特許第6342533号(P6342533)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 緒方 法親の特許一覧

特許6342533トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法
<>
  • 特許6342533-トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 図000007
  • 特許6342533-トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 図000008
  • 特許6342533-トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 図000009
  • 特許6342533-トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6342533
(24)【登録日】2018年5月25日
(45)【発行日】2018年6月13日
(54)【発明の名称】トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20180604BHJP
【FI】
   C12Q1/68
【請求項の数】1
【全頁数】15
(21)【出願番号】特願2017-26967(P2017-26967)
(22)【出願日】2017年2月16日
(62)【分割の表示】特願2012-224598(P2012-224598)の分割
【原出願日】2012年10月9日
(65)【公開番号】特開2017-79800(P2017-79800A)
(43)【公開日】2017年5月18日
【審査請求日】2017年2月16日
【新規性喪失の例外の表示】特許法第30条第2項適用 論文名:Transcriptome Responses of Insect Fat Body Cells to Tissue Culture Environment 刊行物名:PLoS ONE,vol.7,issue 4,p.e34940 発行年月日:平成24年4月6日 発行者名:Public Library of Science DOI:10.1371/journal.pone.0034940
(73)【特許権者】
【識別番号】512261791
【氏名又は名称】緒方 法親
(74)【代理人】
【識別番号】110000039
【氏名又は名称】特許業務法人アイ・ピー・ウィン
(72)【発明者】
【氏名】緒方 法親
(72)【発明者】
【氏名】古崎 利紀
(72)【発明者】
【氏名】岩淵 喜久男
【審査官】 田ノ上 拓自
(56)【参考文献】
【文献】 BMC Bioinformatics, 2006年,Vol.7, No.294,p.1-9
【文献】 Clin. Lab. Med., 2008年,Vol.28, No.1,p.127-143
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00−3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
WPIDS/WPIX(STN)
PubMed
(57)【特許請求の範囲】
【請求項1】
発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法であって、
(1)各実験区及びコントロール区に対応するトランスクリプトームデータから
k番目のサンプルに含まれるi番目の遺伝子の発現頻度Pikを、Pik=(k番目のサンプルに含まれるi番目の遺伝子の発現量)/(k番目のサンプルに含まれる全遺伝子の発現量)と定義した場合に、各遺伝子について前記発現頻度Pikを算出する工程と、
(2)下記式(II)に基づいて各実験区及びコントロール区に対応するHkの値を算出する工程と、
(II):Hk = −Σ(Pik・logPik) 但し、Pik=0の場合を除く
(3)前記Hkの値に従って、後続の発現変動遺伝子抽出又はパスウェイ解析にかける実験区を選定する工程と、
を備え、
各実験区における同一実験区のデータセット数nが、いずれも3以上であり、
前記(3)の工程おいては、前記Hkの値についてt検定を行い、前記t検定におけるp値が0.05以上となる実験区及びコントロール区の組合せを、発現変動遺伝子抽出又はパスウェイ解析にかける対象として選定することを特徴とする実験区の選定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法に係り、詳しくは、トランスクリプトームデータを情報処理することで、発現変動遺伝子抽出又はパスウェイ解析にかける実験区を選定する方法に関する。
【背景技術】
【0002】
トランスクリプトームとは、特定の状況下において細胞中に存在する全ての一時転写産物の総体を指す呼称である。原則として、細胞に存在するゲノム(DNAの全塩基配列)は同一個体内の全ての細胞で同一であり、特定の個体から採取された細胞であれば、環境に変化が生じてもゲノムは一定である。一方、トランスクリプトームは、各遺伝子の発現状況(頻度)が反映された結果であるため、同一個体の細胞であっても各細胞の存在環境に呼応した固有の構成を取るため、例えば異なる組織の細胞間では全く異なる態様を示す。
【0003】
次世代シークエンサの登場により、トランスクリプトームの測定(細胞の遺伝子発現量総体の測定)の精度が飛躍的に向上した、しかしながら、トランスクリプトームの測定結果として得られるデータは膨大な量であるため、得られたトランスクリプトームデータが如何なる意味を持つのか、直接的に人間が理解することは難しい。
【0004】
そのため、得られたトランスクリプトームデータが如何なる意味を持つのかについて、統計処理を行って解析することが行われている。
【0005】
条件刺激に対するトランスクリプトームの変動(=各遺伝子の発現頻度の変動の総体)を解析するにあたっては、例えば、発現変動遺伝子(DEG)抽出という手法が一般的に取られる。
【0006】
ある条件刺激に対して細胞に生じている生命現象を解析しようとした際、全ての遺伝子についてその生命現象との関連を解析することは、時間・費用等各種コストの問題の点から実質的に不可能である。従って、限られたコストで有用な考察を得るためには、少数の遺伝子に着目し集中して解析を行う必要がある。そこで、どの遺伝子に着目すべきなのかという視点で、解析対象の遺伝子を絞り込む過程が必要であり、その過程としてDEG抽出が行われる。
【0007】
DEG抽出は、条件刺激によって細胞に生じている事象と関連性の高い遺伝子を抽出することを目的とするものであり、条件刺激の前・後のトランスクリプトームを比較し、発現頻度がより大きく変動した遺伝子は、その条件刺激に対する細胞の反応とより関連性が高いであろう、という予測に基づき、発現頻度の変化が大きかった遺伝子をDEGとして同定・抽出するものである。
【0008】
何件の遺伝子をDEGとして抽出するかは、研究者の主観で決められているが、一般的にはp値あるいはFDR値を用いて絞り込んで、その遺伝子発現量の変動に対しての解釈が試みられる。
【0009】
また、発現頻度の変化量の違いから個々の遺伝子に着目して抽出しようとするDEG抽出に対して、生命現象を制御している、複数の生体分子の相互作用としての生物学的過程・径路を、一つのまとまり(パスウェイ:Pathway)として捉え、条件刺激に対するDEGが有意に多く含まれるパスウェイを統計的に抽出しようとする手法は、パスウェイ解析と呼ばれる。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】Bentley DR, Balasubramanian S, Swerdlow HP, Smith GP, Milton J, et al. (2008) Accurate whole human genome sequencing using reversible terminator chemistry. Nature 456: 53-59.
【非特許文献2】Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (2008) Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature methods 5: 621-628.
【非特許文献3】Robinson MD, Oshlack A (2010) A scaling normalization method for differential expression analysis of RNA-seq data. Genome biology 11: R25.
【発明の概要】
【発明が解決しようとする課題】
【0011】
本来、生命科学の研究者が観測したいのは生物個体の生命現象であるため、DEG抽出にしてもパスウェイ解析にしても、本来であればin vivoでの各細胞のトランスクリプトームを観測できることが好ましい。しかしながら、細胞培養の簡便さ、培養条件の均一化の容易さ等の視点から、通常はin vitroの細胞を対象としてトランスクリプトームの解析がなされることが一般的に行われている。
【0012】
ところが、in vitroの場合、人工的に培養環境を整えることができるため、各種条件刺激に対する細胞の反応を見ようとした場合、例えば薬剤投与等に対する反応を解明しようとする際に、何の判断材料もないときにはその薬剤の投与濃度の幅について無限の選択肢が存在することになり、どの投与濃度の実験区を観測対象とするのかの基準については、各研究者の主観に委ねられているのが現状である。
【0013】
例えば、その薬剤濃度が、in vivoであれば当該細胞が正常に機能しない(細胞としては生きているが、生命体としては死を意味する)ような高濃度であってもin vitroであれば観測可能であるが、生命現象を観測したい研究者にとっては、そのような実験区のデータはあまり好ましくない。
【0014】
そのため、研究者はある実験区におかれた細胞について、例えば、細胞の形がきれいか、変色していないか等の各自の主観的な判断で、その実験区の環境が適切であるかどうか実験区の選択の妥当性を判断してきた。
【0015】
しかしながら、見た目等の主観的な基準のみでは、実験区選択の妥当性は経験・スキルに依存することになり、特に経験の乏しい研究者の場合、折角得られたDEGが観測したい生命現象と関連性が低いために無駄なデータとなってしまうこともしばしば発生し、試実験区の選択について試行錯誤を繰り返さなければならないことも多い。
【0016】
本発明は上記課題を解決するためなされたものであり、任意の実験区から得られたトランスクリプトームデータについて、個人の経験やスキルに依存せずに、DEG抽出やパスウェイ解析にかけるべき対象かどうかを客観的な基準で判断するための方法を提供することを目的とする。
【課題を解決するための手段】
【0017】
上記目的を達成するため、本発明に係る、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法は、
(1)各実験区に対応するトランスクリプトームデータから各遺伝子の発現量Pikを算出する工程と、
(2)下記式(I)ないし(II)に基づいて各実験区に対応するSないしHの値を算出する工程と、
(I):S = Σ(Pik−a) 但し、Pik<aの場合を除く
ここで、aは、0.00001<a<0.1を満たす定数
(II):H = −Σ(Pik・logPik) 但し、Pik=0の場合を除く
(3)前記HないしSの値に従って、後続の発現変動遺伝子抽出又はパスウェイ解析にかける実験区を選定する工程と、
を備えることを特徴とする。
【0018】
本発明にかかる実験区の選定方法によれば、細胞から客観的に得られるトランスクリプトームデータから一義的に算出されるSないしHの値を基準に用いることが可能となり、従来、測定者の主観に委ねられていた、発現変動遺伝子(DEG)抽出やパスウェイ解析にかける対象としての実験区を選定するための判断基準について、客観的な尺度がもたらされる。その結果、測定者の熟練度に依存せずに実験区の選定を行うことが可能となる。
【0019】
本発明に係る実験区の選定方法においては、各実験区の同一データセット数nが3以上の場合は、等分散性を確認した上でSないしHの値でt検定を行い、p値が0.05以上となる実験区の組み合わせを、DEG抽出やパスウェイ解析の対象として選定することが好ましい。なお、等分散性は、Bartlett検定、Hartley検定、Levene検定といった既知の検定方法を用いて確認することが可能である。
【0020】
また、各実験区の同一データセット数nが2以下の場合は、t検定を行うことができないが、同一データセット数nが1の実験区との比較の場合は、前記SないしHの値(平均値)を直接比較すれば良く、各実験区に対応するSの値(平均値)の差が0.1以下となる組み合わせないしはHの値の差が、0.5以下となる実験区の組合せを、DEG抽出やパスウェイ解析の対象として選定すれば良い。
【発明の効果】
【0021】
本発明によれば、DEG抽出やパスウェイ解析にかけるべき対象の実験区であるかどうかを、経験やスキルに依存しない客観的な基準で判断できるようになるため、実験区を選定するための過程の効率化が可能となる。
【0022】
また、本発明においては、DEG抽出やパスウェイ解析にかける対象として選定された実験区の組合せに、参照群に相当する実験区が含まれていれば、薬剤投与等の各種条件刺激に対する細胞の反応として観測される生命現象とより関連性の高い遺伝子やパスウェイが抽出される可能性を高くすることが期待できる。
【図面の簡単な説明】
【0023】
図1】実施例1にかかる各実験例の実験条件妥当性指標1を表す棒グラフである。
図2】実施例1にかかる各実験例の実験条件妥当性指標2を表す棒グラフである。
図3】実施例2にかかる各実験例の実験条件妥当性指標1を表す棒グラフである。
図4】実施例2にかかる各実験例の実験条件妥当性指標2を表す棒グラフである。
【発明を実施するための形態】
【0024】
以下、本発明を実施するための形態を実施例を通じて詳細に説明する。但し、以下に示す実施例は、本発明の技術思想を具体化するための一例を示すものであって、本発明をこの実施例に限定することを意図するものではなく、本発明は特許請求の範囲に示した技術思想を逸脱することなく種々の変更を行ったものにも均しく適用し得るものである。
【0025】
なお、下記実施例1及び実施例2においては、以下に示す共通のカイコガ培養細胞及び次世代シークエンサを用いて、トランスクリプトームデータを取得した。
<カイコガ培養細胞>
各実験例に用いるカイコガ培養細胞としては、カイコガ終齢幼虫から摘出した脂肪体細胞を用いた。
<シークエンサ>
トランスクリプトームデータは、Illumina社製 GenomeAnalyzerIIxを用いて取得した。
【実施例1】
【0026】
シス−ペルメトリン(cis-Permethrin:以下、「cPER」)は、昆虫の神経を標的とした化学物質(神経毒)であり、いわゆるピレスロイド系殺虫剤の主成分として広く使われている、合成ピレスロイドの一つである。
昆虫が農薬に対する耐性を獲得するメカニズムの一つとして、解毒酵素群による農薬の分解・無毒化が考えられている。生物で広く発見されている解毒酵素としては、シトクロームP450(Cytochrome P450:以下「CYP」)ファミリーが知られているが、カイコのゲノム上にも86種のCYP遺伝子が発見されている。
そこで、本実施例としては、cPER刺激に対するカイコガの培養細胞の反応を、トランスクリプトームデータを取得することで観測・考察した。
【0027】
[実験例1−1:高濃度cPER]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、cPERを2.5mモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。
[実験例1−2:低濃度cPER]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、cPERを250μモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。
[実験例1−3:コントロール]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、cPERを含まないMGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。
【0028】
[発現変動遺伝子(DEG)抽出]
高濃度cPER(実験例1−1)及び低濃度cPER(実験例1−2)の各条件で、コントロール区である実験例1−3に対して遺伝子発現量がどのように変化したのかを観測するため、上記のようにして得られた、各実験例のトランスクリプトームデータを基に、各遺伝子の発現量を求め、統計解析を行って発現頻度変化の大きかった上位10遺伝子を抽出(DEG抽出)した。
【0029】
その結果、実験例1−1においては、CYPファミリーの遺伝子はDEGとして抽出されなかったのに対して、実験例1−2においては、CYPファミリーのひとつであるCYP6AV1の発現量が増加し、DEGとして抽出された。なお、その発現変動量としては全遺伝子中4番目であった。
【0030】
すなわち、250μモル/Lといった低濃度のcPER刺激に晒されたカイコガの脂肪体細胞は、CYP6AV1遺伝子の発現量を増加させて、cPERを分解・解毒する反応を示したのに対して、2.5mモル/Lといった高濃度のcPER刺激に晒されたカイコガの脂肪体細胞は、何らのCYPファミリーの遺伝子発現が誘導されなかった。
【0031】
これは、実験例1−2では、カイコガの脂肪体細胞はCYP6AV1を介してcPERを分解・解毒する機構を備えていることが観測されたのに対して、実験例1−1では、カイコガの脂肪体細胞が、CYPファミリーを介した何らかのcPERに対する分解・解毒能を備えていることは、何も観測できていないことになる。
【0032】
このことは、実験例1−1の条件、すなわち、2.5mモル/Lといった高濃度の条件は、cPER等の合成ピレスロイドに対する昆虫の防御機構を解明することを目的とした場合には不適切であったことを示す。
【0033】
また、実験例1−1の条件であってもDEG抽出そのものは可能であるが、実験例1−1の条件では本来観測したい事象、すなわち、合成ピレスロイドに対する昆虫細胞の防御反応が生じていないか、生じていたとしてもより大きな変化が細胞に生じていることが示唆されることから、実験例1−1の条件で得られたトランスクリプトームデータによって抽出されたDEGは、合成ピレスロイドに対する昆虫の防御機構との関連性が高い遺伝子である可能性は低く、このDEGに着目して研究を進めるのは、合成ピレスロイドに対する昆虫の防御機構の解明を目的とした研究を進める上では、効率が悪いことが示唆される。
【0034】
[実験条件妥当性指標1の算出]
各実験区ごとに、トランスクリプトームの生データから得られる各遺伝子の発現頻度Pに対して、下記の式にして求められる値Hを、実験条件妥当性指標1として算出した。なお、Pは、P=(当該遺伝子iの発現量)/(全遺伝子の発現量)で表される確率を意味する。

H = −Σ(P×logP) (但し、P=0の遺伝子については除外した)
【0035】
上記、Hの算出にあたっては、1列目に遺伝子名が、2列目に発現量が収まった行列トランスクリプトームデータについてR言語環境を備えたコンピュータ上で自動計算することによって求めた。自動計算に用いたプログラムは以下のとおりである。
Hx(※)<-function(x){
x2<-x/sum(x)
x3<-x2*log2(x2)
x4<-x3[!is.na(x3)]
-sum(x4)
}
※:"Hx"は、英数字からなる任意の文字列であれば良い
上記のようにして得られた、各実験例のHの値を表1に示し、基づく棒グラフを、図1に示す。
【0036】
【表1】
【0037】
[実験条件妥当性指標2の算出]
各実験区ごとに、トランスクリプトームの生データから得られる各遺伝子の発現頻度Pに対して、下記の式にして求められる値Sを、実験条件妥当性指標2として算出した。なお、aの値は、0.00001、0.0001、0.001、0.005、0.01、0.05、0.1の、7通りに変化させた。

S = −Σ(P−a) (但し、P<aとなる遺伝子については除外した)

上記S値の算出にあたっては、1列目に遺伝子名が、2列目に発現量が収まった行列トランスクリプトームデータについてR言語環境を備えたコンピュータ上で自動計算することによって求めた。自動計算に用いたプログラムは以下のとおりである。

a<-n #(nは任意の実数)
Sx(※)<-function(x){
x2<-x/sum(x)
x3<-x2-a
x3<-ifelse(x3<0,0,x3)
sum(x3)
}
※:"Sx"は英数字からなる任意の文字列であれば良い

上記のようにして得られた、各実験例のSの値を表2に示し、グラフを図2に示した。
【0038】
【表2】
【0039】
実験条件妥当性指標1は、トランスクリプトームのいわゆる情報エントロピー(シャノンエントロピー)である。この実験条件妥当性指標1について、コントロール実験区である実験例1−3と比較すると、実験条件として好ましくないことが示唆される実験例1−1では大きく低下しているのに対して、実験条件として好ましい実験例1−2では低下していないことがわかる。
【0040】
また、実験条件妥当性指標2についても同様に、コントロール実験区である実験例1−3と比較すると、実験条件として好ましくないことが示唆される実験例1−1では大きく低下しているのに対して、実験条件として好ましい実験例1−2では低下していないことがわかる。
【実施例2】
【0041】
フェノバルビタール(Phenobarbital:以下、「PB」)は、抗てんかん薬の主成分として用いられる、バルビツール系中枢神経抑制作用剤である。PBは薬剤代謝を誘導する化学物質として知られており、CYP遺伝子の誘導を目的として一般的に用いられている。
そこで、本実施例としては、PB添加刺激に対するカイコガの培養細胞の反応を、トランスクリプトームデータを取得することで観測・考察した。
【0042】
[実験例2−1:PB 250μM]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、PBを250μモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。データセット数nは3とした。
【0043】
[実験例2−2:PB 1mM]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、PBを1mモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。データセット数nは4とした。
【0044】
[実験例2−3:PB 2.5mM]
MMGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、PBを2.5mモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。データセット数nは4とした。
【0045】
[実験例2−4:PB 12.5mM]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、MGM−450昆虫培地(10体積%FBSを含む)に、PBを12.5mモル/Lとなるように添加した培地を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。データセット数nは4とした。
【0046】
[実験例2−5:コントロール]
MGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を80時間培養した後、PBを含まないMGM−450昆虫培地(10体積%FBSを含む)を用いて、カイコガ培養細胞を10時間培養した後、トランスクリプトームデータを取得した。データセット数nは3とした。
【0047】
[発現変動遺伝子(DEG)抽出]
PB 250μM(実験例2−1)、PB 1mM(実験例2−2)、PB 2.5mM(実験例2−3)及びPB 12.5mM(実験例2−4)の各条件で、コントロール区である実験例2−5に対して遺伝子発現量がどのように変化したのかを観測するため、上記のようにして得られた各実験例のトランスクリプトームデータを基に、各遺伝子の発現量を求め、統計解析を行って発現頻度変化の大きかった上位10遺伝子を抽出(DEG抽出)した。
【0048】
その結果、DEGとして抽出された上位10遺伝子の中に、CYPファミリー遺伝子が含まれていたのは、実験例2−1のみであった。実験例2−1でDEGとして抽出されたCYPファミリー遺伝子は、CYP4G23b(全遺伝子中2番目の変動量)、CYP4G23a(同、7番目の変動量)であった。
【0049】
すなわち、CYPファミリーの誘導という、PB刺激による反応として期待される反応を生じている実験区はPBの投与濃度が250μモル/Lの実験例2−1のみであり、1mモル/L以上の濃度のPBが投与されている実験区(実験区2−2〜2−4)では、PB刺激によって本来観測されるべきであると考えられるCYPファミリーの誘導が生じていないか、生じていたとしても、より大きな変化が培養細胞に生じており、培養細胞において観測したい事象が観測できない状態になっていることが示唆された。
【0050】
これは、実験例2−1によって示唆される、カイコガの脂肪体細胞の、CYP4G23b及びCYP4G23aを介したPBの代謝機構の存在について、実験例2−2〜2−4では、何も観測できていないことを意味する。
【0051】
このことから、PB刺激に対して生じるカイコガ脂肪体細胞の事象を適切に観測するための実験区としては実験例2−2〜2−4の投与濃度の設定は、不適切であることが示唆される。
【0052】
そのため、実験例2−2〜2−4の条件であってもDEG抽出そのものは可能であるが、実験例2−2〜2−4の条件では本来観測したい事象、すなわち、PBを代謝する反応が生じていないか、生じていたとしてもより大きな変化が細胞に生じていることが示唆され、実験例2−2〜2−4の条件で得られたトランスクリプトームデータによって抽出されたDEGは、PBの代謝機構との関連性が高い遺伝子である可能性は低く、このDEGに着目するのは、PBの代謝機構との関連性が高い遺伝子であることを期待して研究を進める上では、効率が悪いことが示唆される。
【0053】
[実験条件妥当性指標1及び2の算出]
実施例1と同様にして、トランスクリプトームの生データから得られる各遺伝子の発現頻度Pに対して、下記式で求められる値H、Sを、実験条件妥当性指標1、2として算出した。

H = −Σ(P×logP) (但し、P=0の遺伝子については除外した)
S = −Σ(P−a) (但し、P<aとなる遺伝子については除外した)
【0054】
上記のようにして得られた、各実験例のHの値を表3に示すと共にグラフを図3に示し、各実験例のSの値を表4及び表5に示すと共にグラフを図4に示した。
【0055】
【表3】
【0056】
【表4】
【0057】
【表5】
【0058】
トランスクリプトームの情報エントロピー(シャノンエントロピー)である実験条件妥当性指標1について、コントロール実験区である実験例2−5と比較すると、実験条件として好ましくないことが示唆される実験例2−2〜2−4では大きく低下しているのに対して、実験条件として好ましい実験例2−1では低下していない。
【0059】
また、実験条件妥当性指標2についても同様に、コントロール実験区である実験例2−5と比較すると、実験条件として好ましくないことが示唆される実験例実験例2−2〜2−4では大きく低下しているのに対して、実験条件として好ましい実験例2−1では低下していない。
【0060】
[実験条件妥当性指標1のt検定]
実験条件妥当性指標1(H値)について、有意な差が生じているかどうかを以下のとおりt検定を行い確認した。
正規性については、実験例2−1〜2−5のH値についてコルモゴロフ-スミノフ検定を行い、全ての実験区について正規性が確認された。
等分散性については、コントロール実験区である実験例2−5に対して、実験例2−1〜2−4のそれぞれについてF検定を行い、全ての比較について比較H値間の等分散性が確認された。
実験例2−5に対して、実験例2−1〜2−4のそれぞれについて、比較H値間の平均値の差についてt検定を行った。結果を以下に示す。
【0061】
・実施例2−1と実施例2−5の比較では平均値に有意な差がなかった。(p=0.9183)
・実施例2−2と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0001109)
・実施例2−3と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0001486)
・実施例2−4と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=5.177e−05)
【0062】
[実験条件妥当性指標2のt検定]
実験条件妥当性指標2(S値)について、有意な差が生じているかどうかを、以下のとおりt検定を行い確認した。なお、a値は0.01、0.0001の場合で確認した。、
実験例2−1〜2−5のS値についてコルモゴロフ-スミノフ検定を行い、全ての実験区について正規性が確認された。
次いで、コントロール実験区である実験例2−5に対して、実験例2−1〜2−4のそれぞれについてF検定を行い、全ての比較について比較S値間の等分散性が確認された。
実験例2−5に対して、実験例2−1〜2−4のそれぞれについて、比較S値間の平均値の差についてt検定を行った。結果を以下に示す。
【0063】
<a=0.01>
・実施例2−1と実施例2−5の比較では平均値に有意な差がなかった。(p=0.9096)
・実施例2−2と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=4.731e−05)
・実施例2−3と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0001163)
・実施例2−4と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=2.943e−05)
【0064】
<a=0.0001>
・実施例2−1と実施例2−5の比較では平均値に有意な差がなかった。(p=0.985)
・実施例2−2と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0002291)
・実施例2−3と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0001562)
・実施例2−4と実施例2−5の比較では平均値に有意な差がないとは言えなかった。(p=0.0001082)
【0065】
なお、実験例1−1と実験例1−2及び1−3との比較、実験例2−1及び2〜5と、実験例2−2〜2〜4との比較から、トランスクリプトームとして観測できる細胞の状態には、いわば2つの相が存在することが予測される。
【0066】
すなわち、実験例1−1ないし実験例2−2〜2−4はコントロールである、実験例1−3ないし実験例2−5に対して、過大な薬物刺激を受けたことによって、いわば相転移が生じている状態であり、そのため、正常な細胞であれば生じうるはずのCYPファミリーの誘導が観測できなかったものと考えられる。
【0067】
一方、実験例1−2及び実験例2−1においては相転移が生じていないため、CYPの誘導という好ましい反応が観測できたものと考えられる。
従って、特定の条件刺激に対する生命現象を観察するためにDEG抽出やパスウェイ解析を行う際には、実験条件妥当性指標1(H値)ないし2(S値)を用いて、コントロール群に対して相転移が生じていないことが確認された実験区について絞り込んで、DEG抽出やパスウェイ解析を行うことで、条件刺激とより関連性の高い遺伝子やパスウェイの抽出に結びつく可能性が高くなるものと示唆される。
【0068】
また、図2及び4からわかるように、aの値が大き過ぎる(0.1以上)または小さ過ぎる(0.0001以下)場合は、S値の違いを判別しにくくなるため、トランスクリプトームのS値を用いて後続の発現変動遺伝子抽出又はパスウェイ解析にかける実験区を選定する場合は、aの値を、0.00001<a<0.1としておくことが好ましい。
【0069】
また、データセット数nが2以下の実験区に対しては、t検定を行うことはできないが、S値(平均値)の直接比較を行えば良い。なお、aの値を0.001≦a≦0.01としてS値を算出した場合は、S値が0.1以下となる組合せをDEG抽出やパスウェイ解析の対象として選定すれば良い。
図1
図2
図3
図4