【課題を解決するための手段】
【0010】
上記課題を解決する本発明の方法は、コンピュータによる攪乱を受けた生物試料が示す生物応答の解析方法であって、上記コンピュータが、
a)異なる種類の攪乱を受けた少なくとも2種の被験生物試料及び上記攪乱を受けていない対照生物試料についての同一の検出法を用いて測定された少なくとも2種の生物応答指標の発現値に基づき得られた、各生物応答指標についての、各被験生物試料における発現値の対照生物試料における発現値からの変化量に対応する値を、基礎データとして、該基礎データを与えた攪乱と関連づけて読み込むステップ、
b)上記a)ステップにおいて読み込まれた基礎データのそれぞれについて、該基礎データと−1との積を仮想データとして算出するステップ、
c)上記a)ステップにおいて読み込まれた基礎データと上記b)ステップにおいて算出された仮想データの全てを結合して、データ全体の重心が0となるデータ群を得るステップ、
d)上記c)ステップにおいて得られたデータ群について主成分分析を行い、得られた主成分からノイズ成分を廃棄し、残余の主成分について、互いに独立した反応様式に対応する主成分固有ベクトルから構成された反応様式行列を得るステップ、
及び、
e)上記d)ステップにおいて得られた反応様式行列に含まれる各主成分固有ベクトルと上記a)ステップにおいて読み込まれた各攪乱に関連付けられた基礎データとから、各攪乱の各反応様式における応答強度に対応する主成分スコアから構成された応答強度行列を得るステップ
を実行することを特徴とする。
【0011】
本発明において、「生物」は、動物、植物及び微生物のいずれであっても良く、「生物試料」は、生物の全部であっても良く、生物の一部の器官、組織又は細胞であっても良い。「攪乱」とは、上記生物試料の状態を変化させる要因を意味し、生物が発症した疾患の種類や発症からの経過時間、同時に発症している疾患の種類やその数、生物に投与される化学物質の種類やその濃度及び投与時間、併用投与される化学物質の種類やその数、生物の成長や老化、生物の周囲環境の変化やその持続時間、遺伝子操作などが例示される。なお、「化学物質」とは1以上の元素から成る物質を意味する。そして、生物試料が受ける攪乱の内容は、一般に、単独で生物試料の状態を変化させうる要素と、他の要素と組み合わせられることにより生物試料の状態を変化させうる要素と、で規定される。例えば、「化学物質Aを濃度Bで用いて刺激する」という内容の攪乱では、化学物質Aは前者に当たり、濃度Bは後者に当たる。本発明では、前者を攪乱の独立要素といい、後者を攪乱の従属要素という。異なる種類の攪乱は、一般的には独立要素に関して異なっているが、独立要素が同一であっても従属要素の相違により異なる反応様式が発現することがあるため、従属要素に関して異なっていても良い。また、本発明において、「生物応答」とは、上記生物試料が示す生命活動として把握される現象を意味し、本発明では生物応答の状態が生物応答指標の発現値によって把握される。生物試料が示す生物応答は、単一の反応様式に起因する応答であることもあり、2種以上の独立した反応様式が関与した複合的な応答であることもある。また、本発明では、異なる種類の攪乱を受けた少なくとも2種の被験生物試料と対照生物試料とが解析のために使用される。攪乱の種類と被験生物試料とは対応しており、異なる種類の攪乱から異なる種類の被験生物試料が導かれる。攪乱の種類、したがってまた被験生物試料の種類の数は、2以上であれば制限がない。被験生物試料と対照生物試料とは、攪乱を受ける前後の試料であっても良く、同一の条件で採取された生物試料を複数の群に分割し、一つの群を対照生物試料とし、残余の群に所定の攪乱を受けさせることによって被験生物試料を得ても良い。
【0012】
また、本発明では、生物応答指標についての発現値を同一の検出法を用いて測定した結果が解析のために使用される。「生物応答指標」は、上記生物試料の生命活動を反映した指標であれば特に制限がなく、例として、上記生物試料が発現した様々な遺伝子、様々なタンパク質、様々な代謝物、上記生物試料の活動状態、増殖状態、成長状態が挙げられる。本発明では、少なくとも2種の生物応答指標、例えば、少なくとも2種の遺伝子、少なくとも2種のタンパク質、が解析のために使用される。生物応答指標の種類の数は、2以上であれば制限がない。但し、本発明では、被験生物試料における発現値と対照生物試料における発現値とが対比されるのであるから、生物応答指標は定量することができる指標でなければならない。定量のための測定方法としては、目的の生物応答指標の発現値を測定可能な方法として知られている方法を特に限定なく使用することができる。また、「発現値」は、上記生物応答指標の発現量であっても良く、発現量に比例する値、例えば二次元電気泳動画像のスポットの強度、であっても良い。但し、本発明の解析方法のために用いる発現値は、同一の検出法により測定されなければならない。例えば、DNAマイクロアレイによる測定結果と二次元電気泳動による測定結果とを1回の本発明の解析方法の実施において同時に使用することはできない。ただし、同一の検出法による測定であれば、各被験生物試料における発現値と対照生物試料における発現値とが同時に測定されている必要はない。
【0013】
本発明の解析方法では、各生物応答指標についての、各被験生物試料における発現値の対照生物試料における発現値からの変化量に対応する値が基礎データとして使用される。各生物応答指標についての基礎データは、各被験生物試料における発現値の対照生物試料における発現値からの変化量を反映しているデータであれば特に限定がなく、例えば、各被験生物試料における発現値から対照生物試料における発現値を減算した値、各被験生物試料における発現値の対数値から対照生物試料における発現値の対数値を減算した値、CMapやLINCSにおいて使用されているmoderated Z−score(Cell 171,1437−1452.e17 (2017)参照)、及び、一般に使用されているrobust Z−score(例えばhttp://dx.doi.org/10.5772/52508参照)を本発明において基礎データとして使用することができる。さらには、これらのデータに対して規格化処理を施すことによって得られた規格化値も、各被験生物試料における発現値の対照生物試料における発現値からの変化量を反映しているため、本発明において基礎データとして使用することもできる。分析に用いるデータを得るための規格化処理は、従来の一般的な主成分分析において慣用的に行われているが、本発明においてもこの慣用的な処理を適用した後のデータを基礎データとすることができる。
【0014】
収集された多くのデータの全体から何らかの知識を得るためには、特許文献1においても採用されている、高次元データ(生物応答指標の数と同じ次元のデータ)の持つ情報をできるだけ損なわずに低次元空間情報に縮約する主成分分析が有効である。
図1の上図は、上記a)ステップにおいて読み込まれた、生物応答指標の識別番号i(i=1,2,・・・)、攪乱の識別番号j(j=1,2,・・・)についての基礎データFD
ijの全てを用いて主成分分析を行ったときの、生物応答指標の数Xと同じ次元の空間のうちの2次元を示した図である。この図において、各基礎データの位置は、
【化1】
で表されるが、データ全体の重心の位置が収集されたデータによって変化し、原点からデータ全体の重心へのベクトル、すなわち、基礎データのデータ全体の重心の位置と対照の位置との距離が収集されたデータによって変化するため、このような変化する値に生物学的な意味を付帯させることができず、したがってこの変化する重心から出発した互いに独立な各主成分固有ベクトルにも生物学的な意味を付帯させることができない。
【0015】
そこで、発明者らは、上記a)ステップにおいて読み込まれた基礎データの全てと、上記b)ステップにおいて算出された基礎データと−1との積である仮想データの全てと、を上記ステップc)において結合してデータ全体の重心が原点(対照)となるデータ群を得、得られたデータ群を主成分分析に供することを検討した。仮想データを設定することは、基礎データに現れる攪乱の効果が反対方向(原点(対照)に戻る方向)にも働くはずであるとの仮定の下に採用された。
図1の下図は、上記データ群を用いて主成分分析を行ったときの、生物応答指標の数Xと同じ次元の空間のうちの2次元を示した図である。基礎データFD
ijとこれに対する仮想データVD
ijとは、原点(対照)に関して点対称の位置にある。また、データ全体の重心の位置は、収集されたデータによって変化せず、常に原点(対照)の位置にある。この図では、各基礎データの位置は、
【化2】
で表される。
【0016】
図1の下図から明らかなように、基礎データの全てと仮想データの全てを用いて主成分分析を行うと、各主成分固有ベクトルは原点(対照の位置)から出発することになり、しかも各主成分固有ベクトルは互いに直交し、したがって互いに独立である。このことから、上記d)ステップにおいて、主成分分析後にノイズ成分を廃棄し、残余の主成分固有ベクトルを互いに独立した反応様式に対応させることができると考えられる。また、上記e)ステップにおいて、各主成分固有ベクトルと各攪乱に関連づけられた基礎データのベクトルとの内積を算出すれば、各攪乱の各反応様式における応答強度に対応する主成分スコアが得られると考えられる。ここで、「ノイズ成分」とは、主成分軸におけるデータの分散にもはやなんらの特徴も見出すことができない成分を意味し、使用される生物応答データによって異なる。
【0017】
そして、検証の結果、以下で実施例を用いて説明するが、攪乱に対する複数の反応様式が関与した生物応答を個々の独立した反応様式に起因した応答に分離することができ、上記攪乱の分離された各反応様式における応答強度を算出することに成功した。したがって、各基礎データに現れる各攪乱の効果が反対方向(原点(対照)に戻る方向)にも働くはずであるとの仮定の下に採用された仮想データをも使用した主成分分析が妥当であることがわかった。ここで、それぞれの主成分固有ベクトルに対応する反応様式は、単一の反応様式である場合が多いが、2以上の反応様式が一体不可分に結合した反応様式である場合もある。しかし、2以上の反応様式が一体不可分に結合した反応様式である場合でも、他の主成分固有ベクトルに対応する反応様式とは独立である。
【0018】
本発明の方法により、各主成分固有ベクトルに対応する独立した反応様式に分離することができるが、得られた反応様式の種類に関する情報、例えば、微小管阻害作用であるのか、プロテアソーム阻害作用であるのか、といった情報を解析結果から直ちに知ることはできない。反応様式の種類は、一般には各攪乱と対応した主成分スコアの大小と攪乱のいくつかに関して先行文献等に開示された既知の情報とから推定される。したがって、上記少なくとも2種の被験生物試料に与える攪乱の中に、反応様式が既知である攪乱が含まれているのが好ましい。
【0019】
上述したように、本発明では、各生物応答指標についての各被験生物試料における発現値と対照生物試料における発現値との相違を示す基礎データと該基礎データと−1との積である仮想データとを結合することにより得られたデータ全体の重心が0となるデータ群について主成分分析を行うという特徴的な方法により、生物応答のスペクトル分解が達成される。生物応答指標の種類の数及び攪乱の種類の数はそれぞれ2以上であれば良いが、生物応答指標の種類の数及び/又は攪乱の種類の数が増加するほど、上記基礎データの中に外れ値が混在する確率が高くなる。このような場合には、従来の一般的な主成分分析において慣用的に行われているように外れ値検定を行い、外れ値を除いたデータを基礎データとして解析のために使用すれば良い。この他、上述した基礎データと仮想データとを結合したデータ群について主成分分析を行うという本発明の特徴的な方法を実行した後であれば、従来の一般的な主成分分析において分析結果の解釈を容易にするために行われているバリマックス回転等の慣用的な処理を本発明においても適用することができる。
【0020】
本発明はまた、コンピュータに、上記a)ステップ、上記b)ステップ、上記c)ステップ、上記d)ステップ、及び上記e)ステップを実行させるための、攪乱を受けた生物試料が示す生物応答の解析プログラムを提供する。該プログラムとコンピュータとの協働により、本発明の生物応答の解析方法を実行することができ、多種多様な攪乱のいずれかを受けた生物が示した複数の反応様式が関与した生物応答を個々の独立した反応様式に起因した応答に分離した上で、上記生物応答を与えた攪乱の各反応様式における応答強度を算出することができる。
【0021】
本発明はまた、攪乱を受けた生物試料が示す生物応答の解析装置であって、
異なる種類の攪乱を受けた少なくとも2種の被験生物試料及び上記攪乱を受けていない対照生物試料についての同一の検出法を用いて測定された少なくとも2種の生物応答指標の発現値に基づき得られた、各生物応答指標についての、各被験生物試料における発現値の対照生物試料における発現値からの変化量に対応する値を、基礎データとして、該基礎データを与えた攪乱と関連づけて読み込む、データ読み込み手段、
上記データ読み込み手段により読み込まれた基礎データのそれぞれについて、該基礎データと−1との積を仮想データとして算出する、仮想データ算出手段、
上記データ読み込み手段により読み込まれた基礎データと上記仮想データ算出手段により算出された仮想データの全てを結合して、データ全体の重心が0となるデータ群を得る、データ群生成手段、
上記データ群生成手段により生成されたデータ群について主成分分析を行い、得られた主成分からノイズ成分を廃棄し、残余の主成分について、互いに独立した反応様式に対応する主成分固有ベクトルから構成された反応様式行列を得る、反応様式行列生成手段、
及び、
上記反応様式行列生成手段により生成された反応様式行列に含まれる各主成分固有ベクトルと上記データ読み込み手段により読み込まれた各攪乱に関連付けられた基礎データとから、各攪乱の各反応様式における応答強度に対応する主成分スコアから構成された応答強度行列を得る、応答強度行列生成手段
を備えたことを特徴とする、生物応答の解析装置を提供する。この解析装置により、多種多様な攪乱のいずれかを受けた生物が示した複数の反応様式が関与した生物応答を個々の独立した反応様式に起因した応答に分離した上で、上記生物応答を与えた攪乱の各反応様式における応答強度を算出することができる。