(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6884389
(24)【登録日】2021年5月14日
(45)【発行日】2021年6月9日
(54)【発明の名称】解析装置、解析方法およびプログラム
(51)【国際特許分類】
G16B 5/20 20190101AFI20210531BHJP
G01N 33/48 20060101ALI20210531BHJP
G01N 33/50 20060101ALI20210531BHJP
【FI】
G16B5/20
G01N33/48 Z
G01N33/50 Z
【請求項の数】10
【全頁数】18
(21)【出願番号】特願2017-215038(P2017-215038)
(22)【出願日】2017年11月7日
(65)【公開番号】特開2019-87053(P2019-87053A)
(43)【公開日】2019年6月6日
【審査請求日】2020年3月9日
(73)【特許権者】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(74)【代理人】
【識別番号】100113549
【弁理士】
【氏名又は名称】鈴木 守
(74)【代理人】
【識別番号】100115808
【弁理士】
【氏名又は名称】加藤 真司
(74)【代理人】
【識別番号】230111590
【弁護士】
【氏名又は名称】金本 恵子
(74)【代理人】
【識別番号】230121430
【弁護士】
【氏名又は名称】安井 友章
(72)【発明者】
【氏名】堀本 勝久
(72)【発明者】
【氏名】福井 一彦
(72)【発明者】
【氏名】鍵和田 晴美
【審査官】
松野 広一
(56)【参考文献】
【文献】
特開2016−048485(JP,A)
【文献】
特開2002−175305(JP,A)
【文献】
特開2014−228991(JP,A)
【文献】
SAITO, Shigeru et al.,Network evaluation from the consistency of the graph structure with the measured data,BMC System Biology,2008年10月 1日,Vol.2 No.84,pp.1-14,doi:10.1186/1752-0509-2-89
【文献】
安富祖 仁 外1名,遺伝子発現データからの遺伝子間因果関係ネットワーク推定,情報処理学会研究報告,日本,社団法人情報処理学会,2006年 9月15日,Vol.2006 No.99,pp.9-15,ISSN:0919-6072
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00−99/00
G01N 33/48
G01N 33/50
JSTPlus/JMEDPlus/JST7580(JDreamIII)
PubMed
(57)【特許請求の範囲】
【請求項1】
検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析装置によって解析するための解析方法であって、次のステップを備える:
(a)前記解析装置が、複数の検体についての前記反応量データを取得するステップ;
(b)前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。
【請求項2】
請求項1に記載の解析方法であって、ステップ(b−3)において、前記既知のパスウェイと同数のノード及び同数のリンクを有する複数のグラフを生成する。
【請求項3】
請求項1または2に記載の解析方法であって、(b−6)前記解析装置が、前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであると判定するステップをさらに備える解析方法。
【請求項4】
検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データに基づいて、解析装置が、ターゲット物質を求める解析方法であって、次のステップを備える:
(a)前記解析装置が、複数の検体についての前記反応量データを取得するステップ;
(b)前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有する既知のパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ;
(b−6)前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ;
(c)前記解析装置が、前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ;
(d)前記解析装置が、ステップ(b)で選択された前記既知のパスウェイと、ステップ(c)で生成された前記ネットワーク構造との間で、リンクで接続された2つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。
【請求項5】
請求項4に記載の解析方法であって、ステップ(b)で読み出した既知のパスウェイが有向非巡回グラフである場合に、次のステップによってパスウェイを選択する解析方法:
(b−7)前記既知のパスウェイを条件付き確率で接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−8)各サブグラフに前記反応量データを用いて線形回帰を行い、前記既知のパスウェイの全体の尤度を求めるステップ;
(b−9)前記既知のパスウェイと同数のノードを有する複数の有向非巡回グラフを生成するステップ;
(b−10)前記複数の有向非巡回グラフの尤度を上記ステップ(b−7)及び(b−8)と同じ方法によって求め、前記複数の有向非巡回グラフの尤度の確率分布を生成するステップ;
(b−11)上記ステップ(b−10)で求めた確率分布において、上記ステップ(b−8)で求めた尤度から上側における確率密度をグラフ整合性確率として計算するステップ;
(b−12)前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであると判定するステップ。
【請求項6】
請求項4または5に記載の解析方法であって、さらに、
(e)前記解析装置が、前記反応量データがコントロールの反応量に対して所定の閾値以上の差分を有する物質をシグネチャ物質として求めるステップを備え、
前記ステップ(d)では、前記ステップ(e)で求めた物質のデータをも用いてターゲット物質を求める。
【請求項7】
検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析する解析装置であって、
複数の検体についての反応量データを入力する入力部と、
前記物質をノードとする既知のパスウェイのデータを記憶した記憶部と、
前記記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるネットワーク整合性判定部と、
を備え、
前記ネットワーク整合性判定部は、前記既知のパスウェイが有向非巡回グラフでない場合に、次の処理によって、前記既知のパスウェイと前記反応量データとの整合性を表すグラフ整合性確率を求める:
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。
【請求項8】
検体に含まれる複数に物質に対して所定の処理を行ったときの反応量データに基づいて、ターゲット物質を求める解析装置であって、
複数の検体についての反応量データを入力する入力部と、
前記物質をノードとする既知のパスウェイのデータを記憶した記憶部と、
前記記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイの中から前記反応量データに整合するパスウェイを選択するネットワーク整合性判定部と、
前記反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するネットワーク推定部と、
前記ネットワーク整合性判定部にて選択した前記既知のパスウェイと、前記ネットワーク推定部にて生成した前記ネットワーク構造との間で、リンクで接続された2つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるターゲット物質探索部と、
を備え、
前記ネットワーク整合性判定部は、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次の処理によって前記反応量データに整合する既知のパスウェイを選択する:
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ;
(b−6)前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ。
【請求項9】
検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析するためのプログラムであって、コンピュータに、次のステップを実行させる:
(a)複数の検体についての前記反応量データを取得するステップ;
(b)前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。
【請求項10】
検体に含まれる複数に物質に対して所定の処理を行ったときの反応量データに基づいて、ターゲット物質を求めるためのプログラムであって、コンピュータに、次のステップを実行させる:
(a)複数の検体についての前記反応量データを取得するステップ;
(b)前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有するパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ;
(b−6)前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであるとして選択するステップ;
(c)前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ;
(d)ステップ(b)で選択された前記既知のパスウェイと、ステップ(c)で生成された前記ネットワーク構造との間で、リンクで接続された2つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析する技術に関する。
【背景技術】
【0002】
タンパク質のリン酸化は、キナーゼにより触媒される反応で、細胞増殖や転写制御、細胞死、代謝など様々な生命機能を調節している。がんを初めとする疾患などもリン酸化酵素の異常により起こることが知られており、リン酸化シグナルパスウェイは、ヒトの疾患にも大きな影響を持っている。リン酸化シグナルを解析することで創薬や疾患の診断などに対して有用な情報を得ることができると考えられている(非特許文献1)。
【0003】
非特許文献1は、ペプチドアレイを用いたリン酸化シグナルの解析法を開示している。この文献では、正常細胞のリン酸化パターンと検体細胞のリン酸化パターンとを比較することによって疾患の早期診断に利用する(非特許文献1、99頁右欄〜100頁左欄)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】船津貴洋他「細胞内リン酸化シグナル網羅的解析のためのペプチド固定化酸化チタン基板の開発」北九州工業高等専門学校研究報告第44号(2011年1月)
【非特許文献2】堀本勝久他「Network evaluation from consistency of the graph structure with the measured data」BMC Systems Biology 2008, 2:84(2008年10月1日)
【発明の概要】
【発明が解決しようとする課題】
【0005】
非特許文献1に記載された方法は、正常細胞と検体細胞とでリン酸化の程度が異なるペプチドを発見することができるにとどまり、そのリン酸化シグナルパスウェイを解析することはできなかった。
【0006】
本発明者は、非特許文献2において、測定データとネットワーク構造との整合性を評価する方法を発表した。非特許文献2で開示した方法は、ネットワーク構造が有向非巡回グラフ(DAG)である場合の方法である。DAGでないネットワーク構造と測定データとの整合性を評価する方法を開示した文献は存在しなかった。
【0007】
本発明は、上記背景に鑑み、検体に含まれる複数の物質の反応量データと既知のパスウェイとの整合性を解析する方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の解析方法は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析装置によって解析するための解析方法であって、次のステップを備える:
(a)前記解析装置が、複数の検体についての前記反応量データを取得するステップ;
(b)前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。
【0009】
本発明の別の態様の解析方法は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データに基づいて、解析装置が、ターゲット物質を求める解析方法であって、次のステップを備える:
(a)前記解析装置が、複数の検体についての前記反応量データを取得するステップ;
(b)前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有する既知のパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ;
(b−1)前記既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解するステップ;
(b−2)各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ;
(b−3)前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ;
(b−4)前記複数のグラフの結合確率を上記ステップ(b−1)及び(b−2)と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ;
(b−5)上記ステップ(b−4)で求めた確率分布において、上記ステップ(b−2)で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ;
(b−6)前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ;
(c)前記解析装置が、前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ;
(d)前記解析装置が、ステップ(b)で選択された前記既知のパスウェイと、ステップ(c)で生成された前記ネットワーク構造との間で、リンクで接続された2つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。
【0010】
本発明の解析方法は、さらに、(e)前記解析装置が、前記反応量データがコントロールの反応量に対して所定の閾値以上の差分を有する物質をシグネチャ物質として求めるステップを備え、前記ステップ(d)では、前記ステップ(e)で求めた物質のデータをも用いてターゲット物質を求めてもよい。
【発明の効果】
【0011】
本発明によれば、既知のパスウェイがDAGでない場合であっても、反応量データとの整合性を適切に求めることができる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施の形態の解析装置の構成を示す図である。
【
図2】(a)既知のパスウェイの例を示す図である。(b)既知のパスウェイをサブグラフに分解した例を示す図である。
【
図3】(a)解析対象の反応量データの例を示す図である。(b)2つの物質Aと物質Bの相関の例を示す図である。
【
図4】それぞれの物質の相関係数の例を記載した表である。
【
図5】(a)〜(c)ランダムに生成した多数のネットワークの例を示す図である。
【
図6】ランダムなネットワークの結合確率の確率分布を示す図である。
【
図7】第1の実施の形態の解析装置の動作を示す図である。
【
図8】偏相関係数ではなく相関係数を用いて求めた結合確率の確率分布を示す図である。
【
図9】第2の実施の形態の解析方法の概要を示す図である。
【
図10】第2の実施の形態の解析装置の構成を示す図である。
【
図12】(a)既知のパスウェイ(DAG)の例を示す図である。(b)既知のパスウェイ(DAG)をサブグラフに分解した例を示す図である。
【
図13】第2の実施の形態の解析装置の動作を示す図である。
【
図14】第3の実施の形態の解析方法の概要を示す図である。
【
図15】第3の実施の形態の解析装置の構成を示す図である。
【
図16】第3の実施の形態の解析装置の動作を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態の解析方法および装置について図面を参照しながら説明する。実施の形態においては、検体に含まれる複数の物質に対して所定の処理を行ったときの生物学的な反応量データと既知のパスウェイとの整合性を解析する方法および装置について説明する。ここで、以下に説明する実施の形態の解析対象について述べる。例えば、免疫系や疾患に関するパスウェイは、因果関係が不明な点が多いため、無向グラフで評価することが好ましい。具体的には、例えば、抗原抗体反応などのタンパク質間の相互作用の連鎖が挙げられる。この場合、物質としては、タンパク質であり、反応量データは、抗原抗体相互作用のアフィニティー等である。ここで紹介したのは一例であり、本実施の形態の解析方法は、様々な物質に適用することができる。
【0014】
(第1の実施の形態)
図1は、第1の実施の形態の解析装置1の構成を示す図である。第1の実施の形態の解析装置1は、非DAGのネットワーク構造を有する既知のパスウェイと反応量データとの整合性を求める。パスウェイは、物質をノードとし、ノード間がリンクによって接続されたネットワークの構造を有しているので、パスウェイと反応量データの整合性の評価は、パスウェイをネットワークとして評価を行う。「パスウェイ」とは、実験によって見つけ出された物質どうしのつながりであり、「ネットワーク」は計算生物学における物質どうしのつながりである。本書では、「グラフ」という用語も使用するが、グラフは、ネットワークの構造を数学的に表現する際の用語である。
【0015】
解析装置1は、反応量データを入力する入力部10と、解析結果を出力する出力部11と、反応量データと既知のパスウェイとの整合性を判定する演算処理部12とを備えている。
【0016】
解析装置1は、CPU、RAM、ROM、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。解析処理のためのプログラムをROMに記憶しておき、CPUがROMからプログラムを読み出して実行することにより、コンピュータが、反応量データと既知のパスウェイとの整合性を判定する処理を行う。
【0017】
入力部10の一例は、通信インターフェースである。例えば、マイクロアレイ等によって取得した反応量データを受信して解析装置1に取り込む。なお、受信した反応量データは、いったんハードディスクに保存する。出力部11の一例は、ディスプレイである。
【0018】
次に、演算処理部12について説明する。演算処理部12は、入力された反応量データと、既知のパスウェイとの整合性を求めるネットワーク整合性判定部14を有している。本実施の形態では、既知のパスウェイは、非DAGのネットワーク構造を有するパスウェイである。以下、ネットワーク整合性判定部14の処理について説明する。
【0019】
図2(a)は、既知のパスウェイの例を示す図である。ネットワーク整合性判定部14は、
図2(b)に示すように、既知のパスウェイをリンクによって接続された2つのノードからなるサブグラフに分解する。ネットワーク整合性判定部14は、反応量データに基づいて、各サブグラフにおけるノード間の一次の偏相関係数を求める。ここで、物質どうしの相関について説明する。
【0020】
図3(a)は、解析対象の反応量データの例を示す図であり、
図3(a)ではマイクロアレイを模して、反応量データをマトリックス状に記載している。反応量データは、各物質が所定の処理によって反応した程度を表す定量的なデータである。
【0021】
ここで、例えば、2つの物質Aと物質Bの相関は、
図3(b)に示すように、各検体の物質Aの反応量と物質Bの反応量をプロットすることでその関係が求まり、両物質の相関係数を求めることができる。
【0022】
図4は、
図3(b)に示す方法によって求めた、それぞれの物質の相関係数の例を記載した表である。
図4から、物質Aと物質Bの相関係数は0.3、物質Aと物質Cの相関係数は0.6であることが分かる。なお、本実施の形態では、ネットワークを評価するために物質どうしの一次の偏相関係数を用いる。偏相関係数は、対象としている2変数以外の他の変数の影響を除いた真の相関を示す係数であり、公知の方法によって計算することができる。
【0023】
以上のようにして求めたノード間の偏相関係数を用いて、ネットワーク整合性判定部14は、既知のパスウェイの各ノード間の独立性検定の確率を求める。そして、ネットワーク整合性判定部14は、
図2(b)に示すように、各ノード間の独立性検定の確率をフィッシャーの結合確率によって統合して、既知のパスウェイの反応量データに対する独立性を表す確率を求める。本実施の形態では、偏相関係数を用いたことにより、相関係数では検出不可能な偽相関を検出し、全体の整合性をより正確に見積もることができる。なお、本実施の形態では、各ノード間の独立性検定の確率を統合するのに、フィッシャーの結合確率を用いたが、他の結合確率、例えば、ブラウンの結合確率によって統合することとしてもよい。
【0024】
次に、ネットワーク整合性判定部14は、既知のパスウェイと同数のノード、同数のリンクを有する多数のネットワークをランダムに生成する。本実施の形態では、10000個のネットワークを生成する。なお、本実施の形態では、既知のパスウェイとノード及びリンクの両方が同数であるネットワークをランダムに生成したが、リンクの数は必ずしも同数でなくてもよい。ネットワーク整合性判定部14は、既知のパスウェイと同数のノードを有し、リンク数が異なるネットワークをランダムに生成してもよい。
【0025】
図5(a)〜
図5(c)は、ランダムに生成した多数のネットワークの例を示す図である。ネットワーク整合性判定部は、これらのネットワークについても、
図2(b)で説明した方法を用いて、ネットワークの結合確率を求める。すなわち、ネットワークをサブグラフに分解し、サブグラフの偏相関係数から独立性検定の確率を求め、これらを結合してネットワークの結合確率値を求める。このようにして、10000個のネットワークについての結合確率を求める。
【0026】
図6は、ランダムに生成したネットワークの結合確率の分布を示す図である。
図6に示すグラフの横軸は、ランダムなネットワークの結合確率のχ
2値(カイ二乗値)であり、縦軸は度数である。
図6に示すように、ランダムなネットワークの場合には、χ
2値は300〜360にピークを有する分布となったことが分かる。
【0027】
既知のパスウェイが反応量データに整合しているということは、既知のパスウェイが反応量データに対して独立ではないということを意味する(既知のパスウェイが反応量データに独立であるということは、両者が無関係であることを意味する)。したがって、既知のパスウェイの結合確率のχ
2値が、例えば、ランダムに生成したネットワークの確率分布の平均値付近(平均を含む所定の範囲内)にあるときは、既知のパスウェイが反応量データに対して独立性が高いことを意味し、整合性が高くないということになる。
【0028】
ネットワーク整合性判定部14は、結合確率の分布において、既知のパスウェイの結合確率値から上方の確率密度を求める。この確率密度が既知のパスウェイと反応量データとのグラフ整合性確率(GCP:Graph Consistency Probability)である。このGCPが小さくなるほど、既知のパスウェイが反応量データに対して整合するということを意味する。ネットワーク整合性判定部14は、GCPが所定の閾値(例えば、0.2)以下のときに、反応量データに対する整合性があると判定することができる。
【0029】
図6に示す例では、既知のパスウェイの結合確率のχ
2値は597.4であり、この値から上方(+∞)の確率密度は0.0001である。すなわち、GCP=0.0001である。以上の処理により、既知のパスウェイと反応量データとの整合性を表すGCPを求めることができる。
【0030】
図7は、第1の実施の形態の解析装置1の動作を示す図である。解析装置1は、検体についての反応量データを入力する(S10)。また、解析装置1は、反応量データとの比較対象の既知のパスウェイを記憶部13から読み出す(S11)。解析装置1は、既知のパスウェイを互いに接続された2つのノードからなる複数のサブグラフに分解する(S12)。続いて、解析装置1は、それぞれのサブグラフについて、ノード間の偏相関係数に基づいて独立性検定の確率を求め、この確率を結合することにより、既知のパスウェイの結合確率を求める(S13)。
【0031】
次に、解析装置1は、既知のパスウェイと同数のノード、同数のリンクを有するネットワークをランダムに生成する(S14)。本実施の形態では、10000個のネットワークを生成する。続いて、解析装置1は、ランダムに生成したネットワークについても、独立性検定の結合確率を求め、結合確率の確率分布を生成する(S15)。解析装置1は、生成した確率分布において、既知のパスウェイの結合確率値から上方の確率密度を求め、これをGCPとする(S16)。解析装置1は、求めたGCPの値を出力する。
【0032】
以上、第1の実施の形態の解析装置1の構成および動作について説明した。第1の実施の形態の解析装置1は、ノード間の独立性検定の確率を一次の偏相関係数を用いて求め、こうして求めたノード間の確率を結合してネットワークの結合確率を求めた。そして、この結合確率に基づいてGCPを計算しているので、適切なGCPを求めることができ、ネットワークの整合性を評価することができた。
【0033】
図8は、一次の偏相関係数ではなく相関係数を用いて、
図6で示したのと同じデータに対して、本実施の形態と同様の方法でGCPを求めた例である。結合確率のχ
2値の分布は、550〜600あたりにピークを有する分布となった。そして、既知のパスウェイの独立性検定の結合確率値は、C=492.0であり、この値から上方(+∞)の確率密度、すなわち、GCPは0.90となった。このように相関係数を用いた場合には、既知のパスウェイは、反応量データと整合性がない(ランダムに生成したネットワークの分布の中に含まれる)と判定された。
【0034】
図6及び
図8の実験で用いた反応量データと既知のパスウェイとは整合性を有するものであったから、偏相関係数を用いなかったときの判定結果は誤りである。本実施の形態のように、偏相関係数を用いて、反応量データと既知のパスウェイの整合性を評価することにより、正しい評価が行えることが示された。
【0035】
(第2の実施の形態)
第2の実施の形態の解析方法は、入力された反応量データに基づいて、ターゲット物質を求める方法である。「ターゲット物質」とは、疾患等を鑑別するのにキーとなる、あるいは疾患の治療薬を創るのにキーとなると期待される物質(遺伝子、タンパク質等)である。本実施の形態では、単に、コントロールとの違いを見るのではなく、パスウェイをも考慮して重要と考えられるターゲット物質を探索する。
【0036】
まず、
図9を参照して、第2の実施の形態の解析方法の処理概要について説明する。第2の実施の形態の解析方法は、例えば、マイクロアレイによって取得された反応量データが入力されると、反応量データに基づいて物質のネットワークを2通りの方法で求める。
【0037】
一つ目は、既知のパスウェイと反応量データとの整合性を評価し、既知のパスウェイの中から整合性の高いパスウェイを抽出する。具体的には、解析装置2は、第1の実施の形態において説明した方法を用いて、反応量データと既知のパスウェイとのGCPを求め、GCPが所定の閾値以下である場合に、反応量データとパスウェイとが整合性を有すると判定する。二つ目は、それぞれの物質の反応量データに基づいて各物質の関係をグラフ化したネットワークを推定する。ネットワークを推定する方法は、後述する。
【0038】
第2の実施の形態の解析方法は、整合性があると評価されたパスウェイと、推定されたネットワークの中から、オーバーラップする2つのノードのデータを検出する。
図9に示す例では、ノードEとノードGが2つのネットワークにオーバーラップする2つのノードであるとして検出される。これにより、第2の実施の形態では、パスウェイに関係の深い2つの物質をターゲット物質として検出することができる。
【0039】
図10は、第2の実施の形態の解析装置2の構成を示す図である。解析装置2は、反応量データを入力する入力部10と、解析結果を出力する出力部11と、反応量データに基づいてターゲット物質を求める演算処理部12とを備えている。
【0040】
解析装置2は、CPU、RAM、ROM、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。解析処理のためのプログラムをROMに記憶しておき、CPUがROMからプログラムを読み出して実行することにより、コンピュータが、反応量データを解析してターゲット物質を探索する処理を行う。
【0041】
入力部10の一例は、通信インターフェースである。例えば、マイクロアレイによって取得した反応量データを受信して解析装置2に取り込む。なお、受信した反応量データは、いったんハードディスクに保存する。出力部11の一例は、ディスプレイである。
【0042】
次に、演算処理部12について説明する。演算処理部12は、ネットワーク整合性判定部14と、ネットワーク推定部15と、ターゲット物質探索部16とを有している。ネットワーク推定部15は、反応量データに基づいて、物質をノードとするネットワークを推定する機能を有する。ネットワーク推定部15は、反応量データに含まれる多数の物質の反応量に基づいて、物質どうしの偏相関係数を求める。
【0043】
ネットワーク推定部15は、物質どうしの偏相関係数に基づいて、偏相関係数が所定の閾値以上のノード間にリンクを生成することによって、反応量データに含まれる物質のネットワークを生成する。
図11は、ネットワーク推定部15によって推定されたネットワークの一例を示す図である。なお、実際には、反応量データには図に示すより多くの物質が含まれている。
【0044】
ネットワーク整合性判定部14は、入力された反応量データと、既知のパスウェイとの整合性を判定し、所定の閾値以上の整合性を有するパスウェイを求める機能を有する。ネットワーク整合性判定部14は、既知のパスウェイを記憶した記憶部13から、既知のパスウェイのデータを順次読み出して、反応量データと整合性を有するかどうかを判定する。既知のパスウェイが非DAGの場合については、上述したので、ここでは、既知のパスウェイがDAGの場合の処理について説明する。
【0045】
次に、既知のパスウェイがDAGの場合の処理について説明する。
図12は、既知のパスウェイがDAGの場合にグラフ全体の尤度を求める処理を示す図である。
図12(a)は、既知のパスウェイの例を示す図である。ネットワーク整合性判定部14は、
図12(b)に示すように、DAGのパスウェイを条件付き確率で接続された2つのノードからなる複数のサブグラフに分解する。各サブグラフについて線形回帰を適用して、パスウェイの全体の尤度を計算する。
【0046】
また、ネットワーク整合性判定部14は、既知のパスウェイと同数のノードおよびリンクを有する複数のDAGを生成し、それぞれの尤度を求めて確率分布を生成する。そして、確率分布を用いてGCPを求める方法は、非DAGの場合と同じである。以上の処理により、既知のパスウェイがDAGの場合にも、反応量データと既知のパスウェイとのGCPを求めることができる。ネットワーク整合性判定部14は、GCPに基づいて、反応量データとの整合性を有するパスウェイを求めることができる。
【0047】
ターゲット物質探索部16は、推定されたネットワークと、整合性を有するネットワークにおいて共通する2つのノードの構造を探索し、探索された物質をターゲット物質として特定する。
【0048】
図13は、第2の実施の形態の解析装置2の動作を示す図である。解析装置2は、反応量データを取得すると(S20)、記憶部13から既知のパスウェイのデータを順次読み出し、反応量データとの整合性を判定し、整合性の高いパスウェイを求める(S21)。また、解析装置2は、各物質の反応量データに基づいて、物質のネットワークを推定する(S22)。解析装置2は、整合性の高い既知のパスウェイと推定されたネットワークとの両方に共通に含まれている2つのノードを探索し、探索されたノードの物質をターゲット物質として特定する(S23)。解析装置2は、特定されたターゲット物質の情報を出力する(S24)。
【0049】
以上、第2の実施の形態の解析装置2の構成及び動作について説明した。第2の実施の形態の解析装置2は、反応量データから生成されたネットワークと、反応量データと整合性を有する既知のパスウェイの両方に共通して存在する2つのノードを探索するので、パスウェイを特定する精度の高い物質を求めることができる。
【0050】
また、本実施の形態の解析装置2は、上述した従来技術のように、正常細胞のリン酸化パターンと検体細胞のリン酸化パターンとを比較するのではなく、既知のパスウェイのデータを利用して物質を探索しているので、パスウェイの全体に基づいて、適切にターゲット物質の探索を行うことができる。
【0051】
(第3の実施の形態)
第3の実施の形態の解析方法では、第2の実施の形態の解析方法に加えて、さらに別の方法でターゲットの物質を絞り込む。具体的には、反応量データに含まれる物質から、コントロールに比べて反応量が大きいシグネチャ物質を求め、シグネチャ物質であるかどうかという観点も含めてターゲット物質を求める。
【0052】
第3の実施の形態の解析方法は、
図14に示すように、整合性があると評価されたパスウェイと、推定されたネットワークの中から、オーバーラップする2つのノードのデータを検出する。そして、求めた2つのノードに係る物質がシグネチャ物質であるか否かを判定し、シグネチャ物質と判定された場合に、ノードEとノードGに係る物質が、ターゲット物質として検出される。
【0053】
図15は、第3の実施の形態の解析装置3の構成を示す図である。第3の実施の形態の解析装置3の基本的な構成は、第2の実施の形態の解析装置2と同じであるが、解析装置2の構成に加えて、シグネチャ物質抽出部17を備えている。
【0054】
シグネチャ物質抽出部17は、入力された検体の反応量データをコントロールの反応量データを比較して、コントロールに比べて所定の閾値以上の反応量を有するシグネチャ物質を求める。シグネチャ物質抽出部17は、例えば、検体の反応量データがコントロールに比べて所定の閾値以上の差を有するときに、シグネチャ物質であると判定する。また、シグネチャ物質の抽出には、本発明者が出願した特願2014−173382で開示した技術を使ってもよい。
【0055】
ターゲット物質探索部16は、ネットワーク整合性判定部14にて整合性があると評価された既知のネットワークと、ネットワーク推定部15にて推定されたネットワークに共通して存在する2つのノードの構造を探索する。共通するノードが発見されたときは、ターゲット物質探索部16は、そのノードに係る物質がシグネチャ物質であるか否かを判定し、シグネチャ物質であると判定された場合に、探索されたノードに係る物質をターゲット物質として特定する。
【0056】
図16は、第3の実施の形態の解析装置3の動作を示す図である。解析装置3は、反応量データを取得すると(S30)、記憶部13から既知のパスウェイのデータを順次読み出し、反応量データとの整合性を判定し、整合性の高いネットワークを求める(S31)。また、解析装置3は、各物質の反応量に基づいて、物質のネットワークを推定する(S32)。解析装置3は、入力された検体の反応量データをコントロールの反応量データを比較して、シグネチャ物質を求める(S33)。
【0057】
解析装置3は、整合性の高い既知のパスウェイと、推定されたネットワークに共通に含まれている2つのノードを探索し、探索されたノードの物質がシグネチャ物質であるか否かを判定する。共通するノードに係る物質がシグネチャ物質であるときに、解析装置3は、その物質をターゲット物質として特定する(S34)。解析装置3は、特定されたターゲット物質の情報を出力する(S35)。
【0058】
以上、第3の実施の形態の解析装置3の構成および動作について説明した。第3の実施の形態の解析装置3は、第2の実施の形態と同様に、パスウェイを特定する精度の高い物質を求めることができる。
【符号の説明】
【0059】
1〜3 解析装置
10 入力部
11 出力部
12 演算処理部
13 記憶部
14 ネットワーク整合性判定部
15 ネットワーク推定部
16 ターゲット物質探索部
17 シグネチャ物質抽出部