特許6884389 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人産業技術総合研究所の特許一覧

特許6884389解析装置、解析方法およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6884389

(24)【登録日】2021年5月14日

(45)【発行日】2021年6月9日

(54)【発明の名称】解析装置、解析方法およびプログラム

(51)【国際特許分類】

G16B 5/20 20190101AFI20210531BHJP

G01N 33/48 20060101ALI20210531BHJP

G01N 33/50 20060101ALI20210531BHJP

【ＦＩ】

G16B5/20

G01N33/48 Z

G01N33/50 Z

【請求項の数】10

【全頁数】18

(21)【出願番号】特願2017-215038(P2017-215038)

(22)【出願日】2017年11月7日

(65)【公開番号】特開2019-87053(P2019-87053A)

(43)【公開日】2019年6月6日

【審査請求日】2020年3月9日

(73)【特許権者】

【識別番号】301021533

【氏名又は名称】国立研究開発法人産業技術総合研究所

(74)【代理人】

【識別番号】100113549

【弁理士】

【氏名又は名称】鈴木守

(74)【代理人】

【識別番号】100115808

【弁理士】

【氏名又は名称】加藤真司

(74)【代理人】

【識別番号】230111590

【弁護士】

【氏名又は名称】金本恵子

(74)【代理人】

【識別番号】230121430

【弁護士】

【氏名又は名称】安井友章

(72)【発明者】

【氏名】堀本勝久

(72)【発明者】

【氏名】福井一彦

(72)【発明者】

【氏名】鍵和田晴美

【審査官】松野広一

(56)【参考文献】

【文献】特開２０１６−０４８４８５（ＪＰ，Ａ）

【文献】特開２００２−１７５３０５（ＪＰ，Ａ）

【文献】特開２０１４−２２８９９１（ＪＰ，Ａ）

【文献】 SAITO, Shigeru et al.，Network evaluation from the consistency of the graph structure with the measured data，BMC System Biology，２００８年１０月１日，Vol.2 No.84，pp.1-14，doi:10.1186/1752-0509-2-89

【文献】安富祖仁外１名，遺伝子発現データからの遺伝子間因果関係ネットワーク推定，情報処理学会研究報告，日本，社団法人情報処理学会，２００６年９月１５日，Vol.2006 No.99，pp.9-15，ISSN:0919-6072

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１６Ｂ５／００−９９／００

Ｇ０１Ｎ３３／４８

Ｇ０１Ｎ３３／５０

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＰｕｂＭｅｄ

(57)【特許請求の範囲】

【請求項1】

検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析装置によって解析するための解析方法であって、次のステップを備える：
（ａ）前記解析装置が、複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。

【請求項2】

請求項１に記載の解析方法であって、ステップ（ｂ−３）において、前記既知のパスウェイと同数のノード及び同数のリンクを有する複数のグラフを生成する。

【請求項3】

請求項１または２に記載の解析方法であって、（ｂ−６）前記解析装置が、前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであると判定するステップをさらに備える解析方法。

【請求項4】

検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データに基づいて、解析装置が、ターゲット物質を求める解析方法であって、次のステップを備える：
（ａ）前記解析装置が、複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有する既知のパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ；
（ｂ−６）前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ；
（ｃ）前記解析装置が、前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ；
（ｄ）前記解析装置が、ステップ（ｂ）で選択された前記既知のパスウェイと、ステップ（ｃ）で生成された前記ネットワーク構造との間で、リンクで接続された２つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。

【請求項5】

請求項４に記載の解析方法であって、ステップ（ｂ）で読み出した既知のパスウェイが有向非巡回グラフである場合に、次のステップによってパスウェイを選択する解析方法：
（ｂ−７）前記既知のパスウェイを条件付き確率で接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−８）各サブグラフに前記反応量データを用いて線形回帰を行い、前記既知のパスウェイの全体の尤度を求めるステップ；
（ｂ−９）前記既知のパスウェイと同数のノードを有する複数の有向非巡回グラフを生成するステップ；
（ｂ−１０）前記複数の有向非巡回グラフの尤度を上記ステップ（ｂ−７）及び（ｂ−８）と同じ方法によって求め、前記複数の有向非巡回グラフの尤度の確率分布を生成するステップ；
（ｂ−１１）上記ステップ（ｂ−１０）で求めた確率分布において、上記ステップ（ｂ−８）で求めた尤度から上側における確率密度をグラフ整合性確率として計算するステップ；
（ｂ−１２）前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであると判定するステップ。

【請求項6】

請求項４または５に記載の解析方法であって、さらに、
（ｅ）前記解析装置が、前記反応量データがコントロールの反応量に対して所定の閾値以上の差分を有する物質をシグネチャ物質として求めるステップを備え、
前記ステップ（ｄ）では、前記ステップ（ｅ）で求めた物質のデータをも用いてターゲット物質を求める。

【請求項7】

検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析する解析装置であって、
複数の検体についての反応量データを入力する入力部と、
前記物質をノードとする既知のパスウェイのデータを記憶した記憶部と、
前記記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるネットワーク整合性判定部と、
を備え、
前記ネットワーク整合性判定部は、前記既知のパスウェイが有向非巡回グラフでない場合に、次の処理によって、前記既知のパスウェイと前記反応量データとの整合性を表すグラフ整合性確率を求める：
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。

【請求項8】

検体に含まれる複数に物質に対して所定の処理を行ったときの反応量データに基づいて、ターゲット物質を求める解析装置であって、
複数の検体についての反応量データを入力する入力部と、
前記物質をノードとする既知のパスウェイのデータを記憶した記憶部と、
前記記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイの中から前記反応量データに整合するパスウェイを選択するネットワーク整合性判定部と、
前記反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するネットワーク推定部と、
前記ネットワーク整合性判定部にて選択した前記既知のパスウェイと、前記ネットワーク推定部にて生成した前記ネットワーク構造との間で、リンクで接続された２つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるターゲット物質探索部と、
を備え、
前記ネットワーク整合性判定部は、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次の処理によって前記反応量データに整合する既知のパスウェイを選択する：
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ；
（ｂ−６）前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ。

【請求項9】

検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析するためのプログラムであって、コンピュータに、次のステップを実行させる：
（ａ）複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。

【請求項10】

検体に含まれる複数に物質に対して所定の処理を行ったときの反応量データに基づいて、ターゲット物質を求めるためのプログラムであって、コンピュータに、次のステップを実行させる：
（ａ）複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有するパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ；
（ｂ−６）前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイであるとして選択するステップ；
（ｃ）前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ；
（ｄ）ステップ（ｂ）で選択された前記既知のパスウェイと、ステップ（ｃ）で生成された前記ネットワーク構造との間で、リンクで接続された２つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析する技術に関する。

【背景技術】

【0002】

タンパク質のリン酸化は、キナーゼにより触媒される反応で、細胞増殖や転写制御、細胞死、代謝など様々な生命機能を調節している。がんを初めとする疾患などもリン酸化酵素の異常により起こることが知られており、リン酸化シグナルパスウェイは、ヒトの疾患にも大きな影響を持っている。リン酸化シグナルを解析することで創薬や疾患の診断などに対して有用な情報を得ることができると考えられている（非特許文献１）。

【0003】

非特許文献１は、ペプチドアレイを用いたリン酸化シグナルの解析法を開示している。この文献では、正常細胞のリン酸化パターンと検体細胞のリン酸化パターンとを比較することによって疾患の早期診断に利用する（非特許文献１、９９頁右欄〜１００頁左欄）。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】船津貴洋他「細胞内リン酸化シグナル網羅的解析のためのペプチド固定化酸化チタン基板の開発」北九州工業高等専門学校研究報告第44号（2011年1月）

【非特許文献2】堀本勝久他「Network evaluation from consistency of the graph structure with the measured data」BMC Systems Biology 2008, 2:84（2008年10月1日）

【発明の概要】

【発明が解決しようとする課題】

【0005】

非特許文献１に記載された方法は、正常細胞と検体細胞とでリン酸化の程度が異なるペプチドを発見することができるにとどまり、そのリン酸化シグナルパスウェイを解析することはできなかった。

【0006】

本発明者は、非特許文献２において、測定データとネットワーク構造との整合性を評価する方法を発表した。非特許文献２で開示した方法は、ネットワーク構造が有向非巡回グラフ（ＤＡＧ）である場合の方法である。ＤＡＧでないネットワーク構造と測定データとの整合性を評価する方法を開示した文献は存在しなかった。

【0007】

本発明は、上記背景に鑑み、検体に含まれる複数の物質の反応量データと既知のパスウェイとの整合性を解析する方法を提供することを目的とする。

【課題を解決するための手段】

【0008】

本発明の解析方法は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データと既知のパスウェイとの整合性を解析装置によって解析するための解析方法であって、次のステップを備える：
（ａ）前記解析装置が、複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から前記既知のパスウェイのデータを読み出し、前記既知のパスウェイと前記反応量データとの整合性を求めるステップであって、前記既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイとの整合性を求めるステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ。

【0009】

本発明の別の態様の解析方法は、検体に含まれる複数の物質に対して所定の処理を行ったときの反応量データに基づいて、解析装置が、ターゲット物質を求める解析方法であって、次のステップを備える：
（ａ）前記解析装置が、複数の検体についての前記反応量データを取得するステップ；
（ｂ）前記解析装置が、前記物質をノードとする既知のパスウェイのデータを記憶した記憶部から、前記既知のパスウェイのデータを読み出し、前記反応量データと所定の閾値以上の整合性を有する既知のパスウェイを選択するステップであって、前記記憶部に記憶された既知のパスウェイが有向非巡回グラフでない場合に、次のステップによって既知のパスウェイを選択するステップ；
（ｂ−１）前記既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解するステップ；
（ｂ−２）各サブグラフに前記反応量データを適用して各ノード間の偏相関係数を求め、求めた偏相関係数の独立性検定の確率値を結合して、前記既知のパスウェイの前記反応量データに対する独立性を表す結合確率値を求めるステップ；
（ｂ−３）前記既知のパスウェイと同数のノードを有する複数のグラフを生成するステップ；
（ｂ−４）前記複数のグラフの結合確率を上記ステップ（ｂ−１）及び（ｂ−２）と同じ方法によって求め、前記複数のグラフの結合確率値の確率分布を生成するステップ；
（ｂ−５）上記ステップ（ｂ−４）で求めた確率分布において、上記ステップ（ｂ−２）で求めた結合確率値から上側における確率密度をグラフ整合性確率として求めるステップ；
（ｂ−６）前記グラフ整合性確率が所定の閾値以下である場合に、前記既知のパスウェイを前記反応量データに整合するパスウェイとして選択するステップ；
（ｃ）前記解析装置が、前記物質の反応量データに基づいて、前記物質間の偏相関係数を求め、前記偏相関係数に基づいて前記物質をノードとするネットワーク構造を生成するステップ；
（ｄ）前記解析装置が、ステップ（ｂ）で選択された前記既知のパスウェイと、ステップ（ｃ）で生成された前記ネットワーク構造との間で、リンクで接続された２つのノードが同じ部分を探索し、探索されたノードの物質をターゲット物質として求めるステップ。

【0010】

本発明の解析方法は、さらに、（ｅ）前記解析装置が、前記反応量データがコントロールの反応量に対して所定の閾値以上の差分を有する物質をシグネチャ物質として求めるステップを備え、前記ステップ（ｄ）では、前記ステップ（ｅ）で求めた物質のデータをも用いてターゲット物質を求めてもよい。

【発明の効果】

【0011】

本発明によれば、既知のパスウェイがＤＡＧでない場合であっても、反応量データとの整合性を適切に求めることができる。

【図面の簡単な説明】

【0012】

【図1】第１の実施の形態の解析装置の構成を示す図である。

【図2】（ａ）既知のパスウェイの例を示す図である。（ｂ）既知のパスウェイをサブグラフに分解した例を示す図である。

【図3】（ａ）解析対象の反応量データの例を示す図である。（ｂ）２つの物質Ａと物質Ｂの相関の例を示す図である。

【図4】それぞれの物質の相関係数の例を記載した表である。

【図5】（ａ）〜（ｃ）ランダムに生成した多数のネットワークの例を示す図である。

【図6】ランダムなネットワークの結合確率の確率分布を示す図である。

【図7】第１の実施の形態の解析装置の動作を示す図である。

【図8】偏相関係数ではなく相関係数を用いて求めた結合確率の確率分布を示す図である。

【図9】第２の実施の形態の解析方法の概要を示す図である。

【図10】第２の実施の形態の解析装置の構成を示す図である。

【図11】ネットワーク推定の例を示す図である。

【図12】（ａ）既知のパスウェイ（ＤＡＧ）の例を示す図である。（ｂ）既知のパスウェイ（ＤＡＧ）をサブグラフに分解した例を示す図である。

【図13】第２の実施の形態の解析装置の動作を示す図である。

【図14】第３の実施の形態の解析方法の概要を示す図である。

【図15】第３の実施の形態の解析装置の構成を示す図である。

【図16】第３の実施の形態の解析装置の動作を示す図である。

【発明を実施するための形態】

【0013】

以下、本発明の実施の形態の解析方法および装置について図面を参照しながら説明する。実施の形態においては、検体に含まれる複数の物質に対して所定の処理を行ったときの生物学的な反応量データと既知のパスウェイとの整合性を解析する方法および装置について説明する。ここで、以下に説明する実施の形態の解析対象について述べる。例えば、免疫系や疾患に関するパスウェイは、因果関係が不明な点が多いため、無向グラフで評価することが好ましい。具体的には、例えば、抗原抗体反応などのタンパク質間の相互作用の連鎖が挙げられる。この場合、物質としては、タンパク質であり、反応量データは、抗原抗体相互作用のアフィニティー等である。ここで紹介したのは一例であり、本実施の形態の解析方法は、様々な物質に適用することができる。

【0014】

（第１の実施の形態）
図１は、第１の実施の形態の解析装置１の構成を示す図である。第１の実施の形態の解析装置１は、非ＤＡＧのネットワーク構造を有する既知のパスウェイと反応量データとの整合性を求める。パスウェイは、物質をノードとし、ノード間がリンクによって接続されたネットワークの構造を有しているので、パスウェイと反応量データの整合性の評価は、パスウェイをネットワークとして評価を行う。「パスウェイ」とは、実験によって見つけ出された物質どうしのつながりであり、「ネットワーク」は計算生物学における物質どうしのつながりである。本書では、「グラフ」という用語も使用するが、グラフは、ネットワークの構造を数学的に表現する際の用語である。

【0015】

解析装置１は、反応量データを入力する入力部１０と、解析結果を出力する出力部１１と、反応量データと既知のパスウェイとの整合性を判定する演算処理部１２とを備えている。

【0016】

解析装置１は、ＣＰＵ、ＲＡＭ、ＲＯＭ、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。解析処理のためのプログラムをＲＯＭに記憶しておき、ＣＰＵがＲＯＭからプログラムを読み出して実行することにより、コンピュータが、反応量データと既知のパスウェイとの整合性を判定する処理を行う。

【0017】

入力部１０の一例は、通信インターフェースである。例えば、マイクロアレイ等によって取得した反応量データを受信して解析装置１に取り込む。なお、受信した反応量データは、いったんハードディスクに保存する。出力部１１の一例は、ディスプレイである。

【0018】

次に、演算処理部１２について説明する。演算処理部１２は、入力された反応量データと、既知のパスウェイとの整合性を求めるネットワーク整合性判定部１４を有している。本実施の形態では、既知のパスウェイは、非ＤＡＧのネットワーク構造を有するパスウェイである。以下、ネットワーク整合性判定部１４の処理について説明する。

【0019】

図２（ａ）は、既知のパスウェイの例を示す図である。ネットワーク整合性判定部１４は、図２（ｂ）に示すように、既知のパスウェイをリンクによって接続された２つのノードからなるサブグラフに分解する。ネットワーク整合性判定部１４は、反応量データに基づいて、各サブグラフにおけるノード間の一次の偏相関係数を求める。ここで、物質どうしの相関について説明する。

【0020】

図３（ａ）は、解析対象の反応量データの例を示す図であり、図３（ａ）ではマイクロアレイを模して、反応量データをマトリックス状に記載している。反応量データは、各物質が所定の処理によって反応した程度を表す定量的なデータである。

【0021】

ここで、例えば、２つの物質Ａと物質Ｂの相関は、図３（ｂ）に示すように、各検体の物質Ａの反応量と物質Ｂの反応量をプロットすることでその関係が求まり、両物質の相関係数を求めることができる。

【0022】

図４は、図３（ｂ）に示す方法によって求めた、それぞれの物質の相関係数の例を記載した表である。図４から、物質Ａと物質Ｂの相関係数は０．３、物質Ａと物質Ｃの相関係数は０．６であることが分かる。なお、本実施の形態では、ネットワークを評価するために物質どうしの一次の偏相関係数を用いる。偏相関係数は、対象としている２変数以外の他の変数の影響を除いた真の相関を示す係数であり、公知の方法によって計算することができる。

【0023】

以上のようにして求めたノード間の偏相関係数を用いて、ネットワーク整合性判定部１４は、既知のパスウェイの各ノード間の独立性検定の確率を求める。そして、ネットワーク整合性判定部１４は、図２（ｂ）に示すように、各ノード間の独立性検定の確率をフィッシャーの結合確率によって統合して、既知のパスウェイの反応量データに対する独立性を表す確率を求める。本実施の形態では、偏相関係数を用いたことにより、相関係数では検出不可能な偽相関を検出し、全体の整合性をより正確に見積もることができる。なお、本実施の形態では、各ノード間の独立性検定の確率を統合するのに、フィッシャーの結合確率を用いたが、他の結合確率、例えば、ブラウンの結合確率によって統合することとしてもよい。

【0024】

次に、ネットワーク整合性判定部１４は、既知のパスウェイと同数のノード、同数のリンクを有する多数のネットワークをランダムに生成する。本実施の形態では、１００００個のネットワークを生成する。なお、本実施の形態では、既知のパスウェイとノード及びリンクの両方が同数であるネットワークをランダムに生成したが、リンクの数は必ずしも同数でなくてもよい。ネットワーク整合性判定部１４は、既知のパスウェイと同数のノードを有し、リンク数が異なるネットワークをランダムに生成してもよい。

【0025】

図５（ａ）〜図５（ｃ）は、ランダムに生成した多数のネットワークの例を示す図である。ネットワーク整合性判定部は、これらのネットワークについても、図２（ｂ）で説明した方法を用いて、ネットワークの結合確率を求める。すなわち、ネットワークをサブグラフに分解し、サブグラフの偏相関係数から独立性検定の確率を求め、これらを結合してネットワークの結合確率値を求める。このようにして、１００００個のネットワークについての結合確率を求める。

【0026】

図６は、ランダムに生成したネットワークの結合確率の分布を示す図である。図６に示すグラフの横軸は、ランダムなネットワークの結合確率のχ^２値（カイ二乗値）であり、縦軸は度数である。図６に示すように、ランダムなネットワークの場合には、χ^２値は３００〜３６０にピークを有する分布となったことが分かる。

【0027】

既知のパスウェイが反応量データに整合しているということは、既知のパスウェイが反応量データに対して独立ではないということを意味する（既知のパスウェイが反応量データに独立であるということは、両者が無関係であることを意味する）。したがって、既知のパスウェイの結合確率のχ^２値が、例えば、ランダムに生成したネットワークの確率分布の平均値付近（平均を含む所定の範囲内）にあるときは、既知のパスウェイが反応量データに対して独立性が高いことを意味し、整合性が高くないということになる。

【0028】

ネットワーク整合性判定部１４は、結合確率の分布において、既知のパスウェイの結合確率値から上方の確率密度を求める。この確率密度が既知のパスウェイと反応量データとのグラフ整合性確率（ＧＣＰ：Graph Consistency Probability）である。このＧＣＰが小さくなるほど、既知のパスウェイが反応量データに対して整合するということを意味する。ネットワーク整合性判定部１４は、ＧＣＰが所定の閾値（例えば、０．２）以下のときに、反応量データに対する整合性があると判定することができる。

【0029】

図６に示す例では、既知のパスウェイの結合確率のχ^２値は５９７．４であり、この値から上方（＋∞）の確率密度は０．０００１である。すなわち、ＧＣＰ＝０．０００１である。以上の処理により、既知のパスウェイと反応量データとの整合性を表すＧＣＰを求めることができる。

【0030】

図７は、第１の実施の形態の解析装置１の動作を示す図である。解析装置１は、検体についての反応量データを入力する（Ｓ１０）。また、解析装置１は、反応量データとの比較対象の既知のパスウェイを記憶部１３から読み出す（Ｓ１１）。解析装置１は、既知のパスウェイを互いに接続された２つのノードからなる複数のサブグラフに分解する（Ｓ１２）。続いて、解析装置１は、それぞれのサブグラフについて、ノード間の偏相関係数に基づいて独立性検定の確率を求め、この確率を結合することにより、既知のパスウェイの結合確率を求める（Ｓ１３）。

【0031】

次に、解析装置１は、既知のパスウェイと同数のノード、同数のリンクを有するネットワークをランダムに生成する（Ｓ１４）。本実施の形態では、１００００個のネットワークを生成する。続いて、解析装置１は、ランダムに生成したネットワークについても、独立性検定の結合確率を求め、結合確率の確率分布を生成する（Ｓ１５）。解析装置１は、生成した確率分布において、既知のパスウェイの結合確率値から上方の確率密度を求め、これをＧＣＰとする（Ｓ１６）。解析装置１は、求めたＧＣＰの値を出力する。

【0032】

以上、第１の実施の形態の解析装置１の構成および動作について説明した。第１の実施の形態の解析装置１は、ノード間の独立性検定の確率を一次の偏相関係数を用いて求め、こうして求めたノード間の確率を結合してネットワークの結合確率を求めた。そして、この結合確率に基づいてＧＣＰを計算しているので、適切なＧＣＰを求めることができ、ネットワークの整合性を評価することができた。

【0033】

図８は、一次の偏相関係数ではなく相関係数を用いて、図６で示したのと同じデータに対して、本実施の形態と同様の方法でＧＣＰを求めた例である。結合確率のχ^２値の分布は、５５０〜６００あたりにピークを有する分布となった。そして、既知のパスウェイの独立性検定の結合確率値は、Ｃ＝４９２．０であり、この値から上方（＋∞）の確率密度、すなわち、ＧＣＰは０．９０となった。このように相関係数を用いた場合には、既知のパスウェイは、反応量データと整合性がない（ランダムに生成したネットワークの分布の中に含まれる）と判定された。

【0034】

図６及び図８の実験で用いた反応量データと既知のパスウェイとは整合性を有するものであったから、偏相関係数を用いなかったときの判定結果は誤りである。本実施の形態のように、偏相関係数を用いて、反応量データと既知のパスウェイの整合性を評価することにより、正しい評価が行えることが示された。

【0035】

（第２の実施の形態）
第２の実施の形態の解析方法は、入力された反応量データに基づいて、ターゲット物質を求める方法である。「ターゲット物質」とは、疾患等を鑑別するのにキーとなる、あるいは疾患の治療薬を創るのにキーとなると期待される物質（遺伝子、タンパク質等）である。本実施の形態では、単に、コントロールとの違いを見るのではなく、パスウェイをも考慮して重要と考えられるターゲット物質を探索する。

【0036】

まず、図９を参照して、第２の実施の形態の解析方法の処理概要について説明する。第２の実施の形態の解析方法は、例えば、マイクロアレイによって取得された反応量データが入力されると、反応量データに基づいて物質のネットワークを２通りの方法で求める。

【0037】

一つ目は、既知のパスウェイと反応量データとの整合性を評価し、既知のパスウェイの中から整合性の高いパスウェイを抽出する。具体的には、解析装置２は、第１の実施の形態において説明した方法を用いて、反応量データと既知のパスウェイとのＧＣＰを求め、ＧＣＰが所定の閾値以下である場合に、反応量データとパスウェイとが整合性を有すると判定する。二つ目は、それぞれの物質の反応量データに基づいて各物質の関係をグラフ化したネットワークを推定する。ネットワークを推定する方法は、後述する。

【0038】

第２の実施の形態の解析方法は、整合性があると評価されたパスウェイと、推定されたネットワークの中から、オーバーラップする２つのノードのデータを検出する。図９に示す例では、ノードＥとノードＧが２つのネットワークにオーバーラップする２つのノードであるとして検出される。これにより、第２の実施の形態では、パスウェイに関係の深い２つの物質をターゲット物質として検出することができる。

【0039】

図１０は、第２の実施の形態の解析装置２の構成を示す図である。解析装置２は、反応量データを入力する入力部１０と、解析結果を出力する出力部１１と、反応量データに基づいてターゲット物質を求める演算処理部１２とを備えている。

【0040】

解析装置２は、ＣＰＵ、ＲＡＭ、ＲＯＭ、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。解析処理のためのプログラムをＲＯＭに記憶しておき、ＣＰＵがＲＯＭからプログラムを読み出して実行することにより、コンピュータが、反応量データを解析してターゲット物質を探索する処理を行う。

【0041】

入力部１０の一例は、通信インターフェースである。例えば、マイクロアレイによって取得した反応量データを受信して解析装置２に取り込む。なお、受信した反応量データは、いったんハードディスクに保存する。出力部１１の一例は、ディスプレイである。

【0042】

次に、演算処理部１２について説明する。演算処理部１２は、ネットワーク整合性判定部１４と、ネットワーク推定部１５と、ターゲット物質探索部１６とを有している。ネットワーク推定部１５は、反応量データに基づいて、物質をノードとするネットワークを推定する機能を有する。ネットワーク推定部１５は、反応量データに含まれる多数の物質の反応量に基づいて、物質どうしの偏相関係数を求める。

【0043】

ネットワーク推定部１５は、物質どうしの偏相関係数に基づいて、偏相関係数が所定の閾値以上のノード間にリンクを生成することによって、反応量データに含まれる物質のネットワークを生成する。図１１は、ネットワーク推定部１５によって推定されたネットワークの一例を示す図である。なお、実際には、反応量データには図に示すより多くの物質が含まれている。

【0044】

ネットワーク整合性判定部１４は、入力された反応量データと、既知のパスウェイとの整合性を判定し、所定の閾値以上の整合性を有するパスウェイを求める機能を有する。ネットワーク整合性判定部１４は、既知のパスウェイを記憶した記憶部１３から、既知のパスウェイのデータを順次読み出して、反応量データと整合性を有するかどうかを判定する。既知のパスウェイが非ＤＡＧの場合については、上述したので、ここでは、既知のパスウェイがＤＡＧの場合の処理について説明する。

【0045】

次に、既知のパスウェイがＤＡＧの場合の処理について説明する。図１２は、既知のパスウェイがＤＡＧの場合にグラフ全体の尤度を求める処理を示す図である。図１２（ａ）は、既知のパスウェイの例を示す図である。ネットワーク整合性判定部１４は、図１２（ｂ）に示すように、ＤＡＧのパスウェイを条件付き確率で接続された２つのノードからなる複数のサブグラフに分解する。各サブグラフについて線形回帰を適用して、パスウェイの全体の尤度を計算する。

【0046】

また、ネットワーク整合性判定部１４は、既知のパスウェイと同数のノードおよびリンクを有する複数のＤＡＧを生成し、それぞれの尤度を求めて確率分布を生成する。そして、確率分布を用いてＧＣＰを求める方法は、非ＤＡＧの場合と同じである。以上の処理により、既知のパスウェイがＤＡＧの場合にも、反応量データと既知のパスウェイとのＧＣＰを求めることができる。ネットワーク整合性判定部１４は、ＧＣＰに基づいて、反応量データとの整合性を有するパスウェイを求めることができる。

【0047】

ターゲット物質探索部１６は、推定されたネットワークと、整合性を有するネットワークにおいて共通する２つのノードの構造を探索し、探索された物質をターゲット物質として特定する。

【0048】

図１３は、第２の実施の形態の解析装置２の動作を示す図である。解析装置２は、反応量データを取得すると（Ｓ２０）、記憶部１３から既知のパスウェイのデータを順次読み出し、反応量データとの整合性を判定し、整合性の高いパスウェイを求める（Ｓ２１）。また、解析装置２は、各物質の反応量データに基づいて、物質のネットワークを推定する（Ｓ２２）。解析装置２は、整合性の高い既知のパスウェイと推定されたネットワークとの両方に共通に含まれている２つのノードを探索し、探索されたノードの物質をターゲット物質として特定する（Ｓ２３）。解析装置２は、特定されたターゲット物質の情報を出力する（Ｓ２４）。

【0049】

以上、第２の実施の形態の解析装置２の構成及び動作について説明した。第２の実施の形態の解析装置２は、反応量データから生成されたネットワークと、反応量データと整合性を有する既知のパスウェイの両方に共通して存在する２つのノードを探索するので、パスウェイを特定する精度の高い物質を求めることができる。

【0050】

また、本実施の形態の解析装置２は、上述した従来技術のように、正常細胞のリン酸化パターンと検体細胞のリン酸化パターンとを比較するのではなく、既知のパスウェイのデータを利用して物質を探索しているので、パスウェイの全体に基づいて、適切にターゲット物質の探索を行うことができる。

【0051】

（第３の実施の形態）
第３の実施の形態の解析方法では、第２の実施の形態の解析方法に加えて、さらに別の方法でターゲットの物質を絞り込む。具体的には、反応量データに含まれる物質から、コントロールに比べて反応量が大きいシグネチャ物質を求め、シグネチャ物質であるかどうかという観点も含めてターゲット物質を求める。

【0052】

第３の実施の形態の解析方法は、図１４に示すように、整合性があると評価されたパスウェイと、推定されたネットワークの中から、オーバーラップする２つのノードのデータを検出する。そして、求めた２つのノードに係る物質がシグネチャ物質であるか否かを判定し、シグネチャ物質と判定された場合に、ノードＥとノードＧに係る物質が、ターゲット物質として検出される。

【0053】

図１５は、第３の実施の形態の解析装置３の構成を示す図である。第３の実施の形態の解析装置３の基本的な構成は、第２の実施の形態の解析装置２と同じであるが、解析装置２の構成に加えて、シグネチャ物質抽出部１７を備えている。

【0054】

シグネチャ物質抽出部１７は、入力された検体の反応量データをコントロールの反応量データを比較して、コントロールに比べて所定の閾値以上の反応量を有するシグネチャ物質を求める。シグネチャ物質抽出部１７は、例えば、検体の反応量データがコントロールに比べて所定の閾値以上の差を有するときに、シグネチャ物質であると判定する。また、シグネチャ物質の抽出には、本発明者が出願した特願２０１４−１７３３８２で開示した技術を使ってもよい。

【0055】

ターゲット物質探索部１６は、ネットワーク整合性判定部１４にて整合性があると評価された既知のネットワークと、ネットワーク推定部１５にて推定されたネットワークに共通して存在する２つのノードの構造を探索する。共通するノードが発見されたときは、ターゲット物質探索部１６は、そのノードに係る物質がシグネチャ物質であるか否かを判定し、シグネチャ物質であると判定された場合に、探索されたノードに係る物質をターゲット物質として特定する。

【0056】

図１６は、第３の実施の形態の解析装置３の動作を示す図である。解析装置３は、反応量データを取得すると（Ｓ３０）、記憶部１３から既知のパスウェイのデータを順次読み出し、反応量データとの整合性を判定し、整合性の高いネットワークを求める（Ｓ３１）。また、解析装置３は、各物質の反応量に基づいて、物質のネットワークを推定する（Ｓ３２）。解析装置３は、入力された検体の反応量データをコントロールの反応量データを比較して、シグネチャ物質を求める（Ｓ３３）。

【0057】

解析装置３は、整合性の高い既知のパスウェイと、推定されたネットワークに共通に含まれている２つのノードを探索し、探索されたノードの物質がシグネチャ物質であるか否かを判定する。共通するノードに係る物質がシグネチャ物質であるときに、解析装置３は、その物質をターゲット物質として特定する（Ｓ３４）。解析装置３は、特定されたターゲット物質の情報を出力する（Ｓ３５）。

【0058】

以上、第３の実施の形態の解析装置３の構成および動作について説明した。第３の実施の形態の解析装置３は、第２の実施の形態と同様に、パスウェイを特定する精度の高い物質を求めることができる。

【符号の説明】

【0059】

１〜３解析装置
１０入力部
１１出力部
１２演算処理部
１３記憶部
１４ネットワーク整合性判定部
１５ネットワーク推定部
１６ターゲット物質探索部
１７シグネチャ物質抽出部

【図1】