特許第6804721号(P6804721)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧
特許6804721生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム
<>
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000002
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000003
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000004
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000005
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000006
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000007
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000008
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000009
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000010
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000011
  • 特許6804721-生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6804721
(24)【登録日】2020年12月7日
(45)【発行日】2020年12月23日
(54)【発明の名称】生物学的経路の関連性の評価を行うコンピュータ実装方法、コンピュータ・システム、およびコンピュータ・プログラム
(51)【国際特許分類】
   G16B 45/00 20190101AFI20201214BHJP
【FI】
   G16B45/00
【請求項の数】24
【全頁数】24
(21)【出願番号】特願2017-548186(P2017-548186)
(86)(22)【出願日】2016年3月21日
(65)【公表番号】特表2018-517192(P2018-517192A)
(43)【公表日】2018年6月28日
(86)【国際出願番号】CN2016076828
(87)【国際公開番号】WO2016150358
(87)【国際公開日】20160929
【審査請求日】2018年10月31日
(31)【優先権主張番号】14/665,024
(32)【優先日】2015年3月23日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
(74)【代理人】
【識別番号】100108501
【弁理士】
【氏名又は名称】上野 剛史
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】カーメリ、ボアズ
(72)【発明者】
【氏名】エルハン、ビラル
(72)【発明者】
【氏名】小山 尚彦
(72)【発明者】
【氏名】ラリッソラックライ、カーン
(72)【発明者】
【氏名】ロイユル、アジャイ、ケイ
(72)【発明者】
【氏名】ウトロ、フィリッポ
(72)【発明者】
【氏名】ワクス、ゼーブ
【審査官】 田付 徳雄
(56)【参考文献】
【文献】 特開2006−146380(JP,A)
【文献】 特開2007−293430(JP,A)
【文献】 特表2013−533530(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
対象の病気に対する複数の生物学的経路(以下、「経路」という)の関連性を評価する、コンピュータにより実装される方法であって、前記経路それぞれはソース遺伝子(以下、「ソース」という)と、該ソースの下流でターゲットにされることが可能な分子的実体(以下、「ターゲット」という)を含んでおり、前記方法が、
プロセッサによって、前記経路それぞれに対する前記ソースの影響を作成することと、
前記プロセッサによって、前記経路それぞれの変更の少なくとも一部に基づいて、対象の薬品を使用して前記経路それぞれをターゲットにすることの価値を作成することと、
前記プロセッサによって、前記経路それぞれ内の前記ソースと前記ターゲットとの間の関係を識別することと、
前記経路それぞれに対する前記ソースの前記影響、
前記経路それぞれの変更の少なくとも一部に基づいて、対象の薬品を使用して前記経路それぞれをターゲットにすることの前記価値、および
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係
を結合すること、ここで、前記結合によって前記対象の病気に対する前記経路それぞれの前記関連性の評価が得られる
前記プロセッサによって、前記評価の少なくとも一部に基づいて、前記複数の経路のうちの特定の経路の簡略化された視覚化を実行することと
を含む
前記方法。
【請求項2】
前記経路それぞれに対する前記ソースの前記影響が、前記ソースの加重値を含む、請求項1に記載の方法。
【請求項3】
記経路それぞれをターゲットにすることの前記価値が、前記ターゲットの加重値を含む、請求項1又は2に記載の方法。
【請求項4】
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係が、前記ソースから前記ターゲットまでの前記経路それぞれのトポロジーを含む、請求項1乃至3のいずれか1項に記載の方法。
【請求項5】
前記プロセッサによって、前記評価を他の前記評価と比較してランク付けすることをさらに含む、請求項1乃至4のいずれか1項に記載の方法。
【請求項6】
前記簡略化された視覚化を実行することが、
前記特定の経路のグラフを作成すること、ここで、前記グラフが、エッジによって接続された複数のノードを含んでいる
前記グラフの関連するパスを識別することと、
前記関連するパスから、情報を与えないノードまたは無意味なノードを削除して、第1のサブグラフを作成することと、
前記第1のサブグラフの関係および関連する属性を簡略化して、第2の簡略化されたサブグラフを作成することと
を含む、請求項1〜5のいずれか1項に記載の方法。
【請求項7】
前記関連する属性が、前記第2の簡略化されたサブグラフの前記複数のノードまたは前記複数のエッジの特性を備える、請求項に記載の方法。
【請求項8】
前記特性が、
人工的リンクの距離、または
スーパーセット複合体
を含む、請求項7に記載の方法。
【請求項9】
対象の病気に対する複数の生物学的経路(以下、「経路」という)の関連性を評価する、コンピュータ・システムであって、前記経路それぞれはソース遺伝子(以下、「ソース」という)と、該ソースの下流でターゲットにされることが可能な分子的実体(以下、「ターゲット」という)を含んでおり、前記コンピュータ・システムがプロセッサを備えており、
前記プロセッサは、前記経路それぞれに対する前記ソースの影響を作成するようにさらに構成され、
前記プロセッサは、前記経路それぞれの変更の少なくとも一部に基づいて、対象の薬品を使用して前記経路それぞれをターゲットにすることの価値を作成するようにさらに構成され、
前記プロセッサは、前記経路それぞれ内の前記ソースと前記ターゲットとの間の関係を識別するようにさらに構成され、
前記プロセッサは、
前記経路それぞれに対する前記ソースの前記影響、
前記経路それぞれの変更の少なくとも一部に基づいて、対象の薬品を使用して前記経路それぞれをターゲットにすることの前記価値、および
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係
を結合するようにさらに構成され、ここで、前記結合によって前記対象の病気に対する前記経路それぞれの前記関連性の評価が得られる、
前記プロセッサは、前記評価の少なくとも一部に基づいて、前記複数の経路のうちの特定の経路の簡略化された視覚化を実行するようにさらに構成される、
前記コンピュータ・システム。
【請求項10】
前記経路それぞれに対する前記ソースの前記影響が、前記ソースの加重値を含む、請求項9に記載のコンピュータ・システム。
【請求項11】
記経路それぞれをターゲットにすることの前記価値が、前記ターゲットの加重値を含む、請求項9又は10に記載のコンピュータ・システム。
【請求項12】
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係が、前記ソースから前記ターゲットまでの前記経それぞれ路のトポロジーを含む、請求項9乃至11のいずれか1項に記載のコンピュータ・システム。
【請求項13】
前記プロセッサは、前記評価を他の前記評価と比較してランク付けするようにさらに構成される、請求項9乃至12のいずれか1項に記載のコンピュータ・システム。
【請求項14】
前記簡略化された視覚化を実行することが、
前記特定の経路のグラフを作成すること、ここで、前記グラフが、エッジによって接続された複数のノードを含んでいる
前記グラフの関連するパスを識別することと、
前記関連するパスから、情報を与えないノードまたは無意味なノードを削除して、第1のサブグラフを作成することと、
前記第1のサブグラフの関係および関連する属性を簡略化して、第2の簡略化されたサブグラフを作成することと
を含む、請求項9〜13のいずれか1項に記載のコンピュータ・システム。
【請求項15】
前記関連する属性が、前記第2の簡略化されたサブグラフの前記複数のノードまたは前記複数のエッジの特性を備える、請求項14に記載のコンピュータ・システム。
【請求項16】
前記特性が、
人工的リンクの距離、または
スーパーセット複合体
を含む、請求項15に記載のコンピュータ・システム。
【請求項17】
対象の病気に対する複数の生物学的経路(以下、「経路」という)の関連性を評価する、コンピュータにより実装されるコンピュータ・プログラムであって、前記経路それぞれはソース遺伝子(以下、「ソース」という)と、該ソースの下流でターゲットにされることが可能な分子的実体(以下、「ターゲット」という)を含んでおり前記コンピュータに、
前記経路それぞれに対する前記ソースの影響を作成することと、
前記経路それぞれの変更の少なくとも一部に基づいて、対象の薬品を使用して前記経路それぞれをターゲットにすることの価値を作成することと、
前記経路それぞれ内の前記ソースと前記ターゲットとの間の関係を識別することと、
前記経路それぞれに対する前記ソースの前記影響、
前記経路それぞれの前記変更の少なくとも一部に基づいて、前記対象の薬品を使用して前記経路それぞれをターゲットにすることの前記価値、および
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係
を結合することと、ここで、前記結合によって前記対象の病気に対する前記経路それぞれの前記関連性の評価が得られる、
前記評価の少なくとも一部に基づいて、前記複数の経路のうちの特定の経路の簡略化された視覚化を実行することと
を含む方法を実行させる、
前記コンピュータ・プログラム。
【請求項18】
前記経路それぞれに対する前記ソースの前記影響が、前記ソースの加重値を含む、請求項17に記載のコンピュータ・プログラム。
【請求項19】
記経路それぞれをターゲットにすることの前記価値が、前記ターゲットの加重値を含む、請求項17又は18に記載のコンピュータ・プログラム。
【請求項20】
前記経路それぞれ内の前記ソースと前記ターゲットとの間の前記関係が、前記ソースから前記ターゲットまでの前記経路それぞれのトポロジーを含む、請求項17乃至19のいずれか1項に記載のコンピュータ・プログラム。
【請求項21】
前記コンピュータに、
前記評価を他の前記評価と比較してランク付けするこ
さらに実行させることを含む、請求項17乃至20のいずれか1項に記載のコンピュータ・プログラム。
【請求項22】
前記簡略化された視覚化を実行することが、
前記特定の経路のグラフを作成すること、ここで、前記グラフが、エッジによって接続された複数のノードを含んでいる
前記グラフの関連するパスを識別することと、
前記関連するパスから、情報を与えないノードまたは無意味なノードを削除して、第1のサブグラフを作成することと、
前記第1のサブグラフの関係および関連する属性を簡略化して、第2の簡略化されたサブグラフを作成することと
を含む、請求項17乃至21のいずれか1項に記載のコンピュータ・プログラム。
【請求項23】
前記関連する属性が、前記第2の簡略化されたサブグラフの前記複数のノードまたは前記複数のエッジの特性を備える、請求項22に記載のコンピュータ・プログラム。
【請求項24】
前記特性が、
人工的リンクの距離、または
スーパーセット複合体
を含む、請求項23に記載のコンピュータ・プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、概して、生物学的経路の評価および視覚化に関する。さらに詳細には、本開示は、特定の病状に対する生物学的経路の関連性を評価するため、および特定の病状に関連するとして評価された生物学的経路の視覚化を簡略化するためのシステムおよび方法に関する。
【背景技術】
【0002】
非常に多くの病気の全ゲノム関連性研究によって、DNA配列の変異と特定の病気表現型の間の多数の因果関係および相関関係が提案されている。これらの疑わしい変異または有効な変異は、多くの場合、生物学的経路にマッピングできる遺伝子またはオープン・リーディング・フレーム内に存在する。生物学的経路は、例えば、代謝合成の制御によって、または一連の遺伝子の発現を調節することによって細胞の機能に影響を与える集団的活性が存在する細胞内分子の間の順序付けられた一連の相互作用である。
【0003】
標準的細胞の生物学的経路の例を示す図が、図1に示されている。図示されているように、各細胞は体内および体外の両方からキューを絶えず受け取る。これらのキューは、怪我、感染、ストレス、または食品などの刺激によって引き起こされる。これらのキューに反応して適応するために、細胞は生物学的経路を介して信号を送受信する。最も一般的な生物学的経路のいくつかは、代謝、遺伝子の調節、および信号送信に関わっている。細胞経路の大部分は、信号伝達経路(遺伝子発現に影響を与える)または代謝経路(生化学的合成を調節する)として分類できる。酸素などの一部の分子は細胞膜を通って容易に移動することができ、そのとき受容体と呼ばれる細胞表面上の構造を信号が通過する。これらの信号は、受容体と相互作用した後に、細胞を通って移動する。細胞では、信号のメッセージが細胞内に存在する特殊なタンパク質またはその他の分子によって送信され、変更される。信号は、化学反応、新しい分子の組み立ての開始、細胞移動の誘発、遺伝子のオン/オフ、または細胞の形状変更にさえ関わることができる。特定の遺伝子は、複数の経路に存在することができ、複数の下流の経路の活性を変更することができる。したがって、1つの遺伝子内の機能を変更する変異が、複数の経路に影響を与える場合がある。経路は、細胞内の生物学的プロセスの理解を深める上で重要な役割を果たす。
【0004】
経路情報は、専門的な管理者によって作成された高品質のデータベースから、自然言語処理(NLP)および要約書のテキスト・マイニングを通じて作成された膨大な数の経路を対象にする巨大なデータベースまで、多数のデータベースを介して利用できる。例えば、一部の経路データベースは詳細な代謝経路を提供するが、その他の経路データベースは詳細な信号伝達経路を提供する。規模、品質、または特性、あるいはこれらの組合せにおいて差異があるため、経路データベースを選択することは困難であり、選択された経路データベースを使用して、ユーザの目的に合った経路を識別することはさらに困難である。
【0005】
標準的な経路データベースは、文献に基づいて代謝ネットワーク、遺伝子ネットワーク、および信号伝達ネットワークを結合する経路図を用いて経路を視覚化するための機能を含んでいる。ソフトウェア・アプリケーションを使用して、経路図の生成、編集、および解析を行うことができる。経路図は、通常は有向グラフを用いて表現される。有向グラフ(またはダイグラフ、あるいは有向ネットワーク)は、グラフ、つまり、互いに接続された頂点またはノードと呼ばれるオブジェクトのセットであり、すべてのエッジがある頂点から別の頂点に向けられる。経路図を視覚化する機能は、生物学的プロセスを解釈して理解する上で基本的な役割を果たす。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】E.W. Dijkstra, titled “A Note on Two problems in Connection With Graphs”, published by Numerische Mathematik 1, pp. 269-271 (1959)
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、経路図の生成、編集、解析およびその視覚化にはさらなる改善の余地がある。
【課題を解決するための手段】
【0008】
各実施形態は、対象の病気に対する少なくとも1つの経路の関連性を評価するコンピュータ実装方法を対象にし、この少なくとも1つの経路はソースおよびターゲットを含んでいる。方法は、プロセッサによって、少なくとも1つの経路に対するソースの影響を作成することを含む。方法は、プロセッサによって、少なくとも1つの経路の変更の少なくとも一部に基づいて、対象の薬品を使用して少なくとも1つの経路をターゲットにすることの価値を作成することをさらに含む。方法は、プロセッサによって、少なくとも1つの経路内のソースとターゲットの間の関係を識別することをさらに含む。方法は、少なくとも1つの経路に対するソースの影響、少なくとも1つの経路の変更の少なくとも一部に基づいて、対象の薬品を使用して少なくとも1つの経路をターゲットにすることの価値、および少なくとも1つの経路内のソースとターゲットの間の関係を結合することをさらに含み、この結合によって、対象の病気に対する少なくとも1つの経路の関連性を表す評価が得られる。
【0009】
各実施形態は、対象の病気に対する少なくとも1つの経路の関連性を評価するためのコンピュータ・システムをさらに対象にし、この少なくとも1つの経路はソースおよびターゲットを含んでいる。このシステムは、少なくとも1つの経路に対するソースの影響を作成するように構成されたプロセッサを含む。このシステムは、少なくとも1つの経路の変更の少なくとも一部に基づいて、少なくとも1つの薬品を使用して少なくとも1つの経路をターゲットにすることの価値を作成するように構成されたプロセッサをさらに含む。このシステムは、少なくとも1つの経路内のソースとターゲットの間の関係を識別するように構成されたプロセッサをさらに含む。このシステムは、少なくとも1つの経路に対するソースの影響、少なくとも1つの経路の変更の少なくとも一部に基づいて、対象の薬品を使用して少なくとも1つの経路をターゲットにすることの価値、および少なくとも1つの経路内のソースとターゲットの間の関係を結合するように構成されたプロセッサをさらに含み、プロセッサによるこの結合によって、対象の病気に対する少なくとも1つの経路の関連性を表す評価が得られる。
【0010】
各実施形態は、対象の病気に対する少なくとも1つの経路の関連性を評価するためのコンピュータ・プログラム製品をさらに対象にし、この少なくとも1つの経路はソースおよびターゲットを含んでいる。このコンピュータ・プログラム製品は、プログラム命令が具現化されたコンピュータ可読記憶媒体を含み、このコンピュータ可読記憶媒体は本質的に一時的信号ではなく、このプログラム命令は、プロセッサ回路に方法を実行させるために、プロセッサ回路によって読み取り可能である。方法は、少なくとも1つの経路に対するソースの影響を作成することを含む。方法は、少なくとも1つの経路の変更の少なくとも一部に基づいて、対象の薬品を使用して少なくとも1つの経路をターゲットにすることの価値を作成することをさらに含む。方法は、少なくとも1つの経路内のソースとターゲットの間の関係を識別することをさらに含む。方法は、少なくとも1つの経路に対するソースの影響、少なくとも1つの経路の変更の少なくとも一部に基づいて、対象の薬品を使用して少なくとも1つの経路をターゲットにすることの価値、および少なくとも1つの経路内のソースとターゲットの間の関係を結合することをさらに含み、この結合によって、対象の病気に対する少なくとも1つの経路の関連性を表す評価が得られる。
【0011】
各実施形態は、少なくとも1つの経路の視覚化を簡略化するコンピュータ実装方法をさらに対象にしている。方法は、少なくとも1つの経路のグラフを作成することを含み、このグラフはエッジによって接続された複数のノードを含んでいる。方法は、グラフの関連するパス(path)を識別することをさらに含む。方法は、関連するパスから、情報を与えないノードまたは無意味なノードを削除して、第1のサブグラフを作成することをさらに含む。方法は、第1のサブグラフの関係および関連する属性を簡略化して、第2の簡略化されたサブグラフを作成することをさらに含む。
【0012】
各実施形態は、少なくとも1つの経路の視覚化を簡略化するためのコンピュータ・システムをさらに対象にしている。このシステムは、少なくとも1つの経路のグラフを作成するように構成されたプロセッサを含み、このグラフはエッジによって接続された複数のノードを含んでいる。このシステムは、グラフの関連するパスを識別するように構成されたプロセッサをさらに含む。このシステムは、関連するパスから、情報を与えないノードまたは無意味なノードを削除して、第1のサブグラフを作成するように構成されたプロセッサをさらに含む。このシステムは、第1のサブグラフの関係および関連する属性を簡略化して、第2の簡略化されたサブグラフを作成するようにさらに構成されたプロセッサをさらに含む。
【0013】
その他の特徴および長所が、本明細書に記載された技術によって実現される。本明細書では、その他の実施形態および態様が詳細に説明される。さらに良く理解するために、説明および図面を参照されたい。
【0014】
本開示と見なされる対象は、本明細書の最後にある特許請求の範囲において具体的に指摘され、明確に請求される。前述およびその他の特徴と長所は、添付の図面と併せて行われる以下の詳細な説明から明らかになる。
【図面の簡単な説明】
【0015】
図1】標準的な細胞の生物学的経路の例を示す図である。
図2】本開示の1つまたは複数の実施形態を実装できるコンピュータ・システムの例を示す図である。
図3】1つまたは複数の実施形態に記載されているシステムの例を示す図である。
図4】1つまたは複数の実施形態に記載されている、図3に示されたシステムのモジュールによって実装できる式を示す図である。
図5】1つまたは複数の実施形態に記載されている方法を説明するフロー図である。
図6】1つまたは複数の実施形態に記載されている経路の評価結果の例を説明する表である。
図7】1つまたは複数の実施形態に記載されている、図3に示されたシステムの経路評価の実装方法の例を説明する図である。
図8】簡略化されていない経路の一部を説明するグラフである。
図9】1つまたは複数の実施形態に記載されている、図8に示された経路の簡略化されたバージョンの一部を説明するグラフである。
図10】1つまたは複数の実施形態に記載されている方法を説明するフロー図である。
図11】1つまたは複数の実施形態に記載されているコンピュータ・プログラム製品を示す図である。
【発明を実施するための形態】
【0016】
添付の図および開示された実施形態に関する以下の詳細な説明では、図に示されたさまざまな要素が、3桁または4桁の参照番号付きで記載されている。各参照番号の左端の数字は、その要素が最初に示された図に対応している。
【0017】
以下では、関連する図面を参照して本開示のさまざまな実施形態について説明する。本開示の範囲を逸脱することなく、代替の実施形態を考案することができる。以下の説明および図面では、要素間のさまざまな接続が記載されていることに注意する。それらの接続は、特に規定されない限り、直接的または間接的であることができ、本開示はこの点において限定することを意図していない。したがって、実体の結合は直接的接続または間接的接続のいずれかを指すことができる。
【0018】
生物学的経路は、細胞内の特定の生成物または変更につながる、細胞内の分子間の一連の作用である。細胞の形状に変化をもたらし、新しいタンパク質を作成する、代謝に関する細胞経路の例が図1に示されている。そのような経路は、脂肪やタンパク質などの新しい分子の組み立てを引き起こすことができる。経路は、遺伝子をオン/オフしたり、細胞の移動を促進したりすることもきる。したがって経路は、信号またはキューを体内および体外の両方から細胞に絶えず運ぶことができる。これらの信号またはキューは、怪我、感染、ストレス、または食品などによって引き起こされる。また、これらのキューに反応して適応するために、細胞は生物学的経路を介して信号およびキューを送信する。生物学的経路を構成する分子は、信号と相互作用することに加えて、分子同士が相互作用し、指定された作業を実行する。生物学的経路は、短距離または長距離を経由して作用することができる。例えば、一部の細胞は、膝の引っかき傷などの局所的な損傷を修復するために、近くの細胞に信号を送信する。他の細胞は、ホルモンなどの物質を生成し、それらのホルモンは血液を介して離れたターゲット細胞に移動する。生物学的経路は、小さい結果または大きい結果をもたらすこともできる。例えば、ある経路は、体が薬品を処理する方法にわずかに影響を与えるが、別の経路は、受精卵が赤ん坊に成長する過程において、大きな役割を果たす。
【0019】
生物学的経路には多くの種類がある。最も一般的な生物学的経路のいくつかは、代謝、遺伝子の調節、および信号送信に関わっている。代謝経路は、化学反応が体内で発生できるようにする。代謝経路の一例は、人間の細胞が食品をエネルギー分子に分解し、それらのエネルギー分子を、後で使用するために貯蔵することができるプロセスである。別の代謝経路は、分子を構築するのに実際に役立つ。遺伝子調節経路は、遺伝子をオン/オフする。そのような作用は、体内のほぼすべての作業を実行するために必要で重要な構成要素になるタンパク質を遺伝子が生成するので、生命維持に不可欠である。タンパク質は、筋肉および臓器を構成し、体を動かしたり、細菌から体を守ったりすることができるようにする。信号伝達経路は、細胞の外部から内部へ信号を移動させる。さまざまな細胞が、その表面上の構造(受容体と呼ばれる)を介して特定の信号を受け取ることができる。信号は、受容体と相互作用した後に、細胞を通って移動する。細胞では、信号のメッセージが、細胞内の特定の作用を開始する特殊なタンパク質によって送信される。例えば、細胞の外部からの化学的信号が、細胞内のタンパク質信号に変化する場合がある。次に、そのタンパク質信号が、細胞の移動を引き起こす信号に変換される場合がある。
【0020】
生物学的経路は、常に正しく機能するとは限らない。経路に何らかの異常が発生した場合、癌や糖尿病などの病気になる可能性がある。研究者はしばしば、生物学的経路を研究することで、人間の病気に関して学習する。どの遺伝子、タンパク質、およびその他の分子が生物学的経路に関わっているかを識別することによって、病気に冒されたときに、何の異常が発生したかに関する手がかりを得ることができる。例えば研究者は、健康な人の特定の生物学的経路を、病気を持っている人の同じ生物学的経路と比較して、病気の本質を発見するのに役立てることができる。
【0021】
関連する経路を一連の遺伝子から識別することは、多くの場合、その研究の原理を実行に移す上での最初のステップになる。ただし、一連の病的な遺伝子に最も関連する経路を決定することは困難であり、情報として蓄えられた異なる経路間に存在する経路の構成およびトポロジーにおける差異によって、多くの場合、さらに困難になる。例えば、生物学的経路に沿った任意の数のステップにおける問題が、しばしば同じ病気につながる場合がある。遺伝子突然変異も、病状に関連する経路の識別を複雑にする。例えば、癌は、遺伝子突然変異が多すぎることに関連するゲノムの病気である。これらの突然変異した遺伝子のうちのドライバー遺伝子は、腫瘍の形成および進行に因果的に関係しているとして定義され、パッセンジャー遺伝子は、癌の進行には無関係であると考えられている。異なる遺伝子突然変異が、異なる患者において同じ癌につながる場合がある。明確に定義された1つの遺伝子の標的を攻撃する方法を発見しようとする代わりに、遺伝子突然変異によって中断された生物学的経路を識別して重視することによって、この複雑な考え方を簡略化することができる。薬品開発者は、多数の突然変異をターゲットにする多数の薬品を設計するのではなく、2つまたは3つの生物学的経路にだけ注意を集中することができる。その後、患者は、特定の腫瘍において影響を受けた経路に基づいて、その患者に最も効く可能性のある1つまたは2つの薬品を受け取ることができる。
【0022】
病気に関わる経路の正確な識別、および各患者において影響を受けた識別済み経路のステップの正確な識別は、病気の診断、治療、および予防に関する、より個人向けの戦略につながる可能性がある。研究者は、現在、生物学的経路に関する情報を使用して、新しいより良い薬品を開発している。さらに、経路情報は、既存の薬品をより効率的に選択して組み合わせるのに使用することもできる。使用できる大規模なゲノム・データセットの数が増えている状況では、それらのゲノム・データを統合して癌のゲノムの異常領域からドライバー遺伝子を識別することは、癌のゲノム解析および癌の進行の原因となるメカニズムの調査における重要な目標になっている。
【0023】
本開示は、対象の病気に対する関連性に関して、生物学的経路をターゲットにすることの価値を評価するためのシステムおよび方法を提供し、最高の関連性を持っている生物学的経路を、より簡単に識別することができる。本開示は、高い関連性として識別された経路を受け取り、関連性の高い経路を視覚化する機能を改善するシステムおよび方法をさらに提供する。1つまたは複数の実施形態において、開示されたシステムおよび方法は、ソース(例えば、突然変異した遺伝子)およびソースの下流でターゲットにされることが可能なターゲット(例えば、新薬の開発につながる分子的実体)の評価を行い、それによって調査する価値のある生物学的経路を識別する。1つまたは複数の実施形態において、開示されたシステムおよび方法は、調査する価値のある識別された生物学的経路の簡略化された視覚化をさらに提供する。それによって、開示された実施形態のうちの1つまたは複数を実装するコンピュータ・システムの動作を改善することができる。
【0024】
ここで、詳細に図面を参照すると、類似する参照番号は類似する要素を示しており、図2は、本開示の1つまたは複数の実施形態の実装に役立つコンピュータベース情報処理システム200の例を示す上位のブロック図を示している。コンピュータ・システム200の一例が示されているが、コンピュータ・システム200は通信経路226を含んでおり、通信経路226は、コンピュータ・システム200をその他のシステム(図示されていない)に接続し、1つまたは複数の広域ネットワーク(WAN:wide area network)、またはローカル・エリア・ネットワーク(LAN:localarea network)、あるいはその両方(インターネット、イントラネット、または無線通信ネットワーク、あるいはこれらの組合せなど)を含むことができる。コンピュータ・システム200およびその他のシステムは、例えばそれらの間でデータをやりとりするために、通信経路226を介して通信する。
【0025】
コンピュータ・システム200は、プロセッサ202などの1つまたは複数のプロセッサを含む。プロセッサ202は、通信インフラ204(例えば、通信バス、クロスオーバー・バー、またはネットワーク)に接続される。コンピュータ・システム200は、ディスプレイ・ユニット208上に表示するために、グラフィックス、テキスト、およびその他のデータを通信インフラ204から(または、図示されていないフレーム・バッファから)転送する表示インターフェイス206を含むことができる。コンピュータ・システム200は、主記憶装置210、好ましくはランダム・アクセス・メモリ(RAM:random access memory)も含み、二次記憶装置212も含むことができる。二次記憶装置212は、例えばハード・ディスク・ドライブ214または取り外し可能ストレージ・ドライブ216(例えば、フロッピー(R)・ディスク・ドライブ、磁気テープ・ドライブ、または光ディスク・ドライブを表す)あるいはその両方を含むことができる。取り外し可能ストレージ・ドライブ216は、当業者に良く知られた方法で、取り外し可能ストレージ・ユニット218から読み取り、または取り外し可能ストレージ・ユニット218に書き込み、あるいはその両方を行う。取り外し可能ストレージ・ユニット218は、例えばフロッピー(R)・ディスク、コンパクト・ディスク、磁気テープ、または光ディスクなどを表し、取り外し可能ストレージ・ドライブ216によって読み取られ、取り外し可能ストレージ・ドライブ216に書き込まれる。理解されているように、取り外し可能ストレージ・ユニット218は、コンピュータ・ソフトウェアまたはデータあるいはその両方を記憶しているコンピュータ可読媒体を含む。
【0026】
代替の実施形態では、二次記憶装置212は、コンピュータ・プログラムまたはその他の命令をコンピュータ・システムに読み込むことができるようにするためのその他の類似する手段を含むことができる。そのような手段は、例えば取り外し可能ストレージ・ユニット220およびインターフェイス222を含むことができる。そのような手段の例は、プログラム・パッケージおよびパッケージ・インターフェイス(ビデオ・ゲーム・デバイスで見られるインターフェイスなど)、取り外し可能メモリ・チップ(EPROMまたはPROMなど)および関連するソケット、ならびにソフトウェアおよびデータを取り外し可能ストレージ・ユニット220からコンピュータ・システム200に転送できるようにするその他の取り外し可能ストレージ・ユニット220およびインターフェイス222を含むことができる。
【0027】
コンピュータ・システム200は、通信インターフェイス224も含むことができる。通信インターフェイス224によって、ソフトウェアおよびデータを、コンピュータ・システムと外部デバイスの間で転送することができる。通信インターフェイス224の例は、モデム、ネットワーク・インターフェイス(イーサネット(R)・カードなど)、通信ポート、またはPCM−CIAスロットおよびカードなどを含むことができる。通信インターフェイス224を介して転送されるソフトウェアおよびデータは、例えば電子信号、電磁気信号、光信号、または通信インターフェイス224によって受信できるその他の信号であることができる信号の形態を取る。これらの信号は、通信経路226(すなわち、チャネル)を介して通信インターフェイス224に提供される。通信経路226は、信号を運び、ワイヤもしくはケーブル、光ファイバ、電話線、携帯電話リンク、RFリンク、またはその他の通信チャネル、あるいはこれらの組合せを使用して実装できる。
【0028】
本開示では、「コンピュータ・プログラム媒体」、「コンピュータ使用可能媒体」、および「コンピュータ可読媒体」という用語は、一般に、主記憶装置210および二次記憶装置212、取り外し可能ストレージ・ドライブ216、ならびにハード・ディスク・ドライブ214に設置されたハード・ディスクなどの媒体を指すために使用される。コンピュータ・プログラム(コンピュータ制御ロジックとも呼ばれる)は、主記憶装置210または二次記憶装置212あるいはその両方に記憶される。コンピュータ・プログラムを、通信インターフェイス224を介して受信することもできる。そのようなコンピュータ・プログラムが実行された場合、コンピュータ・システムは、本明細書で説明された本開示の機能を実行することができる。特に、コンピュータ・プログラムが実行された場合、プロセッサ202は、コンピュータ・システムの機能を実行することができる。したがって、そのようなコンピュータ・プログラムは、コンピュータ・システムのコントローラを表す。
【0029】
図3は、1つまたは複数の実施形態に従って、評価および可視化システム300の図を示している。評価および可視化システム300のさまざまな機能モジュールは、図2に示されているコンピュータベース情報処理システム200を使用して実装できる。図3に示されているように、評価および可視化システム300は、図示されているように構成および配置された経路入力302、遺伝子突然変異(GM:gene mutation)入力304、ターゲットに選択可能な遺伝子入力306、対象の病気入力308、多重化(MUX:multiplex)モジュール310、ドライバー遺伝子(DG:driver gene)の加重値モジュール312、ターゲット遺伝子(TG:target gene)の加重値モジュール314、ソースからターゲットへの経路のトポロジー・モジュール316、結合モジュール318、関連性ランク付けモジュール320、および簡略化された視覚化モジュール322を含んでいる。
【0030】
全体的動作において、評価および可視化システム300は、データベース内の特定の経路が、選択された病気の進行に関わっている可能性、または選択された病気の治療に関連する可能性の定量的な決定に基づいて、選択された経路データベースに格納されている経路をランク付けする。データベース内の特定の経路が、選択された病気の進行に関わっている、または選択された病気の治療に関連しているとの決定は、経路を選択された病状に向けて進める経路内の遺伝子の識別の少なくとも一部に基づく。
【0031】
GMは、遺伝子を構成するDNA配列内の変化である。GMは、病状に関連する経路の識別を複雑にする。例えば、癌は、GMが多すぎることに関連するゲノムの病気である。これらのGMのうちのDGは、腫瘍の形成および進行に因果的に関係しているGMとして定義され、パッセンジャー遺伝子は、癌の進行には無関係であると考えられているGMである。異なるDGが、異なる患者において同じ癌につながる場合がある。一般に、本開示の目的では、DGという用語は、ある種の病気に関わっている経路を進める(または推進する)GMを指すために使用される。特定の病気をもたらす可能性のある多くの経路を推進する多くのDGが存在する。特定の病気に対して、通常は、最も意味のある特定の数(例えば、15〜20)のDGが存在する。
【0032】
図3に示されているように、システム300への初期データ入力は、選択された経路データベース(経路入力302)、特定の対象となる病気に関する選択されたGMのプール(GM入力304)、対象の病気に関連する新薬の開発につながる(TG)(ターゲットに選択可能な遺伝子入力306)、および対象の病気(対象の病気入力308)である。経路データベースは、多くの要因に基づいて選択できる。本開示では、1つまたは複数の実施形態が、NIC−PIDとして知られている、癌に固有の精選された経路のデータベースを考慮する。適切な経路データベースの選択におけるその他の考慮は、精選のレベル(例えば、手動とNLP)、癌またはその他の病気あるいはその両方に固有の生物学的経路、経路に関する実験のサポートの程度、高スループットのデータ・ソース対低スループットのデータ・ソース、人間、哺乳類のその他の動物、および植物に対する要望のデータ・ソース、オルソロジー・ベースのリンク、および望ましい相互作用の種類(例えば、物理的、論理的、相関関係など)を含むが、これらに限定されない。
【0033】
対象の病気は、個々のユーザの必要性と関心に基づいて選択される。対象の病気(対象の病気入力308)が識別されると、次に、選択された病気に関わる最も意味のある遺伝子および遺伝子突然変異(GM入力304)を識別できる。一般に、GM入力304は既存の文献またはデータベースから集めることができる。さらに、最も意味のあるGMを推測するための既知の計算方法および情報科学的方法を利用することもできる。GMのプールを決定するための方法は、適用対象(例えば、臨床治療または基礎研究への適用)によって異なる。
【0034】
対象の病気(対象の病気入力308)が識別されると、対象の病気に関連する新薬の開発につながるターゲット遺伝子(ターゲットに選択可能な遺伝子306)も識別することができる。例えば、新薬の開発につながるターゲット遺伝子は既存の文献またはデータベースから集めることができる。計算方法および情報科学的方法を使用して、新薬の開発につながるターゲットを推測することもできる。新薬の開発につながるターゲット遺伝子のプールを決定するために選択される特定の方法は、適用対象(例えば、臨床治療または基礎研究への適用)によって異なる。
【0035】
MUXモジュール310は、経路入力302、GM入力304、ターゲットに選択可能な遺伝子入力306、および対象の病気入力308から入力を受け取り、一般的な多重化機能に従って、それらの入力をモジュール312、314、および316に選択的に提供する。モジュール312は、DGの加重値を計算する。1つまたは複数の実施形態では、モジュール312は、図4に示されているA項に従って、DGの加重値を計算する。A項のaは、「i」個のGMのそれぞれの存在を重み付けする数値である。したがって「a」は、cnv(コピー数の多様性:copy number variations)、DGの数などを考慮することができる。したがって、「a」は他のGMよりも意味のあるGMを識別する。「a」の値は、外部の知識(例えば、GMの活性のレベルおよび対象の経路内でのGMの推定された重要性)から得ることができる。「a」の選択には、かなりの柔軟性がある。例えば、「a」はベイジアン・モデル、サポート・ベクトル・マシンなどとして実装できる。「a」の選択における柔軟性により、システム300への入力データが時間とともに改善されたり、変化したりするにつれて、「a」は時間とともに変化することができる。
【0036】
図4に示されているA項を引き続き見てみると、∂は、GMが現在の対象の経路内に存在しない場合に0になり、GMが現在の対象の経路内に存在する場合に1になる2進数の項である。言い換えると、GMが現在の対象の経路のDGである場合に∂は1になり、GMが現在の対象の経路のDGでない場合に∂は0になる。プロセスのこの段階では、他の経路から分離して、特定の経路に対して、A項およびその後の関連性(例えば、モジュール318の出力)が決定されるが、その後、これらは、経路間で関連性を比較するために使用されるということに注意する。したがって、2進数の項∂には、A項の分子から、特定の対象の病気につながる現在の対象の経路内に存在しないGMを除去する効果がある。システム300およびそれに関連する方法が、特定の対象の病気の関連状況において、特定の患者に関連すると最初に考えられたGMのセットを評価するということに注意する。したがって、事前に定義された経路のセットに対して、すべてのGMが評価される。そのため、患者固有のGMを何も含んでいないいくつかの経路が存在する。∂のソースは、現在の対象の経路の単純な検索である。そのため、GMが存在するかどうかによって、∂が1であるかまたは0であるかをそれぞれ決定する。
【0037】
したがって、A項は、考慮されている他のすべての経路と対比して、現在の対象の経路の関連性の表現を提供する。すべての対象の経路の「a」の値が等しい場合、A項は、GMのセットを獲得することに対するその経路の感度を表す。すべての対象の経路の「a」の値が均等に重み付けされているわけではない場合、A項は、「a」の計算をサポートする考慮に関して、関連性を表す。言い換えると、A項は、DGである初期GMプール、したがって特定の対象の病気をもたらす経路を進める可能性が最も高い初期GMプールの割合を表す。A項が大きいほど、識別されたDGが経路に対して持つと予想される影響が大きくなる。
【0038】
モジュール314は、TGの加重値を計算する。1つまたは複数の実施形態では、モジュール314は、図4に示されているB項に従って、TGの加重値を計算する。B項の構造は、A項に類似している。A項はDGの識別と評価に重点を置いているが、B項はTGの識別と評価に重点を置いている。そのため、B項は、A項の計算の一部として識別されたDGも考慮する。B項において、1から「i」までのすべての薬品のターゲットに関して、bは、新薬の開発につながる遺伝子「i」をターゲットにすることに関連する考慮を重み付けする数値(例えば、信号伝達ネットワーク内の遺伝子の重要性)である。bの値は、遺伝子をターゲットにする特定の薬品の性質および有効性、または遺伝子「i」の活性のレベルなどの項目を含むことができる。引き続きB項を見てみると、∂は、新薬の開発につながる遺伝子「i」が現在の対象の経路内のいずれかの突然変異した遺伝子(例えば、DG)の上流または下流あるいはその両方に存在しない場合に0になる2進数の項であり、∂は、新薬の開発につながる遺伝子「i」が現在の対象の経路内のいずれかの突然変異した遺伝子(例えば、DG)の上流または下流あるいはその両方に存在する場合に値1になる。
【0039】
あるいはB項は、図4に示されている代替B項の式によって与えられることも可能であり、図示されているように、Mが分子内で提供されている。Mは、経路のセット全体の新薬の開発につながる遺伝子ターゲットの数として定義できる。Mは、正規化項として機能し、代替B項が0と1の間の実数値であることを保証する。代替B項の計算では、ターゲット遺伝子「i」の重み付けに加えて、「i」をターゲットにする薬品に対する遺伝子「i」の上流および下流に存在する突然変異の潜在的影響を考慮するように(例えば、「i」の上流および下流のすべての突然変異数に対する「i」の上流の突然変異数の比を取ることによって)、bの値を変更することもできる。
【0040】
したがって、B項は、考慮されている他のすべての経路と対比して、現在の対象の経路の関連性の表現を提供する。すべての対象の経路の「b」の値が等しい場合、B項は、単に新薬の開発につながるターゲット遺伝子のセットを獲得することに対するその経路の感度を表す。すべての対象の経路の「b」の値が均等に重み付けされているわけではない場合、B項は「b」の計算をサポートする考慮に関して、関連性を表す。
【0041】
モジュール316は、ソースからターゲットまでの経路のトポロジーを計算する。1つまたは複数の実施形態では、モジュール316は、図4に示されているC項に従って、ソースからターゲットまでの経路のトポロジーを計算する。C項の構造は、A項およびB項に類似している。A項はDGの識別と評価に重点を置き、B項はTGの識別と評価に重点を置いていたが、C項はA項とB項の間の関係に重点を置き、A項によって識別されたDGと、B項によって識別された新薬の開発につながるターゲットの両方も考慮する。C項では、1から「i」までのすべてのDG、および1から「j」までのすべての新薬の開発につながるターゲットに関して、∂ijは、新薬の開発につながる遺伝子「i」が経路内の突然変異した遺伝子「j」(すなわち、DG)の下流に存在するか、または「i」が新薬の開発につながる遺伝子であり、かつ「j」に等しい場合に、値1になる。そうでない場合、∂ijは0の値になる。引き続きC項を見てみると、「d」は、DGへの経路を含んでいる現在の対象の経路内に存在する新薬の開発につながるターゲットの数であり、「n」は、現在の対象の経路内のDGの数である。最後に、C項のcijは、個々のDG「i」と個々のTG「j」との間の関係を重み付けする実数である。例えば、cijの値は、個々のDG「i」と個々のTG「j」の間の距離(すなわち、タンパク質/小分子の数)もしくは方向性またはその両方に基づくことができ、あるいはcijの値は、個々のDG「i」がいずれかのDGへのパス内に存在する頻度に基づくことができる。
【0042】
モジュール318は、モジュール312、314、および316によって行われた評価の出力を結合し、現在の対象の経路の関連性を決定する。1つまたは複数の実施形態では、現在の対象の経路の関連性は、現在の対象の経路の関連性を表す計算された関連性スコア(図4に示される)として実装できる。モジュール320は、モジュール318によって逐次計算された関連性を集めてランク付けし、モジュール322はモジュール320によってランク付けされた経路の視覚化を簡略化する。モジュール318および320によって識別されたランク付けにより、簡略化された視覚化モジュール322は、最高の関連性を持っている経路に焦点を合わせることができる。図4に示された関連性スコアに加えて、経路の関連性は、経路内の突然変異の数または経路内の新薬の開発につながる遺伝子の数を含むがこれらに限定されない、ランク付けされた経路のその他の基準を含むことができる。モジュール318および320によって識別された関連性のランク付けを整理して表示する過程を説明する表の例を図6に示す。図8、9、および10は、簡略化された視覚化モジュール322のその他の詳細を示しており、本開示において後で詳細に説明される。
【0043】
図5は、1つまたは複数の実施形態に従って、評価および可視化システム300の方法400を説明するフロー図を示している。図示されているように、ブロック408は、DG入力のセットをブロック402から受け取り、(任意で)遺伝子活性入力をブロック406から受け取る。ブロック408は、DGが現在の対象の経路に対して与える影響の評価を作成する。ブロック408の実装例は、図4に示されているA項の計算である。ブロック410は、(任意で)遺伝子活性入力をブロック406から受け取り、TGのセットをブロック404から受け取る。ブロック410は、特定の経路の変更を含む経路のドライバーの状態を前提として、薬品を使用して特定の経路をターゲットにすることの価値の評価を作成する。ブロック410の実装例は、図4に示されているB項の計算または代替B項の計算である。ブロック412は、(任意で)遺伝子活性入力をブロック406から受け取り、TGのセットをブロック404から受け取り、DG入力をブロック402から受け取る。ブロック412の実装例は、図4に示されているC項の計算である。ブロック412は、経路内のDGと新薬の開発につながるターゲットのペアにおける関係の評価を作成する。モジュール414は、ブロック408、410、および412によって行われた評価の出力を受け取り、現在の対象の経路の関連性を決定する。ブロック416は、ブロック414によって逐次決定された関係性を集め、ランク付けする。ブロック418は、ブロック416によってランク付けされた経路の視覚化を簡略化する。ブロック414および416によって識別されたランク付けにより、ブロック418によって実行される簡略化プロセスは、最高の関連性を持っている経路に焦点を合わせることができる。図4に示された関連性スコアに加えて、経路の関連性は、経路内の突然変異の数または経路内の新薬の開発につながる遺伝子の数を含むがこれらに限定されない、ランク付けされた経路のその他の基準によって決定することができる。ブロック414および416によって識別された関連性のランク付けを整理して表示する過程を説明する表の例を図6に示す。図8、9、および10は、ブロック418の経路視覚化簡略化プロセス(pathway visualization simplification process)のその他の詳細を示しており、本開示において後で詳細に説明される。
【0044】
図7は、1つまたは複数の実施形態に従って、評価および可視化システム300(図3に示されている)の経路評価の実装方法の2つの例を説明する図を示している。経路Xの場合、「i」は連続的に1から4までに等しく、2番目および4番目のGMは病気「X」につながる経路内に存在せず、2番目および4番目の新薬の開発につながるターゲット遺伝子は経路内の新薬の開発につながる遺伝子の上流または下流に存在せず、「a」はいかなる場合でも1であり、「b」はいかなる場合でも1であり、∂ijはパスの距離の逆数であり、cijは可能性のあるペア「i,j」について1である。図7に示されているように、経路Xに対して計算された関連性スコアは0.486である。
【0045】
経路Yの場合、「i」は連続的に1から4までに等しく、2番目および4番目のGMは病気「X」につながる経路内に存在せず、2番目および4番目の新薬の開発につながるターゲット遺伝子は経路内の新薬の開発につながる遺伝子の上流または下流に存在せず、「a」はいかなる場合でも1であり、「b」はいかなる場合でも1であり、∂ijはパスの距離の逆数であり、cijは可能性のあるペア「i,j」について1である。経路Yは、第1のGMが第1の新薬の開発につながる遺伝子への追加のより直接的な経路を持っているという点において、経路Xとはわずかに異なっている。図7に示されているように、経路Yに対して計算された関連性スコアは0.5であり、この値は経路Xに対して計算された関連性スコア0.486よりも高い。したがって、経路Yは、対象の病気に対して、経路Xよりもわずかに高い関連性がある。
【0046】
このように、評価および可視化システム300(図3に示されている)において、A項、B項、および代替B項は、システム300の評価部分に、DGまたは新薬の開発につながるターゲット遺伝子の重要性の定量化を可能にする重み付け係数を導入する。加えて、C項は、システム300の評価部分に、現在の対象の経路の実際のトポロジーを考慮する手段を導入する。言い換えると、C項は、ソース遺伝子(例えば、GM)から新薬の開発につながるターゲットへの接続の考慮を可能にする。そのため、A項およびB項によって適用される重み付けは、DGとターゲットの間にパスが存在するかどうか、およびDGとターゲットの間のパスの距離によって決定される。パスに沿った各遺伝子の発現に関する追加情報を含めることによって、トポロジーをさらに考慮することができる。この方法では、(例えば、「遺伝子発現のない」シナリオで)平面に沿ってパスのルートをたどる代わりに、等高線が示された表面に沿ってルートをたどることができ、この等高線の高さは発現レベルによって決定される。その場合、これらの等高線を考慮した合計距離を最小限に抑えるように、スコアを決定できる。さらに、DGとターゲットの間で可能性のあるルートの数および多様性を評価することによって、トポロジーを考慮することができる。
【0047】
経路の関連性は評価および可視化システム300によって確立することができるが、識別された関連する経路は、依然として複雑であり、視覚化するのが困難である場合がある。例えば、識別された関連する経路を表すグラフは、数百個のノードとエッジで構成される場合があり、このことが、生物学的に関連する構成要素を見つけたり、新しい洞察を発見したりするのを極めて困難にしている。したがって、簡略化された視覚化モジュール322(図3に示されている)およびブロック418(図5に示されている)の経路視覚化簡略化プロセスは、ソースのセットからターゲットのセットまでのノード間の相互作用の関連状況において、経路の視覚化を簡略化するフレームワークを提供する。例えば、(何らかの条件に起因して)突然変異したタンパク質のセットと、それらのタンパク質の下流にある新薬の開発につながるタンパク質との間の関係の調査において、本明細書で開示された簡略化された視覚化プロセスは、グラフ内の視覚的複雑さを軽減して、即時の視覚的フィードバックを提供し、生物学的ネットワークの理解と新しい洞察の発見に役立つ。
【0048】
図8、9、および10は、図3に示されている簡略化された視覚化モジュール322および図5に示されているブロック418の経路視覚化簡略化プロセスのその他の詳細を示している。さらに具体的には、図8および9は、ErbB1下流信号伝達経路への本開示の適用例を説明するために使用されるNCI−PID経路モデルであり、突然変異またはソースはEGFRであり、薬品のターゲットまたはターゲットはHGSおよびPPP2RPAである。図8は、交点を含む元の経路を示しており、図9は、関連する共有された中間ノードおよび薬品のターゲットを含む、修正されて簡略化されたグラフを示している。一般に、中間ノードとは、端点ではないパス内のノードのことである。NCI−PID生物学的経路モデルは、専門家によって精選された、文献に基づく、癌に関連する経路の生物学的ネットワークである。これらの経路は、多数の視覚的特徴を使用して高度に詳細化されており、データのより臨床的な適用の理解を容易にするために、またはデータのより臨床的な適用に対する非関連性に関して、本開示に従って簡略化することができる。
【0049】
図8のNCI−PID生物学的経路を簡略化するために、ソースとターゲットを接続する長さkまでのすべてのパスが、元のグラフから抽出された。その後、得られたサブグラフから、関連するすべての実体および機能的相互作用が、視覚化のために考慮された。この実体は、タンパク質、RNA、小分子、および複合体を含むことができる。この相互作用は、生物学的反応、複合体の組み立て、輸送、生物学的反応を伴う輸送、鋳型反応、鋳型反応調節(template reaction regulation)、触媒反応、および制御を含むことができる。具体的な特徴、ノードの種類、および相互作用は、図9の簡略化されたグラフでは非表示にすることができる。例えば、特定の小分子が治療方針を検索している臨床医にあまり関係しない可能性があるため、それらを非表示にして、視覚化を容易にすることができる。経路を簡略するときにノードまたはエッジを非表示にするプロセスは、図の例で示されているように、小分子を含むすべてのノードがアクセスされる状況において、ソースとターゲットの間のパスの検索に影響を与えない。図8および9に示された例の経路簡略化の一部として、小分子が1つの入力エッジおよび1つの出力エッジのみを持っており、分子のより大きい集合の一部ではない場合、それらの小分子はネットワークから削除されている。削除に対するこの制約は、重要なメカニズム情報(分子の活性状態を示すリン酸化反応事象など)の損失がある場合、それを軽減する。
【0050】
特定のノードの種類の削除の後に、グラフに対して、次の追加の簡略化が行われる。保持されるノードとエッジ、および新しいエッジが作成される場所を決定するために、さまざまな重要性の尺度に従ってノードおよびエッジを評価することができる。例えば、ソース(S)ノードおよびターゲット(T)ノードの各ペア(P)の間の最短パスを、経路の重要性の特徴として使用することができ、例えばダイクストラのアルゴリズムを使用して計算できる。このアルゴリズムの詳細は、公開文献であるE.W. Dijkstra, titled “A Note on Twoproblems in Connection With Graphs”, published byNumerische Mathematik 1, pp. 269-271 (1959)で開示されおり、この文献の全体的開示は、参照によって本明細書に包含されている。したがって、ノード(N)は、望ましい出力に依存する可能性のある特定の基準に基づいて、グラフから除外される。例えば、ノードごとのスコアは、ノードがP個の最短パスによってアクセスされる頻度にすることができる。あるいは、ソースSおよびターゲットTが固定されている場合、ノードごとのスコアは、長さk、k+1、k+2、・・・・k+Nのパスによってノードがアクセスされる回数をカウントすることによって計算できる。ここで、kはパスが横断するノードの数に基づいて測定され、SとTの間の最短パスの長さである。
【0051】
少なくとも「x」回アクセスされたノードは維持される。この基準は、ソース−ターゲット間の関係の集合により関連しているノードを暗黙的に維持する。さらに洗練されたスコア付け機能を埋め込むことができ、この機能では、ソースとターゲットの間の関係に対するノードの関連性の相互情報スコアなどの、その他の特徴が考慮される。ノードが除外された場合、パス内の除外されたノードに対して上流および下流にあるノードをリンクする新しいエッジが作成される。一般に、エッジとは、2つのノードの間のリンクのことである。
【0052】
前述した方法の自然な拡張は、除外を続行して、パスの分岐点ではないすべてのノード(すなわち、1つの入力エッジと1つの出力エッジのみを持つノード)を除去することである。グラフに存在する可能性のある冗長性を削減するために、同じ名前またはラベルを持っているノードもマージされるが、ユーザの判断で例外が適用される。さらに、複合体を、その複合体を全体的に含んでいる最大の複合体に統合するか、または人工的に生成されたスーパーセット複合体(superset complex)に統合することができる。一般に、複合体は、2つ以上の関連するタンパク質のグループであり、スーパーセット複合体は、すべての実体を複数の複合体に包含している特殊な複合体として本明細書で定義される実体である。特定の特徴、ノードの種類、および相互作用も、グラフから削除することができる。名前(具体的には、「表示名」)に基づくノードのマージは、同じ名前のノードの異なる局在性がグラフ内で規定されていないすべての場合で、実行される。これによって、可能性のある局在性に固有の分子の活性を維持する。その結果、前述した簡略化処理を、図8に示された元のグラフに適用することによって、図9に示された簡略化されたグラフが得られる。
【0053】
図10は、図5に示されたブロック418の経路視覚化簡略化プロセスを実行するための方法800の例のその他の詳細を示すフロー図である。図10に示されているように、方法800において、ブロック808は、DG入力のセットをブロック802から受け取り、TG入力のセットをブロック804から受け取り、(任意で)遺伝子活性入力をブロック806から受け取る。ブロック808は、関連するパスを識別する。ブロック810は、識別された関連するパスをブロック808から受け取り、情報を与えない実体または無意味な実体あるいはその両方を削除する。ブロック812は、ブロック810から出力を受け取り、簡略化された関係および関連する属性を作成する。ブロック812の関連する属性は、簡略化されたノードまたはエッジの特性(例えば、人工的リンク(synthetic link)の距離、スーパーセット複合体など)を説明するために、開示された簡略化方法によって作成される情報である。
【0054】
前述の詳細な説明から、本開示が多くの技術的利点を提供することがわかる。評価および可視化システム300(図3に示されている)において、A項、B項、および代替B項は、システム300の評価部分に、DGまたは新薬の開発につながるターゲット遺伝子の重要性の定量化を可能にする重み付け係数を導入する。加えて、C項は、システム300の評価部分に、現在の対象の経路の実際のトポロジーを考慮する手段を導入する。言い換えると、C項は、ソース遺伝子(例えば、GM)から新薬の開発につながるターゲットへの接続の考慮を可能にする。そのため、A項およびB項によって適用される重み付けは、DGとターゲットの間にパスが存在するかどうか、およびDGとターゲットの間のパスの距離によって決定される。パスに沿った各遺伝子の発現に関する追加情報を含めることによって、トポロジーをさらに考慮することができる。この方法では、(例えば、「遺伝子発現のない」シナリオで)平面に沿ってパスのルートをたどる代わりに、等高線が示された表面に沿ってルートをたどることができ、この等高線の高さは発現レベルによって決定される。その場合、これらの等高線を考慮した合計距離を最小限に抑えるように、スコアを決定できる。さらに、DGとターゲットの間で可能性のあるルートの数および多様性を調べることによって、トポロジーを考慮することができる。
【0055】
さらに本開示の技術的利点は、簡略化された視覚化モジュール322(図3に示されている)およびブロック418(図5に示されている)の経路視覚化簡略化プロセスを含み、ソースのセットからターゲットのセットまでのノード間の相互作用の関連状況において、経路の視覚化を簡略化するフレームワークを提供する。例えば、(何らかの条件に起因して)突然変異したタンパク質のセットと、それらのタンパク質の下流にある新薬の開発につながるタンパク質との間の関係の調査において、本明細書で開示された簡略化された視覚化プロセスは、グラフ内の視覚的複雑さを軽減して、即時の視覚的フィードバックを提供し、生物学的ネットワークの理解と新しい洞察の発見に役立つ。したがって、開示された実施形態のうちの1つまたは複数を実装するコンピュータ・システムの動作を改善することができる。
【0056】
ここで図11を参照すると、コンピュータ可読記憶媒体902およびプログラム命令904を含んでいる実施形態に従うコンピュータ・プログラム製品900が、一般的に示されている。
【0057】
本発明は、システム、方法、またはコンピュータ・プログラム製品あるいはこれらの組合せにすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいる(1つまたは複数の)コンピュータ可読記憶媒体を含んでもよい。
【0058】
コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持および記憶できる有形のデバイスにすることができる。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組合せにすることができるが、これらに限定されない。コンピュータ可読記憶媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-onlymemory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmableread-only memoryまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disc read-only memory)、デジタル多用途ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー(R)・ディスク、パンチカードまたは命令が記録されている溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組合せを含む。本明細書において使用されているコンピュータ可読記憶媒体は、本質的に、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの一時的信号であると解釈されるべきではない。
【0059】
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワークあるいはこれらの組合せ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードすることができる。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはこれらの組合せを備えてもよい。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読記憶媒体に記憶するために転送する。
【0060】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、あるいは、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードまたはオブジェクト・コードにすることができる。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータを、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide areanetwork)を含む任意の種類のネットワークを介してユーザのコンピュータに接続することができ、または接続を、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行うことができる。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate arrays)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic arrays)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行できる。
【0061】
本発明の態様は、本明細書において、本発明の実施形態に記載された方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組合せは、コンピュータ可読プログラム命令によって実装できると理解されるであろう。
【0062】
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて規定された機能/動作を実装するための手段を構築するように、汎用コンピュータ、専用コンピュータ、またはその他のプログラマブル・データ処理装置のプロセッサに提供されて、マシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて規定された機能/動作の態様を実装する命令を含む製品を備えるように、コンピュータ可読記憶媒体に記憶され、コンピュータ、プログラマブル・データ処理装置、またはその他のデバイスあるいはこれらの組合せに特定の方法で機能するように指示できるものであってもよい。
【0063】
コンピュータ可読プログラム命令は、コンピュータ、その他のプログラマブル装置、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて規定された機能/動作を実装するように、コンピュータ実装プロセスを生成するべく、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイス上にロードされ、コンピュータ、その他のプログラマブル装置、またはその他のデバイス上で一連の動作ステップを実行させるものであってもよい。
【0064】
図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に記載されているシステム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表すことができる。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生させることができる。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されてもよく、または場合によっては逆の順序で実行されてもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組合せは、規定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェアベースのシステムによって実装できるということにも注意する。
【0065】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、本開示を限定することを意図していない。本明細書で使用される単数形「a」、「an」、および「the」は、特に明示的に示されない限り、複数形も含むことが意図されている。「備える(comprise)」または「備えている(comprising)」あるいはその両方は、本明細書で使用される場合、記載された機能、整数、ステップ、動作、要素、またはコンポーネントあるいはこれらの組合せの存在を示すが、1つまたは複数のその他の機能、整数、ステップ、動作、要素、コンポーネント、またはこれらのグループ、あるいはこれらの組合せの存在または追加を除外していないとさらに理解されるであろう。
【0066】
下の特許請求の範囲内のすべてのミーンズ・プラス・ファンクション要素またはステップ・プラス・ファンクション要素の対応する構造、材料、動作、および均等物は、具体的に請求されるその他の請求される要素と組み合わせて機能を実行するための任意の構造、材料、または動作を含むことが意図されている。本開示の説明は、例示および説明の目的で提示されているが、網羅的であることは意図されておらず、開示された形態での本開示に限定されない。本開示の範囲および思想を逸脱することなく多くの変更および変形が当業者にとって明らかである。本開示の原理および実際的な適用を最も適切に説明するため、およびその他の当業者が、企図されている特定の用途に適しているようなさまざまな変更を伴う多様な実施形態に関して、本開示を理解できるようにするために、実施形態が選択されて説明された。
【0067】
現在および将来の当業者が添付の特許請求の範囲内に含まれるさまざまな改善および拡張を行うことができるということが、理解されるであろう。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11