IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7439359薬物相乗効果予測モデルの構築方法、予測方法及び対応装置
<>
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図1
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図2
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図3
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図4
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図5
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図6
  • 特許-薬物相乗効果予測モデルの構築方法、予測方法及び対応装置 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-19
(45)【発行日】2024-02-28
(54)【発明の名称】薬物相乗効果予測モデルの構築方法、予測方法及び対応装置
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240220BHJP
   G16B 40/20 20190101ALI20240220BHJP
【FI】
G06N3/08
G16B40/20
【請求項の数】 22
(21)【出願番号】P 2022100471
(22)【出願日】2022-06-22
(65)【公開番号】P2023020910
(43)【公開日】2023-02-09
【審査請求日】2022-06-22
(31)【優先権主張番号】202110867932.6
(32)【優先日】2021-07-29
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】202111597730.0
(32)【優先日】2021-12-24
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】フ、ジン
(72)【発明者】
【氏名】ツァオ、グオドン
【審査官】北川 純次
(56)【参考文献】
【文献】米国特許出願公開第2021/0065913(US,A1)
【文献】米国特許出願公開第2019/0303535(US,A1)
【文献】ZHAO, Tianyi et al.,Identifying drug-target interactions based on graph convolutional network and deep neural network,Briefings in Bioinformatics [online],2021年03月,Volume 22, Issue 2,pp. 2141-2150,[検索日 2023.08.28], インターネット:<URL:https://doi.org/10.1093/bib/bbaa044>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/02-3/10
G06N 5/04
G06N 20/00
G16B 40/00-40/20
(57)【特許請求の範囲】
【請求項1】
コンピュータにより、ノードに薬物ノード及び蛋白質ノードが含まれ且つエッジがノード間に相互作用があると示す関係図を取得することと、
前記コンピュータにより、前記関係図から、相乗効果が明確にされた薬物ノード対及び当該薬物ノード対の相乗効果の有無に対する注釈を訓練サンプルとして採集することと、
前記コンピュータにより、訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、グラフ畳み込みネットワークに基づいて前記関係図を学習して得られる前記薬物相乗効果予測モデルを訓練することと、を含み、
前記薬物相乗効果予測モデルは、グラフ畳み込みネットワーク層及び分類層を含み、
前記グラフ畳み込みネットワーク層は、前記関係図から入力された薬物ノード対における各薬物ノードに対応する、薬物ノードと、予め設定された近傍範囲における当該薬物ノードの隣接ノードと、当該薬物ノードと隣接ノードとの間のエッジとが含まれるサブグラフを取得し、薬物ノードに対応するサブグラフにグラフ畳み込み処理を行って、薬物ノードに対応するベクトル表現を得、
前記分類層は、薬物ノード対における各薬物ノードに対応するベクトル表現を用いて、当該薬物ノード対の相乗効果の有無に対する分類結果を得、
前記薬物相乗効果予測モデルの訓練目標は、分類結果と対応する注釈との間の差異を最小化することである
薬物相乗効果予測モデルの構築方法。
【請求項2】
前記薬物相乗効果予測モデルは、グラフ畳み込みネットワークに基づいて、前記関係図における一部のノード及びエッジから構成されるサブグラフを学習して得られる、
請求項1に記載の薬物相乗効果予測モデルの構築方法。
【請求項3】
前記予め設定された近傍範囲は、1次蛋白質隣接ノードと、1次蛋白質隣接ノードの隣接蛋白質ノードとを含む、
請求項に記載の薬物相乗効果予測モデルの構築方法。
【請求項4】
前記関係図における薬物ノード間のエッジは細胞株により識別され、前記訓練サンプルの注釈は細胞株ラベルを含み、
前記分類結果は、前記細胞株における薬物対の相乗効果の有無である、
請求項に記載の薬物相乗効果予測モデルの構築方法。
【請求項5】
薬物ノードに対応するサブグラフにグラフ畳み込み処理を行うことは、
前記薬物ノードに対応するサブグラフに含まれる各ノードの特徴と各エッジの特徴に埋め込み処理を行うことと、
前記埋め込み処理で得られた各ノードの特徴ベクトルと各エッジの特徴ベクトルにアグリゲーション処理を行って、当該薬物ノードに対応するベクトル表現を得ることと、を含む、
請求項に記載の薬物相乗効果予測モデルの構築方法。
【請求項6】
各エッジの特徴ベクトルの初期値は、疾患分類タスクにより予め訓練されており、
各ノードの特徴ベクトルの初期値はCCI化合物化合物相互作用タスクにより予め求める、
請求項に記載の薬物相乗効果予測モデルの構築方法。
【請求項7】
前記コンピュータにより、関係図から識別すべき薬物ノード対を決定することと、
前記コンピュータにより、前記薬物相乗効果予測モデルを用いて前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得ることと、を含み、
前記薬物相乗効果予測モデルは、請求項1~のいずれか1項に記載の薬物相乗効果予測モデルの構築方法を用いて予め訓練された、
薬物相乗効果の予測方法。
【請求項8】
前記コンピュータにより、標的細胞株を決定し、前記関係図から識別すべき薬物ノード対を決定することと、
前記コンピュータにより、前記薬物相乗効果予測モデルを用いて、前記識別すべき薬物ノード対を予測して、前記標的細胞株における前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得ることと、を含み、
前記薬物相乗効果予測モデルは、請求項に記載の薬物相乗効果予測モデルの構築方法を用いて予め訓練された、
薬物相乗効果の予測方法。
【請求項9】
ノードに薬物ノードと蛋白質ノードとが含まれ且つエッジがノード間に相互作用があると示す関係図を取得する図取得部と、
前記関係図から、相乗効果が明確にされた薬物ノード対と、当該薬物ノード対の相乗効果の有無に対する注釈とを訓練サンプルとして採集するサンプル採集部と、
訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、グラフ畳み込みネットワークに基づいて前記関係図を学習して得られる前記薬物相乗効果予測モデルを訓練するモデル訓練部と、を備え
前記薬物相乗効果予測モデルは、グラフ畳み込みネットワーク層及び分類層を含み、
前記グラフ畳み込みネットワーク層は、前記関係図から入力された薬物ノード対における各薬物ノードに対応する、薬物ノードと、予め設定された近傍範囲における当該薬物ノードの隣接ノードと、当該薬物ノードと隣接ノードとの間のエッジとが含まれるサブグラフを取得し、薬物ノードに対応するサブグラフにグラフ畳み込み処理を行って、薬物ノードに対応するベクトル表現を得、
前記分類層は、薬物ノード対における各薬物ノードに対応するベクトル表現を用いて、当該薬物ノード対の相乗効果の有無に対する分類結果を得、
前記モデル訓練部は、分類結果と対応する注釈との間の差異を最小化する訓練目標を採用する
薬物相乗効果予測モデルの構築装置。
【請求項10】
前記薬物相乗効果予測モデルは、グラフ畳み込みネットワークに基づいて、前記関係図における一部のノード及びエッジから構成されるサブグラフを学習して得られる、
請求項に記載の薬物相乗効果予測モデルの構築装置。
【請求項11】
前記予め設定された近傍範囲は、1次蛋白質隣接ノードと、1次蛋白質隣接ノードの隣接蛋白質ノードとを含む、
請求項に記載の薬物相乗効果予測モデルの構築装置。
【請求項12】
前記関係図における薬物ノード間のエッジは細胞株により識別され、前記訓練サンプルの注釈は細胞株ラベルを含み、
前記分類結果は、前記細胞株における薬物対の相乗効果の有無である、
請求項に記載の薬物相乗効果予測モデルの構築装置。
【請求項13】
前記グラフ畳み込みネットワーク層は、薬物ノードに対応するサブグラフにグラフ畳み込み処理を行う際に、
前記薬物ノードに対応するサブグラフに含まれる各ノードの特徴と各エッジの特徴に埋め込み処理を行い、
前記埋め込み処理で得られた各ノードの特徴ベクトルと各エッジの特徴ベクトルにアグリゲーション処理を行って、当該薬物ノードに対応するベクトル表現を得る、
請求項に記載の薬物相乗効果予測モデルの構築装置。
【請求項14】
各エッジの特徴ベクトルの初期値は、疾患分類タスクにより予め訓練されており、
各ノードの特徴ベクトルの初期値はCCI化合物化合物相互作用タスクにより予め求める、
請求項13に記載の薬物相乗効果予測モデルの構築装置。
【請求項15】
関係図から識別すべき薬物ノード対を決定する決定部と、
前記薬物相乗効果予測モデルを用いて前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る予測部と、を備え、
前記薬物相乗効果予測モデルは、請求項14のいずれか1項に記載の薬物相乗効果予測モデルの構築装置により予め訓練される、
薬物相乗効果の予測装置。
【請求項16】
標的細胞株を決定し、前記関係図から識別すべき薬物ノード対を決定する決定部と、
前記薬物相乗効果予測モデルを用いて、前記識別すべき薬物ノード対を予測して、前記標的細胞株における前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る予測部と、を備え、
前記薬物相乗効果予測モデルは、請求項12に記載の薬物相乗効果予測モデルの構築装置により予め訓練される、
薬物相乗効果の予測装置。
【請求項17】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~のいずれか1項に記載の薬物相乗効果予測モデルの構築方法を実行させる、
電子デバイス。
【請求項18】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項に記載の薬物相乗効果の予測方法を実行させる、
電子デバイス。
【請求項19】
コンピュータに請求項1~のいずれか1項に記載の薬物相乗効果予測モデルの構築方法を実行させるためのコンピュータコマンドを記憶する非一時的なコンピュータ可読記憶媒体。
【請求項20】
コンピュータに請求項に記載の薬物相乗効果の予測方法を実行させるためのコンピュータコマンドを記憶する非一時的なコンピュータ可読記憶媒体。
【請求項21】
プロセッサにより実行されると、請求項1~のいずれか1項に記載の薬物相乗効果予測モデルの構築方法を実現するコンピュータプログラム。
【請求項22】
プロセッサにより実行されると、請求項に記載の薬物相乗効果の予測方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータ応用技術の分野に関し、特にAI(Artificial Intelligence、人工知能)技術分野におけるディープラーニングやAI医療などの技術に関する。
【背景技術】
【0002】
薬の併用とは、治療目的を達成するために採用した2種類或いは2種類以上の薬物の同時或いは前後の応用を指し、その主な目的は薬物の治療効果を増加し或いは薬物の毒副作用を軽減するためである。しかし、逆効果を生む可能性もあるため、合理的な薬の併用が重要である。合理的な薬の併用は薬物の相乗効果に基づいているが、試験側から薬物の相乗効果のスクリーニングを行うのは非常に人力と物力を費やす。
【発明の概要】
【発明が解決しようとする課題】
【0003】
これに鑑みて、本開示は、人的/物的コストの削減を容易にする薬物相乗効果予測モデルの構築方法、予測方法及び対応装置を提供する。
【課題を解決するための手段】
【0004】
本開示の第1態様によれば、ノードに薬物ノード及び蛋白質ノードが含まれ且つエッジがノード間に相互作用があると示す関係図を取得し、前記関係図から相乗効果が明確にされた薬物ノード対及び当該薬物ノード対の相乗効果の有無に対する注釈を訓練サンプルとして採集し、訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、グラフ畳み込みネットワークに基づいて前記関係図を学習して得られる前記薬物相乗効果予測モデルを訓練することを含む薬物相乗効果予測モデルの構築方法が提供される。
【0005】
本開示の第2態様によれば、関係図から識別すべき薬物ノード対を決定し、前記薬物相乗効果予測モデルを用いて前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得ることを含み、前記薬剤相乗効果予測モデルは、上記の方法を用いて予め訓練された薬物相乗効果の予測方法が提供される。
【0006】
本開示の第3態様によれば、標的細胞株を決定し、及び前記関係図から識別すべき薬物ノード対を決定し、前記薬物相乗効果予測モデルを用いて、前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の前記標的細胞株における相乗効果の有無に対する予測結果を得ることを含み、前記薬物相乗効果予測モデルは、上記の方法を用いて予め訓練された薬物相乗効果の予測方法が提供される。
【0007】
本開示の第4態様によれば、ノードに薬物ノードと蛋白質ノードとが含まれ且つエッジがノード間に相互作用があると示す関係図を取得する図取得部と、前記関係図から、相乗効果が明確にされた薬物ノード対と、当該薬物ノード対の相乗効果の有無に対する注釈とを訓練サンプルとして収集するサンプル収集部と、訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、グラフ畳み込みネットワークに基づいて前記関係図を学習して得られる前記薬物相乗効果予測モデルを訓練するモデル訓練部と、を備える薬物相乗効果予測モデルの構築装置が提供される。
【0008】
本開示の第5態様によれば、関係図から識別すべき薬物ノード対を決定する決定部と、前記薬物相乗効果予測モデルを用いて前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る予測部とを備え、前記薬物相乗効果予測モデルは、上記装置により予め訓練された薬物相乗効果の予測装置が提供される。
【0009】
本開示の第6態様によれば、標的細胞株を決定し、及び前記関係図から識別すべき薬物ノード対を決定する決定部と、前記薬物相乗効果予測モデルを用いて、前記識別すべき薬物ノード対を予測して、前記識別すべき薬物ノード対の前記標的細胞株における相乗効果の有無に対する予測結果を得る予測部とを備え、前記薬物相乗効果予測モデルは、上記装置により予め訓練された薬物相乗効果の予測装置が提供される。
【0010】
本開示の第7態様によれば、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに上述した方法を実行させる電子デバイスが提供される。
【0011】
本開示の第8態様によれば、コンピュータに上述した方法を実行させるためのコンピュータコマンドを格納した非一時的なコンピュータ可読記憶媒体が提供される。
【0012】
本開示の第9態様によれば、プロセッサにより実行されると、上述した方法を実現するコンピュータプログラムを含むコンピュータプログラム製品が提供される。
【0013】
理解すべきなのは、本セクションで説明される内容は、本開示の実施形態の重要な又は肝心な特徴を標識することでもなく、本開示の範囲を制限することでもない。本開示の他の特徴は、以下の明細書により容易に理解されるであろう。
【図面の簡単な説明】
【0014】
図面は、本技術案をより良く理解するためのものであり、本願に制限されない。
図1】本開示の実施形態により提供される薬物相乗効果予測モデルの構築方法のフローチャートである。
図2】本開示の実施形態により提供される概略的な関係図である。
図3】本開示の実施形態により提供される薬物相乗効果予測モデルの概略図である。
図4】本開示の実施形態により提供される薬物相乗効果の予測方法のフローチャートである。
図5】本開示の実施形態により提供される薬物相乗効果予測モデルの構築装置の構成図である。
図6】本開示の実施形態により提供される薬物相乗効果の予測装置の構成図である。
図7】本開示の実施形態を実現するための電子デバイスのブロック図である。
【発明を実施するための形態】
【0015】
以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
【0016】
本開示は、グラフ畳み込みネットワークに基づく薬物相乗効果予測モデルの構築方法と、このモデルに基づく予測方法を提供する。図1は本開示の実施形態により提供される薬物相乗効果予測モデルの構築方法のフローチャートである。実行主体は、薬物相乗効果予測モデルを構築する装置であってよい。この装置は、コンピュータ端末のアプリケーションに配置されてもよく、コンピュータ端末のアプリケーション内に配置されるプラグイン又はソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットであってもよく、サーバ側に配置されてもよいが、本発明の実施形態に特に限定されない。図1に示すように、当該方法は、以下のステップを含むことができる。
【0017】
101では、ノードに薬物ノードと蛋白質ノードとが含まれ且つエッジがノード間に相互作用があると示す関係図を取得する。
【0018】
102では、関係図から、相乗効果が明確にされた薬物ノード対と、当該薬物ノード対の相乗効果の有無に対する注釈を訓練サンプルとして収集する。
【0019】
103では、訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、フラフ畳み込みネットワークに基づいて前記関係図を学習して得られる薬物相乗効果予測モデルを訓練する。
【0020】
以上からわかるように、本開示は、グラフ畳み込みネットワークに基づいて、関係図における相乗効果が明確にされた薬物ノードに関する、予め設定された近傍範囲内での作用関係を学習して薬物相乗効果予測モデルを得ることにより、薬物相乗効果の自動予測を実現することができ、全てが試験を用いる方法に比べて、人的/物的コストをより節減することができる。
【0021】
以下では、実施形態に関連して上記のステップについて詳細に説明する。まず、ステップ101について詳細に説明する。
【0022】
薬物は主に動物体(人間を含む)に作用し、薬物の動物体内での分配、伝送、代謝と効能はすべて蛋白質と関係があるため、薬物の効果を研究するのは主に薬物と蛋白質の間の相互作用を研究することである。薬物が作用する蛋白質は通常に標的蛋白質と呼ばれる。つまり、薬物と蛋白質との相互作用は、これまでの実験データから取得することができる。
【0023】
蛋白質と蛋白質の間の相互作用もすでに成熟した技術であり、大量の実験データが蓄積され、発展の途上にある。蛋白質と蛋白質の相互作用は、蛋白質の機能をより良くアノテーションし、生命現象を解読することができ、特に薬物設計に大きな利用価値がある。
【0024】
前段階の実験の方式ですでに相乗効果が明確にされた一部の薬物ノード対を得ることができる。この一部の実験データも取得されて本開示のモデルの訓練に用いられることができる。
【0025】
前記薬物と蛋白質、蛋白質と蛋白質、薬物と薬物との相互作用のデータを用いて関係図を構築して得られる。関係図はノードとエッジから構成される。ノードは薬物と蛋白質を含み、ノード間のエッジはノード間に相互作用があると示す。ここで、薬物と薬物との間の相互作用は相乗効果を含み、即ち薬物と薬物との間に相乗効果があれば、関係図において対応する薬物ノード間にエッジが存在し、さもなければ、エッジが存在しない。
【0026】
図2は、本開示の実施形態により提供される概略的な関係図である。当該図において、中実ノード1~5は薬物ノードを表し、中実ノード6~14は蛋白質ノードを表す。薬物ノードと蛋白質ノードとの間のエッジは薬物と蛋白質との相互作用を表し、蛋白質ノードの間のエッジは対応する蛋白質の間の相互作用を表す。薬物ノードの間のエッジは、薬物ノードの間に相乗効果があることを意味する。
【0027】
さらに、薬物ノード間の相乗作用は細胞株によって異なるため、細胞株は主に部位や病巣を区別するために用いられる。がんの場合、通常は原発巣ごとに区分される。したがって、好ましい実施形態として、図2に示す関係図において、薬物ノード間のエッジは細胞株によって標識される。例えば、ノード1とノード2の間には細胞株A2058とA2780に相乗効果があるため、ノード1とノード2の間にはそれぞれA2058とA2780で標識されたエッジが存在する。このような標識方式の他に、異なる細胞株のエッジに対応するノードを異なるノードと見なすことも可能であり、たとえばノード1がA2058と結合して1つのノード、ノード1がA2780と結合して別のノードと見なすことも可能である。
【0028】
上述の関係図において、すでに相乗効果が明確にされた薬物ノード対の間にはエッジの接続が存在しているのに対して、相乗効果が存在するか否かがまだ明らかでないか又は相乗効果が明確にない薬物ノードに対してはエッジが存在しない。上述した実施形態のステップ102では、関係図から相乗効果が明確にされた薬物ノード対と、その薬物ノード対の相乗効果の有無に対する注釈を、訓練サンプルとして採集することができる。さらに、関係図では薬物ノード対間の相乗効果、すなわち薬物ノード間のエッジが細胞株で標識されているため、上記訓練サンプルの注釈は細胞株ラベルを含んでいる。
【0029】
図2の例では、薬物ノード1と薬物ノード2との間には明確な相乗効果が存在するため、薬物ノード1と薬物ノード2とを薬物ノード対として収集して訓練サンプルを形成することができる。例えば、訓練サンプル1は(薬物ノード1-薬物ノード2、相乗効果あり[A2058])、訓練サンプル2は(薬物ノード1-薬物ノード2、相乗効果あり[A2780])である。
【0030】
薬物ノード2と薬物ノード5との間には相乗効果がないことが明確にされたため、薬物ノード2と薬物ノード5とを薬物ノード対として収集して訓練サンプルを形成することができる。例えば、訓練サンプル3は(薬物ノード2-薬物ノード5、相乗効果なし)である。
【0031】
以下では、上記ステップ103、すなわち、「訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として薬物相乗効果予測モデルを訓練する」について、実施形態に関連して詳細に説明する。
【0032】
本開示では、薬物相乗効果予測モデルを訓練する際に、グラフ畳み込みネットワークに基づいて、訓練サンプルにおける薬物ノードが関係図に示された接続関係を学習する。当該接続関係は、薬物ノード間の関係に加え、薬物ノードと蛋白質との関係及び蛋白質と蛋白質との関係を含む。しかし、関係図にトータルラーニングを行うと隣接行列が膨大になり、訓練効率が低下するため、本開示の実施形態では、各薬物ノードに対して、あらかじめ設定された近傍範囲内でノードとエッジを選択してサブグラフを構成し、サブグラフを学習することで学習効率を向上させる。
【0033】
具体的には、図3に示すように、当該薬物相乗効果予測モデルは、主にグラフ畳み込みネットワーク層と分類層とを含むことができる。ここで、グラフ畳み込みネットワーク層は、1つ以上のグラフ畳み込みネットワークの層を含むことができる。
【0034】
訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルを入力した後、グラフ畳み込みネットワーク層は、関係図から入力された薬物ノード対における各薬物ノードに対応するサブグラフを取得するために使用される。薬物ノードに対応するサブグラフは、薬物ノードと、当該薬物ノードの予め設定された近傍範囲における隣接ノードと、当該薬物ノードと隣接ノードとの間のエッジとを含む。そして、薬物ノードに対応するサブグラフに対してグラフ畳み込み処理を行って、薬物ノードに対応するベクトル表現を得る。
【0035】
前記予め設定された近傍範囲は、1次蛋白質隣接ノード及び1次蛋白質隣接ノードの隣接蛋白質ノードを含むことができる。すなわち、サンプリング学習を行う際には、薬物ノードの一次隣接ノードである薬物ノードの標的蛋白質をサンプリングし、次に一次隣接ノードの隣接ノード(即ち薬物ノードの二次隣接)をサンプリングする。ただし、二次隣接ノードをサンプリングする際には、すでにサンプリングされたノードは含まれない。上述の過程において、一次隣接に対するサンプリングは実際には薬物-標的関係をサンプリングし、二次隣接に対するサンプリングは実際には蛋白質-蛋白質関係をサンプリングした。
【0036】
薬物ノードに対応するサブグラフに対してグラフ畳み込み処理を行う際に、薬物ノードに対応するサブグラフに含まれる各ノードの特徴と各エッジの特徴に埋め込む処理を行い、次に埋め込み処理で得られた各ノードの特徴ベクトルと各エッジの特徴ベクトルにアグリゲーション処理を行って、当該薬物ノードに対応するベクトル表現を得ることができる。
【0037】
図2のノード1とノード2からなる薬物ノード対を例として、ノード1の一次隣接であるノード6とノード7をサンプリングする。ノード1の二次隣接ノードであるノード14をサンプリングする。この近傍範囲における隣接ノードとエッジに対して、ノード1、6、7の特徴に埋め込む処理を行い、ノード1とノード6との間のエッジ、ノード1とノード7との間のエッジ、ノード7とノード14との間のエッジの特徴に埋め込む処理を行うことを含むグラフ畳み込み処理を行い、次に埋め込み処理により得られた特徴ベクトルにアグリゲーション処理を行って、ノード1に対応するベクトル表現を得る。
【0038】
ノード2の一次隣接であるノード8をサンプリングし、ノード2の二次隣接ノードであるノード9をサンプリングする。当該近傍範囲における隣接ノードとエッジに対して、ノード2、ノード8、ノード9の特徴に埋め込む処理を行い、ノード2とノード8との間のエッジ、ノード8とノード9との間のエッジの特徴に埋め込む処理を行うことを含むグラフ畳み込み処理を行い、次に埋め込み処理により得られた特徴ベクトルにアグリゲーション処理を行って、ノード2に対応するベクトル表現を得る。
【0039】
上記の埋め込み処理の際に用いるエッジの特徴には、作用のタイプ、細胞株、遺伝子発現プロファイルなどのトランスクリプトーム情報が含まれて良い。埋め込み処理を行う際に用いる初期値は、予め設定された値を用いても良く、疾患分類タスクによってあらかじめ訓練されていてもよい。一例として、がん種分類タスクを用いることができる。例えば、第1埋め込みユニットとマッピングユニットとを含む癌種分類モデルが用いられる。ここで、第1埋め込みユニットはトランスクリプトームの特徴に埋め込み処理を行い、マッピングユニットは埋め込み処理により得られた結果を具体的ながん種類にマッピングする。訓練を行う際には、既知のがん種類に対応するトランスクリプトーム等を訓練データとして用いて、トランスクリプトームを入力、対応する既知のがん種類を目標出力とする上記のがん種分類モデルを訓練する。訓練が終了した後、訓練により得られたがん種分類モデルにおける第1埋め込みユニットを事前訓練モデルとして用いて、本開示でサンプリングにより得られたエッジに埋め込み処理を行い、得られた特徴ベクトルを薬物相乗効果予測モデルの訓練に当該エッジの特徴ベクトルの初期値として用いる。
【0040】
採用されるノード特徴は、分子量、分子活性などを含むことができる。本開示の実施形態における薬物相乗効果予測モデルが埋め込み処理を行う際に用いられる初期値は、予め設定された値を用いてもよく、CCI(化合物-化合物相互作用)タスクによって予め訓練されてもよい。例えば、化合物対及び化合物対の間の作用結果を訓練サンプルとして採集し、化合物対を入力とし、対応する相互作用結果を目標出力としてCCI分類モデルを訓練する。CCI分類モデルには、第2埋め込みユニット及びマッピングユニットが含まれる。ここで、第2埋め込みユニットは、化合物対における各化合物の特徴に埋め込む処理を行い、マッピングユニットは、埋め込み処理により得られた結果を具体的な作用結果にマッピングする。訓練が終了した後、訓練により得られた第2埋め込みユニットを事前訓練モデルとして用いて、本開示で用いられるノードに対して埋め込み処理を行い、得られた特徴ベクトルを薬相乗効果予測モデルの訓練にノードの特徴ベクトル初期値として用いる。
【0041】
依然として図3を参照する。分類層は薬物ノード対における各薬物ノードに対応するベクトル表現を用いて、その薬物ノード対の相乗効果の有無に対する分類結果を得る。薬物相乗効果予測モデルの訓練目標は、分類結果と対応注釈との間の差異を最小化することである。
【0042】
図2を例にすると、上の手順でノード1に対応するベクトル表現とノード2に対応するベクトル表現が得られた後、分類層はノード1に対応するベクトル表現とノード2に対応するベクトル表現を用いて分類する。分類結果はその薬物ノード対に相乗効果があるか否かである。実際の分類過程では、ノード1とノード2との間に相乗効果が存在する確率値が実際に得られる。
【0043】
さらに、上記の学習過程では、細胞株ごとにエッジの区分が行われているため、分類結果にも細胞株情報が含まれている。つまり、実際に薬物対がある細胞株に相乗効果があるか否かという分類結果が得られた。
【0044】
以上からわかるように、前記のように構築された薬物相乗効果予測モデルは生物ネットワークの相互作用特性を保持すると同時に、異なる細胞系の特徴を導入することにより、構築されたモデルがより良い汎化性能を持つようになった。
【0045】
上記の訓練過程では、訓練目標を用いて損失関数を構築することができる。モデルパラメータは、予め設定された訓練終了条件に達するまで、毎回の繰り返しにおいて損失関数の値を用いて更新される。ここで、訓練終了条件は、損失関数の値が収束すること、繰り返し回数が予め設定された回数閾値に達することなどであってよい。
【0046】
図4は本開示の実施形態により提供される薬物相乗効果の予測方法のフローチャートである。実行主体は、薬物相乗効果の予測装置であって良い。この装置は、コンピュータ端末のアプリケーション内に配置されてもよく、コンピュータ端末のアプリケーション内に配置されるプラグイン又はソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットであってもよく、サーバ側に配置されてもよいが、本発明の実施形態に特に限定されない。図4に示すように、当該方法は、以下のステップを含むことができる。
【0047】
401では、関係図から識別すべき薬物ノード対を決定する。
【0048】
本開示の実施形態は、関係図における、相乗効果の有無が明確にされていない薬物ノード対を予測することができ、すなわち、関係図における、相乗効果の有無が明確にされていない薬物ノード対を識別すべき薬物ノード対とすることができる。
【0049】
新たに生み出された新規薬物については、新規薬物と蛋白質との相互作用は実験的に検証されなければならないため、実験データから取得することができる。この場合、この新規薬物を関係図に追加して他の薬物ノードとの相乗効果予測を行うことができる。すなわち、関係図における新規薬物と他の薬物ノードをそれぞれ識別すべき薬物ノード対を構成することができる。
【0050】
402では、薬物相乗効果予測モデルを用いて識別すべき薬物ノード対を予測して、識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る。
【0051】
識別すべき薬物ノード対を薬物相乗効果予測モデルに入力した後、薬物相乗効果予測モデルのグラフ畳み込みネットワーク層は、入力された薬物ノード対における各薬物ノードに対応するサブグラフを取得する。薬物ノードに対応するサブグラフは、薬物ノードと、予め設定された近傍範囲における当該薬物ノードの隣接ノードと、当該薬物ノードと隣接ノードとの間のエッジとを含む。薬物ノードに対応するサブグラフに対してグラフ畳み込み処理を行って、薬物ノードに対応するベクトル表現を得る。そして、分類層は薬物ノード対における各薬物ノードに対応するベクトル表現を用いて、その薬物ノード対の相乗効果の有無に対する分類結果を得る。その分類結果は予測結果である。
【0052】
さらに、薬物相乗効果予測モデルのヘッジの特徴には細胞株の標識が組み込まれているため、上記の予測過程において、ステップ401は、さらに目標細胞株を決定し、即ち薬物対は具体的にどの細胞株に相乗効果があるかを予測することができる。薬物相乗効果予測モデルによる予測過程において、標的細胞株における各ノードのエッジ関係を考慮して、標的細胞株において識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る。
【0053】
以上は、本開示により提供される方法の詳細な説明であり、以下に、本開示により提供される装置について、実施形態に関連して詳細に説明する。
【0054】
図5は、本開示の実施形態により提供される、薬物相乗効果予測モデルの構築装置の構成図である。図5に示されるように、当該装置500は、図取得部501、サンプル採集部502、及びモデル訓練部503を備えることができる。その中の各構成部の主な機能は以下のとおりである。
【0055】
図取得部501は、ノードに薬物ノードと蛋白質ノードとが含まれ且つエッジがノード間に相互作用があると示す関係図を取得する。
【0056】
サンプル採集部502は、関係図から、相乗効果が明確にされた薬物ノード対と、当該薬物ノード対の相乗効果の有無に対する注釈とを訓練サンプルとして採集する。
【0057】
モデル訓練部503は、訓練サンプルにおける薬物ノード対を薬物相乗効果予測モデルの入力とし、薬物ノード対の相乗効果の有無に対する注釈を目標出力として、グラフ畳み込みネットワークに基づいて前記関係図を学習して得られる薬物相乗効果予測モデルを訓練する。
【0058】
ここで、薬物相乗効果予測モデルは、グラフ畳み込みネットワーク層と分類層とを含むことができる。
【0059】
グラフ畳み込みネットワーク層は、関係図から入力された薬物ノード対における各薬物ノードに対応するサブグラフを取得する。薬物ノードに対応するサブグラフは、薬物ノードと、予め設定された近傍範囲における当該薬物ノードの隣接ノードと、当該薬物ノードと隣接ノードとの間のエッジとを含む。薬物ノードに対応するサブグラフに対してグラフ畳み込み処理を行って、薬物ノードに対応するベクトル表現を得る。
【0060】
分類層は薬物ノード対における各薬物ノードに対応するベクトル表現を用いて、その薬物ノード対の相乗効果の有無に対する分類結果を得る。
【0061】
モデル訓練部503は、分類結果と対応する注釈との差異を最小化する訓練目標を採用する。
【0062】
1つの実現形態として、予め設定された近傍範囲は、1次蛋白質隣接ノードと1次蛋白質隣接ノードの隣接蛋白質ノードを含む。
【0063】
さらに、薬物ノード間の相乗効果は細胞株の違いによって異なるので、好ましい実施形態として、上記の関係図における薬物ノード間のエッジは細胞株によって識別され、訓練サンプルの注釈に細胞株ラベルが含まれる。それに応じて、分類結果は、薬物対が細胞系で相乗効果があるか否かである。
【0064】
1つの実現形態として、グラフ畳み込みネットワーク層は、薬物ノードに対応するサブグラフに対してグラフ畳み込み処理を行う際に、具体的には、薬物ノードに対応するサブグラフに含まれる各ノードの特徴と各エッジの特徴に埋め込む処理を行い、埋め込み処理で得られた各ノードの特徴ベクトルと各エッジの特徴ベクトルにアグリゲーション処理を行って、その薬物ノードに対応するベクトル表現を得る。
【0065】
ここで、各エッジの特徴ベクトルの初期値は、疾患分類タスクにより予め訓練される。各ノードの特徴ベクトルの初期値はCCI化合物化合物相互作用タスクにより予め求める。
【0066】
図6は、本開示の実施形態により提供される薬物相乗効果の予測装置の構成図である。図6に示されるように、当該装置600は、決定部601及び予測部602を備えることができる。その中の各構成部の主な機能は以下のとおりである。
【0067】
決定部601は、関係図から識別すべき薬物ノード対を決定する。
【0068】
予測部602は、薬物相乗効果予測モデルを用いて識別すべき薬物ノード対を予測して、識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る。
【0069】
ここで、薬物相乗効果予測モデルは、図5に示される装置により予め訓練される。
【0070】
好ましい実施形態として、上記決定部601は、さらに、標的細胞株を決定することができる。それに応じて、予測部602は、標的細胞株における識別すべき薬物ノード対の相乗効果の有無に対する予測結果を得る。
【0071】
本明細書の様々な実施形態は、漸進的に説明されており、様々な実施形態間の類似部分は互いに参照すればよく、各実施形態は、他の実施形態との相違点に焦点を当てて説明されている。特に、装置の実施形態については、基本的に方法の実施形態と同様であるので、説明は比較的簡単であり、関連内容について方法の実施形態の内容を参照すればよい。
【0072】
本開示の技術案において、関わるユーザの個人情報の取得、記憶及び応用等は、いずれも関連法律法規の規定に適合しており、公序良俗に反するものではない。
【0073】
本開示の実施形態によれば、本開示はさらに、電子デバイス、可読記憶媒体、及びコンピュータプログラム製品を提供する。
【0074】
図7は、本開示の実施形態による薬物相乗効果予測モデルの構築方法及び予測方法の電子デバイスのブロック図を示した。電子デバイスは、ラップトップ、デスクトップコンピュータ、ワークベンチ、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような、様々な形態のデジタルコンピュータを表す。電子デバイスはさらに、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。本明細書に示す構成要素、それらの接続及び関係、ならびにそれらの機能は、単なる一例であり、本明細書に記載及び/又は要求された本開示の実現を制限することではない。
【0075】
図7に示すように、デバイス700は、読み取り専用メモリ(ROM)702に記憶されたコンピュータプログラム、又は記憶手段708からランダムアクセスメモリ(RAM)703にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる演算手段701を含む。RAM703には、デバイス700の動作に必要な各種のプログラムやデータが記憶されてもよい。演算手段701、ROM702及びRAM703は、バス704を介して接続されている。入出力(I/O)インターフェース705もバス704に接続されている。
【0076】
例えばキーボード、マウス等の入力手段706と、例えば様々なタイプのディスプレイ、スピーカ等の出力手段707と、例えば磁気ディスク、光ディスク等の記憶手段708と、例えばネットワークカード、モデム、無線通信トランシーバなどの通信手段709を含むデバイス700の複数の構成要素は、I/Oインターフェース705に接続される。通信手段709は、デバイス700が例えばインターネットのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他のデバイスと情報/データを交換することを可能にする。
【0077】
演算手段701は、処理能力及び演算能力を有する様々な汎用及び/又は専用の処理コンポーネントであってよい。演算手段701のいくつかの例は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、様々な専用の人工知能(AI)演算チップ、機械学習モデルアルゴリズムを実行する様々な演算ユニット、デジタル信号プロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。演算手段701は、上述した様々な方法及び処理、例えば薬物相乗効果予測モデルの構築方法及び予測方法を実行する。例えば、幾つかの実施形態では、薬物相乗効果予測モデルの構築方法及び予測方法は、例えば記憶手段708のような機械可読媒体に物理的に組み込まれたコンピュータソフトウェアプログラムとして実装されてもよい。
【0078】
幾つかの実施形態では、コンピュータプログラムの一部又は全部は、ROM802及び/又は通信手段709を介してデバイス700にロード及び/又はインストールすることができる。コンピュータプログラムがRAM703にロードされ、演算手段701により実行されると、前記薬物相乗効果予測モデルの構築方法及び予測方法の1つ又は複数のステップを実行することができる。代替的に、他の実施形態では、演算手段701は、薬物相乗効果予測モデルの構築方法及び予測方法を実行するように、他の任意の適切な方法で(例えば、ファームウェアを介する)構成されてもよい。
【0079】
本明細書で前述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、専用集積回路(ASIC)、専用標準製品(ASSP)、システムオンチップシステム(SOC)、ロードプログラマブル論理デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせにおいて実装されてもよい。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含んで良い。当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することができる。当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであって、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置にデータ及び命令を転送することができる。
【0080】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせを用いて記述することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することにより、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図に指定された機能/動作を実行するようにすることができる。プログラムコードは、全てがマシン上で実行されても良く、一部がマシン上で実行されても良く、スタンドアロンパッケージとして一部的にマシン上で実行され且つ一部的にリモートマシン上で実行され、或いは全てがリモートマシン又はサーバ上で実行されても良い。
【0081】
本開示の文脈では、機械可読媒体は、有形の媒体であって、命令実行システム、装置又はデバイスにより使用され、或いは命令実行システム、装置又はデバイスと合わせて使用されるプログラムを含むか記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってよい。機械可読媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体的なシステム、装置又はデバイス、あるいはこれらの任意の適切な組み合わせを含んで良いが、これらに限定されない。機械可読記憶媒体のより具体的な例は、1つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又はこれらの任意の適切な組み合わせを含む。
【0082】
ユーザとのインタラクションを提供するために、本明細書に記載されたシステム及び技術は、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、ユーザにより入力をコンピュータに提供するキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)と備えるコンピュータ上に実施されてよい。他の種類の装置は、ユーザとのインタラクションを提供するためにも使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であって良く、ユーザからの入力を任意の形式(音入力、音声入力、又は触覚入力を含む)で受信して良い。
【0083】
本明細書に記載されたシステム及び技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
【0084】
コンピュータシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。サーバはクラウドサーバ、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれ、従来の物理ホストと仮想専用サーバ(VPs;Virtual Private Server)サービスにおいて管理が難しく、ビジネスの拡張性が弱いという欠点を解決するクラウドコンピューティングサービスシステムのホスト製品の1つであって良い。サーバは、分散システムのサーバであっても良く、ブロックチェーンを組み合わせたサーバであってもよい。
【0085】
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
【0086】
上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5
図6
図7