IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ▲騰▼▲訊▼科技(深▲セン▼)有限公司の特許一覧

特表2023-548923人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム
<>
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図1
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図2
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図3
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図4
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図5
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図6
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図7
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図8
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図9
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図10A
  • 特表-人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム 図10B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-21
(54)【発明の名称】人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム
(51)【国際特許分類】
   G16C 20/50 20190101AFI20231114BHJP
【FI】
G16C20/50
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023528178
(86)(22)【出願日】2022-01-24
(85)【翻訳文提出日】2023-05-10
(86)【国際出願番号】 CN2022073558
(87)【国際公開番号】W WO2022161323
(87)【国際公開日】2022-08-04
(31)【優先権主張番号】202110119170.1
(32)【優先日】2021-01-28
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.ANDROID
3.iOS
(71)【出願人】
【識別番号】517392436
【氏名又は名称】▲騰▼▲訊▼科技(深▲セン▼)有限公司
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【弁理士】
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】于 洋
(72)【発明者】
【氏名】▲鄭▼ 良振
(72)【発明者】
【氏名】▲劉▼ ▲藝▼▲シュアン▼
(57)【要約】
人工知能技術に関する、人工知能ベースの薬物分子処理方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム製品が提供され、上記方法は、標的タンパク質の複数の候補薬物分子を決定するステップと、複数の候補薬物分子および標的タンパク質に基づいて活性予測処理を行い、各候補薬物分子の活性情報を得るステップと、標的タンパク質に対してホモロジーモデリング処理を行い、標的タンパク質と相同構造を有する参照タンパク質を得るステップと、参照タンパク質および複数の候補薬物分子に基づいて分子ドッキング処理を行い、各候補薬物分子の分子ドッキング情報を得るステップと、各候補薬物分子の活性情報および各候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子に対して選別処理を行い、標的タンパク質の標的薬物分子を得るステップと、含む。
【特許請求の範囲】
【請求項1】
電子機器によって実行される、人工知能ベースの薬物分子処理方法であって、
標的タンパク質の複数の候補薬物分子を決定するステップと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るステップと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得るステップと、
前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るステップと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るステップと、を含む、
人工知能ベースの薬物分子処理方法。
【請求項2】
標的タンパク質の複数の候補薬物分子を決定する前記ステップは、
前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得るステップと、
前記複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得るステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項3】
前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得る前記ステップは、
前記標的タンパク質に基づいて、化合物ライブラリ内の化合物に対してリピンスキーの法則に基づく選別処理を行い、リピンスキーの法則に合致する複数の化合物を得るステップと、
前記リピンスキーの法則に合致する複数の化合物に対して重複除去処理を行い、複数の選別後の化合物を得るステップと、を含む、
請求項2に記載の人工知能ベースの薬物分子処理方法。
【請求項4】
前記複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得る前記ステップは、
標的基に基づいて前記複数の選別後の化合物に対して化学的フィルタリング処理を行い、複数のフィルタリング後の化合物を得るステップと、
前記複数のフィルタリング後の化合物からキラル化合物の鏡像異性体を除去して、標的タンパク質の候補薬物分子を得るステップと、を含む、
請求項2に記載の人工知能ベースの薬物分子処理方法。
【請求項5】
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得る前記ステップは、
前記複数の候補薬物分子のうちの任意の1つの候補薬物分子について、
前記候補薬物分子の分子構造に対して符号化処理を行い、前記候補薬物分子の埋め込み特徴を得、
前記標的タンパク質のタンパク質構造に対して符号化処理を行い、前記標的タンパク質の埋め込み特徴を得、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得、
前記活性融合特徴に対してマッピング処理を行い、前記候補薬物分子の活性情報を得る、処理を実行するステップを含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項6】
前記候補薬物分子の分子構造に対して符号化処理を行い、前記候補薬物分子の埋め込み特徴を得る前記ステップは、
前記候補薬物分子の分子構造に基づいて、前記候補薬物分子の分子図を決定するステップと、
前記候補薬物分子の分子図に対して画像符号化処理を行い、前記候補薬物分子の埋め込み特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項7】
前記標的タンパク質のタンパク質構造に対して符号化処理を行い、前記標的タンパク質の埋め込み特徴を得る前記ステップは、
前記標的タンパク質のタンパク質構造に基づいて、前記標的タンパク質のタンパク質配列を決定するステップと、
前記標的タンパク質のタンパク質配列に対してテキスト変換処理を行い、前記標的タンパク質の埋め込み特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項8】
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得る前記ステップは、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して加算処理を行い、前記活性融合特徴を得るステップ、または、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して連結処理を行い、前記活性融合特徴を得るステップ、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項9】
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得る前記ステップは、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対してマッピング処理を行い、前記候補薬物分子および前記標的タンパク質を含む中間特徴ベクトルを得るステップと、
前記中間特徴ベクトルに対してアフィン変換処理を行い、前記活性融合特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項10】
前記活性融合特徴に対してマッピング処理を行い、前記候補薬物分子の活性情報を得る前記ステップは、
前記活性融合特徴を隠れベクトル空間にマッピングして、前記活性融合特徴の隠れベクトルを得るステップと、
前記活性融合特徴の隠れベクトルに対して非線形マッピング処理を行い、前記候補薬物分子の活性情報を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項11】
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得る前記ステップは、
タンパク質プールのうちの任意の1つの候補タンパク質について、
前記候補タンパク質の配列と前記標的タンパク質の配列とに対して類似度処理を行い、前記候補タンパク質と前記標的タンパク質との類似度を得、
前記類似度が類似度閾値より大きい場合、前記候補タンパク質の3次元構造に基づいて構造最適化処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得る、処理を実行するステップを含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項12】
前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得る前記ステップは、
前記参照タンパク質に基づいて分子動力学シミュレーション処理を行い、前記参照タンパク質の活性部位および結合ポケットを得るステップと、
前記複数の候補薬物分子をそれぞれ前処理して、各前記候補薬物分子の分子配座を得るステップと、
各前記候補薬物分子の分子配座について、前記参照タンパク質の活性部位、前記結合ポケットおよび前記候補薬物分子の分子配座に基づいて分子ドッキングスコアリングを実行して、前記分子ドッキングスコアリングの結果を前記候補薬物分子の分子ドッキング情報として使用するステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項13】
前記複数の候補薬物分子をそれぞれ前処理して、各前記候補薬物分子の分子配座を得る前記ステップは、
前記複数の候補薬物分子のそれぞれに対してフォーマット変換処理を行い、各前記候補薬物分子の変換フォーマットを得るステップと、
各前記候補薬物分子の変換フォーマットに基づいて、各前記候補薬物分子の3次元配座を構築するステップと、
各前記候補薬物分子の3次元配座に基づいて、各前記候補薬物分子における水素原子付加可能位置を決定するステップと、
前記水素原子付加可能位置に水素原子を付加して、前記候補薬物分子の分子配座を得るステップと、を含む、
請求項12に記載の人工知能ベースの薬物分子処理方法。
【請求項14】
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るステップは、
前記複数の候補薬物分子に対してクラスタリング処理を行い、複数の薬物カテゴリ集合を得るステップと、
前記複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を前記標的薬物分子として選別するステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項15】
前記複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を前記標的薬物分子として選別する前記ステップは、
前記複数の薬物カテゴリ集合のうちの任意の1つの薬物カテゴリ集合について、
前記薬物カテゴリ集合の中で最も高い活性情報を有する候補薬物分子を選別対象の薬物分子として使用し、
前記選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性に対して加重加算処理を行い、前記選別対象の薬物分子の総合薬物情報を得、
複数の前記選別対象の薬物分子の総合薬物情報に基づいて、複数の前記選別対象の薬物分子を降順に並べ、ランキングが上位にある前記選別対象の薬物分子の一部を前記標的薬物分子として使用する、処理を実行するステップを含む、
請求項14に記載の人工知能ベースの薬物分子処理方法。
【請求項16】
人工知能ベースの薬物分子処理装置であって、
標的タンパク質の複数の候補薬物分子を決定するように構成される決定モジュールと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るように構成される予測モジュールと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得、前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るように構成される処理モジュールと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るように構成される選別モジュールと、を備える、
人工知能ベースの薬物分子処理装置。
【請求項17】
電子機器であって、
実行可能な命令を記憶するメモリと、
前記メモリに記憶された実行可能な命令を実行するとき、請求項1から15のいずれか一項に記載の人工知能ベースの薬物分子処理方法を実現するように構成されるプロセッサと、を備える、
電子機器。
【請求項18】
プロセッサによって実行されるとき、請求項1から15のいずれか一項に記載の人工知能ベースの薬物分子処理方法を実現するための実行可能な命令を記憶した、コンピュータ可読記憶媒体。
【請求項19】
請求項1から15のいずれか一項に記載の人工知能ベースの薬物分子処理方法をコンピュータに実行させるコンピュータプログラムまたは命令を含む、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
本願実施例は、2021年1月28日に中国特許局に提出された、出願番号が第202110119170.1号である中国特許出願の優先権を主張し、その内容の全てが参照により本願実施例に援用される。
【0002】
本願は、知的医学技術に関し、特に、人工知能ベースの薬物分子処理方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム製品に関するものである。
【背景技術】
【0003】
人工知能(AI:Artificial Intelligence)は、コンピュータ科学の総合技術であり、各種の知能機器の設計原理と実現方法を研究することにより、機器に感知、推論と意思決定の機能を持たせる。人工知能技術は、自然言語処理技術および機械学習/深層学習など、幅広い分野に関わる総合的な学科である。技術の発展に伴い、人工知能技術は、より多くの分野に適用され、ますます重要な価値を発揮することになる。
【0004】
薬物選別は、特定の疾患(多嚢胞性卵巣症候群など)に参照価値を有する標的薬物分子を大量の薬物分子の中から選別する技術である。現在、化合物ライブラリ内に存在する大量の候補薬物分子は、参照価値を有するかもしれないが、大量の候補薬物分子から参照価値のあるデータを発掘することは、手動選別に依存するため、正確度も効率も理想的ではなく、コストも非常に高い。
【0005】
関連技術は、人工知能に基づいて候補薬物分子を効率的に選別する技術案が不足している。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本願実施例は、大量の候補薬物分子から価値のある薬物分子を効率的に選別するための人工知能ベースの薬物分子処理方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム製品を提供する。
【課題を解決するための手段】
【0007】
本願実施例の技術的解決策は、次のように実現される:
本願実施例は、人工知能ベースの薬物分子処理方法を提供し、当該方法は、
標的タンパク質の複数の候補薬物分子を決定するステップと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るステップと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得るステップと、
前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るステップと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るステップと、を含む。
【0008】
本願実施例は、人工知能ベースの薬物分子処理装置を提供し、当該装置は、
標的タンパク質の複数の候補薬物分子を決定するように構成される決定モジュールと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るように構成される予測モジュールと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得、前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るように構成される処理モジュールと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、標的薬物分子を得るように構成される選別モジュールと、を備える。
【0009】
本願実施例は、薬物分子処理用の電子機器を提供し、前記電子機器は、
実行可能な命令を記憶するメモリと、
前記メモリに記憶された実行可能な命令を実行するとき、本願実施例によって提供される人工知能ベースの薬物分子処理方法を実現するように構成されるプロセッサと、を備える。
【0010】
本願実施例は、プロセッサによって実行されるとき、本願実施例によって提供される人工知能ベースの薬物分子処理方法を実現するための実行可能な命令を記憶した、コンピュータ可読記憶媒体を提供する。
【0011】
本願実施例は、上記の人工知能ベースの薬物分子処理方法をコンピュータに実行させるコンピュータプログラムまたは命令を含む、コンピュータプログラム製品を提供する。
【発明の効果】
【0012】
本願実施例は、次の有利な効果を有する。
候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、大量の候補薬物分子から、標的タンパク質の標的薬物分子を選別し、それにより、価値のある標的薬物分子を効率よく自動的に選別するように、標的薬物分子の活性および標的タンパク質との結合能力を確保する。
【図面の簡単な説明】
【0013】
図1】関連技術によって提供されるGタンパク質共役受容体GPR54/Kiss-1シグナル経路の概略図である。
図2】関連技術によって提供されるヒット化合物1の構造最適化の概略図である。
図3】本願実施例によって提供される医薬品システムの適用シナリオの概略図である。
図4】本願実施例によって提供される薬物分子処理用の電子機器の概略構成図である。
図5】本願実施例によって提供される人工知能ベースの有機物サンプル処理方法のフローチャートである。
図6】本願実施例によって提供される人工知能ベースの有機物サンプル処理方法のフローチャートである。
図7】本願実施例によって提供される人工知能ベースの有機物サンプル処理方法のフローチャートである。
図8】本願実施例によって提供される予測モデルの概略構成図である。
図9】本願実施例によって提供される深層学習ベースの化合物活性スコアリングのフローチャートである。
図10A】本願実施例によって提供される潜在活性分子の概略構成図である。
図10B】本願実施例によって提供される潜在活性分子の概略構成図である。
【発明を実施するための形態】
【0014】
本願の目的、技術的解決策および利点をより明確にするために、以下に添付図面を参照して本願をさらに詳細に説明する。説明される実施例は、本願に対する制限と見なされるべきではなく、当業者が創造的な努力なしに取得した他のすべての実施例は、本願の保護範囲に含まれるものとする。
【0015】
以下の説明では、「第1/第2」という関連用語は、類似する対象を区別するためのものに過ぎず、対象に対する特定の順を表すものではなく、「第1/第2」という用語は、本明細書に記載された本願実施例が本明細書で図示または説明した以外の順序で実施できるように、許可される場合に、特定の順又は優先順位を互いに交換することができることに留意されたい。
【0016】
特に定義しない限り、本明細書で使用されるすべての技術及び科学的用語は、当業者が通常理解している意味と同じである。本明細書で使用される用語は、本願実施例の目的を説明するために過ぎず、本願を限定することを目的とするものではない。
【0017】
本願実施例をさらに詳細に説明する前に、本願実施例に関する名詞及び用語を説明する。本願実施例に関する名詞及び用語は、以下の解釈に適用可能である。
【0018】
1)深層学習(DL:Deep Learning):機械学習(ML:Machine Learning)分野における新しい研究方向であり、機械学習に導入され、最初の目標である人工知能(AI:Artificial Intelligence)により近づけるようにする。深層学習は、サンプルデータの内在規則や表現階層を学習するものであり、これらの学習過程で獲得された情報は、文字、画像、音声などのデータの解釈に大きく役立つ。深層学習の最終的な目標は、機器が人間のように分析学習能力を持ち、文字、画像、音声などのデータを認識できるようにすることである。
【0019】
2)畳み込みニューラルネットワーク(CNN:Convolutional Neural Networks):畳み込みコンピューティングを含み、且つ深層構造を有するフィードフォワードニューラルネットワーク(FNN:Feedforward Neural Networks)であり、深層学習(Deep Learning)の代表的なアルゴリズムの1つである。畳み込みニューラルネットワークは、表現学習(Representation Learning)能力を持ち、その階層構造に応じて、入力画像に対してシフト不変分類(Shift-invariant Classification)を実行することができる。
【0020】
3)分子の化学構造の線形表記法(SMILES:Simplified Molecular Input Line Entry System):分子構造を米国情報交換標準コード(ASCII:American Standard Code for Information Interchange)文字列で明示的に表記する仕様である。SMILES式は、例えば、シクロヘキサン(C6H12)のSMILES式がC1CCCCC1、即ち、C1CCCCC1がシクロヘキサンであることを示すなど、一連の文字列で3次元化学構造を表記することができる。
【0021】
4)薬物分子:薬物の化学構造であり、例えば、ベンゼン環が薬物分子である。
【0022】
5)薬物の特性:例えば、溶解度、血液脳関門透過性、および毒性(特定の薬物分子が生命体に接触または生体内に進入すると、直接的なまたは間接的な損害作用を引き起こす可能性があり、即ち、当該タイプの薬物分子は、生物毒性を有する)など、薬物分子構造の特性を表す。
【0023】
6)分子ドッキング(Docking):分子シミュレーションの重要な方法の1つであり、受容体の特徴および受容体と薬物分子との相互作用の方式による薬物設計方法であり、その本質は、複数の分子間の認識過程であり、そのプロセスは、分子間の空間マッチングとエネルギーマッチングに関連する。薬物研究開発分野では、主に、小分子と標的タンパク質の結合方式と重要な結合作用をコンピューティングして観察するために使用される。分子ドッキング方法は、ある程度簡略化されており、簡略化の程度と方式に応じて、剛性ドッキング、半柔軟性ドッキングおよび柔軟性ドッキングに分けられる。
【0024】
7)ホモロジーモデリング(Homology Modeling):タンパク質の3次元構造は、その生物学的および生理学的機能を理解し、標的構造に基づく薬物設計を行うための重要な情報である。ホモロジーモデリングは、タンパク質のアミノ酸配列に基づいて、実験的に解析した相同タンパク質の3次元構造をテンプレートとして、標的タンパク質の3次元構造を構築する方法である。
【0025】
8)結合ポケット(Binding Pocket):薬物設計において、小分子とタンパク質が結合してタンパク質を調節する機能を果たす空洞を結合ポケットと称する。
【0026】
9)Gタンパク質共役受容体(GPCR:G Protein-Coupled Receptors):膜タンパク質受容体の大分類の総称である。このような受容体の共通点は、その立体構造内にすべて7つの膜貫通α螺旋があり、且つそのペプチド鎖のC端と、5番目および6番目の膜貫通螺旋を結ぶ細胞内環にすべてGタンパク質の結合部位があることである。
【0027】
10)リード化合物:略して先導物と呼ばれ、様々な手法や手段により得られた何らかの生物活性や化学構造を有する化合物であり、更なる化合物構造の改造に用いられる。
【0028】
多嚢胞性卵巣症候群(PCOS:Polycystic Ovarian Syndrome)は、ホルモン失調による疾患であり、現在、具体的にどのような原因によるものかまだ不明である。卵巣は、エストロゲンと妊娠ホルモンを生成する。それらは、エストロゲンである。卵巣は、男性ホルモンであるアンドロゲンも生成する。多嚢胞性卵巣症候群では、卵巣から過剰なアンドロゲンが生成され、ホルモン失調を引き起こし、ホルモン失調は体に広範な影響を与える。これらの影響は軽微または深刻であり、それに影響を受ける人々には、女性群が約10分の1を占める。いずれの慢性疾患と同様に、多嚢胞性卵巣症候群は、ある程度生活に影響を及ぼすが、治療しなければ、心臓病、糖尿病、肥満、子宮内膜癌、不妊など、他の健康問題を引き起こす恐れがある。
【0029】
関連技術において、PCOS治療は主に、ホルモン治療によって、女性ホルモンのレベルを高めたり、高まった男性ホルモンの影響を減したりすることによって行われてきた。現在、多嚢胞性卵巣症候群という疾患を主に狙った薬物がまだ上市されていない。図1に示されるように、異常なMAPKまたはERKシグナルチャネルは、PCOS患者の代謝シグナルの欠陥、卵巣のアンドロゲンの過剰分泌を引き起こし、Gタンパク質共役受容体GPR54/Kiss-1は、生殖系症候群に一定の作用を有し、卵巣内のいくつかのキー蛋白の発現レベルは、ポリペプチド分子Kisspeptin(Kpニューロンが生成したホルモンであり、生体内のエストロゲンの含有量を調節することにより生殖活動を調節する)とGPR54タンパク質の結合影響を著しく受け、それにより、多嚢胞性卵巣症候群を緩和できる。
【0030】
Kisspeptinは、GPR54と結合してPCOS緩和効果を達成できるが、Kisspeptinは中枢神経系内で高度に発現されるため、Kisspeptinを直接に投与することにより治療の目的に達成することができない。したがって、GPR54タンパク質に選択的に結合できるとともに、中枢神経系に毒副作用を引き起こさないように血液脳関門を通過不能な小分子を見つけることは、非常に研究展望と臨床的価値がある。
【0031】
しかしながら、GPR54ターゲット用に開発された薬物分子が非常に少なく、その原因は、主に次の2つがある:1)標的GPR54の結晶構造が予測不可能な情報であり、構造に基づく薬物分子設計が非常に困難であり、2)関連活性分子のデータが少ない。図2に示されるように、分子は、設計-合成-テスト-再設計のサイクルプロセスにより、構造活性相関に応じて最適化されて、活性が1.2μMである理想的な活性を有するリード化合物(ヒット化合物1)を見つけようとする。
【0032】
しかしながら、前述した薬物設計手段は、大量の人的資源と物質資源をかけて試行錯誤を重ね、非効率的で、周期が長いだけでなく、正確性も低い。同時に、この過程で、薬物分子の安全性と物理化学的特性、および生体内代謝の安定性を確保するために、血液脳関門の通過率およびその他の薬物の吸収、分配、代謝、排泄、および毒性(ADMET特性)を絶えずにテストする必要がある。
【0033】
上記の問題を解決するために、本願実施例は、大量の候補薬物分子から価値のある標的薬物分子を効率的に選別できる、人工知能ベースの薬物分子処理方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム製品を提供する。
【0034】
本願実施例によって提供される人工知能ベースの薬物分子処理方法は、端末またはサーバによって単独で実現されてもよいし、端末およびサーバが共同で実現されてもよい。例えば、端末が単独で以下のような人工知能ベースの薬物分子処理方法を実行するか、または、端末がサーバに薬物分子の選別要求(標的タンパク質情報を含む)を送信し、サーバが、受信した当該薬物分子の選別要求に基づいて人工知能ベースの薬物分子処理方法を実行して、標的タンパク質の標的薬物分子を取得し、医薬品研究者は、選別された標的薬物分子によって、後続の薬物分子の研究、分析などを迅速に進めることができる。
【0035】
本願実施例によって提供される薬物分子処理用の電子機器は、様々なタイプの端末機器またはサーバであり得る。ここで、サーバは、独立した物理サーバであってもよく、複数の物理サーバからなるサーバクラスタまたは分散システムであってもよく、さらに、クラウドコンピューティングサービスを提供するクラウドサーバであってもよい。端末は、スマートフォン、タブレットコンピュータ、ノートパソコン、デスクトップコンピュータ、スマートスピーカ、スマートウォッチなどであってもよいが、これに限定されるものではない。端末およびサーバは、有線または無線通信方式で直接的または間接的に接続されることができ、本願はこれに限定されない。
【0036】
サーバを例としては、例えば、クラウドに展開されたサーバクラスタであり、人工知能クラウドサービス(AIaaS:AI as a Service)をユーザにオープンすることができる。AIaaSプラットフォームは、いくつかの一般的なAIサービスを分割し、クラウド上で独立したサービスまたはパッケージサービスを提供することができる。このようなサービスモデルは、AIテーマモールと類似しており、すべてのユーザがアプリケーションプログラミングインタフェースを介して、AIaaSプラットフォームによって提供される1つ以上の人工知能サービスにアクセスして利用することができる。
【0037】
例えば、人工知能クラウドサービスの1つは、本願実施例によって提供される薬物分子処理のプログラムがクラウド上のサーバにカプセル化される、薬物分子処理サービスであり得る。ユーザは、端末(例えば、薬物選別クライアントなどのクライアントが稼働している)を介してクラウドサービスにおける薬物分子処理サービスを呼び出すことにより、クラウドに配置されたサーバは、カプセル化された薬物分子処理のプログラムを呼び出して、候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子から標的薬物分子を選別し、後続に標的薬物分子に基づいて薬物分子の選別要求に応答する。例えば、薬物選別アプリケーションの場合、GPCRの化合物ライブラリを獲得し、化合物ライブラリにおける候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子からGPCRの標的薬物分子を選別する。Gタンパク質共役受容体が生殖系症候群に対して一定の作用を有するため、薬剤研究開発者は、その後に、標的薬物分子から生殖系症候群に対して積極的な作用を有する薬物分子を迅速に得ることができる。
【0038】
図3を参照すれば、図3は、本願実施例によって提供される医薬品システム10の適用シナリオの概略図であり、端末200は、ネットワーク300を介してサーバ100に接続されており、ネットワーク300は、広域ネットワークまたはローカルエリアネットワークであってもよく、これらの組み合わせであってもよい。
【0039】
端末200(例えば、薬物選別クライアントなどのクライアントが稼働している)は、標的タンパク質および化合物ライブラリ(複数の候補薬物分子を含む)を取得するために使用され、例えば、薬剤研究開発者は、端末200の入力インタフェースを介して、標的タンパク質(GPCRなど)および薬物選別を行うための化合物ライブラリ(ZINCライブラリなど)を入力して、標的タンパク質および化合物ライブラリを取得し、薬物分子の選別要求を自動的に生成する。
【0040】
いくつかの実施例において、人工知能ベースの薬物分子処理方法をクライアントでローカルに実現するために、端末で動作するクライアントに薬物分子処理プラグインを埋め込んでもよい。例えば、端末200が、薬物分子の選別要求(標的タンパク質の化合物ライブラリを含む)を取得した後、人工知能ベースの薬物分子処理方法を実現するために、薬物分子処理プラグインを呼び出して、候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子から標的薬物分子を選別し、後続に標的薬物分子に基づいて薬物分子の選別要求に応答する。
【0041】
いくつかの実施例において、端末200が、薬物分子の選別要求を取得した後、サーバ100の薬物分子処理インタフェース(クラウドサービスの形、即ち、薬物分子処理サービスとして提供可能)を呼び出し、サーバ100は、候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子から標的薬物分子を選別し、後続に標的薬物分子に基づいて薬物分子の選別要求に応答する。例えば、薬物選別アプリケーションの場合、薬剤研究開発者は、薬物選別クライアントの入力インタフェースを介して、標的タンパク質(GPCRなど)および薬物選別を行うための化合物ライブラリ(ZINCライブラリなど)を入力して、標的タンパク質および化合物ライブラリを取得し、薬物分子の選別要求を自動的に生成し、サーバ100の薬物分子処理インタフェースを呼び出して、化合物ライブラリにおける候補薬物分子の活性情報および候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子から、GPCRの標的薬物分子を選別する。Gタンパク質共役受容体が生殖系症候群に対して一定の作用を有するため、薬剤研究開発者は、その後に、標的薬物分子から生殖系症候群に対して積極的な作用を有する薬物分子を迅速に得ることができる。
【0042】
以下は、本願実施例によって提供される薬物分子処理用の電子機器の構成を説明する。図4を参照すれば、図4は、本願実施例によって提供される薬物分子処理用の電子機器500の概略構成図であり、電子機器500がサーバであることを例にとって説明すれば、図4に示されるように、有機物サンプル処理用の電子機器500は、少なくとも1つのプロセッサ510、メモリ550、少なくとも1つのネットワークインタフェース520およびユーザインタフェース530を備える。電子機器500内の各構成要素は、バスシステム540を介して結合される。バスシステム540は、これらの構成要素間の接続通信を実現するために使用されることが理解される。データバスに加えて、バスシステム540はさらに、電源バス、制御バスおよびステータスシグナルバスを含む。ただし、説明を明確にするために、図4で、各種のバスをいずれもバスシステム540と表記する。
【0043】
プロセッサ510は、例えば、汎用プロセッサ、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)、または他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなど、信号処理の機能を有する集積回路チップであり得、ここで、汎用プロセッサは、マイクロプロセッサまたは任意の従来のプロセッサなどであり得る。
【0044】
メモリ550は、揮発性メモリ又は不揮発性メモリを含んでもよいし、揮発性及び不揮発性メモリの両方を含んでもよい。ここで、不揮発性メモリは、読み取り専用メモリ(ROM:Read Only Memory)であってもよく、揮発性メモリは、ランダムアクセスメモリ(RAM:Random Access Memory)であってもよい。本願実施例で説明されるメモリ550は、任意の適切なタイプのメモリを含むことを意図する。メモリ550は、物理的位置においてプロセッサ510から離れた1つ又は複数の記憶機器を含む。
【0045】
いくつかの実施例において、メモリ550は、様々な動作をサポートするためのデータを記憶することができ、これらのデータの例は、プログラム、モジュールおよびデータ構造またはそのサブセットまたはスーパーセットを含み、以下で例示的に説明する。
【0046】
オペレーティングシステム551は、フレームワーク層、コアライブラリ層、ドライバ層などの、様々な基本的なシステムサービスを処理し、ハードウェアに関するタスクを実行するためのシステムプログラムを含み、様々な基本的なサービスを実現し、ハードウェアベースのタスクを処理するために使用される。
【0047】
ネットワーク通信モジュール552は、1つ又は複数の(有線又は無線)ネットワークインタフェース520を経由して他のコンピュータ機器に到達するために使用され、例示的なネットワークインタフェース520は、Bluetooth(登録商標)技術、ワイヤレス・フィディリティ(Wi-Fi(登録商標))、及びユニバーサルシリアルバス(USB、Universal Serial Bus)などを含む。
【0048】
いくつかの実施例において、本願実施例によって提供される薬物分子処理装置は、ソフトウェア方式を採用して実現することができ、例えば、前述した端末における薬物分子処理プラグインであってもよく、前述したサーバにおける薬物分子処理サービスであってもよい。もちろん、これに限定されず、本願実施例によって提供される薬物分子処理装置は、アプリケーション、ソフトウェア、ソフトウェアモジュール、スクリプトまたはコードを含む様々な形態の様々なソフトウェアの実施例として提供されることができる。
【0049】
図4は、メモリ550内に記憶された薬物分子処理装置555を示し、それは、薬物分子処理プラグインなど、プログラムおよびプラグインなどの形態のソフトウェアであり、決定モジュール5551、予測モジュール5552、処理モジュール5553および選別モジュール5554を含む、一連のモジュールを含み、ここで、決定モジュール5551、予測モジュール5552、処理モジュール5553および選別モジュール5554は、本願実施例によって提供される薬物分子処理機能を実現するために使用される。
【0050】
上記のように、本願実施例によって提供される人工知能ベースの薬物分子処理方法は、様々なタイプの電子機器によって実施されることができる。図5を参照すれば、図5は、本願実施例によって提供される人工知能ベースの薬物分子処理方法のフローチャートであり、図5に示すステップと組み合わせて説明する。
【0051】
以下のステップにおいて、標的タンパク質とは、例えば、生殖系症候群に一定の作用を有するGタンパク質共役受容体GPR54/Kiss-1など、ある疾患に作用を有するか、または影響を与えるタンパク質を表す。
【0052】
ステップ101において、標的タンパク質の複数の候補薬物分子を決定する。
【0053】
候補薬物分子の取得の例として、ユーザが、端末の入力インタフェースを介して標的タンパク質(GPCRなど)および薬物選別を行うための化合物ライブラリ(ZINCライブラリなど)を入力して、標的タンパク質および化合物ライブラリを取得し、薬物分子の選別要求を自動的に生成して、サーバに送信し、サーバは、薬物分子の選別要求を解析して、標的タンパク質および化合物ライブラリを取得し、化合物ライブラリから標的タンパク質の複数の候補薬物分子を読み出して、後続に複数の候補薬物分子に基づいて選別処理を行い、標的タンパク質に作用を果たす標的薬物分子を得る。
【0054】
いくつかの実施例において、標的タンパク質の複数の候補薬物分子を決定するステップは、標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得るステップと、複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得るステップと、を含む。
【0055】
例えば、化合物ライブラリ中に大量の化合物が存在するため、大量のコンピューティング量を必要とし、したがって、標的タンパク質に基づいて化合物ライブラリ内の化合物を粗選別して、標的タンパク質に作用を有する可能性のある候補薬物分子を取得することにより、候補薬物分子の数を減らして、後続の薬物選別の効率を向上させることができる。
【0056】
いくつかの実施例において、標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得るステップは、標的タンパク質に基づいて化合物ライブラリ内の化合物に対してリピンスキーの法則に基づく選別処理を行い、リピンスキーの法則に合致する複数の化合物を得るステップと、リピンスキーの法則に合致する複数の化合物に対して重複除去処理を行い、複数の選別後の化合物を得るステップと、を含む。
【0057】
例えば、まず、標的タンパク質に基づいて化合物ライブラリ内の化合物に対してリピンスキーの法則に基づく選別処理を行い、リピンスキーの法則に合致する化合物、即ち、薬理学的活性または生物学的活性を有する化合物を得た後、リピンスキーの法則に合致する化合物を重複除去して、再び化合物の数を減らす。ここで、リピンスキーの法則は、化合物が薬物分子として機能できるか否かを評価するために使用され(すべての化合物が薬物分子として機能できるわけではない)、例えば、リピンスキーの法則は、250≦分子量≦750;-2≦化合物の油水分配係数の対数値≦7;水素結合受容体+水素結合ドナー<10;回転可能結合の数<10;トポロジー極性表面積<150である。
【0058】
いくつかの実施例において、複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得るステップは、標的基に基づいて複数の選別後の化合物に対して化学的フィルタリング処理を行い、複数のフィルタリング後の化合物を得るステップと、複数のフィルタリング後の化合物からキラル化合物の鏡像異性体を除去して、標的タンパク質の候補薬物分子を得るステップと、を含む。
【0059】
ここで、標的基(Target Group)は、例えば、毒性基(Toxicophore Groups)や活性基(Reactive Groups)を含む分子など、薬物化学的に不要な基を表し、即ち、選別後の化合物に標的基を含む化合物を除去することで、薬物化学的フィルタリングを行う。化合物ライブラリには、多くのキラル化合物の鏡像異性体が含まれており、これらのキラル化合物とその鏡像異性体は、分子量と分子構造が同じで、左右の配列が逆になっているため、即ち、作用が類似しているため、キラル化合物の鏡像異性体を除去して、候補薬物分子の数を減らし、後続の候補薬物分子のコンピューティング量を減らすことができる。
【0060】
ステップ102において、複数の候補薬物分子および標的タンパク質に基づいて活性予測処理を行い、各候補薬物分子の活性情報を得る。
【0061】
例えば、複数の候補薬物分子を得た後、各候補薬物分子および標的タンパク質に対して活性予測を行い、各候補薬物分子の活性スコア(活性情報)を得、活性スコアに基づいて、補薬物分子の活性を評価することにより、後続に活性情報に基づいて薬物選別を行うことができる。
【0062】
図6を参照すれば、図6は、本願実施例によって提供される人工知能ベースの薬物分子処理方法のフローチャートである。図6は、図5におけるステップ102が、ステップ1021~1024によって実現されることを示す。複数の候補薬物分子のうちの任意の1つの候補薬物分子に対して、次の処理を実行する:ステップ1021において、候補薬物分子の分子構造に対して符号化処理を行い、候補薬物分子の埋め込み特徴を得;ステップ1022において、標的タンパク質のタンパク質構造に対して符号化処理を行い、標的タンパク質の埋め込み特徴を得;ステップ1023において、候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得;ステップ1024において、活性融合特徴に対してマッピング処理を行い、候補薬物分子の活性情報を得る。
【0063】
例えば、図8に示されるように、予測ネットワークのエンコーダを介して、候補薬物分子の分子構造(分子図)を符号化して、候補薬物分子の埋め込み特徴を得、標的タンパク質のタンパク質構造(タンパク質配列)に対して符号化処理を行い、標的タンパク質の埋め込み特徴を得、次に、候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴を融合し、融合により得られた活性融合特徴をマッピングして、候補薬物分子の活性スコアを得る。それにより、人工知能技術により、候補薬物分子の活性を学習して、後続に正確な候補薬物分子の活性に基づいて選別処理を行うようにする。
【0064】
上記の例を引き継ぎ、候補薬物分子の分子構造に基づいて、候補薬物分子の分子図を構築し;候補薬物分子の分子図を画像エンコーダ(例えば、DMPNN)により画像符号化処理を行い、候補薬物分子の埋め込み特徴を得る。それにより、画像の符号化により、正確な候補薬物分子の埋め込み特徴を得る。
【0065】
上記の例を引き継ぎ、標的タンパク質のタンパク質構造に基づいて、標的タンパク質のタンパク質配列を決定し;標的タンパク質のタンパク質配列をテキスト変換器(例えば、Doc-to-Vector)により、テキスト変換形式の符号化処理を行って、標的タンパク質の埋め込み特徴を得る。それにより、テキスト符号化により、正確な標的タンパク質の埋め込み特徴を得る。
【0066】
上記の例を引き継ぎ、候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得るステップは、次の3つの方式を含む。
方式1.候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴に対いて加算処理を行い、加算処理の結果を活性融合特徴として使用する。
方式2.候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴に対して連結処理を行い、連結処理の結果を活性融合特徴として使用する。
方式3.候補薬物分子の埋め込み特徴および標的タンパク質の埋め込み特徴に対してマッピング処理を行い、候補薬物分子および標的タンパク質を含む中間特徴ベクトルを得、中間特徴ベクトルをアフィン変換して、活性融合特徴を得る。
【0067】
ここで、方式1および方式2の融合方式は簡単で、融合のコンピューティング量を節約でき、方式3の融合方式は正確で、正確な融合を行って、正確な活性融合特徴を得て、後続に正確な活性予測を行うことができる。
【0068】
上記の例を引き継ぎ、活性融合特徴に対してマッピング処理を行い、候補薬物分子の活性情報を得るステップは、活性融合特徴を隠れベクトル空間にマッピングして、活性融合特徴の隠れベクトルを得るステップと、活性融合特徴の隠れベクトルに対して非線形マッピング処理を行い、得られた候補薬物分子の活性スコアを候補薬物分子の活性情報として使用するステップと、を含む。
【0069】
例えば、予測ネットワークにおける全接続層(Fully-Connected Layer)により、活性融合特徴を隠れベクトル空間にマッピングして、活性融合特徴の隠れベクトルを得、次に、予測ネットワークにおける活性層により、活性融合特徴の隠れベクトルに対して非線形マッピング処理を行い、得られた候補薬物分子の活性スコア(活性スコアリング)を候補薬物分子の活性情報として使用する。
【0070】
ステップ103において、標的タンパク質に対してホモロジーモデリング処理を行い、標的タンパク質と相同構造を有する参照タンパク質を得る。
【0071】
本願実施例における標的タンパク質(GPR54タンパク質など)の結晶構造の情報は、予測不可能な情報であり、標的タンパク質に基づいて分子ドッキング処理を行うことは不可能であるため、ホモロジーモデリングの方法を用いて、標的タンパク質と相同構造を有する参照タンパク質、即ち、標的タンパク質と相同構造を有するタンパク質の配列情報を確立する必要がある。
【0072】
いくつかの実施例において、標的タンパク質に対してホモロジーモデリング処理を行い、標的タンパク質と相同構造を有する参照タンパク質を得るステップは、タンパク質プールのうちの任意の1つの候補タンパク質について、候補タンパク質の配列と標的タンパク質の配列とに対して類似度処理を行い、候補タンパク質と標的タンパク質との類似度を得、類似度が類似度閾値より大きい場合、候補タンパク質の3次元構造に基づいて構造最適化処理を行い、標的タンパク質と相同構造を有する参照タンパク質を得る、処理を実行する、ステップを含む。
【0073】
例えば、2つのタンパク質の配列が類似している場合、2つのタンパク質の構造は類似している。即ち、相同関係(相同構造)を有する2つのタンパク質配列は、類似した構造を有する。まず、タンパク質ライブラリ(複数の候補タンパク質を含む)のうちのいずれか1つのタンパク質(既知構造のタンパク質)を候補タンパク質(テンプレートタンパク質)とし、候補タンパク質の配列と標的タンパク質の配列とを照合して、候補タンパク質と標的タンパク質との類似度を得る。類似度が類似度閾値より大きい場合、候補タンパク質の3次元構造に基づいて構造最適化を行い、即ち、候補タンパク質をプロトタイプとして使用して、標的タンパク質の主鎖構造モデルを構築し、候補タンパク質と標的タンパク質との対比中に空きの領域が形成され、ループモデリングにより完全な主鎖構造モデルを得、モデルの側鎖を構築して最適化することにより、構造モデル全体の最適化を実現し、それにより、標的タンパク質と相同構造を有する参照タンパク質の配列を得る。
【0074】
ステップ104において、参照タンパク質および複数の候補薬物分子に基づいて分子ドッキング処理を行い、各候補薬物分子の分子ドッキング情報を得る。
【0075】
参照タンパク質の構造を取得した後、参照タンパク質および各候補薬物分子に基づいて分子ドッキング処理を行い、各候補薬物分子と参照タンパク質との分子ドッキングスコアを取得し、候補薬物分子と参照タンパク質との分子ドッキングスコアを、候補薬物分子の分子ドッキング情報として使用し、分子ドッキング情報に基づいて候補薬物分子の結合抑制作用を評価することにより、後続に分子ドッキング情報に基づいて正確な薬物選別を実行することができる。
【0076】
図7を参照すれば、図7は、本願実施例によって提供される人工知能ベースの薬物分子処理方法のフローチャートであり、図7は、図5におけるステップ104が、ステップ1041~1043によって実現されることを示す。ステップ1041において、参照タンパク質に基づいて分子動力学シミュレーション処理を行い、参照タンパク質の活性部位および結合ポケットを得;ステップ1042において、複数の候補薬物分子をそれぞれ前処理して、各候補薬物分子の分子配座を得;ステップ1043において、各候補薬物分子の分子配座について、参照タンパク質の活性部位、結合ポケットおよび候補薬物分子の分子配座に基づいて分子ドッキングスコアリングを実行して、分子ドッキングスコアリングの結果を候補薬物分子の分子ドッキング情報として使用する。
【0077】
例えば、分子動力学により、リガンド結合のない参照タンパク質構造をシミュレーションし、参照タンパク質を二重膜構造(POPE)に挿入し、シミュレーション空間に水分子を充填し、0.15M濃度の塩イオン(NaCl)を加え、300Kの温度下で、定圧系で100ns時間を超えるシミュレーションを実行する。上記のシミュレーション系における最後の80ns時間のシミュレーション軌跡の参照タンパク質をクラスタリングし、最後のクラスタリング中心構造を分子ドッキングの受容体構造(活性部位)として使用する。FTMap方法(即ち、分子ドッキング方法)を用いて、一連の化学基または分子(例えば、ベンゼン、イソブチルアルコール、尿酸、エタノールなど)をポケット領域にドッキングすることにより、複数種の化学分子が集積された領域を取得することができ、即ち、次のステップにおける分子ドッキングのポケット領域(結合ポケット)が構成される。
【0078】
上記の例を引き継ぎ、複数の候補薬物分子をそれぞれ前処理するステップは、複数の候補薬物分子のそれぞれに対してフォーマット変換処理を行い、各候補薬物分子の変換フォーマットを得るステップと、各候補薬物分子の変換フォーマットに基づいて、各候補薬物分子の3次元配座を構築するステップと、各候補薬物分子の3次元配座に基づいて、各候補薬物分子の水素原子付加可能位置を決定するステップと、水素原子付加可能位置に水素原子を付加して、候補薬物分子の分子配座を得るステップと、を含む。
【0079】
例えば、候補薬物分子をSMILESフォーマットからPDB、MOL2、PDBQT、SDF formatsなどのフォーマットに変換し;候補薬物分子の変換フォーマットに基づいて候補薬物分子の3次元配座を構築し;候補薬物分子の水素原子付加可能位置(アルカリ性の位置)を決定し、水素原子付加可能位置に水素原子を付加する。
【0080】
ステップ105において、各候補薬物分子の活性情報および各候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子に対して選別処理を行い、標的タンパク質の標的薬物分子を得る。
【0081】
例えば、各候補薬物分子の活性情報および各候補薬物分子の分子ドッキング情報を得た後、各候補薬物分子の活性情報および分子ドッキング情報に基づいて薬物選別を行い、標的薬物分子を得、それにより、標的薬物分子の活性と結合抑制性を確保し、後続の薬物分子の研究および分子に参照データを提供して、薬物の研究周期を短縮する。
【0082】
いくつかの実施例において、各候補薬物分子の活性情報および各候補薬物分子の分子ドッキング情報に基づいて、複数の候補薬物分子に対して選別処理を行い、標的タンパク質の標的薬物分子を得るステップは、複数の候補薬物分子に対してクラスタリング処理を行い、複数の薬物カテゴリ集合を得るステップと、複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を標的薬物分子として選別するステップと、を含む。
【0083】
例えば、候補薬物分子をクラスタリングして、複数の薬物カテゴリ集合(クラスタ)を得、複数の薬物カテゴリ集合に基づいて選別処理を行い、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を標的薬物分子として得る。クラスタリング処理により、構造的に多様なフレームワークを持つ薬物分子が得られ、それにより、標的薬物分子の多様性が向上する。
【0084】
上記の例を引き継ぎ、各薬物カテゴリ集合のうち、活性情報が最も高い、または分子ドッキング情報が最も高い候補薬物分子を標的薬物分子として選択することができる。
【0085】
いくつかの実施例において、複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を標的薬物分子として選別するステップは、複数の薬物カテゴリ集合のうちの任意の1つの薬物カテゴリ集合について、薬物カテゴリ集合のうちの最も高い活性情報を有する候補薬物分子を選別対象の薬物分子とし;選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性に対して加重加算処理を行い、選別対象の薬物分子の総合薬物情報を得;複数の選別対象の薬物分子の総合薬物情報に基づいて、複数の選別対象の薬物分子を降順に並べ、ランキングが上位にある選別対象の薬物分子の一部を標的薬物分子として使用する、処理を実行する、ステップを含む。
【0086】
例えば、各薬物カテゴリ集合から、最も高い活性情報を有する候補薬物分子を選別対象の薬物分子として選択し、選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性(溶解度、血液脳関門透過性、毒性などを含む)を決定し、活性情報の重み、分子ドッキング情報の重みおよび薬物特性の重みを決定し、活性情報の重み、分子ドッキング情報の重みおよび薬物特性の重みに基づいて、選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性に対して加重加算を行い、選別対象の薬物分子の総合薬物情報を得、複数の選別対象の薬物分子の総合薬物情報に基づいて、複数の選別対象の薬物分子を降順に並べ、ランキングが上位にある選別対象の薬物分子の一部を標的薬物分子として使用し、それにより、多くの候補薬物分子から、活性が強く、結合抑制能力が強く、安全な標的薬物分子を選別して、後続の薬物分子の研究および分子に参照データを提供して、薬物の研究周期を短縮する。
【0087】
以下、実際の医療適用シナリオにおける本願実施例の適用例を説明する。
【0088】
本願実施例は、様々な薬物分子選別の適用シナリオに適用することができ、以下は、多嚢胞性卵巣症候群(PCOS、Polycystic Ovarian Syndrome)に対する薬物分子選別を例に取って説明する。
【0089】
関連技術の薬物設計手段は、大量の人的資源と物質資源をかけて試行錯誤を重ね、非効率的で、周期が長いだけでなく、正確性も低い。同時に、この過程で、薬物分子の安全性と物理化学的特性、および生体内代謝の安定性を確保するために、血液脳関門の通過率およびその他のADMET特性を絶えずにテストする必要がある。
【0090】
上記の問題を解決するために、本願実施例は、多嚢胞性卵巣症候群のための人工知能ベースの薬物仮想選別方法(即ち、人工知能ベースの薬物分子処理方法)を提供し、人工知能の方法を採用して、GPR54(標的タンパク質)に対して抑制作用を有する潜在的な50個の小分子薬物(標的薬物分子)を選別し、即ち、人工知能の手法によって、多嚢胞性卵巣症候群に対して抑制作用を有する薬物分子を選別して、多嚢胞性卵巣症候群を治療するヒット化合物の開発に関する後期の研究に参考データを提供し、それにより、大量の人的資源と物質資源をかけて試行錯誤を重ねることなく、分子選別の効率を向上させることができる。
【0091】
本願実施例は、まず、GPR54ターゲット用のアミノ酸配列の情報を分析することにより、ホモロジーモデリングの方式を用いて、小分子の活性をさらに評価するために使用されるdockingモデルを確立する。人工知能のアルゴリズムモデルを用いて、すべてのGPCRターゲット用の小分子を学習して、ZINC分子ライブラリに対して活性予測スコアリングをうまく行い、ADMETモデルを用いて、各小分子の特性を予測し、それにより、分子活性を可能な限り確保しつつ、分子のADMET特性に応じた選別を行うことができるようにする。
【0092】
ここで、多嚢胞性卵巣症候群のための人工知能ベースの薬物仮想選別方法は、8つの部分(選別対象の化合物ライブラリの選択、化合物ライブラリの前処理、深層学習ベースの化合物活性スコアリング、分子ドッキングモデルの確立、分子ドッキングのスコアリング、後処理の選別、化合物のADMET特性の予測、最終的な化合物の選別)を含み、以下に示すように、多嚢胞性卵巣症候群のための人工知能ベースの薬物仮想選別方法の処理プロセスを具体的に説明する。
【0093】
1)選別対象の化合物ライブラリの選択
分子仮想選別の時間と精度を考慮して、ここで、ZINCライブラリにおけるin-vitro活性を持つサブライブラリが選択され、合計276003個の小分子が含まれている。
【0094】
2)化合物ライブラリの前処理
まず、選択した化合物ライブラリを前処理し、主に、次の処理が含まれる。
1.リピンスキーの法則(Lipinski’s Rule of Five:化合物が薬物として使用できるかどうか、または1つの薬理学的活性または生物学的活性を有する化合物が、経口薬物になることができるかどうかを評価する経験則である)に基づく選別であって、具体的な選別条件は、次の通りである:250≦分子量(MW:Molecule Weight)≦750;-2≦化合物の油水分配係数の対数値(clogP)≦7;水素結合受容体(HBA)+水素結合ドナー(HBD)<10;回転可能結合の数(Num of Rotatable Bonds)<10;トポロジー極性表面積(TPSA)<150。
2.重複除去であって、リピンスキーの法則による選別後の分子には、分子構造が同じ分子が存在する可能性があり、選別後の分子の構造が異なることを確保するように、分子構造が同じ分子を除去する。
3.薬物化学フィルタ(MCF、Medicinal Chemistry Filter):薬物化学的に不要な基(標的基、例えば、毒性基(Toxicophore)と活性基(Reactive Groups)など)を含む分子を除去する。
4.存在可能なキラル化合物の鏡像異性体の除去(SMILES構造を1つだけ残す):化合物ライブラリにキラル化合物(分子量と分子構造が同じで、左右の配列が逆になっている化合物)の鏡像異性体(キラル関係を構成する分子間で、一方を他方の鏡像異性体と称する)が多く含まれているため、この処理により大部分の小分子を除去することができる。
【0095】
ここで、化合物ライブラリに対して、リピンスキーの法則に基づく選別を行った後、260300個の分子が得られ;重複除去処理により、160455個の重複のない小分子が得られ;薬物化学のフィルタと鏡像異性体の除去により、18907個の分子が得られる。
【0096】
3)深層学習ベースの化合物活性スコアリング(DL活性スコアリング)
図9に示されるように、既知のすべてのGPCRタンパク質の配列と、GPCRと結合活性を有する既知の小分子(候補薬物分子)のSMILESとを入力とし、GPCRタンパク質の配列に基づいて、テキスト変換器(例えば、Doc-to-Vector)を介して、タンパク質の埋め込み特徴を得、GPCRと結合活性を有する小分子に基づいて、画像エンコーダ(例えば、DMPNN)を介して、小分子の埋め込み特徴を得た後、全接続層を介して、小分子の埋め込み特徴およびタンパク質の埋め込み特徴に基づいて、小分子とGPCRタンパク質の結合強度を予測し、図9に示すようなモデルを使用して、上記で選択された18907個の分子に対して深層学習に基づく活性予測を実行して、この18907個の分子にそれぞれ対応する活性スコア(IC50値の負の対数pIC50で表す)を得る。
【0097】
4)分子ドッキング(docking)モデルの確立
A)GPR54のホモロジーモデリング
本願実施例のGPR54タンパク質の結晶構造は予測不可能な情報であるため、ホモロジーモデリングの方法を使用してモデルを確立する必要がある。ここで、ホモロジーモデリングによって得られた構造は、7TMの類似構造を含む。
B)活性アミノ酸(活性部位)とポケット検出
ほとんどのGPCRタンパク質は、いずれも結合ポケット(活性部位を含む)を多く含んでいるが、ここでは、7TMヘリックス(helices)に位置する結合位置を選択する。
【0098】
本願実施例のリガンドの活性部位または結合ポケットの正確な位置は、予測不可能な情報であるため、分子動力学(MD:Molecular Dynamics)シミュレーション(MDシミュレーションは、物理数学と化学を結合した複合分子シミュレーション方法)を用いて、小分子結合位置およびどの活性アミノ酸が結合ポケットを構成する可能性があるかを予測および確認する必要がある。分子動力学により、リガンド結合のないタンパク質構造をシミュレーションし、タンパク質を二重膜構造(POPE)に挿入し、シミュレーション空間に水分子を充填し、0.15M濃度の塩イオン(NaCl)を加え、300Kの温度下で、定圧系で100ns時間を超えるシミュレーションを実行する。上記のシミュレーション系における最後の80ns時間のシミュレーション軌跡のタンパク質構造をクラスタリングし、最後のクラスタリング中心構造を分子ドッキングの受容体構造として使用する。FTMap方法(即ち、分子ドッキング方法)を用いて、一連の化学基または分子(例えば、ベンゼン、イソブチルアルコール、尿酸、エタノールなど)をポケット領域にドッキングすることにより、複数種の化学分子が集積された領域を取得することができ、即ち、次のステップにおける分子ドッキングのポケット領域が構成される。
【0099】
5)分子ドッキング(docking)スコアリング
dockingソフトウェア(AutoDock Vinaなど)用の入力ファイルを用意し、その過程で化合物ライブラリの各分子の正しい分子配座を決定する必要がある。ここで、原子電荷および水素結合作用は、仮想選別の成功にとって非常に重要である。水素結合作用は、小分子とタンパク質の結合能力を顕著に増加させることができるため、プロトン化した水素原子とタンパク質上の特定位置の原子との結合という、プロトン化した状態が存在するかどうかが非常に重要である。次は、化合物ライブラリ内の分子の処理手順を以下に示す。
a.小分子をSMILESフォーマットからPDB、MOL2、PDBQT、SDF formatsなどの変換フォーマットに変換し;
b.小分子の変換フォーマットに基づいて、小分子の3次元配座を生成し;
c.小分子の3次元配座に基づいて、小分子の水素原子付加可能位置(アルカリ性の位置)を決定し、水素原子付加可能位置に水素原子を付加し;
d.水素原子を付加した後の小分子の電荷数を算出し;
e.電荷数に基づいて、小分子の正しいタイプを決定する。
【0100】
なお、前述した各ステップは、dockingソフトウェア(AutoDock Vinaなど)が提供する対応するネイティブ機能モジュールによって実現される。
【0101】
ここで、処理された小分子を、ホモロジーモデリングにより得られた構造と結合して、エネルギー削減値を決定し、削減値が大きいほど、分子ドッキングスコアが高く、結合が強いことを示す。
【0102】
6)後処理の選別
2つのモデルによってスコアリングされた分子に対してクラスタリング(Clustering)を実行する。構造的に多様なフレームワークを持つ分子を得るために、上記の1.8万個の小分子をclusteringして、合計6446個のクラスタ(Cluster)を得た後、6446個のクラスタからDL活性スコアの最も高い分子をそれぞれ選択した。
【0103】
ここで、クラスタリングは、類似度(Tanimoto Similarity)に基づくクラスタリングであり、分子の多様性を高め、類似した分子を減少させることを目的とする。分子間の類似度が0.6より大きい分子がクラスタリングされるように、類似度の閾値を設定する。
【0104】
7)化合物のADMET特性(薬物の吸収、分配、代謝、排泄と毒性)の予測
ここで、薬物分子のいくつかの重要な基本特性が選択され、血液脳関門通過率(BBBP)に加えて、動力学溶解度(S、体内環境での薬物分子の溶解性を評価する)および毒性が選択される。これまで、上記で得られた18907個の化合物に対して、DL活性スコア、dockingスコア、溶解度(Solubility)、血液脳関門透過性(BBBP)、毒性(Toxicity)の5つのラベルを付けた。後続の化合物の選択は、主にこれら5つのラベルを参考にして化合物を総合的に選択する。
【0105】
8)最終化合物の選別
後処理の選別により得られた6446個分子を、DL活性スコア(pIC50)にしたがって、降順にランク付けした後、溶解度、血液脳関門透過性、毒性、およびdockingスコアを参考にして、50個の化合物を含む、図10A図10Bに示されるような潜在活性分子(標的薬物分子)を選択した。ここでの特性の参考は次のとおりである:-4.5より大きい溶解度log(S,mol/L)が選択され、確率値が0.5未満のBBBPが選択され、有意な予測毒性が見られないこと。
【0106】
要約すると、本願実施例に係る多嚢胞性卵巣症候群のための人工知能ベースの薬物仮想選別方法によれば、多嚢胞性卵巣症候群のような発病率の高い慢性疾患に対して、人工知能のアルゴリズムを用いて、抑制活性を有する潜在的な50個の薬物分子を選別し、化学構造の多様性を広げ、後続に、この疾患に対する更なる開発に後続のヒット化合物を提供することができる。
【0107】
これまで、本願実施例によって提供されるサーバの適用例と実施を参照して、本願実施例によって提供される人工知能ベースの薬物分子処理方法を説明した。本願実施例はさらに、薬物分子処理装置を提供する。実際の適用において、薬物分子処理装置における各機能モジュールは、プロセッサなどのコンピューティングリソース、通信リソース(例えば、光ケーブル、セルラなどの様々な方式を実現するための通信をサポートする)、メモリなど、電子機器(端末機器、サーバまたはサーバクラスタなど)のハードウェアリソースによって協働して実現することができる。図4は、メモリ550に記憶された薬物分子処理装置555を示し、例えば、ソフトウェアC/C++、Javaなどのプログラミング言語で設計されたソフトウェアモジュール、C/C++、Javaなどのプログラミング言語で設計されたアプリケーションソフトウェアまたは大規模なソフトウェアシステムにおける専用ソフトウェアモジュール、アプリケーションインタフェース、プラグイン、クラウドサービスなど、プログラムとプラグインなどの形態のソフトウェアの実装形態であり得る。次に、異なる実装形態について例を示して説明する。
【0108】
例1において、薬物分子処理装置がモバイル端末のアプリケーションおよびモジュールである。
【0109】
本願実施例における薬物分子処理装置555は、ソフトウェアC/C++、Javaなどのプログラミング言語で設計されたソフトウェアモジュールとして提供されることができ、AndroidまたはiOSなどのシステムベースの様々なモバイル端末のアプリケーションに埋め込み(実行可能な命令の形態でモバイル端末の記憶媒体に記憶され、モバイル端末のプロセッサによって実行される)、それにより、モバイル端末自体のコンピューティングリソースを直接用いて、関連する薬物分子の選別タスクを完了し、さらに、様々なネットワーク通信方式で処理結果を定期的または不定期的に遠隔のサーバに送信したり、モバイル端末でローカルに保存したりすることができる。
【0110】
例2において、薬物分子処理装置がサーバのアプリケーションおよびプラットフォームである。
【0111】
本願実施例における薬物分子処理装置555は、C/C++、Javaなどのプログラミング言語で設計されたアプリケーションソフトウェアまたは大規模なソフトウェアシステムにおける専用ソフトウェアモジュールとして提供されることができ、サーバ側で実行され(実行可能な命令の形態でサーバ側の記憶媒体に記憶され、サーバ側のプロセッサによって実行される)、サーバは、自体のコンピューティングリソースを使用して関連する薬物分子の選別タスクを完了する。
【0112】
本願実施例はさらに、複数台のサーバによって構成された分散式、並列コンピューティングプラットフォーム上に提供されることができ、カスタマイズされたインタラクティブなネットワーク(Web)インタフェースまたは他の各ユーザインタフェース(UI:User Interface)に搭載して、個人、団体または組織で使用するための薬物分子プラットフォーム(薬物分子選別用)などを形成することができる。
【0113】
例3において、薬物分子処理装置がサーバ側のアプリケーションインタフェース(API:Application Program Interface)およびプラグインである。
【0114】
本願実施例における薬物分子処理装置555は、本願実施例における人工知能ベースの薬物分子処理方法を実行するよう、ユーザによって呼び出される、サーバ側のAPIまたはプラグインとして提供されることができ、様々なアプリケーションに埋め込む。
【0115】
例4において、薬物分子処理装置がモバイルデバイスクライアントのAPIおよびプラグインである。
【0116】
本願実施例における薬物分子処理装置555は、本願実施例における人工知能ベースの薬物分子処理方法を実行するよう、ユーザによって呼び出される、モバイルデバイス側のAPIまたはプラグインとして提供されることができる。
【0117】
例5において、薬物分子処理装置がクラウドオープンサービスである。
【0118】
本願実施例における薬物分子処理装置555は、個人、団体または組織が標的薬物分子を獲得できるよう、ユーザに向けて開発された薬物分子処理のクラウドサービスとして提供されることができる。
【0119】
ここで、薬物分子処理装置555は、決定モジュール5551と、予測モジュール5552と、処理モジュール5553および選別モジュール5554と、を含む、一連のモジュールを備える。以下は、本願実施例によって提供される薬物分子処理装置555内の各モジュールが協働的に薬物分子処理案を実現することを説明し続ける。
【0120】
決定モジュール5551は、標的タンパク質の複数の候補薬物分子を決定するように構成され;予測モジュール5552は、前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るように構成され;処理モジュール5553は、前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得、前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るように構成され;選別モジュール5554は、各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るように構成される。
【0121】
いくつかの実施例において、前記決定モジュール5551はさらに、前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得、前記複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得るように構成される。
【0122】
いくつかの実施例において、前記決定モジュール5551はさらに、前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対してリピンスキーの法則に基づく選別処理を行い、リピンスキーの法則に合致する複数の化合物を得、前記リピンスキーの法則に合致する複数の化合物に対して重複除去処理を行い、複数の選別後の化合物を得るように構成される。
【0123】
いくつかの実施例において、前記決定モジュール5551はさらに、標的基に基づいて前記複数の選別後の化合物に対して化学的フィルタリング処理を行い、複数のフィルタリング後の化合物を得、前記複数のフィルタリング後の化合物からキラル化合物の鏡像異性体を除去して、標的タンパク質の候補薬物分子を得るように構成される。
【0124】
いくつかの実施例において、前記予測モジュール5552はさらに、前記複数の候補薬物分子のうちの任意の1つの候補薬物分子について、前記候補薬物分子の分子構造に対して符号化処理を行い、前記候補薬物分子の埋め込み特徴を得;前記標的タンパク質のタンパク質構造に対して符号化処理を行い、前記標的タンパク質の埋め込み特徴を得;前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得;前記活性融合特徴に対してマッピング処理を行い、前記候補薬物分子の活性情報を得る、処理を実行するように構成される。
【0125】
いくつかの実施例において、前記予測モジュール5552はさらに、前記候補薬物分子の分子構造に基づいて、前記候補薬物分子の分子図を決定し;前記候補薬物分子の分子図に対して画像符号化処理を行い、前記候補薬物分子の埋め込み特徴を得るように構成される。
【0126】
いくつかの実施例において、前記予測モジュール5552はさらに、前記標的タンパク質のタンパク質構造に基づいて、前記標的タンパク質のタンパク質配列を決定し;前記標的タンパク質のタンパク質配列に対してテキスト変換処理を行い、前記標的タンパク質の埋め込み特徴を得るように構成される。
【0127】
いくつかの実施例において、前記予測モジュール5552はさらに、前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して加算処理を行い、前記活性融合特徴を得るように構成され;または、前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して連結処理を行い、前記活性融合特徴を得るように構成される。
【0128】
いくつかの実施例において、前記予測モジュール5552はさらに、前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対してマッピング処理を行い、前記候補薬物分子および前記標的タンパク質を含む中間特徴ベクトルを得;前記中間特徴ベクトルに対してアフィン変換を行い、前記活性融合特徴を得るように構成される。
【0129】
いくつかの実施例において、前記予測モジュール5552はさらに、前記活性融合特徴を隠れベクトル空間にマッピングして、前記活性融合特徴の隠れベクトルを得;前記活性融合特徴の隠れベクトルに対して非線形マッピング処理を行い、得られた前記候補薬物分子の活性スコアを前記候補薬物分子の活性情報として使用するように構成される。
【0130】
いくつかの実施例において、前記処理モジュール5553はさらに、タンパク質プールのうちの任意の1つの候補タンパク質について、前記候補タンパク質の配列と前記標的タンパク質の配列とに対して類似度処理を行い、前記候補タンパク質と前記標的タンパク質との類似度を得;前記類似度が類似度閾値より大きい場合、前記候補タンパク質の3次元構造に基づいて構造最適化処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得る、処理を実行するように構成される。
【0131】
いくつかの実施例において、前記処理モジュール5553はさらに、前記参照タンパク質に基づいて分子動力学シミュレーション処理を行い、前記参照タンパク質の活性部位および結合ポケットを得;前記複数の候補薬物分子をそれぞれ前処理して、各前記候補薬物分子の分子配座を得;各前記候補薬物分子の分子配座について、前記参照タンパク質の活性部位、前記結合ポケットおよび前記候補薬物分子の分子配座に基づいて分子ドッキングスコアリングを実行して、前記分子ドッキングスコアリングの結果を前記候補薬物分子の分子ドッキング情報として使用する、処理を実行するように構成される。
【0132】
いくつかの実施例において、前記処理モジュール5553はさらに、前記複数の候補薬物分子のそれぞれに対してフォーマット変換処理を行い、各前記候補薬物分子の変換フォーマットを得;各前記候補薬物分子の変換フォーマットに基づいて、各前記候補薬物分子の3次元配座を構築し、各前記候補薬物分子の3次元配座に基づいて、各前記候補薬物分子における水素原子付加可能位置を決定し、前記水素原子付加可能位置に水素原子を付加して、前記候補薬物分子の分子配座を得るように構成される。
【0133】
いくつかの実施例において、前記選別モジュール5554はさらに、前記複数の候補薬物分子に対してクラスタリング処理を行い、複数の薬物カテゴリ集合を得;前記複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を前記標的薬物分子として選別するように構成される。
【0134】
いくつかの実施例において、前記選別モジュール5554はさらに、前記複数の薬物カテゴリ集合のうちの任意の1つの薬物カテゴリ集合について、前記薬物カテゴリ集合の中で最も高い活性情報を有する候補薬物分子を選別対象の薬物分子として使用し;前記選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性に対して加重加算処理を行い、前記選別対象の薬物分子の総合薬物情報を得;複数の前記選別対象の薬物分子の総合薬物情報に基づいて、複数の前記選別対象の薬物分子を降順に並べ、ランキングが上位にある前記選別対象の薬物分子の一部を前記標的薬物分子として使用する、処理を実行するように構成される。
【0135】
本願実施例は、コンピュータ可読記憶媒体に格納されたコンピュータ命令を含む、コンピュータプログラム製品またはコンピュータプログラムを提供する。コンピュータ機器のプロセッサは、コンピュータ可読記憶媒体から当該コンピュータ命令を読み取り、プロセッサは、当該コンピュータ命令を実行することにより、当該コンピュータ機器に、本願実施例に記載の人工知能ベースの薬物分子処理方法を実行させる。
【0136】
本願実施例は、実行可能な命令が格納されたコンピュータ可読記憶媒体を提供し、実行可能な命令がプロセッサによって実行されるとき、プロセッサに、例えば、図5図7に示された人工知能ベースの薬物分子処理方法など、本願実施例によって提供される人工知能ベースの薬物分子処理方法を実行させる。
【0137】
いくつかの実施例において、コンピュータ可読記憶媒体は、FRAM(登録商標)、ROM、PROM、EPROM、EEPROM、フラッシュメモリ、磁気表面メモリ、光ディスク、又はCD-ROMなどのメモリであってもよいし、上記のメモリのうちの1つを含むか、任意に組み合わされた様々な機器であってもよい。
【0138】
いくつかの実施例において、実行可能な命令は、プログラム、ソフトウェア、ソフトウェアモジュール、スクリプトまたはコードの形を採用し、任意の形のプログラミング言語(コンパイル又は解析された言語、あるいは宣言型言語又は手続き型言語を含む)で記述され、独立したプログラムとして展開されるか又はモジュール、コンポーネント、サブルーチン又はコンピューティング環境での使用に適した他のユニットとして展開されるなど、任意の形で展開されてもよい。
【0139】
一例として、実行可能な命令は、ファイルシステム内のファイルに対応してもよいが必ずしもそうではなく、他のプログラム又はデータを保存するファイルの一部に記憶されることができ、例えば、ハイパーテキストマークアップ言語(HTML:Hyper Text Markup Language)ファイル内の1つ又は複数のスクリプトに記憶され、議論中のプログラムの単一のファイルに記憶されるか、又は、複数の共同ファイル(例えば、1つ又は複数のモジュール、サブプログラム又はコード部分を記憶するファイル)に記憶されてもよい。
【0140】
一例として、実行可能な命令は、1つのコンピュータ機器で実行されるように展開されてもよいし、同じ場所にある複数のコンピュータ機器で実行されるように展開されてもよいし、複数の場所に分散し且つ通信ネットワークによって相互接続された複数のコンピュータ機器で実行されるように展開されてもよい。
【0141】
上記は、本願実施例に過ぎず、本願の保護範囲を限定することを意図するものではない。本願の趣旨及び範囲内で行われるあらゆる修正、同等の置換、改善などは、すべて本願の保護範囲に含まれる。
【符号の説明】
【0142】
10 医薬品システム
100 サーバ
200 端末
300 ネットワーク
500 電子機器
510 プロセッサ
520 ネットワークインタフェース
530 ユーザインタフェース
540 バスシステム
550 メモリ
551 オペレーティングシステム
552 ネットワーク通信モジュール
555 薬物分子処理装置
5551 決定モジュール
5552 予測モジュール
5553 処理モジュール
5554 選別モジュール
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10A
図10B
【手続補正書】
【提出日】2023-05-10
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
電子機器によって実行される、人工知能ベースの薬物分子処理方法であって、
標的タンパク質の複数の候補薬物分子を決定するステップと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るステップと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得るステップと、
前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るステップと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るステップと、を含む、
人工知能ベースの薬物分子処理方法。
【請求項2】
標的タンパク質の複数の候補薬物分子を決定する前記ステップは、
前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得るステップと、
前記複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得るステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項3】
前記標的タンパク質に基づいて化合物ライブラリ内の化合物に対して選別処理を行い、複数の選別後の化合物を得る前記ステップは、
前記標的タンパク質に基づいて、化合物ライブラリ内の化合物に対してリピンスキーの法則に基づく選別処理を行い、リピンスキーの法則に合致する複数の化合物を得るステップと、
前記リピンスキーの法則に合致する複数の化合物に対して重複除去処理を行い、複数の選別後の化合物を得るステップと、を含む、
請求項2に記載の人工知能ベースの薬物分子処理方法。
【請求項4】
前記複数の選別後の化合物に対して前処理を行い、標的タンパク質の候補薬物分子を得る前記ステップは、
標的基に基づいて前記複数の選別後の化合物に対して化学的フィルタリング処理を行い、複数のフィルタリング後の化合物を得るステップと、
前記複数のフィルタリング後の化合物からキラル化合物の鏡像異性体を除去して、標的タンパク質の候補薬物分子を得るステップと、を含む、
請求項2に記載の人工知能ベースの薬物分子処理方法。
【請求項5】
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得る前記ステップは、
前記複数の候補薬物分子のうちの任意の1つの候補薬物分子について、
前記候補薬物分子の分子構造に対して符号化処理を行い、前記候補薬物分子の埋め込み特徴を得、
前記標的タンパク質のタンパク質構造に対して符号化処理を行い、前記標的タンパク質の埋め込み特徴を得、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得、
前記活性融合特徴に対してマッピング処理を行い、前記候補薬物分子の活性情報を得る、処理を実行するステップを含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項6】
前記候補薬物分子の分子構造に対して符号化処理を行い、前記候補薬物分子の埋め込み特徴を得る前記ステップは、
前記候補薬物分子の分子構造に基づいて、前記候補薬物分子の分子図を決定するステップと、
前記候補薬物分子の分子図に対して画像符号化処理を行い、前記候補薬物分子の埋め込み特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項7】
前記標的タンパク質のタンパク質構造に対して符号化処理を行い、前記標的タンパク質の埋め込み特徴を得る前記ステップは、
前記標的タンパク質のタンパク質構造に基づいて、前記標的タンパク質のタンパク質配列を決定するステップと、
前記標的タンパク質のタンパク質配列に対してテキスト変換処理を行い、前記標的タンパク質の埋め込み特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項8】
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得る前記ステップは、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して加算処理を行い、前記活性融合特徴を得るステップ、または、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して連結処理を行い、前記活性融合特徴を得るステップ、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項9】
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対して融合処理を行い、活性融合特徴を得る前記ステップは、
前記候補薬物分子の埋め込み特徴および前記標的タンパク質の埋め込み特徴に対してマッピング処理を行い、前記候補薬物分子および前記標的タンパク質を含む中間特徴ベクトルを得るステップと、
前記中間特徴ベクトルに対してアフィン変換処理を行い、前記活性融合特徴を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項10】
前記活性融合特徴に対してマッピング処理を行い、前記候補薬物分子の活性情報を得る前記ステップは、
前記活性融合特徴を隠れベクトル空間にマッピングして、前記活性融合特徴の隠れベクトルを得るステップと、
前記活性融合特徴の隠れベクトルに対して非線形マッピング処理を行い、前記候補薬物分子の活性情報を得るステップと、を含む、
請求項5に記載の人工知能ベースの薬物分子処理方法。
【請求項11】
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得る前記ステップは、
タンパク質プールのうちの任意の1つの候補タンパク質について、
前記候補タンパク質の配列と前記標的タンパク質の配列とに対して類似度処理を行い、前記候補タンパク質と前記標的タンパク質との類似度を得、
前記類似度が類似度閾値より大きい場合、前記候補タンパク質の3次元構造に基づいて構造最適化処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得る、処理を実行するステップを含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項12】
前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得る前記ステップは、
前記参照タンパク質に基づいて分子動力学シミュレーション処理を行い、前記参照タンパク質の活性部位および結合ポケットを得るステップと、
前記複数の候補薬物分子をそれぞれ前処理して、各前記候補薬物分子の分子配座を得るステップと、
各前記候補薬物分子の分子配座について、前記参照タンパク質の活性部位、前記結合ポケットおよび前記候補薬物分子の分子配座に基づいて分子ドッキングスコアリングを実行して、前記分子ドッキングスコアリングの結果を前記候補薬物分子の分子ドッキング情報として使用するステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項13】
前記複数の候補薬物分子をそれぞれ前処理して、各前記候補薬物分子の分子配座を得る前記ステップは、
前記複数の候補薬物分子のそれぞれに対してフォーマット変換処理を行い、各前記候補薬物分子の変換フォーマットを得るステップと、
各前記候補薬物分子の変換フォーマットに基づいて、各前記候補薬物分子の3次元配座を構築するステップと、
各前記候補薬物分子の3次元配座に基づいて、各前記候補薬物分子における水素原子付加可能位置を決定するステップと、
前記水素原子付加可能位置に水素原子を付加して、前記候補薬物分子の分子配座を得るステップと、を含む、
請求項12に記載の人工知能ベースの薬物分子処理方法。
【請求項14】
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るステップは、
前記複数の候補薬物分子に対してクラスタリング処理を行い、複数の薬物カテゴリ集合を得るステップと、
前記複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を前記標的薬物分子として選別するステップと、を含む、
請求項1に記載の人工知能ベースの薬物分子処理方法。
【請求項15】
前記複数の薬物カテゴリ集合のうち、活性情報要件および分子ドッキング情報要件を満たす候補薬物分子を前記標的薬物分子として選別する前記ステップは、
前記複数の薬物カテゴリ集合のうちの任意の1つの薬物カテゴリ集合について、
前記薬物カテゴリ集合の中で最も高い活性情報を有する候補薬物分子を選別対象の薬物分子として使用し、
前記選別対象の薬物分子の活性情報、分子ドッキング情報および薬物特性に対して加重加算処理を行い、前記選別対象の薬物分子の総合薬物情報を得、
複数の前記選別対象の薬物分子の総合薬物情報に基づいて、複数の前記選別対象の薬物分子を降順に並べ、ランキングが上位にある前記選別対象の薬物分子の一部を前記標的薬物分子として使用する、処理を実行するステップを含む、
請求項14に記載の人工知能ベースの薬物分子処理方法。
【請求項16】
人工知能ベースの薬物分子処理装置であって、
標的タンパク質の複数の候補薬物分子を決定するように構成される決定モジュールと、
前記複数の候補薬物分子および前記標的タンパク質に基づいて活性予測処理を行い、各前記候補薬物分子の活性情報を得るように構成される予測モジュールと、
前記標的タンパク質に対してホモロジーモデリング処理を行い、前記標的タンパク質と相同構造を有する参照タンパク質を得、前記参照タンパク質および前記複数の候補薬物分子に基づいて分子ドッキング処理を行い、各前記候補薬物分子の分子ドッキング情報を得るように構成される処理モジュールと、
各前記候補薬物分子の活性情報および各前記候補薬物分子の分子ドッキング情報に基づいて、前記複数の候補薬物分子に対して選別処理を行い、前記標的タンパク質の標的薬物分子を得るように構成される選別モジュールと、を備える、
人工知能ベースの薬物分子処理装置。
【請求項17】
電子機器であって、
実行可能な命令を記憶するメモリと、
前記メモリに記憶された実行可能な命令を実行するとき、請求項1から15のいずれか一項に記載の人工知能ベースの薬物分子処理方法を実現するように構成されるプロセッサと、を備える、
電子機器。
【請求項18】
コンピュータに、請求項1から15のいずれか一項に記載の人工知能ベースの薬物分子処理方法を実行させるように構成される、コンピュータプログラム。
【国際調査報告】