(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024167284
(43)【公開日】2024-12-03
(54)【発明の名称】タンパク質のドッキング方法、装置、電子デバイス及び記憶媒体
(51)【国際特許分類】
G16B 15/30 20190101AFI20241126BHJP
【FI】
G16B15/30
【審査請求】有
【請求項の数】23
【出願形態】OL
【公開請求】
(21)【出願番号】P 2024143225
(22)【出願日】2024-08-23
(31)【優先権主張番号】2023114430536
(32)【優先日】2023-11-01
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100118913
【弁理士】
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【弁理士】
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100201466
【弁理士】
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】ガオ杰
(72)【発明者】
【氏名】胡靖
(72)【発明者】
【氏名】方シャオ敏
(72)【発明者】
【氏名】ツァン肖男
(57)【要約】 (修正有)
【課題】タンパク質のドッキング方法、装置、電子デバイス及び記憶媒体を提供する。
【解決手段】方法は、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップと、反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得するステップと、を含む。これにより、少なくとも2種類の分子ドッキング方式を総合的に考慮してタンパク質ドッキングを実現し、複数のラウンドのタンパク質ドッキングを行うことができ、即ち、複合体立体配座の複数のラウンドの反復を実現し、タンパク質ドッキングの正確性を向上させる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
タンパク質のドッキング方法であって、
各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップと、
反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得するステップと、
を含む、タンパク質のドッキング方法。
【請求項2】
前記第1タンパク質の単量体立体配座に基づいて、前記第1タンパク質の残基の情報を取得するステップと、
前記第2タンパク質の単量体立体配座に基づいて、前記第2タンパク質の残基の情報を取得するステップと、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップであって、前記ターゲットグラフにおけるノードが、前記第1タンパク質の残基又は前記第2タンパク質の残基を示し、前記ターゲットグラフにおけるエッチが、2つの残基の間のエッチを示し、前記ターゲットグラフが、前記複合体立体配座を生成することに使用されるステップと、
をさらに含む、請求項1に記載のタンパク質のドッキング方法。
【請求項3】
前記少なくとも2種類の分子ドッキング方式はリジッドドッキングを含み、
前記少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップは、
前記ターゲットグラフを第1グラフニューラルネットワークに入力し、前記第1グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得するステップであって、前記キーポイントが、前記複合体立体配座における前記第1タンパク質、前記第2タンパク質の接触面における位置点であるステップと、
複合体立体配座における前記キーポイントの位置に基づいて、前記複合体立体配座を生成するステップと、
を含む、請求項2に記載のタンパク質のドッキング方法。
【請求項4】
前記第1グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得するステップは、
前記第1グラフニューラルネットワークにより前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新するステップと、
前記第1グラフニューラルネットワークにより前記ノードの特徴と前記エッチの特徴とに基づいて、複合体立体配座における前記キーポイントの位置を取得するステップと、
を含む、請求項3に記載のタンパク質のドッキング方法。
【請求項5】
前記複合体立体配座における前記キーポイントの位置に基づいて、前記複合体立体配座を生成するステップは、
前記第1タンパク質と前記第2タンパク質とから受容体とリガンドとを決定するステップと、
リガンドの単量体立体配座における前記キーポイントの位置、および複合体立体配座における前記キーポイントの位置に基づいて、回転平行移動行列を取得するステップと、
前記回転平行移動行列に基づいて、前記リガンドの単量体立体配座に対して全体的な空間変換を行うステップと、
変換された前記リガンドの単量体立体配座と前記受容体の単量体立体配座とに基づいて、前記複合体立体配座を生成するステップと、
を含む、請求項3に記載のタンパク質のドッキング方法。
【請求項6】
前記少なくとも2種類の分子ドッキング方式はフレキシブルドッキングを含み、
前記少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップは、
前記ターゲットグラフを第2グラフニューラルネットワークに入力し、前記第2グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座における前記残基の位置を取得するステップであって、複合体立体配座における前記残基の位置を取得するプロセスにおいて、前記第1タンパク質の単量体立体配座、前記第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化するステップと、
複合体立体配座における複数の残基の位置に基づいて、前記複合体立体配座を生成するステップと、
を含む、請求項2に記載のタンパク質のドッキング方法。
【請求項7】
最近取得された複合体立体配座に基づいて、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とを更新するステップと、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップに戻って実行することで、前記ターゲットグラフを更新するステップと、
をさらに含む、請求項2に記載のタンパク質のドッキング方法。
【請求項8】
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とを更新するステップの後に、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新するステップであって、前記ノードの特徴が、前記ノードに対応する残基の情報に基づいて決定されるものであり、前記エッチの特徴が、前記エッチに対応する2つの残基の情報に基づいて決定されるものであるステップをさらに含む、請求項7に記載のタンパク質のドッキング方法。
【請求項9】
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップは、
第1残基の情報と第2残基の情報とに基づいて、前記第1残基の特徴と前記第2残基の特徴との間の距離を決定するステップであって、前記第1残基及び前記第2残基がターゲットタンパク質に属し、前記ターゲットタンパク質が前記第1タンパク質又は前記第2タンパク質であるステップと、
前記距離に従って複数の第2残基を昇順に並べ替え、並べ替えられた上位N個の第2残基をターゲット残基とするステップであって、Nが正の整数であるステップと、
前記第1残基に対応するノードと前記ターゲット残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成するステップと、
を含む、請求項2に記載のタンパク質のドッキング方法。
【請求項10】
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップは、
前記第1タンパク質の残基を第3残基とするステップと、
前記第2タンパク質の残基を第4残基とするステップと、
前記第3残基に対応するノードと前記第4残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成するステップと、
を含む、請求項2に記載のタンパク質のドッキング方法。
【請求項11】
タンパク質のドッキング装置であって、
各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するためのドッキングモジュールと、
反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得するための処理モジュールと、
を含む、タンパク質のドッキング装置。
【請求項12】
構築モジュールをさらに含み、
該構築モジュールは、
前記第1タンパク質の単量体立体配座に基づいて、前記第1タンパク質の残基の情報を取得し、
前記第2タンパク質の単量体立体配座に基づいて、前記第2タンパク質の残基の情報を取得し、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築し、前記ターゲットグラフにおけるノードが、前記第1タンパク質の残基又は前記第2タンパク質の残基を示し、前記ターゲットグラフにおけるエッチが、2つの残基の間のエッチを示し、前記ターゲットグラフが、前記複合体立体配座を生成することに使用される、請求項11に記載のタンパク質のドッキング装置。
【請求項13】
前記少なくとも2種類の分子ドッキング方式はリジッドドッキングを含み、
前記ドッキングモジュールはさらに、
前記ターゲットグラフを第1グラフニューラルネットワークに入力し、前記第1グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得し、前記キーポイントが、前記複合体立体配座における前記第1タンパク質、前記第2タンパク質の接触面における位置点であり、
複合体立体配座における前記キーポイントの位置に基づいて、前記複合体立体配座を生成する、請求項12に記載のタンパク質のドッキング装置。
【請求項14】
前記ドッキングモジュールはさらに、
前記第1グラフニューラルネットワークにより前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、
前記第1グラフニューラルネットワークにより前記ノードの特徴と前記エッチの特徴とに基づいて、複合体立体配座における前記キーポイントの位置を取得する、請求項13に記載のタンパク質のドッキング装置。
【請求項15】
前記ドッキングモジュールはさらに、
前記第1タンパク質と前記第2タンパク質とから受容体とリガンドとを決定し、
リガンドの単量体立体配座における前記キーポイントの位置、および複合体立体配座における前記キーポイントの位置に基づいて、回転平行移動行列を取得し、
前記回転平行移動行列に基づいて、前記リガンドの単量体立体配座に対して全体的な空間変換を行い、
変換された前記リガンドの単量体立体配座と前記受容体の単量体立体配座とに基づいて、前記複合体立体配座を生成する、請求項13に記載のタンパク質のドッキング装置。
【請求項16】
前記少なくとも2種類の分子ドッキング方式はフレキシブルドッキングを含み、
前記ドッキングモジュールはさらに、
前記ターゲットグラフを第2グラフニューラルネットワークに入力し、前記第2グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座における前記残基の位置を取得し、複合体立体配座における前記残基の位置を取得するプロセスにおいて、前記第1タンパク質の単量体立体配座、前記第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化し、
複合体立体配座における複数の残基の位置に基づいて、前記複合体立体配座を生成する、請求項12に記載のタンパク質のドッキング装置。
【請求項17】
前記構築モジュールはさらに、
最近取得された複合体立体配座に基づいて、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とを更新し、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいてターゲットグラフを構築するステップに戻って実行することで、前記ターゲットグラフを更新する、請求項12から16のいずれか一項に記載のタンパク質のドッキング装置。
【請求項18】
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報を更新した後に、前記構築モジュールはさらに、
前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、前記ノードの特徴が、前記ノードに対応する残基の情報に基づいて決定されるものであり、前記エッチの特徴が、前記エッチに対応する2つの残基の情報に基づいて決定されるものである、請求項17に記載のタンパク質のドッキング装置。
【請求項19】
前記構築モジュールはさらに、
第1残基の情報と第2残基の情報とに基づいて、前記第1残基の特徴と前記第2残基の特徴との間の距離を決定し、前記第1残基及び前記第2残基がターゲットタンパク質に属し、前記ターゲットタンパク質が前記第1タンパク質又は前記第2タンパク質であり、
前記距離に従って複数の第2残基を昇順に並べ替え、並べ替えられた上位N個の第2残基をターゲット残基とし、Nが正の整数であり、
前記第1残基に対応するノードと前記ターゲット残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成する、請求項12から16のいずれか一項に記載のタンパク質のドッキング装置。
【請求項20】
前記構築モジュールはさらに、
前記第1タンパク質の残基を第3残基とし、
前記第2タンパク質の残基を第4残基とし、
前記第3残基に対応するノードと前記第4残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成する、請求項12から16のいずれか一項に記載のタンパク質のドッキング装置。
【請求項21】
電子デバイスであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに請求項1から10のいずれか一項に記載の方法を実行させる電子デバイス。
【請求項22】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1から10のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項23】
プロセッサによって実行される場合、請求項1から10のいずれか一項に記載の方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は人工知能技術分野に関し、特にバイオコンピューティング、分子ドッキング、深層学習技術分野に関し、特にタンパク質のドッキング方法、装置、電子デバイス、記憶媒体及びコンピュータプログラムに関する。
【背景技術】
【0002】
タンパク質のドッキングとは、2つ以上のタンパク質分子の間が相互作用して複合体(複合物)を形成するプロセスを指し、生物分野において極めて重要な作用を果たしており、例えば、抗原と抗体とのドッキング、ポリペプチドタンパク質ドッキングなどを含む。しかし、関連技術におけるタンパク質のドッキング方法には、ドッキング正確性が低いという問題が存在する。
【発明の概要】
【0003】
本開示はタンパク質のドッキング方法、装置、電子デバイス、記憶媒体及びコンピュータプログラムを提供する。
【0004】
本開示の第1態様によれば、タンパク質のドッキング方法を提供し、該方法は、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップと、反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得するステップと、を含む。
【0005】
本開示の第2態様によれば、タンパク質のドッキング装置を提供し、該装置は、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するためのドッキングモジュールと、反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得するための処理モジュールと、を含む。
【0006】
本開示の第3態様によれば、電子デバイスを提供し、該電子デバイスは、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに上記第1態様によって提供されるタンパク質のドッキング方法を実行させる。
【0007】
本開示の第4態様によると、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに上記第1態様によって提供されるタンパク質のドッキング方法を実行させる。
【0008】
本開示の第5態様によると、コンピュータプログラムを提供し、前記コンピュータプログラムは、プロセッサによって実行される場合、上記第1態様によって提供されるタンパク質のドッキング方法を実現する。
【0009】
なお、この部分で説明される内容は、本開示の実施例の肝心又は重要な特徴を特定するために使用されるものではなく、本開示の範囲を限定するものではない。本開示の他の特徴は、以下の説明により理解しやすくなる。
【図面の簡単な説明】
【0010】
図面は本解決案をよりよく理解するためのものであり、本開示を限定するものではない。
【
図1】本開示の一実施例のタンパク質のドッキング方法の概略フローチャートである。
【
図2】本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートである。
【
図3】本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートである。
【
図4】本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートである。
【
図5】本開示の1つの実施例のタンパク質のドッキング装置の概略構造図である。
【
図6】本開示の1つの実施例の電子デバイスの概略的なブロック図である。
【発明を実施するための形態】
【0011】
以下、図面と組み合わせて本開示の例示的な実施例を説明し、理解を容易にするために本開示の実施例の様々な詳細が含まれており、それらを例示的なものとして見なすべきである。したがって、当業者であれば分かるように、本開示の範囲と精神から逸脱せずに、実施例に対して様々な変更と修正を行うことができる。同様に、明確かつ簡潔にするために、以下の説明では、周知の機能や構造に対する説明が省略されている。
【0012】
AI(Artificial Intelligence、人工知能)とは、人間の知能をシミュレートし且つ拡張する理論、方法、技術及び応用システムを研究して開発する技術科学である。現在、AI技術は、高度な自動化、高正確性、低コストという利点があり、幅広く活用されている。
【0013】
バイオコンピューティング(Bio computing)とは、生体高分子を「データ」とするコンピューティングモデルを指し、主に、タンパク質コンピューティング、RNA(Ribonucleic Acid、リボ核酸)コンピューティング、及びDNA(Deoxyribo Nucleic Acid、デオキシリボ核酸)コンピューティングという3つのタイプに分けられ、又は、コンピュータサイエンスとコンピュターエンジニアリングの下位分野を指し、生物工学と生物学を使用してコンピュータを構築し、一方、生物情報学のようなものは、学際的科学であり、コンピュータを用いて生物学的データを記憶し処理する。
【0014】
分子ドッキングは、受容体の特徴、および受容体と薬物分子との間の相互作用の方式により薬物を設計する方法である。主に、分子間(例えばリガンドと受容体)の相互作用を研究し、それらの結合モード及び親和性を予測する理論的なシミュレーション方法である。近年、分子ドッキング方法はコンピュータ支援薬物研究分野における重要な技術となっている。
【0015】
DL(Deep Learning、深層学習)は、ML(Machine Learning、機械学習)分野における新しい研究の方向であり、サンプルデータの固有の法則と表現レベルを学習し、機械が人間のような分析学習能力を持ち、文字、画像および音声などのデータを認識できるようにする科学であり、幅広く音声認識や画像認識に適用される。
【0016】
図1は、本開示の一実施例のタンパク質のドッキング方法の概略フローチャートである。
図1に示すように、該方法は以下のステップS101~S102を含む。
【0017】
S101において、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成する。
【0018】
なお、本開示の実施例のタンパク質のドッキング方法の実行主体は、データ情報処理能力を備えるハードウェアデバイス及び/又は該ハードウェアデバイスの動作を駆動するために必要なソフトウェアであってもよい。選択的に、実行主体は、ワークステーション、サーバ、コンピュータ、ユーザ端末およびその他のインテリジェントデバイスを含んでもよい。ここで、ユーザ端末は、携帯電話、コンピュータ、インテリジェント音声インタラクションデバイス、スマート家電、車載端末などを含んでもよいが、これらに限定されない。
【0019】
なお、少なくとも2種類の分子ドッキング方式は、リジッドドッキング、フレキシブルドッキング、セミフレキシブルドッキングなどを含んでもよく、過度に限定されていない。ここで、リジッドドッキングのプロセスでは、第1タンパク質の単量体立体配座と第2タンパク質の単量体立体配座はいずいれも変化しない。フレキシブルドッキングのプロセスでは、第1タンパク質の単量体立体配座と第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化する。
【0020】
なお、少なくとも2種類の分子ドッキング方式の実行順序は過度に限定されていない。例えば、少なくとも2種類の分子ドッキング方式がリジッドドッキングとフレキシブルドッキングを含む場合を例にすると、リジッドドッキング、フレキシブルドッキングという順序に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成してもよく、又は、フレキシブルドッキング、リジッドドッキングという順序に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成してもよい。
【0021】
なお、各分子ドッキング方式はいずれも1つの複合体立体配座を生成することができ、現在複合体立体配座が存在しない場合、一つの分子ドッキング方式に従って、複合体立体配座を生成することができ、現在複合体立体配座が存在する場合、一つの分子ドッキング方式に従って、複合体立体配座を改めて生成することができ、即ち、複合体立体配座を更新する。
【0022】
例えば、各ラウンドの反復プロセスにおいて、リジッドドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成し、フレキシブルドッキング方式に従って、複合体立体配座を更新する。
【0023】
例えば、各ラウンドの反復プロセスにおいて、フレキシブルドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成し、リジッドドッキング方式に従って、複合体立体配座を更新する。
【0024】
S102において、反復終了条件が満たされていないと認識される場合、反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得する。
【0025】
なお、反復終了条件は過度に限定されていない。例えば、反復のラウンド数が設定閾値に達すること、複合体立体配座のパラメータが設定範囲内にあること、第1タンパク質と第2タンパク質とのドッキングに成功したことなどを含んでもよい。ここで、複合体立体配座のパラメータはドッキング精度を特徴づけるために使用される。
【0026】
一実施形態では、最終的な複合体立体配座を取得することは、最後に取得された複合体立体配座を最終的な複合体立体配座とすることを含む。
【0027】
一実施形態では、最終的な複合体立体配座を取得することは、複数のラウンドの反復プロセスによって生成された複数の複合体立体配座から最終的な複合体立体配座を選別することを含む。
【0028】
なお、本開示によって提供されるタンパク質のドッキング方法は、以下の少なくとも1つのシーンに適用される。
シーン1、抗原と抗体とのドッキング:本開示は、抗原抗体複合体立体配座の予測に使用可能であるため、抗体の設計を支援することができる。
シーン2、ポリペプチドタンパク質ドッキング:本開示は、ポリペプチドタンパク質複合体立体配座の予測に使用可能であるため、ポリペプチド医薬品の設計を支援することができる。
シーン3、疾患メカニズム研究:多くの疾患の発生と進展は、タンパク質間の異常な相互作用に関しており、タンパク質ドッキングは、研究者がこれらの異常な相互作用の分子メカニズムを理解するのに役立つので、疾患の診断と治療に新しいアイデアを提供する。
シーン4、タンパク質機能研究:タンパク質ドッキングは、タンパク質間の相互作用を明らかにすることができるので、科学者がタンパク質の機能と制御メカニズムを理解するのに役立つ。これは、細胞シグナル伝達や遺伝子制御などの生物学的プロセスを明らかにするために非常に重要である。
シーン5、構造生物学:タンパク質構造生物学では、タンパク質ドッキングはタンパク質複合物の結合パターンの予測に使用可能であるため、研究者がタンパク質複合体の構造と機能を説明するのに役立つ。
シーン6、疾患メカニズム研究:多くの疾患の発生と進展は、タンパク質間の異常な相互作用に関する。タンパク質ドッキングは、研究者がこれらの異常な相互作用の分子メカニズムを理解するのに役立つので、疾患の診断と治療に新しいアイデアを提供する。
シーン7、タンパク質相互作用ネットワーク分析:タンパク質間の相互作用を予測することにより、タンパク質相互作用ネットワークを構築することができ、研究者が細胞内のタンパク質の相互接続と制御ネットワークを理解するのに役立つ。
シーン8、タンパク質工学:生物技術分野では、特定の機能を実現するために、タンパク質ドッキングは、融合タンパク質、抗体、酵素などの新しいタンパク質構造の設計に使用可能である。
【0029】
本開示によって提供されるタンパク質のドッキング方法は、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成し、反復終了条件が満たされていないと認識される場合、反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得する。これにより、タンパク質ドッキングを実現するために少なくとも2種類の分子ドッキング方式を総合的に考慮して、複数のラウンドのタンパク質ドッキングを行うことができ、即ち、複合体立体配座の複数のラウンドの反復を実現し、タンパク質ドッキングの正確性を向上させる。
【0030】
上記いずれか1つの実施例を基に、複合体立体配座を生成するためのターゲットグラフを構築することができる。
【0031】
ターゲットグラフの構築について、
図2と組み合わせてさらに理解することができ、
図2は、本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートであり、
図2に示すように、該方法は以下のステップS201~S203を含む。
【0032】
S201において、第1タンパク質の単量体立体配座に基づいて、第1タンパク質の残基の情報を取得する。
【0033】
S202において、第2タンパク質の単量体立体配座に基づいて、第2タンパク質の残基の情報を取得する。
【0034】
なお、残基の情報は過度に限定されていない。例えば、残基の種類、残基の位置(例えば残基のα~炭素原子の位置)を含んでもよく、ここで、α~炭素原子とは、残基の一番目の炭素原子を指す。
【0035】
なお、タンパク質の単量体立体配座にはタンパク質の残基の情報が運ばれており(carry)、タンパク質の単量体立体配座からタンパク質の残基の情報を抽出することができる。
【0036】
例えば、第1タンパク質の単量体立体配座から第1タンパク質の残基の情報を抽出することができる。
【0037】
S203において、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築し、ターゲットグラフにおけるノードが、第1タンパク質の残基又は第2タンパク質の残基を示し、ターゲットグラフにおけるエッチが、2つの残基の間のエッチを示し、ターゲットグラフが、複合体立体配座を生成することに使用される。
【0038】
なお、ターゲットグラフはヘテログラフであり、ターゲットグラフは2種類のタイプのノードを含み、第1種のタイプのノードは、第1タンパク質の残基を示し、第2種のタイプのノードは、第2タンパク質の残基を示す。ターゲットグラフにおけるノードは残基と一対一で対応している。ターゲットグラフにおけるエッチは、エッチによって接続される2つのノードに対応する残基の間のエッチを示す。
【0039】
なお、ターゲットグラフにおけるノードの数は、第1タンパク質の残基の数と第2タンパク質の残基の数との合計の値である。
【0040】
なお、ターゲットグラフにおけるいずれか2つのノードの間にエッチが存在する場合もあれば、エッチが存在しない場合もある。
【0041】
本開示の実施例では、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築することは、以下の幾つかの可能な実施形態を含む。
【0042】
方式1、残基と一対一で対応するノードを構築することで、ターゲットグラフを生成し、ここで、残基は第1タンパク質の残基と第2タンパク質の残基とを含む。
【0043】
これにより、該方法では、残基と一対一で対応するノードを構築することで、ノードの構築を実現することができる。
【0044】
方式2、第1残基の情報と第2残基の情報とに基づいて、第1残基の特徴と第2残基の特徴との間の距離を決定し、ここで、第1残基と第2残基がターゲットタンパク質に属し、ターゲットタンパク質が第1タンパク質又は第2タンパク質であり、距離に従って複数の第2残基を昇順に並べ替え、並べ替えられた上位N個の第2残基をターゲット残基とし、Nが正の整数であり、第1残基に対応するノードとターゲット残基に対応するノードとの間に接続エッチを追加することで、ターゲットグラフを生成する。
【0045】
これにより、該方法では、第1残基の情報と第2残基の情報とに基づいて、第1残基の特徴と第2残基の特徴との間の距離を決定し、距離が最も近いN個の第2残基をターゲット残基とし、且つ第1残基に対応するノードとターゲット残基に対応するノードとの間に接続エッチを追加することで、同一タンパク質の残基の間のエッチを構築することができる。
【0046】
なお、第1残基と第2残基はターゲットタンパク質に属し、即ち第1残基と第2残基は同一のタンパク質に属し、例えば、第1残基と第2残基は第1タンパク質に属し、又は、第1残基と第2残基は第2タンパク質に属する。
【0047】
なお、Nについて過度に限定せず、例えば、10であってもよい。
【0048】
一実施形態では、第1残基の情報と第2残基の情報とに基づいて、第1残基の特徴と第2残基の特徴との間の距離を決定することは、第1残基の情報に対して特徴抽出を行って、第1残基の特徴を取得し、第2残基の情報に対して特徴抽出を行って、第2残基の特徴を取得し、第1残基の特徴と第2残基の特徴との間の距離を取得することを含む。
【0049】
一実施形態では、第1残基の情報と第2残基の情報をKNN(K~Nearest Neighbor、K近傍)モデルに入力して、KNNモデルによってターゲット残基を出力してもよい。
【0050】
なお、距離について過度に限定せず、例えば、ユークリッド距離、マンハッタン距離などを含んでもよい。
【0051】
方式3、第1タンパク質の残基を第3残基とし、第2タンパク質の残基を第4残基とし、第3残基に対応するノードと第4残基に対応するノードとの間に接続エッチを追加することで、ターゲットグラフを生成する。
【0052】
これにより、該方法では、第3残基に対応するノードと第4残基に対応するノードとの間に接続エッチを追加することで、異なるタンパク質の残基の間のエッチを構築することができる。
【0053】
なお、第3残基は第1タンパク質のいずれか1つの残基であり、第4残基は第2タンパク質のいずれか1つの残基である。
【0054】
方式4、ノードに対応する残基の情報に基づいて、ノードの特徴を決定する。
【0055】
なお、ノードの特徴について過度に限定せず、例えば、ノードに対応する残基のタイプ、ノードに対応する残基の位置などを含んでもよい。
【0056】
方式5、エッチに対応する2つの残基の情報に基づいて、エッチの特徴を決定する。
【0057】
なお、エッチの特徴について過度に限定せず、例えば、エッチの長さ、エッチに対応する2つの残基の角度差などを含んでもよい。
【0058】
一実施形態では、エッチに対応する2つの残基の情報に基づいてエッチの特徴を決定することは、エッチに対応する2つの残基の位置に基づいて、エッチに対応する2つの残基の間の距離を決定して、エッチの長さとすることを含む。
【0059】
一実施形態では、エッチに対応する2つの残基の情報に基づいてエッチの特徴を決定することは、エッチに対応する2つの残基の角度の差分を取得して、エッチに対応する2つの残基の角度差とすることを含む。
【0060】
上記いずれか1つの実施例を基に、方法は、最近に取得された複合体立体配座に基づいて、第1タンパク質の残基の情報と第2タンパク質の残基の情報とを更新するステップと、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップに戻って実行することで、ターゲットグラフを更新するステップと、をさらに含む。これにより、最新の複合体立体配座を用いて残基の情報を更新し、且つ更新された残基の情報を用いて、ターゲットグラフを再構築することができ、タンパク質のドッキングプロセスでターゲットグラフのリアルタイムな更新を実現することができる。
【0061】
なお、複合体立体配座には、第1タンパク質の残基の情報と第2タンパク質の残基の情報とが運ばれており、最近に取得された複合体立体配座中から第1タンパク質の残基の情報と第2タンパク質の残基の情報とを抽出し、且つ元の第1タンパク質の残基の情報を、抽出された第1タンパク質の残基の情報に切り替え、元の第2タンパク質の残基の情報を、抽出された第2タンパク質の残基の情報に切り替えることができる。
【0062】
なお、ターゲットグラフの更新は、ノードの間のエッチの削除又は追加を含んでもよく、ここで限定されない。
【0063】
幾つかの例では、第1タンパク質の残基の情報と第2タンパク質の残基の情報とを更新するステップの後に、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新するステップをさらに含み、ノードの特徴は、ノードに対応する残基の情報に基づいて決定されるものであり、エッチの特徴は、エッチに対応する2つの残基の情報によって決定されるものである。これにより、更新された残基の情報を用いて、ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新することができ、ドッキングのプロセスでノードの特徴とエッチの特徴とのリアルタイムな更新を実現することができる。
【0064】
本開示によって提供されるタンパク質のドッキング方法は、第1タンパク質の単量体立体配座に基づいて、第1タンパク質の残基の情報を取得し、第2タンパク質の単量体立体配座に基づいて、第2タンパク質の残基の情報を取得し、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築して、複合体立体配座を生成することができる。
【0065】
上記実施例では、少なくとも2種類の分子ドッキング方式はリジッドドッキングを含み、ステップS102の少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップについて、
図3と組み合わせてさらに理解してもよく、
図3は、本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートであり、
図3に示すように、該方法は以下のS301~S302を含む。
【0066】
S301において、ターゲットグラフを第1グラフニューラルネットワークに入力し、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得し、キーポイントが、複合体立体配座における第1タンパク質と第2タンパク質の接触面における位置点である。
【0067】
なお、複合体立体配座におけるキーポイントの位置を取得するプロセスで、第1タンパク質の単量体立体配座と第2タンパク質の単量体立体配座はいずれも変化しない。
【0068】
なお、第1グラフニューラルネットワークを過度に限定せず、例えば、GCN(Graph Convolutional Network、グラフ畳み込みネットワーク)、GRN(Graph Recurrent Network、グラフリカレントネットワーク)、GAT(Graph Attention Network、グラフアテンションネットワーク)などを含んでもよい。
【0069】
なお、キーポイントの数を過度に限定しない。
【0070】
一実施形態では、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得することは、第1グラフニューラルネットワークによりターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、第1グラフニューラルネットワークによりノードの特徴とエッチの特徴とに基づいて、複合体立体配座におけるキーポイントの位置を取得することを含み、複合体立体配座におけるキーポイントの位置の取得を実現する。
【0071】
なお、第1グラフニューラルネットワークによりターゲットグラフにおけるノードの特徴とエッチの特徴とを更新することは、関連技術におけるいずれか1つのグラフニューラルネットワークの特徴更新方法で実現可能であり、ここで過度に限定しない。
【0072】
一実施形態では、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得することは、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座における残基の位置を取得し、複合体立体配座における第3残基の位置と複合体立体配座における第4残基の位置とに基づいて、第3残基と第4残基との間の距離を取得し、第3残基と第4残基との間の距離が設定閾値より小さい場合、第3残基と第4残基との間のエッチの中点の複合体立体配座における位置を、複合体立体配座におけるキーポイントの位置とすることを含む。本実施例では、第3残基と第4残基との間の距離が設定閾値より小さい場合、第3残基と第4残基との間のエッチの中点をキーポイントとする。
【0073】
S302において、複合体立体配座におけるキーポイントの位置に基づいて、複合体立体配座を生成する。
【0074】
一実施形態では、複合体立体配座におけるキーポイントの位置に基づいて、複合体立体配座を生成することは、第1タンパク質と第2タンパク質から受容体とリガンドを決定し、リガンドの単量体立体配座におけるキーポイントの位置、および複合体立体配座におけるキーポイントの位置に基づいて、回転平行移動行列を取得し、回転平行移動行列に基づいて、リガンドの単量体立体配座に対して全体的な空間変換を行い、変換されたリガンドの単量体立体配座と受容体の単量体立体配座とに基づいて、複合体立体配座を生成することを含む。これにより、複合体立体配座におけるキーポイントの位置に基づいて、回転平行移動行列を得ることができ、これにより、リガンドの単量体立体配座に対して全体的な空間変換を行い、且つ変換されたリガンドの単量体立体配座と受容体の単量体立体配座とを組み合わせて、複合体立体配座を生成する。
【0075】
なお、リガンドの単量体立体配座に対して全体的な空間変換を行うことは、リガンドの単量体立体配座に対して全体的な回転と全体的な平行移動とを行うことを指す。
【0076】
幾つかの例では、第1タンパク質と第2タンパク質から受容体とリガンドを決定することは、第1タンパク質を受容体とし、第2タンパク質をリガンドとすることを含み、又は、第2タンパク質を受容体とし、第1タンパク質をリガンドとすることを含む。
【0077】
幾つかの例では、リガンドの単量体立体配座におけるキーポイントの位置、および複合体立体配座におけるキーポイントの位置に基づいて、回転平行移動行列を取得することは、リガンドの単量体立体配座における複数のキーポイントの位置に基づいて、第1行列を生成し、複合体立体配座における複数のキーポイントの位置に基づいて、第2行列を生成し、第2行列が、回転平行移動行列と第1行列との積であり、第1行列に基づいて、第2行列に対して行列分解を行って、回転平行移動行列を得ることを含む。なお、行列分解は、関連技術におけるいずれか1つの行列分解方法により実現可能であり、例えば、SVD(Singular Value Decomposition、特異値分解)を含んでもよい。
【0078】
幾つかの例では、リガンドの単量体立体配座におけるキーポイントの位置、および複合体立体配座におけるキーポイントの位置に基づいて、回転平行移動行列を取得することは、回転平行移動行列内の元素を未知数とし、リガンドの単量体立体配座におけるキーポイントの位置、複合体立体配座におけるキーポイントの位置、及び回転平行移動行列内における元素に基づいて連立方程式を構築し、連立方程式の解を求めて、連立方程式の解を取得して回転平行移動行列内の元素とし、これによって回転平行移動行列を生成することを含む。
【0079】
幾つかの例では、回転平行移動行列に基づいて、リガンドの単量体立体配座に対して全体的な空間変換を行うことは、回転平行移動行列に基づいて、単量体立体配座におけるリガンドの残基の位置に対して空間変換を行い、単量体立体配座におけるリガンドの複数の残基の位置に基づいて、変換されたリガンドの単量体立体配座を取得することを含む。
【0080】
本開示によって提供されるタンパク質のドッキング方法では、少なくとも2種類の分子ドッキング方式はリジッドドッキングを含み、ターゲットグラフを第1グラフニューラルネットワークに入力し、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得し、キーポイントが、複合体立体配座における第1タンパク質と第2タンパク質の接触面における位置点であり、複合体立体配座におけるキーポイントの位置に基づいて、複合体立体配座を生成することで、タンパク質のリジッドドッキングを実現する。
【0081】
上記実施例では、少なくとも2種類の分子ドッキング方式はフレキシブルドッキングを含み、ステップS102の少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成するステップについて、
図4と組み合わせてさらに理解してもよく、
図4は、本開示のもう1つの実施例のタンパク質のドッキング方法の概略フローチャートであり、
図4に示すように、該方法は以下のステップS401~S402を含む。
【0082】
S401において、ターゲットグラフを第2グラフニューラルネットワークに入力し、第2グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座における残基の位置を取得し、複合体立体配座における残基の位置を取得するプロセスで、第1タンパク質の単量体立体配座、第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化する。
【0083】
なお、第2グラフニューラルネットワークは、第1グラフニューラルネットワークの関連記載を参照されたく、ここで詳しい説明を省略する。
【0084】
なお、残基は第1タンパク質の残基と第2タンパク質の残基とを含む。
【0085】
一実施形態では、第2グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座における残基の位置を取得することは、第2グラフニューラルネットワークによりターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、第2グラフニューラルネットワークによりノードの特徴とエッチの特徴とに基づいて、複合体立体配座における残基の位置を取得することを含み、複合体立体配座における残基の位置の取得を実現する。
【0086】
なお、第2グラフニューラルネットワークによりターゲットグラフにおけるノードの特徴とエッチの特徴とを更新することは、関連技術におけるいずれか1つのグラフニューラルネットワークの特徴更新方法により実現可能であり、ここで過度に限定しない。
【0087】
S402において、複合体立体配座における複数の残基の位置に基づいて、複合体立体配座を生成する。
【0088】
本開示の実施例では、複合体立体配座における複数の残基の位置に基づいて、複合体立体配座を生成することは、複合体立体配座における複数の第1タンパク質の残基の位置、および複合体立体配座における複数の第2タンパク質の残基の位置に基づいて、複合体立体配座を生成することを含む。
【0089】
本開示によって提供されるタンパク質のドッキング方法では、少なくとも2種類の分子ドッキング方式はフレキシブルドッキングを含み、ターゲットグラフを第2グラフニューラルネットワークに入力し、第2グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座における残基の位置を取得し、ここで、複合体立体配座における残基の位置を取得するプロセスで、第1タンパク質の単量体立体配座、第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化し、複合体立体配座における複数の残基の位置に基づいて、複合体立体配座を生成することで、タンパク質のフレキシブルドッキングを実現する。
【0090】
上記いずれか1つの実施例を基に、各ラウンドの反復プロセスにおいて、リジッドドッキング、フレキシブルドッキングという順序に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成してもよい。
【0091】
例えば、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築し、ターゲットグラフを第1グラフニューラルネットワークに入力し、第1グラフニューラルネットワークにより、複合体立体配座におけるキーポイントの位置を取得し、複合体立体配座におけるキーポイントの位置に基づいて、複合体立体配座Aを生成することができる。
【0092】
複合体立体配座Aに基づいて、第1タンパク質の残基の情報と第2タンパク質の残基の情報とを更新し、且つ、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップに戻って実行することでターゲットグラフを更新し、さらに、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新してもよい。
【0093】
ターゲットグラフを第2グラフニューラルネットワークに入力し、第2グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座における残基の位置を取得し、複合体立体配座における複数の残基の位置に基づいて、複合体立体配座Bを生成することができる。
【0094】
上記いずれか1つの実施例を基に、各ラウンドの反復プロセスにおいて、フレキシブルドッキング、リジッドドッキングという順序に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成してもよい。
【0095】
例えば、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築し、ターゲットグラフを第2グラフニューラルネットワークに入力し、第2グラフニューラルネットワークにより、複合体立体配座における残基の位置を取得し、複合体立体配座における複数の残基の位置に基づいて、複合体立体配座Cを生成することができる。
【0096】
複合体立体配座Cに基づいて、第1タンパク質の残基の情報と第2タンパク質の残基の情報とを更新し、且つ、第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築するステップに戻って実行することでターゲットグラフを更新し、さらに第1タンパク質の残基の情報と第2タンパク質の残基の情報とに基づいて、ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新してもよい。
【0097】
ターゲットグラフを第1グラフニューラルネットワークに入力し、第1グラフニューラルネットワークによりターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得し、複合体立体配座におけるキーポイントの位置に基づいて、複合体立体配座Dを生成することができる。
【0098】
本開示の技術案では、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供及び開示などの処理は、いずれも関連する法律法規の規定に合致し、且つ公序良俗に違反しない。
【0099】
本開示の実施例により、本開示は、上記タンパク質のドッキング方法を実現するためのタンパク質のドッキング装置をさらに提供する。
【0100】
図5は本開示の一実施例のタンパク質に係るドッキング装置のブロック図である。
【0101】
図5に示すように、タンパク質のドッキング装置500は、ドッキングモジュール501と処理モジュール502とを含む。
【0102】
ドッキングモジュール501は、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成する。
【0103】
処理モジュール502は、反復終了条件が満たされていないと認識される場合、前記反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得する。
【0104】
本開示の1つの実施例では、前記装置は構築モジュールをさらに含み、前記構築モジュールは、前記第1タンパク質の単量体立体配座に基づいて、前記第1タンパク質の残基の情報を取得し、前記第2タンパク質の単量体立体配座に基づいて、前記第2タンパク質の残基の情報を取得し、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、ターゲットグラフを構築し、ここで、前記ターゲットグラフにおけるノードが、前記第1タンパク質の残基又は前記第2タンパク質の残基を示し、前記ターゲットグラフにおけるエッチが、2つの残基の間のエッチを示し、前記ターゲットグラフが、前記複合体立体配座を生成することに使用される。
【0105】
本開示の1つの実施例では、前記少なくとも2種類の分子ドッキング方式はリジッドドッキングを含み、前記ドッキングモジュール501はさらに、前記ターゲットグラフを第1グラフニューラルネットワークに入力し、前記第1グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座におけるキーポイントの位置を取得し、ここで、前記キーポイントが、前記複合体立体配座における前記第1タンパク質、前記第2タンパク質の接触面における位置点であり、複合体立体配座における前記キーポイントの位置に基づいて、前記複合体立体配座を生成する。
【0106】
本開示の1つの実施例では、前記ドッキングモジュール501はさらに、前記第1グラフニューラルネットワークにより前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、前記第1グラフニューラルネットワークにより前記ノードの特徴と前記エッチの特徴とに基づいて、複合体立体配座における前記キーポイントの位置を取得する。
【0107】
本開示の1つの実施例では、前記ドッキングモジュール501はさらに、前記第1タンパク質と前記第2タンパク質から受容体とリガンドを決定し、リガンドの単量体立体配座における前記キーポイントの位置、および複合体立体配座における前記キーポイントの位置に基づいて、回転平行移動行列を取得し、前記回転平行移動行列に基づいて、前記リガンドの単量体立体配座に対して全体的な空間変換を行い、変換された前記リガンドの単量体立体配座と前記受容体の単量体立体配座とに基づいて、前記複合体立体配座を生成する。
【0108】
本開示の1つの実施例では、前記少なくとも2種類の分子ドッキング方式はフレキシブルドッキングを含み、前記ドッキングモジュール501はさらに、前記ターゲットグラフを第2グラフニューラルネットワークに入力し、前記第2グラフニューラルネットワークにより前記ターゲットグラフに基づいて、複合体立体配座における前記残基の位置を取得し、ここで、複合体立体配座における前記残基の位置を取得するプロセスで、前記第1タンパク質の単量体立体配座、前記第2タンパク質の単量体立体配座のうちの少なくとも1つの立体配座が変化し、複合体立体配座における複数の残基の位置に基づいて、前記複合体立体配座を生成する。
【0109】
本開示の1つの実施例では、前記構築モジュールはさらに、最近に取得された複合体立体配座に基づいて、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とを更新し、第1タンパク質の残基の情報と前記第2タンパク質の残基の情報ちに基づいてターゲットグラフを構築するステップに戻って実行することで、前記ターゲットグラフを更新する。
【0110】
本開示の1つの実施例では、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報を更新した後、前記構築モジュールはさらに、前記第1タンパク質の残基の情報と前記第2タンパク質の残基の情報とに基づいて、前記ターゲットグラフにおけるノードの特徴とエッチの特徴とを更新し、ここで、前記ノードの特徴が、前記ノードに対応する残基の情報に基づいて決定されるものであり、前記エッチの特徴が、前記エッチに対応する2つの残基の情報によって決定されるものである。
【0111】
本開示の1つの実施例では、前記構築モジュールはさらに、第1残基の情報と第2残基の情報とに基づいて、前記第1残基の特徴と前記第2残基の特徴との間の距離を決定し、ここで、前記第1残基と前記第2残基がターゲットタンパク質に属し、前記ターゲットタンパク質が前記第1タンパク質又は前記第2タンパク質であり、前記距離に基づいて複数の第2残基を昇順に並べ替え、並べ替えられた上位N個の第2残基をターゲット残基とし、Nが正の整数であり、前記第1残基に対応するノードと前記ターゲット残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成する。
【0112】
本開示の1つの実施例では、前記構築モジュールはさらに、前記第1タンパク質の残基を第3残基とし、前記第2タンパク質の残基を第4残基とし、前記第3残基に対応するノードと前記第4残基に対応するノードとの間に接続エッチを追加することで、前記ターゲットグラフを生成する。
【0113】
本開示によって提供されるタンパク質のドッキング装置では、各ラウンドの反復プロセスにおいて、少なくとも2種類の分子ドッキング方式に従って、第1タンパク質と第2タンパク質とをドッキングして、複合体立体配座を生成し、反復終了条件が満たされていないと認識される場合、反復終了条件が満たされるまで次のラウンドの反復プロセスを継続して、最終的な複合体立体配座を取得する。これにより、少なくとも2種類の分子ドッキング方式を総合的に考慮してタンパク質ドッキングを実現し、複数のラウンドのタンパク質ドッキングを行うことができ、即ち、複合体立体配座の複数のラウンドの反復を実現し、タンパク質ドッキングの正確性を向上させる。
【0114】
本開示の実施例によると、本開示は電子デバイス、読み取り可能な記憶媒体、及びコンピュータプログラムを提供する。
【0115】
図6は、本開示の実施例を実施するために使用可能な電子デバイス600の概略的なブロック図を示す。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書で説明される及び/又は要求される本開示の実現を制限することを意図したものではない。
【0116】
図6に示すように、電子デバイス600は、リードオンリーメモリ(ROM)602に記憶されたコンピュータプログラム又は記憶ユニット608からランダムアクセスメモリ(RAM)603にロードされたコンピュータプログラムにより、様々な適切な動作及び処理を実行することができる計算ユニット601を含む。RAM603には、電子デバイス600の操作に必要な様々なプログラム及びデータが記憶されてもよい。計算ユニット601、ROM602及びRAM603は、バス604を介して互いに接続される。入力/出力(I/O)インタフェース605もバス604に接続される。
【0117】
電子デバイス600の複数の構成要素はI/Oインタフェース605に接続され、キーボード、マウスなどの入力ユニット606と、様々なタイプのディスプレイ、スピーカーなどの出力ユニット606と、磁気ディスク、光ディスクなどの記憶ユニット608と、ネットワークカード、モデム、無線通信送受信機などの通信ユニット609と、を含む。通信ユニット609は、電子デバイス600がインターネットなどのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して、他の機器と情報/データを交換することを可能にする。
【0118】
計算ユニット601は、処理及び計算能力を有する様々な汎用及び/又は専用処理コンポーネントであり得る。計算ユニット601のいくつかの例は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、様々な専用人工知能(AI)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタルシグナルプロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット601は、上述した各方法と処理、例えば、タンパク質のドッキング方法を実行する。例えば、いくつかの実施例では、タンパク質のドッキング方法は、記憶ユニット608などの機械読み取り可能な媒体に有形に組み込まれたコンピュータソフトウェアプログラムとして実現され得る。いくつかの実施例では、コンピュータプログラムの一部又は全部は、ROM602及び/又は通信ユニット609を介して電子デバイス600にロード及び/又はインストールされ得る。コンピュータプログラムがRAM603にロードされ、計算ユニット601により実行される時、上述したタンパク質のドッキング方法の1つ以上のステップが実行され得る。選択的に、他の実施例では、計算ユニット601は、他の任意の適切な方式(例えば、ファームウェアを介して)でタンパク質のドッキング方法を実行するように構成されてもよい。
【0119】
本明細書で説明したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、負荷プログラマブル論理デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現され得る。これらの様々な実施形態は1つ以上のコンピュータプログラムで実施されることを含むことができ、この1つ以上のコンピュータプログラムは、専用又は汎用のプログラマブルプロセッサであり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することができ、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置にデータ及び命令を送信することを含み得る。
【0120】
本開示の方法を実施するためのプログラムコードは、1つ以上のプログラミング言語の任意の組み合わせでプログラミングすることができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供され、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図において特定された機能/操作が実施されるようにしてもよい。プログラムコードは、完全にマシンで実行されてもよく、部分的にマシンで実行されてもよく、独立型ソフトウェアパッケージとして一部がマシンで実行され、一部がリモートマシンで実行され、又は完全にリモートマシン又はサーバで実行されてもよい。
【0121】
本開示の文脈では、機械読み取り可能な媒体は、命令実行システム、装置、又は機器により、又は命令実行システム、装置、又は機器と組み合わせて使用されるプログラムを含む又は記憶することができる有形媒体であり得る。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であり得る。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁的、赤外線、又は半導体システム、装置、又は機器、又は上記の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、1つ以上の配線に基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光記憶機器、磁気記憶機器、又は上記の任意の適切な組み合わせを含むが、これらに限定されない。
【0122】
ユーザとのインタラクションを提供するために、ここで説明されるシステム及び技術をコンピュータで実施することができ、当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティング装置(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティング装置により入力をコンピュータに提供することができる。他のタイプの装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、ユーザからの入力は任意の形態(音入力、音声入力、又は触覚入力を含む)で受信することができる。
【0123】
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによりここで説明されるシステム及び技術の実施形態とインタラクションする)、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)とインターネットと、を含む。
【0124】
コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバは、一般に互いに離れており、通常、通信ネットワークを介してインタラクションする。対応するコンピュータで実行され、かつ互いにクライアント-サーバの関係を有するコンピュータプログラムにより、クライアントとサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、分散システムのサーバであってもよく、又はブロックチェーンと組み合わせたサーバであってもよい。
【0125】
本開示の実施例によると、本開示は、コンピュータプログラムをさらに提供し、前記コンピュータプログラムはプロセッサによって実行される場合、本開示の上記実施例に記載のタンパク質のドッキング方法のステップを実現する。
【0126】
なお、上記に説明された様々な形態のフローを使用して、ステップを並べ替えたり、追加したり、又は削除したりすることができる。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術的手段の所望の結果を実現できれば、本明細書では限定しない。
【0127】
上記の具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件と他の要因とに基づいて、様々な訂正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本開示の精神と原則内で行われる任意の訂正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。