IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2022-188603安定構造探索システム、安定構造探索方法及び安定構造探索プログラム
<>
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図1
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図2
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図3
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図4
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図5
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図6
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図7
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図8
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図9
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図10
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図11
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図12
  • 特開-安定構造探索システム、安定構造探索方法及び安定構造探索プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022188603
(43)【公開日】2022-12-21
(54)【発明の名称】安定構造探索システム、安定構造探索方法及び安定構造探索プログラム
(51)【国際特許分類】
   G16B 15/30 20190101AFI20221214BHJP
【FI】
G16B15/30
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021096771
(22)【出願日】2021-06-09
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】寺島 千絵子
(72)【発明者】
【氏名】谷田 義明
(72)【発明者】
【氏名】佐藤 博之
(57)【要約】
【課題】中分子の安定構造を効率的に探索する。
【解決手段】安定構造探索システムは、相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算する算出部と、前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する特定部とを有する。
【選択図】図1
【特許請求の範囲】
【請求項1】
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算する算出部と、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する特定部と
を有する安定構造探索システム。
【請求項2】
前記特定部は、前記中分子を粗視化した粗視化モデルに基づいて前記エネルギを算出する、請求項1に記載の安定構造探索システム。
【請求項3】
前記第2分子は、アミノ酸1残基である、請求項1に記載の安定構造探索システム。
【請求項4】
前記電荷類似度は、前記第1分子が有する電荷の種類と、前記第2分子が有する電荷の種類とに基づいて算出される、請求項2に記載の安定構造探索システム。
【請求項5】
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算し、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する、
処理をコンピュータが実行する安定構造探索方法。
【請求項6】
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算し、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する、
処理をコンピュータに実行させるための安定構造探索プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、安定構造探索システム、安定構造探索方法及び安定構造探索プログラムに関する。
【背景技術】
【0002】
近年、創薬の分野では、副作用の少ない中分子(分子量500~3000)による創薬が期待されており、中分子の安定構造を探索するための探索方法の開発が進められている。
【0003】
一例として、粗視化モデルに対して相互作用ポテンシャルを用いて探索を行う探索方法が挙げられる。当該探索方法によれば、中分子の安定構造に近い初期構造について高速に探索を行うことができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-173643号公報
【特許文献2】国際公開第2019/235567号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記探索方法を適用するためには、探索対象の中分子の粗視化モデルについて、粗視化粒子(分子)の相互作用ポテンシャルを、事前に算出しておく必要がある。このため、例えば、非天然アミノ酸等のように、粗視化モデルに、相互作用ポテンシャルが算出されていない粗視化粒子(分子)が含まれる場合には、まず、粗視化粒子(分子)の相互作用ポテンシャルを膨大な時間をかけて算出する必要があり、非効率である。
【0006】
一つの側面では、中分子の安定構造を効率的に探索することを目的とする。
【課題を解決するための手段】
【0007】
一態様によれば、安定構造探索システムは、
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算する算出部と、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する特定部とを有する。
【発明の効果】
【0008】
中分子の安定構造を効率的に探索することができる。
【図面の簡単な説明】
【0009】
図1】安定構造探索システムのシステム構成の一例を示す図である。
図2】端末装置のハードウェア構成の一例を示す図である。
図3】アミノ酸1残基の情報の一例を示す図である。
図4】類似度算出用情報入力部の機能構成の一例を示す図である。
図5】グラフ化部の処理の具体例を示す図である。
図6】コンフリクトグラフ生成部の処理の具体例を示す図である。
図7】相互作用ポテンシャル取得部の処理の具体例を示す図である。
図8】安定構造探索部の処理の具体例を示す図である。
図9】構造類似度算出部の処理の具体例を示す図である。
図10】電荷類似度算出部の処理の具体例を示す図である。
図11】総合類似度算出部の処理の具体例を示す図である。
図12】総合類似度を算出することの効果を示す図である。
図13】安定構造探索処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
[第1の実施形態]
<安定構造探索システムのシステム構成>
はじめに、第1の実施形態に係る安定構造探索システムのシステム構成について説明する。図1は、安定構造探索システムのシステム構成の一例を示す図である。安定構造探索システム100は、中分子の安定構造を探索するためのシステムであり、第1の実施形態においては、中分子の分子構造を粗視化し、格子空間における粗視化モデルの安定構造を探索することで、高速な探索を実現する。
【0012】
図1に示すように、安定構造探索システム100は、端末装置110と、量子アニーリング装置などのイジング装置120とを有する。
【0013】
端末装置110には、探索プログラムがインストールされており、当該プログラムが実行されることで、端末装置110は、探索対象情報取得部111、類似度算出用情報入力部112、相互作用ポテンシャル取得部113、安定構造探索部114として機能する。
【0014】
探索対象情報取得部111は、安定構造の探索を行う探索対象の中分子の粗視化モデルを取得する。
【0015】
第1の実施形態において、探索対象情報取得部111が取得する探索対象の中分子の粗視化モデルは、例えば、非天然アミノ酸の粗視化モデルのように、相互作用ポテンシャルが算出されていない粗視化粒子(分子)が含まれる粗視化モデルである。
【0016】
探索対象情報取得部111は、取得した粗視化モデルを、類似度算出用情報入力部112に通知する。
【0017】
類似度算出用情報入力部112は、探索対象情報取得部111より粗視化モデルが通知されると、アミノ酸残基情報格納部115を参照する。アミノ酸残基情報格納部115には、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基(例えば、天然アミノ酸1残基)であって、複数種類のアミノ酸1残基についての情報がそれぞれ格納されている。
【0018】
類似度算出用情報入力部112は、アミノ酸残基情報格納部115に格納されている相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)を順次読み出す。また、類似度算出用情報入力部112は、通知された粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、相互作用ポテンシャルが既知の粗視化粒子(分子)との間の類似度を算出する際に用いる算出用情報を順次生成する。
【0019】
また、類似度算出用情報入力部112は、生成した算出用情報を、順次、イジング装置120に入力し、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)それぞれと、
の間の総合類似度(詳細は後述)を算出させる。
【0020】
相互作用ポテンシャル取得部113は、イジング装置120により算出されたそれぞれの総合類似度を、順次、イジング装置120より取得する。また、相互作用ポテンシャル取得部113は、取得した総合類似度の中から、最大の総合類似度を判定し、判定した総合類似度に対応する、相互作用ポテンシャルが既知の粗視化粒子(分子)を抽出する。
【0021】
更に、相互作用ポテンシャル取得部113は、アミノ酸残基情報格納部115を参照し、抽出した、相互作用ポテンシャルが既知の粗視化粒子(分子)に対応付けて格納された相互作用ポテンシャルを取得し、安定構造探索部114に通知する。
【0022】
安定構造探索部114は特定部の一例であり、通知された相互作用ポテンシャルを用いて、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の様々な配置におけるエネルギを算出する。これにより、安定構造探索部114は、エネルギの算出結果が所定の条件を満たす、粗視化粒子(分子)の配置が示す粗視化モデルの分子構造を、粗視化モデルの安定構造として特定する。
【0023】
このように、安定構造探索システム100では、探索対象の中分子の粗視化モデルの安定構造を探索する際、安定構造の探索に用いる粗視化粒子(分子)の未知の相互作用ポテンシャルを、類似する粗視化粒子(分子)の既知の相互作用ポテンシャルで代替する。
【0024】
これにより、安定構造探索システム100によれば、探索対象の中分子の粗視化モデルに、相互作用ポテンシャルが算出されていない粗視化粒子(分子)が含まれていた場合でも、膨大な時間をかけて相互作用ポテンシャルを算出する必要がなくなる。この結果、第1の実施形態によれば、中分子の安定構造を効率的に探索することが可能になる。
【0025】
一方、イジング装置120には、類似度算出プログラムがインストールされており、当該プログラムが実行されることで、イジング装置120は、構造類似度算出部121、電荷類似度算出部122、総合類似度算出部123として機能する。
【0026】
構造類似度算出部121は、類似度算出用情報入力部112より算出用情報を取得する。算出用情報には、構造類似度を算出するための構造類似度算出用情報が含まれており、構造類似度算出部121は、当該構造類似度算出用情報に基づいて、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)それぞれと、
の間の構造類似度を算出する。
【0027】
また、構造類似度算出部121は、算出した構造類似度を、総合類似度算出部123に通知する。
【0028】
電荷類似度算出部122は、類似度算出用情報入力部112より算出用情報を取得する。算出用情報には、電荷類似度を算出するための電荷類似度算出用情報が含まれており、電荷類似度算出部122は、当該電荷類似度算出用情報に基づいて、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)それぞれと、
の間の電荷類似度を算出する。
【0029】
また、電荷類似度算出部122は、算出した電荷類似度を、総合類似度算出部123に通知する。
【0030】
総合類似度算出部123は算出部の一例であり、構造類似度算出部121より通知された構造類似度と、電荷類似度算出部122より通知された電荷類似度とを、重み付け加算することで、総合類似度を算出する。また、総合類似度算出部123は、算出した総合類似度を、端末装置110の相互作用ポテンシャル取得部113に送信する。
【0031】
<端末装置のハードウェア構成>
次に、端末装置110のハードウェア構成について説明する。図2は、端末装置のハードウェア構成の一例を示す図である。
【0032】
図2に示すように、端末装置110は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、端末装置110の各ハードウェアは、バス207を介して相互に接続されている。
【0033】
プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、探索プログラム等)をメモリ202上に読み出して実行する。
【0034】
メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する。
【0035】
補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種情報を格納する。
【0036】
I/F装置204は、外部装置の一例である操作装置210、出力装置220と、端末装置110とを接続する接続デバイスである。
【0037】
通信装置205は、他の装置の一例であるイジング装置120と通信するための通信デバイスである。
【0038】
ドライブ装置206は記録媒体230をセットするためのデバイスである。ここでいう記録媒体230には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体230には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0039】
なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体230がドライブ装置206にセットされ、該記録媒体230に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。
【0040】
なお、ここでは、端末装置110のハードウェア構成についてのみ説明し、イジング装置120のハードウェア構成について説明しなかったが、イジング装置120のハードウェア構成は、例えば、端末装置110と同様であってもよい。あるいは、イジング装置120のハードウェア構成は、いわゆる量子コンピュータのハードウェア構成と同様であってもよい。
【0041】
<アミノ酸1残基の情報の具体例>
次に、アミノ酸残基情報格納部115に格納される、複数種類のアミノ酸1残基についての情報の具体例を説明する。図3は、アミノ酸1残基の情報の一例を示す図である。図3に示すように、アミノ酸1残基の情報300には、情報の項目として、"種類"、"構造"、"電荷"、"相互作用ポテンシャル"が含まれる。
【0042】
"種類"には、相互作用ポテンシャルが既知の粗視化粒子(分子)である、複数種類の天然のアミノ酸1残基が格納される。図3の例は、相互作用ポテンシャルが既知の粗視化粒子(分子)である天然のアミノ酸1残基が、k種類格納された様子を示している。
【0043】
"構造"には、対応する種類の天然のアミノ酸1残基の構造情報が格納される。"電荷"には、対応する種類の天然のアミノ酸1残基の電荷情報が格納される。
【0044】
"相互作用ポテンシャル"には、対応する種類の天然のアミノ酸1残基について事前に算出された相互作用ポテンシャルデータが格納される。
【0045】
図3において、符号310は、所定の種類の天然のアミノ酸1残基について、事前に算出された相互作用ポテンシャルデータの算出方法の概要を示している。符号310に示すように、相互作用ポテンシャルデータを算出するにあたっては、まず、所定の種類の天然のアミノ酸からアミノ酸1残基を取り出し、末端部分を、タンパク質を模して処理するとともに、相互作用を起こさないように、力場を作成する(矢印311参照)。
【0046】
続いて、符号310に示すように、取り出したアミノ酸1残基について、Umbrella Samplingにより、各分子間距離における分子動力学計算を実施する。続いて、符号310に示すように、Weighted Histogram Analysis Methodにより各距離におけるサンプリング結果を統合し、相互作用ポテンシャルデータを生成する(矢印312参照)。
【0047】
図3において、グラフ320は、生成した相互作用ポテンシャルデータを可視化して示したものであり、横軸は各分子間距離を、縦軸はエネルギを表している。
【0048】
<端末装置の各部の処理の具体例>
次に、端末装置110の各部(ここでは、類似度算出用情報入力部112、相互作用ポテンシャル取得部113、安定構造探索部114)の処理の具体例について説明する。
【0049】
(1)類似度算出用情報入力部の処理の具体例
はじめに、類似度算出用情報入力部112の処理の具体例について説明する。図4は、類似度算出用情報入力部の機能構成の一例を示す図である。図4に示すように、類似度算出用情報入力部112は、構造情報取得部401、グラフ化部402、コンフリクトグラフ生成部403、構造類似度算出用情報取得部404、電荷類似度算出用情報取得部405、送信部406を有する。
【0050】
構造情報取得部401は、探索対象情報取得部111により取得された探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の構造情報を取得する。また、構造情報取得部401は、アミノ酸残基情報格納部115から読み出した、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基であって、複数種類のアミノ酸1残基の構造情報をそれぞれ取得する。
【0051】
グラフ化部402は、探索対象情報取得部111より通知された、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の構造情報をグラフ化する。また、グラフ化部402は、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基であって、複数種類のアミノ酸1残基の構造情報をそれぞれグラフ化する。なお、グラフ化部402によるグラフ化とは、例えば、粗視化粒子(分子)に含まれる原子の種類(元素)の情報と各原子の結合状態の情報とを用いて、粗視化粒子(分子)の構造を表すことを意味する。
【0052】
コンフリクトグラフ生成部403は、グラフ化した粗視化粒子(分子)における頂点(原子)どうしを組み合わせて、コンフリクトグラフの頂点(ノード)を作成する。また、コンフリクトグラフ生成部403は、生成したノードどうしを比較し、異なる状況にある原子で構成されているか否かに応じて、ノード間のエッジを作成する。
【0053】
構造類似度算出用情報取得部404は、コンフリクトグラフ生成部403により生成されたコンフリクトグラフそれぞれを、構造類似度算出用情報として取得する。なお、コンフリクトグラフにおいて、ノード間にエッジが存在しないノードで構成される集合のうち、ノード数が最大となる集合(最大独立集合)を求めることは、2つの粗視化粒子(分子)において共通する部分構造のうち、最大のものを求めることと同義である。つまり、構造類似度算出用情報取得部404により取得されたコンフリクトグラフは、構造類似度算出部121が、2つの粗視化粒子(分子)において共通する部分構造のうち、最大のもの(つまり、構造類似度)を求めるのに用いられる。
【0054】
電荷類似度算出用情報取得部405は、探索対象情報取得部111により取得された探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の電荷情報を取得する。また、電荷類似度算出用情報取得部405は、アミノ酸残基情報格納部115から読み出した、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基であって、複数種類のアミノ酸1残基の電荷情報をそれぞれ取得する。
【0055】
また、電荷類似度算出用情報取得部405は、取得した複数種類の粗視化粒子(分子)の電荷情報それぞれを、電荷類似度算出用情報として、送信部406に通知する。
【0056】
送信部406は、構造類似度算出用情報取得部404により取得された構造類似度算出用情報と、電荷類似度算出用情報取得部405により取得された電荷類似度算出用情報とを、算出用情報として、イジング装置120に送信する。
【0057】
a)グラフ化部の処理の詳細
次に、グラフ化部402の処理の詳細について説明する。図5は、グラフ化部の処理の具体例を示す図である。グラフ化部402では、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の構造情報510を取得すると、グラフ511を生成する。図5の構造情報510の例は、粗視化粒子(分子)が、4つの原子により形成され、グラフ511に示すような結合状態で結合されていることを示している。
【0058】
同様に、グラフ化部402では、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の構造情報520を取得すると、グラフ521を生成する。図5の構造情報520の例は、粗視化粒子(分子)が、5つの原子により形成され、グラフ521に示すような結合状態で結合されていることを示している。
【0059】
b)コンフリクトグラフ生成部の処理の詳細
次に、コンフリクトグラフ生成部403の処理の詳細について説明する。図6は、コンフリクトグラフ生成部の処理の具体例を示す図である。コンフリクトグラフ生成部403では、例えば、グラフ化部402より、グラフ511とグラフ521とを取得すると、各グラフの原子を組み合わせて、コンフリクトグラフの頂点(ノード)を作成する。図6の例は、10個のノードが作成されたことを示している。
【0060】
続いて、コンフリクトグラフ生成部403では、
・ノードどうしが異なる状況にある原子で構成される場合は、そのノードの間にエッジを作成する、
・ノードどうしが同じ状況にある原子で構成される場合は、そのノードの間にはエッジを作成しない、
というルールに基づいて、エッジを作成する/作成しないを決定することで、コンフリクトグラフ600を作成する。
【0061】
なお、コンフリクトグラフ生成部403により作成されたコンフリクトグラフ600は、構造類似度算出用情報として、構造類似度算出用情報取得部404により取得され、送信部406により、イジング装置120に送信される。
【0062】
上述したように、コンフリクトグラフ600において、ノード間にエッジが存在しないノードで構成される集合のうち、最大独立集合を求めることは、2つの粗視化粒子(分子)において共通する部分構造のうち、最大のものを求めることと同義である。したがって、コンフリクトグラフ600が送信されるイジング装置120の構造類似度算出部121では、2つの粗視化粒子(分子)において共通する部分構造のうち、最大のものを求めることで、構造類似度を算出する。
【0063】
(2)相互作用ポテンシャル取得部の処理の具体例
次に、相互作用ポテンシャル取得部113の処理の具体例について説明する。図7は、相互作用ポテンシャル取得部の処理の具体例を示す図である。
【0064】
図7の例は、イジング装置120より取得した総合類似度の中から、最大の総合類似度が判定され、判定された最大の総合類似度に対応する粗視化粒子(分子)であるアミノ酸1残基として、"種類"=「アミノ酸残基2」が抽出された様子を示している。
【0065】
相互作用ポテンシャル取得部113では、抽出した「アミノ酸残基2」の"相互作用ポテンシャル"として、アミノ酸残基情報格納部115から「相互作用ポテンシャルデータ2」を読み出し、安定構造探索部114に通知する。なお、符号710は、「アミノ酸残基2」の"相互作用ポテンシャル"である「相互作用ポテンシャルデータ2」の具体例を示している。
【0066】
(3)安定構造探索部の処理の具体例
次に、安定構造探索部114の処理の具体例について説明する。図8は、安定構造探索部の処理の具体例を示す図である。図8において、符号810は、探索対象の中分子の粗視化モデルを表している。説明の簡略化のため、図8の例は、探索対象の中分子の粗視化モデルが、7個の粗視化粒子(分子)により構成されている場合を示している。
【0067】
図8において、符号820は、安定構造探索部114が、相互作用ポテンシャル取得部113により取得された「相互作用ポテンシャルデータ2」を用いて、格子空間における粗視化粒子(分子)の様々な配置におけるエネルギを算出した結果を示している。
【0068】
符号820によれば、配置821、配置822、配置823の各配置におけるエネルギと比較して、配置824のエネルギの方が低い。このため、安定構造探索部114では、探索対象の中分子の粗視化モデル(符号810)について、配置824を、探索結果(粗視化モデルの安定構造)として出力する。
【0069】
<イジング装置の各部の処理の具体例>
次に、イジング装置120の各部(構造類似度算出部121、電荷類似度算出部122、総合類似度算出部123)の処理の具体例について説明する。
【0070】
(1)構造類似度算出部の処理の具体例
はじめに、構造類似度算出部121の処理の具体例について説明する。図9は、構造類似度算出部の処理の具体例を示す図である。
【0071】
図9に示すように、コンフリクトグラフ600の最大独立集合は、例えば、最小化することが最大独立集合の探索を意味するハミルトニアンを用いることにより求めることができる。
【0072】
図9において、符号900は、ハミルトニアン(H)を示す式であり、
n:コンフリクトグラフ600におけるノードの数、
:i番目のノードに対するバイアスを表す数値、
ij:i番目のノードとj番目のノードとの間にエッジが存在するときは0でない正の数、エッジが存在しないときは0、
:i番目のノードが0又は1であることを表すバイナリ変数
:j番目のノードが0又は1であることを表すバイナリ変数、
α、β:正の値、
である。
【0073】
構造類似度算出部121では、ハミルトニアン(H)を示す式(符号900)を用いて最大独立集合を求めることで、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)それぞれと、
の間の最大の共通部分構造を求める。
【0074】
続いて、構造類似度算出部121は、求めた最大独立集合に基づいて、構造類似度を算出する。図9の符号910は、構造類似度S(G,G)を算出するための式であり、
:グラフ化した探索対象の中分子の粗視化モデルにおけるノードの総数、
:グラフ化した探索対象の中分子の粗視化モデルにおけるノードのうち、コンフリクトグラフ600の最大独立集合に含まれるノードの数、
:グラフ化した、相互作用ポテンシャルが既知の粗視化モデルにおけるノードの総数、
:グラフ化した、相互作用ポテンシャルが既知の粗視化モデルにおけるノードのうち、コンフリクトグラフ600の最大独立集合に含まれるノードの数、
δ:0~1の値、
である。
【0075】
(2)電荷類似度算出部の処理の具体例
次に、電荷類似度算出部122の処理の具体例について説明する。図10は、電荷類似度算出部の処理の具体例を示す図である。
【0076】
図10において、テーブル1000は、電荷類似度算出部122による電荷類似度の算出方法を示している。テーブル1000に示すように、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の電荷の種類をAchg、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の電荷の種類をBchgとする。この場合、電荷類似度算出部122では、電荷類似度δAchgBchgを、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)の電荷の種類と、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の電荷の種類とが等しい場合:1
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)の電荷の種類と、相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の電荷の種類とが異なる場合:0
として算出する。
【0077】
図10において、テーブル1010は、電荷類似度算出部122により算出される電荷類似度の具体例を示している。
【0078】
テーブル1010に示すように、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)の電荷の種類Achgが正電荷であった場合、
・相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の粗視化モデルの電荷の種類Bchgが正電荷の場合には、電荷類似度=1、負電荷の場合には、電荷類似度=0、電荷無しの場合には電荷類似度=0と算出される。
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)の電荷の種類Achgが負電荷であった場合、
・相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の粗視化モデルの電荷の種類Bchgが正電荷の場合には、電荷類似度=0、負電荷の場合には、電荷類似度=1、電荷無しの場合には電荷類似度=0と算出される。
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)の電荷の種類Achgが電荷無しであった場合、
・相互作用ポテンシャルが既知の粗視化粒子(分子)であるアミノ酸1残基の粗視化モデルの電荷の種類Bchgが正電荷の場合には、電荷類似度=0、負電荷の場合には、電荷類似度=0、電荷無しの場合には電荷類似度=1と算出される。
【0079】
(3)総合類似度算出部の処理の具体例
次に、総合類似度算出部123の処理の具体例について説明する。図11は、総合類似度算出部の処理の具体例を示す図である。図11に示すように、総合類似度算出部123では、構造類似度と電荷類似度とを重み付け加算することで総合類似度を算出する。なお、図11において、
・1/2×(ABcommon/Aall+ABcommon/Ball):構造類似度、
・δAchgBchg:電荷類似度、
をそれぞれ表している。また、図11の例は、構造類似度と電荷類似度とを、重み係数=1/2で重み付け加算する場合を示している。
【0080】
<総合類似度を算出することの効果>
次に、イジング装置120が総合類似度を算出することの効果について検証する。図12は、総合類似度を算出することの効果を示す図である。図12の例では、相互作用ポテンシャルが既知の2種類の粗視化粒子(分子)について、
・構造類似度の算出結果と、
・総合類似度の算出結果と、
・2種類の粗視化粒子(分子)の相互作用ポテンシャルデータの誤差と、
を示すことで、構造類似度と総合類似度のいずれの算出結果が、相互作用ポテンシャルの類似度をより精度よく表しているかを検証したものである。
【0081】
このうち、符号1210は、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)を「バリン」と仮定し、相互作用ポテンシャルが既知の粗視化粒子(分子)を「イソロシン」と仮定した場合の検証結果を示している。符号1210によれば、「バリン」と「イソロシン」の構造類似度は「0.96」であり、総合類似度は「0.98」である。一方、「バリン」の相互作用ポテンシャルデータと、「イソロシン」の相互作用ポテンシャルデータとの誤差(RMSE)は「0.07」であり、両者の相互作用ポテンシャルは、類似している(グラフ1211参照)。
【0082】
したがって、符号1210の場合、構造類似度の算出結果も総合類似度の算出結果も、いずれも、相互作用ポテンシャルの類似度を精度よく表しているといえる。
【0083】
これに対して、符号1220は、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)を「アスパラギン酸」と仮定し、相互作用ポテンシャルが既知の粗視化粒子(分子)を「アスパラギン」と仮定した場合の検証結果を示している。符号1220によれば、「アスパラギン酸」と「アスパラギン」の構造類似度は「0.92」であるのに対して、総合類似度は「0.46」である。一方、「アスパラギン酸」の相互作用ポテンシャルデータと、「アスパラギン」の相互作用ポテンシャルデータとの誤差(RMSE)は、「0.39」であり、両者の相互作用ポテンシャルは、非類似である(グラフ1221参照)。
【0084】
したがって、符号1220の場合、構造類似度の算出結果は、相互作用ポテンシャルの類似度を精度よく表しているとはいえない。一方、総合類似度の算出結果は、相互作用ポテンシャルの類似度を精度よく表しているといえる。
【0085】
また、符号1230は、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)を「アスパラギン酸」と仮定し、相互作用ポテンシャルが既知の粗視化粒子(分子)を「グルタミン酸」と仮定した場合の検証結果を示している。符号1230によれば、「アスパラギン酸」と「グルタミン酸」の構造類似度は「0.89」であるのに対して、総合類似度は「0.95」である。一方、「アスパラギン酸」の相互作用ポテンシャルデータと、「グルタミン酸」の相互作用ポテンシャルデータとの誤差(RMSE)は、「0.06」であり、両者の相互作用ポテンシャルは、類似している(グラフ1231参照)。
【0086】
ここで、符号1220と符号1230とを対比すると、探索対象の中分子の粗視化モデルが「アスパラギン酸」であった場合、構造類似度のみで判定すると、「グルタミン酸」ではなく、「アスパラギン」が探索結果として出力されることになる。「アスパラギン」の構造類似度(=0.92)>「グルタミン酸」の構造類似度(=0.89)の関係にあるからである。
【0087】
しかしながら、グラフ1221から明らかなように、「アスパラギン酸」の相互作用ポテンシャルと、「アスパラギン」の相互作用ポテンシャルとは、非類似である。つまり、構造類似度のみで判定した場合、誤った探索結果が出力されることになる。
【0088】
一方、総合類似度で判定すると、「グルタミン酸」が探索結果として出力されることになる。「アスパラギン」の総合類似度(=0.46)<「グルタミン酸」の総合類似度(=0.95)の関係にあるからである。
【0089】
そして、グラフ1231から明らかなように、「アスパラギン酸」の相互作用ポテンシャルと、「グルタミン酸」の相互作用ポテンシャルとは、類似している。つまり、総合類似度を用いて判定した場合、正しい探索結果が出力されることになる。
【0090】
<安定構造探索処理の流れ>
次に、安定構造探索システム100による安定構造探索処理の流れについて説明する。図13は、安定構造探索処理の流れを示すフローチャートである。
【0091】
ステップS1301において、端末装置110は、探索対象情報として、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の構造情報と、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)の電荷情報とを取得する。
【0092】
ステップS1302において、端末装置110は、アミノ酸残基情報格納部115より、アミノ酸1残基の情報300を読み出す。
【0093】
ステップS1303において、端末装置110は、アミノ酸1残基の情報300に含まれるアミノ酸1残基の種類の数をカウントするカウンタmに1を入力する。
【0094】
ステップS1304において、端末装置110は、探索対象情報と、m番目のアミノ酸1残基の構造情報及び電荷情報とに基づいて、m番目の算出用情報(構造類似度算出用情報、電荷類似度算出用情報)を算出する。
【0095】
ステップS1305において、端末装置110は、m番目の算出用情報をイジング装置120に送信する。
【0096】
ステップS1306において、イジング装置120は、端末装置110より受信したm番目の算出用情報に基づいて、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知のm番目のアミノ酸1残基と、
の構造類似度を算出する。
【0097】
ステップS1307において、イジング装置120は、端末装置110より受信したm番目の算出用情報に基づいて、
・探索対象の中分子の粗視化モデルに含まれる、相互作用ポテンシャルが算出されていない粗視化粒子(分子)と、
・相互作用ポテンシャルが既知のm番目のアミノ酸1残基と、
の電荷類似度を算出する。
【0098】
ステップS1308において、イジング装置120は、構造類似度と電荷類似度とに基づいて、総合類似度を算出し、端末装置110に送信する。
【0099】
ステップS1309において、端末装置110は、相互作用ポテンシャルが既知の全ての種類のアミノ酸1残基について、総合類似度を算出したか否かを判定する。
【0100】
ステップS1309において、総合類似度を算出していない、相互作用ポテンシャルが既知のアミノ酸1残基があると判定した場合には(ステップS1309においてNOの場合には)、ステップS1310に進む。
【0101】
ステップS1310において、端末装置110は、相互作用ポテンシャルが既知のアミノ酸1残基の種類の数をカウントするカウンタmをインクリメントしたうえで、ステップS1304に戻る。
【0102】
一方、ステップS1309において、相互作用ポテンシャルが既知の全ての種類のアミノ酸1残基について、総合類似度を算出したと判定した場合には(ステップS1309においてYESの場合には)、ステップS1311に進む。
【0103】
ステップS1311において、端末装置110は、イジング装置120から送信された複数の総合類似度の中から、最大の総合類似度に対応するアミノ酸1残基を抽出する。また、端末装置110は、アミノ酸残基情報格納部115を参照し、抽出したアミノ酸1残基に対応付けられた相互作用ポテンシャルデータを読み出す。
【0104】
ステップS1312において、端末装置110は、読み出した相互作用ポテンシャルデータを用いて、探索対象の中分子の粗視化モデルの安定構造を探索する。また、端末装置110は、探索した安定構造による粗視化モデルの分子構造(各粗視化粒子(各分子)の配置)を出力する。
【0105】
以上の説明から明らかなように、第1の実施形態に係る安定構造探索システム100は、相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)それぞれと探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子(第1分子に対応))との間の構造類似度を算出する。
【0106】
また、安定構造探索システム100は、相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)と、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子(第1分子に対応))との間の電荷類似度を算出する。
【0107】
また、安定構造探索システム100は、構造類似度と電荷類似度とを重み付け加算する。また、安定構造探索システム100は、重み付け加算した結果に基づいて、相互作用ポテンシャルが既知の複数種類の粗視化粒子(分子)の中から、1の粗視化粒子(分子(第2分子に対応))を抽出する。
【0108】
また、安定構造探索システム100は、抽出した粗視化粒子(分子(第2分子に対応))の相互作用ポテンシャルを用いることで、粗視化モデルに含まれる粗視化粒子(分子(第1分子に対応))の様々な配置におけるエネルギを算出する。更に、安定構造探索システム100は、算出したエネルギが所定の条件を満たす、探索対象の中分子の粗視化モデルの分子構造を特定する。
【0109】
このように、安定構造探索システム100では、探索対象の中分子の粗視化モデルの安定構造を探索するにあたり、探索対象の中分子の粗視化モデルに含まれる粗視化粒子(分子)と構造及び電荷が類似する粗視化粒子(分子)の相互作用ポテンシャルを用いる。これにより、安定構造探索システム100によれば、探索対象の中分子の粗視化モデルに、相互作用ポテンシャルが算出されていない粗視化粒子(分子)が含まれていた場合でも、相互作用ポテンシャルを算出する必要がない。このため、相互作用ポテンシャルを算出するのに要する膨大な時間を削減することができる。
【0110】
この結果、第1の実施形態によれば、中分子の安定構造を効率的に探索することができる。
【0111】
[第2の実施形態]
上記第1の実施形態では、安定構造探索システム100が端末装置110とイジング装置120とを有するものとして説明した。しかしながら、安定構造探索システム100は、端末装置110とイジング装置120以外の装置(つまり、3台以上の装置)により形成されてもよい。あるいは、安定構造探索システム100は、一体化された装置(つまり、1台の装置)により形成されてもよい。この場合、安定構造探索処理(図13)は、当該1台の装置により、安定構造探索プログラム(探索プログラム+類似度算出プログラム)が実行されることで実現されることになる。
【0112】
また、上記第1の実施形態では、端末装置110が、探索対象情報取得部111~安定構造探索部114を有し、イジング装置120が、構造類似度算出部121~総合類似度算出部123を有するものとして説明した。しかしながら、端末装置110の一部の機能は、イジング装置120において実現されてもよい。同様に、イジング装置120の一部の機能は、端末装置110において実現されてもよい。
【0113】
なお、開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算する算出部と、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する特定部と
を有する安定構造探索システム。
(付記2)
前記特定部は、前記中分子を粗視化した粗視化モデルに基づいて前記エネルギを算出する、付記1に記載の安定構造探索システム。
(付記3)
前記第2分子は、アミノ酸1残基である、付記1に記載の安定構造探索システム。
(付記4)
前記構造類似度は、前記第1分子と前記第2分子との間の共通する部分構造のうち最大のものを求めることで算出される、付記2に記載の安定構造探索システム。
(付記5)
前記構造類似度は、粗視化モデルをグラフ化し、コンフリクトグラフを生成することで算出される、付記4に記載の安定構造探索システム。
(付記6)
前記電荷類似度は、前記第1分子が有する電荷の種類と、前記第2分子が有する電荷の種類とに基づいて算出される、付記2に記載の安定構造探索システム。
(付記7)
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算し、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する、
処理をコンピュータが実行する安定構造探索方法。
(付記8)
相互作用ポテンシャルが既知の複数種類の分子それぞれと探索対象の中分子に含まれる第1分子との間の構造類似度と、前記複数種類の分子それぞれと前記第1分子との間の電荷類似度と、を重み付け加算し、
前記重み付け加算した結果に基づいて前記複数種類の分子の中から抽出された第2分子の前記相互作用ポテンシャルに基づき、前記探索対象の中分子の分子構造のエネルギを算出し、算出された前記エネルギが所定の条件を満たすかを特定する、
処理をコンピュータに実行させるための安定構造探索プログラム。
【0114】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0115】
100 :安定構造探索システム
110 :端末装置
111 :探索対象情報取得部
112 :類似度算出用情報入力部
113 :相互作用ポテンシャル取得部
114 :安定構造探索部
121 :構造類似度算出部
122 :電荷類似度算出部
123 :総合類似度算出部
300 :アミノ酸1残基の情報
401 :構造情報取得部
402 :グラフ化部
403 :コンフリクトグラフ生成部
404 :構造類似度算出用情報取得部
405 :電荷類似度算出用情報取得部
406 :送信部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13