(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-27
(45)【発行日】2023-04-04
(54)【発明の名称】結合構造探索装置、結合構造探索方法、及び結合構造探索プログラム
(51)【国際特許分類】
G16C 20/40 20190101AFI20230328BHJP
【FI】
G16C20/40
(21)【出願番号】P 2019075588
(22)【出願日】2019-04-11
【審査請求日】2022-01-11
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100107515
【氏名又は名称】廣田 浩一
(72)【発明者】
【氏名】佐藤 博之
【審査官】塩田 徳彦
(56)【参考文献】
【文献】特開2018-022446(JP,A)
【文献】米国特許第7574306(US,B1)
【文献】米国特許出願公開第2003/0135331(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
分子の安定な結合構造を探索する装置であって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とを有する構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないように、かつ前記同一の分割点どうしが同じ前記格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する作成部、
を有することを特徴とする結合構造探索装置。
【請求項2】
前記分子が分岐構造を有する分子であり、
前記分割点が前記分岐構造を有する分子における分岐点であり、
前記分岐構造を有する分子を、前記分岐点から分岐末端までからなる直鎖状分子単位と、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位を有する構造とみなす、請求項1に記載の結合構造探索装置。
【請求項3】
前記直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなす、請求項1から2のいずれかに記載の結合構造探索装置。
【請求項4】
作成した前記分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる前記分子の立体構造を算出する算出部を有する、請求項1から3のいずれかに記載の結合構造探索装置。
【請求項5】
前記分子がタンパク質である、請求項1から4のいずれかに記載の結合構造探索装置。
【請求項6】
前記分割点が前記タンパク質の主鎖に位置し、前記直鎖状分子単位がアミノ酸残基又は前記タンパク質の主鎖の一部である、請求項5に記載の結合構造探索装置。
【請求項7】
コンピュータを用いて、分子の安定な結合構造を探索する方法であって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないようにかつ前記同一の分割点どうしが同じ格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する工程、
を含むことを特徴とする分子の結合構造探索方法。
【請求項8】
分子の安定な結合構造を探索するプログラムであって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないようにかつ前記同一の分割点どうしが同じ格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する処理、
をコンピュータに行わせることを特徴とする結合構造探索プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本件は、結合構造探索装置、結合構造探索方法、及び結合構造探索プログラムに関する。
【背景技術】
【0002】
近年、創薬などの場面においては、計算機(コンピュータ)を用いてサイズの大きな分子の安定構造を求めることが必要となる場合がある。しかし、例えば、タンパク質などのサイズの大きな分子は、全ての原子を露わに考慮する計算では、現実的な時間内に安定構造を探索することが困難になる場合がある。
【0003】
そこで、分子の構造を粗く捉える(粗視化する)ことで、計算時間を短縮する技術が研究されている。分子構造の粗視化に関する技術としては、例えば、標的タンパク質及びこれに結合するペプチド分子について、それぞれの分子を形成する各アミノ酸残基を一つの点(粒子)に粗視化して扱う技術が知られている(例えば、特許文献1参照)。
分子構造の粗視化に関する技術としては、例えば、タンパク質におけるアミノ酸残基の一次元配列情報に基づき、直鎖(一続き)の単純立方格子構造に粗視化して、格子タンパク質(Lattice Protein)として扱う技術が研究されている。Lattice Proteinにおいては、量子アニーリングの技術を用いて、安定構造を高速に探索する技術が報告されている(例えば、非特許文献1参照)。
【0004】
このようなLattice Proteinにおける安定構造をアニーリングマシンで探索する技術においては、利用するハードウェアの制約により、扱うことができる演算ビット又は量子ビットの数に制約が存在する場合がある。ここで、Lattice Proteinにおける安定構造を探索するために必要とされるビット数は、タンパク質やペプチドの規模(アミノ酸残基の数)に対して指数関数的に増加する。
そのため、上記の従来の技術においては、利用するハードウェアで扱うことができるビットの数の制約により、安定構造の探索対象としてのタンパク質やペプチドのアミノ酸残基の数が制限される場合がある。さらに、上記の従来の技術においては、タンパク質やペプチドを形成する全てのアミノ酸を同時に扱うことができる数のビット数が必要とされるため、計算の効率が悪い場合がある。
【0005】
また、Lattice Proteinにおける安定構造を探索する従来の技術は、タンパク質の主鎖の構造のみを考慮して構造を探索するものである。このため、このような従来の技術においては、タンパク質の側鎖の構造を考慮することができない。
ここで、例えば、創薬などの場面においては、標的となるタンパク質に結合可能な医薬候補となるタンパク質やペプチドの安定構造を探索する際に、アミノ酸の主鎖の取り得る構造に、当該アミノ酸の側鎖の構造(位置)が影響すると考えられる。そのため、Lattice Proteinの技術を創薬に応用する場合などには、タンパク質を形成するアミノ酸の主鎖だけでなく、アミノ酸の側鎖を含めた構造における安定構造を探索することが必要になる場合がある。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】R. Babbush et.al., Construction of Energy Functions for Lattice Heteropolymer Models: A Case Study in Constraint Satisfaction Programmisng and Adiabatic Quantum Optimization, Advances in Chemical Physics, 155, 201-244
【発明の概要】
【発明が解決しようとする課題】
【0008】
一つの側面では、本件は、分子の安定な結合構造を計算機により探索する際に用いるビットの数を少なくすることができる結合構造探索装置、結合構造探索方法、及び結合構造探索プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記の課題を解決するための手段の一つの実施態様は、以下の通りである。
すなわち、一つの実施態様では、結合構造探索装置は、分子の安定な結合構造を探索する装置であって、
分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とを有する構造とみなし、
格子の集合である三次元格子空間の各格子点に、
一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、
三次元格子空間に分子の立体構造を作成する作成部、を有する。
【0010】
また、一つの実施態様では、結合構造探索方法は、コンピュータを用いて、分子の安定な結合構造を探索する方法であって、
分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、
三次元格子空間に分子の立体構造を作成する工程、を含む。
【0011】
さらに、一つの実施態様では、結合構造探索プログラムは、分子の安定な結合構造を探索するプログラムであって、
分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、
三次元格子空間に分子の立体構造を作成する処理、をコンピュータに行わせる。
【発明の効果】
【0012】
一つの側面では、本件は、分子の安定な結合構造を計算機により探索する際に用いるビットの数を少なくすることができる結合構造探索装置、結合構造探索方法、及び結合構造探索プログラムを提供できる。
【図面の簡単な説明】
【0013】
【
図1A】
図1Aは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その1)。
【
図1B】
図1Bは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その2)。
【
図1C】
図1Cは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その3)。
【
図2A】
図2Aは、Diamond encording法の一例を説明するための模式図である(その1)。
【
図2B】
図2Bは、Diamond encording法の一例を説明するための模式図である(その2)。
【
図2C】
図2Cは、Diamond encording法の一例を説明するための模式図である(その3)。
【
図2D】
図2Dは、Diamond encording法の一例を説明するための模式図である(その4)。
【
図2E】
図2Eは、Diamond encording法の一例を説明するための模式図である(その5)。
【
図3】
図3は、アミノ酸残基の数と、必要なbit数との関係の一例を表すグラフである。
【
図4】
図4は、従来の技術におけるダイアモンド格子空間を設定手法の一例を説明するための模式図である。
【
図5】
図5は、本件で開示する技術の一例におけるダイアモンド格子空間を設定手法の一例を説明するための模式図である。
【
図6】
図6は、直鎖状分子単位の配置の一例を示す模式図である。
【
図7】
図7は、複数の直鎖状分子単位を有する分子の構造の一例を示す模式図である。
【
図8】
図8は、直鎖状分子単位を更に分割する際の一例を示す模式図である。
【
図9】
図9は、アミノ酸残基の側鎖の構造を考慮する場合としない場合における、同一の分子を粗視化した構造の一例を示す模式図である。
【
図10】
図10は、
図9に示した分子について、安定な構造を探索した場合の一例を示す模式図である。
【
図11】
図11は、アミノ酸残基の側鎖の構造を考慮して粗視化したタンパク質を、複数の直鎖状分子単位に分割した様子の一例を示す模式図である。
【
図12】
図12は、本件で開示する結合構造探索装置の構成例を表す図である。
【
図13】
図13は、本件で開示する結合構造探索装置の他の構成例を表す図である。
【
図14】
図14は、本件で開示する結合構造探索装置の他の構成例を表す図である。
【
図15】
図15は、直鎖状のタンパク質の安定構造を探索する方法の一例を示すフローチャートである。
【
図16】
図16は、半径rにある各格子をS
rとした場合の一例を表す図である。
【
図17A】
図17Aは、アミノ酸残基の移動先の格子点の集合の一例を表す図である(その1)。
【
図17B】
図17Bは、アミノ酸残基の移動先の格子点の集合の一例を表す図である(その2)。
【
図17C】
図17Cは、アミノ酸残基の移動先の格子点の集合の一例を表す図である(その3)。
【
図17D】
図17Dは、アミノ酸残基の移動先の格子点の集合の一例を表す図である(その4)。
【
図18】
図18は、S
1、S
2、S
3を三次元で表した場合の一例を示す図である。
【
図19A】
図19Aは、各ビットX
1~X
nに空間の情報を割り振る様子の一例を示す図である(その1)。
【
図19B】
図19Bは、各ビットX
1~X
nに空間の情報を割り振る様子の一例を示す図である(その2)。
【
図19C】
図19Cは、各ビットX
1~X
nに空間の情報を割り振る様子の一例を示す図である(その3)。
【
図20】
図20は、H
oneの一例を説明するための図である。
【
図21】
図21は、H
olapの一例を説明するための図である。
【
図22】
図22は、H
conn1及びH
conn2の一例を説明するための図である。
【
図23A】
図23Aは、H
pair1及びH
pair2の一例を説明するための図である(その1)。
【
図23B】
図23Bは、H
pair1及びH
pair2の一例を説明するための図である(その2)。
【
図25】
図25は、イジングモデルのエネルギー式(ハミルトニアン)を構築する際の条件の一例を示す説明図である。
【
図26】
図26は、アミノ酸残基の側鎖の構造を考慮してタンパク質の安定構造を探索する方法の一例を示すフローチャートである。
【
図27】
図27は、焼き鈍し法に用いる最適化装置(制御部)の機能構成の一例を示す図である。
【
図28】
図28は、遷移制御部の回路レベルの一例を示すブロック図である。
【
図29】
図29は、遷移制御部の動作フローの一例を示す図である。
【
図30】
図30は、実施形態1及び2、並びに従来技術において、タンパク質(ペプチド)の安定な結合構造を探索する際に必要とされる格子点の数と、探索した安定構造の差異の一例を示す図である。
【発明を実施するための形態】
【0014】
(結合構造探索装置)
本件で開示する結合構造探索装置は、分子の安定な結合構造を探索する装置である。本件で開示する結合構造探索装置は、作成部を有し、算出部を有することが好ましく、更に必要に応じてその他の部(手段)を有する。
【0015】
まず、本件で開示する技術の詳細を説明する前に、Lattice Proteinを用いた技術の一つであるDiamond encording法によって、タンパク質の折り畳み構造を求める方法について説明する。
【0016】
Lattice Proteinを用いたタンパク質(又はべプチド)の構造探索を行う際には、まず、タンパク質の粗視化を行う。ここで、タンパク質の粗視化は、例えば、
図1Aに示すように、タンパク質を構成する原子2を、アミノ酸残基ごとの単位である粗視化粒子1A、1B、1Cに粗視化して粗視化モデルを作成することにより行う。
次に、作成した粗視化モデルを用いて安定な結合構造の探索を行う。
図1Bにおいては、粗視化粒子1Cが矢印の終点に位置する結合構造が安定である場合の例を示す。ここで、安定な結合構造の探索は、後述するDiamond encording法によって行う。
そして、
図1Cに示すように、Diamond encording法を用いて探索した安定な結合構造に基づいて、粗視化モデルを全原子のモデルに戻す。
【0017】
ここで、Diamond encording法は、一般的に、タンパク質を形成する鎖状のアミノ酸を粗視化した粒子(粗視化モデル)を、ダイアモンド格子の格子点に当てはめていく手法であり、三次元のタンパク質の構造を表現可能である。
以下では、説明の簡略化のため、Diamond encording法について、二次元の場合を例として説明する。
【0018】
図2Aは、5つのアミノ酸残基が結合した直鎖ペンタペプチドが直線構造を有する場合の構造の一例を示す図である。また、
図2A~
図2Eにおいて、丸の中の番号は、直鎖ペンタペプチドにおけるアミノ酸残基の番号を表す。
【0019】
Diamond encording法において、まず、ダイアモンド格子の中心に、番号1のアミノ酸残基を配置すると、
図2Aに示すように、番号2のアミノ酸残基の配置可能な場所は、中心に隣接する
図2Bに示す場所(番号2が付された場所)に限定される。
続いて、番号2のアミノ酸残基に結合する番号3のアミノ酸残基の配置可能な場所は、
図2Cにおいて、
図2Bで番号2が付された場所に隣接する場所(番号3が付された場所)に限定される。
そして、番号3のアミノ酸残基に結合する番号4のアミノ酸残基の配置可能な場所は、
図2Dにおいて、
図2Cで番号3が付された場所に隣接する場所(番号4が付された場所)に限定される。
さらに、番号4のアミノ酸残基に結合する番号5のアミノ酸残基の配置可能な場所は、
図2Eにおいて、
図2Dで番号4が付された場所に隣接する場所(番号5が付された場所)に限定される。
このようにして特定された配置可能な場所どうしを、アミノ酸残基の番号の順に繋いでいくことにより、粗視化したタンパク質の構造を表現することができる。
【0020】
ここで、上述したような従来の技術においては、安定な結合構造の探索対象としてのタンパク質を、アミノ酸残基が単に鎖状に連続して結合したものとして扱う。このため、タンパク質の安定な構造を、アニーリングマシンなどを用いて探索する際には、タンパク質を形成する全てのアミノ酸を同時に扱うことができる数のビット数が必要となる。
アミノ酸残基が単に鎖状に連続して結合したものとしてタンパク質を扱う場合には、例えば、
図3に示すように、構造の探索に必要とされるビット数は、タンパク質を形成するアミノ酸残基の数が増えると指数関数的に増加する。
【0021】
タンパク質の安定な構造を、アニーリングマシンなどを用いて探索する場合には、用いるハードウェアの制約により、扱うことができる演算ビット又は量子ビットの数に制約が存在する場合がある。このため、利用するハードウェアで扱うことができるビットの数の制約により、安定構造の探索対象としてのタンパク質やペプチドのアミノ酸残基の数が制限される場合がある。
また、近年では、いわゆる中分子創薬に注目が集まっており、中分子医薬候補となる数残基から50残基程度のタンパク質やペプチドの安定構造を探索することが求められる場合がある。この場合、上述したような従来の技術においては、利用するハードウェアで扱うことができるビットの数の制約により、中分子医薬候補となる数残基から50残基程度のタンパク質やペプチドの安定構造を探索することができないときがある。
【0022】
さらに、上記の従来の技術においては、タンパク質やペプチドを形成する全てのアミノ酸を同時に扱うことができる数のビット数が必要とされるため、計算の効率が悪い場合がある。
【0023】
そこで、本発明者は、分子の安定な結合構造を計算機により探索する際に用いるビットの数を少なくすることができる装置等について鋭意検討を重ね、本件で開示する技術を想到した。すなわち、本発明者は、分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とを有する構造とみなし、格子の集合である三次元格子空間の各格子点に、一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、三次元格子空間に分子の立体構造を作成することにより、分子の安定な結合構造を計算機により探索する際に用いるビットの数を少なくできることを見出した。
以下では、本件で開示する技術の一例を、図面を参照しながら説明する。
【0024】
図4に示すように、従来の技術においては、5つのアミノ酸残基が結合した直鎖ペンタペプチドの安定構造を探索する場合、結合させるアミノ酸残基の数(n)に応じて、半径(n)のダイアモンド格子空間を設定する。このため、
図4の例においては、格子点を41個用意する必要があり、格子点の数に応じてアニーリングマシン等における演算ビット又は量子ビットを用意する必要がある。なお、以下では、演算ビットと量子ビットとをまとめて、単に「ビット」と称することがある。
【0025】
一方、本件で開示する技術の一例においては、例えば、
図5に示すように、直鎖ペンタペプチドの3つ目のアミノ酸残基を分割点として、直鎖ペンタペプチドを2つの直鎖上分子単位とを有する構造とみなす。言い換えると、分子としての直鎖ペンタペプチドを、一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と一の分割点を含む他の直鎖状分子単位とを有する構造とみなす。
こうすることにより、本件で開示する技術は、一つの側面では、分子の安定な結合構造を探索する際に用いる、三次元格子空間の一例であるダイアモンド格子空間における格子点の数を少なくすることができ、必要とされるビットの数を少なくすることができる。より具体的には、
図5に示す例では、一つの直鎖状分子単位は3つのアミノ酸残基で形成されているため、一つの直鎖状分子単位の構造の探索に必要とされる格子点は13個となる。このため、直鎖状分子単位ごとに格子点を用意した場合には、分子全体の構造を探索するのに必要とされる格子点の数は26個となる。
このように、
図5に示す例においては、
図4に示した従来技術の例と比べると、より少ない数の格子点で構造の探索が可能であることがわかる。このように、
図5の例では、構造の探索に必要とされる格子点の数を減らすことができるため、必要とされるビットの数を少なくすることができる。また、本件で開示する技術は、一つの側面では、実際には三次元格子空間での構造探索を行うため、上記の
図4及び5に示した例よりも、大きな割合で必要とされる格子点の数を減らすことができ、例えば、必要とされるビットの数を1/3以下とすることができる。
すなわち、本件で開示する技術は、一つの側面では、分子を、一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と一の分割点を含む他の直鎖状分子単位とを有する構造(一の直鎖状分子単位と他の直鎖状分子単位が結合した構造)とみなすことにより、構造の探索に必要とされるビットの数を少なくすることができる。
【0026】
また、本件で開示する技術の一例においては、一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置する。
例えば、
図6に示す例では、構造を探索するタンパク質におけるアミノ酸の結合順序(アミノ酸配列)の情報などに基づいて、分割点となる番号3のアミノ酸を、直鎖状分子単位aと直鎖状分子単位bとにおいて同一の格子点に位置するように配置する。さらに、
図6に示す例では、例えば、直鎖状分子単位aに含まれる番号1及び2のアミノ酸残基を、直鎖状分子単位bに含まれる番号4及び5のアミノ酸残基と互いに重ならないように配置する。
こうすることにより、本件で開示する技術は、一つの側面では、構造を探索するタンパク質を分割した直鎖状分子単位どうしを、当該タンパク質として矛盾のない構造となるように配置した構造を作成できる。これにより、本件で開示する技術は、一つの側面では、アニーリングマシンなどを用いて基底状態探索を実行する場合に、分子の構造の探索に必要とされるビットの数を抑制しつつ、分子の構造として矛盾がなく、エネルギーが最小となる分子の立体構造を算出することができる。
なお、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置する具体的な手法については後述する。
【0027】
なお、直鎖状分子単位の構造(形状)としては、特に制限はなく、直線状でなくてもよい。例えば、
図7に示すように、構造を探索する分子における直鎖状分子単位が曲がった構造を有していてもよい。
【0028】
また、本件で開示する技術の一例においては、直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなす。言い換えると、本件で開示する技術の一例においては、一つ直鎖状分子単位の端以外に位置する粒子を分割点として、当該直鎖状分子単位を更に分割する。
【0029】
より具体的には、例えば、
図8の左部のように、8個の粒子で形成された分子について、番号3の粒子を分割点とすると、当該分子は、3個の粒子で形成された直鎖状分子単位cと6個の粒子で形成された直鎖状分子単位dを有する構造とみなすことができる。
ここで、
図8の右部のように、上記の6個の粒子で形成された直鎖状分子単位dを、更に番号6の粒子を分割点として分割すると、直鎖状分子単位dは、4つの粒子で形成された直鎖状分子単位d1と3つの粒子で形成された直鎖状分子単位d2からなる構造とみなすことができる。この場合、
図8の右部に示す分子は、直鎖状分子単位c、直鎖状分子単位d1、及び直鎖状分子単位d1からなる構造とみなすことができる。
【0030】
安定構造の探索に必要となる格子点の数は、最も粒子数の多い直鎖状分子単位の粒子数に応じて決まるため、直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなすことで、構造の探索に必要とされる格子点の数を小さくすることができる。構造の探索に必要とされる格子点の数を減らすことができると、上述したように、構造の探索に必要とされるビットの数を少なくすることができる。
すなわち、本件で開示する技術は、一つの側面では、直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなすことにより、構造の探索に必要とされる格子点を少なくできるため、必要とされるビットの数を少なくすることができる。
【0031】
さらに、本件で開示する技術は、一つの側面では、分岐構造を有する分子に好適に適用することができる。言い換えると、本件で開示する技術の一例では、分割点が分岐構造を有する分子における分岐点であり、当該分子を、分岐点から分岐末端までからなる直鎖状分子単位と、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位を有する構造とみなす。
こうすることにより、本件で開示する技術は、一つの側面では、分岐構造を有する分子における安定構造を、分子の構造探索に必要とされるビットの数を抑制しつつ探索することができる。
【0032】
ここで、分岐構造を有する分子としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、アミノ酸残基の側鎖を含めた構造におけるタンパク質、ソフトマテリアル分野で用いられる分岐構造を有するポリマー等の分子などが挙げられる。
以下では、分岐構造を有する分子として、アミノ酸残基の側鎖を含めた構造におけるタンパク質を例として説明する。
【0033】
Lattice Proteinにおける安定構造を探索する従来の技術は、タンパク質の主鎖の構造のみを考慮して構造を探索するものであり、タンパク質の側鎖の構造を考慮することができない。タンパク質の立体構造には、タンパク質の主鎖だけではなく、タンパク質を形成するアミノ酸残基の側鎖の構造(位置)が影響すると考えられる。
例えば、
図9の左部に示すように、Lattice Proteinにおける従来の技術においては、構造の探索対象となるタンパク質を形成するアミノ酸残基を、一つの粒子に粗視化して扱っているため、アミノ酸残基の側鎖が考慮されていない。
しかしながら、
図9の右部に示すように、実際のタンパク質には側鎖が存在しており、例えば、原子数が20以上の(側鎖が大きい)アミノ酸残基がタンパク質に含まれる場合には、アミノ酸残基の側鎖がタンパク質の立体構造に大きな影響を及ぼすと考えられる。
図9の右部に示すように、粗視化したタンパク質においてアミノ酸残基の側鎖を考慮すると、当該タンパク質は、分岐構造を有する分子としてみなすことができる。
【0034】
図10は、
図9に示した分子について、安定な構造を探索した場合の一例を示す模式図である。
図10の左部に示すように、タンパク質の主鎖のみを考慮する従来の技術においては、例えば、番号1のアミノ酸残基と番号4のアミノ酸残基が相互作用して、番号1のアミノ酸残基と番号4のアミノ酸残基とが隣接する構造が、安定な構造として探索されるとする。
しかしながら、タンパク質を形成するアミノ酸残基の側鎖を考慮して算出した安定構造は、タンパク質の主鎖のみを考慮して算出して安定構造とは異なる場合がある。例えば、番号1のアミノ酸残基の主鎖と番号3のアミノ酸残基の側鎖3’’の相互作用が、番号1のアミノ酸残基と番号4のアミノ酸残基の相互作用よりも大きいとする。この場合には、例えば、
図10の右部に示すように、番号1のアミノ酸残基の主鎖と番号3のアミノ酸残基の側鎖3’’が隣接する構造が安定な構造として算出されると考えられる。
このように、タンパク質を形成するアミノ酸残基の側鎖の構造を考慮して、当該タンパク質の安定な構造を探索することで、より正確なタンパク質の安定構造を求めることができる。
【0035】
また、本件で開示する技術の一例では、分岐構造を有する分子としてのタンパク質における分割点は、例えば、分岐構造を有する分子における分岐点とすることができ、分子がタンパク質である場合は、当該タンパク質の主鎖に位置させることが好ましい。この場合、直鎖状分子単位は、アミノ酸残基又はタンパク質の主鎖の一部となる。
ここで、例えば、タンパク質の主鎖における、所定の大きさ以上の側鎖を有するアミノ酸残基を分割点とする場合を考える。この場合、上述した分割点(分岐点)から分岐末端までからなる直鎖状分子単位は、側鎖を含む一つのアミノ酸残基となり、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位は、タンパク質の主鎖の一部となる。
【0036】
より具体的には、例えば、
図11に示すように、所定の大きさ以上の側鎖を有する(側鎖を考慮すべき)アミノ酸残基が番号1のアミノ酸残基と番号3のアミノ酸残基であるとする。この場合、分割点は、タンパク質の主鎖における、番号1のアミノ酸残基と番号3のアミノ酸残基となり、
図11に示すように、当該タンパク質を5つの直鎖状分子単位を有する構造とみなすことができる。
【0037】
このように、本件で開示する技術においては、一つの側面では、分割点がタンパク質の主鎖に位置し、直鎖状分子単位がアミノ酸残基又はタンパク質の主鎖の一部であることで、アミノ酸残基の側鎖の構造を考慮して、より正確に安定な構造を探索することができる。
【0038】
また、アミノ酸残基の元となるアミノ酸としては、天然アミノ酸であってもよいし、非天然アミノ酸であってもよい。
天然アミノ酸としては、例えば、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン、β-アラニン、β-フェニルアラニンなどが挙げられる。
非天然アミノ酸としては、例えば、パラベンゾイルフェニルアラニン等の化学修飾されたアミノ酸残基などが挙げられる。
【0039】
また、本件で開示する技術における側鎖を考慮すべきアミノ酸残基としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、原子数が20以上のアミノ酸とすることができる。より具体的には、側鎖を考慮すべきアミノ酸残基としては、分子が天然アミノ酸の残基で形成される場合は、例えば、グリシン及びアラニン以外のアミノ酸残基とすることができる。さらに、分子の安定な構造を探索する際の条件などによっては、グリシン、アラニン、及びセリン以外のアミノ酸残基としてもよい。
【0040】
タンパク質におけるアミノ酸残基の数としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、10以上50以下程度であってもよいし、数百であってもよい。なお、本件においては、アミノ酸残基が50以下程度の分子を「ペプチド」と称することがある。
また、樹脂やゴムなどのポリマーの分子の安定な構造を探索する場合、分割点は、例えば、原子群(例えば、2会場の官能基)又は原子とすることができる。
【0041】
ここで、本件で開示する技術の一例では、上述した手法により作成した分子の立体構造について、分子の安定な結合構造を探索する。分子の安定な結合構造を探索する手法としては、特に制限はなく、目的に応じて適宜選択することができるが、焼き鈍し法(アニーリング)を用いることが好ましい。すなわち、本件で開示する技術の一例では、上述した手法により作成した分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる分子の立体構造を算出することが好ましい。言い換えると、本件で開示する結合構造探索装置は、一つの側面では、作成した分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる分子の立体構造を算出する算出部を有することが好ましい。
こうすることにより、本件で開示する技術は、一つの側面では、分子の構造の探索に必要とされるビットの数を抑制しつつ、当該分子の最も安定であると考えられる構造を探索することができる。さらに、本件で開示する技術は、一つの側面では、側鎖を考慮したタンパク質などの分岐構造を有する分子についても、分岐構造を考慮して、より正確に当該分子の最も安定であると考えられる構造を探索することができる。
【0042】
以下、装置の構成例やフローチャートを用いて、本件で開示する技術の一例を更に詳細に説明する。
図12に、本件で開示する結合構造探索装置の構成例を示す。
結合構造探索装置10においては、例えば、制御部11、メモリ12、記憶部13、表示部14、入力部15、出力部16、I/Oインターフェース部17がシステムバス18を介して接続されている。
【0043】
制御部11は、演算(四則演算、比較演算、焼き鈍し法の演算等)、ハードウェア及びソフトウェアの動作制御などを行う。
制御部11としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、CPU(Central Processing Unit)であってもよいし、後述する焼き鈍し法に用いる最適化装置であってもよく、これらの組み合わせでもよい。
本件で開示する結合構造探索装置における作成部及び算出部は、例えば、制御部11により実現することができる。
【0044】
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。RAMは、ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、制御部11の主メモリ及びワークエリアとして機能する。
【0045】
記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部13には、制御部11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。
本件で開示する結合自由エネルギー計算の前処理プログラムは、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、制御部11により実行される。
【0046】
表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネルなどのディスプレイ装置である。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタなどである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。I/Oインターフェース部17は、例えば、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などのデータの入出力を可能にする。
【0047】
図13に、本件で開示する結合構造探索装置の他の構成例を示す。
図13に示す例は、結合構造探索装置をクラウド型にした場合の例であり、制御部11が、記憶部13などとは独立している。
図13に示す例においては、ネットワークインターフェース部19、20を介して、記憶部13などを格納するコンピュータ30と、制御部11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
【0048】
図14に、本件で開示する結合構造探索装置の他の構成例を示す。
図14に示す例は、結合構造探索装置をクラウド型にした場合の例であり、記憶部13が、制御部11などとは独立している。
図14に示す例においては、ネットワークインターフェース部19、20を介して、制御部11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
【0049】
図15に、本件で開示する技術の一例を用いて、直鎖状のタンパク質の安定構造を探索する際のフローチャートの例を示す。
【0050】
まず、制御部11は、構造を探索するタンパク質を分割点で分割する(S101)。タンパク質における分割点の位置としては、特に制限はなく、目的に応じて適宜選択することができるが、構造の探索に必要となるビットの数をより少なくするという観点からは、タンパク質のアミノ酸配列の中央近傍に位置するアミノ酸残基を分割点の一つとすることが好ましい。なお、この例においては、タンパク質の残基数がn個であるものとする。
【0051】
続いて、タンパク質を分割して形成した、最もアミノ酸残基の数が多い直鎖状分子単位におけるアミノ酸残基の数に応じて、複数のアミノ酸残基が順次配置される格子の集合である三次元格子空間を定義する(S102)。
ここで、三次元格子空間の定義の一例を説明する。なお、格子空間は三次元であるが、以下では、簡略化のため二次元の場合を例として示す。
まず、ダイアモンド格子空間において半径rにある格子の集合をShellとし、各格子点をS
rとする。すると、各格子点S
rは、
図16のように表すことができる。
【0052】
例えば、1から5個目のアミノ酸残基の移動先の格子点の集合V
1~V
5は
図17A~
図17Dのようになる。
ここで、
図17Aにおいては、V
1=S
1であり、V
2=S
2である。
図17Bにおいて、V
3=S
3である。
図17Cにおいて、V
4=S
2、S
4である。
図17Dにおいて、V
5=S
3、S
5である。
なお、S
1、S
2、S
3を三次元で表すと
図18のようになる。
図18において、A=S
1であり、B=S
2であり、C=S
3である。
【0053】
また、n個のアミノ酸残基を有するタンパク質におけるi番目のアミノ酸残基に必要な空間Viは、以下の式で表される。
【0054】
【数1】
ここで、i={1,2,3,......n}である。
そして、奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}であり、偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
【0055】
続いて、制御部11は、それぞれの直鎖状分子単位におけるi番目のアミノ酸残基の移動先の格子点の集合をViとする(S103)。
【0056】
次に、制御部11は、それぞれの直鎖状分子単位について、各格子点にビットを割り当てる。すなわち、各ビットX
1~X
nに空間の情報を割り振る(S104)。具体的には、
図19Aから19Cに示すように、各アミノ酸残基の入る空間に対して、その位置にアミノ酸残基が存在することを「1」で、無いことを「0」で表すビットを割り振る。なお、
図19Aから19Cにおいては、各アミノ酸残基2~4に対して複数のX
iに割当てられているが、実際は、1つのアミノ酸残基に対して、1つのビットX
iが割り当てられる。
【0057】
次に、Hone、Holap、Hconn1、Hconn2、Hpair1、Hpair2を設定し、各格子点に関する制約条件に基づいて変換したイジングモデルを作成する(S105)。
【0058】
ここで、本件で開示する技術の一例においては、全エネルギーは、以下のように表現できる。
【0059】
【数2】
ここで、H
oneは、1~n番目のアミノ酸残基はそれぞれ一つしかないという制約を表す。
H
olapは、1~n番目のアミノ酸残基はそれぞれ重ならないという制約を表す。
H
conn1は、同一の直鎖状分子単位におけるアミノ酸残基は、タンパク質における結合順序を満たすようにそれぞれ繋がっているという制約を表す。
H
conn2は、直鎖状分子単位は、タンパク質における結合順序を満たすようにそれぞれ繋がっているという制約を表す。
H
pair1は、同一の直鎖状分子単位におけるアミノ酸残基同士の相互作用を表す制約を表す。
H
pair2は、異なる直鎖状分子単位におけるアミノ酸残基同士の相互作用を表す制約を表す。
【0060】
各制約の一例は、以下の通りである。
なお、以下において説明する
図20から23A及び
図23Bにおいて、X
1は、番号1のアミノ酸残基が配置可能な位置を表す。
X
2~X
5は、番号2のアミノ酸残基が配置可能な位置を表す。
X
6~X
13は、番号3のアミノ酸残基が配置可能な位置を表す。
X
14~X
29は、番号4のアミノ酸残基が配置可能な位置を表す。
【0061】
Honeの一例を以下に示す。
【0062】
【0063】
上記関数において、X
a、X
bは、1又は0を取る。すなわち、H
oneは、
図20において、X
2、X
3、X
4、X
5のうち、いずれか一つだけ1であるため、いずれか二つ以上1になっていた場合エネルギーが上がる関数であり、一つだけ1であった場合は0になるペナルティーの項である。
なお、上記関数において、λ
oneは、重み付けのための係数である。
【0064】
Holapの一例を以下に示す。
【0065】
【0066】
上記関数において、X
a、X
bは、1又は0を取る。すなわち、H
olapは、
図21において、X
2が1のとき、X
14が1になった場合にペナルティーが発生する項である。
なお、上記関数において、λ
olapは、重み付けのための係数である。
【0067】
Hconn1の一例を以下に示す。
【0068】
【数5】
上記の関数は、アミノ酸残基どうしの繋がりを評価する関数であり、X
d、X
uは、1又は0を取る。すなわち、H
conn1は、
図22において、X
2が1のとき、X
13、X
6、X
7のいずれかがが1であればエネルギーが下がる式であり、同一の直鎖状分子単位におけるすべてのアミノ酸残基が、タンパク質における結合順序を満たすように連結していると0になるペナルティー項である。
なお、上記関数において、λ
conn1は、重み付けのための係数である。例えば、λ
one>λ
conn1の関係とすることができる。
また、H
conn1は、上記の数式を変形して、同一の直鎖状分子単位におけるアミノ酸残基が連結しているときに、値が小さくなりマイナスになるような関数としてもよい。
【0069】
Hconn2の一例を以下に示す。
【0070】
【数6】
上記の関数は、直鎖状分子単位どうしの繋がりを評価する関数であり、X
d、X
uは、1又は0を取る。すなわち、H
conn2は、
図22において、X
2が1のとき、X
13、X
6、X
7のいずれかがが1であればエネルギーが下がる式であり、すべての直鎖状分子単位が、タンパク質における結合順序を満たすように連結していると0になるペナルティー項である。
なお、上記関数において、λ
conn2は、重み付けのための係数である。
また、H
conn2は、上記の数式を変形して、直鎖状分子単位どうしが連結しているときに、値が小さくなりマイナスになるような関数としてもよい。
【0071】
Hpair1の一例を以下に示す。
【0072】
【0073】
上記関数において、X
a、X
bは、1又は0を取る。すなわち、H
pair1は、
図23A及び
図23Bにおいて、同一の直鎖状分子単位のアミノ酸残基について、X
1が1のとき、X
15が1になった場合にX
1のアミノ酸残基とX
15のアミノ酸残基との間に相互作用P
ω(x1)ω(x15)が働きエネルギーが下がるという関数である。相互作用P
ω(x1)ω(x15)は、2つのアミノ酸残基の組み合わせにより決まり、相互作用P
ω(x1)ω(x15)は、例えば、miyazawa-jernigan(MJ) matrixなどを参照して決定される。また、構造の探索対象となるタンパク質に、非天然アミノ酸残基が含まれる場合は、当該非天然アミノ酸残基と、その他のアミノ酸残基との相互作用パラメータを、適宜作成して用いることが好ましい。
【0074】
Hpair2の一例を以下に示す。
【0075】
【0076】
上記関数において、X
a、X
bは、1又は0を取る。すなわち、H
pair2は、
図23A及び23Bにおいて、異なる直鎖状分子単位のアミノ酸残基について、X
1が1のとき、X
15が1になった場合にX
1のアミノ酸残基とX
15のアミノ酸残基との間に相互作用P
ω(x1)ω(x15)が働きエネルギーが下がるという関数である。相互作用P
ω(x1)ω(x15)は、2つのアミノ酸残基の組み合わせにより決まり、相互作用P
ω(x1)ω(x15)は、例えば、miyazawa-jernigan(MJ) matrixなどを参照して決定される。また、構造の探索対象となるタンパク質に、非天然アミノ酸残基が含まれる場合は、当該非天然アミノ酸残基と、その他のアミノ酸残基との相互作用パラメータを、適宜作成して用いることが好ましい。
【0077】
そして、Hone、Holap、Hconn1、Hconn2、Hpair1、及びHpair2を合成することでHが算出される。
【0078】
次に、以下のイジングモデルのエネルギー式を用いた計算を通じて抽出され最適化された、上記各関数における重み係数(例えば、λ
one、λ
olap、λ
conn1、λ
conn2など)に対応した重みファイルは、例えば、行列であり、2X
1X
2+4X
2X
3の場合、
図24のような行列のファイルとなる。
【0079】
【数9】
上記の関数において、状態X
i、X
jは、「0」又は「1」であり、「0」は、アミノ酸残基が無いことを意味し、「1」は、アミノ酸残基が存在することを意味する。右辺の1項目のW
ijは、重み付けのための係数である。
右辺の1項目は、全回路から選択可能な2つの回路の全組み合わせについて、漏れと重複なく、2つの回路の状態と重み値との積を積算したものである。
また、右辺の2項目は、全回路のそれぞれのバイアス値と状態との積を積算したものである。b
iは、i番目の回路のバイアス値を示している。
【0080】
ここで、上記のイジングモデルのエネルギー式を用いて、分岐構造を有する分子の安定な結合構造を探索することについての意味合いを説明する。
【0081】
上記のイジングモデルのエネルギー式は、各直鎖状分子単位(分岐鎖)を従来技術における主鎖構造とみなした場合のハミルトニアンに、分岐鎖間における制約及び相互作用を考慮したハミルトニアンを組み合わせたものと考えることができる。例えば、分岐鎖内の粒子について、分子全体から見た場合の各粒子間の結合順序を保つことができる制約と相互作用を表すハミルトニアンと、各分岐鎖間の粒子について、分子の結合順序を保つことができる制約と相互作用を表すハミルトニアンを組み合わせる。これは、
図25に示すように、分岐鎖内における条件と分岐鎖間における条件の直積を取ることと同様の計算となる。
このような条件を反映した上記のイジングモデルのエネルギー式を小さくする粒子の位置を探索することにより、分子構造として矛盾のない安定構造を探索することができる。言い換えると、上記のイジングモデルのエネルギー式を小さくする粒子の位置を探索することにより、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように直鎖状分子単位を配置できる。
【0082】
次に、アニーリングマシンにおいて、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する(S106)。
アニーリングマシンとしては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば特に制限はなく、目的に応じて適宜選択することができる。アニーリングマシンとしては、例えば、量子アニーリングマシン、半導体技術を用いた半導体アニーリングマシン、CPUやGPU(Graphics Processing Unit)を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング(Simulated Annealing)を行うマシンなどが挙げられる。また、アニーリングマシンとしては、例えば、デジタルアニーラ(登録商標)を用いてもよい。
【0083】
S107では、算出結果を出力する。結果は、タンパク質の立体構造図として出力してもよいし、タンパク質を構成する各アミノ酸残基の座標情報として出力してもよい。
このようにして、タンパク質の安定な構造を探索することにより、分子の構造の探索に必要とされるビットの数を抑制しつつ、当該タンパク質の最も安定であると考えられる構造を探索することができる。
【0084】
図26に、本件で開示する技術の一例を用いて、側鎖の構造を考慮してタンパク質の安定構造を探索する際のフローチャートの例を示す。
図26において、S202からS207は、
図15におけるS102からS107と同様の処理であるため、説明を省略する。
【0085】
S201では、制御部11は、構造を探索するタンパク質を、当該タンパク質の主鎖における、側鎖の構造を考慮すべきアミノ酸残基を分割点として分割する。ここで、側鎖の構造を考慮すべきアミノ酸残基としては、上述したように、例えば、グリシン及びアラニン以外のアミノ酸残基とすることができる。
このようにして、タンパク質を分割して、複数の直鎖状分子単位を有する構造とみなすことで、側鎖の構造を考慮して、より正確に当該タンパク質の最も安定であると考えられる構造を探索することができる。
【0086】
以下に、焼き鈍し法及びアニーリングマシンの一例について説明する。
焼き鈍し法は、乱数値や量子ビットの重ね合わせを用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。また、評価関数の値を最大化する場合は、評価関数の符号を変えればよい。
【0087】
まず、各変数に離散値の1つを代入した初期状態からはじめ、現在の状態(変数の値の組み合わせ)から、それに近い状態(例えば、1つの変数だけ変化させた状態)を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。このため、最終的には最適解又は最適値に近いエネルギーを与える近似解を得られる可能性がある。
もし、これを決定論的にエネルギーが下がる場合に採択とし、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、離散最適化問題を解く際には、その状態を採択するかどうかを確率的に決定することが重要である。
【0088】
焼き鈍し法においては、状態遷移の採択(許容)確率を次のように決めれば、時刻(反復回数)無限大の極限で状態が最適解に到達することが証明されている。
以下では、焼き鈍し法を用いて最適解を求める方法について、順序を追って説明する。
【0089】
(1)状態遷移に伴うエネルギー変化(エネルギー減少)値(-ΔE)に対して、その状態遷移の許容確率pを、次のいずれかの関数f( )により決める。
【0090】
【0091】
【0092】
【0093】
ここで、Tは、温度値と呼ばれるパラメータであり、例えば、次のように変化させることができる。
【0094】
(2)温度値Tを次式で表されるように反復回数tに対数的に減少させる。
【0095】
【0096】
ここで、T0は、初期温度値であり問題に応じて、十分大きくとることが望ましい。
(1)の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布に従う。
そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られると考えられる。この様子が、材料を焼き鈍したときの状態変化とよく似ているため、この方法は焼き鈍し法(または、疑似焼き鈍し法)と称される。なお、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。
【0097】
図27に焼き鈍し法を行う最適化装置(制御部11)の機能構成の一例を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べるが、基本的な焼き鈍し法は、遷移候補を1つずつ発生させるものである。
【0098】
最適化装置100は、現在の状態S(複数の状態変数の値)を保持する状態保持部111を有する。また、最適化装置100は、複数の状態変数の値のいずれかが変化することによる現在の状態Sからの状態遷移が起こった場合における、各状態遷移のエネルギー変化値{-ΔEi}を計算するエネルギー計算部112を有する。さらに、最適化装置100は、温度値Tを制御する温度制御部113、状態変化を制御するための遷移制御部114を有する。
【0099】
遷移制御部114は、温度値Tとエネルギー変化値{-ΔEi}と乱数値とに基づいて、エネルギー変化値{-ΔEi}と熱励起エネルギーとの相対関係によって複数の状態遷移のいずれかを受け入れるか否かを確率的に決定する。
【0100】
ここで、遷移制御部114は、状態遷移の候補を発生する候補発生部114a、各候補に対して、そのエネルギー変化値{-ΔEi}と温度値Tとから状態遷移を許可するかどうかを確率的に決定するための可否判定部114bを有する。さらに、遷移制御部114は、可となった候補から採用される候補を決定する遷移決定部114c、及び確率変数を発生させるための乱数発生部114dを有する。
【0101】
最適化装置100における、一回の反復における動作は次のようなものである。
まず、候補発生部114aは、状態保持部111に保持された現在の状態Sから次の状態への状態遷移の候補(候補番号{Ni})を1つまたは複数発生する。次に、エネルギー計算部112は、現在の状態Sと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値{-ΔEi}を計算する。可否判定部114bは、温度制御部113で発生した温度値Tと乱数発生部114dで生成した確率変数(乱数値)を用い、各状態遷移のエネルギー変化値{-ΔEi}に応じて、上記(1)の式の許容確率でその状態遷移を許容する。
そして、可否判定部114bは、各状態遷移の可否{fi}を出力する。許容された状態遷移が複数ある場合には、遷移決定部114cは、乱数値を用いてランダムにそのうちの1つを選択する。そして、遷移決定部114cは、選択した状態遷移の遷移番号Nと、遷移可否fを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部111に記憶された状態変数の値が更新される。
【0102】
初期状態から始めて、温度制御部113で温度値を下げながら上記反復を繰り返し、一定の反復回数に達する、又はエネルギーが一定の値を下回る等の終了判定条件が満たされたときに動作が終了する。最適化装置100が出力する答えは、終了時の状態である。
【0103】
図28は、候補を1つずつ発生させる通常の焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部114は、乱数発生回路114b1、セレクタ114b2、ノイズテーブル114b3、乗算器114b4、比較器114b5を有する。
【0104】
セレクタ114b2は、各状態遷移の候補に対して計算されたエネルギー変化値{-ΔEi}のうち、乱数発生回路114b1が生成した乱数値である遷移番号Nに対応するものを選択して出力する。
【0105】
ノイズテーブル114b3の機能については後述する。ノイズテーブル114b3として、例えば、RAM、フラッシュメモリ等のメモリを用いることができる。
【0106】
乗算器114b4は、ノイズテーブル114b3が出力する値と、温度値Tとを乗算した積(前述した熱励起エネルギーに相当する)を出力する。
比較器114b5は、乗算器114b4が出力した乗算結果と、セレクタ114b2が選択したエネルギー変化値である-ΔEとを比較した比較結果を遷移可否fとして出力する。
【0107】
図28に示されている遷移制御部114は、基本的に前述した機能をそのまま実装するものであるが、(1)の式で表される許容確率で状態遷移を許容するメカニズムについて、更に詳細に説明する。
【0108】
許容確率pで1を、(1-p)で0を出力する回路は、2つの入力A,Bを持ち、A>Bのとき1を出力し、A<Bのとき0を出力する比較器の入力Aに許容確率pを、入力Bに区間[0,1)の値をとる一様乱数を入力することで実現することができる。したがって、この比較器の入力Aに、エネルギー変化値と温度値Tにより(1)の式を用いて計算される許容確率pの値を入力すれば、上記の機能を実現することができる。
【0109】
すなわち、fを(1)の式で用いる関数、uを区間[0,1)の値をとる一様乱数とするとき、f(ΔE/T)がuより大きいとき1を出力する回路により、上記の機能を実現できる。
【0110】
また、次のような変形を行っても、上記の機能と同じ機能が実現できる。
2つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって、比較器の2つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数として、fの逆関数f
-1を採用すると、-ΔE/Tがf
-1(u)より大きいとき1を出力する回路とすることができることがわかる。さらに、温度値Tが正であることから、-ΔEがTf
-1(u)より大きいとき1を出力する回路でよいことがわかる。
図28中のノイズテーブル114b3はこの逆関数f
-1(u)を実現するための変換テーブルであり、区間[0,1)を離散化した入力に対して次の関数の値を出力するテーブルである。
【0111】
【0112】
【0113】
遷移制御部114には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、
図28では図示を簡単にするため省略されている。
【0114】
図29は、遷移制御部114の動作フローの一例を示す図である。
図29に示す動作フローは、1つの状態遷移を候補として選ぶステップ(S0001)、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ(S0002)、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ(S0003)を有する。
【0115】
(結合構造探索方法)
本件で開示する結合構造探索方法は、コンピュータを用いて、分子の安定な結合構造を探索する方法であって、分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、格子の集合である三次元格子空間の各格子点に、一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、三次元格子空間に分子の立体構造を作成する工程、を含む。
【0116】
本件で開示する結合構造探索方法は、例えば、本件で開示する結合構造探索装置により行うことができる。また、本件で開示する結合構造探索方法における好適な態様は、例えば、本件で開示する結合構造探索装置における好適な態様と同様にすることができる。
【0117】
(結合構造探索プログラム)
本件で開示する結合構造探索プログラムは、分子の安定な結合構造を探索するプログラムであって、分子を、少なくとも一の分割点で分割し、一の分割点を含む一の直鎖状分子単位と、一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、格子の集合である三次元格子空間の各格子点に、一の直鎖状分子単位と他の直鎖状分子単位とを配置すると共に、同一の分割点を含む直鎖状分子単位については、互いに重ならないように、かつ同一の分割点どうしが同じ格子点に位置するように配置して、三次元格子空間に分子の立体構造を作成する処理、をコンピュータに行わせる。
【0118】
本件で開示する結合構造探索プログラムは、例えば、本件で開示する結合構造探索方法コンピュータを実行させるプログラムとすることができる。また、本件で開示する結合構造探索プログラムにおける好適な態様は、例えば、本件で開示する結合構造探索装置における好適な態様と同様にすることができる。
【0119】
本件で開示する結合構造探索プログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。
【0120】
本件で開示する結合構造探索プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、CD-ROM、DVD-ROM、MOディスク、USBメモリなどの記録媒体に記録しておいてもよい。
さらに、本件で開示する結合構造探索プログラムを、上記の記録媒体に記録する場合には、必要に応じて、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータなど)に本件で開示する結合構造探索プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本件で開示する結合構造探索プログラムは、必要に応じて、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することができる。
なお、本件で開示する結合構造探索プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
【0121】
(コンピュータが読み取り可能な記録媒体)
本件で開示するコンピュータが読み取り可能な記録媒体は、本件で開示する結合構造探索プログラムを記録してなる。
本件で開示するコンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
また、本件で開示するコンピュータが読み取り可能な記録媒体は、本件で開示する結合構造探索プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
【0122】
<実施形態1>
本件で開示する結合構造探索装置の一実施形態として、アミノ酸配列AAAAA(「A」は、アラニンを意味する)のペプチド(以下では、ペプチド1と称する)について、安定な結合構造を探索する例について説明する。ここで、実施形態1においては、側鎖が水素原子のみからなるアミノ酸残基であるアラニンについては、側鎖の構造を考慮しないものとする。
【0123】
まず、実施形態1では、ペプチド1について、各アミノ酸残基をそれぞれ1つの粒子として粗視化する。次に、配列の中央に位置するアミノ酸残基(ペプチド1の場合、末端から3つ目のアラニン残基)を分割点としてペプチド1を分割して、ペプチド1を2つの直鎖状分子単位を有する構造とみなす。また、アミノ酸残基間の相互作用を規定するポテンシャルは、上述したMiyazawa-Jernigan(MJ) matrixを参照して決定する。
【0124】
続いて、ペプチド1における直鎖状分子単位どうしが、互いに重ならないように、かつ分割点どうしが同じ格子点に位置するように配置可能な制約及びアミノ酸残基間の相互作用などに基づいて、QUBO(Quadratic Unconstrained Binary Optimization)表現のハミルトニアンを作成する。
そして、アニーリングマシンにより、作成したハミルトニアンの値が最小となるペプチド1の構造を探索する。
【0125】
こうすることにより、従来技術では5個のアミノ酸が配置され得る空間全体を考慮しなければならないのに対し、実施形態1の例では、3個のアミノ酸が配置され得る空間のみを探索することで、ペプチド1の安定な構造を探索することができる。このため、実施形態1の例では、アニーリングマシンで必要とするビット数を、従来技術で必要とするビット数の1/3以下に削減でき、効率的に安定構造を探索することができる。
【0126】
<実施形態2>
本件で開示する結合構造探索装置の一実施形態として、アミノ酸配列AK(K’)AA(「K」はリシンを意味し、「K’」はリシン残基の側鎖を意味する)のペプチド(以下では、ペプチド2と称する)について、安定な結合構造を探索する例について説明する。ここで、実施形態2においては、リシン残基の側鎖の構造を考慮して、ペプチド2の構造を探索するものとする。
【0127】
まず、実施形態2では、ペプチド2について、各アミノ酸残基及びリシン残基の側鎖をそれぞれ1つの粒子として粗視化する。次に、ペプチド2の分岐点である、ペプチド2の主鎖におけるリシン残基を分割点としてペプチド2を分割して、ペプチド2を3つの直鎖状分子単位を有する構造とみなす。また、アミノ酸残基間の相互作用を規定するポテンシャルは、上述したMiyazawa-Jernigan(MJ) matrixを参照して決定する。
【0128】
続いて、ペプチド2における直鎖状分子単位どうしが、互いに重ならないように、かつ分割点どうしが同じ格子点に位置するように配置可能な制約及びアミノ酸残基間の相互作用などに基づいて、QUBO表現のハミルトニアンを作成する。
そして、アニーリングマシンにより、作成したハミルトニアンの値が最小となるペプチド2の構造を探索する。
【0129】
こうすることにより、ペプチド2を形成するアミノ酸残基の側鎖の構造を考慮して安定な構造を探索できるため、より正確なタンパク質の安定構造を効率よく求めることができる。
【0130】
図30は、実施形態1及び2、並びに従来技術において、タンパク質(ペプチド)の安定な結合構造を探索する際に必要とされる格子点の数と、探索した安定構造の差異の一例を示す図である。
図30に示すように、本件で開示する技術は、一つの側面では、実施形態1の例において、分子の安定な結合構造を計算機により探索する際に用いるビットの数を少なくすることができる。さらに、本件で開示する技術は、一つの側面では、実施形態2の例において、側鎖を考慮した場合におけるタンパク質等の分岐構造を有する分子について、より正確なタンパク質の安定構造を効率よく算出することができる。
【0131】
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
分子の安定な結合構造を探索する装置であって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とを有する構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないように、かつ前記同一の分割点どうしが同じ前記格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する作成部、
を有することを特徴とする結合構造探索装置。
(付記2)
前記分子が分岐構造を有する分子であり、
前記分割点が前記分岐構造を有する分子における分岐点であり、
前記分岐構造を有する分子を、前記分岐点から分岐末端までからなる直鎖状分子単位と、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位を有する構造とみなす、付記1に記載の結合構造探索装置。
(付記3)
前記直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなす、付記1から2のいずれかに記載の結合構造探索装置。
(付記4)
作成した前記分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる前記分子の立体構造を算出する算出部を有する、付記1から3のいずれかに記載の結合構造探索装置。
(付記5)
前記分子がタンパク質である、付記1から4のいずれかに記載の結合構造探索装置。
(付記6)
前記分割点が前記タンパク質の主鎖に位置し、前記直鎖状分子単位がアミノ酸残基又は前記タンパク質の主鎖の一部である、付記5に記載の結合構造探索装置。
(付記7)
コンピュータを用いて、分子の安定な結合構造を探索する方法であって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないようにかつ前記同一の分割点どうしが同じ格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する工程、
を含むことを特徴とする分子の結合構造探索方法。
(付記8)
前記分子が分岐構造を有する分子であり、
前記分割点が前記分岐構造を有する分子における分岐点であり、
前記分岐構造を有する分子を、前記分岐点から分岐末端までからなる直鎖状分子単位と、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位を有する構造とみなす、付記7に記載の結合構造探索方法。
(付記9)
前記直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなす、付記7から8のいずれかに記載の結合構造探索方法。
(付記10)
作成した前記分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる前記分子の立体構造を算出する算出工程を含む、付記7から9のいずれかに記載の結合構造探索方法。
(付記11)
前記分子がタンパク質である、付記7から10のいずれかに記載の結合構造探索方法。
(付記12)
前記分割点が前記タンパク質の主鎖に位置し、前記直鎖状分子単位がアミノ酸残基又は前記タンパク質の主鎖の一部である、付記11に記載の結合構造探索方法。
(付記13)
分子の安定な結合構造を探索するプログラムであって、
前記分子を、少なくとも一の分割点で分割し、前記一の分割点を含む一の直鎖状分子単位と、前記一の分割点を含む他の直鎖状分子単位とからなる構造とみなし、
格子の集合である三次元格子空間の各格子点に、
前記一の直鎖状分子単位と前記他の直鎖状分子単位とを配置すると共に、
同一の分割点を含む前記直鎖状分子単位については、互いに重ならないようにかつ前記同一の分割点どうしが同じ格子点に位置するように配置して、
前記三次元格子空間に前記分子の立体構造を作成する処理、
をコンピュータに行わせることを特徴とする結合構造探索プログラム。
(付記14)
前記分子が分岐構造を有する分子であり、
前記分割点が前記分岐構造を有する分子における分岐点であり、
前記分岐構造を有する分子を、前記分岐点から分岐末端までからなる直鎖状分子単位と、一の分岐点から隣接する他の分岐点までからなる直鎖状分子単位を有する構造とみなす、付記13に記載の結合構造探索プログラム。
(付記15)
前記直鎖状分子単位を更に複数の小さな直鎖状分子単位からなる構造とみなす、付記13から14のいずれかに記載の結合構造探索プログラム。
(付記16)
作成した前記分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、エネルギーが最小となる前記分子の立体構造を算出する、付記13から15のいずれかに記載の結合構造探索プログラム。
(付記17)
前記分子がタンパク質である、付記13から16のいずれかに記載の結合構造探索プログラム。
(付記18)
前記分割点が前記タンパク質の主鎖に位置し、前記直鎖状分子単位がアミノ酸残基又は前記タンパク質の主鎖の一部である、付記17に記載の結合構造探索プログラム。
【符号の説明】
【0132】
10 結合構造探索装置
11 制御部
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ
a、b、c、d、d1、d2 直鎖状分子単位