(58)【調査した分野】(Int.Cl.,DB名)
個々のリガンド組メンバーと受容体との間で複合体を形成するための、前記受容体と1組のリガンドの個々のメンバーとの間の結合の相対強度を決定するコンピュータ実装された方法であって、
a.コンピュータが、少なくとも1つの閉じたサイクルを形成するリガンド対の組について、前記閉じた熱力学的サイクルについて観察される前記ヒステリシスの大きさを確率的に導く、前記閉じた熱力学的サイクルの区画の各々に沿った結合自由エネルギー差と前記結合自由エネルギー差に関する誤差分布とを決定する工程と、
b.前記コンピュータが、前記aの工程において決定された確率モデルに含まれる前記閉じた熱力学的サイクルにおける区画ごとの最も確からしい結合自由エネルギー差を決定する工程と、
c.前記コンピュータが、前記bの工程における前記閉じた熱力学的サイクルにおける各区画に沿ったリガンド対ごとの前記最も確からしい結合自由エネルギー差に関連する最も確からしい誤差を決定する工程と、
d.前記コンピュータが、コンピュータユーザに対する、前記cの工程における前記結合自由エネルギー差および前記誤差を表す値を出力する工程と、を備える、方法であって、同方法はさらに、
前記コンピュータが、前記結合自由エネルギー差の計算のための自由エネルギー、ならびにこれらの対応する初期リガンドおよび最終リガンドのリガンド対を列挙する工程と、
前記コンピュータが、閉じたサイクルを形成するリガンド対を探索して発見し、同発見したリガンド対を表す連結性行列を生成する工程と、
前記コンピュータが、全体グラフを独立した部分グラフに分解する工程であって、前記独立した部分グラフの各々は、他の独立した部分グラフと連結する閉じたサイクルを有していない、工程と、
前記コンピュータが、前記独立した部分グラフの各々に対応する連結性行列を入手する工程と、
前記コンピュータが、前記部分グラフの各々に対応するそれぞれの連結性行列を、独立した行ベクトルのみを含む独立した行列に縮約する工程と、
前記コンピュータが、前記部分グラフごとに、前記リガンド対について最も確からしい結合自由エネルギー推定値を生成する工程と、
前記コンピュータが、前記最も確からしい結合自由エネルギー推定値に関連する戦記最も確からしい誤差を決定する工程と
を備える方法。
前記誤差を決定する工程は、前記コンピュータが、2つ以上の閉じた熱力学的サイクルの区画に沿ったリガンド間での結合自由エネルギー差を解析する工程と、前記コンピュータが、閉じた熱力学的サイクルの各々に関するヒステリシスの大きさを決定する工程とを含む、請求項1に記載の方法。
コンピュータと、請求項1に記載の方法を実行するための非一時的なコンピュータ可読命令を記憶するコンピュータ可読記憶媒体とを備えるコンピュータシステムであって、前記コンピュータは、前記媒体から前記命令を読み出し前記命令を実行するように構成されている、コンピュータシステム。
プロセッサと、請求項1に記載の方法を実行するための非一時的なコンピュータ可読命令を記憶するメモリとを備える汎用グラフィック処理ユニットであって、前記プロセッサは、前記メモリから前記命令を読み出し前記命令を実行するように構成されている、汎用グラフィック処理ユニット。
【発明を実施するための形態】
【0020】
本発明によりサイクルクロージャを用いて計算される相対結合親和性は、実験データと高度に相関し、計算の収束を示す有意味なエラーバーが生成される。
これは、本発明を利用してFEP/REST自由エネルギー計算の値を求めるときに特
に明らかである。このFEP/REST自由エネルギー計算は、受容体の活性部位におけるリガンドの様々なコンフォメーションの完全なサンプリングを提供する。特定の理論に縛られることなく、本発明者らは、リガンドのうちの2つについて、複数の結合モードが存在すること、およびこれらのモードをサンプリングすることが、結合親和性の正しい予測に重要であることを割り出した。FEP/RESTは比較的短いシミュレーション時間内で重要なコンフォメーションをサンプリングすることができるが、FEP/MDを用いると、リガンドは初期コンフォメーションにトラップされた。本方法は、FEP/MD自由エネルギー計算に関連する高い誤差、およびFEP/REST計算に関連する低い誤差を示すこの特徴を説明する。このため、本発明は、計算における関連誤差の妥当な推定、および予測の信頼性を提供することによって相対自由エネルギー計算技法を改善することができる
19。
【0021】
最初に、本方法は、いくつかの他のグループによって行われたような相対自由エネルギー計算においてサイクルクロージャを構築し
10,20,21、次に、この入力から、本方法は、閉じた熱力学サイクルごとに計算された自由エネルギーの和が理論値0からどれだけ変化しているかを評価することによって、相対自由エネルギー計算の一貫性および信頼性を決定する。次のセクションにおいて、この方法を詳細に説明する。これによって、当業者は、本方法が、どのようにサイクルクロージャ相対自由エネルギー計算によって取得された複数の自由エネルギー推定値から相対自由エネルギーの信頼性のある予測をもたらし、また、これらの計算に関連する予測誤差限界をもたらし、また、系統誤差を有する相対自由エネルギー計算にフラグを付けるメカニズムをもたらすかを直ちに理解することができる。
【0022】
サイクルクロージャ相対自由エネルギー一貫性の発明の詳細な説明
I.相対結合自由エネルギー計算パスにおけるサイクルクロージャを用いた一貫性検証および最良自由エネルギー推定量
以下の単純なモデルは、本方法および本方法の概念を説明する。1組の3つのリガンドL
1、L
2およびL
3を検討する。3つのリガンド間の実験により測定された相対結合自由エネルギーの差が、
【0026】
は、それぞれリガンドL
1、L
2およびL
3について実験により測定された結合自由エネルギーである。自由エネルギーは熱力学的特性であり、したがって、
【0028】
である(
図1を参照)。仮に、3つの相対結合自由エネルギー計算が、L
1からL
2まで、L
2からL
3まで、およびL
3からL
1まで実行されるとすると、3つの相対結合自由エネルギー計算パスについて計算される自由エネルギーの差はそれぞれ、E
2l、E
32およびE
13である。シミュレーションが完全に収束し、力場が完全である場合、理想的には、
【0030】
である。しかしながら、実際には、計算される相対自由エネルギーに関連する誤差が存在し、通常、
【0032】
である。Δを、このサイクルクロージャに関連する自由エネルギーのヒステリシスと呼ぶ。これらの誤差は、不規則変動に起因する不偏統計誤差、および位相空間の不完全なサンプリングに起因するバイアス誤差(タンパク質および/またはリガンドはコンフォメーション空間の極小にトラップされる)、および力場における誤差を含む。本方法は、これらの計算の一貫性および信頼性を評価する。
【0033】
実験値と比較した相対自由エネルギー計算における誤差は、2つのカテゴリに分けられ得る。2つのカテゴリとは、系の真の潜在的なエネルギー面と比較した、シミュレーションにおいて用いられる力場の違いから生じる系統誤差と、位相区間の不規則に不完全なサンプリングもしくは系統的に不完全なサンプリングのいずれかに起因する非収束、または自由エネルギー推定量自体、例えば、TI対FEP等から生じる誤差である。F
21が、無限長の不偏シミュレーションおよび不偏相対自由エネルギー推定量からの基礎をなす力場に関する2つの熱力学的状態間(すなわち、リガンドL
1からリガンドL
1まで)の理論的自由エネルギー差を表すものとする。力場に系統誤差が存在しない場合、
【0035】
である。例えば、L
1からL
2までの計算の場合の実際の相対自由エネルギー計算では、シミュレーションは有限のサンプリング時間量を用いて実行され、サンプリングは何らか
のバイアスを有する場合があり、このため、計算される自由エネルギーE
21は、自由エネルギーE
21の理論値F
21から離れる場合があり、シミュレーションの初期構成に依存することになる。
【0036】
様々な初期構成、および速度の様々な乱数種から開始して無限回同じ相対自由エネルギー計算を繰り返すと、計算される自由エネルギーは分布を有する。一般性を損なうことなく、リガンドL
iおよびリガンドL
j間の理論的自由エネルギー差がF
jiであるリガンドL
iからリガンドL
jまでの相対結合自由エネルギーの計算に関して、P(E
ji|F
ji)は、計算される自由エネルギーE
jiの分布を表す。P(E
ji|F
ji)は、原理的に、ガウス分布、ローレンツ分布、一様分布、デルタ分布等の任意の種類の分布であり得る。
【0038】
この方法は、相対結合自由エネルギー計算パスにおいて構築されたサイクルクロージャを有する分布P(E
ji|F
ji)に基づいて、リガンドL
iからリガンドL
jまでの自由エネルギー差を予測し、この予測に関する関連誤差を予測する。すなわち、
【0042】
はリガンドL
iとリガンドL
jとの間の予測自由エネルギー差を表す、e
jiは予測に関連付けられた誤差を表す。
予測は、多くの様々な方法、例えば、観察の確率を最大にする最大尤度法、計算される自由エネルギーに基づいてパラメーターを最適化するベイズ統計法等を用いて行われ得る。
【0043】
ここで、最大尤度法を用いる1つの特定の例を通じて、かつ計算される自由エネルギー
についてガウス分布を仮定して、反転を例示する。当業者であれば、本発明が、他のタイプの統計的解析法および他のタイプの分布のための一般的なツールとして用いられ得ることを理解するであろう。ベイズ統計を用いた導出例も、このセクションの末尾において与えられる。
【0044】
計算される自由エネルギーが、平均F
21(系統的バイアスなし)および標準偏差σ
21を有するガウス分布であると仮定する。このとき、単一の相対自由エネルギー計算がこのパスについてE
21の値を与える確率密度は以下となる。
【0046】
同様に、L
2からL
3へのパス、およびL
3からL
1へのパスについて、相対自由エネルギー計算がE
32およびE
13の値を与える確率密度はそれぞれ以下となる。
【0048】
理論的自由エネルギー差F
21、F
32およびF
13の所与の組について、3つの相対自由エネルギー計算がE
21、E
32およびE
13の値を与える全体尤度Lは以下となる。
【0050】
最大尤度法によれば、F
21、F
32およびF
13の最も可能性の高い値は、上記の尤度を最大にする値の組である。上記の式の対数をとると、尤度を最大にする値の組は、以下の関数を最小にする値の組である。
【0052】
ここで、制約:
F
21+F
32+F
13=0
を有する。
【0053】
ラグランジュ乗数を用いると、尤度を最大にする値の組は以下となる。
【0055】
上記の推定量は系統的バイアスを有さず、様々なパスからの自由エネルギー予測間には実質的に相違がない。本方法は、上記の推定量を2つのパスからの加重平均として解釈する。例えば、リガンドL
1とL
2との間の自由エネルギー差F
21は、E
21または−(E
32+E
13)から推定することができ、最良の推定量は、2つの予測の加重平均である。パスに沿って計算された自由エネルギー差の標準偏差が小さいほど、最良推定量に対する重みが大きくなり、逆もまた同様である。
【0056】
更に、上記のモデルによれば、サイクルクロージャのヒステリシスE
21+E
32+E
13=Δも、平均0および標準偏差
【0058】
を有するガウス分布である。3つの計算される自由エネルギーの和が、2sよりも大きく0から離れている場合、計算が収束しておらず、結果に信頼性がないことがほぼ確実(P=0.95)であり、3つの計算される自由エネルギーの和が、sよりも大きく0から離れている場合、計算が収束しておらず、結果に信頼性がない場合がある可能性が高い(P=0.68)。このため、本方法は、予測に信頼性があるか否かを決定する。
【0059】
実際の相対自由エネルギー計算では、高い計算コストに起因して、所与の計算は通常一回のみ実行され、予測ごとに標準偏差が推定され得ない。この場合、本方法は、計算ごと
の標準偏差が同じである、例えばパスごとに3.347kJ/mol(0.8kcal/mol)であると仮定する。そして、2つのパスからの自由エネルギー結果の相違が5.757kJ/mol(1.4kcal/mol)よりも大きい場合、これは計算が収束しておらず、おそらく信頼性がないことを示す。この仮定の下で、最良自由エネルギー推定量は下式である。
【0061】
更に、計算ごとの標準偏差が同じであるという仮定の下で、サイクルクロージャのヒステリシス自体が、各自由エネルギー予測に関連する誤差の推定値を提供する。上記で検討したように、サイクルクロージャのヒステリシスΔは、平均0および標準偏差
【0063】
を有するガウス分布である。このため、所与の計算がサイクルクロージャについて値Δを有するヒステリシスを生成する確率は以下となる。
【0065】
上記の確率を最大にするシグマの値は、各自由エネルギー計算に関連する標準偏差の最大尤度推定値を与える。
【0067】
上記の導出において、本方法が推定する自由エネルギーおよび関連誤差は、相対自由エネルギー計算から得た全ての情報に基づく最適推定値である。計算における基礎をなす力場が系統的バイアスを有する場合、完全に収束した相対自由エネルギー計算結果であっても、実験により測定された値から離れる場合がある。これは上記の解析に基づいて補正され得ないものである。
【0068】
上記で記載した方法を、より多くのメンバーをサイクルクロージャ内に有し、いくつかのサイクルが同じエッジを共有する、より複雑な事例に適用する。ここで、結晶構造を有する6つのCDK2リガンド(
図2)のためのFEP/MD計算およびFEP/REST計算において用いられる、パスのための最良自由エネルギー推定量を取得する方法を説明する。任意の種類の相対結合自由エネルギー計算パスのためのより一般的なアルゴリズムが以下のセクションで与えられる。
【0070】
ベイズ統計を用いた最良自由エネルギー推定量
リガンドL
iからリガンドL
jに、理論的自由エネルギー差F
jiを有して突然変異するFEP計算について、仮に、計算される自由エネルギーE
jiが、平均F
jiおよび標準偏差σ
jiを有するガウス分布であるものとする(最大尤度法の場合に用いられるのと同じモデル)。このとき、1つのFEP計算から計算される自由エネルギーがE
jiの値を与える確率密度は以下となる。
【0072】
F
jiの多くの様々な値は、様々な確率を有する同じ計算された自由エネルギーE
jiを導くことができる。ベイズ統計によれば、本方法は、FEP計算を実行する前に、2つのリガンド間の自由エネルギー差の分布(事前分布)の推定値
【0074】
を有し、FEP計算を実行した後、FEPからの計算結果に基づいて分布(事後分布
【0076】
を調整する。
FEP計算を実行する前に、相対結合自由エネルギー計算に関する情報が知られていない場合、F
jiの事前分布に関する妥当な推定は、F
jiが−∞と+∞との間で一様分布するというものであり、すなわち、
【0078】
である。事前分布は正規化されないことに留意されたい。
FEP計算がE
jiの値を与える場合、ベイズ統計によれば、F
jiの事後確率は以下となる。
【0080】
上記の事例の場合、3つのリガンドL
1、L
2およびL
3を用いて、本方法は、計算された自由エネルギー差E
21、E
32およびE
13を有する閉じたサイクルを形成するFEP計算を実行する。このとき、ベイズ統計によれば、(F
21,F
32,F
13)の事後分布は、
F
21+F
32+F
13=0
という制約の下で以下となる。
【0084】
に位置する。
これにより、上記で提示した最大尤度法から取得した結果を確認する。
II.サイクルクロージャにより導出された自由エネルギー推定値および誤差推定値の発明の一般的な実施のプログラミング
1組のL個のリガンドについて、本方法は全てのリガンドをサイクルクロージャ(複数の場合もある)と連結するN個の相対自由エネルギー計算を実行する。このセクションに記載される本発明の特定の実施形態は、リガンド間の相対自由エネルギーの最良予測およびこれらの予測に関連するエラーバーをもたらす。入力は、相対自由エネルギーシミュレーションが実行されるリガンドのN個の対間のN個の計算される自由エネルギー差であり、出力は、相対自由エネルギーシミュレーションが実行されたリガンドのN個の対間のN個の予測相対自由エネルギー差および関連するエラーバー、ならびにまた、組内のリガンドの任意の対間の相対自由エネルギー差およびこれらの関連するエラーバーである。予測相対自由エネルギーはヒステリシスを有さず、これは、任意の2つのリガンド間の予測相対自由エネルギー差が、これらを連結するパスから独立しており、このため内部的に矛盾しないことを意味する。
【0085】
図3に示す例示的なパスにおいて、8つ全てのリガンドをいくつかのサイクルクロージャに連結する、1組の8つのリガンドのための11個の相対自由エネルギー計算が存在する。プログラムの入力は、リガンドの11個の対についての11個の相対自由エネルギー計算結果であり、出力は、リガンドの11個の対についての予測相対自由エネルギー差、これらの関連するエラーバー、ならびにまた、組内の8つのリガンドの任意の対間の相対自由エネルギー差およびこれらの関連するエラーバーである。
【0086】
入力:
{E
i;L
j→L
k}、ここでi∈{1,2,3,...N}
出力:
{F
i,e
i;L
j→L
k}、ここでi∈{1,2,3,...N}
および{F
ij,e
ij}、ここでi,j∈{L
2...L}
アルゴリズム
工程1:実行される全ての相対結合自由エネルギー計算について計算される自由エネルギー、ならびにこれらの対応する初期リガンドおよび最終リガンドを列挙する。
【0087】
この工程から入手するものは以下のリストである。
{E
i;L
j→L
k}、ここでi∈{1,2,3,...N}
ここで、E
iは第iの相対結合自由エネルギー計算についての、相対自由エネルギーシミュレーションにより計算される自由エネルギーである。この相対自由エネルギー計算についての初期リガンドおよび最終リガンドはL
jおよびL
kである。これはプログラムの入力である。
【0088】
工程2:相対結合自由エネルギー計算パスにおける全ての閉じたサイクルを列挙し、全体グラフについてサイクルクロージャ連結性行列(C3M)を組み立てる。
この工程において、本方法は、全てのリガンド対にわたって探索し、閉じたサイクルを形成する全ての対を発見し、この情報を連結性行列に変換する。
【0089】
例えば、上記に示すリガンド対パスにおいて、対1、2および5は閉じたサイクルを形成する。自由エネルギーは状態関数であるので、そのような閉じたサイクルに沿った自由エネルギーの和は0となるべきである。換言すれば、
F
1+F
2−F
5=0
である。
【0090】
一般的な事例では、閉じたサイクルに沿った自由エネルギーに対する拘束は、以下の一般的な拘束関数に書かれ得る。
【0092】
ここで、F
iは、閉じたサイクルに沿ったエッジの2つの頂点上の2つのリガンド間の自由エネルギー差であり、M
iは、エッジが閉じたサイクルと同じ方向にある場合、1であり、エッジが閉じたサイクルの反対方向にある場合、−1であり、エッジが閉じたサイクル内にない場合、0である。
【0093】
この工程において、本方法は、リガンド対パス内の全ての閉じたサイクルおよび全ての拘束を列挙する。上記で示す例において、閉じたサイクルについて以下の拘束を有する。
F
1+F
2−F
5=0
F
3+F
4−F
5=0
F
4−F
7−F
6=0
F
1+F
2−F
4−F
3=0
F
5−F
7−F
6−F
3=0
F
1+F
2−F
7−F
6−F
3=0
F
9+F
11−F
10=0
一般的な事例において、仮に、リガンド対パス内に合計M個の閉じたサイクルがあるとすると、M個の拘束方程式を有する。
【0095】
M
ji=M
GはM×Nの行列であり、行列の各行は閉じたサイクルのための拘束方程式を表す。M
Gを用いて、全体グラフのサイクルクロージャ連結性行列(C3M)を表す。
上記で示す例において、
【0097】
である。
工程3:全体グラフを独立した部分グラフに分解する。
相対自由エネルギー計算グラフにおいて、2つの部分グラフを連結する閉じたサイクルがない場合、リガンドのサブセット間の予測相対自由エネルギーは、リガンドの他のサブセット間の予測相対自由エネルギーから独立している。上記に示す例において、リガンドの組[1,2,3,4,5]間の予測相対自由エネルギーは、リガンドの組[6,7,8]間の相対自由エネルギーから独立している。なぜなら、2つの部分グラフを連結する閉じたサイクルがないためである。この工程において、全体グラフは各独立した部分グラフに分解され、次に、各独立した部分グラフが連続して解かれる。
【0098】
工程3a:M
Gの各行を検査し、各行における非ゼロ要素の列数を記録し、列数を以下のリストに入れる。
【0100】
この工程において、本方法はM個のリストを生成する。各リストは、C3M行列の各行の非ゼロ要素の列数を含む。これを以下の記載について明確にするために、この工程において生成される、未加工リストであるM個のリストを含む組は、組S
rと呼ばれる。
【0101】
上記で示す例において、本方法のこの工程は、7つのリストを含む未加工リスト組を生成する。
L
1={1,2,5}
L
2={3,4,5}
L
3={4,6,7}
L
4={1,2,3,4}
L
5={3,5,6,7}
L
6={1,2,3,6,7}
L
7={9,10,11}
工程3b:未加工リスト組S
rにおいて第2のリストから最後のリストまで反復し、L
jに含まれる要素を第1のリストL
1内の要素と比較する。ここで、j∈{2,3,...m}である。これらが1つの共通要素(または数個の共通要素)を含む場合、L
j内の全ての要素をマージして第1のリストL
1にし、未加工リスト組からL
jを削除する。これらがコメント要素を一切有しない場合、リストL
jを未加工リスト組内に維持する。
【0102】
上記に示す例において、L
2、L
4、L
5、L
6は、L
1との共通要素(複数の場合もある)を含むので、これらのリストはこの工程において削除され、これらのリストの要素はL
1にマージされる。この工程から未加工リスト組内に残るものは、以下である。
【0103】
L
1={1,2,3,4,5,6,7}
L
2={4,6,7}
L
7={9,10,11}
工程3c:工程3bにおいて削除されていないリストについて工程3bを繰り返し、要素がL
1との共通要素を含む場合、これらの要素をL
1に統合する。これ以上リストが削除され得なくなるまでこの工程を繰り返す。
【0104】
上記で示す例において、この工程から未加工リスト組S
r内に残るものは、以下である。
L
1={1,2,3,4,5,6,7}
L
7={9,10,11}
工程3d:未加工リスト組S
r内の第1のリストL
1を最終リスト組S
f={L
1...}内に移し、これを未加工リスト組から削除する。
【0105】
上記で示す例において、この工程の後、最終リスト組Sにおいて、
S
f={L
1={1,2,3,4,5,6,7}}
であり、未加工リスト組内に1つのリストが残される。
【0106】
S
r={L
7={9,10,11}}
工程3e:工程3dの後、未加工リスト組内に2つ以上のリストが残されている場合、残されているリストが1つのみになるまで、工程3b〜工程3dを繰り返す。
【0107】
上記に示す例では、この工程において動作は必要ない。なぜなら、工程3dの後、未加工リスト組内には1つのリストしか残されていないからである。
工程3f:未加工リスト組S
r内の最後のリストを、最終リスト組S
fに移す。この工程の後、最終リスト組内にいくつかのリストが存在し、未加工リスト組内にはリストが残されていない。最終リスト組内のリストは、共通要素を一切含まない。
【0108】
上記に示す例において、最終リスト組内に以下を有する。
S
f={L
i={1,2,3,4,5,6,7},L
2={9,10,11}}
工程3g:列番号1〜Nにわたって反復する。列番号が最終リスト組内の任意のリストにある場合、これをスキップし、そうでない場合、その列番号しか含まないリストを最終リスト組に加える。
【0109】
これはこのプロセスにおける最終工程である。この工程の後、最終リスト組はいくつかのリストを含み、リストの内のいずれの間においても共通要素は存在しない。列番号1〜Nは、最終リスト組における1つのリスト内にのみある。
【0110】
上記に示す例において、この工程の後、
S
f={L
1={1,2,3,4,5,6,7},L
2={9,10,11},L
3={8}}
である。
【0111】
このプロセスの後、全体グラフは、各個々の独立した部分グラフに分解される。各独立した部分グラフはエッジを含み、エッジ番号は最終リスト組S
fの各リスト内に列挙されている。これらの独立した部分グラフは共有エッジを含まないが、共有頂点を有する場合がある。
【0112】
上記に示す例において、全体グラフは3つの独立した部分グラフに分解される。第1の部分グラフは7つの結合自由エネルギー計算パス[El,E2,E3,E4,E5,E6,E7]を含み、第2の部分グラフは3つの相対結合自由エネルギー計算パス[E9,E10,E11]を含み、第3の部分グラフは1つの相対結合自由エネルギー計算パス[E8]を含む。これらの部分グラフは
図4に示される。
【0113】
工程4:独立した部分グラフごとのC3MであるM
Sを入手する。
工程3から、全体連結性グラフは既に独立した部分グラフに分解されており、各部分グラフのエッジ番号は最終リスト組内のリストに記憶されている。この工程において、独立した部分グラフごとのC3Mを入手することに着手する。
【0114】
仮に、リスト内にN
i個の要素が存在するとして、最終リスト組S
fから各リストL
iを取る。全体グラフのC3MであるM
Gの全ての行にわたって探索する。M
Gの行ごとに、列番号がリストL
i内にある全てのn個の要素を探索し、これらのうちのいずれかがゼロでない場合、この行のn個の列をM
iSに入れる。この部分グラフのためのC3MはリストL
iに対応している。これを、M
Gの全ての行、および最終リスト組S
f内の全てのリストに対して行う。
【0115】
この工程から、全体グループのC3Mである、M×Nの行列であるM
Gが、それぞれが独立した各部分グラフに対応する各独立したC3Mである、M
i=N
i行列であるM
iSに分解される。これらの行列の次元は以下の特性を満たす。
【0117】
この工程の後、全体グラフは独立した部分グラフに分解され、全体グラフのC3MであるM
Gも、独立した部分グラフごとのC3MであるM
iSに分解される。
M
iS内の各行が、パス内の閉じたサイクルを表し、ある独立した部分グラフのための連結性行列M
iSは、ゼロ要素を含む場合があり、これは、その部分グラフ内に閉じたサイクルがないことを意味することに留意されたい。
【0118】
上記の例において、3つの独立した部分グラフのためのC3Mは、以下である。
【0120】
第3の部分グラフのためのM
Sは空であることに留意されたい。
工程5:部分グラフM
SごとにC3Mを独立した行列M
SRに縮約する。
部分グラフごとに工程4から生成されたC3Mにおいて、いくつかの行は互いに独立しておらず、これは、M
S内に列挙された閉じたサイクルが独立していないことを意味する。例えば、上記で示す例において、部分グラフ1について、3つの独立したサイクルが存在するが、6つ全ての閉じたサイクルが連結性行列M
S1に列挙されている。それらのうちの3つは必ずしも必要でない。
【0121】
この工程において、各部分グラフのC3MであるM
iSは、独立した行ベクトルのみを含む行列に縮約される。独立した行ベクトルのみを含む変換された行列をRC3M(縮約されたサイクルクロージャ連結性行列(Reduced Cycle Closure Connectivity Matrix))と呼び、M
iSRと表す。
【0122】
行列M
iSを行列M
iSRに縮約する多くの方法が存在する。ここでは単純な方法を列挙する。
工程5a:M
iSの最初の2つの行に新たな2×N
i行列Mを形成させる。
【0123】
工程5b:det|MM
T|を計算する。抑制がゼロでない場合、2つの行は独立している。抑制がゼロの場合、2つの行は相互依存しており、第2の行を削除する。
工程5c:M
iSの第3の行をMに入れ、工程5bを繰り返す。
【0124】
工程5d:M
iS内の全ての残りの行について工程5cを繰り返す。
この工程の後、部分グラフごとにM
iSRが取得される。M
iSRは独立した行ベクトルのみを含み、これは、独立した閉じたサイクルのみが行列内に列挙されていることを意味する。
【0125】
上記の例において、第1の部分グラフのためのM
SRは以下である。
【0127】
C3M内の行の順序および行列を縮約するアルゴリズムに依拠して、部分グラフごとのM
SRは一意ではないが、M
SR内の行数は、行の順序、および縮約を行うアルゴリズムに対し独立している。
【0128】
この工程の後、縮約されたサイクルクロージャ連結性行列M
SRが独立した部分グラフごとに取得される。M
SRは各部分グラフ内に独立したサイクルのみを含む。以下において、独立した部分グラフごとにサイクルクロージャ方程式を解く。
【0129】
工程6:独立した部分グラフごとにサイクルクロージャ方程式を解く。
この工程は、部分グラフごとに、ヒステリシスを有しないリガンドのN
i個の対について、自由エネルギーの1組の最適推定値を生成し、また、確率を最大にする。
【0130】
2つの異なる事例が存在する。
事例a:部分グラフ内に閉じたサイクルが存在しない。このとき、この事例に対する解は以下となる。
【0131】
F
i=E
i
e
i=0
上記に示す例において、第3の部分グラフは閉じたサイクルを一切有しない。このため、第3の部分グラフのための解は以下となる。
【0132】
F
8=E
8
e
R=0
事例b:部分グラフ内にm個の独立した閉じたサイクルが存在する。
【0133】
この事例では、n個の要素および対応するRC3Mである、M=M
SR(m×n行列)を有する最終リスト組S
f内のリストL
sに対応する部分グラフごとに、以下の関数、
【0137】
ここで、j∈{1,2...m}、i∈L
s
の下で最小化される。
ラグランジュ乗数を用いて、以下の関数、
【0141】
ここで、j∈{1,2...m}、およびi∈L
s
の下で最小化する必要がある場合がある。ここで、C
jはラグランジュ乗数の係数である。
【0146】
を確立する。
ここで、M
TjiはM
jiの転置である。
行列式において書かれると、
【0148】
であり、以下の2組の式がもたらされる。
【0150】
式(1)を式(2)に代入して、以下の式を得る。
【0152】
RC3M行列MおよびベクトルEの双方が知られているので、式が解かれ、係数ベクトルCを得ることができる。係数が解かれた後、式(1)は、シミュレーションのn個の対について最良の自由エネルギー推定量をもたらす。
【0153】
工程7:可能な相対結合自由エネルギー計算パスごとに誤差推定値を得る。
上記で導入された仮説によれば、閉じたサイクルに沿った相対自由エネルギー計算の和は、標準偏差
【0155】
を有するガウス分布である。ここで、nは閉じたサイクル上のメンバー数である。この閉じたサイクル上のリガンドの対間の計算される差ごとの誤差は、
【0157】
であり、ここで、Δは閉じたサイクルのヒステリシスである。
閉じたサイクル上のリガンドの対ごとに、閉じたサイクル上のリガンドの対間の計算される自由エネルギー差の誤差が、そのサイクルのヒステリシスによって推定され得る。
【0158】
より誘導形の形式で書かれると、C3MであるM
S(ここでは縮約されていないサイクルクロージャ連結性行列であることに留意されたい)の行ごとに、以下の誤差推定値がサイクル上の各メンバーに割り当てられ得る。
【0160】
全ての閉じたサイクルについて、すなわちM
S内の全ての行について式(4)に従って誤差計算を行った後、相対結合自由エネルギー推定値iのための最終誤差推定値が全ての行からの推定値の最大値として選択される。換言すれば、
【0162】
である。
工程6および工程7の後、n個の相対自由エネルギーのための最良自由エネルギー推定値、およびまた独立した部分グラフごとのこれらの関連するエラーバーを得る。
【0163】
工程8:組内のリガンドの任意の対間の自由エネルギー差の推定値およびこれらの関連するエラーバーを報告する。
前の工程において、本方法は既に、各独立した部分グラフのリガンドのn個の対について、最良自由エネルギー推定値およびこれらの関連するエラーバーを提供している。全ての独立した部分グラフからこれらのデータを共にマージすることによって、以下の出力が生じる。
【0165】
上記で列挙されていないリガンドの任意の対について、本方法は、2つのリガンドを連結することができるグラフ上の全ての可能なパスを列挙し、次に、パスの各エッジ上の自由エネルギーおよびまた誤差を総和する。自由エネルギーはパスから独立しているが、誤差はパスに依拠する場合がある。報告する全ての誤差の最大値は、具体的な式で書かれ得る。
【0169】
であり、最大値は、リガンドL
iおよびリガンドL
jを連結する全ての可能なパスについて取られる。この工程において、自由エネルギー推定値および誤差は、自由エネルギー計算が実行されない(グラフにおいて直接連結されていない)リガンドの対についてのみ計算されることに留意されたい。自由エネルギー計算が実行されるリガンドの対についての自由エネルギー推定値および誤差は、前の工程において計算される。
【0170】
当業者にとって、上記において、閉じたサイクル(複数の場合もある)について観察されるヒステリシス(複数の場合もある)を引き起こす、確からしい自由エネルギー差およびこれらの誤差の確率モデルのコンピュータ実装を開発し、また、そのような確率モデルを所与として、自由エネルギー差およびこれらの誤差の最適な予測を行うための、多くの様々な手法が取られ得ることが明らかであるはずである。例えば制限するものではないが、行列またはグラフによる方法を用いて、必要とされるデータ構造を作成することができ、行列代数またはグラフ理論による方法を用いて確率モデルを構築することができ,最大尤度法またはベイズ法を用いて、ヒステリシス(複数の場合もある)と矛盾しないようにモデルをパラメーター化することができる。先行するセクションにおける代数行列式は、本発明の特定の実施形態にすぎず、経路の区画(leg)の最も確からしい誤差がベネット誤差、ブートストラップ誤差または双方に加算されると仮定することを含む、多くの方法で容易に一般化され得る。同様に、上記代数行列式は、ガウス分布だけでなく、制限するものではないが、ローレンツ分布、レヴィ分布、レイリー分布、デルタ分布および一様分布等の他の分布を用いるように一般化され得る。
【0171】
したがって、閉じたサイクル(複数の場合もある)について観察されるヒステリシス(複数の場合もある)を引き起こす、確からしい自由エネルギー差およびこれらの誤差の特定の確率モデルを構築し、また、そのような確率モデルを所与として、自由エネルギー差およびこれらの誤差の最適な予測を行うために検討され得る多岐にわたる手法は、本明細書に記載される本発明の興味深い実施形態であろう。
【0172】
様々な特定の受容体およびリガンドに対する様々な特定の相対結合自由エネルギー計算への本発明の適用の例示的な実施例
FEP/REST相対自由エネルギー計算アルゴリズム
本発明は、相対自由エネルギー計算(例えば、明確な溶媒モデル計算)の精度および信頼性を改善する。そのような精度は、異なるリガンドが結合するときに結合ポケットを取り囲むタンパク質残基が大きく動く場合、または2つのリガンドが異なる結合モードを採用するか、もしくは1つもしくは複数の変性結合モードが現れる場合に、達成するのが特に困難である
4,11,19。このような事例では、全ての関係するコンフォメーションをサンプリングすることによって、自由エネルギー差の推定値の精度が改善するが、異なるコンフォメーション間で交換するための移行時間が、ほとんどのFEP/MDシミュレーション長のタイムスケールでアクセス可能となるには長すぎる場合がある。
【0173】
ここで、本発明者らは、近年開発された相対自由エネルギー計算法であるFEP/RE
STを用いる方法の有用性を説明する、相対結合自由エネルギー計算の特定の組を提示する。ワンら(Wang et al.)
12によって導入されたFEP/RESTは、強化されたサンプリング法であるRESTを、効率的なラムダホッピングプロトコルを通じてFEP計算に組み込み、容易にアクセス可能なシミュレーション時間内で相対タンパク質−リガンド結合親和性計算における関係するローカル構造再配列をサンプリングする。本発明者らはまた、特定の選択された相対結合自由エネルギー計算方法と独立して、本発明の有用性を同様に説明する、より定型的なFEP/MD相対自由エネルギー計算も提示する。
【0174】
FEPは、λ値によって表される一連の別個の工程において系間でアルケミカル的に(alchemically)変換することによって、2つの系間の自由エネルギー差を計算することを伴う。ここで、λは、初期状態の場合の0から最終状態の場合の1まで変動する。FEP/RESTは、タンパク質残基およびリガンドを含むことができる結合ポケット(「ホット」領域と呼ぶ)を取り囲む局所領域のための潜在エネルギーを変更する。中間λウィンドウについて、局所領域のための潜在エネルギーは1未満の係数でスケーリングされる。このようにして、エネルギー障壁が下げられ、これらの中間λウィンドウにおいて様々なコンフォメーションの効率的なサンプリングが可能になり、様々なコンフォメーションがハミルトニアンレプリカ交換法を通じて最終状態に伝搬される
15,22,23。潜在的なエネルギーがスケーリングされる領域を「ホット」領域と呼ぶ。なぜなら、潜在的なエネルギーへのローカル寄与が、その領域の有効温度が高くなるように、より小さな値にスケーリングされているためである。しかし、この類推は、シミュレーション内においてより高い運動エネルギーを実際に有する粒子には引き継がない。FEP/RESTアルゴリズムに関する詳細は、本願明細書に援用される、ワンら(Wang et al.)
12によるFEP/RESTの研究において記載されている。
【0175】
REST強化型サンプリングのための「ホット」領域は、SARの研究において変異したリガンド官能基を含むように構成される。リガンド官能基が芳香環に付着されると、芳香環も「ホット」領域内に含まれ、環がREST強化型サンプリングを通じてフリップすることが可能になる。REST「ホット」領域のための効率的な温度プロファイルは、参考文献26の式9に従って計算され
24、レプリカ交換の予測受容比を0.3になるように設定し、最適値は、必要なレプリカ数と交換効率との間のトレードオフを反映する。通常のFEP計算およびFEP/REST計算の双方について合計12個のλウィンドウが用いられる。初期状態に一意な静電相互作用は、レナード・ジョーンズ(LJ)相互作用の前にオフにされ、最終状態に一意なLJ相互作用は静電相互作用の前にオンにされた。結合された相互作用は、初期状態から平滑に最終状態にされる。LJ相互作用のコアは、シミュレーションにおける特異性および不安定性を回避するように軟化された
25。本発明による現行のシミュレーションにおいて、SARの研究
16において置換基が変更されたベンゼン環が「ホット」領域に含められ、合計で12個のλウィンドウが達成される最高有効温度は概ね900Kである。
【0176】
FEP/RESTおよびFEP/MDの様々な相対自由エネルギー計算の詳細
デズモンド(Desmond)
26,27において実施されるリガンド官能基変異モジュールが計算をセットアップするのに用いられた
28。OPLS2005力場
29,30がSPC
31水モデルと共にタンパク質およびリガンドのために用いられた。シミュレーションのための開始構造は、ID lhlq、lhlr、lhls、loiu、loi9およびloiyを有するPDB構造から取られた
16。PDB内に複数のコンフォメーションが存在した場合はいつでも、シミュレーションにおいて用いるために第1のコンフォメーションを選択した。タンパク質がタンパク質調剤ウィザードを用いて調剤され
32,33、この間、7.0のpHを仮定してプロトン化状態が割り当てられた
34。サイクリンAはCDK2と共に保持され、全ての計算について、受容体の一部として扱われた。N
a
+イオンまたはCI
−イオンが、電気的中性を維持するために加えられた。系は、デフォルトのデズモンド緩和プロトコルを用いて緩和および平衡化された。デズモンド緩和プロトコルは、一連の最小化および短い分子動力学シミュレーションを伴う。通常のFEP計算およびFEP/REST計算の双方について合計12個のλウィンドウが用いられた。製造段階は、複雑なシミュレーションの場合、2ns続き、溶媒シミュレーションの場合、5ns続いた。近傍のラムダウィンドウ間のレプリカ交換が1.2psおきに試行された。製造段階は、FEP/MDおよびFEP/RESTを用いてサンプリングされた。ベネット受容比法(BAR)
35を用いて自由エネルギーが計算された。ブートストラッピング
19,36およびBAR解析誤差予測
19,36,37の双方を用いて自由エネルギー計算ごとに誤差が推定され、2つの誤差のうちの大きい方が報告された。
【0177】
本発明の特定の適用による予測の一貫性および信頼性の評価
最も単純には、共通参照リガンドから全てのFEPシミュレーションを実行することによって、相対タンパク質−リガンド結合親和性FEP計算におけるリガンドの全体組について相対結合親和性を順位付けすることができる。更に、計算ごとに完全に収束した結果を取得する場合、最終的な予測は理論的に、相対結合自由エネルギー計算を行うために選択されるパスと独立している。例えば、3つのリガンドA、BおよびCの場合、リガンドAとリガンドCとの間で相対結合親和性を取得するための2つの戦略、すなわち(1)AからCまでパスを直接サンプリングする、または(2)AからBおよびBからCの2工程でパスをサンプリングし、次に、2つの取得した自由エネルギーを合算する、が存在する。理論的に、上記の2つの方法からの最終的な収束した自由エネルギー推定値は同じであるはずである。一方、実際には、ベネット誤差限界によって特徴付けることができる位相空間のサンプリングにおける不規則変動に起因する不偏誤差と、ベネット誤差限界によって特徴付けされない位相空間の系統的に不完全なサンプリングに起因したバイアス誤差とを含む、各計算における誤差に起因して、上記の2つのパスからの分散および平均値の双方が、通例、幾分異なっている
38。これらの制限を所与として、取得した結果の信頼性を評価することが重要である。
【0178】
予測の一貫性および信頼性に関する追加情報を得るために、全てのパスについてサイクルクロージャを含む。上記で与える例において、2つのパスからの結果が指定された閾値以内まで一致する場合、これは予測に一貫性があり、利用される力場の制限内で信頼性がある可能性が高いことを示す。一方、2つのパスからの結果が、ある閾値を超えて異なっている場合、これは、結果が収束していない場合があり、予測に信頼性がない場合があることを示す場合がある。閾値は、各サイクル内のメンバーの数、およびサイクル内の区画について予期する誤差に依拠する。本発明のこの特定の実施形態は、予測の信頼性、およびサイクルごとの適切な閾値をどのように適応的に割り当てるかを厳密に評価する。更に、パス内にサイクルクロージャを含めると、2つの状態間の自由エネルギー差を計算する複数の独立した方法が存在する。本発明のこの特定の実施形態では、閉じたサイクルに沿って取得された複数の自由エネルギー推定値からの最適予測も報告される。この実施形態において、本発明はまた、各サイクルのヒステリシスからの自由エネルギー計算に関連する収束誤差に関する情報も直接提供する。
【0179】
本明細書において検討される方法は、これらの工程を実行するようにプログラムされたコンピュータシステムによって実行される。
図15において、システムは、コンピュータ(複数の場合もある)110と、データストア120と、プログラムモジュール130とを備える。コンピュータ命令は、1つまたは複数の非一時的コンピュータ可読媒体に記憶される。
図16は、全ての自由エネルギー計算パスについての計算される自由エネルギーの列挙(302)と、全ての閉じたサイクルの列挙およびサイクルクロージャ連結性行列の組み立て(304)と、独立した部分グラフへの全体グラフの分解(306)とを含む本方法における工程を示す。
【0180】
以下で、ある特定の例を検討し、以下のように関係する表を提示する。
表1:参照リガンドlhlqと比較した、結晶構造を有する5つのリガンドについてFEP/MDおよびFEP/RESTにより予測される相対結合自由エネルギー。
表2:本発明の実施形態によって導出される式を用いるFEP/MD計算およびFEP/REST計算からの、結晶構造を有する6つのリガンドについての最終自由エネルギー予測。
表3:FEP/RESTを用いて研究されるCDK2阻害剤およびこれらの化合物#の構造。
表4:結晶構造を有しない追加の10個の化合物についての、FEP/RESTにより予測される相対結合自由エネルギー。
表5:本発明の実施形態によって導出される式を用いる、リガンドの全体組についての最終自由エネルギー予測。
表6:jnk1リガンドの8つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
表7:jnk1に結合している7つのリガンドについての予測結合親和性およびそれらの関連誤差。
表8:BACEリガンドのための7つの7相対結合自由エネルギー計算パスについてのFEP/REST結果。
表9:BACEに結合している6つのリガンドについての予測結合親和性およびそれらの関連誤差。
表10:シタロンデヒドラターゼリガンドの9個の相対結合自由エネルギー計算パスについてのMC/FEP結果。
表11:シタロンデヒドラターゼに結合している3つのリガンドについての予測結合親和性およびそれらの関連誤差。
表12:
図14において描かれる4つの状態間のサイクルクロージャにより予測される自由エネルギー差およびそれらの関連誤差。
【0181】
結果および検討
結晶構造を有するリガンドにおける性能
図5に表示される、CDK2−サイクリンA受容体に結合している6つのリガンドについて、相対結合親和性を予測するためのFEP/MDシミュレーションおよびFEP/RESTシミュレーションが行われた。これらは、PDB ID lhlq、lhlr、lhls、loi9、loiuおよびloiyを有するホロ複合体ごとに利用可能な、結晶構造を有する6つのみのリガンドであり
16、これらのリガンドのための実験による結合親和性データは、同じ方法を用いる同じ公表文献を基にした。このため、リガンドの結合モードは結晶学から既知であるので、ここで報告される計算は、本質的に純粋にスコアリングの演習である。これらの結晶構造において、いずれのリガンドが結合しているかに関わらず、CDK2受容体・コンフォメーションは本質的に同じである。このため、シミュレーション収束を大きく制限するタンパク質コンフォメーション変化のサンプリングは予期しなかった。計算において、5つ全ての摂動のための開始構造として、lhlqからのタンパク質コンフォメーションおよびリガンドを用いることを選択した(
図5において青い矢印で描画される)。なぜなら、組内の全ての他のリガンドは、リガンドlhlqのベンゼン環上に様々な置換基を付加することによって生成されるためでる。
【0182】
FEP/MD結果とFEP/REST結果との比較
結晶構造を有するリガンド間の相対結合自由エネルギー計算パスについてのFEP/MD結果およびFEP/REST結果が表1に与えられる。予測と、実験による結合親和性データとの相関が
図6に表示される。実験による結合親和性の〜14.64kJ/mol(〜3.5kcal/mol)の範囲に関わらず、FEP/MDは、5つの複合体(参照
複合体lhlqを除外する)がほぼ同じ結合親和性を有し、結果として0.32のR
2値が得られることを予測する。比較により、FEP/REST結果は、実験値と高く相関し(R
2=0.91)、実験値からのFEP/REST結果の偏差は、全てのリガンド対について3.347kJ/mol(0.8kcal/mol)未満である。
【0183】
FEP/MD結果およびFEP/REST結果の比較から、2つの方法からの複合体loi9、loiuおよびlioyのための予測は、本質的に同じであり、実験結果との改善された相関の主な理由は、FEP/RESTを用いたリガンドlhlsおよびlhlrについてのより良好な結合親和性推定値を基にしているようである。以下で、これらの2つの事例についてFEP/RESTがFEP/MDよりも大幅に性能が優れている理由を検討する。
【0184】
リガンドlhlrについてのFEP/MD軌道およびFEP/REST軌道の検査は、2−クロロ置換ベンゼン環がFEP/REST軌道において数回フリップする一方で、FEP/MD軌道では環は初期コンフォメーションにトラップされたままであることを示した。結晶構造のコンフォメーションのうちの1つに対応する初期コンフォメーション、およびFEP/REST計算において観察される代替フリップコンフォメーションが
図7に表示される。興味深いことに、リガンドlhlrについて、堆積されたX線結晶構造における電子密度は、FEP/REST計算において見られる交互の結合モードに対応する代替リガンド結合モード(
図7の右パネル)も示した。
【0185】
lhlsについて、結晶構造においてモデル化される結合モードに加えて、FEP/REST軌道では別のコンフォメーションがサンプリングされるが、FEP/MDシミュレーションではサンプリングされない。
図8は、結晶構造において見られる結合モードおよびFEP/REST計算においてサンプリングされる代替結合モードを表示する。結晶構造では、スルホンアミド基はAsp86との2つの水素結合(HB)を行い、一方は主鎖との水素結合であり、もう一方は側鎖との水素結合である。FEP/RESTシミュレーションにおいてサンプリングされる代替結合モードでは、スルホンアミド基は結晶構造に対しCS結合の回りを約120°回転する。それに応じて、結合ポケットを取り囲む残基、特にGln85およびAsp86が再配列し、スルホンアミド基とタンパク質残基との間に2つの水素結合が形成され、一方はAsp側鎖との水素結合であり、他方はGln85側鎖との水素結合である。X線結晶学における結合ポケットおよびリガンドを取り囲むこれらの数個の残基のB係数は、これらの基が非常に不安定であることを示す
16。したがって、リガンドが溶媒内で2つの結合モード間で切り替わり得る可能性が非常に高い。FEP/RESTシミュレーション軌道では、結晶学的に観察される結合モードと代替結合モードとの占有比はほぼ60:40であり、結晶学的に決定されたモードに有利である。一方、この代替結合モードのサンプリングは、結合親和性の正確な予測のために非常に重要なようであり、FEP/MDと比較して、この種の相対結合自由エネルギーを正確に算出する際に、FEP/RESTのより高い有効性に対し責任を担う。興味深いことに、本発明は、実験データを参照することなくこれを決定することを可能にする。なぜなら、FEP/MDに関連する算出誤差は、本発明のこの特定の実施形態によって、高くなるように算出され(loiuおよびlhlsの場合、4.226kJ/mol(1.01kcal/mol)、ならびにloiy、loi9およびlhlsの場合、〜2.929kJ/mol(〜0.7kcal/mol))、それに対し、FEP/RESTに関連する算出誤差は、本発明によって低くなる(全てのリガンドについて0.8368kJ/mol(0.2kcal/mol)〜1.674kJ/mol(0.4kcal/mol))ように算出されるためである。
【0186】
本発明の特定の実施形態を用いた相対自由エネルギー計算の一貫性および信頼性の評価
FEP/RESTの一貫性および信頼性を評価するために、相対結合自由エネルギー計
算パス(
図5)において3つのサイクルクロージャを形成する3つの更なるシミュレーションを実行した。これらのサイクルを形成する3つのパスのFEP/REST結果が表1の最後の3つの行に与えられる。本発明の特定の実施形態によって決定されたこれらのリガンドの結合親和性のための最終予測が表2に与えられる。3つ全てのサイクルについて、サイクルは、異なるパスから3.347kJ/mol(0.8kcal/mol)未満の差異で自己矛盾なく閉じており、これは、自由エネルギーが良好に収束し、基礎をなす力場の制限内で予測の信頼性が高いことを示す。
【0187】
一方、サイクルが十分に閉じており、様々なパスから計算される自由エネルギーがややタイトな閾値内で一致している場合であっても、これらは正確に同じではない。このため、同じリガンド対について、リガンド間のパスをどのようにトラバースするかに依拠して、自由エネルギー差のための複数の様々な推定値を有する。次に、自由エネルギーのための統計的に最良の推定値を取得するために、計算において生成される全ての情報をどのように最良に組み込むか?という問が残される。本発明の特定の実施形態を用いて、自由エネルギーの最適推定値、およびこれらの予測に関連する誤差を決定する。ここで、全てのサイクルは良好に閉じており、サイクルクロージャを有する最終予測は、サイクルクロージャを有しない上記の予測と良好に一致し、これらの計算の高い信頼性を更に立証する。最終予測と実験結果との間の偏差は、全て2.929kJ/mol(0.7kcal/mol)未満であり、これらは実験データと非常に高い相関を有する(R
2=0.92)。
【0188】
本発明のこの特定の実施形態が、FEP/MD相対自由エネルギー計算を用いて算出された同様の閉じたサイクルに適用されたときと対象的に、リガンドlhlrおよびlhlsを伴う閉じたサイクルのヒステリシスは非常に大きく(それぞれ7.322kJ/mol(1.75kcal/mol)および5.648kJ/mol(1.35kcal/mol)の大きさ)、FEP/MD計算が収束していないことを示す。本発明のこの特定の実施形態によるサイクルクロージャ自由エネルギー推定値を用いると、これらのFEP/MD自由エネルギー計算の誤差は、FEP/REST結果(それぞれ1.464kJ/mol(0.35kcal/mol)および1.046kJ/mol(0.25kcal/mol)の誤差)よりもはるかに大きい(それぞれ4.226kJ/mol(1.01kal/mol)および2.845kJ/mol(0.68kal/mol))。
【0189】
結晶構造を有しないリガンドにおける性能
本発明によるモデルを更に実証するために、ホロ複合体に対し利用可能な結晶構造を有しない同じ受容体に結合する別の10個のリガンドについて更なるFEP/REST計算が実行された。これらの10個のリガンドは、ハンドキャッスル(Handcastle)
16によって同じ公表文献からランダムに選択された。上記で言及した結晶構造を有するリガンドと同じ方法を用いて結合親和性が測定され、これらは同じコアを保つ。元の公表文献
16のように、リガンドの構造およびこれらの対応する複合体番号が表3に与えられる。これらのリガンドについてのFEP/REST予測相対結合親和性が、実験データと共に表4において報告される。サイクルクロージャは、これらのリガンドのためのパスにおいて構築され(
図9)、サイクルクロージャのヒステリシスは全て4.184kJ/mol(1.0kcal/mol)未満であり、これは、計算が高度に収束していることを示す。本発明のこの特定の実施形態による最終的な予測相対結合親和性が表5において報告される。相対結合自由エネルギー計算パスにおいて構築されるサイクルクロージャを有するリガンドについて、自由エネルギー予測に関連する誤差も表5において報告される。予測相対結合親和性と、リガンドの全体組のための実験データとの間の相関(結晶構造を有する6つのリガンドおよび結晶構造を有しない10個のリガンド)が
図10に表示される。結晶構造を有しないこれらのリガンドについて、FEP/REST自由エネルギー計算に適用されたときに本発明のこの特定の実施形態の性能が良好であることは明らかであり、手法の移行可能性を更に実証している。実験データと比較した予測結合親和性の平
均偏差は1.841kJ/mol(0.44kcal/mol)であり、R
2値は0.82である。
【0190】
結論
上記において、複数の実施形態において、本方法が、近年開発された自由エネルギー計算FEP/REST法およびより定型的に用いられるFEP/MD自由エネルギー計算法に適用され、CDK2−サイクリンA受容体に結合する一連の同種リガンド間の相対結合親和性を計算することができることを示した。本発明は、FEP/REST自由エネルギー計算予測とFEP/MD自由エネルギー計算予測との比較を容易にした。結晶構造を有する6つのリガンドについて相対結合親和性を順位付けする際に、より定型的なFEP/MD法は性能が不良であったが、本発明は、FEP/MD予測に関連する誤差が高いことを示す値を提供した。対照的に、FEP/RESTにより計算された相対結合親和性は、実験データと極めて一致し、本発明の適用により収束することが示された。結晶構造を有しない10個のリガンドを含むより大きなデータセットに対しFEP/REST法によって実行される相対自由計算への本発明の適用は、同種リガンドの相対結合親和性を正しく順位付けする本発明の能力を更に実証した。
【0191】
本発明は、任意のタイプの相対自由エネルギー計算手順に関連するサイクルクロージャ計算から導出された情報を用いて自由エネルギーの一貫性および信頼性を評価する手段を提供する。本発明は、予測の一貫性および信頼性を判定する明確な判断基準、および良好に形成された誤差限界を有する自由エネルギーの最適推定値を提供する。CDK2−サイクリンA系列への本発明の適用は、FEP/REST相対自由エネルギー計算を用いる本発明による予測の信頼性が高いことを示し、これは、予測が実験データと極めて一致していることによっても証明される。同様に、本発明はFEP/MD予測の信頼性がより低いことを妥当に決定した。
【0192】
本発明の一般性および有用性において、他の系および他の相対結合自由エネルギー計算への本発明の様々な実施形態の更なる適用を含む。
多岐にわたる相対結合自由エネルギー計算方式を用いた多岐にわたる系への本発明の様々な実施形態の更なる適用
I.JNK1キナーゼへの本発明の一実施形態の適用
相対結合自由エネルギー計算パスにおける2つのサイクルクロージャを有するjnkl受容体と結合するリガンドのサブセットについてFEP/REST相対結合自由エネルギーシミュレーションが実行された(
図11)。リガンドのサブセットのためのリガンド番号は[2,6,7,9,10,12,13]であり、8つの相対結合自由エネルギー計算パスのための8つのFEP/REST結果が表6に列挙される。
【0193】
サイクルクロージャの最良エネルギー推定量および誤差推定量を用いて、7つのリガンドについての結合親和性およびこれらの関連するエラーバーが表7において報告される。
サイクルクロージャ推定値は、シミュレーションの力場において系統誤差を補正することができないことに留意されたい。このため、リガンドのうちの2つ(リガンド12および13)のための予測結合親和性は、実験値と比較して6.276kJ/mol(1.5kcal/mol)よりも大きく離れる。この偏差は、力場における誤差または実験測定値における不確実性のいずれかに起因する場合がある。しかし、予測結果と実験値との全体相関は非常に良好である。
【0194】
II.BACEへの本発明の一実施形態の適用
相対結合自由エネルギー計算パスにおける2つの独立したサイクルクロージャを有するBACEに結合するリガンドのサブセットについてFEP/RESTシミュレーションが実行された(
図12に示す)。リガンドのサブセットのためのリガンド番号は[4j,4
o,4p,17d,17g,17h]であり、7つの相対結合自由エネルギー計算パスのための7つのFEP/REST結果が表8に列挙される。
【0195】
サイクルクロージャの最良自由エネルギー推定量および誤差推定量を用いて、6つのリガンドについての結合親和性およびこれらの関連するエラーバーが表9において報告される。
【0196】
ここでもまた、リガンド17hについての結合親和性は、約8.368kJ/mol(2kcal/mol)だけ過剰予測されるが、予測結果と実験値と全体相関は非常に良好であることに留意されたい。
【0197】
III.シタロンデヒドラターゼに結合するリガンドのFEP/MC相対結合自由エネルギー計算への本発明の一実施形態の適用
活性部位における水結合を有するシタロンデヒドラターゼおよび有しないシタロンデヒドラターゼに結合する3つのリガンド間の相対結合親和性がFEP/MCを用いて計算される
39。4つの独立サイクルクロージャを有するこれらのシミュレーションのための相対結合自由エネルギー計算パスが
図13に表示される。相対結合自由エネルギー計算のための計算される結合親和性が表10において報告される。
【0198】
サイクル[L1(H2O),L2(H2O),L3(H2O)]のヒステリシスは、5.858kJ/mol(1.4kcal/mol)よりもはるかに大きい17.99kJ/mol(4.3kcal/mol)であり、これは、これらの計算が収束していないことを示し、このサイクルの内部の計算される結合親和性も実験データからの大きな偏差を有する。同様に、サイクル[L3(H2O),L3,L2,L2(H2O)]について、ヒステリシスは、5.858kJ/mol(1.4kcal/mol)よりも大きい6.276kJ/mol(1.5kcal/mol)であり、これは、これらの計算にも信頼性がないことを示す。
【0199】
他方で、他のサイクル[L1(H2O),L1,L3,L3(H2O)]および[L1,L2,L3]のヒステリシスは非常に小さく(それぞれ、0.8368kJ/mol(0.2kcal/mol)および2.092kJ/mol(0.5kcal/mol))、計算に信頼性があることを示す。上記に記載のサイクルクロージャ推定値を有する3つのリガンド間の最終的な予測相対結合親和性が表11において報告される。
【0200】
IV.モデルエンクロージャーのための試験粒子挿入による相対結合自由エネルギーサンプリングへの本発明の一実施形態の適用
融合原子メタンと電荷を有するモデルエンクロージャーおよび電荷を有しないモデルエンクロージャーとの間の相対結合自由エネルギーが試験粒子挿入法を用いて計算される
40。結合メタンを有するモデルエンクロージャーおよび結合メタンを有しないモデルエンクロージャーに帯電する自由エネルギーも、FEP/MDサンプリングを用いて計算される。相対結合自由エネルギー計算パスは、閉じたサイクルを形成し(
図14)、サイクル上のエッジごとの関連自由エネルギーがここで報告される。
【0201】
上記で記載したサイクルクロージャ解析を用いて、
図16において描く4つの状態間の予測自由エネルギー差およびこれらの関連誤差が表12において報告される。
複数の実施形態が記載された。それにもかかわらず、本発明の趣旨および範囲から逸脱することなく種々の変更を行うことができることが理解されよう。
【0202】
表
表1:参照リガンドlhlqと比較した、結晶構造を有する5つのリガンドについてF
EP/MDおよびFEP/RESTにより予測される相対結合自由エネルギー。結晶構造を有する6つのリガンドについて3つのサイクルクロージャを形成する3つの相対結合自由エネルギー計算パスの結果も表に含まれる。BAR解析誤差推定を用いて計算される自由エネルギーの誤差も表に含まれる。FEP/MDによる予測結果は、リガンドlhlrおよびlhlsについて実験データからの大きな偏差を有し(表における太字)、一方、FEP/RESTによる予測結果は、全て実験データと良好に一致する。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
【0204】
表2:本発明の実施形態によって導出される式を用いるFEP/MD計算およびFEP/REST計算からの、結晶構造を有する6つのリガンドについての最終自由エネルギー予測。サイクルクロージャを用いる最終自由エネルギー予測についての、本発明の実施形態によって導出される式を用いる誤差推定値も表に含まれる。リガンドIhlqが参照として用いられ、このため、リガンドIhlqの偏差は設計により0である。リガンドIhlqがこの研究のために用いられる参照リガンドであるので、リガンドIhlqについてサイクルクロージャエラーバーは報告されず、リガンドIhlqの結合自由エネルギーは、プロット目的でリガンドIhlqの実験値に全く同一に設定されることに留意されたい。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
【0206】
表3:FEP/RESTを用いて研究されるCDK2阻害剤およびこれらの化合物#の構造。
【0208】
表4:結晶構造を有しない追加の10個の化合物についての、FEP/RESTにより予測される相対結合自由エネルギー。BAR解析誤差推定を用いて計算される自由エネルギーについての誤差も表において報告される。自由エネルギーはkJ/mol(kcal
/mol)単位で報告される。
【0210】
表5:本発明の実施形態によって導出される式を用いる、リガンドの全体組についての最終自由エネルギー予測。サイクルクロージャを用いる最終自由エネルギー予測についての、本発明の実施形態を用いる誤差推定値も表に含まれる。リガンドIhlqが参照として用いられ、このため、リガンドIhlqの偏差は設計により0である。リガンドIhlqがこの研究のために用いられる参照リガンドであるので、リガンドIhlqについてサイクルクロージャエラーバーは報告されず、リガンドIhlqの結合自由エネルギーは、プロット目的でリガンドIhlqの実験値に全く同一に設定されることに留意されたい。リガンド20、31および32についてもサイクルクロージャエラーバーは報告されない。なぜならこれらの種は、誤差について閉じたサイクルを形成することが要求されるように、参照リガンド以外の他のリガンドに連結することが技術的に困難であったためである。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
【0212】
表6:jnk1リガンドの8つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
【0214】
表7:jnk1に結合している7つのリガンドについての予測結合親和性およびそれらの関連誤差。
【0216】
表8:BACEリガンドのための7つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
【0218】
表9:BACEに結合している6つのリガンドについての予測結合親和性およびそれらの関連誤差。
【0220】
表10:シタロンデヒドラターゼリガンドの9個の相対結合自由エネルギー計算パスについてのMC/FEP結果。
【0222】
表11:シタロンデヒドラターゼに結合している3つのリガンドについての予測結合親和性およびそれらの関連誤差。3つのリガンドについての予測結合親和性は比較的大きな誤差を有するにもかかわらず、非常に大きな誤差を有する相対結合自由エネルギー計算パスはフィルタリング除去され、正しい順位が予測される。
【0224】
*注:表において報告される結合親和性はリガンド1と比較した相対結合親和性である。
表12:
図14において描かれる4つの状態間のサイクルクロージャにより予測される自由エネルギー差およびそれらの関連誤差。Mは融合原子メタンを表す、Pは疎水性プレートを表す、CPは帯電プレートを表す、MPは融合原子メタンと結合した疎水性プレートを表す、MCPは融合原子メタンと結合した帯電プレートを表す。