特許7343911 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ　ボード　オブ　トラスティーズ　オブ　ザ　レランド　スタンフォード　ジュニア　ユニバーシティーの特許一覧

特許7343911結合および活性予測を強化するための機械学習および分子シミュレーションに基づく方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8A
8B
8C
8D
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-05

(45)【発行日】2023-09-13

(54)【発明の名称】結合および活性予測を強化するための機械学習および分子シミュレーションに基づく方法

(51)【国際特許分類】

G01N 33/68 20060101AFI20230906BHJP

【ＦＩ】

G01N33/68

【請求項の数】 20

(21)【出願番号】P 2020546373

(86)(22)【出願日】2019-03-05

(65)【公表番号】

(43)【公表日】2021-06-17

(86)【国際出願番号】 US2019020843

(87)【国際公開番号】W WO2019173407

(87)【国際公開日】2019-09-12

【審査請求日】2022-03-04

(31)【優先権主張番号】62/638,805

(32)【優先日】2018-03-05

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】503115205

【氏名又は名称】ザボードオブトラスティーズオブザレランドスタンフォードジュニアユニバーシティー

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(72)【発明者】

【氏名】フェインバーグ，エバンナサニエル

(72)【発明者】

【氏名】パンデ，ビジャイサティアナンド

【審査官】三木隆

(56)【参考文献】

【文献】国際公開第２００２／１０１０７７（ＷＯ，Ａ２）

【文献】特表２００５－５１７６３０（ＪＰ，Ａ）

【文献】特開２０１６－１６６１５９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１５／０１９３５７５（ＵＳ，Ａ１）

【文献】国際公開第２０１７／０７０１６０（ＷＯ，Ａ１）

【文献】米国特許出願公開第２００２／００７２５８７（ＵＳ，Ａ１）

【文献】Diwakar Shukla，Elucidating Ligand-Modulated Conformational Landscape of GPCRs Using Cloud-Computing Approaches，Methods in Enzymology，2015年03月24日，Vol.557，Page.551-572

【文献】Ashtawy, Hossam Mohamed Farg，Data-driven and task-specific scoring functions for predicting ligand binding poses and affinity and for screening enrichment，2017年，https://doi.org/doi:10.25335/M5QX2N

【文献】Brian E Krumm，Structure and dynamics of a constitutively active neurotensin receptor，Sci Rep，2016年12月07日，Vol.6，Page.38564

【文献】Pedro J Ballester，A machine learning approach to predicting protein-ligand binding affinity with applications to molecular docking，Bioinformatics，2010年03月17日，Vol.26 No.9，Page.1169-1175

【文献】Qurrat Ul Ain，Machine-learning scoring functions to improve structure-based binding affinity prediction and virtual screening，Wiley Interdiscip Rev Comput Mol Sci，2015年08月28日，Vol.5 No.6，Page.405-424

【文献】Gabriela S Heck，Supervised Machine Learning Methods Applied to Predict Ligand- Binding Affinity，Curr Med Chem，2017年，Vol.24 No.23，Page.2459-2470

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０１Ｎ３３／６８

(57)【特許請求の範囲】

【請求項1】

１つまたは複数のコンピューターによって実施するリガンドと受容体との間の関係を予測するための方法であって、
前記受容体の複数のクラスタリングされたコンフォメーションを同定するステップであって、
前記受容体のシミュレートされたコンフォメーションの集合を定める、前記受容体の時間間隔にわたる分子動力学のシミュレーションを行うこと、および
前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングして、前記受容体の前記複数のクラスタリングされたコンフォメーションを生成すること
を含む、ステップと、
前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについて、前記受容体の前記クラスタリングされたコンフォメーションと、前記リガンドとの間のそれぞれのドッキングスコアを計算するステップと、
機械学習モデルによって、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記機械学習モデルへのモデル入力を受信するステップであって、前記機械学習モデルは、監督された機械学習技術により訓練された機械学習モデルパラメーターのセットによってパラメータ化されている、ステップと、
前記機械学習モデルパラメーターのセットの訓練された値に従って、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記モデル入力を、前記機械学習モデルを使用して処理して、結合スコアを含む前記機械学習モデルのモデル出力を生成するステップであって、前記結合スコアは前記リガンドの前記受容体への結合親和性を特徴付けるスコアである、ステップと
を含む、方法。

【請求項2】

前記受容体のシミュレートされたコンフォメーションの前記集合が、少なくとも１つの非結晶学的状態を含む、請求項１に記載の方法。

【請求項3】

前記受容体の分子動力学のシミュレーションを行うことが、前記受容体と前記リガンドとの相互作用をシミュレートすることを含む、請求項１または２に記載の方法。

【請求項4】

前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングすることが、前記受容体のシミュレートされたコンフォメーションの前記集合に対して次元削減演算を行うことを含む、請求項１～３のいずれか一項に記載の方法。

【請求項5】

前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについて、前記受容体の前記クラスタリングされたコンフォメーションと、前記リガンドとの間のドッキングスコアを計算するステップが、前記リガンドと前記受容体のクラスタリングされたコンフォメーションのドッキングをシミュレートすることを含む、請求項１～４のいずれか一項に記載の方法。

【請求項6】

前記機械学習モデルが、１つまたは複数のランダムフォレストモデルを含む、請求項１～５のいずれか一項に記載の方法。

【請求項7】

前記リガンドと前記受容体との反応を、物理的に試験するステップをさらに含む、請求項１～６のいずれか一項に記載の方法。

【請求項8】

前記機械学習モデルが、ニューラルネットワークモデルを含む、請求項１～７のいずれか一項に記載の方法。

【請求項9】

前記機械学習モデルの前記モデル出力が、前記リガンドが前記受容体のアゴニストである尤度を特徴付けるアゴニストスコアを含む、請求項１～８のいずれか一項に記載の方法。

【請求項10】

前記機械学習モデルの前記モデル出力が、（ｉ）前記リガンドの前記受容体への結合親和性を特徴付ける結合スコア、および（ｉｉ）前記リガンドが前記受容体のアゴニストである尤度を特徴付けるアゴニストスコアを含み、
前記方法が、前記結合スコアおよび前記アゴニストスコアを組み合わせることにより全体スコアを生成するステップをさらに含む、請求項１～９のいずれか一項に記載の方法。

【請求項11】

前記結合スコアおよび前記アゴニストスコアを合わせることにより全体スコアを生成するステップが、前記結合スコアおよび前記アゴニストスコアの積を計算することを含む、請求項１０に記載の方法。

【請求項12】

前記分子動力学シミュレーションの時間間隔が、少なくとも１ミリ秒の持続期間を有する、請求項１～１１のいずれか一項に記載の方法。

【請求項13】

前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングすることが、前記受容体のシミュレートされたコンフォメーションの前記集合にｋ－平均クラスタリング演算を適用することを含む、請求項１～１２のいずれか一項に記載の方法。

【請求項14】

前記受容体のシミュレートされたコンフォメーションの前記集合が、前記受容体の百万のシミュレートされたコンフォメーションを含む、請求項１～１３のいずれか一項に記載の方法。

【請求項15】

前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングすることが、クラスターのセットを生成することを含み、ここで、前記クラスターのセットにおけるクラスターの数は、前記受容体のシミュレートされたコンフォメーションの前記集合における前記受容体のシミュレートされたコンフォメーションの数よりも少ない、請求項１～１４のいずれか一項に記載の方法。

【請求項16】

１つまたは複数のコンピューターによって実行された場合に、前記１つまたは複数のコンピューターにリガンドと受容体との間の関係を予測するための命令を実施させる、１つまたは複数の非一過性コンピューター記録媒体であって、前記操作は、
前記受容体の複数のクラスタリングされたコンフォメーションを同定するステップであって、
前記受容体のシミュレートされたコンフォメーションの集合を定める、前記受容体の時間間隔にわたる分子動力学のシミュレーションを行うこと、および
前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングして、前記受容体の前記複数のクラスタリングされたコンフォメーションを生成すること
を含む、ステップと、
前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについて、前記受容体の前記クラスタリングされたコンフォメーションと、前記リガンドとの間のそれぞれのドッキングスコアを計算するステップと、
機械学習モデルによって、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記機械学習モデルへのモデル入力を受信するステップであって、前記機械学習モデルは、監督された機械学習技術により訓練された機械学習モデルパラメーターのセットによってパラメータ化されている、ステップと、
前記機械学習モデルパラメーターのセットの訓練された値に従って、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記モデル入力を、前記機械学習モデルを使用して処理して、結合スコアを含む前記機械学習モデルのモデル出力を生成するステップであって、前記結合スコアは前記リガンドの前記受容体への結合親和性を特徴付けるスコアである、ステップと
を含む、非一過性コンピューター記録媒体。

【請求項17】

１つまたは複数のコンピューター、および
前記１つまたは複数のコンピューターと通信可能に接続された１つまたは複数の記録デバイス
を含むシステムであって、前記１つまたは複数の記録デバイスは、前記１つまたは複数のコンピューターによって実行された場合に、前記１つまたは複数のコンピューターにリガンドと受容体との間の関係を予測するための操作を実施させる命令を記録し、前記操作は、
前記受容体の複数のクラスタリングされたコンフォメーションを同定するステップであって、
前記受容体のシミュレートされたコンフォメーションの集合を定める、前記受容体の時間間隔にわたる分子動力学のシミュレーションを行うこと、および
前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングして、前記受容体の前記複数のクラスタリングされたコンフォメーションを生成すること
を含む、ステップと、
前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについて、前記受容体の前記クラスタリングされたコンフォメーションと、前記リガンドとの間のそれぞれのドッキングスコアを計算するステップと、
機械学習モデルによって、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記機械学習モデルへのモデル入力を受信するステップであって、前記機械学習モデルは、監督された機械学習技術により訓練された機械学習モデルパラメーターのセットによってパラメータ化されている、ステップと、
前記機械学習モデルパラメーターのセットの訓練された値に従って、前記受容体の前記複数のクラスタリングされたコンフォメーションのそれぞれについての前記それぞれのドッキングスコアを含む前記モデル入力を、前記機械学習モデルを使用して処理して、結合スコアを含む前記機械学習モデルのモデル出力を生成するステップであって、前記結合スコアは前記リガンドの前記受容体への結合親和性を特徴付けるスコアである、ステップと
を含む、システム。

【請求項18】

前記受容体のシミュレートされたコンフォメーションの前記集合が、少なくとも１つの非結晶学的状態を含む、請求項１７に記載のシステム。

【請求項19】

前記受容体の分子動力学のシミュレーションを行うことが、前記受容体と前記リガンドとの相互作用をシミュレートすることを含む、請求項１７または１８に記載のシステム。

【請求項20】

前記受容体のシミュレートされたコンフォメーションの前記集合をクラスタリングすることが、前記受容体のシミュレートされたコンフォメーションの前記集合に対して次元削減演算を行うことを含む、請求項１７～１９のいずれか一項に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本出願は、２０１８年３月５日に出願された"Machine Learning and Molecular Simulation Based Methods for Enhancing Binding and Activity Prediction"という名称の米国仮特許出願第６２／６３８，８０５号に関し、米国特許法（３５Ｕ．Ｓ．Ｃ．）第１１９条（ｅ）に基づく利益および優先権を請求する。米国仮特許出願第６２／６３８，８０５号の開示は、これにより全ての目的でその全体が参照により本明細書に組み込まれる。

【0002】

本発明は、一般に機械学習方法に関し、より詳細には、分子シミュレーションにおける機械学習の使用に関する。

【背景技術】

【0003】

タンパク質の一分類であるＧタンパク質共役受容体（ＧＰＣＲ）は、ＦＤＡの承認を得た全ての薬物の標的の３分の１以上を構成する。１つのそのようなＧＰＣＲであるμオピオイド受容体（μＯＲ）は、既存のＧＰＣＲ薬の利益および欠点を典型的に示す。モルフィンおよびヒドロコドンなどのオピオイド慢性疼痛投薬は、それらの鎮痛の主な治療目的を達成するが、呼吸抑制および嗜癖などの重篤な副作用を引き起こすμＯＲアゴニストである。

【0004】

２０１５年には、３０，０００名を超えるアメリカ人がオピオイド薬の過剰投与で亡くなっており、僅か５年前の２０，０００名から上昇している。過去１世紀にわたり、医薬品化学者は、依存症の問題なしにオピオイド鎮痛物質を合成するという無駄な努力をしてきた。

【発明の概要】

【課題を解決するための手段】

【0005】

本発明の実施形態による分子シミュレーションのためのシステムおよび方法が例示される。一実施形態は、リガンドと受容体との間の関係を予測するための方法を含む。方法は、受容体の複数のコンフォメーションを同定するステップと、複数のコンフォメーションのそれぞれと１つまたは複数のリガンドのセットとに関するドッキングスコアを計算するステップと、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係を予測するステップとを含む。

【0006】

さらなる実施形態では、複数のコンフォメーションは、少なくとも１つの非結晶学的状態を含む。

【0007】

さらに別の実施形態では、複数のコンフォメーションを同定するステップは、受容体とリガンドとの相互作用をシミュレートすることからシミュレーションデータを作成することを含む。

【0008】

さらにさらなる実施形態では、複数のコンフォメーションを同定するステップは、シミュレーションデータに関してクラスタリング演算を行って複数のコンフォメーションを同定することをさらに含む。

【0009】

さらに別の実施形態では、クラスタリング演算は、ミニバッチｋ平均クラスタリング演算である。

【0010】

さらにさらなる実施形態では、複数のコンフォメーションを同定するステップは、シミュレーションデータに関して次元削減演算を行うことをさらに含む。

【0011】

別の追加の実施形態では、複数のコンフォメーションを同定するステップは、複数のコンフォメーションの各コンフォメーションに関する反応座標のセットを同定することを含む。

【0012】

さらなる追加の実施形態では、ドッキングスコアを計算するステップは、リガンドのセットと複数のコンフォメーションのそれぞれとのドッキングをシミュレートすることを含む。

【0013】

別の実施形態では、やはり、ドッキングスコアを計算するステップは、ドッキングスコアの素性行列を構築することを含み、関係を予測するステップは、素性行列を機械学習モデルに入力することを含む。

【0014】

さらなる実施形態では、やはり、機械学習モデルはランダムフォレストモデルを含む。

【0015】

さらになお別の実施形態では、ランダムフォレストが、８．０（１０ｎＭ）のｐＩＣ５０カットオフを有する。

【0016】

さらになおさらなる実施形態では、ランダムフォレストが第１のランダムフォレストモデルであり、機械学習モデルは、第２のランダムフォレストモデルをさらに含む。

【0017】

さらに別の追加の実施形態では、第１のランダムフォレストモデルは結合のためであり、第２のランダムフォレストモデルはアゴニズムのためである。

【0018】

さらにさらなる追加の実施形態では、第１のランダムフォレストモデルおよび第２のランダムフォレストモデルは、第１のランダムフォレストモデルおよび第２のランダムフォレストモデルの両方からそれぞれ最終スコアを作成するためにライブラリーリガンドに適用される。

【0019】

さらに別の実施形態では、やはり、方法は、公知の薬理学的性質を持つリガンドのデータベースからのリガンドで機械学習モデルを訓練するステップをさらに含む。

【0020】

さらにさらなる実施形態では、やはり、関係を予測するステップは、リガンドが受容体に対するアゴニストであるか否かを決定することを含む。

【0021】

さらに別の追加の実施形態では、方法は、予測された関係に基づいて、１つまたは複数の候補リガンドのセットを同定するステップと、候補リガンドのセットと受容体との反応を物理的に試験するステップとをさらに含む。

【0022】

さらにさらなる追加の実施形態では、関係を予測するステップは、リガンドのセットと複数のコンフォメーションの各コンフォメーションとの関係を予測すること、およびリガンドのセットと受容体との総計の関係を、複数のコンフォメーションに関する予測された関係に基づいて予測することを含む。

【0023】

追加の実施形態および特徴を、以下に続く明細書で部分的に述べ、部分的には本明細書を検討することによって当業者に明らかになりまたは本発明の実施により学ぶことができる。本発明の性質および利点のさらなる理解は、本開示の一部を形成する本明細書の残りの部分および図面を参照することによって実現することができる。

【0024】

特許または出願ファイルは、カラーで作成された少なくとも１つの図面を含有する。カラー図面（複数可）を備える本特許または特許出願公開のコピーは、請求および必要な料金の支払いによって特許庁により提供されることになる。

【0025】

明細書および特許請求の範囲は、本発明の例示的な実施形態として提示されるかつ本発明の範囲の完全な列挙として解釈すべきではない、以下の図およびデータグラフを参照することによって、より十分に理解されよう。
本発明の実施形態において、例えば以下の項目が提供される。
（項目１）
リガンドと受容体との間の関係を予測するための方法であって、
受容体の複数のコンフォメーションを同定するステップと、
前記複数のコンフォメーションのそれぞれと１つまたは複数のリガンドのセットとに関するドッキングスコアを計算するステップと、
前記１つまたは複数のリガンドのセットと前記受容体の複数のコンフォメーションとの間の関係を予測するステップと
を含む、方法。
（項目２）
前記複数のコンフォメーションが、少なくとも１つの非結晶学的状態を含む、項目１に記載の方法。
（項目３）
前記複数のコンフォメーションを同定するステップが、前記受容体とリガンドとの相互作用をシミュレートすることからシミュレーションデータを作成することを含む、項目１に記載の方法。
（項目４）
前記複数のコンフォメーションを同定するステップが、前記シミュレーションデータにクラスタリング演算を行って前記複数のコンフォメーションを同定することをさらに含む、項目３に記載の方法。
（項目５）
前記クラスタリング演算が、ミニバッチｋ－平均クラスタリング演算である、項目４に記載の方法。
（項目６）
前記複数のコンフォメーションを同定するステップが、前記シミュレーションデータに対して次元削減演算を行うことをさらに含む、項目３に記載の方法。
（項目７）
前記複数のコンフォメーションを同定するステップが、前記複数のコンフォメーションの各コンフォメーションに関する反応座標のセットを同定することを含む、項目１に記載の方法。
（項目８）
前記ドッキングスコアを計算するステップが、前記リガンドのセットと前記複数のコンフォメーションのそれぞれとのドッキングをシミュレートすることを含む、項目１に記載の方法。
（項目９）
前記ドッキングスコアを計算するステップが、ドッキングスコアの素性行列を構築することを含み、前記関係を予測するステップが、前記素性行列を機械学習モデルに入力することを含む、項目１に記載の方法。
（項目１０）
前記機械学習モデルが、ランダムフォレストモデルを含む、項目９に記載の方法。
（項目１１）
前記ランダムフォレストが、８．０（１０ｎＭ）のｐＩＣ５０カットオフを有する、項目１０に記載の方法。
（項目１２）
前記ランダムフォレストが第１のランダムフォレストモデルであり、前記機械学習モデルが、第２のランダムフォレストモデルをさらに含む、項目１０に記載の方法。
（項目１３）
前記第１のランダムフォレストモデルが結合のためであり、前記第２のランダムフォレストモデルがアゴニズムのためである、項目１２に記載の方法。
（項目１４）
前記第１のランダムフォレストモデルおよび前記第２のランダムフォレストモデルが、前記第１のランダムフォレストモデルおよび前記第２のランダムフォレストモデルの両方からそれぞれ最終スコアを作成するためにライブラリーリガンドに適用される、項目１３に記載の方法。
（項目１５）
公知の薬理学的性質を持つリガンドのデータベースからのリガンドで前記機械学習モデルを訓練するステップをさらに含む、項目９に記載の方法。
（項目１６）
前記関係を予測するステップが、前記リガンドが前記受容体に対するアゴニストであるか否かを決定することを含む、項目１に記載の方法。
（項目１７）
予測された前記関係に基づいて、１つまたは複数の候補リガンドのセットを同定するステップと、
前記候補リガンドのセットと前記受容体との反応を、物理的に試験するステップと
をさらに含む、項目１に記載の方法。
（項目１８）
前記関係を予測するステップが、
前記リガンドのセットと前記複数のコンフォメーションの各コンフォメーションとに関する関係を予測すること、および
前記リガンドのセットと前記受容体との総計の関係を、前記複数のコンフォメーションに関する予測された前記関係に基づいて予測すること
を含む、項目１に記載の方法。
（項目１９）
リガンドと受容体との間の関係を予測するためのシステムであって、
受容体の複数のコンフォメーションを同定し、
前記複数のコンフォメーションのそれぞれと１つまたは複数のリガンドのセットとに関するドッキングスコアを計算し、かつ
前記１つまたは複数のリガンドのセットと前記受容体の複数のコンフォメーションとの間の関係を予測する
ように個々にまたはまとめて構成された１つまたは複数のプロセッサーを含む、システム。
（項目２０）
前記複数のコンフォメーションが、少なくとも１つの非結晶学的状態を含む、項目１９に記載のシステム。
（項目２１）
前記複数のコンフォメーションを同定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記受容体とリガンドとの相互作用をシミュレートすることからシミュレーションデータを作成するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含む、項目１９に記載のシステム。
（項目２２）
前記複数のコンフォメーションを同定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記複数のコンフォメーションを同定するために前記シミュレーションデータにクラスター演算を行うように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーをさらに含む、項目２１に記載のシステム。
（項目２３）
前記クラスター演算に対して個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、ミニバッチｋ－平均クラスタリング演算である、項目２２に記載のシステム。
（項目２４）
前記複数のコンフォメーションを同定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記シミュレーションデータに対して次元削減演算を行うように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーをさらに含む、項目２１に記載のシステム。
（項目２５）
前記複数のコンフォメーションを同定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記複数のコンフォメーションの各コンフォメーションに関する反応座標のセットを同定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含む、項目１９に記載のシステム。
（項目２６）
前記ドッキングスコアを計算するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記リガンドのセットと前記複数のコンフォメーションのそれぞれとのドッキングをシミュレートするように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含む、項目１９に記載のシステム。
（項目２７）
前記ドッキングスコアを計算するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、ドッキングスコアの素性行列を構築するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含み、前記関係を予測するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記素性行列を機械学習モデルに入力するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含む、項目１９に記載のシステム。
（項目２８）
前記機械学習モデルがランダムフォレストである、項目２７に記載のシステム。
（項目２９）
前記ランダムフォレストが、８．０（１０ｎＭ）のｐＩＣ５０カットオフを有する、項目２８に記載のシステム。
（項目３０）
前記ランダムフォレストが第１のランダムフォレストモデルであり、前記機械学習モデルが、第２のランダムフォレストモデルをさらに含む、項目２８に記載のシステム。
（項目３１）
前記第１のランダムフォレストモデルが結合のためであり、前記第２のランダムフォレストモデルがアゴニズムのためである、項目３０に記載のシステム。
（項目３２）
前記第１のランダムフォレストモデルおよび前記第２のランダムフォレストモデルが、前記第１のランダムフォレストモデルおよび前記第２のランダムフォレストモデルの両方からそれぞれ最終スコアを作成するためにライブラリーリガンドに適用される、項目３１に記載のシステム。
（項目３３）
公知の薬理学的性質を持つリガンドのデータベースからのリガンドで前記機械学習モデルを訓練するように個々にまたはまとめて構成された、前記１つまたは複数のプロセッサーをさらに含む、項目２７に記載のシステム。
（項目３４）
前記関係を予測するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーが、前記リガンドが前記受容体に対するアゴニストであるか否かを決定するように個々にまたはまとめて構成された前記１つまたは複数のプロセッサーを含む、項目１９に記載のシステム。
（項目３５）
予測された前記関係に基づいて、１つまたは複数の候補リガンドのセットを同定し、かつ
前記候補リガンドのセットと前記受容体との反応を物理的に試験する
ように個々にまたはまとめて構成された１つまたは複数のプロセッサーをさらに含む、項目１９に記載のシステム。
（項目３６）
前記関係を予測するステップが、
前記リガンドのセットおよび前記複数のコンフォメーションの各コンフォメーションに関する関係を予測し、かつ
前記複数のコンフォメーションに関して予測された前記関係に基づいて、前記リガンドのセットと前記受容体とに関する総計の関係を予測する
ように個々にまたはまとめて構成された１つまたは複数のプロセッサーを含む、
項目１９に記載のシステム。

【図面の簡単な説明】

【0026】

【図1】図１は、μＯＲの様々な状態の実施例を示す図である。

【0027】

【図2】図２は、μＯＲの自由エネルギーランドスケープの視覚化を示す図である。

【0028】

【図3】図３は、本発明の一部の実施形態による、リガンド発見をもたらすシステムの実施例を示す図である。

【0029】

【図4】図４は、本発明のいくつかの実施形態による、リガンド発見要素の実施例を示す図である。

【0030】

【図5】図５は、本発明の実施形態による、候補リガンドを同定するためのリガンド発見アプリケーションの実施例を示す図である。

【0031】

【図6】図６は、本発明の実施形態による、リガンド発見のためのプロセスのフローチャートを概念的に示す図である。

【0032】

【図7】図７は、本発明の実施形態による、ＭＯＲ－１結合剤のスクリーニングの実施例を示す図である。

【0033】

【図8A】図８Ａ～８Ｄは、ＦＭＰ１～ＦＭＰ３２に関する構造および分子量を示す図である。

【図8B】図８Ａ～８Ｄは、ＦＭＰ１～ＦＭＰ３２に関する構造および分子量を示す図である。

【図8C】図８Ａ～８Ｄは、ＦＭＰ１～ＦＭＰ３２に関する構造および分子量を示す図である。

【図8D】図８Ａ～８Ｄは、ＦＭＰ１～ＦＭＰ３２に関する構造および分子量を示す図である。

【0034】

【図9】図９は、本発明の実施形態による、ＣＨＯ細胞からの膜における、１２５ｌ－ＩＢＮｔｘＡ（０．１ｎＭ）に対するＦＭＰ４による競合研究を示す図である。

【発明を実施するための形態】

【0035】

本発明の、ある特定の実施形態によるシステムおよび方法は、新規なＧタンパク質共役受容体（ＧＰＣＲ）薬の足場を同定する際に、橋渡し研究者を支援することができる。既存の化学変種の誘導体を合成する際の、医薬品化学における大変な努力にも関わらず、現行のＦＤＡ承認オピオイドには重篤な副作用が数多くあり、それが急性および慢性疼痛の処置におけるそれらの有用性を制限する。本発明のいくつかの実施形態による方法は、μオピオイド受容体（μＯＲ）で活性である分子のこれまで未知であった化学空間を探索するのに、機械学習による結晶学および分子モデリングを利用する。実施例の多くはμＯＲを参照しながら記述されるが、当業者なら、本発明のいくつかの実施形態による手法は、その他のタンパク質、酵素、ＧＰＣＲ、キナーゼ、イオンチャネル、および核内受容体を含む任意の種類のコンフォメーション上の柔軟性を有することが予測される任意の受容体に容易に適用できることが、容易に理解されよう。

【0036】

現在公知のオピオイドのかなりの部分が、２つの足場：モルフィンおよびフェンタニルの１種の類似体である。大多数の現在公知のオピオイドは、第３級アミン窒素モチーフを中心としている。誘導体を創出するこの１世紀続いた戦略と離れて、本発明の一部の実施形態によるシステムおよび方法を使用して、μオピオイドの新規の種類を開発するための化学空間の、完全に新しい領域を拓くことができる。一部の実施形態では、本開示は、ＧＰＣＲ、キナーゼ、イオンチャネル、および核内受容体用の新規なリガンドを開発するのに使用することができる、システムおよび方法を提供する。

【0037】

基本的に新しい分子を開発するには、それらを発見するための創造性に富んだ手法が求められる。何十年にもわたり、研究者らは、薬物発見のために３つの主要な方法：構造生物学（例えば、結晶学）、分子シミュレーション（例えば、分子動力学、ドッキング）、および機械学習（例えば、定量的構造活性相関（ＱＳＡＲ）、ランダムフォレストなど）を使用してきた。しかしこれらの方法は、これらの一見したところの直交法を合成できるスキームではなかったので、独立して使用されてきた。一部の実施形態では、新規なプロセスは、薬物設計における本発明者らの予測能力を大幅に改善するために、これらの手法の全てを利用する。このスキームの成功は、より広範に、タンパク質の機能における主要な仮説：タンパク質受容体は、それらの機能的義務における複雑なコンフォメーションランドスケープをサンプル抽出するという仮説を裏付ける。

【0038】

計算化学者は、典型的には、μオピオイド受容体およびＧＰＣＲファミリーのその他のメンバーのような一部の標的が多くの非結晶学的状態をトラバースするという事実にも関わらず、タンパク質の結晶構造に対して化合物を事実上スクリーニングすることにより薬物候補をアッセイする。本発明の一部の実施形態は、分子動力学シミュレーションで、タンパク質、例えばμＯＲの新しいコンフォメーション状態を発見し、次いで機械学習を使用してリガンド構造関係を学習することによりリガンド機能を予測するための方法を提供する。本発明のいくつかの実施形態による方法は、新規な活性リード分子を体系的に発見するために機械学習によるタンパク質のコンフォメーション上の柔軟性を利用する。出発点としてこれらの鋳型を使用する古典的な医薬品化学手法を使用する構造活性研究は、受容体でより高い親和性を持つ化合物をもたらし得る。

【0039】

他のＧＰＣＲのように、μＯＲは２進スイッチではない。むしろ生物物理学実験は、一般にＧＰＣＲが、特にμＯＲが、多種多様なコンフォメーション状態をトラバースすることを示す。μＯＲは、多数の機能的に関連のあるかつ薬理学的に予測可能な状態をサンプル抽出する。この多数の状態は、現行の薬物発見科学者に到達できない。本発明の多くの実施形態によるプロセスは、これらの状態を同定し組み込むために、前例のないミリ秒規模の分子動力学シミュレーションを使用し、共に、活性予測において増大したＡＵＣをもたらしかつ新しい化学足場の発見に力を与える、新規な計算方法を提供する。特にこの実施例では、２つの結晶構造を越えた重要なμＯＲ状態の同定が、受容体でのリガンドの活性を予測する能力を改善することができる。この方法は、受容体に結合し得る目的のその他の分子（または単一分子）に適用可能である。

【0040】

一部の実施形態では、この手法の重要な要素は、受容体のいくつかのコンフォメーションのそれぞれに関する各リガンドの親和性の推定である。リガンド由来の特徴が予測されるだけである、多くの以前の事実上のスクリーニング手法とは対照的に、本発明の一部の実施形態によるプロセスは、各受容体のコンフォメーションに対する所与のリガンドの親和性に基づく。ある特定の実施形態では、これらのコンフォメーションは、単一ＭＤシミュレーションプレステップで得ることができ、受容体の機能性に関する構造基底関数系を範囲とする。対照的に、誘導適合ドッキングは、異なるコンフォメーションをサンプル抽出して、タンパク質に関する単一ドッキング（親和性）スコアを推定する。コンフォメーションサンプル抽出は、空間時間的に制限され、結合ポケットにのみ拡がり、各リガンドごとに繰り返さなければならず、親和性に相関する単一数値を出力することによって、アゴニズムを予測することを本質的に標的としない。

【0041】

目的のタンパク質（この実施例では、μＯＲ）の長時間尺度の分子動力学（ＭＤ）シミュレーションは、リガンドなしでまたはいくつかのリガンドの１つに結合されて、実行される。この実施例では、シミュレーションは、いくつかのアゴニスト：ＢＵ７２、スフェンタニル、ＴＲＶ１３０、およびＩＢＮｔｘＡの１種に結合させて実行した。本発明のいくつかの実施形態によるＭＤシミュレーションは、タンパク質（例えば、μＯＲ）を採用することができる、不均質であるが包括的なコンフォメーションのスペクトルを提供することができる。このデータセットは、受容体のコンフォメーション動力学に焦点を当てた以前の研究にまで拡張する。大きい並列ＭＤデータセット（例えば、前例のない１．１ミリ秒のμＯＲシミュレーションからなる）を体系的に処理するために、いくつかの実施形態による動態学的に動機付けられた機械学習手法であって、（１）最先端の希薄な時間構造独立成分分析（ｔＩＣＡ）アルゴリズムなど（しかしこれらに限定するものではない）の様々な方法を使用して受容体（例えば、μＯＲ）の最も顕著な反応座標（この場合、最も遅い動力学的モード）を同定し、（２）ミニバッチＫ－平均クラスタリングなどの（しかしこれらに限定するものではない）クラスタリング法を使用して個別の受容体状態を定める手法を、適用することができる。一部の実施形態では、（１）は、希薄な時間構造独立成分分析、時間構造独立成分分析、主成分分析（ＰＣＡ）、および／または独立成分分析（ＩＣＡ）を利用してもよい。一部の実施形態では、（２）は、ミニバッチＫ－平均クラスタリング、Ｋ－平均クラスタリング、確率的勾配降下法（ＳＧＤ）Ｋ－平均、ｋ－メドイド、ガウス混合モデリング、ジェンクス自然分類最適化、ファジーＣ－平均クラスタリング、ｋ－平均＋＋、Ｘ－平均クラスタリング、Ｇ－平均クラスタリング、内部クラスター評価、および／またはミンコフスキー重み付きｋ－平均を利用してもよい。

【0042】

一部の実施形態では、候補リガンドの計算シミュレーションが受容体に結合したとき、リガンド（複数可）をドッキングすることができる。一部の実施形態では、結合は、分子が互いに近接している安定な会合をもたらす、２つまたはそれよりも多くの分子間での誘因性相互作用とすることができる。一部の実施形態では、結合は、非共有結合とすることができる。一部の実施形態では、結合は、可逆的共有結合とすることができる。一部の実施形態では、結合は、不可逆的共有結合とすることができる。一部の実施形態では、結合は、化学結合を含むことができる。

【0043】

いくつかの実施形態において、この無監督のステップは、間の中間体ならびに結晶構造とは全く異なる非標準状態の両方からなる、μＯＲの重要なコンフォメーションをカバーしていない。μＯＲの様々な状態の実施例を、図１に例示する。この図は、活性結晶構造（ＰＤＢ：５Ｃ１Ｍ）１０５、ＭＤ状態３１１０、およびＦＭＰ４がＭＤ状態３にドッキングした態勢１１５を示す。ＦＭＰ４は、本発明の数多くの実施形態によるプロセスを経て、μＯＲに対して親和性を有すると同定された分子であり、受容体に対するアゴニストでもある。実線矢印は、結晶構造からのＭＤの変化を表す。破線は、ＦＭＰ４およびμＯＲ結合ポケット残基間の非共有結合相互作用を示す。ＦＭＰ４は、おそらくはその構造に対するその非常に低いドッキングスコアが原因で、活性結晶内で残基Ｍ１５１およびＨ２９７と立体的に衝突し得ることに留意されたい。Ｍ１５１およびＨ２９７の運動は、リガンドの歪みのないコンフォメーションにおいて、好ましい非共有結合リガンド－タンパク質相互作用を可能にする。モルフィナンフェノールとは異なり、ＦＭＰ４のフェニル環は、π－Ｔ芳香族相互作用により重要な活性化残基Ｗ２９３に係合する。

【0044】

μＯＲの状態空間を列挙することにより、受容体のコンフォメーションを問い合わせて、全原子構造情報による合理的設計を促すことができる。避けられない大量のデータがＭＤから生じ、これはシミュレーションのみの膨大なデータセットから実用的知識を誘発させる、著しいデータ科学の難題である。ナノ秒当たり１つのフレームで保存される１ミリ秒のＭＤは、百万のコンフォメーションを含有する可能性があり、専門家の目で見るには膨大過ぎる。むしろ、動態学的に動機付けられた統計的手法を追及することにより、本発明の多くの実施形態による方法は、扱い易い範囲内で受容体の重要なコンフォメーションを発見するのを可能にする。

【0045】

μＯＲの自由エネルギーランドスケープの視覚化を、図２に示す。特に、この実施例では、μＯＲの自由エネルギーランドスケープが、その２つの最も遅い集団的自由度に投影される。ｔＩＣＡ座標１は、活性および不活性（ＰＤＢ：４ＤＫＬ）結晶構造を分離する一方、ｔＩＣＡ座標２は、いくつかの非結晶学的不活性および活性様状態を定める直交自由度である。そのような状態は、受容体に係合するＦＭＰ４の能力に極めて重要な、状態３を含む。

【0046】

最近の研究に照らし、これらの構造は、μＯＲに関する合理的薬物発見キャンペーンを強化するのに直接用いることができる、潜在的にドラッガブルな状態とすることができる。この可能性を実現するために、本発明の一部の実施形態によるプロセスは、監督された機械学習モデルを訓練することにより、２つの二項分類タスク：（１）アゴニストをアンタゴニストと区別する能力、および（２）受容体で非結合剤から結合剤を区別する能力における、著しい改善を実証する。

【0047】

一部の実施形態では、ランダムフォレストが展開されて、構造を機能に接続する。当業者なら、本発明から逸脱することなく、その他の機械学習法（限定するものではないがサポートベクターマシン、決定木、および人工ニューラルネットワークなど）を用いることができることが理解されよう。公知の薬理学的性質を持つリガンド（例えば、オピオイド）のデータベースを、結晶構造ならびに各状態の１つまたは複数の代表的コンフォメーションのセットの両方に、ドッキングすることができる。本発明の様々な実施形態による種々のコンフォメーションは、非結晶学的状態または受容体のその他のコンフォメーションを含むことができる。本発明のある特定の実施形態によるコンフォメーションは、実験（結晶学、核磁気共鳴（ＮＭＲ）、低温電子顕微鏡法（ｃｒｙｏＥＭ）などであるがこれらに限定されない）を含む（しかしこれらに限定されない）様々な方法を経て、かつ／または計算（分子動力学シミュレーション、モンテカルロシミュレーション、ディープニューラルネットワーク推進型コンフォメーション発生などであるがこれらに限定されない）を経て、同定することができる。

【0048】

次いである特定の実施形態では、各ＭＤコンフォメーションに対する各リガンドのドッキングスコアを、目的の受容体でのアゴニズムおよび結合の両方に関する二項分類モデルへの入力または素性行列として使用することができる。いくつかの実施形態では、素性行列は、各行がリガンドであり各列がフィーチャであるような（ＭＤ状態のそれぞれに対するおよび各結晶構造に対するドッキングスコア）構造である。様々な実施形態では、素性行列における入力（ｉ，ｊ）は、ｊ番目のコンフォメーション状態に対するｉ番目のリガンドの、ドッキングスコアである。ドッキングスコアは、互いに対する順位を決定するのに、即ちリガンドのセットに関して順位を決定するのに利用されてもよい。ドッキングスコアは、分子の結合親和性を、全体としてのタンパク質にまたはそのタンパク質の所与の状態に相関させることができる。行列は、全親和性のより良い予測子／相関である単一数値を発生させるため、ドッキングスコアでの種々の機能に関して使用することができる。一部の実施形態では、Ｎリガンドに関する結合親和性またはアゴニズムの先験的情報が、Ｋコンフォメーション状態のそれぞれに対してＮリガンドのそれぞれに関するドッキングスコアにより得られ、Ｋドッキングスコアのセットを結合親和性にマップする機能が得られる。

【0049】

結晶学およびＭＤの両方からの構造情報の、この二重に無監督のおよび監督されたＭＬベースの合成は、両方のタスクの統計的に有意な強化をもたらす。一実施例では、本発明の一部の実施形態による方法は－結晶構造に加えてＭＤ状態へのドッキングを組み込む－、結晶構造のみと比較してアゴニズムおよび結合におけるメジアン曲線下面積（ＡＵＣ）の改善を達成した。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて約０．１１である。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて０．０１から０．５である。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて０．５から１．０である。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて０．１から０．３である。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて０．３から０．６である。一部の実施形態では、メジアンＡＵＣの改善は、アゴニズムにおいて０．６から０．９である。一部の実施形態では、メジアンＡＵＣの改善は、結合において約０．１５である。一部の実施形態では、メジアンＡＵＣの改善は、結合において０．０１から０．５である。一部の実施形態において、メジアンＡＵＣの改善は、結合において０．５から１．０である。一部の実施形態において、メジアンＡＵＣの改善は、結合において０．１から０．３である。一部の実施形態において、メジアンＡＵＣの改善は、結合において０．３から０．６である。一部の実施形態において、メジアンＡＵＣの改善は、結合において０．６から０．９である。

【0050】

アゴニズムに対する堅牢性のさらなる試験として、足場スプリットを用いた。特に、一連のモデルを訓練し、メタドンまたはフェンタニルのいずれかの類似体を訓練データから取り出し、ヘルドアウト試験セットにおいた。言い換えれば、これらのモデルは、メタドン（または代替としてフェンタニル）類似体のいかなる先験的知識も持たなかった。それにも関わらず、モデルは、メタドンおよびフェンタニル由来のアゴニストを、アンタゴニストのランダムセットから首尾良く区別した。類似の足場スプリットを、結合予測タスクのために定義し、ＡＵＣに同等の増加をもたらした。したがって、本発明の多くの実施形態による方法はリガンドの化学構成を明示的に組み込まないので、それらは既存のものの誘導体に加えて新しいオピオイド活性足場を発見するために、より良好に準備することができる。これらの結果に基づいて、本発明のいくつかの実施形態によるオピオイドの予測は、結晶学のみでは予測できないコンフォメーション状態を組み込むことによって強化され、シミュレーションでリガンドにより安定化される。

【0051】

（リガンドモデリングおよび予測のためのシステムおよび方法）
本発明の一部の実施形態によるモデリングおよび予測を提供するシステムを、図３に示す。ネットワーク３００は、通信ネットワーク３６０を含む。通信ネットワーク３６０は、ネットワーク３６０に接続されたデバイスをその他の接続されたデバイスと通信可能にする、インターネットなどのネットワークである。サーバーシステム３１０、３４０、および３７０はネットワーク３６０に接続される。サーバーシステム３１０、３４０、および３７０のそれぞれは、ネットワーク３６０上でユーザーにクラウドサービスを提供するプロセスを実行する内部ネットワークを介して、互いに通信可能に接続された１つまたは複数のサーバーコンピュータシステムのグループである。この考察の目的で、クラウドサービスは、ネットワーク上でデバイスにデータおよび／または実行可能なアプリケーションを提供するために１つまたは複数のサーバーシステムによって実行される１つまたは複数のアプリケーションである。サーバーシステム３１０、３４０、および３７０は、各々内部ネットワークを介して接続された３つのサーバーを有して示される。しかしサーバーシステム３１０、３４０、および３７０は、任意の数のサーバーを含んでいてもよく、任意の追加の数のサーバーシステムがネットワーク３６０に接続されて、限定するものではないが仮想化サーバーシステムを含むクラウドサービスを提供してもよい。本発明の様々な実施形態によれば、リガンド特性をモデリングし予測するためのプロセスは、ネットワーク３６０経由で通信する単一サーバーシステムおよび／または一群のサーバーシステム上で実行される１つまたは複数のソフトウェアアプリケーションによって提供される。

【0052】

ユーザーは、本発明の様々な実施形態によるリガンド特性をモデリングし予測するプロセスを行うため、ネットワーク３６０に接続されるパーソナルデバイス３８０および３２０を使用してもよい。例示される実施形態では、パーソナルデバイス３８０が、従来の「有線」接続を介してネットワーク３６０に接続されたデスクトップコンピュータとして示されている。しかし、パーソナルデバイス３８０は、デスクトップコンピュータ、ラップトップコンピュータ、スマートテレビ、エンターテイメントゲームコンソール、または「有線」または「無線」ネットワーク接続を介してネットワーク３６０に接続する任意のその他のデバイスであってもよい。モバイルデバイス３２０は、無線接続を使用してネットワーク３６０に接続する。無線接続は、ネットワーク３６０に接続するのにラジオ周波数（ＲＦ）信号、赤外線信号、または任意のその他の形の無線信号伝達を使用する接続である。図３で、モバイルデバイス３２０は携帯電話である。しかしモバイルデバイス３２０は、携帯電話、携帯情報端末（ＰＤＡ）、タブレット、スマートフォン、仮想現実ヘッドセット、拡張現実ヘッドセット、複合現実ヘッドセット、または本発明から逸脱することなく無線接続を介してネットワーク３６０に接続する任意のその他のタイプのデバイスであってもよい。本発明の一部の実施形態によれば、リガンド特性をモデリングし予測するためのプロセスは、ユーザーデバイスによって行われる。

【0053】

容易に理解できるように、リガンド特性をモデリングし予測するのに使用される特定の計算システムは、所与の適用の要件に大きく依存し、任意の特定の計算システム（複数可）の実装に限定されると見なすべきではない。

【0054】

本発明のいくつかの実施形態によるリガンド発見要素を、図４に示す。本発明の多くの実施形態によるリガンド発見要素は、モバイルデバイス、コンピュータ、サーバー、およびクラウドサービスの１つまたは複数を含むことができる（しかしこれらに限定されない）。リガンド発見要素４００は、プロセッサー４１０、通信インターフェース４２０、およびメモリ４３０を含む。

【0055】

当業者なら、特定のリガンド発見要素が、本発明から逸脱することなく簡略化のために省略されるその他の構成要素を含み得ることが理解されよう。プロセッサー４１０は、プロセッサー、マイクロプロセッサー、コントローラー、あるいはプロセッサー、マイクロプロセッサー、および／またはコントローラーの組合せであって、メモリ４３０に保存されたデータを操作するためメモリ４３０に保存された命令を実行するものを含むことができる（しかしこれらに限定するものではない）。プロセッサーの命令は、本発明のある特定の実施形態によるプロセスを行うように、プロセッサー４１０を構成することができる。通信インターフェース４２０は、プロセッサー４１０により実行される命令に基づいてネットワーク上でデータを送信し受信するように要素４００を訓練することが可能である。

【0056】

メモリ４３０は、リガンド発見アプリケーション４３２、受容体データ４３４、リガンドデータ４３６、およびモデルデータ４３８を含む。本発明のいくつかの実施形態によるリガンド発見アプリケーションは、受容体との相互作用に関して試験することができる、リガンドを分析し候補リガンドを同定するのに使用される。一部の実施形態では、リガンド発見アプリケーションは、分子ドッキングシミュレーションおよび／または公知の薬理学的性質を備えるオピオイドのデータベースを含む（しかしこれらに限定されない）様々なソースから作成されたデータを含む、受容体データおよび／またはリガンドデータを使用することができる。本発明の様々な実施形態によるモデルデータ４３８は、個別のコンフォメーション状態を同定するためのクラスタリング、アゴニスト／アンタゴニストとしてのリガンドの分類、および／または結合／非結合としてのリガンドの分類など（しかしこれらに限定されない）、様々な目的で使用することができる無監督および監督モデル用のデータを含むことができる。

【0057】

リガンド発見要素４００の特定の実施例が図４に示されるが、様々な訓練要素のいずれかを利用して、本発明の実施形態による特定の適用の要件に対して適切に、本明細書に記述されるものに類似したプロセスを行うことができる。

【0058】

本発明の実施形態による候補リガンドを同定するためのリガンド発見アプリケーションを、図５に示す。リガンド発見アプリケーション５００は、シミュレーションエンジン５０５、クラスタリングエンジン５１０、スコアリングエンジン５１５、および分類エンジン５２０を含む。本発明の多くの実施形態によるリガンド発見アプリケーションは、リガンドおよび受容体データを分析して、受容体に関係する様々な用途での候補リガンドを同定することができる。

【0059】

様々な実施形態において、シミュレーションエンジンは、様々な受容体コンフォメーションをシミュレートするのに使用することができる。多くの実施形態では、シミュレーションエンジンは、リガンドと受容体との間のドッキングスコアを計算することができる。

【0060】

本発明の数多くの実施形態によるクラスタリングエンジンは、シミュレートされたデータに基づいて、個別の受容体コンフォメーション状態を同定することができる。いくつかの実施形態では、クラスタリングエンジンは、ミニバッチｋ－平均クラスタリングおよび凝集型階層クラスタリングなどの（しかしこれらに限定されないクラスタリングプロセスを使用する。

【0061】

本発明の様々な実施形態によるスコアリングエンジンは、受容体に対するリガンドに関してドッキングスコアを計算することができる。数多くの実施形態において、スコアリングエンジンは、シミュレーションエンジンからのリガンドおよび受容体のシミュレーションを評価することができる。シミュレーションは、クラスタリングエンジンによって同定された受容体のいくつかの個別のコンフォメーションを持つリガンドのシミュレーションを含むことができる。いくつかの実施形態において、スコアリングエンジンは、リガンドのセットおよび受容体のコンフォメーション状態のセットに関してドッキングスコアの素性行列を生成することができる。

【0062】

様々な実施形態では、分類エンジンを使用して、リガンドと受容体との間の相互作用を分類しまたは予測することができる。一部の実施形態では、分類エンジンは、サポートベクターマシン、線形回帰、ロジスティック回帰、単純ベイズ、線形判別分析、決定木、ｋ－近傍アルゴリズム、ニューラルネットワーク、および／または類似性学習などの（しかしこれらに限定されない）、監督学習アルゴリズムまたは無監督学習アルゴリズムとすることができる。一部の実施形態では、監督型学習は、半監督型学習、アクティブラーニング、構造予測、および／またはランク学習とすることができる。本発明の一部の実施形態による分類エンジンは、完全接続ニューラルネットワーク（ＦＣＮＮ）および／またはランダムフォレストなど（しかしこれらに限定されない）の分類子を実装することができる。様々な実施形態では、分類エンジンは、スコアリングエンジンによって作成された素性行列を入力として得、リガンドが受容体と特定の関係（例えば、結合／非結合、アゴニスト／アンタゴニストなど）を有する尤度を出力する。一部の実施形態では、ドッキングスコアは、下記の方程式：
Ｐ（結合剤∩アゴニスト｜モデル）＝Ｐ（結合剤｜モデル_ｂ）・Ｐ（アゴニスト｜モデル_ａ）
による、２つの発生した最終スコアの積から計算される。

【0063】

リガンド発見アプリケーションの特定の実施例を図５に示すが、様々なリガンド発見アプリケーションのいずれかを利用して、本発明の実施形態による特定の適用の要件に適切な本明細書に記述されるものに類似のプロセスを行うことができる。

【0064】

本発明の実施形態によるリガンド発見のためのプロセスのフローチャートを、図６に示す。プロセス６００は、受容体の複数のコンフォメーションを同定する（６０５）。多くの実施形態で、種々のコンフォメーション（または状態）は、受容体の長期時間尺度の分子ドッキング（ＭＤ）シミュレーションに基づく。本発明のいくつかの実施形態によるシミュレーションは、受容体だけでまたは受容体と公知のリガンドとの相互作用に基づいて、行うことができる。いくつかの実施形態では、種々のコンフォメーションは、ＭＤシミュレーションによって作成された状態データでクラスターを同定する、クラスタリングプロセスに基づいて同定される。本発明の様々な実施形態によるクラスタリングは、ミニバッチＫ－平均クラスタリングおよび凝集型階層クラスタリングを含む（しかしこれらに限定されない）様々な手法で行うことができる。本発明のいくつかの実施形態による種々の個別のコンフォメーションは、結晶状態、結晶状態間の中間体、ならびに結晶構造とは別の標準状態を含む（しかしこれらに限定されない）、受容体の様々な状態を表すことができる。

【0065】

プロセス６００は、１つまたは複数のリガンドのセットおよび同定されたコンフォメーションの各コンフォメーションに関するドッキングスコアを計算する（６１０）。いくつかの実施形態では、ドッキングスコアは、リガンドのセットと受容体の各コンフォメーションとの間の相互作用をシミュレートすることができる分子ドッキングシミュレーションを使用して、計算することができる。本発明の数多くの実施形態による計算されたドッキングスコアは、各リガンドコンフォメーションの組合せに関するドッキングスコアを持つ素性行列で提供することができる。

【0066】

プロセス６００は、リガンドのセットと受容体との間の相互作用を予測する（６１５）。多くの実施形態において、予測される相互作用は、リガンドのセットが受容体と結合するか否かを含むことができる。あるいは、または共同して、予測される相互作用は、リガンドのセットが、受容体に対するアゴニストであるか否かを含むことができる。本発明の多くの実施形態による相互作用の予測は、結合剤としてまたは特定の受容体に対するアゴニストとしてリガンドを分類するよう訓練されたランダムフォレストを使用して行うことができる。ある特定の実施形態では、リガンドと受容体との間の相互作用の予測は、リガンドと受容体の各コンフォメーションとの間の相互作用を予測し、次いで全体としてリガンドと受容体との間の相互作用に関する包括的予測を計算することを含む。様々な実施形態では、予測された相互作用を使用して、１つまたは複数のリガンドのセットを同定し、同定されたリガンドと受容体との相互作用を物理的に試験する。

【0067】

態様において、本開示は、リガンドと受容体との間の関係を予測するための方法であって、受容体の複数のコンフォメーションを同定するステップと、複数のコンフォメーションのそれぞれと１つまたは複数のリガンドのセットとに関するドッキングスコアを計算するステップと、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係を予測するステップとを含む方法を提供する。

【0068】

一部の実施形態では、複数のコンフォメーションは、単一受容体のコンフォメーションを含む。一部の実施形態では、コンフォメーションは、実験（結晶学、ＮＭＲ、ＣｒｙｏＥＭなど）または計算（分子動力学シミュレーション、モンテカルロシミュレーション、ディープニューラルネットワーク推進型コンフォメーション発生、またはこれらの組合せから生ずることができる。

【0069】

一部の実施形態では、複数のコンフォメーションは、少なくとも１つの非結晶学的状態を含む。

【0070】

様々な実施形態では、複数のコンフォメーションを同定するステップは、受容体とリガンドとの相互作用をシミュレートすることからシミュレーションデータを作成することを含む。

【0071】

いくつかの実施形態では、複数のコンフォメーションを同定するステップは、シミュレーションデータに対してクラスタリング演算を行って複数のコンフォメーションを同定することをさらに含む。

【0072】

いくつかの実施形態では、複数のコンフォメーションを同定するステップは、シミュレーションデータに対して次元削減演算を行うことをさらに含む。本発明の数多くの実施形態による次元削減演算は、ｔＩＣＡ、希薄ｔＩＣＡ、ＩＣＡ、ＰＣＡ、ｔ－ＳＮＥ、およびその他またはこれらの組合せを含むことができる（しかしこれらに限定されない）。

【0073】

様々な実施形態では、複数のコンフォメーションを同定するステップは、複数のコンフォメーションの各コンフォメーションに関する反応座標のセットを同定することを含む。

【0074】

数多くの実施形態では、ドッキングスコアを計算するステップは、リガンドのセットと複数のコンフォメーションのそれぞれとのドッキングをシミュレートすることを含む。

【0075】

いくつかの実施形態では、ドッキングスコアを計算するステップは、ドッキングスコアの素性行列を構築することを含み、関係を予測するステップは、素性行列を機械学習モデルに入力することを含む。一部の実施形態では、機械学習モデルがランダムフォレストである。

【0076】

数多くの実施形態では、公知の薬理学的性質を持つリガンドのデータベースからのリガンドにより機械学習モデルをさらに訓練する。一部の実施形態では、分子をオピオイドとすることができる。

【0077】

次に、関係を予測するステップは、リガンドが受容体に対するアゴニストであるか否かを決定することを含む。

【0078】

次に、予測された関係に基づいて、１つまたは複数の候補リガンドのセットを同定し、候補リガンドのセットと受容体との反応を物理的に試験する。

【0079】

次に、関係を予測するステップは、リガンドのセットと複数のコンフォメーションの各コンフォメーションとの関係を予測すること、およびリガンドのセットと受容体との総計の関係を、複数のコンフォメーションに関する予測された関係に基づいて予測することを含む。

【0080】

一部の実施形態では、ランダムフォレストモデルが８．０（１０ｎＭ）のｐＩＣ５０カットオフを有する。様々な実施形態では、関係を予測するステップは、ＩＣ５０、ＥＣ５０、および／またはＫｉなどの（しかしこれらに限定されない）、親和性またはアゴニズムの定量的測定基準（ｑｕａｎｔｉｔａｔｉｖｅｍｅｔｒｉｃ）を予測することを含む。あるいは、または共同的に、本発明の多くの実施形態により関係を予測するステップは、結合剤対非結合剤などの（しかしこれらに限定されない）関係を分類することを含むことができる。いくつかの実施形態では、関係を分類することは、一部のカットオフまたは閾値、例えば８．０（１０ｎＭ）のｐＩＣ５０に基づくことができる。

【0081】

次に、第１のランダムフォレストモデルおよび第２のランダムフォレストモデルをさらに含み、両方のモデルは訓練される。

【0082】

次に、第１のランダムフォレストモデルは結合のためのものであり、第２のランダムフォレストモデルはアゴニズムのためのものである。

【0083】

次に、第１のランダムフォレストモデルおよび第２のランダムフォレストモデルは、第１のランダムフォレストモデルおよび第２のランダムフォレストモデルの両方からそれぞれ最終スコアを発生させるために、ライブラリーリガンドに適用される。

【0084】

別の態様では、本開示は、リガンドと受容体との間の関係を予測するためのシステムであって、このシステムは、受容体の複数のコンフォメーションを同定し、複数のコンフォメーションのそれぞれおよび１つまたは複数のリガンドのセットに関するドッキングスコアを計算し、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係を予測するように個々にまたはまとめて構成された１つまたは複数のプロセッサーを含む、システムを提供する。

【0085】

別の態様では、本開示は、薬物発見のための方法およびシステムを提供する。方法は、機械学習で予測された分子特性から候補リガンドを同定することを含んでいてもよい。一部の実施形態では、候補リガンドを同定することは、受容体の複数のコンフォメーションを選択すること、複数のコンフォメーションのそれぞれおよび１つまたは複数のリガンドのセットに関するドッキングスコアを計算すること、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係を算出すること、および１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係から候補リガンドを予測することを含む。一部の実施形態では、候補リガンドを同定するシステムは、受容体の複数のコンフォメーションを選択し、複数のコンフォメーションのそれぞれおよび１つまたは複数のリガンドのセットに関するドッキングスコアを計算し、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係を算出し、１つまたは複数のリガンドのセットと受容体の複数のコンフォメーションとの間の関係から候補リガンドを予測するように個々にまたはまとめて構成された１つまたは複数のプロセッサーを含む。

【0086】

本発明の実施形態によるリガンド発見の特定のプロセスは上記にて記述され、しかし当業者なら、本発明の実施形態による特定の適用の要件に適切な、任意の数のプロセスを利用できることが理解されよう。

【0087】

本発明について、ある特定の態様において記述してきたが、多くの追加の修正例および変形例が当業者に明らかにされよう。したがって本発明は、本発明の範囲および精神から逸脱することなく、特に記述されたもの以外の手法で実施され得ることを理解されたい。このように、本発明の実施形態は、全ての観点で、例示的なものでありかつ制限的ではないものとして見なされるべきである。

【実施例】

【0088】

下記の実施例は、特許請求の範囲に記載された本発明を例示するために提供されるが、それらに限定するものではない。

【0089】

（実施例１）
下記の実施例は、特許請求の範囲に記載された本発明を例示するために提供されるが、それらに限定するものではない。

【表1-1】

【表1-2】

【表1-3】

【表1-4】

【0090】

（実施例２）
足場スプリット（ｓｃａｆｆｏｌｄｓｐｌｉｔ）が定義され、（１）フェンタニルと比較して≦０．５であるタニモトスコアを持つアゴニストリガンドを訓練セットに置き、（２）フェンタニルと比較して≧０．７であるタニモトスコアを持つアゴニストリガンドを試験セットに置き、（３）アンタゴニストを、訓練および試験セットの間でランダムに分布させた。
ａ）
フェンタニル類似体リガンド（試験セット）：
［‘アセチルフェンタニル’、‘アクリルフェンタニル’、‘３－アリルフェンタニル’、‘アルファメチルチオフェンタニル’、‘アザプロシン’、‘ベータヒドロキシフェンタニル’、‘ベータヒドロキシチオフェンタニル’、‘ブチルフェンタニル’、‘カルフェンタニル’、‘デスメチルプロジン’、‘ジアムプロミド’、‘フェンタニル’、‘４－フルオロブチルフェンタニル’、‘フラニルフェンタニル’、‘ロフェンタニル’、‘４－メトキシブチルフェンタニル’、‘アルファ－メチルアセチルフェンタニル’、‘３－メチルブチルフェンタニル’、‘ｎ－メチルカルフェンタニル’、‘３－メチルフェンタニル’、‘ベータ－メチルフェンタニル’、‘３－メチルチオフェンタニル’、‘オクフェンタニル’、‘オーメフェンタニル’、‘パラフルオロフェンタニル’、‘ｐｅｐａｐ’、‘フェナムプロミド’、‘フェナリジン’、‘４－フェニルフェンタニル’、‘プロジリジン’、‘プロジン’、‘プロヘプタジン’、‘プロシドール’、‘ｒ－３０４９０’、‘レミフェンタニル’、‘スフェンタニル’、‘チオフェンタニル’、‘トリメペリジン’、‘ｕ－４７７００’］
非フェンタニル－類似体アゴニスト（訓練セット）：
［‘７－ｐｅｔ’、‘アリマドール’、‘アルファメタドール’、‘アジドモルフィン’、‘ｂｄｐｃ’、‘ベータメタドール’、‘ｃ－８８１３’、‘セブラノパドール’、‘クロロモルフィデ’、‘クロロキシモルファミン’、‘シプレファドール’、‘クロニタゼン’、‘ｄａｄｌｅ’、‘ｄａｍｇｏ’、‘デソモルフィン’、‘ジヒドロエトルフィン’、‘ジヒドロモルフィン’、‘ジメノキサドール’、‘ジメフェプタノール’、‘ジメチルアミノピバロフェノン’、‘エルキサドリン’、‘エンドモルフィン’、‘エンドモルフィン－１’、‘１４－エトキシメトポン’、‘エトニタゼン’、‘エトルフィン’、‘ヘモルフィン－４’、‘ヘテロコデイン’、‘ヒドロモルフィノール’、‘ヒドロモルフォン’、‘ｉｂｎｔｘａ’、‘ケタミン’、‘レフェタミン’、‘レボフェナシルモルファン’、‘レボルファノール’、‘１４－メトキシジヒドロモルフィノン’、‘１４－メトキシメトポン’、‘メチルデソルフィン’、‘メチルジヒドロモルフィン’、‘６－メチレンジヒドロデソキシモルフィン’、‘メトポン’、‘ミトラギニン＿シュードインドキシル’、‘６－モノアセチルモルフィン’、‘モルフィン’、‘モルフィン－６－グルクロニド’、‘モルフィノン’、‘ｍｒ－２０９６’、‘オリセリジン’、‘オキシモルファゾン’、‘オキシモルフォール’、‘オキシモルフォン’、‘ペンタモルフォン’、‘フェナゾシン’、‘ｎ－フェネチルノルデソモルフィン’、‘ｎ－フェネチルノルモルフィン’、‘フェノモルファン’、‘１４－フェニルプロポキシメトポン’、‘ピセナドール’、‘ｐｚｍ２１’、‘ラセモルファン’、‘ｒｏ４－１５３９’、‘ｓｃ－１７５９９’、‘セモルフォン’、‘チエノルフィン’、‘チリジン’、‘ｔｒｉｍｕ＿５’、‘ビミノール’］
アンタゴニスト：
［‘レバロルファン’、‘６ベータ－ナルトレキソール－ｄ４’、‘ベータ－クロルナルトレキサミン’、‘ベータ－フナルトレキサミン’、‘アルビモパン’、‘ａｔ－０７６’、‘アキセロプラン’、‘ベヴェノプラン’、‘クロシンナモックス’、‘シクロフォキシ’、‘シプロジム’、‘エプタゾシン’、‘ｌｙ－２５５５８２’、‘メトシンナモックス’、‘メチルナルトレキソン’、‘メチルサミドルファン’、‘ナルメフェン’、‘ナロキサゾン’、‘ナロキセゴール’、‘ナロキソール’、‘ナロキソナジン’、‘ナロキソン’、‘ナルトレキサゾン（ｎａｌｔｒｅｘａｚｏｎｅ）’、‘ナルトレキソン’、‘オキシロルファン’、‘クウァダゾシン（ｑｕａｄａｚｏｃｉｎｅ）’、‘サミドルファン’］

【0091】

足場スプリットが定義され、（１）メタドンと比較して≦０．５であるタニモトスコアを持つアゴニストリガンドを訓練セットに置き、（２）メタドンと比較して≧０．７であるタニモトスコアを持つアゴニストリガンドを試験セットに置き、（３）アンタゴニストを、訓練および試験セットの間でランダムに分布させた。
ｂ）
メタドン類似体リガンド（試験セット）。
［‘アセチルメタドール’、‘アルファセチルメタドール’、‘アルファメタドール’、‘ベータセチルメタドール’、‘ベータメタドール’、‘ジピパノン’、‘ｉｃ－２６’、‘イソメタドン’、‘ケトベミドン’、‘レバセチルメタドール’、‘レボメタドン’、‘メタドン’、‘メチルケトベミドン’、‘ノルアシメタドール’、‘フェナドキソン’、‘プロピルケトベミドン’、‘ｒ４０６６’］
非メタドン類似体（訓練セット）。
［‘７－ｐｅｔ’、‘アリマドール’、‘アジドモルフィン’、‘ｂｄｐｃ’、‘ｃ－８８１３’、‘セブラノパドール’、‘クロロモルフィデ’、‘クロロキシモルファミン’、‘シプレファドール’、‘クロニタゼン’、‘ｄａｄｌｅ’、‘ｄａｍｇｏ’、‘デソモルフィン’、‘ジヒドロエトルフィン’、‘ジヒドロモルフィン’、‘ジメノキサドール’、‘ジメフェプタノール’、‘ジメチルアミノピバロフェノン’、‘エルキサドリン’、‘エンドモルフィン’、‘エンドモルフィン－１’、‘１４－エトキシメトポン’、‘エトニタゼン’、‘エトルフィン’、‘ヘモルフィン－４’、‘ヘテロコデイン’、‘ヒドロモルフィノール’、‘ヒドロモルフォン’、‘ｉｂｎｔｘａ’、‘ケタミン’、‘レフェタミン’、‘レボフェナシルモルファン’、‘レボルファノール’、‘１４－メトキシジヒドロモルフィノン’、‘１４－メトキシメトポン’、‘メチルデソルフィン’、‘メチルジヒドロモルフィン’、‘６－メチレンジヒドロデソキシモルフィン’、‘メトポン’、‘ミトラギニン＿シュードインドキシル’、‘６－モノアセチルモルフィン’、‘モルフィン’、‘モルフィン－６－グルクロニド’、‘モルフィノン’、‘ｍｒ－２０９６’、‘オリセリジン’、‘オキシモルファゾン’、‘オキシモルフォール’、‘オキシモルフォン’、‘ペンタモルフォン’、‘フェナゾシン’、‘ｎ－フェネチルノルデソモルフィン’、‘ｎ－フェネチルノルモルフィン’、‘フェノモルファン’、‘１４－フェニルプロポキシメトポン’、‘ピセナドール’、‘ｐｚｍ２１’、‘ラセモルファン’、‘ｒｏ４－１５３９’、‘ｓｃ－１７５９９’、‘セモルフォン’、‘チエノルフィン’、‘チリジン’、‘ｔｒｉｍｕ＿５’、‘ビミノール’］
アンタゴニスト：
［‘レバロルファン’、‘６ベータ－ナルトレキソール－ｄ４’、‘ベータ－クロルナルトレキサミン’、‘ベータ－フナルトレキサミン’、‘アルビモパン’、‘ａｔ－０７６’、‘アキセロプラン’、‘ベヴェノプラン’、‘クロシンナモックス’、‘シクロフォキシ’、‘シプロジム’、‘エプタゾシン’、‘ｌｙ－２５５５８２’、‘メトシンナモックス’、‘メチルナルトレキソン’、‘メチルサミドルファン’、‘ナルメフェン’、‘ナロキサゾン’、‘ナロキセゴール’、‘ナロキソール’、‘ナロキソナジン’、‘ナロキソン’、‘ナルトレキサゾン’、‘ナルトレキソン’、‘オキシロルファン’、‘クウァダゾシン’、‘サミドルファン’］

【0092】

（実施例３）
ａ）オピオイドアゴニストおよびアンタゴニストの間を区別し、ｂ）μＯＲからの結合剤および非結合剤の間を区別するための、各フィーチャ（ＭＤ状態、結晶構造）のランダムフォレスト平均Ｇｉｎｉ不純度低減（「重要性」）。

【0093】

ａ）

【表2-1】

【表2-2】

【0094】

ｂ）

【表3-1】

【表3-2】

【0095】

（実施例４）
ＭＤ状態および結晶構造の両方とのドッキングは、非結合剤からμＯＲ結合剤を区別する能力を、結晶単独よりも統計的に有意に改善する。以下の表は、種々のスプリットおよびモデルタイプに関する１，０００の訓練－検証スプリット（ｔｒａｉｎ－ｖａｌｉｄｓｐｌｉｔ）上での検証セットでのメジアンＲＯＣ曲線下面積（ＡＵＣ）性能を示す。結晶単独と結晶＋ＭＤ構造法との間の差は、９９％ウィルソンスコアリング信頼区間（ＣＩ）の下限が０．５よりも大きい場合、統計的に有意と見なされる。各データセットごとに、結晶構造に加えてＭＤ由来構造を組み込むことで、ＡＵＣにより測定したときに非結合剤から結合剤を区別する能力に、統計的に有意な改善が提供されることに留意されたい。特に、フェンタニル（またはメタドン）類似体が訓練セットから取り出された場合、モデルは、アンタゴニストのランダムセットからフェンタニル（またはメタドン）誘導体アゴニストを依然として区別できる。このことは、このように適合されたモデルが、既存のものの誘導体に加えて新しいオピオイドアゴニスト足場を発見する能力を有することを示す。

【表4】

【0096】

（実施例５）
ＭＤ状態および結晶構造の両方とのドッキングは、非結合剤からμＯＲ結合剤を区別する能力を、結晶単独よりも統計的に有意に改善する。以下の表は、種々のスプリットおよびモデルタイプに関する１，０００の訓練－検証スプリット上での検証セットでのメジアンＲＯＣ曲線下面積（ＡＵＣ）性能を示す。結晶単独と結晶＋ＭＤ構造法との間の差は、９９％ウィルソンスコアリング信頼区間（ＣＩ）の下限が０．５よりも大きい場合、統計的に有意と見なされる。各データセットごとに、結晶構造に加えてＭＤ由来構造を組み込むことで、ＡＵＣにより測定したときに非結合剤から結合剤を区別する能力に、統計的に有意な改善が提供されることに留意されたい。特に、類似の足場を持つ（＞０．７のタニモト類似性スコアにより測定したとき）分子が訓練データから取り出された場合、モデルは、非結合剤から結合剤を依然として区別できる。このことは、このように適合されたモデルが、既存のものの誘導体に加えて新しいオピオイド足場を発見する能力を有することを示す。

【0097】

データセットは、μＯＲに対する結合親和性の、実験的に公知の値を持つ、化合物からなる。「測定されたＫｉ（ＭｅａｓｕｒｅｄＫｉ）」と称されるデータセットは、実際に番号が付されたＫｉ値を持つような化合物のみを含み；「全（Ａｌｌ）」と称されるデータセットは、列挙されたＫｉを持たずに「非活性（ＮｏｔＡｃｔｉｖｅ）」と称される化合物も含む。したがって、「測定されたＫｉ」データセットは、データセットの「全」シリーズのサブセットである。結合剤は、いくらかのカットオフ（「データセット」表に列挙される）よりも大きいｐＩＣ５０を持つ化合物であり、非結合剤は、同じカットオフの場合よりも低いｐＩＣ５０を持つ化合物と見なされる。例えば、「全、ｐＩＣ５０カットオフ＝７．０」は、（ａ）測定可能なｐＩＣ５０＜７．０を有するリガンド、および「不活性（ＮｏｔＡｃｔｉｖｅ）」として列挙されるものの両方が、非結合剤と見なされ、（ｂ）測定可能なｐＩＣ５０約７．０を有するリガンド、ならびにその他の公知のアゴニストおよびアンタゴニストの両方が結合剤と見なされる、データセットを示す。

【表5-1】

【表5-2】

【0098】

（実施例６）
いくつかの新規なオピオイド－活性リガンド、ＦＭＰ４の同定

【0099】

本明細書に含まれる方法は、新規なリガンド、ＦＭＰ４を同定した。特にＦＭＰ４は、塩基性第３級アミンまたはフェノールを持たない点で、合成オピオイドの顕著な特徴に欠ける。

【0100】

１３３，５６４の小分子の群を、結晶構造およびμＯＲの計算的にモデリングされたコンフォーマーの両方にドッキングして、１３３，５６４行×２７列の素性行列を得、この行列では入力（ｉ，ｊ）が、ｊ番目のコンフォメーション状態に対するｉ番目のリガンドのドッキングスコアである。結合およびアゴニズムに関する２つの訓練されたランダムフォレストモデルを各ライブラリーリガンドに適用し、２つの値の積から計算された最終スコアを得た。

【数1】

【0101】

ヒットのモデル性能および足場は、２進分類子用に選択されたｐＩＣ５０カットオフの対して高い感受性がある。結合に関してより低い親和性閾値を持つモデルは、より高いＡＵＣを一般に有するが、上位のヒットは、公知の足場と同様に、第３級の塩基性窒素を持つ化合物に向かってバイアスを有することが示されてきた。８．０（１０ｎＭ）のｐＩＣ５０カットオフを持つランダムフォレストモデルは、新規な足場発見のために最適化するのに使用される。一部の実施形態では、ｐＩＣ５０は、少なくとも３．０、４．０、５．０、６．０、７．０、８．０、９．０、１０．０、１１．０、またはそれよりも大きくてもよい。一部の実施形態では、ｐＩＣ５０は、３．０から１１．０、３．０から１０．０、３．０から９．０、３．０から８．０、３．０から７．０、３．０から６．０、３．０から５．０、５．０から１１．０、５．０から１０．０、５．０から９．０、５．０から８．０、５．０から７．０、８．０から１１．０、または８．０から１０．０であってもよい。

【0102】

３０種の利用可能な最高スコアを有する化合物を、実験的にアッセイした。３０種のうち少なくとも３種は、μＯＲに関してマイクロモル濃度の親和性を示した。１種の化合物、ＦＭＰ４は、独自の構造を有し、塩基性アミンまたはフェノールがない。オピオイドがトランスフェクトされた細胞系での他の結合アッセイでは、ＦＭＰ４が、ＭＯＲ－１、ＫＯＲ－１、およびＤＯＲ－１でそれぞれ、３２１７±１５３ｎＭ、２５０３±５２３ｎＭ、および８１４３±１３９８ｎＭの結合親和性を有する。ＦＭＰ４は、［３５Ｓ］ＧＴＰｙＳ機能的アッセイにおいて、弱いＭＯＲ－１部分アゴニストでもある。ＦＭＰ４は、公知のオピオイドアゴニストおよびアンタゴニストとは全く異なり、μＯＲに関してその他の公知のアゴニストおよびアンタゴニストと比較して、０．４４の最大タニモトスコアを持つ。同じデータセットにおけるＦＭＰ４－様化合物は結合アッセイで特徴付けられ、２種の化合物ＦＭＰ１およびＦＭＰ１６は、ＭＯＲ－１で＜１０μＭ親和性を示す。

【0103】

図７は、ＭＯＲ－１結合剤のスクリーニングを示し、ＭＯＲ－１での１２５ＩＢＮｔｘＡ比結合（ｓｐｅｃｉｆｉｃｂｉｎｄｉｎｇ）の阻害は、単一用量１０μＭの濃度で実施された。３種の化合物ＦＭＰ１、４、および１６（円で囲まれた）は、ＭＯＲ－１結合の約３０％の阻害を示した（赤い点線は、約３０％の阻害を示す化合物を表す）。各パネルは、少なくとも３回、独立して反復された、代表的な実験である。図８Ａ～８Ｄは、ＦＭＰ１～ＦＭＰ３２の構造および分子量を示す。

【0104】

（実施例７）
ＦＭＰ４の分析およびμＯＲの新規な活性様状態の同定

【0105】

モデリングは、ＦＭＰ４が、独自の手法でμＯＲに結合しかつμＯＲの活性化を容易にすることを予測した。ＦＭＰ４は、アゴニズムおよび結合に重要であると計算されるＭＤ状態３に関して比較的高いドッキングスコアを有する。図１は、ｔＩＣ．１、最も遅いｔＩＣＡ反応座標が２つの結晶学的状態を接続することを示す。図２は、２番目に遅いｔＩＣＡ、ｔＩＣ．２がｔＩＣ．１に動態的に直交し、いくつかの非結晶学的状態を定めることを示す。

【0106】

ｔＩＣ．１に沿ったその進行によっておよびＧＰＣＲ文献の伝統的な測定基準によって、膜貫通ヘリックス６の外向きの配向およびＮＰｘｘＹモチーフ残基Ｎ３３２^７．４８～Ｙ３３６^７．５３の膨張したコンフォメーションを測定すると、ＭＤ状態３は、μＯＲの新規な活性様状態である。オルソステリックな結合部位付近で、状態３は、Ｑ１２４^２．６０、Ｍ１５１^３．３６、Ｈ２９７^６．５２、Ｙ２９９^６．５４、およびＷ３１８^６．３５の再配置を伴う。Ｍ１５１^３．３６およびＨ２９７^６．５２の新しい位置により、ＦＭＰ４は、図１に見られるように活性結晶構造において立体的に禁止され得る態勢を占有することができる。共結晶化アゴニストとは対照的に、ＦＭＰ４は、π－Ｔ相互作用でＷ２９３^６．４８（μＯＲ活性化のゲーティングで極めて重要な残基）および水素結合でＨ２９７^６．５２と係合する。

【0107】

図９は、競合研究が、示されたクローン化マウスオピオイド受容体を安定して発現するＣＨＯ細胞の膜において、１２５Ｉ－ＩＢＮｔｘＡ（０．１ｎＭ）に対してＦＭＰ４で行われたことを示す。各図は、少なくとも３回、独立して反復された代表的な実験である。エラーバーは、３連の試料のＳＥＭを表す。見ることができないエラーバーは、記号のサイズよりも小さい。ＦＭＰ４は、ＭＯＲ－１、ＫＯＲ－１、およびＤＯＲ－１のそれぞれで、３２１７±１５３ｎＭ、２５０３±５２３ｎＭ、および８１４３±１３９８ｎＭの親和性を有していた。

【図1】