(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-19
(54)【発明の名称】観測された分子間相互作用を分類するための方法とシステム
(51)【国際特許分類】
G01N 33/536 20060101AFI20230711BHJP
G01N 21/41 20060101ALN20230711BHJP
【FI】
G01N33/536
G01N21/41 101
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022579099
(86)(22)【出願日】2021-06-22
(85)【翻訳文提出日】2022-12-21
(86)【国際出願番号】 EP2021067031
(87)【国際公開番号】W WO2022002699
(87)【国際公開日】2022-01-06
(32)【優先日】2020-06-29
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】597064713
【氏名又は名称】サイティバ・スウェーデン・アクチボラグ
(74)【代理人】
【識別番号】100188558
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100154922
【氏名又は名称】崔 允辰
(74)【代理人】
【識別番号】100207158
【氏名又は名称】田中 研二
(72)【発明者】
【氏名】トビアス・セーデルマン
(72)【発明者】
【氏名】オロフ・カールソン
(72)【発明者】
【氏名】ポール・イー・ベルチャー
【テーマコード(参考)】
2G059
【Fターム(参考)】
2G059AA02
2G059AA03
2G059BB04
2G059BB12
2G059CC16
2G059EE02
2G059FF04
2G059GG02
2G059KK04
2G059MM20
(57)【要約】
開示されるのは、第一アナライトサンプルセットをリガンド(3)と相互作用させること(100)、応答データセットを取得すること(101)、応答データから少なくとも一つの相互作用パラメータを抽出すること(102)、及び、各アナライトサンプル溶液について、相互作用パラメータを学習済み機械学習アルゴリズムに与えることによって、分析センサシステム(20)からの観測結果を分類するための方法である。学習済み機械学習アルゴリズムは、各アナライトサンプル溶液を、相互作用パラメータに基づいて、アナライトサンプル溶液とリガンド(3)の相互作用を示す少なくとも一つのクオリティ分類グループに分類する(104)。機械学習アルゴリズムは、第二アナライトサンプル溶液セットと少なくとも一つのリガンド(3)との間の相互作用から得られた応答データから抽出された相互作用パラメータセットと、アナライトサンプル溶液とリガンド(3)の相互作用を示す少なくとも一つのクオリティ分類グループとを用いて、学習させている(200)。
【特許請求の範囲】
【請求項1】
アナライト(4)とリガンド(3)との間の分子間相互作用の時間発展を表す応答データセットが取得されるように、前記分子間相互作用を観測するように構成された分析センサシステム(20)からの観測結果を分析するための方法であって、
第一アナライトサンプル溶液セットをリガンド(3)と相互作用させること(100)、観測された各分子間相互作用についての対応の応答データセットを取得すること(101)、
取得された各応答データセットの少なくとも一部から少なくとも一つの相互作用パラメータを抽出すること(102)、
各アナライトサンプル溶液について、抽出された前記少なくとも一つの相互作用パラメータを学習済み機械学習アルゴリズムに与えること(103)、及び、前記学習済み機械学習アルゴリズムが、抽出された前記少なくとも一つの相互作用パラメータに基づいて、前記リガンド(3)とアナライトサンプル溶液の相互作用を示す少なくとも一つのクオリティ分類グループに各アナライトサンプル溶液を分類すること(104)、を順に含み、
機械学習アルゴリズムの学習(200)が、
第二アナライトサンプル溶液セットと少なくとも一つのリガンド(3)との間の相互作用から得られた取得応答データセットの少なくとも一部から抽出された相互作用パラメータセットと、
前記第二アナライトサンプル溶液セットの各アナライトサンプル溶液についてのアナライトサンプル溶液とリガンド(3)の相互作用を示す少なくとも一つのクオリティ分類グループと、を用いて行われている、方法。
【請求項2】
前記第一アナライトサンプル溶液セットのアナライトサンプル溶液について取得された応答データセットから抽出された少なくとも一つの相互作用パラメータが、取得された応答データのうち80~100%を含む、請求項1に記載の方法。
【請求項3】
前記第二アナライトサンプル溶液セットのアナライトサンプル溶液について取得された応答データセットから抽出されて機械学習アルゴリズムの学習用に用いられる少なくとも一つの相互作用パラメータが、取得された応答データのうち80~100%を含む、請求項1又は2に記載の方法。
【請求項4】
前記第一アナライトサンプル溶液セットのアナライトサンプル溶液について取得された応答データセットから抽出された少なくとも一つの相互作用パラメータが、応答データの所定の時点において抽出された下記の一つ以上の相互作用パラメータを含み、該下記の一つ以上の相互作用パラメータが、
a)初期結合応答、
b)後期結合応答、
c)安定初期応答、
d)安定後期応答、
e)初期結合応答をアナライトの分子量で割ったもの、
f)後期結合応答をアナライトの分子量で割ったもの、
g)結合後期応答と結合初期応答の差を結合初期応答で割ったもの、
h)前記a)~g)のいずれかの相互作用パラメータの測定変動、
i)前記a)~g)のいずれかの相互作用パラメータの測定勾配、及び/又は、
j)アナライトサンプル溶液が同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合における、前記複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数、である、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記第二アナライトサンプル溶液セットのアナライトサンプル溶液について取得される第二応答データセットから抽出され前記機械学習アルゴリズムの学習に用いられる少なくとも一つの相互作用パラメータが、応答データの所定の時点において抽出された下記の一つ以上の相互作用パラメータを含み、該下記の一つ以上の相互作用パラメータが、
a)初期結合応答、
b)後期結合応答、
c)安定初期応答、
d)安定後期応答、
e)初期結合応答をアナライトの分子量で割ったもの、
f)後期結合応答をアナライトの分子量で割ったもの、
g)結合後期応答と結合初期応答の差を結合初期応答で割ったもの、
h)前記a)~g)のいずれかの相互作用パラメータの測定変動、
i)前記a)~g)のいずれかの相互作用パラメータの測定勾配、及び/又は、
j)アナライトサンプル溶液が同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合における、前記複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数、である、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記第一アナライトサンプル溶液セットの各アナライトサンプル溶液についての少なくとも一つのリファレンス減算相互作用パラメータを抽出して、前記学習済み機械学習アルゴリズムに与えることを更に含む請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記機械学習アルゴリズムの学習が、前記第二アナライトサンプル溶液セットの各アナライトサンプル溶液についての少なくとも一つのリファレンス減算相互作用パラメータを用いて更に行われている、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記第一アナライトサンプル溶液セットの各アナライトサンプル溶液についての少なくとも一つのリファレンス相互作用パラメータを抽出して前記学習済み機械学習アルゴリズムに与えることを更に含み、該少なくとも一つのリファレンス相互作用パラメータが、
k)リファレンスの初期結合応答、
l)リファレンスの後期結合応答、
m)リファレンスの安定初期応答、
n)リファレンスの安定後期応答、
o)リファレンスの結合後期応答とリファレンスの結合初期応答の差をリファレンスの結合初期応答で割ったもの、及び/又は、
p)アナライトサンプル溶液が同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合における、前記複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数、
のうちの一つ以上を含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記機械学習アルゴリズムの学習が、前記第二アナライトサンプル溶液セットの各アナライトサンプル溶液についての少なくとも一つのリファレンス相互作用パラメータを用いて更に行われていて、該少なくとも一つのリファレンス相互作用パラメータが、
k)リファレンスの初期結合応答、
l)リファレンスの後期結合応答、
m)リファレンスの安定初期応答、
n)リファレンスの安定後期応答、
o)リファレンスの結合後期応答とリファレンスの結合初期応答の差をリファレンスの結合初期応答で割ったもの、及び/又は、
p)アナライトサンプル溶液が同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合における、前記複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数、
のうちの一つ以上を含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
ネガティブコントロール溶液とリガンドとの相互作用から得られた少なくとも一つのネガティブコントロール相互作用パラメータを抽出して前記学習済み機械学習アルゴリズムに与えることを更に含む請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記機械学習アルゴリズムの学習が、ネガティブコントロールサンプル溶液とリガンドの相互作用から得られた少なくとも一つのネガティブコントロール相互作用パラメータを用いて更に行われている、請求項1から10のいずれか一項に記載の方法。
【請求項12】
ポジティブコントロール溶液とリガンドとの相互作用から得られた少なくとも一つのポジティブコントロール相互作用パラメータを抽出して前記学習済み機械学習アルゴリズムに与えることを更に含む請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記機械学習アルゴリズムの学習が、ポジティブコントロールサンプル溶液とリガンドの相互作用から得られた少なくとも一つのポジティブコントロール相互作用パラメータを用いて更に行われている、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記機械学習アルゴリズムが、ディシジョンツリー、k近傍法(kNN)、ランダムフォレスト、K平均法、勾配ブースティングアルゴリズム、人工ニューラルネットワーク(ANN)、ディープラーニングアルゴリズム、又はこれらの組み合わせから成る群から選択される、請求項1から13のいずれか一項に記載の方法。
【請求項15】
アナライト(4)とリガンド(3)との間の分子結合相互作用を検出し、観測結果を分類するための分析センサシステム(20)であって、
リガンド(3)とアナライト(4)のサンプル溶液との間の分子間相互作用を経時的に観測するための検出器(11)を備えるセンサデバイス(1)と、
観測された分子間相互作用の時間発展を表す応答データを生成するように構成されたデータ生成ユニット(12)と、
生成された前記応答データの少なくとも一部から少なくとも一つの相互作用パラメータを抽出するように構成された抽出ユニット(13)と、
前記少なくとも一つの相互作用パラメータを受信し、学習済み機械学習アルゴリズムを用いて、前記少なくとも一つの相互作用パラメータに基づいて、サンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトのサンプル溶液を分類するように構成されたデータ処理ユニット(14)と、を備える分析センサシステム(20)。
【請求項16】
観測された複数のアナライトリガンド相互作用からの応答データから抽出された相互作用パラメータを、アナライトとリガンドの相互作用を示す少なくとも一つのクオリティ分類グループと一緒に前記機械学習アルゴリズムに与えることによって前記機械学習アルゴリズムを学習させるための学習用センタ(15)を更に備える請求項15に記載の分析センサシステム(20)。
【請求項17】
コンピュータ上で実行されると請求項1から14のいずれか一項に記載の方法を行うためのプログラムコードを備えるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は概して観測された分子間相互作用を分類するための方法とシステムに関する。
【背景技術】
【0002】
生体分子等の分子間相互作用を実時間で観測するように構成された分析センサシステムは、光学バイオセンサ等の無標識バイオセンサに基づくものであることが多い。このようなバイオセンサシステムの代表例がBIACORE(登録商標)機器であり、これは、サンプルの分子とセンシング表面上に固定された分子構造体との間の相互作用を検出するのに表面プラズモン共鳴(SPR)を用いるものである。サンプルがセンサ表面を通過すると、その結合の発展が、相互作用が生じる速度を直接反映するものとなる。サンプルの注入にバッファ流が続き、その際の検出器の応答が、表面上の複合体の解離速度を反映するものとなる。
【0003】
BIACORE(登録商標)システムや同様のバイオセンサシステムからの典型的な出力は、会合段階の部分や解離段階の部分を含む時間に対する分子間相互作用の時間発展を記述する応答グラフや検出曲線である。この応答グラフや検出曲線は、コンピュータスクリーン上に表示されるのが一般的であり、結合曲線や「センサグラム」(sensorgram)と称されることが多い。
【0004】
BIACORE(登録商標)システムや類似のセンサシステムを用いて、リガンドやアナライト(分析対象)として用いられる分子についての複数の相互作用パラメータを求めることができる。こうしたパラメータとしては、分子間相互作用の結合(会合)と解離についての運動速度定数や相互作用の親和性(アフィニティ)が挙げられる。
【0005】
例えば、フラグメント創薬の初期段階において、単一結合測定結果だけから候補のアナライトを特定できることは稀である。結合レベルスクリーン(BLS)が、アナライト候補のライブラリのオーバービュー(概観)を与え、更なる分析に関与するアナライトを特定できるようになる。典型的なBLSでは、単一濃度の各アナライトをターゲットとリファレンス上に流す。応答データの分析を通じて結合強度と結合挙動に関して有力候補のアナライトを選択することができる。次のステップのアフィニティスクリーンにおいて、有力候補のアナライトを複数の濃度シリーズで試験して、結合が濃度依存性であることを確かめ、アナライト/リガンドの相互作用のアフィニティを求めること又は少なくとも推定することができる。
【0006】
しかしながら、ユーザがどの結合レベルスクリーン(BLS)にアナライトサンプルがヒットしたのかを分類して、更なる処理用に使用することは、特に一回の評価で数百サンプルが存在するように得るような場合には熟練のユーザにとっても煩雑で困難なものとなる。ユーザ毎にBLSサンプルを異なって分類し得るので(つまり、ヒットか否か)、候補アナライトのライブラリの評価は多様でユーザ依存のものとなり得る。アフィニティスクリーン分析では、ユーザは、一部の濃度を分析から除外する必要が生じ得て、また、KD(アナライトとリガンドの間の平衡解離定数)の決定にどのモデルを用いるのかを決めなければならない。このことは、BLSの場合のように、熟練のユーザにとっても困難なものとなり得て、アフィニティスクリーンから得られる結果がユーザ依存のものとなり得る。BLSとアフィニティスクリーン分析のいずれか一方又は両方を行うことによって、例えば創薬実験において更なる処理用のアナライト候補を特定することができる。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本開示の目的の一つは、アナライトとリガンドの相互作用を分類するためのより単純で高速な方法又は少なくとも代替方法を提供することであり、その方法は、例えば、創薬実験において更なる処理用のアナライト候補を特定するためのものである。本方法は、多数の分子間相互作用を分離するのに適している。また、このような分子間相互作用の分類を行うための分析システムを提供することも目的の一つである。
【課題を解決するための手段】
【0008】
本発明は添付の独立請求項によって定められる。非限定的な実施形態が、従属請求項、添付図面及び以下の説明から明らかとなるものである。
【0009】
第一態様によると、アナライトとリガンドとの間の分子間相互作用を観測するように構成された分析センサシステムからの観測結果を分類するための方法が提供され、その方法では、分子間相互作用の時間発展を表す応答データセットが取得される。順に、第一アナライトサンプル溶液セットをリガンドと相互作用させて、観測された各分子間相互作用についての対応の応答データセットを取得する。取得した各応答データセットの少なくとも一部から少なくとも一つの相互作用パラメータを抽出して、各アナライトサンプル溶液について、抽出された少なくとも一つの相互作用パラメータを学習済み機械学習アルゴリズムに与える。学習済み機械学習アルゴリズムは、抽出された少なくとも一つの相互作用パラメータに基づいて、各アナライトサンプル溶液を、そのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループに分類する。
【0010】
機械学習アルゴリズムの学習は、第二アナライトサンプル溶液セットと少なくとも一つのリガンドとの間の相互作用から得られた取得応答データセットの少なくとも一部から抽出された相互作用パラメータセットと、第二アナライトサンプル溶液セットの各アナライトサンプル溶液についてのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループとを用いて行われる。
【0011】
観測される分子間相互作用は、例えば、光学バイオセンサ等の質量検出バイオセンサシステムのセンシング表面において生じ得て、一方の分子(リガンド)が、センサ表面及びそのセンサ表面上を通過していた他方の分子(アナライト)に付着/固定し得て、アナライトとリガンドの結合の時間発展が観測できるようになる。電気化学システム等の他の検出原理に基づいた分析センサシステムも可能である。
【0012】
第一アナライトサンプル溶液セットは、少なくとも一つのアナライトサンプル溶液を備え得る。アナライトは、例えば、創薬分析における異なる複数の候補アナライトであり得る。通常、結合レベルスクリーン(BLS)分析やアフィニティスクリーン分析を行う際には、アナライト候補のライブラリの概観を与えるために数百のアナライトサンプル溶液を分析し得て、特定のリガンドと相互作用して更なる処理に関連しそうなアナライト候補を特定することができる。
【0013】
応答データからどの相互作用パラメータを抽出し、また、どの位多くの相互作用パラメータを抽出し、学習済み機械学習アルゴリズムに与えるのかは、分析センサシステムのユーザによって決定され得る。代わりに、どの相互作用パラメータを抽出し、また、どの位多くの相互作用パラメータを抽出し、学習済み機械学習アルゴリズムに与えるのかは、本法において予め決められた所定のものとなり得る。一般的に、相互作用パラメータの数が多い方が、より信頼性のある分類が得られる。どの相互作用パラメータにするのかの決定及びその相互作用パラメータの抽出は、複数の学習用応答データで学習させたエキスパートシステム又はANNによって行われ得る。分析の目的と分析されるリガンドに応じて、抽出されて学習済み機械学習アルゴリズムに与えられる相互作用パラメータの数と種類は異なり得る。
【0014】
アナライトサンプル溶液は、学習済み機械学習アルゴリズムによって、少なくとも一つの抽出相互作用パラメータに基づいて、そのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループに分類される。
【0015】
異なるクオリティ分類グループの数は一例では二つであり得て、一つ目のグループが、対象のリガンドと十分良好に相互作用するアナライトを含み、二つの目のグループが、対象のリガンドとの相互作用が悪いアナライトを含む。そして、リガンドと十分良好に相互作用するアナライトを含むグループが更なる分析用に選択され得る。
【0016】
他の例では、クオリティ分類グループの数は100個と成り得て、グループ1がリガンドとの相互作用が悪いアナライトを含み、グループ100がリガンドと極めて良好に相互作用するアナライトを含む。ユーザが本方法の厳格性を規制して、例えば、>50にカットオフを設定することによって、分類グループ51~分類グループ100に分類されたアナライトのみが更なる分析に含まれるようになり得る。この場合も、十分良好なクオリティの相互作用が何なのかや、カットオフを何処に設定するのかは、分析/実験の目的に依存する。
【0017】
アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトサンプル溶液又は溶液のシリーズを分類することは、メイングループへの第一分類(例えば、更なる分析用に関連しているのか否か)、そのアナライトサンプル溶液が何故そのメイングループに分類されたのかという理由についての情報を与える第二グループを含み得て、その理由は、例えば、不確実な結合、低過ぎ又は高過ぎる屈折率、リガンドへの結合が1:1ではないこと、結合応答が無いか非常に低いこと(所定のカットオフライン未満)、会合における高勾配や予期せぬ勾配、遅い解離、混合の悪さ、R>Rmax、アナライトが超化学量論的バインダであること、KD(アナライトとリガンドの間の平衡解離定数)を超える濃度、KDを決定するには少な過ぎる濃度、定常状態分析において信頼できないパラメータ等である。
【0018】
機械学習アルゴリズムを学習させる際には、第二アナライトサンプル溶液セットを用いる。第二アナライトサンプル溶液セットは、アナライトサンプル溶液の数とアナライトの種類の両方において第一アナライトサンプル溶液セットと異なり得る。機械学習アルゴリズムを学習させる際に用いるリガンドは、第一アナライトサンプル溶液セットと相互作用させるのに用いるものと同じであり得る。代わりに、用いられるリガンドは、第一アナライトサンプル溶液セットと相互作用させるのに用いるものではないリガンドであり得る。
【0019】
第二アナライトサンプル溶液セットは複数の異なるアナライトサンプル溶液を含み得る。好ましくは、第二アナライトサンプル溶液セットは、10個以上、100個以上、500個以上の異なるアナライトサンプル溶液を含み得る。学習に用いられるアナライトサンプル溶液の数が多いほど、第一アナライトサンプル溶液セットのアナライトサンプル溶液の分類が良好になる。
【0020】
機械学習アルゴリズムの学習用に、どの相互作用パラメータを用いるのか、また、アナライトサンプル溶液毎にどのくらい多くの相互作用パラメータを用いるのかは、機械学習アルゴリズムの使用目的に依存し得る。一般的には、学習に用いる相互作用パラメータの数が多いほど、第一アナライトサンプル溶液セットのアナライトサンプル溶液の分類が良好になる。どの相互作用パラメータにするのかの決定とそのパラメータの抽出は、分析システムのエキスパートユーザによって行われ得て、又は、複数の学習用応答データセットで学習済みのエキスパートシステムやANNによって行われ得る。
【0021】
機械学習アルゴリズムを学習させるのに用いられる相互作用パラメータの数と種類は、第一アナライトサンプル溶液セットのアナライトサンプル溶液について学習済みの機械学習アルゴリズムに与えられるものと同じであり得る。代わりに、用いられる相互作用パラメータの数及び/又は種類が異なり得る。機械学習アルゴリズムを、第一アナライトサンプル溶液セットのアナライトサンプル溶液の実際の分類に用いられるよりも多くの相互作用パラメータのセットで学習させ得る。
【0022】
また、機械学習アルゴリズムには、第二アナライトサンプル溶液セットの各アナライトサンプル溶液について、そのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループも与えられる。第二アナライトサンプルセットの各アナライトサンプル溶液のクオリティ分類グループの決定は、分析システムのエキスパートユーザによって行われ得て、又は、複数の学習用応答データセットで学習済みのエキスパートシステムやANNによって行われ得る。
【0023】
異なるクオリティ分類グループの数は一例では二つであり得て、一つ目のグループが対象のリガンドと十分良好に相互作用するアナライトを含み、二つ目のグループが対象のリガンドとの相互作用が悪いアナライトを含む。十分良好であるという分類は、そのアナライトが更なる分析の対象となり得ることを示す。
【0024】
他の例では、クオリティ分類グループの数は100個と成り得て、グループ1がリガンドとの相互作用が悪いアナライトを含み、グループ100がリガンドと極めて良好に相互作用するアナライトを含む。
【0025】
アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトサンプル溶液又は溶液のシリーズを分類することは、メイングループへの第一分類(例えば、更なる分析用に関連しているのか否か)、そのアナライトサンプル溶液が何故そのメイングループに分類されたのかという理由についての情報を与える第二グループを含み得て、その理由は、例えば、不確実な結合、低過ぎ又は高過ぎる屈折率、リガンドへの結合が1:1ではないこと、結合応答が無いか非常に低いこと(所定のカットオフライン未満)、会合における高勾配、遅い解離、混合の悪さ、R>Rmax、アナライトが超化学量論的バインダであること、KDを超える濃度、KDを決定するには少な過ぎる濃度、定常状態分析において信頼できないパラメータ等である。
【0026】
そして、このように学習させた機械学習アルゴリズムは、第一アナライトサンプル溶液セットからのアナライトサンプル溶液を、そのアナライトサンプル溶液とリガンドとの相互作用を示すクオリティ分類グループに分類する。BLS分析において、アナライト候補のライブラリの概観を与えるために数百のアナライトサンプル溶液が分析される場合、本方法は、更なる処理用に関連しているか否かのアナライト候補の高速分類を提供し、また、アフィニティスクリーンにおいて、本方法は、濃度依存性とアフィニティ(KD)の追加的な推定を提供する。更に、候補アナライトの評価が、あまりユーザ依存のものではなくなり、観測された分子間相互作用の評価において熟練のユーザが補助されるようなものではなくなり得る。
【0027】
第一アナライトサンプル溶液セットのアナライトサンプル溶液の取得応答データセットから抽出された少なくとも一つの相互作用パラメータは、取得応答データのうち80~100%を含み得る。
【0028】
第二アナライトサンプル溶液セットのアナライトサンプル溶液の取得応答データセットから抽出され機械学習アルゴリズムの学習用に用いられる少なくとも一つの相互作用パラメータは、取得応答データのうち80~100%を含み得る。
【0029】
第一アナライトサンプル溶液セットのアナライトサンプル溶液の取得応答データセットから抽出される少なくとも一つの抽出パラメータは、応答データの所定の時点で抽出される以下の相互作用パラメータのうちいずれか一つ以上を備え得る:
a)初期結合応答、
b)後期結合応答、
c)安定初期応答、
d)安定後期応答、
e)初期結合応答をアナライトの分子量で割ったもの、
f)後期結合応答をアナライトの分子量で割ったもの、
g)結合後期応答と結合初期応答の差を結合初期応答で割ったもの、
h)a)~g)のいずれかの相互作用パラメータの測定変動、
i)a)~g)のいずれかの相互作用パラメータの測定勾配、及び/又は、
相互作用パラメータは、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液でアナライトサンプル溶液が構成されている場合には、以下のパラメータを備える:
j)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
パラメータj)の平衡解離定数(KD)は、複数のアナライト濃度のシリーズ(つまり、同じアナライト)から得られたアフィニティスクリーン分析から得られる。用いられる最大結合能(Rmax)は定数又は固定Rmaxであり得る。ここで、Rmaxは、表面上の全ての結合サイトがアナライトによって占められている際の応答である。フィッティングされたRmaxは、Rmaxがフリーフィットパラメータとして使用されて求められる際のものである。一定のRmaxは、Rmaxがフィッティングされたものではなくて、定数として方程式に代入されるものである。これが用いられ得るのは、フィッティングされたRmaxが不確実であると予測され、一定のRmaxがより確実な決定から得られている場合である。例えば、Mw(分子量)で、より高いアフィニティのアナライトでフィッティングされたRmaxを調節する。
【0030】
第二アナライトサンプル溶液セットのアナライトサンプル溶液の第二取得応答データセットから抽出され機械学習アルゴリズムの学習用に用いられる少なくとも一つの抽出パラメータは、応答データの所定の時点で抽出される以下の相互作用パラメータのうちいずれか一つ以上を備え得る:
a)初期結合応答、
b)後期結合応答、
c)安定初期応答、
d)安定後期応答、
e)初期結合応答をアナライトの分子量で割ったもの、
f)後期結合応答をアナライトの分子量で割ったもの、
g)結合後期応答と結合初期応答の差を結合初期応答で割ったもの、
h)a)~g)のいずれかの相互作用パラメータの測定変動、
i)a)~g)のいずれかの相互作用パラメータの測定勾配、及び/又は、
相互作用パラメータは、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液でアナライトサンプル溶液が構成されている場合には、以下のパラメータを備える:
j)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
【0031】
本方法は、第一アナライトサンプル溶液セットの各アナライトサンプル溶液について、少なくとも一つのリファレンス減算相互作用パラメータを抽出して、学習済み機械学習アルゴリズムに与えることを更に備え得る。
【0032】
機械学習アルゴリズムを、第二アナライトサンプル溶液セットの各アナライトサンプル溶液について少なくとも一つのリファレンス減算相互作用パラメータを用いて更に学習させ得る。
【0033】
本方法は、第一アナライトサンプル溶液セットの各アナライトサンプル溶液について、少なくとも一つのリファレンス相互作用パラメータを抽出して、そのリファレンス相互作用パラメータを学習済み機械学習アルゴリズムに与えることを更に備え得て、その少なくとも一つのリファレンス相互作用パラメータは以下のうちのいずれか一つ以上を備え得る:
k)リファレンスの初期結合応答、
l)リファレンスの後期結合応答、
m)リファレンスの安定初期応答、
n)リファレンスの安定後期応答、
o)リファレンスの結合後期応答とリファレンスの結合初期応答の差をリファレンスの結合初期応答で割ったもの、及び/又は、
そのアナライトサンプル溶液が、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合には、リファレンス相互作用パラメータは、以下のものを備える:
p)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
【0034】
機械学習アルゴリズムを、第二アナライトサンプル溶液セットの各アナライトサンプル溶液について、少なくとも一つのリファレンス相互作用パラメータを用いて更に学習させ得て、その少なくとも一つのリファレンス相互作用パラメータは以下のうちのいずれか一つ以上を備え得る。
k)リファレンスの初期結合応答、
l)リファレンスの後期結合応答、
m)リファレンスの安定初期応答、
n)リファレンスの安定後期応答、
o)リファレンスの結合後期応答とリファレンスの結合初期応答の差をリファレンスの結合初期応答で割ったもの、及び/又は、
そのアナライトサンプル溶液が、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合には、リファレンス相互作用パラメータは、以下のものを備える:
p)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
【0035】
本方法は、ネガティブコントロール溶液とリガンドの相互作用から得られた少なくとも一つのネガティブコントロール相互作用パラメータを抽出して、その少なくとも一つのネガティブコントロール相互作用パラメータを学習済み機械学習アルゴリズムに与えることを更に備え得る。
【0036】
機械学習アルゴリズムを、ネガティブコントロール溶液とリガンドの相互作用から得られた少なくとも一つのネガティブコントロール相互作用パラメータを用いて更に学習させ得る。
【0037】
本方法は、ポジティブコントロール溶液とリガンドの相互作用から得られた少なくとも一つのポジティブコントロール相互作用パラメータを抽出して、その少なくとも一つのポジティブコントロール相互作用パラメータを学習済み機械学習アルゴリズムに与えることを更に備え得る。
【0038】
機械学習アルゴリズムを、ポジティブコントロール溶液とリガンドの相互作用から得られた少なくとも一つのポジティブコントロール相互作用パラメータを用いて更に学習させ得る。
【0039】
機械学習アルゴリズムは、ディシジョンツリー、k近傍法(kNN)、ランダムフォレスト、K平均法、勾配ブースティングアルゴリズム、人工ニューラルネットワーク(ANN)、ディープラーニングアルゴリズム、又はこれらの組み合わせから成る群から選択され得る。
【0040】
第二態様に従って提供されるのは、アナライトとリガンドとの間の分子結合相互作用を検出し、観測結果を分類するための分析センサシステムである。そのシステムは、リガンドとアナライトサンプル溶液との間の分子間相互作用を経時的に観測するための検出器を備えるセンサデバイスと、観測された分子間相互作用の時間発展を表す応答データを生成するように構成されたデータ生成ユニットと、生成された応答データの少なくとも一部から少なくとも一つの相互作用パラメータを抽出するように構成された抽出ユニットと、少なくとも一つの相互作用パラメータを受信して、学習済み機械学習アルゴリズムを用いて、少なくとも一つの相互作用パラメータに基づいて、アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトサンプル溶液を分類するように構成されたデータ処理ユニットと、を備える。
【0041】
分析センサシステムは、観測された複数のアナライト‐リガンド相互作用からの応答データから抽出された相互作用パラメータを、アナライトとリガンドの相互作用を示す少なくとも一つのクオリティ分類グループと一緒に機械学習アルゴリズムに与えることによって機械学習アルゴリズムを学習させるための学習用センタを更に備え得る。
【図面の簡単な説明】
【0042】
【
図1】分子結合相互作用を検出し、観測結果を分類するための分析システムの概略図を示す。
【
図2】アナライトとリガンドの間の相互作用からの時間に対する検出曲線を示す。
【
図3】同じ濃度の複数の異なるアナライトとリガンドの結合相互作用の応答レベルを示す。
【
図4】
図4aと
図4bは、濃度シリーズと報告点BLの濃度のプロットを示す。
【
図5】理想的検出曲線を示し、後期結合応答、初期結合応答、安定初期、安定後期という特徴が示されている。
【
図6】結合のクオリティが悪いリガンドに対するアナライトの結合を示す検出曲線の一例を示す。
【
図7】結合のクオリティが悪いリガンドに対するアナライトの結合を示す検出曲線の一例を示す。
【
図8】
図8aと
図8bは、アナライト溶液のシリーズと、濃度がKD未満とKD超の両方にあるドーズ応答曲線を示す。このシリーズは、Rmaxパラメータのフリーフィッティングを用いてデータをフィッティングするためのグループに分類される。
【
図9】
図9aと
図9bは、アナライト溶液のシリーズと、全ての濃度がKD未満であるドーズ応答曲線を示し、アフィニティはRmaxパラメータのフリーフィッティングを用いて求められる。このシリーズは、一定のRmaxでデータをフィッティングするためのグループに分類される。
【
図10】アナライトとリガンドとの間の分子間相互作用を観測するように構成された分析センサシステムからの観測結果を分類するための方法のステップを示すフローチャートである。
【
図11a】学習及び分類をサポートするグラフィック要素を示す。
【
図11b】学習及び分類をサポートするグラフィック要素を示す。
【
図11c】学習及び分類をサポートするグラフィック要素を示す。
【
図11d】学習及び分類をサポートするグラフィック要素を示す。
【
図11e】学習及び分類をサポートするグラフィック要素を示す。
【発明を実施するための形態】
【0043】
本開示は、分析センサ方法に関し、特に、バイオセンサに基づき、分子間相互作用を調べるものである。結果は、相互作用が進むに連れて実時間で、応答データの形式で表され、その応答データは応答曲線、センサグラムとして示されることが多い。
【0044】
バイオセンサは多種多様な検出方法に基づいたものとなり得る。典型的には、そのような方法として、質量検出方法(圧電、光学、熱光学、表面音響波(SAW)デバイス方法等)や、電気化学的方法(電位差測定、伝導度測定、電流測定、キャパシタンス方法)が挙げられるが、これらに限定されない。光学検出方法に関して代表的な方法として、質量表面濃度を検出する方法(例えば、内部反射方法や外部反射方法等の反射光学的方法)、角度を検出する方法、波長を検出する方法、分解された位相を検出する方法、例えば、偏光解析法やエバネセント波分光法(EWS)が挙げられ、後者として、表面プラズモン共鳴(SPR)分光法、ブリュースター角屈折率測定法、臨界角屈折率測定法、漏れ全反射(FTR,frustrated total reflection)、エバネセント波偏光解析法、散乱全内部反射(STIR, scattered total internal reflection)、導光路センサ、エバネセント波型イメージング、例えば、臨界角解像イメージング、ブリュースター角解像イメージング、SPR角解像イメージング等が挙げられる。更に、測光法、例えば、エバネセント蛍光(TIRF、全内部反射蛍光)や燐光、導波路干渉計に基づいた測光法も使用可能である。
【0045】
一般的に用いられている検出原理の一つは表面プラズモン共鳴(SPR)分光法である。SPR型バイオセンサの一例はBIACORE(登録商標)との名称で販売されている(以下、「BIACORE機器」と称する)。こうしたバイオセンサは、SPRに基づいた質量検知法を用いて、表面結合リガンドと対象アナライトとの間の実質的に実時間で無標識の結合相互作用分析を与える。
【0046】
BIACORE機器は、発光ダイオード(LED)と、金薄膜で覆われたガラスプレートを含むセンサチップと、センタチップ上に液体の流れを与える集積流体カートリッジと、光検出器アレイと、を含む。LEDからの入射光は、ガラスと金の界面で全内部反射されて、光検出器アレイによって検出される。特定の入射角(「SPR角」)において、表面プラズモン波が金層に生じ、反射光の強度損失又は「ディップ」(dip)として検出される。BIACORE機器に関するSPR現象は、ガラスプレートの反対側の金属薄膜におけるプラズモンと称される伝導電子の振動に対する、プリズム及びガラスプレートを介して金属薄膜に入射する単色p偏光の光の共鳴結合に依存する。その振動が、表面から液体流中に1波長(略1μm)程度の距離に及ぶエバネセント場を生じさせる。共鳴が生じると、金属膜における電子の集団励起によって光エネルギーが金属膜に失われていき、反射光強度は、厳密に定められた入射角(SPR角)において低下し、そのSPR角度は、金属表面近傍におけるエバネセント場の到達範囲内の屈折率に依存する。
【0047】
上述のように、SPR角は、金層近傍の媒体の屈折率に依存する。BIACORE機器では、典型的にはデキストランを金表面に結合させて、アナライト結合用のリガンドをデキストラン層の表面に結合させる。対象アナライトは、流体カートリッジを通して溶液状でセンサ表面に注入される。金膜近傍の屈折率が、(i)溶液の屈折率(定数)と、(ii)表面に結合した物質の量に依存するので、結合したリガンドとアナライトの間の結合相互作用を、SPR角の変化の関数として観測することができる。
【0048】
図1には、分子結合相互作用を検出して、観測結果を分類するための分析センサシステム20の概略図が示されている。この例では、システムは、流路5を通してアナライト4(例えば、抗原)を有するサンプル流に晒された捕捉用分子3(例えば、抗体)を支持するセンシング表面(金膜2)を有するセンサデバイス(チップ1)を備える。光源7(LED)からの単色p偏光の光6がプリズム8によって、ガラスと金属の界面9に結合され、その界面9において光が全反射される。反射光ビーム10の強度が検出器11(例えば、光検出器アレイ)によって検出される。
【0049】
BIACORE機器からの典型的な出力は「センサグラム」(sensorgram)であり、これは、時間の関数としての応答データのプロットである(「レゾナンスユニット」(RU)単位で測定される)。1000RUの上昇は、略1ng/mm2のセンサ表面上の質量増加に対応する。アナライトを含有するサンプルがセンサ表面に接触すると、「会合」(association)と称される段階において、センサ表面に結合したリガンドがアナライトと相互作用する。サンプルは最初にセンサ表面に接触するので、この段階は、RUの上昇としてセンサグラムに示される。逆に、「解離」(dissociation)は、サンプル流が例えばバッファ流に置換される際に通常は生じる。アナライトが表面結合リガンドから解離するので、このステップは、経時的なRUの低下としてセンサグラムに示される。
【0050】
BIACORE機器の代表的なセンサグラムが
図2に与えられていて、サンプル中のアナライトと相互作用している固定リガンド(例えば、抗体)を有するセンシング表面を表している。y軸が応答(ここではレゾナンスユニット(RU)単位)を示し、x軸が時間(ここでは秒単位)を示す。最初に、バッファをセンシング表面上に通して、センサグラムの「基準応答」(baseline response)を与える。サンプル注入中に観測される信号の増加はアナライトの結合(つまり、会合)に起因するものであり、応答信号が横這い(プラトー)になる安定状態になる。サンプル注入の最後に、サンプルをバッファの連続的な流れに置換し、信号の減少は、表面からのアナライトの解離又は放出を反映する。会合/解離曲線の勾配は、相互作用動力学に関する有用な情報を与え、応答信号の高さは、表面濃度を表す(つまり、相互作用に起因する応答は表面上の質量濃度変化に関係している)。
図1に示される分析システム20は、相互作用の時間発展を表す応答データを生成するためのデータ生成ユニット12を備える。
【0051】
他の検出原理に基づいたバイオセンサシステムによって生成される検出曲線やセンサグラムも同様の見た目を有している。
【0052】
例えば、フラグメント創薬の初期段階において、単一結合測定結果だけから候補のアナライトを特定できることは稀である。結合レベルスクリーン(BLS)が、アナライト候補のライブラリの概観を与え、更なる分析に関与するアナライトを特定できるようになる。典型的なBLSでは、単一濃度の各アナライトをターゲットとリファレンス上に流す。応答データの分析を通じて結合強度と結合挙動に関して有力候補のアナライトを選択することができる。次のステップのアフィニティスクリーンにおいて、有力候補のアナライトを複数の濃度を用いて試験して、結合が濃度依存性であることを確かめ、アナライト/リガンドの相互作用のアフィニティ(親和性)を求めること又は少なくとも推定することができる。
【0053】
しかしながら、ユーザがどの結合レベルスクリーン(BLS)にアナライトサンプルがヒットしたのかを分類して、更なる処理用に使用することは、特に一回の評価で数百サンプルが存在するように得るような場合には熟練のユーザにとっても煩雑で困難なものとなる。
図3には、典型的なBLS分析からのリガンドに対する同じ濃度の複数の異なるアナライトの結合相互作用の応答レベルが示されている。ユーザ毎にBLSサンプルを異なって分類し得るので(つまり、ヒットか否か)、候補アナライトのライブラリの評価は多様でユーザ依存のものとなり得る。親和性スクリーン分析では、ユーザは、一部の濃度を分析から除外する必要が生じ得て、また、KDの決定にどのモデルを用いるのかを決めなければならない。
【0054】
アフィニティスクリーン分析では、複数のアナライト濃度のシリーズ(つまり、同じアナライトを用いる)から得られた取得応答データ(センサグラム)セットを分析する。機械学習アルゴリズム(ML)を、センサグラムのシリーズのうちから異常なものを除去するように学習させて用いて、センサグラムの更なる分析がこのような異常センサグラムを含むデータに基づいたものにならないようにし得る。一シリーズのうちのあまりにも多くのセンサグラムがクオリティの悪いものであると決定されると、そのシリーズ全体を排除することが望ましい。MLはセンサグラムの包除を決定し、また、エキスパートユーザによって学習させて、特定のセンサグラムが何故排除されたのかに関する情報を含むようにもし得る。
【0055】
アフィニティスクリーンでは、センサグラムの分類は、複数のセンサグラムを用いて行われ得て、各セットのセンサグラムについて、特徴のセットを計算して、センサグラムのセットに対して数学モデルをフィッティングする。
【0056】
このようして計算された特徴のセットは以下のうち三つ以上を有し得る:
‐ 最大結合能RmaxをRmaxの標準誤差で割ったもの;
‐ 後期結合応答BをRmaxで割ったもの;
‐ 検出曲線とフィッティング数学モデルとの間の平均二乗誤差MSEを二乗後期結合応答B2で割ったもの
‐ 各センサグラムのクオリティ分類グループへの分類。
【0057】
用いられる最大結合能Rmaxは定数又はフィッティングされたRmaxであり得る。平衡解離定数KDがフィッティングされる。
【0058】
センサグラムのセットは、少なくとも一つのセンサグラムを含み得る。二つ以上のセンサグラム(例えば、2~10個のセンサグラム)を含むる場合には、センサグラムのセットのうちの各センサグラムが、異なる分子濃度、つまり異なるアナライト濃度における(同じリガンドとアナライトとの間の)分子間相互作用を表す。
【0059】
センサグラムのセットにフィッティングされる数学モデルは、平衡状態における分子間相互作用を記述するモデルである。モデルは、例えば、1:1定常状態アフィニティモデルや、異種リガンド定常状態アフィニティモデルであり得る。
【0060】
KD、Rmax、オフセットのパラメータ値は、各々の標準誤差で割られる。パラメータの標準誤差は、そのパラメータが、フィッティングされた数学モデルにどの程度近いかについての尺度である。Rmaxは、フィッティングから計算されたRmaxであり得る。後期結合応答Bは、検出曲線の基準値に対する相対的な検出曲線中の最大結合応答である。後期結合応答Bという特徴は、その値をRmaxで割ることによって、正規化され得て、平均二乗誤差MSEという特徴は、その値を二乗後期結合応答B2で割ることによって、正規化される。あらゆる種類の入力データに対して適用可能となるようにこれらの特徴は正規化される。一定のRmaxを有する定常状態モデルが適用される場合、そのパラメータについて計算可能な標準誤差は無い。
【0061】
センサグラムのセットに数学モデルをフィッティングして、センサグラムのセット及びフィッティングした数学モデルから特徴のセットを計算して、各センサグラムをクオリティ分類グループに分類するように機械学習アルゴリズムを学習(訓練)させることができる。その学習(訓練)で用いられるパラメータは、熟練のユーザによって決定される。
【0062】
センサグラムは、そのセンサグラムのクオリティ(質)を示すクオリティ分類グループに分類される。クオリティの悪いセンサグラムは、評価に悪影響を与え得るので、観測された相互作用の更なる分析から排除されることが望ましい。クオリティの悪い曲線は、例えば、不安定な基準値(ベースライン)、エアスパイク、基準値未満の応答等を有し得て、例えば、汚染されたフローシステムやランニングバッファ(泳動用緩衝液)、用いられたリガンド捕捉方法、ランニングバッファの低過ぎる洗剤濃度によって生じ得る。検出曲線の十分良好なクオリティが何なのかや、観測された相互作用のアフィニティ分析に或る検出曲線を含めるかどうかは、分析/実験の目的に依存する。
【0063】
一例として、異なるクオリティ分類グループの数は、二つであり、一つ目のグループが、十分良好なクオリティのセンサグラムを有し、二つ目のグループが、クオリティの悪いセンサグラムを有する。そして、十分良好なクオリティのセンサグラムを有するグループが、観測された分子間相互作用のアフィニティ分析用に選択され得る。
【0064】
他の例では、クオリティ分類グループの数は100個であり、グループ1がクオリティの悪いセンサグラムを有し、グループ100が極めて良好なクオリティのセンサグラムを有する。ユーザが本方法の厳格性を規制して、例えば、>50にカットオフを設定することによって、観測された相互作用の動力学分析に分類グループ51~分類グループ100に分類されたセンサグラムのみが含まれるようになり得る。この場合も、十分良好なクオリティのセンサグラムが何なのかや、カットオフを何処に設定するのかは、分析/実験の目的に依存する。
【0065】
計算される特徴のセットは三つ以上であり得る。特徴が互いに補完し合う場合にはより多数の特徴を本方法で用いることでセンサグラムの分類が改善され得て、熟練のユーザが十分良好なクオリティをあまり良好ではないクオリティから区別するのに何に着目して区別しているのかが強調される。分類に寄与しない特徴が多過ぎると、学習と分類があまり良好なものではなくなり得る。また、上述のものではない追加の特徴を計算して、センサグラムの分類ステップに含ませることも可能である。
【0066】
数学モデルは、1:1定常状態アフィニティモデル、又は異種リガンド定常状態アフィニティモデルから選択され得る。
【0067】
分類に基づいて、観測された分子間相互作用のアフィニティ分析にどのセンサグラムを使用するのかを決定し得る。
【0068】
固定/一定のRmaxモデルを用いる場合、固定レベルは、予測Rmaxに設定されて、MLの予測後に評価ソフトウェアがそのシリーズを自動的に再フィッティングする。このモデルは、このモデルは、固定Rmaxを予測するものであり、何故それが固定Rmaxであるのかの注釈を与えるようにエキスパートユーザによって学習させ得る。固定Rmaxは現状ではセンサグラムから二つの特徴のみを用いるものであるが、会合段階の勾配や結合初期応答等の特徴を追加して、超化学量論的な場合を検出するようにし得る。
【0069】
MLモデルは、センサグラムのシリーズの合否と、不合格の理由を予測する。機械学習アルゴリズムの学習(訓練)では、エキスパートが、不合格のシリーズについて所定のサブクラスの注釈を与え、合格のシリーズは無標識のままとする。MLモデルは二つのモデルで構成され得て、一方が合否を取り扱い、他方が不合格の理由を取り扱う。
【0070】
図4aと
図4bには、濃度シリーズと、報告点BLの応答・対・濃度が示されている。BLSの場合のように、これは熟練のユーザにとっても難解なものであり得て、アフィニティスクリーンから得られる結果はユーザ依存のものとなり得る。BLSとアフィニティスクリーン分析の一方又は両方を行うことによって、例えば創薬実験における、更なる処理用のアナライト候補を特定し得る。
【0071】
以下説明するのは、アナライト4とリガンド3との間の分子間相互作用を分類するための方法とシステムであり、例えば、創薬実験において、更なる処理用のアナライト候補を特定するためのもの等である。本方法と装置は、多数のこのような分子間相互作用を分類するのに適している。
【0072】
本方法は
図10に示されていて、アナライト4とリガンド3との間の分子結合相互作用を検出し、観測結果を分類するための例示的な分析センサシステム20が
図1に示されている。第一アナライトサンプル溶液セットを対象のリガンド3と相互作用(100)させる。第一アナライトサンプル溶液セットは少なくとも一つのアナライトサンプル溶液を備え得る。アナライトは、例えば、創薬分析における複数の異なる候補アナライトであり得る。通常、結合レベルスクリーン(BLS)やアフィニティスクリーンを行う際には、数百のアナライトサンプル溶液を分析して、アナライト候補のライブラリの概観を与えて、特定のリガンドと相互作用し更なる処理に関係しそうなアナライト候補を特定できるようにし得る。
【0073】
検出器11を備えるセンサデバイス1が、リガンド4とアナライト3のサンプル溶液との間の分子間相互作用を経時的に観測(101)するように配置構成される。観測される分子間相互作用は、例えば、光学バイオセンサ等の質量検出バイオセンサシステムのセンシング表面2で生じ得て、一方の分子(リガンド3)が、センサ表面及びそのセンサ表面上を通過していた他方の分子(アナライト4)に付着/固定され、アナライトとリガンドの結合の時間発展を観測することができるようになる。電気化学システム等の他の検出原理に基づいた分析センサシステムも可能である。
【0074】
複数のサンプル溶液は略同じ濃度のアナライトを備え得る。実際には、アナライトの厳密な濃度が分かっていることは稀である。実践的には公称の固定濃度値を用いることによって濃度変動を許容し得るが、結果の解釈がより不確実なものになる。
【0075】
データ生成ユニット12は、観測された分子間相互作用の時間発展を表す対応の応答データを生成するように構成される。抽出ユニット13を用いることによって、取得応答データの各セットの少なくとも一部から少なくとも一つの相互作用パラメータを抽出(102)し得る。各応答データセットはリガンド3とアナライト4との間の分子間相互作用を理想的に表す。しかしながら、応答データセットは、例えば、望ましくない不確実なセンシング表面2への結合、アナライトサンプル溶液と使用されているランニングバッファとの間の屈折率の差等に起因する「ノイズ」も備え得る。
【0076】
アナライトサンプルの注入中に、アナライト4の結合(つまり、会合)に起因する信号の増加が観測され、応答信号が横這い(プラトー)な定常状態になる。アナライトがリガンドから解離すると解離状態になる。
【0077】
データ処理ユニット14は、少なくとも一つの相互作用パラメータが提供(103)されると、学習済みの機械学習アルゴリズムを用いて、少なくとも一つの相互作用パラメータに基づいて、アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループへアナライトサンプル溶液を分類(104)するように構成される。
【0078】
応答データは、データセットとして提供され得て、又は、BIACORE(登録商標)等の表面プラズモン共鳴型バイオセンサを用いた場合には検出/応答曲線(センサグラム)としてグラフで提供され得る。
【0079】
少なくとも一つの相互作用パラメータは、用いられた各検出曲線/センサグラムの取得応答データのうち80~100%を含み得る。
【0080】
一部実施形態では、応答データセットの一部のみではなくて全部を抽出相互作用パラメータとして用いることが好ましい。相互作用パラメータは、例えば、全応答データのうちの90~100%に基づいたものとなり得る。最も有益な情報を含む応答データセットの部分は、アナライトがリガンドに結合する前、相互作用中、そしてその後の期間(解離中)に観測されていた応答データである。
【0081】
少なくとも一つの抽出パラメータは、応答データの所定の時点(例えば、所定の期間)で抽出される以下の相互作用パラメータのうちいずれか一つ以上を備え得る:
a)初期結合応答、
b)後期結合応答、
c)安定初期応答、
d)安定後期応答、
e)初期結合応答をアナライトの分子量で割ったもの、
f)後期結合応答をアナライトの分子量で割ったもの、
g)結合後期応答と結合初期応答の差を結合初期応答で割ったもの、
h)a)~g)のいずれかの相互作用パラメータの測定変動、
i)a)~g)のいずれかの相互作用パラメータの測定勾配、及び/又は、
相互作用パラメータは、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液でアナライトサンプル溶液が構成されている場合には、以下のパラメータを備える:
j)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
【0082】
このような所定の期間は、例えば、1秒間、30秒間にわたって観測された、又は1分間以上にわたって観測された連続的な応答データを含み得て、好ましくは1秒間~1分間である。
【0083】
アナライトの初期結合応答は、アナライトサンプル溶液注入開始時に検出された分子間相互作用の結合レベルである。これは、アナライトサンプル溶液がリガンドと相互作用し始める時点である。
【0084】
アナライトの後期結合応答は、アナライトサンプル溶液注入終了時に検出された分子間相互作用の結合レベルである。
【0085】
安定初期応答は、アナライトサンプル溶液注入に続く解離段階の開始時にそれぞれ検出される分子間相互作用のレベルである。
【0086】
安定後期応答は、アナライトサンプル溶液注入に続く解離段階の終了時にそれぞれ検出される分子間相互作用のレベルである。
【0087】
図5には、アナライトサンプル溶液とリガンドとの間の理想的検出が示されている。この検出曲線には、初期結合応答、後期結合応答、安定初期、安定後期が示されている。
【0088】
計算される特徴の一つは、初期結合応答をアナライトの分子量で割ったものであり得る。小型アナライトは大型アナライトと同じほど大きな応答を有さないので、分子量で割ることによって、応答レベルが正規化される。相対応答は、可能な限りアナライト4のサイズに依存しないことが望ましい。
【0089】
アナライト結合後期応答とアナライト結合初期応答との間の差をアナライト結合初期応答で割ったものが、会合段階全体の勾配を記述する。
【0090】
ここで、a)~g)のいずれかの相互作用パラメータの測定変動とは、特定のパラメータ、例えば初期結合応答というパラメータが測定されている期間にわたって取られる標準偏差を意味する。
【0091】
ここで、a)~g)のいずれかの相互作用パラメータの測定勾配とは、特定のパラメータ、例えば初期結合応答というパラメータが測定されている期間にわたって取られる勾配を意味する。
【0092】
第一アナライトサンプル溶液セットのうちの各アナライトサンプル溶液について学習済み機械学習アルゴリズムに与えられる相互作用パラメータの数は、上記パラメータのうちの一つ以上のパラメータであり得る。例えば、初期結合応答、結合後期応答と結合初期応答の差を結合初期応答又は後期結合応答で割ったもの、後期結合応答が用いられ得る。アフィニティスクリーンにおいては、初期結合、後期結合、安定初期、又は安定後期の応答・対・濃度のプロットが、KD値を得るために定常状態モデルでフィッティング可能なデータを与える。
【0093】
応答データから抽出して学習済み機械学習アルゴリズムに与えるのが、どの相互作用パラメータになり、また、どの位多くの相互作用パラメータになるのかは、分析センサシステムのユーザによって決定され得る。代わりに、抽出して学習済み機械学習アルゴリズムに与えるのが、どの相互作用パラメータになり、また、どの位多くの相互作用パラメータになるのかは、本方法において予め決定される所定のものとなる。一般的には、相互作用パラメータの数が多くなるほど、より信頼性のある分類となる。どの相互作用パラメータにするのかの決定とパラメータの抽出は、複数の学習用応答データセットで学習させたエキスパートシステム又はANNによって行われ得る。分析の目的と、分析されるリガンドに応じて、抽出され学習済み機械学習アルゴリズムに与えられる相互作用のパラメータの数と種類は異なり得る。相互作用パラメータが互いに補完し合う場合にはより多数の相互作用パラメータを本方法で用いることで、学習済み機械学習アルゴリズムによって行われる分類が改善され得て、熟練のユーザが関連のアナライトを無関係のアナライトから区別するのに何に着目して区別しているのかが強調される。分類に寄与しないパラメータが多過ぎると、あまり良好な分類ではなくなり得る。また、上述のものではない追加のパラメータを計算して、アナライトサンプル溶液を分類するステップに含ませることも可能である。
【0094】
代わりに、これらの相互作用パラメータのうちの一つ以上を、上述の第一アナライトサンプル溶液セットのうちのアナライトサンプル溶液についての取得応答データのうち80~100%を備える相互作用パラメータと一緒に学習済み機械学習アルゴリズムに与え得る。
【0095】
アナライトサンプル溶液は、学習済み機械学習アルゴリズムによって、少なくとも一つの抽出相互作用パラメータに基づいて、アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループに分類される。
【0096】
アナライトサンプル溶液は、その結合強度や結合挙動に関して分類され得る。
【0097】
異なるクオリティ分類グループの数は一例では二つであり得て、一つ目のグループが、対象のリガンドと十分良好に相互作用するアナライトを含み、二つ目のグループが、対象のリガンドとの相互作用が悪いアナライトを含む。そして、リガンドと十分良好に相互作用するアナライトを含むグループが、更なる分析用に選択され得る。
【0098】
他の例では、クオリティ分類グループの数は100個であり得て、グループ1がリガンドとの相互作用が悪いアナライトを含み、グループ100がリガンドとの相互作用が極めて良好なアナライトを含む。ユーザが本方法の厳格性を規制して、例えば、>50にカットオフを設定することによって、分類グループ51~分類グループ100に分類されたアナライトのみが更なる分析に含まれるようになり得る。この場合も、十分良好なクオリティの相互作用が何なのかや、カットオフを何処に設定するのかは、分析/実験の目的に依存する。
【0099】
アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトサンプル溶液を分類することは、メイングループへの第一分類(例えば、更なる分析用に関連しているのか否か)、そのアナライトサンプル溶液が何故そのメイングループに分類されたのかという理由についての情報を与える第二グループを含み得て、その理由は、例えば、不確実な結合、低過ぎ又は高過ぎる屈折率、リガンドへの結合が1:1ではないこと、結合応答が無いか非常に低いこと(所定のカットライン未満)、会合における高勾配、遅い解離、混合の悪さ、R>Rmax、アナライトが超化学量論的バインダであること等である。
図5には、アナライト4のサンプル溶液とリガンド3との間の理想的検出が示されている。この検出曲線には、初期結合応答、後期結合応答、安定初期、安定後期が示されている。
図6及び
図7には、クオリティの悪いアナライトとリガンドの結合を示す曲線が示されている。
図6のアナライトサンプル溶液は、注入後に長期間に及ぶ応答を示し、更なる分析に関係しないものとしてメイングループでは分類され、リガンドに対するアナライトの副次的な望ましくない結合及び/又はアナライトの凝集を示すものとして第二グループでは分類される。
図7のアナライトサンプル溶液は、注入中にリガンドに対するアナライトの結合の増加を示し、例えば、更なる分析に関係しないものとしてメイングループでは分類され、リガンドに対するアナライトの副次的な望ましくない結合及び/又はアナライトの凝集を示すものとして第二グループでは分類される。
図8a及び
図8bに示されるアナライト溶液のシリーズでは、プロットされたデータのフィッティングが、濃度がKD値の未満と超のどちらにも存在することを明らかにしていて、少なくとも一つの濃度が飽和応答に近い。このことは、KDを、定常モデルにおけるRmaxパラメータのフィッティングによって得ることができることを示す。このシリーズは、Rmaxパラメータのフリーフィッティングを用いてデータをフィッティングするためのグループに分類される。
図9a及び
図9bに示されるドーズ応答曲線では、全ての濃度がKD値未満であり、初期フィッティング作業が、信頼できないKD値とRmax値を与える。このシリーズは、一定のRmaxパラメータでデータをフィッティングするためのグループに分類される。
【0100】
上述のもの以外の他の相互作用パラメータを抽出して、本方法において単独で又は上述の相互作用パラメータと組み合わせて使用し得る。例えば、本方法は、第一アナライトサンプル溶液セットのうちの各アナライトサンプル溶液について、少なくとも一つのリファレンス減算相互作用パラメータを抽出して、学習済み機械学習アルゴリズムに与えることを更に備え得る。
【0101】
リファレンス減算相互作用パラメータは、リガンド無しのリファレンス(例えば、リガンドが固定されていないリファレンス表面)と第一アナライトサンプル溶液セットを相互作用させて、対応の抽出相互作用パラメータから抽出リファレンス相互作用パラメータを減算することによって、得られ得る。
【0102】
リファレンス相互作用パラメータが本方法において使用され得て、少なくとも一つのリファレンス相互作用パラメータは以下のうちのいずれか一つ以上を備える:
k)リファレンスの初期結合応答、
l)リファレンスの後期結合応答、
m)リファレンスの安定初期応答、
n)リファレンスの安定後期応答、
o)リファレンスの結合後期応答とリファレンスの結合初期応答の差をリファレンスの結合初期応答で割ったもの、及び/又は、
そのアナライトサンプル溶液が、同じアナライトでアナライト濃度が異なる複数のアナライトサンプル溶液によって構成されている場合には、リファレンス相互作用パラメータは、以下のものを備える:
p)複数のアナライトサンプル溶液からの最大結合能を用いて計算された平衡解離定数。
【0103】
リファレンス相互作用パラメータは、リガンド無しのリファレンス(例えば、リガンドが固定されていないリファレンス表面)と第一アナライトサンプル溶液セットを相互作用させて、得られたリファレンス応答データのセットからリファレンス相互作用パラメータを抽出することによって、得られ得る。このような相互作用パラメータを本方法に追加することによって、不確実な結合や混合の悪さを検出する確率を向上させ得る。
【0104】
リガンドとネガティブコントロール(陰性対照)溶液の相互作用から得られるネガティブコントロール相互作用パラメータを本方法において使用し得る。
【0105】
少なくとも一つのネガティブコントロール溶液は、リガンドに対する既知の非親和性(non‐affinity)を有するアナライトを含むか、アナライトを含まないものであり得て、例えばバッファ溶液であり得る。ネガティブコントロール相互作用パラメータは、例えば、ネガティブコントロールに基づく境界レベルであり得る。これは、ネガティブコントール注入時の平均応答レベルに所定数の標準偏差(典型的には三)を掛けたものであり、分子間相互作用の存在を確認することができなくなる結合レベル限界を定める。ネガティブコントロールを有する相互作用パラメータは、サンプルとシステムランニングバッファとの間のバッファ整合の取り扱いの悪さ、サンプル及び/又はシステムの汚染、リガンドの変化、分子間相互作用に関係しない実験信号を検出することを目的としている。また、ネガティブコントロールは、境界レベルを決定し、これは、対象のヒット候補を非バインダ(境界未満)から区別するのに用いられる。
【0106】
リガンドとポジティブコントロール(陽性対照)溶液の相互作用から得られるポジティブコントロール相互作用パラメータを本方法において使用し得る。
【0107】
少なくとも一つのポジティブコントロール溶液は、リガンドに対する既知のアフィニティ、結合挙動を有するアナライトサンプルを含む。ポジティブコントールは、アナライトサンプル溶液と同じ分子濃度を有し得るが、これは実際には稀である。ポジティブコントロール相互作用パラメータは、例えば、ポジティブコントールに基づく境界レベルであり得て、これは、リガンドとポジティブコントロールとの間で検出される各分子間相互作用についての平均結合レベルであり、未知のサンプルが関係し得る既知の結合レベルを定め、又は、ポジティブコントロールの化学量論が確立されている場合において未知のサンプルの化学量論を確立する。ポジティブコントール相互作用パラメータは、固定ターゲットの結合能、応答の再現性を観測して、化学量論的応答レベルを設定することを目的としている。
【0108】
上述の相互作用パラメータを用いることに加えて、BIACORE(登録商標)等の表面プラズモン共鳴型分析システムを用いる場合には、アナライトサンプルの分析中に溶媒補正相互作用パラメータを学習済み機械学習アルゴリズムに与えることが必要となり得る。溶媒補正の必要性は、リガンドの量が多く(リガンド無しのリファレンスと比較して)、溶媒のバルク屈折率寄与が予測アナライト応答と比較して高い場合に生じ得る。バルク溶液は、活性(アクティブ)表面上のリガンドが占有する体積空間から排除されるので、活性表面とリファレンス表面に対するバルク寄与は僅かに異なり、リファレンス減算応答に小さな誤差を生じさせる。サンプルの屈折率が一定である限り、リファレンス減算応答の誤差も一定であり、実際的な目的にとっては無視可能である。しかしながら、サンプルの屈折率が変わる場合には、誤差の大きさも変わる。バッファに1%DMSO(ジメチルスルホキシド)を加えると、略1200RUのバルク応答が与えられるので、低分子量サンプルからの予測応答(1RU程度の低いものであり得る)に関して、DMSO含量の小さな変動がバルク応答の顕著な変動に繋がる。このような変動は、スクリーニング用の薬の候補やフラグメント等のサンプルの準備中に避けるのが困難なものである。
【0109】
溶媒補正は、活性表面とリファレンス表面上に或る範囲の溶媒濃度を有する複数のブランクサンプルのシリーズを注入することによって求められ得る。リファレンス表面上の絶対応答に対する活性表面上の相対的なリファレンス減算応答のプロットが、バルク寄与に対するリファレンス減算の誤差を較正する。そして、この較正を用いて、測定サンプル応答を補正する。ラン(泳動)の開始時及び終了時に、並びにラン中の規則的な間隔において溶媒補正サイクルを行うことが推奨される。このようにして、所与のサンプルサイクルが、二つの溶媒補正サイクルの間にあるようになる。所与のサンプルサイクルについての補正因子は、その前後の補正サイクルの曲線間の内挿によって求められ、泳動過程における溶媒補正因子のドリフトを補償する。
【0110】
分析センサシステム20は、機械学習アルゴリズムの学習(訓練)のための学習用センタ15を更に備え得る。少なくとも一つのリガンドと第二アナライトサンプル溶液セットとの間の相互作用から得られた取得応答データセットの少なくとも一部から抽出された相互作用パラメータのセットと、第二アナライトサンプル溶液セットの各アナライトサンプル溶液についてのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループを用いて、機械学習アルゴリズムを学習させる(200)。
【0111】
学習済み機械学習アルゴリズムは、熟練のユーザがアナライトサンプル溶液をクオリティ分類グループに分類するやり方を模倣する。その学習は、標準的な機械学習アルゴリズムの学習法であり得て、データセット全体を学習用セットと検証用セットに分け、そのうち80%のデータが学習用に用いられ、20%のデータが検証用に用いられる。機械学習アルゴリズムは、学習用データで学習させるべきであって、検証用セットで学習させてはならない。
【0112】
図11a~
図11cに示されるようなグラフィック要素を用いて機械学習アルゴリズムを更に学習させ得て、理論的結合曲線に対する比較、結合とリファレンスに対する結合の同時表示、異なる複数の定常状態モデルを用いることに基づいたKD値に対応するドーズ応答プロットのライン等を含むパラメータ割り当てをサポートするようにし得る。生成されたモデルによって、
図11eに示されるようにグラフィック要素を通じて分類を簡単に変更することができる。
【0113】
図11a及び
図11bでは、ゴースト曲線がセンサグラムに示されている。ゴースト曲線は、質量移動を含む1:1結合モデルでシミュレーションされた典型的なフラグメントプロファイルである。Rmaxをスケーリングして、実際のセンサグラムとシミュレーション曲線を直接比較できるようにしている。
【0114】
本方法は、
図11dに示されるように分類のセットを可視化するためのデータのフィルタリングとタブも含み得る。
【0115】
コンピュータプログラムは、グラフィック要素(
図11a~
図11c)を用いて、理論的結合曲線に対する比較、結合とリファレンスに対する結合の同時表示、及び/又は、異なる複数の定常状態モデルを用いることに基づいたKD値に対応するドーズ応答プロットのライン等のパラメータ割り当てをサポートし得る。
【0116】
機械学習アルゴリズムは、ディシジョンツリー(決定木)、k近傍法(kNN)、ランダムフォレスト、K平均法、勾配ブースティングアルゴリズム、人工ニューラルネットワーク(ANN)、ディープラーニングアルゴリズム、又はこれらの組み合わせから成る群から選択され得る。
【0117】
機械学習アルゴリズムを、或る分析センサシステムからのデータを用いて学習させて、別の分析センサシステムからのデータを分類するのに用い得る。代わりに、学習用のデータと、機械学習アルゴリズムによって分類されるデータは、同じシステムによって得られ、又は少なくとも同じ種類のシステムによって得られ得る。
【0118】
機械学習アルゴリズムを学習させる際には、第二アナライトサンプル溶液セットを用いる。第二アナライトサンプル溶液セットと第一アナライトサンプル溶液セットは、アナライトサンプル溶液の数とアナライトの種類の両方において異なり得る。機械学習アルゴリズムを学習させる際に用いられるリガンドは、第一アナライトサンプル溶液セットとの相互作用に用いられるものと同じであり得る。代わりに、用いられるリガンドは、第一アナライトサンプル溶液セットとの相互作用に用いられないリガンドであり得る。
【0119】
第二アナライトサンプル溶液セットは、複数の異なるアナライトサンプル溶液を含み得る。好ましくは、第二アナライトサンプル溶液セットは、10個以上、100個以上、500個以上の異なるアナライトサンプル溶液を含み得る。学習に用いられるアナライトサンプル溶液の数が多いほど、第一アナライトサンプル溶液セットのアナライトサンプル溶液の分類が良好になる。
【0120】
機械学習アルゴリズムの学習用に、どの相互作用パラメータを用いるのか、また、アナライトサンプル溶液毎にどのくらい多くの相互作用パラメータを用いるのかは、機械学習アルゴリズムの使用目的に依存し得る。一般的には、学習に用いる相互作用パラメータの数が多いほど、第一アナライトサンプル溶液セットのアナライトサンプル溶液の分類が良好になる。どの相互作用パラメータにするのかの決定とそのパラメータの抽出は、分析システムのエキスパートユーザによって行われ得て、又は、複数の学習用応答データセットで学習済みのエキスパートシステムやANNによって行われ得る。
【0121】
機械学習アルゴリズムを学習させるのに用いられる相互作用パラメータの種類は、第一アナライトサンプル溶液セットのアナライトサンプル溶液について学習済みの機械学習アルゴリズムに与えられるものと同じであり得る。代わりに、用いられる相互作用パラメータの数及び/又は種類が異なり得る。機械学習アルゴリズムを、第一アナライトサンプル溶液セットのアナライトサンプル溶液の実際の分類に用いられるよりも多くの相互作用パラメータのセットで学習させ得る。
【0122】
第一アナライトサンプルセットから抽出される上述のパラメータの種類は、機械学習アルゴリズムの学習用の第二アナライトサンプルセットから抽出され得る。また、機械学習アルゴリズムには、上述のように、リファレンス減算相互作用パラメータ、リファレンス相互作用パラメータ、ネガティブ相互作用パラメータ、ポジティブ相互作用パラメータ、溶媒補正も与えられ得る。また、機械学習アルゴリズムには、第二アナライトサンプル溶液セットの各アナライトサンプル溶液について、そのアナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループが与えられる。第二アナライトサンプルセットの各アナライトサンプル溶液のクオリティ分類グループの決定は、分析システムのエキスパートユーザによって行われ得て、又は、複数の学習用応答データセットで学習済みのエキスパートシステムやANNによって行われ得る。
【0123】
異なるクオリティ分類グループの数は一例では二つであり、一つ目のグループが対象のリガンドと十分良好に相互作用するアナライトを含み(
図4a及び
図4bを参照)、二つ目のグループが対象のリガンドとの相互作用が悪いアナライトを含む(
図5及び
図6を参照)。十分良好であるとの分類は、そのアナライトが更なる分析の対象となり得ることを示す。
【0124】
他の例では、クオリティ分類グループの数は100個となり得て、グループ1がリガンドとの相互作用が悪いアナライトを含み、グループ100がリガンドと極めて良好に相互作用するアナライトを含む。
【0125】
アナライトサンプル溶液とリガンドの相互作用を示す少なくとも一つのクオリティ分類グループにアナライトサンプル溶液又は溶液のシリーズを分類することは、メイングループへの第一分類(例えば、更なる分析用に関連しているのか否か)、そのアナライトサンプル溶液が何故そのメイングループに分類されたのかという理由についての情報を与える第二グループを含み得て、その理由は、例えば、不確実な結合、低過ぎ又は高過ぎる屈折率、リガンドへの結合が1:1ではないこと、結合応答が無いか非常に低いこと(所定のカットライン未満)、会合における高勾配、遅い解離、混合の悪さ、R>Rmax、アナライトが超化学量論的バインダであること、KDを超える濃度、KDを決定するには少な過ぎる濃度、定常状態分析において信頼できないパラメータ等である。
【0126】
同じ機械学習アルゴリズムが、ヒットであるか否や、何故ヒットではないのかを等の複数のグループへの分類を行い得る。代替案は、二つの機械学習アルゴリズムを、一方をアナライトの分類用に、他方を更なる分析に関連しないものとしてアナライトが分類された理由の説明用に学習させて、それら学習済みの機械学習アルゴリズムを組み合わせることである。機械学習アルゴリズムを学習させる際には各相互作用パラメータの統計的尺度を使用し得る。
【0127】
そして、このように学習させた機械学習アルゴリズムは、第一アナライトサンプル溶液セットからのアナライトサンプル溶液を、そのアナライトサンプル溶液とリガンドとの相互作用を示すクオリティ分類グループに分類する。BLSやアフィニティスクリーン分析において、アナライト候補のライブラリの概観を与えるために数百のアナライトサンプル溶液が分析される場合、本方法は、更なる処理用に関連しているか否かのアナライト候補の高速分類を提供する。更に、候補アナライトの評価が、あまりユーザ依存のものではなくなり、観測された分子間相互作用の評価において熟練のユーザが補助されるようなものではなくなり得る。
【0128】
非限定的な一例として、10個の隠れニューロンを有する一つの隠れ層ニューラルネットワークを含み学習率が0.001である機械学習アルゴリズムを用いた(SciSharp.Tensorflow.Redist v1.15.1とTensorflow.NET v0.13.0NuGetパッケージを用いた)。この例では、複数の異なるアナライトサンプル溶液とリガンドとしての肝炎酵素NS5B1b(RNA依存型RNAポリメラーゼ,サブタイプ1b)との間の相互作用を観測した。457個のアナライトサンプル溶液と、64個のポジティブコントロールと、136個のネガティブコントロールについてのデータを含むデータセットを、学習用セット(第二アナライトサンプル溶液セット)と検証用セット(第一アナライトサンプル溶液セット)に分け、そのうち80%のデータを学習用に用いて、20%のデータを検証用に用いた。
【0129】
この例において学習用と検証用の両方のために抽出され使用された相互作用パラメータは、ポジティブコントロールの後期結合応答で割った初期結合応答、結合後期応答と結合初期応答の差異を結合初期応答で割ったもの、安定初期応答、安定後期応答、結合後期応答と結合初期応答の差、リファレンスの後期結合応答、リファレンスの安定後期応答、リファレンスの後期結合応答とリファレンスの初期結合応答の差、全ネガティブコントールの五つの標準偏差での全ネガティブコントールの平均結合で割った結合初期、初期結合応答の測定変動(標準偏差)であった。
【0130】
更に、学習用に用いた各アナライトサンプル溶液について、アンライトサンプル溶液とリガンドの相互作用を示すクオリティ分類グループを機械学習アルゴリズムに与えた。ここで、サンプル溶液は二つのクオリティ分類グループに分類され、一つ目のグループがリガンドと十分良好に相互作用するアナライトを含み、二つ目のグループがリガンドとの相互作用が悪いアナライトを含んでいた。
【0131】
このようにして学習させた機械学習アルゴリズムに対して検証用データセットを用いたところ、特異度が96%であり、感度が93%であった。
【0132】
これらのモデルを継続的に学習させて発達させることによって、熟練のユーザが、分類の成果を容易に修正し、よりユーザの好みに合うようにモデルを再学習させることができる。更に、上述の学習済み機械学習アルゴリズムを用いて、検出アナライトサンプルを分類することによって、特に多量のアナライトサンプルが分析に存在する場合において分類プロセスが高速化され得て、評価結果が、あまりユーザ依存のものではなくなり、観測された分子間相互作用の評価において熟練のユーザが補助されるようなものではなくなり得る。
【0133】
上記説明は複数の特徴を含むものであるが、それらは本開示のコンセプトの範囲を限定するものではなくて、単に本開示のコンセプトの一部実施形態の例を例示するものに過ぎない。本開示のコンセプトの範囲は、当業者にとって自明となり得る他の実施形態を完全に包含するものであって、本開示のコンセプトの範囲は限定的なものではない。単数形での或る要素への言及は、特に断らない限り、一つ又は一つのみを意味するものではなく、一つ以上を意味するものである。上述の実施形態の要素の当業者にとって既知のあらゆる構造的及び機能的な均等物は本願に明示的に組み込まれ包含されているものである。
【国際調査報告】