(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-31
(54)【発明の名称】試料の定量分析における、またはこれに関する改善
(51)【国際特許分類】
G01N 33/68 20060101AFI20231024BHJP
G16B 40/20 20190101ALI20231024BHJP
【FI】
G01N33/68
G16B40/20
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023517319
(86)(22)【出願日】2021-09-16
(85)【翻訳文提出日】2023-05-09
(86)【国際出願番号】 GB2021052400
(87)【国際公開番号】W WO2022058731
(87)【国際公開日】2022-03-24
(32)【優先日】2020-09-16
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】518296506
【氏名又は名称】フルイディック・アナリティクス・リミテッド
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(72)【発明者】
【氏名】モルグノフ,アレクセイ
(72)【発明者】
【氏名】モーリング,サイモン
【テーマコード(参考)】
2G045
【Fターム(参考)】
2G045AA25
2G045CA26
2G045CB01
2G045CB04
2G045CB07
2G045CB12
2G045DA36
2G045FA34
2G045FB03
2G045FB06
2G045FB12
(57)【要約】
試料の定量分析を改善するためのシステムが提供される。本システムは、デバイス、データストア、および本システムを動作させるように構成される処理回路を備える。デバイスは、定量分析データを提供するために流体試料について溶液中の生体高分子相互作用の定量分析を実施するように構成される。データストアは、複数の個人に関する個人データ、および生体高分子相互作用に関するデータを格納する。処理回路は、データストアにアクセスし、試料に関連性のあるデータを識別および取得し、上記取得されたデータに基づいて、パラメータを設定し、パラメータの下で、試料の定量分析がデバイス内で実施され、デバイスから定量分析の予測結果を作成するために一般モデルを使用して分析を実施し、デバイスから試料の定量分析データを受信し、デバイスから受信される上記定量分析を予測結果と比較し、比較の出力および上記受信された定量分析データのうちの少なくとも一方で上記データストアを、更新するように構成される。
【特許請求の範囲】
【請求項1】
試料の定量分析を改善するためのシステムであって、
定量分析データを提供するために流体試料について溶液中の生体高分子相互作用の定量分析を実施するように構成されるデバイスと、
データストアであって、
複数の個人に関する個人データ、
生体高分子相互作用に関するデータ
を格納する、データストアと、
処理回路であって、
前記データストアにアクセスし、前記試料に関連性のあるデータを識別および取得し、
前記取得されたデータに基づいて、パラメータを設定し、前記パラメータの下で、前記試料の前記定量分析が前記デバイス内で実施され、
前記デバイスから前記定量分析の予測結果を作成するために一般モデルを使用して分析を実施し、
前記デバイスから前記試料の定量分析データを受信し、
前記デバイスから受信される前記定量分析を前記予測結果と比較し、
前記比較の出力および前記受信された定量分析データのうちの少なくとも一方で前記データストアを更新する
ように構成される、処理回路と
を備える、システム。
【請求項2】
前記デバイスから受信される前記定量分析と前記予測結果との前記比較の前記出力は、前記予測結果の確認である、請求項1に記載のシステム。
【請求項3】
前記デバイスから受信される前記定量分析と前記予測結果との前記比較の前記出力は、前記予測結果からの逸脱である、請求項1に記載のシステム。
【請求項4】
前記分析を実施するように構成される回路は、機械学習アルゴリズムを備える、請求項1~3のいずれか一項に記載のシステム。
【請求項5】
前記試料は、個人から獲得され、前記処理回路は、患者のための臨床的に関連性のあるデータを生成するために、前記デバイスから受信される前記定量分析データのさらなる分析を実施するように構成される、請求項1~4のいずれか一項に記載のシステム。
【請求項6】
前記処理回路は、分析される前記個人の試料に関する前記個人データを更新するようにさらに構成される、請求項5に記載のシステム。
【請求項7】
生体高分子相互作用に関する前記データは、個人からの匿名データおよび実験データを含む、請求項1~6のいずれか一項に記載のシステム。
【請求項8】
前記データストア内の各データ点は、関連付けられた正確性スコアを有し、前記データストアを更新するステップは、前記正確性スコアを更新することを含む、請求項1~7のいずれか一項に記載のシステム。
【請求項9】
前記システムによって生成される各予測結果は、関連付けられた正確性スコアを有する、請求項1~8のいずれか一項に記載のシステム。
【請求項10】
生体高分子相互作用に関する前記データは、隣接データに基づいた予測データを含む、請求項1~9のいずれか一項に記載のシステム。
【請求項11】
前記個人データは、診療記録、年齢、性別、体重、疾病状態、疾病重症度、処方された薬の固有性、および対応する投与計画のうちの1つまたは複数を含む、請求項1~10のいずれか一項に記載のシステム。
【請求項12】
前記試料は、細胞培養物である、請求項1~11のいずれか一項に記載のシステム。
【請求項13】
前記試料は、体液である、請求項1~12のいずれか一項に記載のシステム。
【請求項14】
前記機械学習アルゴリズムは、疾病状態などの臨床的に関連性のある出力に関する複数の特定モデルを含む、請求項4~13のいずれか一項に記載のシステム。
【請求項15】
前記機械学習アルゴリズムは、前記デバイスによって実行される各定量分析が特定モデルおよび一般モデルの両方を通知するように構成される、請求項4~14のいずれか一項に記載のシステム。
【請求項16】
前記試料の前記定量分析は、生体高分子相互作用の親和性の測定を含む、請求項1~15のいずれか一項に記載のシステム。
【請求項17】
前記試料の前記定量分析は、前記試料内の目的の生体高分子の濃度の測定を含む、請求項1~16のいずれか一項に記載のシステム。
【請求項18】
前記試料の前記定量分析は、前記試料の異質性の分析を含む、請求項1~17のいずれか一項に記載のシステム。
【請求項19】
前記機械学習アルゴリズムによって設定される前記パラメータは、試料調製パラメータを含む、請求項4~18のいずれか一項に記載のシステム。
【請求項20】
前記機械学習アルゴリズムによって設定される前記パラメータは、デバイス条件を含む、請求項4~19のいずれか一項に記載のシステム。
【請求項21】
前記機械学習アルゴリズムによって設定される前記パラメータは、前記分析の結果の予想を設定することを含む、請求項4~20のいずれか一項に記載のシステム。
【請求項22】
前記デバイスは、分配された試料を作成するために試料流体および補助流体の組み合わせおよび分配、ならびに前記分配された試料の2つ以上の部分へのその後の分割、ならびに前記部分のうちの少なくとも1つの測定を可能にするように構成される微小流体ネットワークを備える、請求項1~21のいずれか一項に記載のシステム。
【請求項23】
前記分配は、拡散、電気泳動または磁気泳動、熱拡散、クロマトグラフィ、および等電点電気泳動のうちの1つまたは複数によってもたらされる、請求項1~22のいずれか一項に記載のシステム。
【請求項24】
前記デバイスは、前記分配された試料を3つ以上の部分へ分割するように構成され、測定は、各分割された部分に対して実行される、請求項1~23のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料の定量分析に関し、特に、改善された実験設計につながる情報収集および知識処理における改善に関する。
【背景技術】
【0002】
診断は、歴史的に、疾病の存在または不在、免疫の存在または不在などを識別する実質的に二値のフィールドであった。しかしながら、生物医学データのフィールドは、多次元で複雑であり、二値出力ではシステムの複雑性および微妙な差異を捕捉するには不十分であるケースが増えている。
【0003】
近年では、様々な疾病のためのより高度な診断/医療ツールを開発するのを助けるために、タンパク質などの生体分子同士の相互作用について多くの研究が行われた。タンパク質-タンパク質相互作用(PPI)は、タンパク質自己組立、タンパク質凝集、抗体-抗原認識、筋肉収縮および細胞通信を含む、多くの生物学的および生理学的に関連性のあるプロセスの基礎を形成する。それにもかかわらず、タンパク質-タンパク質相互作用を、特に複合培地内の生理学的条件下で、研究することは、いまだに困難である。酵素結合免疫吸着検査法(ELISA)ビーズベースのマルチプレックスアッセイおよび表面プラズモン共鳴(SPR)分光学などの現在の技術は、1つの結合相手の固定化に依拠する。これらの技術は、偽陽性結果を引き起こし得る表面との潜在的な非特異相互作用、および偽陰性結果を引き起こすフック/プロゾーン効果を含み、以て、半定量分析のみを可能にする。
【0004】
現在、臨床タンパク質検出および定量化のためのすべての周知の手法は、例えば、ELISAアッセイのように、表面固定化またはビーズ固定化に依拠するアッセイに関与する。ELISAアッセイは、比較的高い感度を達成することができる一方で、それらは、生理学的に関連性のあるプロセスが溶液中で起こるにもかかわらず、溶液中の結合相互作用を説明する生体物理パラメータを決定することができない。
【0005】
代替の戦略は、タンパク質分子を検出するための抗体ペアの使用、および相対強度を読み出すためのフローサイトメトリーのために開発された装置の使用を含め、感度強化を達成するために出現した。しかしながら、これらのアッセイは、依然としてビーズの表面で実施され、したがって、上に説明される表面ベースの技術の通常の欠点に遭遇する。加えて、これらの技術は、しばしば時間がかかる。
【0006】
機械学習アルゴリズムは、タンパク質-タンパク質相互作用研究、ならびに特に、異なる生物学的プロセスに関わるタンパク質機能および経路の研究のためだけでなく、疾病の原因および進行を理解するために、近年使用されている。いくつかの実験技術は、PPIの識別のために用いられているが、これらは、二値出力に限定され、患者のための意義のある結果を提供するにはPPIにおける生体物理特性の識別、分析、および予測においてギャップが依然として存在する。
【0007】
故に、公にある利用可能な生体物理データ、ならびに完全に定量的な様式にある、体液中の生体指標およびそれらの特定の標的など、生体分子相互作用の間の測定された生体物理特性に基づいて、患者に対する結果を照合、分析、および推奨するために使用され得る溶液中プラットフォームを提供する必要性がある。
【0008】
さらには、利用可能な生物医学データの幅の増加の微妙な差異を理解することは、治療計画が患者の個々の生物医学データを考慮するように調整され得るように、疾病進行および監視に対するより個人化された手法を可能にする。
【発明の概要】
【発明が解決しようとする課題】
【0009】
このような背景に対して生じたのが本発明である。
【課題を解決するための手段】
【0010】
本発明によると、試料の定量分析を改善するためのシステムが提供され、本システムは、提供された定量分析データへの流体試料について溶液中の生体高分子相互作用の定量分析を実施するように構成されるデバイスと、データストアであって、複数の個人に関する個人データ、生体高分子相互作用に関するデータを格納する、データストアと、処理回路であって、データストアにアクセスし、試料に関連性のあるデータを識別および取得し、上記取得されたデータに基づいて、パラメータを設定し、パラメータの下で、試料の定量分析がデバイス内で実施され、デバイスから定量分析の予測結果を作成するために一般モデルを使用して分析を実施し、デバイスから試料の定量分析データを受信し、デバイスから受信される上記定量分析を予測結果と比較し、比較の出力および上記受信された定量分析データのうちの少なくとも一方で上記データストアを更新する、ように構成される、処理回路と、を備える。
【0011】
デバイスから受信される定量分析と予測結果との比較の出力は、予測結果の確認であり得る。逆に、デバイスから受信される定量分析と予測結果との比較の出力は、予測結果からの逸脱であり得る。
【0012】
上記分析を実施するように構成される回路は、機械学習アルゴリズムを備え得る。
試料の定量分析は、標識の存在または不在の単なる二値分類よりもはるかに大きい洞察を可能にする。定量分析は、生体指標の単なる存在または不在を超越する、より微妙な差異を明らかにする診断ツールをもたらす。
【0013】
データストアは、様々なソースから描写され、知能ループのすべてに関与する、絶え間なく発展する情報レポジトリである。たとえそれが、低信頼実験データのみで開始するとしても、これは、何らかの値、および、デバイスが試料の定量分析に着手するとき、知識ストアを増補するために使用されるこの分析から収集される追加のデータ、を追加するのには十分である。
【0014】
システムが臨床的に関連性のある出力を提供するよう動作するために、データストアは、複数の個人に関する個人データを含む。このデータは、薬、病歴、疾病状態および重症度、年齢、性別、ならびに体重を含む、診療記録から任意の関連性のある情報を含み得る。例えば疾病状態に関する、追加のデータは、それらがシステムによって計算されるとき、データストアに追加され得、以て、患者の疾病状態が経時的に追跡されることを可能にする。
【0015】
一般モデルは、例えば、タンパク質-タンパク質相互作用自体に関する。モデルのソースは、システム自体から、所有者データセットとして、または第三者ライブラリデータセットからのいずれかの、任意の実験または患者データを含み得る。タンパク質-タンパク質相互作用自体に一般的なモデルの作成はまた、欠陥データが既存データの補間によって予測されることを可能にする。補間または予測されたデータ点の正確性スコアは、これらのデータ点の性質を反映する。
【0016】
患者に焦点を合わせたシステム配備において、試料は、個人から獲得され得、処理回路は、患者のための臨床的に関連性のあるデータを生成するために、デバイスから受信される定量分析データのさらなる分析を実施するように構成され得る。
【0017】
臨床的に関連性のあるデータまたは出力は、提供される流体試料内の、例えば、抗体などの、主要な生体指標のしきい値レベルの存在または不在を確認する二値結果の形態をとり得る。さらには、臨床的に関連性のあるデータはまた、試料内で識別される生体指標の量を提供し得る。
【0018】
追加的または代替的に、臨床的に関連性のある出力は、以前に診断された疾病状態の重症度における漸進的変化に関し得る。これは、疾病の変化の速度に関する情報を含み得る。疾病状態に関するこの情報はまた、識別された疾病重症度に基づいて推奨投薬量調整の形態で臨床的に関連性のある出力を提供するために、薬の投与計画に関する情報を含むその個人のための個人データと組み合わされ得る。
【0019】
処理回路は、分析される個人の試料に関する個人データを更新するようにさらに構成され得る。これは、個人レベルでのフィードバックループの閉鎖を提供する。データストア内に保持される個人の個人データは、試料の新規定量分析で拡張される。このデータは、処理された結果および試料の定量分析から導出される他のメタデータと一緒に、個人の記録と共に格納される。
【0020】
システムと共に配備されるデータソースに関連して、生体高分子相互作用に関するデータは、個人からの匿名データおよび実験データを含み得る。
本発明の文脈において、用語「生体高分子相互作用」は、タンパク質、ペプチド、アプタマー、核酸、および抗体の間のラベル化変異株を含む、天然型、またはそれらの任意の化学修飾派生物のいずれかにおける、すべての相互作用を説明するために使用される。各相互作用は、同じタイプまたは異なるタイプの2つの生体高分子の間であってもよい。タンパク質-タンパク質相互作用は、タンパク質-ペプチド相互作用と同様に、生体高分子相互作用である。高分子は、天然または合成であり得る。高分子のうちの1つは、プローブを含み得、これはラベル化され得る。
【0021】
データストア内の各データ点は、関連付けられた正確性スコアを有し得、データストアを更新するステップは、正確性スコアを更新することを含む。正確性スコアは、例えば、データが、そのシステムに含まれるものと類似したデバイスを使用して獲得されたか、または異なるデバイスを使用して獲得されたか、データのソースに関してアルゴリズムを通知する。正確性スコアは、データが、年齢、性別、体重、疾病状態、疾病重症度などの1つまたは複数の因子に関連して、試料と相関するかどうか、アルゴリズムをさらに通知する。
【0022】
システムによって生成される各予測結果は、関連付けられた正確性スコアを有し得る。予測結果内の正確性スコアは、データの正確性に関する基本的もしくは偶然性誤差、および新規データ点が訓練データセットから開発されるような既存モデルにどれくらい近いかに関する認識的誤差の両方を考慮する。
【0023】
生体高分子相互作用に関するデータは、隣接データに基づいた予測データを含み得る。データのサブセットの正確性スコアが十分に高く、したがって、そのデータの正確性における信頼が十分に高い場合、機械学習アルゴリズムは、データ空間内で隣接する予想結果の予測を、高信頼度を有する既存のデータ点に提供するように構成される。
【0024】
個人データは、診療記録、年齢、性別、体重、疾病状態、疾病重症度、処方された薬の固有性、および対応する投与計画のうちの1つまたは複数を含み得る。
データストア内に含まれ得る事前情報が多いほど、システムは、個人からの試料をより正確に分析することができる。一般に、所与の個人のための分析のために提供される後続試料は、より正確な事前情報が利用可能であることから、より良好に調節されたパラメータを用いて評価され得る。機械学習アルゴリズムは、したがって、データストアからの個人データを事前情報の一部と見なすことができ、例えば、疾病状態および重症度に基づいた実験データからの、類似と見なされるデータにあまり依拠しない。
【0025】
試料は、細胞培養物であってもよい。細胞培養物試料は、それらが、目的の試薬のみを含むように調整され得るためにあまり複雑ではない場合があることから、一般モデルを通知するのに非常に重要であり、したがって、定量分析は、副反応または他のスプリアス信号によって不透明にされるべきではない。
【0026】
試料は、体液であってもよい。特に、試料は、血清および血漿を含む血液であってもよく、もしくはこれから派生されてもよく、またはそれは、CSF、唾液、汗、便、または尿であってもよい。
【0027】
システム内に配備されるモデルに関連して、機械学習アルゴリズムは、疾病状態などの臨床的に関連性のある出力に関する複数の特定モデルを含み得る。これらのモデルは、疾病重症度、疾病発症の予測を可能にする、患者の階層化を含む様々な結果を可能にすることができる。これらのモデルはまた、特定の疾病状態に関連した個人のリスクに関してリスク評価を提供することができる。
【0028】
機械学習アルゴリズムは、デバイスによって実行される各定量分析が特定モデルおよび一般モデルの両方を通知するように構成され得る。これは、システムによって実行される各定量分析が、データストア内へフィードバックされ、また、特定モデルおよび一般モデルを通知する、フィードバックループの閉鎖である。例えば、定量分析が特定の個人の試料において実行されていた場合、分析の出力は、その個人の個人データに追加される。加えて、データは、その疾病の改善された特定モデルを介して、同様の疾病状態または重症度を有する他の個人に関連した特定モデルを通知するためにアクセス可能である。さらには、タンパク質-タンパク質相互作用自体に関するデータは、一般モデルにとってアクセス可能である。
【0029】
システム上で実行される定量分析に関連して、試料の定量分析は、生体高分子相互作用の親和性の測定を含み得る。
追加的または代替的に、試料の定量分析は、試料内の目的の生体高分子の濃度の測定を含み得る。
【0030】
追加的または代替的に、試料の定量分析は、試料の異質性の分析を含む。試料の異質性は、限定されるものではないが、アイソフォーム、翻訳後修飾、異なる化学量論、余剰結合相手、スプライスアイソフォームの存在、および/またはこれらの程度を含み得る。試料の定量分析は、電荷、移動性、流体力学的半径、タンパク質内のアミノ酸含有量、タンパク質の蛍光の分析をさらに含み得る。
【0031】
機械学習アルゴリズムによって設定されるパラメータに関連して、これらは、試料調製パラメータを含み得る。試料調製パラメータは、限定されるものではないが、滴定濃度、緩衝液濃度および/または緩衝液のpHなどの緩衝液組成、塩、界面活性物質、共溶媒、および有機分子を含むがこれに限定されない反応混合物に追加される任意の他の化学成分の固有性および濃度、時間および温度などの反応条件、生または凍結としての試料の状態を含む検査試料自体に対して実施される任意の調製、特定の成分のろ過、遠心分離、破壊のうちの1つまたは複数を含むがこれらに限定されない、実行される準備ステップ、ならびに精製、格納条件の規定化のうちの1つまたは複数を含むがこれらに限定されない追加されたラベル成分に対して実施される任意の調製、流量および試料および/または緩衝液の流量を含み得る。例において、S1タンパク質は、ACE2タンパク質と複合体形成状態にあり、ここでは、抗体を含有する血清の滴定が、複合体に追加され得る。この例において機械学習アルゴリズムによって変化され得るパラメータは、ラベル化されないS1タンパク質の濃度、ラベル化されるACE2タンパク質の濃度、および血清の濃度、すなわち、滴定の程度を含む。パラメータは、実験が最も豊富なデータ出力を提供するのに好適な条件下で実行されることを確実にするために変化される。
【0032】
代替的または追加的に、機械学習アルゴリズムによって設定されるパラメータは、デバイス条件を含み得る。デバイス条件は、限定されるものではないが、アッセイが実施される温度、印加される電圧、観察が発生する波長(複数可)、微小流体デバイスの流路壁に成分が付着するのを防ぐために使用され得る防着物質を含む。
【0033】
代替的または追加的に、機械学習アルゴリズムによって設定されるパラメータは、限定されるものではないが、使用される蛍光色素分子のタイプなどのラベルの選択、およびしたがって、データの読み出しが最適化される波長を含み得る。さらには、パラメータは、HSAなどの1つまたは複数の添加物を含み得る。
【0034】
代替的または追加的に、機械学習アルゴリズムによって設定されるパラメータは、限定されるものではないが、分析の結果の予想を設定することを含み得る。予想の設定は、データストア内からの事前情報に基づく。予想の信頼度は、データストア内の関連性のあるデータの正確性スコアの影響を受ける。デバイスが、続いて定量分析に着手するとき、分析は、予想を確認し得るか、またはそれは、予想から逸脱し得る。分析の結果が予想から逸脱する後者の場合、これは、さらなる定量分析が着手されることを結果として引き起こし得、このことが、システムによって開発されるモデルをさらに通知し得る。
【0035】
システム内に配備されるデバイスに関連して、デバイスは、分配された試料を作成するために試料流体および補助流体の組み合わせおよび分配、ならびに分配された試料の2つ以上の部分へのその後の分割、ならびにその部分のうちの少なくとも1つの測定を可能にするように構成される微小流体ネットワークを備え得る。
【0036】
分配は、拡散、電気泳動または磁気泳動、熱拡散、クロマトグラフィ、および等電点電気泳動のうちの1つまたは複数によってもたらされ得る。限定されるものではないが、サイズ排除クロマトグラフィおよび逆相クロマトグラフィを含む、様々な異なるクロマトグラフィ技術も適用可能であり得る。
【0037】
デバイスは、分配された試料を3つ以上の部分へ分割するように構成され得、測定は、各分割された部分に対して実行される。
本発明は、これより、添付の図面を参照して、単に例として説明されるものとする。
【図面の簡単な説明】
【0038】
【
図1】改善された実験設計およびデータストア内の強化されたデータに関する本発明のフィードバックワークフローを示すフロー図であって、臨床的に関連性のある予測を提供するためにこれらのフィードバックワークフローの適用も示す図である。
【
図2】
図1に呈示されるシステムについての4つの別個の使用事例を示す図である。
【
図3】本発明のシステム内に提供される微小流体デバイスの概略図である。
【
図4】4つの主要構造タンパク質:外被(E)、膜(M)、核タンパク質(N)、およびスパイク(S)タンパク質で主に構成される正の向きの一本鎖RNAウイルスであるSARS-CoV-2の概略図である。
【
図5】
図5Aは、0.05% Tween20を有するPBSの緩衝液中の20nM Alexa Fluor 647ラベル化SARS-CoV-2 RBDに対する抗スパイクS1抗体の平衡結合曲線を示す図である。
図5Bは、ヒト血清中の20nM Alexa Fluor 647ラベル化SARS-CoV-2 RBDに対する抗スパイクS1抗体の平衡結合曲線を示す図である。
【
図6】
図6Aは、ヒトACE2受容体に結合するSARS-CoV-2 RBDの異なる変異株の解離定数K
Dを示す図である。
図6Bは、モノクローナル中和抗体に結合するSARS-CoV-2 RBDの異なる変異株の解離定数K
Dを示す図である。
【発明を実施するための形態】
【0039】
図1は、本発明のシステム10において達成されるワークフローを示す。システム10は、所有者知識データベース21、タンパク質-タンパク質相互作用または他の関連性のある生体高分子相互作用に関わるオープンソース一般データを含む第三者データベース24を含み得るデータストア19を含む。加えて、データストア19は、デバイス50上で生成されるインハウスデータ26を含む(
図3を参照して以下により詳細に示され、説明される)。データストア19は、単一のデータストアであり得るか、またはそれは、各々が特定のソースからのデータを格納する複数のサブストアを含み得る。これらのサブストアは、デバイス50と物理的に共同設置され得るか、またはそれらは、分散され得、特に、クラウドベースであり得る。それらの物理的場所に関わりなく、それらは、機能的に連結され、したがって、概して、データストア19と称される。
【0040】
システム10はまた、生体高分子相互作用に関わる少なくとも1つの一般モデル34を含む機械学習アルゴリズム32を含む。機械学習アルゴリズム32は、複数の異なるアルゴリズムを含み、各々がモデルとの使用のために選択される。疾病状態に関わる少なくとも1つの一般モデル34および1つの特定モデル36が存在する。
【0041】
試料が獲得されるとき、それが細胞培養物から生じるにしろ、緩衝液中の抗体から生じるにしろ、インビトロもしくはインビボ試料から生じるにしろ、供給源にかかわらず、分析されるべき相互作用に関わるタンパク質-タンパク質相互作用データは、一般モデルから獲得される。この一般モデルデータは、次いで、試料の分析の定量的結果を予測するために使用され、したがって、最も情報が豊富な領域が識別され得る。機械学習アルゴリズムは、次いで、定量分析が情報豊富な区域で起こることを可能にする試料調製および/または実験条件におけるパラメータに関してデバイス50に指示を出すために使用される。デバイス50は、次いで、試料調製に着手し、デバイス50に試料を流し、横分配を引き起こし、例えば、試料の親和性、濃度、または異質性の測定につながる定量的読み出しを行う。この測定された定量的データは、次いで、2つの結果のうちの一方を有する予測値と比較される。
【0042】
測定された値が予測値にぴったり合う場合、モデルは立証され、試料は、高い正確性スコアを伴って所有者データベース内に含まれ得る。逆に、測定された値が予測値から外れる、または逸脱する場合、これは、相違がなぜ生じたのかを理解するためにさらなる分析が必要とされることを示すものであり得る。この段階的手法は、予測データと測定データとの間の相違を調査するために、同じ試料に対してさらなる分析が行われることにつながり得る。
【0043】
患者試料が獲得されるとき、関連性のある生体高分子相互作用に関わる一般モデルにアクセスすることに加えて、機械学習アルゴリズム32はまた、患者に関わる個人データを獲得するためにデータストア19にアクセスする。このデータは、以前の定量分析からのデバイス50からの以前の定量的データを含み得る。加えて、これは、患者の年齢、体重、性別、投薬計画、および他の関連性のあるリスク因子などの患者データを含み得る。さらには、機械学習アルゴリズム32は、疾病状態に関わる特定モデル36にアクセスする。機械学習アルゴリズム32は、試料内で研究されるべき生体高分子相互作用の予測した定量的測定を行うためにこれらの3つの事前のソースを使用する。機械学習アルゴリズム32はまた、実験条件を開発および設計し、これの下でデバイス50は、予測した定量的測定を最良に観察するように動作する。
【0044】
デバイス50が、アルゴリズム32によって決定された条件の下で実験に着手すると、定量的データは、患者データおよび特定モデルを参照してさらに分析されて、患者のための臨床的に関連性のある出力をもたらす。これは、疾病の進行の速度を得るための以前のデータとの比較を含む、患者の疾病状態の概要であり得る。さらには、臨床的に関連性のある出力は、既存の薬の投与量の変更または利用される薬の変化を含む、投薬計画に関連する推奨を含み得る。
【0045】
図2は、システム10が動作され得る異なるモードのうちの一部を示す。最初の自己参照的フェーズにおいて、システム10は、試料を使用し、以て、一般モデルにのみアクセスし、K
D、PPIネットワーク情報、溶液中のタンパク質の生体物理特性、流体力学的半径、電荷、スプライスもしくは電荷アイソフォームに関して、インハウスデータストアまたは所有者データストアを、データの正確性スコアを増加させることを通じて最適化して、動作され得る。これは、ローカル生成したデータセットがサイズおよび信頼度を増加させるため、オープンソースPPIデータおよび公開データベースへの依拠が経時的に低減されることを可能にする。
【0046】
本発明のシステム10が動作され得る第2のモードは、特定モデルを導入し、システムを生体指標評価のためのプラットフォームとして使用することである。デバイス50は、目的の生体高分子相互作用の親和性、濃度、および/または電荷を定量的に測定するように構成される。これは、タンパク質-タンパク質相互作用および結合機序の特徴に洞察をもたらす。そしてこれが、タンパク質-タンパク質相互作用の臨床転帰への相関を可能にする。これは、疾病をスクリーニングするための特定のPPIの遡及的予測を可能にする。さらには、時系列サンプリングが、個々の患者のための早期診断を提供する。
【0047】
本発明のシステム10が動作され得る第3のモードは、生体高分子相互作用の間での生体物理特性を決定するために複数の特定モデルおよび他のプローブ促進分析をプローブなし手法と組み合わせるタンパク質フィンガープリント手法を組み込む。仮説なしデータ獲得モード、デバイスが測定するように構成される生体物理特性を測定すること、およびそのデータの患者データとの組み合わせを臨床転帰と相関させること。
【0048】
プローブは、結合部位における特定のシーケンス上へ、または目的の生体分子の特定の表面上への付着のために使用され得る。プローブは、ユーザが定量化されるべき生体高分子を可視化および検出することを可能にするために、例えば、蛍光色素分子によりラベル化され得る。好適な蛍光色素分子の例としては、Alexa FluorTM、ATTO、DyLight、または、限定されるものではないが、DyLight 350、ATTO 488、DY-489XL、Alexa FluorTM 647、もしくはAlexa FluorTM 700などの個々の染料によって例示される他の系統が挙げられる。染料は、可視波長蛍光に限定されず、UV、可視、またはIR範囲のスペクトルにおいて活性であり得る。
【0049】
蛍光ラベルなどのラベルを有するプローブは、それがラベルの場所を選択することにおいてより柔軟性を提供することができることから望ましい場合があり、強化された蛍光特性は、目的の生体分子の定量分析のために使用されるより多くの生体物理技術に好適であり得る。したがって、本発明のシステム内のプローブに付着されるラベルをプローブに提供することは、プローブが、目的の生体高分子相互作用の親和性、濃度、および/または電荷などの生体高分子相互作用の1つまたは複数の生体物理特性をユーザが正確かつ迅速に決定することを可能にし得るため、非常に有利であり得る。
【0050】
いくつかの場合において、目的の生体分子の表面上で曝露される1つまたは複数の残基のバルクラベル化が、親和性、濃度、および/または電荷などの生体高分子相互作用の1つまたは複数の生体物理特性を決定するのを助けるために使用され得る、プローブなし手法の例も配備され得る。
【0051】
代替的または追加的に、プローブなし手法の別の例は、特定の波長でタンパク質の芳香族残基からの内在蛍光を検出することなど、生体分子の内在蛍光を利用することであり得る。生体分子の内在蛍光特性を利用することは、その天然状態における生体高分子相互作用の生体物理特性に関する情報を提供することができ、したがって、このプローブなし手法は、しばしば分子間の自然な結合または相互作用を歪め得るプローブを必要としないため、非常に有利であり得る。
【0052】
デバイス50を使用して測定され得る生体分子相互作用の生体物理特性の他の例としては、流体力学的半径であって、そこから、分子量が、推測を行うための実験データを使用して推測され得る、流体力学的半径;電荷が推測され得る移動度;疎水性、ラベル化もしくは内在蛍光を介した酸含有量、pIは等電点電気泳動を介する、UV内在蛍光を介したTrpおよびTyr、またはMet、Lys、および/もしくはCys残基などの特定のアミノ酸残基の蛍光色素分子によるラベル化が挙げられる。
【0053】
機械学習アルゴリズム
機械学習アルゴリズムという用語は、各々が実験設計および/または臨床出力態様のそれぞれの態様と共に使用するために選択される多数の異なるアルゴリズムの組み合わせを概して指すために使用される。異なるアルゴリズムは、生体高分子相互作用の一般モデル、疾病進行の特定モデル、および親和性測定に適切である。
【0054】
例えば、一般モデルの場合、全結合深層ニューラルネットワーク、リカレントニューラルネットワーク、畳み込みニューラルネットワーク、または、変圧器ベースのアーキテクチャなどの自己注意ベースのアーキテクチャが配備され得る。表現学習は、生体高分子のシーケンスおよび構造の埋め込みを生成するために使用され得る。これらのアルゴリズムは、必要に応じて分類器またはリグレッサシステムと組み合わされ得る。一般に適切であり得る分類器の例としては、ランダムフォレスト、勾配ブースティングマシン、ガウス過程、または多層パーセプトロンが挙げられる。単一の分類器が配備され得る。しかしながら、いくつかの実施形態において、分類器の積み重ねが達成され得る。分類器の効果的な積み重ねを達成するために、分類器は、出力自体よりも、出力における誤差を予測するように訓練される。ガウス過程および多層パーセプトロンの組み合わせは、この文脈において効果的である。
【0055】
分類器の積み重ねは、生体高分子相互作用のフィールドが複雑であり、データセットが比較的小さいことから、この文脈において有利である。
データを機械学習アルゴリズム内へ導入するために、まず、目的の生体高分子、例えば、タンパク質をベクトル化する必要があり、その結果として、タンパク質の複雑な構造が数値ベクトルとして表され得る。このベクトルは、分類器によって取り込まれ得、こうして機械学習アルゴリズムにより処理され得る。これは、データが、最初は、機械学習アルゴリズムを訓練するために、および、多くの他の同様にベクトル化された生体高分子データと組み合わせて、その生体高分子の相互作用の新規定量分析の予測を生み出すために、使用されることを可能にする。
【0056】
疾病進行および疾病状態のモデリングに関する特定モデル、関連データ変換を伴う表形式データセット、およびアルゴリズムのための符号化が配備され得る。一般モデルを参照して上に説明されるような同様の分類器またはリグレッサが配備され得る。加えて、特定モデルは、一般モデルからの情報によって追加的に通知される。
【0057】
図3は、システム10内に組み込まれ得るデバイス50の例を示す。
図3は、不均一な試料内の複数の成分の分離および分析を提供するように構成されるデバイス50を示す。デバイスは、キャピラリー電気泳動区域およびHフィルタ18という2つの区域を組み込む。例証された実施形態においては、キャピラリー電気泳動区域がHフィルタに先行するが、順序は、Hフィルタが最初に配備されるように入れ替えられ得るということを理解されたい。その構成において、キャピラリー電気泳動モジュールは、Hフィルタの出力の各々に適用され得、その結果として、Hフィルタの出力が存在するのと同じだけ多くのキャピラリー電気泳動モジュールが存在する。
【0058】
成分は、生物学的および/もしくは化学成分であり得るか、またはそれは、生体分子であり得る。生体分子は、限定されるものではないが、タンパク質、ペプチド、多糖、DNAなどの核酸、RNA、抗体、またはそれらの抗体フラグメントであり得る。
【0059】
デバイス50は、試料および緩衝液または補助流体が導入され得る試料流路12および緩衝液流路16を伴うHフィルタ18の構成部品を含む。試料流路12および緩衝液流路16は、第1の方向である細長である分配流路14で終端する。
【0060】
流路の細長い構成の結果として、試料が、試料流路12に沿って、分配流路14内へ、およびこれを通って流れるとき、第1の方向に実質的に垂直である第2の方向における成分の分配が生じる。
【0061】
デバイス50は、電気泳動による分配を駆動するために、Hフィルタ18の分配流路14にわたって電場を提供するように構成される少なくとも1つの電源30を含み得る。
Hフィルタ18は、2つの出口20を有し、分配流路14内の流体は、2つの出口の間で分割される。出口の各々において収集される流体の定量分析が行われ得、データは、出口20の間で比較され得る。定量分析は、横分配がもたらされた計画と関連付けられる。したがって、
図3に例証されるデバイスにおいて、電源30が、分配が電気泳動によって達成されるように分配流路14にわたって電場を作り出す場合、定量分析は、試料内の成分における変化の分析である。
【0062】
逆に、
図3内の電源30が活性化されない場合、分配流路14内の分配は、拡散を介してのみ生じ、定量分析は、試料内の成分のサイズに関連する。
代替的に、または追加的に、分配流路内で作り出される分配は、キャピラリー電気泳動によって達成され得る。加えて、横分配は、拡散的に、電気泳動的に、拡散泳動的に(diffusophoretically)、磁気泳動的に、または熱泳動的に作り出され得る。
【0063】
デバイス50は、キャピラリー電気泳動(CE)分離および拡散サイジングを使用して流体試料を分離および分析するように構成される。
図3に示されるように、デバイス50は、1つまたは複数の延長入口22を伴うHフィルタ18を備える。試料の充填は、分離流路12内への試料ポート13を通じて起こり、電気浸透流(EOF)を介して達成されるか、圧力駆動であるかのいずれかである。試料が分離流路12に到達すると、電場が、Hフィルタ18の両端、すなわち、入口22および出口20にわたって印加されて、分配流路14全体を電気浸透的に駆動する。分離流路12に供給されている試料に対する制御を提供するために、試料入口ポート13に対応する試料廃棄ポート15が存在する。
【0064】
図3に示されるように、電圧が分離流路12および補助流路16に印加され得るように、少なくとも1つの電源30が提供される。
図3は、本発明のデバイス50を実行するために使用され得る電圧源30および電気接続のための例示的な構成を示す。電力源30の極性の適切な選択は、試料中の成分に対する予測電荷に依存する。
【0065】
図3に例証される実施形態において、分離流路12および補助流路16は、等しい長さのものである。分離流路12および補助流路16はまた、等しい断面積を有する。等しい寸法の分離流路および補助流路を有することは、同じ電圧が分離流路12および補助流路16の両方にわたって印加され得、以て、分離流路12および補助流路16において、実質的に等しい電気浸透流量を提供するため、デバイスを通じた電気浸透流の制御を単純化する。
【0066】
さらには、補助流路16および分離流路12の対称性は、分配流路14に入る、および/または全Hフィルタ18全体を通じた、等しい流れを確実にする。流れセンサまたは基準試料(添付の図には示されない)が、バルク流量を決定するために含まれ得る。基準試料は、分離流路または補助流路のいずれかの中に導入され得る。
【0067】
さらには、試料は、分離流路12内でCEを介して分離され得、次いで、Hフィルタ18内で拡散サイジングに供され得る。対称性分離流路12および補助流路16、ならびに両方の流路にわたる一定の印加電場は、明確に定義された流量を提供し得る。いくつかの実施形態において、補助キャピラリーはまた、対称性を強化するために試料充填のための交差流路(添付の図には示されない)を含有し得る。
【0068】
デバイス50はまた、試料が試料流路12内への導入に備えて調製され得る試料調製モジュール(添付の図には示されない)を含み得る。試料調製モジュールは、試料の濃度が制御されることを可能にするために微小滴定器を含む。試料調製モジュールはまた、試料調製モジュールが、機械学習アルゴリズムによって推奨される時間期間にわたって、機械学習アルゴリズムによって規定される条件下で試料を混合および格納できるように、温度および湿度制御された格納条件を含む。試料調製モジュール内で作成される混合物は、三成分以上の混合物を含み得る。
【0069】
1つの例示的な定量分析の詳細な説明
血清のような複雑な混合物における生理学的に関連性のある条件下での、時として解離定数またはKDとも称される、親和性の定量的測定は、患者およびワクチン接種者における免疫反応および保護窓への有用な洞察を提供することができる。
【0070】
血清中のSARS-CoV-2抗体の正確な親和性プロファイリングは、抗スパイクS1抗体を、血清中のSARS-CoV-2スパイクタンパク質の受容体結合ドメイン(RBD)へのその結合親和性を測定することによって特徴付けるために微小流体拡散サイジングを使用する
図3のデバイスにおいて行われ得る。
【0071】
血清反応陽性者である個人を正確に識別するため、ならびに、近年出現したコロナウイルスSARS-CoV-2に対する最も効果的なワクチンを見出すために、感染の過程で、またはワクチン接種後に、免疫反応を完全に特徴付けることが基本となる。これは、個人がウイルスに曝露されていたか否かに関する2値表示、および患者試料内に存在する抗体のレベルに関する定量的評価の両方を含む。特に、免疫システムのウイルス中和能力は、重大な関心事であり、COVID-19患者またはワクチン接種者の血清試料中の中和抗体(NAb)の親和性および量を評価するための正確な検査が重要である。
【0072】
図4に概略的に例証されるように、SARS-CoV-2は、4つの主要構造タンパク質:外被(E)、膜(M)、核タンパク質(N)、およびスパイク(S)タンパク質で主に構成される正の向きの一本鎖RNAウイルスである。スパイクタンパク質は、ホスト細胞内へのウイルス侵入に不可欠である。それは、2つのサブユニット:ホスト細胞受容体ACE2に結合するS1、および細胞膜との後のウイルス融合を介在するS2からなる。
【0073】
ホスト細胞のウイルス侵入の第1のステップを介在するその重要な役割に起因して、S1のRBD(受容体結合ドメイン)は、コロナ属の他のウイルスに対して生じる中和抗体の標的であることが証明されており、SARS-CoV-2の場合に重要な標的である。
【0074】
図3に示されるデバイスは、抗体の濃度および親和性が同時に、かつ独立して決定されることを可能にする。これは、免疫反応の理解を助ける。そしてこれは、抗体成熟および免疫の持続のより良好な理解を可能にし、将来的には、回復期血漿療法研究およびワクチン設計を助け得る。
【0075】
ヒト試料における抗体親和性を測定することは、理想的には、平衡結合曲線を生成するために使用され得る抗体濃度の範囲を最大限にするために不希釈血清を利用する。しかしながら、タンパク質結合を測定するための最も確立された技術は、結合相手のうちの1つの表面固定化に依拠する。これは、分析表面への血清中の他のタンパク質の非特異的結合に起因して、血清などの複雑な試料を扱うときに著しい困難を引き起こし得、偽陽性または少なくとも低い信号対雑音比につながる。
【0076】
図3に示されるデバイスにおいて、微小流体拡散サイジングは、直接血清中の蛍光ラベル化SARS-CoV-2 RBDへの抗スパイクS1抗体の親和性を測定するために使用される。この溶液中技術は、抗体への結合の際にラベル化抗原の流体力学的半径(Rh)における変化を測定することによって、抗原-抗体相互作用の検出を可能にする。結果として、MDSは、直接血清中の抗体の正確な検出および特徴付けを可能にし、故に、表面結合技術の制約を除去する。
【実施例】
【0077】
SARS-CoV-2 RBD(40592-V08H、Sino Biological)を、400μL滅菌水中で0.25mg/mLの濃度へ再構成した。ラベル化のため、タンパク質を、ラベル化緩衝液(0.2M NaHCO3 pH8.3)中へ希釈し、10:1の染料対タンパク質比でAlexa Fluor(商標)647NHSエーテル(Thermo Fisher Scientificと混合した。4℃で一晩のインキュベーションの後、ラベル化RBDを、溶出緩衝液としてPBS(pH7.4)を有するSuperdex 75 Increase10/300GLカラムを使用してサイズ排除クロマトグラフィにより精製した。
【0078】
血清中の親和性測定のため、SARS-CoV-2(2019-nCoV)スパイク抗体(40150-R007、Sino Biological)を、ヒト血清(H5667、Sigma)中に希釈し、490pM~1uMの範囲に及ぶ2倍濃度シリーズを達成した。続いて、抗体希釈物をAlexa Fluor 647ラベル化SARS-CoV-2 RBDの40nM溶液と1:1比で混合して、20nMの最終1RBD濃度を得た。測定の前にすべての試料を4℃で30分間インキュベートし、実験全体を通して4℃に維持した。
【0079】
緩衝液中の親和性測定のため、抗体およびAlexa Fluor 647ラベル化タンパク質を、血清の代わりに、0.05%Tween20を有するPBS中に希釈した。濃度およびインキュベーション時間は、血清における実験と同一であった。
【0080】
1.5~8nmサイズ範囲設定を使用して、
図3のデバイス上で試料を測定した。測定は、室温で3回実施された。血清によって引き起こされるバックグラウンド蛍光を補正するため、ヒト血清の独立した測定を実施し、血清において得られる個々のデータ点にバックグラウンド減算を適用した。式1への非線形最小二乗フィッティングによって、結合親和性K
Dを自動的に生成した。
式1:
【0081】
【数1】
式中、
R
hは、平衡状態での流体力学的半径であり、
R
h,freeは、非結合タンパク質の流体力学的半径であり、
R
h,complexは、タンパク質-リガンド複合体の流体力学的半径であり、
[L]
totは、ラベル化種の合計濃度であり、
[U]
totは、非ラベル化種の合計濃度であり、
nは、複雑な化学量論(0.5に固定されるラベル化分子あたりの非ラベル化分子であり、
K
Dは、解離定数である。
【0082】
絶対サイズが、SARS-CoV-2 RBDの2つの分子が1つの抗体に結合されることを示したため、化学量論パラメータnを0.5に設定した。
SARS-CoV-2スパイクタンパク質のRBDへの抗スパイクS1抗体の結合親和性を評価するため、抗体を、20nMの一定濃度のAlexa Fluor 647ラベル化組換え発現RBDに対して滴定した。対照群として、最初に、緩衝液において滴定実験を実施した。
図5Aは、9.6±1.7nMのKDをもたらす、0.05%Tween20を有するPBSにおいて測定された親和性結合曲線を示す。
【0083】
ヒト血清における測定のため、同じ抗体濃度を、血清中に希釈された抗体を用いて、20nM Alexa Fluor 647ラベル化RBDに対して滴定した。血清測定を示す
図5Bに関連して、血清バックグラウンド蛍光を、上の式1を使用した非線形最小二乗フィッティングによってK
Dを決定する前に、生データから減算した。非ラベル化抗スパイクS1抗体の希釈倍率に応じて、それぞれの血清濃度は、91~97%の範囲に及び、また、これらの試料中の血清の高い濃度にもかかわらず、この相互作用のために決定されるK
D値は、PBSにおけるものに一致する。
【0084】
この例は、直接ヒト血清中のウイルスタンパク質への抗体の結合親和性を正確に検出および特徴付けするために
図3のデバイス上でMDSを使用して実施される単一の定量分析を示す。故に、この技術は、COVID-19パンデミックとの戦いにおける信頼性の高い抗体検査およびワクチンの開発を支援するために、SARS-CoV-2に対する液性免疫反応の徹底的な分析のために使用され得る。
【0085】
各定量分析は、次いで、患者体重、年齢、心臓病、喘息などの他の関連のない診断などの関連リスク因子を含む、患者の個人データと一緒にデータストアに追加される。より多くの分析が収集されると、システムは、これまでに収集された定量分析に基づいて、別の患者の免疫反応をより正確に予測することができる。
【0086】
上記の例、S1スパイクタンパク質は、プローブとして効果的に作用する。しかしながら、本システムは、溶液中でプローブなしシステムとしても使用され得る。プローブなしシステムの例は、生体高分子相互作用を識別および検出するために、リジン残基などの表面曝露残基のバルクラベル化を必要とし得る。リジン残基は、タンパク質内で頻出であり、したがって、タンパク質の表面上の曝露リジン残基をラベル化することは、ラベル化タンパク質の表面上の別の生体分子の結合を検出および可視化するのに役立ち得る。しかしながら、生体分子の表面上の、特定の、しかしながら限られた、場所におけるラベル化の成功を促進し得るN末端α-アミノ基を具体的に標的とすることが可能であり得る。
【0087】
この例では、ラベルは、例えば、分配がラベルを前提とするように、磁気ラベルの使用およびそれに続く分配流路への磁場の印加とは異なり、分離に影響を及ぼさない。しかしながら、プローブは、分配が作り出される計画に応じて、分配に寄与し得る。例えば、分配が拡散によって作り出される場合、プローブの質量が、分配流路を通る生体高分子の拡散に寄与する。同様に、分配が電気泳動的に作り出される場合、プローブの電荷が、分配の作成に寄与する。
【0088】
プローブなし手法の別の例は、アミノ酸などの生体分子の内在蛍光特性の検出および/または測定を必要とする。例えば、トリプトファン、フェニルアラニン、および/またはチロシン残基などの目的の生体分子の芳香族残基は、特定の波長で励起され得、励起された芳香族残基は、U.V/蛍光分光計を使用して検出され得る異なる波長で蛍光を発することができる。故に、生体高分子相互作用間の親和性、濃度、分子量、アミノ酸含有量などの生体物理特性は、その内在蛍光特性に基づいて測定され得る。
【0089】
プローブベースおよびプローブなしのデータセットは、タンパク質フィンガープリントにおいて組み合わされ得る。タンパク質フィンガープリントは、利用可能なすべての可能なデータを組み合わせ、各データ点は、独自の正確性スコアを有して、そのデータ点の真実性における信頼度が確証されることを可能にする。データは、様々なソースから集計され、経時的に増加され、健康状態の発展または疾病状態の追跡が行われることを可能にする。さらに、特定モデルがさらに開発され、新規特定モデルが作成されると、タンパク質フィンガープリント内のデータは、何度もインテロゲートされ得る。これは、既存のデータ内で新規発見がなされることを可能にする。例えば、以前に獲得されたデータに基づいて新規疾患を診断すること。
【0090】
本明細書に開示されるような本発明のシステムは、以下のさらなる例において詳述され得る。以下に説明されるような例は、アルファ株およびベータ株などのSARS-CoV-2変異株が抗体エスケープの能力があることを、異なる技術を通じて調査することを目指す。抗体エスケープの能力がある変異株は、感染者におけるより高い伝染およびより症候性の疾患につながり得る。
【0091】
本明細書で使用される場合、および別途記載のない限り、用語「抗体エスケープ」は、ランダムに発生し得るウイルスの変異が、ウイルスの表面上に存在する抗原の構造における変化を引き起こし、故に、抗原を同じウイルスの未変異株による以前の感染に対して開発された抗体によって認知できなくすることを意味する。
【0092】
図1に示されるように、PPI知識データベースとも称される所有者知識データベース21は、特定のタンパク質-タンパク質相互作用に関する結合親和性情報を含む。例えば、強力な中和モノクローナル抗体SAD-S35を有するS1タンパク質のSARS-CoV-2受容体結合ドメイン(RBD)、およびヒトACE2受容体を有するSARS-CoV-2 S1RBD。この情報は、様々なソースを介して獲得され得る。1つの例において、データは、外部オープンソースデータベース19、24を参照して、ならびに本発明において開示されるようにデバイス50上で生成され得る結合親和性26のインハウス決定を通じて、獲得され得る。外部オープンソースデータベース19、24によって獲得されるデータと、デバイス50によってインハウス26を通じて獲得されるデータとの比較ステップは、それらが一致することを示す。インハウス測定された値は、x軸上にRBD-WT(野生型)について、
図6Aおよび
図6Bにおいて、不確実性を伴ってプロットされる。
【0093】
図6Aおよび
図6Bは、ACE2受容体(
図6A)および中和モノクローナル抗体(
図6B)に結合するSARS-CoV-2 RBDの異なる変異株の解離定数K
Dを示す。平衡結合は、蛍光ラベル化RBD変異株および非ラベル化ACE2または非ラベル化中和抗体(Nab)の様々な濃度について微小流体拡散サイジング(MDS)によって測定され得る。K
D値は、結合相互作用を説明する動的平衡モデルのベイズ推論によって獲得される後確率分配のモードから決定され得る。エラーバーは、
図6Aおよび
図6Bに示されるように、95%信用区間である。
【0094】
図6Aおよび
図6Bに例証されるように、結合親和性は、SARS-CoV-2の野生型(または武漢株)を参照する。
図1に示されるように、PPI知識データベース21は、SARS-CoV-2の懸念される変異株(VoC)に関するさらなる情報を含む。この情報に基づいて、変異S1-RBDタンパク質のセットが使用され得、実験パラメータは、ACE2受容体および中和抗体SAD-S35へのこれらの変異株の結合親和性を決定するために設定される。
【0095】
両方の標的への変異S1-RBDタンパク質の結合親和性は、本明細書に開示されるようなデバイス50を使用して測定され得る。結果は、
図6に示される。重要なことには、RBD-アルファは、ACE2受容体について増加した親和性(10倍)を示すが、中和抗体SAD-S35に対するその親和性は、おおむね影響がない。逆に、RBD-ベータは、中和抗体SAD-S35によって結合されないが、ACE2受容体に対するその親和性は、同じままであった。
【0096】
さらには、個々の変異株を測定することは、K417Nの効果を、抗体エスケープの原因となる変異として認識することができる。K417Nのみを導入する効果は、ベータ変異株が抗体エスケープを達成する機序を実証する。ベータにおけるいくつかの変異のうち、K417Nは、中和抗体によって認識されるエピトープを改造する原因となる変異である。
【0097】
インビトロでの上述の親和性を測定することによって獲得される結果は、PPI知識データベース21内へフィードバックされ、次いで、S1-RBDへ結合するためのACE2および中和抗体と抗体エスケープ32、34との競合の特定のシステムのための機械学習アルゴリズム32内に入力される。抗体陽転した患者におけるSARS-CoV-2 S1-RBDに対する抗体反応プロファイルの特性に関する事前知識と組み合わせて、本システムは、野生型株による感染から派生される免疫を有する患者内のS1-RBD変異に対抗する抗体プロファイルに対するS1-RBD変異の効果を予測するために使用され得る。具体的には、本システムは、アルファおよびベータVoCの両方に対してより低いウイルス中和能力を予測したが、主な効果は、2つのケース間で異なる。
【0098】
予測は、次いで、デバイス50上での溶液中の受容体結合競合アッセイを通じて確認され、このアッセイは、S1タンパク質に対する患者血清抗体の中和能力を、ACE2受容体からそれを移動させることによって測定する。結果は、
図7に示される。
【0099】
図7を参照すると、溶液中の受容体結合競合アッセイが示される。アッセイは、
図7に示されるように、ラベル化ACE2受容体が発見されるSARS-CoV-2複合体のサイズを例証する。それがS1によって結合される場合、サイズはより大きい(Rh=1、正規化)。抗体がS1を負かす場合、ACE2は、複合体がないため、より小さい(Rh=0、正規化)。そのため、アッセイは、中和が発生するかどうかを示すことができる。エラーバーは、三重測定から獲得される標準偏差である。
【0100】
図7に例証されるように、3人の患者のうちの2人(3973および3707)は、野生型株よりも両方のVoCに対してより低い中和能力を示しており、先の予測を確証する。患者3541は、変異株のいずれに対しても中和抗体を有さなかった。
【0101】
デバイス50から獲得されるデータと一緒にPPI知識データベース21を使用して、結果は、2つのVoCによって用いられる異なる抗体エスケープ機序を説明する機構仮説を提供する。アルファは、より強力な親和性を有するACE2受容体に結合し、中和抗体がそれを移動させることをより困難にする。逆に、ベータ内のK417Nなどの変異は、野生型に対して生じる中和抗体によって使用されるエピトープを改造し、それらの、抗原の認識および抗原への結合を防ぐ。両方のケースにおいて、これは、感染のより高い可能性につながる。
【0102】
結論として、
図1に例証されるような情報フィードバックループを備えるシステムは、デバイス50を使用した測定と組み合わせて、複雑なタンパク質-タンパク質相互作用を特徴付けし、患者試料に対して検証され得る、機構的に解釈可能でありかつ臨床的に関連性のある予測を行うことができる。
【0103】
本発明の様々なさらなる態様および実施形態は、本開示を考慮して当業者に明白であるものとする。
本明細書で使用される場合、「および/または」は、2つの指定の特徴または構成要素の各々の、他方ありまたはなしでの、特定の開示と見なされるものとする。例えば、「Aおよび/またはB」は、各々が個々に本明細書に明記されるかのように、(i)A、(ii)B、ならびに(iii)AおよびBの各々の特定の開示と見なされるものとする。
【0104】
文脈が別途示さない限り、上に明記される特徴の説明および定義は、本発明の任意の特定の態様または実施形態に限定されず、説明されるすべての態様および実施形態に等しく当てはまる。
【0105】
本発明は、いくつかの実施形態を参照して、例として説明されているが、当業者によってさらに理解されるものとする。開示された実施形態に限定されない、および代替の実施形態が、添付の特許請求の範囲に規定されるような発明の範囲から逸脱することなく構築され得る。
【国際調査報告】