(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-02
(54)【発明の名称】COVIDバリアントの検出のための方法およびシステム
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240625BHJP
C12Q 1/6888 20180101ALI20240625BHJP
C12M 1/00 20060101ALI20240625BHJP
C12Q 1/06 20060101ALI20240625BHJP
【FI】
C12Q1/6869 Z
C12Q1/6888 Z
C12M1/00 A
C12Q1/06
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023578734
(86)(22)【出願日】2022-06-21
(85)【翻訳文提出日】2024-02-19
(86)【国際出願番号】 US2022034331
(87)【国際公開番号】W WO2022271690
(87)【国際公開日】2022-12-29
(32)【優先日】2021-06-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】511172461
【氏名又は名称】ラボラトリー コーポレイション オブ アメリカ ホールディングス
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ウィリアムズ, ジョナサン デイビッド
(72)【発明者】
【氏名】クルーガー, ブライアン
(72)【発明者】
【氏名】ノーベル, ブライアン マシュー
(72)【発明者】
【氏名】パーカー, スコット
(72)【発明者】
【氏名】アイヤル, ラクシュマナン ケー.
(72)【発明者】
【氏名】ブロシュ, ヘイデン エヌ.
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029BB13
4B029FA01
4B029FA15
4B029GB10
4B063QA18
4B063QA19
4B063QQ03
4B063QQ10
4B063QQ42
4B063QQ52
4B063QR08
4B063QR62
4B063QS32
4B063QS39
4B063QX02
(57)【要約】
COVID-19を引き起こすSARS-CoV-2ウイルスのバリアントの検出のための方法およびシステムが開示される。例えば、SARS-CoV-2のバリアントを同定および/または追跡するための方法であって、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップを含む方法が、開示される。
【特許請求の範囲】
【請求項1】
SARS-CoV-2のバリアントを同定および/または追跡するための方法であって、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;
(b)前記試料から試料特異的SARS-CoV-2 cDNAを生成するステップ;
(c)前記試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップ
を含む方法。
【請求項2】
次いで、前記SARS-CoV-2 cDNAが、ウイルスゲノムに沿って間隔を空けて結合するタイル型プライマーを使用してさらに増幅される、請求項1に記載の方法。
【請求項3】
前記タイル型プライマーが、隣接するプライマーが互いにおおよそ600bp離れているような間隔で配置される、請求項2に記載の方法。
【請求項4】
試料特異的SARS-CoV-2核酸を生成するステップが、前記試料SARS-CoV-2 cDNAの1本の鎖を、ペアのSARS-CoV-2プローブを含む一本鎖プローブDNA鋳型とハイブリダイズさせることをさらに含み、第1のプローブが、フォワードプライマーとして機能するように前記プローブDNA鋳型の3’末端に位置し、第2のプローブが、リバースプライマーとして機能するように前記プローブDNA鋳型の5’末端に位置する、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記一本鎖プローブDNA鋳型が、プローブ配列に隣接する位置にあるユニバーサルシークエンシングプライマーをさらに含む、請求項4に記載の方法。
【請求項6】
前記一本鎖プローブDNA鋳型が、前記SARS-CoV-2試料特異的核酸を試料番号と相関させるために使用されるバーコード配列の付加のためのアダプター配列をさらに含む、請求項4から5のいずれか一項に記載の方法。
【請求項7】
バーコードが、前記試料についての郵便番号または他の地理的識別子に関連付けられる、請求項6に記載の方法。
【請求項8】
2つの前記プローブ間の配列を埋めて、2つの前記プローブ配列間に前記試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を生成するステップをさらに含む、請求項4から7のいずれか一項に記載の方法。
【請求項9】
前記核酸シークエンシングが、全ウイルスゲノムの少なくとも90%をシークエンシングすることを含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
全SARS-CoV-2ゲノムに及ぶ29のオーバーラップ1.2kb領域における塩基のカバー率中央値が、前記試料の各々について計算される、請求項1から9のいずれか一項に記載の方法。
【請求項11】
ステップ(d)の結果を、バリアントが検出された場合に、さらなる分類のためにデポジトリーにアップロードするステップをさらに含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
前記デポジトリーが、CDCデータベースである、請求項11に記載の方法。
【請求項13】
前記対象の地理的位置を同定するステップをさらに含む、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップが、試料SAR-CoV-2配列をSARS-CoV-2参照ゲノムとアラインして試料特異的アセンブリおよびコンセンサス配列を生成することを含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
ステップ(d)が、前記試料についての系統をアセスメントすることをさらに含む、請求項1から14のいずれか一項に記載の方法。
【請求項16】
ステップ(d)の組み入れ基準が、>90%ゲノムカバー率、カバー率中央値の平均値>10CCSリード;および前記試料についての系統決定を含む、請求項1から15のいずれか一項に記載の方法。
【請求項17】
前記核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの前に前記デポジトリーのアップデートが行われたかどうかを決定するステップをさらに含む、請求項11に記載の方法。
【請求項18】
前記ステップのうちの少なくとも複数が、
1つまたは複数のデータプロセッサーと、
前記1つまたは複数のデータプロセッサーで実行されたときに方法ステップのいずれかを含む処理を前記1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体と
によって制御される、請求項1から18のいずれか一項に記載の方法。
【請求項19】
1つまたは複数のデータプロセッサーと、
前記1つまたは複数のデータプロセッサーで実行されたときに、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定すること;
(b)前記試料から試料特異的SARS-CoV-2核酸を生成すること;
(c)前記試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行すること;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定すること
を含む処理を前記1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体と
を含むシステム。
【請求項20】
非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品であって、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定すること;
(b)前記試料から試料特異的SARS-CoV-2核酸を生成すること;
(c)前記試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行すること;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定すること
を含む処理を1つまたは複数のデータプロセッサーに遂行させるように構成された命令を含む、コンピュータ-プログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
分野
COVID-19を引き起こすSARS-CoV-2ウイルスのバリアントおよびバリアントのいずれかの株に感染した個体の地理的位置の検出のための方法およびシステムが開示される。
【背景技術】
【0002】
序論
SARS-CoV-2は、Coronaviridae科、Beta coronavirus属の、エンベロープを有する一本鎖RNAウイルスである。全てのコロナウイルスは、16の非構造タンパク質と、4つの構造タンパク質:スパイク(S)、エンベロープ(E)、膜(M)およびヌクレオカプシド(N)とをコードする、それらのゲノムの構成および発現の類似性を共有する。この科のウイルスは、人畜共通起源のものである。それらは、軽度の感冒から重症急性呼吸器症候群(SARS)、中東呼吸器症候群(MERS)および新型コロナウイルス感染症(COVID-19)などのより重症度の高いものまで多岐にわたる症状を有する疾患を引き起こす。人々を感染させることが公知の他のコロナウイルスとしては、229E、NL63、OC43およびHKU1が挙げられる。後述のものは、遍在性であり、感染は、概して、感冒またはインフルエンザ様症状を引き起こす。
【0003】
2019新型コロナウイルス(SARS-CoV-2)は、大流行の可能性がある病原体として2019年12月に中国、武漢において初めて現れたベータ-コロナウイルスである。初期の報告は、限定的な人から人への伝播が中国国内で起こったことを示唆した。しかし、2020年初頭に、2019-nCoVのさらなる症例が世界中で認められ、それによって持続的な人から人への伝播が示された。これまでのところ、SARS-CoV-2の臨床スペクトルは、軽度の自己限定性上気道感染症から、著しい罹病率および死亡率をもたらす、より重篤な下気道疾患まで多岐にわたっている。SARS-CoV-2パンデミックが加速するにつれて、ウイルスゲノム配列の多様性について、およびこれらのバリアントが感染の伝播性、感染の重症度または自然免疫もしくはワクチン誘導免疫からのウイルスの回避にどのように影響を与えるかについて、より大きな注目が払われてきた。
【0004】
ウイルスは、変異によって絶えず変化する。COVID-19を引き起こすウイルスの複数のバリアントが、米国においておよび地球規模で記録されている。現れては消えるバリアントもあり、存続し、感染力の増大または症状の重症度の上昇を示すバリアントもある。
【0005】
例えば、2021年6月時点で、米国には6つの注目すべきバリアントが存在した。(1)B.1.1.7:このバリアントは、2020年12月に初めて米国で検出された。それは、英国で最初に検出された。(2)B.1.351:このバリアントは、2021年1月の終わりに初めて米国で検出され、2020年12月に南アフリカで最初に検出された。(3)P.1:このバリアントは、2021年1月に初めて米国で検出された-P.1は、1月初頭に日本の空港で所定のスクリーニング中に検査を受けたブラジルからの旅行者において最初に同定された。(4)B.1.427および(5)B.1.429:これら2つのバリアントは、2021年2月に初めてカリフォルニアで同定された。(6)B.1.617.2:このバリアントは、2021年3月に初めて米国で検出された。それは、2020年12月にインドで最初に同定された。CDC.gov/coronavirus/2019-ncov/variants。
【0006】
このように、新しいバリアントを同定および追跡する必要がある。パンデミックに対応する公共の保健機関を支援するために感染個体の地理的位置を追跡する必要がさらにある。
【発明の概要】
【課題を解決するための手段】
【0007】
要旨
COVID-19を引き起こし得るSARS-CoV-2のバリアントを同定および追跡するための方法およびシステムが開示される。方法およびシステムを様々な仕方で具現化することができる。
【0008】
ある特定の実施形態では、方法は、SARS-CoV-2のバリアントを同定および/または追跡するための方法であって、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップを含む方法を含み得る。
【0009】
ある実施形態では、シークエンシングは、ウイルスゲノムの大部分をカバーする。したがって、試料SARS-CoV-2ゲノムがRT-PCRにより増幅される、ある特定の実施形態では、得られたcDNAは、その後、ウイルスゲノムに沿って間隔を空けて結合するタイル型プライマーを使用してさらに増幅される。ある特定の実施形態では、タイル型プライマーは、隣接するプライマーが互いに600bp離れているような間隔で配置される。このようにして、SARS-CoV-2ゲノムは、新たなバリアントの存在または非存在にかかわらず非常に効率的に増幅される。例えば、ある特定の実施形態では、核酸シークエンシングは、全ウイルスゲノムの少なくとも80%、または必要に応じて少なくとも85%、または必要に応じて少なくとも90%、または必要に応じて少なくとも95%をシークエンシングすることを含む。
【0010】
増幅された核酸分子を、配列を識別する分子バーコードで標識することができる。例えば、ある特定の実施形態では、タイル型プライマーは、バーコード配列の付加のためのアダプター、および/または核酸シーケンシングのためのユニバーサルプライマー部位をさらに含むプライマーである。
【0011】
開示される方法ステップのうちのステップのいずれかを遂行するためのシステム、ならびにシステムのステーションおよび/もしくはコンポーネントのいずれかを実行するようにならびに/または開示される実施形態のいずれかの方法のステップ(単数もしくは複数)を遂行するように構成された命令を含む非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品も開示される。
【0012】
1つまたは複数のデータプロセッサーと、1つまたは複数のデータプロセッサーで実行されたときに本明細書で開示される1つまたは複数の方法の一部または全てを1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体とを含む、システム;および非一時的な機械可読記憶媒体で有形に具現化されるコンピュータプログラム製品であって、本明細書で開示される1つまたは複数の方法の一部または全てを1つまたは複数のデータプロセッサーに遂行させるように構成された命令を含む、コンピュータプログラム製品も開示される。
【0013】
本明細書に記載のシークエンシングは、バリアントを同定するのに有利である。様々な核酸シークエンシングプロトコルを使用することができる。ある特定の実施形態では、核酸シークエンシングは、RT-PCRを含む。例えば、ある特定の実施形態では、PacBio(登録商標)シークエンシングプロトコルおよびまたは装置が使用される。
【0014】
さらなる実施形態では、バリアントに感染した個体の地理的位置を同定するための方法およびシステムが開示される。例えば、ある特定の実施形態では、バーコードが、個体の郵便番号または他の地理的識別子に関連付けられる。加えて、本開示は、感染個体の集団および/または一般集団におけるバリアントの保有率を追跡するための方法および/またはシステムを提供する。どちらの場合も、地理的地域は、集団を含み得る。さらなる実施形態では、本開示は、特定のバリアントを感染力(ウイルス伝播)および疾患重症度と相関させるための方法およびシステムを提供する。
【0015】
本開示の方法またはシステムにより生成されるデータを、解析に、他のソースからの同様のタイプの他のデータ、および/または異なるタイプの他のデータと組み合わせることができる。ある特定の実施形態では、データを解析および/または他のデータとの組合せのためにデポジトリーに寄託することができる。ある特定の実施形態では、デポジトリーは、CDCデータベースである。または、他の政府または大学または私的データベースを用いることができる。
【0016】
以下の非限定的な図を参照することにより、本開示をよりよく理解することができる。
【図面の簡単な説明】
【0017】
【
図1】
図1は、本開示のある特定のステップの実施形態によるSARS-CoV-2バリアントの検出のための方法を示す。
【0018】
【
図2】
図2は、本開示のある特定のステップの実施形態によるシークエンシングのための試料特異的SARS-CoV-2核酸を調製するための方法を示す。
【0019】
【
図3】
図3は、本開示のある実施形態による全ゲノムシークエンシングおよびバリアント同定のための方法を示す。
【0020】
【
図4】
図4は、本開示のある実施形態による配列データの解析のための方法ステップを示す。
【0021】
【
図5】
図5は、本開示のある実施形態によるバリアント同定および系統割り当てのための方法ステップを示す。
【0022】
【
図6】
図6は、本開示のある実施形態による社内データ(in-house data)および外部データベースを使用するバリアント同定の再検証のための方法ステップを示す。
【0023】
【
図7】
図7は、本開示のある実施形態によるSARS-CoV-2バリアントの検出のためのシステムを示す。
【0024】
【
図8】
図8は、本開示のある実施形態による方法またはシステムのいずれかとともに使用するためコンピュータデバイスを示す。
【0025】
【
図9】
図9は、本開示のある実施形態による増幅反応にM13フォワード(1001~1032)およびM13リバースプライマー(1049~1079、および1082)を分配するために使用される96ウェルプレートのマップを示す。
【0026】
【
図10】
図10は、本開示のある実施形態による増幅反応における使用のためのM13フォワード(1001~1032)およびリバース(1049~1051)バーコード付きプライマーの組合せを有する96ウェルプレートのマップを示す。
【0027】
【
図11】
図11は、本開示のある実施形態による平均リードカバー率(NTC平均CCSリード深度)の分布を示す。
【0028】
【
図12】
図12は、本開示のある実施形態による確認された陰性核酸増幅(NAA)診断試料の平均CCSリードカウントを示す。
【0029】
【
図13】
図13は、本開示のある実施形態による株の分布を示す。
【0030】
【
図14】
図14は、本開示のある実施形態によるNAA CT値による90%ゲノムカバー率についての率を示す。
【0031】
【
図15】
図15は、本開示のある実施形態による3回の別々のシークエンシング実行(PBT5073、PBT5075、およびPBT5080)の安定性研究に使用されたインターアッセイ試料についての平均リードカウントを示す。
【発明を実施するための形態】
【0032】
詳細な説明
定義
試料または患者試料または生体試料または検体という用語は、本明細書では同義で使用される。試料は、上部および下部呼吸器検体を含み得る。そのような検体(試料)は、鼻咽頭もしくは中咽頭スワブ、痰、下気道吸引液、気管支肺胞洗浄物、および鼻咽頭洗浄液/吸引液または鼻腔吸引液を含み得る。試料の他の非限定的な例としては、組織試料(例えば、生検)、血液もしくは血液製剤(例えば、血清、血漿など)、無細胞DNA、尿、液体生検試料、またはこれらの組合せが挙げられる。用語「血液」は、従来通りの定義の、全血、血液製剤、または血液の任意の画分、例えば、血清、血漿、バフィーコートなどを包含する。
【0033】
本明細書で使用される場合、対象または個体という用語は、ヒトまたは任意の非ヒト動物を指す。対象または個体は、患者であり得、患者は、疾患の診断または処置のために医療提供者の元を訪れるヒトであって、一部の場合には、疾患が病原体による何らかの感染症であり得る、ヒトを指す。また、本明細書で使用される場合、用語「個体」、「対象」または「患者」は、全ての温血動物を含む。
【0034】
本明細書で使用される場合、SMRTは、ゼロモード導波管(ZMW)を使用する一分子リアルタイムシークエンシングを指す。単一DNAポリメラーゼ酵素が、鋳型としてのDNAの一分子とともにZMWの底部に取り付けられる。ZMWが、組み込まれている単一ヌクレオチドのみを観察するのに十分に小さい照明された観察体積を作り出す。4つのDNA塩基の各々が、4つの異なる蛍光色素の1つに付着する。ヌクレオチドがDNAポリメラーゼにより組み込まれると、蛍光タグが切断され、ZMWの観察エリアから拡散し、そこではその蛍光をもはや観察できない。検出器が、ヌクレオチド組込みの蛍光シグナルを検出し、色素の対応する蛍光に従って塩基コールが行われる。
【0035】
本明細書で使用される場合、CTまたはctは、サイクル閾値、またはRT-PCRによりウイルス(例えば、SARS-CoV-3)核酸を増幅および検出するために必要とされる総サイクル数を指す。
【0036】
本明細書で使用される場合、遺伝子座ループ捕捉は、分子反転プローブを使用してウイルスゲノム内の目的の領域に結合し、それを増幅するプロセスである。
【0037】
本明細書で使用される場合、CCSまたは環状コンセンサスシークエンシングリードは、捕捉されたDNA断片の長さを複数回シークエンシングすることによって生シークエンシングデータのエラーが補正された、処理されたリードである。
【0038】
本明細書で使用される場合、反復性(またはイントラアッセイ精度)は、同じ被解析物の、同じ測定条件下で行われた、連続測定の結果間の一致の近似性を言い表す。イントラアッセイ反復性は、同じ検体が1回の解析実行中に解析されたときの可変性の測定値である。
【0039】
本明細書で使用される場合、再現性(またはインターアッセイ精度)は、同じ被解析物の、同じ測定条件下で行われた、連続測定の結果間の一致の近似性を言い表す。インターアッセイ反復性は、同じ検体が1回より多くの実行中に解析されたときの可変性の測定値である。
【0040】
本明細書で使用される場合、一致度は、測定された値と、従来真として受け入れられている値または受け入れられている参照値との間の一致の近似性の尺度となる。これは、「究極の判断基準」、または新たな方法を比較することができる許容されている方法を必要とし得る。
【0041】
本明細書で使用される場合、解析妥当性は、特定の配列(被解析物)が存在するときに検査が陽性となる確率(解析感度)、およびその配列が非存在であるときに検査が陰性となる確率(解析特異度)を確立することを必要とする。次世代シークエンシング(NGS)において、解析感度は、アッセイが、存在する場合には標的となる配列変化、アッセイから導出される核酸配列、および参照配列を検出することとなる、尤度であり得る。NGSについて、解析特異度は、アッセイが、配列変化を、存在しない場合、検出しないことになる確率と定義される(偽検出率は、シークエンシングアッセイの有用な測定値である)。
【0042】
本明細書で使用される場合、特異度は、被解析物だけを測定する測定手順の能力を定義する。
【0043】
本明細書で使用される場合、核酸投入量に対するアッセイ許容度は、反応に加えられる被解析物の量の変化に対する許容度である。
【0044】
本明細書で使用される場合、GISAIDは、世界的な科学イニシアティブであり、インフルエンザおよびコロナウイルス(例えば、COVID-19)データについてのゲノムデータへのオープンアクセスを提供する2008年に設立された主要情報源である。データベースは、SARS-CoV-2配列についての世界最大のリポジトリーとなっている。GISAIDは、新たなCOVID-19ウイルス株の出現をモニターするための、ゲノム疫学およびリアルタイムサーベイランスを容易にする。
【0045】
本明細書で使用される場合、動作が、何かに「基づく」とき、これは、その動作が、その何かの少なくとも一部に、少なくともある程度、基づくことを意味する。
【0046】
NGS SARS-CoV-2株決定のための方法
COVID-19を引き起こし得るSARS-CoV-2のバリアントを同定および追跡するための方法およびシステムが開示される。方法およびシステムを様々な仕方で具現化することができる。
【0047】
ある特定の実施形態では、方法は、SARS-CoV-2のバリアントを同定および/または追跡するための方法であって、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップを含む方法を含み得る。
【0048】
方法は、COVIDステータスが分からない試料を利用することもあり、またはCOVIDに対して以前に検査で陽性と出た試料を使用することもある。ある特定の実施形態では、陽性試料は、承認されたEUA承認COVID-19 RT-PCR Test(例えば、Labcorp EUA200011および/またはEUA203057)を使用して同定され得る。このように、結果は、試料中のウイルスRNAの検出後の個体を感染させるSARS-CoV-2株の同定についての結果である。
【0049】
ある実施形態では、シークエンシングは、ウイルスゲノムの大部分をカバーする。したがって、試料SARS-CoV-2ゲノムがRT-PCRにより増幅される、ある特定の実施形態では、得られたcDNAは、その後、ウイルスゲノムに沿って間隔を空けて結合するタイル型プライマーを使用してさらに増幅される。ある特定の実施形態では、タイル型プライマーは、隣接するプライマーが互いに600bp離れているような間隔で配置される。このようにして、SARS-CoV-2ゲノムは、新たなバリアントの存在または非存在にかかわらず非常に効率的に増幅される。例えば、ある特定の実施形態では、核酸シークエンシングは、全ウイルスゲノムの少なくとも80%、または必要に応じて少なくとも85%、または必要に応じて少なくとも90%、または必要に応じて少なくとも95%をシークエンシングすることを含む。
【0050】
増幅された核酸分子を、配列を識別する分子バーコードで標識することができる。例えば、ある特定の実施形態では、タイル型プライマーは、バーコード配列の付加のためのアダプター、および/または核酸シーケンシングのためのユニバーサルプライマー部位をさらに含むプライマーである。
【0051】
ある特定の実施形態では、試料特異的SARS-CoV-2核酸を生成するステップは、逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)を使用して試料特異的SARS-CoV-2 cDNAを生成することを含む。
【0052】
また、ある特定の実施形態では、試料特異的SARS-CoV-2核酸を生成するステップは、試料特異的SARS-CoV-2核酸(例えば、Molecular Loop SARS-CoV-2 Sequencing Panel)を生成する手段として反転型分子プローブと組み合わせて標的次世代シークエンシングを使用することを含む。例えば、ある特定の実施形態では、試料特異的SARS-CoV-2核酸を生成するステップは、試料SARS-CoV-2 cDNAの1本の鎖を、ペアのSARS-CoV-2プローブを含む一本鎖プローブDNA鋳型とハイブリダイズさせることをさらに含み、第1のプローブは、プローブDNA鋳型の3’末端に位置し、第2のプローブは、プローブDNA鋳型の5’末端に位置する。このようにして、3’プローブは、フォワードプライマーとして機能し、5’プローブは、リバースプライマーとして機能する。
【0053】
ある特定の実施形態では、プローブ配列は、SARS-CoV-2ゲノムに沿って間隔を空けて結合するタイル型プローブとして選択される。ある実施形態では、Wuhan-Hu-1 SARS-CoV-2参照ゲノム(NC_045512)(www.ncbi.nlm.nih.gov/nuccore/NC_045512で入手可能)が使用される。または、他の公知の参照ゲノムが使用され得る。例えば、代替実施形態では、プローブは、約100、または200、または300、または400、または500、または600、または700、または800、または900塩基対、または1,000より多くの塩基対分、間隔が空いていることがある。または、この範囲内の間隔(例えば、450、550、650または750)が使用され得る。プローブは、30kb SARS-CoV-2ウイルスゲノムの99%より多く(例えば、99.6%)にわたってタイリングされ得る。プローブは、配列にわたって、および/または平均で所与のヌクレオチドが2X、7X、22Xのもしくはそれより多い配列を提供するように、タイリングされ得る。
【0054】
また、ある特定の実施形態では、一本鎖プローブDNA鋳型は、プローブ配列に隣接する位置にあるユニバーサルシークエンシングプライマー(例えば、M13プライマー)をさらに含む。これらは、ユニバーサルプライマー配列と下流のバイオインフォマティック解析のための特有の試料特異的バーコーディングとをマッチさせることによって濃縮を可能にし得る。加えて、ある特定の実施形態では、および本明細書でより詳細に開示されるように、一本鎖プローブDNA鋳型は、SARS-CoV-2試料特異的核酸を試料番号と相関させるために使用されるバーコード配列の付加のためのアダプター配列をさらに含む。一部の場合には、バーコードを、試料および/または患者の出身地の郵便番号と相関させることができる。また、方法は、2つのプローブ間の配列を埋めて、2つのプローブ配列間に試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を生成すること、次いで、試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を試料特異的SARS-CoV-2 DNAから遊離させること、および核酸シークエンシングのための鋳型として使用される直鎖状DNAを生成するための試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型の消化を含み得る。ある特定の実施形態では、次いで、直鎖状プローブDNA鋳型は、アダプターを付加するために改変され、次いで、DNAシークエンシングのためにPCR増幅(濃縮)される。ある特定の実施形態では、濃縮ステップは、精製ステップ(例えば、ビーズによる精製)を含む。例えば、ある特定の実施形態では、シークエンシングのための基質がRT-PCRにより生成され、次いで、ほとんどの塩基が22のMIPによってカバーされるSARS-CoV-2ゲノムの99.6%からcDNAに逆転写されたRNAを増幅するように設計された約1000のタイル型Molecular Loop反転プローブ(MIPS)を使用して、SARS-CoV-2配列が同定される。ある特定の実施形態では、MIPSの中間に合成された産物は、濃縮され、増幅によって付加され続いてシークエンシングされる試料特異的分子バーコードを有する。
【0055】
ある特定の実施形態では、方法は、全ゲノムシークエンシングを用いる。ある特定の実施形態では、次世代シークエンシング(NGS)が使用される。または、他のタイプのシークエンシング、例えば、これらに限定されないが、サンガーシークエンシング、ショットガンシークエンシング、SMRTシークエンシング、パイロシークエンシングまたはナノポアシークエンシングが使用され得る。例えば、ある特定の実施形態では、PacBio全ゲノムシークエンシングが、対応するSMRT link 9ソフトウェアおよび解析ツールとともに、使用され得る。例えば、一実施形態では、方法は、陽性試料からの残存全核酸抽出物を使用するSARS-CoV-2株同定にPacBio全ゲノムシークエンシング検査を用い得る。ある特定の実施形態では、核酸シークエンシングは、全ウイルスゲノムの少なくとも80%、または必要に応じて85%、または必要に応じて90%、またはそれより多くをシークエンシングすることを含む。
【0056】
ある特定の実施形態では、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップは、試料SAR-CoV-2配列をSARS-CoV-2参照ゲノムとアラインして、試料特異的アセンブリおよびコンセンサス配列を生成することを含む。加えて、方法は、試料についての系統をアセスメントするステップを含み得る。ある特定の実施形態では、方法は、対象の地理的位置を同定するステップを含み得る。
【0057】
加えて、本明細書で開示されるように、ある特定の実施形態では、方法は、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの結果を、バリアントが検出された場合にさらなる分類(例えば、系統決定)のためにデポジトリーにアップロードするステップを含み得る。デポジトリーは、CDCデータベースであり得る。または、他の公共のデポジトリーが使用され得る。
【0058】
方法は、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの前にデポジトリーのアップデートが行われたかどうかを決定するステップをさらに含み得る。
【0059】
方法は、手順における様々なステップで自動化され得る。ある特定の実施形態では、方法は、試料プレート設定のためのHamilton Starロボットとともに使用され得る。これに加えておよび/または代えて、Formulatrix Mantis液体ハンドラーまたは他の自動デバイスが、マスターミックス分配に使用され得る。また、本明細書で開示されるように、方法は、プログラム実装型であり得、および/または方法のステップのいずれかを遂行するように構成された命令を含む非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品の使用を含み得る。
【0060】
例えば、ある特定の実施形態では、Ct値<31でのSARS-CoV-2陽性RT-PCR診断検査試料から残存全核酸抽出物が、例えば、本明細書でより詳細に開示されるように、RNA抽出プレートから陽性試料のみを含有する96ウェルプレートへHamilton STARを使用してチェリーピッキングされる。次いで、試料は、1つの水無鋳型対照(NTC)を伴う95の試料のシークエンシング実行プレートに分取され得る。方法は、必要に応じて拡大縮小され得る。例えば、ある特定の実施形態では、8つのプレート、または760の検体が、1つの生産バッチで処理され得る。
【0061】
図1は、本開示の方法100の実施形態の例を示す。
図1に示されているように、検査のための、必要に応じてSARS-CoV-2に対して陽性の試料が、対象から得られる102。ある実施形態では、SARS-CoV-2 cDNA配列は、RT-PCTにより生成される104。次いで、SARS-CoV-2 cDNAが一連のタイル型プローブとともにインキュベートされ得る106。ある特定の実施形態では、タイル型プローブは、SARS-CoV-2ゲノムにわたって比較的等間隔で配置される。結合後、2つのプローブの中間の領域がDNAポリメラーゼで埋められ、ライゲーションされて、2つのプローブ配列間に位置する試料特異的SARS-CoV-2核酸配列を有する閉じた環状分子(すなわち、環状プローブ鋳型)が形成され得る108。非結合または不完全ループは、直鎖状分子のままであり、エキソヌクレアーゼ消化によって除去され得る110。また、この時点で、環状プローブ鋳型分子が、試料cDNAから遊離され得る(すなわち、PCR増幅反応での変性中に)110。次いで、プローブが直鎖状にされ、3’M13ユニバーサル配列および5’試料特異的バーコードを用いる増幅によって濃縮され得る112。次いで、試料が等体積でプールされ114、ライブラリーがシークエンシングのために調製される116。この時点で、試料は、本明細書で開示されるようにシークエンシングされ、結果が解析され300、報告される400。
【0062】
図2は、配列解析のためのSARS-CoV-2特異的配列を捕捉するための方法の一部分の代替説明図を提供する。したがって、ある特定の実施形態では、カスタムMolecular Loop SARS-CoV-2捕捉キットが、シークエンシングするための試料を調製するために使用される。ある特定の実施形態では、本明細書で開示されるように、シークエンシングは、PacBio Sequel IIシーケンサーを使用して遂行される。したがって、逆転写酵素が、RNAからcDNAを合成するために使用される。次いで、SARS-CoV-2 cDNAは、molecular loopプローブのハイブリダイゼーションの標的として使用される(
図2、ステップ1)。molecular loopプローブは、30kb SARS-CoV-2ウイルスゲノムの99%より多く(例えば、99.6%)にわたってタイリングされ、おおよそ600bp離れている2つの結合部位からなり得る。結合後、2つのプローブの中間の領域が、DNAポリメラーゼで合成され、ライゲーションされて、閉じた分子が形成される(
図2、ステップ2)。非結合または不完全ループは、直鎖状分子のままであり、エキソヌクレアーゼ消化によって除去される(
図2、ステップ3)。次いで、環状分子は、鋳型cDNAから遊離され(
図2、ステップ4)、次いで直鎖状にされ(例えば、X1での消化により)、3’molecular loop特異的M13ユニバーサル配列および5’試料特異的バーコードを用いる増幅によって濃縮される(
図2、ステップ5)。
図2中のP1およびP2は、バーコード付加に使用され得るアダプターである。次いで、試料は、等体積でプールされ、ライブラリーがPacBioシークエンシングのために調製される。ライブラリー調製は、DNA損傷修復、シークエンシングアダプターのライゲーション、ライゲーションされていない産物の酵素消化による除去、およびビーズによる精製を必然的に伴い得る。次いで、ライブラリーは、PacBio Sequel IIにおいて、例えば15時間ムービーを用いて、シークエンシングされ得る。
【0063】
図3に示されているように、この時点で、シークエンシングステップおよびデータ解析ステップが遂行され得る300。したがって、ある特定の実施形態では、方法は、配列解析のためのコンピュータ実装ステップを含み得る。ある特定の実施形態では、全ゲノムシークエンシングが遂行される302。ある特定の実施形態では、シークエンシングは、一分子リアルタイム(SMRT)ロングリードシークエンシング技術を利用する。ライブラリー調製から生成された環状鋳型が、ポリメラーゼおよびプライマーと結合され、SMRTCell(シークエンシングセル)にロードされる。一分子産物は、ポリメラーゼが底部に固定化されている800万のゼロモード導波管(ZMW)ウェルのうちの1つに拡散する。次いで、リン酸基連結ヌクレオチドがZMWに導入され、次いで、塩基がポリメラーゼにより組み込まれ得る。所与の塩基対が組み込まれると、その付加によってヌクレオチド特異的発光が生じ、それが、ウェルごとにカメラにより検出される。このプロセスは、一定の時間、またはムービー長にわたって反復され、所与のウェル上のヌクレオチドの順序が解析され、長い配列リード出力の際に対応するヌクレオチドに翻訳される。
【0064】
次に、データは、配列ファイルとしてアセンブルされ得る303。例えば、ある特定の実施形態では、PacBio SMRT LINKソフトウェアおよびカスタムmolecular loop処理スクリプトが、各試料のFASTQファイルを生成するために使用され得る。FASTQは、CLC genomics serverバージョン6.5.6を使用して実装されるゲノム解析パイプラインを使用して解析され得る。または、他のシークエンシング解析システムが使用され得る。この時点で、シークエンシングプライマー配列は、除去され304、配列がSARS-CoV-2参照ゲノム(例えば、NC_045512v2)とアラインされて、アラインメントのbamファイルが生成され得る306。ある特定の実施形態では、Minimap2が、アラインメントを生成するために使用され得る。または、他のアラインメントプログラムが使用され得る。ある実施形態では、次いで、50%の最小カバー率を満たす試料は、各試料についてのコンセンサス配列を生成するために、バリアントをコールするためのおよび試料特異的ゲノムアセンブリを生成するための入力データとして使用される308。または、他の最小カバー率限度(例えば、20、30、40、60、70、80、90パーセント)が使用され得る。ある実施形態では、コンセンサス配列は、VCFcons(www.biorxiv.org/content/10.1101/2021.02.26.433111v1で入手可能)を使用して生成され得る。または、別のアルゴリズムが使用され得る。ある実施形態では、コンセンサス配列を生成するための定義された閾値がある。例えば、ある特定の実施形態では、VCFconsがゲノム構築のためのヌクレオチド配列をコールする場合、それは、その塩基対をカバーする少なくとも4の環状コンセンサスシークエンシング(CCS)リード、および>50%の参照配列と比較される代替対立遺伝子頻度を有さなければならない。ヌクレオチドが、4未満のリードを有する場合、それは、コンセンサス配列におけるN(定義されていないヌクレオチド)として報告される。
【0065】
試料系統の割り当ては、ある特定の実験変数および/または対照を考慮に入れ得る310。例えば、ある特定の実施形態では、外部鋳型なし対照(NTC)の評価が、結果の妥当性をアセスメントするために使用される310。これに加えておよび/または代えて、外部陽性鋳型対照(PTC)が、プレートの十分な処理を実証するために加えられ得る310。さらに、ある特定の実施形態では、成功した実行からの特有の株(入手可能な場合)が株型ごとにプールされ得、各々の特有のプールされた株が、プレート処理にわたってプレート起源を保証するためにバッチ(例えば、8つ1セットのシークエンシングプレート)にわたってプレートに添加され得る。外部無鋳型対照(NTC)は、マスターミックス夾雑事象が所与の増幅プレートに存在しないことを保証するために必要とされ得る。NTCは、試料添加前にあらゆる96ウェル陽性プレートの定義された位置(例えば、A1位置)に添加される水(例えば、分子グレードの水)を含み得る。または、他のNTC(例えば、緩衝液)が使用され得る。次いで、NTCは、陽性試料とともにシークエンシング実行プレートに移され、シークエンシングおよび(品質管理)QC解析に付され得る。
【0066】
ある特定の実施形態では、シークエンシング後、所与のプレートの陽性対照の株タイピングが、処理前に添加された記録された株と比較され得る。割り当てられたプレートの株タイピング間の不一致が、個々のプレートを続行するかどうかを決定するために、さらに調査され得る。例えば、ある特定の実施形態では、陽性対照結果を一致させることができないことは、所与の対照のプレートに関連する全ての株の除去につながり得る。他の実施形態では、バッチの他のプレート内の対応する対照によってプレート交換の可能性が排除され得る場合、陽性対照の反応の失敗は、必ずしも結果の除去に至るとは限らない。
【0067】
ある特定の実施形態では、シークエンシングおよびNTC解析の後、媒体CCSリードの平均値が10CCSリードの判定基準の合格についてコンピュータ解析され得る310。ある特定の実施形態では、所与の96ウェルシークエンシングプレートについて陽性の試料の結果をリリースするには、NTCが、定義されたレベル中央値の平均値(例えば<10)CCSリードを返さなければならない。プレートの所与のNTCのCCSリード中央値の平均値が、CCSリードの定義されたレベルよりも高い場合、プレート上の全ての対応する試料は、反復されるようにスケジューリングされ得る。
【0068】
次いで、この時点で、個々の試料についての系統が、コンセンサス配列を使用して割り当てられ得る312。ある実施形態では、これは、Pangolin解析パッケージへの入力として遂行される。または、別の解析が使用され得る。ある特定の実施形態では、株系統結果は、90%ゲノムカバー率を有する、および/または全ゲノムにわたってリードカバー率中央値の平均値が>10環状コンセンサス配列(CCS)リードである、試料についてリリースされる314。ある実施形態では、異なるCCSリード測定基準は、ヌクレオチドレベル(4CCSリード)におよびゲノムレベル(10CCSリード)に基づく。
【0069】
ある特定の実施形態では、株決定結果のアセスメントは、NTC解析、およびNTCが不合格となったプレート上の任意の試料の除去の後に遂行される。次いで、個々の試料結果がCCSリード中央値の平均値>10CCSについてコンピュータで調査され、ゲノムカバー率パーセントは、>90%である。ある特定の実施形態では、検査結果は、地方、州および連邦政府の要請に従って医療提供者および関連公共保健機関に報告され得る。ある特定の実施形態では、これらの基準を満たさない試料は、解析で不合格となり、株タイピングは報告されない。これに加えておよび/または代えて、陽性試料のみが検査されるとき、方法は、感染ステータスがウイルスの全ゲノムシークエンシング結果によって左右されないSARS-CoV-2感染ステータスの検出には使用されない。
【0070】
データ解析
配列データの解析は、ある特定の実施形態では、前処理(すなわち、上流)ステップおよび後処理(すなわち、下流)ステップを含み得る。ある特定の実施形態では、これらのステップの少なくとも一部は、データ解析のためのコンピュータ実装ステップを含む。上流解析は、完了についてシーケンサー実行をモニターすることと、個々の試料FASTQファイルを生成するために逆多重化することと、アラインメントおよびバリアントコールを生成するためにSARS-CoV-2参照ゲノムとの各々のアラインメントを始動させることとを含み得る。各SMRTCellにおける試料についての下流解析は、各試料についての系統分類を含む結果全てを生成することから構成され得る。
【0071】
上流解析
シークエンシングデータの上流解析のための方法の例400が、
図4に示されている。このように、ある特定の実施形態では、解析起動のために、PacBio/Molecular Loop生シークエンシングデータが寄託され、作成されたCCS BAMファイルが逆多重化のためにコピーされ得る。ある実施形態では、シーケンサーで不首尾に終わった試料は、データファイルを生成しない。反復されるように指定されるこれらの試料は、配列解析を続けない。
【0072】
この時点で、個々の試料FASTQファイルの生成が遂行され得る。ある実施形態では、CCS BAMファイルの生成、逆多重化、およびFASTQファイルの生成は、本明細書における実施例で開示されるように遂行される。または、他の方法が使用され得る。したがって、ある特定の実施形態では、前処理は、環状コンセンサス配列(CCS)BAMファイルを生成するステップ(402);中間BAMファイルをマージするステップ(404);異なるバーコードの組合せに対応する個々の生成したBAMファイルを使用して逆多重化するステップ(406);逆多重化された出力データを試料名および/または患者識別子ごとに組み合わせるステップ(408);配列からバーコードを除去し、個々の試料FASTQファイルを生成するステップ(410);配列をバーコードとアラインし、バーコードをトリミングするステップ(412);BAMファイルをFASTQファイルに変換し、FASTQおよびCCS BAMファイルを最終位置にコピーするステップ(414);ならびにCLCワークフローを始動させるステップ(416)のうちの少なくとも一部を含み得る。
【0073】
CLC解析ワークフローは、以下のステップを使用して遂行され得る。先ず、NGSデータ解析ワークフローが、現行の有効性が認められているCLC Genomics Serverバージョンを使用して、各試料に対して実行され得る418。次に、各試料のFASTQファイルについて、以下のステップが遂行され得る。先ず、リードが、250~5000bp長のリードを保持するようにフィルタリングされ得る420。次に、リードは、SARS-CoV-2参照ゲノム(例えば、「NC_045512v2」)とアラインされる422。このアラインメントは、BAMファイルを生成するためにminimap2を使用して遂行され得る。または他のアラインメント方法が使用され得る。この時点で、ローカルリアラインメントが遂行され、バリアントコールが行われ得る424。これは、CLC Genomics ServerでLow Frequency Variant Detectionツールを使用して遂行され得る。または、他の方法が使用され得る。この時点で、アセンブリ(BAMファイル)および検出されたバリアント(cf)の両方が、下流の後処理解析に入力される426。スクリプトがCLCプロセス完了を検出し、それによって、各SMRTcellにおける試料の下流解析の開始が生じる。
【0074】
下流解析
下流(後処理)解析のフローチャートの例500が、
図5に示されている。後処理第1部(501)のステップは、ある特定の実施形態では、次の通りであり得る。適切な参照ファイルを使用して、VCFConsが、各試料についての配列アラインメントおよびバリアントコールに基づいてコンセンサス配列を生成するために使用され得る502。この解析のために、4CCSリードの最小カバー率および0.5の最小代替頻度が、塩基を各ゲノム位置に割り当てるために使用され得る。または、異なる閾値が適用され得る。ある実施形態では、この基準を満たさない位置は、曖昧塩基「N」に割り当てられる。次に、配列塩基組成が生成され得る504。ある実施形態では、これは、後に非曖昧塩基のパーセンテージを決定するために使用され得る。ある特定の実施形態では、この解析は、Seqtkまたは代替アルゴリズムを用いて遂行され得る。この時点で、コンセンサス配列を入力データとして使用して、(a)クレード割り当て、(b)変異コーリング、および(c)試料配列品質チェックのいずれか1つまたは全てを、必要に応じて生じさせることができる506。ある実施形態では、Nextcladeがこの解析に使用される。または、ある特定の実施形態では、他のアルゴリズムが使用され得る。この時点で、系統が割り当てられる508。ある特定の実施形態では、Pangolinは、SARS-CoV-2系統を生成すること(Pango命名法として公知)、次いで、SARS-CoV-2ゲノム配列系統(Pango系統)を割り当てることにより、コンセンサス配列に系統を割り当てる。ある実施形態では、Pangolinは、少なくとも50%非曖昧塩基を有するゲノムのみを考慮するように設定される。最後に、カバー率統計データが生成され得る510。ある特定の実施形態では、SummaryStatが、Nextclade、PangolinおよびSeqtkからの結果をコンパイルし、アンプリコンカバー率中央値の平均値およびゲノムカバー率パーセントをはじめとする、後のQCに必要なカバー率統計データを生成する。または、別のアルゴリズムがコンパイルに使用され得る。ある特定の実施形態では、この解析のために、全SARS-CoV-2ゲノムに及ぶ29のオーバーラップ1.2kb領域における塩基のカバー率中央値が、試料の各々について計算される。または、他の閾値が使用され得る。次いで、これらのカバー率値(最小値、第1四分位値、平均値、中央値、第3四分位値、および最大値)の分布の統計データが、各試料について計算され得る。また、ゲノムカバー率パーセントが、総配列長で割った非曖昧塩基(A、T、C、G)の数として計算され得、系統分類が集約され、Nextclade結果およびPangolin系統コールを生じさせる試料のみが、さらなる処理のために保持される。
【0075】
この時点で、後処理第2部(503)が開始され得る。したがって、適切な参照ファイル、株サーベイランス特異的メタデータ509、510(人口統計データ、ゲノムカバー率パーセント、およびRT-PCRアッセイからのCt値)を再び使用してQCが遂行され、データが結果に加えられる512。ある実施形態では、メタデータを欠いている試料は、結果セットから除外される516。また、無鋳型QCは、鋳型なし対照(NTC)に基づいて遂行される516。また、ある特定の実施形態では、29のゲノム領域のカバー率中央値の平均値が、>10CCSリードである場合には、同じプレート上のシークエンシングされた全ての試料が除去される516。最後に、カバー率QCが遂行される516。ある実施形態では、ゲノムカバー率>=90%を有する試料が、結果に保持される。また、ある実施形態では、およびカバー率中央値の平均値>10CCSリードを有する試料が、結果に保持された。次いで、結果は、対応するPangolin系統を伴う患者レポートを生成するためにReport Systemの場所に転送され得る514。ある実施形態では、結果を生じさせることができなかった試料は、系統を決定することができなかったと報告される。SARS-CoV-2ウイルスが検出されても、系統情報が報告されないことがある。
【0076】
ある特定の実施形態では、系統コーリング基準は、次の通りであり得る。組み入れ基準:(1)CT<31;(2)対応するメタデータ(株サーベイランス);(3)>90%ゲノムカバー率;(4)カバー率中央値の平均値>10CCSリード;(4)合格NTC対照;ならびに(5)Nextclade結果およびPangolin系統コール。除外基準:(1)CT>31;(2)欠測メタデータ(株サーベイランス);(3)<90%ゲノムカバー率;(4)カバー率中央値の平均値<10CCSリード;および(4)不合格NTC対照。
【0077】
再検証
ある特定の実施形態では、アッセイは、新たなバリアントの出現に応じて再検証される。ある特定の実施形態では、これらのステップの少なくとも一部は、再検証解析のためのコンピュータ実装ステップを含む。ある特定の実施形態では、SARS-CoV-2ウイルスの新たなバリアント(すなわち、系統)の出現およびpangolin分類ソフトウェアの付随する変更に応じて、Virseqアッセイ600の分類精度を再検証することが、
図6に描示されているように遂行され得る(実施例5も参照されたい)。
図6に描示されている解析は、pangolin用に開発されたものであるが、ウイルスの系統発生学的割り当て用の他のデータベースに適用することができる。pangolinソフトウェアは、Dockerhubによって(hub.docker.com/r/staphb/pangolinで)配給されている。したがって、ある特定の実施形態では、pangolinサイトがモニターされ602、アップデートされたdockerコンテナを一定間隔で(例えば、週1回、2週間に1回、月1回)ダウンロードし、インストールすることによってアップデートについてチェックされ得る604。ある実施形態では、アップデートがない場合、何もする必要がない606。
【0078】
アップデートがあった場合、社内実験室データを使用して回帰解析が遂行され得る601。ある実施形態では、新たなpangolinバージョンが、社内参照試料608の系統を決定するために使用され得る610。参照試料セット608は、様々なセット(例えば、発生および/またはCOVID型の、日付に基づく)からのデータを含み得る。例えば、データセットは、主としてデルタバリアントおよび/またはオミクロン系統であると定義され得る。または、他の型が解析され得る。ある実施形態では、参照セット中の各試料は、そのコンセンサス配列、ならびに以前のpangolinバージョンにより行われたその系統分類の履歴を含む。参照試料セット608は、pangolinバージョンがアップデートされるにつれてより新しい、より保有率が高い系統を代表する試料を含むように、定期的にアップデートされ得る。
【0079】
次に、pangolin出力形式の変更があったかどうかを決定するために、pangolinソフトウェア出力の形式が以前のバージョンのものと比較され得る612。何らかの変更があった場合、これらの変更が記録され、実験室パイプラインがその変更に対応するように修正され得る。次いで、修正バージョンが、検査のためのQC環境に配備され得る614。次に、系統コールのあらゆる変更が、アセスメントされ、ソフトウェアアップデート変更記録から予想されるものと比較され得る616。例えば、ある特定の実施形態では、予想される変更は、亜系統間の再割り当てを含む。系統の何らかの予想外の変更(例えば、アルファへのデルタ亜系統の変更)があった場合、これらが詳細に調査され、記録される618。
【0080】
この時点で、第2の回帰検定が、公表されている(GISAID)配列およびそれらのメタデータを使用して遂行され得る603。または他の公共データベースが使用され得る。この解析のために、最新のGISAID配列がダウンロードされ、全てのGISAID配列についてのメタデータおよびpangolin系統が得られ、懸念されるバリアント(VOC)(すなわち、CDCおよび/または他の保健機関により積極的に追跡されているバリアント)および注目すべきバリアント(VOI)(すなわち、CDCおよび/または他の保健機関によりモニターされているバリアント)のリストが、系統についてのWHOアップデートおよび最新の完全リストに基づいてアップデートされ得る620。次に、データシミュレーターが、社内アッセイのカバー率およびエラー特性をモデル化するために使用され得る622。ある実施形態では、シミュレーターは、GISAID配列を出発点として使用し、シミュレーションしたカバー率およびエラーを社内試料の収集物からの経験的カバー率プロファイルおよび最大-マイナー対立遺伝子頻度に基づいてインポーズする。得られたシミュレーション試料は、pangolinに通され、系統分類が、元のGISAID配列のものと比較される。分類安定性は、変異配列がそれらの予想系統分類を維持する率として定義される。ある実施形態では、回帰に関する2つの実験が、シミュレーションによる分類安定性をアセスメントするために実行される。したがって、方法は、各VOC/VOIについての最大100のGISAID配列をランダムにサンプリングして、これらの重要な系統の分類安定性を、入手可能なシークエンシングデータ中のそれらの頻度に関係なく、アセスメントすることができる624。または、各VOC/VOIについてのより多くのまたはより少ないGISAID配列(例えば、50、200、400、500またはそれより多く)を、解析の必要に応じて、サンプリングすることができる。これは、新興バリアントおよび既存のものの新たな亜系統の、分類安定性をアセスメントすることを可能にし得る。加えて、方法は、系統分類安定性の頻度に基づくレトロスペクティブ解析のためにデータベースから10,000のGISAID配列をランダムにサンプリングすることができる626。または、より多くのまたはより少ないレトロスペクティブGISAID配列を、解析の必要に応じて、サンプリングすることができる。これは、安定性を過去の保有率と比較して定量化することを可能にし得る。
【0081】
次いで、データシミュレーター実験の出力データが再考され、VOC/VOIデータついてのGISAIDデータ628およびレトロスペクティブデータ630を使用して以前の回帰検定に関する分類安定性の予想外の変更がチェックされる。ある特定の実施形態では、あらゆる予想外の不安定性が調査され、記録される632。ある特定の実施形態では、ある特定のパラメーターを満たすとアップグレードが受け入れられる。一部の場合には、シミュレーションデータと参照配列との間のVOC/VOI一致度中央値が少なくとも90%であった場合、アップグレードがリクエストされる640。これらの基準が満たされない場合、追加の調査が必要とされ得る。
【0082】
ある特定の実施形態では、新たな不一致系統が新規のものであった場合、試料は、確認のために検査され得る。不一致バリアントが、新規バリアントでなかった場合、方法は、不一致の根本原因を見つけるためのさらなる調査を含み得る。これは、参照配列のカバー率はもちろん、それが特定の領域における塩基カバー率の望ましくない降下でないことを保証するためにシミュレーションした配列も、調べることを含み得る。これに加えておよび/または代えて、これは、この不一致が再現されるかどうかを見るために別のシードでのシミュレーションを再実行することを含み得る。再現された場合、アップグレードは中止され得る。
【0083】
この時点で、新規バリアントは、本明細書で開示される方法およびシステムを使用してアセスメントされ得る650。新興バリアント(系統)のサーベイランス成功のために、in silico解析を行うことによりmolecular loop反転プローブ増幅に対する潜在的影響を再考することは、有益であり得る。したがって、方法は、新興系統の個々の配列バリアントおよび関連molecular loopプローブの位置を同定して、プローブ結合に干渉する可能性をアセスメントするステップをさらに含み得る。ある実施形態では、任意のプローブとオーバーラップする新規配列バリアントがハイブリダイゼーションに影響を及ぼすことになるという控えめな推定が使用される。これに加えておよび/または代えて、領域内の隣接するプローブが、新規配列バリアントのカバー率を確保するために再考され得る。特定の領域内のカバー率の低下をもたらし得る任意の配列バリアントについて、pangolin系統アップデート検証サマリー内の影響を受けるプローブが記録される。
【0084】
NGS SARS-CoV-2株決定のためのシステム
本明細書における方法を遂行するためのシステムも開示される。例えば、システムは、方法の様々なステップを遂行するためのステーションまたはコンポーネント(単数または複数)を含み得る。ある特定の実施形態では、ステーションまたはコンポーネントは、方法のステップ(単数または複数)を遂行するための、ロボットまたはコンピュータによる制御ステーションまたはコンポーネントを含み得る。ある特定の実施形態では、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップのうちの少なくとも一部を遂行するためのシステムが、開示される。
【0085】
したがって、システムは、検査用の試料を得るためのステーションまたはコンポーネントを含み得る。試料は、COVIDステータスが分からないものであることも、COVIDに対して以前に検査で陽性と出た試料であることもある。ある特定の実施形態では、陽性試料は、承認されたEUA承認COVID-19 RT-PCR Test(例えば、Labcorp EUA200011および/またはEUA203057)を使用して同定され得る。このように、結果は、試料中のウイルスRNAの検出後の個体を感染させるSARS-CoV-2株の同定についての結果である。
【0086】
ある特定の実施形態では、システムは、逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)を使用して試料特異的SARS-CoV-2 cDNAを生成することを含む試料特異的SARS-CoV-2核酸を生成するステップを遂行するためのステーションまたはコンポーネントを含み得る。システムは、試料SARS-CoV-2 cDNAの1本の鎖を、ペアのSARS-CoV-2プローブを含む一本鎖プローブDNA鋳型とハイブリダイズさせるためのステーションまたはコンポーネントも含み得、第1のプローブは、プローブDNA鋳型の3’末端に位置し、第2のプローブは、プローブDNA鋳型の5’末端に位置する。ある特定の実施形態では、プローブ配列は、SARS-CoV-2ゲノムに沿って間隔を空けて結合するタイル型プローブとして選択される。例えば、代替実施形態では、プローブは、約100、または200、または300、または400、または500、または600、または700、または800、または900塩基対、または1,000より多くの塩基対分、間隔が空いていることがある。または、この範囲内の間隔(例えば、450、550、650または750)が使用され得る。プローブは、30kb SARS-CoV-2ウイルスゲノムの99%より多く(例えば、99.6%)にわたってタイリングされ得る。また、ある特定の実施形態では、一本鎖プローブDNA鋳型は、プローブ配列の内部に位置するユニバーサルシークエンシングプライマー(例えば、M13プライマー)をさらに含む。加えて、一本鎖プローブDNA鋳型は、SARS-CoV-2試料特異的核酸を試料番号と相関させるために使用されるバーコード配列の付加のためのアダプター配列をさらに含み得る。また、システムは、2つのプローブ間の配列を埋めて2つのプローブ配列間に試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を生成すること、次いで、試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を試料特異的SARS-CoV-2 DNAから遊離させること、および核酸シークエンシングのための鋳型として使用される直鎖状DNAを生成するための試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型の消化のための、ステーションおよび/またはコンポーネントを含み得る。ある特定の実施形態では、システムは、アダプターを付加させるために直鎖状プローブDNA鋳型を改変し、次いで、直鎖状DNA鋳型をDNAシークエンシングのために増幅するための、ステーションおよび/またはコンポーネントを含み得る。ある特定の実施形態では、濃縮ステップは、精製ステップ(例えば、ビーズによる精製)を含む。
【0087】
システムは、DNAシークエンシングのためのステーションおよび/またはコンポーネントをさらに含み得る。ある特定の実施形態では、方法は、全ゲノムシークエンシングを用いる。ある特定の実施形態では、次世代シークエンシング(NGS)が使用される。または、他のタイプのシークエンシング、例えば、これらに限定されないが、サンガーシークエンシング、ショットガンシークエンシング、SMRTシークエンシング、パイロシークエンシングまたはナノポアシークエンシング。例えば、ある特定の実施形態では、PacBio全ゲノムシークエンシングが、対応するSMRT link 9ソフトウェアおよび解析ツールとともに、使用され得る。
【0088】
システムは、データ解析のためのステーションおよび/またはコンポーネントをさらに含み得る。したがって、システムは、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを、試料SAR-CoV-2配列をSARS-CoV-2参照ゲノムとアラインして試料特異的アセンブリおよびコンセンサス配列を生成することによって決定するための、ならびに/または試料についての系統をアセスメントするための、ステーションおよび/またはコンポーネントを含み得る。ある特定の実施形態では、システムは、対象の地理的位置を同定するためのステーションおよび/またはコンポーネントを含み得る。
【0089】
加えて、本明細書で開示されるように、ある特定の実施形態では、システムは、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの結果をバリアントが検出された場合にさらなる分類のためにデポジトリーにアップロードすることを含み得る、ステーションおよび/またはコンポーネントを含み得る。デポジトリーは、CDCデータベースであり得る。または、他の公共のデポジトリーが使用され得る。
【0090】
本明細書で開示されるように、システムは、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの前にデポジトリーのアップデートが行われたかどうかを決定するためのステーションおよび/またはコンポーネントを含み得る。
【0091】
システムは、手順の様々なステップを自動化するためのステーションおよび/またはコンポーネントを含み得る。ある特定の実施形態では、Hamilton Starロボットが、試料プレート設定のために使用され得る。これに加えておよび/または代えて、Formulatrix Mantis液体ハンドラーまたは他の自動デバイスが、マスターミックス分配に使用され得る。
【0092】
図7は、本開示の方法ステップのいずれかを遂行するためのシステム700の実施形態を示す。
図7に示されているように、システムは、検査用の試料を得るためのステーションまたはコンポーネント702を含み得る。ある特定の実施形態では、試料は、SARS-CoV-2に対して陽性である。ある実施形態では、システムは、RT-PCTによりSARS-CoV-2 cDNA配列を生成するためのコンポーネントのステーション704を含む。システムは、SARS-CoV-2 cDNAを一連のタイル型プローブとともにインキュベートするためのステーションまたはコンポーネント706をさらに含み得る。ある特定の実施形態では、タイル型プローブは、SARS-CoV-2ゲノムにわたって比較的等間隔で配置される。例えば、代替実施形態では、プローブは、約100、または200、または300、または400、または500、または600、または700、または800、または900塩基対、または1,000より多くの塩基対分、間隔が空いていることがある。または、この範囲内の間隔(例えば、450、550、650または750)が使用され得る。プローブは、30kb SARS-CoV-2ウイルスゲノムの99%より多く(例えば、99.6%)にわたってタイリングされ得る。結合後、2つのプローブの中間の領域が、DNAポリメラーゼで埋められ、ライゲーションされて、閉じた分子が形成され得る。これは、タイル型プローブとともにインキュベートするステップと同じステーションで、または異なるステーションで、異なるコンポーネントを使用して、行われ得る708。非結合または不完全ループは、直鎖状分子のままであり、エキソヌクレアーゼ消化によって除去され得る。これは、タイル型プローブとともにインキュベートするステップと同じステーションで、または異なるステーションで、異なるコンポーネントを使用して、行われ得る。システムは、鋳型cDNAからの環状分子の遊離、ならびに3’M13ユニバーサル配列および5’試料特異的バーコードを用いる増幅による濃縮のためのステーション710をさらに含み得る。システムは、試料のプーリングおよびライブラリー生成のためのステーションおよび/またはコンポーネント712をさらに含み得る。
【0093】
システムは、本明細書で開示される方法を使用する、DNAをシークエンシングするためのステーションおよび/またはコンポーネント714、ならびにコンティグアラインメントおよびバリアント同定のためのステーションおよび/またはコンポーネント716をさらに含み得る。また、システムは、本明細書で開示されるように、結果を検証および報告するためのステーションおよび/またはコンポーネント718を含み得る。
【0094】
本明細書で例証されるように、方法ステップ、ステーションまたはコンポーネントのいずれかは、少なくとも一部はコンピュータ800および/またはプログラム可能なソフトウェアにより、自動化、ロボット制御、および/または制御され得る。したがって、システムは、システムもしくはシステムの任意の部分(例えば、ステーションもしくはコンポーネント)を実行するようにならびに/または開示される実施形態のいずれかの方法のステップ(単数もしくは複数)を遂行するように構成された命令を含む非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品を含み得る。一部の実施形態では、1つまたは複数のデータプロセッサーと、1つまたは複数のデータプロセッサーで実行されたときに、1つまたは複数のデータプロセッサーに、本明細書で開示される1つもしくは複数の方法もしくはプロセスの一部もしくは全てを遂行させるおよび/または本明細書で開示されるシステムの部分のいずれかを実行させる命令を含有する非一時的なコンピュータ可読記憶媒体とを含む、システムが提供される。
【0095】
例えば、1つまたは複数のデータプロセッサーと、1つまたは複数のデータプロセッサーで実行されたときに、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップのうちの少なくとも1つを指示する動作を1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体とを含む、システムが開示される。
【0096】
システムを実行するようにおよび/または開示される実施形態のいずれかの方法のステップ(単数もしくは複数)を遂行するように構成された命令を含む非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品も、開示される。例えば、ある特定の実施形態では、非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品は、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップのうちの少なくとも1つを指示する動作を1つまたは複数のデータプロセッサーに遂行させるように構成された命令を含む。これに加えておよび/または代えて、ある特定の実施形態では、非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品は、(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップのうちの少なくとも1つを指示する動作を遂行するようにシステムのコンポーネントおよび/またはステーションの少なくとも1つに指示する動作を1つまたは複数のデータプロセッサーに遂行させるように構成された命令を含む。
【0097】
システムおよびコンピュータ製品は、本明細書で開示される方法のいずれかを遂行し得る。本明細書に記載される1つまたは複数の実施形態は、プログラマティックモジュール、エンジンまたはコンポーネントを使用して実装され得る。プログラマティックモジュール、エンジン、またはコンポーネントは、1つまたは複数の定められたタスクまたは機能を遂行することができる、プログラム、サブルーチン、プログラムの一部分、ソフトウェアコンポーネントまたはハードウェアコンポーネントを含み得る。本明細書で使用される場合、モジュールまたはコンポーネントは、他のモジュールまたはコンポーネントとは無関係にハードウェアコンポーネント上に存在し得る。あるいは、モジュールまたはコンポーネントは、他のモジュール、プログラムまたは機械の共有要素またはプロセスであり得る。
【0098】
図8は、病原体の検出および/または定量化に使用される解析システム800のブロック図を示す。
図8に示されているように、1つまたは複数のプロセッサーにより実行可能なモジュール、エンジン、またはコンポーネント(例えば、プログラム、コード、または命令)が、様々な実施形態による解析装置システムの様々なサブシステムを実装するために使用され得る。モジュール、エンジン、またはコンポーネントは、非一時的なコンピュータ媒体に記憶され得る。必要に応じて、モジュール、エンジン、またはコンポーネントの1つまたは複数がシステムメモリー(例えば、RAM)にロードされ、解析装置システムの1つまたは複数のプロセッサーにより実行され得る。
図8に描示されている例には、本開示の方法を実装するためのモジュール、エンジン、またはコンポーネントが示されている。
【0099】
したがって、
図8は、本開示によるシステムおよび方法での使用に好適なコンピュータデバイス800の例を示す。コンピュータデバイスの例800は、1つまたは複数の通信バス815を使用してメモリー810およびコンピュータデバイス800の他のコンポーネントと通信している、プロセッサー805を含む。プロセッサー805は、
図1~7に示されているものまたは本明細書の他の箇所で開示されるものなどの異なる例に従って、1つもしくは複数の方法を遂行するために、または病原体レベルを検出するための1つもしくは複数のステーションもしくはコンポーネントを作動させるために、メモリー810に記憶されているプロセッサー実行可能命令を実行するように構成されている。この例では、メモリー810は、本明細書で論じられるような試料または検査ユニット確認の結果を解析すること820ができるプロセッサー実行可能命令825を記憶し得る。
【0100】
この例におけるコンピュータデバイス800は、ユーザー入力を受け入れるための1つまたは複数のユーザー入力デバイス830、例えば、キーボード、マウス、タッチスクリーン、マイクロホンなども含み得る。コンピュータデバイス800は、ユーザーに映像出力を提供するためのディスプレイ835、例えば、ユーザーインターフェースも含み得る。コンピュータデバイス800は、通信インターフェース840も含み得る。一部の例では、通信インターフェース840は、ローカルエリアネットワーク(「LAN」);広域ネットワーク(「WAN」)、例えば、インターネット;メトロポリタンエリアネットワーク(「MAN」);二地点間またはピアツーピア接続などを含む、1つまたは複数のネットワークを使用して通信を可能にし得る。他のデバイスとの通信は、任意の好適なネットワークプロトコルを使用して果たされ得る。例えば、1つの好適なネットワークプロトコルは、インターネットプロトコル(「IP」)、伝送制御プロトコル(「TCP」)、ユーザーデータグラムプロトコル(「UDP」)、またはこれらの組合せ、例えば、TCP/IPもしくはUDP/IPを含み得る。
【実施例】
【0101】
本開示の方法およびシステムのある特定の実施形態を、本明細書における以下の実施例でより詳細に提供する。
【0102】
(実施例1)
全体的な方法および結果の解析
次世代シークエンシング(NGS)を使用して、多数の試料に関して、ならびに懸念される変異およびバリアントをそれらが生じた場合に追跡するのに十分な数のウイルスゲノムを生成するために、サーベイランス検査を遂行することができる。全体的な検査原理は、次の通りである。先ず、第一鎖合成のためにランダムプライミングを使用してウイルスRNAからcDNAを調製する。次に、16時間のハイブリダイゼーション中に反転プローブを標的にアニールする。次に、ギャップを重合およびライゲーションによって埋める。次に、反応しなかった直鎖状プローブを除去し、プローブを標的DNAから遊離させる。次に、捕捉された標的を、非対称バーコードを使用するPCR増幅により濃縮する。次に、PCR産物をプールし、定量化し、SMRTbellヘアピンアダプターをアンプリコンにライゲーションし、15時間ムービーを使用してPacific Biosciences Sequel IIでシークエンシングする。
【0103】
この時点で、NGS配列データの処理に基づいて系統コールを行う。この解析のために、「チェリーピッキングされる」(より詳細に本明細書中で論じられる)どの凝縮陽性も、96ウェル凝縮陽性プレートのウェルA1における鋳型なし対照(NTC)(すなわち、分子グレードの水)を含む。所与のSMRTcellの結果ファイルの生成の前にNTC結果を再考する。NTCが無効であることが分かった場合、影響を受けるプレート上の全ての患者試料についての結果が報告されない。所与のシークエンスセルについてのNGS結果の処理の完了時に、結果ファイルを生成し、保存する。この時点で、PacBio SMRTLNKソフトウェアおよびカスタムmolecular loop処理スクリプトを使用して、試料の各々についてのFASTQファイルを生成する。CLC genomics serverバージョン6.5.6で実装されるゲノム解析パイプラインを使用して、FASTQ結果を解析する。このワークフローは、試料レベルfastqファイルによって開始し、プライマーをトリミングし、次いで、Minimap2を使用してSARS-COVID19参照ゲノム(「NC_045512v2」)とアラインしてアラインメントのbamファイルを生成する。カバー率をチェックした後、bamファイルを、バリアントをコールするためのおよび試料特異的ゲノムアセンブリを生成するための入力データとして使用する。4CCSリードのカバー率および各塩基における50%の代替対立遺伝子頻度を必要とする「VCFcons」を使用して、各試料についてのコンセンサス配列を生成する。Pangolinパッケージを使用して、個々の試料についての系統を割り当てる。
【0104】
(実施例2)
VirSeq SARS-CoV-2 NGS株の決定方法および決定の検証
COVID-19を引き起こすウイルスであるSARS-CoV-2のゲノムシークエンシングは、SARS-CoV-2の特定の株を決定することができる。株情報は、ウイルスに対する公衆衛生上の対応または将来の臨床処置に役立つ有益な情報を臨床医および疫学者に提供できる可能性がある。所与の株の決定は、DNAシークエンシング結果の、元の武漢参照株との比較から検出されるゲノムの複数の変化の組合せに基づく。このアプローチによって、時が経つにつれてウイルスが変化したとき再検証なしにSARS-CoV-2のあらゆる新しいおよび新興株の同定が可能になる。このアッセイの使用目的は、少なくとも90%ゲノムカバー率を生じさせる試料に関してSARS-CoV-2系統または株のコールをもたらすことである。
【0105】
全体的な検査原理は、次の通りである。残存SARS-CoV-2 NAA診断検査陽性試料からの残存全核酸抽出物を、Hamilton STARを使用して実行プレートから凝縮陽性プレートにチェリーピッキングし、1つの生産バッチに8プレートまたは768検体で、96のシークエンシング実行プレートに分取した。次いで、PacBioにおいてMolecular Loop Viral RNA Target Captureを使用して、PacBioシークエンシングまで試料を処理した。先ず、Loopキットの特異的Thermo Fisher VILO逆転写酵素を使用してRNAからcDNAを合成した。次いで、SARS-CoV-2 cDNAを標的として使用して、表1で概説されるようにmolecular loopプローブにアニールした。molecular loopプローブを全30KB SARS-CoV-2ゲノムにわたってタイリングした。これらのプローブは、おおよそ600bp離れている2つの結合部位を含む。
【0106】
【0107】
結合後、2つのプローブの中間のおおよそ600bp領域をDNAポリメラーゼで合成し、表1におけるハイブリダイゼーション条件を使用してさらに60分間、ライゲーションして、閉じた分子を形成した。非結合または不完全ループは、直鎖状分子のままであり、それらをエキソヌクレアーゼ消化によって除去した(すなわち、試料クリーンアップ)。クリーンアップのためのインキュベーション時間を表2に示す。試料を、約2時間以内に次のステップに使用しない場合、-20℃で保管した。
【0108】
【0109】
次いで、得られた環状分子(2つのプローブ部位の間に挿入された試料特異的SARS-CoV-2核酸を含有する)を鋳型cDNAから遊離させ、試料特異的バーコードを用いてPCR増幅した。PCR増幅に使用した条件を表3に示す。768の非対称バーコードの組合せが1つのバッチ(すなわち、768の試料および対照)を処理するために必要である。これを行うために、M13バーコード付きプライマーのプレートを調製し(
図9)、次いで、20μLのM13フォワードバーコード付きプライマーおよび30μLのM13リバースバーコード付きプライマーを添加することにより10の96ウェルプレートを作出した(
図10)。
図9に示されているように、第1~4列は、バーコード1001~1032を尾部に有するM13フォワードプライマーであり、第7~10列は、バーコード1049~1079および1082を尾部に有するM13リバースプライマーであった。32のフォワードプライマーの各々を異なるリバースプライマーと組み合わせて、プレートの1つの例について
図10に示されているような非対称にバーコードが付けられたペアを作出した。
【0110】
【0111】
次に、試料をプールした(またはプーリングを遂行するまで-20℃で保管した)。プーリングのために、8つの反応プレートを保管場所から取り出し、遠心沈降させ、各反応のアリコート(例えば、5μL)を8mL管に移した。一般に、768の試料に加えて対照をシークエンシングの前にプールした。
【0112】
この時点で、AMPure PBビーズでのビーズによる精製を使用して試料を精製した。500μLのプールを使用して、350μLのPB AMPureビーズを添加し、混合し、遠心分離にかけてビーズをペレット化し、5分間、室温でインキュベートし、遠心分離にかけ、磁気分離してビーズを回収することにより、AMPure PB Bead(0.70X)クリーンアップを遂行した。上清を除去し、ビーズを80%エタノールで洗浄し、溶出緩衝液でビーズからDNAを溶出させ、定量した。
【0113】
この時点で、1000ngのプールされたDNAを使用してSMRTbellライブラリーを調製した。プールされたDNAを緩衝液(DNA Prep Buffer)、NAD、DNA Damage Repair Mix v.2と混合し、37℃で30分間インキュベートした。4℃に戻した後、End Prep Mix、Reaction Mix 1の添加、20℃で30分間、65℃で30分間、インキュベートとすること、その後、反応を4℃に戻すことにより、末端修復を遂行した。この時点で、Reaction Mix 2、Overhand Adapter v3、Ligation Mix、Ligation AdditiveおよびLigation Enhancerを使用してアダプターを付加させ、試料を、プローブ構築物をライゲーションするために20℃で60分間、リガーゼを不活性化するために65℃で10分間、インキュベートし、その後、4℃に戻した。次いで、酵素クリーンアップを遂行し、100uLの溶出緩衝液を使用して上記のAMPure(0.6X)ビーズで試料を精製した。次いで、小体積(20uL)の溶出緩衝液を使用しAMPureビーズクリーンアップを反復し、DNAを定量した。
【0114】
試料をPacBio Sequel IIでシークエンシングした。10のバッチにおける各96ウェルプレートは非対称バーコードの特有のセットを必要とする。
図10は、1つのプレートについてのマップの一例を示す。特有の組合せを有する10のプレートを使用するような他の組合せを他のプレートに使用した。例えば、第2のプレートでは、ウェルA1~H4は、M13フォワードプライマー1001~1032とM13リバースプライマー1052の組合せとなり、ウェルA5~H8は、M13フォワードプライマー1001~1032とM13リバースプライマー1053の組合せとなり、ウェルA9~H12は、M13フォワードプライマー1001~1032とM13リバースプライマー1054の組合せとなり、さらなるプレートについては、その他様々である。
【0115】
シークエンシング後、PacBio SMRTLNKソフトウェアおよびカスタムmolecular loop処理スクリプトを使用して、各試料についてのFASTQファイルを生成した。CLC genomics serverバージョン6.5.6で実装されるゲノム解析パイプラインを使用してFASTQを解析した。このワークフローは、試料レベルfastqファイルによって開始し、プライマーをトリミングし、Minimap2を使用してSARS-COVID19参照ゲノム(「NC_045512v2」)とアラインしてアラインメントのbamファイルを生成した。カバー率をチェックした後、このbamファイルを、バリアントをコールするためのおよび試料特異的ゲノムアセンブリを生成するための入力データとして使用した。4CCSリードのカバー率および各塩基における50%の代替対立遺伝子頻度を必要とする「VCFcons」を使用して、各試料についてのコンセンサス配列を生成した。次いで、Pangolinパッケージを使用して個々の試料についての系統を割り当て、その結果を得た。
【0116】
以下の対照を含めた。試料および試薬にわたって夾雑がないことを実証するために全てのステップの実行時に各プレートに鋳型なし対照(NTC)を含めた。この対照をシークエンシングにより解析した。不合格NTCは、90%ゲノムカバー率を有する株のコールを生じさせる試料であった。陽性対照を実行の各プレートに含めた。検証のために、以前に実行した試料を陽性対照として使用した。試料が合格したのか不合格であったのかを決定するための測定基準は、ゲノムカバー率パーセント、カバー率の最小深度、および株系統コール解決率を含んだ。
【0117】
検体要件は、次の通りであった。約90%成功率のために26未満のCTでのEUA承認SARS-CoV-2、NAA検査からの陽性結果を有する試料に由来する抽出核酸。より高いCTまたはCTのないメタデータ試料は、許容可能であるとみなされたが、結果を報告できないリスクを増大した。
【0118】
許容可能な結果測定基準は、次の通りであった:>90%ゲノムカバー率、およびリードカバー率中央値の平均値>10CCSリード。
【0119】
A.結果
精度(反復性):イントラアッセイ
イントラアッセイ反復性を、現行のSARS-CoV-2 CDCサーベイランス検査からの様々な推測タイピングの11の核酸試料の3回の反復実験でアセスメントした。試料は、元の実行ではCT値および広範なリードカウントに幅があった。さらに、試料を1:4希釈して、全てのイントラおよびインターアッセイ実験への十分な全核酸投入を可能にした。判定基準を、SARS-CoV-2ゲノムの≧90%カバー率の報告閾値に達する全ての株の≧95%反復性と定義した。
【0120】
株コール、ゲノムカバー率パーセント(欠測パーセントとして表示する)、およびリードカウントを比較した(表4)。全11試料の株コールは、3回の反復実験にわたって100%の一致度であり、全ての反復実験が、90%ゲノムカバー率および十分なリード深度を満たした。90%ゲノムカバー率を有する株の95%精度の判定基準を満たした。
【0121】
【0122】
精度(再現性):インターアッセイ
インターアッセイ反復性を、現行のSARS-COV-2 CDCサーベイランスからの様々な推測タイピングの10の核酸試料の3回の反復実験でアセスメントした。試料は、イントラアッセイ実験で使用したものと同一であり、最終実行から意図せず除外されたことから欠落した試料が1つあった。試料は、元の実行ではCT値および広範なリードカウントに幅があった。さらに、試料を1:4希釈して、全てのイントラおよびインターアッセイ実験への十分な全核酸投入を可能にした。判定基準を、SARS-CoV-2ゲノムの≧90%カバー率の報告閾値に達する全ての株の≧95%反復性と定義した。
【0123】
株コール、ゲノムカバー率パーセント(欠測パーセントとして表示する)、およびリードカウントを比較した(表5)。全10回の反復実験について、不一致の結果はなかった。9つの試料が、予想された系統コールを三連反復実験にわたって生じさせた。境界リードカバー率のために意図的に選択した1つの試料は、ゲノムカバー率の欠如に起因してどの回も結果を生じさせることができなかった。全体的に見て、試料の93%が同一の株タイピングを生じさせ、試料の100%が、判定基準を満たす正確な結果をリリースした。
【0124】
【0125】
一致度
相対精度を、代替法により生成したものとの結果の直接比較によって確立した。陽性の比較に使用した2つの方法、IlluminaシークエンシングおよびアンプリコンPacbioシークエンシング、があった。Pacbioは、有効性が認められたシークエンシング技術である一方、Molecular Loop法は、旧来のアンプリコンシークエンシングとはプレシークエンシングステップが機構的に異なる。陰性は、Illuminaのみでシークエンシングした。
【0126】
使用した個々の比較研究を下に列挙する。
・Illumina Articシークエンシング
○93の陰性NAA試料
○2020年の冬にシークエンシングした72のSARS-CoV-2試料
○Molecular loopにおいてCMBPで以前にシークエンシングした29の試料
○Molecular loopにおいてDNA Identificationで以前にシークエンシングした50の試料
・Pacbioアンプリコンシークエンシング
○90%カバー率でアンプリコンシークエンシングし、Molecular loopにおいて二連で実行した、122の試料
【0127】
最小リードカバー率のベースラインを設定するために、検証実行からの110のNTCおよび検証タイムライン中に実行した現行のRUO株サーベイランスを使用して、4CCSリードで最小リードカバー率閾値セットを設定した。Illumina一致度のために、93の陰性をCMBP NAA診断用生産実行からランダムに選択し、十分な体積を確保するために最初の検査後に再抽出した。2020年の冬に流布し、2021年1月にシークエンシングした、株の72の試料を、Molecular Loopで再シークエンシングした。さらに、CMBPおよびDNAからの79の試料を、多様性を確保するために最初の株コール、CTおよびリードカバー率に基づくIllumina並行検査に選択した。当初はPacbioでアンプリコンシークエンシングした382の試料を、Molecular Loopにおいて二連で再処理した。二連反復実験は、同等であることを以前に示したThermo Fisher VILO RTマスターミックスのそれらの組成がほんのわずか異なった。最初のアンプリコンシークエンシング実行では、382の試料のうちの122が、>90%ゲノムカバー率を生じさせた。最初の90%カバー率を有する試料のみを、molecular loop結果のさらなる解析に使用した。
【0128】
判定基準は、SARS-CoV-2ゲノムの≧90%カバー率の報告閾値に達する全ての株の≧95%精度であった。
【0129】
リードカバー率閾値:ここでは平均リードカバー率と呼ぶアンプリコンカバー率中央値の平均、最小および最大平均値を、検証実行および生産実行について解析した。平均リードカバー率の分布を
図11に示す。最小、最大および平均は、それぞれ、0.24、9および1.7CCSリードであった。典型的な閾値を、3X標準偏差プラス平均により設定し、これはこの解析については6.67に等しい。しかし、迅速な処理のために、株タイピングに使用する塩基対についてのカットオフリードカバー率を、10CCSリード、または10%プラス最大NTCで設定した。
【0130】
Illumina Articシークエンシング:陰性であると以前に決定された93の試料をMolecular LoopにおいておよびIlluminaにおいて二連で並行してシークエンシングした。Illuminaにおける報告対象ゲノムをもたらす2つの試料、およびMolecular loopにおけるものに関して、2つの技術間に98.3%の一致度があった。さらなる調査により、Illuminaにおいて得られた両方の試料は、実際には核酸増幅(NAA)に対して陽性であり、誤って検証に含まれたことが明らかになった。二連での他の91の試料についての平均リードカウントは、控えめなリード深度閾値をさらに確証した(
図12)。
【0131】
2021年1月に流布した株からのIlluminaにおいて以前にシークエンシングした72の試料を、Molecular loopにおいて再シークエンシングした。流布している現行の株を提示するために、CMBPおよびDNA同定時にMolecular loopにおいて以前にシークエンシングした79の試料を、Molecular loopおよびIlluminaにおいて並行して再シークエンシングした。検査現場間の輸送中に損傷したまたは比較シークエンシング反応に失敗した試料の除去後、両方のプラットフォームで生じさせることに成功した123の株コールを解析した(
図13)。
【0132】
72の試料のうち、51は、71%成功率のための10CCSリード深度および90%ゲノムカバー率のQC閾値を満たした。この報告対象ゲノム率は、検証の月中の72.5%のDNAでのCDC株サーベイランス報告対象ゲノム率と似ていた。51の報告対象結果のうちの全ての株の結果が100%の一致度であった(表6)。平均で10CCS未満のリード深度を有する結果の組み入れによって、10/13(77%)のマッチする株の結果、および61/64、95.3%、の完全一致度が得られた。ゲノムカバー率が90%未満の試料の解析は、同一の株の結果を2/7のしか有さなかった。
【0133】
【0134】
Molecular LoopにおいてCMBPおよびDNAで当初シークエンシングした72の試料のうちの66を希釈後にIlluminaおよびMolecular loopにおいて十分なリード深度でシークエンシングするのに成功した。72の試料全てが90%カバー率を生じさせ、そのうち71の株タイピングは、Illumina参照法と同一の株コールできた。全体的に見て、全ての報告対象結果は、並列技術間で100%の一致度であった(表7)。
【0135】
【0136】
アンプリコンPacbioシークエンシング:アンプリコンシークエンシングで90%カバー率を有した122の試料のうち、116を両方の反復実験について90%カバー率で反復した。116のmolecular loop反復株タイピング間に100%の一致度があった。全体的に見て、molecular loopと旧来のアンプリコンシークエンシング間での並行検査は、98.2%の一致度であった。
【0137】
解析感度/特異度
熱不活性化SARS-CoV-2株B.1.1.7(VR-3326HK(商標))、Hong Kong/VM20001061およびItaly-INMI1ゲノムは、ATCCにより特徴付けられている。解析感度のために、全てのバリアントを、解析パイプラインを使用して同定し、公開ATCC株バリアントデータセットと比較した。旧来、ヒトゲノムシークエンシングでは、注目すべきバリアントを解析し、検証し、偽発見率(FDR)、偽陽性(FP)を全ての陰性ではなく全ての陽性コール(FP+TP、ここでTP=真陽性)に対して正規化する。しかし、Sars-Cov-2では、株コールをもたらす、所与の株の定義された位置における4~20+バリアントの組合せがある。また、ウイルスRNAの完全ゲノムシークエンシングに起因して、現行の株タイピングにとって適切でないシークエンシングデータの変化を引き起こすことが公知の複数の高反復領域がある。Nextcladeなどの株タイピングプログラムは、これを考慮に入れることができる。したがって、株について記録されているコールされたバリアントの数を総バリアント数で割ることによって感度を決定した。FDRに加えて、正確にシークエンシングされた塩基対と比較してコールされた偽バリアントの総数によって特異度を計算した。バリアントをコールし、株タイピングを出力するPangolinにおいて、入力データとして、アセンブルされたゲノムを使用した。バリアントをコールせず、株をさらなる解析のためにのみ出力した。それ故、別のゲノムバリアントコーラー、CLC、および反復することを考慮に入れるNextclade Sars-Cov-2特異的バリアントコーラーであって、バリアントコールを行うときにウイルス領域をシークエンシングすることが難しいNextclade Sars-Cov-2特異的バリアントコーラー、からのバリアントコールを使用して、感度および特異度を計算した。判定基準は、次の通りであった:(1)最小カバー率より上であるセグメントにおけるバリアントについて対照RNAで≧90%の解析感度;および(2)最小カバー率より上であるセグメントにおけるバリアントについて対照RNAで≧90%の解析特異度。最小カバー率より上であるセグメントにおけるバリアントについて対照RNAでの偽発見率を記録したが、判定基準を設定しなかった。
【0138】
両方のバリアントコーリングプラットフォームは、バリアントを検出するそれらの能力の点で高感度であり、Nextcladeで96.23%、CLCで98.11%の感度であった(表8)。ゲノムにわたって塩基対を決定する全体的特異度を比較したとき、両方とも>99.9%特異的であった。しかし、反復する、シークエンシングが困難な、領域について調整するNextcladeの能力は、23での調整プロセスのないCLCと比較して3での検出される偽バリアントの数から明らかであった。これは、偽バリアント発見が反復ウイルス領域をシークエンシングすることが困難な場合のものであることを示す、Nextcladeについて5.36およびCLCについて30.26であるバリアントの偽発見率の食い違いにつながり、これらの領域は、現行の株タイピングにとって適切でない。まとめると、全ての判定基準を満たしており、Molecular Loopプロセスは、高感度かつ全体的に特異的であり、現行の株タイピングアルゴリズムで解析されないウイルス領域からの高いFDRを有する。
【0139】
【0140】
アッセイ許容度
核酸投入量に対するアッセイ許容度は、反応に加えられる被解析物の量の変化に対する許容度と考えることができる。通常はcp/μLで表されるが、アッセイした試料の約80%は、各試料の対応するサイクル閾値(CT)の値を提供するEUA NAA SARS-CoV-2検査からのものとなる。それ故、解析およびガイダンスのための投入量測定基準としてcp/μLの代わりにCTを使用した。残存NAA検査からウイルスゲノムをシークエンシングすることは、本質的に、高い失敗率を有し、これは、検体のウイルス力価およびRNA完全性と直接関係しており、試料間で劇的に異なり得る。失敗率は、RNA力価(CT)によって左右されるが、バックグラウンドを控えめに設定すると、より高いCTの試料において観察される失敗の増加は、食い違った結果をもたらすことにならず、アッセイの費用を単に増加させることになる。この検証のアッセイ許容度実験の目的は、所与のCTで予想成功率のベースラインを設定することであったが、シークエンシングされたゲノムを有するように試みるのがどの試料であるのかを限定しない。
【0141】
3カ所の現場にわたって9,718の生産結果を、それらのヌクレオカプシド標的#1(N1)CT値に基づく結果を生じさせる成功率について解析した。先ず、試料を、ゲノムを生じさせる能力によって90%でビニングし、CT値を1整数刻みで最も近い整数に切り上げた。例えば、30.1のCTを31ビン未満で計算した。<16のCTを有する全ての試料を16ビンに含めた。CTメタデータを欠いている全ての試料を解析から除去した。判定基準は、(1)使用する入力濃度の許容可能な変化を有するシークエンシング用のRNAの10,000コピーについての製造業者推奨が、解析についての以下の判定基準を満たす;および少なくとも20試料のCT群、であった。
【0142】
8815/9718を上回る生産試料が、対応するCTメタデータを有した。<16~24CT解析ビンから約90%ゲノムカバー率を生成する能力の低下はなかった(
図14)。25CTで出発して、90%カバー率でゲノムを生成する所与のCTでの試料の能力の急落があり、30.1→31CTビンは、7.65%試料しか報告しなかった。アッセイ入力データのCTカットオフが必要とされる場合には、試料は<26CTでなければならないことが推奨され、それらは78%ゲノム産生率を有した。
【0143】
被解析物安定性
この検証における試料を、試料を臨床実験室で検査する期間を超える最低4週間の期間、保管した。長期安定性は、研究試料と同じ条件下で少なくとも3つのアリコートを保管することによって決定するべきである。試料の体積は、3回の別々の機会に解析するのに十分なものでなければならない。意図された保管温度で生体マトリックスにおける被解析物の安定性を確立するべきである。
【0144】
様々な保管条件下での被解析物の安定性を、様々な保管長での一致度の測定により確立した。NAA診断検査後、抽出した核酸を検査する実験室にドライアイスを用いて発送し、シークエンシングまで-20℃で保管した。検証に使用した全ての試料は、残存生産試料であった。下で説明する安定性実験は、試料を収集し、シークエンシング実験室に発送するプロセスに加えてである。被解析物安定性を2つの別々の実験で測定した。第1の実験では、インターアッセイ精度に使用した10の試料を、1ヵ月の時点を越えて3回、解凍し、アッセイし、再凍結した。試料は、様々な株、CT値、および元のリードカバー率を示した。第2の実験では、幅がある元のリード配列深度を有する懸念されるアルファ、ベータおよびデルタバリアント(VOC)を含む12の試料を、3回の凍結融解を必然的に伴う1ヵ月の-20℃での保管後に再シークエンシングした。試料が、定義された保管長後に同じ株検出を生じさせ、かつ報告対象株の結果について≧90%の精度を生じさせた場合、保管条件を好適とみなすように、判定基準を定義した。
【0145】
安定性研究で使用したインターアッセイ結果は、上の表5で見つけられる。1つの試料、1583805067、の2回の反復実験のみは、90%再現性のための90%カバー率および10CCSリードを生じさせることができなかった。さらに、3回の別々のシークエンシング実行(PBT5073、PBT5075およびPBT5080)については最後の安定性時点(PBT5080)で試料特異的リードカウントの低下が観察されなかった(
図15)。
【0146】
VOCを再処理すると、9/12試料に、同一の株の結果を生じさせた。1つの試料は、元の結果は1.617.2であったが、AY.3を生じさせた。AY.3と1.617.2の両方がデルタVOCを含み、元の第24週以降の結果は、今はデルタVOCの別個の亜株として分類されている。さらなる調査によって2つの結果間で38のCLCバリアントは同一であることが判明し、株タイピングは、Pangolin株コーラーバージョンの違いに起因した。1つの試料は、一致したが、結果を報告するのに十分なリード深度がなかった。真の不一致のものは、当初報告されたB.1.1.7および反復時のB.1.621.1のみであった。当初のシークエンシングと安定性シークエンシングの両方が、実行間のコールされるバリアントの最小限の共有で十分なリードカバー率を生じさせる結果となったので、食い違いは、試料交換によって生じた可能性があると考えられる。全体的な精度は、91.6%であり、食い違った結果は、安定性の問題によるものとは考えられなかった。
【0147】
(実施例3)
チェリーピッキング
Hamilton MicroLab STAR液体ハンドラーを使用して、陽性患者試料と陰性患者試料の両方を含有するソースプレートから、シークエンシング用の陽性試料のみを含有する凝縮PCRプレートに検体を移した。非公式に、このプロセスを「チェリーピッキング」と呼ぶ。検体は、CT<31で陽性検体から抽出された全核酸であった。
【0148】
(実施例4)
SARS-CoV-2株決定のためのシークエンシングデータの解析
上流解析は、完了についてシーケンサー実行をモニターすることと、個々の試料FASTQファイルを生成するために逆多重化することと、アラインメントおよびバリアントコールを生成するためにSARS-CoV-2参照ゲノムとの各々のアラインメントを始動させることとを含んだ。各SMRTCellにおける試料についての下流解析は、各試料についての系統分類を含む結果全てを生成することを含んだ。
【0149】
上流解析
上流解析についてのフローチャートの例を
図4に示す。解析起動のために、PacBio/Molecular Loop生データをシーケンサーからAWS drop directoryに寄託した。実行完了ファイルが作成されるとスクリプトが検出し、逆多重化の準備が整ったフォルダーにデータをコピーした。シーケンサーで不首尾に終わった試料は、データファイルを生成しなかった。これらの試料を反復するように指定し、配列解析に使用しなかった。
【0150】
この時点で、逆多重化および個々の試料FASTQファイルの生成を、以下のステップを使用して遂行した:(1)PacBioのSMRTLINK CCSプログラムを使用する環状コンセンサス配列(CCS)BAMファイルの生成ステップ;(2)samtoolを使用して中間BAMファイルをマージするステップ;(3)PacBio limaプログラムを使用して逆多重化して、実行マニフェストにおける異なるバーコードの組合せに対応する個々のBAMファイルを生成するステップ;(4)逆多重化された出力データを試料名および/または患者識別子ごとに組み合わせるステップ;(5)配列からバーコードを除去し、個々の試料FASTQファイルを生成するステップ;(6)配列をバーコードとアラインし、バーコードを(例えば、PacBioトリムスクリプトを使用して)トリミングするステップ;(7)BAMファイルをFASTQファイルに(例えば、bamtoolを使用して)変換するステップ;(8)FASTQおよびCCS BAMファイルを最終位置にコピーするステップ;(9)ならびにFASTQファイルおよび対応する実行マニフェストをドロップ位置にコピーして、CLCワークフローを始動させるステップ。
【0151】
CLC解析ワークフローは、以下のステップを使用して遂行した:(1)NGSデータ解析ワークフローを、現行の有効性が認められているCLC Genomics Serverバージョンを使用して、各試料に対して実行する;(2)各試料のFASTQファイルについて、(a)250~5000bp長のリードを保持するようにリードをフィルタリングした;(b)minimap2を使用してリードをSARS-CoV-2参照ゲノム(「NC_045512v2」)とアラインしてBAMファイルを生成した;(c)ローカルリアラインメントを遂行し、CLC Genomics ServerにおけるLow Frequency Variant Detectionツールを使用してバリアントコールを行った;および(d)アセンブリ(BAMファイル)と検出されたバリアント(cf)の両方を下流の後処理解析に入力した。スクリプトがCLCプロセス完了を検出し、それによって、各SMRTcellにおける試料の下流解析の開始が生じた。
【0152】
下流解析
下流(後処理)解析のフローチャートの例を
図5に示す。後処理第1部は、
図5の第1のブロックで表される。後処理第1部のステップは、次の通りであった。(1)適切な参照ファイルを使用することにより、VCFConsを使用して、各試料についての配列アラインメントおよびバリアントコールに基づいてコンセンサス配列を生成した。この解析には、塩基を各ゲノム位置に割り当てるために4CCSリードの最小カバー率、および0.5の最小代替頻度が必要であり、この基準を満たさない位置を曖昧塩基「N」に割り当てた。(2)Seqtkを使用して配列塩基組成を生成し、それを後に非曖昧塩基のパーセンテージを決定するために使用した。(3)Nextcladeを使用して、コンセンサス配列を入力データとして使用して(a)クレード割り当て、(b)変異コーリング、および(c)試料配列品質チェックを生じさせた。次いで、(4)Pangolinを使用して、SARS-CoV-2系統を生成すること(Pango命名法として公知)、次いで、SARS-CoV-2ゲノム配列系統(Pango系統)を割り当てることにより、コンセンサス配列に系統を割り当てた。Pangolinは、少なくとも50%非曖昧塩基を有するゲノムのみを考慮する。(5)SummaryStatを使用して、Nextclade、PangolinおよびSeqtkからの結果をコンパイルし、アンプリコンカバー率中央値の平均値およびゲノムカバー率パーセントをはじめとする、後のQCに必要なカバー率統計データを生成した。この解析のために、全SARS-CoV-2ゲノムに及ぶ29のオーバーラップ1.2kb領域における塩基のカバー率中央値を試料の各々について計算した。これらのカバー率値(最小値、第1四分位値、平均値、中央値、第3四分位値、および最大値)の分布の統計データを各試料について計算した。また、ゲノムカバー率パーセントを、総配列長で割った非曖昧塩基(A、T、C、G)の数として計算し、系統分類を集約し、Nextclade結果およびPangolin系統コールを生じさせた試料のみを、さらなる処理のために保持した。
【0153】
この時点で、後処理第2部を、
図5において「患者メタデータを組み合わせる」ブロック、「品質チェック」ブロック、および「最終レポートを生成する」ブロックに示されているように開始した。したがって、適切な参照ファイル、株サーベイランス特異的メタデータ(人口統計データ、ゲノムカバー率パーセント、およびRT-PCRアッセイからのCt値)を再び使用してQCを遂行し、データを結果に加えた。メタデータを欠いている試料を結果セットから除外した。また、無鋳型QCを、無鋳型対照に基づいて遂行した。29のゲノム領域のカバー率中央値の平均値が、>10CCSリードであった場合には、同じプレート上のシークエンシングされた全ての試料を除去した。最後に、カバー率QCを遂行した。ゲノムカバー率>=90%を有する試料を結果に保持し、カバー率中央値の平均値>10CCSリードを有する試料を結果に保持した。次いで、結果を、対応するPangolin系統を伴う患者レポートを生成するためにReport Systemの場所に転送した。結果を生じさせることができなかった試料は、系統を決定することができなかったと報告した。SARS-CoV-2ウイルスが検出されても、系統情報が報告されないことがある。
【0154】
系統コーリング基準は、次の通りであった。組み入れ基準:(1)CT<31;(2)対応するメタデータ(株サーベイランス);(3)>90%ゲノムカバー率;(4)カバー率中央値の平均値>10CCSリード;(4)合格NTC対照;ならびに(5)Nextclade結果およびPangolin系統コール。除外基準:(1)CT>31;(2)欠測メタデータ(株サーベイランス);(3)<90%ゲノムカバー率;(4)カバー率中央値の平均値<10CCSリード;および(4)不合格NTC対照。
【0155】
(実施例5)
可能性のある新たなバリアントおよび分類のアセスメント
SARS-CoV-2ウイルスの新たなバリアント(すなわち、系統)の出現およびpangolin分類ソフトウェアの付随する変更に応じてVirseqアッセイの分類精度の再検証を、
図6で概説されるように遂行した。pangolinソフトウェアは、Dockerhubによって(hub.docker.com/r/staphb/pangolinで)配給されている。Pangolinサイトをモニターし、アップデートされたdockerコンテナを一定間隔で(例えば、週1回)ダウンロードし、インストールすることによってアップデートについてチェックした。アップデートがなかった場合、何もする必要がないと判断した。ドキュメントdockerコンテナは、リリースノートとともに変更ログがアップデートされた。アップデートされたdockerファイルは、変更記録ならびにpangolinの最新バージョン、pangoLEARN、pango-designation、scorpio、およびconstellationを含有した(github.com/cov-lineagesを参照されたい)。
【0156】
アップデートがあった場合、社内実験室データを使用して回帰解析を遂行した。本質的に、ステップを以下のように遂行した。新しいpangolinバージョンを使用して、過去のVirseq配列の参照セット内に含有されていた試料の系統を決定した。参照セットは、主としてデルタ系統で構成されている、2021年10月からの初期SMRT cellを含んだ。それは、2021年12月および2022年3月に行われたオミクロン系統の2つのアップデートも含有した。参照セットの中の各試料は、そのコンセンサス配列、ならびに以前のpangolinバージョンにより行われたその系統分類の履歴を含んだ。参照セットを、pangolinバージョンがアップデートされるにつれてより新しい、より保有率が高い系統を代表する試料を含むように、定期的にアップデートした。
【0157】
次に、pangolinソフトウェア出力の形式を以前のバージョンのものと比較して、pangolin出力形式の変更があったかどうかを決定した。CSV出力データに何らかの変更(すなわち、追加のカラム、カラム名の変更)があった場合、これらを記録し、実験室Virseqパイプラインを変更に対応するように必要に応じて修正した。次いで、修正バージョンを検査のためのQA環境に配備した。
【0158】
次に、系統コールのあらゆる変更をアセスメントし、ソフトウェアアップデート変更記録から予想されるものと比較した。予想される変更は、概して、亜系統間の再割り当てを含む。系統の何らかの予想外の変更(例えば、デルタ亜系統からアルファへ)があった場合、これらを詳細に調査し、記録した。
【0159】
判定基準および行った動作は、次の通りであった。系統分類の相違は、主として、より新しいバージョンでのバリアントのpangoLEARN/pango-designation定義の改善に起因する。これらの大部分は、亜系統の再割り当てであるが、モデルによるバリアント定義の変更に起因することもあり得る。亜系統の再割り当てを再考して、それらが、親デルタ系統におけるAY間の再割り当てなどの親系統の下で予想された変更であることを確実にした。<90%ゲノムカバー率を有する試料には別の不一致源が存在することがあり得る。上記の亜系統再割り当てまたはゲノムカバー率の問題により説明され得るいずれの不一致も記録し、承認のためにさらに再考した。次に、GISAID回帰検定を遂行した。不一致を上記のように説明できず、アップグレードで新しいpangolin系統が追加されなかった場合、アップグレードを中止し、pangolinの現行バージョンで生産を継続した。上記のようなアップデートに伴う不一致を記録し、記憶させた。新たな情報が入手可能になり、記録されるように、またはpangolinの次のリリースについてのこのプロトコルの開始が不一致を解決できるように、不一致をさらに調査した。
【0160】
この時点で、第2の回帰検定を、公表されている(GISAID)配列およびそれらのメタデータを使用して遂行した。最新のGISAID配列をダウンロードし、全てのGISAID配列についてのメタデータおよびpangolin系統を得、VOCおよびVOIのリストを、系統についてのWHOアップデートおよび最新の完全リストに基づいてアップデートした。次に、データシミュレーターを使用して、Virseqアッセイのカバー率およびエラー特性をモデル化した。シミュレーターは、GISAID配列を出発点として使用し、シミュレーションしたカバー率およびエラーを、Virseq試料の収集物からの経験的カバー率プロファイルおよび最大-マイナー対立遺伝子頻度に基づいてインポーズした。得られたシミュレーション試料をpangolinに通し、系統分類を元のGISAID配列のものと比較した。分類安定性を、変異配列がそれらの予想系統分類を維持する率として定義した。この回帰検定では、2つの実験を実行して、シミュレーションによる分類安定性をアセスメントした。第1に、最大100のGISAID配列を各VOC/VOIについてランダムにサンプリングして、これらの重要な系統の分類安定性を、入手可能なシークエンシングデータ中のそれらの頻度に関係なく、アセスメントした。これによって、新興バリアントおよび既存のものの、新たな亜系統の分類安定性のアセスメントが可能になった。第2に、系統分類安定性の頻度に基づくレトロスペクティブ解析のためにデータベースから10,000のGISAID配列をランダムにサンプリングした。これによって、安定性を過去の保有率と比較して定量化することが可能になった。
【0161】
この時点で、データシミュレーター実験の出力データを再考し、全ての既知のVOC/VOIについてのGISAIDデータ、およびレトロスペクティブGISAIDデータを使用して、以前の回帰検定に関する分類安定性の予想外の変更をチェックした。あらゆる予想外の不安定性を調査し、記録した。その結果、ある特定のパラメーターを満たすとアップグレードが受け入れられた。一部の場合には、シミュレーションデータと参照配列との間のVOC/VOI一致度中央値が少なくとも90%であった場合、アップグレードがリクエストされた。これらの基準を満たされなかった場合、追加の調査が指示された。
【0162】
新たな不一致系統が新規のものであった場合、新規系統を検査して、それらが、本明細書で開示される方法を使用して検出されるかどうかを決定した。不一致バリアントが、新規バリアントでなかった場合、それらを調査して不一致の根本原因を見つけた。これは、参照配列のカバー率はもちろん、特定の領域における塩基カバー率の望ましくない降下がないことを保証するためにシミュレーションした配列も、調べることを含んだ。また、別のシードでシミュレーションを再実行して、不一致が再現されるかどうかを決定した。再現された場合、アップグレードを中止した。
【0163】
この時点で、新規バリアントを、本明細書で開示される方法を使用してアセスメントした。新興バリアント(系統)のサーベイランス成功のために、例えば、新興系統における個々の配列バリアントおよび関連molecular loopプローブの位置を同定することによるような、in silico解析を行うことにより、molecular loop反転プローブ増幅に対する潜在的影響を再考して、プローブ結合への干渉の可能性をアセスメントした。例えば、任意のプローブとオーバーラップする新規配列バリアントがハイブリダイゼーションに影響を及ぼすことになるという非常に控えめな推定をその際に使用することになる。また、新規配列バリアントのカバー率を確保するために領域内の隣接するプローブ全てを再考した。特定の領域内のカバー率の低下をもたらし得る任意の配列バリアントについて、pangolin系統アップデート検証サマリー内の影響を受けるプローブを記録した。
【0164】
(実施例6)
実施形態
以下の非限定的な実施形態を参照することにより、本開示をよりよく理解することができる。
A1.SARS-CoV-2のバリアントを同定および/または追跡するための方法であって、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;
(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;
(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップ
を含む方法。
A2.試料特異的SARS-CoV-2核酸を生成するステップが、逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)を使用して試料特異的SARS-CoV-2 cDNAを生成することを含む、前記または後記の方法実施形態のいずれか1つの方法。
A3.次いで、SARS-CoV-2 cDNAが、ウイルスゲノムに沿って間隔を空けて結合するタイル型プライマーを使用してさらに増幅される、前記または後記の方法実施形態のいずれか1つの方法。
A4.タイル型プライマーが、隣接するプライマーが互いにおおよそ600bp離れているような間隔で配置される、前記または後記の方法実施形態のいずれか1つの方法。
A4.1 試料SARS-CoV-2 cDNAの1本の鎖を、ペアのSARS-CoV-2プローブを含む一本鎖プローブDNA鋳型とハイブリダイズさせることをさらに含み、第1のプローブが、フォワードプライマーとして機能するようにプローブDNA鋳型の3’末端に位置し、第2のプローブが、リバースプライマーとして機能するようにプローブDNA鋳型の5’末端に位置する、前記または後記の方法実施形態のいずれか1つの方法。
A4.2 SARS-CoV-2ゲノムが、新たなバリアントの存在または非存在にかかわらず非常に効率的に増幅される、前記または後記の方法実施形態のいずれか1つの方法。
A4.3 タイル型プライマーが、SARS-CoV-2試料特異的核酸を試料番号におよび/または核酸シークエンシングのためのユニバーサルプライマー部位と相関させるために使用されるバーコード配列の付加のためのアダプターをさらに含むプライマーである、前記または後記の方法実施形態のいずれか1つの方法。
A5.一本鎖プローブDNA鋳型が、プローブ配列の内部に位置するユニバーサルシークエンシングプライマーをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A6.一本鎖プローブDNA鋳型が、SARS-CoV-2試料特異的核酸を試料番号と相関させるために使用されるバーコード配列の付加のためのアダプター配列をさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A7.2つのプローブ間の配列を埋めて、2つのプローブ配列間に試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を生成するステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A8.試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型を試料特異的SARS-CoV-2 DNAから遊離させるステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A9.試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップのための鋳型として使用される直鎖状DNAを生成するための試料SARS-CoV-2 cDNAに特異的な配列を含む環状一本鎖プローブDNA鋳型の消化をさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A10.核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの結果を、バリアントが検出された場合にさらなる分類のためにデポジトリーにアップロードするステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A11.デポジトリーが、CDCデータベースである、前記または後記の方法実施形態のいずれか1つの方法。
A12.核酸シークエンシングが、全ウイルスゲノムの少なくとも80%、または必要に応じて85%、または必要に応じて90%をシークエンシングすることを含む、前記または後記の方法実施形態のいずれか1つの方法。
A13.対象の地理的位置を同定するステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A14.核酸シークエンシングが、全ゲノムシークエンシングを含む、前記または後記の方法実施形態のいずれか1つの方法。
A15.核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップが、試料SAR-CoV-2配列をSARS-CoV-2参照ゲノムとアラインして、試料特異的アセンブリおよびコンセンサス配列を生成することを含む、前記または後記の方法実施形態のいずれか1つの方法。
A15.1 少なくとも50%の最小カバー率を有する試料SAR-CoV-2核酸配列が、各試料についてのコンセンサス配列を生成するために、バリアントをコールするためのおよび/または試料特異的ゲノムアセンブリを生成するための入力データとして使用される、前記または後記の方法実施形態のいずれか1つの方法。
A15.2 コンセンサス配列を生成するための定義された閾値がある、前記または後記の方法実施形態のいずれか1つの方法。
A15.3 定義された閾値が、個々の塩基対をカバーする少なくとも4の環状コンセンサスシークエンシング(CCS)リード、および/または>50%の参照と比較した代替対立遺伝子頻度を含む、前記または後記の方法実施形態のいずれか1つの方法。
A15.4 結果の妥当性をアセスメントするための外部鋳型なし対照(NTC)および/または外部陽性鋳型対照(PTC)の評価をさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A15.5 試料SAR-CoV-2核酸シークエンシングリードが、250~5000bp長のリードを保持するようにフィルタリングされる、前記または後記の方法実施形態のいずれか1つの方法。
A15.6 試料SAR-CoV-2核酸シークエンシングリードが、SARS-CoV-2参照ゲノム(NC_045512v2)とアラインされる、前記または後記の方法実施形態のいずれか1つの方法。
A15.7 試料SAR-CoV-2核酸シークエンシングリードが、SARS-CoV-2参照ゲノムとアラインされた後、ローカルリアラインメントが遂行され、バリアントコールが行われる、前記または後記の方法実施形態のいずれか1つの方法。
A15.8 試料SAR-CoV-2核酸配列塩基組成の決定が、非曖昧塩基のパーセンテージを決定するために生み出される、前記または後記の方法実施形態のいずれか1つの方法。
A15.9 コンセンサス配列を入力データとして使用して(a)クレード割り当て、(b)変異の決定および(c)試料配列品質チェックのいずれか1つまたは全てを、必要に応じて生じさせることができる、前記または後記の方法実施形態のいずれか1つの方法。
A16.核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップ(d)が、試料についての系統をアセスメントすることをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A16.1 系統が、SARS-CoV-2系統を生成すること、次いで、SARS-CoV-2ゲノム配列系統を割り当てることにより、コンセンサス配列に割り当てられる、前記または後記の方法実施形態のいずれか1つの方法。
A16.2 系統割り当てが、少なくとも50%非曖昧塩基を有するゲノムのみを考慮するように設定される、前記または後記の方法実施形態のいずれか1つの方法。
A16.3 株系統結果が、90%ゲノムカバー率を有する試料についてリリースされる、前記または後記の方法実施形態のいずれか1つの方法。
A16.4 株系統結果が、>10環状コンセンサス配列(CCS)リードである全ゲノムにわたってのリードカバー率中央値の平均値を有する試料についてリリースされる、前記または後記の方法実施形態のいずれか1つの方法。
A16.5 異なるCCSリード測定基準が、ヌクレオチドレベル(4CCSリード)におよびゲノムレベル(10CCSリード)に基づく、前記または後記の方法実施形態のいずれか1つの方法。
A16.6 Pangolinが、系統を割り当てるために使用される、前記または後記の方法実施形態のいずれか1つの方法。
A16.7 カバー率統計データを生成するステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A16.8 カバー率統計データが、SummaryStatを使用して生成される、前記または後記の方法実施形態のいずれか1つの方法。
A16.9 全SARS-CoV-2ゲノムに及ぶ29のオーバーラップ1.2kb領域における塩基のカバー率中央値が、試料の各々について計算される、前記または後記の方法実施形態のいずれか1つの方法。
A16.10 29のゲノム領域のカバー率中央値の平均値が、>10CCSリードである、前記または後記の方法実施形態のいずれか1つの方法。
A16.11 ゲノムカバー率>=90%を有する試料が、結果に保持される、前記または後記の方法実施形態のいずれか1つの方法。
A16.12 カバー率中央値の平均値>10CCSリードを有する試料が、結果に保持される、前記または後記の方法実施形態のいずれか1つの方法。
A16.13 人口統計データ、ゲノムカバー率パーセント、およびRT-PCRアッセイからのCt値を使用して、QCが遂行され、データが結果に加えられる、前記または後記の方法実施形態のいずれか1つの方法。
A16.14 結果が、対応する系統および/または地理的割り当てを伴う患者レポートを生成するために使用される、前記または後記の方法実施形態のいずれか1つの方法。
A16.15 組み入れ基準が、(1)CT<31;(2)対応するメタデータ(株サーベイランス);(3)>90%ゲノムカバー率;(4)カバー率中央値の平均値>10CCSリード;(4)合格NTC対照;および(5)系統コールを含む、前記または後記の方法実施形態のいずれか1つの方法。
A16.16 除外基準が、(1)CT>31;(2)欠測メタデータ(株サーベイランス);(3)<90%ゲノムカバー率;(4)カバー率中央値の平均値<10CCSリード;および(4)不合格NTC対照を含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.デポジトリーのアップデートが行われたかどうかを決定することにより系統割り当てを再検証するステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.1 再検証するステップが、核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップの前に遂行される、前記または後記の方法実施形態のいずれか1つの方法。
A17.2 再検証が、以前に割り当てられた系統を変更するべきかどうかを決定するために社内データを使用する回帰解析を含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.3 社内データが、発生日、SARS-CoV-2系統、試料の地理的起源、系統分類の履歴、または系統分類に使用されるアルゴリズムのアップデートのうちの少なくとも1つにより定義されるデータセットを含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.4 アップデートが、社内データについての系統または亜系統の変更を含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.5 再検証が、デポジトリーからのデータを使用する回帰解析を含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.6 デポジトリーが、GISAIDである、前記または後記の方法実施形態のいずれか1つの方法。
A17.7 GISAID配列がダウンロードされ、全てのGISAID配列についてのメタデータおよび系統が得られ、VOCおよびVOIのリストが、系統についてのWHOアップデートおよび最新の完全リストに基づいてアップデートされる、前記または後記の方法実施形態のいずれか1つの方法。
A17.8 データシミュレーターを使用して、社内アッセイのカバー率およびエラー特性をモデル化するステップをさらに含む、前記または後記の方法実施形態のいずれか1つの方法。
A17.9 シミュレーターが、GISAID配列を出発点として使用し、シミュレーションしたカバー率およびエラーを試料の収集物からの経験的カバー率プロファイルおよび最大-マイナー対立遺伝子頻度に基づいてインポーズし、得られたシミュレーション試料が系統アルゴリズムに通され、系統分類が、元のGISAID配列のものと比較される、前記または後記の方法実施形態のいずれか1つの方法。
A17.10 分類安定性が、変異配列がそれらの予想系統分類を維持する率として定義される、前記または後記の方法実施形態のいずれか1つの方法。
A17.11 シミュレーションのために、100のGISAID配列が、各VOCおよび/またはVOIについてランダムにサンプリングされる、前記または後記の方法実施形態のいずれか1つの方法。
A17.12 シミュレーションのために、データベースから10,000のGISAID配列が、系統分類安定性の頻度に基づくレトロスペクティブ解析のためにランダムにサンプリングされる、前記または後記の方法実施形態のいずれか1つの方法。
A17.13 シミュレーションデータと参照配列間のVOC/VOI一致度中央値が少なくとも90%であった場合、アップグレードがリクエストされる、前記または後記の方法実施形態のいずれか1つの方法。
A18.ステップの少なくとも一部が、コンピュータおよび/または非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品により制御される、前記または後記の方法実施形態のいずれか1つの方法。
A18.1 ステップの少なくとも一部が、
1つまたは複数のデータプロセッサーと、
1つまたは複数のデータプロセッサーで実行されたときに方法ステップのいずれかを含む処理を1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体と
によって制御される、前記または後記の方法実施形態のいずれか1つの方法。
B1.前記または後記の方法実施形態のいずれかを遂行するための少なくとも1つのステーションまたはコンポーネントを含むシステム。
B2.(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;
(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;
(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップ
を含む、前記または後記の方法実施形態のいずれかを遂行するための少なくとも1つのステーションまたはコンポーネントを含むシステム。
B3.ステップの少なくとも一部が、コンピュータおよび/または非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品により制御される、前記または後記の実施形態のいずれか1つのシステム。
B.4 ステップの少なくとも一部が、
1つまたは複数のデータプロセッサーと、
1つまたは複数のデータプロセッサーで実行されたときに方法ステップのいずれかを含む処理を1つまたは複数のデータプロセッサーに遂行させる命令を含有する非一時的なコンピュータ可読記憶媒体と
によって制御される、前記または後記の方法実施形態のいずれか1つのシステム。
C1.非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品であって、1つまたは複数のデータプロセッサーで実行されたときに、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定すること;
(b)試料から試料特異的SARS-CoV-2核酸を生成すること;
(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行すること;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定すること
を含む処理を1つまたは複数のデータプロセッサーに遂行させる、コンピュータ-プログラム製品。
D1.非一時的な機械可読記憶媒体で有形に具現化されるコンピュータ-プログラム製品であって、
(a)対象からの試料をSARS-CoV-2核酸に対しておよび/またはSARS-CoV-2に対する抗体に対して陽性と同定するステップ;
(b)試料から試料特異的SARS-CoV-2核酸を生成するステップ;
(c)試料特異的SARS-CoV-2核酸に関して核酸シークエンシングを遂行するステップ;ならびに
(d)核酸配列がSARS-CoV-2バリアント配列を含むかどうかを決定するステップ
のいずれかを遂行するためにシステムの少なくとも1つのステーションまたはコンポーネントを実行するように構成された命令を含む、コンピュータ-プログラム製品。
【国際調査報告】