(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-24
(45)【発行日】2022-11-01
(54)【発明の名称】シーケンシングベースのアッセイの妥当性を確保するための品質管理鋳型
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20221025BHJP
【FI】
C12Q1/6869 Z
(21)【出願番号】P 2020537213
(86)(22)【出願日】2018-08-06
(86)【国際出願番号】 US2018045434
(87)【国際公開番号】W WO2019135790
(87)【国際公開日】2019-07-11
【審査請求日】2020-08-17
(32)【優先日】2018-01-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520030202
【氏名又は名称】ビリオントゥーワン,インコーポレイテッド
【氏名又は名称原語表記】BillionToOne,Inc.
(74)【代理人】
【識別番号】110001302
【氏名又は名称】特許業務法人北青山インターナショナル
(72)【発明者】
【氏名】ツァオ,デイヴィッド
(72)【発明者】
【氏名】サイラス,スクリット
(72)【発明者】
【氏名】アタイ,オグザーン
【審査官】山内 達人
(56)【参考文献】
【文献】特表2015-521482(JP,A)
【文献】米国特許出願公開第2017/0275691(US,A1)
【文献】特表2013-530727(JP,A)
【文献】特表2014-520509(JP,A)
【文献】国際公開第2012/058316(WO,A1)
【文献】国際公開第2017/165864(WO,A1)
【文献】Nucleic Acids Research,2017年,Vol. 45, No. 4,e23及びSupplementary Data
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
妊婦に関連する母体試料からの遺伝的障害の出生前診断を促進するための方法において、
・前記母体試料に、前記遺伝的障害に関連する品質管理鋳型(QCT)分子セットを加えることであって、前記QCT分子セットが、
・内因性標的分子の標的配列領域のヌクレオチド配列と合致するヌクレオチド配列を有する標的関連領域、及び
・前記内因性標的分子の配列領域のヌクレオチド配列と異なるヌクレオチド配列を有する変動領域
を含むこと;
・前記QCT分子セットと、前記内因性標的分子の前記標的配列領域を含む核酸分子と、内因性リファレンス分子
の配列領域を含む核酸分子とを共増幅することに基づき共増幅混合物を生成すること;
・前記共増幅混合物をシーケンシングすること;
・前記シーケンシングからのQCT分子シーケンスリードから検出される別個の前記変動領域の数に基づき、前記QCT分子セットのユニークな数を計算的に決定することであって、前記QCT分子シーケンスリードが前記QCT分子セットに対応すること;
・前記QCT分子シーケンスリードの数を前記QCT分子セットのユニークな数で除すことに基づき平均QCTシーケンシング深度を計算すること;
・前記共増幅混合物のシーケンシングにより決定された前記内因性標的分子についての総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づき前記内因性標的分子の絶対カウント数を決定すること;
・前記共増幅混合物のシーケンシングにより決定された内因性リファレンス分子についての総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づき前記内因性リファレンス分子の絶対カウント数を決定すること;及び
・前記内因性標的分子の前記絶対カウント数と前記内因性リファレンス分子の前記絶対カウント数との間の比較に基づき前記遺伝的障害の前記出生前診断を促進すること
を含むことを特徴とする方法。
【請求項2】
請求項1に記載の方法において、
・前記遺伝的障害が単一遺伝子病を含み、
・前記内因性標的分子の前記絶対カウント数を決定することが、前記内因性標的分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、前記単一遺伝子病に関連する突然変異を含む前記内因性標的分子の前記絶対カウント数を決定することを含み、
・前記内因性リファレンス分子の前記絶対カウント数を決定することが、前記内因性リファレンス分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、前記突然変異を含まない前記内因性リファレンス分子の前記絶対カウント数を決定することを含み、及び
・前記遺伝的障害の前記出生前診断を促進することが、前記比較に基づき前記単一遺伝子病の前記出生前診断を促進することを含むことを特徴とする方法。
【請求項3】
請求項1に記載の方法において、
・前記遺伝的障害が染色体異常を含み、
・前記内因性標的分子の前記絶対カウント数を決定することが、前記内因性標的分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、第1の染色体に関連する前記内因性標的分子の前記絶対カウント数を決定することを含み、
・前記内因性リファレンス分子の前記絶対カウント数を決定することが、前記内因性リファレンス分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、第2の染色体に関連する前記内因性リファレンス分子の前記絶対カウント数を決定することを含み、及び
・前記遺伝的障害の前記出生前診断を促進することが、前記比較に基づき前記染色体異常の前記出生前診断を促進することを含むことを特徴とする方法。
【請求項4】
請求項1に記載の方法において、前記遺伝的障害が染色体微小欠失を含み、
・前記内因性標的分子の前記絶対カウント数を決定することが、前記内因性標的分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、微小欠失領域に関連する前記内因性標的分子の前記絶対カウント数を決定することを含み、
・前記内因性リファレンス分子の前記絶対カウント数を決定することが、前記内因性リファレンス分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、微小欠失を有しないものと予想される第2の染色体領域に関連する前記内因性リファレンス分子の前記絶対カウント数を決定することを含み、及び
・前記遺伝的障害の前記出生前診断を促進することが、前記比較に基づき前記染色体微小欠失の前記出生前診断を促進することを含むことを特徴とする方法。
【請求項5】
請求項1に記載の方法において、前記遺伝的障害がコピー数変異を含み、
・前記内因性標的分子の前記絶対カウント数を決定することが、前記内因性標的分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、コピー数変異を有し得る領域に関連する前記内因性標的分子の前記絶対カウント数を決定することを含み、
・前記内因性リファレンス分子の前記絶対カウント数を決定することが、前記内因性リファレンス分子についての前記総リードカウント数を前記平均QCTシーケンシング深度で除すことに基づいて、コピー数変異を有しないものと予想される領域に関連する前記内因性リファレンス分子の前記絶対カウント数を決定することを含み、及び
・前記遺伝的障害の前記出生前診断を促進することが、前記比較に基づき前記コピー数変異の前記出生前診断を促進することを含むことを特徴とする方法。
【請求項6】
請求項1に記載の方法において、前記内因性標的分子の前記絶対カウント数及び内因性リファレンス分子の前記絶対カウント数の各々を決定することに用いられる前記平均QCTシーケンシング深度が、前記QCT分子セットの
ユニークな数とは別に決定されることを特徴とする方法。
【請求項7】
請求項1に記載の方法において、前記出生前診断を促進することが、胎児画分測定値、前記内因性標的分子の前記絶対カウント数、及び前記内因性リファレンス分子の前記絶対カウント数に基づき前記遺伝的障害の前記出生前診断を促進することを含むことを特徴とする方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2018年1月5日に出願された米国仮特許出願第62/614,236号明細書の利益を主張するものであり、この参照により全体として本明細書に援用される。
【0002】
本開示は、概して、遺伝子シーケンシングの技術分野に関する。
【背景技術】
【0003】
ハイスループットシーケンシング(例えば、次世代シーケンシング(NGS))は、全ゲノムシーケンシング及びエクソームシーケンシングの両方とも、診断アッセイに、並びに無侵襲的出生前遺伝学的検査(NIPT)、リキッドバイオプシー、及び多型を検出する同様のアッセイなど、より特化した適用に用いられることが多くなっている。ハイスループットシーケンシング(例えば、NGS)では、複数の試料(例えば、最大384試料等)が同じシーケンシングランで処理され得るため、クロスコンタミネーションが臨床適用上の重大な懸念である。特に、突然変異又は多型がまれで、そのアレル頻度が全体の僅か数パーセントを占めるに過ぎないようなアッセイでは、他の試料からのクロスコンタミネーションによって偽陽性が生じ得る。これは特にNIPT及びリキッドバイオプシーについて言えることであり、これらにおいては陽性と陰性とのアウトカム差が数パーセント未満の定量差である。
【0004】
ハイスループットシーケンシングの標準的なライブラリ調製実践では、当初の入力DNA試料の増幅が必要であり得る。検査室における突然変異アレルの増幅はいずれも、PCRキャリーオーバーコンタミネーションとして一般に知られる後続試料及び実験への混入が起こり得るため、こうした増幅ステップによりクロスコンタミネーション効果は悪化し得る。この問題を防ぐため、qPCRなどの一部の標準的診断アッセイはdUTP/UNGキャリーオーバー防止システムを利用し、ここではPCRにおいてdTTPの代わりにdUTPが用いられ、アッセイ後、ウラシル含有アンプリコンが酵素ウラシルDNAグリコシラーゼによる処理によって分解される。しかしながら、ハイスループットシーケンシング(例えば、NGS)は感度が一層高く、且つハイスループットシーケンシングベースのアッセイが微小な定量的変化を測定することを考えると尚更喫緊に必要であるにも関わらず、ハイスループットシーケンシングベースのアッセイ(例えば、NGSベースのアッセイ等)に対しては、類似の解決法がない。
【0005】
ハイスループットシーケンシングにおいてクロスコンタミネーションを完全に取り除くことは、関連するケミストリーに起因して困難であるが、それを追跡可能であれば、同様に有用であり得る。複数の例において、各試料に異なる識別可能な配列が加えられてもよく、他のウェルへのその混入を追跡することができる。しかしながら、ユーザー毎、実験毎、及び試料毎に配列ライブラリが異なるような例は厄介となることもあり、マルチプレックス化したハイスループットシーケンシングベースのアッセイ(例えば、NGSベースのアッセイ等)のクロスコンタミネーションの追跡に用いられる場合、大規模な複数の別個のライブラリ(例えば、384通りの別個のライブラリ;同じシーケンシングランで処理される試料の数に対応する数の別個のライブラリ;等)を管理することが必要となり得る。その上、このような例であれば、異なる実験に同じライブラリが使用されるであろうため、前の実験からのPCRキャリーオーバーは追跡できないであろう。更に、大規模な複数の別個のライブラリ(例えば、384通りの別個のライブラリ等)の管理が困難であることに起因して、識別子配列それ自体がクロスコンタミネーションを被り得る。このように、これらの限界を打破する一方で、クロスコンタミネーションの追跡のためなどの、方法及び/又はシステムの新規の有用な実施形態が必要とされている。
【図面の簡単な説明】
【0006】
【
図1A】
図1Aは、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図1B】
図1Bは、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図1C】
図1Cは、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図1D】
図1Dは、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図2】
図2は、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図3】
図3は、ある方法の実施形態の変形形態のフローチャート図を含む。
【
図4】
図4Aは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはクロスコンタミネーション及びインデックスミスアサインメントに関する結果のグラフ図を含む。
図4Bは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはクロスコンタミネーション及びインデックスミスアサインメントに関する結果のグラフ図を含む。
図4Cは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはクロスコンタミネーション及びインデックスミスアサインメントに関する結果のグラフ図を含む。
図4Dは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはクロスコンタミネーション及びインデックスミスアサインメントに関する結果のグラフ図を含む。
【
図5】
図5Aは、分子カウントへのQCT分子の使用についてのバリデーション実験からの結果の具体例を含む。
図5Bは、分子カウントへのQCT分子の使用についてのバリデーション実験からの結果の具体例を含む。
【
図6】
図6は、技師マネジメント及び/又は検査室マネジメントに関連する品質面に関連する結果の具体例を含む。
【
図7】
図7Aは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはQCT分子の定量化に関する結果のグラフ図を含む。
図7Bは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはQCT分子の定量化に関する結果のグラフ図を含む。
図7Cは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細にはQCT分子の定量化に関する結果のグラフ図を含む。
【
図8】
図8Aは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細には生物学的標的の定量化に関する結果のグラフ図を含む。
図8Bは、ある方法の実施形態の変形形態のバリデーション部分からの、詳細には生物学的標的の定量化に関する結果のグラフ図を含む。
【
図9】
図9は、QCT分子を用いてアッセイ可能なゲノム当量を測定する具体例を含む。
【
図10】
図10は、コンタミネーションパラメータを決定する具体例を含む。
【
図11】
図11は、QCT分子を複数の試料で用いて試料処理エラーを決定する具体例を含む。
【
図12】
図12は、QCT分子を異なる段階で使用する具体例を含む。
【
図13】
図13Aは、インデックスホッピングに関連する特徴付けの具体例を含む。
図13Bは、インデックスホッピングに関連する特徴付けの具体例を含む。
【
図14】
図14は、ユニークデュアルインデックスプライマーの使用に関連する真のコンタミネーションレベルの測定を促進する具体例を含む。
【
図15】
図15Aは、単一遺伝子病の診断の促進に関連する具体例を含む。
図15Bは、単一遺伝子病の診断の促進に関連する具体例を含む。
図15Cは、単一遺伝子病の診断の促進に関連する具体例を含む。
図15Dは、単一遺伝子病の診断の促進に関連する具体例を含む。
【
図16】
図16Aは、染色体異常の診断の促進に関連する具体例を含む。
図16Bは、染色体異常の診断の促進に関連する具体例を含む。
【発明を実施するための形態】
【0007】
本実施形態の以下の説明は、それらの実施形態に限定するのでなく、むしろ当業者による作製及び使用を可能にすることを意図している。
【0008】
1.概要。
図1A~
図1D及び
図2~
図3に示されるとおり、方法100の実施形態(例えば、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方に関連する特徴付けのための;等)は、品質管理鋳型(QCT)分子セット(例えば、各QCT分子が標的関連領域、変動領域等を含む)を生成することS110;QCT分子セットに基づき(例えば、QCT分子セットの変動領域に基づき;等)QCTシーケンスリードクラスターセット(例えば、QCT分子セットに対応する;等)を(例えば、計算的に;等)決定することS120;及び/又はQCTシーケンスリードクラスターセットに基づき、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方に関連するシーケンシング関連パラメータ(例えば、コンタミネーションパラメータ、分子カウント数パラメータ等)を決定することS130を含み得る。
【0009】
加えて又は代わりに、方法100の実施形態は、1つ以上の配列ライブラリを調製することS112;1つ以上の配列ライブラリをシーケンシングすることS114;1つ以上の病態(例えば、遺伝的障害等)の1つ以上の診断を促進すること(例えば、補助すること、決定すること、提供すること等)S140(例えば、1つ以上のシーケンシング関連パラメータに基づく;等);シーケンシング関連パラメータ、診断、及び/又は他の好適な構成要素に基づくなどして、1つ以上の病態に対する治療を促進すること(例えば、補助すること、決定すること、提供すること、投与すること等)S150;及び/又は任意の他の好適なプロセスを含み得る。
【0010】
具体例において、方法100(例えば、妊婦に関連する母体試料からの遺伝的障害の出生前診断を促進するための;等)は、遺伝的障害に関連するQCT分子セットを母体試料に加えることであって、QCT分子セットが、内因性標的分子(例えば、遺伝的障害に関連する;等)の標的配列領域との配列類似性がある標的関連領域と、内因性標的分子の配列領域との配列非類似性がある変動領域(例えば、可変「N」塩基セットを含む埋め込み分子識別子(embedded molecular identifier:EMI)領域を含む、ここで各「N」塩基は、「A」塩基、「G」塩基、「T」塩基、及び「C」塩基のいずれか1つから選択される等)とを含むこと;QCT分子セットと標的配列領域を含む核酸分子(例えば、核酸;核酸断片;等)とを共増幅することに基づき共増幅混合物を生成すること;共増幅混合物をシーケンシングすること;シーケンシングからのQCT分子シーケンスリードから検出される別個の変動領域の数に基づき、QCT分子セットのユニークな数を計算的に決定することであって、QCT分子シーケンスリードがQCT分子セットに対応すること;QCT分子シーケンスリードの数をユニークなQCT分子数で除すことに基づき平均QCTシーケンシング深度を計算すること;内因性標的分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づき内因性標的分子の絶対カウント数を決定すること;内因性リファレンス分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づき内因性リファレンス分子の絶対カウント数を決定すること;及び内因性標的配列の絶対カウント数と内因性リファレンス配列の絶対カウント数との間の比較に基づき遺伝的障害の出生前診断を促進することを含み得る。
【0011】
具体例において、方法100(例えば、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方に関連した、コンタミネーションを同定するなど、特徴付けのための;等)は、QCT分子セットを生成することであって、各QCT分子が、変動領域(例えば、1つ以上のEMI領域を含む等)及び/又は標的関連領域(例えば、生物学的標的の標的配列領域との配列類似性がある等)を含むこと;QCT分子セットの変動領域に基づきQCTシーケンスリードクラスターセットを計算的に決定することであって、例えばここでQCTシーケンスリードクラスターセットが、QCT分子セットと生物学的標的を含む試料(例えば、生物学的標的に対応する内因性標的分子を含む試料;等)とをベースに生成されるQCT混合物に対応するシーケンシングから導き出されたQCT分子シーケンスリードを含み、例えばここでシーケンシングライブラリ調製が、QCT分子セットと生物学的標的を含む核酸分子との(例えば、標的関連領域と生物学的標的の標的配列領域との配列類似性に基づく等)共増幅を含むこと;及びQCTシーケンスリードクラスターセットに基づき、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方に関連するシーケンシング関連パラメータを決定すること(例えば、シーケンシングライブラリ調製及びハイスループットシーケンシングのうちの少なくとも一方に関連するコンタミネーションを記述するコンタミネーションパラメータを決定すること等)を含み得る。
【0012】
具体例において、
図2に示されるとおり、方法100(例えば、QCT分子に基づくシーケンシングベースのアッセイの妥当性を確保するための;等)は、QCT分子のQCTライブラリ又はQCTライブラリ混合物を生成すること(例えば、QCT DNAは、
図2に黒色の矢印として図示されるPCRプライマーを使用した共増幅を可能にするため目的の遺伝子との高い類似性がある標的関連領域を含む;QCT DNAは、目的の遺伝子と比較して配列差異のある変動領域を含み、例えばここで変動領域は、ランダムに「A」、「C」、「T」、又は「G」塩基をとることのできる「N」塩基を含むEMI領域を含んでもよく、例えばここで最大4^4個のユニークなEMI配列が「NNNN」で生成されることができ、例えばここで2つのQCT分子が同じEMIを有する確率は、ハッシュ衝突確率の計算に関する誕生日問題の解法を用いて見出すことができ、例えばここでQCTとHBBとの配列差異のサブセクションが、
図2に示され得る;QCT DNAは、シーケンシングリード中のQCTライブラリと目的の遺伝子配列とを区別するためのQCT識別子(QCT ID)領域を含む;等);QCTライブラリをヒトDNAにスパイクインすることによるなど、QCT分子及び生物学的標的(例えば、HBB、
図2に示されるとおり;等)を含む1つ以上の試料に基づきシーケンシングライブラリを調製すること;計算論的アプローチを適用してQCT分子シーケンスリードをクラスター形成し(例えば、EMI配列類似性に基づく;ここでEMIクラスターの数は、試料にスパイクインされたQCT分子の絶対数に対応する;等)及びクラスターを異なる試料識別子(例えば、異なる試料に対応する;シーケンシングに使用された異なる試料コンパートメントに対応する;等)に割り当てること;及びかかるデータを用いて、クロスコンタミネーション、インデックスミスアサインメント、ユーザーエラー(例えば、アッセイの実行における)、アッセイパラメータとの不適合(例えば、入力DNA量、試料中の利用可能なゲノム当量が少な過ぎる;等)などの品質管理メトリックを評価すること、及び/又はアッセイが利用可能な入力された生物学的標的の量を定量化することを含み得る。
【0013】
方法100及び/又はシステム200の実施形態は、生物学的標的の存在量を正確に定量化し、コンタミネーション(例えば、異なる試料間、異なる実験間でのクロスコンタミネーション;ユニークデュアルインデックスプライマーの使用に関連する真のコンタミネーションレベル;等)を正確に追跡し及び/又はその程度を定量化し、シーケンシングベースのアッセイの実行におけるユーザーエラーを同定し、シーケンシングインデックスミスアサインメントをモニタし、アッセイパラメータとの不適合を決定し、コンタミネーション及び/又はインデックスホッピングを起こすプライマーを同定し及び/又はその除去を促進し、及び/又は診断及び/又は治療の改善のためなど、シーケンシングライブラリ調製及び/又はシーケンシングに関連する任意の好適な側面を改善する働きをし得る。
【0014】
ある例において、試料セットに単一の試薬(例えば、QCT分子セットを含む等)が加えられてもよく、全ての試料に単一の試薬を加えることによりクロスコンタミネーション並びに他のユーザーエラーを追跡することができ、本明細書に開示される。ある例において、QCT分子を加えると、ハッシュ衝突に関する誕生日問題の解法に基づくカスタムの数学的及び計算論的分析パイプラインを伴うとき、異なるユーザー間、異なる実験間、及び異なる試料間でのクロスコンタミネーションを同時に追跡することができる。複数の例において、ユーザーフレンドリー性及び利便性の向上のためなど、全ての試料(例えば、ハイスループットシーケンシングに関連する;等)に単一のQCTライブラリが加えられてもよい。具体例において、別個のQCTライブラリ(例えば、異なるQCT識別子領域、例えばQCT IDなどに対応する等)が試料調製の異なる段階で加えられてもよく、任意のユーザーエラー又は入力試料の損失を追跡することができる。複数の例において、自動化されたフィンガープリント・オン・ディスペンス(fingerprint-on-dispense)手法を適用することができ、ここでは各試料をQCT分子によって(例えば、QCT分子の変動領域;QCT分子のQCT識別子領域に基づき;等)識別することができる。複数の例において、PCRキャリーオーバーに起因するコンタミネーションが測定されてもよく、かかるコンタミネーションは臨床環境及び/又は他のコンテクストにおける懸念であり得る。具体例において、QCT分子を使用して各PCRチューブに分子フィンガープリントを割り当てることができ、所与の検査場所又は検査室で実施されるあらゆるPCRチューブに関連する全ての変動領域(例えば、EMI領域のEMI配列等)のデータベースを管理することにより、PCRキャリーオーバーを検出及び定量化し得る。後続のアッセイにおけるキャリーオーバーPCRは、次には歴史的データベースで変動領域フィンガープリント(例えば、EMIフィンガープリント類似性等)を計算的に検索することにより同定し得る。
【0015】
実施形態は、加えて又は代わりに、ハイスループットシーケンシング(例えば、NGS等)に関する重要な懸念、即ち「インデックススイッチング」又はインデックスミスアサインメントに対する品質保証に用いることができる。複数の例において、いかなるクロスコンタミネーションもない場合であっても、同じフローセルでのマルチプレックス化時に1つの試料からのシーケンシングリード又はシグナル(例えば、最大5~10%;等)が別の試料に誤って割り当てられ得る。複数の例において、簡便なフィンガープリント・オン・ディスペンス手法を実施して、あらゆる試料におけるミスアサインメントの程度を正確に定量化することができる。具体例において、
図4A~
図4Dに示されるとおり、近隣のウェルにおけるクロスコンタミネーション及びインデックスミスアサインメントの累積効果を90%を超える感度で検出することができる。具体例において、
図4Aに示されるとおり、i7及びi5インデックスの全96通りの組み合わせを用いてIllumina Truseq HTライブラリを調製することができ、ここでは各ウェルがHBBアンプリコンシーケンシング実験に対応し、各ウェルに400、200、100、又は0個のQCT分子が加えられる;各ウェルには、クロスコンタミネーションと同定されるQCTリードの比率が示され、ここでこの実験では、クロスコンタミネーション及びインデックスミスアサインメントは1%未満13%以下の範囲であった;D710~D712列はQCT分子が0個であるため、これらのウェルにおける比率は、方法100の実施形態の変形形態がクロスコンタミネーションを検出し得る感度を示す;及びここで
図4Bは、×で示した、D702/D504に見られる混入リードの数及び混入源(左);並びに〇で示した、D702/D504に由来する混入リードの数及び混入先(右)を図示し;及びここで
図4Cは、
図4Bと類似の、但しウェルD707/D504についての分析を図示し;及びここで
図4Dは、ウェルD710/D504及びD711/D504の混入源を図示し、ここでこれらのウェルにQCT分子を加えていないことと一致して、これらのウェルに由来する混入リードは認められなかった。
【0016】
実施形態は、加えて又は代わりに、リード深度が十分な場合(例えば、別個のQCT分子1個当たり20リード深度より高い;等)など、生物学的標的の正確な分子カウント(例えば、QCT分子セットの変動領域セットの使用に基づく等)を可能にすることができ、これは複雑な配列の付加を用いる手法において正確な標的定量の取得に役立ち得る。実施形態は、リード深度が十分に高い場合に、アッセイされる利用可能な生物学的標的を定量化することができる。ある例において、アンプリコンシーケンシングによる無侵襲的出生前遺伝学的検査に用いられる突然変異の検出に関して、各試料に400個未満のQCT分子を加えると、複雑な配列についてかかる高いリード深度が得られ、例えばここでMiSeqランで96個のかかる試料がマルチプレックス化される(例えば、
図7Cに示されるとおり)。しかしながら、分子カウント及び/又は他の好適な機能の促進のため、1つ以上の試料に任意の好適な数のQCT分子を加えることができる。具体例において、
図5A~
図5Bに示されるとおり、シーケンスリード数と分子数(例えば、シーケンスリード及びQCT分子に関連する処理に基づき決定される;等)とは相関することができ、及びここで分子数とリード数との比は2~3倍異なり得ることから、所与の試料中の分子数の決定にQCT分子を使用することに関連する改善(例えば、リード数それ自体を使用することと比べた信頼度の改善;等)が指摘される。
【0017】
複数の例において(例えば、1つ以上の生物学的標的の分子カウント絶対数を定量化する例等)、方法100及び/又はシステム200を用いると、a)アッセイの診断アウトカムを決定するためのアルゴリズムに用いるパラメータを決定し、b)実験又はアッセイの種々の段階における入力DNAの損失を追跡し、c)標的分子数が少な過ぎる場合にノーコール結果を返し(例えば、アッセイが信頼できない場合を決定する等)、d)特定の遺伝子座における又は遺伝子座間でのコピー数変異を検出するアッセイを設計し、及び/又はe)診断アッセイ結果に基づく治療上及び臨床上の意思決定を支援することができる。
【0018】
実施形態は、加えて又は代わりに、技師マネジメント及び/又は検査室マネジメント(例えば、臨床検査室マネジメント;等)に関連する幾つかの品質面を評価及び/又は改善することができる。
図6に示されるとおり、具体例において、方法100及び/又はシステム200を用いて異なる技師又は検査室による問題のある試料処理を同定することができ、ここで試料A01~A06と、それに対する試料B31~B35のランは、2つの異なる検査室において異なるPCR前/PCR後分離実施技法で行われた;処理前に、同じキットからの同じ容積のQCT分子(概略で約200分子に対応する)を各試料に加えた;「num_seqs」は、各試料について同定された別個のEMIクラスター数を示す;「contam_frac」は、各試料中に同定された混入リードの総比率を示す;「collision_frac」は、2つの有効なEMIクラスターがどの程度2つの異なる試料に見られるかを同定する;「contam_collision_frac」は前述の2つのメトリックを結合する;「ident_frac」は、有効なEMIにマッピングされるリード数を当該の特定の試料についての総リード数で除したものである;「reads_per_qctmol」は、EMIの平均リード深度を示す;これらの導き出されたメトリックにフィルタ閾値を使用して、品質管理(QC)を通過する又は通過しない試料を同定した;ここで検査室Aについては6例中1例の試料のみがQCメトリックを通過した一方、検査室Bについては5例中5例の試料がQCメトリックを通過した;及びここでこれらの結果を用いて、試料処理及びPCR前/PCR後分離をどのように行い得るかを変更することができる(例えば、ここで検査室Aでは、試料処理の改善を伴う次のランにおいて、試料は同じQCメトリックを通過した;等)。
図7A~
図7Cに示されるとおり、具体例において、同じプールから分注される複数のQCT種を含めることにより、QCT分子カウント絶対数の相関を用いてピペットのランダムエラーを測定することができ(例えば、
図7Cに示されるとおり)、及び/又は系統的ピペット及び/又は定量エラーが、加えて又は代わりにトレース可能であり得る(例えば、
図7Aに示されるとおり、中央のパネルと左右のパネルとの比較に基づくなど)。具体例において、
図7A~
図7Cに示されるとおり、スパイクインされたQCT分子の絶対的定量を決定することができる。具体例において、
図7Aに示されるとおり、QCT1、QCT2、及びQCT3ライブラリ(例えば、異なるQCT分子セットに対応する;等)を調製し、プールし、及びQCTライブラリ当たり100、200、又は400分子でPCR反応物にスパイクインすることができる;多くても2塩基の変化でEMIシーケンスリードを集約することにより、各QCTライブラリのEMIをクラスター形成することができる;エラーバーは24レプリケートの平均値±標準偏差を表し得る;及びグラフ線は線形回帰フィットを表し、網掛けが平均値の95%信頼区間に対応し得る。具体例において、
図7Bに示されるとおり、リード深度に対するQCTカウントのロバスト性を決定するため、全リードの1/2をランダムに選択することによりシーケンシングリードをダウンサンプリングしてもよい;ダウンサンプリングしたシーケンシングリードから回収されたEMIクラスターの数を完全なデータセットに対してプロットすることができる;点の色はEMIクラスター当たりのダウンサンプリング後のリード深度を表してもよく、ここで黒色の線は、傾き=1、切片=0である;QCT分析は、QCT分子当たりのリード深度が20を超えるときロバストであり、これは分子カウントの信頼性を支援し得る;及びQCTクラスターの数が400のとき、ダウンサンプリング後のリード深度は1分子当たり20未満である。具体例において、
図7Cに示されるとおり、QCT分子カウント数はQCTライブラリ間で無相関であり得る(例えば、予想どおり等);ここで100QCT分子入力レベルでの
図7Aからの各PCRレプリケートについてQCT3クラスター数対QCT1クラスター数の散布図を示すことができる。
【0019】
実施形態は、加えて又は代わりに、種々のシーケンシングライブラリ調製段階(例えば、試料調製段階)及び/又はシーケンシング段階でQCTライブラリを展開して試料損失をトレースすることができる。具体例において、試料採取時点で第1のQCT分子セット(例えば、QCT1分子;第1の共有QCT識別子領域を含む第1のQCT分子;等)が分注され、試料精製後に等量の第2のQCT分子セット(例えば、QCT2分子;第2の共有QCT識別子領域を含む第2のQCT分子;等)が分注される場合、第1のQCT分子セット及び第2のQCT分子セットについての分子カウント数の比較により(例えば、QCT1対QCT2分子カウント数等)、精製収率が評価されてもよい。
【0020】
実施形態は、加えて又は代わりに、生物学的材料のうちアッセイが利用可能な分量を、QCT分子を使用することに基づく生物学的標的の定量化によるなどして決定することができ、これは利用可能な総ゲノム材料の測定及び予想される生物学的標的濃度の計算を改善し得るものであり、というのも、全ての標的をアッセイに利用できるわけではないからである。具体例において、これは、胎児の遺伝子状態を決定するための無侵襲的出生前遺伝学的検査(NIPT)の適用においてアッセイされる循環遊離DNA及び循環腫瘍DNAがアッセイされるリキッドバイオプシー適用の場合のように、DNAを短いサイズ分布に剪断することに起因し得る。具体例において、これらの適用では、目的の標的次第では利用可能なDNAは25%未満であり、ここで、
図8A~
図8Bに示されるとおり、入力DNAゲノム当量の決定はQCT分子を使用して決定することができ、例えばここでヒトゲノムDNAは、目的の遺伝子のそれぞれ外側及び内側で切断するAlu又はHpyのいずれかによって消化される制限酵素であってもよい;次にQCT分子を9ng~36ngの消化済みDNA(2,500~10,000ゲノム当量に相当する)にスパイクインし、PCR増幅し、MiSeqでシーケンシングすることができる;各PCR反応物中のヒトDNAのゲノム当量(G.E.)は、方法100の実施形態の該当部分におけるQCT分子に関連する分析によって測定することができる;PCR反応はデュプリケートで実施することができ、ここで
図8Aは線形フィット線を示し、網掛けは平均値の95%CIであり、及びここで入力DNAの測定値はレプリケート間で且つ希釈系列を通じて一貫しているが、しかし系統的にQubit測定値より一定の倍数だけ高い;及びここで、
図8Bに示されるとおり、ヒトゲノムDNAは、ピークが100~150bpのサイズ分布に剪断することができる;次にQCT分子を2.3ng~36ngの剪断DNAにスパイクインすることができ、及びアンプリコンサイズが約150bpで、剪断DNAのゲノム当量を測定することができ、及びここで
図8Bは、線の傾きがランダムな剪断に起因して増幅され得る分子の比率を指示していることを示す。具体例において、
図9に示されるとおり、QCT分子を使用するとアッセイ可能なゲノム当量を測定することができ、これはアッセイ毎に異なってもよく、同じアッセイであってもフットプリントで異なり得る;ここでは剪断DNAから同じ突然変異を取り囲む領域を増幅して150bp PCR産物対72bp PCR産物(左対右)が形成され、いずれの場合にもQCT分子を使用して増幅された分子の数を測定した;ここでは5000入力ゲノム当量に相当する18ナノグラム(ng)のゲノムDNAを約170bpの平均長さ(例えば、循環遊離DNAの平均長さ)に剪断し、いずれの場合にも含めた(150bpについてn=8及び72bpについてn=4);及び理論的モデルと一致して、増幅することのできる分子の数は入力DNAより大幅に少なく、同じ入力DNA質量について異なるフットプリント間で2倍もの差があり得る;及びここで
図9は、なぜ他の入力DNA測定値(濃度など)は、分子情報を必要とする正確な分子診断に十分でないことがあるのかを示し得るものであり、例えばここで分子カウント数が約2分の1に減少したならば、そのポアソン雑音は約40%増加し、これは95%(2σ)~99%(3σ)の正確度の差であり得る。
【0021】
方法100及び/又はシステム200の実施形態は、1つ以上の病態に関連して(例えば、1つ以上の病態に関する過程の特徴付け、診断、治療、及び/又は実施に関連して;等)用いることができ、ここで病態は、無侵襲的出生前遺伝学的検査(NIPT)(例えば、21トリソミー又はダウン症候群、18トリソミー又はエドワーズ症候群、13トリソミー又はパトー症候群、ターナー症候群などの性染色体異数性、他の好適な異数性など、異数性を含む染色体異常;ディジョージ症候群を含めた染色体異常の存在についての遺伝子スクリーニングに関する;単一遺伝子病についての遺伝子スクリーニングに関する;等);他の出生前検査;出生前コンテクスト以外での異数性分析及び/又は他の好適な分析;遺伝的障害(例えば、鎌状赤血球症を含めた単一遺伝子病;染色体異常;遺伝子増幅に関連する障害;遺伝子欠失;部分染色体異常;22q11.2欠失症候群又はディジョージ症候群;シャルコー・マリー・トゥース症候群、嚢胞性線維症、ハンチントン病;デュシェンヌ型筋ジストロフィー;血友病、サラセミア;等)、染色体異常に関連する他の適用(例えば、追加的な、欠損している、不規則な染色体DNA等)、癌(例えば、任意の好適な癌遺伝子、癌バイオマーカー、及び/又は他の癌関連標的に関連する分析を通じて;リキッドバイオプシーに関連する分析を通じて)、及び/又は任意の他の好適な病態のうちの1つ以上を含んでもよく、及び/又は他の形でそれに関連してもよい。ある例において、方法100は、無侵襲的出生前遺伝学的検査及びリキッドバイオプシーの少なくとも一方に関連する診断を促進するため、標的分子カウント数(例えば、試料中の標的分子の数に対応する;QCT分子の使用に基づく;等)を決定することを含んでもよい。病態は、加えて又は代わりに、精神医学的及び行動的病態(例えば、心理的障害;抑欝;精神病;等);コミュニケーション関連病態(例えば、表出性言語障害;吃音;音韻障害;自閉症障害;発声病態;聴覚病態;眼病態;等);睡眠関連病態(例えば、不眠症;睡眠時無呼吸;等);心血管関連病態(例えば、冠動脈疾患;高血圧;等);代謝関連病態(例えば、糖尿病等)、リウマチ様関連病態(例えば、関節炎等);体重関連病態(例えば、肥満症等);疼痛関連病態;内分泌関連病態;慢性疾患;及び/又は任意の他の好適な種類の病態を含んでもよい。
【0022】
方法100及び/又はシステム200の1つ以上の実施形態に関連するシーケンシング(例えば、S112に関する)は、好ましくはハイスループットシーケンシングを含み、これは、NGS、NGS関連技術、超並列シグネチャシーケンシング、Polonyシーケンシング、454パイロシーケンシング、Illuminaシーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope1分子シーケンシング、1分子リアルタイム(SMRT)シーケンシング、ナノポアDNAシーケンシング、いずれかの世代数のシーケンシング技術(例えば、第2世代シーケンシング技術、第3世代シーケンシング技術、第4世代シーケンシング技術等)、アンプリコン関連シーケンシング(例えば、ターゲットアンプリコンシーケンシング)、メタゲノム関連シーケンシング、合成によるシーケンシング、トンネル電流シーケンシング、ハイブリダイゼーションによるシーケンシング、質量分析シーケンシング、顕微鏡法ベースの技法、及び/又はハイスループットシーケンシングに関する任意の好適な技術のいずれか1つ以上を含んでもよく、及び/又はそれに関連してもよい。加えて又は代わりに、シーケンシングは任意の好適なシーケンシング技術(例えば、サンガーシーケンシング、キャピラリーシーケンシング等)を含むことができる。
【0023】
方法100及び/又は本明細書に記載されるプロセスの実施形態の1つ以上の工程及び/又は部分は、非同期的に(例えば、逐次的に)、同時に(例えば、並行して;生体試料をマルチプレックスの自動化された方法で同時に処理すること;システム処理能力の向上のためシーケンスリードを同時に計算処理すること;等)、トリガーイベントとの時間的関係において、及び/又は任意の他の好適な順序で、任意の好適な時点及び頻度で、システム200、本明細書に記載される構成要素、及び/又は実体の実施形態の1つ以上の工程により、及び/又はそれを用いて実施されてもよい。
【0024】
加えて又は代わりに、本明細書に記載されるデータ(例えば、クラスター、シーケンシング関連パラメータ、識別子、リード深度、シーケンスリード、配列領域決定、QCT分子設計、プライマー設計等)は、データがいつ収集され、決定され、送信され、受信され、及び/又は他に処理されたかを指示する時間的インジケータ;シーケンシングライブラリ調製段階及び/又はシーケンシング段階の順番を指示する時間的インジケータなど、データによって記述される内容に文脈を付与する時間的インジケータ;時間的インジケータの変化(例えば、経時的データ;データの変化;データパターン;データ傾向;データ外挿及び/又は他の予測;等);及び/又は時間に関する任意の他の好適なインジケータのうちの1つ以上を含む任意の好適な時間的インジケータ(例えば、秒、分、時間、日、週、期間、時点、タイムスタンプ等)に関連し得る。
【0025】
加えて又は代わりに、本明細書に記載されるパラメータ、メトリック、入力、出力、及び/又は他の好適なデータは、スコア、バイナリ値、分類、信頼水準、識別子(例えば、試料識別子、QCT分子識別子等)、スペクトルに沿った値、及び/又は任意の他の好適な値の型のうちの任意の1つ以上を含む値の型に関連し得る。本明細書に記載される任意の好適な型のデータが、方法100及び/又はシステム200の実施形態に関連する任意の好適な構成要素についての入力として使用され、出力として生成され、及び/又は任意の好適な方法で操作されることができる。
【0026】
システム200の実施形態は、加えて又は代わりに、分子(例えば、QCT分子;QCTライブラリ;等)を生成し、生体試料を処理し、及び/又は他の好適なプロセスを実施するように構成された試料ハンドリングネットワーク;生体試料とQCT分子とをベースに生成される混合物からの処理された遺伝子材料をシーケンシングするように構成されたシーケンシングシステム;シーケンスリードを分析し、QCTシーケンスリードクラスターを決定し、シーケンシング関連パラメータを決定し、診断を促進し、治療を促進し、及び/又は他の好適なプロセス(例えば、計算プロセス)を実施するように構成された計算システム(例えば、リモート計算システム;ローカル計算システム;等);及び/又は任意の他の好適な構成要素を含み得る。システム200の構成要素は、何らかの方法で(例えば、方法100の実施形態の一部に関してなど、構成要素間で機能を何らか好適に分散して;等)物理的に及び/又は論理的に統合されてもよい。しかしながら、方法100及びシステム200は任意の好適な方法で構成されることができる。
【0027】
2.1 QCT分子を生成する。
方法100の実施形態は、QCT分子セットを生成することS110を含んでもよく、これは、下流の計算処理を促進するためなど(例えば、配列関連パラメータ決定を促進するためのQCTシーケンスリードクラスター決定;等)、シーケンシングライブラリ調製及びシーケンシング(例えば、ハイスループットシーケンシング等)のうちの少なくとも一方の1つ以上の段階(例えば、ステップ、フェーズ、期間、時期等)で使用される(例えば、加えられる、処理される、シーケンシングされる等)ことになる分子を生成する働きをし得る。
【0028】
QCT分子は好ましくは、標的関連領域(例えば、QCT分子1個当たり1つ以上の標的関連領域;等)を含む。
図2に示されるとおり、標的関連領域は好ましくは、1つ以上の標的分子(例えば、内因性標的分子;1つ以上の生物学的標的に対応する;等)の1つ以上の標的配列領域との配列類似性(例えば、完全な配列類似性;閾値条件を満たす配列類似性;指定された数の塩基の配列類似性;等)を含むが、加えて又は代わりに、1つ以上の標的分子の任意の好適な構成要素との任意の好適な関連性を含んでもよい。標的関連領域は好ましくは、対応するQCT分子(例えば、標的関連領域を含む等)と標的配列領域を含む核酸分子(例えば、核酸、核酸断片等)との共増幅を可能にし、これは分子カウントにおける(例えば、分子カウント数パラメータの決定における;増幅バイアスを考慮することによる;等)正確度の改善を促進し得るが、加えて又は代わりに、シーケンシングライブラリ調製、シーケンシング、及び/又は方法100の実施形態の一部に関連する任意の好適なプロセスを可能にし得る。ある例において、シーケンシングライブラリ調製(例えば、シーケンシングライブラリ調製を実施する S112)は、QCT分子セットと生物学的標的を含む核酸分子との、標的関連領域と生物学的標的の標的配列領域との配列類似性に基づく共増幅を含んでもよく、及びここでシーケンシング関連パラメータを決定することは、シーケンシングに関連する生物学的標的の分子の数を記述する標的分子カウント数をQCTシーケンスリードクラスターセットに基づき決定することを含み得る。
【0029】
変形形態において、QCT分子は標的関連領域を省略することができる。例えば、QCT分子は、標的関連性なしに(例えば、生物学的標的の標的配列領域との所定の類似性を有することなしに)、及び/又は試料の構成要素(例えば、標的配列領域を含む核酸分子;等)との対応する共増幅なしに、生物学的標的を含む試料の構成要素と共に使用することができる。複数の例において、QCT分子は、シーケンシングに適合するように前処理することができ、例えばここで前処理されたQCT分子をシーケンシングに好適な処理済みの試料に加えることにより、(例えば、ユーザーフレンドリー性の改善のため)共増幅する必要なしに同時シーケンシングすることができる。標的関連領域を省略するQCT分子は、好ましくはコンタミネーションパラメータ決定の促進に有用であるが、加えて又は代わりに、任意の好適なシーケンシング関連パラメータ決定の促進に使用することができる。具体例において、QCT分子セットは後続のシーケンシング(例えば、NGSなどのハイスループットシーケンシング;等)に適合させることができ、ここでQCT分子セットを生成することは、QCT分子セットの第1のQCT分子サブセット(例えば、各々が第1の共有QCT識別子領域を含む;等)を増幅すること;及びQCT分子セットの第2のQCT分子サブセット(例えば、各々が第2の共有QCT識別子領域を含む;等)を増幅することを含んでもよく、ここでQCT分子シーケンシングリードは、第1のQCT分子サブセットと生物学的標的を含む(例えば、生物学的標的に対応する第1の標的分子を含む;等)試料とをベースに生成されるQCT混合物、及び第2のQCT分子サブセットと生物学的標的を含む(例えば、生物学的標的に対応する第2の標的分子を含む;等)追加的な試料とをベースに生成される追加的なQCT混合物に対応するシーケンシングから導き出され、ここで試料及び追加的な試料は、それぞれ、試料コンパートメントの第1の試料コンパートメント及び第2の試料コンパートメントに対応する。しかしながら、標的関連領域及び/又は標的関連領域を省略するQCT分子は、任意の好適な方法で構成することができる。
【0030】
QCT分子は好ましくは、1つ以上の変動領域(例えば、QCT分子1個当たり1つ以上の変動領域;隣接する変動領域;離れた変動領域;等)を含む。
図2に示されるとおり、変動領域は好ましくは、標的分子の1つ以上の配列領域(例えば、標的配列領域と別個の;等)との配列非類似性(例えば、完全な配列非類似性;指定される数の塩基の非類似性;部分的配列非類似性;等)を含む。変動領域は、加えて又は代わりに、1つ以上のEMI領域を含むことができる。変形形態において、EMI領域は可変「N」塩基セット(例えば、1つ以上の可変「N」塩基等)を含むことができ、ここで各「N」塩基は、「A」塩基、「G」塩基、「T」塩基、及び「C」塩基のいずれか1つから選択される(例えば、ランダムに選択される;所定の統計的分布及び/又は確率に従い選択される;等)。変形形態において、EMI領域は、QCTシーケンスリードクラスター決定を(例えば、EMI領域間のペアワイズハミング距離を最大化することにより;等)促進するように設計された合成領域など、1つ以上の指定された塩基(例えば、設計及び合成された塩基;等)を含む合成領域(例えば、マイクロアレイ上の;シリコンベースの合成を用いる;等)を含むことができる。変形形態において、QCT分子は、加えて又は代わりに、複数のEMI領域(例えば、複数のEMI領域;隣接するEMI領域;離れたEMI領域;可変「N」塩基を含むEMI領域;合成領域を含むEMI領域を含む変動領域;等)を含むことができる。例えば、QCT分子セットの各変動領域は、可変「N」塩基セットを含む埋め込み分子識別子領域を含むことができ、ここで各「N」塩基は、「A」塩基、「G」塩基、「T」塩基、及び「C」塩基のいずれか1つから選択され、ここでQCT分子セットの各QCT分子は、追加的な可変「N」塩基セットを含む追加的なEMI領域を更に含み、ここで追加的なEMI領域はEMI領域とQCT分子の配列領域によって隔てられており、例えばここで可変「N」塩基セット及び追加的な可変「N」塩基セットは、各々が、決められた(例えば、所定の)数の「N」塩基(例えば、3より多い「N」塩基、任意の好適な数より多い「N」塩基、正確にある数の「N」塩基;等)を含むことができ、及びここでシーケンシング関連パラメータ(例えば、コンタミネーションパラメータ)を決定することは、QCT分子セットのEMI領域及び追加的なEMI領域に基づき(例えば、EMI領域と追加的なEMI領域との対に対応する別個のEMIシーケンスリードに基づき;等)導き出されるQCTシーケンスリードクラスターに基づくことができる。変形形態において、変動領域は、加えて又は代わりに、合成されたを含むことができる
【0031】
変形形態において、
図2に示されるとおり、QCT分子は、QCT分子セットに属するQCT分子を識別する共有QCT識別子領域(例えば、共有配列領域、標的分子の1つ以上の配列領域との非類似性がある等)など(例えば、ここで異なるQCT識別子領域は異なるQCT分子セットにユニークである等)、QCT分子(及び/又は他の好適なQCT分子)を識別するQCT識別子領域を含むことができる。ある例において、第1のQCT分子セットの各QCT分子の変動領域は、第2のEMI領域と少なくとも第1のQCT識別子領域によって隔てられている第1のEMI領域を含むことができ、ここで第2のQCT分子セットの各追加的なQCT分子は、第2の追加的なEMI領域と少なくとも第2のQCT識別子領域によって隔てられている第1の追加的なEMI領域を含むことができる。ある例において、第1の、第2の、第1の追加的な、及び第2の追加的なEMI領域は可変「N」塩基セットを含むことができ、及びここで各「N」塩基は、「A」塩基、「G」塩基、「T」塩基、及び「C」塩基のいずれか1つから選択され、及びここでQCTシーケンスリードクラスターセットを計算的に決定することは、第1及び第2のQCT識別子領域に基づいて、並びに第1の、第2の、第1の追加的な、及び第2の追加的なEMI領域に基づいてQCTシーケンスリードクラスターセットを決定することを含んでもよい。ある例において、第1のQCT分子セットの各QCT分子について、対応するQCT分子配列は、第1のQCT識別子領域、第1のEMI領域、及び第2のEMI領域を除く生物学的標的の第1の配列鋳型との完全な配列類似性によって特徴付けられ;及びここで、第2のQCT分子セットの各追加的なQCT分子について、対応する追加的なQCT分子配列は、第2のQCT識別子領域、第1の追加的なEMI領域、及び第2の追加的なEMI領域を除く第2の配列鋳型との完全な配列類似性によって特徴付けられる。具体例において、QCT分子配列は、先に決定された別個のQCT識別子領域(例えば、ユニークな識別子配列等)によって分断されている5N配列の2つの離れたセクションを除き、標的分子配列(例えば、標的分子配列の1つ以上の領域;等)と同一であってもよい。具体例において、QCT識別子領域(例えば、ユニークなQCT ID配列、
図2に示されるとおり等)を用いると、内部対照のため1つの段階で加えられるか、又は入力された生物学的標的の損失若しくは他のユーザーエラーを追跡するため種々の段階で加えられてもよい複数のQCTライブラリの使用が可能となり得る。加えて又は代わりに、QCT識別子領域は、任意の好適な方法で構成することができる。しかしながら、QCT分子は、任意の好適な種類の領域の任意の好適な組み合わせを含むことができる(例えば、ここで異なるQCT分子は、同じ又は異なる種類及び/又は数の領域を含む;標的分子の配列領域との任意の好適な配列類似性及び/又は非類似性がある;等)。
【0032】
変形形態において、方法100は、加えて又は代わりに、1つ以上のQCTライブラリを生成すること(例えば、各QCTライブラリがQCT分子を含む等)を含んでもよく、例えばここでQCTライブラリは複数のQCT分子セットを含むことができ、例えばここで各QCT分子セットは異なるQCT識別子領域によって識別可能である。ある例において、QCTライブラリを生成することは、異なるQCT分子セットを増幅することを含み得る(例えば、シーケンシングの調製のため、例えばここでQCT分子は、QCT混合物の生成のため試料の1つ以上の構成要素に加える前に増幅される;等)。複数の例において、QCTライブラリを生成することは、QCTライブラリに含めるQCT分子の数を決定することを含んでもよい。具体例において、QCT分子の特有の多様性を所与として各試料に含まれるべきユニークなQCT分子の最大数を誕生日問題の解法を用いて決定することができ、例えばここで、QCT分子中の10個の可変N塩基によって生成され得る4^10個の配列について、約0.5の確率の単一の有効なEMI衝突として最大1200個のQCT分子を使用することができ(exp(-1200×1199/2/4^10)≒0.5)、及びここで200個のQCT分子では、単一の有効な衝突の確率は約2%である。具体例において、QCTライブラリを生成することは、試料セットの各試料につき0.00001ナノグラム未満(及び/又は他の好適な量)の増幅可能なQCT分子の展開(例えば、シーケンシングライブラリ調製及びハイスループットシーケンシングのうちの少なくとも一方の一段階における等)に適合したQCTライブラリを生成することを含んでもよい。しかしながら、QCTライブラリに含めるQCT分子の数を決定すること、及びQCTライブラリを生成することは、任意の好適な方法で実施することができる。
【0033】
ある例において、QCTライブラリは、可変「N」配列を含む一本鎖オリゴヌクレオチド配列に対する相補鎖を合成することにより生成されてもよい。具体例において、QCTウルトラマー(ultramer)を相補的なプライマー配列と再懸濁してアニールし、クレノウ断片(exo-)を使用して配列を伸長させ、及びエキソヌクレアーゼIで処理することにより、二本鎖QCTライブラリが生成されてもよい。最終産物を精製して未使用の一本鎖DNA分子が除去されてもよく、及びQCTライブラリはQubit HSアッセイなどの蛍光定量アッセイを用いて定量化することができ、そこから各試料に加えるQCT分子の数が、この二本鎖QCT分子の予想分子量を用いることにより計算されてもよい。
【0034】
しかしながら、QCT分子を生成することS110は、任意の好適な方法で実施することができる。
【0035】
2.2 QCTシーケンスリードクラスターセットを決定する。
方法100の実施形態は、1つ以上のQCTシーケンスリードクラスターを決定することS120を含んでもよく、これは、シーケンシング関連パラメータ決定を促進するため、QCT分子シーケンスリードを(例えば、シーケンシングライブラリ調製及びシーケンシングの後に等)クラスター形成する働きをし得る。
【0036】
QCTシーケンスリードクラスターは好ましくは、QCT分子シーケンスリード(例えば、1つ以上のQCT分子セットと生物学的標的を含む1つ以上の試料とをベースに生成される1つ以上のQCT混合物に対応するシーケンシングから導き出される;等)を含むが、加えて又は代わりに、任意の好適なリード及び/又はシーケンシングに関連する成分を含むことができる。
【0037】
QCT分子シーケンスリードは、各試料に分注された1つ以上のQCT分子セットの識別情報を決定するためなど、計算的にクラスター形成することができる。様々な計算論的クラスター形成手法を用いることができ、限定はされないが、主成分分析、K平均法、階層クラスタリング、及び/又は任意の配列同一性に基づくクラスター形成手法が挙げられる。加えて又は代わりに、クラスター形成、クラスター形成に関連する計算論的分析(例えば、前処理、フィルタリング等)、及び/又は方法100の実施形態の任意の他の好適な一部は、教師あり学習(例えば、ロジスティック回帰を用いる、バックプロパゲーションニューラルネットワークを用いる、ランダムフォレストを用いる、決定木等)、教師なし学習(例えば、アプリオリアルゴリズムを用いる、K平均クラスタリングを用いる)、半教師あり学習、深層学習アルゴリズム(例えば、ニューラルネットワーク、制限ボルツマンマシン、ディープビリーフネットワーク法、畳み込みニューラルネットワーク法、再帰型ニューラルネットワーク法、積層自己符号化器法等)、強化学習(例えば、Q学習アルゴリズムを用いる、時間差学習を用いる)、回帰アルゴリズム(例えば、通常最小二乗法、ロジスティック回帰、段階的回帰、多変量適応型回帰スプライン、局所推定散布図平滑化等)、事例ベースの方法(例えば、k最近傍法、学習ベクトル量子化、自己組織化マップ等)、正則化法(例えば、リッジ回帰、最小絶対収縮と選択演算子、エラスティックネット等)、決定木学習法(例えば、分類及び回帰木、反復二分器3(iterative dichotomiser 3)、C4.5、カイ二乗自動相互作用検出、決定株、ランダムフォレスト、多変量適応型回帰スプライン、勾配ブースティングマシン等)、ベイズ法(例えば、単純ベイズ、平均1従属推定器(averaged one-dependence estimator)、ベイジアンビリーフネットワーク等)、カーネル法(例えば、サポートベクターマシン、動径基底関数、線形判別分析等)、クラスタリング法(例えば、k平均クラスタリング、期待値最大化等)、相関ルール学習アルゴリズム(例えば、アプリオリアルゴリズム、エクラアルゴリズム等)、人工ニューラルネットワークモデル(例えば、パーセプトロン法、バックプロパゲーション法、ホップフィールドネットワーク法、自己組織化マップ法、学習ベクトル量子化法等)、次元削減法(例えば、主成分分析、部分的最小二乗回帰(partial lest squares regression)、サモンマッピング、多次元尺度構成法、射影追跡等)、アンサンブル法(例えば、ブースティング、ブートストラップ集約、アダブースト(AdaBoost)、積層一般化、勾配ブースティングマシン法、ランダムフォレスト法等)、及び/又は任意の好適な人工知能手法のいずれか1つ以上を含む人工知能手法(例えば、機械学習手法等)を適用することができる。
【0038】
QCTシーケンスリードクラスターを決定することは、好ましくは、QCT分子の1つ以上の領域(例えば、変動領域;QCT識別子領域;等)に基づくが(例えば、QCT分子のそれらの領域に対応するシーケンスリードに基づく;等)、加えて又は代わりに、任意の好適なデータに基づいてもよい。具体例において、QCT分子(例えば、標的に関連する品質管理鋳型等)が試料の成分と組み合わされ、標的配列領域及びQCT分子配列(例えば、QCT分子の標的関連領域;等)の両方に相補的なプライマーを用いて生物学的標的(例えば、標的配列領域を含む核酸分子;等)が増幅された後、それらの分子はマルチプレックス化のためインデックスが付加され、シーケンシングされてもよく、及びシーケンシングリードがそのマルチプレックスインデックスに基づき分けられてもよい。具体例において、インデックスが付加されたリードは、次にQCT識別子領域(例えば、QCT ID配列;等)別に異なるQCTグループにクラスター形成することができ、又は予想QCT配列との正確な配列一致(EMI領域などの変動領域を除く等)に基づき同定することができる。ある例において、QCTシーケンスリードクラスターセットを(例えば、計算的に等)決定することは、第1の条件(例えば、閾値数より少ない非類似性の塩基;等)を満たす変動領域配列類似性(例えば、第1のQCT分子の第1の変動領域、及び第2のQCT分子の第2の変動領域との間の;等)に基づき、第1のQCT分子シーケンスリード及び第2のQCT分子シーケンスリードをQCTシーケンスリードクラスターセットのQCTシーケンスリードクラスターにクラスター形成すること、及びQCTシーケンスリードクラスターセットの各QCTシーケンスリードクラスターについて、その試料セットを識別する試料識別子セットの試料識別子への(例えば、シーケンシングライブラリ調製及び/又はシーケンシングに関連する試料への、試料コンパートメントへの等)QCTシーケンスリードクラスターのアサインメントを決定することを含んでもよく、例えばここでシーケンシング関連パラメータ(例えば、コンタミネーションパラメータ等)を決定することは、QCTシーケンスリードクラスターセットと試料識別子セットの試料識別子へのQCTシーケンスリードクラスターのアサインメントとに基づいてもよい。具体例において、第1及び第2のQCTシーケンスリードをクラスター形成することは、3個未満の点置換の変動領域配列類似性に基づいて、及び第2の条件(例えば、QCTシーケンスリードクラスター当たり20リード深度より高い;30リード深度より高い;任意の好適なリード深度より高い;等)を満たすQCTシーケンスリードクラスターに関連するリード深度に基づいて第1及び第2のQCTシーケンスリードをQCTシーケンスリードクラスターにクラスター形成することを含んでもよい。具体例において、QCT分子シーケンスリード(例えば、EMI領域配列を含むシーケンスリード)は、同じウェルにおいてより高いリード深度で点置換が2個以下の別のQCT分子シーケンスリードが観察された場合に集約することができる。具体例において、各EMIが特定の試料並びに対応するウェル及びインデックス又はインデックス対に割り当てられる。
【0039】
変形形態において、QCTシーケンスリードクラスターを決定することは、非有効なQCTシーケンスリードクラスター(例えば、非有効なEMIクラスター等)を決定及び/又は破棄すること(例えば、フィルタリングによって取り除くこと等)を含んでもよい。ある例において、
図10に示されるとおり、非有効なQCTシーケンスリードクラスターは、リード深度が閾値を下回る及び/又は閾値である(例えば、20リード以下;30リード以下;任意の好適なリード深度の閾値;等)、及び/又は任意の好適な条件(例えば、所定のリード深度条件に適合するリード数;等)を満たすQCTシーケンスリードクラスターを含んでもよく、例えばここで分子カウントに際して非有効なQCTシーケンスリードクラスターは破棄され得る。具体例において、有効なQCTシーケンスリードクラスター(例えば、非有効なQCTシーケンスリードクラスターを破棄した後の残りのQCTシーケンスリードクラスター等)を使用して、各試料についてのシーケンシングリードカウント数に対する品質管理鋳型数の比を決定することができる(例えば、ここでこの比を補正係数として使用して標的分子数を定量化することができる等)。具体例において、
図10に示されるとおり、30を超える平均EMIリード深度では、有効対非有効QCTシーケンスリードクラスター(例えば、EMIクラスター等)はシーケンシング深度の顕著な低下によって明確に識別することができ、より低い平均リード深度では、適応手法(例えば、適応リード深度閾値決定;等)を用いて有効対非有効EMIを識別することができる。具体例において、QCTシーケンスリードクラスターセットを決定することは、フィルタリング後のQCTシーケンスリードクラスターサブセット(例えば、有効なQCTシーケンスリードクラスター等)を、そのフィルタリング後のQCTシーケンスリードクラスターサブセットに対応するリード深度(例えば、リード深度閾値条件及び/又は他の好適な条件を満たす;等)に基づき決定することを含んでもよく、例えばここでシーケンシング関連パラメータ(例えば、元の試料中に存在する標的分子数のものなど、標的分子カウント数;等)を決定することは、フィルタリング後のQCTシーケンスリードクラスターサブセットに基づきQCT分子カウント数を決定すること(例えば、ここでフィルタリング後のQCTシーケンスリードクラスターサブセット中のQCTシーケンスリードクラスターの数がQCT分子カウント数に対応し得る;等);QCT分子カウント数とQCT分子シーケンスリードとに基づき(例えば、QCT分子カウント数をQCT分子シーケンスリードで除す;等)補正係数比を決定すること;及び補正係数比と、シーケンシングから導き出された標的分子シーケンスリードであって、生物学的標的に関連する(例えば、標的分子の標的配列領域を含む;等)標的分子シーケンスリードとに基づき(例えば、標的分子シーケンスリード数に補正係数比を乗じる;等)標的分子カウント数を決定することを含んでもよい。具体例において、方法100は、QCT分子シーケンスリードのリード深度分布特徴に基づきリード深度閾値を適応的に決定することを含んでもよく、及びここでフィルタリング後のQCTシーケンスリードクラスターサブセットを決定することは、リード深度が適応的に決定されたリード深度閾値を満たすかどうかに基づきフィルタリング後のサブセットを決定することを含んでもよい。具体例において、リード深度の各リード深度は、フィルタリング後のQCTシーケンスリードクラスターサブセットの対応するQCTシーケンスリードクラスターについて20リード(及び/又は他の好適なリード数;等)より高いものに対応してもよい。複数の例において、シーケンシングエラー及びPCRエラーに起因して、非有効なQCTシーケンスリードクラスターはコンタミネーション以外の側面に起因して非有効であり得る。加えて又は代わりに、有効又は非有効なQCTシーケンスリードクラスターを決定することは、任意の好適な方法で実施することができる。しかしながら、QCTシーケンスリードクラスターを決定することS120は、任意の好適な方法で実施することができる。
【0040】
2.3 シーケンシング関連パラメータを決定する。
方法100の実施形態は、1つ以上のシーケンシング関連パラメータを決定することS130を含み得る。
【0041】
シーケンシング関連パラメータには、コンタミネーションパラメータ(例えば、異なるユーザー間、試料間、実験間などでの、シーケンシングライブラリ調製及び/又はシーケンシングに関連するコンタミネーションを記述する等);分子カウント数パラメータ(例えば、標的分子及び/又はQCT分子など、所与の試料及び/又は混合物中に当初存在する分子の数を記述する;等);試料追跡パラメータ(例えば、試料損失に関連する;等);試料処理エラーパラメータ(例えば、ノイズ;ピペットエラーなどの誤った試料処理操作;系統エラーを記述する;等);定量エラーパラメータ(例えば、定量エラーを記述する;等);分析エラーパラメータ(例えば、計算論的分析エラーを記述する;等);及び/又はシーケンシングライブラリ調製、シーケンシング、関連性分析、及び/又は他の好適な側面に関連する任意の好適なパラメータのいずれか1つ以上が含まれてもよい。ある例において、
図11に示されるとおり、複数の試料間で決定されたQCT分子の数を用いて、ノイズ及び/又は誤った試料処理を記述する試料処理エラーを決定することができる;ここでPCR前に各試料に、約200個のユニークなQCT分子におよそ対応する同容積のQCT分子を加えることができ、PCR及びシーケンシング後にシーケンシングデータから有効なQCTシーケンスリードクラスター(例えば、EMIクラスター等)を決定することができる;ここで約200個のQCT分子の予想変動係数(CV)はsqrt(200)/200≒7%であり、これは12例の試料間での
図11に示す観察データと一致する;ここで任意の試料が特定の閾値(例えば、3σ、200-3×sqrt(200)≒150又は約200/2≒100のあまり厳しくない閾値)を下回る場合、この結果を用いて当該の特定の試料についての試料処理エラーを同定することができる;及びここでQCT分子の数は増加させてもまたよく、プロセスにおける7%未満のCVに対応する追加的な試料処理エラーパラメータを決定することができる。ある例において、シーケンシング関連パラメータを決定することは、QCTシーケンスリードクラスターセットのQCTシーケンスリードクラスターにアサインメントされないQCTシーケンスリードを同定すること;及びアサインメントされないQCTシーケンスリードの数及びQCTシーケンスリード総数からシーケンシングエラー率及びポリメラーゼエラー率のうちの少なくとも一方(例えば、エンド・ツー・エンドシーケンシング及びポリメラーゼエラー率;等)を決定することを含んでもよい。具体例において、標的又はリファレンス配列に対する可変領域(例えば、標的変動領域、リファレンス変動領域等)を有するが、配列の点でQCTリードクラスター配列と同一でない任意の配列は、配列又はポリメラーゼエラーに起因する。具体例において、これらの配列のリードカウント数をQCTリードカウント総数で除したものが、総合シーケンシング及びポリメラーゼエラー頻度である。前者のシーケンシングエラーは線形過程によって生じてもよい一方、ポリメラーゼエラーは指数関数的過程によって生じてもよく(例えば、線形PCRが用いられない限り)、ここで初期PCRサイクルにおけるエラーの効果は指数関数的に増幅し得る。従って、具体例において、QCTリードクラスターにアサインメントされない配列のリードカウント数の分布を分析することにより、シーケンシングエラー対ポリメラーゼエラーの寄与を計算することができる。しかしながら、シーケンシングエラー率及び/又はポリメラーゼエラー率を決定することは、任意の好適な方法で実施することができる。
【0042】
変形形態において、シーケンシング関連パラメータを決定することは、複数のQCT分子セット(例えば、異なる共有QCT識別子領域によって識別される異なるQCT分子セット;シーケンシングライブラリ調製及び/又はシーケンシングに関連する異なる段階で展開される異なるQCT分子セット;等)を伴う処理に基づいてもよく、例えば異なるQCT分子セットに対応する異なるQCTシーケンスリードクラスターサブセットに基づいてもよい。ある例において、方法100は、QCT分子セットを生成することであって、各QCT分子が、QCT分子セット間で共有の、且つQCT分子を識別するように適合された第1のQCT識別子領域を含むこと;追加的なQCT分子セットを生成することであって、各追加的なQCT分子が、追加的なQCT分子セット間で共有の、且つ追加的なQCT分子を識別するように適合された第2のQCT識別子領域を含むこと;第1及び第2のQCT識別子領域に基づきQCTシーケンスリードクラスターセットを決定すること;及びQCTシーケンスリードクラスターセットに基づきシーケンシング関連パラメータを決定することを含んでもよい。具体例において、QCT分子セットは、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方の第1の段階での展開に適合されてもよく、ここで追加的なQCT分子セットは、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方の第2の段階での展開に適合され、ここでQCTシーケンスリードクラスターセットを計算的に決定することは、QCTシーケンスリードクラスターセットの第1のサブセットを(例えば、対応する第1のQCT分子の第1のQCT識別子領域及び第1の変動領域に基づき;等)決定することであって、第1のサブセットが第1のQCT識別子領域に対応し、且つ第1の段階に関連すること;及びQCTシーケンスリードクラスターセットの第2のサブセットを(例えば、対応する第2のQCT分子の第2のQCT識別子領域及び第2の変動領域に基づき;等)決定することであって、第2のサブセットが第2のQCT識別子領域に対応し、且つ第2の段階に関連することを含み;及びここでシーケンシング関連パラメータを決定することは、QCTシーケンスリードクラスターセットの第1及び第2のサブセットに基づいて、試料損失に関連する試料追跡パラメータを決定することを含む。
【0043】
ある例において、シーケンシング関連パラメータを決定することは、QCTシーケンスリードクラスターセットに基づき、それぞれQCT分子セット及び追加的なQCT分子セットに対応する第1の絶対カウント数及び第2の絶対カウント数を決定すること、及び第1及び第2の絶対カウント数に基づきピペットエラーパラメータ及び定量エラーパラメータのうちの少なくとも一方を決定することを含んでもよい。
【0044】
具体例において、
図12に示されるとおり、異なる段階でQCT分子を使用すると、異なる試料調製手法の比較が可能となり;例えばここでDNA精製前に各血漿試料に200個のQCT1分子(及び/又は任意の好適な数のQCT分子)を加えることによりDNA精製手法を評価してもよく;ここでDNAは血漿から精製方法#1又は精製方法#2によって精製したものであり、得られたDNA試料はPCR増幅し及びシーケンシングした;ここで200個のQCT2分子(及び/又は任意の好適な数のQCT分子)はDNA精製後、PCR増幅前に加えた;ここでQCT2分子に対応する有効なQCTシーケンスリードクラスターの数は2つの試料間で同様であった(約25%以内)ことから、これらの2つの試料について精製後の処理に違いはなかったことが指摘される;及びここで精製方法#1についてのQCT1の有効なQCTシーケンスリードクラスターは約3分の1の少なさであったことから、精製方法#1は(例えば、cfDNAの)大幅な試料損失を生じさせることが指摘される。
【0045】
しかしながら、シーケンシング関連パラメータを決定することS130は、任意の好適な方法で実施することができる。
【0046】
2.3.A コンタミネーションパラメータを決定する。
シーケンシング関連パラメータを決定することS130は、加えて又は代わりに、1つ以上のコンタミネーションパラメータを決定することS132を含んでもよい。コンタミネーションパラメータは、クロスコンタミネーションパラメータ(例えば、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方に関連する試料及び/又は試料コンパートメント間でのクロスコンタミネーション;異なるユーザー間でのクロスコンタミネーションを記述する;等)、キャリーオーバーコンタミネーションパラメータ(例えば、シーケンシングライブラリ調製及びシーケンシングのうちの少なくとも一方の複数の工程間でのキャリーオーバーコンタミネーションを記述する;等)、インデックスホッピングコンタミネーションパラメータ(例えば、インデックスホッピングプライマーに関連するインデックスホッピングコンタミネーションを記述する等)のうちの1つ以上を含んでもよい。コンタミネーションパラメータは、インデックスミスアサインメント(例えば、ハイスループットシーケンシングに関連する等)の程度を記述することができ、例えばここでコンタミネーションパラメータは、クロスコンタミネーション(及び/又は他の好適なコンタミネーション)(例えば、その累積効果)及びインデックスミスアサインメントの両方、及び/又はシーケンシングライブラリ調製及び/又はシーケンシングに関連する任意の他の好適な特性を記述することができる。
【0047】
ある例において、コンタミネーションパラメータを決定することは、特定の試料について混入配列(例えば、特定の試料に関連することが見出される;その試料に対応する試料コンパートメントに見出される;等)のリード深度を足し合わせ、リード総数(又は有効なQCTシーケンスリードクラスターに関連するQCT分子シーケンスリード総数)で除すことに基づき総コンタミネーション割合又は比率を決定することを含んでもよい。具体例において、
図10に示されるとおり、コンタミネーションパラメータが決定されてもよく、ここで試料Aのシーケンシングについて非有効なEMIクラスターの配列が別の試料(試料B)に有効なEMIクラスターとして見られる場合、それは試料A中のこのリードが試料Bからのコンタミネーションに起因することを指示し;ここで、かかる混入配列全てを見つけ出し、そのリード深度を足し合わせ、及びリード総数(又は有効なEMIクラスターにマッピングされるリードの総数)で除すことにより、特定の試料についての総コンタミネーション割合又は比率を決定することができ;及びここで総コンタミネーション割合又は比率は、臨床アッセイが報告し得る分析感度及び特異度の最大レベルの分析に用いることができ、及び/又は偽陽性の代わりに不成功のアッセイ及び/又はノーコール結果を報告するための閾値として用いることができ;例えばここで、特定のアッセイが0.1%アレル比率の検出を必要とする場合、当該試料について0.1%である、それを上回る、又はそれに近い総コンタミネーション率がノーコール結果の同定に用いられてもよく;及びここで、代わりに、混入試料からのアレル比率の知識を用いてこの閾値を採用することができる(即ち、所与の試料中の特定のアレルの測定について、同じアレルについて10%である別の試料からの1%コンタミネーションは、当該アレルが1%である試料からの10%コンタミネーションと同じ効果がある)。
【0048】
具体例において、
図4A~
図4Dに示されるとおり、コンタミネーションは、各試料コンパートメント(例えば、ウェル等)におけるQCT分子シーケンスリード(例えば、EMIシーケンスリード等)の混入源及び混入先を同定することにより測定されてもよい。具体例において、複数の試料コンパートメント(例えば、複数のウェル等)に同じQCT分子シーケンスリード(例えば、同じEMIシーケンスリード)が観察される場合、そのQCT分子シーケンスリードは、複数の試料コンパートメントのうち最高リード深度の試料コンパートメントに由来するものとして特徴付けることができ、複数の試料コンパートメントの他の試料コンパートメント(例えば、他の1つ又は複数のウェル;等)における混入物と見なすことができる。具体例において、コンタミネーションパラメータを決定することは、共有される変動領域配列に対応する第1及び第2のQCTシーケンスリードクラスターを識別することであって、第1及び第2のQCTシーケンスリードクラスターのアサインメントが、試料識別子セットの別個の試料識別子(例えば、別個の試料コンパートメント;別個の試料を識別する;等)へのものであること;第1のQCTシーケンスリードクラスターに関連する第1のリード深度と第2のQCTシーケンスリードクラスターに関連する第2のリード深度との間のリード深度比較を生成すること;及びリード深度比較に基づき、それらの別個の試料識別子のうちのある別個の試料識別子によって識別される試料に関連するコンタミネーションパラメータを決定することを含んでもよい。
【0049】
ある例において、コンタミネーションパラメータを決定することは、QCTシーケンスリードクラスターセットに基づき、シーケンシングライブラリ調製の第1の工程における第1の増幅に関連する第1の分子フィンガープリントを決定すること;追加的なQCTシーケンスリードクラスターセットに基づき、シーケンシングライブラリ調製の第2の工程における第2の増幅に関連する第2の分子フィンガープリントを決定すること;及び第1及び第2の分子フィンガープリント間の比較に基づき、第1の工程から第2の工程へのキャリーオーバーコンタミネーションを記述するキャリーオーバーコンタミネーションパラメータを決定することを含んでもよい。
【0050】
ある変形形態において、コンタミネーションパラメータを決定することは、インデックスホッピングコンタミネーションパラメータを決定することを含んでもよい。具体例において、
図13A~
図13Bに示されるとおり、QCT分子を用いると、コンタミネーション及び/又はインデックスホッピングを生じるプライマーの識別及び除去を促進することができる;ここで、
図13Aに示されるとおり、各試料には対応するD7xxインデックス付加用プライマーによってバーコードを付加し、及びバリデーション実験のため同じシーケンシングフローセルレーン上でランを行った;ここで可能性として、D701及びD707インデックス付加用オリゴが同じオリゴ合成カラムで合成されること、合成エラー、又はインデックスホッピングに起因して、D701及びD707が互いに由来し合う高いコンタミネーション率であることが判明したとともに、ここでこのレベルは5%で有意であり、及び臨床アウトカムに影響を及ぼし得るものであり;及びここで、
図13Bに示されるとおり、臨床試料による後続のランではインデックス付加用プライマーは使用しなかったため、最大コンタミネーションレベルが1%未満にまで低下した。
【0051】
具体例において、
図14に示されるとおり、QCT分子を使用すると、ユニークデュアルインデックスプライマーの使用に関連する真のコンタミネーションレベルの測定を促進することができる;ここで標準的なデュアルインデックス付加用プライマーは、真の試料間コンタミネーション、インデックスホッピング、及び/又はインデックス付加用オリゴコンタミネーションの組み合わせに起因して0.1%のコンタミネーションを生じさせ得る(試料1~9に示されるとおり);ここでユニークデュアルインデックスの付加により、インデックスホッピング及びインデックス付加用オリゴコンタミネーションの効果は0.001×0.001≒1e-6に低下するものと予想される;しかしここで測定値はデュアルユニークインデックスを付加した反応物中で最大0.03%(3e-5)のコンタミネーション率を示し(試料10~29に示されるとおり)、これは予想される1e-6コンタミネーションよりも高く、これは所与のアッセイについての検査室条件下における真のコンタミネーションレベルの検出を示唆し得る。
【0052】
しかしながら、コンタミネーションパラメータを決定することS132は、任意の好適な方法で実施することができる。
【0053】
2.3.B 分子カウント数パラメータを決定する。
シーケンシング関連パラメータを決定することS130は、加えて又は代わりに、1つ以上の分子カウント数パラメータを決定することS134を含んでもよい。分子カウント数パラメータは、標的分子カウント数(例えば、当初の試料中にあるなどの、標的分子の絶対分子カウント数;当初の試料中にあるなどの、内因性標的分子の絶対カウント数;等);リファレンス分子カウント数(例えば、内因性リファレンス分子の絶対カウント数;当初の試料中にあるなどの;等);QCT分子カウント数(例えば、有効なQCTシーケンスリードクラスターの数に対応する;試料の成分に加えられる別個のQCT分子の数に対応する;等);関連する比(例えば、補正係数;分子カウント数と関連するシーケンスリード数との間の比;等);及び/又は分子カウント数に関連する任意の他の好適なパラメータのうちの1つ以上を含んでもよい。
【0054】
分子カウント数パラメータは好ましくは、1つ以上の診断の促進に用いられるが、加えて又は代わりに、方法100の実施形態の任意の好適な一部に(例えば、その入力として)用いることができる。
【0055】
変形形態において、分子カウント数パラメータ(例えば、標的分子カウント数;等)を決定することは、標的分子シーケンスリード数に補正係数比を乗じることによるなど、QCT分子カウント数(例えば、有効なQCTシーケンスリードクラスターの数など、QCTシーケンスリードクラスターの数に対応する;等)及びQCT分子シーケンスリード(例えば、QCTシーケンスリードクラスターに対応するQCT分子シーケンスリードの数;等)に基づき決定される補正係数比に基づいてもよい。具体例において、有効な非混入QCTシーケンスリードクラスターの数(例えば、2リード以下の、及び/又は任意の好適な数以下のリードであるQCTシーケンスリードクラスターを破棄した後の残りのQCTシーケンスリードクラスター;等)は、QCT分子カウント数(例えば、特定の試料コンパートメントについて;特定の試料について;特定の試料識別子についてのQCT分子数;等)を指示し得る。具体例において、QCT分子カウント数を対応するQCT分子から得られたシーケンシングリードで除すことにより補正係数が求められてもよく、例えばここで補正係数にその標的分子(例えば、特定の試料コンパートメント中の;特定の試料からの;特定の試料識別子に関連する;等)に属するシーケンシングリードを乗じれば、標的分子カウント数(例えば、増幅のためアッセイが利用可能であった当初の生物学的標的分子の絶対数;等)が得られることになる。ある例において、内因性標的分子の絶対カウント数及び内因性リファレンス分子の絶対カウント数の決定に用いられる平均QCTシーケンシング深度は、その対応するQCTとは別に決定される。
【0056】
代わりに、実施形態の変形形態において、QCTシーケンスリードクラスターを(例えば、分子カウント数パラメータ及び/又は好適なシーケンシング関連パラメータを決定するため;等)破棄する際のリード深度閾値は、QCT分子シーケンスリード(例えば、EMIシーケンスリード)深度分布の特徴に基づき適応的に決定されてもよい。例えば、閾値は、各インデックス付加した試料について、各試料内での平均EMIリード深度を計算し、この平均リード深度の平方根を計算し、及びリード深度が平均リード深度の平方根未満であるQCTシーケンスリードクラスターを破棄することにより設定されてもよい。加えて又は代わりに、QCTシーケンスリードクラスターを破棄する際のリード深度閾値は、任意の好適な方法で計算することができる。
【0057】
しかしながら、分子カウント数パラメータを決定することS134は、任意の好適な方法で実施することができる。
【0058】
2.4 診断を促進する。
方法100の実施形態は、加えて又は代わりに、診断を促進することS140を含んでもよく、これは1つ以上の病態についての1つ以上の診断を補助し、決定し、提供し、及び/又は他の形で促進する働きをし得る。
【0059】
1つ以上の診断を促進することは、1つ以上の診断を決定すること(例えば、1つ以上のシーケンシング関連パラメータに基づく;等);1つ以上の診断を提供すること(例えば、1人以上のユーザーに;1人以上の医療提供者に、1人以上の医療提供者による患者への医学的診断の提供における使用のためなど;等);1つ以上の診断を補助すること(例えば、診断の決定における使用のため、他のデータと組み合わせるなどして、1人以上の医療提供者及び/又は他の好適な実体に1つ以上のシーケンシング関連パラメータ及び/又は他の好適なパラメータを提供すること;等);及び/又は診断に関連する任意の好適なプロセスのいずれか1つ以上を含んでもよい。例えば、診断を補助することは、無侵襲的出生前遺伝学的検査及びリキッドバイオプシーのうちの少なくとも一方に関連するアッセイについての診断アウトカムの決定における使用に適合されたコンタミネーションパラメータを(例えば、ユーザーに;医療提供者に;等)提供することを含んでもよい。ある例において、標的分子カウント数(及び/又は好適なシーケンシング関連パラメータ等)を決定することは、無侵襲的出生前遺伝学的検査及びリキッドバイオプシーのうちの少なくとも一方に関連する診断を促進するため標的分子カウント数(及び/又は好適なシーケンシング関連パラメータ等)を決定することを含んでもよい。
【0060】
変形形態において、診断を促進することは、出生前診断(例えば、無侵襲的出生前遺伝学的検査に関連する;関連する遺伝的障害及び/又は好適な病態についての;等)を促進することを含んでもよい。ある例において、診断を促進することは、標的分子カウント数パラメータ及びリファレンス分子カウント数パラメータに基づき(例えば、内因性標的配列の絶対カウント数と内因性リファレンス配列の絶対カウント数との間の比較に基づき;等)1つ以上の遺伝的障害(例えば、単一遺伝子病、染色体異常等)の出生前診断を促進することを含んでもよい。
【0061】
変形形態において、診断を促進することは、1つ以上の単一遺伝子病(及び/又は好適な遺伝的障害)の診断を促進することを含んでもよい。例えば、内因性標的分子の絶対カウント数を決定することは、単一遺伝子病に関連する突然変異を含む内因性標的分子の絶対カウント数を(例えば、QCT分子シーケンスリード数をユニークなQCT分子数で除すことにより導き出されるなどの平均QCTシーケンシング深度で内因性標的分子についての総リードカウント数を除すことに基づき;等)決定することを含んでもよく、ここで内因性リファレンス分子の絶対カウント数を決定することは、突然変異を含まない内因性リファレンス分子の絶対カウント数を(例えば、内因性リファレンス分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づき等)決定すること;及び内因性標的配列の絶対カウント数及び内因性リファレンス配列の絶対カウント数(例えば、その間の比較等)に基づき単一遺伝子病の遺伝的障害の出生前診断を促進することを含んでもよい。具体例において、
図15A~
図15Dに示されるとおり、試料中の疾患及び非疾患アレルの数を測定し、比較することにより、母体血から発育中の胎児の遺伝子型を決定することができる;ここで
図15Aは、鎌状赤血球形質(SCT)試料でQCT分子によって測定したときのHbS(突然変異型ヘモグロビン)及びHbA(正常ヘモグロビン)分子数を含み、ここでHbS及びHbAアレルは同じ頻度であると予想され、これは妊娠中の母親及び発育中の胎児の両方がこの障害に関してヘテロ接合である場合に相当する;ここで
図15Bは、SCT+10%鎌状赤血球症(SCD)試料でQCTによって測定したときのHbS及びHbA分子数を含み、これは妊娠中の母親がこの障害の保因者であり、発育中の胎児が両方の親から疾患アレルを遺伝的に受け継いでいるため、ひいては疾患を有する場合に相当する;ここで
図15Cは、胎児が障害を遺伝的に受け継いでいる事後確率の相対突然変異量(relative mutation dosage:RMD)分析による計算に使用するための、分子数及び胎児画分測定(例えば、母親と胎児とで遺伝子型が異なる最大9遺伝子座における測定)を含む;及びここで
図15Dは、0%対10%SCDをSCTに加えた試料(例えば、この障害に関して保因者である妊娠中の母親からの保因者対疾患胎児に相当する)についての平均値及び95%信頼区間を含む。しかしながら、単一遺伝子病の診断を促進することは、任意の好適な方法で実施することができる。
【0062】
変形形態において、診断を促進することは、1つ以上の染色体異常(及び/又は好適な遺伝的障害)の診断を促進することを含んでもよい。例えば、内因性標的分子の絶対カウント数を決定することは、第1の染色体に関連する内因性標的分子の絶対カウント数を(例えば、内因性標的分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づき;等)決定することを含んでもよく、ここで内因性リファレンス分子の絶対カウント数を決定することは、第2の染色体に関連する内因性リファレンス分子の絶対カウント数を(例えば、内因性リファレンス分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づき等)決定すること;及び内因性標的配列の絶対カウント数及び内因性リファレンス配列の絶対カウント数(例えば、その間の比較等)に基づき染色体異常の出生前診断を促進することを含んでもよい。具体例において、
図16A~
図16Bに示されるとおり、同様にQCT分子を使用して21番染色体及び別の染色体の数をカウントすることにより、胎児がダウン症候群を有することを示す21番染色体数の(例えば、別の染色体と比較した)過剰があるかどうかを決定することができる;ここで3本と2本の染色体のカウントされる差について、シグナルは遺伝性劣性疾患の半分であってもよく(例えば、HbSS対HbASは2対1のシグナルであり;100%増加対50%増加)、これは、母体血中の循環DNAから発育中の胎児のダウン症候群を測定するにおいて、正確度の向上のため、各染色体上で2つ以上の遺伝子座をカウントする必要があることを示すものであり得る;及びここで方法100の実施形態の一部は、加えて又は代わりに、18トリソミー及び/又はディジョージ症候群などの他のデノボ突然変異及び/又は染色体異常についての診断の促進に用いることができる。
【0063】
変形形態において、診断を促進することは、1つ以上の染色体微小欠失の診断を促進することを含んでもよい。例えば、内因性標的分子の絶対カウント数を決定することは、内因性標的分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づいて、微小欠失領域に関連する内因性標的分子の絶対カウント数を決定することを含んでもよく、ここで内因性リファレンス分子の絶対カウント数を決定することは、内因性リファレンス分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づいて、微小欠失を有しないものと予想される第2の染色体領域に関連する内因性リファレンス分子の絶対カウント数を決定することを含んでもよく、及びここで遺伝的障害の診断(例えば、出生前診断等)を促進することは、比較に基づき染色体微小欠失の診断(例えば、出生前診断;等)を促進することを含んでもよい。
【0064】
変形形態において、診断を促進することは、1つ以上のコピー数変異の診断を促進することを含んでもよい。例えば、内因性標的分子の絶対カウント数を決定することは、内因性標的分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づいて、コピー数変異を有し得る領域に関連する内因性標的分子の絶対カウント数を決定することを含んでもよく、ここで内因性リファレンス分子の絶対カウント数を決定することは、内因性リファレンス分子についての総リードカウント数を平均QCTシーケンシング深度で除すことに基づいて、コピー数変異を有しないものと予想される領域に関連する内因性リファレンス分子の絶対カウント数を決定することを含んでもよく、及びここで遺伝的障害の診断(例えば、出生前診断)を促進することは、比較に基づきコピー数変異の診断(例えば、出生前診断)を促進することを含んでもよい。
【0065】
加えて又は代わりに、診断を促進することは、任意の好適な病態に関するものであってよい。
【0066】
図15C及び
図16Bに示されるとおり、診断を促進することは、1つ以上の胎児画分測定値に基づいてもよい。例えば出生前診断を促進することは、胎児画分測定値、内因性標的配列の絶対カウント数、及び内因性リファレンス配列の絶対カウント数に基づき遺伝的障害の出生前診断を促進することを含んでもよい。しかしながら、胎児画分測定値の使用は、方法100の実施形態の任意の好適なプロセスに対して任意の好適な方法で実施することができ、及び診断を促進することS140は、任意の好適な方法で実施することができる。
【0067】
しかしながら、方法100の実施形態は、任意の好適な方法で実施することができる。
【0068】
方法100及び/又はシステム200の実施形態は、任意の変形例(例えば、実施形態、変形形態、実施例、具体例、図等)を含め、様々なシステム構成要素及び様々な方法プロセスのあらゆる組み合わせ及び並べ替えを含んでもよく、ここで方法100及び/又は本明細書に記載されるプロセスの実施形態の一部は、非同期的に(例えば、逐次的に)、同時に(例えば、並行して)、又は任意の他の好適な順序で、システム200及び/又は本明細書に記載される他の実体の1つ以上の工程、要素、構成要素、及び/又はその他の態様により、及び/又はそれを用いて実施されてもよい。
【0069】
本明細書に記載される変形例(例えば、実施形態、変形形態、実施例、具体例、図等)及び/又は本明細書に記載される変形例の任意の一部はいずれも、加えて又は代わりに、組み合わせ、集約し、除外し、使用し、連続的に実施し、並行して実施し、及び/又は他の形で適用することができる。
【0070】
方法100及び/又はシステム200の実施形態の一部は、少なくとも一部には、コンピュータ可読命令を記憶するコンピュータ可読媒体を受け入れるように構成された機械として具現化及び/又は実装されてもよい。命令は、システムと統合されてもよいコンピュータ実行可能な構成要素によって実行されてもよい。コンピュータ可読媒体は、RAM、ROM、フラッシュメモリ、EEPROM、光デバイス(CD又はDVD)、ハードドライブ、フロッピードライブ、又は任意の好適なデバイスなど、任意の好適なコンピュータ可読媒体上に記憶されることができる。コンピュータ実行可能な構成要素は汎用又は特定用途向けプロセッサであってもよいが、代わりに又は加えて、任意の好適な専用ハードウェア又はハードウェア/ファームウェアの組み合わせデバイスが命令を実行してもよい。
【0071】
当業者は前述の詳細な説明から、並びに図及び特許請求の範囲から認識するであろうとおり、特許請求の範囲に定義される範囲から逸脱することなく方法100、システム200の実施形態、及び/又は変形例に修正及び変更を加えることができる。