(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023155473
(43)【公開日】2023-10-20
(54)【発明の名称】複数種の核酸試料を処理または分析するための組成物、方法およびシステム
(51)【国際特許分類】
C12N 15/10 20060101AFI20231013BHJP
C12Q 1/6813 20180101ALI20231013BHJP
C12Q 1/6869 20180101ALI20231013BHJP
C12N 15/11 20060101ALI20231013BHJP
C12M 1/00 20060101ALI20231013BHJP
C12M 1/34 20060101ALI20231013BHJP
【FI】
C12N15/10 110Z
C12Q1/6813 Z
C12Q1/6869 Z
C12N15/11 Z
C12M1/00 A
C12M1/34
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023142153
(22)【出願日】2023-09-01
(62)【分割の表示】P 2020566295の分割
【原出願日】2019-05-24
(31)【優先権主張番号】62/678,475
(32)【優先日】2018-05-31
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/056,982
(32)【優先日】2018-08-07
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】517151257
【氏名又は名称】パーソナリス・インコーポレイテッド
【氏名又は名称原語表記】PERSONALIS, INC
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ジョン ウェスト
(72)【発明者】
【氏名】リチャード チェン
(72)【発明者】
【氏名】クリスチャン ハウデンシルド
(72)【発明者】
【氏名】ガボール バーサ
(72)【発明者】
【氏名】シュジュン ルオ
(57)【要約】
【課題】試料の処理および/またはデータ分析のための、組成物、方法、およびシステムを提供すること。
【解決手段】試料の処理は、核酸試料の処理、およびその後の配列決定を含み得る。本開示の方法およびシステムは、例えば、ヒト、非ヒト、およびその組合せ由来の核酸試料の分析のために使用することができる。本明細書に開示される方法は、これらの課題に対処し、単一試料中のヒトおよび非ヒトゲノムに分析を拡大する、特定の配列決定プロトコールまたは技術を提供する。
【選択図】なし
【特許請求の範囲】
【請求項1】
明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2018年8月7日に出願された米国特許出願第16/056,982号、および2018年5月31日に出願された米国仮特許出願第62/678,475号に対する優先権を主張し、これらは、全体が参照によって本明細書に組み込まれる。
【背景技術】
【0002】
全ゲノムおよび/またはエクソームの配列決定の現在の方法は、費用がかかり、多くの生物医学的に重要な変異体を捕捉することができない場合がある。例えば、市販のエクソーム濃縮キット(例えば、IlluminaのTruSeqエクソーム濃縮、およびAgilentのSureSelectエクソーム濃縮)は、生物医学的に興味深い非エクソーム領域およびエクソーム領域を標的にすることができない場合がある。多くの場合、標準的な配列決定法を使用する全ゲノムおよび/またはエクソームの配列決定は、非常に高いCG含量(>70%)を有する含量範囲において、成績が悪い。さらにまた、全ゲノムおよび/またはエクソームの配列決定は、ゲノム中の反復エレメントの適切なおよび/または費用効率がよい配列決定を提供することもできない。
【発明の概要】
【課題を解決するための手段】
【0003】
本明細書に開示される方法は、これらの課題に対処し、単一試料中のヒトおよび非ヒトゲノムに分析を拡大する、特定の配列決定プロトコールまたは技術を提供する。
【0004】
本明細書において、対象から得られた生体試料を処理するための方法であって、(a)核酸プローブのプールを使用して、生体試料から核酸分子のサブセットを生成することであって、プローブが、(i)ヒトゲノムのエレメントを標的にするように構成された第1の複数の核酸プローブ、および(ii)1つまたは複数の非ヒトゲノムのエレメントを標的にするように構成された第2の複数の核酸プローブを含むこと;ならびに(b)核酸分子のサブセットをアッセイに付して、(i)対象からの生体試料由来のヒト核酸、および(ii)対象の生体試料由来の非ヒト核酸の配列を含む配列情報を得ることを含む、方法を開示する。一部の場合では、(i)の第1の複数の核酸プローブは、ヒトゲノムに由来するエレメントを標的にするように構成される。一部の場合では、対象はヒトであり得る。一部の場合では、第2の複数の核酸プローブは、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、遺伝子改変細胞、および遺伝子改変ベクターからなる群より選択される1つまたは複数の種の非ヒトゲノム配列由来のエレメントを標的にするように構成される。態様では、生体試料から核酸分子のサブセットを生成することは、1つまたは複数のハイブリダイゼーション反応を実施することを含む。一部の場合では、方法は、対象から生体試料を得ることをさらに含む。一部の場合では、対象の生体試料は、腫瘍生検材料、全血、または血漿に由来し得る。一部の態様では、方法は、核酸分子のサブセットの配列を1つまたは複数の参照配列と整列させることをさらに含む。一部の場合では、1つまたは複数の参照配列は、複数の参照配列を含む。一部の場合では、複数の参照配列は、2つまたはそれよりも多くの異なる種に対応する。方法は、整列に基づいて、サブセット中の核酸分子の起源を特定することをさらに含むことができる。一部の場合では、方法は、生体試料中の核酸分子の特定された起源を含む出力を生成することをさらに含むことができる。一部の場合では、第2の複数の核酸プローブの濃度は、核酸プローブのプール中の第1の複数の核酸プローブの濃度よりも高い。態様では、プローブのプール中の第2の複数の核酸プローブの相対濃度は、核酸プローブのプール中の第1の複数の核酸プローブの相対濃度よりも高い。態様では、第1の複数の核酸プローブは、ヒトエクソーム捕捉用プローブセットを含む。一部の場合では、第1の複数の核酸プローブは、ヒトV(D)Jの再編成または組換えによって作出されるジャンクション配列を標的にするように構成されたプローブを含む。一部の場合では、第2の複数の核酸プローブは、ヒトパピローマウイルスのE6遺伝子および/またはE7遺伝子を標的にするように構成された1つまたは複数のプローブを含む。一部の場合では、第2の複数の核酸プローブは、細菌の16SリボソームRNA遺伝子の1つまたは複数のエレメントを標的にするように構成されたプローブを含む。態様では、(b)のアッセイは、配列決定を行って、130塩基~280塩基の長さのペアエンドリード配列を生成することを含む。態様では、方法は、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出されるCDR3配列、およびそれらの任意の組合せからなる群より選択されるデータの1つまたは複数のセットを含む1つまたは複数の生物医学レポートを生成することをさらに含むことができる。態様では、検出される非ヒト種は抗原である。一部の場合では、CDR3配列は、V(D)Jの再編成または組換えによって生成される。一部の場合では、CDR3配列は、抗原に対する免疫応答に対応する。一部の場合では、1つまたは複数の生物医学レポートは、(i)~(iii)を含む。
【0005】
本明細書において、対象から得られた生体試料を処理するための方法であって、(a)生体試料から核酸分子のサブセットを生成することであって、核酸分子のサブセットが、(i)対象由来の第1の複数の核酸分子、および(ii)対象由来ではない第2の複数の核酸分子を含み、第1の複数の核酸分子の存在量が、生体試料中の第2の複数の核酸分子の存在量よりも多いこと;ならびに(b)核酸分子のサブセットをアッセイに付して、(i)第1の複数の核酸分子、および(ii)第2の複数の核酸分子の配列を含む配列情報を得ることを含む、方法を開示する。一部の場合では、(i)の核酸分子は、対象のゲノムに由来する。一部の場合では、対象はヒトである。一部の場合では、対象由来ではない第2の複数の核酸分子は、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、遺伝子改変細胞、および遺伝子改変ベクターからなる群より選択される1つまたは複数のメンバーを含む。態様では、生体試料から核酸分子のサブセットを生成することは、1つまたは複数のハイブリダイゼーション反応を実施することを含む。態様では、方法は、対象から生体試料を得ることをさらに含む。一部の場合では、対象の生体試料は、腫瘍生検材料、全血、または血漿に由来する。態様では、方法は、核酸分子のサブセットの配列を1つまたは複数の参照配列と整列させることをさらに含む。態様では、1つまたは複数の参照配列は、複数の参照配列を含む。態様では、複数の参照配列は、2つまたはそれよりも多くの異なる種に対応する。方法は、整列に基づいて、サブセット中の核酸分子の起源を特定することをさらに含むことができる。態様では、方法は、生体試料中の核酸分子の特定された起源を含む出力を生成することをさらに含む。一部の場合では、第1の複数の核酸分子の存在量は、生体試料中の第1の複数の核酸分子の存在量よりも多い。一部の場合では、サブセット中の第2の複数の核酸分子の相対存在量は、サブセット中の第1の複数の核酸分子の相対存在量よりも多い。
【0006】
本明細書において、(i)対象由来の1つまたは複数のヒト配列、および(ii)対象由来の1つまたは複数の非ヒト配列とハイブリダイズするように構成されたプローブのプールを含む組成物を開示する。態様では、プローブのプールは、複数の捕捉用プローブである。態様では、プローブのプールは、複数の増幅用プローブである。
【0007】
本明細書において、対象の生体試料を処理するためのシステムであって、核酸分子のサブセットをアッセイに付して、(i)対象からの生体試料由来のヒト核酸、および(ii)対象の生体試料由来の非ヒト核酸の配列を含む配列情報を得るように、個々にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサーを含むプロセシングユニットであって、核酸分子のサブセットが、核酸プローブのプールを使用して、生体試料から生成され、プローブが、(i)ヒトゲノムのエレメントを標的にするように構成された第1の複数の核酸プローブ、および(ii)1つまたは複数の非ヒトゲノムのエレメントを標的にするように構成された第2の複数の核酸プローブを含む、プロセシングユニット;ならびに配列情報を保存するように構成されたコンピュータメモリを含む、システムを開示する。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、配列と1つまたは複数の参照配列との整列を生成するようにプログラムされる。一部の実施形態では、1つまたは複数の参照配列は、複数の参照配列を含み、複数の参照配列は、2つまたはそれよりも多くの異なる種に対応する。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、整列に基づいて、サブセット中の核酸分子の起源を特定するようにプログラムされる。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出される相補性決定領域3(CDR3)配列、およびそれらの任意の組合せからなる群より選択される情報を含む1つまたは複数の生物医学レポートを生成するようにプログラムされる。
【0008】
本明細書において、対象の生体試料を処理するためのシステムであって、核酸分子のサブセットをアッセイに付して、(i)第1の複数の核酸分子、および(ii)第2の複数の核酸分子の配列を含む配列情報を得るように、個々にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサーを含むプロセシングユニットであって、核酸分子のサブセットが、生体試料から生成され、核酸分子のサブセットが、(i)対象由来の第1の複数の核酸分子、および(ii)対象由来ではない第2の複数の核酸分子を含み、第1の複数の核酸分子の存在量が、生体試料中の第2の複数の核酸分子の存在量よりも多い、プロセシングユニット;ならびに配列情報を保存するように構成されたコンピュータメモリを含む、システムを開示する。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、配列と1つまたは複数の参照配列との整列を生成するようにプログラムされる。一部の実施形態では、1つまたは複数の参照配列は、複数の参照配列を含み、複数の参照配列は、2つまたはそれよりも多くの異なる種に対応する。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、整列に基づいて、サブセット中の核酸分子の起源を特定するようにプログラムされる。一部の実施形態では、1つまたは複数のコンピュータプロセッサーは、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出される相補性決定領域3(CDR3)配列、およびそれらの任意の組合せからなる群より選択される情報を含む1つまたは複数の生物医学レポートを生成するようにプログラムされる。
【0009】
本開示の別の態様は、1つまたは複数のコンピュータプロセッサーによる実行の際に、上記または本明細書の他の場所の方法のいずれかを実行する、機械実行可能コードを含む非一時的コンピュータ可読媒体を提供する。
【0010】
本開示の別の態様は、1つまたは複数のコンピュータプロセッサー、およびそれらに連結されたコンピュータメモリを含むシステムを提供する。コンピュータメモリは、1つまたは複数のコンピュータプロセッサーによる実行の際に、上記または本明細書の他の場所の方法のいずれかを実行する、機械実行可能コードを含む。
【0011】
本開示の追加の態様および利点は、本開示の例示的な実施形態のみを示し、説明する、以下の詳細な説明から当業者には容易に明らかになるだろう。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、すべて開示から逸脱することなく、さまざまな自明な点において改変することが可能である。したがって、図面および説明は、実質的に例示的なものと見なされるべきであり、限定的なものと見なされるべきではない。
参照による組込み
【0012】
本明細書において言及されるすべての刊行物、特許および特許出願は、それぞれの個々の刊行物、特許または特許出願が、参照によって組み込まれることが具体的かつ個々に示されているのと同程度に、参照により本明細書に組み込まれる。
【0013】
本発明の新規な特徴を、添付の特許請求の範囲において詳細に説明する。本発明の特徴および利点のより良好な理解は、本発明の原理が利用される例示的な実施形態、および添付の図面(drawing)(本明細書において「図面(Figure)」および「図(FIG.)」とも
)を説明する以下の詳細な説明を参照することによって得られるだろう。
【図面の簡単な説明】
【0014】
【
図1】
図1は、第1の複数の核酸プローブおよび第2の複数の核酸プローブを使用する、核酸分子のサブセットを生成するための方法を模式的に図示する。
【0015】
【
図2】
図2は、第1の複数の核酸プローブおよび第2の複数の核酸プローブを使用する、核酸分子のサブセットを生成するための方法を模式的に図示する。第1の複数の核酸プローブは、非ヒトゲノムに結合し得る。
【0016】
【
図3】
図3は、第1の複数の核酸プローブおよび第2の複数の核酸プローブを使用する、核酸分子のサブセットを生成するための方法を模式的に図示する。第1の複数の核酸プローブは、セグメント化トランスクリプトームに結合し得る。
【0017】
【
図4】
図4は、複数の核酸プローブを使用する、核酸分子のサブセットを生成するための方法を模式的に図示する。複数の核酸プローブは、対象のエクソームを標的にするプローブセット、および非対象核酸配列を標的にするプローブセットを含み得る。
【0018】
【
図5】
図5は、本開示の方法を実行するようにプログラムされたか、またはそうでなければ構成された、コンピュータシステムを示す。
【0019】
【
図6】
図6Aは、ワークフローの概略図を示す。調製1および調製2は、核酸のサブセットを指す。アッセイ1、分析1および出力は、本明細書に記載の任意のアッセイ、分析および出力を指す。
図6Bは、ワークフローの概略図を示す。調製1および調製2は、核酸のサブセットを指す。アッセイ1、アッセイ2、分析1および出力は、本明細書に記載の任意のアッセイ、分析および出力を指す。
図6Cは、ワークフローの概略図を示す。調製1および調製2は、核酸のサブセットを指す。アッセイ1、アッセイ2、分析1、分析2および出力は、本明細書に記載の任意のアッセイ、分析および出力を指す。
図6Dは、(1)いくつかのプロトコールにより処理されたいくつかのサブセットへの核酸試料の分離を含むワークフローの概略図を示す。これらのプロトコールは、異なるゲノム領域または非ゲノム領域についての濃縮を含んでいてもよく、アッセイのための核酸分子のライブラリーを調製するための1つまたは複数の異なる増幅操作を含んでいてもよい。これらのライブラリーの一部は、アッセイのために(2)と組み合わせてもよい。一部のアッセイの結果は、その後の分析のために(3)と組み合わせてもよい。変異体コール、または配列もしくは遺伝的状態の他の評価は、(4)とさらに組み合わせて、アッセイによって対処された東の遺伝子座での複合評価を生成してもよい。プロトコール1~4は、本明細書に記載の任意の方法を指す。アッセイ1、アッセイ2、アッセイ3、分析1、分析2および出力は、本明細書に記載の任意のアッセイ、分析および出力を指す。
【0020】
【
図7】
図7は、本明細書に記載のアッセイのワークフローの例を表す。
【0021】
【
図8】
図8は、本開示のワークフローの概略図を示す。
【0022】
【
図9】
図9は、本開示のワークフローの概略図を示す。
【0023】
【
図10】
図10は、断片サイズに対する剪断時間の効果を示す。
【0024】
【
図11】
図11は、断片サイズに対するビーズ比の効果を示す。
【0025】
【
図12】
図12は、断片サイズに対する剪断時間の効果を示す。
【0026】
【
図13】
図13は、核酸ライブラリー構築のワークフローの概略図を表す。
【0027】
【
図14】
図14は、複数の生物医学的適用に対処するマルチスレッド化アッセイを開発するための方法を示す。
【0028】
【
図15】
図15は、異なるゲノム領域について濃縮されたDNAの複数のサブセットを含み、配列決定アッセイのために組み合わされる前に、一部の独立した処理操作を受ける、アッセイのワークフローの例を表す。2つまたはそれよりも多くのサブセットからの読み取りデータは、a)配列決定デバイスにおいて、b)その後のin silico(例えば、1つまたは複数のアルゴリズムを使用する)のいずれかで組み合わせて、2つまたはそれよりも多くのサブセットの連合によって対処される領域についての単一の試験結果を生成し、1つまたは複数の生物医学レポートのために使用され得るデータプールをもたらす。補充引き抜きは、ヒト標的配列および非ヒト標的配列を含んでいてもよい。
【0029】
【
図16】
図16は、異なるゲノム領域について濃縮されたDNAの複数のサブセットを含み、独立して配列決定され、変異体について分析される前に、一部の独立した処理操作を受ける、アッセイのワークフローの例を表す。2つのサブセットからの変異体は、マージされて、2つまたはそれよりも多くのサブセットの連合によって対処される領域についての結果を生成し得、1つまたは複数の生物医学レポートのために使用され得るデータプールをもたらす。補充引き抜きは、ヒト標的配列および非ヒト標的配列を含んでいてもよい。
【0030】
【
図17】
図17は、異なるゲノム領域について濃縮されたDNAの複数のサブセットを含み、独立して配列決定され、配列読み取りデータを含み得る一次データを生成する前に、一部の独立した処理操作を受ける、アッセイのワークフローの例を表す。2つまたはそれよりも多くのアッセイからの一次データは、組み合わされ、分析されて(例えば、1つまたは複数のソフトウェアプログラムまたはアルゴリズムによる)、2つまたはそれよりも多くのサブセットの連合によって対処されるすべての領域についての結果を生成し、1つまたは複数の生物医学レポートのために使用され得るデータプールをもたらす。補充引き抜きは、ヒト標的配列および非ヒト標的配列を含んでいてもよい。
【0031】
【
図18】
図18は、サイズ選択によって生成され、GC含量に基づいて異なるゲノム領域について濃縮されたDNAの2つのサブセットにさらに分割された、DNAの2つのサブセットを含むマルチスレッド化アッセイを表す。より長い分子は、より長い分子に適した技術を使用する配列決定を受け得る。2つのより短い分子のサブセットは、さらに調製され、サブセットのT
mに適したプロトコールに基づいて増幅され、次いで、ハイスループットの短いリードシーケンサーのHiSeqにおける配列決定のためにプールされ得る。配列決定からの一次データは、マージされ、分析されて(例えば、1つまたは複数のソフトウェアプログラムまたはアルゴリズムによる)、サブセットによって対処されるすべての領域についての単一の最良の結果を生成し得、1つまたは複数の生物医学レポートのために使用され得るデータプールをもたらす。補充引き抜きは、ヒト標的配列および非ヒト標的配列を含んでいてもよい。
【発明を実施するための形態】
【0032】
本発明のさまざまな実施形態を本明細書に示し、説明するが、そのような実施形態が例としてのみ提供されることは、当業者には自明であろう。多数の変形、変化および置換は、本発明から逸脱することなく、当業者に起こり得る。本明細書に記載される本発明の実施形態に対するさまざまな代替物を用いてもよいことが理解されるべきである。
【0033】
ヒト身体は、高い頻度で、多数の微生物種、一部の場合では、1,000を超える微生物種を内部に持つ。これらは、ヒトマイクロバイオームプロジェクトおよび他の研究によって立証されており、多数のウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、および一部のアメーバ、蠕虫、および藻類を含むことができる。これらの非ヒト種は、有益であり得るが、これらはまた、がんを含む疾患を引き起こすことができ、またはモジュレートすることができる。これらの効果は、直接的(例えば、ヒト細胞における突然変異を引き起こし、このようにしてがんをもたらす)、または間接的(例えば、疾患と戦うためのその能力に影響を及ぼす免疫系を刺激する)であり得る。個体中の微生物種は、人々の試料から抽出された核酸を配列決定することによって、特定および特徴付けることができる。これらの微生物の多くは、身体とその周囲環境との境界面(例えば、皮膚、唾液、鼻孔、消化管、腸、生殖器)で生きている。これらは、拭き取り、生検、糞便もしくは尿、唾液または類似の方法のいずれかによって、それらの境界面から試料採取することができる。複数の方法が、これらの試料由来の微生物の核酸の配列分析のために開発されている。これらとしては、標的PCR増幅(例えば、16SリボソームRNA遺伝子のサブセクションの)、およびディープシークエンシングを使用する非標的(メタゲノミクス)法の両方が挙げられる。これらの方法の多くは、意図する微生物標的に対する感受性を最適化するために、ヒトDNAの量を最小化しようとする、試料の種類および/または濃縮方法を含む。ヒトゲノム(約30億塩基)は、典型的な細菌のゲノム(100万未満の塩基から最大で数100万)よりも約1,000倍大きく、大部分のウイルスゲノムのサイズ(典型的には、数千から最大で数万の塩基)よりも数千倍大きい。したがって、これを回避または低減する試料採取法またはアッセイ技術なしでは、ヒトDNA含量は、アッセイの能力の大部分を占め得る。
【0034】
多くの疾患の進行は、ヒト細胞のジェネティクスによっても影響される。これは、遺伝する遺伝的変異体、がんにおける体細胞変異体、免疫細胞におけるVDJ組換え、異なる細胞型における差次的遺伝子発現、および他の性質を含むことができる。これらは、典型的には、血液(最も一般的には、PBMCまたは無細胞DNA)由来、または罹患組織(例えば、腫瘍生検材料)由来のいずれかの核酸の配列決定によってアッセイすることもできる。複数の方法は、アンプリコンパネル(典型的には、最大で、数百遺伝子のため)、ハイブリッド捕捉(典型的には、エクソームを含む、多くの数の遺伝子のため)、および非標的法(全ゲノム配列決定)を含む、これらの試料由来の核酸の配列分析のために開発されている。これらの方法の多くは、それらの意図するヒト核酸標的について最適化された試料の種類および/または濃縮方法を含む。
【0035】
微生物分析のための試料の種類は、ヒト遺伝分析のために使用されるものと異なっていてもよい。糞便試料は、消化管のマイクロバイオームの分析のために使用されてもよいが、例えば、これは、嚢胞性線維症などの遺伝するヒト遺伝性疾患についての試験において、不十分な試料であり得る。血液(PBMC)由来の白血球は、遺伝する遺伝性疾患の原因を探すために配列決定され得るが、免疫系が血液から細菌をほとんど除去するので、通常、細菌分析のための不十分な選択であり得る。ヒトおよび微生物分析のためのアッセイ方法も異なる。例えば、いずれもPCRを使用し得るが、PCRは、非常に狭く焦点が絞られた結果が得られるので(すなわち、アンプリコンは、それぞれ、一般に、標的種のゲノムのごく一部を表す)、ヒトおよび微生物の標的は、一般に、単一のPCR系アッセイに組み込まれない。非標的アッセイは、ヒトジェネティクス(すなわち、全ヒトゲノム配列決定)および微生物のメタゲノミクスの両方のために使用することができるが、上記で言及したゲノムサイズにおける非常に大きな相違のために、一般に、それぞれについて最適化された起源の材料およびアッセイを用いて、それぞれを別々にアッセイすることが最適である。同じ理由のために、ハイブリッド捕捉アッセイ技術(例えば、エクソーム)は、特定の(一般に、哺乳動物)種(例えば、ヒトエクソーム、またはウシエクソーム)のために開発されている。
【0036】
がんは、特殊な場合であり得る。多くの腫瘍は、免疫系を部分的または完全に排除する、チェックポイント遺伝子および他の方法を使用する。そのため、腫瘍に首尾よく浸潤することができた微生物は、生存し、さらにそこで力強く成長することが可能であり得る。完全な生きた細菌(例えば、Fusobacterium)が、多くのがん細胞で見つかっており、細胞分裂のサイクルおよび転移を含んで、完全にその中で生きている。細菌は、がんを引き起こす場合があり(例えば、Helicobacter pyloriは胃がんの原因である)、それらは、がんの進行、およびがん治療薬(例えば、免疫チェックポイント阻害剤)に対する応答に影響を及ぼし得る。ウイルスも、細胞に進入する場合があり、一部の場合では、がんの原因であり、および/またはヒト染色体にそれらのゲノムを組み込み得る。このため、腫瘍生検材料は、ヒトおよびマイクロバイオーム種の両方、ならびにそれらの核酸を含有し得る。これらの細胞が死ぬと、それらの複数種の核酸が、それらの周囲に排出され得、最終的に、血漿中の無細胞核酸として検出可能であり得る。
【0037】
腫瘍生検からの試料の量は、多くの場合、非常に限定されており、同じ試料から、ヒトに対する微生物の遺伝的標的についての複数の異なるアッセイを実施することをより困難にする。ヒトおよびマイクロバイオーム種の両方からの配列データを同時に提供することができる統合アッセイは、試料の量が限定されている場合に有利であり得る。血漿からの無細胞DNAおよびRNAも、多くの場合、量が非常に限定される。単一の少量の血漿試料由来のヒトおよびマイクロバイオーム種の両方から配列データを同時に提供することができる統合アッセイも有利であり得る。
【0038】
本明細書において、同時に同じ試料からのマイクロバイオームのデータを用いて、幅広いヒト遺伝的データの同時検出を裏付けるアッセイを開示する。同等のヒトのみのアッセイのために必要とし得るよりもより多くの試料を必要としない単一アッセイを行うことができる。このアッセイは、ヒトエクソーム捕捉キット(例えば、Agilent Clinical Research Exome v2)を使用することができる。プローブのプールのキットまたは組成物は、それが標的にするヒト配列に対して相補的であるハイブリダイゼーションプローブを用いることができる。50,000を超える捕捉用プローブを使用することにより、方法、キットまたは組成物は、所定のヒト遺伝子の大部分のエクソンを標的にすることができる。例えば、がん試料由来の核酸とこのキットのプローブとのハイブリダイゼーション反応を実施する前に、我々は、我々が非ヒト配列を標的にするように設計した捕捉用プローブの追加のセットを添加する。非ヒト配列は、ウイルス、細菌、真菌または古細菌のゲノム由来、すなわち、ヒトマイクロバイオーム由来であり得る。ヒトエクソームプローブを非ヒトマイクロバイオームプローブと組み合わせると、プローブ混合物を、患者試料から抽出された核酸との単一のハイブリダイゼーションに基づく捕捉反応のために使用することができる(
図2)。その後、捕捉された核酸を配列決定することができる。我々の研究室では、この配列決定は、Illumina NovaSeq-6000 DNA配列決定装置を使用して行われる。
【0039】
このようなプロセスから得られる混合(ヒトおよび非ヒト)DNA配列は、ヒトおよびマイクロバイオーム-種参照配列との整列によって分離することができる。ヒトゲノムが進化の過程で微生物ゲノムから非常に大幅に分岐しているので、整列による配列の分離が可能である。
【0040】
捕捉用プローブを使用することは、複数の遺伝子を同時に標的にするPCRの困難さに起因して、目的の配列を濃縮し、標的にするポリメラーゼ連鎖反応(PCR)に基づくアッセイに対して有利であり得る。複数の遺伝子を標的にするために、PCRは、50,000配列を増幅および標的にするために、多数のプライマー、例えば、最大で潜在的に100,000のプライマーが必要であり得、特定のための核酸分子を生成するために、酵素操作が必要であり得る。複数の遺伝子のPCRプライマーの比を最適化することはまた、困難であり得、偏りのある増幅をもたらす場合があり、核酸試料中の標的核酸の相対量を表さない場合がある。
【0041】
本明細書および特許請求の範囲において使用される場合、単数形の「a」、「an」および「the」は、文脈が明確に他のことを指示しない限り、複数形の参照を含む。例えば、「キメラ膜貫通受容体ポリペプチド」という用語は、複数のキメラ膜貫通受容体ポリペプチドを含む。
【0042】
「約」または「およそ」という用語は、当業者によって決定される特定の値に対して許容される誤差範囲内であることを意味し、これは、一部分において、値が測定または決定される方法、すなわち、測定系の限界に依存する。例えば、「約」は、当技術分野における実施ごとに、1または1よりも多い標準偏差内であることを意味し得る。あるいは、「約」は、所与の値の最大で20%まで、最大で10%まで、最大で5%まで、または最大で1%までの範囲を意味し得る。あるいは、例えば、生物学的系またはプロセスに関して、この用語は、値の大きさの一桁以内、または5倍以内、または2倍以内であることを意味し得る。特定の値が、本出願および特許請求の範囲に記載されている場合、特に明記されていない限り、特定の値についての許容される誤差範囲内を意味する「約」という用語を想定すべきである。
【0043】
本明細書で使用される場合、「細胞」は、一般に、生体細胞を指す。細胞は、生命体の基本的な構造、機能および/または生物学的単位であり得る。細胞は、1つまたは複数の細胞を有するあらゆる生物が起源であり得る。一部の非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞の真核生物の細胞、原生動物細胞、植物由来の細胞(例えば、植物作物、果物、野菜、穀物、大豆、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種子、トマト、コメ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、ワタ、大麻、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ類、ツノゴケ類、苔類、蘚類)、藻類の細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardtii、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens C.Agardhなど)、海藻(例えば、ケルプ)、真菌細胞(例えば、酵母細胞、キノコ由来の細胞)、動物細胞、無脊椎動物由来の細胞(例えば、ショウジョウバエ、刺胞動物、棘皮動物、線形動物など)、脊椎動物由来の細胞(例えば、魚類、両生類、爬虫類、鳥類、哺乳動物)、哺乳動物(例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)由来の細胞などが挙げられる。細胞は、天然の生物が起源でない場合がある(例えば、細胞は、合成的に作製され得、人工細胞と称される場合がある)。
【0044】
「ヌクレオチド」という用語は、本明細書で使用される場合、一般に、塩基-糖-リン酸の組合せを指す。ヌクレオチドは、合成ヌクレオチドを含むことができる。ヌクレオチドは、合成ヌクレオチドアナログを含むことができる。ヌクレオチドは、モノマー単位の核酸配列であり得る(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))。ヌクレオチドという用語は、リボヌクレオシド三リン酸、アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)およびdATP、dCTP、dITP、dUTP、dGTP、dTTP、またはそれらの誘導体などのデオキシリボヌクレオシド三リン酸を含むことができる。そのような誘導体としては、例えば、[αS]dATP、7-デアザ-dGTPおよび7-デアザ-dATP、ならびにそれらを含有する核酸分子にヌクレアーゼ耐性を付与するヌクレオチド誘導体を挙げることができる。本明細書で使用されるヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されるものではないが、ddATP、ddCTP、ddGTP、ddITP、およびddTTPを挙げることができる。ヌクレオチドは、無標識であり得るか、または検出可能に標識され得る。標識化は、量子ドットを用いて行うこともできる。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、および酵素標識を挙げることができる。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’,N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、カスケードブルー、オレゴングリーン、テキサスレッド、シアニン、および5-(2’-アミノエチル)アミノナフタレン-l-スルホン酸(EDANS)を挙げることができる。蛍光標識ヌクレオチドの具体例としては、Perkin Elmer、Foster City、Califから入手可能な、[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham、Arlington Heights、Ill.から入手可能なFluoroLinkデオキシヌクレオチドの、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、およびFluoroLink Cy5-dUTP;Boehringer Mannheim、Indianapolis、Indから入手可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-ローダミン-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2’-dATP;ならびにMolecular Probes、Eugene、Oregから入手可能な染色体標識ヌクレオチドの、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、カスケードブルー-7-UTP、カスケードブルー-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、オレゴングリーン488-5-dUTP、ローダミングリーン-5-UTP、ローダミングリーン-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、テキサスレッド-5-UTP、テキサスレッド-5-dUTP、およびテキサスレッド-12-dUTPを挙げることができる。ヌクレオチドは、化学修飾によって標識またはマークすることもできる。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン化dNTPの一部の非限定的例としては、ビオチン-dATP(例えば、bio-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)を挙げることができる。
【0045】
「ゲノム(genome)」および「ゲノム(genomes)」という用語は、本明細書で使用される場合、一般に、対象のゲノムの一部、または対象のゲノムの全体を指すために使用される。例えば、ゲノムは、対象の遺伝子配列を指す場合がある。ゲノムは、対象の全ゲノム配列を指す場合がある。
【0046】
「ポリヌクレオチド」、「オリゴヌクレオチド」および「核酸」という用語は、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかの任意の長さの高分子型のヌクレオチド、または一本鎖型、二本鎖型もしくは複数本鎖型のいずれかのそのアナログを指すために、互換可能に使用される。ポリヌクレオチドは、細胞にとって外因性または内在性であり得る。ポリヌクレオチドは、無細胞環境に存在することができる。ポリヌクレオチドは、遺伝子またはその断片であり得る。ポリヌクレオチドは、DNAであり得る。ポリヌクレオチドは、RNAであり得る。ポリヌクレオチドは、任意の三次元構造を有することができ、任意の機能を果たすことができる。ポリヌクレオチドは、1つまたは複数のアナログ(例えば、変化した主鎖、糖または核酸塩基)を含むことができる。ヌクレオチド構造への修飾は、存在する場合、高分子の構築の前または後に付与することができる。アナログの一部の非限定的な例としては、5-ブロモウラシル、ペプチド核酸、キセノ核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に連結されたローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン連結ヌクレオチド、蛍光塩基アナログ、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン(pseudourdine)、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子もしくは遺伝子断片のコード領域または非コード領域、連鎖解析から規定される遺伝子座(loci)(遺伝子座(locus))、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、無細胞DNA(cfDNA)および無細胞RNA(cfRNA)を含む無細胞ポリヌクレオチド、核酸プローブ、ならびにプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド成分によって中断され得る。前述の核酸分子のいずれかは、操作されていてもよく、または合成されていてもよい。
【0047】
「遺伝子」という用語は、本明細書で使用される場合、RNA転写物のコーディングに関与する核酸(例えば、ゲノムDNAおよびcDNAなどのDNA)およびその対応するそのヌクレオチド配列を指す。ゲノムDNAに関して本明細書で使用されるこの用語は、介在領域、非コード領域だけでなく、調節領域を含み、5’および3’末端を含むことができる。一部の使用では、この用語は、5’および3’非翻訳領域(5’-UTRおよび3’-UTR)、エクソンおよびイントロンを含む転写配列を包含する。一部の遺伝子では、転写領域は、ポリペプチドをコードする「オープンリーディングフレーム」を含有する。この用語の一部の使用では、「遺伝子」は、ポリペプチドをコードするために必要なコード配列(例えば、「オープンリーディングフレーム」または「コード領域」)のみを含む。一部の場合では、遺伝子は、ポリペプチド、例えば、リボソームRNA遺伝子(rRNA)およびトランスファーRNA(tRNA)遺伝子をコードしない。一部の場合では、「遺伝子」という用語は、転写配列だけなく、さらに、上流および下流の調節領域、エンハンサーおよびプロモーターを含む、非転写領域も含む。遺伝子は、生物のゲノムにおいてその本来の場所にある「内在性遺伝子」またはネイティブ遺伝子を指すことができる。遺伝子は「外因性遺伝子」または非ネイティブ遺伝子を指すことができる。非ネイティブ遺伝子は、宿主生物中に通常は見出されないが、遺伝子移入によって宿主生物に導入される遺伝子を指すことができる。非ネイティブ遺伝子は、遺伝子改変された生物などの生物のゲノムにおいてその本来の場所にない遺伝子を指すこともできる。非ネイティブ遺伝子は、突然変異、挿入および/または欠失を含む天然に存在する核酸またはポリペプチド配列(例えば、非ネイティブ配列)を指すこともできる。
【0048】
「同一性パーセント(%)」という用語は、本明細書で使用される場合、最大の同一性パーセントが達成されるように配列を整列させ、必要により、ギャップを導入した後に(すなわち、最適の整列のために、候補配列および参照配列の一方または両方にギャップを導入することができ、比較の目的のために、非相同配列を無視することができる)、参照配列のアミノ酸残基または核酸残基と同一である候補配列のアミノ酸残基または核酸残基のパーセンテージを指す。同一性パーセントを決定する目的のために、整列は、例えば、BLAST、ALIGNまたはMegalign(DNASTAR)ソフトウェアなどのコンピュータソフトウェアを使用するなどの、さまざまな方法で達成することができる。2つの配列の同一性パーセントは、BLASTを使用して、試験配列を比較配列と整列させ、比較配列の同じ位置にあるアミノ酸またはヌクレオチドと同一である、整列させた試験配列中のアミノ酸またはヌクレオチドの数を決定し、同一のアミノ酸またはヌクレオチドの数を比較配列中のアミノ酸またはヌクレオチドの数で割ることによって、計算することができる。
【0049】
「対象」という用語は、本明細書で使用される場合、一般に、あらゆる動物、例えば、哺乳動物または有袋類を指す。対象は患者であり得る。対象は、疾患または病気に関して、症候性または無症候性であり得る。対象は、霊長類(例えば、ヒト)、非ヒト霊長類(例えば、アカゲザルまたは他の種類のマカク)、イヌ、ネコ、マウス、ブタ、ウマ、ロバ、ウシ、ヒツジ、ラットおよび家禽であり得る。哺乳動物としては、限定されるものではないが、マウス、サル、ヒト、家畜、スポーツ動物および愛玩動物が挙げられる。in vivoで得られるか、またはin vitroで培養される、生物学的実体の組織、細胞およびそれらの子孫も包含される。宿主は、非宿主を内部に持つことができる生物である。対象は、疾患に関して無症候性であり得る。代替として、対象は、疾患に関して無症候性ではない。
【0050】
「処置」および「処置する」という用語は、本明細書で使用される場合、限定されないが、治療利益および/または予防利益を含む、有益なまたは望ましい結果を得るためのアプローチを指す。例えば、処置は、本明細書に開示されるシステムまたは細胞集団を投与することを含むことができる。治療利益とは、処置下にある1つまたは複数の疾患、状態または症状における任意の治療に関連する改善、またはそれらに対する効果を意味する。予防利益のためには、特定の疾患、状態もしくは症状を発症する危険性がある対象に、または疾患の生理学的症状の1つもしくは複数を報告する対象に、疾患、状態または症状がまだ発現していない場合であっても、組成物を投与することができる。
【0051】
一部の場合では、本開示は、生体試料を処理および分析するための組成物および方法も提供する。一部の場合では、対象由来の生体試料は、対象由来の核酸、および対象由来ではない核酸分子を含むことができる。一部の場合では、生体試料は、ヒトおよび非ヒトゲノム由来の核酸を含むことができる。一部の場合では、非ヒトゲノムは、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、またはそれらの組合せ由来であり得る。一部の場合では、非ヒトゲノムの起源は、ヒト宿主に対して有益であり得る。一部の場合では、非ヒトゲノムの起源は、がんなどの疾患のモジュレートに関与し得る。一部の場合では、非ヒトゲノムを含む非ヒト生物の起源は、ヒト細胞における突然変異を引き起こし、それによって、対象にがんを引き起こすことにより、直接的に振る舞うことができる。一部の場合では、非ヒトゲノムの起源は、例えば、疾患と戦うためのその能力に影響を及ぼすヒト宿主の免疫系を刺激することによって、間接的に振る舞うことができる。一部の場合では、本開示は、試料中の非ヒトゲノムおよびヒトゲノムの存在を特定することを含む方法も提供する。
【0052】
試料は、皮膚、唾液、鼻孔、消化管、腸、生殖器、またはそれらの組合せ由来であり得る。一部の場合では、試料は、拭き取り、生検、糞便の採取、尿の採取、唾液の採取などによって取得することができる。
【0053】
ヒトゲノム(約30億塩基)は、非ヒトゲノム、例えば、細菌のゲノムより約1,000倍大きく、大部分のウイルスゲノムのサイズの数千倍である。一部の場合では、方法は、混合試料中の非ヒトゲノムを濃縮するための試料採取方法を含むことができる。
【0054】
本開示は、試料由来の微生物の核酸の配列(または配列決定)分析を含む方法も提供する。配列決定分析は、例えば、16SリボソームRNA遺伝子のサブセクションのPCR増幅、およびディープシークエンシングを使用する非標的メタゲノミクス法を含むことができる。方法は、非ヒトゲノムに対する感受性を最適化するために、ヒトゲノムの量を最小化しようとし得る、試料の種類および/または濃縮方法の選択を含むことができる。
【0055】
一態様では、第1の複数の核酸分子は、対象由来であり得る。対象は、ヒトであり得、そのため、本開示は、ヒトの核酸分子も提供する。本開示は、ヒトゲノム由来であり得る複数の核酸プローブを使用する、第1のサブセットまたは生成物も提供する。本開示は、ヒトゲノムも提供する。一部の場合では、ヒトゲノムは、例えば、遺伝する遺伝的変異体、体細胞変異体、免疫細胞におけるVDJ組換え、異なる細胞型における差次的遺伝子発現、および他の性質を含み得る。前述の少なくとも一部は、対象における疾患(例えば、がんにおける体細胞変異体)に寄与し得るか、または関連し得る。ゲノムは、遺伝子、エクソン、UTR、調節領域、スプライス部位、再構築遺伝子、代替配列、再構築遺伝子、遺伝子フェージング、外因性配列などを含み得る。
【0056】
一部の場合では、生体試料中の核酸は、配列決定によって分析することができる。一部の場合では、典型的には、血液または罹患組織由来の核酸の配列決定を行うことができる。一部の場合では、血液試料は、末梢血単核細胞、無細胞DNAまたはそれらの組合せを含むことができる。一部の場合では、罹患組織は、がんを含むことができる。一部の場合では、血液試料または罹患組織試料由来の核酸の配列分析は、アンプリコンパネルの生成、ハイブリッド捕捉、および全ゲノム配列決定などの非標的法を含むことができる。一部の場合では、方法は、試料の種類、ヒトゲノムの濃縮法およびそれらの組合せの選択を含むことができる。
【0057】
一部の場合では、生体試料は、対象の核酸、非対象の核酸およびそれらの組合せを含むことができる。一部の場合では、生体試料は、宿主の核酸、非宿主の核酸およびそれらの組合せを含むことができる。一部の場合では、生体試料は、受容体をコードするゲノムを含むことができる。一部の場合では、受容体は、免疫細胞由来であり得る。一部の場合では、免疫細胞由来の受容体は、T細胞受容体(TCR)、B細胞受容体(BCR)、キメラ抗原受容体(CAR)などであり得る。
【0058】
一部の場合では、本明細書に提供される方法は、核酸分子をアッセイに付して、配列情報を得ることを含む。アッセイは、VDJ再編成またはVDJ組換えを含む核酸を配列決定することを含むことができる。一部の場合では、VDJ再編成または組換えは、細胞受容体を指すことができる。例えば、体細胞高頻度突然変異は、抗原の顕著な多様性のために、抗体をコードするB細胞受容体(BCR)配列を生じさせることができる。一部の場合では、BCRを配列決定することができる。本明細書に提供される方法は、どのようにして抗体が発生するかを解明するためにBCRを配列決定することを含むことができる。例えば、方法は、V、DもしくはJ遺伝子の特定の1つに由来する、またはN付加(別名:非鋳型挿入)に由来すると、それぞれの塩基に注釈を付ける配列分析を含むことができる。一部の場合では、VDJ組換えは、CDR3配列を生成し得る。一部の場合では、CDR3配列は、抗原、例えば、腫瘍抗原に結合するポリペプチドを生成し得る。一部の場合では、CDR3配列は、抗原、例えば、ネオ抗原に結合するポリペプチドを生成し得る。
【0059】
一部の場合では、本明細書に提供される方法は、候補腫瘍ネオ抗原をコードするか、または関連する、核酸を配列決定することを含むことができる。一部の場合では、本明細書に提供される方法は、検出されるCDR3配列を配列決定することを含むことができる。一部の態様では、対象のTCRは、各種の方法を使用して特定することができる。一部の場合では、TCRは、全エクソーム配列決定を使用して特定することができる。例えば、TCRは、標的細胞の全エクソーム配列決定によって特定されるネオ抗原またはネオエピトープを標的にすることができる。あるいは、TCRは、自家、同種間または異種間のレパートリーから特定することができる。一部の場合では、ネオ抗原またはネオエピトープを生じさせる突然変異を含み得る遺伝子は、ABL1、ACOl 1997、ACVR2A、AFP、AKT1、ALK、ALPPL2、ANAPC1、APC、ARID1A、AR、AR-v7、ASCL2、β2Μ、BRAF、BTK、C15ORF40、CDH1、CLDN6、CNOT1、CT45A5、CTAG1B、DCT、DKK4、EEF1B2、EEF1DP3、EGFR、EIF2B3、env、EPHB2、ERBB3、ESR1、ESRP1、FAM11 IB、FGFR3、FRG1B、GAGE1、GAGE 10、GATA3、GBP3、HER2、IDH1、JAK1、KIT、KRAS、LMAN1、MABEB 16、MAGEA1、MAGEA10、MAGEA4、MAGEA8、MAGEB 17、MAGEB4、MAGEC1、MEK、MLANA、MLL2、MMP13、MSH3、MSH6、MYC、NDUFC2、NRAS、NY-ESO、PAGE2、PAGE5、PDGFRa、PIK3CA、PMEL、polタンパク質、POLE、PTEN、RAC1、RBM27、RNF43、RPL22、RUNX1、SEC31A、SEC63、SF3B 1、SLC35F5、SLC45A2、SMAP1、SMAP1、SPOP、TFAM、TGFBR2、THAP5、TP53、TTK、TYR、UBR5、VHL、XPOTであり得る。
【0060】
本開示は、1つまたは複数のゲノムを含む核酸試料または核酸分子のサブセットを得ること、または用意することを含む方法も提供する。本明細書に開示される方法は、生体試料から生成された核酸分子の核のサブセットを分析し得る。サブセットは、対象由来の核酸分子、および対象由来ではない核酸分子を含み得る。例えば、ヒトおよび微生物の配列は、標的捕捉および配列を使用して、濃縮されてもよい。1つまたは複数のゲノムは、1つまたは複数のゲノムの特徴を含み得る。
【0061】
ゲノムの特徴は、全ゲノムまたはその部分を含み得る。ゲノムの特徴は、全エクソームまたはその部分を含み得る。ゲノムの特徴は、遺伝子の1つまたは複数のセットを含み得る。ゲノムの特徴は、1つまたは複数の遺伝子を含み得る。ゲノムの特徴は、調節エレメントの1つまたは複数のセットを含み得る。ゲノムの特徴は、1つまたは複数の調節エレメントを含み得る。ゲノムの特徴は、多型のセットを含み得る。ゲノムの特徴は、1つまたは複数の多型を含み得る。一部の場合では、多型は、遺伝子型における突然変異を指す。多型は、1つもしくは複数の塩基の変化、挿入、繰り返し、または1つもしくは複数の塩基の欠失を含み得る。ゲノムの特徴は、コピー数変異体(CNV)、トランスバージョン、他の再編成、および他の形態の遺伝的変異を含むことができる。一部の場合では、核酸試料のサブセットの1つまたは複数の特徴は、制限断片長多型、縦列反復配列多型(VNTR’s)、超可変領域、ミニサテライト、ジヌクレオチド反復、トリヌクレオチド反復、テトラヌクレオチド反復、単純反復配列、およびAluなどの挿入エレメントを含む、多型マーカーであり得る。一部の場合では、核酸分子の第1のサブセットおよび核酸分子の第2のサブセットの間の相違は、制限断片長多型、縦列反復配列多型(VNTR’s)、超可変領域、ミニサテライト、ジヌクレオチド反復、トリヌクレオチド反復、テトラヌクレオチド反復、単純反復配列、およびAluなどの挿入エレメントを含む、多型マーカーであり得る。選択された集団において最も頻繁に生じる対立遺伝子形態を野生型形態と称する場合がある。二倍体生物は、対立遺伝子形態について、ホモ接合性またはヘテロ接合性であり得る。2対立遺伝子多型は、2つの形態を有する。3対立遺伝子多型は、3つの形態を有する。多型は、一塩基多型(SNP)を含み得る。本開示の一部の態様では、1つまたは複数の多型は、1つまたは複数の一塩基多様性、InDel、小挿入、小欠失、構造変異体ジャンクション、可変長タンデム反復、フランキング配列またはそれらの組合せを含む。1つまたは複数の多型は、コード領域および/または非コード領域内に位置していてもよい。1つまたは複数の多型は、遺伝子、エクソン、イントロン、スプライス部位、非翻訳領域またはそれらの組合せ内、それらの周囲、またはそれらに近接して位置していてもよい。1つまたは複数の多型は、遺伝子、エクソン、イントロン、非翻訳領域の少なくとも一部に及んでいてもよい。一部の場合では、ゲノムの特徴は、GC含量、複雑さ、および/または1つもしくは複数の核酸分子のマッピング可能性に関連し得る。ゲノムの特徴は、1つもしくは複数の単純タンデム反復(STR)、不安定な伸長反復、セグメント重複、シングルおよびペアリード変性マッピングスコア、GRCh38もしくはGRCh37パッチ、またはそれらの組合せを含み得る。ゲノムの特徴は、全ゲノム配列決定(WGS)からの1つまたは複数の低平均カバー領域、WGSからのゼロ平均カバー領域、有効な圧縮、またはそれらの組合せを含み得る。ゲノムの特徴は、1つまたは複数の代替配列または非参照配列を含み得る。
【0062】
ゲノムの特徴は、1つまたは複数の遺伝子フェージングおよび再構築遺伝子を含み得る。フェージングおよび再構築遺伝子の例としては、限定されるものではないが、1つまたは複数の主要組織適合遺伝子複合体、血液タイピング、およびアミラーゼ(amaylase)遺伝子ファミリーが挙げられる。一部の場合では、遺伝子フェージングおよび/または再構築遺伝子は、血液タイピングに関連する遺伝子を含み得る。血液タイピング遺伝子は、ABO、RHD、RHCE、またはそれらの組合せを含み得る。
【0063】
一部の場合では、ゲノムの特徴は、再構築遺伝子を含み得る。再構築遺伝子は、免疫応答に関与する遺伝子を含むことができる。免疫応答に関与する遺伝子は、主要組織適合遺伝子複合体、免疫応答、および細胞機能に関与する遺伝子を含むことができる。1つまたは複数の主要組織適合遺伝子複合体は、1つもしくは複数のHLAクラスI、HLAクラスII、またはそれらの組合せを含み得る。HLAクラスIは、HLA-A、HLA-B、HLA-C、またはそれらの組合せのいずれか1つであり得る。HLAクラスIIは、HLA-DP、HLA-DM、HLA-DOA、HLA-DOB、HLA-DQ、HLA-DR、またはそれらの組合せのいずれか1つであり得る。免疫応答に関与する遺伝子は、RAG1、RAG2、およびそれらの組合せであり得る。一部の場合では、再構築遺伝子は、VDJ組換えに関与する遺伝子を含み得る。例えば、B細胞およびT細胞受容体(BCRおよびTCR)において多様性を確立するために、遺伝子は、既存の遺伝子セグメントを組み換えることによって、作出することができる。一部の場合では、遺伝子セグメントの有限集合の異なる組合せは、限定されない数の外来ゲノムまたは非ヒトゲノムを認識することができる受容体を生じさせることができる。VDJ組換えは、組換えシグナル配列(RSS)を含むDNAを切断することを含むことができる。一部の場合では、断片化配列は、細胞修復機構を使用して再構築することができる。本開示は、VDJ組換えからゲノムの断片化セクションを配列決定することを含む方法も提供する。例えば、本開示は、VDJ組換えの部位で配列決定することを含む方法を提供する。
【0064】
本開示の一部の態様では、1つまたは複数のゲノムの特徴は、相互に排他的ではなくてもよい。例えば、全ゲノムまたはその部分を含むゲノムの特徴は、全エクソームまたはその部分、1つまたは複数の遺伝子、1つまたは複数の調節エレメントなどの追加のゲノムの特徴と重なり合うことができる。あるいは、1つまたは複数のゲノムの特徴は、相互に排他的であってもよい。例えば、全ゲノムの非コード部分を含むゲノムは、エクソームもしくはその部分、または遺伝子のコード部分などのゲノムの特徴と重なり合わなくてもよい。代わりに、または加えて、1つまたは複数のゲノムの特徴は、部分的に排他的であるか、または部分的に包括的である。例えば、全エクソームまたはその部分を含むゲノムは、遺伝子のエクソン部分を含むゲノムと部分的に重なり合うことができる。しかしながら、全エクソームまたはその部分を含むゲノムは、遺伝子のイントロン部分を含むゲノムと重なり合わなくてもよい。したがって、遺伝子またはその部分を含むゲノムの特徴は、全エクソームまたはその部分を含むゲノムの特徴を、部分的に排除してもよく、および/または部分的に含んでいてもよい。一部の場合では、遺伝子の特徴は、1つより多くの種を区別することができるように、種に関連し得る。一部の場合では、遺伝子の特徴は、ヒト遺伝子の特徴および細菌遺伝子の特徴を区別することができるように、種に関連し得る。一部の場合では、核酸分子の第1のサブセットは、1つの種に特異的であり、核酸分子の第2のサブセットは、第2の種に特異的である。
【0065】
生体試料は、ヒトゲノム、非ヒトゲノム、またはそれらの組合せを含むことができる。一部の場合では、生体試料を処理することができる。一部の場合では、生体試料は、対象、例えば、ヒトの核酸配列について濃縮され得るか、または対象由来ではない(例えば、非ヒト)核酸配列について、試料由来のヒトゲノムおよび非ヒトゲノムの同時検出を行うことができる。生体試料は、無細胞DNA(cfDNA)または無細胞RNAなどの無細胞核酸分子を含み得る。無細胞核酸分子は、循環腫瘍核酸分子(例えば、循環腫瘍DNA)であり得る。無細胞DNAは、がんなどの疾患を示し得るか、関連し得るか、または関係し得る突然変異を含んでいてもよい。
【0066】
生体試料は、操作された配列を含む核酸分子を有していてもよい。例えば、生体試料中の核酸は、2~3例挙げると、タグなどの外因性配列または代替配列、キメラ抗原受容体(CAR)などの外因性受容体、プラスミド配列、およびネオ抗原特異的配列を含み得る。一部の場合では、操作された配列は、診断マーカーとして利用されてもよい。一部の場合では、操作された配列を利用して、治療薬が腫瘍標的などの標的に輸送されるかを決定してもよい。代替配列は、外因性または内在性であり得る。一部の場合では、代替配列は、プラスミド配列由来を含み得る。プラスミド配列は、DNAまたはRNAであり得る。一部の場合では、プラスミド配列は、DNAの小環状配列またはドギーボーン配列(doggy bone sequence)でもあり得る。
【0067】
本開示は、1つまたは複数のトランスクリプトームを含む核酸試料または核酸分子のサブセットを得ること、または用意することを含む方法も提供する。核酸試料は、mRNAを含んでいてもよい。mRNAは、対象における異なる組織由来であってもよい。試料中のmRNAの量は、組織および対象に特異的な方法で、mRNAまたはタンパク質の発現レベルを分析するために使用され得る。例えば、試料中のmRNAの量は、対象中の特定の特徴または疾患(例えば、がん)に関連し得る。加えて、試料中のmRNAの量は、対象中の特定の組織型における発現における変化または相対的相違を示し得る。一部の場合では、mRNAは、処理されて、cDNAを形成し得る。例えば、mRNAは、cDNA分子を合成する逆転写を使用する逆転写に付されてもよい。cDNA分子は、本明細書の他の箇所で記載の核酸において行い得る、捕捉、単離、濃縮、増幅、配列決定、または他の反応に付され得る。
【0068】
対象および非対象配列を含有する生体試料由来の核酸は、単一プールにおいて、濃縮および配列決定され得、in silicoで分離され得る。例えば、混合されたヒトゲノムおよび非ヒトゲノムは、ヒトおよび非ヒト種の参照配列との整列によって分離することができる。ヒトゲノムが進化の過程で微生物ゲノムから分岐しているので、整列による配列の分離が可能であり得る。微生物種などの非ヒトゲノム由来のゲノム、例えば、DNAは、一般に、ヒトゲノムに対して整列されず、逆もまた同様である。微生物ゲノムなどの非ヒトゲノムは、他の非ヒトゲノムと共通または類似のセグメントを有していてもよい。ヒトゲノムおよび非ヒトゲノムの混合物中の1つより多くの非ヒトゲノムは、非ヒト種を特定するための追加の整列が必要であり得る。
【0069】
一部の場合では、方法は、生体試料から核酸分子のサブセットを生成することを含むことができる。一部の場合では、方法は、1つまたは複数のハイブリダイゼーション反応を実施することによって、生体試料から核酸分子のサブセットを生成することを含むことができる。ハイブリダイゼーション反応は、濃縮を含むことができる。一部の場合では、濃縮を行うことができる。濃縮は、さまざまな方法によって行うことができる。一部の場合では、濃縮は、ハイブリッド捕捉、アレイ捕捉、ビーズ捕捉などによって行うことができる。一部の場合では、ハイブリッド捕捉は、溶液中、またはアレイ上などの固体担体上であり得る。一部の場合では、濃縮は、分子反転プローブ(MIP)によって行うことができる。濃縮は、例えば、PCRを使用する、増幅によって行うことができる。一部の場合では、方法は、濃縮の目的のために、ヒトゲノムまたは非ヒトゲノムの増幅によって、核酸のサブセットを生成することを含むことができる。一部の場合では、増幅は、ポリメラーゼ連鎖反応(PCR)に基づく手法(例えば、固相PCR、RT-PCR、qPCR、マルチプレックスPCR、タッチダウンPCR、ナノPCR、ネステッドPCR、ホットスタートPCRなど)、ヘリカーゼ依存性増幅(HDA)、ループ介在等温増幅(LAMP)、自家持続配列複製(3SR)、核酸配列に基づく増幅(NASBA)、ストランド置換増幅(SDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、および任意の他の適切な増幅手法のうちの1つを含むことができる。
【0070】
核酸プローブのプールは、ヒトエクソーム捕捉キット、例えば、Agilent Clinical Research Exome v2(
図1)を含むことができる。核酸プローブのプールは、それが標的にするヒト配列に対して相補的であるハイブリダイゼーションプローブを含むことができる。核酸プローブのプールは、所定のヒト遺伝子などの大部分のゲノムを標的にするために、約50,000個の捕捉用プローブから含むことができる。捕捉用プローブは、遺伝子、エクソン、UTR、調節領域、スプライス部位、再構築遺伝子、代替配列、および追加のゲノム含量を標的にするように設計することができる。一部の場合では、方法は、非ヒト配列を標的にするように設計された核酸プローブのプールを含むことができる。一部の場合では、核酸プローブのプールは、ウイルス、細菌、真菌または古細菌のゲノム由来、すなわち、ヒトマイクロバイオーム由来のような非ヒトゲノムに特異的であり得る。一部の場合では、核酸プローブのプールは、核酸プローブの第1のプールと比較して、第2の種に特異的であり得る核酸プローブの第2のプールと組み合わせることができる(
図2)。核酸プローブのプールは、ヒト配列および非ヒト配列に結合するように構成することができ、核酸プローブのプールは、セグメント化トランスクリプトーム由来の配列に結合することができる(
図3)。一部の場合では、核酸プローブのプールは、ヒト配列に結合することができ、核酸プローブのプールは、非ヒト配列に結合することができる(
図4)。一部の場合では、核酸プローブのプールは、患者試料から抽出された核酸との単一ハイブリダイゼーションに基づく捕捉反応のために使用することができる。一部の場合では、方法は、捕捉されている核酸のプールを配列決定することを含むことができる。捕捉または濃縮された核酸は、ヒト、非ヒト、またはヒトおよび非ヒト配列であり得、配列決定は、Illumina NovaSeq-6000 DNA配列決定装置を含むことができる。一部の場合では、微生物種を標的にする捕捉用プローブは、1つもしくは複数の種が異なるか、または1つもしくは複数の種が異なる領域、例えば、非ヒトまたはヒトの領域に直ぐ隣接する微生物種配列の領域を標的にするように設計され得る。一部の場合では、方法は、微生物配列などの非ヒト配列の間の相違の領域を標的にし、それによって、少数の捕捉用プローブで、多数の可能性がある非ヒト微生物種由来の核酸の捕捉を可能にすることを含む。共有の配列領域を含み得るが、可変領域に隣接する捕捉用プローブを使用することによって、捕捉することができる多くの非ヒト配列は、両方に及び得る。
【0071】
一部の場合では、非ヒトゲノム由来の配列は、次いで、1つまたは複数の種に固有の領域によって、それらの起源種に割り当てることができる。例えば、ほぼすべての細菌中に存在する16SリボソームRNA遺伝子は、配列が種ごとに異なり、共有配列の領域と交互配置された約9つの領域を有する。一部の場合では、配列がこれらの共有領域から可変領域に伸長した捕捉された分子は、次いで、可変領域部由来の配列に基づくそれらの起源の種に割り当てることができる。真菌核酸配列は、真菌ゲノムの大きなサブユニットのリボソームRNA遺伝子の部分的に保存されたD2領域を使用することによって、同様に評価することができる。ゲノムのエクソームを分析することができる。ゲノムのイントロン領域を分析することができる。エクソームは、主に、ヒトゲノムのコード領域を標的にし、全ヒトゲノムの2%未満を表し得る。ヒトゲノムのイントロン部分および遺伝子間部分の大部分を除外することによって、ヒト配列の量は、約98%低減され得る。エクソームは、非コード含量を含むように増大され得る。がんなどにおけるエクソームの配列決定は、ディープシークエンシングを可能にし得、それにより、低対立遺伝子頻度で体細胞変異体の検出を改善すること、また試料から共捕捉された非ヒト配列の検出を改善することを可能にし得る。
【0072】
本開示は、生体試料を処理するための組成物および方法も提供する。生体試料は、成人または小児などの対象から得ることができる。一部の場合では、生体試料を処理するための方法は、(a)核酸プローブのプールを使用して、生体試料から核酸分子のサブセットを生成することであって、プローブが、(i)ヒトゲノムのエレメントを標的にするように構成された第1の複数の核酸プローブ、および(ii)1つまたは複数の非ヒトゲノムのエレメントを標的にするように構成された第2の複数の核酸プローブを含むこと;ならびに(b)核酸分子のサブセットをアッセイに付して、(i)対象からの生体試料由来のヒト核酸、および(ii)対象の生体試料由来の非ヒト核酸の配列を含む配列情報を得ることを含む。
【0073】
開示される方法は、1つもしくは複数の非ヒト核酸分子、または1つもしくは複数の非ヒトゲノムもしくは非宿主ゲノムによって引き起こされる1つもしくは複数の疾患または状態を、検出すること、モニタリングすること、定量化すること、または評価することを含み得る。一部の場合では、捕捉用プローブは、異なる属の間を標的にすることができる。一部の場合では、捕捉用プローブは、異なる種の間を標的にすることができる。一部の態様では、捕捉用プローブは、異なる目の1つより多くの生物の間を標的にすることができる。一部の場合では、捕捉用プローブは、植物界、動物界、真菌、原生動物(protest
)、真正細菌、および/または古細菌を標的にすることができる。一部の場合では、捕捉用プローブは、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、遺伝子改変細胞、遺伝子改変ベクター、およびそれらの組合せを標的にすることができる。一部の場合では、非ヒト配列は細菌であり得る。例えば、細菌配列は、acidiobacteria、actiniobacteria、Aquificae、armatimonadetes、Bacteroidetes、caldiserica、chlamydiae、Chlorobi、chloroflexi、chrysiogenetes、cyanobacteria、deferribacteres、deinococcus-thermus、dictyoglomi、elusimicrobia、fibrobacteres、firmicutes、fusobacteria、gemmatimonadetes、lentisphaerae、Nitrospirae、planctomycetes、Proteobacteria、spirochaetes、synergistetes、tenericutes、thermodesulfobacteria、thermomicrobia、thermotogae、および/またはverrucomicrobia由来であり得る。一部の場合では、非ヒト配列は、限定されるものではないが、Bordetella、Borrelia、Brucella、Campylobacter、Chlamydia、Chlamydophila、Clostridium、Corynebacterium、Enterococcus、Escherichia、Francisella、Haemophilus、Helicobacter、Legionella、Leptospira、Listeria、Mycobacterium、Mycoplasma、Neisseria、Pseudomonas、Rickettsia、Salmonella、Shigella、Staphylococcus、Streptococcus、Treponema、Vibrio、またはYersinia由来であり得る。追加の病原体としては、限定されるものではないが、Mycobacterium tuberculosis、Streptococcus、Pseudomonas、Shigella、Campylobacter、およびSalmonellaが挙げられる。一部の場合では、捕捉用プローブは、blastocladiomycota、chytridiomycota、Glomeromycota、Microsporidia、Neocallimastigomycota、Deuteromycota、Ascomycota、Pezizomycotina、Saccharomycotina、Taphrinomycotina、Basidiomycota、Agaricomycotina、Pucciniomycotina、Ustilaginomycotina、Entomophthoromycotina、Kickxellomycotina、Mucoromycotina、Zoopagomycotinaなどの真菌を標的にすることができる。一部の場合では、非ヒトまたは非宿主は、ウシ、ウマ、魚類、ロバ、ウサギ、ラット、マウス、ハムスター、イヌ、ネコ、ブタ、ヘビ、ヒツジ、ヤギなど由来であり得る。
【0074】
1つまたは複数の非ヒトゲノムによって引き起こされるか、またはこれらと関連する、疾患または状態は、結核、肺炎、経口感染病、破傷風、腸チフス、ジフテリア、梅毒、ハンセン病、細菌性腟症、細菌性髄膜炎、細菌性肺炎、尿路感染症、細菌性胃腸炎、細菌性皮膚感染症、またはそれらの任意の組合せを含み得る。細菌性皮膚感染症の例としては、限定されるものではないが、Staphylococcus aureusまたはStreptococcus pyogenesによって引き起こされ得る膿痂疹;リンパ液の伝搬による深部表皮のstreptococcus細菌感染症によって引き起こされ得る丹毒;および正常な皮膚細菌叢または外因性細菌によって引き起こされ得る蜂巣炎が挙げられる。
【0075】
非対象核酸配列は、Candida、Aspergillus、Cryptococcus、Histoplasma、PneumocystisおよびStachybotrysなどの真菌に由来していてもよい。真菌によって引き起こされる疾患または状態の例としては、限定されるものではないが、頑癬、カンジダ症、白癬および水虫が挙げられる。
【0076】
一部の場合では、非対象または非宿主の核酸配列は、原生生物由来であり得る。原生生物は、原生動物、原生植物、カビ、およびそれらの組合せを含むことができる。原生生物は、archaeplastidaであり得る。archaeplastidaは、RhodophytaまたはGlaucophytaであり得る。原生生物は、SarまたはHarosaであり得る。SARは、stramenopiles、alveolatesおよびRhizaria(SAR)を含むクレードであり得る。加えて、クレードSARは、Stramenopiles、Alveolata、Apicomplexa、Ciliophora、Dinoflagellata、Rhizaria、Cercozoa、Foraminifera、Radiolaria、およびそれらの組合せを含むことができる。一部の場合では、原生生物は、Excavataであり得る。Excavataは、Euglenozoa、Percolozoa、Metamonada、およびそれらの組合せであり得る。一部の場合では、非宿主は、Amoebozoa、Hacrobia、Apusozoa、Opisthokontaおよび/またはChoanozoaであり得る。
【0077】
非対象核酸配列は、ウイルスに由来していてもよい。ウイルスの例としては、限定されるものではないが、アデノウイルス、コクサッキーウイルス、エプスタインバーウイルス、肝炎ウイルス(例えば、A型、B型およびC型肝炎)、単純ヘルペスウイルス(1型および2型)、サイトメガロウイルス、ヘルペスウイルス、HIV、インフルエンザウイルス、麻疹ウイルス、流行性耳下腺炎ウイルス、パピローマウイルス、パラインフルエンザウイルス、ポリオウイルス、呼吸器多核体ウイルス、風疹ウイルスおよび水痘帯状疱疹ウイルスが挙げられる。ウイルスによって引き起こされる疾患または状態の例としては、限定されるものではないが、風邪、インフルエンザ、肝炎、AIDS、水疱、風疹、流行性耳下腺炎、麻疹、疣贅および灰白髄炎が挙げられる。
【0078】
非対象核酸は、Acanthamoeba(例えば、A.astronyxis、A.castellanii、A.culbertsoni、A.hatchetti、A.polyphaga、A.rhysodes、A.healyi、A.divionensis)、Brachiola(例えば、B connori、B.vesicularum)、Cryptosporidium(例えば、C.parvum)、Cyclospora(例えば、C.cayetanensis)、Encephalitozoon(例えば、E.cuniculi、E.hellem、E.intestinalis)、Entamoeba(例えば、E.histolytica)、Enterocytozoon(例えば、E.bieneusi)、Giardia(例えば、G.lamblia)、Isospora(例えば、I.belli)、Microsporidium(例えば、M.africanum、M.ceylonensis)、Naegleria(例えば、N.fowleri)、Nosema(例えば、N.algerae、N.ocularum)、Pleistophora、Trachipleistophora(例えば、T.anthropophthera、T.hominis)、およびVittaforma(例えば、V.corneae)などの原生動物に由来していてもよい。
【0079】
核酸は、例えば、細胞画分の単離を行うことによって、対象由来の生体試料から抽出および/または単離することができる。変形では、試料の処理は、したがって、試料の溶解、試料の細胞における膜の破壊、試料からの望ましくないエレメント(例えば、RNA、タンパク質)の分離、試料の非ヒト、マイクロバイオームの核酸含量およびヒトゲノムの核酸含量を含む核酸試料を生成するための試料中の核酸(例えば、DNA)の精製、核酸試料由来の核酸の増幅、核酸試料の増幅された核酸のさらなる精製、核酸試料の増幅された核酸の配列決定、ならびにそれらの任意の組合せのいずれか1つまたは複数を含むことができる。変形では、試料の溶解、および/または試料の細胞における膜の破壊は、細胞溶解/膜破壊の物理的方法(例えば、ビーズ叩打、窒素減圧、均質化、超音波処理)を含むことができ、これは、配列決定の際にある特定の微生物群の提示におけるバイアスが生じるある特定の試薬を取り除く。加えて、または代わりに、溶解または破壊は、化学的方法(例えば、洗剤を使用する、溶媒を使用する、界面活性剤を使用するなど)を含むことができる。
【0080】
変形では、試料由来の望ましくないエレメントの分離は、RNアーゼを使用するRNAの除去、および/またはプロテアーゼを使用するタンパク質の除去を含むことができる。変形では、核酸試料を生成するための試料中の核酸の精製は、生体試料から核酸の沈殿(例えば、アルコール系沈殿法を使用する)、液-液系精製手法(例えば、フェノール-クロロホルム抽出)、クロマトグラフィー系精製手法(例えば、カラム吸着)、核酸に結合するように構成され、溶出環境(例えば、溶出溶液を有する、pH変化を提供する、温度変化を提供するなど)の存在中で核酸を放出するように構成された、結合部分-結合粒子(例えば、磁気ビーズ、浮遊ビーズ、サイズ分布を有するビーズ、超音波応答性ビーズなど)の使用を含む精製手法、ならびに任意の他の適切な精製手法の1つまたは複数を含むことができる。
【0081】
核酸は、抽出および単離するために生体試料から抽出および/または単離することができ、ならびに/あるいは、単離を、任意の混入物質(例えば、試料中の核酸に影響を与え得るか、または核酸の夾雑物に寄与し得る物質)の無菌環境(例えば、無菌実験フード、無菌室)において実施することができ、環境は、温度を制御することができ、酸素含量について制御することができ、二酸化炭素含量について制御することができ、および/または光曝露(例えば、紫外光への曝露)について制御することができる。抽出は、細胞膜を破壊し、生体試料中の細胞からの核酸の放出を促進する溶解を含むことができる。非限定的な一例では、溶解は、試料と混合され、試料の生物学的含量を撹拌するように機能するビーズとの使用のために構成されたビーズミル装置(例えば、Tissue Lyser)を含むことができる。一部の場合では、生体試料の処理は、溶解試薬(例えば、プロテイナーゼ)、熱モジュール、および溶解のための任意の他の適切な装置(複数可)の1つまたは複数の組合せを含むことができる。
【0082】
溶解試料からの核酸の単離のために、試料の非核酸含量は、試料の核酸含量から分離される。試料を処理する方法の精製モジュールは、力に基づく分離、サイズに基づく分離、結合部分に基づく分離(例えば、磁気結合部分による、浮遊結合部分によるなど)、および/または任意の他の適切な分離の形式を含むことができる。例えば、方法の精製操作は、上清の抽出を促進する遠心分離、フィルター(例えば、濾過プレート)、溶解試料を試料の核酸含量および/または廃棄物に結合する部分と組み合わせるように構成された液体送達モジュール、洗浄試薬送達システム、溶出試薬送達システム、および試料からの核酸含量の精製のための任意の他の適切な装置の1つまたは複数を含むことができる。
【0083】
核酸分子のサブセットをアッセイに付して、配列情報を得ることができる。配列情報を与えるアッセイは、配列決定反応を含むことができる。一部の場合では、配列決定は、RNAの配列決定であり得る。例えば、配列決定は、RNA転写の配列決定であり得る。RNAの配列決定は、RNA精製によるクロマチン単離(ChIRP-Seq)、グローバルランオン配列決定(GRO-Seq)、リボソームプロファイリング配列決定(Ribo-Seq)/ARTseq(商標)、RNA免疫沈降配列決定(RIP-Seq)、CLIP cDNAライブラリーのハイスループット配列決定(HITS-CLIP)、架橋および免疫沈降配列決定(CLIP-Seq)、光活性化可能リボヌクレオシドが増強する架橋および免疫沈降(PAR-CLIP)、個々のヌクレオチドの解像度のCLIP(iCLIP)、ネイティブ伸長転写物配列決定(NET-Seq)、ポリソームmRNAの標的精製(TRAP-Seq)、ハイブリッドの架橋、ライゲーションおよび配列決定(CLASH-Seq)、RNAエンド配列決定のパラレル分析(PARE-Seq)、非キャップ転写物のゲノムワイドマッピング(GMUCT)、転写物アイソフォーム配列決定(TIF-Seq)、TSSのペアエンド分析(PEAT)、ならびにそれらの任意の組合せのいずれか1つを含むことができる。一部の場合では、配列決定は、RNA構造を含むことができる。RNA構造の配列決定は、プライマー伸長配列決定によって分析される選択的2’-ヒドロキシルアシル化(SHAPE-Seq)、RNA構造のパラレル分析(PARS-Seq)、断片化配列決定(FRAG-Seq)、CXXCアフィニティー精製配列決定(CAP-Seq)、アルカリホスファターゼ、仔ウシ腸-タバコ酸ピロホスファターゼ配列決定(CIP-TAP)、イノシン化学的消去配列決定(ICE)、m6A-特異的メチル化RNA免疫沈降配列決定(MeRIP-Seq)、およびそれらの任意の組合せのいずれか1つを含むことができる。一部の場合では、配列決定は、低レベルRNA検出を含むことができる。低レベルRNA検出は、デジタルRNA配列決定、単一細胞についての全転写物増幅(Quartz-Seq)、設計プライマーに基づくRNA配列決定(DP-Seq)、RNA鋳型の5’末端でのスイッチ機構(Smart-Seq)、RNA鋳型の5’末端でのスイッチ機構バージョン2(Smart-Seq2)、固有分子識別子(UMI)、線形増幅配列決定による細胞発現(CEL-Seq)、単一細胞タグ化逆転写配列決定(STRT-Seq)、およびそれらの任意の組合せを含むことができる。一部の場合では、配列決定は、DNAの配列決定であり得る。DNA配列決定は、低レベルDNA検出を含むことができる。低レベルDNA検出を含むDNA配列決定は、単一分子の分子反転プローブ(smMIP)、多置換増幅(MDA)、多重アニーリングおよびルーピングに基づく増幅サイクル(MALBAC)、オリゴヌクレオチド選択的配列決定(OS-Seq)、デュプレックス配列決定(Duplex-Seq)、およびそれらの任意の組合せの少なくとも1つを含むことができる。一部の態様では、配列決定は、DNAメチル化を含むことができる。DNAメチル化は、亜硫酸水素塩配列決定(BS-Seq)、ポスト亜硫酸水素塩アダプタータグ付け(PBAT)、タグメンテーションに基づく全ゲノム亜硫酸水素塩配列決定(T-WGBS)、酸化的亜硫酸水素塩配列決定(oxBS-Seq)、Tet支援亜硫酸水素塩配列決定(TAB-Seq)、メチル化DNA免疫沈降配列決定(MeDIP-Seq)、メチル化捕捉(MethylCap)配列決定、メチル結合ドメイン捕捉(MBDCap)配列決定、還元提示亜硫酸水素塩配列決定(RRBS-Seq)、およびそれらの組合せの少なくとも1つを含むことができる。一部の場合では、配列決定は、DNA-タンパク質相互作用を含むことができる。例えば、DNA-タンパク質相互作用を含む配列決定は、DNアーゼl超感受性部位配列決定(DNase-Seq)、ヌクレオソーム配列決定のMNアーゼ支援単離(MAINE-Seq)、クロマチン免疫沈降配列決定(ChIP-Seq)、調節エレメントのホルムアルデヒド支援単離(FAIRE-Seq)、トランスポザーゼ-アクセス可能なクロマチン配列決定のためのアッセイ(ATAC-Seq)、ペアエンドタグ配列決定によるクロマチン相互作用分析(ChIA-PET)、クロマチンコンフォメーション捕捉(Hi-C/3C-Seq)、環状クロマチンコンフォメーション捕捉(4-Cまたは4C-Seq)、クロマチンコンフォメーション捕捉カーボンコピー(5-C)、およびそれらの組合せを含むことができる。一部の場合では、配列決定は、再編成を含むことができる。配列再編成の配列決定は、レトロトランスポゾン捕捉配列決定(RC-Seq)、トランスポゾン配列決定(Tn-Seq)または挿入配列決定(INSeq)、転位捕捉配列決定(TC-Seq)、およびそれらの組合せの少なくとも1つを含むことができる。
【0084】
配列決定分析は、例えば、16SリボソームRNA遺伝子のサブセクションのPCR増幅、およびディープシークエンシングを使用する非標的メタゲノミクス法を含むことができる。一部の実施形態では、方法は、次世代の増幅のためのプロセスを含むことができ、配列決定は、同時に、微生物のそれぞれのセットについての全16S領域を増幅すること、微生物のそれぞれのセットについての全16S領域のアンプリコンを断片化して、アンプリコン断片のセットを生成すること、およびアンプリコン断片のセットに基づいて分析を生成することを含むことができ、ここで、分析は、微生物集団の特性、微生物種の特定、および特定された標的微生物配列の少なくとも1つを含む。一部の場合では、全エクソーム配列決定を利用することができる。
【0085】
一部の場合では、方法は、非ヒトゲノムの遺伝子レベルでの整列を含むことができる。例えば、整列は、18S配列に関して、ITS配列に関してなどで、16S配列を整列させることを含むことができる。したがって、出力は、生体試料の微生物の特性を明らかにするために使用することができる目的の特徴を特定するために使用することができ、ここで、特徴は、非ヒトの(例えば、細菌の属の存在)、遺伝子に基づき(例えば、特定の遺伝子領域および/または配列の提示に基づく)、および/または任意の他の適切なスケールに基づくことができる。
【0086】
変形では、参照の非ヒトゲノム、例えば、細菌のゲノム(例えば、全米バイオテクノロジー情報センターによって提供される)に対する整列およびマッピングは、グローバル整列のスコア化(例えば、挿入、欠失、マッチ、ミスマッチの観点)に基づく停止条件を用いる、2つの読み取りデータ(例えば、配列読み取りデータおよび参照読み取りデータ)のグローバル整列を行うNeedleman-Wunschアルゴリズム;ローカル整列のスコア化(例えば、挿入、欠失、マッチ、ミスマッチの観点)を用いる、2つの読み取りデータ(例えば、配列読み取りデータおよび参照読み取りデータ)のローカル整列を行うSmith-watermanアルゴリズム;配列の間(例えば、配列読み取りデータおよび参照読み取りデータ)のローカル類似の領域を特定する基本的なローカル整列検索ツール(BLAST);FPGA加速整列ツール;BWAツールを用いるBWTインデックス化;SOAPツールを用いるBWTインデックス化;Bowtieツールを用いるBWTインデックス化;ワードハッシュ法およびダイナミックプログラミングを使用する、ゲノム参照配列に対して核酸配列読み取りデータをマップ化するHashingアルゴリズムによる配列検索および整列(SSAHA2);ならびに任意の他の適切な整列アルゴリズムの1つまたは複数を含む、整列アルゴリズムを使用して行うことができる。未同定配列のマッピングは、個体のマイクロバイオームのウイルスおよび/または真菌成分をさらに特定するために、参照のウイルスゲノムおよび/または真菌ゲノムへのマッピングをさらに含むことができる。例えば、PCRは、並行して、または順次、複数のマーカー(例えば、第1のマーカー、第2のマーカー、第3のマーカー、第Nのマーカー)を用いて行うことができ、細菌マーカー、真菌マーカーおよび真核生物マーカーの1つまたは複数と関連することができる。さらにまた、重複した読み取りデータ(例えば、ペアエンド配列決定によって生成される)は、整列アルゴリズムの出力に基づいて構築することができ、または、整列した配列読み取りデータは、参照配列とマージすることができる(例えば、隠れMarkovモデルのバンド形成手法を使用する、Durbin-Holmes手法を使用する)。しかしながら、整列およびマッピングは、任意の他の適切なアルゴリズムまたは手法を実行することができる。一部の場合では、配列読み取りデータは、コード化して、行われる整列およびマッピング操作を促進することができる。一例では、配列のそれぞれの塩基は、配置0000TGCAに従ってバイトとしてコード化することができ、それにより、最下位ビットは、塩基が、おそらく塩基Aを含有するとして配列決定される場合、1であり(例えば、Aは00000001として表される)、次の有効ビットは、塩基が、おそらく塩基Cを含有するとして配列決定される場合、1であり(例えば、Cは00000010として表される)、次の有効ビットは、塩基が、おそらく塩基Gを含有するとして配列決定される場合、1であり(例えば、Gは00000100として表される)、次の有効ビットは、塩基が、おそらく塩基Tを含有するとして配列決定される場合、1である(例えば、Tは00001000として表される)。例では、4つの最上位ビットは、ゼロに設定される。しかしながら、この例の代替の変形は、任意の他の適切な方法で塩基をコード化することができる。さらにまた、増幅の間に使用されるプライマーの所定の配列を使用して、配列読み取りデータを整えて、プライマー配列を除外して、整列およびマッピングの効率を増加させることができる。
【0087】
核酸分子のサブセットは、本明細書に開示される1つまたは複数のゲノムを含んでいてもよい。核酸分子のサブセットは、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、11もしくはそれよりも多く、12もしくはそれよりも多く、13もしくはそれよりも多く、14もしくはそれよりも多く、15もしくはそれよりも多く、20もしくはそれよりも多く、25もしくはそれよりも多く、30もしくはそれよりも多く、35もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、または100もしくはそれよりも多くのゲノムを含んでいてもよい。1つまたは複数のゲノムは、同一であってもよく、類似であってもよく、異なっていてもよく、またはそれらの組合せであってもよい。一部の場合では、核酸の2つのサブセットが存在する(
図6A)。
【0088】
核酸分子のサブセットは、本明細書に開示される1つまたは複数のゲノムの特徴を含んでいてもよい。核酸分子のサブセットは、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、11もしくはそれよりも多く、12もしくはそれよりも多く、13もしくはそれよりも多く、14もしくはそれよりも多く、15もしくはそれよりも多く、20もしくはそれよりも多く、25もしくはそれよりも多く、30もしくはそれよりも多く、35もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、または100もしくはそれよりも多くのゲノムの特徴を含んでいてもよい。1つまたは複数のゲノムの特徴は、同一であってもよく、類似であってもよく、異なっていてもよく、またはそれらの組合せであってもよい。
【0089】
核酸分子のサブセットは、異なるサイズの核酸分子を含んでいてもよい。核酸分子のサブセット中の核酸分子の長さは、核酸分子のサイズと称される場合がある。核酸分子のサブセット中の核酸分子の平均長さは、核酸分子の平均サイズと称される場合がある。本明細書で使用される場合、「核酸分子のサイズ」、「核酸分子の平均サイズ」、「分子サイズ」および「平均分子サイズ」という用語は、互換可能に使用され得る。核酸分子のサイズは、核酸分子の2つまたはそれよりも多くのサブセットを区別するために使用され得る。核酸分子のサブセット中の核酸分子の平均サイズ、および核酸分子の別のサブセット中の核酸分子の平均サイズにおける相違は、核酸分子の2つのサブセットを区別するために使用され得る。核酸分子の1つのサブセット中の核酸分子の平均サイズは、核酸分子の少なくとも1つの他のサブセット中の核酸分子の平均サイズよりも大きくてもよい。核酸分子の1つのサブセット中の核酸分子の平均サイズは、核酸分子の少なくとも1つの他のサブセット中の核酸分子の平均サイズよりも小さくてもよい。核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子サイズにおける相違は、少なくとも約50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000、またはそれよりも多くの塩基または塩基対であり得る。本開示の一部の態様では、核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子サイズにおける相違は、少なくとも約200塩基または塩基対である。あるいは、核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子サイズにおける相違は、少なくとも約300塩基または塩基対である。
【0090】
核酸分子のサブセットは、異なる配列決定サイズの核酸分子を含んでいてもよい。配列決定される核酸分子のサブセット中の核酸分子の長さは、核酸分子の配列決定サイズと称される場合がある。核酸分子のサブセット中の核酸分子の平均長さは、核酸分子の平均配列決定サイズと称される場合がある。本明細書で使用される場合、「核酸分子の配列決定サイズ」、「核酸分子の平均配列決定サイズ」、「分子配列決定サイズ」および「平均分子配列決定サイズ」という用語は、互換可能に使用され得る。核酸分子の1つまたは複数のサブセットの平均分子配列決定サイズは、少なくとも約50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000、またはそれよりも多くの塩基または塩基対であり得る。核酸分子の配列決定サイズは、核酸分子の2つまたはそれよりも多くのサブセットを区別するために使用され得る。核酸分子のサブセット中の核酸分子の平均配列決定サイズ、および核酸分子の別のサブセット中の核酸分子の平均配列決定サイズにおける相違は、核酸分子の2つのサブセットを区別するために使用され得る。核酸分子の1つのサブセット中の核酸分子の平均配列決定サイズは、核酸分子の少なくとも1つの他のサブセット中の核酸分子の平均配列決定サイズよりも大きくてもよい。核酸分子の1つのサブセット中の核酸分子の平均配列決定サイズは、核酸分子の少なくとも1つの他のサブセット中の核酸分子の平均配列決定サイズよりも小さくてもよい。核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子配列決定サイズにおける相違は、少なくとも約50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000、またはそれよりも多くの塩基または塩基対であり得る。本開示の一部の態様では、核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子配列決定サイズにおける相違は、少なくとも約200塩基または塩基対である。あるいは、核酸分子の2つまたはそれよりも多くのサブセットの間の平均分子配列決定サイズにおける相違は、少なくとも約300塩基または塩基対である。
【0091】
本明細書に開示される方法は、1つもしくは複数の捕捉用プローブ、複数の捕捉用プローブ、または1つもしくは複数の捕捉用プローブセットを含んでいてもよい。典型的には、捕捉用プローブは、核酸結合部位を含む。捕捉用プローブは、捕捉された核酸とハイブリダイズしてもよい。捕捉用プローブは、捕捉された核酸と相補的である核酸配列を含んでいてもよい。一部の場合では、捕捉用プローブは、捕捉された核酸の部分と完全に相補的である核酸配列を含んでいてもよい。例えば、捕捉用プローブ中のそれぞれの核酸は、捕捉された核酸中の塩基と相補的であってもよい。捕捉用プローブは、捕捉用核酸より長くてもよい。例えば、捕捉された核酸中のそれぞれの塩基は、捕捉用プローブ中の塩基と相補的であってもよいが、捕捉用プローブ中のすべての塩基が、捕捉された核酸中の塩基と相補的であるわけではない。捕捉用プローブは、捕捉された核酸よりも短くてもよい。例えば、捕捉用プローブ中のそれぞれの塩基は、捕捉された核酸の塩基と相補的であってもよいが、捕捉された核酸中のすべての塩基が、捕捉用プローブと相補的でなくてもよい。
【0092】
捕捉用プローブは、溶液中で捕捉反応を行ってもよい。捕捉用プローブは、溶液中にあってもよく、溶液中の核酸を捕捉してもよい。捕捉された核酸は、その後、本明細書の他の場所で記載されるようにして、単離および/または溶出させてもよい。捕捉用プローブは、溶液中で核酸を捕捉してもよく、次いで、捕捉用プローブは、その後、固体支持体(例えば、アレイまたはビーズ)などの支持体に付着されてもよい。一部の状況では、支持体は、半固体物質(例えば、ゲル)の形態であり得る。
【0093】
支持体への付着は、非共有結合的な付着であってもよい。例えば、核酸は、ビオチン化プローブによって捕捉されてもよく、これは、その後、アビジン/ストレプトアビジンビーズに結合し、それによって、捕捉された核酸複合体は、アビジン/ストレプトアビジンビーズに付着する。他の結合のペアを使用して、捕捉用プローブを表面に付着させてもよい。捕捉用プローブは、支持体に共有結合的に付着させることができる。例えば、支持体は、捕捉用プローブが支持体に共有結合的に連結されるように、捕捉用プローブと反応し得る化学反応性リンカーを有していてもよい。
【0094】
捕捉用プローブは、支持体に付着されてもよく、捕捉反応を行ってもよい。例えば、捕捉用プローブは、支持体とカップリングしてもよく、その後、核酸分子を捕捉してもよい。支持体は、固体または半固体(例えば、ゲル)の物質であり得る。支持体の例としては、限定されないが、ビーズ、スライドおよびチップが挙げられる。支持体は、例えば、ガラス、シリカ、ケイ素、プラスチック(ポリスチレンなど)、寒天またはアガロースであり得る。
【0095】
捕捉用プローブは、1つまたは複数のリンカーをさらに含んでいてもよい。捕捉用プローブは、1つまたは複数の標識をさらに含んでいてもよい。1つまたは複数のリンカーは、1つまたは複数の標識を核酸結合部位に付着してもよい。一部の場合では、捕捉用プローブは、16S遺伝子配列の共有領域とハイブリダイズするように設計されてもよい。16S遺伝子配列の共有領域を標的にするように設計され得る捕捉用プローブは、未だに特定および特性が明らかにされていない種でさえも、幅広い種類の種由来の核酸分子を捕捉するために、使用することができる。一部の場合では、方法は、ヒトゲノム配列のエレメントを標的にするように構成された第1の複数の核酸プローブを含むことができる。一部の場合では、方法は、非ヒト種のゲノム配列由来のエレメントを標的にするように構成された第2の複数の核酸プローブを含むことができる。
【0096】
本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、1000もしくはそれよりも多く、5000もしくはそれよりも多く、10,000もしくはそれよりも多く、20,000もしくはそれよりも多く、30,000もしくはそれよりも多く、40,000もしくはそれよりも多く、50,000もしくはそれよりも多く、60,000もしくはそれよりも多く、70,000もしくはそれよりも多く、80,000もしくはそれよりも多く、90,000もしくはそれよりも多く、100,0000もしくはそれよりも多くの捕捉用プローブまたは捕捉用プローブセットを含んでいてもよい。一部の場合では、方法は、約50,000の捕捉用プローブを含むことができる。1つまたは複数の捕捉用プローブまたは捕捉用プローブセットは、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。1つまたは複数の捕捉用プローブまたは捕捉用プローブセットは、他の捕捉用プローブと比較して、種々の相対濃度であり得る。例えば、一部の捕捉用プローブは、捕捉するのが困難であり得る核酸(例えば、高GC含量を有する配列、配列組換えの結果である配列、多くの数の突然変異を有する配列、高い突然変異比率を有する配列)を捕捉するために、より高い濃度であり得、それによって、特定の核酸を捕捉する可能性を増加させ得る。
【0097】
1つまたは複数の捕捉用プローブは、試料中の1つもしくは複数の核酸分子またはそれらの変異体もしくは誘導体、あるいは核酸分子のサブセットの少なくとも一部とハイブリダイズする、核酸結合部位を含んでいてもよい。捕捉用プローブは、1つまたは複数のゲノムとハイブリダイズする核酸結合部位を含んでいてもよい。捕捉用プローブは、異なるか、類似するか、および/または同一のゲノムとハイブリダイズしてもよい。1つまたは複数の捕捉用プローブは、1つもしくは複数の核酸分子またはそれらの変異体もしくは誘導体に対して、少なくとも約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%、またはそれよりも高い相補性であってもよい。
【0098】
捕捉用プローブは、1つまたは複数のヌクレオチドを含んでいてもよい。捕捉用プローブは、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くのヌクレオチドを含んでいてもよい。捕捉用プローブは、約100のヌクレオチドを含んでいてもよい。捕捉用プローブは、約10~約500の間のヌクレオチド、約20~約450の間のヌクレオチド、約30~約400の間のヌクレオチド、約40~約350の間のヌクレオチド、約50~約300の間のヌクレオチド、約60~約250の間のヌクレオチド、約70~約200ヌクレオチド、または約80~約150の間のヌクレオチドを含んでいてもよい。本開示の一部の態様では、捕捉用プローブは、約80のヌクレオチド~約100のヌクレオチドの間を含む。
【0099】
複数の捕捉用プローブまたは捕捉用プローブセットは、同一であるか、類似であるか、および/または異なる核酸結合部位配列、リンカーおよび/または標識を有する2つまたはそれよりも多くの捕捉用プローブを含んでいてもよい。例えば、2つまたはそれよりも多くの捕捉用プローブは、同一の核酸結合部位を含む。別の例では、2つまたはそれよりも多くの捕捉用プローブは、類似の核酸結合部位を含む。さらに別の例では、2つまたはそれよりも多くの捕捉用プローブは、異なる核酸結合部位を含む。2つまたはそれよりも多くの捕捉用プローブは、1つまたは複数のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、異なるリンカーをさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、類似のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、同一のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、1つまたは複数の標識をさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、異なる標識をさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、類似の標識をさらに含んでいてもよい。2つまたはそれよりも多くの捕捉用プローブは、同一の標識をさらに含んでいてもよい。
【0100】
アッセイとしては、限定されるものではないが、1つまたは複数の核酸分子の、配列決定、増幅、ハイブリダイゼーション、濃縮、単離、溶出、断片化、検出、定量化を挙げることができる。アッセイは、1つまたは複数の核酸分子を調製するための方法を含んでいてもよい。アッセイは、従来のアッセイ、長い読み取りデータ、高GC含量、およびハイブリダイゼーションアッセイを含んでいてもよい(
図9)。任意の数のアッセイを行ってもよい。アッセイの数は、1、2、3、4、5、6、7、8、9、または最大で10のアッセイであり得る。例えば、
図6Bは、2つのアッセイの利用を示す概略図を図示する。同様に、1つまたは複数のアッセイからのデータの任意の数の分析を行ってもよい。分析の数は、1つまたは複数のアッセイからのデータの1、2、3、4、5、6、7、8、9、または最大で10の分析であり得る。例えば、
図6Cは、行われる2つの異なる分析を図示する。一部の場合では、分析は、バイオインフォマティクス分析である(
図8)。アッセイは、任意の数のプロトコールを使用して行ってもよい。例えば、1、2、3、4、5、6、7、8、9、または最大で10のプロトコールを利用してもよい。
図6Dは、4つのプロトコールを利用する概略図を提供する。
【0101】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の配列決定反応を実施することを含んでいてもよい。本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、15もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、200もしくはそれよりも多く、300もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くの配列決定反応を実施することを含んでいてもよい。配列決定反応は、同時、連続して、またはそれらの組合せで行ってもよい。配列決定反応は、全ゲノム配列決定またはエクソーム配列決定を含んでいてもよい。配列決定反応は、Maxim-Gilbert、連鎖停止、またはハイスループットシステムを含んでいてもよい。代わりに、または加えて、配列決定反応は、Helioscope(商標)単一分子配列決定、ナノポアDNA配列決定、Lynx Therapeutics’ Massively Parallel Signature配列決定(MPSS)、454パイロシークエンシング、単一分子リアルタイム(RNAP)配列決定、Illumina(Solexa)配列決定、SOLiD配列決定、Ion Torrent(商標)、イオン半導体配列決定、単一分子SMRT(TM)配列決定、Polony配列決定、DNAナノボール配列決定、VisiGen生物工学アプローチ、またはそれらの組合せを含んでいてもよい。代わりに、または加えて、配列決定反応は、限定されるものではないが、Illuminaによって提供されるGenome Analyzer IIx、HiSeq、およびMiSeq、Pacific Biosciences(California)によって提供されるPacBio RSシステムおよびSolexaシーケンサーなどの単一分子リアルタイム(SMRT(商標))技術、Helicos Inc.(Cambridge、MA)によって提供されるHeliScope(商標)シーケンサーなどのTrue単一分子配列決定(tSMS(商標))技術を含む、1つまたは複数の配列決定プラットフォームを含むことができる。配列決定反応はまた、電子顕微鏡法または化学的高感度電界効果トランジスタ(chemFET)アレイを含んでいてもよい。本開示の一部の態様では、配列決定反応は、キャピラリー配列決定、次世代配列決定、サンガー配列決定、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、単一分子配列決定、またはそれらの組合せを含む。合成による配列決定は、可逆的ターミネーター配列決定、プログレッシブ単一分子配列決定、シーケンシャルフロー配列決定、またはそれらの組合せを含んでいてもよい。シーケンシャルフロー配列決定は、パイロシークエンシング、pH媒介配列決定、半導体配列決定、またはそれらの組合せを含んでいてもよい。
【0102】
本明細書に開示される方法は、少なくとも1つの長読み取りデータの配列決定反応および少なくとも1つの短読み取りデータの配列決定反応を実施することを含んでいてもよい。長読み取りデータおよび短読み取りデータの配列決定を含む方法の例を
図18に図示する。長読み取りデータの配列決定反応および/または短読み取りデータの配列決定反応は、核酸分子のサブセットの少なくとも一部において実施してもよい。長読み取りデータの配列決定反応および/または短読み取りデータの配列決定反応は、核酸分子の2つまたはそれよりも多くのサブセットの少なくとも一部において実施してもよい。長読み取りデータの配列決定反応および短読み取りデータの配列決定反応は両方とも、核酸分子の1つまたは複数のサブセットの少なくとも一部において実施してもよい。
【0103】
1つまたは複数の核酸分子またはそのサブセットの配列決定は、少なくとも約5;10;15;20;25;30;35;40;45;50;60;70;80;90;100;200;300;400;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;25,000;50,000;75,000;100,000;250,000;500,000;750,000;10,000,000;25,000,000;50,000,000;100,000,000;250,000,000;500,000,000;750,000,000;1,000,000,000またはそれよりも多くの配列読み取りデータを含んでいてもよい。
【0104】
配列決定反応は、1つまたは複数の核酸分子の少なくとも約50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300;325;350;375;400;425;450;475;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000またはそれよりも多くの塩基または塩基対の配列決定を含んでいてもよい。配列決定反応は、1つまたは複数の核酸分子の少なくとも約50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300;325;350;375;400;425;450;475;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000またはそれよりも多くの連続した塩基または塩基対の配列決定を含んでいてもよい。
【0105】
本開示の方法において使用される配列決定手法は、ランあたり少なくとも100の読み取りデータ、ランあたり少なくとも200の読み取りデータ、ランあたり少なくとも300の読み取りデータ、ランあたり少なくとも400の読み取りデータ、ランあたり少なくとも500の読み取りデータ、ランあたり少なくとも600の読み取りデータ、ランあたり少なくとも700の読み取りデータ、ランあたり少なくとも800の読み取りデータ、ランあたり少なくとも900の読み取りデータ、ランあたり少なくとも1000の読み取りデータ、ランあたり少なくとも5,000の読み取りデータ、ランあたり少なくとも10,000の読み取りデータ、ランあたり少なくとも50,000の読み取りデータ、ランあたり少なくとも100,000の読み取りデータ、ランあたり少なくとも500,000の読み取りデータ、またはランあたり少なくとも1,000,000の読み取りデータを生成してもよい。あるいは、本開示の方法において使用される配列決定手法は、ランあたり少なくとも1,500,000の読み取りデータ、ランあたり少なくとも2,000,000の読み取りデータ、ランあたり少なくとも2,500,000の読み取りデータ、ランあたり少なくとも3,000,000の読み取りデータ、ランあたり少なくとも3,500,000の読み取りデータ、ランあたり少なくとも4,000,000の読み取りデータ、ランあたり少なくとも4,500,000の読み取りデータ、またはランあたり少なくとも5,000,000の読み取りデータを生成してもよい。
【0106】
本開示の方法において使用される配列決定手法は、読み取りデータあたり、少なくとも約30の塩基対、少なくとも約40の塩基対、少なくとも約50の塩基対、少なくとも約60の塩基対、少なくとも約70の塩基対、少なくとも約80の塩基対、少なくとも約90の塩基対、少なくとも約100の塩基対、少なくとも約110塩基対、少なくとも約120の塩基対、少なくとも約150の塩基対、少なくとも約200の塩基対、少なくとも約250の塩基対、少なくとも約300の塩基対、少なくとも約350の塩基対、少なくとも約400の塩基対、少なくとも約450の塩基対、少なくとも約500の塩基対、少なくとも約550の塩基対、少なくとも約600の塩基対、少なくとも約700の塩基対、少なくとも約800の塩基対、少なくとも約900の塩基対、または少なくとも約1,000の塩基対を生成してもよい。あるいは、本開示の方法において使用される配列決定手法は、長い配列読み取りデータを生成し得る。一部の例では、本開示の方法において使用される配列決定手法は、読み取りデータあたり少なくとも約1,200の塩基対、読み取りデータあたり少なくとも約1,500の塩基対、読み取りデータあたり少なくとも約1,800の塩基対、読み取りデータあたり少なくとも約2,000の塩基対、読み取りデータあたり少なくとも約2,500の塩基対、読み取りデータあたり少なくとも約3,000の塩基対、読み取りデータあたり少なくとも約3,500の塩基対、読み取りデータあたり少なくとも約4,000の塩基対、読み取りデータあたり少なくとも約4,500の塩基対、読み取りデータあたり少なくとも約5,000の塩基対、読み取りデータあたり少なくとも約6,000の塩基対、読み取りデータあたり少なくとも約7,000の塩基対、読み取りデータあたり少なくとも約8,000の塩基対、読み取りデータあたり少なくとも約9,000の塩基対、読み取りデータあたり少なくとも約10,000の塩基対、読み取りデータあたり20,000の塩基対、読み取りデータあたり30,000の塩基対、読み取りデータあたり40,000の塩基対、読み取りデータあたり50,000の塩基対、読み取りデータあたり60,000の塩基対、読み取りデータあたり70,000の塩基対、読み取りデータあたり80,000の塩基対、読み取りデータあたり90,000の塩基対、または読み取りデータあたり100,000の塩基対を生成してもよい。
【0107】
ハイスループット配列決定システムは、成長する鎖に組み込まれた直後または組み込まれるときに、配列決定されるヌクレオチドの検出、すなわち、リアルタイムまたは実質的にリアルタイムで配列の検出を可能にし得る。一部の場合では、ハイスループット配列決定は、1時間あたり、少なくとも1,000、少なくとも5,000、少なくとも10,000、少なくとも20,000、少なくとも30,000、少なくとも40,000、少なくとも50,000、少なくとも100,000、または少なくとも500,000の配列読み取りデータを生成し、それぞれの読み取りデータは、読み取りデータあたり、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも120、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも450、または少なくとも500の塩基である。配列決定は、ゲノムDNA、RNA転写物に由来するcDNA、または鋳型としてのRNAなどの本明細書に記載の核酸を使用して行うことができる。
【0108】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の増幅反応を実施することを含んでいてもよい。「増幅」という用語は、核酸分子の少なくとも1つのコピーを生成する任意のプロセスを指す。「アプリコン」および「増幅された核酸分子」という用語は、核酸分子のコピーを指し、互換可能に使用することができる。増幅反応は、PCRに基づく方法、PCRに基づかない方法、またはそれらの組合せを含むことができる。PCRに基づかない方法の例としては、限定されるものではないが、多重置換増幅(MDA)、転写媒介増幅(TMA)、核酸配列に基づく増幅(NASBA)、ストランド置換増幅(SDA)、リアルタイムSDA、ローリングサークル増幅、またはサークル-サークル増幅が挙げられる。PCR系の方法としては、限定されるものではないが、PCR、HD-PCR、Next Gen PCR、デジタルRTA、またはそれらの任意の組合せが挙げられ得る。追加のPCR法としては、限定されるものではないが、線形増幅、対立遺伝子特異的PCR、Alu PCR、アセンブリPCR、非対称PCR、ドロップレットPCR、エマルジョンPCR、ヘリカーゼ依存性増幅HDA、ホットスタートPCR、インバースPCR、指数関数後線形(LATE)-PCR、ロングPCR、マルチプレックスPCR、ネステッドPCR、半ネステッドPCR、定量的PCR、RT-PCR、リアルタイムPCR、単一細胞PCR、およびタッチダウンPCRが挙げられる。
【0109】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数のハイブリダイゼーション反応を実施することを含んでいてもよい。ハイブリダイゼーション反応は、1つまたは複数の捕捉用プローブの、試料中の1つもしくは複数の核酸分子または核酸分子のサブセットとのハイブリダイゼーションを含んでいてもよい。ハイブリダイゼーション反応は、1つまたは複数の捕捉用プローブセットを、試料中の1つもしくは複数の核酸分子または核酸分子のサブセットとハイブリダイズすることを含んでいてもよい。ハイブリダイゼーション反応は、1つもしくは複数のハイブリダイゼーションアレイ、マルチプレックスハイブリダイゼーション反応、ハイブリダイゼーション連鎖反応、等温ハイブリダイゼーション反応、核酸ハイブリダイゼーション反応、またはそれらの組合せを含んでいてもよい。1つまたは複数のハイブリダイゼーションアレイは、ハイブリダイゼーションアレイジェノタイピング、ハイブリダイゼーションアレイ比例センシング、DNAハイブリダイゼーションアレイ、マクロアレイ、マイクロアレイ、高密度オリゴヌクレオチドアレイ、ゲノムハイブリダイゼーションアレイ、比較ハイブリダイゼーションアレイ、またはそれらの組合せを含んでいてもよい。ハイブリダイゼーション反応は、1つもしくは複数の捕捉用プローブ、1つもしくは複数のビーズ、1つもしくは複数の標識、核酸分子の1つもしくは複数のサブセット、1つもしくは複数の核酸試料、1つもしくは複数の試薬、1つもしくは複数の洗浄緩衝液、1つもしくは複数の溶出緩衝液、1つもしくは複数のハイブリダイゼーション緩衝液、1つもしくは複数のハイブリダイゼーションチャンバー、1つもしくは複数のインキュベーター、1つもしくは複数の分離器、またはそれらの組合せを含んでいてもよい。
【0110】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の濃縮反応を実施することを含んでいてもよい。濃縮反応は、試料を1つまたは複数のビーズまたはビーズセットと接触させることを含んでいてもよい。濃縮反応は、1つまたは複数のゲノムの特徴に基づく、核酸分子の2つまたはそれよりも多くのサブセットの差次的増幅を含んでいてもよい。例えば、濃縮反応は、GC含量に基づく、核酸分子の2つまたはそれよりも多くのサブセットの差次的増幅を含む。代わりに、または加えて、濃縮反応は、メチル化状態に基づく、核酸分子の2つまたはそれよりも多くのサブセットの差次的増幅を含む。濃縮反応は、1つまたは複数のハイブリダイゼーション反応を含んでいてもよい。濃縮反応は、1つもしくは複数のハイブリダイズされた核酸分子、1つもしくは複数のビーズ結合核酸分子、1つもしくは複数の遊離核酸分子(例えば、捕捉用プローブを含まない核酸分子、ビーズを含まない核酸分子)、1つもしくは複数の標識化核酸分子、1つもしくは複数の非標識化核酸分子、1つもしくは複数のアンプリコン、1つもしくは複数の非増幅核酸分子、またはそれらの組合せの単離および/または精製をさらに含んでいてもよい。代わりに、または加えて、濃縮反応は、試料中の1つまたは複数の細胞型について濃縮することを含んでいてもよい。1つまたは複数の細胞型は、フローサイトメトリーによって濃縮されてもよい。
【0111】
1つまたは複数の濃縮反応は、1つまたは複数の濃縮された核酸分子を生成し得る。濃縮された核酸分子は、核酸分子、またはその変異体もしくは誘導体を含んでいてもよい。例えば、濃縮された核酸分子は、1つもしくは複数のハイブリダイズされた核酸分子、1つもしくは複数のビーズ結合核酸分子、1つもしくは複数の遊離核酸分子(例えば、捕捉用プローブを含まない核酸分子、ビーズを含まない核酸分子)、1つもしくは複数の標識化核酸分子、1つもしくは複数の非標識化核酸分子、1つもしくは複数のアンプリコン、1つもしくは複数の非増幅核酸分子、またはそれらの組合せを含む。濃縮された核酸分子は、GC含量、分子サイズ、ゲノム、ゲノムの特徴、またはそれらの組合せによって、濃縮されていない核酸分子から区別されてもよい。濃縮された核酸分子は、1つもしくは複数のアッセイ、上清、溶出液、またはそれらの組合せに由来していてもよい。濃縮された核酸分子は、平均サイズ、平均GC含量、ゲノム、またはそれらの組合せによって、濃縮されていない核酸分子と異なっていてもよい。一部の場合では、濃縮は、異なるゲノム領域について濃縮されたDNAの複数のサブセットを含んでいてもよく、配列決定アッセイのために組み合わされる前に、独立した処理操作を受ける(
図15)。一部の場合では、濃縮は、異なるゲノム領域について濃縮されたDNAの複数のサブセットを含んでいてもよく、独立して配列決定および分析される前に、独立した処理操作を受ける(
図16)。
【0112】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の単離または精製反応を実施することを含んでいてもよい。単離または精製反応は、試料を1つまたは複数のビーズまたはビーズセットと接触させることを含んでいてもよい。単離または精製反応は、1つもしくは複数のハイブリダイゼーション反応、濃縮反応、増幅反応、配列決定反応、またはそれらの組合せを含んでいてもよい。単離または精製反応は、1つまたは複数の分離器の使用を含んでいてもよい。1つまたは複数の分離器は、磁気分離器を含んでいてもよい。単離または精製反応は、ビーズを含まない核酸分子から、ビーズに結合した核酸分子を分離することを含んでいてもよい。単離または精製反応は、捕捉用プローブを含まない核酸分子から、捕捉用プローブとハイブリダイズした核酸分子を分離することを含んでいてもよい。単離または精製反応は、核酸分子の第2のサブセットから核酸分子の第1のサブセットを分離することを含んでいてもよく、核酸分子の第1のサブセットは、平均サイズ、平均GC含量、ゲノム、またはそれらの組合せによって、核酸分子における第2のサブセットと異なる。
【0113】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の溶出反応を実施することを含んでいてもよい。溶出反応は、試料を1つまたは複数のビーズまたはビーズセットと接触させることを含んでいてもよい。溶出反応は、ビーズを含まない核酸分子から、ビーズに結合した核酸分子を分離することを含んでいてもよい。溶出反応は、捕捉用プローブを含まない核酸分子から、捕捉用プローブとハイブリダイズした核酸分子を分離することを含んでいてもよい。溶出反応は、核酸分子の第2のサブセットから核酸分子の第1のサブセットを分離することを含んでいてもよく、核酸分子の第1のサブセットは、平均サイズ、平均GC含量、ゲノム、またはそれらの組合せによって、核酸分子における第2のサブセットと異なる。
【0114】
本明細書に開示される方法は、1つまたは複数の断片化反応を含んでいてもよい。断片化反応は、試料中の1つもしくは複数の核酸分子、または核酸分子のサブセットを断片化して、1つまたは複数の断片化核酸分子を生成することを含んでいてもよい。1つまたは複数の核酸分子は、超音波処理、ニードル剪断、噴霧、剪断(例えば、音響剪断、機械的剪断、ポイントシンク剪断)、フレンチ圧力セルの通過、または酵素消化によって、断片化されてもよい。酵素消化は、ヌクレアーゼ消化(例えば、小球菌ヌクレアーゼ消化、エンドヌクレアーゼ、エキソヌクレアーゼ、RNアーゼHまたはDNアーゼI)によって起こってもよい。1つまたは複数の核酸分子の断片化は、約100塩基対~約2000塩基対、約200塩基対~約1500塩基対、約200塩基対~約1000塩基対、約200塩基対~約500塩基対、約500塩基対~約1500塩基対、および約500塩基対~約1000塩基対のサイズの断片をもたらしてもよい。1つまたは複数の断片化反応は、約50塩基対~約1000塩基対のサイズの断片をもたらしてもよい。1つまたは複数の断片化反応は、約100塩基対、150塩基対、200塩基対、250塩基対、300塩基対、350塩基対、400塩基対、450塩基対、500塩基対、550塩基対、600塩基対、650塩基対、700塩基対、750塩基対、800塩基対、850塩基対、900塩基対、950塩基対、1000塩基対、またはそれよりも大きいサイズの断片をもたらしてもよい。
【0115】
1つまたは複数の核酸分子の断片化は、一定時間、試料中の1つまたは複数の核酸分子の機械的剪断を含んでいてもよい。断片化反応は、少なくとも約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500秒、またはそれよりも長く起こってもよい。
【0116】
1つまたは複数の核酸分子の断片化は、核酸試料を1つまたは複数のビーズと接触させることを含んでいてもよい。1つまたは複数の核酸分子の断片化は、核酸試料を複数のビーズと接触させることを含んでいてもよく、複数のビーズの体積の核酸試料の体積に対する比は、約0.10、0.20、0.30、0.40、0.50、0.60、0.70、0.80、0.90、1.00、1.10、1.20、1.30、1.40、1.50、1.60、1.70、1.80、1.90、2.00であるか、またはそれよりも大きい。1つまたは複数の核酸分子の断片化は、核酸試料を複数のビーズと接触させることを含んでいてもよく、複数のビーズの体積の核酸の体積に対する比は、約2.00、1.90、1.80、1.70、1.60、1.50、1.40、1.30、1.20、1.10、1.00、0.90、0.80、0.70、0.60、0.50、0.40、0.30、0.20、0.10、0.05、0.04、0.03、0.02、0.01であるか、またはそれよりも小さい。
【0117】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の検出反応を実施することを含んでいてもよい。検出反応は、1つまたは複数の配列決定反応を含んでいてもよい。あるいは、検出反応の実施は、光学的センシング、電気的センシング、またはそれらの組合せを含む。光学的センシングは、光ルミネセンス光子放出、蛍光光子放出、ピロホスフェート光子放出、化学ルミネセンス光子放出、またはそれらの組合せの光学的センシングを含んでいてもよい。電気的センシングは、イオン濃度、イオン電流変調、ヌクレオチド電界、ヌクレオチドトンネル電流、またはそれらの組合せの電気的センシングを含んでいてもよい。
【0118】
本明細書に開示される方法は、試料中の1つまたは複数の核酸分子における1つまたは複数の定量化反応を実施することを含んでいてもよい。定量化反応は、配列決定、PCR、qPCR、デジタルPCR、またはそれらの組合せを含んでいてもよい。
【0119】
本明細書に開示される方法は、1つまたは複数の試料を含んでいてもよい。本明細書に開示される方法は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、またはそれよりも多くの試料を含んでいてもよい。試料は、対象に由来していてもよい。2つまたはそれよりも多くの試料は、単一の対象に由来していてもよい。2つまたはそれよりも多くの試料は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、またはそれよりも多くの異なる対象に由来していてもよい。対象は、哺乳動物、爬虫類、両生類、鳥類および魚類であり得る。哺乳動物は、ヒト、類人猿、オランウータン、サル、チンパンジー、ウシ、ブタ、ウマ、げっ歯類、イヌ、ネコ、または他の動物であり得る。爬虫類は、トカゲ、ヘビ、アリゲータ、カメ(turtle)、クロコダイル、およびカメ(tortoise)であり得る。両生類は、ヒキガエル、カエル、イモリ、およびサンショウウオであり得る。鳥類の例としては、限定されるものではないが、アヒル、ガチョウ、ペンギン、ダチョウ、およびフクロウが挙げられる。魚類の例としては、限定されるものではないが、ナマズ、ウナギ、サメ、およびメカジキが挙げられる。対象はヒトであり得る。対象は、疾患または状態を患っていてもよい。
【0120】
2つまたはそれよりも多くの試料は、1、2、3、4、5、6、7、8、9、10、11、12、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000またはそれより多くの時点にわたって採取してもよい。時点は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60またはそれよりも多くの時間の期間にわたって存在してもよい。時点は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60またはそれよりも多くの日の期間にわたって存在してもよい。時点は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60またはそれよりも多くの週の期間にわたって存在してもよい。時点は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60またはそれよりも多くの月の期間にわたって存在してもよい。時点は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60またはそれよりも多くの年の期間にわたって存在してもよい。
【0121】
一部の場合では、方法は、対象から生体試料を得ることを含むことができる。対象は、ヒトまたは非ヒトであり得る。対象は、成人または小児であり得る。一部の場合では、成人対象は、18歳、または18歳を超え得る。一部の場合では、対象の生体試料は、腫瘍生検、全血、または血漿に由来し得る。一部の場合では、生体試料は、体液、細胞、皮膚、組織、器官、またはそれらの組合せ由来であり得る。試料は、血液、血漿、血液画分、唾液、痰、尿、精液、腟液、脳脊髄液、糞便、細胞、または組織生検であり得る。試料は、副腎、虫垂、膀胱、脳、耳、食道、眼、胆嚢、心臓、腎臓、大腸、肝臓、肺、口、筋肉、鼻、膵臓、副甲状腺、松果体、下垂体、皮膚、小腸、脾臓、胃、胸腺、甲状腺、気管、子宮、虫垂、角膜、皮膚、心臓弁、動脈、または静脈由来であり得る。
【0122】
試料は、1つまたは複数の核酸分子を含んでいてもよい。核酸分子は、DNA分子、RNA分子(例えば、mRNA、cRNAまたはmiRNA)、およびDNA/RNAハイブリッドであり得る。DNA分子の例としては、限定されるものではないが、二本鎖DNA、一本鎖DNA、一本鎖DNAヘアピン、cDNA、ゲノムDNAが挙げられる。核酸は、二本鎖RNA、一本鎖RNA、ncRNA、RNAヘアピン、およびmRNAなどのRNA分子であり得る。ncRNAの例としては、限定されるものではないが、siRNA、miRNA、snoRNA、piRNA、tiRNA、PASR、TASR、aTASR、TSSa-RNA、snRNA、RE-RNA、uaRNA、x-ncRNA、hY RNA、usRNA、snaR、およびvtRNAが挙げられる。
【0123】
本明細書に開示される方法は、1つまたは複数の容器を含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くの容器を含んでいてもよい。1つまたは複数の容器は、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。容器の例としては、限定されるものではないが、プレート、マイクロプレート、PCRプレート、ウェル、マイクロウェル、チューブ、エッペンドルフチューブ、バイアル、アレイ、マイクロアレイ、およびチップが挙げられる。
【0124】
本明細書に開示される方法は、1つまたは複数の試薬を含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くの試薬を含んでいてもよい。1つまたは複数の試薬は、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。試薬は、1つまたは複数のアッセイの効率を改善してもよい。試薬は、核酸分子、またはその変異体もしくは誘導体の安定性を改善してもよい。試薬としては、限定されるものではないが、酵素、プロテアーゼ、ヌクレアーゼ、分子、ポリメラーゼ、逆転写酵素、リガーゼ、および化学化合物が挙げられ得る。本明細書に開示される方法は、1つまたは複数の抗酸化剤を含むアッセイを実施することを含んでいてもよい。一般に、抗酸化剤は、別の分子の酸化を阻害する分子である。抗酸化剤の例としては、限定されるものではないが、アスコルビン酸(例えば、ビタミンC)、グルタチオン、リポ酸、尿酸、カロテン、α-トコフェロール(例えば、ビタミンE)、ユビキノール(例えば、コエンザイムQ)、およびビタミンAが挙げられる。
【0125】
本明細書に開示される方法は、1つまたは複数の緩衝液または溶液を含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くの緩衝液または溶液を含んでいてもよい。1つまたは複数の緩衝液または溶液は、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。緩衝液または溶液は、1つまたは複数のアッセイの効率を改善してもよい。緩衝液または溶液は、核酸分子、またはその変異体もしくは誘導体の安定性を改善してもよい。緩衝液または溶液としては、限定されるものではないが、洗浄緩衝液、溶出緩衝液、およびハイブリダイゼーション緩衝液が挙げられ得る。
【0126】
本明細書に開示される方法は、1つもしくは複数のビーズ、複数のビーズ、または1つもしくはビーズセットを含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くのビーズまたはビーズセットを含んでいてもよい。1つまたは複数のビーズまたはビーズセットは、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。ビーズは、磁気、抗体コーティング、プロテインA架橋、プロテインG架橋、ストレプトアビジンコーティング、オリゴヌクレオチドコンジュゲート、シリカコーティング、またはそれらの組合せであってもよい。ビーズの例としては、限定されるものではないが、Ampureビーズ、AMPure XPビーズ、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)、MACS(登録商標)マイクロビーズ、抗体コンジュゲートビーズ(例えば、抗免疫グロブリンマイクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴ-dTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、およびBcMag(商標)カルボキシ終端磁気ビーズが挙げられる。本開示の一部の態様では、1つまたは複数のビーズは、1つまたは複数のAmpureビーズを含む。代わりに、または加えて、1つまたは複数のビーズは、AMPure XPビーズを含む。
【0127】
本明細書に開示される方法は、1つもしくは複数のプライマー、複数のプライマー、または1つもしくは複数のプライマーセットを含んでいてもよい。プライマーは、1つまたは複数のリンカーをさらに含んでいてもよい。プライマーは、1つまたは複数の標識をさらに含んでいてもよい。プライマーは、1つまたは複数のアッセイにおいて使用されてもよい。例えば、プライマーは、1つもしくは複数の配列決定反応、増幅反応、またはそれらの組合せにおいて使用される。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くのプライマーまたはプライマーセットを含んでいてもよい。プライマーは、約100のヌクレオチドを含んでいてもよい。プライマーは、約10~約500の間のヌクレオチド、約20~約450の間のヌクレオチド、約30~約400の間のヌクレオチド、約40~約350の間のヌクレオチド、約50~約300の間のヌクレオチド、約60~約250の間のヌクレオチド、約70~約200の間のヌクレオチド、または約80~約150の間のヌクレオチドを含んでいてもよい。本開示の一部の態様では、プライマーは、約80のヌクレオチド~約100のヌクレオチドの間を含む。1つまたは複数のプライマーまたはプライマーセットは、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。
【0128】
プライマーは、試料中の1つもしくは複数の核酸分子またはそれらの変異体もしくは誘導体、あるいは核酸分子のサブセットの少なくとも一部とハイブリダイズしてもよい。プライマーは、1つまたは複数のゲノムとハイブリダイズしてもよい。プライマーは、異なるか、類似するか、および/または同一のゲノムとハイブリダイズしてもよい。1つまたは複数のプライマーは、1つもしくは複数の核酸分子またはそれらの変異体もしくは誘導体に対して、少なくとも約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%、またはそれよりも高い相補性であってもよい。
【0129】
プライマーは、1つまたは複数のヌクレオチドを含んでいてもよい。プライマーは、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くのヌクレオチドを含んでいてもよい。プライマーは、約100のヌクレオチドを含んでいてもよい。プライマーは、約10~約500の間のヌクレオチド、約20~約450の間のヌクレオチド、約30~約400の間のヌクレオチド、約40~約350の間のヌクレオチド、約50~約300の間のヌクレオチド、約60~約250の間のヌクレオチド、約70~約200の間のヌクレオチド、または約80~約150の間のヌクレオチドを含んでいてもよい。本開示の一部の態様では、プライマーは、約80のヌクレオチド~約100のヌクレオチドの間を含む。
【0130】
複数のプライマーまたはプライマーセットは、同一、類似、および/または異なる配列、リンカーおよび/または標識を有する2つまたはそれよりも多くのプライマーを含んでいてもよい。例えば、2つまたはそれよりも多くのプライマーは、同一の配列を含む。別の例では、2つまたはそれよりも多くのプライマーは、類似の配列を含む。さらに別の例では、2つまたはそれよりも多くのプライマーは、異なる配列を含む。2つまたはそれよりも多くのプライマーは、1つまたは複数のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、異なるリンカーをさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、類似のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、同一のリンカーをさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、1つまたは複数の標識をさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、異なる標識をさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、類似の標識をさらに含んでいてもよい。2つまたはそれよりも多くのプライマーは、同一の標識をさらに含んでいてもよい。
【0131】
一部の場合では、汎用プライマーを利用することができ、8Fプライマー、27Fプライマー、CC[F]プライマー、357Fプライマー、515Fプライマー、533Fプライマー、16S.1100.F16プライマー、1237Fプライマー、519Rプライマー、CD[R]プライマー、907Rプライマー、1391Rプライマー、1492R(I)プライマー、1492R(s)プライマー、U1492Rプライマー、928Fプライマー、336Rプライマー、1100Fプライマー、1100Rプライマー、337Fプライマー、785Fプライマー、805Rプライマー、518Rプライマー、および任意の他の適切な汎用プライマーの1つまたは複数を含むことができる。あるいは、特異的なプライマーが適切であり得る試料のためには、増幅は、特異的プライマーを用いて行うことができる。例では、特異的プライマーとしては、CYA106プライマー(シアノバクテリアのため)、CYA359Fプライマー(シアノバクテリアのため)、895Fプライマー(プラスチドおよびシアノバクテリアを除く細菌のため)、CYA781Rプライマー(シアノバクテリアのため)、902Rプライマー(プラスチドおよびシアノバクテリアを除く細菌のため)、904Rプライマー(プラスチドおよびシアノバクテリアを除く細菌のため)、1100Rプライマー(細菌のため)、1185mRプライマー(プラスチドおよびシアノバクテリアを除く細菌のため)、1185aRプライマー(苔癬関連Rhizobialesのため)、1381Rプライマー(Asterochloris種プラスチドを除く細菌のため)、または任意の他の適切な特異的プライマーが挙げられ得る。
【0132】
捕捉用プローブ、プライマー、標識、および/またはビーズは、1つまたは複数のヌクレオチドを含んでいてもよい。1つまたは複数のヌクレオチドは、RNA、DNA、DNAおよびRNA残基の混合物、または2’-OMeもしくは2’-フルオロ(2’-F)などのそれらの修飾アナログ、ロックド核酸(LNA)、あるいは非塩基部位を含んでいてもよい。
【0133】
本明細書に開示される方法は、1つまたは複数の標識を含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くの標識を含んでいてもよい。1つまたは複数の標識は、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。
【0134】
標識の例としては、限定されるものではないが、化学標識、生化学標識、生物学標識、発色標識、酵素標識、蛍光標識、およびルミネセンス標識が挙げられる。標識は、色素、光架橋剤、細胞傷害性化合物、薬物、親和性標識、光親和性標識、反応性化合物、抗体もしくは抗体断片、生体材料、ナノ粒子、スピン標識、フルオロフォア、金属含有部分、放射性部分、新規官能基、他の分子と共有結合的もしくは非共有結合的に相互作用する基、光ケージ化部分、アクチン放射線励起部分、リガンド、光異性化可能部分、ビオチン、ビオチンアナログ、重原子組込み部分、化学切断可能基、光切断可能基、酸化還元活性剤、同位体標識部分、生物物理学的プローブ、リン光基、化学発光基、高電子密度基、磁気基、挿入基、発色団、エネルギー移動剤、生物活性剤、検出可能な標識、またはそれらの組合せを含む。
【0135】
標識は、化学標識であり得る。化学標識の例としては、限定されるものではないが、ビオチンおよび放射性同位元素(例えば、ヨウ素、炭素、リン、水素)を挙げることができる。
【0136】
本明細書に開示される方法、キットおよび組成物は、生物学標識を含んでいてもよい。生物学標識は、限定されるものではないが、生体直交型アジド修飾アミノ酸、糖、および他の化合物を含む代謝標識を含んでいてもよい。
【0137】
本明細書に開示される方法、キットおよび組成物は、酵素標識を含んでいてもよい。酵素標識としては、限定されるものではないが、西洋ワサビペルオキシダーゼ(HRP)、アルカリホスファターゼ(AP)、グルコースオキシダーゼ、およびβ-ガラクトシダーゼを挙げることができる。酵素標識はルシフェラーゼであってもよい。
【0138】
本明細書に開示される方法、キットおよび組成物は、蛍光標識を含んでいてもよい。蛍光標識は、有機色素(例えば、FITC)、生物学的フルオロフォア(例えば、緑色蛍光タンパク質)、または量子ドットであり得る。蛍光標識の非限定的リストとしては、フルオレセインイソチオシアネート(FITC)、DyLight Fluors、フルオレセイン、ローダミン(テトラメチルローダミンイソチオシアネート、TRITC)、クマリン、Lucifer YellowおよびBODIPYが挙げられる。標識はフルオロフォアであり得る。フルオロフォアの例としては、限定されるものではないが、インドカルボシアニン(C3)、インドジカルボシアニン(C5)、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、テキサスレッド、パシフィックブルー、オレゴングリーン488、Alexa Fluor(登録商標)-355、Alexa Fluor 488、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor-555、Alexa Fluor 568、Alexa Fluor 594、Alexa Fluor 647、Alexa Fluor 660、Alexa Fluor 680、JOE、リサミン、ローダミングリーン、BODIPY、フルオレセインイソチオシアネート(FITC)、カルボキシ-フルオレセイン(FAM)、フィコエリトリン、ローダミン、ジクロロローダミン(dローダミン)、カルボキシテトラメチルローダミン(TAMRA)、カルボキシ-X-ローダミン(ROX(商標))、LIZ(商標)、VIC(商標)、NED(商標)、PET(商標)、SYBR、ピコグリーン、リボグリーンなどが挙げられる。蛍光標識は、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、黄色蛍光タンパク質、フィコビリンタンパク質(例えば、アロフィコシアニン、フィコシアニン、フィコエリトリン、およびフィコエリトロシアニン)であり得る。
【0139】
本明細書に開示される方法は、1つまたは複数のリンカーを含んでいてもよい。本明細書に開示される方法は、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、20もしくはそれよりも多く、30もしくはそれよりも多く、40もしくはそれよりも多く、50もしくはそれよりも多く、60もしくはそれよりも多く、70もしくはそれよりも多く、80もしくはそれよりも多く、90もしくはそれよりも多く、100もしくはそれよりも多く、125もしくはそれよりも多く、150もしくはそれよりも多く、175もしくはそれよりも多く、200もしくはそれよりも多く、250もしくはそれよりも多く、300もしくはそれよりも多く、350もしくはそれよりも多く、400もしくはそれよりも多く、500もしくはそれよりも多く、600もしくはそれよりも多く、700もしくはそれよりも多く、800もしくはそれよりも多く、900もしくはそれよりも多く、または1000もしくはそれよりも多くのリンカーを含んでいてもよい。1つまたは複数のリンカーは、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。
【0140】
適切なリンカーは、本明細書に開示される標識、プライマーおよび/もしくは捕捉用プローブに付着する能力を有する、任意の化学化合物または生体化合物を含む。リンカーが標識およびプライマーまたは捕捉用プローブの両方に付着する場合、その結果、適切なリンカーは、標識およびプライマーまたは捕捉用プローブを十分に分離する能力を有していてもよい。適切なリンカーは、核酸分子、その部分、またはそれらの変異体もしくは誘導体とハイブリダイズするプライマーおよび/または捕捉用プローブの能力を顕著に妨げない場合がある。適切なリンカーは、検出される標識の能力を顕著に妨げない場合がある。リンカーは剛性であり得る。リンカーは柔軟性であり得る。リンカーは半剛性であり得る。リンカーは、タンパク分解に安定(例えば、タンパク質切断に対して耐性)であり得る。リンカーは、タンパク分解に不安定(例えば、タンパク質切断に対して感受性)であり得る。リンカーはらせん状であり得る。リンカーは非らせん状であり得る。リンカーはコイル状であり得る。リンカーはβ-ストランドであり得る。リンカーはターン配座を含んでいてもよい。リンカーは一本鎖であり得る。リンカーは長鎖であり得る。リンカーは短鎖であり得る。リンカーは、少なくとも約5残基、少なくとも約10残基、少なくとも約15残基、少なくとも約20残基、少なくとも約25残基、少なくとも約30残基、もしくは少なくとも約40残基、またはそれよりも多くを含んでいてもよい。
【0141】
リンカーの例としては、限定されるものではないが、ヒドラゾン、ジスルフィド、チオエーテル、およびペプチドリンカーが挙げられる。リンカーはペプチドリンカーであり得る。ペプチドリンカーはプロリン残基を含んでいてもよい。ペプチドリンカーは、アルギニン、フェニルアラニン、トレオニン、グルタミン、グルタミン酸塩、またはそれらの任意の組合せを含んでいてもよい。リンカーはヘテロ二官能性架橋剤であり得る。
【0142】
本明細書に開示される方法は、1または複数の核酸分子を含む試料において、1つもしくはそれよりも多く、2つもしくはそれよりも多く、3つもしくはそれよりも多く、4つもしくはそれよりも多く、5つもしくはそれよりも多く、6つもしくはそれよりも多く、7つもしくはそれよりも多く、8つもしくはそれよりも多く、9つもしくはそれよりも多く、10もしくはそれよりも多く、11もしくはそれよりも多く、12もしくはそれよりも多く、13もしくはそれよりも多く、14もしくはそれよりも多く、15もしくはそれよりも多く、20もしくはそれよりも多く、25もしくはそれよりも多く、30もしくはそれよりも多く、35もしくはそれよりも多く、40もしくはそれよりも多く、45もしくはそれよりも多く、または50もしくはそれよりも多くのアッセイを実施することを含んでいてもよい。2つまたはそれよりも多くのアッセイは、異なっていてもよく、類似であってもよく、同一であってもよく、またはそれらの組合せであってもよい。例えば、本明細書に開示される方法は、2つまたはそれよりも多くの配列決定反応を実施することを含む。別の例では、本明細書に開示される方法は、2つまたはそれよりも多くのアッセイを実施することを含み、2つまたはそれよりも多くのアッセイの少なくとも1つは、配列決定反応を含む。さらに別の例では、本明細書に開示される方法は、2つまたはそれよりも多くのアッセイを実施することを含み、2つまたはそれよりも多くのアッセイの少なくとも2つは、配列決定反応およびハイブリダイゼーション反応を含む。2つまたはそれよりも多くのアッセイは、連続して、同時に、またはそれらの組合せで行ってもよい。例えば、2つまたはそれよりも多くの配列決定反応は、同時に行ってもよい。別の例では、本明細書に開示される方法は、ハイブリダイゼーション反応、続いて配列決定反応を実施することを含む。さらに別の例では、本明細書に開示される方法は、同時に2つまたはそれよりも多くのハイブリダイゼーション反応を実施すること、続いて同時に2つまたはそれよりも多くの配列決定反応を実施することを含む。2つまたはそれよりも多くのアッセイは、1つまたは複数のデバイスによって行ってもよい。例えば、2つまたはそれよりも多くの増幅反応は、PCR機によって行ってもよい。別の例では、2つまたはそれよりも多くの配列決定反応は、2つまたはそれよりも多くのシーケンサーによって行ってもよい。
【0143】
本明細書に開示される方法は、1つまたは複数のデバイスを含んでいてもよい。本明細書に開示される方法は、1つまたは複数のデバイスを含む1つまたは複数のアッセイを含んでいてもよい。本明細書に開示される方法は、1つまたは複数の操作またはアッセイを行う1つまたは複数のデバイスの使用を含んでいてもよい。本明細書に開示される方法は、1つまたは複数の操作またはアッセイにおける1つまたは複数のデバイスの使用を含んでいてもよい。例えば、配列決定反応の実施は、1つまたは複数のシーケンサーを含んでいてもよい。別の例では、核酸分子のサブセットの生成は、1つまたは複数の磁気分離器の使用を含んでいてもよい。さらに別の例では、1つまたは複数のプロセッサーは、1つまたは複数の核酸試料の分析において使用してもよい。デバイスの例としては、限定されるものではないが、シーケンサー、サーモサイクラー、リアルタイムPCR装置、磁気分離器、伝送デバイス、ハイブリダイゼーションチャンバー、電気泳動機器、遠心分離機、顕微鏡、撮像装置、蛍光光度計、発光光度計、プレートリーダー、コンピュータ、プロセッサー、およびバイオアナライザーが挙げられる。
【0144】
本明細書に開示される方法は、1つまたは複数のシーケンサーを含んでいてもよい。1つまたは複数のシーケンサーは、1つもしくは複数のHiSeq、MiSeq、HiScan、Genome Analyzer IIx、SOLiD Sequencer、Ion Torrent PGM、454 GSジュニア、Pac Bio RS、またはそれらの組合せを含んでいてもよい。1つまたは複数のシーケンサーは、1つまたは複数の配列決定プラットフォームを含んでいてもよい。1つまたは複数の配列決定プラットフォームは、454 Life Technologies/RocheによるGS FLX、Solexa/IlluminaによるGenome Analyzer、Applied BiosystemsによるSOLiD、Complete GenomicsによるCGA Platform、Pacific BiosciencesによるPacBio RS、またはそれらの組合せを含んでいてもよい。
【0145】
本明細書に開示される方法は、1つまたは複数のサーモサイクラーを含んでいてもよい。1つまたは複数のサーモサイクラーは、1つまたは複数の核酸分子を増幅するために使用されてもよい。本明細書に開示される方法は、1つまたは複数のリアルタイムPCR装置を含んでいてもよい。1つまたは複数のリアルタイムPCR装置は、サーマルサイクラーおよび蛍光光度計を含んでいてもよい。1つまたは複数のサーモサイクラーは、1つまたは複数の核酸分子を増幅および検出するために使用されてもよい。
【0146】
本明細書に開示される方法は、1つまたは複数の磁気分離器を含んでいてもよい。1つまたは複数の磁気分離器は、懸濁液からの常磁性および強磁性粒子の分離のために使用されてもよい。1つまたは複数の磁気分離器は、1つもしくは複数のLifeStep(商標)biomagnetic分離器、SPHERO(商標)FlexiMag分離器、SPHERO(商標)MicroMag分離器、SPHERO(商標)HandiMag分離器、SPHERO(商標)MiniTube Mag分離器、SPHERO(商標)UltraMag分離器、DynaMag(商標)マグネット、DynaMag(商標)-2マグネット、またはそれらの組合せを含んでいてもよい。
【0147】
本明細書に開示される方法は、1つまたは複数のバイオアナライザーを含んでいてもよい。一部の場合では、バイオアナライザーは、RNA、DNAおよびタンパク質を分析することができるチップに基づくキャピラリー電気泳動機である。1つまたは複数のバイオアナライザーは、Agilent’s 2100バイオアナライザーを含んでいてもよい。
【0148】
本明細書に開示される方法は、1つまたは複数のプロセッサーを含んでいてもよい。1つまたは複数のプロセッサーは、1つもしくは複数のアッセイからの1つもしくは複数のデータおよび/もしくは結果、1つもしくは複数のアッセイに基づくか、もしくはそれらに由来する1つもしくは複数のデータおよび/もしくは結果、1つもしくは複数のアッセイからの1つもしくは複数の出力、1つもしくは複数のアッセイに基づくか、もしくはそれらに由来する1つもしくは複数の出力、1つもしくは複数のデータおよび/もしくは結果からの1つもしくは複数の出力、1つもしくは複数のデータおよび/もしくは結果に基づくか、もしくはそれらに由来する1つもしくは複数の出力、またはそれらの組合せを、分析し、コンパイルし、保存し、ソートし、組み合わせ、評価し、またはそうでなければ処理してもよい。一部の場合では、本明細書に開示される方法は、
図17に示されるような、分析のためのデータを組み合わせることを含むことができる。1つまたは複数のプロセッサーは、1つもしくは複数のアッセイからの1つもしくは複数のデータ、結果もしくは出力、1つもしくは複数のアッセイに基づくか、もしくはそれらに由来する1つもしくは複数のデータ、結果もしくは出力、1つもしくは複数のデータもしくは結果からの1つもしくは複数の出力、1つもしくは複数のデータもしくは結果に基づくか、もしくはそれらに由来する1つもしくは複数の出力、またはそれらの組合せを、伝送してもよい。1つまたは複数のプロセッサーは、ユーザーから要求を受信および/または保存してもよい。1つまたは複数のプロセッサーは、1つまたは複数のデータ、結果、出力を生成または生成してもよい。1つまたは複数のプロセッサーは、1つまたは複数の生物医学レポートを生成または生成してもよい。1つまたは複数のプロセッサーは、1つまたは複数の生物医学レポートを伝送してもよい。1つまたは複数のプロセッサーは、1つもしくは複数のデータベース、1つもしくは複数のデータもしくは結果、1つもしくは複数の出力、またはそれらの組合せからの情報を、分析し、コンパイルし、保存し、ソートし、組み合わせ、評価し、またはそうでなければ処理してもよい。1つもしくは複数のプロセッサーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、またはそれよりも多くのデータベースからの情報を、分析し、コンパイルし、保存し、ソートし、組み合わせ、評価し、またはそうでなければ処理してもよい。1つまたは複数のプロセッサーは、1つまたは複数の要求、データ、結果、出力および/または情報を、1つもしくは複数のユーザー、プロセッサー、コンピュータ、コンピュータシステム、メモリロケーション、デバイス、データベース、またはそれらの組合せに伝送してもよい。1つまたは複数のプロセッサーは、1つまたは複数の要求、データ、結果、出力および/または情報を、1つもしくは複数のユーザー、プロセッサー、コンピュータ、コンピュータシステム、メモリロケーション、デバイス、データベース、またはそれらの組合せから受信してもよい。1つまたは複数のプロセッサーは、1つまたは複数の要求、データ、結果、出力および/または情報を、1つもしくは複数のユーザー、プロセッサー、コンピュータ、コンピュータシステム、メモリロケーション、デバイス、データベース、またはそれらの組合せから取り込んでもよい。本開示は、複数の生物医学適用のために利用することができる方法も提供する。一部の場合では、変異体、遺伝子、再構築遺伝子、エクソン、UTR、調節領域、スプライス部位、代替配列、およびヒトまたは非ヒトのゲノムの目的の他の含量は、複数の生物医学レポートに適用可能な含量の集約セットを生成するために、いくつかのデータベースから組み合わせることができる。この含量は、次いで、ローカルまたはグローバルのゲノム状況、ヌクレオチド含量、配列決定の性能、および解釈の必要に基づいて分類することができ、次いで、その後に、特定のプロトコール、アッセイの進行などについてのサブセットにグループ分けすることができる。一部の場合では、変異体、遺伝子、エクソン、UTR、調節領域、スプライス部位、代替配列、および目的の他の含量は、複数の生物医学レポートに適用可能な含量の集約セットを生成するために、いくつかのデータベースから組み合わされる。この含量は、次いで、ローカルもしくはグローバルのゲノム状況、ヌクレオチド含量、配列決定の性能、および解釈の必要に基づいて分類され、次いで、その後に、特定のプロトコールおよびアッセイの進行についてのサブセットにグループ分けされる(
図14)。一部の場合では、プロトコールおよび/またはアッセイは、補充引き抜きを含んでいてもよい。補充引き抜きは、ヒト標的配列、非ヒト標的配列、およびそれらの組合せを含んでいてもよい。補充引き抜きは、対象由来の(例えば、対象の組織に由来する細胞が起源である)核酸分子、および対象由来ではない(例えば、微生物(共生または寄生)、病原体または移植)核酸分子を含んでいてもよい。
図15~17は、異なるゲノム領域について濃縮されたDNAの複数のサブセットの1つまたは複数についての補充引き抜きを含むアッセイのワークフローの例を提供する。
【0149】
本明細書に開示される方法は、1つまたは複数のメモリロケーションを含んでいてもよい。1つまたは複数のメモリロケーションは、情報、データ、結果、出力、要求、またはそれらの組合せを保存してもよい。1つまたは複数のメモリロケーションは、情報、データ、結果、出力、要求、またはそれらの組合せを、1つもしくは複数のユーザー、プロセッサー、コンピュータ、コンピュータシステム、デバイス、またはそれらの組合せから受信してもよい。
【0150】
本明細書に記載の方法は、1つまたは複数のコンピュータおよび/またはコンピュータシステムの補助により実行することができる。コンピュータまたはコンピュータシステムは、本開示において提供される方法を実行するための機械実行可能コードを有する電子保存場所(例えば、データベース、メモリ)、および機械実行可能コードを実行するための1つまたは複数のプロセッサーを含んでいてもよい。
【0151】
本明細書に開示される方法は、1つまたは複数の生物医学出力に基づいて、対象における疾患または状態を処置および/または予防することを含んでいてもよい。1つまたは複数の生物医学出力は、1つまたは複数の治療を推奨してもよい。1つまたは複数の生物医学出力は、疾患または状態の処置の経過および/または予防を、提案し、選択し、指示し、推奨し、またはそうでなければ決定してもよい。1つまたは複数の生物医学出力は、1つまたは複数の治療の修飾または継続を推奨してもよい。1つまたは複数の治療の修飾は、1つまたは複数の治療を、投与すること、開始すること、低減すること、増加させること、および/または終了することを含んでいてもよい。1つまたは複数の治療は、抗がん治療、抗ウイルス治療、抗細菌治療、抗真菌治療、免疫抑制治療、またはそれらの組合せを含む。1つまたは複数の治療は、1つまたは複数の疾患または徴候を、処置、軽減または予防してもよい。
【0152】
抗がん治療の例としては、限定されるものではないが、手術、化学療法、放射線療法、免疫療法/生物学的療法、光線力学的療法が挙げられる。抗がん治療は、化学療法剤、モノクローナル抗体(例えば、リツキシマブ、トラスツズマブ)、がんワクチン(例えば、治療ワクチン、予防ワクチン)、遺伝子治療、またはそれらの組合せを含んでいてもよい。
【0153】
1つまたは複数の治療は、抗菌剤を含んでいてもよい。一般に、抗菌剤は、細菌、真菌、ウイルスまたは原生動物などの微生物を死滅させるか、またはその成長を阻害する物質を指す。抗菌薬は、微生物を死滅させる(殺菌的)か、または微生物の成長を防ぐ(静菌的)のいずれかである。天然源から得られるもの(例えば、抗生物質、タンパク質合成阻害剤(アミノグリコシド、マクロライド、テトラサイクリン、クロラムフェニコール、ポリペプチドなど))、および合成薬剤(例えば、スルホンアミド、コトリモキサゾール、キノロン)の主に2つのクラスの抗菌薬がある。一部の例では、抗菌薬は、抗生物質、抗ウイルス剤、抗真菌剤、抗マラリア剤、抗結核薬、抗ハンセン病剤、または抗原虫剤である。
【0154】
抗生物質は、一般に、細菌感染症を処置するために使用される。抗生物質は、殺菌性抗生物質および静菌性抗生物質の2つのカテゴリーに分けられ得る。一般に、殺菌性は、細菌を直接死滅させ得、静菌性は、それらが分裂するのを予防し得る。抗生物質は、生命体に由来していてもよく、またはスルホンアミドなどの合成抗菌剤を含んでいてもよい。抗生物質としては、アミカシン、ゲンタマイシン、カナマイシン、ネオマイシン、ネチルマイシン、トブラマイシン、およびパロモマイシンなどのアミノグリコシドが挙げられ得る。あるいは、抗生物質は、アンサマイシン(例えば、ゲルダナマイシン、ハービマイシン)、カバセフェム(例えば、ロラカルベフ)、カルバペネム(例えば、エルタペネム、ドリペネム、イミペネム、シラスタチン、メロペネム)、グリコペプチド(例えば、テイコプラニン、バンコマイシン、テラバンシン)、リンコサミド(例えば、クリンダマイシン、リンコマイシン、ダプトマイシン)、マクロライド(例えば、アジスロマイシン、クラリスロマイシン、ジリスロマイシン、エリスロマイシン、ロキシスロマイシン、トロレアンドマイシン、テリスロマイシン、スペクチノマイシン、スピラマイシン)、ニトロフラン(例えば、フラゾリドン、ニトロフラントイン)、およびポリペプチド(例えば、バシトラシン、コリスチン、ポリミキシンB)であり得る。
【0155】
一部の例では、抗生物質治療としては、セファロスポリン、例えば、セファドロキシル、セファゾリン、セファロチン、セファレキシン、セファクロル、セファマンドール、セフォキシチン、セフプロジル、セフロキシム、セフィキシム、セフジニル、セフジトレン、セフォペラゾン、セフォタキシム、セフポドキシム、セフタジジム、セフチブテン、セフチゾキシム、セフトリアキソン、セフェピム、セフタロリンフォサミル、およびセフトビプロールが挙げられる。
【0156】
抗生物質治療としては、ペニシリンも挙げられ得る。ペニシリンの例としては、アモキシシリン、アンピシリン、アズロシリン、カルベニシリン、クロキサシリン、ジクロキサシリン、フルクロキサシリン、メズロシリン、メチシリン、ナフシリン、オキサシリン、ペニシリンg、ペニシリンv、ピペラシリン、テモシリン、およびチカルシリンが挙げられる。
【0157】
あるいは、キノリンを、細菌感染症を処置するために使用してもよい。キノリン(quinilones)の例としては、シプロフロキサシン、エノキサシン、ガチフロキサシン、レボフロキサシン、ロメフロキサシン、モキシフロキサシン、ナリジクス酸、ノルフロキサシン、オフロキサシン、トロバフロキサシン、グレパフロキサシン、スパルフロキサシン、およびテマフロキサシンが挙げられる。
【0158】
一部の例では、抗生物質治療は、2つまたはそれよりも多くの治療の組合せを含む。例えば、アモキシシリンおよびクラブラン酸塩、アンピシリンおよびスルバクタム、ピペラシリンおよびタゾバクタム、またはチカルシリンおよびクラブラン酸塩を、細菌感染症を処置するために使用してもよい。
【0159】
スルホンアミドを、細菌感染症を処置するために使用してもよい。スルホンアミドの例としては、限定されるものではないが、マフェニド、スルホンアミドクリソイジン、スルファセタミド、スルファジアジン、スルファジアジン銀、スルファメチゾール、スルファメトキサゾール、スルファニルイミド、スルファサラジン、スルフイソキサゾール、トリメトプリム、およびトリメトプリム-スルファメトキサゾール(コトリモキサゾール)(tmp-smx)が挙げられる。
【0160】
テトラサイクリンは、抗生物質の別の例である。テトラサイクリンは、mRNA翻訳複合体中で30Sリボソームサブユニットに結合することによって、アミノアシル-tRNAのmRNAリボソーム複合体への結合を阻害してもよい。テトラサイクリンとしては、デメクロサイクリン、ドキシサイクリン、ミノサイクリン、オキシテトラサイクリン、およびテトラサイクリンが挙げられる。細菌感染症を処置するために使用され得る追加の構成物質としては、アルスフェナミン、クロラムフェニコール、ホスホマイシン、フシジン酸、リネゾリド、メトロニダゾール、ムピロシン、プラテンシマイシン、キヌプリスチン/ダルホプリスチン、リファキシミン、チアンフェニコール、チゲサイクリン、チニダゾール、クロファジミン、ダプソン、カプレオマイシン、サイクロセリン、エタンブトール、エチオナミド、イソニアジド、ピラジナミド、リファンピシン、リファマイシン、リファブチン、リファペンチン、およびストレプトマイシンが挙げられる。
【0161】
抗ウイルス治療は、ウイルス感染症を処置するために特異的に使用される医薬のクラスである。抗生物質のように、特定の抗ウイルス剤が、特定のウイルスのために使用される。それらは、宿主に対して比較的無害であり、したがって、感染症を処置するために使用することができる。抗ウイルス治療は、ウイルスのライフサイクルのさまざまな段階を阻害し得る。例えば、抗ウイルス治療は、ウイルスの細胞受容体への付着を阻害してもよい。そのような抗ウイルス治療としては、ウイルス関連タンパク質(VAP)を模倣し、細胞受容体に結合する薬剤が挙げられ得る。他の抗ウイルス治療は、ウイルスの侵入、ウイルスの脱殻(例えば、アマンタジン、リマンタジン、プレコナリル)、ウイルス合成、ウイルス組込み、ウイルス転写、またはウイルス翻訳(例えば、ホミビルセン)を阻害してもよい。一部の例では、抗ウイルス治療はモルホリノアンチセンスである。抗ウイルス治療は、身体の外側でウイルス粒子を積極的に不活性化する殺ウイルス剤と区別されなければならない。
【0162】
利用可能な多くの抗ウイルス薬は、レトロウイルス、大抵はHIVによる感染症を処置するために設計される。抗レトロウイルス薬は、プロテアーゼ阻害剤、逆転写酵素阻害剤、およびインテグラーゼ阻害剤のクラスを含み得る。HIVを処置するための薬物としては、プロテアーゼ阻害剤(例えば、インビラーゼ、サキナビル、カレトラ、ロピナビル、レクシヴァ、ホスアンプレナビル、ノービア、リトナビル、プリジスタ、ダルナビル(duranavir)、レイアタッツ、ビラセプト)、インテグラーゼ阻害剤(例えば、ラルテグラ
ビル)、転写酵素阻害剤(例えば、アバカビル、ザイアジェン、アゲネラーゼ、アンプレナビル、アプティバス、チプラナビル、クリキシバン、インジナビル、フォートベイス、サキナビル、Intelence(商標)、エトラビリン、アイセントレス、ビリアード)、逆転写酵素阻害剤(例えば、デラビルジン、エファビレンツ、エピビル、ハイビッド、ネビラピン、レトロビル、AZT、スタブジン(stuvadine)、ツルバダ、ヴァイデッ
クス)、融合阻害剤(例えば、フゼオン、エンフビルチド)、ケモカイン共受容体アンタゴニスト(例えば、シーエルセントリ、エムトリバ、エムトリシタビン、エプジコム、またはトリジビル)が挙げられ得る。あるいは、抗レトロウイルス治療は、アトリプラ(例えば、エファビレンツ、エムトリシタビン、およびテノホビル(tenofovira)ジソプロキシルフマル酸塩)およびコンプリーター(エムトリシタビン(embricitabine)、リルピ
ビリン、およびテノホビルジソプロキシルフマル酸塩)などの併用療法であり得る。単純ヘルペスおよび陰部ヘルペスを引き起こし得るヘルペスウイルスは、通常、ヌクレオシドアナログのアシクロビルで処置される。ウイルス性肝炎(A~E)は、5つの別個の肝臓指向性ウイルスによって引き起こされ、また、一般に、感染症の種類に応じて、抗ウイルス薬で処置される。A型およびB型インフルエンザウイルスは、オセルタミビルなどの既存のノイラミニダーゼ阻害剤に対する耐性を克服する新たなインフルエンザ処置の開発のための重要な標的である。
【0163】
一部の例では、抗ウイルス治療は、逆転写酵素阻害剤を含んでいてもよい。逆転写酵素阻害剤は、ヌクレオシド逆転写酵素阻害剤、または非ヌクレオシド逆転写酵素阻害剤であり得る。ヌクレオシド逆転写酵素阻害剤としては、限定されるものではないが、コンビビル、エムトリバ、エピビル、エプジコム、ハイビッド、レトロビル、トリジビル、ツルバダ、ヴァイデックスec、ヴァイデックス、ビリアード、ゼリット、およびザイアジェンが挙げられ得る。非ヌクレオシド逆転写酵素阻害剤は、エジュラント、インテレンス、レスクリプター、サスティバ、およびビラミューン(即時放出または持続放出)を含み得る。
【0164】
プロテアーゼ阻害剤は、抗ウイルス薬の別の例であり、限定されるものではないが、アゲネラーゼ、アプティバス、クリキシバン、フォートベイス、インビラーゼ、カレトラ、レクシヴァ、ノービア、プリジスタ、レイアタッツ、およびビラセプトが挙げられ得る。あるいは、抗ウイルス治療は、融合阻害剤(例えば、エンフビルチド(enfuviride)、または侵入阻害剤(例えば、マラビロク)を含み得る。
【0165】
抗ウイルス薬の追加の例としては、アバカビル、アシクロビル、アデホビル、アマンタジン、アンプレナビル、アンプリジェン、アルビドール、アタザナビル、アトリプラ、ボセプレビル、シドホビル、コンビビル、ダルナビル、デラビルジン、ジダノシン、ドコサノール、エドクスジン、エファビレンツ、エムトリシタビン、エンフビルチド、エンテカビル、ファムシクロビル、ホミビルセン、ホスアンプレナビル、ホスカルネット、ホスホネット、融合阻害剤、ガンシクロビル、イバシタビン、イムノビル、イドクスウリジン、イミキモド、インジナビル、イノシン、インテグラーゼ阻害剤、インターフェロン(例えば、I型、II型、III型インターフェロン)、ラミブジン、ロピナビル、ロビリド、マラビロク、モロキシジン、メチサゾン、ネルフィナビル、ネビラピン、ネキサビル、ヌクレオシドアナログ、オセルタミビル、peg-インターフェロンアルファ-2a、ペンシクロビル、ペラミビル、プレコナリル、ポドフィロトキシン、プロテアーゼ阻害剤、ラルテグラビル、逆転写酵素阻害剤、リバビリン、リマンタジン、リトナビル、ピラミジン、サキナビル、スタブジン、ティーツリー油、テノホビル、テノホビルジソプロキシル、チプラナビル、トリフルリジン、トリジビル、トロマンタジン、ツルバダ、バラシクロビル、バルガンシクロビル、ビクリビロック、ビダラビン、ビラミジン、ザルシタビン、ザナミビル、およびジドブジンが挙げられる。
【0166】
抗真菌薬は、水虫、白癬、カンジダ症(鵞口瘡)、クリプトコッカス髄膜炎などの深刻な全身感染症などの真菌感染症を処置するために使用され得る医薬である。抗真菌剤は、真菌生物を死滅させる哺乳動物および真菌細胞の間の相違を利用することによって働く。細菌とは違って、真菌およびヒトは両方とも真核生物である。したがって、真菌細胞およびヒト細胞は、分子レベルで類似しており、これは、感染した生物中において存在もしない、攻撃する抗真菌薬についての標的を見出すことをより困難にする。
【0167】
抗寄生虫剤は、線形動物、条虫、吸虫、感染性原生動物、およびアメーバなどの寄生生物による感染症の処置のために示される医薬のクラスである。抗真菌剤のように、それらは、宿主に対して深刻な損傷なく、感染した有害生物を死滅させなければならない。
【0168】
本開示の方法は、システム、キット、ライブラリー、またはそれらの組合せによって実行することができる。本開示の方法は、1つまたは複数のシステムを含んでいてもよい。本開示のシステムは、キット、ライブラリー、またはそれらの両方によって実行することができる。システムは、本方法のいずれか、または本明細書に開示される方法の操作のいずれかを行うための1つまたは複数の構成要素を含んでいてもよい。例えば、システムは、1つもしくは複数のキット、デバイス、ライブラリー、またはそれらの組合せを含んでいてもよい。システムは、1つもしくは複数のシーケンサー、プロセッサー、メモリロケーション、コンピュータ、コンピュータシステム、またはそれらの組合せを含んでいてもよい。システムは、伝送デバイスを含んでいてもよい。
【0169】
キットは、試料の処理および/または分析操作を含む、本明細書に開示されるさまざまな操作を実行するためのさまざまな試薬を含んでいてもよい。キットは、本明細書に開示される操作の少なくとも一部を実行するための使用説明書を含んでいてもよい。キットは、1つもしくは複数の捕捉用プローブ、1つもしくは複数のビーズ、1つもしくは複数の標識、1つもしくは複数のリンカー、1つもしくは複数のデバイス、1つもしくは複数の試薬、1つもしくは複数の緩衝剤、1つもしくは複数の試料、1つもしくは複数のデータベース、またはそれらの組合せを含んでいてもよい。
【0170】
ライブラリーは、1つまたは複数の捕捉用プローブを含んでいてもよい。ライブラリーは、核酸分子の1つまたは複数のサブセットを含んでいてもよい。ライブラリーは、1つまたは複数のデータベースを含んでいてもよい。ライブラリーは、本明細書に開示される方法、キットまたはシステムのいずれかから、生成または生成されてもよい。データベースライブラリーは、1つまたは複数のデータベースから生成されてもよい。1つまたは複数のライブラリーを生成するための方法は、(a)集約されたデータセットを生成するための1つまたは複数のデータベースからの情報を集約すること;(b)集約されたデータセットを分析すること;ならびに(c)集約されたデータセットから1つまたは複数のデータベースライブラリーを生成することを含んでいてもよい。
図13は、ライブラリー構築ワークフローの例を提供する。一部の場合では、ライブラリーは、プールされてもよい(
図7)。
コンピュータシステム
【0171】
本開示は、本開示の方法を実行するようにプログラムされたコンピュータシステムを提供する。
図5は、核酸分子の起源(例えば、ヒトまたは非ヒト、宿主または非宿主)を特定するため、1つもしくは複数の特徴(例えば、遺伝的変異体)を特定するため、またはそれらの任意の組合せのために、配列読み取りデータをマッピングおよび/または整列させるように、プログラムされたか、またはそうでなければ構成されたコンピュータシステム501を示す。コンピュータシステム501は、例えば、生体試料中の核酸配列の起源を特定するために配列読み取りデータを1つまたは複数の参照配列と整列させるなどの、本開示において提供される配列決定情報を処理するさまざまな態様を調節することができる。コンピュータシステム501は、ユーザーの電子デバイス、または電子デバイスに関して遠隔設置されたコンピュータシステムであり得る。電子デバイスは、モバイル電子デバイスであり得る。
【0172】
コンピュータシステム501は、中央演算処理装置(CPU、また、本明細書において「プロセッサー」および「コンピュータプロセッサー」)505を含み、これは、単一のコアもしくは複数のコアプロセッサー、または並列処理のための複数のプロセッサーであり得る。コンピュータシステム501は、メモリまたはメモリロケーション510(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置515(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース520(例えば、ネットワークアダプター)、ならびにキャッシュ、他のメモリ、データストレージおよび/または電子ディスプレイアダプターなどの周辺デバイス525も含む。メモリ510、記憶装置515、インターフェース520、および周辺デバイス525は、マザーボードなどのコミュニケーションバス(実線)を通してCPU505と通信する。記憶装置515は、データを保存するためのデータ記憶装置(またはデータリポジトリ)であり得る。コンピュータシステム501は、通信インターフェース520の補助によりコンピュータネットワーク(「ネットワーク」)530と動作可能に連結され得る。ネットワーク530は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットで通信するイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク530は、一部の場合では、電気通信および/またはデータネットワークである。ネットワーク530は、1つまたは複数のコンピュータサーバーを含むことができ、これは、クラウドコンピューティングなどの分散コンピューティングを可能にし得る。一部の場合では、コンピュータシステム501の補助を有するネットワーク530は、ピアツーピアネットワークを実行することができ、これは、コンピュータシステム501に連結したデバイスがクライアントまたはサーバーとして挙動することを可能にし得る。
【0173】
CPU505は、一連の機械可読命令を実行することができ、これは、プログラムまたはソフトウェアで具体化することができる。命令は、メモリ510などのメモリロケーションに保存されていてもよい。命令は、CPU505に向けることができ、これは、その後、本開示の方法を実行するためにCPU505をプログラムするか、またはそうでなければ構成することができる。CPU505によって行われる操作の例としては、フェッチ、デコード、実行、およびライトバックが挙げられ得る。
【0174】
CPU505は、集積回路などの回路の部分であり得る。システム501の1つまたは複数の他の構成要素は、回路に含まれ得る。一部の場合では、回路は、特定用途向け集積回路(ASIC)である。
【0175】
記憶装置515は、ドライバー、ライブラリーおよびセーブされたプログラムなどのファイルを保存することができる。記憶装置515は、ユーザーのデータ、例えば、ユーザー選択およびユーザープログラムを保存することができる。コンピュータシステム501は、一部の場合では、イントラネットまたはインターネットを通してコンピュータシステム501と通信するリモートサーバー上に配置されるなど、コンピュータシステム501の外部にある1つまたは複数の追加のデータ記憶装置を含むことができる。
【0176】
コンピュータシステム501は、ネットワーク530を通して1つまたは複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム501は、ユーザー(例えば、ヘルスケア提供者)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)GalaxyTab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワーク1130を介してコンピュータシステム501にアクセスすることができる。
【0177】
本明細書に記載の方法は、例えば、メモリ510または電子記憶装置515などのコンピュータシステム501の電子保存場所に保存された機械(例えば、コンピュータプロセッサー)実行可能コードによって実行することができる。機械実行可能コードまたは機械可読コードは、ソフトウェアの形態で提供され得る。使用の間に、コードは、プロセッサー505によって実行され得る。一部の場合では、コードは、プロセッサー505によるアクセスの準備のために、記憶装置515から読み出すことができ、メモリ510に保存することができる。一部の状況では、電子記憶装置515を除外することができ、機械実行可能命令はメモリ510に保存される。
【0178】
コードは、事前にコンパイルすることができ、コードを実行するように適合されたプロセッサーを有する機械による使用のために構成することができ、またはランタイムの間にコンパイルすることができる。コードは、事前コンパイルされたか、またはコンパイルされた様式でコードを実行できるように選択され得るプログラミング言語で提供することができる。
【0179】
コンピュータシステム501などの本明細書において提供されるシステムおよび方法の態様は、プログラミングに具体化することができる。技術のさまざまな態様は、典型的には、機械(またはプロセッサー)実行可能コードおよび/または機械可読媒体のタイプで行われるか、もしくは具体化される関連データの形式の「製品」または「製造品」と考えられ得る。機械実行可能コードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に保存することができる。「保存」型媒体としては、コンピュータ、プロセッサーなどの有形メモリのいずれかもしくはすべて、またはさまざまな半導体メモリ、テープドライブ、ディスクドライブなどのそれらの関連モジュールを挙げることができ、これは、ソフトウェアプログラミングのために任意の時に非一時的保存を提供し得る。ソフトウェアのすべてまたは部分は、時には、インターネットまたはさまざまな他の電気通信ネットワークを通して通信してもよい。このような通信は、例えば、1つのコンピュータまたはプロセッサーから別のものに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームに、ソフトウェアのロードを可能にし得る。したがって、ソフトウェア要素を有し得る別の種類の媒体は、有線および光の地上通信ネットワーク、ならびにさまざまなエアリンクによる、例えば、ローカルデバイスの間の物理インターフェースにわたって使用される、光、電気および電磁波を含む。有線または無線リンク、光リンクなどのこのような波を運ぶ物理的要素はまた、ソフトウェアを有する媒体として考えられ得る。本明細書で使用される場合、非一時的有形「保存」媒体に制限されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサーへの命令の提供するに関与する任意の媒体を指す。
【0180】
そのため、コンピュータ実行可能コードなどの機械可読媒体は、限定されるものではないが、有形保存媒体、搬送波媒体、または物理的伝送媒体を含む、多くの形態をとり得る。非揮発性保存媒体としては、例えば、任意のコンピュータ(複数可)中の保存デバイスのいずれかなどの光学もしくは磁気ディスクが挙げられ、例えば、図面に示されるデータベースなどを実行するために使用され得る。揮発性保存媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含む銅線および光ファイバーが挙げられる。搬送波伝送媒体は、電気もしくは電磁信号、またはラジオ波(RF)および赤外(IR)データ通信の間に生成されるものなどの音波もしくは光波の形態をとってもよい。したがって、コンピュータ可読媒体の通常の形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード穿孔紙テープ、穴のパターンを有する任意の他の物理保存媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を運ぶケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体が挙げられる。コンピュータ可読媒体のこれらの形態の多くは、実行のためのプロセッサーに対する一連のまたは複数の連なりの1つまたは複数の命令を運ぶことに関与し得る。
【0181】
コンピュータシステム501は、例えば、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出されるCDR3配列、およびそれらの任意の組合せからなる群より選択されるデータの1つまたは複数のセットを含む1つまたは複数の生物医学レポートを提供するためのユーザーインターフェース(UI)540を含む、電子ディスプレイ535を含み得るか、またはディスプレイ535と通信し得る。UIの例としては、限定されないが、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースが挙げられる。
【0182】
本開示の方法およびシステムは、1つまたは複数のアルゴリズムによって実行することができる。アルゴリズムは、中央演算処理装置505による実行の際に、ソフトウェアによって実行することができる。アルゴリズムは、例えば、配列読み取りデータをマッピングおよび/もしくは整列させることができ、変異体をコールすることができ、配列情報に注釈を付けることができ、またはそれらの任意の組合せを行うことができる。
【実施例0183】
(実施例1)
ゲノムDNAの調製
以下の操作を使用して、ゲノムDNAを含む試料由来の核酸分子のサブセットを調製した。
【0184】
1. ゲノムDNAを含む試料を、15~35秒間、M220で剪断する。
【0185】
2. 断片化gDNAを、ライゲーション後にSPRIビーズを用いて精製し(SPRIビーズのDNA試料に対する体積の比は1であった)、DNAを100μLの溶出緩衝液(EB)に溶出させた。
【0186】
3. 50μLのSPRIビーズを100μLのDNAに添加した。
【0187】
4. 上清を新しいチューブに移した。
【0188】
5. 残ったビーズ結合DNAからDNAを溶出させた。この溶出DNAを長挿入物と呼んだ。
【0189】
6. 10μLのSPRIビーズを、操作4からの上清に添加した。
【0190】
7. 操作6からの上清を新しいチューブに移した。
【0191】
8. 操作6の残ったビーズ結合DNAからDNAを溶出させた。この溶出DNAを中挿入物と呼んだ。
【0192】
9. 20μLのSPRIビーズを、操作7からの上清に添加した。
【0193】
10. 操作9からの上清を新しいチューブに移した。
【0194】
11. 操作9の残ったビーズ結合DNAからDNAを溶出させた。この溶出DNAを短挿入物と呼んだ。
【0195】
(実施例2)
生体試料の入手
評価可能な転移性がんを有する対象は、腫瘍の切除を受ける。腫瘍由来のリンパ球である腫瘍浸潤リンパ球(TIL)を成長させ、増やす。TILの複数の個々の断片または複数の個々の培養物を成長させる。個々の培養物を別々に増やし、TILの十分な収率(およそ108個の細胞)がそれぞれの培養物から増えたときに、TILを凍結保存し、アリコートを免疫学的試験のために取る。起源の腫瘍のアリコートを、エクソームおよびトランスクリプトームの配列決定に付して、正常細胞と比較して、腫瘍中に固有で存在する突然変異を特定する。配列決定は、微生物を含む非ヒトゲノムの存在および同一性も特定する。
【0196】
(実施例3)
生体試料からのゲノム材料の抽出
ゲノムDNA(gDNA)および総RNAを、製造者の提案に従って、QIAGEN AllPrep DNA/RNAキット(カタログ番号80204)を使用して、さまざまな腫瘍から精製し、正常なアフェレーシス試料とマッチさせる。腫瘍試料を、ホルマリン固定し、パラフィン包埋し(FFPE)、gDNAを、製造者の指示の通り、Covaris truXTRACTM FFPE DNAキットを使用して抽出する。
【0197】
(実施例4)
生体試料の配列決定分析
およそ20,000コード遺伝子の全エクソームライブラリーの構築およびエクソン捕捉を、Human All Exson V6 RNAベイト(カタログ番号5190-8863)(Agilent Technologies、Santa Clara、CA、米国)およびBacterial RNAベイトとカップリングしたペアエンドライブラリーのために、Agilent Technologies SureSelectXT Target Enrichmentシステム(カタログ番号5190-8646)を使用して調製する。全エクソーム配列決定(WES)ライブラリーを、その後、NextSeq 500卓上シーケンサー(Illumina、San Diego、CA、米国)において配列決定する。ライブラリーを、新鮮な腫瘍組織試料由来の3μgのgDNA、およびFFPE腫瘍試料由来の200ngのgDNAを使用して、製造者のプロトコールに従って、調製する。ペアエンド配列決定を、Illumina高出力フローセルキット(300サイクル)(カタログ番号FC-404-2004)を用いて行う。Tu-1、Tu-2AおよびTu-2B試料を、最初に、試薬/フローセルキットのv1で実行し、同じライブラリー調製のその後の実行を、試薬/フローセルキットのv2を使用して行う。腫瘍試料を、v2試薬/フローセルキットで実行する。各試料における平均配列決定深度および腫瘍のパーセンテージ(腫瘍純度)を、バイオインフォマティクスプログラムの腫瘍の対立遺伝子特異的コピー数分析(ASCAT)1を用いて推定される通り、決定する。RNA-seqライブラリーを、2μgの総RNAを使用して、Illumina TruSeq RNA標準ライブラリー調製キットを用いて、製造者のプロトコールに従って調製する。RNA-seqライブラリーを、NextSeq 500卓上シーケンサー(Illumina、San Diego、CA、米国)においてペアエンド配列決定する。整列、処理および変異体呼び出し。WESのために、整列を、ヒトゲノムビルドhg19に対して、novocraft(http://www.novocraft.com/)からのno
voalign MPIを使用して行う。重複を、Picard’s MarkDuplicatesツールを使用してマークする。In/del再配列および塩基再較正を、GATKベストプラクティスワークフロー(https://www.broadinstitute.org/gatk/)に従って行う。データのクリーンアップ後、samtools(http://samtools.sourceforge.net)を使用して、パイルアップファイルを作出し、Varscan2(http://varscan.sourceforge.net)を使用して、以下の基準:腫瘍および正常読み取りデータカウント
が10またはそれよりも高い、変異体対立遺伝子頻度が10%またはそれよりも高い、および腫瘍変異体読み取りデータが4またはそれよりも高い、を使用して、体細胞変異体を呼び出す。次いで、これらの変異体をAnnovar(http://annovar.openbioinformatics.org)を使用して注釈を付ける。RNA-seqのために、整列を、ヒトゲノムビル
ドhg19に対して、STAR(https://github.com/alexdobin/STAR)2パス法を使用
して行う。重複を、Picard’s MarkDuplicatesツールを使用してマークする。読み取りデータを分割し、GATK SplitNTrimツールを使用してトリミングする。その後、In/del再配列および塩基再較正を、GATKツールボックスを使用して行う。パイルアップファイルを、最終の再較正bamファイルおよびsamtools mpileupを使用して、作出する。最後に、変異体を、Varscan2を使用して呼び出す。
【0198】
(実施例5)
非ヒトゲノムの配列の整列
配列決定分析から抽出されたゲノム情報を、リボソームRNA遺伝子の16Sのゲノム参照に対して、整列させる。16S遺伝子と完全にマッチした読み取りデータを特定する。16S遺伝子の共有領域とハイブリダイズするように設計された捕捉用プローブを、未だに特定および特性が明らかにされていない種でさえも、幅広い種類の種由来の核酸分子を捕捉するために、使用することができる。配列がこれらの共有領域から可変領域に伸長した捕捉された分子は、可変領域部由来の配列に基づくそれらの起源の種に割り当てられる。
【0199】
(実施例6)
剪断時間および断片サイズ
ゲノムDNA(gDNA)を、Covarisの設定の剪断時間を変えることによって、剪断した。次いで、さまざまな剪断時間によって生成したgDNA断片を分析した。結果を
図10および表1に示す。
【表1】
【0200】
(実施例7)
ビーズ比および断片サイズ
ビーズの体積の核酸試料の体積に対する比は、変更され、平均断片サイズに対するこれらの比の効果を分析した。
図11において見ることができるように、ビーズの体積の核酸試料の体積に対する比を0.8(ライン1)、0.7(ライン2)、0.6(ライン3)、0.5(ライン4)および0.4(ライン5)に変更すると、DNA断片の平均サイズの変化がもたらされた。一般に、比が低くなると、平均断片サイズが大きくなると思われた。
【0201】
(実施例8)
ライゲーション反応および断片サイズ
2つの異なる剪断時間および3つの異なるライゲーション反応の組合せを、核酸試料において実施した。試料1は、25秒間剪断し、ライゲーション反応を、長挿入DNAにおいて行った。試料2は、32秒間剪断し、ライゲーション反応を、長挿入DNAにおいて行った。試料3は、25秒間剪断し、ライゲーション反応を、中挿入DNAにおいて行った。試料4は、32秒間剪断し、ライゲーション反応を、中挿入DNAにおいて行った。試料5は、25秒間剪断し、ライゲーション反応を、短挿入DNAにおいて行った。試料6は、32秒間剪断し、ライゲーション反応を、短挿入DNAにおいて行った。
図12は、6つの反応についての平均断片サイズを示す。
(実施例9)
目的の核酸の捕捉
核酸試料を対象から得る。試料を2つの別々の試料に分けることができ、それぞれ別々の試料をプローブの異なるプールおよび条件に付すことができる。ビオチン化捕捉用プローブの第1のプールを、Agilent Clinical Research Exomeキット(GRCh37参照ゲノムにおけるエクソームに基づく)を、GRCh38参照配列に対応するエクソーム領域、HLA特異的プローブ、T細胞受容体およびB細胞受容体組換え特異的プローブ(すなわち、V(D)J領域に対応する領域)、マイクロサテライト不安定性の領域、ならびにオンコウイルス配列を含む、追加の目的のプローブと組み合わせることによって、生成する。追加のプローブを、プールに滴定して、核酸の相対捕捉速度を調整する。これは、捕捉された核酸のセットについての配列決定深度または感受性を増加させる下流の配列決定反応のために有益であり得る。プローブの第2のプール(例えば、特異的配列を標的にするプローブの「ブーストセット」、または配列のサブセット)は、捕捉することが困難である配列により、核酸を捕捉することができる。ブーストセットのプローブは、高GC含量を有するGRCh37およびGRCh38参照配列のエクソーム、がん治療に関するプローブ、追加のT細胞受容体およびB細胞組換え特異的プローブを含むことができる。第1のプールによって捕捉された核酸分子、および第2のプールによって捕捉された核酸分子を組み合わせて、捕捉用プローブおよび捕捉された核酸の組合せプールを作出する。組合せプールは、それぞれのプールに対応する捕捉された核酸の相対量を調整するために、異なる比の捕捉された分子の2つのプールを組み合わせることによって作出することができる。これは、捕捉用核酸のセットについての深度または感受性を増加させる下流の配列決定反応のために有益であり得る。ハイブリダイズされた捕捉用プローブおよび捕捉用核酸を、磁気ストレプトアビジンビーズとともにインキュベートする。磁気分離器を、試料を含有するチューブの外側に配置し、捕捉用プローブが磁気ストレプトアビジンビーズを固定化することが可能になる。液体をデカントし、追加の緩衝液を添加してビーズを洗浄し、任意の未結合核酸を除去する。捕捉された核酸を増幅反応に付して、さらに下流の配列決定反応のためのアダプターを付加する。
【0202】
(実施例10)
マイクロバイオームおよびオンコウイルスの特定
核酸試料を対象から得る。試料を2つの別々の試料に分けることができ、それぞれ別々の試料をプローブの異なるプールおよび条件に付すことができる。ビオチン化捕捉用プローブの第1のプールを、Agilent Clinical Research Exomeキット(GRCh37参照ゲノムにおけるエクソームに基づく)を、GRCh38参照配列に対応するエクソーム領域、Helicobacter pyloriおよびFusobacteriumの遺伝子を含む、細菌、真菌、古細菌および原生生物の遺伝子の16S rRNA領域と相同性を有するプローブ、ウイルス遺伝子(ヒトパピローマウイルス、B型肝炎ウイルス、C型肝炎ウイルスを含む)に対するプローブ、ならびに病原性に関する遺伝子に対するプローブを含む追加の目的のプローブと組み合わせることによって、生成する。追加のプローブを、プールに滴定して、核酸の相対捕捉速度を調整する。プローブの第2のプール(例えば、特異的配列を標的にするプローブの「ブーストセット」、または配列のサブセット)は、捕捉することが困難である配列により、核酸を捕捉することができる。ブーストセットのプローブは、高GC含量、または複数の代替遺伝子配列もしくは高突然変異比率を有する遺伝子に起因する遺伝子に対する低相同性を有するGRCh37およびGRCh38参照配列のエクソームを含むことができる。第1のプールによって捕捉された核酸分子、および第2のプールによって捕捉された核酸分子を組み合わせて、核酸の組合せプールを作出する。これらの2つのプールを組み合わせ、異なる比で滴定して、他のプールに対する1つのプールの感受性を増加させる。ハイブリダイズされた捕捉用プローブおよび捕捉用核酸を、磁気ストレプトアビジンビーズとともにインキュベートする。磁気分離器を、試料および捕捉用プローブを含有するチューブの外側に配置し、磁気ストレプトアビジンビーズを固定化することが可能になる。液体をデカントし、追加の緩衝液を添加してビーズを洗浄し、任意の未結合核酸を除去する。捕捉された核酸を増幅反応に付して、さらに下流の配列決定反応のためのアダプターを付加する。配列を参照配列と整列させて、対象のマイクロバイオーム中の特定の微生物の存在を特定するか、または任意の疾患を引き起こす病原体を特定する。
【0203】
(実施例11)
CAR-T細胞の特定
対象由来の核酸試料を得る。プローブの2つのプールを、ビオチン化されたAgilent Clinical Research Exomeキットのプローブで構成された第1のプールを用いて生成する。ビオチン化プローブの補充セットを、CAR-T細胞において見られるキメラ抗原受容体に特異的な配列を含む第1のプールに添加する。ビオチン化捕捉用プローブの第2のプール(例えば、特異的配列を標的にするプローブの「ブーストセット」、または配列のサブセット)は、高GC含量を有するCAR配列、および/または突然変異もしくは組換えに起因する捕捉された核酸とより低い全体の配列相同性を有し得る配列に向けられる配列を含有する。試料を2つの試料プールに分け、第1の試料プールをプローブの第1のプールに付し、第2の試料プールをプローブの第2のプールに付して、捕捉用プローブが試料プールのそれぞれに由来の核酸を捕捉することを可能にする。捕捉された核酸とハイブリダイズされたプローブの第1のプールおよび第2のプールを組み合わせる。磁気ストレプトアビジンビーズを混合物に添加し、ビオチン化プローブをビーズに結合させる。磁気分離器を、試料および捕捉用プローブを含有するチューブの外側に配置し、磁気ストレプトアビジンビーズを固定化することが可能になる。液体をデカントし、追加の緩衝液を添加してビーズを洗浄し、任意の未結合核酸を除去する。捕捉された核酸を、新鮮な緩衝液に再懸濁させ、増幅反応に付して、アダプターを付加し、その後、捕捉された核酸を配列決定する。配列読み取りデータを、分析し、CAR-T遺伝子参照配列に対して整列させて、CAR-T関連核酸の存在を特定する。
【0204】
(実施例12)
セグメント化トランスクリプトームの特定
試料を、対象から、異なる組織型から得る。試料を、酵素消化によって処理して、DNAおよび複数の種類のRNA分子(rRNA、tRNA、miRNA)を除去する。mRNAは、未消化で残り、逆転写に付されて、cDNA分子を生成する。およそ20,000遺伝子に対する配列相同性を有するビオチン化プローブセットを生成し、cDNA試料と混合する。磁気ストレプトアビジンビーズを混合物に添加し、ビオチン化プローブをビーズに結合させる。磁気分離器を、試料および捕捉用プローブを含有するチューブの外側に配置し、磁気ストレプトアビジンビーズを固定化することが可能になる。液体をデカントし、追加の緩衝液を添加してビーズを洗浄し、任意の未結合核酸を除去する。捕捉された核酸を、新鮮な緩衝液に再懸濁させ、増幅反応に付して、アダプターを付加し、その後、捕捉された核酸を配列決定する。配列読み取りデータを、分析し、参照配列に対して整列させて、各試料中の遺伝子の同一性を決定し、試料の組織型に関連付ける。ビオチン化プローブが異なる比で滴定される、試料の複数の複製を実行する。試料に提供されたプローブの量に関連する核酸の特異的シグナルを分析することによって、それぞれの遺伝子の発現レベルを決定することができる。トランスクリプトーム分析を、エクソームまたはゲノム分析と並行して実行することができる。エクソームまたはゲノムのプローブは、プローブの第1のプールとして使用してもよく、cDNA捕捉用プローブを第2のプールとして使用することができる。この場合における試料は、部分に分割することができ、DNA特異的反応またはmRNA特異的反応に付すことができる。前の実施例に開示するように、捕捉された核酸は、一緒にプールすることができ、配列決定反応に付して、核酸の同一性を決定することができる。
【0205】
(実施例13)
がんに関する無細胞DNA(cfDNA)の特定および捕捉
全血または血清由来の核酸試料抽出物を得る。血液試料の細胞を遠心分離により除去し、無細胞試料を得る。およそ20,000遺伝子に対する配列相同性を有するビオチン化プローブセットを生成し、無細胞試料と混合する。ビオチン化捕捉用プローブの第1のプールを、Agilent Clinical Research Exomeキット(GRCh37参照ゲノムにおけるエクソームに基づく)を、GRCh38参照配列に対応するエクソーム領域を含む追加の目的のプローブ、およびがんに関連する遺伝子に対する相同性を有するプローブと組み合わせることによって、生成する。追加のプローブを、プールに滴定して、核酸の相対捕捉速度を調整する。プローブの第2のプール(例えば、特異的配列を標的にするプローブの「ブーストセット」、または配列のサブセット)は、捕捉するのが困難である配列により、核酸を捕捉することができる。ブーストセットのプローブは、高GC含量、または複数の代替遺伝子配列もしくは高突然変異比率を有する遺伝子に起因する遺伝子に対する低相同性を有するGRCh37およびGRCh38参照配列のエクソームを含むことができる。磁気ストレプトアビジンビーズを混合物に添加し、ビオチン化プローブをビーズに結合させる。磁気分離器を、試料および捕捉用プローブを含有するチューブの外側に配置し、磁気ストレプトアビジンビーズを固定化することが可能になる。液体をデカントし、追加の緩衝液を添加してビーズを洗浄し、任意の未結合核酸を除去する。捕捉された核酸を、新鮮な緩衝液に再懸濁させ、増幅反応に付して、アダプターを付加し、その後、捕捉された核酸を配列決定する。配列読み取りデータを、分析し、参照配列に対して整列させて、各試料中の遺伝子の同一性を決定する。cfDNA分析を、cfDNAで行われるようにして、ゲノムDNAを同じまたは類似のプローブセットに適用することによって、ゲノムDNAのエクソーム配列決定と並行して実行することができる。
【0206】
本発明の好ましい実施形態を本明細書に示し、説明してきたが、そのような実施形態が例としてのみ提供されることは、当業者には自明であろう。本発明が本明細書内で提供される特定の実施例によって限定されることを意図していない。本発明は、前述の明細書を参照して記載してきたが、本明細書における実施形態の記載および図示は、限定的な意味で解釈されることを意味しない。多数の変形、変化および置換は、ここに、本発明から逸脱することなく、当業者は気付くだろう。さらにまた、本発明のすべての態様が、各種の条件および変数に依存する、本明細書において説明する特定の表現、配置または相対的な割合に限定されないことが理解されるべきである。本明細書に記載される本発明の実施形態に対するさまざまな代替を本発明の実施において用いてもよいことが理解されるべきである。したがって、本発明が、任意のそのような代替、改変、変形または均等物も包含するものとすることを企図する。以下の特許請求の範囲が本発明の範囲を定義し、これらの特許請求の範囲内の方法および構造、ならびにそれらの均等物がそれによって包含されることを意図する。
本発明は、例えば、以下の項目を提供する。
(項目1)
対象の生体試料を処理するための方法であって、
(a)核酸プローブのプールを使用して、前記生体試料から核酸分子のサブセットを生成するステップであって、前記プローブが、(i)ヒトゲノムのエレメントを標的にするように構成された第1の複数の核酸プローブ、および(ii)1つまたは複数の非ヒトゲノムのエレメントを標的にするように構成された第2の複数の核酸プローブを含む、ステップ;ならびに
(b)前記核酸分子のサブセットをアッセイに付して、(i)前記対象からの前記生体試料由来のヒト核酸、および(ii)前記対象の前記生体試料由来の非ヒト核酸の配列を含む配列情報を得るステップ
を含む、方法。
(項目2)
(i)の前記第1の複数の核酸プローブが、前記ヒトゲノムに由来するエレメントを標的にするように構成される、項目1に記載の方法。
(項目3)
前記第2の複数の核酸プローブが、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、遺伝子改変細胞、および遺伝子改変ベクターからなる群より選択される1つまたは複数の種の非ヒトゲノム配列由来のエレメントを標的にするように構成される、項目1に記載の方法。
(項目4)
前記生体試料から前記核酸分子のサブセットを生成するステップが、1つまたは複数のハイブリダイゼーション反応を実施するステップを含む、項目1に記載の方法。
(項目5)
前記対象から前記生体試料を得るステップをさらに含み、前記生体試料が、腫瘍生検材料、全血、または血漿に由来する、項目1に記載の方法。
(項目6)
前記核酸分子のサブセットの前記配列を1つまたは複数の参照配列と整列させるステップをさらに含む、項目1に記載の方法。
(項目7)
前記1つまたは複数の参照配列が、複数の参照配列を含み、前記複数の参照配列が、2つまたはそれよりも多くの異なる種に対応する、項目6に記載の方法。
(項目8)
前記整列に基づいて、前記サブセット中の前記核酸分子の起源を特定するステップをさらに含む、項目6に記載の方法。
(項目9)
前記生体試料中の前記核酸分子の前記起源を含む出力を生成するステップをさらに含む、項目8に記載の方法。
(項目10)
前記第2の複数の核酸プローブの濃度が、前記核酸プローブのプール中の前記第1の複数の核酸プローブの濃度よりも高い、項目1に記載の方法。
(項目11)
前記プローブのプール中の前記第2の複数の核酸プローブの濃度が、前記核酸プローブのプール中の前記第1の複数の核酸プローブの濃度よりも高い、項目1に記載の方法。
(項目12)
前記第1の複数の核酸プローブが、ヒトエクソーム捕捉用プローブセットを含む、項目1に記載の方法。
(項目13)
前記第1の複数の核酸プローブが、ヒトV(D)Jの再編成または組換えによって作出されるジャンクション配列を標的にするように構成されたプローブを含む、項目1に記載の方法。
(項目14)
前記第2の複数の核酸プローブが、ヒトパピローマウイルスのE6遺伝子、E7遺伝子、および/または細菌の16SリボソームRNA遺伝子の1つもしくは複数のエレメントを標的にするように構成された1つまたは複数のプローブを含む、項目1に記載の方法。(項目15)
(b)の前記アッセイが、配列決定を行って、130塩基~280塩基の長さのペアエンドリード配列を生成することを含む、項目1に記載の方法。
(項目16)
(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出される相補性決定領域3(CDR3)配列、およびそれらの任意の組合せからなる群より選択されるデータの1つまたは複数のセットを含む1つまたは複数の生物医学レポートを生成するステップをさらに含む、項目1に記載の方法。
(項目17)
前記検出される非ヒト種が、抗原であり、前記CDR3配列が、抗原に結合する能力を有する、項目16に記載の方法。
(項目18)
前記1つまたは複数の生物医学レポートが、(i)~(iii)のいずれか2つを含む、項目16に記載の方法。
(項目19)
対象の生体試料を処理するための方法であって、
(a)前記生体試料から核酸分子のサブセットを生成するステップであって、前記核酸分子のサブセットが、(i)前記対象由来の第1の複数の核酸分子、および(ii)前記対象由来ではない第2の複数の核酸分子を含み、前記第1の複数の核酸分子の存在量が、前記生体試料中の前記第2の複数の核酸分子の存在量よりも多い、ステップ;ならびに
(b)前記核酸分子のサブセットをアッセイに付して、(i)前記第1の複数の核酸分子、および(ii)前記第2の複数の核酸分子の配列を含む配列情報を得るステップ
を含む、方法。
(項目20)
(i)の前記核酸分子が、前記対象のゲノムに由来する、項目19に記載の方法。
(項目21)
前記対象由来ではない前記第2の複数の核酸分子が、ウイルス、細菌、細菌のファージ、真菌、原生生物、古細菌、アメーバ、蠕虫、藻類、遺伝子改変細胞、および遺伝子改変ベクターからなる群より選択される1つまたは複数のメンバーを含む、項目19に記載の方法。
(項目22)
前記生体試料から前記核酸分子のサブセットを生成するステップが、1つまたは複数のハイブリダイゼーション反応を実施することを含む、項目19に記載の方法。
(項目23)
前記対象から前記生体試料を得るステップをさらに含み、前記生体試料が、腫瘍生検材料、全血、または血漿に由来する、項目19に記載の方法。
(項目24)
前記核酸分子のサブセットの前記配列を1つまたは複数の参照配列と整列させるステップをさらに含む、項目19に記載の方法。
(項目25)
前記1つまたは複数の参照配列が、複数の参照配列を含み、前記複数の参照配列が、2つまたはそれよりも多くの異なる種に対応する、項目24に記載の方法。
(項目26)
前記整列に基づいて、前記サブセット中の前記核酸分子の起源を特定するステップをさらに含む、項目24に記載の方法。
(項目27)
前記生体試料中の核酸分子の特定された前記起源を含む出力を生成するステップをさらに含む、項目26に記載の方法。
(項目28)
前記第1の複数の核酸分子の存在量が、前記生体試料中の前記第1の複数の核酸分子の存在量よりも多い、項目19に記載の方法。
(項目29)
前記サブセット中の前記第2の複数の核酸分子の相対存在量が、前記サブセット中の前記第1の複数の核酸分子の相対存在量よりも多い、項目19に記載の方法。
(項目30)
対象の生体試料を処理するためのシステムであって、
核酸分子のサブセットをアッセイに付して、(i)前記対象からの前記生体試料由来のヒト核酸、および(ii)前記対象の前記生体試料由来の非ヒト核酸の配列を含む配列情報を得るように、個々にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサーを含むプロセシングユニットであって、前記核酸分子のサブセットが、核酸プローブのプールを使用して、前記生体試料から生成され、前記プローブが、(i)ヒトゲノムのエレメントを標的にするように構成された第1の複数の核酸プローブ、および(ii)1つまたは複数の非ヒトゲノムのエレメントを標的にするように構成された第2の複数の核酸プローブを含む、プロセシングユニット;ならびに
前記配列情報を保存するように構成されたコンピュータメモリ
を含む、システム。
(項目31)
前記1つまたは複数のコンピュータプロセッサーが、前記配列と1つまたは複数の参照配列との整列を生成するようにプログラムされる、項目30に記載のシステム。
(項目32)
前記1つまたは複数の参照配列が、複数の参照配列を含み、前記複数の参照配列が、2つまたはそれよりも多くの異なる種に対応する、項目31に記載のシステム。
(項目33)
前記1つまたは複数のコンピュータプロセッサーが、前記整列に基づいて、前記サブセット中の前記核酸分子の起源を特定するようにプログラムされる、項目31に記載のシステム。
(項目34)
前記1つまたは複数のコンピュータプロセッサーが、前記生体試料中の前記核酸分子の前記起源を含む出力を生成するようにプログラムされる、項目33に記載のシステム。
(項目35)
前記1つまたは複数のコンピュータプロセッサーが、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出される相補性決定領域3(CDR3)配列、およびそれらの任意の組合せからなる群より選択される情報を含む1つまたは複数の生物医学レポートを生成するようにプログラムされる、項目30に記載のシステム。
(項目36)
対象の生体試料を処理するためのシステムであって、
核酸分子のサブセットをアッセイに付して、(i)前記第1の複数の核酸分子、および(ii)前記第2の複数の核酸分子の配列を含む配列情報を得るように、個々にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサーを含むプロセシングユニットであって、前記核酸分子のサブセットが、前記生体試料から生成され、前記核酸分子のサブセットが、(i)前記対象由来の第1の複数の核酸分子、および(ii)前記対象由来ではない第2の複数の核酸分子を含み、前記第1の複数の核酸分子の存在量が、前記生体試料中の前記第2の複数の核酸分子の存在量よりも多い、プロセシングユニット;ならびに
前記配列情報を保存するように構成されたコンピュータメモリ
を含む、システム。
(項目37)
前記1つまたは複数のコンピュータプロセッサーが、前記配列と1つまたは複数の参照配列との整列を生成するようにプログラムされる、項目36に記載のシステム。
(項目38)
前記1つまたは複数の参照配列が、複数の参照配列を含み、前記複数の参照配列が、2つまたはそれよりも多くの異なる種に対応する、項目37に記載のシステム。
(項目39)
前記1つまたは複数のコンピュータプロセッサーが、前記整列に基づいて、前記サブセット中の前記核酸分子の起源を特定するようにプログラムされる、項目37に記載のシステム。
(項目40)
前記1つまたは複数のコンピュータプロセッサーが、前記生体試料中の前記核酸分子の前記起源を含む出力を生成するようにプログラムされる、項目38に記載のシステム。
(項目41)
前記1つまたは複数のコンピュータプロセッサーが、(i)候補腫瘍ネオ抗原、(ii)検出される非ヒト種、(iii)検出される相補性決定領域3(CDR3)配列、およびそれらの任意の組合せからなる群より選択される情報を含む1つまたは複数の生物医学レポートを生成するようにプログラムされる、項目36に記載のシステム。