(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024119824
(43)【公開日】2024-09-03
(54)【発明の名称】循環微粒子を分析するための方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240827BHJP
C12Q 1/04 20060101ALI20240827BHJP
G01N 33/50 20060101ALI20240827BHJP
G01N 33/68 20060101ALI20240827BHJP
【FI】
C12Q1/6869 Z
C12Q1/04
G01N33/50 P
G01N33/68
【審査請求】有
【請求項の数】22
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024080461
(22)【出願日】2024-05-16
(62)【分割の表示】P 2020573510の分割
【原出願日】2018-12-21
(31)【優先権主張番号】1810571.8
(32)【優先日】2018-06-27
(33)【優先権主張国・地域又は機関】GB
(31)【優先権主張番号】18180259.6
(32)【優先日】2018-06-28
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
2.TWEEN
3.PYTHON
4.スタイロフォーム
(71)【出願人】
【識別番号】520512672
【氏名又は名称】シーエス ジェネティックス リミテッド
【氏名又は名称原語表記】CS GENETICS LIMITED
(74)【代理人】
【識別番号】100107456
【弁理士】
【氏名又は名称】池田 成人
(74)【代理人】
【識別番号】100162352
【弁理士】
【氏名又は名称】酒巻 順一郎
(74)【代理人】
【識別番号】100123995
【弁理士】
【氏名又は名称】野田 雅一
(72)【発明者】
【氏名】エーデルマン, ルーカス ブランドン
(57)【要約】 (修正有)
【課題】第1の循環微粒子を含む試料を分析する方法を提供する。
【解決手段】第1の循環微粒子を含む試料を分析する方法であって、前記第1の循環微粒子が膜小胞であり、前記第1の循環微粒子が少なくとも3つの標的分子を含み、前記標的分子のうちの少なくとも2つがゲノムDNA断片であり、前記標的分子のうちの少なくとも1つが標的ポリペプチドであり、前記方法が、前記標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、前記第1の循環微粒子に対する少なくとも2つの情報的に連結されたシグナルのセットを生成するステップを含む、方法である。
【選択図】
図30
【特許請求の範囲】
【請求項1】
循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、前記循環微粒子が膜小胞であり、前記循環微粒子が少なくとも3つの標的分子を含み、前記標的分子のうちの少なくとも2つがゲノムDNA断片であり、前記標的分子のうちの少なくとも1つが標的ポリペプチドであり、前記方法が、前記標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、前記循環微粒子に対する少なくとも2つの連結されたシグナルのセットを生成することを含み、前記連結されたシグナルのうちの少なくとも1つが、前記試料中の前記ゲノムDNA断片の存在、不在、および/またはレベルに対応し、前記連結されたシグナルのうちの少なくとも1つが、前記試料中の前記標的ポリペプチドの存在、不在、および/またはレベルに対応し、前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つを連結して、少なくとも2つの連結されたゲノムDNA断片のセットを生成することを含む、方法。
【請求項2】
前記ゲノムDNA断片が特定のヌクレオチド配列を含み、かつ/または前記ゲノムDNA断片が少なくとも1つの修飾ヌクレオチドまたは核酸塩基を含み、任意選択的に、前記修飾ヌクレオチドまたは核酸塩基が5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンである、請求項1に記載の方法。
【請求項3】
前記標的ポリペプチドが特定のアミノ酸配列を含み、かつ/または前記標的ポリペプチドが翻訳後修飾を含み、任意選択的に、前記標的ポリペプチドがアセチル化アミノ酸残基および/またはメチル化アミノ酸残基を含む、請求項1または請求項2に記載の方法。
【請求項4】
前記方法が、前記循環微粒子の前記標的分子の各々の存在、不在、および/またはレベルに対応する前記シグナルを測定して、前記循環微粒子に対する少なくとも3つの連結されたシグナルのセットを生成することを含み、前記連結されたシグナルのうちの1つが、前記循環微粒子の第1のゲノムDNA断片の存在、不在、および/またはレベルに対応し、前記連結されたシグナルのうちの1つが、前記循環微粒子の第2のゲノムDNA断片の存在、不在、および/またはレベルに対応し、前記連結されたシグナルのうちの1つが、前記循環微粒子の前記標的ポリペプチドの存在、不在、および/またはレベルに対応する、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々の配列を分析することを含み、任意選択的に、前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々の少なくとも一部を配列決定することを含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記セット内の前記連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することを含む、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、
(a)前記循環微粒子の前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々をバーコード配列に付加して、連結されたゲノムDNA断片のセットを生成することと、
任意選択的に、(b)前記セット内の前記連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み、前記少なくとも2つの連結された配列リードが前記バーコード配列によって連結される、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、
(a)前記循環微粒子の前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々をバーコード配列セットの異なるバーコード配列に付加して、連結されたゲノムDNA断片のセットを生成することと、
任意選択的に、(b)前記セット内の前記連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み、前記少なくとも2つの連結された配列リードが前記バーコード配列セットによって連結される、請求項1~6のいずれか1項に記載の方法。
【請求項9】
前記ゲノムDNA断片が少なくとも1つの修飾ヌクレオチドまたは核酸塩基を含み、前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記ゲノムDNA断片の前記修飾ヌクレオチドまたは核酸塩基の存在、不在、および/またはレベルに対応するシグナルを測定することを含み、任意選択的に、前記修飾ヌクレオチドまたは核酸塩基が5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンである、請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記修飾ヌクレオチドまたは核酸塩基の存在、不在、および/またはレベルに対応する前記シグナルが、(i)バーコード化親和性プローブであって、前記バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、前記バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、前記親和性部分が前記修飾ヌクレオチドまたは核酸塩基に結合することができ、任意選択的に、前記シグナルが、配列決定により前記バーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって測定される、バーコード化親和性プローブ、および/または(ii)光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブを使用して測定され、任意選択的に、前記シグナルが、フローサイトメトリーおよび/または蛍光活性化細胞選別によって測定される、請求項9に記載の方法。
【請求項11】
前記標的ポリペプチドの存在、不在、および/またはレベルに対応する前記シグナルが、(i)バーコード化親和性プローブであって、前記バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、前記バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、前記親和性部分が前記標的ポリペプチドに結合することができ、任意選択的に、前記シグナルが、配列決定により前記バーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって測定される、バーコード化親和性プローブ、および/または(ii)光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブを使用して測定され、任意選択的に、前記シグナルが、フローサイトメトリーおよび/または蛍光活性化細胞選別によって測定される、請求項1~10のいずれか1項に記載の方法。
【請求項12】
前記循環微粒子が、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の標的分子を含み、前記方法が、前記循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記標的分子が、少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個のゲノムDNA断片を含み、任意選択的に、前記方法が、前記循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、請求項1~12のいずれか1項に記載の方法。
【請求項14】
前記標的分子が、少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個の標的ポリペプチドを含み、任意選択的に、前記方法が、前記循環微粒子に対する少なくとも少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、請求項1~13のいずれか1項に記載の方法。
【請求項15】
前記試料が、第1の循環微粒子および第2の循環微粒子を含み、各循環微粒子が、請求項1~14のいずれか1項に定義される少なくとも3つの標的分子を含み、前記方法が、請求項1~14のいずれか1項に記載の測定するステップを行って、前記第1の循環微粒子に対する連結されたシグナルのセットを生成することと、請求項1~14のいずれか1項に記載の測定するステップを行って、前記第2の循環微粒子に対する連結されたシグナルのセットを生成することと、を含み、任意選択的に、前記試料が、n個の循環微粒子を含み、各循環微粒子が、請求項1~14のいずれか1項に定義される少なくとも3つの標的分子を含み、前記方法が、各循環微粒子に対する請求項1~14のいずれか1項に記載の測定するステップを行って、各循環微粒子に対する連結されたシグナルのセットを生成することを含み、任意選択的に、nが、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の循環微粒子である、請求項1~14のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、無細胞生体分子(例えば、無細胞核酸分子および無細胞ポリペプチド)の分析に関する。特に、循環微粒子内に含まれる、または循環微粒子に由来する無細胞生体分子の分析に関する。単一の循環微粒子の生体分子を分析するための試薬および方法を含む、循環微粒子の生体分子を分析するための試薬および方法が提供される。
【背景技術】
【0002】
循環中の無細胞DNA(cfDNA)は通常断片化されており(通常、長さは100~200塩基対の範囲)、そのためcfDNA分析の方法は従来、これらの短いDNA断片で見られ得る生物学的シグナルに焦点を当ててきた。例えば、例えば、母体循環内の胎児DNAを評価する胎児染色体トリソミーのための検査(いわゆる「非侵襲的出生前検査」またはNIPTの形式)など、個々の分子内の一塩基バリアントを検出するか、または多数の配列決定された断片全体で「分子カウント」を行って、大規模な染色体異常の存在を間接的に推測する。
【0003】
循環する無細胞DNAを分析するための多種多様な方法が以前に説明されている。特定の適用分野に応じて、これらのアッセイでは、循環腫瘍DNA(ctDNA)、無細胞胎児DNA(cffDNA)、および/もしくはリキッドバイオプシー、または非侵襲的出生前検査等、広く類似した試料タイプと技術的手法のセットに対して異なる用語を使用する場合がある。一般に、これらの方法は、配列決定用の循環無細胞DNAの試料を調製するための実験プロトコル、配列決定反応自体、および結果として得られた配列を分析して関連する生物学的シグナルを検出するための情報フレームワークを含む。この方法には、配列決定の前にDNAの精製と単離のステップが含まれる。つまり、後続の分析はDNA自体に含まれる情報のみに依存する必要がある。配列決定に続いて、かかる方法は一般に、その中の特定の突然変異の検出、および/または特定の染色体もしくは亜染色体領域の選択的濃縮または選択的枯渇の検出等、配列データの様々な側面を分析するために1つ以上の情報的フレームワークまたは統計的フレームワークを使用する(例えば、これは発育中の胎児における染色体異数性を示している可能性がある)。
【0004】
これらの方法の多くは、NIPTで使用するためのものである(例えば、米国特許第6258540B1号、同第8296076B2号、同第8318430B2号、同第8195415B2号、同第9447453B2号、および同第8442774B2号)。胎児の染色体異常(トリソミー等、および/または微小欠失等の亜染色体異常)を検出するために非侵襲的出生前検査を行うための最も一般的な方法では、cfDNAの多数の分子を配列決定し、結果として得られた配列をゲノムに(すなわち、配列がどの染色体および/または特定の染色体のどの部分に由来するかを決定するために)マッピングし、次に、1つ以上のかかる染色体または亜染色体領域について、それにマッピングされる配列の量を(例えば、リードの絶対数またはリードの相対数の形態で)決定し、次に、これを1つ以上の正常もしくは異常な閾値またはカットオフ値と比較し、かつ/または統計的検定を行って、当該領域が、(例えば、染色体トリソミーに対応し得る)配列の量で過大に表されている可能性があるかどうかを判断し、かつ/または、当該領域が、(例えば、微小欠失に対応し得る)配列の量において過小に表されている可能性があるかどうかを判断する。
【0005】
連結されていない個々の分子からのデータを使用して無細胞DNAを分析するための様々な追加または変更されたアプローチも説明されている(例えば、WO2016/094853A1、US2015/344970A1およびUS2015/0105267A1)。
【0006】
このように幅広い方法が存在するにもかかわらず、長距離の遺伝情報の信頼性の高い検出(例えば、フェージング)を可能にするcfDNAを分析する新しい方法と、より感度の高い方法が依然として必要とされている。例えば、NIPTの場合、胎児のcfDNAは、妊娠中の個体のcfDNA全体のごく一部にすぎない(循環DNAの大部分は正常な母体のDNAである)。したがって、NIPTの技術的課題の大部分は、胎児のcfDNAを母体のDNAから区別することにある。同様に、がんの患者では、cfDNAは、循環DNA全体のごく一部にすぎない。したがって、がんの診断またはモニタリングのためのcfDNA分析の使用に関して、同様の技術的課題が存在する。
【0007】
これとは別に、蛍光活性化細胞選別(FACS)による細胞型特異的アポトーシス小体の単離を可能にする方法(Atkin-Smith et al.,2017.Scientific Reports 7,39846)、および単一の細胞外小胞におけるタンパク質マーカーの多重プロファイリングを可能にする方法(Lee et al.,2018.ACS Nano.23,12(1),494-503)も説明されている。
【発明の詳細な説明】
【0008】
本発明は、アポトーシス小体等の循環微粒子を含む試料(または循環微粒子に由来する試料)を分析するための方法を提供する。本発明は、単一の循環微粒子内に含まれる、または単一の循環微粒子に由来する異なるタイプの生体分子のマルチパラメトリック測定に基づいている。特に、本発明は、同じ循環微粒子中の2つ以上のタイプの標的生体分子の存在、不在、および/またはレベルに対応する連結されたシグナルの測定を可能にする。
図30に示されるように、(例えば、区画化、バーコード化および配列決定によって)ゲノムDNAの断片のレベルに対応するシグナルが生成され得、(例えば、バーコード化親和性プローブを使用して)標的ポリペプチドのレベルに対応するシグナルが生成され得る。さらに、修飾ヌクレオチド(例えば、5-メチルシトシンを含むヌクレオチド)のレベルに対応するシグナルが(例えば、ゲノムDNAの断片中の5-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用するような親和性ベースの濃縮アプローチによって)生成され得る。したがって、これらの測定および関連する技術は、循環微粒子の物理的および生物学的状態に対応する一連の連結されたシグナルを生成する。
【0009】
本明細書で提供されるマルチパラメトリック方法は、PCT/GB2017/053820、PCT/GB2017/053812、およびPCT/GB2017/053816で発明者によって提供された以前の発明に情報の追加の層を追加する。
【0010】
PCT/GB2017/053820において、発明者は以前に、循環微粒子(または血液に由来する微粒子)中の核酸断片を分析するための方法を提供した。その発明は、単一の微粒子からの核酸の断片が一緒に連結される連結断片アプローチに基づいている。このリンケージにより、単一の微粒子からの断片の配列に対応する連結された配列リードのセット(すなわち、連結されたシグナルのセット)の生成が可能になる。
【0011】
連結断片アプローチは、高感度のcfDNA分析を提供し、長距離の遺伝情報の検出も可能にする。このアプローチは、洞察を組み合わせることに基づいている。第一に、この方法は、個々の循環微粒子(例えば、個々の循環アポトーシス小体)が、アポトーシスを受けた同じ個々の細胞(体内のある位置)から生成されたゲノムDNAの断片の数を含むという洞察を利用する。第二に、個々の微粒子内のゲノムDNAのかかる断片の一部は、1つ以上の特定の染色体領域からの配列を優先的に含む。したがって、累積的に、かかる循環微粒子は、データが豊富で多機能の「分子聴診器」として機能し、体内のどこかの限られた体細胞組織空間で発生する非常に複雑であり得る遺伝子イベントを観察する。重要なことに、かかる微粒子は大部分がクリアランスまたは代謝の前に循環に入るので、それらは非侵襲的に検出され得る。本発明は、これらの「聴診器」、すなわち、分析および診断タスクを行う連結された断片および連結された配列リードのセット(単一の個々の微粒子、または多くの実施形態では、多数の単一の循環微粒子を含む複合体試料のいずれか)を使用する実験的かつ有益な方法を説明する。
【0012】
本発明は、例えば、単一の循環微粒子における非核酸分子(例えば、標的ポリペプチド)と核酸分子(例えば、ゲノムDNAの断片)との共局在化によって提供されるデータを利用することによって、「分子聴診器」の概念を進歩させるものである。この進歩は、血液中で特異で自由に拡散するのではなく、循環内に含まれる多くの生体分子(例えば、核酸分子およびポリペプチド)が循環微粒子内に生物物理学的に保持されるという発見に基づいている。本発明は、循環微粒子の複数の標的生体分子の存在、不在、および/またはレベルに対応するシグナルを測定することによってこの豊富な情報源を利用して、循環微粒子の(情報的に)連結されたシグナルのセットを生成する。さらに、このセットに、特定の細胞または組織タイプに特徴的な1つ以上の標的生体分子に対応する1つ以上のシグナルを含めることにより、単一の循環微粒子に由来する特定の連結されたシグナルのセットの細胞起源を決定することができる。これにより、連結されたシグナルのセットに「細胞コンテキスト」が提供され、現在利用可能な方法よりもはるかに豊富な情報源が提供される。そうすることで、本発明は、高精度、感度、および正確さを備えた分析方法を提供する。かかる方法は、がんの診断およびモニタリング、ならびにNIPT等の幅広い診断およびモニタリングの用途に明確に適用される。
【0013】
発明者は以前に、バーコード化に関連する試薬および方法を提供している。WO2016/207639において、発明者は、多量体バーコード化試薬を含む分子バーコード化のための幅広い試薬、キット、および方法を提供している。PCT/GB2017/053812において、発明者は、分子バーコード化のためのさらなる方法および試薬を提供している。PCT/GB2017/053816において、発明者は、単一細胞の核酸の分子バーコード化のための試薬および方法を提供している。
【0014】
WO2016/207639、PCT/GB2017/053812、PCT/GB2017/053816、およびPCT/GB2017/053820の全内容は、参照により本明細書に組み込まれる。
【0015】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも2つの標的分子を含み、少なくとも2つの標的分子が生体分子であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料中の第1の生体分子の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料中の第2の生体分子の存在、不在、および/またはレベルに対応する。
【0016】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも2つの標的分子を含み、少なくとも2つの標的分子が生体分子であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する単一シグナルを生成することを含み、単一シグナルが、試料中の生体分子の存在、不在、および/またはレベルに対応する。
【0017】
第1の生体分子は、標的核酸の断片(例えば、ゲノムDNAの断片)であり得、第2の生体分子は、標的(または事前定義された)非核酸生体分子(例えば、標的ポリペプチド)であり得る。任意選択的に、標的核酸の断片は、少なくとも1つの修飾ヌクレオチドまたは核酸塩基を含み得る。
【0018】
標的分子は、標的核酸(例えば、ゲノムDNA)の少なくとも1つ、または好ましくは少なくとも2つの断片を含み得る。
【0019】
第1の生体分子は、ポリペプチドであり得、第2の標的生体分子は、エピジェネティック修飾(例えば、5-ヒドロキシ-メチルシトシンDNAまたは5-メチルシトシンDNA)を含む標的核酸(例えば、ゲノムDNA)の断片であり得る。
【0020】
第1の生体分子は、5-ヒドロキシ-メチルシトシンDNAであり得、第2の標的生体分子は、RNAの断片であり得る。
【0021】
第1の生体分子は、5-メチルシトシンDNAであり得、第2の標的生体分子はRNAの断片であり得る。
【0022】
第1の生体分子は、5-ヒドロキシ-メチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0023】
第1の生体分子は、5-メチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0024】
第1および第2の生体分子は、生体分子群1から選択され得る。
【0025】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つがゲノムDNA断片であり、標的分子のうちの少なくとも1つがRNA断片であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも1つが試料中のゲノムDNA断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが試料中のRNA断片の存在、不在、および/またはレベルに対応する。
【0026】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つがゲノムDNA断片であり、標的分子のうちの少なくとも1つがRNA断片であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する単一シグナルを生成することを含み、単一シグナルが、試料中のゲノムDNA断片およびRNA断片の存在、不在、および/またはレベルに対応する。
【0027】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つが標的核酸(例えば、ゲノムDNA)の断片であり、標的分子のうちの少なくとも1つが標的生体分子(例えば、標的ポリペプチド)であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも3つの(情報的に)連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも2つの各々が、試料中の標的核酸(例えば、ゲノムDNA)の断片のうちの1つの存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料中の標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0028】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つが標的核酸(例えば、ゲノムDNA)の断片であり、標的分子のうちの少なくとも1つが標的生体分子(例えば、標的ポリペプチド)であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料中の標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料中の標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0029】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つが標的核酸(例えば、ゲノムDNA)の断片であり、標的分子のうちの少なくとも1つが標的生体分子(例えば、標的ポリペプチド)であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する単一シグナルを生成することを含み、単一シグナルが、試料中の標的核酸(例えば、ゲノムDNA)の断片および標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0030】
標的核酸(例えば、ゲノムDNA)の断片は、ヌクレオチドの特定の配列を含み得、かつ/または標的核酸(例えば、ゲノムDNA)の断片は、少なくとも1つの修飾ヌクレオチドもしくは核酸塩基を含み得る。標的核酸の断片は、ヌクレオチドの特定の配列を含まない場合がある。標的核酸の断片は、非標的および/または未知のおよび/またはランダムに選択されたおよび/またはランダムにサンプリングされたヌクレオチド配列を含み得る。例えば、修飾ヌクレオチドまたは核酸塩基は、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンであり得る。標的核酸(例えば、ゲノムDNA)の断片は、1つもしくはマイクロサテライトの配列および/またはマイクロサテライトのゲノム領域(すなわち、短いタンデムリピート)を含み得る。
【0031】
標的ポリペプチドは、特定のアミノ酸配列を含み得、かつ/または標的ポリペプチドは、翻訳後修飾を含み得る。例えば、標的ポリペプチドは、アセチル化アミノ酸残基および/またはメチル化アミノ酸残基(例えば、特定のポリペプチド上/内の特定のアセチル化アミノ酸残基および/または特定のポリペプチド上/内の特定のメチル化アミノ酸残基)を含み得る。
【0032】
この方法は、循環微粒子の標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも3つの(情報的に)連結されたシグナルのセットを生成することを含み得、連結されたシグナルのうちの1つが、循環微粒子の標的核酸(例えば、ゲノムDNA)の第1の断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの1つが、循環微粒子の標的核酸(例えば、ゲノムDNA)の第2の断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの1つが、循環微粒子の標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0033】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片のうちの少なくとも2つの各々の配列を分析することを含み得、任意選択的に、標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含む。
【0034】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片のうちの少なくとも2つを連結して、標的核酸(例えば、ゲノムDNA)の少なくとも2つの連結された断片のセットを生成することと、任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の配列を分析することとを含み得る。ステップ(b)は、セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。
【0035】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)循環微粒子の標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片のうちの少なくとも2つの各々をバーコード配列に付加して、標的核酸(例えば、ゲノムDNA)の連結された断片のセットを生成することと、任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の配列を分析することとを含み得る。ステップ(b)は、セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得、少なくとも2つの連結された配列リードがバーコード配列によって連結される。任意選択的に、標的核酸の少なくとも2つの断片のうちの少なくとも2つの各々は、同じバーコード配列を含み得る。
【0036】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)循環微粒子の標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片のうちの少なくとも2つの各々をバーコード配列のセットの異なるバーコード配列に付加して、標的核酸(例えば、ゲノムDNA)の連結された断片のセットを生成することと、任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の配列を分析することとを含み得る。ステップ(b)は、セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。少なくとも2つの連結された配列リードは、バーコード配列のセットによって連結され得る(すなわち、標的核酸の第1の断片に付加されたバーコード配列および標的核酸の第2の断片に付加されたバーコード配列は、バーコード配列の同じセット内に存在することにより、2つの配列リードを互いに連結する)。
【0037】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)第1のバーコード配列を標的核酸(例えば、ゲノムDNA)の第1の断片に付加して、第1のバーコード化標的核酸分子を生成し、第2のバーコード配列を標的核酸(例えば、ゲノムDNA)の第2の断片に付加して、第2のバーコード化標的核酸分子を生成することであって、第1および第2のバーコード配列が各々同じバーコード配列を含むか、または各々がバーコード配列のセットの異なるバーコード配列を含む、生成することと、任意選択的に、(b)第1および第2のバーコード化標的核酸分子の各々の配列を分析することとを含み得る。ステップ(b)は、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。少なくとも2つの連結された配列リードは、同じバーコード配列またはバーコード配列のセットによって連結され得る。ステップ(b)は、標的核酸の第1および第2の断片に付加された第1および第2のバーコード配列の各々の全てまたは少なくとも一部を配列決定することを含み得る。
【0038】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)第1のバーコード化オリゴヌクレオチドを標的核酸(例えば、ゲノムDNA)の第1の断片に付加して、第1のバーコード化標的核酸分子を生成し、第2のバーコード化オリゴヌクレオチドを標的核酸(例えば、ゲノムDNA)の第2の断片に付加(例えば、アニールまたはライゲート)して、第2のバーコード化標的核酸分子を生成することであって、第1および第2のバーコード化オリゴヌクレオチドが各々同じバーコード配列を含むか、または各々がバーコード配列のセットの異なるバーコード配列を含む、生成することと、任意選択的に、(b)第1および第2のバーコード化標的核酸分子の各々の配列を分析することとを含み得る。ステップ(b)は、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。少なくとも2つの連結された配列リードは、同じバーコード配列またはバーコード配列のセットによって連結され得る。ステップ(b)は、標的核酸の第1および第2の断片に付加された第1および第2のバーコード化オリゴヌクレオチドの各々の全てまたは少なくとも一部を配列決定することを含み得る。
【0039】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)試料を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含む、接触させることと、(b)バーコード配列を微粒子の標的核酸の第1および第2の断片の各々に付加して、微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が第1のバーコード化領域の核酸配列を含み、第2のバーコード化標的核酸分子が第2のバーコード化領域の核酸配列を含む、生成することとを含み得る。第1および第2のバーコード領域は各々、同じバーコード配列を含み得るか、または第1および第2のバーコード領域は、バーコード配列のセットの異なるバーコード配列を含み得る。この方法は、(c)第1および第2のバーコード化標的核酸分子の各々の配列を分析することをさらに含み得る。ステップ(c)は、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。少なくとも2つの連結された配列リードは、同じバーコード配列またはバーコード配列のセットによって連結され得る。
【0040】
標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)試料を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が一緒に連結された第1のバーコード化オリゴヌクレオチドおよび第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドが各々バーコード領域を含む、接触させることと、(b)第1および第2のバーコード化オリゴヌクレオチドを微粒子の標的核酸の第1および第2の断片に付加(例えば、アニールまたはライゲート)して、第1および第2のバーコード化標的核酸分子を生成することとを含み得る。第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は各々、同じバーコード配列を含み得るか、または第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は各々、バーコード配列のセットの異なるバーコード配列を含み得る。この方法は、(c)第1および第2のバーコード化標的核酸分子の各々の配列を分析することをさらに含み得る。ステップ(c)は、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することを含み得る。少なくとも2つの連結された配列リードは、同じバーコード配列またはバーコード配列のセットによって連結され得る。
【0041】
標的核酸(例えば、ゲノムDNA)の断片は、少なくとも1つのエピジェネティック修飾(例えば、修飾ヌクレオチドまたは核酸塩基)を含み得、標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、標的核酸(例えば、ゲノムDNA)の断片のエピジェネティック修飾(例えば、修飾ヌクレオチドまたは核酸塩基)の存在、不在、および/またはレベルに対応するシグナルを測定することを含み得る。例えば、修飾ヌクレオチドまたは核酸塩基は、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンを含み得る。
【0042】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも2つの標的分子を含み、標的分子のうちの少なくとも1つがエピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の断片であり、標的分子のうちの少なくとも1つが標的生体分子(例えば、標的ポリペプチド)であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも1つが試料中のエピジェネティック修飾の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが試料中の標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0043】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子が少なくとも2つの標的分子を含み、標的分子のうちの少なくとも1つがエピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の断片であり、標的分子のうちの少なくとも1つが標的生体分子(例えば、標的ポリペプチド)であり、この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する単一シグナルを生成することを含み、単一シグナルが、試料中のエピジェネティック修飾の断片および標的生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応する。
【0044】
この方法は、エピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の配列を分析するステップを含み得る。あるいは、この方法は、エピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の配列を分析するステップを含まなくてもよい。
【0045】
エピジェネティック修飾は、修飾ヌクレオチド、例えば、修飾gDNAヌクレオチドまたは修飾RNAヌクレオチドを含み得る。修飾ヌクレオチドは、修飾塩基を含み得る。修飾塩基は、メチル化塩基、例えば、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンであり得る。エピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の断片は、5-メチルシトシンDNAまたは5-ヒドロキシ-メチルシトシンDNAを含み得る。
【0046】
エピジェネティック修飾(例えば、修飾されたDNAまたはRNAヌクレオチド)の存在、不在、および/またはレベルに対応するシグナルは、バーコード化親和性プローブを使用して測定することができる。バーコード化親和性プローブは、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み得、ここで、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、親和性部分は、標的生体分子に結合することができる(すなわち、エピジェネティック修飾に結合することができる)。シグナルは、バーコード化親和性プローブのバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって(例えば、配列決定またはPCRによって)測定され得る。
【0047】
エピジェネティック修飾(例えば、修飾されたDNAまたはRNAヌクレオチド)の存在、不在、および/またはレベルに対応するシグナルは、フローサイトメトリーならびに/または光学的に標識された親和性プローブおよび/もしくは蛍光標識された親和性プローブを使用した蛍光活性化細胞選別によって測定され得る。光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、光学顕微鏡および/または蛍光顕微鏡可視化を使用して測定および/または検出され得る。例えば、蛍光顕微鏡を使用して、および/または蛍光レーザーベースの検出を使用して、および/または蛍光活性化細胞選別(FACS)機器を使用して。光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、選定プロセスを使用して、例えば、蛍光活性化細胞選別(FACS)を使用して測定および/または検出され得る。
【0048】
エピジェネティック修飾(例えば、修飾されたDNAまたはRNAヌクレオチド)の存在、不在、および/またはレベルに対応するシグナルは、分子変換ステップを含む方法を使用して測定され得る。修飾ヌクレオチド(すなわち、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等の修飾塩基を含むヌクレオチド)の場合、分子変換ステップを行って、当該修飾塩基(複数可)を異なる修飾または非修飾ヌクレオチドに変換することができる。これは(例えば、PCRまたは配列決定を使用して)検出され、エピジェネティック修飾の存在、不在、および/またはレベルに対応するシグナルを提供する。この変換ステップは、重亜硫酸塩変換ステップ、酸化的重亜硫酸塩変換ステップ、または任意の他の分子変換ステップを含み得る。この方法は、循環微粒子のゲノムDNAの断片中の5-メチルシトシンを測定するために使用できる。
【0049】
この方法は、1つ以上の循環微粒子を含む試料(または1つ以上の循環微粒子に由来する試料)を区画化する1つ以上のステップをさらに含み得る。加えてまたはあるいは、この方法は、任意の1つ以上のバーコード配列を付加する、ならびに/またはバーコード配列および/もしくはバーコード化オリゴヌクレオチドを標的核酸の1つ以上の断片に区画化する1つ以上のステップをさらに含み得る。1つ以上のバーコード配列および/またはバーコード化オリゴヌクレオチドは、本明細書に記載されるような1つ以上の多量体バーコード化試薬によって提供され、かつ/またはその中に含まれ得る。
【0050】
非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応するシグナルは、バーコード化親和性プローブを使用して測定することができる。バーコード化親和性プローブは、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み得、ここで、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、親和性部分は、標的生体分子(すなわち、標的非核酸生体分子(例えば、標的ポリペプチド))に結合することができる。シグナルは、バーコード化親和性プローブのバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって(例えば、配列決定またはPCRによって)測定され得る。
【0051】
非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応するシグナルは、フローサイトメトリーならびに/または光学的に標識された親和性プローブおよび/もしくは蛍光標識された親和性プローブを使用した蛍光活性化細胞選別によって測定され得る。光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、光学顕微鏡および/または蛍光顕微鏡可視化を使用して測定および/または検出され得る。例えば、蛍光顕微鏡を使用して、および/または蛍光レーザーベースの検出を使用して、および/または蛍光活性化細胞選別(FACS)機器を使用して。光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、選定プロセスを使用して、例えば、蛍光活性化細胞選別(FACS)を使用して測定および/または検出され得る。
【0052】
非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応するシグナルは、親和性プローブで標識された支持体によって測定され得る。親和性プローブで標識された支持体は、例えば、標的ポリペプチドに特異的な抗体で標識された、親和性プローブで標識されたビーズ(磁性ビーズ等)を含み得る。非核酸生体分子(例えば、循環微粒子内の標的ポリペプチド)の存在、不在、および/またはレベルは、当該非核酸生体分子を、当該支持体上の当該親和性プローブ(複数可)にインキュベートおよび/または結合することによって測定することができる。任意選択的に、支持体結合画分(すなわち、高レベルの当該非核酸生体分子を含む、および/または含む微粒子(複数可))は、さらに単離および/または処理(例えば、区画化および/またはバーコード化および/または核酸配列決定による分析)される。任意選択的に、支持体非結合画分(すなわち、低レベルの当該非核酸生体分子を含まないか、かつ/または含む微粒子(複数可))がさらに単離および/または処理(例えば、区画化および/またはバーコード化および/または核酸配列決定による分析)される。
【0053】
非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応するシグナルは、核酸生体分子の存在、不在、および/またはレベルに対応するシグナルとは別に測定され得る。例えば、非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応するシグナルは、FACSによって測定され得、そして核酸生体分子の存在、不在、および/またはレベルに対応するシグナルは、配列決定によって測定され得る。
【0054】
この方法では、標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応する(または各々の)循環微粒子、エピジェネティック修飾(例えば、5-メチルシトシンおよび/または5-ヒドロキシメチルシトシンを含む修飾ヌクレオチド等の修飾ヌクレオチド)ならびに標的非核酸生体分子(例えば、標的ポリペプチド)について、連結されたシグナルのセットが測定され得る。
【0055】
例えば、この方法では、循環微粒子の標的分子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの(異なる)断片、エピジェネティック修飾を含む標的核酸(例えば、ゲノムDNA)の少なくとも1つの断片、および少なくとも1つの標的非核酸生体分子(例えば、標的ポリペプチド)を含み得る。この方法は、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子の連結されたシグナルのセットを生成することを含み得る。方法は、標的分子の各々に(異なる)連結されたシグナルを提供し得る。この方法では、連結されたシグナルのうちの少なくとも2つの各々は、標的核酸(例えば、ゲノムDNA)の断片のうちの1つの存在、不在、および/またはレベルに対応し得る。連結されたシグナルのうちの少なくとも1つは、エピジェネティック修飾(例えば、5-メチルシトシンおよび/または5-ヒドロキシメチルシトシンを含む修飾ヌクレオチド等の修飾ヌクレオチド)の存在、不在、および/またはレベルに対応し得る。そして、連結されたシグナルのうちの少なくとも1つは、標的非核酸生体分子(例えば、標的ポリペプチド)の存在、不在、および/またはレベルに対応し得る。
【0056】
循環微粒子は、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の(異なる)標的分子を含み得、かつ任意選択的に、この方法は、循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の(異なる)連結されたシグナル(すなわち、循環微粒子の標的分子の各々の(異なる)連結されたシグナル)のセットを生成することを含む。
【0057】
循環微粒子の標的分子は、標的核酸(例えば、ゲノムDNA)の少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個の(異なる)断片、および少なくとも1つの標的非核酸生体分子(例えば、標的ポリペプチド)を含み得る。任意選択的に、この方法は、循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の(異なる)連結されたシグナル(すなわち、循環微粒子の標的分子の各々の(異なる)連結されたシグナル)のセットを生成することを含む。
【0058】
循環微粒子の標的分子は、少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個の(異なる)標的ポリペプチド、および標的核酸(例えば、ゲノムDNA)の少なくとも1つの断片を含み得る。任意選択的に、この方法は、循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の(異なる)連結されたシグナル(すなわち、循環微粒子の標的分子の各々の(異なる)連結されたシグナル)のセットを生成することを含む。
【0059】
試料は、第1および第2の循環微粒子を含み得、ここで、各循環微粒子は、標的分子(例えば、少なくとも2つまたは少なくとも3つの標的分子)を含み、この方法は、(本明細書に記載のように)測定するステップを行って、第1の循環微粒子に対する連結されたシグナルのセットを生成をすることと、本明細書に記載のように測定するステップを行って、第2の循環微粒子に対する連結されたシグナルのセットを生成することと、を含む。
【0060】
例えば、標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)試料を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含み、第1の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域とは異なる、接触させることと、(b)バーコード配列を第1の微粒子の標的核酸の第1および第2の断片の各々に付加して、第1の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成すること、およびバーコード配列を第2の微粒子の標的核酸の第1および第2の断片の各々に付加して、第2の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、を含む。
【0061】
例えば、標的核酸(例えば、ゲノムDNA)の断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップは、(a)試料を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドが各々、バーコード領域を含み、ライブラリの第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域とは異なる、接触させることと、(b)第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第1の微粒子の標的核酸の第1および第2の断片に付加(例えば、アニールまたはライゲート)して、第1および第2のバーコード化標的核酸分子を生成すること、および第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第2の微粒子の標的核酸の第1および第2の断片に付加(例えば、アニールまたはライゲート)して、第1および第2のバーコード化標的核酸分子を生成することと、を含む。
【0062】
試料は、n個の循環微粒子を含み得、ここで、各循環微粒子は、標的分子(例えば、少なくとも2つまたは少なくとも3つの標的分子)を含み、この方法は、各循環微粒子について(本明細書に記載のように)測定するステップを行って、各循環微粒子に対する連結されたシグナルのセットを生成することを含む。任意選択的に、nは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の循環微粒子である。
【0063】
この方法は、連結されたシグナルのセットが由来する標的生体分子の起源の細胞および/または起源の組織の同一性を決定するステップをさらに含み得る。起源の細胞および/または起源の組織の同一性を決定するステップは、連結されたシグナルのセットにおいて1つ以上のシグネチャシグナルを特定することを含み得る。シグネチャシグナルは、シグネチャ標的生体分子の存在、不在、および/またはレベルに対応するシグナルであり得る。ここで、シグネチャ標的生体分子は、特定の細胞および/または組織に特徴的な標的生体分子である。
【0064】
シグネチャシグナルは、任意の2つ以上のシグネチャ標的生体分子の存在、不在、および/またはレベルに対応する組み合わせシグネチャシグナルであり得る。ここで、当該シグネチャ標的生体分子は、特定の細胞および/または組織に特徴的な標的生体分子である(例えば、当該標的生体分子は一緒になって、特定の細胞および/または組織に特徴的である)。例えば、組み合わせシグネチャシグナルは、生体分子群1からの任意の2つ以上の生体分子の存在、不在、および/またはレベルに対応し得る。任意選択的に、組み合わせシグネチャシグナルは、生体分子群1からの任意の2つ以上の生体分子、ならびに任意の1つ以上の参照配列、ならびに任意の1つ以上のエピジェネティックシグナル(5-メチルシトシンに対応する1つ以上のシグナル、および/または5-ヒドロキシメチルシトシンに対応する1つ以上のシグナル等)の存在、不在、および/またはレベルに対応し得る。シグネチャシグナルは、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも30、または少なくとも50個のシグネチャ標的生体分子(および/もしくは参照配列のリストまたは群等のそのリストまたは群、ならびに/または5-メチルシトシンおよび/または5-ヒドロキシメチルシトシンに対応するシグナルのリストまたは群)のような任意の数のシグネチャ標的生体分子の存在、不在、および/またはレベルに対応する組み合わせシグネチャシグナルであり得る。
【0065】
起源の細胞は、特定の対象(例えば、胎児細胞、母体細胞、または父体細胞)に由来し得る。起源の細胞は、肺細胞、肝臓細胞、卵巣細胞、腎臓細胞、膵臓細胞、子宮細胞、皮膚細胞、上皮細胞、内皮細胞、脳細胞、膀胱細胞、血液細胞、リンパ球細胞、前立腺細胞、乳房細胞、結腸直腸細胞、脳細胞、子宮細胞、心臓細胞、血管細胞(動脈細胞もしくは静脈細胞等)、および/または任意の他のタイプの細胞であり得る。
【0066】
起源の細胞は、がん性細胞または悪性細胞であり得る。起源の細胞は、肺がん細胞、乳がん細胞、卵巣がん細胞、前立腺がん細胞、腎臓がん細胞、肝臓がん細胞、血液がん細胞、白血病細胞、リンパ腫細胞、結腸直腸がん細胞、膵臓がん細胞、脳がん細胞、子宮がん細胞、胆管がん細胞、皮膚がん細胞、黒色腫細胞、膀胱がん細胞、食道がん細胞、口腔がん細胞、咽頭がん細胞、および/または任意の他のタイプのがん細胞であり得る。
【0067】
起源の組織は、特定の対象(例えば、胎児組織、母体組織、または父体組織)に由来し得る。起源の組織は、肺組織、肝臓組織、卵巣組織、心臓組織、血管組織、血管内組織、血管内プラーク組織、安定な血管内プラーク組織、不安定および/もしくは脆弱な血管内プラーク組織、アテローム性動脈硬化組織、血栓症組織、塞栓組織、脳血管組織、心内膜炎組織、心筋炎組織、末梢動脈組織、脳組織、心筋症組織、ならびに/または任意の他の組織であり得る。
【0068】
起源の組織は、がん性組織または悪性組織であり得る。起源の組織は、がん性肺組織、がん性肝臓組織、がん性卵巣組織、がん性乳房組織、がん性前立腺組織、がん性血液組織、がん性白血病組織、がん性リンパ腫組織、がん性結腸直腸組織、がん性膵臓組織、がん性脳組織、がん性皮膚組織、がん性黒色腫組織、がん性膀胱組織、がん性食道組織、および/または任意の他のがん性組織であり得る。
【0069】
シグネチャシグナルは、第1のシグネチャ生体分子の存在、不在、および/またはレベルに対応するシグナルと、第2のシグネチャ生体分子の存在、不在、および/またはレベルに対応するシグナルとを含み得る。第1および第2のシグネチャ生体分子は、標的生体分子について本明細書に記載されている形態のいずれかをとることができる。例えば、シグネチャシグナルは、生体分子群1にリストされた任意の1つ以上の生体分子の存在、不在、および/またはレベルに対応するシグナルを含み得る。
【0070】
シグネチャ生体分子は、特定の細胞型または組織タイプ(例えば、がん細胞または胎児細胞)でのみ発現されるポリペプチドであり得る。シグネチャ生体分子は、特定の細胞型または組織タイプ(例えば、がん細胞または胎児細胞)で優先的に発現されるポリペプチドであり得る。シグネチャ生体分子は、特定の細胞型または組織タイプ(例えば、がん細胞もしくは胎児細胞、または血管内プラーク等の血管内組織)でのみ発現される(または優先的に発現される)核酸(mRNA分子またはマイクロRNA分子等)であり得る。例えば、シグネチャ生体分子は、生体分子群1にリストされた任意の1つ以上の生体分子を含み得る。
【0071】
シグネチャ生体分子は、エピジェネティック修飾、例えば、5-ヒドロキシメチルシトシンを含むゲノムDNA断片であり得る。5-ヒドロキシメチルシトシンを含むゲノムDNA断片は、がん性および/または悪性の細胞または組織にシグネチャシグナルを提供し得る。
【0072】
シグネチャ生体分子は、ポリペプチドまたはそのポリペプチドをコードするRNA、例えば、TTF-1(NK2ホメオボックス1としても知られている)またはTTF-1 RNAであり得る。TTF-1(またはTTF-1 RNA)は、肺細胞および/または組織に対するシグネチャシグナルを提供し得る。
【0073】
肺がんのシグネチャシグナルは、5-ヒドロキシメチルシトシン(第1のシグネチャ生体分子)を含むゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルと、(第2のシグネチャ生体分子として)TTF-1またはTTF-1 RNAの存在、不在、および/またはレベルに対応するシグナルを測定することによって提供され得る。
【0074】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、この方法は、(a)試料をバーコード化親和性プローブと接触させることであって、バーコード化親和性プローブが、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが、少なくとも1つのヌクレオチドを含み(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、親和性部分が、標的生体分子に結合することができる、接触させることと、(b)反応混合物を形成することであって、反応混合物を形成するステップが、親和性部分が存在する場合、標的分子に結合して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することを含む、形成することと、(c)反応混合物中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することにより、試料中の標的生体分子の存在、不在、および/またはレベルを決定することと、を含む。
【0075】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子は標的生体分子を含み、この方法は、(a)試料をバーコード化親和性プローブと接触させることであって、バーコード化親和性プローブが、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが、少なくとも1つのヌクレオチドを含み(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、親和性部分が、標的生体分子に結合することができる、接触させることと、(b)反応混合物を形成することであって、反応混合物を形成するステップが、親和性部分を標的生体分子に結合して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することを含む、形成することと、(c)反応混合物中のバーコード化オリゴヌクレオチドのレベルを測定することにより、試料中の標的生体分子のレベルを決定することと、を含む。
【0076】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、この方法は、(a)試料を少なくとも1つの親和性部分と接触させることであって、親和性部分が標的生体分子に結合することができる、接触させることと、(b)反応混合物を形成することであって、反応混合物を形成するステップが、(i)存在する場合、親和性部分を標的生体分子に結合することと、(ii)試料をバーコード化オリゴヌクレオチドと接触させ、バーコード化オリゴヌクレオチドを親和性部分に連結して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することと、を含み、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含む(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、形成することと、(c)反応混合物中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することにより、試料中の標的生体分子の存在、不在、および/またはレベルを決定することと、を含む。
【0077】
本発明は、循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法を提供し、循環微粒子は標的生体分子を含み、この方法は、(a)試料を少なくとも1つの親和性部分と接触させることであって、親和性部分が標的生体分子に結合することができる、接触させることと、(b)反応混合物を形成することであって、反応混合物を形成するステップが、(i)親和性部分を標的生体分子に結合することと、(ii)試料をバーコード化オリゴヌクレオチドと接触させ、バーコード化オリゴヌクレオチドを親和性部分に連結して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することと、を含み、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含む(すなわち、バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長のヌクレオチド配列を含む)、形成することと、(c)反応混合物中のバーコード化オリゴヌクレオチドのレベルを測定することにより、試料中の標的生体分子のレベルを決定することと、を含む。
【0078】
反応混合物を形成するステップは、親和性部分の標的生体分子への結合に適した条件下で試薬をインキュベートすることを含み得る。
【0079】
試料中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定するステップの前に、この方法は、バーコード化生体分子複合体の一部ではないバーコード化親和性プローブおよび/またはバーコード化オリゴヌクレオチドを除去または枯渇させることを含み得る。
【0080】
反応混合物中のバーコード化オリゴヌクレオチドのレベルを測定することは、反応混合物中のバーコード化オリゴヌクレオチドのレベルを定量することを含み得る。
【0081】
バーコード化オリゴヌクレオチドは、親和性部分に直接的または間接的に(例えば、1つ以上のリンカー分子を介して)連結され得る。バーコード化オリゴヌクレオチドは、リンカー分子を介して親和性部分に連結され得、ここで、当該リンカー分子は、少なくとも1つの親和性部分、および少なくとも1つのバーコード化オリゴヌクレオチドの両方に(共有結合または非共有結合で)付加および/または連結および/または結合される。バーコード化オリゴヌクレオチドは、1つ以上の共有リンケージ(または結合)(例えば、Innova Biosciences社のLighteningLink(登録商標)抗体標識キットによって作成された結合等の共有結合)、1つ以上の非共有リンケージ(または結合)(例えば、タンパク質-タンパク質相互作用またはストレプトアビジン-ビオチンリンケージ。例えば、親和性部分は、ストレプトアビジンドメインを含み得、バーコード化オリゴヌクレオチドは、ビオチン部分を含み得る)、または核酸ハイブリダイゼーションリンケージによって、任意の親和性部分に連結することができる。任意の1つ以上のリンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。任意の1つ以上のリンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。任意の1つ以上のリンカー分子は、1つ以上のC3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。
【0082】
試料は、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個の異なるバーコード化親和性プローブのライブラリと接触させることができる。
【0083】
バーコード化親和性プローブは、任意選択的に、バーコード化親和性プローブがアプタマーであるアプタマーを含み得る。アプタマーは、バーコード化親和性プローブの親和性部分とバーコード化オリゴヌクレオチドの両方を提供し得る。
【0084】
アプタマーは、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み得、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み、親和性部分は、標的生体分子に結合することができる。アプタマーは、バーコード配列を含み得る。アプタマーの核酸配列のいずれかまたは全ては、アプタマーの親和性部分に関連し、および/もしくは特定するのに役立ち、ならびに/またはアプタマーの親和性部分が結合することができる標的生体分子を特定することができる。
【0085】
親和性部分は、標的生体分子に結合することができる可能性がある。親和性部分は、標的生体分子に特異的に結合することができる可能性がある。親和性部分は、標的生体分子に結合し得る。親和性部分は、標的生体分子に結合し特異的に結合し得る。親和性部分は、標的生体分子に対して高い親和性を有し得る。
【0086】
親和性部分は、抗体、抗体断片、軽鎖抗体断片、一本鎖可変断片(scFv)、ペプチド、細胞透過性ペプチド、アプタマー、DNAアプタマー、および/またはRNAアプタマーのうちの1つ以上を含み得る。
【0087】
親和性部分は、抗体またはその断片を含み得、標的分子は、ポリペプチドであり得る。
【0088】
親和性部分は、抗体またはその断片を含み得、標的分子は、核酸の断片であり得る。
【0089】
親和性部分は、抗体またはその断片を含み得、標的分子は、エピジェネティック修飾、例えば、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンを含む核酸の断片であり得る。
【0090】
親和性部分はアプタマーを含み得、標的分子はポリペプチドであり得る。
【0091】
親和性部分はアプタマーを含み得、標的分子は核酸の断片であり得る。
【0092】
親和性部分はアプタマーを含み得、標的分子は、エピジェネティック修飾、例えば、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンを含む核酸の断片であり得る。
【0093】
バーコード化親和性プローブはアプタマーを含み得、ここで、当該アプタマーは、親和性オリゴヌクレオチド内のアプタマー配列内に含まれる。バーコード化親和性プローブはアプタマーを含み得、ここで、当該アプタマーは、親和性オリゴヌクレオチド内のアプタマー配列内に含まれ、当該親和性オリゴヌクレオチドは、バーコード配列を含む。バーコード化親和性プローブはアプタマーを含み得、ここで、当該アプタマーは、親和性オリゴヌクレオチド内のアプタマー配列内に含まれ、当該親和性オリゴヌクレオチドは、バーコード配列を含み、当該バーコード配列の全部または一部は、部分的または完全に当該アプタマー配列から構成される。アプタマーおよび/またはアプタマー配列および/または親和性オリゴヌクレオチドおよび/またはバーコード配列は、1つ以上のDNAヌクレオチドを含み得る。任意選択的に、任意の当該アプタマーおよび/またはアプタマー配列および/または親和性オリゴヌクレオチドおよび/またはバーコード配列は、1つ以上のRNAヌクレオチドを含み得る。
【0094】
バーコード化親和性プローブは、少なくとも2つの親和性部分を含み得る。バーコード化親和性プローブは、少なくとも第1および第2の親和性部分を含み得、ここで、当該第1の親和性部分は、第1の標的生体分子に結合することができ、当該第2の親和性部分は、第2の標的生体分子に結合することができ、ここで、当該第1の標的生体分子と当該第2の標的生体分子は異なる。
【0095】
バーコード化親和性プローブは、少なくとも3つ、少なくとも4つ、少なくとも5つ、または少なくとも10個の異なる親和性部分を含み得る。任意選択的に、親和性部分の各々は、異なる標的生体分子に結合することができる。
【0096】
バーコード化親和性プローブは、直接的または間接的に連結された少なくとも2つの親和性部分を含み得る。バーコード化親和性プローブの少なくとも2つの親和性部分は、支持体(例えば、固体支持体)、分子支持体、または高分子支持体に連結され得る。
【0097】
バーコード化親和性プローブは、少なくとも2つの親和性部分を含み得る。親和性部分の各々は、アプタマーを含み得る。バーコード化親和性プローブの少なくとも2つの親和性部分は、単一のアプタマー内に含まれ得る。バーコード化親和性プローブの少なくとも2つの親和性部分は、単一の隣接する核酸配列(例えば、DNA配列および/またはRNA配列)内に含まれ得る。
【0098】
バーコード化親和性プローブは、少なくとも2つの異なるバーコード化オリゴヌクレオチドを含み得る。
【0099】
バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含む。バーコード化オリゴヌクレオチドは、バーコード配列を含み得る。バーコード化オリゴヌクレオチドは、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個のヌクレオチドのバーコード配列を含む。
【0100】
バーコード化オリゴヌクレオチドは、それが連結されている親和性部分に関連するおよび/またはそれを特定するバーコード配列を含み得る。同じ親和性部分(例えば、同じタンパク質標的に特異的な同じ抗体)に連結されたバーコード化オリゴヌクレオチドの各々は、同じ配列(例えば、同じバーコード配列)を含み得る。同じ親和性部分に連結されたバーコード化オリゴヌクレオチドの各々は、異なる配列(例えば、2つ以上の異なるバーコード配列)を含む。任意選択的に、異なる親和性部分に連結されたバーコード化オリゴヌクレオチドの各々は、異なる配列(例えば、2つ以上の異なるバーコード配列)を含み得る。
【0101】
バーコード化オリゴヌクレオチドは、アダプターおよび/またはカップリング配列を含み得、ここで、当該配列は、少なくとも1、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30ヌクレオチド長である。バーコード化オリゴヌクレオチドのアダプターおよび/またはカップリング配列は、任意の多量体バーコード化試薬および/またはそのライブラリ内に含まれるバーコード化オリゴヌクレオチドの標的領域に相補的な配列を含み得る。バーコード化オリゴヌクレオチドのアダプターおよび/またはカップリング配列は、2ヌクレオチド長以上のポリ(A)配列を含み得る。バーコード化オリゴヌクレオチド内のアダプターおよび/またはカップリング配列は、当該バーコード化オリゴヌクレオチドの3’末端内、および/または5’末端内に含まれ得る。
【0102】
バーコード化親和性プローブは、1つ以上の二次バーコード化オリゴヌクレオチドを含み得、ここで、当該二次バーコード化オリゴヌクレオチドは、1つ以上の(非二次)バーコード化オリゴヌクレオチドの全部または一部に少なくとも部分的に相補的な配列を含む。二次バーコード化オリゴヌクレオチドは、任意の1つ以上の(非二次)バーコード化オリゴヌクレオチドに完全にまたは部分的にアニール(すなわち、ハイブリダイズ)され得る。二次バーコード化オリゴヌクレオチドは、二次バーコード化オリゴヌクレオチドアニール反応において、任意の1つ以上の(非二次)バーコード化オリゴヌクレオチドに完全にまたは部分的にアニール(すなわち、ハイブリダイズ)され得る。二次バーコード化オリゴヌクレオチドアニール反応は、ステップ(a)、(b)または(c)のいずれかの前、および/または後に、および/またはその間に起こり得る。二次バーコード化オリゴヌクレオチドは、バーコード配列の1つ以上のヌクレオチドを含み得、ここで、当該バーコード配列は、バーコード化親和性プローブ内で連結される親和性部分に関連し、かつ/またはそれを特定している。
【0103】
バーコード化親和性プローブは、1つ以上の親和性部分、1つ以上の一次バーコード化オリゴヌクレオチド、および1つ以上の二次バーコード化オリゴヌクレオチドを含み得る。
【0104】
試料は、1つ以上の循環微粒子を含み得、かつ/または試料は、1つ以上の循環微粒子に由来し得る。
【0105】
生体分子は、ポリペプチド(例えば、タンパク質)、炭水化物、脂質、または核酸であり得る。生体分子は、代謝物であり得る。
【0106】
試料は、第1の循環微粒子および第2の循環微粒子を含み得るか、または試料が第1の循環微粒子および第2の循環微粒子に由来し、ステップ(b)は、バーコード化親和性プローブおよび第1の循環微粒子の標的生体分子を含む少なくとも1つのバーコード化生体分子複合体を形成することと、バーコード化親和性プローブおよび第2の循環微粒子の標的生体分子を含む少なくとも1つのバーコード化生体分子複合体を形成することと、を含む。試料は、第1の循環微粒子の標的核酸の断片および第2の循環微粒子の標的核酸の断片をさらに含み得る。
【0107】
ステップ(a)、(b)および/または(c)において、バーコード化親和性プローブは、任意の濃度、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、少なくとも1ピコモル、少なくとも100フェムトモル、少なくとも10フェムトモル、または少なくとも1フェムトモルの濃度であり得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。
【0108】
任意選択的に、任意の方法の任意の1つ以上のステップ(カップリング配列および/またはカップリング分子を付加する任意のステップ、バーコード化オリゴヌクレオチドを付加および/または連結および/または接続する任意のステップ等(バーコード化オリゴヌクレオチド内に含まれるバーコード配列を付加/連結/接続する任意のステップ等)のバーコード配列を付加する任意のステップ等))において、ステップ(複数可)および/または方法(複数可)は、高粘度溶液中で行うことができる。任意選択的に、かかる高粘度溶液は、ポリ(エチレングリコール)(PEG)溶液、例えば、PEG400、PEG1000、PEG2000、PEG4000、PEG5000、PEG8000、PEG10000、および/またはPEG20,000のうちの1つ以上から構成され得る。任意選択的に、かかる溶液は、重量または体積で、少なくとも5%のポリ(エチレン)グリコール、少なくとも10%のポリ(エチレン)グリコール、少なくとも20%のポリ(エチレン)グリコール、少なくとも25%のポリ(エチレン)グリコール、少なくとも30%のポリ(エチレン)グリコール、少なくとも40%のポリ(エチレン)グリコール、または少なくとも50%のポリ(エチレン)グリコールを含み得る。任意選択的に、かかる溶液は、任意の2つ以上のPEG分子を含み得、ここで、かかる各2つ以上のPEG分子は、重量または体積によるこれらの当該濃度のうちの1つで存在する。任意選択的に、かかる高粘度溶液は、バーコード化オリゴヌクレオチドを標的核酸にアニールする任意のステップ中に使用される溶液を含み得る。任意選択的に、かかる高粘度溶液は、少なくとも1.0センチポアズ、少なくとも1.1センチポアズ、少なくとも1.2センチポアズ、少なくとも1.5センチポアズ、少なくとも2.0センチポアズ、少なくとも5.0センチポアズ、少なくとも10.0センチポアズ、少なくとも20.0センチポアズ、少なくとも50.0センチポアズ、少なくとも100.0センチポアズ、または少なくとも200.0センチポアズ(例えば、標準的な海面気圧で25℃)の動的粘度を有し得る。好ましくは、かかる高粘度溶液は、少なくとも1.5センチポアズの動的粘度を有するであろう。高粘度溶液の使用は、試薬(バーコード化オリゴヌクレオチドおよび/または多量体バーコード化試薬等)の拡散を遅らせて、標的核酸等の標的分子からの拡散を防止するか、または遅らせることができる。
【0109】
任意選択的に、任意の方法の任意の1つ以上のステップ(カップリング配列および/またはカップリング分子を付加する任意のステップ、バーコード化オリゴヌクレオチドを付加および/または連結および/または接続する任意のステップ等(バーコード化オリゴヌクレオチド内に含まれるバーコード配列を付加/連結/接続する任意のステップ等)のバーコード配列を付加する任意のステップ等))において、ステップ(複数可)および/または方法(複数可)は、1つ以上の分子密集試薬を含む溶液中で行うすることができる。すなわち、当該分子密集試薬(複数可)は、当該ステップにおいて、標的分子および/またはバーコード化オリゴヌクレオチドおよび/または多量体バーコード化試薬および/または他の成分の有効濃度を増加させる効果を有する。任意選択的に、任意の1つ以上の分子密集試薬は、任意のサイズのビーズおよび/または他の剛性支持体、例えば、ミクロンスケールのビーズ(直径が少なくとも1.0、少なくとも2.0、少なくとも3.0、少なくとも5.0、少なくとも10、少なくとも20、少なくとも50、もしくは少なくとも100マイクロメートルのビーズ等)および/またはナノメートルサイズのビーズ(直径が少なくとも1.0、少なくとも2.0、少なくとも3.0、少なくとも5.0、少なくとも10、少なくとも20、少なくとも50、もしくは少なくとも100ナノメートルのビーズ等)を含み得る。
【0110】
未結合のバーコード化親和性プローブを除去および/または枯渇させる1つ以上のステップは、1つ以上の循環微粒子からの1つ以上の生体分子に1つ以上のバーコード化親和性プローブを結合する任意のステップ中および/または後に行うことができる。
【0111】
任意選択的に、循環微粒子から生体分子を測定する任意の方法は、単一のバーコード化親和性プローブを用いた測定を含み得る。任意選択的に、循環微粒子から生体分子を測定する任意の方法は、単一のバーコード化親和性プローブを用いた測定を含み得、ここで、当該単一のバーコード化親和性プローブは、少なくとも単一ヌクレオチド長のオリゴヌクレオチドを含む。
【0112】
任意選択的に、少なくとも単一ヌクレオチド長の任意のヌクレオチドおよび/またはオリゴヌクレオチド配列は、バーコード化親和性プローブ内のバーコードおよび/またはバーコード配列(および/またはバーコード化オリゴヌクレオチド)であると見なされ得る。少なくとも単一ヌクレオチド長の当該ヌクレオチドおよび/またはオリゴヌクレオチド配列は、当該バーコード化親和性プローブ内の任意の他のヌクレオチドおよび/またはオリゴヌクレオチド配列、ならびに/あるいは任意の他のバーコード化親和性プローブ内の任意の他のヌクレオチドおよび/またはオリゴヌクレオチド配列と異なる必要はない。
【0113】
この方法のステップ(c)は、バーコード化オリゴヌクレオチドのヌクレオチド配列を分析することによってバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することを含み得、任意選択的に、配列は、配列決定(バーコード化オリゴヌクレオチドの少なくとも一部が配列決定される)またはPCR(バーコード化オリゴヌクレオチドの少なくとも一部が増幅される)によって分析される。
【0114】
ステップ(c)は、プライマー伸長および/またはPCR反応および/または定量的もしくは半定量的PCR反応(リアルタイムPCR反応等)によってバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することを含み得る。
【0115】
ステップ(c)は、プライマー伸長および/またはPCR反応および/または定量的もしくは半定量的PCR反応(リアルタイムPCR反応等)によってバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することを含み得、ここで、反応中の少なくとも1つのプライマーは、当該バーコード化オリゴヌクレオチドの少なくとも一部に特異的および/または少なくとも部分的に相補的(および/または少なくとも部分的に同一)である。
【0116】
この方法では、ステップ(b)またはステップ(c)は、第1の循環微粒子の少なくとも2つのバーコード化生体分子複合体を一緒に連結することと、第2の循環微粒子の少なくとも2つのバーコード化生体分子複合体を一緒に連結することと、を含み得る。
【0117】
1つ以上の循環微粒子を含む試料は、化学的に架橋され得る(例えば、ホルムアルデヒドを用いて)。循環微粒子は、ステップ(a)、(b)および/または(c)の前に化学的に架橋され得る。
【0118】
1つ以上の循環微粒子を含む試料は、透過処理され得る(例えば、化学的界面活性剤を用いて)。循環微粒子は、ステップ(a)および/または(b)の前に透過処理され得る。
【0119】
1つ以上の循環微粒子を含む試料は、ステップ(a)および/または(b)の前に、(例えば、ホルムアルデヒドを用いて)化学的に架橋され、次いで(例えば、化学的界面活性剤を用いて)透過処理され得る。
【0120】
この方法は、(任意選択的に、ステップ(c)の一部として)(i)反応混合物を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が、一緒に連結された第1および第2のバーコード領域を含み、各バーコード領域が核酸配列を含む、接触させることと、(ii)多量体バーコード化試薬のバーコード領域のバーコード配列を、循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチドに付加することと、(iii)多量体バーコード化試薬のバーコード領域の付加されたバーコード配列を分析することにより、反応混合物中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することと、を含み得る。
【0121】
反応混合物は、循環微粒子の標的核酸の断片をさらに含み得、ここで、この方法は、(i)反応混合物を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が、一緒に連結された第1および第2のバーコード領域を含み、各バーコード領域が核酸配列を含む、接触させることと、(ii)多量体バーコード化試薬の第1のバーコード領域のバーコード配列を、循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチド(すなわち、標的核酸の第1の断片)に付加して、第1のバーコード化標的核酸分子を生成すること、および多量体バーコード化試薬の第2のバーコード領域のバーコード配列を、標的核酸の断片(すなわち、標的核酸の第2の断片)に付加して、第2のバーコード化標的核酸分子を生成することと、(iii)第1および第2のバーコード化標的核酸分子の各々の配列を分析することと、を含む。
【0122】
第1および第2のバーコード化標的核酸分子の各々の配列を分析するステップは、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することによって行われ得る。
【0123】
この方法は、第1の循環微粒子の第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することをさらに含み得る。この方法は、第1のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、多量体バーコード化試薬の第1のバーコード領域の配列の少なくとも一部および循環微粒子の標的核酸の第1の断片の配列の少なくとも一部を含む。この方法は、第2のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、多量体バーコード化試薬の第2のバーコード領域の配列の少なくとも一部および循環微粒子の標的核酸の第2の断片の配列の少なくとも一部を含む。
【0124】
この方法は、(任意選択的に、ステップ(c)の一部として)反応混合物を少なくとも第1および第2の区画に区画化し、第1および第2の区画の各々におけるバーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析することを含み得る。
【0125】
この方法は、反応混合物を少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000個の区画に区画化することを含み得る。好ましくは、この方法は、反応混合物を少なくとも1000個の区画に区画化することを含む。
【0126】
標的核酸分子は、循環微粒子のバーコード化生体分子複合体のバーコード化オリゴヌクレオチドを含み得る。循環微粒子のバーコード化生体分子複合体のバーコード化オリゴヌクレオチドは、バーコード化生体分子複合体内に存在するか、またはバーコード化生体分子複合体に由来し得る。
【0127】
2つ以上の標的核酸分子は、微粒子の標的核酸の断片と、循環微粒子のバーコード化生体分子複合体のバーコード化オリゴヌクレオチドの両方を含み得る。
【0128】
2つ以上の標的核酸分子は、微粒子の標的核酸(例えば、ゲノムDNA)の断片と、循環微粒子のバーコード化生体分子複合体のバーコード化オリゴヌクレオチドの両方を含み得る。
【0129】
2つ以上の標的核酸分子は、微粒子の標的核酸(例えば、RNA)の断片と、循環微粒子のバーコード化生体分子複合体のバーコード化オリゴヌクレオチドの両方を含み得る。
【0130】
バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップは、第1の区画バーコード配列を当該第1の区画に区画化された少なくとも1つのバーコード化オリゴヌクレオチド(第1の区画の標的核酸の第1の断片)に付加する(第1の区画の第1のバーコード化標的核酸分子を生成する)ことであって、当該第1の区画に区画化された少なくとも1つのバーコード化オリゴヌクレオチドが、バーコード化生体分子複合体に含まれるか、またはそれに由来する、付加することと、第2の区画バーコード配列を当該第2の区画に区画化された少なくとも1つのバーコード化オリゴヌクレオチド(第2の区画の標的核酸の第1の断片)に付加する(第2の区画の第1のバーコード化標的核酸分子を生成する)ことであって、当該第1の区画に区画化された少なくとも1つのバーコード化オリゴヌクレオチドが、バーコード化生体分子複合体に含まれるか、またはそれに由来する、付加することと、を含み得る。好ましくは、第1および第2の区画は各々、バーコード化生体分子複合体に含まれるか、またはそれに由来するバーコード化オリゴヌクレオチドを含む。
【0131】
第1の区画バーコード配列と第2の区画バーコード配列は異なり得る。第1の区画バーコード配列は、区画バーコード配列の第1のセット内に含まれ得、第2の区画バーコード配列は、区画バーコード配列の第2のセット内に含まれ得、ここで、区画バーコード配列の当該第1と第2のセットは異なる。第1の区画バーコード配列は、第1の多量体バーコード化試薬のバーコード領域の核酸配列であり得、第2の区画バーコード配列は、第2の多量体バーコード化試薬の核酸配列であり得、第1および第2の多量体バーコード化試薬は、各々、一緒に連結された2つ以上のバーコード領域を含む。
【0132】
バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップは、当該第1および第2の区画の各々から付加された区画バーコード配列を分析することをさらに含み得る。
【0133】
循環微粒子からの標的核酸(例えば、gDNAまたはRNA)の断片(第1の区画の標的核酸の第2の断片)もまた、(第1の区画の第2のバーコード化標的核酸分子を生成するために)当該第1の区画の当該第1の区画バーコード配列に付加され得、かつ/または異なる循環微粒子からの標的核酸(例えば、gDNAまたはRNA)の断片(第2の区画の標的核酸の第2の断片)もまた、(第2の区画の第2のバーコード化標的核酸分子を生成するために)当該第2の区画の当該第2の区画バーコード配列に付加され得る。
【0134】
第1および第2のバーコード化標的核酸分子の各々の配列を分析するステップは、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することによって行われ得る。
【0135】
この方法は、第1の区画の第1および第2のバーコード化標的核酸分子の各々の配列を分析すること、ならびに第2の区画の第1および第2のバーコード化標的核酸分子の各々の配列を分析することをさらに含み得る。任意選択的に、配列を分析するステップは、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することによって行われる。
【0136】
この方法は、第1の区画の第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することをさらに含み得る。この方法は、第1のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第1の区画バーコードの配列の少なくとも一部および第1の区画の標的核酸の第1の断片の配列の少なくとも一部を含む。この方法は、第2のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第1の区画バーコードの少なくとも一部および第1の区画の標的核酸の第2の断片の配列の少なくとも一部を含む。
【0137】
この方法は、第2の区画の第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することをさらに含み得る。この方法は、第1のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第2の区画バーコードの配列の少なくとも一部および第2の区画の標的核酸の第1の断片の配列の少なくとも一部を含む。この方法は、第2のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第2の区画バーコードの配列の少なくとも一部および第2の区画の標的核酸の第2の断片の配列の少なくとも一部を含む。
配列リードは、標的核酸(ゲノムDNA)由来の少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各配列リードは、標的核酸由来の少なくとも5つのヌクレオチドを含む。本明細書における「配列の少なくとも一部」とは、関連する配列の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、または少なくとも5000個のヌクレオチドを意味する。好ましくは、本明細書における「配列の少なくとも一部」とは、関連する配列の少なくとも2つのヌクレオチドを意味する。
【0138】
この方法は、1つ以上のバーコード化親和性プローブからのシグナルを増幅するステップ(すなわち、シグナル増幅ステップまたはプロセス)を含み得る。シグナル増幅プロセスは、1つ以上の鎖置換増幅反応および/または1つ以上の多置換増幅反応を含み得る。シグナル増幅プロセスは、インビトロ転写反応を含み得る。シグナル増幅プロセスは、1つ以上の二次バーコード化オリゴヌクレオチドを、バーコード化親和性プローブ内の(非二次)バーコード化オリゴヌクレオチド等の、当該バーコード化親和性プローブに付加および/または結合および/またはアニール(すなわち、ハイブリダイズ)するステップを含み得る。シグナル増幅プロセスは、1つ以上の二次親和性部分を、当該バーコード化親和性プローブに付加および/または結合する(例えば、二次抗体をバーコード化親和性プローブ内の(非二次)抗体に結合する)ステップを含み得る。任意選択的に、任意の数の少なくとも2、少なくとも3、少なくとも5、または少なくとも10の二次バーコード化オリゴヌクレオチドおよび/または二次親和性部分を、任意のバーコード化親和性プローブに付加および/または結合および/またはアニールすることができる。2つ以上の二次バーコード化オリゴヌクレオチドおよび/または二次親和性部分をバーコード化親和性プローブに付加および/またはアニールおよび/または結合する方法は、それらの各々を付加および/またはアニールおよび/または結合する別個の連続ステップで行われ得、または単一の並列ステップで行われ得る。
【0139】
バーコード化オリゴヌクレオチド、および/または二次バーコード化オリゴヌクレオチドは、インビトロ転写反応のためのテンプレートを含み得る。バーコード化オリゴヌクレオチド、および/または二次バーコード化オリゴヌクレオチドは、T7 RNAポリメラーゼのプロモーター等の、インビトロ転写反応のためのプロモーター領域を含み得る。
【0140】
バーコード化オリゴヌクレオチド、および/または二次バーコード化オリゴヌクレオチドは、環状(例えば、環状化)オリゴヌクレオチド(環状DNAオリゴヌクレオチドまたは環状RNAオリゴヌクレオチド等)を含み得る。環状バーコード化オリゴヌクレオチドは、少なくとも1ヌクレオチド長の1つ以上の相補的プライマーオリゴヌクレオチドを含み得、ここで、当該相補的プライマーオリゴヌクレオチドは、当該環状バーコード化オリゴヌクレオチド(複数可)内の1つ以上の配列にアニールされる。環状バーコード化オリゴヌクレオチドは、1つ以上の鎖置換増幅反応および/または1つ以上の多置換増幅反応、例えば、phi29 DNAポリメラーゼ等の鎖置換ポリメラーゼを用いた反応のテンプレートとして使用され得る(任意選択的に、1つ以上の相補的プライマーオリゴヌクレオチドが、かかる増幅反応のプライマーとして使用される)。鎖置換増幅反応および/または多置換増幅反応は、任意の1つ以上のバーコード化親和性プローブを試料からの任意の標的生体分子に結合する任意のステップの前および/または後および/または間に起こり得る。任意の1つ以上の当該鎖置換増幅反応および/または1つ以上の当該多置換増幅反応の産物は、本明細書に記載の任意の方法のための標的核酸分子を含み得る。任意の1つ以上の当該鎖置換増幅反応および/または1つ以上の当該多置換増幅反応の産物は、任意のバーコード配列(任意の区画バーコード配列、任意のバーコード化オリゴヌクレオチド、任意のバーコード配列および/または任意の多量体バーコード化試薬内に含まれるバーコード化オリゴヌクレオチド等)に付加され得る。
【0141】
この方法は、(任意選択的に、ステップ(c)の一部として)、(i)反応混合物を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含み、第1の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域とは異なる、接触させることと、(ii)バーコード配列を第1の微粒子の標的核酸の第1の断片および標的核酸の第2の断片の各々に付加して、第1の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、バーコード配列を第2の微粒子の標的核酸の第1の断片および標的核酸の第2の断片の各々に付加して、第2の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、を含む。
【0142】
第1の微粒子の標的核酸の第1の断片は、第1の循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチドであり得、第2の微粒子の標的核酸の第1の断片は、第2の循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチドであり得る。
【0143】
反応混合物は、第1の循環微粒子の標的核酸の断片をさらに含み得、第1の循環微粒子の標的核酸の第2の断片は、第1の循環微粒子の標的核酸の断片である。
【0144】
反応混合物は、第2の循環微粒子の標的核酸の断片をさらに含み得、第2の循環微粒子の標的核酸の第2の断片は、第2の循環微粒子の標的核酸の断片である。
【0145】
反応混合物を多量体バーコード化試薬のライブラリと接触させるステップは、単一の隣接する水性体積中で行うことができる。ステップ(c)は、単一の隣接する水性体積中で行われ得、任意選択的に、ステップ(b)および(c)は、単一の隣接する水性体積中で行われ、任意選択的に、ステップ(a)、(b)、および(c)は、単一の隣接する水性体積中で行われる。
【0146】
この方法は、第1の循環微粒子の第1および第2のバーコード化標的核酸分子の各々の配列を分析すること、および第2の循環微粒子の第1および第2のバーコード化標的核酸分子の各々の配列を分析することをさらに含み得る。任意選択的に、配列を分析するステップは、第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することによって行われる。
【0147】
この方法は、第1の循環微粒子の第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することをさらに含み得る。この方法は、第1のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第1の多量体バーコード化試薬の第1のバーコード領域の配列の少なくとも一部および第1の循環微粒子の標的核酸の第1の断片の配列の少なくとも一部を含む。この方法は、第2のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第1の多量体バーコード化試薬の第2のバーコード領域の配列の少なくとも一部および第1の循環微粒子の標的核酸の第2の断片の配列の少なくとも一部を含む。
【0148】
この方法は、第2の循環微粒子の第1および第2のバーコード化標的核酸分子の各々の少なくとも一部を配列決定することをさらに含み得る。この方法は、第1のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第2の多量体バーコード化試薬の第1のバーコード領域の配列の少なくとも一部および第2の循環微粒子の標的核酸の第1の断片の配列の少なくとも一部を含む。この方法は、第2のバーコード化標的核酸分子について配列リードを生成することを含み得、ここで、配列リードは、第2の多量体バーコード化試薬の第2のバーコード領域の配列の少なくとも一部および第2の循環微粒子の標的核酸の第2の断片の配列の少なくとも一部を含む。
【0149】
配列リードは、標的核酸(ゲノムDNA)由来の少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各配列リードは、標的核酸由来の少なくとも5つのヌクレオチドを含む。本明細書における「配列の少なくとも一部」とは、関連する配列の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、または少なくとも5000個のヌクレオチドを意味する。好ましくは、本明細書における「配列の少なくとも一部」とは、関連する配列の少なくとも2つのヌクレオチドを意味する。
【0150】
この方法は、試料または反応混合物を少なくとも第1および第2の区画に区画化することと、第1および第2の区画の各々内のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析することと、をさらに含み得、ここで、第1の区画が、第1の循環微粒子の少なくとも1つのバーコード化生体分子複合体に含まれるか、またはそれに由来する少なくとも1つのバーコード化オリゴヌクレオチドを含み、第2の区画が、第2の循環微粒子の少なくとも1つのバーコード化生体分子複合体に含まれるか、またはそれに由来する少なくとも1つのバーコード化オリゴヌクレオチドを含む。区画化のステップは、ステップ(a)の前、ステップ(b)の前、および/またはステップ(c)の前に行われ得る。
【0151】
この方法は、試料を少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000個の区画に区画化することを含み得る。好ましくは、方法は、試料を少なくとも1000個の区画に区画化することを含む。
【0152】
バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップは、(i)第1の区画バーコード配列を第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加することと、(ii)第2の区画のバーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加することと、を含み得る。
【0153】
第1の区画バーコード配列と第2の区画バーコード配列は異なり得る。
【0154】
第1の区画バーコード配列は、区画バーコード配列の第1のセットに由来し得、第2の区画バーコード配列は、区画バーコード配列の第2のセットに由来し得、区画バーコード配列の第1と第2のセットは異なる。
【0155】
第1の区画バーコード配列は、第1の多量体バーコード化試薬のバーコード領域の核酸配列であり得、第2の区画バーコード配列は、第2の多量体バーコード化試薬のバーコード領域の核酸配列であり得、第1および第2の多量体バーコード化試薬は、各々、一緒に連結された2つ以上のバーコード領域を含む。
【0156】
第1の区画は、第1の循環微粒子の標的核酸の断片をさらに含み得、第2の区画は、第2の循環微粒子の標的核酸の断片をさらに含み得る。
【0157】
バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップは、(i)第1の区画バーコード配列を第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列を第1の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列を第2の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、を含み得、当該第1の区画バーコード配列と第2の区画バーコード配列は異なる。
【0158】
バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップは、(i)第1の区画バーコード配列セットの第1の区画バーコード配列を、第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列セットの第2の区画バーコード配列を第1の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列セットの第1の区画バーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列セットの第2の区画バーコード配列を、第2の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、を含み得、第1の区画バーコード配列セットと第2の区画バーコード配列セットは異なる。
【0159】
第1の区画バーコード配列セットの第1および第2の区画バーコード配列は、第1の多量体バーコード化試薬の第1および第2のバーコード領域の核酸配列であり得、第2の区画バーコード配列セットの第1および第2の区画バーコード配列は、第2の多量体バーコード化試薬の第1および第2のバーコード領域の核酸配列であり得、第1の多量体バーコード化試薬および第2の多量体バーコード化試薬は各々、互いに連結された2つ以上のバーコード領域を含む。
【0160】
第1の区画は、標的核酸の断片をさらに含み得、第2の区画は、標的核酸の断片をさらに含み得、バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップが、(i)第1の区画バーコード配列を第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列を第1の区画の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列を第2の区画の標的核酸の少なくとも1つの断片に付加することと、を含み、当該第1の区画バーコード配列と第2の区画バーコード配列は異なる。あるいは、バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップが、(i)第1の区画バーコード配列セットの第1の区画バーコード配列を、第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列セットの第2の区画バーコード配列を第1の区画の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列セットの第1の区画バーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列セットの第2の区画バーコード配列を、第2の区画の標的核酸の少なくとも1つの断片に付加することと、を含み、第1の区画バーコード配列セットと第2の区画バーコード配列セットは異なる。
【0161】
第1の区画バーコード配列セットの第1および第2の区画バーコード配列は、第1の多量体バーコード化試薬の第1および第2のバーコード領域の核酸配列であり得、第2の区画バーコード配列セットの第1および第2の区画バーコード配列は、第2の多量体バーコード化試薬の第1および第2のバーコード領域の核酸配列であり得、第1の多量体バーコード化試薬および第2の多量体バーコード化試薬は各々、互いに連結された2つ以上のバーコード領域を含む。
【0162】
本発明は、循環微粒子またはそれに由来する試料中の標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブの使用であって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが、少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、使用を提供する。
【0163】
本発明は、標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、バーコード化親和性プローブを提供する。
【0164】
バーコード化親和性プローブ、標的生体分子、親和性部分、およびバーコード化オリゴヌクレオチドは、本明細書に記載の形態のうちのいずれかをとることができる。特に、それらは、この方法に関して本明細書に記載の形態のうちのいずれかをとり得る。
【0165】
本発明は、少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブのライブラリであって、ライブラリが、(i)バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含む第1のバーコード化親和性プローブであって、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が第1の標的生体分子に結合することができる、第1のバーコード化親和性プローブと、(ii)バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含む第2のバーコード化親和性プローブであって、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が第2の標的生体分子に結合することができる、第2のバーコード化親和性プローブと、を含み、第1の標的生体分子と第2の標的生体分子が異なる、ライブラリを提供する。
【0166】
バーコード化親和性プローブ、バーコード化親和性プローブ、標的生体分子、親和性部分、およびバーコード化オリゴヌクレオチドのライブラリは、本明細書に記載の形態のうちのいずれかをとることができる。特に、それらは、この方法に関して本明細書に記載の形態のうちのいずれかをとり得る。
【0167】
第1の標的生体分子はポリペプチドであり得、第2の標的生体分子は、バーコード化オリゴヌクレオチドまたは標的核酸(ゲノムDNA)の断片であり得る。
【0168】
第1の標的生体分子はポリペプチドであり得、第2の標的生体分子は、エピジェネティック修飾(例えば、5-ヒドロキシ-メチルシトシンDNAまたは5-メチルシトシンDNA)を含む標的核酸(例えば、ゲノムDNA)の断片であり得る。
【0169】
第1の標的生体分子は、5-ヒドロキシメチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0170】
第1の標的生体分子は、5-メチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0171】
第1および第2の標的生体分子は、生体分子群1から選択され得る。
【0172】
任意選択的に、2つ以上のバーコード化親和性プローブの任意のライブラリは、当該2つ以上のバーコード化親和性プローブを含む単一の混合溶液を含み得る。任意選択的に、2つ以上のバーコード化親和性プローブの任意のライブラリは、2つ以上の別個の溶液を含み得、各溶液は、当該2つ以上のバーコード化親和性プローブのうちの1つの溶液を含む。任意選択的に、2つ以上のバーコード化親和性プローブの任意のライブラリがキットの形態で提供され得、当該キットは2つ以上の別個の溶液から構成され、各溶液は当該2つ以上のバーコード化親和性プローブのうちの1つの溶液を含む。
【0173】
試料は、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個の異なるバーコード化親和性プローブのライブラリと接触させることができる。好ましくは、ライブラリは、少なくとも2つの異なるバーコード化親和性プローブを含む。バーコード化親和性プローブの各々は、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み得、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み、親和性部分は、標的生体分子に結合することができる。ライブラリ内の異なるバーコード化親和性プローブの各々の親和性部分は、異なる標的生体分子に結合することができる可能性がある。バーコード化親和性プローブのライブラリは、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個の異なる標的生体分子に結合することができる可能性がある。好ましくは、バーコード化親和性プローブのライブラリは、少なくとも2つの異なる標的生体分子に結合することができる。
【0174】
任意選択的に、2つ以上のバーコード化親和性プローブの任意のライブラリにおいて、同じ親和性部分を含む(かつ/または同じ標的生体分子に結合することができる親和性部分を含む)バーコード化親和性プローブは、同一のバーコード化オリゴヌクレオチドを含み得る。任意選択的に、バーコード化親和性プローブの任意のライブラリにおいて、同じ親和性部分を含む(かつ/または同じ標的生体分子に親和性を有する親和性部分を含む)バーコード化親和性プローブは、2つ以上の異なるバーコード配列のセットからの、かつ/または少なくとも10個の異なるバーコード配列のセットからの、かつ/または少なくとも100個の異なるバーコード配列のセットからの、かつ/または少なくとも1000個の異なるバーコード配列のセットからの、かつ/または少なくとも10,000個の異なるバーコード配列のセットからの、かつ/または少なくとも1,000,000個の異なるバーコード配列のセットからの、異なるバーコード化オリゴヌクレオチドもしくは異なるバーコード配列を含み得る。
【0175】
任意選択的に、2つ以上の異なるバーコード化親和性プローブの任意のライブラリにおいて、各バーコード化親和性プローブは、2つ以上の異なる親和性部分のセットを含み得る(例えば、各バーコード化親和性プローブは、各々が別の標的生体分子に結合することができる2つ以上の異なる親和性部分を含み得る)。任意選択的に、バーコード化親和性プローブの任意のライブラリにおいて、2つ以上の異なる親和性部分の同じセットを含む(かつ/または同じ標的生体分子(複数可)に結合することができる親和性部分のセットを含む)バーコード化親和性プローブは、同一のバーコード化オリゴヌクレオチドを含み得る。任意選択的に、バーコード化親和性プローブの任意のライブラリにおいて、2つ以上の異なる親和性部分の同じセットを含む(かつ/または同じ標的生体分子(複数可)に結合することができる親和性部分のセットを含む)バーコード化親和性プローブは、異なるバーコード配列あるいは2つ以上の異なるバーコード配列のセットからの、かつ/または少なくとも10個の異なるバーコード配列のセットからの、かつ/または少なくとも100個の異なるバーコード配列のセットからの、かつ/または少なくとも1000個の異なるバーコード配列のセットからの、かつ/または少なくとも10,000個の異なるバーコード配列のセットからの、かつ/または少なくとも1,000,000個の異なるバーコード配列のセットからの、異なるバーコード配列を含み得る。
【0176】
2つ以上の異なるバーコード化親和性プローブのライブラリは、各々が1つ以上の親和性部分を含むバーコード化親和性プローブ、1つ以上の一次バーコード化オリゴヌクレオチド、および1つ以上の二次バーコード化オリゴヌクレオチドを含み得、当該ライブラリ内の各一次バーコード化オリゴヌクレオチドは、同一の配列を含み、当該ライブラリ中の各二次バーコード化オリゴヌクレオチドは、異なる配列を含む。
【0177】
光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブが提供され、当該光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、生体分子群1から選択される任意の1つ以上の生体分子(もしくは標的生体分子)に対する親和性および/または特異性を有する少なくとも1つの親和性部分を含む。光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブが提供され、当該光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、生体分子群1から選択される任意の1つ以上の生体分子(もしくは標的生体分子)に対する親和性および/または特異性を有する少なくとも1つの親和性部分を含み、少なくとも1つの光学的および/または蛍光標識を含む。
【0178】
生体分子群1から選択される少なくとも第1および第2の生体分子(もしくは標的生体分子)のための少なくとも第1および第2の親和性プローブを含む、2つ以上の光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブのライブラリが提供される。各光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブは、少なくとも1つの光学標識および/または蛍光標識を含む。5-メチルシトシンDNAまたは5-ヒドロキシ-メチルシトシンDNAに対する親和性および/または特異性を有する第1の光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブと、生体分子群1から選択された任意の1つ以上の生体分子(もしくは標的生体分子)に対する親和性および/または特異性を有する少なくとも第2の光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブと、を含む、2つ以上の光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブのライブラリが提供される。
【0179】
1つ以上のオリゴヌクレオチドが提供され、当該オリゴヌクレオチドは、生体分子群1の生体分子の任意のDNAおよび/またはRNA配列のいずれかと同一および/または相補的な配列を含む。1つ以上のプライマーが提供され、当該プライマーは、生体分子群1の生体分子の任意のDNAおよび/またはRNA配列のいずれかと同一および/または相補的な配列を含む。インサイチュハイブリダイゼーション(ISH)プロセスのための1つ以上のオリゴヌクレオチドプローブが提供され、当該オリゴヌクレオチドプローブは、生体分子群1の生体分子の任意のDNAおよび/またはRNA配列のいずれかと同一および/または相補的な配列を含む。蛍光インサイチュハイブリダイゼーション(FISH)プロセスのための1つ以上のオリゴヌクレオチドプローブが提供され、当該オリゴヌクレオチドプローブは、生体分子群1の任意の生体分子の任意のDNAおよび/またはRNA配列と同一および/または相補的な配列を含む。任意選択的に、任意の当該オリゴヌクレオチド、および/またはプライマー、および/またはオリゴヌクレオチドプローブは、光学的および/または蛍光標識を含み得る。任意選択的に、任意の当該オリゴヌクレオチド、および/またはプライマー、および/またはオリゴヌクレオチドプローブは、アダプター配列および/またはカップリング配列を含み得る。任意選択的に、任意の当該オリゴヌクレオチド、および/またはプライマー、および/またはオリゴヌクレオチドプローブを、逆転写プロセス、および/またはプライマー伸長プロセス、および/またはPCRプロセス、および/またはインサイチュハイブリダイゼーション(ISH)プロセス、および/または蛍光インサイチュハイブリダイゼーション(FISH)プロセスで使用することができる。2つ以上のオリゴヌクレオチドのライブラリが提供され、各当該オリゴヌクレオチドは、生体分子群1の生体分子の任意のDNAおよび/またはRNA配列のいずれかと同一および/または相補的な配列を含む。
【0180】
この方法では、循環微粒子は、標的核酸の少なくとも2つの断片を含み得、ここで、この方法は、(a)標的核酸の少なくとも2つの断片のうちの少なくとも2つを連結して、標的核酸の少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片のうちの少なくとも2つを配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0181】
この方法では、循環微粒子は、標的核酸の少なくとも2つの断片を含み得、ここで、この方法は、(a)標的核酸の少なくとも2つの断片のうちの少なくとも2つを連結して、標的核酸の少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片のうちの少なくとも2つを配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0182】
この方法では、循環微粒子は、ゲノムDNAの少なくとも2つの断片を含み、ここで、この方法は、(a)ゲノムDNAの少なくとも2つの断片のうちの少なくとも2つを連結して、ゲノムDNAの少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片のうちの少なくとも2つを配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む。
【0183】
この方法では、循環微粒子は、ゲノムDNAの少なくとも2つの断片を含み得、ここで、この方法は、(a)ゲノムDNAの少なくとも2つの断片のうちの少なくとも2つを連結して、ゲノムDNAの少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片のうちの少なくとも2つを配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む。
【0184】
この方法では、微粒子の標的核酸の少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の断片は、セットとして連結され得、次いで、配列決定され、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結された配列リードを生成し得る。好ましくは、微粒子の標的核酸の少なくとも5つの断片は、セットとして連結され得、次いで、配列決定されて、少なくとも5つの連結された配列リードを生成し得る。
【0185】
この方法では、連結された配列リードの各々は、連結された断片の少なくとも1ヌクレオチド、少なくとも5ヌクレオチド、少なくとも10ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも50ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも500ヌクレオチド、少なくとも1000ヌクレオチド、または少なくとも10,000個のヌクレオチドの配列を提供し得る。好ましくは、連結された配列リードの各々は、連結された断片の少なくとも20ヌクレオチドの配列を提供し得る。
【0186】
この方法では、合計で少なくとも2、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、少なくとも100,000,000,000、または少なくとも1,000,000,000,000個の配列リードが生成され得る。好ましくは、合計で少なくとも500,000個の配列リードが生成される。
【0187】
配列リードは、標的核酸(ゲノムDNA)由来の少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各配列リードは、標的核酸由来の少なくとも5つのヌクレオチドを含む。
【0188】
配列リードは、配列決定機器から生成されたその一部の生の配列リード、例えば、Illumina配列決定機器から生成された50ヌクレオチド長の配列の生の配列リードを含み得る。配列リードは、ペアエンド配列決定ランの両方のリードからのマージされた配列、例えば、Illumina配列決定機器でのペアエンド配列決定ランの第1および第2のリードの両方からのマージされた配列を含み得る。配列リードは、Illumina配列決定機器によって生成された150ヌクレオチドの生の配列リード内の、配列決定機器から生成された生の配列リードの一部、例えば、20個の隣接するヌクレオチドを含み得る。単一の生の配列リードは、本発明の方法によって生成された少なくとも2つの連結された配列リードを含み得る。
【0189】
配列リードは、当技術分野で知られている任意の方法によって生成することができる。例えば、連鎖停止またはサンガー配列決定による。好ましくは、配列決定は、合成による配列決定、可逆的ターミネーターを使用した合成による配列決定(例えば、Illumina配列決定)、パイロ配列決定(例えば、454配列決定)、ライゲーションによる配列決定(例えば、SOLiD配列決定)、単一分子配列決定(例えば、単一分子リアルタイム(SMRT)配列決定(Pacific Biosciences))、またはナノポア配列決定(例えば、MinionまたはPromethionプラットフォーム(Oxford Nanopore Technologies)上)等の次世代配列決定法によって行われる。最も好ましくは、配列リードは、可逆的ターミネーターを使用する合成による配列決定(例えば、Illumina配列決定)によって生成される。
【0190】
この方法は、連結された配列リードの各々を参照ゲノム配列にマッピングする、さらなるステップを含み得る。連結された配列リードは、参照ゲノム配列の同じ染色体にマッピングされた配列、または参照ゲノム配列の2つ以上の異なる染色体にマッピングされた配列を含み得る。
【0191】
微粒子は、少なくとも100nm、少なくとも110nm、少なくとも125nm、少なくとも150nm、少なくとも175nm、少なくとも200nm、少なくとも250nm、または少なくとも500nmの直径を有し得る。好ましくは、微粒子は、少なくとも200nmの直径を有する。微粒子の直径は、100~5000nmであり得る。微粒子の直径は、10~10,000nm(例えば、100~10,000nm、110~10,000nm)、50~5000nm、75~5,000nm、100~3,000nmであり得る。微粒子の直径は、10~90nm、50~100nm、90~200nm、100~200nm、100~500nm、100~1000nm、1000~2000nm、90~5000nm、または2000~10,000nmであり得る。好ましくは、微粒子の直径は100~5000nmである。最も好ましくは、微粒子は、200~5000nmの直径を有する。試料は、少なくとも2つの異なるサイズ、または少なくとも3つの異なるサイズ、または異なるサイズの範囲の微粒子を含み得る。
【0192】
ゲノムDNAの連結された断片は、単一のゲノムDNA分子に由来し得る。
【0193】
この方法は、ゲノムDNAの連結された断片のゲノム配列長を推定または決定するステップをさらに含み得る。任意選択的に、このステップは、連結された断片の実質的に全配列(すなわち、その約5’末端からその約3’末端まで)を配列決定し、その中で配列決定されたヌクレオチドの数をカウントすることによって行われ得る。任意選択的に、これは、連結された断片の配列の5’末端で十分な数のヌクレオチドを配列決定して、当該5’末端を参照ゲノム配列(例えば、ヒトゲノム配列)内の遺伝子座にマッピングし、同様に連結された断片の3’末端で十分な数のヌクレオチドを配列決定して、当該3’末端を参照ゲノム配列内の遺伝子座にマッピングし、次に、参照ゲノム配列を使用して連結された断片のゲノム配列長(すなわち、連結された断片の3’末端で配列決定されたヌクレオチドの数+連結された断片の5’末端で配列決定されたヌクレオチドの数+参照ゲノム(すなわち、配列決定されていない部分)内のこれらの配列間のヌクレオチド数)を決定することによって行われ得る。
【0194】
この方法では、試料は、第1および第2の循環微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、第1の微粒子に対する標的核酸の連結された断片の第1のセットおよび第2の微粒子に対する標的核酸の連結された断片の第2のセットを生成することと、ステップ(b)を行って、第1の微粒子に対する連結された配列リードの第1のセット(すなわち、連結されたシグナルのセット)および第2の微粒子に対する連結された配列リードの第2のセット(すなわち、連結されたシグナルのセット)を生成することと、を含む。
【0195】
この方法では、第1の微粒子に対して生成された連結された配列リードのセット(すなわち、連結されたシグナルのセット)は、第2の微粒子に対して生成された連結された配列リードのセット(すなわち、連結されたシグナルのセット)と区別可能であり得る。
【0196】
この方法では、試料は、血液に由来するn個の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、n個の連結された標的核酸断片セット(n個の微粒子毎に1セット)を生成することと、ステップ(b)を行って、n個の連結された配列リードセット(すなわち、連結されたシグナルセット)(n個の微粒子毎に1セット)を生成することと、を含む。
【0197】
この方法では、nは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000であり得る。好ましくは、nは、少なくとも100,000個の微粒子である。
【0198】
この方法では、試料は、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000個の微粒子(および/または少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000個の微粒子に由来する試料)を含み得る。ここで、当該微粒子(および/またはそれに由来する試料)は、試料を多量体バーコード化試薬のライブラリと接触させる任意のステップ、および/またはバーコード配列(バーコード化オリゴヌクレオチド等)を標的核酸に付加および/または連結および/または接続する任意のステップ、および/または、カップリング配列を標的核酸に付加する任意のステップ、および/またはカップリング分子を標的核酸または他の標的生体分子に付加および/または連結および/または接続する任意のステップ、および/または架橋または透過処理の任意のステップ等、方法の任意のステップの間、単一の隣接する水性体積内に含まれる。
【0199】
各微粒子に対して生成された連結された配列リードのセット(すなわち、連結されたシグナルのセット)は、他の微粒子に対して生成された連結された配列リードのセットと区別可能であり得る。
【0200】
この方法は、ステップ(a)の前に、試料を少なくとも2つの異なる反応体積に区画化するステップをさらに含み得る。
【0201】
本発明において、(例えば、配列決定反応によって決定される)2つの配列または配列リードは、かかる配列が、コンピュータシステム内、アルゴリズム内で、またはデータセット内で、任意の方法で互いに関連または相互関係することを可能にする任意の手段によって情報的に連結され得る。かかる連結は、個別の特定連結、または共有プロパティ、または2つ以上のかかる配列を連結、相互関係、または相関させる任意の間接的な方法から構成され、かつ/または確立され、かつ/またはそれらによって表され得る。
【0202】
連結は、配列決定反応自体内の配列(例えば、配列決定反応によって決定されたバーコード配列の形態、または、一緒に第1および第2の連結された配列を含む単一の決定された配列の2つの異なる部分またはセグメントの形態)から構成され得、かつ/または確立され得、かつ/またはそれによって表され得、あるいは、かかる配列から独立して確立、構成、または表され得る(同じフローセル内もしくはフローセルの同じレーン内、または、配列決定機器の同じコンパートメントもしくは領域内に含まれるか、あるいは配列決定機器の同じ配列決定ラン内に含まれるか、あるいは生物学的試料内のある程度の空間的近接性、および/または配列決定機器もしくは配列決定フローセル内のある程度の空間的近接性を有して含まれるというメリットによって確立される等)。連結は、画像内および/またはマルチピクセルカメラもしくはマルチピクセル電荷結合素子内のピクセルもしくはピクセル位置等、および/あるいはナノポアまたはナノポア配列決定機器もしくはナノポア膜内のナノポアの位置等、配列決定機器内の物理的位置または区画に対応する測定値またはパラメータから構成され、かつ/または確立され、かつ/またはそれらによって表され得る。
【0203】
連結は絶対的なものであり得る(すなわち、2つの配列は連結されているか連結されていないかのいずれかであり、これ以外に定量的、半定量的、または定性的/カテゴリ的関係はない)。連結はまた、例えば、一連のうちの定量的、半定量的、または定性的/カテゴリ的値の1つを保持し得る1つ以上のパラメータに対して、例えば、連結の程度、確率、または範囲に関して、相対的であるか、確率的であるか、あるいは確立され、構成され、または表され得る。例えば、2つ(もしくはそれ以上)の配列は、定量的、半定量的、または定性的/カテゴリ的パラメータによって情報的に連結され得、これは、配列決定機器内の当該2つ(もしくはそれ以上)の配列の近接性、または生物学的試料内の当該2つ(もしくはそれ以上)の配列の近接性を表すか、含むか、推定するか、または具体化する。
【0204】
任意のかかる方法で情報的に連結されている2つ以上の配列を含む任意の分析の場合、連結の存在(またはその欠如)を、分析もしくは評価ステップまたはそれを行うためのアルゴリズムのパラメータとして使用することができる。任意のかかる方法で情報的に連結されている2つ以上の配列を含む任意の分析の場合、連結の程度、確率、または範囲を、分析もしくは評価ステップまたはそれを行うためのアルゴリズムのパラメータとして使用することができる。
【0205】
かかる連結の1つのバージョンでは、2つ以上の連結された配列の所与のセットは、英数字識別子、もしくはバーコード、またはバーコード配列等の特定の識別子に関連付けられ得る。1つのさらなるバージョンでは、2つ以上の連結された配列の所与のセットは、バーコードまたはバーコード配列に関連付けられ得、ここで、当該バーコードまたはバーコード配列は、配列決定反応によって決定される配列内に含まれる。例えば、配列決定反応で決定される各配列は、バーコード配列とゲノムDNA配列に対応する配列の両方を含み得る。任意選択的に、特定の配列または連結された配列は、2つ以上のバーコードまたは識別子によって表されるか、または関連付けられ得る。
【0206】
連結の別のバージョンでは、2つ以上の連結された配列は、コンピュータ内の個別のパーティション内、またはコンピュータネットワーク内、ハードドライブ内、または任意の種類の記憶媒体、または配列データを格納する任意の他の手段内に保持され得る。任意選択的に、特定の配列または連結された配列は、かかるコンピュータまたはデータ媒体内の2つ以上のパーティションに保持され得る。
【0207】
情報的に連結されている配列は、情報的に連結された配列の1つ以上のセットを含み得る。連結された配列のセット内の配列は全て、同じ連結機能またはその表現を共有する場合がある。例えば、連結されたセット内の全ての配列は、同じバーコードまたは同じ識別子に関連付けられ得るか、またはコンピュータまたは記憶媒体内の同じパーティション内に含まれ得る。全ての配列は、任意の他の形態の連結、相互関係、および/または相関を共有できる。連結されたセット内の1つ以上の配列は、当該セットの排他的メンバーであり得、したがって、任意の他のセットのメンバーであってはならない。あるいは、連結されたセット内の1つ以上の配列は、当該セットの非排他的メンバーであり得、したがって、当該配列は、2つ以上の異なる連結された配列のセットによって表され、および/または関連付けられ得る。
【0208】
本発明は、少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、各区画が、平均して、n個未満の循環微粒子を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含む方法を提供する。任意選択的に、nは1000、500、200、100、50、40、30、20、10、5、4、3、2、1、0.5、0.4、0.3、0.2、0.1、0.05、0.04、0.03、0.02、0.01、0.005、0.001、0.0005、または0.0001である。好ましくは、ここで、nは0.5である。任意選択的に、ステップ(i)は、試料を少なくとも3つの区画、少なくとも5つの区画、少なくとも10の区画、少なくとも100の区画、少なくとも1000の区画、少なくとも10,000の区画、少なくとも100,000の区画、少なくとも1,000,000の区画、少なくとも10,000,000の区画、少なくとも100,000,000の区画、または少なくとも1,000,000,000個の区画に区画化することを含む。好ましくは、ステップ(i)は、試料を少なくとも1000個の区画に区画化することを含む。
【0209】
(ii)少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定するステップは、少なくとも2つの区画のうちの少なくとも2つの各々について、循環微粒子を含む試料(すなわち、区画内の試料)または循環微粒子に由来する試料を分析する方法によって行われ得、循環微粒子が少なくとも2つの標的分子を含み、少なくとも2つの標的分子が生体分子であり、この方法が、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセット(すなわち、区画に対する少なくとも2つの(情報的に)連結されたシグナルのセット)を生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第1の生体分子の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第2の生体分子の存在、不在、および/またはレベルに対応する。この方法は、微粒子の少なくとも2つの連結されたシグナルのセットを生成することを含む、本明細書に提供される方法のうちのいずれかによって行われ得る。この方法は、少なくとも2つの区画のうちの少なくとも2つの各々に対する少なくとも2つの連結されたシグナルのセットを生成することができる。
【0210】
本発明は、少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、第1の区画が第1の循環微粒子の少なくとも第1および第2の標的生体分子を含み、第2の区画が第2の循環微粒子の少なくとも第1および第2の標的生体分子を含み、少なくとも2つの区画のうちの少なくとも2つの各区画が、平均して、[X]未満の総DNA質量を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含む方法を提供する。任意選択的に、ここで、[X]は、1.0アトグラムのDNA、10アトグラムのDNA、100アトグラムのDNA、1.0フェムトグラムのDNA、10フェムトグラムのDNA、100フェムトグラムのDNA、1.0ピコグラムのDNA、10ピコグラムのDNA、100ピコグラムのDNA、または1.0ナノグラムのDNAである。好ましくは、ここで、[X]は、100フェムトグラムのDNAである。
【0211】
(ii)少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定するステップは、少なくとも2つの区画のうちの少なくとも2つの各々について、循環微粒子を含む試料(すなわち、区画内の試料)または循環微粒子に由来する試料を分析する方法によって行われ得、循環微粒子が少なくとも2つの標的分子を含み、少なくとも2つの標的分子が生体分子であり、この方法が、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセット(すなわち、区画に対する少なくとも2つの(情報的に)連結されたシグナルのセット)を生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第1の生体分子の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第2の生体分子の存在、不在、および/またはレベルに対応する。この方法は、微粒子の少なくとも2つの連結されたシグナルのセットを生成することを含む、本明細書に提供される方法のうちのいずれかによって行われ得る。この方法は、少なくとも2つの区画のうちの少なくとも2つの各々に対する少なくとも2つの連結されたシグナルのセットを生成することができる。
【0212】
本発明は、少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、第1の区画が第1の循環微粒子の少なくとも第1および第2の標的生体分子を含み、第2の区画が第2の循環微粒子の少なくとも第1および第2の標的生体分子を含み、少なくとも2つの区画のうちの少なくとも2つの各区画が、平均して、[Y]未満の総ポリペプチド質量を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含む方法を提供する。任意選択的に、ここで、[Y]は、1.0アトグラムのポリペプチド、10アトグラムのポリペプチド、100アトグラムのポリペプチド、1.0フェムトグラムのポリペプチド、10フェムトグラムのポリペプチド、100フェムトグラムのポリペプチド、1.0ピコグラムのポリペプチド、10ピコグラムのポリペプチド、100ピコグラムのポリペプチド、または1.0ナノグラムのポリペプチドである。好ましくは、ここで、[Y]は、ポリペプチドの100フェムトグラムである。
【0213】
(ii)少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定するステップは、少なくとも2つの区画のうちの少なくとも2つの各々について、循環微粒子を含む試料(すなわち、区画内の試料)または循環微粒子に由来する試料を分析する方法によって行われ得、循環微粒子が少なくとも2つの標的分子を含み、少なくとも2つの標的分子が生体分子であり、この方法が、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの(情報的に)連結されたシグナルのセット(すなわち、区画に対する少なくとも2つの(情報的に)連結されたシグナルのセット)を生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第1の生体分子の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料(すなわち、区画内の試料)中の第2の生体分子の存在、不在、および/またはレベルに対応する。この方法は、微粒子の少なくとも2つの連結されたシグナルのセットを生成することを含む、本明細書に提供される方法のうちのいずれかによって行われ得る。この方法は、少なくとも2つの区画のうちの少なくとも2つの各々に対する少なくとも2つの連結されたシグナルのセットを生成することができる。
【0214】
この方法は、当該第1および第2の区画の各々に区画化された少なくとも2つの標的核酸分子の配列を分析することをさらに含み得る。
【0215】
この方法は、試料を少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000個の区画に区画化することを含み得る。好ましくは、この方法は、試料を少なくとも1000個の区画に区画化することを含む。
【0216】
第1の標的生体分子はポリペプチドであり得、第2の標的生体分子は、バーコード化オリゴヌクレオチドまたは標的核酸(ゲノムDNA)の断片であり得る。
【0217】
第1の標的生体分子はポリペプチドであり得、第2の標的生体分子は、エピジェネティック修飾(例えば、5-ヒドロキシ-メチルシトシンDNAまたは5-メチルシトシンDNA)を含む標的核酸(例えば、ゲノムDNA)の断片であり得る。
【0218】
第1の標的生体分子は、5-ヒドロキシメチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0219】
第1の標的生体分子は、5-メチルシトシンDNAであり得、第2の標的生体分子は、生体分子群1から選択される生体分子であり得る。
【0220】
第1および第2の標的生体分子は、生体分子群1から選択され得る。
【0221】
標的生体分子の存在、不在、および/またはレベルを決定(または測定)する(または標的生体分子の存在、不在、および/またはレベルに対応するシグナルを測定する)任意の1つ以上のステップは、1つ以上バーコード化親和性プローブ(本明細書で提供される)を使用して行われ得、例えば、バーコード化親和性プローブを標的生体分子に結合することによって行われ得る。標的生体分子の存在、不在、および/またはレベルを決定(または測定)する(または標的生体分子の存在、不在、および/またはレベルに対応するシグナルを測定する)任意の1つ以上のステップは、試料をバーコード化親和性プローブ(本明細書で提供される)と接触させることを含む方法のいずれかに従って行われ得る。任意選択的に、この方法は、少なくとも1つのバーコード化親和性プローブを標的生体分子に結合することを含み、ここで、多量体バーコード化試薬からのバーコード配列が、バーコード化親和性プローブのバーコード化オリゴヌクレオチドに付加される。任意選択的に、測定は、多量体バーコード化試薬のバーコード配列を分析することによって、かつ/またはバーコード化親和性プローブのバーコード化オリゴヌクレオチドからのバーコードの配列を分析することによって行われる。
【0222】
標的生体分子の存在、不在、および/もしくはレベルを決定(または測定)する(または標的生体分子の存在、不在、および/もしくはレベルに対応するシグナルを測定する)任意の1つ以上のステップは、1つ以上の光学的および/または蛍光/蛍光的測定プロセスを使用して行われ得、例えば、1つ以上の光学的標識および/または蛍光標識された親和性プローブを使用して行われ得る。例えば、測定のステップは、1つ以上の光学的標識および/または蛍光標識された親和性プローブを使用して行われ得、ここで、少なくとも1つの光学的標識および/または蛍光標識された親和性プローブは、標的生体分子に結合され、当該測定は、少なくとも1つの光学的測定ステップまたは少なくとも1つの蛍光検出ステップを使用して行われる(例えば、当該測定は、当該光学的に標識されたおよび/または蛍光標識された親和性プローブからの光学的および/または蛍光シグナルを測定することによって行われる)。
【0223】
任意選択的に、任意の1つ以上の光学的および/または蛍光/蛍光的測定プロセスは、1つ以上の循環微粒子を含むおよび/または1つ以上の循環微粒子からの生体分子を含む試料の光学的および/または蛍光測定を含み得、当該試料は、水性体積および/または水性液滴(蛍光活性化細胞選別(FACS)機器で分析された液滴等)内に含まれる。任意選択的に、任意のかかる光学的および/または蛍光測定プロセスは、選別および/または選択プロセスをさらに含み得、例えば、循環微粒子の任意の1つ以上の光学的および/または蛍光測定が、任意の所与の循環微粒子および/または2つ以上の循環微粒子の任意の群および/またはサブセットを選別および/または選択するため(例えば、循環微粒子を含む試料を、高レベルの特定の標的生体分子を示す循環微粒子の第1のサブセットと高レベルの当該特定の標的生体分子を示す循環微粒子の第2のサブセットとに選別するため)に使用される。
【0224】
任意選択的に、任意の1つ以上の光学的および/または蛍光/蛍光的測定プロセスは、1つ以上の循環微粒子を含むおよび/または1つ以上の循環微粒子からの生体分子を含む試料の光学的および/または蛍光測定を含み得、当該試料は、平面(顕微鏡スライド等の平面ガラス表面、または任意の他の平面等)上に含まれる。任意選択的に、任意の1つ以上の光学的および/または蛍光/蛍光的測定プロセスは、1つ以上の循環微粒子を含むおよび/または1つ以上の循環微粒子からの生体分子を含む試料の光学的および/または蛍光測定を含み得、当該試料は光学顕微鏡および/または蛍光顕微鏡で視覚化される。
【0225】
任意選択的に、任意の1つ以上の蛍光標識された親和性プローブは、特定の吸収スペクトルおよび/または発光スペクトルを有するフルオロフォアを含み得る。任意選択的に、プールおよび/またはライブラリおよび/または2つ以上の蛍光標識された親和性プローブのセット内に含まれる任意の1つ以上の蛍光標識された親和性プローブは、当該プールおよび/またはライブラリおよび/またはセット内の他の蛍光標識された親和性プローブのうちの少なくとも1つおよび/または少なくとも2つとは異なる吸収スペクトルおよび/または発光スペクトルを有するフルオロフォアを含み得る。
【0226】
任意選択的に、プールおよび/またはライブラリ内に含まれる同じ標的生体分子に対する親和性を有する全ての蛍光標識された親和性プローブおよび/または2つ以上の蛍光標識された親和性プローブのセットは、同じ吸収スペクトルおよび/または発光スペクトルを有するフルオロフォアを含み得る。任意選択的に、プールおよび/またはライブラリ内に含まれる同じ標的生体分子に対する親和性を有する全ての蛍光標識された親和性プローブおよび/または2つ以上の蛍光標識された親和性プローブのセットは、同じフルオロフォアを含み得る。任意選択的に、プールおよび/またはライブラリ内に含まれる同じ標的生体分子に対する親和性を有する蛍光標識された親和性プローブおよび/または2つ以上の蛍光標識された親和性プローブのセットは、2つ以上の異なるフルオロフォア(例えば、2つ以上の異なる吸収スペクトルおよび/または発光スペクトルを含む2つ以上の異なるフルオロフォア)を含み得る。任意選択的に、プールおよび/またはライブラリ内の蛍光標識された親和性プローブおよび/または2つ以上の蛍光標識された親和性プローブのセットは各々、2つ以上の異なるフルオロフォアのセットからのフルオロフォア(例えば、2つ以上の異なる吸収スペクトルおよび/または発光スペクトルを含む2つ以上の異なるフルオロフォア)を含み得る。ここで、同じ標的生体分子に親和性を有する全ての当該蛍光標識された親和性プローブは、同じフルオロフォアを共有し、任意選択的に、各フルオロフォアは、当該蛍光標識された親和性プローブの標的生体分子を特定するか、かつ/またはそれに関連付けられる。任意選択的に、任意のプールおよび/またはライブラリおよび/または2つ以上の蛍光標識された親和性プローブのセットにおいて、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも15、少なくとも20、または少なくとも50等の数の異なるフルオロフォア(例えば、異なる吸収スペクトルおよび/または発光スペクトルを含む任意の数の異なるフルオロフォア)を使用することができる。
【0227】
任意選択的に、少なくとも1つの循環微粒子を含む試料を分析する任意の方法では、任意の試料、および/または溶液、および/または反応物もしくは反応混合物、および/または水性体積、および/または任意の数もしくは濃度の循環微粒子を含む混合物、および/または1つ以上の循環微粒子からの任意の数もしくは濃度の生体分子、および/または任意の数もしくは濃度の(同一もしくは異なる)バーコード、および/または任意の数もしくは濃度の(同一もしくは異なる)バーコード分子、および/または任意の数もしくは濃度の(同一もしくは異なる)バーコード配列、および/または任意の数もしくは濃度の(同一もしくは異なる)バーコード化オリゴヌクレオチド、および/または任意の数もしくは濃度の(同一もしくは異なる)多量体バーコード化試薬、および/または任意の数もしくは濃度の(同一もしくは異なる)親和性部分、および/または任意の数もしくは濃度の(同一もしくは異なる)バーコード化親和性プローブ、および/または任意の数もしくは濃度の(同一もしくは異なる)アダプターオリゴヌクレオチド、および/または任意の数もしくは濃度の(同一もしくは異なる)カップリング配列、および/または任意の数もしくは濃度の(同一もしくは異なる)濃縮プローブ、および/または任意の数もしくは濃度の(同一もしくは異なる)プライマー、および/または任意の数もしくは濃度の(同一もしくは異なる)ハイブリダイゼーションプローブ、および/または任意の数もしくは濃度の(同一もしくは異なる)蛍光インサイチュハイブリダイゼーションプローブは、当該方法のいずれか1つ以上のステップの間、および/または前、および/または後に、単一の区画内、または少なくとも第1および第2の区画内に含まれ得(例えば、第1および第2の区画に区画化または分割される)、あるいは少なくとも3つの区画、少なくとも4つの区画、少なくとも5つの区画、少なくとも10の区画少なくとも100の区画、少なくとも1000の区画、少なくとも10,000の区画、少なくとも100,000の区画、少なくとも1,000,000の区画、少なくとも10,000,000の区画、少なくとも100,000,000の区画または少なくとも1,000,000,000個の区画等、任意の数の区画内に含まれる(例えば、区画化または分割される)。
【0228】
任意選択的に、任意の方法において、任意の1つ以上の標的生体分子は、光学的測定および/または光学的定量のプロセスによって測定および/または分析され得る。任意選択的に、任意の方法において、任意の1つ以上の標的生体分子は、光学的に標識および/または蛍光標識された親和性プローブで測定および/または分析され得、ここで、当該親和性プローブは、当該標的生体分子に対して親和性および/または特異性を有する。
【0229】
任意選択的に、生体分子を測定および/または分析する任意の方法は、直接検出の1つ以上のステップを含み得る。任意選択的に、生体分子を測定および/または分析する任意の方法は、間接検出の1つ以上のステップを含み得る。
【0230】
誤解を避けるために、本発明および本明細書の任意の方法において、「循環微粒子の中に」および/または「循環微粒子内部」および/または「循環微粒子の」および/または「循環微粒子から」、および/または「循環微粒子に含まれる」、および/または「循環微粒子の内部に含まれる」である任意の1つ以上の生体分子を指す任意の用語は、当該循環微粒子の任意の形態または位置内で完全にまたは部分的に見出される(および/または潜在的に見出される)当該生体分子を広く指す(膜内に完全にまたは部分的に封入されていること、ならびに/または膜の外面および/もしくは内面に完全または部分的に、かつ/または膜内に完全にまたは部分的に埋め込まれていることを含む)。
【0231】
任意選択的に、任意の方法において、1つ以上の標的核酸分子の配列を分析する任意のステップは、プライマー伸長反応によって行われ得る。任意選択的に、任意の方法において、1つ以上の標的核酸分子の配列を分析する任意のステップは、任意選択的に、特定の標的配列(特定のDNA、RNA、cDNA標的配列等)の増幅(したがって、測定および検出)を提供するプライマーセットを使用して、ポリメラーゼ連鎖反応(PCR)によって行われ得る。任意選択的に、任意の方法において、1つ以上の標的核酸分子の配列を分析する任意のステップは、逆転写反応によって、任意選択的に、1つ以上の後続のプライマー伸長またはPCRステップを伴って行われ得る。
【0232】
任意選択的に、任意の方法において、1つ以上の標的核酸分子の配列を分析する任意のステップは、蛍光インサイチュハイブリダイゼーション(FISH)プロセス等のインサイチュハイブリダイゼーション(ISH)プロセスによって行われ得る。
【0233】
本発明の方法は、決定論的(例えば、1つのバーコード配列を使用して単一の微粒子からの配列リードを特定することができる)または確率的(例えば、単一の微粒子からである可能性が高い配列リードを特定するためにバーコード配列を使用することができる)であり得る。さらなる例として、この方法では、区画化のステップは、区画化ごとに平均1つの循環微粒子を達成することを目的とし得る。しかしながら、これは本質的に統計的なプロセスであり、各区画に単一の微粒子からの生体分子のみが含まれることを保証することはできない。したがって、特定の区画からの生体分子に対応する連結されたシグナルのセットが、単一の微粒子からの生体分子に対応することを保証することはできない。例えば、特定の区画が2つの異なる微粒子を含む場合、連結されたシグナルのセットは、2つの微粒子に対応し得る。
【0234】
本発明はさらに、1つ以上の循環微粒子を含む試料(または2つ以上のかかる試料、例えば、各々が1つ以上の循環微粒子を含む)を分析するためのシステムおよび装置を含む。任意選択的に、かかるシステムは、少なくとも1つの循環微粒子の測定に由来する連結されたシグナルの1つ以上のセット(例えば、少なくとも1つの循環微粒子の測定に由来する連結された配列の1つ以上のセット)を分析するための少なくとも1つのアルゴリズムまたはアルゴリズムおよび/もしくはコンピュータプログラムの一部(例えば、コンピュータシステム内に含まれるおよび/もしくはウェブベースまたはインターネットベースのコンピュータストレージシステム内に含まれるアルゴリズムまたはアルゴリズムおよび/もしくはコンピュータプログラムの一部)(本明細書に記載の任意のパラメータ値等の任意の1つまたはパラメータ値を計算するように構成された任意の1つ以上のアルゴリズムおよび/もしくはコンピュータプログラム等)、ならびに/または少なくとも1つの参照配列および/もしくは参照配列のセット(コンピュータシステムおよび/もしくはサーバおよび/もしくはハードディスク等のコンピュータデータストレージシステム内に含まれる1つ以上の参照配列等)、ならびに/またはバーコード化オリゴヌクレオチドの少なくとも1つのセット、ならびに/または少なくとも1つの多量体バーコード化試薬および/もしくはそのライブラリ、ならびに/または1つ以上の区画(各々が区画を含む1つ以上のチューブ、ならびに/またはウェルを含み、各ウェルが区画を含む、1つ以上のプレート、ならびに/または2つ以上の区画を含む1つ以上の装置であって、かかる各区画は、マイクロ流体液滴を含むかまたは生成することができるマイクロ流体デバイス(10X Genomicsによって提供されるChromiumシステム等)等の液滴、もしくはその上に1つ以上の液滴を含む平面を含む、装置等)を含む少なくとも1つの物理的装置、ならびに/またはバーコード配列を標的核酸に付加することができる少なくとも1つの酵素もしくは酵素溶液(任意のリガーゼ酵素、ポリメラーゼ酵素、および/もしくはトランスポザーゼ酵素等)、ならびに/または本明細書における任意の1つ以上の分析の結果(1つ以上の循環微粒子を含む試料からの2つまたは複数の連結されたシグナルの分析に基づく診断および/もしくは診断検査の任意の1つ以上の方法の結果等)を医師および/もしくは他の医療従事者および/もしくは患者に報告するように構成された、少なくとも1つのアルゴリズムおよび/もしくはコンピュータプログラムを含み得る。例えば、1つ以上の循環微粒子を含む試料を分析するためのシステムは、少なくとも1つの循環微粒子の測定に由来する連結されたシグナルの1つ以上のセットを分析するための少なくとも1つのアルゴリズムまたはその一部、および少なくとも1つのセットのバーコード化オリゴヌクレオチド(循環微粒子と一緒に構成されているか、または循環微粒子に由来する標的生体分子に付加されるように構成されている)、および1つ以上の区画を含む少なくとも1つの物理的装置を含み得る。あるいは、かかるシステムは、少なくとも1つの循環微粒子の測定に由来する連結されたシグナルの1つ以上のセットを分析するための少なくとも1つのアルゴリズムまたはその一部、および多量体バーコード化試薬の少なくとも1つのライブラリを含み得る。あるいは、かかるシステムは、少なくとも1つの循環微粒子の測定に由来する連結されたシグナルの1つ以上のセットを分析するための少なくとも1つのアルゴリズムまたはその一部、および多量体バーコード化試薬の少なくとも1つのライブラリ、および1つ以上の区画を含む少なくとも1つの物理的装置を含み得る。あるいは、かかるシステムは、少なくとも1つの循環微粒子の測定に由来する連結されたシグナルの1つ以上のセットを分析するための少なくとも1つのアルゴリズムまたはその一部、および少なくとも1つのセットのバーコード化オリゴヌクレオチド(循環微粒子と一緒に構成されているか、または循環微粒子に由来する標的生体分子に付加されるように構成されている)、ならびに本明細書における任意の1つ以上の分析の結果を報告するように構成された少なくとも1つのアルゴリズムおよび/もしくはコンピュータプログラムを含み得る。
【0235】
1.循環微粒子の試料
本発明の方法で使用するための試料は、少なくとも1つの循環微粒子(すなわち、血液(例えば、ヒト血液)に由来する微粒子)を含み得、かつ/または、本発明の方法で使用するための試料は、少なくとも1つの循環微粒子に由来し得る。微粒子(複数可)は、母体の血液に由来し得る。微粒子(複数可)は、疾患(例えば、がん)を有する患者の血液に由来し得る。試料は、例えば、血液試料、血漿試料、または血清試料であり得る。試料は、哺乳動物試料であり得る。好ましくは、試料はヒト試料である。
【0236】
循環微粒子(複数可)は、ヒトおよび/または他の動物からの血液、血漿、および/または血清中に見出された様々な無細胞微粒子のうちの1つ以上であり得る(Orozco et al,Cytometry Part A(2010).77A:502 514,2010)。「無細胞」とは、かかる微粒子が細胞ではないという事実を指す。代わりに、微粒子は、例えば、分泌またはアポトーシス後の細胞に由来する。これらの微粒子は、それらが由来する組織および細胞、ならびにそれらの形成の根底にある生物物理学的プロセス、ならびにそれらのそれぞれのサイズおよび分子構造および組成において多様である。微粒子は、細胞膜からの1つ以上の成分(例えば、リン脂質成分を含む)および1つ以上の細胞内および/もしくは細胞核成分を含み得る。微粒子(複数可)は、1つ以上のエクソソーム、アポトーシス小体(アポトーシス小胞としても知られている)および/または細胞外微小胞から選択され得る。
【0237】
微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含む膜小胞として定義することができる。微粒子は、100~5000nmの直径を有し得る。好ましくは、微粒子は、100~3000ナノメートルの直径を有する。
【0238】
エクソソームは最小の循環微粒子の1つであり、通常は直径50~100ナノメートルの範囲であり、生存可能な無傷の細胞の細胞膜に由来すると考えられており、外側のリン脂質成分内に含まれるタンパク質ならびに(mRNA分子および/または分解されたmRNA分子、およびマイクロRNA分子等の小さな調節RNA分子の両方を含む)RNAの両方の成分を含む。エクソソームは、細胞質の多小胞体のエキソサイトーシスによって形成されると考えられている(Gyorgy et al,Cell.Mol.Life Sci.(2011)68:2667-2688)。エクソソームは、細胞間シグナル伝達および細胞外機能において様々な役割を果たすと考えられている(Kanada et al,PNAS(2015)1418401112)。エクソソームに見られるマイクロRNAおよび/またはmRNA分子を定量または配列決定するための技術は以前に説明されている(例えば、米国特許出願第13/456,121号、欧州特許出願第EP2626433A1号)。
【0239】
微粒子には、アポトーシス小体(アポトーシス小胞としても知られる)および細胞外微小胞も含まれ、これらは全体で直径1ミクロンまたは2~5ミクロンの範囲であり、一般に直径100ナノメートルよりも大きいと考えられている(Lichtenstein et al,Ann N Y Acad Sci.(2001);945:239-49)。循環微粒子の全てのクラスは、体内の多数の多様な細胞によって生成されると考えられている(Thierry et al,Cancer Metastasis Rev35(3),347-376.9(2016)/s10555-016-9629-x)。
【0240】
好ましくは、微粒子はエクソソームではなく、例えば、微粒子は、エクソソームよりも大きな直径を有する任意の微粒子である。
【0241】
この方法で使用するための試料は、少なくとも1つの循環微粒子を含む試料、ならびに少なくとも1つの循環微粒子に由来する試料を含み得る。例えば、シグナルを測定するか、試薬(例えば、バーコード化オリゴヌクレオチド)を測定するステップは、少なくとも1つの無傷の循環微粒子を含む試料(例えば、試料または反応混合物が、シグナルの測定時または試薬の測定時に無傷の循環微粒子を含む)に対して行われ得る。あるいは、シグナルを測定するか、試薬(例えば、バーコード化オリゴヌクレオチド)を測定するステップは、循環微粒子に由来する生体分子(例えば、循環微粒子から精製および/または処理および/または分画および/または単離された生体分子)を含む試料に対して行われ得る。試料は、シグナルの測定時または試薬の測定時に、無傷の循環微粒子を含まない場合がある。
【0242】
試料は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも7、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも20,000、少なくとも50,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、または少なくとも100,000,000,000個の異なる標的生体分子および/または標的エピトープを含み得る。好ましくは、試料は、少なくとも100個の標的生体分子および/または標的エピトープを含む。
【0243】
試料では、核酸の断片(例えば、ゲノムDNA)は、マイクロリットルあたり1.0ピコグラム未満のDNA、マイクロリットルあたり10ピコグラム未満のDNA、マイクロリットルあたり100ピコグラム未満のDNA、マイクロリットルあたり1.0ナノグラム未満のDNA、マイクロリットルあたり10ナノグラム未満のDNA、マイクロリットルあたり100ナノグラム未満のDNA、またはマイクロリットルあたり1000ナノグラム未満のDNAの濃度であり得る。
【0244】
試料は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも7、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも50,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の循環微粒子を含み得る(またはそれに由来し得る)。好ましくは、試料は、少なくとも100個の循環微粒子を含む(またはそれに由来する)。
【0245】
試料では、微粒子は、マイクロリットルあたり0.001未満の微粒子、マイクロリットルあたり0.01未満の微粒子、マイクロリットルあたり0.1未満の微粒子、マイクロリットルあたり1.0未満の微粒子、マイクロリットルあたり10未満の微粒子、マイクロリットルあたり100未満の微粒子、マイクロリットルあたり1000未満の微粒子、マイクロリットルあたり10,000未満の微粒子、マイクロリットルあたり100,000未満の微粒子、マイクロリットルあたり1,000,000未満の微粒子、マイクロリットルあたり10,000,000未満の微粒子、またはマイクロリットルあたり100,000,000未満の微粒子の濃度であり得る。
【0246】
循環微粒子は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも7、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも20,000、少なくとも100,000、少なくとも500,000、少なくとも1,000,000、または少なくとも10,000,000個の異なる標的生体分子および/または標的エピトープを含み得る。好ましくは、循環微粒子は、少なくとも10個の標的生体分子および/または標的エピトープを含む。
【0247】
本発明の方法では、任意の数の1つ以上の異なる標的生体分子および/または標的エピトープを測定および/または分析することができる。任意選択的に、任意の方法において、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも7、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、または少なくとも20,000個の異なる標的生体分子および/または標的エピトープの群を測定および/または分析することができる。好ましくは、少なくとも3つの異なる標的生体分子および/または標的エピトープの群が測定および/または分析される。
【0248】
この方法では、同じ標的生体分子(および/または標的エピトープ)、および/または2つ以上の標的生体分子(および/または標的エピトープ)の同じ群を、試料内の全ての循環微粒子(または区画)について測定および/または分析することができる。任意選択的に、任意の方法において、特定の標的生体分子(および/または標的エピトープ)、および/または2つ以上の標的生体分子(および/または標的エピトープ)の特定の群を、試料内の循環微粒子のサブセットについて測定および/または分析することができる。任意選択的に、任意の方法において、循環微粒子の試料は、任意の数の2つ以上のサブ試料に分割され得、異なる特定の標的生体分子(および/または標的エピトープ)、および/または2以上の標的生体分子(および/または標的エピトープ)の異なる特定の群は、各サブ試料について測定および/または分析することができる。
【0249】
任意選択的に、任意の方法において、同じ生体分子の2つ以上の異なる標的エピトープを測定および/または分析することができる。例えば、標的生体分子(標的タンパク質等)内の2つ以上の異なるエピトープに対する親和性または特異性を有する2つ以上の異なる親和性プローブ(2つ以上の異なる抗体等)を使用して、当該標的生体分子を測定または分析することができる。
【0250】
生体分子(本明細書では標的生体分子とも呼ばれる)は、循環微粒子に存在するか、またはそれに由来する化学種または分子種であり得る。生体分子は、高分子であり得る。生体分子は、高分子であり得る。生体分子は、ポリペプチド(例えば、タンパク質)、炭水化物分子、脂質分子、または核酸分子であり得る。生体分子は、代謝物であり得る。好ましくは、生体分子はヒト生体分子である。
【0251】
標的生体分子は、所定の(または事前定義された)配列を有し得る。例えば、標的ポリペプチドは、所定の(または事前定義された)アミノ酸配列またはエピトープを有し得る。同様に、標的核酸の断片は、所定の(または事前定義された)ヌクレオチド配列を有し得る。この方法は、標的特異的試薬、例えば、バーコード化親和性プローブもしくは親和性プローブを使用して、所定の(または事前定義された)配列またはエピトープの存在、不在、および/またはレベルに対応するシグナルを測定することを含み得る。
【0252】
生体分子は、核酸生体分子または非核酸生体分子であり得る。
【0253】
本明細書で使用される場合、「ポリペプチド」という用語は、ペプチド結合、ペプチド、およびタンパク質、例えば糖タンパク質等の翻訳後修飾タンパク質によって連結された少なくとも2つのアミノ酸モノマーの鎖を含む。1つ以上の生体分子は、1つ以上のタンパク質アイソフォームであり得る。
【0254】
生体分子は、循環微粒子に存在するか、またはそれに由来する抗原のエピトープを含み得る。例えば、エピトープは、ポリペプチドまたはタンパク質のエピトープであり得る。生体分子は、特定のエピトープ、例えば、特定のタンパク質エピトープおよび/またはタンパク質の翻訳後修飾(例えば、リジンメチル化修飾)によって生成される特定のエピトープを含み得る。生体分子は、特定の核酸修飾(例えば、5-メチルシトシンDNAエピトープおよび/または5-ヒドロキシ-メチルシトシンDNAエピトープ)等の特定の核酸エピトープを含み得る。生体分子は、抗体によって認識される特定のエピトープ等、1つ以上の親和性プローブ(例えば、バーコード化親和性プローブ)によって認識される特定のエピトープを含み得る。
【0255】
生体分子は、核酸エピトープではないエピトープを含み得る。生体分子は、5-メチルシトシンDNA分子ではない可能性があり(すなわち、生体分子は、5-メチルシトシンDNAエピトープではないエピトープである可能性がある)、かつ/または生体分子は、5-ヒドロキシ-メチルシトシンDNA分子ではない可能性がある(すなわち、生体分子は、5-ヒドロキシ-メチルシトシンDNAエピトープではないエピトープである可能性がある)。
【0256】
生体分子は、DNA結合タンパク質であり得る。任意選択的に、生体分子は、DNA結合タンパク質ではない。
【0257】
生体分子は、ヒストンタンパク質(例えば、ヒストンH1、ヒストンH2A、ヒストンH2B、ヒストンH3、および/もしくはヒストンH4、ならびに/または任意のヒストンバリアント)であり得る。ヒストンタンパク質は、翻訳後修飾されたヒストンタンパク質(例えば、ヒストンH3リジン4トリメチル化、ヒストンH3リジン27トリメチル化、および/または任意のヒストンアセチル化修飾)であり得る。任意選択的に、生体分子は、ヒストンタンパク質ではない。
【0258】
生体分子は、クロマチンタンパク質であり得る。任意選択的に、生体分子は、クロマチンタンパク質ではない。
【0259】
生体分子は、膜タンパク質またはポリペプチドであり得る。任意選択的に、生体分子は、膜タンパク質またはポリペプチドではない。生体分子は、DNAで免疫沈降するポリペプチドまたはタンパク質であり得る。任意選択的に、生体分子は、DNAで免疫沈降するポリペプチドまたはタンパク質ではない。
【0260】
生体分子は、DNAに結合する生体分子であり得る。任意選択的に、生体分子は、DNAに結合する生体分子ではない。生体分子は、膜生体分子または膜関連生体分子であり得る。任意選択的に、生体分子は、膜生体分子または膜関連生体分子ではない。生体分子は、DNAで免疫沈降する生体分子であり得る。任意選択的に、生体分子は、DNAで免疫沈降する生体分子ではない。
【0261】
生体分子は、循環微粒子の膜(循環微粒子の脂質二重層膜等)の内面および/または外面に完全にまたは部分的に含まれ得る。生体分子は、循環微粒子の膜内に完全にまたは部分的に封入され得る(循環微粒子の脂質二重層内に封入される等)。生体分子は、循環微粒子の膜内および/または膜を横切って含まれ得、および/あるいはそれらの任意の組み合わせを含み得る。生体分子は、循環微粒子の膜内に完全にまたは部分的に埋め込まれて(例えば、循環微粒子の脂質二重層膜内に完全にまたは部分的に埋め込まれて)含まれ得る。
【0262】
生体分子は、循環微粒子の内面および/もしくは外面に由来し得、かつ/または循環微粒子内に由来し得(例えば、循環微粒子の膜内に由来し得る)、かつ/または循環微粒子の膜内および/もしくは膜を横切って由来し得、かつ/あるいはそれらの任意の組み合わせに由来し得る。
【0263】
生体分子は、DNA(例えば、二本鎖DNA(dsDNA)もしくは一本鎖DNA(ssDNA))、RNA(例えば、二本鎖RNA(dsRNA)もしくは一本鎖RNA(ssRNA))、またはそれらの断片であり得る。生体分子は、ゲノムDNAまたはRNA(例えば、mRNA)、あるいはそれらの断片であり得る。
【0264】
1つ以上の生体分子(もしくは標的生体分子)は、以下を含む生体分子群1から選択される(またはコードする)DNA断片、RNA断片および/またはポリペプチドであり得る。
・前立腺特異抗原(PSA)およびCA-125を含む、がんおよび/またはがんの攻撃性の血漿ベースのタンパク質マーカー。
・CD3、CD4、CD8、CD19、CD20、CD20、CD41、CD45、CD61、CD62、CD146、CD235a、CD326を含む細胞表面および免疫細胞型マーカー。
・発がんおよび悪性形質転換に関与する遺伝子およびタンパク質、ならびに抗原KI-67(Ki-67)、NK2ホメオボックス1(TTF-1)、B細胞リンパ腫2(BCL2)、BRAF、C-kit/CD117、c-Myc、c-Raf、Ras、サバイビン、血管内皮成長因子受容体(VEGFR)、腫瘍関連糖タンパク質72(TAG-72)、上皮成長因子受容体(EGFR)、エストロゲン受容体、プログラムデスリガンド1(PD-L1)、サイクリンB1、上皮細胞接着分子(EpCAM)、HER2/Neu、プロゲステロン受容体、K-ras、NRAS、ベータ2ミクログロブリン(B2M)、カルシトニン、CA19-9、CA15-3/CA27.29、クロモグラニンA(CgA)、ニューロン特異的エノラーゼ、乳酸デヒドロゲナーゼ、チログロブリン、クローディン-1(CLDN1)、HE4、血小板由来成長因子受容体(PDGF-R)、核マトリックスタンパク質22、サイトケラチン8(CK-8)、サイトケラチン18(CK-18)、サイトケラチン断片21-1、およびOVX1を含むがん細胞のタイプおよびサブタイプを評価するための免疫細胞化学的マーカーとして使用される遺伝子。
・(アルファフェトプロテイン(AFP)、ベータヒト絨毛性ゴナドトロピン(ベータ-nCG)、トール様受容体4(TLR4)を含む、妊娠(胎児マーカーまたは胎盤マーカー等)に関連するマーカー(すなわち、血漿タンパク質マーカー)または妊娠の合併症に関連するマーカー。
・アネキシンV、アポリポタンパク質A1(Apo A-1)、プラスミノーゲンアクチベーター阻害剤(PAI-1)、CD31、CD144、およびウロキナーゼプラスミノーゲンアクチベーター(uPA)を含む、循環リポタンパク質粒子および/または血管内プラークに関連するタンパク質。
・miR-1、miR-19b、miR-21、miR-22、miR-29b、miR-92a、miR-99a、miR-100、miR-126、miR-127、miR-133a、miR-133b、miR-143、miR-145、miR-199a、miR-210、およびlet-7fを含む血管内プラークに関連する(および/またはその中で示差的に発現する)マイクロRNA分子(miRNA)。
・リンパ球および/またはLY6G6Dおよび免疫グロブリンを含む他の免疫細胞のマーカー。
・トランスサイレチン、C反応性タンパク質(CRP)、トロポニン等の他の標的生体分子。
【0265】
上記で提供される生体分子(もしくは標的生体分子)は、本明細書ではまとめて「生体分子群1」として知られている。
【0266】
かかるDNA断片は、1つ以上のタンパク質コード遺伝子のDNA配列(例えば、ゲノム配列、エキソン領域配列、イントロン領域配列、プロモーター領域配列、および/またはターミネーター領域配列)の全部または一部を含み得る。かかるRNA断片は、1つ以上のタンパク質をコードする遺伝子のRNA配列(例えば、エキソンRNA配列、イントロンRNA配列、5’非翻訳領域配列、および/または3’非翻訳領域配列)の全部または一部を含み得る。かかるポリペプチドは、1つ以上のタンパク質の全部または一部を含み得る。かかるポリペプチドは、当該ポリペプチドの1つ以上の翻訳後修飾形態を含み得る(例えば、当該ポリペプチドは、任意の1つ以上のアミノ酸残基でアセチル化またはメチル化されている)。好ましくは、生体分子は、ヒト生体分子(例えば、ヒトKi-67)である。
【0267】
生体分子は、エピジェネティック修飾を含み得る。エピジェネティック修飾は、修飾ヌクレオチド、例えば、修飾gDNAヌクレオチドまたは修飾RNAヌクレオチドを含み得る。修飾ヌクレオチドは、修飾塩基を含み得る。修飾塩基は、メチル化塩基、例えば、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンであり得る。生体分子(標的核酸(例えば、ゲノムDNA)の断片等)は、5-メチルシトシンを含み得る(すなわち、5-メチルシトシンDNAを含み得る、かつ/または5-メチルシトシンDNAヌクレオチドを含み得る)。生体分子(標的核酸(例えば、ゲノムDNA)の断片等)は、5-ヒドロキシ-メチルシトシンを含み得る(すなわち、5-ヒドロキシ-メチルシトシンDNAを含み得る、かつ/または5-ヒドロキシ-メチルシトシンDNAヌクレオチドを含み得る)。エピジェネティック修飾は、タンパク質の翻訳後修飾を含み得る。翻訳後修飾は、メチル化、リン酸化、アセチル化、ユビキチン化および/またはSUMO化であり得る。翻訳後修飾されたポリペプチドは、ヒストンタンパク質であり得る。例えば、翻訳後修飾されたヒストンタンパク質(例えば、ヒストンH3リジン4トリメチル化、ヒストンH3リジン27トリメチル化、および/または任意のヒストンアセチル化修飾)。
【0268】
生体分子は、外因的に投与されるポリペプチド(外因的に投与される抗体等)等の外因的に投与される分子、および/または外因的に投与される核酸(外因的に投与されるオリゴヌクレオチド等、例えば、バーコード化オリゴヌクレオチド等の外因的に投与されるバーコード配列等)を含み得る。
【0269】
生体分子は、バーコード化親和性プローブのバーコード化オリゴヌクレオチド(またはそのバーコード配列)を含み得る。
【0270】
循環微粒子の生体分子のうちの少なくとも2つは、標的核酸の断片(例えば、断片化されたゲノムDNAの分子)であり得る。断片化されたゲノムDNAのこれらの分子、および/または断片化されたゲノムDNAのこれらの分子内に含まれる配列は、本明細書に記載の任意の方法によって連結され得る。
【0271】
標的核酸の断片は、DNAの断片(例えば、断片化されたゲノムDNAの分子)またはRNAの断片(例えば、mRNAの断片)であり得る。好ましくは、標的核酸の断片は、ゲノムDNAの断片である。
【0272】
DNAの断片は、ミトコンドリアDNAの断片であり得る。DNAの断片は、母体の細胞または組織からのミトコンドリアDNAの断片であり得る。DNAの断片は、胎児または胎盤組織からのミトコンドリアDNAの断片であり得る。DNAの断片は、罹患組織および/またはがん組織からのミトコンドリアDNAの断片であり得る。
【0273】
微粒子は、血小板を含み得る。微粒子は、腫瘍化血小板を含み得る。標的核酸は、血小板RNA(例えば、血小板RNAの断片、および/または腫瘍化血小板RNAの断片)を含み得る。1つ以上の血小板を含む試料は、多血小板血漿(例えば、腫瘍化血小板を含む多血小板血漿)を含み得る。
【0274】
標的核酸の断片は、二本鎖または一本鎖核酸を含み得る。ゲノムDNAの断片は、二本鎖DNAまたは一本鎖DNAを含み得る。標的核酸の断片は、部分的に二本鎖の核酸を含み得る。ゲノムDNAの断片は、部分的に二本鎖のDNAを含み得る。
【0275】
標的核酸の断片は、単一の核酸分子に由来する断片、または2つ以上の核酸分子に由来する断片であり得る。例えば、ゲノムDNAの断片は、単一のゲノムDNA分子に由来し得る。
【0276】
当業者が理解するように、本明細書で使用される場合、標的核酸の断片という用語は、微粒子中に存在する元の断片、およびそのコピーまたはアンプリコンを指す。例えば、gDNAの断片という用語は、微粒子中に存在する元のgDNA断片を指し、例えば、プライマー伸長反応によって元のゲノムDNA断片から調製され得るDNA分子を指す。さらなる例として、mRNA断片という用語は、微粒子中に存在する元のmRNA断片を指し、例えば、逆転写によって元のmRNA断片から調製され得るcDNA分子を指す。
【0277】
標的核酸(例えば、ゲノムDNA)の断片は、少なくとも10ヌクレオチド、少なくとも15ヌクレオチド、少なくとも20ヌクレオチド、少なくとも25ヌクレオチド、または少なくとも50ヌクレオチドであり得る。標的核酸(例えば、ゲノムDNA)の断片は、15~100,000ヌクレオチド、20~50,000ヌクレオチド、25~25,000ヌクレオチド、30~10,000ヌクレオチド、35~5,000ヌクレオチド、40~1000ヌクレオチド、または50~500ヌクレオチドであり得る。標的核酸(例えば、ゲノムDNA)の断片は、20~200ヌクレオチド長、100~200ヌクレオチド長、200~1000ヌクレオチド長、50~250ヌクレオチド長、1000~10,000ヌクレオチド長、10,000~100,000ヌクレオチド長、または50~100,000ヌクレオチド長であり得る。好ましくは、断片化されたゲノムDNAの分子は、50~500ヌクレオチド長である。
【0278】
任意選択的に、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法は、任意の2つ以上の異なる生体分子(例えば、任意の2つ以上の異なる標的生体分子)の任意の組み合わせの測定を含む、組み合わせ測定(例えば、存在、不在、および/またはレベルの測定)を含み得る。例えば、任意のかかる方法は、(例えば、バーコード化および/または配列決定によって)ゲノムDNAの連結された断片の測定を含み得、任意選択的に、ゲノムDNAの連結された断片の測定は、ゲノムDNAの当該断片のゲノムまたはヌクレオチド配列長の測定および/または推定をさらに含み、かつ任意選択的に、ゲノムDNAの連結された断片の測定は、ゲノムDNAの連結された断片の3’末端(複数可)および/または5’末端のゲノム座標(またはゲノム位置)の測定および/または推定、および1つ以上の修飾ヌクレオチドまたは核酸塩基の測定(5-メチルシトシンの測定、5-ヒドロキシ-メチルシトシンの測定等)、ならびに1つ以上のポリペプチド生体分子の測定(生体分子1からの任意の1つ以上の生体分子の測定等)をさらに含む。任意選択的に、任意のかかる組み合わせ測定は、がんおよび/またはがん攻撃性の1つ以上の血漿ベースのタンパク質マーカー、ならびに1つ以上の細胞表面または免疫細胞型マーカー、ならびにがん細胞型および細胞型を評価するための発がんおよび悪性形質転換または免疫細胞化学的マーカーに関与する1つ以上のタンパク質、ならびに妊娠に関連するまたは妊娠の合併症に関連する1つ以上のマーカー、ならびに循環リポタンパク質粒子および/または血管内プラークに関連する1つ以上のタンパク質、ならびに1つ以上のマイクロRNA分子(生体分子群1に含まれるリスト内で提供されるようなマーカー等)の測定を(さらに)含み得る。例えば、組み合わせ測定は、ゲノムDNAの連結された断片の測定を含み得、任意選択的に、ゲノムDNAの連結された断片の測定は、ゲノムDNAの当該断片のゲノムまたはヌクレオチド配列長の測定および/または推定をさらに含み、かつ任意選択的に、ゲノムDNAの連結された断片の測定は、ゲノムDNAの連結された断片の3’末端(複数可)および/または5’末端のゲノム座標(またはゲノム位置)の測定および/または推定、および1つ以上の修飾ヌクレオチドまたは核酸塩基の測定(5-メチルシトシンの測定、5-ヒドロキシ-メチルシトシンの測定等)、ならびにPSA、およびCA-125、およびCD4、およびCD8、およびKi-67、およびBCL2、およびEGFRの測定をさらに含む。任意選択的に、かかる組み合わせ測定は、TTF-1および/またはRasおよび/またはc-Mycおよび/またはPD-L1および/またはエストロゲン受容体および/またはサイクリンB1の測定をさらに含み得る。
【0279】
任意選択的に、任意の組み合わせ測定は、単一の個体(例えば、単一の患者)からの2つ以上の試料の別個のかかる組み合わせ測定を含み得、当該2つ以上の試料は、同じ個体から採取/作成されるが、1つ以上の期間(少なくとも1か月、少なくとも3か月、少なくとも6か月、少なくとも12か月、少なくとも18か月、少なくとも2年、少なくとも3年、少なくとも4年、少なくとも5年、および/もしくは少なくとも10年、ならびに/または任意の他の期間)で分離されている。例えば、(本明細書に記載の任意の種類の)特定の組み合わせ測定は、個体から採取された第1の試料に対して行われ得、後の期間に当該個体から採取された第2の試料に対して別個に行われ得る。個体からのかかる連続した(時間分離された)試料の任意の数は、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも8、少なくとも10、少なくとも15、少なくとも20、少なくとも25、または少なくとも30の連続試料、またはそれ以上または同様の数を分析することができる。
【0280】
2.循環微粒子の試料の単離
循環微粒子(および/または循環微粒子の特定のサブセット、カテゴリ、または画分)を単離するための多数の方法が以前に説明されている。欧州特許第ES2540255(B1)号および米国特許第9005888B2号は、遠心分離手順に基づいてアポトーシス小体等の特定の循環微粒子を単離する方法を説明している。遠心分離、超遠心分離、および他の技術によって異なるタイプの無細胞微粒子を単離するための多数の方法が以前に十分に説明され、開発されてきた(Gyorgy et al,Cell.Mol.Life Sci.(2011)68:2667-2688)。
【0281】
この方法は、血液、血漿、または血清から1つ以上の循環微粒子を含む試料を単離することをさらに含み得る。微粒子(複数可)は、血液、血漿、または血清から単離することができる。この方法は、血液、血漿、または血清から微粒子を単離するステップをさらに含み得る。
【0282】
微粒子(複数可)は、遠心分離、サイズ排除クロマトグラフィ、および/またはフィルタリングによって単離することができる。
【0283】
単離するステップは、遠心分離を含み得る。微粒子(複数可)は、遠心分離ステップおよび/または超遠心分離ステップ、あるいは2つ以上の異なる速度での一連の2つ以上の遠心分離ステップおよび/または超遠心分離ステップでペレット化することによって単離することができ、1つの遠心分離/超遠心分離ステップからのペレットおよび/または上清は、第2の遠心分離/超遠心分離ステップ、および/または分画遠心分離プロセスでさらに処理される。
【0284】
遠心分離または超遠心分離ステップ(複数可)は、100~500,000G、100~1000G、1000~10,000G、10,000~100,000G、500~100,000G、または100,000~500,000Gの速度で行うことができる。遠心分離または超遠心分離ステップは、少なくとも5秒、少なくとも10秒、少なくとも30秒、少なくとも60秒、少なくとも5分、少なくとも10分、少なくとも30分、少なくとも60分、または少なくとも3時間で行われ得る。
【0285】
単離するステップは、サイズ排除クロマトグラフィ、例えば、セファロースベースのマトリックスまたはセファクリルベースのマトリックスを含むカラムを含むもの等の、カラムベースのサイズ排除クロマトグラフィプロセスを含み得る。
【0286】
サイズ排除クロマトグラフィは、少なくとも50ナノメートル、少なくとも100ナノメートル、少なくとも200ナノメートル、少なくとも500ナノメートル、少なくとも1.0マイクロメートル、少なくとも2.0マイクロメートル、または少なくとも5.0マイクロメートルのサイズまたは直径の細孔サイズを含むマトリックスまたはフィルタを使用することを含み得る。
【0287】
単離するステップは、試料をフィルタリングすることを含み得る。濾液は、この方法で分析された微粒子(複数可)を提供し得る。任意選択的に、フィルタを使用して、特定のサイズ未満の微粒子を単離し、フィルタは、サイズが100ナノメートルを超える、サイズが200ナノメートルを超える、サイズが300ナノメートルを超える、サイズが500ナノメートルを超える、サイズが1.0マイクロメートルを超える、サイズが2.0マイクロメートルを超える、サイズが3.0マイクロメートルを超える、サイズが5.0マイクロメートルを超える、またはサイズが10.0マイクロメートルを超える粒子を優先的または完全に除去する。任意選択的に、同じサイズフィルタリングパラメータを有する、または異なるサイズフィルタリングパラメータを有するフィルタを使用して、2つ以上のかかるフィルタリングステップを行うことができる。任意選択的に、1つ以上のフィルタリングステップからの濾液は微粒子を含み、連結された配列リードがそこから生成される。
【0288】
3.分析のための循環微粒子の試料の調製
この方法では、循環微粒子が無傷である間に、任意の1つ以上の標的生体分子を測定および/または分析することができる。任意選択的に、循環微粒子が無傷ではない間(すなわち、1つ以上の生体分子が循環微粒子から放出された後)に、任意の1つ以上の標的生体分子を測定および/または分析することができる。
【0289】
1つ以上の循環微粒子を含む試料は、化学的に架橋され得る(例えば、ホルムアルデヒドを用いて)。1つ以上の循環微粒子を含む試料は、透過処理され得る(例えば、化学的界面活性剤を用いて)。1つ以上の循環微粒子を含む試料は、(例えば、ホルムアルデヒドを用いて)化学的に架橋され得る。化学架橋および/または透過処理のステップ(複数可)は、1つ以上の循環微粒子の標的生体分子(複数可)を測定および/または分析する前に行うことができる。
【0290】
架橋ステップは、化学架橋剤、例えば、ホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、グルタル酸ジスクシンイミジル、エチレングリコールビス(コハク酸スクシンイミジル)、ホモ二官能性架橋剤、またはヘテロ二官能性架橋剤を用いて行われ得る。任意のかかる架橋ステップは、クエンチするステップによって、例えば、グリシン溶液と混合することによってホルムアルデヒド架橋ステップをクエンチすることによってさらに終了させられ得る。任意のかかる架橋は、プロトコルの特定の後続ステップの前に、例えば、プライマー伸長、PCR、または核酸精製ステップの前に除去され得る。化学架橋剤による架橋のステップは、各微粒子内の生体分子(ゲノムDNAおよび/またはポリペプチドの断片)を互いに物理的に近接して保持するという目的を果たし、これにより、微粒子の基本的な構造的性質を保持しながら(すなわち、同じ微粒子に由来するゲノムDNA断片および/またはポリペプチドの物理的近接を保持しながら)試料が操作および処理されるようになり得る。
【0291】
微粒子(複数可)は、インキュベーションステップで透過処理され得る。インキュベーションステップは、化学的界面活性剤(例えば、Triton X-100(C14H22O(C2H4O)n(n=9~10))、NP-40、Tween20、Tween80、サポニン、ジギトニン、またはドデシル硫酸ナトリウム)の存在下で行うことができる。インキュベーションステップは、少なくとも摂氏20度、少なくとも摂氏30度、少なくとも摂氏37度、少なくとも摂氏45度、少なくとも摂氏50度、少なくとも摂氏60度、少なくとも摂氏65度、少なくとも摂氏70度、または少なくとも摂氏80度の温度で行われ得る。インキュベーションステップは、少なくとも1秒間の長さ、少なくとも5秒間の長さ、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも1分間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、または少なくとも3時間の長さであり得る。
【0292】
本明細書に記載の試薬(例えば、バーコード化オリゴヌクレオチド、多量体バーコード化試薬、親和性プローブ、バーコード化親和性プローブ等)のいずれか1つ以上を1つ以上の微粒子に移すステップの後に、任意の1つ以上の標的生体分子を測定および/または分析することができる。この方法は、本明細書に記載の試薬(例えば、バーコード化オリゴヌクレオチド、多量体バーコード化試薬、親和性プローブ、バーコード化親和性プローブ等)のいずれか1つ以上を1つ以上の循環微粒子に移すステップを含み得る。
【0293】
この方法では、本明細書に記載の試薬のいずれか1つ以上は、トランスフェクション試薬または脂質担体(例えば、リポソームまたはミセル)との複合体形成によって、1つ以上の循環微粒子に移され得る。トランスフェクション試薬は、脂質トランスフェクション試薬、例えば、カチオン性脂質トランスフェクション試薬であり得る。任意選択的に、当該カチオン性脂質トランスフェクション試薬は、少なくとも2つのアルキル鎖を含む。任意選択的に、当該カチオン性脂質トランスフェクション試薬は、リポフェクタミン等の市販のカチオン性脂質トランスフェクション試薬であり得る。
【0294】
この方法では、第1の循環微粒子を分析するための試薬は、第1の脂質担体内に含まれ得、第2の循環微粒子を分析するための試薬は、第2の脂質担体内に含まれ得る。脂質担体は、リポソームまたはミセルであり得る。
【0295】
移すステップの前に、この方法は、微粒子中の生体分子(例えば、ゲノムDNAの断片および/または標的ポリペプチド)を架橋するステップを含み得る。移すステップの前に、そして任意選択的に、架橋のステップの後に、この方法は、微粒子を透過処理するステップをさらに含み得る
【0296】
1つ以上の循環微粒子から標的生体分子を放出するステップに続いて、任意の1つ以上の標的生体分子を測定および/または分析することができる。1つ以上の標的生体分子は、循環微粒子(複数可)を溶解、透過処理、および/または渙散するステップによって、循環微粒子(複数可)から放出され得る。本発明の方法は、1つ以上の循環微粒子から標的生体分子を(例えば、1つ以上の循環微粒子を溶解、透過処理、および/または渙散することによって)放出することを含み得る。この放出ステップは、高温インキュベーションステップとともに、および/または分子溶媒または化学的界面活性剤とのインキュベーションにより行われ得る
【0297】
任意の1つ以上の標的生体分子は、1つ以上の循環微粒子から任意の1つ以上の標的生体分子を精製および/または単離および/または処理するステップの後に測定および/または分析することができる。本発明の方法は、当該試料を分析する任意のステップの前に、かつ/またはその間に、かつ/またはその後に、当該循環微粒子のいずれかまたは全ての標的生体分子および/または他の構成要素を、処理、精製、分画、および/または単離する1つ以上のステップを含み得る。この方法は、核酸(DNA分子および/またはRNA分子等)を精製および/または単離するステップを含み得る。この方法は、ポリペプチド(タンパク質および/または翻訳後修飾タンパク質等)を精製および/または単離するステップを含み得る。
【0298】
任意の1つ以上の標的生体分子は、任意の1つ以上の当該標的生体分子および/または標的核酸分子を、固体支持体、および/または半固体支持体、および/またはゲル支持体等の支持体に結合および/または付加するステップの後に測定および/または分析することができる。
【0299】
この方法は、1つ以上の分子(DNA分子および/またはRNA分子等の任意の1つ以上の核酸分子、および/またはタンパク質または翻訳後修飾タンパク質等の任意のポリペプチド分子等)を支持体に付加するステップを含み得る。1つ以上の循環微粒子を含む試料からのかかる分子の任意の数または画分を、1つ以上の支持体に付加することができる。任意選択的に、かかる分子の少なくとも0.01%、少なくとも0.1%、少なくとも1%、少なくとも10%、少なくとも50%または100%を1つ以上の支持体に付加することができる。
【0300】
任意の1つ以上のかかる分子は、任意の形態の支持体(例えば、高分子、固体支持体または半固体支持体、またはデンドリマー)に連結され得る。任意の支持体は、ビーズ(例えば、ゲルビーズ、アガロースビーズ、シリカビーズ、スタイロフォームビーズ、ゲルビーズ(10x Genomics(登録商標)から入手可能なもの等)、抗体コンジュゲートビーズ、オリゴdTコンジュゲートビーズ、ストレプトアビジンビーズ、または磁気ビーズ(例えば、超常磁性ビーズ))であり得る。任意のビーズは、任意のサイズおよび/または分子構造(例えば、直径10ナノメートル~100ミクロン、直径100ナノメートル~10ミクロン、または直径1ミクロン~5ミクロン)であり得る。分子は、直接的または間接的に(例えば、リンカー分子を介して)支持体に連結され得る。分子は、支持体に結合することによって、かつ/または支持体に結合しているリンカー分子に結合またはアニールすることによって連結することができる。分子は、共有リンケージ、非共有リンケージ(例えば、タンパク質-タンパク質相互作用もしくはストレプトアビジン-ビオチン結合)または核酸ハイブリダイゼーションによって支持体(もしくはリンカー分子)に結合することができる。リンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。リンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。リンカー分子は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。任意の支持体は、2つ以上の分子の付着を可能にするように官能基化され得る。この官能基化は、化学部分(例えば、カルボキシル化基、アルキン、アジド、アクリレート基、アミノ基、硫酸基、もしくはスクシンイミド基)、および/またはタンパク質ベースの部分(例えば、ストレプトアビジン、アビジン、もしくはプロテインG)を支持体に付加することにより可能になり得る。
【0301】
分子は、高分子に結合することによって、かつ/または高分子にアニールすることによって、高分子によって連結することができる。高分子は、各々バーコード分子に結合することができる2つ以上のヌクレオチドを含む核酸であり得る。加えてまたはあるいは、核酸は、各々バーコード分子にハイブリダイズすることができる2つ以上の領域を含み得る。高分子は、合成ポリマー(例えば、デンドリマー)またはバイオポリマー、例えば、核酸(例えば、一本鎖DNA等の一本鎖核酸)、ペプチド、ポリペプチド、またはタンパク質(例えば、多量体タンパク質)であり得る。デンドリマーは、少なくとも2、少なくとも3、少なくとも5、または少なくとも10世代を含み得る。
【0302】
この方法は、(a)任意の方法により、1つ以上のビオチン部分を含むカップリング分子を標的分子(標的核酸分子または標的ポリペプチド分子等)に付加すること、および/またはビオチンコンジュゲート親和性プローブを標的分子に付加して、ビオチンコンジュゲート標的分子を作成することと、(b)当該ビオチンコンジュゲート標的分子を1つ以上のストレプトアビジンコンジュゲート支持体(1つ以上のストレプトアビジンコンジュゲートビーズ等)に付加することと、を含む方法によって、1つ以上の循環微粒子を支持体に付加することを含み得る。任意選択的に、ステップ(b)の前および/または間に、当該ビオチンコンジュゲート標的分子を2つ以上の区画に区画化する。
【0303】
試料を2つ以上の区画に区画化するステップに続いて、任意の1つ以上の標的生体分子を測定および/または分析することができる。この方法は、試料を2つ以上の区画に区画化することを含み得る。任意選択的に、各区画は、1つ以上の支持体を含み得、各区画に区画化された微粒子(複数可)からの分子は、それぞれ、同じ区画内に含まれる支持体に付加される。任意選択的に、任意の数の微粒子(少なくとも1000個の微粒子、少なくとも1,000,000個の微粒子、または少なくとも100,000,000個の微粒子等)を含む試料を、かかるプロセスによって付加することができる。任意選択的に、任意の数および/または平均数の微粒子を各区画に区画化することができる(例えば、平均100未満、10未満、1未満、0.5未満、0.2未満、0.1未満、未満0.05、0.01未満、0.001未満、0.0001未満、0.00001未満、または0.000001未満の微粒子は、各区画に区画化できる)。各区画には、平均0.1の支持体、平均0.5の支持体、平均1の支持体、平均2の支持体、平均5の支持体、平均10の支持体、または平均100の支持体等、任意の数の支持体を含めることができる、または平均して含む。任意選択的に、2つ以上の循環微粒子を含む試料からの分子を区画内の支持体に付加する任意のプロセスに続いて、任意の画分および/または全ての区画内に含まれる溶液の全てまたは任意の画分を一緒にマージして、単一の非区画化されていない支持体付加反応混合物を形成することができる。ここで、当該区画化されていない支持体付加反応混合物は、試料からの分子がそのように付加された支持体を含む。次に、任意選択的に、当該区画化されていない支持体付加反応混合物を、ゲノムDNAの断片を測定する任意の方法、修飾ヌクレオチドまたは核酸塩基を測定する任意の方法、および/または1つ以上の標的ポリペプチドを測定する任意の方法等、2つ以上の循環微粒子を含む試料を分析する任意のプロセスに使用することができる。任意選択的に、区画化されていない支持体付加反応混合物内の支持体に付加された2つ以上の標的分子(例えば、ゲノムDNAの2つ以上の断片等の同じ循環微粒子からの2つ以上の分子、および/またはバーコード化親和性プローブに結合した2つ以上のポリペプチド)は、同じバーコード配列、またはバーコード配列のセットからの異なるバーコード配列に付加して、当該2つ以上の標的分子を連結することができる。任意選択的に、バーコード配列を付加する任意の当該プロセスは、多量体バーコード化試薬からの2つ以上のバーコード化オリゴヌクレオチドを、区画化されていない支持体付加反応混合物内の同じ支持体に付加された2つ以上の標的分子に付加することを含み得る。任意選択的に、バーコード配列を付加する任意の当該プロセスは、区画化されていない支持体付加反応混合物を、少なくとも2、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも1,000,000,000個の多量体バーコード化試薬のライブラリと接触させることと、当該多量体バーコード化試薬内に含まれるバーコード化オリゴヌクレオチドを、当該区画化されていない支持体付加反応混合物内の支持体に付加された標的分子に付加することと、を含み得る。任意の1つ以上の区画化されていない支持体付加反応混合物は、本明細書に記載の任意の1つ以上の方法で使用するための1つ以上の循環微粒子に由来する試料を含み得る。任意選択的に、任意のかかる方法の場合、任意の数の区画(少なくとも10、少なくとも1000、少なくとも1,000,000、もしくは少なくとも1,000,000,000の区画等)、任意のタイプの区画(反応管、水滴、もしくはエマルジョン内の水滴等)、および/あるいは区画の任意の体積(100フェムトリットル未満もしくはそれを超える、1.0、10.0、もしくは100.0ピコリットル未満もしくはそれを超える、1.0、10.0、もしくは100.0ナノリットル未満もしくはそれを超える、または1.0、10.0、もしくは100.0マイクロリットル未満もしくはそれを超える)を使用することができる。例えば、本明細書および/またはPCT/GB2017/053820に記載されている区画の数、タイプ、または体積は任意であり、その内容は参照により本明細書に組み込まれる。
【0304】
4.バーコード化による連結
本発明は、配列決定のための試料を調製する方法を提供し、試料は循環微粒子(または血液に由来する微粒子)を含み、微粒子は標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、微粒子の標的核酸の少なくとも2つの断片をバーコード配列、またはバーコード配列のセットの異なるバーコード配列に付加して、標的核酸の連結された断片のセットを生成することを含む。
【0305】
本発明は、配列決定のための試料を調製する方法を提供し、試料は循環微粒子を含み、循環微粒子は標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、循環微粒子の標的核酸の少なくとも2つの断片をバーコード配列、またはバーコード配列のセットの異なるバーコード配列に付加して、標的核酸の連結された断片のセットを生成することを含む。
【0306】
微粒子の標的核酸の少なくとも2つの断片をバーコード配列、またはバーコード配列のセットの異なるバーコード配列に付加するステップの前に、この方法は、カップリング配列を微粒子の標的核酸(例えば、ゲノムDNA)の断片の各々に付加することを含み得、次に、カップリング配列がバーコード配列またはバーコード配列のセットの異なるバーコード配列に付加されて、標的核酸の連結された断片のセットを生成する。
【0307】
この方法では、試料は、血液に由来する第1および第2の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、第1の微粒子の標的核酸の少なくとも2つの断片を第1のバーコード配列、または第1のセットのバーコード配列の異なるバーコード配列に付加して、標的核酸の第1のセットの連結された断片を生成することと、第2の微粒子の標的核酸の少なくとも2つの断片を第2のバーコード配列、または第2のセットのバーコード配列の異なるバーコード配列に付加して、標的核酸の第2のセットの連結された断片を生成することと、を含み得る。
【0308】
第1のバーコード配列は、第2のバーコード配列とは異なり得る。バーコード配列の第1のセットのバーコード配列は、バーコード配列の第2のセットのバーコード配列とは異なり得る。
【0309】
この方法では、試料は、血液に由来するn個の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、n個の連結された標的核酸断片セット(n個の微粒子毎に1セット)を生成することを含む。
【0310】
この方法では、nは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000であり得る。好ましくは、nは、少なくとも100,000個の微粒子である。
【0311】
好ましくは、連結された配列リードの各セット(すなわち、連結されたシグナルのセット)は、異なるバーコード配列または異なるバーコード配列のセットによって連結されている。バーコード配列セットの各バーコード配列は、ライブラリ内の少なくとも1、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも999、少なくとも9,999、少なくとも99,999、少なくとも999,999、少なくとも9,999,999、少なくとも99,999,999、少なくとも999,999,999、少なくとも9,999,999,999、少なくとも99,999,999,999、または少なくとも999,999,999,999個の他のバーコード配列セットのバーコード配列とは異なり得る。バーコード配列のセットの各バーコード配列は、ライブラリ内の他の全てのバーコード配列のセットのバーコード配列とは異なり得る。好ましくは、バーコード配列セット内の各バーコード配列は、ライブラリ内の少なくとも9つの他のバーコード配列セットのバーコード配列とは異なる。
【0312】
本発明は、血液由来の微粒子を含む試料を分析する方法を提供し、微粒子は、標的核酸の少なくとも2つの断片を含み、この方法は、(a)微粒子の標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片をバーコード配列に付加して標的核酸の連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み、ここで、少なくとも2つの連結された配列リードは、バーコード配列によって連結される。
【0313】
バーコード配列には、固有の配列が含まれ得る。各バーコード配列は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各バーコード配列は、少なくとも5つのヌクレオチドを含む。好ましくは、各バーコード配列はデオキシリボヌクレオチドを含み、任意選択的に、バーコード配列中の全てのヌクレオチドはデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード配列は、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード配列は、縮重ヌクレオチドまたは配列を含まない場合がある。
【0314】
この方法では、微粒子の標的核酸の少なくとも2つの断片をバーコード配列に付加するステップの前に、この方法は、カップリング配列を微粒子の核酸の断片の各々に付加することを含み得、次に、カップリング配列がバーコード配列に付加され、連結された断片のセットが生成される。
【0315】
この方法では、試料は、血液に由来する第1および第2の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、第1の微粒子に対する標的核酸の連結された断片の第1のセットおよび第2の微粒子に対する標的核酸の連結された断片の第2のセットを生成することと、ステップ(b)を行って、第1の微粒子に対する連結された配列リードの第1のセット(すなわち、連結されたシグナルのセット)および第2の微粒子に対する連結された配列リードの第2のセット(すなわち、連結されたシグナルのセット)を生成することと、を含み、ここで、第1の微粒子の少なくとも2つの連結された配列リードは、異なるバーコード配列によって、第2の微粒子の少なくとも2つの連結された配列リードに連結される。
【0316】
連結された断片の第1のセットは、異なるバーコード配列によって、連結された断片の第2のセットに連結され得る。
【0317】
この方法では、試料は、血液に由来するn個の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、n個の連結された標的核酸断片セット(n個の微粒子毎に1セット)を生成することと、ステップ(b)を行って、n個の連結された配列リードセット(すなわち、連結されたシグナルセット)(n個の微粒子毎に1セット)を生成することと、を含む。
【0318】
この方法では、nは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000であり得る。好ましくは、nは、少なくとも100,000個の微粒子である。
【0319】
好ましくは、連結された配列リードの各セット(すなわち、連結されたシグナルのセット)は、異なるバーコード配列によって連結されている。
【0320】
この方法では、異なるバーコード配列がバーコード配列のライブラリとして提供され得る。この方法で使用されるライブラリは、少なくとも2、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、少なくとも100,000,000,000、または少なくとも1,000,000,000,000個の異なるバーコード配列を含み得る。好ましくは、この方法で使用されるライブラリは、少なくとも1,000,000個の異なるバーコード配列を含む。
【0321】
この方法では、ライブラリの各バーコード配列は、単一の微粒子からの断片にのみ付加できる。
【0322】
この方法は、決定論的(すなわち、1つのバーコード配列を使用して単一の微粒子からの配列リードを特定することができる)または確率的(すなわち、単一の微粒子からの可能性が高い配列リードを特定するために1つのバーコード配列を使用することができる)であり得る。特定の実施形態において、1つのバーコード配列は、2つ以上の微粒子からのゲノムDNAの断片に付加され得る。
【0323】
この方法は、(a)微粒子の標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片の各々をバーコード配列のセットの異なるバーコード配列に付加して、標的核酸の連結された断片を生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み得、ここで、少なくとも2つの連結された配列リードは、バーコード配列のセットによって連結される。
【0324】
この方法では、微粒子の標的核酸の少なくとも2つの断片の各々を異なるバーコード配列に付加するステップの前に、この方法は、カップリング配列を微粒子の標的核酸の断片の各々に付加することを含み得、ここで、微粒子の標的核酸の少なくとも2つの断片の各々は、そのカップリング配列によって、バーコード配列のセットの異なるバーコード配列に付加される。
【0325】
この方法では、試料は、血液に由来する第1および第2の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、第1の微粒子に対する標的核酸の連結された断片の第1のセットおよび第2の微粒子の標的核酸の連結された断片の第2のセットを生成することと、ステップ(b)を行って、第1の微粒子に対する連結された配列リードの第1のセット(すなわち、連結されたシグナルのセット)および第2の微粒子に対する連結された配列リードの第2のセット(すなわち、連結されたシグナルのセット)を生成することと、を含み得、ここで、連結された配列リードの第1のセットは、異なるバーコード配列のセットによって、連結された配列リードの第2のセットに連結される。
【0326】
この方法では、試料は、血液に由来するn個の微粒子を含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、n個の連結された標的核酸断片セット(n個の微粒子毎に1セット)を生成することと、ステップ(b)を行って、n個の連結された配列リードセット(すなわち、連結されたシグナルセット)(n個の微粒子毎に1セット)を生成することと、を含み得る。
【0327】
この方法では、nは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、または少なくとも100,000,000,000であり得る。好ましくは、nは、少なくとも100,000個の微粒子である。
【0328】
好ましくは、連結された配列リードの各セット(すなわち、連結されたシグナルのセット)は、異なるバーコード配列のセットによって連結されている。
【0329】
この方法では、バーコード配列の異なるセットが、バーコード配列のセットのライブラリとして提供され得る。この方法で使用されるライブラリは、少なくとも2、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、少なくとも10,000,000,000、少なくとも100,000,000,000、または少なくとも1,000,000,000,000個の異なるバーコード配列のセットを含み得る。好ましくは、この方法で使用されるライブラリは、少なくとも1,000,000個の異なるバーコード配列のセットを含む。
【0330】
バーコード配列セットの各バーコード配列は、ライブラリ内の少なくとも1、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも999、少なくとも9,999、少なくとも99,999、少なくとも999,999、少なくとも9,999,999、少なくとも99,999,999、少なくとも999,999,999、少なくとも9,999,999,999、少なくとも99,999,999,999、または少なくとも999,999,999,999個の他のバーコード配列セットのバーコード配列とは異なり得る。バーコード配列のセット内の各バーコード配列は、ライブラリ内の他の全てのバーコード配列のセットのバーコード配列とは異なり得る。好ましくは、バーコード配列セット内の各バーコード配列は、ライブラリ内の少なくとも9つの他のバーコード配列セットのバーコード配列とは異なる。
【0331】
この方法では、ライブラリのバーコード配列のセットからのバーコード配列は、単一の微粒子からの断片にのみ付加され得る。
【0332】
この方法は、決定論的(すなわち、1つのセットのバーコード配列を使用して単一の微粒子からの配列リードを特定することができる)または確率的(すなわち、単一の微粒子からの可能性が高い配列リードを特定するために1つのセットのバーコード配列を使用することができる)であり得る。
【0333】
この方法は、配列決定のための第1および第2の試料を調製することを含み得、各試料は、血液に由来する少なくとも1つの微粒子を含み、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、バーコード配列は、各々、試料識別子領域を含み、この方法は、(i)各試料に対してステップ(a)を行うことであって、第1の試料からの標的核酸の断片に付加されたバーコード配列(複数可)は、第2の試料からの標的核酸の断片に付加されたバーコード配列(複数可)とは異なる試料識別子領域を有する、行うことと、(ii)各試料に対してステップ(b)を行うことであって、各連結された配列リードは、試料識別子領域の配列を含む、行うことと、(iii)各連結された配列リードがその試料識別子領域に由来する試料を決定することと、を含む。
【0334】
この方法では、バーコード配列および/またはカップリング配列を付加するステップの前、その間、および/またはその後、この方法は、微粒子中のゲノムDNAの断片を架橋するステップを含み得る。
【0335】
この方法では、バーコード配列および/またはカップリング配列を付加するステップの前、その間、および/またはその後、および/または任意選択的に、微粒子中のゲノムDNAの断片を架橋するステップの後に、この方法は、微粒子を透過処理するステップを含み得る。移すステップの前、かつ任意選択的に、架橋のステップの後に、この方法は、微粒子を透過処理することを含む。
【0336】
バーコード配列は、バーコード化オリゴヌクレオチドの溶液中のバーコード化オリゴヌクレオチド内に含まれ得る。かかるバーコード化オリゴヌクレオチドは、一本鎖二本鎖、または1つ以上の二本鎖領域を有する一本鎖であり得る。バーコード化オリゴヌクレオチドは、一本鎖または二本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。バーコード化オリゴヌクレオチドは、標的核酸の断片にライゲートすることができる一本鎖5’または3’領域を含み得る。各バーコード化オリゴヌクレオチドは、一本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。あるいは、バーコード化オリゴヌクレオチドは、標的核酸の断片にライゲートすることができる、平滑、陥凹、またはオーバーハング5’または3’領域を含み得る。各バーコード化オリゴヌクレオチドは、二本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0337】
特定の方法において、標的核酸の断片の末端は、平滑反応において平滑二本鎖末端に変換され得、バーコード化オリゴヌクレオチドは、平滑二本鎖末端を含み得る。各バーコード化オリゴヌクレオチドは、平滑末端ライゲーション反応時に標的核酸の断片にライゲートされ得る。特定の方法において、標的核酸の断片の末端は、平滑反応においてそれらの末端を平滑二本鎖末端に変換し、次いでそれらの末端を単一の3’アデノシンオーバーハングを有する形態に変換し得、ここで、バーコード化オリゴヌクレオチドは、標的核酸の断片の単一の3’アデノシンオーバーハングにアニールすることができる単一の3’チミンオーバーハングを有する二本鎖末端を含む。各バーコード化オリゴヌクレオチドは、二本鎖A/Tライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0338】
特定の方法において、バーコード化オリゴヌクレオチドは、標的核酸および/またはカップリング配列の標的領域にアニールすることができるそれらの3’または5’末端に標的領域を含み、バーコード配列は、バーコード化オリゴヌクレオチドを当該標的核酸および/またはカップリング配列にアニールし、任意選択的に、バーコード化オリゴヌクレオチドを核酸標的および/またはカップリング配列に伸長および/またはライゲートすることによって標的核酸に付加され得る。
【0339】
特定の方法では、バーコード化オリゴヌクレオチドを付加する前に、カップリング配列をゲノムDNAの断片に付加することができる。
【0340】
この方法は、付加するステップの前に、核酸試料を少なくとも2つの異なる反応体積に区画化するステップを含み得る。
【0341】
5.多量体バーコード化試薬を使用したバーコード化による連結
本発明は、配列決定のための試料を調製する方法を提供し、試料は循環微粒子(すなわち、血液に由来する微粒子)を含み、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、以下のステップ(a)試料を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含む、接触させることと、(b)バーコード配列を微粒子の標的核酸の第1および第2の断片の各々に付加して、微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が第2のバーコード領域の核酸配列を含む、生成することとを含み得る。
【0342】
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する微粒子を含み、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、以下のステップ(a)試料を多量体バーコード化試薬と接触させることであって、多量体バーコード化試薬が一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドが各々バーコード領域を含む、接触させることと、(b)第1および第2のバーコード化オリゴヌクレオチドを微粒子の標的核酸の第1および第2の断片にアニールまたはライゲートして、第1および第2のバーコード化標的核酸分子を生成することとを含み得る。
【0343】
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する第1および第2の微粒子を含み、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、以下のステップ(a)試料を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含み、第1の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域とは異なる、接触させることと、(b)バーコード配列を第1の微粒子の標的核酸の第1および第2の断片の各々に付加して、第1の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、ならびにバーコード配列を第2の微粒子の標的核酸の第1および第2の断片の各々に付加して、第2の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、を含む。
【0344】
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する第1および第2の微粒子を含み、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、以下のステップ(a)試料を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドが各々、バーコード領域を含み、ライブラリの第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域とは異なる、接触させることと、(b)第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第1の微粒子の標的核酸の第1および第2の断片にアニールまたはライゲートして、第1および第2のバーコード化標的核酸分子を生成すること、ならびに第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第2の微粒子の標的核酸の第1および第2の断片にアニールまたはライゲートして、第1および第2のバーコード化標的核酸分子を生成することと、を含む。
【0345】
バーコード化オリゴヌクレオチドは、一本鎖または二本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0346】
この方法では、バーコード化オリゴヌクレオチドは、標的核酸の断片にライゲートすることができる一本鎖5’または3’領域を含み得る。各バーコード化オリゴヌクレオチドは、一本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0347】
この方法では、バーコード化オリゴヌクレオチドは、標的核酸の断片にライゲートすることができる、平滑、陥凹、またはオーバーハング5’もしくは3’領域を含み得る。各バーコード化オリゴヌクレオチドは、二本鎖ライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0348】
この方法では、標的核酸の断片の末端は、平滑反応において平滑二本鎖末端に変換され得、バーコード化オリゴヌクレオチドは、平滑二本鎖末端を含み得る。各バーコード化オリゴヌクレオチドは、平滑末端ライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0349】
この方法では、標的核酸の断片の末端は、平滑反応においてそれらの末端を平滑二本鎖末端に変換し、次いでそれらの末端を単一の3’アデノシンオーバーハングを有する形態に変換し得、ここで、バーコード化オリゴヌクレオチドは、標的核酸の断片の単一の3’アデノシンオーバーハングにアニールすることができる単一の3’チミンオーバーハングを有する二本鎖末端を含む。各バーコード化オリゴヌクレオチドは、二本鎖A/Tライゲーション反応時に標的核酸の断片にライゲートされ得る。
【0350】
この方法では、標的核酸の断片の末端を制限酵素と接触させることができ、制限酵素は、制限部位で各断片を消化してこれらの制限部位にライゲーション接合部を作成し、バーコード化オリゴヌクレオチドは、これらのライゲーション接合部と適合性の末端を含む。各バーコード化オリゴヌクレオチドは、二本鎖ライゲーション反応時に当該ライゲーション接合部で標的核酸の断片にライゲートされ得る。任意選択的に、当該制限酵素は、EcoRI、HindIII、またはBglIIであり得る。
【0351】
この方法では、第1および第2のバーコード化オリゴヌクレオチドを標的核酸の第1および第2の断片にアニールまたはライゲートするステップの前に、この方法は、カップリング配列を標的核酸の各断片に付加することを含み得、次に、第1および第2のバーコード化オリゴヌクレオチドは、標的核酸の第1および第2の断片のカップリング配列にアニールまたはライゲートされる。
【0352】
この方法では、ステップ(b)は、(i)第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第1の微粒子の標的核酸の第1および第2の断片にアニールすること、ならびに第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを第2の微粒子の標的核酸の第1および第2の断片にアニールすることと、(ii)第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを伸長して第1および第2の異なるバーコード化標的核酸分子を生成すること、ならびに第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドを伸長して第1および第2の異なるバーコード化標的核酸分子を生成することと、を含み得、ここで、バーコード化標的核酸分子の各々は、テンプレートとして標的核酸の断片から合成された少なくとも1つのヌクレオチドを含む。
【0353】
この方法は、(a)試料を少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬は、一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドは、各々5’から3’方向に標的領域およびバーコード領域を含み、ライブラリの第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリの第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域と異なり、試料は、各多量体バーコード化試薬の第1および第2の標的プライマーとさらに接触されている、接触させることと、(b)各微粒子に対して、以下のステップ(i)第1のバーコード化オリゴヌクレオチドの標的領域を微粒子の標的核酸(例えば、ゲノムDNA)の第1の断片の第1の部分配列にアニールすること、および、第2のバーコード化オリゴヌクレオチドの標的領域を微粒子の標的核酸(例えば、ゲノムDNA)の第2の断片の第1の部分配列にアニールすること、(ii)第1の標的プライマーを微粒子の標的核酸の第1の断片の第2の部分配列にアニールすることであって、第2の部分配列が第1の部分配列の3’である、アニールすること、および第2の標的プライマーを微粒子の標的核酸の第2の断片の第2の部分配列にアニールすることであって、第2の部分配列が第1の部分配列の3’である、アニールすること、(iii)微粒子の標的核酸の第1の断片をテンプレートとして使用して、第1の部分配列に到達するまで第1の標的プライマーを伸長して、第1の伸長された標的プライマーを生成すること、および微粒子の標的核酸の第2の断片を使用して、第1の部分配列に到達するまで第2の標的プライマーを伸長して、第2の伸長された標的プライマーを生成すること、ならびに(iv)第1の伸長標的プライマーの3’末端を第1のバーコード化オリゴヌクレオチドの5’末端にライゲートして第1のバーコード化標的核酸分子を生成すること、および第2の伸長標的プライマーの3’末端を第2のバーコード化オリゴヌクレオチドの5’末端にライゲートして第2のバーコード化標的核酸分子を生成すること、を行うことと、を含み得、ここで、第1および第2のバーコード化標的核酸分子が異なり、各々がテンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0354】
多量体バーコード化試薬は、各々、(i)一緒に連結された第1および第2のハイブリダイゼーション分子(ハイブリダイゼーション分子の各々が、ハイブリダイゼーション領域を含む核酸配列を含む)と、(ii)第1および第2のバーコード化オリゴヌクレオチド(第1のバーコード化オリゴヌクレオチドが第1のハイブリダイゼーション分子のハイブリダイゼーション領域にアニールされ、かつ第2のバーコード化オリゴヌクレオチドが第2のハイブリダイゼーション分子のハイブリダイゼーション領域にアニールされる)と、を含み得る。
【0355】
多量体バーコード化試薬は、各々、(i)一緒に連結された第1および第2のバーコード分子(バーコード分子の各々が、バーコード領域を含む核酸配列を含む)と、(ii)第1および第2のバーコード化オリゴヌクレオチド(第1のバーコード化オリゴヌクレオチドが、第1のバーコード分子のバーコード領域にアニールされたバーコード領域を含み、第2のバーコード化オリゴヌクレオチドが、第2のバーコード分子のバーコード領域にアニールされたバーコード領域を含む)と、を含み得る。
【0356】
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する少なくとも2つの微粒子を含み、各微粒子は、標的核酸の少なくとも2つの断片を含み、この方法は、以下のステップ(a)試料を第1および第2の多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬は、一緒に連結された第1および第2のバーコード分子を含み、バーコード分子の各々は、任意選択的に、5’から3’方向にバーコード領域およびアダプター領域を含む核酸配列を含む、接触させることと、(b)第1および第2の微粒子の標的核酸(例えば、ゲノムDNA)の第1および第2の断片にカップリング配列を付加することと、(c)多量体バーコード化試薬の各々について、第1の断片のカップリング配列を第1のバーコード分子のアダプター領域にアニールすること、および第2の断片のカップリング配列を第2のバーコード分子のアダプター領域にアニールすることと、(d)多量体バーコード化試薬の各々について、微粒子の標的核酸の少なくとも2つの断片の各々にバーコード配列を付加して、第1および第2の異なるバーコード化標的核酸分子を生成することと、を含み、ここで、第1のバーコード化標的核酸分子は、第1のバーコード分子のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子は、第2のバーコード分子のバーコード領域の核酸配列を含む。
【0357】
この方法では、バーコード分子の各々は、5’から3’方向にバーコード領域およびアダプター領域を含む核酸配列を含み得、ここで、ステップ(d)は、多量体バーコード化試薬の各々について、第1のバーコード分子のバーコード領域をテンプレートとして使用して第1の断片のカップリング配列を伸長して第1のバーコード化標的核酸分子を生成することと、第2のバーコード分子のバーコード領域をテンプレートとして使用して第2の断片のカップリング配列を伸長して第2のバーコード化標的核酸分子を生成することと、を含み、ここで、第1のバーコード化標的核酸分子は、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化標的核酸分子は、第2のバーコード分子のバーコード領域に相補的な配列を含む。
【0358】
この方法では、バーコード分子の各々は、5’から3’方向にアダプター領域およびバーコード領域を含む核酸配列を含み得、ここで、ステップ(d)は、多量体バーコード化試薬の各々について、(i)第1のバーコード分子のバーコード領域をテンプレートとして使用して第1の伸長プライマーをアニールおよび伸長して、第1のバーコード化オリゴヌクレオチドを生成すること、ならびに第2のバーコード分子のバーコード領域をテンプレートとして使用して第2の伸長プライマーをアニールおよび伸長して、第2のバーコード化オリゴヌクレオチドを生成することであって、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域に相補的な配列を含む、アニールおよび伸長することと、(ii)第1のバーコード化オリゴヌクレオチドの3’末端を第1の断片のカップリング配列の5’末端にライゲートして、第1のバーコード化標的核酸分子を生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2の断片のカップリング配列の5’末端にライゲートして、第2のバーコード化標的核酸分子を生成することと、を含む。
【0359】
この方法では、バーコード分子の各々は、5’から3’方向に、アダプター領域、バーコード領域、およびプライミング領域を含む核酸配列を含み得、ここで、ステップ(d)は、多量体バーコード化試薬の各々について、(i)第1のバーコード分子のプライミング領域に第1の伸長プライマーをアニールし、第1のバーコード分子のバーコード領域をテンプレートとして使用して第1の伸長プライマーを伸長して、第1のバーコード化オリゴヌクレオチドを生成すること、および第2のバーコード分子のプライミング領域に第2の伸長プライマーをアニールし、第2のバーコード分子のバーコード領域をテンプレートとして使用して第2の伸長プライマーを伸長して、第2のバーコード化オリゴヌクレオチドを生成することであって、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域に相補的な配列を含む、アニールすることと、(ii)第1のバーコード化オリゴヌクレオチドの3’末端を第1の断片のカップリング配列の5’末端にライゲートして、第1のバーコード化標的核酸分子を生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2の断片のカップリング配列の5’末端にライゲートして、第2のバーコード化標的核酸分子を生成することと、を含む。
【0360】
この方法は、(a)試料を第1および第2の多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬は、一緒に連結された第1および第2のバーコード分子を含み、バーコード分子の各々は、5’から3’方向にバーコード領域およびアダプター領域を含む核酸配列を含み、試料は、多量体バーコード化試薬の各々について、第1および第2のアダプターオリゴヌクレオチドとさらに接触され、第1および第2のアダプターオリゴヌクレオチドは、各々、アダプター領域を含む、接触させることと、(b)第1の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第1の微粒子の標的核酸の第1および第2の断片にライゲートすること、および第2の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第2の微粒子の標的核酸の第1および第2の断片にライゲートすることと、(c)多量体バーコード化試薬の各々について、第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることと、(d)多量体バーコード化試薬の各々について、第1のバーコード分子のバーコード領域をテンプレートとして使用して第1のアダプターオリゴヌクレオチドを伸長して、第1のバーコード化標的核酸分子を生成すること、および第2のバーコード分子のバーコード領域をテンプレートとして使用して第2のアダプターオリゴヌクレオチドを伸長して、第2のバーコード化標的核酸分子を生成することと、を含み得、ここで、第1のバーコード化標的核酸分子は、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化標的核酸分子は、第2のバーコード分子のバーコード領域に相補的な配列を含む。
【0361】
この方法は、以下のステップ(a)試料を第1および第2の多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬は、(i)一緒に連結された第1および第2のバーコード分子(バーコード分子の各々は、任意選択的に、5’から3’方向に、アダプター領域およびバーコード領域を含む核酸配列を含む)、ならびに(ii)第1および第2のバーコード化オリゴヌクレオチド(第1のバーコード化オリゴヌクレオチドは、第1のバーコード領域にアニールされたバーコード領域を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード領域にアニールされたバーコード領域を含み、ライブラリの第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリの第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域とは異なり、試料は、多量体バーコード化試薬の各々について、第1および第2のアダプターオリゴヌクレオチドとさらに接触され、第1および第2のアダプターオリゴヌクレオチドは各々、アダプター領域を含む)、を含む、接触させることと、(b)第1の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第1の微粒子の標的核酸(例えば、ゲノムDNA)の第1および第2の断片にアニールまたはライゲートすること、および第2の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第2の微粒子の標的核酸(例えば、ゲノムDNA)の第1および第2の断片にアニールまたはライゲートすることと、(c)多量体バーコード化試薬の各々について、第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることと、(d)多量体バーコード化試薬の各々について、第1のバーコード化オリゴヌクレオチドの3’末端を第1のアダプターオリゴヌクレオチドの5’末端にライゲートして第1のバーコード化標的核酸分子を生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2のアダプターオリゴヌクレオチドの5’末端にライゲートして第2のバーコード化標的核酸分子を生成することと、を含み得る。
【0362】
この方法では、ステップ(b)は、第1の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第1の微粒子の標的核酸(例えば、ゲノムDNA)の第1および第2の断片にアニールすること、および第2の多量体バーコード化試薬の第1および第2のアダプターオリゴヌクレオチドを第2の微粒子の標的核酸(例えば、ゲノムDNA)の第1および第2の断片にアニールすることを含み、ここで、(i)多量体バーコード化試薬の各々について、ステップ(d)は、第1のバーコード化オリゴヌクレオチドの3’末端を第1のアダプターオリゴヌクレオチドの5’末端にライゲートして第1のバーコード化アダプターオリゴヌクレオチドを生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2のアダプターオリゴヌクレオチドの5’末端にライゲートして第2のバーコード化アダプターオリゴヌクレオチドを生成すること、ならびに第1および第2のバーコード化アダプターオリゴヌクレオチドを伸長して、各々がテンプレートとして標的核酸の断片から合成された少なくとも1つのヌクレオチドを含む第1および第2の異なるバーコード化標的核酸分子を生成することを含むか、あるいは(ii)ステップ(d)の前に、多量体バーコード化試薬の各々について、この方法は、第1および第2のアダプターオリゴヌクレオチドを伸長して、各々がテンプレートとして標的核酸の断片から合成された少なくとも1つのヌクレオチドを含む第1および第2の異なる標的核酸分子を生成することを含む。
【0363】
この方法では、第1および第2のアダプターオリゴヌクレオチドを標的核酸の第1および第2の断片にアニールまたはライゲートするステップの前に、この方法は、カップリング配列を標的核酸の断片の各々に付加することを含み得、次に、第1および第2のアダプターオリゴヌクレオチドは、標的核酸の第1および第2の断片のカップリング配列にアニールまたはライゲートされる。
【0364】
本明細書に記載の任意の方法では、この方法は、微粒子中の標的核酸(例えば、ゲノムDNA)の断片を架橋するステップを含み得る。このステップは、化学架橋剤、例えば、ホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、グルタル酸ジスクシンイミジル、エチレングリコールビス(コハク酸スクシンイミジル)、ホモ二官能性架橋剤、またはヘテロ二官能性架橋剤を用いて行われ得る。このステップは、任意の透過処理ステップの前、任意の透過処理ステップの後、任意の区画化ステップの前、カップリング配列を付加する任意のステップの前、カップリング配列を付加する任意のステップの後、バーコード配列を付加する任意のステップの前(例えば、ステップ(b)の前)、バーコード配列を付加する任意のステップの後(例えば、ステップ(d)の後)、バーコード配列を付加する間、あるいはそれらの任意の組み合わせで行うことができる。例えば、微粒子を含む試料を2つ以上の多量体バーコード化試薬のライブラリと接触させる前に、微粒子を含む試料を架橋することができる。任意の架橋ステップは、クエンチするステップによって、例えば、グリシン溶液と混合することによってホルムアルデヒド架橋ステップをクエンチすることによってさらに終了させられ得る。任意のかかる架橋は、プロトコルの特定の後続ステップの前に、例えば、プライマー伸長、PCR、または核酸精製ステップの前に除去され得る。
【0365】
この方法では、ステップ(b)、(c)および/または(d)(すなわち、バーコード配列を付加するステップ)の間に、標的核酸の微粒子および/または断片は、アガロースゲル、ポリアクリルアミドゲル等のゲルもしくはヒドロゲル、または共有結合架橋ポリ(エチレングリコール)ゲル等の任意の共有結合架橋ゲル、あるいはチオール官能化ポリ(エチレングリコール)とアクリレート官能化ポリ(エチレングリコール)の混合物を含む共有結合架橋ゲル内に含まれ得る。
【0366】
本明細書に記載の任意の方法では、任意選択的に、架橋の任意のステップの後、この方法は、微粒子を透過処理することを含み得る。微粒子は、インキュベーションステップで透過処理され得る。インキュベーションステップは、化学的界面活性剤の存在下で行うことができる。任意選択的に、この透過処理ステップは、バーコード配列を付加する前(例えば、ステップ(b)の前)、バーコード配列を付加した後(例えば、ステップ(d)の後)、またはバーコード配列を付加する前と後の両方で行うことができる。インキュベーションステップは、少なくとも摂氏20度、少なくとも摂氏30度、少なくとも摂氏37度、少なくとも摂氏45度、少なくとも摂氏50度、少なくとも摂氏60度、少なくとも摂氏65度、少なくとも摂氏70度、または少なくとも摂氏80度の温度で行われ得る。インキュベーションステップは、少なくとも1秒間の長さ、少なくとも5秒間の長さ、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも1分間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、または少なくとも3時間の長さであり得る。このステップは、任意の架橋ステップの後、任意の透過処理ステップの前、任意の透過処理ステップの後、任意の区画化ステップの前、カップリング配列を付加する任意のステップの前、カップリング配列を付加する任意のステップの後、バーコード配列を付加する任意のステップの前(例えば、ステップ(b)の前)、バーコード配列を付加する任意のステップの後(例えば、ステップ(d)の後)、バーコード配列を付加する間、あるいはそれらの任意の組み合わせで行うことができる。例えば、微粒子を含む試料を2つ以上の多量体バーコード化試薬のライブラリと接触させる前に、微粒子を含む試料を架橋し、次いで化学的界面活性剤の存在下で透過処理され得る。
【0367】
本明細書に記載の方法のいずれにおいても、微粒子の試料は、プロテイナーゼK酵素による消化等のプロテイナーゼ消化ステップで消化され得る。任意選択的に、このプロテイナーゼ消化ステップは、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも60秒間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、少なくとも3時間の長さ、少なくとも6時間の長さ、少なくとも12時間の長さ、または少なくとも24時間の長さであり得る。このステップは、任意の架橋ステップの後、任意の透過処理ステップの前、任意の透過処理ステップの後、任意の区画化ステップの前、カップリング配列を付加する任意のステップの前、カップリング配列を付加する任意のステップの後、バーコード配列を付加する任意のステップの前(例えば、ステップ(b)の前)、バーコード配列を付加する任意のステップの後(例えば、ステップ(d)の後)、バーコード配列を付加する間、あるいはそれらの任意の組み合わせで行うことができる。例えば、微粒子を含む試料を2つ以上の多量体バーコード化試薬のライブラリと接触させる前に、微粒子を含む試料を架橋し、次いでプロテイナーゼK消化ステップで部分的に消化することができる。
【0368】
この方法では、ステップ(a)および(b)、ならびに任意選択的に、(c)および(d)は、単一の反応体積内の少なくとも2つの微粒子に対して行われ得る。
【0369】
この方法は、ステップ(b)の前に、核酸試料を少なくとも2つの異なる反応体積に区画化するステップをさらに含み得る。
【0370】
本発明は、血液由来の微粒子を含む試料を分析する方法を提供し、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、(a)配列決定のための試料を調製することであって、(i)試料を、一緒に連結された第1および第2のバーコード領域を含む多量体バーコード化試薬と接触させることであって、各バーコード領域が核酸配列を含む、接触させることと、(ii)バーコード配列を微粒子の標的核酸の少なくとも2つの断片の各々に付加して、第1および第2の異なるバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が第1のバーコードの核酸配列を含み、第2のバーコード化標的核酸分子が第2のバーコードの核酸配列を含む、付加することと、を含む、調製することと、(b)バーコード化標的核酸分子の各々を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む。
【0371】
この方法では、微粒子のゲノムDNAの少なくとも2つの断片の各々にバーコード配列を付加するステップの前に、この方法は、微粒子のゲノムDNAの断片の各々にカップリング配列を付加することを含み得、次に、配列は、微粒子のゲノムDNAの少なくとも2つの断片の各々のカップリング配列に付加されて、第1および第2の異なるバーコード化標的核酸分子を生成する。
【0372】
ステップ(a)の間、標的核酸の微粒子および/または断片は、アガロースゲル、ポリアクリルアミドゲル等のゲルもしくはヒドロゲル、または共有結合架橋ポリ(エチレングリコール)ゲル等の任意の共有結合架橋ゲル、あるいはチオール官能化ポリ(エチレングリコール)とアクリレート官能化ポリ(エチレングリコール)の混合物を含む共有結合架橋ゲル内に含まれ得る。
【0373】
微粒子の試料は、プロテイナーゼK酵素による消化等のプロテイナーゼ消化ステップを用いて消化され得る。任意選択的に、このプロテイナーゼ消化ステップは、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも60秒間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、少なくとも3時間の長さ、少なくとも6時間の長さ、少なくとも12時間の長さ、または少なくとも24時間の長さであり得る。このステップは、透過処理前、透過処理後、バーコード配列を付加する前(例えば、ステップ(a)(ii)の前)、バーコード配列を付加した後(例えば、ステップ(a)(ii)の後)、バーコード配列を付加する間、あるいはそれらの任意の組み合わせで行うことができる。
【0374】
この方法のステップ(a)は、本明細書に記載の配列決定のための試料(または核酸試料)を調製する任意の方法によって行うことができる。
【0375】
この方法は、配列決定のための第1および第2の試料を調製することを含み得、各試料は、血液に由来する少なくとも1つの微粒子を含み、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、バーコード配列は、各々、試料識別子領域を含み、この方法は、(i)各試料に対してステップ(a)を行うことであって、第1の試料からの核酸の断片に付加されたバーコード配列は、第2の試料からの標的核酸の断片に付加されたバーコード配列とは異なる試料識別子領域を有する、行うことと、(ii)各試料に対してステップ(b)を行うことであって、各配列リードは、試料識別子領域の配列を含む、行うことと、(iii)各配列リードがその試料識別子領域に由来する試料を決定することと、を含む。
【0376】
この方法は、血液に由来する少なくとも2つの微粒子を含む試料を分析することを含み得、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、以下のステップ(a)配列決定のための試料を調製することであって、(i)2つ以上の微粒子の各々について、試料を多量体バーコード化試薬を含む多量体バーコード化試薬のライブラリと接触させることであって、各多量体バーコード化試薬が本明細書で定義される通りである、接触させること、および(ii)各微粒子の標的核酸の少なくとも2つの断片の各々にバーコード配列を付加することであって、少なくとも2つのバーコード化標的核酸分子は、少なくとも2つの微粒子の各々から生成され、単一の微粒子から生成された少なくとも2つのバーコード化標的核酸分子は各々、同じ多量体バーコード化試薬からのバーコード領域の核酸配列を含む、付加すること、を含む、調製することと、(b)バーコード化標的核酸分子の各々を配列決定して、各微粒子について少なくとも2つの連結された配列リードを生成することと、を含む。
【0377】
バーコード配列は、単一の反応体積で微粒子のゲノムDNAの断片に付加され得る。すなわち、方法のステップ(a)は、単一の反応体積で行われ得る。
【0378】
付加するステップ(ステップ(a)(ii))の前に、この方法は、試料を少なくとも2つの異なる反応体積に区画化するステップをさらに含み得る。
【0379】
任意の方法において、バーコード配列を付加するステップの前に、多量体バーコード化試薬は、例えば、バーコード化オリゴヌクレオチドを放出する等、2つ以上の構成部分に分離、分画、または溶解することができる。
【0380】
任意の方法において、多量体バーコード化試薬は、1.0フェムトモル未満、10フェムトモル未満、100フェムトモル未満、1.0ピコモル未満、10ピコモル未満、100ピコモル未満、1ナノモル未満、10ナノモル未満、100ナノモル未満、または1.0マイクロモル未満の濃度であり得る。
【0381】
6.断片を一緒に連結することによる連結
本発明は、血液由来の微粒子を含む試料を分析する方法を提供し、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、(a)微粒子の標的核酸の少なくとも2つの断片を一緒に連結して、標的核酸の少なくとも2つの断片の配列を含む単一の核酸分子を生成することを含む、配列決定のための試料を調製することと、(b)単一の核酸分子内の断片の各々を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む。
【0382】
標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片は、単一の核酸分子内で隣接していてもよい。
【0383】
少なくとも2つの連結された配列リードは、単一の生の配列リード内で提供され得る。
【0384】
この方法は、連結のステップの前に、カップリング配列を標的核酸の断片(例えば、ゲノムDNA)の少なくとも1つに付加し、次いで、カップリング配列によって標的核酸の少なくとも2つの断片を一緒に連結することを含み得る。
【0385】
標的核酸の断片(例えば、ゲノムDNA)は、固体支持体によって一緒に連結され得、ここで、2つ以上の断片は、同じ固体支持体に(直接的または間接的に、例えば、カップリング配列を介して)連結される。任意選択的に、固体支持体は、発泡スチロールビーズ、超常磁性ビーズ、またはアガロースビーズ等のビーズである。
【0386】
標的核酸(例えば、ゲノムDNA)の断片は、ライゲーション反応、例えば、二本鎖ライゲーション反応または一本鎖ライゲーション反応によって一緒に連結され得る。
【0387】
標的核酸の断片の末端は、平滑末端反応において平滑でライゲート可能な二本鎖末端に変換され得、そしてこの方法は、平滑末端ライゲーション反応によって2つ以上の断片を互いにライゲートすることを含み得る。
【0388】
標的核酸の断片の末端を制限酵素と接触させることができ、制限酵素は制限部位で断片を消化してこれらの制限部位にライゲーション接合部を作成し、この方法は、2つ以上の断片をライゲーション接合部でのライゲーション反応により互いにライゲートすることを含み得る。任意の標的核酸を制限酵素と接触させることができ、制限酵素は制限部位で断片を消化してこれらの制限部位にライゲーション接合部を作成し、この方法は、2つ以上の断片をライゲーション接合部でのライゲーション反応により互いにライゲートすることを含み得る。任意選択的に、当該制限酵素は、EcoRI、HindIII、またはBglIIであり得る。
【0389】
カップリング配列は、断片を一緒に連結する前に、標的核酸の2つ以上の断片に付加され得る。任意選択的に、2つ以上の異なるカップリング配列が、標的核酸の断片の集団に付加される。
【0390】
カップリング配列は、少なくとも一端にライゲーション接合部を含み得、ここで、第1のカップリング配列は、標的核酸の第1の断片に付加され、第2のカップリング配列は、標的核酸の第2の断片に付加される。そして、2つのカップリング配列が一緒にライゲートされ、したがって、標的核酸の2つの断片を一緒に連結する。
【0391】
カップリング配列は、少なくとも1つの3’末端にアニール領域を含み得、第1のカップリング配列は、標的核酸の第1の断片に付加され、第2のカップリング配列は、標的核酸の第2の断片に付加され、2つのカップリング配列は、少なくとも1ヌクレオチド長のセグメントに沿って互いに相補的であり、互いにアニールされており、DNAポリメラーゼを使用して、第1のカップリング配列の3’末端の少なくとも1つを、標的核酸の第2の断片の配列に少なくとも1ヌクレオチドだけ伸長させ、それにより標的核酸の2つの断片(例えば、ゲノムDNA)を連結する。
【0392】
少なくとも2つの断片を一緒に連結する前に、この方法は、例えば、ホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、グルタル酸ジスクシンイミジル、エチレングリコールビス(コハク酸スクシンイミジル)、ホモ二官能性架橋剤、またはヘテロ二官能性架橋剤等の化学架橋剤で微粒子を架橋するステップをさらに含み得る。
【0393】
少なくとも2つの断片を一緒に連結する前に、この方法は、微粒子を2つ以上の区画に区画化することをさらに含み得る。
【0394】
この方法は、インキュベーションステップ中に微粒子を透過処理することをさらに含み得る。このステップは、区画化する前(行われている場合)、区画化した後(行われている場合)、断片を連結する前、および/または断片を連結した後に行われ得る。
【0395】
インキュベーションステップは、化学的界面活性剤(例えば、Triton X-100(C14H22O(C2H4O)n(n=9~10))、NP-40、Tween20、Tween80、サポニン、ジギトニン、またはドデシル硫酸ナトリウム)の存在下で行うことができる。
【0396】
インキュベーションステップは、少なくとも摂氏20度、少なくとも摂氏30度、少なくとも摂氏37度、少なくとも摂氏45度、少なくとも摂氏50度、少なくとも摂氏60度、少なくとも摂氏65度、少なくとも摂氏70度、少なくとも摂氏80度、少なくとも摂氏90度、または少なくとも摂氏95度の温度で行われる。
【0397】
インキュベーションステップは、少なくとも1秒間の長さ、少なくとも5秒間の長さ、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも1分間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、または少なくとも3時間の長さであり得る。
【0398】
この方法は、プロテイナーゼK酵素による消化等のプロテイナーゼ消化ステップで微粒子の試料を消化することを含み得る。任意選択的に、このプロテイナーゼ消化ステップは、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも60秒間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、少なくとも3時間の長さ、少なくとも6時間の長さ、少なくとも12時間の長さ、または少なくとも24時間の長さであり得る。このステップは、区画化する前(行われている場合)、区画化した後(行われている場合)、断片を連結する前、および/または断片を連結した後に行われ得る。
【0399】
この方法は、標的核酸の(元の)断片を増幅し、次いで、結果として得られた核酸分子の2つ以上を一緒に連結することを含み得る。
【0400】
断片を一緒に連結するステップは、単一の隣接する核酸分子に互いに付加された少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、または少なくとも1000個の核酸分子を含む、連結された核酸分子を作成し得る。
【0401】
この方法は、少なくとも3つの微粒子、少なくとも5つの微粒子、少なくとも10の微粒子、少なくとも50の微粒子、少なくとも100の微粒子、少なくとも1000の微粒子、少なくとも10,000の微粒子、少なくとも100,000の微粒子少なくとも1,000,000の微粒子、少なくとも10,000,000の微粒子、少なくとも100,000,000の微粒子、少なくとも1,000,000,000の微粒子、少なくとも10,000,000,000の微粒子、または少なくとも100,000,000,000個の微粒子の連結された配列リードを生成するために使用され得る。
【0402】
試料は、血液に由来する少なくとも2つの微粒子を含み得、ここで、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、各微粒子の標的核酸の少なくとも2つの断片の配列を含む単一の核酸分子を生成することと、ステップ(b)を行って、各微粒子の連結された配列リードを生成することと、を含む。
【0403】
標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を一緒に連結するステップの前、その間、および/またはその後に、この方法は、微粒子(複数可)中の標的核酸の断片を架橋するステップを含み得る。架橋ステップは、化学架橋剤、例えば、ホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、グルタル酸ジスクシンイミジル、エチレングリコールビス(コハク酸スクシンイミジル)、ホモ二官能性架橋剤、またはヘテロ二官能性架橋剤を用いて行われ得る。
【0404】
標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を一緒に連結するステップの前、その間、および/またはその後、および/または任意選択的に、微粒子中の標的核酸の断片を架橋するステップの後、この方法は、微粒子を透過処理するステップを含む。
【0405】
ステップ(a)の前に、この方法は、核酸試料を少なくとも2つの異なる反応体積に区画化するステップをさらに含み得る。
【0406】
循環微粒子の標的核酸の少なくとも2つの断片を一緒に連結して、標的核酸の少なくとも2つの断片の配列を含む単一の核酸分子を生成する方法の一実施形態では、試料は、少なくとも1つの循環微粒子を含む試料(例えば、当該試料は、本明細書に開示される任意の方法によって得られ、および/または精製される)は、室温で1%ホルムアルデヒドの溶液中で10分間架橋され、次いで、ホルムアルデヒド架橋ステップは、グリシンでクエンチされる。微粒子を遠心分離ステップ(例えば、3000xGで5分間)でペレット化し、1.0%ドデシル硫酸ナトリウム(SDS)を含む1X NEBuffer2(New England Biolabs)に再懸濁し、摂氏45度で10分間インキュベートして微粒子を透過処理する。Triton X-100を添加してSDSをクエンチし、溶液をAluI(New England Biolabs)と摂氏37度で一晩インキュベートして、平滑でライゲート可能な末端を作成する。SDSを最終濃度1.0%まで添加し、摂氏65度で15分間インキュベートすることにより、酵素を不活性化する。Triton X-100を添加してSDSをクエンチし、溶液をT4 DNAリガーゼ用の1Xバッファーで少なくとも10倍に希釈し、DNAの総濃度をマイクロリットルあたり最大1.0ナノグラムのDNAにする。希釈した溶液をT4 DNAリガーゼとともに摂氏16度で一晩インキュベートし、循環微粒子からの断片をライゲートする。次に、架橋を逆転させ、プロテイナーゼKの溶液中で65℃で一晩インキュベートすることによりタンパク質成分を分解する。次に、ライゲートしたDNAを精製する(例えば、QiagenスピンカラムPCR精製キットおよび/またはAmpure XPビーズ等を使用)。次に、Illumina配列決定アダプター配列にNexteraインビトロ転位法(Illumina、メーカーのプロトコルによる)を付加し、適切な数のPCRサイクルを行ってライゲートした材料を増幅する。次に、増幅および精製されたサイズに適したDNAが、Illuminaシーケンサー(例えば、Illumina NextSeq 500、またはMiSeq)で、各々少なくとも50塩基のペアエンドリードで配列決定される。ペアエンド配列の各末端は、参照ヒトゲノムに個別にマッピングされ、連結された配列リード(例えば、2つの末端が単一の循環微粒子からのゲノムDNAの異なる断片からの配列を含むリード)を解明する。
【0407】
微粒子の標的核酸の少なくとも2つの断片を一緒に連結して、標的核酸の少なくとも2つの断片の配列を含む単一の核酸分子を生成する方法は、1つ以上の循環微粒子からの配列を連結するための方法として望ましいものとする様々な固有の特性および特徴を有し得る。一態様では、かかる方法は、複雑な機器(例えば、区画化ベースのアプローチのためのマイクロ流体)なしで循環微粒子からの配列の連結を可能にする。さらに、このアプローチは、多数の循環微粒子(数百、数千、またはそれ以上の数)を含む可能性のある単一の個別の反応で(広く)行うことができるでき、したがって、例えば、コンビナトリアルインデックス作成アプローチで必要になる可能性のある複数の反応を必要とせずに、多数の循環微粒子を処理することができる。さらに、この方法は必ずしもバーコードおよび/または多量体バーコード化試薬の使用を必要としないので、循環微粒子からの連結された配列の有用な分子測定を達成するためのバーコードライブラリ(および/または多量体バーコード化試薬ライブラリ)のサイズによって制限されない。
【0408】
7.区画化による連結
この方法は、少なくとも2つの異なる反応体積(または区画)に区画化された少なくとも2つの微粒子を含む核酸試料に対して行われ得る。
【0409】
任意の方法において、少なくとも2つの微粒子を含む核酸試料は、少なくとも2つの異なる反応体積(または区画)に区画化され得る。異なる反応体積(または区画)は、異なる反応容器(または異なる物理的反応容器)によって提供され得る。異なる反応体積(または区画)は、異なる水滴、例えば、エマルジョン内の異なる水滴、または固体支持体(例えば、スライド)上の異なる水滴によって提供され得る。
【0410】
例えば、核酸試料は、微粒子の標的核酸の断片にバーコード配列を付加する前に区画化され得る。あるいは、核酸試料は、微粒子の標的核酸の少なくとも2つの断片を一緒に連結する前に区画化され得る。
【0411】
区画化ステップを含む任意の方法について、当該区画化ステップに続く方法の任意のステップは、バーコード配列の付加もしくはカップリング配列を付加する任意のステップ、またはライゲーション、アニール、プライマー伸長、もしくはPCRの任意のステップ等、各区画で独立して行うことができる、試薬(オリゴヌクレオチド、酵素、バッファー等)を各区画に直接追加できる。区画がエマルジョン中に水滴を含む方法では、かかる添加ステップは、マイクロ流体液滴マージ導管等を用いて、エマルジョン内の水液滴をマージするプロセスを介して、そして任意選択的に、機械的または熱混合ステップを使用して行われ得る。
【0412】
区画は、エマルジョン内の水溶液の異なる液滴を含み、エマルジョンは、油中水型エマルジョンであり、液滴は、物理的震盪または渦流ステップによって生成されるか、あるいは、液滴は、マイクロ流体導管または接合部内で水溶液と油溶液がマージすることによって生成される。
【0413】
区画がエマルジョン内に水滴を含む方法の場合、かかる油中水型エマルジョンは、当技術分野で知られている任意の方法またはツールによって生成することができる。任意選択的に、これには、Chromiumシステムまたは10X Genomics Incから入手可能な他のシステム等の市販のマイクロ流体システム、Raindance TechnologiesまたはBio-Radからのデジタル液滴発生器、およびDrop-Seq (Macosko et al.,2015,Cell 161,1202-1214)およびinDrop(Klein et al.,2015,Cell 161,1187-1201)等のマイクロ流体生成および操作のための成分ベースのシステムが含まれ得る。
【0414】
区画は、アガロースゲル、ポリアクリルアミドゲル等のゲルもしくはヒドロゲル、または共有結合架橋ポリ(エチレングリコール)ゲル等の任意の共有結合架橋ゲル、あるいはチオール官能化ポリ(エチレングリコール)分子とアクリレート官能化ポリ(エチレングリコール)分子の混合物を含む共有結合架橋ゲル内の異なる物理的に重複しない空間体積を含み得る。
【0415】
微粒子の試料は、合計で少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000個の区画に分離することができる。好ましくは、微粒子の溶液は、合計で少なくとも1000個の区画に分離される。
【0416】
微粒子の試料は、1区画あたり平均0.0001未満の微粒子、0.001未満の微粒子、0.01未満の微粒子、0.1未満の微粒子、1.0未満の微粒子、10未満の微粒子、100未満の微粒子、1000未満の微粒子、10,000未満の微粒子、100,000未満の微粒子、1,000,000未満の微粒子、10,000,000未満の微粒子、または100,000,000未満の微粒子が存在するような区画に分離することができる。好ましくは、1区画あたり平均1.0未満の微粒子が存在する。
【0417】
微粒子の溶液は、1区画あたり平均1.0アトグラム未満のDNA、10アトグラム未満のDNA、100アトグラム未満のDNA、1.0フェムトグラム未満のDNA、10フェムトグラム未満のDNA、100フェムトグラム未満のDNA、1.0ピコグラム未満のDNA、10ピコグラム未満のDNA、100ピコグラム未満のDNA、または1.0ナノグラム未満のDNAが存在するように区画化することができる。好ましくは、1区画あたり10ピコグラム未満のDNAが存在する。
【0418】
区画は、100フェムトリットル未満、1.0ピコリットル未満、10ピコリットル未満、100ピコリットル未満、1.0ナノリットル未満、10ナノリットル未満、100ナノリットル未満、1.0マイクロリットル未満、10マイクロリットル未満、100マイクロリットル未満、または1.0ミリリットル未満の体積であり得る。
【0419】
バーコード配列は、各区画で提供され得る。バーコード配列を含む2つ以上の区画の各々について、そこに含まれるバーコード配列は、同じバーコード配列の複数のコピーを含むか、または同じバーコード配列のセットからの異なるバーコード配列を含み得る。
【0420】
微粒子が2つ以上の区画に分離された後、微粒子は、本明細書に記載の方法のいずれかによるインキュベーションステップで透過処理され得る。
【0421】
微粒子の試料は、プロテイナーゼK酵素による消化等のプロテイナーゼ消化ステップを用いて消化され得る。任意選択的に、このプロテイナーゼ消化ステップは、少なくとも10秒間の長さ、少なくとも30秒間の長さ、少なくとも60秒間の長さ、少なくとも5分間の長さ、少なくとも10分間の長さ、少なくとも30分間の長さ、少なくとも60分間の長さ、少なくとも3時間の長さ、少なくとも6時間の長さ、少なくとも12時間の長さ、または少なくとも24時間の長さであり得る。このステップは、区画化前、区画化後、バーコード配列を付加する前、バーコード配列を付加した後、および/またはバーコード配列を付加している間に行うことができる。
【0422】
コンビナトリアルバーコード化プロセスによる配列の付加
バーコード配列を付加する方法は、コンビナトリアルバーコード化プロセスの少なくとも2つのステップを含み得、ここで、第1のバーコード化ステップが行われ、微粒子の試料が2つ以上の区画に区画化され、各区画が異なるバーコード配列または異なるバーコード配列のセットを含み、これらは、次に、その区画内に含まれる微粒子の標的核酸(例えば、ゲノムDNA)の断片からの配列に付加され、少なくとも2つの区画のバーコード化核酸分子が第2の試料混合物にマージされ、次に、この第2の試料混合物は、2つ以上の新しい区画に区画化され、各新しい区画は、異なるバーコード配列または異なるバーコード配列のセットを含み、これらは、2つ以上の新しい区画内に含まれる微粒子の標的核酸(例えば、ゲノムDNA)の断片からの配列に付加される。
【0423】
任意選択的に、コンビナトリアルバーコード化プロセスは、第1のバーコード化ステップを含み得、ここで、A)少なくとも第1および第2の循環微粒子を含む第1の試料混合物は、少なくとも第1および第2の元の区画に区画化され(例えば、試料からの少なくとも第1の循環微粒子は、第1の元の区画に区画化され、試料からの少なくとも第2の循環微粒子は、第2の元の区画に区画化される)、第1の元の区画は、第2の元の区画内に含まれるバーコード配列(またはバーコード配列のセット)とは異なるバーコード配列(またはバーコード配列のセット)を含み、第1の元の区画内に含まれるバーコード配列(またはバーコード配列のセットからのバーコード配列)は、第1の循環微粒子の標的核酸の少なくとも第1および第2の断片に付加され、第2の元の区画内に含まれるバーコード配列(またはバーコード配列のセットからのバーコード配列)は、第2の循環微粒子の標的核酸の少なくとも第1および第2の断片に付加され、第1の元の区画内に含まれる少なくとも1つの循環微粒子と、第2の元の区画内に含まれる少なくとも1つの循環微粒子とがマージして、第2の試料混合物、および第2のバーコード化ステップを生成し、B)第2の試料内に含まれる微粒子は、少なくとも第1および第2の新しい区画に区画化され(例えば、第2の試料混合物からの少なくとも第1の循環微粒子は、第1の新しい区画に区画化され、第2の試料混合物からの少なくとも第2の循環微粒子は、第2の新しい区画に区画化される)、第1の新しい区画は、第2の新しい区画内に含まれるバーコード配列(またはバーコード配列のセット)とは異なるバーコード配列(またはバーコード配列のセット)を含み、第1の新しい区画内に含まれるバーコード配列(またはバーコード配列のセットからのバーコード配列)は、第1の循環微粒子の標的核酸の少なくとも第1および第2の断片に付加され、第2の新しい区画内に含まれるバーコード配列(またはバーコード配列のセットからのバーコード配列)は、第2の循環微粒子の標的核酸の少なくとも第1および第2の断片に付加される。
【0424】
コンビナトリアルバーコード化プロセスの代替プロセスは、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
【0425】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、任意のコンビナトリアルバーコード化プロセスの任意のステップの前および/または後に、化学架橋の1つ以上のステップを行うことができる。
【0426】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、化学架橋ステップに続くステップにおいて、架橋された微粒子が透過処理され得る。さらなる詳細は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0427】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、化学架橋ステップに続く任意の1つ以上のステップにおいて、架橋は部分的または完全に逆転され得る。さらなる詳細は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0428】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、バーコード配列は、本明細書に記載の任意の1つ以上の方法(一本鎖ライゲーション、二本鎖ライゲーション、平滑末端ライゲーション、Aテールライゲーション、粘着末端媒介ライゲーション、ハイブリダイゼーション、ハイブリダイゼーションおよび伸長、ハイブリダイゼーションおよび伸長およびライゲーション、および/または転位等)によって付加され得る。
【0429】
任意選択的に、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、少なくとも10,000、少なくとも50,000、少なくとも100,000、少なくとも500,000、または少なくとも1,000,000個の循環微粒子は、区画内(ならびに/または少なくとも第1および第2の区画の各々、および/もしくは任意のより多くの区画内)に含まれ得る。好ましくは、少なくとも50個の循環微粒子は、区画内(ならびに/または少なくとも第1および第2の区画の各々、および/もしくは任意のより多くの区画内)に含まれ得る。
【0430】
任意選択的に、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、少なくとも10,000、少なくとも50,000、少なくとも100,000、少なくとも500,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の区画を使用することができる(例えば、循環微粒子は、当該数の区画に区画化することができる)。好ましくは、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、少なくとも24個の区画を使用することができる(例えば、循環微粒子は、当該数の区画に区画化することができる)。
【0431】
任意選択的に、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、微粒子の試料は、1区画あたり平均0.0001未満の微粒子、0.001未満の微粒子、0.01未満の微粒子、0.1未満の微粒子、1.0未満の微粒子、10未満の微粒子、100未満の微粒子、1000未満の微粒子、10,000未満の微粒子、100,000未満の微粒子、1,000,000未満の微粒子、10,000,000未満の微粒子、または100,000,000未満の微粒子が存在するような区画に分離することができる。好ましくは、1区画あたり平均1.0未満の微粒子が存在する。
【0432】
任意選択的に、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、微粒子の溶液は、1区画あたり平均1.0アトグラム未満のDNA、10アトグラム未満のDNA、100アトグラム未満のDNA、1.0フェムトグラム未満のDNA、10フェムトグラム未満のDNA、100フェムトグラム未満のDNA、1.0ピコグラム未満のDNA、10ピコグラム未満のDNA、100ピコグラム未満のDNA、または1.0ナノグラム未満のDNAが存在するように区画化することができる。好ましくは、1区画あたり10ピコグラム未満のDNAが存在する。
【0433】
任意選択的に、任意のコンビナトリアルバーコード化プロセスの任意のステップ中に、区画は、100フェムトリットル未満、1.0ピコリットル未満、10ピコリットル未満、100ピコリットル未満、1.0ナノリットル未満、10ナノリットル未満、100ナノリットル未満、1.0マイクロリットル未満、10マイクロリットル未満、100マイクロリットル未満、または1.0ミリリットル未満の体積であり得る。
【0434】
任意選択的に、任意のコンビナトリアルバーコード化プロセスは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも500、または少なくとも1000個の異なるバーコード化ステップを含み得る。バーコード化ステップの各々は、第1および第2のバーコード化ステップについて本明細書に記載されている通りであり得る。
【0435】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、任意の1つ以上の区画化ステップは、確率的特徴を含み得る。例えば、循環微粒子の(実際の数、または正確な数ではなく)推定数を1つ以上の区画に区画化することができる。すなわち、区画ごとの循環微粒子の当該数は、統計的または確率的不確実性の影響を受ける(ポアソン負荷および/または分布統計の影響を受ける等)可能性がある。
【0436】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、特定の配列に付加されたバーコードのセット(例えば、ゲノムDNAの断片の配列に付加された、例えば、第1のバーコード化ステップ中に当該配列に付加された第1のバーコードおよび第2のバーコード化ステップ中に当該配列に付加された第2のバーコードを含むセット)は、単一の微粒子からの配列を連結するために、および/または2つ以上の微粒子のセットからの配列を連結するために使用され得る。任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、2つ(または2つ以上)のバーコードの同じセットが、2つ以上の循環微粒子からの特定の配列に付加(例えば、ゲノムDNAの断片の配列に付加)され得る(例えば、当該2つ以上の循環微粒子は、それぞれ第1および第2のバーコード化ステップ中に同じ一連の第1および第2の区画に区画化される)。任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、2つ(または2つ以上)のバーコードの同じセットが、1つの循環微粒子のみからの特定の配列に付加(例えば、ゲノムDNAの断片の配列に付加)され得る(例えば、1つの循環微粒子のみは、それぞれ第1および第2のバーコード化ステップ中に特定の一連の第1および第2の区画に区画化される)。
【0437】
任意選択的に、任意のコンビナトリアルバーコード化プロセスにおいて、任意の1つ以上のバーコード化ステップで使用される区画の数、および異なるバーコード化ステップの数は、平均して2つ(またはそれ以上)のバーコードの各セットが、1つの循環微粒子のみからの配列に付加されるようにコンビナトリアル的に組み合わせることができる。さらなる詳細は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0438】
コンビナトリアルバーコード化プロセスは、循環微粒子からの配列にバーコードを付加する目的で(例えば、ゲノムDNAの断片から)多数の潜在的な特定バーコードセットを実現するための高度なおよび/または複雑な機器の要件を減らすという形で、代替バーコード化プロセスに勝る利点を提供できる。例えば、2つの異なるバーコード化ステップで96個の異なる区画を使用するコンビナトリアルバーコード化プロセス(例えば、分子生物学で広く使用されている標準の96ウェルプレートで簡単に実装できる)は、(96x96=)9216個の異なるバーコードセットのネットを達成できる。これにより、代替の非組み合わせアプローチと比較して、かかるインデックス作成を行うために必要な区画の量が大幅に削減される。バーコード化ステップの数を増やすこと、および/または1つ以上のかかるバーコード化ステップで使用される区画の数を増やすことによって、非常に高レベルの組み合わせインデックス作成解像度をさらに達成することができる。さらに、コンビナトリアルバーコード化プロセスは、代替のバーコード化プロセスに使用される複雑な機器(例えば、(10X Genomics Chromium System等の)マイクロ流体機器等)の必要性を排除し得る。
【0439】
8.空間的配列決定またはインサイチュ配列決定またはインサイチュライブラリ構築による連結
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する微粒子を含み、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、(a)配列決定のための試料を調製することであって、微粒子の標的核酸の少なくとも2つの断片は、配列決定装置上で互いに近接することによって連結されて、標的核酸の少なくとも2つの連結された断片のセットを生成する、調製することと、(b)配列決定装置を使用して標的核酸の連結された断片の各々を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む。
【0440】
核酸試料は、血液に由来する少なくとも2つの微粒子を含み得、ここで、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、各微粒子の標的核酸の連結された断片のセットを生成することであって、各微粒子の標的核酸の断片は、配列決定装置上で空間的に異なる、行うことと、ステップ(b)を行って、各微粒子の連結された配列リードを生成することと、を含む。
【0441】
微粒子からの少なくとも2つの断片は、配列決定装置自体の内部または上で互いに物理的近接を保持することができ、この物理的近接は、配列決定装置によって、またはその動作によって、またはその動作中に既知であるか、または決定または観察することができ、この物理的近接の測定は、少なくとも2つの配列を連結するのに役立つ。
【0442】
この方法は、インサイチュライブラリ構築プロセスを使用して配列決定することを含み得る。この方法では、試料からの無傷または部分的に無傷の微粒子をシーケンサー上に配置することができ、標的核酸(例えば、ゲノムDNA)の2つ以上の断片をシーケンサー内で配列決定可能なテンプレートに処理する、すなわち、インサイチュライブラリ構築プロセスを使用して配列決定する。インサイチュライブラリの構築は、Schwartz et al(2012)PNAS109(46):18749-54に記載されている。
【0443】
この方法は、インサイチュ配列決定を含み得る。この方法では、試料は無傷のまま(例えば、大部分または部分的に無傷)であり得、微粒子内の標的核酸(例えば、ゲノムDNA)の断片は、例えば、Lee et al.(2014)Science,343,6177,1360-1363に記載されているような「FISSEQ」蛍光インサイチュ配列決定技術法を使用して、直接配列決定される。
【0444】
任意選択的に、微粒子の試料は、化学架橋剤で架橋され、次いで、配列決定装置内または上に配置され、次いで、互いに物理的に近接して保持され得る。任意選択的に、配列決定装置内または配列決定装置上に配置された微粒子からの標的核酸(例えば、ゲノムDNA)の2つ以上の断片は、配列決定プロセスによって決定されるそれらの配列の全部または一部を有し得る。任意選択的に、かかる断片は、蛍光インサイチュ配列決定技術によって配列決定され得、ここで、当該断片の配列は、光学配列決定プロセスによって決定される。任意選択的に、1つ以上のカップリング、アダプター、または増幅配列を、標的核酸の当該断片に付加することができる。任意選択的に、当該断片は、増幅プロセスにおいて増幅され得、ここで、増幅された産物は、それらが増幅された断片の物理的近接または物理的接触に留まる。任意選択的に、これらの増幅産物は、光学配列決定プロセスによって配列決定される。任意選択的に、当該増幅産物は、配列決定フローセル等の平面に付加される。任意選択的に、単一の断片から生成された当該増幅産物は各々、フローセル内の単一のクラスターを構成する。任意選択的に、上記の任意の方法において、任意の2つ以上の配列決定された分子間の距離は、配列決定装置内の構成によって先験的に知られているか、または配列決定プロセス中に決定または観察され得る。任意選択的に、各配列決定された分子は、クラスターのフィールド内、またはピクセルのアレイ内にマッピングされ、任意の2つ以上の配列決定された分子間の距離は、当該クラスターまたはピクセル間の距離によって決定される。任意選択的に、距離または近接度の任意の測定または推定を使用して、任意の2つ以上の決定された配列を連結することができる。
【0445】
任意選択的に、上記の任意の方法によって決定された配列をさらに評価することができ、2つ以上の配列決定された分子間の距離または近接度の測定値が、1つ以上のカットオフ値もしくは閾値と比較され、特定の範囲内、または特定の閾値もしくはカットオフ値より上もしくは下の分子のみが情報に連結されていると判断される。任意選択的に、2つ以上のかかるカットオフもしくは閾値またはそれらの範囲のセットを使用し得、任意の2つ以上の配列決定された分子の異なる程度および/またはクラスおよび/またはカテゴリの連結を決定することができる。
【0446】
9.個別の配列決定プロセスによる連結
本発明は、配列決定のための試料を調製する方法を提供し、試料は、血液に由来する微粒子を含み、微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、(a)配列決定のための試料を調製することであって、各微粒子の標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片が、個別の配列決定プロセスにロードされることによって連結されて、標的核酸の少なくとも2つの連結された断片のセットを生成する、調製することと、(b)配列決定装置を使用して標的核酸の連結された断片の各々を配列決定して、少なくとも2つの連結された配列リードのセット(すなわち、少なくとも2つの連結されたシグナルのセット)を生成することと、を含む。
【0447】
試料は、血液由来の少なくとも2つの微粒子を含み得、ここで、各微粒子は、標的核酸(例えば、ゲノムDNA)の少なくとも2つの断片を含み、この方法は、ステップ(a)を行って、各微粒子の標的核酸の連結された断片を生成することであって、各微粒子の標的核酸の少なくとも2つの断片が、個別の配列決定プロセスにロードされることによって連結される、行うことと、各配列決定プロセスに対してステップ(b)を行って、各微粒子の連結された配列リードを生成することと、を含み得る。
【0448】
この方法では、第1の単一の微粒子(または微粒子の群)の断片を他の微粒子の断片とは独立して配列決定することができ、結果として得られる配列リードは、情報的に連結される。第2の単一微粒子(または微粒子の群)内に含まれる断片は、第1の微粒子または微粒子の群とは独立して配列決定され、結果として得られる配列リードは、情報的に連結される。
【0449】
任意選択的に、(全ての配列決定プロセスの)第1および第2の配列決定プロセスは、異なる配列決定機器で行われるか、かつ/または同じ配列決定機器で、但し2つの異なる時間にまたは2つの異なる配列決定プロセス内で行われる。任意選択的に、第1および第2の配列決定プロセスは、同じ配列決定機器を用いて行われるが、2つの異なる領域、区画、コンパートメント、導管、フローセル、レーン、ナノポア、マイクロスキャフォールド、マイクロスキャフォールドのアレイ、または配列決定機器の集積回路内で行われる。任意選択的に、3つ以上、10以上、1000以上、1,000,000以上、または1,000,000,000以上の微粒子または微粒子群を上記の方法で連結することができる。
【0450】
10.連結する前に元の断片を増幅する
当業者が理解するように、本明細書で使用される用語「断片」(例えば、「ゲノムDNAの断片」、または「標的核酸の断片」、または「微粒子の/微粒子からのゲノムDNAの断片」)は、微粒子に存在する元の断片、および元の断片の一部のみのコピーを含むその部分、コピー、またはアンプリコン(例えば、そのアンプリコン)、ならびに修飾された断片またはコピー(例えば、カップリング配列が付加された断片)を指す。例えば、ゲノムDNAの断片という用語は、微粒子中に存在する元のゲノムDNA断片を指し、例えば、プライマー伸長反応によって元のゲノムDNA断片から調製され得るDNA分子を指す。さらなる例として、mRNA断片という用語は、微粒子中に存在する元のmRNA断片を指し、例えば、逆転写によって元のmRNA断片から調製され得るcDNA分子を指す。本明細書で使用される場合、「標的核酸の断片」は、バーコード化オリゴヌクレオチド(例えば、バーコード化親和性プローブのバーコード化オリゴヌクレオチド)および本明細書に記載の他の核酸試薬も指す。
【0451】
この方法は、バーコード配列を付加するステップの前に、例えば、プライマー伸長ステップまたはポリメラーゼ連鎖反応ステップによって、微粒子の標的核酸の元の断片を増幅するステップをさらに含み得る。次に、バーコード配列は、本明細書に記載の方法のいずれかを使用して、標的核酸の元の断片のアンプリコンまたはコピーに付加され得る。
【0452】
プライマー伸長ステップまたはポリメラーゼ連鎖反応ステップは、1つ以上の縮重塩基のセグメントを含む1つ以上のプライマーを使用して行うことができる。
【0453】
プライマー伸長ステップまたはポリメラーゼ連鎖反応ステップは、特定の標的核酸配列(例えば、特定の標的ゲノムDNA配列)に特異的な1つ以上のプライマーを使用して行うことができる。
【0454】
増幅ステップは、Phi29 DNAポリメラーゼ、またはBstポリメラーゼもしくはBsmポリメラーゼ、あるいはphi29、Bst、もしくはBsmポリメラーゼの修飾誘導体等の鎖置換ポリメラーゼによって行うことができる。増幅は、多置換増幅反応および1つ以上の縮重塩基の領域を含むプライマーのセットによって行うことができる。任意選択的に、ランダムヘキサマー、ランダムヘプタマー、ランダムオクタマー、ランダムノナマー、またはランダムデカマープライマーが使用される。
【0455】
増幅ステップは、元の標的核酸の断片における一本鎖ニックのDNAポリメラーゼによる伸長を含み得る。ニックは、一本鎖DNA切断挙動を示す酵素によって生成され得、または配列特異的ニック制限エンドヌクレアーゼによって生成され得る。
【0456】
増幅ステップは、DNAポリメラーゼによってゲノムDNAの1つ以上の断片の少なくとも一部を複製または増幅することによって合成されたDNA鎖に少なくとも1つ以上のdUTPヌクレオチドを組み込むことを含み得、ニックはウラシルDNAグリコシラーゼ酵素等のウラシル切除酵素によって生成される。
【0457】
増幅ステップは、ゲノムDNAの断片を含む核酸上でのプライミング配列の生成を含み得、プライミング配列は、Thermus Thermophilus PrimPolポリメラーゼまたはTthPrimPolポリメラーゼ等のプライマーゼ酵素によって生成され、DNAポリメラーゼは、このプライミング配列をプライマーとして使用して、ゲノムDNAの断片の配列の少なくとも1つのヌクレオチドをコピーするために使用される。
【0458】
増幅ステップは、インビトロ転写プロセスを介して行われるRNA増幅プロセス等の線形増幅反応によって行われ得る。
【0459】
増幅ステップは、プライマー伸長ステップまたはポリメラーゼ連鎖反応ステップによって行うことができ、そのために使用されるプライマーまたは複数のプライマーは、1つ以上のユニバーサルプライミング配列に対応するユニバーサルプライマーである。ユニバーサルプライミング配列は、ライゲーション反応、プライマー伸長またはポリメラーゼ連鎖反応、またはインビトロ転位反応によってゲノムDNAの断片に付加され得る。
【0460】
11.連結する前に断片にカップリング配列を付加する
任意の方法において、バーコード配列は、微粒子の標的核酸(例えば、gDNA)の断片に直接的または間接的に(例えば、アニールまたはライゲーションによって)付加され得る。バーコード配列は、断片に付加されるカップリング配列(例えば、合成配列)に付加され得る。
【0461】
微粒子の標的核酸の少なくとも2つの断片を一緒に連結して単一の核酸分子を生成することを含む方法において、カップリング配列は、最初に少なくとも2つの断片の各々に付加され得、次いで、断片は、カップリング配列によって一緒に連結され得る。
【0462】
カップリング配列は、微粒子の標的核酸の元の断片、またはそのコピーまたはアンプリコンに付加され得る。
【0463】
カップリング配列は、核酸試料の2つ以上の断片の5’末端または3’末端に追加され得る。この方法では、(バーコード化オリゴヌクレオチドの)標的領域は、カップリング配列に相補的な配列を含み得る。
【0464】
カップリング配列は、二本鎖カップリングオリゴヌクレオチド内または一本鎖カップリングオリゴヌクレオチド内に含まれ得る。カップリングオリゴヌクレオチドは、二本鎖ライゲーション反応または一本鎖ライゲーション反応によって標的核酸に付加され得る。カップリングオリゴヌクレオチドは、標的核酸にライゲートすることができる一本鎖5’または3’領域を含み得、カップリング配列は、一本鎖ライゲーション反応によって標的核酸に付加され得る。
【0465】
カップリングオリゴヌクレオチドは、標的核酸にライゲートすることができる平滑、陥凹、またはオーバーハング5’または3’領域を含み得、カップリング配列は、二本鎖ライゲーション反応標的核酸に付加され得る。
【0466】
標的核酸の末端(複数可)は、平滑末端化反応時に平滑二本鎖末端(複数可)に変換され得、カップリングオリゴヌクレオチドは、平滑二本鎖末端を含み得、ここで、カップリングオリゴヌクレオチドが、平滑末端ライゲーション反応時に標的核酸にライゲートされ得る。
【0467】
標的核酸の末端(複数可)は、平滑末端化反応時に平滑二本鎖末端(複数可)に変換され得、その後、(a)単一の3’アデノシンオーバーハング(複数可)を有する形態に変換され得、ここで、カップリングオリゴヌクレオチドが、標的核酸の単一の3’アデノシンオーバーハングにアニールすることができる単一の3’チミンオーバーハングを有する二本鎖末端を含み得、カップリングオリゴヌクレオチドが、二本鎖A/Tライゲーション反応時に標的核酸にライゲートされる。
【0468】
標的核酸を制限酵素と接触させることができ、この制限酵素は、制限部位で標的核酸を消化して、制限部位(複数可)に(a)ライゲーション接合部を作製し、カップリングオリゴヌクレオチドは、ライゲーション接合部と適合性の末端を含み、その後、カップリングオリゴヌクレオチドが二本鎖ライゲーション反応の際に標的核酸にライゲートされる。
【0469】
カップリングオリゴヌクレオチドは、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0470】
カップリングオリゴヌクレオチドは、1つ以上の縮重塩基を含むプライミングセグメントを含む1つ以上のオリゴヌクレオチドを使用して、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0471】
カップリングオリゴヌクレオチドは、特定の標的核酸配列に特異的なプライミングまたはハイブリダイゼーションセグメントをさらに含む1つ以上のオリゴヌクレオチドを使用して、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0472】
カップリング配列は、ポリヌクレオチドテーリング反応によって付加され得る。カップリング配列は、末端トランスフェラーゼ酵素(例えば、末端デオキシヌクレオチジルトランスフェラーゼ酵素)によって付加され得る。カップリング配列は、末端デオキシヌクレオチジルトランスフェラーゼ酵素を用いて行われるポリヌクレオチドテーリング反応によって付加され得、ここで、カップリング配列は、ホモポリマー配列の少なくとも2つの隣接するヌクレオチドを含む。
【0473】
カップリング配列は、ホモポリマー3’テール(例えば、ポリ(A)テール)を含み得る。任意選択的に、かかる方法では、(バーコード化オリゴヌクレオチドの)標的領域は、相補的ホモポリマー3’テール(例えば、ポリ(T)テール)を含む。
【0474】
カップリング配列は、合成トランスポゾン内に含まれ得、インビトロ転位反応により付加され得る。
【0475】
カップリング配列は、標的核酸に付加され得、ここで、バーコードオリゴヌクレオチドは、少なくとも1つのプライマー伸長ステップまたはポリメラーゼ連鎖反応ステップによって標的核酸に付加され、当該バーコードオリゴヌクレオチドは、当該カップリング配列に相補的な少なくとも1ヌクレオチド長の領域を含む。任意選択的に、この相補性領域は、バーコードオリゴヌクレオチドの3’末端にある。任意選択的に、この相補性領域は、少なくとも2ヌクレオチド長、少なくとも5ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも20ヌクレオチド長、または少なくとも50ヌクレオチド長である。
【0476】
12.カップリング分子および微粒子分析のためのカップリング分子の使用方法
この方法は、(a)1つ以上のカップリング分子を、当該循環微粒子の、または当該循環微粒子からの1つ以上の標的生体分子に付加して、1つ以上の付加カップリング分子を作成することと、(b)1つ以上のバーコード配列を当該付加カップリング分子に連結して、1つ以上のバーコード化付加カップリング分子を作成することと、を含み得る。任意選択的に、1つ以上のバーコード配列を当該付加カップリング分子に連結する任意のかかるステップは、1つ以上のバーコード化オリゴヌクレオチドを当該付加カップリング分子(複数可)に付加することを含み得、任意選択的に、当該バーコード化オリゴヌクレオチド(複数可)は、1つ以上の多量体バーコード化試薬(2つ以上の多量体バーコード化試薬のライブラリ等)内に含まれる。
【0477】
この方法は、(a)当該試料を架橋する1つ以上のステップを行うことと、(b)1つ以上のカップリング分子を、当該循環微粒子の、または当該循環微粒子からの1つ以上の標的生体分子に付加して、1つ以上の付加カップリング分子を作成する1つ以上のステップを行うことと、(c)1つ以上のバーコード配列(例えば、1つ以上の多量体バーコード化試薬内に含まれるバーコード化オリゴヌクレオチド等のバーコード化オリゴヌクレオチド)を当該付加カップリング分子に連結して、1つ以上のバーコード化付加カップリング分子を作成することと、を含み得る。任意選択的に、架橋の任意のステップに続いて、試料および/または微粒子を透過処理する1つ以上のステップを行うことができる。任意選択的に、架橋の任意のステップに続いて、架橋を部分的または完全に逆転させる1つ以上のステップを行うことができる。任意選択的に、架橋の任意のステップに続いて、試料を部分的または完全にプロテイナーゼ消化する1つ以上のステップを行うことができる。
【0478】
任意選択的に、1つ以上のバーコード化付加カップリング分子を作成する任意の1つ以上のステップに続いて、プロセスは、任意選択的に、1つ以上のバーコード接続ステップをさらに含み得、ここで、1つ以上のバーコード配列が、1つ以上の標的核酸分子に付加される。任意選択的に、任意のかかる1つ以上のバーコード接続ステップは、1つ以上のバーコード化付加カップリング分子内の1つ以上のバーコード配列を、当該バーコード化付加カップリング分子(複数可)内の1つ以上の標的核酸分子にアニールおよび/またはライゲートするプロセスを含み得る。任意選択的に、任意の1つ以上のバーコード接続ステップは、1つ以上の微粒子の試料を架橋する1つ以上のステップの後に行われ得、かつ/または部分的または完全に架橋を逆転させる1つ以上のステップの後に行われ得、かつ/または部分的または完全なプロテイナーゼ消化の1つ以上のステップの後に行われ得る。
【0479】
この方法は、(a)当該試料を架橋する1つ以上のステップを行い、次に(任意選択的に)当該試料を透過処理する1つ以上のステップを行うことと、(b)1つ以上のカップリング分子を、当該循環微粒子の、または当該循環微粒子からの1つ以上の標的生体分子に付加して、1つ以上の(単一および/または二重および/または多重)付加カップリング分子を作成する1つ以上のステップを行うことであって、1つ以上のかかる標的生体分子が標的核酸分子を含む、行うことと、(c)少なくとも1つのバーコード配列を当該付加カップリング分子に連結して、1つ以上のバーコード化付加カップリング分子を作成する1つ以上のステップ(例えば、1つ以上の多量体バーコード化試薬内に含まれる少なくとも1つのバーコード化オリゴヌクレオチド等の少なくとも1つのバーコード化オリゴヌクレオチドを連結する1つ以上のステップ)を行うことと、(d)1つ以上のバーコード接続ステップを行うことであって、バーコード化付加カップリング分子内のバーコード配列が、当該バーコード化付加カップリング分子内の標的核酸分子に付加され、任意選択的に、架橋を逆転させる1つ以上のステップおよび/またはプロテイナーゼ消化の1つ以上のステップが、1つ以上のバーコード接続ステップを行うステップ(d)の前および/または間に行われ、任意選択的に、1つ以上の当該バーコード接続ステップが、当該バーコード化付加カップリング分子内の1つ以上のバーコード配列を当該バーコード化付加カップリング分子内の1つ以上の標的核酸分子にアニールおよび/またはライゲートする1つ以上のステップを含む、行うことと、を含み得る。
【0480】
この方法は、1つ以上のカップリング分子を、当該循環微粒子の1つ以上の標的生体分子に付加して、1つ以上の付加カップリング分子を作成する2つ以上のステップを含み得る。この方法は、2つ以上のカップリング分子を、当該循環微粒子の1つ以上の標的生体分子の各々に付加して、1つ以上の多重付加カップリング分子(すなわち、1つ以上の付加カップリング分子)を作成する1つ以上のステップを含み得る。この方法は、当該循環微粒子(複数可)の1つ以上の標的生体分子の各々に第1のカップリング分子を付加して、1つ以上の単一付加カップリング分子を作成する第1のステップと、次いで、当該単一付加カップリング分子(複数可)の各々に第2のカップリング分子を付加して、1つ以上の二重に付加カップリング分子(すなわち、1つ以上の付加カップリング分子)を作成する第2のステップと、を含み得る。カップリング分子を単一および/または二重および/または多重付加カップリング分子に付加する任意の数の(連続的または同時の)ステップを行って、1つ以上の多重付加カップリング分子(すなわち、1つ以上の付加カップリング分子)を作成することができ、任意選択的に、その後、架橋を逆転させる1つ以上のステップが続き、かつ/または任意選択的に、その後、任意の1つ以上のバーコード接続ステップが続く。カップリング分子を付加する任意のステップは、カップリング分子を、付加カップリング分子に直接的または間接的に付加することを含み得る。
【0481】
この方法は、試料および/または由来した試料および/または任意の溶液および/または反応混合物を希釈する1つ以上のステップを含み得、ここで、核酸(DNAおよび/またはRNA等)の濃度および/または試料中のポリペプチドは、マイクロリットルあたり1.0ピコグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、マイクロリットルあたり10ピコグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、マイクロリットルあたり100ピコグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、マイクロリットルあたり1.0ナノグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、マイクロリットルあたり10ナノグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、マイクロリットルあたり100ナノグラム未満のDNA(および/またはRNAおよび/またはタンパク質)、あるいはマイクロリットルあたり1000ナノグラム未満のDNA(および/またはRNAおよび/またはタンパク質)等、特定の濃度に減少するか、または特定の濃度未満に減少する。任意選択的に、希釈の任意のかかるステップは、1つ以上の循環微粒子を含む試料および/または1つ以上の循環微粒子に由来する試料を分析する任意の方法の間の、任意の1つ以上のステップおよび/またはプロセスの前に、かつ/またはその間に、かつ/またはその後に行うことができる。任意選択的に、希釈の任意のかかるステップは、部分的または完全に架橋を逆転させる任意の1つ以上のステップの後、かつ/またはプロテイナーゼ消化の任意の1つ以上のステップの後、かつ/または任意の1つ以上のバーコード接続ステップの前に行われ得る。
【0482】
1つ以上のカップリング分子を、当該循環微粒子の、または当該循環微粒子からの1つ以上の標的生体分子および/または1つ以上の(単一付加および/または二重付加および/または多重付加)カップリング分子に付加する任意のステップは、当該標的生体分子および/または当該(単一付加および/または二重付加および/または多重付加)カップリング分子の1つ、または2つ、または2つ以上、または全て、または任意の数および/または画分および/または一部に対して行われ得る。1つ以上のバーコード配列を任意の1つ以上の付加カップリング分子に連結する任意のステップは、当該付加カップリング分子の1つまたは2つ、または2つ以上、または全て、または任意の数および/または画分および/または一部に対して行われ得る。任意のバーコード接続ステップ(1つ以上のバーコード配列が1つ以上の標的核酸分子に付加される)は、当該標的核酸分子の1つまたは2つ、または2つ以上、または全て、または任意の数および/または画分および/または一部に対して行われ得る。任意のバーコード接続ステップ(1つ以上のバーコード化付加カップリング分子内の1つ以上のバーコード配列が、当該バーコード化付加カップリング分子内の1つ以上の標的核酸分子にアニールおよび/またはライゲートされる)は、当該バーコード化付加カップリング分子の1つまたは2つ、または2つ以上、または全て、または任意の数および/または画分および/または一部に対して行われ得る。
【0483】
カップリング分子を付加する任意の方法において、任意の1つ以上の標的生体分子は、ゲノムDNAの断片、mRNA分子またはその断片、マイクロRNA分子、および/またはバーコード化オリゴヌクレオチド(バーコード化親和性プローブ内のバーコード化オリゴヌクレオチド等)、ならびに/あるいは任意の他のタイプの標的核酸分子等の任意のタイプの標的核酸分子を含み得る。任意選択的に、カップリング分子を付加する任意の方法において、1つ以上の標的生体分子は、ゲノムDNAの1つ以上の断片、および親和性部分に付加された1つ以上のオリゴヌクレオチド(すなわち、バーコード化親和性プローブ内の1つ以上のバーコード化オリゴヌクレオチド)の両方を含み得る。
【0484】
任意選択的に、1つ以上の循環微粒子を含む試料および/または1つ以上の循環微粒子に由来する試料を分析する任意の方法中に作成される任意の1つ以上のバーコード化付加カップリング分子は、1つ以上の標的生体分子(標的核酸配列等)と、当該標的生体分子に付加された1つ以上の(第1の)カップリング分子(任意選択的に、当該第1のカップリング分子が各々1つ以上のカップリング配列を含み得る)と、当該(第1の)カップリング分子に付加された1つ以上の第2またはさらなるカップリング分子(任意選択的に、当該第2またはさらなるカップリング分子が各々1つ以上のカップリング配列を含み得る)と、1つ以上のカップリング分子の各々の中に任意選択的に含まれる1つ以上のリンカー部分(および/またはリンカー分子)と、1つ以上のカップリング分子の各々の中に任意選択的に含まれる1つ以上の結合部分(および/またはリンカー分子)と、任意の1つ以上の第1、第2、および/またはさらなるカップリング分子に連結された1つ以上のバーコード配列(1つ以上のバーコード化オリゴヌクレオチド等)と、を含み得る。
【0485】
任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のカップリング配列を含み得る。
【0486】
任意選択的に、任意の1つ以上のカップリング分子は、1つ以上の結合部分を含み得る。
【0487】
任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のリンカー分子および/またはリンカー部分(例えば、カップリング配列と結合部分との間に配置された、または2つの異なるカップリング配列の間に配置された、または2つの異なる結合部分の間に配置された)任意の1つ以上のリンカー分子)を含み得る。任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のアダプター配列を含み得る。任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のバーコード配列を含み得る。任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のバーコード化オリゴヌクレオチドを含み得る。任意のリンカー分子および/またはリンカー部分は、バイオポリマー(例えば、核酸分子)または合成ポリマーを含み得る。任意のリンカー分子および/またはリンカー部分は、1つ以上のユニットのエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサエチレングリコールまたはペンタエチレングリコール)を含み得る。任意のリンカー分子および/またはリンカー部分は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。任意のリンカー分子は、2つ以上のポリ(エチレン)グリコールリンカー部分、または2つ以上のC12もしくはC18スペーサー等の2つ以上のリンカー部分の直列の配列もしくは鎖(連結および/または直鎖分子配列もしくは鎖等)を含み得る。任意選択的に、任意のリンカー分子は、鎖および/または直鎖配列中に少なくとも3、少なくとも4、少なくとも5、少なくとも10、または少なくとも20のリンカー部分を含み得る。
【0488】
任意選択的に、任意の1つ以上のカップリング分子は、1つ以上のカップリング配列を含み得、さらに1つ以上の結合部分を含み、さらに1つ以上のリンカー分子および/またはリンカー部分を含み得る。
【0489】
任意選択的に、任意の1つ以上のカップリング分子は、少なくとも第1および第2のカップリング配列を含み得、ここで、当該第1および第2のカップリング配列は、1つ以上のリンカー分子によって互いに接続される。
【0490】
任意選択的に、任意の方法において、任意の1つ以上の標的生体分子(例えば、任意の1つ以上の標的核酸分子)により、少なくとも1、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、または少なくとも1000個のカップリング分子が、直鎖配列および/または当該標的生体分子内に含まれる複数の部位のいずれかで、直接的および/または間接的に、それに付加および/または連結され得、かつ、任意選択的に、複数の、カップリング分子を互いに付加/連結する連続的および/または独立したステップ(例えば、第2のカップリング分子を1つ以上の第1の、以前に付加/連結されたカップリング分子に付加/連結する少なくとも2、少なくとも5、または少なくとも10の連続ステップ等)を含む方法を含む。
【0491】
任意選択的に、カップリング分子は、オリゴヌクレオチド配列(例えば、カップリング配列)および結合部分を含み得、ここで、当該オリゴヌクレオチド配列および結合部分は、共有結合または非共有結合で連結されている。任意選択的に、カップリング分子は、オリゴヌクレオチド配列および結合部分を含み得、ここで、当該オリゴヌクレオチド配列および結合部分は、リンカー部分(例えば、リンカー分子)によって連結されている。任意選択的に、カップリング分子は、物理的配列でリンカー部分に接続され、次いでその後の物理的配列で結合部分に接続される第1のオリゴヌクレオチド配列を含み得る。任意選択的に、カップリング分子は、物理的配列でリンカー部分に接続され、次いでその後の物理的配列で第2の結合部分に接続される第1の結合部分を含み得る。
【0492】
任意選択的に、カップリング分子は、少なくとも第1のオリゴヌクレオチド配列および第2のオリゴヌクレオチド配列を含み得、ここで、当該少なくとも第1および第2のオリゴヌクレオチド配列は、リンカー部分によって連結されている。任意選択的に、カップリング分子は、オリゴヌクレオチド配列および2つ以上の結合部分を含み得、ここで、当該オリゴヌクレオチド配列および結合部分は、分岐リンカー部分(例えば、2つ以上のエチル基等、2つ以上のスペーサー部分等、2つ以上のC3(3炭素)スペーサー、および/またはC6スペーサー、および/またはC12スペーサー、および/またはC18スペーサー等を含む分岐リンカー分子)によって連結される。任意選択的に、カップリング分子は、3つ以上の結合部分を含み得、ここで、当該結合部分および結合部分は、分岐または多重分岐リンカー部分によって連結されている。
【0493】
任意選択的に、付加および/または連結の任意のステップ(カップリング分子を付加する任意のステップ、および/またはバーコード配列を付加する任意のステップ等)は、任意の共有結合または非共有結合の方法等の任意の付着および/または結合の方法、アニールまたはハイブリダイゼーションの任意の方法(第1のカップリング配列を第2のカップリング配列にアニールする、またはバーコード化オリゴヌクレオチド内に含まれる配列をカップリング配列および/またはアダプター配列にアニールする等、2つの相補的オリゴヌクレオチド配列を互いにアニールする任意の方法等)、ライゲーションの任意の方法(一本鎖ライゲーションまたは二本鎖ライゲーション、例えば、平滑またはオーバーハング媒介二本鎖ライゲーション等)、またはビオチン部分をストレプトアビジン部分もしくはストレプトアビジン関連部分に結合する任意の方法、または親和性を有する部分に親和性部分を結合する任意の方法(抗体をその標的エピトープに結合する任意の方法等)、あるいは任意のクリックケミストリー関連の方法(銅(I)触媒アジド-アルキン環状付加(CuAAC)反応、ひずみ促進アジド-アルキン環状付加(SPAAC)反応、ひずみ促進アルキン-ニトロン環化付加(SPANC)反応等、またはアルケンとテトラゾールのフォトクリック反応等)によって行われ得る。
【0494】
任意の1つ以上の結合部分は、それに結合することができる任意の分子および/もしくはクラスの分子および/もしくは高分子(ならびに/またはその任意の1つ以上の部分、例えば、分子および/もしくは高分子の任意の1つ以上の部分)を含み得、かつ/あるいは、任意の1つ以上の他の分子もしくはその部分(任意の他の結合部分もしくは任意の他の結合部分の任意の部分等)と結合、かつ/またはそれに結合する優先的および/もしくは熱力学的および/もしくは化学的ポテンシャルを有する。
【0495】
任意の1つ以上の結合部分は、ビオチン部分、ストレプトアビジン部分(および/またはニュートラアビジンもしくはアビジン等のストレプトアビジンの誘導体を含む任意の部分)、アジド部分、アルキン部分、アミン部分(一級アミン等)、アルケン部分、トランスシクロオクテン部分、ジベンゾシクロオクチン部分、テトラジン部分、ハプテン部分(ジゴキシゲニン等の小分子ハプテン部分等)、任意の形態の親和性部分(抗体、抗体断片、DNAアプタマーもしくはRNAアプタマー等のアプタマー)、ならびに/あるいは任意の親和性部分が任意の親和性および/もしくは優先的親和性を有する任意のエピトープ、I-Linker(Integrated DNA Technologies製)、および/またはアクリダイト部分のうちのいずれかを含み得る。
【0496】
13.この方法の任意の追加のステップ
この方法は、1つ以上の循環微粒子を含む試料からのゲノムDNAの1つ以上の断片における少なくとも1つの修飾ヌクレオチドまたは核酸塩基の存在または不在を決定することを含み得る。この方法は、循環微粒子のゲノムDNAの断片中の修飾ヌクレオチドまたは核酸塩基の測定(例えば、修飾ヌクレオチドまたは核酸塩基の測定)を含み得る。測定値は、循環微粒子のゲノムDNAの分析された断片(すなわち、ゲノムDNAの連結された断片)の合計値であり得、かつ/または測定値は、ゲノムDNAの各分析された断片の値であり得る。修飾ヌクレオチドまたは核酸塩基は、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンであり得る。
【0497】
循環微粒子からのゲノムDNAの1つ以上の断片中の修飾ヌクレオチドまたは核酸塩基の測定(複数可)は、当該断片自体の配列の測定を補完し得る様々な分子的および情報的分析を可能にする。一態様では、循環微粒子からのゲノムDNAの断片中のいわゆる「エピジェネティック」マークの測定(すなわち、「エピゲノム」の測定)は、参照エピジェネティック配列および/または参照エピジェネティック配列のリストとの比較(ならびに/あるいはそれらに対するマッピング)を可能にする。これにより、標準の4(未修飾)塩基および/またはそれらの従来の「遺伝的」配列のみの測定と比較して、循環微粒子からのゲノムDNAの断片からの配列を分析する「直交」形態が可能になる。さらに、修飾ヌクレオチドおよび/または核酸塩基の測定は、1つ以上の循環微粒子が生じた細胞および/または組織のタイプのより正確な決定および/または推定を可能にし得る。体内の異なる細胞タイプは異なるエピジェネティックなシグネチャを示すため、循環微粒子からのゲノムDNAの断片のエピゲノムの測定により、かかる微粒子から細胞タイプへのマッピングをより正確に行うことができる。この方法では、循環微粒子からのゲノムDNAの断片からのエピジェネティックな測定値は、特に、特定の組織内のメチル化および/またはヒドロキシメチル化に対応する参照エピジェネティックな配列のリスト(または複数のリスト)と比較され得る(例えば、マッピングされ得る)。これは、特定の組織タイプおよび/または特定の健康組織および/または罹患組織(例えば、がん組織)からの微粒子(例えば、特定の微粒子からの配列の連結されたセット)の解明および/または濃縮を可能にし得る。例えば、循環微粒子のゲノムDNAの断片中の修飾ヌクレオチドまたは核酸塩基の測定は、がん細胞に由来するゲノムDNAの断片の連結された配列(または連結された配列リード)の特定を可能にし得る。さらなる例において、循環微粒子のゲノムDNAの断片中の修飾ヌクレオチドまたは核酸塩基の測定は、胎児細胞に由来するゲノムDNAの断片の連結された配列(または連結された配列リード)の特定を可能にし得る。特定の修飾ヌクレオチドまたは核酸塩基の絶対量は、特定の組織内の健康および/または疾患と相関し得る。例えば、5-ヒドロキシ-メチルシトシンのレベルは、正常な健康な組織と比較して、がん性組織で強く変化する。したがって、循環微粒子からのゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定は、がん細胞に由来する循環微粒子のより正確な検出および/または分析を可能にし得る。
【0498】
この方法は、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得る。この方法は、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得る。
【0499】
この方法は、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得、当該測定は、他の修飾または非修飾塩基と比較して、ゲノムDNAの断片中の5-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用して行われる。この方法は、循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得、当該測定は、他の修飾または非修飾塩基と比較して、ゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用して行われる。
【0500】
この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得る。この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得る。
【0501】
この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得る。ここで、当該測定は、他の修飾または非修飾塩基と比較して、ゲノムDNAの断片中の5-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用して行われる。この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得る。ここで、当該測定は、他の修飾または非修飾塩基と比較して、ゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用して行われる。
【0502】
この方法は、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得、当該測定は、重亜硫酸塩変換プロセスまたは酸化的重亜硫酸塩変換プロセスを使用して行われる。この方法は、循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定(例えば、循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得、当該測定は、重亜硫酸塩変換プロセスまたは酸化的重亜硫酸水素塩変換プロセスを使用して行われる。
【0503】
この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-メチルシトシンの測定)を含み得、当該測定は、重亜硫酸塩変換プロセスまたは酸化的重亜硫酸塩変換プロセスを使用して行われる。この方法は、2つ以上の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定(例えば、第1の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定および第2の循環微粒子のゲノムDNAの断片中の5-ヒドロキシ-メチルシトシンの測定)を含み得、当該測定は、重亜硫酸塩変換プロセスまたは酸化的重亜硫酸塩変換プロセスを使用して行われる。
【0504】
任意選択的に、1つ以上の循環微粒子を含む試料の2つ以上の構成部分からの配列は、当該試料からのゲノムDNAの1つ以上の断片における少なくとも1つの修飾ヌクレオチドまたは核酸塩基の存在または不在を決定することに関連して決定され得る。例えば、濃縮ステップを行って、修飾塩基(5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等)を含む試料内のゲノムDNAの断片を濃縮することができ、ここで、当該濃縮ステップによって濃縮されたゲノムDNAの断片を含む試料の第1の構成部分を配列決定することができ、かつ、当該濃縮ステップによって非濃縮ゲノムDNAの断片を含む試料の第2の構成部分も配列決定することができる(例えば、個別の配列決定反応で配列決定する)。任意選択的に、試料の当該第2の構成部分は、濃縮プロセス中に生成された非濃縮および/または上清画分(例えば、濃縮プロセス中に濃縮プローブもしくは親和性プローブによって結合されない画分)を含み得る。任意選択的に、元の試料は、第1および第2のサブ試料に分割され得、第1のサブ試料は、試料の第1の構成部分を生成するための濃縮ステップを行うために使用され、試料の当該第2の構成部分は、第2の非濃縮サブ試料を含み得る。試料の2つ以上の濃縮および/または非濃縮および/または変換(例えば、重亜硫酸塩変換、および/もしくは酸化的重亜硫酸塩変換)ならびに/あるいは非変換構成部分の任意の組み合わせを配列決定することができる。例えば、1つ以上の循環微粒子を含む試料を使用して、3つの構成部分、例えば、5-メチルシトシンDNAが濃縮された構成部分(あるいは、重亜硫酸塩変換された構成部分)、5-ヒドロキシ-メチルシトシンが濃縮された構成部分(あるいは、酸化的重亜硫酸水素塩に変換された構成部分)、ならびに非濃縮(および/または変換されていない)構成部分を生成することができる。任意選択的に、試料の任意のかかる2つ以上の構成部分は、個別の配列決定反応(例えば、個別のフローセル内、または単一のフローセルの個別のレーン内)で個別に配列決定され得る。任意選択的に、試料の任意のかかる2つ以上の部分は、特定バーコード配列(例えば、所与の配列を試料の濃縮または非濃縮構成部分内にあるものとして特定する)に付加され得、次いで同じ配列決定プロセス内(例えば、同じフローセルまたはフローセルのレーン)で配列決定され得る。
【0505】
任意選択的に、本明細書に記載の配列を連結する任意の方法(例えば、多量体バーコード化試薬からのバーコード配列を付加することによる、または2つ以上の多量体バーコード化試薬のライブラリからのバーコード配列を付加することによる等のバーコード配列を付加することによる)は、任意のかかる濃縮および/または分子変換ステップ(例えば、かかる連結プロセスが、少なくとも1つの循環微粒子、または少なくとも2つの循環微粒子を含む元の試料に対して行われ、次に、連結された配列が、濃縮または分子変換プロセスのための入力配列として使用される)の前に行われ得る。
【0506】
例えば、2つ以上の循環微粒子を含む試料は、2つ以上の多量体バーコード化試薬のライブラリからのバーコード配列に付加され得、第1の多量体バーコード化試薬からの第1および第2のバーコード配列は、第1の循環微粒子からのゲノムDNAの第1および第2の断片に付加され、第2の多量体バーコード化試薬からの第1および第2のバーコード配列は、第2の循環微粒子からのゲノムDNAの第1および第2の断片に付加され、ゲノムDNAの結果として得られたバーコード付加断片は、5-メチルシトシン(および/または5-ヒドロキシ-メチルシトシン)を濃縮し、次いで、ゲノムDNAの濃縮断片が配列決定され、次いで、バーコード配列を使用して、同じ多量体バーコード化試薬からのバーコードに付加された濃縮断片を決定し、それにより、どの濃縮断片が同じ循環微粒子内に含まれていたかを予測(または決定)する。この例では、第2の配列決定反応はまた、ゲノムDNAの非濃縮断片に対して(例えば、濃縮ステップの上清画分(すなわち、捕捉されていない、非濃縮画分)内のゲノムDNAの断片を配列決定することによって)行われ得る。次に、バーコード配列を使用して、同じ多量体バーコード化試薬からのバーコードに付加された非濃縮断片を決定し、それによって、どの非濃縮断片が同じ循環微粒子(複数可)内に含まれるかを予測(または決定)する。この例では、ゲノムDNAの濃縮断片と非濃縮断片の両方がそのように配列決定されている場合、同じ多量体バーコード化試薬からのバーコードにどの濃縮断片と非濃縮断片が付加されたかを予測(または決定)でき、それにより、濃縮断片と非濃縮断片の両方うちのどちらが同じ循環微粒子内に含まれるかを予測(または決定)し得る。この例と同様の方法はまた、例えば、1つ以上の分子変換法を使用することによって、かつ/または例えば、試料の3つ以上の構成部分(例えば、5-メチルシトシンが濃縮された構成部分、5-ヒドロキシ-メチルシトシンが濃縮された構成部分、および非濃縮構成部分)を調製、分析、または配列決定することによって、使用され得る。
【0507】
任意選択的に、本明細書に記載の配列を連結する任意の方法(例えば、多量体バーコード化試薬または2つ以上の多量体バーコード化試薬のライブラリからのバーコード配列を付加することによる等のバーコード配列を付加することによる)は、任意のかかる濃縮および/または分子変換ステップ(例えば、5-メチルシトシンを含むか、もしくは5-ヒドロキシ-メチルシトシンを含むゲノムDNAの断片を濃縮する濃縮ステップが行われ、このプロセスを通じて濃縮されたゲノムDNAの断片は、本明細書に記載の方法によって連結される)の後に行われ得る。
【0508】
この方法は、ゲノムDNAの断片中の少なくとも1つの修飾ヌクレオチドまたは核酸塩基の存在または不在を決定することを含み得、ここで、濃縮ステップは、当該修飾塩基を含むゲノムDNAの断片を濃縮するために行われる。かかる修飾された塩基は、1つ以上の5-メチルシトシン、または5-ヒドロキシ-メチルシトシン、または任意の他の修飾された塩基を含み得る。かかる濃縮ステップは、抗体、酵素、酵素断片、または他のタンパク質、またはアプタマー、あるいは他の修飾された塩基または未修飾の塩基と比較して当該修飾された塩基に特異的または優先的に結合する任意の他のプローブ等の濃縮プローブによって行われ得る。かかる濃縮ステップは、5-ヒドロキシメチルシトシングルコシルトランスフェラーゼ酵素等のグルコシルトランスフェラーゼ酵素等の、修飾された塩基を含むDNA分子を酵素的に修飾することができる酵素によって行われ得る。任意選択的に、ゲノムDNAの断片中の5-ヒドロキシメチルシトシンの存在は、5-ヒドロキシメチルシトシングルコシルトランスフェラーゼ酵素を用いて決定され得、ここで、5-ヒドロキシメチルシトシングルコシルトランスフェラーゼ酵素は、グルコース部分をウリジンジホスホグルコースからゲノムDNA断片中の修飾塩基に移して、グルコシル-5-ヒドロキシメチルシトシン塩基を生成するために使用され、任意選択的に、次に、当該グルコシル-5-ヒドロキシメチルシトシン塩基が、グルコシル-5-ヒドロキシメチルシトシン感応性制限酵素で検出される等して検出され、ここで、ゲノムDNAの断片が消化に耐性がある当該グルコシル-5-ヒドロキシメチルシトシン感応性制限酵素は、修飾された5-ヒドロキシメチルシトシン塩基を含むと考えられている。任意選択的に、消化に耐性のあるゲノムDNAの当該断片は、本明細書に記載の任意の方法によってそれらの配列を決定するために配列決定され得る。任意選択的に、バーコード配列が付加される場合、この濃縮ステップは、バーコード配列を付加するステップの前にまたはバーコード配列を付加するステップの後に行われ得る。任意選択的に、微粒子由来のゲノムDNA断片の2つ以上の配列が互いに付加される場合、この濃縮ステップは、かかる配列を互いに付加するステップの前にまたはかかる配列を互いに付加するステップの後に行われ得る。濃縮プローブを使用してゲノムDNAの断片中の少なくとも1つの修飾ヌクレオチドまたは核酸塩基を測定する任意の方法は、市販の濃縮プローブあるいは抗5-ヒドロキシ-メチルシトシン抗体ab178771(Abcam)、または抗5-メチルシトシン抗体ab10805(Abcam)等の市販の抗体等の他の製品を使用して行うことができる。さらに、市販の製品および/またはキットはまた、それに結合された抗体および/または断片の結合、回収、および処理/洗浄のためのプロテインAまたはプロテインGダイナビーズ(ThermoFisher)等のかかる方法の追加のステップに使用され得る。
【0509】
この方法は、ゲノムDNAの断片中の少なくとも1つの修飾ヌクレオチドまたは核酸塩基の存在または不在を決定することを含み得、ここで、分子変換ステップが行われて、当該修飾塩基を、核酸配列を決定する過程で検出され得る異なる修飾または非修飾ヌクレオチドに変換する。この変換ステップは、重亜硫酸塩変換ステップ、酸化的重亜硫酸塩変換ステップ、または任意の他の分子変換ステップを含み得る。任意選択的に、バーコード配列が付加される場合、この濃縮ステップは、バーコード配列を付加するステップの前にまたはバーコード配列を付加するステップの後に行われ得る。任意選択的に、微粒子由来のゲノムDNA断片の2つ以上の配列が互いに付加される場合、この濃縮ステップは、かかる配列を互いに付加するステップの前にまたはかかる配列を互いに付加するステップの後に行われ得る。分子変換ステップを使用してゲノムDNAの断片中の少なくとも1つの修飾ヌクレオチドまたは核酸塩基を測定する任意の方法は、EpiMark重亜硫酸塩変換キット(New England Biolabs)またはTruMethyl Seq Oxidative重亜硫酸塩基配列決定キット(Cambridge Epigenetix)等の市販の分子変換キットを使用して行うことができる。
【0510】
分子変換ステップを行う任意の方法において、1つ以上のアダプターオリゴヌクレオチドは、分子変換プロセスに続くゲノムDNAの断片(および/または試料内のゲノムDNAの断片のコレクション)の一端または両端に付加され得る。例えば、一本鎖アダプターオリゴヌクレオチド(例えば、PCR増幅等による増幅に使用されるプライマーの結合部位を含む)は、一本鎖リガーゼ酵素を用いて、変換されたゲノムDNAの断片(および/または試料内のゲノムDNAの断片のコレクション)一端または両端にライゲートされ得る。任意選択的に、バーコード配列および/またはアダプター配列(バーコード化オリゴヌクレオチド内等)は、分子変換の前に、ゲノムDNAの断片(および/または試料内のゲノムDNAの断片のコレクション)の一端に付加され得る。次に、分子変換プロセスに続いて、アダプターオリゴヌクレオチドをゲノムDNAの断片の第2の末端に付加することができる。任意選択的に、当該第2の末端は、分子変換プロセス中に作成された末端を含み得る(すなわち、ゲノムDNAの断片が断片化プロセスを受けたことにより、対応する元の断片に対して、当該断片の1つ以上の新しい末端が生じる)。アダプターオリゴヌクレオチドを付加するかかる方法は、分子変換プロセス中に断片化および/または分解されたゲノムDNAの断片をさらに増幅および/または分析および/または配列決定することを可能にするという利点を有し得る。
【0511】
分子変換ステップを行う任意の方法において、任意のアダプターオリゴヌクレオチド、および/またはバーコード化オリゴヌクレオチド、および/またはバーコード配列、および/または任意のカップリング配列および/または任意のカップリングオリゴヌクレオチドは、1つ以上の合成5-メチルシトシンヌクレオチドを含み得る。任意選択的に、任意のアダプターオリゴヌクレオチド、および/またはバーコード化オリゴヌクレオチド、および/またはバーコード配列、および/または任意のカップリング配列および/または任意のカップリングオリゴヌクレオチドは、そこに含まれる任意または全てのシトシンヌクレオチドが合成5-メチルシトシンヌクレオチドであるように構成され得る。任意選択的に、任意のアダプターオリゴヌクレオチド、および/またはバーコード化オリゴヌクレオチド、および/またはバーコード配列、および/または任意のカップリング配列および/または1つ以上の合成5-メチルシトシンヌクレオチドを含む任意のカップリングオリゴヌクレオチドを、分子変換ステップ前にゲノムDNAの断片に付加することができる。あるいは、かつ/または加えて、それらは、分子変換ステップの後にゲノムDNAの断片に付加され得る。かかるプロセス中の劣化に対する耐性のため、当該アダプターおよび/またはオリゴヌクレオチドおよび/または配列内のかかる合成5-メチルシトシンヌクレオチドは、分子変換プロセス(重亜硫酸塩変換プロセス等)中のそれらの分解および/または断片化を低減または最小化するという利点を有し得る。
【0512】
この方法は、ゲノムDNAの断片中の少なくとも1つの修飾ヌクレオチドまたは核酸塩基の存在または不在を決定することを含み得、ここで、当該修飾ヌクレオチドまたは核酸塩基(5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等)は、配列決定反応によって決定または検出される。任意選択的に、当該配列決定反応は、Minion、Gridion X5、Promethion、および/またはOxford Nanopore Technologiesによって製造されたSmidgion配列決定機器等のナノポアベースの配列決定機器によって行われ得、ここで、修飾ヌクレオチドの存在または核酸塩基は、配列決定機器内のナノポアを介してゲノムDNAの断片を転座させるプロセス中に、およびゲノムDNAの断片の当該転座中にナノポア装置を通る電流シグナルを分析することによって決定される。任意選択的に、当該配列決定反応は、Pacific Biosciencesによって製造されたSequelまたはRSII配列決定機器等のゼロモード導波路ベースの配列決定機器によって行われ得、ここで、修飾ヌクレオチドまたは核酸塩基の存在は、配列決定機器内のゼロモード導波路内でゲノムDNAの断片の少なくとも一部のコピーを合成するプロセスの間に決定され、かつゲノムDNAの断片の少なくとも一部をコピーする当該プロセス中に当該ゼロモード導波路から得られた光シグナルを分析することによって決定される。
【0513】
濃縮ステップおよび/または分子変換ステップを行う任意の方法において、当該濃縮および/または変換は、不完全であり、かつ/または100%未満の効率であり得る。例えば、分子変換プロセスは、特定のクラスの標的修飾ヌクレオチド(5-メチルシトシン、または5-ヒドロキシ-メチルシトシン等)の100%未満が分子変換プロセス(重亜硫酸塩変換または酸化的重亜硫酸水素塩変換等)で変換されるように行われ得る。例えば、約99%、または約95%、または約90%、または約80%、または約70%、または約60%、または約50%、または約40%、または約25%、または約10%のかかる標的修飾ヌクレオチドは、かかる分子変換プロセス中に変換され得る。この不完全な分子変換プロセスは、分子変換プロセスが行われる期間を制限することによって(例えば、分子変換プロセスの完全またはほぼ完全な効率を達成するために使用される標準時間よりも当該期間を短くすることによって)行われ得、平均して、当該標的の変換効率が達成される。かかる不完全な分子変換プロセスは、例えば、亜硫酸水素塩変換等の多くの分子変換プロセスの特徴である、試料の分解/断片化および/または試料損失の量を低減するという利点を有し得る。
【0514】
同様に、濃縮ステップを行う任意の方法において、当該濃縮は、不完全であるか、かつ/または100%未満の効率であり得る。例えば、5-メチルシトシン(および/または5-ヒドロキシ-メチルシトシン)の濃縮ステップは、約99%、または約95%、または約90%、または約80%、または約70%、または約60%、または約50%、または約40%、または約25%、または約10%の、かかる標的修飾ヌクレオチドを含むゲノムDNAの断片が、濃縮ステップ(当該標的化修飾ヌクレオチドに特異的な抗体等の親和性プローブ)を使用する濃縮ステップ等)中に捕捉および回収されるように行われ得る。任意選択的に、当該不完全な濃縮は、濃縮プロセスで使用される親和性プローブの量および/または濃度を制限および/または低減することによって(例えば、異なる量および/または濃度の当該親和性プローブを使用することによってかかる捕捉の効率を経験的に検査することによって、かつ任意選択的に、当該経験的検査のための評価測定基準として既知の修飾ヌクレオチドプロファイルを含むDNA配列を使用することによって)行われ得る。任意選択的に、当該不完全な濃縮は、親和性プローブが濃縮プロセス内でゲノムDNAの標的断片に結合および/または捕捉するために使用される期間を制限および/または短縮することによって(すなわち、親和性プローブは、試料内のゲノムDNAの潜在的な標的断片と相互作用することができる異なるインキュベーション時間を使用することによって、例えば、異なるインキュベーション期間を使用することによってかかる捕捉の効率を経験的に検査することによって、かつ任意選択的に、当該経験的検査の評価測定基準として既知の修飾ヌクレオチドプロファイルを含むDNA配列を使用することによって)行われ得る。かかる不完全な濃縮は、偽陽性の分子シグナルを低減するという利点を有し得る(例えば、ゲノムDNAの断片が濃縮プロセス中に捕捉されるが、当該断片が所望の標的修飾ヌクレオチドを有さない)。さらに、当該不完全な濃縮は、濃縮プロセス自体のコストおよび複雑さを低減するという利点を有し得る。
【0515】
この方法は、1つ以上の特定のゲノムDNA配列がゲノムDNAの断片から濃縮される、配列濃縮または配列捕捉ステップを行うことを含み得る。このステップは、当該配列に相補的なDNAオリゴヌクレオチド、もしくは当該配列に相補的なRNAオリゴヌクレオチドを使用するステップ、またはプライマー伸長標的濃縮ステップを使用するステップ、または分子反転プローブセットもしくはパドロックプローブセットを使用するステップ等、配列濃縮を行う任意の方法によって行われ得る。任意選択的に、バーコード配列が付加される場合、この濃縮ステップは、バーコード配列を付加するステップの前にまたはバーコード配列を付加するステップの後に行われ得る。任意選択的に、微粒子由来のゲノムDNA断片の2つ以上の配列が互いに付加される場合、この濃縮ステップは、かかる配列を互いに付加するステップの前にまたはかかる配列を互いに付加するステップの後に行われ得る。
【0516】
この方法は、1つ以上の特定のゲノムDNA配列(および/または特定のRNA配列)をゲノムDNAの断片(および/またはRNAの断片または分子)から枯渇および/または除去する、配列枯渇ステップまたは配列除去ステップを行うことを含み得る。このステップは、当該配列に相補的なDNAオリゴヌクレオチド、または当該配列に相補的なRNAオリゴヌクレオチドを使用する等、配列の枯渇または除去を行う任意の方法によって行われ得る。任意選択的に、任意のかかる枯渇および/または除去ステップは、リボソームRNA配列の枯渇または除去を含み得る。
【0517】
この方法は、ゲノムDNAの少なくとも1、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、または少なくとも10,000,000個の異なる断片を濃縮することを含み得る。
【0518】
この方法では、各固有の入力分子は、配列決定反応内で、平均して少なくとも1.0回、平均して少なくとも1.5回、平均して少なくとも2.0回、平均して少なくとも3.0回、平均して少なくとも5.0回、平均して少なくとも10.0回、平均して少なくとも20.0回、平均して少なくとも50.0回、または平均して少なくとも100回、配列決定され得る。任意選択的に、配列決定反応内で少なくとも2回配列決定される(すなわち、少なくとも2つの配列リードで冗長に配列決定される)固有の入力分子を使用して、配列決定反応によって作られた当該少なくとも2つの配列リードの間の配列決定におけるエラーまたは不整合を検出および/または除去する。
【0519】
配列決定反応を行う前に、かつ/または増幅反応を行う前に、ヌクレオチド修復反応を行うことができ、そこでは、損傷および/または切除された塩基またはオリゴヌクレオチドが除去および/または修復される。任意選択的に、当該修復反応は、Thermus aquaticus DNA Ligase、大腸菌エンドヌクレアーゼIV、Bacillus stearothermophilus DNAポリメラーゼ、大腸菌ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ、大腸菌ウラシル-DNAグリコシラーゼ、T4エンドヌクレアーゼV、および大腸菌エンドヌクレアーゼVIIIのうちの1つ以上の存在下で行われ得る。
【0520】
この方法では、ユニバーサルアダプター配列(例えば、1つまたは2つのユニバーサルアダプター配列)を、配列決定ステップの前、かつ/またはPCR増幅ステップ等の増幅ステップの前に付加することができる。任意選択的に、1つ以上のかかるユニバーサルアダプター配列は、ランダムプライミングまたは遺伝子特異的プライマー伸長ステップによって、インビトロ転位反応によって追加され得、ここで、1つ以上の当該ユニバーサルアダプター配列が、二本鎖または一本鎖ライゲーション反応により、(化学的断片化ステップ、音響的または機械的断片化ステップ、または酵素的断片化ステップ等の先行する断片化ステップの有無にかかわらず、かつ任意選択的に、平滑ステップおよび/または3’A-テーリングステップの有無にかかわらず)合成トランスポゾン内に含まれる。
【0521】
酵素的に生成されたコピーまたは酵素的に生成された補体を含むバーコード配列
1つ以上のバーコード配列は、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を含むオリゴヌクレオチド(例えば、バーコード化オリゴヌクレオチド内に含まれる)内に含まれ得る。
【0522】
任意選択的に、1つ以上のバーコード配列は、バーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を含む。任意選択的に、1つ以上のバーコード配列は、バーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、バーコード分子内に含まれるバーコード配列の酵素的に生成された補体を含む。任意選択的に、1つ以上のバーコード配列は、バーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、バーコード分子内に含まれるバーコード配列の酵素的に生成されたコピーを含む。
【0523】
任意選択的に、1つ以上のバーコード配列は、バーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、多量体バーコード分子内に含まれるバーコード配列の酵素的に生成された補体を含む。任意選択的に、1つ以上のバーコード配列は、バーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、多量体バーコード分子内に含まれるバーコード配列の酵素的に生成されたコピーを含む。
【0524】
任意選択的に、1つ以上のバーコード配列は、第1のバーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、第2のバーコード化オリゴヌクレオチド内に含まれるバーコード配列の酵素的に生成された補体を含む。任意選択的に、1つ以上のバーコード配列は、第1のバーコード化オリゴヌクレオチド内に含まれ得、バーコード化オリゴヌクレオチドのバーコード領域は、第2のバーコード化オリゴヌクレオチド内に含まれるバーコード配列の酵素的に生成されたコピーを含む。
【0525】
核酸配列をコピー、複製、および/または合成するために使用される任意の酵素プロセスを使用して、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成することができる。任意選択的に、プライマー伸長プロセスを使用することができる。任意選択的に、プライマー伸長プロセスを使用することができ、ここで、バーコード分子内に含まれる(かつ/または多量体バーコード分子内に含まれる、かつ/またはバーコード化オリゴヌクレオチド内に含まれる)バーコード配列が、プライマー伸長ステップ内にコピーされ、そしてここで、プライマー伸長ステップの結果として得られるプライマー伸長産物は、バーコード配列の全部または一部を含み(例えば、バーコード化オリゴヌクレオチドの全部または一部を含む)、これは、次に、循環微粒子からの核酸の配列に付加される(例えば、循環微粒子からのゲノムDNAの断片の配列に付加される)。
【0526】
任意選択的に、ポリメラーゼ連鎖反応(PCR)プロセスを使用することができる。任意選択的に、ポリメラーゼ連鎖反応(PCR)を使用することができ、ここで、バーコード分子内に含まれる(かつ/または多量体バーコード分子内に含まれる、かつ/またはバーコード化オリゴヌクレオチド内に含まれる)バーコード配列が、PCR伸長ステップ内にコピーされ、そしてここで、PCR伸長ステップの結果として得られる伸長産物は、バーコード配列の全部または一部を含み(例えば、バーコード化オリゴヌクレオチドの全部または一部を含む)、これは、次に、循環微粒子からの核酸の配列に付加される(例えば、循環微粒子からのゲノムDNAの断片の配列に付加される)。任意選択的に、ポリメラーゼ連鎖反応(PCR)プロセスを使用することができ、ここで、バーコード分子内に含まれる(かつ/または多量体バーコード分子内に含まれる、かつ/またはバーコード化オリゴヌクレオチド内に含まれる)バーコード配列が、少なくとも2つの連続PCR伸長ステップでコピーされ(例えば、少なくとも第1のPCRサイクル、次に第2のPCRサイクルでコピーされる)、そしてここで、少なくとも2つの結果として得られるPCR伸長産物は、バーコード配列の全部または一部を含み(例えば、バーコード化オリゴヌクレオチドの全部または一部を含む)、これは、次に、循環微粒子からの核酸の配列に付加される(例えば、循環微粒子からのゲノムDNAの断片の配列に付加される)。
【0527】
任意選択的に、ローリングサークル増幅(RCA)プロセスを使用することができる。任意選択的に、ローリングサークル増幅(RCA)プロセスを使用することができ、バーコード分子内に含まれる(かつ/または多量体バーコード分子内に含まれる、かつ/またはバーコード化オリゴヌクレオチド内に含まれる)バーコード配列がローリングサークル増幅ステップ内にコピーされる。例えば、
図7に示すように使用される。かかる方法のさらなる詳細は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0528】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のかかるプロセスは、単一の反応体積で行われ得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のかかるプロセスは、2つ以上の異なる反応体積で行われ得る(すなわち、2つ以上の異なる区画で行われ得る)。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のかかるプロセスは、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の異なる反応体積(および/または区画)で行われ得る。
【0529】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のかかるプロセスは、1つ以上の循環微粒子からの核酸の配列を含む反応体積で(例えば、1つ以上の循環微粒子を含む反応体積で)行われ得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成するプロセスは、(例えば、試料からの第1の循環微粒子のゲノムDNAの断片を含み、かつ/または試料からの第1の循環微粒子を含む)試料からの第1の循環微粒子の核酸の配列を含む第1の反応体積で行われ得、ならびに(例えば、第2の試料からの循環微粒子のゲノムDNAの断片を含み、かつ/または試料からの第2の循環微粒子を含む)試料からの第2の循環微粒子の核酸の配列を含む第2の反応体積で行われ得る。
【0530】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成するプロセスは、N個の異なる反応体積で行われ得、ここで、かかる各反応体積は、少なくとも1つのバーコード配列を含み、試料からの循環微粒子の核酸の配列をさらに含み(例えば、試料からの循環微粒子のゲノムDNAの断片をさらに含み、かつ/または試料からの循環微粒子をさらに含む)、ここで、Nは、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000である。任意選択的に、N個の異なる反応体積にわたって含まれるバーコード配列は、一緒に、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の異なるバーコード配列を含み得る。
【0531】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成するプロセスは、第1のバーコード配列を含み(例えば、試料からの第1の循環微粒子のゲノムDNAの断片をさらに含み、かつ/または試料からの第1の循環微粒子をさらに含む)、試料の第1の循環微粒子の核酸の配列をさらに含む第1の反応体積で行われ得、ならびに第2のバーコード配列を含み、(例えば、第2の試料からの循環微粒子のゲノムDNAの断片をさらに含み、かつ/または試料からの第2の循環微粒子をさらに含む)試料の第2の循環微粒子の核酸の配列をさらに含む第2の反応体積で行われ得、ここで、第1のバーコード配列は、第2のバーコード配列とは異なる。
【0532】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成するプロセスは、試料の第1の循環微粒子の核酸の配列を含む(例えば、試料の第1の循環微粒子のゲノムDNAの断片を含む)第1の反応体積で行われ得、ここで、第1の反応体積からのバーコード配列の少なくとも第1および第2の酵素的に生成されたコピーまたは酵素的に生成された補体が、試料の第1の循環微粒子の核酸の配列に付加され、試料の第2の循環微粒子の核酸の配列を含む(例えば、試料の第2の循環微粒子のゲノムDNAの断片を含む)第2の反応体積で行われ、ここで、第2の反応体積からのバーコード配列の少なくとも第1および第2の酵素的に生成されたコピーまたは酵素的に生成された補体が、試料の第2の循環微粒子の核酸の配列に付加される。
【0533】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、2つ以上のバーコード配列を含むライブラリに対して行われ得る(かつ/またはライブラリ上で、もしくはライブラリを用いて行われ得る)。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、2つ以上のバーコード分子を含むライブラリに対して行われ得る(かつ/またはライブラリ上で、もしくはライブラリを用いて行われ得る)。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、2つ以上の多量体バーコード分子を含むライブラリに対して行われ得る(かつ/またはライブラリ上で、もしくはライブラリを用いて行われ得る)。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、2つ以上の多量体バーコード化試薬を含むライブラリに対して行われ得る(かつ/またはライブラリ上で、もしくはライブラリを用いて行われ得る)。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、2つ以上のバーコード化オリゴヌクレオチドを含むライブラリに対して行われ得る(かつ/またはライブラリ上で、もしくはライブラリを用いて行われ得る)。
【0534】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、バーコード配列の任意の1つ以上の酵素的に生成されたコピーまたは酵素的に生成された補体を、付加ステップにおいて、循環微粒子の核酸の1つ以上の配列の各々(例えば、循環微粒子のゲノムDNAの断片)に付加することをさらに含み得る。任意選択的に、任意の1つ以上のかかる付加ステップは、ハイブリダイゼーションのステップ(例えば、バーコード化オリゴヌクレオチドを核酸配列にハイブリダイズするステップ)、ハイブリダイゼーションおよび伸長ハイブリダイゼーションのステップ(例えば、バーコード化オリゴヌクレオチドを核酸配列にハイブリダイズし、次に、ハイブリダイズしたバーコード化オリゴヌクレオチドをポリメラーゼで伸長するステップ)、および/またはライゲーションのステップ(例えば、バーコード化オリゴヌクレオチドを核酸配列にライゲートするステップ)を含み得る。任意の1つ以上のかかる付加ステップに続いて、バーコード配列を含む核酸配列およびそれらが付加された循環微粒子からの核酸の配列は、次に、配列決定ステップに供され得る。
【0535】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、バーコード配列の任意の1つ以上の酵素的に生成されたコピーまたは酵素的に生成された補体を、循環微粒子の核酸の1つ以上の配列の各々(例えば、循環微粒子のゲノムDNAの断片)に付加することをさらに含み得、ここで、循環微粒子の核酸の当該配列は、カップリング配列をさらに含む。本明細書に記載の任意のカップリング配列および/またはカップリング配列を付加する方法、および/またはバーコード配列をカップリング配列(および/またはカップリング配列を含むオリゴヌクレオチド)に付加する方法を使用することができる。
【0536】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成し、さらにバーコード配列の任意の1つ以上の酵素的に生成されたコピーまたは酵素的に生成された補体を循環微粒子の核酸の配列に付加することを含む任意のプロセスは、循環微粒子を化学的に架橋する(かつ/または2つ以上の循環微粒子を含む試料を化学的に架橋する)ステップをさらに含み得る。任意選択的に、化学架橋の当該ステップは、循環微粒子および/またはバーコード分子を2つ以上の異なる区画に区画化するステップの前および/または後に行うことができる。任意選択的に、化学架橋の当該ステップの後に、例えば、高温熱インキュベーションステップを用いて、当該架橋を逆転させるステップが続き得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成し、さらにバーコード配列の任意の1つ以上の酵素的に生成されたコピーまたは酵素的に生成された補体を循環微粒子の核酸の配列に付加することを含む任意のプロセスは、当該循環微粒子を、例えば、高温インキュベーションステップおよび/または化学的界面活性剤を用いて、透過処理するステップをさらに含み得る。
【0537】
任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を生成する任意のプロセスは、本明細書に記載の任意の数および/またはタイプおよび/または体積の区画で行われ得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を1つ以上の区画で生成する任意のプロセスは、本明細書に記載の任意の数の循環微粒子を含む1つ以上の区画を含み得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を1つ以上の区画で生成する任意のプロセスは、本明細書に記載の任意の数(または平均数)の循環微粒子を含む1つ以上の区画を含み得る。任意選択的に、バーコード配列の酵素的に生成されたコピーまたは酵素的に生成された補体を1つ以上の区画で生成する任意のプロセスは、本明細書に記載されるように循環微粒子からの任意の質量(または平均質量)の核酸(例えば、ゲノムDNAの断片の任意の質量)を含む1つ以上の区画を含み得る。
【0538】
バーコード配列の酵素的に生成されたコピーおよび/または酵素的に生成された補体を生成するプロセスは、循環微粒子から連結された配列を分析する目的のために、様々な望ましい特性および特徴を有し得る。第1のケースでは、バーコード配列の酵素的に生成されたコピーおよび/または酵素的に生成された補体を生成することにより、少量の開始バーコード配列材料のみを使用して、バーコード配列の大きな絶対質量(例えば、バーコード分子またはバーコード化オリゴヌクレオチドの大きな絶対質量)を生成することが可能になる(例えば、PCRおよびRCA処理は、その後の使用および操作のために入力材料の膨大な指数関数的増幅を生成することができる)。
【0539】
さらに、酵素的に生成されたコピーおよび/または酵素的に生成されたバーコード配列の補体を生成し、かかるバーコード配列は、ライブラリ内に含まれる(例えば、バーコード分子のライブラリ、多量体バーコード分子のライブラリ、多量体バーコード化試薬のライブラリ、および/またはバーコード化オリゴヌクレオチドのライブラリ内に含まれる)ことにより、定義された配列文字のバーコード配列の大きな絶対質量の生成が可能になる(例えば、バーコード配列の大きな絶対質量は、以前に確立されたおよび/または以前に特徴付けられたライブラリからの配列を含む)。
【0540】
さらに、多くの酵素的コピーおよび増幅プロセス(phi29ポリメラーゼによるローリングサークル増幅、Phusionポリメラーゼ等の熱安定性ポリメラーゼによるプライマー伸長および/またはPCR増幅等)は、当該コピー中に(新たにコピーされた配列内でのエラー生成の点で)高い分子精度を示し、したがって、非酵素的アプローチ(例えば、ホスホルアミダイトオリゴヌクレオチド合成等の標準的な化学オリゴヌクレオチド合成手順と比較して)と比較して、結果として得られるバーコード配列(例えば、結果として得られるバーコード分子、多量体バーコード分子、および/またはバーコード化オリゴヌクレオチド)の好ましい精度プロファイルを示す。
【0541】
さらに、酵素的コピーおよび増幅プロセス(例えば、プライマー伸長およびPCRプロセス)は、当該配列の修飾、処理、および官能基化の後続のステップに非常に適している。これはまた、比較的簡単な方法で大きな絶対質量の基質上で達成可能であるというさらなる利点を有し得る。例えば、プライマー伸長産物は、(例えば、バーコード化オリゴヌクレオチドおよび/または多量体バーコード化試薬を生成するために行われ得るプライマー伸長およびライゲーションプロセスのように)その後のライゲーションプロセスのために容易に構成および/または構成可能である。そして、さらなる例として、酵素コピープロセス自体の直接産物(例えば、バーコード配列の補体/コピーがバーコード配列自体にアニールされる)は、望ましい機能的および/または構造的特性を有し得る。例えば、酵素的プライマー伸長プロセスによって生成されたバーコード化オリゴヌクレオチドは、それが生成されたバーコード分子(例えば、多量体バーコード分子)に(アニールされたヌクレオチド配列を介して)構造的につながれたまま、単一の高分子複合体に保持され、溶液中の単一の無傷の試薬としてさらに処理および/または官能基化され得る。
【0542】
14.多量体バーコード化試薬の一般的特性
多量体バーコード化試薬の使用は、循環微粒子からの配列を連結するための様々な有用な特徴と機能を示す。第1のケースでは、かかる試薬(および/またはそのライブラリ)は、非常に明確に定義され、十分に特徴付けられたバーコードのセットを含むことができ、これは、その後の(例えば、既知および/または経験的に決定された配列の多量体バーコード分子および/または多量体バーコード化試薬の使用に関連して)バイオインフォマティクス分析に情報を提供し、強化することができる。さらに、かかる試薬は、一度に複数のバーコード配列の非常に簡単な区画化および/または他の分子もしくは生物物理学的プロセスを可能にする(すなわち、複数のバーコード配列がかかる各試薬内に含まれるため、それらは溶液内で、液体の取り扱いおよび/または処理ステップ中に自動的に「一緒に移動」する)。さらに、かかる試薬自体の複数のバーコード配列間の近接性は、循環微粒子を架橋し、次にかかる多量体試薬からの配列をそこに含まれるゲノムDNAの断片に付加する等の新規の機能的アッセイ形態を可能にすることができる(例えば、その液相反応内、すなわち、単一の区画内の2つ以上の微粒子との反応内を含む)。
【0543】
本発明は、1つ以上の標的核酸を標識するための多量体バーコード化試薬を提供する。多量体バーコード化試薬は、(直接的または間接的に)一緒に連結された2つ以上のバーコード領域を含む。
【0544】
各バーコード領域は、核酸配列を含む。核酸配列は、一本鎖DNA、二本鎖DNA、または1つ以上の二本鎖領域を有する一本鎖DNAであり得る。
【0545】
各バーコード領域は、多量体バーコード化試薬を特定する配列を含み得る。例えば、この配列は、単一の多量体バーコード試薬の全てのバーコード領域によって共有される定常領域であり得る。各バーコード領域は、他の領域には存在しない固有の配列を含むことができ、したがって、各バーコード領域を一意的に特定するのに役立ち得る。各バーコード領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各バーコード領域は、少なくとも5つのヌクレオチドを含む。好ましくは、各バーコード領域はデオキシリボヌクレオチドを含み、任意選択的に、バーコード領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード領域は、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード領域は、いずれの縮重ヌクレオチドまたは配列も含まなくてもよい。
【0546】
多量体バーコード化試薬は、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、または少なくとも10,000個のバーコード領域を含み得る。好ましくは、多量体バーコード化試薬は、少なくとも5つのバーコード領域を含む。
【0547】
多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも104、少なくとも105、または少なくとも106個の固有のまたは異なるバーコード領域を含み得る。好ましくは、多量体バーコード化試薬は、少なくとも5つの固有のまたは異なるバーコード領域を含む。
【0548】
多量体バーコード化試薬は、一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)を含み得、ここで、バーコード分子の各々は、バーコード領域を含む核酸配列を含む。
【0549】
多量体バーコード分子のバーコード分子は、核酸分子上に連結され得る。多量体バーコード分子のバーコード分子は、(単一の)核酸分子内に含まれ得る。多量体バーコード分子は、2つ以上のバーコード分子を含む単一の隣接する核酸配列を含み得る。多量体バーコード分子は、一本鎖核酸分子(例えば、一本鎖DNA)、二本鎖核酸分子、または1つ以上の二本鎖領域を含む一本鎖分子であり得る。多量体バーコード分子は、他の核酸分子の3’末端にライゲートすることができる1つ以上のリン酸化5’末端を含み得る。多量体バーコード分子および多量体バーコード化試薬のさらなる詳細は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0550】
バーコード分子は、支持体、例えば、高分子、固体支持体または半固体支持体によって連結され得る。各支持体に連結されたバーコード分子の配列は既知であり得る。バーコード分子は、直接的または間接的に(例えば、リンカー分子を介して)支持体に連結され得る。バーコード分子は、支持体に結合することによって、かつ/または支持体に結合しているリンカー分子に結合またはアニールすることによって連結することができる。バーコード分子は、共有リンケージ、非共有リンケージ(例えば、タンパク質-タンパク質相互作用またはストレプトアビジン-ビオチン結合)または核酸ハイブリダイゼーションによって支持体(またはリンカー分子)に結合することができる。リンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。リンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。リンカー分子は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。リンカー分子は、任意の個々のリンカーの少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、または少なくとも20個の連続繰り返し単位(少なくとも2、少なくとも5、または少なくとも10個のC12スペーサーまたはC18スペーサーの連続直鎖状系列等)を含み得る。リンカー分子は、分岐状リンカー分子を含み得、ここで、2つ以上のバーコード分子は、単一のリンカー分子によって支持体に連結されている。
【0551】
バーコード分子は、高分子に結合することによって、かつ/または高分子にアニールすることによって、高分子によって連結することができる。
【0552】
バーコード分子は、直接的または間接的に(例えば、リンカー分子を介して)高分子に連結され得る。バーコード分子は、高分子に結合することによって、かつ/または高分子に結合しているリンカー分子に結合またはアニールすることによって連結することができる。バーコード分子は、共有リンケージ、非共有リンケージ(例えば、タンパク質-タンパク質相互作用またはストレプトアビジン-ビオチン結合)または核酸ハイブリダイゼーションによって高分子(またはリンカー分子)に結合することができる。リンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。リンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。リンカー分子は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。
【0553】
高分子は、合成ポリマー(例えば、デンドリマー)またはバイオポリマー、例えば、核酸(例えば、一本鎖DNA等の一本鎖核酸)、ペプチド、ポリペプチド、またはタンパク質(例えば、多量体タンパク質)であり得る。
【0554】
デンドリマーは、少なくとも2、少なくとも3、少なくとも5、または少なくとも10世代を含み得る。
【0555】
高分子は、各々バーコード分子に結合することができる2つ以上のヌクレオチドを含む核酸であり得る。加えてまたはあるいは、核酸は、各々バーコード分子にハイブリダイズすることができる2つ以上の領域を含み得る。
【0556】
核酸は、第1の修飾ヌクレオチドおよび第2の修飾ヌクレオチドを含み得、ここで、各修飾ヌクレオチドは、バーコード分子に結合することができる結合部分(例えば、ビオチン部分、またはクリック化学反応に使用され得るアルキン部分)を含む。任意選択的に、第1および第2の修飾ヌクレオチドは、少なくとも1、少なくとも2、少なくとも5、または少なくとも10個のヌクレオチドの介在核酸配列によって分離され得る。
【0557】
核酸は、第1のハイブリダイゼーション領域および第2のハイブリダイゼーション領域を含み得、ここで、各ハイブリダイゼーション領域は、バーコード分子内の少なくとも1つのヌクレオチドの配列に相補的であり、ハイブリダイズすることができる配列を含む。相補的配列は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、または少なくとも50個の隣接するヌクレオチドであり得る。好ましくは、相補配列は少なくとも10個の隣接するヌクレオチドである。任意選択的に、第1および第2のハイブリダイゼーション領域は、少なくとも1、少なくとも2、少なくとも5、または少なくとも10個のヌクレオチドの介在核酸配列によって分離され得る。
【0558】
高分子は、多量体タンパク質、例えば、ホモマータンパク質またはヘテロマータンパク質等のタンパク質であり得る。例えば、タンパク質は、ストレプトアビジン、例えば、四量体ストレプトアビジンを含み得る。
【0559】
支持体は、固体支持体または半固体支持体であり得る。支持体は、平面を含み得る。支持体は、スライド、例えば、スライドガラスであり得る。スライドは、配列決定用のフローセルであり得る。支持体がスライドである場合、第1および第2のバーコード分子は、スライド上の個別の領域に固定化され得る。任意選択的に、ライブラリ内の各多量体バーコード化試薬のバーコード分子は、スライド上の異なる個別の領域に、ライブラリ内の他の多量体バーコード化試薬のバーコード分子に固定化される。支持体は、任意選択的に、第1および第2のバーコード分子が同じウェルに固定化されているウェルを含むプレートであり得る。任意選択的に、ライブラリ内の各多量体バーコード化試薬のバーコード分子は、ライブラリ内の他の多量体バーコード化試薬のバーコード分子とは異なるプレートのウェルに固定化される。
【0560】
好ましくは、支持体は、ビーズ(例えば、ゲルビーズ)である。ビーズは、アガロースビーズ、シリカビーズ、スタイロフォームビーズ、ゲルビーズ(10x Genomics(登録商標)から入手可能なもの等)、抗体コンジュゲートビーズ、オリゴdTコンジュゲートビーズ、ストレプトアビジンビーズ、または磁気ビーズ(例えば、超常磁性ビーズ)であり得る。ビーズは、任意のサイズおよび/または分子構造のものであり得る。例えば、ビーズは、直径10ナノメートル~100ミクロン、直径100ナノメートル~10ミクロン、または直径1ミクロン~5ミクロンであり得る。任意選択的に、ビーズは、直径約10ナノメートル、直径約100ナノメートル、直径約1ミクロン、直径約10ミクロン、または直径約100ミクロンである。ビーズは中実であり得るか、あるいは、ビーズは中空または部分的に中空または多孔質であり得る。ある特定のサイズのビーズがある特定のバーコード化法に最も好ましくあり得る。例えば、5.0ミクロン未満または1.0ミクロン未満のビーズは、個々の細胞内の核酸標的のバーコード化に最も有用であり得る。好ましくは、ライブラリ内の各多量体バーコード化試薬のバーコード分子は、異なるビーズ上で、ライブラリ内の他の多量体バーコード化試薬のバーコード分子に一緒に連結されている。
【0561】
支持体は、2つ以上のバーコード分子の付着を可能にするように官能基化され得る。この官能基化は、化学部分(例えば、カルボキシル化基、アルキン、アジド、アクリレート基、アミノ基、硫酸基、もしくはスクシンイミド基)、および/またはタンパク質ベースの部分(例えば、ストレプトアビジン、アビジン、もしくはプロテインG)を支持体に付加することにより可能になり得る。バーコード分子は、直接的または間接的に(例えば、リンカー分子を介して)部分に付着され得る。
【0562】
官能基化された支持体(例えば、ビーズ)は、溶液中の各ビーズへの2つ以上のバーコード分子の付着を促進する条件下でバーコード分子の溶液と接触させられ得る(多量体バーコード化試薬を生成する)。
【0563】
多量体バーコード化試薬のライブラリにおいて、ライブラリ内の各多量体バーコード化試薬のバーコード分子は、ライブラリ内の他の多量体バーコード化試薬のバーコード分子に異なる支持体上で一緒に連結され得る。
【0564】
多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも104、少なくとも105、または少なくとも106個の一緒に連結されたバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含み得る。好ましくは、多量体バーコード化試薬は、一緒に連結された少なくとも5つのバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含む。
【0565】
多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも104、少なくとも105、または少なくとも106個の一緒に連結された固有のまたは異なるバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含み得る。好ましくは、多量体バーコード化試薬は、一緒に連結された少なくとも5つの固有のまたは異なるバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含む。
【0566】
多量体バーコード化試薬は、本明細書で定義される2つ以上のバーコード化オリゴヌクレオチドを含み得、ここで、バーコード化オリゴヌクレオチドは、各々、バーコード領域を含む。多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の固有のまたは異なるバーコード化オリゴヌクレオチドを含み得る。好ましくは、多量体バーコード化試薬は、少なくとも5つの固有のまたは異なるバーコード化オリゴヌクレオチドを含む。
【0567】
多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、(直接的または間接的に)一緒に連結されている。多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、本明細書に記載されるように、支持体、例えば、高分子、固体支持体または半固体支持体によって一緒に連結されている。多量体バーコード化試薬は、バーコード化オリゴヌクレオチドがアニールまたは付着されている1つ以上のポリマーを含み得る。例えば、多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、多量体ハイブリダイゼーション分子、例えば、多量体バーコード分子にアニールすることができる。あるいは、多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、高分子(合成ポリマー(他デンドリマー)、またはバイオポリマー(例えば、タンパク質)等)または支持体(固体支持体または半固体支持体、例えば、ゲルビーズ等)によって一緒に連結され得る。加えてまたはあるいは、(単一の)多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、(単一の)脂質担体(例えば、リポソームまたはミセル)内に含まれることによって一緒に連結され得る。
【0568】
多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、バーコード領域、および標的核酸の第1の断片にアニールまたはライゲートすることができる標的領域を含む第1のバーコード化オリゴヌクレオチドと、任意選択的に、5’から3’方向に、バーコード領域、および標的核酸の第2の断片にアニールまたはライゲートすることができる標的領域を含む第2のバーコード化オリゴヌクレオチドと、を含み得る。
【0569】
多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、バーコード領域および標的核酸の第1の断片にライゲートすることができる標的領域を含む第1のバーコード化オリゴヌクレオチドと、バーコード領域および標的核酸の第2の断片にライゲートすることができる標的領域を含む第2のバーコード化オリゴヌクレオチドと、を含み得る。
【0570】
多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、5’から3’方向に、バーコード領域、および標的核酸の第1の断片にアニールすることができる標的領域を含む第1のバーコード化オリゴヌクレオチドと、5’から3’方向に、バーコード領域、および標的核酸の第2の断片にアニールすることができる標的領域を含む第2のバーコード化オリゴヌクレオチドと、を含み得る。
【0571】
15.バーコード化オリゴヌクレオチドの一般的特性
バーコード化オリゴヌクレオチドは、バーコード領域を含む。バーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、バーコード領域および標的領域を含み得る。標的領域は、標的核酸の断片にアニールまたはライゲートすることができる。あるいは、バーコード化オリゴヌクレオチドは、本質的にバーコード領域から構成されるか、またはバーコード領域から構成され得る。
【0572】
バーコード化オリゴヌクレオチドの5’末端はリン酸化され得る。これにより、バーコード化オリゴヌクレオチドの5’末端が標的核酸の3’末端にライゲートされ得る。あるいは、バーコード化オリゴヌクレオチドの5’末端はリン酸化されない場合がある。
【0573】
バーコード化オリゴヌクレオチドは、一本鎖核酸分子(例えば、一本鎖DNA)であり得る。バーコード化オリゴヌクレオチドは、1つ以上の二本鎖領域を含み得る。バーコード化オリゴヌクレオチドは、二本鎖核酸分子(例えば、二本鎖DNA)であり得る。
【0574】
バーコード化オリゴヌクレオチドは、デオキシリボヌクレオチドを含むか、またはそれから構成され得る。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード化オリゴヌクレオチドは、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード化オリゴヌクレオチドは、縮重ヌクレオチドまたは配列を含まない場合がある。
各バーコード化オリゴヌクレオチドのバーコード領域は、異なる配列を含み得る。各バーコード領域は、多量体バーコード化試薬を特定する配列を含み得る。例えば、この配列は、単一の多量体バーコード試薬の全てのバーコード領域によって共有される定常領域であり得る。各バーコード化オリゴヌクレオチドのバーコード領域は、他のバーコード化オリゴヌクレオチドには存在しない固有の配列を含み得、したがって、各バーコード化オリゴヌクレオチドを一意的に特定するのに役立ち得る。各バーコード領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各バーコード領域は、少なくとも5つのヌクレオチドを含む。好ましくは、各バーコード領域はデオキシリボヌクレオチドを含み、任意選択的に、バーコード領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード領域は、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード領域は、いずれの縮重ヌクレオチドまたは配列も含まなくてもよい。
【0575】
各バーコード化オリゴヌクレオチドの標的領域は、異なる配列を含み得る。各標的領域は、核酸の試料内の標的核酸の単一の断片のみにアニールすることができる配列(すなわち、標的特異的配列)を含み得る。各標的領域は、標的領域が標的核酸の1つより多くの断片にアニールすることを可能にするために、1つ以上のランダム配列または1つ以上の縮重配列を含み得る。各標的領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各標的領域は、少なくとも5つのヌクレオチドを含む。各標的領域は、5~100個のヌクレオチド、5~10個のヌクレオチド、10~20個のヌクレオチド、20~30個のヌクレオチド、30~50個のヌクレオチド、50~100個のヌクレオチド、10~90個のヌクレオチド、20~80個のヌクレオチド、30~70個のヌクレオチド、または50~60個のヌクレオチドを含み得る。好ましくは、各標的領域は、30~70個のヌクレオチドを含む。好ましくは、各標的領域はデオキシリボヌクレオチドを含み、任意選択的に、標的領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各標的領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0576】
標的領域は、バーコード化オリゴヌクレオチドを標的核酸の断片にアニールするために使用され得、その後、プライマー伸長反応または増幅反応、例えば、ポリメラーゼ連鎖反応のためのプライマーとして使用され得る。あるいは、標的領域を使用して、バーコード化オリゴヌクレオチドを標的核酸の断片にライゲートすることができる。標的領域は、バーコード化オリゴヌクレオチドの5’末端にあってもよい。かかる標的領域は、リン酸化され得る。これにより、標的領域の5’末端を標的核酸の断片の3’末端にライゲートすることが可能になり得る。
【0577】
バーコード化オリゴヌクレオチドは、1つ以上のアダプター領域をさらに含み得る。アダプター領域は、バーコード領域と標的領域との間にある場合がある。バーコード化オリゴヌクレオチドは、例えば、バーコード領域の5’のアダプター領域(5’アダプター領域)および/またはバーコード領域の3’のアダプター領域(3’アダプター領域)を含み得る。任意選択的に、バーコード化オリゴヌクレオチドは、5’から3’方向に、バーコード領域、アダプター領域、および標的領域を含む。
【0578】
バーコード化オリゴヌクレオチドのアダプター領域は、多量体バーコード分子のアダプター領域に相補的な配列、または多量体ハイブリダイゼーション分子のハイブリダイゼーション領域に相補的な配列を含み得る。バーコード化オリゴヌクレオチドのアダプター領域は、バーコード化オリゴヌクレオチドを高分子または支持体(例えば、ビーズ)に連結することを可能にし得る。アダプター領域は、バーコード化オリゴヌクレオチドおよび/またはそれらがアニールまたはライゲートする可能性のある標的核酸を操作、精製、検索、増幅、または検出するために使用することができる。
【0579】
各バーコード化オリゴヌクレオチドのアダプター領域は、定常領域を含み得る。任意選択的に、各多量体バーコード化試薬のバーコード化オリゴヌクレオチドの全てのアダプター領域は実質的に同一である。アダプター領域は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも8、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、少なくとも100、または少なくとも250個のヌクレオチドを含み得る。好ましくは、アダプター領域は、少なくとも4つのヌクレオチドを含む。好ましくは、各アダプター領域はデオキシリボヌクレオチドを含み、任意選択的に、アダプター領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各アダプター領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0580】
任意選択的に、バーコード化オリゴヌクレオチドは、1つ以上の結合部分、および/または1つ以上のリンカー部分(多量体バーコード化試薬内に含まれる任意のバーコード化オリゴヌクレオチド等)を含み得る。任意選択的に、任意のバーコード化オリゴヌクレオチドを、任意の1つ以上のカップリング分子に連結および/または付加することができる。
【0581】
バーコード化オリゴヌクレオチドは、化学オリゴヌクレオチド合成プロセスによって合成することができる。バーコード化オリゴヌクレオチド合成プロセスは、酵素的産生プロセス、酵素的増幅プロセス、または酵素的修飾手順、例えば、インビトロ転写プロセス、逆転写プロセス、プライマー伸長プロセス、もしくはポリメラーゼ連鎖反応プロセスの1つ以上のステップを含み得る。
【0582】
バーコード化オリゴヌクレオチドのこれらの一般的特性は、本明細書に記載の多量体バーコード化試薬のいずれにも適用可能である。
【0583】
16.多量体バーコード化試薬のライブラリの一般的特性
本発明は、本明細書で定義される第1および第2の多量体バーコード化試薬を含む多量体バーコード化試薬のライブラリを提供し、第1の多量体バーコード化試薬のバーコード領域は、第2の多量体バーコード化試薬のバーコード領域とは異なる。
【0584】
多量体バーコード化試薬のライブラリは、本明細書で定義される少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、または少なくとも109個の多量体バーコード化試薬を含み得る。好ましくは、ライブラリは、本明細書で定義される少なくとも10個の多量体バーコード化試薬を含む。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード領域とは異なる。
【0585】
各多量体バーコード化試薬の第1および第2のバーコード領域は、少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個のライブラリ内の他の多量体バーコード化試薬のバーコード領域とは異なり得る。各多量体バーコード化試薬の第1および第2のバーコード領域は、ライブラリ内の他の全ての多量体バーコード化試薬のバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード領域とは異なる。
【0586】
各多量体バーコード化試薬のバーコード領域は、少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個のライブラリ内の他の多量体バーコード化試薬のバーコード領域とは異なり得る。各多量体バーコード化試薬のバーコード領域は、ライブラリ内の他の全ての多量体バーコード化試薬のバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬のバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード領域とは異なる。
【0587】
本発明は、本明細書で定義される第1および第2の多量体バーコード化試薬を含む多量体バーコード化試薬のライブラリを提供し、第1の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、第2の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0588】
多量体バーコード化試薬のライブラリ内の異なる多量体バーコード化試薬は、異なる数のバーコード化オリゴヌクレオチドを含み得る。
【0589】
多量体バーコード化試薬のライブラリは、本明細書で定義される少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、または少なくとも109個の多量体バーコード化試薬を含み得る。好ましくは、ライブラリは、本明細書で定義される少なくとも10個の多量体バーコード化試薬を含む。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0590】
各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の他の多量体バーコード化試薬の全てのバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0591】
各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の他の多量体バーコード化試薬の全てのバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0592】
多量体バーコード化試薬のライブラリのこれらの一般的特性は、本明細書に記載の多量体バーコード化試薬のいずれにも適用可能である。
【0593】
17.多量体バーコード分子にアニールされたバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)を含み、バーコード分子の各々は、バーコード領域を含む核酸配列と、第1および第2のバーコード化オリゴヌクレオチドと、を含み、第1のバーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、第1のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第1の断片にアニールまたはライゲートすることができる標的領域とを含み、第2のバーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、第2のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第2の断片にアニールまたはライゲートすることができる標的領域とを含む。
【0594】
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)を含み、バーコード分子の各々は、バーコード領域を含む核酸配列と、第1および第2のバーコード化オリゴヌクレオチドと、を含み、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第1の断片にアニールが可能な標的領域とを含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第2の断片にアニールが可能な標的領域とを含む。
【0595】
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)を含み、バーコード分子の各々は、バーコード領域を含む核酸配列と、第1および第2のバーコード化オリゴヌクレオチドと、を含み、第1のバーコード化オリゴヌクレオチドは、5’から3’方向に、第1のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第1の断片にアニールすることができる標的領域とを含み、第2のバーコード化オリゴヌクレオチドは、5’から3’方向に、第2のバーコード分子のバーコード領域にアニールされたバーコード領域と、標的核酸の第2の断片にアニールすることができる標的領域とを含む。
【0596】
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)(バーコード分子の各々は、バーコード領域を含む核酸配列を含む)と、第1および第2のバーコード化オリゴヌクレオチド(第1のバーコード化オリゴヌクレオチドが、第1のバーコード分子のバーコード領域にアニールされ、標的核酸の第1の断片に連結することができるバーコード領域を含み、第2のバーコード化オリゴヌクレオチドが、第2のバーコード分子のバーコード領域にアニールされ、標的核酸の第2の断片に連結することができるバーコード領域を含む)と、を含む。
【0597】
各バーコード化オリゴヌクレオチドは、本質的にバーコード領域から構成されるか、またはバーコード領域から構成され得る。
【0598】
好ましくは、バーコード分子は、デオキシリボヌクレオチドを含むか、またはそれから構成される。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード分子は、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード分子は、縮重ヌクレオチドまたは配列を含まない場合がある。
【0599】
バーコード領域は、バーコード分子の各々を一意的に特定し得る。各バーコード領域は、多量体バーコード化試薬を特定する配列を含み得る。例えば、この配列は、単一の多量体バーコード試薬の全てのバーコード領域によって共有される定常領域であり得る。各バーコード領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各バーコード領域は、少なくとも5つのヌクレオチドを含む。好ましくは、各バーコード領域はデオキシリボヌクレオチドを含み、任意選択的に、バーコード領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。バーコード領域は、1つ以上の縮重ヌクレオチドまたは配列を含み得る。バーコード領域は、いずれの縮重ヌクレオチドまたは配列も含まなくてもよい。
【0600】
好ましくは、第1のバーコード化オリゴヌクレオチドのバーコード領域は、第1のバーコード分子のバーコード領域に相補的でアニールされる配列を含み、第2のバーコード化オリゴヌクレオチドのバーコード領域は、第2のバーコード分子のバーコード領域に相補的でアニールされる配列を含む。各バーコード化オリゴヌクレオチドの相補配列は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個の隣接するヌクレオチドであり得る。
【0601】
バーコード化オリゴヌクレオチドの標的領域(多量体バーコード分子にアニールされていない)は、多量体バーコード分子に対して非相補的であり得る。
【0602】
バーコード化オリゴヌクレオチドは、バーコード領域と標的領域との間にリンカー領域を含み得る。リンカー領域は、多量体バーコード分子にアニールされておらず、かつ標的核酸の断片に非相補的である1つ以上の隣接するヌクレオチドを含み得る。リンカーは、1~100、5~75、10~50、15~30、または20~25個の非相補的ヌクレオチドを含み得る。好ましくは、リンカーは、15~30個の非相補的ヌクレオチドを含む。かかるリンカー領域の使用は、多量体バーコード化試薬を使用して行われるバーコード化反応の効率を高める。
【0603】
バーコード分子は、バーコード化オリゴヌクレオチドのバーコード領域に相補的ではない1つ以上の核酸配列をさらに含み得る。例えば、バーコード分子は、1つ以上のアダプター領域を含み得る。バーコード分子は、例えば、バーコード領域の5’のアダプター領域(5’アダプター領域)および/またはバーコード領域の3’のアダプター領域(3’アダプター領域)を含み得る。アダプター領域(および/またはアダプター領域の1つ以上の部分)は、オリゴヌクレオチド、例えば、バーコード化オリゴヌクレオチドのアダプター領域に相補的であり、アニールすることができる。あるいは、バーコード分子のアダプター領域(および/またはアダプター領域の1つ以上の部分)は、バーコード化オリゴヌクレオチドの配列に相補的ではない場合がある。アダプター領域は、バーコード分子を操作、精製、検索、増幅、および/または検出するために使用することができる。
【0604】
多量体バーコード化試薬は、バーコード分子の各々が、5’から3’方向にアダプター領域およびバーコード領域を含む核酸配列を含み、第1のバーコード化オリゴヌクレオチドが、任意選択的に、5’から3’方向に、第1のバーコード分子のバーコード領域にアニールされたバーコード領域、第1のバーコード分子のアダプター領域にアニールされたアダプター領域、および標的核酸の第1の断片にアニールすることができる標的領域を含み、第2のバーコード化オリゴヌクレオチドが、任意選択的に、5’から3’方向に、第2のバーコード分子のバーコード領域にアニールされたバーコード領域、第2のバーコード分子のアダプター領域にアニールされたアダプター領域、および標的核酸の第2の断片にアニールすることができる標的領域を含むように構成され得る。
【0605】
各バーコード分子のアダプター領域は、定常領域を含み得る。任意選択的に、多量体バーコード化試薬の全てのアダプター領域は実質的に同一である。アダプター領域は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも8、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、少なくとも100、または少なくとも250個のヌクレオチドを含み得る。好ましくは、アダプター領域は、少なくとも4つのヌクレオチドを含む。好ましくは、各アダプター領域はデオキシリボヌクレオチドを含み、任意選択的に、アダプター領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各アダプター領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0606】
バーコード化オリゴヌクレオチドは、アダプター領域と標的領域との間にリンカー領域を含み得る。リンカー領域は、多量体バーコード分子にアニールされておらず、かつ標的核酸の断片に非相補的である1つ以上の隣接するヌクレオチドを含み得る。リンカーは、1~100、5~75、10~50、15~30、または20~25個の非相補的ヌクレオチドを含み得る。好ましくは、リンカーは、15~30個の非相補的ヌクレオチドを含む。かかるリンカー領域の使用は、多量体バーコード化試薬を使用して行われるバーコード化反応の効率を高める。
【0607】
多量体バーコード分子のバーコード分子は、核酸分子上に連結され得る。かかる核酸分子は、一本鎖バーコード化オリゴヌクレオチドがアニールされ得るバックボーンを提供し得る。あるいは、多量体バーコード分子のバーコード分子は、本明細書に記載されている他の手段のいずれかによって一緒に連結され得る。
【0608】
多量体バーコード化試薬は、一緒に連結された少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、または少なくとも10,000個のバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)と、を含み得る。好ましくは、多量体バーコード化試薬は、一緒に連結された少なくとも5つのバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含む。
【0609】
多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも104、少なくとも105、または少なくとも106個の一緒に連結された固有のまたは異なるバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含み得る。好ましくは、多量体バーコード化試薬は、一緒に連結された少なくとも5つの固有のまたは異なるバーコード分子(各バーコード分子が本明細書で定義される通りである)と、各バーコード分子にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)とを含む。
【0610】
多量体バーコード化試薬は、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、または少なくとも10,000個のバーコード領域(各バーコード領域が本明細書で定義される通りである)と、各バーコード領域にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)と、を含み得る。好ましくは、多量体バーコード化試薬は、少なくとも5つのバーコード領域(各バーコード領域が本明細書で定義される通りである)と、各バーコード領域にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)と、を含む。
【0611】
多量体バーコード化試薬は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも5000、少なくとも104、少なくとも105、または少なくとも106個の固有のまたは異なるバーコード領域(各バーコード領域が本明細書で定義される通りである)と、各バーコード領域にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)と、を含み得る。好ましくは、多量体バーコード化試薬は、少なくとも5つの固有のまたは異なるバーコード領域(各バーコード領域が本明細書で定義される通りである)と、各バーコード領域にアニールされたバーコード化オリゴヌクレオチド(各バーコード化オリゴヌクレオチドが本明細書で定義される通りである)と、を含む。
【0612】
図1は、第1(D1、E1、およびF1)ならびに第2(D2、E2、およびF2)バーコード分子を含む多量体バーコード化試薬を示している。これらの分子には各々バーコード領域(E1およびE2)を含む核酸配列が含まれている。これらの第1および第2のバーコード分子は、例えば、結合核酸配列(S)によって一緒に連結されている。多量体バーコード化試薬は、第1(A1、B1、C1、およびG1)ならびに第2(A2、B2、C2、およびG2)のバーコード化オリゴヌクレオチドも含む。これらのバーコード化オリゴヌクレオチドは各々、バーコード領域(B1およびB2)ならびに標的領域(G1およびG2)を含む。
【0613】
バーコード化オリゴヌクレオチド内のバーコード領域は各々、他のバーコード化オリゴヌクレオチドには存在しない固有の配列を含み得、したがって、かかる各バーコード分子を一意的に特定するのに役立ち得る。標的領域は、バーコード化オリゴヌクレオチドを標的核酸の断片にアニールするために使用され得、その後、プライマー伸長反応または増幅反応、例えば、ポリメラーゼ連鎖反応のためのプライマーとして使用され得る。
【0614】
各バーコード分子は、任意選択的に、5’アダプター領域(F1およびF2)も含み得る。次に、バーコード化オリゴヌクレオチドは、バーコード分子の5’アダプター領域に相補的な3’アダプター領域(C1およびC2)も含み得る。
【0615】
各バーコード分子は、任意選択的に、3’領域(D1およびD2)を含み得、これは、各バーコード分子内の同一の配列から構成され得る。次に、バーコード化オリゴヌクレオチドは、バーコード分子の3’領域に相補的な5’領域(A1およびA2)も含み得る。これらの3’領域は、核酸配列、例えば、バーコード化オリゴヌクレオチドで核酸標的を標識することによって生成される配列の操作または増幅に有用であり得る。3’領域は、少なくとも4、少なくとも5、少なくとも6、少なくとも8、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、少なくとも100、または少なくとも250個のヌクレオチドを含み得る。好ましくは、3’領域は、少なくとも4つのヌクレオチドを含む。好ましくは、各3’領域はデオキシリボヌクレオチドを含み、任意選択的に、3’領域の全てのヌクレオチドはデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各3’領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つ以上の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0616】
本発明は、配列決定のために標的核酸を標識するための少なくとも10個の多量体バーコード化試薬を含む多量体バーコード化試薬のライブラリを提供し、ここで、各多量体バーコード化試薬は、(単一の)核酸分子内に含まれる第1および第2のバーコード分子を含み、バーコード分子の各々は、バーコード領域を含む核酸配列と、第1および第2のバーコード化オリゴヌクレオチドと、を含み、第1のバーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、第1のバーコード分子のバーコード領域に相補的かつアニールされたバーコード領域と、標的核酸の第1の断片にアニールまたはライゲートすることができる標的領域とを含み、第2のバーコード化オリゴヌクレオチドは、任意選択的に、5’から3’方向に、第2のバーコード分子のバーコード領域に相補的かつアニールされたバーコード領域と、標的核酸の第2の断片にアニールまたはライゲートすることができる標的領域とを含む。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0617】
18.高分子によって連結されたバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、高分子によって一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドは、各々バーコード領域を含む。
【0618】
バーコード化オリゴヌクレオチドのさらなる詳細は、PCT/GB2017/053820に記載されており、参照により本明細書に組み込まれる。
【0619】
バーコード化オリゴヌクレオチドは、高分子に結合することによって、かつ/または高分子にアニールすることによって、高分子によって連結することができる。
【0620】
バーコード化オリゴヌクレオチドは、直接的または間接的に(例えば、リンカー分子を介して)高分子に連結され得る。バーコード化オリゴヌクレオチドは、高分子に結合することによって、かつ/または高分子に結合しているリンカー分子に結合またはアニールすることによって連結することができる。バーコード化オリゴヌクレオチドは、共有リンケージ、非共有リンケージ(例えば、タンパク質-タンパク質相互作用またはストレプトアビジン-ビオチン結合)または核酸ハイブリダイゼーションによって高分子(またはリンカー分子)に結合することができる。リンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。リンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。リンカー分子は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。
【0621】
高分子は、合成ポリマー(例えば、デンドリマー)またはバイオポリマー、例えば、核酸(例えば、一本鎖DNA等の一本鎖核酸)、ペプチド、ポリペプチド、またはタンパク質(例えば、多量体タンパク質)であり得る。
【0622】
デンドリマーは、少なくとも2、少なくとも3、少なくとも5、または少なくとも10世代を含み得る。
【0623】
高分子は、各々バーコード化オリゴヌクレオチドに結合することができる2つ以上のヌクレオチドを含む核酸であり得る。加えてまたはあるいは、核酸は、各々バーコード化オリゴヌクレオチドにハイブリダイズすることができる2つ以上の領域を含み得る。
【0624】
核酸は、第1の修飾ヌクレオチドおよび第2の修飾ヌクレオチドを含み得、ここで、各修飾ヌクレオチドは、バーコード化オリゴヌクレオチドに結合することができる結合部分(例えば、ビオチン部分、またはクリック化学反応に使用され得るアルキン部分)を含む。任意選択的に、第1および第2の修飾ヌクレオチドは、少なくとも1、少なくとも2、少なくとも5、または少なくとも10個のヌクレオチドの介在核酸配列によって分離され得る。
【0625】
核酸は、第1のハイブリダイゼーション領域および第2のハイブリダイゼーション領域を含み得、ここで、各ハイブリダイゼーション領域は、バーコード化オリゴヌクレオチド内の少なくとも1つのヌクレオチドの配列に相補的であり、ハイブリダイズすることができる配列を含む。相補的配列は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、または少なくとも50個の隣接するヌクレオチドであり得る。任意選択的に、第1および第2のハイブリダイゼーション領域は、少なくとも1、少なくとも2、少なくとも5、または少なくとも10個のヌクレオチドの介在核酸配列によって分離され得る。
【0626】
高分子は、多量体タンパク質、例えば、ホモマータンパク質またはヘテロマータンパク質等のタンパク質であり得る。例えば、タンパク質は、ストレプトアビジン、例えば、四量体ストレプトアビジンを含み得る。
【0627】
高分子によって連結されたバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬のライブラリも提供される。かかるライブラリは、本明細書に記載の多量体バーコード化試薬のライブラリの一般的特性に基づき得る。ライブラリでは、各多量体バーコード化試薬は異なる高分子を含み得る。
【0628】
19.固体支持体または半固体支持体によって連結されたバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬
本発明は、標的核酸を標識するための多量体バーコード化試薬を提供し、ここで、試薬は、固体支持体または半固体支持体によって一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含み、バーコード化オリゴヌクレオチドは、各々バーコード領域を含む。
【0629】
第1のバーコード化オリゴヌクレオチドは、標的核酸の第1の断片にアニールまたはライゲートすることができる標的領域をさらに含み得、第2のバーコード化オリゴヌクレオチドは、標的核酸の第2の断片にアニールまたはライゲートすることができる標的領域をさらに含み得る。
【0630】
第1のバーコード化オリゴヌクレオチドは、5’-3’方向に、標的核酸の第1の断片にアニールすることができるバーコード領域および標的領域を含み得、第2のバーコード化オリゴヌクレオチドは、5’-3’方向に、標的核酸の第2の断片にアニールすることができるバーコード領域および標的領域を含み得る。
【0631】
バーコード化オリゴヌクレオチドは、本明細書に記載の特徴のいずれかをさらに含み得る。
【0632】
バーコード化オリゴヌクレオチドは、固体支持体または半固体支持体によって連結され得る。バーコード化オリゴヌクレオチドは、直接的または間接的に(例えば、リンカー分子を介して)支持体に連結され得る。バーコード化オリゴヌクレオチドは、支持体に結合することによって、かつ/または支持体に結合しているリンカー分子に結合またはアニールすることによって連結することができる。バーコード化オリゴヌクレオチドは、共有リンケージ、非共有リンケージ(例えば、タンパク質-タンパク質相互作用またはストレプトアビジン-ビオチン結合)または核酸ハイブリダイゼーションによって支持体(またはリンカー分子)に結合することができる。リンカー分子は、バイオポリマー(例えば、核酸分子)または合成ポリマーであり得る。リンカー分子は、1つ以上のエチレングリコールおよび/またはポリ(エチレン)グリコール(例えば、ヘキサ-エチレングリコールまたはペンタ-エチレングリコール)単位を含み得る。リンカー分子は、C3(3炭素)スペーサー、C6スペーサー、C12スペーサー、またはC18スペーサー等の1つ以上のエチル基を含み得る。リンカー分子は、任意の個々のリンカーの少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、または少なくとも20個の連続繰り返し単位(少なくとも2、少なくとも5、または少なくとも10個のC12スペーサーまたはC18スペーサーの連続直鎖状系列等)を含み得る。リンカー分子は、分岐状リンカー分子を含み得、ここで、2つ以上のバーコード分子は、単一のリンカー分子によって支持体に連結されている。
【0633】
支持体は、平面を含み得る。支持体は、スライド、例えば、スライドガラスであり得る。スライドは、配列決定用のフローセルであり得る。支持体がスライドである場合、第1および第2のバーコード化オリゴヌクレオチドは、スライド上の個別の領域に固定化され得る。任意選択的に、ライブラリ内の各多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、スライド上の異なる個別の領域に、ライブラリ内の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドに固定化される。支持体は、任意選択的に、第1および第2のバーコード化オリゴヌクレオチドが同じウェルに固定化されているウェルを含むプレートであり得る。任意選択的に、ライブラリ内の各多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、ライブラリ内の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドとは異なるプレートのウェルに固定化される。
【0634】
好ましくは、支持体は、ビーズ(例えば、ゲルビーズ)である。ビーズは、アガロースビーズ、シリカビーズ、スタイロフォームビーズ、ゲルビーズ(10x Genomics(登録商標)から入手可能なもの等)、抗体コンジュゲートビーズ、オリゴdTコンジュゲートビーズ、ストレプトアビジンビーズ、または磁気ビーズ(例えば、超常磁性ビーズ)であり得る。ビーズは、任意のサイズおよび/または分子構造のものであり得る。例えば、ビーズは、直径10ナノメートル~100ミクロン、直径100ナノメートル~10ミクロン、または直径1ミクロン~5ミクロンであり得る。任意選択的に、ビーズは、直径およそ10ナノメートル、直径およそ100ナノメートル、直径およそ1ミクロン、直径およそ10ミクロン、または直径およそ100ミクロンである。ビーズは中実であり得るか、あるいは、ビーズは中空または部分的に中空または多孔質であり得る。ある特定のサイズのビーズがある特定のバーコード化法に最も好ましくあり得る。例えば、5.0ミクロン未満または1.0ミクロン未満のビーズは、個々の細胞内の核酸標的のバーコード化に最も有用であり得る。好ましくは、ライブラリ内の各多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、異なるビーズ上で、ライブラリ内の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドに一緒に連結されている。
【0635】
支持体は、2つ以上のバーコード化オリゴヌクレオチドの付着を可能にするように官能基化され得る。この官能基化は、化学部分(例えば、カルボキシル化基、アルキン、アジド、アクリレート基、アミノ基、硫酸基、もしくはスクシンイミド基)、および/またはタンパク質ベースの部分(例えば、ストレプトアビジン、アビジン、もしくはプロテインG)を支持体に付加することにより可能になり得る。バーコード化オリゴヌクレオチドは、直接的または間接的に(例えば、リンカー分子を介して)部分に付着され得る。
【0636】
官能基化された支持体(例えば、ビーズ)は、溶液中の各ビーズへの2つ以上のバーコード化オリゴヌクレオチドの付着を促進する条件下でバーコード化オリゴヌクレオチドの溶液と接触させられ得る(多量体バーコード化試薬を生成する)。
【0637】
支持体によって連結されたバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬のライブラリも提供される。かかるライブラリは、本明細書に記載の多量体バーコード化試薬のライブラリの一般的特性に基づき得る。ライブラリでは、各多量体バーコード化試薬は、異なる支持体(例えば、異なる標識のビーズ)を含み得る。多量体バーコード化試薬のライブラリにおいて、ライブラリ内の各多量体バーコード化試薬のバーコード化オリゴヌクレオチドは、ライブラリ内の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドに異なる支持体上で一緒に連結され得る。
【0638】
20.配列決定のための核酸試料の調製方法
配列決定のための核酸試料を調製する方法は、(i)核酸試料を、一緒に連結された第1および第2のバーコード領域を含む多量体バーコード化試薬と接触させることであって、各バーコード領域が核酸配列を含む、接触させることと、(ii)標的核酸の第1および第2の断片にバーコード配列を付加して、第1および第2の異なるバーコード化標的核酸分子を生成することと、を含み得、ここで、第1のバーコード化標的核酸分子は第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子は第2のバーコード領域の核酸配列を含む。
【0639】
多量体バーコード化試薬が一緒に連結された第1および第2のバーコード化オリゴヌクレオチドを含む方法において、バーコード配列は、本明細書に記載の方法のいずれかによって、標的核酸の第1および第2の断片に付加され得る。
【0640】
第1および第2のバーコード化オリゴヌクレオチドを、標的核酸の第1および第2の断片にライゲートして、第1および第2の異なるバーコード化標的核酸分子を生成することができる。任意選択的に、ライゲーションステップの前に、この方法は、第1および第2のカップリング配列を標的核酸に付加することを含み、ここで、第1および第2のカップリング配列は、第1および第2のバーコード化オリゴヌクレオチドがライゲートされる標的核酸の第1および第2の断片である。
【0641】
第1および第2のバーコード化オリゴヌクレオチドを、標的核酸の第1および第2の断片にアニールして、第1および第2の異なるバーコード化標的核酸分子を生成するように伸長することができる。任意選択的に、アニールステップの前に、この方法は、第1および第2のカップリング配列を標的核酸に付加することを含み、ここで、第1および第2のカップリング配列は、第1および第2のバーコード化オリゴヌクレオチドがアニールされる標的核酸の第1および第2の断片である。
【0642】
第1および第2のバーコード化オリゴヌクレオチドは、それらの5’末端で標的核酸の第1および第2の部分配列にアニールされ得、第1および第2の標的プライマーは、それぞれ、標的核酸の第3および第4の部分配列にアニールされ得、ここで、第3の部分配列は第1の部分配列の3’であり、第4の部分配列は第2の部分配列の3’である。この方法は、標的核酸をテンプレートとして使用して第1の標的プライマーを第1の部分配列に到達するまで伸長して、第1の伸長標的プライマーを生成することと、標的核酸をテンプレートとして使用して第2の標的プライマーを第2の部分配列に到達するまで伸長して、第2の伸長標的プライマーを生成することと、第1の伸長標的プライマーの3’末端を第1のバーコード化オリゴヌクレオチドの5’末端にライゲートして第1のバーコード化標的核酸分子を生成することと、第2の伸長標的プライマーの3’末端を第2のバーコード化オリゴヌクレオチドの5’末端にライゲートして第2のバーコード化標的核酸分子を生成することと、をさらに含み、ここで、第1および第2のバーコード化標的核酸分子は異なり、各々が、テンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む。任意選択的に、いずれかまたは両方のアニールステップの前に、この方法は、第1および第2、ならびに/または第3および第4のカップリング配列を標的核酸に付加することを含み、ここで、第1および第2のカップリング配列は、第1および第2のバーコード化オリゴヌクレオチドがアニールされる標的核酸の第1および第2の部分配列であり、ならびに/または、第3および第4のカップリング配列は、第1および第2の標的プライマーがアニールされる標的核酸の第3および第4の部分配列である。
【0643】
本明細書に記載されるように、多量体ハイブリダイゼーション分子、多量体バーコード分子、バーコード化オリゴヌクレオチド、アダプターオリゴヌクレオチドまたは標的プライマーを標的核酸にアニールまたはライゲートする前に、カップリング配列を標的核酸に付加することができる。次に、多量体ハイブリダイゼーション分子、多量体バーコード分子、バーコード化オリゴヌクレオチド、アダプターオリゴヌクレオチドまたは標的プライマーをアニールするか、またはカップリング配列にライゲートすることができる。
【0644】
カップリング配列は、核酸試料の2つ以上の標的核酸の5’末端または3’末端に付加され得る。この方法では、(バーコード化オリゴヌクレオチドの)標的領域は、カップリング配列に相補的な配列を含み得る。
【0645】
カップリング配列は、二本鎖カップリングオリゴヌクレオチド内または一本鎖カップリングオリゴヌクレオチド内に含まれ得る。カップリングオリゴヌクレオチドは、二本鎖ライゲーション反応または一本鎖ライゲーション反応によって標的核酸に付加され得る。カップリングオリゴヌクレオチドは、標的核酸にライゲートすることができる一本鎖5’または3’領域を含み得、カップリング配列は、一本鎖ライゲーション反応によって標的核酸に付加され得る。
【0646】
カップリングオリゴヌクレオチドは、標的核酸にライゲートすることができる平滑、陥凹、またはオーバーハング5’または3’領域を含み得、カップリング配列は、二本鎖ライゲーション反応標的核酸に付加され得る。
【0647】
標的核酸の末端(複数可)は、平滑末端化反応時に平滑二本鎖末端(複数可)に変換され得、カップリングオリゴヌクレオチドは、平滑二本鎖末端を含み得、ここで、カップリングオリゴヌクレオチドが、平滑末端ライゲーション反応時に標的核酸にライゲートされ得る。
【0648】
標的核酸の末端(複数可)は、平滑末端化反応時に平滑二本鎖末端(複数可)に変換され得、その後、(a)単一の3’アデノシンオーバーハング(複数可)を有する形態に変換され得、ここで、カップリングオリゴヌクレオチドが、標的核酸の単一の3’アデノシンオーバーハングにアニールすることができる単一の3’チミンオーバーハングを有する二本鎖末端を含み得、カップリングオリゴヌクレオチドが、二本鎖A/Tライゲーション反応時に標的核酸にライゲートされる。
【0649】
標的核酸を制限酵素と接触させることができ、この制限酵素は、制限部位で標的核酸を消化して、制限部位(複数可)に(a)ライゲーション接合部を作製し、カップリングオリゴヌクレオチドは、ライゲーション接合部と適合性の末端を含み、その後、カップリングオリゴヌクレオチドが二本鎖ライゲーション反応の際に標的核酸にライゲートされる。
【0650】
カップリングオリゴヌクレオチドは、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0651】
カップリングオリゴヌクレオチドは、1つ以上の縮重塩基を含むプライミングセグメントを含む1つ以上のオリゴヌクレオチドを使用して、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0652】
カップリングオリゴヌクレオチドは、特定の標的核酸配列に特異的なプライミングまたはハイブリダイゼーションセグメントをさらに含む1つ以上のオリゴヌクレオチドを使用して、プライマー伸長またはポリメラーゼ連鎖反応ステップによって付加され得る。
【0653】
カップリング配列は、ポリヌクレオチドテーリング反応によって付加され得る。カップリング配列は、末端トランスフェラーゼ酵素(例えば、末端デオキシヌクレオチジルトランスフェラーゼ酵素)によって付加され得る。カップリング配列は、末端デオキシヌクレオチジルトランスフェラーゼ酵素を用いて行われるポリヌクレオチドテーリング反応によって付加され得、ここで、カップリング配列は、ホモポリマー配列の少なくとも2つの隣接するヌクレオチドを含む。
【0654】
カップリング配列は、ホモポリマー3’テール(例えば、ポリ(A)テール)を含み得る。任意選択的に、かかる方法では、(バーコード化オリゴヌクレオチドの)標的領域は、相補的ホモポリマー3’テール(例えば、ポリ(T)テール)を含む。
【0655】
カップリング配列は、合成トランスポゾン内に含まれ得、インビトロ転位反応により付加され得る。
【0656】
カップリング配列は、標的核酸に付加され得、ここで、バーコードオリゴヌクレオチドは、少なくとも1つのプライマー伸長ステップまたはポリメラーゼ連鎖反応ステップによって標的核酸に付加され、当該バーコードオリゴヌクレオチドは、当該カップリング配列に相補的な少なくとも1ヌクレオチド長の領域を含む。任意選択的に、この相補性領域は、バーコードオリゴヌクレオチドの3’末端にある。任意選択的に、この相補性領域は、少なくとも2ヌクレオチド長、少なくとも5ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも20ヌクレオチド長、または少なくとも50ヌクレオチド長である。
【0657】
アダプターオリゴヌクレオチドが標的核酸に付加される(例えば、ライゲートまたはアニールされる)方法において、アダプターオリゴヌクレオチドのアダプター領域は、多量体ハイブリダイゼーション分子または多量体バーコード分子のアダプター領域にハイブリダイズすることができるカップリング配列を提供する。
【0658】
本発明は、配列決定のための核酸試料を調製する方法を提供し、以下のステップ(a)標的核酸の第1および第2の断片にカップリング配列を付加することと、(b)核酸試料を、一緒に連結された第1および第2のバーコード分子を含む多量体バーコード化試薬と接触させることであって、バーコード分子の各々は、(5’から3’または3’から5’方向に)バーコード領域およびアダプター領域を含む核酸配列を含む、接触させることと、(c)第1の断片のカップリング配列を第1のバーコード分子のアダプター領域にアニールすること、および第2の断片のカップリング配列を第2のバーコード分子のアダプター領域にアニールすることと、(d)標的核酸の少なくとも2つの断片の各々にバーコード配列を付加して、第1および第2の異なるバーコード化標的核酸分子を生成することと、を含み、ここで、第1のバーコード化標的核酸分子は、第1のバーコード分子のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子は、第2のバーコード分子のバーコード領域の核酸配列を含む。
【0659】
この方法では、バーコード分子の各々は、5’から3’方向にバーコード領域およびアダプター領域を含む核酸配列を含み得、ステップ(d)は、第1のバーコード分子のバーコード領域をテンプレートとして使用して標的核酸の第1の断片のカップリング配列を伸長して、第1のバーコード化標的核酸分子を生成することと、第2のバーコード分子のバーコード領域をテンプレートとして使用して標的核酸の第2の断片のカップリング配列を伸長して、第2のバーコード化標的核酸分子を生成することと、を含み得、第1のバーコード化標的核酸分子が第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化標的核酸分子が第2のバーコード分子のバーコード領域に相補的な配列を含む。
【0660】
この方法では、バーコード分子の各々は、5’から3’方向にアダプター領域およびバーコード領域を含む核酸配列を含み得、ステップ(d)は、(i)第1のバーコード分子のバーコード領域をテンプレートとして使用して第1の伸長プライマーをアニールおよび伸長して、第1のバーコード化オリゴヌクレオチドを生成すること、および第2のバーコード分子のバーコード領域をテンプレートとして使用して第2の伸長プライマーをアニールおよび伸長して、第2のバーコード化オリゴヌクレオチドを生成することであって、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域に相補的な配列を含む、アニールおよび伸長することと、(ii)第1のバーコード化オリゴヌクレオチドの3’末端を標的核酸の第1の断片のカップリング配列の5’末端にライゲートして、第1のバーコード化標的核酸分子を生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を標的核酸の第2の断片のカップリング配列の5’末端にライゲートして、第2のバーコード化標的核酸分子を生成することと、を含み得る。
【0661】
この方法では、バーコード分子の各々は、5’から3’方向に、アダプター領域、バーコード領域、およびプライミング領域を含む核酸配列を含み得、ここで、ステップ(d)は、(i)第1のバーコード分子のプライミング領域に第1の伸長プライマーをアニールし、第1のバーコード分子のバーコード領域をテンプレートとして使用して第1の伸長プライマーを伸長して、第1のバーコード化オリゴヌクレオチドを生成すること、および第2のバーコード分子のプライミング領域に第2の伸長プライマーをアニールし、第2のバーコード分子のバーコード領域をテンプレートとして使用して第2の伸長プライマーを伸長して、第2のバーコード化オリゴヌクレオチドを生成することであって、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域に相補的な配列を含む、アニールすることと、(ii)第1のバーコード化オリゴヌクレオチドの3’末端を標的核酸の第1の断片のカップリング配列の5’末端にライゲートして、第1のバーコード化標的核酸分子を生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を標的核酸の第2の断片のカップリング配列の5’末端にライゲートして、第2のバーコード化標的核酸分子を生成することと、を含む。
【0662】
配列決定のための核酸試料を調製するための方法は、配列決定のための一連の異なる核酸試料を調製するために使用され得る。標的核酸は、DNA分子(例えば、ゲノムDNA分子)またはRNA分子(例えば、mRNA分子)であり得る。標的核酸は、任意の試料に由来し得る。例えば、個々の細胞(または複数の細胞)、組織、体液(例えば、血液、血漿、および/または血清)、生検、またはホルマリン固定パラフィン包埋(FFPE)試料であり得る。
【0663】
試料は、少なくとも10、少なくとも100、または少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、または少なくとも109個の標的核酸を含み得る。
【0664】
この方法は、少なくとも2、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109個の異なるバーコード化標的核酸分子を生成することを含み得る。好ましくは、この方法は、少なくとも5つの異なるバーコード化標的核酸分子を生成することを含む。
【0665】
各バーコード化標的核酸分子は、テンプレートとしての標的核酸から合成された少なくとも1、少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各バーコード化標的核酸分子は、テンプレートとしての標的核酸から合成された少なくとも20個のヌクレオチドを含む。
【0666】
あるいは、各バーコード化標的核酸分子は、標的核酸の少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各バーコード化標的核酸分子は、標的核酸の少なくとも5つのヌクレオチドを含む。
【0667】
ユニバーサルプライミング配列がバーコード化標的核酸分子に付加され得る。この配列は、1つのフォワードプライマーおよび1つのリバースプライマーを使用して、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、または少なくとも109個の異なるバーコード化標的核酸分子のその後の増幅を可能にし得る。
【0668】
任意選択的に、循環微粒子を含む試料または循環微粒子に由来する試料を分析する任意の方法において、この方法は、多量体バーコード化試薬内に含まれるバーコード配列を標的核酸分子等の標的分子に付加および/または連結および/または接続することを含み(例えば、この方法は、多量体バーコード化試薬内に含まれるバーコード化オリゴヌクレオチドを標的核酸分子等の標的分子に付加および/または連結および/または接続することを含む)、任意の数の異なる多量体バーコード化試薬からの、またはその中に含まれるバーコード配列(例えば、バーコード化オリゴヌクレオチド)は、そのように付加および/または連結および/または接続され得る。例えば、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、または少なくとも1000個の異なる多量体バーコード化試薬からのバーコード化オリゴヌクレオチドを、単一の循環微粒子内に含まれるか、または単一の循環微粒子に由来する標的核酸分子に付加および/または連結および/または接続することができ、任意選択的に、循環微粒子あたりの多量体バーコード化試薬のかかる比率は、循環微粒子の試料内の任意または全ての循環微粒子について平均して真であり得る。任意選択的に、2つ以上の多量体バーコード化試薬からのバーコード化オリゴヌクレオチドが、単一の循環微粒子内に含まれるか、または単一の循環微粒子に由来する標的核酸分子に付加および/または連結および/または接続される任意の方法において、結果として得られるバーコードからバーコードへの付加分子が配列決定反応で配列決定され得るような方法で、当該2つ以上の多量体バーコード化試薬が互いに「クロスバーコード化反応」に関与し、したがって共局在化され(例えば、物理的に近接した空間的近接性に占有され、および/もしくは近くに占有され、または溶液中の物理的体積がオーバーラップ(または部分的にオーバーラップ)している)、かつ同じ(物理的に近い、または近くにある)単一の循環微粒子(またはそこに含まれるか、かつ/もしくはそこから由来する試料もしくは標的生体分子)を共標識(共バーコード化)したものとして特定されるような方法で、任意の第1のかかる多量体バーコード化試薬からの任意の数の1つ以上のバーコード配列は、任意の第2のかかる多量体バーコード化試薬からの任意の数の1つ以上のバーコード配列に付加され得る(「クロスバーコード化反応」)。任意選択的に、「クロスバーコード化反応」に関与した任意の第1の多量体バーコード化試薬内に含まれるバーコード配列(例えば、バーコード化オリゴヌクレオチド)に付加された任意もしくは全ての標的核酸分子は、同じ「クロスバーコード化反応」に関与した任意の第2の多量体バーコード化試薬内に含まれるバーコード配列(例えば、バーコード化オリゴヌクレオチド)に付加された任意もしくは全ての標的核酸分子に連結されていると見なされるか、または見出され得る。任意選択的に、この「クロスバーコード化反応」法は、本明細書に記載の任意の方法内の任意もしくは全ての循環微粒子および/または任意もしくは全ての多量体バーコード化試薬および/または任意もしくは全ての標的核酸分子に対して使用され得る。
【0669】
任意選択的に、2つ以上の多量体バーコード化試薬からのバーコード化オリゴヌクレオチドが、単一の循環微粒子内に含まれる、または単一の循環微粒子に由来する標的核酸分子に付加および/または連結および/または接続される任意の方法において、かかる多量体バーコード化試薬の第1および第2(またはそれ以上)の各々からの任意の数の1つ以上のバーコード配列(例えば、バーコード化オリゴヌクレオチド内に含まれる)は、単一の合成DNAテンプレート(例えば、一本鎖合成DNAテンプレート)内に含まれる分子識別子配列に付加されて、「バーコード対分子識別子配列」分子を作成することができ、ここで、当該合成DNAテンプレートが、分子識別子配列の少なくとも2つのコピー(例えば、少なくとも2つのタンデムに繰り返されるコピー)を含み、当該分子識別子配列が、少なくとも1ヌクレオチド長(または少なくとも2、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも30、または少なくとも50ヌクレオチド長)の識別子配列を含み、ここで、当該識別子配列は、単一の合成DNAテンプレート内の(および/または各々の)全ての分子識別子配列について同じである(すなわち、配列が同一である)(かつ任意選択的に、当該識別子配列は、2つ以上の異なる合成DNAテンプレートの各々の間で異なる)。
【0670】
任意選択的に、かかる各分子識別子配列は、(5’末端および/または3’末端に)1つ以上のアダプター配列を含み得る(1つ以上のアダプター配列は任意の長さであり得る)。任意選択的に、任意の1つ以上のかかるアダプター配列は、全ての分子識別子配列および/または合成DNAテンプレート(異なる合成DNAテンプレートのライブラリ内等)について同じであり得る。任意選択的に、任意の1つ以上のかかるアダプター配列は、バーコード化オリゴヌクレオチド(多量体バーコード化試薬のライブラリ内の例えば、バーコード化オリゴヌクレオチド)内の任意の標的配列に部分的または完全に相補的であり得る。任意選択的に、2つ以上の異なる合成DNAテンプレートのライブラリを使用することができ、ここで、識別子配列は、単一の合成DNAテンプレート内の全ての分子識別子配列について同じである(すなわち、配列が同一である)が、分子識別子配列は、2つ以上の異なる単一の合成DNAテンプレートの間で異なる。任意選択的に、合成DNAテンプレートのライブラリは、少なくとも10、少なくとも100、少なくとも1000、少なくとも1,000,0000、少なくとも10,000,000、少なくとも100,000,000、少なくとも1,000,000,000、または少なくとも100,000,000,000個の異なる合成DNAテンプレートを含み得る(例えば、当該ライブラリ内の各合成DNAテンプレートは、異なる識別子配列を含む)。任意選択的に、かかる個々の(異なる)合成DNAテンプレートの各々は、ライブラリおよび/または溶液内に任意の濃度(例えば、2つ以上のコピー)で存在し得る。合成DNAテンプレートおよび/またはそのライブラリを合成および使用する方法は、本明細書の方法5、6、および7に記載されている。
【0671】
任意選択的に、1つ以上の循環微粒子(本明細書に記載の任意の種類および任意の濃度)を含むか、またはそれに由来する試料は、多量体バーコード化試薬(本明細書に記載されている任意の種類および任意の濃度で)のライブラリと、2以上の合成DNAテンプレート(本明細書に記載されている任意の種類および任意の濃度で)のライブラリと、溶液を形成するために(例えば、連続した水性体積内で)組み合わされ得、当該多量体バーコード化試薬からのバーコード配列(例えば、バーコード化オリゴヌクレオチド)を当該循環微粒子内に含まれるか、または当該循環微粒子に由来する標的核酸分子に付加および/または連結および/または接続(本明細書に記載のいずれか1つまたは方法により)し得、さらに、合成DNAテンプレートの当該ライブラリ内に含まれる分子識別子配列に付加および/または連結および/または接続(本明細書に記載のいずれか1つまたは方法により)し得(任意選択的に、かかる全ての付加および/または連結および/または接続が単一のおよび/または同時ステップで行われる)、これは、任意選択的に、任意の2つ以上の異なる多量体バーコード化試薬からのバーコード分子(例えば、任意の2つ以上の多量体バーコード化試薬からのバーコード化オリゴヌクレオチド)を単一の合成DNAテンプレート(例えば、当該溶液内の当該多量体バーコード化試薬に物理的に近接する単一の合成DNAテンプレート)内に含まれる分子識別子配列に付加できるような方法で行われる。ここで、任意選択的に、次に、同じ分子識別子配列(すなわち、単一の合成DNAテンプレート内に含まれる分子識別子配列)に付加された任意の2つ以上の異なる多量体バーコード化試薬からのバーコード分子が、互いに「クロスバーコード化反応」に関与したものとして特定され、したがって、同じ単一の循環微粒子(またはそれに由来する試料)からの標的分子を共局在化および共標識(すなわち、共バーコード化)されたものとして特定される方法で、結果として得られるバーコード対分子識別子配列分子は、配列決定反応で配列決定される。任意選択的に、かかる「クロスバーコード化反応」に関与した任意の多量体バーコード化試薬内に含まれるバーコード配列に付加された任意もしくは全ての標的核酸分子は、当該「クロスバーコード化反応」に関与した任意の他の多量体バーコード化試薬(例えば、同じ分子識別子配列に付加されたその1つ以上の構成バーコード配列を有する他の多量体バーコード化試薬)内に含まれるバーコード配列に付加された任意もしくは全ての標的核酸分子に連結されていると見なされるか、または見出され得る。任意選択的に、任意の数または総数の「バーコード対分子識別子配列」分子(例えば、配列決定反応から決定される)を(例えば、リードの数をカウントすること、および/または配列決定反応から生じる固有のリードの数をカウントすることによって)カウントおよび/または定量することができる。ここで、各リードは、1)多量体バーコード化試薬からのバーコード配列/バーコード化オリゴヌクレオチド配列(またはその補体)の全部または一部、および2)合成DNAテンプレートからの分子識別子配列(またはその補体)の全部または一部のうちの任意のペアを含む。任意選択的に、第1の多量体バーコード化試薬からの(すなわち、多量体バーコード化試薬のライブラリ内の)任意のバーコード配列/バーコード化オリゴヌクレオチド配列(またはその補体)の全部または一部を含み、かつ合成DNAテンプレートからの特定の単一分子識別子配列(またはその補体)の全部または一部を含む、任意のかかる配列決定反応から結果として得られるリード(および/または固有のリード)の総数をカウントして、第1の標識カウントを作成し得、第2の多量体バーコード化試薬からの(すなわち、多量体バーコード化試薬のライブラリ内の)任意のバーコード配列/バーコード化オリゴヌクレオチド配列(またはその補体)の全部または一部を含み、かつ当該合成DNAテンプレートからの当該特定の単一分子識別子配列(またはその補体)の全部または一部を含む、当該配列決定反応から結果として得られるリード(および/または固有のリード)の総数をカウントして、第2の標識リードカウントを作成し得る。任意選択的に、当該第1および第2の標識リードカウントの合計は、当該第1および第2の多量体バーコード化試薬間の接続性および/または連結度および/または物理的近接および/または連結の確率を決定するための重み付け値と見なされ得る。任意選択的に、当該第1および第2の標識リードカウントの各々は、当該カウントカットオフまたは閾値と比較され得、その結果、第1および第2の標識リードカウントの両方がカウントカットオフまたは閾値以上である反応において、当該第1および第2の多量体バーコード化試薬は、連結されていると見なされ得る(そして、伸長によって、当該第1または第2の多量体バーコード化試薬のいずれかからのバーコード配列/バーコード化オリゴヌクレオチドによって標識される標的核酸分子等の任意の標的生体分子も連結されていると見なされ得る)。潜在的なかかるカウントカットオフまたは閾値には、1、2、3、4、5、6、7、8、9、10、15、20、30、50、100、200、500、または1000個のリードが含まれる可能性がある。任意選択的に、任意のかかる標識リードカウントおよび/またはその分析は、多量体バーコード化試薬のライブラリ内の2つの異なる多量体バーコード化試薬のいずれかまたは全てのペアワイズ比較のために行われ得る。任意選択的に、任意のかかる標識リードカウントおよび/またはその分析は、多量体バーコード化試薬のライブラリ内の3つ以上の異なる多量体バーコード化試薬を含むセット(少なくとも5、少なくとも10、少なくとも20、少なくとも50、少なくとも100、または少なくとも1000の異なる多量体バーコード化試薬のセット等)の高次比較を行うことができる。任意選択的に、異なる多量体バーコード化試薬の任意のかかるセット内の全ての多量体バーコード化試薬は、任意の単一の特定の分子識別子配列に対応する当該セット内の各多量体バーコード化試薬の標識リードカウントが任意の特定のカウントカットオフまたは閾値以上である場合、互いに一緒に連結していると見なすことができる(すなわち、「クロスバーコード化反応」に関与したと見なす)。任意選択的に、特定の多量体バーコード化試薬の任意の標識リードカウントは、当該多量体バーコード化試薬からの任意のバーコード配列/バーコード化オリゴヌクレオチド配列を含む(全てまたは一部)配列決定反応におけるリード(および/または固有のリード)の総数で除算され、正規化された標識リードカウントを計算することができる。次に、任意選択的に、当該正規化標識リードカウントを正規化カウントカットオフまたは閾値と比較して、任意の単一の特定の分子識別子配列に対応する当該セット内の各多量体バーコード化試薬の標識リードカウントが任意の特定の正規化されたカウントカットオフまたは閾値以上である場合、異なる多量体バーコード化試薬の任意のセット内の全ての多量体バーコード化試薬が互いに一緒に連結していると見なすことができる。潜在的なかかる正規化されたカウントカットオフまたは閾値には、0.00000001、0.0000001、0.000001、0.00001、0.0001、0.001、0.002、0.003、0.004、0.005、0.0075、0.01、0.015、0.02、0.03、0.04、0.05、0.075、0.10、0.15、0.20、0.25、または0.30が含まれる。
【0672】
任意選択的に、バーコード配列を標的核酸分子および/または合成DNAテンプレートのライブラリ内に含まれる分子識別子配列に付加および/または連結および/または接続する任意のステップの前および/またはその間に、合成DNAテンプレートの当該ライブラリ内の合成DNAテンプレートは、溶液内(すなわち、反応溶液および/または隣接する水性体積内)に溶解され得る(例えば、自由に浮遊し、拡散可能である)。任意選択的に、バーコード配列を標的核酸分子および/または合成DNAテンプレートのライブラリ内に含まれる分子識別子配列に付加および/または連結および/または接続する任意のステップの前および/またはその間に、合成DNAテンプレートの当該ライブラリ内の合成DNAテンプレートは、1つ以上の循環微粒子および/または当該循環微粒子内あるいはその上に含まれる分子(例えば、1つ以上の循環微粒子を含む試料内または試料から)に付加され得る。任意選択的に、当該合成DNAテンプレートは、1つ以上のカップリング配列および/またはアダプター配列(カップリング分子内のカップリング配列等)に相補的な1つ以上の配列を含み得、ここで、当該カップリング配列は、最初に当該循環微粒子(複数可)内の標的生体分子(標的核酸等)に付加され、次に、当該合成DNAテンプレートが、当該カップリング配列内の相補的配列に付加される。任意選択的に、合成DNAテンプレートを当該循環微粒子(複数可)内あるいはその上に含まれる1つ以上の循環微粒子および/または分子に付加する任意のステップは、多量体バーコード化試薬を当該循環微粒子内あるいはその上に含まれる当該循環微粒子および/または分子に付加するさらなるまたは同時のステップをさらに含み得る(例えば、当該多量体バーコード化試薬内のバーコード化オリゴヌクレオチドが、当該循環微粒子(複数可)内に含まれる標的核酸等の標的生体分子に最初に付加されるカップリング配列に相補的な配列(それらの標的領域内の配列等)を含む)。任意選択的に、任意の合成DNAテンプレートは、任意のカップリング分子内に含まれ得る(すなわち、その一部を含み得る)。
【0673】
任意選択的に、多量体バーコード化試薬のライブラリからのバーコード配列を標的核酸分子および/または合成DNAテンプレートのライブラリ内に含まれる分子識別子配列に付加および/または連結および/または接続する任意のステップの前および/またはその間に、多量体バーコード化試薬の当該ライブラリ内の多量体バーコード化試薬は、溶液内(すなわち、反応溶液および/または隣接する水性体積内)に溶解され得る(例えば、自由に浮遊し、拡散可能である)。任意選択的に、バーコード配列を標的核酸分子および/または合成DNAテンプレートのライブラリ内に含まれる分子識別子配列に付加および/または連結および/または接続する任意のステップの前および/またはその間に、多量体バーコード化試薬を「多量体バーコード化試薬結合ステップ」によって、(例えば、1つ以上の循環微粒子を含む試料内または試料からの)当該循環微粒子(複数可)内あるいはその上に含まれる1つ以上の循環微粒子および/または分子に結合することができる。任意選択的に、当該多量体バーコード化試薬は、1つ以上のカップリング配列および/またはアダプター配列(カップリング分子内のカップリング配列等)に相補的である1つ以上の配列(例えば、それらの構成バーコード化オリゴヌクレオチド内に含まれる)を含み得、ここで、当該カップリング配列は、最初に当該循環微粒子(複数可)内の標的生体分子(標的核酸等)に付加され、次に、当該多量体バーコード化試薬が、当該カップリング配列内の相補的配列にアニールされる。任意選択的に、任意の「多量体バーコード化試薬結合ステップ」(1つ以上の循環微粒子および/または当該循環微粒子内あるいはその上に含まれる分子内のカップリング配列に多量体バーコード化試薬をアニールする任意のプロセス等)は、バーコード配列を標的生体分子に付加する後続のプロセス(本明細書に記載の任意のプロセス等)に先行し得る。任意選択的に、任意の「多量体バーコード化試薬結合ステップ」は、その後の任意の解離プロセスに先行することができ、ここで、当該解離プロセスは、熱変性(すなわち、二本鎖融解)ステップ、および/または本明細書に記載される任意の他のタイプの解離プロセスを介して、解離プロセスでアニールされるバーコード分子からバーコード化オリゴヌクレオチドを解離することを含み、任意選択的に、その後、任意のかかる解離プロセスの後に、バーコード配列を付加する任意のプロセスまたは方法(例えば、アニールプロセスを介したバーコード配列および/またはバーコード化オリゴヌクレオチドの付加)がさらに続くことができる。
【0674】
任意選択的に、バーコード配列(バーコード化オリゴヌクレオチドの形態で)を標的核酸分子に付加および/または連結および/または接続する任意のステップ(任意の「クロスバーコード化反応」プロセスおよび/またはステップ等)の前および/またはその間に、バーコード化オリゴヌクレオチドは、それらが解離プロセスにおいて、例えば、熱変性(すなわち、二本鎖融解)ステップを介してアニールされるバーコード分子から解離され得る。任意選択的に、かかる解離プロセスは、少なくとも1秒の長さ、少なくとも5秒の長さ、少なくとも10秒の長さ、少なくとも15秒の長さ、少なくとも20秒の長さ、少なくとも30秒の長さ、少なくとも45秒の長さ、少なくとも60秒の長さ、少なくとも90秒の長さ、少なくとも2分の長さ、少なくとも3分の長さ、少なくとも5分の長さ、または少なくとも10分の長さであり得る。任意選択的に、かかる解離プロセスは、少なくとも摂氏45度、少なくとも摂氏50度、少なくとも摂氏55度、少なくとも摂氏60度、少なくとも摂氏65度、少なくとも摂氏70度、または少なくとも摂氏70度等の任意の温度で行うことができる。任意選択的に、かかる解離プロセスは、DMSOおよび/またはベタイン等の核酸変性剤の存在下で行うことができ、ここで、任意選択的に、当該核酸変性剤は少なくとも5重量%もしくは体積%、少なくとも10重量%もしくは体積%、少なくとも15重量%もしくは体積%、少なくとも20重量%もしくは体積%、少なくとも25重量%もしくは体積%、少なくとも30重量%もしくは体積%、少なくとも35重量%もしくは体積%、少なくとも40重量%もしくは体積%、または少なくとも50重量%もしくは体積%である。任意選択的に、かかる解離プロセスおよび/または熱変性ステップの直後に、アニールプロセスが続くことができ、ここで、バーコード化オリゴヌクレオチドが標的核酸にアニールされ、任意選択的に、当該アニールプロセスは、溶液の温度を当該アニールを助長する温度に下げるプロセスを含む。任意選択的に、任意のかかる解離プロセスおよび/またはアニールステップは、高粘度溶液(本明細書に記載の任意の高粘度溶液等)で行うことができる。
【0675】
任意選択的に、バーコード配列(例えば、多量体バーコード化試薬内に含まれるバーコード化オリゴヌクレオチドの形態等のバーコード化オリゴヌクレオチドの形態で)を標的核酸分子に付加および/または連結および/または接続する任意のステップの前および/またはその間および/またはその後に、かつ/あるいはプロテイナーゼ消化の任意のステップおよび/または架橋反転の任意のステップ(例えば、ホルムアルデヒド架橋の反転)、および/またはバーコード化標的核酸分子を精製する任意のステップの前および/またはその間および/またはその後に、2つ以上の異なる試料(2人以上の異なる患者からの試料等)からの、かつ/またはそれらに含まれる、かつ/またはそれらに由来するバーコード化核酸分子は、「プールされた試料溶液」に組み合わせる(すなわち、一緒にマージする)ことができる。任意選択的に、任意のかかるプールされた試料溶液は、ハイスループット配列決定のためにさらに調製および/または修飾および/または増幅される等、任意の方法でさらに処理され得、かつ/または5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等の修飾ヌクレオチドの濃縮を含む任意の濃縮プロセス等の任意の濃縮ステップで処理され得る(例えば、当該濃縮が、他の修飾または非修飾塩基と比較して、ゲノムDNAの断片中の5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンに特異的または優先的に結合する濃縮プローブを使用して行われる)。任意選択的に、1つ以上の配列決定プロセスを行って、当該濃縮(すなわち、濃縮プローブ結合)バーコード化核酸および/または結果として得られる修飾ヌクレオチド枯渇(すなわち、非濃縮プローブ結合)バーコード化核酸を分析することができる。
【0676】
この方法は、配列決定のために2つ以上の独立した核酸試料を調製することを含み得、各核酸試料は、多量体バーコード化試薬の異なるライブラリ(または多量体バーコード分子の異なるライブラリ)を使用して調製され、多量体バーコード化試薬(または多量体バーコード分子)の各ライブラリのバーコード領域は、多量体バーコード化試薬(または多量体バーコード分子)の他のライブラリのバーコード領域とは異なる配列を含む。配列決定のために各試料を別個に調製した後、異なる試料から調製されたバーコード化標的核酸分子がプールされ、一緒に配列決定され得る。バーコード化標的核酸分子毎に生成された配列リードを使用して、その調製に使用された多量体バーコード化試薬(または多量体バーコード分子)のライブラリを特定し、それにより、それが調製された核酸試料を特定することができる。
【0677】
配列決定のための核酸試料を調製する任意の方法において、標的核酸分子は、核酸試料内の特定の濃度で、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、少なくとも1ピコモル、少なくとも100フェムトモル、少なくとも10フェムトモル、または少なくとも1フェムトモルの濃度で存在し得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。好ましくは、濃度は10ピコモル~1ナノモルである。
【0678】
配列決定のための核酸試料を調製する任意の方法において、多量体バーコード化試薬は、核酸試料内の特定の濃度で、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、少なくとも1ピコモル、少なくとも100フェムトモル、少なくとも10フェムトモル、または少なくとも1フェムトモルの濃度で存在し得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。好ましくは、濃度は、1ピコモル~100ピコモルである。
【0679】
配列決定のための核酸試料を調製する任意の方法において、多量体バーコード分子は、核酸試料内の特定の濃度で、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、少なくとも1ピコモル、少なくとも100フェムトモル、少なくとも10フェムトモル、または少なくとも1フェムトモルの濃度で存在し得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。好ましくは、濃度は、1ピコモル~100ピコモルである。
【0680】
配列決定のための核酸試料を調製する任意の方法において、バーコード化オリゴヌクレオチドは、核酸試料内の特定の濃度で、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、少なくとも1ピコモル、少なくとも100フェムトモル、少なくとも10フェムトモル、または少なくとも1フェムトモルの濃度で存在し得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。好ましくは、濃度は100ピコモル~100ナノモルである。
【0681】
21.多量体バーコード化試薬を使用して配列決定するための核酸試料を調製する方法
本発明は、配列決定のための核酸試料を調製する方法を提供し、この方法は、本明細書で定義されるような多量体バーコード化試薬と核酸試料を接触させるステップと、第1のバーコード化オリゴヌクレオチドの標的領域を標的核酸の第1の断片にアニールすること、および第2のバーコード化オリゴヌクレオチドの標的領域を標的核酸の第2の断片にアニールするステップと、第1および第2のバーコード化オリゴヌクレオチドを伸長して、第1および第2の異なるバーコード化標的核酸分子を生成するステップと、を含み、ここで、バーコード化標的核酸分子の各々は、テンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0682】
配列決定のための核酸試料を調製する任意の方法において、核酸試料内の核酸分子、および/または多量体バーコード化試薬のいずれかが、溶液体積内の特定の濃度、例えば、少なくとも100ナノモル、少なくとも10ナノモル、少なくとも1ナノモル、少なくとも100ピコモル、少なくとも10ピコモル、または少なくとも1ピコモルの濃度で存在し得る。濃度は、1ピコモル~100ナノモル、10ピコモル~10ナノモル、または100ピコモル~1ナノモルであり得る。代替のより高いまたはより低い濃度も使用され得る。
【0683】
配列決定のための核酸試料を調製する方法は、核酸試料を本明細書で定義される多量体バーコード化試薬のライブラリと接触させることを含み得、ここで、第1の標的核酸の断片にアニールする第1の多量体バーコード化試薬のバーコード化オリゴヌクレオチドおよび第1および第2の異なるバーコード化標的核酸分子が生成され、各バーコード化標的核酸分子は、テンプレートとして第1の標的核酸から合成された少なくとも1つのヌクレオチドを含み、第2の標的核酸の断片にアニールする第2の多量体バーコード化試薬のバーコード化オリゴヌクレオチドおよび第1および第2の異なるバーコード化標的核酸分子が生成され、各バーコード化標的核酸分子は、テンプレートとしての第2の標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0684】
この方法では、バーコード化オリゴヌクレオチドは、標的核酸の断片にアニールした後、バーコード化標的核酸分子が生成される前に、核酸試料から単離され得る。任意選択的に、バーコード化オリゴヌクレオチドは、ストレプトアビジン-ビオチン相互作用を介した固体支持体上での捕捉によって単離される。
【0685】
加えてまたはあるいは、バーコード化標的核酸分子は、核酸試料から単離され得る。任意選択的に、バーコード化標的核酸分子は、ストレプトアビジン-ビオチン相互作用による固体支持体上での捕捉によって単離される。
【0686】
バーコード化オリゴヌクレオチドを伸長するステップは、バーコード化オリゴヌクレオチドがバーコード分子にアニールされている間に行われ得る。
【0687】
図3は、配列決定のための核酸試料を調製する方法を示し、本明細書で定義される多量体バーコード化試薬(例えば、
図1に示される)を使用して、核酸試料中の2つ以上の核酸部分配列を標識および伸長する。この方法では、少なくとも第1の(A1、B1、C1、およびG1)ならびに第2の(A2、B2、C2、およびG2)バーコード化オリゴヌクレオチドを組み込んだ多量体バーコード化試薬が合成され、これらは各々バーコード領域(B1およびB2)ならびに標的領域(それぞれG1およびG2)の両方を含む。
【0688】
標的核酸を含む核酸試料は、多量体バーコード化試薬と接触または混合され、2つ以上のバーコード化オリゴヌクレオチドの標的領域(G1およびG2)は、標的核酸(H1およびH2)内の2つ以上の対応する部分配列にアニールすることができる。アニールステップに続いて、第1および第2のバーコード化オリゴヌクレオチドは、(例えば、ポリメラーゼのプライマーとして機能する標的領域とともに)標的核酸の配列に伸長され、その結果、部分配列の少なくとも1つのヌクレオチドがバーコード化オリゴヌクレオチドの各々の伸長された3’末端に組み込まれる。この方法は、バーコード化標的核酸分子を作成し、標的核酸からの2つ以上の部分配列がバーコード化のオリゴヌクレオチドによって標識される。
【0689】
あるいは、この方法は、バーコード化オリゴヌクレオチドの標的領域を標的核酸の部分配列にアニールする前に、バーコード化オリゴヌクレオチドをバーコード分子から解離するステップをさらに含み得る。
【0690】
図4は、配列決定のための核酸試料を調製する方法を示し、本明細書に記載の多量体バーコード化試薬(例えば、
図1に示される)を使用して、核酸試料中の2つ以上の核酸部分配列を標識および伸長する。但し、多量体バーコード化試薬からのバーコード化オリゴヌクレオチドは、標的核酸配列へのアニール(および伸長)の前にバーコード分子から解離される。この方法では、少なくとも第1の(A1、B1、C1、およびG1)ならびに第2の(A2、B2、C2、およびG2)バーコード化オリゴヌクレオチドを組み込んだ多量体バーコード化試薬が合成され、これらは各々バーコード領域(B1およびB2)ならびに標的核酸(H1およびH2)内の部分配列にアニールすることができる標的領域(G1およびG2)を含む。
図4の方法は、参照により本明細書に組み込まれるPCT/GB2017/053820に詳細に記載されている。
【0691】
ユニバーサルプライミング配列がバーコード化標的核酸分子に付加され得る。この配列は、1つのフォワードプライマーおよび1つのリバースプライマーを使用して、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、または少なくとも109個の異なるバーコード化標的核酸分子のその後の増幅を可能にし得る。
【0692】
本明細書で定義されるように、核酸試料を多量体バーコード化試薬または多量体バーコード化試薬のライブラリと接触させる前に、カップリング配列を、核酸の2つ以上の標的核酸試料の5’末端または3’末端に追加することができる。この方法では、標的領域は、カップリング配列に相補的な配列を含み得る。カップリング配列は、ホモポリマーの3’テール(例えば、ポリ(A)テール)を含み得る。カップリング配列は、末端トランスフェラーゼ酵素によって追加され得る。カップリング配列がポリ(A)テールを含む方法では、標的領域は、ポリ(T)配列を含み得る。かかるカップリング配列は、カップリング配列を加える前に、そこに含まれる核酸を変性させるために、核酸試料の高温インキュベーションの後に加えることができる。
【0693】
あるいは、カップリング配列は、標的核酸試料を制限酵素で消化することによって加えることができ、その場合、カップリング配列は、制限酵素認識配列の1つ以上のヌクレオチドから構成され得る。この場合、カップリング配列は、少なくとも部分的に二本鎖であり得、そして、平滑末端二本鎖DNA配列、または1ヌクレオチド以上の5’オーバーハング領域を有する配列、または1つ以上のヌクレオチドの’3オーバーハング領域を有する配列を含み得る。これらの場合、多量体バーコード化試薬の標的領域は、二本鎖かつ平滑末端である(したがって、平滑末端制限消化産物にライゲートすることができる)配列を含み得る。または、標的領域は、1つ以上のヌクレオチドの5’または3’オーバーハング配列を含み得、それらを、当該制限消化産物に対して凝集性にする(したがって、それらとアニールし、かつそれらにライゲートすることができる)。
【0694】
この方法は、配列決定のために2つ以上の独立した核酸試料を調製することを含み得、各核酸試料は、多量体バーコード化試薬の異なるライブラリ(または多量体バーコード分子の異なるライブラリ)を使用して調製され、多量体バーコード化試薬(または多量体バーコード分子)の各ライブラリのバーコード領域は、多量体バーコード化試薬(または多量体バーコード分子)の他のライブラリのバーコード領域とは異なる配列を含む。配列決定のために各試料を別個に調製した後、異なる試料から調製されたバーコード化標的核酸分子がプールされ、一緒に配列決定され得る。バーコード化標的核酸分子毎に生成された配列リードを使用して、その調製に使用された多量体バーコード化試薬(または多量体バーコード分子)のライブラリを特定し、それにより、それが調製された核酸試料を特定することができる。
【0695】
本発明は、配列決定のための核酸試料を調製する方法を提供し、この方法は、以下のステップ(a)核酸試料を多量体バーコード化試薬と接触させることであって、各バーコード化オリゴヌクレオチドは5’から3’方向に、標的領域とバーコード領域、ならびに第1と第2の標的プライマーを含む、接触させることと、(b)第1のバーコード化オリゴヌクレオチドの標的領域を標的核酸の第1の部分配列にアニールすること、および第2のバーコード化オリゴヌクレオチドの標的領域を標的核酸の第2の部分配列にアニールすることと、(c)第1の標的プライマーを標的核酸の第3の部分配列にアニールすることであって、第3の部分配列が第1の部分配列の3’である、アニールすること、および第2の標的プライマーを標的核酸の第4の部分配列にアニールすることであって、第4の部分配列が第2の部分配列の3’である、アニールすることと、(d)第1の部分配列に到達するまで標的核酸をテンプレートとして使用して第1の標的プライマーを伸長して第1の伸長標的プライマーを生成すること、および第2の部分配列に到達するまで標的核酸をテンプレートとして使用して第2の標的プライマーを伸長して第2の伸長標的プライマーを生成することと、(e)第1の伸長標的プライマーの3’末端を第1のバーコード化オリゴヌクレオチドの5’末端にライゲートして第1のバーコード化標的核酸分子を生成すること、および第2の伸長標的プライマーの3’末端を第2のバーコード化オリゴヌクレオチドの5’末端にライゲートして第2のバーコード化標的核酸分子を生成することと、を含み、第1および第2のバーコード化標的核酸分子が異なり、バーコード化標的核酸分子の各々は、テンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0696】
この方法では、ステップ(b)および(c)を同時に行うことができる。
【0697】
22.多量体バーコード化試薬およびアダプターオリゴヌクレオチドを使用して配列決定するための核酸試料を調製する方法
以下に提供される方法は、本明細書で定義されるキットのいずれかを用いて行われ得る。
【0698】
本発明はさらに、配列決定のための核酸試料を調製する方法を提供し、この方法は、以下のステップ(a)核酸試料を、本明細書で定義される第1および第2のアダプターオリゴヌクレオチドと接触させることと、(b)第1のアダプターオリゴヌクレオチドを標的核酸の第1の断片にアニールまたはライゲートすること、および第2のアダプターオリゴヌクレオチドを標的核酸の第2の断片にアニールまたはライゲートすることと、(c)核酸試料を本明細書で定義される多量体バーコード化試薬と接触させることと、(d)第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることと、(e)第1のバーコード化オリゴヌクレオチドの3’末端を第1のアダプターオリゴヌクレオチドの5’末端にライゲートして第1のバーコード化アダプターオリゴヌクレオチドを生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2のアダプターオリゴヌクレオチドの5’末端にライゲートして第2のバーコード化アダプターオリゴヌクレオチドを生成することと、を含む。
【0699】
本発明はさらに、配列決定のための核酸試料を調製する方法を提供し、この方法は、以下のステップ(a)核酸試料を、本明細書で定義される第1および第2のアダプターオリゴヌクレオチドと接触させることと、(b)第1のアダプターオリゴヌクレオチドを標的核酸の第1の断片にライゲートすること、および第2のアダプターオリゴヌクレオチドを標的核酸の第2の断片にライゲートすることと、(c)核酸試料を本明細書で定義される多量体バーコード化試薬と接触させることと、(d)第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることと、(e)第1のバーコード分子のバーコード領域をテンプレートとして使用して第1のアダプターオリゴヌクレオチドを伸長して第1のバーコード化標的核酸分子を生成すること、および第2のバーコード分子のバーコード領域をテンプレートとして使用して第2のアダプターオリゴヌクレオチドを伸長して第2のバーコード化標的核酸分子を生成することと、を含み、ここで、第1のバーコード化標的核酸分子が第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化標的核酸分子が第2のバーコード分子のバーコード領域に相補的な配列を含む。
【0700】
本発明はさらに、配列決定のための核酸試料を調製する方法を提供し、この方法は、以下のステップ(a)核酸試料を、本明細書で定義される第1および第2のアダプターオリゴヌクレオチドと接触させることと、(b)第1のアダプターオリゴヌクレオチドの標的領域を標的核酸の第1の断片にアニールすること、および第2のアダプターオリゴヌクレオチドの標的領域を標的核酸の第2の断片にアニールすることと、(c)核酸試料を本明細書で定義される多量体バーコード化試薬と接触させることと、(d)第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることと、(e)第1のバーコード化オリゴヌクレオチドの3’末端を第1のアダプターオリゴヌクレオチドの5’末端にライゲートして第1のバーコード化アダプターオリゴヌクレオチドを生成すること、および第2のバーコード化オリゴヌクレオチドの3’末端を第2のアダプターオリゴヌクレオチドの5’末端にライゲートして第2のバーコード化アダプターオリゴヌクレオチドを生成することと、を含む。
【0701】
この方法では、第1および第2のバーコード化アダプターオリゴヌクレオチドを伸長して、各々がテンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む第1および第2の異なるバーコード化標的核酸分子を生成し得る。
【0702】
あるいは、第1および第2のアダプターオリゴヌクレオチドを伸長して、各々がテンプレートとして標的核酸から合成された少なくとも1つのヌクレオチドを含む第1および第2の異なる標的核酸分子を生成し得る。この方法では、ステップ(f)は、第1のバーコード化標的核酸分子(すなわち、伸長された第1のアダプターオリゴヌクレオチドにライゲートされた第1のバーコード化オリゴヌクレオチド)および第2のバーコード化標的核酸分子(すなわち、伸長された第2のアダプターオリゴヌクレオチドにライゲートされた第2のバーコード化オリゴヌクレオチド)を生成する。
【0703】
アダプターオリゴヌクレオチドを伸長するステップは、ステップ(c)の前、ステップ(d)の前、および/またはステップ(e)の前に行われ得、第1および第2のアダプターオリゴヌクレオチドは、ステップ(e)の後まで第1および第2のバーコード分子にアニールされたままであり得る。
【0704】
この方法は、本明細書で定義される多量体バーコード化試薬のライブラリおよび多量体バーコード化試薬の各々について本明細書で定義されるアダプターオリゴヌクレオチドを使用して行われ得る。好ましくは、第1の標的核酸の断片にアニールする第1の多量体バーコード化試薬のバーコード化アダプターオリゴヌクレオチドおよび第1および第2の異なるバーコード化標的核酸分子が生成され、各バーコード化標的核酸分子は、テンプレートとして第1の標的核酸から合成された少なくとも1つのヌクレオチドを含み、第2の標的核酸の断片にアニールする第2の多量体バーコード化試薬のバーコード化アダプターオリゴヌクレオチドおよび第1および第2の異なるバーコード化標的核酸分子が生成され、各バーコード化標的核酸分子は、テンプレートとしての第2の標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0705】
この方法は、本明細書で定義される多量体バーコード化試薬のライブラリおよび多量体バーコード化試薬の各々について本明細書で定義されるアダプターオリゴヌクレオチドを使用して行われ得る。好ましくは、第1の標的核酸の断片にアニールする第1の多量体バーコード化試薬のアダプターオリゴヌクレオチドおよび第1および第2の異なる標的核酸分子が生成され、各標的核酸分子は、テンプレートとして第1の標的核酸から合成された少なくとも1つのヌクレオチドを含み、第2の標的核酸の断片にアニールする第2の多量体バーコード化試薬のアダプターオリゴヌクレオチドおよび第1および第2の異なる標的核酸分子が生成され、各標的核酸分子は、テンプレートとしての第2の標的核酸から合成された少なくとも1つのヌクレオチドを含む。
【0706】
バーコード化アダプターオリゴヌクレオチドは、標的核酸の断片にアニールした後、バーコード化標的核酸分子が生成される前に、核酸試料から単離され得る。任意選択的に、バーコード化アダプターオリゴヌクレオチドは、ストレプトアビジン-ビオチン相互作用を介した固体支持体上での捕捉によって単離される。
【0707】
バーコード化標的核酸分子は、核酸試料から単離され得る。任意選択的に、バーコード化標的核酸分子は、ストレプトアビジン-ビオチン相互作用による固体支持体上での捕捉によって単離される。
【0708】
図5は、多量体バーコード化試薬を使用して配列決定するための核酸試料を調製する方法を示している。この方法では、第1(C1およびG1)ならびに第2(C2およびG2)のアダプターオリゴヌクレオチドが、核酸試料中の標的核酸にアニールされ、次いで、プライマー伸長反応に使用される。各アダプターオリゴヌクレオチドは、バーコード分子(F1およびF2)の5’アダプター領域に相補的であり、したがってアニールすることができるアダプター領域(C1およびC2)で構成されている。各アダプターオリゴヌクレオチドはまた、標的領域(G1およびG2)から構成され、これは、バーコード化オリゴヌクレオチドを標的核酸にアニールするために使用され得、次いで、プライマー伸長反応またはポリメラーゼ連鎖反応のためのプライマーとして使用され得る。これらのアダプターオリゴヌクレオチドは、5’末端リン酸基を含むように合成され得る。
【0709】
次に、各々が標的核酸からの配列を含むように伸長されたアダプターオリゴヌクレオチドを、第1(D1、E1、およびF1)と第2(D2、E2、およびF2)のバーコード分子、ならびに第1(A1およびB1)と第2(A2およびB2)のバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬と接触させる。これらは各々バーコード領域(B1およびB2)、ならびに5’領域(A1およびA2)を含む。第1および第2のバーコード分子は各々、バーコード領域(E1およびE2)、アダプター領域(F1およびF2)、および3’領域(D1およびD2)を含み、この実施形態では、結合核酸配列(S)によって一緒に連結されている。
【0710】
プライマー伸長核酸試料を多量体バーコード化試薬と接触させた後、各アダプターオリゴヌクレオチドの5’アダプター領域(C1およびC2)は、各バーコード化オリゴヌクレオチドの3’末端(J1およびJ2)に隣接する「ライゲーション接合部」にアニールすることができる。次に、伸長アダプターオリゴヌクレオチドの5’末端を多量体バーコード化試薬内のバーコード化オリゴヌクレオチドの3’末端にライゲートし、ライゲーション接合部が以前に配置されていたライゲーション塩基対(K1およびK2)を作成する。その後、溶液をさらに処理または増幅して、配列決定反応に使用することができる。
【0711】
この方法は、
図3および4に示す方法と同様に、バーコード化標的核酸分子を作成する。この方法では、核酸試料からの2つ以上の断片がバーコード化のオリゴヌクレオチドで標識される。この方法では、標的領域を標的核酸の断片にアニールするステップ、またはポリメラーゼを使用してアニールされた標的領域を伸長するステップのために、多量体バーコード化試薬が存在する必要はない。この特徴は、例えば、多数の標的配列が対象であり、標的領域が、多量体バーコード化試薬によって分子的に制約されていない場合、標的核酸により迅速にハイブリダイズすることができる特定の用途において利点を保持し得る。
【0712】
23.多量体バーコード化試薬、アダプターオリゴヌクレオチドおよび伸長プライマーを使用して配列決定するための核酸試料を調製する方法
多量体バーコード化試薬、アダプターオリゴヌクレオチドおよび伸長プライマーを使用して配列決定するために核酸試料を調製する方法は、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
【0713】
24.多量体バーコード化試薬、アダプターオリゴヌクレオチドおよび標的プライマーを使用して配列決定するための核酸試料を調製する方法
多量体バーコード化試薬、アダプターオリゴヌクレオチドおよび標的プライマーを使用して配列決定するための核酸試料を調製する方法は、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
図6は、この方法が行われ得る1つの方法を示している。この方法では、標的核酸はゲノムDNAである。標的核酸は、mRNA分子等の別のタイプの核酸例えば、RNA分子であり得ることが理解されよう。
【0714】
25.多量体バーコード化試薬および標的プライマーを使用して配列決定するための核酸試料を調製する方法
多量体バーコード化試薬および標的プライマーを使用して配列決定するための核酸試料を調製する方法は、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
【0715】
26.多量体バーコード化試薬の合成方法
本発明はさらに、標的核酸を標識するための多量体バーコード化試薬を合成する方法を提供し、(a)第1および第2のバーコード分子を第1および第2の伸長プライマーと接触させることであって、バーコード分子の各々が、5’から3’方向に、アダプター領域、バーコード領域、およびプライミング領域を含む一本鎖核酸を含む、接触させることと、(b)第1の伸長プライマーを第1のバーコード分子のプライミング領域にアニールすること、および第2の伸長プライマーを第2のバーコード分子のプライミング領域にアニールすることと、(c)第1の伸長プライマーを伸長することにより第1のバーコード化伸長産物を合成すること、および第2の伸長プライマーを伸長することにより第2のバーコード化伸長産物を合成することと、を含み、ここで、第1のバーコード化伸長産物は、第1のバーコード分子のバーコード領域に相補的な配列を含み、第2のバーコード化伸長産物は、第2のバーコード分子のバーコード領域に相補的な配列を含み、第1のバーコード化伸長産物は、第1のバーコード分子のアダプター領域に相補的な配列を含まず、第2のバーコード化伸長産物は、第2のバーコード分子のアダプター領域に相補的な配列を含まず、第1および第2のバーコード分子は、一緒に連結されている。
【0716】
この方法は、第1および第2のバーコード化伸長産物を合成するステップの前に、(a)第1および第2のバーコード分子を第1および第2のブロッキングプライマーと接触させることと、(b)第1のブロッキングプライマーを第1のバーコード分子のアダプター領域にアニールすること、および、第2のブロッキングプライマーを第2のバーコード分子のアダプター領域にアニールすることと、をさらに含み得、ここで、この方法は、バーコード化伸長産物を合成するステップの後に、バーコード分子からブロッキングプライマーを解離するステップをさらに含む。
【0717】
この方法では、伸長ステップ、または伸長産物の合成後に行われる第2の伸長ステップが行われ得、ここで、4つの標準的なデオキシリボヌクレオチドのうちの1つ以上が伸長反応から除外され、その結果、第2の伸長ステップが終了する。アダプター領域配列の前の位置で、その位置は、除外されたデオキシリボヌクレオチドに相補的なヌクレオチドを含む。この伸長ステップは、3’から5’のエキソヌクレアーゼ活性を欠くポリメラーゼを用いて行うことができる。
【0718】
バーコード分子は、本明細書で定義される一本鎖多量体バーコード分子によって提供され得る。
【0719】
バーコード分子は、本明細書で定義された方法のいずれかによって合成することができる。バーコード領域は、バーコード分子の各々を一意的に特定し得る。バーコード分子は、核酸分子上で連結され得る。バーコード分子は、ライゲーション反応で一緒に連結することができる。バーコード分子は、バーコード分子を固体支持体に付着させることを含むさらなるステップによって一緒に連結され得る。
【0720】
第1および第2のバーコード分子は、上記で定義されたステップ(a)の前に本明細書で定義された方法のいずれかによって二本鎖多量体バーコード分子として組み立てられ得る(すなわち、第1および第2のバーコード分子を第1および第2の伸長プライマーと接触させる)。二本鎖多量体バーコード分子を解離して、上記で定義されたステップ(a)で使用するための一本鎖多量体バーコード分子を生成することができる(すなわち、第1および第2のバーコード分子を第1および第2の伸長プライマーと接触させる)。
【0721】
この方法は、以下のステップ(a)第1のアダプターオリゴヌクレオチドのアダプター領域を第1のバーコード分子のアダプター領域にアニールすること、および第2のアダプターオリゴヌクレオチドのアダプター領域を第2のバーコード分子のアダプター領域にアニールすることであって、第1のアダプターオリゴヌクレオチドは、標的核酸の第1の部分配列にアニールすることができる標的領域をさらに含み、第2のアダプターオリゴヌクレオチドは、標的核酸の第2の部分配列にアニールすることができる標的領域をさらに含む、アニールすることと、(b)第1のバーコード化伸長産物の3’末端を第1のアダプターオリゴヌクレオチドの5’末端にライゲートして第1のバーコード化オリゴヌクレオチドを生成すること、および第2のバーコード化伸長産物の3’末端を第2のアダプターオリゴヌクレオチドの5’末端にライゲートして第2のバーコード化オリゴヌクレオチドを生成することと、をさらに含み得る。任意選択的に、アニールステップ(a)は、第1および第2のバーコード化伸長産物を合成するステップの前に行われ得、第1および第2のバーコード化伸長産物を合成するステップは、ライゲーションステップ(b)を行うリガーゼ酵素の存在下で行われる。リガーゼは熱安定性リガーゼであり得る。伸長およびライゲーション反応は、摂氏37度以上、摂氏45度以上、または摂氏50度以上で進行し得る。
【0722】
標的領域は、異なる配列を含み得る。各標的領域は、核酸の試料内の標的核酸の単一の部分配列のみにアニールすることができる配列を含み得る。各標的領域は、標的領域が標的核酸の1つより多くの部分配列にアニールすることを可能にするために、1つ以上のランダム配列または1つ以上の縮重配列を含み得る。各標的領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各標的領域は、少なくとも5つのヌクレオチドを含む。各標的領域は、5~100個のヌクレオチド、5~10個のヌクレオチド、10~20個のヌクレオチド、20~30個のヌクレオチド、30~50個のヌクレオチド、50~100個のヌクレオチド、10~90個のヌクレオチド、20~80個のヌクレオチド、30~70個のヌクレオチド、または50~60個のヌクレオチドを含み得る。好ましくは、各標的領域は、30~70個のヌクレオチドを含む。好ましくは、各標的領域はデオキシリボヌクレオチドを含み、任意選択的に、標的領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各標的領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0723】
各アダプターオリゴヌクレオチドのアダプター領域は、定常領域を含み得る。任意選択的に、単一の多量体バーコード化試薬にアニールするアダプターオリゴヌクレオチドの全てのアダプター領域は実質的に同一である。アダプター領域は、少なくとも4、少なくとも5、少なくとも6、少なくとも8、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、少なくとも100、または少なくとも250個のヌクレオチドを含み得る。好ましくは、アダプター領域は、少なくとも4つのヌクレオチドを含む。好ましくは、各アダプター領域はデオキシリボヌクレオチドを含み、任意選択的に、アダプター領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各アダプター領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0724】
アダプターオリゴヌクレオチドを含む方法のいずれかについて、アダプターオリゴヌクレオチドの3’末端は、例えば、標的領域の3’末端ヌクレオチドに、可逆的ターミネーター部分または可逆的ターミネーターヌクレオチド(例えば、3’-O-ブロックヌクレオチド)を含み得る。伸長ならびに/または伸長反応およびライゲーション反応で使用される場合、これらのアダプターオリゴヌクレオチドの3’末端は、伸長イベントをプライミングすることを妨げられ得る。これにより、バーコード化オリゴヌクレオチドの製造中のミスプライミングまたはその他の偽の伸長イベントを最小限に抑えることができる。組み立てられた多量体バーコード化試薬を使用する前に、可逆的ターミネーターのターミネーター部分を化学的または他の手段によって除去することができ、したがって、標的領域を、それがアニールされる標的核酸テンプレートに沿って伸長することができる。
【0725】
同様に、アダプターオリゴヌクレオチドを含む方法のいずれかについて、標的領域内の1つ以上の配列に相補的な1つ以上のブロッキングオリゴヌクレオチドを、伸長ならびに/または伸長反応およびライゲーション反応中に使用することができる。ブロッキングオリゴヌクレオチドは、それらがポリメラーゼによって伸長され得ないように、それらの3’および/または5’末端にターミネーターおよび/または他の部分を含み得る。ブロッキングオリゴヌクレオチドは、それらが1つ以上の標的領域に完全にまたは部分的に相補的な配列にアニールし、伸長ならびに/または伸長反応およびライゲーション反応の前に当該標的領域にアニールされるように設計され得る。ブロッキングプライマーの使用は、標的領域が、かかるアニールが望まれない溶液内の配列(例えば、バーコード分子自体内の配列特徴)へのアニール、および潜在的にそれに沿ったミスプライミングを防ぐ可能性がある。ブロッキングオリゴヌクレオチドは、特定のアニールおよび/または融解温度を達成するように設計することができる。次に、組み立てられた多量体バーコード化試薬を使用する前に、ブロッキングオリゴヌクレオチドを、例えば、熱変性、次にサイズ選択的クリーンアップ、または他の手段によって除去することができる。ブロッキングオリゴヌクレオチドの除去は、標的領域が、それがアニールされる標的核酸テンプレートに沿って伸長されることを可能にし得る。
【0726】
この方法は、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75または少なくとも100のバーコード分子を含む多量体バーコード化試薬を合成することを含み得、ここで、(a)各バーコード分子は、本明細書で定義されている通りであり、(b)バーコード化伸長産物は、本明細書で定義された任意の方法に従って、各バーコード分子から合成され、かつ、任意選択的に、(c)アダプターオリゴヌクレオチドをバーコード化伸長産物の各々にライゲートして、本明細書で定義される方法のいずれかに従ってバーコード化オリゴヌクレオチドを生成する。
【0727】
本発明はさらに、多量体バーコード化試薬のライブラリを合成する方法を提供し、この方法は、本明細書で定義される方法の任意のステップを繰り返して、2つ以上の多量体バーコード化試薬を合成することを含む。任意選択的に、この方法は、本明細書で定義されるように、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、または少なくとも1010個の多量体バーコード化試薬のライブラリを合成することを含む。好ましくは、ライブラリは、本明細書で定義される少なくとも5個の多量体バーコード化試薬を含む。好ましくは、多量体バーコード化試薬の各々のバーコード領域は、他の多量体バーコード化試薬のバーコード領域とは異なり得る。
【0728】
図8は、標的核酸を標識するための多量体バーコード化試薬を合成する方法を示している。この方法では、各々バーコード領域(E1およびE2)を含む核酸配列を含み、かつ結合核酸配列(S)によって連結されている第1(D1、E1、およびF1)および第2(D2、E2、およびF2)のバーコード分子は、一本鎖形態に変性する。これらの一本鎖バーコード分子に対して、第1および第2の伸長プライマー(A1およびA2)が第1および第2のバーコード分子(D1およびD2)の3’領域にアニールされ、かつ第1および第2のブロッキングプライマー(R1およびR2)が第1および第2のバーコード分子の5’アダプター領域(F1およびF2)にアニールされる。これらのブロッキングプライマー(R1およびR2)は、ポリメラーゼのプライミング部位として機能できないように3’末端を修飾することができる。
【0729】
その後、ポリメラーゼを使用してプライマー伸長反応を行い、ここで、伸長プライマーが伸長されて、バーコード分子(E1およびE2)のバーコード領域のコピー(B1およびB2)を作製する。このプライマー伸長反応は、例えば、鎖置換または5’-3’エキソヌクレアーゼ活性を欠くポリメラーゼの使用を通じて、伸長産物がブロッキングプライマー配列に直接隣接して終結するように行われる。次に、ブロッキングプライマー(R1およびR2)は、例えば、高温変性によって除去される。
【0730】
したがって、この方法は、一本鎖アダプター領域(F1およびF2)に隣接する第1および第2のライゲーション接合部(J1およびJ2)を含む多量体バーコード化試薬を作成する。この多量体バーコード化試薬は、
図5に示す方法で使用できる。
【0731】
この方法は、プライマー伸長ステップによって作成された第1および第2のバーコード化オリゴヌクレオチドの3’末端(B1およびB2の3’末端)を第1(C1およびG1)および第2(C2およびG2)のアダプターオリゴヌクレオチドにライゲートするステップをさらに含み得る。ここで、各アダプターオリゴヌクレオチドは、バーコード分子(F1およびF2)のアダプター領域に相補的であり、したがってそれに対してアニールすることができるアダプター領域(C1およびC2)を含む。アダプターオリゴヌクレオチドは、5’末端リン酸基を含むように合成され得る。
【0732】
各アダプターオリゴヌクレオチドはまた、標的領域(G1およびG2)を含み得、これは、バーコード化オリゴヌクレオチドを標的核酸にアニールするために使用され得、そして別個にまたはその後、プライマー伸長反応またはポリメラーゼ連鎖反応のためのプライマーとして使用され得る。第1および第2のバーコード化オリゴヌクレオチドをアダプターオリゴヌクレオチドにライゲートするステップは、
図3および/または
図4に示される方法で使用され得る、
図1に示されるような多量体バーコード化試薬を生成する。
【0733】
図9は、標的核酸を標識するための多量体バーコード化試薬(
図1に示す)を合成する方法を示している。この方法では、各々バーコード領域(E1およびE2)を含む核酸配列を含み、かつ結合核酸配列(S)によって連結されている第1(D1、E1、およびF1)および第2(D2、E2、およびF2)のバーコード分子は、一本鎖形態に変性する。これらの一本鎖バーコード分子に対して、第1および第2の伸長プライマー(A1およびA2)が第1および第2のバーコード分子(D1およびD2)の3’領域にアニールされ、かつ第1(C1およびC2)ならびに第2(C2およびG2)のアダプターオリゴヌクレオチドのアダプター領域(C1およびG1)は、第1および第2のバーコード分子の5’アダプター領域(F1およびF2)にアニールされる。これらのアダプターオリゴヌクレオチドは、5’末端リン酸基を含むように合成され得る。
【0734】
その後、ポリメラーゼを使用してプライマー伸長反応を行い、ここで、伸長プライマーが伸長されて、バーコード分子(E1およびE2)のバーコード領域のコピー(B1およびB2)を作製する。このプライマー伸長反応は、例えば、鎖置換または5’-3’エキソヌクレアーゼ活性を欠くポリメラーゼの使用を通じて、伸長産物がアダプター領域(C1およびC2)配列に直接隣接して終結するように行われる。
【0735】
次に、リガーゼ酵素を使用して、アダプターオリゴヌクレオチドの5’末端を対応する伸長産物の隣接する3’末端にライゲートする。代替の実施形態において、リガーゼ酵素は、プライマー伸長およびアダプターオリゴヌクレオチドへの結果として得られた産物のライゲーションの両方を同時にもたらす1つの反応においてポリメラーゼ酵素とともに含まれ得る。この方法により、結果として得られたバーコード化オリゴヌクレオチドは、その後、例えば、
図3および/または
図4に示される方法のように、プライマー伸長反応またはポリメラーゼ連鎖反応のためのプライマーとして使用され得る。
【0736】
27.配列決定および/または配列決定データの処理の方法
本発明は、循環微粒子の標的核酸を配列決定する方法を提供し、循環微粒子は、標的核酸の少なくとも2つの断片を含み、この方法は、(a)標的核酸の少なくとも2つの断片のうちの少なくとも2つを連結して、標的核酸の少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0737】
本発明は、循環微粒子のゲノムDNAを配列決定する方法を提供し、ここで、循環微粒子は、ゲノムDNAの少なくとも2つの断片を含み、この方法は、(a)ゲノムDNAの少なくとも2つの断片のうちの少なくとも2つを連結して、ゲノムDNAの少なくとも2つの連結された断片のセットを生成することを含む、配列決定のための試料を調製することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0738】
本発明は、循環微粒子の標的核酸を配列決定する方法を提供し、(a)(単一の)循環微粒子から標的核酸の少なくとも2つの断片を連結して、標的核酸の少なくとも2つの連結された断片のセットを生成することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0739】
本発明は、循環微粒子ゲノムDNAを配列決定する方法を提供し、(a)(単一の)循環微粒子からのゲノムDNAの少なくとも2つの断片を連結して、循環微粒子ゲノムDNAの少なくとも2つの連結された断片のセットを生成することと、(b)セット内の連結された断片の各々を配列決定して、少なくとも2つの(情報的に)連結された配列リードを生成することと、を含む。
【0740】
本発明はさらに、試料を配列決定する方法を提供し、試料は、本明細書で定義されるように、配列決定のための核酸試料を調製する方法のいずれか1つによって調製されている。試料を配列決定する方法は、バーコード化標的核酸分子を単離するステップと、バーコード領域、標的領域、および標的核酸からの少なくとも1つの追加のヌクレオチドを含む各バーコード化標的核酸分子から配列リードを生成するステップと、を含む。各配列リードは、標的核酸由来の少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、または少なくとも10,000個のヌクレオチドを含み得る。好ましくは、各配列リードは、標的核酸由来の少なくとも5つのヌクレオチドを含む。
【0741】
この方法は、少なくとも10、少なくとも100、または少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108または少なくとも109個の異なる標的核酸から生成された1つ以上のバーコード化標的核酸分子から配列リードを生成し得る。
【0742】
配列決定は、当技術分野で知られている任意の方法によって行うことができる。例えば、連鎖停止またはサンガー配列決定による。好ましくは、配列決定は、合成による配列決定、可逆的ターミネーターを使用した合成による配列決定(例えば、Illumina配列決定)、パイロ配列決定(例えば、454配列決定)、ライゲーションによる配列決定(例えば、SOLiD配列決定)、単一分子配列決定(例えば、単一分子リアルタイム(SMRT)配列決定(Pacific Biosciences))、またはナノポア配列決定(例えば、MinionまたはPromethionプラットフォーム(Oxford Nanopore Technologies)上)等の次世代配列決定法によって行われる。
【0743】
本発明はさらに、本明細書で定義された方法のいずれかによって得られた配列決定データを処理するための方法を提供する。配列データを処理するための方法は、(a)各配列リードについて、バーコード領域の配列および標的核酸からの配列を特定するステップと、(b)ステップ(a)からの情報を使用して、同じ多量体バーコード化試薬からのバーコード領域で標識された標的核酸からの配列の群を決定するステップと、を含む。
【0744】
この方法は、配列の群を分析して連続する配列を特定することによって標的核酸の配列を決定するステップをさらに含み得、ここで、標的核酸の配列は、少なくとも2つの配列リードからのヌクレオチドを含む。
【0745】
本発明はさらに、本明細書で定義された方法のいずれかによって得られた配列決定データを処理(または分析)するためのアルゴリズムを提供する。アルゴリズムは、本明細書で定義された配列決定データを処理するための任意の方法を行うように構成され得る。このアルゴリズムを使用して、各配列リード内のバーコード領域の配列を検出し、また、標的核酸に由来する配列リード内の配列を検出し、これらを2つの関連するデータセットに分離することができる。
【0746】
本発明はさらに、標的核酸からの合成ロングリードを生成する方法を提供し、(a)本明細書で定義される方法のいずれかに従って配列決定するための核酸試料を調製することと、(b)試料を配列決定することであって、任意選択的に、試料は、本明細書で定義される方法のいずれかによって配列決定される、配列決定することと、(c)ステップ(b)によって得られた配列データを処理することであって、任意選択的に、配列データは、本明細書で定義された方法のいずれかに従って処理される、処理することと、を含み、ここで、ステップ(c)は、少なくとも2つの配列リードの各々から少なくとも1つのヌクレオチドを含む合成ロングリードを生成する。
【0747】
この方法は、標的核酸分子の標的配列のフェージングを可能にし得る、すなわち、配列が染色体のどのコピー(すなわち、父体または母体)に位置するかの決定を可能にし得る。標的配列は、特定の標的突然変異、転座、欠失または増幅を含み得、そしてこの方法は、突然変異、転座、欠失または増幅を特定の染色体に割り当てるために使用され得る。2つ以上の標的配列をフェージングすることにより、異数性の検出も可能になり得る。
【0748】
合成ロングリードは、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも750、少なくとも1000、少なくとも2000、少なくとも104、少なくとも105、少なくとも106、少なくとも107、または少なくとも108個のヌクレオチドを含み得る。好ましくは、合成ロングリードは、少なくとも50個のヌクレオチドを含む。
【0749】
本発明はさらに、2つ以上の共局在化された標的核酸を配列決定する方法を提供し、(a)本明細書で定義される方法のいずれかに従って配列決定するための核酸試料を調製することと、(b)試料を配列決定することであって、任意選択的に、試料は、本明細書で定義される方法のいずれかによって配列決定される、配列決定することと、(c)ステップ(b)によって得られた配列データを処理することであって、任意選択的に、配列データは、本明細書で定義された方法のいずれかに従って処理される、処理することと、を含み、ここで、ステップ(c)は、試料中に共局在化した少なくとも2つの標的核酸からのヌクレオチドを含む少なくとも2つの配列リードを特定する。
【0750】
配列決定によってバーコード化または連結された核酸分子を分析する任意の方法は、冗長な配列決定反応を含み得、ここで、(例えば、バーコード化反応でバーコード化された)標的核酸分子は、配列決定反応内で2回以上配列決定される。任意選択的に、試料から調製されたかかる各分子は、平均して、少なくとも2回、少なくとも3回、少なくとも5回、少なくとも10回、少なくとも20回、少なくとも50回、または少なくとも100回、配列決定され得る。
【0751】
配列決定によってバーコード化核酸分子を分析する任意の方法において、エラー訂正プロセスを使用することができる。このプロセスは、(i)同じバーコード配列を含む配列決定データセットから2つ以上の配列リードを決定するステップ、および(ii)当該2つ以上の配列リードからの配列を互いに整列させるステップを含み得る。任意選択的に、このエラー訂正プロセスは、(iii)配列リード内の各位置および/または標的核酸分子の配列内の各位置で大多数および/または最も一般的および/または最も可能性の高いヌクレオチドを決定するステップをさらに含み得る。このステップは、任意選択的に、エラー訂正、エラー除去、エラー検出、エラーカウント、または統計的エラー除去の任意のプロセスによって、各標的核酸配列のコンセンサス配列を確立することを含み得る。このステップは、同じバーコード配列を含む複数の配列リードを、単一のエラー修正されたリードを含む表現に折りたたむステップをさらに含み得る。任意選択的に、同じバーコード配列を含む配列決定データセットからの2つ以上の配列リードを決定する任意のステップは、少なくともある程度の同一ヌクレオチドおよび/または配列類似性、例えば、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%の配列類似性を有するバーコード配列を含む配列リードを決定することを含み得る(例えば、バーコード配列間の任意の点での不一致および/または挿入または欠失を可能にする)。
【0752】
配列決定によるバーコード化核酸分子の分析を使用する任意の方法において、代替のエラー修正プロセスを使用することができ、(i)同じ標的核酸配列を含む配列決定データセットからの2つ以上の配列リードを決定することであって、当該2つ以上の配列リードは、2つ以上の異なるバーコード配列をさらに含み、バーコード配列は、同じ多量体バーコード分子および/または多量体バーコード化試薬に由来する、決定することと、(ii)当該2つ以上の配列リードからの配列を互いに整列させることと、を含む。任意選択的に、このエラー訂正プロセスは、(iii)標的核酸分子の配列内の各位置で大多数および/または最も一般的および/または最も可能性の高いヌクレオチドを決定するステップをさらに含み得る。このステップは、任意選択的に、エラー訂正、エラー除去、エラー検出、エラーカウント、または統計的エラー除去の任意のプロセスによって、標的核酸分子のコンセンサス配列を確立することを含み得る。このステップは、同じ標的核酸分子を含む複数の配列リードを、単一のエラー修正されたリードを含む表現に折りたたむステップをさらに含み得る。標的核酸分子は、例えば、ゲノムDNA配列を含み得る。任意選択的に、2つのバーコード配列を比較する、かつ/または配列決定されたバーコード配列と参照バーコード配列を比較する任意のステップは、少なくともある程度の同一ヌクレオチドおよび/または配列類似性、例えば、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%の配列類似性を含む配列を決定することを含み得る(例えば、バーコード配列間の任意の点での不一致および/または挿入または削除を可能にする)。
【0753】
28.微粒子からの連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定および分析するための方法
本発明は、単一の微粒子からの標的核酸(例えば、ゲノムDNA)の断片の連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定する方法を提供し、この方法は、(a)本明細書に記載の方法のいずれかに従って試料を分析することと、(b)2つ以上の連結された配列リードのセットを決定することと、を含む。
【0754】
2つ以上の連結された配列リードのセットは、同じバーコード配列を含む配列リードを特定することによって決定され得る。
【0755】
2つ以上の連結された配列リードのセットは、同じバーコード配列のセットからの異なるバーコード配列を含む配列リードを特定することによって決定され得る。
【0756】
2つ以上の連結された配列リードのセットは、同じ多量体バーコード化試薬からのバーコード領域のバーコード配列を含む配列リードを特定することによって決定され得る。
【0757】
2つ以上の連結された配列リードは、同じ配列決定された分子の2つ以上の重複しないセグメント内に含まれる配列リードを特定することによって決定され得る。
【0758】
2つ以上の連結された配列リードのセットは、それらの配列決定に使用される配列決定機器内のそれらの空間的近接性を特定することによって決定され得る。任意選択的に、この空間的近接性は、カットオフまたは閾値を使用して決定されるか、非ランダムまたは平均以上の近接性によって決定される。任意選択的に、この空間的近接性は、配列決定機器内の様々な程度の空間的近接性に対応する定量的、半定量的、またはカテゴリ的値として表される。
【0759】
この方法は、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000セットの連結された配列リード(すなわち、連結されたシグナルのセット)を決定することを含み得る。
【0760】
本発明は、以下を含む、配列データセット内の連結された配列リードのセット(すなわち、連結されたシグナルのセット)の総数を決定する方法を提供し、(a)本明細書に記載の方法のいずれかに従って試料を分析することと、(b)連結された配列リードのセットの数を決定することと、を含む。
【0761】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)の数は、異なるバーコード配列を含む配列リードの数をカウントすることによって決定され得る。
【0762】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)の数は、配列リードにバーコード配列を有するバーコード配列のセットをカウントすることによって決定され得る。
【0763】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)の数は、バーコード配列が配列リードにあるバーコード領域を有する多量体バーコード化試薬の数をカウントすることによって決定され得る。
【0764】
任意選択的に、配列データセット内で少なくとも2回、少なくとも3回、少なくとも5回、少なくとも10回、少なくとも20回、少なくとも50回、または少なくとも100回表されるバーコード配列のみがこれらのカウントプロセスに含まれる。任意選択的に、配列リードおよび/またはバーコード配列は、当該カウントプロセスの前にエラー訂正プロセスを介して処理される。任意選択的に、配列データセット全体で複数回表される技術的な重複リードは、当該カウントプロセスの前に、重複排除プロセスで単一の重複排除リードに折りたたまれる。
【0765】
この方法は、連結された配列リードのセット(すなわち、連結されたシグナルのセット)の総数をカウントまたは推定することを含み得、ここで、微粒子からの標的核酸(例えば、ゲノムDNA)の断片を含む2つ以上の核酸配列が互いに付加され、当該配列データセットを含む配列内で、標的核酸の少なくとも2つの異なるセグメントを含む当該配列データセットからの配列リードの数がカウントされ、これにより、配列データセット内の連結された配列リードのセットの数が決定される。任意選択的に、当該配列データセット内の配列決定された分子の総数がカウントされ、これにより、配列データセット内の連結された配列リードのセットの数が決定される。任意選択的に、標的核酸の少なくとも3つの異なるセグメントを含むか、標的核酸の少なくとも5つの異なるセグメントを含むか、標的核酸の少なくとも10の異なるセグメントを含むか、または標的核酸の少なくとも50個の異なるセグメントを含む、配列決定された分子のみがカウントされる。
【0766】
この方法は、連結された配列リードのセット(すなわち、連結されたシグナルのセット)の総数をカウントまたは推定することを含み得、配列のセットは、配列決定機器内の空間的近接性によって情報的に連結され、当該配列内の配列決定された分子の総数データセットがカウントされ、これにより、配列データセット内の連結された配列リードのセット数が決定される。任意選択的に、当該配列データセット内の配列決定された分子の総数がカウントされ、次に不変の正規化係数で除算して、配列データセット内の連結された配列リードのセットの数が決定される。
【0767】
本発明は、連結された配列リードのセット(すなわち、連結されたシグナルのセット)からパラメータ値を決定する方法を提供し、ここで、この方法は、(a)本明細書に記載の方法のいずれかに従って連結された配列リードのセットを決定することと、(b)連結された配列リードのセットの各配列を(少なくともその一部の)1つ以上の参照ヌクレオチド配列にマッピングすることと、(c)連結された配列リードのセット内の1つ以上の参照ヌクレオチド配列の存在をカウントまたは特定することによってパラメータ値を決定することと、を含む。
【0768】
任意選択的に、この参照配列は、ゲノム全体、染色体全体、染色体の一部、遺伝子、遺伝子の一部、ゲノムの任意の他の部分または複数の部分、または任意の他の合成もしくは実際の配列を含み得る。参照配列は、転写物、転写物の一部、転写物アイソフォーム、または転写物アイソフォームの一部を含み得る。参照配列は、転写物のスプライス接合部を含み得る。参照配列は、ヒトゲノムに由来し得る。参照配列は、2つ以上の異なる参照ヒトゲノム配列のライブラリからの参照配列、または2つ以上の異なるハプロタイプ段階の参照ヒトゲノム配列のライブラリからの異なる参照配列(例えば、International HapMap Projectおよび/または100 Genomes Projectとは異なるゲノム配列)等、1つ以上の異なる参照ヒトゲノム配列に由来し得る。
【0769】
参照配列のさらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
【0770】
任意選択的に、1つ以上の参照配列は、特定の組織(すなわち、特定の細胞型)内および/または特に特定の罹患組織内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出される配列を含み得る。任意選択的に、1つ以上の参照配列は、非母体および/または父体組織内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。任意選択的に、1つ以上の参照配列は、母体組織内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。任意選択的に、1つ以上の参照配列は、1つ以上の特定の組織タイプ(例えば、肺組織、または膵臓組織、またはリンパ球)内に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。任意選択的に、1つ以上の参照配列は、特定のタイプの罹患組織(例えば、肺がん組織もしくは結腸直腸がん組織等のがん組織、または梗塞した心筋組織、または罹患した脳血管組織、または子癇または子癇前症を患っている胎盤組織等の非がん性の罹患組織)内に排他的に存在するか、優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。任意選択的に、1つ以上の参照配列は、特定の組織(例えば、肺組織、または膵臓組織、またはリンパ球)内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。任意選択的に、1つ以上の参照配列は、特定のタイプの健康な組織(例えば、健康な肺組織、健康な膵臓組織、または健康なリンパ球)内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出され得る。
【0771】
任意選択的に、特定の組織(すなわち、特定の細胞型)内および/または特に特定の罹患組織内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出される配列を含む任意の1つ以上の参照配列は、経験的測定および/または評価プロセスによって確立され得る。さらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0772】
任意選択的に、1つ以上の参照配列は、バーコード化親和性プローブ内に含まれる配列を含み得、ここで、当該バーコード化親和性プローブの標的分子(例えば、当該バーコード化親和性プローブが親和性を有するタンパク質)は、特定の組織(すなわち、特定の細胞型)内および/または特に特定の罹患組織内に排他的に存在するか、または優先的に見出されるか、あるいは高レベルおよび/もしくは平均以上のレベルで見出される。任意選択的に、1つ以上の参照配列は、バーコード化親和性プローブ内に含まれる配列を含み得、ここで、当該バーコード化親和性プローブの標的分子(例えば、当該バーコード化親和性プローブが親和性を有するタンパク質)は、特定の組織(すなわち、特定の細胞型)内および/または特に特定の罹患組織内に排他的に存在しないか、または優先的に存在しないか、あるいは低レベルおよび/もしくは平均以下のレベルで見出される。
【0773】
参照ヌクレオチド配列は、染色体または染色体の一部に対応する配列を含み得る。任意選択的に、この配列は、少なくとも1ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも100ヌクレオチド長、少なくとも1000ヌクレオチド長、少なくとも10,000ヌクレオチド長、少なくとも100,000ヌクレオチド長、少なくとも1,000,000ヌクレオチド長、少なくとも10,000,000ヌクレオチド長、または少なくとも100,000,000ヌクレオチド長である。
【0774】
参照ヌクレオチド配列は、2つ以上の染色体に対応する2つ以上の配列、または1つ以上の染色体の2つ以上の部分に対応する配列を含み得る。任意選択的に、これらの配列は各々、少なくとも1ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも100ヌクレオチド長、少なくとも1000ヌクレオチド長、少なくとも10,000ヌクレオチド長、少なくとも100,000ヌクレオチド長、少なくとも1,000,000ヌクレオチド長、少なくとも10,000,000ヌクレオチド長、または少なくとも100,000,000ヌクレオチド長である。任意選択的に、この参照配列は、全ゲノム配列を含み得る。
【0775】
参照ヌクレオチド配列は、1つ以上のスライディングウィンドウを含み得、各ウィンドウは、有限長のゲノム領域のスパンを含み、2つ以上のウィンドウは、当該ゲノム領域に沿って特定の有限数のヌクレオチドをオフセットする。任意選択的に、これらのスライディングウィンドウは、部分的に重なり合うか、互いに直接隣接するか、または特定の数のヌクレオチドのスパンによって分離され得る。
【0776】
参照ヌクレオチド配列は、反復配列を含み得る。任意選択的に、この反復配列は、ジヌクレオチド反復、トリヌクレオチド反復、テトラヌクレオチド反復、またはペンタヌクレオチド反復を含む。任意選択的に、参照ヌクレオチド配列は、同じ繰り返し単位の一連の2つ以上の直接隣接コピー、例えば、2つの直接隣接コピー、5つの直接隣接コピー、8つの直接隣接コピー、10の直接隣接コピー、15の直接隣接コピー、20の直接隣接コピー、30の直接隣接コピー、40の直接隣接コピー、50の直接隣接コピー、または100の直接隣接コピーを含む。
【0777】
任意選択的に、任意の1つ以上の参照配列を使用して、本明細書に記載の任意の方法によって決定された配列を分析することができる。ゲノムDNAの断片の配列を分析するために、任意の1つ以上の参照配列を使用することができる。RNAの配列を分析するために、任意の1つ以上の参照配列を使用することができる。任意の1つ以上の参照配列を使用して、ゲノムDNAの断片の配列を分析することができ、修飾ヌクレオチドまたは核酸塩基の測定は、ゲノムDNAの1つ以上の当該断片に対して行われる(かかる例の1つとして、任意の1つ以上の参照配列は、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等の修飾ヌクレオチドの濃縮プロセスによって濃縮されたゲノムDNAの断片の配列を分析するために使用できる。別のかかる例として、任意の1つ以上の参照配列は、重亜硫酸塩変換プロセスまたは酸化的重亜硫酸塩変換プロセス等の分子変換プロセスによって変換された、少なくとも1つのヌクレオチドが含まれるゲノムDNAの断片の配列を分析するために使用され得、ここで、当該変換プロセスは、5-メチルシトシンまたは5-ヒドロキシ-メチルシトシン等の1つ以上の修飾ヌクレオチドを検出するために使用される)。
【0778】
任意選択的に、任意の1つ以上の参照配列は、1つ以上の示差的にメチル化された領域(DMR)(例えば、少なくとも20、少なくとも30、少なくとも50、少なくとも80、少なくとも100、少なくとも120、少なくとも150、少なくとも200、少なくとも300、または少なくとも500ヌクレオチド長のDMR)、例えば、任意の2つの細胞タイプおよび/または組織タイプ間で示差的にメチル化されたDMR、ならびに/あるいは1つ以上の特定の組織タイプおよび/または細胞タイプおよび/または罹患組織タイプにおいて優先的にメチル化された(または優先的に脱メチル化された)DMRを含み得る。
【0779】
任意選択的に、任意の1つ以上の参照配列を使用して、ゲノムDNAの断片の配列を分析することができ、ここで、ゲノムDNAの任意のかかる断片の5’近傍および/または3’近傍ヌクレオチド(ならびに/あるいは、5’近傍ヌクレオチドおよび/または3’近傍ヌクレオチド、例えば、5’近傍および/または3’近傍ヌクレオチドの最も近い2、3、4、または5ヌクレオチド内のヌクレオチド)は、当該参照配列にマッピングされる。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。任意選択的に、参照配列および/またはそのリストは、クロマチンのアクセシビリティおよび/またはクロマチンの開放性(例えば、ATAC-seqアッセイおよび/またはDNAseアクセシビリティアッセイによる測定として)(例えば、任意の1つ以上の特定の組織および/または罹患組織および/または健康な組織において)の配列を含み得る。任意選択的に、かかる各参照配列に対応する重み付け値が、かかる各参照配列に対するクロマチンのアクセシビリティおよび/または開放性の程度および/または好適性に対応して(例えば、任意の1つ以上の特定の組織および/または罹患組織および/または健康な組織内で)生成される。
【0780】
パラメータ値は、定量的または半定量的値であり得、当該参照ヌクレオチド配列または複数の配列に由来する配列を含むと決定される配列のセット内の配列リードの数をカウントすることによって決定される。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
パラメータ値は、バイナリ値であり得るか、配列リードのセット内の少なくとも1つの配列リードが、当該参照ヌクレオチド配列または複数の配列に由来する配列を含むかどうかを検出することによって決定され得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
任意選択的に、リストおよび/または2つ以上の参照配列の群内の各参照配列は、重み付け値および/または関連値に関連付けられ得る。任意選択的に、この重み付け値および/または関連値は、所与の配列が非母体もしくは父体である可能性もしくは確率に対応するか、または所与の配列が母体である可能性もしくは確率に対応し得る。任意選択的に、この重み付け値および/または関連値は、所与の配列が特定の組織タイプ(例えば、肺組織、または膵臓組織、またはリンパ球)に由来する可能性もしくは確率に対応し得る。任意選択的に、この重み付け値および/または関連値は、所与の配列が特定のタイプの罹患組織(例えば、肺がん組織もしくは結腸直腸がん組織等のがん組織、または梗塞した心筋組織、または罹患した脳血管組織、または子癇または子癇前症を患っている胎盤組織等の非がん性の罹患組織)に由来する可能性もしくは確率に対応し得る。
【0781】
任意選択的に、任意の1つ以上の参照配列に対する任意のかかる重み付け値および/または関連値は、経験的測定および/または評価プロセスによって確立され得る。任意選択的に、任意の1つ以上の参照配列の重み付け値および/または関連値は、2つ以上の異なる組織タイプ(例えば、罹患組織および健康な組織)における2つ以上の転写物の発現(例えば、RNAレベル)を測定することによって確立され得る。次に、第1および第2の組織タイプ内の当該2つ以上の転写物の絶対的および/または相対的発現レベルは、それぞれ、当該第1および第2の組織タイプの当該重み付け値および/または関連値(複数可)として経験的に確立され得る。任意選択的に、任意の1つ以上の参照配列の任意の重み付け値および/または関連値は、2つ以上の異なる組織タイプ(例えば、罹患組織および健康な組織)における2つ以上のゲノム領域(例えば、2つ以上遺伝子、または2つ以上の遺伝子プロモーター領域)の5-メチルシトシン(または同様に、5-ヒドロキシ-メチルシトシン)のレベルを測定することによって確立され得る。次いで、第1および第2の組織タイプ内の当該2つ以上の遺伝子(またはプロモーター)の絶対的および/または相対的5-メチルシトシンレベルは、それぞれ、当該第1および第2の組織タイプの当該重み付け値および/または関連値(複数可)として経験的に確立され得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0782】
任意選択的に、任意の1つ以上の参照配列に対する任意のかかる重み付け値および/または関連値は、経験的測定および/または評価プロセスによって確立され得、ここで、当該経験的測定および/または評価プロセスは、当該経験的測定および/または評価プロセスのための入力試料として、1つ以上の循環微粒子を含む1つ以上の試料を使用する(例えば、循環微粒子からのゲノムDNAの断片の第1および第2の配列が、本明細書に記載の任意の方法等によって連結される)。任意選択的に、任意の当該1つ以上の循環微粒子は各々、ゲノムDNAの少なくとも第1および第2の断片を含む。任意選択的に、1つ以上の循環微粒子を含む任意の当該1つ以上の試料は、がん(肺がんもしくは膵臓がん等)、または特定の段階のがん(I期、II期、III期、IV期)、または特定の臨床的特徴を有するがん(良性がん、悪性がん、局所がん、転移性がん、もしくは治療抵抗性がん等)等の1つ以上の特定の疾患を有する患者から得ることができる。任意選択的に、1つ以上の循環微粒子を含む当該1つ以上の試料は、任意のかかる1つ以上の特定の疾患を有さない患者に由来し得る。任意選択的に、1つ以上の循環微粒子を含む当該1つ以上の試料は、健康であると考えられる患者に由来し得る。任意選択的に、1つ以上の循環微粒子を含む任意の当該1つ以上の試料は、同じ個体からの少なくとも第1および第2の試料を含み得、ここで、第1の試料はより早い時期に個体から作製され、第2の試料は後の時期に個体から作製され、これらは第1の試料と第2の試料との間の期間(1時間、または1日、または1週間、または1か月、または3か月、または6か月、または12か月、または2年、または3年、または5年、または10年等)で区切られる。任意選択的に、任意の1つ以上の参照配列に対する任意のかかる重み付け値および/または関連値は、経験的測定および/または評価プロセスによって確立され得、ここで、当該経験的測定および/または評価プロセスは、疾患を有する患者からの少なくとも1つの試料(1つ以上の循環微粒子を含む)と、当該疾患を有さない人からの少なくとも1つの試料(1つ以上の循環微粒子を含む)と、を使用する(例えば、疾患を有する人からの試料内の当該参照配列に対応する量および/またはシグナルが、例えば、疾患を有さない人からの試料内の当該参照配列に対応する量および/またはシグナルと比較され、当該2つの測定値の比率が、当該重み付け値および/または関連値として使用される)。任意選択的に、任意の1つ以上の参照配列に対する任意のかかる重み付け値および/または関連値は、経験的測定および/または評価プロセスによって確立され得、ここで、当該経験的測定および/または評価プロセスは、疾患を有する少なくとも2人の患者の群からの試料(1つ以上の循環微粒子を含む)と、当該疾患を有さない少なくとも2人の群からの試料(1つ以上の循環微粒子を含む)と、を使用する。任意選択的に、疾患を有する患者の当該群(または当該疾患を有さない人の群)は各々、少なくとも3人、少なくとも5人、少なくとも10人、少なくとも20人、少なくとも50人、少なくとも100人、少なくとも200人、少なくとも500人、少なくとも1000人、少なくとも2000人、少なくとも10,000人、少なくとも20,000人、少なくとも50,000人、少なくとも100,000人、少なくとも500,000人、少なくとも1,000,000人、または少なくとも10,000,000人の個体を含み得る。任意選択的に、疾患を有する患者の当該群内の任意の患者(または当該疾患を有さない当該群内の任意の人)は各々、循環微粒子を含む2つ以上の試料を提供することができ、ここで、各試料は異なる時点(例えば、時点は、少なくとも1日、少なくとも1週間、少なくとも1か月、少なくとも2か月、少なくとも6か月、少なくとも1年、少なくとも2年、または少なくとも5年で区切られている)で得られる。
【0783】
任意選択的に、1つ以上の循環微粒子を含む1つ以上の試料を入力試料として使用して、経験的測定および/または評価プロセスによって任意の1つ以上の参照配列の任意の重み付け値および/または関連値を確立する任意の方法において、当該重み付け値および/または関連値(複数可)は、5-メチルシトシンレベルに関連し得(例えば、それらは、特定の健康組織または特定の罹患組織内の5-メチルシトシンレベルに関連し得る)、あるいは任意選択的に、5-ヒドロキシ-メチルシトシンレベルに関連し得る(例えば、それらは、特定の健康組織または特定の罹患組織内の5-ヒドロキシ-メチルシトシンレベルに関連し得る)。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0784】
任意選択的に、この方法は、連結された配列リードのセット(すなわち、連結されたシグナルのセット)における参照配列の1つ以上のリストからの参照配列の数をカウントすることを含み得る。任意選択的に、このカウントプロセスは、試料内の連結された配列リードの全てのセット、またはその任意の1つ以上のサブセットに対して行われ得る。任意選択的に、各参照配列は、カウントプロセスが、連結された配列リードのセット内の参照配列の重み付け和が決定される重み付けカウントプロセスを含むように、重み付け値および/または関連値に関連付けられ得る。任意選択的に、この重み付け値は、所与の配列が非母体もしくは父体である可能性もしくは確率に対応し得、または所与の配列が母体である可能性もしくは確率に対応し得、または所与の配列が特定の起源の組織(肺組織、もしくは膵臓組織、もしくはリンパ球等)に由来する可能性もしくは確率に対応し得、または特定の配列が特定の健康な起源の組織(健康な肺組織、もしくは健康な膵臓組織、もしくは健康なリンパ球等)に由来する可能性もしくは確率に対応し得、または特定の配列が特定の病気の起源の組織(病気の肺組織、もしくは病気の膵臓組織、もしくは病気のリンパ球等)に由来する可能性もしくは確率に対応し得、または特定の配列が特定のがん性組織(がん性肺組織、もしくはがん性膵臓組織、もしくはがん性リンパ球等)に由来する可能性もしくは確率に対応し得る。
【0785】
任意選択的に、連結された配列リードのセットからの参照配列の任意の合計または重み付け和は、1つ以上の閾値と比較され得、ここで、当該閾値(複数可)より大きい数の参照配列を含む連結された配列リードのセット(すなわち、連結されたシグナルのセット)は、特定の起源の組織に由来するものであると判断されるか、かつ/または疑われる。任意選択的に、任意のかかる当該合計を決定し、1つ以上の閾値と比較する任意のプロセスを、試料内の連結された配列リードの全てのセット、および/またはその任意の1つ以上のサブセットに対して行うことができる。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0786】
任意選択的に、連結された配列の任意の1つ以上のセット(または、例えば、試料中の連結された配列リードの全てのセット(すなわち、連結されたシグナルのセット))は、参照配列の2つ以上の異なるリストによって分析および/または比較され得る。任意選択的に、試料中の連結された配列リードのセットは、第1の特定の組織タイプに対応する参照配列の第1のリストで分析され得、また、第2の特定の組織タイプに対応する参照配列の第2のリストで分析され得る。任意選択的に、試料中の連結された配列リードのセットは、特定の健康な組織タイプに対応する参照配列の第1のリストで分析され得、また、特定の罹患組織タイプに対応する参照配列の第2のリストで分析され得る。任意選択的に、試料中の連結された配列リードのセットは、特定の健康な組織タイプに対応する参照配列の第1のリストで分析され得、また、同じ組織タイプのがん性組織に対応する参照配列の第2のリストで分析され得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0787】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)からの配列リードは、同じゲノム領域またはゲノム領域に対応する2つ以上の参照ヌクレオチド配列にマッピングされ得、ここで、各参照ヌクレオチド配列は、当該ゲノム領域またはゲノム領域内の異なる変異対立遺伝子または異なる変異対立遺伝子のセットを含み、かつ、当該パラメータ値は、連結された配列リードの当該セット内の1つ以上の参照ヌクレオチド配列の存在によって決定され得る。
【0788】
標的核酸(例えば、ゲノムDNA)の当該断片の長さが決定または推定され得、そしてパラメータは、当該決定または推定された長さの平均、媒体、モード、最大、最小、または任意の他の単一の代表値を含み得る。任意選択的に、配列決定された各断片内のゲノムDNA配列の長さは、ゲノムDNAの断片の実質的に全配列を配列決定し(すなわち、その約5’末端からその約3’末端まで)、その中で配列決定されたヌクレオチドの数をカウントすることによって決定される。任意選択的に、これは、断片化されたゲノムDNAの配列の5’末端に十分な数のヌクレオチドを配列決定して、当該5’末端を参照ヒトゲノム配列内の遺伝子座にマッピングし、同様に、断片化されたゲノムDNAの配列の3’末端に十分な数のヌクレオチドを配列決定して、当該3’末端を参照ヒトゲノム配列内の遺伝子座にマッピングし、次いで、参照ヒトゲノム配列内の当該5’セグメント、参照ヒトゲノム配列内の当該3’セグメント、および2つの配列決定された部分の間に含まれる配列決定されていないヒトゲノム配列を含むヌクレオチドの総スパンを計算することにより、行われる。
【0789】
パラメータ値は、少なくとも2、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000セットの連結された配列リード(すなわち、連結されたシグナルのセット)に対して決定することができる。
【0790】
パラメータ値は、少なくとも2セットの連結された配列リード(すなわち、連結されたシグナルのセット)について決定され得、パラメータ値は、パラメータ値が特定のパラメータに等しい、2つ以上のパラメータ値のセットの1つに等しい、特定のパラメータ値より小さい、特定のパラメータ値より大きい、または当該パラメータの値の少なくとも1つの範囲内、または当該パラメータの値の2つ以上の範囲のうちの1つ内である連結された配列リードのセットの数を決定することによって評価され得る。任意選択的に、連結された配列リードの全ての評価されたセットのうち、上記の条件のうちの1つ以上を満たすと決定された連結された配列リードのセットの画分または割合が決定される。任意選択的に、少なくとも2セットの連結された配列リードのパラメータ値が決定され、パラメータ値の群全体の平均(mean)値、平均(average)値、モード値、または中央値のパラメータ値が決定される。
【0791】
パラメータ値は、少なくとも2セットの連結された配列リードの群(すなわち、連結されたシグナルのセット)について決定され、パラメータ値の群をパラメータ値の第2の群と比較することによってパラメータ値を評価することができる。任意選択的に、パラメータ値の当該第2の群は、パラメータ値の予想される正規分布、またはパラメータ値の予想される異常な分布に対応し得る。任意選択的に、これらのパラメータ値は、合成データ、ランダム化されたデータ、または1つ以上の正常または異常な状態を表す循環微粒子の1つ以上の別個の試料から生成された実験データから導出され得る。任意選択的に、少なくとも1、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個のパラメータ値のさらなる群が決定され、パラメータ値の第1の群とさらに比較され得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0792】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)について、少なくとも2つの異なるパラメータ値が決定され得る。任意選択的に、少なくとも3、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の異なるパラメータ値が決定される。
【0793】
本発明は、連結された配列リードのセットの群(すなわち、連結されたシグナルのセット)を決定する方法を提供し、(a)連結された配列リードの2つ以上のセットの各々のパラメータ値を決定することであって、連結された配列リードの数は、本明細書に記載の任意の方法に従って決定される、決定することと、(b)連結された配列リードのセットのパラメータ値を比較して、連結された配列リードの2つ以上のセットの群を特定することと、を含む。
【0794】
連結された配列リードのセット(すなわち、連結されたシグナルのセット)の群は、特定のパラメータに等しい、2つ以上のパラメータ値のセットの1つに等しい、特定のパラメータ値より小さい、特定のパラメータ値より大きい、または当該パラメータ値の値の少なくとも1つの範囲内、または当該パラメータ値の値の2つ以上の範囲のうちの1つ内であるパラメータ値を有する連結された配列リードのセットを特定することによって決定され得る。任意選択的に、群内の連結された配列リードのセットの数が決定され、群のサイズが決定される。
【0795】
この方法は、連結された配列リードのセット(すなわち、連結されたシグナルのセット)の群をさらに評価することを含み得、連結された配列リードのセットの群は、第2の分析ステップによってさらに分析される。任意選択的に、この第2の分析ステップは、連結された配列リードのセットの群の第2のパラメータ値を決定および/または評価することを含む。任意選択的に、この第2の分析ステップは、連結された配列リードのセットの群内に含まれる配列内の特定の対立遺伝子の存在または不在を決定することを含む。任意選択的に、この第2の分析ステップは、1つ以上の異数性、または微小欠失、またはコピー数多型、またはヘテロ接合性消失、または再配列もしくは転座イベント、一塩基バリアント、de novo突然変異、あるいは任意の他のゲノム特徴もしくは突然変異等の染色体異常の有無を決定することを含む。
【0796】
この方法は、第2の分析ステップによって、連結された配列リードのセット(すなわち、連結されたシグナルのセット)の群をさらに評価することを含み得、ここで、第2の解析ステップは、1つ以上の参照ヌクレオチド配列にマッピングする連結された配列リードのセットのグループ内の連結された配列リードの各セット内の配列リードの数を決定することを含む。任意選択的に、この参照配列または複数の参照配列は、ゲノム全体、染色体全体、染色体の一部、遺伝子、遺伝子の一部、ゲノムの任意の他の部分または複数の部分、または任意の他の合成もしくは実際の配列を含み得る。任意選択的に、この第2の分析ステップでは、参照配列内にマッピングされる群内の配列リードの総数をカウントし、この配列リードの数を群内のセットの総数で除算して、セットごとの参照配列内の配列リードの相対数を推定する。したがって、これは、連結された配列リードのセットの群に対応する微粒子の元の試料内の微粒子あたりの参照配列内の配列リードの相対数の推定値を形成し得る。任意選択的に、この第2の分析ステップは、この推定相対数を閾値と比較するステップをさらに含み得、ここで、当該閾値よりも大きい推定相対数、あるいは、当該閾値よりも小さい推定相対数は、染色体異数性または微小欠失等の特定の医学的または遺伝的状態の存在または不在を示し得る。
【0797】
29.微粒子からの連結されたシグナルのセットを決定および分析するための方法
任意選択的に、本明細書に記載の任意の方法について、任意の数の1つ以上のパラメータ値を決定および/または計算および/または推定され得(そして任意選択的に、さらに分析および/または評価および/または任意の方法および/または参照値(複数可)および/または制御パラメータ(複数可)と比較され得る)、ここで、任意の1つ以上のパラメータ値は、任意のシグナル(複数可)の測定値(複数可)および/または任意のシグナル(複数可)自体(例えば、循環微粒子の測定からの少なくとも2つの連結されたシグナルのセット等、少なくとも2つの連結されたシグナルのセットからの任意のシグナル(複数可))に由来し、かつ/またはそれらに関連し、かつ/またはそれらに関連付けられる。ここで、当該測定値(複数可)および/もしくはシグナル(複数可)は、任意のタイプの分子および/もしくは生体分子および/もしくは標的分子および/もしくは標的生体分子、例えば、ゲノムDNAの任意の1つ以上の断片、任意の1つ以上のRNA配列および/もしくはRNA分子、任意の1つ以上の修飾ヌクレオチドおよび/もしくは修飾核酸塩基、任意の1つ以上のポリペプチド(任意の1つ以上のタンパク質および/もしくは標的タンパク質、ならびに/または任意の1つ以上の翻訳後修飾タンパク質等)、任意の1つ以上のかかる分子および/もしくは生体分子の任意のレベル、および/もしくは任意の存在、および/もしくは任意の不在等に由来し、かつ/またはそれらに関連し、かつ/またはそれらに関連付けられる。任意選択的に、任意のかかるパラメータ値(複数可)は、1つ以上の制御パラメータ値(複数可)と比較することができ、任意選択的に、1つ以上のかかる制御パラメータ値(複数可)は、1つ以上の第2のシグナルおよび/または異なるシグナルから(例えば、第2の異なる循環微粒子の測定(複数可)からの第2の連結されたシグナルのセットからのような、第2の異なる連結されたシグナルのセットからの1つ以上のシグナルから)決定され得る。任意のパラメータ値(複数可)および/または制御パラメータ値(複数可)は、少なくとも2、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、少なくとも100,000,000、または少なくとも1,000,000,000セットの連結されたシグナルについて決定することができる。連結されたシグナルの任意のセットに対して、少なくとも2つの異なるパラメータ値を決定できる。任意選択的に、少なくとも3、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の異なるパラメータ値が決定され得る。任意のかかるパラメータ値(複数可)および/または制御パラメータ値(複数可)の計算、導出、確立、分析、および/または使用を含み、それらに関連する方法の選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0798】
任意選択的に、任意の分子および/または生体分子および/または標的分子および/または標的生体分子のレベル(任意のレベルの修飾ヌクレオチドおよび/もしくは修飾核酸塩基、または任意のレベルの標的ポリペプチドもしくは標的翻訳後修飾ポリペプチド等)(ならびに/または任意の推定レベルおよび/もしくは予測レベルおよび/もしくは測定レベル)に対応する任意の数の1つ以上のシグナルは、パラメータ値および/または制御パラメータ値を含み得る。任意のかかるパラメータ値(複数可)および/または制御パラメータ値(複数可)のいずれも関与させる方法およびそれらに関連する方法の選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0799】
任意選択的に、任意の分子および/または生体分子および/または標的分子および/または標的生体分子(任意のレベルの修飾ヌクレオチドおよび/もしくは修飾核酸塩基、または任意のレベルの標的ポリペプチドもしくは標的翻訳後修飾ポリペプチド等)の存在に対応する、かつ/または不在(および/または任意の予測もしくは測定された存在もしくは不在)を含む任意の数の1つ以上のシグナルは、パラメータ値および/または制御パラメータ値、例えば、定性的またはカテゴリ的等のパラメータ値および/または制御パラメータ値を含み得る。任意のかかるパラメータ値(複数可)および/または制御パラメータ値(複数可)のいずれも関与させる方法およびそれらに関連する方法の選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0800】
任意選択的に、任意の方法において、循環微粒子を含む試料(および/または循環微粒子に由来する試料)は、少なくとも2つのサブセットおよび/またはサブ集団に分割され(例えば、循環微粒子の第1のサブセットおよび循環微粒子の第2のサブセットに分割され、ここで、例えば、高レベルの特定の標的生体分子を示す循環微粒子の第1のサブセット、および低レベルの当該特定の標的生体分子を示す循環微粒子の第2のサブセットに選別されるFACS等のように試料が選別される)、循環微粒子の任意の1つ以上のサブセットおよび/またはサブ集団内のメンバーシップは、定性的および/またはカテゴリ的値等のパラメータ値を含み得る。
【0801】
任意選択的に、1つ以上のバーコード化親和性プローブの使用を含む任意の方法において、任意の1つ以上の参照配列(例えば、連結された配列および/または連結された配列の1つ以上のセットおよび/または群を分析するために使用される任意の参照配列)リードおよび/または連結されたシグナル)は、当該1つ以上のバーコード化親和性プローブ内に含まれる1つ以上のオリゴヌクレオチド配列を含み得る(例えば、任意の1つ以上の参照配列は、任意の1つ以上のバーコード化親和性プローブ内に含まれるバーコード化オリゴヌクレオチドの配列等のオリゴヌクレオチドの配列を含み得る)。任意選択的に、当該バーコード化親和性プローブがヒトゲノムにコードされたポリペプチドに対して親和性を有する1つ以上のバーコード化親和性プローブの使用を含む任意の方法において、バーコード化親和性プローブ内の配列を含む連結された配列リードの任意の1つ以上のセットからの各配列は、各当該バーコード化親和性プローブが親和性を有するタンパク質の遺伝子に対応するヒトゲノム配列の全部または一部を含む参照配列にマッピングする(例えば、合成的または人工的にマッピングする)と見なすことができる(例えば、情報的に見なすことができる)。任意選択的に、参照配列に関連するパラメータ値の生成、予測、計算、および/または分析または使用を含む任意の方法は、任意の1つ以上のバーコード化親和性プローブに何らかの方法で関連付けられた参照配列を使用することができる。任意のかかる1つ以上の参照配列は、重み付け値および/または関連値と関連付けることができ、ここで、任意選択的に、任意のかかる重み付け値および/または関連値(複数可)は、任意の経験的測定および/または評価プロセス(複数可)によって確立され得る(健康な個体の群および/または1つ以上の疾患または状態を有する個体の群等、1つ以上の個体または個体の群からの1つ以上の試料を含む任意の経験的測定および/または評価プロセス(複数可)等によって確立され得る。任意選択的に、当該試料は循環微粒子を含み得、および/または任意選択的に、当該試料は、組織および/または生検試料等の他の試料を含み得る)。任意のかかる参照配列および/またはパラメータ値(複数可)および/または値および/または重み付け値および/または関連値(複数可)および/または経験的測定および/または評価プロセスを含み、それらに関連する方法の選択肢が、参照により本明細書に組み込まれる。PCT/GB2017/053820に提供されている。
【0802】
任意のかかる方法で情報的に連結されている2つ以上のシグナルを含む分析の場合、連結の存在(またはその欠如)は、任意の分析または評価ステップまたは同じことを行うための任意のアルゴリズムにおけるパラメータ(パラメータ値および/または制御パラメータ値等)として使用され得る。任意のかかる方法で情報的に連結されている2つ以上のシグナルを含む分析の場合、連結の程度、確率、範囲またはレベルを、分析もしくは評価ステップまたはそれを行うためのアルゴリズムのパラメータとして使用することができる。
【0803】
本発明は、連結されたシグナルのセットからパラメータ値を決定する方法を提供し、この方法は、(a)本明細書に記載の方法のいずれかに従って連結されたシグナルのセットを決定することと、(b)連結されたシグナルのセット内の1つ以上の参照ヌクレオチド配列の存在をカウントまたは特定することによってパラメータ値を決定することと、を含む。
【0804】
任意のパラメータ値は、定量的または半定量的値であり得、任意の参照ヌクレオチド配列または複数の配列に由来する配列を含むと決定される連結された配列のセット内の配列リードの数をカウントすることによって決定され得る。さらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0805】
任意のパラメータ値(複数可)および/または制御パラメータ値(複数可)は、少なくとも2セットの連結されたシグナルについて決定され得、パラメータ値は、パラメータ値が特定の(例えば、制御)パラメータに等しい、2つ以上のパラメータ値のセットの1つに等しい、特定のパラメータ値より小さい、特定のパラメータ値より大きい、または当該パラメータの値の少なくとも1つの範囲内、または当該パラメータの値の2つ以上の範囲のうちの1つ内である連結されたシグナルのセットの数を決定することによって評価され得る。任意選択的に、連結されたシグナルの全ての評価されたセットのうち、上記の条件のうちの1つ以上を満たすと決定された連結されたシグナルのセットの画分または割合が決定される。任意選択的に、少なくとも2セットの連結されたシグナルのパラメータ値が決定され、パラメータ値の群全体の平均(mean)値、平均(average)値、モード値、または中央値のパラメータ値が決定される。
【0806】
30.アルゴリズムによる分析のための連結された配列リードデータを変換するための方法
本発明は、連結された配列データを、分析または統計ツールによってより容易にまたはより包括的に分析され得るそれを代表する形態に変換するための方法を提供する。特に重要なことは、この方法を使用して、循環微粒子の特定の試料を分析して、構造異常の存在を調べることができる(例えば、転座、または大規模なコピー数多型)が、その特定の性質、ゲノム位置、または当該構造異常のサイズはこれまで知られておらず、さらに、かかる因子が特定の生物学的測定にとって直接重要ではない場合があることである。
【0807】
微粒子からの配列を使用して、試料が由来する人の体内のがんの存在を示す可能性がある構造異常の存在を検出することができる。特定の数の構造的異常自体の存在および/または負担は、それ自体ががんを示している(またはそのリスクを示している)可能性があるが、かかる潜在的な異常のゲノム位置は、俯瞰的には知られておらず、がんリスク評価に関連していない可能性がある。したがって、連結された微粒子配列データを、情報ツールまたは統計ツールでより容易に分析できる形態に変換することで、この方法の感度と特異性を高めることができる。特に重要なのは、変換方法により、ディープラーニングおよび/または機械学習アプローチ、ならびにニューラルネットワーク/リカレントニューラルネットワークアプローチ等の効果的な分析のためにデータの変換を通常必要とする特定の数値ツールファミリを使用して、かかる微粒子連結された配列データの分析が可能になる場合がある。
【0808】
本発明は、微粒子の試料から生成された連結された配列データを変換する方法を提供し、ここで、連結された配列リードの第1のセット(すなわち、連結されたシグナルの第1のセット)は、第1の循環微粒子の標的核酸の断片から生成され、ここで、連結された配列リードの第2のセット(すなわち、連結されたシグナルの第2のセット)は、第2の循環微粒子の標的核酸の断片から生成される。
【0809】
連結された配列リードの第1および第2のセット(すなわち、連結されたシグナルのセット)は、参照ゲノム配列にマッピングされ得、ここで、各配列リードは、それがマッピングされた染色体を含む表現、およびインデックス機能に変換され、当該インデックス機能は、連結された配列リードの同じセットからの別の少なくとも1つの配列へのリンケージを含む。任意選択的に、当該インデックス機能は、連結された配列リードの対応するセットを特定する固有の識別子であり得る。
【0810】
31.ゲノムの再配列、転座、構造的バリアント、またはゲノム連鎖を決定するための方法
本発明は、単一の微粒子からの標的核酸(例えば、ゲノムDNA)の断片の連結された配列リードのセット(すなわち、連結されたシグナルのセット)内のゲノム再配列または構造的バリアントの存在を決定する方法を提供し、この方法は、(a)本明細書に記載の方法のいずれかに従って、連結された配列リードのセットを決定することと、(b)連結された配列リードのセットの各配列(の少なくとも一部)を、第1のゲノム領域を含む第1の参照ヌクレオチド配列にマッピングすること、および連結された配列リードのセットの各配列(の少なくとも一部)を、第2のゲノム領域を含む第2の参照ヌクレオチド配列にマッピングすることと、(c)第1のゲノム領域内にマッピングされることが見出された連結された配列リードのセットからの配列リードの数をカウントすること、および第2のゲノム領域内にマッピングされることが見出された連結された配列リードのセットからの配列リードの数をカウントすることと、を含む。
【0811】
ゲノム再配列または構造的バリアントは、任意のタイプのゲノム構造現象、例えば、ゲノムコピー数多型(コピー数増加もしくはコピー数損失を含む)、微小欠失、または任意の種類の再配列(例えば、反転)、染色体転座(例えば、染色体内転座もしくは染色体間転座)等の転座であり得る。
【0812】
この方法では、カウントされた配列リード数の数を、さらなる評価ステップまたは統計分析で使用して、ゲノム連鎖(すなわち、染色体の同じストレッチに沿った接続)が第1のゲノム領域と第2のゲノム領域との間に存在し得るかどうかを決定し得る。この方法は、連結された配列リードの単一のセット(すなわち、連結されたシグナルのセット)に対して行われ得、微粒子の試料中の連結された配列リードの2つ以上のセット、ならびに連結された配列リードの全てのセットの群またはその下位群に対しても行われ得る。
【0813】
任意選択的に、連結された配列リードのセット(すなわち、連結されたシグナルのセット)内の配列リードの総数も決定される。第1および第2のゲノム領域は、同じ染色体内に位置し得、その場合、互いに直接隣接し得るか、または任意の数のヌクレオチドによって分離され得る。あるいは、第1および第2のゲノム領域は、2つの異なる染色体内に位置し得る。第1および第2のゲノム領域は各々、1ヌクレオチドから染色体アームまたは染色体全体の長さまでの任意の数のヌクレオチド長であり得る。
【0814】
任意選択的に、評価が行われ、ここで、第1のゲノム領域内の配列リードの数が第1の閾値と比較され、第2のゲノム領域内の配列リードの数が第2の閾値と比較され、第1の閾値以上である第1の数および第2の閾値以上である第2の数は、第1のゲノム領域と第2のゲノム領域との間のゲノム連鎖の存在、および/または第1および第2のゲノム領域を含む再配列もしくは転座イベントの存在を決定または示す。
【0815】
さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0816】
32.バリアントまたはバリアント対立遺伝子をフェージングする方法
本発明は、染色体領域全体に分布する対立遺伝子をフェージングするための方法を提供する。これらの分析は、同じ染色体上または2つの異なる染色体上に2つの核酸バリアントが存在することが生物学的または医学的に重要である可能性がある任意の用途またはタスクを対象としている。例えば、2つの異なるバリアント部位が単一の遺伝子内にある場合(複合ヘテロ接合性の場合)、第1の部位の突然変異が第2の部位の突然変異と同じように個体のゲノム内の遺伝子の同じコピー内にあるかどうか、または対照的に、それらが各々個体のゲノム内の遺伝子の2つの異なるコピーの1つにあるかどうかは、非常に関連性がある。例えば、2つの突然変異が突然変異を不活性化している場合、それらは同じコピーにある遺伝子は依然として遺伝子の1つの活性で機能するコピーを許可するが、2つの不活性化変異が各々遺伝子の2つのコピーのいずれかにある場合、遺伝子のどちらのコピーも活性とならない。
【0817】
本発明は、第1のバリアント対立遺伝子が第1のゲノム領域内に含まれ、第2のバリアント対立遺伝子が第2のゲノム領域内に含まれ、各バリアント対立遺伝子が少なくとも2つのバリアントまたは潜在的バリアントを有する2つのバリアント対立遺伝子をフェージングする方法を提供する。ここで、この方法は、(a)本明細書に記載の方法のいずれかに従って、連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定することと、(b)第1のバリアント対立遺伝子からの各潜在的バリアントを含む配列が連結された配列リードのセット内に存在するかどうかを決定し、第2のバリアント対立遺伝子からの各潜在的バリアントを含む配列が同じ連結された配列リードのセット内に存在するかどうかを決定することと、を含む。
【0818】
バリアント対立遺伝子は、単一のヌクレオチド、または2つ以上のヌクレオチドの領域、あるいは1つ以上のヌクレオチドの挿入および/または欠失を含み得る。任意選択的に、第1の対立遺伝子の第1のバリアントの存在が検出され、第2の対立遺伝子の第1のバリアントの存在が検出され、これらの2つの対立遺伝子が同じセット内で見出されるさらなる評価ステップが行われる。ここで、連結された配列リード(すなわち、連結されたシグナルのセット)は、2つの対立遺伝子が互いに同じ染色体相にある、かつ/または同じ染色体もしくはハプロタイプもしくはハプロタイプブロックに沿って連結されている確率を示すか、または推定する。
【0819】
この方法は、任意の潜在的なバリアント対立遺伝子、および対立遺伝子またはバリアント対立遺伝子部位内の任意の潜在的バリアント、ならびに任意の2つ以上の異なるかかるバリアント対立遺伝子のそれらの任意の組み合わせを含む、バリアント対立遺伝子の2つ以上の対について繰り返され得る。
【0820】
この方法は、微粒子からの連結された配列リードの単一のセット(すなわち、連結されたシグナルのセット)に対して行われ得るか、または連結された配列リードの2つ以上のセットの群に対して行われ得る。それはまた、特定の試料からの連結された配列リードの全てのセットに対して行われ得、また、連結された配列リードのセットの1つ以上の特定の群に対して行われ得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0821】
任意選択的に、この方法を使用して、3つ以上のバリアント対立遺伝子をフェージングすることができる。任意選択的に、これは、単一のステップ内で全ての当該3つ以上のバリアント対立遺伝子を同時にフェージングすることによって行われ得るか、または2つ以上の連続するステップの配列によって行われ得る。
【0822】
任意選択的に、この方法を使用して、ゲノムスパン全体でバリアント対立遺伝子(例えば、少なくとも2、少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも10,000、または少なくとも100,000個のバリアント対立遺伝子)フェージングさせるために使用され得る。ゲノムスパンは、少なくとも100キロベース、少なくとも1メガベース、少なくとも10メガベース、または染色体アーム全体または染色体全体であり得る。さらなる選択肢が、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0823】
バリアント対立遺伝子は、一塩基バリアントもしくは一塩基多型、長さが2ヌクレオチド以上のバリアント、1つ以上のヌクレオチドの挿入もしくは欠失、de novo突然変異、ヘテロ接合性の喪失、再配列もしくは転座イベント、コピー数多型、または任意の他のゲノムの特徴もしくは突然変異を含む、任意の種類の遺伝子バリアントであり得る。
【0824】
この方法は、遺伝的補完プロセスを含むか、または含むように伸長することができる。任意選択的に、微粒子からの連結された配列リードのセット(すなわち、連結されたシグナルのセット)からの1つ以上の対立遺伝子またはバリアント対立遺伝子のリストが、遺伝的補完プロセスを行うために決定される。任意選択的に、このリストは、連結された配列リードの2つ以上のセットの群から、または連結された配列リードのセットの特定のサブ群から決定され得る。遺伝的補完プロセスが行われ得、ここで、1つ以上のかかるリストが、ヒト集団からの1つ以上の既知のハプロタイプまたはハプロタイプブロックと比較されて、当該リスト内の対立遺伝子またはバリアント対立遺伝子の位相をフェージングまたは推定するか、あるいは当該配列が由来するゲノムの一部について、ハプロタイプまたはハプロタイプブロックを決定または推定する。任意選択的に、2つ以上の対立遺伝子またはバリアント対立遺伝子は、遺伝的補完プロセスを行う前にフェージングされ得る。任意選択的に、かかる2つ以上の対立遺伝子またはバリアント対立遺伝子のフェージングは、上記のような任意のプロセスを介して行われ得る。任意選択的に、フェージングおよび/または遺伝的補完および/またはハプロタイプ推定の組み合わせおよび/または反復プロセスを行うことができ、任意のかかるステップまたは構成要素を1回、2回、またはそれ以上繰り返すことができる。
【0825】
遺伝的補完および/またはハプロタイプ推定および/またはフェージングおよび/またはバリアント推定を行うための任意のツールおよび/または方法および/または情報提供的アプローチを使用することができる。任意選択的に、SHAPEIT2、MaCH、Minimac、IMPUTE2、および/またはBeagleを使用できる。
【0826】
任意選択的に、遺伝的補完プロセスを使用して、1つ以上の参照配列を生成する(例えば、参照配列の1つ以上のリストを生成する)ことができる。任意選択的に、遺伝的補完プロセスを、ハプロタイプ推定プロセスと同時に、かつ/またはハプロタイプ推定プロセスとともに使用することができる。遺伝的補完プロセスのさらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0827】
任意選択的に、遺伝的補完プロセスは、配列および/または対立遺伝子の入力リスト(例えば、一塩基多型のリスト)を使用することができ、ここで、当該入力リストは、循環微粒子からのゲノムDNAの断片の配列に由来する。任意選択的に、当該入力リストは、循環微粒子からのゲノムDNAの断片の連結された配列に由来し得る。当該入力リストのさらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。任意選択的に、当該入力リストは、循環微粒子からのゲノムDNAの断片の(連結または非連結)配列のサブセットに由来し得、ここで、配列の当該サブセットは、がんゲノムの中に含まれる、かつ/またはその中に含まれる可能性がある、かつ/またはその中に濃縮される、かつ/またはその中に濃縮されると疑われる配列を含む。
【0828】
配列および/もしくは対立遺伝子の任意の入力リスト(例えば、一塩基多型のリスト)、ならびに/または任意の1つ以上の参照配列(例えば、参照配列の1つ以上のリスト)ならびに/またはそのサブセットは、本明細書に記載されている任意の方法によって生成され得る。
【0829】
任意選択的に、遺伝的補完プロセスを使用して、ゲノムの一部のハプロタイプまたはハプロタイプブロックを生成、決定、または推定することができる。遺伝的補完プロセスのさらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820に提供されている。
【0830】
任意選択的に、遺伝的補完プロセスは、ヒト集団からの2つ以上の以前に知られている(かつ/または以前に予測もしくは作成された)ハプロタイプまたはハプロタイプブロックのカタログを使用することができる。任意選択的に、ハプロタイプまたはハプロタイプブロックは、少なくとも2ヌクレオチド、少なくとも10、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000ヌクレオチド長のゲノム領域に関連し得る。任意選択的に、ハプロタイプもしくはハプロタイプブロックは、染色体アーム、完全な染色体、および/または完全なゲノムに関連し得る。
【0831】
任意選択的に、遺伝的補完プロセスは、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも50,000、少なくとも100,000、少なくとも500,000、または少なくとも1,000,000以上の既知の(および/または以前に予測もしくは作成された)ハプロタイプもしくはハプロタイプブロックのカタログを使用することができる。
【0832】
この方法は、連結された配列リードの単一のセット(すなわち、連結されたシグナルのセット)に対して行われ得、微粒子の試料中の連結された配列リードの2つ以上のセット、ならびに連結された配列リードの全てのセットの群またはその下位群に対しても行われ得る。
【0833】
33.胎児起源の連結された配列リードを決定および分析するための方法
本発明は、連結された配列データを分析するための方法を提供し、当該データは、妊娠中の女性からの試料から生成される(したがって、試料は、母体起源の微粒子、すなわち、正常な体細胞母体組織からの微粒子、ならびに胎児(および/もしくは胎盤)起源の微粒子との混合物を含み得る)。この方法は、胎児トリソミー等の胎児染色体異常、または胎児染色体微小欠失の存在を検出するために使用することができる。いくつかのかかる方法は、胎児配列の同じセットで行われ得、これにより、胎児の遺伝的状態の多重化された高感度の検出を可能にする。
【0834】
本発明は、胎児起源の連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定する方法を提供し、この方法は、(a)本明細書に記載の方法のいずれかに従って連結された配列リードのセットを決定することであって、試料は母体の血液に由来する微粒子を含む、決定することと、(b)連結された配列リードのセットの各配列リード(の少なくとも一部)を、胎児ゲノムに存在する配列の参照リストと比較することと、(c)連結された配列リードのセットの1つ以上の配列リード内の参照リストからの1つ以上の配列の存在によって、胎児起源の連結された配列リードのセットを特定することと、を含む。
【0835】
胎児起源の連結された配列リードのセット(すなわち、連結されたシグナルのセット)は、胎児に由来する標的核酸の断片の配列リードを含むか、それから構成されるか、または本質的にそれから構成され得る。任意選択的に、胎児起源の連結された配列リードのセットは、胎児に由来する標的核酸の断片の配列リードを含むか、またはそれから構成され得、あるいは、1つ以上の母体組織および/もしくは母体細胞に由来する標的核酸の断片の配列リードを含むか、またはそれから構成され得る。
【0836】
胎児ゲノムに存在する配列(または配列バリアント)の参照リストは、胎児ゲノムに富む配列を含むか、それから構成されるか、または本質的にそれから構成されることができる。胎児ゲノムに存在する配列の参照リストは、(母体ゲノムと比較して)胎児ゲノムに富む配列を含むか、それから構成されるか、または本質的にそれから構成されることができる。胎児ゲノムに存在する配列の参照リストのさらなる選択肢は、参照により本明細書に組み込まれるPCT/GB2017/053820にさらに提供される。
【0837】
微粒子は、妊娠中の個体の母体血液に由来し得る。任意選択的に、微粒子は、妊娠中の個体の母体血液に由来し得、ここで、個体は、少なくとも2つの発育中の胎児を妊娠している(例えば、個体は、双子、または三つ子、または任意のより多くの発育中の胎児を妊娠している)。任意選択的に、微粒子は、妊娠が体外受精によって生成された妊娠中の個体の母体血液に由来し得る。任意選択的に、任意の体外受精プロセスは、着床前遺伝子スクリーニング、着床前遺伝子診断、着床前胚評価、および/または着床前胚選択の任意のステップをさらに含み得る。
【0838】
34.診断およびモニタリングの方法
本発明は、本明細書に記載の方法のいずれかに基づく診断およびモニタリングの方法を提供する。
【0839】
本発明は、検査対象における疾患または状態を診断する方法を提供し、ここで、この方法は、(a)対象からの検査試料から決定された連結された配列リードの第1のセット(すなわち、連結されたシグナルのセット)のパラメータ値を決定することであって、パラメータ値は、本明細書に記載の方法のいずれかに従って決定される、決定することと、(b)検査試料から決定された連結された配列リードのセットのパラメータ値をコントロールパラメータ値と比較することと、を含む。
【0840】
制御パラメータ値は、対象からの検査試料から決定された連結された配列リードの第2のセット(すなわち、連結されたシグナルのセット)から決定され得、ここで、制御パラメータ値は、本明細書に記載の方法のいずれかに従って決定される。
【0841】
制御パラメータ値は、コントロール試料から決定された連結された配列リードのセット(すなわち、連結されたシグナルのセット)から決定され得、ここで、制御パラメータ値は、本明細書に記載の方法のいずれかに従って決定される。
【0842】
疾患または状態は、がん、染色体異数性、または染色体微小欠失、ゲノムコピー数多型(例えば、コピー数多型またはコピー数多型)、ヘテロ接合性消失、再配列または転座イベント、一塩基バリアント、またはde novo突然変異であり得る。
【0843】
本発明は、検査対象における疾患または状態をモニタリングする方法を提供し、ここで、この方法は、(a)対象からの検査試料から決定された連結された配列リードの(セットのうちの)第1のセットのパラメータ値を決定することであって、パラメータ値は、本明細書に記載の方法のいずれかに従って決定される、決定することと、(b)連結された配列リードのセット(すなわち、連結されたシグナルのセット)のパラメータ値を制御パラメータ値と比較することと、を含む。
【0844】
制御パラメータ値は、検査試料よりも早い時点で同じ対象から得られたコントロール試料から決定された連結された配列リードの第2のセット(すなわち、連結されたシグナルのセット)から決定され得る。得られるコントロール試料と検査試料との間の時間間隔は、少なくとも1日、少なくとも1週間、少なくとも1ヶ月、または少なくとも1年であり得る。
【0845】
パラメータ値を決定する、かつ/または本明細書に記載の第2の分析ステップを行う任意の方法は、時間間隔によって区切られた対象からの2つ以上の異なる試料からの配列の連結されたセットに対して独立して行われ得る。ここで、2つ以上の異なる試料は同じ対象に由来しており、時間間隔は、少なくとも1日、少なくとも1週間、少なくとも1か月、少なくとも1年、少なくとも2年、または少なくとも3年である。任意のかかるパラメータ値および/または第2の分析ステップの結果は、任意の2つ以上のかかる異なる試料間で比較され得る。かかるパラメータ値および/または第2の分析ステップの結果との間の絶対的または相対的差異は、かかる比較ステップによって決定され得る。任意選択的に、かかる絶対的または相対的差異は、2つの試料間の時間間隔の長さに対して正規化および/または除算され得る。任意選択的に、かかる絶対的もしくは相対的差異および/または関連する正規化値は、1つ以上の閾値と比較され得、かかる閾値を超える値は、がんまたはがん発症のリスクの増大等の疾患または状態を示し得る。
【0846】
疾患または状態は、がんであり得る。
【0847】
本発明は、対象における疾患または状態を診断する方法を提供し、この方法は、(a)本明細書に記載の方法のいずれかに従って、連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定することであって、試料は血液に由来する微粒子を含む、決定することと、(b)連結された配列リードのセットの各配列リード(の少なくとも一部)を、疾患の細胞に存在する配列の参照リストと比較することと、を含み、ここで、1つ以上の内の参照リストからの1つ以上の配列の存在連結された配列リードのセットのより多くの配列リードは、疾患の存在を示す。
【0848】
疾患または状態は、がんであり得る。
【0849】
本発明は、罹患細胞(例えば、腫瘍細胞)起源の連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定する方法を提供し、この方法は、(a)任意の方法に従って連結された配列リードのセットを決定することであって、試料は血液に由来する微粒子を含む、決定することと、(b)連結された配列リードのセットの各配列リード(の少なくとも一部)を、疾患の細胞(例えば、腫瘍細胞)に存在する配列の参照リストと比較することと、(c)連結された配列リードのセットの1つ以上の配列リード内の参照リストからの1つ以上の配列の存在によって、罹患細胞(例えば、腫瘍細胞)起源の連結された配列リードのセットを特定することと、を含む。
【0850】
本発明は、腫瘍遺伝子型を決定する方法を提供し、(a)本明細書に記載の方法のいずれかに従って、腫瘍起源の連結された配列リードのセット(すなわち、連結されたシグナルのセット)を決定することと、(b)腫瘍起源の連結された配列リードのセットから腫瘍遺伝子型を決定することと、を含む。
【0851】
試料は、疾患(例えば、がん)と診断された患者からの血液に由来する微粒子(または複数の微粒子)を含み得る。試料は、疾患(例えば、がん)を有すると疑われる患者からの血液に由来する微粒子(または2つ以上の微粒子)を含み得る。
【0852】
任意選択的に、任意の1つ以上の疾患および/または状態を診断および/または推定またはリスクを予測および/またはモニタリングする任意の方法(複数可)において、この方法(複数可)は、さらなるステップ(すなわち、結果通信ステップ)を含み得、ここで、方法の任意の1つ以上の結果(例えば、任意の1つ以上の診断結果および/もしくは読み出し、ならびに/または任意の1つ以上の予後結果および/もしくは読み出し、ならびに/または任意の1つ以上のリスク層別化結果および/もしくは読み出し、ならびに/または任意の1つ以上のリスク推定結果および/もしくは読み出しおよび/もしくは測定値)が、患者(すなわち、1つ以上の循環微粒子を含む任意の1つ以上の試料が由来する患者)ならびに/あるいは当該患者の代理人および/もしくは家族、および/もしくは任意の1人以上の医師、看護師、および/または任意の他の医療提供者および/もしくは当該患者に医療サービスを提供する機関もしくは組織に伝達される。任意選択的に、任意の結果通信ステップは、本明細書に記載の任意の方法の最後のステップを含み得る。任意選択的に、任意の結果通信ステップは、電子メール、インターネットベースの通信および/またはインターネットベースのインターフェースおよび/または任意の電子メッセージングシステムおよび/または電話および/もしくはテキストメッセージ等の任意の電話ベースの方法等の電子媒体、ならびに/あるいは郵便等の紙ベースの方法、ならびに/あるいは対面での会話および/もしくは開示等の対面での方法を介した任意のかかる結果として得られた通信を含み得る。任意選択的に、任意のかかる結果伝達ステップにおいて、少なくとも1つのかかる結果が伝達され得る、かつ/または、任意の2つ以上のかかる結果が伝達され得る、かつ/または、全てのかかる結果が伝達され得る、かつ/または、全てのかかる結果の画分の割合または数が伝達される場合がある。
【0853】
35.微粒子ベースと非微粒子ベースの組み合わせ分析
1つ以上の循環微粒子を含む試料および/または1つ以上の循環微粒子に由来する試料を分析する方法(例えば、任意の疾患および/または状態およびまたは遺伝子配列および/または遺伝子突然変異および/または遺伝的状態または染色体または構造異常を診断および/またはモニタリングおよび/または予測する方法)は、微粒子ベースおよび非微粒子ベースの組み合わせ分析を行うために、当該循環微粒子(複数可)が取得および/または誘導された同一個体から測定され、かつ/またはそれに関連する1つ以上の非微粒子測定値もしくは因子の測定値および/または考察をさらに含み得る。
【0854】
1つ以上の循環微粒子を含む試料および/または1つ以上の循環微粒子に由来する試料を分析する方法は、同じ個体からの1つ以上の非微粒子因子(個体的因子、人口統計学的因子、臨床的/医学的因子、分子的または生化学的因子、遺伝的因子、および/もしくは健康関連または健康履歴関連の任意の他の形態の因子等)、体重、体重指数(BMI)、肥満状態、性別、年齢、民族性および/もしくは民族的背景、現在および/もしくは以前および/もしくは過去の喫煙状態、糖尿病状態(I型糖尿病状態および/もしくはII型糖尿病状態等)、1つ以上の以前の脳卒中の病歴、1つ以上の以前の一過性脳虚血発作の病歴、1つ以上の以前の妊娠の病歴、任意の形態の疾患(任意の形態の心臓病、および/もしくは心血管疾患、および/もしくはまたはがん、および/または特定のがんのタイプ(乳がんおよび/もしくは卵巣がん等))の家族歴、任意の血液、血漿、および/もしくは血清の検査または測定の結果(完全血液数(CBC)等の血液数、ならびに/または前立腺特異抗原(PSA)等)レベル、ならびに/またはPSA速度(数ヶ月および/もしくは年の期間にわたって)、ならびに/またはCA-125レベルおよび/またはCA-125速度、ならびに/または任意の代謝物測定(基本的な代謝パネル(BMP)等)、ならびに/または収縮期および/もしくは伸長期の血圧、ならびに/または血中コレステロールレベルおよび/または高血中コレステロールレベルの状態、ならびに/またはC反応性タンパク質レベル、ならびに/または任意の1つ以上の心電図(ECG)検査の結果および/もしくは解釈された結果、ならびに/または任意の1つ以上の組織生検または組織吸引物(肺生検、心臓生検、肝臓生検、および/もしくは腎臓生検等)の結果および/もしくは解釈された結果等と組み合わせることができる。任意選択的に、任意のかかる生検材料は、任意の分子病理学的プロセスもしくは技術、例えば、任意の免疫組織化学技術、任意のインサイチュハイブリダイゼーション技術(DNAおよび/もしくはRNA分子を分析するため)等の任意の分子病理学的プロセスもしくは技術、ならびに/または任意の細胞ベースまたは形態ベースの技術、ならびに/または任意の1つ以上の既存の状態(任意の肺疾患、任意の心臓病、肝臓病、腎臓病、神経疾患、および/または心理的もしくは精神医学的疾患もしくは状態)、1つ以上の医用画像検査(コンピュータ断層撮影スキャン、スパイラルコンピュータ断層撮影スキャン、低用量コンピュータ断層撮影スキャン、磁気共鳴画像スキャン、ポジトロン放出断層撮影スキャン、超音波スキャン、および/もしくは光コヒーレンストモグラフィースキャン等)の結果および/もしくは解釈された結果、ならびに/または任意の1つ以上の単一リスク対立遺伝子(乳がんもしくは卵巣がんの感応性または素因遺伝子等)の存在もしくは不在、ならびに/または多遺伝子リスクスコアもしくはリスク推定値、ならびに/または前述の測定値および/もしくは他の測定値によって評価される。ここで、当該測定は、経時的に行われ、かつ/または追跡される(月次ベースまたは年次ベース等、任意選択的に、少なくとも2つのかかる経時的測定が行われ、あるいは少なくとも3つ、または少なくとも5つ、または少なくとも10、または少なくとも20、または少なくとも100の経時的測定が行われる)。任意選択的に、2つ以上のかかる非微粒子因子(例えば、PSAレベルおよびCA-125レベル)の任意の組み合わせを測定および/または決定し、次いで、本明細書に記載されている1つ以上の循環微粒子(および/または1つ以上の循環微粒子に由来する試料)を含む試料を分析する任意の方法と併せて分析することができる。任意選択的に、任意の2つ以上のかかる非微粒子因子は、1つ以上の患者血液試料から測定および/または決定され得、ここで、当該患者血液試料(複数可)はまた、1つ以上の循環微粒子を含む当該試料(複数可)を提供する。任意選択的に、任意の1つ以上の非微粒子因子を、任意の1つ以上のカットオフおよび/または閾値および/または正常な(すなわち、健康な)範囲および/または罹患した(すなわち、不健康な)範囲と比較することができる。任意のかかる非微粒子因子が任意のかかる閾値を超える、任意のかかる閾値を下回る、任意のかかる範囲内、および/または任意のかかる範囲外の場合、健康状態(すなわち、当該患者の特定の疾患もしくは状態の健康状態、すなわち、「健康状態の読み出し」を示す)を示し得、かつ/または特定の疾患もしくは状態の疾患状態(すなわち、疾患の存在もしくはリスクを示す、すなわち、「疾患状態の読み出し」を示す)を示し得る。任意選択的に、1つ以上の循環微粒子(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法を、組み合わせ診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を作成するために、任意の数(1つ以上)の「健康状態の読み出し」および/または「疾患状態の読み出し」を組み合わせて分析することができる。任意選択的に、任意のかかる組み合わせ診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定は、アルゴリズムおよび/もしくはコンピュータプログラム(すなわち、ソフトウェア)による分析をさらに含み得、例えば、1つ以上のカテゴリ的スコアもしくは結果(高スコアもしくは低スコア、または正の結果もしくは負の結果等)、ならびに/または1つ以上の定量的もしくは数値スコア(1、2もしくは3、または、1~10もしくは1~100のスケールの数値、またはパーセンテージもしくはリスクもしくは可能性の評価等)を生成および/または計算する。ここで、当該スコアは、任意選択的に、任意の疾患、状態、または症候群の診断、予後、リスク推定または可能性および/またはリスク因子、および/またはリスクカテゴリに関連付けられるか、またはそれらを示すことができる。
【0855】
36.診断、予後、および/またはリスクの層別化またはリスク推定のための方法および使用
本発明の方法は、1つ以上のアルゴリズム(手動アルゴリズムおよび/またはコンピュータベースおよび/または定量的アルゴリズム等の自動アルゴリズム等)による、またはそれらと組み合わせた分析のステップを含み得、任意選択的に、またはさらに、診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を生成または推定するために使用され得る。1つ以上のかかる診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定は、1つ以上のカテゴリ的スコアもしくは結果(高スコアもしくは低スコア、または正な結果もしくは負の結果)、ならびに/または1つ以上の定量的もしくは数値的スコア(1、2もしくは3、または1~10もしくは1~100までのスケールの数値、またはパーセンテージもしくはリスクもしくは可能性等)を含み得る。ここで、当該スコアは、任意選択的に、任意の疾患、状態、または症候群の診断、予後、リスク推定または可能性、および/またはリスク因子および/またはリスクカテゴリに関連付けられるか、またはそれらを示すことができる。
【0856】
任意選択的に、かかる疾患、状態、または症候群は、任意の1つ以上のがんまたは前がん状態(任意の肺がん、または任意の乳がん、または任意の卵巣がん、または任意の前立腺がん、または任意の腎臓がん、肝臓がん、血液がん、白血病、リンパ腫、結腸直腸がん、膵臓がん、脳がん、子宮がん、胆管がん、皮膚がん、または黒色腫、または膀胱がん、または食道がん、または口腔がん、または咽頭がん等)を含み得る。任意選択的に、任意のかかるがんまたは前がん状態は、がんまたは前がんの病期および/またはグレード(病期1、2、3、もしくは4等)の診断または推定、および/または攻撃性の任意の尺度、ならびに/あるいは転移または転移の可能性の測定または予測または予後をさらに含み得る。
【0857】
任意選択的に、かかる疾患、状態、または症候群は、心筋梗塞、アテローム性動脈硬化症、心筋症(肥大性心筋症もしくは伸長性心筋症等)、心不全、静脈血栓症、深部静脈血栓症、塞栓症、血栓症、脳卒中(虚血性脳卒中もしくは出血性脳卒中等)、冠状動脈疾患、脳血管疾患、末梢動脈疾患、血管内プラーク、安定した血管内プラーク、不安定もしくは脆弱な血管内プラーク、弁心疾患、動脈硬化、心内膜炎、または心筋炎等の任意の1つ以上の心臓もしくは血管の疾患および/または状態を含み得る。
【0858】
任意選択的に、かかる疾患、状態、または症候群は、子癇前症、子癇、妊娠性糖尿病、早産、高血圧、深部静脈血栓症、異所性妊娠、あるいは、胎児の遺伝的および/もしくは染色体異常(1つ以上の異数性、微小欠失、コピー数多型、ヘテロ接合性の喪失、再配列もしくは転座イベント、一塩基バリアント、de novo突然変異、または任意の他のゲノムの特徴もしくは突然変異等)等の妊娠に関連する1つ以上の疾患または状態または合併症を含み得る。任意選択的に、かかる疾患、状態、または症候群は、発育中の胎児の第21染色体のトリソミー(すなわち、ダウン症候群)、および/または発育中の胎児の第13染色体のトリソミー(すなわち、パトウ症候群)、および/または発育中の胎児の第18染色体のトリソミー(すなわち、エドワーズ症候群)、および/または発育中の胎児の第9染色体のトリソミー、および/または発育中の胎児の第8染色体のトリソミー、および/またはトリプルX症候群、および/またはクラインフェルター症候群を含み得る。任意選択的に、かかる疾患、状態、または症候群は、ゲノム微小欠失、例えば、微小欠失症候群、例えば、ディ・ジョージ症候群、および/またはプラダー・ウィリ症候群、および/またはアンジェルマン症候群、および/または神経線維腫症I型および/もしくはII型、および/またはウィリアムズ症候群、および/またはミラーディッカー症候群等を含み得る。
【0859】
任意選択的に、かかる疾患、状態、または症候群は、任意の単一遺伝子疾患もしくは単遺伝子疾患素因、例えば、優勢な遺伝パターンを示す任意の単一遺伝子疾患もしくは単一遺伝子疾患素因、および/または劣性遺伝パターンを示す任意の単一遺伝子疾患もしくは単遺伝子疾患素因および/またはX連鎖遺伝パターンを示す単一遺伝子疾患もしくは単一遺伝子疾患素因を含み得る。任意選択的に、任意のかかる単一遺伝子疾患もしくは単一遺伝子疾患素因は、サラセミア疾患、および/または鎌状赤血球貧血、および/または血友病、および/またはテイサックス病、および/または嚢胞性線維症、および/またはハンチントン病、および/または脆弱X症候群を含み得る。任意選択的に、かかる単一遺伝子疾患もしくは単一遺伝子疾患素因は、胎児かかる単一遺伝子疾患もしくは単一遺伝子疾患素因(すなわち、妊娠中の母体血液試料内に含まれる胎児核酸に存在するような胎児ゲノムに存在する)を含み得る。
【0860】
任意選択的に、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法は、任意の2つ以上の疾患、状態、または症候群の複合疾患セット(本明細書に記載の2つ以上の疾患、状態、または症候群の任意の組み合わせ等)の診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を含み得る。例えば、任意のかかる方法は、組み合わされた疾患セット、例えば、肺がんおよび乳がんを含む複合疾患セット、または、肺がんおよび前立腺がんを含む複合疾患セット、または、肺がんおよび乳がんおよび結腸直腸がんを含む複合疾患セット、または、肺がんおよび前立腺がんおよび結腸直腸がんを含む複合疾患セット、または、肺がんおよび前立腺がんおよび結腸直腸がんおよび膵臓がんを含む複合疾患セット、または、肺がんおよび乳がんおよび結腸直腸がんおよび膵臓がんを含む複合疾患セット、または、肺がんおよび乳がん、結腸直腸がんおよび膵臓がんおよび卵巣がんを含む複合疾患セット、または、肺がんおよび乳がん、結腸直腸がんおよび膵臓がん、卵巣がんおよび子宮がんを含む複合疾患セット、または、前立腺がんおよび結腸直腸がんおよび膵臓がんを含む複合疾患セット、または、乳がんおよび結腸直腸がん、膵臓がんおよび卵巣がんを含む複合疾患セット、または、結腸直腸がんおよび膵臓がんを含む複合疾患セット、または、結腸直腸がんおよび膵臓がんおよび卵巣がんを含む複合疾患セット、または、結腸直腸がんおよび膵臓がんおよび卵巣がんおよび子宮を含む複合疾患セット、の各メンバーの診断、および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を含み得る。任意選択的に、任意の先行する複合疾患セットは、任意のがんの診断、および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定(すなわち、任意のタイプおよび/または任意の病期の任意のがん(および/または任意の2つまたはより多くのがん)の診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定であり、ここで、特定のがん(すなわち、複合疾患セット内の特定のタイプのがん等の特定のタイプのがん)は不明であるか、かつ/または診断されていない)をさらに含み得る。
【0861】
任意選択的に、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法は、任意の1つ以上のがんもしくは前がん状態(任意の2つ以上のがんを含む任意の複合疾患セット等)の診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を含み得る。ここで、当該診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定は、がんまたは前がんの病期および/または悪性度(病期1、2、3、もしくは4等)の推定、および/または攻撃性の測定、および/または転移(および/または転移のリスクもしくは可能性)または転移の可能性の測定もしくは予測もしくは予後を含む。
【0862】
任意選択的に、任意のタイプならびに/または任意の病期のがん(および/もしくは任意の2つ以上のがんを含む任意の複合疾患セット)の診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を含む、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法は、特定のがん(すなわち、特定のタイプのがん)が不明であるか、かつ/または診断されていない場合、「がんランク付け」プロセスをさらに含み得る。ここで、当該ランク付けプロセスは、複合疾患セット(例えば、肺がんおよび前立腺がんおよび結腸直腸がんおよび膵臓がんを含む複合疾患セット、または肺がんおよび乳がんおよび結腸直腸がんおよび膵臓がんを含む複合疾患セット、または肺がんおよび乳がんおよび結腸直腸がんおよび膵臓がんおよび卵巣がんを含む複合疾患セット)内に含まれる個々の疾患の順序付けられたリストの作成を含む。任意選択的に、当該ランク付けプロセスは、当該個々の疾患が1つ以上のペアワイズ比較(すなわち、個々の疾患対個々の疾患比較)に基づいて順序付けられるプロセスを含み得、ここで、かかるより多くのペアワイズ比較は各々、(例えば、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を含む当該分析に基づいて)2つの個々の疾患のどちらがより可能性が高いか、かつ/またはより重症であるかを評価する。
【0863】
任意選択的に、診断および/または予後、および/またはリスク層別化および/またはリスク推定の読み出しおよび/または測定を含む、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法は、任意の1つ以上の疾患からの死亡の可能性の推定および/または読み出し(例えば、任意のがん、および/または任意の特定のがん、および/または任意の2つ以上の異なる特定のがん(例えば、2つ以上の異なる特定のがんを含む任意の複合疾患セット内に含まれる任意の2つ以上の異なる特定のがん)(のうちの1つ)からの死亡の可能性の推定および/または読み出し)を含み得る。任意選択的に、死亡の可能性のかかる推定および/または読み出しを生成する任意の方法は、当該試料が人から採取された時から特定の期間内の死亡の可能性を推定および/または読み出しするように構成され得る。任意選択的に、かかる特定の期間は、3か月、6か月、9か月、12か月、18か月、2年、3年、4年、5年、6年、8年、10年、12年、15年、20年、25年、30年、35年、40年、および/または50年のいずれか1つ以上を含み得る。任意選択的に、(特定の期間内等の)死亡の可能性のかかる推定および/または読み出しを生成する任意の方法は、関連する疾患(すなわち、死亡の可能性を提供する関連疾患)は未治療のままである(すなわち、患者が当該疾患の治療および/または手術で治療されていない)場合に、死亡の可能性を推定および/または読み出しするように構成され得る。任意選択的に、(特定の期間内等の)死亡の可能性のかかる推定および/または読み出しを生成する任意の方法は、関連する疾患(すなわち、死亡の可能性を提供する関連疾患)が治療される(すなわち、患者が当該疾患の治療および/または手術で治療される)場合に、死亡の可能性を推定および/または読み出しするように構成され得る。任意選択的に、当該疾患の治療を受けている患者に基づいて計算された当該疾患による死亡の可能性を、当該疾患の治療を受けていない患者に基づいて計算された関連する疾患による死亡の可能性と比較することができる(例えば、患者が当該疾患の治療を受けた場合に期待されるまたは潜在的な生存利益を計算または推定するため、例えば、当該可能性を1または別のもので除算することができる)。
【0864】
任意の複合疾患セットは、複合胎児遺伝疾患セット、例えば、発育中の胎児におけるダウン症候群およびパトウ症候群を含む複合胎児遺伝疾患セット、または、発育中の胎児におけるダウン症候群およびエドワーズ症候群を含む複合胎児遺伝疾患セット、または、発育中の胎児におけるダウン症候群およびパトウ症候群およびエドワーズ症候群を含む複合胎児遺伝疾患セット、または、ダウン症候群およびパトウ症候群およびエドワーズ症候群および発育中の胎児における第9染色体のトリソミーを含む複合胎児遺伝疾患セット、または、ダウン症候群およびパトウ症候群およびエドワーズ症候群および発育中の胎児における第9染色体のトリソミーおよび1つ以上の微小欠失症候群を含む複合胎児遺伝疾患セット、または、ダウン症候群およびパトウ症候群およびエドワーズ症候群および発達中の胎児における第9染色体のトリソミーおよび1つ以上の微小欠失症候群および1つ以上の胎児単一遺伝子疾患もしくは胎児単一遺伝子疾患素因(サラセミアおよび/または鎌状細胞貧血、および/または血友病、および/またはテイサックス病、および/または嚢胞性線維症、および/またはハンチントン病、および/または脆弱X症候群、および/または少なくとも2つ、少なくとも3つ、または少なくとも4つのメンバーの任意の組み合わせ等)を含む複合胎児遺伝疾患セットを含み得る。
【0865】
任意選択的に、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法において、任意の循環微粒子(複数可)からの任意の2つ以上の生体分子の任意の測定値、および/または任意のかかる測定(複数可)に対応する任意の2つ以上の連結されたシグナルは、本明細書に開示される状態および/または疾患および/または組織タイプのいずれか1つ以上に関連する組織および/または細胞に由来する循環微粒子(複数可)(ならびに/または任意のかかる循環微粒子(複数可)に関連および/もしくは由来する2つ以上の連結されたシグナルの任意のセット)を特定および/または予測するために使用され得る。任意選択的に、1つ以上の循環微粒子を含む試料(および/または1つ以上の循環微粒子に由来する試料)を分析する任意の方法において、1つ以上のパラメータ値を使用して、以前および/または本明細書に開示された状態および/または疾患および/または組織タイプのいずれか1つ以上に関連する組織および/または細胞に由来する循環微粒子(複数可)を特定および/または予測することができる。例えば、任意の1つ以上のパラメータ値を1つ以上の制御パラメータ値と比較することができる。任意のかかるパラメータが、特定の特定の制御パラメータ値より上、特定の特定の制御パラメータ値より下、制御パラメータ値の特定の範囲内、および/または制御パラメータ値の特定の範囲外である場合、関連する循環微粒子(複数可)(および/またはかかる循環微粒子(複数可)に関連する、かつ/もしくはそれに由来する2つ以上の連結されたシグナルの関連するセット)が由来する組織および/または細胞タイプを示し、かつ/または予測し、かつ/または推定する。任意選択的に、循環微粒子に関連する、かつ/または連結されたシグナルのセットに関連する組織および/または細胞タイプを特定する任意のかかる方法は、任意の(および/または全ての)特定の組織および/または細胞タイプに由来すると特定および/または予測された、全ての連結されたシグナルのセット(および/または循環微粒子の総数)の総数(および/または割合)をカウントすることをさらに含み得る。任意選択的に、当該総数(および/または当該割合)は、1つ以上の閾値数および/または範囲内で比較することができ、ここで、任意のかかる総数(および/または割合)が、特定の閾値数を超える、特定の閾値数を下回る、閾値数の特定の範囲内、および/または閾値数の特定の範囲外である場合、任意の疾患、状態、または症候群の診断、予後、リスク推定、もしくは可能性および/もしくはリスク因子、および/もしくはリスクカテゴリを示し、かつ/または予測し、かつ/または推定し、かつ/または提供する。
【0866】
37.発明の方法を行うためのライブラリおよびキット
本発明はさらに、本明細書で定義される1つ以上の試薬を含むライブラリを提供する。本発明はまた、本明細書で定義される方法のいずれかを行うために特に適合されたライブラリを提供する。
【0867】
本発明はさらに、本明細書で定義される1つ以上の構成要素を含むキットを提供する。本発明はまた、本明細書で定義される方法のいずれかを行うために特に適合されたキットを提供する。
【0868】
標的核酸を標識するためのキットは、参照により本明細書に組み込まれるPCT/GB2017/053820に記載されている。
【0869】
本発明はさらに、標的核酸分子および標的生体分子を標識するためのキットを提供し、キットは、本明細書で定義されるような多量体バーコード化試薬および本明細書で定義されるようなバーコード化親和性プローブを含む。好ましくは、標的生体分子は、非核酸標的生体分子(例えば、標的ポリペプチド)である。
【0870】
本発明はさらに、標的核酸分子および標的生体分子を標識するためのキットを提供し、キットは、(a)多量体バーコード化試薬であって、多量体バーコード化試薬は、一緒に連結された第1および第2のバーコード領域を含み、各バーコード領域は、核酸配列を含む、多量体バーコード化試薬と、(b)バーコード化親和性プローブであって、バーコード化親和性プローブは、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み、親和性部分は、標的生体分子に結合することができる、バーコード化親和性プローブと、を含む。
【0871】
本発明はさらに、標的核酸および標的生体分子を標識するためのキットを提供し、キットは、(i)多量体バーコード化試薬であって、(a)一緒に連結された第1および第2のバーコード分子(すなわち、多量体バーコード分子)であって、バーコード分子の各々は、任意選択的に、5’から3’方向に、アダプター領域およびバーコード領域を含む核酸配列を含む、第1および第2のバーコード分子と、(ii)第1および第2のバーコード化オリゴヌクレオチドであって、第1のバーコード化オリゴヌクレオチドは、第1のバーコード分子のバーコード領域にアニールされたバーコード領域を含み、第2のバーコード化オリゴヌクレオチドは、第2のバーコード分子のバーコード領域にアニールされたバーコード領域を含む、第1および第2のバーコード化オリゴヌクレオチドと、を含む、多量体バーコード化試薬と、(b)第1および第2のアダプターオリゴヌクレオチドであって、第1のアダプターオリゴヌクレオチドは、任意選択的に、5’から3’方向に、第1のバーコード分子のアダプター領域にアニールすることができるアダプター領域と、標的核酸の第1の断片にアニールまたはライゲートすることができる標的領域と、を含み、第2のアダプターオリゴヌクレオチドは、任意選択的に、5’から3’方向に、第2のバーコード分子のアダプター領域にアニールすることができるアダプター領域と、標的核酸の第2の断片にアニールまたはライゲートすることができる標的領域と、を含む、第1および第2のアダプターオリゴヌクレオチドと、(c)バーコード化親和性プローブであって、バーコード化親和性プローブは、バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドは、少なくとも1つのヌクレオチドを含み、親和性部分は、標的生体分子に結合することができる、バーコード化親和性プローブと、を含む。
【0872】
キットは、バーコード化親和性プローブの代わりに(またはそれに加えて)親和性プローブを含み得る。親和性プローブは、本明細書に記載の形態のいずれかをとることができる。親和性プローブは、少なくとも1つの親和性部分を含み得、ここで、親和性部分は、標的生体分子に結合することができる。
【0873】
各アダプターオリゴヌクレオチドの標的領域は、異なる配列を含み得る。各標的領域は、核酸の試料内の標的核酸の単一の断片のみにアニールすることができる配列を含み得る。各標的領域は、標的領域が標的核酸の1つより多くの断片にアニールすることを可能にするために、1つ以上のランダム配列または1つ以上の縮重配列を含み得る。各標的領域は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも50、または少なくとも100個のヌクレオチドを含み得る。好ましくは、各標的領域は、少なくとも5つのヌクレオチドを含む。各標的領域は、5~100個のヌクレオチド、5~10個のヌクレオチド、10~20個のヌクレオチド、20~30個のヌクレオチド、30~50個のヌクレオチド、50~100個のヌクレオチド、10~90個のヌクレオチド、20~80個のヌクレオチド、30~70個のヌクレオチド、または50~60個のヌクレオチドを含み得る。好ましくは、各標的領域は、30~70個のヌクレオチドを含む。好ましくは、各標的領域はデオキシリボヌクレオチドを含み、任意選択的に、標的領域内のヌクレオチドは全てデオキシリボヌクレオチドである。デオキシリボヌクレオチドのうちの1つ以上は、修飾されたデオキシリボヌクレオチド(例えば、ビオチン部分またはデオキシウラシルヌクレオチドで修飾されたデオキシリボヌクレオチド)であり得る。各標的領域は、1つ以上のユニバーサル塩基(例えば、イノシン)、1つまたは複数の修飾ヌクレオチド、および/または1つ以上のヌクレオチド類似体を含み得る。
【0874】
標的領域は、アダプターオリゴヌクレオチドを標的核酸の断片にアニールするために使用され得、その後、プライマー伸長反応または増幅反応、例えば、ポリメラーゼ連鎖反応のためのプライマーとして使用され得る。あるいは、標的領域を使用して、アダプターオリゴヌクレオチドを標的核酸の断片にライゲートすることができる。標的領域は、アダプターオリゴヌクレオチドの5’末端にあってもよい。かかる標的領域は、リン酸化され得る。これにより、標的領域の5’末端を標的核酸の断片の3’末端にライゲートすることが可能になり得る。
【0875】
アダプターオリゴヌクレオチドは、アダプター領域と標的領域との間にリンカー領域を含み得る。リンカー領域は、第1および第2のバーコード分子(すなわち、多量体バーコード分子)にアニールされておらず、かつ標的核酸の断片に非相補的である1つ以上の隣接ヌクレオチドを含み得る。リンカーは、1~100、5~75、10~50、15~30、または20~25個の非相補的ヌクレオチドを含み得る。好ましくは、リンカーは、15~30個の非相補的ヌクレオチドを含む。かかるリンカー領域の使用は、本明細書に記載のキットを使用して行われるバーコード化反応の効率を高める。
【0876】
キットの構成要素の各々は、本明細書で定義された形態のいずれかを取ることができる。
【0877】
構成要素は、物理的に分離された構成要素としてキットに含まれている場合がある。
【0878】
キットは、(a)一緒に連結された少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75または少なくとも100のバーコード分子を含む多量体バーコード化試薬であって、各バーコード分子は、本明細書で定義されている通りである、多量体バーコード化試薬と、(b)各バーコード分子にアニールすることができるアダプターオリゴヌクレオチドであって、各アダプターオリゴヌクレオチドが本明細書で定義される通りである、アダプターオリゴヌクレオチドと、を含み得る。
【0879】
図2は、標的核酸を標識するための多量体バーコード化試薬とアダプターオリゴヌクレオチドを含むキットを示している。より詳細には、キットは、第1(D1、E1、およびF1)および第2(D2、E2、およびF2)バーコード分子を含み、各々がバーコード領域(E1およびE2)ならびに5’アダプター領域(F1およびF2)を組み込んでいる。これらの第1および第2のバーコード分子は、この実施形態では、結合核酸配列(S)によって一緒に連結されている。
【0880】
キットはさらに、第1(A1およびB1)ならびに第2(A2およびB2)バーコード化オリゴヌクレオチドを含み、これらは各々バーコード領域(B1およびB2)ならびに5’領域(A1およびA2)を含む。各バーコード化オリゴヌクレオチドの5’領域は、バーコード分子(D1およびD2)の3’領域に相補的であり、したがってアニールすることができる。バーコード領域(B1およびB2)は、バーコード分子のバーコード領域(E1およびE2)を相補的であり、したがってアニールすることができる。
【0881】
キットはさらに、第1(C1およびG1)ならびに第2(C2およびG2)アダプターオリゴヌクレオチドを含み、各アダプターオリゴヌクレオチドは、バーコード分子(F1およびF2)の5’アダプター領域に相補的であり、したがってそれに対してアニールすることができるアダプター領域(C1およびC2)を含む。これらのアダプターオリゴヌクレオチドは、5’末端リン酸基を含むように合成され得る。各アダプターオリゴヌクレオチドはまた、標的領域(G1およびG2)を含み、これは、バーコード化アダプターオリゴヌクレオチド(A1、B1、C1およびG1、ならびにA2、B2、C2およびG2)を標的核酸にアニールするために使用され得、次いで、プライマー伸長反応またはポリメラーゼ連鎖反応のプライマーとして使用され得る。
【0882】
キットは、各多量体バーコード化試薬が本明細書で定義される通りである2つ以上の多量体バーコード化試薬のライブラリ、および各アダプターオリゴヌクレオチドが本明細書で定義される通りである多量体バーコード化試薬用の各々のアダプターオリゴヌクレオチドを含み得る。第1の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、第2の多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0883】
キットは、本明細書で定義されるように、少なくとも5、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108または少なくとも109個の多量体バーコード化試薬を含むライブラリを含み得る。好ましくは、キットは、本明細書で定義されるような少なくとも10個の多量体バーコード化試薬を含むライブラリを含む。キットは、多量体バーコード化試薬の各々のためのアダプターオリゴヌクレオチドをさらに含み得、ここで、各アダプターオリゴヌクレオチドは、本明細書で定義されるアダプターオリゴヌクレオチドの任意の形態をとることができる。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0884】
各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の他の多量体バーコード化試薬の全てのバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬の第1および第2のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0885】
各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも4、少なくとも9、少なくとも19、少なくとも24、少なくとも49、少なくとも74、少なくとも99、少なくとも249、少なくとも499、少なくとも999(すなわち、103-1)、少なくとも104-1、少なくとも105-1、少なくとも106-1、少なくとも107-1、少なくとも108-1、または少なくとも109-1個の他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の他の多量体バーコード化試薬の全てのバーコード化オリゴヌクレオチドのバーコード領域とは異なり得る。好ましくは、各多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域は、ライブラリ内の少なくとも9つの他の多量体バーコード化試薬のバーコード化オリゴヌクレオチドのバーコード領域とは異なる。
【0886】
好ましくは、キットは、少なくとも2つの異なるバーコード化親和性プローブを含み、少なくとも2つの異なるバーコード化親和性プローブのうちの少なくとも2つの各々が、異なる標的生体分子に結合することができる。
【0887】
本発明は、以下の組の番号付けされた条項でさらに定義される。
1.循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、
(a)試料をバーコード化親和性プローブと接触させることであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、接触させることと、
(b)反応混合物を形成することであって、反応混合物を形成するステップが、存在する場合、親和性部分を標的分子に結合して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することを含む、形成することと、
(c)反応混合物中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することによって、試料中の標的生体分子の存在、不在、および/またはレベルを決定することと、を含む、方法。
【0888】
2.循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、循環微粒子が標的生体分子を含み、
(a)試料をバーコード化親和性プローブと接触させることであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、接触させることと、
(b)反応混合物を形成することであって、反応混合物を形成するステップが、親和性部分を標的生体分子に結合して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することを含む、形成することと、
(c)反応混合物中のバーコード化オリゴヌクレオチドのレベルを測定することによって、試料中の標的生体分子のレベルを決定することと、を含む、方法。
【0889】
3.循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、
(a)試料を少なくとも1つの親和性部分と接触させることであって、親和性部分が標的生体分子に結合することができる、接触させることと、
(b)反応混合物を形成することであって、反応混合物を形成するステップが、(i)存在する場合、親和性部分を標的生体分子に結合することと、(ii)試料をバーコード化オリゴヌクレオチドと接触させ、バーコード化オリゴヌクレオチドを親和性部分に連結して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することと、を含み、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含む、形成することと、
(c)反応混合物中のバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを測定することによって、試料中の標的生体分子の存在、不在、および/またはレベルを決定することと、を含む、方法。
【0890】
4.循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、循環微粒子が標的生体分子を含み、
(a)試料を少なくとも1つの親和性部分と接触させることであって、親和性部分が標的生体分子に結合することができる、接触させることと、
(b)反応混合物を形成することであって、反応混合物を形成するステップが、(i)親和性部分を標的生体分子に結合することと、(ii)試料をバーコード化オリゴヌクレオチドと接触させ、バーコード化オリゴヌクレオチドを親和性部分に連結して、バーコード化親和性プローブおよび標的生体分子を含むバーコード化生体分子複合体を形成することと、を含み、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含む、形成することと、
(c)反応混合物中のバーコード化オリゴヌクレオチドのレベルを測定することによって、試料中の標的生体分子のレベルを決定することと、を含む、方法。
【0891】
5.試料が少なくとも2つの異なるバーコード化親和性プローブと接触する、条項1~4のいずれか1項に記載の方法。
【0892】
6.バーコード化親和性プローブがアプタマーを含み、任意選択的に、バーコード化親和性プローブがアプタマーである、条項1~5のいずれか1項に記載の方法。
【0893】
7.親和性部分が抗体またはアプタマーである、条項1~5のいずれか1項に記載の方法。
【0894】
8.バーコード化親和性プローブが少なくとも2つの親和性部分を含む、条項1~7のいずれか1項に記載の方法。
【0895】
9.バーコード化親和性プローブが少なくとも2つの異なるバーコード化オリゴヌクレオチドを含む、条項1~8のいずれか1項に記載の方法。
【0896】
10.バーコード化オリゴヌクレオチドが、それが連結されている親和性部分に関連するおよび/またはそれを特定するバーコード配列を含む、条項1~9のいずれか1項に記載の方法。
【0897】
11.バーコード化オリゴヌクレオチドが、少なくとも2、少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個のヌクレオチドのバーコード配列を含む、条項1~10のいずれか1項に記載の方法。
【0898】
12.ステップ(c)がバーコード化オリゴヌクレオチドのヌクレオチド配列を分析することを含み、任意選択的に、配列が配列決定またはPCRによって分析される、条項1~11のいずれか1項に記載の方法。
【0899】
13.ステップ(b)またはステップ(c)が、第1の循環微粒子の少なくとも2つのバーコード化生体分子複合体を一緒に連結することと、第2の循環微粒子の少なくとも2つのバーコード化生体分子複合体を一緒に連結することと、を含む、条項1~12のいずれか1項に記載の方法。
【0900】
14.標的生体分子がポリペプチドまたは標的核酸の断片である、条項1~13のいずれか1項に記載の方法。
【0901】
15.試料が微粒子の標的核酸の断片をさらに含む、条項1~14のいずれか1項に記載の方法。
【0902】
16.試料が第1の循環微粒子および第2の循環微粒子を含むか、または試料が第1の循環微粒子および第2の循環微粒子に由来し、ステップ(b)が、バーコード化親和性プローブおよび第1の循環微粒子の標的生体分子を含む少なくとも1つのバーコード化生体分子複合体を形成することと、バーコード化親和性プローブおよび第2の循環微粒子の標的生体分子を含む少なくとも1つのバーコード生体分子複合体を形成することと、を含む、条項1~15のいずれか1項に記載の方法。
【0903】
17.試料が、第1の循環微粒子の標的核酸の断片および第2の循環微粒子の標的核酸の断片をさらに含む、条項1~16のいずれか1項に記載の方法。
【0904】
18.ステップ(c)が、(i)反応混合物を、少なくとも2つの多量体バーコード化試薬を含むライブラリと接触させることであって、各多量体バーコード化試薬が、一緒に連結された第1のバーコード領域および第2のバーコード領域を含み、各バーコード領域が核酸配列を含み、第1の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域が、ライブラリの第2の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域とは異なる、接触させることと、(ii)バーコード配列を第1の微粒子の標的核酸の第1の断片および標的核酸の第2の断片の各々に付加して、第1の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第1の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、バーコード配列を第2の微粒子の標的核酸の第1の断片および標的核酸の第2の断片の各々に付加して、第2の微粒子に対する第1および第2のバーコード化標的核酸分子を生成することであって、第1のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第1のバーコード領域の核酸配列を含み、第2のバーコード化標的核酸分子が、第2の多量体バーコード化試薬の第2のバーコード領域の核酸配列を含む、生成することと、を含む、条項16または条項17に記載の方法。
【0905】
19.第1の微粒子の標的核酸の第1の断片が、第1の循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチドであり、第2の微粒子の標的核酸の第1の断片が、第2の循環微粒子の少なくとも1つのバーコード化生体分子複合体のバーコード化オリゴヌクレオチドである、条項18に記載の方法。
【0906】
20.反応混合物が、第1の循環微粒子の標的核酸の断片をさらに含み、第1の循環微粒子の標的核酸の第2の断片が、第1の循環微粒子の標的核酸の断片である、条項18または条項19に記載の方法。
【0907】
21.反応混合物が、第2の循環微粒子の標的核酸の断片をさらに含み、第2の循環微粒子の標的核酸の第2の断片が、第2の循環微粒子の核酸標的の断片である、条項18~20のいずれか1項に記載の方法。
【0908】
22.反応混合物を多量体バーコード化試薬のライブラリと接触させるステップが、単一の隣接する水性体積中で行われる、条項18~21のいずれか1項に記載の方法。
【0909】
23.ステップ(c)が単一の隣接する水性体積中で行われ、任意選択的に、ステップ(b)および(c)が単一の隣接する水性体積中で行われ、任意選択的に、ステップ(a)、(b)、および(c)が単一の隣接する水性体積中で行われる、条項18~22のいずれか1項に記載の方法。
【0910】
24.方法が、試料または反応混合物を少なくとも第1の区画および第2の区画に区画化することと、第1の区画および第2の区画の各々内のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析することと、をさらに含み、第1の区画が、第1の循環微粒子の少なくとも1つのバーコード化生体分子複合体に含まれるか、またはそれに由来する少なくとも1つのバーコード化オリゴヌクレオチドを含み、第2の区画が、第2の循環微粒子の少なくとも1つのバーコード化生体分子複合体に含まれるか、またはそれに由来する少なくとも1つのバーコード化オリゴヌクレオチドを含む、条項16または条項17に記載の方法。
【0911】
25.バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップが、(i)第1の区画バーコード配列を第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加することと、(ii)第2の区画バーコード配列を第2区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加することと、を含む、条項24に記載の方法。
【0912】
26.当該第1の区画バーコード配列と第2の区画バーコード配列が異なる、条項25に記載の方法。
【0913】
27.第1の区画バーコード配列が、第1の区画バーコード配列セット由来であり、第2の区画バーコード配列が、第2の区画バーコード配列セット由来であり、第1の区画バーコード配列セットと第2の区画バーコード配列セットが異なる、条項25に記載の方法。
【0914】
28.当該第1の区画バーコード配列が、第1の多量体バーコード化試薬のバーコード領域の核酸配列であり、第2の区画バーコード配列が、第2の多量体バーコード化試薬の核酸配列であり、第1の多量体バーコード化試薬および第2の多量体バーコード化試薬が各々、一緒に連結された2つ以上のバーコード領域を含む、条項25~27のいずれか1項に記載の方法。
【0915】
29.第1の区画が、第1の循環微粒子の標的核酸の断片をさらに含み、第2の区画が、第2の循環微粒子の標的核酸の断片をさらに含む、条項25~28のいずれか1項に記載の方法。
【0916】
30.バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップが、(i)第1の区画バーコード配列を第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列を第1の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列を第2区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列を第2の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、を含み、当該第1の区画バーコード配列と第2の区画バーコード配列が異なる、条項29に記載の方法。
【0917】
31.バーコード化生体分子複合体のバーコード化オリゴヌクレオチドのヌクレオチド配列を分析するステップが、(i)第1の区画バーコード配列セットの第1の区画バーコード配列を、第1の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第1の区画バーコード配列セットの第2の区画バーコード配列を第1の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、(ii)第2の区画バーコード配列セットの第1の区画バーコード配列を第2の区画の少なくとも1つのバーコード化オリゴヌクレオチドに付加し、第2の区画バーコード配列セットの第2の区画バーコード配列を、第2の循環微粒子の標的核酸の少なくとも1つの断片に付加することと、を含み、第1の区画バーコード配列セットと第2の区画バーコード配列セットが異なる、条項29に記載の方法。
【0918】
32.第1の区画バーコード配列セットの第1の区画バーコード配列および第2の区画バーコード配列が、第1の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域の核酸配列であり、第2の区画バーコード配列セットの第1の区画バーコード配列および第2の区画バーコード配列が、第2の多量体バーコード化試薬の第1のバーコード領域および第2のバーコード領域の核酸配列であり、第1の多量体バーコード化試薬および第2の多量体バーコード化試薬が各々、一緒に連結された2つ以上のバーコード領域を含む、条項31に記載の方法。
【0919】
33.循環微粒子またはそれに由来する試料中の標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブの使用であって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが、少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、使用。
【0920】
34.標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が標的生体分子に結合することができる、バーコード化親和性プローブ。
【0921】
35.少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定するためのバーコード化親和性プローブのライブラリであって、ライブラリが、(i)バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含む第1のバーコード化親和性プローブであって、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が第1の標的生体分子に結合することができる、第1のバーコード化親和性プローブと、(ii)バーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含む第2のバーコード化親和性プローブであって、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が第2の標的生体分子に結合することができる、第2のバーコード化親和性プローブと、を含み、第1の標的生体分子と第2の標的生体分子が異なる、ライブラリ。
【0922】
36.少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、各区画が、平均して、n個未満の循環微粒子を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含み、任意選択的に、nが、1000、500、200、100、50、40、30、20、10、5、4、3、2、1、0.5、0.4、0.3、0.2、0.1、0.05、0.04、0.03、0.02、0.01、0.005、0.001、0.0005、または0.0001である、方法。
【0923】
37.少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、第1の区画が第1の循環微粒子の少なくとも第1および第2の標的生体分子を含み、第2の区画が第2の循環微粒子の少なくとも第1および第2の標的生体分子を含み、各区画が、平均して、[X]未満の総DNA質量を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含み、任意選択的に、[X]が、1.0アトグラムのDNA、10アトグラムのDNA、100アトグラムのDNA、1.0フェムトグラムのDNA、10フェムトグラムのDNA、100フェムトグラムのDNA、1.0ピコグラムのDNA、10ピコグラムのDNA、100ピコグラムのDNA、または1.0ナノグラムのDNAである、方法。
【0924】
38.少なくとも2つの循環微粒子を含む試料または少なくとも2つの循環微粒子に由来する試料を分析する方法であって、(i)試料を少なくとも2つの区画に区画化することであって、第1の区画が第1の循環微粒子の少なくとも第1および第2の標的生体分子を含み、第2の区画が第2の循環微粒子の少なくとも第1および第2の標的生体分子を含み、各区画が、平均して、[Y]未満の総タンパク質質量を含む、区画化することと、(ii)少なくとも2つの区画のうちの少なくとも2つの各々中の少なくとも2つの標的生体分子の存在、不在、および/またはレベルを決定することと、を含み、任意選択的に、[Y]が、1.0アトグラムのタンパク質、10アトグラムのタンパク質、100アトグラムのタンパク質、1.0フェムトグラムのタンパク質、10フェムトグラムのタンパク質、100フェムトグラムのタンパク質、1.0ピコグラムのタンパク質、10ピコグラムのタンパク質、100ピコグラムのタンパク質、または1.0ナノグラムのタンパク質である、方法。
【0925】
39.方法が、当該第1の区画および第2の区画の各々に区画化された少なくとも2つの標的核酸分子の配列を分析することをさらに含む、条項36~38のいずれか1項に記載の方法。
【0926】
本発明は、以下の組の番号付けされた条項でさらに定義される。
1.循環微粒子を含む試料または循環微粒子に由来する試料を分析する方法であって、循環微粒子が少なくとも3つの標的分子を含み、標的分子のうちの少なくとも2つがゲノムDNA断片であり、標的分子のうちの少なくとも1つが標的ポリペプチドであり、方法が、標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも2つの連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの少なくとも1つが、試料中のゲノムDNA断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの少なくとも1つが、試料中の標的ポリペプチドの存在、不在、および/またはレベルに対応する、方法。
【0927】
2.ゲノムDNA断片が特定のヌクレオチド配列を含み、かつ/またはゲノムDNA断片が少なくとも1つの修飾ヌクレオチドまたは核酸塩基を含み、任意選択的に、修飾ヌクレオチドまたは核酸塩基が5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンである、条項1に記載の方法。
【0928】
3.標的ポリペプチドが特定のアミノ酸配列を含み、かつ/または標的ポリペプチドが翻訳後修飾を含み、任意選択的に、標的ポリペプチドがアセチル化アミノ酸残基および/またはメチル化アミノ酸残基を含む、条項1または条項2に記載の方法。
【0929】
4.方法が、循環微粒子の標的分子の各々の存在、不在、および/またはレベルに対応するシグナルを測定して、循環微粒子に対する少なくとも3つの連結されたシグナルのセットを生成することを含み、連結されたシグナルのうちの1つが、循環微粒子の第1のゲノムDNA断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの1つが、循環微粒子の第2のゲノムDNA断片の存在、不在、および/またはレベルに対応し、連結されたシグナルのうちの1つが、循環微粒子の標的ポリペプチドの存在、不在、および/またはレベルに対応する、条項1~3のいずれか1項に記載の方法。
【0930】
5.ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々の配列を分析することを含み、任意選択的に、ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々の少なくとも一部を配列決定することを含む、条項1~4のいずれか1項に記載の方法。
【0931】
6.ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、
(a)少なくとも2つのゲノムDNA断片のうちの少なくとも2つを連結して、少なくとも2つの連結されたゲノムDNA断片のセットを生成することと、
任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含む、条項1~5のいずれか1項に記載の方法。
【0932】
7.ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、
(a)循環微粒子の少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々をバーコード配列に付加して、連結されたゲノムDNA断片のセットを生成することと、
任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み、少なくとも2つの連結された配列リードがバーコード配列によって連結される、条項1~6のいずれか1項に記載の方法。
【0933】
8.ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、
(a)循環微粒子の少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々をバーコード配列セットの異なるバーコード配列に付加して、連結されたゲノムDNA断片のセットを生成することと、
任意選択的に、(b)セット内の連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することと、を含み、少なくとも2つの連結された配列リードがバーコード配列セットによって連結される、条項1~6のいずれか1項に記載の方法。
【0934】
9.ゲノムDNA断片が少なくとも1つの修飾ヌクレオチドまたは核酸塩基を含み、ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定するステップが、ゲノムDNA断片の修飾ヌクレオチドまたは核酸塩基の存在、不在、および/またはレベルに対応するシグナルを測定することを含み、任意選択的に、修飾ヌクレオチドまたは核酸塩基が5-メチルシトシンまたは5-ヒドロキシ-メチルシトシンである、条項1~8のいずれか1項に記載の方法。
【0935】
10.修飾ヌクレオチドまたは核酸塩基の存在、不在、および/またはレベルに対応するシグナルが、(i)バーコード化親和性プローブであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が修飾ヌクレオチドまたは核酸塩基に結合することができ、任意選択的に、シグナルが、配列決定によりバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって測定される、バーコード化親和性プローブ、および/または(ii)光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブを使用して測定され、任意選択的に、シグナルが、フローサイトメトリーおよび/または蛍光活性化細胞選別によって測定される、条項9に記載の方法。
【0936】
11.標的ポリペプチドの存在、不在、および/またはレベルに対応するシグナルが、(i)バーコード化親和性プローブであって、バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、親和性部分が標的ポリペプチドに結合することができ、任意選択的に、シグナルが、配列決定によりバーコード化オリゴヌクレオチドの存在、不在、および/またはレベルを決定することによって測定される、バーコード化親和性プローブ、および/または(ii)光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブを使用して測定され、任意選択的に、シグナルが、フローサイトメトリーおよび/または蛍光活性化細胞選別によって測定される、条項1~10のいずれか1項に記載の方法。
【0937】
12.循環微粒子が、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の標的分子を含み、方法が、循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、条項1~11のいずれか1項に記載の方法。
【0938】
13.標的分子が、少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個のゲノムDNA断片を含み、任意選択的に、方法が、循環微粒子に対する少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、条項1~12のいずれか1項に記載の方法。
【0939】
14.標的分子が、少なくとも2、少なくとも3、少なくとも4、少なくとも9、少なくとも49、少なくとも99、少なくとも499、少なくとも999、少なくとも4999、少なくとも9,999、少なくとも99,999、または少なくとも999,999個の標的ポリペプチドを含み、任意選択的に、方法が、循環微粒子に対する少なくとも少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10,000、少なくとも100,000、または少なくとも1,000,000個の連結されたシグナルのセットを生成することを含む、条項1~13のいずれか1項に記載の方法。
【0940】
15.試料が、第1の循環微粒子および第2の循環微粒子を含み、各循環微粒子が、条項1~14のいずれか1項に定義される少なくとも3つの標的分子を含み、方法が、条項1~14のいずれか1項に記載の測定するステップを行って、第1の循環微粒子に対する連結されたシグナルのセットを生成することと、条項1~14のいずれか1項に記載の測定するステップを行って、第2の循環微粒子に対する連結されたシグナルのセットを生成することと、を含み、任意選択的に、試料が、n個の循環微粒子を含み、各循環微粒子が、条項1~14のいずれか1項に定義される少なくとも3つの標的分子を含み、方法が、各循環微粒子に対する条項1~14のいずれか1項に記載の測定するステップを行って、各循環微粒子に対する連結されたシグナルのセットを生成することを含み、任意選択的に、nが、少なくとも3、少なくとも5、少なくとも10、少なくとも50、少なくとも100、少なくとも1000、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、少なくとも10,000,000、または少なくとも100,000,000個の循環微粒子である、条項1~14のいずれか1項に記載の方法。
【0941】
本発明は、さらなる目的およびその利点とともに、添付の図面と一緒に取られた説明を参照することによって最もよく理解され得る。
【図面の簡単な説明】
【0942】
【
図1】
図3または
図4に示す方法で使用できる多量体バーコード化試薬を示している。
【
図2】標的核酸を標識するための多量体バーコード化試薬とアダプターオリゴヌクレオチドを含むキットを示している。
【
図3】多量体バーコード化試薬を使用して配列決定するための核酸試料を調製する第1の方法を示している。
【
図4】多量体バーコード化試薬を使用して配列決定するための核酸試料を調製する第2の方法を示している。
【
図5】多量体バーコード化試薬およびアダプターオリゴヌクレオチドを使用して配列決定するための核酸試料の調製方法を示している。
【
図6】多量体バーコード化試薬、アダプターオリゴヌクレオチド、および標的オリゴヌクレオチドを使用して配列決定するための核酸試料の調製方法を示している。
【
図7】ローリングサークル増幅法を使用して多量体バーコード分子を組み立てる方法を示している。
【
図8】
図3、
図4および/または
図5に示される方法で使用され得る標的核酸を標識するための多量体バーコード化試薬を合成する方法を示している。
【
図9】
図3および/または
図4に示される方法で使用され得る標的核酸を標識するための多量体バーコード化試薬(
図1に示される)を合成する代替方法を示している。
【
図10】各バーコード配列内のヌクレオチドの総数を示すグラフである。
【
図11】配列決定された各多量体バーコード分子内の固有のバーコード分子の総数を示すグラフである。
【
図12】分析スクリプトで検出された代表的な多量体バーコード分子を示している。
【
図13】バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を用いて既知配列の合成DNAテンプレートをバーコード化した後の分子配列識別子数に対する分子配列識別子あたりの固有バーコード数を示すグラフである。
【
図14】多量体バーコード化試薬および個別のアダプターオリゴヌクレオチドを用いて既知配列の合成DNAテンプレートをバーコード化した後の分子配列識別子数に対する分子配列識別子あたりの固有バーコード数を示すグラフである。
【
図15】バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を用いて、3つのヒト遺伝子(BRCA1、HLA-A、DQB1)のゲノムDNA遺伝子座をバーコード化した結果を示す表である。
【
図16】バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を用いて、ゲノムDNA遺伝子座をバーコード化して得られた配列リードの概略図である。
【
図17】同じ合成テンプレート分子上の配列を合成テンプレート分子の数に対して標識した、同じ多量体バーコード化試薬からのバーコードの数を示すグラフである。
【
図18】微粒子からの2つ以上の配列を決定し、かつ情報的に連結する方法を示している。
【
図19】特定の微粒子からの配列が共有識別子によって連結される方法を示している。
【
図20-1】分子バーコードが区画化された微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間のリンケージを提供する方法を示している。
【
図20-2】分子バーコードが区画化された微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間のリンケージを提供する方法を示している。
【
図21-1】分子バーコードが多量体バーコード化試薬によって微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間のリンケージを提供する特定の方法を示している。
【
図21-2】分子バーコードが多量体バーコード化試薬によって微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間のリンケージを提供する特定の方法を示している。
【
図22-1】個々の微粒子内のゲノムDNAの断片を互いに付加し、結果として得られた分子を配列決定する方法であって、同じ微粒子からのゲノムDNAの2つ以上の断片からの配列が同じ配列決定分子から決定され、それによって同じ微粒子内の断片間のリンケージを確立する方法を示している。
【
図22-2】個々の微粒子内のゲノムDNAの断片を互いに付加し、結果として得られた分子を配列決定する方法であって、同じ微粒子からのゲノムDNAの2つ以上の断片からの配列が同じ配列決定分子から決定され、それによって同じ微粒子内の断片間のリンケージを確立する方法を示している。
【
図23】微粒子の大きな試料からの個々の微粒子(および/または微粒子の小さな群)が2つ以上の別個の個々の配列決定反応で配列決定され、したがって、かかる各配列決定反応から決定される配列が情報的に連結されていると決定され、同じ個々の微粒子(および/または微粒子の小さな群)に由来すると予測される方法を示している。
【
図24-1】個々の微粒子内のゲノムDNAの断片を配列決定の前に配列決定フローセルの個別の領域に付加して、当該フローセル上で配列決定された断片の近接性により、同じ微粒子に由来する配列間のリンケージが提供される特定の方法を示している。
【
図24-2】個々の微粒子内のゲノムDNAの断片を配列決定の前に配列決定フローセルの個別の領域に付加して、当該フローセル上で配列決定された断片の近接性により、同じ微粒子に由来する配列間のリンケージが提供される特定の方法を示している。
【
図25】バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントA」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。特異な染色体セグメント内でのリードの明確なクラスター化を伴う、ヒトゲノムにおける全ての染色体にわたる配列リードの密度が示されている。
【
図26】バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントB」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。特異な染色体セグメント内でのリードの明確なクラスター化を伴う、ヒトゲノムにおける全ての染色体にわたる配列リードの密度が示されている。
【
図27】バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントB」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。示されているのは、特定の染色体セグメント内で拡大された配列リードの密度であり、これらの連結されたリードの焦点の高密度の性質を示している。
【
図28】バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントC」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。ヒトゲノムの全染色体にわたる配列リードの密度を示しており、染色体セグメントが他のバリアント法に比べて大きくなっているが、特異な染色体セグメントの中にリードが明確にクラスター化している(バリアントAまたはBと比較してバリアントC内でより大きな微粒子がペレット化されているため)。
【
図29】ネガティブコントロール実験を示しており、この実験では、バーコード化オリゴヌクレオチドに付加される前に、ゲノムDNAの断片が精製される(すなわち、連結が解除される)。リードのクラスター化はまったく観察されず、循環微粒子が、焦点のある隣接するゲノム領域からのゲノムDNAの断片を含むことを確認する。
【
図30】単一の循環微粒子の標的分子のマルチパラメトリック測定の概念を示している。
【
図31-1】バーコード化親和性プローブおよび区画化ステップを使用して、標的生体分子を測定する方法を示している。
【
図31-2】バーコード化親和性プローブおよび区画化ステップを使用して、標的生体分子を測定する方法を示している。
【
図32-1】バーコード化親和性プローブおよび多量体バーコード化試薬を使用して、標的生体分子を測定する方法を示している。
【
図32-2】バーコード化親和性プローブおよび多量体バーコード化試薬を使用して、標的生体分子を測定する方法を示している。
【
図33】循環微粒子を含む試料を分析する方法(および関連する実験結果)を示し、循環微粒子はゲノムDNAの断片とタンパク質を含み、この方法は抗体コンジュゲートビーズベースのアプローチを使用したタンパク質の測定、およびその後のゲノムDNAの断片のバーコード化と配列決定を含む。
【
図34】循環微粒子を含む試料を分析する方法(および関連する実験結果)を示し、循環微粒子はゲノムDNAの断片およびタンパク質を含み、この方法は抗体コンジュゲートビーズベースのアプローチを使用したタンパク質の測定を含み、修飾核酸塩基を測定するステップも行われ、その後、ゲノムDNAの断片のバーコード化および配列決定が行われる。
【
図35】循環微粒子を含む試料を分析する方法(および関連する実験結果)を示し、循環微粒子は、ゲノムDNAの断片と第1のタンパク質および第2のタンパク質を含み、この方法は、抗体コンジュゲートビーズベースのアプローチを使用した第1のタンパク質の測定と、バーコード化親和性プローブを使用した第2のタンパク質の測定と、その後のゲノムDNAの断片およびバーコード化親和性プローブからの配列のバーコード化および配列決定とを含む。
図18~35の各々の詳細な説明を以下に示す。
【0943】
図18は、微粒子からの2つ以上の配列が決定され、情報的に連結される方法を示している。この方法では、血液、血漿、または血清試料内に含まれるか、またはそれらに由来する微粒子は、ゲノムDNAの2つ以上の断片を含む。ゲノムDNAのこれらの断片の少なくとも一部の配列が決定される。さらに、1つ以上の方法を介して、微粒子からの第1および第2の配列が連結されるように、情報的リンケージが確立される。
【0944】
このリンケージは、共有識別子(例えば、分子バーコード化処理中に当該第1および第2のゲノムDNA配列に付加され得る共有バーコードから導出され得る)等の任意の形態をとることができる。任意の他の共有プロパティを使用して、2つの配列を連結することもできる。配列自体を含むデータは、共有電子記憶媒体またはその区画内に含まれ得る。さらに、リンケージは、非バイナリ値または相対値を含み得、例えば、空間的に計測された配列決定反応内の2つの断片の物理的近接を表すか、または2つの配列が同じ微粒子内に含まれるゲノムDNAの断片に由来し得る推定可能性もしくは確率を表す。
【0945】
図19は、特定の微粒子からの配列が共有識別子によって連結される方法を示している。この方法では、2つの異なる微粒子(例えば、単一の血液、血漿、または血清試料に由来する2つの異なる微粒子)内に含まれるゲノムDNAの断片からのいくつかの配列が、例えば、核酸配列決定反応によって決定される。第1の微粒子からのゲノムDNAの断片に対応する配列は、各々同じ情報識別子(ここでは、識別子「0001」)に割り当てられ、第2の微粒子からのゲノムDNAの断片に対応する配列は、各々、同じ、異なる情報識別子(ここでは、識別子「0002」)に割り当てられる。したがって、配列および対応する識別子のこの情報は、同じ微粒子に由来する配列間の非情報的リンケージを含み、異なる識別子のセットが情報的リンケージの機能を果たす。
【0946】
図20-1及び20-2は、分子バーコードが区画化された微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間のリンケージを提供する方法を示している。この方法では、微粒子の試料からの微粒子が2つ以上の区画に区画化され、次に微粒子内のゲノムDNAの断片が区画内でバーコード化され、次にバーコードがどの区画からの配列に由来するか特定されるように配列が決定され、それによって個々の微粒子からの異なる配列が連結される。
【0947】
第1のステップでは、微粒子は2つ以上の区画に区画化される(例えば、異なる物理的反応容器、またはエマルジョン内の異なる液滴を含むことができる)。次に、ゲノムDNAの断片が、各区画内の微粒子から放出される(すなわち、断片は、バーコード化できるように物理的にアクセス可能になる)。この放出ステップは、高温インキュベーションステップとともに、および/または分子溶媒または化学的界面活性剤とのインキュベーションにより行われ得る。任意選択的に(但し、本明細書には示されていない)、バーコード配列を付加する前に、増幅ステップがこの時点で行われ、これにより、ゲノムDNAの断片の全てまたは一部が(PCR反応等の際に)少なくとも1回複製されるようになり、その後、バーコード配列が結果として得られた複製産物に付加され得る。
【0948】
次に、バーコード配列がゲノムDNAの断片に付加される。バーコード配列は、バーコード領域を含むプライマー、または多量体バーコード化試薬中のバーコード化オリゴヌクレオチド、または多量体バーコード分子中のバーコード分子等の任意の形態をとり得る。バーコード配列は、任意の手段によって、例えば、プライマー伸長および/もしくはPCR反応、または一本鎖もしくは二本鎖ライゲーション反応によって、またはインビトロ転位によっても付加され得る。いずれにせよ、バーコード配列を付加するプロセスは、各区画内の分子の溶液を生成し、かかる各分子は、バーコード配列を含み、次に、当該区画に区画化された微粒子からのゲノムDNAの断片に対応する配列の全部または一部を含む。
【0949】
次に、異なる区画からのバーコードを含む分子が単一の反応にマージされ、結果として得られた分子に対して配列決定反応が行われて、ゲノムDNAの配列とそれらが付加されたバーコード配列が決定される。次に、関連するバーコード配列を使用して、各配列が由来した区画を特定し、それによって、同じ微粒子または微粒子の群内に含まれるゲノムDNAの断片から由来した配列決定反応で決定された配列を連結する。
【0950】
図21-1及び21-2は、分子バーコードが多量体バーコード化試薬によって微粒子内のゲノムDNAの断片に付加され、当該バーコードが同じ微粒子に由来する配列間の結合を提供する特定の方法を示している。この方法では、微粒子の試料からの微粒子を架橋してから透過処理し、次に微粒子内に含まれるゲノムDNAの断片を多量体バーコード化試薬でバーコード化し、各配列がどの多量体バーコード化試薬によってバーコード化されたかを特定するように配列を決定し、それによって個々の微粒子からの異なる配列を連結している。
【0951】
第1のステップでは、微粒子試料由来の微粒子が化学架橋剤によって架橋される。このステップは、各微粒子内のゲノムDNA断片を互いに物理的に近接して保持するという目的を果たし、これにより、微粒子の基本的な構造的性質を保持しながら(すなわち、同じ微粒子に由来するゲノムDNA断片の物理的近接を保持しながら)試料が操作および処理されるようになり得る。第2のステップでは、架橋された微粒子が透過処理され(すなわち、ゲノムDNA断片がバーコード化ステップでバーコード化され得るように物理的にアクセス可能にされ)、この透過処理は、例えば、非イオン性界面活性剤等の化学的界面活性剤とのインキュベーションによって行われ得る。
【0952】
次に、バーコード配列がゲノムDNAの断片に付加され、ここで、多量体バーコード化試薬(および/または多量体バーコード分子)内に含まれるバーコード配列が、同じ架橋微粒子内の断片に付加される。バーコード配列は、任意の手段、例えば、プライマー伸長反応によって、または一本鎖もしくは二本鎖ライゲーション反応によって付加され得る。バーコード配列を付加するプロセスは、各多量体バーコード化試薬(および/または多量体バーコード分子)が通常、単一の微粒子内に含まれる配列のみをバーコード化する希釈条件下で、多数の多量体バーコード化試薬(および/または多量体バーコード分子)のライブラリを使用して、多数の架橋された微粒子を含む試料に配列を付加するように行われる。
【0953】
次に、結果として得られた分子に対して配列決定反応を行って、ゲノムDNAの配列とそれらが付加されたバーコード配列を決定する。次に、関連するバーコード配列を使用して、各配列がバーコード化された多量体バーコード化試薬(および/または多量体バーコード分子)を特定し、それによって、同じ微粒子内に含まれるゲノムDNAの断片に由来する配列決定反応で決定された配列を連結する。
【0954】
図22-1及び22-2は、個々の微粒子内のゲノムDNAの断片を互いに付加し、結果として得られた分子を配列決定する方法であって、同じ微粒子からのゲノムDNAの2つ以上の断片からの配列が同じ配列決定分子から決定され、それによって同じ微粒子内の断片間の連結を確立する方法を示している。この方法では、個々の微粒子内のゲノムDNAの断片が互いに架橋され、次に平滑化され、次に、結果として得られた平滑化されたゲノムDNAの断片が互いに一緒にライゲートされて隣接するマルチパート配列になる。次に、結果として得られた分子は、同じ配列決定された分子内に含まれるゲノムDNAの2つ以上の断片からの配列が、同じ微粒子に由来するものとして連結されていると決定されるように配列決定される。
【0955】
第1のステップでは、微粒子試料由来の微粒子が化学架橋剤によって架橋される。このステップは、各微粒子内のゲノムDNA断片を互いに物理的に近接して保持するという目的を果たし、これにより、微粒子の基本的な構造的性質を保持しながら(すなわち、同じ微粒子に由来するゲノムDNA断片の物理的近接を保持しながら)試料が操作および処理されるようになり得る。第2のステップでは、架橋された微粒子が透過処理され(すなわち、ゲノムDNA断片がバーコード化ステップでバーコード化される得るように物理的にアクセス可能にされ)、この透過処理は、例えば、非イオン性界面活性剤等の化学的界面活性剤とのインキュベーションによって行われ得る。
【0956】
次のステップでは、各微粒子内のゲノムDNAの断片の端が平滑され(すなわち、オーバーハングが除去され、および/または端が埋められ)、両端が二本鎖ライゲーション反応で互いに付加できるようになる。次に、二本鎖ライゲーション反応が行われ(例えば、T4 DNAリガーゼを使用)、同じ微粒子内に含まれる分子の平滑化された末端が、隣接するマルチパート二本鎖配列に互いにライゲートされる。このライゲーション反応(または任意の他のステップ)は、2つ以上の異なる微粒子内に含まれる配列間のスプリアスライゲーション産物が最小化されるような希釈条件下で行うことができる。
【0957】
次に、結果として得られた分子に対して配列決定反応を行って、各マルチパート分子内のゲノムDNAの配列を決定する。次に、結果として得られた分子は、同じ配列決定された分子内に含まれるゲノムDNAの2つ以上の断片からの配列が、同じ微粒子に由来するものとして連結されていると決定されるように評価される。
【0958】
図23は、微粒子の大きな試料からの個々の微粒子(および/または微粒子の小さな群)が2つ以上の別個の個々の配列決定反応で配列決定され、したがって、かかる各配列決定反応から決定される配列が情報的に連結されていると決定され、同じ個々の微粒子(および/または微粒子の小さな群)に由来すると予測される方法を示している。この方法では、微粒子の試料からの微粒子は、微粒子の2つ以上の別個のサブ試料に分割される。各サブ試料は、1つ以上の個別の微粒子を含む場合があるが、いずれの場合も、微粒子の元の試料の一部のみを含む。
【0959】
次に、各サブ試料内のゲノムDNAの断片が放出され、配列決定され得るような形態に処理される(例えば、Illumina配列決定アダプター等の配列決定アダプターに付加され得、任意選択的に増幅され得、配列決定用に精製され得る)。この方法には、バーコード配列を付加するステップが含まれる場合と含まれない場合がある。任意選択的に、配列決定された分子はバーコード配列を含まない。
【0960】
次に、個々のサブ試料からのゲノムDNAの断片(および/またはその複製コピー)が、個別の独立した配列決定反応で配列決定される。例えば、各サブ試料からの分子は、個別の配列決定フローセル上で配列決定され得るか、またはフローセルの異なるレーン内で配列決定され得るか、またはナノポアシーケンサーの異なるポートまたはフローセル内で配列決定され得る。
【0961】
次に、結果として得られた配列決定された分子が評価され、同じ個々の配列決定反応からの配列が、同じ微粒子(および/または同じ小さな群の微粒子)に由来するものとして連結されていると決定される。
【0962】
図24-1及び24-2は、個々の微粒子内のゲノムDNAの断片を配列決定の前に配列決定フローセルの個別の領域に付加され、当該フローセル上で配列決定された断片の近接性により、同じ微粒子に由来する配列間のリンケージが含まれる特定の方法を示している。この方法では、微粒子の試料からの微粒子が架橋され、次に透過処理され、次に、個々の微粒子内に含まれるゲノムDNAの断片が、同じ個々の微粒子からの2つ以上の断片がフローセルの同じ領域に付加されるように、配列決定フローセルに付加される。次に、付加された分子が配列決定され、フローセル上で結果として得られた配列の近接性は、連結値を含み、フローセル上で近接した配列は、元の試料内の同じ個々の微粒子に由来すると予測され得る。
【0963】
第1のステップでは、微粒子試料由来の微粒子が化学架橋剤によって架橋される。このステップは、各微粒子内のゲノムDNA断片を互いに物理的に近接して保持するという目的を果たし、これにより、微粒子の基本的な構造的性質を保持しながら(すなわち、同じ微粒子に由来するゲノムDNA断片の物理的近接を保持しながら)試料が操作および処理されるようになり得る。第2のステップでは、架橋された微粒子が透過処理され(すなわち、ゲノムDNA断片がフローセルに付加され得るように物理的にアクセス可能にされ)、この透過処理は、例えば、非イオン性界面活性剤等の化学的界面活性剤とのインキュベーションによって行われ得る。
【0964】
次のステップでは、微粒子からのゲノムDNAの断片が配列決定装置のフローセルに付加され、同じ微粒子内で架橋された2つ以上の断片がフローセルの同じ個別の領域に付加される。これは、アダプター分子が関与するマルチパート反応で行うことができる。例えば、アダプター分子は、微粒子内のゲノムDNAの断片に付加され得、そして当該アダプター分子は、フローセル上の一本鎖プライマーに相補的な一本鎖部分を含み得る。次に、架橋された微粒子からの配列を拡散させ、フローセルの同じ領域内の異なるプライマーにアニールさせることができる。
【0965】
次に、結果として得られた配列決定された分子は、フローセル上の結果として得られた配列の近接性が連結値を提供するように配列決定され、フローセル上で近接した配列(例えば、特定の離散領域および/または近接値内)は、元の試料内の同じ個々の微粒子に由来すると予測され得る。
【0966】
本発明の利点は、ほんの一例として、NIPTおよびがん検出における可能な用途を参照することによって説明することができる。
【0967】
例として、腫瘍学の分野において、本発明は、がんの早期発見をスクリーニングするための強力な新しいフレームワークを可能にし得る。いくつかのグループは、転移性変換の前に、初期腫瘍からの低レベルの循環DNA(いわゆる「循環腫瘍DNA」またはctDNA)を検出できるcfDNAアッセイの開発を模索している。非がん性検体からがん性を描写するために取られた主なアプローチの1つは、悪性腫瘍のほぼ普遍的な特徴である「構造的バリアント」(遺伝的増幅、欠失、または転座)を検出することである。しかしながら、現在の「分子カウント」フレームワークによるかかる大規模な遺伝子イベントの検出には、統計的に意味のある検出を実現するためにcfDNAの超深度配列決定が必要であり、その場合でも、仮に無制限の配列決定深度であっても十分な絶対分子シグナルを生成するために十分な量のctDNAが血漿中に存在する必要がある。
【0968】
対照的に、本発明は、潜在的な単一分子感応性を伴う構造多型の直接分子評価を可能にし得る。「再配列部位」(例えば、ある染色体上の点が他の染色体と一緒に転座し、それによって別の染色体に付着した点、または単一の染色体内で遺伝子または他の染色体セグメントが増幅または欠失した点等)を含む任意の構造多型は、この方法で直接検出でき、再配列DNAを含む循環微粒子は、再配列部位自体の両側に隣接するDNA断片の集団を含んでいる可能性があるため、この方法では、再配列自体の位置と、その両端にある2つの関与するゲノム遺伝子座の結合の両方を情報的に推測するために、互いに連結することができる。
【0969】
これが普遍的ながん検診の費用効果と絶対分析感度の両方をどのように改善するかを概念化するために、初期のがん細胞からの染色体転座を含み、この転座の左半分と右半分にまたがる合計1メガベースのDNAを含み、このDNAは、1メガベースのセグメント全体に累積的にまたがる10,000の異なる100ヌクレオチド長の個々の断片として断片化される、仮想の単一循環微粒子の例が与えられ得る。現在の連結されていない断片のみのアプローチを使用してこの転座イベントの存在を検出するには、転座の正確な部位を含む単一の100塩基対断片を配列決定し、その全長にわたって配列決定して実際の転座部位自体を検出する必要がある。したがって、この検査方法では、1)10,000個の断片全てをシーケンサーで読み取れる形態に効率的に変換する(すなわち、10,000個の断片の大部分を正常に処理し、DNAの精製と配列決定試料調製プロセス全体を通して保持する必要がある)ことと、次に、2)転座部位を含むものを確実に配列決定するために、10,000断片全てをDNA配列決定プロセスによって少なくとも1回配列決定する必要がある(すなわち、配列決定ステップへの全ての入力分子の理論的に均一なサンプリングを仮定しても、少なくとも1メガベースの配列決定を行う必要がある)ことと、の両方を行う必要がある。したがって、転座イベントを検出するには、1メガベースの配列決定を行う必要がある。
【0970】
対照的に、高度な統計的信頼性で転座の存在を検出するためには、連結断片アプローチを使用して、転座部位自体の両側からの少数の入力断片のみを配列決定する必要がある(これにより、例えば、統計的ノイズまたは誤ったマッピングエラーから「高確度で」転座イベントを区別する)。高度な統計的信頼性を提供するために、転座の両側から10個程度の断片を配列決定することができる。また、実際の転座自体を観察するために、ゲノム内の場所にマッピングするだけで、全長にわたって配列決定する必要はないため、各断片から50塩基対程度の配列決定を行う必要がある。まとめると、これにより、転座の存在を検出するために1000塩基対の合計配列決定要件が生成される。これは、現在の最先端技術で必要とされる1,000,000塩基対に対して1000分の1に削減される。
【0971】
相対的な配列決定スループットとコストの点でのこの大きな利点に加えて、連結されたリードのアプローチは、これらのがんスクリーニング検査の絶対的に達成可能な感度を高める可能性もある。初期段階の(したがって治癒の可能性がある)がんの場合、循環中の腫瘍DNAの絶対量が少ないため、試料処理および配列決定の調製プロセス中に試料DNAが失われると、理論的には無制限の配列決定深度であっても、検査の有効性が大幅に低下する可能性がある。上記の例に沿って、現在のアプローチを使用すると、転座部位自体を含む単一のDNA断片を保持し、試料の収集、処理、および配列決定調製プロトコル全体で正常に処理してから、正常に配列決定する必要がある。しかしながら、これらの全てのステップでは、処理済み試料から物理的に失われるか(例えば、遠心分離もしくはクリーンアップステップ中)、または単に後続のステップで正常に処理/修飾されない(例えば、DNAシーケンサーに配置する前に正常に増幅されない)「入力」分子の特定の部分をもたらす。対照的に、本発明の連結されたリードのアプローチは、実際の「入力」分子のごく一部の配列決定を含むだけでよいので、このタイプの試料損失は、最終アッセイの最終感度への影響を顕著に低減し得る。
【0972】
腫瘍学およびがんスクリーニングにおけるその適用に加えて、本発明はまた、非侵襲的出生前検査(NIPT)の領域において非常に新しいツールを可能にし得る。発育中の胎児(およびそれが含まれている胎盤)は、断片化されたDNAを母体循環に流し、その一部は循環微粒子内に含まれている。ctDNAからのがん検診の問題と同様に、循環胎児DNAは、妊娠中の個体の循環DNA全体のごく一部にすぎない(循環DNAの大部分は正常な母体DNAである)。NIPTの大きな技術的課題は、実際の胎児DNAを母体DNA断片(胎児ゲノムの半分の遺伝源であるため、同じヌクレオチド配列を共有する)と区別することにある。NIPTの追加の技術的課題には、循環中に存在する胎児DNAの短い断片からの長距離ゲノム配列(または突然変異)の検出が含まれる。
【0973】
同じ個々の循環微粒子に由来する連結された断片の分析は、NIPTのこれらの技術的課題の両方に実質的に対処するための強力なフレームワークを提示する。胎児ゲノムの(約)半分は、発育中の胎児が受け継いだ母体ゲノムの(約)半分と配列が同一であるため、母体配列を持つ特定の配列決定された断片が、正常な母体組織によって生成され得たか、またはむしろ発育中の胎児組織によって生成され得たかを区別することは困難である。対照的に、父体から受け継がれた(父親から受け継いだ)胎児ゲノムの(約)半分については、父体のゲノムには存在するが母体のゲノムには存在しない配列バリアント(例えば、単一ヌクレオチドバリアントまたは他のバリアント)の存在が、(循環している父体のDNA配列は妊娠自体に由来するものだけであるため)これらの父体に受け継がれた胎児の断片を特定するための分子マーカーとして役立つ。
【0974】
したがって、母体と父体の両方の配列(例えば、父体に受け継がれた第2の胎児染色体からの配列とともに、1つの特定の母体に受け継がれた胎児染色体からの配列)を含む単一の循環胎児微粒子からの複数の断片を配列決定する能力は、どの母体配列が発育中の胎児に受け継がれているかを直接認識するための方法を提示する。父体配列も含む微粒子内に共局在していることが見出された母体配列は、胎児に受け継がれた母体配列であると予測でき、対照的に、そうではない母体配列父体の配列と共局在していることがわかった場合、胎児に受け継がれなかった母体の配列を表すと予測できる。この技術により、正常な母体DNAで構成される循環DNAの大部分は、処理された配列データセットから特異的に除外され得、真の胎児配列であることが証明された配列のみが、さらなる分析のために情報的に単離され得る。
【0975】
NIPTアッセイの「胎児画分」(胎児自体によって生成された全ての循環DNAの画分)は、多くの場合10%未満であり、一部の臨床検体では1%~5%であり、かつ、この父体配列由来の「情報ゲーティング」ステップは、100%の「有効胎児画分」を生成する(最小限のミスマッピングエラーを想定)ため、この連結断片アプローチは、NIPT検査のシグナル対雑音比を1~2桁の大きさで改善する可能性がある。したがって、本発明は、NIPT検査の全体的な分析感度および特異性を改善するだけでなく、プロセスに必要な配列決定の量を大幅に削減し、妊娠初期(現在の検査では許容できない偽陽性率と偽陰性率があるような胎児画分が十分に低い時点)にNIPT検査を行うことができるようにする可能性がある。
【0976】
重要なことに、本発明は、情報的に連結された配列の形態で循環DNAからの配列データ内に新規の直交次元を提供し、その上で分析アルゴリズム、計算、および/または統計的検定を直接行って、非常に高感度で特異的な遺伝子測定を生成することができる。例えば、試料全体の2つの染色体間の配列の全体量を評価して胎児の染色体異数性を測定するのではなく、連結された配列(および/またはそのセットもしくはサブセット)を直接評価して、例えば、特定の染色体または染色体部分にマッピングされる情報的に連結されたセットあたりの配列の数を調べることができる。比較および/または統計的検査を行って、異なる推定細胞起源の配列の連結されたセットを比較するか(例えば、胎児配列と母体配列との間、または推定健康組織と推定がん性もしくは悪性組織との間の比較)、あるいは、特定の染色体分布パターン、または特定の配列もしくは配列セットの累積濃縮等、配列の連結されたセットのレベルでのみ存在する(かつ、個々の連結されていない配列のレベルでは存在しない)配列特徴もしくは数値的特徴を評価することができる。
【0977】
この方法は、胎児の微粒子配列の検出への応用に加えて、胎児のゲノムに存在する長距離の遺伝子配列または配列突然変異を検出する可能性がある。がんゲノム再配列について説明したのとほぼ同じ方法で、胎児微粒子からのいくつかのDNA断片が、ゲノム再配列部位(例えば、転座または増幅または欠失)にまたがって、かつ/または隣接して配列決定される場合、これらのクラスの再配列は、再配列部位自体を直接配列決定しなくても、情報的に検出され得る。さらに、ゲノム再配列イベント以外では、この方法は、個々のゲノム領域内の「フェージング」情報を検出する可能性がある。例えば、2つの一塩基バリアントが特定の遺伝子内の異なるポイントで見出されたが、ゲノム距離が数キロベースで区切られている場合、この方法により、これら2つの一塩基バリアントが胎児ゲノム内の遺伝子の同じ単一コピーにあるかどうか、またはそれらが各々胎児ゲノムに存在する遺伝子の2つのコピーのうちの異なる1つにあるかどうか(すなわち、同じハプロタイプ内にあるかどうか)を評価できる。この機能は、遺伝的病因を伴う主要な発達障害の大部分を構成する胎児ゲノムにおけるde novo単一ヌクレチオド突然変異の遺伝的評価および予後のための特別な臨床的有用性を有し得る。
【0978】
図31-1及び31-2は、バーコード化親和性プローブと区画化ステップを使用して、標的生体分子を測定する方法を示している。この方法では、バーコード化親和性プローブは、微粒子試料由来の微粒子とインキュベートされ、当該微粒子中またはその上の標的ポリペプチド(すなわち、標的生体分子)に結合することが可能になる。バーコード化親和性プローブは、標的ポリペプチドに結合することができる親和性部分と、バーコード化親和性プローブを特定するバーコード化オリゴヌクレオチドとを含む。次に、微粒子を2つ以上の区画に区画化し、微粒子内のゲノムDNAの断片と、結合されたバーコード化親和性プローブからのバーコード化オリゴヌクレオチドとを区画内でバーコード化し、次にバーコードがどの区画からの配列に由来するか特定されるように配列が決定され、それによって個々の微粒子からの異なる配列が連結される。
【0979】
バーコード化親和性プローブを標的ポリペプチドに結合するステップに続いて、微粒子は2つ以上の区画に区画化される(例えば、異なる物理的反応容器、またはエマルジョン内の異なる液滴を含むことができる)。次に、バーコード化親和性プローブからのゲノムDNAの断片とバーコード化オリゴヌクレオチドが、各区画内の微粒子から放出される(すなわち、断片は、バーコード化できるように物理的にアクセス可能になる)。この放出ステップは、高温インキュベーションステップとともに、および/または分子溶媒または化学的界面活性剤とのインキュベーションにより行われ得る。任意選択的に(但し、本明細書には示されていない)、バーコード配列を付加する前に、増幅ステップがこの時点で行われ、これにより、ゲノムDNAの断片の全てまたは一部が(PCR反応等の際に)少なくとも1回複製されるようになり、その後、バーコード配列が結果として得られた複製産物に付加され得る。
【0980】
次に、バーコード配列は、バーコード化親和性プローブからのゲノムDNA(またはその増幅産物)およびバーコード化オリゴヌクレオチド(またはそのアンプリコン)の断片に付加される(すなわち、バーコード配列は「標的核酸分子」に付加される)。バーコード配列は、バーコード領域を含むプライマー、または多量体バーコード化試薬中のバーコード化オリゴヌクレオチド、または多量体バーコード分子中のバーコード分子等の任意の形態をとり得る。バーコード配列は、任意の手段によって、例えば、プライマー伸長および/もしくはPCR反応、または一本鎖もしくは二本鎖ライゲーション反応によって、またはインビトロ転位によっても付加され得る。いずれにせよ、バーコード配列を付加するプロセスは、各区画内の分子の溶液を生成し、かかる各分子は、バーコード配列を含み、次に、当該区画に区画化された微粒子からのバーコード化親和性プローブからのゲノムDNAまたはバーコード化オリゴヌクレオチドの断片に対応する配列の全部または一部を含む。
【0981】
次に、異なる区画からのバーコードを含む分子が単一の反応にマージされ、結果として得られた分子に対して配列決定反応が行われて、ゲノムDNAの配列および/またはバーコード化親和性プローブの配列とそれらが付加されたバーコード配列が決定される。次に、関連するバーコード配列を使用して、各配列が由来した区画を特定し、それによって、同じ微粒子または微粒子の群内に含まれる標的生体分子から由来した配列決定反応で決定された配列を連結する。バーコード化オリゴヌクレオチドの配列は、連結された親和性部分を特定し、それにより、親和性部分が結合する標的ポリペプチドを特定する。したがって、配列決定データは、同じ循環微粒子内に共局在している可能性が高いゲノムDNA断片と1つ以上の標的ポリペプチドを特定する。
【0982】
図32-1及び32-2は、バーコード化親和性プローブと多量体バーコード化試薬を使用して標的生体分子を測定する方法を示している。この方法では、バーコード化親和性プローブは、微粒子試料由来の微粒子とインキュベートされ、当該微粒子中またはその上の標的ポリペプチド(すなわち、標的生体分子)に結合することが可能になる。バーコード化親和性プローブは、標的ポリペプチドに結合することができる親和性部分と、バーコード化親和性プローブを特定するバーコード化オリゴヌクレオチドとを含む。次に、微粒子の試料からの微粒子を架橋して透過処理し、次に標的核酸分子(すなわち、ゲノムDNAの断片および微粒子内に含まれるバーコード化親和性プローブからのバーコード化オリゴヌクレオチド)を多量体バーコード化試薬によってバーコード化し、次に、配列は、バーコードが、各配列がどの多量体バーコード化試薬によってバーコード化されたかを特定し、それによって個々の微粒子からの異なる配列を連結するように決定される。
【0983】
バーコード化親和性プローブを標的ポリペプチドに結合するステップに続いて、微粒子の試料からの微粒子は、化学架橋剤によって架橋される。このステップは、各微粒子内のバーコード化親和性プローブからのゲノムDNAおよびバーコード化オリゴヌクレオチドの断片を互いに物理的に近接して保持するという目的を果たし、微粒子の基本的な構造的性質を保持しながら(すなわち、同じ微粒子に由来するバーコード化親和性プローブからのゲノムDNA断片とバーコード化オリゴヌクレオチドの物理的近接を保持しながら)試料が操作および処理されるようになり得る。第2のステップでは、架橋された微粒子が透過処理され(すなわち、ゲノムDNA断片がバーコード化ステップでバーコード化される得るように物理的にアクセス可能にされ)、この透過処理は、例えば、非イオン性界面活性剤等の化学的界面活性剤とのインキュベーションによって行われ得る。任意選択的に、バーコード化親和性プローブを標的ポリペプチドに結合する(第1または第2の)ステップは、架橋のかかるステップの後に、および/または透過処理の任意のかかるステップの後に行われ得る。
【0984】
次に、バーコード配列は、ゲノムDNAの断片およびバーコード化親和性プローブを含むバーコード化オリゴヌクレオチドに付加され、ここで、多量体バーコード化試薬(および/または多量体バーコード分子)内に含まれるバーコード配列が、同じ架橋微粒子内の断片に、または同一の架橋微粒子に結合された断片に付加される。バーコード配列は、任意の手段、例えば、プライマー伸長反応によって、または一本鎖もしくは二本鎖ライゲーション反応によって付加され得る。バーコード配列を付加するプロセスは、各多量体バーコード化試薬(および/または多量体バーコード分子)が通常、単一の微粒子内に含まれる標的核酸分子のみをバーコード化する希釈条件下で、多数の多量体バーコード化試薬(および/または多量体バーコード分子)のライブラリを使用して、多数の架橋された微粒子を含む試料に配列を付加するように行われる。任意選択的に、1つ以上のカップリング分子を標的核酸分子(例えば、ゲノムDNAの断片および/またはバーコード化親和性プローブからのバーコード化オリゴヌクレオチド)に付加する任意の方法を、バーコード配列を付加する任意のステップの前および/またはその間に行うことができる。次に、(任意選択的に)多量体バーコード化試薬からのバーコード配列を、任意選択的に、当該バーコード配列が当該標的核酸分子に付加される後続のバーコード接続ステップで、当該カップリング分子に連結することができる。
【0985】
次に、結果として得られた分子に対して配列決定反応を行って、バーコード化親和性プローブからのゲノムDNAおよびバーコード化オリゴヌクレオチドの配列、ならびにそれらが付加されたバーコード配列を決定する。次に、関連するバーコード配列を使用して、各配列がバーコード化された多量体バーコード化試薬(および/または多量体バーコード分子)を特定し、それによって、同じ微粒子内に含まれるか、または同じ微粒子に結合するゲノムDNAの断片およびバーコード化親和性プローブからのバーコード化オリゴヌクレオチドに由来する配列決定反応で決定された配列を連結する。バーコード化オリゴヌクレオチドの配列は、連結された親和性部分を特定し、それにより、親和性部分が結合する標的ポリペプチドを特定する。したがって、配列決定データは、同じ循環微粒子内に共局在している可能性が高いゲノムDNA断片と1つ以上の標的ポリペプチドを特定する。
【実施例0986】
実施例1
材料および方法
方法1-核酸バーコード分子のライブラリの合成
二本鎖サブバーコード分子ライブラリの合成
PCRチューブ内で、10マイクロリットルの10マイクロモルBC_MX3(配列番号18~269の全ての配列の等モル混合物)を、10マイクロリットルの10マイクロモルBC_ADD_TP1(配列番号1)、10マイクロリットルの10X CutSmart Buffer(New England Biolabs)、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、および68マイクロリットルのH2Oに添加し、99マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、75℃で5分間インキュベートした後、ゆっくりと4℃までアニールし、4℃に保った後、氷上に置いた。1.0マイクロリットルのクレノウポリメラーゼ断片(New England Biolabs、5U/uL)を溶液に添加し、混合した。PCRチューブを再びサーマルサイクラーに置き、25℃で15分間インキュベートした後、4℃で保持した。次に、溶液を精製カラム(ヌクレオチド除去キット、Qiagen)で精製し、50マイクロリットルのH2O中に溶出させ、分光光度法で定量した。
【0987】
二本鎖下流アダプター分子の合成
PCRチューブ内で、0.5マイクロリットルの100マイクロモルBC_ANC_TP1(配列番号2)を、0.5マイクロリットルの100マイクロモルBC_ANC_BT1(配列番号3)、20マイクロリットルの10X CutSmart Buffer(New England Biolabs)、および178マイクロリットルのH2Oに添加し、200マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で5分間インキュベートした後、ゆっくりと4℃までアニールし、4℃に保った後、氷上に置き、-20℃で保存した。
【0988】
二本鎖サブバーコード分子ライブラリの二本鎖下流アダプター分子へのライゲーション
1.5ミリリットルのエッペンドルフチューブにおいて、二本鎖下流アダプター分子溶液の1.0マイクロリットルを、2.5マイクロリットルの二本鎖サブバーコード分子ライブラリ、2.0マイクロリットルの10X T4 DNAリガーゼバッファー、および13.5マイクロリットルのH2Oに添加し、19マイクロリットルの最終体積とした。1.0マイクロリットルのT4 DNAリガーゼ(New England Biolabs、高濃度)を溶液に添加し、混合した。チューブを室温で60分間インキュベートし、その後、1.8倍体積(34マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【0989】
ライゲーションライブラリのPCR増幅
PCRチューブ内で、2.0マイクロリットルのLigated Libraryを、2.0マイクロリットルの50マイクロモルのBC_FWD_PR1(配列番号4)、2.0マイクロリットルの50マイクロモルのBC_REV_PR1(配列番号5)、10マイクロリットルの10X Taq PCRバッファー(Qiagen)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、81.5マイクロリットルのH2O、および0.5マイクロリットルのQiagen Taqポリメラーゼ(5U/uL)に添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次いで59℃で30秒間、次いで72℃で30秒間の15サイクルで増幅し、その後、4℃で保持した。その後、溶液を1.8倍体積(180マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、50マイクロリットルのH2O中に溶出させた。
【0990】
ウラシルグリコシラーゼ酵素消化
エッペンドルフチューブに、15マイクロリットルの溶出PCR増幅、1.0マイクロリットルのH2O、2.0マイクロリットルの10X CutSmart Buffer(New England Biolabs)、および2.0マイクロリットルのUSER酵素溶液(New England Biolabs)を添加して混合した。チューブを37℃で60分間インキュベートし、次いで溶液を1.8倍体積(34マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、34マイクロリットルのH2O中に溶出させた。
【0991】
MlyI制限酵素切断
前の(グリコシラーゼ消化)ステップからの溶出液に、4.0マイクロリットルの10X CutSmart Buffer(New England Biolabs)と2.0マイクロリットルのMlyI酵素(New England Biolabs、5U/uL)を添加して混合した。チューブを37℃で60分間インキュベートし、次いで溶液を1.8倍体積(72マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【0992】
MlyIで切断された溶液へのサブバーコードライブラリのライゲーション
1.5ミリリットルのエッペンドルフチューブにおいて、10マイクロリットルのMlyI切断溶液溶液を、2.5マイクロリットルの二本鎖サブバーコード分子ライブラリ、2.0マイクロリットルの10X T4 DNAリガーゼバッファー、および4.5マイクロリットルのH2Oに添加し、19マイクロリットルの最終体積とした。1.0マイクロリットルのT4 DNAリガーゼ(New England Biolabs、高濃度)を溶液に添加し、混合した。チューブを室温で60分間インキュベートし、その後、1.8倍体積(34マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【0993】
サブバーコード添加の繰り返しサイクル
実験は、1)サブバーコードライブラリのMlyI切断溶液へのライゲーション、2)ライゲーションライブラリのPCR増幅、3)ウラシルグリコシラーゼ酵素消化、4)MlyI制限酵素切断のステップを5サイクル順番に繰り返した。
【0994】
二本鎖上流アダプター分子の合成
PCRチューブ内で、1.0マイクロリットルの100マイクロモルBC_USO_TP1(配列番号6)を、1.0マイクロリットルの100マイクロモルBC_USO_BT1(配列番号7)、20マイクロリットルの10X CutSmart Buffer(New England Biolabs)、および178マイクロリットルのH2Oに添加し、200マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で60秒間インキュベートした後、ゆっくりと4℃までアニールし、4℃に保った後、氷上に置き、-20℃で保存した。
【0995】
二本鎖上流アダプター分子のライゲーション
1.5ミリリットルのエッペンドルフチューブにおいて、3.0マイクロリットルの上流アダプター溶液を、10.0マイクロリットルの最終(5サイクル後)MlyI切断溶液、2.0マイクロリットルの10X T4 DNAリガーゼバッファー、および5.0マイクロリットルのH2Oに添加し、19マイクロリットルの最終体積とした。1.0マイクロリットルのT4 DNAリガーゼ(New England Biolabs、高濃度)を溶液に添加し、混合した。チューブを室温で60分間インキュベートし、その後、1.8倍体積(34マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【0996】
上流アダプターライゲーションライブラリのPCR増幅
PCRチューブ内で、6.0マイクロリットルの上流アダプターLigated Libraryを、1.0マイクロリットルの100マイクロモルのBC_CS_PCR_FWD1(配列番号8)、1.0マイクロリットルの100マイクロモルのBC_CS_PCR_REV1(配列番号9)、10マイクロリットルの10X Taq PCRバッファー(Qiagen)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、73.5マイクロリットルのH2O、および0.5マイクロリットルのQiagen Taqポリメラーゼ(5U/uL)に添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次いで61℃で30秒間、次いで72℃で30秒間の15サイクルで増幅し、その後、4℃で保持した。次に、増幅された核酸バーコード分子のライブラリを含む溶液を、1.8倍体積(180マイクロリットル)のAmpure XPビーズ(Agencourt、製造元の指示に従う)で精製した。増幅された核酸バーコード分子のライブラリを、次いで、40マイクロリットルのH2O中に溶出させた。
【0997】
次に、上記の方法によって合成された増幅された核酸バーコード分子のライブラリを使用して、以下に説明するように多量体バーコード分子のライブラリを組み立てた。
【0998】
方法2-多量体バーコード分子のライブラリの組み立て
方法1の方法に従って合成された核酸バーコード分子のライブラリを使用して、多量体バーコード分子のライブラリを組み立てた。
【0999】
プライマー-フォワードターミネーションプライマーとフォワードスプリントプライマーによる伸長
PCRチューブ内で、5.0マイクロリットルの増幅された核酸バーコード分子のライブラリを、1.0マイクロリットルの100マイクロモルのCS_SPLT_FWD1(配列番号10)、1.0マイクロリットルの5マイクロモルのCS_TERM_FWD1(配列番号11)、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、80.0マイクロリットルのH2O、および1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)に添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次いで53℃で30秒間、次いで72℃で60秒間の1サイクル、その後、95℃で30秒間、次いで50℃で30秒間、次いで72℃で60秒間の1サイクルで増幅し、その後、4℃で保持した。次に、溶液をPCR精製カラム(Qiagen)で精製し、85.0マイクロリットルのH2O中に溶出させた。
【1000】
プライマー-リバースターミネーションプライマーとリバーススプリントプライマーによる伸長
PCRチューブ内で、85.0マイクロリットルのフォワード伸長プライマー伸長産物を、1.0マイクロリットルの100マイクロモルのCS_SPLT_REV1(配列番号12)、1.0マイクロリットルの5マイクロモルのCS_TERM_REV1(配列番号13)、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、および1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)に添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次いで53℃で30秒間、次いで72℃で60秒間の1サイクル、その後、95℃で30秒間、次いで50℃で30秒間、次いで72℃で60秒間の1サイクルで増幅し、その後、4℃で保持した。次に、溶液をPCR精製カラム(Qiagen)で精製し、43.0マイクロリットルのH2O中に溶出させた。
【1001】
プライマー伸長産物と重複伸長PCRの連結
PCRチューブ内に、43.0マイクロリットルのリバース伸長プライマー伸長産物、5.0マイクロリットルの10X Thermopolバッファー(NEB)、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、および1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)を添加し、50マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次に60℃で60秒間、72℃で2分間の5サイクル、次に、95℃で30秒間、60℃で60秒間、72℃で5分間の5サイクル、次に、95℃で30秒間、60℃で60秒間、72℃で10分間の5サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【1002】
重複伸長産物の増幅
PCRチューブ内に、2.0マイクロリットルの重複伸長PCR溶液、1.0マイクロリットルの100マイクロモルのCS_PCR_FWD1(配列番号14)、1.0マイクロリットルの100マイクロモルのCS_PCR_REV1(配列番号15)、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)、および83.0マイクロリットルのH2Oを添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、58℃で30秒間、72℃で10分間の15サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、50マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1003】
増幅された重複伸長産物のゲルベースのサイズ選択
約250ナノグラムの増幅重複伸長産物を0.9%アガロースゲルにロードして泳動し、エチジウムブロマイドで染色および可視化した。1000ヌクレオチドサイズ(プラスマイナス100ヌクレオチド)に対応するバンドを切除し、ゲル抽出カラム(ゲル抽出キット、Qiagen)で精製し、50マイクロリットルのH2O中に溶出させた。
【1004】
重複伸長産物の増幅
PCRチューブ内に、10.0マイクロリットルのGel-Size-Selected溶液、1.0マイクロリットルの100マイクロモルのCS_PCR_FWD1(配列番号14)、1.0マイクロリットルの100マイクロモルのCS_PCR_REV1(配列番号15)、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)、および75.0マイクロリットルのH2Oを添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、58℃で30秒間、72℃で4分間の15サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、50マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1005】
定量的に既知の数の多量体バーコード分子の選択と増幅
増幅されたゲル抽出溶液をマイクロリットルあたり1ピコグラムの濃度に希釈し、次にPCRチューブに、2.0マイクロリットルのこの希釈溶液(約200万個の個別分子)、0.1マイクロリットルの100マイクロモルのCS_PCR_FWD1(配列番号14)、0.1マイクロリットルの100マイクロモルのCS_PCR_REV1(配列番号15)、1.0マイクロリットルの10X Thermopolバッファー(NEB)、0.2マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、0.1マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)、および6.5マイクロリットルのH2Oを添加し、10マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、57℃で30秒間、72℃で4分間の11サイクルで増幅し、その後、4℃で保持した。
【1006】
PCRチューブ内に、1.0マイクロリットルの100マイクロモルのCS_PCR_FWD1(配列番号14)、1.0マイクロリットルの100マイクロモルのCS_PCR_REV1(配列番号15)、9.0マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)、および76.0マイクロリットルのH2Oを添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、57℃で30秒間、72℃で4分間の10サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、50マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1007】
方法3:インビトロ転写およびcDNA合成による一本鎖多量体バーコード分子の生成
この方法では、オリゴヌクレオチドをアニールしてバーコード化できる一本鎖DNA鎖を生成する一連の手順について説明する。この方法は、この反応では、重複伸長PCR増幅反応を使用して、T7 RNAポリメラーゼのプロモーター部位を多量体バーコード分子のライブラリの5’末端に付加する4つの同一の反応を並行して行うことから始まる。4つの同一の反応が並行して行われ、次にマージされて、利用可能なこの産物の量と濃度が増加する。4つの同一のPCRチューブの各々で、約500ピコグラムのサイズ選択およびPCR増幅された多量体バーコード分子(方法2の「定量的に既知の数の多量体バーコード分子の選択と増幅」ステップで生成)を、2.0マイクロリットルの100マイクロモルのCS_PCR_FWD1_T7(配列番号270)、2.0マイクロリットルの100マイクロモルのCS_PCR_REV4(配列番号271)、20.0マイクロリットルの10X Thermopol PCRバッファー、4.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、および2.0マイクロリットルのVent Exo Minusポリメラーゼ(マイクロリットルあたり5ユニット)と水に混合して、200マイクロリットルの総体積とした。PCRチューブをサーマルサイクラーに置き、95℃で60秒間、次に60℃で30秒間、72℃で3分間の22サイクルで増幅し、その後、4℃で保持した。全ての4つの反応からの溶液を、次いで、ゲル抽出カラム(ゲル抽出キット、Qiagen)で精製し、52マイクロリットルのH2O中に溶出させた。
【1008】
50マイクロリットルの溶出液を、10マイクロリットルの10X NEBuffer 2(NEB)、0.5マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、および1.0マイクロリットルのVent Exo Minusポリメラーゼ(マイクロリットルあたり5ユニット)と水に混合して、100マイクロリットルの総体積とした。反応物を室温で15分間インキュベートし、その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1009】
次に、転写ステップが行われ、T7 RNAポリメラーゼプロモーター部位を含むPCR増幅テンプレートのライブラリ(前のステップで生成されたもの)がT7RNAポリメラーゼのテンプレートとして使用される。これは、(各入力PCR分子は、多数の同族RNA分子を生成するためのテンプレートとして機能できるため)多量体バーコード分子のライブラリに対応する大量のRNAベースの核酸を生成するための増幅ステップを含む。次のステップでは、これらのRNA分子が逆転写されて、目的の一本鎖多量体バーコード分子が作成される。10マイクロリットルの溶出液を、20マイクロリットルの5X転写バッファー(Promega)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、10マイクロリットルの0.1ミリモルのDTT、4.0マイクロリットルのSuperAseIn(Ambion)、および4.0マイクロリットルのPromega T7 RNAポリメラーゼ(マイクロリットルあたり20ユニット)と水に混合して、100マイクロリットルの総体積とした。反応物を37℃で4時間インキュベートし、次にRNEasy Mini Kit(Qiagen)で精製し、50マイクロリットルのH2O中に溶出させ、6.0マイクロリットルのSuperAseIn(Ambion)に添加した。
【1010】
次に、前のインビトロ転写ステップで生成されたRNA溶液を逆転写し(RNA分子の3’末端に特異的なプライマーを使用)、RNAse Hで消化して、オリゴヌクレオチドをアニールしてからバーコード化できる、多量体バーコード分子に対応する一本鎖DNA分子を作成する。2つの同一の複製チューブ内で、23.5マイクロリットルの溶出液を、5.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、3.0マイクロリットルのSuperAseIn(Ambion)、および10.0マイクロリットルの2.0マイクロモルのCS_PCR_REV1(配列番号272)と水に混合して、73.5マイクロリットルの最終体積とした。反応物をサーマルサイクラー上で65℃で5分間、次に50℃で60秒間インキュベートし、その後、4℃で保持した。チューブに、20マイクロリットルの5X逆転写バッファー(Invitrogen)、5.0マイクロリットルの0.1ミリモルDTT、および1.75マイクロリットルのSuperscript III逆転写酵素(Invitrogen)を添加した。反応物を55℃で45分間、次に60℃で5分間インキュベートし、次いで、70℃で15分間、次いで、4℃で保持PCRクリーンアップカラム(Qiagen)で精製し、40マイクロリットルのH2O中に溶出させた。
【1011】
60マイクロリットルの溶出液を、7.0マイクロリットルの10X RNAse Hバッファー(Promega)と4.0マイクロリットルのRNAse H(Promega)と混合した。反応物を37℃で12時間、次に95℃で10分間インキュベートし、次に4℃で保持し、その後、0.7倍体積(49マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1012】
方法4:バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬の生成
この方法では、一本鎖多量体バーコード分子(方法3で生成)および適切な伸長プライマーとアダプターオリゴヌクレオチドから多量体バーコード化試薬を生成する手順について説明する。
【1013】
PCRチューブ内で、約45ナノグラムの一本鎖RNAse H消化多量体バーコード分子(方法3の最後のステップで生成)を、0.25マイクロリットルの10マイクロモルDS_ST_05(配列番号273、アダプターオリゴヌクレオチド)、0.25マイクロリットルの10マイクロモルUS_PCR_Prm_Only_03(配列番号274、伸長プライマー)、および5.0マイクロリットルの5X等温伸長/ライゲーションバッファーと水に混合して、19.7マイクロリットルの最終体積とした。アダプターオリゴヌクレオチドと伸長プライマーを多量体バーコード分子にアニールするために、サーマルサイクラーでチューブを98℃で60秒間インキュベートし、次に55℃までゆっくりとアニールし、55℃で60秒間保持し、次に、ゆっくりと50℃にアニールし、次に50℃で60秒間保持し、次にゆっくりと20℃に0.1℃/秒でアニールし、次に4℃に保持した。チューブに、0.3マイクロリットル(0.625U)のPhusionポリメラーゼ(NEB、2U/uL)、2.5マイクロリットル(100U)のTaq DNAリガーゼ(NEB、40U/uL)、および2.5マイクロリットルの100ミリモルDTTを添加した。各多量体バーコード分子の隣接するバーコード領域を横切って伸長プライマーを伸長し、次にこの伸長産物をその下流にアニールされたアダプターオリゴヌクレオチドのリン酸化された5’末端にライゲートするために、チューブは次に、50℃で3分間インキュベートし、次に4℃で保持した。次に、反応物をPCRクリーンアップカラム(Qiagen)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法で定量した。
【1014】
方法5:既知の配列の合成DNAテンプレートの生成
この方法は、当該分子配列識別子を含むオリゴヌクレオチドを環状化し、次にタンデムに増幅する(プロセッシブな鎖置換ポリメラーゼを用いて)ことにより、タンデムに繰り返される多数の同一直線上の分子配列識別子を有する合成DNAテンプレートを生成する技術を説明する。次に、この試薬を使用して、本明細書に記載の多量体バーコード化試薬を評価および測定することができる。
【1015】
PCRに、0.4マイクロリットルの1.0マイクロモルのSyn_Temp_01(配列番号275)、0.4マイクロリットルの1.0マイクロモルのST_Splint_02(配列番号276)、および10.0マイクロリットルの10X NEB CutSmartバッファーを添加した。サーマルサイクラーでは、チューブを95℃で60秒間インキュベートした後、75℃で5分間保持した後、ゆっくりと20℃までアニールし、20℃で60秒間保持した後、4℃で保持した。次に、分子内ライゲーション反応によって分子を環状化するために、チューブに10.0マイクロリットルのリボ-ATPと5.0マイクロリットルのT4 DNAリガーゼ(NEB、高濃度)を添加した。次に、チューブを室温で30分間、次に65℃で10分間インキュベートし、次にゆっくりと20℃にアニールし、次に20℃で60秒間保持し、次に4℃で保持した。次に、各チューブに、10X NEB CutSmartバッファー、4.0マイクロリットルの10ミリモルデオキシヌクレオチド三リン酸ヌクレオチド混合物、および1.5マイクロリットルの希釈phi29 DNAポリメラーゼ(NEB、1X CutSmartバッファーで1:20に希釈)と水を添加して、200マイクロリットルの総体積とした。反応物を30℃で5分間インキュベートし、次に4℃で保持し、その後、溶液を0.7倍体積(140マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1016】
方法6:バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を使用した既知の配列のバーコード化合成DNAテンプレート
PCRチューブに、10.0マイクロリットルの5X Phusion HFバッファー(NEB)、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、および2.0マイクロリットル(10ナノグラム)の5.0ナノグラム/マイクロリットルの既知の配列の合成DNAテンプレート(方法5で生成)と水を添加して、42.5マイクロリットルの最終体積とした。次に、チューブを98℃で60秒間インキュベートし、次に20℃で保持した。チューブに、5.0マイクロリットルの5.0ピコグラム/マイクロリットルのバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬(方法4で生成)を添加した。次に、反応物を70℃で60秒間インキュベートし、次に60℃にゆっくりとアニールし、次に60℃で5分間、次に55℃にゆっくりとアニールし、次に55℃で5分間、次に50℃にゆっくりとアニールし、次に50℃で5分間、次に4℃で保持した。反応物に、0.5マイクロリットルのPhusionポリメラーゼ(NEB)、2.0マイクロリットルの10uM SynTemp_PE2_B1_Short1(配列番号277、方法4で作成された多量体バーコード化試薬を方法5で作成された合成DNAテンプレートに沿ってアニールおよび伸長することによって生成された伸長産物の一部に相補的なプライマーは、この方法で説明されているプライマー伸長とPCR反応のプライマーとして機能する)。この反応について、5.0マイクロリットルの体積を新たなPCRチューブに添加し、55℃で30秒間、60℃で30秒間、72℃で30秒間インキュベートし、その後、98℃、次いで65℃、次いで72℃で各々30秒間の10サイクルを行い、その後、4℃で保持した。次に、各チューブに、9.0マイクロリットルの5X Phusionバッファー、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、1.75マイクロリットルの10uM SynTemp_PE2_B1_Short1(配列番号277)、1.75マイクロリットルの10uM US_PCR_Prm_Only_02(配列番号278、方法4に従って多量体バーコード化試薬を生成するために使用される伸長プライマーに部分的に相補的であり、このPCR増幅反応で「フォワード」プライマーとして機能するプライマー)、および0.5マイクロリットルのPhusionポリメラーゼ(NEB)と水を添加して、50マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、98℃で30秒間、次いで72℃で30秒間の24サイクルで増幅し、その後、4℃で保持し、1.2倍体積(60マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1017】
その後、結果として得られたライブラリをPCRベースの方法によって試料を特定するためにバーコード化し、増幅し、150サイクルの中間出力NextSeqフローセル(Illumina)を使用して標準の方法によって配列決定し、さらなる分析のために情報的に逆多重化した。
【1018】
方法7:多量体バーコード化試薬と個別のアダプターオリゴヌクレオチドを使用した既知の配列のバーコード化合成DNAテンプレート
合成DNAテンプレートに沿ってアダプターオリゴヌクレオチドをアニールおよび伸長するために、PCRチューブに、10.0マイクロリットルの5X Phusion HFバッファー(NEB)、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、5.0マイクロリットル(25ナノグラム)の5.0ナノグラム/マイクロリットルの既知の配列の合成DNAテンプレート(方法5で生成)、および0.25マイクロリットルの10マイクロモルDS_ST_05(配列番号273、アダプターオリゴヌクレオチド)と水を添加して、49.7マイクロリットルの最終体積とした。サーマルサイクラーで、チューブを98℃で2分間、次に63℃で1分間インキュベートし、次に60℃までゆっくりとアニールし、次に60℃で1分間保持し、次に57℃までゆっくりとアニールし、次に57℃で1分間保持し、次に54℃までゆっくりとアニールし、次に54℃で1分間保持し、次に50℃までゆっくりとアニールし、次に50℃で1分間保持し、次に45℃までゆっくりとアニールし、次に45℃で1分間保持し、次に40℃までゆっくりとアニールし、次に40℃で1分間保持し、次に4℃で保持した。チューブに0.3マイクロリットルのPhusionポリメラーゼ(NEB)を添加し、反応物を45℃で20秒間、次に50℃で20秒間、次に55℃で20秒間、60℃で20秒間、次に72℃で20秒間インキュベートし、次に4℃で保持した。次に、反応物を0.8倍体積(40マイクロリットル)のAmpure XPビーズ(Agencourt、製造元の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1019】
アダプターオリゴヌクレオチド(前のステップのように合成DNAテンプレートに沿ってアニールおよび伸長)をアニールして、多量体バーコード分子にアニールし、次に、各多量体バーコード分子の隣接するバーコード領域に伸長プライマーをアニールしてから伸長し、次にこの伸長産物をその下流にアニールしたアダプターオリゴヌクレオチドのリン酸化5’末端にライゲートするために、PCRチューブに10マイクロリットルの前のステップからの溶出液(アダプターオリゴヌクレオチドがアニールおよび伸長されている合成DNAテンプレートを含む)、3.0マイクロリットルの50.0ナノモル溶液のRNAse H消化多量体バーコード分子の(方法3の最後のステップで生成)、および6.0マイクロリットルの5X等温伸長/ライゲーションバッファーと水を添加して、26.6マイクロリットルの最終体積とした。サーマルサイクラーで、チューブを70℃で60秒間インキュベートした後、60℃までゆっくりとアニールし、次に60℃で5分間保持し、次に55℃までゆっくりとアニールし、55℃で5分間保持した。数分後、0.1℃/秒で50℃までゆっくりアニールし、50℃で30分間保持した後、4℃で保持した。チューブに0.6マイクロリットルの10uM US_PCR_Prm_Only_02(配列番号278、伸長プライマー)を添加し、反応物を50℃で10分間インキュベートし、次に4℃で保持した。チューブに、0.3マイクロリットル(0.625U)のPhusionポリメラーゼ(NEB、2U/uL)、2.5マイクロリットル(100U)のTaq DNAリガーゼ(NEB、40U/uL)、および2.5マイクロリットルの100ミリモルDTTを添加した。次に、チューブを50℃で5分間インキュベートし、次に4℃で保持した。その後、反応物を0.7倍体積(21マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1020】
新しいPCRチューブに、25.0マイクロリットルの溶出液10.0マイクロリットルの5X Phusion HFバッファー(NEB)、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、2.0マイクロリットルの10uM SynTemp_PE2_B1_Short1(配列番号277、上記のステップで生成された伸長産物の一部に相補的なプライマーであり、ここで説明するプライマー伸長とPCR反応のプライマーとして機能する)、および0.5uL Phusionポリメラーゼ(NEB)と水を添加して、49.7マイクロリットルの最終体積とした。この反応について、5.0マイクロリットルの体積を新たなPCRチューブに添加し、55℃で30秒間、60℃で30秒間、72℃で30秒間インキュベートし、その後、98℃、次いで65℃、次いで72℃で各々30秒間の10サイクルを行い、その後、4℃で保持した。次に、各チューブに、9.0マイクロリットルの5X Phusionバッファー、1.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、1.75マイクロリットルの10uM SynTemp_PE2_B1_Short1(配列番号277)、1.75マイクロリットルの10uM US_PCR_Prm_Only_02(配列番号278)、および0.5マイクロリットルのPhusionポリメラーゼ(NEB)と水を添加して、50マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、98℃で30秒間、次いで72℃で30秒間の24サイクルで増幅し、その後、4℃で保持し、1.2倍体積(60マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1021】
その後、結果として得られたライブラリをPCRベースの方法によって試料を特定するためにバーコード化し、増幅し、150サイクルの中間出力NextSeqフローセル(Illumina)を使用して標準の方法によって配列決定し、さらなる分析のために情報的に逆多重化した。
【1022】
方法9:バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を用いたバーコード化ゲノムDNA遺伝子座
この方法は、バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を使用して、特定のゲノム遺伝子座内の標的をバーコード化するためのフレームワーク(例えば、特定の遺伝子内の多数のエキソンをバーコード化する)について説明する。最初に、(方法3に記載されているように)多量体バーコード分子の溶液が、インビトロ転写およびcDNA合成によって生成された。次に、バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬の溶液を、方法4で説明したように生成し、合成DNAテンプレート(すなわち、方法4で使用したDS_ST_05、配列番号273)を標的とするアダプターオリゴヌクレオチドを使用する代わりに、特定のゲノム遺伝子座を標的とするアダプターオリゴヌクレオチドがそのステップに含まれるように修飾された。具体的には、適切なバーコード化オリゴヌクレオチドを含む多量体バーコード化試薬の溶液を、3つの異なるヒト遺伝子の各々、すなわち、BRCA1(7つのアダプターオリゴヌクレオチドを含む、配列番号279-285)、HLA-A(3つのアダプターオリゴヌクレオチドを含む、配列番号286-288)、およびDQB1(2つのアダプターオリゴヌクレオチドを含む、配列番号289-290)について個別に生成した。方法4のプロセスは、上記の3つの溶液の各々に対して行われた。次に、これら3つの溶液を等量でマージし、最終的な総濃度に希釈して、約50ナノモルの全てのバーコード化オリゴヌクレオチドを作成した。
【1023】
PCRチューブに、2.0マイクロリットルの5X Phusion HFバッファー(NEB)と、1.0マイクロリットルの100ナノグラム/マイクロリットルのヒトゲノムDNA(Coriell Institute製NA12878)が追加され、9.0マイクロリットルの最終体積とした。このプロトコルの特定のバリアントバージョンでは、高温の98℃インキュベーションの前に、このステップで多量体バーコード化試薬(バーコード化オリゴヌクレオチドを含む)も追加された。反応物を98℃で120秒間インキュベートし、次に4℃で保持した。チューブに、1.0マイクロリットルの多量体バーコード試薬の上記50ナノモル溶液を添加し、次に反応物を55℃で1時間、次に50℃で1時間、次に45℃で1時間インキュベートし、次に4℃で保持した。(特定の試料では、この最後のアニールプロセスが一晩で行われるように延長され、温度ステップごとに合計で約4時間になることに注意されたい)。
【1024】
各アンプリコン配列に逆ユニバーサルプライミング配列を追加するために(したがって、1つの順増幅プライマーと1つの逆増幅プライマーを使用してライブラリ全体を一度に増幅できるようにするために)、反応物を1:100に希釈し、新しいPCRチューブ内に、1.0マイクロリットルの結果として得られた溶液を、20.0マイクロリットルの5X Phusion HFバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物、1.0マイクロリットルのリバースプライマー混合物(等モル濃度の配列番号291-303、5マイクロモル濃度の各プライマー)、および1.0uL Phusionポリメラーゼ(NEB)と水を添加して、100マイクロリットルの最終体積とした。反応物を53℃で30秒間、72℃で45秒間、98℃で90秒間、次に68℃で30秒間、次に64℃で30秒間、次に72℃で30秒間インキュベートし、その後、4℃で保持した。その後、反応物を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、30マイクロリットルのH2O中に溶出させ、分光光度法により定量した。
【1025】
その後、結果として得られたライブラリをPCRベースの方法によって試料を特定するためにバーコード化し、増幅し、150サイクルの中間出力NextSeqフローセル(Illumina)を使用して標準の方法によって配列決定し、さらなる分析のために情報的に逆多重化した。
【1026】
方法10-多量体バーコード分子のライブラリの配列決定
ハイスループット配列決定による評価のための増幅された選択された分子の調製
PCRチューブ内に、1.0マイクロリットルの増幅された選択分子溶液、1.0マイクロリットルの100マイクロモルのCS_SQ_AMP_REV1(配列番号16)、1.0マイクロリットルの100マイクロモルのUS_PCR_Prm_Only_02(配列番号17)、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)、および84.0マイクロリットルのH2Oを添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次に56℃で30秒間、72℃で3分間の3サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、85マイクロリットルのH2O中に溶出させた。
【1027】
次に、新しいPCRチューブ内に、この溶液を、1.0マイクロリットルの100マイクロモルのIllumina_PE1、1.0マイクロリットルの100マイクロモルのIllumina_PE2、10マイクロリットルの10X Thermopolバッファー(NEB)、2.0マイクロリットルの10ミリモルのデオキシヌクレオチド三リン酸ヌクレオチド混合物(Invitrogen)、および1.0マイクロリットルのVent Exo-Minusポリメラーゼ(New England Biolabs、2U/uL)を添加し、100マイクロリットルの最終体積とした。PCRチューブをサーマルサイクラーに置き、95℃で30秒間、次いで64℃で30秒間、次いで72℃で3分間の4サイクル、その後、95℃で30秒間、次いで67℃で30秒間、次いで72℃で3分間の18サイクルで増幅し、その後、4℃で保持した。その後、溶液を0.8倍体積(80マイクロリットル)のAmpure XPビーズ(Agencourt、製造業者の指示に従う)で精製し、40マイクロリットルのH2O中に溶出させた。
【1028】
次に、ペアエンドの250サイクルV2配列決定ケミストリーを備えたMiSeqシーケンサーを使用して、この試料でハイスループットIllumina配列決定を行ったた。
【1029】
方法11-単一の合成テンプレートDNA分子に沿ってアニールおよび伸長されたバーコードの多量体性質の評価
バーコード化合成DNAテンプレートのライブラリは、方法3および方法4で一般的に説明されているプロトコルに従って生成された多量体バーコード化試薬の溶液を使用し、方法5で説明されている合成DNAテンプレートの溶液を使用し、方法6で説明されている実験プロトコルを使用して作成された。その後、結果として得られたライブラリをPCRベースの方法によって試料を特定するためにバーコード化し、増幅し、150サイクルの中間出力NextSeqフローセル(Illumina)を使用して標準の方法によって配列決定し、さらなる分析のために情報的に逆多重化した。次に、この方法のDNA配列決定結果をこの方法10で生成されたデータと情報的に比較して、合成DNAテンプレートの多量体バーコード化と個々の多量体バーコード化試薬上の当該バーコードの配置との間の重複の程度を評価した(結果を
図17に示す)。
【1030】
結果
各配列多量体バーコード化試薬分子の構造と予想される配列内容
方法1~3で説明したように合成された多量体バーコード分子のライブラリは、ハイスループット配列決定用に調製され、ここで、配列決定された各分子には、特定の多量体バーコード分子の連続スパンが含まれ(1つ以上のバーコード配列と1つ以上の関連する上流アダプター配列および/または下流アダプター配列)、全て配列決定された分子内で同一直線上にある。次に、このライブラリを、説明されたように、MiSeqシーケンサー(Illumina)でペアエンド250ヌクレオチドリードを使用して配列決定した。これにより、ライブラリから配列決定された合計約1,350万の分子が得られ、両端から1回配列決定され、合計で約2,700万の配列リードが得られた。
【1031】
各フォワードリードは、上流アダプターの3’末端に対応する6ヌクレオチド配列、すなわち、TGACCTで始まると予想される。
このフォワードリードの後に、分子内の第1のバーコード配列が続く(長さは20ntと予想される)。
【1032】
次に、このバーコードの後に「バーコード内配列」が続く(この場合は「フォワード」方向に配列決定される(これは、下流アダプター配列と上流アダプター配列の両方を直列に含む82ヌクレオチドである))。
ATACCTGACTGCTCGTCAGTTGAGCGAATTCCGTATGGTGGTACACACCTACACTACTCGGACGCTCTTCCGATCTTGACCT
【1033】
250ヌクレオチドフォワードリード内で、これに、第2のバーコード、別のバーコード内配列、第3のバーコード、その後、別のバーコード内配列の一部が続く。
【1034】
各逆リードは、下流アダプター配列、すなわち、GCTCAACTGACGAGCAGTCAGGTATに対応する配列で開始することが期待される。
次に、この逆リードの後に、分子の反対側の端から入ってくる第1のバーコードが続く(これも20ヌクレオチド長であるが、分子の反対側の鎖から配列決定されているため、フォワードリードによって配列決定されたものとは逆向きである)
次に、このバーコードの後に「バーコード内配列」が続くが、逆方向になる(反対側のストランドにあるため)。
AGGTCAAGATCGGAAGAGCGTCCGAGTAGTGTAGGTGTGTACCACCATACGGAATTCGCTCAACTGACGAGCAGTCAGGTAT
同様に、この250ヌクレオチドの逆リードの後に、第2のバーコード、別のバーコード内配列、第3のバーコード、そして別のバーコード内配列の一部が続く。
【1035】
配列の抽出および分析
Pythonでのスクリプティングを使用して、関連するバーコードと隣接する上流アダプターおよび下流アダプター配列の各ペアを単離し、各バーコード分子の個々のバーコード配列を単離し、同じ分子内で配列決定された各バーコード配列を、多量体バーコード分子のライブラリ内の同じ多量体バーコード分子に属するものとして注釈を付けた。単純な分析スクリプト(Networkx、Python)を使用して、配列決定された様々な分子間でバーコードとバーコードのペアの重複を調べることにより、多量体バーコード分子のバーコード群全体を決定した。バーコードの長さ、配列の内容、および多量体バーコード分子のライブラリ全体の多量体バーコード分子のサイズと複雑さ等、このデータのいくつかの測定基準が作成された。
【1036】
各バーコード配列内のヌクレオチドの数
Illumina配列決定された各分子内に含まれる、各バーコード分子からの個々のバーコード配列が単離され、かかる各バーコードの全長は、上流アダプター分子配列と下流アダプター分子配列との間のヌクレオチド数をカウントすることによって決定された。結果を
図10に示す。
【1037】
バーコードの圧倒的多数は20ヌクレオチド長であり、これは、二本鎖サブバーコードライブラリからの4ヌクレオチド長のサブバーコード分子の5つの追加に対応する。したがって、これは期待され、かつ所望の結果であり、サブバーコードライブラリのMlyI切断溶液へのライゲーション、ライゲートされたライブラリのPCR増幅、ウラシルグリコシラーゼ酵素消化、およびMlyI制限酵素切断の各「サイクル」が成功し、そして、各サイクルで新しい4ヌクレオチドのサブバーコード分子を効率的に追加することができ、その後、これらの分子を増幅し、サブバーコードの追加の5サイクルを含むさらなる処理を継続するためのプロトコルを介して、最終的な上流アダプターライゲーションライブラリを作成することに成功したことを示している。
【1038】
また、この配列分析方法を使用して、配列決定された全ての多量体バーコード分子全体の固有のバーコードの総数を定量した。これは、合計19,953,626の固有のバーコードになり、これは、各々約10個の個別のバーコード分子を持つ200万個の多量体バーコード分子を合成したことを考えると、予想される2,000万のバーコードと本質的に同じである。
【1039】
したがって、このデータと分析を総合すると、サブバーコード配列から複雑なコンビナトリアルバーコードを作成する方法が、多量体バーコード分子を合成する目的に効果的かつ有用であることを示している。
【1040】
各多量体バーコード分子内の固有のバーコード分子の総数
図11は、配列決定された各多量体バーコード分子内の固有のバーコード分子の総数(それぞれのバーコード配列によって決定される)の定量の結果を示している。上記のように、これを行うために、第1のケースでは、シーケンサーで配列決定された同じ個々の分子内に存在し、検出されたバーコード配列を調べた。次に、バーコード配列をさらにクラスター化する追加のステップを採用した。ここでは、連結の明示的な知識に基づいて個々のバーコード配列間の連結を決定でき、かつ「暗黙の」連結を決定することもできる、単純なネットワーク分析スクリプト(Networkx)を使用した(ここで、バーコードは同じ連続した配列決定された分子内に見出される)。ここで、同じ配列決定された分子内で配列決定されていない2つ以上のバーコードは、代わりに、共通の第3のバーコード配列への直接連結を共有する(この共有された共通の連結は、第1の2つのバーコード配列が実際には同じ多量体バーコード分子上にあることを指示する)。
【1041】
この図は、反応内で配列決定された多量体バーコード分子の大部分に2つ以上の固有のバーコードが含まれていることを示している。したがって、重複伸長PCR連結プロセスを通じて、複数のバーコード分子を多量体バーコード分子に連結できることを示している。より多くの多量体バーコード分子が予想される数のバーコード分子(10)に近いことを示すと予想されるが、この観察された効果は不十分な配列決定深度によるものであり、配列決定された分子の数が多いほど、個々のバーコード分子間の真の連結の大部分を観察できる。それにもかかわらず、このデータは、ここで説明する基本的な合成手順が意図された目的に有効であることを示唆している。
【1042】
代表的な多量体バーコード分子
図12は、分析スクリプトによって検出された代表的な多量体バーコード分子を示している。この図では、各「ノード」は(関連するバーコード配列からの)単一のバーコード分子であり、各行は、同じ配列決定された分子で少なくとも1回配列決定された2つのバーコード分子間の「直接連結」であり、ノードは個々の多量体バーコード分子であり、直接連結のあるバーコードと、分析スクリプトによって決定された暗黙の間接連結内のバーコードとの両方を含む。挿入図には、単一の多量体バーコード分子と、そこに含まれるその構成バーコード分子の配列が含まれている。
【1043】
この図は、多量体バーコード分子合成手順を示しており、サブバーコード分子ライブラリからバーコード分子を構築でき、複数のバーコード分子を重複伸長PCR反応で連結でき、個々の多量体バーコード分子の数が定量的に単離でき、これらを増幅して下流の分析と使用に供することができる。
【1044】
(i)バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬、および(ii)多量体バーコード化試薬と個別のアダプターオリゴヌクレオチドを含む既知の配列のバーコード化合成DNAテンプレート
配列の抽出および分析
Pythonでスクリプトを作成し、Amazon Web Services(AWS)フレームワークに実装することで、試料の逆多重化に続いて配列リードごとに、特定の多量体バーコード試薬の各バーコード領域が、隣接する上流アダプターおよび下流アダプター配列から単離された。同様に、所与の合成DNAテンプレート分子からの各分子配列識別子領域は、その隣接する上流および下流配列から単離された。このプロセスは、試料ライブラリの各分子に対して繰り返され、単一のフィルタリングステップが行われ、単一のリードでのみに存在する個々のバーコードと分子配列識別子(したがって、配列決定エラーまたは酵素試料調製プロセスからのエラーのいずれかを表す可能性が高い)がデータから打ち切られた。各分子配列識別子について、単一の配列リード内でそれに関連して見出された固有の(すなわち、異なる配列を有する)バーコード領域の総数が定量された。次に、ヒストグラムプロットを作成して、ライブラリで見出された全ての分子配列識別子にわたるこの数の分布を視覚化した。
【1045】
考察
図13は、方法6(バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を使用した既知の配列のバーコード化合成DNAテンプレート)のこの分析結果を示している。この図は、多量体バーコード化試薬の大部分が、それらが関連付けられている各分子配列識別子のタンデムに繰り返されるコピーの2つ以上を正常に標識できることを明らかにしている。1から約5または6の「標識イベント」の分布が観察される。これは、おそらく不完全な酵素反応、またはバーコード試薬/合成テンプレートインターフェイスでの立体障害、または他の因子が原因で、このシステムである程度の確率的相互作用が発生する可能性があることを示している。
【1046】
図14は、方法7(多量体バーコード分子と個別のアダプターオリゴヌクレオチドを使用した既知の配列のバーコード化オリゴヌクレオチド合成DNAテンプレート)を使用して行った同じ分析の結果を示している。この図はまた、多量体バーコード化試薬の大部分が、前の分析で観察されたものと同様の分布で、それらが関連付けられている各分子配列識別子のタンデムに繰り返されるコピーの2つ以上を正常に標識できることを明確に示している。
【1047】
総合すると、これら2つの図は、多量体分子バーコード化のこのフレームワークが効果的なものであり、さらに、フレームワークを様々な方法で構成できることを示している。
図13は、標的(合成)DNAテンプレートと接触する前に、多量体バーコード試薬がすでにバーコード化オリゴヌクレオチドを含むようにフレームワークを構成した方法に基づく結果を示している。対照的に、
図14は、アダプターオリゴヌクレオチドが最初に合成DNAテンプレートに接触し、その後のステップでアダプターオリゴヌクレオチドが多量体バーコード試薬との接触によってバーコード化される代替方法に基づく結果を示している。これらの図を合わせると、これらの試薬の多量体バーコード化能力と、様々な主要な実験プロトコルにおけるそれらの多様性の両方が示される。
【1048】
個々の多量体バーコード化試薬が同じ合成DNAテンプレートの2つ以上の部分配列を正常に標識するかどうかを分析するために、かつその程度を分析するために、(前の段落で説明した、
図12に示すようなNetworkx分析から予測された)ライブラリ内の個々の多量体バーコード化試薬の異なるバーコードの群を、(方法11で説明したように)単一の合成DNAテンプレートに沿ってアニールおよび伸長したバーコードと比較した。個々の多量体バーコード化試薬で見出されたバーコードの各群には、数値の「試薬識別子標識」が付けられた。方法11の配列決定データで2つ以上のバーコードによって表された各合成DNAテンプレート分子配列識別子(すなわち、合成テンプレート分子の2つ以上の部分配列がバーコード化オリゴヌクレオチドによってアニールおよび伸長された)について(すなわち、個々の合成DNAテンプレート分子について)、対応する「試薬識別子標識」が決定された。次に、かかる各合成テンプレート分子について、同じ単一の多量体バーコード化試薬に由来する多量体バーコードの総数を計算した(すなわち、異なるバーコード化オリゴヌクレオチドによって標識されたが、同じ、単一の多量体バーコード化試薬から得られた合成テンプレート分子内の異なる部分配列の数を計算した)。次に、この分析を繰り返し、各「試薬識別子標識」に割り当てられたバーコードがランダム化された「ネガティブコントロール」条件と比較した(すなわち、同じバーコード配列がデータに存在したままであるが、多量体バーコード化試薬のライブラリ全体にわたる異なるバーコード配列の実際の分子リンケージには対応していない)。
【1049】
この分析のデータを、実際の実験データと、ランダム化されたバーコードが割り当てられた対照データの両方について、
図17に示す(縦軸の対数目盛に注意されたい)。この図が示すように、標的合成DNAテンプレート分子ごとの固有のバーコード化イベントの数は少ないが、それらは個々の多量体バーコード化試薬の既知のバーコードコンテンツとほぼ完全に重複している。つまり、ランダム化されたバーコードデータ(「多価バーコード化」のように見えるテンプレート分子を本質的に含まない)と比較すると、実際の実験では、同じ、個々の多量体バーコード化試薬からの複数のバーコード化オリゴヌクレオチドで標識されているように見えるテンプレート分子の圧倒的多数(99.9%以上)は、実際には、溶液中の同じ単一の試薬によって多価に標識される。対照的に、個々の合成DNAテンプレートに標識を付けた異なるバーコード間に非ランダムな関連がなかった場合(つまり、
図17が実際の実験データとランダム化されたデータとの間に違いを示さなかった場合)、これは、多量体バーコード化試薬によって指示されたように、空間的に制約された方法でバーコード化が発生していないことを示したであろう。しかしながら、上で説明したように、データは、単一の合成DNAテンプレートで見出された部分配列が、単一の個別の多量体バーコード化試薬のみと相互作用した(そしてバーコード化された)、目的のバーコード化反応が発生したことをもっともらしく示している。
【1050】
バーコード化オリゴヌクレオチドを含む多量体バーコード化試薬を用いたバーコード化ゲノムDNA遺伝子座
配列の抽出および分析
他の分析と同様に、スクリプトはPythonで作成され、Amazon Web Services(AWS)フレームワークに実装された。試料の逆多重化に続いて各配列リードについて、特定の多量体バーコード試薬からの各バーコード領域が、隣接する上流アダプターおよび下流アダプター配列から分離され、さらなる分析のために個別に記録された。同様に、下流領域の3’末端までの各配列(バーコード化オリゴヌクレオチドを含む配列、および実験プロトコル中にオリゴヌクレオチドがプライミングした配列を表す)を、さらなる分析のために単離した。各リードの各下流配列を、予想されるアダプターオリゴヌクレオチド配列(すなわち、オリゴヌクレオチドが向けられた3つの遺伝子の1つに対応するプライマーから)および関連する追加の下流配列の存在について分析した。次に、各リードは、「オン標的」(予想される標的配列の1つに対応する配列)または「オフ標的」のいずれかとして記録された。さらに、標的となる領域の各々に、固有の多量体バーコード(すなわち、同一であるが重複するバーコードが単一のコピー表現にマージされている)の総数が計算された。予想される各配列リードの概略図とその構成要素を
図16に示す。
【1051】
考察
図15は、4つの異なる独立した試料について、この方法のこの分析の結果を示している。これらの4つの試料は、多量体バーコード試薬をアニールするプロセスが3時間、または一晩(約12時間)行われた方法を表している。さらに、これらの2つの条件の各々について、この方法は、合成されたままの状態で保持された多量体バーコード試薬、またはバーコード化オリゴヌクレオチドが最初にバーコード分子自体から離れて(高温融解ステップを経て)最初に変性させる修正されたプロトコルのいずれかで行われた。各行は、示されているように異なるアンプリコン標的を表し、各セルは、4つの試料の各々で各アンプリコンに関連付けられていることが検出された固有のバーコードの総数を表す。また、各試料について、合計された全ての標的にわたるオン標的リードの合計割合もリストされている。
【1052】
図に示されているように、全ての試料のリードの大部分はオン標的である。しかしながら、各アンプリコン標的で観察される固有のバーコード分子の数には大きな範囲が見られる。異なるアンプリコンにわたるこれらの傾向は、異なる実験条件にわたって一貫しているようであり、異なるオリゴヌクレオチドの異なるプライミング(またはミスプライミング)効率、異なる増幅効率、または異なるマッピング効率、および独立して、もしくは組み合わせて作用する潜在的な他の因子が原因である可能性がある。さらに、より長くアニールされた試料は、おそらくそれらの同族のゲノム標的への多量体試薬のより完全な全体的なアニールのために、より多くのバーコードが観察されることは明らかである。さらに、バーコード化オリゴヌクレオチドがバーコード分子から最初に変性された試料は、おそらく完全に組み立てられたバーコード分子がプライマーのクラスターを同じ遺伝子座の近くのゲノム標的により効果的にアニールできるアビディティ効果のために、固有のバーコードの総数が少なくなっている。いずれにせよ、この図は、多数の分子にわたって同時にゲノムDNA分子を標識する多量体試薬の能力を示しており、バーコード化オリゴヌクレオチドが多量体バーコード化試薬に結合したままであるかどうか、またはそこから変性されて、それによって潜在的に溶液中でより容易に拡散することができるかどうかにかかわらず、そうすることができる。
【1053】
実施例2
微粒子からの配列を連結するための材料および方法
全ての実験ステップは、標準的な物理的実験分離(例えば、PCR前およびPCR後の実験)の使用を含む、汚染が管理された実験環境で行われる。
【1054】
微粒子検体を単離するためのプロトコル
標準的な血液試料(例えば、合計5~15mL)を対象から採取し、EDTAを含むチューブを使用した血液分画法で処理し、800xGで10分間遠心分離して血漿画分を単離する。次に、細胞血漿画分を注意深く分離し、800xGで10分間遠心単離して、残っている無傷の細胞をペレット化する。その後、上清をさらに処理するために注意深く単離する。次に、上清を3000xGで30分間遠心単離して、微粒子画分をペレット化する(20,000xGで30分間の高速遠心分離モードを使用して、高濃度の微粒子検体をペレット化する)。次に、結果として得られた上清を注意深く除去し、ペレットを次の処理ステップのために適切なバッファーに再懸濁する。再懸濁したペレットからアリコートを採取し、(例えば、PicoGreen、ThermoFisher Scientific等の標準的な蛍光核酸染色法を使用して)再懸濁したペレット中のDNA濃度を定量するために使用する。試料は、後続の処理ステップで適切な濃度になるように体積が調整される。
【1055】
区画化とPCR増幅のプロトコル
上記のように微粒子検体を単離するプロセスに続いて、ペレットは、1X PCRバッファー、PCRポリメラーゼ酵素、dNTP、およびプライマーペアのセットの完全な溶液を含むPCRバッファーに再懸濁され、直接PCRに適したポリメラーゼとPCRバッファーを使用する。この再懸濁ステップは、再懸濁された溶液の各5マイクロリットルが微粒子検体自体からの約0.1ピコグラムのDNAを含むように行われる。マルチプレックスPCR設計アルゴリズム(例えば、PrimerPlex、PREMIER Biosoft)を使用して、1つ以上の遺伝子標的をカバーする5~10個(大きなアンプリコンパネルには大きな数が使用される)のプライマーペアのパネルを設計して、クロスプライミングを最小限に抑え、全てのプライマー間でほぼ同等のアニール温度を実現する。各アンプリコンの長さは70~120ヌクレオチドに固定されている。各フォワードプライマーは、5’末端に一定のフォワードアダプター配列を有し、各リバースプライマーは、5’末端に一定のリバースアダプター配列を有し、プライマーは等モル濃度でポリメラーゼ反応に含まれる。次に、再懸濁した試料をPCRチューブのセット(または384ウェルプレートフォーマットの個々のウェル)に広げ、各チューブ/ウェルに5.0マイクロリットルの反応溶液を入れる。微粒子試料中のDNAの総量が許す限り、最大384以上の個別の反応が行われる。バーコード化オリゴヌクレオチドを使用した後続のバーコード化のために、10~15回のPCRサイクルが行われる。22~28回のPCRサイクルが、多量体バーコード化試薬を使用した後続のバーコード化に対して行われる。
【1056】
バーコード化オリゴヌクレオチドによるバーコード化のプロトコル
上記のPCR増幅のプロトコルに従って、バーコード化オリゴヌクレオチドを各ウェルに追加する。各フォワードバーコード化オリゴヌクレオチドは、3’末端にフォワードアダプター配列、5’末端にフォワード(リード1)Illumina配列決定プライマー配列、および2つの間の6ヌクレオチドのバーコード配列を含む。5’末端にリバース(リード2)Illumina増幅配列と3’末端にリバースアダプター配列を含むリバースプライマーが使用される。異なる単一のバーコード化オリゴヌクレオチド(すなわち、異なるバーコード配列を含む)が各ウェルに使用される。PCR反応体積を50マイクロリットルに調整して標的特異的プライマーを希釈し、8~12回のPCRサイクルを行って、各チューブ/ウェル内の配列にバーコード配列を付加する。各ウェルからの増幅産物は、SPRIクリーンアップ/サイズ選択ステップ(Agencourt Ampure XP、Beckman-Coulter Genomics)を使用して精製され、全てのウェルから結果として得られた精製産物は単一の溶液にマージされる。全長Illumina増幅プライマー(PE PCRプライマー1.0/2.0)を使用した最終PCR反応を7~12サイクル行い、マージされた産物をIlluminaフローセルにロードするのに適切な濃度に増幅し、結果として得られた反応物をSPRI精製/サイズ選択し、定量する。
【1057】
多量体バーコード化試薬を使用したバーコード化のプロトコル
バーコード配列に多量体バーコード化試薬を付加するには、上記のPCR増幅のプロセスに続いて、個々のウェルからのPCR増幅産物をSPRI精製ステップで精製し、異なるウェルからの試料をマージまたは相互汚染させることなく、個々のウェルの1X PCR反応バッファー(dNTPを含む)中に再懸濁する。次に、少なくとも1,000万の異なる多量体バーコード化試薬のライブラリから、約5つの多量体バーコード化試薬を含むアリコートを各ウェルに追加する。ここで、各多量体バーコード化試薬は、10~30個の個別のバーコード分子で構成される連続した多量体バーコード分子である。各バーコード分子は、他のバーコード分子とは異なる配列を有するバーコード領域を含み、各バーコード分子にアニールされたバーコード化オリゴヌクレオチドを有する。各バーコード化オリゴヌクレオチドは、5’末端にフォワード(リード1)Illumina配列決定プライマー配列を含み、3’末端にフォワードアダプター配列(フォワードPCRプライマーにも含まれている)を含み、バーコード配列は中央セクションにある。5’末端に逆(リード2)Illumina増幅配列と3’末端にリバースアダプター配列を含むリバースプライマーも反応混合物に含まれる。このバーコード付加反応には、ホットスタートポリメラーゼが使用される。ポリメラーゼは最初にその活性化温度で活性化され、次に5~10回のPCRサイクルが行われ、フォワード/リバースアダプターアニール温度で行われるアニールステップで、バーコード化オリゴヌクレオチドがPCR増幅産物に沿って伸長し、これらのプライマー伸長産物にリバースIllumina増幅配列が伸長する。各ウェルから結果として得られた産物は、SPRIクリーンアップ/サイズ選択を使用して精製され、全てのウェルから結果として得られた精製された産物は、単一の溶液にマージされる。全長Illumina増幅プライマー(PE PCRプライマー1.0/2.0)を使用した最終PCR反応を7~12サイクル行い、マージされた産物をIlluminaフローセルにロードするのに適切な濃度に増幅し、結果として得られた反応物をSPRI精製/サイズ選択し、定量する。
【1058】
配列決定と情報分析のためのプロトコル
バーコード化および増幅プロトコルに続いて、増幅された試料がIlluminaシーケンサー(例えば、HiSeq 2500)で定量および配列決定される。ロードする前に、試料はシーケンサー対応のphiXゲノムDNAライブラリと結合され、phiX分子は結合されたライブラリの最終モル分率の50~70%を含む。次に、組み合わせた試料を各々、クラスター化に推奨される濃度でフローセルの1つ以上のレーンにロードする。試料は、ペアエンド2x100配列決定サイクルを使用して、個々のバーコード化された配列が平均5~10回のリードで配列決定されるリード深度まで配列決定される。次に、生の配列が品質トリミングおよび長さトリミングされ、一定のアダプター/プライマー配列がトリミングされ、各保持配列リードからのゲノムDNA配列およびバーコード配列が情報的に単離される。連結された配列は、同じバーコード配列に付加された、または同じバーコード配列のセットからの(すなわち、同じ多量体バーコード化試薬からの)異なるバーコード配列に付加されたゲノムDNA配列を検出することによって決定される。
【1059】
バーコード化オリゴヌクレオチドを使用してゲノムDNAの断片をバーコード化するためのプロトコル
全血から循環微粒子を単離するために、1.0ミリリットルの全ヒト血液(K2 EDTAチューブで収集)を2本の1.5ミリリットルのエッペンドルフDNA Lo-Bindチューブの各々に添加し、デスクトップマイクロ遠心機で500xGで5分間遠心分離した。次に、結果として得られた最上部(上清)層(各チューブから約400マイクロリットル)を新しい1.5ミリリットルのエッペンドルフDNA Lo-Bindチューブに添加し、再びデスクトップマイクロ遠心機で500xGで5分間遠心分離した。次に、結果として得られた最上部(上清)層(各チューブから約300マイクロリットル)を新しい1.5ミリリットルのエッペンドルフDNA Lo-Bindチューブに添加し、デスクトップマイクロ遠心分離機で3000xGで15分間遠心分離した。結果として得られた上清層を完全かつ注意深く吸引し、各チューブのペレットを10マイクロリットルのリン酸緩衝生理食塩水(PBS)に再懸濁し、次に2つの10マイクロリットルの再懸濁試料を単一の20マイクロリットルの試料にマージした(本方法の「バリアントA」用の試料を生成する)。
【1060】
この方法の関連するバリアント(「バリアントC」)では、この元の20マイクロリットルの試料のアリコートを新しい1.5ミリリットルのエッペンドルフDNA Lo-Bindチューブに移し、1500xGで5分間遠心分離し、結果として得られたペレットをPBSに再懸濁し、以下に説明するように低濃度溶液に分注した。
【1061】
次に、前述の20マイクロリットルの試料内(および/または再懸濁した「バリアントC」試料から)の循環微粒子を、バーコード化オリゴヌクレオチドを付加する前に区画化した。区画ごとに少数の循環微粒子を区画化するために、20マイクロリットルの試料をより低い微粒子濃度を含む溶液に分注した。異なる濃度の8つの溶液を使用し、第1の溶液は元の(希釈されていない)20マイクロリットルの試料で、後続の7つの溶液は各々前の溶液に比べて2.5倍低い微粒子濃度(PBS中)であった。次に、各溶液の0.5マイクロリットルのアリコートを200マイクロリットルのPCRチューブ(フラットキャップ、Axygen製)中のH2O中の9.5マイクロリットルの1.22X「NEBNext Ultra II End Prep Reaction Buffer」(New England Biolabs)に添加し、穏やかに混合した。微粒子を透過処理するために、加熱された蓋を備えたサーマルサイクラー上で、チューブを摂氏65度で30分間加熱した。各チューブに0.5マイクロリットルの「NEBNext Ultra II End Prep Enzyme Mix」を添加し、溶液を穏やかに混合した。溶液を、サーマルサイクラー上で摂氏20度で30分間、次に摂氏65度で30分間インキュベートした。
【1062】
各チューブに、5.0マイクロリットルの「NEBNext Ultra IIライゲーションマスターミックス」、0.33マイクロリットルの0.5X(H2O中)「NEBNextライゲーションエンハンサー」、0.42マイクロリットルの0.04X(0.1X NEBuffer 3内)「NEBNextアダプター」を追加し、溶液を穏やかに混合した。次に、溶液を、加熱された蓋をオフにしたサーマルサイクラー上で、摂氏20度で15分間(またはこの方法の「バリアントB」では2時間)インキュベートした。各チューブに0.5マイクロリットルの「NEBNext USER Enzyme」を添加し、溶液を穏やかに混合した。次に、溶液を、摂氏50度に設定された加熱された蓋を備えたサーマルサイクラー上で、摂氏20度で20分間、摂氏37度で30分間インキュベートし、次いで、摂氏4度に保持した。次に、各反応物を1.1倍体積のAmpure XP SPRIビーズ(Agencourt、製造元の指示に従う)で精製し、21.0マイクロリットルのH2O中に溶出させた。区画化された循環微粒子からのゲノムDNAの断片に「NEBNextアダプター」配列をライゲートするこのプロセスは、カップリング配列を当該断片に付加するプロセスを提供する(ここで、部分的に二本鎖および部分的に一本鎖の配列を含む「NEBNextアダプター」自体は、当該カップリング配列を含み、カップリング配列を付加するプロセスは、ライゲーション反応で行われる)。プロセスの次のステップでは、バーコード化オリゴヌクレオチドが、区画化された循環微粒子からのゲノムDNAの断片に、アニールおよび伸長プロセス(PCR反応を介して行われる)で付加される。
【1063】
この方法の「バリアントB」では、上記のUSER酵素ステップの後、Ampure XP精製の前に、USER消化試料を、50.0マイクロリットルの「NEBNext Ultra II Q5マスターミックス」、および2.5マイクロリットルの「Universal PCR Primer for Illumina」、および2.5マイクロリットルの特定の「NEBNext Index Primer」[NEBNext Multiplex Oligos Index Primers Set1またはIndex Primers Set2から]、および28.2マイクロリットルのH2Oに添加し、溶液を穏やかに混合し、サーマルサイクラーで5サイクルのPCRで増幅した。各サイクルは、98℃で20秒間、65℃で3分間である。次に、各反応物を0.95倍体積のAmpure XP SPRIビーズ(Agencourt、製造元の指示に従う)で精製し、21.0マイクロリットルのH2O中に溶出させた。
【1064】
次に、Ampure XP精製溶液(USER消化後またはこの方法の「バリアントB」の初回のPCR増幅プロセス後)(各20.0マイクロリットル)を、25.0マイクロリットルの「NEBNext Ultra II Q5マスターミックス」、および2.5マイクロリットルの「Universal PCR Primer for Illumina」、および2.5マイクロリットルの特定の「NEBNext Index Primer」に添加し、溶液を穏やかに混合し、サーマルサイクラーで28(またはバリアントBの場合は26サイクル)サイクルのPCRで増幅した。各サイクルは、98℃で10秒間、65℃で75秒間。摂氏75度の1回の最終伸長ステップで5分間である。次に、各反応物を0.9倍体積のAmpure XP SPRIビーズ(Agencourt、製造元の指示に従う)で精製し、25.0マイクロリットルのH2O中に溶出させた。PCRのこれらのステップは、循環微粒子からのゲノムDNAの断片の配列にバーコード配列を付加する。ここで、バーコード配列はバーコード化オリゴヌクレオチド内に含まれる(すなわち、各PCR反応内で使用される特定の「NEBNext Index Primer」内に含まれる)。PCR反応の各プライマー結合および伸長ステップにおいて、バーコード化オリゴヌクレオチドはカップリング配列(例えば、「NEBNextアダプター」内の配列)にハイブリダイズし、次に伸長ステップをプライミングするために使用される。ここで、バーコード化オリゴヌクレオチドの3’末端は、バーコード配列と循環微粒子からのゲノムDNAの断片の配列の両方を含む配列を生成するように伸長された。PCR反応ごとに1つのバーコード化オリゴヌクレオチド(したがって1つのバーコード配列)を使用し、異なるPCR反応の各々に異なるバーコード配列を使用した。したがって、各区画内の循環微粒子からのゲノムDNAの断片の配列は、区画からの配列のセットを連結する単一のバーコード配列に付加された。区画の各々の配列のセットは、異なるバーコード配列によって連結された。
【1065】
ネガティブコントロール試料を作成するために、上記の第1の段落のように循環微粒子の別の20マイクロリットル試料を調製したが、その中のゲノムDNAの断片を、Qiagen DNEasy精製キット(Qiagenメーカーの指示に従ってスピンカラムと遠心分離プロトコルを使用)を用いて単離および精製し、50マイクロリットルのH2O中に溶出させた後、上記のようにNEBNext End Prep、Ligation、USER、およびPCR処理ステップで処理する。このネガティブコントロール試料は、非常に多数の循環微粒子からのゲノムDNAの断片が分析される(すなわち、1つまたは少数の循環微粒子からの配列の連結が行われていない)配列決定シグナルおよび読み出しを分析するために使用された。
【1066】
循環微粒子の遠心分離と区画化、カップリング配列の付加、バーコード配列の付加、PCR増幅と精製の上記の手順に続いて、循環微粒子からのゲノムDNAの断片からの配列を含むいくつかのバーコードライブラリをマージし、Mid-Output Illumina NextSeq 500フローセル上で、ペアエンドリード(100x50)と、個別の(フォワード方向)インデックスリード(バーコード化オリゴヌクレオチドが付加されたバーコード配列を決定するための)を使用して、150サイクルの配列決定を行った。通常、6~12個のバーコードライブラリ(すなわち、ライブラリごとに連結された配列の1つのバーコードセットを含む)がマージされ、フローセルごとに配列決定された。バーコードライブラリごとに、少なくとも数百万回のリードのカバレッジが達成された。配列リードは、インデックスリード内のバーコードに従って逆多重化され、各バーコード区画からの配列は、Bowtie2で参照ヒトゲノム配列(hg38)にマッピングされ、マッピングされた(および重複排除された)配列をSeqmonk(バージョン1.39.0)にインポートして、視覚化、定量、および分析を行った。典型的な代表的な分析では、リードは各ヒト染色体に沿って500Kbのスライディングウィンドウにマッピングされ、次にかかる各ウィンドウ全体のリードの総数が定量され、視覚化された。
【1067】
これらのバーコード化オリゴヌクレオチド法の主要な実験結果を
図25~29に示しており、ここでさらに詳しく説明する。
【1068】
図25は、バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントA」バージョンから)によって生成された、代表的な循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。各染色体にわたってタイリングされた500キロベース(Kb)のスライディングウィンドウ内のヒトゲノムにおける全ての染色体にわたる配列リードの密度が示される。2つの明確な自己完結型のリードクラスターが観察されており、合計スパンはそれぞれ約200Kbおよび500Kbである。特に、2つのリードクラスターは両方とも同じ染色体上にあり、さらに同じ染色体アームの近くの部分(第14染色体上)に由来するものであるため、実際には、複数の分子内染色体構造が単一の循環微粒子にパッケージ化され得、そこから由来したゲノムDNAの断片がヒトの血管系内を循環しているのではないかという疑念が確認された。
【1069】
図26はまた、循環微粒子内のゲノムDNA断片の配列のリンケージも示しているが、バーコード化オリゴヌクレオチドを付加するバリアント法(プロトコル例の「バリアントB」バージョンから)によって生成され、「バリアントA」へのライゲーションの期間が相対的に増加する。特異な染色体セグメント(それぞれ第1染色体および第12染色体)内でのリードの明確なクラスター化を伴う、ヒトゲノムにおける全ての染色体にわたる配列リードの密度が再び示されている。この実験で使用された区画が2つの異なる微粒子で構成されている可能性がある。その場合、各微粒子から1つのリードクラスターが発生した可能性がある。あるいは、単一の微粒子が第1染色体および第12染色体の各々からのリードクラスターを含んでいた可能性がある。これは、分子間染色体構造が単一の循環微粒子にパッケージ化され、血液中を循環することを示している。
【1070】
図27は、バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントA」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。(
図26の第12染色体からのリードクラスターの)実際の配列リードが示されており、大きな染色体セグメント内、次に小さな染色体セグメント内でズームインされ、これらの連結されたリードの焦点の高密度の性質を示し、リードクラスターは、単一細胞からの個々の染色体分子からの配列の明確で連続したクラスターを含むという事実を示すために、すぐに隣接する、重複しない、ヌクレオソームに配置された断片を示すレベルまで低下している。
【1071】
図28は、バーコード化オリゴヌクレオチドを付加する方法(プロトコル例の「バリアントC」バージョンから)によって生成された、循環微粒子内のゲノムDNAの断片の配列のリンケージを示している。バリアントAおよびバリアントBとは対照的に、このバリアントCの実験では、低速の遠心分離プロセスを使用して、他の2つのバリアントと比較して循環微粒子の異なるより大きな集団を単離した。特異な染色体セグメント内での観察されたリードの明確なクラスター化を再び伴う、この実験からのヒトゲノムにおける全ての染色体にわたる配列リードの密度が示されている。しかしながら、かかるセグメントは、他のバリアントこの方法よりも染色体スパンが明らかに大きくなっている(バリアントAまたはBと比較してバリアントC内でペレット化される微粒子が大きいため)。
【1072】
図29は、「バリアントA」プロトコルのようにバーコード化オリゴヌクレオチドに付加する前に、ゲノムDNAの断片をクリーンアップキット(Qiagen DNEasyスピンカラムキット)で精製する(すなわち、連結を解除する)ネガティブコントロール実験を示している。連結されていないリードの入力試料を考えると予想されるように、リードのクラスター化はまったく観察されず(むしろ、存在するリードはゲノムの全ての染色体領域全体にランダムかつ本質的に均等に分散される)、循環微粒子が、個々の染色体内の焦点のある隣接するゲノム領域からのゲノムDNAの断片を含むことを検証する。当該制御ライブラリからのリードのさらなるランダムサンプリング/サブサンプリングを行っても、リードクラスターは観察されない。
【1073】
実施例3
標的生体分子から連結されたシグナルのセットを測定するための材料と方法
CD2タンパク質の測定と選択のためのプロトコル
循環微粒子のCD2タンパク質レベルを測定するために、微粒子を単離し、上記のようにリン酸緩衝生理食塩水(PBS)に再懸濁し、10uLの洗浄済みCD2 Dynabeads(Invitrogen、カタログ番号11159D)と4℃で20分間インキュベートした。ビーズ試料のインキュベーションと結合に続いて、反応混合物を磁石で結合し、「CD2陰性」循環微粒子を含む結果として得られた上清(ビーズ非結合)相を吸引して新しいチューブに移し、結合した「CD2陽性」循環微粒子を有するビーズが磁石から放出され、PBSに再懸濁された。次に、CD2陰性およびCD2陽性を区画化し、上記のように低濃度溶液に分注し、次に個々のアリコートをバーコード化し、上記のようにNEBNext試料調製キットで配列決定するために調製した。次に、CD2陰性の一部を、以下に説明するようにメチル化およびPMCA測定のためにさらに処理した。
【1074】
5-メチルシトシン修飾DNAの測定と濃縮のためのプロトコル
循環微粒子内のゲノムDNA断片内の5-メチルシトシン修飾DNAを測定するために、CD2陰性微粒子を上記のように単離し、次に上記のように区画化および分注し、次に上記のように65℃で30分間インキュベートすることにより、分注および区画化された微粒子からゲノムDNAの断片が当該微粒子から放出され、次に、ゲノムDNAの断片の末端を末端修復し、Aテール化し、アダプターにライゲートし、次に、上記のようにNEBNext試料調製キットを用いてUSER酵素で消化し、次に、試料を1X CutSmartバッファー(New England Biolabs)で5倍に希釈し、次に、1.0uL HpaII酵素(New England Biolabs)を使用して37℃で30分間消化し、これにより、CCGG部位で非メチル化DNAを消化するが、メチル化CCGG部位による消化が阻害されているため、非メチル化CCGG配列と比較して、メチル化CCGG配列を含むDNA断片が濃縮されている。次に、結果として得られた試料を「NEBNext Ultra IIQ5マスターミックス」および「NEBNext Index Primer」を使用して区画バーコードでPCR増幅し、前述のようにAmpureXPビーズでクリーンアップした。結果として得られたバーコード化および増幅された試料は、V2 2x25塩基対MiSeqフローセル(Illumina)で定量、プール、および配列決定され、個々のバーコード化試料が合計約100万の配列リードを生成した。データはBowtie2(Galaxyクラウドベースのインフォマティクススイート内)でヒトの参照配列にマッピングされ、前述のようにSeqMonkゲノミクスソフトウェアでさらに分析された。
【1075】
バーコード化親和性プローブの合成
PMCA(血漿膜カルシウムATPaseタンパク質)に対するバーコード化親和性プローブを合成するために、2つの相補的オリゴヌクレオチド(Integrated DNA TechnologiesによるPolyT_5AM_3dT_1およびPolyT_5AM_3dT_COMPL1)を合成し、各々がNEBNextIndexプライマーの外側のフォワード配列およびリバース配列と内部の合成バーコード配列を含み、そして、それぞれが3’末端で逆dT塩基でブロックされ、PolyT_5AM_3dT_1は5’C12アミノ修飾因子(活性化および抗体へのコンジュゲーション用)を含む。オリゴヌクレオチドは、サーマルサイクラーでの遅いプライマーアニールサイクルを使用して互いにアニールされ、2.8X Ampure XPビーズでクリーンアップされ、H2Oに再懸濁された。次に、100マイクロリットルの42マイクロモルの精製アニールされたオリゴヌクレオチドを、ThunderLink PLUSオリゴコンジュゲーションシステム(Expedeon、カタログ番号425-0300)を使用して、ヒトPMCAタンパク質(ab2783、Abcam)に対する100マイクログラムの親和性精製モノクローナル抗体にコンジュゲートした。製造元の指示に従い、活性化オリゴ材料を活性化抗体材料に1:2の体積比でコンジュゲートさせ、PBSで1:400に希釈し、以下のようにPMCA測定用のバーコード化親和性プローブとして使用した。
PolyT_5AM_3dT_1:
/5AmMC12/TTCCCTACACGACGCTCTTGATCTCAGTTAGATACAACGTGACCTGAGCAGTCTTAGCGAGATCGGAAGAGCACACGTCTGAACT*C*/3InvdT/
PolyT_5AM_3dT_COMPL1:
G*A*GTTCAGACGTGTGCTCTTCCGATCTCGCTAAGACTGCTCAGGTCACGTTGTATCTAACTGAGATCGGAAGAGCGTCGTGTAGGGA*A*/3InvdT/
上記の配列では:
*=ホスホロチオエート結合
/5AmMC12/=C12リンカーを備えた5プライム末端アミノ修飾因子
/3InvdT/=3プライム末端逆dT塩基
【1076】
PMCAタンパク質測定のプロトコル
循環微粒子上のPMCAタンパク質レベルを測定するために、CD2陰性微粒子を上記のように単離し、次に20マイクロリットルのCD2陰性微粒子を、PMCAに対する1.0マイクロリットルの1:400希釈バーコード化親和性プローブとともに摂氏4度で30分間インキュベートした。次に、試料を3000xGで15分間、室温で遠心分離し、上清を吸引し(ペレットを乱さないように注意して)、ペレットを300マイクロリットルのPBSで洗浄し、次に再び3000xGで15分間室温で遠心分離した。上清を再び吸引し(ペレットを乱さないように再度注意して)、結果として得られた洗浄済みのバーコード化親和性プローブ結合微粒子試料を25マイクロリットルのPBSに再懸濁した。次に、結果として得られた微粒子試料を区画化し、上記のように低濃度溶液に分注し、次に個々のアリコートをバーコード化し、上記のようにNEBNext試料調製キットで配列決定するために調製した。次に、結果として得られた試料を「NEBNext Ultra IIQ5マスターミックス」および「NEBNext Index Primer」を使用して区画バーコードでPCR増幅し、前述のようにAmpureXPビーズでクリーンアップした。結果として得られたバーコード化および増幅された試料は、V2 2x25塩基対MiSeqフローセル(Illumina)で定量、プール、および配列決定され、個々のバーコード化試料が合計約100万の配列リードを生成した。データはBowtie 2(Galaxyクラウドベースのインフォマティクススイート内)でヒトの参照配列にマッピングされ、前述のようにSeqMonkゲノミクスソフトウェアでさらに分析された。PMCAバーコード化親和性プローブからの内部合成バーコード配列を含むリードは、バーコード化ライブラリごとに個別に検出、定量、分析された。
【1077】
図33では、図の上部に、循環微粒子の試料が生成され、ビーズの溶液とインキュベートされる実験方法の概略図が示されている。ここで、ビーズはCD2タンパク質(免疫細胞のサブセットの膜上およびそこから由来する微粒子上)に対する抗体にコンジュゲートされている。CD2陽性微粒子(すなわち、表面に高濃度のCD2タンパク質を有する微粒子)を抗CD2ビーズに結合させるプロセスの後に、磁石を使用して、ビーズおよびビーズに結合した微粒子を収集する(したがって、ビーズに含まれるCD2タンパク質の測定および選択を行う)。次に、上清(CD2陰性微粒子を含む)とビーズ結合画分(CD2陽性微粒子を含む)を希釈して区画に区画化し、各区画に含まれる核酸含有量(すなわち、ゲノムDNAの断片)を区画に関連付けられたバーコードに付加し、いくつかの区画にわたるバーコード化された核酸をプールして配列決定する。
【1078】
図の下部には、バーコード化オリゴヌクレオチドを付加する方法によって生成され、CD2陽性プール(左)とCD2陰性プールから取得された、2つの代表的な循環微粒子区画内のゲノムDNA断片の配列が示されている。各染色体にわたってタイリングされた2メガベース(Mb)のスライディングウィンドウ内のヒトゲノムにおける全ての染色体にわたる配列リードの密度が示される。様々であるが大きなサイズの明確な自己完結型のリードクラスターが観察され、循環微粒子からの標的ポリペプチド(この例ではCD2)の測定が、ゲノムDNAの多くの連結された断片の測定と組み合わされてこれらの実験方法によって達成可能であることを示している。
【1079】
図34では、図の上部に、循環微粒子の試料が生成され、ビーズの溶液とインキュベートされる実験方法の概略図が示されている。ここで、ビーズはCD2タンパク質(免疫細胞のサブセットの膜上およびそこから由来する微粒子上)に対する抗体にコンジュゲートされている。CD2陽性微粒子(すなわち、表面に高濃度のCD2タンパク質を有する微粒子)を抗CD2ビーズに結合させるプロセスの後に、磁石を使用して、ビーズおよびビーズに結合した微粒子を収集する(したがって、ビーズに含まれるCD2タンパク質の測定および選択を行う)。次に、上清(CD2陰性微粒子を含む)画分を希釈して区画に区画化し、各区画に含まれる核酸含有量(すなわちゲノムDNAの断片)を5-メチルシトシン感応性制限酵素(HpaII、非メチル化CCGGDNA部位で消化するが、シトシンメチル化によって阻害される)で消化し、CCGG部位で非メチル化されているゲノムDNAの断片を濃縮する(したがって、5-メチルシトシン修飾DNAの測定を行う)。結果として得られた未消化、非メチル化濃縮DNA断片は、区画に関連付けられたバーコードに付加され、いくつかの区画にまたがるバーコード化核酸がプールされ、配列決定される。
【1080】
図の左下には、バーコード化オリゴヌクレオチドを付加する方法によって生成され、HpaII消化による非メチル化DNA断片の枯渇後にCD2陰性プールから取得された、代表的な循環微粒子区画内のゲノムDNA断片の配列が示されている。各染色体にわたってタイリングされた2メガベース(Mb)のスライディングウィンドウ内のヒトゲノムにおける全ての染色体にわたる配列リードの密度が示される。右側は、4つのコントロール(未消化)ライブラリと4つのHpaII消化ライブラリ(メチル化CCGG DNAが濃縮されている)内のCCGG配列を含む配列リードのパーセンテージのプロットである。予想通り、消化されたライブラリは、ライブラリ内でCCGG配列の小さいが明確な枯渇を示す。これは、HpaII試料の非メチル化CCGG含有断片の分子枯渇に対応しており、この方法が循環微粒子からのポリペプチド、ゲノムDNAの断片、および修飾されたDNAヌクレオチドを累積的に測定できることを示している。
【1081】
図35では、図の上部に、循環微粒子の試料が生成され、ビーズの溶液とインキュベートされる実験方法の概略図が示されている。ここで、ビーズはCD2タンパク質(免疫細胞のサブセットの膜上およびそこから由来する微粒子上)に対する抗体にコンジュゲートされている。CD2陽性微粒子(すなわち、表面に高濃度のCD2タンパク質を有する微粒子)を抗CD2ビーズに結合させるプロセスの後に、磁石を使用して、ビーズおよびビーズに結合した微粒子を収集する(したがって、ビーズに含まれるCD2タンパク質の測定および選択を行う)。次に、上清(CD2陰性微粒子を含む)画分を、PMCA(原形質膜カルシウムATPase)タンパク質に対する抗体とバーコード化オリゴヌクレオチドを含むバーコード化親和性プローブの溶液とインキュベートする。次に、結果として得られたバーコード化親和性プローブに結合した微粒子を遠心分離ステップでペレット化し、PBSで洗浄して、未結合のバーコード化親和性プローブを除去する。結果として得られたバーコード化親和性プローブに結合した微粒子をPBSに再懸濁し、希釈して区画に区画化し、各区画に含まれる核酸含有量(すなわち、ゲノムDNAの断片とバーコード化親和性プローブの配列)を区画に関連付けられたバーコードに付加し、いくつかの区画にわたるバーコード化された核酸をプールして配列決定する。
【1082】
図の左下には、バーコード化オリゴヌクレオチドを付加する方法によって生成され、CD2陰性プールから取得され、バーコード化親和性プローブを使用したPMCAの測定を組み込んだ、代表的な循環微粒子区画内のゲノムDNA断片の配列が示されている。各染色体にわたってタイリングされた2メガベース(Mb)のスライディングウィンドウ内のヒトゲノムにおける全ての染色体にわたる配列リードの密度が示される。右側には、PMCAを標的としたバーコード化親和性プローブで標識した後の、4つのコントロール試料(バーコード化親和性プローブ標識なし)と2つの試料(循環微粒子区画)の各々における配列リードの数が示されている。コントロール試料では、バーコード化親和性プローブからの配列リードは見られないが、バーコード化親和性プローブからの大量の配列が陽性試料の各々で観察された。累積的に、これらの結果は、この方法が複数のポリペプチド(バーコード化親和性プローブの使用を含む)および循環微粒子からのゲノムDNAの断片を測定できることを示している。
【1083】
様々な刊行物が本明細書に引用されており、それらの開示は、その全体が参照により組み込まれる。
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記少なくとも2つのゲノムDNA断片のうちの少なくとも2つの各々の配列を分析することを含む、請求項1~6のいずれか1項に記載の方法。
前記ゲノムDNA断片の存在、不在、および/またはレベルに対応するシグナルを測定する前記ステップが、前記セット内の前記連結された断片のうちの少なくとも2つの各々の少なくとも一部を配列決定して、少なくとも2つの連結された配列リードを生成することを含む、請求項1~8のいずれか1項に記載の方法。
前記標的ポリペプチドの存在、不在、および/またはレベルに対応する前記シグナルが、(i)バーコード化親和性プローブであって、前記バーコード化親和性プローブがバーコード化オリゴヌクレオチドに連結された少なくとも1つの親和性部分を含み、前記バーコード化オリゴヌクレオチドが少なくとも1つのヌクレオチドを含み、前記親和性部分が前記標的ポリペプチドに結合することができる、バーコード化親和性プローブ、および/または(ii)光学的に標識された親和性プローブおよび/または蛍光標識された親和性プローブを使用して測定される、請求項1~15のいずれか1項に記載の方法。