特許第6435334号(P6435334)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アキュラジェン ホールディングス リミテッドの特許一覧

特許6435334稀な配列変異体を検出するための組成物および方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6435334
(24)【登録日】2018年11月16日
(45)【発行日】2018年12月5日
(54)【発明の名称】稀な配列変異体を検出するための組成物および方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20181126BHJP
   C12Q 1/6844 20180101ALI20181126BHJP
   C12N 15/09 20060101ALI20181126BHJP
【FI】
   C12Q1/6869 ZZNA
   C12Q1/6844 Z
   C12N15/09 Z
【請求項の数】23
【全頁数】124
(21)【出願番号】特願2016-539051(P2016-539051)
(86)(22)【出願日】2014年12月11日
(65)【公表番号】特表2017-510244(P2017-510244A)
(43)【公表日】2017年4月13日
(86)【国際出願番号】US2014069848
(87)【国際公開番号】WO2015089333
(87)【国際公開日】20150618
【審査請求日】2017年12月11日
(31)【優先権主張番号】61/987,414
(32)【優先日】2014年5月1日
(33)【優先権主張国】US
(31)【優先権主張番号】62/010,975
(32)【優先日】2014年6月11日
(33)【優先権主張国】US
(31)【優先権主張番号】61/914,907
(32)【優先日】2013年12月11日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】517444562
【氏名又は名称】アキュラジェン ホールディングス リミテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】リン, シェンロン
(72)【発明者】
【氏名】サン, ザオフイ
(72)【発明者】
【氏名】ザオ, グレース チージ
(72)【発明者】
【氏名】タン, ポール リン−ファン
【審査官】 池上 文緒
(56)【参考文献】
【文献】 特表2013−515149(JP,A)
【文献】 特表2012−517238(JP,A)
【文献】 特表2008−538496(JP,A)
【文献】 米国特許出願公開第2011/319299(US,A1)
【文献】 米国特許出願公開第2013/217023(US,A1)
【文献】 Proc. Natl. Acad. Sci. U.S.A (Nov 2013) vol.110, no.49, p.19872-19877
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12Q 1/6869
PubMed
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
WPIDS/WPIX(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
それぞれが5’末端および3’末端を有する複数のポリヌクレオチドを含む核酸試料における配列変異体を同定する方法であって、
(a)前記複数の個々のポリヌクレオチドを環状化して、それぞれが前記5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、
(b)(a)の前記環状ポリヌクレオチドを増幅するステップと、
(c)増幅されたポリヌクレオチドを配列決定して、複数の配列決定リードを生成するステップと、
(d)配列決定リードと参照配列の間の配列の差異を同定するステップと、
(e)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を前記配列変異体としてコールするステップと
を含む方法。
【請求項2】
前記複数のポリヌクレオチドが一本鎖である、請求項に記載の方法。
【請求項3】
環状化が、前記複数のポリヌクレオチドをライゲーション反応に供することによってなされる、請求項に記載の方法。
【請求項4】
個々の環状ポリヌクレオチドが、環状化されたポリヌクレオチドの中で独特である接合部を有する、請求項に記載の方法。
【請求項5】
前記配列変異体が、一塩基多型である、請求項に記載の方法。
【請求項6】
前記参照配列が、前記配列決定リードを互いとアラインすることによって形成されたコンセンサス配列である、請求項に記載の方法。
【請求項7】
環状化が、アダプターポリヌクレオチドを前記複数のポリヌクレオチド中のポリヌクレオチドの5’末端、3’末端、または5’末端と3’末端の両方と接合するステップを含む、請求項1に記載の方法。
【請求項8】
増幅が、鎖置換活性を有するポリメラーゼを使用することによってなされる、請求項1に記載の方法。
【請求項9】
増幅が、前記環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物に供することを含む、請求項1に記載の方法。
【請求項10】
前記増幅されたポリヌクレオチドを、富化を伴わずに前記配列決定ステップに供する、請求項に記載の方法。
【請求項11】
配列決定の前に、富化ステップを実施することによって、前記増幅されたポリヌクレオチドの中で1つまたは複数の標的ポリヌクレオチドを富化するステップをさらに含む、請求項に記載の方法。
【請求項12】
前記富化ステップが、増幅されたポリヌクレオチドを、基質に付着させた複数のプローブにハイブリダイズさせることを含む、請求項1に記載の方法。
【請求項13】
前記富化ステップが、
(a)前記増幅されたポリヌクレオチド;
(b)配列A’を含む第1のプライマーであって、前記標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;
(c)配列Bを含む第2のプライマーであって、前記標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに
(d)前記第1のプライマーおよび前記第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼ
を含む増幅反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を増幅することを含み、
前記標的配列の配列Aの5’末端と配列Bの3’末端の間の距離が75ntまたはそれ未満である、請求項1に記載の方法。
【請求項14】
前記試料が、対象由来の試料である、請求項に記載の方法。
【請求項15】
前記試料が、尿、便、血液、唾液、組織、または体液である、請求項14に記載の方法。
【請求項16】
前記試料が、腫瘍細胞を含む、請求項14に記載の方法。
【請求項17】
前記試料が、ホルマリン固定パラフィン包埋(FFPE)試料である、請求項14に記載の方法。
【請求項18】
前記配列変異体が、がんの種類または病期に関連する、請求項に記載の方法。
【請求項19】
前記複数のポリヌクレオチドが、無細胞ポリヌクレオチドを含む、請求項に記載の方法。
【請求項20】
前記無細胞ポリヌクレオチドが、循環腫瘍DNAを含む、請求項19に記載の方法。
【請求項21】
(a)の前記環状ポリヌクレオチドを増幅するステップが、複数のコンカテマーを形成する、請求項1に記載の方法。
【請求項22】
前記配列変異体が、約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約0.5%未満、または約0.1%未満の頻度で生じる稀な配列変異体である、請求項1に記載の方法。
【請求項23】
前記核酸試料が、50ng未満、45ng未満、40ng未満、35ng未満、30ng未満、25ng未満、20ng未満、15ng未満、10ng未満、5ng未満、4ng未満、3ng未満、2ng未満、または1ng未満のポリヌクレオチドを含む、請求項1に記載の方法。

【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2013年12月11日に出願された米国仮出願第61/914,907号;2014年5月1日に出願された米国仮出願第61/987,414号;および2014年6月11日に出願された米国仮出願第62/010,975号の利益を請求し、これらのすべては参照によって本明細書に組み込まれる。
【背景技術】
【0002】
複雑な集団内の配列変異の同定は、特に大規模並行核酸配列決定の出現に伴い活発に成長している分野である。しかし、大規模並行配列決定には、一般に使用される技法における固有の誤差頻度が集団内の実際の配列変異の多くの頻度よりも大きいという点で、著しい限定がある。例えば、標準のハイスループットな配列決定では、0.1〜1%の誤差率が報告されている。稀な配列変異体の検出は、変異体の頻度が低い場合、例えば誤差率でまたはそれ未満でなど、偽陽性率が高い。
【0003】
稀な配列変異体を検出することに関しては多くの理由がある。例えば、稀な特有の配列の検出を使用して、細菌分類群などの有害な環境汚染物質の存在を同定および区別することができる。細菌分類群を特徴付ける一般的なやり方は、rRNA配列などの高度に保存された配列の差異を同定することである。しかし、これを行うための、典型的な配列決定に基づく手法は、かねてから労力を要する手順に関する複雑な問題を示す、所与の試料中の非常に多くの異なるゲノムおよびメンバー間の相同性の程度に関する難題に面している。改善された手順には、種々の設定における汚染検出を増強する潜在性がある。例えば、人工衛星および他の宇宙船の構成要素を組み立てるために使用するクリーンルームを、どんな微生物群集が存在するかを理解すること、ならびに陸生微生物が他の惑星もしくはその試料に導入されることを予防するためのより良好な汚染除去および浄化技法を開発するため、または推定上の地球外微生物から生じたデータと汚染陸生微生物から生じたデータを区別するための方法体系を開発するために、本システムおよび方法を用いて調査することができる。食品モニタリングへの適用としては、食品加工工場における生産ラインの定期検査、屠殺場の調査、レストラン、病院、学校、矯正施設および他の施設のキッチンおよび食品貯蔵場所の食品媒介性病原体に関する検査が挙げられる。水の貯蔵および加工工場も同様にモニターすることができる。
【0004】
稀な変異体の検出は、病理学的突然変異の早期検出のためにも重要であり得る。例えば、臨床試料におけるがんに関連する点突然変異の検出により、化学療法中の微小残存病変の同定を改善すること、および再発患者における腫瘍細胞の出現を検出することができる。稀な点突然変異の検出は、環境の突然変異原への曝露を評価するため、内因性DNA修復をモニターするため、および高齢個体における体細胞突然変異の蓄積を研究するためにも重要である。さらに、稀な変異体を検出するための、より感度の高い方法により、出生前診断を増強することができ、母体の血液中に存在する胎児細胞を特徴付けることが可能になる。
【発明の概要】
【課題を解決するための手段】
【0005】
前述事項を考慮して、稀な配列変異体を検出する改善された方法が必要とされている。本開示の組成物および方法は、この必要性に対処するだけでなく、追加的な利点も提供する。特に、本開示の種々の態様は、稀なまたは低頻度の核酸配列変異体(時には突然変異と称される)の感度が高い検出を提供する。これは、正常な配列のバックグラウンドにおける少量の変異体配列を含有する可能性がある試料中の低頻度の核酸変異(置換、挿入および欠失を含む)の同定および解明、ならびに配列決定誤差のバックグラウンドにおける低頻度の変異の同定を含む。
【0006】
一態様では、本開示は、例えば核酸試料においてなど、配列変異体を同定する方法を提供する。一部の実施形態では、複数のポリヌクレオチドのそれぞれが5’末端および3’末端を有し、方法は、(a)前記複数の個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(b)(a)の環状ポリヌクレオチドを増幅するステップと、(c)増幅されたポリヌクレオチドを配列決定して、複数の配列決定リードを生成するステップと、(d)配列決定リードと参照配列の間の配列の差異を同定するステップと、(e)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコール(call)するステップとを含む。一部の実施形態では、方法は、配列決定リードと参照配列の間の配列の差異を同定するステップと、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするステップとを含み、(a)配列決定リードは、少なくとも2つの環状ポリヌクレオチドの増幅産物に対応し、(b)少なくとも2つの環状ポリヌクレオチドのそれぞれは、各々のポリヌクレオチドの5’末端と3’末端をライゲーションすることによって形成された異なる接合部を含む。
【0007】
複数のポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。一部の実施形態では、ポリヌクレオチドは一本鎖である。一部の実施形態では、環状化は、複数のポリヌクレオチドをライゲーション反応に供することによってなされる。一部の実施形態では、個々の環状ポリヌクレオチドは、環状化されたポリヌクレオチドの中で独特である接合部を有する。一部の実施形態では、配列変異体は、一塩基多型(SNP)である。一部の実施形態では、参照配列は、配列リードを互いとアラインすることによって形成されたコンセンサス配列である。一部の実施形態では、参照配列は、参照ゲノムまたはその一部などの既知の参照配列である。一部の実施形態では、環状化は、アダプターポリヌクレオチドを複数のポリヌクレオチド中のポリヌクレオチドの5’末端、3’末端、または5’末端と3’末端の両方と接合するステップを含む。一部の実施形態では、増幅は、例えばローリングサークル増幅(RCA)においてなど、鎖置換活性を有するポリメラーゼを使用することによってなされる。一部の実施形態では、増幅は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物に供することを含む。一部の実施形態では、増幅は、環状ポリヌクレオチドを、それぞれが異なる標的配列と配列相補性によって特異的にハイブリダイズする1つまたは複数のプライマーを含む増幅反応混合物に供することを含む。一部の実施形態では、コールするステップに基づいて微生物性汚染物質を同定する。
【0008】
増幅されたポリヌクレオチドは、配列決定の前に富化ステップを実施することによって増幅されたポリヌクレオチドの中で1つまたは複数の標的ポリヌクレオチドを富化することなどの富化を伴ってまたは伴わずに配列決定に供することができる。一部の実施形態では、富化ステップは、増幅されたポリヌクレオチドを基質に付着させた複数のプローブにハイブリダイズさせることを含む。一部の実施形態では、富化ステップは、(a)増幅されたポリヌクレオチド;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含む増幅反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を増幅することを含み、ここで、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。
【0009】
一態様では、本開示は、それぞれが5’末端および3’末端を有するポリヌクレオチド50ng未満を含む核酸試料において配列変異体を同定する方法を提供する。一部の実施形態では、方法は、(a)リガーゼを用いて前記試料中の個々のポリヌクレオチドを環状化して複数の環状ポリヌクレオチドを形成するステップと、(b)前記リガーゼを前記環状ポリヌクレオチドから分離したら、環状ポリヌクレオチドを増幅してコンカテマーを形成するステップと、(c)コンカテマーを配列決定して複数の配列決定リードを生成するステップと、(d)複数の配列決定リードと参照配列の間の配列の差異を同定するステップと、(e)前記50ng未満のポリヌクレオチドの核酸試料からの前記複数のリードにおいて0.05%またはそれ超の頻度で生じている配列の差異を配列変異体としてコールするステップとを含む。ポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。一部の実施形態では、ポリヌクレオチドは一本鎖である。一部の実施形態では、個々の環状ポリヌクレオチドは、環状化されたポリヌクレオチドの中で独特である接合部を有する。一部の実施形態では、配列変異体は、一塩基多型である。一部の実施形態では、参照配列は、配列決定リードを互いとアラインすることによって形成されたコンセンサス配列である。一部の実施形態では、参照配列は、参照ゲノムなどの既知の参照配列である。一部の実施形態では、増幅は、鎖置換活性を有するポリメラーゼを使用することによってなされる。一部の実施形態では、増幅は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物に供することを含む。一部の実施形態では、増幅は、環状ポリヌクレオチドを、それぞれが異なる標的配列と配列相補性によって特異的にハイブリダイズする1つまたは複数のプライマーを含む増幅反応混合物に供することを含む。
【0010】
一態様では、本開示は、反応混合物において標的配列の2つまたはそれ超のコピーを含む複数の異なるコンカテマーを増幅する方法であって、標的配列が、5’から3’の方向に配向された配列Aおよび配列Bを含む方法を提供する。一部の実施形態では、方法は、反応混合物を核酸増幅反応に供するステップを含み、反応混合物は、(a)複数のコンカテマーであって、前記複数の個々のコンカテマーが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む複数のコンカテマー;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。一部の実施形態では、第1のプライマーは、配列A’に対して5’側に配列Cを含み、第2のプライマーは、配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも複数のコンカテマーとハイブリダイズしない。一部の実施形態では、増幅は、第1の相および第2の相を含み、第1の相は、第1の温度におけるハイブリダイゼーションステップを含み、その間に、プライマー伸長の前に第1および第2のプライマーがコンカテマーとハイブリダイズし、第2の相は、第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップを含み、その間に、第1および第2のプライマーが、伸長した第1もしくは第2のプライマーまたはその相補体を含む増幅産物とハイブリダイズする。一部の実施形態では、第2の温度におけるハイブリダイゼーションおよびプライマー伸長を5サイクル行った後、反応混合物中の増幅されたポリヌクレオチドの少なくとも5%は、標的配列の2つまたはそれ超のコピーを含む。
【0011】
関連する態様では、本開示は、反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を含む複数の異なる環状ポリヌクレオチドを増幅する方法を提供する。一部の実施形態では、方法は、反応混合物を核酸増幅反応に供するステップを含み、反応混合物は、(a)複数の環状ポリヌクレオチドであって、前記複数の個々の環状ポリヌクレオチドが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む、複数の環状ポリヌクレオチド;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、配列Aおよび配列Bは内因性配列であり、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。一部の実施形態では、第1のプライマーは、配列A’に対して5’側に配列Cを含み、第2のプライマーは、配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも複数の環状ポリヌクレオチドとハイブリダイズしない。一部の実施形態では、増幅は、第1の相および第2の相を含み、第1の相は、第1の温度におけるハイブリダイゼーションステップを含み、その間に、プライマー伸長の前に第1および第2のプライマーが環状ポリヌクレオチドまたはその増幅産物とハイブリダイズし、第2の相は、第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップを含み、その間に、第1および第2のプライマーが、伸長した第1もしくは第2のプライマーまたはその相補体を含む増幅産物とハイブリダイズする。
【0012】
一態様では、本開示は、本開示の方法に従って方法を実施するための反応混合物を提供する。反応混合物は、種々の方法のいずれかに関して本明細書に記載されている種々の成分のうちの1つまたは複数を含んでよい。一部の実施形態では、反応混合物は、標的配列の2つまたはそれ超のコピーを含む複数の異なるコンカテマーを増幅するための混合物であり、ここで、標的配列は、5’から3’の方向に配向された配列Aおよび配列Bを含み、反応混合物は、(a)複数のコンカテマーであって、前記複数の個々のコンカテマーが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む複数のコンカテマー;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに;(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。一部の実施形態では、第1のプライマーは、配列A’に対して5’側に配列Cを含み、第2のプライマーは、配列Bに対して5’側に配列Dを含み、増幅反応の第1の増幅ステップの間、配列Cも配列Dも2つまたはそれ超のコンカテマーとハイブリダイズしない。
【0013】
一態様では、本開示は、例えば、本開示の種々の他の態様のいずれかにおいてなど、本明細書に記載の方法において有用であるまたはそれによって生成される組成物を提供する。一部の実施形態では、組成物は、一本鎖であり、リガーゼを実質的に含まない複数の環状化されたポリヌクレオチドを含む。一部の実施形態では、組成物は、10000またはそれ未満の標的ポリヌクレオチドの群に対応する複数のコンカテマーを含み、さらに、複数の個々のコンカテマーは、(a)配列反復の2つまたはそれ超のコピーを含み、前記コピーの全てが同じ標的ポリヌクレオチドに対応すること、および(b)前記組成物中の1つの個々のコンカテマーの配列反復の2つまたはそれ超のコピー間の接合部が別の個々のコンカテマーのものとは異なることを特徴とする。
【0014】
一態様では、本開示は、配列変異体を検出するためのシステムを提供する。一部の実施形態では、システムは、(a)試料に対する検出反応を実施するための使用者要求を受信するように構成されたコンピュータ;(b)使用者要求に応答して試料またはその一部に対する核酸増幅反応を実施する増幅システムであって、増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)環状ポリヌクレオチドを増幅するステップとを含む増幅システム;(c)増幅システムによって増幅されたポリヌクレオチドの配列決定リードを作成し、配列決定リードと参照配列の間の配列の差異を同定し、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするシークエンシングシステム;および(d)受信者に報告を送信する報告作成プログラムであって、報告が、配列変異体の検出の結果を含有する報告作成プログラムを含む。一部の実施形態では、受信者は使用者である。
【0015】
一態様では、本開示は、1つまたは複数のプロセッサにより実行されると、配列変異体を検出する方法を実行するコードを含むコンピュータ可読媒体を提供する。一部の実施形態では、実行される方法は、(a)試料に対する検出反応を実施するための顧客要求を受信するステップと、(b)顧客要求に応答して試料またはその一部に対する核酸増幅反応を実施するステップであって、増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)環状ポリヌクレオチドを増幅するステップとを含むステップと、(c)(i)増幅反応において増幅されたポリヌクレオチドの配列決定リードを作成するステップと、(ii)配列決定リードと参照配列の間の配列の差異を同定するステップと、(iii)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするステップとを含む配列決定解析を実施するステップと、(d)配列変異体の検出の結果を含有する報告を作成するステップとを含む。
【0016】
本明細書に開示されている種々の態様のいずれかの一部の実施形態では、方法、組成物、およびシステムは、例えば、患者試料の特徴付けおよび場合によって対象の状態の診断においてなど、治療に適用される。一部の実施形態では、試料は、尿、便、血液、唾液、組織、または体液などの対象由来の試料である。一部の実施形態では、試料は、対象由来の腫瘍組織の試料中のものなどの腫瘍細胞を含む。一部の実施形態では、試料は、ホルマリン固定パラフィン包埋(FFPE)試料である。一部の実施形態では、方法は、コールするステップに基づいて対象を診断するステップをさらに含む。一部の実施形態では、配列変異体は、原因遺伝子変異体である。一部の実施形態では、配列変異体は、がんの種類または病期に関連するものである。一部の実施形態では、複数のポリヌクレオチドは、無細胞DNAまたは循環腫瘍DNAなどの無細胞ポリヌクレオチドを含む。
本発明は、例えば、以下の項目を提供する。
(項目1)
それぞれが5’末端および3’末端を有する複数のポリヌクレオチドを含む核酸試料における配列変異体を同定する方法であって、
(a)前記複数の個々のポリヌクレオチドを環状化して、それぞれが前記5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、
(b)(a)の前記環状ポリヌクレオチドを増幅するステップと、
(c)増幅されたポリヌクレオチドを配列決定して、複数の配列決定リードを生成するステップと、
(d)配列決定リードと参照配列の間の配列の差異を同定するステップと、
(e)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を前記配列変異体としてコールするステップと
を含む方法。
(項目2)
配列変異体を同定する方法であって、配列決定リードと参照配列の間の配列の差異を同定するステップと、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を前記配列変異体としてコールするステップとを含み、
(a)前記配列決定リードが、前記少なくとも2つの環状ポリヌクレオチドの増幅産物に対応し、
(b)前記少なくとも2つの環状ポリヌクレオチドのそれぞれが、各々のポリヌクレオチドの5’末端と3’末端をライゲーションすることによって形成された異なる接合部を含む、
方法。
(項目3)
前記複数のポリヌクレオチドが一本鎖である、項目1または2に記載の方法。
(項目4)
環状化が、前記複数のポリヌクレオチドをライゲーション反応に供することによってなされる、項目1または2に記載の方法。
(項目5)
個々の環状ポリヌクレオチドが、環状化されたポリヌクレオチドの中で独特である接合部を有する、項目1または2に記載の方法。
(項目6)
前記配列変異体が、一塩基多型である、項目1または2に記載の方法。
(項目7)
前記参照配列が、前記配列決定リードを互いとアラインすることによって形成されたコンセンサス配列である、項目1または2に記載の方法。
(項目8)
前記参照配列が、既知の参照配列である、項目1または2に記載の方法。
(項目9)
環状化が、アダプターポリヌクレオチドを前記複数のポリヌクレオチド中のポリヌクレオチドの5’末端、3’末端、または5’末端と3’末端の両方と接合するステップを含む、項目1に記載の方法。
(項目10)
増幅が、鎖置換活性を有するポリメラーゼを使用することによってなされる、項目1に記載の方法。
(項目11)
増幅が、前記環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物に供することを含む、項目1に記載の方法。
(項目12)
増幅が、前記環状ポリヌクレオチドを、それぞれが異なる標的配列と配列相補性によって特異的にハイブリダイズする1つまたは複数のプライマーを含む増幅反応混合物に供することを含む、項目1に記載の方法。
(項目13)
前記増幅されたポリヌクレオチドを、富化を伴わずに前記配列決定ステップに供する、項目11または12に記載の方法。
(項目14)
配列決定の前に、富化ステップを実施することによって、前記増幅されたポリヌクレオチドの中で1つまたは複数の標的ポリヌクレオチドを富化するステップをさらに含む、項目11または12に記載の方法。
(項目15)
前記富化ステップが、増幅されたポリヌクレオチドを、基質に付着させた複数のプローブにハイブリダイズさせることを含む、項目14に記載の方法。
(項目16)
前記富化ステップが、
(a)前記増幅されたポリヌクレオチド;
(b)配列A’を含む第1のプライマーであって、前記標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;
(c)配列Bを含む第2のプライマーであって、前記標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに
(d)前記第1のプライマーおよび前記第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼ
を含む増幅反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を増幅することを含み、
前記標的配列の配列Aの5’末端と配列Bの3’末端の間の距離が75ntまたはそれ未満である、項目14に記載の方法。
(項目17)
前記コールするステップに基づいて微生物性汚染物質を同定する、項目1または2に記載の方法。
(項目18)
それぞれが5’末端および3’末端を有するポリヌクレオチド50ng未満を含む核酸試料において配列変異体を同定する方法であって、
(a)リガーゼを用いて前記試料中の個々のポリヌクレオチドを環状化して複数の環状ポリヌクレオチドを形成するステップと、
(b)前記リガーゼを前記環状ポリヌクレオチドから分離したら、前記環状ポリヌクレオチドを増幅してコンカテマーを形成するステップと、
(c)前記コンカテマーを配列決定して複数の配列決定リードを生成するステップと、
(d)複数の配列決定リードと参照配列の間の配列の差異を同定するステップと、
(e)前記50ng未満のポリヌクレオチドの核酸試料からの前記複数のリードにおいて0.05%またはそれ超の頻度で生じている配列の差異を前記配列変異体としてコールするステップと
を含む方法。
(項目19)
前記試料の前記ポリヌクレオチドが一本鎖である、項目18に記載の方法。
(項目20)
個々の環状ポリヌクレオチドが、環状化されたポリヌクレオチドの中で独特である接合部を有する、項目18に記載の方法。
(項目21)
前記配列変異体が、一塩基多型である、項目18に記載の方法。
(項目22)
前記参照配列が、前記配列決定リードを互いとアラインすることによって形成されたコンセンサス配列である、項目18に記載の方法。
(項目23)
前記参照配列が、既知の参照配列である、項目18に記載の方法。
(項目24)
増幅が、鎖置換活性を有するポリメラーゼを使用することによってなされる、項目18に記載の方法。
(項目25)
増幅が、前記環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物に供することを含む、項目18に記載の方法。
(項目26)
増幅が、前記環状ポリヌクレオチドを、それぞれが異なる標的配列と配列相補性によって特異的にハイブリダイズする1つまたは複数のプライマーを含む増幅反応混合物に供することを含む、項目18に記載の方法。
(項目27)
反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列の2つまたはそれ超のコピーを含む複数の異なるコンカテマーを増幅する方法であって、前記反応混合物を核酸増幅反応に供するステップを含み、前記反応混合物が、
(a)複数のコンカテマーであって、前記複数の個々のコンカテマーが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む、複数のコンカテマー;
(b)配列A’を含む第1のプライマーであって、前記標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;
(c)配列Bを含む第2のプライマーであって、前記標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに
(d)前記第1のプライマーおよび前記第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼ
を含み、
前記標的配列の配列Aの5’末端と配列Bの3’末端の間の距離が75ntまたはそれ未満である、方法。
(項目28)
反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を含む複数の異なる環状ポリヌクレオチドを増幅する方法であって、前記反応混合物を核酸増幅反応に供するステップを含み、前記反応混合物が、
(a)複数の環状ポリヌクレオチドであって、前記複数の個々の環状ポリヌクレオチドが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む、複数の環状ポリヌクレオチド;
(b)配列A’を含む第1のプライマーであって、前記標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;
(c)配列Bを含む第2のプライマーであって、前記標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに
(d)前記第1のプライマーおよび前記第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼ
を含み、
配列Aおよび配列Bが内因性配列であり、前記標的配列の配列Aの5’末端と配列Bの3’末端の間の距離が75ntまたはそれ未満である、方法。
(項目29)
前記第1のプライマーが配列A’に対して5’側に配列Cを含み、前記第2のプライマーが配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも前記複数のコンカテマーとハイブリダイズしない、項目27に記載の方法。
(項目30)
増幅が、第1の相および第2の相を含み、前記第1の相が、第1の温度におけるハイブリダイゼーションステップを含み、その間に、プライマー伸長の前に前記第1および第2のプライマーが前記コンカテマーとハイブリダイズし、前記第2の相が前記第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップを含み、その間に、前記第1および第2のプライマーが、伸長した第1もしくは第2のプライマーまたはその相補体を含む増幅産物とハイブリダイズする、項目29に記載の方法。
(項目31)
前記第2の温度におけるハイブリダイゼーションおよびプライマー伸長を5サイクル行った後、前記反応混合物中の増幅されたポリヌクレオチドの少なくとも5%が前記標的配列の2つまたはそれ超のコピーを含む、項目30に記載の方法。
(項目32)
前記第1のプライマーが配列A’に対して5’側に配列Cを含み、前記第2のプライマーが配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも前記複数の環状ポリヌクレオチドとハイブリダイズしない、項目28に記載の方法。
(項目33)
増幅が、第1の相および第2の相を含み、前記第1の相が、第1の温度におけるハイブリダイゼーションステップを含み、その間に、プライマー伸長の前に前記第1および第2のプライマーが前記環状ポリヌクレオチドまたはその増幅産物とハイブリダイズし、前記第2の相が、前記第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップを含み、その間に、前記第1および第2のプライマーが、伸長した第1もしくは第2のプライマーまたはその相補体を含む増幅産物とハイブリダイズする、項目32に記載の方法。
(項目34)
5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列の2つまたはそれ超のコピーを含む複数の異なるコンカテマーを増幅するための反応混合物であって、
(a)複数のコンカテマーであって、前記複数の個々のコンカテマーが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む、複数のコンカテマー;
(b)配列A’を含む第1のプライマーであって、前記標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;
(c)配列Bを含む第2のプライマーであって、前記標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに
(d)前記第1のプライマーおよび前記第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼ
を含み、
前記標的配列の配列Aの5’末端と配列Bの3’末端の間の距離が75ntまたはそれ未満である、反応混合物。
(項目35)
前記第1のプライマーが配列A’に対して5’側に配列Cを含み、前記第2のプライマーが配列Bに対して5’側に配列Dを含み、増幅反応の第1の増幅ステップの間、配列Cも配列Dも前記2つまたはそれ超のコンカテマーとハイブリダイズしない、項目34に記載の反応混合物。
(項目36)
一本鎖であり、リガーゼを実質的に含まない複数の環状化されたポリヌクレオチドを含む組成物。
(項目37)
複数のコンカテマーを含む組成物であって、前記複数のコンカテマーが、10000またはそれ未満の標的ポリヌクレオチドの群に対応し、さらに、前記複数の個々のコンカテマーが、
(a)配列反復の2つまたはそれ超のコピーを含み、前記コピーの全てが同じ標的ポリヌクレオチドに対応し、
(b)前記組成物における1つの個々のコンカテマーの前記配列反復の前記2つまたはそれ超のコピー間の接合部が別の個々のコンカテマーのものとは異なる
ことを特徴とする、組成物。
(項目38)
配列変異体を検出するためのシステムであって、
(a)試料に対する検出反応を実施するための使用者要求を受信するように構成されたコンピュータ;
(b)前記使用者要求に応答して前記試料またはその一部に対する核酸増幅反応を実施する増幅システムであって、前記増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)前記環状ポリヌクレオチドを増幅するステップとを含む増幅システム;
(c)前記増幅システムによって増幅されたポリヌクレオチドの配列決定リードを作成し、配列決定リードと参照配列の間の配列の差異を同定し、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を前記配列変異体としてコールするシークエンシングシステム;および
(d)受信者に報告を送信する報告作成プログラムであって、前記報告が、前記配列変異体の検出の結果を含有する報告作成プログラム
を含むシステム。
(項目39)
前記受信者が使用者である、項目38に記載のシステム。
(項目40)
1つまたは複数のプロセッサにより実行されると、配列変異体を検出する方法を実行するコードを含むコンピュータ可読媒体であって、該方法は、
(a)試料に対する検出反応を実施するための顧客要求を受信するステップと、
(b)前記顧客要求に応答して前記試料またはその一部に対する核酸増幅反応を実施するステップであって、前記増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)前記環状ポリヌクレオチドを増幅するステップとを含むステップと、
(c)(i)前記増幅反応において増幅されたポリヌクレオチドの配列決定リードを作成するステップと、(ii)配列決定リードと参照配列の間の配列の差異を同定するステップと、(iii)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を前記配列変異体としてコールするステップとを含む配列決定解析を実施するステップと、
(d)前記配列変異体の検出の結果を含有する報告を作成するステップと
を含む、コンピュータ可読媒体。
(項目41)
前記試料が、対象由来の試料である、項目1または2に記載の方法。
(項目42)
前記試料が、尿、便、血液、唾液、組織、または体液である、項目41に記載の方法。
(項目43)
前記試料が、腫瘍細胞を含む、項目41に記載の方法。
(項目44)
前記試料が、ホルマリン固定パラフィン包埋(FFPE)試料である、項目41に記載の方法。
(項目45)
前記コールするステップに基づいて前記対象を診断するステップをさらに含む、項目41に記載の方法。
(項目46)
前記配列変異体が原因遺伝子変異体である、項目1または2に記載の方法。
(項目47)
前記配列変異体が、がんの種類または病期に関連する、項目1または2に記載の方法。
(項目48)
前記複数のポリヌクレオチドが、無細胞ポリヌクレオチドを含む、項目1または2に記載の方法。
(項目49)
前記無細胞ポリヌクレオチドが、循環腫瘍DNAを含む、項目48に記載の方法。
(項目50)
前記試料の前記ポリヌクレオチドが、無細胞ポリヌクレオチドを含む、項目18に記載の方法。
(項目51)
前記配列変異体が原因遺伝子変異体である、項目18に記載の方法。
(項目52)
前記ポリヌクレオチドが無細胞DNAである、項目36に記載の組成物。
【0017】
参照による組み込み
本明細書において言及されている全ての刊行物、特許および特許出願は、個別の刊行物、特許、または特許出願が、具体的にかつ個々に参照により組み込まれることが示されたのと同じ程度に参照により本明細書に組み込まれる。
【0018】
本発明の新規の特徴は、添付の特許請求の範囲において詳細に記載されている。本発明の原理が利用されている例示的な実施形態が記載されている以下の詳細な説明および付属図面を参照することにより、本発明の特徴および利点がよりよく理解される。
【図面の簡単な説明】
【0019】
図1図1は、本開示による方法の一実施形態の概略図である。DNA鎖を環状化し、調査中の遺伝子に対応する標的特異的プライマーをポリメラーゼ、dNTP、緩衝液などと一緒に添加し、したがって、ローリングサークル増幅(RCA)が起こって鋳型DNA(例えば、「単量体」)のコンカテマー(例えば「多量体」)が形成される。コンカテマーを処理して対応する相補鎖を合成し、次いで、アダプターを付加して配列決定ライブラリーを作出する。この結果もたらされるライブラリーは、その後に標準の技術を使用して配列決定されるが、一般に、3つの種:稀な配列変異体(例えば、突然変異)を含有しないnDNA(「正常な」DNA);酵素的な配列決定誤差を含有するnDNA、および、増幅前に試料ポリヌクレオチド中に元から存在していた「本物の」または実際の配列変異体の多量体を含有するDNAを含有する。有効に稀な突然変異の多数のコピーが存在することにより、配列変異体の検出および同定が可能になる。
【0020】
図2図2は、図1と同様であるが、ポリヌクレオチドの環状化を容易にするためにアダプターを付加した戦略を示す図である。図2はまた、標的特異的プライマーの使用も示す。
【0021】
図3図3は、増幅にアダプタープライマーを使用すること以外は図2と同様の図である。
【0022】
図4図4は、環状化されたccDNAの形成に関連する3つの実施形態を示す図である。一番上は、一本鎖DNA(ssDNA)をアダプターの不在下で環状化するものであり、中央のスキームはアダプターの使用を示し、一番下のスキームは、2種のアダプターオリゴ(各末端に異なる配列をもたらす)を利用するものであり、両方のアダプターとハイブリダイズして2つの末端を近接させる副子オリゴをさらに含んでよい。
【0023】
図5図5は、ライゲーションのために一本鎖DNAの2つの末端を空間的に近接させるために「分子クランプ」を使用することによって特異的な標的を環状化するための実施形態を示す図である。
【0024】
図6図6Aおよび6Bは、核酸のブロッキング末端を使用してアダプターを付加するための2つのスキームを示す図である。
【0025】
図7図7A、7B、および7Cは、ローリングサークル増幅(RCA)反応を刺激するための3つの異なるやり方を示す図である。図7Aは、標的、例えば、目的の特定の標的遺伝子または標的配列に特異的なプライマーの使用を示す。これにより、一般に、標的配列のみが増幅される。図7Bは、全ゲノム増幅(WGA)を実施するためのランダムプライマーの使用を示し、これにより、一般に、全ての試料配列が増幅され、次いでそれをプロセシングの間にバイオインフォマティクスによって選別する。図7Cは、アダプターを使用する場合のアダプタープライマーの使用を示し、これは同様に、一般的な非標的特異的増幅をもたらすものである。
【0026】
図8図8は、ある実施形態による、両方の鎖が増幅される二本鎖DNAの環状化および増幅の例を示す。
【0027】
図9図9A、9B、9C、および9Dは、その後の配列決定のために相補鎖合成を実現するための種々のスキームを示す。図9Aは、標的鎖のランダムプライミングの使用、その後のライゲーションを示す。図9Bは、標的鎖のアダプタープライミングの使用、同様にその後のライゲーションを示す。図9Cは、「ループ」アダプターの使用を示し、ここで、アダプターは、相補的である配列の2つの切片を有し、したがって、これらは互いとハイブリダイズしてループ(例えば、ステムループ構造)を創出する。コンカテマーの末端とのライゲーションの際、ループの遊離末端は、相補鎖に対するプライマーとしての機能を果たす。図9Dは、第2の鎖合成を実現するための高分岐ランダムプライマーの使用を示す。
【0028】
図10図10は、標的配列の単量体内でアラインした場合に互いと離れる方に配向された(「背中合わせ」とも称され、例えば、2方向に配向されているが、増幅されるドメインの末端上にはない)プライマー対を使用した、標的核酸配列の少なくとも2つのコピーを含有する環状ポリヌクレオチドまたは鎖の配列決定を促進する実施形態によるPCR方法を示す図である。一部の実施形態では、これらのプライマーセットを、コンカテマーを形成してアンプリコンが標的配列のより高次の多量体、例えば、二量体、三量体などになるのを促進した後に使用する。場合によって、方法は、二量体よりも小さいアンプリコンを除去するためのサイズ選択をさらに含んでよい。
【0029】
図11図11は、背中合わせ(B2B)プライマーを「タッチアップ」PCRステップと共に使用し、したがって、短い産物(例えば、単量体など)の増幅が不利になる実施形態を示す。この場合、プライマーは、2つのドメイン;標的配列とハイブリダイズする第1のドメイン(灰色または黒い矢印)および元の標的配列とはハイブリダイズしない「ユニバーサルプライマー」結合性ドメイン(折り曲がった四角形;時にはアダプターとも称される)である第2のドメインを有する。一部の実施形態では、PCRの第1のラウンドを低温アニーリングステップで行い、したがって、遺伝子に特異的な配列が結合する。低温での実行により、短い産物を含めた種々の長さのPCR産物がもたらされる。少数のラウンド後、アニーリング温度を上昇させ、したがって、プライマー全体、両方のドメインのハイブリダイゼーションが有利になるようにし、示されている通り、これらは、鋳型の末端において見いだされ、一方で内部の結合は不安定になる。したがって、高温で両方のドメインを用いると、低温または単一ドメインのみの場合よりも短い産物が不利になる。
【0030】
図12図12Aおよび12Bは、配列決定ライブラリー構築の2つの異なる方法を示す図である。図12Aは、単一のステップでDNAを同時に断片化し、配列決定アダプターでタグ付けすることができるIllumina(登録商標)Nextera試料調製システムの例を説明する。図12Bでは、コンカテマーを超音波処理によって断片化し、その後、アダプターを両末端に添加し(例えば、KAPA Biosystemsのキットを使用することによって)、PCR増幅する。他の方法が利用可能である。
【0031】
図13図13A〜Cは、従来のPCRプライマー設計と比較した、背中合わせ(B2B)プライマーの設計の例示的な利点の図である。従来のPCRプライマー設計(左側)では、プライマー(矢印、AおよびB)は、突然変異のホットスポット(黒い星印)であり得る標的配列を挟む領域に配置され、また、一般には少なくとも60塩基対(bp)離れており、これにより、約100bpの典型的なフットプリントがもたらされる。この図において、B2Bプライマーの設計(右側)では、プライマーは標的配列の片側に配置される。2つのB2Bプライマーは逆方向を向いており、いずれかは重複してよい(例えば、約12bpもしくはそれ未満、約10bpもしくはそれ未満、約5bpもしくはそれ未満、またはそれ未満)。B2Bプライマーの長さに応じて、この図における全フットプリントは、28〜50bpであり得る。従来の設計では、フットプリントが大きいことに起因して、断片化事象によってプライマー結合が破壊される可能性がより高く、それにより、直鎖状断片であるか(13A)、環状化されたDNAであるか(13B)、または増幅産物であるか(13C)にかかわらず、配列情報が失われる。さらに、図13Cにおいて例示されているように、B2Bプライマーの設計では、異なるポリヌクレオチドを区別するために使用することができる接合部の配列(「天然バーコード」とも称される)が捕捉される。
【0032】
図14図14は、ある実施形態に従って配列変異体を検出するための鋳型を作製するための方法(例えば、本明細書では「Nebula」とも称される、環状化されたポリヌクレオチドを使用するプロセスの実行例)を説明する図である。DNAインプットを変性させてssDNAにし、ライゲーションによって環状化し、環状化されなかったDNAをエキソヌクレアーゼ消化によって分解する。ライゲーション効率を定量的PCR(qPCR)によって数量化し、インプットDNAと環状化されたDNAの量を比較し、一般には、少なくとも約80%のライゲーション効率がもたらされる。環状化されたDNAを精製して緩衝液を交換し、その後、ランダムプライマーおよびPhi29ポリメラーゼを用いた全ゲノム増幅(WGA)を行う。WGA産物を精製し、産物を断片化して(例えば、超音波処理によって)約400bpまたはそれ未満の短い断片にする。増幅されたDNAのオンターゲット率を、同じ量の参照ゲノムDNAと増幅されたDNAを比較するqPRCによって数量化し、一般には、約95%またはそれ超の平均オンターゲット率が示される。
【0033】
図15図15は、有尾B2Bプライマーを用いた増幅の別の実行、および高温でのPCRの「タッチアップ」第2相の実行を説明する図である。B2Bプライマーは、配列に特異的な領域(太い黒い線)およびアダプター配列(白い四角)を含有する。より低い、第1相アニーリング温度を用いると、標的特異的配列が鋳型とアニーリングして、最初の単量体がもたらされ、PCR産物は縦列反復を含有する(15A)。高温の第2の増幅相では、標的特異的配列とアダプター配列の両方のハイブリダイゼーションが、標的特異的配列が単独でハイブリダイズするよりも有利であり、これにより、短い産物が優先的に生成する程度が低下する(15B)。全プライマーに有利でなく、標的特異的配列との内部アニーリングにより、単量体の画分が急速に増加する(15C、左側)。
【0034】
図16図16は、変異体として計数される2つの異なるポリヌクレオチド(例えば、異なる接合部によって同定されたもの)に配列の差異が生じていることを要求して(下の線)、および要求せずに(上の線)、Q30フィルターを使用して標的配列決定方法によって検出されたバックグラウンドノイズ(変異体の頻度)間の比較を説明する図である。この検証フィルターの適用は、本明細書では、「Firefly」とも称される。ヒトゲノムDNA(12878、Coriell Institute)は100〜200bpに断片化され、公知のSNP(CYP2C19)を含有するゲノムDNAの2%スパイクイン(19240、Coriell Institute)を含んだ。真の変異体シグナル(顕著なピーク)は有意にはバックグラウンドを超えなかった(上、薄い灰色のプロット)。バックグラウンドノイズは検証フィルターを適用することによって約0.1まで減少した(下、黒のプロット)。
【0035】
図17図17は、ポリヌクレオチドの集団において種々の低頻度(2%、0.2%、および0.02%)でスパイクされ、それにもかかわらず、本開示の方法を適用すると有意にバックグラウンドを超えた配列変異体の検出を説明する図である。
【0036】
図18図18は、本開示のある実施形態のライゲーション効率およびオンターゲット率の解析結果を説明する図である。
【0037】
図19図19は、本開示のある実施形態による方法における対立遺伝子頻度の保存、および偏りが実質的に存在しないことを説明する図である。
【0038】
図20図20は、ある実施形態による、小さなインプット試料における配列変異体の検出の結果を説明する図である。
【0039】
図21図21は、標準の配列決定方法に従って、2つの異なるポリヌクレオチドにおいて配列の差異が生じていることを要求せずに得られた配列変異体の検出の結果における高バックグラウンドの例を説明する図である。
【0040】
図22図22は、ゲノムのGC含量分布と、本開示のある実施形態による方法(「Nebula−Firefly」;左側)に従って生じた配列決定結果のGC含量分布、代替配列決定ライブラリー構築キット(Rubicon、Rubicon Genomics;中央)を使用した配列決定結果のGC含量分布、および一般に、32ngであると文献において報告されている無細胞DNAのGC含量分布(cfDNA)(右側)の比較を説明するグラフである。
【0041】
図23図23は、ある実施形態による方法の配列決定リードから得たインプットDNAのサイズ分布を説明するグラフである。
【0042】
図24図24は、ある実施形態に従うランダムプライミング法による多数の標的にわたって均一な増幅を説明するグラフである。
【0043】
図25図25は、環状化の不在下で同定可能な接合部を有するポリヌクレオチド多量体の形成に関する実施形態を説明する図である。ポリヌクレオチド(例えば、ポリヌクレオチド断片、または無細胞DNAなど)を接合して、本開示の実施形態による独立したポリヌクレオチドを区別するのに有用な非天然接合部(本明細書では「自己タグ」とも称される)を有する多量体を形成する。図25Aでは、ポリヌクレオチドを、平滑末端ライゲーションによって互いと直接接合する。図25Bでは、ポリヌクレオチドを1つまたは複数の介在アダプターオリゴヌクレオチドを介して接合し、介在アダプターオリゴヌクレオチドは、バーコード配列をさらに含んでよい。次いで、多量体を、種々の方法のいずれかによる、例えば、ランダムプライマー(全ゲノム増幅)、アダプタープライマー、または1つもしくは複数の標的特異的プライマーもしくはプライマー対によるものなどの増幅に供する。複数の別々のポリヌクレオチドから同定可能な接合部を有する多量体を形成するためのプロセスは、本明細書では「Eclipse」とも称される。
【0044】
図26図26は、図25のプロセスにおける変異例を説明する図である。ポリヌクレオチド(例えば、cfDNA、または他のポリヌクレオチド断片)を末端修復し、A尾部付加し、アダプターライゲーションする(例えば、KAPA Biosystemsのキットなどの標準のキットを使用して)。内部ウラシル(U)で標識した担体DNAを補充して、総DNAインプットを所望のレベルまで(例えば、約20ngまたはそれ超まで)生じさせることができる。検出される配列変異体は「星印」によって示される。ライゲーションが完了したら、担体DNAは、ウラシルDNAグリコシラーゼ(UDG)とDNAグリコシラーゼ−リアーゼエンドヌクレアーゼVIIIの混合物であるウラシル特異的切除試薬(USER)酵素を添加することによって分解することができる。産物を精製して、担体DNAの断片を排除する。精製された産物を増幅する(例えば、PCRによって、アダプター配列を対象とするプライマーを使用して)。残留している担体DNAはいずれも、分解、および少なくとも一方の末端のアダプターからの分離に起因して、増幅される可能性が低い。増幅産物を精製して短いDNA断片を除去することができる。
【0045】
図27図27は、図25のプロセスにおける変異例を説明する図である。標的特異的増幅プライマーは、アダプターとして機能する共通の5’「尾部」(灰色の矢印)を含む。最初の増幅(例えば、PCRによる)は、数サイクル(例えば、少なくとも約5、10、またはそれ超のサイクル)にわたって進行する。PCR産物は、同様にプライマーとしての機能を果たし得、他のPCR産物とアニーリングして(例えば、第2の相においてアニーリング温度を低下させた場合)、同定可能な接合部を有するコンカテマーが生成する。第2の相は、いくつかのサイクル(例えば、5、10、15、20、またはそれ超のサイクル)を含んでよく、また、コンカテマーの形成および増幅に有利な条件の選択または変異を含んでよい。この概略図に従った方法は、「Relay Amp Seq」とも称され、区分された状況(例えば、液滴)において特定の使用を見いだすことができる。
【0046】
図28図28A〜Eは、ポリヌクレオチドを環状化するための方法の非限定的な例を説明する図である。図28Aでは、二本鎖ポリヌクレオチド(例えば、dsDNA)を変性させて一本鎖にし、その後、直接環状化(例えば、CircLigaseによる自己接合ライゲーション)を行う。図28Bでは、ポリヌクレオチド(例えば、DNA断片)を、ライゲーション効率を改善するために末端修復およびA尾部付加(3’末端へのアデノシンの一塩基伸長の付加)し、その後、変性させて一本鎖にし、環状化を行う。図28Cでは、ポリヌクレオチドを、末端修復およびA尾部付加し(二本鎖の場合)、チミジン(T)伸長を有するアダプターに接合し、変性させて一本鎖にし、環状化する。図28Dでは、ポリヌクレオチドを、末端修復およびA尾部付加し(二本鎖の場合)、両末端を、3つの要素(ライゲーションのためのT伸長、アダプター間の相補性、および3’尾部)を有するアダプターとライゲーションし、鎖を変性させ、一本鎖ポリヌクレオチドを環状化する(アダプター配列間の相補性によって容易になる)。図28Eでは、二本鎖ポリヌクレオチドを変性させて一本鎖の形態にし、ポリヌクレオチドの末端を近づけて接合を容易にする分子クランプの存在下で環状化する。
【0047】
図29図29は、特に、環状化されたポリヌクレオチドに関して、本開示の方法に従って配列変異体を同定するための増幅システムのワークフロー設計の例を説明する図である。
【0048】
図30図30は、特に、環状化ステップを伴わない直鎖状ポリヌクレオチドインプットに関して、本開示の方法に従って配列変異体を同定するための増幅システムのワークフロー設計の例を説明する図である。
【0049】
図31図31は、本開示の方法に従って配列変異体を同定するためのワークフローの例の概要図である。「Eclipse」(直鎖状ポリヌクレオチド解析)の枝に沿って、解析は、デジタルPCR(例えば、デジタルドロップレットPCR、ddPCR)、リアルタイムPCR、接合部の配列の解析(auto tag)を用いたプローブ捕捉による富化(capture seq)、挿入したアダプター配列(barcoded insertion)に基づく配列決定、またはRelay Amp配列決定を含み得る。「Nebula」(環状化されたポリヌクレオチド解析)に沿って、解析は、デジタルPCR(例えば、デジタルドロップレットPCR、ddPCR)、リアルタイムPCR、接合部の配列の解析(natural barcode)を用いたプローブ捕捉による富化(capture seq)、プローブ捕捉による富化または標的化増幅(例えば、B2B増幅)、および配列変異体を2つの異なるポリヌクレオチド(例えば、異なる接合部を有するポリヌクレオチド)において生じている差異として同定する検証ステップを伴う配列解析を含み得る。
【0050】
図32図32は、ある実施形態によるシステムの図である。
【0051】
図33図33は、ある例による、標的領域に沿った捕捉の効率およびカバレッジを説明する図である。標的とされる塩基の90%超が20×超カバーされ、標的とされる塩基の50%超が50×超のカバレッジを有する。
【発明を実施するための形態】
【0052】
本明細書に開示されている一部の実施形態の実施では、別段の指定のない限り、当技術分野の技術の範囲内に入る、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えDNAの従来の技法を使用する。例えば、SambrookおよびGreen、Molecular Cloning: A Laboratory Manual、第4版(2012年);the series Current Protocols in Molecular Biology(F. M. Ausubelら編);the series Methods In Enzymology(Academic Press, Inc.)、PCR 2: A Practical Approach(M.J. MacPherson、B.D. HamesおよびG.R. Taylor編(1995年))、HarlowおよびLane編(1988年)Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications、第6版(R.I. Freshney編(2010年))を参照されたい。
【0053】
「約」または「およそ」という用語は、当業者よって決定される、特定の値についての許容される誤差範囲内を意味し、これは、当該値をどのように測定または決定するか、すなわち、測定システムの限定に一部左右される。例えば、「約」とは、当技術分野の慣習に従って、1または1超の標準偏差以内を意味し得る。あるいは、「約」とは、所与の値の20%まで、10%まで、5%まで、または1%までの範囲を意味し得る。あるいは、特に、生物システムまたはプロセスに関して、この用語は、値の1桁分以内、好ましくは5倍以内、より好ましくは2倍以内を意味し得る。特定の値が本出願および特許請求の範囲に記載されている場合、別段に述べられていない限り、特定の値について許容される誤差範囲内を意味する「約」という用語を想定すべきである。
【0054】
「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」および「オリゴヌクレオチド」という用語は、互換的に使用される。これらの用語は、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかのヌクレオチドの任意の長さのポリマー形態、またはその類似体を指す。ポリヌクレオチドは、任意の3次元構造を有するものであってよく、また、既知または未知の任意の機能を果たすものであってよい。以下はポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコードまたは非コード領域、連鎖解析により定義された遺伝子座(複数または単数)、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、およびプライマー。ポリヌクレオチドは、メチル化されたヌクレオチドおよびヌクレオチド類似体などの1つまたは複数の修飾されたヌクレオチドを含んでよい。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーの集合の前、またはその後に与えられてよい。ヌクレオチドの配列には、非ヌクレオチド成分が割り込んでいてよい。ポリヌクレオチドは、重合後に、例えば、標識成分とのコンジュゲーションなどによってさらに修飾することができる。
【0055】
一般に、「標的ポリヌクレオチド」という用語は、その存在、量、および/もしくはヌクレオチド配列、またはこれらのうちの1つもしくは複数の変化を決定することが望まれる標的配列を有する核酸分子の出発集団内の核酸分子またはポリヌクレオチドを指す。一般に、「標的配列」という用語は、核酸の単一の鎖上の核酸配列を指す。標的配列は、遺伝子、調節配列、ゲノムDNA、cDNA、mRNA、miRNA、rRNAを含めたRNA、または他のものの一部であってよい。標的配列は、試料由来の標的配列または増幅反応の産物などの二次的な標的であってよい。
【0056】
一般に、「ヌクレオチドプローブ」、「プローブ」または「タグオリゴヌクレオチド」とは、ハイブリダイゼーション反応におけるその対応する標的ポリヌクレオチドを、対応する標的配列とのハイブリダイゼーションによって検出または同定するために使用されるポリヌクレオチドを指す。したがって、ヌクレオチドプローブは、1つまたは複数の標的ポリヌクレオチドとハイブリダイズ可能である。タグオリゴヌクレオチドは、試料中の1つまたは複数の標的ポリヌクレオチドと完全に相補的であってもよく、または、試料中の1つまたは複数の標的ポリヌクレオチド内の対応するヌクレオチドと相補的でない1つまたは複数のヌクレオチドを含有してもよい。
【0057】
「ハイブリダイゼーション」とは、1つまたは複数のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合によって安定化された複合体を形成する反応を指す。水素結合は、塩基相補性に応じて、ワトソン・クリック塩基対合によって、フーグスティーン結合によって、または任意の他の配列特異的な様式で生じるものであってよい。複合体は、二重鎖構造を形成する2つの鎖、多鎖複合体を形成する3つもしくはそれ超の鎖、単一の自己ハイブリダイズ鎖、またはこれらの任意の組合せを含んでよい。ハイブリダイゼーション反応は、PCRの開始、またはポリヌクレオチドのエンドヌクレアーゼによる酵素的切断など、より広範囲にわたるプロセスにおけるステップを構成するものであってよい。第1の配列と相補的である第2の配列は、第1の配列の「相補体」と称される。「ハイブリダイズ可能」という用語は、ポリヌクレオチドに適用される場合、ポリヌクレオチドがハイブリダイゼーション反応においてヌクレオチド残基の塩基間の水素結合によって安定化された複合体を形成する能力を指す。
【0058】
「相補性」とは、核酸が従来のワトソン・クリックまたは他の従来のものでない型のいずれかによって別の核酸配列と水素結合(複数可)を形成する能力を指す。パーセント相補性は、第2の核酸配列と水素結合(例えば、ワトソン・クリック塩基対合)を形成することができる核酸分子内の残基の百分率を示す(例えば、10のうち5、6、7、8、9、10はそれぞれ50%、60%、70%、80%、90%、および100%相補的である)。「完全に相補的」とは、核酸配列の連続した残基の全てが、第2の核酸配列内の同じ数の連続した残基と水素結合することを意味する。「実質的に相補的」とは、本明細書で使用される場合、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれ超のヌクレオチドの領域にわたって少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%である相補性の程度を指す、または、ストリンジェントな条件下でハイブリダイズする2つの核酸を指す。配列同一性は、例えばパーセント相補性を評価する目的などで、これらに限定されないが、Needleman−Wunschアルゴリズム(例えば、www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.htmlにおいて入手可能なEMBOSS Needle alignerを参照されたい、場合によって初期設定で)、BLASTアルゴリズム(例えば、blast.ncbi.nlm.nih.gov/Blast.cgiにおいて入手可能なBLAST alignment toolを参照されたい、場合によって初期設定で)、またはSmith−Watermanアルゴリズム(例えば、www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.htmlにおいて入手可能なEMBOSS Water alignerを参照されたい、場合によって初期設定で)を含めた任意の適切なアラインメントアルゴリズムによって測定することができる。最適なアラインメントは、初期パラメータを含めた、選択したアルゴリズムの任意の適切なパラメータを使用して評価することができる。
【0059】
一般に、ハイブリダイゼーションについての「ストリンジェントな条件」とは、標的配列に対する相補性を有する核酸が主に標的配列とハイブリダイズし、非標的配列とは実質的にハイブリダイズしない条件を指す。ストリンジェントな条件は、一般に、配列依存性であり、いくつかの因子に応じて変動する。一般に、配列が長いほど、その標的配列と配列特異的にハイブリダイズする温度が高くなる。ストリンジェントな条件の非限定的な例は、Tijssen(1993年)、Laboratory Technniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I、Second Chapter 「Overview of principles of hybridization and the strategy of nucleic acid probe assay」、Elsevier、N.Yに詳しく記載されている。
【0060】
一態様では、本開示は、例えば核酸試料においてなど、配列変異体を同定する方法を提供する。一部の実施形態では、複数のポリヌクレオチドのそれぞれが5’末端および3’末端を有し、方法は、(a)前記複数の個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(b)(a)の環状ポリヌクレオチドを増幅するステップと、(c)増幅されたポリヌクレオチドを配列決定して、複数の配列決定リードを生成するステップと、(d)配列決定リードと参照配列の間の配列の差異を同定するステップと、(e)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするステップとを含む。一部の実施形態では、方法は、配列決定リードと参照配列の間の配列の差異を同定するステップと、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするステップとを含み、(a)配列決定リードは、少なくとも2つの環状ポリヌクレオチドの増幅産物に対応し、(b)少なくとも2つの環状ポリヌクレオチドのそれぞれは、各々のポリヌクレオチドの5’末端と3’末端をライゲーションすることによって形成された異なる接合部を含む。
【0061】
一般に、「配列変異体」という用語は、1つまたは複数の参照配列と相対的な配列内の任意の変異を指す。一般には、配列変異体は、参照配列が既知である個体の所与の集団についての参照配列よりも低い頻度で生じている。例えば、特定の細菌属は16S rRNA遺伝子に関してコンセンサス参照配列を有し得るが、その属内の個々の種は、細菌の集団内の種を同定するのに有用である遺伝子(またはその一部)内の1つまたは複数の配列変異体を有し得る。別の例として、同じ種の多数の個体に関する配列(または同じ個体に関する多数の配列決定リード)から、最適にアラインした場合にコンセンサス配列が生じ得、そのコンセンサスに対する配列変異体を使用して、危険な汚染を示す、集団内の突然変異体を同定することができる。一般に、「コンセンサス配列」とは、一連の関連する核酸が、種々の配列アラインメントアルゴリズムのいずれかに応じて最適な配列アラインメントなどの集中的な数学的および/または配列解析に供された場合に、配列内の各位置における塩基の最も一般的な選択を反映するヌクレオチド配列を指す。種々のアラインメントアルゴリズムが利用可能であり、そのいくつかは本明細書に記載されている。一部の実施形態では、参照配列は、単一の個体のゲノム配列などの単一の既知の参照配列である。一部の実施形態では、参照配列は、参照集団としての機能を果たす多数の個体のゲノム配列、または同じ個体からのポリヌクレオチドの多数の配列決定リードなどの多数の既知の配列をアラインすることによって形成されるコンセンサス配列である。一部の実施形態では、参照配列は、解析中の試料からの配列を最適にアラインすることによって形成されるコンセンサス配列であり、したがって、配列変異体は、同じ試料中の対応する配列に相対的な変異を表す。一部の実施形態では、配列変異体は、集団内に低頻度で生じている(「稀な」配列変異体とも称される)。例えば、配列変異体は、約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.75%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.075%もしくはそれ未満、約0.05%もしくはそれ未満、約0.04%もしくはそれ未満、約0.03%もしくはそれ未満、約0.02%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、またはそれ未満の頻度で生じ得る。一部の実施形態では、配列変異体は、約0.1%またはそれ未満の頻度で生じている。
【0062】
配列変異体は、参照配列に対する任意の変異であってよい。配列変異は、単一ヌクレオチド、または複数のヌクレオチド(例えば、2、3、4、5、6、7、8、9、10、またはそれ超のヌクレオチド)の変化、挿入、または欠失からなってよい。配列変異体が2つまたはそれ超のヌクレオチドの差異を含む場合、異なるヌクレオチドは、互いと連続していてもよく、連続していなくてもよい。配列変異体の型の非限定的な例としては、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数変異体(CNV)、短い縦列反復(STR)、単純配列反復(SSR)、可変数縦列反復(VNTR)、増幅断片長多型(AFLP)、レトロトランスポゾンに基づく挿入多型、配列特異的増幅多型、および配列変異体として検出することができるエピジェネティックマークの差異(例えば、メチル化の差異)が挙げられる。
【0063】
本明細書に記載の方法に供することができる核酸試料は、任意の適切な供給源に由来し得る。一部の実施形態では、使用する試料は環境試料である。環境試料は、任意の環境供給源、例えば、自然もしくは人工雰囲気、水系、土壌、または任意の他の目的の試料に由来するものであってよい。一部の実施形態では、環境試料は、例えば、大気病原体収集システム、表面下沈渣、地下水、地中深くの古代の水、草地の植物の根−土壌界面、沿岸水および下水処理場から得ることができる。
【0064】
試料由来のポリヌクレオチドは、これらに限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、またはこれらの任意の2つもしくはそれ超の組合せを含めた種々のポリヌクレオチドのいずれであってもよい。一部の実施形態では、試料は、DNAを含む。一部の実施形態では、試料は、ゲノムDNAを含む。一部の実施形態では、試料は、ミトコンドリアDNA、葉緑体DNA、プラスミドDNA、細菌人工染色体、酵母の人工染色体、オリゴヌクレオチドタグ、またはこれらの組合せを含む。一部の実施形態では、試料は、例えば、これらに限定されないが、ポリメラーゼ連鎖反応(PCR)、逆転写、およびこれらの組合せを含めた、プライマーおよびDNAポリメラーゼの任意の適切な組合せを使用したプライマー伸長反応などの増幅によって作製されたDNAを含む。プライマー伸長反応の鋳型がRNAである場合、逆転写の産物は、相補DNA(cDNA)と称される。プライマー伸長反応において有用なプライマーは、1つまたは複数の標的、ランダムな配列、部分的にランダムな配列、およびこれらの組合せに特異的な配列を含んでよい。一般に、試料ポリヌクレオチドは、試料中に存在する任意のポリヌクレオチドを含み、これは、標的ポリヌクレオチドを含む場合もあり含まない場合もある。ポリヌクレオチドは、一本鎖、二本鎖、またはこれらの組合せであってよい。一部の実施形態では、本開示の方法に供するポリヌクレオチドは、一本鎖ポリヌクレオチドであり、これは、二本鎖ポリヌクレオチドの存在下である場合もあり存在下でない場合もある。一部の実施形態では、ポリヌクレオチドは一本鎖DNAである。一本鎖DNA(ssDNA)は、一本鎖の形態で単離されるssDNAであってもよく、または二本鎖の形態で単離され、その後、本開示の方法における1つまたは複数のステップのために一本鎖にされるDNAであってもよい。
【0065】
一部の実施形態では、ポリヌクレオチドを、抽出ステップを伴わずに、かつ/または精製ステップを伴わずに、その後のステップ(例えば、環状化および増幅)に供する。例えば、流体試料を、抽出ステップを伴わずに処理して細胞を除去して精製された液体試料および細胞試料を生じさせ、その後、精製された流体試料からDNAを単離することができる。沈殿または基質への非特異的な結合、その後、基質を洗浄して結合したポリヌクレオチドを放出させることによるものなど、ポリヌクレオチドを単離するための種々の手順が利用可能である。ポリヌクレオチドを、細胞抽出ステップを伴わずに試料から単離する場合、ポリヌクレオチドは大部分が細胞外または「無細胞」ポリヌクレオチドになり、これは、死細胞または損傷を受けた細胞に対応する可能性がある。そのような細胞の同一性を使用して、それらが由来する細胞もしくは細胞の集団、例えば、腫瘍細胞(例えば、がんの検出において)、胎児細胞(例えば、出生前診断において)、移植された組織由来の細胞(例えば、移植不全の早期検出において)など、または微生物の群集のメンバーを特徴付けることができる。
【0066】
試料を、例えば試料中の細胞からポリヌクレオチドを抽出するために処理する場合、種々の抽出方法が利用可能である。例えば、核酸は、フェノール、フェノール/クロロホルム/イソアミルアルコール、またはTRIzolおよびTriReagentを含めた同様の製剤を用いた有機抽出によって精製することができる。抽出技法の他の非限定的な例としては、以下が挙げられる。(1)例えば、自動核酸抽出器、例えば、Applied Biosystems(Foster City、Calif.)から入手可能なModel 341 DNA Extractorを使用するまたは使用しない、フェノール/クロロホルム有機試薬を使用した有機抽出、その後エタノール沈殿(Ausubelら、1993年);(2)固定相吸着方法(米国特許第5,234,809号;Walshら、1991年);および(3)塩誘導性核酸沈殿方法(Millerら、(1988年)、そのような沈殿方法は一般には「塩析」方法と称される。核酸の単離および/または精製の別の例としては、核酸を特異的にまたは非特異的に結合させることができる磁気粒子を使用し、その後、磁石を使用してビーズを単離し、洗浄し、ビーズから核酸を溶出することが挙げられる(例えば、米国特許第5,705,628号を参照されたい)。一部の実施形態では、上記の単離方法の前に、望ましくないタンパク質の試料からの排除を補助するために、酵素消化ステップ、例えば、プロテイナーゼK、または他の同様のプロテアーゼを用いた消化を行うことができる。例えば、米国特許第7,001,724号を参照されたい。所望であれば、RNA分解酵素阻害剤を溶解緩衝液に添加することができる。ある特定の細胞または試料の種類については、タンパク質の変性/消化ステップをプロトコールに加えることが望ましいことがある。精製方法は、DNA、RNA、またはその両方の分離を対象とし得る。抽出手順の間またはその後にDNAとRNAの両方を一緒に単離する場合、一方または両方を他から別々に精製するために、さらなるステップを使用することができる。抽出された核酸の細分画も、例えば、サイズ、配列、または他の物理的もしくは化学的特性による精製により作製することができる。最初の核酸の単離ステップに加えて、核酸の精製を、例えば過剰なまたは望ましくない試薬、反応物、または産物を除去するためになど、開示されている方法における任意のステップの後に実施することができる。試料中の核酸の量および/または純度を決定するための種々の方法、例えば吸光度(例えば、260nm、280nmにおける光の吸光度、およびこれらの比)によるもの、および標識(例えば、蛍光色素および挿入剤、例えば、SYBRグリーン、SYBRブルー、DAPI、ヨウ化プロピジウム(propidium iodine)、Hoechst染色、SYBRゴールド、臭化エチジウムなど)の検出によるものなどが利用可能である。
【0067】
所望であれば、試料由来のポリヌクレオチドを、さらなる処理の前に断片化することができる。断片化は、化学的、酵素的、および機械的断片化を含めた種々の方法のいずれによっても実現することができる。一部の実施形態では、断片の長さの平均または中央値は、10〜800、10〜500、50〜500、90〜200、または50〜150ヌクレオチドなどの約10〜約1,000ヌクレオチドの長さである。一部の実施形態では、断片の長さの平均または中央値は、約100もしくはそれ未満、約200もしくはそれ未満、約300もしくはそれ未満、約500もしくはそれ未満、約600もしくはそれ未満、約800もしくはそれ未満、約1000もしくはそれ未満、または約1500ヌクレオチドもしくはそれ未満である。一部の実施形態では、断片は、約90〜200ヌクレオチドにわたり、かつ/または、平均長が約150ヌクレオチドである。一部の実施形態では、断片化は、試料ポリヌクレオチドを超音波処理に供することを含んで機械的に実現される。一部の実施形態では、断片化は、試料ポリヌクレオチドを、1種または複数種の酵素を用い、1種または複数種の酵素が二本鎖核酸切断を発生させるのに適した条件下で処理することを含む。ポリヌクレオチド断片の作製に有用な酵素の例としては、配列特異的および非配列特異的ヌクレアーゼが挙げられる。ヌクレアーゼの非限定的な例としては、DNaseI、Fragmentase、制限エンドヌクレアーゼ、その変異体、およびこれらの組合せが挙げられる。例えば、DNaseIを用いた消化により、Mg++の不在下およびMn++の存在下でDNAのランダム二本鎖切断を誘導することができる。一部の実施形態では、断片化は、試料ポリヌクレオチドを、1種または複数種の制限エンドヌクレアーゼを用いて処理することを含む。断片化により、5’突出部、3’突出部、平滑末端、またはこれらの組合せを有する断片を生成することができる。断片化が1種または複数種の制限エンドヌクレアーゼの使用を含む場合などの一部の実施形態では、試料ポリヌクレオチドの切断により、予測可能な配列を有する突出部が残る。断片化されたポリヌクレオチドを、カラム精製またはアガロースゲルからの単離などの標準の方法によって断片をサイズ選択するステップに供することができる。
【0068】
一部の実施形態によると、試料由来の複数のポリヌクレオチド中のポリヌクレオチドを環状化する。環状化は、ポリヌクレオチドの5’末端を、同じポリヌクレオチドの3’末端と、試料中の別のポリヌクレオチドの3’末端と、または異なる供給源からのポリヌクレオチド(例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド)の3’末端と接合することを含んでよい。一部の実施形態では、ポリヌクレオチドの5’末端を同じポリヌクレオチドの3’末端と接合する(「自己接合」とも称される)。一部の実施形態では、環状化反応の条件を、特定の平均長の環状化されたポリヌクレオチドの集団を生成するために、特定の範囲内の長さのポリヌクレオチドの自己接合が有利になるように選択する。例えば、環状化反応条件は、約5000、2500、1000、750、500、400、300、200、150、100、50、またはそれ未満のヌクレオチドの長さよりも短いポリヌクレオチドの自己接合が有利になるように選択することができる。一部の実施形態では、長さが50〜5000ヌクレオチド、100〜2500ヌクレオチド、または150〜500ヌクレオチドの断片が有利であり、したがって、環状化されたポリヌクレオチドの平均長はそれぞれの範囲に入る。一部の実施形態では、環状化された断片の80%またはそれ超は50〜500ヌクレオチドの長さ、例えば、50〜200ヌクレオチドの長さである。最適化することができる反応条件としては、接合反応に充てる時間の長さ、種々の試薬の濃度、および接合するポリヌクレオチドの濃度が挙げられる。一部の実施形態では、環状化反応では、環状化の前に試料中に存在する断片の長さの分布が保存される。例えば、環状化前のポリヌクレオチドと環状化されたポリヌクレオチドの試料中の断片の長さの平均、中央値、最頻値、および標準偏差のうちの1つまたは複数は、互いの75%、80%、85%、90%、95%、またはそれ超以内である。
【0069】
自己接合環状化産物を優先的に形成するのではなく、1つまたは複数のアダプターオリゴヌクレオチドを使用し、したがって、試料中のポリヌクレオチドの5’末端および3’末端が1つまたは複数の介在アダプターオリゴヌクレオチドによって接合して環状ポリヌクレオチドを形成する。例えば、ポリヌクレオチドの5’末端をアダプターの3’末端と接合することができ、同じアダプターの5’末端を同じポリヌクレオチドの3’末端と接合することができる。アダプターオリゴヌクレオチドは、試料ポリヌクレオチドと接合することができる、少なくとも一部分が既知である配列を有する任意のオリゴヌクレオチドを含む。アダプターオリゴヌクレオチドは、DNA、RNA、ヌクレオチド類似体、非標準ヌクレオチド、標識されたヌクレオチド、修飾されたヌクレオチド、またはこれらの組合せを含んでよい。アダプターオリゴヌクレオチドは、一本鎖、二本鎖、または部分的二重鎖であってよい。一般に、部分的二重鎖アダプターは、1つまたは複数の一本鎖領域と1つまたは複数の二本鎖領域とを含む。二本鎖アダプターは、互いとハイブリダイズした2つの別々のオリゴヌクレオチドを含んでよく(「オリゴヌクレオチド二重鎖」とも称される)、ハイブリダイゼーションにより、ミスマッチおよび/または対応のないヌクレオチドによって生じる1つもしくは複数の平滑末端、1つもしくは複数の3’突出部、1つもしくは複数の5’突出部、1つもしくは複数のバルジ、またはこれらの任意の組合せが残り得る。アダプターの2つのハイブリダイズした領域がハイブリダイズしていない領域によって互いと分離されている場合、「バブル」構造がもたらされる。配列が異なるアダプターなどの、異なる種類のアダプターを組み合わせて使用することができる。異なるアダプターは、逐次的な反応でまたは同時に試料ポリヌクレオチドと接合することができる。一部の実施形態では、標的ポリヌクレオチドの両末端に同一のアダプターを付加する。例えば、第1および第2のアダプターを同じ反応に付加することができる。アダプターは、試料ポリヌクレオチドと組み合わせる前に操作することができる。例えば、末端リン酸を付加または除去することができる。
【0070】
アダプターオリゴヌクレオチドを使用する場合、アダプターオリゴヌクレオチドは、これらに限定されないが、1つもしくは複数の増幅プライマーアニーリング配列またはその相補体、1つもしくは複数の配列決定プライマーアニーリング配列またはその相補体、1つまたは複数のバーコード配列、多数の異なるアダプターまたは異なるアダプターのサブセットの間で共有される1つまたは複数の共通配列、1つまたは複数の制限酵素認識部位、1つまたは複数の標的ポリヌクレオチド突出部と相補的な1つまたは複数の突出部、1つまたは複数のプローブ結合部位(例えば、配列決定プラットフォーム、例えば、大規模並列配列決定用のフローセルなど、例えば、Illumina,Inc.により開発されたフローセルなどに付着させるため)、1つもしくは複数のランダムなまたはほぼランダムな配列(例えば、1つまたは複数の位置において2つまたはそれ超の異なるヌクレオチドのセットからランダムに選択された1つまたは複数のヌクレオチドであり、1つまたは複数の位置において選択された異なるヌクレオチドのそれぞれが、ランダムな配列を含むアダプターのプールで表される)、およびこれらの組合せを含めた、種々の配列エレメントのうちの1つまたは複数を含有してよい。いくつかの場合には、アダプターを使用して、例えば、正確なアダプターを用い、閉じた環とのハイブリダイゼーションによって閉じた環を「捕捉」することができる、アダプターに対する相補配列を含むオリゴヌクレオチドでコーティングしたビーズ(特に、取扱いの容易さに関して磁気ビーズ)を使用することによってアダプターを含有する環を精製し、アダプターを含有しない環およびあらゆるライゲーションしていない成分を洗い流し、次いで、捕捉された環をビーズから放出させることができる。さらに、いくつかの場合には、ハイブリダイズした捕捉プローブと標的環の複合体を直接使用して、例えば、直接ローリングサークル増幅(RCA)などによって、コンカテマーを作製することができる。一部の実施形態では、環内のアダプターを配列決定プライマーとして使用することもできる。2つまたはそれ超の配列エレメントは、互いと隣接していなくてもよく(例えば、1つまたは複数のヌクレオチドによって分離されている)、互いと隣接していてもよく、部分的に重複していてもよく、完全に重複していてもよい。例えば、増幅プライマーアニーリング配列は、配列決定プライマーアニーリング配列としての機能も果たし得る。配列エレメントは、3’末端またはその付近、5’末端またはその付近に位置していてもよく、アダプターオリゴヌクレオチドの内部に位置していてもよい。配列エレメントは、約3もしくはそれ未満、約4もしくはそれ未満、約5もしくはそれ未満、約6もしくはそれ未満、約7もしくはそれ未満、約8もしくはそれ未満、約9もしくはそれ未満、約10もしくはそれ未満、約15もしくはそれ未満、約20もしくはそれ未満、約25もしくはそれ未満、約30もしくはそれ未満、約35もしくはそれ未満、約40もしくはそれ未満、約45もしくはそれ未満、約50もしくはそれ未満またはそれ超のヌクレオチドの長さなどの任意の適切な長さであってよい。アダプターオリゴヌクレオチドは、少なくとも、それらが含まれる1つまたは複数の配列エレメントに適応させるのに十分な任意の適切な長さであってよい。一部の実施形態では、アダプターは、約10もしくはそれ未満、約15もしくはそれ未満、約20もしくはそれ未満、約25もしくはそれ未満、約30もしくはそれ未満、約35もしくはそれ未満、約40もしくはそれ未満、約45もしくはそれ未満、約50もしくはそれ未満、約55もしくはそれ未満、約60もしくはそれ未満、約65もしくはそれ未満、約70もしくはそれ未満、約75もしくはそれ未満、約80もしくはそれ未満、約90もしくはそれ未満、約100もしくはそれ未満、約200もしくはそれ未満、またはそれ超のヌクレオチドの長さである。一部の実施形態では、アダプターオリゴヌクレオチドは、約12〜40ヌクレオチドの長さの範囲、例えば、約15〜35ヌクレオチドの長さなどである。
【0071】
一部の実施形態では、1つの試料由来の断片化されたポリヌクレオチドと接合するアダプターオリゴヌクレオチドは、全てのアダプターオリゴヌクレオチドに共通する1つまたは複数の配列と、その特定の試料のポリヌクレオチドと接合するアダプターに独特であるバーコードとを含み、したがって、バーコード配列を使用して、1つの試料またはアダプター接合反応に由来するポリヌクレオチドと別の試料またはアダプター接合反応に由来するポリヌクレオチドを区別することができる。一部の実施形態では、アダプターオリゴヌクレオチドは、1つまたは複数の標的ポリヌクレオチド突出部と相補的である5’突出部、3’突出部、またはその両方を含む。相補的な突出部は、これらに限定されないが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、またはそれ超のヌクレオチドの長さを含めた、1ヌクレオチドまたは複数のヌクレオチドの長さであってよい。相補的な突出部は、固定された配列を含んでよい。アダプターオリゴヌクレオチドの相補的な突出部は、1つまたは複数のヌクレオチドのランダムな配列を含んでよく、したがって、1つまたは複数のヌクレオチドは、1つまたは複数の位置において2つまたはそれ超の異なるヌクレオチドのセットからランダムに選択され、1つまたは複数の位置において選択された異なるヌクレオチドのそれぞれが、ランダムな配列を含む相補的な突出部を有するアダプターのプールで表される。一部の実施形態では、アダプター突出部は、制限エンドヌクレアーゼ消化によって生成する標的ポリヌクレオチド突出部と相補的である。一部の実施形態では、アダプター突出部は、アデニンまたはチミンからなる。
【0072】
ポリヌクレオチドを環状化するための種々の方法が利用可能である。一部の実施形態では、環状化は、リガーゼ(例えば、RNAまたはDNAリガーゼ)の使用などの酵素反応を含む。これらに限定されないが、Circligase(商標)(Epicentre;Madison、WI)、RNAリガーゼ、T4 RNAリガーゼ1(DNAとRNAの両方に対して働くssRNAリガーゼ)を含めた種々のリガーゼが利用可能である。さらに、dsDNA鋳型が存在しない場合にはT4 DNAリガーゼによりssDNAもライゲーションすることができるが、これは一般に遅い反応である。リガーゼの他の非限定的な例としては、Taq DNAリガーゼ、Thermus filiformis DNAリガーゼ、Escherichia coli DNAリガーゼ、Tth DNAリガーゼ、Thermus scotoductus DNAリガーゼ(IおよびII)、熱安定性リガーゼ、Ampligase熱安定性DNAリガーゼ、VanC型リガーゼ、9°N DNAリガーゼ、Tsp DNAリガーゼ、およびバイオプロスペクティングにより発見された新規のリガーゼを含めたNAD依存性リガーゼ;T4 RNAリガーゼ、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼ、Pfu DNAリガーゼ、DNAリガーゼ1、DNAリガーゼIII、DNAリガーゼIV、およびバイオプロスペクティングにより発見された新規のリガーゼを含めたATP依存性リガーゼ;ならびに野生型、突然変異体アイソフォーム、および遺伝子操作されたその変異体が挙げられる。自己接合が望まれる場合には、ポリヌクレオチドおよび酵素の濃度を調整して、分子間構造ではなく分子内環の形成を容易にすることができる。反応温度および時間も調整することができる。一部の実施形態では、60℃を使用して、分子内環を容易にする。一部の実施形態では、反応時間は12〜16時間である。反応条件は、選択した酵素の製造業者によって指定された条件であってよい。一部の実施形態では、環状化反応後に、あらゆるライゲーションしていない核酸を消化するためにエキソヌクレアーゼステップを含めることができる。すなわち、閉じた環は遊離の5’末端も3’末端も含有せず、したがって、5’または3’エキソヌクレアーゼの導入により、閉じた環は消化されないが、ライゲーションしていない成分は消化される。これは、マルチプレックスシステムにおいて特定の使用を見いだすことができる。
【0073】
一般に、ポリヌクレオチドの末端を互いと接合して、環状ポリヌクレオチドを形成し(直接、または1つもしくは複数の中間のアダプターオリゴヌクレオチドを用いて)、接合部の配列を有する接合部を生じさせる。アダプターポリヌクレオチドを介してポリヌクレオチドの5’末端と3’末端を接合する場合、「接合部」という用語は、ポリヌクレオチドとアダプター(例えば、5’末端接合部または3’末端接合部の一方)の接合部、またはアダプターポリヌクレオチドによって形成され、それを含むポリヌクレオチドの5’末端と3’末端の間の接合部を指し得る。ポリヌクレオチドの5’末端と3’末端を、介在アダプターを用いずに接合する場合(例えば、一本鎖DNAの5’末端と3’末端)、「接合部」という用語は、これらの2つの末端が接合する点を指す。接合部は、接合部を含むヌクレオチドの配列(「接合部の配列」とも称される)によって同定することができる。一部の実施形態では、試料は、天然の分解プロセス(例えば、細胞溶解、細胞死、および、無細胞ポリヌクレオチドなどの、DNAが細胞からその周囲のさらに分解される可能性がある環境に放出される他のプロセスなど)、試料処理(例えば、固定、染色、および/または保管手順など)の副産物である断片化、および特定の標的配列への制限なしにDNAを切断する方法による断片化(例えば、超音波処理によるものなどの機械的な断片化;DNaseI、fragmentaseなどの非配列特異的ヌクレアーゼ処理)によって形成された末端の混合物を有するポリヌクレオチドを含む。試料が、末端の混合物を有するポリヌクレオチドを含む場合、2つのポリヌクレオチドが同じ5’末端または3’末端を有する可能性は低く、2つのポリヌクレオチドが同じ5’末端と3’末端の両方を独立に有する可能性は非常に低い。したがって、一部の実施形態では、2つのポリヌクレオチドが同じ標的配列を有する部分を含む場合であっても、接合部を使用して異なるポリヌクレオチドを区別することができる。介在アダプターを用いずにポリヌクレオチド末端を接合する場合、接合部の配列は、参照配列とアラインすることによって同定することができる。例えば、2つの成分配列の順序が参照配列と逆であると思われる場合、その逆になっていると思われる点が、その点において接合部を示し得る。1つまたは複数のアダプター配列を介してポリヌクレオチド末端を接合する場合、接合部は、公知のアダプター配列に近接していることによって、または、配列決定リードが、環状化されたポリヌクレオチドの5’末端と3’末端の両方から配列を得るのに十分な長さである場合には上記の通りアラインすることによって同定することができる。一部の実施形態では、特定の接合部の形成は、十分に稀な事象であり、したがって、試料の環状化されたポリヌクレオチドの中で独特なものである。
【0074】
図4は、ポリヌクレオチドを環状化する方法の3つの非限定的な例を説明する。一番上ではポリヌクレオチドをアダプターの不在下で環状化し、中央のスキームはアダプターの使用を示し、一番下のスキームは2種のアダプターを利用するものである。2種のアダプターを使用する場合、一方をポリヌクレオチドの5’末端に接合することができ、第2のアダプターを同じポリヌクレオチドの3’末端に接合することができる。一部の実施形態では、アダプターライゲーションは、2種の異なるアダプターを、ライゲーションを容易にするために2種のアダプターと相補的である「副子」核酸と一緒に使用することを含んでよい。分岐または「Y」アダプターも使用することができる。2種のアダプターを使用する場合、両末端に同じアダプターを有するポリヌクレオチドは、その後のステップにおいて自己アニーリングに起因して除去され得る。
【0075】
図6は、一本鎖DNAなどのポリヌクレオチドを環状化する方法の別の非限定的な例を説明する。アダプターは、ポリヌクレオチドの5’または3’末端のいずれかに非対称に付加することができる。図6Aに示されている通り、一本鎖DNA(ssDNA)は、3’末端に遊離のヒドロキシル基を有し、アダプターは、ブロッキングされた3’末端を有し、したがって、リガーゼの存在下で、好ましい反応によりssDNAの3’末端とアダプターの5’末端が接合する。この実施形態では、環を形成するための分子内ライゲーションの前に、単一のssDNA断片と単一のアダプターの分子間ライゲーションを駆動するためにポリエチレングリコール(PEG)などの薬剤を使用することが有用であり得る。末端の順序を逆にして行うこともできる(ブロッキングされた3’、遊離の5’など)。直鎖状ライゲーションが実現されたら、ライゲーションした部分を、キナーゼまたは他の適切な酵素もしくは化学を使用することによってなど、酵素を用いて処理して、ブロッキング部分を除去することができる。ブロッキング部分を除去したら、CircLigaseなどの環状化酵素を添加することにより、環状化されたポリヌクレオチドが形成される分子内の反応を可能にする。図6Bに示されている通り、一方の鎖がブロッキングされた5’または3’末端を有する二本鎖アダプターを使用することによって、二本鎖構造を形成することができ、これをライゲーションすると、ニックを有する二本鎖断片が生じる。次いで、2つの鎖を分離し、クロッキング部分を除去し、一本鎖の断片を環状化して、環状化されたポリヌクレオチドを形成することができる。
【0076】
一部の実施形態では、分子内環状化の速度を増強するために、分子クランプを使用してポリヌクレオチドの2つの末端(例えば、一本鎖DNA)をひとつにする。1つのそのようなプロセスの図の例が図5において説明されている。これは、アダプターを用いて行うこともでき、アダプターを用いずに行うこともできる。分子クランプの使用は、平均ポリヌクレオチド断片が約100ヌクレオチドを超える長さである場合に特に有用であり得る。一部の実施形態では、分子クランププローブは、3つのドメイン:第1のドメイン、介在ドメイン、および第2のドメインを含む。第1および第2のドメインをまず標的ポリヌクレオチドの対応する配列と配列相補性によってハイブリダイズする。分子クランププローブの介在ドメインは標的配列と有意にはハイブリダイズしない。したがって、クランプと標的ポリヌクレオチドのハイブリダイゼーションにより、標的配列の2つの末端が極めて近接し、それにより、環状化酵素の存在下での標的配列の分子内環状化が容易になる。一部の実施形態では、分子クランプが増幅プライマーとしての機能も果たし得るので、これはさらに有用である。
【0077】
環状化後、反応生成物を、サブシークエンスステップへの関与に利用可能な環状化されたポリヌクレオチドの相対的な濃度または純度を上昇させるために(例えば、環状ポリヌクレオチドの単離または反応物中の1つもしくは複数の他の分子の除去によって)、増幅または配列決定の前に精製することができる。例えば、環状化反応またはその成分を、例えば、エキソヌクレアーゼでの処理により、一本鎖(環状化されていない)ポリヌクレオチドが除去されるように処理することができる。別の例として、環状化反応またはその一部をサイズ排除クロマトグラフィーに供してもよく、それにより、少ない試薬を保持および廃棄する(例えば、未反応のアダプター)、または環状化産物を保持し、別々の体積に放出する。Zymo Research製のZymoオリゴ精製キットによって提供されるキットなどの、ライゲーション反応物を浄化するための種々のキットが利用可能である。一部の実施形態では、精製は、環状化反応に使用したリガーゼを除去もしくは分解するための処理、および/または環状化されたポリヌクレオチドをそのようなリガーゼから精製するための処理を含む。一部の実施形態では、リガーゼを分解するための処理は、プロテイナーゼKなどのプロテアーゼを用いた処理を含む。プロテイナーゼK処理は、製造業者のプロトコールに従ってもよく、標準のプロトコール(例えば、SambrookおよびGreen、Molecular Cloning: A Laboratory Manual、第4版(2012年)において提供される)に従ってもよい。プロテアーゼ処理の後に、抽出および沈殿を行うこともできる。一例では、環状化されたポリヌクレオチドを、0.1%SDSおよび20mMのEDTAの存在下でプロテイナーゼK(Qiagen)処理によって精製し、1:1フェノール/クロロホルムおよびクロロホルムを用いて抽出し、エタノールまたはイソプロパノールを用いて沈殿させる。一部の実施形態では、沈殿はエタノール中で行う。
【0078】
環状化の後に、環状化されたポリヌクレオチドの配列決定を直接続けることができる。あるいは、配列決定の前に1つまたは複数の増幅反応を行うことができる。一般に、「増幅」とは、標的ポリヌクレオチドまたはその一部の1つまたは複数のコピーを作出するプロセスを指す。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する種々の方法が利用可能である。増幅は、直線的なものであってもよく、指数関数的なものであってもよく、多相増幅プロセスにおいて直線位相と指数関数位相の両方を伴うものであってもよい。増幅方法は、熱変性ステップなどの温度の変化を伴ってもよく、熱変性を必要としない等温プロセスであってもよい。ポリメラーゼ連鎖反応(PCR)では、標的配列のコピー数を指数関数的に増加させるために、変性、プライマー対と逆の鎖のアニーリング、およびプライマー伸長の多数のサイクルを使用する。アニーリングした核酸鎖の変性は、熱の適用、局所的な金属イオン濃度の上昇(例えば、米国特許第6,277,605号)、超音波照射(例えば、WO/2000/049176)、電圧の印加(例えば、米国特許第5,527,670号、米国特許第6,033,850号、米国特許第5,939,291号、および米国特許第6,333,157号)、および磁気応答性材料に結合させたプライマーと組み合わせた電磁場の印加(例えば、米国特許第5,545,540号)によって実現することができる。RT−PCRと称される変形では、逆転写酵素(RT)を使用してRNAから相補DNA(cDNA)を作出し、次いで、cDNAをPCRによって増幅してDNAの多数のコピーを生成させる(例えば、米国特許第5,322,770号および米国特許第5,310,652号)。等温増幅方法の1つの例は、一般にSDAと称される鎖置換増幅であり、この方法では、プライマー配列の対と標的配列の逆の鎖のアニーリング、二重鎖ヘミホスホロチオエート化プライマー伸長産物を生成させるためのdNTPの存在下でのプライマー伸長、半改変制限エンドヌクレアーゼ認識部位のエンドヌクレアーゼ媒介性ニッキング、および現存する鎖を置き換え、次のプライマーのアニーリング、ニッキングおよび鎖置換のラウンドのための鎖を生成させるための、ニックの3’末端からのポリメラーゼ媒介性プライマー伸長のサイクルを使用し、その結果、産物の幾何的増幅をもたらす(例えば、米国特許第5,270,184号および米国特許第5,455,166号)。好熱性SDA(tSDA)では、基本的に同じ方法において、好熱性エンドヌクレアーゼおよびポリメラーゼを高温で使用する(欧州特許第0 684 315号)。他の増幅方法としては、ローリングサークル増幅(RCA)(例えば、Lizardi、「Rolling Circle Replication Reporter Systems」、米国特許第5,854,033号);ヘリカーゼ依存性増幅(HDA)(例えば、Kongら、「Helicase Dependent Amplification Nucleic Acids」、米国特許出願公開第US2004−0058378A1号);およびループ媒介性等温増幅(LAMP)(例えば、Notomiら、「Process for Synthesizing Nucleic Acid」、米国特許第6,410,278号)が挙げられる。いくつかの場合には、等温増幅では、オリゴヌクレオチドプライマーに組み入れることができるものなどのプロモーター配列からのRNAポリメラーゼによる転写を利用する。転写に基づく増幅方法としては、NASBAとも称される核酸配列に基づく増幅(例えば、米国特許第5,130,238号);一般にQβレプリカーゼと称されるRNAレプリカーゼの使用に依拠してプローブ分子自体を増幅する方法(例えば、Lizardi, P.ら(1988年)BioTechnol. 6巻、1197〜1202頁);自家持続配列複製(例えば、Guatelli, J.ら(1990年)Proc. Natl. Acad. Sci. USA 87巻、1874〜1878頁;Landgren(1993年)Trends in Genetics 9巻、199〜202頁;およびHELEN H. LEEら、NUCLEIC ACID AMPLIFICATION T ECHNOLOGIES(1997年));および、追加的な転写鋳型を作製するための方法(例えば、米国特許第5,480,784号および米国特許第5,399,491号)が挙げられる。等温性の核酸増幅の別の方法としては、非標準ヌクレオチド(例えば、ウラシルまたはRNAヌクレオチド)を含有するプライマーを、非標準ヌクレオチドにおいて核酸を切断して結合部位を追加的なプライマーに曝露する酵素(例えば、DNAグリコシラーゼまたはRNA分解酵素H)と組み合わせて使用することが挙げられる(例えば、米国特許第6,251,639号、米国特許第6,946,251号、および米国特許第7,824,890号)。等温増幅プロセスは直線的なものであっても指数関数的なものであってもよい。
【0079】
一部の実施形態では、増幅は、ローリングサークル増幅(RCA)を含む。典型的なRCA反応混合物は、1つまたは複数のプライマー、ポリメラーゼ、およびdNTPを含み、コンカテマーを生成する。一般には、RCA反応におけるポリメラーゼは、鎖置換活性を有するポリメラーゼである。種々のそのようなポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼのないDNAポリメラーゼIの大きな(クレノウ)断片、Phi29 DNAポリメラーゼ、Taq DNAポリメラーゼなどが挙げられる。一般に、コンカテマーは、鋳型ポリヌクレオチド由来の標的配列の2つまたはそれ超のコピーを含むポリヌクレオチド増幅産物である(例えば、標的配列の約2もしくはそれ超、約3もしくはそれ超、約4もしくはそれ超、約5もしくはそれ超、約6もしくはそれ超、約7もしくはそれ超、約8もしくはそれ超、約9もしくはそれ超、約10もしくはそれ超、またはそれ超のコピー;一部の実施形態では、約2またはそれ超のコピー)。増幅プライマーは、約もしくは少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、またはそれ超のヌクレオチドなどの任意の適切な長さであってよく、その任意の部分または全てが、プライマーがハイブリダイズする対応する標的配列と相補的であってよい(例えば、約もしくは少なくとも約5、10、15、20、25、30、35、40、45、50、またはそれ超のヌクレオチド)。図7は、適切なプライマーの3つの非限定的な例を示す。図7Aは、特定の標的配列内の配列変異体の有無を検出するために使用することができるアダプターおよび標的特異的プライマーの不使用を示す。一部の実施形態では、複数の標的に対する多数の標的特異的プライマーを同じ反応において使用する。例えば、約もしくは少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、またはそれ超の異なる標的配列に対する標的特異的プライマーを、対応する数の標的配列(存在する場合)を並行して増幅するために単一の増幅反応において使用することができる。多数の標的配列が同じ遺伝子の異なる部分、異なる遺伝子、または非遺伝子配列に対応する可能性がある。多数のプライマーが単一の遺伝子内の多数の標的配列を標的とする場合、プライマーは、標的遺伝子の全てまたは指定の部分を網羅するために、遺伝子配列に沿って間隔を空けることができる(例えば、約もしくは少なくとも約50ヌクレオチド、50〜150ヌクレオチドごと、または50〜100ヌクレオチドごとの間隔を空ける)。図7Cでは、アダプター配列とハイブリダイズするプライマー(いくつかの場合には、アダプターオリゴヌクレオチド自体であってよい)の使用を説明している。
【0080】
図7Bは、ランダムプライマーによる増幅の例を説明する。一般に、ランダムなプライマーは、1つまたは複数のランダムなまたはほぼランダムな配列を含む(例えば、1つまたは複数の位置において2つまたはそれ超の異なるヌクレオチドのセットからランダムに選択された1つまたは複数のヌクレオチドであり、1つまたは複数の位置において選択された異なるヌクレオチドのそれぞれが、ランダムな配列を含むアダプターのプールで表される)。このように、ポリヌクレオチド(例えば、全てまたは実質的に全て環状化されたポリヌクレオチド)を配列非特異的に増幅することができる。そのような手順は、「全ゲノム増幅」(WGA)と称することができる;しかし、典型的なWGAプロトコール(環状化ステップを伴わない)では、本開示で意図されるポリヌクレオチド断片などの短いポリヌクレオチドは効率的に増幅されない。WGA手順に関するさらなる例示的な考察については、例えば、Liら(2006年)J Mol. Diagn. 8巻(1号):22〜30頁を参照されたい。
【0081】
環状化されたポリヌクレオチドを、配列決定の前に増幅する場合、増幅産物を、富化を伴わずに直接配列決定に供することもでき、1つまたは複数の富化ステップの後で配列決定に供することもできる。富化は、増幅産物の保持または1種もしくは複数種の試薬の除去によるものなどの、1種または複数種の反応成分の精製を含んでよい。例えば、増幅産物は、基質に付着させた複数のプローブとのハイブリダイゼーション、続いて、洗浄ステップによるものなどの、捕捉されたポリヌクレオチドの放出によって精製することができる。あるいは、増幅産物を結合対のメンバーで標識し、その後、基質に付着させた結合対の他方のメンバーと結合させ、洗浄して増幅産物を放出させることができる。可能性のある基質としては、これらに限定されないが、ガラスおよび改質または機能化したガラス、プラスチック(アクリル、ポリスチレンおよびスチレンと他の材料の共重合体、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、Teflon(商標)など)、多糖、ナイロンまたはニトロセルロース、セラミックス、樹脂、シリコンおよび改質シリコンを含めたシリカまたはシリカに基づく材料、炭素、金属、無機ガラス、プラスチック、光ファイバー束、および種々の他のポリマーが挙げられる。一部の実施形態では、基質は、ビーズまたは他の小さな別個の粒子の形態であり、それは、磁場を印加することによって単離を容易にするための磁気または常磁性ビーズであってよい。一般に、「結合対」とは、第1および第2の部分の1つを指し、第1および第2の部分は、互いに対して特異的な結合親和性を有する。適切な結合対としては、これらに限定されないが、抗原/抗体(例えば、ジゴキシゲニン/抗ジゴキシゲニン、ジニトロフェニル(DNP)/抗DNP、ダンシル−X−抗ダンシル、フルオレセイン/抗フルオレセイン、ルシファーイエロー/抗ルシファーイエロー、およびローダミン抗ローダミン);ビオチン/アビジン(またはビオチン/ストレプトアビジン);カルモジュリン結合性タンパク質(CBP)/カルモジュリン;ホルモン/ホルモン受容体;レクチン/炭水化物;ペプチド/細胞膜受容体;プロテインA/抗体;ハプテン/抗ハプテン;酵素/補因子;および酵素/基質が挙げられる。
【0082】
一部の実施形態では、環状化されたポリヌクレオチドの増幅後の富化は、1つまたは複数の追加的な増幅反応を含む。一部の実施形態では、富化は、(a)増幅されたポリヌクレオチド;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含む増幅反応混合物において、配列Aおよび配列B(5’から3’の方向に配向された)を含む標的配列を増幅することを含み、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。図10は、単一の反復(一般には環状でなければ増幅されない)、および標的配列の多数のコピーを含むコンカテマーに関して、標的配列に対する第1および第2のプライマーの配置の例を説明する。標的配列の単量体に対するプライマーの方向を考慮すると、この配置は、「背中合わせ」(B2B)または「逆方向」プライマーと称することができる。B2Bプライマーを用いた増幅により、環状および/またはコンカテマー増幅産物の富化が容易になる。さらに、この方向を比較的小さなフットプリント(プライマー対が及ぶ総距離)と組み合わせることにより、接合部が、典型的な増幅反応において見いだされるプライマーの配置(互いに面し、標的配列に及ぶ)におけるものよりも、プライマー間に生じている可能性が低いので、標的配列の周囲の様々な断片化事象の増幅が可能になる。一部の実施形態では、配列Aの5’末端と配列Bの3’末端の間の距離は、約200もしくはそれ未満、約150もしくはそれ未満、約100もしくはそれ未満、約75もしくはそれ未満、約50もしくはそれ未満、約40もしくはそれ未満、約30もしくはそれ未満、約25もしくはそれ未満、約20もしくはそれ未満、約15もしくはそれ未満、またはそれ未満のヌクレオチドである。一部の実施形態では、配列Aは配列Bの相補体である。一部の実施形態では、複数の異なる標的配列を対象とする多数のB2Bプライマー対を同じ反応において使用して、複数の異なる標的配列を並行して増幅する(例えば、約もしくは少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、またはそれ超の異なる標的配列)。プライマーは、本明細書の他の箇所に記載されているものなどの任意の適切な長さであってよい。増幅は、本明細書に記載の増幅反応などの、適切な条件下での任意の適切な増幅反応を含んでよい。一部の実施形態では、増幅は、ポリメラーゼ連鎖反応である。
【0083】
一部の実施形態では、B2Bプライマーは、少なくとも2つの配列エレメント、標的配列と配列相補性によってハイブリダイズする第1のエレメント、および、第1のエレメントがハイブリダイズする第1のハイブリダイゼーション温度における第1の増幅相の間に標的配列とハイブリダイズしない(例えば、尾部と、第1のエレメントが結合する場所に対してすぐ3’側の標的配列の部分の間の配列相補性の欠如に起因して)、5’「尾部」を含む。例えば、第1のプライマーは、配列A’に対して5’側に配列Cを含み、第2のプライマーは、配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも複数のコンカテマーとハイブリダイズしない。そのような有尾プライマーを使用する一部の実施形態では、増幅は、第1の相および第2の相を含んでよく、第1の相は、第1の温度におけるハイブリダイゼーションステップであって、その間に第1および第2のプライマーがコンカテマー(または環状化されたポリヌクレオチド)とハイブリダイズするハイブリダイゼーションステップ、およびプライマー伸長を含み、第2の相は、第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップであって、その間に、第1および第2のプライマーが伸長した第1もしくは第2のプライマー、またはその相補体を含む増幅産物とハイブリダイズするハイブリダイゼーションステップ、およびプライマー伸長を含む。高温では、第1のエレメントとプライマー伸長産物におけるプライマーの尾部エレメントの間のハイブリダイゼーションが、プライマー内の第1のエレメントのみとコンカテマー内の内部標的配列とのハイブリダイゼーションによって形成される短い断片よりも有利である。したがって、二相増幅を使用して、そうでなければ短い増幅産物が有利になり得る程度を低下させ、それにより、標的配列の2つまたはそれ超のコピーを有する増幅産物の比較的高い割合を維持することができる。例えば、第2の温度におけるハイブリダイゼーションおよびプライマー伸長を5サイクル(例えば、少なくとも5、6、7、8、9、10、15、20、またはそれ超のサイクル)行った後に、反応混合物中の増幅されたポリヌクレオチドの少なくとも5%(例えば、少なくとも5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、またはそれ超)が、標的配列の2つまたはそれ超のコピーを含む。この二相の有尾B2Bプライマー増幅プロセスに従ったある実施形態の図が図11において説明されている。
【0084】
一部の実施形態では、富化は、コンカテマー由来のアンプリコンの長さが増大するように偏った条件下での増幅を含む。例えば、プライマー濃度を低下させることができ、したがって、全てではないプライミング部位がプライマーとハイブリダイズし、したがってPCR産物がより長くなる。同様に、サイクル中のプライマーハイブリダイゼーション時間を減少させることにより、同様に、より少ないプライマーがハイブリダイズすることが可能になり、したがって、平均PCRアンプリコンサイズも増加する。さらに、サイクルの温度および/または伸長時間を増大させることにより、同様に、PCRアンプリコンの平均長が増加する。これらの技法の任意の組合せを使用することができる。
【0085】
一部の実施形態では、特に、B2Bプライマーを用いた増幅を実施した場合には、増幅産物を、生じたアンプリコンがサイズに基づいて選別されるように処理して、コンカテマーを含む単量体混合物の数を減少させ、かつ/または排除する。これは、これらに限定されないが、ゲルからの断片の切り出しおよびゲル濾過(例えば、約300、400、500、またはそれ超のヌクレオチドの長さよりも大きな断片を富化するため);ならびに結合緩衝液の濃度を細かく調整することによってサイズ選択するためのSPRIビーズ(Agencourt AMPure XP)を含めた種々の利用可能な技法を使用して行うことができる。例えば、DNA断片との混合の間に0.6×結合緩衝液の使用を使用して、約500塩基対(bp)よりも大きなDNA断片を優先的に結合させることができる。
【0086】
増幅により一本鎖コンカテマーが生じる一部の実施形態では、単一の鎖を、配列決定反応のために作製される配列決定ライブラリーの形成の前に、またはその一部として、二本鎖構築物に変換する。一本鎖核酸から二本鎖構築物を作製するための種々の適切な方法が利用可能である。いくつかの可能性のある方法が図9に示されているが、いくつかの他の方法も使用することができる。図9Aに示されている通り、例えば、ランダムプライマー、ポリメラーゼ、dNTPおよびリガーゼの使用により、二本鎖が生じる。図9Bは、コンカテマーが、反応においてプライマーとして使用することができるアダプター配列を含有する場合の第2の鎖合成を示す。図9Cは、「ループ」の使用を示し、この場合、ループアダプターの一方の末端をコンカテマーの末端に付加し、ループアダプターは自己ハイブリダイズ性核酸の小さな切片を有する。この場合、ループアダプターのライゲーションにより、自己ハイブリダイズし、ポリメラーゼプライマー鋳型としての機能を果たすループが生じる。図9Dは、高分岐プライマーの使用、一般に、標的配列が既知である場合、特に、強力な鎖置換機能を有するポリメラーゼを使用した場合に多数の鎖が形成される場合の大多数の使用を示す。
【0087】
一部の実施形態によると、環状化されたポリヌクレオチド(またはその増幅産物、場合によって富化されていてよい)を配列決定反応に供して配列決定リードを作成する。そのような方法によって生成する配列決定リードは、本明細書に開示されている他の方法に従って使用することができる。種々の配列決定方法体系、特に、ハイスループットな配列決定方法体系が利用可能である。例としては、限定することなく、Illumina製のシークエンシングシステム(HiSeq(登録商標)およびMiSeq(登録商標)などのシークエンシングシステム)、Life Technologies製のシークエンシングシステム(Ion Torrent(登録商標)、SOLiD(登録商標)など)、Roche’s 454 Life Sciences systems製のシークエンシングシステム、Pacific Biosciences systems製のシークエンシングシステムなどが挙げられる。一部の実施形態では、配列決定は、HiSeq(登録商標)およびMiSeq(登録商標)システムを使用して約50もしくはそれ超、約75もしくはそれ超、約100もしくはそれ超、約125もしくはそれ超、約150もしくはそれ超、約175もしくはそれ超、約200もしくはそれ超、約250もしくはそれ超、約300もしくはそれ超、またはそれ超のヌクレオチドの長さのリードを生成することを含む。一部の実施形態では、配列決定は、個々のヌクレオチドを、成長しているプライマー伸長産物に添加するにつれ繰り返し同定する、合成プロセスによる配列決定を含む。パイロシークエンシングは、生じた合成混合物を、配列決定反応の副産物、すなわち、ピロリン酸の存在についてアッセイすることによってヌクレオチドの組み入れを同定する、合成プロセスによる配列決定の例である。具体的には、プライマー/鋳型/ポリメラーゼ複合体を単一の種類のヌクレオチドと接触させる。そのヌクレオチドが組み入れられると、重合反応により三リン酸鎖のαリン酸とβリン酸の間のヌクレオシド三リン酸が切断され、ピロリン酸が放出される。次いで、放出されたピロリン酸の存在を、AMPを用いてピロリン酸をATPに変換する化学発光酵素レポーター系を使用して同定し、次いで、ルシフェラーゼ酵素を使用してATPを測定して、測定可能な光信号を生成する。光が検出される場合には塩基が組み入れられており、光が検出されない場合には、塩基は組み入れられていない。適切な洗浄ステップの後、種々の塩基を周期的に複合体と接触させて、鋳型配列内のその後の塩基を逐次的に同定する。例えば、米国特許第6,210,891号を参照されたい。
【0088】
関連する配列決定プロセスでは、プライマー/鋳型/ポリメラーゼ複合体を基質に固定化し、複合体を標識されたヌクレオチドと接触させる。複合体の固定化は、プライマー配列、鋳型配列および/またはポリメラーゼ酵素によるものであってよく、また、共有結合性であっても非共有結合性であってもよい。例えば、複合体の固定化は、ポリメラーゼまたはプライマーと基質表面の連結を介したものであってよい。代替の立体配置では、ヌクレオチドは、除去可能なターミネーター基を伴ってまたは伴わずにもたらされる。組み入れられると、標識が複合体とカップリングし、したがって、検出可能になる。ターミネーターを担持するヌクレオチドの場合では、個々に同定可能な標識を担持する4つの異なるヌクレオチドの全てを複合体と接触させる。標識したヌクレオチドの組み入れにより、ターミネーターが存在することによって伸長が停止し、標識が複合体に付加され、それにより、組み入れられたヌクレオチドの同定が可能になる。次いで、組み入れられたヌクレオチドから標識およびターミネーターを除去し、適切な洗浄ステップの後、プロセスを繰り返す。ターミネーターを有さない(non−terminated)ヌクレオチドの場合では、パイロシークエンシングと同様に、単一の種類の標識されたヌクレオチドを複合体に付加して、それが組み入れられるかどうかを決定する。ヌクレオチド上の標識基の除去および適切な洗浄ステップの後、種々の異なるヌクレオチドを、反応混合物を通じて同じプロセスでサイクルにかける。例えば、その全体があらゆる目的に関して参照により本明細書に組み込まれる米国特許第6,833,246号を参照されたい。例えば、Illumina Genome Analyzer Systemは、WO98/44151に記載されている技術に基づき、DNA分子を配列決定プラットフォーム(フローセル)にアンカープローブ結合部位(他の点ではフローセル結合部位と称される)を介して結合させ、ガラススライド上でin situで増幅する。DNA分子の増幅が行われる固体表面は、一般には、複数の第1および第2の結合したオリゴヌクレオチドを含み、第1の結合したオリゴヌクレオチドは標的ポリヌクレオチドの一方の末端またはその付近の配列と相補的であり、第2の結合したオリゴヌクレオチドは標的ポリヌクレオチドの他方の末端またはその付近の配列と相補的である。この配置により、US20140121116に記載されているものなどの橋増幅が可能になる。次いで、DNA分子を配列決定プライマーとアニーリングさせ、可逆的なターミネーター手法を使用して、塩基ごとに並行して配列決定する。配列決定プライマーのハイブリダイゼーションの前に、橋を係留する結合したオリゴヌクレオチドの1つの切断部位において二本鎖橋ポリヌクレオチドの一方の鎖の切断を行い、したがって、1つの一本鎖は変性によって除去することができる固体基質に結合しないまま残し、他方の鎖は結合し、配列決定プライマーとのハイブリダイゼーションに利用可能にすることができる。一般には、Illumina Genome Analyzer Systemでは8チャネルのフローセルを利用し、それにより、18〜36塩基の長さの配列決定リードが生じ、実行ごとに>1.3Gbpの高品質データが生じる(www.illumina.comを参照されたい)。
【0089】
合成プロセスによるさらに別の配列では、違うように標識したヌクレオチドの組み入れがリアルタイムで鋳型依存性合成を行ったように観察される。具体的には、蛍光標識したヌクレオチドが組み入れられると個々の固定化したプライマー/鋳型/ポリメラーゼ複合体が観察され、これにより、付加された塩基のそれぞれの付加されるにつれたリアルタイム同定が可能になる。このプロセスでは、標識基は組み入れの間に切断されるヌクレオチドの一部に付着している。例えば、組み入れの間に除去されるリン酸鎖、すなわち、ヌクレオシドポリリン酸上のβ、γ、または他の末端リン酸基の一部に標識基を付着させることにより、標識は新生鎖には組み入れられず、その代わりに、天然DNAが生成する。個々の分子の観察は、一般には、非常に小さな照明体積内への複合体の光学的拘束を伴う。複合体を光学的に拘束することにより、ランダムに拡散しているヌクレオチドは非常に短い期間存在するが、組み入れられたヌクレオチドは、組み入れられているので観察体積内により長く保持される、モニター領域が創出される。これにより、組み入れ事象に伴う特徴的なシグナルがもたらされ、これは、付加された塩基の特性であるシグナルプロファイルによっても特徴付けられる。関連する態様では、蛍光共鳴エネルギー移動(FRET)色素対などの、相互作用する標識成分がポリメラーゼまたは複合体の他の部分および組み入れるヌクレオチド上にもたらされ、したがって、組み入れ事象により、標識成分が相互作用的に近接し、再度、組み入れられた塩基の特性でもある特徴的なシグナルがもたらされる(例えば、米国特許第6,917,726号、同第7,033,764号、同第7,052,847号、同第7,056,676号、同第7,170,050号、同第7,361,466号、および同第7,416,844号;ならびにUS20070134128を参照されたい)。
【0090】
一部の実施形態では、試料中の核酸について、ライゲーションによって配列決定することができる。この方法では、一般には、例えば、polony法およびSOLiD技術(Applied Biosystems、現在はInvitrogen)において使用される通り、DNAリガーゼ酵素を使用して標的配列を同定する。一般に、固定された長さの全ての可能性のあるオリゴヌクレオチドのプールが、配列決定された位置に応じて標識されてもたらされる。オリゴヌクレオチドをアニーリングし、ライゲーションする;マッチする配列に対するDNAリガーゼによる優先的なライゲーションにより、その位置における相補配列に対応するシグナルがもたらされる。
【0091】
一部の実施形態によると、配列決定リードと参照配列の間の配列の差異は、少なくとも2つの異なるポリヌクレオチド(例えば、異なる接合部を有する結果として区別することができる2つの異なる環状ポリヌクレオチド)において生じている場合、真性配列変異体としてコールされる(例えば、増幅または配列決定の前に試料中に存在し、これらのプロセスのいずれの結果でもない)。増幅または配列決定誤差の結果である配列変異体は、同じ標的配列を含む2つの異なるポリヌクレオチドにおいて正確に重複する可能性は低いので(例えば、位置および種類)、この検証パラメータを追加することにより、誤った配列変異体のバックグラウンドが著しく低下し、同時に、試料中の実際の配列変異を検出する感度および正確度が上昇する。一部の実施形態では、頻度が約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.75%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.075%もしくはそれ未満、約0.05%もしくはそれ未満、約0.04%もしくはそれ未満、約0.03%もしくはそれ未満、約0.02%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、またはそれ未満である配列変異体は、正確なコールを許容するためのバックグラウンドを十分に超える。一部の実施形態では、配列変異体は、約0.1%またはそれ未満の頻度で生じている。一部の実施形態では、配列変異体の頻度は、そのような頻度が、バックグラウンド誤差率を統計的に有意に上回る場合(例えば、約0.05もしくはそれ未満、約0.01もしくはそれ未満、約0.001もしくはそれ未満、約0.0001もしくはそれ未満、またはそれ未満のp値)、バックグラウンドを十分に超える。一部の実施形態では、配列変異体の頻度は、そのような頻度が、バックグラウンド誤差率を約もしくは少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、またはそれ超上回る(例えば、少なくとも5倍高い)場合、バックグラウンドを十分に超える。一部の実施形態では、所与の位置における配列を正確に決定することにおけるバックグラウンド誤差率は、約1%もしくはそれ未満、約0.5%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、約0.0005%もしくはそれ未満、またはそれ未満である。一部の実施形態では、誤差率は0.001%未満である。
【0092】
一部の実施形態では、真性配列変異体の同定(「コール」または「コールを行う」とも称される)は、1つまたは複数の配列決定リードを参照配列と最適にアラインして、2つの間の差異を同定すると共に、接合部を同定することを含む。一般に、アラインメントは、1つの配列を別の配列に沿って置き、各配列に沿ってギャップを繰り返し導入し、2つの配列がどれくらいよくマッチするかをスコアリングし、好ましくは様々な位置に関して参照に沿って反復することを伴う。最も良いスコアリングのマッチが、アラインされたとみなされ、配列間の関係のおよその程度の推測を表す。一部の実施形態では、配列決定リードと比較する参照配列は、対象と同じ種のメンバーのゲノムなどの参照ゲノムである。参照ゲノムは、完全であっても不完全であってもよい。一部の実施形態では、参照ゲノムは、参照ゲノムに由来するものまたは解析中の配列決定リードから作製したコンセンサスに由来するものなどの、標的ポリヌクレオチドを含有する領域のみからなる。一部の実施形態では、参照配列は、1つもしくは複数の細菌、古細菌、ウイルス、原生生物、真菌、または他の生物体に由来する配列などの、1つまたは複数の生物体のポリヌクレオチドの配列を含む、またはそれからなる。一部の実施形態では、参照配列は、解析中の1つまたは複数の標的配列(例えば、1つもしくは複数の遺伝子、またはその一部)に対応する領域などの、参照ゲノムの一部のみからなる。例えば、病原体の検出(例えば、汚染検出の場合など)に関しては、参照ゲノムは、病原体(例えば、HIV、HPV、または有害な細菌株、例えば、E.coli)のゲノム全体、または、特定の株もしくは血清型などの、同定において有用なその一部である。一部の実施形態では、例えば、多数の異なる生物体または株をスクリーニングするためになど、配列決定リードを多数の異なる参照配列とアラインする。
【0093】
典型的なアラインメントでは、配列決定リード内の塩基が参照内のマッチしない塩基と並んでいることは、その点において置換突然変異が生じていることを示す。同様に、1つの配列が他の配列内の塩基と並んでギャップを含む場合、挿入または欠失突然変異(「インデル」)が生じたことが推定される。1つの配列が1つの他の配列とアラインしていることを明示することが望まれる場合、アラインメントは、時にはペアワイズアラインメントと称される。多数の配列アラインメントとは、一般に、例えば、一連のペアワイズアラインメントによるものを含めた、2つまたはそれ超の配列のアラインメントを指す。一部の実施形態では、アラインメントのスコアリングは、置換およびインデルの確率についての値を設定することを含む。個々の塩基をアラインすると、マッチまたはミスマッチは置換確率によってアラインメントスコアに寄与し、これは、例えば、マッチに関しては1、ミスマッチに関しては0.33であってよい。インデルはアラインメントスコアからギャップペナルティを差し引き、これは、例えば、−1であってよい。ギャップペナルティおよび置換確率は、配列がどのように突然変異するかに関する経験的な知見または事前仮定に基づいてよい。それらの値は、生じたアラインメントに影響を及ぼす。アラインメントを実施するためのアルゴリズムの例としては、限定することなく、Smith−Waterman(SW)アルゴリズム、Needleman−Wunsch(NW)アルゴリズム、Burrows−Wheeler Transform(BWT)に基づくアルゴリズム、ならびにNovoalign(Novocraft Technologies;www.novocraft.comにおいて入手可能)、ELAND(Illumina、San Diego、Calif.)、SOAP(soap.genomics.org.cnにおいて入手可能)、およびMaq(maq.sourceforge.netにおいて入手可能)などのハッシュ関数アライナーが挙げられる。BWT手法を実行する1つの例示的なアラインメントプログラムは、Geeknet(Fairfax、Va.)によって維持されているSourceForgeウェブサイトから入手可能なBurrows−Wheeler Aligner(BWA)である。BWTは、一般には、ヌクレオチドごとに占有するメモリが2ビットであり、これにより、典型的なデスクトップまたはラップトップコンピュータを用いて4G塩基対ものヌクレオチド配列に索引を付けることが可能になる。前処理は、BWTの構築(すなわち、参照に索引を付けること)および補助的なデータ構造の支持を含む。BWAは、どちらもBWTに基づく2つの異なるアルゴリズムを含む。BWAによるアラインメントは、低誤差率(<3%)を伴う最大約200までの短いクエリ用に設計されたアルゴリズムbwa−shortを使用して進行させることができる(Li H.およびDurbin R. Bioinformatics、25巻:1754〜60頁(2009年))。第2のアルゴリズム、BWA−SWは、誤差の多い長いリード用に設計されたものである(Li H.およびDurbin R.(2010年)。Fast and accurate long-read alignment with Burrows-Wheeler Transform. Bioinformatics、Epub.)。bwa−swアライナーは、時には、「bwa−long」、「bwa longアルゴリズム」などと称される。Smith−Watermanアルゴリズムのバージョンを実行するアラインメントプログラムは、Geeknet(Fairfax、Va.)によって維持されているSourceForgeウェブサイトから入手可能なMUMmerである。MUMmerは、完全な形態であるかまたはドラフト形態であるかにかかわらず、ゲノム全体を迅速にアラインするシステムである(Kurtz, S.ら、Genome Biology、5巻:R12頁(2004年);Delcher, A. L.ら、Nucl. Acids Res.、27巻:11頁(1999年))。例えば、MUMmer3.0では、2.4GHzのLinux(登録商標)デスクトップコンピュータにおいて78MBのメモリを使用して、5メガベースゲノムの対間の20塩基対またはそれ超の正確なマッチの全てを13.7秒で見いだすことができる。MUMmerでは、不完全なゲノムをアラインすることもできる;MUMmerでは、ショットガン配列決定プロジェクトからの100sまたは1000sのコンティグを容易に取り扱うことができ、また、当該システムに含まれるNUCmerプログラムを使用してそれらを別のコンティグまたはゲノムのセットとアラインする。アラインメントプログラムの他の非限定的な例としては、Kent Informatics(Santa Cruz、Calif.)からのBLAT(Kent, W. J.、Genome Research 4巻:656〜664頁(2002年));Beijing Genomics Institute(Beijing、Conn.)またはBGI Americas Corporation(Cambridge、Mass.)からのSOAP2;Bowtie(Langmeadら、Genome Biology、10巻:R25頁(2009年));Efficient Large−Scale Alignment of Nucleotide Databases(ELAND)またはConsensus Assessment of Sequence and Variation(CASAVA)softwareのELANDv2コンポーネント(Illumina、San Diego、Calif.);Real Time Genomics,Inc.(San Francisco、Calif.)からのRTG Investigator;Novocraft(Selangor、Malaysia)からのNovoalign;Exonerate、European Bioinformatics Institute(Hinxton、UK)(Slater, G.、およびBirney, E.、BMC Bioinformatics 6巻:31頁(2005年))、University College Dublin(Dublin、Ireland)からのClustal Omega(Sievers F.ら、Mol Syst Biol 7巻、論文番号539(2011年));University College Dublin(Dublin、Ireland)からのClustalWまたはClustalX(Larkin M. A.ら、Bioinformatics、23巻、2947〜2948頁(2007年));およびFASTA、European Bioinformatics Institute(Hinxton、UK)(Pearson W. R.ら、PNAS 85巻(8号):2444〜8頁(1988年);Lipman, D. J.、Science 227巻(4693号):1435〜41頁(1985年))が挙げられる。
【0094】
一般には、配列決定データは、大規模並行配列決定反応から得られる。次世代ハイスループットシークエンシングシステムの多くでは、データはFASTQファイルとしてエクスポートされるが、他の形式も使用することができる。一部の実施形態では、配列を解析して繰り返し単位長(例えば、単量体の長さ)、環状化によって形成される接合部、および参照配列に対するあらゆる真の変異を、一般には配列アラインメントによって同定する。繰り返し単位長の同定は、繰り返し単位の領域を計算すること、配列の参照遺伝子座(例えば、増幅、富化、および/または配列決定のために1つまたは複数の配列を特に標的とする場合)、各繰り返し領域の境界、および/または各配列決定の実行内の反復の数を見いだすことを含んでよい。配列解析は、二重鎖の両方の鎖について配列データを解析することを含んでよい。上記の通り、一部の実施形態では、試料由来の異なるポリヌクレオチドからのリードの配列と思われる同一の変異体(例えば、異なる接合部を有する環状化されたポリヌクレオチド)は、確認された変異体とみなされる。一部の実施形態では、配列変異体は、同じポリヌクレオチドの2つ以上の繰り返し単位において生じている場合、同じ配列変異が同様に、同じコンカテマー内の繰り返される標的配列の同じ位置において生じている可能性は低いので、確認されたまたは真性の変異体とみなすこともできる。変異体および確認された変異体の同定において、配列の品質スコアを考慮することができ、例えば、品質スコアが閾値よりも低い配列および塩基を除外することができる。変異体コールの感度および特異度をさらに増大させるために他のバイオインフォマティクス方法を使用することができる。
【0095】
一部の実施形態では、変異体(突然変異)の決定に統計解析を適用し、総DNA試料中の変異体の比を定量化することができる。配列決定データを使用して特定の塩基の総測定値を算出することができる。例えば、以前のステップにおいて算出されたアラインメント結果から、各遺伝子座について「有効なリード」の数、すなわち、確認されたリードの数を算出することができる。変異体の対立遺伝子頻度を遺伝子座についての有効なリード数によって正規化することができる。遺伝子座全てにわたって観察される変異体の平均率である全体的なノイズレベルを計算することができる。変異体の頻度および全体的なノイズレベルを他の因子と組み合わせて使用して、変異体コールの信頼区間を決定することができる。ポアソン分布などの統計学的モデルを使用して変異体コールの信頼区間を評価することができる。変異体の対立遺伝子頻度は、全試料中の変異体の相対的な数量の指標としても使用することができる。
【0096】
一部の実施形態では、コールするステップに基づいて微生物性汚染物質を同定する。例えば、特定の配列変異体は、潜在的に感染性である微生物による汚染を示し得る。微生物を同定する目的で、高度に保存されたポリヌクレオチド内の配列変異体を同定することができる。系統学的な特徴付けおよび微生物の同定において有用な、高度に保存されたポリヌクレオチドの例は、16S rRNA遺伝子、23S rRNA遺伝子、5S rRNA遺伝子、5.8S rRNA遺伝子、12S rRNA遺伝子、18S rRNA遺伝子、28S rRNA遺伝子、gyrB遺伝子、rpoB遺伝子、fusA遺伝子、recA遺伝子、coxl遺伝子およびnifD遺伝子において見いだされるヌクレオチド配列を含む。真核生物では、rRNA遺伝子は核のrRNA遺伝子、ミトコンドリアのrRNA遺伝子、またはその両方であってもよい。一部の実施形態では、16S〜23S rRNA遺伝子内部転写スペーサー(ITS)内の配列変異体を、他のrRNA遺伝子の使用を伴ってまたは伴わずに、密接に関連する分類群を弁別し、同定するために使用することができる。16S rRNAの構造的な制約に起因して、遺伝子全体を通して、特定の領域は、高度に保存されたポリヌクレオチド配列を有するが、非構造的セグメントの変動性の程度は高い可能性がある。配列変異体の同定を使用して、亜属、属、亜科、科、亜目、目、亜綱、綱、亜門、門、亜界、または界を表す操作的分類単位(OTU)を同定すること、および場合によって、集団におけるそれらの頻度を決定することができる。汚染を示す微生物の存在、および場合によって量(相対的なまたは絶対的な)の検出において特定の配列変異体の検出を使用することができる。適用例としては、糞便または他の汚染に関する水の品質検査、動物またはヒト病原体に関する検査、水の汚染の原因を正確に示すこと、再生または再利用水の検査、海への排出プルームを含めた下水排水の流れの検査、水産養殖施設の病原体に関するモニタリング、ビーチ、遊泳領域または他の水に関連する娯楽施設のモニタリング、および毒性藻類異常発生の予測が挙げられる。食品モニタリングへの適用としては、食品加工工場における生産ラインの定期検査、屠殺場の調査、レストラン、病院、学校、矯正施設および他の施設のキッチンおよび食品貯蔵場所の、E.coli株O157:H7もしくはO111:B4、Listeria monocytogenes、またはSalmonella enterica subsp.enterica serovar Enteritidisなどの食品媒介性病原体に関する検査が挙げられる。甲殻類および甲殻類から生じる水を、麻痺性貝中毒、神経毒性貝中毒、下痢性貝中毒および健忘性貝中毒の原因である藻類について調査することができる。さらに、輸入された食糧を、放出される前に税関において同時にスクリーニングして、食品の安全を確実にすることができる。植物病原体のモニタリングへの適用としては、園芸および苗床のモニタリング、例えば、オーク突然死病の原因である微生物であるPhytophthora ramorumに関するモニタリング、作物病原体のサーベイランスおよび疾患管理、ならびに森林病原体のサーベイランスおよび疾患管理が挙げられる。微生物汚染が主要な安全性の懸念である医薬品、医療機器、および他の消耗品または重要な成分の製造環境を、Pseudomonas aeruginosaまたはStaphylococcus aureusのような特定の病原体の存在、より一般的なヒトに関連する微生物、水またはその特定の環境もしくは同様の環境において以前同定されたバイオバーデンを表す他のものの存在に関連する微生物の存在について調査することができる。同様に、宇宙船を含めた感受性の高い設備の構築および組み立ての領域を、そのような環境に生息するまたは最も一般的に導入されることが公知の以前同定された微生物についてモニターすることができる。
【0097】
一態様では、本開示は、それぞれが5’末端および3’末端を有するポリヌクレオチド50ng未満を含む核酸試料において配列変異体を同定する方法を提供する。一部の実施形態では、方法は、(a)リガーゼを用いて前記試料中の個々のポリヌクレオチドを環状化して複数の環状ポリヌクレオチドを形成するステップと、(b)前記リガーゼを前記環状ポリヌクレオチドから分離したら、環状ポリヌクレオチドを増幅してコンカテマーを形成するステップと、(c)コンカテマーを配列決定して複数の配列決定リードを生成するステップと、(d)複数の配列決定リードと参照配列の間の配列の差異を同定するステップと、(e)前記50ng未満のポリヌクレオチドの核酸試料からの前記複数のリードにおいて0.05%またはそれ超の頻度で生じている配列の差異を配列変異体としてコールするステップとを含む。
【0098】
試料中のポリヌクレオチドの出発量は少なくてよい。一部の実施形態では、出発ポリヌクレオチドの量は、50ng未満、例えば、45ng未満、40ng未満、35ng未満、30ng未満、25ng未満、20ng未満、15ng未満、10ng未満、5ng未満、4ng未満、3ng未満、2ng未満、1ng未満、0.5ng未満、0.1ng未満、またはそれ未満などである。一部の実施形態では、出発ポリヌクレオチドの量は、0.1〜100ngの範囲、例えば、1〜75ng、5〜50ng、または10〜20ngである。一般に、出発材料が少ないほど、種々の処理ステップからの回収率を上昇させる重要性が増す。その後の反応に関与する試料中のポリヌクレオチドの量が減少するプロセスにより、稀な突然変異を検出することができる感度が低下する。例えば、Louら(PNAS、2013年、110巻(49号))に記載されている方法では、出発材料の回収率がたった10〜20%であることが予測される。大量の出発材料(例えば、実験室で培養された細菌から精製されたもの)に関しては、これは実質的な障害物にはならない可能性がある。しかし、出発材料が実質的に少ない試料に関しては、この低範囲の回収率は、十分に稀な変異体の検出に対する実質的な障害物になる可能性がある。したがって、一部の実施形態では、本開示の方法の1つのステップから別のステップへの試料の回収率(例えば、環状化ステップへのインプットの、その後の増幅ステップまたは配列決定ステップにインプットするために利用可能な質量分率)は、約50%もしくはそれ超、約60%もしくはそれ超、約75%もしくはそれ超、約80%もしくはそれ超、約85%もしくはそれ超、約90%もしくはそれ超、約95%もしくはそれ超、またはそれ超である。特定のステップからの回収率は、ほぼ100%であり得る。回収率は、非環状ポリヌクレオチドのインプットからの環状ポリヌクレオチドの回収率などの、特定の形態に関するものであってよい。
【0099】
ポリヌクレオチドは、本開示の種々の態様に関して本明細書に記載されている試料などの、任意の適切な試料に由来するものであってよい。試料由来のポリヌクレオチドは、これらに限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、またはこれらの任意の2つもしくはそれ超の組合せを含めた種々のポリヌクレオチドのいずれであってもよい。一部の実施形態では、試料はDNAを含む。一部の実施形態では、ポリヌクレオチドは、得られたままか、処理(例えば、変性)されたものかのいずれにせよ、一本鎖である。適切なポリヌクレオチドのさらなる例は、例えば、本開示の種々の態様のいずれかに関してなど本明細書に記載されている。一部の実施形態では、ポリヌクレオチドを、抽出ステップを伴わずに、かつ/または精製ステップを伴わずに、その後のステップ(例えば、環状化および増幅)に供する。例えば、流体試料を、抽出ステップを伴わずに処理して細胞を除去して精製された液体試料および細胞試料を生じさせ、その後、精製された流体試料からDNAを単離することができる。沈殿または基質への非特異的な結合、その後、基質を洗浄して結合したポリヌクレオチドを放出させることによるものなど、ポリヌクレオチドを単離するための種々の手順が利用可能である。ポリヌクレオチドを、細胞抽出ステップを伴わずに試料から単離する場合、ポリヌクレオチドは大部分が細胞外または「無細胞」ポリヌクレオチドになり、これは、死細胞または損傷を受けた細胞に対応する可能性がある。そのような細胞の同一性を使用して、例えば微生物の群集においてなど、それらが由来する細胞または細胞の集団を特徴付けることができる。試料を、例えば試料中の細胞からポリヌクレオチドを抽出するために処理する場合、種々の抽出方法が利用可能であり、その例は本明細書において提供される(例えば、本開示の種々の態様のいずれかに関して)。
【0100】
核酸試料中の配列変異体は、様々な配列変異体のいずれであってもよい。配列変異体の非限定的な多数の例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。一部の実施形態では配列変異体は、一塩基多型(SNP)である。一部の実施形態では、配列変異体は、集団内に低頻度で生じている(「稀な」配列変異体とも称される)。例えば、配列変異体は、約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.75%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.075%もしくはそれ未満、約0.05%もしくはそれ未満、約0.04%もしくはそれ未満、約0.03%もしくはそれ未満、約0.02%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、またはそれ未満の頻度で生じ得る。一部の実施形態では、配列変異体は、約0.1%またはそれ未満の頻度で生じている。
【0101】
一部の実施形態によると、試料のポリヌクレオチドを、例えばリガーゼを使用することなどによって環状化する。環状化は、ポリヌクレオチドの5’末端を、同じポリヌクレオチドの3’末端と、試料中の別のポリヌクレオチドの3’末端と、または異なる供給源からのポリヌクレオチド(例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド)の3’末端と接合することを含んでよい。一部の実施形態では、ポリヌクレオチドの5’末端を同じポリヌクレオチドの3’末端と接合する(「自己接合」とも称される)。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いるまたは用いない)、試薬(例えば、アダプターの種類、リガーゼの使用)、反応条件(例えば、有利な自己接合)、および任意選択の追加的な処理(例えば、反応後精製)の非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書において提供される。
【0102】
一般に、ポリヌクレオチドの末端を互いと接合して、環状ポリヌクレオチドを形成し(直接、または1つもしくは複数の中間のアダプターオリゴヌクレオチドを用いて)、接合部の配列を有する接合部を生じさせる。アダプターポリヌクレオチドを介してポリヌクレオチドの5’末端と3’末端を接合する場合、「接合部」という用語は、ポリヌクレオチドとアダプター(例えば、5’末端接合部または3’末端接合部の一方)の接合部、またはアダプターポリヌクレオチドによって形成され、それを含むポリヌクレオチドの5’末端と3’末端の間の接合部を指し得る。ポリヌクレオチドの5’末端と3’末端を、介在アダプターを用いずに接合する場合(例えば、一本鎖DNAの5’末端と3’末端)、「接合部」という用語は、これらの2つの末端が接合する点を指す。接合部は、接合部を含むヌクレオチドの配列(「接合部の配列」とも称される)によって同定することができる。一部の実施形態では、試料は、天然の分解プロセス(例えば、細胞溶解、細胞死、および、無細胞ポリヌクレオチドなどの、DNAが細胞からその周囲のさらに分解される可能性がある環境に放出される他のプロセスなど)、試料処理(例えば、固定、染色、および/または保管手順など)の副産物である断片化、および特定の標的配列への制限なしにDNAを切断する方法による断片化(例えば、超音波処理によるものなどの機械的な断片化;DNaseI、fragmentaseなどの非配列特異的ヌクレアーゼ処理)によって形成された末端の混合物を有するポリヌクレオチドを含む。試料が、末端の混合物を有するポリヌクレオチドを含む場合、2つのポリヌクレオチドが同じ5’末端または3’末端を有する可能性は低く、2つのポリヌクレオチドが同じ5’末端と3’末端の両方を独立に有する可能性は非常に低い。したがって、一部の実施形態では、2つのポリヌクレオチドが同じ標的配列を有する部分を含む場合であっても、接合部を使用して異なるポリヌクレオチドを区別することができる。介在アダプターを用いずにポリヌクレオチド末端を接合する場合、接合部の配列は、参照配列とアラインすることによって同定することができる。例えば、2つの成分配列の順序が参照配列と逆であると思われる場合、その逆になっていると思われる点が、その点において接合部を示し得る。1つまたは複数のアダプター配列を介してポリヌクレオチド末端を接合する場合、接合部は、公知のアダプター配列に近接していることによって、または、配列決定リードが、環状化されたポリヌクレオチドの5’末端と3’末端の両方から配列を得るのに十分な長さである場合には上記の通りアラインすることによって同定することができる。一部の実施形態では、特定の接合部の形成は、十分に稀な事象であり、したがって、試料の環状化されたポリヌクレオチドの中で独特なものである。
【0103】
環状化後、反応生成物を、サブシークエンスステップへの関与に利用可能な環状化されたポリヌクレオチドの相対的な濃度または純度を上昇させるために(例えば、環状ポリヌクレオチドの単離または反応物中の1つもしくは複数の他の分子の除去によって)、増幅または配列決定の前に精製することができる。例えば、環状化反応またはその成分を、例えば、エキソヌクレアーゼでの処理により、一本鎖(環状化されていない)ポリヌクレオチドが除去されるように処理することができる。別の例として、環状化反応またはその一部をサイズ排除クロマトグラフィーに供してもよく、それにより、少ない試薬を保持および廃棄する(例えば、未反応のアダプター)、または環状化産物を保持し、別々の体積に放出する。Zymo Research製のZymoオリゴ精製キットによって提供されるキットなどの、ライゲーション反応物を浄化するための種々のキットが利用可能である。一部の実施形態では、精製は、環状化反応に使用したリガーゼを除去もしくは分解するための処理、および/または環状化されたポリヌクレオチドをそのようなリガーゼから精製するための処理を含む。一部の実施形態では、リガーゼを分解するための処理は、プロテアーゼを用いた処理を含む。適切なプロテアーゼは、原核生物、ウイルス、および真核生物から入手可能である。プロテアーゼの例としては、プロテイナーゼK(Tritirachium albumに由来する)、プロナーゼE(Streptomyces griseusに由来する)、Bacillus polymyxaプロテアーゼ、サーモリシン(theromolysin)(好熱細菌に由来する)、トリプシン、スブチリシン、フューリンなどが挙げられる。一部の実施形態では、プロテアーゼはプロテイナーゼKである。プロテアーゼ処理は、製造業者のプロトコールに従ってもよく、標準の条件(例えば、SambrookおよびGreen、Molecular Cloning: A Laboratory Manual、第4版(2012年)において提供される)に供してもよい。プロテアーゼ処理の後に、抽出および沈殿を行うこともできる。一実施例では、環状化されたポリヌクレオチドを、0.1%SDSおよび20mMのEDTAの存在下でプロテイナーゼK(Qiagen)処理によって精製し、1:1フェノール/クロロホルムおよびクロロホルムを用いて抽出し、エタノールまたはイソプロパノールを用いて沈殿させる。一部の実施形態では、沈殿はエタノール中で行う。
【0104】
本開示の他の態様に関して記載されている通り、環状化の後に、環状化されたポリヌクレオチドの配列決定を直接続けることができる。あるいは、配列決定の前に1つまたは複数の増幅反応を行うことができる。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する種々の方法が利用可能である。増幅は、直線的なものであってもよく、指数関数的なものであってもよく、多相増幅プロセスにおいて直線位相と指数関数位相の両方を伴うものであってもよい。増幅方法は、熱変性ステップなどの温度の変化を伴ってもよく、熱変性を必要としない等温プロセスであってもよい。適切な増幅プロセスの非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。一部の実施形態では、増幅は、ローリングサークル増幅(RCA)を含む。本明細書の他の箇所に記載の通り、典型的なRCA反応混合物は、1つまたは複数のプライマー、ポリメラーゼ、およびdNTPを含み、コンカテマーを生成する。一般には、RCA反応におけるポリメラーゼは、鎖置換活性を有するポリメラーゼである。種々のそのようなポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼのないDNAポリメラーゼIの大きな(クレノウ)断片、Phi29 DNAポリメラーゼ、Taq DNAポリメラーゼなどが挙げられる。一般に、コンカテマーは、鋳型ポリヌクレオチド由来の標的配列の2つまたはそれ超のコピーを含むポリヌクレオチド増幅産物である(例えば、標的配列の約2もしくはそれ超、約3もしくはそれ超、約4もしくはそれ超、約5もしくはそれ超、約6もしくはそれ超、約7もしくはそれ超、約8もしくはそれ超、約9もしくはそれ超、約10もしくはそれ超、またはそれ超のコピー;一部の実施形態では、約2またはそれ超のコピー)。増幅プライマーは、約もしくは少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、またはそれ超のヌクレオチドなどの任意の適切な長さであってよく、その任意の部分または全てが、プライマーがハイブリダイズする対応する標的配列と相補的であってよい(例えば、約もしくは少なくとも約5、10、15、20、25、30、35、40、45、50、またはそれ超のヌクレオチド)。種々のRCAプロセスの例は、例えば、ランダムプライマー、標的特異的プライマー、およびアダプター標的化プライマーの使用など、本明細書に記載されており、そのいくつかは図7において説明されている。
【0105】
環状化されたポリヌクレオチドを、配列決定の前に増幅する場合(例えば、コンカテマーを生成するために)、増幅産物を、富化を伴わずに直接配列決定に供することもでき、1つまたは複数の富化ステップの後で配列決定に供することもできる。適切な富化プロセスの非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている(例えば、第2の増幅ステップにB2Bプライマーを使用すること)。一部の実施形態によると、環状化されたポリヌクレオチド(またはその増幅産物、場合によって富化されていてよい)を配列決定反応に供して配列決定リードを作成する。そのような方法によって生成する配列決定リードは、本明細書に開示されている他の方法に従って使用することができる。種々の配列決定方法体系、特に、ハイスループットな配列決定方法体系が利用可能である。例としては、限定することなく、Illumina製のシークエンシングシステム(HiSeq(登録商標)およびMiSeq(登録商標)などのシークエンシングシステム)、Life Technologies製のシークエンシングシステム(Ion Torrent(登録商標)、SOLiD(登録商標)など)、Roche’s 454 Life Sciences systems製のシークエンシングシステム、Pacific Biosciences systems製のシークエンシングシステムなどが挙げられる。一部の実施形態では、配列決定は、HiSeq(登録商標)およびMiSeq(登録商標)システムを使用して約50もしくはそれ超、約75もしくはそれ超、約100もしくはそれ超、約125もしくはそれ超、約150もしくはそれ超、約175もしくはそれ超、約200もしくはそれ超、約250もしくはそれ超、約300もしくはそれ超、またはそれ超のヌクレオチドの長さのリードを生成することを含む。増幅プラットフォームおよび方法体系のさらなる非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。
【0106】
一部の実施形態によると、配列決定リードと参照配列の間の配列の差異は、少なくとも2つの異なるポリヌクレオチド(例えば、異なる接合部を有する結果として区別することができる2つの異なる環状ポリヌクレオチド)において生じている場合、真性配列変異体としてコールされる(例えば、増幅または配列決定の前に試料中に存在し、これらのプロセスのいずれの結果でもない)。増幅または配列決定誤差の結果である配列変異体は、同じ標的配列を含む2つの異なるポリヌクレオチドにおいて正確に重複する可能性は低いので(例えば、位置および種類)、この検証パラメータを追加することにより、誤った配列変異体のバックグラウンドが著しく低下し、同時に、試料中の実際の配列変異を検出する感度および正確度が上昇する。一部の実施形態では、頻度が約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.75%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.075%もしくはそれ未満、約0.05%もしくはそれ未満、約0.04%もしくはそれ未満、約0.03%もしくはそれ未満、約0.02%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、またはそれ未満である配列変異体は、正確なコールを許容するためのバックグラウンドを十分に超える。一部の実施形態では、配列変異体は、約0.1%またはそれ未満の頻度で生じている。一部の実施形態では、方法は、頻度が約0.0005%〜約3%の範囲、例えば、0.001%〜2%、または0.01%〜1%である配列の差異を真性配列変異体としてコールするステップを含む。一部の実施形態では、配列変異体の頻度は、そのような頻度が、バックグラウンド誤差率を統計的に有意に上回る場合(例えば、約0.05もしくはそれ未満、約0.01もしくはそれ未満、約0.001もしくはそれ未満、約0.0001もしくはそれ未満、またはそれ未満のp値)、バックグラウンドを十分に超える。一部の実施形態では、配列変異体の頻度は、そのような頻度が、バックグラウンド誤差率を約もしくは少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、またはそれ超上回る(例えば、少なくとも5倍高い)場合、バックグラウンドを十分に超える。一部の実施形態では、所与の位置における配列を正確に決定することにおけるバックグラウンド誤差率は、約1%もしくはそれ未満、約0.5%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.01%もしくはそれ未満、約0.005%もしくはそれ未満、約0.001%もしくはそれ未満、約0.0005%もしくはそれ未満、またはそれ未満である。一部の実施形態では、誤差率は0.001%未満である。頻度および誤差率を決定するための方法は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。
【0107】
一部の実施形態では、真性配列変異体の同定(「コール」または「コールを行う」とも称される)は、1つまたは複数の配列決定リードを参照配列と最適にアラインして、2つの間の差異を同定すると共に、接合部を同定することを含む。一般に、アラインメントは、1つの配列を別の配列に沿って置き、各配列に沿ってギャップを繰り返し導入し、2つの配列がどれくらいよくマッチするかをスコアリングし、好ましくは様々な位置に関して参照に沿って反復することを伴う。最も良いスコアリングのマッチが、アラインされたとみなされ、配列間の関係のおよその程度の推測を表す。それらを実行する種々のアラインメントアルゴリズムおよびアライナーが利用可能であり、その非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。一部の実施形態では、配列決定リードを比較する参照配列は、参照ゲノムなどの既知の参照配列である(例えば、対象と同じ種のメンバーのゲノム)。参照ゲノムは、完全であっても不完全であってもよい。一部の実施形態では、参照ゲノムは、参照ゲノムに由来するものまたは解析中の配列決定リードから作製したコンセンサスに由来するものなどの、標的ポリヌクレオチドを含有する領域のみからなる。一部の実施形態では、参照配列は、1つもしくは複数の細菌、古細菌、ウイルス、原生生物、真菌、または他の生物体に由来する配列などの、1つまたは複数の生物体のポリヌクレオチドの配列を含む、またはそれからなる。一部の実施形態では、参照配列は、解析中の1つまたは複数の標的配列(例えば、1つもしくは複数の遺伝子、またはその一部)に対応する領域などの、参照ゲノムの一部のみからなる。例えば、病原体の検出(例えば、汚染検出の場合など)に関しては、参照ゲノムは、病原体(例えば、HIV、HPV、または有害な細菌株、例えば、E.coli)のゲノム全体、または、特定の株もしくは血清型などの、同定において有用なその一部である。一部の実施形態では、例えば、多数の異なる生物体または株をスクリーニングするためになど、配列決定リードを多数の異なる参照配列とアラインする。比較して配列の差異を同定すること(および配列変異体をコールすること)ができる参照配列のさらなる非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。
【0108】
一態様では、本開示は、反応混合物において標的配列の2つまたはそれ超のコピーを含む複数の異なるコンカテマーを増幅する方法であって、標的配列が、5’から3’の方向に配向された配列Aおよび配列Bを含む方法を提供する。一部の実施形態では、方法は、反応混合物を核酸増幅反応に供するステップを含み、反応混合物は、(a)複数のコンカテマーであって、前記複数の個々のコンカテマーが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む複数のコンカテマー;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。
【0109】
関連する態様では、本開示は、反応混合物において、5’から3’の方向に配向された配列Aおよび配列Bを含む標的配列を含む複数の異なる環状ポリヌクレオチドを増幅する方法を提供する。一部の実施形態では、方法は、反応混合物を核酸増幅反応に供するステップを含み、反応混合物は、(a)複数の環状ポリヌクレオチドであって、前記複数の個々の環状ポリヌクレオチドが、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む複数の環状ポリヌクレオチド;(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、配列BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、配列Aおよび配列Bは内因性配列であり、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。
【0110】
環状ポリヌクレオチドまたはコンカテマーのいずれを増幅するかにかかわらず、そのようなポリヌクレオチドは、任意の適切な試料供給源に由来するものであってよい(直接、または増幅によるなどの間接的のいずれか)。種々の適切な試料供給源、任意選択の抽出プロセス、ポリヌクレオチドの種類、および配列変異体の種類は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。環状ポリヌクレオチドは、非環状ポリヌクレオチドの環状化に由来するものであってよい。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いる、および用いない)、試薬(例えば、アダプターの種類、リガーゼの使用)、反応条件(例えば、有利な自己接合)、任意選択の追加的な処理(例えば、反応後精製)、およびそれにより形成される接合部の非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書において提供される。コンカテマーは、環状ポリヌクレオチドの増幅に由来するものであってよい。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する種々の方法が利用可能であり、その非限定的な例は本明細書にも記載されている。一部の実施形態では、コンカテマーは、環状ポリヌクレオチドのローリングサークル増幅によって作製される。
【0111】
図10は、単一の反復(一般には環状でなければ増幅されない)、および標的配列の多数のコピーを含むコンカテマーに関して、標的配列に対する第1および第2のプライマーの配置の例を説明する。本明細書に記載の他の態様に関して記載されている通り、プライマーのこの配置は、「背中合わせ」(B2B)または「逆方向」プライマーと称することができる。B2Bプライマーを用いた増幅により、環状および/またはコンカテマー鋳型の富化が容易になる。さらに、この方向を比較的小さなフットプリント(プライマー対が及ぶ総距離)と組み合わせることにより、接合部が、典型的な増幅反応において見いだされるプライマーの配置(互いに面し、標的配列に及ぶ)におけるものよりも、プライマー間に生じている可能性が低いので、標的配列の周囲の様々な断片化事象の増幅が可能になる。一部の実施形態では、配列Aの5’末端と配列Bの3’末端の間の距離は、約200もしくはそれ未満、約150もしくはそれ未満、約100もしくはそれ未満、約75もしくはそれ未満、約50もしくはそれ未満、約40もしくはそれ未満、約30もしくはそれ未満、約25もしくはそれ未満、約20もしくはそれ未満、約15もしくはそれ未満、またはそれ未満のヌクレオチドである。一部の実施形態では、配列Aは配列Bの相補体である。一部の実施形態では、複数の異なる標的配列を対象とする多数のB2Bプライマー対を同じ反応において使用して、複数の異なる標的配列を並行して増幅する(例えば、約もしくは少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、またはそれ超の異なる標的配列)。プライマーは、本明細書の他の箇所に記載されているものなどの任意の適切な長さであってよい。増幅は、本明細書に記載の増幅反応などの、適切な条件下での任意の適切な増幅反応を含んでよい。一部の実施形態では、増幅は、ポリメラーゼ連鎖反応である。
【0112】
一部の実施形態では、B2Bプライマーは、少なくとも2つの配列エレメント、標的配列と配列相補性によってハイブリダイズする第1のエレメント、および、第1のエレメントがハイブリダイズする第1のハイブリダイゼーション温度における第1の増幅相の間に標的配列とハイブリダイズしない(例えば、尾部と、標的配列の第1のエレメントが結合する場所に対してすぐ3’側の部分の間の配列相補性の欠如に起因して)、5’「尾部」を含む。例えば、第1のプライマーは、配列A’に対して5’側に配列Cを含み、第2のプライマーは、配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも複数のコンカテマー(または環状ポリヌクレオチド)とハイブリダイズしない。そのような有尾プライマーを使用する一部の実施形態では、増幅は、第1の相および第2の相を含んでよく、第1の相は、第1の温度におけるハイブリダイゼーションステップであって、その間に第1および第2のプライマーがコンカテマー(または環状ポリヌクレオチド)とハイブリダイズするハイブリダイゼーションステップ、およびプライマー伸長を含み、第2の相は、第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップであって、その間に、第1および第2のプライマーが伸長した第1もしくは第2のプライマー、またはその相補体を含む増幅産物とハイブリダイズするハイブリダイゼーションステップ、およびプライマー伸長を含む。2つの温度のそれぞれにおける増幅サイクルの数は、所望の産物に基づいて調整することができる。一般には、第1の温度は、約15もしくはそれ未満、約10もしくはそれ未満、約9もしくはそれ未満、約8もしくはそれ未満、約7もしくはそれ未満、約6もしくはそれ未満、約5もしくはそれ未満またはそれ未満のサイクルなどの比較的少ないサイクル数に対して使用される。高温におけるサイクルの数は、第1の温度におけるサイクルの数とは独立して選択することができるが、一般には、約もしくは少なくとも約5、6、7、8、9、10、15、20、25、またはそれ超のサイクルなどの、多くのまたはより多くのサイクルになる。高温では、第1のエレメントとプライマー伸長産物におけるプライマーの尾部エレメントの間のハイブリダイゼーションが、プライマー内の第1のエレメントのみとコンカテマー内の内部標的配列とのハイブリダイゼーションによって形成される短い断片よりも有利である。したがって、二相増幅を使用して、そうでなければ短い増幅産物が有利になり得る程度を低下させ、それにより、標的配列の2つまたはそれ超のコピーを有する増幅産物の比較的高い割合を維持することができる。例えば、第2の温度におけるハイブリダイゼーションおよびプライマー伸長を5サイクル(例えば、少なくとも5、6、7、8、9、10、15、20、またはそれ超のサイクル)行った後に、反応混合物中の増幅されたポリヌクレオチドの少なくとも5%(例えば、少なくとも5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、またはそれ超)が、標的配列の2つまたはそれ超のコピーを含む。この二相の有尾B2Bプライマー増幅プロセスに従ったある実施形態の図が図11において説明されている。
【0113】
一部の実施形態では、増幅は、コンカテマー由来のアンプリコンの長さが増大するように偏った条件下でのものである。例えば、プライマー濃度を低下させることができ、したがって、全てではないプライミング部位がプライマーとハイブリダイズし、したがってPCR産物がより長くなる。同様に、サイクル中のプライマーハイブリダイゼーション時間を減少させることにより、同様に、より少ないプライマーがハイブリダイズすることが可能になり、したがって、平均PCRアンプリコンサイズも増加する。さらに、サイクルの温度および/または伸長時間を増大させることにより、同様に、PCRアンプリコンの平均長が増加する。これらの技法の任意の組合せを使用することができる。
【0114】
一部の実施形態では、特に、B2Bプライマーを用いた増幅を実施した場合には、増幅産物を、生じたアンプリコンがサイズに基づいて選別されるように処理して、コンカテマーを含む単量体混合物の数を減少させ、かつ/または排除する。これは、これらに限定されないが、ゲルからの断片の切り出しおよびゲル濾過(例えば、約300、400、500、またはそれ超のヌクレオチドの長さよりも大きな断片を富化するため);ならびに結合緩衝液の濃度を細かく調整することによってサイズ選択するためのSPRIビーズ(Agencourt AMPure XP)を含めた種々の利用可能な技法を使用して行うことができる。例えば、DNA断片との混合の間に0.6×結合緩衝液の使用を使用して、約500塩基対(bp)よりも大きなDNA断片を優先的に結合させることができる。
【0115】
一部の実施形態では、第1のプライマーは配列A’に対して5’側に配列Cを含み、第2のプライマーは配列Bに対して5’側に配列Dを含み、第1のハイブリダイゼーション温度における第1の増幅相の間、配列Cも配列Dも複数の環状ポリヌクレオチドとハイブリダイズしない。増幅は、第1の相および第2の相を含んでよく、第1の相は、第1の温度におけるハイブリダイゼーションステップを含み、その間に、プライマー伸長の前に第1および第2のプライマーが環状ポリヌクレオチドまたはその増幅産物とハイブリダイズし、第2の相は、第1の温度よりも高い第2の温度におけるハイブリダイゼーションステップを含み、その間に、第1および第2のプライマーが、伸長した第1もしくは第2のプライマーまたはその相補体を含む増幅産物とハイブリダイズする。例えば、第1の温度は、およそ配列A’のTmもしくはそれ超、およそ配列BのTmもしくはそれ超、またはおよそこれらの平均もしくはそれ超、またはこれらのTmのうちの1つよりも1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃高い、またはそれ超の温度として選択することができる。この例では、第2の温度は、およそ組合せ配列(A’+C)のTmもしくはそれ超、およそ組合せ配列(B+D)のTmもしくはそれ超、またはおよそこれらの平均もしくはそれ超、またはこれらのTmのうちの1つよりも1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃高い、もしくはそれ超の温度になるように選択することができる。「Tm」という用語は、「融解温度」とも称され、一般に、参照配列からなるオリゴヌクレオチドの50%(実際にはより大きなポリヌクレオチド内のサブ配列であってよい)とその相補配列がハイブリダイズする(または分離する)温度を表す。一般に、Tmは、長さが増大するにしたがって上昇し、したがって、配列A’のTmは、組合せ配列(A’+C)のTmよりも低いことが予想される。
【0116】
一態様では、本開示は、本開示の方法に従って方法を実施するための反応混合物を提供する。反応混合物は、本明細書に記載の方法に記載されている反応混合物を含めた、種々の方法のいずれかに関して本明細書に記載されている種々の成分のうちの1つまたは複数を含んでよい。一部の実施形態では、反応混合物は、標的配列の2つもしくはそれ超のコピーを含む複数の異なるコンカテマー、または標的配列の1つもしくは複数のコピーを含む環状ポリヌクレオチド(例えば、環状単量体)を増幅するための混合物であり、ここで、標的配列は、5’から3’の方向に配向された配列Aおよび配列Bを含み、反応混合物は、(a)複数のコンカテマー(または環状ポリヌクレオチド)であって、前記複数の個々のコンカテマー(または環状ポリヌクレオチド)が、5’末端および3’末端を有する個々のポリヌクレオチドを環状化することによって形成された異なる接合部を含む、複数のコンカテマー(または環状ポリヌクレオチド);(b)配列A’を含む第1のプライマーであって、標的配列の配列Aと、配列Aと配列A’の間の配列相補性によって特異的にハイブリダイズする第1のプライマー;(c)配列Bを含む第2のプライマーであって、標的配列の相補体を含む相補的なポリヌクレオチド内に存在する配列B’と、BとB’の間の配列相補性によって特異的にハイブリダイズする第2のプライマー;ならびに(d)第1のプライマーおよび第2のプライマーを伸長させて、増幅されたポリヌクレオチドを生成するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端の間の距離は75ntまたはそれ未満である。試料、ポリヌクレオチド、プライマー、ポリメラーゼ、他の試薬、および反応条件は、例えば種々の態様のいずれかに関してなど、本明細書に記載されているもののいずれであってもよく、これらは、任意の適切な組合せで反応混合物に含めることができる。一部の実施形態では、第1のプライマーは配列A’に対して5’側に配列Cを含み、第2のプライマーは配列Bに対して5’側に配列Dを含み、増幅反応の第1の増幅ステップの間、配列Cも配列Dも2つまたはそれ超のコンカテマーとハイブリダイズしない。
【0117】
一態様では、本開示は、例えば、本開示の種々の他の態様のいずれかにおいてなど、本明細書に記載の方法において有用であるまたはそれによって生成する組成物を提供する。一部の実施形態では、組成物は、一本鎖であり、リガーゼを実質的に含まない複数の環状化されたポリヌクレオチドを含む。一部の実施形態では、組成物は、10000またはそれ未満の標的ポリヌクレオチドの群に対応する複数のコンカテマーを含み、さらに、複数の個々のコンカテマーは、(a)配列反復の2つまたはそれ超のコピーを含み、前記コピーの全てが同じ標的ポリヌクレオチドに対応すること、および(b)前記組成物中の1つの個々のコンカテマーの配列反復の2つまたはそれ超のコピー間の接合部が別の個々のコンカテマーのものとは異なることを特徴とする。試料、ポリヌクレオチド、プライマー、ポリメラーゼ、および他の試薬は、例えば種々の態様のいずれかに関してなど、本明細書に記載されているもののいずれであってもよく、これらは、任意の適切な組合せで組成物に含めることができる。組成物は、1つまたは複数の標的配列が増幅されるように設計された、本明細書に記載のB2Bプライマーなどの1つまたは複数のプライマー対を含んでよい。組成物は、キットの形態で提供することができる。キット中の試薬および他の材料は、任意の適切な容器に含有されていてよく、また、すぐに使用可能な形態であってもよく、キット中の他の試薬または使用者から供給される試薬と組み合わせること(例えば、濃縮した組成物の希釈または凍結乾燥した組成物の再構成)が必要であってもよい。キットにより緩衝液を提供することができ、その非限定的な例としては、炭酸ナトリウム緩衝液、炭酸水素ナトリウム緩衝液、ホウ酸緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液、およびこれらの組合せが挙げられる。キットは、種々の態様のいずれかに関して本明細書に記載されている1つまたは複数の方法を実施するための説明書をさらに含んでよい。説明書は、1種または複数種の言語(例えば、2種、3種、4種、5種、またはそれ超の言語)で提供されてよい。
【0118】
一態様では、本開示は、配列変異体を検出するためのシステムを提供する。一部の実施形態では、システムは、(a)試料に対する検出反応を実施するための使用者要求を受信するように構成されたコンピュータ;(b)使用者要求に応答して試料またはその一部に対する核酸増幅反応を実施する増幅システムであって、増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)環状ポリヌクレオチドを増幅するステップとを含む増幅システム;(c)増幅システムによって増幅されたポリヌクレオチドの配列決定リードを作成し、配列決定リードと参照配列の間の配列の差異を同定し、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするシークエンシングシステム;および(d)受信者に報告を送信する報告作成プログラムであって、報告が、配列変異体の検出の結果を含有する報告作成プログラムを含む。一部の実施形態では、受信者は使用者である。図32は、本開示の方法において有用なシステムの非限定的な例を説明する。
【0119】
本システムにおいて使用するためのコンピュータは、1つまたは複数のプロセッサを含んでよい。プロセッサは、1つまたは複数の制御器、算出ユニット、および/またはコンピュータシステムの他のユニットを伴ってもよく、ファームウェアに所望の通り埋め込まれていてもよい。ソフトウェアで実行される場合、ルーティンは、RAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク(登録商標)、または他の適切な記憶媒体などの任意のコンピュータ可読メモリに記憶させることができる。同様に、このソフトウェアは、例えば、電話線、インターネット、無線接続などの通信チャネルを通して、またはコンピュータ可読ディスク、フラッシュドライブなどの可搬型媒体を介してなどを含めた任意の公知の送達方法によってコンピューティングデバイスに送達することができる。種々のステップは、種々のブロック、操作、ツール、モジュールおよび技法として実行することができ、それらは、今度は、ハードウェア、ファームウェア、ソフトウェア、またはハードウェア、ファームウェア、および/もしくはソフトウェアの任意の組合せで実行することができる。ハードウェアで実行する場合、ブロック、操作、技法などの一部または全部は、例えば、カスタム集積回路(IC)、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、プログラマブルロジックアレイ(PLA)などで実行することができる。クライアント−サーバー、リレーショナルデータベースアーキテクチャを当該システムの実施形態において使用することができる。クライアント−サーバーアーキテクチャは、ネットワーク上の各コンピュータまたはプロセスがクライアントまたはサーバーのいずれかであるネットワークアーキテクチャである。サーバーコンピュータは一般には、ディスクドライブ(ファイルサーバー)、プリンター(プリントサーバー)、またはネットワークトラフィック(ネットワークサーバー)の管理専用の強力なコンピュータである。クライアントコンピュータは、PC(パーソナルコンピュータ)または使用者がアプリケーションを実行するワークステーション、ならびに本明細書に開示されている出力デバイスの例を含む。クライアントコンピュータは、ファイル、デバイス、さらには処理能力などのリソースについてサーバーコンピュータに依拠する。一部の実施形態では、サーバーコンピュータは、データベース機能の全てを取り扱う。クライアントコンピュータは、フロントエンドデータ管理の全てを取り扱い、また、使用者からのデータ入力を受けることもできるソフトウェアを有してよい。
【0120】
当該システムは、試料に対する検出反応を実施するための使用者要求を受信するように構成することができる。使用者要求は、直接的であっても間接的であってもよい。直接要求の例としては、キーボード、マウス、またはタッチスクリーン)などの入力デバイスを介して伝達されるものが挙げられる。間接的な要求の例としては、インターネットを通して(有線または無線のいずれか)などの、通信媒体を介した伝達が挙げられる。
【0121】
システムは、使用者要求に応答して試料またはその一部に対する核酸増幅反応を実施する増幅システムをさらに含んでよい。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する種々の方法が利用可能である。増幅は、直線的なものであってもよく、指数関数的なものであってもよく、多相増幅プロセスにおいて直線位相と指数関数位相の両方を伴うものであってもよい。増幅方法は、熱変性ステップなどの温度の変化を伴ってもよく、熱変性を必要としない等温プロセスであってもよい。適切な増幅プロセスの非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。一部の実施形態では、増幅は、ローリングサークル増幅(RCA)を含む。ポリヌクレオチドを増幅するための種々のシステムが利用可能であり、実施される増幅反応の種類に基づいて変動し得る。例えば、温度変化のサイクルを含む増幅方法に関しては、増幅システムは、サーモサイクラーを含んでよい。増幅システムは、Applied Biosystems製、Roche製、およびStrategene製のシステムなどのリアルタイム増幅および検出計器を含んでよい。一部の実施形態では、増幅反応は、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)環状ポリヌクレオチドを増幅するステップとを含む。試料、ポリヌクレオチド、プライマー、ポリメラーゼ、および他の試薬は、例えば種々の態様のいずれかに関してなど、本明細書に記載されているもののいずれであってもよい。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いる、および用いない)、試薬(例えば、アダプターの種類、リガーゼの使用)、反応条件(例えば、有利な自己接合)、任意選択の追加的な処理(例えば、反応後精製)、およびそれにより形成される接合部の非限定的な例は、例えば本開示の種々の態様のいずれかに関してなど、本明細書において提供される。システムは、任意のそのような方法が実行されるように選択および/または設計することができる。
【0122】
システムは、増幅システムによって増幅されたポリヌクレオチドの配列決定リードを作成し、配列決定リードと参照配列の間の配列の差異を同定し、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするシークエンシングシステムをさらに含んでよい。シークエンシングシステムおよび増幅システムは同じであってもよく、重複した機器を含んでもよい。例えば、増幅システムとシークエンシングシステムの両方で同じサーモサイクラーを利用することができる。当該システムにおいて使用するための種々の配列決定プラットフォームが利用可能であり、選択された配列決定方法に基づいて選択することができる。配列決定方法の例は、本明細書に記載されている。増幅および配列決定は、リキッドハンドラーの使用を伴ってよい。これらのプロセスの自動化を行うために、いくつかの市販の液体取扱いシステムを利用することができる(例えば、例として、Perkin−Elmer、Beckman Coulter、Caliper Life Sciences、Tecan、Eppendorf、Apricot Design、Velocity 11からのリキッドハンドラーを参照されたい)。種々の自動化された配列決定機が市販されており、それらとして、Life Technologies製のシークエンサー(SOLiDプラットフォーム、およびpHに基づく検出)、Roche製のシークエンサー(454プラットフォーム)、Illumina製のシークエンサー(例えば、フローセルに基づくシステム、例えば、Genome Analyzerデバイスなど)が挙げられる。2つ、3つ、4つ、5つ、またはそれ超の自動化されたデバイス間(例えば、リキッドハンドラーおよび配列決定デバイスのうちの1つまたは複数間)の移行は手動であっても自動化されていてもよい。
【0123】
参照配列に対する配列の差異を同定し、配列変異体をコールするための方法は、例えば本開示の種々の態様のいずれかに関してなど、本明細書に記載されている。シークエンシングシステムは、一般には、配列決定データの入力および所望のパラメータ(例えば、参照ゲノムの選択)の入力に応答してこれらのステップを実施するためのソフトウェアを含む。これらのアルゴリズムを実行するアラインメントアルゴリズムおよびアライナーの例は、本明細書に記載されており、シークエンシングシステムの一部を形成してよい。
【0124】
システムは、受信者に報告を送信する報告作成プログラムであって、報告が、配列変異体の検出の結果を含有する報告作成プログラムをさらに含んでよい。報告は、例えば、配列決定リードの間または配列決定データの解析と同時になど、プロセスの進行にしたがって周期的に更新しながらリアルタイムで作成することができる。それに加えて、またはその代わりに、報告は、解析の終了時に作成することができる。報告は、シークエンシングシステムにより全ての配列変異体をコールするステップが完了した時などに自動的に作成することができる。一部の実施形態では、報告は、使用者の指示に応じて作成される。配列変異体の検出の結果に加えて、報告は、1つまたは複数の配列変異体に基づく解析も含有してよい。例えば、1つまたは複数の配列変異体が特定の汚染物質または表現型に関連する場合、報告は、その汚染物質または表現型が存在する可能性、どんなレベルであるかなどの、この関連にかかわる情報、および場合によってこの情報に基づく提案(例えば、追加的な試験、モニタリング、または矯正措置)を含んでよい。報告は、種々の形態のいずれをとってもよい。本開示に関するデータは、受信者による受領および/または再調査のためのこのようなネットワークまたは接続(または、これに限定されないが、プリントアウトなどの物理的な報告を郵送することを含めた、情報を伝達するための任意の他の適切な手段)を通じて伝達することができることが構想される。受信者は、これらに限定されないが、個人、または電子システム(例えば、1つもしくは複数のコンピュータ、および/または1つもしくは複数のサーバー)であり得る。
【0125】
一態様では、本開示は、1つまたは複数のプロセッサにより実行されると、配列変異体を検出する方法を実行するコードを含むコンピュータ可読媒体を提供する。一部の実施形態では、実行される方法は、(a)試料に対する検出反応を実施するための顧客要求を受信するステップと、(b)顧客要求に応答して試料またはその一部に対する核酸増幅反応を実施するステップであって、増幅反応が、(i)個々のポリヌクレオチドを環状化して、それぞれが5’末端と3’末端の間に接合部を有する複数の環状ポリヌクレオチドを形成するステップと、(ii)環状ポリヌクレオチドを増幅するステップとを含むステップと、(c)(i)増幅反応において増幅されたポリヌクレオチドの配列決定リードを作成するステップと、(ii)配列決定リードと参照配列の間の配列の差異を同定するステップと、(iii)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドにおいて生じている配列の差異を配列変異体としてコールするステップとを含む配列決定解析を実施するステップと、(d)配列変異体の検出の結果を含有する報告を作成するステップとを含む。
【0126】
コンピュータにより実行可能なコードを含む機械可読媒体は、これらに限定されないが、有形記憶媒体、搬送波媒体または物理的な伝達媒体を含めた多くの形態をとってよい。非揮発性記憶媒体としては、例えば、任意のコンピュータ内のストレージデバイスのいずれかなどの光学または磁気ディスクなど、例えば、データベースを実行するために使用できるものなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝達媒体としては、コンピュータシステム内のバスを含むワイヤーを含めた同軸ケーブル;銅線および光ファイバーが挙げられる。搬送波伝送媒体は、高周波(RF)および赤外(IR)データ通信の間に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとってよい。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD−ROM、DVDもしくはDVD−ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを用いた任意の他の物理的な記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH−EPROM、任意の他のメモリチップもしくはカートリッジ、搬送波移送データもしくは指示、そのような搬送波を移送するケーブルもしくはリンク、または、コンピュータによりプログラミングコードおよび/もしくはデータを読み取ることができる任意の他の媒体が挙げられる。これらのコンピュータ可読媒体の形態の多くは、1つまたは複数の連続した1つまたは複数の指示を実行のためにプロセッサに伝えることに関与する可能性がある。
【0127】
主題のコンピュータにより実行可能なコードは、サーバー、PC、またはスマートフォンもしくはタブレットなどの可動性デバイスを含めた、プロセッサを含む任意の適切なデバイスで実行することができる。任意の制御器またはコンピュータは、場合によってモニターを含み、これは、ブラウン管(「CRT」)ディスプレイ、フラットパネルディスプレイ(例えば、アクティブ・マトリクス型液晶ディスプレイ、液晶ディスプレイなど)、または他のものであってよい。コンピュータ回路網は、多くの場合、箱の中に配置され、マイクロプロセッサ、メモリ、インターフェース回路、およびその他などの多数の集積回路チップを含む。箱は、場合によって、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、書き込み可能CD−ROMなどの大容量リムーバブルドライブ、および他の一般的な周辺要素も含む。場合によって、キーボード、マウス、またはタッチセンシティブスクリーンなどの入力デバイスにより、使用者からの入力がもたらされる。コンピュータは、使用者指示を、パラメータフィールドのセット、例えば、GUIへの使用者入力の形態で、または予めプログラムされた指示、例えば、種々の異なる特定の操作に関して予めプログラムされた指示の形態でのいずれかで受信する適切なソフトウェアを含んでよい。
【0128】
本明細書に開示されている種々の態様のいずれかの一部の実施形態では、方法、組成物、およびシステムは、例えば、患者試料の特徴付けおよび場合によって対象の状態の診断においてなど、治療に適用される。治療への適用は、本明細書に記載の方法の結果に基づいて、患者が最も応答する療法の選択を通知すること(「セラノスティクス」とも称される)、およびそれを必要とする対象の実際の治療も含み得る。具体的には、本明細書に開示されている方法および組成物は、特に、解析されるポリヌクレオチドが、cfDNA、ctDNA、または断片化された腫瘍DNAを含む、またはそれからなる場合に、腫瘍の存在、腫瘍の進行および/または転移を診断するために使用することができる。一部の実施形態では、対象を治療の有効性についてモニターする。例えば、ctDNAを経時的にモニターすることにより、ctDNAの減少を効果的な治療の指標として使用することができ、一方、ctDNAの増加により、異なる治療または異なる投与量の選択を容易にすることができる。他の使用としては、移植レシピエントにおける臓器拒絶反応の評価(移植ドナーゲノムに対応する循環DNAの量の上昇が移植片拒絶反応の初期指標として使用される場合)、およびウイルスまたは細菌感染などの病原体感染の遺伝子型決定/アイソタイピングが挙げられる。循環胎児DNAにおける配列変異体の検出を使用して、胎児の状態を診断することができる。
【0129】
本明細書で使用される場合、「治療(treatment)」または「治療すること(treating)」または「緩和すること(palliating)」または「好転させること(ameliorating)」は、互換的に使用される。これらの用語は、これらに限定されないが、治療的利益および/または予防的利益を含めた、有益なまたは所望の結果を得るための手法を指す。治療的利益とは、治療中の1つまたは複数の疾患、状態、または症状における任意の治療上関連する改善、または治療中の1つまたは複数の疾患、状態、または症状に対する任意の治療上関連する効果を意味する。予防的利益のために、特定の疾患、状態、もしくは症状が発生するリスクがある対象、または、疾患、状態、もしくは症状はまだ顕在化していない可能性があるにもかかわらず、当該疾患の生理症状のうちの1つまたは複数が報告されている対象に組成物を投与することができる。一般には、予防的利益は、治療中の1つまたは複数の疾患、状態、または症状の発生率および/または悪化を低下させることを含む(例えば、治療を受けた集団と治療を受けていない集団の間、または対象の治療を受けた状態と治療を受けていない状態の間で)。治療転帰の改善は、対象を、1種もしくは複数種の治療剤での治療、または他の治療介入(例えば、外科手術など)から利益を得るまたは得ない対象と同定するために対象の状態を診断することを含んでよい。そのような診断への適用では、1種または複数種の治療剤を用いた上首尾の治療の全体率を、本開示の方法に従った診断を伴わずに群分けされた患者の中でのその効果と比較して改善することができる(例えば、治療有効性の測定値の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、またはそれ超の改善)。
【0130】
「対象」、「個体」および「患者」という用語は、本明細書では、互換的に使用され、脊椎動物、好ましくは哺乳動物、より好ましくはヒトを指す。哺乳動物としては、これらに限定されないが、マウス、サル、ヒト、農場動物、競技動物、および愛玩動物が挙げられる。in vivoにおいて得られたまたはin vitroにおいて培養された生物学的実体の組織、細胞、およびそれらの後代も包含される。
【0131】
「治療剤(therapeutic agent)」、「治療能のある薬剤(therapeutic capable agent)」または「処置用薬剤(treatment agent)」という用語は、互換的に使用され、対象に投与されると、なんらかの有益な効果を付与する分子または化合物を指す。有益な効果としては、診断的決定の実施可能性;疾患、症状、障害、または病的状態の好転;疾患、症状、障害または状態の発症の低下または予防;および一般に、疾患、症状、障害または病的状態の相殺が挙げられる。
【0132】
本明細書に記載の種々の方法の一部の実施形態では、試料は対象由来のものである。対象は、任意の生物体であってよく、その非限定的な例としては、植物、動物、真菌、原生生物、モネラ界の生物、ウイルス、ミトコンドリア、および葉緑体が挙げられる。試料ポリヌクレオチドは、例えば、培養細胞株、生検、血液試料、頬スワブ、または細胞を含有する流体試料(例えば、唾液)を含めた、細胞試料、組織試料、体液試料、もしくは臓器試料(またはこれらのいずれかに由来する細胞培養物)など、対象から単離することができる。いくつかの場合には、試料は、インタクトな細胞を含まないか、処理して細胞を除去するか、または細胞抽出ステップ(例えば、無細胞ポリヌクレオチドを単離するため、無細胞DNAなど)を伴わずにポリヌクレオチドを単離する。試料供給源の他の例としては、血液、尿、糞便、鼻孔、肺、消化管、他の体液もしくは排泄物に由来するもの、それらに由来する材料、またはそれらの組合せが挙げられる。対象は、これらに限定されないが、ウシ、ブタ、マウス、ラット、ニワトリ、ネコ、イヌなどを含めた動物であってよく、通常、ヒトなどの哺乳動物である。一部の実施形態では、試料は、対象由来の腫瘍組織の試料中のものなどの腫瘍細胞を含む。一部の実施形態では、試料は、血液試料またはその一部(例えば、血漿または血清)である。血清および血漿は、そのような組織の中でも、悪性細胞死率が高いことに関連付けられる腫瘍DNAの相対的な富化に起因して、特に興味深い場合がある。試料は新鮮な試料であってもよく、1つまたは複数の保存プロセスに供された試料(例えば、パラフィン包埋試料、特に、ホルマリン固定パラフィン包埋(FFPE)試料)であってもよい。一部の実施形態では、単一の個体由来の試料を多数の別々の試料(例えば、2、3、4、5、6、7、8、9、10、またはそれ超の別々の試料)に分け、それらを、独立に、2連、3連、4連、またはそれ超の分析などの、本開示の方法に供する。試料が対象に由来する場合、参照配列も、分析中の試料由来のコンセンサス配列、または同じ対象の別の試料もしくは組織由来のポリヌクレオチドの配列などの、対象に由来するものであってよい。例えば、血液試料をctDNA突然変異に関して分析することができ、別の試料(例えば、頬側または皮膚試料)由来の細胞内DNAを、参照配列を決定するために分析する。
【0133】
ポリヌクレオチドは、任意の適切な方法に従って、試料中の細胞からの抽出を伴ってまたは伴わずに試料から抽出することができる。ポリヌクレオチドを抽出するために種々のキットが利用可能であり、その選択は、試料の種類、または単離される核酸の種類に左右され得る。抽出方法の例は、本明細書に開示されている種々の態様のいずれかに関して記載されているものなど、本明細書において提供される。一例では、試料は、EDTAチューブ(例えば、BDバキュテナー)中に採取された試料などの血液試料であってよい。血漿は、末梢血液細胞から遠心分離によって(例えば、4℃、1900×gで10分)分離することができる。血液試料6mLに対してこのように実施する血漿分離では、一般には、血漿2.5〜3mLが得られる。循環無細胞DNAは、例えば、QIAmp Circulating Nucleic Acid Kit(Qiagene)を製造業者のプロトコールに従って使用することによって、血漿試料から抽出することができる。次いで、DNAを数量化することができる(例えば、Agilent 2100 Bioanalyzer with High Sensitivity DNA kit(Agilent)において)。例として、健康な人由来のそのような血漿試料からの循環DNAの収量は、血漿1mL当たり1ngから10ngまでにわたり得、がん患者試料ではそれよりも有意に多い。
【0134】
ポリヌクレオチドは、凍結または保管試料などの貯蔵試料に由来するものであってもよい。試料を貯蔵するための1つの一般的な方法は、それらをホルマリン固定し、パラフィン包埋することである。しかし、このプロセスには、核酸の分解も伴う。FFPE試料から処理し、分析したポリヌクレオチドは、50〜200塩基対の範囲、またはより短い断片などの短いポリヌクレオチドを含み得る。固定しパラフィン包埋した試料から核酸を精製するための技法は、例えば、WO2007133703に記載されているもの、ならびにFossら、Diagnostic Molecular Pathology、(1994年)3巻:148〜155頁およびPaska, C.ら、Diagnostic Molecular Pathology、(2004年)13巻:234〜240頁により記載されている方法など、いくつか存在する。AmbionのRecoverall Total Nucleic acid Isolation kitなどの市販のキットを、FFPE試料からポリヌクレオチドを精製するために使用することができる。典型的な方法は、キシレンまたは他の有機溶媒を用いた抽出によってパラフィンを組織から除去するステップから開始され、その後、熱ならびに組織およびタンパク質を切断してゲノム材料の組織からの放出を補助するプロテアーゼ様プロテイナーゼKを用いて処理する。次いで、放出された核酸を膜に捕捉するまたは溶液から沈殿させ、洗浄して不純物を除去することができ、mRNA単離の場合には、時にはDNase処理ステップを追加して望ましくないDNAを分解する。FFPE DNAを抽出するための他の方法が利用可能であり、本開示の方法において使用することができる。
【0135】
一部の実施形態では、複数のポリヌクレオチドは、無細胞DNA(cfDNA)などの無細胞ポリヌクレオチドまたは循環腫瘍DNA(ctDNA)を含む。無細胞DNAは、健康な個体と疾患にかかっている個体のどちらでも循環している。腫瘍由来のcfDNA(ctDNA)は、いかなる特定のがんの種類にも限局されず、異なる悪性腫瘍にわたって共通する所見であると思われる。いくつかの測定によると、血漿中の遊離の循環DNA濃度は、対照の対象では約14〜18ng/mlであり、新形成を有する患者では約180〜318ng/mlである。アポトーシス性および壊死性細胞死が体液中の無細胞循環DNAに寄与する。例えば、前立腺がん患者ならびに良性前立腺肥大症および前立腺炎(prostatits)などの他の前立腺疾患の血漿において、循環DNAレベルの有意な上昇が観察されている。さらに、循環腫瘍DNAは、原発腫瘍が生じる臓器に由来する流体中に存在する。したがって、管洗浄液で乳がん検出を実現することができ、便で結腸直腸がん検出を実現することができ、痰で肺がん検出を実現することができ、尿または射出精液で前立腺がん検出を実現することができる。無細胞DNAは、種々の供給源から得ることができる。1つの一般的な供給源は、対象の血液試料である。しかし、cfDNAまたは他の断片化DNAは、種々の他の供給源に由来するものであってよい。例えば、尿および便試料がctDNAを含めたcfDNAの供給源であってよい。
【0136】
一部の実施形態では、ポリヌクレオチドを、抽出ステップを伴わずに、かつ/または精製ステップを伴わずに、その後のステップ(例えば、環状化および増幅)に供する。例えば、流体試料を、抽出ステップを伴わずに処理して細胞を除去して精製された液体試料および細胞試料を生じさせ、その後、精製された流体試料からDNAを単離することができる。沈殿または基質への非特異的な結合、その後、基質を洗浄して結合したポリヌクレオチドを放出させることによるものなど、ポリヌクレオチドを単離するための種々の手順が利用可能である。ポリヌクレオチドを、細胞抽出ステップを伴わずに試料から単離する場合、ポリヌクレオチドは大部分が細胞外または「無細胞」ポリヌクレオチドになる。例えば、無細胞ポリヌクレオチドは、無細胞DNA(「循環」DNAとも称される)を含んでよい。一部の実施形態では、循環DNAは、体液または排泄物(例えば、血液試料)に由来するものなどの、腫瘍細胞由来の循環腫瘍DNA(ctDNA)である。腫瘍は、アポトーシスまたは壊死を頻繁に示し、したがって、腫瘍核酸は、種々の機構を通じて、異なる形態で、かつ異なるレベルで、対象の血流を含めた体内に放出される。一般には、ctDNAのサイズは、高濃度の小さな断片、一般に、70〜200ヌクレオチドの長さから、低濃度の大きな断片、数千キロベースに至るまでにわたり得る。
【0137】
本明細書に記載の種々の態様のいずれかの一部の実施形態では、配列変異体の検出は、参照配列に対して、または突然変異のないバックグラウンドで突然変異(例えば、稀な体細胞突然変異)を検出することを含み、その配列変異体は疾患と相関する。一般に、疾患または形質との関連に関する統計学的、生物学的、および/または機能的証拠が存在する配列変異体は、「原因遺伝子変異体」と称される。単一の原因遺伝子変異体を2つ以上の疾患または形質と関連付けることができる。一部の実施形態では、原因遺伝子変異体は、メンデル形質、非メンデル形質、またはその両方と関連付けることができる。原因遺伝子変異体は、1、2、3、4、5、6、7、8、9、10、20、50、またはそれ超の配列の差異(例えば、原因遺伝子変異体を含むポリヌクレオチドと、同じ相対的なゲノム位に原因遺伝子変異体がないポリヌクレオチドの間など)などのポリヌクレオチドの変異として顕在化し得る。原因遺伝子変異体の型の非限定的な例としては、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数変異体(CNV)、短い縦列反復(STR)、制限断片長多型(RFLP)、単純配列反復(SSR)、可変数縦列反復(VNTR)、ランダムに増幅された多型DNA(RAPD)、増幅断片長多型(AFLP)、レトロトランスポゾン間増幅多型(IRAP)、長いおよび短い分散要素(LINE/SINE)、長い縦列反復(LTR)、可動要素、レトロトランスポゾンマイクロサテライト増幅多型、レトロトランスポゾンに基づく挿入多型、配列特異的増幅多型、ならびに遺伝性後成的修飾(例えば、DNAメチル化)が挙げられる。原因遺伝子変異体は、密接に関連する原因遺伝子変異体のセットであってもよい。いくつかの原因遺伝子変異体は、RNAポリヌクレオチドにおける配列変異として影響を及ぼし得る。このレベルでは、いくつかの原因遺伝子変異体は、RNAポリヌクレオチドの種の有無によっても示される。また、いくつかの原因遺伝子変異体により、タンパク質ポリペプチドにおける配列変異がもたらされる。いくつかの原因遺伝子変異体が報告されている。SNPである原因遺伝子変異体の例は、鎌状赤血球貧血を引き起こす、ヘモグロビンのHb S変異体である。DIPである原因遺伝子変異体の例は、嚢胞性線維症を引き起こす、CFTR遺伝子のデルタ508突然変異である。CNVである原因遺伝子変異体の例は、ダウン症候群を引き起こす21トリソミーである。STRである原因遺伝子変異体の例は、ハンチントン病を引き起こす縦列反復である。原因遺伝子変異体およびそれらが関連する疾患の非限定的な例を表4において提示する。原因遺伝子変異体のさらなる非限定的な例は、WO2014015084に記載されている。突然変異が疾患に関連する遺伝子、および本開示の方法に従って配列変異体を検出することができる遺伝子のさらなる例を表5において提示する。
【表4-1】
【表4-2】
【表4-3】
【表4-4】
【表4-5】
【表4-6】
【表4-7】
【表4-8】
【表4-9】
【表4-10】
【表4-11】
【表4-12】
【表4-13】
【表4-14】
【表4-15】
【表4-16】
【表4-17】
【表4-18】
【表4-19】
【表4-20】
【表4-21】
【表4-22】
【表4-23】
【表4-24】
【表4-25】
【表4-26】
【表4-27】
【表4-28】
【表5】
【0138】
一部の実施形態では、方法は、検出された原因遺伝子変異体に関連する疾患を有する対象を診断するステップ、または患者がそのような疾患を有するまたは発生する可能性を報告するステップなどの、コールするステップに基づいて対象を診断するステップをさらに含む。疾患、関連する遺伝子、および関連する配列変異体の例は本明細書において提供される。一部の実施形態では、結果は、本明細書に記載されているような報告作成プログラムを介して報告される。
【0139】
一部の実施形態では、1つまたは複数の原因遺伝子変異体は、がんまたは特定の特性(例えば、転移能、薬物抵抗性、薬物応答性)を有するがんの特定の種類または病期に関連する配列変異体である。一部の実施形態では、本開示は、例えば、ある特定の突然変異が患者の転帰に関連することが公知である場合など、予後を決定するための方法を提供する。例えば、ctDNAは、乳がん予後に関して従来のがん抗原53(CA−53)および循環性腫瘍細胞の列挙よりも良好なバイオマーカーであることが示されている(例えば、Dawsonら、N Engl J Med 368巻:1199頁(2013年)を参照されたい)。さらに、本開示の方法は、治療上の決定、手引きおよびモニタリング、ならびにがん療法の開発および臨床試験において使用することができる。例えば、治療の有効性は、例えば、分子標的療法(モノクローナル薬物)、化学療法薬、放射線プロトコールなどの特定の療法またはこれらの組合せを用いた治療の前、その間、およびその後の患者のctDNA試料を比較することによってモニターすることができる。例えば、ctDNAをモニターして、治療後にある特定の突然変異が増加または減少しているか、新しい突然変異が出現しているかなどを確かめることができ、それにより、医師が、患者の症状を追跡するモニター方法によってもたらされるよりもはるかに短い期間で治療を変更する(例えば、治療を継続する、中止するまたは変化させる)ことが可能になる。一部の実施形態では、方法は、検出された配列変異体に関連する特定の病期もしくは種類のがんを有する対象を診断するステップ、または患者がそのようながんを有するもしくは発生する可能性を報告するステップなどの、コールするステップに基づいて対象を診断するステップをさらに含む。
【0140】
例えば、分子マーカー(例えば、ハーセプチンおよびher2/neuの状態)に基づいて患者を特異的に標的とする療法に関しては、患者を検査して、患者の腫瘍にある特定の突然変異が存在するかどうか、およびこれらの突然変異を、療法に対する応答または抵抗性を予測し、その療法を使用するかどうかの決定を手引きするために使用することができるかどうかを見いだす。したがって、治療の過程中にctDNAを検出およびモニターすることは、治療の選択の手引きにおいて非常に有用であり得る。いくつかの一次的な(治療前)または二次的な(治療後)がん突然変異が、いくつかの療法に対するがんの抵抗性に関与することが見いだされる(Misaleら、Nature 486巻(7404号):532頁(2012年))。
【0141】
診断、予後、または治療の決定において有用であり得る、1つまたは複数の種類のがんに関連する種々の配列変異体は公知である。本開示の方法において使用を見いだす、腫瘍学的に重要な適切な標的配列としては、これらに限定されないが、TP53遺伝子、ALK遺伝子、KRAS遺伝子、PIK3CA遺伝子、BRAF遺伝子、EGFR遺伝子、およびKIT遺伝子における変更が挙げられる。特異的に増幅し、かつ/または配列変異体に関して特異的に分析することができる標的配列は、がん関連遺伝子の全部または一部であってよい。一部の実施形態では、TP53遺伝子における1つまたは複数の配列変異体を同定する。TP53は、ヒトがんにおいて最も頻繁に突然変異する遺伝子の1つであり、例えば、TP53突然変異は、卵巣がんの45%、大腸がんの43%、および上部気道消化管(upper aerodigestive track)のがんの42%において見いだされる(例えば、M. Olivierら、TP53 Mutations in Human Cancers: Origins, Consequences, and Clinical Use. Cold Spring Harb Perspect Biol. 2010年1月;2巻(1号)を参照されたい。TP53の突然変異の状態の特徴付けは、臨床的診断の助けになり得、予後値をもたらし得、がん患者の治療に影響を及ぼし得る。例えば、TP53突然変異を、グリア細胞に由来するCNS腫瘍の患者に対する予後不良の予測因子および慢性リンパ球性白血病の患者における急速な疾患の進行の予測因子として使用することができる(例えば、McLendon REら、Cancer. 2005年10月15日;104巻(8号):1693〜9頁;Dicker Fら、Leukemia. 2009年1月;23巻(1号):117〜24頁を参照されたい)。配列変異は、遺伝子内のどこにでも生じ得る。したがって、本発明ではTP53遺伝子の全部または一部を評価することができる。すなわち、本明細書の他の箇所に記載の通り、標的特異的成分(例えば、標的特異的プライマー)を使用する場合、例えば、選択された標的に対して使用することができるのと同様に、1つまたは複数の選択された部分配列(例えば、突然変異「ホットスポット」など)だけではなく、遺伝子にわたる断片を増幅し、検出するために、複数のTP53特異的配列を使用することができる。あるいは、1つまたは複数の選択された部分配列(同様に「ホットスポット」という用語に包含される、対象のクラスの中で突然変異の率の上昇に関連するそのようなヌクレオチドまたはヌクレオチド領域)の上流または下流にハイブリダイズする標的特異的プライマーを設計することができる。そのような部分配列にわたる標準のプライマーを設計することができ、かつ/または、そのような部分配列の上流または下流にハイブリダイズするB2Bプライマーを設計することができる。
【0142】
一部の実施形態では、ALK遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。肺腫瘍の7%もにおいてALK融合が報告されており、そのいくつかは、EGFRチロシンキナーゼ阻害剤(TKI)抵抗性と関連付けられている(例えば、Shawら、J Clin Oncol. 2009年9月10日;27巻(26号):4247〜4253頁を参照されたい)。2013年まで、ALKチロシンキナーゼ阻害剤(TKI)に対する二次的な抵抗性を有する患者において、ALKチロシンキナーゼドメイン全体にわたる、いくつかの異なる点突然変異が見いだされた(Katayama R 2012 Sci Transl Med. 2012年2月8日;4巻(120号))。したがって、ALK遺伝子における突然変異の検出を使用して、がん療法の決定を補助することができる。
【0143】
一部の実施形態では、KRAS遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。肺腺癌の患者のおよそ15〜25%および結腸直腸がんの患者の40%が腫瘍に関連するKRAS突然変異を有することが報告されている(例えば、Neuman 2009年、Pathol Res Pract. 2009年;205巻(12号):858〜62頁を参照されたい)。突然変異の大部分は、KRAS遺伝子のコドン12、13、および61に位置する。これらの突然変異によりKRASシグナル伝達経路が活性化し、それにより、腫瘍細胞の成長および増殖が誘発される。いくつかの研究により、KRASに突然変異を有する、腫瘍を有する患者は、単独または化学療法と組み合わせた抗EGFR抗体療法から利益を得る可能性が低いことが示されている(例えば、Amadoら、2008年 J Clin On col. 2008年4月1日;26巻(10号):1626〜34頁、Bokemeyerら、2009年 J Clin Oncol. 2009年2月10日;27巻(5号):663〜71頁を参照されたい)。配列変異の同定を標的とすることができる配列変異の1つの特定の「ホットスポット」は、遺伝子の35位である。例えば、結腸直腸がんの対象に対する治療の選択においてなど、治療の選択においてKRAS配列変異体の同定を使用することができる。
【0144】
一部の実施形態では、PIK3CA遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。PIK3CAにおける体細胞突然変異は、種々の種類のがんにおいて頻繁に見いだされており、例えば、結腸直腸がんの10〜30%において見いだされている(例えば、Samuelsら、2004年 Science. 2004年4月23日;304巻(5670号):554頁を参照されたい)。これらの突然変異は、最も一般的に、エクソン9(ヘリックスドメイン)およびエクソン20(キナーゼドメイン)内の2つの「ホットスポット」領域内に位置し、配列変異体の検出の増幅および/または分析に関して特異的に標的とすることができる。3140位も特異的に標的とすることができる。
【0145】
一部の実施形態では、BRAF遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。全ての悪性黒色腫のうちの50%近くがBRAFに体細胞突然変異を有することが報告されている(例えば、Maldonadoら、J Natl Cancer Inst. 2003年12月17日;95巻(24号):1878〜90頁を参照されたい)。BRAF突然変異は、全ての黒色腫サブタイプに見いだされるが、日光により誘導される慢性損傷を伴わない皮膚から生じる黒色腫における頻度が最も高い。黒色腫における最も一般的なBRAF突然変異は、600位のバリンがグルタミンで置換されたミスセンス突然変異V600Eである。BRAF V600E突然変異は、BRAF阻害剤療法の臨床的利益に関連する。BRAF突然変異の検出は、黒色腫の治療の選択および標的化療法への抵抗性の研究に使用することができる。
【0146】
一部の実施形態では、EGFR遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。EGFR突然変異は、非小細胞肺がんに頻繁に付随する(米国では約10%、および東アジアでは35%;例えば、Paoら、Proc Natl Acad Sci US A.2004年9月7日;101巻(36号):13306〜11頁を参照されたい)。これらの突然変異は、一般にはEGFRエクソン18〜21の範囲内に生じており、通常はヘテロ接合性である。これらの突然変異のおよそ90%はエクソン19欠失またはエクソン21 L858R点突然変異である。
【0147】
一部の実施形態では、KIT遺伝子の全部または一部における1つまたは複数の配列変異体を同定する。消化管間質腫瘍(GIST)の85%近くがKIT突然変異を有することが報告されている(例えば、Heinrichら、2003年 J Clin Oncol. 2003年12月1日;21巻(23号):4342〜9頁を参照されたい)。大多数のKIT突然変異は、膜近傍ドメイン(エクソン11、70%)、細胞外二量体化モチーフ(エクソン9、10〜15%)、チロシンキナーゼI(TKI)ドメイン(エクソン13、1〜3%)、およびチロシンキナーゼ2(TK2)ドメインおよび活性化ループ(エクソン17、1〜3%)に見いだされる。二次的なKIT突然変異は、一般に、標的療法イマチニブの後および患者に療法に対する抵抗性が発生した後に同定される。
【0148】
その全部または一部を配列変異体に関して本明細書に記載の方法に従って分析することができる、がんに関連する遺伝子のさらなる非限定的な例としては、これらに限定されないが、PTEN;ATM;ATR;EGFR;ERBB2;ERBB3;ERBB4;Notch1;Notch2;Notch3;Notch4;AKT;AKT2;AKT3;HIF;HIF1a;HIF3a;Met;HRG;Bcl2;PPARアルファ;PPARガンマ;WT1(ウィルムス腫瘍);FGF受容体ファミリーメンバー(5種のメンバー:1、2、3、4、5);CDKN2a;APC;RB(網膜芽細胞腫);MEN1;VHL;BRCA1;BRCA2;AR;(アンドロゲン受容体);TSG101;IGF;IGF受容体;Igf1(4種の変異体);Igf2(3種の変異体);Igf1受容体;Igf2受容体;Bax;Bcl2;カスパーゼファミリー(9種のメンバー:1、2、3、4、6、7、8、9、12);Kras;およびApcが挙げられる。さらなる例は、本明細書の他の箇所で提示されている。本明細書に開示されている方法に従って、1つまたは複数の配列変異体をコールすることに基づいて診断することができるがんの例としては、限定することなく、棘細胞腫、腺房細胞癌、聴神経腫、末端黒子型黒色腫、先端汗腺腫、急性好酸球性白血病、急性リンパ芽球性白血病、急性巨核芽球性白血病、急性単球性白血病、成熟化を伴う急性骨髄芽球性白血病、急性骨髄樹状細胞白血病、急性骨髄性白血病、急性前骨髄球性白血病、アダマンチノーマ、腺癌、腺様嚢胞癌、腺腫、腺様歯原性腫瘍、副腎皮質癌、成人T細胞白血病、侵攻性NK細胞白血病、AIDS関連がん、AIDS関連リンパ腫、胞巣状軟部肉腫、エナメル芽細胞線維腫、肛門がん、未分化大細胞型リンパ腫、甲状腺未分化がん、血管免疫芽細胞性T細胞リンパ腫、血管筋脂肪腫、血管肉腫、虫垂がん、星状細胞腫、非定型奇形腫様横紋筋肉腫様腫瘍、基底細胞癌、基底様癌、B細胞白血病、B細胞リンパ腫、ベリーニ管癌、胆道がん、膀胱がん、芽細胞腫、骨がん、骨腫瘍、脳幹神経膠腫、脳腫瘍、乳がん、ブレンナー腫瘍、気管支腫瘍、細気管支肺胞癌、褐色腫、バーキットリンパ腫、原発部位不明がん、カルチノイド腫瘍、癌腫、上皮内癌、陰茎癌、原発部位不明癌、癌肉腫、キャッスルマン病、中枢神経系胚芽腫、小脳星状細胞腫、大脳星状細胞腫、子宮頸がん、胆管細胞癌、軟骨腫、軟骨肉腫、脊索腫、絨毛癌、脈絡叢乳頭腫、慢性リンパ球性白血病、慢性単球性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、慢性好中球性白血病、明細胞腫瘍、結腸がん、結腸直腸がん、頭蓋咽頭腫、皮膚のT細胞リンパ腫、デゴス病、隆起性皮膚線維肉腫、類皮嚢胞、線維形成性小円形細胞腫瘍、びまん性大細胞型B細胞リンパ腫、胚芽異形成性神経上皮腫瘍、胎児性癌、卵黄嚢腫瘍、子宮体がん、子宮内膜がん、子宮内膜性腫瘍、腸疾患関連T細胞リンパ腫、上衣芽腫、上衣腫、類上皮肉腫、赤白血病、食道がん、鼻腔神経芽細胞腫、ユーイング腫瘍、ユーイングファミリー肉腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管がん、乳房外パジェット病、卵管がん、封入奇形児、線維腫、線維肉腫、濾胞性リンパ腫、甲状腺濾胞がん、胆嚢がん、胆嚢がん、神経節膠腫、神経節細胞腫、胃がん、胃リンパ腫、胃腸がん、消化管カルチノイド腫瘍、消化管間質腫瘍、消化管間質腫瘍、胚細胞性腫瘍、胚細胞腫、妊娠性絨毛癌、妊娠性絨毛性腫瘍、骨の巨細胞腫、多形神経膠芽腫、神経膠腫、大脳神経膠腫症、グロムス腫瘍、グルカゴノーマ、生殖腺芽細胞腫、顆粒膜細胞腫、ヘアリー細胞白血病、ヘアリー細胞白血病、頭頸部がん、頭頸部がん、心臓がん、血管芽細胞腫、血管外皮腫、血管肉腫、血液悪性腫瘍、肝細胞癌、肝脾T細胞リンパ腫、遺伝性乳がん卵巣がん症候群、ホジキンリンパ腫、ホジキンリンパ腫、下咽頭がん、視床下部神経膠腫、炎症性乳がん、眼内黒色腫、膵島細胞癌、膵島細胞腫瘍、若年性骨髄単球性白血病、カポジ肉腫、カポジ肉腫、腎がん、クラツキン腫瘍、クルケンベルグ腫瘍、喉頭がん、喉頭がん、悪性黒子黒色腫、白血病、白血病、口唇・口腔がん、脂肪肉腫、肺がん、黄体腫、リンパ管腫、リンパ管肉腫、リンパ上皮腫、リンパ性白血病、リンパ腫、マクログロブリン血症、悪性線維性組織球腫、悪性線維性組織球腫、骨の悪性線維性組織球腫、悪性神経膠腫、悪性中皮腫、悪性末梢神経鞘腫瘍、悪性横紋筋肉腫様腫瘍、悪性トリトン腫瘍、MALTリンパ腫、マントル細胞リンパ腫、肥満細胞性白血病、縦隔胚細胞性腫瘍、縦隔腫瘍、甲状腺髄様がん、髄芽腫、髄芽腫、髄上皮腫、黒色腫、黒色腫、髄膜腫、メルケル細胞癌、中皮腫、中皮腫、原発不明転移性扁平上皮性頸部がん、転移性尿路上皮癌、ミュラー管混合腫瘍、単球性白血病、口腔がん、粘液性腫瘍、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫、菌状息肉腫、菌状息肉腫、骨髄異形成疾患、骨髄異形成症候群、骨髄性白血病、骨髄肉腫、骨髄増殖性疾患、粘液腫、鼻腔がん、鼻咽頭がん、上咽頭癌、新生物、神経鞘腫、神経芽細胞腫、神経芽細胞腫、神経線維腫、神経腫、結節性黒色腫、非ホジキンリンパ腫、非ホジキンリンパ腫、非黒色腫皮膚がん、非小細胞肺がん、眼腫瘍、乏突起星細胞腫、乏突起神経膠腫、オンコサイトーマ、視神経鞘髄膜腫、口腔がん、口腔がん、中咽頭がん、骨肉腫、骨肉腫、卵巣がん、卵巣がん、卵巣上皮がん、卵巣胚細胞性腫瘍、卵巣低悪性度腫瘍、乳房パジェット病、パンコースト腫瘍、膵がん、膵がん、甲状腺乳頭がん、乳頭腫症、傍神経節腫、副鼻腔がん、副甲状腺がん、陰茎がん、血管周囲類上皮細胞腫瘍、咽頭がん、褐色細胞腫、中間型松果体実質腫瘍、松果体芽腫、下垂体細胞腫、下垂体腺腫、下垂体腫瘍、形質細胞新生物、胸膜肺芽腫、多胚腫、前駆Tリンパ芽球性リンパ腫、原発性中枢神経系リンパ腫、原発性滲出液リンパ腫、原発性肝細胞がん、原発性肝臓がん、原発性腹膜がん、原始神経外胚葉性腫瘍、前立腺がん、腹膜偽粘液腫、直腸がん、腎細胞癌、第15染色体上のNUT遺伝子が関与する呼吸器癌、網膜芽細胞腫、横紋筋腫、横紋筋肉腫、リヒタートランスフォーメーション、仙尾部奇形腫、唾液腺がん、肉腫、神経鞘腫症、脂腺癌、続発性新生物、セミノーマ、漿液性腫瘍、セルトリ・ライディッヒ細胞腫、性索間質腫瘍、セザリー症候群、印環細胞癌、皮膚がん、小円形青色細胞腫瘍、小細胞癌、小細胞肺がん、小細胞型リンパ腫、小腸がん、軟部肉腫、ソマトスタチノーマ、煤煙性疣贅、脊髄腫瘍、脊椎腫瘍、脾臓周辺帯リンパ腫、扁平上皮癌、胃がん、表在拡大型黒色腫、テント上原始神経外胚葉性腫瘍、表層上皮性間質性腫瘍、滑膜肉腫、T細胞急性リンパ芽球性白血病、T細胞大顆粒リンパ球性白血病、T細胞白血病、T細胞リンパ腫、T細胞前リンパ球性白血病、奇形腫、末期のリンパのがん、精巣がん、莢膜細胞腫、のどがん、胸腺癌、胸腺腫、甲状腺がん、腎盤および尿管の移行上皮がん、移行上皮癌、尿膜管癌、尿道がん、泌尿生殖器新生物、子宮肉腫、ぶどう膜黒色腫、膣がん、ヴェルナー・モリソン症候群、疣状癌、視経路グリオーマ、外陰がん、ワルデンシュトレームマクログロブリン血症、ワルチン腫瘍、ウィルムス腫瘍、およびこれらの組合せが挙げられる。がんに関連する特異的な配列変異体の非限定的な例を表6に提示する。
【表6-1】
【表6-2】
【表6-3】
【0149】
さらに、本明細書に開示されている方法および組成物は、1つまたは複数のがんの種類、病期またはがんの特性に関連付けられる新しい稀な突然変異の発見において有用であり得る。例えば、分析中の特性(例えば、特定の疾患、がんの種類、がんの病期など)を共有する個体の集団を、配列変異体または配列変異体の種類(例えば、特定の遺伝子または遺伝子の一部における突然変異)を同定するために、本開示による配列変異体の検出方法に供することができる。特性を共有する個体の群の中で、特性を伴わない個体よりも統計的に有意に大きな頻度で生じていることが同定された配列変異体に、その特性とのある程度の関連を割り当てることができる。次いで、そのように同定された配列変異体または配列変異体の種類を、その配列変異体を有することが発見された個体の診断または治療において使用することができる。
【0150】
他の治療への適用としては、非侵襲的な胎児の診断における使用が挙げられる。胎児DNAは、妊娠中の女性の血液中に見いだすことができる。本明細書に記載の方法および組成物は、循環胎児DNAにおける配列変異体を同定するために使用することができ、したがって、1つまたは複数の原因遺伝子変異体に関連するものなどの、胎児における1つまたは複数の遺伝子疾患を診断するために使用することができる。原因遺伝子変異体の非限定的な例は、本明細書に記載されており、それらとして、トリソミー、嚢胞性線維症、鎌状赤血球貧血、およびテイ・サックス病(Tay-Saks disease)が挙げられる。この実施形態では、比較のために使用する対照試料および血液試料を母親が提供することができる。対照試料は、任意の適切な組織であってよく、一般には、処理して細胞内DNAを抽出し、次いでそれを配列決定して、参照配列をもたらすことができる。次いで、胎児のゲノムDNAに対応するcfDNAの配列を母体参照に対する配列変異体と同定することができる。胎児の配列、および配列変異体の同定を補助するために、父親も参照試料を提供することができる。
【0151】
さらに別の治療への適用としては、病原体(例えば、細菌、ウイルス、真菌、および微生物)に由来するものなどの外因性ポリヌクレオチドの検出が挙げられ、この情報により、診断および治療の選択が通知され得る。例えば、いくつかのHIVサブタイプは薬物抵抗性と相関する(例えば、hivdb.stanford.edu/pages/genotype-rxを参照されたい)。同様に、HCVタイピング、サブタイピングおよびアイソタイプ突然変異も本開示の方法および組成物を使用して行うことができる。さらに、HPVサブタイプは、子宮頸がんのリスクと相関し、このような診断により、がんリスクの評価をさらに通知することができる。検出することができるウイルスの別の非限定的な例としては、ヘパドナウイルスB型肝炎ウイルス(HBV)、ウッドチャック肝炎ウイルス、地リス(Hepadnaviridae)肝炎ウイルス、アヒルB型肝炎ウイルス、サギB型肝炎ウイルス、ヘルペスウイルス単純ヘルペスウイルス(HSV)1型および2型、水痘帯状疱疹ウイルス、サイトメガロウイルス(CMV)、ヒトサイトメガロウイルス(HCMV)、マウスサイトメガロウイルス(MCMV)、モルモットサイトメガロウイルス(GPCMV)、エプスタイン・バーウイルス(EBV)、ヒトヘルペスウイルス6(HHV変異体AおよびB)、ヒトヘルペスウイルス7(HHV−7)、ヒトヘルペスウイルス8(HHV−8)、カポジ肉腫関連ヘルペスウイルス(KSHV)、Bウイルスポックスウイルスワクシニアウイルス、痘瘡ウイルス、天然痘ウイルス、サル痘ウイルス、牛痘ウイルス、ラクダ痘ウイルス、エクトロメリアウイルス、マウス痘ウイルス、ウサギ痘ウイルス、アライグマ痘ウイルス、伝染性軟属腫ウイルス、オルフウイルス、ミルカー結節ウイルス、ウシ丘疹性口炎ウイルス、羊痘ウイルス、山羊痘ウイルス、ランピースキン病ウイルス、鶏痘ウイルス、カナリア痘ウイルス、鳩痘ウイルス、スズメ痘ウイルス、粘液腫ウイルス、ノウサギ線維腫ウイルス、ウサギ線維腫ウイルス、リス線維腫ウイルス、豚痘ウイルス、タナ痘ウイルス、ヤバポックスウイルス、フラビウイルスデングウイルス、C型肝炎ウイルス(HCV)、GB肝炎ウイルス(GBV−A、GBV−BおよびGBV−C)、西ナイルウイルス、黄熱ウイルス、セントルイス脳炎ウイルス、日本脳炎ウイルス、ポワッサンウイルス、ダニ媒介脳炎ウイルス、キャサヌール森林病ウイルス、トガウイルス、ベネズエラウマ脳炎(VEE)ウイルス、チクングニアウイルス、ロスリバーウイルス、マヤロウイルス、シンドビスウイルス、風疹ウイルス、レトロウイルスヒト免疫不全ウイルス(HIV)1型および2型、ヒトT細胞白血病ウイルス(HTLV)1型、2型、および5型、マウス乳房腫瘍ウイルス(MMTV)、ラウス肉腫ウイルス(RSV)、レンチウイルス、コロナウイルス、重症急性呼吸器症候群(SARS)ウイルス、フィロウイルスエボラウイルス、マールブルグウイルス、ヒトメタニューモウイルス(HMPV)などのメタニューモウイルス(MPV)、ラブドウイルス狂犬病ウイルス、水疱性口内炎ウイルス、ブニヤウイルス、クリミア・コンゴ出血熱ウイルス、リフトバレー熱ウイルス、ラクロスウイルス、ハンタンウイルス、オルソミクソウイルス、インフルエンザウイルス(A型、B型、およびC型)、パラミクソウイルス、パラインフルエンザウイルス(PIV1型、2型および3型)、呼吸器合胞体ウイルス(A型およびB型)、麻疹ウイルス、流行性耳下腺炎ウイルス、アレナウイルス、リンパ球性脈絡髄膜炎ウイルス、フニンウイルス、マチュポウイルス、グアナリトウイルス、ラッサウイルス、アマパリウイルス、フレキサルウイルス、イッピーウイルス、モバラウイルス、モペイアウイルス、ラチノウイルス、パラナウイルス、ピキンデウイルス、プンタトロウイルス(PTV)、タカリベウイルスおよびタミアミウイルスが挙げられる。
【0152】
本開示の方法によって検出することができる細菌病原体の例は、限定することなく、細菌病原体の特定の例を含み、それらとして、限定することなく、とりわけ、Acinetobacter baumanii、Actinobacillus sp.、Actinomycetes、Actinomyces sp.(例えば、Actinomyces israeliiおよびActinomyces naeslundiiなど)、Aeromonas sp.(例えば、Aeromonas hydrophila、Aeromonas veronii biovar sobria(Aeromonas sobria)、およびAeromonas caviaeなど)、Anaplasma phagocytophilum、Alcaligenes xylosoxidans、Acinetobacter baumanii、Actinobacillus actinomycetemcomitans、Bacillus sp.(例えば、Bacillus anthracis、Bacillus cereus、Bacillus subtilis、Bacillus thuringiensis、およびBacillus stearothermophilusなど)、Bacteroides sp.(例えば、Bacteroides fragilisなど)、Bartonella sp.(例えば、Bartonella bacilliformisおよびBartonella henselaeなど)、Bifidobacterium sp.、Bordetella sp.(例えば、Bordetella pertussis、Bordetella parapertussis、およびBordetella bronchisepticaなど)、Borrelia sp.(例えば、Borrelia recurrentis、およびBorrelia burgdorferiなど)、Brucella sp.(例えば、Brucella abortus、Brucella canis、Brucella melintensisおよびBrucella suisなど)、Burkholderia sp.(例えば、Burkholderia pseudomalleiおよびBurkholderia cepaciaなど)、Campylobacter sp.(例えば、Campylobacter jejuni、Campylobacter coli、Campylobacter lariおよびCampylobacter fetusなど)、Capnocytophaga sp.、Cardiobacterium hominis、Chlamydia trachomatis、Chlamydophila pneumoniae、Chlamydophila psittaci、Citrobacter sp. Coxiella burnetii、Corynebacterium sp.(例えば、Corynebacterium diphtheriae、Corynebacterium jeikeumおよびCorynebacteriumなど)、Clostridium sp.(例えば、Clostridium perfringens、Clostridium difficile、Clostridium botulinumおよびClostridium tetaniなど)、Eikenella corrodens、Enterobacter sp.(例えば、Enterobacter aerogenes、Enterobacter agglomerans、Enterobacter cloacae、ならびにopportunistic Escherichia coli、例えば、enterotoxigenic E.coli、enteroinvasive E.coli、enteropathogenic E.coli、enterohemorrhagic E.coli、enteroaggregative E.coliおよびuropathogenic E.coliを含めたEscherichia coliなど)Enterococcus sp.(例えば、Enterococcus faecalisおよびEnterococcus faeciumなど)Ehrlichia sp.(例えば、Ehrlichia chafeensiaおよびEhrlichia canisなど)、Erysipelothrix rhusiopathiae、Eubacterium sp.、Francisella tularensis、Fusobacterium nucleatum、Gardnerella vaginalis、Gemella morbillorum、Haemophilus sp.(例えば、Haemophilus influenzae、Haemophilus ducreyi、Haemophilus aegyptius、Haemophilus parainfluenzae、Haemophilus haemolyticusおよびHaemophilus parahaemolyticusなど)、Helicobacter sp.(例えば、Helicobacter pylori、Helicobacter cinaediおよびHelicobacter fennelliaeなど)、Kingella kingii、Klebsiella sp.(例えば、Klebsiella pneumoniae、Klebsiella granulomatisおよびKlebsiella oxytocaなど)、Lactobacillus sp.、Listeria monocytogenes、Leptospira interrogans、Legionella pneumophila、Leptospira interrogans、Peptostreptococcus sp.、Moraxella catarrhalis、Morganella sp.、Mobiluncus sp.、Micrococcus sp.、Mycobacterium sp.(例えば、Mycobacterium leprae、Mycobacterium tuberculosis、Mycobacterium intracellulare、Mycobacterium avium、Mycobacterium bovis、およびMycobacterium marinumなど)、Mycoplasm sp.(例えば、Mycoplasma pneumoniae、Mycoplasma hominis、およびMycoplasma genitaliumなど)、Nocardia sp.(例えば、Nocardia asteroides、Nocardia cyriacigeorgicaおよびNocardia brasiliensisなど)、Neisseria sp.(例えば、Neisseria gonorrhoeaeおよびNeisseria meningitidisなど)、Pasteurella multocida、Plesiomonas shigelloides. Prevotella sp.、Porphyromonas sp.、Prevotella melaminogenica、Proteus sp.(例えば、Proteus vulgarisおよびProteus mirabilisなど)、Providencia sp.(例えば、Providencia alcalifaciens、Providencia rettgeriおよびProvidencia stuartiiなど)、Pseudomonas aeruginosa、Propionibacterium acnes、Rhodococcus equi、Rickettsia sp.(例えば、Rickettsia rickettsii、Rickettsia akariおよびRickettsia prowazekii、Orientia tsutsugamushi(以前はRickettsia tsutsugamushi)およびRickettsia typhiなど)、Rhodococcus sp.、Serratia marcescens、Stenotrophomonas maltophilia、Salmonella sp.(例えば、Salmonella enterica、Salmonella typhi、Salmonella paratyphi、Salmonella enteritidis、Salmonella cholerasuisおよびSalmonella typhimuriumなど)、Serratia sp.(例えば、Serratia marcesansおよびSerratia liquifaciensなど)、Shigella sp.(例えば、Shigella dysenteriae、Shigella flexneri、Shigella boydiiおよびShigella sonneiなど)、Staphylococcus sp.(例えば、Staphylococcus aureus、Staphylococcus epidermidis、Staphylococcus hemolyticus、Staphylococcus saprophyticusなど)、Streptococcus sp.(例えば、Streptococcus pneumoniae(例えば、クロラムフェニコール抵抗性血清型4 Streptococcus pneumoniae、スペクチノマイシン抵抗性血清型6B Streptococcus pneumoniae、ストレプトマイシン抵抗性血清型9V Streptococcus pneumoniae、エリスロマイシン抵抗性血清型14 Streptococcus pneumoniae、オプトヒン抵抗性血清型14 Streptococcus pneumoniae、リファンピシン抵抗性血清型18C Streptococcus pneumoniae、テトラサイクリン抵抗性血清型19F Streptococcus pneumoniae、ペニシリン抵抗性血清型19F Streptococcus pneumoniae、およびトリメトプリム抵抗性血清型23F Streptococcus pneumoniae、クロラムフェニコール抵抗性血清型4 Streptococcus pneumoniae、スペクチノマイシン抵抗性血清型6B Streptococcus pneumoniae、ストレプトマイシン抵抗性血清型9V Streptococcus pneumoniae、オプトヒン抵抗性血清型14 Streptococcus pneumoniae、リファンピシン抵抗性血清型18C Streptococcus pneumoniae、ペニシリン抵抗性血清型19F Streptococcus pneumoniae、またはトリメトプリム抵抗性血清型23F Streptococcus pneumoniae)、Streptococcus agalactiae、Streptococcus mutans、Streptococcus pyogenes、A群streptococci、Streptococcus pyogenes、B群streptococci、Streptococcus agalactiae、C群streptococci、Streptococcus anginosus、Streptococcus equismilis、D群streptococci、Streptococcus bovis、F群streptococci、およびStreptococcus anginosus G群streptococciなど)、Spirillum minus、Streptobacillus moniliformi、Treponema sp.(例えば、Treponema carateum、Trepon
ema petenue、Treponema pallidumおよびTreponema endemicumなど)、Tropheryma whippelii、Ureaplasma urealyticum、Veillonella sp.、Vibrio sp.(例えば、Vibrio cholerae、Vibrio parahemolyticus、Vibrio vulnificus、Vibrio parahaemolyticus、Vibrio vulnificus、Vibrio alginolyticus、Vibrio mimicus、Vibrio hollisae、Vibrio fluvialis、Vibrio metchnikovii、Vibrio damselaおよびVibrio furnisiiなど)、Yersinia sp.(例えば、Yersinia enterocolitica、Yersinia pestis、およびYersinia pseudotuberculosisなど)、ならびにXanthomonas maltophiliaのうちの任意の1つまたは複数(またはそれらの任意の組合せ)が挙げられる。
【0153】
一部の実施形態では、本開示の方法および組成物を、臓器移植レシピエントのモニタリングに使用する。一般には、ドナー細胞由来のポリヌクレオチドは、レシピエント細胞由来のポリヌクレオチドのバックグラウンドにおいて循環中に見いだされる。ドナー循環DNAのレベルは、一般に、臓器が十分に受け入れられている場合には安定であり、ドナーDNAの急速な増加(例えば、所与の試料における頻度として)を移植片拒絶反応の初期の徴候として使用することができる。移植不全を予防するためにこの段階で治療を行うことができる。ドナー臓器の拒絶反応により、血液中のドナーDNAが増加することが示されている;Snyderら、PNAS 108巻(15号):6629頁(2011年)を参照されたい。本開示は、この領域における以前の技法に対する有意な感度の改善を提供する。この実施形態では、レシピエント対照試料(例えば、頬スワブなど)およびドナー対照試料を比較のために使用することができる。レシピエント試料を、その参照配列をもたらすために使用することができ、ドナーのゲノムに対応する配列を、その参照に対する配列変異体として同定することができる。モニタリングは、ある期間にわたってレシピエントから試料(例えば、血液試料)を得ることを含んでよい。初期試料(例えば、最初の数週間以内)を、ドナーcfDNAの画分についてのベースラインを確立するために使用することができる。その後の試料をベースラインと比較することができる。一部の実施形態では、約もしくは少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、100%、250%、500%、1000%、またはそれ超のドナーcfDNAの画分の増加が、レシピエントが、ドナー組織を拒絶するプロセス中であることの指標としての機能を果たし得る。
【実施例】
【0154】
以下の実施例は、本発明の種々の実施形態を例示する目的でもたらされ、本発明をいかなる様にも限定することを意図するものではない。本実施例は、本明細書に記載の方法と共に、現在好ましい実施形態を表し、例示であり、本発明の範囲を限定するものではない。特許請求の範囲によって定義される本発明の主旨の範囲内に包含される、実施例における変化および他の使用が当業者には想起されよう。
(実施例1)
突然変異を検出するための縦列反復性の配列決定ライブラリーの調製
【0155】
12μLの水または10mMのTris−HCl、pH8.0中約150bpのDNA断片>10ngから開始して、10×CircLigase緩衝液ミックス2μLを添加し、混合物を95℃まで2分加熱し、氷上で5分冷却した。これに、5Mのベタインを4μL、50mMのMnClを1μL、およびCircLigase IIを1μL添加した。反応物を60℃で少なくとも12時間インキュベートした。次に、RCAプライマーミックス(各50nM、最終濃度5nMまで)2μLを添加し、混合した。混合物を95℃まで2分加熱し、42℃まで2時間冷却した。CirLigation産物を、Zymoオリゴヌクレオチド精製キットを用いて精製した。製造業者の説明書に従って、水28μLをCircLigation産物22μLに添加して総体積を50μLにした。これをオリゴ結合緩衝液100μLおよびエタノール400μLと混合した。これを>10,000×gで30秒回転させ、フロースルーを廃棄した。DNA洗浄緩衝液750μLを添加し、次いで、>10,000×gで30秒回転させ、フロースルーを廃棄し、最高速度でさらに1分、回転させた。カラムを新しいエッペンドルフチューブに移し、水17μLを用いて溶出した(最終的な溶出体積はおよそ15μLであった)。
【0156】
約50μLの体積でローリングサークル増幅を行った。溶出試料15μL中に、10×RepliPHI緩衝液(Epicentre)を5μL、25mMのdNTPを1μL、100mMのDTTを2μL、100U/μLのRepliPHI Phi29を1μL、および水を26μL添加した。反応混合物を30℃で1時間インキュベートした。RCA産物を、Ampureビーズ80μLを添加し、残りの洗浄ステップについて製造業者の説明書に従うことによって精製した。溶出のために、溶出緩衝液22.5μLを添加し、ビーズを65℃で5分インキュベートした。手短に回転させた後、チューブを磁石に戻した。
【0157】
RCA反応からの溶出産物約20μLを2×Phusion Master mix 25μL、DMSO 2.5μL、および10μMの各B2Bプライマーミックス0.5μLと混合した。増幅には以下のPCRプログラムを使用した:95℃で1分、5サイクルの伸長(95℃で15秒、55℃で15秒、72℃で1分)、13〜18サイクルの複製(95℃で15秒、68℃で15秒、72℃で1分)、および72℃で7分の最終的な伸長。PCR産物サイズをEゲルに流すことによって確認した。範囲が100〜500bpである場合、0.6×Ampureビーズ精製を実施して300〜500bpを富化し、1〜2ngを、低分子RNAライブラリーアダプタープライマーを用いたPCRの別のラウンドのために取った。産物のサイズ範囲が>1000bpであった場合、1.6×Ampureビーズを用いて産物を精製し、0.6×Ampureビーズ精製によって400〜1000bpの範囲のサイズを富化するためにNextera XTアンプリコンライブラリープレップのために2〜3ngを取った。
【0158】
配列決定データに対してバイオインフォマティクスを実施するために、FASTQファイルをMiSeqの実行から得た。BWAを使用して、配列をFASTQファイルにおいて標的配列(例えば、KRASおよびEGFR)を含有する参照ゲノム配列とアラインした。アラインメント結果を使用して、反復単位およびその参照位置の領域および長さを各配列(両方のリード)について見いだした。アラインメント結果および各配列の反復単位に関する情報を使用して全ての遺伝子座における変異体を見いだした。2つのリードからの結果を統合した。正規化された変異体の頻度およびノイズレベルを計算した。qスコア>30およびp値<0.0001を含めた、確認された変異体からの変異体コールにおける多数の追加的な基準を適用した。これらの基準を通った確認された変異体を真の変異体(突然変異)として報告した。プロセスは、コンピュータ言語(例えば、python)によって自動化することができる。
(実施例2)
配列変異体を検出するための縦列反復性の配列決定ライブラリーの作出
【0159】
平均長が150bpであるDNA断片10ngを体積12μLで縦列反復性の配列決定ライブラリー構築のために使用した。DNAは、T4 Polynucleotide Kinase(New England Biolabs)を用いて予め処理して、5’末端にリン酸基を付加し、3’末端にヒドロキシル基を残した。DNaseIもしくは酵素的な断片化によって作製されたまたは血清もしくは血漿から抽出されたDNA断片については、末端処理ステップは飛ばした。DNAを10×CircLigase緩衝液(Epicentre CL9021K)2μLと混合した。混合物を95℃まで2分加熱し、氷上で5分冷却し、次いで、ベタインを4μL、50mMのMnClを1μL、およびCircLigase IIを1μL(Epicentre CL9021K)添加した。ライゲーション反応を60℃で少なくとも12時間実施した。200nM(最終的に10nMの最終濃度)の各RCAプライマーミックス1μLをライゲーション産物に添加し、混合し、96℃まで1分加熱し、42℃まで冷却し、42℃で2時間インキュベートした。
【0160】
ハイブリダイズしたRCAプライマーを含むCircLigation産物を、Zymoオリゴヌクレオチド精製キット(Zymo Research、D4060)を用いて精製した。これを行うために、産物21μLを、水28μLおよび担体RNA(Sigma−Aldrich、R5636、1×TE緩衝液を用いて200ng/μLに希釈したもの)1μLを用いて50μLまで希釈した。希釈した試料を、オリゴ結合緩衝液100μLおよび100%エタノール400μLと混合した。混合物をカラムにローディングし、>10,000×gで30秒遠心分離した。フロースルーを廃棄した。カラムを、DNA洗浄緩衝液750μLを用い、>10,000×gで30秒遠心分離し、フロースルーを廃棄し、最高速度でさらに1分遠心分離することによって洗浄した。カラムを新しい1.5mLのエッペンドルフチューブに移し、DNAを、溶出緩衝液(10mMのTris−Cl、pH8.0、最終的な溶出体積約15μL)17μLを用いて溶出した。
【0161】
10×RepliPHI緩衝液を5μL、25mMのdNTPを2μL、100mMのDTTを2μL、100U/μLのRepliPHI Phi29を1μL、および水(Epicentre、RH040210)を25μL、カラムから溶出した試料15μLに添加し、反応総体積を50μLにした。反応混合物を30℃で2時間インキュベートした。RCA産物を、Ampure XPビーズ(Beckman Coulter、A63881)80μLを添加することによって精製した。洗浄ステップは製造業者の説明書に従った。溶出緩衝液22.5μL中、65℃で5分インキュベートした後、RCA産物を溶出させた。チューブを手短に遠心分離した後、磁石に戻した。
【0162】
RCA反応から溶出した産物約20μLを、2×Phusion Master mix(New England Biolabs M0531S)25μL、水2.5μL、DMSO 2.5μL、およびB2Bプライマーミックス(各10μM)0.5μLと混合した。以下のサーモサイクリングプログラムを用いて増幅を実施した:95℃で2分、5サイクルの伸長(95℃で30秒、55℃で15秒、72℃で1分)、18サイクルの複製(95℃で15秒、68℃で15秒、72℃で1分)、および72℃で7分の最終的な伸長。PCR産物サイズを電気泳動によって確認した。長いPCR産物が電気泳動によって確認されたら、PCR産物を、精製して>500bpのPCR産物を富化するためにAmpureビーズ(0.6×体積)30μLと混合した。精製された産物を、Qubit 2.0 Quantification Platform(Invitorgen)を用いて数量化した。精製されたDNA約1ngをNextera XTアンプリコンライブラリー調製のために使用した(Illumina FC−131−1024)。挿入断片サイズが>500bpであるライブラリー要素を、0.6×Ampureビーズを用いて精製することによって富化した。
【0163】
増幅されたライブラリーの濃度およびサイズ分布を、2100 Bioanalyzer(Agilent Technologies Inc.、Santa Clara、CA)に対してAgilent DNA High Sensitivity Kitを使用して解析した。配列決定を、2〜250bp MiSeq配列決定キットを用いたIllumina MiSeqを使用して実施した。MiSeqマニュアルに従って、変性ライブラリー12pMを配列決定実行にローディングした。
【0164】
この手順の変形では、ライブラリー調製においてNextera調製物の代わりにIlluminaアダプターを使用した。これを行うために、同様に精製したDNA約1ngを、B2Bプライマーのユニバーサル部分およびIlluminaアダプター配列を含有するプライマー対(P5およびP7;5’CAAGCAGAAGACGGCATACGA3’および5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’)を用いたPCR増幅に対して使用した。Phusion Master Mixを使用して、12サイクルの複製ステップ(95℃で30秒、55℃で15秒、72℃で60秒)を実施した。この増幅ステップの目的は、アンプリコン配列決定のためにIlluminaアダプターを付加することであった。長さが>500bpのアンプリコンを、0.6×Ampureビーズを用いて富化した。アンプリコンライブラリーの濃度およびサイズ分布を、2100 Bioanalyzer(Agilent technologies Inc.、Santa Clara、CA)に対してAgilent DNA High Sensitivity Kitを使用して解析した。配列決定を、2×250bp MiSeq配列決定キットを用いたIllumina MiSeqを使用して実施した。B2Bプライマーのユニバーサル部分も配列決定プライマー配列としての機能を果たし、Illuminaキットにプライマーが含有されない場合にはカスタム配列決定プライマーを添加した。変性ライブラリー12pMを配列決定実行にローディングした。
【0165】
1つの例の分析における標的領域カバレッジを図33において説明する。以下の表3には標的領域の分析結果が記載されている。
【0166】
表1は、本開示の方法において有用なRCAプライマーの例を提供する。表2は、本開示の方法において有用なB2Bプライマーの例を提供する。
【表1-1】
【表1-2】
【表2-1】
【表2-2】
【表2-3】
【表3】
(実施例3)
配列決定ライブラリー構築のためのゲノムDNAの断片化
【0167】
ゲノムDNA1μLを、NEBNext dsDNA Fragmentase kit(New England Biolabs)を使用し、製造業者のプロトコールに従って処理した。インキュベート時間を37℃で45分に延長した。0.5MのEDTA、pH8.0、5μLを添加することによって断片化反応を停止させ、2×体積のAmpure XPビーズ(Beckman Coulter、A63881)を製造業者のプロトコールに従って添加することによって精製した。BioanalyzerにおいてHigh Sensitivity DNA kit(Agilent)を用いて断片化DNAを解析した。断片化DNAのサイズ範囲は、一般には、約100bp〜約200bpであり、ピークは約150bpであった。
(実施例4)
ライブラリー調製手順
【0168】
本実施例では、KAPA Library Prep Kit(KK8230)を例示のために使用した。
【0169】
ビーズ精製を伴うステップに関しては、AMPure XPビーズ(cat#A63881)を室温まで平衡化し、徹底的に再懸濁させた後に試料と混合した。ボルテックスミキサーで試料と徹底的に混合した後、室温で15分インキュベートして、DNAをビーズに結合させた。次いで、ビーズを液体が透明になるまで磁気台の上に置いた。次いで、ビーズを80%エタノール200μlで2回洗浄し、室温で15分乾燥させた。
【0170】
末端修復反応を実施するために、最大50μL(2〜10ng)の無細胞DNAを末端修復マスターミックス(水8μL、10×KAPA末端修復緩衝液7μL、およびKAPA末端修復酵素ミックス5μL)20μLと混合し、20℃で30分インキュベートした。次いで、AMPure XPビーズ120μLを末端修復反応物70μLに添加した。次いで、試料を上記の通り精製した。
【0171】
A尾部付加反応を実施するために、末端修復したDNA断片を含有する乾燥ビーズを、A尾部付加マスターミックス(水42μL、10×KAPA A尾部付加緩衝液5μL、およびKAPA A尾部付加酵素)と混合した。反応物を30℃で30分インキュベートした。PEG溶液(20%PEG8000、2.5MのNaCl)90μLを添加した後、混合物を上記のビーズ精製プロトコールに従って洗浄した。平滑末端ライゲーション反応に関してはこのA尾部付加ステップを飛ばした。
【0172】
リンカーライゲーションのために、以下の配列(5’から3’へ)を有する2種のオリゴを使用して、アダプターポリヌクレオチド二重鎖:/5Phos/CCATTTCATTACCTCTTTCTCCGCACCCGACATAGAT*Tおよび/5Phos/ATCTATGTCGGGTGCGGAGAAAGAGGTAATGAAATGG*Tを形成した。末端修復した(平滑末端ライゲーション用)またはa尾部付加した(リンカーに基づくライゲーション用)を含有する乾燥ビーズを、ライゲーションマスターミックス(水30μL、5×KAPAライゲーション緩衝液10μL、およびKAPA T4 DNAリガーゼ5μL)45μL、および水5μL(平滑末端ライゲーション用)またはリンカーオリゴヌクレオチドの同等モル濃度ミックス5μL(リンカーに基づくライゲーション)と混合した。ビーズを徹底的に再懸濁させ、20℃で15分インキュベートした。PEG溶液(上記を参照されたい)50μLを添加した後、混合物を上記のビーズ精製プロトコールに従って洗浄した。
【0173】
Illustra Genomiphi V2 DNA Amplification Kitsを使用して多置換増幅(MDA)を実施した。ライゲーションした断片鎖を含有する乾燥ビーズをランダムな六量体を含有する緩衝液9μLに再懸濁させ、95℃で3分加熱し、その後、氷上で急速に冷却した。酵素ミックス1μLを添加した後、冷却した試料を30℃で90分インキュベートした。次いで、65℃で10分加熱することによって反応を停止させた。PEG溶液(上記を参照されたい)30μLを添加した後、混合物を上記の精製プロトコールに従って洗浄し、TE200μLに再懸濁させた(65℃で5分のインキュベーションを伴って)。所望であれば、精製された産物を、定量的PCR、デジタルドロップレットPCR(ddPCR)を用いて定量化すること、または次世代シークエンシング(NGS)を提案することができる。
【0174】
MDA後、長いライゲーションした断片鎖(例えば、>2kb)を、総体積130μLでCovaris S220を使用して超音波処理して約300bpにした。製造業者のプロトコールによりピーク電力140W、デューティ比10%、バースト当たり200サイクル、および処理時間80秒が指示された。インタクトな元の無細胞DNA断片が維持される可能性を上昇させるために約300bpの断片長を選択した。配列決定するために、所望であれば超音波処理したDNA断片にアダプターを付加するために、標準のライブラリー調製プロトコールを使用することができる。種々のリード組成物をIlluminaシークエンサー(HiSeqまたはMiSeqのいずれか)での対末端配列決定実行から戻した。接合部(自己接合部、またはアダプターをライゲーションステップに含めた場合ではアダプター接合部)がリードの内側にあるもの(5’および3’に非アダプター配列が隣接する)を使用して目的の配列をバーコード処理した。
(実施例5)
環状化および増幅
【0175】
これにより、環状化および増幅手順(「Nebula」手順とも称される)の例示的な説明がもたらされる。この手順では、以下の供給材料を使用した:PCR Machine(例えば、MJ research PTC−200 Peltier thermal cycler);Circligase II、ssDNA ligase Epicentre cat#CL9025K;Exonuclease(例えば、ExoI、NEB Biolabs cat#M0293S;ExoIII、NEB biolabs cat#M0206S);T4 Polynucleotide Kinase(NEB Biolab cat#M0201S);Whole Genome Amplification kit(例えば、GE Healthcare、Illustra、Ready−To−Go、Genomiphi、V3 DNA amplification kit);GlycoBlue(例えば、Ambion cat#AM9515);Micro centrifuge(例えば、Eppendrof 5415D);DNA purification beads(例えば、Agencourt、AMpure XP、Beckman Coulter cat#A63881);Magnetic stand(例えば、The MagnaRack(商標)Invitrogen cat#CS15000);Qubit(登録商標)2.0 Fluorometer(Invitrogen、cat#Q32866);molecular probes ds DNA HS assay kit(Life Technology cat#032854);およびBioanalyzer(Agilent 2100)、およびhigh sensitivity DNA reagents(cat#5067−4626)。
【0176】
5’末端リン酸を欠くDNA断片(例えば、無細胞DNA)を増幅するために、第1のステップは末端修復および単一鎖の形成であった。DNAを96℃で30秒変性させた(例えば、PCR機器において)。ポリヌクレオチドキナーゼ(PNK)反応を、DNA40μLおよび10×PNK反応緩衝液5μLと組み合わせ、その後、37℃で30分インキュベートすることによって調製した。1mMのATPおよびPNK酵素を反応に添加し、37℃で45分インキュベートした。DNAを沈殿させ、再懸濁させることによって緩衝液の交換を行った。PNK反応からのDNA50μL、0.5M、pH5.2の酢酸ナトリウム5μL、GlycoBlue1μL、オリゴ(100ng/μL)1μL、および100%エタノール150μLを合わせた。混合物を−80℃で30分インキュベートし、16k rpmで5分遠心分離してDNAをペレット化した。DNAペレットを70%エタノール500μLで洗浄し、室温で5分風乾させ、DNAを10mMのTris−Cl、pH8.0、12μLに懸濁させた。
【0177】
次いで、再懸濁させたDNAをライゲーションによって環状化した。DNAを96℃で30秒変性させ、試料を氷上で2分冷却し、リガーゼミックス(10×CircLigase緩衝液2μL、5Mのベタイン4μL、50mMのMnCl、1μL、CircLigase II、1μL)を添加した。ライゲーション反応物をPCR機器において60℃で16時間インキュベートした。ライゲーションしていないポリヌクレオチドをエキソヌクレアーゼ消化によって分解した。このために、DNAを80℃で45秒変性させ、Exoヌクレアーゼミックス(20U/μLのExoI:100U/μLのExoIII=1:2)1μLを各チューブに添加した。これを5回ピペッティングすることによって混合し、手短に回転させた。消化ミックスを37℃で45分インキュベートした。水30μLを用いて体積を50μLにし、上記の通り沈殿および再懸濁させることにより、さらに緩衝液の交換を行った。
【0178】
全ゲノム増幅(WGA)を行うために、精製したDNAをまず、65℃で5分変性させた。GE WGAキットからの変性緩衝液10μLを、精製したDNA10μLに添加した。DNAを冷却ブロックまたは氷上で2分冷却した。DNA20μLをReady−To−Go GenomiPhi V3 cake(WGA)に添加した。WGA反応物を30℃で1.5時間インキュベートし、その後、65℃で10分熱不活化した。
【0179】
試料を、AmpureXP磁気ビーズ(1.6×)を使用して精製した。ビーズをボルテックスし、80μLを1.5mLのチューブに分注した。次いで、水30μL、増幅されたDNA20μL、およびビーズ80μLを合わせ、室温で3分インキュベートした。チューブを磁気台に2分置き、透明な溶液をピペットで取り出した。ビーズを80%エタノールで2回洗浄した。10mMのTris−Cl、pH8.0を200μL添加することによってDNAを溶出させた。DNAビーズ混合物を65℃で5分インキュベートした。チューブを磁気台に戻して2分置いた。DNA195μLを新しいチューブに移した。1μLをQubitによる数量化のために使用した。最後に、WGA産物130μLを、Covaris S220を使用して超音波処理しておよそ400bpのサイズにした。
(実施例6)
追加的な精製を伴う環状化および増幅
【0180】
これにより、フェノールクロロホルム抽出ステップを伴う環状化および増幅手順(「Nebula」手順とも称される)の例示的な説明がもたらされる。
【0181】
ステップ1は、circligase反応のために競合RNA(抽出物中の担体RNAから)および天然RNA(同時精製された)の除去であった。RNA分解酵素A(10mg/ml)(Qiagen1007885)1μlをcfDNA(2〜10ng)50μlに添加し、PCR機器(MJ research PTC−200 Peltier thermal cycler)において37℃で30分インキュベートすることによってRNAを除去した。
【0182】
ステップ2は、塩およびエタノール沈殿を用いた緩衝液の交換であった。このステップは、ほぼ100%の回収率を伴うライゲーションのためにインプットを浄化し、濃縮するのに有用であった(一方、カラムでは一般に30%のみが回収される)。エタノール共沈殿剤ミックス(RNA分解酵素処理からのDNA50μL、0.5M、pH5.2の酢酸ナトリウム5μL、GlycoBlue(Ambion AM9515)1μL、担体オリゴ(100ng/μl)1μL、100%エタノール150μL)を−80℃で30分インキュベートし、16k rpm(Eppendorf 5415D)で5分遠心分離してDNAを沈殿させた。20−merの非特異的担体オリゴ(我々はPCRプライマーを使用した)を使用することにより、沈殿回収の収率および安定性がわずかに上昇した。DNAペレットを70%エタノール500μLで洗浄した。DNAペレットを室温で5分風乾させ、10mMのTris−Cl、pH8.0、13μLを用いて再懸濁させた。
【0183】
ステップ3は環状化であった。cfDNA12μLを96℃で30秒変性させ、氷ブロック上で2分冷却した。ライゲーションミックス(cfDNA12μL、10×Circligase緩衝液2μL、5Mのベタイン4μL、50mMのMnCl、1μL、Circligase II(Epicentre#CL9025K)1μLを冷却ブロック上にセットアップし、ライゲーションを60℃で16時間実施した。
【0184】
ステップ4は、エキソヌクレアーゼ消化であった。ライゲーションDNA混合物をPCR機器において80℃で45秒インキュベートし、その後、エキソヌクレアーゼ処理を行った。Exoヌクレアーゼミックス(20U/μLのExoI:100U/μLのExoIII=1:2)1μLを各チューブに添加し、反応物を37℃で30分インキュベートした。品質管理のために直鎖状の鋳型の除去は必要でなかった。
【0185】
ステップ5は、フェノールクロロホルム抽出ならびに塩およびエタノール沈殿を用いた緩衝液の交換であった。フェノール/エタノールは、80%超のライゲーション効率を実現するために役立った(環状化産物の量はインプットポリヌクレオチドの量とほぼ等しかった)。10mMのTris180μLをエキソヌクレアーゼ処理からのDNA20μLに添加して体積を200μLにし、フェノール200μLを使用してDNAを抽出した。水層を採取し、DNAをエタノール沈殿によって回収した。エタノール共沈殿剤ミックス(フェノール抽出後のDNA溶液200μL、0.5M、pH5.2の酢酸ナトリウム20μL、GlycoBlue1μL、担体オリゴ(100ng/μL)1μL、100%エタノール600μL)を−80℃で30分インキュベートし、16k rpmで5分遠心分離してDNAを沈殿させた。DNAペレットを70%エタノール500μLで洗浄した。DNAペレットを室温で5分風乾させ、10mMのTris−Cl、pH8.0、11μLを用いて再懸濁させた。
【0186】
ステップ6は全ゲノム増幅であった。精製したDNA10μLを加熱ブロック上、65℃で5分インキュベートし、GE Healthcare、Ready−To−Go、Genomiphi、V3 DNA増幅キットからの変性緩衝液10μLを添加した。DNAを室温で5分冷却した後、DNA20μLをReady−To−Go GenomiPhi V3 cake(WGA)に供した。増幅反応物を30℃で1.5時間インキュベートし、反応を65℃で10分熱不活化することによって終結させた。
【0187】
ステップ7は、AmpureXP磁気ビーズ(1.6×)を使用したビーズ精製であった。これは以前の実施例と同様に行った。
【0188】
ステップ8は以前の実施例と同様の超音波処理であった。次いで、定量的PCR、ddPCR、または配列決定ライブラリー構築に対するDNAの準備ができた。
(実施例7)
ライゲーション効率およびオンターゲット率の分析
【0189】
上記の実施例と同様に環状化し、全ゲノム適用に供したcfDNAを定量的PCR(qPCR)によって分析した。試料標的についてのqPCR増幅曲線の結果(KRASプライマーを使用)が図18に示されている。図18Aに示されている通り、インプットcfDNAの1/10のqPCR増幅により、31.75の平均Ct(サイクル閾値)がもたらされ、同じ試料のライゲーション産物の1/10では31.927の平均Ctがもたらされ、これにより、約88%の高いライゲーション効率が示される。ライゲーション効率は、約70%もしくはそれ超、約80%もしくはそれ超、約90%もしくはそれ超、約95%もしくはそれ超、またはそれ超、例えば、約100%などにわたり得る。いくつかの例では、環状化されなかった直鎖状DNAを除去し、したがって、ほぼ全てのDNAを環状形態から増幅することができる。各試料について、2連で3回実行した。図18Bに示されている通り、WGA産物10ngおよび参照ゲノムDNA(gDNA)(12878、10ng)の増幅曲線は、事実上、互いに重複した。WGA試料についての平均Ctは26.655であったが、gDNA試料についての平均Ctは26.605であり、これにより、96%を超える高いオンターゲット率が示される。所与の量の増幅されたDNA中のKRASの数は、増幅されなかったgDNAと同等であり、これにより、増幅プロセスに偏りがないことが示される。各試料を2連で3回試験した。対比点として、Louら(PNAS、2013年、110巻(49号))において提供される環状化プロトコールも試験した。上記の実施例の沈殿および精製ステップを欠くLouの方法を使用すると、直鎖状インプットDNAの10〜30%のみが環状DNAに変換された。そのような低回収率により、下流の配列決定および変異体の検出に対する難題が提示される。
(実施例8)
ddPCRによる増幅された環状化DNAの分析
【0190】
ドロップレットデジタルPCR(ddPCR)を使用して、環状化されたポリヌクレオチドから生じた全ゲノム増幅産物における対立遺伝子頻度の保存および偏りを評価した。一般に、ddPCRとは、PCR増幅を支持する、別個の容積測定的に定義済みの油中水液滴分配に封入された核酸分子を計数することによって絶対的な分量を測定するデジタルPCRアッセイを指す(Hinsonら、2011年、Anal. Chem. 83巻:8604〜8610頁;Pinheiroら、2012年、Anal. Chem. 84巻:1003〜1011頁)。単一のddPCR反応は、ウェル当たり少なくとも20,000の分配された液滴で構成されてよい。ドロップレットデジタルPCRは、PCR増幅を支持する、別個の容積測定的に定義済みの油中水液滴分配に封入された核酸分子を計数することによって絶対的な分量を測定するデジタルPCRアッセイを実施する任意のプラットフォームを使用して実施することができる。ドロップレットデジタルPCRの典型的な戦略は、以下の通り要約することができる:試料を希釈し、それぞれが目的の核酸分子のコピーを1つ含有するまたは含有しないように数千から数百万の別々の反応チャンバー(油中水液滴)に分配する。検出された、標的アンプリコン(すなわち、目的の核酸分子)を含有する「陽性」液滴の数と、標的アンプリコン(目的の核酸分子)を含有しない「陰性」液滴の数を使用して、元の試料に存在していた目的の核酸分子のコピーの数を決定することができる。ドロップレットデジタルPCRシステムの例としては、核酸鋳型を含有する試料を20,000ナノリットルサイズの液滴に分配する、Bio−RadによるQX100(商標)Droplet Digital PCR System;および核酸鋳型を含有する試料を1,000,000〜10,000,000ピコリットルサイズの液滴に分配する、RainDanceによるRainDrop(商標)digital PCR systemが挙げられる。ddPCRに関する方法のさらなる例は、WO2013181276A1において提供される。
【0191】
本実施例では、メラノーマ細胞株由来のBRAF V600EゲノムDNA(gDNA)を参照ゲノムDNA 12878と特定の割合(0%、0.67%、2.0%、6.67%、20%、または100%)で混合し、断片化して、cfDNAに見いだされるものと類似したサイズ(この場合、約150bp)の断片を作製した。混合したDNA試料(10ng)を環状化し、実施例2に従って増幅した。BRAF V600Eおよび野生型について、増幅されたDNA40ngをddPCRに供した。観察された突然変異対立遺伝子頻度は、図19においてグラフによって説明され、表で示されている。示されている通り、増幅を伴う観察された突然変異対立遺伝子頻度(図19の表の中央の行)は、インプット突然変異体対立遺伝子頻度(上の行)、ならびに増幅を伴わないゲノムDNA100ngからのddPCR結果(下の行)を反映する。ddPCRアウトプットからの対立遺伝子頻度を、液滴を含有する突然変異体および野生型の両方の合計に対する、液滴を含有するBRAF突然変異の数として算出する。増幅を伴うDNAは白抜きの丸で示されており、増幅を伴わないDNAは小さな黒塗りの丸で示されている。0.67%における小さな偏差を例外として、2つのデータセットは完全に重複する。これにより、突然変異体対立遺伝子頻度の真の表示が実質的に偏りなく保存されることが実証される。
(実施例9)
バックグラウンドを超える配列変異体の検出
【0192】
超音波処理したgDNA(150bp、Multi−Gene Multiplex参照DNA、Horizon)10ngを実施例2に記載の通り環状化し、増幅し、その後、超音波処理を行った。次いで、断片化DNAをRubicon配列決定ライブラリー構築に供した。捕捉配列決定後、参照ホットスポットから50bp以内の変異体をプロットした。変異体のコールに、異なる接合部によって区別される2つの異なるポリヌクレオチドの検出を要求した場合の変異体の検出の結果が図20に示されている。7つの予測される参照ホットスポット(KIT D816V、EGFR G719S、EGFR T790M、EGFR L858R、KRAS G13D、KRAS G12D、NRAS Q61K)が0位にプロットされている。2つの他の変異体も確認され、図20では白抜きの三角形およびダイヤモンドとして説明されている。
【0193】
比較のために、gDNAを、上記の通りであるが、超音波処理したgDNA10ngを一般的な慣習に従ってRubicon配列決定ライブラリー構築に直接供し、環状化を伴わず、2つの異なるポリヌクレオチドに対する配列変異体の確認を要求せずに、超音波処理した。捕捉配列決定後、参照ホットスポットから50bp以内の変異体を再度プロットし、結果が図21に示されている。7つの予測される参照ホットスポット(KIT D816V、EGFR G719S、EGFR T790M、EGFR L858R、KRAS G13D、KRAS G12D、NRAS Q61K)が0位にプロットされている。他の位置の変異体は予測されず、配列決定誤差に起因する可能性が最も高い。図20の作成に使用した方法の結果と対照すると、図21の結果により、標準の配列決定方法のランダムな誤差率がはるかに高く、それにより、対立遺伝子頻度が低い(例えば、5%未満など)場合に真の突然変異シグナルが遮蔽される可能性があることが示される。
【0194】
2つの異なるポリヌクレオチドの検出を要求して、および要求せずに、配列決定方法によって検出された感度およびバックグラウンドノイズの別々の分析の結果が図16〜17において説明されている。これらの図により説明される通り、検証の要求により、バックグラウンドノイズが著しく低下し、感度が上昇する。
(実施例10)
GC組成およびサイズ分布の分析
【0195】
超音波処理したgDNA(150bp、Multi−Gene Multiplex参照DNA、Horizon)10ngを実施例5と同様に増幅、環状化および増幅し、配列決定し、変異体コール2ポリヌクレオチド検証フィルターを用いて分析した(左側)。図22に示されている通り、様々なCG百分率を有する配列の数を表にし、グラフにプロットした。左端のプロットに示されている通り、実施例5に従って調製した試料の配列は、中心ピーク(基礎をなすゲノムの全GC含量に対応する)以外は大部分が理論的分布と類似している。対照的に、同じ量のgDNAを、Rubicon配列決定ライブラリー構築キットを使用した増幅を伴わずに配列決定ライブラリーを構築するために直接使用した場合、配列決定結果と理論的分布の差異は、非常に明らかである(中央のプロットを参照されたい)。この直接Rubicon配列決定の中心ピークは理論的分布よりも大きい。Newmanら(2014年;Nature Medicine、(20巻):548〜54頁)は、cfDNA32ngを使用した場合、cfDNA配列決定GC含量分布は理論的分布と同様であったことを報告した。これは、右端のプロットにおいて説明されている。
【0196】
実施例5と同様に環状化し、増幅し、配列決定したcfDNAについて、DNAサイズ分布を評価した。図23に示されている通り、配列決定結果によって示される断片の長さの分布のピークは約150〜180bpにおいてであり、これは、cfDNAの典型的な分布パターンと類似している。
(実施例11)
増幅均一性の評価
【0197】
実施例5に従って環状化し増幅した産物10種のqPCR結果を、増幅しなかった参照DNA(12878細胞株由来のgDNA、Coriell Institute)と比較した。ゲノム参照DNAまたは増幅産物10ngを各リアルタイムqPCR反応のために使用し、ゲノム参照に対する増幅産物の相対的な数量化によって比を生じさせた。図24に示されている通り、各PCRの比は2倍の変化の範囲内であり、これにより、増幅されたDNAプール内のこれらの標的のコピー数が増幅しなかった参照DNAと非常に類似していることが示唆される。6遺伝子(BRAF、cKIT、EGFR、KRAS、NRAS、PI3KCA)からPCRプライマー10対を設計し、予め検証した。
(実施例12)
DNA断片の増幅収率の数量化
【0198】
cfDNAを患者4名(患者1〜4)および健康な対照1名から単離した。ゲノムDNA(gDNA、Multi−Gene Multiplex Horizon)を超音波処理し、およそ150bpの断片にした。DNAを環状化し、ランダムプライマーを用いて増幅した。表7は、増幅反応へのDNAインプットの量、および増幅によって生成するDNAの量を示す。最小の試料(0.4ng)でさえ有意な増幅が得られ、全ての試料が少なくとも600倍に増幅した。
【表7】
(実施例13)
がん患者のcfDNAからの低頻度突然変異の検出
【0199】
ステップ1では、cfDNAを環状化した。環ライゲーションミックスを室温でPCRチューブ中に調製した。4ng〜10ngのcfDNAを、ピペットで体積12μlを取りPCRチューブ中に入れた。DNAを96℃で30秒変性させ、次いで、PCRチューブを氷上で2分冷却した。ライゲーションミックス(10×CircLigase緩衝液2μl、5Mのベタイン4μl、50mMのMnCl2、1μl、CircLigase II、1μl)を各チューブに添加し、PCR機器において反応を60℃で16時間進行させた。
【0200】
ステップ2では、ライゲーション反応物を処理してライゲーションしていない直鎖状DNAを除去した。エキソヌクレアーゼミックス(NEB M0206S、M0293S;20u/μlのExoI:100u/μlのExoIII=1:2)1μlを各チューブに添加し、混合し、PCR機器において37℃で30分インキュベートした。
【0201】
ステップ3では、緩衝液の交換に関してライゲーション反応物を精製した。ライゲーション産物をOligo Clean&Concentrator(Zymo Research)を用いて精製した。エキソヌクレアーゼ処理後、結合ミックス(10mMのTris、30μl、オリゴ結合緩衝液100μl、100%エタノール400μl)をライゲーション反応物に添加し、混合し、手短に遠心沈殿させた。Zymo−スピンカラムをローディングし、10,000×g超で30秒回転させた。カラムをDNA洗浄緩衝液750μlで洗浄し、14,000×gで1分遠心分離した。10mMのTris、15μlを用い、10,000×g超で30秒遠心分離することによってDNAを溶出した。
【0202】
ステップ4では、DNAをランダムプライミングによって増幅した。全ゲノム増幅(WGA)を、Ready−To−Go Genomiphi V3 DNA amplification Kit(GE Healthcare)を用いて実施した。精製されたライゲーション物10μlを2×変性緩衝液10μlと混合し、95℃で3分インキュベートし、次いで、氷上で4℃まで冷却した。変性DNA20μlをWGAプレミックスに添加し、試料を30℃で1.5時間インキュベートし、その後、65℃で10分不活化した。
【0203】
ステップ5では、Agencourt AMPure XP Purification(1.6×)(Beckman Coulter)を使用して増幅産物を浄化した。10mMのTris、30μlおよびAMpureビーズ80μlをWGA反応物20μlに添加した。混合物を室温で2分インキュベートした。チューブを磁石台に置き、2分インキュベートした。上清を取り出し、廃棄した。試料をエタノール(80%)200μlで2回洗浄し、5分風乾させ、10mMのTris、pH8.0、200μlを用いてDNAを溶出した。
【0204】
ステップ6では、WGA DNAを断片化した。WGA産物130μlを、Covaris S220 sonicatorを使用して超音波処理して、およそ400bpの断片サイズを得た。Covaris S220の設定は以下の通りであった:ピーク入射電力=140W、デューティ比=10%、バースト当たりのサイクル=200、処理時間=55秒。
【0205】
ステップ7では、試料をqPCRによって数量化した。ライゲーション効率を測定するために、ライゲーションインプットの1/10およびライゲーション産物をqPCR反応のために使用し、3つの反復を伴った。断片化されたWGA産物10ngを、参照gDNA(12878細胞株)10ngと共に、qPCRのために使用して、オンターゲット率を測定した。反応物は、2×マスターミックス(TaqMan Fast Universal PCR master mix(2×)、Applied Biosystems;Evagreen dye、Biotium)5μl、プライマー(5μM)0.5μl、HO、1.2μl、DNA10μlを含んだ。以下のプログラムに従って増幅を進行させた:95℃で2分;および[95℃で10秒;60℃で20秒]を40サイクル。
【0206】
ステップ8では、配列決定ライブラリーを構築した。超音波処理した増幅されたDNA500〜1000ngから、KAPA Hyper Prep Kit(KK8500)またはKAPA Library Preparation Kit with Standard PCR Library(KK8200)を使用して配列決定ライブラリーを調製した。アダプターライゲーション(1uMのアダプター最終濃度)を製造業者のプロトコールに従って調製した。ライゲーション産物のアダプターライゲーションした洗浄物、20%PEG8000/2.5MのNaCl溶液30μl(0.3×)を再懸濁させたライゲーション産物100μlに添加した。ビーズをライゲーション産物と徹底的に混合し、室温で15分インキュベートした。次いで、液体が透明になるまでビーズを磁石上に捕捉した。次いで、上清130μlを、Ampure XPビーズを使用したサイズ選択に供した。試料を新しいプレートに移し、その後、Ampure XPビーズ(0.5×)20μlを添加した。ライゲーション産物をすぐにビーズに捕捉し、80%エタノール200μlで2回洗浄した。次いで、ライゲーション産物をEB緩衝液20μl中に再懸濁させ、溶出した。サイズ選択および精製後、ライゲーション産物20μlを2×KAPA HiFi Hotstart ready mix、25μlおよび10μMのP5+P7プライマー(5’CAAGCAGAAGACGGCATACGA3’、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’)5μlに添加し、以下のサイクリングプログラムを使用してライブラリーを増幅した:98℃で45秒;(98℃で15秒;60℃で30秒;72℃で30秒)を5サイクル;72℃で60秒。増幅されたライブラリーを20×に希釈した後、定量化のために断片分析機器またはバイオアナライザー(高感度チップ)にローディングした。ゲルサイズ選択機(Sage ScienceからのBlue Pippin prep)によってさらなるサイズ選択を行った。
【0207】
ステップ9では、配列決定ライブラリーを、xGEN Pan−Cancer Panel v1.5、127908597(IDT)からのプローブを使用したプローブ捕捉富化によって富化した。ステップ10では、ライブラリーをHiSeq2500において、平均深さ1000×で配列決定した。
【0208】
ステップ11では、配列決定データを解析して変異体コールを行った。変異体コールは、2つの異なるポリヌクレオチド(例えば、異なる接合部によって同定)において生じている配列の差異を変異体として計数することを要求するステップを含んだ。いくつかの体細胞突然変異が検出され、それらはまた、公共のデータベース(COSMIC(Catalog of Somatic Mutations in Cancer))に報告された。同定された突然変異としては、0.05%対立遺伝子頻度を有するBRAF V600Mがあり、これにより、インプットが少ない場合であってもこのシステムが高感度であることが実証される。様々な突然変異の検出の結果を、それらの試料における頻度を含め、表8に示す。
【表8】
(実施例14)
FFPE試料由来のマルチプレックス参照DNAからの正確な突然変異の検出
【0209】
試料Horizon FFPE−マルチプレックス(HD200)から、製造業者のプロトコール(Covaris truXTRAC(商標)FFPE DNA Kit)に従ってDNAを抽出した。FFPE gDNA130μlを、Covaris S220 sonicatorを使用して超音波処理して、およそ150bpの断片サイズを得た(Covaris S220の設定:ピーク入射電力=175W、デューティ比=10%、バースト当たりのサイクル=200、処理時間=430秒)。11μl体積のDNA50ngを95℃で30秒変性させた。HO、10.5μl、リガーゼ緩衝液(NEB B0202S)2.5μl、およびT4 Polynucleotide Kinase(NEB M0201S)1μlを添加した。リン酸化のために反応物を37℃で30分インキュベートした。
【0210】
試料をライゲーションし、次いで、Oligo Clean&Concentrator(Zymo Research)を用いて精製した。エキソヌクレアーゼ処理後に結合ミックス(10mMのTris、30μl、オリゴ結合緩衝液100μl、100%エタノール400μl)をライゲーション反応物に添加し、ボルテックスによって混合し、手短に回転させた。試料をZymo−スピンカラムにローディングし、10,000×g超で30秒回転させた。カラムをDNA洗浄緩衝液750μlで洗浄し、14,000×gで1分遠心分離した。10mMのTris、15μlを用い、10,000×g超で30秒遠心分離することによってDNAを溶出した。
【0211】
試料を実施例13におけるステップ5〜11に従ってさらに処理し、分析した。結果を表9に要約する。Horizon’s multiple mutation standard DNAにおける9つの突然変異の表示はこのプロセスによってほぼ保持されたが、DNAの数量は少なくとも600倍に増加した。
【表9】
(実施例15)
がん突然変異細胞株gDNA多量体からの低頻度突然変異の検出
【0212】
本実施例では、超音波処理したゲノムDNAをライゲーションして多量体を形成し、次いで、それを増幅、断片化、および分析に供した。図25は、このプロセスの例を説明する。
【0213】
BRAF V600E突然変異を含有するメラノーマ細胞株SK−−mel−28(ATCC)由来のgDNAを参照gDNA(12878 Coriell Institute)と混合して、1%BRAF V600Eを実現した。DNAを実施例14と同様に超音波処理して、およそ150bpの断片サイズを得た。11μl体積のDNA100ngを95℃で30秒変性させ、HO、10.5μl、リガーゼ緩衝液(NEB B0202S)2.5μl、およびT4 Polynucleotide Kinase(NEB M0201S)1μlを添加し、その後、37℃で30分インキュベートしてDNAをリン酸化した。
【0214】
Oligo Clean&Concentrator(Zymo Research)を用いて試料を精製した。これは、エキソヌクレアーゼ処理後に結合ミックス(10mMのTris、25μl、オリゴ結合緩衝液100μl、100%エタノール400μl)をライゲーション反応に添加することを含んだ。これをボルテックスによって混合し、手短に回転させた。Zymo−スピンカラムをローディングし、10,000×g超で30秒回転させ、DNA洗浄緩衝液750μlで洗浄し、14,000×gで1分遠心分離した。10mMのTris、15μlを用い、10,000×g超で30秒遠心分離することによってDNAを溶出した。
【0215】
ライゲーションするために、4μl体積のDNA6ngを10×末端修復緩衝液(Enyzymatics)0.45μl、25mMのdNTP、0.05μl、10mMのATP、0.5μl、End repair enzyme mix(Enyzymatics)、および2000単位/μlのT4リガーゼと混合した。反応物を25℃で30分、その後、75℃で20分インキュベートした。
【0216】
全ゲノム増幅を、Ready−To−Go Genomiphi V3 DNA amplification Kit(GE Healthcare)を用いて実施した。HO、8μlおよび精製されたライゲーション物10μlを、2×変性緩衝液10μlと混合した。DNAを95℃で3分変性させ、次いで、氷上で4℃まで冷却した。変性DNA20μlをWGAプレミックスに添加し、30℃で1.5時間インキュベートし、その後、65℃で10分不活化した。
【0217】
次いで、増幅反応物を、Agencourt AMPure XP Purification(1.6×)(Beckman Coulter)を使用して浄化した。10mMのTris、30μlおよびAMpureビーズ80μlをWGA反応物20μlに添加した。これを室温で2分インキュベートした。チューブを磁石台に置き、2分インキュベートした。上清を取り出し、廃棄した。ビーズをエタノール(80%)200μlで2回洗浄し、次いで、5分風乾させた。10mMのTris、pH8.0、200μlを用いてDNAを溶出した。次いで、WGA産物130μlを、Covaris S220 sonicatorを使用して断片化して、およそ400bpの断片サイズを得た(Covaris S220の設定:ピーク入射電力=140W、デューティ比=10%、バースト当たりのサイクル=200、処理時間=55秒)。
【0218】
BioRad Prime PCR ddPCR mutation detection assayを使用したddPCRによって突然変異を検出した。突然変異−検出ddPCR反応物は、室温でPCRチューブ中に集合させた(増幅されたDNA80ng、プローブ用の2×ddPCRスーパーミックス10μl、20×標的(BRAF V600E、BioRad)プライマー(9μM)/プローブ(FAM;5μM)1μl、20×野生型プライマー(9μM)/プローブ(HEX;5μM)1μl、DNA試料(50ng)8μl。反応物を5回ピペッティングすることによって混合し、次いで、液滴発生剤カートリッジに移した。QX200液滴発生剤を使用して液滴を生じさせ、96ウェルのPCRプレートに移し、以下のPCRプログラムを使用して増幅した:95℃で10分;[94℃で30秒、55℃で1分]を40サイクル;98℃で10分。PCR反応プレートをQX200液滴リーダーに移して結果を数量化した。インプットDNAに基づいて、BRAF V600E突然変異の予測される頻度は1%であった。このライゲーションおよび増幅手順により、この頻度はほぼ維持されたが(ddPCR分析に従って1.41%)、DNAの数量は約200倍に増加した。
【0219】
本発明の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本発明から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の本発明の実施形態に対する種々の代替を、本発明の実施において使用することができることが理解されるべきである。以下の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲に入る方法および構造ならびにそれらの等価物がそれにより包含されることが意図されている。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]