(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-09-26
(54)【発明の名称】遺伝子ライブラリーの高効率構築および遺伝子解析のためのアダプターおよび方法
(51)【国際特許分類】
C12Q 1/6876 20180101AFI20230919BHJP
C12Q 1/6806 20180101ALI20230919BHJP
C12N 15/10 20060101ALI20230919BHJP
C12N 15/11 20060101ALI20230919BHJP
C40B 40/06 20060101ALI20230919BHJP
C12Q 1/6851 20180101ALI20230919BHJP
C12Q 1/686 20180101ALI20230919BHJP
C12Q 1/6869 20180101ALI20230919BHJP
【FI】
C12Q1/6876 Z
C12Q1/6806 Z ZNA
C12N15/10 Z
C12N15/11 Z
C40B40/06
C12Q1/6851 Z
C12Q1/686 Z
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023515279
(86)(22)【出願日】2021-09-08
(85)【翻訳文提出日】2023-04-12
(86)【国際出願番号】 US2021049448
(87)【国際公開番号】W WO2022055984
(87)【国際公開日】2022-03-17
(32)【優先日】2020-09-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515138791
【氏名又は名称】レゾリューション バイオサイエンス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】グオ, ジアンナン
(72)【発明者】
【氏名】ヘルナンデス, ジェニファー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA17
4B063QA18
4B063QQ28
4B063QQ42
4B063QQ62
4B063QR08
4B063QR32
4B063QR42
4B063QR62
4B063QR66
4B063QS03
4B063QS25
4B063QS34
4B063QS36
4B063QS39
4B063QX02
(57)【要約】
本開示は、細胞核酸の多重検出および解析のための組成物および方法を提供する。いくつかの実施形態では、本開示は、本開示の方法で使用するための多機能アダプターを提供する。いくつかの実施形態では、本開示の組成物および方法は自動化可能である。本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは3’末端にdTオーバーハングを含み、dsDNA断片は各鎖の3’末端にdAオーバーハングを含む。
【特許請求の範囲】
【請求項1】
a)ライゲーション鎖オリゴヌクレオチドと、
b)ライゲーション鎖オリゴヌクレオチドの3’末端の領域にハイブリダイズし、それと共に二重鎖を形成することができる非ライゲーション鎖オリゴヌクレオチドと、を含み、
前記ライゲーション鎖オリゴヌクレオチドが、試料からのdsDNA断片と接触すると、前記dsDNA断片の各鎖の5’末端に連結し、
前記ライゲーション鎖オリゴヌクレオチドが、
i)3’末端オーバーハングと、
ii)プライマー認識部位として働くことができるポリヌクレオチド配列を含む増幅領域と、
iii)ユニーク多機能性ID領域と、
iv)ユニーク分子識別子(UMI)マルチプライヤーと、
v)前記非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を含むアンカー領域と、を含み、
前記dsDNA断片が、各鎖の5’末端にリン酸基を含み、各鎖の3’末端にオーバーハングを含み、
前記多機能性ID領域と前記UMIマルチプライヤーとの組み合わせが、前記dsDNA断片を識別し、
前記多機能性ID領域が、前記試料を識別する、多機能アダプター。
【請求項2】
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdTオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdAオーバーハングを含み、
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdAオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdTオーバーハングを含み、
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdCオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdGオーバーハングを含むか、または
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdGオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdCオーバーハングを含む、請求項1に記載の多機能アダプター。
【請求項3】
前記非ライゲーション鎖オリゴヌクレオチドが、その3’末端に、前記dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾を含み、前記非ライゲーション鎖が前記二重鎖から置換され得る、請求項1または2に記載の多機能アダプター。
【請求項4】
前記増幅領域が、25ヌクレオチド長であり、
前記多機能性ID領域が、8ヌクレオチド長であり、
前記UMIマルチプライヤーが、3ヌクレオチド長であり、
前記アンカー領域が、10ヌクレオチド長であり、
前記UMIマルチプライヤーが、前記多機能性ID領域に隣接しているか、または前記多機能性ID領域内に含まれている、かつ
前記アンカー領域が、4つのヌクレオチド配列のうちの1つを含む、請求項1~3のいずれか一項に記載の多機能アダプター。
【請求項5】
多機能アダプターとdsDNA断片とを含む複合体であって、前記多機能アダプターが、請求項1~4のいずれか一項に記載の多機能アダプターから選択される、複合体。
【請求項6】
アダプタータグ付きDNAライブラリーを作製するための方法であって、
a)複数の多機能アダプターを複数のdsDNA断片と連結して、複数の多機能アダプター/dsDNA断片複合体を生成することであって、前記複数の多機能アダプターのそれぞれが、請求項1~4のいずれか一項に記載の多機能アダプターから選択されることと、必要に応じて、
b)工程(a)からの前記複数の複合体を1またはそれを超える酵素と接触させて、複数の連続したアダプタータグ付きDNA断片を含むアダプタータグ付きDNAライブラリーを形成することと、を含む、方法。
【請求項7】
前記複数の複合体の各多機能アダプター/dsDNA断片複合体が、前記dsDNA断片の各末端に連結された多機能アダプターを含む、請求項6に記載の方法。
【請求項8】
前記複数のdsDNA断片が、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNAまたは脱メチル化DNAを含む、請求項6または請求項7に記載の方法。
【請求項9】
前記複数のdsDNA断片が、複数の多機能アダプターと連結する前に末端修復される、請求項6~8のいずれか一項に記載の方法。
【請求項10】
前記非ライゲーション鎖オリゴヌクレオチドが、工程(b)において前記多機能アダプター/dsDNA断片複合体から置換される、請求項6~9のいずれか一項に記載の方法。
【請求項11】
前記方法が、複数の増幅連続アダプタータグ付きdsDNA断片を含む増幅アダプタータグ付きDNAライブラリーを生成するために、前記複数の連続アダプタータグ付きDNA断片を増幅することを含む、請求項6~10のいずれか一項に記載の方法。
【請求項12】
増幅のために1またはそれを超えるプライマーが使用され、前記1またはそれを超えるプライマーが、前記アダプターの前記プライマー結合領域にハイブリダイズするユニバーサルプライマー結合配列を含む、請求項11に記載の方法。
【請求項13】
請求項6~12のいずれか一項に記載の方法に従って作製されたアダプタータグ付きDNAライブラリー。
【請求項14】
プローブ捕捉ライブラリーを作製するための方法であって、
a)請求項13に記載のアダプタータグ付きDNAライブラリーを、1またはそれを超える多機能捕捉プローブとハイブリダイズさせて、1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を形成することであって、各多機能捕捉プローブが、
i)パートナーオリゴヌクレオチドにハイブリダイズすることができる第1の領域であって、必要に応じて、PCRプライマー結合部位を含むテール配列を含む前記第1の領域と、
ii)前記アダプタータグ付きDNAライブラリー中の標的領域にハイブリダイズすることができる第2の領域と、を含む、ハイブリダイズすることと、
b)工程(a)から前記1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を単離することであって、各単離された捕捉プローブ/アダプタータグ付きDNA複合体が、捕捉プローブおよびアダプタータグ付きDNA断片を含む、単離することと、
c)工程(b)からの単離された捕捉プローブ/DNA断片複合体を酵素的処理して、ハイブリッド分子を含むプローブ捕捉DNAライブラリーを生成することであって、各ハイブリッド分子は、
i)捕捉プローブの少なくとも一部またはその相補体と、
ii)DNA断片またはその相補体の少なくとも一部と、
iii)アダプターと、を含む、酵素的処理することと、を含む、方法。
【請求項15】
(c)の前記酵素処理工程が、前記複合体中の前記アダプタータグ付きDNA断片を鋳型として使用して、前記捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うことを含む、請求項14に記載の方法。
【請求項16】
少なくとも1つの捕捉プローブが前記標的領域中の特定領域の下流にハイブリダイズし、少なくとも1つの捕捉プローブが前記標的領域中の前記特定領域の上流にハイブリダイズする、請求項14または請求項15に記載の方法。
【請求項17】
d)増幅ハイブリッド分子を生成するために工程(c)からの前記ハイブリッド分子に対してPCRを行う工程を、
更に含む、請求項14~16のいずれか一項に記載の方法。
【請求項18】
請求項14~17のいずれか一項に従って作製されたハイブリッド分子または増幅ハイブリッド分子を含むプローブ捕捉ライブラリー。
【請求項19】
請求項18に記載のプローブ捕捉ライブラリーに対して標的遺伝子解析を行うことを含む方法。
【請求項20】
前記標的遺伝子解析が、配列解析またはコピー数解析を含む、請求項19に記載の方法。
【請求項21】
前記ハイブリッド分子の各々における前記捕捉プローブ領域の全部または一部が配列決定される、請求項19または20に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2020年9月8日に出願された米国仮出願第63/075,543号に基づく優先権を主張し、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
発明の分野
【0002】
本開示は、遺伝子ライブラリーの高効率構築のための組成物および方法並びにその使用方法に関する。本明細書中に記載される組成物および方法を使用して作製される遺伝子ライブラリーは、遺伝子解析のために使用され得る。
配列表
【0003】
本出願は、ASCII形式で電子的に提出された配列表を含み、その全体が参照により本明細書に組み込まれる。2021年9月7日に作成された前記ASCIIコピーは、CLFK_006_01WO_SeqList_ST25と名付けられ、サイズが約20KBである。
【背景技術】
【0004】
背景
次世代シーケンシング(NGS)は、遺伝子変化を識別するために様々な臨床現場で使用することができる。NGSは、試料前処理、ライブラリー調製、シーケンシング、およびバイオインフォマティクスのプロセス要素に大別される。現在、試料の前処理およびライブラリーの調製は、大部分が自動化されずに行われる労働集約的なプロセスである。ライブラリー調製プロトコルは、通常、多段階プロセスからなり、高価な試薬および実質的なハンズオン時間を必要とする。NGSにおけるこのボトルネックに対処するために、試料多重化、高スループット、および感度の向上を可能にする自動化されたNGS方法が非常に望まれている。
【発明の概要】
【課題を解決するための手段】
【0005】
簡単な要旨
本開示は、a)ライゲーション鎖オリゴヌクレオチドと、b)ライゲーション鎖オリゴヌクレオチドの3’末端の領域にハイブリダイズし、それと共に二重鎖を形成することができる非ライゲーション鎖オリゴヌクレオチドと、を含み、
ライゲーション鎖オリゴヌクレオチドが、試料由来の二本鎖DNA(dsDNA)断片と接触すると、dsDNA断片の各鎖の5’末端に連結し、ライゲーション鎖オリゴヌクレオチドが、i)3’末端オーバーハングと、ii)プライマー認識部位として働くことができるポリヌクレオチド配列を含む増幅領域と、iii)ユニーク多機能性ID領域と、iv)ユニーク分子識別子(UMI)マルチプライヤーと、v)非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を含むアンカー領域と、を含み、dsDNA断片が、各鎖の5’末端にリン酸基を含み、各鎖の3’末端にオーバーハングを含み、各dsDNA断片が、多機能性ID領域とUMIマルチプライヤーとの組み合わせによって識別されることができ、試料が、多機能性ID領域によって識別され得る、多機能アダプターを提供する。
【0006】
本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは3’末端にdTオーバーハングを含み、dsDNA断片は各鎖の3’末端にdAオーバーハングを含む。
【0007】
本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは3’末端にdAオーバーハングを含み、dsDNA断片は各鎖の3’末端にdTオーバーハングを含む。
【0008】
本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは3’末端にdCオーバーハングを含み、dsDNA断片は各鎖の3’末端にdGオーバーハングを含む。
【0009】
本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは3’末端にdGオーバーハングを含み、dsDNA断片は各鎖の3’末端にdCオーバーハングを含む。
【0010】
本開示の多機能アダプターのいくつかの実施形態では、ライゲーション鎖オリゴヌクレオチド中の増幅領域は、PCR、LAMP、NASBA、SDA、RCAまたはLCRのプライマー認識部位として働くことができるポリヌクレオチド配列を含む。
【0011】
本開示の多機能アダプターのいくつかの実施形態では、非ライゲーション鎖オリゴヌクレオチドは、dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾をその3’末端に含む。
【0012】
本開示の多機能アダプターのいくつかの実施形態では、試料は、哺乳動物から単離されるか、または由来する。いくつかの実施形態では、哺乳動物はヒト疾患の動物モデルである。いくつかの実施形態では、哺乳動物は、マウス、ラット、モルモット、ウサギ、ブタ、ネコ、イヌ、ヒツジまたはウマである。いくつかの実施形態では、哺乳動物は非ヒト霊長類(NHP)である。いくつかの実施形態では、哺乳動物はヒトである。
【0013】
本開示の多機能アダプターのいくつかの実施形態では、試料は、1またはそれを超える細胞型から単離されるかまたは由来する。いくつかの実施形態では、試料は、1またはそれを超える組織型から単離されるかまたは由来する。いくつかの実施形態では、試料は、1またはそれを超える供給源から単離されるか、または由来する。いくつかの実施形態では、1またはそれを超える供給源はドナーを含む。いくつかの実施形態では、ドナーはヒトである。いくつかの実施形態では、ドナーは、健常ドナーまたは対照ドナーである。いくつかの実施形態では、1またはそれを超える供給源は、(例えば、臨床試験の)患者または対象を含む。いくつかの実施形態では、患者または対象はヒトである。いくつかの実施形態では、患者または対象は、健常または対照の患者または対象である。いくつかの実施形態では、患者または対象は、試験患者または対象である。いくつかの実施形態では、患者または対象は、疾患または障害の徴候または病徴を呈する。いくつかの実施形態では、患者または対象は妊娠している。いくつかの実施形態では、患者または対象は、疾患または障害のファミリー歴または遺伝マーカーを示す。
【0014】
本開示の多機能アダプターのいくつかの実施形態では、試料は組織生検である。いくつかの実施形態では、組織生検は、腫瘍または腫瘍であると疑われる組織から採取される。
【0015】
本開示の多機能アダプターのいくつかの実施形態では、dsDNA断片は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNA、または脱メチル化DNAである。いくつかの実施形態では、dsDNA断片は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNA、および脱メチル化DNAのうちの1またはそれを超えるものを含む。いくつかの実施形態では、dsDNA断片は無細胞DNA(cfDNA)を含む。いくつかの実施形態では、dsDNA断片はゲノムDNA(gDNA)を含む。いくつかの実施形態では、dsDNA断片は相補的DNA(cDNA)を含む。いくつかの実施形態では、dsDNA断片はミトコンドリアDNAを含む。いくつかの実施形態では、dsDNA断片はメチル化DNAを含む。いくつかの実施形態では、dsDNA断片は、脱メチル化DNAを含む。
【0016】
本開示の多機能アダプターのいくつかの実施形態では、dsDNAは、試料または試験試料から単離されるかまたは由来する。いくつかの実施形態では、試料または試験試料は生物学的試料を含む。いくつかの実施形態では、生物学的試料は、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、便、粘液、涙および汗からなる群から選択される生物学的体液を含む。いくつかの実施形態では、生物学的試料または生物学的体液は羊水を含む。いくつかの実施形態では、生物学的試料または生物学的体液は、全血、血漿、バフィーコートおよび血清のうちの1またはそれを超えるものを含む。いくつかの実施形態では、生物学的試料または生物学的体液はリンパ液を含む。いくつかの実施形態では、生物学的試料または生物学的体液は脳脊髄液を含む。いくつかの実施形態では、生物学的試料または生物学的体液は尿を含む。いくつかの実施形態では、生物学的試料または生物学的体液は、唾液、便、粘液、涙および汗のうちの1またはそれを超えるものを含む。
【0017】
本開示の多機能アダプターのいくつかの実施形態では、dsDNA断片は、ゲノムDNAを断片化して少なくとも1つのDNA断片を生成することを含む方法によって得られる。いくつかの実施形態では、本方法は、断片化工程の前に、少なくとも1つの細胞を含む試料からゲノムDNAを単離することをさらに含む。いくつかの実施形態では、断片化することは、ゲノムDNAを少なくとも1つの酵素と接触させることを含み、酵素はゲノムDNAを消化して少なくとも1つのDNA断片を生成する。いくつかの実施形態では、断片化することは、少なくとも1つのDNA断片を生成するためにゲノムDNAに機械的ストレスを加えることを含む。いくつかの実施形態では、断片化することは、ゲノムDNAを1またはそれを超える化合物と接触させて、ゲノムDNAの1またはそれを超える結合を化学的に破壊することを含む。いくつかの実施形態では、機械的ストレスは、ゲノムDNAを超音波処理して少なくとも1つのDNA断片を生成することを含む。いくつかの実施形態では、断片化工程に続いて、方法は、少なくとも1つのDNA断片と酵素とを接触させることをさらに含み、酵素は、DNA断片の一端または両端を消化して、1またはそれを超える平滑末端を含むDNA断片を生成する。いくつかの実施形態では、断片化工程に続いて、方法は、デオキシリボ核酸アデニン(dA)テールを少なくとも1つのDNA断片の一方または両方の平滑末端に付着することをさらに含む。いくつかの実施形態では、断片化工程の後、本方法は、少なくとも1つのDNA断片の一端または両端をリン酸化することをさらに含む。いくつかの実施形態では、断片化工程に続いて、方法は、テールおよびリン酸化工程を同時にまたは連続的に付着することをさらに含む。いくつかの実施形態では、断片化工程に続いて、方法は、テールおよびリン酸化工程を連続的に付着することをさらに含む。いくつかの実施形態では、テールの付着工程は、リン酸化工程に続く。いくつかの実施形態では、リン酸化工程は、テールの付着工程に続く。
【0018】
本開示の多機能アダプターのいくつかの実施形態では、dsDNA断片は、(a)試験試料からゲノムDNAを単離することと、(b)ゲノムDNAを断片化して、ゲノムDNA断片を得ることと、を含む工程によって得られる。いくつかの実施形態では、工程(b)は、ゲノムDNAを少なくとも1つの消化酵素と接触させることによって行われる。いくつかの実施形態では、工程(b)は、ゲノムDNAに機械的ストレスを加えることによって行われる。いくつかの実施形態では、機械的ストレスは、ゲノムDNAを超音波処理することによって加えられる。
【0019】
本開示の多機能アダプターのいくつかの実施形態では、dsDNA断片は、(a)試験試料から細胞DNAを単離することと、(b)細胞DNAを断片化して、ゲノムDNA断片を得ることと、を含む工程によって得られる。いくつかの実施形態では、工程(b)は、細胞DNAを少なくとも1つの消化酵素と接触させることによって実施される。いくつかの実施形態では、工程(b)は、細胞DNAに機械的ストレスを加えることによって行われる。いくつかの実施形態では、機械的ストレスは、細胞DNAを超音波処理することによって加えられる。
【0020】
本開示の多機能アダプターのいくつかの実施形態では、増幅領域は10~50ヌクレオチド長である。いくつかの実施形態では、増幅領域は20~30ヌクレオチド長である。いくつかの実施形態では、増幅領域は25ヌクレオチド長である。
【0021】
本開示の多機能アダプターのいくつかの実施形態では、多機能性ID領域は3~50ヌクレオチド長である。いくつかの実施形態では、多機能性ID領域は3~15ヌクレオチド長である。いくつかの実施形態では、多機能性ID領域は8ヌクレオチド長である。
【0022】
本開示の多機能アダプターのいくつかの実施形態では、UMIマルチプライヤーは、多機能性ID領域に隣接するか、または多機能性ID領域内に含まれる。いくつかの実施形態では、UMIマルチプライヤーは、1~5ヌクレオチド長である。いくつかの実施形態では、UMIマルチプライヤーは3ヌクレオチド長であり、64個の可能なヌクレオチド配列のうちの1つを含む。
【0023】
本開示の多機能アダプターのいくつかの実施形態では、アンカー領域は1~50ヌクレオチド長である。いくつかの実施形態では、アンカー領域は5ヌクレオチド~25ヌクレオチド長である。いくつかの実施形態では、アンカー領域は10ヌクレオチド長である。
【0024】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターが複数のdsDNA断片に連結される。
【0025】
いくつかの実施形態では、dsDNA断片は、複数の多機能アダプターと連結する前に末端修復される。
【0026】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの増幅領域は、同一のヌクレオチド配列を含む。いくつかの実施形態では、同一のヌクレオチド配列は、PCRプライマー結合部位である。
【0027】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、2~10,000個のユニークヌクレオチド配列のうちの1つを含む。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、50~500個のユニークヌクレオチド配列のうちの1つを含む。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、100~400個のユニークヌクレオチド配列のうちの1つを含む。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、60個のユニークヌクレオチド配列のうちの1つを含む。
【0028】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は8ヌクレオチド長である。
【0029】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターは、64~2,560,000個のユニークヌクレオチド配列のうちの1つを含む。
【0030】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターは、3840個のユニークヌクレオチド配列のうちの1つを含み、各ヌクレオチド配列は、3840個のユニークヌクレオチド配列の任意の他の配列から少なくとも2のハミング距離だけ離れている。
【0031】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターのそれぞれは、多機能性ID領域に隣接するかまたは多機能性ID領域内に含まれるUMIマルチプライヤーを含む。
【0032】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターのUMIマルチプライヤーは、1~5ヌクレオチド長である。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターのUMIマルチプライヤーは、3ヌクレオチド長である。
【0033】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターのアンカー領域は、4つのヌクレオチド配列のうちの1つを含み、所与の配列の各多機能性ID領域は、4つのアンカー領域のそれぞれと対をなすことができる。
【0034】
本開示の多機能アダプターのいくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの増幅領域は、同一のヌクレオチド配列を含み、複数の多機能アダプターの各多機能アダプターの多機能性ID領域が8ヌクレオチド長であり、各多機能性ID領域のヌクレオチド配列は、少なくとも2のハミング距離だけ複数の多機能アダプターの任意の他の多機能性ID領域のヌクレオチド配列とは異なり、複数の多機能アダプターの各々は、多機能性ID領域に隣接するかまたは多機能性ID領域内に含まれるUMIマルチプライヤーを含み、複数の多機能アダプターの各多機能アダプターのUMIマルチプライヤーは3ヌクレオチド長であり、可能なヌクレオチド配列の各々のUMIマルチプライヤーは、複数の多機能アダプターの各多機能性ID領域と対になっており、複数の多機能アダプターの各多機能アダプターのアンカー領域は、4つのヌクレオチド配列のうちの1つを含み、所与の配列の各多機能性ID領域は、4つのアンカー領域のそれぞれと対をなしてもよい。
【0035】
本開示は、多機能アダプターとdsDNA断片とを含む複合体を提供し、多機能アダプターは、開示された多機能アダプターのいずれか1つから選択される。
【0036】
本開示は、本開示の複数の多機能アダプターを提供する。いくつかの実施形態では、複数はプールと呼ばれることもある。いくつかの実施形態では、複数の多機能アダプターは、試料に適用されるアダプターのセットを含む。いくつかの実施形態では、試料に適用されたアダプターのセット内で、複数の多機能アダプターの各多機能アダプターは、ユニークID領域またはユニークUMIを含む。いくつかの実施形態では、複数の多機能アダプターのうちの多機能アダプターの数は、試料または試料の細胞DNA標的を収容するために増減され得る。いくつかの実施形態では、複数の多機能アダプターのうちの多機能アダプターの数は、試料の細胞DNA標的を検出および/または解析するために必要な多重化のレベルに対応するように増減され得る。いくつかの実施形態では、複数の多機能アダプターの多機能アダプターの数は、試料に適用された複数の多機能アダプター内のユニークID領域またはユニークUMIの数を増減することによって増減され得る。いくつかの実施形態では、複数の多機能アダプターのうちの多機能アダプターの数は、ID領域またはアンカー領域のヌクレオチドの数を増減させることによって増減され得る。
【0037】
本開示は、アダプタータグ付きDNAライブラリーを作製する方法であって、(a)複数の多機能アダプターを複数のdsDNA断片と連結して、複数の多機能アダプター/dsDNA断片複合体を生成することであって、多機能アダプターが、開示された多機能アダプターのいずれか1つから選択されることと、(b)工程(a)からの多機能アダプター/dsDNA断片複合体を1またはそれを超える酵素と接触させて、複数の連続アダプタータグ付きdsDNA断片を含むアダプタータグ付きDNAライブラリーを形成することと、を含む、方法を提供する。いくつかの実施形態では、複数の複合体の各多機能アダプター/dsDNA断片複合体は、dsDNA断片の各末端に連結された多機能アダプターを含む。
【0038】
本開示の方法のいくつかの実施形態では、dsDNA断片は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、またはメチル化DNA、または脱メチル化DNAである。いくつかの実施形態では、dsDNA断片は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNA、および脱メチル化DNAのうちの1またはそれを超えるものを含む。いくつかの実施形態では、dsDNA断片は無細胞DNA(cfDNA)を含む。いくつかの実施形態では、dsDNA断片はゲノムDNA(gDNA)を含む。いくつかの実施形態では、dsDNA断片は相補的DNA(cDNA)を含む。いくつかの実施形態では、dsDNA断片はミトコンドリアDNAを含む。いくつかの実施形態では、dsDNA断片はメチル化DNAを含む。いくつかの実施形態では、dsDNA断片は、脱メチル化DNAを含む。
【0039】
本開示の方法のいくつかの実施形態では、複数のdsDNA断片は、複数の多機能アダプターと連結する前に末端修復される。
【0040】
本開示の方法のいくつかの実施形態では、複数のdsDNA断片は、ローパス全ゲノムライブラリー、アンプリコンライブラリー、全エクソームライブラリー、cDNAライブラリーまたはメチル化DNAライブラリーからなるリストから選択されるライブラリーから得られる。
【0041】
本開示の方法のいくつかの実施形態では、非ライゲーション鎖オリゴヌクレオチドは、多機能アダプター/dsDNA断片複合体から置換される。
【0042】
本開示の方法のいくつかの実施形態では、1またはそれを超える酵素は、DNAリガーゼまたはRNAリガーゼを含む。いくつかの実施形態では、DNAリガーゼは、T4 DNAリガーゼまたはTaq DNAリガーゼを含む。
【0043】
本開示は、アダプタータグ付きDNAライブラリーを作製する方法であって、(a)複数の多機能アダプターを複数のdsDNA断片と連結して、複数の多機能アダプター/dsDNA断片複合体を生成することを含み、多機能アダプターが、開示された多機能アダプターのいずれか1つから選択される、生成することと、(b)工程(a)からの多機能アダプター/dsDNA断片複合体を1またはそれを超える酵素と接触させて、連続アダプタータグ付きdsDNA断片を形成することと、隣接アダプタータグ付きdsDNA断片を増幅して、複数の隣接するアダプタータグ付きdsDNA断片を含むアダプタータグ付きDNAライブラリーを生成することと、を含む方法を提供する。
【0044】
本開示の方法のいくつかの実施形態では、1またはそれを超えるプライマーが増幅のために使用される。いくつかの実施形態では、1またはそれを超えるプライマーは、アダプターのプライマー結合領域にハイブリダイズするユニバーサルプライマー結合配列を含む。
【0045】
本開示は、開示される方法のいずれか1つに従って作製されたアダプタータグ付きDNAライブラリーを提供する。
【0046】
本開示は、ハイブリッド分子のライブラリーを作製するための方法であって、(a)開示される方法のいずれか1つに従って作製されたアダプタータグ付きDNAライブラリーを1またはそれを超える多機能捕捉プローブとハイブリダイズさせて、1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を形成することであって、各多機能捕捉プローブが(i)パートナーオリゴヌクレオチドにハイブリダイズすることができる第1の領域であって、必要に応じて、第1の領域がPCRプライマー結合部位を含むテール配列を含む第1の領域と、(ii)タグ付き遺伝子DNAライブラリー中の特定の標的領域にハイブリダイズすることができる第2の領域と、を含む、形成することと、(b)工程(a)から1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を単離することであって、各単離された捕捉プローブ/アダプタータグ付きDNA複合体が、捕捉プローブおよびアダプタータグ付きDNA断片を含む、単離することと、(c)工程(b)からの1またはそれを超える単離された捕捉プローブ/アダプタータグ付きDNA複合体を酵素的処理して、1またはそれを超えるアダプタータグ付きハイブリッド核酸分子(ハイブリッド分子)を生成することであって、各ハイブリッド分子は、捕捉プローブと、捕捉プローブが標的遺伝子配列にハイブリダイズした場所から3’にあるアダプタータグ付きDNA断片の相補体とを含む、生成することと、を含む、方法を提供する。いくつかの実施形態では、方法は、(d)工程(c)のハイブリッド分子に対してPCRを行って、増幅ハイブリッド分子を含む標的遺伝子ライブラリーを生成することをさらに含む。いくつかの実施形態では、(c)の酵素処理工程は、複合体中のアダプタータグ付きDNA断片を鋳型として使用して、捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うことを含む。
【0047】
開示される方法のいずれか1つのいくつかの実施形態では、少なくとも1つの捕捉プローブが標的遺伝子配列の下流にハイブリダイズし、少なくとも1つの捕捉プローブが標的遺伝子配列の上流にハイブリダイズする。
【0048】
開示される方法のいずれか1つのいくつかの実施形態では、捕捉プローブはシーケンシングプライマー認識配列を含む。
【0049】
いくつかの実施形態では、本開示は、開示される方法のいずれか1つに従って作製された捕捉プローブ/アダプタータグ付きDNA複合体を提供する。
【0050】
いくつかの実施形態では、本開示は、開示される方法のいずれか1つに従って作製されたハイブリッド分子のライブラリーを提供する。
【0051】
いくつかの実施形態では、本開示は、開示される方法のいずれか1つに従って作製された標的遺伝子ライブラリーを提供する。
【0052】
本開示のいくつかの実施形態は、開示される方法のいずれか1つに従って作製されたハイブリッド分子のライブラリーに対して標的遺伝子解析を行うことを含む方法に向けられる。いくつかの実施形態では、標的遺伝子解析は配列解析である。いくつかの実施形態では、標的遺伝子解析はコピー数解析である。
【0053】
本開示のいくつかの実施形態は、開示される方法のいずれか1つに従って作製された標的遺伝子ライブラリーに対して標的遺伝子解析を行うことを含む方法に向けられる。いくつかの実施形態では、標的遺伝子解析は配列解析である。いくつかの実施形態では、標的遺伝子解析はコピー数解析である。
【0054】
開示される方法のいずれか1つのいくつかの実施形態では、ハイブリッド分子中の捕捉プローブ領域が配列決定される。開示される方法のいずれか1つのいくつかの実施形態では、ハイブリッド分子中の捕捉プローブ領域全体が配列決定される。開示される方法のいずれか1つのいくつかの実施形態では、ハイブリッド分子中の捕捉プローブ領域の一部が配列決定される。
【0055】
これらおよび他の態様は、以下に記載される詳細な説明においてより詳細に対処される。
図面の簡単な説明
【図面の簡単な説明】
【0056】
【
図1】
図1は、本開示の例示的な多機能アダプターを示す概略図である。例示的な多機能アダプターは、5’から3’に、25ヌクレオチド増幅領域、8ヌクレオチドID領域、3ヌクレオチドUMIマルチプライヤー領域および10ヌクレオチドアンカー領域を含む。多機能アダプターはまた、3’末端にdTオーバーハングを含む。多機能アダプターの各領域の長さは、以下に説明するように変更することができる。
【0057】
【
図2】
図2は、本開示の方法の全体的なワークフローの一実施形態を示す概略図である。このワークフローの工程は、以下でさらに詳細に説明される。
【0058】
【
図3】
図3は、本開示の方法のいくつかの実施形態による、アダプタータグ付きDNAライブラリーを生成するための例示的なプロセスを示す概略図である。工程1では、NEB Next Ultra II End Repair(登録商標)/dA-Tailing Moduleを用いてcfDNAを末端修復する。次いで、塩基を3’末端に付加し、5’末端をリン酸化する(工程2)。工程2は、サーマルサイクラーを用いて行ってもよい。工程3において、3’dT末端オーバーハングを有する多機能アダプターが、5’末端および3’末端のそれぞれに結合される。任意の工程4(図示せず)において、アフィニティービーズを使用して、アダプター連結DNA鎖から非連結断片およびアダプターを分離することができる。いくつかの実施形態では、方法は、工程3~工程5、増幅に直接進む。この工程において、Ultra II Q5(登録商標)酵素は、断片上のオーバーハングを伸長させて二本鎖ライブラリーを作製し、標準的な増幅サイクルを用いて断片を増幅する。必要に応じて、断片の5’および3’末端のオーバーハングのフィルインを可能にするために、追加の3分間の伸長工程を最初に実行することができる。
【0059】
【
図4-1】
図4A~
図4Cは、本開示の方法に従ってアダプタータグ付きDNAライブラリーを生成するコンパレータープロセス(自動化可能に設計されていない)とアダプタータグ付きDNAライブラリーを生成する自動化可能プロセスとを比較する一連の概略図および表を提供する。
図4Aは、コンパレータープロセスで行われる工程、並びに使用される試薬およびサーモサイクラープログラムを示す。
図4Bは、自動化可能なプロセスで実行される工程、並びに使用される試薬およびサーモサイクラープログラムを示す。
図4Cは、コンパレーターおよび自動化可能なプロセスの各々を使用して処理された、例示的な野生型cfDNA試料並びに2つの対照試料からの深度データを提供する。自動化可能プロセスを使用した場合の深度の増加率も示す。
【0060】
【
図5】
図5は、本開示の方法のいくつかの実施形態による、アダプタータグ付きDNAライブラリーの調製および増幅のための例示的な方法を示す概略図である。
【0061】
【
図6】
図6は、本開示の方法のいくつかの実施形態による捕捉プローブハイブリダイゼーションおよび伸長を示す概略図である。
【0062】
【
図7】
図7は、本開示の方法のいくつかの実施形態による標的化(捕捉)ライブラリーの増幅を示す概略図である。
【0063】
【
図8】
図8は、アダプター分子、「ハイブリッド分子」及シーケンシングアンプリコン(NGS用)を比較する概略図である。アダプター分子は、5’から3’に、25ヌクレオチド増幅領域、8ヌクレオチドID領域、3ヌクレオチドUMIマルチプライヤー領域、10ヌクレオチドアンカー領域、および3’末端のdTオーバーハングを含む。ハイブリッド分子は、5’から3’に、フォワードプライマー(FP)、アダプター領域(増幅領域、ID領域、UMIマルチプライヤー、およびアンカー領域を含む、)、ライブラリー断片、多機能捕捉プローブ(MCP)、およびリバースプライマー(RP)を含む。FPおよびRPは、ハイブリッド分子の増幅に使用される。図に示されるように、シーケンシングRead1の場合、シーケンシングは増幅領域の開始時に開始され、シーケンシングアンプリコンに沿って5’から3’に進む。Read2の場合、シーケンシングは多機能捕捉プローブの終わりに開始され、シーケンシングアンプリコンに沿って3’から5’に進む。
【0064】
【
図9】
図9は、コンパレーターおよび自動化可能なプロセスのアダプターアンカー分布を示すグラフである。
【0065】
【
図10-1】
図10A~
図10Bは、cfDNAライブラリー構築の例示的なプロセスにおけるDNA断片へのアダプターの高効率の付着を示す一対のグラフを提供する。
図10Aは、入力cfDNAのBioanalyzerトレースのデータを提供する。
図10Bは、ライブラリー構築後のcfDNAのBioanalyzerトレースのデータを提供し、cfDNAの大部分(>50%)が2つのバーコード(アダプター)を含むことを示す。
【発明を実施するための形態】
【0066】
詳細な説明
本開示の組成物および方法は、多重化された核酸の検出およびシーケンシング、並びにプロセス全体の効率を高めるための自動化可能なプロセスの必要性がこれまで長く感じられていたが満たされていなかったことを解決し、ハイスループット解析を可能にする。本開示の組成物および方法は、様々な次世代シーケンシング(NGS)プロセスで使用され得る。
【0067】
自動化可能なDNAライブラリー調製およびシーケンシングプロセスの速度および精度は、癌を含む後期疾患の迅速な検出および診断、並びに伝染前の高感染性疾患の早期検出にとって特に重要である。遺伝性疾患は、迅速かつ正確な検出を所与として、その発症時に処置可能であり得るか、または予防可能でさえあり得る。さらに、処置有効性のモニタリングは、疾患進行またはその寛解のバイオマーカーを追跡するために、迅速かつ正確な結果を必要とすることが多い。
【0068】
本開示は、自動化を可能にする遺伝子ライブラリーおよび遺伝子解析の高効率構築のためのアダプターおよび方法を提供する。診断目的の解析に加えて、本開示の方法および組成物は、任意の核酸試料の解析に使用され得る。一例として、本開示の方法および組成物は、集団レベルで遺伝的変異を識別するために、例えば、進化、農業および生物学的研究の分野の問題に対処するために、1またはそれを超える種の集団規模のシーケンシングに使用され得る。
【0069】
特に、多数の試料に対する高度に多重化された反応が最適に並行して行われる状況では、本開示の組成物および方法は、例えば疾患または感染の起源を追跡するために、多数の試料集団にわたって解析を行う効率を提供する。
【0070】
本開示の組成物および方法は、核酸断片の検出および解析に必要な工程を最小限に抑えるように設計される。さらに、本開示の組成物および方法は、一段階から別へ試料の操作を単純化するように設計されており、いくつかの状況では、同じ反応容器内で複数の工程を連続的に行うことができる。さらに、本開示の組成物および方法は、他の商業的プロセスと比較してより小さな反応体積で使用され得、それによって遺伝物質の希釈を減少させる。これは、例えば無細胞DNA(cfDNA)または非常に古いDNAを使用する場合など、出発遺伝物質が不足しているかまたは制限されている場合に特に重要である。
【0071】
いくつかの実施形態では、本開示は、コピー数の変化、一塩基変異体(SNV)、短い(40bp未満)挿入および欠失(インデル)、並びにゲノム再編成、例えば発癌性遺伝子融合、逆位、転座などの遺伝子融合を含む(ただしこれらに限定されない)複数の型のDNA変化の検出を可能にするアダプター設計およびそれを使用する方法を提供する。
【0072】
いくつかの実施形態では、本開示は、簡素化されたワークフローに従ってタグ付きDNAライブラリーを調製する方法を提供する。これらの方法は、例えば、NGSライブラリー調製のための試料取り扱いロボットを使用するハイスループット処理および自動化、標的捕捉プロセスによる目的の遺伝子座の濃縮、遺伝物質のシーケンシングおよび遺伝子解析に特に有用である。
【0073】
開示される方法における開示される組成物の使用は、配列リード並びにゲノム均等物のより大きな深度/カバレッジに関して、クローニング効率の増加、均一なアダプター分布の改善、および性能の改善において驚くほど効果的である。
【0074】
結果として、本開示で提供される方法は、標準的なワークフロー(自動化不可能なワークフローなど)と比較して、少なくとも以下の優れた特性を有する:工程数の減少、処理時間の短縮、オペレータエラーのリスクの低下、試薬数の減少、反応体積の減少、およびコストの低下、それにより、そのような方法およびワークフローの商業化および自動化を実現可能にする。
【0075】
本開示の方法のいくつかの実施形態では、方法は自動化可能なプロセスと呼ばれる。本開示の組成物および方法は自動化装置で使用するために設計されているが、本開示の組成物および方法は自動化されている必要はなく、明確にするために、非自動化手段または非自動化装置によって実施することもできる。比較のための基礎を提供するために、本開示は、「コンパレーター」プロセス、すなわち、自動化のために、または自動化された装置と共に使用するために特別に設計されていないプロセスを提供する。例えば、本開示のコンパレータープロセスと整列させると、本開示の「自動化可能な」プロセスは、多重化核酸検出および解析の所望の結果を維持しながらいくつかの工程を排除する。
【0076】
本開示の組成物および方法のいくつかの実施形態では、末端修復は単一工程で行われ、アダプターのライゲーションを単一工程で行われ、かつ、アダプタータグ付きDNA断片の伸長および増幅は、単一工程で行われる。いくつかの実施形態では、自動化可能なプロセスはまた、ライブラリー調製のための時間を短縮し、使用される試薬の数を減少させ、反応のための体積を減少させる。特に、反応の体積の減少は、サンプリングロボットによって取り扱うことができるマイクロタイタープレートまたはチューブストリップでより小さい反応体積を行うことができるので、自動化を容易にする。
図4A~
図4Cは、アダプタータグ付きDNAライブラリーを生成するための例示的なコンパレータープロセスおよび本開示のアダプタータグ付きDNAライブラリーを生成するための本開示の自動化可能なプロセスを概説する概略図である。
【0077】
定義
本開示において他に定義されない限り、本出願で使用される科学的および技術的用語は、当業者によって一般に理解される意味を有するものとする。一般に、本開示に記載される化学、分子生物学、細胞および癌の生物学、免疫学、微生物学、薬理学、並びにタンパク質および核酸の化学に関連して使用される命名法およびその技術は、当技術分野で周知であり、一般的に使用されるものである。本明細書で言及されるすべての刊行物、特許出願、特許および他の参考文献は、その全体が参照により本明細書に組み込まれる。
【0078】
本開示で使用される場合、以下の用語は、特に指定されない限り、それらに帰する意味を有する。
【0079】
冠詞「a」、「an」、および「the」は、冠詞の文法的対象の1つまたは2つ以上(すなわち、少なくとも1つまで)を指すために本開示で使用される。例として、「要素」は、1つの要素または2またはそれを超える要素を意味する。
【0080】
代替形態(例えば、「または」)の使用は、代替形態のいずれか、両方、またはそれらの任意の組み合わせを意味すると理解されるべきである。
【0081】
「および/または」という用語は、選択肢の一方または両方を意味すると理解されるべきである。
【0082】
本開示で使用される場合、「約」または「およそ」という用語は、基準の量、レベル、値、数、パーセンテージ、寸法、サイズ、量、重量または長さに対して15%、10%、9%、8%、7%、6%、5%、4%、3%、2%または1%も変動する量、レベル、値、周波数、パーセンテージ、寸法、サイズ、量、重量または長さを指す。いくつかの実施形態では、「約」または「およそ」という用語は、基準の量、レベル、値、数、頻度、パーセンテージ、寸法、サイズ、量、重量または長さ±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%、または±1%の範囲を指す。
【0083】
本開示で使用される場合、「単離された」という用語は、その天然の状態で通常付随する成分を実質的にまたは本質的に含まない材料を意味する。いくつかの実施形態では、「得られる」または「由来する」という用語は、単離されたものと同義的に使用される。
【0084】
本明細書で使用される「対象」、「個体」または「患者」は、本明細書で企図される組成物で検出または識別することができる症状の病徴を示す任意の動物を含む。適切な対象としては、実験動物(例えば、マウス、ラット、ウサギまたはモルモット)、家畜(例えば、ウマ、ウシ、ヒツジ、ブタなど)、および飼育動物またはペット(ネコまたはイヌなど)が挙げられる。いくつかの実施形態では、対象は哺乳動物である。いくつかの実施形態では、対象は非ヒト霊長類であり、好ましい実施形態では、対象はヒトである。
【0085】
「含む(comprising)」、「から本質的になる(consisting essentially of)」、および「からなる(consisting of)」などの移行句は、米国特許商標庁の特許審査手続マニュアル(MPEP 2111.03参照)に概説されているような通例の定義をとる。
【0086】
アダプター設計
自動化に適した高スループット能力(例えば、試料を取り扱うロボット工学を使用すること、)を達成するために、本開示のアダプターおよび関連する方法は、いくつかの実施形態では、以下の特徴:(i)一段階付着、(ii)高効率付着、(iii)均一なアダプター分布、(iv)試料多重化および試料識別の適応、(v)多数のユニーク分子識別子(UMI)を含む。例えば、本開示のアダプターおよび方法のいくつかの実施形態は、以下を提供する。
【0087】
一段階付着:いくつかの実施形態では、完全長多機能アダプターを一段階でDNA断片に付着させることができる。「完全長」多機能アダプターは、少なくとも4つの領域:プライマー認識部位として働くことができるポリヌクレオチド配列を含む第1の増幅領域、ユニーク分子識別子(UMI)を含む第2の多機能性ID領域、UMIマルチプライヤーを含む第3の領域、およびアンカー領域を含む第4の領域を含み得る。完全長多機能アダプターを付着することにより、最初にアンカーが付着され、次いでアダプターの残りの領域が付着される段階的な様式でのアダプターライゲーションの必要性を排除することができる(例えば、
図4Aのコンパレータープロセスにおけるアダプターライゲーションの段階的様式を参照のこと)。
【0088】
高効率付着:いくつかの実施形態では、多機能アダプターを高効率でDNA断片に付着させることができる。本開示の目的のために、アダプター付着の効率は、アダプタータグ付きDNAライブラリー分子への入力DNA断片の変換速度を指す。例えば、DNA断片は、付着したアダプターのID領域によって識別されてよく、DNA断片は、それがアダプターに付着していなければ、ID領域を使用して識別されないだろう。したがって、アダプター付着のより高い効率は、ライブラリー変換プロセスにおいて失われる入力DNA断片の数を低下させ得る。これは、例えば、多くの腫瘍学用途および他の遺伝性疾患(例えば、多発性硬化症、関節リウマチ、アルツハイマー病)に関連して解析される試料において、利用可能なDNAの量が制限されている状況において特に有用である。そのような状況では、DNA変化(例えば、必要に応じて腫瘍/癌に関連する一塩基変異体(SNV)、インデル、コピー数の変化、DNA再編成)の発生は典型的にはまれであり、したがって検出が困難であり得る。これらのDNA断片への本開示のアダプターの非常に効率的な付着は、そのようなまれな変異の捕捉を容易にし得る。いくつかの実施形態では、入力DNA断片の少なくとも50%が、多機能アダプターの付着によってアダプタータグ付きDNAライブラリー分子に変換される。
図10は、cfDNAライブラリー構築の例示的プロセスにおけるDNA断片へのアダプターの高効率付着のためのデータを提供する。
【0089】
均一なアダプター分布:バイオインフォマティクス解析は、試料内プローブ性能および試料間プローブ性能を解析することができる。試料にわたるアダプタープール間の性能変動は、解析の感度に悪影響を及ぼし得る。配列リードによって測定されるタグ付きDNAライブラリーおよび捕捉プローブライブラリーにおける均一なアダプター分布が望ましい。いくつかの実施形態では、アダプタータグ付きDNAライブラリー中のアダプターの分布に偏りがある可能性があり、いくつかのアダプターは、DNA断片に連結するのにあまり効率的でないか、またはアダプタープール中の他のアダプターと比較してあまり効率的に増幅されない場合がある。これにより、シーケンシング中のアンプリコンおよびそれらの非効率的なアダプターのリードが少なくなり得る。そのような偏った分布は、アダプタープール中の効率の低いアダプターの量を増加させてタグ付きDNAライブラリーおよびシーケンシングリード中のアダプターのよりバランスのとれた表現を提供することによって許容または補償され得るが、本開示の組成物および方法は、そのような補償を排除する選択肢を提供する。本明細書に開示されるアダプターおよび方法は、均一なアダプター分布を達成するという予想外の利点を提供することができ、各アダプターはシーケンシング結果においてほぼ同じ比率で表される。この均一なアダプター分布により、感度が向上する。
【0090】
いくつかの実施形態では、均一なアダプター分布は、アダプターの各プールにすべて表される複数の型のアンカー領域を有することによって達成され得る。
【0091】
いくつかの実施形態では、均一なアダプター分布は、アダプターの各プールに対してランダムに選択されたユニークID領域(各ID領域は、試料およびそれに付着したDNA断片の両方を識別する)を有することによって達成され得る。
【0092】
試料多重化および試料識別の適応:試料多重化(すなわち、異なる試料を同時にランする能力)を達成するために、いくつかの実施形態では、同じプール内の各ユニークアダプターが同じ試料に付着されたユニークアダプターのプールが構築される。配列計数の観点から、アダプターのプールの各ユニークアダプターが、プール内の他のすべてのアダプターと本質的に同一の挙動を有することが有益である。これを達成するために、いくつかの実施形態では、各ID領域は、ID領域と他の任意のID領域との間に2のハミング距離を有し、したがって、リードが誤った試料に誤って割り当てられる可能性を低減する。いくつかの実施形態では、アダプターの各プールは、特定のアンカー領域と対になるさらなるプールに分割され、試料逆多重化のエラーの可能性をさらに低減することを可能にする。例えば、ハミング距離が2の8merタグでは、可能な配列の総数は16,384である。「対になった」という用語は、異なるポリヌクレオチド配列を含む2つの異なるポリヌクレオチド配列またはDNAの領域に関して使用される場合、異なるポリヌクレオチド配列を含む2つの異なるポリヌクレオチド配列またはDNAの領域が同じポリヌクレオチド上に存在することを意味する。例えば、DNAの特定のID領域がDNAの特定の増幅領域と対になっていると言われる場合、ID領域および増幅タグが同じDNAポリヌクレオチド分子上に存在することを意味する。
【0093】
多数のユニーク分子識別子(UMI):アダプターが分子生物学的観点から機能的に同等であることは一般に有益であるが、アダプターが、ユニークゲノム断片の識別を増大する非常に多数のユニーク分子識別子(UMI)(≧10,000)を有することも望ましい。これに関連して、「増大」とは、一意に導出された断片を識別する能力が増加することを意味する。各ゲノムクローン断片は、二本鎖DNAが切断されたゲノム配列中の位置に対応する断片化部位の特定の対を有する。この切断部位は、各クローンが異なる切断部位を有する可能性が高いので、ユニークゲノムクローンを区別するために使用され得る。しかしながら、数千個の独立したクローンを有するライブラリーでは、ユニークに誘導された断片は、多くの場合、正確に同じ切断部位を有し得る。同じ切断部位を共有するゲノムクローン(すなわち、断片)は、同じ試料に由来する他のクローン配列に関してユニークまたは冗長のいずれかに分類され得る。高い多様性の配列タグを導入するアダプターを付着させることによって、同じ切断部位を共有する異なるゲノムクローンは、ユニークとして識別される可能性がより高くなる。いくつかの実施形態では、UMIは、多機能性ID領域とUMIマルチプライヤーとの組み合わせによって作成される。すなわち、多機能性ID領域とUMIマルチプライヤー(すなわち、UMIによって識別された)との組み合わせにより、それぞれのユニークDNA断片を識別することができる。さらに、UMIと切断部位との組み合わせは、ユニーク分子識別子要素(UMIE)を作り出し、これにより、冗長リードまたはユニークリードとしての配列リードの分類を容易にする。いくつかの実施形態は、UMIマルチプライヤーが、全体的なUMI複雑度を増加または低下させるために、より長いまたはより短い配列を含むことができることを企図している。いくつかの実施形態では、各ユニークDNA断片は、多機能性ID領域のみによって識別され得る。
【0094】
「アダプター」、「多機能アダプター」、および「アダプターモジュール」という用語は互換的に使用されてよく、DNAまたはRNA分子の末端に連結され得る短い一本鎖または二本鎖オリゴヌクレオチドを指す。典型的には、本明細書に記載のアダプターは、少なくとも5つの要素:(i)3’末端オーバーハング、(ii)プライマー認識部位として働くことができるポリヌクレオチド配列を含む増幅領域、(iii)ユニーク多機能性ID領域;(iv)ユニーク分子識別子(UMI)マルチプライヤー、(v)非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を含むアンカー領域を含む。
図1は、本明細書中に記載されるようないくつかの実施形態による多機能アダプターの例示的な組成物を提供する(ライゲーション鎖オリゴヌクレオチドのみが示される)。
【0095】
いくつかの実施形態では、アダプターは、1またはそれを超える増幅領域、1またはそれを超える多機能性ID領域、1またはそれを超えるUMIマルチプライヤー、および1またはそれを超えるアンカー領域を含む。いくつかの実施形態では、アダプターは、5’から3’に向かって順に、増幅領域、多機能性ID領域、UMIマルチプライヤー、アンカー領域、および3’末端オーバーハングを含む。
【0096】
いくつかの実施形態では、UMIマルチプライヤーは多機能性ID領域内に含まれ、アダプターは、5’から3’に向かって順に、増幅領域、統合多機能性ID領域/UMIマルチプライヤー領域、アンカー領域、および3’末端オーバーハングを含む。
【0097】
いくつかの実施形態では、多機能アダプターは、効率的なライゲーション基質である1またはそれを超える増幅領域、1またはそれを超えるID領域、1またはそれを超えるUMIマルチプライヤー、1またはそれを超えるアンカー領域、および3’オーバーハング中の1またはそれを超えるヌクレオチドを含む。さらなる実施形態では、アダプターモジュールは、1またはそれを超えるシーケンシングプライマー結合部位をさらに含む。
本開示の組成物および方法において使用され得る例示的なアダプターの構造を表2および表3に提供する。例えば、いくつかの実施形態では、アダプターのライゲーション鎖は、以下の構造:AMP-ID Region/UMI Multiplier-ACGTATGCCA(配列番号2)-3’dTを含み得る。いくつかの実施形態では、アダプターのライゲーション鎖は、以下の構造:AMP-ID Region/UMI Multiplier-CTAGCGTTAC(配列番号3)-3’dTを含み得る。いくつかの実施形態では、アダプターのライゲーション鎖は、以下の構造:AMP-ID Region/UMI Multiplier-GATCGACATG(配列番号4)-3’dTを含み得る。いくつかの実施形態では、アダプターのライゲーション鎖は、以下の構造:AMP-ID Region/UMI Multiplier-TGCATCAGGT(配列番号5)-3’dTを含み得る。いくつかの実施形態では、アダプターの非ライゲーション鎖アンカー領域は、配列TGGCATACGT(配列番号6)を含み得る。いくつかの実施形態では、アダプターの非ライゲーション鎖アンカー領域は、配列GTAACGCTAG_(配列番号7)を含み得る。いくつかの実施形態では、アダプターの非ライゲーション鎖アンカー領域は、配列CATGTCGATC(配列番号8)を含み得る。いくつかの実施形態では、アダプターの非ライゲーション鎖アンカー領域は、配列ACCTGATGCA(配列番号9)を含み得る。
【0098】
いくつかの実施形態では、アダプターは、3’dTオーバーハングを有するライゲーション鎖を含み得る。いくつかの実施形態では、3’dTオーバーハングを有するライゲーション鎖は、表3に示す配列のいずれか1つを含み得る。例えば、3’dTオーバーハングを有するライゲーション鎖は、配列番号10~69のいずれか1つの配列を含み得る。これらのライゲーション鎖配列内の「NNN」は、各NがA、G、CまたはTのいずれか1つから選択され得る3ヌクレオチドUMIマルチプライヤーを表す。いくつかの実施形態では、3’dTオーバーハングを有するライゲーション鎖は、1、2、3、4、5、6、7、8、9、10個またはそれを超えるヌクレオチド置換を有する配列番号10~69のいずれか1つの配列を含み得る。
【0099】
ライゲーション鎖オリゴヌクレオチド
「ライゲーション鎖オリゴヌクレオチド」および「ライゲーション鎖」という用語は互換的に使用される。
【0100】
本開示は、いくつかの実施形態では、(i)3’末端オーバーハング、(ii)プライマー認識部位として働くことができるポリヌクレオチド配列を含む増幅領域、(iii)ユニーク多機能性ID領域;(iv)ユニーク分子識別子(UMI)マルチプライヤー、(v)非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を含むアンカー領域を含むライゲーション鎖オリゴヌクレオチドを提供する。
【0101】
いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、5’末端においてリン酸化されない。
【0102】
いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、約30ヌクレオチド~約70ヌクレオチド長である。いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、約35~約65ヌクレオチド、約40~約60ヌクレオチド、または約40~約50ヌクレオチド長である。いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、約47ヌクレオチド長である。
【0103】
いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、30ヌクレオチド~70ヌクレオチド長である。いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、35~65ヌクレオチド、40~60ヌクレオチド、または40~50ヌクレオチド長である。いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、47ヌクレオチド長である。
【0104】
非ライゲーション鎖
「非ライゲーション鎖オリゴヌクレオチド」および「非ライゲーション鎖」という用語は互換的に使用される。
【0105】
非ライゲーション鎖オリゴヌクレオチドは、ライゲーション鎖オリゴヌクレオチドの3’末端の領域にハイブリダイズし、それと共に二重鎖を形成することができる。非ライゲーション鎖は、二重鎖を形成するために、ライゲーション鎖の少なくとも一部に相補的である。この二重鎖構造は、ライゲーション鎖へのdsDNAの5’末端のライゲーションを容易にし得る。
【0106】
いくつかの実施形態では、非ライゲーション鎖はリン酸化されていない。非ライゲーション鎖のリン酸化の欠如は、非ライゲーション鎖がDNA断片の3’末端に付着するのを妨げ、アダプター二量体の形成を減少させ得る。
【0107】
いくつかの実施形態では、非ライゲーション鎖は、必要に応じて、dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾をその3’末端に含み得る。いくつかの実施形態では、修飾は化学修飾である。
【0108】
3’末端オーバーハング
「3’末端オーバーハング」という用語は、ポリヌクレオチドの3’末端における1またはそれを超えるヌクレオチドオーバーハングまたはテールを指す。
【0109】
いくつかの実施形態では、ライゲーション鎖オリゴヌクレオチドは、3’末端にdTオーバーハングを含む。
【0110】
いくつかの実施形態では、3’末端オーバーハング(例えば、dTテール)は、相補的オーバーハング(例えばdAオーバーハング/テール)を有するDNA断片への多機能アダプターの効率的なライゲーションを駆動するために、ライゲーション鎖のライゲーションを補助してDNA断片の5’末端にライゲーションする。
【0111】
増幅領域
「増幅領域」という用語は、プライマー認識部位として機能することができるポリヌクレオチド配列を含むアダプター分子の要素を指す。プライマー認識部位は、Fakruddinら「Nucleic acid amplification:Alternative methods of polymerase chain reaction」J Pharm Bioallied Sci.2013 Oct-Dec;5(4):245-252に開示されている方法など、当技術分野で公知の任意の増幅に適した任意のプライマーに対するものであり得る。例えば、そのような増幅方法としては、PCR(ポリメラーゼ連鎖反応)、LAMP(ループ媒介等温増幅)、NASBA(核酸配列に基づく増幅)、SDA(鎖置換増幅)、RCA(ローリングサークル増幅)、LCR(リガーゼ連鎖反応)が挙げられ得る。
【0112】
いくつかの実施形態では、アダプターは、DNAライブラリーの単一プライマー増幅のための1またはそれを超えるプライマー認識配列を含む増幅領域を含む。いくつかの実施形態では、増幅領域は、DNAライブラリーの単一プライマー増幅のための1、2、3、4、5、6、7、8、9、10またはそれを超えるプライマー認識配列を含む。いくつかの実施形態では、増幅領域は、ACA2プライマー(配列番号70)に対するPCRプライマー結合部位を含む。
【0113】
いくつかの実施形態では、増幅領域は、約5~約50ヌクレオチド、約10~約45ヌクレオチド、約15~約40ヌクレオチド、または約20~約30ヌクレオチド長である。いくつかの実施形態では、増幅領域は、約10ヌクレオチド、約11ヌクレオチド、約12ヌクレオチド、約13ヌクレオチド、約14ヌクレオチド、約15ヌクレオチド、約16ヌクレオチド、約17ヌクレオチド、約18ヌクレオチド、約19ヌクレオチド、約20ヌクレオチド、約21ヌクレオチド、約22ヌクレオチド、約23ヌクレオチド、約24ヌクレオチド、約25ヌクレオチド、約26ヌクレオチド、約27ヌクレオチド、約28ヌクレオチド、約29ヌクレオチド、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、または約40ヌクレオチドまたはそれを超える長さである。いくつかの実施形態では、増幅領域は約25ヌクレオチド長である。
【0114】
いくつかの実施形態では、増幅領域は、5~50ヌクレオチド、10~45ヌクレオチド、15~40ヌクレオチド、または20~30ヌクレオチド長である。いくつかの実施形態では、増幅領域は、10ヌクレオチド、11ヌクレオチド、12ヌクレオチド、13ヌクレオチド、14ヌクレオチド、15ヌクレオチド、16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、20ヌクレオチド、21ヌクレオチド、22ヌクレオチド、23ヌクレオチド、24ヌクレオチド、25ヌクレオチド、26ヌクレオチド、27ヌクレオチド、28ヌクレオチド、29ヌクレオチド、30ヌクレオチド、31ヌクレオチド、32ヌクレオチド、33ヌクレオチド、34ヌクレオチド、35ヌクレオチド、36ヌクレオチド、37ヌクレオチド、38ヌクレオチド、39ヌクレオチドまたは40ヌクレオチドまたはそれを超える長さである。いくつかの実施形態では、増幅領域は25ヌクレオチド長である。
【0115】
多機能性ID領域
「多機能性ID領域」および「ID領域」という用語は互換的に使用され、特定のDNA断片並びにそれが由来する試料をユニークに識別するポリヌクレオチド配列を含むアダプターの要素を指す。
【0116】
いくつかの実施形態では、多機能性ID領域は、約3~約50ヌクレオチド、約3~約25ヌクレオチド、または約5~約15ヌクレオチド長である。いくつかの実施形態では、多機能性ID領域は、約3ヌクレオチド、4ヌクレオチド、約5ヌクレオチド、約6ヌクレオチド、約7ヌクレオチド、約8ヌクレオチド、約9ヌクレオチド、約10ヌクレオチド、約11ヌクレオチド、約12ヌクレオチド、約13ヌクレオチド、約14ヌクレオチド、約15ヌクレオチド、約16ヌクレオチド、約17ヌクレオチド、約18ヌクレオチド、約19ヌクレオチド、または約20ヌクレオチドまたはそれを超える長さである。いくつかの実施形態では、多機能性ID領域は約8ヌクレオチド長である。
【0117】
いくつかの実施形態では、多機能性ID領域は、3ヌクレオチド~50ヌクレオチド長、3ヌクレオチド~25ヌクレオチド長または5ヌクレオチド~15ヌクレオチド長である。いくつかの実施形態では、多機能性ID領域は、3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、6ヌクレオチド、7ヌクレオチド、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、11ヌクレオチド、12ヌクレオチド、13ヌクレオチド、14ヌクレオチド、15ヌクレオチド、16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、または20ヌクレオチドまたはそれを超える長さである。いくつかの実施形態では、多機能性ID領域は8ヌクレオチド長である。
【0118】
いくつかの実施形態では、多機能性ID領域は、約2~約10,000個のユニークヌクレオチド配列、約50~約500個のユニークヌクレオチド配列、または約100~約400個のユニークヌクレオチド配列のうちの1つを含む。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、約60個のユニークヌクレオチド配列のうちの1つを含む。
【0119】
いくつかの実施形態では、多機能性ID領域は、2個~10,000個のユニークヌクレオチド配列、50個~500個のユニークヌクレオチド配列、または100個~400個のユニークヌクレオチド配列のうちの1つを含む。いくつかの実施形態では、複数の多機能アダプターの各多機能アダプターの多機能性ID領域は、60個のユニークヌクレオチド配列のうちの1つを含む。
【0120】
いくつかの実施形態では、多機能アダプターは、64個~2,560,000個のユニークヌクレオチド配列のうちの1つを含む。
【0121】
いくつかの実施形態では、予め指定されたプール(複数)のアダプターが提供される。そのような予め指定されたプールは、単一の試料を表すために使用される。すなわち、アダプターオリゴヌクレオチドの各プール中の各アダプター配列は、他の試料を識別するために使用される1つおきのプール中の各アダプター配列とは異なる。当業者は、アダプターオリゴヌクレオチドに可能な予め指定されたプール中の別個のオリゴヌクレオチドの数が多機能性ID領域および/またはUMIマルチプライヤーの長さに依存することを認識するであろう。「複数」は、複数の同じアダプターモジュールまたは異なるアダプターモジュールのプールを指すことができる。
【0122】
いくつかの実施形態では、ID領域は、個々の試料、例えば、ゲノムライブラリー供給源を識別する。いくつかの実施形態では、各試料には、約64個~約250万個のユニークアダプターの複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、64個~250万個のユニークアダプターの複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、約3,840個のユニークアダプターの複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、3,840個のユニークアダプターからなる複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、約1個~約60個のユニークアダプターの複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、1個~60個のユニークアダプターの複数(予め指定されたプール)が割り当てられる。いくつかの実施形態では、各試料には、60個のユニークアダプターからなる複数の(予め指定されたプール)が割り当てられ、60個のユニークアダプターからなる予め指定された各プールは、4つのセットにさらに分割され(各セットは15個のユニークアダプターを含む)、1つのセットの各多機能性ID領域は、4つのアンカー配列のうちの1つと対になる。したがって、多機能性ID領域とアンカー領域との組み合わせによって、試料を識別することができる。
【0123】
いくつかの実施形態では、各多機能性ID領域のヌクレオチド配列は、少なくとも2のハミング距離だけ複数の多機能アダプターの他の任意の多機能性ID領域のヌクレオチド配列とは異なる(すなわち、1つのID領域を別のID領域に変更するために少なくとも2つの塩基変化が必要である)。
【0124】
いくつかの実施形態では、ID領域は、それが付着している個々のDNA断片を識別するので、ID領域は、例えば、コピー数解析のためにクローン多様性を列挙することができる断片タグとしても機能する。
【0125】
いくつかの実施形態では、多機能性ID領域は8ヌクレオチド長であり、240個のユニークヌクレオチド配列のうちの1つを含み、UMIマルチプライヤーは3ヌクレオチド配列長であるので、ユニークアダプター配列の総数は240×43=3840=15,360である。したがって、いくつかの実施形態では、各試料に、DNA断片識別のための1~15,360個のユニークアダプターの範囲のアダプターのセットを割り当てることができる。
【0126】
いくつかの実施形態では、多機能性ID領域は8ヌクレオチド長であり、60個のユニークヌクレオチド配列のうちの1つを含み、UMIマルチプライヤーは3ヌクレオチド長であり、各ヌクレオチド配列は、3840個のユニークヌクレオチド配列の任意の他の配列から少なくとも2のハミング距離だけ離れている。
【0127】
したがって、多機能性ID領域は、試料とDNA断片の両方の識別に寄与する。これは、ランダムに生成されたタグを使用して配列を識別し、別個のバーコードまたはシーケンサーインデックス付けを使用して試料多重化を可能にする当技術分野で使用されている現在のシステムとは全く対照的である。
【0128】
UMIマルチプライヤー
可能な配列タグ(UMI)の多様性をさらに増大させるために、UMIマルチプライヤーがアダプターに含まれる。UMIマルチプライヤーは、UMIと組み合わされると、アダプタープール内のアダプター配列の多様性および総数を増加させるランダム塩基(例えば、NNN(式中、各Nは、A、C、G、およびTのいずれか1つから選択されてもよい))の短い配列である。いくつかの実施形態では、アダプターは、UMIマルチプライヤーを含み、UMIマルチプライヤーは、ID領域に隣接するか、またはID領域内に含まれる。いくつかの実施形態では、アダプターは、8ヌクレオチド長であるID領域と、3ヌクレオチド長であるUMIマルチプライヤーとを含む。いくつかの実施形態では、UMIマルチプライヤーは、3ヌクレオチド長であり、64個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、ID領域に隣接して配置されるか、またはID領域内に含まれる。
【0129】
いくつかの実施形態では、UMIマルチプライヤーの各ヌクレオチド位置は、アデニン、グアニン、シトシン、またはチミンのいずれか1つを含むことができる。したがって、いくつかの実施形態では、n個のヌクレオチドを含むUMIマルチプライヤーは、4n個の可能なヌクレオチド配列のいずれかを含むことができる。いくつかの実施形態では、UMIマルチプライヤーは、1ヌクレオチド長であり、4個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、2ヌクレオチド長であり、16個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、3ヌクレオチド長であり、64個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、4ヌクレオチド長であり、256個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、5ヌクレオチド長であり、1,024個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、6ヌクレオチド長であり、4,096個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、7ヌクレオチド長であり、16,384個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、8ヌクレオチド長であり、65,536個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、9ヌクレオチド長であり、262,144個の可能な配列のうちの1つを含む。いくつかの実施形態では、UMIマルチプライヤーは、10またはそれを超えるヌクレオチド長であり、1,048,576個またはそれを超える可能な配列のうちの1つを含む。
【0130】
いくつかの実施形態では、UMIマルチプライヤーは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチド長である。いくつかの実施形態では、UMIマルチプライヤーは、1~5ヌクレオチド長である。
【0131】
アンカー領域
「アンカー領域」および「アンカー配列」という用語は互換的に使用され、非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を指す。いくつかの実施形態では、アンカー領域はリンカーとも呼ばれる。アンカー領域は、いくつかの実施形態では、以下の特性のうちの1またはそれを超えるものを含み得る。
(1)各アンカー配列は、伸長内の各部位における4つの可能なDNA塩基のそれぞれを集合的に表す2またはそれを超えるユニークアンカー型のプールの一部であり得る。この特徴、バランスのとれた塩基提示は、いくつかの実施形態ではシーケンシングリードにおいて適切な塩基呼び出しを較正するのに有用である。アンカー配列の型の総数は、検出モードの総数と一致するべきである。例えば、Illumina(登録商標)シーケンシングでは4色が検出されるため、4種類のアンカー配列を使用してもよい。最大感度を達成するために、各検出モードを利用することができる。本開示の組成物および方法は、光に基づく検出、酵素に基づく検出、および磁気検出を含むがこれらに限定されない、当技術分野で公知の任意の検出モードで使用することができる。
(2)各アンカー配列は、4つの可能な塩基のうちの2つのみから構成されてもよく、これらは、A+Cの数およびG+Tの数のいずれかであるように特に選択される。2つの塩基のみから形成されたアンカー配列は、適切なアダプター機能を妨げる二次構造形成にアンカー配列が関与するであろう可能性を低減する。
(3)各アンカー配列は等しい数のA+CまたはG+Tから構成されるので、各アンカー配列は、プール内の他のすべてのアンカー配列とほぼ同じ融解温度および二重鎖安定性を共有し得る。
(4)各型のアンカー配列(A/T/G/Cのいずれかで終わる)は、シーケンシングリードにおいて、例えば、ほぼ等モル量(すなわち、プールのうちの約25%がAで終わるアダプター配列、約25%がTで終わるアダプター配列、約25%がGで終わるアダプター配列、および約25%がCで終わるアダプター配列を有する)でほぼ等しく分布し得る。
【0132】
いくつかの実施形態では、アダプターモジュールは、より均一なアダプター分布を提供するために、異なるアンカー型(例えば、等モル量のアンカー1、アンカー2、アンカー3、アンカー4)を含有する等モル量のアダプターのDNA断片と混合される。例示的なアンカー配列には、これらに限定されないが、アンカー1ACGTATGCCA(配列番号2)、アンカー2CTAGCGTTAC(配列番号3)、アンカー3GATCGACATG(配列番号4)、アンカー4TGCATCAGGT(配列番号5)が挙げられる。
【0133】
いくつかの実施形態では、アダプター配列は、3’末端のTヌクレオチド(3’Tオーバーハング)で終わる。いくつかの実施形態では、アダプターは、3’末端の最後の2ヌクレオチドとしてTTを有する。いくつかの実施形態では、アダプターは、3’末端の最後の2ヌクレオチドとしてAT、CTまたはGTを有する。
【0134】
一般に、アンカー型の理想的な分布は、各アンカー型が同一の分布率(すなわち、100%をアンカー型の数で割ったものである)を有することをもたらし、すべてのDNA断片の中で異なるアンカーを含む異なるアダプターの「均一な」分布をもたらす。例えば、4つのアンカー型の理想的な分布は、各アンカー型の約25%の分布をもたらす。いくつかの実施形態では、所与のプールのアンカー配列は、約5%~約75%(すなわち、最も頻度の低いアンカー型の分布%は約5%であり、最も頻度の高いアンカー型の分布%は約75%である)の分布パーセンテージを有する。いくつかの実施形態では、所与のプールの各アンカー配列は、約50%、約34%、約28%、約27%、約23%、約14%または約9%の分布%を有する。いくつかの実施形態では、本明細書に記載の自動化可能なプロセスの各アンカー配列の分布率は、コンパレータープロセス(すなわち、自動化のために設計されていないプロセス、表4を参照されたい)と比較して、対応する理想的な分布率に少なくとも5%、少なくとも10%、少なくとも25%、または少なくとも20%近い。
【0135】
いくつかの実施形態では、複数のアダプターは3’dTオーバーハングを含み、3’末端の最後の2つの2ヌクレオチドとしてTTを有するアンカーを有するより大量のアダプターを含み得る。そのようなアダプターは、プール中の他のアンカー型の量の1X、2X、4X、5X、6X、7X、8X、9X、または10X超であってよく、シーケンシングリードにおけるアダプターのより均一な分布をもたらし得る。
【0136】
いくつかの実施形態では、複数のアダプターは、2つ以上のアンカー配列を含み得る。例えば、複数のアダプターは、同時に使用される4つの異なるアンカー配列を含み得る。これらのアンカー配列はまた、エラーを低減するために試料逆多重化中に使用されてもよい。加えて、リード内の配列の位置は固定されており、したがって、下流の検討のために包含フィルタを通過させるために、ID領域およびアンカーはシーケンシングリード内の固定位置を有するべきである。
【0137】
いくつかの実施形態では、アンカー領域は、1~50ヌクレオチド長である。いくつかの実施形態では、アンカー領域は、4~40ヌクレオチド長である。いくつかの実施形態では、アンカー領域は5ヌクレオチド~25ヌクレオチド長である。いくつかの実施形態では、アンカー領域は、少なくとも4ヌクレオチド、少なくとも6ヌクレオチド、少なくとも8ヌクレオチド、少なくとも10ヌクレオチド、少なくとも12ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも16ヌクレオチド長である。いくつかの実施形態では、アンカー領域は10ヌクレオチド長である。
【0138】
例示的なワークフロー
本開示における方法の例示的なワークフローを以下に提供し、
図2に示す。
【0139】
1.末端修復
いくつかの実施形態では、入力DNA断片は、単一の反応混合物中で末端修復されたDNA断片が5’リン酸基および3’dAヌクレオチドオーバーハングを有するように、「末端修復されたDNA断片」に変換される(単一工程)。市販のキット(例えば、NEB Ultra II End Repair(登録商標)/dAテーリングモジュールE7546L)を使用してDNA断片または個々の酵素のうちの1またはそれを超えるものを末端修復することができ、かつ開示された緩衝液は、5’リン酸基および3’dAヌクレオチドオーバーハングを有する末端修復DNA断片の調製のために組み合わせることができる。
【0140】
いくつかの実施形態では、末端修復反応体積は50μL未満である。
【0141】
2.アダプターライゲーション
いくつかの実施形態では、多機能アダプターのプールを、1またはそれを超える試料由来の末端修復dsDNA断片に連結し(多重化)、dsDNA断片の5’末端へのアダプター付着をもたらす。
【0142】
いくつかの実施形態では、ライゲーション反応体積は100μL未満である。
【0143】
いくつかの実施形態では、アダプタータグ付きDNA断片を単離し、100μL未満の反応体積で洗浄する。
【0144】
3.伸長
いくつかの実施形態では、3’dAテーリングされたDNA断片をDNA断片の3’末端から伸長し、DNA断片の5’末端に付着したライゲーション鎖を鋳型として使用して非ライゲーション鎖を置換して、増幅に適した連続アダプタータグ付きdsDNA断片を作製する。「隣接するアダプタータグ付きdsDNA断片」の集合体は、非増幅アダプタータグ付きDNAライブラリーである。
図3は、本開示のいくつかの方法に従ってアダプタータグ付きDNAライブラリーを生成する例示的なプロセスを示す概略図である。
【0145】
いくつかの実施形態では、伸長反応体積は100μL未満である。
【0146】
4.増幅
いくつかの実施形態では、非増幅アダプタータグ付きDNAライブラリーは、アダプターの増幅領域内の増幅プライマー結合部位を認識する単一のプライマーでPCR増幅され、増幅アダプタータグ付きDNAライブラリーをもたらす。いくつかの実施形態では、単一プライマーは、配列番号70の配列を含む。本開示の目的のために、「増幅アダプタータグ付きDNAライブラリー」、「増幅タグ付きDNAライブラリー」および「ライブラリー産物増幅(LPA)」は互換的に使用される。
図5は、本開示の方法によるアダプタータグ付きDNAライブラリーの調製および増幅を示す概略図を提供する。
【0147】
いくつかの実施形態では、増幅反応体積は100μL未満である。
【0148】
いくつかの実施形態では、増幅タグ付きDNAライブラリーをさらに単離し、100μL未満の体積で洗浄する。
【0149】
いくつかの実施形態では、増幅は、表7に示される条件に従って行われる。例えば、いくつかの実施形態では、本明細書に記載の方法は、1)69℃のアニーリング温度下で2つの別個の管に分割されたライブラリーの増幅を実施すること、2)65℃のアニーリング温度下で2つの別個のチューブに分割されたライブラリーの増幅を実施すること、または3)65℃のアニーリング温度下でライブラリーを分割せずに(1チューブで)増幅を実施することを含む。
【0150】
5.遺伝子座/遺伝子座の捕捉および単離
いくつかの実施形態では、少なくとも部分的にビオチン化パートナーオリゴヌクレオチドに二重鎖化されたそのテール領域(第1の領域)を有する多機能捕捉プローブを増幅タグ付きDNAライブラリーにハイブリダイズさせて、1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を形成する。
【0151】
6.増幅タグ付きDNA分子捕捉プローブモジュール複合体の単離
いくつかの実施形態では、捕捉プローブ/アダプタータグ付きDNA複合体(すなわち、捕捉された断片)を、磁性ストレプトアビジンビーズを使用して非ハイブリダイズ断片(すなわち、捕捉されていない断片)から分離する。
【0152】
7.捕捉プローブ伸長
いくつかの実施形態では、複合体中のビーズ支持捕捉プローブを、タグ付きDNA断片を鋳型として使用して3’末端から伸長させ、アダプタータグ付きハイブリッド核酸分子(ハイブリッド分子)を作製し、各ハイブリッド分子は、捕捉プローブと、捕捉プローブが標的遺伝子配列にハイブリダイズした場所から3’にあるアダプタータグ付きDNA断片の相補体と、を含む。
【0153】
いくつかの実施形態では、変性は、ハイブリッド分子を磁気ビーズから溶液中に放出する。
図6は、捕捉プローブハイブリダイゼーションおよび伸長を示す概略図である。
【0154】
8.ハイブリッド分子の増幅
いくつかの実施形態では、Forward Primer(FP)(配列番号71)は、ハイブリッド分子内のアダプタータグの増幅領域内のプライマー結合部位にハイブリダイズし、ハイブリッド分子を鋳型として使用して捕捉プローブを5’→3’に伸長して、隣接する二本鎖ハイブリッド分子を作製する。
【0155】
いくつかの実施形態では、隣接する二本鎖ハイブリッド分子中のFP伸長鎖を変性させ、逆プライマー(RP)(配列番号72)が、ハイブリッド分子中の組み込まれた捕捉プローブモジュールテール領域において変性したFP伸長分子/鎖にハイブリダイズする。
【0156】
いくつかの実施形態では、RPは、当該技術分野における任意の他の公知の方法によるIllumina(登録商標)シーケンシングまたはシーケンシングの準備ができている連続二本鎖ハイブリッド分子を作製するための鋳型としてハイブリッド分子を使用して5’→3’に伸長する。
図7は、標的(捕捉)ライブラリーの増幅を示す概略図を提供する。
【0157】
いくつかの実施形態では、シーケンシングプライマーは互いに異なる。いくつかの実施形態では、ハイブリッド分子の各末端は、P5およびP7シーケンシングプライマー、または他のIllumina(登録商標)シーケンシングプライマーなどのシーケンシングプライマーによって認識されるシーケンシングプライマー結合部位を優先的に含む。増幅シーケンシング準備完了ハイブリッド分子の集合体は、「標的遺伝子ライブラリー」、「標的ライブラリー」または「プローブ捕捉ライブラリー(PCL)」と呼ばれる。
【0158】
いくつかの実施形態では、増幅反応体積は100μL未満である。
【0159】
いくつかの実施形態では、増幅ハイブリッド分子が単離され、洗浄される。
【0160】
9.シーケンシング
いくつかの実施形態では、増幅ハイブリッド分子の次世代シーケンシング(NGS)は、Illumina(登録商標)NextSeq(登録商標)550シーケンサーを使用して行われる。
【0161】
いくつかの実施形態では、NGSは、非増幅アダプタータグ付きDNAライブラリー、増幅タグ付きDNAライブラリー、ハイブリッド分子のライブラリー(非増幅標的ライブラリー)、および/または増幅標的ライブラリーで行うことができる。
【0162】
いくつかの実施形態では、シーケンシングRead1(151nt長)およびシーケンシングRead2(17nt長)は、特注のフォワードおよびリバースプライマーを用いて行われる。
【0163】
シーケンシングを、Illumina NextSeq 550に対して、製造者の指示に従って、カスタムプライマー、Forward Seq PrimerおよびReverse Seq Primer 62を使用して行った。
順方向Seqプライマー:
CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGACCAGAGAATTCGAATACA(配列番号73)
Reverse Seq Primer 62:
GTGACTGGCACGGGACCAGAGAATTCGAATACA(配列番号74)
【0164】
10.遺伝子解析
いくつかの実施形態では、ハイブリッド分子、または増幅プライマーまたはシーケンシングプライマーを使用してシーケンシングに供することができる本開示の方法に従って生成された分子のいずれか)を遺伝子解析に供する。
【0165】
いくつかの実施形態では、配列Read1および2が遺伝子解析のために使用される。
【0166】
いくつかの実施形態では、バイオインフォマティクス解析は、コピー数、SNV、インデル、遺伝子および染色体再編成などの遺伝的変異体を識別するために行われる。
【0167】
詳細な方法
1.アダプタータグ付きDNAライブラリーの調製
いくつかの実施形態では、本開示で企図される方法は、dsDNA断片を1またはそれを超える末端修復酵素で処理して末端修復DNAを生成することと、1またはそれを超えるアダプターを末端修復DNAの各末端に付着させてアダプタータグ付きDNAライブラリーを生成することとを含む、アダプタータグ付きDNAライブラリーを生成することを含む。
【0168】
DNA試料調製
本開示で使用される場合、「DNA」という用語はデオキシリボ核酸を指す。いくつかの実施形態では、DNAという用語は、ゲノムDNA、組換えDNA、合成DNA、またはcDNAを指す。いくつかの実施形態では、DNAは、ゲノムDNAまたはcDNAを指す。いくつかの実施形態では、DNAは「標的領域」を含む。本明細書で企図されるDNAライブラリーには、ゲノムDNAライブラリーおよびRNAから構築されたcDNAライブラリー、例えばRNA発現ライブラリーが含まれる。いくつかの実施形態では、DNAライブラリーは、1またはそれを超える追加のDNA配列および/またはタグを含む。
【0169】
本開示で使用される場合、「循環DNA」、「循環無細胞DNA」、および「無細胞DNA」という用語は、しばしば互換的に使用され、細胞外DNAであるDNA、細胞から押し出されたDNA、または壊死細胞若しくはアポトーシス細胞から放出されたDNAを指す。この用語は、本明細書で互換的に使用され、細胞内に含まれ(すなわち、ヌクレアーゼ)、細胞の完全性を溶解または破壊することによって本明細書に記載されるものなどの分子生物学的技術にのみアクセス可能なゲノムDNAを指す「細胞ゲノムDNA」または「細胞DNA」とは対照的に使用されることが多い。
【0170】
本開示で提供される組成物および方法は、典型的には少量で得られる貴重な生物学的試料、例えば癌組織生検試料または典型的には流体(例えば、尿、CSF、全血、血漿、唾液)である「液体生検」試料の調製に特に適している。
【0171】
いくつかの実施形態では、ライブラリーを作製するために使用されるDNAの量は、任意の適切な量であり得る。いくつかの実施形態では、その量は、約1pg~約500ng、約1ng~約400ng、約5ng~約300ng、約10ng~約250ngまたは約20ng~約200ngである。いくつかの実施形態では、DNA量は、約5ng~約50ngである。
【0172】
いくつかの実施形態では、ライブラリーを作製するために使用されるDNAの量は、任意の適切な量であり得る。いくつかの実施形態では、その量は、1pg~500ng、1ng~400ng、5ng~300ng、10ng~250ngまたは20ng~200ngである。いくつかの実施形態では、DNA量は、5ng~50ngである。
【0173】
いくつかの実施形態では、本開示において企図される方法および組成物は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNAまたは脱メチル化DNAから選択されるdsDNAを使用する。
【0174】
いくつかの実施形態では、本明細書で企図される遺伝子解析の方法は、cfDNAまたは断片化された細胞ゲノムDNAを1またはそれを超える末端修復酵素で処理して末端修復されたDNAを生成すること、および1またはそれを超えるアダプターを末端修復されたDNAの各末端に付着させてDNAライブラリーを生成することを含むDNAライブラリーを生成することを含む。
【0175】
いくつかの実施形態では、本明細書で企図される方法および組成物は、分析物としてゲノムDNAを使用して、コピー数の変化を効率的に解析、検出、診断、および/またはモニタリングするように設計される。いくつかの実施形態では、コピー数解析は、試験試料、例えば組織生検などの生物学的試料から得られたゲノムDNAからゲノムDNAライブラリーを生成することによって行われる。いくつかの実施形態では、ゲノムDNAは循環DNAまたは無細胞DNAである。いくつかの実施形態では、ゲノムDNAは細胞ゲノムDNAである。
【0176】
いくつかの実施形態では、ゲノムDNAは、骨髄、食道、胃、十二指腸、直腸、結腸、回腸、膵臓、肺、肝臓、前立腺、脳、神経、髄膜組織、腎組織、子宮内膜組織、子宮頸部組織、乳房、リンパ節、筋肉、および皮膚を含むがこれらに限定されない組織から採取された組織試料または生検物から得られる。いくつかの実施形態では、組織試料は腫瘍または疑われる腫瘍の生検物である。いくつかの実施形態では、腫瘍は癌性であり、または癌性であることが疑われる。いくつかの実施形態では、組織試料は、癌細胞または癌性であると疑われる細胞を含む。
【0177】
細胞または細胞からなる生物学的組織からゲノムDNAを精製する方法は当技術分野で周知であり、当業者は、組織および組織が得られる条件に応じて最適な手順または市販のキットを認識するであろう。いくつかの実施形態は、組織から細胞DNAを精製するには、例えば、組織試料のブレンド、粉砕または超音波処理、細胞溶解にも役立つ洗剤または界面活性剤を添加することによって膜脂質を除去すること、必要に応じて、例えばプロテアーゼを添加することによってタンパク質を除去すること、例えばRNaseを添加することによるRNAの除去、および、例えば、細胞溶解工程中に使用される界面活性剤、タンパク質、塩および試薬からのDNA精製などの化学的および物理的方法によって、細胞内の細胞DNAを露出させるために細胞破壊または細胞溶解が必要になることを企図している。DNA精製は、例えばエタノールまたはイソプロパノールを用いた沈殿によって、フェノール-クロロホルム抽出によって実施され得る。
【0178】
いくつかの実施形態では、組織および/または細胞から得られた細胞DNAは、本開示に記載されるゲノムDNAライブラリーの取得、生成、作製、形成および/または生成の前および/またはその間に断片化される。当業者は、DNA断片化にはいくつかの適切な技術があり、次世代シーケンシングを含むがこれに限定されない、DNAシーケンシングのためのゲノムDNAライブラリーを生成する目的で細胞DNAを断片化するための適切な技術を認識および識別することができることを理解するであろう。いくつかの実施形態は、細胞DNAを、物理的断片化、酵素的断片化および化学的せん断を含むがこれらに限定されない方法によってライブラリーを作製するのに適切および/または十分な長さの断片に断片化することができることを企図している。
【0179】
物理的断片化には、音響せん断、超音波処理、および流体力学的せん断が含まれ得るが、これらに限定されない。いくつかの実施形態では、細胞DNAは、物理的断片化によって断片化される。いくつかの実施形態では、細胞DNAは、音響せん断または超音波処理によって断片化される。いくつかの実施形態は、音響せん断および超音波処理が、細胞DNAをせん断するために使用される一般的な物理的方法であることを企図している。Covaris(登録商標)機器(マサチューセッツ州ウォバーン)は、DNAを100~5kb bpに切断するための音響装置である。Covaris(登録商標)は、Mate-Pairライブラリー用の6~20kbの試料を処理するであろうチューブ(gTube)も製造している。Bioruptor(登録商標)(ニュージャージー州デンビル)は、クロマチン、DNAをせん断し、組織を破壊するために利用される超音波処理装置である。少量のDNAを150~1kbの長さにせん断することができる。Digilab(登録商標)(マサチューセッツ州マールボロー)のHydroshear(登録商標)は、流体力学的力を利用してDNAをせん断する。ネブライザー(Life Technologies(登録商標)、ニューヨーク州グランドアイランド)を使用して、圧縮空気を使用して液体を霧化し、DNAを100~3kb断片に数秒でせん断することもできる。噴霧化は低コストであるが、このプロセスは元の試料から細胞DNAの約30%の喪失を引き起こし得る。いくつかの実施形態では、細胞DNAは、超音波処理によって断片化される。
【0180】
酵素的断片化には、限定するものではないが、制限エンドヌクレアーゼ、例えば、DNase I、または非特異的ヌクレアーゼによる処理が含まれる。いくつかの実施形態では、細胞DNAは酵素的断片化によって断片化される。いくつかの実施形態では、細胞DNAは、制限エンドヌクレアーゼによる処理によって断片化される。いくつかの実施形態では、細胞DNAは、非特異的ヌクレアーゼによる処理によって断片化される。いくつかの実施形態では、細胞DNAは、トランスポザーゼによる処理によって断片化される。いくつかの実施形態では、細胞DNAを小片にせん断する酵素的方法として、DNAse I、マルトース結合タンパク質(MBP)-T7 Endo Iと非特異的ヌクレアーゼであるVibrio vulnificus(Vvn)ヌクレアーゼとの組み合わせ、New England Biolabs(登録商標)の(マサチューセッツ州イプスウィッチ)Fragmentase(登録商標)およびNextera(商標)タグメンテーション技術(Illumina(登録商標)、カリフォルニア州サンディエゴ)が挙げられる。非特異的ヌクレアーゼとT7 Endoとの組み合わせは相乗的に作用して、非特異的なニックを生成し、ニックを打ち消し、8ヌクレオチドまたはそれ未満をニック部位から解離させる断片を生成する。タグメンテーションは、トランスポザーゼを使用して、アダプターを二本鎖DNAに同時に断片化および挿入する。
【0181】
化学的断片化は、熱および二価金属カチオンによる処理を含むことができる。いくつかの実施形態では、ゲノムDNAは、化学的断片化によって断片化される。いくつかの実施形態は、化学的せん断が、ゲノムDNAとは対照的に、長いRNA断片の破壊により一般的に使用されることを企図している。化学的断片化は、典型的には、二価の金属カチオン(マグネシウムまたは亜鉛)によるDNAの熱消化によって行われる。DNA断片の長さは、インキュベーション時間を増減することによって調整することができる。
【0182】
いくつかの実施形態では、200bp断片を生成するのに適した超音波処理器(Covaris(登録商標))を使用する超音波処理によってゲノムDNAを断片化することができる。
【0183】
いくつかの実施形態では、生成された断片は、常磁性AMPure XP(登録商標)ビーズ(Beckman(登録商標))を用いた「両側」ビーズ精製を使用してさらに精製およびサイズ選択することができる。
【0184】
いくつかの実施形態では、せん断細胞株DNAの混合物は、試験の目的に適した様々な比であってよく、(Xおよび/またはY染色体上の遺伝子を説明するために)女性および/または男性対象からのWT cfDNAとブレンドして、単一遺伝子多型(SNP)、挿入および/または欠失(Indel)、遺伝子配置(転座、融合、逆位、重複(コピー数変化)および定義された対立遺伝子頻度(AF)での他の変異体などの一塩基変異体(SNV)を有する実験室で生成された試料を生成することができる。
【0185】
いくつかの実施形態では、本開示において企図される方法および組成物は、ローパス全ゲノムライブラリー、アンプリコンライブラリー、全エクソームライブラリー、cDNAライブラリー、またはメチル化DNAライブラリーから得られるdsDNAを使用する。
【0186】
いくつかの実施形態では、本開示の方法および組成物は、表1に記載のDNA試料のいずれか1つを分析物として使用する。例えば、いくつかの実施形態では、本開示で企図される方法および組成物は、無細胞DNA(cfDNA)を分析物として使用する。いくつかの実施形態では、分析物として使用されるDNA試料は、合成DNA、ゲノムDNA、またはそれらの混合物を含む。いくつかの実施形態では、分析物として使用されるDNA試料は、HRD(Homologous Repair Deficient:相同修復欠損)遺伝子変異体、例えば以下の遺伝子:ATM、BRCA1、BRCA2、FANCA、HDAC2、PALB2、ERBB2、TP53、EML4-Alk、EGFRのいずれか1つの変異体を含む。いくつかの実施形態では、分析物として使用されるDNA試料は、肺癌遺伝子変異体を含む。いくつかの実施形態では、分析物として使用されるDNA試料は、NA12878、PC-3またはH2228などの細胞株由来のDNAを含む。
【0187】
いくつかの実施形態では、約10~約250ngの試料DNAが解析に使用される。例えば、いくつかの実施形態では、約1~約100ng、約1~約50、または約1~約25ngのDNAが使用される。いくつかの実施形態では、約20、約25、または約50ngのDNAが使用される。
【0188】
いくつかの実施形態では、分析物として使用されるcfDNAのサイズ分布は、約150bp~約180bpの断片の範囲である。いくつかの実施形態では、cfDNAのサイズ分布は、150bp~180bp断片の範囲である。cfDNAの断片化は、エンドヌクレアーゼ活性および/またはエキソヌクレアーゼ活性の結果であってよく、cfDNAの正確で信頼性があり、堅牢な解析に対する困難な課題を提示する。cfDNAを解析するための別の課題は、血流中での半減期が約15分程度と短いことである。いかなる特定の理論にも拘束されることを望むものではないが、本開示は、cfDNAの解析が「液体生検」のようであり、現在の生物学的プロセスのリアルタイムスナップショットであることを部分的に企図する。
【0189】
さらに、cfDNAは細胞内に見出されず、生物学的体液および便試料を含むがこれらに限定されないいくつかの適切な供給源から得られ得るので、解析される組織への直接アクセスなどの次世代シーケンシング解析を妨げる既存の制限を受けない。
【0190】
いくつかの実施形態では、本明細書で企図される遺伝子解析の方法は、1またはそれを超える末端修復酵素でcfDNAを処理して末端修復されたcfDNAを生成することと、1またはそれを超えるアダプターを末端修復されたcfDNAの各末端に連結してcfDNAライブラリーを生成することと、を含む、cfDNAライブラリーを生成することを含む。
【0191】
いくつかの実施形態ではcfDNAを単離するための適切な供給源である生物学的体液の実例としては、これらに限定されないが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、粘液および汗が挙げられる。
【0192】
いくつかの実施形態では、生物学的体液は血液または血漿である。
【0193】
いくつかの実施形態では、当業者に公知の市販のキットおよび他の方法を使用して、例えば、EDTA、EGTA、または二価カチオンに特異的な他のキレート剤を含むがこれらに限定されない酵素キレート剤を凍結および/または添加することによって、対象の生物学的体液または以前に得られ、必要に応じて安定化された生物学的試料からcfDNAを直接単離することができる。
【0194】
いくつかの実施形態では、遺伝子変異体(Coriell Institute for Medical ResearchまたはSeraCare Life Sciences,Inc.)を有する不死化細胞から単離された無細胞DNAまたはゲノムDNA(例えば、cfDNAまたはgDNA)をNGSライブラリー構築に使用することができる。
【0195】
いくつかの実施形態では、無細胞DNAは、QIAmp DSP Circulating NA kit(Qiagen)を用いて血漿試料から抽出され得る。
【0196】
単一工程DNA末端修復
本開示のDNA断片は処理された形態で得ることができるが、本開示の方法は、本開示のアダプターへのライゲーションに適したDNA断片を得るための生物学的試料の処理を可能にする。例えば、本開示のDNA断片の処理された形態には、平滑末端、平滑3’末端、平滑5’末端、デオキシリボ核酸アデニン(dA)テール、3’末端のdAテール、5’末端のdAテール、リン酸化核酸、3’末端のリン酸化核酸、および5’末端のリン酸化核酸のうちの1またはそれを超えるものを含むDNA断片が含まれるが、これらに限定されない。
【0197】
いくつかの実施形態では、「末端修復」は、脱リン酸化された、内部損傷修復された、平滑末端化された、5’リン酸化されたDNA断片を生成するために、または3’オーバーハングを有するDNA断片を生成するために実施され得る。
【0198】
DNA断片の処理を含む本開示の方法のいくつかの実施形態では、末端を平滑末端化するためのDNA修復反応、Aテーリング反応およびリン酸化反応のうちの1またはそれを超えるものを単一工程で実施することができる。
【0199】
いくつかの実施形態では、ゲノムDNAライブラリーの生成は、単離されたcfDNAまたは断片化された細胞DNAの末端修復を含む。断片化されたcfDNAまたは細胞DNAは、末端修復酵素によって処理されて、平滑末端、5’オーバーハングまたは3’オーバーハングを有する末端修復されたcfDNAを生成する。いくつかの実施形態では、末端修復酵素は、例えば、生じることができる。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAは平滑末端を含む。いくつかの実施形態では、末端修復された細胞DNAまたはcfDNAは、平滑末端を含有するように処理される。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAの平滑末端は、単一塩基対オーバーハングを含有するようにさらに修飾される。いくつかの実施形態では、平滑末端を含有する末端修復されたcfDNAまたは細胞DNAを、アデニン(A)/チミン(T)オーバーハングを含有するようにさらに処理することができる。いくつかの実施形態では、平滑末端を含有する末端修復されたcfDNAまたは細胞DNAを、単一塩基対オーバーハングとしてアデニン(A)/チミン(T)オーバーハングを含有するようにさらに処理することができる。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAは、非鋳型3’オーバーハングを有する。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAは、3’オーバーハングを含有するように処理される。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAは、3’オーバーハングを含有するように末端トランスフェラーゼ(TdT)で処理される。いくつかの実施形態では、GテールをTdTによって付加することができる。いくつかの実施形態では、末端修復されたcfDNAまたは細胞DNAは、任意の公知の制限酵素(例えば、酵素Sau3Aなどを用いて、)による部分消化を使用してオーバーハング末端を含むように処理される。
【0200】
いくつかの実施形態では、DNA断片の脱リン酸化は、アルカリホスファターゼなどの熱不安定性ホスファターゼによって行うことができる。市販の例としては、APex(商標)Heat Labile Alkaline ホスファターゼ、NTPhos(商標)Thermolabile Phosphatase、KT(商標)Thermolabile Phosphataseおよびシュリンプアルカリホスファターゼ(SAP)が挙げられる。
【0201】
いくつかの実施形態では、内部DNA損傷は、DNA断片の内部損傷を修復し得る1またはそれを超える修復酵素によって修復され得る。例としては、Taq DNAリガーゼ、Endonuclease IV、Bst DNAポリメラーゼFpg、Uracil-DNA Glycolase(UDG)、T4PDG、およびエンドヌクレアーゼVIIIが挙げられる。いくつかの実施形態では、すべての前述の酵素を使用することができる。前述の酵素(例えば、PreCR酵素キット)の市販のカクテルを使用してもよく、または任意の組み合わせで1またはそれを超える個々の酵素を添加することによってカクテルを調製してもよい。いくつかの実施形態では、DNA内部損傷修復は行われなくてもよい。
【0202】
いくつかの実施形態では、dA-テーリングのための内部DNA損傷修復、末端修復および末端トランスフェラーゼ(TdT)は、単一工程および単一反応混合物で行われ得る。いくつかの実施形態では、NEBからのPreCR酵素キットまたはQuick平滑末端キットなどの市販のキットを単一工程反応に使用することができる。
【0203】
いくつかの実施形態では、DNA末端修復は、平滑末端DNA断片を作製するための1またはそれを超える末端修復酵素の使用によって行われ得る。酵素は、3’-5’エキソヌクレアーゼ、5’-3’DNAポリメラーゼ(例えば、クレノウ断片)、および5’FLAPエンドヌクレアーゼを含み得る。
【0204】
いくつかの実施形態では、dA-テーリングのためのDNA末端修復、5’リン酸化、および末端トランスフェラーゼ(TdT)を単一工程および単一反応混合物で行い、3’-オーバーハング末端で5’リン酸化されたdsDNA断片、例えば5’リン酸化および3’dA-テーリングされたdsDNA断片を生成することができる。いくつかの実施形態では、NEBからのNext Ultra II End repair/dA-テーリングキットなどの市販のキットを単一工程反応に使用することができる。
【0205】
いくつかの実施形態では、本開示は、以下の反応:脱リン酸化、内部DNA損傷修復、平滑末端生成、5’末端リン酸化、および3’オーバーハング生成のそれぞれについて酵素および試薬を単一混合物に組み合わせることによって、適切な量の断片化されたDNA試料を「単一工程末端修復」することができることを企図している。この単一工程単一反応プロセスは、5’リン酸化末端および3’オーバーハングを有する末端修復二本鎖DNA断片を生成する。いくつかの実施形態では、3’オーバーハングはdAテールを含む。
【0206】
いくつかの実施形態では、末端修復され得るDNAの量は、任意の適切な量であり得る。いくつかの実施形態では、末端修復されるDNAの量は、1ng~500ng、5ng~400ng、10ng~300ng、15ng~250ng、または20ng~200ngである。いくつかの実施形態では、末端修復されるDNAの量は、20ng~50ngである。
【0207】
末端修復DNAへのアダプターライゲーション
いくつかの実施形態では、ライゲーション工程は、アダプターモジュールを末端修復されたcfDNAに連結して「タグ付き」cfDNAライブラリーを生成することを含む。いくつかの実施形態では、単一のアダプターモジュールが使用される。いくつかの実施形態では、2つ、3つ、4つまたは5つのアダプターモジュールが使用される。いくつかの実施形態では、同一配列のアダプターモジュールを、断片化された末端修復DNAの各末端に連結する。いくつかの実施形態では、非同一配列のアダプターモジュールを、各断片化末端修復DNAの2つの末端に連結する。
【0208】
本明細書で企図される1またはそれを超えるアダプターのライゲーションは、当業者に公知の方法によって行われ得る。いくつかの実施形態では、本明細書で企図される1またはそれを超えるアダプターは、平滑末端を含む末端修復されたcfDNAに連結される。いくつかの実施形態では、1またはそれを超えるアダプターは、使用されるライゲーション方法に適切な相補的末端を含む末端修復されたcfDNAに連結される。いくつかの実施形態では、1またはそれを超えるアダプターは、3’オーバーハングを含む末端修復されたcfDNAに連結される。
【0209】
いくつかの実施形態では、ゲノムDNA断片を複数のアダプターに付着させることは、末端修復されたcfDNAまたは細胞DNA断片を、アンカー領域の少なくとも一部を含むオリゴヌクレオチドに付着させる工程を含む。いくつかの実施形態では、オリゴヌクレオチドは、アンカー領域全体を含有する。いくつかの実施形態では、オリゴヌクレオチドは、パートナー鎖および二重鎖化された5’リン酸化結合鎖を含むDNA二重鎖であり、パートナー鎖はその3’末端で化学修飾によって付着がブロックされており、付着鎖はゲノムDNA断片に付着している。いくつかの実施形態では、次いで、アンカー領域の少なくとも一部と付着したDNA断片を、完全長アダプター配列をコードするDNAオリゴヌクレオチドとアニーリングする。いくつかの実施形態では、1またはそれを超えるポリヌクレオチドキナーゼ、1またはそれを超えるDNAリガーゼ、および/または1またはそれを超えるDNAポリメラーゼを、ゲノムDNA断片および完全長アダプター配列をコードするDNAオリゴヌクレオチドに付加する。いくつかの実施形態では、ポリヌクレオチドキナーゼはT4ポリヌクレオチドキナーゼである。いくつかの実施形態では、DNAリガーゼはTaq DNAリガーゼである。いくつかの実施形態では、DNAポリメラーゼはTaqポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、完全長Bstポリメラーゼである。
【0210】
いくつかの実施形態では、アダプターおよびDNA断片を、ライゲーション緩衝液、試薬およびライゲーション酵素、例えばDNAリガーゼ(例えば、T4リガーゼまたはTaqリガーゼ)および/またはRNAリガーゼと混合することができる。そのようなリガーゼは、上記の3’オーバーハングを有する一本鎖ライゲーション鎖を一本鎖DNA断片に連結するために使用することができる。
【0211】
いくつかの実施形態では、多機能アダプターのライゲーション鎖は、ライゲーション鎖の3’末端オーバーハングおよびDNA断片の3’オーバーハングの相補体を介してdsDNA断片の5’末端に単一工程で連結するが、非ライゲーション鎖はDNA断片の3’末端に付着しないままである。
【0212】
いくつかの実施形態では、ライゲーション工程は、多機能アダプターをdsDNA断片と連結して、多機能アダプター/dsDNA断片複合体を生成することを含む。いくつかの実施形態では、単一のアダプターが使用される。いくつかの実施形態では、2つ、3つ、4つまたは5つのアダプターが使用される。いくつかの実施形態では、同一配列のアダプターモジュールが、断片化された末端修復DNAの各末端に付着している。
【0213】
いくつかの実施形態では、同じアダプターがDNA断片の両端に付着している。いくつかの実施形態では、異なるアダプターがdsDNA断片の異なる末端に付着している。
【0214】
いくつかの実施形態では、ライゲーション工程は、
(a)複数の多機能アダプターを複数のdsDNA断片と連結して、複数の多機能アダプター/dsDNA断片複合体を生成することであって、多機能アダプターが本開示の多機能アダプターのいずれか1つである、生成すること、
(b)工程(a)からのアダプター/DNA断片複合体を1またはそれを超える酵素と接触させて、複数の連続した二本鎖アダプタータグ付きDNA断片を含むアダプタータグ付きDNAライブラリーを形成すること、を含む。
【0215】
いくつかの実施形態では、工程(b)におけるアダプター/DNA断片複合体は、ライゲーション鎖を鋳型として使用したDNAポリメラーゼ伸長によって、隣接する二本鎖アダプタータグ付きDNA断片にされる。
【0216】
いくつかの実施形態では、ライゲーション鎖を鋳型として使用して、結合していない非ライゲーション鎖をDNA断片の5’-3’ポリメラーゼ伸長によって置換する。いくつかの実施形態では、非ライゲーション鎖は、必要に応じて、dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾をその3’末端に含み得る。
【0217】
いくつかの実施形態では、非ライゲーション鎖は、ライゲーション鎖を鋳型として使用して、DNAポリメラーゼニッケル修復(ニック翻訳)によってDNA断片の3’末端に連結される。
【0218】
いくつかの実施形態では、dsDNA断片は、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、若しくはメチル化DNA、または脱メチル化DNAである。
【0219】
いくつかの実施形態では、複数のdsDNA断片は、複数の多機能アダプターと連結する前に末端修復される。
【0220】
いくつかの実施形態では、複数のdsDNA断片は、ローパス全ゲノムライブラリー、アンプリコンライブラリー、全エクソームライブラリー、cDNAライブラリーまたはメチル化DNAライブラリーからなるリストから選択されるライブラリーから得られる。
【0221】
いくつかの実施形態では、アダプターライゲーション期間は、ライゲーションに適した任意の期間であり得る。いくつかの実施形態では、期間は、少なくとも約5分である。いくつかの実施形態では、期間は、約5分~約72時間である。いくつかの実施形態では、期間は、約5分~約2時間である。いくつかの実施形態では、ライゲーション期間は、約1時間未満、約30分未満、約15分未満、または約10分未満である。
【0222】
いくつかの実施形態では、アダプターライゲーション期間は、ライゲーションに適した任意の期間であり得る。いくつかの実施形態では、期間は、少なくとも5分である。いくつかの実施形態では、期間は、5分~72時間である。いくつかの実施形態では、期間は、5分~2時間である。いくつかの実施形態では、ライゲーション期間は、1時間未満、30分未満、15分未満、または10分未満である。
【0223】
いくつかの実施形態では、アダプターライゲーション体積は、自動化および試料取り扱いロボット工学に適したものである。いくつかの実施形態では、反応体積は、約1μL~約1000μL、約1μL~約350μL、約1μL~約200μL、約1μL~約100μL、約1μL~約50μL、約5μL~約25μL、約10μL~約40μL、約20μL~約40μLである。いくつかの実施形態では、反応体積は、約100μLである。いくつかの実施形態では、体積は、約30μLである。
【0224】
いくつかの実施形態では、アダプターライゲーション体積は、自動化および試料取り扱いロボット工学に適したものである。いくつかの実施形態では、反応体積は、1μL~1000μL、1μL~350μL、1μL~200μL、1μL~100μL、1μL~50μL、5μL~25μL、10μL~40μL、20μL~40μLである。いくつかの実施形態では、反応体積は、100μLである。いくつかの実施形態では、体積は、30μLである。
【0225】
いくつかの実施形態では、アダプターライゲーションは、チューブのストリップまたはマイクロタイタープレートウェル、または自動化および/またはハイスループット処理を可能にするのに適した任意の他のフォーマットで行うことができる。
【0226】
いくつかの実施形態では、アダプター量は、任意の適切な濃度であり得る。いくつかの実施形態では、アダプターの濃度は、少なくとも0.01μMである。いくつかの実施形態では、アダプターの濃度は、約0.01μM~約200μM、約0.01μM~約50μM、約0.1μM~約50μM、約0.2μM~約20μM、約0.2μM~約10μM、約1μM~約10μM、または約2μM~約8μMである。いくつかの実施形態では、アダプター濃度は、少なくとも約2μMである。いくつかの実施形態では、アダプター濃度は、約5μMである。
【0227】
いくつかの実施形態では、アダプターの濃度は、0.01μM~200μM、0.01μM~50μM、0.1μM~50μM、0.2μM~20μM、0.2μM~10μM、1μM~10μM、または2μM~8μMである。いくつかの実施形態では、アダプター濃度は、少なくとも2μMである。いくつかの実施形態では、アダプター濃度は、5μMである。
【0228】
いくつかの実施形態では、ライゲーション反応混合物を約10℃~約30℃の温度でインキュベートすることができる。いくつかの実施形態では、ライゲーション反応混合物を約20℃でインキュベートすることができる。
【0229】
いくつかの実施形態では、ライゲーション反応混合物を10℃~30℃の温度でインキュベートすることができる。いくつかの実施形態では、ライゲーション反応混合物を20℃でインキュベートすることができる。
【0230】
いくつかの実施形態では、ライゲーション後、アダプタータグ付きDNA分子を単離し、洗浄することができる。これは、アダプター-DNA分子がビーズに付着したままであり、汚染物質が洗い流されるように、Ampure XP(登録商標)(Beckman(登録商標))またはSpectra mixなどのDNA精製ビーズを使用して行うことができる。溶出した清澄化上清は、複数のアダプタータグ付きDNA断片を含む単離されたライブラリーを含む。ライブラリーを含む上清を、増幅のために新鮮なPCRチューブまたはマイクロリットルプレートウェルに移すことができる。
【0231】
DNAライブラリー増幅
いくつかの実施形態では、dsDNA断片の5’-3’伸長を最初に行って、隣接するアダプタータグ付きdsDNA断片を生成し、次いで、隣接するアダプタータグ付きdsDNA断片を増幅して、複数の隣接するアダプタータグ付きdsDNA断片を含むアダプタータグ付きDNAライブラリーを生成する。
【0232】
いくつかの実施形態では、隣接するアダプタータグ付きdsDNA断片を形成するdsDNA断片の5’-3’伸長の第1の工程と、隣接するアダプタータグ付きdsDNA断片を増幅する第2の工程とを組み合わせて、単一工程でアダプタータグ付きDNAライブラリーを生成する。DNAライブラリー中のアダプタータグ付きdsDNA断片は、同じ増幅領域を含む両端のアダプターに隣接しており、増幅領域中の配列は、PCR増幅プライマーなどの単一の増幅プライマーによって認識可能な増幅プライマー結合部位として機能することができる。
【0233】
いくつかの実施形態では、ライゲーション鎖を鋳型として使用して、結合していない非ライゲーション鎖をDNA断片の5’-3’ポリメラーゼ伸長によって置換する。いくつかの実施形態では、非ライゲーション鎖は、必要に応じて、dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾をその3’末端に含み得る。
【0234】
いくつかの実施形態では、非ライゲーション鎖は、ライゲーション鎖を鋳型として使用して、DNAポリメラーゼニッケル修復によってDNA断片の3’末端に連結される。
【0235】
いくつかの実施形態では、DNAポリメラーゼが使用される。DNAポリメラーゼは、PCRまたはサーモスタット/等温増幅のために好熱性であり得る。いくつかの実施形態では、5’-3’伸長のための試薬および酵素並びにその後の増幅のための酵素を含有するマスターミックス(MM)を組み合わせる。このような伸長および増幅のための市販の酵素および試薬キットとしては、例えば、NEB Ultra II 2X PCR Amplification(登録商標)kit(New England Biolabs(登録商標))、Hi-Fidelity Q5(登録商標)酵素PCR(NEB)、KAPA(Roche(登録商標))KAPA 2 X(Roche(登録商標))、TruSeq Nano(登録商標)(Thermofisher(登録商標))AmpliTaq(登録商標)(Thermofisher(登録商標))等が挙げられる。
【0236】
いくつかの実施形態では、アダプタータグ付きDNAライブラリーの一部は、増幅を駆動する単一プライマー配列を有する標準的なPCR技術を使用して増幅される。いくつかの実施形態では、単一プライマー配列は約25ヌクレオチドであり、必要に応じて標準的なイオン強度条件下で55℃以上の予測Tmを有する。いくつかの実施形態では、単一プライマー配列は25ヌクレオチドであり、必要に応じて標準的なイオン強度条件下で55℃以上の予測Tmを有する。いくつかの実施形態では、単一の増幅プライマーは、アダプターモジュールの増幅領域内の配列に相補的である。いくつかの実施形態では、単一増幅プライマーは、のTGCAGGACCAGAGAATTCGAATACAの配列(配列番号70)を含む。
【0237】
いくつかの実施形態では、増幅は、PCR(ポリメラーゼ連鎖反応)、LAMP(ループ媒介等温増幅)、NASBA(核酸配列に基づく増幅)、SDA(鎖置換増幅)、RCA(ローリングサークル増幅)、LCR(リガーゼ連鎖反応)などの当技術分野で公知の任意の増幅によって行うことができる。
【0238】
いくつかの実施形態では、増幅中に、いくつかのアンプリコンは、アダプターが断片の両端に連結されているためにステムループ構造を形成する。この戦略は、非常に短い産物(例えばプライマー二量体)が増幅されるのを防ぎ、得られるライブラリーを偏らせるのに有効である。
【0239】
いくつかの実施形態では、最初の3分のインキュベーションサイクルを実施して、ライゲーション鎖鋳型伸長によって複数の連続したアダプタータグ付きdsDNA断片を形成する。
【0240】
いくつかの実施形態では、増幅タグ付きDNAライブラリーを形成するために、複数の隣接するアダプタータグ付きdsDNA断片に対してPCR増幅が行われる。
【0241】
いくつかの実施形態では、ピコグラムの複数の隣接するアダプタータグ付きdsDNA断片は、マイクログラムのDNAクローン(アダプタータグ付きDNAライブラリー)に増幅され、10,000倍の増幅を意味する。増幅産物の量は、当技術分野で公知の方法、例えば、Qubit 2.0またはNanodrop装置での定量を用いて測定することができる。
【0242】
いくつかの実施形態では、増幅アダプタータグ付きDNAライブラリーをDNA精製ビーズの使用によって単離し、洗浄緩衝液、例えばTris-EDTA緩衝液(TEZ)pH8.0で洗浄することができる。清澄化された上清は、新鮮なPCRチューブ若しくはマイクロタイタープレートウェル、または自動化および/またはハイスループットに適した任意の他のフォーマットに移すことができる。
【0243】
一般に、ライブラリーを増幅するためにはできるだけ少ないPCRサイクルを使用することが好ましい。ワークフロー時間の短縮に加えて、これはまた、PCR中に偏りを導入するリスクを制限する。本開示の方法における末端修復、dA-テーリングおよびアダプターライゲーションの効率の向上の結果は、シーケンシングまたは他の中間下流ワークフローに必要なライブラリー収率を達成するために必要なPCRサイクルが少なくなることである。開示されたワークフローおよびプロセスの合理化は、ターンアラウンドタイムの短縮、試薬の数の減少、使用される機器/機械の減少、および費用の削減などの利点を提供する。
【0244】
これらの上記プロセス、アダプターおよびタグ付きDNAライブラリーは、任意の試験試料中に存在する目的の遺伝子座が濃縮された捕捉プローブライブラリーを作製するために使用することができる。
【0245】
2.標的捕捉および単離
いくつかの実施形態では、ゲノムDNA、例えばゲノム細胞またはcfDNAの遺伝子解析のための方法は、DNAライブラリークローンの1またはそれを超える標的遺伝子座の定量的遺伝子解析を含む。定量的遺伝子解析は、以下の工程:標的遺伝子座を含むDNAクローンを捕捉すること、捕捉された標的遺伝子座の増幅、増幅捕捉された標的遺伝子座のシーケンシング、得られた配列リードの生物情報学的解析のうちの1またはそれを超えるもの、または全部を含む。本明細書で使用される場合、「DNAライブラリークローン」という用語は、アダプターとゲノムDNA断片との組み合わせがユニークDNA配列(例えば、別のDNAライブラリークローンのDNA配列と区別することができるDNA配列)をもたらすDNAライブラリー断片を指す。
【0246】
本開示は、部分的には、より大きなプローブの効率および信頼性を保持するが、より小さなDNA断片を含むゲノムDNAライブラリー、例えばcfDNAクローンライブラリーにおける情報価値のない配列生成を最小限に抑えるように設計された捕捉プローブモジュールを企図する。
【0247】
「多機能捕捉プローブ」および「捕捉プローブモジュール」という用語は互換的に使用される。いくつかの実施形態では、「捕捉プローブモジュール」または「多機能捕捉プローブ」は、捕捉プローブ配列およびテール配列を含み、捕捉プローブ配列は、タグ付き遺伝子DNAライブラリー中の標的領域にハイブリダイズすることができる。いくつかの実施形態では、多機能捕捉プローブは、パートナーオリゴヌクレオチドにハイブリダイズすることができる第1の領域を含み、必要に応じて、第1の領域は、PCRプライマー結合部位を含むテール配列、およびタグ付き遺伝子DNAライブラリー中の特定の標的領域にハイブリダイズすることができる第2の領域を含む。第1の領域はテール領域とも呼ばれてよく、第2の領域は捕捉プローブまたは捕捉プローブ配列とも呼ばれ得る。
【0248】
いくつかの実施形態では、捕捉プローブモジュールはテール配列を含む。本明細書で使用される場合、「テール配列」という用語は、いくつかの実施形態ではプライマー結合部位として機能することができる、捕捉プローブモジュールの5’末端のポリヌクレオチドを指す。いくつかの実施形態では、捕捉プローブはシーケンシングプライマー結合部位を含む。
【0249】
いくつかの実施形態では、テール配列は、約5~約100ヌクレオチド、約10~約100ヌクレオチド、約5~約75ヌクレオチド、約5~約50ヌクレオチド、約5~約25ヌクレオチド、または約5~約20ヌクレオチドである。いくつかの実施形態では、第3の領域は、約10~約50ヌクレオチド、約15~約40ヌクレオチド、約20~約30ヌクレオチド若しくは約20ヌクレオチド、または任意の介在する数のヌクレオチドである。
【0250】
いくつかの実施形態では、テール配列は、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチドまたは約40ヌクレオチドである。
【0251】
いくつかの実施形態では、テール配列は、5~100ヌクレオチド、10~100ヌクレオチド、5~75ヌクレオチド、5~50ヌクレオチド、5~25ヌクレオチドまたは5~20ヌクレオチドである。いくつかの実施形態では、第3の領域は、10~50ヌクレオチド、15~40ヌクレオチド、20~30ヌクレオチド若しくは20ヌクレオチド、または任意の介在する数のヌクレオチドである。
【0252】
いくつかの実施形態では、テール配列は、30ヌクレオチド、31ヌクレオチド、32ヌクレオチド、33ヌクレオチド、34ヌクレオチド、35ヌクレオチド、36ヌクレオチド、37ヌクレオチド、38ヌクレオチド、39ヌクレオチドまたは40ヌクレオチドである。
【0253】
いくつかの実施形態では、例示的なパートナーオリゴヌクレオチドは、以下であり得る。GTGAAAACCAGGATCAACTCCCGTGCCAGTCACATCTCAGATGAGCT(配列番号1)3’末端にビオチン-TEG修飾を有する。
【0254】
隣接するアダプタータグ付きDNA断片(非増幅)およびタグ付きDNAライブラリー(増幅)はそれぞれ、目的の1またはそれを超える遺伝子座が濃縮されたハイブリッド分子を含むライブラリーの調製を含む様々なシーケンシングに基づく遺伝子解析に有用であり、非増幅または増幅ライブラリー(「標的ライブラリー」)であり得る。
【0255】
上記のように調製された非増幅アダプタータグ付きDNA断片および/または増幅タグ付きDNAライブラリーは、多機能捕捉プローブモジュールにハイブリダイズして、特定の遺伝子座を標的とするライブラリー、すなわち標的ライブラリーを生成することができる。アダプタータグ付きDNA断片は、1またはそれを超える捕捉プローブとハイブリダイズすることができる。各捕捉プローブは、アダプタータグ付きDNA断片中の同じ遺伝子座を標的とすることができるか、またはアダプタータグ付きDNA断片中の異なる遺伝子座を標的とすることができる。いくつかの実施形態では、増幅タグ付きDNAライブラリー断片中の複数の遺伝子座が標的化される。
【0256】
いくつかの実施形態では、捕捉プローブは、細胞DNAから構築されたゲノムDNAライブラリーと共に使用される。いくつかの実施形態では、捕捉プローブは、cfDNAから構築されたゲノムDNAライブラリーと共に使用される。cfDNAの平均サイズは約150~約170bpであり、高度に断片化されているので、本明細書で企図されるいくつかの実施形態は、目的のDNA標的領域を調べるための高密度および比較的短い捕捉プローブの使用を含む、指向性組成物および方法である。いくつかの実施形態では、捕捉プローブは、均一な密度ですべての染色体セグメントにわたって分布するDNA標的領域にハイブリダイズすることができる。そのような捕捉プローブのセットは、本明細書では「染色体安定性プローブ」と呼ばれる。染色体安定性プローブは、染色体コピー数のゲノム規模の測定を提供するために、ゲノム規模でコピー数変異を調べるために使用される(例えば、染色体倍数性)。
【0257】
高密度捕捉プローブの使用に関する1つの特定の懸念は、一般に、捕捉プローブが特定の「配列ルール」を使用して設計されることである。例えば、冗長配列の領域または極端な塩基組成偏りを示す領域は、一般に、捕捉プローブの設計において除外される。しかしながら、捕捉プローブ設計規則における柔軟性の欠如は、プローブ性能に実質的に影響を及ぼさないことが発見されている。対照的に、位置制約によって厳密に選択された捕捉プローブは、オンターゲット配列情報に提供され、オフターゲットおよびマッピング不可能なリード捕捉をほとんど示さず、わずかな例外を伴う均一で有用なオフターゲットリードをもたらす。さらに、近接したプローブ間隔での高い冗長性は、時折生じる性能の悪い捕捉プローブを補償する。
【0258】
いくつかの実施形態では、標的領域は複数の捕捉プローブによって標的化され、任意の2またはそれを超える捕捉プローブは、互いの10ヌクレオチド以内、互いの15ヌクレオチド以内、互いの20ヌクレオチド以内、互いの25ヌクレオチド以内、互いの30ヌクレオチド以内、互いの35ヌクレオチド以内、互いの40ヌクレオチド以内、互いの45ヌクレオチド以内、または互いの50ヌクレオチド以上以内、並びにすべての介在ヌクレオチド長内で標的領域に結合するように設計されている。
【0259】
いくつかの実施形態では、捕捉プローブは、約25ヌクレオチド、約26ヌクレオチド、約27ヌクレオチド、約28ヌクレオチド、約29ヌクレオチド、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、約40ヌクレオチド、約41ヌクレオチド、約42ヌクレオチド、約43ヌクレオチド、約44ヌクレオチド、または約45ヌクレオチドである。
【0260】
いくつかの実施形態では、捕捉プローブは、25ヌクレオチド、26ヌクレオチド、27ヌクレオチド、28ヌクレオチド、29ヌクレオチド、30ヌクレオチド、31ヌクレオチド、32ヌクレオチド、33ヌクレオチド、34ヌクレオチド、35ヌクレオチド、36ヌクレオチド、37ヌクレオチド、38ヌクレオチド、39ヌクレオチド、40ヌクレオチド、41ヌクレオチド、42ヌクレオチド、43ヌクレオチド、44ヌクレオチド、または45ヌクレオチドである。
【0261】
いくつかの実施形態では、捕捉プローブは、約100ヌクレオチド、約200ヌクレオチド、約300ヌクレオチド、約400ヌクレオチド、または約100ヌクレオチドである。別の実施形態では、捕捉プローブは、約100ヌクレオチド~約500ヌクレオチド、約200ヌクレオチド~約500ヌクレオチド、約300ヌクレオチド~約500ヌクレオチド、または約400ヌクレオチド~約500ヌクレオチド、またはそれらの任意の介在範囲である。
【0262】
いくつかの実施形態では、捕捉プローブは、100ヌクレオチド、200ヌクレオチド、300ヌクレオチド、400ヌクレオチド、または100ヌクレオチドである。別の実施形態では、捕捉プローブは、100ヌクレオチド~500ヌクレオチド、200ヌクレオチド~500ヌクレオチド、300ヌクレオチド~500ヌクレオチド、または400ヌクレオチド~500ヌクレオチド、またはそれらの任意の介在範囲である。
【0263】
特定の実施形態では、捕捉プローブは、60ヌクレオチドである。別の実施形態では、捕捉プローブは、60ヌクレオチドよりも実質的に小さいが、同じDNA標的領域を標的とする60ヌクレオチド捕捉プローブと同等、および/またはそれよりも良好にハイブリダイズする。いくつかの実施形態では、捕捉プローブは、40ヌクレオチドである。
【0264】
いくつかの実施形態では、捕捉プローブモジュールは、捕捉プローブにハイブリダイズするタグ付きおよび/または増幅ゲノムDNAライブラリー(例えば、細胞またはcfDNAライブラリー)の1またはそれを超える捕捉断片の単離および/または精製を可能にする結合対の特定のメンバーを含む。いくつかの実施形態では、捕捉プローブモジュールは、ビオチンまたは別の適切なハプテン、例えばジニトロフェノール、ジゴキシゲニンにコンジュゲートしている。
【0265】
いくつかの実施形態では、捕捉プローブモジュールは、タグ付きされ、必要に応じて増幅DNAライブラリーにハイブリダイズして複合体を形成する。いくつかの実施形態では、多機能捕捉プローブモジュールは、DNAライブラリー中の特定のゲノム標的領域に実質的にハイブリダイズする。
【0266】
ハイブリダイゼーションまたはハイブリダイズ条件は、2つのヌクレオチド配列が安定な複合体を形成する任意の反応条件を含み得る。例えば、タグ付きDNAライブラリーおよび捕捉プローブモジュールは、安定なタグ付きDNAライブラリー-捕捉プローブモジュール複合体を形成する。そのような反応条件は当技術分野で周知であり、当業者は、そのような条件を適切に変更することができ、例えば、より短い長さの捕捉プローブを用いてアニーリング温度を低下させることができることを理解するであろう。捕捉プローブ複合体の第2の領域が、タグ付きDNAライブラリーの領域と100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、85%、80%、75%または70%の配列同一性、相同性または相補性を示す場合、実質的なハイブリダイゼーションが起こり得る。
【0267】
いくつかの実施形態では、捕捉プローブ(すなわち、標的配列にハイブリダイズする領域)は約40ヌクレオチドであり、約44℃~約47℃の最適アニーリング温度を有する。
【0268】
いくつかの実施形態では、捕捉プローブ(すなわち、標的配列にハイブリダイズする領域)は40ヌクレオチドであり、44℃~47℃の最適アニーリング温度を有する。
【0269】
いくつかの実施形態では、本明細書で企図される方法は、タグ付きcfDNAライブラリー-捕捉プローブモジュール複合体を単離することを含む。いくつかの実施形態では、DNA複合体を単離するための方法は当業者に周知であり(例えば、Ausubelら、Current Protocols in Molecular Biology、2007-2012を参照されたい)、当業者によって適切であると考えられる任意の方法を本開示の方法に関連して使用することができる。いくつかの実施形態では、ビオチン-ストレプトアビジン単離技術を使用して複合体を単離する。
【0270】
3.標的ライブラリーの増幅
いくつかの実施形態では、単離された捕捉プローブ/アダプタータグ付きDNA複合体からの一本鎖3’末端の除去が企図される。いくつかの実施形態では、方法は、一本鎖3’末端を除去するための単離されたタグ付きDNAライブラリー多機能捕捉プローブモジュール複合体の3’-5’エキソヌクレアーゼ酵素処理を含む。
【0271】
いくつかの他の実施形態では、本方法は、単離されたタグ付きDNAライブラリー断片を鋳型として利用して、多機能捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うことを含む。この伸長プロセスに適した酵素は、任意の好熱性熱安定性DNAポリメラーゼであり得る。市販のDNAポリメラーゼの例としては、高忠実度Q 5 DNAポリメラーゼ(NEB(登録商標))、NEBNext Ultra PCR(登録商標)、NEBNext Ultra II PCR(登録商標)(NEB)およびKAPA 2X(登録商標)(Roche(登録商標))が挙げられる。
【0272】
いくつかの他の実施形態では、方法は、DNAリガーゼによる5’FLAPエンドヌクレアーゼ、DNA重合およびニック閉鎖の協調作用によって、ハイブリッド捕捉プローブ単離タグ付きDNA標的分子、例えばタグ付きcfDNA標的分子またはタグ付き細胞DNA標的分子を作製することを含む。
【0273】
単離されたタグ付きDNAライブラリー多機能捕捉プローブモジュール複合体の3’-5’エキソヌクレアーゼ酵素処理には、様々な酵素を使用することができる。いくつかの実施形態では使用され得る、3’-5’エキソヌクレアーゼ酵素活性を示す好適な酵素の実例としては、これらに限定されないが、T4またはエキソヌクレアーゼI、III、Vが挙げられる(Shevelev IV,Hubscher U.,Nat Rev Mol Cell Biol.3(5):364-76(2002)も参照されたい)。いくつかの実施形態では、3’-5’エキソヌクレアーゼ活性を含む酵素は、T4ポリメラーゼである。いくつかの実施形態では、例えばT4またはエキソヌクレアーゼI、III、V.Idを含む、3’-5’エキソヌクレアーゼ酵素活性を示し、プライマー鋳型伸長が可能な酵素を使用することができる。
【0274】
いくつかの実施形態では、本明細書で企図される方法は、上記および本明細書の他の箇所で論じた3’-5’エキソヌクレアーゼ酵素処理複合体に対してシーケンシングおよび/またはPCRを行うことを含む。いくつかの実施形態では、ハイブリッド核酸分子を生成するために、捕捉プローブモジュールのテール部分がコピーされる。いくつかの実施形態では、生成されたハイブリッド核酸分子は、捕捉プローブモジュールおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的領域を含む。
【0275】
いくつかの実施形態では、遺伝子解析は、a)1またはそれを超える捕捉プローブモジュールを複数のゲノムDNAライブラリークローン中の1またはそれを超える標的遺伝子座にハイブリダイズさせて、1またはそれを超える捕捉プローブモジュール-DNAライブラリークローン複合体を形成することと、b)a)から1またはそれを超える捕捉プローブモジュール-DNAライブラリークローン複合体を単離することと、c)工程b)からの1またはそれを超える単離された捕捉プローブモジュール-DNAライブラリークローン複合体を酵素的処理することと、d)c)からの酵素的処理された複合体に対してPCRを行うことであって、増幅ハイブリッド核酸分子を生成するために、捕捉プローブモジュールのテール部分がコピーされ、増幅ハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールのテール配列の相補体にハイブリダイズすることができる標的ゲノム遺伝子座内の標的配列を含む、PCRを行うことと、e)d)からの増幅ハイブリッド核酸分子に対して定量的遺伝子解析を行うことと、を含む。
【0276】
いくつかの実施形態では、特定の標的遺伝子座のコピー数を決定するための方法であって、a)1またはそれを超える捕捉プローブモジュールを複数のDNAライブラリークローン中の1またはそれを超える標的遺伝子座にハイブリダイズさせて、1またはそれを超える捕捉プローブモジュール-DNAライブラリークローン複合体を形成することと、b)a)から1またはそれを超える捕捉プローブモジュール-DNAライブラリークローン複合体を単離することと、c)工程b)からの1またはそれを超える単離された捕捉プローブモジュール-DNAライブラリークローン複合体を酵素処理することと、d)c)からの酵素処理された複合体に対してPCRを行うことであって、増幅ハイブリッド核酸分子を生成するために、捕捉プローブモジュールのテール部分がコピーされ、増幅ハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールのテール配列の相補体にハイブリダイズすることができる標的遺伝子座内の標的配列を含む、PCRを行うことと、e)d)において増幅ハイブリッド核酸分子のPCR増幅を行うことと、f)e)におけるPCR反応を定量することであって、定量が、特異的標的領域のコピー数の決定を可能にする、PCR増幅を行うことと、を含む方法が企図される。
【0277】
いくつかの実施形態では、工程c)の酵素処理は、一本鎖3’末端を除去するために3’-5’エキソヌクレアーゼ活性を有する酵素を使用して、b)からの1またはそれを超える捕捉プローブモジュール-DNAライブラリークローン複合体に対して3’-5’エキソヌクレアーゼ酵素処理を行うこと、DNAリガーゼによる5’FLAPエンドヌクレアーゼ、DNA重合およびニック閉鎖の協調作用によって1またはそれを超えるハイブリッド捕捉プローブモジュール-cfDNAライブラリークローン分子を作製すること、または、複合体中の単離されたDNAクローンを鋳型として使用して、捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うこと、を含む。
【0278】
いくつかの実施形態では、工程c)の酵素処理は、複合体中の単離されたDNAクローンを鋳型として使用して捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うことを含む。
【0279】
いくつかの実施形態では、PCRは、当業者に周知の任意の標準的なPCR反応条件を使用して行うことができる。いくつかの実施形態では、e)におけるPCR反応は2つのPCRプライマーを用いる。いくつかの実施形態では、e)のPCR反応は、標的遺伝子座内のリピートにハイブリダイズする第1のPCRプライマーを使用する。特定の実施形態では、e)のPCR反応は、標的遺伝子座/テール接合部でハイブリッド核酸分子にハイブリダイズする第2のPCRプライマーを使用する。いくつかの実施形態では、e)のPCR反応は、標的遺伝子座にハイブリダイズする第1のPCRプライマーおよび標的遺伝子座/テール接合部で増幅ハイブリッド核酸分子にハイブリダイズする第2のPCRプライマーを使用する。いくつかの実施形態では、第2のプライマーは、プライマーの少なくとも1つまたはそれを超えるヌクレオチドが標的遺伝子座にハイブリダイズし、プライマーの少なくとも1つまたはそれを超えるヌクレオチドがテール配列にハイブリダイズするように、標的遺伝子座/テール接合部にハイブリダイズする。
【0280】
いくつかの実施形態では、増幅は、ループ媒介等温増幅(LAMP)、全ゲノム増幅(WGA)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、リコンビナーゼポリメラーゼ増幅(RPA)、核酸シーケンシングに基づく増幅(NASBA)、ニッキング酵素増幅反応(NEAR)、およびリガーゼ連鎖反応(LCR)などによる等温であり得る。
【0281】
いくつかの実施形態では、等温増幅のためのDNAポリメラーゼとしては、中温反応(25~40℃)のためのクレノウ断片、Bsu大断片およびphi29などのDNAポリメラーゼ、並びに高温(50~65℃)反応のためのBst DNAポリメラーゼの大断片が挙げられる。LCRに適した酵素には、熱安定性TaqリガーゼおよびTaqポリメラーゼなどの熱安定性DNAポリメラーゼが含まれる。
【0282】
いくつかの実施形態では、工程e)から得られた増幅ハイブリッド核酸分子を配列決定し、配列を水平に整列させる、すなわち、互いに整列させるが、参照配列に整列させない。いくつかの実施形態では、工程a)~e)は、1またはそれを超える捕捉プローブモジュールを用いて1回以上リピートされる。捕捉プローブモジュールは、同じであっても異なっていてもよく、標的遺伝子座のいずれかのcfDNA鎖を標的とするように設計され得る。いくつかの実施形態では、捕捉プローブが異なる場合、それらは、タグ付きcfDNAクローンライブラリー中の標的遺伝子座内の重複または隣接する標的配列でハイブリダイズする。いくつかの実施形態では、複数の捕捉プローブが標的遺伝子座にハイブリダイズし、複数の捕捉プローブのそれぞれが、すべての介在距離を含む、タグ付きDNAクローンライブラリー中の標的遺伝子座にハイブリダイズする任意の他の捕捉プローブの約5、約10、約15、約20、約25、約30、約35、約40、約45、約50、約100、約200bpまたはそれを超える範囲内で標的遺伝子座にハイブリダイズする高密度捕捉プローブ戦略が使用される。いくつかの実施形態では、複数の捕捉プローブが標的遺伝子座にハイブリダイズし、複数の捕捉プローブのそれぞれが、すべての介在距離を含む、タグ付きDNAクローンライブラリー中の標的遺伝子座にハイブリダイズする任意の他の捕捉プローブの5、10、15、20、25、30、35、40、45、50、100、200bpまたはそれを超える範囲内で標的遺伝子座にハイブリダイズする高密度捕捉プローブ戦略が使用される。
【0283】
いくつかの実施形態では、本方法は、標的遺伝子座ごとに2つの捕捉プローブモジュールを使用して実施することができ、1つは標的領域の上流で「Watson」鎖(非コードまたは鋳型鎖)にハイブリダイズし、1つは標的領域の下流で「Crick」鎖(コードまたは非鋳型鎖)にハイブリダイズする。
【0284】
いくつかの実施形態では、本明細書で企図される方法は、任意の数の捕捉プローブモジュール、例えば標的遺伝子座あたり2、3、4、5、6、7、8、9、または10個またはそれを超える捕捉プローブモジュールを用いて複数回さらに実施することができ、その任意の数は任意の組み合わせでWatsonまたはCrick鎖にハイブリダイズする。いくつかの実施形態では、得られた配列は、多数の差異のいずれかを識別するために、互いに整列され得る。
【0285】
いくつかの実施形態では、複数の標的遺伝子座、例えば、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、50000、100000、500000またはそれ以上が、単一反応で、1またはそれを超える捕捉プローブモジュールを使用して質問される。
【0286】
いくつかの実施形態では、酵素処理工程(上記の開示における工程c)は実施されない。いくつかの実施形態では、単離された捕捉プローブ/タグ付きDNA断片複合体を直接増幅し、DNAポリメラーゼが5’→3’伸長を行ってハイブリッド分子のライブラリーを形成する。いくつかの実施形態では、ハイブリッド分子を含有するライブラリーを、シーケンシングアダプター(例えば、アダプターは、Illumina(登録商標)NextSeq NGS技術のP5およびP7シーケンシングプライマーなどのシーケンシングプライマーに結合する)を含有するフォワードおよびリバースプライマーを使用してさらに増幅して、シーケンシング準備ができた増幅ハイブリッド分子の標的ライブラリーを生成する。
【0287】
酵素処理工程を排除することにより、標的ライブラリーは、開示された方法を使用してより速く生成される。そのようなより速い方法は、タグ付きDNAライブラリーおよび標的ライブラリー中のDNA断片中に存在する目的の遺伝子座の遺伝子解析の改善されたより速い性能をもたらす。当業者は、遺伝子座がDNA変化、例えばSNV、インデル、遺伝子再編成およびコピー数変化について解析され得ることを認識するであろう。
【0288】
4.ゲノム均等物の数の決定
いくつかの実施形態では、DNAの遺伝子解析のための方法は、DNAクローンライブラリー中のゲノム均等物の数を決定することを含む。本明細書で使用される場合、「ゲノム均等物」という用語は、各ライブラリー中のゲノムコピーの数を指す。本明細書で企図される組成物および方法によって満たされる重要な課題は、稀な遺伝子変異または遺伝子配列の違いを検出および解析するのに十分なアッセイ感度を達成することである。試料ごとにアッセイ感度値を決定するために、各試料中に存在する異なる別個の配列の数を、シーケンシングライブラリー中に存在するゲノム均等物の数を測定することによって測定する。感度を確立するために、ゲノム均等物の数を各試料ライブラリーについて測定すべきである。
【0289】
ゲノム均等物の数は、qPCRアッセイによって、またはシーケンシングが行われた後にバイオインフォマティクスに基づく計数を使用することによって決定することができる。臨床試料のプロセスフローでは、ゲノム均等物のqPCR測定がDNAライブラリーのQC工程として使用される。それは、配列解析の前にアッセイ感度の期待を確立し、その対応するDNAクローンライブラリーがゲノム均等物の必要な深度を欠く場合、試料を解析から除外することを可能にする。最終的には、ゲノム均等物のバイオインフォマティクスに基づく計数もまた、所与の各DNAクローンライブラリーに対するゲノム均等物、したがってアッセイ感度および偽陰性推定値を識別するために使用される。
【0290】
実験的qPCRアッセイおよび統計的計数アッセイは、十分に相関するはずである。シーケンシングがDNAクローンライブラリーにおける配列の深度を明らかにできない場合、DNAクローンライブラリーの再処理および/またはさらなるシーケンシングが必要とされ得る。
【0291】
いくつかの実施形態では、細胞DNAまたはcfDNAクローンライブラリー中のゲノム均等物を、定量的PCR(qPCR)アッセイを用いて決定する。いくつかの実施形態では、既知の濃度の標準ライブラリーが、標準曲線を構築するために使用され、qPCRアッセイからの測定値が、得られた標準曲線に当てはめられ、ゲノム均等物についての値が、当てはめから導かれる。本発明者らは、ゲノム中の共通配列、例えばリピート配列に特異的にハイブリダイズする1つのプライマーと、アダプター中のプライマー結合部位に結合する別のプライマーとを含むqPCR「リピートに基づく」アッセイが、(DNAクローンの両端に存在する)アダプター特異的プライマーのみを使用する方法と比較して、ゲノム均等物の8倍の増加を測定したことを発見した。リピートに基づくアッセイによって測定されたゲノム均等物の数は、より一貫したライブラリー間性能、およびシーケンシング実行におけるゲノム均等物のqPCR推定値と生物情報学的にカウントされたタグ均等物との間のより良好なアラインメントを提供する。
【0292】
本明細書で企図されるリピートに基づくゲノム均等物アッセイにおける使用に適したリピートの実例としては、限定されないが、短い散在する核要素(SINE)、例えば、Aluリピート、長い散在する核要素(LINE)、例えば、LINE1、LINE2、LINE3、マイクロサテライトリピート要素、例えば、ショートタンデムリピート(STR)、単純配列リピート(SSR)、および哺乳動物ワイド散在リピート(MIR)が挙げられる。
【0293】
いくつかの実施形態では、リピートは、Aluリピートである。
【0294】
5.シーケンシング
いくつかの実施形態では、定量的遺伝子解析は、複数のユニークシーケンシングリードを得るための十分なシーケンシング深度を生成させるために、本明細書中の他の箇所で上記に論じられるように、複数のハイブリッド核酸分子をシーケンシングすることを含む。「ユニークリード」または「ユニークゲノム配列」(UGS)という用語は、本明細書では互換的に使用され、個々の冗長なリードを一緒に「ファミリー」にグループ化することによって識別される。冗長リードは、同一のUMIE(例えば、ゲノム配列内の同じリードコードおよび同じDNA配列開始位置を共有する)を共有し、単一の付着事象に由来し、したがって互いに増幅由来の「同胞」である配列リードである。冗長リードのファミリーを表す単一のコンセンサスは、ユニークリードまたはUGSとして進められる。各ユニークリードまたはUGSは、ユニーク付着事象とみなされる。特定の捕捉プローブに対応するユニークリードの合計は、その特定の捕捉プローブの「生のゲノム深度」(RGD)と呼ばれる。各捕捉プローブは、ファミリーにグループ化することによって総リードから計算的に蒸留されたユニークリードのセットをもたらす。いくつかの実施形態では、ハイブリッド分子中の捕捉プローブ領域全体が配列決定される。いくつかの実施形態では、ハイブリッド分子中の捕捉プローブ領域の一部が配列決定される。
【0295】
次いで、所与の試料(例えば、試料の生のゲノム深度)に対するユニークリードを、プローブごとに観察されたすべてのユニークリードの平均として計算する。ユニークリードは、各ユニークリードがユニークゲノムDNAクローンに由来しなければならないので、重要である。各ユニークリードは、ゲノムDNAの単数体均等物の入力および解析を表す。ユニークリードの合計は、解析された単数体ゲノムの合計である。解析されたゲノムの数は、シーケンシングアッセイの感度を定義する。非限定的な例として、平均ユニークリードカウントが100ゲノム当量である場合、その特定のアッセイは、100または1%において1つの変異リードを検出することができる感度を有する。これ未満の観察は、正当化できない。
【0296】
明らかなコピー数の変化(例えば、ノイズの多いプローブの場合)がある場合は、試料平均の算出に用いるデータセットから除外する。本明細書において、「ノイズの多いプローブ」とは、大きなセットの同一試料(例えば、12個~16個の試料反復試験片の間で非常に可変的な数のユニークリード)の間で非常に可変的な数のユニークリードを捕捉するプローブを指す。いくつかの実施形態では、ノイズの多いプローブに関連するユニークリードの数は、試料に対するユニークリードの平均数と比較して50%またはそれを超えて増加する。いくつかの実施形態では、ノイズの多いプローブに関連するユニークリードの数は、試料に対するユニークリードの平均数と比較して50%またはそれを超えて減少する。いくつかの実施形態では、特定の解析において使用されるプローブの約2%~約4%が、ノイズの多いプローブとして識別され、所与の試料に対するユニークリードの平均数を決定するための計算から除外される。いくつかの実施形態では、特定の解析において使用されるプローブの2%~4%が、ノイズの多いプローブとして識別され、所与の試料に対するユニークリードの平均数を決定するための計算から除外される。
【0297】
いくつかの実施形態では、シーケンシングリードは、「オンターゲットリード」または「オフターゲットリード」のいずれかとして識別される。オンターゲットリードは、ゲノムライブラリーを作製するために使用される捕捉プローブの近傍内にマッピングするゲノムDNA配列を有する。いくつかの実施形態では、各ゲノム配列が特定の捕捉プローブに物理的に連結されており、ゲノムセグメントおよび捕捉プローブの配列が両方とも統一された情報として決定される場合、オンターゲットリードは、その開始座標が対応する捕捉プローブの3’末端の400bp以内、より一般的には200bp以内にマッピングされる任意のゲノム配列として定義される。オフターゲットリードは、捕捉プローブに対して≧500塩基対の位置で参照ゲノムに整列するゲノム配列を有すると定義される(より頻繁には完全に異なる染色体にマッピングする)。
【0298】
いくつかの実施形態では、定量的遺伝子解析は、複数の試料に由来するハイブリッド核酸分子の多重化シーケンシングを含む。
【0299】
いくつかの実施形態では、定量的遺伝子解析は、1またはそれを超えるタグ付きDNAライブラリークローンを得ることであって、各クローンは第1のDNA配列および第2のDNA配列を含み、第1のDNA配列は標的遺伝子座内の配列を含み、第2のDNA配列は捕捉プローブ配列を含む、得ることと、1またはそれを超えるクローンに対してペアエンドシーケンシング反応を行って、1またはそれを超えるシーケンシングリードを得ること、または
1またはそれを超えるクローンに対してシーケンシングリードを行うことであって、約100、約200、約300、約400、約500またはそれを超えるヌクレオチドの単一の長いシーケンシングリードが得られ、リードが、第一のDNA配列と第二のDNA配列の両方を識別するのに十分である、行うことと、シーケンシングリードのプローブ配列に従って、1またはそれを超えるクローンのシーケンシングリードを順序付けまたはクラスター化することと、を含む。
【0300】
6.バイオインフォマティクス解析
いくつかの実施形態では、定量的遺伝子解析はシーケンシングリードの生物情報学的解析をさらに含む。生物情報学的解析は、シーケンシングのための組成物または方法の非存在下で行われる純粋に精神的な解析を除外する。いくつかの実施形態では、バイオインフォマティクス解析には、配列アラインメント、ゲノム均等物解析、一塩基変異体(SNV)解析、遺伝子コピー数変異(CNV)解析、染色体コピー数の測定、および遺伝的病変の検出が含まれるが、これに限定されない。いくつかの実施形態では、バイオインフォマティクス解析は、cfDNAクローンライブラリーで解析されたゲノム均等物の数を定量するために、標的遺伝子座の遺伝的状態を検出するために、標的遺伝子座における遺伝子病変を検出するために、標的遺伝子座内のコピー数変動を測定するために、有用である。
【0301】
配列アラインメントは、配列リードと1またはそれを超えるヒト参照DNA配列との間で行われ得る。いくつかの実施形態では、シーケンシングアラインメントを使用して、限定するものではないが、ヌクレオチド転移若しくはトランスバージョン、ヌクレオチド挿入若しくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合の検出を含む標的遺伝子座の遺伝子病変を検出することができる。原因または予後の指標である遺伝子病変の検出は、特定の遺伝的症状または疾患の診断、予後、処置および/またはモニタリングに有用であり得る。
【0302】
「標的遺伝子座」および「DNA標的領域」という用語は、本明細書では互換的に使用され、DNA配列内の目的の領域を指す。いくつかの実施形態では、標的遺伝子座に対して標的遺伝子解析が行われる。いくつかの実施形態では、DNA標的領域は、特定の遺伝的状態、遺伝的症状、遺伝的疾患、胎児検査、遺伝的モザイク現象、父子鑑定、薬物処置に対する応答の予測、医学的症状の診断またはモニタリング、微生物叢プロファイリング、病原体スクリーニング、または臓器移植モニタリングに関連する遺伝子の領域である。さらなる実施形態では、DNA標的領域は、特定のヒト染色体、例えば特定の常染色体若しくはX結合染色体、またはその領域(例えば、ユニーク染色体領域)に関連するDNA配列である。
【0303】
本明細書では、本明細書で水平配列解析と呼ばれる、参照配列へのアラインメントを必要とせずに実行することができる配列アラインメント解析のための方法も企図される。そのような解析は、本明細書で企図される方法または任意の他の方法によって生成された任意の配列に対して行うことができる。いくつかの実施形態では、配列解析は、本明細書中で企図される方法によって得られたリードに対して配列アラインメントを行うことを含む。
【0304】
いくつかの実施形態では、シーケンシングが行われた後、バイオインフォマティクスを基本とする計数を使用して、cfDNAクローンライブラリー中のゲノム均等物を決定する。各シーケンシングリードは、特定の捕捉プローブに関連付けられ、各捕捉プローブに割り当てられたリードの集合は、グループに解析される。グループ内で、個々のリードのセットは、ゲノム配列内の同じリードコードおよび同じDNA配列開始位置を共有する。これらの個々のリードは「ファミリー」にグループ化され、このファミリーを代表する単一のコンセンサスが「ユニークリード」として進められる。ファミリーを構成する個々のリードはすべて、単一の付着事象に由来するので、それらは互いに増幅に由来する「同胞」である。各ユニークリードはユニーク付着事象とみなされ、ユニークリードの合計は解析されたゲノム均等物の数と同等であるとみなされる。
【0305】
ユニーククローンの数が可能な配列の組み合わせの総数に近づくにつれて、確率は、同じコードおよび開始部位の組み合わせが独立した事象によって作り出され、これらの独立した事象が単一ファミリー内で不適切にグループ化されることを示す。正味の結果は、解析されたゲノム均等物の過小評価となり、稀な変異体リードは、同じ識別子を有する野生型リードと重複するため、シーケンシングエラーとして破棄され得る。
【0306】
いくつかの実施形態では、cfDNAクローンライブラリーの正確な解析を提供するために、解析されるゲノム均等物の数は、可能なユニーククローンの数の約1/10、約1/12、約1/14、約1/16、約1/18、約1/20、約1/25またはそれ未満である。いくつかの実施形態では、cfDNAクローンライブラリーの正確な解析を提供するために、解析されるゲノム均等物の数は、可能なユニーククローンの数の1/10、1/12、1/14、1/16、1/18、1/20、1/25またはそれ未満である。上記で概説した手順は単なる例示であり、限定するものではないことを理解されたい。
【0307】
いくつかの実施形態では、解析されるゲノム均等物の数を増加させる必要があり得る。ゲノム均等物の深度を拡大するために、少なくとも2つの解決策が企図される。第1の解決策は、試料ごとに2つ以上のアダプターセットを使用することである。アダプターを組み合わせることにより、可能性のあるクローンの総数を多重に拡大することができ、したがって、ゲノム入力の快適な限界を拡大することができる。第2の解決策はリードコードを1、2、3、4、または5、またはそれを超える塩基を拡張することである。1つおきのリードコードと少なくとも2塩基だけ異なる可能なリードコードの数は、4(n-1)となり、ここでnはリードコード内の塩基の数である。したがって、非限定的な例において、リードコードが5ヌクレオチドであり、4(5-1)=256である場合、したがって、追加の塩基を含めると、各追加の塩基について利用可能なレパートリーが4倍に拡大する。
【0308】
いくつかの実施形態では、定量的遺伝子解析は、まれな一塩基変異体(SNV)を識別するためのシーケンシングリードの生物情報学的解析を含む。
【0309】
次世代シーケンシングは、約0.02~0.02%の固有のエラー率を有し、1/200~1/500の塩基呼び出しが正しくないことを意味する。これより低い頻度、例えば1000配列あたり1の頻度で生じる変異体および他の変異を検出するためには、分子アノテーション戦略を呼び出すことが必要である。非限定的な例として、標的化配列捕捉技術を用いた5000個のユニーク分子の解析は、50,000個を超えるリードの十分なシーケンシング深度で、5000個のユニークリードの集合を生成し、各ユニークリードは、すべて同じリードコードを有するリードの「ファミリー」に属する。ファミリー内で発生するSNVは、まれな変異体であるための候補である。この同じ変異体が2つ以上のファミリーで観察される場合、それは出発試料内に存在するまれな変異体であるための非常に強力な候補となる。対照的に、ファミリー内で散発的に生じる変異体はシーケンシングエラーである可能性が高く、唯一のファミリー内で生じる変異体はまれであるか、またはエクスビボで発生した塩基変化の結果である(例えば、DNA塩基の酸化またはPCR導入エラー)。
【0310】
いくつかの実施形態では、SNVを検出する方法が、アッセイの所望の標的の感度として10倍多いゲノム入力(ゲノムまたはゲノム均等物)を導入することを含む。1つの非限定的な例では、所望の感度が2%(100に2)である場合、実験標的は2000ゲノムの入力である。
【0311】
いくつかの実施形態では、シーケンシングデータのバイオインフォマティクス解析を使用して、遺伝的状態、症状または疾患、遺伝的モザイク現象、胎児検査、父子鑑定、薬物処置に対する応答の予測、医学的症状の診断またはモニタリング、微生物叢プロファイリング、病原体スクリーニング、および臓器移植のモニタリングに関連するSNVを検出または識別する。
【0312】
7.コピー数解析
細胞ゲノムDNA(例えば、組織生検試料から)またはcfDNA(例えば、血液試料から)の試料内の変異変化、SNP、転座、逆位、欠失、コピー数の変化または他の遺伝的変異の検出に有用な組成物および方法が本明細書で提供される。本明細書に開示される組成物および方法は、生物学的試料(例えば血液)からのcfDNAのコピー数変異を非常に困難に検出するのに非常に有用である。特に、本開示のいくつかの実施形態は、アダプターに付着したゲノムDNA断片で構成されたゲノムDNAライブラリーを生成し、複数の捕捉プローブでDNA標的領域を捕捉し、DNA標的領域を含むDNAライブラリー断片を単離し、DNA標的領域の定量的遺伝子解析を行って、それによってDNA標的領域のコピー数を決定することによって、試験試料からDNA標的領域のコピー数を検出する方法を対象とする。本明細書に記載のアダプターは、配列決定されている個々のDNA断片の識別、並びにゲノムDNAの試料または供給源の同一性を可能にする。
【0313】
いくつかの実施形態では、本明細書中に開示される標的特異的コピー数変化を検出するための組成物および方法は、いくつかの試料型(直接組織生検および末梢血が含まれるが、これらに限定されない)に適用可能である。癌ゲノム、特に固形腫瘍の解析のための無細胞DNA(cfDNA)アッセイとの関連において、腫瘍DNAの量は、多くの場合、全DNAのごく一部である。さらに、コピー数の減少は、ゲノムDNAアッセイ、特に、試料由来の全ゲノムDNAの一部にのみコピー数の変化が存在し得るゲノムDNAアッセイ、例えば、cfDNAアッセイにおいて検出することが困難である。例えば、癌患者から抽出される無細胞DNAの大部分は、正常な供給源に由来し、二倍体コピー数を有する(男性対象におけるX連鎖遺伝子を除く)。癌患者では、腫瘍に由来するDNAの画分は、例えば血漿から抽出された循環DNAの2%が腫瘍に由来する患者など、マイナー対立遺伝子頻度が低いことが多い。腫瘍抑制因子遺伝子(例えば、乳癌におけるBRCA1)の1コピーの喪失は、検出可能なゲノム断片が存在しない場合のマイナー対立遺伝子頻度が1%であることを意味する。このシナリオでは、操作されたコピー数減少アッセイは、100コピー(正常)と99コピー(ヘテロ接合遺伝子減少)とを区別することができなければならない。したがって、いくつかの実施形態は、本明細書中に記載される方法および組成物が、コピー数変化の検出を、cfDNAの状況においてさえ、マイナー対立遺伝子頻度でのコピー数の変化を検出するための十分な分解能で可能にすることを意図する。
【0314】
いくつかの実施形態では、DNA標的領域DNAのコピー数解析のための方法が提供される。いくつかの実施形態では、コピー数解析は、それぞれがゲノムDNA断片およびアダプターを含有するDNAライブラリー断片のゲノムDNAライブラリーを生成し、DNA標的領域を含有するDNAライブラリー断片を単離し、DNA標的領域の定量的遺伝子解析を行うことによって行われる。「定量的遺伝子解析」とは、DNA変異、SNP、転座、欠失、およびコピー数変異(CNV)を含むがこれらに限定されないDNA(例えば、遺伝子、遺伝子座、目的の標的領域など)の変化を定量することができる任意の分子生物学的技術によって行われる解析を意味する。いくつかの実施形態では、定量的遺伝子解析は、シーケンシング、例えば次世代シーケンシングによって行われる。
【0315】
いくつかの実施形態では、コピー数決定解析のための方法であって、1またはそれを超えるクローンを得ることを含み、各クローンが第1のDNA配列および第2のDNA配列を含み、第1のDNA配列が標的遺伝子座における配列を含み、第2のDNA配列が捕捉プローブ配列を含む、方法が提供される。関連する実施形態では、1またはそれを超えるクローンに対する対エンドシーケンシング反応が行われ、1またはそれを超えるシーケンシングリードが得られる。別の実施形態では、約100ヌクレオチドを超える単一の長いシーケンシングリードが得られ、このリードが第1のDNA配列と第2のDNA配列の両方を識別するのに十分である、1またはそれを超えるクローンに対するシーケンシング反応が行われる。1またはそれを超えるクローンのシーケンシングリードは、シーケンシングリードのプローブ配列に従ってシーケンシングまたはクラスター化することができる。
【0316】
コピー数解析には、これらに限定されないが、所与のゲノムDNA試料で生じる特定の遺伝子または変異のコピー数を調べる分析が含まれ、所与の試料中の所与の遺伝子または配列の相違のコピー数の定量的決定をさらに含むことができる。いくつかの実施形態では、コピー数解析は、遺伝的状態、症状または疾患、胎児検査、遺伝的モザイク現象、父子鑑定、薬物処置に対する応答の予測、医学的症状の診断またはモニタリング、微生物叢プロファイリング、病原体スクリーニング、および臓器移植のモニタリングに関連する遺伝子増幅を検出または識別するために使用される。
【0317】
いくつかの実施形態では、コピー数解析は、染色体不安定性を測定するために使用される。そのような実施形態では、染色体安定性プローブを含む捕捉プローブセットを使用して、すべての染色体セットにわたって均一な密度でコピー数変異を決定する。コピー数解析を各染色体安定性プローブについて行い、次いで、染色体安定性プローブをそれらの染色体標的に従って順序付ける。これは、ゲノムにわたるコピー数の減少または増加の可視化を可能にし、染色体安定性の尺度として役立ち得る。
【0318】
いくつかの実施形態では、シーケンシングデータのバイオインフォマティクス解析を使用して、限定するものではないが、ヌクレオチド転移若しくはトランスバージョン、ヌクレオチド挿入若しくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合の検出を含む、標的遺伝子座における1またはそれを超える配列または遺伝子病変を検出または識別する。原因または予後の指標である遺伝子病変の検出は、特定の遺伝的症状または疾患の診断、予後、処置および/またはモニタリングに有用であり得る。いくつかの実施形態では、遺伝子病変は、遺伝的状態、症状または疾患、胎児検査、遺伝的モザイク現象、父子鑑定、薬物処置に対する応答の予測、医学的症状の診断またはモニタリング、微生物叢プロファイリング、病原体スクリーニング、および臓器移植のモニタリングに関連する。
【0319】
いくつかの実施形態では、試料中に存在するDNA標的領域のコピー数は、定量的遺伝子解析によって決定される。いくつかの実施形態では、DNA標的領域のコピー数は、試料中に存在するDNA標的領域のコピーの量を比較し、それを既知のコピー数を有する1またはそれを超える試料中に存在するDNA標的領域の量と比較することによって決定される。
【0320】
いくつかの実施形態は、本明細書中に記載の組成物および方法が、試料中の全ゲノムDNAの一部のみがコピー数の変化を有するゲノムDNAの試料中のコピー数の変化を検出するために特に有用であることを意図する。例えば、対立遺伝子頻度が一般に約100%、50%または0%である従来のSNP遺伝子型決定とは対照的に、有意な腫瘍変異が、試料、例えば無細胞DNAの試料に存在してよく、これは、50%(例えば、0.1%~20%超の範囲内)より有意に低いマイナー対立遺伝子頻度で存在する。当業者は、本明細書に記載の組成物および方法が、一塩基変異体(SNV)、短い(例えば、40塩基対(bp)未満)挿入および欠失(インデル)、並びに発癌性遺伝子融合を含むゲノム再編成を含む他の型の変異の検出にも有用であることを認識するであろう。
【0321】
いくつかの実施形態では、本明細書に記載される組成物および/または方法は、試料からの全ゲノムDNAの約20%未満、約19%未満、約18%未満、約17%未満、約16%未満、約15%未満、約14%未満、約13%未満、約12%未満、約11%未満、約10%未満、約9%未満、約8%未満、約7%未満、約6%未満、約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約0.5%未満、約0.2%未満、または約0.1%未満に存在する1またはそれを超えるDNA標的領域のコピー数の変化を検出し、識別し、観察し、かつ/または明らかにするために有用であり、可能であり、適しており、かつ/または可能である。いくつかの実施形態では、本明細書中に記載される方法は、試料由来の全ゲノムDNAの約0.01%~約100%、約0.01%~約50%または約0.1%~約20%の間に存在する1またはそれを超えるDNA標的領域のコピー数の変化を検出し、識別し、観察し、かつ/または明らかにするために有用であり、可能であり、適しており、かつ/または可能である。
【0322】
いくつかの実施形態では、本明細書に記載される組成物および/または方法は、試料からの全ゲノムDNAの20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満に存在する1またはそれを超えるDNA標的領域のコピー数の変化を検出し、識別し、観察し、かつ/または明らかにするために有用であり、可能であり、適しており、かつ/または可能である。いくつかの実施形態では、本明細書中に記載される方法は、試料由来の全ゲノムDNAの0.01%~100%、0.01%~50%または0.1%~20%の間に存在する1またはそれを超えるDNA標的領域のコピー数の変化を検出し、識別し、観察し、かつ/または明らかにするために有用であり、それが可能であり、それに適しており、かつ/またはそれを明らかにすることができる。
【0323】
いくつかの実施形態では、cfDNAの遺伝子解析のための方法は、cfDNAライブラリーを生成および増幅することと、cfDNAライブラリー中のゲノム均等物の数を決定することと、1またはそれを超えるゲノム標的遺伝子座の定量的遺伝子解析を行うことと、を含む。
【0324】
いくつかの実施形態では、本明細書に記載の任意の方法および組成物は、ゲノムDNA、例えば細胞またはcfDNAを使用して、遺伝的状態、遺伝的症状、遺伝子疾患、遺伝的モザイク現象、胎児診断、父子鑑定、微生物叢プロファイリング、病原体スクリーニングおよび臓器移植モニタリングを効率的に解析、検出、診断および/またはモニタリングするために使用するのに有効であり、試料中の全ゲノムDNAの全部または一部のみが関心対象の特徴、例えば遺伝子病変、変異、一塩基変異体(SNV)を有することが企図されている。いくつかの実施形態では、関心のある特徴は、疾患または症状に関連する遺伝的特徴である。例えば、対立遺伝子頻度が一般に約100%、50%または0%である従来のSNP遺伝子型決定とは対照的に、有意な腫瘍変異が、試料、例えばcfDNAの試料に存在してよく、これは、50%(例えば、0.1%~20%超の範囲内)より有意に低いマイナー対立遺伝子頻度で存在する。
【0325】
8.臨床応用
いくつかの実施形態では、目的の領域における変異変化、SNP、転座、逆位、欠失、コピー数の変化または他の遺伝的変異を検出することによって、対象における症状または疾患を検出する、識別する、予測する、診断する、またはモニタリングする方法が本明細書中に提供される。
【0326】
いくつかの実施形態では、対象における症状または疾患を検出、識別、予測、診断またはモニタリングする方法が本明細書で提供される。
【0327】
いくつかの実施形態では、対象における遺伝的状態、症状または疾患を検出、識別、予測、診断またはモニタリングする方法は、DNAクローンライブラリー中の1またはそれを超える標的遺伝子座の定量的遺伝子解析を行って、1またはそれを超える標的遺伝子座における配列の変化を検出または識別することを含む。いくつかの実施形態では、変化は、コピー数の変化である。
【0328】
いくつかの実施形態では、遺伝的状態、症状または疾患を検出、識別、予測、診断またはモニタリングする方法は、対象の生物学的試料から細胞DNAまたはcfDNAを単離または取得することと、細胞DNAまたはcfDNAを1またはそれを超える末端修復酵素で処理して末端修復DNAを生成することと、ゲノムDNAライブラリーを生成するために、末端修復されたDNAの各末端に1またはそれを超えるアダプターを付着させることと、DNAクローンライブラリーを生成するためにDNAライブラリーを増幅することと、DNAクローンライブラリー中のゲノム均等物の数を決定することと、DNAクローンライブラリー中の1またはそれを超える標的遺伝子座の定量的遺伝子解析を行って、1またはそれを超える標的遺伝子座における配列の変化、例えばSNP、転座、逆位、欠失、またはコピー数の変化を検出または識別することと、を含む。
【0329】
いくつかの実施形態では、遺伝的状態、または遺伝的疾患、遺伝的モザイク現象、胎児検査、父子鑑定、父子鑑定、薬物処置に対する応答の予測、医学的症状の診断またはモニタリング、微生物叢プロファイリング、病原体スクリーニング、および対象の生物学的試料からゲノムDNAを単離または取得することを含む臓器移植モニタリング、DNAを1またはそれを超える末端修復酵素で処理して末端修復されたDNAを生成すること、ゲノムDNAライブラリーを生成するために、末端修復されたDNAの各末端に1またはそれを超えるアダプターを付着させること、ゲノムDNAライブラリーを増幅してDNAクローンライブラリーを生成すること、DNAクローンライブラリー中のゲノム均等物の数を決定すること、DNAクローンライブラリー中の1またはそれを超える標的遺伝子座の定量的遺伝子解析を行って、1またはそれを超える標的遺伝子座における配列中のヌクレオチド転移または塩基転換、ヌクレオチド挿入または欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を検出または識別することからなる群から選択される遺伝的状態または遺伝的症状または遺伝的疾患を検出、識別、予測、診断、またはモニタリングする方法。
【0330】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる遺伝性疾患の実例としては、これらに限定されないが、癌、アルツハイマー病(APOE1)、シャルコー・マリー・トゥース病、レーバー遺伝性視神経症(LHON)、アンジェルマン症候群(UBE3A、ユビキチン-タンパク質リガーゼE3A)、プラダー・ウィリー症候群(15番染色体の領域)、β-サラセミア(HBB、β-グロビン)、ゴーシェ病(I型)(GBA、グルコセレブロシダーゼ)、嚢胞性線維症(CFTR上皮塩化物チャネル)、鎌状赤血球症(HBB、β-グロビン)、テイ・サックス病(HEXA、ヘキソサミニダーゼA)、フェニルケトン尿症(PAH、フェニルアラニン加水分解酵素)、ファミリー性高コレステロール血症(LDLR、低密度リポタンパク質受容体)、成人多発性嚢胞腎疾患(PKD1、ポリシスチン)、ハンチントン病(HDD、ハンチンチン)、神経線維腫症I型(NF1、NF1腫瘍抑制遺伝子)、筋緊張性ジストロフィー(DM、ミオトニン)、結節性硬化症(TSC1、ツベリン)、軟骨形成症(FGFR3、線維芽細胞増殖因子受容体)、脆弱X症候群(FMR1、RNA結合タンパク質)、デュシェンヌ型筋ジストロフィー(DMD、ジストロフィン)、血友病A(F8C、血液凝固第VIII因子)、レッシュ・ナイハン症候群(HPRT1、ヒポキサンチン・グアニン・リボシルトランスフェラーゼ1)、および副腎白質ジストロフィー(ABCD1)が挙げられる。
【0331】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる癌の実例としては、これらに限定されないが、B細胞癌、例えば多発性骨髄腫、黒色腫、乳癌、肺癌(非小細胞肺癌腫またはNSCLCなど)、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌、卵巣癌、膀胱癌、脳または中枢神経系の癌、末梢神経系癌、食道癌、子宮頸癌、子宮癌または子宮内膜癌、口腔または咽頭の癌、肝臓癌、腎臓癌、精巣癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状腺癌、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌、炎症性筋線維芽細胞性腫瘍、消化管間質腫瘍(GIST)、大腸癌、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、皮脂腺癌、乳頭癌、乳頭腺癌、髄様癌、気管支原性癌、腎細胞癌、肝癌、胆管癌、絨毛癌、セミノーマ、胚性癌、ウィルムス腫瘍、膀胱癌、上皮癌、グリオーマ、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞癌、甲状腺癌、胃癌、頭頸部癌、小細胞癌、本態性血小板血症、異形成性骨髄化生、好酸球増多症候群、全身性肥満細胞症、おなじみの好酸球増加症、慢性好酸球性白血病、神経内分泌癌、カルチノイド腫瘍などが挙げられる。
【0332】
いくつかの実施形態では、遺伝子病変は、Cosmicデータベースにおいて注釈付けされた病変(病変および配列データはオンラインで入手可能であり、CosmicウェブサイトのCancer Gene Censusセクションからダウンロードすることができる)またはCancer Genome Atlasにおいて注釈付けされた病変(病変および配列データはオンラインで入手可能であり、Cancer Genome Atlasウェブサイトからダウンロードすることができる)である。
【0333】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる癌に関連する1またはそれを超える遺伝子病変を有する遺伝子の実例としては、これらに限定されないが、ABCB1、ABCC2、ABCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALDH4A1、ALK、APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRAF、BRCA1、BRCA2、Clorf144、CARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6、EPHX1、ERBB2、ERBB3、ERBB4、ERCC2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、FGFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、MTHFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、NKX2-1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、NTRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、PTPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPRSS2、TNFRSF14、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1、UMPS、USP9X、VHLおよびWT1が挙げられる。
【0334】
いくつかの実施形態では、遺伝子病変は、ヌクレオチド転移若しくは塩基転換、ヌクレオチド挿入若しくは欠失(すなわち、インデル)、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。いくつかの実施形態では、遺伝子病変は、フレームシフトを含む。いくつかの実施形態では、遺伝子病変は、スプライシングの変化を含む。いくつかの実施形態では、遺伝子病変は、一塩基変異(SNV)を含む。
【0335】
いくつかの実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域を別の遺伝子に融合する遺伝子融合である。
【0336】
いくつかの実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域をEML4遺伝子に融合する遺伝子融合である。
【0337】
いくつかの実施形態では、遺伝子病変は、表5または表6に示す病変のいずれか1つである。例えば、遺伝子病変は、TM変異、BRCA1フレームシフト、BRCA2フレームシフト、BRCA2 G4変異(すなわち、G-四重鎖構造の形成を引き起こす変異)、FANCAスプライス変異、HDAC2フレームシフト、PALB2 Q479変異、またはATMフレームシフトであり得る。いくつかの実施形態では、遺伝子病変は、ERBB2 1655V変異、TP53 Q331変異、TP53フレームシフト、EML4-ALK融合、またはEGFR増幅であり得る。
【0338】
本明細書で企図される組成物および方法を用いて検出、識別、予測、診断またはモニタリングすることができる胎児検査に適した症状の実例としては、これらに限定されないが、ダウン症候群(トリソミー21)、エドラード症候群(トリソミー18)、パトー症候群(トリソミー13)、クラインフェルター症候群(XXY)、トリプルX症候群、XYY症候群、トリソミー8、トリソミー16、ターナー症候群(XO)、ロバートソニア転座、ディジョージ症候群およびウォルフ・ハーシュホーン症候群が挙げられる。
【0339】
本明細書で企図される組成物および方法を用いて検出、識別、予測、診断またはモニタリングすることができる父子鑑定に適した対立遺伝子の実例としては、これらに限定されないが、D20S1082、D6S474、D12ATA63、D22S1045、D10S1248、D1S1677、D11S4463、D4S2364、D9S1122、D2S1776、D10S1425、D3S3053、D5S2500、D1S1627、D3S4529、D2S441、D17S974、D6S1017、D4S2408、D9S2157、アメロゲニン、D17S1301、D1GATA113、D18S853、D20S482およびD14S1434のうちの16またはそれを超えるものが挙げられる。
【0340】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる薬物処置に対する応答を予測するのに適した遺伝子の実例には、これらに限定されないが、以下の遺伝子:ABCB1(ATP結合カセット、サブファミリーB(MDR/TAP)、メンバー1)、ACE(アンギオテンシンI変換酵素)、ADH1A(アルコール脱水素酵素1A(クラスI)、アルファポリペプチド)、ADH1B(アルコール脱水素酵素IB(クラスI)、ベータポリペプチド)、ADH1C(アルコール脱水素酵素1C(クラスI)、ガンマポリペプチド)、ADRB1(アドレナリン、ベータ-1-、受容体)、ADRB2(アドレナリン、ベータ-2-、受容体、水面)、AHR(アリール炭化水素受容体)、ALDH1A1(アルデヒド脱水素酵素1ファミリー、メンバーA1)、ALOX5(アラキドン酸5-リポキシゲナーゼ)、BRCA1(乳癌1、早期発症)、COMT(カテコール-O-メチルトランスフェラーゼ)、CYP2A6(シトクロムP450、ファミリー2、サブファミリーA、ポリペプチド6)、CYP2B6(シトクロムP450、ファミリー2、サブファミリーB、ポリペプチド6)、CYP2C9(シトクロムP450、ファミリー2、サブファミリーC、ポリペプチド9)、CYP2C19(シトクロムP450、ファミリー2、サブファミリーC、ポリペプチド19)、CYP2D6(シトクロムP450、ファミリー2、サブファミリーD、ポリペプチド6)、CYP2J2(シトクロムP450、ファミリー2、サブファミリーJ、ポリペプチド2)、CYP3A4(シトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、CYP3A5(シトクロムP450、ファミリー3、サブファミリーA、ポリペプチド5)、DPYD(ジヒドロピリミジンデヒドロゲナーゼ)、DRD2(ドーパミン受容体D2)、F5(凝固因子V)、GSTP1(グルタチオンS-トランスフェラーゼpi)、HMGCR(3-ヒドロキシ-3-メチルグルタリル-コエンザイムAレダクターゼ)、KCNH2(カリウム電位依存性チャネル、サブファミリーH(eag関連)、メンバー2)、KCNJ11(カリウム内向き整流チャネル、サブファミリーJ、メンバー11)、MTHFR(5,10-メチレンテトラヒドロ葉酸レダクターゼ(NADPH))、NQO1(NAD(P)Hデヒドロゲナーゼ、キノン1)、P2RY1(プリン作動性受容体P2Y、Gタンパク質共役、1)、P2RY12(プリン作動性受容体P2Y、Gタンパク質共役、12)、PTGIS(プロスタグランジンI2(プロスタサイクリン)合成酵素)、SCN5A(ナトリウムチャネル、電圧ゲート、V型、アルファ(QT延長症候群3))、SLC19A1(溶質キャリアファミリー19(葉酸トランスポーター)、メンバー1)、SLCO1B1(溶質キャリア有機アニオントランスポーターファミリー、メンバー1B1)、SULT1A1(硫酸転移酵素ファミリー、細胞質、1A、フェノール優先、メンバー1)、TPMT(チオプリンS-メチルトランスフェラーゼ)、TYMS(チミジル酸合成酵素)、UGT1A1(UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA1)、VDR(ビタミンD(1,25-ジヒドロキシビタミンD3)受容体)、VKORC1(ビタミンKエポキシドレダクターゼ複合体、サブユニット1)のうちの1またはそれを超えるものが挙げられる。
【0341】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる医学的症状の例示的な例には、これらに限定されないが、脳卒中、一過性虚血発作、外傷性脳損傷、心疾患、心臓発作、狭心症、アテローム性動脈硬化症および高血圧が挙げられる。
【0342】
本明細書で企図される組成物および方法でスクリーニングすることができる病原体の例示的な例には、これらに限定されないが、細菌真菌およびウイルスが挙げられる。
【0343】
本明細書で企図される組成物および方法でスクリーニングすることができる細菌種の実例としては、これらに限定されないが、マイコバクテリウム属(Mycobacterium)種、肺炎球菌属(Pneumococcus)種、エシェリヒア属(Escherichia)種、カンピロバクター属(Campylobacter)種、コリネバクテリウム属(Corynebacterium)種、クロストリジウム属(Clostridium)種、連鎖球菌属(Streptococcus)種、ブドウ球菌属(Staphylococcus)種、シュードモナス属(Pseudomonas)種、赤痢菌属(Shigella)種、トレポネマ属(Treponema)種、またはサルモネラ属(Salmonella)種が挙げられる。
【0344】
本明細書で企図される組成物および方法でスクリーニングすることができる真菌種の例示的な例には、これらに限定されないが、アスペルギルス属(Aspergillis)種、ブラストミセス属(Blastomyces)種、カンジダ属(Candida)種、トコシロイデス属(Coccicioides)種、クリプトコッカス属(Cryptococcus)種、皮膚糸状菌(dermatophytes)、白癬属(Tinea)種、トリコフィトン属(Trichophyton)種、ミクロスポルム属(Microsporum)種、フザリウム属(Fusarium)種、ヒストプラズマ属(Histoplasma)種、ムコロミコチナ属(Mucoromycotina)種、ニューモシスチス属(Pneumocystis)種、スポロトリックス属(Sporothrix)種、エクセロフィルム属(Exserophilum)種、またはクラドスポルム属(Cladosporium)種が挙げられる。
【0345】
本明細書で企図される組成物および方法でスクリーニングすることができるウイルスの実例としては、これらに限定されないが、インフルエンザA、例えば、H1N1、H1N2、H3N2およびH5N1(鳥インフルエンザ)、インフルエンザB型、C型インフルエンザウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、D型肝炎ウイルス、E型肝炎ウイルス、ロタウイルス、ノーウォークウイルスグループの任意のウイルス、腸内アデノウイルス、パルボウイルス、デング熱ウイルス、サル痘、モノネガウイルス、狂犬病ウイルスなどのリッサウイルス、ラゴスコウモリウイルス、モコラウイルス、ドベンハージウイルス、ヨーロッパコウモリウイルス1&2とオーストラリアコウモリウイルス、エフェメロウイルス、ベシクロウイルス、水疱性口内炎ウイルス(VSV)、単純ヘルペスウイルス1型および2型などのヘルペスウイルス、水痘帯状疱疹、サイトメガロウイルス、エプスタイン・バーウイルス(EBV)、ヒトヘルペスウイルス(HHV)、ヒトヘルペスウイルス6型および8型、モロニーマウス白血病ウイルス(M-MuLV)、モロニーマウス肉腫ウイルス(MoMSV)、ハーベイマウス肉腫ウイルス(HaMuSV)、マウス乳腺腫瘍ウイルス(MuMTV)、テナガザル白血病ウイルス(GaLV)、猫白血病ウイルス(FLV)、スプマウイルス、フレンドマウス白血病ウイルス、マウス幹細胞ウイルス(MSCV)およびラウス肉腫ウイルス(RSV)、HIV(ヒト免疫不全ウイルス;HIV型1、およびHIV型2を含む)、ビスナ・マエディ・ウイルス(VMV)ウイルス、ヤギ関節炎脳炎ウイルス(CAEV)、ウマ伝染性貧血ウイルス(EIAV)、猫免疫不全ウイルス(FIV)、ウシ免疫不全ウイルス(BIV)、およびサル免疫不全ウイルス(SIV)、パピローマウイルス、マウスガンマヘルペスウイルス、アルゼンチン出血熱ウイルスなどのアレナウイルス、ボリビア出血熱ウイルス、サビア関連出血熱ウイルス、ベネズエラ出血熱ウイルス、ラッサ熱ウイルス、マチュポウイルス、リンパ球性脈絡膜髄膜炎ウイルス(LCMV)、クリミア・コンゴ出血熱ウイルスなどのブニヤウイルス科、ハンタウイルス、ウイルスを引き起こす腎症候群を伴う出血熱、リフトバレー熱ウイルス、エボラ出血熱やマールブルグ出血熱などのフィロウイルス科(フィロウイルス)、キャサヌル森林病ウイルスを含むフラビウイルス科、オムスク出血熱ウイルス、ヘンドラウイルスやニパウイルスなどのウイルスやパラミクソウイルス科を引き起こすダニ媒介性脳炎、大痘瘡および小痘瘡(天然痘)、ベネズエラウマ脳炎ウイルスなどのアルファウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス、SARS関連コロナウイルス(SARS-CoV)、ウエストナイルウイルス、および任意の脳炎を引き起こすウイルスが挙げられる。
【0346】
本明細書で企図される組成物および方法で検出、識別、予測、診断またはモニタリングすることができる移植レシピエントにおける臓器移植をモニタリングするのに適した遺伝子の例示的な例は、これらに限定されないが、以下の遺伝子:HLA-A、HLA-B、HLA-C、HLA-DR、HLA-DPおよびHLA-DQのうちの1またはそれを超えるものが挙げられる。
【0347】
いくつかの実施形態では、生物情報学的解析を使用して、cfDNAクローンライブラリーで解析されたゲノム均等物の数を定量する、標的遺伝子座における遺伝的変異体を検出する、標的遺伝子座内の変異を検出する、標的遺伝子座内の遺伝子融合を検出するか、または標的遺伝子座内のコピー数変動を測定する。
【0348】
いくつかの実施形態では、対象の生物学的試料からゲノムDNAを単離または取得することと、DNAを1またはそれを超える末端修復酵素で処理して末端修復されたDNAを生成することと、DNAライブラリーを生成するために、末端修復されたDNAの各末端に1またはそれを超えるアダプターを付着させることと、DNAクローンライブラリーを生成するためにDNAライブラリーを増幅することと、DNAクローンライブラリー中のゲノム均等物の数を決定することと、DNAクローンライブラリー中の遺伝病に関連する1またはそれを超えるバイオマーカーの定量的遺伝子解析を行うことであって、1またはそれを超えるバイオマーカーの少なくとも1つの検出または検出の失敗が、対象が遺伝性疾患について処置されるべきかどうかを示す、定量的遺伝子解析を行うことと、含む、遺伝性疾患を診断するコンパニオンが提供される。いくつかの実施形態では、DNAはcfDNAである。いくつかの実施形態では、DNAは細胞DNAである。
【0349】
本明細書で使用される場合、「コンパニオン診断」という用語は、特定の抗癌治療に関連する診断試験を指す。特定の実施形態では、診断方法は、生物学的試料中に関連するバイオマーカー中の遺伝子病変の検出を含み、それによって抗癌治療で処置すべきまたは処置すべきでない患者の迅速な識別を可能にする。
【0350】
抗癌治療には、手術、放射線、化学療法薬、抗癌薬および免疫調節薬が含まれるが、これらに限定されない。
【0351】
抗癌剤の例示的な例には、チオテパおよびシクロホスファミド(CYTOXAN(商標))などのアルキル化剤が挙げられるが、これらに限定されないが、アルキルスルホネート、例えば、ブスルファン、インプロスルファンおよびピポスルファン、ベンゾドパ、カルボコン、メトレドパ、ウレドパ等のアジリジン類、アルトレタミン、トリエチレンメラミン、トリエチレンホスホラミド、トリエチレンチオホスファミド、トリメチロメラミンレジュームを含むエチレンイミンおよびメチルアメラミン、クロラムブシル、クロルナファジン、クロロフォスファミド、エストラムスチン、イホスファミド、メクロレタミン、メクロレタミンオキシド塩酸塩、メルファラン、ノベンビチン、フェネステリン、プレドニムスチン、トロフォスファミド、ウラシルマスタード等のナイトロジェンマスタード類、カルムスチン、クロロゾトシン、フォテムスチン、ロムスチン、ニムスチン、ラニムスチンなどのニトロソ尿素、アクラシノマイシン、アクチノマイシン、オースラマイシン、アザセリン、ブレオマイシン、カクチノマイシン、カリケアマイシン、カラビシン、カルミノマイシン、カルジノフィリン、クロモマイシン、ダクチノマイシン、ダウノルビシン、デトレビシン、6-ジアゾ-5-オキソ-L-ノルロイシン、ドキソルビシンおよびそのペグ化製剤、エピルビシン、エソルビシン、イダルビシン、マルセロマイシン、マイトマイシン、ミコフェノール酸、ノガラマイシン、オリボマイシン、ペプロマイシン、ポフィロマイシン、ピューロマイシン、クエラマイシン、ロドルビシン、ストレプトニグリン、ストレプトゾシン、ツベルシジン、ウベニメックス、ジノスタチン、ドキソルビシン等の抗生物質、メトトレキサート、5-フルオロウラシル(5-FU)等の代謝拮抗剤、デノプテリン、メトトレキサート、プテロプテリン、トリメトレキセートなどの葉酸類似体、フルダラビン、6-メルカプトプリン、チアミプリン、チオグアニンなどのプリン類似体、アンシタビン、アザシチジン、6-アザウリジン、カルモフル、シタラビン、ジデオキシウリジン、ドキシフルリジン、エノシタビン、フロクスウリジン、5-FUなどのピリミジン類似体、アンドロゲン、例えばカルステロン、プロピオン酸ドロモスタノロン、エピチオスタノール、メピチオスタン、テストラクトン、抗アドレナリン、例えばアミノグルテチミド、ミトタン、トリロスタン、フロリン酸等の葉酸補充剤、アセグラトン、アルドホスファミドグリコシド、アミノレブリン酸、アムサクリン、ベストラブシル、ビサントレン、エダトラキサート、デフォファミン、デメコルシン、ジアジコン、エルホルミチン、酢酸エリプチニウム、トグルシド、硝酸ガリウム、ヒドロキシ尿素、レンチナン、ロニダミン、ミトグアゾン、ミトキサントロン、モピダモール、ニトラクリン、ペントスタチン、フェナメット、ピラルビシン、ポドフィリン酸、2-エチルヒドラジド、プロカルバジン、PSK(登録商標)、ラゾキサン、シゾフィラン、スピロゲルマニウム、テヌアゾン酸、トリアジコン、2,2’,2’’-トリクロロトリエチルアミン、ウレタン、ビンデシン、ダカルバジン、マンノムスチン、ミトブロニトール、ミトラクトール、ピポブロマン、ガシトシン、アラビノシド(「Ara-C」)、シクロホスファミド、チオテパ、タキソイド、例えばパクリタキセル(TAXOL(登録商標)、Bristol-Myers Squibb Oncology,Princeton,N.J.)およびドセタキセル(TAXOTERE(登録商標)、Rhne-Poulenc Rorer,Antony、フランス)、クロラムブシル、ゲムシタビン、6-チオグアニン、メルカプトプリン、メトトレキサート、シスプラチンおよびカルボプラチンなどの白金類似体、ビンブラスチン、白金、エトポシド(VP-16)、イホスファミド、マイトマイシンC、ミトキサントロン、ビンクリスチン、ビノレルビン、ナベルビン、ノバントロン、テニポシド、アミノプテリン、ゼロダ、イバンドロネート、CPT-11、トポイソメラーゼ阻害剤RFS2000、ジフルオロメチルオミチン(DMFO)、Targretin(商標)(ベキサロテン)、Panretin(商標)(アリトレチノイン)などのレチノイン酸誘導体、ONTAK(商標)(denileukin diftitox)、エスペラマイシン、カペシタビン、および上記のいずれかの薬学的に許容され得る塩、酸または誘導体が挙げられる。癌に対するホルモン作用を調節または阻害するように作用する抗ホルモン剤、例えば、タモキシフェン、ラロキシフェン、アロマターゼ阻害4(5)-イミダゾール、4-ヒドロキシタモキシフェン、トリオキシフェン、ケオキシフェン、LY117018、オナプリストンおよびトレミフェン(Fareston)を含む抗エストロゲン、およびフルタミド、ニルタミド、ビカルタミド、ロイプロリド、ゴセレリン等の抗アンドロゲン剤、および上記のいずれかの薬学的に許容され得る塩、酸または誘導体もこの定義に含まれる。
【0352】
免疫調節剤の実例としては、これらに限定されないが、シクロスポリン、タクロリムス、トレスペリムス、ピメクロリムス、シロリムス、ベロリムス、ラフルニムス、ラキニモドおよびイミキモド、並びにそれらの類似体、誘導体、塩、イオンおよび複合体が挙げられる。
【0353】
いくつかの実施形態では、抗癌剤は、ポリ-ADPリボースポリメラーゼ(PARP)阻害剤を含み得る。PARP阻害剤の実例としては、これらに限定されないが、オラパリブ(AZD-2281)、ルカパリブ(AG014699またはPF-01367338)、ニラパリブ(MK-4827)、タラゾパリブ(BMN-673)、ベリパリブ(ABT-888)、CEP9722、E7016、BGB-290、3-アミノベンズアミドが挙げられる。
【0354】
本明細書で引用されるすべての刊行物、特許出願、および発行された特許は、あたかも各個々の刊行物、特許出願、または発行された特許が参照により組み込まれることが具体的かつ個別に示されているかのように、参照により本明細書に組み込まれる。特に、国際PCT公開第WO2016/028316号の全内容は、参照により具体的に組み込まれる。
【0355】
前述の発明は、理解を明確にするために例示および例としてある程度詳細に記載されているが、添付の特許請求の範囲の趣旨または範囲から逸脱することなく特定の変更および修正を行うことができることは、本発明の教示に照らして当業者には容易に明らかであろう。以下の実施例は、例示のみを目的として提供され、限定を目的として提供されない。当業者は、本質的に同様の結果をもたらすように変更または修正することができる様々な重要でないパラメータを容易に認識するであろう。
【0356】
本発明のいくつかの実施形態の実施は、特に反対のことが示されない限り、当技術分野の技術の範囲内にある化学、生化学、有機化学、分子生物学、微生物学、組換えDNA技術、遺伝学、免疫学、および細胞生物学の従来の方法を使用し、それらの多くは例示の目的で以下に記載される。そのような技術は、文献で十分に説明されている。例えば、Sambrook, et al., MolecularCloning: A Laboratory Manual (3rd Edition, 2001); Sambrook, et al., MolecularCloning: A Laboratory Manual (2nd Edition, 1989); Maniatis et al., MolecularCloning: A Laboratory Manual (1982); Ausubel et al., CurrentProtocols in Molecular Biology (John Wiley and Sons, updated July 2008); ShortProtocols in Molecular Biology: A Compendium of Methods from Current Protocolsin Molecular Biology, Greene Pub. Associates and Wiley-Interscience;Glover, DNA Cloning: A Practical Approach, vol. I & II (IRL Press,Oxford, 1985); Anand, Techniques for the Analysis of Complex Genomes,(Academic Press, New York, 1992); Transcription and Translation (B.Hames & S. Higgins, Eds., 1984); Perbal, A Practical Guide to Molecular Cloning(1984);およびHarlow and Lane, Antibodies,(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998)を参照されたい。
【0357】
番号付き実施形態
添付の特許請求の範囲にかかわらず、以下の番号付き実施形態も本開示の一部を形成する。
【0358】
1.多機能アダプターであって、
a.ライゲーション鎖オリゴヌクレオチドと、
b.前記ライゲーション鎖オリゴヌクレオチドの3’末端の領域にハイブリダイズし、それと共に二重鎖を形成することができる非ライゲーション鎖オリゴヌクレオチドと、を含み、
前記ライゲーション鎖オリゴヌクレオチドが、試料由来のdsDNA断片と接触すると、前記dsDNA断片の各鎖の5’末端に連結し、
前記ライゲーション鎖オリゴヌクレオチドが、
(i)3’末端オーバーハングと、
(ii)プライマー認識部位として働くことができるポリヌクレオチド配列を含む増幅領域と、
(iii)ユニーク多機能性ID領域と、
(iv)ユニーク分子識別子(UMI)マルチプライヤーと、
(v)非ライゲーション鎖オリゴヌクレオチドに少なくとも部分的に相補的なポリヌクレオチド配列を含むアンカー領域と、を含み、
前記dsDNA断片が、各鎖の5’末端にリン酸基を含み、各鎖の3’末端にオーバーハングを含み、
各dsDNA断片が、前記多機能性ID領域と前記UMIマルチプライヤーとの組み合わせによって識別することができ、かつ
前記試料が、前記多機能性ID領域によって識別され得る、多機能アダプター。
【0359】
2.前記ライゲーション鎖オリゴヌクレオチドが3’末端にdTオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdAオーバーハングを含むか、または
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdAオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdTオーバーハングを含む、
実施形態1の多機能アダプター。
【0360】
3.前記ライゲーション鎖オリゴヌクレオチドが3’末端にdCオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdGオーバーハングを含むか、または
前記ライゲーション鎖オリゴヌクレオチドが3’末端にdGオーバーハングを含み、前記dsDNA断片が各鎖の3’末端にdCオーバーハングを含む、
実施形態1の多機能アダプター。
【0361】
4.前記ライゲーション鎖オリゴヌクレオチド中の前記増幅領域が、PCR、LAMP、NASBA、SDA、RCAまたはLCRのためのプライマー認識部位として働くことができるポリヌクレオチド配列を含む、実施形態1~3のいずれか一つに記載の多機能アダプター。
【0362】
5.前記非ライゲーション鎖オリゴヌクレオチドが、前記dsDNA断片の5’末端へのライゲーションおよび/またはアダプター二量体形成を妨げる修飾をその3’末端に含む、実施形態1~4のいずれか一つに記載の多機能アダプター。
【0363】
6.前記試料が組織生検である、実施形態1~5のいずれか一つに記載の多機能アダプター。
【0364】
7.前記組織生検が、腫瘍または腫瘍であると疑われる組織から採取される、実施形態6に記載の多機能アダプター。
【0365】
8.dsDNA断片が、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNA、または脱メチル化DNAを含む、実施形態1~7のいずれか一つに記載の多機能アダプター。
【0366】
9.前記dsDNAが試験試料から単離されるかまたは生成され、前記試験試料が、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、便、粘液および汗からなる群から選択される生物学的試料を含む、実施形態8に記載の多機能アダプター。
【0367】
10.前記dsDNA断片が、
a.)試験試料から細胞DNAを単離することと、
b.)細胞DNAを断片化して、ゲノムDNA断片を得ることと、を含む工程によって得られる、実施形態1~9のいずれか一つに記載の多機能アダプター。
【0368】
11.工程(b)が、前記細胞DNAを少なくとも1つの消化酵素と接触させることによって行われる、実施形態10に記載の多機能アダプター。
【0369】
12.工程(b)が、前記細胞DNAに機械的ストレスを加えることによって行われる、実施形態10に記載の多機能アダプター。
【0370】
13.前記機械的ストレスが、細胞DNAを超音波処理することによって加えられる、実施形態12に記載の多機能アダプター。
【0371】
14.工程(b)が、前記細胞DNAを1またはそれを超える化合物と接触させて、前記細胞DNAの1またはそれを超える結合を化学的に破壊することによって行われる、実施形態10に記載の多機能アダプター。
【0372】
15.前記増幅領域が10~50ヌクレオチド長である、実施形態1~14のいずれか一つに記載の多機能アダプター。
【0373】
16.前記増幅領域が20~30ヌクレオチド長である、実施形態15に記載の多機能アダプター。
【0374】
17.前記増幅領域が25ヌクレオチド長である、実施形態15に記載の多機能アダプター。
【0375】
18.前記多機能性ID領域が3~50ヌクレオチド長である、実施形態1~17のいずれか一つに記載の多機能アダプター。
【0376】
19.前記多機能性ID領域が3~15ヌクレオチド長である、実施形態18に記載の多機能アダプター。
【0377】
20.前記多機能性ID領域が8ヌクレオチド長である、実施形態18に記載の多機能アダプター。
【0378】
21.前記UMIマルチプライヤーが多機能性ID領域に隣接するか、または前記多機能性ID領域内に含まれる、実施形態1~20のいずれか一つに記載の多機能アダプター。
【0379】
22.前記UMIマルチプライヤーが1~5ヌクレオチド長である、実施形態21に記載の多機能アダプター。
【0380】
23.前記UMIマルチプライヤーが3ヌクレオチド長であり、64個の可能なヌクレオチド配列のうちの1つを含む、実施形態21に記載の多機能アダプター。
【0381】
24.前記アンカー領域が1~50ヌクレオチド長である、実施形態1~23のいずれか一つに記載の多機能アダプター。
【0382】
25.前記アンカー領域が5~25ヌクレオチド長である、実施形態24に記載の多機能アダプター。
【0383】
26.前記アンカー領域が10ヌクレオチド長である、実施形態24に記載の多機能アダプター。
【0384】
27.複数の多機能アダプターが複数のdsDNA断片に連結されている、実施形態1~26のいずれか一つに記載の多機能アダプター。
【0385】
28.前記dsDNA断片が、複数の多機能アダプターと連結する前に末端修復される、実施形態27に記載の多機能アダプター。
【0386】
29.前記複数の多機能アダプターの各多機能アダプターの前記増幅領域が、同一のヌクレオチド配列を含む、実施形態27または28に記載の多機能アダプター。
【0387】
30.前記同一のヌクレオチド配列がPCRプライマー結合部位を含む、実施形態29に記載の多機能アダプター。
【0388】
31.前記複数の多機能アダプターの各多機能アダプターの前記多機能性ID領域が、2~10,000個のユニークヌクレオチド配列のうちの1つを含む、実施形態27~30のいずれか一つに記載の多機能アダプター。
【0389】
32.前記複数の多機能アダプターの各多機能アダプターの前記多機能性ID領域が、50~500個のユニークヌクレオチド配列のうちの1つを含む、実施形態31に記載の多機能アダプター。
【0390】
33.前記複数の多機能アダプターの各多機能アダプターの前記多機能性ID領域が、100~400個のユニークヌクレオチド配列のうちの1つを含む、実施形態31に記載の多機能アダプター。
【0391】
34.前記複数の多機能アダプターの各多機能アダプターの多機能性ID領域が、60個のユニークヌクレオチド配列のうちの1つを含む、実施形態31に記載の多機能アダプター。
【0392】
35.前記複数の多機能アダプターの各多機能アダプターの前記多機能性ID領域が、8ヌクレオチド長である、実施形態31~34のいずれか一つに記載の多機能アダプター。
【0393】
36.前記複数の多機能アダプターの各多機能アダプターが、64~2,560,000個のユニークヌクレオチド配列のうちの1つを含む、実施形態31~35のいずれか一つに記載の多機能アダプター。
【0394】
37.前記複数の多機能アダプターの各多機能アダプターが、3840個のユニークヌクレオチド配列のうちの1つを含み、かつ各ヌクレオチド配列が、3840個のユニークヌクレオチド配列の任意の他の配列から少なくとも2のハミング距離だけ離れている、実施形態31~36のいずれか一つに記載の多機能アダプター。
【0395】
38.前記複数の多機能アダプターのそれぞれが、多機能性ID領域に隣接するかまたは前記多機能性ID領域内に含まれるUMIマルチプライヤーを含む、実施形態31~37のいずれか一つに記載の多機能アダプター。
【0396】
39.前記複数の多機能アダプターの各多機能アダプターの前記UMIマルチプライヤーが、1~5ヌクレオチド長である、実施形態31~38のいずれか一つに記載の多機能アダプター。
【0397】
40.前記複数の多機能アダプターの各多機能アダプターの前記UMIマルチプライヤーが3ヌクレオチド長である、実施形態39に記載の多機能アダプター。
【0398】
41.前記複数の多機能アダプターの各多機能アダプターの前記アンカー領域が、4つのヌクレオチド配列のうちの1つを含み、かつ所与の配列の各多機能性ID領域を4つのアンカー領域のそれぞれと対をなすことができる、実施形態31~40のいずれか一つに記載の多機能アダプター。
【0399】
42.前記複数の多機能アダプターの各多機能アダプターの増幅領域は、同一のヌクレオチド配列を含み、
前記複数の多機能アダプターの各多機能アダプターの多機能性ID領域が8ヌクレオチド長であり、
各多機能性ID領域のヌクレオチド配列は、少なくとも2のハミング距離だけ複数の多機能性アダプターの任意の他の多機能性ID領域のヌクレオチド配列とは異なり、
前記複数の多機能アダプターの各々は、前記多機能性ID領域に隣接するかまたは前記多機能性ID領域内に含まれるUMIマルチプライヤーを含み、
前記複数の多機能アダプターの各多機能アダプターの前記UMIマルチプライヤーは3ヌクレオチド長であり、前記可能なヌクレオチド配列の各々の前記UMIマルチプライヤーは、前記複数の多機能アダプターの各多機能性ID領域と対になっており、
前記複数の多機能アダプターの各多機能アダプターの前記アンカー領域は、4つのヌクレオチド配列のうちの1つを含み、所与の配列の各多機能性ID領域は、前記4つのアンカー領域のそれぞれと対をなしてもよい、実施形態31に記載の多機能アダプター。
【0400】
43.多機能アダプターとdsDNA断片とを含む複合体であって、前記多機能アダプターが、実施形態1~42のいずれか一項に記載の多機能アダプターから選択される、複合体。
【0401】
44.アダプタータグ付きDNAライブラリーを作製するための方法であって、
a)複数の多機能アダプターを複数のdsDNA断片と連結して、複数の多機能アダプター/dsDNA断片複合体を生成することであって、前記複数の多機能アダプターのそれぞれが、実施形態1~42のいずれか一項に記載の多機能アダプターから選択されることと、前記複数の複合体のそれぞれが、実施形態43に記載の複合体を含み、必要に応じて、
b)工程(a)からの前記複数の複合体を1またはそれを超える酵素と接触させて、複数の連続したアダプタータグ付きDNA断片を含むアダプタータグ付きDNAライブラリーを形成することと、を含む、方法。
【0402】
45.前記複数のdsDNA断片が、無細胞DNA(cfDNA)、ゲノムDNA(gDNA)、相補的DNA(cDNA)、ミトコンドリアDNA、メチル化DNAまたは脱メチル化DNAを含む、実施形態44に記載の方法。
【0403】
46.前記複数のdsDNA断片が、複数の多機能アダプターと連結する前に末端修復される、実施形態44または45に記載の方法。
【0404】
47.前記複数のdsDNA断片が、全ゲノムライブラリー、アンプリコンライブラリー、全エクソームライブラリー、cDNAライブラリーまたはメチル化DNAライブラリーからなるリストから選択されるライブラリーから得られる、実施形態44~46のいずれか一つに記載の方法。
【0405】
48.前記非ライゲーション鎖オリゴヌクレオチドが、工程(b)において前記多機能アダプター/dsDNA断片複合体から置換される、実施形態44~47のいずれか一つに記載の方法。
【0406】
49.前記1またはそれを超える酵素がDNAリガーゼまたはRNAリガーゼを含む、実施形態44~48のいずれか一つに記載の方法。
【0407】
50.前記DNAリガーゼが、T4 DNAリガーゼまたはTaq DNAリガーゼを含む、実施形態49に記載の方法。
【0408】
51.前記方法が、複数の増幅連続アダプタータグ付きdsDNA断片を含む増幅アダプタータグ付きDNAライブラリーを生成するために、前記複数の連続アダプタータグ付きDNA断片を増幅することさらに含む、実施形態44~50のいずれか一つに記載の方法。
【0409】
52.増幅のために1またはそれを超えるプライマーが使用される、実施形態51に記載の方法。
【0410】
53.前記1またはそれを超えるプライマーは、前記アダプターの前記プライマー結合領域にハイブリダイズするユニバーサルプライマー結合配列を含む、実施形態52に記載の方法。
【0411】
54.実施形態44~53および実施形態67のいずれか一つに記載の方法に従って作製されたアダプタータグ付きDNAライブラリー。
【0412】
55.プローブ捕捉ライブラリーを作製するための方法であって、
a)実施形態54に記載のアダプタータグ付きDNAライブラリーを、1またはそれを超える多機能捕捉プローブとハイブリダイズさせて、1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を形成することであって、各多機能捕捉プローブが、
i)パートナーオリゴヌクレオチドにハイブリダイズすることができる第1の領域であって、必要に応じて、PCRプライマー結合部位を含むテール配列を含む前記第1の領域と、
ii)前記アダプタータグ付きDNAライブラリー中の標的領域にハイブリダイズすることができる第2の領域と、を含む、ハイブリダイズすることと、
b.)工程(a)から前記1またはそれを超える捕捉プローブ/アダプタータグ付きDNA複合体を単離することであって、各単離された捕捉プローブ/アダプタータグ付きDNA複合体が、捕捉プローブおよびアダプタータグ付きDNA断片を含む、単離することと、
c.)工程(b)からの単離された捕捉プローブ/DNA断片複合体を酵素的処理して、ハイブリッド分子を含むプローブ捕捉DNAライブラリーを生成することであって、各ハイブリッド分子は、
i)捕捉プローブの少なくとも一部またはその相補体と、
ii)DNA断片またはその相補体の少なくとも一部と、
iii)アダプターと、を含む、酵素的処理することと、を含む、方法。
【0413】
56.(c)の前記酵素処理工程が、前記複合体中の前記アダプタータグ付きDNA断片を鋳型として使用して、前記捕捉プローブの5’-3’DNAポリメラーゼ伸長を行うことを含む、実施形態55に記載の方法。
【0414】
57.少なくとも1つの捕捉プローブが前記標的領域中の特定領域の下流にハイブリダイズし、少なくとも1つの捕捉プローブが前記標的領域中の前記特定領域の上流にハイブリダイズする、実施形態55または実施形態56に記載の方法。
【0415】
58.前記捕捉プローブがシーケンシングプライマー認識配列を含む、実施形態55~57のいずれか一つに記載の方法。
【0416】
59.d.)工程(c)からの前記ハイブリッド分子に対してPCRを行って、増幅ハイブリッド分子を含む増幅ライブラリーを生成することをさらに含む、実施形態55~58のいずれか一つに記載の方法。
【0417】
60.実施形態55~58のいずれか一つに従って作製されたハイブリッド分子を含むプローブ捕捉ライブラリー。
【0418】
61.実施形態59に従って作製された増幅プローブ捕捉ライブラリー。
【0419】
62.実施形態60のハイブリッド分子の前記プローブ捕捉ライブラリーに対して標的遺伝子解析を行うことを含む方法。
【0420】
63.実施形態61において、前記増幅プローブ捕捉ライブラリーに対して標的遺伝子解析を行うことを含む方法。
【0421】
64.前記標的遺伝子解析が配列解析を含む、実施形態62または63に記載の方法。
【0422】
65.前記標的遺伝子解析がコピー数解析を含む、実施形態62または63に記載の方法。
【0423】
66.前記各ハイブリッド分子中の捕捉プローブ領域の全部または一部が配列決定される、実施形態62~65のいずれか一つに記載の方法。
【0424】
67.前記複数の複合体の各多機能アダプター/dsDNA断片複合体が、前記dsDNA断片の各末端に連結された多機能アダプターを含む、実施形態44~53のいずれか一つに記載の方法。
【0425】
均等物
本発明を上記の特定の実施形態と併せて説明してきたが、その多くの代替形態、修正形態および他の変形形態が当業者には明らかであろう。そのような代替形態、修正形態および変形形態はすべて、本発明の趣旨および範囲内に入ることが意図されている。
【0426】
さらに、本明細書に記載の任意の方法は、本明細書に記載の障害のいずれかを処置する際に、医薬の製造のための本明細書に記載の任意の薬剤の使用のためにスイス型形式に書き換えられ得ることが意図される。同様に、本明細書に記載の任意の方法は、使用クレームの化合物として、または化合物クレームの使用として書き換えられることが意図されている。
【0427】
本明細書に記載のすべての刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。
【実施例】
【0428】
本開示は、以下の実施例によってさらに説明されるが、これらの実施例は、本開示の範囲または趣旨を本明細書に記載の特定の手順に限定するものと解釈されるべきではない。例は特定の実施形態を説明するために提供されており、それによって本開示の範囲に対する限定は意図されていないことを理解されたい。本開示の趣旨から逸脱することなく、当業者に示唆することができる様々な他の実施形態、修正形態、およびそれらの均等物に頼ることができることをさらに理解されたい。
【0429】
実施例1:DNAライブラリーの調製
本実施例では、遺伝子変異体(Coriell Institute for Medical ResearchまたはSeraCare Life Sciences,Inc.)を有する不死化細胞から単離された無細胞DNAおよびゲノムDNAをNGSライブラリー(アダプタータグ付きDNAライブラリー)構築に使用した。
表1:実験に使用した試料
【表1-1】
【表1-2】
【0430】
健常ドナー由来の無細胞DNAを、QIAmp DSP Circulating NA kit(Qiagen)を用いて血漿試料から抽出した(表1参照)。
【0431】
実験室で作製した疾患試料1および疾患試料2を使用する利点は、組成物を以下に詳述するように慎重に制御することができ、試料の入手可能性が本質的に無制限であることである。
【0432】
ゲノムDNAを、200bp断片を生成する設定で超音波処理機(Covaris(登録商標))を使用する超音波処理によってせん断し、次いでさらに精製し、常磁性AMPure XP(登録商標)ビーズ(Beckman(登録商標))を用いた「両側」ビーズ精製を使用してサイズ選択した。
【0433】
断片化された細胞株ゲノムDNAおよび合成DNAの混合物をWT cfDNAと組み合わせて、既知の一塩基変異体(SNV)、挿入および欠失(インデル変異体)、コピー数変異体(CNV)、および定義された対立遺伝子頻度(AF)での融合を有する疾患試料1および疾患試料2を作製した。上記の表に列挙された投入試料量の適切な組み合わせを定義されたパーセンテージにブレンドして、低対立遺伝子頻度(AF)の検出を可能にし、末端修復し、以下に記載されるようにタグ付きDNAライブラリーに変換した。
【0434】
実施例2:任意の単一工程DNA末端修復
入力DNA断片を「末端修復されたDNA断片」に変換し、末端修復されたDNA断片が単一の反応混合物中に5’リン酸基および3’dAヌクレオチドオーバーハングを有するようにした(単一工程末端修復)。
【0435】
市販のキット(NEB Ultra II End Repair(登録商標)/dAテーリングモジュール(E7546L)を使用してDNA断片の修復を終了した。End Repair Master Mix(登録商標)(「End Repair MM」)を単一チューブ反応混合物中で伸長DNA断片に添加した。End Repair MMは、NEBNext Ultra II End Prep Enzyme Mix(登録商標)をNEBNext Ultra II End Prep Reaction Buffer(登録商標)と合わせることによって調製し、各ミックスは、NEBNext Ultra II End Prep/dAテーリングモジュール(New England Biolabs(登録商標))の成分を緩衝する。伸長したDNA断片を含む反応混合物をサーモサイクラーで以下の反応条件下:20℃で15分間、次いで70℃で10分間でインキュベートした(「単一工程反応」)。
【0436】
いくつかの実施形態では、単一工程反応がそのような反応を行うための製造業者の推奨量よりも有意に少ない量のEnd Repairマスターミックス(MM)を使用するように、末端修復/dAテーリング工程を最適化した。いくつかの実施形態では、End Repair MMの量の減少も、驚くべきことに、本開示のアダプターおよび観察された得られたNGSライブラリーのゲノム均等物を使用した末端修復されたDNA断片のクローニング効率によって実証されるように、末端修復されたDNA断片の形成に悪影響を及ぼさなかった(平均>3500GE)。実際、驚くべきことに、クローニング効率は、本開示に記載されているようなこの単一工程末端修復プロセスを使用して増加した。
【0437】
実施例3:アダプターライゲーション
多機能アダプターモジュールの3’dTテーリングされたライゲーション鎖のプールを上記の試料からの末端修復されたDNA断片に連結し、断片の5’末端へのアダプター付着をもたらした。相補的な非ライゲーション鎖は、DNA断片の3’dAテーリングされた末端に連結されなかった。この実験で使用したアダプターの説明を表2および表3に示す。
【0438】
ユニーク多機能アダプターモジュールのプール(5μM)5.0μLおよびNEB Ultra II Ligation Mix(登録商標)(New England Biolabs(登録商標)、米国マサチューセッツ州)30μLに、45uLのEnd Repair反応混合物(5’リン酸化末端および3’dAヌクレオチドオーバーハングを有する末端修復DNA断片を含む)を加えた。アダプターモジュールの各ライゲーション鎖は長さが47ntであり、(5’→3’から)増幅領域(AMP、25nt)、試料とユニーク断片の両方を識別することができる多機能性ID領域(8nt)、UMIマルチプライヤー(3nt)、アンカー(10nt)および3’dTオーバーハングを含む。この実施例で使用したライゲーション鎖を表2に示す。アダプターモジュールのプールは、各アダプタープールが4種類のアンカー領域を含む等モル量のアダプターモジュールを含むように調製し、各アンカー型はA、T、CおよびGから選択される3’末端ヌクレオチドを有する。
表2:アダプター構造
【表2】
【0439】
反応混合物を20℃で30分間インキュベートして、アダプタータグ付きDNA断片を生成した。
表3.非増幅および増幅タグ付きDNAライブラリーを作製するために使用される例示的なアダプター配列
【表3-1】
【表3-2】
【表3-3】
*表3の配列中のNNNは、各NがA、G、C、Tのいずれか1つから選択され得る3ヌクレオチドUMIマルチプライヤーを表す。
【0440】
ライゲーション後、100μLのDNA精製ビーズ(Ampure XP(登録商標)、Beckman(登録商標))をライゲーション混合物に添加した。反応混合物を室温で2分間インキュベートした。磁石上で80%エタノール/水(v/v)200μLで2回洗浄し、風乾した後、TRIS-EDTA(TEZ)25μLで溶出した。アダプタータグ付きDNA断片を含む約25μLの溶出した清澄化上清を、増幅のために新鮮なPCRチューブまたはマイクロタイタープレートウェルに移して、アダプタータグ付きDNAライブラリーを生成した。
【0441】
実施例4:タグ付きDNAライブラリーの伸長および増幅
実施例3におけるアダプターライゲーションに続いて、試薬および好熱性DNAポリメラーゼ酵素(NEB Ultra II 2X PCR Amplification(登録商標);New England Biolabs(登録商標))を含有する75μLのマスターミックス(MM)を添加し、反応混合物を以下のランパラメータを使用して増幅した:
60℃ 30秒間、72℃ 2分間、98℃ 30秒間;
98℃ 30秒間、65℃ 30秒間および72℃ 30秒間の8サイクル。
【0442】
単一の増幅プライマーを使用したTGCAGGACCAGAGAATTCGAATACA(配列番号70)。
【0443】
最初の3分のインキュベーションサイクルを実施して、ライゲーション-鎖-鋳型化伸長によって複数の連続したアダプタータグ付きdsDNA断片を形成し、続いて、連続したアダプタータグ付きdsDNA断片の8サイクルPCR増幅を実施して、アダプタータグ付きDNA断片分子を含む増幅タグ付きDNAライブラリーを形成した。
【0444】
増幅後、120μLのDNA精製ビーズをライゲーション混合物に添加した。反応混合物を室温で2分間インキュベートした。磁石上でビーズを80%エタノール/水(v/v)200μLで2回洗浄し、風乾し、次いで14μLのTEZで溶出した。増幅タグ付きDNAライブラリーを含む清澄化された上清を新鮮なPCRチューブに移した。
【0445】
これらの方法を使用して、本発明者らは、高効率ライブラリーを調製する時間を約8時間から約3~4時間に短縮した。実施例で使用される酵素を含む酵素/キット試薬の数が16から4に減少するにつれて、複雑度が減少した。
【0446】
実施例5:捕捉プローブライブラリー増幅(予言的)
目的の遺伝子座を捕捉して濃縮するために、実施例2に記載したように調製した各タグ付きDNAライブラリー(例えば、疾患試料1および疾患試料2)を組み合わせ、多重化し、相同修復欠損遺伝子に特異的な多機能捕捉プローブモジュールのプール(例えば、ATM、BRCA1、BRCA2、FANCA、HDAC2、およびPALB2)または肺癌遺伝子に特異的な多機能捕捉プローブモジュールのプール(例えば、ERBB2、TP53、EML4-ALK融合物、EGFR、MET)にハイブリダイズさせる。
【0447】
次に、100uLのストレプトアビジン被覆ビーズ(Dynabeads MyOne C1)をハイブリダイゼーション反応と合わせ、室温で20分間静置する。ビーズを磁石上に集め、200μLのTEZ緩衝液で一回洗浄する。洗浄したビーズを40μLのTEZ緩衝液に再懸濁する。160μLの洗浄緩衝液を再懸濁ビーズに添加し、混合物を45℃で5分間インキュベートする。次いで、磁石を使用してビーズを分離し、200μLのTEZ緩衝液で洗浄する。
【0448】
ハイブリダイゼーション後、捕捉プローブのプライマー伸長を使用して、捕捉されたゲノム配列、DNA断片の接合部におけるA/Tオーバーハング、および付着したアダプターモジュールをコピーして、ハイブリッド分子のライブラリーを形成する。このようにして形成されたハイブリッド分子は、一端に捕捉プローブモジュールが隣接し、他端にアダプターモジュールが隣接するDNA断片を含む。
【0449】
オンビーズプローブ伸長に続いて、PCRを実施して、Illumina(登録商標)シーケンシングアダプターを組み込む。ビーズを20uLのTEZに再懸濁し、PCRマスターミックス(55uLのUltra II PCR Mix、5.5uLのプライマーF、5.5uLのプライマーR)と合わせ、サーマルサイクラーに入れ、以下のプログラムに従って操作する:60℃ 30秒間、72℃ 30秒間、98℃ 30秒間、98℃ 30秒間を5サイクル、65℃ 30秒間、72℃で30秒間。
【0450】
次に、磁石上で反応混合物からビーズを分離する。上清を新しいPCRチューブに移し、PCR MMと組み合わせ、以下の増幅サイクルを使用してサーマルサイクラーで増幅する:98℃ 30秒間を10サイクル、65℃ 30秒間、72℃で30秒間。
【0451】
フォワードプライマー:AATGATACGGCGACCACCGAGATCTACACGTCATGCAGGACCAGAGAATTCGAATACA(配列番号71)。
【0452】
リバースプライマー:CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGAGTTGATCCTGGTTTTCAC(配列番号72)。
【0453】
このハイブリッド分子のライブラリーをPCR増幅して、各試料に対する増幅ハイブリッド分子を含有する増幅標的化DNAライブラリーを提供する。これらの増幅ハイブリッド分子は、それらが
図8に示されるように分子の2つの末端にシーケンシングプライマー結合部位を含有するという点で「シーケンシング準備ができている」。
【0454】
実施例6:配列解析
ハイブリッド分子について遺伝子解析を行った。シーケンシングRead1(151nt)およびRead2(17nt)を遺伝子解析に使用した。適切なクラスターおよびアラインメント分析のために、各個々の配列リードを処理して、(アダプターの3’末端オーバーハングおよびDNA断片の5’末端オーバーハングから生成された)A/Tヌクレオチド挿入を生物情報学的に排除した。このA/T挿入の排除は、バイオインフォマティクス法を用いて配列リードを遺伝子解析に供することによって行った。変異体呼び出し側は、冗長リードを識別し、冗長リードを単一のコンセンサスリードに処理し、次いで各プローブ位置で定量した。変異体呼び出し側は、適切な試料特異的DNA断片配列を得るために、挿入されたA/Tオーバーハングを生物情報学的に排除するために、アダプターと各DNA断片の5’末端との接合部をさらに識別した。遺伝子解析中のA/T挿入の排除は、質を高め、配列リードのミスアラインメントおよび/または不正確なクラスター化を減少させた。最後に、統計的有意性を各変異体測定で検出された偏差に割り当てた。
【0455】
実施例7:シーケンシング深度の改善
上記で生成したタグ付きDNAライブラリーに対してシーケンシングを行った。タグ付きDNAライブラリーをヒト参照ゲノムに整列し、意図する標的にマッピングした。
【0456】
コンパレータープロセスおよび自動化可能プロセスを用いた3つのタグ付きDNAライブラリー(WT cfDNA、疾患試料1および疾患試料2)の平均深度を測定した(
図4Cを参照されたい)。
【0457】
実施例8:均一なアダプター分布
本実施例では、配列リードによって測定されるタグ付きDNAライブラリーへの特定のアダプター配列の包含に対する偏りが減少した。自動化可能プロセスを使用したライブラリー調製は、コンパレータープロセスを使用したライブラリー調製と比較して改善されたアダプター分布を示し、効率の低いアダプターを補償する必要性を排除した。得られたアンカー分布を
図9および表4に示す。
表4:アダプター分布のライブラリー調製比較
【表4-1】
【表4-2】
【0458】
実施例9:変異体検出
表6および表7は、実施例1(疾患試料1および疾患試料2)で調製した試料について得られたワトソン鎖(+)またはクリック鎖(-)上の各変異体に対するシーケンシングリードの数を示した。表5に見られるように、疾患試料1について、自動化可能プロセスを使用した変異体プラス鎖(+鎖)の平均リードは94であったが、コンパレータープロセスを使用した場合は66であった。同様に、疾患試料2については、自動化可能プロセスを使用した変異体プラス鎖(+鎖)の平均リードは238であったが、疾患試料1のコンパレータープロセスを使用した場合は199であった。これらの結果は、試験した検出された各変異体について、タグ付きDNAライブラリーおよびプローブ捕捉ライブラリーを作製するためのプロセスが、各変異体のリード数の増加によって測定することができるようにはるかに効率的であり、アッセイ感度の増加を示すことを示唆している。
表5:疾患試料1から調製したライブラリーを使用した自動化可能プロセスとコンパレータープロセスとの間の変異体検出比較
【表5-1】
【表5-2】
表6:疾患試料2から調製したライブラリーを使用した自動化可能プロセスとコンパレータープロセスとの間の変異体検出比較
【表6-1】
【表6-2】
【0459】
実施例10:ゲノムライブラリーの増幅に対する改善
ゲノムライブラリーを増幅するための条件を3つの異なる条件下で試験した。
1)69℃のアニーリング温度下で、2つの別々のチューブに分割されたライブラリーの増幅を行うこと、
2)65℃のアニーリング温度下で、2つの別々のチューブに分割されたライブラリーの増幅を行うこと、および
3)65℃のアニーリング温度下で、ライブラリーを分割することなく(1チューブで)増幅を行うこと(表7)。
【0460】
65℃のアニーリング温度下でライブラリーを分割せずに行われた増幅条件(条件3)は、良好に機能し、ライブラリーを2つの試料チューブに分割する必要がなくなり、ライブラリー調製プロセスが単純化された。
表7:増幅条件の最適化
【表7】
【配列表】
【国際調査報告】