IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イルミナ インコーポレイテッドの特許一覧

特表2024-513187ライブラリー中のDNA損傷を評価し、アンプリコンサイズバイアスを正規化するための組成物及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-22
(54)【発明の名称】ライブラリー中のDNA損傷を評価し、アンプリコンサイズバイアスを正規化するための組成物及び方法
(51)【国際特許分類】
   C12Q 1/6876 20180101AFI20240314BHJP
   C12N 15/09 20060101ALI20240314BHJP
   C12Q 1/6869 20180101ALI20240314BHJP
【FI】
C12Q1/6876 Z
C12N15/09 Z
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023558993
(86)(22)【出願日】2022-03-28
(85)【翻訳文提出日】2023-09-26
(86)【国際出願番号】 US2022022184
(87)【国際公開番号】W WO2022212280
(87)【国際公開日】2022-10-06
(31)【優先権主張番号】63/167,171
(32)【優先日】2021-03-29
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/227,550
(32)【優先日】2021-07-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100119013
【弁理士】
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100123777
【弁理士】
【氏名又は名称】市川 さつき
(74)【代理人】
【識別番号】100111796
【弁理士】
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100123766
【弁理士】
【氏名又は名称】松田 七重
(74)【代理人】
【識別番号】100111501
【弁理士】
【氏名又は名称】滝澤 敏雄
(72)【発明者】
【氏名】ケネディ アンドリュー ビー
(72)【発明者】
【氏名】ストームス レナ
(72)【発明者】
【氏名】シェン フェイ
(72)【発明者】
【氏名】ベニス オリヴィア
(72)【発明者】
【氏名】ムルトフェルト エリック
(72)【発明者】
【氏名】プグリエーセ ケイトリン
(72)【発明者】
【氏名】ハワード マイケル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ28
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR62
4B063QS25
4B063QS36
4B063QX02
(57)【要約】
アンプリコンサイズバイアスを正規化する標準物質及び方法が本明細書に記載される。これらの標準物質は、固有分子識別子を含み得る。いくつかの実施形態では、標準物質及び方法は、次世代配列決定(NGS)アッセイと共に使用するためのものである。蛍光を使用してDNAを含む試料中のDNA損傷を定量化するため、又はライブラリー中のDNA損傷の存在を決定するための方法も本明細書に記載される。
【特許請求の範囲】
【請求項1】
異なる長さの核酸標準物質のプールであって、前記核酸標準物質は、固有分子識別子(UMI)、並びに、
a.5’ユニバーサルオリゴヌクレオチドであって、前記5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、
b.3’ユニバーサルオリゴヌクレオチドであって、前記3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、
c.前記UMIと前記5’ユニバーサルオリゴヌクレオチドとの間及び/又は前記UMIと前記3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域と、を含み、
前記少なくとも1つの領域の長さは、前記標準物質の長さを決定する、標準物質のプール。
【請求項2】
前記プールが、UMI、並びに、
a.5’ユニバーサルオリゴヌクレオチドであって、前記5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、
b.3’ユニバーサルオリゴヌクレオチドであって、前記3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、を含む、更なる拡散標準物質を更に含み、
前記更なる核酸標準物質は、前記UMIと前記5’ユニバーサルオリゴヌクレオチドとの間又は前記UMIと前記3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域を含まない、請求項1に記載の標準物質のプール。
【請求項3】
前記UMIと前記5’ユニバーサルオリゴヌクレオチドとの間及び/又は前記UMIと前記3’ユニバーサルオリゴヌクレオチドとの間の前記少なくとも1つの領域が、0.2kb~10kbを含む、請求項1に記載の標準物質のプール。
【請求項4】
前記5’ユニバーサルオリゴヌクレオチド及び/又は前記3’ユニバーサルオリゴヌクレオチドがそれぞれ、目的の配列から増幅されたアンプリコンを含む、請求項1~3のいずれか一項に記載の標準物質のプール。
【請求項5】
前記UMIと前記5’ユニバーサルオリゴヌクレオチドとの間及び/又は前記UMIと前記3’ユニバーサルオリゴヌクレオチドとの間の前記少なくとも1つの領域がそれぞれ、目的の配列から増幅されたアンプリコンを含む、請求項1又は3~4のいずれか一項に記載の標準物質のプール。
【請求項6】
前記UMIと前記5’ユニバーサルオリゴヌクレオチドとの間及び/又は前記UMIと前記3’ユニバーサルオリゴヌクレオチドとの間の前記少なくとも1つの領域がそれぞれ、任意の配列を含む、請求項1又は3~5のいずれか一項に記載の標準物質のプール。
【請求項7】
異なる長さの核酸標準物質のプールであって、前記核酸標準物質は、UMI、並びに、
a.5’部分的重複オリゴヌクレオチドであって、前記5’部分的重複オリゴヌクレオチドは、全ての前記標準物質についてその配列の少なくとも一部にわたって同一である、5’部分的重複オリゴヌクレオチド、及び/又は、
b.3’部分的重複オリゴヌクレオチドであって、前記3’部分的重複オリゴヌクレオチドは、全ての前記標準物質についてその配列の少なくとも一部にわたって同一である、3’部分的重複オリゴヌクレオチド、を含み、
前記5’部分的重複オリゴヌクレオチド及び/又は前記3’部分的重複オリゴヌクレオチドの長さは、前記標準物質の長さを決定する、標準物質のプール。
【請求項8】
a.前記5’部分的重複オリゴヌクレオチドが、目的の配列の少なくとも第1の部分を含み、
b.前記3’部分的重複オリゴヌクレオチドが、目的の配列の少なくとも第2の部分を含む、請求項7に記載の標準物質のプール。
【請求項9】
前記5’部分的重複オリゴヌクレオチド及び/又は前記3’部分的重複オリゴヌクレオチドがそれぞれ、目的の配列よりも20bp~1kb小さい配列を含む、請求項7~8のいずれか一項に記載の標準物質のプール。
【請求項10】
前記5’部分的重複オリゴヌクレオチド及び/又は前記3’部分的重複オリゴヌクレオチドがそれぞれ、目的の配列から増幅されたアンプリコンを含む、請求項7~9のいずれか一項に記載の標準物質のプール。
【請求項11】
前記標準物質が、二本鎖である、請求項1~10のいずれか一項に記載の標準物質のプール。
【請求項12】
前記標準物質が、二本鎖DNAを含む、請求項1~11のいずれか一項に記載の標準物質のプール。
【請求項13】
各標準物質が異なるUMIを含む、請求項1~12のいずれか一項に記載の標準物質のプール。
【請求項14】
前記標準物質のプールに含まれる前記UMIが、16~20塩基対を含む配列のランダムセットである、請求項1~13のいずれか一項に記載の標準物質のプール。
【請求項15】
前記標準物質のプールに含まれる前記UMIが、18塩基対を含む配列のランダムセットである、請求項14に記載の標準物質のプール。
【請求項16】
前記標準物質のプールが、1×1010以上、10×1010以上、又は100×1010以上の標準物質を含み、各標準物質が異なるUMIを含む、請求項1~15のいずれか一項に記載の標準物質のプール。
【請求項17】
前記プール中の標準物質の数が、増幅反応によって生成されるアンプリコンの数より多い、請求項1~16のいずれか一項に記載の標準物質のプール。
【請求項18】
標準物質のプールであって、前記標準物質の少なくとも第1の部分は、請求項1~6又は11~17のいずれか一項に由来し、前記標準物質の少なくとも第2の部分は、請求項7~17のいずれか一項に由来する、標準物質のプール。
【請求項19】
核酸標準物質のプールを生成する方法であって、
a.核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、
b.それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、
c.様々な長さの一連の挿入オリゴヌクレオチドを提供することと、
d.(a)の少なくとも1つの目的の配列、(b)のUMIを含む少なくとも1つのオリゴヌクレオチド、及び(c)の少なくとも1つの挿入アンプリコンをライゲーションして、前記核酸標準物質のプールの複数の核酸標準物質を生成することと、を含む、方法。
【請求項20】
前記少なくとも1つの目的の配列及び/又は挿入オリゴヌクレオチドが、増幅によって調製される、請求項19に記載の方法。
【請求項21】
前記目的の配列、それぞれUMIを含む前記オリゴヌクレオチド、及び/又は前記挿入オリゴヌクレオチドが、制限酵素切断部位を含む、請求項19又は20に記載の方法。
【請求項22】
前記制限酵素切断部位が、前記目的の配列、それぞれUMIを含む前記オリゴヌクレオチド、及び/又は前記挿入オリゴヌクレオチドの5’末端及び/又は3’末端の近位にある、請求項21に記載の方法。
【請求項23】
前記方法が、前記目的の配列、それぞれUMIを含む前記オリゴヌクレオチド、及び/又は前記挿入オリゴヌクレオチドを制限酵素で切断することを前記ライゲーションの前に更に含む、請求項21又は22に記載の方法。
【請求項24】
前記制限酵素により切断することが、前記ライゲーションのための付着末端を生成する、請求項23に記載の方法。
【請求項25】
核酸標準物質のプールを生成する方法であって、
a.核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、
b.それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、
c.(a)の少なくとも1つの目的の配列と(b)のUMIを含む少なくとも1つのオリゴヌクレオチドをライゲーションすることと、を含む、方法。
【請求項26】
前記少なくとも1つの目的の配列が、増幅によって調製される、請求項25に記載の方法。
【請求項27】
前記目的の配列及び/又はそれぞれUMIを含む前記オリゴヌクレオチドが、制限酵素切断部位を含む、請求項25又は26に記載の方法。
【請求項28】
前記制限酵素切断部位が、前記目的の配列及び/又はそれぞれUMIを含む前記オリゴヌクレオチドの5’末端及び/又は3’末端の近位にある、請求項27に記載の方法。
【請求項29】
前記方法が、前記目的の配列及び/又はそれぞれUMIを含む前記オリゴヌクレオチドを制限酵素で切断することを前記ライゲーションの前に更に含む、請求項27~28に記載の方法。
【請求項30】
前記制限酵素により切断することが、前記ライゲーションのための付着末端を生成する、請求項29に記載の方法。
【請求項31】
アンプリコンサイズバイアスを正規化する方法であって、
a.標的核酸を含む試料を、異なる長さの核酸標準物質のプールと組み合わせることであって、各標準物質はUMIを含む、ことと、
b.前記標準物質及び前記標的核酸に含まれる目的の配列のアンプリコンを増幅することと、
c.前記標準物質及び前記目的の配列のアンプリコンを配列決定して、配列決定データを生成することと、
d.前記標準物質由来の配列決定データを使用して、アンプリコンサイズに基づいてバイアスプロファイルを決定することと、
e.前記バイアスプロファイルを使用して、アンプリコンサイズバイアスを正規化することと、を含む、方法。
【請求項32】
前記核酸標準物質のプール中の前記標準物質が、0.2kb~20kb塩基対の範囲である、請求項31に記載の方法。
【請求項33】
前記核酸標準物質のプール中に含まれる各標準物質が、異なるUMIを含む、請求項31又は32に記載の方法。
【請求項34】
前記標準物質のプールに含まれる前記UMIが、16~20塩基対を含む配列のランダムセットである、請求項31~33に記載の方法。
【請求項35】
前記標準物質のプールに含まれる前記UMIが、18塩基対を含む配列のランダムセットである、請求項31~34に記載の方法。
【請求項36】
前記標準物質のプールが、1×1010以上、10×1010以上、又は100×1010以上の標準物質を含み、各標準物質が異なるUMIを含む、請求項31~35のいずれか一項に記載の方法。
【請求項37】
前記標準物質のプール中の標準物質の数が、前記増幅によって生成されるアンプリコンの数より多い、請求項31~36のいずれか一項に記載の方法。
【請求項38】
前記核酸標準物質のプールが、請求項1~18のいずれか一項に記載の核酸標準物質のプールを含む、請求項31~37のいずれか一項に記載の方法。
【請求項39】
前記核酸標準物質のプールが、請求項1~6又は11~17のいずれか一項に記載の核酸標準物質のプールを含む第1の部分と、請求項7~17のいずれか一項に記載の核酸標準物質のプールを含む第2の部分と、を含む、請求項31~37のいずれか一項に記載の方法。
【請求項40】
前記目的の配列が、前記目的の配列の5’末端及び/若しくは3’末端にない、又は前記目的の配列の5’末端及び/若しくは3’末端に近接していない制限酵素切断部位を含む、請求項31~39のいずれか一項に記載の方法。
【請求項41】
前記目的の配列が、挿入又は欠失変異を含み得る、請求項31~40のいずれか一項に記載の方法。
【請求項42】
前記目的の配列が遺伝子編集に供されており、任意選択で、前記目的の配列が遺伝子編集によって導入された切断部位を含む、請求項31~41のいずれか一項に記載の方法。
【請求項43】
前記目的の配列のアンプリコンを増幅することが、前記目的の配列の末端でプライマー結合配列に結合する一対のPCRプライマーを用いて前記標的核酸からアンプリコンを増幅することを含む、請求項31~42のいずれか一項に記載の方法。
【請求項44】
前記標準物質が、前記目的の配列の末端にあるものと同じプライマー結合配列を含む、請求項31~43のいずれか一項に記載の方法。
【請求項45】
前記増幅後かつ前記配列決定前に、断片のライブラリーを生成することを更に含む、請求項31~44のいずれか一項に記載の方法。
【請求項46】
前記断片のライブラリーを生成することが、タグメンテーションによる、請求項31~45に記載の方法。
【請求項47】
前記バイアスプロファイルを決定するために使用される前記標準物質由来の配列決定データが、前記標準物質に含まれるUMIの固有分子数である、請求項31~46のいずれか一項に記載の方法。
【請求項48】
1つ以上のライブラリー分子を含むライブラリーにおけるDNA損傷の存在を決定する方法であって、各ライブラリー分子は、挿入部の各末端にヘアピンアダプターを有する二本鎖DNA挿入部を含み、前記方法は、
a.ライブラリー分子に含まれる前記二本鎖DNA挿入部の第1の鎖及び第2の鎖を変性することと、
b.フォワードプライマー及びリバースプライマーをライブラリー分子にアニーリングすることと、
c.ライブラリーアンプリコンを生成するために増幅することと、
d.生成されたライブラリーアンプリコンの数に基づいてDNA損傷の存在を評価することと、を含む、方法。
【請求項49】
前記フォワードプライマー及び/又は前記リバースプライマーが、一方又は両方のヘアピンアダプターに含まれる1つ以上の配列に結合する、請求項48に記載の方法。
【請求項50】
前記フォワードプライマーが、前記二本鎖DNA挿入部の第1の末端に結合した前記ヘアピンアダプターに含まれる配列に結合し、前記リバースプライマーが、前記二本鎖DNA挿入部の第2の末端に結合した前記ヘアピンアダプターに含まれる配列に結合する、請求項48又は49に記載の方法。
【請求項51】
前記生成されたライブラリーアンプリコンの数が、定量サイクル(Cq)値を測定することによって推定される、請求項48~50のいずれか一項に記載の方法。
【請求項52】
ライブラリーアンプリコンの数が多いほど、Cq値が低くなる、請求項48~51のいずれか一項に記載の方法。
【請求項53】
より低いCq値を有するライブラリーが、より少ないDNA損傷を有する、請求項48~52のいずれか一項に記載の方法。
【請求項54】
前記Cq値に基づいて前記ライブラリーの分析のための条件を決定することを更に含む、請求項51~53のいずれか一項に記載の方法。
【請求項55】
前記分析が配列決定である、請求項54に記載の方法。
【請求項56】
前記増幅することが、5kb以上、10kb以上、15kb以上、20kb以上、25kb以上、又は30kb以上であるライブラリー分子を増幅するために最適化されている、請求項48~55のいずれか一項に記載の方法。
【請求項57】
前記増幅することが、長いアンプリコンの増幅に最適化されているポリメラーゼを用いて行われる、請求項48~56のいずれか一項に記載の方法。
【請求項58】
前記ポリメラーゼが、20kb以上又は30kb以上のアンプリコンの増幅に最適化されている、請求項57に記載の方法。
【請求項59】
前記ポリメラーゼが、野生型Taqポリメラーゼと比較してより高い処理能力又は伸長速度を有する、請求項57又は58に記載の方法。
【請求項60】
前記ポリメラーゼが、処理能力又は伸長速度を増加させる1つ以上の突然変異又は融合を含む、請求項59に記載の方法。
【請求項61】
前記ポリメラーゼが、3kb/分以上の伸長速度を有する、請求項59又は60に記載の方法。
【請求項62】
前記増幅することが指数関数的である、請求項48~61のいずれか一項に記載の方法。
【請求項63】
30サイクル以上又は40サイクル以上の増幅が行われる、請求項48~62のいずれか一項に記載の方法。
【請求項64】
前記DNA損傷が、ライブラリー分子中の1つ以上のニックを含む、請求項48~63のいずれか一項に記載の方法。
【請求項65】
前記1つ以上のニックが前記挿入部内にある、請求項64に記載の方法。
【請求項66】
前記Cq値が、前記ライブラリー中のより高い割合のライブラリー分子が1つ以上のニックを含む場合により高い、請求項64又は65に記載の方法。
【請求項67】
前記DNA損傷が、ライブラリー分子中の2つ以上のニックを含み、前記ニックが、前記二本鎖DNA挿入部の同じ鎖中にある、請求項64~66のいずれか一項に記載の方法。
【請求項68】
前記DNA損傷が、ライブラリー分子中の2つ以上のニックを含み、前記ニックが、前記二本鎖DNA挿入部の両方の鎖中にある、請求項64~66のいずれか一項に記載の方法。
【請求項69】
前記ライブラリー分子が1つ以上のニックを含む場合、前記フォワードプライマー及び/又は前記リバースプライマーが、前記ライブラリー分子の完全配列に対応するアンプリコンを生成することができない、請求項48~68のいずれか一項に記載の方法。
【請求項70】
ニックを含むライブラリー分子から生成されたアンプリコンが、前記フォワードプライマー及び/又は前記リバースプライマーに結合するための配列を欠いている、請求項69に記載の方法。
【請求項71】
ニックを含むライブラリー分子が、ニックを含まないライブラリー分子と比較して、前記増幅中により少ないアンプリコンを生成する、請求項64~70のいずれか一項に記載の方法。
【請求項72】
前記フォワードプライマー及び前記リバースプライマーをアニーリングする前に、ニックから二本鎖切断を生じさせることを更に含む、請求項64~71のいずれか一項に記載の方法。
【請求項73】
前記二本鎖切断を生じさせることが、酵素反応を使用して行われる、請求項72に記載の方法。
【請求項74】
前記酵素反応がエンドヌクレアーゼによって行われる、請求項73に記載の方法。
【請求項75】
前記エンドヌクレアーゼがT7エンドヌクレアーゼである、請求項74に記載の方法。
【請求項76】
二本鎖切断を含むライブラリー分子が、前記増幅中に前記ライブラリー分子の完全配列に対応するアンプリコンを生成しない、請求項72~75のいずれか一項に記載の方法。
【請求項77】
二本鎖切断を含むライブラリー分子から生成されたアンプリコンが、前記フォワードプライマー及び/又は前記リバースプライマーに結合するための配列を欠いている、請求項72~76に記載の方法。
【請求項78】
蛍光を使用してDNAを含む試料中のDNA損傷を定量化する方法であって、
a.
i.DNAを含む試料のアリコートと、
ii.1つ以上のDNA修復酵素と、
iii.1つ以上のdNTPが蛍光標識されている、dNTPと、を組み合わせることと、
b.修復されたDNAを調製することと、
c.dNTPからリン酸を脱リン酸化することと、
d.前記修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させることと、
e.再懸濁緩衝液を用いて、前記結合した修復DNAを前記カルボキシレートビーズ又はセルロースビーズから溶出することと、
f.前記修復されたDNAの蛍光を測定して、DNA損傷の量を決定することと、を含む、方法。
【請求項79】
前記修復されたDNAのより高い蛍光が、より多いDNA損傷を示す、請求項78に記載の方法。
【請求項80】
前記修復されたDNAの蛍光が、異なる量のDNA損傷の範囲にわたって線形である、請求項78又は79に記載の方法。
【請求項81】
前記アッセイが、前記試料の操作の前後に同じ試料のアリコートを評価することによって、前記操作によって誘発されたDNA損傷を評価することができる、請求項78~80のいずれか一項に記載の方法。
【請求項82】
前記操作が、試料の配列決定である、請求項81に記載の方法。
【請求項83】
前記修復されたDNAの蛍光を測定することが、修復されたDNAの希釈物の標準曲線を作成することと、前記修復されたDNAの希釈物の蛍光を測定することと、を含む、請求項81又は82に記載の方法。
【請求項84】
前記修復されたDNAの蛍光を測定することが、前記修復されたDNAの蛍光を、蛍光標識された前記1つ以上のdNTPのみの希釈物の別個の標準曲線に対して比較し、前記修復されたDNAに含まれる蛍光色素分子の数を決定することを含む、請求項78~83のいずれか一項に記載の方法。
【請求項85】
前記決定された蛍光色素分子の数を前記修復されたDNAの質量で割ることによって、前記修復されたDNAに含まれる蛍光色素分子の正規化された数を計算することを更に含む、請求項84の方法。
【請求項86】
前記DNAが、ゲノムDNA、cDNA、又は断片化二本鎖DNAを含むライブラリーである、請求項78~85のいずれか一項に記載の方法。
【請求項87】
前記DNAが、ゲノムDNA及びcDNAであり、前記方法が、前記DNA損傷の量を決定した後にライブラリーを調製することを更に含む、請求項86の方法。
【請求項88】
前記DNA損傷の量が全ヌクレオチドの5%以下、4%以下、3%以下、2%以下、又は1%以下である場合にライブラリーが調製される、請求項87に記載の方法。
【請求項89】
前記DNA損傷の量が全ヌクレオチドの5%以上、4%以上、3%以上、2%以上、又は1%以上である場合にライブラリーが調製されない、請求項78~88のいずれか一項に記載の方法。
【請求項90】
前記蛍光を測定する前に、前記修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回以上行われる、請求項78~89のいずれか一項に記載の方法。
【請求項91】
前記蛍光を測定する前に、前記修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回行われる、請求項90に記載の方法。
【請求項92】
前記カルボキシレートビーズ又はセルロースビーズが磁性である、請求項78~91のいずれか一項に記載の方法。
【請求項93】
前記修復されたDNAを調整することが、37℃で行われる、請求項78~92のいずれか一項に記載の方法。
【請求項94】
前記修復されたDNAを調製することが、10分間以上、20分間以上、30分間以上、45分間以上、又は60分間以上行われる、請求項78~93のいずれか一項に記載の方法。
【請求項95】
前記dNTPからリン酸を脱リン酸化することが、酵素を用いて行われる、請求項78~94に記載の方法。
【請求項96】
前記dNTPからリン酸を脱リン酸化するための前記酵素が、エビアルカリホスファターゼ(SAP)又は仔ウシ腸アルカリホスファターゼ(CIP)である、請求項78~95に記載の方法。
【請求項97】
前記1つ以上のDNA修復酵素が、DNAポリメラーゼを含む、請求項78~96のいずれか一項に記載の方法。
【請求項98】
前記DNAポリメラーゼが、5’→3’ポリメラーゼ活性を有するが、5’→3’エキソヌクレアーゼ活性を欠いている、請求項97に記載の方法。
【請求項99】
前記DNAポリメラーゼが、Bst DNAポリメラーゼ、ラージフラグメントである、請求項97に記載の方法。
【請求項100】
前記1つ以上のDNA修復酵素が、リガーゼを含む、請求項78~99のいずれかに記載の方法。
【請求項101】
前記リガーゼが、Taqリガーゼである、請求項100に記載の方法。
【請求項102】
前記DNA損傷が、二本鎖DNA中のニックを含む、請求項78~101のいずれか一項に記載の方法。
【請求項103】
前記1つ以上のDNA修復酵素が、T4ピリミジンダイマーグリコシラーゼ(PDG)を含む、請求項78~102のいずれか一項に記載の方法。
【請求項104】
前記DNA損傷が、チミンダイマーを含む、請求項78~103のいずれか一項に記載の方法。
【請求項105】
前記チミンダイマーが、紫外線照射によって誘発された、請求項104に記載の方法。
【請求項106】
前記1つ以上のDNA修復酵素が、ウラシルDNAグリコシラーゼ(UDG)及び脱プリン又は脱ピリミジン部位リアーゼを含む、請求項78~105のいずれかに記載の方法。
【請求項107】
前記DNA損傷が、ウラシルを含む、請求項78~106のいずれか一項に記載の方法。
【請求項108】
前記1つ以上のDNA修復酵素が、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)及び脱プリン又は脱ピリミジン部位リアーゼを含む、請求項78~107のいずれかに記載の方法。
【請求項109】
前記DNA損傷が、酸化塩基を含む、請求項78~108に記載の方法。
【請求項110】
前記dNTPが、dATP、dGTP、dCTP、及びdTTP又はdUTPを含む、請求項78~109のいずれか一項に記載の方法。
【請求項111】
全ての前記dNTPが蛍光標識されている、請求項78~110のいずれか一項に記載の方法。
【請求項112】
dUTP及びdCTPが蛍光標識されている、請求項78~111に記載の方法。
【請求項113】
前記蛍光標識が、Alexa Fluor 488、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 633、フルオレセインイソチオシアネート(FITC)、又はテトラメチルローダミン-5-(及び6)-イソチオシアネート(TRITC)である、請求項112に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年3月29日に出願された米国特許仮出願第63/167,171号、及び2021年7月30日に出願された同第63/227,550号に対する優先権の利益を主張し、これらの各々は、任意の目的のためにその全体が参照により本明細書に組み込まれる。
【0002】
説明
本出願は、次世代配列決定(NGS)アッセイにおいてライブラリー損傷を評価し、アンプリコンサイズバイアスを正規化するための標準物質及び方法に関する。本出願はまた、蛍光を使用してDNAを含む試料中のDNA損傷を定量化することにも関する。
【背景技術】
【0003】
ゲノム編集又は腫瘍学用途における大きな挿入/欠失バリアント(インデル)を検出及び定量化するための一般的な方法は、標的化された「長いアンプリコン」PCR(LongAmp、1kb超)と、それに続く長リード配列決定又は(短リード)NGSのための短リードライブラリーへの変換を含む。しかしながら、「長い」PCR増幅におけるサイズに基づくバイアスは、大きなインデルバリアントの相対頻度を正確に定量化するプロセスを複雑にする。増幅前又は増幅中に固有分子識別子で標的DNA分子の末端にタグ付けする戦略は、同じNGSリードにおいて同定されるバリアント及びUMIを必要とする。したがって、長いアンプリコンライブラリーを用いるタグ付け方法は、長リード配列決定又は複雑な合成長リードライブラリー調製を必要とする。短リードNGSは、バリアント配列及び元のアンプリコンUMIを別々のリードに分断し得るため、短リードNGSのための増幅後ライブラリー変換工程は、このUMI末端タグ付けを不適切なものにする。
【0004】
これらの既存の方法は、アンプリコンサイズバイアスを正規化するために、様々な長さのUMI含有合成DNA対照を有する短リードNGSを組み込む。DNA対照は、標準物質及びUMIの同一性が同じNGSリードに含まれるように設計される。これらの標準物質を用いて対照アッセイを実行すること、又は各LongAmpアッセイに既知量のこれらの標準物質をスパイクインすることは、サイズに基づくPCRバイアスのバイオインフォマティクス分析を可能にし、定量化されたPCRサイズバイアスを考慮することによって、より良好に大きなインデルの頻度を推定することを容易にする。
【0005】
長リード配列決定のためのライブラリー(すなわち、長リードライブラリー)に関する別の問題は、損傷したライブラリー分子の存在である。長リードライブラリー調製の品質の評価は、後続のワークフロー工程及び配列決定の成功を予測するために使用され得る。長いライブラリー分子は、標準的なワークフローの間に容易にニック形成又は損傷され得、その結果アダプター配列と関連しないライブラリー分子を生じ、したがって、配列決定などのアダプターを必要とするワークフローにおいて使用できない。ライブラリー調製工程は、ピペッティング、保存、又は他の取り扱い及び/若しくは手技的エラーのいずれかによって、DNAを損傷し得る。ニックの入ったDNAが、5’アダプター及び3’アダプターの両方を必要とするライブラリー調製を経る場合、ニックの入ったDNAは、下流の工程において使用不可能である。したがって、考慮されないライブラリー損傷は、ライブラリー濃度の不正確な推定、不十分な配列決定カバレッジ、及び全体的に不十分な配列決定アッセイ基準を引き起こし得る。
【0006】
ライブラリー調製中に損傷していないライブラリー分子を正確に定量するためのライブラリー品質管理(QC)法は、この問題を解決するのに役立ち得る。本明細書に記載される定量PCR(qPCR)QC法は、不正確な濃度のライブラリーによって後続のワークフロー工程を進めることを回避するために、ライブラリー調製品質を評価する。したがって、これらの方法は、ユーザーの時間、予算、並びに試薬及び他の消耗品の損失を回避することができる。
【0007】
更に、環境、試料の調製及び処理、又は保存条件由来のDNA損傷は、ライブラリー調製品質の一貫性に顕著に影響し得る。例えば、配列決定プロセスの間、配列決定サイクル間の低波長レーザー及び他の化学物質への曝露によるDNA損傷の蓄積は、配列決定の誤り率を増加させ得る。ユーザーは、この損傷の評価を望み得る。蛍光を使用してDNA損傷を定量化する方法が本明細書に記載される。蛍光を使用してDNA損傷を定量化するために開発された他のアッセイ(例えば、米国特許出願公開第2014/0030705号、国際公開第2010028388号、及び米国特許出願公開第20090042205号)は、取り込まれていない蛍光ヌクレオチドの非特異的結合におそらく部分的に起因する低いシグナル対ノイズ比によって妨げられてきた。DNA損傷を測定する本発明の方法は、dNTPの脱リン酸化の工程と、カルボキシレート又はセルロースビーズから修復されたDNAの結合/溶出の工程とを組み込み、シグナルを改善し、アッセイのより大きなダイナミックレンジを可能にする。
【発明の概要】
【0008】
異なる長さの核酸標準物質のプールが本明細書に記載され、核酸標準物質は、固有分子識別子(UMI)、並びに、
5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、UMIと5’ユニバーサルオリゴヌクレオチドとの間、及び/又は、UMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域と、を含み、
少なくとも1つの領域の長さは、標準物質の長さを決定する。また、ライブラリーの品質管理の方法も本明細書に記載される。
【0009】
実施形態1.異なる長さの核酸標準物質のプールであって、核酸標準物質は、固有分子識別子(UMI)、並びに、
a.5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、
b.3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、
c.UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域と、を含み、
少なくとも1つの領域の長さは、標準物質の長さを決定する、標準物質のプール。
【0010】
実施形態2.プールが、UMI、並びに、
a.5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、
b.3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、を含む、更なる核酸標準物質を更に含み、
更なる核酸標準物質は、UMIと5’ユニバーサルオリゴヌクレオチドとの間又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域を含まない、実施形態1に記載の標準物質のプール。
【0011】
実施形態3.UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域が、0.2kb~10kbを含む、実施形態1に記載の標準物質のプール。
【0012】
実施形態4.5’ユニバーサルオリゴヌクレオチド及び/又は3’ユニバーサルオリゴヌクレオチドがそれぞれ、目的の配列から増幅されたアンプリコンを含む、実施形態1~3のいずれか1つに記載の標準物質のプール。
【0013】
実施形態5.UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域がそれぞれ、目的の配列から増幅されたアンプリコンを含む、実施形態1又は3~4のいずれか1つに記載の標準物質のプール。
【0014】
実施形態6.UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域がそれぞれ、任意の配列を含む、実施形態1又は3~5のいずれか1つに記載の標準物質のプール。
【0015】
実施形態7.異なる長さの核酸標準物質のプールであって、核酸標準物質は、UMI、並びに、
a.5’部分的重複オリゴヌクレオチドであって、5’部分的重複オリゴヌクレオチドは、全ての標準物質についてその配列の少なくとも一部にわたって同一である、5’部分的重複オリゴヌクレオチド、及び/又は、
b.3’部分的重複オリゴヌクレオチドであって、3’部分的重複オリゴヌクレオチドは、全ての標準物質についてその配列の少なくとも一部にわたって同一である、3’部分的重複オリゴヌクレオチド、を含み、
5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドの長さは、標準物質の長さを決定する、標準物質のプール。
【0016】
実施形態8.
a.5’部分的重複オリゴヌクレオチドが、目的の配列の少なくとも第1の部分を含み、
b.3’部分的重複オリゴヌクレオチドが、目的の配列の少なくとも第2の部分を含む、実施形態7に記載の標準物質のプール。
【0017】
実施形態9.5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドがそれぞれ、目的の配列よりも20bp~1kb小さい配列を含む、実施形態7~8のいずれか1つに記載の標準物質のプール。
【0018】
実施形態10.5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドがそれぞれ、目的の配列から増幅されたアンプリコンを含む、実施形態7~9のいずれか1つに記載の標準物質のプール。
【0019】
実施形態11.標準物質が、二本鎖核酸を含む、実施形態1~10のいずれか1つに記載の標準物質のプール。
【0020】
実施形態12.標準物質が、二本鎖DNAを含む、実施形態1~11のいずれか1つに記載の標準物質のプール。
【0021】
実施形態13.各標準物質が異なるUMIを含む、実施形態1~12のいずれか1つに記載の標準物質のプール。
【0022】
実施形態14.標準物質のプールに含まれるUMIが、16~20塩基対を含む配列のランダムセットである、実施形態1~13のいずれか1つに記載の標準物質のプール。
【0023】
実施形態15.標準物質のプールに含まれるUMIが、18塩基対を含む配列のランダムセットである、実施形態14に記載の標準物質のプール。
【0024】
実施形態16.標準物質のプールが、1×1010以上、10×1010以上、又は100×1010以上の標準物質を含み、各標準物質が異なるUMIを含む、実施形態1~15のいずれか1つに記載の標準物質のプール。
【0025】
実施形態17.プール中の標準物質の数が、増幅反応によって生成されるアンプリコンの数より多い、実施形態1~16のいずれか1つに記載の標準物質のプール。
【0026】
実施形態18.標準物質のプールであって、標準物質の少なくとも第1の部分は、実施形態1~6又は11~17のいずれか1つに由来し、標準物質の少なくとも第2の部分は、実施形態7~17のいずれか1つに由来する、標準物質のプール。
【0027】
実施形態19.核酸標準物質のプールを生成する方法であって、
a.核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、
b.それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、
c.様々な長さの一連の挿入オリゴヌクレオチドを提供することと、
d.(a)の少なくとも1つの目的の配列、(b)のUMIを含む少なくとも1つのオリゴヌクレオチド、及び(c)の少なくとも1つの挿入アンプリコンをライゲーションして、核酸標準物質のプールの複数の核酸標準物質を生成することと、を含む、方法。
【0028】
実施形態20.少なくとも1つの目的の配列及び/又は挿入オリゴヌクレオチドが、増幅によって調製される、実施形態19に記載の方法。
【0029】
実施形態21.目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドが、制限酵素切断部位を含む、実施形態19又は実施形態20に記載の方法。
【0030】
実施形態22.制限酵素切断部位が、目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドの5’末端及び/又は3’末端の近位にある、実施形態21に記載の方法。
【0031】
実施形態23.方法が、目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドを制限酵素で切断することをライゲーションの前に更に含む、実施形態21又は実施形態22に記載の方法。
【0032】
実施形態24.制限酵素により切断することが、ライゲーションのための付着末端を生成する、実施形態23に記載の方法。
【0033】
実施形態25.核酸標準物質のプールを生成する方法であって、
a.核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、
b.それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、
c.(a)の少なくとも1つの目的の配列と(b)のUMIを含む少なくとも1つのオリゴヌクレオチドをライゲーションすることと、を含む、方法。
【0034】
実施形態26.少なくとも1つの目的の配列が、増幅によって調製される、実施形態25に記載の方法。
【0035】
実施形態27.目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドが、制限酵素切断部位を含む、実施形態25又は実施形態26に記載の方法。
【0036】
実施形態28.制限酵素切断部位が、目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドの5’末端及び/又は3’末端の近位にある、実施形態27に記載の方法。
【0037】
実施形態29.方法が、目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドを制限酵素で切断することをライゲーションの前に更に含む、実施形態27~28に記載の方法。
【0038】
実施形態30.制限酵素により切断することが、ライゲーションのための付着末端を生成する、実施形態29に記載の方法。
【0039】
実施形態31.アンプリコンサイズバイアスを正規化する方法であって、
a.標的核酸を含む試料を、異なる長さの核酸標準物質のプールと組み合わせることであって、各標準物質はUMIを含む、ことと、
b.標準物質及び標的核酸に含まれる目的の配列のアンプリコンを増幅することと、
c.標準物質及び目的の配列のアンプリコンを配列決定して、配列決定データを生成することと、
d.標準物質由来の配列決定データを使用して、アンプリコンサイズに基づいてバイアスプロファイルを決定することと、
e.バイアスプロファイルを使用して、アンプリコンサイズバイアスを正規化することと、を含む、方法。
【0040】
実施形態32.核酸標準物質のプール中の標準物質が、0.2kb~20kb塩基対の範囲である、実施形態31に記載の方法。
【0041】
実施形態33.核酸標準物質のプール中に含まれる各標準物質が、異なるUMIを含む、実施形態31又は実施形態32に記載の方法。
【0042】
実施形態34.標準物質のプールに含まれるUMIが、16~20塩基対を含む配列のランダムセットである、実施形態31~33に記載の方法。
【0043】
実施形態35.標準物質のプールに含まれるUMIが、18塩基対を含む配列のランダムセットである、実施形態31~34に記載の方法。
【0044】
実施形態36.標準物質のプールが、1×1010以上、10×1010以上、又は100×1010以上の標準物質を含み、各標準物質が異なるUMIを含む、実施形態31~35のいずれか1つに記載の方法。
【0045】
実施形態37.標準物質のプール中の標準物質の数が、増幅によって生成されるアンプリコンの数より多い、実施形態31~36のいずれか1つに記載の方法。
【0046】
実施形態38.核酸標準物質のプールが、実施形態1~18のいずれか1つに記載の核酸標準物質のプールを含む、実施形態31~37のいずれか1つに記載の方法。
【0047】
実施形態39.核酸標準物質のプールが、実施形態1~6又は11~17のいずれか1つに記載の核酸標準物質のプールを含む第1の部分と、実施形態7~17のいずれか1つに記載の核酸標準物質のプールを含む第2の部分と、を含む、実施形態31~37のいずれか1つに記載の方法。
【0048】
実施形態40.目的の配列が、目的の配列の5’末端及び/若しくは3’末端にない、又は目的の配列の5’末端及び/若しくは3’末端に近接していない制限酵素切断部位を含む、実施形態31~39のいずれか1つに記載の方法。
【0049】
実施形態41.目的の配列が、挿入又は欠失変異を含み得る、実施形態31~40のいずれか1つに記載の方法。
【0050】
実施形態42.目的の配列が遺伝子編集に供されており、任意選択で、目的の配列が遺伝子編集によって導入された切断部位を含む、実施形態31~41のいずれか1つに記載の方法。
【0051】
実施形態43.目的の配列のアンプリコンを増幅することが、目的の配列の末端でプライマー結合配列に結合する一対のPCRプライマーを用いて標的核酸からアンプリコンを増幅することを含む、実施形態31~42のいずれか1つに記載の方法。
【0052】
実施形態44.標準物質が、目的の配列の末端にあるものと同じプライマー結合配列を含む、実施形態31~43のいずれか1つに記載の方法。
【0053】
実施形態45.増幅後かつ配列決定前に、断片のライブラリーを生成することを更に含む、実施形態31~44のいずれか1つに記載の方法。
【0054】
実施形態46.断片のライブラリーを生成することが、タグメンテーションによる、実施形態31~45のいずれか1つに記載の方法。
【0055】
実施形態47.バイアスプロファイルを決定するために使用される標準物質由来の配列決定データが、標準物質に含まれるUMIの固有分子数である、実施形態31~46のいずれか1つに記載の方法。
【0056】
実施形態48.1つ以上のライブラリー分子を含むライブラリーにおけるDNA損傷の存在を決定する方法であって、各ライブラリー分子は、挿入部の各末端にヘアピンアダプターを有する二本鎖DNA挿入部を含み、方法は、
a.ライブラリー分子に含まれる二本鎖DNA挿入部の第1の鎖及び第2の鎖を変性することと、
b.フォワードプライマー及びリバースプライマーをライブラリー分子にアニーリングすることと、
c.ライブラリーアンプリコンを生成するために増幅することと、
d.生成されたライブラリーアンプリコンの数に基づいてDNA損傷の存在を評価することと、を含む、方法。
【0057】
実施形態49.フォワードプライマー及び/又はリバースプライマーが、一方又は両方のヘアピンアダプターに含まれる1つ以上の配列に結合する、実施形態48に記載の方法。
【0058】
実施形態50.フォワードプライマーが、二本鎖DNA挿入部の第1の末端に結合したヘアピンアダプターに含まれる配列に結合し、リバースプライマーが、二本鎖DNA挿入部の第2の末端に結合したヘアピンアダプターに含まれる配列に結合する、実施形態48又は実施形態49に記載の方法。
【0059】
実施形態51.生成されたライブラリーアンプリコンの数が、定量サイクル(cycle of quantification、Cq)値を測定することによって推定される、実施形態48~50のいずれか1つに記載の方法。
【0060】
実施形態52.ライブラリーアンプリコンの数が多いほど、Cq値が低くなる、実施形態48~51のいずれか1つに記載の方法。
【0061】
実施形態53.より低いCq値を有するライブラリーが、より少ないDNA損傷を有する、実施形態48~52のいずれか1つに記載の方法。
【0062】
実施形態54.Cq値に基づいてライブラリーの分析のための条件を決定することを更に含む、実施形態51~53のいずれか1つに記載の方法。
【0063】
実施形態55.分析が配列決定である、実施形態54に記載の方法。
【0064】
実施形態56.増幅することが、5kb以上、10kb以上、15kb以上、20kb以上、25kb以上、又は30kb以上であるライブラリー分子を増幅するために最適化されている、実施形態48~55のいずれか1つに記載の方法。
【0065】
実施形態57.増幅することが、長いアンプリコンの増幅に最適化されているポリメラーゼを用いて行われる、実施形態48~56のいずれか1つに記載の方法。
【0066】
実施形態58.ポリメラーゼが、20kb以上又は30kb以上のアンプリコンの増幅に最適化されている、実施形態57に記載の方法。
【0067】
実施形態59.ポリメラーゼが、野生型Taqポリメラーゼと比較してより高い処理能力又は伸長速度を有する、実施形態57又は実施形態58に記載の方法。
【0068】
実施形態60.ポリメラーゼが、処理能力又は伸長速度を増加させる1つ以上の突然変異又は融合を含む、実施形態59に記載の方法。
【0069】
実施形態61.ポリメラーゼが、3kb/分より高い伸長速度を有する、実施形態59又は実施形態60に記載の方法。
【0070】
実施形態62.増幅することが指数関数的である、実施形態48~61のいずれか1つに記載の方法。
【0071】
実施形態63.30サイクル以上又は40サイクル以上の増幅が行われる、実施形態48~62のいずれか1つに記載の方法。
【0072】
実施形態64.DNA損傷が、ライブラリー分子中の1つ以上のニックを含む、実施形態48~63のいずれか1つに記載の方法。
【0073】
実施形態65.1つ以上のニックが挿入部内にある、実施形態64に記載の方法。
【0074】
実施形態66.Cq値が、ライブラリー中のより高い割合のライブラリー分子が1つ以上のニックを含む場合により高い、実施形態64又は実施形態65に記載の方法。
【0075】
実施形態67.DNA損傷が、ライブラリー分子中の2つ以上のニックを含み、ニックが、二本鎖DNA挿入部の同じ鎖中にある、実施形態64~66のいずれか1つに記載の方法。
【0076】
実施形態68.DNA損傷が、ライブラリー分子中の2つ以上のニックを含み、ニックが、二本鎖DNA挿入部の両方の鎖中にある、実施形態64~66のいずれか1つに記載の方法。
【0077】
実施形態69.ライブラリー分子が1つ以上のニックを含む場合、フォワードプライマー及び/又はリバースプライマーが、ライブラリー分子の完全配列に対応するアンプリコンを生成することができない、実施形態48~68のいずれか1つに記載の方法。
【0078】
実施形態70.ニックを含むライブラリー分子から生成されたアンプリコンが、フォワードプライマー及び/又はリバースプライマーに結合するための配列を欠いている、実施形態69に記載の方法。
【0079】
実施形態71.ニックを含むライブラリー分子が、ニックを含まないライブラリー分子と比較して、増幅中により少ないアンプリコンを生成する、実施形態64~70のいずれか1つに記載の方法。
【0080】
実施形態72.フォワードプライマー及びリバースプライマーをアニーリングする前に、ニックから二本鎖切断を生じさせることを更に含む、実施形態64~71のいずれか1つに記載の方法。
実施形態73.二本鎖切断を生じさせることが、酵素反応を使用して行われる、実施形態72に記載の方法。
【0081】
実施形態74.酵素反応がエンドヌクレアーゼによって行われる、実施形態73に記載の方法。
【0082】
実施形態75.エンドヌクレアーゼがT7エンドヌクレアーゼである、実施形態74に記載の方法。
【0083】
実施形態76.二本鎖切断を含むライブラリー分子が、増幅中にライブラリー分子の完全配列に対応するアンプリコンを生成しない、実施形態72~75のいずれか1つに記載の方法。
【0084】
実施形態77.二本鎖切断を含むライブラリー分子から生成されたアンプリコンが、フォワードプライマー及び/又はリバースプライマーに結合するための配列を欠いている、実施形態72~76に記載の方法。
【0085】
実施形態78.蛍光を使用してDNAを含む試料中のDNA損傷を定量化する方法であって、
a.
i.DNAを含む試料のアリコートと、
ii.1つ以上のDNA修復酵素と、
iii.1つ以上のdNTPが蛍光標識されている、dNTPと、を組み合わせることと、
b.修復されたDNAを調製することと、
c.dNTPからリン酸を脱リン酸化することと、
d.修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させることと、
e.再懸濁緩衝液を用いて、結合した修復DNAをカルボキシレートビーズ又はセルロースビーズから溶出することと、
f.修復されたDNAの蛍光を測定して、DNA損傷の量を決定することと、を含む、方法。
【0086】
実施形態79.修復されたDNAのより高い蛍光が、より多いDNA損傷を示す、実施形態78に記載の方法。
【0087】
実施形態80.修復されたDNAの蛍光が、異なる量のDNA損傷の範囲にわたって線形である、実施形態78又は実施形態79に記載の方法。
【0088】
実施形態81.アッセイが、試料の操作の前後に同じ試料のアリコートを評価することによって、操作によって誘発されたDNA損傷を評価することができる、実施形態78~80のいずれか1つに記載の方法。
実施形態82.操作が、試料の配列決定である、実施形態81に記載の方法。
【0089】
実施形態83.修復されたDNAの蛍光を測定することが、修復されたDNAの希釈物の標準曲線を作成することと、修復されたDNAの希釈物の蛍光を測定することと、を含む、実施形態81又は実施形態82に記載の方法。
【0090】
実施形態84.修復されたDNAの蛍光を測定することが、修復されたDNAの蛍光を、蛍光標識された1つ以上のdNTPのみの希釈物の別個の標準曲線に対して比較し、修復されたDNAに含まれる蛍光色素分子の数を決定することを含む、実施形態78~83のいずれか1つに記載の方法。
【0091】
実施形態85.決定された蛍光色素分子の数を修復されたDNAの質量で割ることによって、修復されたDNAに含まれる蛍光色素分子の正規化された数を計算することを更に含む、実施形態84の方法。
【0092】
実施形態86.DNAが、ゲノムDNA、cDNA、又は断片化二本鎖DNAを含むライブラリーである、実施形態78~85のいずれか1つに記載の方法。
【0093】
実施形態87.DNAが、ゲノムDNA及びcDNAであり、方法が、DNA損傷の量を決定した後にライブラリーを調製することを更に含む、実施形態86の方法。
【0094】
実施形態88.DNA損傷の量が全ヌクレオチドの5%以下、4%以下、3%以下、2%以下、又は1%以下である場合にライブラリーが調製される、実施形態87に記載の方法。
【0095】
実施形態89.DNA損傷の量が全ヌクレオチドの5%以上、4%以上、3%以上、2%以上、又は1%以上である場合にライブラリーが調製されない、実施形態78~88のいずれか1つに記載の方法。
【0096】
実施形態90.蛍光を測定する前に、修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回以上行われる、実施形態78~89のいずれか1つに記載の方法。
【0097】
実施形態91.蛍光を測定する前に、修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回行われる、実施形態90に記載の方法。
【0098】
実施形態92.カルボキシレートビーズ又はセルロースビーズが磁性である、実施形態78~91のいずれか1つに記載の方法。
【0099】
実施形態93.修復されたDNAを調整することが、37℃で行われる、実施形態78~92のいずれか1つに記載の方法。
【0100】
実施形態94.修復されたDNAを調製することが、10分間以上、20分間以上、30分間以上、45分間以上、又は60分間以上行われる、実施形態78~93のいずれか1つに記載の方法。
【0101】
実施形態95.dNTPからリン酸を脱リン酸化することが、酵素を用いて行われる、実施形態78~94に記載の方法。
【0102】
実施形態96.dNTPからリン酸を脱リン酸化するための酵素が、エビアルカリホスファターゼ(SAP)又は仔ウシ腸アルカリホスファターゼ(CIP)である、実施形態78~95に記載の方法。
【0103】
実施形態97.1つ以上のDNA修復酵素が、DNAポリメラーゼを含む、実施形態78~96のいずれか1つに記載の方法。
【0104】
実施形態98.DNAポリメラーゼが、5’-3’ポリメラーゼ活性を有するが、5’ -3’エキソヌクレアーゼ活性を欠いている、実施形態97に記載の方法。
【0105】
実施形態99.DNAポリメラーゼが、Bst DNAポリメラーゼ、ラージフラグメントである、実施形態97に記載の方法。
【0106】
実施形態100.1つ以上のDNA修復酵素が、リガーゼを含む、実施形態78~99のいずれかに記載の方法。
【0107】
実施形態101.リガーゼが、Taqリガーゼである、実施形態100に記載の方法。
【0108】
実施形態102.DNA損傷が、二本鎖DNA中のニックを含む、実施形態78~101のいずれか1つに記載の方法。
【0109】
実施形態103.1つ以上のDNA修復酵素が、T4ピリミジンダイマーグリコシラーゼ(PDG)を含む、実施形態78~102のいずれか1つに記載の方法。
【0110】
実施形態104.DNA損傷が、チミンダイマーを含む、実施形態78~103のいずれか1つに記載の方法。
【0111】
実施形態105.チミンダイマーが、紫外線照射によって誘発された、実施形態104に記載の方法。
【0112】
実施形態106.1つ以上のDNA修復酵素が、ウラシルDNAグリコシラーゼ(UDG)及び脱プリン又は脱ピリミジン部位リアーゼを含む、実施形態78~105のいずれかに記載の方法。
【0113】
実施形態107.DNA損傷が、ウラシルを含む、実施形態78~106のいずれか1つに記載の方法。
【0114】
実施形態108.1つ以上のDNA修復酵素が、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)及び脱プリン又は脱ピリミジン部位リアーゼを含む、実施形態78~107のいずれかに記載の方法。
【0115】
実施形態109.DNA損傷が、酸化塩基を含む、実施形態78~108に記載の方法。
【0116】
実施形態110.dNTPが、dATP、dGTP、dCTP、及びdTTP又はdUTPを含む、実施形態78~109のいずれか1つに記載の方法。
【0117】
実施形態111.全てのdNTPが蛍光標識されている、実施形態78~110のいずれか1つに記載の方法。
【0118】
実施形態112.dUTP及びdCTPが蛍光標識されている、実施形態78~111に記載の方法。
【0119】
実施形態113.蛍光標識が、Alexa Fluor 488、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 633、フルオレセインイソチオシアネート(FITC)、又はテトラメチルローダミン-5-(及び6)-イソチオシアネート(TRITC)である、実施形態112に記載の方法。
【0120】
追加の目的及び利点は、以下の説明において部分的に記載され、一部は説明から明白であるか、又は実践によって習得され得る。目的及び利点は、添付の特許請求の範囲において特に指摘される要素及び組み合わせによって実現及び達成されるであろう。
【0121】
前述の一般的な説明及び以下の詳細な説明はいずれも例示的かつ説明的のみであり、特許請求の範囲を限定するものではないことを理解されたい。
【0122】
本明細書に組み込まれ、本明細書の一部を構成する添付図面は、1つの(いくつかの)実施形態を図解し、明細書とともに本明細書に記載される原理を説明する役割を果たす。
【図面の簡単な説明】
【0123】
図1】大きなインデル検出のための代表的な標準的方法を示す。このような方法は、長いアンプリコン(約10kb)に最適化されたPCR条件を用いた、切断部位の周りの低サイクルPCR(低サイクル、約1kb野生型アンプリコン)を伴う。増幅後、Nexteraライブラリー調製(LP)をPCRアンプリコンに対して行う。アンプリコン分析は、「デノボ」アンプリコンアセンブリ及び固有の遺伝子編集事象(すなわち、固有のアンプリコンを生成する事象)の定量化を含む。
図2A】ユニバーサルUMI二本鎖(ds)DNAオリゴヌクレオチドを使用して調製できる長い増幅(LongAmp)挿入対照を要約する。UMI dsDNAオリゴヌクレオチドは、商業的に供給され得る(Integrated DNA TechnologiesのgBlock遺伝子断片など)(A)。このオリゴヌクレオチドを用いて、LongAmp挿入対照を調製することができる(B)。RS(RS1などの)は、制限部位を指す。N18は、18個のランダムヌクレオチドを含むUMI配列を指す。LA-fwd及びLA-revは、それぞれ、LongAmp反応のためのフォワードプライマー及びリバースプライマーを指す。対照1、2、3、及びnは、それぞれ0.2kb、1kb、2kb、及び10kbの挿入部を含む。10kb標準物質の明るい領域は、この標準物質が縮尺通りに描かれていないことを示す。
図2B】ユニバーサルUMI二本鎖(ds)DNAオリゴヌクレオチドを使用して調製できる長い増幅(LongAmp)挿入対照を要約する。UMI dsDNAオリゴヌクレオチドは、商業的に供給され得る(Integrated DNA TechnologiesのgBlock遺伝子断片など)(A)。このオリゴヌクレオチドを用いて、LongAmp挿入対照を調製することができる(B)。RS(RS1などの)は、制限部位を指す。N18は、18個のランダムヌクレオチドを含むUMI配列を指す。LA-fwd及びLA-revは、それぞれ、LongAmp反応のためのフォワードプライマー及びリバースプライマーを指す。対照1、2、3、及びnは、それぞれ0.2kb、1kb、2kb、及び10kbの挿入部を含む。10kb標準物質の明るい領域は、この標準物質が縮尺通りに描かれていないことを示す。
図3】上流ユニバーサルPCRアダプターアンプリコン及び下流ユニバーサルPCRアダプターアンプリコンを生成する方法を示す。これらのアンプリコンは、それぞれ、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドとして使用され得る。RS1及びRS2を含み、目的の標的配列の5’領域又は3’領域中の相補鎖に結合するプライマーを使用して、それぞれLA-ampフォワードプライマー及びリバースプライマーを用い(例えば、上流アンプリコン用のLA-fwd/RS1プライマー及び下流アンプリコン用のLA-rev/RS2を用い)、上流ユニバーサルPCRアダプターアンプリコン(5’領域)及び下流ユニバーサルPCRアダプターアンプリコン(3’領域)を生成できる。示される「切断部位」は、遺伝子編集(例えば、CRISPR Cas系を用いる)を介して代表的な目的の配列に導入された切断部位を指し、挿入及び欠失は、遺伝子編集に使用されるそのような切断部位の周囲でしばしば起こり得る。他の目的の配列(例えば、挿入/欠失変異について評価されているがん患者由来の試料に含まれる配列)は、導入された切断部位を持たない。
図4】テール付加PCRプライマーを用いて異なるサイズの挿入アンプリコンを調製する方法を示す。この方法は、制限酵素切断部位(RS)の配列を含み、目的の配列内のプライマー結合配列に結合する2つのプライマーのセット(すなわち、示される、2つのプライマー、例えばRS1/RS3配列を含むもの、又は2つのプライマー、例えばRS2/RS4を含むもの)を使用する。挿入アンプリコンのサイズ及び挿入アンプリコンは、目的の配列とのプライマー結合部位に基づくプライマーの選択によって制御することができる。この図において、上流は、目的の配列の5’部分における配列を指し、下流は、目的の配列の3’部分における配列を指す。挿入アンプリコン対は、上流挿入アンプリコン及び下流挿入アンプリコンを指し得る。10kb標準物質の明るい領域は、この標準物質が縮尺通りに描かれていないことを示す。
図5】欠失標準物質を作製する方法を示す。目的の配列の相補鎖上のRS3及びRS4に結合するプライマーは、LA-ampフォワードプライマー及びLA-ampリバースプライマー(例えば、LA-fwd/RS3プライマー又はLA-rev/RS4)を使用する欠失アンプリコンの生成に使用され得る。欠失アンプリコン対は、上流欠失アンプリコン及び下流欠失アンプリコンを指し得る。次いで、RS3及びRS4に対応する制限部位を使用して、切断されたアンプリコンをユニバーサルUMI dsDNAオリゴヌクレオチド(図6Aに示す)にライゲーションするための適切な末端を生成し、図6Bに示すLongAmp欠失標準物質を生成することができる。
図6A】ユニバーサルUMI二本鎖(ds)DNAオリゴヌクレオチドを使用して調製できる長い増幅(LongAmp)欠失対照を要約する。UMI dsDNAオリゴヌクレオチドは、商業的に供給され得る(Integrated DNA TechnologiesのgBlock遺伝子断片など)(A)。このオリゴヌクレオチドを用いて、LongAmp欠失標準物質を調製することができる(B)。対照1、2、3、及びnは、それぞれ、-20塩基対(bp)、-50bp、又は約-1kbの欠失部を含む。
図6B】ユニバーサルUMI二本鎖(ds)DNAオリゴヌクレオチドを使用して調製できる長い増幅(LongAmp)欠失対照を要約する。UMI dsDNAオリゴヌクレオチドは、商業的に供給され得る(Integrated DNA TechnologiesのgBlock遺伝子断片など)(A)。このオリゴヌクレオチドを用いて、LongAmp欠失標準物質を調製することができる(B)。対照1、2、3、及びnは、それぞれ、-20塩基対(bp)、-50bp、又は約-1kbの欠失部を含む。
図7】UMI配列の重複を回避するためにLongAmp反応において存在し得る対照入力の質量を示す。
図8A】異なる長さの核酸標準物質のプールに含まれ得る代表的な個々の標準物質を示す。これらの標準物質は全て、UMI、並びにLA-rev及びLA-fwdプライマー結合配列を含み得る。以下の表1は、標準物質に含まれる標識領域及びオリゴヌクレオチドについての説明を提供する。完全長標準物質は、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含み得る(100及び101)(A)。挿入標準物質は、5’ユニバーサルオリゴヌクレオチド、3’ユニバーサルオリゴヌクレオチド、並びにUMIと5’ユニバーサルオリゴヌクレオチドとの間の領域及びUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域を含み得る(100、101、並びに102及び103)(B)。挿入標準物質はまた、UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域のいずれかを含み得るが、両方の領域を含まない(100、101、及び103を含むが102を含まない8Bの下部標準物質に示される)。欠失標準物質は、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドを含み得る(104及び105)(C)。欠失標準物質は、5’部分的重複オリゴヌクレオチド又は3’部分的重複オリゴヌクレオチドのいずれかを含み得るが、両方を含まない(104を含むが105を含まない8Cの下部標準物質に示される)。本明細書に記載されるように、核酸標準物質のプールは、本明細書に示される任意の又は全ての異なる種類の標準物質を含み得る。
図8B】異なる長さの核酸標準物質のプールに含まれ得る代表的な個々の標準物質を示す。これらの標準物質は全て、UMI、並びにLA-rev及びLA-fwdプライマー結合配列を含み得る。以下の表1は、標準物質に含まれる標識領域及びオリゴヌクレオチドについての説明を提供する。完全長標準物質は、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含み得る(100及び101)(A)。挿入標準物質は、5’ユニバーサルオリゴヌクレオチド、3’ユニバーサルオリゴヌクレオチド、並びにUMIと5’ユニバーサルオリゴヌクレオチドとの間の領域及びUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域を含み得る(100、101、並びに102及び103)(B)。挿入標準物質はまた、UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域のいずれかを含み得るが、両方の領域を含まない(100、101、及び103を含むが102を含まない8Bの下部標準物質に示される)。欠失標準物質は、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドを含み得る(104及び105)(C)。欠失標準物質は、5’部分的重複オリゴヌクレオチド又は3’部分的重複オリゴヌクレオチドのいずれかを含み得るが、両方を含まない(104を含むが105を含まない8Cの下部標準物質に示される)。本明細書に記載されるように、核酸標準物質のプールは、本明細書に示される任意の又は全ての異なる種類の標準物質を含み得る。
図8C】異なる長さの核酸標準物質のプールに含まれ得る代表的な個々の標準物質を示す。これらの標準物質は全て、UMI、並びにLA-rev及びLA-fwdプライマー結合配列を含み得る。以下の表1は、標準物質に含まれる標識領域及びオリゴヌクレオチドについての説明を提供する。完全長標準物質は、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含み得る(100及び101)(A)。挿入標準物質は、5’ユニバーサルオリゴヌクレオチド、3’ユニバーサルオリゴヌクレオチド、並びにUMIと5’ユニバーサルオリゴヌクレオチドとの間の領域及びUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域を含み得る(100、101、並びに102及び103)(B)。挿入標準物質はまた、UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域のいずれかを含み得るが、両方の領域を含まない(100、101、及び103を含むが102を含まない8Bの下部標準物質に示される)。欠失標準物質は、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドを含み得る(104及び105)(C)。欠失標準物質は、5’部分的重複オリゴヌクレオチド又は3’部分的重複オリゴヌクレオチドのいずれかを含み得るが、両方を含まない(104を含むが105を含まない8Cの下部標準物質に示される)。本明細書に記載されるように、核酸標準物質のプールは、本明細書に示される任意の又は全ての異なる種類の標準物質を含み得る。
【0124】
【表1】

図9】長いライブラリーにおいてDNA損傷を評価するための定量的PCR(qPCR)アッセイを要約する。このアッセイは、ライブラリー分子に含まれるヘアピンアダプター内の配列に結合するフォワードプライマー及びリバースプライマーを使用する。DNA損傷(例えば、ニック)を含まないライブラリーは、より多くのシグナルを生成する(すなわち、より多くの完全長アンプリコンを産生する)。図に示すように、例示的なアッセイは、LongAmp PCRに最適化されたポリメラーゼ(例えば、PrimeStar GXL DNAポリメラーゼ、Takara)を用いた指数関数的増幅を含み得る。
図10A】異なる濃度のニッカーゼで処理されたライブラリーに対するQCアッセイによる平均定量サイクル(Cq)及び損傷%の結果を示す。10ngのライブラリーについてのCq(A)及び損傷%(B)の結果、並びに20ngのライブラリーについてのCq(C)及び損傷%(D)の結果を示す。
図10B】異なる濃度のニッカーゼで処理されたライブラリーに対するQCアッセイによる平均定量サイクル(Cq)及び損傷%の結果を示す。10ngのライブラリーについてのCq(A)及び損傷%(B)の結果、並びに20ngのライブラリーについてのCq(C)及び損傷%(D)の結果を示す。
図10C】異なる濃度のニッカーゼで処理されたライブラリーに対するQCアッセイによる平均定量サイクル(Cq)及び損傷%の結果を示す。10ngのライブラリーについてのCq(A)及び損傷%(B)の結果、並びに20ngのライブラリーについてのCq(C)及び損傷%(D)の結果を示す。
図10D】異なる濃度のニッカーゼで処理されたライブラリーに対するQCアッセイによる平均定量サイクル(Cq)及び損傷%の結果を示す。10ngのライブラリーについてのCq(A)及び損傷%(B)の結果、並びに20ngのライブラリーについてのCq(C)及び損傷%(D)の結果を示す。
図11】例えばVibrio vulnificusヌクレアーゼ(VVN)とT7エンドヌクレアーゼ変異体との組み合わせを用いるなどの、ライブラリー分子中のニックを二本鎖切断に変換する方法の結果を示す。Endo=エンドヌクレアーゼ。
図12A】ライブラリーに対するエンドヌクレアーゼ変異体での処理の有無によるCq値の差を要約する。(A)Cq値の概要。(B)TapeStation(登録商標)、Agilentを使用した自動電気泳動結果の概要。
図12B】ライブラリーに対するエンドヌクレアーゼ変異体での処理の有無によるCq値の差を要約する。(A)Cq値の概要。(B)TapeStation(登録商標)、Agilentを使用した自動電気泳動結果の概要。
図13A】SMRTbell鋳型を定量的PCR(qPCR)で評価し、次いでPacBio Sequel 2システムで配列決定して、qPCR Cqが配列決定基準と相関するかどうかを決定した際の結果を示す。試料を最も低いCqから最も高いCqの順に並べる。(A)平均Cq。(B)総出力。(C)変動(P1%)。相関は、qPCR Cq及び総出力(ギガベース、GB)について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー8の1つの外れ値を除く)。一般に、ライブラリーの平均Cq値は2~3であった。qPCRの結果は、ライブラリー13が低品質であることを予測し、これは比較的不十分な配列決定結果によって確認される。
図13B】SMRTbell鋳型を定量的PCR(qPCR)で評価し、次いでPacBio Sequel 2システムで配列決定して、qPCR Cqが配列決定基準と相関するかどうかを決定した際の結果を示す。試料を最も低いCqから最も高いCqの順に並べる。(A)平均Cq。(B)総出力。(C)変動(P1%)。相関は、qPCR Cq及び総出力(ギガベース、GB)について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー8の1つの外れ値を除く)。一般に、ライブラリーの平均Cq値は2~3であった。qPCRの結果は、ライブラリー13が低品質であることを予測し、これは比較的不十分な配列決定結果によって確認される。
図13C】SMRTbell鋳型を定量的PCR(qPCR)で評価し、次いでPacBio Sequel 2システムで配列決定して、qPCR Cqが配列決定基準と相関するかどうかを決定した際の結果を示す。試料を最も低いCqから最も高いCqの順に並べる。(A)平均Cq。(B)総出力。(C)変動(P1%)。相関は、qPCR Cq及び総出力(ギガベース、GB)について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー8の1つの外れ値を除く)。一般に、ライブラリーの平均Cq値は2~3であった。qPCRの結果は、ライブラリー13が低品質であることを予測し、これは比較的不十分な配列決定結果によって確認される。
図14A】qPCRで評価され、次いでPacBio Sequel 2システムで配列決定されたSMRTbell鋳型の別のセットを用いたデータを示す。(A)平均Cq値、試料は最も低いCqから最も高いCqへの順。(B)総出力(GB)。(C)P1パーセント。相関は、qPCR Cq及び総出力について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー14の1つの外れ値を除く)。ほとんどのライブラリーの平均Cq値は3~4であった。qPCRは、ライブラリー10が低品質であることを予測し、これは配列決定によって確認される。
図14B】qPCRで評価され、次いでPacBio Sequel 2システムで配列決定されたSMRTbell鋳型の別のセットを用いたデータを示す。(A)平均Cq値、試料は最も低いCqから最も高いCqへの順。(B)総出力(GB)。(C)P1パーセント。相関は、qPCR Cq及び総出力について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー14の1つの外れ値を除く)。ほとんどのライブラリーの平均Cq値は3~4であった。qPCRは、ライブラリー10が低品質であることを予測し、これは配列決定によって確認される。
図14C】qPCRで評価され、次いでPacBio Sequel 2システムで配列決定されたSMRTbell鋳型の別のセットを用いたデータを示す。(A)平均Cq値、試料は最も低いCqから最も高いCqへの順。(B)総出力(GB)。(C)P1パーセント。相関は、qPCR Cq及び総出力について観察され、より低いCqは、より高い出力を示す(最も低いCqのライブラリー14の1つの外れ値を除く)。ほとんどのライブラリーの平均Cq値は3~4であった。qPCRは、ライブラリー10が低品質であることを予測し、これは配列決定によって確認される。
図15A】配列決定前のいくつかのPacBio SMRTbellライブラリーについてのqPCR QCアッセイ結果、及び総Gb出力と相関したデータを示す。総出力はより低いCq値で増加し、このQCアッセイが配列決定性能を予測するための有用なツールとして役立ち得ることを示唆している。ライブラリー20(A)、ライブラリー21(B)、及びライブラリー22(C)由来のライブラリー画分(F#)についてのCq値及びGb測定値。
図15B】配列決定前のいくつかのPacBio SMRTbellライブラリーについてのqPCR QCアッセイ結果、及び総Gb出力と相関したデータを示す。総出力はより低いCq値で増加し、このQCアッセイが配列決定性能を予測するための有用なツールとして役立ち得ることを示唆している。ライブラリー20(A)、ライブラリー21(B)、及びライブラリー22(C)由来のライブラリー画分(F#)についてのCq値及びGb測定値。
図15C】配列決定前のいくつかのPacBio SMRTbellライブラリーについてのqPCR QCアッセイ結果、及び総Gb出力と相関したデータを示す。総出力はより低いCq値で増加し、このQCアッセイが配列決定性能を予測するための有用なツールとして役立ち得ることを示唆している。ライブラリー20(A)、ライブラリー21(B)、及びライブラリー22(C)由来のライブラリー画分(F#)についてのCq値及びGb測定値。
図16】DNA損傷検出ワークフローを示す。このアッセイのシグナル対ノイズ比は、組み込まれていない蛍光ヌクレオチドの非特異的結合を大きく減少させるために、エビアルカリホスファターゼ(SAP)消化及びストリンジェントな二重SPRIビーズベースの精製工程(すなわち、カルボキシレートビーズを用いた2回の精製)の両方を用いることによって増加した。
図17】SAP消化及び単一のSPRIビーズベースの精製工程の結果を示す。単一のSPRIで精製された剪断ゲノムDNAは、SAP処理なし(-SAP)とは対照的に、精製前にSAPで処理した場合(+SAP)、蛍光ヌクレオチドの非特異的結合の減少を示した。
図18】2回のビーズベースの精製工程が蛍光ヌクレオチドの非特異的結合を実質的に減少させたことを示す。
図19A】市販の修復ミックス(PreCR Repair mix(NEB)、パネル(A)に示す)と、Taqリガーゼ(40U)、Bstポリメラーゼラージフラグメント(8U)、及びT4 PDG(1U)を含むDNA修復酵素ミックスを用いる本発明の方法(パネル(B)に示す)との有効性の比較を示す。
図19B】市販の修復ミックス(PreCR Repair mix(NEB)、パネル(A)に示す)と、Taqリガーゼ(40U)、Bstポリメラーゼラージフラグメント(8U)、及びT4 PDG(1U)を含むDNA修復酵素ミックスを用いる本発明の方法(パネル(B)に示す)との有効性の比較を示す。
図20】ゲノムDNA試料に対する紫外線(UV)損傷の測定を示す。光のエネルギーが増加し、曝露時間が増加するにつれて、Taqリガーゼ、Bstポリメラーゼ、及びUV損傷特異的修復酵素であるT4ピリミジンダイマーグリコシラーゼ(T4 PDG)を含むカスタムDNA修復酵素ミックスで修復された試料において、蛍光の量もまた増加する。
図21】ゲノムDNA試料に対するニッキング損傷の測定を示す。ニッキング酵素(Nt.BspQI)の量が増加するにつれて、本発明のアッセイを使用してTaqリガーゼ及びBstポリメラーゼで修復された試料中の蛍光シグナルも一般に増加する。
【発明を実施するための形態】
【0125】
長い増幅PCRは、標的核酸由来の目的の配列における標的化された長いインデル検出のために使用することができる。しかしながら、PCRは、小さな挿入及び欠失変異を有するものなどのより小さなアンプリコンに偏っており、長い挿入などのより長いアンプリコンに偏っている。長いアンプリコンは、短いアンプリコンと比較して、PCRサイクルにおいて長いアンプリコンが生成される可能性がより低い核酸の新鎖合成に時間がかかるので、このバイアスはPCR法に固有である。更に、長いアンプリコンは、事象が複製を停止し得る前に、完全なアンプリコンを産生する成功率がより低い。言い換えれば、長いアンプリコンの増幅は、より短いアンプリコンよりも高い割合で失敗する可能性がある。例えば、アンプリコンを産生するためにポリメラーゼを作用させるべき時間が長ければ長いほど、ランダムな脱落、DNA損傷への遭遇、又は処理速度を考慮する場合に時間不足のために、ポリメラーゼがアンプリコンの末端に到達しない可能性が高くなる。
【0126】
長いアンプリコンに対する既知のバイアスのために、長い増幅(LongAmp)PCRは、異なる事象の相対頻度を正確に決定するために使用することができない。したがって、異なる突然変異に関連するアンプリコンのサイズが異なって増幅されるため、LongAmp増幅の結果は、元の標的核酸試料中の特定の突然変異の相対数を定量化することができない。
【0127】
本明細書に記載される標準物質及び方法は、このアンプリコンサイズバイアスを正規化するのに役立ち得る。
【0128】
更に、本開示はまた、ライブラリー品質を評価するための品質管理(QC)方法も記載する。いくつかの実施形態では、ライブラリー、例えば長リード配列決定のためのものは、配列決定の前に評価される。いくつかの実施形態では、ライブラリーは、挿入部の両末端にヘアピンアダプターを有する二本鎖DNA挿入部を含むライブラリー分子を含む。いくつかの実施形態では、ライブラリーは、標的DNAを断片化し、タグメンテーション又はライゲーションなどにより、断片の両端にヘアピンアダプターを組み込むことによって作製される。
【0129】
I.アンプリコンサイズバイアスを正規化するための標準物質
いくつかの実施形態では、アンプリコンサイズバイアスを正規化する方法において、異なる長さの核酸標準物質のプールを使用することができる。いくつかの実施形態では、これらの拡散標準物質は、固有分子識別子(UMI)を含む。
【0130】
いくつかの実施形態では、核酸のプールは、目的の配列に含まれる様々な異なる配列を含み得る。
【0131】
いくつかの実施形態では、プール中の標準物質の数は、増幅反応によって生成されるアンプリコンの数より多い。いくつかの実施形態では、増幅反応は、目的の配列の増幅である。
【0132】
いくつかの実施形態では、標準物質の少なくとも第1の部分は、標準物質の1つのプール由来であり、標準物質の少なくとも第2の部分は、標準物質の別のプール由来である。
【0133】
いくつかの実施形態では、標準物質は、二本鎖である。いくつかの実施形態では、標準物質は、二本鎖DNAを含む。いくつかの実施形態では、各標準物質は、異なるUMIを含む。
【0134】
いくつかの実施形態では、増幅プライマー結合配列は、各標準物質の一方若しくは両方の末端に、又は各標準物質の一方若しくは両方の末端に近接して含まれる。本明細書を通して、「一方又は両方の末端に近接して」とは、末端から10ヌクレオチド以内を意味する。いくつかの実施形態では、増幅プライマー結合配列は、各標準物質の一方又は両方の末端に含まれる。いくつかの実施形態では、増幅プライマー結合配列は、各標準物質の一方又は両方の末端の1、2、3、4、5、6、7、8、又は9ヌクレオチドを含む。いくつかの実施形態では、標準物質は、その3’末端及びその5’末端の両方に増幅プライマー結合配列を含む。いくつかの実施形態では、標準物質は、その3’末端に対して3’末端に異なる増幅プライマー結合配列を含む。いくつかの実施形態では、標準物質は、UMIの5’側に1つ以上のオリゴヌクレオチドを含む。いくつかの実施形態では、標準物質は、UMIの3’側に1つ以上のオリゴヌクレオチドを含む。いくつかの実施形態では、標準物質は、UMIの5’側の1つ以上のオリゴヌクレオチド及びUMIの3’側の1つ以上のオリゴヌクレオチドを含む。
【0135】
A.UMI
いくつかの実施形態では、標準物質のプール中の標準物質はそれぞれ、UMIを含む。
【0136】
いくつかの実施形態では、UMIは、標準物質の5’末端及び/若しくは3’末端になく、又は標準物質の5’末端及び/若しくは3’末端に近接していない。いくつかの実施形態では、標準物質内の中心に位置するUMIは、標準物質の断片化(例えばタグメンテーションによる)が、UMI及び標準物質の残り由来の配列の全部又は一部(UMIの5’及び/又は3’のいずれか)を含む断片を生じる確率を増加させる。本明細書中で使用される場合、「中心に」位置する特徴は、標準物質の中心から10ヌクレオチド以内の位置にある特徴の中心をいう。いくつかの実施形態では、標準物質内の中心に位置するUMIは、標準物質の中心の1、2、3、4、5、6、7、8、又は9ヌクレオチド以内にUMIの中心を有する。
【0137】
対照的に、目的の配列の5’末端及び/又は3’末端の近位にUMIを配置すると、UMIのみを含み、標準物質の残りの部分由来の追加の配列を含まない断片の割合が高くなる可能性がある。
【0138】
いくつかの実施形態では、UMIは、同じLongAmp標準物質から生成されるアンプリコンを同定するために使用される。言い換えれば、UMI及び上流/下流挿入ジャンクション塩基を含む標準物質の配列決定は、それぞれ、標準物質の固有の分子数及び対照同一性を提供することができる。これは、同じ標準物質から生成された各アンプリコンが同じ固有のUMIを有し、LongAmp標準物質から生成された他のアンプリコンが異なるUMIを有するためである。
【0139】
いくつかの実施形態では、UMIはランダム塩基対を含み、その結果、各固有のUMIは、プール内の他のUMIとは異なる配列を含む。いくつかの実施形態では、UMIは、10(N10)以上、12(N12)以上、14(N14)以上、16(N16)以上、18(N18)以上、20(N20)以上、又は22(N22)以上のランダム塩基対を含む。いくつかの実施形態では、UMIは、18塩基対(N18)を含む。いくつかの実施形態では、標準物質のプールに含まれるUMIは、16~20塩基対を含む配列のランダムセットである。
【0140】
多数のUMIを有するUMIプールの使用は、(UMI衝突を回避するのに役立ち得る。より長いUMI(すなわち、N10の代わりにN18)を有することも、UMI衝突の機会を減少させる。
【0141】
本明細書で使用される場合、「UMI衝突」は、同じ配列及び同じUMIバーコードを有するが、2つの異なるゲノム分子に由来する2つのリードを観察する事象を指す。アンプリコン配列決定では、ゲノム中の特定の位置が何度も配列決定され、ゲノム全体の配列決定よりもはるかに大きいシーケンス深度をもたらす(Clement et al.,Bioinformatics,34,2018,i202-i210参照)。このシーケンス深度に基づいて、異なるゲノム分子由来の多くの対立遺伝子は、同じ配列を共有し得、UMI衝突の可能性は、全ゲノム配列決定と比較してアンプリコン配列決定についてはるかに高い。
【0142】
いくつかの実施形態では、標準物質のプールは、1×1010以上、10×1010以上、又は100×1010以上の標準物質を含み、各標準物質は異なるUMIを含む。図7は、必要とされるUMIを含む合成二本鎖DNAの量を含む、6.87×1010個のUMIを含む実験を準備するための計算を示す。
【0143】
いくつかの実施形態では、本明細書に記載されるように、標準物質中のUMIは、比較的安価な市販の試薬に由来し得る。いくつかの実施形態では、UMIを含む二本鎖オリゴヌクレオチドはまた、標準物質の調製に使用するための1つ以上の制限酵素切断部位を含む。
【0144】
例えば、以下に記載されるように、代表的な合成dsDNAオリゴヌクレオチドは、挿入標準物質を調製するため(図2A)及び欠失標準物質を調製するため(図6A)に示される。いくつかの実施形態では、合成dsDNAオリゴヌクレオチドは、UMI及び制限酵素切断部位(又は図2A及び図6Aに示されるようなRS3及びRS4などの制限部位)を含む。いくつかの実施形態では、制限酵素切断部位を使用してオリゴヌクレオチドを切断し、次いで他のオリゴヌクレオチドにライゲーションして最終標準物質を調製することができる。UMI dsDNAオリゴヌクレオチドの供給源として、gBlock遺伝子断片(Integrated DNA Technologies)が挙げられる。
【0145】
B.目的の配列
本明細書で使用される場合、「目的の配列」は、ユーザーが調査したい任意の配列であり得る。いくつかの実施形態では、目的の配列は、遺伝子編集に供されている。例えば、ユーザーは、遺伝子編集又は他の突然変異誘発(化学的突然変異誘発など)の方法を実施している可能性があり、目的の配列中の異なる突然変異(野生型配列と共に)を評価したいと望む。
【0146】
いくつかの実施形態では、遺伝子編集は、CRISPR Cas法を用いて行われる。いくつかの実施形態では、CRISPR Cas切断部位は、目的の配列中に存在する。いくつかの実施形態では、挿入変異又は欠失変異は、目的の配列内の切断部位の近くで生じる可能性が高い。例えば、図5は、CRISPR Casなどの遺伝子編集の方法を使用して導入された目的の配列内に存在する切断部位を示す。いくつかの目的の配列、例えばインデル突然変異について評価されている患者由来の腫瘍学的試料の配列は、遺伝子編集法によって導入された切断部位を有さない。
【0147】
いくつかの実施形態では、目的の配列は、目的の配列の5’末端及び/若しくは3’末端にない、又は目的の配列の5’末端及び/若しくは3’末端に近接していない制限酵素切断部位を含む。いくつかの実施形態では、このような切断部位は、標準物質を生成する際に有用であり得るか、又は目的の配列を評価するために使用され得る。
【0148】
いくつかの実施形態では、目的の配列は、長い増幅プライマー(すなわち、LA-fwd及びLA-revプライマー)に結合できるプライマー結合配列を含む。いくつかの実施形態では、ユーザーは、適切なLA-fwd及びLA-revプライマーを調製するために、目的の配列を評価し得る。
【0149】
いくつかの実施形態では、目的の配列は、挿入変異又は欠失変異を含み得る。例えば、目的の配列は、挿入変異を含み得るか、又は欠失変異であり得る(すなわち、目的の配列の全長配列を含まない)。
【0150】
本明細書で使用される場合、目的の「野生型」配列は、インデル突然変異を含まない目的の配列を指す。言い換えれば、野生型配列は、挿入変異を含まず、欠失変異も含まない配列を指す。本明細書で使用される場合、「野生型アンプリコン」は、目的の野生型配列を含むアンプリコンである。
【0151】
目的の配列は、任意のタイプの核酸配列であり得る。いくつかの実施形態では、目的の配列は、遺伝子編集法(CRISPRなど)に供されており、ユーザーは、固有の遺伝子編集事象の分析を望む。いくつかの実施形態では、遺伝子編集に供された目的の配列は、図3図5、及び図6Bの代表例に示されるような「切断部位」を含み得る。そのような遺伝子編集法は、ユーザーが特徴付けることを望み得る様々な異なる種類のインデル突然変異をもたらし得る。
【0152】
いくつかの実施形態では、がん及び生殖系インデル変異を含む目的の配列は、転移性エレメント由来の挿入と同様に、この方法によって評価することができる。そのような実施形態では、目的の配列は、遺伝子編集による切断部位を含まなくてもよい。
【0153】
いくつかの実施形態では、目的の配列は、目的の遺伝子、例えば、がんに関連することが知られている遺伝子の全て又は一部であり得る。当業者は、患者が目的の配列を含む遺伝子中に有し得るインデルを特徴付けること、及び/又は異なる変異の相対量を特徴付けることを望む場合がある。例えば、当業者は、患者の試料由来の目的の配列中に存在する大きな挿入変異の数を特徴付けたい場合がある。
【0154】
C.ユニバーサルオリゴヌクレオチドを含む標準物質
いくつかの実施形態では、核酸標準物質のプール内の全て又はいくつかの標準物質は、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含む。本明細書中で使用される場合、「ユニバーサルオリゴヌクレオチド」とは、このプール中の全ての標準物質に含まれるオリゴヌクレオチドをいう。本明細書で使用される場合、「5’ユニバーサルオリゴヌクレオチド」は、標準物質に含まれるUMIの5’側にあるオリゴヌクレオチドである(図8の100として表される)。本明細書で使用される場合、「3’ユニバーサルオリゴヌクレオチド」は、標準物質に含まれるUMIの3’側にあるオリゴヌクレオチドである(図8の101として表される)。
【0155】
いくつかの実施形態では、標準物質の少なくとも第1の部分は、標準物質の1つのプール由来であり、標準物質の少なくとも第2の部分は、標準物質の別のプール由来である。言い換えれば、各標準物質が5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含む標準物質のプールを、5’ユニバーサルオリゴヌクレオチド及び/又は3’ユニバーサルオリゴヌクレオチドを含まない標準物質の異なるプールと組み合わせることができる。
【0156】
いくつかの実施形態では、核酸標準物質のプールは、異なる長さの標準物質を含み、核酸標準物質は、固有分子識別子(UMI)、並びに、5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、UMIと5’ユニバーサルオリゴヌクレオチドとの間、及び/又は、UMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域と、を含み、少なくとも1つの領域の長さは、標準物質の長さを決定する。UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域は図8Bに102として示され、UMIと3’ユニバーサルオリゴヌクレオチドとの間の領域は図8Bに103として示される。
【0157】
いくつかの実施形態では、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含み、追加の配列(例えば、UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域)も含む標準物質は、「挿入標準物質」と称され得る。これは、挿入標準物質が目的の野生型配列よりも長さが長い可能性があるためである。これらの挿入突然変異は対象の野生型配列よりも大きいため、このようにして、挿入標準物質は、対象の野生型配列における挿入突然変異のアンプリコンサイズバイアスを正規化するために制御することができる。
【0158】
いくつかの実施形態では、プールは、UMI、並びに、5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドが全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、を含む、核酸標準物質を更に含み、更なる核酸標準物質は、UMIと5’ユニバーサルオリゴヌクレオチドとの間又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域を含まない。5’ユニバーサルオリゴヌクレオチド(100)及び3’ユニバーサルオリゴヌクレオチド(101)を含む標準物質は、図8Aに示されるように、完全長標準物質と称され得る。完全長標準物質は、挿入又は欠失変異のいずれも有さない目的の野生型配列(すなわち、インデルを有さない野生型配列)と同様の長さを有し得る。
【0159】
いくつかの実施形態では、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域は、挿入標準物質の長さを決定する。いくつかの実施形態では、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域は、目的の挿入変異の潜在的な長さに対応するキロベース(kb)数を含む。いくつかの実施形態では、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域は、0.2kb~10kbを含む。
【0160】
5’ユニバーサルオリゴヌクレオチド及び/又は3’ユニバーサルオリゴヌクレオチドは、目的の配列に含まれる配列を含み得る。いくつかの実施形態では、5’ユニバーサルオリゴヌクレオチド及び/又は3’ユニバーサルオリゴヌクレオチドはそれぞれ、目的の配列から増幅されたアンプリコンを含む。言い換えれば、5’ユニバーサルオリゴヌクレオチド及び/又は3’ユニバーサルオリゴヌクレオチドは、図3に示されるように、増幅によって調製され得る。
【0161】
5’ユニバーサルオリゴヌクレオチドが増幅によって調製される場合、それは「5’ユニバーサルPCRアダプターアンプリコン」又は「上流ユニバーサルPCRアダプターアンプリコン」と称され得る。図3は、代表的な上流ユニバーサルPCRアダプターアンプリコンが、長い増幅フォワードプライマー(LA-fwd)及び、目的の配列に結合し、かつ制限酵素切断部位(RS1)を含むプライマーを使用して生成され得る方法を示す。
【0162】
3’ユニバーサルオリゴヌクレオチドが増幅によって調製される場合、それは「3’ユニバーサルPCRアダプターアンプリコン」又は「下流ユニバーサルPCRアダプターアンプリコン」と称され得る。図3は、代表的な下流ユニバーサルPCRアダプターアンプリコンが、長い増幅リバースプライマー(LA-rev)及び、目的の配列に結合し、かつ制限酵素切断部位(RS2)を含むプライマーを使用して生成され得る方法を示す。
【0163】
いくつかの実施形態では、上流ユニバーサルPCRアダプターアンプリコン及び下流ユニバーサルPCRアダプターアンプリコンを適切な制限酵素で切断して(図3に示す例ではRS1及びRS2で切断できる)、UMI、並びに、5’ユニバーサルオリゴヌクレオチドであって、5’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、5’ユニバーサルオリゴヌクレオチドと、3’ユニバーサルオリゴヌクレオチドであって、3’ユニバーサルオリゴヌクレオチドは全ての標準物質について同じである、3’ユニバーサルオリゴヌクレオチドと、を含む、標準物質を調製することができる。この切断は、標準物質を作製する方法の記述において以下で考察されるように、これらのアンプリコンを標準物質の他の部分(例えば、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域)にライゲーションするのに適合する末端を生成し得る。
【0164】
いくつかの実施形態では、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域は、それぞれ任意の配列を含む。本明細書中で使用される場合、「任意の配列」とは、ヌクレオチドを含む任意の配列をいい、特定の核酸配列がこの任意の配列に含まれることを何ら必要としない。例えば、当業者は、任意の配列がランダムであり、目的の配列に関連しない挿入標準物質を調製することを所望し得る。別の実施形態では、任意の配列は、ランダムではない既知の配列であってよいが、それはまた、目的の配列に関連しない(例えば、関連しない遺伝子配列)。任意の配列を含む標準物質を使用して、挿入変異のアンプリコンサイズバイアスについて正規化することができ、これは、このバイアスの多くがアンプリコンサイズに関連し、挿入配列に含まれる正確な配列に関連しないためである。いくつかの実施形態では、任意の配列は、二本鎖である。
【0165】
いくつかの実施形態では、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の少なくとも1つの領域は、それぞれ目的の配列から増幅されたアンプリコンを含む。言い換えれば、UMIと5’ユニバーサルオリゴヌクレオチドとの間及び/又はUMIと3’ユニバーサルオリゴヌクレオチドとの間の領域を、増幅によって調製することができる。いくつかの実施形態では、この増幅は、図4に示されるように、目的の配列由来である。
【0166】
1.挿入アンプリコン
本明細書で使用される場合、UMIと5’ユニバーサルオリゴヌクレオチドとの間の領域は、増幅によって調製されるとき、「5’挿入アンプリコン」又は「上流挿入アンプリコン」と称され得る。図4は、目的の配列に結合し、かつ制限酵素切断部位(RS1及びRS3)を含むプライマーを使用する、代表的な上流挿入アンプリコンが生成され得る方法を示す。
【0167】
本明細書で使用される場合、UMIと3’ユニバーサルオリゴヌクレオチドとの間の領域は、増幅によって調製されるとき、「3’挿入アンプリコン」又は「下流挿入アンプリコン」と称され得る。図4は、制限酵素切断部位(RS2及びRS4)を使用する、代表的な上流挿入アンプリコンが生成され得る方法を示す。
【0168】
いくつかの実施形態では、挿入アンプリコンを調製するために使用されるリバースプライマー及びフォワードプライマーは、挿入アンプリコンのサイズを決定する。いくつかの実施形態では、単一のプライマー対は、所望のサイズの挿入アンプリコンを生成する。
【0169】
本明細書で使用される場合、「挿入アンプリコン」は、5’挿入アンプリコン又は3’挿入アンプリコンのいずれかであるアンプリコンを指し得る。一般に、「挿入アンプリコン」は、標準物質中の配置によって限定されない。
【0170】
いくつかの実施形態では、標準物質は、上流挿入アンプリコン及び下流挿入アンプリコンの両方を含む(図4に示される)。これらは、「挿入アンプリコン対」と称され得る。しかし、標準物質はまた、上流挿入アンプリコン又は下流挿入アンプリコンのいずれかのみを含み得る。
【0171】
図2Bは、5’ユニバーサルオリゴヌクレオチド及び3’ユニバーサルオリゴヌクレオチドを含む核酸標準物質のプールを含む標準物質の代表的なプールを示す。図2Bに示されるように、標準物質のプールは、図4に示されるように調製された上流挿入アンプリコン及び下流挿入アンプリコンを含み得る。
【0172】
D.部分的重複オリゴヌクレオチドを含む標準物質
いくつかの実施形態では、異なる長さの核酸標準物質のプールは、UMI、並びに、5’部分的重複オリゴヌクレオチドであって、5’部分的重複オリゴヌクレオチドは、全ての標準物質についてその配列の少なくとも一部にわたって同一である、5’部分的重複オリゴヌクレオチド、及び/又は、3’部分的重複オリゴヌクレオチドであって、3’部分的重複オリゴヌクレオチドは、全ての標準物質についてその配列の少なくとも一部にわたって同一である、3’部分的重複オリゴヌクレオチド、を含む、核酸標準物質を含み、5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドの長さは、標準物質の長さを決定する。
【0173】
本明細書中で使用される場合、「部分的重複オリゴヌクレオチド」とは、全ての標準物質についてその配列の少なくとも一部にわたって同一であるオリゴヌクレオチドを指す。いくつかの実施形態では、標準物質は、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドの両方を含む。
【0174】
本明細書で使用される場合、「5’部分的重複オリゴヌクレオチド」は、図8Cの104によって表されるような、標準物質に含まれるUMIの5’側にあるオリゴヌクレオチドである。本明細書で使用される場合、「3’部分的重複オリゴヌクレオチド」は、図8Cの105によって表されるような、標準物質に含まれるUMIの3’側にあるオリゴヌクレオチドである。いくつかの実施形態では、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドは異なる。いくつかの実施形態では、5’部分的重複オリゴヌクレオチド及び3’部分的重複オリゴヌクレオチドは、異なる数のヌクレオチドを含む。
【0175】
いくつかの実施形態では、5’部分的重複オリゴヌクレオチドは、目的の配列の少なくとも第1の部分を含み、3’部分的重複オリゴヌクレオチドは、目的の配列の少なくとも第2の部分を含む。言い換えれば、5’部分的重複オリゴヌクレオチドは、目的の配列の少なくとも第1の部分を含み、3’部分的重複オリゴヌクレオチドは、目的の配列の異なる部分に対応し得る。
【0176】
いくつかの実施形態では、標準物質は、5’部分的重複オリゴヌクレオチドのみを含む(3’部分的重複オリゴヌクレオチドは含まない)。いくつかの実施形態では、標準物質は、3’部分的重複オリゴヌクレオチドのみを含む(5’部分的重複オリゴヌクレオチドは含まない)。5’部分的重複オリゴヌクレオチド又は3’部分的重複オリゴヌクレオチドのみを含む標準物質は、目的の配列中の大きな領域の損失を生じる欠失変異について制御するために有用であり得る。
【0177】
いくつかの実施形態では、5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドはそれぞれ、図5に示されるように、目的の配列から増幅されたアンプリコンを含む。
【0178】
1.欠失アンプリコン
5’部分的重複オリゴヌクレオチドは、目的の配列からの増幅によって生成される場合、5’欠失アンプリコン又は上流欠失アンプリコンと称され得る。3’部分的重複オリゴヌクレオチドは、目的の配列からの増幅によって生成される場合、3’欠失アンプリコン又は下流欠失アンプリコンと称され得る。例えば、図5に示されるように、上流欠失アンプリコンの各々は、目的の配列の一部(黒色で示される)を含み、下流欠失アンプリコンの各々もまた、目的の配列の一部(黒色で示される)を含む。いくつかの実施形態では、上流欠失アンプリコン及び下流欠失アンプリコンに含まれる目的の配列の部分は異なっていてもよい。図5は、制限酵素切断部位(例えば、RS3及びRS4)を含み、かつLA-fwd及びLA-revプライマー結合配列及び目的の配列に含まれる他の配列に結合するプライマーを使用して、代表的な上流欠失アンプリコン及び下流欠失アンプリコンが生成され得る方法を示す。
【0179】
本明細書で使用される場合、「欠失アンプリコン」は、5’欠失アンプリコン又は3’欠失アンプリコンのいずれかであるアンプリコンを指し得る。一般に、「欠失アンプリコン」は、標準物質におけるその配置によって限定されない。
【0180】
いくつかの実施形態では、欠失アンプリコンを調製するために使用されるリバースプライマー及びフォワードプライマーは、欠失アンプリコンのサイズを決定する。いくつかの実施形態では、単一のプライマー対は、所望のサイズの欠失アンプリコンを生成する。
【0181】
いくつかの実施形態では、標準物質は、上流欠失アンプリコン及び下流欠失アンプリコンの両方を含む(図5に示される)。これらは、「欠失アンプリコン対」と称され得る。しかし、標準物質はまた、上流欠失アンプリコン又は下流欠失アンプリコンのいずれかのみを含み得る。
【0182】
いくつかの実施形態では、5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドはそれぞれ、目的の配列よりも20bp~1kb小さい配列を含む。言い換えれば、5’部分的重複オリゴヌクレオチド及び/又は3’部分的重複オリゴヌクレオチドは、目的の配列の欠失変異において見出される配列に対応し得る。
【0183】
図6Bは、図5に示されるように調製された、上流欠失アンプリコン及び下流欠失アンプリコンを含む核酸標準物質のプールを含む標準物質の代表的なプールを示す。
【0184】
II.標準物質を作製する方法
本発明の標準物質及び使用方法は、標準物質を生成する手段によって限定されない。いくつかの実施形態では、標準物質は、標準物質を調製するためにオリゴヌクレオチドを一緒にライゲーションすることによって生成される。
【0185】
核酸標準物質のプールを生成する方法が本明細書に記載され、この方法は、核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、様々な長さの一連の挿入オリゴヌクレオチドを提供することと、少なくとも1つの目的の配列、UMIを含む少なくとも1つのオリゴヌクレオチド、及び少なくとも1つの挿入アンプリコンをライゲーションして、核酸標準物質のプールの複数の核酸標準物質を生成することと、を含む。
【0186】
いくつかの実施形態では、少なくとも1つの目的の配列及び/又は挿入オリゴヌクレオチドは、増幅によって調製される。
【0187】
いくつかの実施形態では、目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドは、制限酵素切断部位を含む。いくつかの実施形態では、制限酵素切断部位は、目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドの5’末端及び/又は3’末端の近位にある。
【0188】
いくつかの実施形態では、方法は、目的の配列、それぞれUMIを含むオリゴヌクレオチド、及び/又は挿入オリゴヌクレオチドを制限酵素で切断することをライゲーションの前に更に含む。いくつかの実施形態では、制限酵素により切断することは、ライゲーションのための付着末端を生成する。いくつかの実施形態では、UMIを含むオリゴヌクレオチドは、目的の配列にも含まれる所望の制限酵素切断部位を含むように設計される。
【0189】
核酸標準物質のプールを生成する方法が本明細書に更に記載され、この方法は、核酸を含む少なくとも1つの目的の配列の複数のコピーを提供することと、それぞれUMIを含む一連のオリゴヌクレオチドを提供することと、少なくとも1つの目的の配列と、UMIを含む少なくとも1つのオリゴヌクレオチドとをライゲーションすることと、を含む。
【0190】
いくつかの実施形態では、少なくとも1つの目的の配列は、増幅によって調製される。いくつかの実施形態では、目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドは、制限酵素切断部位を含む。いくつかの実施形態では、制限酵素切断部位は、目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドの5’末端及び/又は3’末端の近位にある。
【0191】
いくつかの実施形態では、方法は、目的の配列及び/又はそれぞれUMIを含むオリゴヌクレオチドを制限酵素で切断することをライゲーションの前に更に含む。
【0192】
いくつかの実施形態では、制限酵素により切断することは、ライゲーションのための付着末端を生成する。
【0193】
いくつかの実施形態では、使用されているLongAmp標準物質の数と比較して、より多数のUMIが利用可能である。このようにして、UMIの数は、作成される標準物質の数より多くなり、UMIの重複が最小限に抑えられる。
【0194】
III.アンプリコンサイズバイアスを正規化する方法
本明細書に記載される標準物質のプールは、アンプリコンサイズバイアスを正規化するための方法において使用され得る。
【0195】
アンプリコンサイズバイアスを正規化する方法が本明細書に記載され、この方法は、標的核酸を含む試料を、異なる長さの核酸標準物質のプールと組み合わせることであって、各標準物質はUMIを含む、ことと、標準物質及び標的核酸に含まれる目的の配列のアンプリコンを増幅することと、標準物質及び目的の配列のアンプリコンを配列決定して、配列決定データを生成することと、標準物質由来の配列決定データを使用して、アンプリコンサイズに基づいてバイアスプロファイルを決定することと、バイアスプロファイルを使用して、アンプリコンサイズバイアスを正規化することと、を含む。
【0196】
本明細書で使用される場合、「アンプリコンサイズバイアス」は、異なるサイズのアンプリコンが異なって増幅されるという事実を指す。いくつかの実施形態では、所与の増幅反応において、より短いアンプリコンと比較して、より少ない大きなアンプリコンが生成される。いくつかの実施形態では、増幅は、PCR増幅を含む。いくつかの実施形態では、増幅は、LongAmp PCRである。
【0197】
LongAmp PCRは、通常のPCR法又は試薬を使用して典型的に増幅することができないDNA長の増幅を含む。LongAmp PCRに最適化された酵素は、長距離ポリメラーゼと称され得る。LongAmp PCRの結果は、完全なアンプリコンが生成される場合に改善されるため、サイクルにおける不完全なアンプリコンの生成は、後のPCRサイクルにおける不完全なアンプリコンの更なる生成につながる。いくつかの実施形態では、長距離ポリメラーゼは、高い処理能力(すなわち、DNAポリメラーゼによる単一の結合事象の間に比較的多数のヌクレオチドを組み込む)及び/又は高い伸長速度を有する。
【0198】
高い処理能力及び高い伸長速度を有する長距離ポリメラーゼは、長い鋳型の効率的なDNA合成を確実にし、サイクル時間を短縮するのに役立つ。LongAmp PCRで使用するための多種多様なプロトコール及び長距離ポリメラーゼ、例えばLongAmp Taq DNAポリメラーゼ及びPhusion DNAポリメラーゼ(New England Biolabs)が知られている。いくつかの実施形態では、長距離ポリメラーゼは、PrimeSTAR GXL DNAポリメラーゼ(Takara)である。
【0199】
いくつかの実施形態では、LongAmp PCRにおけるアンプリコンサイズバイアスは、本明細書に記載の核酸標準物質を使用する方法で正規化することができる。いくつかの実施形態では、標準物質は、バイアスプロファイルを生成するために使用され、このバイアスプロファイルは、目的の配列から生成されたアンプリコンについてのデータを正規化するために使用され得る。いくつかの実施形態では、目的の配列からのアンプリコンの増幅へのアンプリコンサイズの影響は、本明細書に記載される標準物質を用いて生成されたデータを使用して正規化され得る。
【0200】
いくつかの実施形態では、目的の配列のアンプリコンを増幅することは、目的の配列の末端でプライマー結合配列に結合する一対のPCRプライマーを用いて標的核酸からアンプリコンを増幅することを含む。いくつかの実施形態では、標準物質は、目的の配列の末端にあるものと同じプライマー結合配列を含む。
【0201】
いくつかの実施形態では、方法は、増幅後かつ配列決定前に、断片のライブラリーを生成することを更に含む。
【0202】
いくつかの実施形態では、断片のライブラリーを生成することは、タグメンテーションによる。このような方法を図1に示し、ここで、断片は、Nextera断片化プロトコールによって生成される。そのような方法は、例えば、異なる挿入突然変異(図1において矢印で示される)を含む断片を生成する。この「long amp」PCR及び断片化工程では、PCR中のアンプリコンサイズバイアスを正規化するために、本明細書に記載される標準物質のプールを添加することができる。このようにして、標準物質のプールは、目的の配列と同じ増幅及び断片化条件に供される。
【0203】
いくつかの実施形態では、バイアスプロファイルを決定するために使用される標準物質由来の配列決定データは、標準物質に含まれるUMIの固有分子数である。言い換えれば、当業者は、配列決定データの標準的な分析を使用して、異なる標準物質から複製されたUMIの数を決定することができる。これらのUMIは異なる長さの標準物質に由来するため、異なるUMIの数は、バイアスプロファイルを生成するための異なるサイズのアンプリコンの増幅効率の尺度を提供することができる。このようにして、目的の配列とは異なる配列について生成されたアンプリコン(目的の野生型配列及びインデルを含む目的の配列からも生成されたアンプリコンを含む)の数を、バイアスプロファイルと比較することができる。言い換えれば、標準物質と比較する目的の配列から生成されたデータの比較を使用して、アンプリコンサイズバイアスについて配列決定データを正規化することができる。例えば、目的の配列の大きな挿入変異と同様のサイズの挿入標準物質が、目的の野生型配列と同様のサイズの標準物質よりも3倍低い速度で増幅された場合、ユーザーは、これらの大きな挿入変異のコピー数を、野生型配列と比較して正規化することができる。同様に、当業者は、欠失標準物質を使用して野生型配列と比較して、多数の大きな欠失変異(すなわち、大量の配列が失われている場合)について正規化することができる。
【0204】
A.長い増幅PCR及び配列決定
長い増幅PCR(LongAmp)は、長いアンプリコンに最適化されたPCR反応を指す。そのようなLongAmp反応を図1に示す(「long amp」PCR)。そのような最適化されたLongAmp PCRの方法は、当技術分野において周知である。
【0205】
いくつかの実施形態では、長いアンプリコンは、5,000キロベース超、10,000キロベース超、又は20,000キロベース超であり得る。
【0206】
いくつかの実施形態では、長いアンプリコンは、大きな挿入変異を含み得る目的の配列から生成される。例えば、長いアンプリコンは、約10,000キロベースであり得るが、この目的の配列由来の野生型アンプリコンは、約1,000キロベースである。
【0207】
いくつかの実施形態では、LongAmpは、目的の配列における長い挿入突然変異の同定を最適化するために使用される。
【0208】
LongAmp PCRの後、ライブラリー断片の配列決定の前にライブラリー調製を行ってもよい。例えば、タグメンテーションを使用して(例えば、IlluminaのNexteraシステムを用いて)、配列決定のためのライブラリーを調製できる。
【0209】
いくつかの実施形態では、標準物質は、対照アッセイを実行するために使用される。いくつかの実施形態では、これらの対照アッセイは、LongAmp PCR反応とは別個である。いくつかの実施形態では、標準物質は、各LongAmp PCR反応への既知の量のスパイクインである。「スパイクイン」とは、標準物質がLongAmp PCR反応と同じ反応溶液中で増幅されることを意味する。
【0210】
IV.ライブラリー中のDNA損傷を決定する方法
ライブラリーを品質管理(QC)するための定量的PCR(qPCR)方法が本明細書に記載される。このような方法は、ユーザーが、配列決定などのライブラリーの更なる分析を実施する前に、ライブラリー中に存在するDNA損傷の量を決定することを可能にし得る。いくつかの実施形態では、QCアッセイは、異なるレベルの損傷を有するライブラリーを区別する。
【0211】
いくつかの実施形態では、これらのライブラリーは、配列決定のために使用され得る。いくつかの実施形態では、ライブラリーは、長リード配列決定のために意図される。いくつかの実施形態では、ライブラリーは、タグメンテーション及び/又はビーズ連結トランスポソームを使用して調製される。ライブラリー中のDNA損傷を決定する本発明の方法は、任意の方法によって生成されたライブラリーで使用することができる。
【0212】
本明細書中で使用される場合、「ライブラリー分子」は、ライブラリー内に含まれる単一分子をいう。いくつかの実施形態では、各ライブラリー分子は、標的核酸とは異なる挿入部を含み得る。ライブラリー分子は、当該分野で周知である標準的なタグメンテーション又はライゲーションプロトコールを用いて生成され得る。
【0213】
多くの配列決定用途は、ライブラリー分子中に1つ以上のアダプターの存在を必要とする。多くの場合、これらのアダプター配列は挿入部の両端にある。いくつかの実施形態では、アダプターに含まれる配列は、例えば、フローセルへのライブラリー分子の結合又はライブラリー分子への配列決定プライマーの結合を可能にするために、配列決定用途において使用される。いくつかの実施形態では、アダプター配列は、2つの異なる配列決定プライマー配列への結合のためなど、配列決定用途のために挿入部の両端に必要とされる。このようなシナリオにおいて、1つのアダプター配列を欠くライブラリー分子(例えば、ニックの入ったライブラリー又はそのアンプリコン)は、配列決定を成功できない。
【0214】
いくつかの実施形態では、ライブラリーは、長リードヘアピンアダプターを含むライブラリー分子を含む。長リードライブラリー分子中の挿入部サイズは、5kb以上、10kb以上、15kb以上、20kb以上、25kb以上、又は30kb以上であり得る。いくつかの実施形態では、ヘアピンアダプターを、ライブラリー分子内の挿入部に含まれるDNAの長い領域に付加することができる。いくつかの実施形態では、ヘアピンアダプターは、ライゲーション又はタグメンテーションプロトコールを使用して挿入部に付加され得る。例えば、NEBのNEBNext Multiplex Oligos for Illumina(登録商標)は、アダプター二量体形成を最小限にする独特のヘアピンループ構造を有するアダプターライゲーションを使用する。
【0215】
いくつかの実施形態では、ヘアピンアダプターは、タグメンテーション反応の間に挿入部に付加され得る。「タグメンテーション」は、断片及びタグ核酸に対するトランスポザーゼの使用を指す。タグメンテーションは、トランスポゾン末端配列(本明細書でトランスポゾンと称される)を含む1つ以上のタグ(アダプター配列など)で複合体化されたトランスポザーゼ酵素を含むトランスポソーム複合体によるDNAの修飾を含む。タグメンテーションは、DNAの断片化及び二重鎖断片の両方の鎖の5’末端へのアダプターのライゲーションを同時にもたらし得る。しかし、タグメンテーションは、ライブラリーを生成する1つの方法にすぎず、他の方法(ライゲーションなど)もまた、本発明のQCアッセイで使用するためのライブラリーを生成するために使用することができる。
【0216】
いくつかの実施形態では、1つ以上のライブラリー分子を含むライブラリーにおけるDNA損傷の存在を決定する方法であって、各ライブラリー分子は、挿入部の各末端にヘアピンアダプターを有する二本鎖DNA挿入部を含み、この方法は、ライブラリー分子に含まれる二本鎖DNA挿入部の第1の鎖及び第2の鎖を変性することと、フォワードプライマー及びリバースプライマーをライブラリー分子にアニーリングすることと、ライブラリーアンプリコンを生成するために増幅することと、生成されたライブラリーアンプリコンの数に基づいてDNA損傷の存在を評価することと、を含む。例示的な方法を図9に示し、これは、ニックを有するライブラリー分子が完全長アンプリコンを生成しないことを示す。
【0217】
本明細書に記載の方法は、長距離ポリメラーゼを使用して、QCのためのライブラリー分子を増幅することができる。いくつかの実施形態では、QCアッセイは、異なるレベルの損傷を有するライブラリーを区別し、ライブラリー調製物における損傷率と相関するCq値をもたらす。本明細書に記載の方法は、1つ以上のヘアピンアダプターを含む任意のライブラリーに適用することができ、特に、長リード配列決定のための長い挿入部のライブラリー調製に使用することができる。いくつかの実施形態では、本発明のQCアッセイの使用は、損傷したライブラリーの使用を回避し、時間、費用、及び消耗品の節約をもたらす。
【0218】
A.ライブラリーにおけるDNA損傷
ライブラリー調製の全ての方法は、調製プロセスの間に核酸に損傷を導入し得る。例えば、任意のピペッティング工程は、核酸の剪断をもたらし得る。ユーザーは潜在的な損傷を低減するための措置を講じることができるが、この損傷を完全に回避又は予測することはできない。
【0219】
ライブラリー分子内の挿入部は、1つ以上のより大きな核酸由来の断片として得られる二本鎖核酸を含み得る。断片化は、例えば、噴霧化、超音波処理、化学的開裂、酵素的開裂、又は物理的剪断を含む、当技術分野で公知の様々な技術のいずれかを用いて行うことができる。しかし、これらの断片化方法のいずれも、DNA損傷(例えば、DNAのニッキング)を導入する可能性を有する。
【0220】
したがって、ライブラリー中のDNA損傷を評価できることが重要である。例えば、配列決定の質が低いため、ユーザーは、広範なDNA損傷を有するライブラリーに対して更なる配列決定を行うことを望まない。同様に、ライブラリーの多くが損傷されている場合、ユーザーは、配列決定するためのライブラリー産物の適切な量を決定することが困難であり得る。多くの配列決定プラットフォームについて、ライブラリー分子は、フローセルへの結合又は配列決定プライマーへの結合などの使用のために、断片の両端にアダプター配列を必要とする。適切なアダプターが存在しない場合、例えば、ライブラリー分子がDNA損傷を有する場合、ライブラリー分子(及びそのアンプリコン)は、分析可能な配列決定データを生成しない。
【0221】
DNA損傷の評価は、損傷したライブラリーのユーザーによる更なる使用の回避を可能にし得る。このようにして、ユーザーは、低いライブラリー品質が高品質のデータの生成を妨げる場合、配列決定などの用途のための時間及び試薬コストを節約することができる。いくつかの実施形態では、低品質のライブラリーは、配列決定から除外される。
【0222】
いくつかの実施形態では、DNA損傷は、1つ以上のニックである。いくつかの実施形態では、QCアッセイを実施する前に、1つ以上のニックを二本鎖切断に変換することができる。
【0223】
1.ニック
いくつかの実施形態では、DNA損傷は、ライブラリー分子中の1つ以上のニックを含む。本明細書中で使用される場合、1つ以上のニックは、単一のニック又は複数の別個のニックであってよい。
【0224】
いくつかの実施形態では、1つ以上のニックは、ライブラリー分子に含まれる挿入部内にある。挿入部は二本鎖挿入部であり得るので、ニックは挿入部の一方の鎖における切断を指し、切断はその位置において他方の鎖に存在しない。したがって、本明細書で使用される場合、ニックは、二本鎖DNA挿入部における不連続性を指すことができ、そこでは一方の鎖の隣接するヌクレオチド間にホスホジエステル結合が存在しない。いくつかの実施形態では、1つ以上のニックは、ライブラリー調製中のDNA損傷によって生成された。例えば、ピペッティング中の剪断は、ライブラリー分子中にニックをもたらし得る。
【0225】
いくつかの実施形態では、以下で述べられるように、ライブラリー中に1つ以上のニックを含むライブラリー分子の割合がより大きい場合、QCアッセイで生成されるCq値がより大きい。
【0226】
いくつかの実施形態では、DNA損傷は、ライブラリー分子中の2つ以上のニックを含み、ニックは、二本鎖DNA挿入部の同じ鎖中にある。
【0227】
いくつかの実施形態では、DNA損傷は、ライブラリー分子中の2つ以上のニックを含み、ニックは、二本鎖DNA挿入部の両方の鎖中にある。2つ以上のニックが異なる鎖にある場合、これらのニックは、以下に記載される二本鎖DNA切断と区別するために、異なる位置にあってもよい。
【0228】
増幅中にニックに遭遇した場合、DNAポリメラーゼは、ニックを越えてアンプリコンを伸長することができない可能性がある。したがって、1つ以上のニックは、ライブラリー分子の完全な配列を有さない不完全なアンプリコンの生成をもたらし得る。いくつかの実施形態では、ライブラリー分子が1つ以上のニックを含む場合、フォワードプライマー及び/又はリバースプライマーは、ライブラリー分子の完全配列に対応するアンプリコンを生成することができない。ライブラリーの完全配列を含まないこのようなアンプリコンは、配列決定不可能であり得る(挿入部の一方又は両方の末端にあるべきアダプター配列の欠如に起因する)。
【0229】
いくつかの実施形態では、ニックを含むライブラリー分子から生成されたアンプリコンは、フォワードプライマー及び/又はリバースプライマーに結合するための配列を欠いている。
【0230】
いくつかの実施形態では、ニックを含むライブラリー分子は、ニックを含まないライブラリー分子と比較して、増幅中により少ないアンプリコンを生成する。以下で記載されるように、本発明のQC方法は、ニックを含むライブラリー分子のCq値を推定することができ、したがって、ライブラリーが比較的低品質(高いCq値を有する)又は比較的高品質(低いCq値を有する)であることをユーザーに示すことができる。このようにして、Cq値は、配列決定などによってライブラリーを更に評価するかどうかを評価するために所与のライブラリーの質を推定するため、及び不十分なデータを生じるライブラリーの配列決定に関連する時間及び費用を回避するために使用され得る。
【0231】
2.ニックから生成される二本鎖DNA切断
いくつかの実施形態では、方法は、ニックから二本鎖切断を生成することを更に含む。いくつかの実施形態では、二本鎖切断は、QC法においてフォワードプライマー及びリバースプライマーをアニーリングする前にニックから生成される。
【0232】
いくつかの実施形態では、酵素を用いて、ニックから二本鎖切断を調製する。言い換えれば、二本鎖切断を生成することは、酵素反応を使用して行われ得る。いくつかの実施形態では、酵素反応はエンドヌクレアーゼによって行われる。いくつかの実施形態では、エンドヌクレアーゼは、T7エンドヌクレアーゼである。
【0233】
いくつかの実施形態では、二本鎖切断を含むライブラリー分子は、増幅中にライブラリー分子の完全配列に対応するアンプリコンを生成しない。いくつかの実施形態では、二本鎖切断は、挿入部内のライブラリー分子を切断し、ライブラリー分子の完全長アンプリコンは、切断後に生成され得ない。
【0234】
いくつかの実施形態では、二本鎖切断を含むライブラリー分子から生成されたアンプリコンが、フォワードプライマー及び/又はリバースプライマーに結合するための配列を欠いている。いくつかの実施形態では、二本鎖切断は、挿入部内のライブラリー分子を切断し、2つの異なるヘアピンアダプター(ライブラリー挿入部の2つの末端に関連する)に含まれるプライマー結合配列が分離される。いくつかの実施形態では、切断後、フォワードプライマーもリバースプライマーも、ライブラリー分子への結合後に完全長アンプリコンを生成することができない。
【0235】
B.ヘアピンアダプター
本明細書で使用される場合、「ヘアピン」とは、互いに少なくとも部分的に相補的である一対の核酸配列を含む核酸を指す。少なくとも部分的に相補的であるこれらの2つの核酸配列は、互いに結合し、核酸の折り畳みを媒介することができる。いくつかの実施形態では、少なくとも部分的に相補的である2つの核酸配列は、ヘアピン二次構造を有する核酸を生成する。
【0236】
本明細書で使用される「ヘアピンアダプター」は、互いに少なくとも部分的に相補的である少なくとも1対の核酸配列を含むアダプターを指す。いくつかの実施形態では、ヘアピンアダプターは、折り畳まれた二次構造を有する。
【0237】
いくつかの実施形態では、ヘアピンアダプターは、1つ以上のアダプター配列を含む。いくつかの実施形態では、アダプター配列は、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、切断配列、若しくは配列決定関連配列、又はそれらの組み合わせを含む。本明細書で使用される場合、配列決定関連配列は、後の配列決定工程に関連する任意の配列であり得る。配列決定関連配列は、下流の配列決定工程を単純化するように作用し得る。例えば、配列決定関連配列は、他の点でアダプターを核酸断片にライゲーションする工程を介して組み込まれる配列であり得る。いくつかの実施形態では、アダプター配列は、特定の配列決定方法においてフローセルへの結合を容易にするために、P5又はP7配列(又はそれらの相補体)を含む。
【0238】
いくつかの実施形態では、ヘアピンアダプターは、増幅プライマー配列(すなわち、増幅プライマー配列に結合する配列)を含む。いくつかの実施形態では、ヘアピンアダプターは、増幅プライマー配列と、アダプター配列に少なくとも部分的に相補的な配列の全部又は一部と、を含む。いくつかの実施形態では、ヘアピンに含まれた増幅プライマー配列は、ユニバーサルプライマー配列である。ユニバーサル配列は、2つ以上の核酸断片に共通の(すなわち、共有される)ヌクレオチド配列の領域である。
【0239】
いくつかの実施形態では、フォワードプライマー又はリバースプライマーのいずれかは、一方又は両方のヘアピンアダプターに含まれる1つ以上の配列に結合する。いくつかの実施形態では、フォワードプライマー及びリバースプライマーの両方は、一方又は両方のヘアピンアダプターに含まれる1つ以上の配列に結合する。いくつかの実施形態では、フォワードプライマーは、二本鎖DNA挿入部の第1の末端に結合したヘアピンアダプターに含まれる配列に結合し、リバースプライマーは、二本鎖DNA挿入部の第2の末端に結合したヘアピンアダプターに含まれる配列に結合する。
【0240】
いくつかの実施形態では、ライブラリー分子は、二本鎖核酸を含む挿入部及び挿入部の両末端にヘアピンアダプターを含む。いくつかの実施形態では、挿入部は、標的核酸由来の断片を含む。ヘアピンアダプターを組み込む方法は、ライゲーション又はタグメンテーションによるものなど、当技術分野で周知である。
【0241】
例えば、NEBNext(登録商標)Multiplex Oligos for Illumina(登録商標)(New England BioLabs)は、ライブラリー産物の収量を増加させるためのヘアピンアダプター及びプライマーを提供する。いくつかの実施形態では、ヘアピンアダプターは、アダプター二量体形成を最小化するヘアピンループ構造を含む。いくつかの実施形態では、ヘアピンアダプターは、末端修復されたdAテール付加DNAにライゲーションされる。いくつかの実施形態では、ヘアピンアダプターは、USER試薬による処理によって除去されるウラシルを含有するループを含む。いくつかの実施形態では、USER酵素は、ウラシルDNAグリコシラーゼ(UDG)及びDNAグリコシラーゼ-リアーゼ(エンドヌクレアーゼVIIIなど)の混合物である。いくつかの実施形態では、USER処理は、ヘアピンアダプターのループを開き、インデックスプライマーを組み込むための増幅及びその後の配列決定のための基質として利用可能にすることができる。
【0242】
いくつかの実施形態では、ヘアピンアダプターは、遺伝子座特異的プライマー及びUSER試薬を使用して組み込まれ、ヘアピンアダプターをライゲーションするためのオーバーハングを生成する。例示的な方法は、SMRTbellライブラリー調製である(Pacific Biosciences、SMRTbell Library Preparation & SMRT Sequencing Workflow Updates,2017参照)。
【0243】
いくつかの実施形態では、ヘアピンアダプターは、比較的大きな挿入部を有するライブラリー分子に含まれ、ライブラリー分子は、長リード配列決定のために設計される。
【0244】
いくつかの実施形態では、各ヘアピンアダプターは、増幅プライマー結合部位を含む。いくつかの実施形態では、挿入部の第1の末端におけるヘアピンアダプターは、挿入部の第2の末端におけるヘアピンアダプターとは異なる増幅プライマー結合部位を含む。いくつかの実施形態では、挿入部の第1の末端におけるヘアピンアダプターは、第1の増幅プライマー結合部位を含み、挿入部の第2の末端におけるヘアピンアダプターは、第2の増幅プライマー結合部位を含む。いくつかの実施形態では、第1の増幅プライマー結合部位及び第2の増幅プライマー結合部位は、反対方向の増幅を媒介する。
【0245】
図9に示されるようないくつかの実施形態では、挿入部の第1の末端のヘアピンアダプターは、フォワード増幅プライマー結合部位を含んでもよく、挿入部の第2の末端のヘアピンアダプターは、リバース増幅プライマー結合部位を含んでもよい。
【0246】
C.増幅
いくつかの実施形態では、方法は、増幅プライマー配列に結合する増幅プライマーを使用してライブラリー分子を増幅することを更に含む。いくつかの実施形態では、ライブラリー分子に含まれる一方又は両方のヘアピンアダプターは、増幅プライマーを含む。
【0247】
いくつかの実施形態では、増幅することは、5kb以上、10kb以上、15kb以上、20kb以上、25kb以上、又は30kb以上であるライブラリー分子を増幅するために最適化されている。
【0248】
いくつかの実施形態では、増幅することは、長いアンプリコンの増幅に最適化されているポリメラーゼを用いて行われる。いくつかの実施形態では、ポリメラーゼは、20kb以上又は30kb以上のアンプリコンの増幅に最適化されている。
【0249】
長いアンプリコンの増幅に最適化されている多くの例示的なポリメラーゼが、当該分野で既知である。1つの例示的なポリメラーゼは、PrimeSTAR GXL DNAポリメラーゼ(Takara)である。
【0250】
いくつかの実施形態では、ポリメラーゼは、野生型Taqポリメラーゼと比較してより高い処理能力及び/又は伸長速度を有する。いくつかの実施形態では、ポリメラーゼは、処理能力又は伸長速度を増加させる1つ以上の突然変異又は融合を含む。
【0251】
本明細書中で使用される場合、ポリメラーゼの「処理能力」とは、ポリメラーゼが、DNA鋳型から解離する前に、単一の鋳型結合事象の間にDNAに組み込まれ得るヌクレオチドの数を指す。したがって、比較的高い処理能力を有するポリメラーゼは、単一の鋳型結合事象の間に多数のヌクレオチドを組み込むことができる。より高い処理能力は、完全なアンプリコンがPCRサイクルの間に生成される可能性を増加させ得る。
【0252】
本明細書中で使用される場合、ポリメラーゼの「伸長速度」は、ある期間にわたってDNAに組み込まれ得るヌクレオチドの数である。いくつかの実施形態、比較的高い伸長速度を有するポリメラーゼは、PCRサイクル中にライブラリー分子の完全なアンプリコンを生成することができる。いくつかの実施形態では、ポリメラーゼは、2kb/分以上、3kb/分以上、又は4kb/分以上の伸長速度を有する。
【0253】
いくつかの実施形態では、ポリメラーゼは、3kb/分以上の伸長速度を有する。
【0254】
いくつかの実施形態では、増幅は指数関数的である。
【0255】
いくつかの実施形態では、30サイクル以上又は40サイクル以上の増幅が行われる。
【0256】
いくつかの実施形態では、増幅プライマーは、インデックス配列を含み得る。これらのインデックス配列は、試料及びアレイ中の位置を同定するために使用され得る。いくつかの実施形態では、インデックス配列は、固有分子識別子(unique molecular identifier、UMI)を含む。UMIは、国際公開第2016/176091号、同第2018/197950号、同第2018/197945号、同第2018/200380号、及び同第2018/204423号に記載されている(これらの各々は、参照によりその全体が本明細書に組み込まれる)。
【0257】
いくつかの実施形態では、試料は、固体支持体上で増幅される。
【0258】
例えば、いくつかの実施形態では、試料は、米国特許第7,985,565号及び同第7,115,400号の開示によって例示されるように、クラスター増幅方法論を使用して増幅される(これらの各々の内容は、参照によりその全体が本明細書に組み込まれる)。米国特許第7,985,565号及び同第7,115,400号の組み込まれている材料は、固定化された核酸分子のクラスター又は「コロニー」からなるアレイを形成するために、増幅産物を固体支持体上に固定化することを可能にする固相核酸増幅の方法を記載する。そのようなアレイ上の各クラスター又はコロニーは、複数の同一の固定化されたポリヌクレオチド鎖及び複数の同一の固定化された相補的ポリヌクレオチド鎖から形成される。そのように形成されたアレイは、本明細書では一般に「クラスター化アレイ」と称される。米国特許第7,985,565号及び同第7,115,400号に記載されているような固相増幅反応の産物は、固定化されたポリヌクレオチド鎖と固定化された相補鎖の対をアニーリングすることによって形成されるいわゆる「ブリッジ(bridged)」構造体であり、両方の鎖は、いくつかの実施形態では、共有結合を介して、5’末端で固体支持体上に固定化されている。クラスター増幅方法論は、固定化された核酸鋳型を使用して固定化されたアンプリコンを産生する方法の例である。他の好適な方法論を使用して、本明細書で提供される方法に従って産生された固定化されたDNA断片から固定化されたアンプリコンを産生することもできる。例えば、1つ以上のクラスター又はコロニーは、増幅プライマーの各対の一方又は両方のプライマーが固定化されているかどうかにかかわらず、固相PCRによって形成することができる。
【0259】
他の実施形態では、試料は、溶液中で増幅される。例えば、いくつかの実施形態では、試料は、切断されるか、又は他の方法で固体支持体から遊離され、次いで、増幅プライマーは、溶液中で遊離分子にハイブリダイズする。他の実施形態では、増幅プライマーを、1つ以上の初期の増幅工程のために所望の試料にハイブリダイズさせ、続いて、溶液中で後続の増幅工程を行う。いくつかの実施形態では、固定化された核酸鋳型を使用して、液相アンプリコンを生成することができる。
【0260】
本明細書に記載されているか又は当該技術分野で一般に知られている増幅方法論のいずれかを、ユニバーサルプライマー又は標的特異的プライマーとともに利用して、所望の試料を増幅できることが理解されるであろう。増幅のための好適な方法には、参照によりその全体が本明細書に組み込まれる、米国特許第8,003,354号に記載されるように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写媒介増幅(TMA)及び核酸配列ベースの増幅(NASBA)が含まれるが、これらに限定されない。上記の増幅方法を使用して、目的とする1つ以上の核酸を増幅することができる。例えば、多重PCR、SDA、TMA、NASBAなどを含むPCRを利用して、固定化DNA断片を増幅することができる。いくつかの実施形態では、目的とする核酸に特異的に向けられるプライマーは、増幅反応に含まれる。
【0261】
ポリヌクレオチドの増幅に好適な他の方法としては、オリゴヌクレオチド伸長及びライゲーション、ローリングサークル増幅(rolling circle amplification、RCA)(Lizardi et al.,Nat.Genet.19:225-232(1998)、参照により本明細書に組み込まれる)、及びオリゴヌクレオチドライゲーションアッセイ(oligonucleotide ligation assay、OLA)(一般に米国特許第7,582,420号、同第5,185,243号、同第5,679,524号、及び同第5,573,907号、欧州特許第0320308(B1)号、同第0336731(B1)号、同第0439182(B1)号、国際公開第90/01069号、同第89/12696号、及び同第89/09835号、その全てが参照により組み込まれる)技術、を挙げることができる。これらの増幅方法論は、固定化DNA断片を増幅するように設計され得ることを理解されたい。例えば、いくつかの実施形態では、増幅方法は、目的とする核酸に特異的に向けられるプライマーを含むライゲーションプローブ増幅又はオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含み得る。いくつかの実施形態では、増幅方法は、目的の核酸に特異的に指向されるプライマーを含有するプライマー伸長ライゲーション反応を含んでもよい。目的の核酸を増幅するように特別に設計することができるプライマー伸長及びライゲーションプライマーの非限定的な例として、増幅は、米国特許第7,582,420号及び同第7,611,869号(これらの各々は、参照によりその全体が本明細書に組み込まれる)に例示されるようなGoldenGateアッセイ(Illumina,Inc.、San Diego,CA)に使用されるプライマーを含み得る。
【0262】
本開示の方法で使用され得る例示的な等温増幅方法としては、例えばDean et al.,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)により例示される多置換増幅(Multiple Displacement Amplification、MDA)、又は例えば米国特許第6,214,587号(これらの各々は、参照によりその全体が本明細書に組み込まれる)により例示される等温鎖置換核酸増幅が挙げられるが、これらに限定されない。本開示で使用され得る他の非PCRベースの方法としては、例えば、Walker et al.,Molecular Methods for Virus Detection,Academic Press,Inc.,1995、米国特許第5,455,166号、及び同第5,130,238号、並びにWalker et al.,Nucl.Acids Res.20:1691-96(1992)に記載されている鎖置換増幅(SDA)又は例えば、Lage et al.,Genome Research 13:294-307(2003)に記載されている超分枝鎖置換増幅が挙げられ、これらの各々は、参照によりその全体が本明細書に組み込まれる。等温増幅法は、ゲノムDNAのランダムプライマー増幅のために、鎖置換Phi 29ポリメラーゼ又はBst DNAポリメラーゼの大型断片、5′→3′エキソ-とともに使用することができる。これらのポリメラーゼの使用は、それらの高い加工性及び鎖置換活性を利用する。高い加工性により、ポリメラーゼは、10~20kbの長さの断片を産生することが可能になる。上記のように、クレノウポリメラーゼなどの低いプロセッシビティと鎖置換活性を有するポリメラーゼを使用して、等温条件下でより小さな断片を産生することができる。増幅反応、条件、及び成分の更なる説明は、米国特許第7,670,810号の開示に詳細に記載されている(参照によりその全体が本明細書に組み込まれる)。
【0263】
D.配列決定
いくつかの実施形態では、方法は、ライブラリー産物及び増幅されたライブラリー産物(すなわち、アンプリコン)を配列決定することを更に含む。いくつかの実施形態では、QCアッセイ後のライブラリーの分析は配列決定である。
【0264】
いくつかの実施形態では、方法は、Cq値に基づいてライブラリーの分析のための条件を決定することを含む。いくつかの実施形態では、QCアッセイは、ライブラリーを配列決定する条件を決定するために使用される。いくつかの実施形態では、QCアッセイは、所与のライブラリーを配列決定すべきでないことを決定するために使用される。例えば、QCアッセイは、所与のライブラリー中に十分なライブラリー分子が存在せず、その結果、ライブラリーから生成された配列決定データが低品質であることを推定し得る。
【0265】
いくつかの実施形態では、方法は、インサートの全配列の配列決定を可能にする。
【0266】
1つの例示的な配列決定方法論は、合成による配列決定(sequencing-by-synthesis、SBS)である。SBSにおいて、核酸テンプレートに沿った核酸プライマーの伸長を監視して、テンプレート中のヌクレオチド配列を判定する。基礎となる化学プロセスは、重合(例えば、ポリメラーゼ酵素によって触媒される)であり得る。特定のポリマーベースのSBSの実施形態では、プライマーに付加されるヌクレオチドの順序及び種類の検出を使用して鋳型の配列を決定することができるように、蛍光標識ヌクレオチドを鋳型依存的にプライマーに付加する(それによってプライマーを伸長させる)。
【0267】
フローセルは、配列決定のための便利な固体支持体を提供する。例えば、第1のSBSサイクルを開始するために、1つ以上の標識されたヌクレオチド、DNAポリメラーゼなどを、1つ以上の増幅された核酸分子を収容するフローセルに流入/通過させることができる。プライマー伸長によって標識ヌクレオチドを組み込む部位は、検出することができる。任意選択的に、ヌクレオチドは、ヌクレオチドがプライマーに付加されると、更なるプライマー伸長を終結する可逆的終結特性を更に含むことができる。例えば、脱ブロック作用因子が送達されてその部分を除去するまで、その後の伸長が起こらないように、可逆的ターミネータ部分を有するヌクレオチド類似体をプライマーに付加することができる。したがって、可逆的終端を使用する実施形態では、脱ブロック試薬をフローセルに送達することができる(検出発生の前又は後)。洗浄は、様々な送達工程の間に実施することができる。次に、サイクルをn回繰り返してプライマーをn個のヌクレオチドで伸長し、それによって長さnの配列を検出することができる。本開示の方法によって生成されるアンプリコンとともに使用するために容易に適合させることができる例示的なSBS手順、流体系及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
【0268】
パイロシーケンシングなどの、サイクル反応を使用する他の配列決定手順を使用することができる。パイロシーケンシングは、特定のヌクレオチドが新生核酸鎖に取り込まれる際の、無機ピロリン酸(PPi)の放出を検出する(Ronaghi et al.,Analytical Biochemistry 242(1),84-9(1996)、Ronaghi,Genome Res.11(1),3-11(2001)、Ronaghi et al.Science 281(5375),363(1998)、米国特許第6,210,891号、同第6,258,568号、及び同第6,274,320号、これらの各々は参照により本明細書に組み込まれる)。パイロシーケンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(adenosine triphosphate、ATP)に即座に変換されることで検出することができ、生成されたATPのレベルは、ルシフェラーゼ産生光子を介して検出することができる。したがって、配列決定反応は、発光検出システムを介して監視することができる。蛍光ベースの検出システムに使用される励起放射線源は、パイロシークエンシング手順には必要ない。本開示に従って生成されたアンプリコンへのパイロシーケンシングの適用に適合させることができる有用な流体システム、検出器、及び手順は、例えば国際公開第2012058096号、米国特許出願公開第2005/0191698(A1)号、米国特許第7,595,883号、及び同第7,244,559号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
【0269】
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。例えば、ヌクレオチドの取り込みは、フルオロフォア担持ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(fluorescence resonance energy transfer、FRET)相互作用を介して、又はゼロモード導波路(zeromode waveguide、ZMW)を用いて検出することができる。FRETベースの配列決定のための技術及び試薬は、例えば、Levene et al.Science 299,682-686(2003)、Lundquist et al.Opt.Lett.33,1026-1028(2008)、Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)に記載され、それらの開示は参照により本明細書に組み込まれる。
【0270】
いくつかのSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又は、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、若しくは同第2010/0282617(A1)号に記載されている配列決定方法及びシステムであり、これらの各々は、参照により本明細書に組み込まれる。速度論的排除(kinetic exclusion)を使用して核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を生成することができる。
【0271】
別の有用なシークエンシング技術は、ナノポアシークエンシングである(例えば、Deamer et al.Trends Biotechnol.18,147-151(2000);Deamer et al.Acc.Chem.Res.35:817-825(2002)、Li et al.Nat.Mater.2:611-615(2003)を参照されたく、これらの開示は、参照により本明細書に組み込まれる)。いくつかのナノポアの実施形態では、核酸又は核酸から除去された個々のヌクレオチド個々のヌクレオチドは、ナノポアを通過する。核酸又はヌクレオチドがナノポアを通過するとき、各ヌクレオチドの種類は、ポアの電気コンダクタンスの変動を測定することによって識別され得る。(米国特許第7,001,792号、Soni et al.Clin.Chem.53,1996-2001(2007)、Healy,Nanomed.2,459-481(2007)、Cockroft et al.J.Am.Chem.Soc.130,818-820(2008)、これらの開示は、参照により本明細書に組み込まれる)。
【0272】
本開示による検出に適用することができるアレイベースの発現及び遺伝子型解析のための例示的な方法は、米国特許第7,582,420号、同第6,890,741号、同第6,913,884号、若しくは同第6,355,431号、又は米国特許公開第2005/0053980(A1)号、同第2009/0186349(A1)号、若しくは同第2005/0181440(A1)号に記載されており、これらの各々は参照により本明細書に組み込まれる。
【0273】
本明細書に記載の方法の利点は、複数の核酸を並行して迅速かつ効率的に検出することを提供することである。したがって、本開示は、上記で例示されるものなどの当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の固定化されたDNA断片に送達することができる流体構成要素を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768(A1)号及び同第2012/0270305(A1)号に記載されており、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、又核酸の配列を決定することができる統合シークエンシングシステムの例としては、MiSeq(商標)プラットフォーム(Illumina,Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願公開第2012/0270305号(参照により本明細書に組み込まれる)に記載の装置が挙げられるが、これらに限定されない。
【0274】
E.Cq値
いくつかの実施形態では、産生されたライブラリーアンプリコンの数は、定量的PCR(qPCR)によって推定される。いくつかの実施形態では、産生されたライブラリーアンプリコンの数は、定量のサイクル(Cq、定量サイクルとしても知られる)値を測定することによって推定される。
【0275】
本明細書で使用される場合、Cq値は、試料の反応曲線が閾値線と交差するPCRサイクル数である。したがって、Cq値は、所与の試料についてノイズを超えるシグナルを検出するのに必要なPCRのサイクル数を示す。
【0276】
これは、蛍光色素及びプローブを用いて決定され得、この方法は、蛍光を検出するために必要とされる増幅サイクルの数を測定する。この方法を使用すると、Cq値は、PCR産物の蛍光がバックグラウンドシグナルを超えて検出され得るサイクル数である。したがって、より高いCq値は、より少ない核酸が試料中に存在することを示す。
【0277】
Bustin et al.,Clinical Chemistry 55(4):611-622(2009)に記載されているように、閾値サイクル(Ct)、交差点(Cp)、及び出発点(TOP)という用語は全て、Cq値と同じ測定値を指し、名称の違いは単に異なる機器に基づく。これらの用語(Ct、Cp、及びTOP)は全て、試料の反応曲線が閾値線と交差するPCRサイクル数を決定する方法を指し、したがって、これらの値は全て、Cq値の同義語である。
【0278】
いくつかの実施形態では、ライブラリーアンプリコンの数が多いほど、Cq値が低くなる。いくつかの実施形態では、より低いCq値を有するライブラリーは、より少ないDNA損傷を有する。いくつかの実施形態では、より少ないDNA損傷を有するライブラリーは、より良好な配列決定結果を生じる。
【0279】
いくつかの実施形態では、ニックを含むこれらのライブラリー産物は、ライブラリー分子の完全配列に対応するアンプリコンを生成しない。いくつかの実施形態では、増幅サイクル中の伸長(すなわち、アンプリコンの生成)は、ライブラリー分子中のニックの部位で停止する。
【0280】
例えば、図9は、増幅がフォワード及びリバース増幅プライマー結合部位の両方を有するライブラリー分子の完全配列を産生しないために、ニックを有するライブラリー分子(すなわち、損傷ライブラリー)がより少ないシグナルを生成する様子を示す。
【0281】
いくつかの実施形態では、Cq値は、ライブラリー中の損傷の割合と相関する。いくつかの実施形態では、損傷はライブラリー調製中に導入された。
【0282】
いくつかの実施形態では、高いCq値は、ライブラリー分子のより多くのDNA損傷と相関する。いくつかの実施形態では、高いCq値を有するライブラリーは、より低い配列決定性能を示す。いくつかの実施形態では、より低い配列決定性能は、総出力(Gb)又はP1パーセントによって測定される。
【0283】
いくつかの実施形態では、変則的に低い(例えば、2.58未満)Cq値はまた、より低い配列決定性能を有し得る。
【0284】
いくつかの実施形態では、次のライブラリーの使用に応じて適切なデータ品質を有する配列決定ランを生じる所望のCq範囲を決定することができる。いくつかの実施形態では、所望のCq範囲は、2.58~5であり得る。Cq範囲は、使用されるライブラリーの特定の種類に基づいて変動し得る。したがって、ユーザーは、十分な品質の配列決定データをもたらす所望のCq範囲を決定するために最初の実験を行い、次いで、この範囲内のCq値を有する配列ライブラリーのみを選択することができる。所望のCq範囲を決定するためのこのような分析は、当業者によって容易に実施され、このような決定は、過度の負担とはみなされない。
【0285】
F.長リード配列決定
標準的な短リード配列決定は、短距離情報を提供するために正確な塩基レベルの配列を提供するが、短リード配列決定は、長距離ゲノム情報を提供しない場合がある。更に、ハプロタイプ情報は、配列決定されたゲノム又は短リードデータを有する参照について保持されないため、長距離ハプロタイプの再構築は、標準的な方法では困難である。したがって、標準的な配列決定及び分析アプローチは、一般に、単一ヌクレオチドバリアント(single nucleotide variant、SNV)をコールすることができるが、これらの方法は、個々のゲノムにおいてみられる構造変異の全スペクトルを同定しない場合がある。ゲノムの「構造変異」は、本明細書で使用される場合、50塩基対以上の事象を含む、SNVより大きな事象を指す。代表的な構造バリアントには、コピー数変異、逆位、欠失、及び重複が含まれる。
【0286】
「連結長リード配列決定」又は「連結リード配列決定」は、ゲノム配列に関する長距離情報を提供する配列決定方法を指す。
【0287】
いくつかの実施形態では、連結リード配列決定は、分子バーコードを使用して、同じ長いDNA断片に由来するリードをタグ付けする。固有のバーコードが、個々のDNA分子から生成された全てのリードに付加される場合、リードは、そのDNA分子を一緒に連結することができる。言い換えれば、バーコードを共有するリードは、単一の長いインプット分子に由来するものとして分類することができ、長距離情報を短リードからアセンブリすることを可能にする。
【0288】
いくつかの実施形態では、連結リード配列決定は、ハプロタイプ再構築のために使用され得る。いくつかの実施形態では、連結リード配列決定は、構造バリアントのコーリングを改善する。いくつかの実施形態では、連結リード配列決定は、アクセス可能性が制限されたゲノムの領域へのアクセスを改善する。いくつかの実施形態では、連結リード配列決定は、デノボ二倍体アセンブリのために使用される。いくつかの実施形態では、連結リード配列決定は、デノボアセンブリを必要とする高度に多型の配列(ヒト白血球抗原遺伝子など)の配列決定を改善する。
【0289】
いくつかの実施形態では、配列決定は、5kb以上、10kb以上、15kb以上、20kb以上、25kb以上、又は30kb以上であるライブラリー分子の長リード配列決定である。
【0290】
G.二本鎖DNA切断の調製を含む方法
いくつかの実施形態では、ニックは、二本鎖DNA切断に変換される。ニックから二本鎖DNA切断を生成する利点は、二本鎖切断がライブラリー産物において生成された後に、完全なライブラリー分子に対応するアンプリコンが生成され得ないことである。このようにして、ニックを含むライブラリー分子は、ライブラリー産物の完全配列に対応するアンプリコンを全く生成しない。対照的に、二本鎖挿入部の一本鎖にニックを含むニックの入ったライブラリー分子は、より少ないアンプリコンを生成するが、ライブラリー産物の完全配列に対応するいくつかのアンプリコンを生成することができる(図9に示される)。これは、リバースプライマー又はフォワードプライマーのいずれかが、ライブラリー分子の完全配列に対応するアンプリコンを生成し得るためである。
【0291】
ニックから二本鎖切断を生成する利点は、二本鎖切断を有するライブラリー分子が、フォワードプライマー及びリバースプライマーとの結合部位の両方を有する完全長アンプリコンを生成することができないことである。
【0292】
いくつかの実施形態では、ニックは、エンドヌクレアーゼを使用して二本鎖切断に変換される。いくつかの実施形態では、エンドヌクレアーゼは、変異型T7エンドヌクレアーゼである。いくつかの実施形態では、変異型エンドヌクレアーゼは、マルトース結合タンパク質(MBP)-T7 Endo Iである。いくつかの実施形態では、T7エンドヌクレアーゼは、それまでニックが一本鎖中に位置していたDNAにおいて二本鎖切断を生成するために、カウンターニックを生成する。そのようなニックからの二本鎖切断の生成は、ニックを横切る切断と称され得る。
【0293】
H.SMRTbell鋳型を用いる方法
いくつかの実施形態では、ライブラリー分子は、二本鎖DNA断片の末端にライゲーションされる2つのヘアピンアダプターを含む。いくつかの実施形態では、そのようなアダプターは、閉ループを形成する。
【0294】
本発明はこの調製方法に限定されないが、いくつかの実施形態では、ライブラリー分子はSMRTbell鋳型である。SMRTbell鋳型は、1分子リアルタイム(SMRT)配列決定と共に使用するために当該分野で周知である。いくつかの実施形態では、SMRT配列決定は、Pacific Biosciences(PacBio)の方法を使用する(例えば、Rhoads and Au,Genomics Proteomics Bioinformatics 13:278-289(2015)参照)。本明細書で使用される場合、SMRT配列決定及びPacBio配列決定は、互換的に使用され得る。
【0295】
SMRT配列決定手法は、環状コンセンサス配列決定(CCS)を利用して、>99%の精度かつ≧3回のパスを伴う高精度で長い高忠実度のリードを生成する。配列決定ランごとにHiFiリードの最高出力を生成するために、一定のローリングサークル増幅(RCA)を可能できる高品質のSMRTbell鋳型が生成されなくてはならない。例えば、PacBio Sequelシステムは、オンプラットフォームRCAを使用して、ヘアピンアダプターがライゲーションされたライブラリー分子を配列決定できる。したがって、CCSリードを生成するために、ポリメラーゼは、挿入部の長さの≧3倍の長いポリメラーゼリード長を生成するように、反復パスで配列決定すべきである。
【0296】
SMRTシステムにおけるポリメラーゼが効率的に配列決定するためには、入力ライブラリーは高品質でなければならない。ライブラリー調製プロセスの間に、ピペッティング、保存又は他の取り扱い及び/又は手技的エラーのいずれかによって、損傷がDNAに導入され得る。ニックの入ったSMRTbell鋳型が配列決定のためにBio Sequelシステムにロードされる場合、ポリメラーゼはニック部位で脱落し、RCAを終結させ、結果として、P1パーセントは、その配列決定ランからのCCS出力と共に減少する。
【0297】
SMRT配列決定の利点は、特定の他の配列決定方法よりも長いリード長と速いランである。例えば、PacBioシステムは、60キロベースを超えるリード長を生成できることが知られている。これらのより長いリード長は、単一のリード内の反復領域の正確な位置及び配列を可能でき、これは、他の配列決定プラットフォームでは利用できない場合がある。
【0298】
要約すると、SMRT配列決定は、いくつかの他の方法よりも低いスループット、高いエラー率、及び高い塩基あたりコストを有することが知られており、ユーザーはこれらの欠点を最小限にすることを望むであろう。いくつかの実施形態では、本発明のライブラリーの品質管理の方法は、ユーザーが、SMRT配列決定などの方法を用いて十分な品質の配列決定ランを生成する可能性が高い配列決定のためのライブラリーを選択することを可能にする。このようにして、ユーザーは、質の高い配列決定データを生成する能力を制限するDNA損傷を有する配列決定ランに費やされる費用及び時間を回避することができる。
【0299】
いくつかの実施形態では、本明細書に記載されるQC方法は、SMRT配列決定ランからのP1パーセント及び総出力を最大化する。いくつかの実施形態では、本明細書に記載されるqPCR QC方法は、顧客によるSMRT配列決定プラットフォーム上への損傷したライブラリーのロードの回避を可能にし、したがって時間、費用、試薬、及び消耗品の節約を可能にする。図13A図15Cは、SMRT配列決定を用いたQCアッセイのいくつかの代表的なデータを示す。
【0300】
V.蛍光を使用してDNA損傷を決定する方法
DNAを含む試料中のDNA損傷の量はまた、本明細書中に記載される方法によって蛍光を使用して測定され得る。いくつかの実施形態では、DNA損傷は、ライブラリーが調製される前に、蛍光を使用して試料DNAにおいて定量化され得る。そのようなワークフローは、配列決定などの下流のアッセイに弊害をもたらす、試料中のDNA損傷が多すぎることをユーザーが決定することを可能にするため、非常に魅力的であり得る。例えば、ユーザーは、試料中のDNA損傷を定量化し、次いで、低レベル(例えば、5%以下)のDNA損傷が存在する場合にのみ、試料からライブラリーを調製し得る。このようにして、ユーザーは、中程度(例えば、5%超)レベルのDNA損傷を有する試料からライブラリーを調製しないことによって、時間及び資源を節約することができる。
【0301】
いくつかの実施形態では、蛍光を使用してDNAを含む試料中のDNA損傷を定量化する方法は、
a.
i.DNAを含む試料のアリコートと、
ii.1つ以上のDNA修復酵素と、
iii.1つ以上のdNTPが蛍光標識されている、dNTPと、を組み合わせることと、
b.修復されたDNAを調製することと、
c.dNTPからリン酸を脱リン酸化することと、
d.修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させることと、
e.再懸濁緩衝液を用いて、結合した修復DNAをカルボキシレートビーズ又はセルロースビーズから溶出することと、
f.修復されたDNAの蛍光を測定して、DNA損傷の量を決定することと、を含む。
【0302】
DNA損傷を定量化する方法の概要を図16に示し、この方法を用いた代表的な実験の結果を図17図21に示す。
【0303】
いくつかの実施形態では、修復されたDNAのより高い蛍光は、より多いDNA損傷を示す。言い換えれば、より高いレベルのDNA損傷が存在する場合、より多くの蛍光標識されたdNTPが組み込まれる。
【0304】
いくつかの実施形態では、修復されたDNAの蛍光は、異なる量のDNA損傷の範囲にわたって線形である。このようにして、アッセイのダイナミックレンジ(すなわち、正確に測定できるDNA損傷の全範囲)が改善され、したがって、ユーザーは、様々なライブラリーに対する損傷の相対的な差を評価することができる。いくつかの実施形態では、比較的少量のDNA損傷が結果に悪影響を及ぼし得る高感度の下流アッセイのためにユーザーが試料を評価している場合、広い線形範囲は、その量のDNA損傷を正確に決定するのに役立ち得る。
【0305】
いくつかの実施形態では、方法は、試料のアリコート中のDNA損傷を評価することができる。言い換えれば、ユーザーは、少量の試料を採取し、DNA損傷を定量化し、次いで、DNA損傷の定量化の結果に基づいて、潜在的により多くのアッセイ(ライブラリー調製又は配列決定等)を行うことができる。
【0306】
いくつかの実施形態では、方法は、操作の前後に同じ試料のアリコートを評価することによって、試料の操作によって誘発されたDNA損傷を評価することができる。このようにして、ユーザーは、操作によって誘発された任意のDNA損傷を直接測定することができる。
【0307】
いくつかの実施形態では、操作は試料の配列決定である。例えば、ユーザーは、特定の試薬がDNA損傷を誘発するかどうかを決定するために、DNAを含む試料に対する異なる配列決定試薬の影響の評価を望む場合がある。
【0308】
いくつかの実施形態では、修復されたDNAの蛍光を測定することは、修復されたDNAの希釈物の標準曲線を作成することと、修復されたDNAの希釈物の蛍光を測定することと、を含む。いくつかの実施形態では、標準曲線の使用は、アッセイのダイナミックレンジを増加させて、少量のDNA損傷の定量化を可能にできる。少量のDNA損傷を定量化するためのこのような方法は、少量のDNA損傷であっても下流のアッセイ(配列決定など)の結果に弊害をもたらし得る場合に有用であり得る。
【0309】
いくつかの実施形態では、修復されたDNAの蛍光を測定することは、修復されたDNAの蛍光を、蛍光標識された1つ以上のdNTPのみの希釈物の別個の標準曲線に対して比較し、修復されたDNAに含まれる蛍光色素分子の数を決定することを含む。
【0310】
いくつかの実施形態では、方法は、決定された蛍光色素分子の数を修復されたDNAの質量で割ることによって、修復されたDNAに含まれる蛍光色素分子の正規化された数を計算することを更に含む。そのような尺度は、DNAの損傷されている割合を推定することができる。
【0311】
いくつかの実施形態では、DNAは、ゲノムDNA、cDNA、又は断片化二本鎖DNAを含むライブラリーである。DNAがゲノムDNA又はcDNAである場合、この方法は、ライブラリー調製の前に実施され得る。
【0312】
いくつかの実施形態では、DNAは、ゲノムDNA及びcDNAであり、方法は、DNA損傷の量を決定した後にライブラリーを調製することを更に含む。
【0313】
いくつかの実施形態では、DNA損傷の量が全ヌクレオチドの5%以下、4%以下、3%以下、2%以下、又は1%以下である場合にライブラリーが調製される。言い換えれば、ライブラリーは、DNA損傷が低いと決定される場合に調製され得る。ライブラリー調製又は他の下流アッセイに受容可能なDNA損傷の量は、下流アッセイの感度及びDNA損傷の種類に依存する。例えば、短リード配列決定は、中程度のレベルのDNA損傷(例えば、5%以下)であっても、許容可能な配列決定結果を与え得る。対照的に、長リード配列決定は、許容可能な結果のためにより低いレベルのDNA損傷(例えば、2%以下)を必要とする場合があり、また、ニッキングによって誘発される損傷に対してより感受性であり得る。
【0314】
いくつかの実施形態では、本発明のアッセイが特定の種類の損傷(ニッキングなど)の存在を決定する場合、この損傷は、ライブラリー調製又は配列決定などの更なる工程の前に修復され得る。
【0315】
いくつかの実施形態では、DNA損傷の量が全ヌクレオチドの5%以上、4%以上、3%以上、2%以上、又は1%以上である場合、ライブラリーは調製されない。このようにして、ユーザーは、下流アッセイの結果に悪影響を及ぼすレベルのDNA損傷が存在する場合に、ライブラリーを調製する(及び配列決定などの更なる下流アッセイを実行する)際に時間及び資源を浪費することを回避する。
【0316】
いくつかの実施形態では、蛍光を測定する前に、修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回以上行われる。いくつかの実施形態では、複数回のビーズベースの精製は、方法の結果を改善する。いくつかの実施形態では、複数回のビーズベースの精製は、非特異的シグナルを減少させる。いくつかの実施形態では、蛍光を測定する前に、ビーズベースの精製が複数回、修復されたDNAをカルボキシレートビーズ又はセルロースビーズに結合させ、溶出することが2回行われる。
【0317】
カルボキシレートビーズ(例えば、SPRIビーズ)及びセルロースビーズは、DNA精製及びサイズ選択用途のために市販されており、このようなビーズは、本発明の方法において使用され得る。
【0318】
いくつかの実施形態では、カルボキシレート又はセルロースビーズは、磁性である。この特性は、修復されたDNAの結合後のビーズの洗浄に役立ち得る。
【0319】
いくつかの実施形態では、修復されたDNAの調製は、37℃で行われる。いくつかの実施形態では、修復されたDNAを調製することは、10分間以上、20分間以上、30分間以上、45分間以上、又は60分間以上行われる。
【0320】
いくつかの実施形態では、dNTPからリン酸を脱リン酸化することは、dNTPの非特異的結合を減少させ、アッセイ結果を改善する。
【0321】
いくつかの実施形態では、dNTPからリン酸を脱リン酸化することは、酵素を用いて行われる。いくつかの実施形態では、dNTPからリン酸を脱リン酸化するための酵素は、エビアルカリホスファターゼ(SAP)又は仔ウシ腸アルカリホスファターゼ(CIP)である。
【0322】
様々な異なるDNA修復酵素をこの方法で使用することができ、本明細書で使用される場合、「DNA損傷」は、単一試料中に含まれるDNA中に存在し得る複数の異なる種類のDNA修飾(例えば、ニック及びチミンダイマー)を指し得る。
【0323】
いくつかの実施形態では、1つ以上のDNA修復酵素は、DNAポリメラーゼを含む。いくつかの実施形態では、DNAポリメラーゼは、5’-3’ポリメラーゼ活性を有するが、5’-3’エキソヌクレアーゼ活性を欠いている。いくつかの実施形態では、DNAポリメラーゼは、Bst DNAポリメラーゼ、ラージフラグメントである。いくつかの実施形態では、1つ以上のDNA修復酵素は、リガーゼを含む。いくつかの実施形態では、リガーゼは、Taqリガーゼである。いくつかの実施形態では、DNA損傷は、二本鎖DNA中のニックを含む。
【0324】
いくつかの実施形態では、1つ以上のDNA修復酵素は、T4ピリミジンダイマーグリコシラーゼ(PDG)を含む。いくつかの実施形態では、DNA損傷は、チミンダイマーを含む。いくつかの実施形態では、チミンダイマーは、紫外線照射によって誘発された。
【0325】
いくつかの実施形態では、1つ以上のDNA修復酵素は、ウラシルDNAグリコシラーゼ(UDG)及び脱プリン又は脱ピリミジン部位リアーゼを含む。いくつかの実施形態では、DNA損傷は、ウラシルを含む。
【0326】
いくつかの実施形態では、1つ以上のDNA修復酵素は、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)及び脱プリン又は脱ピリミジン部位リアーゼを含む。いくつかの実施形態では、DNA損傷は、酸化塩基を含む。
【0327】
いくつかの実施形態では、2つ以上のDNA修復酵素が使用される。いくつかの実施形態では、1つ以上のDNA修復酵素は、複数のDNA修復酵素の混合物である。そのようなアプローチは、DNA損傷がDNAへの2つ以上の種類の損傷修飾(すなわち、チミンダイマー及びニック又は任意の他の修飾の組み合わせ)を含み得るとユーザーが疑う場合に使用され得る。
【0328】
いくつかの実施形態では、dNTPは、dATP、dGTP、dCTP、及びdTTP又はdUTPを含む。いずれか又は全てのdNTPを蛍光標識してもよい。いくつかの実施形態では、全てのdNTPが蛍光標識される。いくつかの実施形態では、dUTP及びdCTPが蛍光標識される。
【0329】
任意の適切な蛍光標識が、dNTPに含まれ得る。いくつかの実施形態では、蛍光標識は、Alexa Fluor 488、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 633、フルオレセインイソチオシアネート(FITC)、又はテトラメチルローダミン-5-(及び6)-イソチオシアネート(TRITC)であるが、励起スペクトルにおける広範な他の蛍光標識が使用されてもよい。いくつかの実施形態では、蛍光標識は、DNAを損傷しない励起波長を有する。
【0330】
実施例
実施例1.標準物質を使用したLongAmp PCR反応のアンプリコンサイズバイアスの正規化
図1は、代表的なLongAmp PCR反応と、それに続く、例えばNextera製品(Illumina)を用いた断片化を示す。本明細書に記載されているように、異なる長さの核酸標準物質のプールを使用して、この実験におけるアンプリコンサイズバイアスを正規化することができる。
【0331】
長い増幅PCRを行って、試料内の標的核酸断片に含まれる目的の配列からアンプリコンを生成することができる(図1に示される)。試料は、遺伝子編集に供された核酸から構成される試料であってもよく、ユーザーは、いくつかの異なる種類のインデル変異が存在し得ると予想する。
【0332】
このPCR反応の間、本明細書に記載されるように、異なる長さの核酸標準物質のプールを反応に含めることができる。このプールは、完全長標準物質(例えば、図8Aに示されるもの)、挿入標準物質(例えば、図8Bに示されるもの)、及び欠失標準物質(例えば、図8Cに示されるもの)を含み得る。このようにして、標準物質は、目的の配列と同じ条件下で増幅される。
【0333】
挿入標準物質を作成する代表的な方法は以下の通りである。
工程1)N18 UMIを含む図2Aに示されるオリゴヌクレオチドを、制限部位3(RS3)及び制限部位4(RS4)で切断する制限酵素を用いて消化する。
工程2)図3のPCR産物を、制限部位1(RS1)及び制限部位2(RS2)で切断する制限酵素によって消化する。
工程3)図4のPCR産物をRS1及びRS2によって消化する。
工程4)工程2及び3の産物をライゲーションする。
工程5)図4のPCR産物をRS3及びRS4によって消化する。
工程6)工程5の産物を工程1の産物とライゲーションする。
【0334】
挿入標準物質を調製するためのこれらの工程は、図2Bに示される産物を生成することが期待される。RS消化の順序は固定されていない。更に、RSで消化する全ての制限酵素が緩衝液相溶性である場合、全ての消化工程を組み合わせてもよい。あるいは、消化工程は別々の工程で行われてもよい。ライゲーション工程(工程4及び6)はまた、挿入標準物質を調製する方法における最終工程として組み合わされ得る。
【0335】
欠失標準物質を作成する代表的な方法は以下の通りである。
工程1)図6Aに示すオリゴヌクレオチド(図2Aに示すオリゴヌクレオチドと同一であり、N18 UMIを含む)を、RS3及びRS4によって消化する。
工程2)図5のPCR産物をRS3及びRS4によって消化する。
工程3)工程2の産物を工程1の産物とライゲーションする。
【0336】
欠失標準物質を調製するためのこれらの工程は、図6Bに示される産物を生成することが期待される。
【0337】
目的の配列を標準物質と共に増幅した後、次いで、アンプリコン(標準物質由来及び目的の配列由来)を、配列決定ライブラリーを調製するための方法に供し得る。図1Aは、これが、トランスポザーゼが断片の両端にアダプター配列を組み込むNextera断片化(すなわち、タグメンテーション)であり得ることを示す。次いで、断片は、これらのアダプター配列に含まれる配列(例えば、配列決定プライマー結合部位)を使用して配列決定され得る。
【0338】
次いで、ライブラリー(目的の配列及び標準物質から生成された断片から構成される)を、配列決定できる。個々の標準物質に含まれるUMIを使用して、バイアスプロファイルを生成することができる。このバイアスプロファイルは、所与の標準物質の複製物が標準物質のUMIを使用して同定され得るため、より大きな標準物質がより少ない固有の複製物を有するという事実を説明する。これらのデータを使用して、アンプリコンサイズバイアスを正規化することができる。このようにして、ユーザーは、目的の配列中の所与のインデル変異を有した元のコピー数を概算することができる。言い換えれば、この方法は、目的の配列の大きな挿入変異(得られる目的の配列のアンプリコンが、有意に大きくなる)が、目的の野生型配列又は目的の配列の欠失変異よりも少ないアンプリコンを生成するという事実を制御できる。
【0339】
実施例2.ライブラリーの品質管理評価
ライブラリーの品質管理(QC)のために定量的PCR(qPCR)アッセイを実施した。QC qPCRアッセイは、ニックの入っていない鋳型鎖を増幅するために、PrimeStar GXL DNAポリメラーゼ(Takara)(長い標的(例えば、30kb超)を高い忠実度で増幅することができることが知られている長距離ポリメラーゼ)を使用した。増幅の間、ライブラリー分子に含まれるヘアピンアダプターに特異的なフォワードプライマーは、鋳型がニックによって破壊されない場合にのみ、反対のアダプターに伸長し、リバースプライマーのための新しい鋳型鎖を生成する。対照的に、新しい鋳型鎖由来のシグナルは、ポリメラーゼがニックに遭遇した場合には生成されない(図9に示される)。
【0340】
コントロール実験を行って、ニックがCq値にどのように影響するかを決定した。qPCRマスターミックスは、0.5U長距離ポリメラーゼ(PrimeStar GXLポリメラーゼ)、ヘアピンアダプター内の特定の配列に結合するようにそれぞれ設計されたフォワードプライマー及びリバースプライマー、1×EvaGreen、200μMの各dNTP、1×PrimeStarバッファー、及び約200pg/μLのDNA入力(入力は、必要に応じてfg範囲に減少させ得る)から構成された。
【0341】
20×EvaGreenを水中で5×に希釈し、次いで、効率的な増幅を確認するために試料を用いて作製した標準曲線(Nexteraアダプター及びP5/P7増幅プライマーを有するライブラリー)と共に反応プレート上に含めた。以下のサイクルパラメータを実施した。95℃で2分間の初期変性、続いて95℃で30秒間、50℃で30秒間、及び68℃で15秒間を30サイクル。反応を2回行い、Cq値を平均した。
【0342】
表2は、qPCRマスターミックスの概要を提供する。
【0343】
【表2】
【0344】
EvaGreen(登録商標)Dye及びEvaGreen(登録商標)Plus Dyeは、それ自体は本質的に非蛍光性であるが、dsDNAに結合すると高度蛍光性になる緑色蛍光核酸色素である。したがって、EvaGreenは、デジタルPCR及び等温増幅用途に使用することができる。
【0345】
ニッカーゼ処理により、10ngライブラリー(図10A及び図10B)及び20ngライブラリー(図10C及び図10D)の両方について、DNA損傷及び平均Cqの用量依存的増加が引き起こされた。これらの結果は、このQCアッセイのqPCR結果が、より高品質のライブラリーに対してより低いCqをもたらし、損傷ライブラリー(例えば、ニックを含有するライブラリー分子から構成されるもの)に対してより高いCqをもたらすことを示す。
【0346】
Vibrio vulnificusヌクレアーゼ(VVN、非特異的ヌクレアーゼ)とT7エンドヌクレアーゼ変異体との組み合わせを使用してニックから二本鎖切断を調製するためのエンドヌクレアーゼ処理(図11並びに図12A及び図12B)後に、同様の結果が見られた。したがって、ニックの入った鋳型から二本鎖切断を調製し、増幅に必要なプライマー配列の分離をもたらすことは、QCアッセイが不十分な品質のライブラリーを同定できることを更に実証する。
【0347】
実施例3.SMRTbellライブラリーの品質管理
図13A図15Cは、実施例2に記載の方法を用いた、二本鎖断片の両端にヘアピンアダプターを含有するSMRTbellライブラリーを用いた更なる実験を示す。異なるライブラリーについてのこれらの分析は、総配列決定出力が、より低いCq値を有するライブラリーについて一貫して増加することを確認する。言い換えれば、QC工程におけるqPCR結果と測定された総配列決定出力(すなわち、配列決定されたギガベース)との間に強い相関があった。一般に、QCアッセイにおいてより低いCq値を有するライブラリーは、より高い総配列決定出力を有した。例えば、QCアッセイにおいて約3のCq値を有するライブラリーでは、Cq値が9を超えたときの17%と比較して、39%~67%のP1パーセントの変動が見られた(図13A図13C)。ライブラリー8は、この関係に対する外れ値として注目される。
【0348】
更に、図14A図14Cのデータは、3~4の範囲のCq値が平均で約366ギガベースを生成したことを示す。対照的に、ライブラリー10は、6を超えるそのQC値に基づいて実施不十分であると予測され(図14A)、配列決定結果は、比較的低い総出力とP1パーセントを示した(図14B及び図14C)。したがって、QCアッセイは、不十分な配列決定性能を有するライブラリーを予測することができた。一般的に、ライブラリーの平均Cqが低いほど、P1パーセントが高いという関係が見られたが、これは、ライブラリー14(図13A図13Cにおけるライブラリー8に対応する)については当てはまらなかった。
【0349】
図15A図15Cは、同様に、高いCq値を有するライブラリー画分と比較して、QCアッセイにおいてより低いCq値を有するライブラリー画分(すなわち、F4、F5、及びF6などの同じライブラリーから調製された異なる画分)について、最も良い総配列決定出力(ギガベース)が見られたことを示す。
【0350】
したがって、本発明のQC法は、個々のライブラリーを配列決定すること(又は配列決定しないこと)を決定するための有用なツールである。そのようなQC方法は、既存のQC方法のみに基づいてユーザーが予測できないようにライブラリーの品質が変化し得るため、特に有益である。例えば、1つの試料で使用されるピペッティング力は、同じユーザーによって生成された他のライブラリーでは見られない分解を引き起こし得る。既に作製されたライブラリーの質を評価できる方法のみが、配列決定データの質に影響を与えるランダムな変化を制御することができる。したがって、当業者は、最初の実験を使用して、使用される特定のライブラリーに基づいて、所望のCq値の範囲を生成することができ、これは、QC法を使用する配列決定のためのライブラリーを選択するために使用され得る。
【0351】
実施例4.蛍光を用いたDNA損傷の測定
ユーザーはまた、蛍光を使用してDNA損傷を測定することを望み得る。例えば、ユーザーは、試料中のDNA損傷のレベルが許容可能であることを保証するために、ライブラリーを調製する前にDNA損傷を測定することを望む場合がある。例えば、ユーザーは、ライブラリー調製前のゲノムDNA又はcDNAに対して、又は既に調製されたライブラリーに対して使用するのに柔軟なDNA損傷を定量化する方法を使用することを望む場合がある。しかしながら、蛍光標識されたヌクレオチド及びタンパク質の両方を含有する現在のアッセイは、組み込まれていない蛍光ヌクレオチドの高い非特異的結合に悩まされることが多い。
【0352】
本発明のアッセイは、蛍光定量のシグナル対ノイズ比を改善するために開発された。この方法は、非特異的結合を顕著に減少させるために、エビアルカリホスファターゼ(SAP)消化及びSPRI(カルボキシレートビーズ)結合/溶出工程の両方を用いる。ユーザーの好みに依存して、セルロースビーズを、カルボキシレートビーズの代わりに使用でき、仔ウシ腸アルカリホスフェートを、記載される方法のいずれかにおいてSAPの代わりに使用できる。
【0353】
図16は、蛍光標識されたdNTPの存在下でのDNA修復工程(この例では、Bstポリメラーゼ及びTaqリガーゼを用いる)と、それに続くSAPによる処理及びSPRIビーズベースの精製の2工程を組み込む、本発明の方法を概説する。次いで、修復されたDNAを含む処理された試料を測定して、蛍光の量を決定する。
【0354】
最初の実験は、dNTPの非特異的結合を減少させるための異なる条件を試験した。図17は、単一のSPRIビーズベースの精製により、剪断されたゲノムDNA(gDNA)のSAP処理が、SAP処理を伴わないアッセイと比較して、蛍光ヌクレオチドの非特異的結合を実質的に低減したことを示す。言い換えれば、SAP処理を伴うビーズベースの精製工程は、非特異的蛍光を減少させた。
【0355】
更に、図18は、2回目のSPRIビーズベースの精製工程が、蛍光ヌクレオチドの非特異的結合を緩衝液に匹敵するレベルまで低下させたことを示す。このような低いバックグラウンドは、少量のDNA損傷(すなわち、DNA中の低い割合のヌクレオチドが損傷されている場合)を正確に測定するために重要である。
【0356】
最初の実験に基づいて、SPRIビーズに基づく精製の2回の工程を、更なる実験においてSAP処理後に行った。本発明の方法を用いて、市販の修復ミックス対我々のDNA修復酵素ミックスの有効性の比較を行った。PreCR Repair Mix(NEB)を、本プロトコールを用いて、Taqリガーゼ(40U)、Bstポリメラーゼラージフラグメント(8U)、及びT4 PDG(1U)のカスタム修復ミックスと比較した。図19Aに示されるように、PreCRミックスは、試料の損傷が増加するにつれて予想される蛍光増加を示さなかったが、カスタム修復ミックスは、これらの予想される増加を示した。PreCR Mix試料はまた、より大きな標準偏差及び低いシグナルを有し、このような不一致はまた、DNA損傷修復処方を最適化するグループからの文献において見出され得る。対照的に、本発明の方法を使用したカスタム修復酵素ミックスは、低い標準偏差及びより高いシグナル対ノイズ比を有した(図19B)。
【0357】
ユーザーによって決定されたDNA修復酵素のカスタムミックスを用いる本発明の方法はまた、ユーザーがアッセイにおいてどの修復酵素を利用するかを選択することができるため、ワークフローに柔軟性を加える。例えば、本発明のアッセイは、異なるDNA損傷修復酵素を利用することによって、DNA中の異なる種類の損傷を検出するように設計することができる。DNA修復酵素混合物中にT4ピリミジンダイマーグリコシラーゼ(T4 PDG)酵素を組み込むことにより、チミンダイマーなどのUV照射によって引き起こされる損傷の修復及びその後の検出を可能できる。図20に示すように、Taqリガーゼ、Bstポリメラーゼ、及びT4 PDG(UV損傷特異的修復酵素)を含むDNA修復酵素混合物を使用する方法は、UV誘発性DNA損傷を評価することができた。UV光の量及び曝露時間が増加するにつれて、本発明のアッセイによって測定されるDNA損傷も増加し、本発明のアッセイが広い範囲にわたってDNA損傷を測定する能力を示す。
【0358】
図21は更に、DNA試料が異なる量のニッキング酵素(Nt.BspQI)に曝露されたとき、DNA損傷測定の蛍光シグナルが増加したことを示す。したがって、本発明のアッセイは、広い範囲にわたってニックの入ったDNAの量を感度よく測定することができる。
【0359】
ユーザーが望む場合、ウラシルDNAグリコシラーゼ(UDG)及び脱プリン若しくは脱ピリミジン部位リアーゼ、並びに/又は、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)及び脱プリン若しくは脱ピリミジン部位リアーゼを酵素修復ミックスに組み込むことにより、それぞれウラシル又は酸化塩基の修復及びその後の検出を可能できる。
【0360】
このアッセイのモジュール方式により、使用される酵素の活性及び特異性に基づいて、二本鎖DNAにおける異なる種類の損傷を検出するための柔軟でカスタマイズ可能なツールにする。
【0361】
実施例5.蛍光を用いたDNA損傷の測定
最初の実験に基づいて、例示的なアッセイプロトコールを、Taqリガーゼ、Bstポリメラーゼ、及びT4 PDGを含むDNA修復酵素ミックスと共に使用するために開発した。表3は、このアッセイで使用するための試薬を提供し、表4は、dNTPマスターミックス含量を提供し、表5は、DNA損傷アッセイの含量を提供する。
【0362】
【表3】
【0363】
【表4】
【0364】
【表5】
【0365】
代表的なアッセイプロトコールを以下のように実施できる。
1.dNTP希釈物及びdNTPマスターミックスを表4及び5に記載のように調製する。氷上に置く。
2.Qubitを使用して試料及び対照gDNAを定量化する。gDNAを100ng/μLに希釈し、氷上に置く。
3.アッセイ混合物を氷上のストリップチューブ中に、試料当たり2つ調製し、穏やかにピペッティングして混合する。加熱した蓋を備えたサーモサイクラーにおいて37℃で30分間インキュベートする。
4.30分後、サーモサイクラーから取り出し、1μLのエビアルカリホスファターゼ(SAP)を各試料に添加する。穏やかにピペッティングして混合し、加熱した蓋を備えたサーモサイクラーにおいて37℃で60分間インキュベートする。
5.インキュベーション後、再懸濁緩衝液(RSB)で100μLに希釈する。AMPure PB(SPRI)ビーズをボルテックスして混合し、100μLのSPRIビーズを添加する。ピペッティグして混合し、室温で15分間穏やかに振盪する。
6.卓上磁気ラックを使用してビーズを磁化し、ビーズペレットを乱すことなく、試料を100μLの80%エタノールで2回洗浄する。2回目の洗浄後、確実に遠沈させ、全てのエタノールを完全に吸引する。
7.ビーズを100μLのRSB中に再懸濁する。室温で15分間穏やかに振盪する。
8.卓上磁気ラックを使用してビーズを磁化し、上清を新しいストリップチューブに吸引する。
9.任意選択で、SPRIの洗浄を繰り返す(工程5~8)。
10.5nMで開始し、濃度を半分に減少させるRSB中のAF-546 dUTPを使用して、100μLの標準曲線用試料を作製する。(5nM、2.5nM、1.25nM、625pM、312pM、156pM、78pM、及び39pM)
11.45μLの各精製試料を96ウェルプレートに2箇所ずつピペットで入れる。45μLの標準曲線用試料を96ウェルプレートに2箇所ずつピペットで入れる。
12.プレートをCytation 5マルチモードリーダー(Agilent)のプレートホルダーに入れる。Alexa Fluor 546をフルオロフォアとして選択し、試料及び標準曲線用試料の蛍光を1回の読み取りで測定する。
13.残りの試料及び対照をRSB中で1:10に希釈し、回収したDNAをQubitで定量する。標準曲線を用いて、DNAに取り込まれた色素分子を計算する。色素分子の数を回収されたgDNAの質量で割り、色素分子の正規化された数を決定する。
【0366】
当業者は、試料中のDNA損傷を評価するために、彼らの好みのDNA修復酵素混合物を用いてこの代表的なプロトコールを使用することができる。
【0367】
均等物
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方式で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
【0368】
本明細書で使用するとき、約という用語は、明示的に示されているか否かにかかわらず、例えば、整数、割合、及び百分率を含む数値を指す。用語は、一般に、当業者が列挙された値(例えば、同じ機能又は結果を有する)と同等であると考えられる数値の範囲(例えば、列挙された範囲の±5~10%)を指す。少なくとも及び約などの用語が数値又は範囲のリストの前にある場合、その用語はリスト内に提供される値又は範囲の全てを変更する。場合によっては、約という用語は、最も近い有効数字に丸められた数値を含んでもよい。
図1
図2A
図2B
図3
図4
図5
図6A
図6B
図7
図8A
図8B
図8C
図9
図10A
図10B
図10C
図10D
図11
図12A
図12B
図13A
図13B
図13C
図14A
図14B
図14C
図15A
図15B
図15C
図16
図17
図18
図19A
図19B
図20
図21
【国際調査報告】