(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024035110
(43)【公開日】2024-03-13
(54)【発明の名称】変異核酸の正確な並行定量するための高感度方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240306BHJP
C12Q 1/6844 20180101ALI20240306BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6844 Z
【審査請求】有
【請求項の数】22
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023131129
(22)【出願日】2023-08-10
(31)【優先権主張番号】17/900,109
(32)【優先日】2022-08-31
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.UNIX
2.PYTHON
(71)【出願人】
【識別番号】522099674
【氏名又は名称】ゲノミル ヘルス オサケユイチア
【氏名又は名称原語表記】Genomill Health Oy
(74)【代理人】
【識別番号】100145849
【弁理士】
【氏名又は名称】井澤 眞樹子
(72)【発明者】
【氏名】ユハ ペッカ プルシヘイモ
(72)【発明者】
【氏名】タトゥ ヒルヴォネン
(72)【発明者】
【氏名】アントーニ コルキアコスキ
(72)【発明者】
【氏名】マヌ タンミネン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QQ03
4B063QQ42
4B063QR08
4B063QR14
4B063QR42
4B063QR55
4B063QR62
4B063QS24
4B063QS34
4B063QX01
(57)【要約】 (修正有)
【課題】大量の試料(最大数十ミリリットル)、並びに/又は希釈且つ/若しくは非精製試料材料からの高度にスケーラブルで正確な標的定量のために次世代シーケンシングを使用する方法を提供する。
【解決手段】本発明は、遺伝子標的ごとに少なくとも標的特異性核酸プローブ(第1のプローブ、第2のプローブ及び標的特異性プローブ)及び架橋オリゴ又は架橋オリゴ複合体を含む。
【選択図】
図3
【特許請求の範囲】
【請求項1】
試料中の1以上の標的ヌクレオチド配列を検出する方法であって、該方法は、
(i)試料中の各標的ヌクレオチド配列に対して、第1のプローブ、第2のプローブ、及び互いにアニーリングして架橋オリゴ複合体を形成することができる架橋オリゴ又は複数のオリゴヌクレオチドを供給することであって、
前記第1のプローブは、分子の5’末端から開始して、第1の架橋オリゴ特異性配列、任意に、第1の配列バーコード、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から開始して、第2の標的特異性部分、場合により第2の配列バーコード、及び第2のプローブの3’末端の第2の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は架橋オリゴ複合体は、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び任意に第3のバーコードを含み、
前記第1配列バーコード又は前記第2配列バーコード又は前記第3バーコードのうちの少なくとも1つは、それぞれ前記第1プローブ又は前記第2プローブ又は前記架橋オリゴ又は架橋オリゴ複合体中に存在し、及び、
任意に、前記第1のプローブ又は前記第2のプローブ又は前記架橋オリゴ又は架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼの認識配列を含むこと、
(ii)1つ又は複数の標的ヌクレオチド配列のそれぞれについて、前記第1のプローブ及び前記第2のプローブを、互いにアニーリングして架橋オリゴ複合体を形成することができる前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させること、及び、複数のライゲーション複合体に自己アニーリングすることを可能にすること、
(iii)標的ヌクレオチド配列について試験される前記試料中に存在する核酸を前記ライゲーション複合体と接触させること、
(iv)それぞれの前記第1のプローブ及び前記第2のプローブの前記第1の標的特異性部分及び第2の標的特異性部分を前記標的配列上の本質的に隣接するセクションにハイブリダイズさせ、それによってハイブリダイゼーション複合体を形成すること、
(v)前記ハイブリダイゼーション複合体中の前記プローブをライゲートして、ライゲートされたライゲーション複合体を提供すること、
(vi)前記ライゲートされたライゲーション複合体を前記標的ヌクレオチド配列から解離させること、
(vii)前記標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加することであって、ここで、前記標的特異性プローブは、前記ライゲートされたライゲーション複合体とアニーリングすることができ、及び、前記標的特異性プローブが前記ライゲートされたライゲーション複合体にアニーリングすることを可能にし、それにより、増幅テンプレートを形成すること、
(viii)鎖置換ポリメラーゼを用いたローリングサークル増幅を使用して前記増幅テンプレートから核酸を増幅し、それによって一本鎖コンカテマー配列を得ること、
(ix)任意に、工程(i)で指定された認識配列が存在することを条件として、以下によって核酸フラグメントを取得する工程を実行すること、
(a)工程(viii)で得られた前記一本鎖コンカテマー配列を切断すること、又は、
(b)工程(viii)で得られた前記増幅された1つまたは複数の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとのアニーリングに供することであって、ここで、前記オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、工程(i)で特定された前記認識配列とアニールし、及び、アニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(x)工程(viii)で得られた前記コンカテマー配列又は工程(ix)で得られた前記核酸断片を配列決定技術に供して、前記バーコード配列を決定すること、及び、
(xi)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は前記第1のバーコード及び/又は前記第2のバーコードの少なくとも一部、及び/又は第3のバーコードの少なくとも一部を決定することによって、前記試料中の前記標的ヌクレオチド配列の存在及び/又は数を同定すること、である各工程を含む方法。
【請求項2】
複数の試料中の1つ又は複数の標的ヌクレオチド配列のハイスループット検出のためのものであって、複数の試料が提供され、好ましくは、工程(ii)は、別個のチューブ内の試料のそれぞれに対して実行される、請求項1に記載の方法。
【請求項3】
工程(viii)に先立って複数の試料中はプールされる請求項2に記載の方法。
【請求項4】
前記第1のプローブ、前記第2のプローブ、前記架橋オリゴ又は複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドのうちの少なくとも1つは、第1の捕捉部分を含み、及び、工程(iv)と(v)の間で、
ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体に接触させること、
前記ハイブリダイゼーション複合体が前記固体支持体に結合するように、前記第1の捕捉部分と前記第2の捕捉部分が相互作用できるようにすること、及び、
前記固体支持体に結合していない試料の成分から前記固体支持体に結合したハイブリダイゼーション複合体を分離すること、を実行する中間工程(iv)(a)が実行される請求項1~3の何れか一項に記載の方法。
【請求項5】
工程(iv)(a)の前に核酸を濃縮するステップを含まない、請求項4に記載の方法。
【請求項6】
前記第1の捕捉部分がビオチン部分であり、前記第2の捕捉部分がストレプトアビジン部分又はアビジン部分である、請求項4又は5に記載の方法。
【請求項7】
前記試料又は前記複数の試料が、血液試料、唾液試料、尿試料又は糞便試料を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドの1つ以上のオリゴヌクレオチドは、前記第1のプローブ又は前記第2のプローブに相補的ではない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを可能にする複数のユニバーサル塩基類似体を含み、及び、工程(v)の前に、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填ステップが実行される、請求項1~7の何れか一項に記載の方法、
【請求項9】
前記複数のユニバーサル塩基類似体が複数の5-ニトロインドールである、請求項8に記載の方法。
【請求項10】
互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドの使用を含み、
前記複数のオリゴヌクレオチドはバーコードループオリゴを含み、
前記バーコードループオリゴは、分子の5’末端から始まって、第3の架橋オリゴ特異性配列、任意に、前記第3のバーコードを含み得るバーコード化ループ配列、及び第4の架橋オリゴ特異的配列を含み、及び、1つ以上の他の架橋オリゴは、バーコードループオリゴ中の第3の架橋オリゴ特異的配列及び第4の架橋オリゴ特異的配列に相補的な配列を含み、
前記1つ以上の他の前記架橋オリゴは、前記バーコードループオリゴ中の前記第3の架橋オリゴ特異性配列及び前記第4の架橋オリゴ特異性配列に相補的な配列を含む、請求項1~9のいずれか一項に記載の方法、
【請求項11】
前記架橋オリゴ又は架橋オリゴ複合体が、
(i)1~3個の3’突出塩基、及び/又は
(ii)3’リン酸、及び/又は
(iii)3’末端から3つの位置内の1以上のホスホロチオエート修飾を含む請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記第1のプローブの3’末端又は前記第2のプローブの5’末端、又はその両方が、前記第1のプローブの前記第2のプローブへの化学的ライゲーションを可能にするように修飾される請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記第1のプローブ又は前記第2のプローブ、又はその両方の架橋部分、又は前記架橋オリゴもしくは前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドが、前記架橋オリゴ又は架橋オリゴ複合体への結合を改善させる化学修飾された塩基を含む請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、及び/又は前記第2の架橋オリゴ特異性配列が、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含む、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのオリゴヌクレオチドが1以上の化学的に修飾されたヌクレオチドを含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
工程(viii)は、phi29ポリメラーゼ又はBstポリメラーゼを使用して実行される、請求項1~15のいずれか一項に記載の方法。
【請求項17】
PCR増幅が、前記第1及び前記第2のプローブのユニバーサル部分に結合するプライマーを使用して工程(x)の直前に実行され、
前記プライマーが、工程(x)における後続の配列決定のためのアダプターを任意に含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
工程(x)の配列決定はナノポア配列決定を使用して実行され、
任意に、工程(viii)で得られた前記コンカテマー配列は、転位複合体を使用して断片化される、請求項1~17のいずれか一項に記載の方法。
【請求項19】
遺伝子標的列挙が、標的当たりの、及び試料当たりの分子バーコードの数を数えることによって可能になる、請求項1~18のいずれか一項に記載の方法。
【請求項20】
2つ以上の試料について、又は2つ以上の遺伝子座/対立遺伝子の組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1つ以上の配列及び/又は多型について試料の遺伝子型を特定するために使用される、請求項1~19のいずれか一項に記載の方法。
【請求項21】
複数の容器を含むパーツのキットであって、
少なくとも1つの容器が第1のプローブ及び第2のプローブの1以上のセットを含み、少なくとも1つの容器が、1つ以上の架橋オリゴ又は架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含み、
前記第1のプローブは、分子の5’末端から開始され、前記第1の標的特異性配列、任意に第1の配列バーコード、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から開始され、前記第2の標的特異性配列、任意に第2の配列バーコード、及び第2のプローブの3’末端の第2の標的特異性部分を含み、
前記架橋オリゴ又は架橋オリゴ複合体は、それぞれ第1又は第2のプローブにおける第1及び第2の架橋オリゴ特異性配列に相補的な配列、及び任意に、第3のバーコードを含み、
前記第1の配列バーコード又は前記第2の配列バーコード又は前記第3バーコードのうちの少なくとも1つは、それぞれ前記第1のプローブ又は前記第2のプローブ又は架橋オリゴ又は架橋オリゴ複合体中に存在し、
前記キットは、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブをさらに含み、前記標的特異性プローブは、前記ライゲートされたライゲーション複合体とアニーリングすることができ、及び、
任意に、前記第1のプローブ、前記第2のプローブ、前記架橋オリゴ又は架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼの認識配列を含み、及び、
任意に、前記パーツのキットは、前記エンドヌクレアーゼの認識部位が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む、キット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の開示は、1以上の核酸標的を正確に、且つ大規模に並行して定量するための改良された次世代DNAシーケンシング方法に関する。
より詳細には、本開示は、主に遺伝子標的及び変異体の検出に使用される、複合DNAプール中の遺伝子標的を検出及び定量するためのプローブを含む方法及びキットに関する
【背景技術】
【0002】
植物及び動物における遺伝的変異の検出は、研究技術の進歩によって、煩雑ではない。しかしながら、特に弱いシグナルを有する試料における突然変異などの遺伝子変異の検出及び正確な定量は、シーケンシングコストの低下にもかかわらず、現在依然として面倒で、労力を要し、高価である。
コンセンサスバックグラウンドに対する遺伝子シグナルを検出するための特異性、弱い遺伝子シグナルを検出するための感度、検出されたシグナルを正確に定量するための精度、アッセイあたりの標的化遺伝子標的のスループット数、アッセイあたりのコスト、複数の試料を並行してアッセイする場合のアッセイコスト規模を決定するための評価、及び試料採取から結果までの時間の長さを決定するためのターンオーバーなど、様々な問題はより正確に提示されうる。
【0003】
現在、液体生検の典型的な定量方法及び概念的に類似したアッセイ(抗生物質耐性遺伝子検出など)には、定量PCR(qPCR)、アレイqPCR、デジタルPCR、多重ライゲーション依存性プローブ増幅(MLPA)、又は次世代DNAシーケンシングデータからの定量が含まれる。定量方法は確固とした、かつ良好に確立された方法であるが、各方法は、以下により詳細に説明する特定の問題に関連している。
【0004】
定量PCR:定量PCR(qPCR)は、PCR中の、すなわちリアルタイムでの標的DNA分子の増幅を含む技術である。リアルタイムPCRは、定量的に(定量的リアルタイムPCR)、及び半定量的に、すなわち一定量のDNA分子より多い/少ない(半定量的リアルタイムPCR)場合、に使用され得る。定量的PCR(qPCR)は、遺伝子標的定量の絶対的な基準である。現在、qPCR反応の実験室コストは約2ドルである。
しかしながら、反応を準備するための相当な実践時間(労働コスト)、標準曲線の必要性、及び各定量化標的についての反復を考慮に入れると、事実、実際のコストははるかに高い。各遺伝子標的について別個の定量実験が必要とされるため、実践時間量は、試料数の増加に伴って急激に変化する。
【0005】
アレイPCR:PCRアレイは、関連する経路又は疾患に焦点を当てた遺伝子のパネルの発現を分析するための最も信頼性の高いツールである。96ウェルプレート、384ウェルプレート、又は100ウェルディスクのPCRアレイは、それぞれ、焦点を当てた遺伝子パネルの徹底的に研究されたパネルのためのSYBR Green最適化プライマーアッセイを含む。qPCR技術のより新しい反復法は、個々のqPCR反応を小型化するアレイqPCRである。
アレイPCRは、個々のqPCR反応のコストを下げ、複数の標的及び試料に対する方法のスケーラビリティを改善する。しかしながら、この方法は、現在、チップあたり数千ドルのコストに、さらに読み出し基礎設備の大きな資本を加えたコストで、12個の試料からの384個の標的(又は逆に384個の試料からの12個の標的)に限定されている。従って、前記機構を使用した数千の試料のプロファイリングは、依然として極端に費用が高い。
【0006】
デジタルPCR:デジタルポリメラーゼ連鎖反応(デジタルPCR、DigitalPCR、dPCR、又はdePCR)は、液滴マイクロ流体及び蛍光検出によって標的の絶対定量を提供する方法である。この方法論は比較的費用対効果が高い(試料あたり1つの標的のコストは約3ドル)が、各試料の各標的についてそれぞれ実験を準備し、設定し、実行するための実践時間は、数千の試料規模には不十分である。
【0007】
多重ライゲーション依存性プローブ増幅(MLPA)は、個々の試料中の複数の遺伝子標的の検出を単純化するためのアプローチを提供する。しかしながら、MLPAは、標的の相対的な定量しか提供せず、各試料について別個の検出実験を必要とする。さらに最近では、MLPAの変形は、DNAのバーコード化からコンセプトを導入する。このコンセプトは、従来のMLPAワークフローよりも良好な定量的分離及び試料多重化を可能にする。
【0008】
次世代シーケンシングベースのアプローチ:次世代シーケンシング(NGS)は、配列ベースの遺伝子発現分析をアナログ技術に対する「デジタル」代替物にするハイスループットシーケンシングとしても知られる。次世代DNAシーケンシングデータからの標的計数は、DNAシーケンシングのコストが低下し続けるにつれてますます魅力的になってきており、現在、例えば非侵襲的出生前検査で使用されている。しかしながら、現在のアプローチは、高いシーケンシングライブラリ調製コスト、及び関連性のない遺伝子標的のシーケンシングに浪費されるシーケンシング労力に悩まされている。
例えば、癌関連液体生検では、非標的化アプローチは、腫瘍学的に関連性のない遺伝子座に対するシーケンシング労力の浪費をもたらす。胎児診断において、遺伝子座の非標的化試料採取は、データを解釈するための統計的選択肢をかなり制限する。Guardant Health Incは、より標的化されたシーケンシングアプローチを提供し、それは、RNA捕捉プローブのアレイが次世代DNAシーケンシングの標的を濃縮するものである。
【0009】
Akhrasら(2007)PLoS ONE 2(2):e223は、バーコード化標的特異性プローブ、標的環状化及びシーケンシングを含む多重病原体検出アッセイを開示している。標的特異性プローブをライゲートするための架橋オリゴヌクレオチドの使用も開示される。
国際公開第2018/109206号は、パッドロック(padlock)プローブ及びローリングサークル増幅を使用した試料中の分析物の検出方法を記載している。架橋オリゴの使用については記載されていない。
国際公開第2019/038372号は、目的の標的配列をT7ポリメラーゼのプロモーターを含むライゲーション複合体からin vitro転写によって選択的に増幅し、その後cDNA合成と配列決定を行う次世代シーケンシングアプローチを記載している。この方法は、試料中の多くの標的配列の正確かつ並行した検出及び定量を可能にするが、より複雑で大量かつ/又は不純な試料は、依然として困難である。
従って、前記議論に照らして、前記の欠点、例えば、これらに限定されないが、核酸標的の正確かつ大規模に並行した定量を通じた特異性、感度、精度、スループット、コスト、評価及びターンオーバーを克服する必要がある。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】国際公開第2018/109206号公報
【特許文献2】国際公開第2019/038372号公報
【非特許文献】
【0011】
【非特許文献1】Akhras et al.(2007) PLoS ONE 2(2):e223
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明は、例えば大量の試料(最大数十ミリリットル)、並びに/又は希釈且つ/若しくは非精製試料材料からの高度にスケーラブルで正確な標的定量のために次世代シーケンシングを使用する方法を提供する。国際公開第2019/038372に記載されているようなRNA増幅ステップは回避され、方法がより単純になる。
さらに、本発明の方法は、追加の標的特異性プローブまたは複数の追加の標的特異性プローブを使用して、希少配列などの特定の配列を特異的に増幅し、よって特異的に濃縮する、標的配列増幅工程を含む。 。
これにより、関連するが同一ではない過剰な配列を含む試料から、そのようなまれな配列を検出できるようになる。例えば、この方法は、過剰な他の対立遺伝子を含むサンプル中の遺伝子のまれな対立遺伝子を検出するために使用できる。
【課題を解決するための手段】
【0013】
第1の主要な態様では、本発明は、試料中の1以上の標的ヌクレオチド配列を検出する方法であって、該方法は、
(i)試料中の各標的ヌクレオチド配列に対して、第1のプローブ、第2のプローブ、及び互いにアニーリングして架橋オリゴ複合体を形成することができる架橋オリゴまたは複数のオリゴヌクレオチドを供給することであって、
前記第1のプローブは、分子の5’末端から開始して、第1の架橋オリゴ特異性配列、任意に、第1の配列バーコード、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から開始して、第2の標的特異性部分、場合により第2の配列バーコード、及び第2のプローブの3’末端の第2の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は架橋オリゴ複合体は、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び任意に第3のバーコードを含み、
前記第1配列バーコード又は前記第2配列バーコード又は前記第3バーコードのうちの少なくとも1つは、それぞれ前記第1プローブ又は前記第2プローブ又は前記架橋オリゴ又は架橋オリゴ複合体中に存在し、及び、
任意に、前記第1のプローブ又は前記第2のプローブ又は前記架橋オリゴ又は架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼの認識配列を含むこと、
(ii)1つ又は複数の標的ヌクレオチド配列のそれぞれについて、前記第1のプローブ及び前記第2のプローブを、互いにアニーリングして架橋オリゴ複合体を形成することができる前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させること、及び、複数のライゲーション複合体に自己アニーリングすることを可能にすること、
(iii)標的ヌクレオチド配列について試験される前記試料中に存在する核酸を前記ライゲーション複合体と接触させること、
(iv)それぞれの前記第1のプローブ及び前記第2のプローブの第1の標的特異性部分及び第2の標的特異性部分を前記標的配列上の本質的に隣接するセクションにハイブリダイズさせ、それによってハイブリダイゼーション複合体を形成すること、
(v)前記ハイブリダイゼーション複合体中の前記プローブをライゲートして、ライゲートされたライゲーション複合体を提供すること、
(vi)前記ライゲートされたライゲーション複合体を前記標的ヌクレオチド配列から解離させること、
(vii)前記標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加することであって、ここで、前記標的特異性プローブは、前記ライゲートされたライゲーション複合体とアニーリングすることができ、及び、前記標的特異性プローブが前記ライゲートされたライゲーション複合体にアニーリングすることを可能にし、それにより、増幅テンプレートを形成すること、
(viii)鎖置換ポリメラーゼを用いたローリングサークル増幅を使用して前記増幅テンプレートから核酸を増幅し、それによって一本鎖コンカテマー配列を得ること、
(ix)任意に、工程(i)で指定された認識配列が存在することを条件として、以下によって核酸フラグメントを取得する工程を実行すること、
(a)工程(vii)で得られた前記一本鎖コンカテマー配列を切断すること、又は、
(b)工程(viii)で得られた前記増幅された1つまたは複数の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとのアニーリングに供することであって、ここで、前記オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、工程(i)で特定された前記認識配列とアニールし、及び、アニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(x)工程(viii)で得られた前記コンカテマー配列又は工程(ix)で得られた前記核酸断片を配列決定技術に供して、前記バーコード配列を決定すること、及び、
(xi)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は前記第1のバーコード及び/又は前記第2のバーコードの少なくとも一部、及び/又は第3のバーコードの少なくとも一部を、を決定することによって、前記試料中の前記標的ヌクレオチド配列の存在及び/又は数を同定すること、である各工程を含む方法。
【図面の簡単な説明】
【0014】
【
図1】本発明の一実施形態による多重ライゲーションアッセイ(MLA)のフロー図を示す。
【
図2A】
図2Aは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2B】
図2Bは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2C】
図2Cは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2D】
図2Dは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図3】
図3は、ここでは稀な突然変異を検出するための、本発明の一実施形態による標的特異性プローブの使用を示す。
【
図4】
図4は、2つの異なる標的濃度を有する2つのブーストされた配列決定ライブラリを示す。
【
図5】
図5は、12個の遺伝子融合標的のパネルに対するブーストの効果を示す。
【発明を実施するための形態】
【0015】
(定義)
標的ヌクレオチド配列:標的ヌクレオチド配列という用語は、その検出が必要とされる目的の任意のヌクレオチド配列であり得る。所定のその用語は、連続するヌクレオチドの配列ならびに相補的配列を有する核酸分子を指すことが理解されうる。いくつかの態様における標的配列は、多型を表すか又は多型に関連するヌクレオチド配列である。
【0016】
多型:多型という用語は、集団中の2つ以上の遺伝的に決定された代替配列又は対立遺伝子の発生を指す。多型マーカー又は部位は、配列の相違が生じる遺伝子座である。多型遺伝子座は、1つの塩基対ほど小さくてもよい。
【0017】
試料:試料という用語は、本書では、2つ以上の標的配列を含む2つ以上の試料に使用される。本発明による方法で提供される試料は、少なくとも標的核酸を抽出し、それらが本発明で使用されるプローブにアクセスできるようにするために調製されていてもよい。特に、いくつかの実施形態では、試料はそれぞれ、少なくとも2つの異なる標的配列、好ましくは少なくとも100、より好ましくは少なくとも250、より好ましくは少なくとも500、最も好ましくは少なくとも2000又はそれ以上の異なる標的配列を含む。試料という用語は、限定されるものではないが、尿、生検、唾液及び他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒト/動物の体から得られた2つ以上の試料、又は水、廃水、土壌、植物、ウイルスもしくは細菌等を含む試料などを含む環境から得られた2つ以上の試料を指すことができる。一実施形態では、複数の試料は、血液試料、唾液試料、尿試料又は糞便試料、他の体液の試料又は、例えば毛髪又は皮屑からの抽出物等の身体物質を含む。
【0018】
プローブ:プローブという用語は、可変長(通常50~1000塩基長、好ましくは50~200塩基長)のDNA又はRNAの断片であり、プローブ中の配列に相補的なヌクレオチド配列(DNA又はRNA標的)の存在を検出するためのDNA又はRNA試料中に使用できる。標的配列に相補的なオリゴヌクレオチドプローブのセクションは、試料中の各標的配列に対して、第1及び第2のプローブの対が提供されるように設計され、それによって各プローブがその末端に相補的なセクションを含み、その結果プローブはそれぞれ、それらの末端に標的配列の一部に相補的なセクションを含む。さらに、本開示は、第1のプローブと第2のプローブを結合するために使用される架橋オリゴ又は架橋オリゴ複合体について記載する。加えて、標的配列の一部に対応する配列を含む追加の標的特異性プローブ、又はブースティングプローブが使用される。
【0019】
ユニバーサル:増幅手順を説明するために使用される場合、ユニバーサルという用語は、単一のプライマー又はプライマーセットを複数の増幅反応のために使用できるようにする配列を指す。そのようなプライマーの使用は、選択された複数の核酸配列を増幅するために必要なプライマーが2つのみであるという点で、多重化を大幅に単純化する。ユニバーサルという用語は、プライミング部位を説明するために使用される場合、ユニバーサルプライマーがハイブリダイズする部位である。ユニバーサルプライミング配列/プライマーの「セット(複数可)」が使用され得ることにも留意すべきである。
【0020】
ハイブリダイゼーション:ハイブリダイゼーション(hybridization又はhybridisation)という用語は、相補的DNA又はRNAにアニーリングするDNA又はRNA分子のプロセスを表す。DNA又はRNAの複製及びRNAへのDNAの転写は両方とも、ヌクレオチドハイブリダイゼーションに依存する。
【0021】
ライゲーション:ライゲーションという用語は、酵素の作用による2つの核酸断片の連結である。DNAリガーゼは、相補鎖上の隣接部位に結合した2本のポリヌクレオチド鎖(の末端)間のホスホジエステル結合の形成を触媒することができる酵素である。一実施形態では、ライゲーションは、特に、ポリヌクレオチドの隣接する末端の両方が化学的ライゲーションを可能なように修飾されている場合、化学的に行われうる。
【0022】
増幅:増幅という用語は、ヌクレオチド配列の混合物内の特定のヌクレオチド配列の濃度を増加させるための、DNAポリメラーゼの使用を意味するために本書では使用される。「PCR」又は「ポリメラーゼ連鎖反応」は、特定のDNA/RNA断片のインビトロ酵素増幅のための急速な手順である。増幅されるDNA/RNAは、試料を加熱することによって変性され得る。プライマーという用語は、DNA合成の出発点として役立つRNA又はDNA鎖(一般に約18~22塩基)である。DNA複製にそれが必要であるのは、このプロセスを触媒する酵素、すなわちDNAポリメラーゼは、DNAの既存の鎖に新しいヌクレオチドを付加することしかできないからである。
【0023】
ポリメラーゼ:ポリメラーゼは、核酸の長鎖又はポリマーを合成する酵素である。DNAポリメラーゼ及びRNAポリメラーゼを使用して、塩基対合相互作用を用いてDNA又はRNA鋳型鎖をコピーすることによって、それぞれDNA及びRNA分子を組み立てる。
【0024】
ハイスループット:ハイスループットという用語は、多数のDNA試料を同時に処理及びスクリーニングする能力、ならびに単一のDNA試料内の多数の異なる遺伝子座を同時にスクリーニングする能力を意味する。しばしばHTSと略されるハイスループットシーケンシング又はスクリーニングは、大量の試料を同時に効果的にスクリーニングするのに特に関連する科学的実験のための方法である。
【0025】
エンドヌクレアーゼ:エンドヌクレアーゼは、DNAの二本鎖又は一本鎖をランダム又は指定された位置で切断する酵素である。
【0026】
バーコード:本発明で使用されるプローブ及びオリゴは、ヌクレオチド配列からなる1つ又は複数のバーコードを含み得る。バーコード配列は、標的ヌクレオチド配列識別子配列、試料識別子配列、及び/又は標的を列挙するための分子バーコード(固有分子識別子とも呼ばれる)を含み得る。バーコード配列は、ランダム配列を含みうる。
【0027】
上述のように、本開示は、ライゲーション依存性アッセイを活用することによる、非常に多数の試料における標的ヌクレオチド配列検出のハイスループット検出のための方法に関する。本開示は、次世代配列決定によって許可される技術を使用して、複合核酸プール中の遺伝子標的の配列を決定するための方法を提供する。
本開示はまた、ライゲーション依存性アッセイを活用することによって、多数の試料、好ましくは非常に多数の試料中の複数の遺伝子標的をプロファイリングする方法を提供する。
本開示は、複数の試料中の異なる標的核酸の照会を可能にする多重ライゲーション依存性プローブ増幅のための方法を提供する。
本発明の方法は、異なる標的核酸に対する複数の異なるプローブセットを提供する複数の試料中の1以上の標的ヌクレオチド配列の配列決定を可能にする。シーケンシングデータを処理する際に、試料プールから、遺伝子標的を同定するため、及び、個々の試料を絶対的に定量するために、固有配列識別子が使用される。
【0028】
第1の主要な態様では、本発明は、試料中の1以上の標的ヌクレオチド配列を検出する方法であって、該方法は、
(i)試料中の各標的ヌクレオチド配列に対して、第1のプローブ、第2のプローブ、及び互いにアニーリングして架橋オリゴ複合体を形成することができる架橋オリゴまたは複数のオリゴヌクレオチドを供給することであって、
前記第1のプローブは、分子の5’末端から開始して、第1の架橋オリゴ特異性配列、任意に、第1の配列バーコード、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から開始して、第2の標的特異性部分、場合により第2の配列バーコード、及び第2のプローブの3’末端の第2の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は架橋オリゴ複合体は、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び任意に第3のバーコードを含み、
前記第1配列バーコード又は前記第2配列バーコード又は前記第3バーコードのうちの少なくとも1つは、それぞれ前記第1プローブ又は前記第2プローブ又は前記架橋オリゴ又は架橋オリゴ複合体中に存在し、及び、
任意に、前記第1のプローブ又は前記第2のプローブ又は前記架橋オリゴ又は架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼの認識配列を含むこと、
(ii)1つ又は複数の標的ヌクレオチド配列のそれぞれについて、前記第1のプローブ及び前記第2のプローブを、互いにアニーリングして架橋オリゴ複合体を形成することができる前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させること、及び、複数のライゲーション複合体に自己アニーリングすることを可能にすること、
(iii)標的ヌクレオチド配列について試験される前記試料中に存在する核酸を前記ライゲーション複合体と接触させること、
(iv)それぞれの前記第1のプローブ及び前記第2のプローブの前記第1の標的特異性部分及び前記第2の標的特異性部分を前記標的配列上の本質的に隣接するセクションにハイブリダイズさせ、それによってハイブリダイゼーション複合体を形成すること、
(v)前記ハイブリダイゼーション複合体中の前記プローブをライゲートして、ライゲートされたライゲーション複合体を提供すること、
(vi)前記ライゲートされたライゲーション複合体を前記標的ヌクレオチド配列から解離させること、
(vii)前記標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加することであって、ここで、前記標的特異性プローブは、前記ライゲートされたライゲーション複合体とアニーリングすることができ、及び、前記標的特異性プローブが前記ライゲートされたライゲーション複合体にアニーリングすることを可能にし、それにより、増幅テンプレートを形成すること、
(viii)鎖置換ポリメラーゼを用いたローリングサークル増幅を使用して前記増幅テンプレートから核酸を増幅し、それによって一本鎖コンカテマー配列を得ること、
(ix)任意に、工程(i)で指定された認識配列が存在することを条件として、以下によって核酸フラグメントを取得する工程を実行すること、
(a)工程(vii)で得られた前記一本鎖コンカテマー配列を切断すること、又は、
(b)工程(viii)で得られた前記増幅された1つまたは複数の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとのアニーリングに供することであって、ここで、前記オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、工程(i)で特定された前記認識配列とアニールし、及び、アニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(x)工程(viii)で得られた前記コンカテマー配列又は工程(ix)で得られた前記核酸断片を配列決定技術に供して、前記バーコード配列を決定すること、及び、
(xi)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は前記記第1のバーコード及び/又は前記第2のバーコードの少なくとも一部、及び/又は第3のバーコードの少なくとも一部を、を決定することによって、前記試料中の前記標的ヌクレオチド配列の存在及び/又は数を同定すること、である工程を含む方法。
【0029】
一実施形態では、本方法は、複数のサンプル中の1以上の標的ヌクレオチド配列のハイスループット検出のためのものであり、ここで、複数の試料が提供され、及び、好ましくは、工程(ii)は、個別のチューブ内の複数の試料のそれぞれに対して実行される。一実施形態では、複数の試料は、工程(viii)の前にプールされる。
【0030】
図1は、本発明の方法の実施形態の非限定的な図を提供する。
【0031】
本発明の方法は、4つ以上の核酸分子を利用し、そのうちの3つの標的特異性核酸プローブ(第1のプローブ、第2のプローブ及び標的特異性プローブ)は遺伝子標的に特異であり、1以上の他の核酸プローブは典型的にはユニバーサルである(架橋オリゴ又は架橋オリゴ複合体及びバーコードループオリゴ)。
第1のプローブ及び第2のプローブは、架橋プローブ又は架橋オリゴ複合体にハイブリダイズして、ライゲーション複合体を形成する。
サンプルDNA又はRNA上に標的識別部位を有するライゲーション複合体(1つ以上のバーコード配列を含む)は、クエリサンプルの相補的標的配列に対してハイブリダイズすることができる。
ハイブリダイゼーション後、第1のプローブと第2のプローブはDNAリガーゼによって化学的又は酵素的にライゲート(連結)され、ライゲートされたライゲーション複合体を形成する。本発明では、複数の、そのようなライゲートされたライゲーション複合体が、分析される複数の試料における試料分析中に形成されるであろう。
【0032】
一実施形態では、「複数の試料」は、これらに限定されないが、生検、唾液及び他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒトもしくは動物の体から得られた2つ以上の試料、水、廃水、土壌、植物、ウイルスもしくは細菌を含む試料などを含む環境から得られた2つ以上の試料等を指していてもよい。
一実施形態では、試料は、事前に核酸を精製又は濃縮せずに使用される。別の実施形態では、例えば、細胞を溶解して核酸を露出させる等の試料の前処理をしてもよい。
【0033】
標的配列は、検出が必要とされる目的の任意のヌクレオチド配列を含み得る。本開示の標的ヌクレオチド配列は、患者の血液中のDNAの画分又は母体血液中のDNAの画分から得ることができるが、これらに限定されない。
患者の血液中のDNAの画分は、例えば、アポトーシス/壊死癌細胞から、又は胎児及び/又は母体由来の母体血液中のDNAの画分から得ることができる。
さらに、分析の結果を使用して、例えば、所定のタイプの癌に対する個体のリスク、所定の癌に対する所定の治療の有効性の判定、腫瘍における薬物耐性関連変異の発生、又は一般的なトリソミーダウン症候群、パトウ症候群及びエドワーズ症候群などの遺伝性障害を有する胎児のリスク等を評価する。特定の実施形態では、方法は、各標的ヌクレオチド配列に対して、複数の異なるプローブセットを提供することを含む。
【0034】
本書で使用される場合、プローブセット(複数可)という用語は、第1のプローブ、第2のプローブ及び1以上の架橋オリゴを含む。
【0035】
特定の実施形態では、第1のプローブは、分子の5’末端から出発して、任意に、5’リン酸、第1の架橋オリゴ特異性配列、任意に第1のユニバーサル配列、任意に第1の配列バーコード、及びその3’末端における第1の標的特異性部分を含む。
【0036】
特定の実施形態では、第2のプローブは、分子の5’末端から出発して、任意に5’リン酸、第2の標的特異性部分、任意に第2の配列バーコード、任意に第2のユニバーサル配列、及びその3’末端における第2の架橋オリゴ特異性配列を含む。
【0037】
いくつかの実施形態では、第1のプローブ又は第2のプローブのいずれかが、第1の配列バーコード又は第2の配列バーコードの少なくとも1つを含む。第1の配列バーコード又は第2の配列バーコード、又はその両方は、ランダム配列であってもよく、又は標的ヌクレオチド配列識別子配列、試料識別子配列及び/又は標的列挙のための分子バーコードを含んでもよい。
【0038】
架橋オリゴ又は複数の架橋オリゴ複合体は、それぞれ第1及び第2のプローブの第1及び第2の架橋オリゴ特異性配列に相補的な配列、任意にユニバーサル配列を含み、及び/又は、ランダム配列か、又は試料又は配列識別子配列を含むことができる第3のバーコードを含んでいてもよい。
この点において、第3のバーコードは、必ずしも第1と第2のバーコードがすでに存在することを意味するわけではない。
前述したように、テストされたすべての試料のすべてのライゲーション複合体内で複合体を一意に定義できるように、少なくとも1つのバーコードがライゲートされたライゲーション複合体中に存在する必要がある。
【0039】
任意に、第1のプローブ、第2のプローブ、1以上の以上の架橋オリゴ、又は、標的特異性プローブのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含む。
エンドヌクレアーゼ認識配列は、コンカテマー配列の切断を可能にする。
一実施形態では、認識配列は、EcoRIなどの制限エンドヌクレアーゼの認識配列である。
別の実施形態では、認識配列は、I-CeuIなどのホーミングエンドヌクレアーゼの認識配列である。
別の実施形態では、認識配列は、誘導されたDNAaseI又はCRISPR-Cas様切断システムの認識配列である。
別の実施形態では、認識配列はニッキングエンドヌクレアーゼの認識配列である。
【0040】
任意に、第1のプローブ、又は第2のプローブ、又は1つ以上の架橋オリゴのうちの少なくとも1つは、第1の捕捉部分を含む。ここで使用される場合、第1の捕捉部分は、プローブ、ライゲーション複合体、又はハイブリダイゼーション複合体が固体支持体に連結された第2の捕捉部分によって捕捉される、すなわち結合されることを可能にする化学基などの部分を指す。
当技術分野で知られている任意の適切な捕捉部分をこの目的のために使用することができる。よく知られている適切な例は、ストレプトアビジンでコーティングされた磁気ビーズを使用したビオチン化分子の捕捉である。
従って、一実施形態では、第1の捕捉部分はビオチン部分であり、磁気ビーズなどの固体支持体に結合したストレプトアビジン又はアビジン部分(第2の捕捉部分)と相互作用することができる。
他のオプションには、ストレプトアビジン/アビジンとの結合に使用できるデュアルビオチン、デスチオビオチン、又は光切断性ビオチン(photocleavable biotin)などのビオチン誘導体が含まれる。
さらなるオプションには、アクリダイト(acrydite)/アクリルアミド結合にはチオール基とアクリダイト基、クリックケミストリーにはアルキン基とアジド基、及び抗ジゴキシゲニン抗体結合にはジゴキシゲニンの使用などが含まれる。
結合パートナーは、ビーズ(磁性又はその他)又は固体支持体などの任意の固体表面上に提供されうる。
従って、本発明の一実施形態の方法では、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1つ以上の架橋オリゴのうちの少なくとも1つは第1の捕捉部分を含み、及び、工程(iv)と(v)の間に、ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体と接触させ、ハイブリダイゼーション複合体(複数可)が固体支持体に結合するように第1の捕捉部分と第2の捕捉部分を相互作用させ、固体支持体に結合していない試料の成分から固体支持体に結合したハイブリダイゼーション複合体を分離することを含む中間工程(iv)(a)が実行される。
【0041】
第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、及び/又は第2の架橋オリゴ特異性配列は、好ましくは、プローブ結合を増加させるために互いに独立して少なくとも1つの化学修飾ヌクレオチドを含有する。
プローブ結合を増加させる化学修飾には、リボ核酸、ペプチド核酸、及びロックド核酸(例えば、参照により本明細書に組み込まれる国際公開第2019/038372号公報の
図3に示される)が含まれるが、これらに限定されない。
一実施形態では、第1のプローブ又は第2のプローブ、又はその両方の架橋部分は、架橋オリゴまたは架橋オリゴ複合体への結合を改善させるための化学修飾された塩基を含む。
別の実施形態では、第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、及び/又は第2の架橋オリゴ特異性配列は、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含む。特定の実施形態では、化学修飾は、隣接するプローブの化学的ライゲーションを許す。
【0042】
前記のプローブは、隣接する遺伝子座、すなわち標的ヌクレオチド配列の隣接セクションに結合する。しかしながら、そのセクションは、完全に隣接しておらず、それらは、例えば、少なくとも15塩基対、例えば少なくとも20塩基対、少なくとも25塩基対、又は少なくとも30塩基対離れている。好ましい実施形態では、隣接セクションは500塩基対以下、例えば200塩基対以下、例えば100塩基対以下または50塩基対以下離れている。
【0043】
いくつかの実施形態では、第1のプローブ、第2のプローブ、1つ以上の架橋オリゴ、又は標的特異性プローブは(これに限定されないが)、Illumina MiSeq、NextSeq、又はNovaSeqなどのDNA配列決定プラットフォーム用のアダプター配列を含んでいてもよい。これらのアダプター配列により、結果として生じるシーケンシングライブラリがイルミナフローセル等のシーケンシングデバイスの検出部分に結合できるようになる。
【0044】
さらに、いくつかの実施形態では、架橋オリゴ複合体を形成する、架橋オリゴ又は複数の架橋オリゴヌクレオチドのオリゴヌクレオチドは、
(i)1~5個の3’突出塩基(すなわち、第2のプローブと二重らせんを形成しない追加の塩基)、及び/又は
(ii)3’リン酸、及び/又は
(iii)3’末端から3つの位置内の1以上のホスホロチオエート修飾
を含む。
【0045】
本発明の方法の一実施形態では、本方法は、互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドの使用を含み、前記複数のオリゴヌクレオチドはバーコードループオリゴを含み、ここで、バーコードループオリゴは、分子の5’末端から始まって、第3の架橋オリゴ特異性配列、バーコードループ配列、及び第4の架橋オリゴ特異性配列を含み、ここで、1つ以上の他の架橋オリゴは、バーコードループオリゴ中の第3の架橋オリゴ特異性配列及び第4の架橋オリゴ特異性配列に相補的な配列を含む。
【0046】
従って、バーコードループオリゴは、1つまたは複数の架橋オリゴとハイブリダイズして架橋オリゴ複合体を形成することができる2つのセクションに側して配置されているループセクションを含む。ループセクションは、1つ以上の架橋オリゴまたは架橋オリゴ複合体とハイブリダイズせず、バーコードを含む。一実施形態では、バーコードループ配列は第3のバーコードを含む。
【0047】
プローブを標的配列を含む試料と接触させる前に、第1のプローブ及び第2のプローブを、架橋オリゴ又は架橋オリゴ複合体を形成可能な複数のオリゴヌクレオチドと接触させ、好ましくは別個のチューブ内の試料の各々について接触させ、ライゲーション複合体へのセルフアニーリングが可能される(工程(ii))。
架橋が1つのオリゴではなく、互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチド、例えば3つ又は5つのオリゴヌクレオチドである一実施形態では(
図2Bに示す)、複数のオリゴヌクレオチドは、第1及び第2のプローブとアニーリングする前にプレアニーリングされてもよく、又はすべてのアニーリング工程が一度に行われてもよい。
【0048】
好ましくは、各ライゲーション複合体は、第1の標的特異性配列、第2の標的特異性配列及び1以上のバーコード配列の組み合わせに対して固有である。これにより、増幅後の標的配列の列挙及び結果の分析が可能になる。
【0049】
その後、複数の試料中の1以上の標的ヌクレオチド配列を複数のライゲーション複合体と接触させる(工程(iii))。第1のプローブ及び第2のプローブそれぞれの第1の標的特異性部分及び第2の標的特異性部分を、標的配列上の本質的に隣接する部分にハイブリダイズして、それにより、ハイブリダイゼーション複合体を形成する(工程(iv))。前述したように、標的配列上の本質的に隣接する部分は、典型的には15から500塩基対の間、離れている。
【0050】
いくつかの実施形態では、試料は、100マイクロリットルを超える体積、例えば1ml以上の体積を有する。さらなる実施形態では、試料は、5pmol未満、例えば1pmol未満、例えば200fmol未満の核酸濃度を有する。一実施形態では、複数の試料には、1つ以上の血液試料、1つ以上の唾液試料、1つ以上の尿試料、又は1つ以上の糞便試料が含まれる。
【0051】
続いて、いくつかの実施形態では、第1のプローブ、又は第2のプローブ、又は架橋オリゴ、又はヌクレオチド、架橋オリゴ複合体を形成することができるオリゴヌクレオチドが、第1の補足部分を含む場合、ハイブリダイゼーション複合体(複数)を第2の捕捉部分を含む個体の支持体と接触させ、第1の補足部分と第2の補足部分はハイブリダイゼーション複合体が固体支持体に結合するように相互作用することができる(任意工程(iv)(a))。
その後、固体支持体に連結されていない試料の成分から、固体支持体に連結したハイブリダイゼーション複合体を分離する。
固体支持体が磁性ビーズである場合、磁石を用いてビーズを固定化し、残った液体試料を除去してもよい。任意に、洗浄工程は次の工程の前に行われる。
【0052】
工程(iv)(a)によって、核酸が精製及び濃縮され、特に非常に純度の低い試料について結果の改善を可能にする。一実施形態では、本発明の方法は、工程(iv)(a)の前に核酸を濃縮する工程を含まない。従って、一実施形態では、本方法は、工程(vi)の前に、元の試料中の核酸を2倍超、10倍超、又は100倍超に濃縮する工程を含まない。別の実施形態では、本発明の方法は、工程(vi)のライゲーションの後に精製工程を含まない。
【0053】
続いて、形成されたハイブリダイズ複合体中のプローブのライゲーションを酵素的又は化学的に行い、ライゲートされたライゲーション複合体を供給する(工程(v))。工程(v)の一部として任意に、第1のプローブと第2のプローブとの間にギャップが存在する場合、ポリメラーゼ及び1以上のヌクレオチドを導入することによって塞ぐことができる。
ポリメラーゼは、架橋オリゴ配列(複数可)に相補的なヌクレオチド(a)及び/又は、(b)バーコード配列に相補的なヌクレオチドを追加し、それによって、第1のプローブと第2のプローブとの間の2つのギャップを埋め、その結果、第1のプローブと第2のプローブがライゲーションされ、ブリッジ相補鎖へユニバーサル配列及び/又は第3のバーコード配列が組み込まれる。
架橋オリゴ又は架橋オリゴ複合体は、第1のプローブ又は第2のプローブに存在する標的配列識別子配列が架橋オリゴ又は架橋オリゴ複合体に組み込まれるように、ライゲートされたプローブに相補的な5’部位又は3’部位から伸長される。
好ましくは、第1のプローブの第2のプローブへのライゲーションを、両方が標的配列にアニーリングされている場合に妨害しないために、二本鎖DNAを分解しないポリメラーゼ、例えばTaqポリメラーゼなどが使用される。
一実施形態では、架橋オリゴ、又は複数の架橋オリゴヌクレオチドのうちの1つ以上のオリゴヌクレオチドは、第1のプローブ、又は第2のプローブに相補的でない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを許すために、複数のユニバーサル塩基類似体を含む。したがって、これらのランダム配列が第3のバーコードになりうる。
このような実施形態では、工程(v)の一部として、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填工程が実施される。実施形態において、複数のユニバーサル塩基類似体は、複数の5-ニトロインドールである。
【0054】
ステップ(v)の前又は後に、ライゲートされたライゲーション複合体は、任意に1つ又は複数の標的試料からプールされる。
【0055】
続いて、ライゲートされたライゲーション複合体を標的ヌクレオチド配列から解離させ(工程(vi))、標的特異性プローブが添加され、ライゲートされたライゲーション複合体にアニーリングさせ、それによって増幅鋳型を形成する(工程(vii))。
標的特異性プローブは、標的ヌクレオチド配列に対応する配列を含み、従って、その配列と一致するライゲートされたライゲーション複合体に特異的にアニールする。
標的特異性プローブは、標的への結合を強化する、または標的をエキソヌクレアーゼ活性から保護するビオチン及び/又はヌクレオチド修飾(ホスホロチオエート、LNA及びPNA修飾を含むがこれらに限定されない)などの捕捉部分を任意に含む。
工程(vi)及び(vii)を含めることにより、試料中の変異配列、例えば稀な変異の選択的増幅が可能になる。
図3に示すように、標的特異性プローブ配列が、検出対象の変異配列(例えば、稀な変異)と一致するが、非変異配列(例えば、バルクゲノム野生型配列)とは一致しないように選択される場合、次の工程で変異配列の選択的増幅を促進し、その後の検出を容易にする。
典型的には、工程(vii)では、ライゲートされたライゲーション複合体の標的配列との再アニーリングよりも、増幅テンプレートの形成が優先されるように、標的配列の量に対して非常に過剰な標的特異的プローブが添加される。
【0056】
次に、増幅鋳型から核酸が増幅される(工程(viii))。
図3に示すように、増幅は架橋オリゴ及び/又は標的特異性プローブから開始できる。
アニーリングされた標的特異性プローブからの増幅は、標的特異性プローブ配列を含まない非変異体標的配列(「不一致」)よりも、標的特異性プローブ配列を含む変異体標的配列(「一致」)の選択的増幅をもたらす。増幅は、phi29ポリメラーゼ(UniProtKB-P03680;DPOL_BPPH2)又はBstポリメラーゼ(P52026;DPO1_GEOSE)等の鎖置換ポリメラーゼを使用したローリングサークル増幅を使用して実行される。
【0057】
一本鎖コンカテマー配列は、工程(viii)の結果として得られる。
【0058】
任意に、工程(i)で指定された認識配列が存在する場合、工程(ix)は、以下によって核酸断片を取得するために実行される。
(a)工程(viii)で得られた一本鎖コンカテマー配列を切断する、又は、
(b)工程(viii)で得られた増幅された1つまたは複数の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとアニーリングさせ、ここで、オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、工程(i)で特定された認識配列とアニールし、アニーリングされた複合体を前記エンドヌクレアーゼで切断する。
【0059】
任意に、増幅後、固体支持体は、それが存在する場合には除去され、上清がその後の処理に使用される。例えば、固体支持体が磁性粒子である場合、これらは磁石を使用して除去され得る。
本発明の方法のいくつかの他の実施形態では、第1の捕捉部分と第2の捕捉部分との間の相互作用は、工程(v)の直後、工程(vi)の後、又は工程(vii)の後に中断される。
例えば、第1の捕捉部分がビオチンであり、第2の捕捉部分がストレプトアビジンである場合には、過剰な可溶性ビオチンを添加することによって相互作用を中断することができる。ストレプトアビジンが磁性粒子に結合している場合は、磁石を使用して除去できる。
【0060】
次に、工程(x)では、工程(viii)で得られたコンカテマー配列、又は工程(ix)が実行された場合は工程(ix)で得られた核酸フラグメントをハイスループットシークエンシング技術にかけてバーコード配列を決定する。
【0061】
任意に、第1及び第2のプローブのユニバーサル部分に結合するプライマーを使用して工程(x)の直前にPCR増幅が行われ、ここで、前記プライマーは、任意に、工程(x)における後続の配列決定のためのアダプター配列を含む。
【0062】
別の実施形態では、工程(x)の配列決定はナノポア配列決定を使用して行われ、任意に工程(viii)で得られたコンカテマー配列は転位複合体を使用して断片化される。ナノポア配列決定に適した技術は、Wangらの2021 Nat Biotechnol 39(11):1348においてレビューされてきた。
【0063】
複数の試料中の標的ヌクレオチド配列の存在及び/又は数の特定は、第1及び/又は第2の標的特異性部分の少なくとも一部、及び/又は第1及び又は第2のバーコードの少なくとも一部を、及び/又は第3のバーコードの少なくとも一部をハイスループットシーケンシング技術(工程(x)及び(xi))、例えば、イルミナiSeq、MiSeq、HiSeq、NextSeq、又はNovaSeqを含むがこれらに限定されない次世代シーケンシングプラットフォームを使用して決定することで実行されてもよい。
好ましくは、遺伝子標的列挙は、標的あたりの及び試料あたりの分子バーコードの数を数えることによって可能になる。試料を配列データから解き(デコンボリューテッドされde-convoluted)、DNA配列決定後に配列表的をインシリコ(in silico)で定量する。
【0064】
本発明の両態様の利点には、従来の核酸シーケンシング技術と比較して、低コスト、高単純性、高特異性、高感度、高精度、ハイスループット、高スケーラビリティ及び高ターンオーバーでの定量アッセイが含まれるが、これらに限定されない。
本発明の別の態様は、本発明の方法により、ヒト及び動物の集団を含み、及び大量の未精製の試料材料を含む複数の試料中の複数の核酸標的の正確且つ大規模な並行定量を可能にする。
上述したように、好ましい実施形態では、尿試料などの試料は、事前に核酸を精製又は濃縮せずに使用される。別の実施形態では、試料を前処理してもよく、例えば、細胞を溶解して核酸を露出させる。
本発明の1つの特定の利点は、独自のプローブ設計、すなわちプローブトリプレットを使用して、目的の標的配列の検出及び増幅を可能にすることである。
プローブは、アニーリング及び結合効率を改善する特別に配置された修飾ヌクレオチドを用いて設計される。結合特性の改善は、アッセイの特異性、感度及び精度を向上させる。
本発明の方法は、遺伝変異体の研究にも適用可能であり、これらに限定されないが、SNP及び/又はインデルなど、1以上の配列及び/又は多型についての試料の遺伝子型同定、癌診断、又は母体血液からの胎児染色体障害等を含む、診断及び予後への適用が見出される。
好ましい実施形態では、2つ以上の試料又は2つ以上の遺伝子座/対立遺伝子組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1以上の配列及び/又は多型について試料の遺伝子型を同定するために使用される。
【0065】
他の態様において、本発明は、複数の容器を含むパーツのキットを提供し、ここで、少なくとも1つの容器は、1つ以上の第1のプローブ及び第2のプローブのセットを含み、少なくとも1つの容器は、1つ以上の架橋オリゴ、又はバーコードループオリゴと共に架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含み、
ここで、前記第1のプローブは、分子の5’末端から開始して、第1の架橋オリゴ特異性配列、任意に第1の配列バーコード、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
ここで、第2のプローブは、分子の5’末端から開始して、第2の標的特異性部分、任意に第2の配列バーコード、及び第2のプローブの3’末端の第2の架橋オリゴ特異性配列を含み、
ここで、架橋オリゴ又は架橋オリゴ複合体は、それぞれ第1及び第2のプローブ内の第1及び第2の架橋オリゴ特異性配列に相補的な配列、及び任意に第3のバーコードを含み、
ここで、第1配列バーコード又は第2配列バーコード又は第3バーコードのうちの少なくとも1つは、それぞれ第1プローブ又は第2プローブ又は架橋オリゴ又は架橋オリゴ複合体中に存在し、
ここで、前記キットは、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブをさらに含み、ここで、前記標的特異性プローブは、ライゲートされたライゲーション複合体とアニーリングすることができ、及び、
ここで、任意に、第1のプローブ又は第2のプローブ又は架橋オリゴ又は架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼの認識配列を含み、及び、
ここで、任意に、前記パーツのキットは、前記エンドヌクレアーゼの認識部位が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む。
【0066】
好ましくは、第1のプローブの3’末端もしくは第2のプローブの5’末端、またはその両方は、第1のプローブの第2のプローブへの化学的ライゲーションを可能にするために修飾される。
【0067】
好ましくは、架橋オリゴ又は複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドは、第1のプローブの配列に相補的な配列、又は第2のプローブの配列に相補的な配列、又はその両方中に、1つ又は複数の化学修飾ヌクレオチドを含む。
【0068】
好ましくは、第1のプローブの3’末端、又は第2のプローブの5’末端、又はその両方は、第1のプローブの第2のプローブへの化学的ライゲーションを可能にするために修飾される。
【0069】
好ましくは、第1のプローブ又は第2のプローブ又はその両方の架橋部分又は架橋オリゴ又は複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドは、架橋オリゴ又は架橋オリゴ複合体への結合の改善を可能にする化学修飾された塩基を含む。
【0070】
特定の一実施形態では、第1及び第2のプローブのセットを含む少なくとも1つの容器と、互いにアニーリングして架橋オリゴ複合体を形成することができる架橋オリゴ又は複数のオリゴヌクレオチドを含む少なくとも1つの容器は、同一の容器である。このような場合、プローブは事前にアニーリングされており、ライゲーション複合体を形成していてもよい。
【0071】
本発明の1つの特定の利点は、独自のプローブ設計を使用して、目的の標的配列の検出及び増幅を可能にすることである。プローブは、アッセイ特異性、感度及び精度の向上につながる改善された結合特性で設計される。
本発明は、分子生物学、進化生物学、メタゲノミクス、遺伝子型同定の分野、より具体的には、しかし、これらに限定されないが、SNP及び/又はインデルなどのような1以上の配列及び/又は多型についての試料の遺伝子型の同定を含むがこれに限定されない、癌診断又は胎児染色体障害等の分野における応用を見出すことである。
【0072】
1つの特定の好ましい実施形態では、架橋オリゴ又は架橋オリゴ複合体は、試料を識別するための情報を備え、固有のバーコードを含む。そのような場合、第1及び第2のプローブは、すべての試料に一般的に適用可能である(標的を識別するための情報を含むだけである)。従って、1つの好ましい実施形態では、本発明による方法又はキットが提供され、ここでは、架橋オリゴ又は架橋オリゴ複合体は、各試料の標的配列の列挙を可能にする固有の配列を含むバーコードを含む。
【実施例0073】
(方法)
1.プローブ複合体の形成
プローブ複合体は、ゲノムターゲティング、サンプルインデックス付け、及びイルミナシーケンシングライブラリの構築に必要な配列を含む。
【0074】
以下を含む3部構成のプローブ複合体が形成される(
図2を参照)。
(a)分子の5’末端から出発し、第1の架橋オリゴ特異性配列と、第1のプローブの3’末端にある第1の標的特異性部分とを有する第1のプローブ、
(b)分子の5’末端から出発し、第2の標的特異性部分、第2の配列バーコード、及び第2のプローブの3’末端にある第2の架橋オリゴ特異性配列を有する第2のプローブ、及び、
(c)第1のプローブ及び第2のプローブのそれぞれにおける第1の架橋オリゴ特異性配列及び第2の架橋オリゴ特異性配列に相補的な配列を有する架橋オリゴ。
【0075】
プローブ複合体は、アニーリング反応において全3つの部分(架橋、右アーム、左アーム)を等モル量で組み合わせることで構築される。反応はサーモサイクラーで実行される(表1のアニーリングプログラム)。
【0076】
【0077】
2.標的補足
対象となる変異を含む特定のゲノム領域が標的になる。精製されたDNA(組織、血漿、尿、又は唾液から等)を試料として使用することも、精製せずに煮沸及び/又は遠心分離などの前処理のみを行った試料を使用することもできる。
プローブ複合体は、塩基配列の相補的相互作用を介して標的領域にハイブリダイズされる。標的捕捉を開始するには、反応プローブと標的DNAを混合し、サーマルサイクラー内でインキュベートする(表2の標的捕捉及びギャップ充填プログラム)。
【0078】
【0079】
3.ギャップ充填反応
標的を捕捉した後、別々のターゲティング反応から得たプローブ複合体をプールし、続いてPhusion DNAポリメラーゼ、ヌクレオチド、Ampligase DNAリガーゼの組み合わせを加え、+45℃で45分間インキュベートすることによって伸長及びライゲーションする。
【0080】
4.エキソヌクレアーゼ処理
ギャップ充填後、1μlの熱不安定性エキソヌクレアーゼ1(NEB、#M0568L)と1μlのRecJFエキソヌクレアーゼ(NEB、#M0264L)を加え、+37℃で30分間インキュベートすることにより線状分子を除去する。エキソヌクレアーゼは、+92℃で12分間インキュベートすることにより不活化される。
【0081】
5.ローリングサークル増幅
伸長とライゲーションの後、環状プローブ分子はターゲット特異的プローブと整列され、ローリングサークル増幅(RCA)に供される。
RCA反応のため、標的捕捉反応物はブーストオリゴと混合され、短時間変性される。反応物は、続いてEquipPhi29(Thermo Scientific)ポリメラーゼを含むRCA反応ミックスと混合される。反応物を+42℃で30分~2時間インキュベートする。RCA反応後、Qubit蛍光光度計で一本鎖DNA(ssDNA)の濃度を測定することで反応効率が分析される。
【0082】
6.酵素消化
RCA反応により、標的ライブラリの複数のコピーを有する長いコンカテマーssDNA分子が生成される。各完全なターゲットライブラリは、EcoRI制限酵素認識配列によって分離される。この配列により、EcoRI制限酵素認識配列を含む特定のオリゴヌクレオチドとのアニーリングによる長いコンカテマーの配列特異的な切断と、準備ができたターゲットライブラリの解放が可能になる。これらのライブラリは、簡単な精製ステップを経て、さらなる分析にすぐに使用できる。RCA製品はEcoRIで+37℃で1時間消化される。
【0083】
7.ライブラリPCR
消化されたRCA生成物は、PCR反応でシーケンスライブラリに拡張され、適切なプローブに存在する短縮されたシーケンス アダプターはフローセル互換の全長シーケンスアダプターに拡張される。
【0084】
8.ライブラリの精製
ライブラリPCR後、電気泳動又はサイズ選択ビーズ(Macherey Nagel NucleoMagなど)を使用してアガロースゲルからライブラリ分子を抽出することにより、ライブラリ分子が精製される。
【0085】
9.シーケンシング
精製されたMiSeq又はiSeq100互換性ライブラリは、最先端のシーケンシング機器を使用して配列解析される。重要なことに、ライブラリは、簡単なオリゴヌクレオチド修飾によって、利用可能な任意のシーケンシングプラットフォームに適合するように変換できる。シーケンスデータは、UnixコマンドラインツールとPython及びRプログラミング言語を組み合わせて使用して処理される。
要約すると、配列処理の理論的根拠は、各リード内のプローブ配列を特定し、それらの間のゲノム領域を配列決定し、及び各遺伝子標的に関連する分子バーコードの数をカウントすることである。
【0086】
(試験1)
最初の実験では、プローブミックスは4つの異なるインデックス付きプローブ複合体のコレクションであり、結果として4つの反復反応が生じた。それらは、
図5にリストされている12個の遺伝子融合を標的(ターゲット)にした。標的オリゴヌクレオチドは、各標的の識別を可能にする固有の認識配列を持っていた。
試料として、合成標的オリゴヌクレオチドの2つのタイプは、12の遺伝子融合のそれぞれについて等しい濃度で混合された。標的捕捉、伸長及びライゲーション反応、ローリングサークル増幅及びその後のEcoRIによる消化を上記のように実施した。結果として得られるシーケンスライブラリの例を
図4に示す。
準備されたライブラリはiSeq100機器で配列決定され、及び各リード内のプローブ配列と照合し、プローブ配列間のゲノム配列領域を同定し、分子バーコードを計数することによって配列データ内の標的領域を検出した。計数データは、各遺伝子融合標的のブースティングステータスを正確に反映していた(
図5)。
図5中、非ブーストに関連するデータはグラフ内で文字「N」でマークされている。マークのないバーはブーストに関連している。
【0087】
(
図1、2及び3の詳細な説明)
図1は、詳細な説明に記載の発明の一実施形態のワークフローを示す。工程1では、試料(102)内の核酸(DNA又はRNA)をライゲーション複合体のセット(104)と接触させる。ライゲーション複合体は標的核酸上でアニールする(106)。工程2では、任意に、標的に結合したライゲーション複合体が試料材料から捕捉され、試料の不純物が残される(103)。
工程3では、アニールされたライゲーション複合体がライゲートされ、ライゲートされたライゲーション複合体が得られる。
工程4では、複数の試料からライゲートされたライゲーション複合体がともにプールされた。
工程5では、ライゲートされたライゲーション複合体を標的ヌクレオチド配列から解離させ、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加し、標的特異性プローブをライゲートされたライゲーション複合体にアニールさせる。
標的特異性プローブは、選択した稀な変異(114)に特異的にアニールし、標的への結合を強化したり、エキソヌクレアーゼ活性から保護したりする修飾(ホスホロチオエート修飾を含むがこれに限定されない)を任意に含む。
工程6では、phi29ポリメラーゼ又は他の鎖置換ポリメラーゼを使用するローリングサークル増幅によってプローブ配列が増幅され、プローブの長いコンカテマーコピーが生成される。稀な変異の増幅はさらなる効率でブーストされる(116)。
工程7では、コンカテマープローブのコピーは、任意に、EcoRIなどの制限エンドヌクレアーゼ又はI-CeuIなどのホーミングヌクレアーゼを使用してモノマー単位に切断され、任意にPCR又はエマルジョンPCR(117)を使用してさらに増幅される。
工程8では、次世代DNAシーケンスを使用して、増幅されたDNAのシーケンスが行われる。
工程9では、バイオインフォマティックパイプラインを使用して、DNAシーケンスの結果がターゲット数に変換される。
【0088】
図2Aは、本発明の一実施形態による第1のプローブと第2のプローブとの間のギャップ充填を示す。ここで、架橋オリゴは、架橋配列1(228)と架橋配列2(224)との間にギャップ1を含む。ギャップ2はプローブ1と2の標的結合部分(208と216)の間に形成される。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって充填される。このプロセスには、Stoffelフラグメント、Taqポリメラーゼ又はPhusionポリメラーゼと、AmpligaseなどのDNAリガーゼの混合物を使用できる。ポリメラーゼは、(a)ユニバーサル架橋オリゴ配列に相補的なヌクレオチド、及び(b)標的配列に相補的なヌクレオチドを追加し、それによって2つのギャップ、つまり第1のプローブと第2のプローブ間のギャップ1とギャップ2を充填し、そして、その後のDNAリガーゼの作用により、架橋オリゴ及び標的配列に相補的な第1のプローブと第2のプローブのライゲーションがもたされて環状複合体が形成される。
【0089】
図2Bは、本発明の一実施形態による複数のプローブ実体を有するプローブクインテットの原理構造を示す。複数のプローブ実体には、第1のプローブ、第2のプローブ及び3つのオリゴからなる架橋が含まれる。
ここで、プローブ複合体は、第1のプローブと第2の架橋の間(228と236)、第2の架橋と第2のプローブの間(240と222)、第1と第3の架橋オリゴの間(238と242)及び第1及び第2のプローブの間(208と216)のギャップを含む。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって充填される。
このプロセスには、Stoffelフラグメント、Taqポリメラーゼ、又はPhusionポリメラーゼと、AmpligaseなどのDNAリガーゼの混合物を使用できる。ポリメラーゼはこれらのギャップを埋め、その後のDNAリガーゼの作用により、プローブと架橋オリゴがライゲーションに付されて環状複合体が形成される。
【0090】
第1のプローブの15~25塩基は、架橋結合配列1(228)を含み、これは、架橋配列1と呼ばれる効率的な架橋オリゴ結合のための化学的に修飾された塩基を任意に含む。第1のプローブにはさらに、任意に、ライブラリのインデックス付け(204)に使用されるユニバーサル配列を含む5’末端から続く10~20の塩基が含まれている。
第1のプローブはさらに、任意に、バーコード1(206)と呼ばれる分子特異性バーコード又はまたはサンプル特異性バーコードを形成するランダムヌクレオチドのセグメントを含む、5’末端から続く10~20塩基を含む。
第1のプローブはさらに、5’末端から続く15~30塩基を含み、遺伝子標的(208)に結合する。228のヌクレオチドの一部またはすべては、標的又は架橋(226)に対するプローブの親和性を高める化学修飾を含んでもよい。
第1のプローブの最後の塩基には、酵素的ライゲーションのためのリン酸部分、又は修飾1(210)と呼ばれる隣接するプローブの5’末端への化学的ライゲーションを可能にする修飾が任意に含まれる。
【0091】
第2のプローブの第1の塩基は、任意に、酵素的ライゲーションのためのリン酸部分、又は修飾2(214)と呼ばれる、隣接するプローブの5’末端への化学的ライゲーションを可能にする修飾を含む。
第2のプローブの5’末端から15~30塩基には、遺伝子標的(216)に結合する第2のプローブの一部が含まれる。
第2のプローブの5’末端から続く10~20塩基には、バーコード2(218)と呼ばれる分子特異性バーコード又はサンプル特異性バーコードを形成するランダムなヌクレオチドのセグメントが任意に含まれる。第2のプローブの5’末端から続く10~20塩基には、ユニバーサル配列(220)が含まれていてもよい。
架橋配列8(222)と呼ばれる第2のプローブの最後の15~25塩基は、第3の架橋オリゴ(224)の架橋配列7に対して逆相補的である。208、216、222又は228のヌクレオチドの一部又はすべてには、標的又は架橋オリゴに対するプローブの親和性を高める化学修飾が含まれていてもよい。
【0092】
架橋配列3(226)と呼ばれる第1の架橋オリゴの5’末端からの最初の15~25塩基は、第2のプローブ(228)の架橋配列1に逆相補的であり、及び、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
架橋配列2(238)と呼ばれる、第1の架橋オリゴの最後の15~25塩基は、第2の架橋オリゴ(236)の架橋配列4に対して逆相補的であり、及び、任意に結合を高めるために化学修飾されたヌクレオチドを含む。
第1の架橋オリゴの5’末端は、ライゲーション複合体を捕捉するために使用される捕捉部分(230)を任意に含む。
【0093】
架橋配列5(240)と呼ばれる、第2の架橋オリゴの5’末端から最初の15~25塩基は、第3の架橋オリゴの架橋配列6(242)に逆相補的であり、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
架橋配列4(236)と呼ばれる、第2の架橋オリゴの最後の15~25塩基は、第1の架橋オリゴ(238)の架橋配列2の配列に逆相補的であり、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
【0094】
架橋配列6(242)と呼ばれる、第3の架橋オリゴの5’末端から最初の15~25塩基は、第2の架橋オリゴ(240)の架橋配列5の配列に逆相補的であり、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
架橋配列7(224)と呼ばれる、第1の架橋オリゴの最後の15~25塩基は、第2のプローブ(222)の架橋配列8の配列に逆相補的であり、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
第3の架橋オリゴの3’末端は、場合により、ギャップ充填中の伸長を防ぐためにリン酸(または他の切断可能な)部分(234)を含む。
【0095】
図2Cは、バーコードループオリゴの使用を含む実施形態を示す。ここで、複数のプローブ実体には、第1のプローブ(202)、第2のプローブ(201)、架橋オリゴ(200)及びバーコードループオリゴ(217)が含まれる。
ここで、プローブ複合体は、第1のプローブとバーコードループオリゴとの間(210と213)、第2のプローブとバーコードループオリゴとの間(207と215)、及び第1と第2のプローブとの間(203と204)にギャップを含む。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって埋められる。このプロセスには、Stoffelフラグメント、Taqポリメラーゼ又はPhusionポリメラーゼと、AmpligaseなどのDNAリガーゼの混合物を使用できる。
ポリメラーゼはこれらのギャップを埋め、その後のDNAリガーゼの作用により、プローブ、架橋、及びバーコードループオリゴが環状複合体にライゲーションされる。
【0096】
第1のプローブの15~25塩基は、効率的な架橋オリゴ結合のために化学的に修飾された塩基を任意に含む架橋結合配列(210)を含む。第1のプローブには、さらに、5’末端からつづく15~30塩基が含まれており、遺伝子標的(203)に結合する。
210のヌクレオチドの一部又はすべては、標的又は架橋(209)に対するプローブの親和性を高める化学修飾を含んでもよい。第1のプローブの最後の塩基には、任意に、酵素的ライゲーションのためのリン酸部分又は隣接するプローブ(205)の5’末端への化学的ライゲーションを可能にする修飾が含まれる。
【0097】
第2のプローブの最初の塩基は、任意に、酵素的ライゲーションのためのリン酸部分又は隣接するプローブ(206)の5’末端への化学的ライゲーションを可能にする修飾を含む(206)。第2のプローブの5’末端からの15~30塩基には、遺伝子標的(204)に結合する第2のプローブの一部が含まれる。第2のプローブ(207)の最後の15~25塩基は、架橋オリゴ(208)に対して逆相補的である。203、204、207又は210のヌクレオチドの一部又はすべてには、標的又は架橋オリゴに対するプローブの親和性を高める化学修飾が含まれていてもよい。
【0098】
架橋オリゴ(209)の5’末端から最初の15~25塩基は、第1プローブ(210)の架橋オリゴ特異性配列に逆相補的であり、任意に、結合を高めるために化学修飾されたヌクレオチドを含む。
架橋オリゴ(208)の最後の15~25塩基は、第2のプローブ(207)の配列に対して逆相補的であり、任意に結合を高めるために化学修飾されたヌクレオチドを含む。
架橋オリゴの5’末端には、ライゲーション複合体を捕捉するために使用される捕捉部分(211)が任意に含まれる。
さらに、架橋オリゴは、バーコードループオリゴの配列213及び215に相補的な配列214及び216を含む。架橋オリゴの3’末端には、ギャップ充填中の伸長を防ぐために、リン酸(または他の切断可能な)部分(212)が任意に含まれる。
【0099】
バーコードループオリゴ(215)の5’末端からの最初の15~25塩基は、架橋オリゴ配列216に対して逆相補的である。バーコードループオリゴは、バーコード(218)を含むループ領域を含む。バーコードループオリゴ(213)の最後の15~25塩基は、架橋オリゴ配列214に対して逆相補的である。
【0100】
図2Dは、本発明の一実施形態によるプローブ四重項のクワトロプレット原理構造を示す。複数のプローブ実体には、第1のプローブ(202)、第2のプローブ(201)、架橋オリゴ(200)及びバーコードループオリゴ(217)が含まれる。ここで、プローブ複合体は、第1のプローブとバーコードループオリゴとの間(210と213)、第2のプローブとバーコードループオリゴとの間(207と215)及び第1と第2のプローブとの間(203と204)にギャップを含む。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって埋められる。このプロセスには、Stoffelフラグメント、Taqポリメラーゼ又はPhusionポリメラーゼと、Ampligase等のDNAリガーゼの混合物を使用できる。ポリメラーゼはこれらのギャップを埋め、その後のDNAリガーゼの作用により、プローブ、架橋及びバーコードループオリゴがライゲートされ環状複合体となる。
【0101】
第1のプローブの15~25塩基は、効率的な架橋オリゴ結合のために化学的に修飾された塩基を任意に含む架橋結合配列(210)を含む。第1のプローブはさらに、増幅プライマー(221)及びバーコード配列(222)の結合部位、及び、5’末端から15~30塩基で遺伝子標的に結合する配列(203)を含む。
210のヌクレオチドの一部又はすべては、標的または架橋(209)に対するプローブの親和性を高める化学修飾を含んでもよい。第1のプローブの最後の塩基には、任意に、酵素的ライゲーションのためのリン酸部分、または隣接するプローブ(205)の5’末端への化学的ライゲーションを可能にする修飾が含まれる。
【0102】
第2のプローブの最初の塩基は、任意に、酵素的ライゲーションのためのリン酸部分、又は隣接するプローブ(206)の5’末端への化学的ライゲーションを可能にする修飾を含む。第2のプローブの5’末端からの15~30塩基には、遺伝子標的(204)に結合する第2のプローブの一部が含まれる。
第2のプローブは、増幅プライマーの結合部位(223)、配列決定アダプター配列(224)、EcoRIなどの制限エンドヌクレアーゼの認識部位(225)及び別の配列決定アダプター配列(207)をさらに含む。
第2のプローブ(207)の最後の15~25塩基は、架橋オリゴ(208)に対して逆相補的である。203、204、207又は210のヌクレオチドの一部又はすべてには、標的又は架橋オリゴに対するプローブの親和性を高める化学修飾が含まれていてもよい。
【0103】
架橋オリゴ(209)の5’末端からの最初の15~25塩基は、第1のプローブ(210)の架橋オリゴ特異性配列に逆相補的であり、任意に結合を高めるために化学修飾されたヌクレオチドを含む。架橋オリゴ(208)の最後の15~25塩基は、第2のプローブ(207)の配列に対して逆相補的であり、場合により結合を高めるために化学修飾されたヌクレオチドを含む。バーコードループオリゴのどちらの末端とも逆相補的ではない架橋オリゴの部分(220)は、制限エンドヌクレアーゼの認識部位を任意に含む。
架橋オリゴの5’末端には、ライゲーション複合体を捕捉するために使用される捕捉部分(211)が任意に含まれる。さらに、架橋オリゴは、バーコードループオリゴの配列213及び215に相補的な配列214及び216を含む。架橋オリゴの3’末端には、ギャップ充填中の伸長を防ぐために、リン酸(又は他の切断可能な)部分(212)が任意に含まれる。
【0104】
バーコードループオリゴ(215)の5’末端からの最初の15~25塩基は、架橋オリゴ配列216に対して逆相補的である。バーコードループオリゴは、バーコード(218)を含むループ領域を含む。バーコードループオリゴ(213)の最後の15~25塩基は、架橋オリゴ配列214に対して逆相補的である。
【0105】
図3は、記載された発明の一実施形態のワークフローが、変異を含まないバルクゲノムも含むサンプルにおける稀な変異の検出をどのように強化するかを示す。
工程1では、ターゲットに結合したライゲーション複合体にギャップ充填とライゲーションを行う。
工程2では、ライゲートされたライゲーション複合体を標的ヌクレオチド配列から解離させ、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加し、標的特異性プローブをライゲートされたライゲーション複合体にアニールさせる。
工程3及び4では、phi29ポリメラーゼまたは他の鎖置換ポリメラーゼを使用するローリングサークル増幅によってプローブ配列が増幅され、プローブの長いコンカテマーコピーが得られる。標的特異性プローブから始まる増幅は、標的特異的プローンが標的配列と一致する場合にのみ発生する。不一致がある場合、架橋オリゴから始まる増幅のみが行われる。
前記第1のプローブ、前記第2のプローブ、前記架橋オリゴ又は複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドのうちの少なくとも1つは、第1の捕捉部分を含み、及び、工程(iv)と(v)の間で、
ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体に接触させること、
前記ハイブリダイゼーション複合体が前記固体支持体に結合するように、前記第1の捕捉部分と前記第2の捕捉部分が相互作用できるようにすること、及び、
前記固体支持体に結合していない試料の成分から前記固体支持体に結合したハイブリダイゼーション複合体を分離すること、を実行する中間工程(iv)(a)が実行される請求項1~3の何れか一項に記載の方法。
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドの1つ以上のオリゴヌクレオチドは、前記第1のプローブ又は前記第2のプローブに相補的ではない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを可能にする複数のユニバーサル塩基類似体を含み、及び、工程(v)の前に、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填ステップが実行される、請求項1に記載の方法、
前記第1のプローブの3’末端又は前記第2のプローブの5’末端、又はその両方が、前記第1のプローブの前記第2のプローブへの化学的ライゲーションを可能にするように修飾される請求項1に記載の方法。
前記第1のプローブ又は前記第2のプローブ、又はその両方の架橋部分、又は前記架橋オリゴもしくは前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドが、前記架橋オリゴ又は架橋オリゴ複合体への結合を改善させる化学修飾された塩基を含む請求項1に記載の方法。
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、及び/又は前記第2の架橋オリゴ特異性配列が、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含む、請求項1に記載の方法。
2つ以上の試料について、又は2つ以上の遺伝子座/対立遺伝子の組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1つ以上の配列及び/又は多型について試料の遺伝子型を特定するために使用される、請求項1に記載の方法。