(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024035109
(43)【公開日】2024-03-13
(54)【発明の名称】核酸の正確な並行検出及び定量のための方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240306BHJP
C12Q 1/6844 20180101ALI20240306BHJP
C12Q 1/6853 20180101ALI20240306BHJP
C12Q 1/6839 20180101ALI20240306BHJP
C12N 15/11 20060101ALN20240306BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6844 Z
C12Q1/6853 Z
C12Q1/6839 Z
C12N15/11 Z
【審査請求】有
【請求項の数】21
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023131128
(22)【出願日】2023-08-10
(31)【優先権主張番号】17/899,851
(32)【優先日】2022-08-31
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.UNIX
2.PYTHON
(71)【出願人】
【識別番号】522099674
【氏名又は名称】ゲノミル ヘルス オサケユイチア
【氏名又は名称原語表記】Genomill Health Oy
(74)【代理人】
【識別番号】100145849
【弁理士】
【氏名又は名称】井澤 眞樹子
(72)【発明者】
【氏名】ユハ ペッカ プルシヘイモ
(72)【発明者】
【氏名】タトゥ ヒルヴォネン
(72)【発明者】
【氏名】アントーニ コルキアコスキ
(72)【発明者】
【氏名】マヌ タンミネン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA18
4B063QQ03
4B063QQ42
4B063QR08
4B063QR62
4B063QS26
4B063QX02
(57)【要約】 (修正有)
【課題】大量の未精製の試料材料などの1以上の核酸標的を正確に、かつ大規模に並行して定量するための次世代DNAシーケンシング方法であって、複合試料中の遺伝子標的を検出及び定量するためのプローブを含む方法及びキットを提供する。
【解決手段】本発明は、遺伝子標的毎に2つの標的特異性核酸プローブ、バーコードループオリゴ及び架橋オリゴ又は架橋オリゴ複合体を含む。
【選択図】
図2A
【特許請求の範囲】
【請求項1】
複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出する方法であって、該方法は、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブ、バーコードループオリゴ及び架橋オリゴ又はバーコードループオリゴにアニーリングして架橋オリゴ複合体を形成することができる複数の架橋オリゴヌクレオチド、を提供することであって、
前記第1のプローブは、前記第1のプローブの5’末端に第1の架橋オリゴ特異性配列、及び前記第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、前記第2のプローブの5’末端に第2の標的特異性部分、及び第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、
前記バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列、及び第4の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドは、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び、前記バーコードループオリゴにおける前記第3の架橋オリゴ特異性配列及び前記第4の架橋オリゴ特異性的配列に相補的な配列を含み、及び、
任意に、前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は複数の架橋オリゴヌクレオチドのオリゴヌクレオチドのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含むこと、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブ及び前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、前記バーコードループオリゴ及び前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させること、及び、前記ライゲーション複合体への自己アニーリングを可能にすること、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させること、
(iv)前記第1のプローブ及び前記第2のプローブの各前記第1の標的特異性部分及び前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせること、それにより、複数のハイブリダイゼーション複合体を形成すること、
(v)任意に、前記複数の試料からの前記ハイブリダイゼーション複合体をプールすること、
(vi)前記ハイブリダイゼーション複合体中の前記プローブを、ライゲートされたライゲーション複合体に供給するためにライゲートすること、
(vii)置換ポリメラーゼによるローリングサークル増幅を使用して、1以上のライゲートされたライゲーション複合体から核酸を増幅することと、それによって一本鎖コンカテマー配列を得ること、
(viii)選択的に、工程(i)において指定された認識配列が存在する場合、以下の方法で核酸断片を取得する工程を実行すること、
(a)工程(vii)で得られた一本鎖コンカテマー配列を切断すること、又は
(b)工程(vii)で得られた一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとアニーリングに供することであって、ここで前記オリゴヌクレオチドは、工程(i)で特定された認識配列とアニールし、その結果、エンドヌクレアーゼのための認識部位が得られ、及びアニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(ix)前記工程(vii)で得られた前記コンカテマー配列、又は前記工程(viii)で得られた前記核酸断片を、ハイスループットシーケンシング技術に供し、前記バーコード配列を決定すること、及び、
(x)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は、バーコードループオリゴ内のバーコードに対応するバーコード配列の少なくとも一部を決定することによって、複数の試料中の標的ヌクレオチド配列の存在及び/又は数を同定すること、である各工程を含み、
前記工程(v)及び(vi)が、任意の順序で実行され得る方法。
【請求項2】
前記バーコードループオリゴが、ニッキングエンドヌクレアーゼなどのエンドヌクレアーゼに対する1つ又は複数の認識配列を含む、請求項1に記載の方法。
【請求項3】
前記バーコードループオリゴが、二本鎖エンドヌクレアーゼ認識部位が得られるように互いにアニーリングすることができる2つの認識配列を含む、請求項2に記載の方法。
【請求項4】
前記方法は、請求項1で特定される工程(viii)を含まず、工程(vii)と(ix)の間に、バーコードループオリゴ中の前記2つの認識配列をアニーリングさせ、及び、得られた二本鎖エンドヌクレアーゼ認識部位を、前記認識部位に対して特異性を有するニッキングエンドヌクレアーゼなどのエンドヌクレアーゼで切断する工程を含む、請求項3に記載の方法。
【請求項5】
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのうちの1つ以上のオリゴヌクレオチドは、前記第1のプローブ、前記第2のプローブ、又は前記バーコードループオリゴに相補的でない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを可能にする複数のユニバーサル塩基類似体を含み、
前記工程(vi)の一部として、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填工程が実行される、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記複数のユニバーサル塩基類似体は、複数の5-ニトロインドールである、請求項5に記載の方法。
【請求項7】
前記第1のプローブ、前記第2のプローブ、又は前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドは、配列バーコードをさらに含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
工程(v)の後であり且つ工程(vii)の前に、工程(a)及び工程(b)が実行され、
工程(a)は、前記ライゲートされたライゲーション複合体を標的ヌクレオチド配列から解離させることを含み、工程(b)は、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加することを含み、
前記標的特異性プローブは、前記ライゲートされたライゲーション複合体とアニーリングすることができ、前記標的特異性プローブが前記ライゲートされたライゲーション複合体にアニーリングすることを可能にし、それにより、増幅テンプレートを形成し、及び、
工程(vii)において、前記増幅テンプレートは、鎖置換ポリメラーゼを用いたローリングサークル増幅によって増幅される、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は前記複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドのうちの少なくとも1つは、第1の捕捉部分を含み、
工程(iv)と(v)の間で、前記ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体に接触させ、
前記第1の捕捉部分と前記第2の捕捉部分は、ハイブリダイゼーション複合体が固体支持体に結合するように相互作用し、
固体支持体に結合した前記ハイブリダイゼーション複合体を固体支持体に結合していない試料の成分から分離することを含む中間工程(iv)(a)が実行される、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記複数の試料が、血液試料、唾液試料、尿試料、又は糞便試料を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記架橋オリゴ又は複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドが、
(i)1~5個の3’突出塩基、及び/又は
(ii)3’リン酸、及び/又は
(iii)3’末端から3つの位置内の1以上のホスホロチオエート修飾
を含む請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記第1のプローブの3’末端又は第2のプローブの5’末端、又はその両方が、第1のプローブの第2のプローブへの化学的ライゲーションを可能にするように修飾される請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記第1のプローブ又は前記第2のプローブ、又はその両方の架橋部分、又は前記バーコードループオリゴ、前記架橋オリゴもしくは前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドが、前記架橋オリゴ又は架橋オリゴ複合体への結合を改善させる化学修飾された塩基を含む請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、及び/又は前記第2の架橋オリゴ特異性配列が、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含む、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのオリゴヌクレオチドが1以上の化学的に修飾されたヌクレオチドを含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
工程(vii)は、phi29ポリメラーゼ又はBstポリメラーゼを使用して実行される、請求項1~15のいずれか一項に記載の方法。
【請求項17】
PCR増幅が、前記第1及び前記第2のプローブのユニバーサル部分に結合するプライマーを使用して工程(ix)の直前に実行され、
前記プライマーが、工程(ix)における後続の配列決定のためのアダプターを任意に含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
工程(ix)の配列決定はナノポア配列決定を使用して実行され、
任意に、工程(vii)で得られた前記コンカテマー配列は、転位複合体を使用して断片化される、請求項1~17のいずれか一項に記載の方法。
【請求項19】
遺伝子標的列挙が、標的当たりの、及び試料当たりの分子バーコードの数を数えることによって可能になる、請求項1~18のいずれか一項に記載の方法。
【請求項20】
2つ以上の試料について、又は2つ以上の遺伝子座/対立遺伝子の組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1つ以上の配列及び/又は多型について試料の遺伝子型を特定するために使用される、請求項1~19のいずれか一項に記載の方法。
【請求項21】
複数の容器を含むパーツのキットであって、
少なくとも1つの容器は、第1のプローブ及び第2のプローブの1以上のセットを含み、少なくとも1つの容器が、バーコードループオリゴを含み、及び少なくとも1つの容器が、1以上の架橋オリゴ、又はバーコードループオリゴと共に架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含み、
前記第1のプローブは、第1のプローブの5’末端の第1の架橋オリゴ特異性配列、及び第1のプローブの3’末端の第1の標的特異性部分を含み、
前記第2のプローブは、第2のプローブの5’末端の第2の標的特異性部分、及び第2のプローブの3’末端の第2の架橋オリゴ特異性配列を含み、
前記バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列及び第4の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドは、それぞれ第1のプローブ及び第2のプローブにおける第1の架橋オリゴ特異性配列及び第2の架橋オリゴ特異性配列に相補的な配列、及び、第3の架橋オリゴ特異性配列、に相補的な配列、及びバーコードループオリゴ中の第3の架橋オリゴ特異性配列及び第4の架橋オリゴ特異性配列に相補的な配列を含み、
任意に、前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は前記複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含み、及び、
任意に、パーツのキットは、前記エンドヌクレアーゼの認識部位が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む、キット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の開示は、1以上の核酸標的を正確に、かつ大規模に並行して定量するための改良された次世代DNAシーケンシング方法に関する。
より詳細には、本開示は、主に遺伝子標的及び変異体の検出に使用される、複合DNAプール中の遺伝子標的を検出及び定量するためのプローブを含む方法及びキットに関する。
本発明は、遺伝子標的ごとに1つ以上の標的特異性核酸プローブ、バーコードループオリゴ、及び1つ以上の架橋オリゴを使用する。
【背景技術】
【0002】
植物及び動物における遺伝的変異の検出は、研究技術の進歩によって、煩雑ではない。しかしながら、特に弱いシグナルを有する試料における突然変異などの遺伝子変異の検出及び正確な定量は、シーケンシングコストの低下にもかかわらず、現在依然として面倒で、労力を要し、高価である。コンセンサスバックグラウンドに対する遺伝子シグナルを検出するための特異性、弱い遺伝子シグナルを検出するための感度、検出されたシグナルを正確に定量するための精度、アッセイあたりの標的化遺伝子標的のスループット数、アッセイあたりのコスト、複数の試料を並行してアッセイする場合のアッセイコスト規模を決定するための評価、及び試料採取から結果までの時間の長さを決定するためのターンオーバーなど、様々な問題はより正確に提示されうる。
【0003】
現在、液体生検の典型的な定量方法及び概念的に類似したアッセイ(抗生物質耐性遺伝子検出など)には、定量PCR(qPCR)、アレイqPCR、デジタルPCR、多重ライゲーション依存性プローブ増幅(MLPA)、又は次世代DNAシーケンシングデータからの定量が含まれる。定量方法は確固とした、かつ良好に確立された方法であるが、各方法は、以下により詳細に説明する特定の問題に関連している。
【0004】
定量PCR:定量PCR(qPCR)は、PCR中の、すなわちリアルタイムでの標的DNA分子の増幅を含む技術である。リアルタイムPCRは、定量的に(定量的リアルタイムPCR)、及び半定量的に、すなわち一定量のDNA分子より多い/少ない(半定量的リアルタイムPCR)場合、に使用され得る。定量的PCR(qPCR)は、遺伝子標的定量の絶対的な基準である。
現在、qPCR反応の実験室コストは約2ドルである。しかしながら、反応を準備するための相当な実践時間(労働コスト)、標準曲線の必要性、及び各定量化標的についての反復を考慮に入れると、事実、実際のコストははるかに高い。各遺伝子標的について別個の定量実験が必要とされるため、実践時間量は、試料数の増加に伴って急激に変化する。
【0005】
アレイPCR:PCRアレイは、関連する経路又は疾患に焦点を当てた遺伝子のパネルの発現を分析するための最も信頼性の高いツールである。96ウェルプレート、384ウェルプレート、又は100ウェルディスクのPCRアレイは、それぞれ、焦点を当てた遺伝子パネルの徹底的に研究されたパネルのためのSYBR Green最適化プライマーアッセイを含む。qPCR技術のより新しい反復法は、個々のqPCR反応を小型化するアレイqPCRである。
アレイPCRは、個々のqPCR反応のコストを下げ、複数の標的及び試料に対する方法のスケーラビリティを改善する。しかしながら、この方法は、現在、チップあたり数千ドルのコストに、さらに読み出し基礎設備の大きな資本を加えたコストで、12個の試料からの384個の標的(又は逆に384個の試料からの12個の標的)に限定されている。従って、前記機構を使用した数千の試料のプロファイリングは、依然として極端に費用が高い。
【0006】
デジタルPCR:デジタルポリメラーゼ連鎖反応(デジタルPCR、DigitalPCR、dPCR、又はdePCR)は、液滴マイクロ流体及び蛍光検出によって標的の絶対定量を提供する方法である。この方法論は比較的費用対効果が高い(試料あたり1つの標的のコストは約3ドル)が、各試料の各標的についてそれぞれ実験を準備し、設定し、実行するための実践時間は、数千の試料規模には不十分である。
【0007】
多重ライゲーション依存性プローブ増幅(MLPA)は、個々の試料中の複数の遺伝子標的の検出を単純化するためのアプローチを提供する。しかしながら、MLPAは、標的の相対的な定量しか提供せず、各試料について別個の検出実験を必要とする。さらに最近では、MLPAの変形は、DNAのバーコード化からコンセプトを導入する。このコンセプトは、従来のMLPAワークフローよりも良好な定量的分離及び試料多重化を可能にする。
【0008】
次世代シーケンシングベースのアプローチ:次世代シーケンシング(NGS)は、配列ベースの遺伝子発現分析をアナログ技術に対する「デジタル」代替物にするハイスループットシーケンシングとしても知られる。次世代DNAシーケンシングデータからの標的計数は、DNAシーケンシングのコストが低下し続けるにつれてますます魅力的になってきており、現在、例えば非侵襲的出生前検査で使用されている。しかしながら、現在のアプローチは、高いシーケンシングライブラリ調製コスト、及び関連性のない遺伝子標的のシーケンシングに浪費されるシーケンシング労力に悩まされている。
例えば、癌関連液体生検では、非標的化アプローチは、腫瘍学的に関連性のない遺伝子座に対するシーケンシング労力の浪費をもたらす。胎児診断において、遺伝子座の非標的化試料採取は、データを解釈するための統計的選択肢をかなり制限する。Guardant Health Incは、より標的化されたシーケンシングアプローチを提供し、それは、RNA捕捉プローブのアレイが次世代DNAシーケンシングの標的を濃縮するものである。
【0009】
Akhrasら(2007)PLoS ONE 2(2):e223は、バーコード化標的特異性プローブ、標的環状化及びシーケンシングを含む多重病原体検出アッセイを開示している。標的特異性プローブをライゲートするための架橋オリゴヌクレオチドの使用も開示される。
国際公開第2018/109206号は、パッドロック(padlock)プローブ及びローリングサークル増幅を使用した試料中の分析物の検出方法を記載している。架橋オリゴの使用については記載されていない。
国際公開第2019/038372号は、目的の標的配列をT7ポリメラーゼのプロモーターを含むライゲーション複合体からin vitro転写によって選択的に増幅し、その後cDNA合成と配列決定を行う次世代シーケンシングアプローチを記載している。この方法は、試料中の多くの標的配列の正確かつ並行した検出及び定量を可能にするが、より複雑で大量かつ/又は不純な試料は、依然として困難である。
従って、前記議論に照らして、前記の欠点、例えば、これらに限定されないが、核酸標的の正確かつ大規模に並行した定量を通じた特異性、感度、精度、スループット、コスト、評価及びターンオーバーを克服する必要がある。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】国際公開第2018/109206号公報
【特許文献2】国際公開第2019/038372号公報
【非特許文献】
【0011】
【非特許文献1】Akhras et al.(2007) PLoS ONE 2(2):e223
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明は、例えば大量の試料(最大数十ミリリットル)、並びに/又は希釈且つ/若しくは非精製試料材料からの高度にスケーラブルで正確な標的定量のために次世代シーケンシングを使用する方法を提供する。国際公開第2019/038372に記載されているようなRNA増幅ステップは回避され、方法がより単純になる。
さらに、本発明の方法は、試料同定のための別個のバーコードループオリゴヌクレオチドの使用を含む。バーコードループオリゴヌクレオチドの使用は、標的の検出と試料のインデックス付けを同時に行うこと、効率的な試料のプールの許可、その結果としてのよりコスト効率が高く柔軟な定量アッセイを可能とし、ユニークな分子識別子(UMI)配列を導入する代替方法を提供する。結果として得られるプロトコルでは、個別の試料インデックス付けの要件が排除されるため、より短いリード長が可能になり、ショートリードとナノポアシーケンシングアプリケーションの両方に利点をもたらす。
【課題を解決するための手段】
【0013】
第1の主要な態様では、本発明は、複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出する方法であって、前記方法は、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブ、バーコードループオリゴ及び架橋オリゴ又はバーコードループオリゴにアニーリングして架橋オリゴ複合体を形成することができる複数の架橋オリゴヌクレオチド、を提供することであって、
前記第1のプローブは、前記第1のプローブの5’末端に第1の架橋オリゴ特異性配列、及び前記第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、前記第2のプローブの5’末端に第2の標的特異性部分、及び第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、
前記バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列、及び第4の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドは、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び、前記バーコードループオリゴにおける前記第3の架橋オリゴ特異性配列及び前記第4の架橋オリゴ特異性的配列に相補的な配列を含み、及び、
任意に、前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は前記複数の架橋オリゴヌクレオチドのオリゴヌクレオチドのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含む、こと、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブ及び前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、前記バーコードループオリゴ及び前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させることと、及び、ライゲーション複合体への自己アニーリングを可能にすること、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させることと、
(iv)前記第1のプローブ及び前記第2のプローブの各前記第1の標的特異性部分及び前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせることと、それにより、複数のハイブリダイゼーション複合体を形成すること、
(v)任意に、前記複数の試料からの前記ハイブリダイゼーション複合体をプールすること、
(vi)前記ハイブリダイゼーション複合体中の前記プローブを、ライゲートされたライゲーション複合体に供給するためにライゲートすること、
(vii)置換ポリメラーゼによるローリングサークル増幅を使用して、1以上のライゲートされたライゲーション複合体から核酸を増幅すること、それによって一本鎖コンカテマー配列を得ること、
(viii)任意に、工程(i)において指定された認識配列が存在する場合、以下の方法で核酸断片を取得する工程を実行すること、
(a)工程(vii)で得られた一本鎖コンカテマー配列を切断すること、又は
(b)工程(vii)で得られた一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとアニーリングに供することであって、ここで前記オリゴヌクレオチドは、工程(i)で特定された認識配列とアニールし、その結果、エンドヌクレアーゼのための認識部位が得られ、及びアニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(ix)前記工程(vii)で得られた前記コンカテマー配列、又は前記工程(viii)で得られた前記核酸断片を、ハイスループットシーケンシング技術に供し、前記バーコード配列を決定すること、及び
(x)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は、バーコードループオリゴ内のバーコードに対応するバーコード配列の少なくとも一部を決定することによって、複数の試料中の標的ヌクレオチド配列の存在及び/又は数を同定すること、である各工程を含み、
前記工程(v)及び(vi)が、任意の順序で実行され得る方法。
【図面の簡単な説明】
【0014】
【
図1】本発明の一実施形態による多重ライゲーションアッセイ(MLA)のフロー図を示す。
【
図2A】
図2Aは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2B】
図2Bは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2C】
図2Cは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図2D】
図2Dは、本発明の一実施形態によるプローブの原理的な組み合わせを示す。
【
図3】
図3は、制限エンドヌクレアーゼによる消化前(レーン2)及び消化後(レーン1)のワークフローからのRCA産物を示す。
【
図4】
図4は、分子バーコードを列挙することによって次世代DNA配列決定データから推測される、4つの反復反応における対数的に減少する遺伝子標的の数に対する実験ワークフローの線形応答を示す。各行は、標的配列の3つの濃度を表す。応答は3桁にわたって線形である。
【発明を実施するための形態】
【0015】
(定義)
標的ヌクレオチド配列:標的ヌクレオチド配列という用語は、その検出が必要とされる目的の任意のヌクレオチド配列であり得る。所定のその用語は、連続するヌクレオチドの配列ならびに相補的配列を有する核酸分子を指すことが理解されうる。いくつかの態様における標的配列は、多型を表すか又は多型に関連するヌクレオチド配列である。
【0016】
多型:多型という用語は、集団中の2つ以上の遺伝的に決定された代替配列又は対立遺伝子の発生を指す。多型マーカー又は部位は、配列の相違が生じる遺伝子座である。多型遺伝子座は、1つの塩基対ほど小さくてもよい。
【0017】
試料:試料という用語は、本明細書では、2つ以上の標的配列を含む2つ以上の試料に使用される。本発明による方法で提供される試料は、少なくとも標的核酸を抽出し、それらが本発明で使用されるプローブにアクセスできるようにするために調製されていてもよい。特に、いくつかの実施形態では、試料はそれぞれ、少なくとも2つの異なる標的配列、好ましくは少なくとも100、より好ましくは少なくとも250、より好ましくは少なくとも500、最も好ましくは少なくとも2000又はそれ以上の異なる標的配列を含む。試料という用語は、限定されるものではないが、尿、生検、唾液及び他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒト/動物の体から得られた2つ以上の試料、又は水、廃水、土壌、植物、ウイルスもしくは細菌等を含む試料などを含む環境から得られた2つ以上の試料を指すことができる。一実施形態では、複数の試料は、血液試料、唾液試料、尿試料又は糞便試料、他の体液の試料又は、例えば毛髪又は皮屑からの抽出物等の身体物質を含む。
【0018】
プローブ:プローブという用語は、可変長(通常50~1000塩基長、好ましくは50~200塩基長)のDNA又はRNAの断片であり、プローブ中の配列に相補的なヌクレオチド配列(DNA又はRNA標的)の存在を検出するためのDNA又はRNA試料中に使用できる。
標的配列に相補的なオリゴヌクレオチドプローブのセクションは、試料中の各標的配列に対して、第1及び第2のプローブの対が提供されるように設計され、それによって各プローブがその末端に相補的なセクションを含み、その結果プローブはそれぞれ、それらの末端に標的配列の一部に相補的なセクションを含む。
さらに、本開示は、第1のプローブと第2のプローブを結合するために使用される架橋オリゴ又は架橋オリゴ複合体について記載する。
さらに、本開示は、1つ又は複数の架橋オリゴとハイブリダイズすることができる2つのセクションが隣接するループセクションを含むバーコードループオリゴを記載する。ループセクションは、1つ又は複数の架橋オリゴとハイブリダイズせず、バーコードを含む。
【0019】
ユニバーサル:増幅手順を説明するために使用される場合、ユニバーサルという用語は、単一のプライマー又はプライマーセットを複数の増幅反応のために使用できるようにする配列を指す。そのようなプライマーの使用は、選択された複数の核酸配列を増幅するために必要なプライマーが2つのみであるという点で、多重化を大幅に単純化する。ユニバーサルという用語は、プライミング部位を説明するために使用される場合、ユニバーサルプライマーがハイブリダイズする部位である。ユニバーサルプライミング配列/プライマーの「セット(複数可)」が使用され得ることにも留意すべきである。
【0020】
ハイブリダイゼーション:ハイブリダイゼーション(hybridization又はhybridisation)という用語は、相補的DNA又はRNAにアニーリングするDNA又はRNA分子のプロセスを表す。DNA又はRNAの複製及びRNAへのDNAの転写は両方とも、ヌクレオチドハイブリダイゼーションに依存する。
【0021】
ライゲーション:ライゲーションという用語は、酵素の作用による2つの核酸断片の連結である。DNAリガーゼは、相補鎖上の隣接部位に結合した2本のポリヌクレオチド鎖(の末端)間のホスホジエステル結合の形成を触媒することができる酵素である。一実施形態では、ライゲーションは、特に、ポリヌクレオチドの隣接する末端の両方が化学的ライゲーションを可能なように修飾されている場合、化学的に行われうる。
【0022】
増幅:増幅という用語は、ヌクレオチド配列の混合物内の特定のヌクレオチド配列の濃度を増加させるための、DNAポリメラーゼの使用を意味するために本書では使用される。「PCR」又は「ポリメラーゼ連鎖反応」は、特定のDNA/RNA断片のインビトロ酵素増幅のための急速な手順である。増幅されるDNA/RNAは、試料を加熱することによって変性され得る。プライマーという用語は、DNA合成の出発点として役立つRNA又はDNA鎖(一般に約18~22塩基)である。DNA複製にそれが必要であるのは、このプロセスを触媒する酵素、すなわちDNAポリメラーゼは、DNAの既存の鎖に新しいヌクレオチドを付加することしかできないからである。
【0023】
ポリメラーゼ:ポリメラーゼは、核酸の長鎖又はポリマーを合成する酵素である。DNAポリメラーゼ及びRNAポリメラーゼを使用して、塩基対合相互作用を用いてDNA又はRNA鋳型鎖をコピーすることによって、それぞれDNA及びRNA分子を組み立てる。
【0024】
ハイスループット:ハイスループットという用語は、多数のDNA試料を同時に処理及びスクリーニングする能力、ならびに単一のDNA試料内の多数の異なる遺伝子座を同時にスクリーニングする能力を意味する。しばしばHTSと略されるハイスループットシーケンシング又はスクリーニングは、大量の試料を同時に効果的にスクリーニングするのに特に関連する科学的実験のための方法である。
【0025】
エンドヌクレアーゼ:エンドヌクレアーゼは、DNAの二本鎖又は一本鎖をランダム又は指定された位置で切断する又は切れ目を入れる酵素である。
【0026】
バーコード:本発明で使用されるプローブ及びオリゴは、ヌクレオチド配列からなる1つ又は複数のバーコードを含み得る。バーコード配列は、標的ヌクレオチド配列識別子配列、試料識別子配列、及び/又は標的を列挙するための分子バーコード(固有分子識別子とも呼ばれる)を含み得る。バーコード配列は、ランダム配列を含みうる。
【0027】
上述のように、本開示は、ライゲーション依存性アッセイを活用することによる、非常に多数の試料における標的ヌクレオチド配列検出のハイスループット検出のための方法に関する。本開示は、次世代配列決定によって許可される技術を使用して、複合核酸プール中の遺伝子標的の配列を決定するための方法を提供する。
本開示はまた、ライゲーション依存性アッセイを活用することによって、多数の試料、好ましくは非常に多数の試料中の複数の遺伝子標的をプロファイリングする方法を提供する。
本開示は、複数の試料中の異なる標的核酸の照会を可能にする多重ライゲーション依存性プローブ増幅のための方法を提供する。
本発明の方法は、異なる標的核酸に対する複数の異なるプローブセットを提供する複数の試料中の1以上の標的ヌクレオチド配列の配列決定を可能にする。シーケンシングデータを処理する際に、試料プールから、遺伝子標的を同定するため、及び、個々の試料を絶対的に定量するために、固有配列識別子が使用される。
【0028】
第1の主要な態様では、本発明は、複数の試料中の1以上の標的ヌクレオチド配列のハイスループット検出のための方法に関し、前記方法は、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブ、バーコードループオリゴ及び架橋オリゴ又はバーコードループオリゴにアニーリングして架橋オリゴ複合体を形成することができる複数の架橋オリゴヌクレオチド、を提供することであって、
前記第1のプローブは、前記第1のプローブの5’末端に第1の架橋オリゴ特異性配列、及び前記第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、前記第2のプローブの5’末端に第2の標的特異性部分、及び第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、
前記バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列、及び第4の架橋オリゴ特異性配列を含み、
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドは、それぞれ前記第1のプローブ及び前記第2のプローブにおける前記第1の架橋オリゴ特異性配列及び前記第2の架橋オリゴ特異性配列に相補的な配列、及び、前記バーコードループオリゴにおける前記第3の架橋オリゴ特異性配列及び前記第4の架橋オリゴ特異性的配列に相補的な配列を含み、及び、
任意に、前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は前記複数の架橋オリゴヌクレオチドのオリゴヌクレオチドのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含む、こと、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブ及び前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、前記バーコードループオリゴ及び前記架橋オリゴ又は複数のオリゴヌクレオチドと接触させること、及び、ライゲーション複合体への自己アニーリングを可能にすること、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させること、
(iv)前記第1のプローブ及び前記第2のプローブの各前記第1の標的特異性部分及び前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせること、それにより、ハイブリダイゼーション複合体(又は任意に、単数のハイブリダイゼーション複合体)を形成すること、
(v)任意に、前記複数の試料からの前記ハイブリダイゼーション複合体をプールすること、
(vi)前記ハイブリダイゼーション複合体中の前記プローブを、ライゲートされたライゲーション複合体に供給するためにライゲートすること、
(vii)置換ポリメラーゼによるローリングサークル増幅を使用して、1以上のライゲートされたライゲーション複合体から核酸を増幅すること、それによって一本鎖コンカテマー配列を得ること、
(viii)任意に、工程(i)において指定された認識配列が存在する場合、以下の方法で核酸断片を取得する工程を実行すること、
(a)工程(vii)で得られた一本鎖コンカテマー配列を切断すること、又は
(b)工程(vii)で得られた一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとアニーリングに供することであって、ここで前記オリゴヌクレオチドは、工程(i)で特定された認識配列とアニールし、その結果、エンドヌクレアーゼのための認識部位が得られ、及びアニーリングされた複合体を前記エンドヌクレアーゼで切断すること、
(ix)前記工程(vii)で得られた前記コンカテマー配列、又は前記工程(viii)で得られた前記核酸断片を、ハイスループットシーケンシング技術に供し、前記バーコード配列を決定すること、及び
(x)前記第1の標的特異性部分及び/又は前記第2の標的特異性部分の少なくとも一部、及び/又は、バーコードループオリゴ内のバーコードに対応するバーコード配列の少なくとも一部を決定することによって、複数の試料中の標的ヌクレオチド配列の存在及び/又は数を同定すること、である各工程を含み、
前記工程(v)及び(vi)が、任意の順序で実行され得る方法。
【0029】
図1は、本発明の方法の一実施形態の非限定的な例示を提供する。
【0030】
本発明の方法は、4つ以上の核酸分子を利用し、そのうちの2つの標的特異性核酸プローブ(第1プローブ及び第2プローブ)は遺伝子標的に特異であり、2以上の他の核酸プローブ又は複合体は典型的にはユニバーサルである(架橋オリゴ又は架橋オリゴ複合体及びバーコードループオリゴ)。
第1のプローブ、第2のプローブ及びバーコードループオリゴは、1以上の架橋プローブにハイブリダイズして、ライゲーション複合体を形成する。
サンプルDNA又はRNA上に標的識別部位を有するライゲーション複合体(1つ以上のバーコード配列を含む)は、クエリサンプルの相補的標的配列に対してハイブリダイズすることができる。
ハイブリダイゼーション後、第1のプローブと第2のプローブはDNAリガーゼによって化学的又は酵素的にライゲーションされ、ライゲートされたライゲーション複合体を形成する。
本発明では、複数の、そのようなライゲートされたライゲーション複合体のが、分析される複数の試料における試料分析中に形成されるであろう。
【0031】
一実施形態では、「複数の試料」は、これらに限定されないが、生検、唾液及び他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒトもしくは動物の体から得られた2つ以上の試料、水、廃水、土壌、植物、ウイルスもしくは細菌を含む試料などを含む環境から得られた2つ以上の試料等を指していてもよい。
一実施形態では、試料は、事前に核酸を精製又は濃縮せずに使用される。別の実施形態では、例えば、細胞を溶解して核酸を露出させる等の試料の前処理をしてもよい。
【0032】
標的配列は、検出が必要とされる目的の任意のヌクレオチド配列を含み得る。本開示の標的ヌクレオチド配列は、患者の血液中のDNAの画分又は母体血液中のDNAの画分から得ることができるが、これらに限定されない。
患者の血液中のDNAの画分は、例えば、アポトーシス/壊死癌細胞から、又は胎児及び/又は母体由来の母体血液中のDNAの画分から得ることができる。
さらに、分析の結果を使用して、例えば、所定のタイプの癌に対する個体のリスク、所定の癌に対する所定の治療の有効性の判定、腫瘍における薬物耐性関連変異の発生、又は一般的なトリソミーダウン症候群、パトウ症候群及びエドワーズ症候群などの遺伝性障害を有する胎児のリスク等を評価する。特定の実施形態では、方法は、各標的ヌクレオチド配列に対して、複数の異なるプローブセットを提供することを含む。
【0033】
本書で使用される場合、プローブセットという用語は、第1のプローブ、第2のプローブ、バーコードループオリゴ、及び1以上の架橋オリゴを含む。
【0034】
特定の実施形態では、第1のプローブは、分子の5’末端から出発して、任意に、5’リン酸、第1の架橋オリゴ特異性配列、任意に第1のユニバーサル配列、任意に第1の配列バーコード、及びその3’末端における第1の標的特異性部分を含む。
【0035】
特定の実施形態では、第2のプローブは、分子の5’末端から出発して、任意に5’リン酸、第2の標的特異性部分、任意に第2の配列バーコード、任意に第2のユニバーサル配列、及びその3’末端における第2の架橋オリゴ特異性配列を含む。
【0036】
架橋オリゴ又は複数の架橋オリゴ複合体は、それぞれ第1及び第2のプローブの第1及び第2の架橋オリゴ特異性配列に相補的な配列を含み、任意にユニバーサル配列及びバーコードループオリゴ中の第3の架橋オリゴ特異性配列及び第4の架橋オリゴ特異性配列に相補的な配列を含む。
【0037】
バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列、及び第4の架橋オリゴ特異性配列を含む。
バーコードを使用して、試験したすべての試料のすべてのライゲーション複合体内の複合体を一意に定義できる。バーコードループオリゴは、任意の適切な長さを有してもよく、例えば、長さが30から100bpの間、例えば長さが40から60bpの間であってもよい。
【0038】
任意に、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1以上の架橋オリゴのうちの少なくとも1つは、エンドヌクレアーゼの認識配列を含む。エンドヌクレアーゼ認識配列は、コンカテマー配列の切断を可能にする。
一実施形態では、認識配列は、EcoRIなどの制限エンドヌクレアーゼの認識配列である。
別の実施形態では、認識配列は、I-CeuIなどのホーミングエンドヌクレアーゼの認識配列である。
別の実施形態では、認識配列は、誘導されたDNAaseI又はCRISPR-Cas様切断システムの認識配列である。
別の実施形態では、認識配列はニッキングエンドヌクレアーゼの認識配列である。
【0039】
一実施形態では、バーコードループオリゴは、ニッキングエンドヌクレアーゼなどのエンドヌクレアーゼに対する1以上の認識配列を含む。
さらなる実施形態において、前記バーコードループオリゴは、二本鎖エンドヌクレアーゼ認識部位が得られるように互いにアニーリングすることができる2つの認識配列を含む。
さらなる実施形態では、この方法は、上で特定した工程(viii)を含まないが(代わりに)、工程(vii)と(ix)の間に、バーコードループオリゴ内の2つの認識配列をアニールさせること、及び、得られた二本鎖エンドヌクレアーゼ認識部位を、前記認識部位に対する特異性を有するニッキングエンドヌクレアーゼなどのエンドヌクレアーゼで切断することの工程を含む。
【0040】
任意に、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1つ以上の架橋オリゴのうちの少なくとも1つは、第1の捕捉部分を含む。ここで使用される場合、第1の捕捉部分は、プローブ、ライゲーション複合体、又はハイブリダイゼーション複合体が固体支持体に連結された第2の捕捉部分によって捕捉される、すなわち結合されることを可能にする化学基などの部分を指す。
当技術分野で知られている任意の適切な捕捉部分をこの目的のために使用することができる。よく知られている適切な例は、ストレプトアビジンでコーティングされた磁気ビーズを使用したビオチン化分子の捕捉である。
従って、一実施形態では、第1の捕捉部分はビオチン部分であり、磁気ビーズなどの固体支持体に結合したストレプトアビジン又はアビジン部分(第2の捕捉部分)と相互作用することができる。
他のオプションには、ストレプトアビジン/アビジンとの結合に使用できるデュアルビオチン、デスチオビオチン、光切断性ビオチン(photocleavable biotin)などのビオチン誘導体が含まれる。
さらなるオプションには、アクリダイト(acrydite)/アクリルアミド結合にはチオール基とアクリダイト基、クリックケミストリーにはアルキン基とアジド基、及び抗ジゴキシゲニン抗体結合にはジゴキシゲニンの使用などが含まれる。
結合パートナーは、ビーズ(磁性又はその他)又は固体支持体などの任意の固体表面上に提供されうる。
従って、本発明の一実施形態の方法では、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1つ以上の架橋オリゴのうちの少なくとも1つは第1の捕捉部分を含み、及び、工程(iv)と(v)の間に、ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体と接触させ、ハイブリダイゼーション複合体(複数可)が固体支持体に結合するように第1の捕捉部分と第2の捕捉部分を相互作用させ、固体支持体に結合していない試料の成分から固体支持体に結合したハイブリダイゼーション複合体を分離することを含む中間工程(iv)(a)が実行される。
【0041】
第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、第2の架橋オリゴ特異性配列、第3の架橋オリゴ特異性配列及び/又は第4の架橋オリゴ特異性配列は、任意に、プローブ結合を増加させるために互いに独立して少なくとも1つの化学修飾ヌクレオチドを含有する。
プローブ結合を増加させる化学修飾には、リボ核酸、ペプチド核酸、及びロックド核酸(例えば、参照により本明細書に組み込まれる国際公開第2019/038372号公報の
図3に示される)が含まれるが、これらに限定されない。
一実施形態では、第1のプローブ、第2のプローブ、バーコードループオリゴ、又はこれらの3つすべての架橋部分は、1以上の架橋オリゴへの結合を改善させるための化学修飾された塩基を含む。
別の実施形態では、第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、第2の架橋オリゴ特異性配列、第3の架橋オリゴ特異性配列及び/又は第4の架橋オリゴ特異性配列は、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含有する。特定の実施形態では、化学修飾は、隣接するプローブを化学的ライゲーションを可能にする。
【0042】
いくつかの実施形態では、前記のプローブは、完全に隣接する遺伝子座、すなわち標的ヌクレオチド配列の隣接セクション、又は、例えば、最大200塩基対離れて、最大50塩基対離れて、最大40塩基対離れて、最大30塩基対離れて、最大20塩基対離れて、最大10塩基対離れて、最大5塩基対離れている等、最大500塩基対離れて結合する。
【0043】
いくつかの実施形態では、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1以上の架橋オリゴは(これに限定されないが)、イルミナなどのDNA配列決定プラットフォーム用のアダプター配列を含み得る。これらのアダプター配列により、結果として生じるシーケンシングライブラリがイルミナフローセルなどのシーケンシングデバイスの検出部分に結合させることができる。
【0044】
さらに、いくつかの実施形態では、架橋オリゴ又は複数の架橋オリゴヌクレオチドのオリゴヌクレオチドは、
(i)1~5個の3’突出塩基(すなわち、第2のプローブと二重らせんを形成しない追加の塩基)、及び/又は
(ii)3’リン酸、及び/又は
(iii)3’末端から3つの位置内の1以上のホスホロチオエート修飾
を含む。
【0045】
プローブを標的配列を含む試料と接触させる前に、第1のプローブ、第2のプローブ及びバーコードループオリゴを、架橋オリゴ(又は架橋オリゴ複合体を形成可能な複数のオリゴヌクレオチド)と接触させ、好ましくは別個のチューブ内の試料の各々について接触させ、ライゲーション複合体へのアニーリングを可能にする(工程(ii))。
架橋オリゴ及びバーコードループは、第1及び第2のプローブとアニーリングする前にプレアニーリングされてもよく、又はすべてのアニーリング工程が一度に行われてもよい。
架橋が1つのオリゴではなく、バーコードループオリゴにアニーリングして架橋オリゴ複合体を形成することができる2つのオリゴヌクレオチドなどの複数のオリゴヌクレオチドである実施形態では(本書では2Bに示す)、
複数のオリゴヌクレオチドは、第1及び第2のプローブとアニーリングする前に、バーコードループオリゴとプレアニーリングされてもよく、又は、全てのアニーリング工程が一度に行われてもよく、又は、バーコードループオリゴは、標的の捕捉中にプレアニーリングされたプローブ複合体にアニーリングされることができる。
【0046】
好ましくは、各ライゲーション複合体は、第1の標的特異性配列、第2の標的特異性配列及び1以上のバーコード配列の組み合わせに対して固有である。これにより、増幅後の標的配列の列挙及び結果の分析が可能になる。
【0047】
その後、複数の試料中の1以上の標的ヌクレオチド配列を複数のライゲーション複合体と接触させる(工程(iii))。第1のプローブ及び第2のプローブそれぞれの第1の標的特異性部分及び第2の標的特異性部分を、標的配列上の本質的に隣接する部分にハイブリダイズして、それにより、ハイブリダイゼーション複合体を形成する(工程(iv))。前述したように、標的配列上の本質的に隣接する部分は、直接隣接していてもよく、又は、最大500塩基対離れているギャップがあってもよい。
【0048】
いくつかの実施形態では、試料は、100マイクロリットルを超える体積、例えば1ml以上の体積を有する。さらなる実施形態では、試料は、5pmol未満、例えば1pmol未満、例えば200fmol未満の核酸濃度を有する。一実施形態では、複数の試料には、1つ以上の血液試料、1つ以上の唾液試料、1つ以上の尿試料、又は1つ以上の糞便試料が含まれる。
【0049】
続いて、いくつかの実施形態では、第1のプローブ、第2のプローブ、バーコードループオリゴ、又は1つ以上の架橋オリゴのうちの少なくとも1つが第1の捕捉部分を含む場合、ハイブリダイゼーション複合体(複数)を第2の捕捉部分を含む個体の支持体と接触させ、第1の補足部分と第2の補足部分はハイブリダイゼーション複合体が固体支持体に結合するように相互作用することができる(任意工程(iv)(a))。
その後、固体支持体に連結されていない試料の成分から、固体支持体に連結したハイブリダイゼーション複合体を分離する。
固体支持体が磁性ビーズである場合、磁石を用いてビーズを固定化し、残った液体試料を除去してもよい。任意に、洗浄工程は次の工程の前に行われる。
【0050】
工程(iv)(a)によって、核酸が精製及び濃縮され、特に非常に純度の低い試料について結果の改善を可能にする。一実施形態では、本発明の方法は、工程(iv)(a)の前に核酸を濃縮する工程を含まない。従って、一実施形態では、本方法は、工程(vi)の前に、元の試料中の核酸を2倍超、10倍超、又は100倍超に濃縮する工程を含まない。別の実施形態では、本発明の方法は、工程(vi)のライゲーションの後に精製工程を含まない。
【0051】
続いて、形成されたハイブリダイズ複合体中のプローブのライゲーションを酵素的又は化学的に行い、ライゲートされたライゲーション複合体を供給する(工程(vi))。工程(vi)の一部として任意に、第1のプローブと第2のプローブとの間、第1のプローブとバーコードループオリゴとの間、及び/又は第2のプローブとバーコードループオリゴとの間にギャップが存在する場合、ポリメラーゼ及び1以上のヌクレオチドを導入することによって塞ぐことができる。
ポリメラーゼは、架橋オリゴ配列(複数可)に相補的なヌクレオチド(a)を追加し、それによって、第1のプローブ、第2のプローブとバーコードループオリゴとの間のギャップを埋め、その結果プローブがライゲーションされ、バーコードループオリゴが架橋相補鎖に組み込まれる。
架橋オリゴ又は架橋オリゴ複合体は、第1のプローブ又は第2のプローブに存在する標的配列識別子配列が架橋オリゴ又は架橋オリゴ複合体に組み込まれるように、ライゲートされたプローブに相補的な5’部位又は3’部位から伸長される
好ましくは、第1のプローブの第2のプローブへのライゲーションを、両方が標的配列にアニーリングされている場合、妨害しないために、二本鎖DNAを分解しないポリメラーゼ、例えばTaqポリメラーゼなどが使用される。
一実施形態では、架橋オリゴ、又は複数の架橋オリゴヌクレオチドのうちの1つ以上のオリゴヌクレオチドは、第1のプローブ、第2のプローブ、又はバーコードループオリゴに相補的でない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを許すために、複数のユニバーサル塩基類似体を含む。
このような実施形態では、工程(vi)の一部として、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填工程が実施される。実施形態において、複数のユニバーサル塩基類似体は、複数の5-ニトロインドールである。
【0052】
ライゲートされたライゲーション複合体は、そして任意に、1以上の標的試料からプールされる(工程(vi))。工程(v)及び(vi)は、指定された順序で、又は逆の順序で実行されてもよい。
【0053】
次に、1以上のライゲートされたライゲーション複合体から核酸は増幅され、それにより一本鎖コンカテマー配列が得られる(工程(vii))。増幅は、phi29ポリメラーゼ(UniProtKB-P03680;DPOL_BPPH2)又はBstポリメラーゼ(P52026;DPO1_GEOSE)等の鎖置換ポリメラーゼを使用したローリングサークル増幅を使用して実行される。
【0054】
一実施形態では、工程(Vi)の後であって、工程(Vii)の前において、工程(a)と(b)は実行され、工程(a)は、ライゲートされたライゲーション複合体を標的ヌクレオチド配列から解離させることを含み、工程(b)は、標的ヌクレオチド配列に対応する配列を含む標的特異性プローブを添加することを含み、ここで、前記標的特異性プローブは、ライゲートされたライゲーション複合体とアニーリングすることができ、標的特異性プローブがライゲートされたライゲーション複合体にアニーリングすることを可能にし、それによって増幅テンプレートを形成する。
このような実施形態では、前記増幅テンプレートは、工程(vii)において鎖置換ポリメラーゼを用いたローリングサークル増幅によって増幅される。
【0055】
選択的に、工程(i)で特定される認識配列が存在する場合、工程(viii)は、以下によって核酸断片を取得するために実行される。
(a)工程(vii)で得られた一本鎖コンカテマー配列を切断する、又は
(b)工程(vii)で得られた一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドとアニーリングさせ、ここで、オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、工程(i)で特定された認識配列とアニールし、アニーリングされた複合体を前記エンドヌクレアーゼで切断する。
【0056】
続いて、工程(ix)では、工程(vii)で得られたコンカテマー配列、又は、工程(viii)が実行された場合には工程(viii)で得られた核酸断片、はハイスループットシーケンシング技術に付されてバーコード配列が決定される。
【0057】
任意に、増幅後、固体支持体は、それが存在する場合には除去され、上清がその後の処理に使用される。例えば、固体支持体が磁性粒子である場合、これらは磁石を使用して除去され得る。
本発明の方法のいくつかの他の実施形態では、第1の捕捉部分と第2の捕捉部分との間の相互作用は、工程(v)の直後、工程(vi)の後、又は工程(vii)の後に中断される。例えば、第1の捕捉部分がビオチンであり、第2の捕捉部分がストレプトアビジンである場合には、過剰な可溶性ビオチンを添加することによって相互作用を中断することができる。ストレプトアビジンが磁性粒子に結合している場合は、磁石を使用して除去できる。
【0058】
さらに、任意に、第1及び第2のプローブのユニバーサル部分に結合するプライマーを使用して工程(ix)の直前にPCR増幅が行われ、ここで、前記プライマーは、選択的に、工程(ix)における後続の配列決定のためのアダプター配列を含む。
【0059】
別の実施形態では、工程(ix)の配列決定はナノポア配列決定を使用して行われ、選択的に工程(vii)で得られたコンカテマー配列は転位複合体を使用して断片化される。ナノポア配列決定に適した技術は、Wangらの 2021 Nat Biotechnol 39(11):1348においてレビューされてきた。
【0060】
複数の試料中の標的ヌクレオチド配列の存在及び/又は数の特定は、第1及び/又は第2の標的特異性部分の少なくとも一部、及び/又はバーコードの少なくとも一部を、ハイスループットシーケンシング技術(工程(ix)及び(x))、例えば、イルミナiSeq、MiSeq、HiSeq、NextSeq、又はNovaSeqを含むがこれらに限定されない次世代シーケンシング プラットフォームを使用して決定することで実行されてもよい。
好ましくは、遺伝子標的列挙は、標的あたりの及び試料あたりの分子バーコードの数を数えることによって可能になる。試料を配列データから解き(デコンボリューテッドされde-convoluted)、DNA配列決定後に配列表的をインシリコ(in silico)で定量する。
【0061】
本発明の両態様の利点には、従来の核酸シーケンシング技術と比較して、低コスト、高単純性、高特異性、高感度、高精度、ハイスループット、高スケーラビリティ及び高ターンオーバーでの定量アッセイが含まれるが、これらに限定されない。
本発明の別の態様は、本発明の方法により、ワークフローの初期段階での試料のインデックス作成により複数の試料をプールできるようになり、アッセイのコストと速度が向上することである。
本発明の別の態様は、本発明の方法が、ヒト及び動物の集団を含み、大量の未精製試料材料を含む複数の試料中の複数の核酸標的の正確かつ大規模に並行した定量を可能にすることである。
上述したように、好ましい実施形態では、尿試料などの試料は、事前に核酸を精製又は濃縮せずに使用される。別の実施形態では、試料を前処理してもよく、例えば、細胞を溶解して核酸を露出させる。
本発明の1つの特定の利点は、独自のプローブ設計、すなわちプローブトリプレットを使用して、目的の標的配列の検出及び増幅を可能にすることである。プローブは、アニーリング及び結合効率を改善する特別に配置された修飾ヌクレオチドを用いて設計される。結合特性の改善は、アッセイの特異性、感度及び精度を向上させる。
本発明の方法は、遺伝変異体の研究にも適用可能であり、これらに限定されないが、SNP及び/又はインデルなど、1以上の配列及び/又は多型についての試料の遺伝子型同定、癌診断、又は母体血液からの胎児染色体障害等を含む、診断及び予後への適用が見出される。好ましい実施形態では、2つ以上の試料又は2つ以上の遺伝子座/対立遺伝子組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1以上の配列及び/又は多型について試料の遺伝子型を同定するために使用される。
【0062】
別の態様では、本発明は、複数の容器を含むパーツのキットを提供し、ここで、少なくとも1つの容器は、第1のプローブ及び第2のプローブの1以上のセットを含み、少なくとも1つの容器はバーコードループオリゴを含み、及び少なくとも1つの容器は1以上の架橋オリゴ、又はバーコードループオリゴと共に架橋オリゴ複合体を形成することができる複数の架橋オリゴヌクレオチドを含み、
前記第1のプローブは、第1のプローブの5’末端において第1の架橋オリゴ特異性配列と、第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、第2のプローブの5’末端において第2の標的特異性配列と、第2のプローブの3’末端に第2の架橋オリゴ標的特異性部分を含み、
前記バーコードループオリゴは、分子の5’末端から出発し、第3の架橋オリゴ特異性配列、バーコードループ配列、及び、第4の架橋オリゴ特異性配列を含み、
架橋オリゴ又は複数の架橋オリゴヌクレオチドは、それぞれ第1のプローブ及び第2のプローブにおける第1の架橋オリゴ特異性配列及び第2の架橋オリゴ特異性配列に相補的な配列、ならびにバーコードループオリゴ中の第3の架橋オリゴ特異性配列及び第4の架橋オリゴ特異性配列に相補的な配列を含み、
選択的に、第1のプローブ、第2のプローブ、バーコードループオリゴ、架橋オリゴ、又は複数の架橋オリゴヌクレオチドのオリゴヌクレオチドのうちの少なくとも1つは、エンドヌクレアーゼに対する認識配列を含み、及び、
選択的に、パーツのキットは、前記エンドヌクレアーゼに対する認識部位が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む。
好ましくは、第1のプローブの3’末端又は第2のプローブの5’末端、又はその両方は、第1のプローブの第2のプローブへの化学的ライゲーションを可能にするために修飾される。
【0063】
好ましくは、架橋オリゴ又は複数の架橋オリゴヌクレオチドの1つのオリゴヌクレオチドは、第1のプローブの配列に相補的な配列、又は第2のプローブの配列に相補的な配列、又はその両方中に、1以上の化学修飾ヌクレオチドを含む。
【0064】
好ましくは、第1プローブの3’末端又は第2プローブの5’末端、又はその両方が第1プローブと第2プローブの化学的ライゲーションを可能にすべく修飾される。
【0065】
好ましくは、第1のプローブもしくは第2のプローブもしくはその両方の架橋部分、あるいはバーコードループオリゴ、架橋オリゴ又は複数の架橋オリゴヌクレオチドのオリゴヌクレオチドは、架橋オリゴもしくは架橋オリゴ複合体への結合を改善するための化学修飾された塩基を含む。
【0066】
特定の一実施形態では、第1及び第2のプローブのセットを含む少なくとも1つの容器、バーコードループオリゴを含む少なくとも1つの容器、及び、互いにアニーリングして架橋オリゴ複合体を形成することができる架橋オリゴ又は複数のオリゴヌクレオチドを含む少なくとも1つの容器は、1つの及び同じ容器である。そのような場合、4つ以上のプローブは事前にアニーリングされ、連結(ライゲート)された複合体を形成していてもよい。
【0067】
本発明の1つの特定の利点は、独自のプローブ設計を使用して、目的の標的配列の検出及び増幅を可能にすることである。プローブは、アッセイ特異性、感度及び精度の向上につながる改善された結合特性で設計される。
本発明は、分子生物学、進化生物学、メタゲノミクス、遺伝子型同定の分野、より具体的には、しかし、これらに限定されないが、SNP及び/又はインデルなどのような1以上の配列及び/又は多型についての試料の遺伝子型の同定を含むがこれに限定されない、癌診断又は胎児染色体障害等の分野における応用を見出すことである。
【0068】
1つの特定の好ましい実施形態では、バーコードループオリゴは、試料を識別するための情報を備え、固有のバーコードを含む。そのような場合、第1及び第2のプローブは、すべての試料に一般的に適用可能である(標的を識別するための情報を含むだけである)。従って、1つの好ましい実施形態では、本発明による方法又はキットが提供され、ここではバーコードループオリゴは、各試料の標的配列の列挙を可能にする固有の配列を含むバーコードを含む。
【実施例0069】
(方法)
1.プローブ複合体の形成
プローブ複合体は、ゲノムターゲティング、サンプルインデックス付け、及びイルミナシーケンシングライブラリの構築に必要な配列を含む。
【0070】
以下を含む4部構成のプローブ複合体が形成される(
図2を参照)。
(a)分子の5’末端から出発し、第1の架橋オリゴ特異性配列と、第1のプローブの3’末端にある第1の標的特異性部分とを有する第1のプローブ、
(b)分子の5’末端から出発し、第2の標的特異性部分、第2の配列バーコード、及び第2のプローブの3’末端にある第2の架橋オリゴ特異性配列を有する第2のプローブ、
(c)第1のプローブ及び第2のプローブのそれぞれにおける第1の架橋オリゴ特異性配列及び第2の架橋オリゴ特異性配列に相補的な配列を有する架橋オリゴ、及び、
(d)架橋オリゴに相補的な配列を有するループオリゴ。
【0071】
プローブ複合体は、アニーリング反応において全3つの部分(架橋、右アーム、左アーム)を等モル量で組み合わせることで構築される。反応はサーモサイクラーで実行される(表1のアニーリングプログラム)。
【0072】
【0073】
2.標的補足
対象となる変異を含む特定のゲノム領域が標的になる。精製されたDNA(組織、血漿、尿、唾液から等)を試料として使用することも、精製せずに煮沸及び/又は遠心分離などの前処理のみを行った試料を使用することもできる。
プローブ複合体は、塩基配列の相補的相互作用を介して標的領域にハイブリダイズされる。標的捕捉を開始するには、反応プローブと標的DNAを混合し、サーマルサイクラー内でインキュベートする(表2の標的捕捉及びギャップ充填プログラム)。プレアニーリングされたバーコードループ(各試料の特定のインデックスシーケンスを含む)がターゲティング反応に追加される。
【0074】
【0075】
3.ギャップ充填反応
標的を捕捉した後、別々のターゲティング反応から得たプローブ複合体をプールし、続いてPhusion DNA ポリメラーゼ、ヌクレオチド、Ampligase DNAリガーゼの組み合わせを加え、+45℃で45分間インキュベートすることによって伸長及びライゲーションする。
【0076】
4.エキソヌクレアーゼ処理
ギャップ充填後、1μlの熱不安定性エキソヌクレアーゼ1(NEB、#M0568L)と1μlのRecJFエキソヌクレアーゼ(NEB、#M0264L)を加え、+37℃で30分間インキュベートすることにより線状分子を除去する。エキソヌクレアーゼは、+92℃で12分間インキュベートすることにより不活化される。
【0077】
5.ローリングサークル増幅
伸長とライゲーションの後、環状プローブ分子はローリングサークル増幅(RCA)に供される。RCA反応では、標的捕捉反応をEquipPhi29(Thermo Scientific)ポリメラーゼを含むRCA反応ミックスと混合する。反応物を+42℃で30分~2時間インキュベートする。RCA反応後、Qubit蛍光光度計で一本鎖DNA(ssDNA)の濃度を測定することで反応効率が分析される。
【0078】
6.酵素消化
RCA反応により、標的ライブラリの複数のコピーを有する長いコンカテマーssDNA分子が生成される。各完全なターゲットライブラリは、EcoRI制限酵素認識配列によって分離されている。この配列により、EcoRI制限酵素認識配列を含む特定のオリゴヌクレオチドとのアニーリングによる長いコンカテマーの配列特異性な切断と、準備ができたターゲットライブラリの解放が可能になる。RCA製品はEcoRIで+37℃で1時間消化される。
【0079】
7.ライブラリPCR
消化されたRCA生成物は、PCR反応でシーケンスライブラリに拡張され、適切なプローブに存在する短縮されたシーケンスアダプターがフローセル互換性の全長シーケンスアダプターに拡張される。
【0080】
8.ライブラリの精製
ライブラリPCR後、電気泳動又はサイズ選択ビーズ(Macherey Nagel NucleoMagなど)を使用してアガロースゲルからライブラリ分子を抽出することにより、ライブラリ分子が精製される。
【0081】
9.シーケンシング
精製されたMiSeq又はiSeq100互換性ライブラリは、最先端のシーケンシング機器を使用して配列解析される。重要なことに、ライブラリは、簡単なオリゴヌクレオチド修飾によって、利用可能な任意のシーケンシング プラットフォームに適合するように変換できる。シーケンスデータは、UnixコマンドラインツールとPython及びRプログラミング言語を組み合わせて使用して処理される。
要約すると、配列処理の理論的根拠は、各リード内のプローブ配列を特定し、それらの間のゲノム領域を配列決定し、及び各遺伝子標的に関連する分子バーコードの数をカウントすることである。
【0082】
(試験1)
最初の実験では、プローブミックスは5つの別々の試料に含まれる4つのループインデックス付きプローブ複合体のコレクションであり、最初の4つの試料は単一のループインデックスを持ち、5番目の試料は1~4をプールした試料であった。それらは4つの遺伝子融合を標的としていた。標的オリゴヌクレオチドは、各標的の識別を可能にする固有の認識配列を持っていた。
試料として、3つの合成標的オリゴヌクレオチドを対数的に増加する濃度で混合した。標的捕捉、伸長及びライゲーション反応、ローリングサークル増幅、その後のEcoRIによる消化、及びライブラリ調製PCRを上記のように実施した。結果として得られるシーケンスライブラリの例を
図3に示す。
準備されたライブラリはMiSeq及びiSeq100機器で配列決定され、各リード内のプローブ配列を照合し、プローブ配列間のゲノム配列領域を同定し、分子バーコードを計数することにより、配列データ内の標的領域を検出した。計数データは、プールされたループオリゴ分子の割合を正確に反映していた(
図4)。
【0083】
(
図1及び2の詳細な説明)
図1は、詳細な説明に記載の発明の一実施形態のワークフローを示す。工程1では、試料(102)内の核酸(DNA又はRNA)をライゲーション複合体のセット(104)と接触させる。ライゲーション複合体は標的核酸上でアニールする(106)。工程2では、必要に応じて、標的に結合したライゲーション複合体が試料材料から捕捉され、試料の不純物が残される(103)。
工程3では、複数の試料(110)からのライゲートされたライゲーション複合体が共にプールされる(112)。
工程4では、アニーリングされ、プールされたライゲーション複合体がライゲーションされ、ライゲートされたライゲーション複合体が得られる。
工程5では、phi29ポリメラーゼ又は他の鎖置換ポリメラーゼを使用するローリングサークル増幅によって、プローブ配列が増幅され、プローブの長いコンカテマーコピーが得られる(116)。
工程6では、コンカテマープローブのコピーは、必要に応じて、EcoRIなどの制限エンドヌクレアーゼ又はI-CeuIなどのホーミングヌクレアーゼを使用してモノマー単位に切断され、必要に応じてPCR又はエマルジョンPCR(117)を使用してさらに増幅される。
工程7では、次世代DNAシーケンスを使用して、増幅されたDNAのシーケンスが行われる。
工程8では、バイオインフォマティックパイプラインを使用して、DNAシーケンスの結果がターゲット数に変換される。
【0084】
図2Aは、本発明の一実施形態によるプローブクワドラプレットの原理構造を示す。複数のプローブ体は、第1のプローブ(202)、第2のプローブ(201)、架橋オリゴ(200)及びバーコードループオリゴ(217)を含む。
ここで、プローブ複合体は、第1のプローブとバーコードループオリゴ(210と213)の間、第2のプローブとバーコードループオリゴ(207と215)の間、及び第1と第2のプローブ(203と204)の間にギャップ又は切れ目(ニック)を含む。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって埋められる。このプロセスには、Stoffelフラグメント、Taqポリメラーゼ又はPhusionポリメラーゼと、AmpligaseなどのDNAリガーゼの混合物を使用できる。ポリメラーゼはこれらのギャップを埋め、その後のDNAリガーゼの作用により、プローブ、架橋、及びバーコードループオリゴが環状複合体にライゲーションされる。
【0085】
第1のプローブの15~25塩基は、効率的な架橋オリゴ結合のために化学的に修飾された塩基を任意に含む架橋結合配列(210)を含む。第1のプローブにはさらに、遺伝子標的(203)に結合する5’末端から15~30の塩基が含まれている。210のヌクレオチドの一部又はすべては、標的又は架橋(209)に対するプローブの親和性を高める化学修飾を含んでいてもよい。第1のプローブの最後の塩基には、場合により、酵素的ライゲーションのためのリン酸部分、又は隣接するプローブ(205)の5’末端への化学的ライゲーションを可能にする修飾が含まれる。
【0086】
第2のプローブの第1の塩基は、任意に酵素的ライゲーションのためのリン酸部分、又は隣接するプローブ(206)の5’末端への化学的ライゲーションを可能にする修飾を含む。第2プローブの5’末端からの15~30塩基には、遺伝子標的(204)に結合する第2プローブの一部が含まれる。第2のプローブ(207)の最後の15~25塩基は、架橋オリゴ(208)に対して逆相補的である。203、204、207又は210のヌクレオチドの一部又はすべてには、標的又は架橋オリゴに対するプローブの親和性を高める化学修飾が含まれていてもよい。
【0087】
架橋オリゴ(209)の5’末端からの最初の15~25塩基は、第1のプローブ(210)の架橋オリゴ特異性配列に逆相補的であり、場合により結合を高めるために化学修飾されたヌクレオチドを含む。架橋オリゴ(208)の最後の15~25塩基は、第2のプローブ(207)の配列に対して逆相補的であり、場合により結合を高めるために化学修飾されたヌクレオチドを含む。架橋オリゴの5’末端には、ライゲーション複合体を捕捉するために使用される捕捉部分(211)が場合により含まれる。さらに、架橋オリゴは、バーコードループオリゴの配列213及び215に相補的な配列214及び216を含む。架橋オリゴの3’末端には、ギャップ充填中の伸長を防ぐために、リン酸(又は他の切断可能な)部分(212)が任意に含まれる。
【0088】
バーコードループオリゴ(215)の5’末端からの最初の15~25塩基は、架橋オリゴ配列216に対して逆相補的である。バーコードループオリゴは、バーコード(218)を含むループ領域を含む。バーコードループオリゴ(213)の最後の15~25塩基は、架橋オリゴ配列214に対して逆相補的である。
【0089】
図2Bは、本発明の一実施形態による複数のプローブ体を有するプローブセットの原理構造を示す。プローブは
図2Aのそれらに対応するが、ただし、この実施形態は2つの架橋オリゴ(200及び220)を含み、架橋オリゴ200は209及び214を含み、架橋オリゴ220は208及び216を含む。
【0090】
図2Cは、本発明の一実施形態による複数のプローブ体を有するプローブセットの原理構造を示す。プローブは
図2Aのプローブに対応するが、ただし、架橋オリゴ200は、標的列挙のための分子バーコードとして使用するのに適したランダム配列の組み込みを可能にする複数のユニバーサル塩基類似体を含む配列(219)を含む。示された配列219の一方又は両方が存在する可能性がある。
【0091】
図2Dは、本発明の一実施形態によるプローブクワドラプレットの原理構造を示す。複数のプローブ体には、第1のプローブ(202)、第2のプローブ(201)、架橋オリゴ(200)、及びバーコードループオリゴ(217)が含まれる。ここで、プローブ複合体は、第1のプローブとバーコードループオリゴとの間(210と213)、第2のプローブとバーコードループオリゴとの間(207と215)、及び第1と第2のプローブとの間(203と204)にギャップを有する。
これらのギャップは、ポリメラーゼと1つ以上のヌクレオチドを導入することによって埋められる。このプロセスには、Stoffelフラグメント、Taqポリメラーゼ又はPhusionポリメラーゼと、AmpligaseなどのDNAリガーゼの混合物を使用できる。ポリメラーゼはこれらのギャップを埋め、その後のDNAリガーゼの作用により、プローブ、架橋、及びバーコードループオリゴが環状複合体にライゲーションされる。
【0092】
第1のプローブの15~25塩基は、効率的な架橋オリゴ結合のために化学的に修飾された塩基を任意に含むブリッジ結合配列(210)を含む。第1のプローブはさらに、増幅プライマー(221)及びバーコード配列(222)の結合部位、及び5’末端から15~30塩基、遺伝子標的に結合する配列(203)を含む。210のヌクレオチドの一部又はすべては、標的又は架橋(209)に対するプローブの親和性を高める化学修飾を含んでもよい。第1のプローブの最後の塩基には、場合により、酵素的ライゲーションのためのリン酸部分、又は隣接するプローブ(205)の5’末端への化学的ライゲーションを可能にする修飾が含まれる。
【0093】
第2のプローブの第1の塩基は、場合により、酵素的ライゲーションのためのリン酸部分、又は隣接するプローブ(206)の5’末端への化学的ライゲーションを可能にする修飾を含む。第2プローブの5’末端からの15~30塩基には、遺伝子標的(204)に結合する第2プローブの一部が含まれる。第2のプローブは、増幅プライマーの結合部位(223)、配列決定アダプター配列(224)、EcoRI又はホーミングエンドヌクレアーゼなどの制限エンドヌクレアーゼの認識部位(225)、及び別の配列決定アダプター配列(207)をさらに含む。第2のプローブ(207)の最後の15~25塩基は、架橋オリゴ(208)に対して逆相補的である。203、204、207、又は210のヌクレオチドの一部又はすべてには、標的又は架橋オリゴに対するプローブの親和性を高める化学修飾が含まれていてもよい。
【0094】
架橋オリゴ(209)の5’末端からの最初の15~25塩基は、第1プローブ(210)の架橋オリゴ特異性配列に対して逆相補的であり、場合により結合を高めるために化学修飾されたヌクレオチドを含む。架橋オリゴ(208)の最後の15~25塩基は、第2のプローブ(207)の配列に対して逆相補的であり、任意に結合を高めるために化学修飾されたヌクレオチドを含む。バーコードループオリゴのどちらの末端とも逆相補的ではない架橋オリゴ(220)の部分は、任意に、非ループ含有構造の酵素分解を可能にする制限エンドヌクレアーゼの認識部位を含む。架橋オリゴの5’末端には、ライゲーション複合体を捕捉するために使用される捕捉部分(211)が任意に含まれる。さらに、架橋オリゴは、バーコードループオリゴの配列213及び215に相補的な配列214及び216を含む。架橋オリゴの3’末端には、ギャップ充填中の伸長を防ぐために、リン酸(又は他の切断可能な)部分(212)が必要に応じて含まれる。
【0095】
バーコードループオリゴ(215)の5’末端からの最初の15~25塩基は、架橋オリゴ配列216に対して逆相補的である。バーコードループオリゴは、バーコード(218)を含むループ領域を含む。バーコードループオリゴ(213)の最後の15~25塩基は、架橋オリゴ配列214に対して逆相補的である。
前記バーコードループオリゴが、二本鎖エンドヌクレアーゼ認識部位が得られるように互いにアニーリングすることができる2つの認識配列を含む、請求項2に記載の方法。
前記方法は、請求項1で特定される工程(viii)を含まず、工程(vii)と(ix)の間に、バーコードループオリゴ中の前記2つの認識配列をアニーリングさせ、及び、得られた二本鎖エンドヌクレアーゼ認識部位を、前記認識部位に対して特異性を有するニッキングエンドヌクレアーゼなどのエンドヌクレアーゼで切断する工程を含む、請求項3に記載の方法。
前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのうちの1つ以上のオリゴヌクレオチドは、前記第1のプローブ、前記第2のプローブ、又は前記バーコードループオリゴに相補的でない領域に、標的列挙のための分子バーコードとしての使用に適したランダム配列の組み込みを可能にする複数のユニバーサル塩基類似体を含み、
前記工程(vi)の一部として、そのようなランダム配列を生成するために、ポリメラーゼ及びヌクレオチドを使用してギャップ充填工程が実行される、請求項1~4のいずれか一項に記載の方法。
前記第1のプローブ、前記第2のプローブ、又は前記架橋オリゴ又は前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドは、配列バーコードをさらに含む、請求項1に記載の方法。
前記第1のプローブ、前記第2のプローブ、前記バーコードループオリゴ、前記架橋オリゴ、又は前記複数の架橋オリゴヌクレオチドのうちのオリゴヌクレオチドのうちの少なくとも1つは、第1の捕捉部分を含み、
工程(iv)と(v)の間で、前記ハイブリダイゼーション複合体を第2の捕捉部分を含む固体支持体に接触させ、
前記第1の捕捉部分と前記第2の捕捉部分は、ハイブリダイゼーション複合体が固体支持体に結合するように相互作用し、
固体支持体に結合した前記ハイブリダイゼーション複合体を固体支持体に結合していない試料の成分から分離することを含む中間工程(iv)(a)が実行される、請求項1に記載の方法。
前記第1のプローブの3’末端又は第2のプローブの5’末端、又はその両方が、第1のプローブの第2のプローブへの化学的ライゲーションを可能にするように修飾される請求項1に記載の方法。
前記第1のプローブ又は前記第2のプローブ、又はその両方の架橋部分、又は前記バーコードループオリゴ、前記架橋オリゴもしくは前記複数の架橋オリゴヌクレオチドのうちの1つのオリゴヌクレオチドが、前記架橋オリゴ又は架橋オリゴ複合体への結合を改善させる化学修飾された塩基を含む請求項1に記載の方法。
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、及び/又は前記第2の架橋オリゴ特異性配列が、互いに独立して、1以上の化学的に修飾されたヌクレオチドを含む、請求項1に記載の方法。
2つ以上の試料について、又は2つ以上の遺伝子座/対立遺伝子の組み合わせについて、バーコード配列は、SNP及び/又はインデルなどの1つ以上の配列及び/又は多型について試料の遺伝子型を特定するために使用される、請求項1に記載の方法。