(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022145606
(43)【公開日】2022-10-04
(54)【発明の名称】核酸の正確な並行定量のための高感度な方法
(51)【国際特許分類】
C12Q 1/6844 20180101AFI20220926BHJP
C12N 15/10 20060101ALI20220926BHJP
C12Q 1/686 20180101ALI20220926BHJP
C12Q 1/6876 20180101ALI20220926BHJP
C12M 1/00 20060101ALI20220926BHJP
C12M 1/34 20060101ALI20220926BHJP
C12Q 1/6869 20180101ALI20220926BHJP
【FI】
C12Q1/6844 Z
C12N15/10 Z ZNA
C12Q1/686 Z
C12Q1/6876 Z
C12M1/00 A
C12M1/34 Z
C12Q1/6869 Z
【審査請求】未請求
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022038217
(22)【出願日】2022-03-11
(31)【優先権主張番号】21163300.3
(32)【優先日】2021-03-18
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】22152617.1
(32)【優先日】2022-01-21
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.UNIX
2.PYTHON
(71)【出願人】
【識別番号】522099674
【氏名又は名称】ゲノミル ヘルス オサケユイチア
【氏名又は名称原語表記】Genomill Health Oy
(74)【代理人】
【識別番号】100145849
【弁理士】
【氏名又は名称】井澤 眞樹子
(72)【発明者】
【氏名】ユハ ペッカ プルシヘイモ
(72)【発明者】
【氏名】タトゥ ヒルヴォネン
(72)【発明者】
【氏名】マヌ タンミネン
(72)【発明者】
【氏名】アントーニ コルキアコスキ
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029AA23
4B029BB16
4B029BB20
4B029FA12
4B063QA13
4B063QA17
4B063QQ03
4B063QQ28
4B063QQ38
4B063QQ43
4B063QQ53
4B063QR08
4B063QR20
4B063QR32
4B063QR36
4B063QR62
4B063QS25
4B063QS36
4B063QX02
(57)【要約】 (修正有)
【課題】大量の試料(最大数十ミリリットル)、ならびに/または希釈かつ/もしくは非精製試料材料からの高度にスケーラブルで正確な標的定量のために次世代シーケンシングを使用する方法を提供する。
【解決手段】本発明は、複合料中の遺伝子標的を検出および定量するためのプローブを含む方法およびキットに関する。本発明は、遺伝子標的ごとの1以上の標的特異的核酸プローブ(左プローブおよび右プローブ)および架橋オリゴまたは架橋オリゴ複合体を含む。
【選択図】
図2A
【特許請求の範囲】
【請求項1】
複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出のための方法であって、
(i)前記各試料中の各標的ヌクレオチド配列に、
第1のプローブ、第2のプローブおよび架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチド、を提供し、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列、選択的に第1の配列バーコード、および第1のプローブの3’末端に第1の標的特異性部分を含み;
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分、選択的に第2の配列バーコード、および第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み;および、
前記架橋オリゴまたは架橋オリゴ複合体は、前記第1のプローブおよび前記第2のプローブのそれぞれの前記第1の架橋オリゴ特異性配列および前記第2の架橋オリゴ特異性配列に相補的な配列、および、選択的に第3のバーコードを含み;および、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つが、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体中に存在し;および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが、エンドヌクレアーゼの認識配列を含み;および、
選択的に、前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドの少なくとも1つは、第1の捕捉部分を含む、工程と、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブおよび前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、互いにアニーリングして前記架橋オリゴまたは互いにアニーリングして前記架橋オリゴ複合体を形成できる複数のヌクレオチドと接触させ、複数のライゲーション複合体への自己アニーリングを可能にする、工程と、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させる、工程と、
(iv)前記第1のプローブおよび前記第2のプローブの各前記第1の標的特異性部分および前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせて、それにより、ハイブリダイゼーション複合体を形成する、工程と、
(v)選択的に、前記ハイブリダイゼーション複合体を、第2の捕捉部分を含む固体支持体と接触させ、前記ハイブリダイゼーション複合体が前記固体支持体に連結されるように、前記第1の捕捉部分と前記第2の捕捉部分とを相互作用させ、および、固体支持体に結合していないサンプルの成分から固体支持体に結合したハイブリダイゼーション複合体を分離する、工程と、
(vi)前記ハイブリダイゼーション複合体中の前記プローブをライゲーションさせて、ライゲーションされたライゲーション複合体を供給する、工程と、
(vii)選択的に、前記複数の試料から前記ライゲーションされたライゲーション複合体をプールする、工程と、
(viii)1以上の前記ライゲーションされたライゲーション複合体から核酸を、鎖置換ポリメラーゼによるローリングサークル増幅を使用して、増幅する、工程と、
(ix)選択的に、工程(viii)で得られた増幅された1以上の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドでアニーリングに供し、前記オリゴヌクレオチドが、エンドヌクレアーゼに対する認識部位が得られるように、工程(i)で指定された認識配列とアニーリングする、工程と、
(x)選択的に、工程(viii)で得られた前記一本鎖コンカテマー配列または工程(ix)で前記エンドヌクレアーゼで得られたアニーリングされた複合体を切断する、工程と、
(xi)工程(x)で得られた前記核酸断片、または工程(viii)で得られたコンカテマー配列を、ハイスループットシーケンシング技術に供して、前記バーコード配列を決定する工程と、および
(xii)前記第1の標的特異性部分および/もしくは前記第2の標的特異性部分の少なくとも一部、および/または前記第1のバーコードおよび/または前記第2のバーコードの少なくとも一部、および/または前記第3のバーコードの少なくとも一部を決定することによって、前記複数の試料中の前記標的ヌクレオチド配列の存在および/または数を特定する工程と、を含み、
前記工程(vi)および(vii)が、任意の順序で実行され得る方法。
【請求項2】
前記複数の試料が、血液試料、唾液試料、尿試料または糞便試料を含む、請求項1に記載の方法。
【請求項3】
前記第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つは第1の捕捉部分を含み、
前記工程(v)を含み、前記工程(v)の前に核酸を濃縮するステップを含まない、請求項1または2に記載の方法。
【請求項4】
前記第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つは第1の捕捉部分を含み、
工程(v)を含み、前記第1の捕捉部分はビオチン部分であり、前記第2の捕捉部分はストレプトアビジン部分またはアビジン部分である、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つは第1の捕捉部分を含み、
前記工程(v)を含み、前記工程(v)と(vi)の間に洗浄工程が行われる、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記架橋オリゴまたは架橋オリゴ複合体は、
(i)1~5個の3’突出塩基、および/または
(ii)3’リン酸、および/または
(iii)3’末端から3番目の位置以内の1または複数のホスホロチオエート修飾
を含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記第1のプローブの3’末端または前記第2のプローブの5’末端、またはその両方が、前記第1のプローブが前記第2のプローブへ化学的にライゲーションできるように修飾される、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記第1のプローブまたは前記第2のプローブ、またはその両方の架橋部分が、前記架橋オリゴまたは架橋オリゴ複合体への結合を改善させるための化学修飾された塩基を含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、および/または前記第2の架橋オリゴ特異性配列が、互いに独立して1以上の化学修飾ヌクレオチドを含有する、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記工程(viii)は、phi29ポリメラーゼまたはBstポリメラーゼを用いて実施される、請求項1~9のいずれか一項に記載の方法。
【請求項11】
PCR増幅は、第1および第2のプローブのユニバーサル部分に結合するプライマーを使用して、ステップ(x)とステップ(xi)との間で行われ、前記プライマーは、選択的に、ステップ(xi)におけるその後の配列決定のためのアダプターを含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
遺伝子標的列挙が、標的あたりの、および試料あたりの分子バーコードの数を数えることによって可能になる、請求項1~11のいずれか一項に記載の方法。
【請求項13】
2つ以上のサンプルまたは2以上の遺伝子座/対立遺伝子の組み合わせに対して、バーコード配列が使用されて、SNPおよび/またはインデルなどの1以上の配列および/または多型のサンプルの遺伝子型を決定する、請求項1~12のいずれか一項に記載の方法。
【請求項14】
複数の容器を含むパーツのキットであって、
少なくとも1つの容器は、第1のプローブおよび第2のプローブの1以上のセットを含み、および少なくとも1つの容器が、1以上の架橋オリゴ、または架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含み、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列と、選択的に第1の配列バーコード、および第1のプローブの3’末端の第1の標的特異性部分とを含み、
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分と、選択的に第2の配列バーコード、および第2のプローブの3’末端の第2の架橋オリゴ特異性配列とを含み、
前記架橋オリゴまたは架橋オリゴ複合体は、各前記第1および第2のプローブ中の各前記第1および第2の架橋オリゴ特異性配列に相補的な配列、ならびに選択的に第3のバーコードを含み、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つは、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体中にそれぞれ存在し、および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体の少なくとも1つはエンドヌクレアーゼに対する認識配列を含み、および、
前記パーツのキットは、前記エンドヌクレアーゼに対する認識部分が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の開示は、1以上の核酸標的を正確に、かつ大規模に並行して定量するための改良された次世代DNAシーケンシング方法に関する。より詳細には、本開示は、主に遺伝子標的および変異体の検出に使用される、複雑なDNAプール中の遺伝子標的を検出および定量するためのプローブを含む方法およびキットに関する。本発明は、遺伝子標的毎に1以上の標的特異性核酸プローブ(左プローブおよび右プローブ)、および架橋オリゴまたは架橋オリゴ複合体を使用する。
【背景技術】
【0002】
ある植物および動物における遺伝的変異の検出は、遺伝子変異の研究技術の進歩によって、面倒なものではない。しかしながら、特に弱いシグナルを有する試料における突然変異などの遺伝子変異の検出および正確な定量は、シーケンシングコストの低下にもかかわらず、現在依然として面倒で、労力を要し、高価である。コンセンサスバックグラウンドに対する遺伝子シグナルを検出するための特異性、弱い遺伝子シグナルを検出するための感度、検出されたシグナルを正確に定量するための精度、アッセイあたりの標的化遺伝子標的のスループット数、アッセイあたりのコスト、複数の試料を並行してアッセイする場合のアッセイコスト規模を決定するための評価、および試料採取から結果までの時間の長さを決定するためのターンオーバーなど、様々な問題はより正確に示されうる。
【0003】
現在、液体生検の典型的な定量方法および概念的に類似したアッセイ(抗生物質耐性遺伝子検出など)には、定量PCR(qPCR)、アレイqPCR、デジタルPCR、多重ライゲーション依存性プローブ増幅(MLPA)、または次世代DNAシーケンシングデータからの定量が含まれる。定量方法は確固とした、かつ良好に確立された方法であるが、各方法は、以下により詳細に説明する特定の問題に関連している。
【0004】
定量PCR:定量PCR(qPCR)は、PCR中の、すなわちリアルタイムでの標的DNA分子の増幅を含む技術である。リアルタイムPCRは、定量的(定量的リアルタイムPCR)、および半定量的、すなわち一定量のDNA分子より多い/少ない(半定量的リアルタイムPCR)、に使用され得る。定量的PCR(qPCR)は、遺伝子標的定量の絶対的な基準である。現在、qPCR反応の実験室コストは約2ドルである。しかしながら、反応を準備するための相当な実践時間(労働コスト)、標準曲線の必要性、および各定量化標的についての反復を考慮に入れると、事実、実際のコストははるかに高い。各遺伝子標的について別個の定量実験が必要とされるため、実践時間の量は、試料数の増加に伴って急激に変化する。
【0005】
アレイPCR:PCRアレイは、関連する経路または疾患に焦点を当てた遺伝子のパネルの発現を分析するための最も信頼性の高いツールである。96ウェルプレート、384ウェルプレート、または100ウェルディスクのPCRアレイは、それぞれ、焦点を当てた遺伝子パネルの徹底的に研究されたパネルのためのSYBR Green最適化プライマーアッセイを含む。qPCR技術のより新しい反復法は、個々のqPCR反応を小型化するアレイqPCRである。アレイPCRは、個々のqPCR反応のコストを下げ、複数の標的および試料に対する方法のスケーラビリティを改善する。しかしながら、この方法は、現在、チップあたり数千ドルのコストに、さらに読み出し基礎設備の大きな資本を加えたコストで、12個の試料からの384個の標的(または逆に384個の試料からの12個の標的)に限定されている。従って、前記機構を使用した数千の試料のプロファイリングは、依然として極端に費用が高い。
【0006】
デジタルPCR:デジタルポリメラーゼ連鎖反応(デジタルPCR、DigitalPCR、dPCR、またはdePCR)は、液滴マイクロ流体および蛍光検出によって標的の絶対定量を提供する方法である。この方法論は比較的費用対効果が高い(試料あたり1つの標的のコストは約3ドル)が、各試料の各標的についてそれぞれ実験を準備し、設定し、実行するための実践時間は、数千の試料規模には不十分である。
【0007】
多重ライゲーション依存性プローブ増幅(MLPA)は、個々の試料中の複数の遺伝子標的の検出を単純化するためのアプローチを提供する。しかしながら、MLPAは、標的の相対的な定量しか提供せず、各試料について別個の検出実験を必要とする。さらに最近では、MLPAの変形は、DNAのバーコード化からコンセプトを導入する。このコンセプトは、従来のMLPAワークフローよりも良好な定量的分離および試料多重化を可能にする。
【0008】
次世代シーケンシングベースのアプローチ:次世代シーケンシング(NGS)は、配列ベースの遺伝子発現分析をアナログ技術の「デジタル」代替物にするハイスループットシーケンシングとしても知られる。次世代DNAシーケンシングデータからの標的計数は、DNAシーケンシングのコストが低下し続けるにつれてますます魅力的になってきており、現在、例えばNIPTスクリーニングで使用されている。しかしながら、現在のアプローチは、高いシーケンシングライブラリー調製コスト、および関連性のない遺伝子標的のシーケンシングに浪費されるシーケンシング労力に悩まされている。例えば、癌関連液体生検では、非標的化アプローチは、腫瘍学的に関連性のない遺伝子座に対するシーケンシング労力の浪費をもたらす。胎児診断において、遺伝子座の非標的化試料採取は、データを解釈するための統計的選択肢をかなり制限する。Guardant Health Incは、より標的化されたシーケンシングアプローチを提供し、RNA捕捉プローブのアレイが次世代DNAシーケンシングの標的を濃縮する。
【0009】
Akhrasら(2007)PLoS ONE 2(2):e223は、バーコード化標的特異性プローブ、標的環状化およびシーケンシングを含む多重病原体検出アッセイを開示している。標的特異性プローブをライゲーションするための架橋オリゴヌクレオチドの使用も開示される。
国際公開第2018/109206号は、パッドロックプローブとローリングサークル増幅を使用して試料中の分析物を検出する方法を示している。架橋オリゴの使用は記載されていない。
国際公開第2019/038372号はT7ポリメラーゼのプロモーターを含むライゲーション複合体からのインビトロ転写とそれに続くcDNA合成および配列決定によって、目的の標的配列が選択的に増幅される次世代配列決定アプローチを記載している。この方法は、試料中の多くの標的配列の正確かつ並行した検出および定量を可能にするが、より複雑で大量かつ/または不純な試料は、依然として困難である。
したがって、前記議論に照らして、前記の欠点、例えば、これらに限定されないが、核酸標的の正確かつ大規模に並行した定量を通じた特異性、感度、精度、スループット、コスト、評価およびターンオーバーを克服する必要がある。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】国際公開第2018/109206号公報
【0011】
【特許文献2】国際公開第2019/038372号公報
【非特許文献】
【0012】
【非特許文献1】Akhras et al.(2007) PLoS ONE 2(2):e223
【発明の概要】
【発明が解決しようとする課題】
【0013】
本発明は、大量の試料(最大数十ミリリットル)、ならびに/または希釈かつ/もしくは非精製試料材料からの高度にスケーラブルで正確な標的定量のために次世代シーケンシングを使用する方法を提供する。
さらに、WO2019/038372に記載されているようなRNA増幅工程が回避され、方法がより単純になる。
【課題を解決するための手段】
【0014】
第1の主要な態様では、本発明は、複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出するための方法であって、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブおよび架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチド、を提供し、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列、選択的に第1の配列バーコード、および第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分、選択的に第2の配列バーコード、および第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、および、
前記架橋オリゴまたは架橋オリゴ複合体は、前記第1のプローブおよび前記第2のプローブのそれぞれの前記第1の架橋オリゴ特異性配列および前記第2の架橋オリゴ特異性配列に相補的な配列、および、選択的に第3のバーコードを含み、および、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つが、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体中に存在し、および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが、エンドヌクレアーゼの認識配列を含み、および、
選択的に、前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドの少なくとも1つは、第1の捕捉部分を含む、
工程と、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブおよび前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、互いにアニーリングして前記架橋オリゴまたは互いにアニーリングして前記架橋オリゴ複合体を形成できる複数のヌクレオチドと接触させ、複数のライゲーション複合体への自己アニーリングを可能にする、工程と、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させる、工程と、
(iv)前記第1のプローブおよび前記第2のプローブの各前記第1の標的特異性部分および前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせて、それにより、ハイブリダイゼーション複合体を形成する、工程と、
(v)選択的に、前記ハイブリダイゼーション複合体を、第2の捕捉部分を含む固体支持体と接触させ、前記ハイブリダイゼーション複合体が前記固体支持体に連結されるように、前記第1の捕捉部分と前記第2の捕捉部分とを相互作用させ、および、固体支持体に結合していないサンプルの成分から固体支持体に結合したハイブリダイゼーション複合体を分離する、工程と、
(vi)前記ハイブリダイゼーション複合体中の前記プローブをライゲーションさせて、ライゲーションされたライゲーション複合体を供給する、工程と、
(vii)選択的に、前記複数の試料から前記ライゲーションされたライゲーション複合体をプールする、工程と、
(viii)1以上の前記ライゲーションされたライゲーション複合体から核酸を、鎖置換ポリメラーゼによるローリングサークル増幅を使用して、増幅する、工程と、
(ix)選択的に、工程(viii)で得られた増幅された1以上の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドでアニーリングに供し、前記オリゴヌクレオチドが、エンドヌクレアーゼに対する認識部位が得られるように、工程(i)で指定された認識配列とアニーリングする、工程と、
(x)選択的に、工程(viii)で得られた前記一本鎖コンカテマー配列または工程(ix)で前記エンドヌクレアーゼで得られたアニーリングされた複合体を切断する、工程と、
(xi)工程(x)で得られた前記核酸断片、または工程(viii)で得られたコンカテマー配列を、ハイスループットシーケンシング技術に供して、前記バーコード配列を決定する工程、および
(xii)前記第1の標的特異性部分および/もしくは前記第2の標的特異性部分の少なくとも一部、および/または前記第1のバーコードおよび/または前記第2のバーコードの少なくとも一部、および/または前記第3のバーコードの少なくとも一部を決定することによって、前記複数の試料中の前記標的ヌクレオチド配列の存在および/または数を特定する工程、を含み、
前記工程(vi)および(vii)が、任意の順序で実行され得る方法である。
【図面の簡単な説明】
【0015】
【
図1】本明細書の一実施形態による多重ライゲーションアッセイ(MLA)のフロー図を示す。
【
図2A】本明細書の一実施形態による、複数のプローブエンティティを有するプローブトリプレットの原理構造を示す。
【
図2B】本明細書の一実施形態による、第1のプローブと第2のプローブとの間の間隙充填を示す。
【
図2C】本明細書の一実施形態による、第1のプローブと第2のプローブと架橋複合体との間の間隙充填を示す。
【
図3】制限エンドヌクレアーゼによる分解前(レーン2)および分解後(レーン1)のワークフローからのRCA生成物を示す。
【
図4】分子バーコードを列挙することによって次世代DNAシーケンスデータから推測される、4つの複製反応中に対数的に減少する遺伝子標的の数に対する実験ワークフローの線形反応を示す。各行は、標的配列の3つの濃度を示す。反応は3桁にわたって線形である。
【発明を実施するための形態】
【0016】
(定義)
標的ヌクレオチド配列:標的ヌクレオチド配列という用語は、その検出が必要とされる目的の任意のヌクレオチド配列であり得る。所定の用語は、連続するヌクレオチドの配列ならびに相補的配列を有する核酸分子を指すことが理解されうる。いくつかの態様における標的配列は、多型を表すかまたは多型に関連するヌクレオチド配列である。
【0017】
多型:多型という用語は、集団中の2つ以上の遺伝的に決定された代替配列または対立遺伝子の発生を指す。多型マーカーまたは部位は、配列の相違が生じる遺伝子座である。多型遺伝子座は、1つの塩基対ほど小さくてもよい。
【0018】
試料:試料という用語は、本明細書では、2つ以上の標的配列を含む2以上の試料に使用される。本発明による方法で提供される試料は、少なくとも標的核酸を抽出し、それらが本発明で使用されるプローブにアクセスできるようにするために調製されていてもよい。特に、いくつかの実施形態では、試料はそれぞれ、少なくとも2つの異なる標的配列、好ましくは少なくとも100、より好ましくは少なくとも250、より好ましくは少なくとも500、最も好ましくは少なくとも2000またはそれ以上の異なる標的配列を含む。試料という用語は、限定されるものではないが、尿、生検、唾液および他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒト/動物の体から得られた2つ以上の試料、または水、廃水、土壌、植物、ウイルスもしくは細菌等を含む試料などを含む環境から得られた2つ以上の試料を指すことができる。一実施形態では、複数の試料は、血液試料、唾液試料、尿試料または糞便試料、他の体液の試料または、例えば毛髪または皮屑からの抽出物等の身体物質を含む。
【0019】
プローブ:プローブは、可変長(通常50~1000塩基長、好ましくは50~200塩基長)のDNAまたはRNAの断片であり、DNAまたはRNA試料中で使用され、プローブ中の配列に相補的なヌクレオチド配列(DNAまたはRNA標的)の存在を検出することができる。標的配列に相補的なオリゴヌクレオチドプローブのセクションは、試料中の各標的配列に対して、左右のプローブの対が提供されるように設計され、それにより、プローブはそれぞれ、それらの末端に標的配列の一部に相補的なセクションを含む。さらに、本開示には、左プローブおよび右プローブの接合に用いられる架橋オリゴまたは架橋オリゴ複合体が記載されている。
【0020】
ユニバーサル:増幅手順を説明するために使用される場合、ユニバーサルという用語は、単一のプライマーまたはプライマーセットを複数の増幅反応のために使用できるようにする配列を指す。そのようなプライマーの使用は、選択された複数の核酸配列を増幅するために必要なプライマーが2つのみであるという点で、多重化を大幅に単純化する。ユニバーサルという用語は、プライミング部位を説明するために使用される場合、ユニバーサルプライマーがハイブリダイズする部位である。ユニバーサルプライミング配列/プライマーの「セット」が使用され得ることにも留意すべきである。
【0021】
ハイブリダイゼーション:ハイブリダイゼーション(hybridizationまたはhybridisation)という用語は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)分子の、相補的DNAまたはRNAにアニーリングするプロセスを表す。DNAまたはRNAの複製およびRNAへのDNAの転写は両方とも、ヌクレオチドハイブリダイゼーションに依存する。
【0022】
ライゲーション:ライゲーションという用語は、酵素の作用による2つの核酸断片の連結である。DNAリガーゼは、相補鎖上の隣接部位に結合した2本のポリヌクレオチド鎖(の末端)間のホスホジエステル結合の形成を触媒することができる酵素である。一実施形態では、ライゲーションは、特に化学的ライゲーションができるようにポリヌクレオチドの隣接する末端の両方が修飾されている場合、化学的に行われうる。
【0023】
増幅:本明細書で使用される増幅という用語は、ヌクレオチド配列の混合物内の特定のヌクレオチド配列の濃度を増加させるための、ポリメラーゼベース反応の使用を意味する。「PCR」または「ポリメラーゼ連鎖反応」は、特定のDNA/RNAのインビトロ酵素増幅のための急速な手順である。増幅されるDNA/RNAは、試料を加熱することによって変性され得る。プライマーという用語は、DNA合成の出発点として役立つRNAまたはDNAの短鎖(一般に約18~22塩基)である。DNA複製にそれが必要であるのは、このプロセスを触媒する酵素、すなわちDNAポリメラーゼは、DNAの既存の鎖に新しいヌクレオチドを付加することしかできないからである。
【0024】
ポリメラーゼ:ポリメラーゼは、核酸の長鎖またはポリマーを合成する酵素である。DNAポリメラーゼおよびRNAポリメラーゼを使用して、塩基対合相互作用を用いてDNAまたはRNA鋳型鎖をコピーすることによって、それぞれDNAおよびRNA分子を組み立てる。
【0025】
ハイスループット:ハイスループットという用語は、多数のDNA試料を同時に処理する、およびスクリーニングする能力、ならびに単一のDNA試料内の多数の異なる遺伝子座を同時にスクリーニングする能力を意味する。しばしばHTSと略されるハイスループットシーケンシングまたはスクリーニングは、大量の試料を同時に効果的にスクリーニングするのに特に関連する科学的実験のための方法である。
【0026】
エンドヌクレアーゼ:エンドヌクレアーゼは、ランダムに、または指定された位置でDNAの二本鎖または一本鎖を切断する酵素である。
【0027】
上述のように、本開示は、ライゲーション依存性アッセイを活用することによる、非常に多数の試料における標的ヌクレオチド配列検出のハイスループット検出のための方法に関する。本開示は、次世代シーケンシングによって許容される技術を使用して、複合核酸プール中の遺伝子標的の配列を決定する方法を提供する。本開示はまた、ライゲーション依存性アッセイを活用することによって、多数の試料、好ましくは非常に多数の試料中の複数の遺伝子標的をプロファイルする方法を提供する。
本開示はさらに、複数の試料中の異なる標的核酸の照会を可能にする多重ライゲーション依存性プローブ増幅のための方法を提供する。本発明の方法は、異なる標的核酸のための複数の異なるプローブセットを提供して、複数の試料中の1以上の標的ヌクレオチド配列のシーケンシングを可能にする。シーケンシングデータを処理する際に、試料プールから、遺伝子標的を同定すること、および、個々の試料を絶対的に定量するために、固有の配列識別子が使用される。
【0028】
第1の主要な態様では、本発明は、複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出するための方法であって、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブおよび架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチド、を提供し、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列、選択的に第1の配列バーコード、および第1のプローブの3’末端に第1の標的特異性部分を含み、
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分、選択的に第2の配列バーコード、および第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、および、
前記架橋オリゴまたは架橋オリゴ複合体は、前記第1のプローブおよび前記第2のプローブのそれぞれの前記第1の架橋オリゴ特異性配列および前記第2の架橋オリゴ特異性配列に相補的な配列、および、選択的に第3のバーコードを含み、および、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つが、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体中に存在し、および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが、エンドヌクレアーゼの認識配列を含み、および、
選択的に、前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドの少なくとも1つは、第1の捕捉部分を含む、
工程と、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブおよび前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、互いにアニーリングして前記架橋オリゴまたは互いにアニーリングして前記架橋オリゴ複合体を形成できる複数のヌクレオチドと接触させ、複数のライゲーション複合体への自己アニーリングを可能にする、工程と、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させる、工程と、
(iv)前記第1のプローブおよび前記第2のプローブの各前記第1の標的特異性部分および前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせて、それにより、ハイブリダイゼーション複合体を形成する、工程と、
(v)選択的に、前記ハイブリダイゼーション複合体を、第2の捕捉部分を含む固体支持体と接触させ、前記ハイブリダイゼーション複合体が前記固体支持体に連結されるように、前記第1の捕捉部分と前記第2の捕捉部分とを相互作用させ、および、固体支持体に結合していないサンプルの成分から固体支持体に結合したハイブリダイゼーション複合体を分離する、工程と、
(vi)前記ハイブリダイゼーション複合体中の前記プローブをライゲーションさせて、ライゲーションされたライゲーション複合体を供給する、工程と、
(vii)前記複数の試料から前記ライゲーションされたライゲーション複合体をプールする、工程と、
(viii)1以上の前記ライゲーションされたライゲーション複合体から核酸を、鎖置換ポリメラーゼによるローリングサークル増幅を使用して、増幅する、工程と、
(ix)選択的に、工程(viii)で得られた増幅された1以上の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドでアニーリングに供し、前記オリゴヌクレオチドが、エンドヌクレアーゼに対する認識部位が得られるように、工程(i)で指定された認識配列とアニーリングする、工程と、
(x)選択的に、工程(vii)で得られた前記一本鎖コンカテマー配列または工程(ix)で前記エンドヌクレアーゼで得られたアニーリングされた複合体を切断する、工程と、
(xi)工程(x)で得られた前記核酸断片、または、工程(viii)で得られたコンカテマー配列を、ハイスループットシーケンシング技術に供して、前記バーコード配列を決定する工程と、および
(xii)前記第1の標的特異性部分および/もしくは前記第2の標的特異性部分の少なくとも一部、および/または前記第1のバーコードおよび/または前記第2のバーコードの少なくとも一部、および/または前記第3のバーコードの少なくとも一部を決定することによって、前記複数の試料中の前記標的ヌクレオチド配列の存在および/または数を特定する工程と、を含み、
前記工程(vi)および(vii)が、任意の順序で実行され得る方法である。
【0029】
図1は、本発明の方法の一実施形態の非限定的な例示を提供する。
【0030】
本発明の方法は、3つの核酸プローブを利用し、そのうちの2つの標的特異性核酸プローブ(左プローブおよび右プローブ)は遺伝子標的に特異であり、1つの核酸プローブは典型的にはユニバーサルである(架橋オリゴまたは架橋オリゴ複合体)。左右のプローブは、架橋プローブまたは架橋オリゴ複合体にハイブリダイズし、ライゲーション複合体を形成する。試料DNAまたはRNA上に標的識別部位を有するライゲーション複合体(1以上のバーコード配列を含む)は、照会試料の相補的標的配列に対してハイブリダイズすることができる。ハイブリダイゼーション後、左右のプローブを化学的またはDNAリガーゼにより酵素的にライゲーションして、ライゲートされたライゲーション複合体を形成する。本発明では、そのようなライゲーションされたライゲーション複合体の複数が、分析される複数の試料における試料分析中に形成されるであろう。
【0031】
一実施形態では、「複数の試料」は、これらに限定されないが、生検、唾液および他の分泌物、呼気水分抽出物、組織、血漿(液体生検)を含むヒトもしくは動物の体から得られた2つ以上の試料、水、廃水、土壌、植物、ウイルスもしくは細菌を含む試料などを含む環境から得られた2つ以上の試料等を指していてもよい。
好ましい実施形態では、試料は、事前に核酸を精製または濃縮せずに使用される。別の実施形態では、例えば、細胞を溶解して核酸を露出させる等の試料の前処理をしてもよい。
一実施形態では、サンプルは、核酸の事前の精製または濃縮なしで使用される。別の実施形態では、サンプルを前処理することができ、例えば、細胞を溶解して核酸を露出させることができる。
【0032】
標的配列は、検出が必要とされる目的の任意のヌクレオチド配列を含み得る。本開示の標的ヌクレオチド配列は、患者の血液中のDNAの画分または母体血液中のDNAの画分から得ることができるが、これらに限定されない。患者の血液中のDNAの画分は、アポトーシス/壊死癌細胞から、または胎児および/または母体由来の母体血液中のDNAの画分から得ることができる。さらに、分析の結果を使用して、例えば、所定のタイプの癌に対する個体のリスク、所定の癌に対する所定の治療の有効性の判定、腫瘍における薬物耐性関連変異の発生、または一般的なトリソミーダウン症候群、パトウ症候群およびエドワーズ症候群などの遺伝性障害を有する胎児のリスク等を評価する。特定の実施形態では、方法は、各標的ヌクレオチド配列に対して、複数の異なるプローブセットを提供することを含む。
【0033】
本明細書で使用される場合、プローブセットという用語は、第1のプローブ、第2のプローブおよび架橋オリゴまたは架橋オリゴ複合体を含む。
【0034】
特定の実施形態では、第1のプローブは、分子の5’末端から出発して、選択的に5’リン酸、第1の架橋オリゴ特異性配列、選択的に第1のユニバーサル配列、選択的に第1の配列バーコード、およびその3’末端における第1の標的特異性部分を含む。特定の実施形態では、第2のプローブは、分子の5’末端から出発して、選択的に5’リン酸、第2の標的特異性部分、選択的に第2の配列バーコード、選択的に第2のユニバーサル配列、およびその3’末端における第2の架橋オリゴ特異性配列を含む。
【0035】
好ましい実施形態では、第1のプローブまたは第2のプローブのいずれかは、第1の配列バーコードまたは第2の配列バーコードのうちの少なくとも1つを含む。第1の配列バーコードまたは第2の配列バーコード、またはその両方は、ランダム配列であってもよく、または標的ヌクレオチド配列識別子配列、試料識別子配列および/または標的列挙のための分子バーコードを含んでもよい。
【0036】
好ましい実施形態では、架橋オリゴまたは架橋オリゴ複合体は、第1および第2のプローブ中の第1および第2の架橋オリゴ特異性配列にそれぞれ相補的な配列、選択的にユニバーサル配列を含有し、および/またはランダム配列であり得るか、または試料もしくは配列識別子配列を含有し得る第3のバーコードを含有し得る。この点において、第3のバーコードは、必ずしも第1および第2のバーコードが既に存在することを意味するものではない。上述のように、少なくとも1つのバーコードがライゲーションされたライゲーション複合体中に存在すべきであり、これにより、試験されたすべての試料中のすべてのライゲーション複合体内で複合体を一意的に定義することが可能になる。
【0037】
さらに、第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つは、エンドヌクレアーゼのための認識配列を含む。
認識配列は、工程(x)におけるコンカテマー配列切断のために必要とされる。一つの実施形態では、EcoRIなどの制限エンドヌクレアーゼの認識配列である。別の実施形態では、認識配列は、I-CeuIなどのホーミングエンドヌクレアーゼの認識配列である。別の実施形態では、認識配列は、誘導されたDNAaseIまたはCRISPR-Casのような切断システムの認識配列である。
【0038】
選択的に、第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つは、第1の捕捉部分を含む。第1の捕捉部分は、本明細書で使用される場合、化学基などの部分を指し、これによって、固体支持体に連結された第2の捕捉部分がプローブ、ライゲーション複合体またはハイブリダイゼーション複合体を捕捉、すなわち結合することができる。この目的のために、当技術分野で公知の任意の適切な捕捉部分を使用することができる。周知の好適な例は、ストレプトアビジンコーティング磁気ビーズを用いたビオチン化分子の捕捉である。したがって、一実施形態では、第1の捕捉部分はビオチン部分であり、磁気ビーズなどの固体支持体に連結されたストレプトアビジンまたはアビジン部分(第2の捕捉部分)と相互作用することができる。他の選択肢には、ストレプトアビジン/アビジンとのコンジュゲーションに使用することができる、二重ビオチン、デスチオビオチンまたは光切断性ビオチンなどのビオチン誘導体が含まれる。さらなる選択肢としては、アクリルダイト/アクリルアミドコンジュゲーションのためのチオール基およびアクリルダイト基、クリックケミストリーのためのアルキン基およびアジド基、ならびに抗ジゴキシゲニン抗体コンジュゲーションのためのジゴキシゲニンの使用を含む。コンジュゲーションパートナーは、ビーズ(磁性またはその他)など任意の固体表面、または固体支持体上に提供されうる。
【0039】
第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、および/または第2の架橋オリゴ特異性配列は、好ましくは、プローブ結合を増加させるために互いに独立して少なくとも1つの化学修飾ヌクレオチドを含有する。プローブ結合を増加させる化学修飾には、リボ核酸、ペプチド核酸、およびロックド核酸(例えば、参照により本明細書に組み込まれる国際公開第2019/038372号の
図3に示される)が含まれるが、これらに限定されない。一実施形態では、第1のプローブまたは第2のプローブ、またはその両方の架橋部分が、架橋オリゴまたは架橋オリゴ複合体への結合を改善させるための化学修飾された塩基を含む。
別の実施形態では、第1の標的特異性部分、第2の標的特異性部分、第1の架橋オリゴ特異性配列、および/または第2の架橋オリゴ特異性配列が、互いに独立して1以上の化学修飾ヌクレオチドを含有する。特定の実施形態では、化学修飾は、隣接するプローブを化学的にライゲーションさせる。いくつかの実施形態では、前述のプローブは、完全に隣接する遺伝子座に、または最大500塩基対離れて、例えば最大200塩基対離れて、例えば最大50塩基対離れて、好ましくは最大40塩基対離れて、より好ましくは最大30塩基対離れて、より好ましくは最大20塩基対離れて、より好ましくは最大10塩基対離れて、最も好ましくは最大5塩基対離れて結合する。
【0040】
いくつかの実施形態では、第1のプローブまたは第2のプローブまたは架橋プローブまたは架橋オリゴ複合体は、Illuminaなどの(但し、これに限定されない)DNAシーケンシングプラットフォーム用のアダプター配列を含んでいてもよい。これらのアダプター配列により、結果として得られるシーケンシングライブラリをイルミナフローセルなどのシーケンスデバイスの検出部分に結合することができる。
【0041】
さらに、いくつかの実施形態では、架橋オリゴまたは架橋オリゴ複合体は、
(i)1~5個の3’突出塩基(すなわち、第2のプローブと二重らせんを形成しない追加の塩基)、および/または
(ii)3’リン酸、および/または
(iii)3’末端から3番目の位置以内の1つまたは複数のホスホロチオエート修飾、
を含む。
【0042】
プローブを、標的配列を含む試料と接触させる前に、第1のプローブおよび第2のプローブを、架橋オリゴまたは架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドと、好ましくは別個のチューブ内の試料の各々について、接触させ、ライゲーション複合体への自己アニーリングを可能にする(工程(ii))。架橋が1つのオリゴではなく、互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチド、例えば3つまたは5つのオリゴヌクレオチドである実施形態(本明細書では
図2Cに示す)では、複数のオリゴヌクレオチドが第1および第2のプローブとアニーリングする前にプレアニーリングされても、またはすべてのアニーリング工程が一度に行われてもよい。
【0043】
好ましくは、各ライゲーション複合体は、第1の標的特異性配列、第2の標的特異性配列および1以上のバーコード配列の組み合わせに対して固有である。これにより、増幅後の標的配列の列挙および結果の分析が可能になる。
【0044】
その後、複数の試料中の1以上の標的ヌクレオチド配列を複数のライゲーション複合体と接触させる(工程(iii))。第1のプローブおよび第2のプローブそれぞれの第1の標的特異性部分および第2の標的特異性部分を、標的配列上の本質的に隣接する部分にハイブリダイズして、それにより、ハイブリダイゼーション複合体を形成する(工程(iv))。いくつかの実施形態では、試料は、100マイクロリットル超、例えば1ml超の体積を有する。さらなる実施形態では、試料は、5pmol未満、例えば1pmol未満、例えば200fmol未満の核酸濃度を有する。一実施形態では、複数の試料が、1以上の血液試料、1以上の唾液試料、1以上の尿試料、または、1以上の糞便試料を含む。
【0045】
続いて、いくつかの実施形態では、第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが第1の捕捉部分を含む場合、ハイブリダイゼーション複合体は、第2の捕捉部分を含む固体支持体と接触させられ、そして、第1の補足部分および第2の捕捉部分とを、ハイブリダイゼーション複合体が固体支持体に連結されるように相互作用させることができる(選択的な工程(v))。その後、固体支持体に連結されていない試料の成分から、固体支持体に連結したハイブリダイゼーション複合体を分離する(工程(vi))。固体支持体が磁性ビーズである場合、磁石を用いてビーズを固定化し、残った液体試料を除去してもよい。選択的に、洗浄工程は、進行する前に行われる。
【0046】
工程(v)によって、核酸が精製および濃縮され、特に非常に純度の低い試料について結果の改善を可能にする。一実施形態では、本発明の方法は、工程(v)の前に核酸を濃縮する工程を含まない。
したがって、一実施形態では、方法は、工程(vi)の前に、元の試料中の核酸を2倍超、10倍超、または100倍超に濃縮する工程を含まない。
別の実施形態では、本発明の方法は、工程(vi)のライゲーションの後に精製工程を含まない。
【0047】
続いて、形成されたハイブリダイズ複合体中のプローブのライゲーションを酵素的または化学的に行い、ライゲーションされたライゲーション複合体を供給する(工程(vi))。工程(vi)の一部として任意に、第1のプローブと第2のプローブとの間に間隙が存在する場合、ポリメラーゼおよび1以上のヌクレオチドを導入することによって塞ぐことができる。ポリメラーゼは、(a)ユニバーサル架橋オリゴ配列に相補的、および/または(b)バーコード配列に相補的、であるヌクレオチドを付加し、それによって第1のプローブと第2のプローブとの間の2つの間隙を埋め、その結果、左右のプローブがライゲーションし、ユニバーサル配列および/または第3のバーコード配列が架橋相補鎖に含まれる。架橋オリゴまたは架橋オリゴ複合体は、第1のプローブまたは第2のプローブに存在する標的配列識別子配列が架橋オリゴまたは架橋オリゴ複合体に組み込まれるように、ライゲーションされたプローブに相補的な5’部位または3’部位から伸長される。好ましくは、第1のプローブの第2のプローブへのライゲーションを、両方が標的配列にアニーリングされている場合に、妨害しないために、二本鎖DNAを分解しないポリメラーゼ、例えばTaqポリメラーゼなどが使用される。
【0048】
ライゲーションされたライゲーション複合体は、そして、1以上の標的試料からプールされる(工程(vii))。工程(vi)および(vii)は、指定された順序で、または逆の順序で実行されてもよい。
【0049】
次に、核酸は、1以上の複数のライゲーションされたライゲーション複合体から増幅される(工程(viii))。
増幅は、phi29ポリメラーゼ(UniProtKB-P03680、 DPOL_BPPH2)またはBstポリメラーゼ(P52026、 DPO1_GEOSE)などの鎖置換ポリメラーゼによるローリングサークル増幅を使用して実行される。次の工程(ix)では、工程(viii)で得られた増幅された1以上の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドで、選択的にアニーリングに供し、ここで、前記オリゴヌクレオチドは、エンドヌクレアーゼの認識部位が得られるように、ステップ(i)で指定された前記認識配列とアニーリングする。認識配列を含む特定のオリゴヌクレオチドは、典型的には、切断のための安定した二重らせんの形成を可能にするために、認識配列の周りにいくつかの追加の特定の配列を含みうる。
【0050】
続いて、工程(viii)で得られた一本鎖コンカテマー配列または工程(ix)で得られたアニーリングされた複合体は、選択的に前記エンドヌクレアーゼで切断され(工程(x))、その結果、NGSライブラリーが得られる。
【0051】
選択的に、増幅後、固体支持体が存在する場合には、その固体支持体は除去され、上清はその後の処理に使用される。例えば、固体支持体が磁性粒子である場合、これらは磁石を使用して除去することができる。本発明の方法の他のいくつかの実施形態では、第1の捕捉部分と第2の捕捉部分との間の相互作用は、工程(vi)の直後、工程(vi)の後で、または工程(viii)の後に中断される。例えば、第1の捕捉部分がビオチンであり、第2の捕捉部分がストレプトアビジンである場合、過剰の可溶性ビオチンを添加することによって相互作用を中断することができる。ストレプトアビジンが磁性粒子に結合している場合、その後磁石を用いて除去することができる。
【0052】
さらに、選択的に、PCR増幅は、第1および第2のプローブのユニバーサル部分に結合するプライマーを使用して、ステップ(x)とステップ(xi)との間で行われ、前記プライマーは、選択的に、ステップ(xi)におけるその後の配列決定のためのアダプターを含む。
【0053】
複数の試料中の標的ヌクレオチド配列の存在および/または数の特定は、第1および/または第2の標的特異性部分の少なくとも一部分、第1および/または第2のバーコードの少なくとも一部分、および/または第3のバーコードの少なくとも一部分を、ハイスループット次世代シーケンシング技術、例えば、これに限定するものではないが、Illumina iSeq、MiSeq、HiSeq、NextSeqまたはNovaSeqを含む次世代シーケンシングプラットフォームを使用して決定すること(工程(xi)および(xii))によって行われ得る。好ましくは、遺伝子標的列挙は、標的あたりの、および試料あたりの分子バーコードの数を数えることによって可能になる。試料を配列データから分離(逆畳み込み)し、DNAシーケンシング後にイン シリコで配列標的を定量する。
【0054】
好ましい実施形態では、分子は、第1のプライマーおよび第2のプライマーでさらに増幅されて、増幅産物を提供する。好ましくは、ユニバーサル第1プライマーおよびユニバーサル第2プライマーが使用され、ライゲーションされた複合体中に存在する第1または第2のユニバーサル配列に対して相補的である。
【0055】
本発明の利点には、従来の核酸シーケンシング技術と比較して、低コスト、高単純性、高特異性、高感度、高精度、ハイスループット、高スケーラビリティおよび高ターンオーバーでの定量アッセイが含まれるが、これらに限定されない。本発明の別の態様は、本発明の方法が、ヒトおよび動物の集団を含み、大量の未精製試料材料を含む複数の試料中の複数の核酸標的の正確かつ大規模に並行して定量を可能にすることである。上述したように、好ましい実施形態では、尿試料などの試料は、事前に核酸を精製または濃縮せずに使用される。別の実施形態では、試料を前処理してもよく、例えば、細胞を溶解して核酸を露出させる。本発明の1つの特定の利点は、独自のプローブ設計、すなわちプローブトリプレットを使用して、目的の標的配列の検出および増幅を可能にすることである。プローブは、アニーリングおよび結合効率を改善する特別に配置された修飾ヌクレオチドを用いて設計される。結合特性の改善は、アッセイの特異性、感度および精度を向上させる。本発明の方法は、遺伝変異体の研究にも適用可能であり、これらに限定されないが、SNPおよび/またはインデルなど、1以上の配列および/または多型についての試料の遺伝子型同定、癌診断、または母体血液からの胎児染色体障害等を含む診断および予後への適用が見出される。好ましい実施形態では、2つ以上の試料または2つ以上の遺伝子座/対立遺伝子組み合わせについて、バーコード配列は、SNPおよび/またはインデルなどの1以上の配列および/または多型について試料の遺伝子型を同定するために使用される。
【0056】
別の態様では、本発明は、以下のようなパーツのキットを提供する。
パーツのキットは複数の容器を含み、少なくとも1つの容器は、第1のプローブおよび第2のプローブの1以上のセットを含み、および少なくとも1つの容器が、1以上の架橋オリゴ、または架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含み、、
第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列と、選択的に第1の配列バーコード、および第1のプローブの3’末端の第1の標的特異性部分とを含み、
第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分と、選択的に第2の配列バーコード、および第2のプローブの3’末端の第2の架橋オリゴ特異性配列とを含み、
架橋オリゴまたは架橋オリゴ複合体が、第1および第2のプローブそれぞれの第1および第2の架橋オリゴ特異性配列に相補的な配列、ならびに選択的に第3のバーコードを含み、
前記架橋オリゴまたは架橋オリゴ複合体は、各前記第1および第2のプローブ中の各第1および第2の架橋オリゴ特異性配列に相補的な配列、および選択的に第3のバーコードを含み
第1の配列バーコードまたは第2の配列バーコードまたは第3のバーコードの少なくとも1つが、それぞれ第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体中に存在し、
第1の配列バーコードまたは第2の配列バーコードまたは第3のバーコードの少なくとも1つは、それぞれ第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体中にそれぞれ存在し、および、
第1のプローブまたは第2のプローブまたは架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが、エンドヌクレアーゼのための認識配列を含み、および、
パーツのキットが、エンドヌクレアーゼに対する認識部分が得られるように、認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む。
【0057】
好ましくは、複数の第1のプローブの3’末端または複数の第2のプローブの5’末端、またはその両方は、複数の第1のプローブが複数の第2のプローブへ化学的にライゲーションできるように修飾される。
【0058】
好ましくは、架橋オリゴまたは架橋オリゴ複合体は、第1のプローブの配列に相補的な配列または第2のプローブの配列に相補的な配列またはその両方において、1以上の化学修飾ヌクレオチドを含む。
【0059】
好ましくは、第1のプローブの3’末端または第2のプローブの5’末端、またはその両方は、第1のプローブが第2のプローブへ化学的にライゲーションできるように修飾される。
【0060】
好ましくは、第1のプローブまたは第2のプローブ、またはその両方の架橋部分は、架橋オリゴまたは架橋オリゴ複合体への結合を改善させるための化学修飾された塩基を含む。
【0061】
1つの特定の実施形態では、第1および第2のプローブのセットを含む少なくとも1つの容器と、架橋オリゴまたは、互いにアニーリングして架橋オリゴ複合体を形成することができる複数のオリゴヌクレオチドを含む少なくとも1つの容器とは1つの同じ容器である。そのような場合、3つのプローブは、予めアニーリングされ、ライゲーションされた複合体を形成していてもよい。
【0062】
本発明の1つの特定の利点は、独自のプローブ設計、すなわちプローブトリプレットを使用して、目的の標的配列の検出および増幅を可能にすることである。プローブは、アッセイ特異性、感度および精度の向上につながる改善された結合特性で設計される。本発明は、分子生物学、進化生物学、メタゲノミクス、遺伝子型同定、より具体的には、SNPおよび/またはインデルなど、1以上の配列および/または多型についての試料の遺伝子型同定を含むがこれらに限定されない、癌診断または胎児染色体障害を含むがこれらに限定されない分野における用途を見出す。
【0063】
さらに、本発明は、以下に関する:
実施形態1
複数の試料中の1以上の標的ヌクレオチド配列をハイスループット検出のための方法であって、
(i)前記各試料中の各標的ヌクレオチド配列に、第1のプローブ、第2のプローブおよび架橋オリゴを提供し、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列、選択的に第1の配列バーコード、および第1のプローブの3’末端に第1の標的特異性部分を含み、および
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分、選択的に第2の配列バーコード、および第2のプローブの3’末端に第2の架橋オリゴ特異性配列を含み、および、
前記架橋オリゴまたは架橋オリゴ複合体は、前記第1のプローブおよび前記第2のプローブのそれぞれの前記第1の架橋オリゴ特異性配列および前記第2の架橋オリゴ特異性配列に相補的な配列、および、選択的に第3のバーコードを含み、および、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つが、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体中に存在し、および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴまたは架橋オリゴ複合体の少なくとも1つが、エンドヌクレアーゼの認識配列を含み、および、
選択的に、前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴの少なくとも1つは、第1の捕捉部分を含む、
工程と、
(ii)前記1以上の各標的ヌクレオチド配列について、前記第1のプローブおよび前記第2のプローブを、好ましくは別個のチューブ内の前記試料の各々について、前記架橋オリゴ複合体と接触させ、複数のライゲーション複合体への自己アニーリングを可能にする、工程と、
(iii)前記標的ヌクレオチド配列について試験される前記試料の各々に存在する核酸を、前記ライゲーション複合体と接触させる、工程と、
(iv)前記第1のプローブおよび前記第2のプローブの各前記第1の標的特異性部分および前記第2の標的特異性部分を、前記標的配列上の本質的に隣接する部分にハイブリダイズさせて、それにより、ハイブリダイゼーション複合体を形成する、工程と、
(v)選択的に、前記ハイブリダイゼーション複合体を、第2の捕捉部分を含む固体支持体と接触させ、前記ハイブリダイゼーション複合体が前記固体支持体に連結されるように、前記第1の捕捉部分と前記第2の捕捉部分とを相互作用させ、および、固体支持体に結合していないサンプルの成分から固体支持体に結合したハイブリダイゼーション複合体を分離する、工程と、
(vi)前記ハイブリダイゼーション複合体中の前記プローブをライゲーションさせて、ライゲーションされたライゲーション複合体を供給する、工程と、
(vii)前記複数の試料から前記ライゲーションされたライゲーション複合体をプールする、工程と、
(viii)1以上の前記ライゲーションされたライゲーション複合体から核酸を、鎖置換ポリメラーゼによるローリングサークル増幅を使用して、増幅する、工程と、
(ix)工程(viii)で得られた増幅された1以上の一本鎖コンカテマー配列を、エンドヌクレアーゼの認識配列を含む特定のオリゴヌクレオチドでアニーリングに供し、前記オリゴヌクレオチドが、エンドヌクレアーゼに対する認識部位が得られるように、工程(i)で指定された認識配列とアニーリングする、工程と、
(x)工程(viii)で得られた前記一本鎖コンカテマー配列または工程(ix)で前記エンドヌクレアーゼで得られたアニーリングされた複合体を切断する、工程と、
(xi)工程(x)で得られた前記核酸断片を、ハイスループットシーケンシング技術に供して、前記バーコード配列を決定する工程、および
(xii)前記第1の標的特異性部分および/もしくは前記第2の標的特異性部分の少なくとも一部、および/または前記第1のバーコードおよび/または前記第2のバーコードの少なくとも一部、および/または前記第3のバーコードの少なくとも一部を決定することによって、前記複数の試料中の前記標的ヌクレオチド配列の存在および/または数を特定する工程、を含み、
前記工程(vi)および(vii)が、任意の順序で実行され得る方法。
【0064】
実施形態2
前記複数の試料が、血液試料、唾液試料、尿試料または糞便試料を含む、実施形態1に記載の方法。
【0065】
実施形態3
前記第1のプローブまたは第2のプローブまたは架橋オリゴの少なくとも1つは第1の捕捉部分を含み、
前記工程(v)を含み、前記工程(v)の前に核酸を濃縮するステップを含まない、実施形態1または2に記載の方法。
【0066】
実施形態4
前記第1のプローブまたは第2のプローブまたは架橋オリゴの少なくとも1つは第1の捕捉部分を含み、
工程(v)を含み、前記第1の捕捉部分はビオチン部分であり、前記第2の捕捉部分はストレプトアビジン部分またはアビジン部分である、実施形態1~3のいずれかに記載の方法。
【0067】
実施形態5
前記第1のプローブまたは第2のプローブまたは架橋オリゴの少なくとも1つは第1の捕捉部分を含み、
前記工程(v)を含み、前記工程(v)と(vi)の間に洗浄工程が行われる、実施形態1~4のいずれかに記載の方法。
【0068】
実施形態6
前記架橋オリゴは、
(i)1~5個の3’突出塩基、および/または
(ii)3’リン酸、および/または
(iii)3’末端から3番目の位置以内の1または複数のホスホロチオエート修飾
を含む、実施形態1~5のいずれか記載の方法
【0069】
実施形態7
前記第1のプローブの3’末端または前記第2のプローブの5’末端、またはその両方が、前記第1のプローブが前記第2のプローブへ化学的にライゲーションできるように修飾される、実施形態1~6のいずれかに記載の方法
【0070】
実施形態8
前記第1のプローブまたは前記第2のプローブ、またはその両方の架橋部分が、前記架橋オリゴまたは架橋オリゴ複合体への結合を改善させるための化学修飾された塩基を含む、実施形態1~7のいずれかに記載の方法。
【0071】
実施形態9
前記第1の標的特異性部分、前記第2の標的特異性部分、前記第1の架橋オリゴ特異性配列、および/または前記第2の架橋オリゴ特異性配列が、互いに独立して1以上の化学修飾ヌクレオチドを含有する、実施形態1~8のいずれかに記載の方法。
【0072】
実施形態10
前記工程(viii)は、phi29ポリメラーゼまたはBstポリメラーゼを用いて実施される、実施形態1~9のいずれかに記載の方法。
【0073】
実施形態11
PCR増幅は、第1および第2のプローブのユニバーサル部分に結合するプライマーを使用して、ステップ(x)とステップ(xi)との間で行われ、前記プライマーは、選択的に、ステップ(xi)におけるその後の配列決定のためのアダプターを含む、実施形態1~10のいずれかに記載の方法。
【0074】
実施形態12
遺伝子標的列挙が、標的あたりの、および試料あたりの分子バーコードの数を数えることによって可能になる、実施形態1~11のいずれかに記載の方法。
【0075】
実施形態13
2つ以上のサンプルまたは2以上の遺伝子座/対立遺伝子の組み合わせに対して、バーコード配列が使用されて、SNPおよび/またはインデルなどの1以上の配列および/または多型のサンプルの遺伝子型を決定する、実施形態1~12のいずれかに記載の方法。
【0076】
実施形態14
複数の容器を含むパーツのキットであって、
少なくとも1つの容器は、第1のプローブおよび第2のプローブの1以上のセットを含み、および少なくとも1つの容器が、1以上の架橋オリゴを含み、
前記第1のプローブは、分子の5’末端から出発し、第1の架橋オリゴ特異性配列と、選択的に第1の配列バーコード、および第1のプローブの3’末端の第1の標的特異性部分とを含み、
前記第2のプローブは、分子の5’末端から出発し、第2の標的特異性部分と、選択的に第2の配列バーコード、および第2のプローブの3’末端の第2の架橋オリゴ特異性配列とを含み、
前記架橋オリゴは、各前記第1および第2のプローブ中の各前記第1および第2の架橋オリゴ特異性配列に相補的な配列、ならびに選択的に第3のバーコードを含み、
前記第1の配列バーコードまたは前記第2の配列バーコードまたは前記第3のバーコードの少なくとも1つは、それぞれ前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴ中にそれぞれ存在し、および、
前記第1のプローブまたは前記第2のプローブまたは前記架橋オリゴ少なくとも1つはエンドヌクレアーゼに対する認識配列を含み、および、
前記パーツのキットは、前記エンドヌクレアーゼに対する認識部分が得られるように、前記認識配列とアニーリングすることができるオリゴヌクレオチドをさらに含む。
【実施例0077】
(方法)
1.プローブ複合体の形成
プローブ複合体には、遺伝的標的、サンプルインデックス、Illuminaシーケンスライブラリの構築に必要な配列が含まれる。以下を含む3部分構成のプローブ複合体が形成された(
図2に示す。)
(a)分子の5’末端から出発して、第1の架橋オリゴ特異性配列、および第1のプローブの3’末端に第1の標的特異性部分を有する第1のプローブ、
(b)分子の5’末端から出発して、第2の標的特異性部分、第2の配列バーコード、および第2のプローブの3’末端に第2の架橋オリゴ特異性配列を有する第2のプローブ、および、
(c)第1のプローブおよび第2のプローブのそれぞれにおける第1の架橋オリゴ特異性配列および第2の架橋オリゴ特異性配列に相補的な配列、を有する架橋オリゴ。
【0078】
プローブ複合体は、アニーリング反応で3部分(架橋、右アーム、左アーム)すべてを等モル量で組み合わせることによって構築される。
反応は、サーモサイクラー内で実施される(表1に示すアニーリングプログラム)。
【0079】
【0080】
2.標的捕捉
目的の変異を含む特定のゲノム領域が標的とされる。精製されたDNA(たとえば、組織、血漿、尿、唾液からのもの)を試料として使用することも、試料を精製せずに、たとえば煮沸および/または遠心分離等によってのみ前処理することもできる。
【0081】
プローブ複合体は、塩基配列の相補的相互作用を介して標的領域にハイブリダイズする。標的捕捉の開始には、反応プローブと標的DNAを混合し、サーマルサイクラー内でインキュベートする(表2に示す標的捕捉と間隙充填のプログラム)。
【0082】
【0083】
3.間隙充填
標的捕捉の後、プローブ複合体は、Phusion DNAポリメラーゼ、ヌクレオチド、Ampligase DNAリガーゼの組み合わせを追加し、+45°Cで45分間インキュベートすることで、伸長され、ライゲートされる。
【0084】
4.ローリングサークル増幅
伸長およびライゲーションの後、環状プローブ分子は、ローリングサークル増幅(RCA)に付される。RCA反応のための、標的捕捉反応は、EquipPhi29(Thermo Scientific)ポリメラーゼを含むRCA反応ミックスと混合される。
反応は+42℃、30分から2時間、インキュベートされる。RCA反応後、Qubit蛍光光度計で一本鎖DNA(ssDNA)の濃度を測定することにより、反応効率を分析する。
【0085】
5.酵素的設計
RCA反応により、ターゲットライブラリの複数のコピーを持つ長いコンカテマーssDNA分子が生成される。各完全なターゲットライブラリは、EcoRI制限酵素認識配列によって分離されている。
この配列は、EcoRI制限酵素認識配列を含む特定のオリゴヌクレオチドとのアニーリングと、および準備ができた標的ライブラリーの放出とを介して、長いコンカテマーの配列特異的切断を可能にする。
これらのライブラリは、簡単な精製ステップの後、さらに分析する準備ができている。RCA生産物をEcoRIで+37℃で1時間、分解する。
【0086】
6.ライブラリの精製
EcoRI分解後、ライブラリー分子は、電気泳動後またはサイズ選択ビーズ(Macherey Nagel NucleoMagなど)を使用してアガロースゲルから抽出することにより精製される。
【0087】
7.スクリーニング
精製されたMiSeqまたはiSeq100互換のライブラリーは、最先端のシーケンス機器を使用してシーケンス分析に供される。
重要なことは、ライブラリーは、単純なオリゴヌクレオチド修飾によって、利用可能な任意のシーケンスプラットフォームに適合するように変換されうる。シーケンスデータは、UnixコマンドラインツールとPythonおよびRプログラミング言語の組み合わせを使用して処理される。
簡潔に述べると、シーケンシング処理の理論的根拠は、各リード内のプローブ配列を同定し、それらの間のゲノム領域をシーケンシングし、各遺伝子標的に関連する分子バーコードの数を数えることである。
【0088】
(実験1)
第1の実験では、プローブミックスは、4つの複製反応をもたらす4つの異なるインデックスのプローブの集合体であった。それらは、EML-ALK融合を標的にした。標的オリゴヌクレオチドは、各標的の同定を可能にする固有の認識配列をっていた。
【0089】
試料として、3つの合成標的オリゴヌクレオチドを対数的に増加する濃度で混合した。標的の捕捉、伸長およびライゲーション反応、ローリングサークル増幅およびその後のEcoRIによる分解は、上記のように実施された。典型的な結果の例を
図3に示す。
【0090】
レディライブラリはMiSeqおよびiSeq100機器でシーケンスされ、各リード内のプローブ配列をマッチングし、プローブ配列間のゲノム配列領域を同定し、分子バーコードを計数することによって、配列データ内で標的遺伝子を検出した。計数データはスパイクイン鋳型分子の数を正確に反映し、検出されたシグナルは、標的分子の有無に非常に特異的であった(
図4)。
【0091】
(
図1および
図2の詳細な説明)
図1は、記載された本発明の一実施形態のワークフローを示す。工程1では、試料(102)内の核酸(DNAまたはRNA)をライゲーション複合体のセット(104)と接触させる。ライゲーション複合体は、標的核酸(106)上にアニーリングする。
工程2では、選択的に、標的結合ライゲーション複合体を試料材料から試料不純物(103)を残して捕捉した。
工程3では、アニーリングしたライゲーション複合体をライゲーションし、ライゲーションされたライゲーション複合体を得る。
工程4では、複数の試料(110)からのライゲーションされたライゲーション複合体を一緒にプールする(112)。
工程5では、プローブ配列は、phi29ポリメラーゼ(UniProtKB-P03680、 DPOL_BPPH2)または他の鎖置換ポリメラーゼを用いたローリングサークル増幅によって増幅され、結果的にプローブ(1116)の長いコンカテマーコピーが得られる。
工程6では、選択的に、コンカテマープローブのコピーは、EcoRIなどの制限エンドヌクレアーゼまたはI-CeuIなどのホーミングヌクレアーゼを使用して単量体単位に切断され、および、選択的にさらに、PCRまたはエマルジョンPCRを使用して増幅される。
工程7では、増幅されたDNAは、次世代DNAシーケンシングを使用してシーケンシングされる。
工程8では、DNAシーケンシング結果は、生物情報学パイプラインを使用して標的計数に変換される。
【0092】
図2Aは、本明細書の一実施形態による、複数のプローブエンティティを有するプローブトリプレットの原理構造を示す。複数のプローブエンティティは、試料アニーリングの前に組み立てられた左プローブ、右プローブおよび架橋オリゴを含む。
左プローブの最初の塩基は、選択的に、酵素的ライゲーションのためのリン酸部分、または修飾1(202)と呼ばれる隣接プローブの5’末端への化学的ライゲーションを可能にする修飾を含む。
左プローブの15~25塩基は、架橋結合配列1(204)を含み、これは、架橋部位1と呼ばれる効率的な架橋オリゴ結合のための化学修飾塩基をさらに含み得る。
左プローブは、選択的に、分子特異性バーコードまたはバーコード1(206)と呼ばれる試料特異性バーコードを形成するランダムヌクレオチドのセグメントを含む、5’末端から続く10~20塩基をさらに含む。左プローブは、5’末端から続く15~30塩基をさらに含み、遺伝子標的(208)に結合する。204または208のヌクレオチドの一部または全部は、プローブの標的または架橋オリゴ(226)への親和性を増加させる化学修飾を含み得る。左プローブの最後の塩基は、選択的に、酵素的ライゲーションのためのリン酸部分、または修飾1(210)と呼ばれる隣接プローブの5’末端への化学的ライゲーションを可能にする修飾を含む。
【0093】
右プローブの最初の塩基は、選択的に、酵素的ライゲーションのためのリン酸部分、または修飾2(214)と呼ばれる隣接プローブの5’末端への化学的ライゲーションを可能にする修飾を含む。右プローブの5’末端からの15~30塩基は、遺伝子標的(216)に結合する右プローブの一部を含む。右プローブの5’末端から続く10~20塩基は、選択的に、バーコード2(218)と呼ばれる分子特異性バーコードまたは試料特異性バーコードを形成するランダムヌクレオチドのセグメントを含む。右プローブの最後の15~25塩基は、架橋配列2(222)と呼ばれる、効率的な架橋オリゴ結合のための配列を含む。204、208、216または220のヌクレオチドのいくつかまたはすべては、標的または架橋オリゴに対するプローブの親和性を増加させる化学修飾を含み得る。
【0094】
架橋配列3(228)と呼ばれる架橋オリゴの5’末端からの最初の15~25塩基は、右プローブの架橋配列1(204)と逆相補的であり、選択的に結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。架橋配列4(224)と呼ばれる架橋最後の15~25塩基は、左プローブ(220)の架橋配列2と逆相補的であり、選択的に、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。
ここで、架橋配列には、EcoRIなどの制限エンドヌクレアーゼまたはI-CeuI(226)などのホーミングエンドヌクレアーゼの認識部位が含まれている。架橋オリゴの5’末端には、選択的に、ライゲーション複合体を捕捉するために使用される捕捉部分(230)が含まれる。
【0095】
図2Bは、本明細書の一実施形態による、第1のプローブと第2のプローブとの間の間隙充填を示す。ここで、架橋オリゴは、架橋配列1(228)と架橋配列2(224)との間に間隙1を含む。間隙2は、プローブ1と2(208と216)との標的結合部の間に形成される。これらの間隙は、ポリメラーゼおよび1以上のヌクレオチドを導入することによって充填される。
この処理のために、Stoffel断片、TaqポリメラーゼまたはPhusionポリメラーゼ、およびAmpligaseなどのDNAリガーゼの混合物を使用することができる。ポリメラーゼは、(a)ユニバーサル架橋オリゴ配列に相補的であり、および(b)標的配列に相補的であるヌクレオチドを付加し、それによって2つの間隙、すなわち、第1のプローブと第2のプローブとの間の間隙を埋め、DNAリガーゼのその後の作用により、架橋オリゴと標的配列に相補的な左側のプローブと右側のプローブが環状複合体へのライゲーションがもたらされる。
【0096】
図2Cは、本明細書の一実施形態による、複数のプローブエンティティを有するプローブクインテットの原理構造を示す。複数のプローブエンティティは、左プローブ、右プローブおよび3つのオリゴからなる架橋体を含む。
ここで、プローブ複合体は左プローブと第2の架橋(228と236)の間、第2の架橋と右プローブ(240と222)の間、第1と第3の架橋オリゴ(238と242)の間、および左右プローブ(208と216)との間に間隙を含む。これらの間隙は、ポリメラーゼおよび1以上のヌクレオチドを導入することによって充填される。この処理のために、Stoffel断片、TaqポリメラーゼまたはPhusionポリメラーゼ、およびAmpligaseなどのDNAリガーゼの混合物を使用することができる。ポリメラーゼは、これらの間隙を埋め、DNAリガーゼのその後の作用により、プローブと架橋オリゴの環状複合体へのライゲーションがもたらされる。
【0097】
左プローブの15~25塩基は、架橋結合配列1(228)を含み、これは、選択的に、架橋配列1と呼ばれる効率的な架橋オリゴ結合のための化学修飾塩基を含んでもよい。左プローブは、さらに選択的に、ライブラリーのインデックス付けに使用されるユニバーサル配列(204)を含む、5’末端から続く10~20塩基をさらに含む。左プローブは、選択的に、バーコード1(206)と呼ばれる分子特異性バーコードまたは試料特異性バーコードを形成するランダムヌクレオチドのセグメントを含む、5’末端から続く10~20塩基をさらに含む。左プローブは、5’末端から続く15~30塩基をさらに含み、遺伝子標的(208)に結合する。228のヌクレオチドの一部または全部は、プローブの標的または架橋オリゴへの親和性を増加させる化学修飾(226)を含み得る。左プローブの最後の塩基は、選択的に、酵素的ライゲーションのためのリン酸部分、または修飾1(210)と呼ばれる隣接プローブの5’末端への化学的ライゲーションを可能にする修飾を含む。
【0098】
右プローブの最初の塩基は、選択的に、酵素的ライゲーションのためのリン酸部分、または修飾2(214)と呼ばれる、隣接プローブの5’末端への化学的ライゲーションを可能にする修飾を含む。右プローブの5’末端からの15~30塩基は、遺伝子標的(216)に結合する右プローブの一部を含む。右プローブの5’末端から続く10~20塩基は、選択的に、バーコード2(218)としての分子特異性バーコードまたは試料特異性バーコードを形成するランダムヌクレオチドのセグメントを含む。右プローブの5’末端から続く10~20塩基は、選択的にユニバーサル配列(220)を含む。架橋配列8(222)と呼ばれる右プローブの最後の15~25塩基は、第3の架橋オリゴ(224)の架橋配列7と逆相補的である。208、216、222または228のヌクレオチドの一部または全部は、プローブの標的または架橋オリゴへの親和性を増加させる化学修飾を含み得る。
【0099】
架橋配列3(226)と呼ばれる第1の架橋オリゴの5’末端からの最初の15~25塩基は、右プローブの架橋配列1(228)と逆相補的であり、選択的に、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。架橋配列2(238)と呼ばれる第1の架橋オリゴの最後の15~25塩基は、第2の架橋オリゴの架橋配列4配列(236)と逆相補的であり、選択的に、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。第1の架橋オリゴの5’末端は、選択的に、ライゲーション複合体を捕捉するために使用される捕捉部分(230)を含む。
【0100】
架橋配列5(240)と呼ばれる第2の架橋オリゴの5’末端からの最初の15~25塩基は、第3の架橋オリゴの架橋配列6(242)と逆相補的であり、選択的に、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。架橋配列4(236)と呼ばれる第2の架橋オリゴの最後の15~25塩基は、第1の架橋オリゴの架橋配列2配列(238)と逆相補的であり、選択的に、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。
【0101】
架橋配列6(242)と呼ばれる5’末端からの第3の架橋オリゴの最初の15~25塩基は、第2の架橋オリゴの架橋配列5(240)と逆相補的であり、選択的に結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。
架橋配列7(224)と呼ばれる第1の架橋オリゴの最後の15~25塩基は、右プローブの架橋配列8配列(222)と逆相補的であり、結合を増加させるための化学修飾ヌクレオチドを含んでいてもよい。
第3の架橋オリゴの3’末端は、間隙充填中の伸長を防止するために、リン酸(または他の切断可能な)部分(234)を含んでいてもよい。