(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-08-04
(54)【発明の名称】出現による配列決定
(51)【国際特許分類】
C12Q 1/6874 20180101AFI20220728BHJP
C12N 15/11 20060101ALN20220728BHJP
【FI】
C12Q1/6874 Z ZNA
C12N15/11 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021570322
(86)(22)【出願日】2020-05-27
(85)【翻訳文提出日】2022-01-25
(86)【国際出願番号】 US2020034726
(87)【国際公開番号】W WO2020243187
(87)【国際公開日】2020-12-03
(32)【優先日】2019-05-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】520187300
【氏名又は名称】エックスゲノムズ コーポレーション
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ミール,カリム
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA18
4B063QQ42
4B063QR55
4B063QS34
4B063QX02
(57)【要約】
本発明は、ポリマーを配列決定する方法であり、1つ以上のポリマーの配列が、ポリマーへの分子プローブのレパートリーの結合相互作用の出現特性により決定される。
【特許請求の範囲】
【請求項1】
核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基からの1つの定義されたヌクレオチド、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
【請求項2】
前記光学活性が、前記オリゴヌクレオチド種上の標識に起因し、前記標識が、ナノ粒子、蛍光分子構造を含む、請求項1に記載の方法。
【請求項3】
各オリゴヌクレオチド種が、他の標識から区別されることを可能にする異なる標識で標識される、請求項2に記載の方法。
【請求項4】
前記光学活性が、1つ以上の挿入色素分子を含む二重鎖認識部分による結合相互作用の前記標識に起因する、請求項1に記載の方法。
【請求項5】
前記光学活性が、バルク溶液ではなく、前記固定され伸長/伸展された核酸の近傍でのみ検出される、請求項1に記載の方法。
【請求項6】
前記光学活性が、FRETを介して検出されるか、または、前記標識が、それが前記固定され伸長/伸展された核酸の近傍になるまでクエンチされるか、もしくは蛍光発生性である、請求項5に記載の方法。
【請求項7】
前記オリゴが、二重標識され、前記二重標識が、各末端にCy3部分を含み、これが、バルク溶液中では色素間(dye-dye)相互作用によって実質的にクエンチされるが、結合時には蛍光する、請求項5に記載の方法。
【請求項8】
前記固定され伸長/伸展された核酸が、一本鎖である、請求項1に記載の方法。
【請求項9】
ドリフトが、基板ステージを対物レンズにロックすることによって、最小化される、請求項1に記載の方法。
【請求項10】
前記ドリフトが、補正される、請求項1に記載の方法。
【請求項11】
基準ドリフト補正マーカーが、前記固定され伸長/伸展された核酸の近傍で、前記基板上に提供される、請求項1に記載の方法。
【請求項12】
前記基準ドリフト補正マーカーが、空間的にアドレス指定可能な蛍光シグナルを含む折り紙(Origami)グリッドを含む、請求項10に記載の方法。
【請求項13】
前記空間的にアドレス指定可能な蛍光シグナルが、一過性であり、PAINTまたはDNA PAINT法による撮像剤の結合に起因する、請求項11に記載の方法。
【請求項14】
前記オリゴプローブ種のセットが、前記固定され伸長/伸展された核酸に同時に曝露され、それらが他の標識から区別されることを可能にする、それらの別個の標識が、各々検出される、請求項3に記載の方法。
【請求項15】
配列5’NNNXNNN3’のライブラリを各々含む、4つのプローブ種が使用され、式中、Nが、縮重位置であり、Xが、前記差次的に標識された4つのヌクレオチドの各々である、請求項1に記載の方法。
【請求項16】
核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基を各々含む2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
【請求項17】
核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基を各々含む2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に安定して結合することを可能にする条件下で行われ、それによって、照射時に、前記固定された核酸の1つ以上の部分に対応する前記基板上の1つ以上の場所で、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)光学活性の事例の段階的な損失が撮像デバイスを使用して測定/記録されるように、前記光学活性の事例を退色させることと、
(d)前記固定され伸長/伸展された核酸を、結合したオリゴヌクレオチドプローブが解離することを可能にする条件に曝露し、前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)光学活性の各事例のナノメトリック/微調整された場所を計算するために、単一分子局在化アルゴリズムを使用することと、
(f)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
【請求項18】
前記オリゴヌクレオチド種が、
5’NNnNnNN3’を含み、式中、Nまたはnは、指定された位置または縮重位置であり、N=LNA部分であり、n=デオキシリボース部分である、請求項16に記載の方法。
【請求項19】
前記オリゴヌクレオチド種が、5’cy3 NTgGcGN3’、5’cy3B NTgGcGN3’、5’Atto542 NTgGcGN3’を含む、請求項16に記載の方法。
【請求項20】
前記核酸が二本鎖である場合、前記二本鎖が変性され、両方の鎖が前記基板上に位置し、個々のプローブが結合する前記鎖が、前記基板に結合する前記オリゴヌクレオチドプローブ種の配列の重複から、各鎖についてタイリング経路を構築することによって、逆畳み込みが行われる、請求項16に記載の方法。
【請求項21】
核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に固定/固定化し、それによって、固定/固定化核酸を形成することと、
(b)前記固定/固定化核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、
前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定/固定化核酸の1つ以上の部分に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
【請求項22】
各プローブ種の複数のオン・オフ結合事象を使用して、前記試験基板上の位置のセットを取得する、請求項20に記載の方法。
【請求項23】
かなりの数(例えば、70%超)の事象が、サブ回折精度で位置決定された単一分子である、請求項21または22に記載の方法。
【請求項24】
前記オリゴヌクレオチドが、構造:
プローブ配列-スペーサー-シールド-標識であって、プローブ配列が、縮重塩基位置および/または特異的塩基位置を含む核酸配列を含み、前記スペーサーが、化学リンカー(例えば、ヘキサエチレングリコールのいくつかの結合)または核酸配列(例えば、18塩基長の配列)のいずれかを含み、前記リンカーが、二官能性であり、かつ前記プローブ配列を前記シールドまたは標識に連結することができ、前記シールドが、タンパク質(例えば、ストレプトアビジン)を含み、前記標識が、蛍光標識またはタグ(蛍光標識もしくは分子撮像剤のドッキング部位として機能する)を含む、プローブ配列-スペーサー-シールド-標識を含む、請求項21に記載の方法。
【請求項25】
前記スペーサーおよび/またはシールドが存在しない、請求項21に記載の方法。
【請求項26】
酸素除去/蛍光促進分子システムが、撮像中に提供され、前記システムが、(a)ピラノースオキシダーゼ、カタラーゼ、グルコース、(b)プロトカテク酸-ジオキシゲナーゼ、3,4-プロトカテク酸、(c)カタラーゼ、グルコースオキシダーゼ、スクロースまたはグルコース、(d)メチレンブルーおよびジチオトロール(DTT)、(e)βメルカプトエタノール、TCEP、またはジチオトロール(DTT)を含む還元剤、(f)Trolox、1,3,5,7-シクロオクタテトラエン、および/または4-ニトロベンジルアルコールを含む三重項状態消光剤/蛍光促進剤、のうちの1つ以上を含む、請求項21に記載の方法。
【請求項27】
前記オリゴが、高濃度(100nM超)の蛍光標識されたオリゴヌクレオチドを含み、かかる高濃度によるバックグラウンドが、FRET、クエンチング、蛍光発生、光活性化、蛍光ケージを含む機構を使用することによって回避される、請求項21に記載の方法。
【請求項28】
前記核酸が、セルフリー核酸である、請求項20に記載の方法。
【請求項29】
固定化が、非修飾核酸の末端を、疎水性表面に付着させることを含み、前記セルフリー塩基を、前記核酸の前記末端の1つで、MES ph5.5~6の存在下、ビニルシランまたはZeonexの表面に結合させる、請求項27に記載の方法。
【請求項30】
固定化が、セルフリー核酸の末端を、ターミナルトランスフェラーゼを使用して、ヌクレオチドを用いてテール付加し、前記テールを、表面に固定化された相補核酸にハイブリダイズさせることを含む、請求項27に記載の方法。
【請求項31】
固定化が、前記セルフリー核酸を環状化し、ローリングサークル増幅によって増幅し、一本鎖アンプリコンを固定化することを含む、請求項27に記載の方法。
【請求項32】
前記アンプリコンが、前記基板上で伸長または伸展されている、請求項21~31のいずれか一項に記載の方法。
【請求項33】
前記アンプリコンが、ボール状構造に凝縮され、前記基板上に固定化/固定される、請求項30に記載の方法。
【請求項34】
前記セルフリー核酸のゲノム起源が、1つ以上のオリゴヌクレオチド種の前記結合によって決定/識別される、請求項27に記載の方法。
【請求項35】
異なる染色体またはゲノム領域の比率が、それらのゲノム起源に従って識別される核酸分子の数を計数することによって決定される、請求項33に記載の方法。
【請求項36】
試料の胎児画分が決定される、請求項34に記載の方法。
【請求項37】
一塩基バリアントまたはインデルが、1つ以上のオリゴの、核酸分子(それらのゲノム起源に従って識別される)への結合を分析することによって決定される、請求項33に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年11月29日に出願された「Sequencing by Emergence」と題する米国特許出願第16/205,155号の一部継続であり、2017年11月29日に出願された「Sequencing by Emergence」と題する米国特許出願第62/591,850号の優先権を主張し、参照により本明細書に援用される。
【0002】
本開示は、概して、1つ以上のポリヌクレオチドへのプローブの一過的な結合を介して核酸を配列決定するためのシステムおよび方法に関する。
【背景技術】
【0003】
DNA配列決定は、最初に、ゲル電気泳動ベースの方法で実現した:ジデオキシ鎖終結法(例えば、Sanger et al.,Proc.Natl.Acad.Sci.74:5463-5467,1977)、および化学分解法(例えば、Maxam et al.,Proc.Natl.Acad.Sci.74:560-564,1977)。これらのヌクレオチドの配列決定方法は、時間と費用の両方がかかっていた。それにもかかわらず、前者は10年以上および数億ドルを要したにもかかわらず、初めてヒトゲノムの配列決定につながった。
【0004】
個別化医療の夢がますます実現に近づくにつれて、個々のヒトゲノムを配列決定するための安価で大規模な方法の必要性が高まっている(Mir,Sequencing Genomes:From Individuals to Populations,Briefings in Functional Genomics and Proteomics,8:367-378,2009)。ゲル電気泳動を回避するいくつかの配列決定方法(その後、より低コストである)が、「次世代配列決定」として開発された。(Illumina Inc.によって実施されているように)可逆的ターミネーターを使用した、そのような1つの配列決定方法が主流である。サンガー配列決定の最も進化した形態で使用される検出方法および現在主流のイルミナ技術は、蛍光を伴う。単一ヌクレオチド挿入を検出する他の可能な手段としては、プロトン放出を使用した検出(例えば、電界効果トランジスタ、ナノポアを通るイオン電流、および電子顕微鏡を介した検出)が挙げられる。Illuminaの化学は、蛍光標識が付いた可逆的ターミネーター(Canard et al.,Metzker Nucleic Acids Research 22:4259-4267,1994)を使用した、ヌクレオチドの周期的付加を伴う(Bentley et al.,Nature 456:53-59,2008)。Illumina配列決定は、単一ゲノム分子をクローン増幅することから始まり、標的ゲノムをライブラリに変換し、次いでクラスターとしてクローン増幅するために、実質的な事前の試料処理が必要である。
【0005】
しかしながら、配列決定前の増幅の必要性を回避するいくつかの方法が、その後市場に出回っている。どちらの新たな方法も、DNAの単一分子上で、合成による蛍光配列決定(SbS)を行う。第1の方法、HelicosBio(現在のSeqLL)からの方法は、可逆的終結を伴う段階的SbSを行う(Harris et al.,Science,320:106-9,2008)。第2の方法、Pacific BiosciencesからのSMRT配列決定は、ヌクレオチドを組み込んだ反応の天然の脱離基である末端リン酸上の標識を使用し、試薬の交換を必要とせずに連続的に配列決定を行うことを可能にする(例えば、Levene et al.,Science 299:682-686,2003およびEid et al.,Science,323:133-8,2009)。Pacific Bioscience配列決定にやや類似したアプローチは、Genia(現在はRocheの一部)によって開発されている方法であり、光学的方法ではなく、ナノポアを介してSbSを検出することによる。
【0006】
最も一般的に使用されている配列決定方法は、リード長(read length)が制限されており、これにより、配列決定のコストと得られたリード(read)のアセンブリの困難性の両方が増加する。サンガー配列決定によって得られたリード長は、1000塩基範囲内である(例えば、Kchouk et al.,Biol.Med.9:395,2017)。Roche454配列決定およびIon Torrentはともに、数百塩基範囲のリード長を有する。当初、約25塩基のリードで始まったIllumina配列決定は、現在、典型的には、150~300塩基対リードである。しかし、新鮮な試薬が、リード長の各塩基に対して供給される必要があるため、25ではなく250塩基を配列決定するには、10倍の時間および10倍の高価な試薬が必要である。市販のシステムで可能な最長のリード長は、Oxford Nanopores Technology(ONT)およびPacific Bioscience(PacBio)のナノポア鎖配列決定によって得られている(例えば、Kchouk et al.,Biol.Med.9:395,2017)。後者は、通常、平均約10,000塩基長のリードを有するが、前者は、ごく稀に、数百キロ塩基長のリードを得ることができる(例えば、Laver et al.,Biomol.Det.Quant.3:1-8,2015)。
【0007】
ONTおよびPacBioの配列決定の他に、配列決定技術自体ではないが、試料調製のアプローチである、いくつかのアプローチが存在し、Illuminaショートリード配列決定技術を補完して、より長いリードを構築するための足掛かりを提供する。これらのうちの1つは、10×Genomicsによって開発された液滴ベースの技術であり、液滴内の100~200kbの断片(例えば、抽出後の平均の断片長の範囲)を単離し、それらをより短い長さの断片のライブラリに処理し、その各々が、それらが由来する100~200kbに特異的な配列識別タグを含み、複数の液滴からのゲノムの配列決定時に、約50~200Kbのバケットに逆畳み込みを行う(deconvolve)ことができる(Goodwin et al.,Nat.Rev.Genetics 17:333-351,2016)。別のアプローチが、Bionano Genomicsによって開発されており、ニッキングエンドヌクレアーゼへの曝露を介してDNAを伸長し、ニックを誘導する。この方法は、ニッキングのポイントを蛍光検出して、分子のマップまたはスカフォールドを提供する。この方法は現在、ゲノムをアセンブリするのに十分に高い密度を有するようには開発されていないが、それにもかかわらず、ゲノムの直接可視化を提供し、大きな構造多型を検出し、長距離ハプロタイプを決定することができる。
【0008】
異なる配列決定方法が開発され、配列決定のコストが概して減少する傾向にあるにもかかわらず、ヒトゲノムのサイズは、患者に対して高い配列決定コストを引き続きもたらしている。個々のヒトゲノムは、46本の染色体に組織化され、そのうち最も短いものは約50メガ塩基であり、最も長いものは250メガ塩基である。NGS配列決定方法は、依然として、性能に影響を及ぼす多くの問題を有し、分析に必要な時間を実質的に増加させ得る参照ゲノムへの依存性が含まれる(例えば、Kulkarni et al.,Comput Struct Biotechnol J.15:471-477,2017で議論されている)。
【0009】
上記の背景を考慮すると、当該技術分野で必要とされているものは、試薬および時間の使用において効率的であり、かつ正確度を損なうことなく長いハプロタイプ解像リード(haplotype-resolved reads)を提供する、スタンドアロンの配列決定技術を提供するためのデバイス、システムおよび方法である。
【0010】
この背景セクションで開示される情報は、一般的な背景の理解を高めるためにすぎず、この情報が、当業者に既知の従来技術を形成することの承認またはいかなる形態の示唆として解釈されるべきではない。
【発明の概要】
【0011】
本開示は、改善された核酸配列決定技術を提供するためのデバイス、システム、および方法に対する当該技術分野の必要性に対処する。広範な一態様では、本開示は、分子プローブを、1つ以上の単位の二本鎖標的分子に結合させることによって、少なくとも1つの単位の多単位標的分子を識別する方法を含む。本開示は、1つ以上の種類の分子プローブと二本鎖標的分子との単一分子相互作用の検出に基づく。一部の実施形態では、プローブは、少なくとも1単位の標的分子にと一過的に結合する。一部の実施形態では、プローブは、少なくとも1単位の標的分子へと反復的に結合する。一部の実施形態では、分子実体は、高分子、表面またはマトリックス上で、ナノメトリック正確度まで位置決定される。
【0012】
一態様では、核酸を配列決定する方法が提供される。本方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露すること、によって進行する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、1つの定義されたヌクレオチドおよび1つ以上の縮重位置(degenerate position)を含む。各定義されたヌクレオチドは、A、C、G、Tの塩基のセットから選択される。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体(universal base analogs)の混合物のいずれかを含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例(instance)を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって進行する。試験基板上のそれぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって継続する。
【0013】
本開示の別の態様では、核酸を配列決定する方法が提供される。この追加の方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することによって継続する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含む。各定義されたヌクレオチド位置は、A、C、G、Tの塩基を含む。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体(universal base analogs)の混合物のいずれかを含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例(instance)を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって終了する。
【0014】
本開示の別の態様では、核酸を配列決定する方法が提供される。この追加の方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することによって進行する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含む。各定義されたヌクレオチド位置は、A、C、G、Tの塩基のセットのうちの1つを含む。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に安定して結合することを可能にする条件下で行われ、それによって、照射時に、固定された核酸の1つ以上の部分に対応する基板上の1つ以上の場所で、光学活性のそれぞれの事例を生じさせる。本方法は、(c)撮像デバイスを使用して光学活性の事例の段階的な損失が測定/記録されるように、光学活性の事例を退色させることによって進行する。本方法は、(d)固定され伸長/伸展された核酸を、結合したオリゴヌクレオチドプローブが解離することを可能にする条件に曝露し、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(d)単一分子位置決定アルゴリズムを使用して、光学活性の各事例のナノメトリックな/微調整された場所を計算し、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって進行する。
【0015】
本開示の別の態様は、核酸を配列決定する方法を提供する。本方法は、(a)核酸を、試験基板上に固定/固定化し、それによって、固定/固定化核酸を形成すること、を含む。本方法は、(b)固定/固定化核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することにより進行する。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定/固定化核酸の1つ以上の部分に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって終了する。
【0016】
他の実施形態は、本明細書に記載の方法に関連するシステム、携帯型消費者向けデバイス、およびコンピュータ可読媒体を対象とする。
【0017】
本明細書に開示されるように、適用可能な場合、本明細書に開示される任意の実施形態を任意の態様に適用することができる。
【0018】
本開示の追加の態様および利点は、以下の詳細な説明から当業者に容易に明らかになるであろう。ここでは、本開示の例示的な実施形態のみが示され、説明される。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、本開示からすべて逸脱することなく、様々な明白な態様で修正することができる。したがって、図面および説明は、本質的に例示的なものとしてみなされ、限定的なものとしてみなされるべきではない。
【図面の簡単な説明】
【0019】
【
図1A-1B】例示的なシステムトポロジーをまとめて示す。結合事象に関与する複数のプローブを有するポリマーと、結合事象の位置決定および配列識別に関する情報を収集および記憶し、次いで、本開示の様々な実施形態に従ってポリマー配列を決定するための分析をさらに行うためのコンピュータ記憶媒体と、を含む。
【
図2A-2B】本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための方法のプロセスおよび特徴のフローチャートをまとめて提供する。
【
図3】本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための追加の方法のプロセスおよび特徴のフローチャートを提供する。
【
図4】本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための追加の方法のプロセスおよび特徴のフローチャートを提供する。
【
図5A-5C】本開示の様々な実施形態に従う、ポリヌクレオチドへのプローブの一過的な結合の例をまとめて示す。
【
図6A-6B】本開示の様々な実施形態に従って、標的ポリヌクレオチドに結合する異なるk塩基長(k-mer)のプローブの例をまとめて示す。
【
図7A-7C】本開示の様々な実施形態に従って、オリゴヌクレオチドセットの連続サイクルを伴う参照オリゴを使用する例をまとめて示す。
【
図8A-8C】本開示の様々な実施形態に従って、異なるプローブセットを単一の参照分子に適用する例をまとめて示す。
【
図9A-9C】本開示の様々な実施形態に従って、複数の種類のプローブを使用する場合における一過的な結合の例をまとめて示す。
【
図10A-10B】本開示の様々な実施形態に従って、いくつかの収集された一過的な結合事象が、達成され得るプローブの局在化の程度と相関する例をまとめて示す。
【
図11A-11B】本開示の様々な実施形態に従う、タイリングプローブの例をまとめて示す。
【
図12A-12C】本開示の様々な実施形態に従う、直接標識されたプローブの一過的な結合の例をまとめて示す。
【
図13A-13C】本開示の様々な実施形態に従う、挿入色素(intercalating dye)の存在下での一過的なプローブの結合の例をまとめて示す。
【
図14A-14E】本開示の様々な実施形態に従う、異なるプローブ標識技術の例をまとめて示す。
【
図15】本開示の様々な実施形態に従う、変性され梳かれた二本鎖DNA上のプローブの一過的な結合の例を示す。
【
図16A-16B】本開示の様々な実施形態に従う、細胞溶解および核酸固定化および伸長の例をまとめて示す。
【
図17】本開示の様々な実施形態に従って、単一細胞を捕捉し、任意選択的に、細胞由来の核酸の抽出、伸長、および配列決定を提供する例示的なマイクロ流体アーキテクチャを示す。
【
図18】本開示の様々な実施形態に従って、個々の細胞に異なるIDタグを提供する例示的なマイクロ流体アーキテクチャを示す。
【
図19】本開示の様々な実施形態に従って、個々の細胞からポリヌクレオチドを配列決定する例を示す。
【
図20A-20B】本開示の様々な実施形態に従って、一過的なプローブの結合の撮像を行うための例示的なデバイスレイアウトをまとめて示す。
【
図21】本開示の様々な実施形態に従って、エアギャップによって分離された試薬を含む例示的なキャピラリーチューブを示す。
【
図22A-22E】本開示の様々な実施形態に従う、蛍光の例をまとめて示す。
【
図23A-23C】本開示の様々な実施形態に従う、蛍光の例をまとめて示す。
【
図24】本開示の様々な実施形態に従う、合成変性二本鎖DNA上の一過的な結合を示す。
【
図25A-25B】「フットプリント」配列決定の2つのサイクルを示す。この5塩基長の場合、5サイクルが使用される。ここで、各サイクルは、オリゴヌクレオチドの「フットプリント」または長さに沿って定義される異なる単一のヌクレオチド位置を有し、残りのヌクレオチドは縮重しており、各位置が4つすべてのヌクレオチドまたは各縮重位置が普遍的ヌクレオチド類似体(例えば、ニトロインドール、ニトロピロール、またはイノシンなど)のいずれかのライブラリを含む。定義された各塩基は、同じ混合物中に添加された場合、互いに区別され得る4つの異なる標識のうちの1つに連結された異なる色で表される。この図では、位置1は、第1のサイクルで定義され、位置2は、第2のサイクルで定義される。これらのサイクルを経ると、標的(オリゴのフットプリント下)の位置1、2、3、4、5の同一性が、連続したサイクルで得られる。一部の実施形態では、標的の照合された塩基の同一性は、オリゴの対応する定義された塩基に相補的である。一部のかかる実施形態では、位置決定は、オリゴが結合するフットプリントの場所を特定するのに十分である必要があり、フットプリント内の位置は、色またはサイクル数などのコードによって定義される。
【
図26】1つのヌクレオチドのみが定義され、4つの異なる定義されたヌクレオチドすべてが異なる色で示される場合を概略的に示す。一部の実施形態における異なる色は、異なるフルオロフォアまたは異なる付加サイクルを示す。色が異なる場合、配列決定プロセス全体を、試薬交換を必要とせずに、単一の均一反応またはワンポット反応で実行することができる。このアプローチでは、DNAの鎖は、表面上で伸長/伸展され、短いオリゴが、溶液中に添加され、それらの相補場所に結合する。
【
図27】各側に4つの縮重位置、5’cy3 NNgGcNN(オリゴ名称:3004-3mer)に隣接する3つの定義された塩基とのオリゴの結合を示す。伸展されたDNAは、0.5MのNaоHによって20分間変性されたラムダファージである。結合緩衝液は、4×SSCおよび0.1%のTween20であり、結合は、4℃で行われ、撮像は、室温で行われた。
【発明を実施するための形態】
【0020】
ここで、実施形態を詳細に参照する。その例は、添付の図面に例示されている。以下の詳細な説明では、本開示の完全な理解を提供するために、多くの特定の詳細が示されている。しかしながら、本開示がこれらの特定の詳細なしで実施されることは、当業者には明らかであろう。他の例では、実施形態の態様を不必要に曖昧にしないように、周知の方法、手順、構成要素、回路、およびネットワークは、詳細に説明されていない。
【0021】
定義
本開示で使用される専門用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図するものではない。説明および添付の特許請求の範囲で使用される場合、単数形の「a」、「an」、および「the」は、文脈により明らかにそうではないことが示されていない限り、複数形も同様に含むことが意図される。本明細書で使用される「および/または」という用語は、関連する列挙された項目の1つ以上の任意のおよびすべての可能な組み合わせを指し、それを包含することも理解されたい。さらに、「含む(includes)」および/または「含む(comprising)」という用語は、本明細書で使用される場合、記載された特徴、整数、ステップ、操作、要素、および/または構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しないことを理解されたい。
【0022】
本明細書で使用される場合、用語「~の場合(if)」は、文脈に応じて、「~のとき(when)」または「~の際(upon)」または「決定に応じて(in response to determining)」または「検出に応じて(in response to detecting)」を意味すると解釈される。同様に、「それが決定される場合」または「[記載された状態または事象]が検出される場合」という語句は、文脈に応じて、「決定の際」または「決定に応じて」または「[記載された状態または事象]の検出の際」または「[記載された状態または事象]の検出に応じて」を意味すると解釈される。
【0023】
「または」という用語は、排他的な「または」ではなく、包含的な「または」を意味することが意図される。すなわち、別段の指定がない限り、または文脈から明らかでない限り、「XはAまたはBを採用する」という語句は、自然な包含的置換のうちのいずれかを意味することが意図される。すなわち、「Xは、AまたはBを用いる」という語句は、以下の例のうちのいずれかによって満たされる:XはAを用いる、XはBを用いる、または、XはAとBの両方を用いる。さらに、本出願および添付の特許請求の範囲で使用される冠詞「a」および「an」は、別途指定されない限り、または単数形を対象とすることが文脈から明らかでない限り、概して、「1つ以上」を意味すると解釈されるべきである。
【0024】
また、様々な要素を説明するために、本明細書では、第1、第2などの用語を使用するが、これらの要素は、これらの用語によって限定されるべきではないことも理解されたい。これらの用語は、ある要素と別の要素を区別するためにのみ使用される。例えば、第1のフィルタは、本開示の範囲から逸脱することなく、第2のフィルタと呼ぶことができ、同様に、第2のフィルタは、第1のフィルタと呼ぶことができる。第1のフィルタと第2のフィルタは両方ともフィルタであるが、同じフィルタではない。
【0025】
本明細書で使用される場合、「約」または「およそ」という用語は、当業者によって決定される特定の値に対する許容誤差の範囲内であることを意味し得、それは、部分的には、その値がどのように測定または決定されるか(例えば、測定システムの限界)に依存し得る。例えば、「約」は、当該技術分野における慣例に従って、標準偏差が1以内のまたは1超を意味し得る。「約」は、所与の値の±20%、±10%、±5%、または±1%の範囲を意味し得る。「約」または「およそ」という用語は、値が、1桁以内、5倍以内、または2倍以内であることを意味し得る。本出願および特許請求の範囲において特定の値が記載されている場合、別段の記載がない限り、特定の値について許容誤差の範囲内であることを意味する「約」という用語が想定されるべきである。「約」という用語は、当業者によって一般に理解される意味を有し得る。「約」という用語は、±10%を指し得る。「約」という用語は、±5%を指し得る。
【0026】
本明細書で使用される場合、用語「核酸」、「核酸分子」、および「ポリヌクレオチド」は、互換的に使用される。用語は、デオキシリボ核酸(DNA、例えば、相補的DNA(cDNA)、ゲノムDNA(gDNA)など)、リボ核酸(RNA、例えば、メッセンジャーRNA(mRNA)、低分子干渉RNA(siRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA、胎児もしくは胎盤によって高度に発現されるRNAなど)、ならびに/またはDNAもしくはRNA類似体(例えば、合成塩基類似体および/もしくは天然に存在する(エピジェネティック修飾された)塩基類似体、糖類似体、および/または非天然の骨格などを含む)、RNA/DNAハイブリッドおよびペプチド核酸(PNA)など、任意の組成物形態の核酸を指してもよく、これらはすべて、一本鎖形態または二本鎖形態であり得る。特に限定されない限り、核酸は、天然ヌクレオチドの既知の類似体を含むことができ、そのいくつかは、天然に存在するヌクレオチドと同様の様式で機能することができる。核酸は、本明細書に記載されるプロセス(例えば、直鎖、環状、スーパーコイル、一本鎖、二本鎖など)を行うために有用な任意の形態であり得る。場合によっては、核酸は、特定の実施形態では、プラスミド、ファージ、自律複製配列(ARS)、セントロメア、人工染色体、染色体、あるいは他の核酸(インビトロで、または宿主細胞、細胞、細胞核、もしくは細胞の細胞質で、複製し得るか、または複製され得る)であるか、またはそれ由来である。一部の実施形態では、核酸は、単一の染色体またはその断片(例えば、二倍体生物から得られた試料の1つの染色体からの核酸試料)に由来し得る。核酸分子は、完全長の天然ポリヌクレオチド(例えば、長鎖非コード(lnc)RNA、mRNA、染色体、ミトコンドリアDNA、またはポリヌクレオチド断片)を含むことができる。ポリヌクレオチド断片は、少なくとも200塩基長であり得るか、もしくは少なくとも数千ヌクレオチド長であり得るか、または、ゲノムDNAの場合、ポリヌクレオチド断片は、数百キロ塩基長~数メガ塩基長であり得る。
【0027】
特定の実施形態では、核酸は、ヌクレオソーム、ヌクレオソームの断片もしくは部分、またはヌクレオソーム様構造を含む。核酸は、タンパク質(例えば、ヒストン、DNA結合タンパク質など)を含むことがある。本明細書に記載されるプロセスによって分析される核酸は、時には、実質的に単離され、タンパク質または他の分子と実質的に会合していない。核酸には、一本鎖(「センス」または「アンチセンス」、「プラス」鎖または「マイナス」鎖、「フォワード」リーディングフレームまたは「リバース」リーディングフレーム)および二本鎖ポリヌクレオチドから合成、複製、または増幅されたRNAもしくはDNAの誘導体、バリアント、および類似体も含まれる。デオキシリボヌクレオチドには、デオキシアデノシン、デオキシシチジン、デオキシグアノシンおよびデオキシチミジンが含まれる。RNAの場合、塩基シトシンは、ウラシルで置き換えられ、糖の2’位はヒドロキシル部分を含む。一部の実施形態では、核酸は、対象から得られた核酸を鋳型として使用して調製される。
【0028】
本明細書で使用される場合、「末端位置(ending position)」または「末端位置(end position)」(または単に「末端(end)」)という用語は、最も外側の塩基、例えば、セルフリーDNA分子(例えば、プラスミドDNA分子)の端の塩基の、ゲノム座標、またはゲノム同一性、またはヌクレオチド同一性を指し得る。末端位置は、DNA分子のいずれかの末端に対応し得る。このようにして、一方が、DNA分子の開始および終末を指す場合、両方が末端位置に対応し得る。一部の実施形態では、1つの末端位置は、セルフリーDNA分子の一端上の最も外側の塩基のゲノム座標またはヌクレオチド同一性であり、これは、分析方法、例えば、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖DNA配列決定ライブラリ調製プロトコル、ポリメラーゼ連鎖反応(PCR)、またはマイクロアレイによって検出もしくは決定される。一部の実施形態では、そのようなインビトロ技術は、セルフリーDNA分子の真のインビボ物理的末端を変化させることができる。したがって、各検出可能な末端は、生物学的に真の末端を表し得るか、または末端は、元の末端から1つ以上のヌクレオチドを削減するか、または1つ以上のヌクレオチドを分子の伸長する(例えば、クレノウ断片による非平滑末端の二本鎖DNA分子のオーバーハングの5’平滑化および3’充填であり得る)。末端位置のゲノム同一性またはゲノム座標は、ヒト参照ゲノム(例えば、hg19)に対する配列リードの整列(alignment)の結果に由来し得る。これは、ヒトゲノムの元の座標を表すインデックスまたはコードのカタログから導出することができる。本発明は、これらに限定されないが、標的特異的プローブ、ミニ配列決定、DNA増幅によって読み取られる、セルフリーDNA分子上の位置またはヌクレオチド同一性を指し得る。「ゲノム位置」という用語は、ポリヌクレオチド(例えば、遺伝子、プラスミド、核酸断片、ウイルスDNA断片)のヌクレオチド位置を指し得る。「ゲノム位置」という用語は、ゲノム(例えば、配偶子もしくは微生物または多細胞生物の各細胞の染色体のハプロイドセット)のヌクレオチド位置に限定されない。
【0029】
本明細書で使用される場合、用語「変異」、「一塩基バリアント」、「一塩基多型」、「バリアント」、「エピジェネティック修飾」、および「構造再編成」は、1つ以上の細胞の遺伝物質における1つ以上の異なる種類の1つ以上の検出可能な変化を指す。特定の例では、1つ以上の変異を、がん細胞(例えば、ドライバー変異およびパッセンジャー変異)に見出し、識別することができる。変異は、親細胞から娘細胞に伝達され得る。当業者は、親細胞における遺伝子変異(例えば、ドライバー変異)が、娘細胞における追加の異なる変異(例えば、パッセンジャー変異)を誘導し得ることを理解するであろう。変異またはバリアントは、概して、核酸において生じる。特定の例では、変異は、1つ以上のデオキシリボ核酸またはその断片における検出可能な変化であり得る。変異は、概して、核酸内の新しい位置に付加、欠失、置換、反転、または転位されるヌクレオチドを指す。変異は、自然に発生する変異または実験的に誘発される変異であり得る。特定の組織の配列における変異は、「組織特異的アレル(allele)」の例である。例えば、腫瘍は、正常細胞では生じない遺伝子座におけるアレルをもたらす変異を有し得る。「組織特異的アレル」の別の例は、胎児組織に生じるが、母体組織には生じない胎児特異的アレルである。「アレル」という用語は、場合によっては、変異と互換的に使用され得る。
【0030】
「一過的な結合(transient binding)」という用語は、結合試薬またはプローブが、ポリヌクレオチド上の結合部位に可逆的に結合し、通常、プローブがその結合部位に結合したままではないことを意味する。これは、分析の過程における結合部位の場所に関する有用な情報を提供する。典型的には、1つの試薬またはプローブが、固定化ポリマーに結合し、次いで、しばらく滞留した後、ポリマーから脱離する。次いで、同じまたは別の試薬またはプローブは、別の部位でポリマーに結合し得る。一部の実施形態では、ポリマーに沿った複数の結合部位は、複数の試薬またはプローブによって同時に結合され得る。場合によっては、異なるプローブは、重複する結合部位に結合する。ポリマーに可逆的に結合する試薬またはプローブのこのプロセスは、分析の過程で何度も繰り返され得る。かかる結合事象の場所、頻度、滞留時間、光子放出は、最終的に、ポリマーの化学構造のマップをもたらす。実際、これらの結合事象の一過的な性質により、かかる結合事象の数の増加を検出することができる。例えば、プローブが長期間にわたって結合したままである場合、各プローブは他のプローブの結合を阻害する。
【0031】
「反復結合(repetitive binding)」という用語は、ポリマーの同じ結合部位が、分析の過程で同じ結合試薬もしくはプローブ、または同じ種類の結合試薬もしくはプローブによって複数回結合されることを意味する。典型的には、ポリマーのマップが開発されるまで、1つの試薬がある部位に結合し、次いで解離し、別の試薬が結合し、次いで解離するなどである。反復結合は、プローブから得られる情報の感度および正確度を高める。より多くの光子が蓄積されると、複数の独立した結合事象は、実際のシグナルが検出される確率を増加させる。一度だけ検出されたときに、シグナルが低すぎて、バックグラウンドノイズを超えて呼び出すことができない場合、感度が増加する。このような場合、シグナルが、持続的に見られるときに呼び出し可能になる(例えば、同じシグナルが複数回見られる場合、シグナルが実際に増加しているという信頼度が増加する)。情報の複数の読み取りにより、ある読み取りが別の読み取りで確認されるため、結合部位の呼び出しの正確度が高まる。
【0032】
本明細書で使用される場合、「プローブ」という用語は、オリゴヌクレオチドを含むことができ、結合された蛍光標識であり得る1つ以上の任意選択的な標識を有する。一部の実施形態では、プローブは、任意選択的に、蛍光色素または蛍光または光散乱粒子で標識されたペプチドまたはポリペプチドである。これらのプローブは、核酸またはタンパク質、炭水化物、脂肪酸または他の生体分子もしくは非生体ポリマーへの結合部位の局在を決定するために使用することができる。
【0033】
本明細書で使用される場合、「オリゴヌクレオチドプローブ種(oligonucleotide probe species)」という用語は、プローブとして使用される1つ以上の異なるオリゴヌクレオチドを含むことができる。オリゴヌクレオチドの配列の一部分は、オリゴヌクレオチドプローブ種のすべてのメンバーに共通であり、他の部分、特に、共通配列に隣接する塩基は、縮重的または普遍的であり、したがって、オリゴヌクレオチドプローブ種の複数のメンバーがもたらされ得る。場合によっては、「オリゴヌクレオチドプローブ種」という用語は、個々のオリゴヌクレオチドプローブなどの単一種のメンバーを示し得る。他の場合、この用語は、複数種のすべてのメンバーを示し得る。オリゴヌクレオチドプローブ種は、標識が提供される場合、すべて共通の標識を有する。本明細書で使用される場合、「オリゴヌクレオチド種のセット」という用語は、異なる共通配列を有する複数のオリゴヌクレオチド種を意味する。
【0034】
本明細書で使用される場合、「オリゴヌクレオチド種の完全なセット」という用語は、配列決定方法で使用されるすべてのオリゴヌクレオチド種を意味する。オリゴヌクレオチドの完全なセットの異なるメンバーは、同じ長さのk塩基長を有するか、または異なる長さのk塩基長を有する。オリゴヌクレオチドプローブ種の完全なセットは、単一の長さのk塩基長のすべてのk塩基長配列を含み得るか、またはそのサブセットを含み得る。
【0035】
本明細書で使用される場合、「配列プローブのタイリングセット(tiling set)」または「タイリングセット」という用語は、オリゴヌクレオチドプローブ種のセットを意味し、セットの2つを除くすべてのオリゴヌクレオチドプローブ種が、セットの2つの他のオリゴヌクレオチドプローブ種にも共通の1つを除くすべてのオリゴヌクレオチドプローブ種共通の塩基を有し、対応する異なる塩基が、オリゴヌクレオチドプローブ種共通の配列の各末端にある。タイリングセットの2つのメンバーは、1つを除くすべてのオリゴヌクレオチドプローブ種共通の塩基で、また1つの他のオリゴヌクレオチドプローブ種とも共通の塩基を有するオリゴヌクレオチドプローブ種を有し、異なる塩基は、それぞれの3’末端および5’末端にあり、すべて重複するオリゴのセットを完成させる。
【0036】
本明細書で使用される場合、用語「オリゴヌクレオチド」および「オリゴ」は、短い核酸配列を意味する。一部の実施形態では、オリゴは、定義されたサイズのものであり、例えば、各オリゴは、長さがkヌクレオチド塩基である(本明細書において「k塩基長(k-mer)」とも称される)。典型的なオリゴのサイズは、3塩基長、4塩基長、5塩基長、6塩基長などである。オリゴは、本明細書では、N塩基長とも称され得る。
【0037】
本明細書で使用される場合、「標識(label)」という用語は、単一の検出可能な実体(例えば、波長放出実体)または複数の検出可能な実体を包含する。一部の実施形態では、標識は、核酸に一過的に結合するか、またはプローブに共有結合もしくは非共有結合のいずれかで結合される。蛍光発光中に異なる種類の標識が点滅し、光子放出が変動し、または光スイッチがオンもしくはオフし得る。異なる標識は、異なる撮像方法に使用される。特に、一部の標識は、異なる種類の蛍光顕微鏡に固有に適している。一部の実施形態では、蛍光標識は、異なる波長で蛍光を発し、また異なる寿命を有する。一部の実施形態では、バックグラウンド蛍光が、撮像場に存在する。一部のかかる実施形態では、そのようなバックグラウンドは、散乱またはバックグラウンド蛍光による蛍光の時間枠を拒絶することによって分析から除去される。標識がプローブの一端(例えば、オリゴプローブの3’末端)にある場合、位置決定の正確度は、プローブのその末端(例えば、プローブ配列の3’末端および標的配列の5’末端)に対応する。標識の明らかな一過性、変動性、または点滅、または暗化の挙動は、付着したプローブがその結合部位に結合し、解離しているかどうかを区別することができる。
【0038】
本明細書で使用される場合、「フラップ(flap)」という用語は、第2の実体の結合のための受容体として機能する実体を指す。2つの実体は、分子結合対を含み得る。かかる結合対は、核酸結合対を含み得る。一部の実施形態では、フラップは、標識されたオリゴヌクレオチドに結合する一連のオリゴヌクレオチドまたはポリヌクレオチド配列を含む。フラップとオリゴヌクレオチドとの間のかかる結合は、標的に結合するプローブの一部の一過的な結合を撮像するプロセスの過程で実質的に安定でなければならない。
【0039】
用語「伸長された(elongated)」、「拡張された(extended)」、「伸展された(stretched)」、「線状化された(linearized)」、および「直線化された(straightened)」は、互換的に使用され得る。特に、用語「伸長ポリヌクレオチド」(または「拡張されたポリヌクレオチド」など)は、何らかの方法で表面またはマトリックスに付着させた後、線状に伸展された核酸分子を示す。一般に、これらの用語は、ポリヌクレオチドに沿った結合部位が、それらの間のいくつかのヌクレオチドと多少相関する物理的距離によって分離されていることを意味する(例えば、ポリヌクレオチドは直線状である)。物理的距離がいくつかの塩基と一致する程度の幾分の不確かさは、許容され得る。
【0040】
本明細書で使用される「撮像」という用語は、二次元アレイおよび二次元走査検出器の両方を含む。ほとんどの場合、本明細書で使用される撮像技術は、必然的に、蛍光励起源(例えば、適切な波長のレーザ)および蛍光検出器を含む。
【0041】
本明細書で使用される場合、「配列ビット(sequence bit)」という用語は、配列の1つまたはいくつかの塩基(例えば、1~9塩基長)を示す。特に、一部の実施形態では、配列は、一過的な結合に使用されるオリゴ(またはペプチド)の長さに対応する。したがって、かかる実施形態では、配列は、標的ポリヌクレオチドの領域を指す。
【0042】
本明細書で使用される場合、「ハプロタイプ」という用語は、典型的には、ともに遺伝する一連のバリエーションを指す。これは、バリエーションのセットが、ポリヌクレオチドまたは染色体上に近接して存在するために生じる。場合によっては、ハプロタイプは、1つ以上の一塩基多型(SNP)を含む。場合によっては、ハプロタイプは、1つ以上のアレルを含む。
【0043】
本明細書で使用される場合、「メチル結合タンパク質」という用語は、約70個のヌクレオチド残基を含むメチルCpG結合ドメインを含むタンパク質を指す。かかるドメインは、DNAの非メチル化領域に対する親和性が低く、したがって、メチル化された核酸の場所を識別するために使用することができる。いくつかの一般的なメチル結合タンパク質としては、MeCP2、MBD1、およびMBD2が挙げられる。しかし、メチルCpG結合ドメインを含む様々な異なるタンパク質がある(例えば、Roloff et al.,BMC Genomics 4:1,2003に記載されているもの)。同様に、他の種類の抗体を使用して、メチルアデニンなどの他の種類のエピジェネティック修飾に結合する。
【0044】
本明細書で使用される場合、「ナノボディ」という用語は、重鎖のみの抗体断片を含むタンパク質のセットを指す。これらは、非常に安定したタンパク質であり、様々なヒト抗体に類似する配列相同性を有するように設計することができ、したがって、体内の細胞型もしくは領域、または天然に存在する特定の種類のエピジェネティック修飾核酸塩基への特異的標的化を可能にする。ナノボディ生物学の概説は、Bannas et al.,Frontiers in Immu.8:1603,2017に見出すことができる。
【0045】
本明細書で使用される場合、「アフィマー(affimer)」という用語は、非抗体結合タンパク質を指す。これらは、高度にカスタマイズ可能なタンパク質であり、2つのペプチドループと、一部の実施形態では、所望のタンパク質標的に対する親和性および特異性を提供するようにランダム化されたN末端配列と、を有する。したがって、一部の実施形態では、アフィマーを使用して、タンパク質の目的の配列または構造領域を識別する。一部のかかる実施形態では、アフィマーは、多くの異なる種類のタンパク質発現、局在、および相互作用を識別するために使用される(例えば、Tiede et al.,ELife 6:e24903,2017に記載されている)。
【0046】
本明細書で使用される場合、「アプタマー」という用語は、汎用性が高く、カスタマイズ可能な結合分子の別のカテゴリーを指す。アプタマーは、ヌクレオチド領域および/またはペプチド領域を含む。考えられるアプタマー配列のランダムなセットを生成し、次いで、目的の特定の標的分子に結合する所望の配列を選択するのが典型的である。アプタマーは、それらの安定性および柔軟性を超えた追加の特徴を有し、他のカテゴリーの結合タンパク質よりも望ましいものになっている。(例えば、Song et al.,Sensors 12:612-631,2012およびDunn et al.,Nat.Rev.Chem.1:0076,2017に記載されている)。
【0047】
説明のために例示的な用途を参照して、いくつかの態様を以下に記載する。本明細書に記載の特徴の完全な理解を提供するために、多数の特定の詳細、関係、および方法が示されていることを理解されたい。しかしながら、本明細書に記載の特徴は、1つ以上の特定の詳細を用いることなく、または他の方法を用いて実施され得ることは、関連技術分野の当業者には理解されよう。本明細書で説明される特徴は、例示される行為または事象の順序によって限定されず、いくつかの行為は、他の行為または事象とは異なる順序で、かつ/またはそれと同時に生じ得る。さらに、例示される行為または事象のすべてが、本明細書に記載される特徴に従って方法を実行するために必要であるとは限らない。
【0048】
例示的なシステムの実施形態。
一態様では、標的核酸を配列決定する方法が、本明細書に開示される。本方法は、(a)標的核酸を、試験基板上に二本鎖線状化伸展形態で固定し、それによって、固定伸展二本鎖核酸を形成することを含み得る。本方法は、(b)固定伸展二本鎖核酸を、試験基板上で一本鎖形態に変性させ、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得ることをさらに含み得、固定された第2の鎖のそれぞれの塩基は、固定された第1の鎖の対応する相補塩基に隣接または近接していてもよい。本方法は、(c)固定された第1の鎖および固定された第2の鎖を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することをさらに含み得、オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の配列および長さである。曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の各部分と結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ得る。それによって、光学活性のそれぞれの事例を生じ得る。本方法は、(d)1つ以上の二次元撮像デバイスを使用して、試験基板上の場所を測定すること、および、任意選択的に、曝露(c)中に生じる光学活性の各それぞれの事例の持続時間を測定すること、により継続し得る。次いで、本方法は、(e)オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種のそれぞれのプールに対して、曝露(c)および測定(d)を反復することによって進行し、それによって、試験基板上の複数の位置のセットを得ることができる。試験基板上のそれぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットの1つ以上のオリゴヌクレオチドプローブ種に対応し得る。それに関連する複数の標識の使用の結果として、連続的および/または同時に、複数の異なるオリゴヌクレオチドプローブ種が測定される場合、曝露(c)の単一のステップから、試験基板上の複数の位置のセットが得られる。本方法は、(f)異なるまたは異なるセットのオリゴヌクレオチドプローブ種に対応する複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから標的核酸の少なくとも一部分の配列を決定することをさらに含み得る。
【0049】
一部の実施形態では、曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブ種が、個々のオリゴヌクレオチドプローブに相補的である固定された第1の鎖または固定された第2の鎖の各部分と一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性の事例を生じさせる。一部の実施形態では、曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブ種が、個々のプローブに相補的である固定された第1の鎖または固定された第2の鎖の各部分と反復して一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を反復して生じさせる。一部のかかる実施形態では、各オリゴヌクレオチドプローブは、オリゴヌクレオチド種のプールにおいて、オリゴヌクレオチドプローブ種のセットにおいて、標識(例えば、色素、蛍光ナノ粒子、または光散乱粒子)に結合される。
【0050】
一部の実施形態では、ある方法では、曝露は、挿入色素の形態の第1の標識の存在下で行われる。一部の実施形態では、各オリゴヌクレオチドプローブは、オリゴヌクレオチド種のプールにおいて、第2の標識に結合しているオリゴヌクレオチドプローブ種のセットにおいて、第1の標識および第2の標識は、第1の標識および第2の標識が互いに近接している場合、第1の標識蛍光および第2の標識蛍光のうちの1つを増加させる重複するドナー発光スペクトルおよびアクセプター励起スペクトルを有し、光学活性のそれぞれの事例は、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入される挿入色素(intercalating dye)の、オリゴヌクレオチドプローブに結合している第2の標識への近接に由来する。他の実施形態では、第1の標識および第2の標識の両方が、オリゴヌクレオチドプローブに結合している。
【0051】
一部の実施形態では、曝露は、挿入色素の形態の第1の標識の存在下にあり、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識に結合しており、第1の標識は、第1の標識および第2の標識が互いに近接している場合、第2の標識の蛍光を増加し得、光学活性のそれぞれの事例は、挿入色素の近接から、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に第2の標識を挿入する。
【0052】
一部の実施形態では、曝露は、挿入色素の形態の第1の標識の存在下にあり、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識に結合しており、第2の標識は、第1の標識および第2の標識が互いに近接している場合、第1の標識の蛍光を増加させ、光学活性のそれぞれの事例は、挿入色素の近接から、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に第2の標識を挿入する。
【0053】
一部の実施形態では、曝露は、挿入色素の存在下にあり、光学活性のそれぞれの事例は、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入されている挿入色素の蛍光に由来する。かかる実施形態では、光学活性のそれぞれの事例は、それぞれの二重鎖に挿入される前の挿入色素の蛍光よりも大きい。
【0054】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの2つ以上のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、固定された第1の鎖および固定された第2の鎖に曝露されるオリゴヌクレオチドプローブ種のセットの各異なるオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、異なる標識と関連付けられる。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種の第1のプール、第1の標識と関連付けられた第1のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第2のオリゴヌクレオチドプローブ種の第2のプール、第2の標識と関連付けられた第2のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、第1の標識および第2の標識は異なる。代替的に、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種の第1のプール、第1の標識と関連付けられた第1のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第2のオリゴヌクレオチドプローブ種の第2のプール、第2の標識と関連付けられた第2のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第3のオリゴヌクレオチドプローブ種の第3のプール、第3の標識と関連付けられた第3のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、第1の標識、第2の標識、および第3の標識は、各々異なる。
【0055】
他の実施形態では、励起、放出、蛍光寿命などによって区別される任意の数の異なる標識を、オリゴヌクレオチドプローブ種の関連するプールとともに使用する。
【0056】
一部の実施形態では、オリゴヌクレオチドプローブ種のプールは、単一のオリゴヌクレオチドプローブ種を含む。他の実施形態では、オリゴヌクレオチドプローブ種のプールは、複数のオリゴヌクレオチドプローブ種を含む。さらなる実施形態では、複数のオリゴヌクレオチドプローブ種のプールは、複数のオリゴヌクレオチドプローブ種のプールの各単一のオリゴヌクレオチドプローブ種と関連付けられた(結合している)区別用の標識を有する。さらなる実施形態では、複数の異なるオリゴヌクレオチドプローブ種のセットの一部またはすべては、複数のオリゴヌクレオチドプローブ種のプールの他のオリゴヌクレオチドプローブ種とは直接区別可能ではない同じ種類の標識を有する。またさらなる実施形態では、複数のオリゴヌクレオチドプローブ種のプールの1つ以上のオリゴヌクレオチドプローブ種は、標識されていない。
【0057】
一部の実施形態では、(e)オリゴヌクレオチドプローブ種のセットの各単一のオリゴヌクレオチドプローブ種に対して、曝露(c)および測定(d)を繰り返す。
【0058】
一部の実施形態では、曝露(c)および測定(d)および反復は、順次行われる。他の実施形態では、曝露(c)および測定(d)は同時に行われ、曝露(c)プロセス中に単一のフレームが得られたらすぐに、測定(d)が開始される。さらなる実施形態では、複数の曝露(c)プロセスが、例えば、測定(d)プロセスを行う前に、異なるプールのオリゴヌクレオチドプローブを用いて、行われる。
【0059】
一部の実施形態では、曝露(c)は、単一種を含むか、またはオリゴヌクレオチドプローブのセットの複数のオリゴヌクレオチドプローブ種を含むオリゴヌクレオチドプローブ種の第1のプールに対して、第1の温度で行われ、反復(e)、曝露(c)、および測定(d)は、オリゴヌクレオチドプローブ種の第1のプールに対して、曝露(c)および測定(d)を第2の温度で行うことを含む。
【0060】
一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種の第1のプールに対して、第1の温度で行われ、反復(e)、曝露(c)、および測定(d)の事例は、オリゴヌクレオチドプローブ種の第1のプールに対して、曝露(c)および測定(d)を複数の異なる各温度で行うことを含み、第1の温度および複数の異なる各温度での測定(d)によって記録された光学活性の測定場所および持続時間を使用して、オリゴヌクレオチドプローブ種の第1のプールについての融解曲線を構築することをさらに含む。他の実施形態では、異なる温度の代わりに、異なる塩濃度が使用される。追加の実施形態では、ホルムアミドなどの変性試薬またはpHの変化を使用して、結合親和性を変化させる。さらなる実施形態では、異なる塩濃度、異なる温度、異なるpHレベル、または異なるレベルの変性試薬の任意の組み合わせを、1つ以上のオリゴヌクレオチドプローブ種に対して利用して、融解曲線当量を実現する。
【0061】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットは、複数の異なる種類のオリゴヌクレオチドプローブ種のプールを含む複数のサブセットを含み、オリゴヌクレオチドプローブ種の複数のサブセットの複数の異なる種類のオリゴヌクレオチドプローブ種を含むプールの各それぞれのサブセットに対して、反復(e)、曝露(c)、および測定(d)が行われる。一部のかかる実施形態では、各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の2つ以上の異なるオリゴヌクレオチドプローブ種を含む複数の異なる種類のオリゴヌクレオチドプローブ種のプールを含む。代替的に、複数の異なるオリゴヌクレオチドプローブ種のプールを含む各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の4つ以上の異なるオリゴヌクレオチドプローブ種を含む。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットは、オリゴヌクレオチドプローブ種のプールを含む4つのサブセットからなる。一部の実施形態では、本方法は、オリゴヌクレオチドプローブ種のセットを、各オリゴヌクレオチドプローブ種の計算されたまたは実験的に導出された融解温度に基づいて、オリゴヌクレオチドプローブ種のプールを含む複数のサブセットに分割することをさらに含み、同様の融解温度を有するオリゴヌクレオチドプローブ種は、分割によってオリゴヌクレオチドプローブの同じサブセットに配置され、曝露(c)の事例の温度または持続時間は、オリゴヌクレオチドプローブ種のプールを含む対応するサブセットのオリゴヌクレオチドプローブ種の平均融解温度によって決定される。またさらに、一部の実施形態では、本方法は、オリゴヌクレオチドプローブのセットを、各オリゴヌクレオチドプローブ種の配列に基づいて、オリゴヌクレオチドプローブ種のプールを含む複数のサブセットに分割することをさらに含み、配列が重複するオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種のプールを含む異なるサブセットに配置される。
【0062】
一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって得られたデータのフレーム内の光学活性のそれぞれの事例の中心または光学活性のそれぞれの事例の一部分を識別および適合させるための適合関数を用いて、光学活性のそれぞれの事例を識別および適合させることを含み、光学活性のそれぞれの事例の中心は、試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部のかかる実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。
【0063】
一部の実施形態では、光学活性のそれぞれの事例は、二次元撮像デバイスによって測定される複数のフレームにわたって持続し、光学活性のそれぞれの事例を含む複数のフレーム中の単一のフレームは、光学活性のそれぞれの事例の一部分であり、試験基板上の場所を測定することは、複数のフレームにわたる光学活性のそれぞれの事例の中心を識別するために、複数のフレームにわたる適合関数を用いて光学活性のそれぞれの事例を識別および適合させることを含み、光学活性のそれぞれの事例の中心は、複数のフレームにわたる試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部のかかる実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。
【0064】
一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって測定されるデータのフレームを、訓練された畳み込みニューラルネットワークに入力することを含み、データのフレームは、光学活性の複数の事例の中の光学活性のそれぞれの事例を含み、複数の光学活性の事例の中の光学活性の各事例は、固定された第1の鎖または固定された第2の鎖の一部分に結合するオリゴヌクレオチド種の個々のオリゴヌクレオチドプローブに対応し、入力に応答して、訓練された畳み込みニューラルネットワークは、光学活性の複数の事例の中の光学活性の1つ以上の事例の各々の試験基板上の位置を識別する。一部の実施形態では、光学活性の複数の事例は、データの1つ以上のフレーム内の異なる位置に存在し、光学活性の複数の異なる位置は、その各々が、曝露ステップにおける光学活性の複数の事例を有し、1つ以上の標的ポリヌクレオチドの第1の鎖および/または第2の鎖上の異なる結合部位に対応する。さらなる実施形態では、同じ位置を有する光学活性のそれぞれの事例は、異なるフレームのセットにわたって生じ、異なる位置を有するそれぞれの光学活性の他の事例と、異なるフレームのセットにわたって、別々におよび/または同時に処理される。
【0065】
一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも20nm、少なくとも2nm、少なくとも60nm、または少なくとも6nmの位置決定精度で解像する。
【0066】
一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に解像し、位置は、サブ回折限界の正確度および/または精度で決定される。
【0067】
一部の実施形態では、(d)試験基板上の場所およびそれぞれの光学活性の持続時間を測定することは、場所における5,000超の光子、場所における50,000超の光子、または場所における200,000超の光子を測定する。一部の実施形態では、測定(d)に使用される光子の数は、単一のフレームから得られるか、または光学活性の単一の事例を含むとみなされるフレームの組み合わせから得られる。
【0068】
一部の実施形態では、光学活性のそれぞれの事例は、試験基板について観察される背景光学活性に比べて、所定の数の標準偏差(例えば、3、4、5、6、7、8、9、または10標準偏差を超える)よりも大きい。
【0069】
一部の実施形態では、複数のオリゴヌクレオチドプローブ種のセットまたはサブセットの各それぞれのオリゴヌクレオチドプローブ種は、固有のN塩基長配列を含み、ここで、Nは、セット{1、2、3、4、5、6、7、8、および9}の中の整数であり、長さNのすべての固有のN塩基長配列は、複数のオリゴヌクレオチドプローブ種を含むセットまたはサブセットによって表される。一部のかかる実施形態では、固有のN塩基長配列は、1つ以上の縮重ヌクレオチド、および1つ以上の普遍的な塩基(例えば、2’-デオキシイノシン、CPG500、5-ニトロインドール)によって占有される1つ以上のヌクレオチド位置を含む。一部のかかる実施形態では、固有のN塩基長配列は、5’で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接し、3’で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、70%超の割合の標的核酸の配列を決定する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、90%超の割合の標的核酸の配列を決定する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、99%超の割合の標的核酸の配列を決定する。一部の実施形態では、決定(f)は、99%超の割合の標的核酸の配列を決定する。
【0070】
一部の実施形態では、標的核酸は、少なくとも10,000塩基長であるか、または少なくとも1,000,000塩基長である。
【0071】
一部の実施形態では、試験基板は、曝露(c)および測定(d)を反復する前に洗浄され、それによって、試験基板をオリゴヌクレオチドプローブ種のセットにおける1つ以上のオリゴヌクレオチドプローブ種に曝露する前に、1つ以上のオリゴヌクレオチドプローブ種を試験基板から除去する。
【0072】
一部の実施形態では、固定(a)は、分子コーミング(molecular combing)(後退メニスカス)、フロー伸展(flow stretching)、ナノ束縛(nanoconfinement)、または電気伸展(electro-stretching)によって、核酸を、試験基板に適用することを含む。
【0073】
一部の実施形態では、光学活性の各それぞれの事例は、所定の閾値を満たす観測メトリックを有する。一部のかかる実施形態では、観測メトリックは、持続時間、シグナル・ノイズ比、光子計数、または強度を含む。一部の実施形態では、所定の閾値は、(i)固有のN塩基長配列の各塩基または各非縮重塩基および/もしくは非普遍的塩基が、標的核酸の固定された第1の鎖または固定された第2の鎖の相補塩基に結合する、第1の結合形態と、(ii)固有のN塩基長配列の塩基または各非縮重塩基および/もしくは非普遍的塩基と、それぞれのオリゴヌクレオチドプローブが光学活性のそれぞれの事例を形成するように結合している標的核酸の固定された第1の鎖または固定された第2の鎖の配列との間に、少なくとも1つの不一致が存在する、第2の結合形態と、を区別する。
【0074】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種は、固有の対応する所定の閾値を有する。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来し、訓練セットは、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種について、それぞれのオリゴヌクレオチドプローブ種の固有のN塩基長配列の各塩基または各非縮重塩基および/もしくは非普遍的塩基が参照配列の相補塩基に結合するように参照配列に結合した際の、それぞれのオリゴヌクレオチドプローブについての観察メトリックの尺度を含む。一部のかかる実施形態では、参照配列は、参照基板上に固定される。代替的に、参照配列は、標的核酸とともに含まれ、標的核酸から分離されるか、またはそれにライゲーションされ、試験基板上に固定される。一部の実施形態では、参照配列は、PhiX174、M13、ラムダファージ、T7ファージ、大腸菌(Escherichia coli)、酵母(Saccharomyces cerevisiae)、分裂酵母(Saccharomyces pombe)、または任意の他の天然に存在するゲノムもしくはトランスクリプトームのゲノムのすべてまたは一部分を含む。一部の実施形態では、参照配列は、既知の配列の合成構築物である。一部の実施形態では、参照配列は、ウサギグロビンRNAのすべてまたは一部分を含む。
【0075】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、固定された第1の鎖の相補部分に結合することによって、光学活性の第1の事例を生じ、固定された第2の鎖の相補部分に結合することによって、光学活性の第2の事例を生じる。
【0076】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、固定された第1の鎖の2つ以上の相補部分に結合することによって、試験基板上の異なる位置での光学活性の2つ以上の事例を生じさせ、および/または固定された第2の鎖の2つ以上の相補部分に結合することによって、試験基板上の異なる位置での光学活性の2つ以上の第2の事例を生じさせる。
【0077】
一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露(c)中、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、同じ位置で2回以上結合し、それによって、2つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。
【0078】
一部の実施形態では、それぞれのオリゴヌクレオチドプローブは、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、複数の位置で結合し、各位置で複数回結合し、曝露(c)中、光学活性の各位置で、光学活性の複数の事例を潜在的に生成し、光学活性の各事例は、複数の結合事象の結合事象を表す。
【0079】
一部の実施形態では、曝露(c)は、5分間以上、5分間以下、2分間以下、または1分間以下で生じる。
【0080】
一部の実施形態では、曝露(c)は、二次元撮像デバイスの1つ以上のフレーム、二次元撮像デバイスの2つ以上のフレーム、二次元撮像デバイスの500個以上のフレーム、または二次元撮像デバイスの5,000個以上のフレームにわたって生じる。
【0081】
一部の実施形態では、複数の二次元撮像デバイスが、同時および/または順次のいずれかで利用され、複数の二次元撮像デバイスの各々は、特定の種類の標識を検出するように最適化され、それによって、複数の異なるオリゴヌクレオチドプローブ種と関連付けられた複数の標識のデータの同時収集を可能にする。
【0082】
一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の期間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、第2の期間曝露(c)を行うことを含み、第1の期間は、第2の期間とは異なる。
【0083】
一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第1の数のフレーム間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第2の数のフレーム間曝露(c)を行うことを含み、第1の数のフレームは、第2の数のフレームとは異なる。
【0084】
一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第1の数のフレーム間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第2の数のフレーム間曝露(c)を行うことを含み、第1の数のフレームの各フレームの曝露時間は、第2の数のフレームの各フレームの曝露時間とは異なる。
【0085】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さである。
【0086】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さMであり、Mは、2以上の正の整数であり(例えば、Mは、2、3、4、5、6、7、8、9、10、または10以上)、(f)試験基板上の複数の位置のセットからの標的核酸の少なくとも一部分の配列を決定することは、複数の位置のセットによって表される異なるオリゴヌクレオチドプローブ種の重複配列をさらに使用する。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種のセットの別のオリゴヌクレオチドプローブと、M-1個の配列相同性を共有する。一部のかかる実施形態では、試験基板上の複数の位置のセットからの標的核酸の少なくとも一部分の配列を決定することは、固定された第1の鎖に対応する第1のタイリング経路および固定された第2の鎖に対応する第2のタイリング経路を決定することを含む。一部のかかる実施形態では、第1のタイリング経路における切れ目(break)は、第2のタイリング経路の対応する部分を使用して解決され、第2のタイリング経路は、第1のタイリング経路に相補的である。他の実施形態では、第1のタイリング経路または第2のタイリング経路における切れ目は、参照配列を使用して解決される。他の実施形態では、第1のタイリング経路または第2のタイリング経路の切れ目は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して解決される。一部のかかる実施形態では、標的核酸配列の配列割当の信頼度は、第1のタイリング経路および第2のタイリング経路の対応する部分を使用して増加する。他の実施形態では、標的核酸配列の配列割当の信頼度は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して増加する。
【0087】
一部の実施形態では、曝露(c)の事例の時間の長さは、曝露(c)の事例で使用されたオリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種の推定融解温度によって決定される。
【0088】
一部の実施形態では、本方法は、(f)固定された二本鎖または固定された第1の鎖および固定された第2の鎖を、抗体、アフィマー、ナノボディ、アプタマー、またはメチル結合タンパク質に曝露することをさらに含み、それによって、標的核酸への修飾を決定するか、または試験基板上の複数の位置のセットからの標的核酸の一部分の配列と相関させる。一部の実施形態では、本方法は、標的核酸の一部分を含み得る様々なエピジェネティック修飾の決定を可能にし得る。
【0089】
一部の実施形態では、試験基板は、二次元表面を含み得る。一部のかかる実施形態では、二次元表面は、ゲルまたはマトリックスでコーティングされている。
【0090】
一部の実施形態では、試験基板は、フローセル、セル、三次元マトリックス、またはゲルを含み得る。
【0091】
一部の実施形態では、試験基板は、固定(a)の前に、配列特異的オリゴヌクレオチドプローブ種と結合され、固定(a)は、試験基板に結合した配列特異的オリゴヌクレオチドプローブ種を使用して、試験基板上で標的核酸を捕捉することを含み得る。
【0092】
一部の実施形態では、配列特異的オリゴヌクレオチドプローブ種は、試験基板の表面に結合し、天然オリゴヌクレオチド塩基よりも高い融解温度を有し、標的核酸の変性を可能にし得る、PNA塩基および/またはLNA塩基などの塩基を含んでいてもよい。一部の実施形態では、複数の異なる配列特異的オリゴヌクレオチドプローブ種は、相補的であり、それによって、標的核酸の第1の鎖および第2の鎖の結合が可能になり、これにより、各単一の標的核酸から、標的核酸の塩基をより高い割合で決定することが可能になり得る。
【0093】
一部の実施形態では、核酸は、追加の複数の細胞成分を含む溶液中に存在し、固定(a)または変性(b)は、標的核酸が試験基板に固定された後、および曝露(c)の前に、試験基板を洗浄することをさらに含んでもよく、それによって、標的核酸から遊離した追加の複数の細胞成分を精製する。
【0094】
一部の実施形態では、試験基板は、曝露(c)の前に、ポリエチレングリコール、ウシ血清アルブミン-ビオチン-ストレプトアビジン、カゼイン、ウシ血清アルブミン(BSA)、1つ以上の異なるtRNA、1つ以上の異なるデオキシリボヌクレオチド、1つ以上の異なるリボヌクレオチド、サケ精子DNA、プルロニックF-127、Tween-20、水素シルセスキオキサン(HSQ)、またはそれらの任意の組み合わせで不動態化(passivated)される。
【0095】
一部の実施形態では、試験基板は、固定(a)の前に、7-オクテニルトリクロロシランまたはメタクリルオキシプロピルトリメトキシシランを含むビニルシランコーティングでコーティングされる。
【0096】
本開示の別の態様は、核酸を配列決定する方法を提供し、(a)標的核酸を、試験基板上で線状化され伸展された形態で固定し、それによって、固定伸展標的核酸を形成することと、(b)固定伸展標的核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することであって、オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の配列および長さであり、曝露(b)を、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定標的核酸の各部分に一時的かつ可逆的に可能にする条件下で行い、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、(c)二次元撮像デバイスを使用して、試験基板上の場所を測定することと、および、任意選択的に、曝露(b)中に生じる光学活性の各それぞれの事例の持続時間を測定することと、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することであって、試験基板上の各それぞれの位置のセットが、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応し得る、取得することと、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから、標的核酸の少なくとも一部分の配列を決定することであって、位置のセットが、試験基板上の異なる位置および/または同じ位置における光学活性の場所を含み得る、決定することと、を含む。一部のかかる実施形態では、標的核酸は、二本鎖核酸であり、本方法は、試験基板上で、標的固定二本鎖核酸を一本鎖形態に変性させ、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得ることをさらに含み得、固定された第2の鎖は、固定された第1の鎖に相補的である。一部の実施形態では、標的核酸は、一本鎖RNAである。
【0097】
本開示の別の態様は、核酸を分析する方法を提供し、(a)二本鎖形態の標的核酸を、試験基板上で固定し、それによって、固定二本鎖核酸を形成することと、(b)標的固定二本鎖核酸を、試験基板上で一本鎖形態に変性させることであって、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得、固定された第2の鎖が、固定された第1の鎖に相補的である、変性させることと、(c)固定された第1の鎖および固定された第2の鎖を、1つ以上のオリゴヌクレオチドプローブ種に曝露し、1つ以上のオリゴヌクレオチドプローブ種が、固定された第1の鎖または固定された第2の鎖に結合するかどうかを決定することと、を含み得る。
【0098】
ここで、例示的なシステムの詳細を、
図1Aと併せて説明する。
図1Aは、一部の実施態様によるシステム100を示すブロック図である。一部の実施態様では、デバイス100は、1つ以上の処理ユニット(CPU)102(プロセッサまたは処理コアとも称される)、1つ以上のネットワークインターフェース104、ユーザーインターフェース106、非永続的メモリ111、永続的メモリ112、およびこれらの構成要素を相互接続するための1つ以上の通信バス114を含み得る。1つ以上の通信バス114は、任意選択的に、システム構成要素間の通信を相互接続および制御する回路(チップセットと呼ばれることもある)を含む。非永続的メモリ111は、典型的には、DRAM、SRAM、DDR RAMなどの高速ランダムアクセスメモリを含むが、永続的メモリ112は、典型的には、CD-ROM、デジタル多用途ディスク(DVD)または他の光学記憶デバイス、磁気カセット、磁気テープ、磁気ディスク記憶デバイスまたは他の磁気記憶デバイス、磁気ディスク記憶デバイス、光学ディスク記憶デバイス、ROM、EEPROM、フラッシュメモリデバイス、または他の不揮発性固体記憶デバイスを含む。永続的メモリ112は、任意選択的に、CPU102から遠隔的に位置する1つ以上の記憶デバイスを含む。永続的メモリ112は、非一時的コンピュータ可読記憶媒体を含む。一部の実施態様では、非永続的メモリ111、または代替的に、非一時的コンピュータ可読記憶媒体は、時に、永続的メモリ112と併せて、以下のプログラム、モジュール、およびデータ構造、またはそのサブセットを記憶し得る:
●様々な基本システムサービスを扱い、ハードウェア依存タスクを行うためのプロシージャを含み得る、任意選択的なオペレーティングシステム116、
●システム100を他のデバイスと接続するための任意選択的なネットワーク通信モジュール(または命令)118、または通信ネットワーク、
●標的分子130に関する情報を収集するための光学活性検出モジュール120と、
●標的分子130についての光学活性の位置のセットと直接的に相関し得る、複数の結合部位における各それぞれの結合部位140に関する情報、
●(i)持続時間144、および(ii)放出された光子数146を含み得る、各結合部位140の複数の結合事象における各それぞれの結合事象142に関する情報、
●標的分子130の配列を決定するための配列決定モジュール150、
●(i)ベースコール152、および(ii)確率154を含み得る、各標的分子130の複数の結合部位における各それぞれの結合部位140に関する情報、
●各標的分子130の参照ゲノム160に関する任意選択的な情報、および
●各標的分子130の相補鎖170に関する任意選択的な情報。
【0099】
様々な実施態様では、上記識別された要素のうちの1つ以上は、前述の記憶デバイスのうちの1つ以上に記憶され、上記の機能を実行するための命令のセットに対応する。本明細書では、上記で識別されたモジュール、データ、またはプログラム(例えば、命令のセット)は、別個のソフトウェアプログラム、プロシージャ、データセット、またはモジュールとして実装される必要はなく、したがって、これらのモジュールおよびデータの様々なサブセットは、様々な実施態様において組み合わされるか、またはそうでなければ再編成される。一部の実施態様では、非永続的メモリ111は、任意選択的に、上で識別されたモジュールおよびデータ構造のサブセットを記憶する。さらに、一部の実施形態では、非永続的メモリ111または永続的メモリ112は、上に記載されていない追加のモジュールおよびデータ構造を記憶する。一部の実施形態では、上で識別された要素のうちの1つ以上は、視覚化システム100の要素以外のコンピュータシステムに記憶され、視覚化システム100によってアドレス指定可能であり、視覚化システム100は、必要に応じて、そのようなデータのすべてまたは一部分を取得し得る。
【0100】
ネットワーク通信モジュール118の例としては、これらに限定されないが、ワールドワイドウェブ(WWW)、イントラネット、ローカルエリアネットワーク(LAN)、コントローラエリアネットワーク(CAN)、カメラリンクおよび/または携帯電話ネットワーク、無線ローカルエリアネットワーク(WLAN)および/または無線ネットワーク(メトロポリタンエリアネットワーク(MAN)、ならびに無線通信による他のデバイスなど)が挙げられる。有線または無線通信は、任意選択的に、複数の通信規格、通信プロトコルおよび/または通信技術のいずれかを使用、これらに限定されないが、モバイル通信のためのグローバルシステム(GSM)、拡張データGSM環境(EDGE)、高速ダウンリンクパケット接続(HSDPA)、高速アップリンクパケット接続(HSUPA)、Evolution、Data-Only(EV-DO)、HSPA、HSPA+、デュアルセルHSPA(DC-HSPDA)、ロングタームエボリューション(LTE)、近距離無線通信(NFC)、広帯域符号分割多元接続(W-CDMA)、符号分割多元接続(CDMA)、時間分割多元接続(TDMA)、ブルートゥース、ワイヤレスフィデリティ(Wi-Fi)(例えば、IEEE802.11a、IEEE802.11ac、IEEE802.11ax、IEEE802.11b、IEEE802.11gおよび/またはIEEE802.11n)、ボイスオーバーインターネットプロトコル(VoIP)、Wi-MAX、電子メール用のプロトコル(例えば、インターネットアクセスプロトコル(IMAP)および/またはポストプロトコル(POP))、インスタントメッセージ(例えば、拡張可能なメッセージングおよびプレゼンスプロトコル(XMPP)、インスタントメッセージングおよびプレゼンス利用拡張向けセッション開始プロトコル(SIMPLE)、インスタントメッセージングおよびプレゼンスサービス(IMPS))、および/またはショートメッセージサービス(SMS)、あるいは本開示の出願日現在でまだ開発されていない通信プロトコルを含む任意の他の好適な通信プロトコルが含まれる。
【0101】
図1Aは、「システム100」を示すが、図は、本明細書に記載の実施態様の構造的概略図というよりも、コンピュータシステムに存在する様々な特徴の機能的な説明として意図されている。実際には、当業者によって認識されるように、別々に示されたアイテムを組み合わせることができ、いくつかのアイテムを分離することができる。さらに、
図1Aは、非永続的メモリ111内の特定のデータおよびモジュールを示すが、これらのデータおよびモジュールの一部またはすべては、永続的メモリ112内にある。さらに、一部の実施形態では、メモリ111および/または112は、上に記載されていない追加のモジュールおよびデータ構造を記憶する。他の実施形態では、1つ以上の異なるハードウェアモジュール(図示せず)は、1つ以上の二次元撮像デバイス、レーザおよび格子またはフィルタホイールおよび関連するコントローラを含む光学システム、ならびに様々なポンプ、バルブ、ヒーターおよび他の機械システムを含む流体システムなどの、システム100の一部として含まれている。
【0102】
本開示によるシステムは、
図1Aを参照して開示されているが、本開示による方法は、
図2A、
図2B、
図3、および
図4を参照して、ここで詳細に説明される。
【0103】
ブロック202。標的核酸である分子の化学構造を決定する方法が提供される。本開示の目標は、標的核酸の単一ヌクレオチド分解能の配列決定を可能にすることである。一部の実施形態では、オリゴヌクレオチドプローブ種または他の分子を含む1つ以上のプローブと、標的核酸または他の分子との間の相互作用を特徴付ける方法が提供される。本方法は、1つ以上のプローブ種を、標的核酸または他の分子に一過的に結合させる条件下で、オリゴヌクレオチドプローブ種または別の分子を含み得る1つ以上のプローブを、標的核酸または他の分子に添加することを含む。本方法は、検出器で(1つ以上の二次元撮像デバイスを含んでもよい)、標的核酸または他の分子上の個々の結合事象を連続的に監視することによって進行してもよく、ある期間にわたって、または一連のフレームにわたって、結合事象を記録することを含んでもよい。次いで、結合事象からのデータを分析して、相互作用の1つ以上の特徴が決定され得る。
【0104】
一部の実施形態では、同一性(標的核酸であるポリマーの配列)を決定する方法が提供される。一部の実施形態では、細胞または組織の同一性を決定する方法が提供される。一部の実施形態では、生物の同一性を決定する方法が提供される。一部の実施形態では、個体の同一性を決定する方法が提供される。一部の実施形態では、本方法は、単一細胞の核酸および/またはタンパク質の配列決定に適用される。
【0105】
標的ポリヌクレオチド。
一部の実施形態では、分子は、標的核酸であり、天然の標的ポリヌクレオチドであるか、または天然ポリヌクレオチドのコピーである。様々な実施形態では、本方法は、単一細胞、単一のオルガネラ、単一の染色体、単一のウイルス、エキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、単一の標的ポリヌクレオチド分子を抽出することをさらに含み得、これらは試料として、本明細書にも記載され得る。さらなる実施形態では、本方法は、単一細胞、単一のオルガネラ、単一の染色体、単一のウイルス、エキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、1つ以上の標的ポリヌクレオチド分子を抽出することを含み得、これらは試料として、本明細書にも記載され得る。またさらなる実施形態では、本方法は、複数の細胞、複数のオルガネラ、複数の染色体、複数のウイルス、複数のエキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、1つ以上の標的ポリヌクレオチド分子を抽出することを含み得、これらは試料として、本明細書にも記載され得る。一部の実施形態では、単一の標的ポリヌクレオチドは、単一のRNA、単一のssDNA、または単一のdsDNAを含み得る。
【0106】
一部の実施形態では、標的核酸は、短鎖ポリヌクレオチド(例えば、1キロ塩基未満または300塩基未満)である。一部の実施形態では、短鎖ポリヌクレオチドは、尿および血液などの体液中のセルフリーDNAに見られるように、100~200塩基長、150~250塩基長、200~350塩基長、または100~500塩基長である。
【0107】
一部の実施形態では、標的核酸は、少なくとも10,000塩基長である。一部の実施形態では、標的核酸は、少なくとも1,000,000塩基長である。
【0108】
様々な実施形態では、単一の標的核酸は、染色体である。様々な実施形態では、単一標的ポリヌクレオチドは、約102、103、104、105、106、107、108、もしくは109塩基長、または102~109塩基長の任意の長さである。
【0109】
一部の実施形態では、本方法は、標的タンパク質、標的ポリペプチド、または標的ペプチドのアミノ酸配列の分析を可能にする。一部の実施形態では、標的タンパク質、標的ポリペプチド、または標的ペプチドのアミノ酸配列を分析および決定する方法が提供される。一部の実施形態では、ペプチド修飾、ならびに標的ポリヌクレオチドのアミノ酸配列を分析するための方法が提供される。一部の実施形態では、標的分子実体は、少なくとも5単位を含むポリマーである。かかる実施形態では、結合プローブは、オリゴヌクレオチド、抗体、アフィマー、ナノボディ、アプタマー、結合タンパク質、または低分子などを含む分子プローブである。
【0110】
一部の実施形態では、標準的な20アミノ酸、22タンパク質原性アミノ酸、アロタンパク質中に見出される非タンパク質原性アミノ酸もしくは翻訳後修飾の結果として見出される非タンパク質原性アミノ酸、天然に存在するD-アミノ酸、または天然に存在するL-アミノ酸の各々もしくは1つ以上は、N-レコグニン、ナノボディ、抗体、アプタマーなどを含む対応する特異的プローブによって結合される。各プローブの結合は、標的タンパク質、標的ポリペプチド鎖、または標的ペプチド内の対応する各アミノ酸に特異的である。一部の実施形態では、標的タンパク質、標的ポリペプチド鎖、または標的ペプチドにおけるサブユニットの順序が決定される。一部の実施形態では、結合は、サロゲートの結合部位への結合である。一部の実施形態では、サロゲートは、特定のアミノ酸またはペプチド配列に結合したタグであり、一過的な結合は、サロゲートタグへの結合である。
【0111】
一部の実施形態では、分子は、不均一分子である。一部の実施形態では、不均一分子は、超分子構造の一部分を含み得る。一部の実施形態では、本方法は、不均一なポリマーの化学構造の単位を識別し、順序付けること、または超分子構造の化学構造の単位を識別し、順序付けることを可能にし、このような単位は、核酸およびアミノ酸などの異なる種類のポリマーサブユニットを含み得る。かかる実施形態は、1つ以上のポリマーを伸長させ、複数のプローブに結合させて、伸長ポリマーに沿った複数の部位での化学構造を識別することを含み得る。ヘテロポリマーを伸長することで、サブ回折レベル(例えば、ナノメトリック)のプローブ結合部位の位置決定を可能にし得る。
【0112】
一部の実施形態では、ポリマーのサブユニットを認識するオリゴヌクレオチドプローブ種の結合によって、ポリマーを配列決定するための方法が提供される。典型的には、1つのオリゴヌクレオチドプローブ種の結合は、ポリマーを配列決定するのに十分ではない。例えば、
図1Bに、実施形態が示されており、プローブ種の完全なセット182との一過的な相互作用の測定に基づいて、ポリマー130が配列決定される(例えば、変性標的核酸と、オリゴヌクレオチドプローブ種の完全なセットとの相互作用、あるいは変性標的、タンパク質、標的ポリペプチド、もしくは標的ペプチドと、ナノボディもしくはアフィマー、抗体、または他のアミノ酸特異的結合剤プローブ種のセットとの相互作用であり、異なるプローブ種が、光学活性の観察を可能にするように標識される)。
【0113】
標的ポリマーの抽出および/または調製。
一部の実施形態では、対象となる細胞を対象とならない他の細胞から分離すること、または核酸抽出を行う前に、単一の種類のいくつかの細胞のライブラリを作製することが望ましい。1つのそのような例では、循環腫瘍細胞または循環胎児細胞が、血液から単離される(例えば、親和性捕捉用に細胞表面マーカーを使用することによって)。一部の実施形態では、ヒト細胞から微生物細胞を分離することが望ましく、目的は、微生物細胞から標的核酸を検出し、分析することである。一部の実施形態では、オプソニンは、広範囲の微生物を親和性捕捉し、哺乳類細胞からそれらを分離するために使用される。他の実施形態では、分別溶解が行われる。比較的穏和な条件下で、哺乳動物細胞を最初に溶解する。微生物細胞は、典型的には、哺乳動物細胞よりも硬く(溶解しにくい)、そのため、微生物細胞は、哺乳動物細胞の溶解を通してインタクトなままであり得る。溶解した哺乳類細胞断片は、洗い流される。次いで、より過酷な条件を使用して、微生物細胞を溶解する。次いで、標的微生物ポリヌクレオチドを選択的に配列決定する。
【0114】
一部の実施形態では、標的核酸は、配列決定の前に、細胞から抽出される。代替的な実施形態では、配列決定(例えば、染色体DNAの配列決定)は、細胞内で行われ、染色体DNAは、間期に畳み込み経路をたどる。オリゴヌクレオチドプローブ種のインサイツでの安定した結合は、Beliveau et al.,Nature Communications 6:7147(2015)によって実証されている。オリゴヌクレオチドプローブ種のかかるインサイツ結合および三次元空間におけるオリゴヌクレオチドプローブ種のナノメトリックな局在は、細胞内の染色体分子(標的核酸)の配列および構造的配置の決定を可能にし得る。
【0115】
標的ポリヌクレオチドは、天然の折り畳まれた状態で存在することが多い。例えば、ゲノムDNAは、染色体において高度に凝縮されているが、RNAは、二次構造を形成し得る。一部の実施形態では、長い鎖長のポリヌクレオチドは、生体試料から抽出する間に(例えば、天然ポリヌクレオチドの実質的に天然長を保存することによって)得られる。一部の実施形態では、ポリヌクレオチドは、その長さに沿った場所がほとんどまたはまったく曖昧さなしにトレースされるように線状化される。理想的には、標的ポリヌクレオチドは、線状化される前または線状化された後のいずれかに、直線化、伸展、または伸長される。
【0116】
一部の実施形態では、本方法は、天然長またはそのかなりの割合が(例えば、DNA全染色体または約1メガ塩基以上の断片について)保存される、非常に長いポリマー長を配列決定するのに特に適している。しかし、一般的な分子生物学的方法は、DNAの意図しない断片化をもたらし得る。例えば、ピペッティングおよびボルテックスは、剪断力を引き起こし、DNA分子を破壊する可能性がある。ヌクレアーゼ汚染は、核酸を、分解または断片化し得る。一部の実施形態では、天然長の断片またはかなり高分子量の(HMW)断片は、固定化、伸長および配列決定を開始する前に保存される。
【0117】
一部の実施形態では、ポリヌクレオチドは、配列決定に進む前に、意図的に、比較的均一な長さ(例えば、約1Mbの長さ)に断片化される。一部の実施形態では、ポリヌクレオチドは、固定または伸長の後またはその間に、比較的均一な長鎖に断片化される。一部の実施形態では、断片化は、酵素的に実現される。一部の実施形態では、断片化は、物理的に実現される。一部の実施形態では、物理的断片化は、超音波処理を介して実現される。一部の実施形態では、物理的断片化は、イオン衝撃または放射線を介して実現される。一部の実施形態では、物理的断片化は、電磁放射線を介して効果化される。一部の実施形態では、物理的断片化は、UV照明を介して実現される。一部の実施形態では、UV照明の線量を制御して、所与の鎖長に断片化される。一部の実施形態では、物理的断片化は、UV照明と色素による染色(例えば、YOYO-1)の組み合わせを介して実現される。一部の実施形態では、断片化プロセスは、物理的作用または試薬の添加によって停止される。一部の実施形態では、断片化プロセスの停止に影響を及ぼし得る試薬は、β-メルカプトエタノール(BME)などの還元剤である。
【0118】
放射線量による断片化および配列決定
一部の実施形態では、二次元撮像デバイスの視野が、完全なメガ塩基長のDNAを二次元撮像デバイスの1つの次元で見ることを可能にし得る場合、1Mbの長さのゲノムDNAを生成することが効率的である。他の実施形態では、より大きいまたはより小さい断片が、二次元撮像デバイスの1つの次元内に適合する断片によって可視化され得る。さらなる実施形態では、二次元撮像デバイスによって単一の画像として撮像され得るよりも大きい長さの標的核酸が使用され、標的核酸の異なる部分の画像は、異なる時間に撮像され、1つの撮像(c)ステップでは、標的核酸の1つ以上の領域について1つ以上のフレームで撮像されるか、またはより完全な配列決定のプロセスが、二次元撮像デバイスの視野を標的核酸の異なる部分に移動する前に行われ、これは、オリゴヌクレオチドプローブ種の完全なセットまたはその任意のサブセットの利用を含み得る。また、染色体長の断片のサイズを減少させることは、鎖のもつれを最小化し得、伸展され十分に分離された形態の最大長のDNAを可能にし得ることに留意されたい。
【0119】
染色体の長いサブ断片を配列決定するための方法は、以下のステップ:
i)染色体の二本鎖DNAを、色素で染色することであって、当該色素が、二本鎖DNAの塩基対間に挿入される(intercalating)、染色することと、
ii)色素染色された染色体DNAを、所定の線量の電磁放射線に曝露して、所望のサイズ範囲内の染色体DNAのサブ断片を生成することと、
iii)色素染色された染色体のサブ断片DNAを、表面に伸長および固定することと、
iv)染色された染色体断片を変性させて、塩基対を破壊し、それによって、任意の挿入色素を遊離することと、
v)得られた脱染色された伸長固定一本鎖染色体断片を、所望の長さおよび配列のオリゴヌクレオチドプローブ種の1つ以上のセットに曝露することと、
vi)オリゴヌクレオチドプローブ種の1つ以上のセットの各オリゴヌクレオチドプローブ種の脱染色された伸長一本鎖染色体断片に沿った結合の場所を決定することと、
vii)オリゴヌクレオチドプローブ種の1つ以上のセットのオリゴヌクレオチドプローブ種の結合の場所をコンパイルして、染色体サブ断片の完全な配列決定を得ることと、を含む。
【0120】
一部の実施形態では、上に記載されるように、染色は、染色体が細胞内にあるときに生じ得る。一部の実施形態では、上に記載されるように、標識されたオリゴヌクレオチドは、染色により多くの挿入色素を添加した結果として標識され、その後、二重鎖が形成される際、二重鎖に挿入される。一部の実施形態では、上に記載されるように、任意選択的に、変性に加えて、染色を退色可能な線量の電磁放射線が適用される。上記の一部の実施形態では、当該所定の線量は、化学的曝露による曝露の強度および持続時間ならびに断片化の停止を操作することによって達成され、当該化学曝露は、β‐メルカプトエタノールなどの還元剤である。上記の一部の実施形態では、線量は、ポアソン分布が約1Mb長の断片を生成するように既定される。
【0121】
固定および固定化の方法。
ブロック204。標的核酸を、試験基板上の二本鎖線状化伸展形態で固定し、それによって、固定伸展二本鎖核酸を形成する。任意選択的に、分子は、表面またはマトリックスに固定化される。一部の実施形態では、断片化ポリマーまたは天然ポリマーが固定される。一部の実施形態では、固定された二本鎖線状化核酸は、直線状であってもよく、曲線状または蛇行状の経路に沿っていてもよい。
【0122】
一部の実施形態では、固定は、分子コーミング(後退メニスカス)、フロー伸展、ナノ束縛、または電気伸展によって、標的核酸を、試験基板に適用することを含み得る。一部の実施形態では、標的核酸の基板への適用または固定は、UV架橋ステップをさらに含み得、標的核酸は、基板に共有結合される。一部の実施形態では、標的核酸の基板へのUV架橋は、実現されなくてもよく、標的核酸は、他の手段(例えば、疎水性相互作用、水素結合など)を介して基板に結合される。
【0123】
ほんの一端での標的核酸の固定化(例えば、固定)は、ポリヌクレオチドが非協調的な方法で伸展および収縮することを可能にし得る。したがって、任意の伸長方法が使用される場合、標的核酸の長さに沿った伸長の割合は、標的核酸の任意の特定の位置に応じて変化し得る。一部の実施形態では、標的核酸に沿った複数の場所の相対位置を固定し、変動を受けないようにすることが必要である。かかる実施形態では、伸長標的核酸は、その長さに沿った複数の接触点によって、表面に固定化または固定される(例えば、Michalet et al,Science 277:1518-1523,1997の分子コーミング技術で行われる。また、表面での伸展に使用され得るMolecular Combing of DNA:Methods and Applications,Journal of Self-Assembly and Molecular Electronics(SAME)1:125-148を参照されたい(例えば、ACS Nano.2015 Jan 27;9(1):809-16)、ならびにBensimonらのUS6344319およびDedeckerらのUS2013/0130255に記載されている)。
【0124】
一部の実施形態では、標的核酸のアレイ(array)は、表面に固定化され、一部の実施形態では、アレイの標的核酸は、回折限界撮像によって個別に解像されるのに十分に離れている。一部の実施形態では、標的核酸は、所与の表面積内に最大限に充填され、標的核酸が重複しないように、規則正しい様式で表面に固定される。一部の実施形態では、これは、パターン化された表面(例えば、標的核酸の末端が結合し得るような場所における疎水性パッチまたはストリップの規則正しい配置)を作製することによって実現される。一部の実施形態では、アレイの標的核酸は、回折限界撮像によって個別に解像されるのに十分に離れていなくてもよく、超解像法によって個別に解像される。
【0125】
一部の実施形態では、標的核酸は、DNAカーテンを利用して組織化される(Greene et al.,Methods Enzymol.472:293-315,2010)。これは、特に長い標的核酸に有用である。かかる実施形態では、一過的な結合は、一端に付着したDNA鎖がフローまたは電気泳動力によって伸長される間、または鎖の両端が捕捉された後、記録される。一部の実施形態では、複数の標的核酸を形成し得る同じ標的核酸配列の多くのコピーが、DNAカーテン法で利用され、配列が、1つの標的核酸からではなく、複数の標的核酸から、集合としての結合パターンからアセンブリされる。一部の実施形態では、標的核酸の両端は、パッド(例えば、試験基板の他のセクションよりも標的核酸に強力に結合し得る、試験基板の領域)に結合し得、各末端は、異なるパッドに結合し得る。一部の実施形態では、単一の線状標的核酸が結合し得る2つのパッドは、単一の線状標的核酸の伸展された構成を所定の位置に保持することができ、等間隔、非重複または非相互作用の単一線状標的核酸の規則正しいアレイが形成されるようにすることができる。一部の実施形態では、1つの標的核酸のみが、個々のパッドを占有し得る。一部の実施形態では、パッドがポアソン過程を使用して投入される場合、一部のパッドは標的核酸がなく、一部は標的核酸がなく、一部は1つ以上の標的核酸なしにより占有される。
【0126】
一部の実施形態では、標的核酸である標的分子は、規則正しい超分子スカフォールド(例えば、DNA折り紙構造)上に捕捉される。一部の実施形態では、最初に遊離溶液中でスカフォールド構造を使用してもよく、溶液相動態を利用して、標的核酸である標的分子を捕捉する。占有されると、スカフォールドは、沈降するか、または表面で自己組織化し、表面に結合され得る。規則正しいアレイは、視野ごとにより高い密度の分子(高密度アレイ)を可能にする分子の効率的なサブ回折充填を可能にし得る。単一分子位置決定法は、高密度アレイ内の標的核酸である標的分子が、(例えば、点と点の距離が40nm以下に)超解像されるようにすることができる。
【0127】
一部の実施形態では、ヘアピンを、(任意選択的に、標的核酸の末端を研磨した後に)二重鎖標的核酸の末端にライゲーションする。一部の実施形態では、ヘアピンは、標的核酸を表面に固定化し得るビオチンを含み得る。代替的な実施形態では、ヘアピンは、二重鎖標的核酸の2つの鎖を共有結合する役割を果たし得る。一部のかかる実施形態では、標的核酸の他端は、例として、オリオd(T)によって、または特定の配列によって、表面捕捉のためにテール付加(tailed)される。変性後、標的核酸の両方の鎖は、オリゴヌクレオチドまたは他のプローブ種との相互作用に利用可能である。
【0128】
一部の実施形態では、規則正しいアレイは、(例えば、Woo and Rothemund,Nature Communications,5:4889に記載されている)大きなDNA格子を形成するように一緒に連結する個々のスカフォールドの形態をとることができる。一部のかかる実施形態では、個々の小さなスカフォールドは、塩基対合によって、互いにロックオンし得る。一部の実施形態では、小さなスカフォールドは、ともに結合することができ、したがって、本明細書に記載される配列決定ステップのための高度に規則正しいナノ構造アレイを提示する。一部の実施形態では、捕捉部位は、規則正しい二次元格子において10nmのピッチで配置される。このような格子は、1平方センチメートル当たり1兆個程度の分子を捕捉することができる。
【0129】
一部の実施形態では、格子内の捕捉部位は、規則正しい二次元格子に、5nmのピッチ、10nmのピッチ、15nmのピッチ、30nmのピッチ、または50nmのピッチで配置される。一部の実施形態では、格子内の捕捉部位は、規則正しい二次元格子に、5nmのピッチ~50nmのピッチで配置される。
【0130】
一部の実施形態では、標的核酸または他の標的分子の規則正しいアレイは、ナノフルイディクスを使用して作製される。1つのかかる実施例では、ナノトレンチ(nanotrench)またはナノグルーブ(nanogroove)のアレイ(例えば、100nm幅および150nm深)が表面に形成され、長い標的核酸を規則正しく並べるように機能する。かかる実施形態では、ナノトレンチまたはナノグルーブに1つの標的核酸が存在すると、別の標的核酸の侵入が排除され得る。別の実施形態では、ナノピット(nanopit)アレイが使用され、長い標的核酸のセグメントがピット内にあり、ピット内で結合され、介在している長いセグメントの標的核酸がピット間に広がる。
【0131】
一部の実施形態では、高密度の標的核酸は、依然として超解像撮像および正確な配列決定を可能にし得る。例えば、一部の実施形態では、標的核酸のサブセットのみが対象である(例えば、標的化配列決定)。かかる実施形態では、標的化配列決定が行われるとき、複合体試料(例えば、全ゲノムまたはトランスクリプトーム、複数のゲノム)由来の標的核酸のサブセットおよび/または標的核酸の領域のみを分析する必要があり得、標的核酸は、通常よりも高い密度で試験基板またはマトリックスに固定される。かかる実施形態では、回折限界空間またはSMLM解像度空間内にいくつかのポリヌクレオチドが存在する場合であっても、シグナルが検出された場合、それが、標的遺伝子座のうちの1つのみに由来する可能性が高く、また、この遺伝子座が同じオリゴヌクレオチドプローブ種に同時に結合しているような別の遺伝子座の回折限界距離またはSMLM解像度空間内にはない可能性が高い。標的化配列決定を受ける各標的核酸間の必要な距離は、標的となるポリヌクレオチドの割合に相関する。例えば、5%未満のポリヌクレオチドが標的となる場合、ポリヌクレオチドの密度は、すべての標的核酸配列が望まれる場合の20倍を超える。一部の実施形態では、標的化配列決定の場合、撮像時間は、全ゲノムが分析される場合よりも短い(例えば、上の例では、標的化配列決定の撮像は、全ゲノム配列決定よりも10倍速くなり得る)。
【0132】
一部の実施形態では、試験基板は、固定ステップの前に、配列特異的オリゴヌクレオチドプローブ種と結合され、固定ステップは、試験基板に結合した配列特異的オリゴヌクレオチドプローブ種を使用して、試験基板上で標的核酸を捕捉または固定することを含み得る。一部の実施形態では、標的核酸は、5’末端に固定または結合されている。一部の実施形態では、標的核酸は、3’末端に固定または結合されている。別の実施形態では、試験基板上に2つの別個のプローブが存在する場合、1つのプローブは、標的核酸の第1の末端に固定または結合され得、第2のプローブは、標的核酸の第2の末端に固定または結合され得る。2つのプローブを使用する場合、標的核酸の長さに関する事前情報を有することも望ましい場合がある。一部の実施形態では、標的核酸は、試験基板に固定または結合される前に、所定のエンドヌクレアーゼで切断される。追加の実施形態では、標的核酸は、一端または両端で最初に固定または結合された後、標的核酸の長さに沿った追加の点で固定または結合される。
【0133】
様々な実施形態では、固定の前に、標的核酸が抽出され、またはゲルもしくはマトリックス中に包埋される(例えば、Shag et al.,Nature Protocols 7:467-478,2012に記載されている)。1つのかかる非限定的な例では、標的核酸は、液体からゲルへ転移を起こす媒体を含むフローチャネルに沈着される。標的核酸は、最初に伸長され、液相中に分布し、次いで、相を固相/ゲル相に変えることによって(例えば、架橋を引き起こすもしくは加速し得る加熱によって、または、ポリアクリルアミドの場合、補助因子を添加することによって、もしくは時間とともに)固定される。一部の実施形態では、標的核酸は、固相/ゲル相において伸長される。
【0134】
一部の代替的な実施形態では、1つ以上のオリゴヌクレオチドプローブ種は、試験基板もしくはマトリックス上で固定化されるか、または試験基板もしくはマトリックス中で固定化される。かかる実施形態では、1つ以上の標的核酸は、溶液中に懸濁され、1つ以上の固定されたオリゴヌクレオチドプローブ種に一時的に結合し得る。一部の実施形態では、1つ以上のオリゴヌクレオチドプローブ種の空間的にアドレス指定可能なアレイを使用して、標的核酸を捕捉する。一部の実施形態では、セルフリーDNAもしくはマイクロRNAなどの短い標的核酸(例えば、300ヌクレオチド未満)、またはmRNAなどの比較的短い標的核酸(例えば、10,000ヌクレオチド未満)は、1つ以上のオリゴヌクレオチドプローブ種を含み得るか、またはビオチンアビジンなどの他の結合機構を含み得る適切な捕捉分子を使用して標的核酸の修飾末端もしくは非修飾末端を捕捉することによって、表面にランダムに固定化される。一部の実施形態では、短いまたは比較的短い標的核酸は、試験基板との複数の相互作用を有し、配列決定は、試験基板に平行な方向で実行される。したがって、スプライシングアイソフォームの組織的または構造的なDNA修飾が解決される。例えば、一部のアイソフォームでは、反復またはシャッフルされたエキソンの場所が、描写もしくは決定され得るか、または、がん性細胞では顕著な構造再編成が生じ得、かかる構造再編成およびDNAの遺伝子もしくは重要な非コード領域との関係が、描写もしくは決定される。
【0135】
一部の実施形態では、固定化されたプローブは、標的核酸にアニーリングし得る共通の配列を含み得る。かかる実施形態は、標的核酸が、一方または両方の末端で生じ得る共通配列を有する場合に特に有用である。一部の実施形態では、標的核酸は、一本鎖であり、ポリAテール(tail)などの共通の配列を有する。かかる一例では、例えば、平滑ライゲーションまたはスプリントオリゴを利用したライゲーションを使用して天然のmRNAの5’末端にポリアデニル化テールが付加された、ポリアデニル化テールを有する天然のmRNAが、試験基板または他の表面もしくはマトリックス上のオリゴヌクレオチドポリd(T)プローブのアレイまたはローン(lawn)上で捕捉される。一部の実施形態では、特に、短いDNAが分析される場合、例えば、特異的な短いオリゴをライゲーションすることによって、または捕捉分子(試験基板または他の表面もしくはマトリックス上の特異的な相補オリゴヌクレオチドプローブ種である)との相互作用にビオチンを結合させることによって、標的核酸の末端を適合させる。
【0136】
一部の実施形態では、標的核酸は、制限酵素によって生成される粘着末端を有する二本鎖DNAを含み得る。一部の非限定的な例では、稀な部位(例えば、Pmme1またはNOT1)の制限酵素を使用して、標的核酸の長い断片を生成し、各断片は、共通の末端配列を有する粘着性末端を含む。一部の実施形態では、適合は、ターミナルトランスフェラーゼを使用して行われる。他の実施形態では、ライゲーションまたはタグ付けは、Illumina配列決定のユーザーによって利用されるものと同様の様式でアダプターを導入するために使用される。これにより、ユーザーは、十分に確立されたIlluminaプロトコルを使用して試料を調製し、次いで、本明細書に記載の方法によって捕捉し、配列決定することができる。かかる実施形態では、標的核酸は、任意の増幅の前に(誤差およびバイアスが導入され、天然標的核酸の一部を含み得る任意のエピジェネティック情報が除去される)、配列決定のために捕捉または固定される。
【0137】
伸長方法
ほとんどの実施形態では、伸長が起きるように、ポリヌクレオチドまたは他の標的分子(例えば、標的核酸、標的タンパク質、標的ポリペプチド、または標的ペプチド)を、試験基板、表面、またはマトリックスに、付着、結合、または固定する必要があり得る。一部の実施形態では、標的核酸の伸長は、その結晶学的距離(例えば、dsDNAでは、ある塩基から次の塩基へのインサイツでの分離が既知で0.34nm)と等しく、それよりも長く、またはそれよりも短くする。一部の実施形態では、標的核酸は、インサイツの結晶学的距離よりも長く伸展される。
【0138】
一部の実施形態では、標的核酸は、分子コーミングを介して伸展される(例えば、Michalet et al.,Science 277:1518-1523,1997およびDeen et al.,ACS Nano 9:809-816,2015に記載されている)。これにより、数百万~数十億の標的核酸を、並行して、伸展させ、一方向に整列させることが可能になり得る。一部の実施形態では、分子コーミングは、所望の標的核酸を含む溶液を試験基板上で洗浄し、次いで、溶液のメニスカスを縮退することによって行われる。メニスカスを縮退する前に、標的核酸は、試験基板と、共有結合または他の相互作用を形成し得る。溶液が後退するにつれて、標的核酸は、メニスカスと同じ方向に(例えば、表面保持を介して)引っ張られる。しかし、標的核酸と試験基板との間の結合または固定の相互作用の強度が表面保持力を克服するのに十分である場合、標的核酸は、縮退するメニスカスの方向に均一な様式で伸展する。一部の実施形態では、分子コーミングは、Kaykov et al.,Sci Reports.6:19636(2016)に記載のように行われる(その全体が参照により本明細書に援用される)。他の実施形態では、分子コーミングは、Petit et al.Nano Letters 3:1141-1146(2003)に記載されている方法またはその修正版を使用して、(例えば、マイクロ流体デバイスの)チャネルで行われる。
【0139】
気液界面の形状は、分子コーミングによって伸展される伸長標的核酸の配向を決定し得る。一部の実施形態では、標的核酸は、気液界面に対して垂直に伸長される。一部の実施形態では、標的核酸は、その1つの末端の修飾なしに、試験基板もしくは他の表面に付着、結合、または固定されるか、あるいはそのいずれかの末端への修飾なしに、結合または固定される。一部の実施形態では、二本鎖標的核酸の末端が、疎水性相互作用によって捕捉される場合、後退メニスカスにより伸展されると、二本鎖標的核酸の部分が変性し、試験基板または表面とのさらなる疎水性相互作用が形成され得る。
【0140】
一部の実施形態では、標的核酸は、分子スレッディング(molecular threading)を介して伸展される(例えば、Payne et al.,PLoS ONE 8(7):e69058,2013に記載されている)。一部の実施形態では、分子スレッディングは、標的核酸が、(例えば、化学変性剤、温度または酵素、塩濃度またはpHによって)一本鎖に変性された後に行われる。一部の実施形態では、標的核酸は、一端で繋がれ、次いで、流体の流れを利用して伸展される(例えば、Greene et al.,Methods in Enzymology,327:293-315に示されている)。
【0141】
様々な実施形態では、標的核酸は、マイクロ流体チャネル内に存在する。一部の実施形態では、標的核酸が、マイクロ流体チャネル内に流し込まれるか、または1つ以上の染色体、エキソソーム、核、もしくは細胞からフローチャネルに抽出される。一部の実施形態では、標的核酸をマイクロ流体フローセルもしくはナノ流体フローセルを介してナノチャネルに挿入するのではなく、ナノチャネルまたはマイクロチャネルである1つ以上のチャネルを、チャネルの壁および/または底が形成され得る表面が電気的にバイアスされるような方法で構築することによって、標的核酸を、オープントップチャネルに挿入する(例えば、Asanov et al.,Anal Chem.1998 Mar.15;70(6):1156-6を参照されたい)。一部の実施形態では、正のバイアスが、チャネルの壁および/または底が形成され得る表面に適用され、負に帯電した標的核酸がナノチャネルに引き寄せられる。同時に、チャネル間の領域は、電気的にバイアスされていない可能性があり、そのため、標的核酸が、チャネル間の領域に沈着する可能性が低くなる。
【0142】
一部の実施形態では、伸長は、流体力学的抗力によって実現される。一部の実施形態では、標的核酸は、ナノスリット(nanoslit)内のクロスフロー(crossflow)を介して伸展される(Marie et al.,Proc Natl Acad Sci USA 110:4893-8,2013)。一部の実施形態では、標的核酸の伸長は、フローチャネルにおけるナノ束縛によって実現される。フロー伸展・ナノ束縛は、一般に、マイクロ流体デバイスまたはナノ流体デバイス内で行われるフロー勾配を介して、標的核酸を線状のコンフォメーションに伸展することを伴い得る。この伸展方法を利用し得るマイクロ流体デバイスまたはナノ流体デバイスのナノ束縛部分は、マイクロ流体デバイスまたはナノ流体デバイスの狭い領域を指し得る。狭い領域またはチャネルの使用は、分子個体主義(molecular individualism)の問題(例えば、伸長中に個々の核酸または他のポリマーが複数のコンフォメーションを採り得る傾向)を克服するのに役立ち得る。フロー伸展法の1つの問題は、流れが、標的核酸に沿って常に等しく適用されるとは限らないことである。これは、伸長の長さの、広い範囲である、範囲を示す標的核酸をもたらす。一部の実施形態では、フロー伸展法は、伸長流および/または流体力学的抗力を伴ってもよい。一部の実施形態では、標的核酸が、マイクロチャネルまたはナノチャネル内に引き寄せられる場合、1つ以上の標的核酸は、マイクロチャネルまたはナノチャネル内でナノ束縛され、それによって、伸長される。一部の実施形態では、ナノ束縛後、標的核酸は、バイアス表面に、または試験基板もしくは他の表面の上部のコーティングもしくはマトリックスに沈着、結合、または固定される。
【0143】
一部の実施形態では、正のバイアスまたは負のバイアスを表面に適用する複数の方法のいずれかが利用される。一部の実施形態では、試験基板または他の表面は、耐汚染性(non-fouling)の特徴を有する材料で作製されるか、またはコーティングされ、試験基板または他の表面は、脂質(例えば、脂質二重層)、ウシ血清アルブミン(BSA)、カゼイン、様々なPEG誘導体などで不動態化される。不動態化は、チャネルの任意の1つの部分におけるポリヌクレオチドの集積、結合、または固定を防止する役割を果たし得、したがって、伸長および/またはより均一な伸長を可能にし得る。一部の実施形態では、試験基板または他の表面はまた、酸化インジウムスズ(ITO)または広スペクトル透明導電性酸化物、導電性ポリマー、グラフェン、非常に薄い金属フィルムなどの他の透明導電性表面を含んでもよい。
【0144】
一部の実施形態では、マイクロ流体チャネルまたはナノ流体チャネルを含む試験基板または他の表面に脂質二重層(LBL)を作製する場合、1%のリサミン(商標)ローダミンB 1,2-ジヘキサデカノイル-sn-グリセロ-3-ホスホエタノールアミンを含む両性イオンPOPC(1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン)脂質を、表面にコーティングする。トリエチルアンモニウム塩(ローダミン-DHPE)脂質の添加は、蛍光顕微鏡でのLBL形成の観察を可能にし得る。本開示の一部の実施形態で使用される脂質二重層不動態化の方法は、Persson et al.,Nano Lett.12:2260-2265,2012に記載されている。
【0145】
一部の実施形態では、1つ以上の標的核酸の伸長は、電気泳動または誘電泳動を介して行われる。一部の実施形態では、標的核酸は、一方の末端で繋がれ、次いで、電場によって伸展される(例えば、Giese et al.,Nature Biotechnology 26:317-325,2008に記載されている)。核酸の電気伸展は、核酸が非常に負に帯電した分子であるという事実に基づいている。例えば、Randall et al.2006,Lab Chip.6,516-522に記載されている電気伸展の方法は、核酸が、電場によって、マイクロチャネルまたはナノチャネルを通して(標的核酸分子の配向を誘導するために)引き込まれることを伴う。一部の実施形態では、電気伸展は、ゲルまたは絡み合ったポリマー内またはそれなしで行われる。ゲルまたは絡み合ったポリマーを使用する1つの利点は、標的核酸が利用可能な三次元空間を制限することであり、それによって、分子個体主義を克服するのに役立つ。ナノ束縛などの圧力駆動型伸展方法に対する電気伸展の一般的な利点は、核酸分子を破壊するのに十分な剪断力の欠如である。
【0146】
一部の実施形態では、複数のポリヌクレオチドが試験基板または他の表面に存在する場合、標的核酸は、同じ向きで整列していないこともあれば、まっすぐではないこともある(例えば、標的核酸は、試験基板または他の表面に付着、結合、もしくは固定してもよく、または曲線状の経路でゲルまたは絡み合ったポリマーを通して通り抜けてもよい)。かかる実施形態では、複数の標的核酸のうちの2つ以上が重複する可能性が高くなり、各標的核酸の長さに沿ったプローブの局在に関して潜在的な混乱につながる。一部の実施形態では、同じ配列決定情報が、直線状の十分に整列した標的核酸から得られるように、曲線状の標的核酸からも得られるが、曲線状の標的核酸からの配列決定情報を処理する画像処理タスクは、直線状の十分に整列した標的核酸から得られるものよりも、多くの計算力または時間を必要とし得る。
【0147】
実施形態では、1つ以上の標的核酸が、試験基板の表面である平面に平行な方向に伸長され、ある長さの標的核酸が、CMOSまたはCCDカメラなどのアレイ検出器である二次元撮像デバイス内の一連の隣接する画素にわたって撮像される。一部の実施形態では、1つ以上の標的核酸が、試験基板または他の表面に垂直な方向で伸長される。一部の実施形態では、標的核酸は、光シート顕微鏡、スピニングディスク共焦点顕微鏡、三次元超解像顕微鏡、三次元単一分子局在化、またはレーザ走査ディスク共焦点顕微鏡もしくはそのバリアントを介して撮像される。一部の実施形態では、標的核酸は、試験基板または他の表面に対して斜めの角度で伸長される。一部の実施形態では、標的核酸は、二次元撮像デバイスまたは検出器を介して撮像され、得られた画像またはフレームは、単一分子局在化アルゴリズムソフトウェアを介して処理される(例えば、Fiji/ ImageJ plug-in ThunderSTORM、Ovesny et al.,BioInform.30:2389-2390,2014に記載されている)。
【0148】
固定および伸長の前の、単一細胞由来のDNAの抽出および単離。
一部の実施形態では、個々の細胞の標的核酸が遊離される間、個々の細胞を一箇所で保持するために、単一細胞用のトラップが、マイクロ流体構造内に設計される(例えば、WO2012/056192またはWO2012/055415のデバイス設計を使用して)。一部の実施形態では、ナノチャネル中の標的核酸を抽出および伸展する代わりに、カバーガラスまたは箔を使用して、マイクロ/ナノ流体構造を密封し、これをさらに、ポリビニルシランでコーティングして、分子コーミングを可能にする(例えば、Petit et al.,Nano Letters 3:1141-1146.2003に記載されているように、流体の動きによって)。流体チップ内の穏やかな条件により、抽出された標的核酸が長い鎖長を有するように保存され得る。
【0149】
単一細胞または核からバイオポリマーを抽出するために、いくつかの異なるアプローチが利用可能である(例えば、いくつかの好適な方法が、Kim et al.,Integr Biol 1(10),574-86,2009に概説されている)。一部の非限定的な例では、細胞を高濃度のKCLで処理して、細胞膜を破裂させるか、または除去する。細胞は、低張液を添加することによって溶解される。一部の実施形態では、各細胞は、個別に単離され、各細胞のDNAは、個別に抽出され、次いで、単一細胞に関連する標的核酸の各セットは、マイクロ流体容器またはデバイス内で個別に配列決定される。一部の実施形態では、標的核酸抽出は、1つ以上の細胞を洗剤および/またはプロテアーゼで処理することによって行われ得る。一部の実施形態では、キレート剤(例えば、EDTAまたはEDDS)は、ヌクレアーゼによって必要とされる二価カチオンを捕捉するために溶解液中に提供される(したがって、ヌクレアーゼ活性を低下させる)。
【0150】
一部の実施形態では、単一細胞の核および余分な核成分は、以下の方法によって別々に抽出される。1つ以上の細胞が、マイクロ流体デバイスの供給チャネルに提供される。次いで、1つ以上の細胞が捕捉され得、各細胞は1つの捕捉構造によって捕捉される。第1の溶解緩衝液は、1つ以上の捕捉細胞を有するマイクロ流体デバイスの捕捉構造内に流動され、第1の溶解緩衝液は、細胞膜を溶解し得るが、細胞核の完全性を維持し得る。第1の溶解緩衝液が流動すると、マイクロ流体デバイスの捕捉構造内で捕捉された1つ以上の細胞の核外成分がマイクロ流体デバイス内のフローセル内に遊離され、そこで放出されたRNAおよび細胞質が固定化される。次いで、第2の溶解緩衝液を、1つ以上の捕捉細胞またはその残部を有するマイクロ流体デバイスの捕捉構造に供給することによって、1つ以上の核をさらに溶解してもよい。第2の溶解緩衝液の添加は、1つ以上の核および/またはミトコンドリアの成分(例えば、ゲノムDNAまたはミトコンドリアDNA)の、DNAがその後に固定化されるマイクロ流体デバイス中のフローセルへの放出を引き起こし得る。1つ以上の細胞の核外および細胞内構成要素は、同じフローセルの異なる場所で、または同じマイクロ流体デバイス内の異なるフローセル内で、または異なるマイクロ流体デバイス内で固定化される。
【0151】
図16Aおよび
図16Bの概略図は、複数の単一細胞を捕捉および単離し得るマイクロ流体アーキテクチャを示す。細胞1602は、フローセル2004内の細胞トラップ1606によって捕捉される。一部の実施形態では、細胞が捕捉された後、溶解試薬が、図示された細胞トラップ1606に流入し、通過する。次いで、溶解後、核酸1608は、捕捉トラップ1606に近接して分布してもよく、一方、他の細胞1602から抽出された核酸1608から隔離されたままであってもよい。一部の実施形態では、
図16Bに図示されるように、電気泳動性の誘導は、核酸を操作するために行われる(例えば、電荷1610を使用することによって)。溶解により、細胞1602および核1604から核酸1608が放出され得る。核酸1608は、細胞1602が捕捉されたときに、核酸1608があった位置(例えば、細胞トラップ1606に対して)に留まっていてもよい。トラップは、単一細胞の寸法(例えば、2~10μm)である。一部の実施形態では、微小液滴を含む試料をもたらすチャネルおよびマイクロ流体デバイスのフローセルはともに、2μm、10μmよりも広く、かつ高く、または10μm超である。一部の実施形態では、分岐チャネルとトラップとの間の距離は、1~1000ミクロンである。
【0152】
表面での高分子量DNAの抽出および伸長。
様々な実施形態では、HMWポリヌクレオチドを伸展するための様々な方法が使用される(例えば、ACS Nano.9(1):809-16,2015)。1つのそのような例では、表面での伸長は、フローセルで行われる(例えば、Petit and Carbeck in Nano.Lett.3:1141-1146,2003に記載されているアプローチを使用することによって)。流体またはマイクロ流体アプローチに加えて、一部の実施形態では、ポリヌクレオチドは、Giess et al.,Nature Biotechnology 26,317 -325(2008)に開示されているような電場を使用して、伸展される。ポリヌクレオチドが表面に付着されていない場合、ポリヌクレオチドを伸長させるためのいくつかのアプローチが利用可能である(例えば、Frietag et al.,Biomicrofluidics,9(4):044114(2015)、Marie et al.,Proc Natl Acad Sci USA 110:4893-8,2013)。
【0153】
一部の実施形態では、ゲルプラグ中でDNA使用する代替として、試験基板を含み得るマイクロ流体デバイスにロードするのに好適な染色体は、Cram et al.,Methods Cell Sci.,2002,24,27-35に記載されているポリアミン法によって調製され、試験基板を含み得るマイクロ流体デバイスに直接ピペッティングで送られる。一部のかかる実施形態では、染色体中のDNAに結合されたタンパク質は、プロテアーゼを使用して消化され、実質的に裸のDNAを遊離し、次いで、上に記載のように固定され、伸長され得る。
【0154】
リードの場所保存のための試料の処理。
非常に長い領域またはポリマーが配列決定される実施形態では、標的核酸の任意の分解は、全体的な配列決定の正確度を著しく低下させる可能性を有する。伸長ポリマー全体の保存を促進する方法を以下に提示する。
【0155】
標的核酸は、抽出、保存、または調製中に損傷する可能性を有する。ニック、ギャップ、塩基の酸化、シトシンのデラミネーション、および付加物は、天然の二本鎖ゲノムDNA分子内に形成され得る。これは、特に、試料のポリヌクレオチドがFFPE材料由来である場合に当てはまる。したがって、一部の実施形態では、DNA修復溶液は、DNAが固定化される前または後に導入される。一部の実施形態では、DNA修復は、ゲルプラグへのDNA抽出後に行われる。一部の実施形態では、修復溶液は、DNAエンドヌクレアーゼ、キナーゼ、および他のDNA修飾酵素を含んでいてもよい。一部の実施形態では、修復溶液は、ポリメラーゼおよびリガーゼを含み得る。一部の実施形態では、修復溶液は、New England BiolabsのプレPCRキットである。一部の実施形態では、かかる方法は、主に、Karimi-Busheri et al.,Nucleic Acids Res.Oct 1;26(19):4395-400,1998、およびKunkel et al.,Proc.Natl Acad Sci.USA,78,6734-6738,1981に記載されているように行われる。他の実施形態では、標的核酸損傷を検出することが望ましい。例えば、1つ以上のDNA付加物の数および場所を決定することが望ましい。かかる実施形態では、追加の標識付加物特異的結合部分は、配列決定方法の一部として利用される。
【0156】
一部の実施形態では、標的核酸が伸長された後、ゲル重層を適用する。一部のかかる実施形態では、試験基板または他の表面での伸長および変性後、二本鎖標的核酸または変性標的核酸は、ゲル層で覆われる。代替的に、標的核酸は、既にゲル環境にある間、(例えば、上に記載のように)伸長される。一部の実施形態では、標的核酸の伸長後、ゲル中に投入される。例えば、一部の実施形態では、標的核酸が一端で表面に付着し、試薬の流れまたは電気泳動場によって伸展されるとき、周辺領域の媒体がゲル中に投入される。一部の実施形態では、ゲルへの投入は、試薬の流れの中に、アクリルアミド、過硫酸アンモニウム、およびTEMEDを含むことによって起こり得る。かかる化合物は、重合するとポリアクリルアミドとなる。代替的な実施形態では、熱に応答するゲルが適用される。一部の実施形態では、標的核酸の末端は、アクリルアミドと重合し得るアクリダイトで修飾される。一部のかかる実施形態では、天然ポリヌクレオチドの骨格の負電荷を考慮すると、電場の印加により、正極に向かってポリヌクレオチドが伸長する。
【0157】
一部の実施形態では、標的核酸は、標的核酸の完全性を維持するために、ゲルプラグまたはゲル層中の細胞から抽出され、次いで、AC電場が印加されて、ゲル内の標的核酸が誘電泳動的に伸展または伸長される。誘電泳動的な伸展は、カバーガラスの上部のゲル層、または試験基板もしくは他の表面に会合したゲル中で行われ、その後、本明細書に記載される方法のいずれかを利用し、伸展された標的核酸に適用して、オリゴヌクレオチドプローブ種の一過的な結合を検出することができる。
【0158】
一部の実施形態では、試料または標的核酸は、その環境のマトリックスに架橋される。一例では、これは、細胞環境である。例えば、本明細書に記載される核酸配列決定方法が細胞においてインサイツで行われる場合、標的核酸は、ヘテロ二官能性架橋剤を使用して、細胞マトリックスに架橋される。これは、FISSEQなどの技術を使用して、セル内で直接配列決定する方法の一部として行われる(Lee et al.,Science 343:1360-1363,2014)。
【0159】
標的生体分子に対する損傷の多くは、標的生体分子を細胞および組織から抽出するプロセスにおいて、ならびに(標的生体分子が分析される前の)標的生体分子のその後の取り扱いにおいて生じる。標的核酸の場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。一部の実施形態では、機械的ストレスは、例えば、ChemBioChem,11:340-343(2010)に開示されている方法で、最小化される。加えて、カルシウムもしくは亜鉛、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の非触媒性二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対非触媒性二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。
【0160】
標的核酸の完全性を維持するために(例えば、DNA損傷またはより小さな断片への破壊を誘発しないように)、一部の実施形態では、DNAまたはRNAなどの生体高分子を、染色体、ミトコンドリア、細胞、核、エキソソームなどのその天然の保護された環境に保持することが望ましい。標的核酸が既にその保護された環境の外にある一部の実施形態では、それをゲルまたは微小液滴などの保護された環境に内包することが望ましい。一部の実施形態では、標的核酸は、その保護環境から、配列決定される場所(例えば、配列決定データが取得され得る流体系またはフローセルの一部)に物理的に近接して、遊離される。したがって、一部の実施形態では、生体高分子(例えば、核酸、タンパク質)は、保護された実体で提供され、当該保護された実体は、その天然状態(例えば、天然長)に近い生体高分子を維持し、生体高分子を含む保護された実体を、生体高分子が配列決定され得る場所に近接してもたらし、次いで、生体高分子を、配列決定される領域に、または配列決定される領域に近い領域に放出する。一部の実施形態では、フローセルは、試料の標的ゲノムDNAを効果的に封入し得るアガロースゲルを含み得、当該アガロースゲルは、長さが200Kbを超えるゲノムDNAの実質的な部分を維持し、標的ゲノムDNAを含むアガロースゲルを、標的ゲノムDNAが配列決定される環境(例えば、試験基板、表面、ゲル、マトリックス)の近くに配置し、標的ゲノムDNAを、アガロースゲルから配列決定環境に(または標的ゲノムDNAのさらなる輸送および取り扱いが最小化されるように、配列決定環境の近くに)放出し、1つ以上の配列決定方法を実施する。配列決定環境への放出は、電場の印加、またはアガラーゼによるアガロースゲルの消化によるものである。
【0161】
高分子の変性。
ブロック206。一部の実施形態では、固定された伸展二本鎖標的核酸を、その後、試験基板上で一本鎖形態に変性し、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得る。固定された第2の鎖のそれぞれの塩基は、固定された第1の鎖の対応する相補塩基に隣接していてもよい。一部の実施形態では、変性は、最初に、二本鎖標的核酸を伸長または伸展させ、次いで、変性溶液を添加して、2本鎖を分離することによって行われる。
【0162】
一部の実施形態では、変性は、1つ以上の試薬(例えば、0.5MのNaOH、DMSO、ホルムアミド、尿素など)を含む化学変性である。一部の実施形態では、変性は、(例えば、試料を85℃以上に加熱することによる)熱変性である。一部の実施形態では、変性は、ヘリカーゼ、またはヘリカーゼ活性を有する他の酵素の使用を介したものなどの、酵素変性を介したものである。一部の実施形態では、標的核酸は、表面との相互作用を介して、または臨界長を超えた伸展などの物理的プロセスによって、変性される。一部の実施形態では、変性は完全または部分的である。
【0163】
一部の実施形態では、オリゴヌクレオチドプローブ種の、標的核酸の反復単位上の修飾(例えば、ポリヌクレオチドのエピジェネティック修飾ヌクレオチド、またはポリペプチドのリン酸化)への結合は、任意選択的な変性ステップの前または後に行われる。
【0164】
一部の実施形態では、二本鎖標的核酸の任意選択的な変性は、まったく行われない場合がある。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、標的核酸の二重鎖構造への結合またはアニーリングに利用される。例えば、一部の実施形態では、オリゴヌクレオチドプローブ種は、二重鎖形態標的核酸の過剰なゆらぎ(breathing)を誘導することによって、修飾亜鉛フィンガータンパク質の使用により二重鎖形態標的核酸の配列を認識することによって、または標的核酸の二重鎖形態を変性させてガイドRNAの結合を可能にするCas9もしくは類似のタンパク質を使用することによって、二重鎖形態標的核酸の個々の鎖に(例えば、PNAプローブを使用して)ストランド侵入(strand invasion)を介して結合し得る。一部の実施形態では、ガイドRNAは、照合プローブ(interrogation probe)配列および標識を含んでもよく、したがって、本明細書に記載されるオリゴヌクレオチドプローブ種として機能し、オリゴヌクレオチドプローブ種の1つ以上のセットの各配列を含むgRNAが提供される。
【0165】
一部の実施形態では、二本鎖標的核酸は、ニック(例えば、天然のニック、またはDNase1処理によって生成するもの)を含んでもよい。かかる実施形態では、反応の条件下で、一方の鎖が、二重鎖の他方の鎖から一過的に解れるもしくは剥がれる(例えば、一過的に変性する)か、または自然な塩基対のゆらぎが生じる。これは、オリゴヌクレオチドプローブ種が、天然鎖の再ハイブリダイゼーションによって置換される前に、一過的に結合することを可能にし得る。
【0166】
一部の実施形態では、単一の二本鎖標的核酸が変性され、その結果、二重鎖の各鎖が利用可能になり、オリゴヌクレオチドプローブ種が結合する。一部の実施形態では、単一の標的核酸は、変性プロセスによって、または配列決定方法の別のステップによって、損傷され、(例えば、好適なDNAポリメラーゼおよび/またはリガーゼの添加によって)修復される。
【0167】
一部の実施形態では、(試験基板または他の表面への固定または結合の準備において)二本鎖標的ゲノムDNAの固定化および線状化は、分子コーミング、表面への二本鎖標的ゲノムDNAのUV架橋、任意選択的な湿潤、化学変性剤(例えば、アルカリ性溶液、DMSOなど)への曝露による二本鎖標的ゲノムDNAの変性、洗浄後の酸性溶液への任意選択的な曝露、および事前調整緩衝液への任意選択的な曝露を含み得る。
【0168】
プローブのアニーリング。
ブロック208。任意選択的な変性ステップの後、本方法は、固定された第1の鎖および固定された第2の鎖を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することによって継続し得、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、所定の配列および長さである。曝露は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の各部分と結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる。
【0169】
図5A、
図5Bおよび
図5Cは、異なるプローブ種の1つのポリマー502への一過的な結合の例を示す。各プローブ(例えば、504、506、および508)は、特定の照合配列(interrogation sequence)(例えば、オリゴヌクレオチドまたはペプチド配列)を含み得る。プローブ種504を、ポリマー502に適用した後、プローブ種504は、1回以上の洗浄ステップにより、ポリマー502から洗い流される。その後、同様の洗浄ステップが、プローブ種506および508を除去するために使用される。
【0170】
プローブの設計および標的。
一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のプールを含む溶液を、溶液中の標的核酸に提供する。オリゴヌクレオチドプローブ種を含むプールが、試験基板、他の表面、またはマトリックス上の標的核酸と接触した場合、オリゴヌクレオチドプローブは、拡散および分子衝突により、標的核酸と接触することができる。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のプールを含む溶液は、オリゴヌクレオチドプローブを、1つ以上の標的核酸と接触させるように撹拌される。一部の実施形態では、溶液を含むオリゴヌクレオチドプローブ種を交換して、新鮮なオリゴヌクレオチドプローブを、試験基板、他の表面、またはマトリックス上の1つ以上の標的ヌクレオチドにもたらす。一部の実施形態では、電場を使用して、オリゴヌクレオチドプローブを試験基板、または他の表面、例えば、正に付勢した表面またはAC電界に引き寄せることができる。
【0171】
一部の実施形態では、標的核酸は、特定のポリヌクレオチド配列を含み得、オリゴヌクレオチドプローブ種の特異的結合部分は、例えば、3塩基長、4塩基長、5塩基長、または6塩基長のオリゴヌクレオチド配列照合部分(interrogation portion)、任意選択的に、1つ以上の縮重位置または普遍的位置、および、任意選択的に、ヌクレオチドスペーサー(例えば、1つ以上のTヌクレオチド)または脱塩基部分もしくは非ヌクレオチド部分を含む。
図6Aおよび
図6Bに示されるように、同様の結合が、使用されるオリゴヌクレオチドプローブ種(例えば、604および610)の長さに関わらず、標的核酸602に沿って生じる。異なるk塩基長のオリゴヌクレオチドに固有の主な違いは、k塩基長が、それぞれのオリゴヌクレオチドプローブ種によって結合される結合部位の長さを設定することである(例えば、3塩基長のプローブ604は、606などの3ヌクレオチド長の部位に主にかつより安定して結合し、5塩基長のプローブ610は、610などの5ヌクレオチド長の部位に主にかつより安定して結合する)。
【0172】
図6Aでは、例示された3塩基長のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブとして使用するには異常に短い。通常、そのような短い配列は、非常に低い温度および長いインキュベーション時間が使用されない限り、安定して結合することができないため、オリゴヌクレオチドプローブとして使用されない。しかし、そのような短いオリゴヌクレオチドプローブ種は、本明細書に記載される検出方法に必要とされるような標的核酸への一過的な結合を形成しない。さらに、オリゴヌクレオチドプローブ種の配列が短いほど、オリゴヌクレオチドプローブ種のセットに存在するオリゴヌクレオチドプローブ種がより少ない。例えば、3塩基長のオリゴヌクレオチドプローブ種の完全なセットには、64個のみのオリゴヌクレオチド配列が必要であり、一方、4塩基長のオリゴヌクレオチドプローブ種の完全なセットには、256個のオリゴヌクレオチド配列が必要である。さらに、融解温度を上げるために、一部の実施形態では、非常に短いオリゴヌクレオチドプローブ種のプールが修飾され、一部の実施形態では、本明細書に記載される縮重ヌクレオチド(例えば、N)または普遍的ヌクレオチドが含まれる場合がある。例えば、7塩基長のオリゴヌクレオチドの安定性に対して、4つのNヌクレオチドは、3塩基長のオリゴヌクレオチドの安定性を増加させるであろう。
【0173】
図6Bの概略図では、5塩基長のオリゴヌクレオチドプローブの、その完全一致位置(612-3)、1塩基不一致位置(612-2)、および2塩基不一致位置(612-1)への結合が示されている。
【0174】
任意の1つのオリゴヌクレオチドプローブの結合は、標的核酸の配列決定を可能にするのに十分ではない場合がある。一部の実施形態では、標的核酸の配列を再構築するために、オリゴヌクレオチドプローブの完全なセットが必要である。オリゴヌクレオチドプローブ種の結合部位の場所、重複する結合部位へのオリゴヌクレオチドプローブ種の時間的に離れた結合、オリゴヌクレオチドプローブ種と標的核酸との間の不一致の部分的結合、結合の頻度、および結合の持続時間に関する情報は、すべて、配列または標的核酸の推定に寄与し得る。伸長または伸展された標的核酸の場合、標的核酸の長さに沿ったオリゴヌクレオチドプローブ種の結合の場所は、高い信頼度を有する配列の構築に寄与し得る。二本鎖標的核酸の場合、二重鎖形態の標的核酸の両方(例えば、両方の相補鎖)を同時に配列決定することから、より高い信頼性の配列が現れ得る。
【0175】
一部の実施形態では、共通の参照オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の1つ以上のセットにおけるオリゴヌクレオチドプローブ種の1つ以上のプールの各々とともに添加される。例えば、
図7A、
図7B、および
図7Cでは、共通の参照オリゴヌクレオチドプローブ種704は、オリゴヌクレオチドプローブ種のセット(例えば、706、712、および716)に含まれる任意の追加のプローブに関わらず、標的核酸702の同じ結合部位708に結合する。共通の参照オリゴヌクレオチドプローブ種704の存在は、他のオリゴヌクレオチドプローブ種706、712、および716の、それらのそれぞれの結合部位(例えば、710、714、718、720、および722)への結合を阻害しない。
【0176】
図7Cに示されるように、結合部位718、720、および722は、個々のオリゴヌクレオチドプローブ(716-1、716-2、および716-3)が、それらの部位が重複している場合であっても、可能性のあるすべての部位にどのように結合するのかを示す。
図7A、
図7B、および
図7Cでは、プローブ配列は、3塩基長で示されている。しかしながら、同様の方法は、4塩基長、5塩基長、6塩基長などのプローブでも、同様に十分に行うことができる。
【0177】
一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットは、所与の長さのすべてのオリゴを含み得る。例えば、1024個の個々の5塩基長の完全なセットは、本開示の一実施形態に従って、オリゴヌクレオチドプローブ種の1つ以上のセットにコードされ、かつ含まれる。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットは、複数の長さのすべてのオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブのセットは、一連のオリゴヌクレオチドプローブ種のタイリングである。一部の実施形態では、オリゴヌクレオチドプローブ種のセットは、オリゴヌクレオチドプローブ種のパネルである。合成生物学における特定の用途(例えば、DNAデータの記憶)の場合、配列決定は、配列の特定のブロックの順序を見つけることを含み得、ブロックは、所望のデータをコードするように設計される。
【0178】
図8A、
図8B、および
図8Cに示されるように、一部の実施形態では、オリゴヌクレオチドプローブ種の複数セット(例えば、804、806、および808)が、任意の標的核酸802に適用される。各オリゴヌクレオチドプローブ種は、その相補結合部位に優先的に結合する。一部の実施形態では、各曝露(c)間に緩衝液で洗浄することは、以前のセットのオリゴヌクレオチドプローブ種の除去を助ける。
【0179】
一部の実施形態では、核酸配列決定用プローブは、オリゴヌクレオチドであり、エピ修飾用プローブは、修飾結合タンパク質もしくはペプチド(例えば、MBD1などのメチル結合タンパク質)または抗修飾抗体(例えば、抗メチルC抗体)である。一部の実施形態では、オリゴヌクレオチドプローブ種は、ゲノム内の特定の部位(例えば、既知の変異を有する部位)を標的とし得る。
図9A、
図9B、および
図9Cに示されるように、一部の実施形態では、オリゴヌクレオチド(例えば、804、806、および808)および代替プローブ(例えば、902)の両方は、標的核酸802に同時に適用される(および複数回の曝露ステップを通して)。目的の標的部位を決定する方法は、Liu et al.,BMC Genomics 9:509(2008)に提供されている(参照により本明細書に援用される)。
【0180】
一部の実施形態では、プローブの1つ以上のセットのオリゴヌクレオチドプローブ種であり、プローブ種の1つ以上のセットのオリゴヌクレオチドプローブ種またはサブセットであり、オリゴヌクレオチドプローブ種の1つ以上のセットである、プローブ種の各々が、次々に適用される(例えば、最初に、オリゴヌクレオチドプローブ種またはオリゴヌクレオチドプローブ種のサブセットもしくは1つ以上のセットである1つのプローブ種の結合が検出され、次いで、次のオリゴヌクレオチドプローブ種が添加される前に除去され、検出され、除去され、次いで、次の…など)。一部の実施形態では、プローブの1つ以上のセットのプローブのすべてまたはサブセットは、単一のプールに同時に追加され、各結合プローブは、結合プローブの同一性のために完全にまたは部分的にコードする標識に連結され、結合プローブの各々のコードは、検出および分析のプロセスによってデコード(decode)される。
【0181】
図11Aおよび
図11Bによって示されるように、一部の実施形態では、複数のプローブの結合部位に関する情報を得るために、プローブのタイリングシリーズまたはタイリングセットが使用されてもよい。
図11Aでは、第1のタイリングセット1104は、標的核酸1102に適用される。第1のタイリングセット1104中のタイリングプローブのサブセットの各タイリングプローブは、1つの共通の塩基1108を含み、それによって、標的核酸1102のその1つの共通の塩基1108の5倍のカバレッジの深度をもたらす。カバレッジの深度は、タイリングシリーズのプローブのk塩基長に比例する(例えば、3塩基長のオリゴのセットは、標的核酸中のすべての塩基の約3倍のカバレッジをもたらす)。
【0182】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットが標的塩基に沿ってタイリングする場合、タイリング経路に切れ目がある場合に問題が生じる可能性がある。例えば、5塩基長のオリゴヌクレオチドプローブ種のセットでは、5塩基を超える標的分子の1つ以上の配列に結合することができるオリゴヌクレオチドプローブ種は存在しない。この場合、一部の実施形態では、1つ以上のアプローチが利用される。第一に、標的核酸が二本鎖核酸を含む場合、1つ以上の塩基の割当は、二重鎖の相補鎖から得られた配列に委ねられるか、またはそれに依存し得る。第二に、標的核酸の複数コピーが利用可能である場合、1つ以上の塩基の割当は、標的核酸の他のコピー上の同じ配列の他のコピーに依存し得る。第三に、一部の実施形態では、参照配列が利用可能である場合、1つ以上の塩基の割当は、参照配列に委ねられてもよく、またはそれに依存してもよく、1つ以上の塩基が、注釈付けられて、それらが参照配列から人為的に移植されていることを示す。
【0183】
一部の実施形態では、特定のオリゴヌクレオチドプローブ種は、様々な理由のために、オリゴヌクレオチドプローブ種の1つ以上のセットから省略される。例えば、いくつかのオリゴヌクレオチドプローブ配列は、自己相補性または回文配列などのそれら自体との、オリゴヌクレオチドプローブ種の完全なセットの他のプローブとの、または標的核酸との問題のある相互作用(例えば、既知の確率的で無差別な結合)を示す。一部の実施形態では、最小数の有益なオリゴヌクレオチドプローブ種は、標的核酸の種類ごとに決定される。k塩基長のオリゴヌクレオチドプローブ種の完全なセットの中では、オリゴヌクレオチドの半分は、オリゴヌクレオチドの他の半分に完全に相補的である。一部の実施形態では、これらの相補対(および実質的な相補性に起因する問題がある他の対)が同時にポリヌクレオチドに添加されなくてもよく、むしろオリゴヌクレオチドプローブ種の異なるサブセットまたはプールに割り当てられてもよいことは確かである。一部の実施形態では、センスおよびアンチセンスの両方の一本鎖DNA(単一の二本鎖標的核酸由来)が存在し、配列決定は、各相補オリゴヌクレオチドプローブ種対の1つのメンバーのみで行われる。センス鎖およびアンチセンス鎖の両方から得られた配列決定情報を組み合わせて、全体的な配列を生成する。
【0184】
一部の実施形態では、オリゴヌクレオチドプローブ種は、カスタムマイクロアレイ合成を使用して作製されるライブラリを含み得る。一部の実施形態では、マイクロアレイライブラリは、ゲノムの特定の標的部分に系統的に結合するオリゴヌクレオチドを含み得る。一部の実施形態では、マイクロアレイライブラリは、標的ゲノムにわたって一定距離離れた場所に系統的に結合するオリゴヌクレオチドプローブ種を含み得る。例えば、100万個のオリゴヌクレオチドプローブ種を含むライブラリは、約3000塩基ごとに結合するように設計されたオリゴヌクレオチドプローブ種を含むことができる。同様に、1000万個のオリゴヌクレオチドプローブ種を含むライブラリは、約300塩基ごとに結合するように設計され得、3000万個のオリゴヌクレオチドプローブ種を含むライブラリは、約100塩基ごとに結合するように設計され得る。一部の実施形態では、オリゴヌクレオチドプローブ種の配列は、参照ゲノム配列に基づいて計算的に設計される。
【0185】
一部の実施形態では、標的とされるゲノムの領域は、特定の遺伝子座である。他の実施形態では、標的とされるゲノムの領域は、遺伝子座のパネル(例えば、がんに関連する遺伝子もしくは他の高度に保存された領域)、またはゲノムワイド関連解析(genome-wide association study)によって識別された染色体区間内の遺伝子もしくは他の高度に保存された領域である。一部の実施形態では、標的遺伝子座はまた、ゲノムの暗黒物質、典型的には反復性であるゲノムのクロマチン領域、および反復領域の近傍にある複合遺伝子座を含んでもよい。そのような領域としては、テロメア、セントロメア、末端動原体染色体の短腕、ならびにゲノムの他の低複雑度領域が挙げられる。従来の配列決定方法は、ゲノムの反復部分に対処することはできない(2019年現在、まだ完全なヒトゲノムが存在しない)が、ナノメトリック精度が高い場合、本明細書に記載の方法は、これらの領域に網羅的に対処する。
【0186】
一部の実施形態では、複数のオリゴヌクレオチドプローブ種の各それぞれのオリゴヌクレオチドプローブ種は、固有のN塩基長配列を含み、ここで、Nは、セット{1、2、3、4、5、6、7、8、および9}の中の整数であり、長さNのすべての固有のN塩基長配列は、複数のオリゴヌクレオチドプローブ種によって表される。
【0187】
オリゴヌクレオチドプローブ種を作製するために使用されるオリゴ長が長いほど、オリゴヌクレオチドプローブ種に影響を及ぼす回文配列または折り返し配列に対して、効率的なプローブとして機能する可能性が高くなる。一部の実施形態では、結合効率は、1つ以上の縮重塩基または普遍的塩基を除去することにより、そのようなオリゴの長さを短縮することによって、実質的に改善される。このため、オリゴヌクレオチドプローブ種のためのより短い照合配列(例えば、4塩基長)を使用することが有利である。しかしながら、オリゴヌクレオチドプローブの配列が短いほど、より不安定な結合(例えば、より低い結合温度)を示す。一部の実施形態では、オリゴヌクレオチドプローブ種の結合安定性は、特異的安定化塩基修飾またはオリゴコンジュゲート(例えば、スチルベンキャップ)を使用することによって増強される。一部の実施形態では、完全に修飾された3塩基長または4塩基長(例えば、ロックド核酸(LNA)および/またはペプチド核酸(PNA))が使用される。
【0188】
一部の実施形態では、固有のN塩基長配列は、1つ以上の縮重ヌクレオチドによって占有される1つ以上のヌクレオチド位置を含んでもよい。一部の実施形態では、縮重位置は、オリゴヌクレオチドプローブを含むオリゴヌクレオチドプローブ種のすべての4つのヌクレオチドおよびメンバーを含み、縮重塩基場所に、4つのヌクレオチドの各々が提供される。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のヌクレオチド位置は、普遍的塩基によって占有される。一部の実施形態では、普遍的塩基は、2’-デオキシイノシンまたは本明細書に記載される他の普遍的塩基である。一部の実施形態では、固有のN塩基長配列は、5’末端で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接し、3’末端で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接する。一部の実施形態では、5’の単一普遍的ヌクレオチドおよび/または3’の単一普遍的ヌクレオチドは、各々、2’-デオキシイノシンまたは本明細書に記載される他の普遍的塩基であり得る。
【0189】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さMである。一部の実施形態では、Mは、2以上の正の整数である。(f)試験基板上の光学活性の複数の位置のセットから、標的核酸の少なくとも一部分の配列を決定することは、光学活性の複数の位置のセットによって表されるオリゴヌクレオチドプローブ種の重複した配列をさらに使用してもよく、これは、単一のオリゴヌクレオチドプローブ種の異なる場所、および光学活性の同じ場所での異なる回数、持続時間、光子強度、またはそれらの合計の組み合わせを含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブのセットの別のオリゴヌクレオチドプローブと、M-1個の配列相同性を共有する。他の実施形態では、オリゴヌクレオチドプローブのセットのサブセットは、セットの他のオリゴヌクレオチド種と、M-1個の配列相同性を共有し得るか、またはオリゴヌクレオチドプローブのセットのいずれも、M-1個の配列相同性を共有しない場合がある。
【0190】
プローブ標識。
一部の実施形態では、オリゴヌクレオチドプローブのセットの各オリゴヌクレオチドプローブ種は、標識に結合される。
図14A~
図14Eは、オリゴヌクレオチドプローブまたは他のプローブタイプを標識する異なる方法を示す。一部の実施形態では、標識は、色素、蛍光ナノ粒子、または光散乱粒子である。一部の実施形態では、プローブ1402は、標識1406に直接結合されている。一部の実施形態では、プローブ1402は、オリゴヌクレオチドプローブ1408-Aの配列に相補的である配列1408-Bを含み得るフラップ配列1410を介して間接的に標識されている。
【0191】
好ましい特徴を有する多くの種類の有機色素が、標識用に利用可能であり、いくつかは、高い光安定性および/または高い量子効率、および/または最小限の暗状態および/もしくは高い溶解度、および/または低い非特異的結合を有する。Atto542は、いくつかの好ましい品質を有する好ましい色素である。Cy3Bは、非常に明るい色素であり、Cy3もまた有効である。いくつかの色素は、赤色色素Atto655およびAtto647Nなどの、タンパク質、細胞、または細胞材料からの自家蛍光が広がる波長の回避を可能にする。多くの種類のナノ粒子が、標識のために利用可能である。本開示は、蛍光標識されたラテックス粒子以外に、金粒子または銀粒子、半導体ナノ結晶(量子ドット)、およびナノダイヤモンドをナノ粒子標識として使用する。ナノダイヤモンドは、一部の実施形態では、標識として特に好ましい。ナノダイヤモンドは、高い量子効率(QE)を有する光を放射し、高い光安定性、高い化学安定性、長い蛍光寿命(例えば、20ns程度、これは、光散乱および/または自家蛍光からの観察されるバックグラウンドを低減するために使用することができる)を有し、2つ以上の蛍光発光を有し、異なる発光帯域幅を有し、かつ小さい(例えば、直径40nm前後)。DNAナノ構造およびナノボールは、複数の有機色素を、それらの構造(分岐構造を含み得る)に組み込むか、または挿入色素などの標識を利用するかのいずれかによって、非常に明るい標識であり得る。
【0192】
一部の実施形態では、各間接標識は、オリゴヌクレオチドプローブ種の配列照合部分にコードされている塩基の同一性を特定し得る。一部の実施形態では、標識は、核酸挿入色素の1つ以上の分子を含んでもよい。一部の実施形態では、標識は、1つ以上の種類の色素分子、蛍光ナノ粒子、または光散乱粒子を含み得る。一部の実施形態では、より長い撮像時間を可能にするために、速やかに光退色しない標識が選択される。
【0193】
図12A、
図12B、および
図12Cは、付けられた蛍光標識1202を有するオリゴヌクレオチドプローブ1204の、標的核酸1206への一過的なオン・オフ結合を示す。標識1202は、オリゴヌクレオチドプローブ1204が標的核酸1206上の結合部位に結合するかどうかに関わらず、蛍光を発する。同様に、
図13A、
図13B、および
図13Cは、非標識オリゴヌクレオチドプローブ1306の一過的なオン・オフ結合を示す。結合事象は、溶液1302から一過的に形成される二重鎖1304への色素1304(例えば、YOYO-1)の挿入(intercalation)によって検出される。挿入色素は、溶液中で浮遊する遊離状態と比較して、二本鎖核酸に結合したときに、蛍光の顕著な増加を示す。
【0194】
一部の実施形態では、標的核酸に結合し得るオリゴヌクレオチドプローブ種は、直接標識されなくてもよい。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、フラップを含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種の構築(例えば、それらをコード化すること)は、特定の配列単位を結合することを含み、単位は、標識を、それに結合された相補(特定の単位に)コードオリゴヌクレオチド配列と、オリゴヌクレオチドプローブ種の1つ以上のセットの各k塩基長の一端に(例えば、フラップ配列)、結合するのに十分な長さを有する。フラップのコード配列の各ユニットは、別個の蛍光標識プローブに対するドッキング部位または結合部位として機能し得る。5塩基のプローブ配列をコードするために、プローブ上のフラップは、5つの異なる単位または結合場所を含み得、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の単位または結合位置は、オリゴヌクレオチドプローブ種配列(標的核酸に結合し得る部分)に隣接し、第2の単位または結合位置は、第1の単位または結合位置に隣接するなどである。配列決定においてプローブ・フラップを使用するのに先立って、プローブ・フラップの各種は、蛍光標識されたオリゴのセットに結合され、単位の数またはフラップ配列上の結合位置の数が所望の数の蛍光標識タイプよりも多い場合、非標識であるオリゴを含んでもよい。異なる標識と関連付けられたオリゴは、異なる単位または結合位置に相補的なそれぞれの配列を有し、オリゴヌクレオチドプローブ種配列のための固有の識別タグを生成する。一部の実施形態では、これは、フラップ上の各それぞれの単位または結合位置に相補的である4つの別個に標識されたオリゴ配列(例えば、合計で16個もの異なる標識の組み合わせ)を使用することによって行われ得る。
【0195】
一部の実施形態では、A、C、T、およびGが定義されているプローブは、標識が、オリゴヌクレオチドプローブ種の特定の位置で定義されたヌクレオチドを1つだけ報告するような様式で、コード化される(および他の位置は縮重的または普遍的である)。これには、1種類のヌクレオチド当たり1色、つまり、コード化に4色しか必要としない場合がある。
【0196】
一部の実施形態では、1つのフルオロフォア色のみが、曝露プロセス全体を通して使用される。かかる実施形態では、各曝露プロセスは、4つのサブプロセスに分割され、その各々で、セットの次のオリゴヌクレオチドプローブ種が添加される前に、特定の位置(例えば、位置1)に異なる塩基を有する4つのオリゴヌクレオチドプローブ種のセットの1つのオリゴヌクレオチドプローブ種が個別に添加される。各サイクルでは、オリゴヌクレオチドプローブ種は、同じ標識を有してもよい。5塩基長のオリゴヌクレオチドプローブ種配列長の本実施態様では、オリゴヌクレオチドの1つ以上のセットの完全なセットは、単一の塩基位置での照合に対応するオリゴヌクレオチドプローブ種の5つのセットを含み得、各セットは、5塩基長のオリゴヌクレオチドプローブ種のセットの単一の位置での異なる単一の塩基に対応する4つのオリゴヌクレオチドプローブ種を含み得、曝露サブプロセスの総数は20である(各セットが4つのオリゴヌクレオチドプローブ種を有する、5塩基長のオリゴヌクレオチドプローブセットの完全なセットの各塩基位置に対応する5つのセット)。
【0197】
一部の実施形態では、オリゴヌクレオチドプローブ種配列の第1の塩基は、フラップ配列の第1の単位によってコードされ、第2の塩基は、第2の単位によってコードされる。フラップの単位の順序は、オリゴヌクレオチドプローブ種の塩基配列の順序に対応し得る。次いで、別個の蛍光標識を、(相補的な塩基対合を介して)フラップに含まれるそれぞれの対応する単位に結合またはドッキングしてもよい。第1の単位に関連付けられ、したがって第1のオリゴヌクレオチドプローブ種の配列位置に関連付けられた第1の標識は、一実施例では、500nm~530nmの波長で発光し得、第2の単位に関連付けられ、したがって第2のオリゴヌクレオチドプローブ種の配列位置に関連付けられた第2の標識は、550nm~580nmの波長で発光し得、第3の標識は、600nm~630nmで、第4の標識は、650nm~680nmで、第5の標識は、700nm~730nmで発光し得る。次いで、各場所における塩基の同一性は、例えば、標識の蛍光寿命によってコードされ得る。1つのそのような例では、Aに対応する標識は、Cに対応する標識よりも長い寿命を有し、Gに対応する標識よりも長い寿命を有し、Tに対応する標識よりも長い寿命を有する。上記の例では、位置1の塩基Aは、最も長い寿命を有する500nm~530nmで発光してもよく、位置3の塩基Gは、第3の最も長い寿命を有する600nm~630nmで発光してもよい。
【0198】
一部の実施形態では、
図14Eに図示されるように、オリゴヌクレオチドプローブ種1402は、配列1408-Bに対応する配列1408-Aを含み得る。配列1408-Bは、フラップ領域1410に付着、結合、または連結される。
図14Eの全体構築物をもたし得る可能な配列の一例として、1410における4つの単位位置の各々は、それぞれ、配列AAAA(例えば、1412に相補的な領域)、CCCC(例えば、1414に相補的な領域)、GGGG(例えば、1416に相補的な領域)、およびTTTT(例えば、1418に相補的な領域)によって定義される。したがって、全体的なフラップ配列は、(配列番号1)5’-AAAACCCCGGGGTTTT-3’である。次いで、各単位位置は、特定の発光波長範囲を利用してコードされ、その位置にあり得る4つの異なる塩基は、4つの異なる蛍光寿命の標識されたオリゴによってコードされ、寿命/輝度比は、オリゴヌクレオチドプローブ種1402配列自体に対応する特定の塩基位置および塩基コードに対応し得る。
【0199】
好適なコードの例は、以下の通りである:
●位置1-A 塩基コード-TTTT-発光ピーク510、寿命/輝度#1
●位置1-C 塩基コード-TTTT-発光ピーク510、寿命/輝度#2
●位置1-G 塩基コード-TTTT-発光ピーク510、寿命/輝度#3
●位置1-T 塩基コード-TTTT-発光ピーク510、寿命/輝度#4
●位置2-A 塩基コード-GGGG-発光ピーク560、寿命/輝度#1
●位置2-C 塩基コード-GGGG-発光ピーク560、寿命/輝度#2
●位置2-G 塩基コード-GGGG-発光ピーク560、寿命/輝度#3
●位置2-T 塩基コード-GGGG-発光ピーク560、寿命/輝度#4
●位置3-A 塩基コード-CCCC-発光ピーク610、寿命/輝度#1
●位置3-C 塩基コード-CCCC-発光ピーク610、寿命/輝度#2
●位置3-G 塩基コード-CCCC-発光ピーク610、寿命/輝度#3
●位置3-T 塩基コード-CCCC-発光ピーク610、寿命/輝度#4
●位置4-A 塩基コード-AAAA-発光ピーク660、寿命/輝度#1
●位置4-C 塩基コード-GGGG-発光ピーク660、寿命/輝度#2
●位置4-G 塩基コード-GGGG-発光ピーク660、寿命/輝度#3
●位置4-T 塩基コード-GGGG-発光ピーク660、寿命/輝度#4
【0200】
他の実施形態では、異なる単位位置は、蛍光寿命によってコード化され、塩基は、蛍光発光波長によってコード化される。一部の実施形態では、他の測定可能な物理的属性は、代替的に、コード用に使用され得、またはその測定値が波長および寿命の測定値と互換性がある場合に使用され得る。例えば、発光の偏光または輝度はまた、フラップに含めるために利用可能ないくつかのコードのサイズを増加させるために、測定され得る。
【0201】
一部の実施形態では、トーホールド(toe-hold)プローブ(例えば、Levesque et al.,Nature Methods 10:865-867,2013)が使用される。これらのプローブは、部分的に二本鎖であり、不一致標的に結合したときに競合的に不安定化される(例えば、Chen et al.,Nature Chemistry 5,782-789,2013に詳述されている)。一部の実施形態では、トーホールドプローブは、単独で使用される。一部の実施形態では、正しいハイブリダイゼーションを確実にするために、トーホールドプローブが使用される。一部の実施形態では、トーホールドプローブは、標的核酸に結合した他のプローブの解離反応速度を促進するために使用される。
【0202】
一部の実施形態では、共通の励起線によって励起される標識は、量子ドットである。一部のかかる実施形態では、この例によれば、Qdot525、Qdot565、Qdot605、およびQdot655は、それぞれ4つのヌクレオチドに対応するように選択される。代替的に、4つの異なるレーザ線を使用して、4つの異なる有機フルオロフォアを励起し、得られた発光を、イメージスプリッターによって分割して検出される。一部の他の実施形態では、発光波長は、2つ以上の有機色素に共通であるが、蛍光寿命が異なる。当業者は、過度の労力および実験なしに、いくつかの異なるコード化および検出のスキームを想定することができるであろう。
【0203】
一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットの異なるオリゴヌクレオチドプローブ種は、個別に添加されなくてもよいが、コード化され、一緒にプールされる。最も単純な一度に1つの色および1つのオリゴからのステップアップは、一度に2つの色(または2つの寿命、標識間の他の検出可能な差の2つ)および2つのオリゴヌクレオチドプローブ種である。5つのオリゴヌクレオチドプローブ種の各々について、5つの区別可能な単一の色素でコード化された標識、1つの色素でコード化された標識の直接検出を使用して、一度に最大約5つのオリゴヌクレオチドプローブ種をプールすることを期待するのは合理的である。
【0204】
他の実施形態では、より高いレベルの複雑性が必要とされるか、または望まれ、フレーバーまたはコードを増やしてもよい。例えば、3塩基長のオリゴヌクレオチドプローブ種の完全なセットの各塩基を個別にコードするには、64個の異なるコードが必要となる。また、例として、5塩基長のオリゴヌクレオチドプローブ種の完全なセットの各塩基を個別にコードするには、1024の異なるコードが必要となる。このような多数のコードは、複数の異なる検出可能な標識の特徴から構成される、1つのオリゴ当たり1つのコードを有することによって達成される。一部の実施形態では、より小さいセットのコードを使用して、オリゴヌクレオチドプローブ種のより小さいセットまたは完全なセットのサブセットをコード化する(例えば、場合によっては、64個のコードを使用して、5塩基長の1024個のオリゴヌクレオチドプローブ種の配列の完全なセットの16サブセットをコード化する)。
【0205】
一部の実施形態では、いくつかの方法で、大きなセットのオリゴコードが得られる。例えば、一部の実施形態では、コード特異的な色素でロードされたビーズ、またはDNAナノ構造ベースのコードは、最適な間隔の異なる蛍光波長の発光色素を含んでもよい(例えば、Lin et al.,Nature Chemistry 4:832-839,2012)。一部の実施形態では、
図14Cおよび
図14Dに図示されるように、ビーズ1412は、複数の蛍光標識1414を含み得る。
図14Cでは、ビーズ1412上にコーティングされた標識1414が描写されている。
図14Dでは、ビーズ1412に封入された標識1414が描写されている。一部の実施形態では、各標識1414は、異なる種類の蛍光分子である。一部の実施形態では、すべての標識1414は、同じ種類の蛍光分子(例えば、Cy3)である。さらなる実施形態では、異なるおよび/または同じ蛍光分子を含む異なる標識のうちの1つ以上が、ビーズにコーティングされるか、結合されるか、または封入される。
【0206】
一部の実施形態では、コードスキームが使用され、オリゴヌクレオチドプローブ種の塩基の位置およびその同一性を説明するために、モジュラーコードが使用される。一部の実施形態では、これは、オリゴヌクレオチドプローブ種を識別し得る標識の組み合わせを含み得るオリゴヌクレオチドプローブ種にコードアームを付加することによって実施される。例えば、すべての可能な5塩基長のオリゴヌクレオチドプローブのライブラリをコード化することが望まれる場合、アームは、5つの部位、単位、または結合位置を有し、各部位、単位、または結合位置は、5塩基長のオリゴヌクレオチドプローブ種の5つの核酸塩基の各々に対応し、5つの部位の各々は、5つの区別可能な標識に結合され、部位、単位、または結合位置に関連付けられた5つの区別可能な標識の各々は、異なる塩基の決定に関連する15個の他の標識からさらに区別可能である。1つのそのような例では、各部位、単位、または結合位置に対応する特定のピーク発光波長を有するフルオロフォアを含む標識(例えば、第1の部位、単位、または結合位置には500nm、第2の部位、単位、または結合位置には550nm、第3の部位、単位、または結合位置には600nm、第4の部位、単位、または結合位置4には650nm、第5の部位、単位、または結合位置には700nm)、および同じ発光波長を有するが異なる蛍光寿命を有する4つのフルオロフォを含む標識は、各位置で4つの塩基の各々をコードすることができる。
【0207】
一部の実施形態では、オリゴヌクレオチドプローブ種または他の結合試薬上の、それに結合された、もしくはそれに連結された異なる標識は、発光の波長によってコードされるか、または部分的にコード化される。一部の実施形態では、異なる標識は、蛍光寿命によってコード化されるか、または部分的にコード化される。一部の実施形態では、異なる標識は、蛍光偏光によってコード化されるか、または部分的にコード化される。一部の実施形態では、異なる標識は、波長、蛍光寿命、蛍光偏光寿命、または任意の他の光学的に観察可能な機構の任意の組み合わせによってコードされるか、または部分的にコードされる。
【0208】
一部の実施形態では、異なる標識は、関連付けられたオリゴヌクレオチドプローブ種である関連付けられたプローブ種の反復オンオフハイブリダイゼーション動態によってコード化されるか、または部分的にコード化される。異なる会合-解離定数を有する異なるオリゴヌクレオチドプローブ種である異なる結合プローブが使用される。一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブは、蛍光強度によってコードされるか、または部分的にコードされる。一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブは、異なる数の、任意選択的に、結合、付着、または連結された非自己消光フルオロフォアを有することによって、コードされた蛍光強度である。個々のフルオロフォアは、典型的には、消光を防止または低減するために十分に離れている必要がある。一部の実施形態では、これは、任意に剛性リンカーまたはDNAナノ構造を使用して、標識を互いに好適な距離で所定の位置に保持することによって達成される。
【0209】
一部の実施形態では、蛍光強度によるコーデ化は、類似の発光スペクトルを有するが、量子収率または他の測定可能な光学特性が異なる色素バリアントを使用することによって実現される。例えば、励起/発光558/572を有するCy3B(例えば、0.67の量子収率)は、Cy3(励起/発光550/570を有し、0.15の量子収率)よりも実質的に明るいが、同様の吸収/発光スペクトルを有する。一部のかかる実施形態では、532nmレーザは、両方の色素を励起するために使用される。他の好適な色素には、(励起/発光591/604nmを有する)Cy3.5が含まれ得、これは、上方シフトした励起および発光スペクトルを有するが、それにもかかわらず、532nmのレーザによって励起されるであろう。しかし、その波長での励起は、Cy3.5には最適ではなく、Cy3に最適化されたバンドパスフィルタでは、Cy3.5の発光がより明るく見えるであろう。Atto532は、励起/発光532/553を有し、0.9の量子収率を有し、532nmレーザがAtto532をその最大励起で励起させ得るため、明るいと予想される。
【0210】
他の実施形態では、単一の励起波長を使用して、色素の放射寿命を測定し、複数のコードを実現する。かかる実施形態による一例では、Alexa Fluor546、Cy3B、Alexa Fluor555、およびAlexa Fluor555を含むセットが使用される。場合によっては、他の色素セットが、より有用である。一部の実施形態では、コードのセットは、FRETペアを使用することによって、かつ/または放射光の偏光を測定することによっても拡張される。コード標識の数を増やすための別の方法は、複数の色でコードすることである。
【0211】
図15は、標的核酸へのオリゴヌクレオチドプローブ種の一過的な結合からの蛍光の例を示す。時系列から選択されたフレーム(例えば、フレーム番号1、20、40、60、80、100)は、オン・オフ結合を示す特定の部位におけるシグナルの存在(例えば、暗色のスポット)および不在(例えば、白色の領域)を示している。それぞれのフレームは、標的核酸に沿った複数の結合したオリゴヌクレオチドプローブ種から生じた蛍光を示す。集約された画像は、すべての以前のフレームの蛍光の集約または合計を示し、オリゴヌクレオチドプローブ種が結合し、かつ100フレーム中に検出されたすべての部位を示している。
【0212】
プローブの標的ポリヌクレオチドへの一過的な結合。
オリゴヌクレオチドプローブ種であるプローブの結合は、動的プロセスであり、結合したプローブは、常に、非結合になる幾分の確率を有する(例えば、温度、塩濃度、プローブ間の競合、およびいくつかの他の要因を含む様々な要因によって決定される)。したがって、常に、あるプローブが別のプローブに置き換わる機会がある。例えば、一実施形態では、相補的であるオリゴヌクレオチドプローブ種を含むオリゴヌクレオチドプローブ種のプールが使用され、試験基板または他の表面上の伸展標的核酸へのアニーリングと、溶液中の相補オリゴヌクレオチドプローブ種へのアニーリングとの間の連続的な競合を引き起こし得る。別の実施形態では、プローブは、3つの部分を有し、第1の部分は、標的核酸に対して完全に相補的であり、第2の部分は、標的核酸に対して部分的に相補的であり、標的核酸に曝露された共通のプールの1つ以上の他のオリゴヌクレオチドプローブ種に部分的に相補的であり、第3の部分は、標的核酸に曝露された共通のプールの1つ以上の他のオリゴヌクレオチドプローブ種に完全に相補的である。一部の実施形態では、標的核酸の塩基位置などの化学構造の単位の正確な空間場所に関する情報を収集することは、高分子の構造および/または配列を決定するのに役立ち得る。一部の実施形態では、オリゴヌクレオチドプローブ種結合部位の場所は、(例えば、単一分子局在化アルゴリズムを使用することによって)ナノメトリック精度またはサブナノメトリック精度で決定される。一部の実施形態では、複数の観察されたオリゴヌクレオチドプローブ種の結合部位は、回折限界光学撮像法によって解像可能であり、結合事象が時間的に離れているため解像される。標的核酸の配列は、各場所に結合し得るオリゴヌクレオチドプローブ種の同一性に基づいて決定される。
【0213】
一部の実施形態では、曝露プロセスは、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、固定された第1の鎖もしくは固定された第2の鎖または個々のオリゴヌクレオチドプローブ種に相補的である標的核酸の各部分と、一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件を使用して行われ、それによって、光学活性の事例を生じさせる。一部の実施形態では、滞留時間(dwell time)(例えば、特定のオリゴヌクレオチドプローブ種による結合の持続時間(duration)および/または存続時間(persistence)は、結合事象が、完全一致(perfect match)、不一致(mismatch)、または擬似(spurious)結合であるかどうかを決定するために使用される。
【0214】
一部の実施形態では、曝露プロセスは、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、個々のオリゴヌクレオチドプローブ種に相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の各部分と、反復して一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件を使用して行われ、それによって、光学活性のそれぞれの事例を反復して生じさせる。
【0215】
一部の実施形態では、配列決定プロセスまたは方法は、伸長標的核酸を、順次提供されるオリゴヌクレオチドプローブ種の1つ以上の完全なセットの各々からの一過的な相互作用に供することを含み得る(1つのオリゴヌクレオチドプローブ種を有する溶液が除去され、次のオリゴヌクレオチドプローブ種を有する溶液が添加される)。一部の実施形態では、各オリゴヌクレオチドプローブ種の結合は、オリゴヌクレオチドプローブ種が一過的に結合することを可能にする条件を使用して行われる。したがって、例えば、1つのオリゴヌクレオチドプローブ種に対して25℃、次のオリゴヌクレオチドプローブ種に対して30℃で、結合が行われる。一部の実施形態では、オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の共通のプールにあるセットで利用される。例えば、類似の温度、類似の塩濃度、またはハイブリダイゼーション結合に影響を及ぼし得る他の要因などの類似の条件を使用して一過的に結合し得るすべてのオリゴヌクレオチドプローブ種は、セットに集められ、任意選択的に、オリゴヌクレオチドプローブ種の共通のプールで一緒に使用され得る。一部のかかる実施形態では、セットの各オリゴヌクレオチドプローブ種は、差次的に標識されるか、または差次的にコードされる。
【0216】
一部の実施形態では、オリゴヌクレオチドプローブ種の一過的な結合は、少量の二価カチオンを含むが、一価カチオンを含まない緩衝液中で行われる。一部の実施形態では、緩衝液は、5mMのTris-HCl、10mMの塩化マグネシウム、mmのEDTA、0.05%のTween-20、およびpH8を含み得る。一部の実施形態では、緩衝液は、1nM未満、5nM未満、10nM未満、または15nM未満の塩化マグネシウム、塩化カルシウム、塩化マンガン、または他の適切な二価カチオンを含んでもよい。他の実施形態では、溶液中の負に帯電した核酸塩基の濃度のわずかに半分以上の濃度の二価カチオンが提供され、この溶液は、オリゴヌクレオチドプローブ種および標的核酸を含み得る。
【0217】
一部の実施形態では、一過的な結合を促進する複数の条件が使用される。一部の実施形態では、ある条件が、1つのオリゴヌクレオチドプローブ種に対して、そのTmに応じて使用され、別の条件が、別のオリゴヌクレオチドプローブ種に対して、そのTmに応じて使用されるなど、オリゴヌクレオチドプローブ種の完全なセットに対して使用される(例えば、5塩基長の可能な1024個の完全なセットからの各5塩基長のオリゴヌクレオチドプローブ種)。一部の実施形態では、512個の非相補的5塩基長のみが提供される(例えば、標的核酸が二重鎖形態であり、したがって、両方の相補鎖が試料中に存在するため)。一部の実施形態では、各オリゴヌクレオチドプローブ種の付加は、同じ配列順序で同じ5つの特異的塩基および2つの縮重塩基または普遍的塩基を含むオリゴヌクレオチドプローブ(したがって、16個の七量体)の混合物を含んでもよく、したがって、標的核酸配列を照合するために使用される異なる試薬セットのシステムスループットおよび数に関して、単一の五量体オリゴヌクレオチドプローブとして機能し得る同じ標識を用いてすべて標識される。縮重塩基または普遍的塩基は、オリゴヌクレオチドプローブ種のセットの複雑度を増加させることなく、安定性が付加され得る。
【0218】
一部の実施形態では、同じまたは類似のTmを共有し得る複数のオリゴヌクレオチドプローブ種に対して、同じ条件が提供される。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、異なるコード標識を含んでもよい(これは異なる部分を証明し得、そのため、各標識種が一意的に識別される)。このような場合、温度は、オリゴヌクレオチドプローブ種の交換のプールであるいくつかのオリゴヌクレオチドプローブ種を通して保持され、その後、同じまたは類似のTmを共有し得る次のオリゴヌクレオチドプローブ種のセットに対して変更される。
【0219】
一部の実施形態では、曝露プロセスの一部であるオリゴヌクレオチドプローブ種の結合期間中に、温度を変えることで、2つ以上の温度で、オリゴヌクレオチドプローブ種の結合挙動が測定される。一部の実施形態では、オリゴヌクレオチドプローブ種の標的核酸への結合挙動または結合パターンが、選択範囲を通して段階的に設定された温度(例えば、10℃~65℃または1℃~35℃)と相関している、融解曲線の類似体が行われる。他の実施形態では、温度の変化と同様の様式で、塩の変化、ホルムアミドなどの変性剤の添加、およびオリゴヌクレオチドプローブ結合に影響を及ぼすことが知られている他のパラメータの変更などの、標的核酸へのオリゴヌクレオチドプローブ結合に影響を及ぼし得る他のパラメータに変更が加えられる。他の実施形態では、単一の温度が利用され、結合動態の観察が、オリゴヌクレオチドプローブ結合のTmと相関し得る別の測定可能なパラメータとして使用される。
【0220】
一部の実施形態では、オリゴヌクレオチドプローブ種のTmは、例えば、最近傍パラメータによって計算される。他の実施形態では、オリゴヌクレオチドプローブ種のTmは、経験的に導出される。例えば、最適な融解温度範囲は、融解曲線(例えば、ある温度範囲にわたる吸収による融解の程度の測定)を行うことによって導出される。一部の実施形態では、セットオリゴヌクレオチドプローブ種の組成物は、経験的試験によって検証される理論的に一致するTmに従って設計される。一部の実施形態では、曝露プロセスの一部としてのオリゴヌクレオチドプローブ種の結合は、実質的にTm未満(例えば、計算されたTm未満で最大33℃)の温度で行われる。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各個々のオリゴヌクレオチドプローブ種に対して経験的に定義された最適温度は、配列決定方法における曝露プロセスの一部として、各個々のオリゴヌクレオチドプローブ種の結合に使用される。
【0221】
一部の実施形態では、異なるTmを有するオリゴヌクレオチドプローブ種の温度を変更することの代替としてまたはそれに加えて、プローブおよび/または塩の濃度を変化させ、かつ/またはpHを変化させる。一部の実施形態では、他の表面の試験基板上の電気バイアスは、オリゴヌクレオチドプローブ種と1つ以上の標的核酸との間の一過的な結合を積極的に促進するために、正と負の間で繰り返し切り替えられる。
【0222】
一部の実施形態では、使用されるオリゴヌクレオチドプローブ種の濃度は、オリゴヌクレオチドプローブ種の配列のGCに対するATの含有量に従って調節される。一部の実施形態では、より高い濃度のオリゴヌクレオチドプローブ種が、より高いGC含量を有するオリゴに対して提供される。一部の実施形態では、塩基組成の影響を補償し得る緩衝液(例えば、CTAB、ベタイン、またはテトラメチル塩化アンモニウム(TMACl)などのカオトロピック試薬を含む緩衝液)は、2.5M~4Mの濃度で使用され、したがって、同じセットの条件を使用して測定されるように、異なるAT対GC配列の含有量および異なるTmを有する異なるオリゴヌクレオチドプローブ種に対して、効果的なTmを均等化することができる。
【0223】
一部の実施形態では、オリゴヌクレオチドプローブ種は、確率的影響または配列決定チャンバーの設計の様相(例えば、ナノチャネルの角にまたは壁に対してプローブが捕捉され得るフローセル中の渦)のために、試料全体に不均一に分布する(例えば、試験基板、フローチャンバー、スライド、標的核酸の長さ、および/または標的核酸の規則正しいアレイ)。プローブ溶液の効率的な混合または撹拌を確実に行うことによって、プローブの局所的な枯渇に対処する。場合によっては、これは、乱流を生成し得る粒子を溶液中に含ませることによって、および/または乱流を生成するフローセル(例えば、1つ以上の表面上のヘリンボーンパターン)を構築することによって、音響波を使用して実現される。加えて、フローセル内の層流のため、典型的には、混合がほとんどなく、表面に近い溶液は、バルク溶液とほとんど混合されない。これにより、表面近くにある試薬/結合プローブを除去し、表面に新鮮な試薬/プローブをもたらす上で問題が発生する可能性がある。これを軽減するために、上に記載のような乱流生成アプローチを実施することができ、かつ/または表面での大規模な流体の流れ/交換を行うことができる。一部の実施形態では、標的核酸が配列される前または後に、非蛍光のビーズまたはボールを、(標的核酸が結合される表面である)表面に付着させ、表面のランドスケープを粗い質感にする。これは、渦および流れを生成して、表面近くの流体を、より効果的に混合および/または交換し得る。他の実施形態では、電場は、結合したオリゴヌクレオチドプローブ種を濃縮および/または除去するために利用され、電場が、1つ以上の標的核酸が結合した表面とバルク溶液との間に印加される。
【0224】
一部の実施形態では、オリゴヌクレオチド種の完全なセットまたはサブセットが、一緒に添加される。一部のかかる実施形態では、塩基組成の影響を均等化する緩衝液(例えば、米国特許出願第2004/0058349号に記載されているTMAClまたはチオシアン酸グアニジン)が使用される。一部の実施形態では、同じまたは類似のTmを有するプローブ種が、一緒に添加される。一部の実施形態では、一緒に添加されるオリゴヌクレオチドプローブ種は、差次的に標識されていなくてもよい。一部の実施形態では、一緒に添加されるオリゴヌクレオチドプローブ種は、差次的に標識される。一部の実施形態では、差次的な標識は、異なる輝度、寿命、最大励起、最大発光、または他の観察可能な光学的特性、例えば、ならびに/またはそのような物理的特性の組み合わせを有する発光を伴う標識である。
【0225】
一部の実施形態では、2つ以上のオリゴヌクレオチドプローブ種が、一緒に使用され、それらの結合場所は、異なるオリゴヌクレオチド種から生じるシグナル間を区別する必要なく、決定される(例えば、オリゴが同じ発光波長で標識されている)。二重鎖標的核酸の両方の鎖が利用可能な場合、両方の鎖から結合部位のデータを得ることで、アセンブリアルゴリズムの一部として、2つ以上のオリゴヌクレオチド間の区別が可能になり得る。一部の実施形態では、1つ以上の参照オリゴヌクレオチドプローブ種が、アセンブリアルゴリズムのセットまたはサブセットの各オリゴヌクレオチドプローブ種とともに添加され、次いで、そのような参照プローブの光学活性の場所および得られた結合場所を使用して、標的核酸の配列アセンブリの足場形成または繋留を行うことができる。他の実施形態では、2つ以上のオリゴヌクレオチドプローブ種が一緒に使用され、それらの結合場所は、異なるオリゴヌクレオチド種から生じるシグナルを区別する必要なしに(例えば、オリゴが同じ発光波長で標識されている)、オリゴヌクレオチドプローブ種の複数のセットを作製することによって決定される。オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の2つ以上のサブセットに表され、オリゴヌクレオチドプローブ種の識別は、異なるサブセットの組み合わせを使用して実現され、光学活性の共通の場所、したがって、オリゴヌクレオチドプローブ種の結合場所が決定される。
【0226】
代替的な一実施形態では、オリゴヌクレオチドプローブ種は、好ましい結合条件を使用して、安定して結合することができるが、結合条件を好ましくない結合条件に変えて、結合を制御し、一過的な結合を強いるために利用することができる。非限定的な実施形態では、条件の変更は、オリゴヌクレオチドプローブ種の結合を解離させ得る熱、pH、電場、または試薬交換である。次いで、条件を良好な結合条件に戻し、オリゴヌクレオチドプローブ種が再び結合することを可能にする。一部の実施形態では、第1の好ましい結合条件の時間間隔が、すべての標的核酸部位を飽和させない場合、オリゴヌクレオチドローブ種の第2の好ましい結合条件の時間間隔において、第1の好ましい結合条件の時間間隔で使用されるのと同じオリゴヌクレオチドプローブ種のセットであるオリゴヌクレオチドプローブ種が、第1の好ましい結合条件の時間間隔とは異なる標的核酸部位のセットに結合し得る。一部の実施形態では、これらのサイクルは、制御可能な速度で複数回行われる。
【0227】
一部の実施形態では、一過的な結合は、1ミリ秒以下、50ミリ秒以下、500ミリ秒以下、1マイクロ秒以下、10マイクロ秒以下、50マイクロ秒以下、500マイクロ秒以下、1秒以下、2秒以下、5秒以下、または10秒以下持続する。
【0228】
一部の実施形態では、一過的な結合の方法を使用し、新鮮なオリゴヌクレオチドプローブ種の連続供給を確実にする場合、フルオロフォアの光退色が、重大な問題を引き起こさない可能性があり、照明を制限するために洗練された視野絞りまたはパウエルレンズが必要でない可能性がある。したがって、フルオロフォアの選択(または退色防止、レドックス系の提供)が重要ではない場合があり、一部のかかる実施形態では、比較的単純な光学系、例えば、fストップが構築され、これにより、二次元撮像デバイスの視野にはない標的核酸の照明を防止し得る。
【0229】
一部の実施形態では、一過的な結合の別の利点は、ポリヌクレオチドに沿ったすべての結合部位で複数の測定を行うことができるため、光学活性事例または検出の正確度に対する信頼性が増すことである。例えば、場合によっては、分子プロセスの典型的な確率的な性質により、オリゴヌクレオチドプローブ種が、誤った場所に結合する可能性がある。一過的に結合したプローブの、正確な結合よりもはるかに短くなる可能性が高いそのような外れ値を用いて、孤立した結合事象を廃棄することができ、複数の検出された相互作用によって裏付けられたそれらの結合事象のみが、標的核酸の配列決定の目的のための有効な検出事象として受け入れられる。
【0230】
一過的な結合の検出および結合部位の位置決定。
一過的な結合は、サブ回折レベルの位置決定を可能にする不可欠な構成要素である。一過的に結合するオリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブが、標的核酸に結合するか、または溶液中に存在するいずれかの可能性が、いつでも存在する。したがって、標的核酸結合部位のすべてが、いつでもオリゴヌクレオチドプローブによって結合されるわけではない。これにより、光の回折限界よりも近い部位(例えば、標的核酸上で10nmしか離れていない2つの部位)での結合事象の検出が可能になり得る。例えば、配列AAGCTTが60塩基後に繰り返される場合、反復配列は、約20nm離れていることになる(標的核酸が、約0.34nmのワトソン-クリック塩基長に伸長され直線化されている場合)。20ナノメートルは、通常、光学撮像によって区別することはできないであろう。しかし、プローブが、撮像中に、異なる時間に2つの部位に結合した場合、それらは個々に検出される。これにより、結合事象の超解像撮像が可能となる。ナノメトリック精度は、ホモポリマーリピートである配列リピート、または2塩基リピート、3塩基リピート、または3塩基超のリピートを解像し、それらの数を決定するために特に重要である。
【0231】
一部の実施形態では、光学活性の複数の事例と関連付けられ、標的核酸の場所と相関する複数の結合事象は、単一のオリゴヌクレオチドプローブ種の配列からではなく、オリゴヌクレオチドプローブ種の完全なセットからのデータを分析し、部分的に重複する配列から生じ得る結合事象または光学活性の事例を考慮することによって決定され得る。一例として、同じ場所に(実際には、サブナノメトリック的に近い)、プローブATTAAGおよびTTAAGCが結合している。それらは、6塩基長であり、共通の5塩基配列を共有し、それぞれが他方を検証するとともに、共通の5塩基配列のいずれかの側で配列が1塩基伸びている。場合によっては、5塩基配列の各側の1塩基は、不一致であり(末端における不一致は、典型的には、内部にある不一致よりも許容されると予想される)、両方の結合事象に存在するのは、5塩基配列のみであることが検証される。
【0232】
一部の代替的な実施形態では、一過的な単一分子の結合は、非光学的な方法によって検出される。一部の実施形態では、非光学的な方法は、電気的な方法である。一部の実施形態では、一過的な単一分子の結合は、直接的な励起方法が存在しない場合、非蛍光的な方法によって検出され、むしろ生物発光または化学発光の機構が使用される。
【0233】
一部の実施形態では、標的核酸中の各塩基は、配列が重複し得る複数のオリゴヌクレオチドプローブ種によって照合される。各塩基のこの繰り返しサンプリングは、標的核酸における希少な一塩基バリアントまたは変異の検出を可能にする。
【0234】
一部の実施形態では、分析下の各オリゴヌクレオチドプローブ種が標的核酸と有した光学活性または結合相互作用(閾値結合持続時間よりも長い持続時間を有する)のすべての事例が、かかる分析で利用される。一部の実施形態では、配列決定は、完全一致からの配列を繋ぎ合わせる、または再構築することを含み得るだけでなく、第1のソフトウェア配列決定プロセスで、各オリゴヌクレオチドプローブ種と関連する光学活性または結合事象の有効な事例を最初に分析することによって、配列を得ることができる。一部の実施形態では、一過的な結合は、検出手段として記録されるが、オリゴヌクレオチドプローブ種の結合の位置決定を改善するために使用されなくてもよい。
【0235】
光学活性を検出し、結合部位の局在を決定するための撮像技術。
ブロック214。一部の実施形態では、試験基板上の場所、および、任意選択的に、二次元撮像デバイスを使用した曝露プロセス中に生じる光学活性の各それぞれの事例の持続時間が測定される。
【0236】
一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって測定されるデータのフレームを訓練された畳み込みニューラルネットワークに入力することを含み得る。データのフレームは、異なる場所および同じ場所における光学活性の複数の事例のうち、異なる場所における光学活性のそれぞれの事例を含み得る。光学活性の複数の事例の光学活性の各事例は、標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に結合する個々のヌクレオチドプローブ種に対応し得る。入力に応答して、訓練された畳み込みニューラルネットワークは、光学活性の複数の事例の光学活性の1つ以上の事例の各々の試験基板上の位置を識別し得る。
【0237】
一部の実施形態では、検出器は、二次元検出器であり、結合事象は、ナノメトリック正確度で(例えば、単一分子局在化アルゴリズムを使用することによって)位置決定される。一部の実施形態では、相互作用の特徴は、標的核酸とのオリゴヌクレオチドプローブ種の結合親和性に対応し得る光学活性または結合事象の各事例の持続時間を含み得る。一部の実施形態では、特徴は、特定の標的核酸(例えば、特定の遺伝子配列に対応するポリヌクレオチド)のアレイ内の場所に対応し得る、試験基板の場所、表面、またはマトリックスである。
【0238】
一部の実施形態では、光学活性の各それぞれの事例は、所定の閾値を満たし得る観測メトリックを有する。一部の実施形態では、観測メトリックは、持続時間、シグナル・ノイズ比、光子計数、もしくは強度、またはそれらの組み合わせを含む。一部の実施形態では、光学活性のそれぞれの事例が1つのフレームに対して観察される場合、所定の閾値が満たされる。一部の実施形態では、光学活性のそれぞれの事例の強度が比較的低く、光学活性のそれぞれの事例が10分の1のフレームに対して観察される場合、所定の閾値が満たされる。
【0239】
一部の実施形態では、所定の閾値は、(i)オリゴヌクレオチドプローブ種の固有のN塩基長配列の各残基が、標的核酸の固定された第1の鎖または固定された第2の鎖の相補塩基に結合する、第1の結合形態と、(ii)オリゴヌクレオチドプローブ種の固有のN塩基長配列と、それぞれのオリゴヌクレオチドプローブ種が光学活性または結合事象のそれぞれの事例を形成するように結合している標的核酸の固定された第1の鎖または固定された第2の鎖の配列との間に少なくとも1つの不一致が存在する、第2の結合形態と、の間で区別され得る。
【0240】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種は、固有の対応する所定の閾値を有する。
【0241】
一部の実施形態では、所定の閾値は、標的核酸に沿った特定の場所における、オリゴヌクレオチドプローブ種と標的核酸との間の1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上の結合事象を観察することに基づいて、決定される。
【0242】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する(例えば、ラムダファージ、または任意の既知の合成標的核酸の配列決定に一過的な結合方法を適用することによって得られた情報に由来するデータセット)。一部の実施形態では、異なる閾値は、DNA塩基と比較してエピジェネティック修飾塩基またはRNA塩基(例えば、ウリジン)などの異なる塩基バリアントに対して決定され、そのような異なる閾値は、予想される試料の標的核酸の種類または潜在的に修飾された塩基領域(例えば、CpGアイランド)のうちの1つに対応して、使用される。
【0243】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する。訓練セットは、オリゴヌクレオチドプローブ種のセットにおける各それぞれのオリゴヌクレオチドプローブ種について、参照核酸配列に結合した際の各それぞれのオリゴヌクレオチドプローブ種についての観察メトリックの尺度を含み、そのため、それぞれのオリゴヌクレオチドプローブ種の固有のN塩基長配列の各残基が、参照核酸配列の相補塩基に結合する。
【0244】
一部の実施形態では、参照核酸は、参照基板上に固定される。一部の実施形態では、参照核酸は、試験基板とともに含まれ、試験基板上に固定される。一部の実施形態では、参照核酸配列は、PhiX174、M13、ラムダファージ、T7ファージ、大腸菌(Escherichia coli)、酵母(Saccharomyces cerevisiae)、分裂酵母(Saccharomyces pombe)のゲノムのすべてまたは一部分を含み得る。一部の実施形態では、参照核酸配列は、既知の配列の合成構築物である。一部の実施形態では、参照核酸配列は、ウサギグロビンRNAのすべてまたは一部分を含み得る(例えば、標的核酸がRNAを含む場合、または標的核酸の1つの鎖のみが配列決定される場合に利用される)。
【0245】
一部の実施形態では、曝露プロセスは、挿入色素の形態の第1の標識を利用し得る。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、第2の標識に結合される。第1の標識および第2の標識は、重複するドナー発光スペクトルおよびアクセプター励起スペクトルを有し、第1の標識および第2の標識が互いに近接している場合、第1の標識および第2の標識のうちの1つに蛍光レベルを増加させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、第2の標識に挿入する。一部の実施形態では、曝露プロセスおよび関連する蛍光は、フェルスター共鳴エネルギー移動(FRET)法を含み得る。かかる実施形態では、挿入色素は、FRETドナーを含み得、第2の標識は、FRETアクセプターを含み得る。
【0246】
一部の実施形態では、光学活性の事例は、オリゴヌクレオチドプローブ種または標的核酸配列に結合、連結、または会合した標識への挿入色素間のFRETを利用して検出される。一部の実施形態では、標的核酸が固定化された後、すべての標的核酸の末端は、例えば、ターミナルトランスフェラーゼによって、FRETパートナーとして機能し得る蛍光標識されたヌクレオチドを添加することによって標識される。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、その末端の1つにおいて、Cy3BまたはAtto542標識で標識される。
【0247】
一部の実施形態では、FRETは、光活性化によって置換される。かかる実施形態では、ドナー(例えば、標的核酸上の標識)は、光活性化剤を含み得、アクセプター(例えば、オリゴヌクレオチドプローブ種上の標識)は、不活性化または暗化された状態のフルオロフォアを含み得る(例えば、Cy5標識は、20mMのTris(pH7.5)、2mMのEDTA、および50mMのNaCl中で、1mg/mLのNaBH4を用いたケージ化によって暗化され得る)。かかる実施形態では、オリゴヌクレオチドプローブ種に結合され、かつ活性化剤に近接している場合にオンに切り替わり、その活性化剤が標的核酸に結合される、暗化されたフルオロフォアの蛍光。
【0248】
一部の実施形態では、曝露プロセスは、挿入色素(例えば、光活性剤)の形態の第1の標識を利用してもよい。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識(例えば、暗化されたフルオロフォア)に結合される。第1の標識は、第1の標識および第2の標識が互いに近接している場合、第2の標識を蛍光させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、オリゴヌクレオチドプローブ種に結合される第2の標識に挿入する。
【0249】
一部の実施形態では、曝露プロセスは、挿入色素(例えば、暗化されたフルオロフォア)の形態の第1の標識を利用してもよい。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識(例えば、光活性化剤)に結合される。第2の標識は、第1の標識および第2の標識が互いに近接しているときに、第1の標識を蛍光させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、オリゴヌクレオチドプローブ種に結合される第2の標識に挿入する。
【0250】
一部の実施形態では、曝露プロセスは、挿入色素を利用し得る。光学活性のそれぞれの事例は、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入される挿入色素の蛍光から生じ得、光学活性のそれぞれの事例は、それぞれの二重鎖に挿入される前の挿入色素の蛍光よりも大きい。標的核酸とオリゴヌクレオチドプローブ種との間の二重鎖に挿入される1つ以上の挿入色素の蛍光の増加(100倍以上)は、単一分子局在化アルゴリズムのための点光源(point source)様シグナルを提供し得、結合部位の場所の正確な決定を可能にし得る。挿入色素は、二重鎖に挿入されてもよく、強力に検出され、正確に位置決定される各オリゴヌクレオチドプローブ種結合部位の結合事象に関連する、相当数の二重鎖に起因する光学活性の事例を生成してもよい。
【0251】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、標的核酸の固定された第1の鎖の相補部分に結合することによって、光学活性の第1の事例を生じ、標的核酸の固定された第2の鎖の相補部分に結合することによって、光学活性の第2の事例を生じる。一部の実施形態では、標的核酸の固定された第1鎖の一部分は、その相補オリゴヌクレオチドプローブ種の結合による光学活性の事例を生じ得、標的核酸の固定された第1鎖の一部分に相補的な標的核酸の固定された第2鎖の一部分は、その相補オリゴヌクレオチドプローブ種の結合による光学活性の別の事例を生じ得る。
【0252】
一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、標的核酸の固定された第1の鎖の2つ以上の相補領域に結合することによって、光学活性の2つ以上の第1の事例を生じ得、標的核酸の固定された第2の鎖の2つ以上の相補領域に結合することによって、光学活性の2つ以上の第2の事例を生じ得る。
【0253】
一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブ種に相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に、3回以上結合し得、それによって、3つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。
【0254】
一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブに相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に、5回以上結合し得、それによって、5つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。
【0255】
一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、10回以上結合し得、それによって、10個以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。
【0256】
一部の実施形態では、曝露プロセスは、5分以下、4分以下、3分以下、2分以下、または1分以下であってもよい。
【0257】
一部の実施形態では、曝露プロセスは、二次元撮像デバイスの1つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの2つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの500つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの5,000つ以上のフレームで生じ得る。一部の実施形態では、光学活性がまばらである場合(例えば、空間的にプローブ結合が少ない事例がある)、一過的な結合の1つのフレームは、オリゴヌクレオチドプローブ種の結合部位に関連するシグナルを位置決定するのに十分である。
【0258】
一部の実施形態では、曝露プロセス中の光学活性の平均的な事例の予想される時間の長さは、曝露プロセスで使用されるオリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種の推定融解温度によって決定される。
【0259】
一部の実施形態では、光学活性は、標識からの蛍光発光の検出を含み得る。それぞれの標識は、励起され、対応する発光波長は、フィルタホイールの異なるフィルタを使用して、別々に検出される。一部の実施形態では、標識発光寿命は、蛍光寿命撮像(FLIM)システムを使用して測定される。代替的に、発光波長は、分割され、単一のセンサーの異なる象限に、または4つの別々のセンサーに投影される。一部の実施形態では、プリズムを使用して、CCDの画素にわたって発光スペクトルを分割する方法が、Lundquit et al.,Opt Lett.,33:1026-8,2008に記載のように使用(sued)される。一部の実施形態では、スペクトログラフも使用され得る。代替的に、一部の実施形態では、発光波長を輝度レベルと組み合わせて、予想されるオリゴヌクレオチドプローブ種の結合時間がフレーム曝露時間よりも有意に短い場合、結合部位におけるプローブの滞留時間に関する情報を提供し得る。
【0260】
走査型プローブ顕微鏡法(高速原子間力顕微鏡法を含む)および電子顕微鏡法などのいくつかの検出方法は、ポリヌクレオチド分子が検出面で伸長されている場合、ナノメトリック距離を解像することができる。しかし、これらの方法は、フルオロフォアの光学活性に関する情報を提供しない。超解像精度で蛍光分子を検出するための複数の光学撮像技術がある。これらには、誘導放出抑制(STED)、確率的光学再構築顕微鏡(STORM)、超解像光学ゆらぎ撮像(SOFI)、単一分子局在顕微鏡(SMLM)、および全反射照明蛍光顕微鏡(TIRF)が含まれる。一部の実施形態では、ナノスケールトポグラフィーイメージングのための点集積(PAINT)に最も類似したSMLMアプローチが使用される。これらのシステムは通常、フルオロフォアを励起するための1つ以上のレーザ、焦点検出/保持機構、1つ以上のCCDまたはCMOSカメラ、適切な対物レンズ、リレーレンズ、およびミラーを必要とする。一部の実施形態では、オリゴヌクレオチドプローブ種のオン結合(binding-on)およびオフ結合(binding-off)を記録するためのいくつかの画像フレーム(例えば、動画または映像ビデオ)について、曝露ステップが生じ得る。
【0261】
SMLM法は、高い光子計数に依存する。高い光子計数は、生成されたガウスパターンのフルオロフォア発光の重心が決定される精度を向上させるが、高い光子計数の必要性は、長い画像の取得および明るく光安定性のフルオロフォアへの依存にも関連している。高濃度のプローブ溶液は、クエンチされたプローブ、分子ビーコンを使用するか、または相補オリゴヌクレオチドプローブ種と会合した2つ以上の標識(例えば、標的核酸を形成する二重鎖の両側に1つ)を有することによって、支障となるバックグラウンドを引き起こすことなく利用される。かかる実施形態では、標識は、色素間の相互作用を介して溶液中でクエンチされる。しかしながら、それらが標的に結合すると、標識が分離し、蛍光が明るくなり(例えば、単一の色素の2倍の輝度で)、より検出されやすくなる。
【0262】
一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブ種のオン速度(on-rate)は、例えば、プローブ濃度を上げること、温度を上げること、または分子クラウディング(molecular crowding)を増すことによって(例えば、溶液中にPEG400、PEG800などを含むことによって)、変化する(例えば、増加する)。他の実施形態では、オリゴヌクレオチドプローブ種であるプローブ種のオフ速度(off-rate)は、例えば、オリゴヌクレオチドプローブ種であるプローブ種の熱安定性を低下させることによって、化学成分を操作すること、不安定化付属体を添加することに、またはオリゴヌクレオチドプローブ種の場合、具体的には、それらの長さを減らすこと、天然塩基の代わりにエピジェネティック修飾塩基もしくは合成修飾塩基を使用すること、オリゴヌクレオチドプローブ種の骨格を修飾することによって(例えば、核酸塩基間もしくは糖間の間隔を変えることによって、例えば、電荷を付加することによって)、変化する。一部の実施形態では、オフ速度は、温度を上げること、塩濃度を減らすこと(例えば、厳密に増加させること)、またはpHを変化させることによって、増加する。
【0263】
一部の実施形態では、使用されるオリゴヌクレオチドプローブ種の濃度は、オリゴヌクレオチドプローブ種の標識であるプローブ標識を、本質的に、それらが結合するまで非蛍光にすることによって、バックグラウンドレベルを有意に上昇させることなく、増加される。これを行う1つの方法は、結合が、光活性化事象を誘発することである。別の例は、結合が生じるまで標識をクエンチすることである(例えば、分子ビーコン)。別の例は、シグナルを、エネルギー移動事象(例えば、FRET、CRET、BRET)の結果として検出することである。一部の実施形態では、標的核酸であるバイオポリマーが、ドナーに結合し、試験基板である表面にあり、オリゴヌクレオチドプローブ種であるプローブが、アクセプターに結合する(またはその逆)。別の実施形態では、挿入色素は、溶液中に提供され、標識されたプローブが結合すると、挿入色素と標識されたプローブとの間にFRET相互作用が存在する。挿入色素の例は、YOYO-1であり、プローブ上の標識の例は、ATTO655である。別の実施形態では、挿入は、FRET機構なしで使用される色素であり、試験基板または他の表面上の一本鎖標的核酸およびオリゴヌクレオチドプローブ種の両方が非標識であり、シグナルは、挿入色素が挿入され得る相補二本鎖を、結合が生成する場合にのみ、検出され得る。挿入色素は、二重鎖核酸に挿入されておらず、代わりに溶液中に遊離している場合、その同一性に応じて、輝度が100分の1または1000分の1以下である。一部の実施形態では、TIRFまたは薄層斜光照明(HILO)(例えば、Mertz et al.,J.of Biomedical Optics,15(1):016027,2010)顕微鏡を使用して、溶液中の挿入色素から任意のバックグラウンドシグナルを排除する。
【0264】
一部の実施形態では、試験基板または他の表面上のシグナルの検出を不明瞭にさせ得る高いバックグラウンド蛍光の低減(不明瞭化は、高濃度の標識プローブから生じ得る)。一部の実施形態では、これは、試験基板または他の表面上に形成される二重鎖を標識するためのDNA染色剤または挿入色素を利用することによって対処される。色素は、標的核酸が一本鎖である場合も、一本鎖プローブにも挿入されない可能性があるが、オリゴヌクレオチドプローブ種と標的核酸との間に二重鎖が形成された場合、挿入色素が挿入される。一部の実施形態では、オリゴヌクレオチドプローブ種は非標識であり、検出されるシグナルは、挿入色素のみから生じ得る。一部の実施形態では、オリゴヌクレオチドプローブ種は、挿入色素またはDNA染色剤に対するFRETパートナーとして機能し得る標識で標識される。一部の実施形態では、挿入色素はドナーであり、異なる波長のアクセプターと結合され得、したがって、オリゴヌクレオチドプローブ種を複数のフルオロフォアでコードすることが可能になる。
【0265】
一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種に相補的な各標的核酸部位に関連する光学活性または結合事象の複数の事例を検出し得る。一部の実施形態では、複数の事象は、単一のオリゴヌクレオチドプローブ分子のオンおよびオフ結合からのもの、オリゴヌクレオチドプローブ種の亜種のオンおよびオフ結合からのもの、またはオリゴヌクレオチドプローブ種のオンおよびオフ結合からのもの、ならびに前述の結合事象の任意の組み合わせ(単一、亜種、または種のオリゴヌクレオチドプローブ)からのものであり、複数回生じ得る。一部の実施形態では、オン結合またはオフ結合の速度は、条件の変化によって影響を受けない場合がある。例えば、オン結合およびオフ結合の両方が、同じ条件下(例えば、塩濃度、温度など)で生じ、プローブ・標的相互作用が弱いことに起因する。
【0266】
一部の実施形態では、配列決定は、(より短い、同じ長さの、またはオリゴヌクレオチドプローブ種の長さの桁内の)単一の標的核酸上の複数の場所での光学活性またはオン・オフ結合事象の複数の事例を撮像することによって行われる。かかる実施形態では、より長い標的核酸が断片化されるか、または断片のパネルが予め選択され、試験基板または他の表面上に配列されており、そのため、各標的核酸分子は、個別に解像可能である。これらの場合、光学活性の事例の頻度もしくは持続時間、またはオリゴヌクレオチドプローブ種の特定の場所への結合を使用して、オリゴヌクレオチドプローブ種が標的核酸配列に完全に相補的であるかどうかを決定する。オリゴヌクレオチドプローブ種の結合の頻度または持続時間により、オリゴヌクレオチドプローブ種が標的核酸配列のすべてまたは一部に相補的であるかどうか(残りの塩基は不一致またはオーバーハングである)決定され得る。
【0267】
一部の実施形態では、標的核酸間の横並び(side-by-side)の重複の発生が、一部の実施形態では、DNA染色剤からの蛍光の増加によって検出される。一部の実施形態では、染色剤が使用されなくてもよく、重複は、名目上単一であるが実際には重複した対の標的核酸の領域内の見かけの結合部位の頻度の増加によって検出される。例えば、回折限界分子が光学的に重複しているように見えるが、実際には物理的に重複していない可能性があるいくつかの事例では、本開示の他箇所に記載されているように、単一分子局在化を使用して超解像される。端部間(end-on-end)の重複が生じる場合、一部の実施形態では、標的核酸のマーキング末端の標識を使用して、並んだ標的核酸を真の連続した長さの単一の標的核酸から区別する。一部の実施形態では、そのような光学キメラは、ゲノムまたは標的配列の多くのコピーが予想され、見かけのキメラの出現が1回だけ見出される場合、アーティファクトとして却下される。一部の実施形態では、標的核酸の末端(回折限界)が光学的に重複して見えるが、物理的に重複していない場合、それらは、本開示の方法によって解像される。一部の実施形態では、場所決定は、非常に正確であり、そのため、非常に近い標識から発せられるシグナルが解像される。
【0268】
一部の実施形態では、配列決定は、オリゴヌクレオチドプローブ種よりも長い単一の標的核酸上の複数の場所での光学活性またはオン・オフ結合事象の複数の事例を撮像することによって行われる。一部の実施形態では、単一の標的核酸にわたる光学活性またはプローブ結合事象の事例の場所が決定される。一部の実施形態では、単一の標的核酸にわたる光学活性または結合事象のオリゴヌクレオチドプローブ種の事例の場所は、標的核酸を伸長することによって決定され、そのため、標的核酸の長さに沿った光学活性または結合事象の事例の異なる場所が検出され、解像される。
【0269】
一部の実施形態では、非結合オリゴヌクレオチドプローブ種の光学活性を、標的核酸に結合したオリゴヌクレオチドプローブ種から区別することは、結合していないオリゴヌクレオチドプローブ種からのシグナルの拒絶(rejection)または除去(removal)を必要とし得る。一部のかかる実施形態では、これは、例えば、照明のためにエバネッセント場または波導を利用することによって、またはFRETペア標識を利用することによって、または光活性化を利用して、特定の場所でオリゴヌクレオチドプローブ種を検出することによって、実現される(例えば、Hylkje et al.,Biophys J.2015;108(4):949-956に記載されている)。
【0270】
一部の実施形態では、
図13A~13Cに示されるように、オリゴヌクレオチドプローブ種は、標識されていなくてもよいが、標的との相互作用が、結合が生じるかまたは生じた場合(例えば、
図13A~
図13Cに示されるように)、二重鎖に挿入されて蛍光を発する(挿入された色素1304のように)、結合していない挿入色素1302などのDNA染色剤を使用して検出される。一部の実施形態では、1つ以上の挿入色素は、標的核酸とオリゴヌクレオチドプローブ種との間の単一の二重鎖に、任意の時点で挿入され得る。一部の実施形態では、挿入された挿入色素によって発光される蛍光は、溶液中で浮遊する遊離状態の非結合挿入色素からの蛍光よりも桁違いに大きい。例えば、挿入されたYOYO-1色素からのシグナルは、溶液中の遊離したYOYO-1色素からのシグナルよりも約100倍大きい。一部の実施形態では、軽く染色された(または部分的に光退色された)二本鎖ポリヌクレオチドが撮像される場合、観察されるポリヌクレオチドに沿った個々のシグナルは、単一の挿入色素分子に対応し得る。二重鎖におけるYOYO-1色素の交換を促進し、明るいシグナルを得るために、一部の実施形態では、結合緩衝液中に、メチルビオローゲンおよびアスコルビン酸を含むレドックス酸化系(ROX)が提供される。
【0271】
一部の実施形態では、単一の色素分子で標識された個々のヌクレオチドの組み込みを検出することによる単一標的核酸上での配列決定(例えば、HelicosおよびPacBioの配列決定によって実現されるような)は、色素が検出されない場合、エラーが導入され得る。場合によっては、これは、ヌクレオチドがもはや色素に結合されていないか、単一ヌクレオチド結合事象が検出するには短すぎるか、色素が光退色されているか、色素の点滅により検出された累積シグナルが弱いか、色素の発光が弱すぎるか、または色素が長い暗い光物理状態に入るためである。一部の実施形態では、これは、いくつかの代替的な方法で克服される。第一に、好ましい光物理的特性を有する強力な個々の色素(例えば、Cy3B)でヌクレオチドを標識することである。別の例は、光退色および暗い光物理的状態(例えば、β-メルカプトエタノール、Trolox、ビタミンCおよびその誘導体、レドックス系)を低減する緩衝液条件および添加剤を提供することである。別の例は、光への曝露を最小化することである(例えば、より短い曝露を必要とするより高感度の検出器を有すること、またはストロボ照明を提供すること)。第二に、単一の色素の代わりに、量子ドット(例えば、Qdot655)、フルオロスフィア、ナノダイヤモンド、プラズモン共鳴粒子、光散乱粒子などのナノ粒子で、ヌクレオチドを標識することである。別の例は、単一の色素ではなく、ヌクレオチド当たり多くの色素を有することである(例えば、
図14Cおよび
図14Dに示されているように)。この場合、複数の色素1414は、それらの自己消光を最小化するように(例えば、それらを十分に離してDNA折り紙などの剛性ナノ構造1412を使用して)、または剛性リンカーを介した線形間隔で組織化される。
【0272】
一部の実施形態では、検出誤差率は、溶液中の尿素、アスコルビン酸またはその塩、イソアスコルビン酸またはその塩、β-メルカプトエタノール(BME)、DTT、レドックス系、またはTroloxから選択される1つ以上の化合物の存在下で、さらに低減される(および、シグナル寿命が延びる)。
【0273】
一部の実施形態では、標的核酸単独へのプローブの一過的な結合は、色素光物理学による誤差を低減するのに十分である。曝露プロセス中に得られた情報は、異なる標識オリゴヌクレオチドプローブ種の多くのオン/オフ相互作用の集約である。したがって、標識を欠いているか、単一の結合事象を適切に検出するには短すぎるか、標識が光退色されているか、または暗状態にある場合でも、標的核酸に結合する他のオリゴヌクレオチドプローブ種上の標識は、すべて標識を欠いているわけではないか、検出するには短すぎる結合事象を有するか、光退色されているか、または標識が暗状態にあり、したがって、一部の実施形態では、それらの結合部位の場所に関する情報を提供することになる。
【0274】
一部の実施形態では、各一過的な結合事象における標識からの光学活性シグナルの事例は、二次元撮像デバイスの2つ以上の画素をカバーする光路(典型的には、拡大率を提供する)を通して投影される。光学活性シグナルの事例に対する点広がり関数(PSF)が決定され、PSFの重心が光学活性シグナルの事例の正確な場所として使用される。一部の実施形態では、位置決定は、サブ回折(例えば、超解像)およびサブナノメートル正確度でさえ決定される。位置決定の正確度は、収集された光子数に反比例する。したがって、蛍光標識によって1秒当たりに放出される光子が多いほど、またはより長く光子が収集されるほど、正確度が高くなる。
【0275】
一実施例では、
図10Aおよび
図10Bに示されるように、各オリゴヌクレオチドプローブ種の結合部位における光学活性または結合事象の事例の数と、収集された光子数との両方が、達成される局在化の程度と相関する。標的核酸1002の場合、結合部位について記録された最小数の結合事象1004-1および最小数の光子1008-1は、それぞれ、最も低い精度の位置決定1006-1および1010-1と相関する。結合部位について、いくつかの結合事象の数1004-2、1004-3、またはいくつかの記録された光子の数1008-2、1008-3のいずれかが増加するにつれて、位置決定の程度、それぞれ1006-2、1006-3および1010-2、1010-3が増加する。
図10Aでは、標的核酸1002を有する標識されたオリゴヌクレオチドプローブ種の光学活性または結合事象(例えば、1004-1、1004-2、1004-4)の異なる数の検出された確率的事例は、プローブ(1006-1、1006-2、1006-3)の異なる程度の位置決定をもたらし、より多くの数の結合事象(例えば、1004-2)は、より高い程度の位置決定(例えば、1006-2)と相関し、より少ない数の結合事象(例えば、1004-1)は、より低い程度の位置決定(例えば、1006-1)と相関する。
図10Bでは、同様に、検出される異なる数の光子(例えば、1008-1、1008-2、および1008-3)は、異なる程度の位置決定をもたらす(それぞれ、1010-1、1010-2、および1010-3)。
【0276】
代替的な実施形態では、各一過的な結合事象における標識からのシグナルは、光学倍率経路を介して投影されない場合がある。代わりに、基板(典型的には、標的核酸分子が存在し得る光学的に透明な表面)は、二次元検出器アレイに直接結合される。検出器アレイの画素が小さい場合(例えば、1平方ミクロン以下)、検出器の表面上のシグナルの1対1の投影は、結合シグナルが少なくとも1ミクロン正確度で局在することを可能にし得る。標的核酸が十分に伸展されている(例えば、2キロ塩基の標的核酸が1ミクロンの長さに伸展されている)場合、一部の実施形態では、2キロ塩基間隔のシグナルが解像される。例えば、シグナルが4096塩基ごとまたは2ミクロンごとに生じると予想される、6塩基長プローブの場合、前述の分解能は、個々の結合部位を明確に位置決定するのに十分である。シグナルは、2つの画素と中間場所との間に部分的に発生し得る(例えば、シグナルが2つの画素間にある場合、解像度は、1平方ミクロンの画素について500nmまたはそれよりも良好であり得る)。一部の実施形態では、超解像法は、二次元撮像デバイスと比較して、適切な場所に標的核酸を有するシステムのために利用される。そのような場所は、二次元撮像デバイスに使用されるセンサーの種類に応じて変化し得る。例えば、裏面入射型CCDは、前面照射型CCDよりもセンサーの検出面からさらに遠い実際のセンサー領域を有し、両方とも、各画素に不随するナノレンズを利用し得るCCDまたはCMOS撮像デバイスとは著しく異なる。一部の実施形態では、基板は、より高い解像度を提供するために、二次元アレイ検出器に関してXおよび/またはYの寸法で物理的に変換(translated)される(例えば、100nmの増分で)。かかる実施形態では、デバイスまたはシステムは、レンズまたはレンズ間の空間を必要としないため、より小さい(またはより薄い)。一部の実施形態では、基板の変換はまた、分子記憶読み出しを既存のコンピュータおよびデータベースとより互換性のある電子読み出しに直接変換することを提供する。一部の実施形態では、時間分解蛍光が利用され、蛍光寿命を捕捉するために利用されるか、または単に励起バックグラウンドを排除するために使用される。
【0277】
一部の実施形態では、光学活性または結合事象の高速の一過的な事例を捕捉するために、捕捉フレームレートが増加し、データ転送速度が標準顕微鏡技術よりも増加する。一部の実施形態では、曝露プロセスの速度は、高フレームレートをプローブの濃度の増加と結合することによって増加する。しかしながら、最大フレームレートは、各フレームに関連する取得シグナルと比較して、電子ノイズを低減するのに適切である。200ミリ秒露光の電子ノイズは、単一の100ミリ秒露光と同じであるが、単一の200ミリ秒露光と2つの100ミリ秒露光を比較すると、2の平方根と同じくらい高くなる。
【0278】
より高速のCMOSカメラが利用可能になり、より高速の撮像が可能になってきている。例えば、Andor Zyla Plusは、USB3.0接続のみで、512x1024画素平方で、最大398フレーム/秒を可能にし、限られた関心領域(ROI)(画素数が少ない)またはCameraLink接続を使用する場合、さらに高速である。
【0279】
一部の実施形態では、高速撮像を実現し得るシステムは、ガルボミラーまたはデジタルマイクロミラーを使用して、時間的に増分された画像を異なるセンサーに送信し得る。動画のフレームの正しい順序は、異なるセンサーからのフレームを取得時間に応じてインターリーブすることによって再構築される。
【0280】
一部の実施形態では、一過的な結合プロセスは、塩濃度などの様々な生化学パラメータを調整することによって高速化することができる。高フレームレートのカメラがいくつか存在し、それを、結合の速度を一致させるために使用することができ、多くの場合、視野を制限して、画素のサブセットからより高速な読み出しを得ている。一部の実施形態では、ガルバノメーターミラーは、単一のセンサーの異なる領域に連続したシグナルを時間的に分配するために、またはセンサーを分離するために利用される。後者は、センサーの全視野の利用を可能にするが、分配されたシグナルがコンパイルされると、全体的な時間分解能が向上する。
【0281】
複数の結合事象のデータセットの構築。
ブロック218。一部の実施形態では、曝露および測定プロセスは、オリゴヌクレオチドプローブ種のセットの個々のオリゴヌクレオチドプローブ種について反復され、それによって、試験基板上の光学活性または結合事象の複数の位置のセット、オリゴヌクレオチドプローブ種のセットの単一のオリゴヌクレオチドプローブ種に対応する試験基板上の光学活性または結合事象の各それぞれの位置のセットを得る。
【0282】
一部の実施形態では、オリゴヌクレオチドプローブのセットは、オリゴヌクレオチドプローブの複数のサブセットを含み得、オリゴヌクレオチドプローブの複数のサブセットの種のオリゴヌクレオチドプローブの種の各それぞれのサブセットについて、反復して曝露および測定プロセスが行われる。
【0283】
一部の実施形態では、オリゴヌクレオチドプローブ種の各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセットからの2つ以上の異なるオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種の各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の4つ以上の異なるオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブのセットは、オリゴヌクレオチドプローブ種の4つのサブセットを含み得る。
【0284】
一部の実施形態では、本方法は、各オリゴヌクレオチドプローブ種の計算されたまたは実験的に導出された融解温度に基づいて、オリゴヌクレオチドプローブ種のセットを、オリゴヌクレオチドプローブ種の複数のサブセットに分割することをさらに含み得る。同様の融解温度を有するオリゴヌクレオチドプローブ種を、分割によってオリゴヌクレオチドプローブの同じサブセットに配置する。さらに、曝露プロセスの温度または持続時間は、オリゴヌクレオチドプローブ種の対応するサブセットのオリゴヌクレオチドプローブ種の平均融解温度によって決定される。
【0285】
一部の実施形態では、本方法は、各オリゴヌクレオチドプローブ種の配列に基づいて、オリゴヌクレオチドプローブのセットを、オリゴヌクレオチドプローブの複数のサブセットに分割することをさらに含み得、配列が重複しているオリゴヌクレオチドプローブ種は、異なるサブセットに配置される。
【0286】
一部の実施形態では、曝露および測定プロセスを反復することは、オリゴヌクレオチドプローブ種のセットの各単一のオリゴヌクレオチドプローブ種に対して行われる。
【0287】
一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の温度で行われ、曝露および測定プロセスを反復することは、第1のオリゴヌクレオチドプローブ種の曝露および測定プロセスを、第2の温度で行うことを含み得る。
【0288】
一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の温度で行われ得る。曝露および測定プロセスを反復する事例は、第1のオリゴヌクレオチドプローブ種に対する曝露および測定プロセスを、複数の異なる温度の各々で行うことを含み得る。本方法は、複数の異なる温度の第1の温度および各温度についての曝露および測定プロセスによって決定された光学活性の事例の測定された場所、および任意選択的に、持続時間を使用して、第1のオリゴヌクレオチドプローブ種の融解曲線を構築することをさらに含み得る。
【0289】
一部の実施形態では、試験基板は、曝露および測定プロセスを反復する前に洗浄され、それによって、試験基板を異なる1つ以上のオリゴヌクレオチドプローブ種に曝露する前に、試験基板から1つ以上のそれぞれのオリゴヌクレオチドプローブ種を除去する。任意選択的に、第1のオリゴヌクレオチドプローブ種を1つ以上の洗浄液で置換し、次いで、異なる1つ以上のオリゴヌクレオチドプローブ種を添加する。
【0290】
一部の実施形態では、試験基板上の結合事象の場所を測定することは、二次元撮像デバイスによって取得されたデータのフレーム内の光学活性のそれぞれの事例の中心を識別および適合するための適合関数を用いて、光学活性のそれぞれの事例を識別および適合することを含み得る。光学活性のそれぞれの事例の中心は、試験基板上の光学活性または結合事象のそれぞれの事例の場所であるとみなされる。
【0291】
一部の実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。ガウス適合は、顕微鏡システムのPSFの近似であるだけでなく、一部の実施形態では、スプライン(例えば、三次スプライン)またはフーリエ変換アプローチの追加は、PSFの中心を決定する正確度を向上させ得る(例えば、Babcock et al.,Sci Rep.7:552,2017およびZhang et al.,46:1819-1829,2007に記載されている)。
【0292】
一部の実施形態では、測定プロセスの完了後、オリゴヌクレオチドプローブ種の単一の名目上の結合場所についての光学活性の位置のセットは、決定された位置および識別されたオリゴヌクレオチドプローブ種を有し(例えば、検出された発光波長により)、プロセスは、セットからのどのオリゴヌクレオチドプローブ種が、標的核酸への重複した名目上の結合場所を有するかを決定することができる(例えば、どれが、例えば、異なる数の検出される光子により、異なるオリゴヌクレオチドプローブ種について異なる決定された許容範囲内の同じナノメトリック場所に結合するか)。一例では、ナノメトリック場所は、中心が1nm(+/-0.5nm)の精度で定義され、したがって、それぞれのPSF重心の重複についてのそれぞれの精度または許容度が一緒にビニングされるであろう。各単一の定義されたオリゴヌクレオチドプローブ種は、適切な精度または許容度(ナノメートルまたはサブメートル)で、ナノメートル(またはサブナノメートル)の重心への正確な局在を可能にするために、複数回結合し得る(例えば、放出および収集される光子数に応じて)。
【0293】
一部の実施形態では、ナノメトリックまたはサブナノメトリックの位置決定は、例えば、5’-AGTCG-3’のオリゴヌクレオチドプローブ種配列の、第1の塩基がAであり、第2の塩基がGであり、第3の塩基がTであり、第4の塩基がCであり、第5の塩基Gであると決定してもよい。このようなパターンは、5’-CGACT-3’の標的配列を示唆する。したがって、すべての単一塩基が定義された1024個の5塩基長のオリゴヌクレオチドプローブ種は、上に記載されるプローブコーディングシステムを使用して、5サイクルを使用して、適用または試験され、各サイクルは、プロセスを曝露、決定、および反復することを含み得、オリゴヌクレオチドプローブ種プールの添加ステップおよび洗浄ステップの両方をさらに含み得る。一部の実施形態では、オリゴヌクレオチド[プローブ種のプール中の各特異的オリゴヌクレオチドプローブ種の濃度は、単独で使用する場合よりも低い。一部の実施形態では、データの取得は、異なるオリゴヌクレオチドプローブ種間の競合の潜在的な結果として、結合事象の閾値数に達するために、曝露プロセス中に、より長い時間またはより多くのフレームが取得される。一部の実施形態では、縮重塩基または普遍的塩基を利用し得るより高い濃度のオリゴヌクレオチドプローブ種を、縮重塩基または普遍的塩基を有しない同じk塩基長の種の長さのオリゴヌクレオチドプローブ種として使用される。一部の実施形態では、コードスキームは、オリゴヌクレオチドプローブ種の直接標識化によって、例えば、オリゴヌクレオチドプローブ種の3’または5’位置で標識を合成またはコンジュゲートすることによって実現される。しかしながら、一部の代替的な実施形態では、これは、間接的な標識によって(例えば、本明細書に記載されるように、フラップ配列を各標識オリゴに付着させることによって)行われる。
【0294】
一部の実施形態では、各オリゴヌクレオチドプローブ種の場所は、その場所についての複数の結合事象のPSFを決定することによって正確に定義され、次いで、オフセット結合事象からの部分的な配列重複(および、利用可能な場合、二重鎖形態の標的核酸の相補鎖からデータ)によって裏付けられ得る。本明細書に記載される一部の実施形態は、1または数ナノメートルへのプローブ結合の単一分子局在化に高度に依存している。
【0295】
一部の実施形態では、光学活性のそれぞれの事例は、二次元撮像デバイスによって測定されるように、複数のフレームにわたって持続し得る。試験基板上の場所を測定することは、複数のフレームにわたる光学活性のそれぞれの事例の中心を識別するために、複数のフレームにわたって適合関数を用いて、光学活性のそれぞれの事例を識別および適合することを含む。光学活性のそれぞれの事例の中心は、複数のフレームにわたって試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部の実施形態では、適合関数は、複数のフレームの各フレーム上の中心を個別に決定し得る。他の実施形態では、適合関数は、複数のフレームにわたってまとめて光学活性の事例の中心を決定し得る。
【0296】
一部の実施形態では、適合は、直接隣接する(例えば、半画素以内の)局在が次のフレームに存在する場合、それらがどれだけ明るいかによって重み付けされ、それらを一緒に平均化し得る追跡ステップを利用することができ、それは、これが光学活性または結合事象の単一の事例であると仮定し得る。しかしながら、光学活性の事例が複数のフレームによって分離される場合(例えば、結合事象間の、少なくとも5フレームのギャップ、少なくとも10フレームのギャップ、少なくとも25フレームのギャップ、少なくとも50フレームのギャップ、または少なくとも100フレームのギャップ)、適合機能は、それらが異なる結合事象であると仮定し得る。光学活性または結合事象の異なる事例を追跡することは、配列割当における信頼性を向上させるのに役立ち得る。
【0297】
一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも20nmの位置決定精度で解像し得る。一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも2nm、少なくとも60nm、少なくとも6nmの位置精度で解像し得る。一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に、2nm~100nmの位置決定精度で解像し得る。一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に解像し得、位置は、サブ回折限界の位置であり、サブ回折限界であり得る精度を有する。一部の実施形態では、解像度は、精度よりも限定的である。
【0298】
一部の実施形態では、測定プロセスは、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を決定し得、測定プロセスは、光学活性の1つ以上の事例が、場所において5000超個の光子を含んでいることを決定し得る。一部の実施形態では、測定プロセスは、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を決定し得、測定プロセスは、光学活性の1つ以上の事例が、場所において50,000超個の光子、または場所において200,000超個の光子を含んでいることを決定し得る。
【0299】
各色素は、光子を生成し得る最大速度(例えば、1KHz~1MHz)を有する。例えば、いくつかの色素は、1秒間に200,000個の光子しか測定できない。色素の典型的な寿命は、10ナノ秒であり、したがって、1秒当たり100,000,000個の光子を放出し、これを収集効率と組み合わせた場合、検出器の量子効率の濾過損失により、検出される1秒当たりの光子が桁違いに少なくなる可能性がある。したがって、一部の実施形態では、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を測定することは、関連付けられた場所で、1,000,000個超の光子を測定し得る。
【0300】
場合によっては、特定の外れ値配列は、非ワトソン-クリック様式で結合し得るか、または短いモチーフは、異常に高いオン速度または低いオフ速度をもたらし得る。例えば、RNAとDNA間の一部のプリン-ポリプリリミジン相互作用は、非常に強力である(例えば、AGGなどのRNAモチーフ)。これらは、より低いオフ速度を有するだけでなく、核形成配列がより安定なため、より高いオン速度を有する。場合によっては、特定の既知の規則に必ずしも適合しない外れ値から結合が生じる。一部の実施形態では、アルゴリズムは、そのような外れ値を識別するために、またはそのような外れ値の期待値を考慮に入れるために使用される。
【0301】
一部の実施形態では、光学活性のそれぞれの事例は、試験基板について観察されるバックグラウンドに比べて、所定の数の標準偏差(例えば、3、4、5、6、7、8、9、または10標準偏差を超える)よりも大きい。
【0302】
一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の期間行われる。一部のかかる実施形態では、曝露および測定プロセスを反復することは、第2の期間、第2のオリゴヌクレオチドプローブ種の曝露プロセスを行うことを含み得る。第1の期間は、第2の期間を超える。
【0303】
一部の実施形態では、曝露プロセスは、二次元撮像デバイスを使用して、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の数のフレームについて行われる。一部のかかる実施形態では、曝露および測定プロセスを反復することは、二次元撮像デバイスを使用して、第2のオリゴヌクレオチドプローブ種に対して、第2の数のフレームについて曝露プロセスを行うことを含み得る。第1のフレーム数は、第2のフレーム数を超える。
【0304】
一部の実施形態では、1つ以上のタイリングセットの相補オリゴヌクレオチドプローブ種を、変性された二重鎖標的核酸の各鎖に結合させるために使用する。
図11Bに示されるように、試験基板上の複数の位置のセットを使用して、標的核酸の少なくとも一部分の配列を決定することが可能であり、これは、標的核酸1110の固定された第1の鎖に対応する第1のタイリング経路1114、および標的核酸1112の固定された第2の鎖に対応する第2のタイリング経路1116を決定することを含み得る。
【0305】
一部の実施形態では、第1のタイリング経路における切れ目は、第2のタイリング経路の対応する部分を使用して解決され、タイリング経路における切れ目は、所望の信頼度で塩基配列を決定することができないことであり、切れ目を解決することは、所望の信頼度で塩基配列を決定することである。一部の実施形態では、第1のタイリング経路または第2のタイリング経路における切れ目は、参照配列を使用して解決される。一部の実施形態では、第1のタイリング経路または第2のタイリング経路の切断は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して解決される。
【0306】
一部の実施形態では、各結合部位についての標的核酸配列の配列割当の信頼度は、第1のタイリング経路および第2のタイリング経路の対応する部分を使用して増加する。一部の実施形態では、標的核酸配列の配列割当の信頼度は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して増加する。
【0307】
配列の整列またはアセンブリ。
ブロック222。一部の実施形態では、標的核酸の少なくとも一部分の配列は、複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットを使用して決定される。
【0308】
一部の実施形態では、連続した配列は、デノボアセンブリを介して得られる。他の実施形態では、アセンブリを容易にするために、参照配列が使用される。完全なゲノム配列決定が、ゲノムの同じ領域(理想的には、同じ染色体に由来する分子)にわたる複数の標的核酸分子からの情報の合成を必要とする場合、アルゴリズムは、複数の標的核酸分子から得られた情報を処理する必要があり得る。一部の実施形態では、複数の標的核酸分子間の共通の配列に基づいて標的核酸配列を整列させ得るアルゴリズムが利用され、領域がカバーされる共整列された分子からの帰属によって、各標的核酸分子内の任意のギャップを埋めてもよい(例えば、1つの標的核酸分子におけるギャップは、別の共整列された標的核酸分子について決定される配列リードによってカバーされる)。
【0309】
一部の実施形態では、sショットガンアセンブリ法(例えば、Schuler et al.,Science 274:540-546,1996に記載されている)を、本明細書に記載されるように得られた配列割当を使用して、アセンブリを行うように適合させる。サンガー配列決定またはイルミナショットガン配列決定に対する現在の方法の利点は、多数のリードが、それらが完全長、インタクトな標的核酸分子、またはその非常に大きな断片から配列決定されるときに、事前にアセンブリされることである(例えば、互いに対するリードまたはコンティグの場所、およびリードまたはコンティグ間のギャップの長さが既知であり得る)。様々な実施形態では、参照ゲノムは、長距離ゲノム構造のアセンブリ、もしくは短距離ポリヌクレオチド配列のアセンブリ、またはその両方のアセンブリを容易にするために使用される。一部の実施形態では、リードは、部分的にデノボアセンブリされ、次いで参照に整列され、次いで、参照支援アセンブリが、デノボアセンブリされる。一部の実施形態では、様々な参照アセンブリを使用して、ゲノムアセンブリのためのいくつかのガイダンスを提供する。他の実施形態では、実際の分子から得られた情報(特に、2つ以上の分子によって裏付けられている場合)は、参照配列からの任意の情報よりも重み付けされる。
【0310】
一部の実施形態では、配列ビットが得られる標的核酸は、標的核酸間の配列重複のセグメントに基づいて整列され、より長いシリココンティグ、および、最終的には、染色体全体の配列が生成される。
【0311】
一部の実施形態では、標的核酸の同一性は、その長さに沿って結合するオリゴヌクレオチドプローブ種のパターンによって決定される。一部の実施形態では、同一性は、RNA種またはRNAアイソフォームの同一性である。一部の実施形態では、同一性は、標的核酸が対応し得る参照配列の場所である。
【0312】
一部の実施形態では、位置決定の正確度または精度は、配列ビットを一緒に繋ぎ合わせる(stitch)のに十分ではない場合がある。一部の実施形態では、プローブのサブセットは、特定の局所内で結合することが見出されるが、厳密には、位置決定データから、配列順序を、所望の信頼度で決定することは困難である。一部の実施形態では、分解能は、回折限界である。一部の実施形態では、局所または回折限界スポット内の短距離配列は、局所またはスポット内に位置するオリゴヌクレオチドプローブ種の配列重複によってアセンブリされる。したがって、例えば、オリゴヌクレオチドプローブ種のサブセットの個々の配列がどのように重複するかに関する情報を使用することによって、短距離配列がアセンブリされ得る。一部の実施形態では、このようにして構築された短距離配列は、次いで、標的核酸上のそれらの順序に基づいて、長距離配列へと一緒に繋ぎ合わされ得る。したがって、長距離配列は、隣接または重複スポットから得られた短距離配列を結合することによって得ることができる。
【0313】
一部の実施形態では、(例えば、天然に二本鎖である標的核酸の場合)相補鎖について得られた参照配列および配列情報を使用して、配列割当を容易にする。
【0314】
一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、70%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、90%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、99%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、決定プロセスは、99%を超える標的核酸配列の配列のカバレッジを決定し得る。
【0315】
非特異的または不一致の結合事象。
概して、配列決定は、標的核酸が結合したヌクレオチドに相補的であるヌクレオチドを含むと仮定する。しかし、必ずしもそうではないことがある。この仮定が成立しない場合の一例として、結合不一致エラーが挙げられる。それにもかかわらず、不一致は、既知のルールまたは挙動に従って生じる場合、標的核酸の配列を決定するのに有用である。短いオリゴヌクレオチドプローブ種(例えば、5塩基長)の使用は、1つの塩基が5塩基長の20%であるため、単一の不一致の影響が安定性に対して大きな影響を有することを意味する。したがって、適切な条件を使用して、短いオリゴヌクレオチドプローブ種によって、絶妙な特異性が得られる。それでも、不一致が生じる可能性があり、分子相互作用の確率的性質のため、それらの結合の持続時間の一部は、5塩基すべてが特異的である結合から区別可能ではない場合がある。一部の実施形態では、塩基(または配列)呼び出し(calling)を行うために、アルゴリズムが使用され、アセンブリは、不一致の発生を考慮に入れることが多い。多くの種類の不一致は予測可能であり、特定のルールに従っている。いくつかのこれらのルールは、理論的考察によって導出され、他のルールは、実験的に導出されている(例えば、Maskos and Southern,Nucleic Acids Res 21(20):4663-4669,2013、Williams et al.,Nucleic Acids Res 22:1365-1367,1994に記載されている)。
【0316】
一部の実施形態では、表面への非特異的結合の影響は、非特異的部位へのプローブ結合のかかる非存続性によって緩和され、ある撮像剤が非特異的結合部位(例えば、相補標的配列上ではない)を占有すると、それは退色され得るが、場合によっては、その位置に留まり、その場所へのさらなる結合を遮断する(例えば、グアニン四重鎖形成による相互作用)。典型的には、標的ポリヌクレオチドへの撮像剤結合の解像を妨げる非特異的結合部位の大部分は、撮像の初期段階のうちに占有および退色され、撮像剤のポリヌクレオチド部位へのオン/オフ結合が、その後、容易に観察されるようになる。したがって、一実施形態では、高いレーザ出力を使用して、最初に非特異的結合部位を占有するプローブを退色させ、任意選択的に、この段階のうちは画像を撮影せず、次いで、任意選択的に、レーザ出力を低減させ、撮像を開始して、ポリヌクレオチドへのオン・オフ結合を捕捉する。最初の非特異的結合後のさらなる非特異的結合は、頻度が低く(退色されたプローブが、しばしば非特異的結合部位に固着したままであるため)、一部の実施形態では、例えば、ドッキング部位への特異的結合とみなされる閾値を適用することによって、計算的にフィルタリング除去され、同じ場所への結合は、持続的でなければならない(例えば、同じ部位で、少なくとも5回または少なくとも10回発生するはずである)。典型的には、ドッキング部位への特異的な結合事象が、約20回検出される。
【0317】
他の実施形態では、非特異的である結合は、フルオロフォアのシグナルが、表面に伸展される標的分子の直鎖の位置と相関しなければならず、他のシグナルは、アルゴリズム的に除去される。一部の実施形態では、線状二重鎖形態の標的核酸鎖を直接染色するか、または持続的な結合部位を通して線を補間するかのいずれかによって、標的核酸鎖の位置を決定することが可能である。一部の実施形態では、一般に、線に沿って脱落しないシグナルは、それらが持続的であるかどうかにかかわらず、破棄される。同様に、一部の実施形態では、超分子格子が使用される場合、格子の既知の構造と相関しない結合事象は破棄される。
【0318】
一部の実施形態では、複数の結合事象は、特異性を増加させ得る。例えば、単一の「呼び出し(call)」から検出される部分または配列の同一性を確立するのではなく、複数の呼び出しからコンセンサスが得られる。また、標的部分または標的核酸への複数の結合事象は、(閾値持続時間の)結合が、同じ場所で複数回起こる可能性が低い非特異的結合事象から、実際の場所への結合を区別することを可能にし得る。また、経時的に複数の結合事象を測定することにより、表面への非特異的結合事象の蓄積が弱められ、その後、非特異的結合が再び検出される可能性がほとんどなくなるということが観察される。これは、非特異的結合からのシグナルが弱められるものの、非特異的結合部位が占有または妨害されたままであり得るためである可能性が高い。
【0319】
一部の実施形態では、配列決定は、標的核酸上の不一致および非特異的結合によって複雑になる。非特異的結合または外れ値事象の影響を回避するために、一部の実施形態では、本方法は、それらの場所および存続時間に基づいて、シグナルを重み付けしてもよい。場所による重み付けは、プローブが、例えば、格子構造内の場所を含む、伸展された標的核酸または超分子の格子(例えば、DNA折り紙グリッド)上に共局在するかどうかによって予測される。結合の存続性による重み付けは、結合の持続時間および結合の頻度に関係し、異なる名目上の結合事象または結合場所に関連する重み付けを使用して、完全一致、部分一致または非特異的結合の可能性を決定し得る。オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種について確立される重み付けを使用して、シグナルの正確性を決定する。
【0320】
一部の実施形態では、優先順位は、シグナル持続時間が所定の閾値を超えるかどうか、シグナル反復または周波数が所定の閾値を超えるかどうか、シグナルが標的分子の場所と相関するかどうか、および/または収集される光子数が所定の閾値を超えるかどうか、を判定することによって、シグナル検証およびベースコール(base calling)を容易にするために使用される。一部の実施形態では、これらの判定のうちのいずれかに対する答えが真である場合、シグナルは、実在として(例えば、不一致または非特異的結合の事象ではないとして)受け入れられる。他の実施形態では、これらの判定のうちの1つを超えると、シグナルが真として受け入れられるために真である必要があり得る。
【0321】
一部の実施形態では、不一致は、それらの経時的結合パターンによって区別されるため、配列情報の二次層とみなされる。かかる実施形態では、結合シグナルが、その経時的結合特性により不一致であると判定される場合、関連付けられた配列ビットは、推定的な不一致塩基を除去するためにバイオインフォマティクス的にトリミングされ、残りの配列ビットが、配列決定に利用される。不一致は、ハイブリダイズするオリゴヌクレオチドプローブ種の末端で生じる可能性が最も高いため、一部の実施形態では、不一致を決定するための経時的結合特性を使用して、1つ以上の塩基を、オリゴヌクレオチドプローブ種の配列の末端からトリミングすることができる。どの塩基を適切にトリミングするかについての決定は、一部の実施形態では、同じ標的核酸領域にわたってタイリングする他のオリゴからの情報によって通知される。
【0322】
一部の実施形態では、可逆的に見えるシグナルは、(例えば、表面への蛍光汚染物質の付着に起因する)非特異的シグナルに対応する確率または尤度を有するため、負に重み付けられる。
【0323】
ブロック302~304。一部の実施形態では、標的核酸を配列決定する方法は、標的核酸が試験基板上で線状化伸展形態で結合され、それによって、固定伸展核酸を形成する固定プロセスを含み得る。標的核酸を、上記の方法のいずれか1つに従って試験基板に付着させる。
【0324】
表面での単一細胞の単離、ならびにDNAおよびRNAの両方の抽出。
一部の実施形態では、RNAおよびDNAのいずれかまたは両方を、単一細胞から単離し、配列決定することができる。一部の実施形態では、DNAを配列決定することが目的である場合、配列決定を開始する前に、RNaseを試料と反応させる。一部の実施形態では、RNAを配列決定することが目的である場合、配列決定を開始する前に、DNaseを試料と反応させる。一部の実施形態では、細胞質の核酸および核の核酸の両方が分析され、それらは、差次的に、または順次抽出される。一部の実施形態では、まず、細胞膜(核膜ではない)を破壊して、細胞質の核酸を遊離し、回収する。次に、関連する核膜を破壊して、核の核酸を遊離する。一部の実施形態では、タンパク質およびポリペプチドは、細胞質画分の一部として回収される。一部の実施形態では、RNAは、細胞質画分の一部として回収される。一部の実施形態では、DNAは、核画分の一部として回収される。一部の実施形態では、細胞質画分および核画分は、一緒に抽出される。一部の実施形態では、抽出後、mRNAおよびゲノムDNAは、差次的に捕捉される。例えば、mRNAは、表面に付着したオリゴdTプローブによって捕捉される。これは、フローセルの第1の部分で生じ得、DNAは、DNAの末端が捕捉され得る疎水性ビニルシランコーティングを有するフローセルの第2の部分で捕捉される(例えば、おそらく疎水性相互作用により)。
【0325】
一部の実施形態では、ポリ(L)リジン(PLL)(例えば、Microsurfaces Inc.から入手可能であるか、または独自にコーティングするか)などの正電荷を有する表面が利用され、細胞膜に結合し得ることが知られている。一部の実施形態では、細胞が表面と接触する(collide)可能性が増加するように、高さが低い、かつ/または幅が広いフローチャネル(例えば、30ミクロン未満)が使用される。一部の実施形態では、乱流を導入するために、フローセルの天井にヘリンボーンパターンまたは蛇行パターンを使用するとによって、接触回数が増加する。一部の実施形態では、細胞の付着は、細胞が低密度で表面に分散されることが望ましいため、かかる実施形態では効率的である必要がない場合がある(例えば、各個々の細胞から抽出されたRNAおよびDNAが空間的に分離したままであり得るように、細胞間に十分なスペースがあることを確実にするため)。一部の実施形態では、細胞膜および核膜の両方が破壊されるように(例えば、細胞内容物が培体中に放出され、単離された細胞の近傍の表面で捕捉されるように)、プロテイナーゼ処理を使用して、細胞が溶解される。固定化されると、一部の実施形態では、DNAおよびRNAが伸展される。一部の実施形態では、伸展緩衝液が、カバーガラス表面にわたって一方向に流れる(例えば、流体の流れの方向に、DNAおよびRNAポリヌクレオチドを伸展させ、整列させる)。一部の実施形態では、条件(例えば、温度、伸展緩衝液の組成物、および流れの物理的な力など)を調節することで、RNAの二次/三次構造がほとんどの変性するため、RNAが、抗体への結合または配列決定に利用可能となり得る。一旦、RNAが変性形態で伸展されると、変性緩衝液から結合緩衝液に切り替えることが可能である。
【0326】
代替的に、RNAは、まず、細胞膜を破壊し、一方向に流れを誘導することによって、抽出され、固定化される。次に、プロテイナーゼを使用することによって、核膜を破壊し、逆方向に流れを誘導する。一部の実施形態では、DNAは、例えば、レアカッティング制限酵素(例えば、NOT1、PMME1)を使用することによって、遊離の前または後に断片化される。この断片化は、DNAの解離を助けることができ、個々の鎖を単離およびコーミングを可能にすることができる。各細胞から抽出されたRNAおよびDNAが混ざり合わず、固定化された細胞が十分に離れているように、システムが構成される。一部の実施形態では、これは、細胞の破裂または破壊の前、後、または際に、液体をゲルに転移させることによって補助される。
【0327】
一部の実施形態では、標的核酸は、二本鎖核酸である。かかる実施形態では、本方法は、試験基板上で固定二本鎖標的核酸を一本鎖形態に変性させることをさらに含み得る。一部の実施形態では、核酸は、配列決定を進めるために一本鎖形態であるか、または部分的に変性した形態であるか、または鎖侵入(strand invasion)もしくは三重鎖形成オリゴヌクレオチドプローブ種を利用する場合に二本鎖である必要がある。固定二本鎖核酸が変性されると、核酸の固定された第1鎖および固定された第2鎖の両方が直接アクセス可能になる。固定された第2の鎖は、天然の二重鎖標的ヌクレオチドの固定された第1の鎖に相補的である。
【0328】
一部の実施形態では、標的核酸は、一本鎖である(例えば、mRNA、lncRNA、マイクロRNA)。一部の実施形態では、標的核酸が一本鎖RNAであり、配列決定方法が進行する前に、変性を必要としない。
【0329】
一部の実施形態では、試料は、近接した天然の相補鎖を有さない一本鎖DNAポリヌクレオチドを含み得る。一部の実施形態では、標的核酸に沿ったオリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の結合場所がコンパイルされ、配列は、それらの場所に従ってすべての配列ビットを集約し、それらを一緒に繋ぎ合わせることによってアセンブリされる。
【0330】
RNAの伸展
一部の実施形態では、荷電表面上の核酸の伸展は、溶液のカチオン濃度によって影響を受ける。低塩濃度では、RNAは一本鎖であり、その骨格に沿って負に荷電し、その長さに沿ってランダムに表面に結合し得る。
【0331】
RNAを線状形態に変性および伸展するために、複数の可能な方法がある。一部の実施形態では、tRNAは、最初に、(例えば、高い塩濃度を使用することによって)球状形態になるように奨励される。一部のかかる実施形態では、各RNA分子(例えば、特に、ポリAテール)の末端は、相互作用によりアクセスしやすくなる。一部の実施形態では、RNAが球状形態で結合したら、異なる緩衝液(例えば、変性緩衝液)をフローセルに流す。
【0332】
代替的な実施形態では、表面をオリゴd(T)で予めコーティングして、mRNAのポリAテールを捕捉する(例えば、Ozsolak et al.,Cell 143:1018-1029,2010に記載されている)。ポリAテールは、典型的には、二次構造を比較的含まないはずの領域である(例えば、それらがホモポリマーであるため)。ポリAテールは、高等真核生物では比較的長いため(250~3000ヌクレオチド)、一部の実施形態では、長いオリゴd(T)捕捉プローブを設計して、RNAにおける分子内塩基対形成のかなりの部分を融解させるのに十分な比較的高い厳密性(例えば、高い温度および/または塩条件)で、ハイブリダイゼーションを行うようにする。結合後、一部の実施形態では、残りのRNA構造を球状状態から線状状態へ転移させることは、捕捉プローブを剥離するのに十分ではないが、潜在的に、流体の流れまたは電気泳動力と組み合わせて、RNAの分子内塩基対形成を妨害し得る変性条件を使用することによって実現される。
【0333】
ブロック310。一部の実施形態では、固定伸展標的核酸は、オリゴヌクレオチドプローブのセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露される。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、所定の配列および長さであり、曝露は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の各部分に一時的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせ得る。
【0334】
ブロック312。一部の実施形態では、測定プロセスにおいて、試験基板上の場所、および、任意選択的に、二次元撮像デバイスを利用し得る曝露プロセス中に生じる光学活性の各それぞれの事例の持続時間が決定される。
【0335】
ブロック314。一部の実施形態では、曝露および測定プロセスは、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種について反復され、それによって、試験基板上で複数の位置のセットを得、試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種に対応する。
【0336】
ブロック316。一部の実施形態では、標的核酸の少なくとも一部分の配列は、複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから決定される。
【0337】
RNA配列決定
RNAの長さは、典型的には、ゲノムDNAよりも短いが、現在の技術を使用してRNAを一端から他端へ配列決定することは困難である。それにもかかわらず、選択的スプライシングおよび遺伝子アイソフォームのために、mRNAの完全な配列編成を決定することが非常に重要である。一部の実施形態では、mRNAは、そのポリAテールが固定化オリゴd(T)に結合することによって捕捉され、その二次構造は、表面に伸長されるように、伸展力(例えば、400pN超)および変性条件(例えば、ホルムアミドおよび/または7Mもしくは8Mの尿素を含む)を適用することによって除去される。次いで、これにより、結合するオリゴヌクレオチドプローブ種(例えば、エキソン特異的)が、一過的に結合することが可能になる。RNAの長さが短いため、本明細書に記載される単一分子局在化法を用いて、エキソンを解像、区別、および位置決定することが有益である。一部の実施形態では、mRNAに散在するわずかな結合事象は、特定のmRNAアイソフォームに関するmRNA内のエキソンの順序および同一性を決定するのに十分である。
【0338】
二本鎖コンセンサス
試料分子から配列情報を得るための方法は、以下の通りである:
i)第1の発光最大波長の標識を有する第1のオリゴヌクレオチドプローブ種を提供すること、第2のオリゴヌクレオチドプローブ種の配列が第1のオリゴヌクレオチドプローブ種の配列に相補的である、第2の発光最大波長の標識を有する第2のオリゴヌクレオチドプローブ種を提供すること、
ii)基板上の天然の二本鎖標的核酸分子を伸長、固定、および変性すること、
iii)光学活性の事例を含む撮像データを生成しながら、第1および第2のオリゴの両方を、iiの変性核酸に曝露すること、
iv)第1および第2のオリゴヌクレオチドプローブ種の結合場所を決定すること、
v)結合場所が共局在する場合、その位置が正しいとみなすこと、
vi)伸長標的核酸に沿った複数の場所が結合していること。
【0339】
一部の実施形態では、オリゴヌクレオチドプローブ種は、一過性および可逆的に結合し得る。一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、所与の長さの第1および第2のオリゴヌクレオチドプローブ種の完全なセットの一部であり、オリゴヌクレオチドプローブ種の完全なセットの各第1および第2のオリゴ対に対して、ステップii~iiiを反復し、核酸全体を配列決定する。
【0340】
一部の実施形態では、2つの発光最大波長が、光学的にそれらがあるべき場所に共局在することを確実にするために、いくつかの修正を行う必要があり得る。これは、光学的にまたはソフトウェアプロセスを利用して、色収差を補正することを含み得る。一部のかかる実施形態では、2つの相補オリゴヌクレオチドプローブ種が同時に曝露されるが、それらが互いにアニーリングして、したがって標的核酸への同時結合を妨げることを防止するために、修飾オリゴヌクレオチド化学が使用される。非自己対合類似体の場合、標的核酸上で、修飾Gは、相補オリゴヌクレオチドの修飾Cと対合し得ないが、非修飾Cと対合し得、修飾Aは、相補オリゴヌクレオチドプローブ種の修飾Tと対合し得ないが、非修飾Tと対合し得る。したがって、かかる実施形態では、第1および第2のオリゴヌクレオチドプローブ種が修飾されており、そのため、第1のオリゴヌクレオチドプローブ種が、第2のオリゴヌクレオチドプローブ種と塩基対を形成することができず、したがって、標的核酸へアクセスが妨害されないようし、視野にわたって変化し得る色収差のスペクトル較正を可能にする。一部の実施形態では、色収差を較正および除去するために使用される同じプロセスを利用して、スペクトルおよび空間PSF変動が同様に較正および補償され得る。
【0341】
一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、一緒に添加されるのではなく、次々に添加される。
【0342】
かかる実施形態では、オリゴヌクレオチドプローブ種が次々に添加される場合、洗浄ステップは、その間に実施される。この場合、相補オリゴヌクレオチドプローブ種は、同じ発光最大波長で標識され、色収差を補正する必要はない。また、2つのオリゴが互いに結合する可能性もない。
【0343】
一部の実施形態では、標的核酸は、オリゴヌクレオチドプローブ種のセット全体が曝露されるまで、さらなる第1および第2のオリゴヌクレオチドプローブ種に曝露される。
【0344】
一部の実施形態では、第1のオリゴヌクレオチドプローブ種の後、第2のオリゴヌクレオチドプローブ種が、オリゴヌクレオチドプローブ種の完全なセットの相補的なオリゴヌクレオチドプローブ種の他の対が添加される前に、次のオリゴヌクレオチドプローブ種として添加される。一部の実施形態では、第2のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の完全なセットの他のオリゴヌクレオチドプローブ種が添加される前に、次のオリゴヌクレオチドプローブ種として添加されない。
【0345】
かかる実施形態の一例は、以下のような試料標的核酸分子から配列情報を得るための方法を含む:
i)基板上の二本鎖標的核酸分子を、伸長、固定、および変性すること、
ii)第1の標識オリゴを、i)の変性標的核酸に曝露し、オリゴヌクレオチドプローブ種の結合のその場所を、検出および記録すること、
iii)第1の標識オリゴヌクレオチドプローブ種を、洗浄によって除去すること、
iv)第2の標識オリゴヌクレオチドプローブ種を、i)の変性標的核酸に曝露し、オリゴヌクレオチドプローブ種の結合のその場所を、検出および記録すること、
v)任意選択的に、ii)とiv)の記録間のドリフトの補正すること、
vi)ii~ivで得られた結合の記録された位置が共局在する場合、このようにして得られた場所の配列に関する配列情報が、正しいとみなされること。
【0346】
一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の完全なセットの一部であり、標的核酸全体を配列決定するために、オリゴヌクレオチドプローブ種の完全なセットの第1および第2のオリゴヌクレオチドプローブ種対に対して、ステップii~iiiを反復する。
【0347】
共局在は、同じ配列遺伝子座を見ていることを示し得る。さらに、センス鎖を標的とするオリゴヌクレオチドプローブ種は、4つの差次的に標識されたオリゴを使用して、中心塩基を識別することを目指すことができ、アンチセンス鎖を標的とするオリゴヌクレオチドプローブ種は、センス鎖のオリゴヌクレオチドプローブ種に対する相補配列を有する4つの差次的に標識されたオリゴヌクレオチドプローブ種を使用して、中心塩基を識別することを目指すことができる。中央位置についての検証されたベースコールを得るために、センス鎖のデータは、アンチセンス鎖のデータを裏付ける必要がある。したがって、中央A塩基を有するオリゴヌクレオチドプローブ種が、センス鎖に結合する場合、中央T塩基を有する相補オリゴヌクレオチドプローブ種が、アンチセンス鎖に結合する必要がある。
【0348】
一部の実施形態では、センスおよびアンチセンス鎖のかかる裏付けまたはコンセンサスを得ることは、G:TまたはG:Uのゆらぎ塩基対形成から生じる曖昧さを克服するのに役立ち得る。これがセンス鎖上で生じる場合、C:Aは塩基対を形成する可能性が低いため、アンチセンス鎖上でシグナルが得られる可能性は低い。
【0349】
一部の実施形態では、修飾G塩基またはT/Uは、ゆらぎ塩基対の形成を防止するために、オリゴヌクレオチドプローブ種において使用することができる。一部の他の実施形態では、アセンブリアルゴリズムは、特に、相補標的核酸鎖上にC:G塩基対による確証が存在せず、かつ、場所がA:T塩基対を形成する相補標的核酸鎖に結合するオリゴヌクレオチドプローブ種と相関する場合、ゆらぎ塩基対の形成の可能性を考慮してもよい。一部の実施形態では、3つではなく2つだけ水素結合を形成する能力を有する7-デアザグアニシンを、G修飾として使用して、それが形成され得る塩基対合の安定性を低下させ、グアニン四重鎖およびその非常に強力なの形成(したがって、無差別な結合を形成する)を低下させる。
【0350】
同時二重鎖コンセンサスアセンブリ
一部の実施形態では、二重らせん標的核酸の両方の鎖が存在し、標的鎖間に近接している間、上に記載されるオリゴヌクレオチドプローブ種に曝露される。一部の実施形態では、検出される一過的な光シグナルから、オリゴヌクレオチドプローブ種のそれぞれのセットの各オリゴヌクレオチドプローブ種の2つの相補鎖のうちのどちらが結合したかを区別することができない場合がある。例えば、標的核酸に沿ったオリゴヌクレオチドプローブ種のそれぞれのセットのオリゴヌクレオチドプローブ種の各々について、各標的核酸鎖に沿った結合場所がコンパイルされる場合、異なる配列の2つのプローブが、あたかも同じ場所に結合しているように見える場合がある。これらのオリゴヌクレオチドプローブ種は、相補配列を有するべきであり、次いで、標的核酸の配列を正確にコンパイルするための前提条件である、結合した2つのオリゴヌクレオチドプローブ種の各々のどの鎖かを決定することが難しくなる。
【0351】
一部の実施形態では、単一のオリゴヌクレオチドプローブ種の結合事象が、第1の標的核酸鎖または第2の標的核酸鎖に結合しているかどうかの決定は、得られた光学活性のデータの完全なセットを考慮しなければならない。例えば、オリゴヌクレオチドプローブ種の2つのタイリングシリーズが、問題の場所をカバーする場合、シグナルを生成するオリゴヌクレオチドプローブ種の配列のどのシリーズが重複するか基づいて、2つのタイリングシリーズのどちらにシグナルが帰属するかが割り当てられる。次いで、一部の実施形態では、配列は、最初に、結合および配列重複の場所を使用して、各タイリングシリーズを構築することによって、アセンブリすることができる。次いで、2つのタイリングシリーズは、逆相補体として整列され、2つの鎖の配列データがこれらの場所の各々で完全な逆相補体である場合にのみ、各場所での塩基割当が受け入れられる(例えば、したがって、二重鎖コンセンサス配列を提供する)。
【0352】
一部の実施形態では、配列決定の不一致は、2つの可能性のうちの1つが、独立した不一致結合事象などの追加の層の情報によって裏付けられる必要がある、曖昧なベースコールであるとフラグ付けされる。一部の実施形態では、二重鎖コンセンサスが得られたら、ゲノムの同じ領域をカバーする他の標的核酸からのデータを比較することによって、従来の(多分子)コンセンサスが決定される(例えば、複数の細胞からの結合部位の情報が利用可能である場合)。かかるアプローチの1つの問題は、ハプロタイプ配列を含む異なる標的核酸の可能性である。
【0353】
代替的に、一部の実施形態では、個々の鎖コンセンサスを得た後、個々の鎖コンセンサスの二重鎖コンセンサスを得る。かかる実施形態では、二重鎖標的核酸の各鎖の配列が、同時に得られる。これは、一部の実施形態では、追加の試料調製ステップを必要とせずに実現され、分子バーコードを用いた二重鎖標的核酸の鎖のかかる差次的なタグ付けは、現在のNGS法とは異なる(例えば、Salk et al.,Proc.Natl.Acad.Sci.109(36),2012に記載されている)。
【0354】
センス鎖およびアンチセンス鎖の両方の同時配列取得は、ナノポア配列決定に利用される2Dまたは1D2コンセンサス配列決定と比較して有利である。これらの代替方法は、第2の鎖の配列を得る前に、二重鎖の一方の鎖の配列を得る必要がある。一部の実施形態では、二重鎖コンセンサス配列決定は、106の範囲における正確度、例えば、(他のNGSアプローチの102~103の生の正確度と比較して)100万塩基中に1つの誤差を提供し得る。これにより、本方法は、がん状態を示す希少バリアント(例えば、セルフリーDNAに存在するバリアントなど)または腫瘍細胞集団に低頻度で存在するバリアントを解決する必要性と非常に適合する。
【0355】
単細胞解像配列決定
様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含み得る。一部の実施形態では、単一細胞は、他の細胞との結合を含まない。一部の実施形態では、単一細胞は、クラスター中または組織中で、他の細胞に付着している。一部の実施形態では、そのような細胞は、個々の非付着細胞に脱凝集される。
【0356】
一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造(例えば、フローセルまたはマイクロウェル)の入口に、流体的に移される(例えば、ピペットを使用することによって)。一部の実施形態では、脱凝集は、細胞をピペッティングすることによって、プロテアーゼ、超音波処理、または物理的撹拌を適用することによって行われる。一部の実施形態では、細胞は、脱凝集された後、それらが伸長される構造に、流体的に移される。
【0357】
一部の実施形態では、単一細胞が単離され、標的核酸が単一細胞から遊離され、その結果、同じ細胞に由来するすべての標的核酸が互いに近接したまま配置され、かつ他の細胞の内容物が配置される場所とは異なる場所に配置される。一部の実施形態では、Di Carlo et al.,Lab Chip 6:1445-1449,2006に記載されているように、トラップ構造が使用される。
【0358】
一部の実施形態では、複数の単一細胞を捕捉および単離するマイクロ流体アーキテクチャ(例えば、
図16Aおよび
図16Bに示されるようにトラップが離れている場合)、または複数の非単離細胞を捕捉するアーキテクチャ(例えば、トラップが連続している場合)のいずれかを使用することが可能である。一部の実施形態では、トラップは、単一細胞(例えば、2μM~10μM)の寸法である。一部の実施形態では、フローセルは、長さが数百ミクロン~数ミリメートルであり、深さが約30ミクロンである。
【0359】
一部の実施形態では、例えば、
図17に示されるように、単一細胞が、送達チャネル1702に流し込まれ、トラップされ1704、ポリヌクレオチドを遊離し、次いで、伸長される。一部の実施形態では、細胞1602が、溶解され1706、次いで細胞核は、第2の溶解ステップ1708を通して溶解され、したがって、細胞外ポリヌクレオチドおよび細胞内ポリヌクレオチド1608が順次遊離される。任意選択的に、核外ポリヌクレオチドおよび核内ポリヌクレオチドの両方が、単一の溶解ステップを使用して遊離される。遊離後、ポリヌクレオチド1608は、フローセル2004の長さに沿って固定化され、伸長される。一部の実施形態では、トラップは、単一細胞の寸法(例えば、2μM~10μM幅)である。一実施形態では、トラップの寸法は、底部で4.3μM幅、中深部で6μm幅、および上部で8μm幅、深さが33μmであり、デバイスは、射出成形を使用して環状オレフィン(COC)から作製される。
【0360】
一部の実施形態では、単一細胞は、個々のチャネルに溶解され、各個々の細胞を、トランスポザーゼ媒介の組み込みを介して固有のタグ配列と反応させ、その後、ポリヌクレオチドが組み合わされ、同じ混合物中で配列決定される。一部の実施形態では、トランスポザーゼ複合体は、細胞にトランスフェクトされるか、または細胞を含む液滴に融合される液滴中にある。
【0361】
一部の実施形態では、凝集体は、細胞の小さなクラスターであり、一部の実施形態では、クラスター全体が、同じ配列決定タグでタグ付けされる。一部の実施形態では、細胞は凝集しておらず、循環腫瘍細胞(CTC)または循環胎児細胞などの遊離した浮遊細胞である。
【0362】
単一細胞配列決定において、細胞溶解後の自発的なシトシン脱アミノ化によって引き起こされるシトシンからチミンへの一塩基バリアントの問題が存在する。これは、配列決定の前に、試料をウラシルN-グリコシラーゼ(UNG)で前処理することによって克服される(例えば、Chen et al.,Mol Diagn Ther.18(5):587-593,2014に記載されている)。
【0363】
ハプロタイプの識別。
様々な実施形態では、上に記載の方法は、ハプロタイプを配列決定するために使用される。ハプロタイプの配列決定は、本明細書に記載の方法を使用して、二倍体ゲノムのハプロタイプにわたる第1の標的核酸を配列決定することを含む。二倍体ゲノムの第2のハプロタイプ領域にわたる第2の標的核酸も配列決定されなければならない。第1および第2の標的核酸は、相同染色体の異なるコピーから得られるであろう。第1および第2の標的ポリヌクレオチドの配列を比較し、それによって、第1および第2の標的核酸上のハプロタイプを決定する。
【0364】
したがって、実施形態から得られる単一分子のリードおよびアセンブリは、ハプロタイプ特異的であると分類される。アセンブリが断続的な場合だけ、ハプロタイプ特異的な情報が、必ずしも長い範囲にわたって容易に得られるとは限らない。かかる実施形態では、それにもかかわらず、リードの場所が提供される。このような状況でも、ゲノムの同じセグメントをカバーする複数のポリヌクレオチドを分析すると、ハプロタイプが計算的に決定される。
【0365】
一部の実施形態では、相同分子は、ハプロタイプまたは親染色体の特異性に従って分離される。実際に物理的または視覚的に、本開示の方法によって得られた情報の視覚的性質は、特定のハプロタイプを示すことができる。一部の実施形態では、ハプロタイプの解像度は、改善された遺伝子または祖先の研究を行うことを可能にする。他の実施形態では、ハプロタイプの分解能は、より良好な組織型決定を行うことを可能にする。一部の実施形態では、ハプロタイプの分解能または特定のハプロタイプの検出は、診断を行うことを可能にする。
【0366】
複数の細胞由来のポリヌクレオチドの同時配列決定
様々な実施形態では、上に記載の方法は、各ポリヌクレオチドがその起源の細胞の情報を保持する複数の細胞(または核)由来のポリヌクレオチドを配列決定するために使用される。
【0367】
特定の実施形態では、トランスポゾン媒介性の配列挿入は、細胞内で媒介され、各挿入は、起源の細胞の標識としての固有のID配列タグを含む。他の実施形態では、トランスポゾン媒介性の挿入は、単一細胞が単離された容器(例えば、アガロースビーズ、油-水滴などを含む容器)内で生じる。固有のタグは、タグを有するすべてのポリヌクレオチドが同じ細胞に由来しなければならないことを示す。次いで、すべてのDNAおよび/またはRNAが抽出され、混合され、伸長される。次いで、本明細書に記載の実施形態による配列決定(または任意の他の配列決定方法)が標的核酸上で行われる場合、ID配列タグのリードは、標的核酸がどの細胞に由来するかを示す。一部の実施形態では、細胞識別タグは短い。10,000個の細胞について(例えば、腫瘍微量剖検から)、約65,000個の固有配列は、8ヌクレオチド長の識別子配列によって提供され、約100万個の固有配列は、10ヌクレオチド長の識別子配列によって提供される。
【0368】
一部の実施形態では、個々の細胞は、同一性(ID)タグを用いてタグ付けされる。
図19に示されるように、一部の実施形態では、同一性タグは、タグ付けによってポリヌクレオチドに組み込まれ、試薬が、単一細胞に直接提供されるか、または細胞と融合もしくは包接する微小液滴1802中に提供される。各細胞は、異なるIDタグ(例えば、100万個超の可能なタグなどの大きなセットから)を受け取る。微小液滴および細胞1804が融合した後、IDタグは、個々の細胞内のポリヌクレオチドに組み込まれる。個々の細胞の内容物は、フローセル2004内で混合される。次いで、(例えば、本明細書に開示される方法によって)配列決定は、特定の標的核酸が、どの細胞に由来するかを明らかにする。代替的な実施形態では、微小液滴は、細胞を包み込み、タグ付け試薬を細胞に送達する(例えば、細胞内に拡散するか、または細胞内容物を微小液滴内に破裂させることによって)。
【0369】
この同じインデックス化の原理は、その目的が、試料を混合し、それらを一緒に配列決定することだけではなく、各個々の試料に関する配列情報を回収することである場合、細胞以外の(例えば、異なる個体由来の)試料に適用される。
【0370】
さらに、複数の細胞が配列決定される場合、細胞集団におけるハプロタイプの多様性および頻度を決定することが可能である。一部の実施形態では、分子が十分に長い場合、細胞集団に存在する異なる染色体、長い染色体セグメント、またはハプロタイプが決定されるため、単一細胞の内容物を一緒に保持する必要性がなく、集団におけるゲノムの不均一性が分析される。これは、どの2つのハプロタイプが一緒に細胞内に存在するかを示すものではないが、ゲノム構造タイプ(またはハプロタイプ)の多様性およびそれらの頻度、ならびにどの異常な構造バリアントが存在するかについて報告する。
【0371】
一部の実施形態では、標的核酸がRNAであり、cDNAコピーが配列決定される場合、タグの添加は、タグ配列を含むプライマーを用いたcDNA合成を含む。RNAが直接配列決定される場合、T4 RNAリガーゼを使用して、タグをRNAの3’末端にライゲーションすることによって、タグを添加する。タグを生成する代替方法は、4つのA、C、G、およびT塩基のうちの2つ以上のヌクレオチドを用いて、ターミナルトランスフェラーゼでRNAまたはDNAを伸長することであり、各個々のポリヌクレオチドは、その上に、ヌクレオチドの固有配列が確率的にテール付けされる。
【0372】
一部の実施形態では、タグ配列の量を短く保つように維持することで、より多くの配列リードが、ポリヌクレオチド配列の配列決定自体に寄与するようにするために、タグ配列が、いくつかの部位にわたって分配される。ここで、複数の短い識別子配列が、例えば、3つ、各細胞または容器に導入される。次に、ポリヌクレオチドに沿って分布するタグのビットから、ポリヌクレオチドの起点を決定する。したがって、この場合、1つの場所から読み出されるタグのビットは、起源の細胞を決定するのに十分ではないが、複数のタグビットの決定を行うには十分である。
【0373】
構造バリアントの検出
一部の実施形態では、検出された配列と参照ゲノムとの間の差異は、置換、インデル、および構造多型を含む。特に、参照配列が本開示の方法によってアセンブリされていない場合、典型的には、反復は圧縮され、アセンブリが反復を解凍する。
【0374】
一部の実施形態では、ポリヌクレオチドに沿った一連の配列リードの方向は、逆位事象が生じたかどうかを報告する。参照と比較して他のリードと反対方向にある1つ以上のリードは、反転を示す。
【0375】
一部の実施形態では、その近傍の他のリードの文脈では予想されない1つ以上のリードの存在は、参照と比較して、再編成または転座を示す。参照におけるリードの場所は、ゲノムのどの部分が別の部分にシフトしたかを示す。場合によっては、その新しい場所におけるリードは、転座ではなく重複である。
【0376】
一部の実施形態では、反復領域またはコピー数バリエーションを検出することも可能である。パラロガスなバリエーションを有するリードまたは関連するリードの反復的な発生は、ゲノムの複数の場所で発生する複数のリードまたは非常に類似したリードとして観察される。これらの複数の場所は、場合によっては、(例えば、サテライトDNAでのように)一緒に密接に充填されているか、または、他の場合、(例えば、偽遺伝子でのように)ゲノムにわたって分散している。本開示の方法は、短いタンデムリピート(STR)、可変数タンデムリピート(VNTR)、トリヌクレオチドリピートなどに適用される。特異的リードの不在または反復は、それぞれ欠失または増幅が生じたことを示す。一部の実施形態では、本明細書に記載の方法は、ポリヌクレオチドに複数のおよび/または複雑な再編成が存在する場合、特に適用される。本明細書に記載の方法は、単一のポリヌクレオチドを分析することに基づいているため、一部の実施形態では、上に記載の構造バリアントは、少数の細胞(例えば、集団由来のわずか1%の細胞)で稀に生じるものまで解像される。
【0377】
同様に、一部の実施形態では、セグメント重複、すなわちデュプリコンは、ゲノム内で正しく位置決定される。セグメント重複は、典型的には、ほぼ同一の配列のDNA配列の長い領域(例えば、1キロ塩基長を超える)である。これらのセグメント重複は、体細胞変異を含む、個々のゲノムにおける多くの構造多型を引き起こす。セグメント重複は、ゲノムの遠位部分に存在し得る。現在の次世代配列決定では、リードがどのセグメント重複から生じるかを決定することは困難である(したがって、アセンブリを複雑にする)。本開示の一部の実施形態では、配列リードは、長い分子(例えば、0.1~10メガ塩基長の範囲)にわたって得られ、通常、リードを使用して、ゲノムのどのセグメントがデュプリコンに対応するゲノムの特定のセグメントに隣接しているかを決定することによって、デュプリコンのゲノムコンテキストを決定することが可能である。
【0378】
構造バリアントのブレークポイントは、本開示の一部の実施形態では、正確に位置決定される。一部の実施形態では、ゲノムの2つの部分が融合していることを検出することが可能であり、ブレークポイントが生じた正確な個々のリードが決定される。本明細書に記載されるように収集された配列リードは、2つの融合した領域のキメラを含み、ブレークポイントの一方の側のすべての配列は、融合したセグメントの一方に対応し、他方の側は、融合したセグメントの他方である。これにより、ブレークポイント周辺の構造が複雑な場合であっても、ブレークポイントを決定する信頼度が高くなる。一部の実施形態では、正確な染色体ブレークポイント情報は、疾患機序の理解、特定の転座の発生の検出、または疾患の診断において使用される。
【0379】
エピゲノム修飾の位置決定
一部の実施形態では、本方法は、固定二本鎖標的核酸または固定された第1の鎖および天然二重鎖標的核酸の固定された第2の鎖を、抗体、アフィマー、ナノボディ、アプタマー、またはメチル結合タンパク質に曝露して、それによって、核酸への修飾を決定するか、または試験基板上の複数の位置のセットからの核酸の部分の配列と相関させることをさらに含む。一部の抗体は、二本鎖または一本鎖に結合する。メチル結合タンパク質は、クロマチンの場合と同様に、二本鎖ポリヌクレオチドに結合することが予想される。
【0380】
一部の実施形態では、天然ポリヌクレオチドは、配列決定のために呈示される前にプロセシングを必要としない。これにより、本方法は、DNAの化学修飾が所定の位置に留まるため、エピゲノム情報を、配列情報と統合することができる。一部の実施形態では、ポリヌクレオチドは、方向的に十分に整列しており、したがって、撮像、画像処理、ベースコールおよびアセンブリが比較的容易であり、配列の誤差率が低く、カバレッジが高い。本開示を実施するために、いくつかの実施形態が記載されているが、各実施形態は、試料調製の負担が完全にまたはほぼ完全に排除されるように行われる。
【0381】
これらの方法は、増幅なしでゲノムDNAに対して実施されるため、一部の実施形態では、増幅バイアスおよびエラーに悩まされず、エピゲノムマークが保存され、(例えば、配列の取得とは直交的に)検出される。場合によっては、核酸がメチル化されているかどうかを、配列特異的な様式で決定することが有用である。例えば、胎児DNAを母体DNAから区別する1つの方法は、前者が目的の遺伝子座でメチル化されることである。これは、非侵襲的産前検査(NIPT)に有用である。
【0382】
哺乳動物においていくつかのシトシンバリアント、C5-メチルシトシン(5-mC)、C5-ヒドロキシメチルシトシン(5-hmC)、C5-ホルミルシトシン、およびC5-カルボキシルシトシンを生じる、炭素-5(C5)のアルキル化などの複数の種類のメチル化が可能である。また、真核生物および原核生物は、アデニンをN6-メチルアデニン(6-mA)にメチル化する。原核生物では、N4-メチルシトシンも頻繁に見られる。
【0383】
抗体は、利用可能であるか、またはこれらの修飾のそれぞれに対して産生され、ならびに目的に応じて、任意の他のものが構築される。修飾を標的とするアフィマー、ナノボディ、またはアプタマーは、フットプリントがより小さい可能性があるため、特に関連している。本発明における抗体への任意の言及は、アフィマー、ナノボディ、アプタマー、および任意の類似の試薬を含むと解釈されるべきである。加えて、他の天然に存在するDNA結合タンパク質、例えば、メチルタンパク質(MBD1、MBD2など)が、一部の実施形態で使用される。
【0384】
一部の実施形態では、メチル化分析は、配列決定とは直交的に実施される。一部の実施形態では、これは、配列決定の前に行われる。一例として、抗メチルC抗体またはメチル結合タンパク質(MeCP2、MBD1、MBD2、およびMBD4を含むメチル結合ドメイン(MBD)タンパク質ファミリー)、または(MBD1に基づく)ペプチドは、一部の実施形態では、ポリヌクレオチドに結合し、標識を介してそれらの場所が検出された後、(例えば、高塩緩衝液、カオトロフィック試薬、SDS、プロテアーゼ、尿素、および/またはヘパリンを添加することによって)それらが除去される。一部の実施形態では、オン・オフ結合を促進するか、または一過的に結合するように操作されている試薬を使用することで、試薬が一過的に結合し得る。ヒドロキシメチル化またはDNA損傷部位などの他のポリヌクレオチド修飾の場合も、同様のアプローチが使用され、そのための抗体は、入手可能であるか、または産生される。修飾の場所が検出され、修飾結合試薬が除去された後、配列決定が開始される。一部の実施形態では、抗メチル抗体および抗ヒドロキシメチル抗体などが、標的ポリヌクレオチドが一本鎖になるように変性された後に、添加される。この方法は、非常に感度が高く、長いポリヌクレオチド上の単一の修飾を検出することができる。
【0385】
図19は、単一細胞からのDNAおよびRNAの抽出および伸展、ならびにDNAおよびRNAの差次的標識(例えば、それぞれmCおよびm6Aに対する抗体を用いた)を示す。細胞1602は、表面に固定化され、次いで、溶解される(1902)。溶解によって核1604から遊離される核酸1608は、固定化され、伸長される1904。次いで、核酸は、付加されたDNAタグ1910および1912を有する抗体に曝露され、抗体によって結合される。一部の実施形態では、タグは、DNA PAINTベースの単一分子局在化のための蛍光色素またはオリゴヌクレオチドドッキング配列である。一部の実施形態では、タグおよびDNA PAINTを使用する代わりに、抗体または他の結合タンパク質が、単一の蛍光標識または複数の蛍光標識のいずれかで直接蛍光標識される。抗体がコード化される場合、標識化の一例が、
図14A、
図14Cおよび
図14Dに示される。一部の実施形態では、DNAおよびRNAの両方のエピ修飾分析が、本明細書に記載の配列決定方法を使用したそれらの配列と共役される。
【0386】
一部の実施形態では、結合タンパク質によるメチル化の検出に加えて、結合部位におけるメチル化の存在は、修飾が標的核酸部位に存在しないときと比較した、修飾が存在するときの差次的なオリゴヌクレオチドの結合挙動によって、検出される。
【0387】
一部の実施形態では、バイサルファイト処理は、メチル化を検出するのに使用される。ここで、オリゴヌクレオチドプローブ種の完全なセットを通して実行した後、バイサルファイト処理を使用して、非メチル化シトシンをウラシルに変換し、次いで、オリゴヌクレオチドプローブの完全なセットを再び適用する。バイサルファイト処理前のヌクレオチド位置が、Cと読まれ、バイサルファイト処理後にUと読まれた場合、非メチル化とみなすことができる。
【0388】
メチル化などのDNA修飾用の参照エピゲノムは存在しない。有用であるためには、未知のポリヌクレオチドのメチル化マップを、配列ベースのマップに連結する必要がある。したがって、一部の実施形態では、エピマップにコンテキストを提供するために、エピマッピング法を、オリゴ結合によって得られた配列ビットと相関させる。一部の実施形態では、配列リードに加えて、他の種類のメチル化情報も共役される。これには、非限定的な例として、ニッキングエンドヌクレアーゼベースのマップ、オリゴヌクレオチドプローブ種結合ベースのマップ、および変性および変性-再生マップが含まれる。一部の実施形態では、1つ以上のオリゴヌクレオチドプローブ種の一過的な結合を使用して、ポリヌクレオチドをマッピングする。ゲノムへの機能的染色体またはクロマチンが、一部の実施形態では、DNA損傷部位およびタンパク質結合またはリガンド結合などのゲノムにマッピングする他の特徴に適用される。
【0389】
本開示では、塩基配列決定またはエピゲノム配列決定のいずれかが最初に行われる。一部の実施形態では、両方同時に行われる。例えば、特定のエピ修飾に対する抗体は、一部の実施形態では、オリゴから差次的にコードされる。かかる実施形態では、両方の種類のプローブの一過的な結合を促進する条件(例えば、低塩濃度)が使用される。
【0390】
一部の実施形態では、ポリヌクレオチドが染色体またはクロマチンを含む場合、抗体を染色体またはクロマチン上で使用して、DNA上の修飾、およびヒストン上の修飾(例えば、ヒストンアセチル化およびメチル化)も検出する。これらの修飾の場所は、染色体またはクロマチン上の場所に対する抗体の一過的な結合によって決定される。一部の実施形態では、抗体は、オリゴタグで標識され、一過的に結合しないが、むしろそれらの結合部位に永久的または半永久的に固定される。かかる実施形態では、抗体は、オリゴタグを含み、これらの抗体結合部位の場所は、抗体タグ上のオリゴに対する相補オリゴの一過的な結合を使用することによって検出される。
【0391】
セルフリー核酸の単離および分析
診断に最もアクセス可能なDNAまたはRNAのいくつかは、体液または便の細胞外に見つかる。そのような核酸は、体内の細胞によってしばしば脱落したものである。血液中を循環するセルフリーDNAは、21番染色体トリソミーおよび他の染色体およびゲノム障害の出生前検査に使用される。それは、特定の病理状態のマーカーである腫瘍由来のDNAおよび他のDNAまたはRNAを検出する手段でもある。しかしながら、分子は、典型的には、小さなセグメント(例えば、血液中の約200塩基対の長さの範囲、および尿中のさらに短い範囲)に存在する。ゲノム領域のコピー数は、ゲノムの他の部分と比較して、参照の特定の領域に整列するリードの数と比較することによって、決定される。
【0392】
一部の実施形態では、本開示の方法は、2つのアプローチによるセルフリーDNA配列の列挙または分析に適用される。1つ目は、変性の前または後に短い核酸を固定化することを伴う。一過性結合試薬は、核酸の同一性、そのコピー数、変異または特定のSNPアレルが存在するかどうか、ならびに検出された配列がメチル化されているか、または他の修飾(バイオマーカー)を有するかどうかを決定するために、核酸を照合するために使用される。
【0393】
2つ目のアプローチは、(例えば、セルフリー核酸が生体試料から単離された後に)小さい核酸断片を連結することを伴う。連結は、組み合わせた核酸を伸展させることを可能にする。連結は、DNAの末端を研磨し、平滑末端ライゲーションを行うことによって、行われる。代替的に、血液またはセルフリーDNAは、2つのアリコートに分割され、一方のアリコートは、ポリAでテール付加され(ターミナルトランスフェラーゼを使用して)、他方のアリコートは、ポリTによってテール付加される。
【0394】
次いで、得られたコンカテマーを配列決定に供する。得られた「スーパー」配列リードを、次いで、参照と比較して、個々のリードを抽出する。個々のリードデータは、計算的に抽出され、次いで、他の短いリードデータと同じ様式で処理される。
【0395】
一部の実施形態では、生体試料は、便(核酸を分解する多数のエキソヌクレアーゼを含む媒体)を含む。かかる実施形態では、高濃度の二価カチオン(エキソヌクレアーゼが機能するために必要とする)のキレート剤(例えばEDTA)を用いて、DNAを十分にインタクトで維持し、配列決定を可能にする。一部の実施形態では、セルフリー核酸は、エキソソーム中のカプセル化を介して細胞から脱落する。エキソソームは、超遠心分離によって、またはスピンカラム(Qiagen)を使用することによって単離され、それに含まれるDNAまたはRNAが回収され、配列決定される。
【0396】
一部の実施形態では、メチル化情報は、上に記載の方法に従って、セルフリー核酸から得られる。
【0397】
配列決定技術の組み合わせ
一部の実施形態では、本明細書に記載の方法は、他の配列決定技術と組み合わされる。一部の実施形態では、一過的な結合による配列決定の後、第2の方法による配列決定が、同じ分子上で開始される。例えば、より長いより安定なオリゴヌクレオチドが結合して、合成による配列決定が開始される。一部の実施形態では、本方法は、完全なゲノム配列決定であることにとどまらず、Illumina由来のものなどの短いリード配列決定のための足掛かりを提供するために使用される。この場合、ゲノムのより均一なカバレッジを得るために、PCR増幅ステップを除外することによって、Illuminaライブラリの調製を行うことが有利である。これらの実施形態のいくつかの1つの利点は、必要とされる配列決定のカバレッジ倍率が、例えば、約40倍から20倍に半減することである。一部の実施形態では、これは、本明細書に記載の方法が提供する方法および場所情報によって行われる配列決定の追加によるものである。一部の実施形態では、任意選択的に、光学的に標識されるより長くより安定したオリゴは、ゲノム(例えば、BRCA1遺伝子座)の目的の特定の領域を、配列決定プロセスの一部または全体を通して短い配列決定オリゴとともに前にまたは同時にマークするために(差次的に標識される)、標的に結合することができる。
【0398】
機械学習の方法
一部の実施形態では、人工知能または機械学習を使用して、既知の配列のポリマー(例えば、ポリヌクレオチド)に対して試験する場合、および/またはポリヌクレオチドの配列を別の方法からのデータと交差検証する場合、オリゴヌクレオチドプローブ種の完全なセットのメンバーの挙動を学習させる。一部の実施形態では、学習アルゴリズムは、1つ以上の条件または文脈における、オリゴヌクレオチドプローブ種の結合部位を含む1つ以上のポリヌクレオチド標的に対する特定のオリゴヌクレオチドプローブ種の完全な挙動を考慮に入れる。同じまたは異なる試料でより多くの配列決定が行われるにつれて、機械学習から得られる知識はより強力になる。機械学習から学んだことは、様々な他のアッセイに適用され、特に、一過的な結合ベースの出現配列決定に加えて、オリゴとオリゴ/ポリヌクレオチドとの相互作用(例えば、ハイブリダイゼーションによる配列決定)を伴うアッセイにおいて、適用される。
【0399】
一部の実施形態では、人工知能または機械学習は、既知の配列の1つ以上のポリヌクレオチドへの短いオリゴ(例えば、3塩基長、4塩基長、5塩基長、または6塩基長)の完全なセットの結合について実験的に得られた結合パターンのデータを提供することによって、訓練される。各オリゴの訓練データは、結合場所、結合の持続時間、および所与の期間にわたる結合事象の数を含む。この訓練の後、機械学習アルゴリズムが、決定される配列のポリヌクレオチドに適用され、その学習に基づいて、ポリヌクレオチドの配列をアセンブリすることができる。一部の実施形態では、機械学習アルゴリズムに、参照配列も提供される。
【0400】
一部の実施形態では、配列アセンブリアルゴリズムは、機械学習要素および非機械学習要素の両方を含む。
【0401】
一部の実施形態では、実験的に得られた結合パターンから学習するコンピュータアルゴリズムの代わりに、結合パターンは、シミュレーションを介して得られる。例えば、一部の実施形態では、オリゴヌクレオチドプローブ種の完全なセットのオリゴヌクレオチドプローブ種の既知配列のポリヌクレオチドへの一過的な結合のシミュレーションが行われる。シミュレーションは、実験データまたは公開データから得られた各オリゴヌクレオチドプローブ種の配列の挙動のモデルに基づく。例えば、結合安定性の予測は、近傍法に従って利用可能である(例えば、SantaLucia et al.,Biochemistry 35,3555-3562(1996)およびBreslauer et al.,Proc.Natl.Acad.Sci.83:3746-3750,1986に記載されている)。一部の実施形態では、不一致挙動は既知であり(例えば、AへのG不一致結合は、TからAよりも強いまたはより強い相互作用であり得る)、または実験的に導出される。さらに、一部の実施形態では、オリゴのいくつかの短いサブ配列(例えば、GGAまたはACC)の異常に高い結合強度が知られている。一部の実施形態では、機械学習アルゴリズムは、シミュレーションデータ上で訓練され、次いで、それが短いオリゴの完全なセットによって照合される場合、未知の配列の配列を決定するために使用される。
【0402】
一部の実施形態では、オリゴヌクレオチドプローブ種またはパネルの完全なセットのオリゴのデータ(場所、結合持続時間、シグナル強度など)は、1つ、または数十、または数百、または数千の既知の配列で訓練された機械学習アルゴリズムにプラグインされる。次いで、機械学習アルゴリズムを適用して、問題の配列から、データセットを生成し、機械学習アルゴリズムは、問題の未知の配列の配列を生成する。比較的小さいゲノム、またはあまり複雑でないゲノム(例えば、細菌、バクテリオファージなど)の生物の配列決定のためのアルゴリズムの訓練は、その種類の生物に対して行われるべきである。より大きいゲノムまたはより複雑なゲノム(特に、反復DNA領域を有するゲノム)を有する生物の場合(例えば、S.pombeまたはヒト)、訓練は、その種類の生物に対して行われるべきである。全染色体長までのメガ塩基断片の長距離アセンブリの場合、一部の実施形態では、訓練は、類似の生物に対して行われ、そのため、ゲノムの特定の様相が訓練中に表現される。例えば、ヒトゲノムは二倍体であり、セグメント重複を有する大きな配列領域を示す。目的の他のゲノム、特に、多くの農業上重要な植物種は、非常に複雑なゲノムを有する。例えば、コムギおよび他の穀物は、高度な倍数体ゲノムを有する。
【0403】
一部の実施形態では、機械学習ベースの配列アセンブリのアプローチは、(a)1つ以上の訓練データセットから収集されたオリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の結合挙動に関する情報を提供することと、(b)オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の、配列が決定される標的核酸への物理的な結合を提供することと、(c)各オリゴヌクレオチドプローブ種についての結合場所、および/または結合持続時間、および/または各場所で生じる結合の回数(例えば、結合反復の存続時間)に関する情報を提供することと、を含む。
【0404】
一部の実施形態では、特定の実験の配列は、最初に、非機械学習アルゴリズムによって処理される。次いで、第1のアルゴリズムの出力配列を使用して、機械学習アルゴリズムを訓練し、訓練が、同じ分子の実際の実験的に導出された配列上で行われるようにする。一部の実施形態では、配列アセンブリアルゴリズムは、ベイズアプローチを含む。一部の実施形態では、本開示の方法に由来するデータは、WO2010/075570に記載されている種類のアルゴリズムに提供され、任意選択的に、他の種類のゲノムデータまたは配列決定データと組み合わされる。
【0405】
一部の実施形態では、配列は、いくつかの方法でデータから抽出される。配列アセンブリ方法のスペクトルの一端では、モノマーまたは一連のモノマーの局在化は、モノマーまたは一連のモノマーを注文するだけで配列が得られるように正確である(ナノメトリックまたはサブナノメトリック)。スペクトルの他端では、データは、配列に関する様々な仮説を排除するために使用される。例えば、1つの仮説は、配列が既知の個々のゲノム配列に対応するということである。アルゴリズムは、データが個々のゲノムから乖離する場所を決定する。別の場合、仮説は、配列が「正常」体細胞の既知のゲノム配列に対応するということである。アルゴリズムは、推定される腫瘍細胞からのデータが、「正常な」体細胞の配列から乖離する場所を決定する。
【0406】
本開示の一実施形態では、1つ以上の既知の標的核酸(例えば、オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種に対する相補体を含むスーパー配列を含むラムダファージDNAまたは合成構築物)を含む訓練セットを、オリゴヌクレオチドプローブ種の完全なセットからの各オリゴヌクレオチドプローブ種の試験された反復結合のために使用する。機械学習アルゴリズムを使用して、一部の実施形態では、オリゴヌクレオチドプローブ種の結合特性および不一致特性を決定する。したがって、直感に反して、不一致結合は、さらなるデータを提供する方法としてみなされ、配列をアセンブリする、かつ/または配列に対する信頼度を付加するために使用される。
【0407】
配列決定計装とデバイス
配列決定方法は、共通の計装要件を有する。基本的に、機器は撮像および試薬の交換が可能でなければならない。撮像要件には、1つ以上のグループ:対物レンズ、リレーレンズ、ビームスプリッター、ミラー、フィルタ、カメラまたはポイント検出器が含まれる。カメラまたは撮像デバイスは、CCD、アレイCMOS、またはアバランシェフォトダイオードアレイ検出器を含む。ポイント検出器には、光電子増倍管(PMT)またはアバランシェフォトダイオード(APD)が含まれる。場合によっては、高速カメラが使用される。その他のオプションの様相は、本方法の形式に応じて調整される。例えば、照明源(例えば、ランプ、LED、またはレーザ)、照明の基板への結合(例えば、プリズム、導波路、フォトニックナノ構造、格子、ゾル-ゲル、レンズ、可動ステージ、または可動対物レンズ)、撮像デバイスと関連して試料を移動させるための機構、試料混合/撹拌、温度制御、および電気制御は、本明細書に開示される異なる実施形態に対して各々独立して調整される。
【0408】
単一分子の実装の場合、照明は、例えば、プリズムベースの全内部反射、対物レンズベースの全内部反射、プラズモニック導波路、格子ベースの導波路、ヒドロゲルベースの導波路、または好適な角度でレーザ光を基板のエッジにもたらすことによって生成されるエバネッセント導波路を利用することができる。一部の実施形態では、導波路は、コア層および第1のクラッド層を含む。照明は、代替的に、HILO照明またはライトシートを含む。いくつかの単一分子機器では、パルス照明と時間ゲート検出の同期を使用することによって、光散乱の影響を軽減する。ここでは、光散乱がゲートアウトされる。一部の実施形態では、暗視野照明が使用される。蛍光寿命測定のために設定されている器具もある。
【0409】
一部の実施形態では、機器はまた、細胞、核、オルガネラ、染色体などからポリヌクレオチドを抽出するための手段を含む。
【0410】
ほとんどの実施形態に好適な機器は、IlluminaのゲノムアナライザーIIxである。本デバイスは、プリズムベースのTIR、20×乾燥対物レンズ、ライトスクランブラ、532nmおよび660nmのレーザ、赤外線レーザベースの自動焦点システム、発光フィルタホイール、Photometrix CoolSnap CCDカメラ、温度制御、および試薬交換用のシリンジポンプベースのシステムで構成されている。一部の実施形態では、この機器を代替カメラの組み合わせを用いて改良することで、より良好な単一分子配列決定が可能になる。例えば、センサーは、低い電子ノイズ、2e未満を有する。また、センサーは、多数の画素を有する。一部の実施形態では、シリンジ-ポンプベースの試薬交換システムは、圧力駆動フローベースのシステムに置き換えられる。システムは、互換性のあるIlluminaフローセル、または一部の実施形態では、機器の実際の配管もしくは改良された配管に合うように適合されたカスタムのフローセルとともに使用される。
【0411】
代替的に、レーザベッド(レーザは、標識の選択に依存する)またはゲノム分析デバイスからのレーザシステムおよびライトスクランブラ、EM CCDカメラ(例えば、Hamamatsu ImageEM)またはScientific CMOS(例えば、Hamamatsu Orca FLASH)と結合された電動Nikon Ti-E顕微鏡、および任意選択的に、温度制御が使用される。一部の実施形態では、科学用センサーではなく消費者用センサーが使用される。これは、配列決定のコストを劇的に低減する可能性を有する。これは、圧力駆動またはシリンジポンプのシステム、および特別に設計されたフローセルと結合されている。一部の実施形態では、フローセルは、ガラスまたはプラスチックで製作され、それぞれ利点および欠点を有する。一部の実施形態では、フローセルは、環状オレフィンコポリマー(COC)、例えば、TOPAS、他のプラスチック、もしくはPDMSを使用して、またはシリコンもしくはガラス中で、微細加工法を使用して製作される。一部の実施形態では、熱可塑性プラスチックの射出成形は、工業規模の製造に低コスト化の道筋を提供する。一部の光学構成では、熱可塑性プラスチックは、最小限の固有蛍光を有する良好な光学特性を有する必要がある。芳香族または共役系を含むポリマーは、顕著な固有蛍光を有することが予想されるため、理想的には除外されるべきである。Zeonor1060R、Topas5013、およびPMMA-VSUVT(例えば、米国特許第8,057,852号に記載されている)は、緑色および赤色の波長範囲(例えば、Cy3およびCy5に対して)で妥当な光学特性を有することが報告されており、Zeonar1060Rは、最も好ましい特性を有する。一部の実施形態では、熱可塑性プラスチックをマイクロ流体デバイスの広い領域にわたって結合させることが可能である(例えば、Sun et al.,Microfluidics and Nanofluidics,19(4),913-922,2015に報告されている)。一部の実施形態では、バイオポリマーが付着されるガラスカバーガラスは、熱可塑性プラスチックの流体アーキテクチャに結合される。
【0412】
代替的に、手動操作のフローセルは、顕微鏡の上部で使用される。これは、一部の実施形態では、両面粘着シートを使用してフローセルを作製し、適切な寸法のチャネルが得られるようにレーザ切断し、カバースリップとスライドガラスとの間に挟むことによって、構築される。ある試薬交換サイクルから別の試薬交換サイクルまで、フローセルは、フレーム間の位置合わせまで、機器/顕微鏡上に留めてもよい。一部の実施形態では、リニアエンコーダを備えた電動ステージを使用して、広い領域を撮像する際のステージの移動を確実にする。同じ場所が、正しく再訪される。正しい位置合わせを維持するために、基準マーカーが使用される。一部の実施形態では、フローセルまたは表面のエッチングなどの基準マーキングでは、光学的に検出される固定化ビーズがフローセル内に提供される。ポリヌクレオチド骨格が(例えば、YOYO-1によって)染色されている場合、これらの固定された既知の位置を使用して、画像を、あるフレームから次のフレームへ整列させる。
【0413】
一実施形態では、本明細書に記載の方法を実施するために、レーザまたはLED照明を使用する照明機構(例えば、米国特許第7,175,811号およびRamachandran et al.,Scientific Reports 3:2133,2013に記載されているものなど)を、任意選択的な加熱機構および試薬交換システムと結合される。一部の実施形態では、スマートフォンベースの撮像設定(ACS Nano7:9147)が、任意選択的な温度制御モジュールおよび試薬交換システムと結合される。かかる実施形態では、主に電話のカメラが使用されるが、iPhoneまたは他のスマートフォンデバイスの照明および振動機能などの他の態様も使用することができる。
【0414】
図20Aおよび
図20Bは、フローセル2004および統合された光学レイアウトを使用して、本明細書に記載されるように、一過的なプローブ結合の撮像を行うための可能なデバイスを例示している。試薬は、エアギャップ2022によって分離された試薬/緩衝液2008のパケットとして送達される。
図20Aは、プリズム2016(例えば、TIRF設定)を通して透過されるカップリングレーザ光2014を介してエバネッセント波2010が生成される例示的なレイアウトを示している。一部の実施形態では、反応の温度は、統合された温度制御2012によって制御される(例えば、一例では、透明基板2024は、電気的に結合され、したがって、基板2024の全体の温度を変化させる酸化インジウムスズを含む)。試薬は、試薬/緩衝液2008の連続的な流れとして送達される。格子、波導路2020、またはフォトニック構造を使用して、レーザ光2014を結合して、エバネッセント場2010を生成する。一部の実施形態では、温度制御は、空間を覆うブロック2026に由来する。
【0415】
図20Aに記載されるレイアウトの態様は、
図20Bに記載されるレイアウトの態様と互換可能である。例えば、代替的に、対物スタイルTIRF、ライトガイドTIRF、コンデンサTIRFを使用することができる。継続的またはエアギャップ試薬送達は、一部の実施形態では、シリンジポンプまたは圧力駆動の流れによって制御される。エアギャップ方法は、すべての試薬2008(例えば、
図21に図示されるように)が、キャピラリー/チューブ2102またはチャネルに予め充填され、シリンジポンプまたは圧力制御システムからのプッシュまたはプルによって送達されることを可能にする。エアギャップ法は、すべての試薬が、キャピラリー/チューブまたはチャネルに予め充填され、シリンジポンプまたは圧力制御システムからのプッシュまたはプルによって送達されることを可能にする。エアギャップ2022は、空気もしくは気体(窒素など)、または水溶液と混ざらない液体を含む。エアギャップ2022は、試薬送達だけでなく、分子コーミングを行うためにも使用することができる。流体デバイス(例えば、流体容器、カートリッジ、またはチップ)は、ポリヌクレオチド固定化および任意選択的に伸長が行われるフローセル領域、試薬保存、入口、出口、およびポリヌクレオチド抽出、ならびにエバネッセント場を成形するための任意の構造を含む。一部の実施形態では、デバイスは、ガラス、プラスチック、またはガラスとプラスチックのハイブリッドで作製される。一部の実施形態では、熱伝導性要素および電気伝導性要素(例えば、金属)が、ガラスおよび/またはプラスチック構成要素に組み込まれる。一部の実施形態では、流体容器は、ウェルである。一部の実施形態では、流体容器は、フローセルである。一部の実施形態では、表面は、1つ以上の化学層、生化学層(例えば、BSA-ビオチン、ストレプトアビジン)、脂質層、ヒドロゲル、またはゲル層でコーティングされる。次いで、ビニルシランでコーティングされた22×22mmのカバーガラス(BioTechniques 45:649-658,2008、またはGenomic Visionから入手可能)、またはクロロベンゼン溶液中の1.5%Zeonexでスピンコーティングされたカバーガラスを使用する。基板は、2%の3-アミノプロピルトリエトキシシラン(APTES)またはポリリジンでコーティングすることもでき、伸展は、pH7.5~8のHEPES緩衝液中での静電相互作用を介して生じる。代替的に、ビス-アクリルアミドおよびTEMEDを含む1~8%のポリアクリルアミド溶液中でスピンコーティングまたはディップコーティングされたシラン化カバーガラス。これに加えて、ビニルシランでコーティングされたカバーガラスを使用して、コーブガラスを、アセトン(v/v)中の10%の3-メタクリルオキシプロピルトリメトキシシラン(Bind Silane、Pharmacia Biotech)で1時間コーティングすることができる。ポリアクリルアミドコーティングは、以下に記載されているように得ることもできる(Liu Q et al.Biomacromolecules,2012,13(4),pp 1086-1092)。使用することができるいくつかのヒドロゲルコーティングは、Mateescu et al.Membranes 2012,2,40-69に記載および参照されている。
【0416】
また、標的核酸は、交流電流(AC)(誘電泳動)電場を印加することによって、アガロースゲル中で伸長され得る。DNA分子は、ゲル中に電気泳動されてもよく、またはDNAは、融かしたアガロースと混合されてもよく、次いで、アガロースとともに設定されてもよい。次に、約10Hzの周波数のAC電場を印加し、200~400V/cmの電場強度を使用する。伸展は、0.5~3%の範囲のアガロースゲル濃度で行うことができる。場合によっては、表面を、フローチャネルまたはウェル中で、BSA-ビオチンでコーティングした後、ストレプトアビジンまたはニュートラアビジンを添加する。このコーティングされたカバーグラスを使用して、最初にpH7.5の緩衝液中でDNAを結合させ、次いで、pH8.5の緩衝液中でDNAを伸展することによって、二本鎖ゲノムDNAを伸展することができる。場合によっては、ストレプトアビジンでコーティングされたカバーグラスを使用して、核酸鎖を捕捉および固定化するが、伸展は行わない。したがって、核酸は、一端で結合し、一方、他端が溶液中でぶら下がっている。
【0417】
GAIIxなどの光学配列決定システムの様々な顕微鏡様構成要素を使用する代わりに、一部の実施形態では、配列決定のために、より統合された一体化デバイスが構築される。かかる実施形態では、ポリヌクレオチドは、センサーアレイ上に、またはセンサーアレイに隣接する基板上に直接結合され、任意選択的に、伸長される。センサーアレイ上での直接検出は、アレイへのDNAハイブリダイゼーションに関して実証されている(例えば、Lamture et al.,Nucleic Acid Research 22:2121-2125,1994に記載されている)。一部の実施形態では、レイリー散乱が蛍光色素からの発光と比較して短命であることから、センサーを時間ゲートして、バックグラウンド蛍光を低減する。
【0418】
一実施形態では、センサーはCMOS検出器である。一部の実施形態では、複数の発光最大波長が検出される(例えば、米国特許出願第2009/0194799号に記載されている)。一部の実施形態では、検出器は、Foveon検出器である(例えば、米国特許第6,727,521号に記載されている)。一部の実施形態では、センサーアレイは、三重接合ダイオードのアレイである(例えば、米国特許第9,105,537号に記載されている)。
【0419】
一部の実施形態では、試薬/緩衝液は、単回投与(例えば、ブリスターパックを介して)でフローセルに送達される。パック内の各ブリスターは、オリゴヌクレオチドのオリゴヌクレオチドプローブ種のセットとは異なるオリゴヌクレオチドプローブ種を含む。オリゴヌクレオチドプローブ種間のいかなる混合または混入なしで、第1のブリスターを穿刺し、標的核酸をその内容物に曝露する。一部の実施形態では、洗浄ステップは、連続して、次のブリスターに移動する前に適用される。これは、オリゴヌクレオチドプローブ種の異なるセットを物理的に分離し、したがって、バックグラウンドノイズ(前のセットからのオリゴヌクレオチドプローブ種が撮像視野に残る場合)を低減する役割を果たす。
【0420】
一部の実施形態では、配列決定は、細胞が配置され、および/またはポリヌクレオチドが抽出された同じデバイスまたは一体化構造において行われる。一部の実施形態では、本方法を実施するために必要なすべての試薬が、分析が開始される前に流体デバイスに予め充填される。一部の実施形態では、試薬(例えば、プローブ)は、デバイス内で乾燥状態で存在し、反応が進行する前に湿潤され、溶解される。
【0421】
追加の実施形態
広範な一態様では、本発明は、補助的な事象のレパートリーを分析することによって不随的な情報を取得する方法である。
【0422】
1つの広範な態様では、本発明の範囲は、分子プローブを1つ以上の分子の単位に結合させることによって、多単位分子の少なくとも1単位を識別する方法を含む。本発明は、1つ以上の種類の分子プローブと分子との単一分子相互作用の検出に基づいている。一部の実施形態では、プローブは、少なくとも1単位の分子に一過的に結合する。一部の実施形態では、プローブは、少なくとも1単位の分子に反復的に結合する。一部の実施形態では、分子実体は、表面またはマトリックス上で、ナノメトリック正確度(典型的には、250nm未満、好ましくは50nm未満、より好ましくは2nm未満)まで位置決定される。
【0423】
一部の実施形態では、本発明は、1つ以上のプローブと分子との間の相互作用を特徴付ける方法を含み、以下を含む:
1つ以上のプローブ種を、プローブが分子に一過的に結合することができる条件下で、分子に添加することと、
検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
ステップbからのデータを分析して、相互作用の1つ以上の特徴を決定することと、
任意選択的に、ステップaの前に、分子が表面またはマトリックス上に固定化されることと、を含む。一部の実施形態では、cの検出器は、2Dまたは検出器であり、結合事象は、表面またはマトリックス上で、例えば、単一分子局在化アルゴリズムを使用して、ナノメートル正確度で位置決定される。一部の実施形態では、特徴は、プローブと分子との親和性に対応する各事象の持続時間である。一部の実施形態では、特徴は、表面またはマトリックス上の場所である。
【0424】
一部の実施形態では、本発明は、不均一な高分子の化学構造の単位を識別または特徴付ける方法を含み、複数のプローブを結合させて、高分子の複数の部位における化学構造を識別することを含み、
a)1つ以上のプローブ種を、プローブが高分子に結合することができる条件下で、高分子に添加することと、
b)検出器で、高分子上の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、高分子の複数の部位における化学構造を識別することと、を含む。
【0425】
任意選択的に、高分子は、ステップaの前に、表面またはマトリックス上に固定化される。一部の実施形態では、高分子は、超分子構造を含む。一部の実施形態では、1つ以上のプローブの各々は、高分子に一過的に結合する。一部の実施形態では、複数のプローブの各々は、ポリマーに反復的に結合する。
【0426】
一部の実施形態では、分子実体は、少なくとも5単位を含むポリマーである。一部の実施形態では、結合プローブは、オリゴヌクレオチド、抗体、結合タンパク質、低分子などを含む分子プローブである。典型的には、ポリマーは、ポリヌクレオチドまたはポリペプチドを含む。
【0427】
一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または特徴付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、複数のプローブを結合させることを含み、
a)1つ以上のプローブ種を、プローブがポリマーに結合することができる条件下で、ポリマーに添加することと、
b)検出器で、ポリマー上の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、ポリマーに沿った複数の部位における化学構造を識別することと、を含む。
【0428】
一部の実施形態では、ポリマーは、ステップaの前に、表面またはマトリックス上に固定化される。一部の実施形態では、ポリマーは、ステップaの前に変性される。一部の実施形態では、1つ以上のプローブの各々は、ポリマーに一過的に結合する。一部の実施形態では、複数のプローブの各々は、ポリマーに反復的に結合する。一部の実施形態では、化学構造の単位を識別するプローブ結合の場所は、ナノメトリック(必要に応じて、サブナノメトリックでも)正確度/精度で(例えば、単一分子局在化アルゴリズムを使用して)決定され、それによって、「配列」は、各場所に結合するプローブの同一性に基づいて決定される。
【0429】
一部の実施形態では、位置決定の正確度および精度が高く(サブナノメートルまたは数ナノメートル)、各配列ビットの場所および順序が、明確に決定される。しかしながら、配列リードは、非連続的に、断続的な様式で出現する。ほとんどの配列決定方法が、配列を最初から最後まで連続的に読み取る場合、本発明では、配列情報の獲得は、確率的に分散される。すべての配列データが収集された場合、配列は、それらの空間場所に従って得られた配列情報のビットを順序付けることによってまとめられ、各配列ビットは、例えば、5塩基長について得られた情報の前および次の局在化配列ビットと重複する必要があり、各配列ビットは、配列において、一端で、前の配列ビットの4塩基と、および他端で、次の配列ビットの4塩基と重複する必要がある。これが正確に保持されてされない場合(例えば、4つではなく3つのみの重複)、配列ビットは、不一致に起因して得られた可能性が高いか、または位置がわずかにずれている可能性がある。本発明の新規の態様は、この内部チェック機構が、配列ビットの正しい順序を解決でき、したがって、高い信頼度で配列を解決できるはずである、ということである。
【0430】
一部の実施形態では、プローブ添加の各サイクルの持続時間は、特定の数の結合事象が、各相補結合部位について収集され得るように構成される。結合事象の数は、平均で5、10、20などである。一部の実施形態では、プローブ添加の各サイクルの持続時間は、特定の数の光子が、各相補結合部位について収集され得るように構成される。各結合について収集される光子の数が多いほど、達成され得る位置決定の程度(正確度)および精度が良好になる。一部の実施形態では、異なるプローブまたはプローブセットの持続時間が異なる。したがって、いくつかのプローブは、高精度で位置決定することができ、他のプローブは、より低い精度で位置決定することができる。一部の実施形態では、高度に局所化された位置を使用して、配列アセンブリを繋留する(anchor)ことができ、局所化が不十分な位置は、配列の重複によって計算的にアセンブリされる。一部の実施形態では、局所化された位置(あまり十分に局所化されていないものを含む)は、ド・ブラウングラフを使用するものなどのアセンブリアルゴリズムで使用することができる。
【0431】
一部の実施形態では、プローブは標識される。標識という用語は、単一の検出可能な実体(例えば、波長発光実体)または複数の検出可能な実体を包含する。一部の実施形態では、複数の検出可能な実体は、コードを含み得、それによってプローブ種を識別することができる。一部の実施形態では、プローブは、フルオロフォアまたは粒子で標識される。蛍光標識は、異なる波長で蛍光を放出ることができ、また異なる寿命を有する。一部の実施形態では、バックグラウンド蛍光は、散乱に起因する蛍光の早期の時間枠を拒絶することによって除去される。標識がプローブの一端(例えば、オリゴプローブの3’末端)にある場合、1nmの正確度は、プローブ配列の3’末端および標的配列の5’に対応する。
【0432】
一部の実施形態では、ポリマーの配列決定は、プローブのレパートリーとのその一過的な相互作用(例えば、ポリヌクレオチドとオリゴヌクレオチドのレパートリーとの相互作用)を測定することに基づく。一部の実施形態では、レパートリーは、所与の長さまたは所与の長さのセットのすべてのオリゴヌクレオチドを含む。
【0433】
一部の実施形態では、本発明は、単一標的ポリヌクレオチド上でヌクレオチド塩基および/または修飾を配列決定する方法を含み、
a)ポリヌクレオチドを、表面またはマトリックス上に固定化し、任意選択的に、ポリヌクレオチドを伸展することと、
b)任意選択的に、ポリヌクレオチドを、ポリヌクレオチドの少なくとも一部分がプローブとの結合に利用可能になる程度まで、変性させることと、
c)1つ以上のプローブ種を、プローブがポリヌクレオチドに一過的に結合することができる条件下で、添加することと、
d)検出器で、ポリヌクレオチド上の結合事象を継続的に監視し、一定期間、記録することと、
e)bのプローブを除去することと、
f)プローブの完全なレパートリーの結合が監視されるまで、毎回異なる1つ以上のプローブ種を用いて、ステップb~dを反復することと、
g)ステップcの各反復からのデータをコンパイルして、修飾および/または塩基の配列を再構築することと、を含む。
【0434】
一部の実施形態では、ポリマーの配列決定は、プローブ種のレパートリーの一過的な結合相互作用の出現特性の結果である。1つのプローブの結合は、ポリマーを配列決定するのに十分ではなく、オリゴマーの完全なレパートリーが必要である(例えば、ポリヌクレオチドの場合、オリゴヌクレオチドのレパートリー)。オリゴの結合の場所、重複部位への時間的に離れた結合、不一致の部分的な結合、結合の頻度、結合の持続時間に関する情報は、すべて、堅牢な配列の構築に寄与する。伸長または伸展されたポリヌクレオチドの場合、ポリヌクレオチドの長さに沿ったプローブ結合の場所は、堅牢な配列の構築に寄与する。また、二本鎖DNAの場合、配列は、二重鎖の両方の鎖を同時に配列決定することから出現する。
【0435】
上記の一部の実施形態では、ポリマー(ポリヌクレオチド中のヌクレオチド)の反復単位上の修飾へのプローブの結合は、任意選択的なbの変性ステップの前に行われる。一部の実施形態では、任意選択的なbの変性ステップは行われず、プローブが二重鎖構造に対処する。場合によっては、プローブは、鎖侵入を介して(例えば、PNAプローブを使用して)、二重鎖の過剰なゆらぎの誘発を介して、修飾亜鉛フィンガータンパク質を介して二重鎖の配列を認識することによって、または二重鎖を融解する(例えば、ガイドRNA配列の結合を可能にすることにより)Cas9もしくは類似のタンパク質を使用することによって(ガイドRNAは、照合プローブ配列を含み得、レパートリーの各配列を含むgRNAが提供される)、二重鎖の個々の鎖に結合する。
【0436】
上記の注意点は、一部の実施形態では、特定のプローブは、例えば、それ自体との問題のある相互作用(例えば、自己相補性、それ自体の他のコピーとの結合を可能にする回文配列)、レパートリーの他のプローブとの相互作用、またはポリヌクレオチドとの相互作用(例えば、既知の確率的で無差別な結合)に起因して、レパートリーから省略され得るが、本発明の配列決定を実施するのに十分なプローブが残ることである。実際、最小数の有益なプローブは、分析下の配列の種類ごとに決定することができる。別の注意点は、完全なレパートリーの半分が、レパートリーの他のオリゴに完全に相補的であるという事実に関する。一部の実施形態では、これらの相補対(および、実質的な相補性のために問題のある他の対)が、ポリヌクレオチドに同時に添加されないように保証される。一部の実施形態では、二本鎖DNAのセンス鎖およびアンチセンス鎖の両方が存在する場合、配列決定は、相補対の1つだけのメンバーを用いて行われ、センス鎖およびアンチセンス鎖の両方から得られた配列情報が組み合わされて、配列を生成する。
【0437】
一部の実施形態では、(天然に二本鎖である標的の)相補鎖について得られた参照配列および配列情報を使用して、特定の場所における配列の割当を容易にすることができる。
【0438】
本発明の一部の実施形態では、配列決定は、以下のステップ(5塩基の配列決定について示している):
a)表面上の二重鎖DNAを、伸展/伸長させること、
b)二重鎖DNAを変性させて、残っている一対の相補鎖を、表面上で、インサイツで残すことと、
c)短いオリゴ(例えば、3、4、5、6塩基長)の完全なレパートリーを、DNA鎖の対に結合させ、各オリゴの結合場所を、鎖の対の糸尺(linear length)に沿って記録することと、
d)結合の場所およびオリゴ間の配列重複を使用して、2つの鎖の各々に対する相補体を表すオリゴの2つのタイリング経路を構築することと、
e)2つの鎖の逆相補配列を比較し、「二重鎖コンセンサス」由来の塩基割当を行うことと(両方の鎖によって割当が裏付けられ、裏付けが見つからない場合にベースコールの曖昧さが示される)、を含む。
【0439】
問題は、タイリング経路に切れ目がある場合、例えば、5塩基の配列決定の場合、5塩基長を超える一続きの配列にオリゴ結合が存在しない場合に生じ得る。この場合、1つ以上のアプローチを取ることができる:塩基割当は、利用可能な場合、二重鎖の相補鎖から得られた配列に従うこと、利用可能な場合、配列の同じセグメントの他のコピーに依存すること、または参照配列に従うこと(この場合、塩基は、参照から人為的に移植されることを示すように注釈付けされ得る)。
【0440】
一部の実施形態では、人工知能または機械学習を使用して、既知の配列のポリマー(例えば、ポリヌクレオチド)に対して試験する場合、および/またはポリヌクレオチドの配列を別の方法からのデータと交差検証する場合、レパートリーのメンバーの挙動を学習させる。学習アルゴリズムは、1つ以上の条件または文脈における、プローブの結合部位を含む1つ以上のポリヌクレオチド標的に対する特定のプローブの完全な挙動を考慮に入れる。同じまたは異なる試料でより多くの配列決定が行われるにつれて、機械学習から得られる知識はより強力になる。機械学習から学んだことは、様々な他のアッセイに適用され、特に、一過的な結合ベースの出現配列決定および本発明の他の実施形態に加えて、オリゴとオリゴ/ポリヌクレオチドとの相互作用(例えば、ハイブリダイゼーションによる配列決定)を伴うアッセイにおいて、適用され得る。
【0441】
一部の実施形態では、人工知能または機械学習は、既知の配列の1つ以上のポリヌクレオチドへの短いオリゴ(例えば、3塩基長、4塩基長、5塩基長、または6塩基長)の完全なレパートリーの結合について実験的に得られた結合パターンのデータを提供することによって訓練される。各オリゴの訓練データは、結合場所、結合の持続時間、および所与の期間にわたる結合事象の数を含む。この訓練の後、機械学習アルゴリズムが、決定される配列のポリヌクレオチドに適用され、その学習に基づいて、ポリヌクレオチドの配列をアセンブリすることができる。機械学習アルゴリズムに、参照配列を提供することもできる。
【0442】
一部の実施形態では、配列アセンブリアルゴリズムは、機械学習要素および非機械学習要素の両方を含む。
【0443】
一部の実施形態では、配列アセンブリアルゴリズムは、ベイズアプローチを含む。一部の実施形態では、本発明の方法に由来するデータは、(WO2010075570)に記載されている種類のアルゴリズムに提供することができ、任意選択的に、他の種類のゲノムデータまたは配列決定データと組み合わせることができる。
【0444】
一部の実施形態では、実験的に得られた結合パターンから学習するコンピュータアルゴリズムの代わりに、結合パターンは、シミュレーションを介して得られる。例えば、レパートリーのオリゴの、既知の配列のポリヌクレオチドへの一過的な結合のシミュレーションを行うことができ、シミュレーションは、実験データまたは公開データから得られた各オリゴの挙動のモデルに基づいて行うことができる。例えば、結合安定性の予測は、最近傍法[SantaLucia et al.Biochemistry 35,3555-3562(1996)、Breslauer et al.Proc.Natl.Acad.Sci.USA,83:3746-3750(1986)]に従って利用可能であり、不一致挙動は、既知であるか、または実験的に導出され得るが、オリゴの一部の短いサブ配列(例えば、GGAからACCへ)の異常に高い結合強度が知られている。機械学習アルゴリズムは、シミュレーションデータ上で訓練され、次いで、それが短いオリゴの完全なレパートリーによって照合される場合、未知の配列の配列を決定するために使用され得る。
【0445】
一部の実施形態では、レパートリーまたはパネルのオリゴのデータ(場所、結合持続時間、シグナル強度など)は、1つ以上、好ましくは(数十、数百、または数千)の既知の配列で訓練された機械学習アルゴリズムにプラグインされる。
【0446】
次いで、機械学習アルゴリズムを適用して、問題の配列から、データセットを生成し、機械学習アルゴリズムは、問題の未知の配列の配列を生成する。下等生物、例えば、細菌、バクテリオファージなどの配列決定のためのアルゴリズムの訓練は、その種類の生物に対して行われる必要がある。S.pombeなどの酵母から始まり、反復DNAを有するヒトまたはコムギに至る高等生物の場合、高等生物に対して訓練される必要がある。全染色体長までのメガ塩基断片の長距離アセンブリの場合、訓練は、類似の生物に対して行われる必要があり得、そのため、ゲノムの特定の様相が訓練中に表現される。例えば、ヒトゲノムは二倍体であり、多くのセグメント重複を有する。コムギは、倍数体である。
【0447】
一部の実施形態では、機械学習に基づく配列再構築のアプローチは、
a)1つ以上の訓練データセットから収集されたレパートリーの各オリゴの結合挙動に関する情報、およびかかる情報を使用することができるアセンブリアルゴリズムを提供することと、
b)レパートリーの各オリゴを、配列が決定されるポリヌクレオチドに物理的に結合させ、各オリゴについて、結合場所、および/または結合持続時間、および/または各場所で結合が生じる回数(結合反復の存続時間)に関する情報を提供することと、
c)訓練データセットを使用するアセンブリアルゴリズムを使用して、ポリヌクレオチドの配列を再構築することと、を含む。
【0448】
ヒトゲノムの場合、良好な基本ルールのゲノムは、NA12878であろう。NA12878は、様々な配列決定、ハプロタイピングおよび構造マッピングの方法によって広範に特徴付けられており、そのアセンブリは、任意のヒトゲノムの中で最も信頼度が高い。それにもかかわらず、これまでのところ、複雑なゲノムの真の表現を与え得る完璧な技術がないため、そのようなゲノムに利用可能な真値(ground truth)のデータセットは完璧ではない可能性があり、機械学習アルゴリズムは、代替的な「真値」または「平均」または「コンセンサス」を考慮に入れる必要があり得る。真値は、Illumina配列決定と組み合わせて、異なる技術(例えば、10×Genomics、Bionanogenomics、PacBio、ONT)を使用したアセンブリから事前に構築される。
【0449】
一部の実施形態では、特定の実験の配列は、最初に、非機械学習アルゴリズムによって処理される。次いで、第1のアルゴリズムの出力配列を使用して、機械学習アルゴリズムを訓練し、訓練が、同じ分子の実際の実験的に導出された配列上で行われるようにする。機械学習アルゴリズムの利点は、他のアルゴリズムよりも速く実装することができることである。
【0450】
一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または順序付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、複数のプローブを結合させることを含む。複数の当該部位は、回折限界光学撮像によって解像可能であるよりも近いが、それらの検出が時間的に離れているため解像される。化学構造を識別するプローブの結合は、必要に応じて、ナノメトリック/サブナノメトリック位置決定の正確度/精度で決定され、それによって、化学構造の空間順序である「配列」が決定される。
【0451】
さらなる実施形態では、特徴付けられるか、または配列決定される複数のポリマーは、回折限界光学撮像によって解像可能であるものよりも近いが、それらの長さに沿ったプローブ結合の場所がナノメトリック的に局在しているため、解像される。
【0452】
一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または順序付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、ポリマーを伸長させること、および複数のプローブを結合させることを含む。当該複数の部位は、回折限界光学的撮像によって解像可能であるものよりも近いが、ポリマーが伸長され、かつ/またはそれらの標識が時間的に離れているため、解像される。各化学構造を識別するプローブの結合の場所は、ナノメトリック正確度で決定され、それによって、化学構造の空間順序である「配列」が決定される。
【0453】
一部の実施形態では、本発明は、標的ポリヌクレオチド上の塩基配列を分析する方法を含む。一部の実施形態では、本発明は、ヌクレオチド修飾またはDNA損傷、ならびに標的ポリヌクレオチド上の塩基配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリヌクレオチド上の配列の編成を分析する方法を含む。
【0454】
「一過的な結合」という用語は、結合試薬またはプローブが、通常、分析の過程でその結合部位に結合したままではなく、典型的には、1つの試薬の結合がオンおよびオフし、次いで、同じまたは別の試薬の結合がオンおよびオフするなど、を意味する。反復結合とは、同じ結合部位が、分析の過程で、同じ結合試薬もしくはプローブ、または同じ種類の結合試薬もしくはプローブによって複数回結合され、典型的には、1つの試薬の結合がオンおよびオフし、次いで、別の試薬の結合がオンおよびオフするなど、を意味する。一部の実施形態では、結合相互作用は、一定期間にわたって継続的に観察される。
【0455】
一部の実施形態では、反復結合は、得られた情報の感度および正確度を増加させる。シグナルは、一度検出された場合、バックグラウンドを超えて呼び出されるには低すぎる可能性があり、持続的に見られる場合に呼び出されるため、感度が上がると、シグナルが本物であるという信頼度が増す。複数の読み取りの情報により、ある読み取りが、別の読み取りで確認されるため、正確度が上昇する(同様に、両方の鎖の読み取りにより、一方の読み取りが、別の読み取りで確認され得る)。
【0456】
一部の実施形態では、本方法の機構は、プローブ分子の標的分子への結合を含む。かかる結合事象は、短命または一過性であり、ならびに多くのかかる結合事象は、同じ場所および/または部分的に重複する場所で反復的に生じる。かかる結合事象の場所、頻度、滞留時間、および光子放出は、記録され、計算的に処理される。
【0457】
一部の実施形態では、一過的な結合は、少量の二価カチオンを含むが、一価カチオンを含まない緩衝液中で行われる(例えば、5mMのTris-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8)。
【0458】
したがって、ポリヌクレオチドの配列決定は、以下のステップ:
a)ポリヌクレオチドを固定化することと、
b)1nM未満、5nM未満、10nM、または15nMの塩化マグネシウムを含む反応緩衝液中で、オリゴのレパートリーまたはサブレパートリーを、ポリヌクレオチドに結合させることと、
c)一過的な結合を検出することと、
d)必要に応じて、b~cを反復することと、を含む。
【0459】
ポリヌクレオチド配列のアセンブリ
一部の実施形態では、分子が固定化される個体基板は、ガラス、ケイ素、二酸化ケイ素、窒化ケイ素、金属(例えば、金)、ポリジメトキシシラン(PDMS)、ポリマー(例えば、環状オレフィン、Zeonex、ポリメチルメタクリレート、ポリスチレン)を含む。一部の実施形態では、固体表面は、例えば、ポリビニルシランでコーティングされる。一部の実施形態では、ポリマーは、分子コーミングによって、ポリビニルコーティング表面に伸展され、次いで、紫外線または高温に曝露することによって表面に架橋される。
【0460】
一部の実施形態では、本発明は、表面またはマトリックスと複数の相互作用を形成する伸長ポリマーへの、レパートリーの各メンバーの結合場所を決定することを含む。一部の実施形態では、結合場所は、反復的で一過的なオン・オフのプローブ結合事象を検出することによって決定される。その結合部位は、重複してもよいが、それらの結合が時間的に離れる傾向があるため、互いの結合をそれほど干渉しない。プローブがより長い期間結合している場合、一方の結合が、別の結合を遮断する。
【0461】
一部の実施形態では、レパートリーは、(例えば、所与の長さのすべてのオリゴの)完全なレパートリーである。一部の実施形態では、それは一連のオリゴプローブのタイリングシリーズである。一部の実施形態では、それはオリゴプローブのパネルである。合成生物学における特定の用途(例えばDNAデータの記憶)の場合、配列決定は、配列の特定のブロックの順序を見つけることを含み得、データをコード化するように設計される。
【0462】
一部の実施形態では、本方法の機構は、プローブ分子の標的分子への結合を含み、かかる結合は、標識により検出可能であり、当該標識は、その放出または光スイッチングのオフおよび/またはオンにおいて一過的に結合、点滅、または変動し、多くのかかる結合事象は、同じ場所および/または1つ以上の部分的に重複する場所で、反復的に生じ得る。かかる結合事象の場所および持続時間が、記録され、処理される。一部の実施形態では、標識の見かけの一過性、変動性、または点滅挙動は、標識がプローブに結合されており、プローブが標的に結合し、標的から解離しているためである。
【0463】
一部の実施形態では、標的に結合するプローブは、直接標識されていない。一部のかかる実施形態では、プローブは、第2の実体の結合のための受容体として機能する実体である「フラップ」を含む。2つの実体は、分子結合対を含み得る。かかる結合対は、核酸結合対を含み得る。一部の実施形態では、フラップは、標識オリゴヌクレオチド(オリゴ)に結合する一連のオリゴまたはポリヌクレオチド配列を含み、かかる結合は、標的に結合するプローブの部分の一過的な結合を撮像するプロセスの過程中、実質的に安定である。一部の実施形態では、標的は、ポリヌクレオチド配列を含み、プローブの結合部分は、例えば、3塩基長、または4塩基長、または5塩基長、または6塩基長の配列照合部分、任意選択的に、1つ以上の縮重位置もしくは普遍的位置、ならびに任意選択的にヌクレオチドスペーサー(例えば、1つ以上のTヌクレオチド)、または脱塩基部分もしくは非ヌクレオチド部分、およびフラップ部分を含む。かかるフラップ部分は、配列が非修飾であり、撮像の過程中、安定性を保持するために、例えば20塩基長以上であり、配列は安定であるように設計され、かつ好ましくは標的ポリヌクレオチドに頻繁に見つからないものである。
【0464】
一部の実施形態では、プローブのレパートリーが、標的に適用される。一部の実施形態では、レパートリーのプローブの各々、またはレパートリーのプローブのサブセットが、次々に適用される。すなわち、1つまたはサブセットの結合が、最初に検出され、次いで、除去され、その後、次が添加され、検出され、および除去され、次いで、その次に続く。次いで、データを処理して、各特異性のプローブの各プローブ結合事象のナノメトリックまたはサブナノメトリック位置を与える。一部の実施形態では、各プローブ特異性の結合順序および/または場所を使用して、配列をまとめる。
【0465】
一部の実施形態では、レパートリーの結合プローブのすべてまたはサブセットが同時に添加され、各結合プローブが、その同一性を完全にまたは部分的にコードする標識に繋がれ、結合プローブの各々のコードが、検出によってデコードされる。
【0466】
一部の実施形態では、プローブ上のフラップは、モジュール式であり、異なるオリゴに対する結合部位を含んでもよく、かかるオリゴは、異なる標識を有し、オリゴのプローブ部分の同一性をコードするために使用される。
【0467】
一部の実施形態では、核酸標的は、表面またはマトリックスに付着される。一部のかかる実施形態では、標的の一端が、表面またはマトリックスに付着しているが、標的の残部は、相互作用していない。一部の実施形態では、標的は、規則正しい超分子スカフォールド(例えば、DNA折り紙構造)上に捕捉される。一部の実施形態では、スカフォールド構造は、標的分子を捕捉するために、溶液相動態を利用するために、溶液中に遊離状態で開始する。占有されると、スカフォールドは表面に定着または自己組織化し、ロックダウンされて大きなDNA格子を形成し、個々の小さなスカフォールドは互いにロックインする。次いで、それらは、本発明の配列決定ステップのための高度に規則正しいナノ構造アレイを呈する。
【0468】
一部の実施形態では、非特異的結合または外れ値事象の影響を回避するために、本方法は、それらの場所および存続時間に基づいて、シグナルに優先順位を付ける。例えば、格子構造内の場所を含む伸展ポリマーまたは超分子格子(例えば、DNA折り紙グリッド)上に、プローブが、共局在するかどうかに基づいて、場所により優先順位を付ける。結合の存続性による優先順位は、結合の持続時間および結合の頻度に関するものであり、優先順位リストを使用して、完全一致、部分一致、または非特異的結合の可能性を決定する。この優先順位は、パネルまたはレパートリーの各結合プローブに対して確立され、シグナルの正確さを決定するために使用される。優先度は、シグナル検証およびベースコールを容易にするために、本発明のアルゴリズムによって使用される。一部の実施形態では、このアルゴリズムは、
1.シグナル持続時間>閾値であるか。「はい(yes)」の場合、実在(real)として受け入れる。
2.シグナル反復/頻度>閾値であるか。「はい」の場合、実在として受け入れる。
3.シグナルがパターン(グリッドまたはライン)と相関するか。「はい(yes)」の場合、実在(real)として受け入れる。
【0469】
それ以外の場合、このシグナルのデータを破棄する。1および2の代替として、アルゴリズムは、収集された光子数>閾値であるかどうかを尋ねることができる。
【0470】
また、可逆的でないように見えるシグナルは、非特異的シグナル(例えば、表面への蛍光汚染物質の付着)に該当する場合があるため、アセンブリアルゴリズムで廃棄または重み付けされ得る。
【0471】
一部の実施形態では、本発明は、単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を配列決定する方法を含み:
ポリヌクレオチドを、表面に固定化し、線状化することと、
1つ以上の標識プローブ種を、プローブが一過的に結合し、かつ標的部位へのプローブ結合を非標的部位へのプローブ結合から区別することができる条件下で、添加することと、
各場所における結合事象の閾値数(所要の局在化の精度に応じて)が蓄積されるまで、ポリヌクレオチドを2D検出器で連続的に撮像し、プローブ結合の画素座標を記録することと、
bのプローブを除去することと、
毎回、異なる1つ以上のプローブ種を用いて、ステップb~dを反復することと、
プローブが持続的に結合する結合部位の各々のナノメトリック座標(例えば、結合部位への4つ以上の結合事象)を提供するための単一分子局在化アルゴリズムを使用して、ステップcの各反復からのデータをコンパイルし、ナノメトリック的な局在化部位を、プローブ種の同一性(例えば、特異的オリゴヌクレオチド配列または特異的抗体)と相関させることと、
結合種の順序(配列)を決定して、サブナノメトリックまたはナノメトリック場所の各々に関連する配列同一性(および修飾状態)を決定して、ポリヌクレオチドの長さにわたってヌクレオチド修飾および/または塩基配列をコンパイルし、ポリヌクレオチドの長さにわたって任意のギャップを検出することと、を含む。
【0472】
一部の実施形態では、ステップgの前に、追加のステップを実施し、そのステップでは、結合事象が完全一致、不一致、または擬似結合であるかどうかを判定する際に、特定のプローブ種の、その各々の結合場所に対する持続時間および/または存続時間、ならびに、標的が変性二本鎖である場合、どのプローブが隣接場所および相補鎖に結合したかが考慮される。
【0473】
一部の実施形態では、ステップhを追加して、ある種類の結合標的(例えば、抗原)と別の種類の結合標的(例えば、配列)との相関を決定することができる。
【0474】
一部の実施形態では、ステップbのプローブは、試薬交換によって除去される。任意選択的に、まず、プローブを1つ以上の洗浄液で置換し、次いで、次のプローブのセットを添加する。
【0475】
一部の実施形態では、ステップcにおいて、結合事象の閾値数が蓄積されている可能性が高くなるのに十分に長い期間、(オン・オフ結合事象の)撮像が実行される。
【0476】
一部の実施形態では、本方法は、各場所における結合事象の閾値数が蓄積されている可能性が高くなるまで、ポリヌクレオチドを2D検出器上で連続的に撮像し、プローブ結合の画素座標を記録することを含む。
【0477】
一部の実施形態では、撮像持続時間の期間は、必要とされる位置決定の正確度(例えば、ナノメトリックまたはサブナノメトリック正確度)に依存する。撮像は、サブ10nMまたはサブナノメトリック位置決定を得るために長時間実行する必要があり得る。一部の実施形態では、撮像持続時間は、どの短いストレッチの配列(配列ビット)が、どのプローブに結合しているかに関して必要とされる信頼度の程度に依存する。長時間実行すると、正しい一致における信頼度が高まり、擬似結合または不一致結合が計算的にフィルタリング除去されるようになる。
【0478】
一部の実施形態では、本発明の標的ポリヌクレオチドが固定化される。一部の実施形態では、固定化は、構造支持体(例えば、平面、細胞マトリックス)上にある。一部の実施形態では、標的ポリヌクレオチドは、ウェルまたはフローセルなどの流体容器内に配置される。
【0479】
一部の実施形態では、二本鎖ゲノムDNAの固定化および線状化、ならびに表面上の一過的な結合の調製は、以下を含む:
a)分子コーミング、
b)UV架橋、
c)任意選択的な湿潤、
d)化学変性物質、アルカリ性溶液、DMSOなどへの曝露を含む変性、
e)任意選択的な洗浄後の酸性溶液への曝露、
f)任意選択的な事前調整緩衝液。
【0480】
一部の実施形態では、ポリマーは、短いポリヌクレオチド、1Kbp未満または300bp未満である。一部の実施形態では、短いポリヌクレオチドは、尿および血液などの体液中のセルフリーDNAに見られるように、100~200塩基範囲にある。一部の実施形態では、ポリヌクレオチドは、好ましくは、2つの末端のうちの1つによって、表面に結合または捕捉される。一部の実施形態では、ポリヌクレオチドは、ナノ構造格子で順番に捕捉される。格子は、DNA折り紙で形成され得るような超分子構造からなる。捕捉部位は、規則正しい2D格子内の10nmのピッチで配置され得る。このような格子は、完全な占有率で、1cm2当たり1兆分子を捕捉することができる。
【0481】
一部の実施形態では、ポリマーは、直鎖状である。一部の実施形態では、線状化は、表面の波状または蛇行経路に沿ってポリマーを提供する。他の実施形態では、ポリマーは、伸長され、直線状である。一部の実施形態では、直線状のポリマーは、単一の方向で整列される。一部の実施形態では、ポリマーは、伸長しておらず、2Dまたは3D空間を通る捻じれた経路を形成し得る。後者は、細胞内のバイオポリマーに本方法を適用する場合である。
【0482】
一部の実施形態では、ポリヌクレオチドは、表面またはマトリックス上にランダムに整列される。一部の実施形態では、ポリヌクレオチドは、規則正しい様式で整列される。一部の実施形態では、ポリヌクレオチドはDNAカーテン[Greeneおよび共同研究者、US2008/0274905A1]のように呈示される。かかる実施形態では、一過的な結合は、一端に付着したDNA鎖がフローまたは電気泳動力によって伸長される間、または鎖の両端が捕捉された後、記録される。一部の実施形態では、一端または両端での捕捉は、カーテンがそこから延びる表面上または界面での空間的にアドレス指定可能なオリゴへの結合またはライゲーションに起因する。一部の実施形態では、DNAカーテンで使用される脂質表面コーティングは、表面結合およびバックグラウンドを最小化する。一部の実施形態では、多くのコピーの同じ配列が、DNAカーテンの複数のポリヌクレオチドを形成するし、配列は、1つのポリヌクレオチドからではなく、複数のポリヌクレオチドからの集約的な結合パターンからアセンブリされる。
【0483】
DNAカーテン(Greeneおよび共同研究者)に関して実証されているように、長いポリヌクレオチドの場合、規則正しい方法は、各長いポリヌクレオチドの1つの末端を、パッドの規則正しいアレイ内のパッドに個別に付着させることによって行うことができ、異なるポリヌクレオチドの末端が、各パッドを占有する。一部の実施形態では、ポリヌクレオチドの両端はパッドに結合し、各末端は異なるパッドに結合する。単一の線状ポリヌクレオチドが結合する2つのパッドは、ポリヌクレオチドの伸展された構成を所定の位置に保持し、等間隔に配置された、重複していない、または相互作用しないポリヌクレオチドの規則正しいアレイを形成することを可能にする役割を果たすことができる。一部の実施形態では、1つのポリヌクレオチドのみが個々のパッドを占有することができる。一部の実施形態では、ポアソン過程によって、パッドが占有されている。いくつかのパッドは、ポリヌクレオチドによって占有されておらず、いくつかは1つ、いくつかは1つを超えて占有されている。
【0484】
本発明の一部の実施形態では、かなりの数が同じ細胞型である(かつ実質的に同じ配列を含むと予想される)複数の細胞から抽出されたDNAの配列決定の場合、配列は、1つのポリヌクレオチドからではなく、複数のポリヌクレオチドからの集約的な結合パターンからアセンブリされる。
【0485】
一部の実施形態では、ポリヌクレオチドは、それらの天然の環境(例えば、細胞、組織、生体液)から取り出され、表面に固定化される。一部の実施形態では、ポリヌクレオチドは、それらの細胞または組織の環境に留まる。一部の実施形態では、細胞または組織は、固定される。一部の実施形態では、ポリヌクレオチドは、細胞内で架橋される。
【0486】
一部の実施形態では、ポリヌクレオチドは、一本鎖(例えば、mRNA、lncRNA、マイクロRNA)である。一部の実施形態では、ポリヌクレオチドは、二本鎖である。一部の実施形態では、ポリヌクレオチドは、変性される。一部の実施形態では、変性は、0.5Mまたは1MのNaOH、DMSO(例えば、60%)、ホルムアミド(10~90%)、尿素(7~8M)などからの1つ以上の試薬を含む化学変性である。一部の実施形態では、変性は、85℃以上の熱変性である。一部の実施形態では、変性は、ヘリカーゼまたはヘリカーゼ活性を有する他の酵素の使用を介するものなどの、酵素変性を介する変性である。一部の実施形態では、ポリヌクレオチドは、表面との相互作用を通して、または臨界長を超えた伸展などの物理的プロセスによって、変性される。一部の実施形態では、変性は完全または部分的である。
【0487】
一部の実施形態では、ポリヌクレオチドのアレイは、表面に固定化され、一部の実施形態では、アレイのポリヌクレオチドは、個別に解像されるのに十分に離れている。一部の実施形態では、アレイのポリヌクレオチドは、個別に解像されるには十分に離れていない。一部の実施形態では、アレイのポリヌクレオチドは、超解像法によって個別に解像される。一部の実施形態では、ポリヌクレオチドは、表面に対して平行に伸長される。一部の実施形態では、ポリヌクレオチドは、表面に対して斜めの角度で伸長される。一部の実施形態では、2D検出器を介した検出は、単一分子局在化アルゴリズムソフトウェアを介して処理される(例えば、Fiji/ImageJのプラグインであるThunderstorm、またはhttps://github.com/jungmannlab/picassoでダウンロード可能なPicasso)。一部の実施形態では、ポリヌクレオチドは、表面に対して垂直に伸長される。標識の座標の検出は、スピニングディスク共焦点顕微鏡、光シート顕微鏡、3D超解像顕微鏡、もしくは3D単一分子局在化顕微鏡、または他の3D撮像アプローチを介して行われる。
【0488】
本発明の方法では、(特定の種の多数のコピーからの)プローブは、特定の様式(例えば、ワトソン-クリック塩基対合、抗体-抗原結合)でポリヌクレオチドの標的部位に一過的に結合し、デカルト座標および一過的な結合の持続時間が記録される。一部の実施形態では、同種のプローブは、標的部位に一過的に繰り返し結合する。一部の実施形態では、あるプローブ種が除去され、別のプローブ種が添加される。一部の実施形態では、これは、プローブのレパートリー(例えば、完全なレパートリー)、タイリングシリーズ、またはパネルが試験されるまで繰り返される。一部の実施形態では、各プローブ種の結合の場所が記録される。一部の実施形態では、記録は、必要とされる精度に応じて、または用途の目的に従って使用可能である精度に応じて、数十ナノメートル以内、数ナノメートル以内、さらには数サブナノメートル(オングストローム)以内への結合のナノメトリック位置決定精度(すなわち、x-y、および、一部の実施形態では、z座標)を与えるように処理される。一部の実施形態では、1つのオリゴプローブ種またはオリゴプローブ配列のレパートリーもしくはパネルが提供され、核酸修飾または損傷の部位に結合することができる結合剤(例えば、タンパク質)の1つまたはレパートリーも提供され得る。
【0489】
一部の実施形態では、プローブ上の標識の1つ以上の物理的特性も記録される。異なるプローブ種は、異なる物理的特性を含む標識で標識されており、かかる物理的特性は、輝度(吸収、量子収率)、波長、寿命、偏光を含む。一部の実施形態では、物理的特性は、単一分子または単一粒子レベルで測定され得る任意の他の物理的特性である。一部の実施形態では、複数の標識実体は、標識を含む。
【0490】
一部の実施形態では、一過的な的結合は、数秒(a few second)または数秒(several seconds)間である。一部の実施形態では、一過的な結合は、10マイクロ秒~数十秒にわたり得る。一部の実施形態では、一過的な結合は、持続時間が1ミリ秒~1秒である。一部の実施形態では、一過的な結合は、10マイクロ秒~1ミリ秒である。
【0491】
本発明は、方法が絶妙な感受性の可能性を有し、不均一な分子集団における多様性を解消することができるように、単一(個々の)分子(例えば、ポリマー)上で実施される。また、試料分子の処理は、その付随する損失(例えば、ライゲーションが非常に非効率であるため、ライゲーションによって適合されていない分子が効果的に失われる)およびアーティファクトの導入(例えば、PCR中の複製エラー)を伴い、本発明が試料分子の処理を必要としないという事実によっても、感度は肯定的に影響を受ける。
【0492】
複数の結合事象は、感度を増加させ、より多くの光子が蓄積され、複数の独立した結合事象は、実際のシグナルが検出される確率を増加させる。複数の結合事象はまた、単一の「呼び出し(call)」で検出される部分または配列の同一性を確立するのではなく、複数の呼び出しからコンセンサスを得ることができるため、特異性を増加させる。また、標的部分または配列への複数の結合事象は、実際の場所への結合を、(閾値持続時間の)結合が同じ場所で複数回起こる可能性が低い非特異的結合事象と区別することを可能にする。また、経時的に複数の結合事象を測定することにより、表面への非特異的結合事象の蓄積が弱まり、その後、再び非特異的結合が検出されることはほとんどなくなることが観察される。これは、非特異的結合からのシグナルを退色させるものの、非特異的結合部位が占有またはブロックされたままであるためである可能性が高い。したがって、動画の初期フレームを切り落とすことができることから、非特異的結合を最小化するために表面を不動態化する多大な努力は必要ではない。
【0493】
一部の実施形態では、各一過的な結合事象における標識からのシグナルは、2D検出器の1つを超える画素をカバーする光路(典型的には、倍率を提供する)を通して投影される。シグナルの点広がり関数(PSF)をプロットし、PSFの重心を、シグナルの正確な場所とする。この位置決定は、サブナノメートルの精度で行うことができる。位置決定の正確度は収集された光子の数に反比例するため、1秒当たりに放出される光子が多いほど、または長時間光子が収集されるほど、正確度が高くなる。高正確度および高精度を達成するために、2D検出器に対する試料のドリフトを最小化するか、またはドリフト補正のための有効な手段を実施する必要がある。一部の実施形態では、ドリフト補正アプローチは、正しいドリフトを参照するために使用することができる表面上の基準マーカーを含む。精度が数ナノメートルまたはサブナノメートルまで上げる必要がある場合、複数の特定の結合場所を有するDNA折り紙は、非常に効果的な基準マーカーである。
【0494】
本発明の代替的な実施形態では、各一過的な結合事象における標識からのシグナルは、光学倍率経路を通して投影されず、むしろ基板、典型的には、標的分子が存在する光学的に透明な表面が、2D検出器アレイに直接結合される。次いで、検出器アレイの画素が小さい場合(例えば、1ミクロン以下の場合)、表面上のシグナルを1:1で投影すると、結合シグナルを少なくとも1ミクロンの正確度で位置決定することが可能になる。伸展されたDNAの場合、例えば、2kbpの長さは1ミクロンに相当し、2キロ塩基離れたシグナルを解像することができる。6塩基長のプローブで、4096塩基ごと、すなわち2ミクロンごとにシグナルが生じると予想される場合、この解像度は十分である。また、2つの画素間に部分的に収まるシグナルは、中間場所を提供し、そのため、1ミクロンの画素の解像度は500nmである。もちろん、実際の天然ポリヌクレオチド配列では、シグナルは、すべての4096塩基よりも近く、それよりも遠い場所で生じると予想される。しかしながら、DNAストレージなどのいくつかの新奇な用途では、ポリヌクレオチド構築物は、例えば、2Kbごとにシグナルが収まるように設計することができる。このアプローチの利点は、デバイスがより単純で、より安定であることである。また、基板は、2Dアレイ検出器に対して、例えば、100nm単位で平行移動して、より高い解像度を与えることができる。この実施形態の1つの利点は、レンズを必要としないため、デバイスをより小さく(またはより薄く)することができ、レンズ間に空間を作ることができることである。また、分子記憶読み出しの、既存のコンピュータおよびデータベースとより互換性のある電子読み出しへの、直接変換も提供することができる。
【0495】
一部の実施形態では、一過的な結合を促進する複数の条件が使用される。一部の実施形態では、ある条件が、そのTmに応じたあるプローブ種に対して使用され、別の条件が、そのTmに応じた別のプローブ種に対して使用されるなど、プローブ種の全レパートリーに対して使用され、例えば、5塩基長の可能な1024個のレパートリーからの各5塩基長種に対して使用される。一部の実施形態では、両方の標的ポリヌクレオチド鎖が試料中に存在するため、512個の非相補5塩基長のみが提供される。一部の実施形態では、各プローブ付加は、5つの特異的塩基および2つの縮重塩基を含むプローブ(したがって、16個の七量体)の混合物を含み、配列を照合する能力に関して単一の五量体として機能する同一の標識を用いてすべて標識されており、縮重塩基は、プローブセットの複雑度を増加させることなく、安定性を付加する。
【0496】
一部の実施形態では、同一または類似のTmを共有する複数のプローブに対して、同一の条件が提供される。レパートリーの各プローブは、異なるコード化標識(または、それが識別される標識)を含み得る。このような場合、いくつかのプローブ交換を通して温度を保持した後、同じまたは同様のTmを共有する次の一連のプローブに対して温度を上げる。
【0497】
一部の実施形態では、Tmは、例えば、最近傍パラメータによって計算される。他の実施形態では、Tmは、経験的に導出される。例えば、最適なTMまたはTM範囲は、融解曲線を作成する(例えば、ある温度範囲にわたる吸収による融解の程度を測定する)ことによって導出される。一部の実施形態では、プローブセットの組成物は、経験的な試験によって検証されるそれらの理論的に一致するTmに従って設計される。一部の実施形態では、結合は、Tmより実質的に低い温度、例えば、Tmより33度低い温度で行われる。一部の実施形態では、完全一致から不一致を区別するための最適な温度は、様々な場所で、完全一致および不一致を含む短い合成標的を使用して、経験的に融解曲線を作成することによって判定される。一部の実施形態では、経験的に判定された各オリゴの最適温度は、配列決定における各オリゴの結合に使用される。
【0498】
一部の実施形態では、使用されるオリゴの濃度は、オリゴ配列のAT対GC含量に従って調節される。より高い濃度のオリゴが、より高いGC含量を有するオリゴに対して提供される。一部の実施形態では、塩基組成物の影響を均等化する、CTAB、ベタイン、または2.5~4M濃度のテトラメチル塩化アンモニウム(TMACl)などのカオトロピック試薬を含む緩衝液が使用される。
【0499】
使用されるオリゴ長が長いほど、オリゴに影響を及ぼす回文配列または折り返し配列に対して、効率的なプローブとして機能する可能性が高い。効率は、1つ以上の縮重塩基を除去することにより、そのようなオリゴの長さを短縮することによって、実質的に改善することができる。この場合、オリゴの結合安定性は、特異的安定化塩基修飾またはオリゴコンジュゲートを使用することによって増強することができる。このような理由で、より短い照合配列(例えば、4塩基長)の使用は、利点を有する。一部の実施形態では、完全に修飾された3塩基長または4塩基長(例えばLNA)を使用することができる。
【0500】
一部の実施形態では、全レパートリーが一緒に追加される。一部のかかる実施形態では、塩基組成物の影響を均等化する緩衝液(例えば、TMAClまたはグアニジニウムチオシアネート)が使用される。一部の実施形態では、同じまたは類似のTmを有するプローブ種が、一緒に添加される。一部の実施形態では、一緒に添加されるプローブ種は、差次的に標識される。一部の実施形態では、一緒に添加されるプローブ種は、差次的に標識されない。一部の実施形態では、差次的な標識は、例えば、異なる輝度、寿命、または波長、およびそのような物理的特性の組み合わせを有する発光を伴う標識である。
【0501】
一部の実施形態では、差次的な標識は、コード化され、例えば、それらは、DNA折り紙またはDNAナノ構造ベースのコードである。一部の実施形態では、コードアームは、プローブを識別する標識の組み合わせを含むプローブに添加される。例えば、すべての可能な5塩基長のオリゴヌクレオチドプローブのライブラリをコードする場合、アームは、5つの部位を有し、各部位が、5塩基長の5つの核酸塩基の各々に対応し、5つの部位の各々が、5つの区別可能な種に結合され得る。例えば、特定のピーク発光波長を有するフルオロフォアは、位置の各々(例えば、位置1が500nm、位置2が550、位置3が600nm、位置4が650nm、および位置5が700nm)に対応し得、同じ波長であるが、異なる蛍光寿命を有する4つのフルオロフォアは、各位置の4つの塩基の各々をコードし得る。
【0502】
一部の実施形態では、プローブは、標識が、オリゴヌクレオチドの特定の位置で1つだけのヌクレオチドを報告する様式で、コードされる。レパートリーのサブセット(サブレパートリー)を、同時に添加することができる。各サイクルで、オリゴの塩基位置のうちの1つが定義され、他の位置が縮重している、4色コードスキームを使用することができる。
【0503】
A、C、T、およびGが定義されるすべてのオリゴは、各々、その定義された塩基に特異的な特定のフルオロフォアで標識される。第1の塩基が定義され、残りが縮重しているオリゴのサブレパートリーが結合、検出、および除去された後、類似の組成であるが、第2の位置が標識によってコード化されている(他の位置は縮重している)プローブのサブレパートリーが添加され、次いで、各々、第3、第4、および第5と、次々に行われる。
【0504】
第1のサイクル、セット1:4色は、位置1の4つの塩基を表す。
【0505】
第2のサイクル、セット2:4色は、位置2の4つの塩基を表す。
【0506】
第3のサイクル、セット3:4色は、位置3の4つの塩基を表す。
【0507】
第4のサイクル、セット4:4色は、位置4の4つの塩基を表す。
【0508】
第5のサイクル、セット5:4色は、位置5の4つの塩基を表す。
【0509】
全レパートリーは、5サイクルで消耗され得る。
【0510】
一部の実施形態では、4未満、例えば、1色のみが、プロセス全体を通して使用される。この場合、各サイクルは、4つのサブサイクルに分割され、その各々で、位置(例えば、位置1)の4つの塩基のうちの1つが、次の塩基が添加される前に個別に添加され、毎回、プローブは、同じ標識を有する。本実施態様では、全レパートリーは、20サイクルで消耗され得る。
【0511】
データ処理後、単一分子局在化は、セット1~5からのプローブのうち、ポリヌクレオチド上に同じフットプリントを有する(すなわち、同じナノメトリック場所に結合する)ものを(検出された色により)識別することができる。例えば、ナノメトリック場所は、1nmの中心(+/-0.5nm)の精度で定義される。そのため、PSFの重心が同じ1nm内にあるすべてのプローブは、一緒にビニングされる。各単一塩基で定義されたオリゴ種は、ナノメートル(またはサブナノメートル)の重心までの正確な位置決定を可能にするために、(発光および収集される光子の数に応じて)複数回結合することができる。したがって、ナノサブナノメトリックまたはサブナノメトリックの位置決定は、例えば、5’AGTCG3’のオリゴ配列の場合、第1の塩基がA、第2の塩基がG、第3の塩基がT、第4の塩基がC、および第5の塩基がTであると判定してもよく、これは、5’CGACT3’の標的配列を示唆するであろう。したがって、すべての単一塩基が定義された1024個のオリゴプローブは、わずか5サイクルで(オリゴの添加および洗浄を含む)通過または試験され得、これは、5塩基長の全配列空間をカバーする。一部の実施形態では、セットの各オリゴの濃度は、それが単独で使用されるときよりも低い濃度で使用され、この場合、データの取得は、結合事象の閾値数に到達するためにより長い時間行われ、また、特定のオリゴよりも、より高い濃度の縮重オリゴを使用することができる。このコードスキームは、プローブを直接標識することによって、例えば、オリゴの3’または5’で標識を合成またはコンジュゲートすることによって、行うことができる。しかしながら、それはまた、間接的な標識化によっても行うことができる。例えば、プローブ配列を、標識されたオリゴが結合している「フラップ」配列(結合相互作用には意図されていない配列)に結合することで、プローブの配列照合部分でコードされている塩基の同一性を特定することができる。このスキームでは、4つの塩基のみを区別する必要があるため、4つの異なる種類の標識のみが必要である。1塩基のみがコード化されている場合、オリゴライブラリの合成は、各々1つの定義された塩基および他の4つの縮重した塩基を含む、20個の異なるオリゴのみを合成する必要があるため、安価である。合成中の反応性について濃度を調整することができるように、縮重位置の自動合成中は、手動での混合を使用することが好ましい。
【0512】
各オリゴの場所は、その場所ついての複数の事象のPSFを決定することによって正確に定義され、次いで、オフセット事象からの部分的な配列重複によって裏付けられる。この実施形態は、ナノメートルまたはサブナノメートル精度へのプローブ結合の単一分子局在化に高度に依存している。
【0513】
一部の実施形態では、すべての4つの塩基からの寄与が均等化される。これは、G-C対の安定性を抑制するか、またはATの安定性を増加させる試薬を使用することによって行うことができる。このような試薬としては、ベタイン、TMA、および様々な他の試薬が挙げられる。代替的に、ヌクレオチド類似体、修飾、およびN位置を使用して、プローブのTmを均等化することができる。したがって、Gと等しいTmを得るには、安定性が増加したT類似体が使用される。
【0514】
一部の実施形態では、4つの部分的に縮重したオリゴプールの濃度は、各々、そのTmに従って単一コード化塩基の安定性の差異を補償するように調整される。これはTmによる濃度の調整が縮重位置に適用されないため、部分的な補償でしかありえない。
【0515】
一部の実施形態では、レパートリーのプローブのプローブは、コード化される。一部の実施形態では、例えば、1024個の5塩基長のセット全体が、コード化される。一部の実施形態では、コード化は、配列の照合に使用される5塩基長の一端に、特定の配列単位(例えば、フラップ配列)を結合することを含む。コード配列の各単位は、フラップ上にハイブリダイズされた蛍光標識オリゴを有する、別個の蛍光標識プローブのドッキング部位として機能する。5塩基のプローブ配列をコードするために、プローブ上のフラップは5つの異なる結合場所を含み、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の位置は、プローブ配列(ポリヌクレオチド標的に結合する部分)に隣接し、第2の位置は、第1の位置に隣接する、などである。配列決定でプローブ・フラップを使用するのに先立って、各種のプローブ・フラップを、蛍光標識されたオリゴのセットに結合して、プローブ配列のための固有のIDタグを生成する。これは、フラップ上の各位置に相補的である4つの異なる標識オリゴ配列を使用することによって行うことができ、合計で16個の異なる標識が必要である。
【0516】
一部の実施形態では、配列の第1の塩基は、フラップの第1の単位によってコード化され、第2の塩基は、第2の単位によってコードされるなど、塩基配列の順序に対応する単位の順序でコード化される。次いで、別個の蛍光標識を、各単位にドッキングする(相補塩基対合を通して)。例えば、第1の位置は、波長500~530nmで、第2の位置は、波長550~580nmで、第3の位置は、600~630nmで、第4の位置は、650~680nmで、第5の位置は、700~730nmで発光してもよい。次いで、各場所における塩基の同一性は、例えば、標識の蛍光寿命によってコード化され得る。例えば、Aに対応する標識は、Cよりも長い寿命を有し、Cは、Gよりも長い寿命を有し、Gは、Tよりも長い寿命を有する。
【0517】
位置1のAは、500~530nmで発光し、最も長い寿命を有し、位置3のGは、600-630nmで発光し、3番目に長い寿命を有する、などである。
【0518】
一部のかかる実施形態では、ポリヌクレオチドを配列決定する方法は、
a)オリゴのコード化セットを提供することであって、かかるコード化が、モジュール式の多単位配列を含み、各単位について異なる標識プローブが予め結合されている、提供することと、
b)レパートリーを、ポリヌクレオチドに一過的かつ反復的に結合させ、各種類の異なるシグナルを位置決定することと、
c)記録された結合場所を使用して、ポリヌクレオチドの配列を再構築し、各プローブの同一性をデコードすることと、を含む。
【0519】
一部の実施形態では、4つの異なるオリゴヌクレオチドのサブレパートリーのみが使用され、例えば、5塩基長の中央の塩基のみが定義され、残りが縮重している。オリゴヌクレオチドの中央位置での不一致は、最も不安定すると予想され、中央の塩基が結合し、不一致を形成しないための絶対的な必要性が存在するように、条件がセットアップされ得る。一時的な結合は、多かれ少なかれすべての部位がオリゴヌクレオチド結合によってカバーされることを確実にし、その後、位置決定が、高レベル(例えば、サブナノメートル)まで行われる場合、ポリヌクレオチドの配列は、中央にコードされたオリゴによって提供される塩基ごとの情報を一緒に繋ぎ合わせるだけでアセンブリすることができる。中央の塩基のA、C、G、Tの各々は、4つの異なる区別可能なフルオロフォア、例えば、Atto488、Cy3B、Atto655、Alexa700によってコードされ得る。
【0520】
実際には、既知の配列のポリヌクレオチドの配列決定における各々のプールの濃度、反応条件、および温度を繰り返し調整することによって、最適な濃度(ならびに反応条件および温度)を決定することが好ましく、様々な代表的なポリヌクレオチドについて最も正確な配列が得られる濃度/条件が最適であるとみなすことができる。
【0521】
一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法であり、
a)ポリヌクレオチドを固定化することと、
b)オリゴの1つの位置(塩基A、C、G、T)が指定され(X)、かつ標識によってコード化され、残りが縮重した塩基(N)である、オリゴヌクレオチドのライブラリ/レパートリーを添加することと、
c)各標識オリゴのポリヌクレオチドへの反復した結合を撮像し、特定の塩基の結合場所および同一性をナノメトリック的に位置決定することと、
d)第2の位置について標識されたオリゴヌクレオチドのライブラリ/レパートリーを添加し、特定の塩基の結合場所および同一性をナノメトリック的に位置決定し、第3、第4、および第5の位置などについても同様に行うことと、
e)どの塩基標識が、オリゴヌクレオチドレパートリーの各位置の場所に持続的に一過的に結合するかに従って、各場所で配列をアセンブリすることと、
f)結合場所および隣接場所間の配列の重複を考慮に入れることによって、ポリヌクレオチドの配列をアセンブリすることと、を含む。
【0522】
本発明のこの実施形態は、2.5nm未満、または1nm未満、または0.34nm以下であるナノメトリック位置決定の精度から恩恵を受け、プローブオリゴヌクレオチドの特定の塩基の場所を、同じ近傍の別のプローブオリゴヌクレオチド結合の特定の塩基の場所から区別することができるようになる。
【0523】
一部の実施形態では、レパートリーのプローブのいくつかがコード化される。一部の実施形態では、例えば、1024個の5塩基長のセット全体が、コード化される。一部の実施形態では、コード化は、配列の照合に使用される5塩基長の一端に、特定の配列単位(例えば、フラップ配列)を結合することを含む。コード化配列の各単位は、フラップ上にハイブリダイズした蛍光標識オリゴを有する、別個の蛍光標識プローブ種のドッキング部位として機能する。5塩基のプローブ配列をコードするために、プローブ上のフラップは5つの異なる結合場所を含み、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の位置は、プローブ配列(ポリヌクレオチド標的に結合する部分)に隣接し、第2の位置は、第1の位置に隣接する、などである。配列決定でプローブ・フラップを使用するのに先立って、各種のプローブ・フラップを、蛍光標識されたオリゴのセットに結合して、プローブ配列のための固有のIDタグを生成する。これは、フラップ上の各位置に相補的である4つの異なる標識オリゴ配列を使用することによって行うことができ、合計で16個の異なる標識が必要である。
【0524】
一部の実施形態では、配列の第1の塩基は、フラップの第1の単位によってコード化され、第2の塩基は、第2の単位によってコードされるなど、塩基配列の順序に対応する単位の順序でコード化される。次いで、別個の蛍光標識を、各単位にドッキングする(相補塩基対合を通して)。例えば、第1の位置は、波長500~530nmで、第2の位置は、波長550~580nmで、第3の位置は、600~630nmで、第4の位置は、650~680nmで、第5の位置は、700~730nmで発光してもよい。次いで、各場所の塩基の同一性は、例えば、標識の蛍光寿命によってコード化され得る。例えば、Aに対応する標識は、Cよりも長い寿命を有し、Cは、Gよりも長い寿命を有し、Gは、Tよりも長い寿命を有する。
【0525】
位置1のAは、500~530nmで発光し、最も長い寿命を有し、位置3のGは、600-630nmで発光し、3番目に長い寿命を有する、などである。
【0526】
一部のかかる実施形態では、ポリヌクレオチドを配列決定する方法は、
a)オリゴのコード化セットを提供することであって、かかるコード化が、モジュール式の多単位配列を含み、各単位について異なる標識プローブが予め結合されている、提供することと、
b)レパートリーを、ポリヌクレオチドに一過的かつ反復的に結合させ、各種類の異なるシグナルを位置決定することと、
c)記録された結合場所を使用して、ポリヌクレオチドの配列を再構築し、各プローブの同一性をデコードすることと、を含む。
【0527】
このアプローチの利点は、すべての個々のオリゴが個別に合成される必要はなく、単に合成サイクル中にヌクレオチドの混合物を添加することによって作製されることである。
【0528】
オリゴの特定のヌクレオチドが提供することができる識別の程度は、オリゴのその位置に依存する。不一致は、5塩基長の中央で最悪に許容され、中央から離れるほど、より良好に許容されることが予想される。したがって、単一の結合事象からのデータから正しい配列同一性を割り当てることは、時として困難であり得るが、部位および隣接部位(重複、オフセット)に対する複数の事象により、配列が裏付けられ得る。
【0529】
場合によっては、結合の持続時間は、正確ではなくても、再現性がなくてもよく、または期待されるものに対応していなくてもよい。しかしながら、一部の実施形態では、配列は、その場所に結合する完全なレパートリーからのすべてのプローブの結合持続時間を調べることによって、その場所への最長の平均結合持続時間を有するプローブを選択することで、割り当てることができる。非ワトソン-クリック塩基対を形成するプローブの不一致結合または結合の異常に高い結合の知識がある場合を除いて、データセットに適用され、一部の実施形態では、最長結合持続時間を有するオリゴが、ポリヌクレオチドにおける配列に対応するものとみなされる。
【0530】
一部の実施形態では、オリゴがそれらの融解温度に従ってセットに分割されるため、5サイクルを超えて実施される。約20個のセットは、5塩基長のTmレパートリーを表すのに十分である(異常値を除く)。一部の実施形態では、AまたはT=2およびGまたはC=4のTm寄与を使用して、Tmを計算する。他の場合、(例えば、Breslauerによる)最近傍パラメータを使用して、Tmを計算する。他の場合、各オリゴのTmは、経験的に判定される。各所与の温度で、相補体の一方が表面に結合され、他方が標識されて溶液中にある場合、融解曲線の取得を介して経験的に判定されるか、またはオリゴ相補体の結合を分析することによって判定される。
【0531】
一部の実施形態では、同じ温度がすべてのオリゴ結合に使用され、Tmは、オリゴの濃度を調節することによって調節される。より高い濃度は、安定性の低いオリゴに使用され、より低い濃度は、より安定したオリゴに使用される。各オリゴの濃度は、経験的または理論的に判定される。一部の実施形態では、単一の温度が使用されるが、オリゴヌクレオチドの長さまたは化学組成が変化する。
【0532】
一部の実施形態では、最初に、短いオリゴプローブが、一致と不一致間を効率的に識別するための条件が見出される。短いプローブは、非常に速い動態を有するため、多数の一過的な結合事象を短時間(例えば、1秒、数秒、または1分もしくは2分未満)で蓄積することができる。律速段階は、試薬交換および温度調整であり得る。結合は、乾燥させることなく撮像され、それによって、各プローブの最適な平衡反応条件を使用することができる。
【0533】
一般に、配列決定は、標的ポリヌクレオチドが、結合したヌクレオチドに相補的であるヌクレオチドを含むことを仮定しており、結合不一致誤差は、この仮定が当てはまらない場合の一例である。それにもかかわらず、不一致は、既知のルールまたは挙動に従って生じる場合、標的の配列を決定するのに有用であり得る。短いオリゴヌクレオチド(例えば、5塩基長)の使用は、1つの塩基が5塩基長の20%であるため、単一の不一致の影響が安定性に対して大きな影響を有することを意味する。したがって、適切な条件では、短いオリゴプローブによって絶妙な特異性を得ることができる。それでも、不一致が生じる可能性があり、分子相互作用の確率的性質のため、それらの結合の持続時間は、一部の場合において、5塩基すべてが特異的である結合から区別可能ではない場合がある。しかしながら、塩基(または配列)呼び出しおよびアセンブリを行うために使用されるアルゴリズムは、不一致の発生を考慮に入れることができる。多くの種類の不一致は予測可能であり、特定のルールに従っている。これらのルールのいくつかは、理論的考慮によって導出することができ、他のルールは、実験的に導出される(例えば、Maskos and Southern Nucleic Acids Res,Williams et al Nucleic Acids Res 22:13651367(1994))。
【0534】
本発明の一実施形態では、1つ以上の既知の標的ポリヌクレオチド(例えば、ラムダファージDNAまたはレパートリーの各オリゴに対する相補体を含むスーパー配列を含む合成構築物)を含む訓練セットを、レパートリーからの各オリゴヌクレオチドの反復結合を試験するために使用する。機械学習アルゴリズムを使用して、オリゴプローブの結合特性および不一致特性を決定することができる。したがって、直感に反して、不一致結合は、さらなるデータを提供する方法としてみなすことができ、配列をアセンブリする、かつ/または配列に対する信頼度を付加するために使用することができる。
【0535】
特定の外れ値配列は、非ワトソン-クリック様式で結合し得るか、または短いモチーフは、異常に高いオン速度または低いオフ速度をもたらし得る。例えば、RNAとDNAとの間のプリン-ポリプリリミジン相互作用は、非常に強力であり得る(例えば、aggなどのRNAモチーフ)。これらは、より低いオフ速度を有するだけでなく、より安定した核形成配列を提供することによって、より高いオン速度も有する。場合によっては特定の既知の規則に必ずしも適合しない外れ値から結合が生じる。アルゴリズムは、そのような外れ値を識別するために、またはそのような外れ値の期待値を考慮に入れるために設計され得る。
【0536】
二本鎖DNA(例えば、天然ヒトゲノムDNA)が固定化されている場合、1024個のセットからの1つのオリゴ(アンチセンス)は、一方の鎖(センス)に結合し、他のオリゴ(センス)は、他方の鎖(アンチセンス)に結合する。変性後であっても、特定のオリゴが結合している鎖、センスもしくはアンチセンスをすぐに区別することはできない場合がある。
【0537】
どの変性鎖にプローブの1つが結合するかを、すぐに区別可能ではない場合がある。しかし、完全な配列決定データセットにより、オリゴ結合の重複配列が、一方または他方にナノメトリック的に位置することが分かるため、これを明らかにすることができる(
図7を参照)。
【0538】
同じ場所に位置したままの2本の鎖の驚くべき利点は、相補標的部位に基づいて塩基配列の割当が独立して照合されるため、非常に高い正確度が可能になることである。1つの特異的オリゴの1つの鎖への結合の真実性は、表面での数または数ナノメートル(a few or several nanometers)以内の同じ場所に位置する他の鎖に対するその相補体の結合によって確立することができる。
【0539】
一部の実施形態では、6個の定義された塩基を有するオリゴヌクレオチドプローブが使用され、完全なレパートリーは、4096個の配列を含む。一部の実施形態では、5個の定義された塩基を有するオリゴヌクレオチドプローブが使用され、完全なレパートリーは、1024個の配列を含む。一部の実施形態では、5個または6個の塩基が定義され、追加の普遍的塩基または縮重位置がオリゴヌクレオチド長に含まれる。
【0540】
非特異的結合は、典型的には、特定のプローブよりも短い時間結合し、したがって、データ処理中に計算的に区別することができる。例えば、ある条件下では、10ミリ秒より短い結合事象が、非特異的とみなされる。
【0541】
プローブのオン速度は、プローブの濃度を増加させること、温度を上昇させること、分子クラウディングを増加させること(PEG400、PEG800などを含む)によって、操作する(増加させる)ことができる。化学成分を操作することによってプローブの熱安定性を低下させること、不安定化付属体を添加すること、または、オリゴヌクレオチドの場合、それらの長さを短縮することによって、オフ速度を増加させることができる。オフ速度はまた、温度を上昇させること、塩濃度を減少させること(厳密さを増加すること)、pHをスケールの極値に近づけることによって加速させることができる。
【0542】
プローブの濃度を増加させることによってオン速度を増加させると、溶液中のプローブによるバックグラウンド蛍光が顕著になり得るため、問題となる場合がある。表面での単一分子検出は、表面に結合するシグナルが、バックグラウンドを超えて検出されるように、バックグラウンドシグナルを低くすることに依存する。
【0543】
一部の実施形態では、使用されるプローブの濃度は、プローブが結合するまで本質的に非蛍光にすることによって、増加させることができる。これを行う1つの方法は、結合が、光活性化事象を誘発することである。別の例は、プローブが、蛍光発生性であることである。別の例は、結合が生じるまで標識をクエンチすることである(例えば、分子ビーコン)。別の例は、シグナルを、エネルギー移動事象(例えば、FRET、CRET、BRET)の結果として検出することである。一実施形態では、表面のバイオポリマーがドナーを担い、プローブがアクセプターを担うか、またはその逆もまた同様である。別の実施形態では、挿入色素は、溶液中に提供され、標識プローブが結合する際、挿入色素とプローブとの間にFRET相互作用が存在する。挿入色素は、ドナーおよびプローブ上の標識がアクセプターであってもよく、またはその逆であってもよい。例えば、挿入色素は、ストックからの1000~10,000倍希釈のYOYO-1または100~10,000倍希釈のEvagreenであってもよく、プローブ上の標識は、ATTO655であってもよい。別の実施形態では、挿入色素は、FRET機構を用いずに使用され、表面上の一本鎖標的配列とプローブ配列との両方が非標識であり、シグナルは、結合により、挿入色素が挿入される二本鎖が生成されるときにのみ検出される。挿入色素は、DNAに挿入されておらず、かつ溶液中に遊離している場合、その同一性に応じて、輝度が100分の1または1000分の1以下であり得る。これを、TIRFまたはHILO顕微鏡と組み合わせると、溶液中の挿入色素からのいかなるバックグラウンドシグナルも除去される。
【0544】
一部の実施形態では、本発明は、単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を配列決定する方法を含み、
i)ポリヌクレオチドを、表面またはマトリックス上に固定化することと、
ii)1つ以上のプローブ種を、プローブがポリヌクレオチドに一過的に結合して、ポリヌクレオチドから検出される1つ以上の蛍光(または他の検出可能な)シグナルの変化をもたらすことができる条件下で、添加することと、
iii)検出器で、ポリヌクレオチドからの1つ以上のシグナルを継続的に監視し、一定期間、結合事象を記録することと、
iv)bのプローブを除去することと、
v)毎回、異なる1つ以上のプローブ種を用いて、ステップii~ivを反復することと、
vi)ステップiiiの各反復からのデータをコンパイルして、修飾および/または塩基の配列を再構築することと、を含む。
【0545】
特定の実施形態では、本発明の方法は、ポリヌクレオチドのアレイ上で操作することができる。一部の実施形態では、標的ポリヌクレオチドのアレイは、複数のポリヌクレオチドを単一視野で見ることができるように、固定化される。
【0546】
一部の実施形態では、標的ポリヌクレオチドは、その長さに沿って化学的特徴(塩基配列、損傷、修飾)を見ることができるように、伸長または伸展されている。一部の実施形態では、単一の非常に長い標的ポリヌクレオチドは、その長さの実質的な全体を単一視野で見ることができるように、固定化されている(Frietag et al)。
【0547】
一部の実施形態では、流体容器は、ウェルである。一部の実施形態では、流体容器は、フローセルである。一部の実施形態では、表面は、1つ以上の化学層、生化学層(例えば、BSA-ビオチン、ストレプトアビジン)、脂質層、ヒドロゲル、またはゲル層でコーティングされる。
【0548】
一部の実施形態では、天然ポリヌクレオチドは、配列決定のために呈示される前にプロセシングを必要としない。これにより、本方法は、DNAの化学修飾が所定の位置に留まるため、エピゲノム情報を、配列情報と統合することができる。好ましくは、ポリヌクレオチドは、方向的に十分に整列しており、したがって、撮像、画像処理、ベースコールおよびアセンブリが比較的容易であり、配列の誤差率が低く、カバレッジが高い。本発明を実施するために、いくつかの手段が記載されているが、各手段は、試料調製の負担が完全にまたはほぼ完全に排除されるように行われる。
【0549】
本発明は、ゲノムDNAの塩基の数よりも桁違いに少ない試薬添加サイクルを行うことによって、ゲノムDNAの100万個以上の実質的に連続した塩基を配列決定することを可能にするため、直感に反し、驚くべきことである。本発明の方法は、単一の標的ポリヌクレオチド分子が、それらへのプローブの一過的な結合を検出することによって配列決定することができるという発見に部分的に基づいている。したがって、様々な態様および実施形態では、本発明は、長い鎖長のポリヌクレオチドを得ることと、ポリヌクレオチドの長さに沿った場所がトレースされるように、ポリヌクレオチドを線状の状態で配置することと、を含む。
【0550】
一部の実施形態では、ポリヌクレオチドの全長またはほぼ全長は、無視できる数のギャップを有する連続したリードを含む。これは、ゲノムの反復領域を通してでさえ、長距離のゲノム構造を提供し、また、個々のハプロタイプを解像することを可能にする。この方法は、1つまたはわずかな細胞から、高度に完全な配列を提供することができる。
【0551】
一部の実施形態では、連続配列は、アルゴリズムを使用して、デノボアセンブリを介して得られる。場合によっては、重複する配列ビットの高い割合の場所が実験的に得られるため、アルゴリズムのタスクは比較的単純である。しかし、信頼度を高めるのに困難が存在する場合、参照配列を使用して、アセンブリを容易にすることもできる。複数のポリヌクレオチドからの情報を処理するアルゴリズムのいくつかは、非常に長い距離をカバーする個々のハプロタイプを解像するために使用されている。
【0552】
いくつかの方法で、配列をデータから抽出することができる。配列再構築方法のスペクトルの一端では、モノマーまたは一連のモノマーの局在化は、モノマーまたは一連のモノマーを注文するだけで配列が得られるように正確である(ナノメトリックまたはサブナノメトリック)。スペクトルの他端では、データは、配列に関する様々な仮説を排除するために使用される。例えば、1つの仮説は、配列が既知の個々のゲノム配列に対応するということである。アルゴリズムは、データが個々のゲノムから乖離する場所を決定する。別の場合、仮説は、配列が「正常」体細胞の既知のゲノム配列に対応するということである。アルゴリズムは、推定される腫瘍細胞からのデータが、「正常な」体細胞の配列から乖離する場所を決定する。これらのアプローチのスペクトルにわたるバリエーションを実装することができる。
【0553】
したがって、一部の実施形態では、未知の配列のアセンブリは、
a)参照ゲノムを提供することと、
b)参照ゲノムのオリゴのレパートリーへの理論的結合パターンを、インシリコで決定することと、
c)実際のデータを、理論的参照とインシリコで比較することと、
d)実際のデータと理論的参照との間の差異を、インシリコで決定することと、
e)dで見出された差異に従って、参照の配列を変更/再構築して、これまで未知の配列のアセンブリを生成することと、を含む。
【0554】
一部の実施形態では、差異は、置換、インデル、および構造多型を含む。特に、参照配列が本発明の方法によってアセンブリされていない場合、反復は圧縮され、再構築が解凍する。
【0555】
一部の実施形態では、ゲノムDNAが複数の細胞から得られ、データは、複数の分子間で統合され得る。複数の分子の各々は、複数の分子のうちの少なくとも別の分子と部分的に重複し、それらは、共通のプローブ結合パターンを一致させることによって整列される。部分的に重複する分子の各々は、他の分子と一連の配列を共有する。整列が計算的に行われると、各分子に固有の配列がギャップを埋めるために使用され、完全にまたは実質的に連続したアセンブリされた配列が得られる。
【0556】
本方法は、複数の個々の(非クローンの)ポリヌクレオチドに対して並行して実施することができ、複数のポリヌクレオチドは、それらの長さの全体(またはかなりの部分)にわたって個別に解像可能であり、個々のポリヌクレオチド間の重複が最小限であるか、またはまったく生じないような様式で配置される。横並びの重複が発生する場合、これは、DNA染色剤からの蛍光の増加によって、または、染色剤が使用されない場合、結合事象の頻度の増加によって検出することができ、分子が、光学的に重複しているように見えるが、物理的に重複していない場合(回折限界)、それらは、本発明によって提供される単一分子局在化によって提供される超解像によって解像することができる。端部間重複が生じる場合、一部の実施形態では、ポリヌクレオチドの末端をマーキングする標識を使用して、並置されたポリヌクレオチドを真の連続した長さから区別することができる。そのような光学的キメラは、ゲノムの多くのコピーが予想され、見かけのキメラの出現が1回だけ見出される場合、アーティファクトとして却下することもできる。ここでも、分子の末端(回折限界さ)が光学的に重複しているように見えるが、物理的に重複していない場合、それらは本発明の方法によって解像することができる。一部の実施形態では、場所決定は、非常に正確であり、そのため、非常に近い標識から発せられるシグナルが解像され得る。
【0557】
高濃度のプローブ溶液は、クエンチされたプローブ分子ビーコンを使用するか、または同じ種類の2つ以上の標識(例えば、オリゴの両側に1つの標識)を有することによって、支障となるバックグラウンドを引き起こすことなく達成することができる。溶液中では、それらは色素間相互作用を介してクエンチされる。しかし、標的に結合すると分離され、単一の色素の2倍の輝度で明るく蛍光を発することができるため、検出が容易になる。このような色素間相互作用は、Cy3について既知である。
【0558】
一態様では、本発明は、プローブのレパートリーの一過的な結合によってポリマーを配列決定するためのデバイスを含み、かかるデバイスは、光源、流体導管、光学部品、検出器、電子回路、任意選択的に、コンピュータプロセッサおよびコンピュータメモリを含む。DNAは、流体容器に配置され、結合プローブと流体接触しており、光源は、結合プローブと関連付けられた標識を検出器によって検出される光を放出する。一部の実施形態では、検出器は、2D検出器である。一部の実施形態では、ポリヌクレオチドは、流体導管の1つの部分に保持され、結合プローブは別の部分にある。任意選択的に、流体導管の1つの部分は、バルブを介して他の部分から分離される。一部の実施形態では、オリゴまたはオリゴのセットは、液滴またはパケットとして送達される。一部の実施形態では、液滴は、配列決定が行われるフローセルに、予め充填される。
【0559】
一部の実施形態では、配列決定されるポリヌクレオチドのサブセットは、最初に、ポリヌクレオチドの第1のセットから選択される。一部のかかる実施形態では、捕捉オリゴヌクレオチドを溶液中で使用して、ポリヌクレオチドのサブセットにハイブリダイズさせ、それらを溶液から除く。例えば、AgilentのSureSelectまたは同様のアプローチを使用することができる。一部の実施形態では、選択は、CRISPR型のアプローチを伴い、核酸結合は、タンパク質結合によって促進される。同様に、配列決定されるタンパク質またはポリペプチドは、捕捉抗体、ナノボディ、アフィボディ、アプタマーなどによって、溶液から選択され得る。同様に、配列決定される抗体、アフィボディ、またはナノボディは、捕捉抗原によって、溶液から選択され得る。単離されたバイオポリマーは、表面に配列され、本発明の配列決定方法に供される。
【0560】
一部の実施形態では、結合プローブは、タンパク質(例えば、cas9)およびガイドRNAを含むCRISPR系を含む。一部の実施形態では、配列決定の目的は、標的およびオフ標的効果を検出するためのガイドRNAの結合場所を決定することである。
【0561】
一部の実施形態では、標的ポリヌクレオチドは、体液中に存在するもの、例えば、血液中の循環DNAまたはRNAである。かかるポリヌクレオチドは、長さが短く、血液中で約200塩基であり、尿中ではより短い。これらのポリヌクレオチドを表面に固定化し、本発明の配列決定方法に供することができる。そのようなポリヌクレオチドのいくつかは、一本鎖末端を有し、それによって、固定化される。例えば、それらは、ビニルシラン表面(Genomic Vision、France)に固定化することができる。一部の実施形態では、循環DNAまたはRNAは、環状化され、円はローリングサークル反応に使用される。一部の実施形態では、環状化は、CircLigaseなどの酵素によって行われる。一部の実施形態では、ローリングサークル増幅反応の生成物であるタンデムコピーの長い鎖長は、表面上またはマトリックス中で伸展され、次いで、本発明の配列決定方法に供される。このようなアプローチにより、循環ポリヌクレオチドのコンセンサス配列を得ることができる。一部の実施形態では、検出される循環DNAが希少であり、例えば、がんの早期検出の場合、タンデムコピーの配列決定によって得られるコンセンサスは、配列決定方法のエラー率を上回る正確度レベルを得ることを可能にする。例えば、本方法の生の正確度が99.9%である場合、コンセンサスリードは、99.999%の正確度を可能にし、非常に稀なバリアントを検出することを可能にし得る。この文脈におけるローリングサークル増幅の利点は、各アンプリコンが、環状化ポリヌクレオチドから直接コピーされるため、第1または早期の複製ラウンドからの誤差を永続化しないことである(PCRとなる)。
【0562】
一部の実施形態では、本方法は、伸展された分子に沿って、インサイツで適用される。一部の実施形態では、本方法は、クロマチンに、インサイツで適用される。一部の実施形態では、本方法は、分裂期/中期染色体に、インサイツで適用され得る。一部の実施形態では、本方法は、間期染色体に、インサイツで適用され得る。一部の実施形態では、本方法は、細胞内の染色体DNAに、インサイツで適用され得る。一部の実施形態では、本方法は、タンデムコピーに沿って、インサイツで適用され得る。
【0563】
一部の実施形態では、DNAを配列決定することが目的である場合、配列決定を開始する前に、RNAseが試料に適用される。一部の実施形態では、RNAを配列決定することが目的である場合、配列決定を開始する前に、DNAseが試料に適用される。一部の実施形態では、細胞質の核酸および核の核酸の両方が分析され、それらは、差次的に、または順次抽出される。まず、細胞膜(核膜ではない)を破壊して、細胞質の核酸を遊離し、回収する。次いで、核膜を破壊して、核酸を遊離する。一部の実施形態では、タンパク質およびポリペプチドは、細胞質画分の一部として回収される。一部の実施形態では、RNAは、細胞質画分の一部として回収される。一部の実施形態では、DNAは、核画分の一部として回収される。一部の実施形態では、細胞質画分および核画分は、一緒に抽出される。一部の実施形態では、抽出後、mRNAおよびゲノムDNAは、差次的に捕捉される。例えば、mRNAは、表面に付着したオリゴdTプローブによって捕捉される。これはフローセルの第1の部分で生じ得、DNAは、DNAの末端が捕捉され得る疎水性ビニルシランコーティングを有するフローセルの第2の部分で捕捉される(おそらく疎水性相互作用により)。
【0564】
ここまでに説明された一過的な結合の機構は、プローブ結合が不安定であるため、受動的である。以下に、一過的な結合が活性機構である本発明の代替的な実施形態を説明する。ここでは、プローブ結合が安定であり、物理的または分子的手段によって除去されなければならない。
【0565】
したがって、活性な一過的な結合ループは、
1)オリゴまたはオリゴセットを、標的に安定して結合させることと、
2)オリゴまたはオリゴセットを、標的から能動的に除去することと、
3)1および2を反復することと、を含む。
【0566】
一部の実施形態では、ループは、少なくとも2回行われる。一部の実施形態では、オン・オフ結合は、継続的に監視される。一部の実施形態では、オン結合のみが監視される。ステップ1における標的にオリゴを結合させることは、多くの同じ配列のオリゴを結合させることを含む。一部の実施形態では、複数のオリゴ配列は、ステップ1で標的に結合して、標的上の異なる部位に結合する。
【0567】
一部の実施形態では、配列決定方法は、
1)オリゴ1またはオリゴ1セットを添加し、
2)撮像しながら、オリゴを、標的部位のサブセットに安定して結合させ、
3)オリゴを、標的から能動的に除去し、
4)十分な場所から、十分な数の画像が収集されるまで、2および3を反復し。
5)オリゴを洗い流し、
6)オリゴ2またはオリゴセット2を添加し、
7)ステップ2~5を反復し、
8)オリゴ3またはオリゴセット3を添加し、
9)ステップ2~5を反復し、
10)レパートリーが消耗するまで、上記のプロセスを継続する、ことを含む。
【0568】
一部の実施形態では、ステップ2および3は、各オリゴまたはオリゴセットに対して複数回行われる。これは、いくつかの理由で行われる。結合は確率過程であるため、結合が適切な時間にわたって行われる場合、反応は平衡前または初期段階で停止され、結合部位のごく一部が占有される。したがって、使用されるオリゴまたはオリゴセットの結合部位が、全体的にともに近すぎて、個別に解像することができない場合、サブセットは、統計的にさらに離され、オリゴの濃度および反応の時間が適切に設定されている場合、それらを個別に検出することが可能になる。適切な時間および濃度は、経験的に判定することができる。これにより、異なる位置のサブセットを、結合させ、各反復で照合することができる。結合を複数回行う別の理由は、すべてまたはほぼすべてのほとんどの部位を、照合することを可能にし、実質的にすべてまたはほとんどの部位を、各々複数回照合することを可能にするためであり、したがって、感度および正確性が向上する。
【0569】
一部の実施形態では、活性結合および除去は、温度変化によってもたらされる。一部の実施形態では、活性結合および除去は、試薬変化によってもたらされる。一部の実施形態では、活性結合および除去は、電気的変化によってもたらされる。
【0570】
本発明の一部の実施形態では、プローブ結合期間の経過中に、温度を変化させることができ、1つを超える温度で、プローブの結合挙動を決定できるようにする。一部の実施形態では、融解曲線の類似物が行われ、標的ポリマーへの結合挙動または結合パターンは、選択された範囲(例えば、10度~65度)にわたる温度の勾配と相関する。
【0571】
一部の実施形態では、代替として、または異なるTmを有するオリゴヌクレオチドプローブの温度を変更することに加えて、それらの濃度、および/または塩条件、および/またはpHを変化させることができる。一部の実施形態では、表面上の電気バイアスは、一過的な結合を能動的に促進するために、正と負の間で反復的に切り替えられる。
【0572】
一部の代替的な実施形態では、一過的な単一分子の結合は、非光学的方法によって検出される。一部の実施形態では、非光学的な方法は、電気的な方法である。一部の実施形態では、一過的な単一分子の結合は、直接的な励起方法が存在しない場合、非蛍光的な方法によって検出され、むしろ生物発光または化学発光の機構が使用される。
【0573】
一部の実施形態では、本発明は、標的ポリヌクレオチドを配列決定するための方法を含み、
1)標的ポリヌクレオチドを、その長さに沿って、表面/マトリックスとの1つ以上の相互作用(例えば、複数の相互作用)によって、固定化することと、
2)標的中に一致が見出された場合、一過的な結合が、非特異的結合を上回る区別可能な持続時間または存続時間で生じ得るような条件下で(オリゴ濃度、塩濃度、温度)、固定化標的ポリヌクレオチドを、所与の配列および長さのオリゴヌクレオチドまたは化学組成物で満たす(flood)ことと、
3)一過的な結合事象を検出し、それらの2D座標を記録することと、
4)オリゴヌクレオチドを除去することと、
5)次のオリゴヌクレオチドのセットを添加し、所与の長さの配列の全レパートリーが試験されるまで、3および4を反復し、除去することと、
6)アルゴリズムを使用して、一過的な結合するオリゴヌクレオチドの場所に基づいて、固定化標的ポリヌクレオチドの配列をコンパイルすることと、を含む。
【0574】
本発明の方法は、天然長またはそのかなりの割合が(例えば、DNA全染色体または約1Mbp画分について)保存される、非常に長いポリマー長の配列に特に好適である。しかしながら、一般的な分子生物学的方法は、DNAの断片化をもたらす。ピペッティング、ボルテキシングは、DNA分子を破壊する可能性のある剪断力を引き起こす。ヌクレアーゼ汚染は、核酸を分解させる可能性がある。本発明の一部の実施形態では、天然長の天然長または天然長のかなり高分子量の(HMW)断片は、固定化、伸展、および配列決定を開始する前に保存される。
【0575】
したがって、一部の実施形態では、本発明は、標的ポリヌクレオチドを配列決定するための方法を含み、
1)細胞を、マイクロ流体容器またはデバイスに配置することと、
2)ポリヌクレオチドを、細胞からマイクロ流体環境に抽出することと、
3)標的ポリヌクレオチドを、その長さに沿って、表面/マトリックスとの1つ以上(例えば、複数の相互作用)によって、固定化し、伸長することと、
4)標的中に一致が見出された場合、一過的な結合が、非特異的結合を上回る区別可能な持続時間または存続時間で生じ得るような条件下で(オリゴ濃度、塩濃度、温度)、固定化標的ポリヌクレオチドを、所与の配列および長さのオリゴまたは化学組成物で満たすことと、
5)一過的な結合事象を検出し、それらの2D座標を記録することと、
6)オリゴを除去することと、
7)所与の長さの配列の全レパートリーが試験されるまで、毎回、異なるオリゴを用いて4~6回反復することと、
8)単一分子局在化アルゴリズムを使用して、各結合部位をナノメトリックで位置決定することと、
9)アルゴリズムを使用して、一過的な結合するオリゴヌクレオチドの場所に基づいて、固定化標的ポリヌクレオチドの配列をコンパイルすることと、を含む。
【0576】
一部の実施形態では、単一の直線化された、線状ポリマーは、一度に分析または検討される。この場合、2D座標を記録する必要はなく、1D座標だけ必要である。
【0577】
一部の実施形態では、ポリヌクレオチドは、ステップ1の後、その間、またその前に、比較的均一な長い鎖長(例えば、約1Mb)に断片化される。一部の実施形態では、ポリヌクレオチドは、ステップ2の後またはその間に、比較的均一な長い鎖長に断片化される。一部の実施形態では、断片化は、酵素的に行われる。一部の実施形態では、断片化は、物理的に行われる。一部の実施形態では、物理的断片化は、超音波処理を介する。一部の実施形態では、物理的断片化は、イオン爆撃または放射線を介する。一部の実施形態では、物理的断片化は、電磁放射線を介する。一部の実施形態では、物理的断片化は、UV照明を介する。一部の実施形態では、UV照明の線量は、所与の長さまで断片化をもたらすように制御される。一部の実施形態では、物理的断片化は、UV照明および色素(例えば、YOYO-1)による染色の組み合わせを介する。一部の実施形態では、断片化プロセスは、物理作用または試薬の添加によって停止される。一部の実施形態では、断片化プロセスの停止に影響を及ぼす試薬は、β-メルカプトエタノール(BME)などの還元剤である。
【0578】
一部の実施形態では、本発明は、
1)細胞を、マイクロ流体容器またはデバイスに配置することと、
2)細胞を、挿入色素で染色することと、
3)挿入色素媒介性断片化をもたらすための所定の線量のUV光を提供することと、
4)任意選択的に、断片化を中止することと、
5)ポリヌクレオチドを、細胞からマイクロ流体環境に抽出することと、
6)ポリヌクレオチドを、固定化し、伸長させることと、
7)固定化され伸長されたポリヌクレオチド上で、インサイツで配列決定することと、を含む。
【0579】
これらのステップは、単離された単一細胞に作用するステップを含めて、本発明の様々な実施形態に追加することができる。
【0580】
一部の実施形態では、各細胞は、マイクロ流体容器またはデバイス内で個別に単離され、そのDNAは、個別に抽出され、個別に配列決定される。一部の実施形態では、抽出は、洗剤および/またはプロテアーゼで処理することによって行われる。一部の実施形態では、キレート剤(例えば、EDTA)は、ヌクレアーゼによって必要とされる二価カチオンを除去するために溶液中に提供される。一部の実施形態では、特定の試料源を用い、二価カチオンの濃度は、分子生物学において通常使用されるよりも高い。
【0581】
一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも速い。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも低コストである。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも長いリードを提供する。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも高い正確度を提供する。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも高い感度を提供する。最も好ましい実施形態では、本発明は、前述の利点のすべてを提供する。さらに、一部の好ましい実施形態では、フローセル、計装、およびコンピュータパワーのコストがコストに加算されるのにもかかわらず、ほんの数ドル以下の少量の生化学試薬を使用して、全ゲノムを約1時間以内に配列決定することができる。例えば、20塩基の標識部位を有する5塩基長は、約1ドルで購入することができ、完全なレパートリーは、1000ドルになる。標識部位に安定して結合することができる蛍光標識されたオリゴは、約50ドルである。マイクロモル濃度のスケールで合成されたそのようなオリゴの約100万分の1が使用され、1回の実行当たりのコストは1ドル未満となる。
【0582】
本発明の方法は、酵素を必要とせず、プローブ(オリゴ)の希釈溶液のみを消費するという点で注目に値する。したがって、本方法は低コストである。配列決定化学は、単純なプローブおよび緩衝液のみを消費し、その結果、コストは、主に、機器およびプラスチックウェアである。
【0583】
本発明の驚くべき特徴は、単一分子の伸長された標的が、数百回の試薬交換および洗浄サイクルにわたって安定したままであることである。
【0584】
単一分子局在化によって可能になる本発明の注目すべき側面は、10nmピッチの規則正しいアレイは、完全に占有された場合、1cm2当たり1兆個の標的分子を与えることである。
【0585】
本発明の別の注目すべき側面は、標的における単一の塩基置換により、(例えば)10個の5塩基長プローブが、参照配列に対して変化することである。それまで結合しなかった5つのプローブがいま結合し、それまで結合していた5つのプローブがもう結合しない。この変化は、他の鎖でも見られるであろう。
【0586】
その好ましい実施形態では、本発明は、以下の要素のうちの2つ以上を含むことによって、従来技術と区別される:ポリヌクレオチドが固定化される前の事前ライブラリ調製がないこと;一部の実施形態におけるポリヌクレオチドの一方向での整列;一過的な結合;反復結合;ポリヌクレオチドの連続した配列が配列情報のビットを一緒に繋ぎ合わせることによって構築されること。
【0587】
本発明の一部の実施形態では、本方法を実施するために必要なすべての試薬が、分析が開始される前に流体デバイスに予め充填される。一部の実施形態では、試薬(例えば、プローブ)は、デバイス内で乾燥状態で存在し、反応が進行する前に湿潤され、溶解される。
【0588】
一部の実施形態では、本方法は、試薬交換を伴わない撮像の過程中で、単一のポリマーへの複数の結合事象を含む標的バイオポリマーを配列決定する手段を含む。一部の実施形態では、単一のバイオポリマー上の複数の場所の各々への複数の結合事象が、1回または複数回生じる。
【0589】
一部の実施形態では、配列決定方法は、配列プローブが単一のポリヌクレオチドに一過的に結合することを含み、当該プローブは、単一のポリヌクレオチド上の複数の重複部位の各々に実質的に相補的である。一部の実施形態では、重複部位の各々は、本方法の場所正確度および精度によって解像される。
【0590】
一部の実施形態では、配列決定方法は、配列プローブが単一のポリヌクレオチドに一過的に結合することを含み、レパートリーの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的であり、2つ以上のプローブの重複部位への結合は、時間的に離れている。
【0591】
一部の実施形態では、配列決定方法は、配列プローブのタイリングセットが単一のポリヌクレオチドに一過的に結合することを含み、セットの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的であり、2つ以上のプローブの重複部位/ビットへの結合は、時間的に離れる。
【0592】
一部の実施形態では、配列決定方法は、配列プローブのパネルが単一のポリヌクレオチドに結合することを含み、パネルの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的である。一部のかかる実施形態では、配列ビットは、同じまたは異なるプローブによって複数回照合される。
【0593】
一部の実施形態では、本発明は、標的タンパク質上のアミノ酸配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリペプチド上のアミノ酸配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリヌクレオチド上のアミノ酸配列と同様に、ペプチド修飾を分析する方法を含む。
【0594】
一部の実施形態では、本発明の方法は、ポリペプチドの配列決定に適用される。20個のアミノ酸の各々は、N-レコグニン、ナノボディ、抗体、アプタマーなどを含む対応する特異的プローブによって結合される。各プローブの結合は、ポリペプチド鎖内の各対応するアミノ酸に特異的である。
【0595】
一部の実施形態では、ポリペプチドにおけるサブユニットの順序が決定される。一部の実施形態では、結合は、結合部位の代替物に結合する。一部の実施形態では、代替物は、特定のアミノ酸またはペプチド配列で結合されたタグである。一過的な結合は、代替タグに結合する。
【0596】
一部の実施形態では、本発明は、ポリマーの同一性を決定することを含む。一部の実施形態では、本発明は、細胞または組織の同一性を決定することを含む。一部の実施形態では、本発明は、生物の同一性を決定することを含む。一部の実施形態では、本発明は、個体の同一性を決定することを含む。一部の実施形態では、本発明の方法は、単一細胞配列決定に適用される。
【0597】
一部の実施形態では、配列決定は、細胞内でインサイツで行われる。細胞の内容物は、マトリックスと称され得、一過的な結合が開始する前に、固定され、変性される。一部の実施形態では、細胞は、単層を形成してもよく、または他の実施形態では、それらは、組織またはオルガノイドなどの3Dアーキテクチャの一部である。多光子顕微鏡法および光シート顕微鏡法などの、3D構造の事象を検出することができる撮像方法を使用することができる。マトリックスまたはゲル中の分子を固定し、その中で照合することにより、希少なものを含むすべての分子を捕捉することができる。一部の実施形態では、細胞(例えば、循環腫瘍細胞CTC)は、表面に分散され、配列決定される。一部の実施形態では、細胞は、各細胞が他の細胞から十分に離れて分離されるように、表面に分散される。次いで、細胞を溶解することができ、それらの分子インベントリを表面上で捕捉し、本発明の配列決定方法に供することができる。
【0598】
一部のかかる実施形態では、本方法は、
I)細胞内のポリヌクレオチドの場所を固定することと、
II)所与の特異性のオリゴを添加し、単一分子局在化を使用して、すべての結合事象の場所を決定することと、
III)異なる特異性のオリゴを添加し、単一分子局在化を使用して、すべての結合事象の場所を決定することと、
IV)ステップII~IIIを反復することと、
V)オリゴヌクレオチドの結合の場所をコンパイルすることによって、細胞内のポリヌクレオチドの線状経路または領域場所の配列を再構築することと、を含む。
【0599】
上記の一部の実施形態では、機構(FRET、蛍光標識、クエンチ標識など)を使用して、個々の点源の検出を困難にするバックグラウンド蛍光/光散乱を最小化する。上記の一部の実施形態では、RNAseを使用して、本発明が残りのDNAに適用される前に、RNAが除去される。上記の一部の実施形態では、二重鎖DNAは、オリゴの添加前にインサイツで変性される。
【0600】
一部の実施形態では、修飾の場所はまた、5メチルC(5MC)などの修飾の場所を決定するために単一分子局在化を使用することによって決定される。
【0601】
本発明の一部の実施形態は、デジタル分子計数における問題を解決するように設計される。分子を計数する上での1つの問題は、高精度で再現性のあるデータを得ることである。分子相互作用の確率的性質に起因して、エンドポイントデジタル計数アッセイは、エンドポイント測定が行われた時点では存在しない特定の事象を見逃し得るか、またはそれは擬似事象(例えば、非特異的結合または部分一致)を計数し得る。このため、計数される分子が、複数回(または反復的に)結合する一過的な結合プローブによって検出されるデジタル計数アッセイがより好適である。複数の結合事象は、何か本物が検出されているという自信を与え、何が検出されているのか、またはいくつかの特徴の何が検出されているのか(例えば、部分一致)を決定することができる。
【0602】
したがって、一部の実施形態では、本発明は、試料中の分子の種類(例えば、特定の配列を含むDNA断片)の数を計数する(またはコピー数を決定する)方法を含み、
a)プローブが分子に一過的に結合することができる条件下で、1つ以上のプローブ種を添加することと、
b)検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、非認証相互作用をフィルタリング除去し、認証相互作用の数を決定し、それによって、分子のコピー数を決定することと、
d)任意選択的に、分子はステップaの前に、表面またはマトリックス上に固定化することと、を含む。
【0603】
一部の実施形態では、ある種類の分子の列挙は、一過的な結合相互作用の出現特性の結果である。1つのプローブ結合事象または結合のエンドポイント決定は、分子の種類の数の真値を決定するのに十分ではなく、真正な決定は、もみ殻から小麦を分ける(真正な事象を非真正な事象から分ける)複数の結合事象(出現特性)の分析から生じる。
【0604】
一部の実施形態では、本発明は、1つ以上のプローブと分子との間の相互作用を計数する方法であって、
a)プローブが分子に一過的に結合することができる条件下で、所与の特異性の1つ以上のプローブを添加することと、
b)検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、一定の期間中に生じた相互作用の数を決定することと、
d)任意選択的に、異なる特異性の1つ以上のプローブを添加し、ステップb~cを反復することと、
e)任意選択的に、ステップaの前に、分子が表面またはマトリックス上に固定化されることと、を含む。一部のかかる実施形態では、ステップcで、相互作用が、各相互作用の持続時間によって分類され、各分類に該当する事象の数が記録される。本実施形態は、例えば、配列と異なるプローブとの間の一致度が測定されている場合、有用であり得る。この実施形態は、真正な事象を非真正な事象と区別するために前の実施形態に適合され得る。
【0605】
真正な事象を構成するもの、および非真正な事象を構成するものを決定するために、いくつかの基準を確立することができる。例えば、結合持続時間のカットオフは、真正な事象を非真正な事象から分離するための1つの基準である。
【0606】
測定する必要がある高密度の分子を含む混雑した視野に対処する、PAINTなどの特定の単一分子局在化方法では、位置決定の正確度は以下に依存する:(1)収集された光子の数(位置決定の程度は光子の数に反比例するため、サブナノメートルまたは低ナノメートルレベルへの位置決定を得るために多数の光子が必要である)、(2)低デューティサイクル(すなわち、各結合事象が持続する時間が短い)、これは、統計的には結合事象が確率的であるために、ほんの一部、したがって任意の所与の時間に、個別に解像可能なシグナルのみが遊離されることを意味する。
【0607】
一部の代替的な実施形態では、分子の視野が混雑していない、もしくは高密度ではないか、または伸長または伸展されたポリマーに沿った部位がまばらである場合、低デューティサイクルは必要とされない。シグナルまたは検出可能な光子放出は、長寿命であり得、検出される持続時間は、単一分子局在化アルゴリズムを使用して位置決定を行うことができる範囲を決定する。より多くの光子を収集するために、長い露光時間を使用することができる。かかる実施形態では、プローブの光退色を最小化するために、パルス照明またはストロボ照明を使用することが有用である。また、色素からのシグナルは、しばしば、より低い波長の光による励起によって回収することができる。したがって、検出は、
1)波長1の照明、
2)シグナルの検出、
3)波長2の照明、および
4)位置決定に必要とされる十分な光子が収集されるまで、1~3を反復すること、を含む。
【0608】
これを配列決定に適用して、例えば、ポリヌクレオチドの長さに沿った5塩基長プローブの場所を決定する場合、配列ビットを数ナノメートルまで位置決定することができ、プローブのレパートリーの各々の場所を使用して、結合事象のレパートリーの場所の出現特性である、ポリヌクレオチドの配列をまとめることができる。一過的な結合を必要としないこの実施形態は、シグナルが、ナノメートルまたはサブナノメートル寸法まで局在化されるため、依然として新規である。
【0609】
一部の実施形態では、ポリヌクレオチドは、液体からゲルへの転移を起こし得る媒体を含むフローチャネル内に配置し、ポリヌクレオチドが十分に分散され個別に単離された後、ポリヌクレオチドをそれらの場所に固定するゾル-ゲル転移を誘導できるようにする。次いで、本発明のプローブをゲル相に捕捉されたポリヌクレオチドに適用することができる。ポリヌクレオチドが3Dに分散されるため(一方向に整列しているにもかかわらず)、光シート顕微鏡法などの撮像法を使用して2Dスライスを撮像することができる。
【0610】
一部の実施形態では、溶液は、液相および固相(またはゲル相)の2つの相を有する。ポリヌクレオチドは、最初に伸長され、液相中に分布し、次いで、相を固相/ゲル相に変えることによって(例えば、加熱によって、またはポリアクリルアミドの場合は補助因子を添加することによって、もしくは時間とともに)固定される。場合によっては、ポリヌクレオチドは、固相/ゲル相において伸長され得る。次に、本発明の配列決定化学を、固相において三次元で単離した静的ポリヌクレオチドに適用する。次いで、配列決定反応の検出は、共焦点顕微鏡、多光子顕微鏡、光シート顕微鏡、スピニングディスク共焦点顕微鏡などによって行われる。この実施形態は、試料中の実質的にすべての分子が配列決定される必要がある場合、特に関連性がある(表面に捕捉され得る分子だけではない)。ポリヌクレオチドは、ポリ(N-イソプロイルアクリルアミド)を含む媒体中で処理され、加熱は、3D空間でポリヌクレオチドを固定するが、ヒドロゲルを介して試薬の交換を可能にするヒドロゲルを生成する相転移につながる(Eriksen et al Biomicrofluidics 5:31101-311014,2011)。
【0611】
一部の実施形態では、ポリマーは、一端で捕捉され、次いで、ポリマーが配置される液体媒体の流れによるポリマー上の力に起因して、直線化または伸展される。液相/ゾル相がゲル相に転移することで、分子は静的になる。
【0612】
いくつかの方法では、ポリマーがゲル中に配置されるか、またはゲル中に配置されることになる場合、ポリマーの長さに沿った特徴(例えば、配列ブットまたはアミノ酸)の相対的に固定されたまたは静的な位置により、ポリマーの長さに沿った標識の場所を単一分子局在化方法によって決定することができるようになる。
【0613】
したがって、これらの実施形態は、
I)ポリヌクレオチドを、ゲルまたはマトリックス中で一方向に整列することと、
II)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、ゲルまたはマトリックスを通して、所与の特異性の蛍光オリゴを流すことと、
III)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、ゲルまたはマトリックスを通して、異なる特異性の蛍光オリゴを流すことと、
IV)ステップIIIを反復することと、
V)各特異性のオリゴの結合場所に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む。
【0614】
一部の実施形態では、配列情報は、制限酵素、ニッキングエンドヌクレアーゼ、およびメチルトランスフェラーゼなどの配列特異的核酸結合タンパク質の一過的な結合によって取得される。そのようなタンパク質の大量のレパートリーが市販されており、配列空間の多くをカバーしている。回文配列を認識する多数の配列酵素が利用可能である。前述の3つのタンパク質の1つの特徴は、それらが、二本鎖DNAの配列を認識することである。これらのプローブは、完全なレパートリーからのいくつかのオリゴヌクレオチド、例えば、(通常の反応条件下で、それらを比較的非効率的なプローブにさせる自己相互作用またはヘアピン相互作用を起こすいくつかのオリゴヌクレオチド)を置き換えるために使用され得る。
【0615】
抗体または結合タンパク質の一過的な結合は、塩濃度などの反応条件の操作によってもたらされ得る。一部の実施形態では、一過的な結合をもたらすために、塩濃度が、100mM超に上げられる。一部の実施形態では、塩濃度が、200mM超に上げられる。一部の実施形態では、塩濃度が、300mM超に上げられる。一部の実施形態では、一過的な結合は、緩衝液を低塩から高塩に交換することによって能動的に行われる。一部の実施形態では、配列または修飾(例えば、メチル化)特異的結合タンパク質は、安定した結合または一過的な結合を可能にし、それらの場所は、それらにコンジュゲートされた標識の単一分子局在化によって、またはタンパク質への直接的なもしくはタグを介した結合よって、決定される。
【0616】
一部の実施形態では、逆の反応を行い、プローブを固定化し、溶液中の分子(分析される標的)との一過的な相互作用が決定される。
【0617】
本発明の一部の実施形態では、分子は、表面またはマトリックス上に固定化されておらず、溶液中で自由に拡散している。検出は、蛍光相関分光法(FCS)によって実行される。一部のかかる実施形態では、分子(例えば、より大きく、かつ)は、プローブよりもゆっくりと溶液中を移動する。したがって、各共焦点スポットにおいて、分子が共焦点スポットから拡散する前に、プローブと分子との多くの推定結合事象を記録することができ、これらの結合事象は相互相関となる。結合相互相関は、共焦点スポットにおけるプローブの滞在時間によって、非結合相互相関から区別することができる。一部の実施形態では、オリゴのコード化されたレパートリーが提供され、結合オリゴの同一性(これは、統計的に一度に1つずつ生じる)は、蛍光結合シグナルをデコードすることによって決定される。
【0618】
一部のかかる実施形態では、本方法は、
I)ポリヌクレオチドを、溶液中に添加することと、
II)単一のポリヌクレオチドを単離する共焦点領域(confocal volume)に照射することと、
III)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、所与の特異性の蛍光オリゴを流すか、またはアンケージすることと、
IV)オリゴがポリヌクレオチドと一過的な相互作用を行い、それらの結合特性が決定され得るように、異なる特異性の蛍光オリゴを流すか、またはアンケージすることと、
V)ステップIVを反復することと、
VI)各特異性のオリゴについて検出された結合事象の持続時間および存続時間に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む。
【0619】
一部の実施形態では、結合特性は、所定の閾値を超える結合持続時間が生じるかどうかを含む。
【0620】
一部の実施形態では、ポリヌクレオチドは溶液中に留まり、そのバルクは、それが比較的同じ場所または共焦点領域内に留まることを可能にし、レパートリーのオリゴは、その体積を1つずつ(またはセットごとに設定される)通過するか、または、好ましくは、コード化されたレパートリーとしてすべて同時に添加される。一部の実施形態では、ポリヌクレオチドのバルクを、物理的トラップ(例えば、レーザトラッピング、静電トラッピング)によって、固定場所にトラップされるようにする。一部の実施形態では、複数のポリヌクレオチドは、複数の光トラップによって個別に捕捉され得る。
【0621】
一部の実施形態では、ポリヌクレオチドは、容器内(例えば、非混和性脂質小胞内)に拘束される。容器は、プローブの交換を可能にし得るが、ポリヌクレオチドを散逸させない。
【0622】
一部の実施形態では、共焦点領域は、多光子領域(multi-photon volume)である。
【0623】
一部の実施形態では、溶液中のポリマーは、定常ではなく、ポリマーは、レパートリーの異なるプローブを有する十分に離れたフローストリーム(例えば、層流ストリーム)の方向に対して垂直の方向に移動する。移動は、電気泳動(すなわち、正のバイアス電極に向かって)であり、ポリヌクレオチドの移動方向によって軌道が著しく影響されないフローストリーム中で、オリゴよりも高分子量のポリヌクレオチドに作用する。
【0624】
一部の実施形態では、ポリヌクレオチドは、一端のみで固定化されているが、表面に平行なフローストリーム(または、例えば、光学的に捕捉されたビーズに固定化されたときの2D検出面)中で伸展され、一端以外のその長さに沿った場所からの、長寿命の表面との相互作用をしない。一部の実施形態では、一端で固定化されたポリヌクレオチドは、一本鎖である。次いで、レパートリーのオリゴを流体量で交換する。一部の実施形態では、オリゴの流れの方向は、ポリヌクレオチドの伸長方向と同じである。一部の実施形態では、個々のオリゴ分子の検出可能な繰り返しの一過的な結合は、オリゴの大部分が流れの方向に沿って移動しているときであっても、伸長ポリマーの相補的な場所に生じる。
【0625】
一部の実施形態では、ポリヌクレオチドは、その固定化地点から、流れの方向に対して垂直に伸展される。これは、流れの方向に対して垂直に電場を提供することによって実現することができる。流れは、1ミリバールから最大1バールの圧力を印加することによって、圧力駆動の流れによってもたらされ、電場は、1センチメートル当たり1~100ボルトであり得、固定化されたポリヌクレオチドの末端を負にし、フローセルの別の表面を正にして、そちらにポリヌクレオチドが引き寄せられる。
【0626】
一部のかかる実施形態では、本方法は、
I.ポリヌクレオチドを、一方の末端で表面に付着させ、物理的機構によって、一方向に伸長させることと、
II.オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、所与の特異性の蛍光オリゴを流すことと、
III.オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、異なる特異性の蛍光オリゴを流すことと、
IV.ステップIIIを反復することと、
V.各特異性のオリゴについて検出された結合事象の持続時間および存続時間に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む
【0627】
一部の実施形態では、物理的機構は、ポリヌクレオチドの一端に付着されたかさばる実体(例えば、ビーズ)に対する作用による、フロー伸展、電気泳動伸展、または伸展である。次いで、かさばる実体は、レーザトラッピング、静電トラッピング(帯電している場合)、磁気トラッピング(常磁性の場合)に供され得る。
【0628】
上記の方法のポリヌクレオチドがゲノムDNAである場合、本方法は、染色体をアセンブリするために重複してアセンブリされたポリヌクレオチド配列をさらに含むことができる。
【0629】
一部の実施形態では、本発明は、分析用の生体高分子を送達するための方法に関し、
1.生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2.生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3.生体高分子を、保護実体から分析ゾーンに放出することと、
4.本発明に記載の方法に従って、生体高分子を分析することと、を含む。
【0630】
一部の実施形態では、プローブは、定義された1つのヌクレオチド(例えば、NNNXNNN(式中、Xは、定義されたまたはコードヌクレオチドである))に従って標識される。一部の実施形態では、NNNXNNNオリゴのレパートリーは、位置X位は、A、C、G、またはTを含み、位置Nは、A、C、G、およびTのうちの1つである。オリゴの中央塩基は、その同一性、A、C、G、またはTに従って差次的に標識される。一部の実施形態では、NNNXNNNオリゴの4つのライブラリ(例えば、各ライブラリは、オリゴヌクレオチドのセット:NNNANNN、NNNTNNN、NNNGNNN、およびNNCNNNを含む)は、それぞれ差次的に標識され、配列決定プロセス中に試薬交換を必要としない均一な反応で使用される。
【0631】
相補的核酸配列(例えば、オリゴプローブ)を使用して、核酸配列を検出することは非常に容易である。オリゴヌクレオチドによって結合される配列(例えば、5塩基)は、本明細書において配列ビットと称される。いくつかのアッセイ、例えば、Fodorの遺伝子チップアッセイ(例えば、Chee et al Science 274:610-4.1996に記載されている)において、プローブは固定化され、標的は標識され、溶液中で提供される。多くの他のアッセイにおいて、標的は固定化され、プローブは標識され、溶液中で提供される(例えば、サザンブロットを介して、Southern EM,Journal of Molecular Biology,98:503-517(1975)に記載されている)。かかるアッセイでは、プローブは、ワトソン-クリック相互作用によって標的核酸配列にハイブリダイズし、過剰の標識プローブを洗い流し、残りの結合プローブを検出する。ハイブリダイゼーションは、洗浄に耐え、検出中に所定の位置に留まるのに十分に安定した正しい結合を必要とする。固定化ポリヌクレオチドを配列決定するための方法は、オリゴヌクレオチドのレパートリーのハイブリダイゼーションによってのみ提案されており(例えば、Drmanac et al Science,260,1649-1652,1993に記載されている)、この「ハイブリダイゼーションによる配列決定」(SbH)アプローチは、小さなゲノムの再配列決定について実証されている(例えば、Pihlak et al Nature,Biotechnlogy 26:676-684 2008に記載されている)。Mir(WO2002/074988,2001)は、表面に伸展されたポリヌクレオチドのSbHをさらに提供する。前述のプロービングおよび配列決定方法のすべては、エンドポイントアッセイであり、プローブが相補ポリヌクレオチド標的との長寿命相互作用を形成することを必要とする。任意の核酸相互作用はオフ速度を有するが、核酸アッセイの場合、オフ速度は、アッセイに顕著な影響を及ぼさない程度に遅い。プローブが安定して結合している場合、一連の次のプローブをハイブリダイズする前に、厳密な剥離プロトコル(高温を含む)を伴う特定のステップを行って、プローブを除去する必要がある。厳しい条件は、DNAを損傷するか、または標的DNAを表面から除去する可能性があり、本発明者の経験から、かなりの量のプローブが、有効に、永久に固着したままである。
【0632】
本発明は、新規の反直観的な配列決定アプローチであり、プローブと標的配列との短命なワトソン-クリック相互作用を伴う。プローブの化学構造(例えば、配列、3D構造)は、使用される条件下で長寿命の安定した相互作用を形成しないように設計される。むしろ、プローブ分子の大部分が標的に結合し、次いで、検出プロセス中に解離するように設計される。これは、プローブの大部分が検出中に結合したままであると予想されるハイブリダイゼーションとは異なる。
【0633】
本発明のステップは、配列決定におけるハイブリダイゼーションベースの試みが、安定した長寿命の結合を伴う場合、本アプローチは、特に、短寿命の不安定な結合を必要とするという事実を含む。照合塩基が5個という短いオリゴヌクレオチドの不安定で一過的な反復した結合のための条件が見出され、オリゴヌクレオチドは、全レパートリー(1024個のオリゴ)を容易に生成し、かつ実行するのに十分に短い。
【0634】
本発明は、SbHといくつかの類似点を有するが、それは、SbHの固有の問題に悩まされない:1つのプローブが結合したら、例えば、5塩基長のそのフットプリントは、5塩基の配列をカバーし、結合から5塩基のフットプリントと部分的に重複する他のプローブを阻害または妨害する。一度に1つのプローブのみを使用する場合であっても、プローブのサブ配列がタンデムに繰り返されている場合、第1の結合オリゴは、隣接位置から情報が得られないようにする。しかしながら、本発明は一過的な結合を伴うため、第1のプローブが外れ、第2のプローブによる結合のたに配列がアクセス可能になり、第2のプローブが外れ、第3の結合が可能になる、などである。本アプローチの別の利点は、各配列ビットの真偽が、反復結合によって検証されることである。しかし、SbHの場合、一旦何かが結合すると、固着してしまい、それが特異的結合または非特異的結合の結果であるのかを決定することが困難になる。加えて、不一致の安定した結合は、SbHに問題を引き起こすが、本発明の場合、不一致は、結合の持続時間、長い持続時間の結合の頻度などによって完全一致と区別することができる。場合によっては、不一致(例えば、4塩基)は、ワトソン-クリック塩基対を形成し得、5番目の塩基は、塩基対を形成しない。他の場合では、例えば、4は、ワトソン-クリック塩基対を形成し得、5番目は、非ワトソン-クリック塩基対を形成し得る。場合によっては(例えば、非ワトソン-クリック結合が形成される場合)、いくつかのワトソン-クリック塩基対および1つ以上の非ワトソン-クリック塩基対を有する非完全一致は、実際には、完全一致よりもより安定な相互作用を形成する場合があり、結合の平均持続時間がより長いこともある。すべてのそのような可能性に関する経験的なデータを収集することで、本発明の配列決定技術の性能が改善されるであろう。機械学習を使用して、フルセットの挙動を予測するために、そのような挙動を実験のサブセットから学習することができる。
【0635】
本発明の短いオリゴヌクレオチドの使用は、標的配列の探索が、典型的には、3、4、5、または6個の一致の発見を伴うという利点を有しており、これは、非常に迅速に起こり得、標的配列の出現がかなり頻繁である。一部の実施形態では、実質的にすべての一致部位および不一致部位は、検出の過程で一過的に結合されるが、一部の実施形態では、一部の部位のみが結合される。
【0636】
本発明のポリヌクレオチド配列決定は、オリゴのレパートリーの結合特性の出現特性である。概して、SbHおよびハイブリダイゼーションアッセイは、合成オリゴヌクレオチドのその標的天然ポリヌクレオチドへのワトソン-クリックルールによる完全一致の結合から情報を取得し、不一致を含む結合の除去に努める。本発明の一部の実施形態は、各オリゴヌクレオチドが分析下のポリヌクレオチドと有した結合相互作用のレパートリー(閾値結合持続時間を超える)を調べる。一部の実施形態では、配列決定は、完全一致からの配列の繋ぎ合わせまたは再構築を含むだけでなく、各オリゴの結合傾向を分析することによって配列を得る。本方法は、各オリゴ種の結合傾向:オン・オフ結合の速度および持続時間(プローブが部位と結合を形成する塩基対の種類および数の関数である)を測定するために、一意に設定される。要約すると、オリゴと、オリゴが完全な塩基対合または完全一致を形成する部位との反復的な結合相互作用は、プローブのいくつかの塩基が標的と対合しない不一致を形成する場所とは異なる傾向があり、ほとんどの場合、不一致部位への結合は、完全一致部位よりも短命な傾向がある。経験的データを使用して、特定の外れ値(ワトソン-クリック不一致結合がワトソン-クリック一致結合よりも長命である)に対する期待値を修正する。本発明のアルゴリズムは、これを考慮に入れることができる。
【0637】
本発明の一部の実施形態では、検出ステップは、プローブのオン結合およびオフ結合が記録されるいくつかの画像フレーム(例えば、動画またはビデオ)を取ることを伴う。
【0638】
一部の実施形態では、検出ステップは、各相補的部位への複数のオン結合事象およびオフ結合事象を検出することを伴う。複数の事象は、同じプローブ分子のオン結合またはオフ結合によるものか、または同じ特異性を有する別の分子(すなわち、同じ配列または分子構造に特異的である)に置換されたものであり、これは、複数回生じ得る。オン結合またはオフ結合は、条件の変化によって影響されず、オン結合およびオフ結合の両方は、同じ条件(塩濃度、温度など)下で生じ、プローブ標的相互作用が弱いため、結合が一過性であることに起因する。
【0639】
本発明の一部の実施形態では、配列決定は、プローブ長のより短い、同じ長さの、または1桁以内の単一の標的ポリヌクレオチド上の複数の場所での複数のオン・オフ結合事象を撮像することによって行われる。かかる実施形態では、より長い標的ポリヌクレオチドが断片化されているか、または断片のパネルが事前に選択され、表面に配列されており、そのため、各ポリヌクレオチド分子が個別に解像可能である。これらの場合、プローブが特定の場所に結合する頻度または持続時間を使用して、プローブが標的配列に対応するかどうかを判定する。プローブ結合の頻度または持続時間は、プローブが標的配列のすべてまたは一部(残りの塩基が不一致である)に対応するかどうかを決定することもできる。
【0640】
本発明の一部の実施形態では、配列決定は、プローブよりも長い単一の標的ポリヌクレオチド上の複数の場所での複数のオン・オフ結合事象を撮像することによって行われる。一部の実施形態では、単一のポリヌクレオチド上のプローブ結合事象の場所が決定される。一部の実施形態では、単一のポリヌクレオチド上のプローブ結合事象の場所は、標的ポリヌクレオチドを伸長することによって決定され、その長さに沿った異なる場所が検出され、解像され得る。一部の実施形態では、伸長は、表面上で生じる。一部の実施形態では、伸長は、ナノチャネル中で生じる。一部の実施形態では、伸長は、標的の一方または両方の末端が張力下にある場合、流体力学的抗力によって生じる。一部の実施形態では、伸長は、電気泳動力を介して生じ、例えば、標的ポリヌクレオチドの一端が繋がれている、繋留されている、または捕捉されている場合、他端は、溶液またはゲル中で自由にぶら下がっている。
【0641】
一部の実施形態では、標識されたプローブのオン・オフ結合は、結合されていないプローブからのシグナルの拒絶または除去を必要とする。これは、例えば、照明のためにエバネッセント場または波導を使用することによって、または共鳴エネルギー移動(RET、例えば、蛍光またはフォースターRET)を利用することによって、または光活性化を利用することによって、行うことができる(例えば、Biophys J.2015 Feb 17;108(4):949-956に記載されている)。
【0642】
一部の実施形態では、プローブは標識されないが、標的との相互作用は、結合が生じるか、または生じたときに二重鎖に挿入される挿入色素などのDNA染色によって検出される。1つ以上の挿入色素は、二重鎖に挿入され得る。挿入された場合、挿入色素が発する蛍光は、溶液中に遊離している挿入色素による蛍光よりも桁違いに大きくなり得る。例えば、挿入されているYOYO-1色素からのシグナルは、溶液中の遊離したYOYO-1色素からのシグナルよりも約100倍大きい。
【0643】
本発明のこの態様は、軽く染色された(またはある程度の光退色の後)二本鎖ポリヌクレオチドが撮像される場合、単一の挿入色素分子に対応する可能性が高い、ポリヌクレオチドに沿った個々のシグナルが観察され得るという、観察の実施によって最初に動機づけられたものである。二重鎖中のYOYO-1色素の交換を容易にし、明るいシグナルを得るために、結合緩衝液中に、sおよびアスコルビン酸を含む酸化還元系(ROX)が提供され得る。
【0644】
一部の実施形態では、配列決定は、伸長ポリヌクレオチドを、次々に提供されるプローブの完全な配列レパートリーの各々からの一過的な相互作用に供することを含む(1つのプローブ配列を有する溶液が除去され、次のプローブ有する溶液が添加される)。一部の実施形態では、各プローブの結合は、プローブが一過的に結合することを可能にする条件下で行われる。したがって、例えば、1つのプローブに対して25℃、次のプローブに対して30℃で、結合が行われる。また、プローブは、セットで結合することができ、例えば、ほぼ同じ方法で、一過的に結合するすべてのプローブは、セットに集められ、一緒に使用され得る。一部のかかる実施形態では、セットの各プローブ配列は、差次的に標識されるか、または差次的にコード化される。
【0645】
一部の実施形態では、または場合によっては、標的の場所への複数の結合事象は、単一のプローブ配列からではなく、レパートリーからのデータを分析し、部分的に重複する配列から生じる事象を考慮することによって決定される。例えば、同じ場所に(実際には、サブナノメトリック的に近い)、プローブATTAAGおよびTTAAGCが結合している。それらは、6塩基長であり、共通の5塩基配列を共有し、それぞれが他方を検証するとともに、5塩基のいずれかの側で配列が1塩基伸びている。場合によっては、5塩基配列の各側の1塩基は、不一致であり(末端における不一致は、典型的には、内部にある不一致よりも許容されると予想される)、両方の結合事象に存在するのは、5塩基配列のみであることが検証される。
【0646】
一部の実施形態では、シグナルは、挿入色素から、プローブまたは標的配列上の標識へのFRETによって検出される。一部のかかる実施形態では、プローブは、その末端のうちの一方で、Cy3B標識で標識される。一部の実施形態では、標的が固定化された後、すべての標的分子の末端が標識され、例えば、ターミナルトランスフェラーゼによって、FRETパートナーとして作用する蛍光標識ヌクレオチドが組み込まれる。
【0647】
一部の実施形態では、完全な配列レパートリーは使用されず、むしろ、目的の配列の特定のセグメントをカバーする溶液プローブのタイリングアレイが使用される。一部の実施形態では、完全な配列レパートリーは使用されず、むしろ、プローブのパネルが使用され、そのため、複数の場所が、配列特異的に一過的に結合するプローブによって照合される。
【0648】
一部の実施形態では、本発明を実施するために、標的ポリヌクレオチドは一本鎖(例えば、mRNA)であるか、または一本鎖にする必要がある。一部の実施形態では、標的ポリヌクレオチドは二本鎖であり、一過的な結合は、プローブの一過的な鎖侵入に起因する。一部の実施形態では、二本鎖標的は、ニック(例えば、天然またはDNase1処置によって生成される)を含有し、かつ反応条件下で、一方の鎖が、他方から一過的に解れるか、もしくは剥離するか、または天然塩基対のゆらぎが生じ、プローブが天然鎖によって置換される前に一過的に結合することを可能にする。
【0649】
一部の実施形態では、配列は、プローブの各々について収集された一過性データを分析することによって構築される。一部の実施形態では、このようなデータは、2D表面上の結合事象の座標を含み、典型的には、伸長ポリヌクレオチドの経路と相関する。
【0650】
プローブ結合の場所は、各プローブの結合の順序を提供し、これは、連続した配列にコンパイルされ得る。
【0651】
本明細書および特許請求の範囲において、標的ポリヌクレオチドという用語は、単鎖のみが存在する場合と、2つの二重らせん鎖が存在する場合との両方を指す。二本鎖または一本鎖ポリヌクレオチドが単独で意図される場合、それは、本文中に示される。RNAが言及される場合、それは一本鎖であると仮定される。
【0652】
本明細書および特許請求の範囲において、結合または場所が基板上に記録されている場合、かなりの割合の結合が基板上の核酸上で生じていると仮定することができる。
【0653】
ポリヌクレオチドの抽出
様々な実施形態では、本方法は、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または生体材料もしくは流体由来の単一標的ポリヌクレオチド分子を、実質的にインタクトな標的ポリヌクレオチドとして抽出することをさらに含む。様々な実施形態では、標的ポリヌクレオチド分子は、伸長/伸展されている。様々な実施形態では、標的ポリヌクレオチド分子は、表面に固定化される。様々な実施形態では、標的ポリヌクレオチド分子は、ゲル中に配置される(例えば、Shag et al Nature Prototcols 7:467-478(2012)と比較されたい)。様々な実施形態では、標的ポリヌクレオチド分子は、マイクロ流体チャネルおよび/またはナノ流体チャネルに配置される。様々な実施形態では、標的ポリヌクレオチド分子は、インタクトである。
【0654】
様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含む。様々な実施形態では、本方法は、ポリヌクレオチドを、単一細胞からフローチャネルに遊離することをさらに含む。様々な実施形態では、フローチャネルの壁は、ポリヌクレオチドの集積を防止する不動態化を含む。様々な実施形態では、不動態化は、脂質、ポリエチレングリコール(PEG)、カゼインおよび/またはウシ血清アルブミン(BSA)のコーティングを含む。
【0655】
一部の実施形態では、抽出が行われる前に、目的の細胞を、目的ではない他の細胞から分離することが必要である。いくつかの方法が利用可能であり、例えば、循環腫瘍細胞または循環胎児細胞は、それらの表面市場を親和性捕捉に使用することによって、血液から単離される。一部の実施形態では、微生物細胞をヒト細胞から分離することが必要であり、その目的は、微生物細胞由来のポリヌクレオチドを、検出および分析することである。オプソニンは、広範囲の微生物を捕捉し、それらを哺乳動物細胞から分離するために使用することができ、そうして、微生物のポリヌクレオチドが選択的に配列決定され得る。また、差次的溶解を行うことができる。ここで、まず、哺乳動物細胞を溶解するための条件が使用される。微生物細胞(特にマイコバクテリウム)は、哺乳動物細胞を溶解するために使用される条件に対して抵抗性であるため、したがって、インタクトのまま残り、哺乳動物細胞の内容物を洗い流すことによって単離することができる。次いで、より過酷な条件を使用して、微生物細胞からポリヌクレオチドを抽出し、それらを選択的に配列決定する。
【0656】
配列決定
概して、本発明の方法は、
a)標的核酸を提供することと、
b)一過的な結合反応を行って、標的上の第1のセットの配列ビットの場所を得ることと、
c)一過的な結合反応を行って、標的上の第2のセットの配列ビットの場所を得ることと、
d)一過的な結合反応を行って、標的上の第3のセットの配列ビットの場所を得ることと、を含む。
【0657】
一部の実施形態では、複数のオリゴが、決定可能な距離によって、まとめられるか、または分離される。
【0658】
一部の実施形態では、配列ビットが得られる標的は、標的間の配列重複のセグメントに基づいて整列され、より長い「インシリコ」コンティグ、および最終的に染色体全体の配列が生成される。
【0659】
本発明の一部の実施形態では、標的ポリヌクレオチドを、ゲルと接触させる。一部の実施形態では、ゲルとの接触は、標的ポリヌクレオチドを伸長した後に生じる。一部の実施形態では、ゲルとの接触は、標的ポリヌクレオチドを伸長させる前に生じる。
【0660】
一部の実施形態では、一般的に見られる配列が、標的ポリヌクレオチドに使用される。これは、ゲノムで非常に頻繁に生じるいくつかの配列のうちの1つ以上であり得る。この場合、ゲノムの全配列ではなく、ゲノムのフィンガープリントを容易に得ることができる。
【0661】
一部の実施形態では、本発明は、緊密にパックされたポリヌクレオチド、ならびにポリヌクレオチドに沿った配列ビットを超解像することによって得ることができる配列情報の密度を増加させる。
【0662】
一実施形態では、本方法は、
1)DNAの修飾または処理を行わずに、長い鎖長のゲノムDNAを抽出することと、
2)ゲノムDNA分子を、表面に伸展または伸長することと、
3)表面に伸展されたDNAの上を溶液が流れ得るように、フローセルを提供することと(フローセル内で伸展が行われたか、または表面上でフローセルが構築されたかのいずれか)、
4)DNAを変性することと、
5)一過的に結合するプローブを添加することと、
6)例えば、レーザ全内部反射(TIR)照明、焦点検出/保持機構、CCDカメラ、適切な対物レンズ、リレーレンズ、およびミラーを使用して、各場所でどのプローブが結合するのかを検出することと、
7)フローセルが装着されるステージを、ゲノム分子または異なる場所(その第1の位置におけるCCDの視野の外側)に提供される分子の部分が配列決定され得るように、CCDカメラに対して移動させることと、
8)必要に応じて、5~7を反復すること、
9)データを処理することであって、
a)画像を処理すること、
b)配列コール(sequence call)を行うこと、
c)配列コールを、空間場所に結び付けること、
d)どの配列コールの場所がラインに適合するかを判定すること、
e)得られた情報を使用して、配列決定リードをアセンブリして、超連続(super-contiguous)リードを提供すること、
f)アセンブリされたリードを使用して、ゲノムをアセンブリすること、および
g)好ましくはコンピュータまたはスマートフォンタイプのデバイス上のグラフィカルインターフェースを介して、配列リードおよび/またはアセンブリされたゲノムを、ユーザーに提供することを含む、データを処理することと、を含む。
【0663】
複数の細胞からゲノムDNAを抽出することができる場合、分子の多くのコピーが表面に呈示され、同じホモログからの結果が収集され、コンセンサスリードが得られ、ハプロタイプまたは親染色体特異性に従って相同分子が分離される。
【0664】
一部の実施形態では、一過的な結合は、検出手段として記録されるが、位置決定を改善するためには使用されない。場合によっては、分子はまばらに配列され、位置決定を増やす必要はない。しかしながら、光退色に対する堅牢性および非特異的バックグラウンドをフィルタリング除去する能力(永久的に固着したシグナルを処理することができる)により、このアプローチは説得力を持つようになる。
【0665】
一部の実施形態では、プローブは標的に結合したままであるが、一過的な結合標識がオンおよびオフ結合するテールまたはフラップを有する。一部の実施形態では、テールは、非ワトソン-クリック塩基対合する核酸類似体からなる。
【0666】
単一塩基照合
一部の実施形態では、プローブは、定義された1つだけのヌクレオチドに従って標識される。
【0667】
一部の実施形態では、オリゴヌクレオチドは種に分割され、異なるヌクレオチド、ACGTが定義され、各異なるヌクレオチドに対応する各オリゴは、差次的に標識され、任意選択的に、配列決定反応に添加される。
【0668】
一部の実施形態では、オリゴは、差次的に標識されないが、各塩基の種類は、洗浄が以前のヌクレオチドを除去した後に、別々に添加される。
【0669】
一部の実施形態では、比較的短い時間スケール(例えば、1分以上)にわたる結合事象を検出するために、オリゴライブラリのより高い複雑性に対処するために、対応して、1塩基または数塩基のみが定義される、より高い濃度のオリゴが必要である。5塩基が定義されている10nMのオリゴが十分である場合、256倍高い濃度の、1塩基のみが定義されているオリゴが必要である。これは、2.56uMのオリゴヌクレオチドに相当し(一部の実施形態では、不一致などにより、低い濃度で十分である)、表面からの照明の指数関数的に減衰するエバネッセント場が使用される場合でも、表面上のポリヌクレオチド標的上の結合事象を検出することを困難にするレベルのバックグラウンド蛍光をもたらすであろう。バックグラウンド蛍光は、実質的に光散乱に起因するため、一部の実施形態では、それは時間ゲートで除去され得る。一部の実施形態では、溶液中の高濃度のオリゴは、蛍光性ではないが、蛍光生成性であり、クエンチされるか、または直接励起されないが、表面または標的ポリヌクレオチド自体に付着した実体から共鳴エネルギー移動に供される場合にのみ光を放出する機構が用いられる。一部の実施形態では、形成された二重鎖に挿入される色素が励起され、それが結合すると、オリゴ上の蛍光標識にエネルギーを移す。一部の実施形態では、定義されたオリゴライブラリの各々が一度に1つずつ添加され、オリゴには標識が結合しておらず、溶液からの核酸染色剤または挿入色素のみを使用して、結合事象が標識される。
【0670】
一部の実施形態では、オリゴヌクレオチドにおいて、1塩基のみが定義され、残りの位置が縮重している場合、4つの可能な定義された塩基であるA、C、G、またはTに対して、4回以下の試薬交換サイクルのみが必要である。一部の実施形態では、塩基の各々は、別個の標識によってコードされ、4つすべての標識を同時に検出する手段がある場合、試薬交換は必要でない。このような均一またはワンポット配列決定反応が実施される場合、機器は非常に単純で、本質的に顕微鏡であり、試薬交換を必要としない。例えば、適切な緩衝液中のオリゴ混合物(オリゴヌクレオチドプローブ種の混合物)を、標的ポリヌクレオチドが位置するカバーガラスの上に、ほんの一滴加え、次いで、結合事象を十分長い時間観察して、1つ以上の結合事象で配列全体をカバーする。この均一反応は、数時間実行され、蒸発に対して密封される。十分に多い量が使用される場合、溶液の大部分からの拡散による試薬交換を促進することによって、表面近くで生じ得る試薬の枯渇を克服することができる(例えば、これは、乱流またはカオス混合によって増強することができる)。代替的に、目的が異なるオリゴミックスを添加することではなく、単に枯渇した試薬を交換することである場合、試薬交換を行う。
【0671】
一部のかかる実施形態では、標的ポリヌクレオチドを、伸長または伸展させて、結合事象の場所、したがって、ポリヌクレオチドの長さに沿ったヌクレオチドの場所を決定できるようにする。一部のかかる実施形態では、ポリヌクレオチドは、一本鎖であり、そのため、オリゴが結合する鎖に関して曖昧さがない。これは、この一塩基照合(single-nucleotide interrogation)アプローチが、変性二重らせんポリヌクレオチドのどちらの鎖で個々の結合事象が生じるのかを逆折り畳みするために、タイリング経路を構築する無駄(luxury)がないため、有用である。一塩基照合アプローチを一本鎖に適用することができるいくつかの例がある。まず、ほとんどの場合、RNAは天然では一本鎖である。他の場合、二本鎖核酸を一本鎖にすることができ、さらなる場合、二重らせんの片方の鎖を複製して、一本鎖を作ることができ、例えば、核酸を環状化し、ローリングサークル増幅を介して反復的に複製することができる。
【0672】
一部のかかる実施形態では、ドリフトを回避する強い必要性があり、各結合事象は単一塩基の情報のみを提供するため、配列の重複ビットによって形成されるタイリング経路は、配列中のヌクレオチドの配置を容易にする完全なデータセットから抽出することができない。必要な精度を得るために、振動や熱ドリフトの点で極めて安定したシステムを使用している。そのような安定したシステムの1つは、オリンパスのIX81倒立レーザTIRF顕微鏡で使用することができるIX2 Nosepieceステージである。一部の実施形態では、追加または代替として、ドリフト補正機構が使用され、ドリフト補正のための非常に効果的な手段は、DNA折り紙などの基準マーカーを使用し、データを反復的にドリフト補正して正確で高精度な超解像画像を生成するために、複数ラウンドの処理を行うことである。DNA折り紙は、当業者によって、構造内の非常に規則正しく正確に設けられた位置に、蛍光標識用の複数の結合部位を有するように設計されている。例えば、Daiら(Nature Nanotechnology 2016,11:798-807、参照により本明細書に援用される)に記載されている種類のDNA折り紙を使用することができ、例えば、12または16ポイントグリッドを含む。折り紙は、DNA PAINT機構によって標識され、一本鎖ドッキング部位がグリッドの上面から突出し、蛍光標識された撮像剤によって一過的に結合されている。結合部位は、4つの異なる標識で標識された撮像剤に対して、グリッド上に提供され、標識は、4つの一塩基定義オリゴライブラリを特異的に標識するために使用される。一部の実施形態では、折り紙グリッドに結合する撮像剤は、配列決定反応のワトソン-クリック結合系よりも直交的な結合系を有するように設計される。そのような直交系は、例えば、Firebird Biomolecular Sciences LLC(www.firebirdbio.com)から入手可能な人工的に拡張された遺伝情報システム(AEGIS)ホスホロアミダイト試薬を使用した拡張アルファベット核酸塩基対システムである。本システムは、本発明の配列決定システムで使用されるワトソン・クリックA:TおよびG:C塩基対に直交的な、Z:PおよびS:B塩基対を提供する。
【0673】
一部の実施形態では、オリゴ(例えば、3塩基長が定義されているオリゴ)を、低温または高塩で結合させることができ、これにより、多数の部位(そのいくつかは解像可能ではない)が結合できるようになる。一部の実施形態では、結合の場所を特定するために、蛍光標識を退色させ、各々の正確な場所が単一分子局在化によって決定され得るようにする。例えば、Neely et al Nucleic Acids Res.2014 Apr;42(7):e50および米国特許出願第13/701,628号(2012年12月3日出願、参照により本明細書に援用される)を参照されたい。この非一過的な結合アプローチでは、1つのオリゴの結合が、重複するオリゴの結合を妨げ得る可能性がある。これに対処するため、複数のサイクルが使用される。第1のセットの結合したオリゴは、温度および/または化学的変性によって融解され、次いで、結合が再び開始され、第1のサイクルでブロックされた場所が第2のサイクルで結合することができるなどの可能性を可能にする。これは、任意選択的に、より多くのサイクルで繰り返され、より多くの以前にブロックされた部位が結合することを可能にする。同様に、一部の実施形態では、結合は、確率的光学再構築顕微鏡(STORM、例えば、(参照により本明細書に援用される)米国特許第7,776,613号および米国特許第10,073,035号に記載されている)によって検出され、フルオロフォアシグナルのうちのいくつかのみを任意の時点でオンにする。一部の実施形態では、これは、配列を最大限にカバーするために複数回繰り返される。
【0674】
結合速度は、オリゴ濃度を増加させること、結合温度を増加させること、ならびに/または塩および体積排除剤(volume excluding agent)の同一性および濃度を変化させることによって増加させることができる。一部の実施形態では、体積排除剤は、ヒドロキシプロピルメチルセルロース(HPMC)、ヒドロキシエチルメチルセルロース(HEMC)、ヒドロキシブチルメチルセルロース、ヒドロキシプロピルセルロース、メチルセルロース、およびヒドロキシルメチルセルロースからなる群から選択され、PEG-800は、約0.002重量%~約15重量%の範囲の濃度である。加えて、100~600mM濃度のMgCl2などの二価カチオンは、結合速度に加速効果を有する。
【0675】
一部の実施形態では、結合の速度を増加させる追加の手段は、流れの存在下で測定値を得ることによるものである。したがって、最大50ulのフローセル体積では、1分間当たり1μlの流速は結合速度を増加させることができる。一部の実施形態では、流れは、乱流である。一部の実施形態では、乱流は、表面から出ているロッドまたは隆起の存在、フローセルの上面のヘリンボーンパターン、または流れを乱流にする溶液中のビーズまたは微細構造の存在によって誘発される。結合速度を増加させることに加えて、フロープロセスを最適化することもまた、試薬交換の有効性を増加させ、以前のサイクルからの残留オリゴが最小限にとどまることを確実にする。一部の実施形態では、1つのオリゴ種から次のオリゴ種への交換プロセス中、きれいな緩衝液を用いた1回以上の洗浄が必要であり、洗浄中に、オリゴプローブが表面から拡散し、平衡濃度に到達するのに時間が必要である。一部の実施形態では、時間は1分であり、他の実施形態では、時間は10分である。一部の実施形態では、10~100容量の緩衝液を、フローセルに通して、残留オリゴの除去を確実にする。一部の実施形態では、TIRF範囲外でのプローブの移動が、例えば、ver帯電したオリゴを正のバイアス電極に移動させる電場を印加することによって促進されるため、時間が低減される。様々なプロセス:時間、乱流、交換される緩衝液の量、および電場のうちの1つ以上を組み合わせることができる。一部の実施形態では、ある程度の残留オリゴは許容される。それは、前のオリゴの同一性が既知であり、アセンブリアルゴリズムが、それらの微量な存在を考慮することができるためである。
【0676】
一部の実施形態では、縮重位置は使用されず、オリゴヌクレオチドの所望の安定性は、条件(例えば、低温、高塩)を適切に操作することによって得られるか、もしくはそれ自体が十分に安定している(例えば、ガンマPNAなど)オリゴ化学を使用することによって得られるか、またはスペルミンもしくはスチルベンなどのコンジュゲートを末端に付加して、短いオリゴヌクレオチドの安定性を増加させる。
【0677】
一部の実施形態では、ハイブリダイゼーションは、定義されていない位置にあるすべての可能な配列を含むオリゴヌクレオチドのライブラリを使用するよりも、縮重でニトロインドールまたはデオキシイノシンなどの普遍的塩基を使用することによって改善され得る。これらの普遍的塩基は、様々なベンダーから購入されるオリゴの配列に沿った位置で指定することができる。一部の実施形態では、いくつかの位置は、ヌクレオチドのライブラリによって占有され、他の位置は、普遍的塩基によって占有される。普遍的塩基は、混合物の複雑度を低減するために、より低い濃度のオリゴプローブを用いることができる。
【0678】
使用されるオリゴの複雑度をコードする1つの塩基が高いため、使用されるオリゴライブラリの濃度を増やす必要があり、そのため、10nMの濃度の代わりに、1uM以上の濃度を使用する必要があり、これが大きなバックグラウンドを生み出すため、一部の実施形態では、挿入色素などからのFRET機構が使用され、挿入標識スキーム(FRETなし)またはオリゴは、ハイブリダイゼーションが起こると蛍光を発する蛍光発生性標識で標識される。
【0679】
一部の実施形態では、2つの定義された塩基で、64個のすべての可能なオリゴが同時に添加され、差次的に標識される。一部の実施形態では、16個の差次的な標識が利用可能であり、そのため、64個のライブラリは、4つの16個のライブラリに分割される。したがって、4サイクルだけで配列決定が終了する。他の実施形態では、4個の標識を使用して、4個のオリゴを一緒に添加することを可能にし、16サイクル行うことが必要になる。これらの3塩基長のハイブリダイゼーションは、4×SSC、または2.4MのTMAClまたは3.5MのTMACl、LiTCA、GUCNを含む緩衝液中で行うことができる。これらは、不一致をより良好に識別し、かつ/または塩基組成物の影響を均等化する役割を果たし得る。
【0680】
時間解像度の向上。
一部の実施形態では、一過的な結合プロセスは、塩濃度などの様々な生化学パラメータを調整することによって高速化することができる。高フレームレートのカメラがいくつか存在し、それを、結合の速度を一致させるために使用することができ、多くの場合、視野を制限して、画素のサブセットからより高速な読み出しを得ている。1つの代替的なアプローチは、ガルボノメータミラーを使用して、単一のセンサーの異なる領域に連続したシグナルを時間的に分散させるか、またはセンサーを分離することであり、後者は、センサーの完全な視野を利用することができるが、分散されたシグナルがコンパイルされる場合、全体的な時間解像度が増加する。回折限界スポット内の複数のシグナルの画像処理事例中に拒否することができるため、プロセスをより高速で実行することができ、プローブの高い結合速度に対処することができる。
【0681】
DNA光損傷の回避
一部の実施形態では、タンパク質を介してオリゴヌクレオチドに結合した蛍光部分を有し、配列決定される核酸に対する光損傷の影響を低減することが好都合である。一部の実施形態では、タンパク質部分の影響は、蛍光標識の様々な悪影響から、オリゴおよび標的配列に対して保護を提供することである。酸化的損傷などのこれらの悪影響のいくつかは、還元剤またはレドックス系などの反応溶液中に添加剤を含めることによって克服することができる。しかしながら、電子伝達またはトンネル効果などの他の有害な機構は、添加剤によって防止されない場合がある。一部の実施形態では、還元剤またはレドックス系は、オリゴに物理的に連結されている。一部の実施形態では、タンパク質は、ストレプトアビジンである。ストレプトアビジンの蛍光標識バージョンは、例えば、FRETによる波長シフトをもたらす別の色素にコンジュゲートされたストレプトアビジン-フィコエリトリンを含むストレプトアビジン-フィコエリトリンが入手可能である。次いで、ストレプトアビジンはまた、周知のビオチン-ストレプトアビジン相互作用によって1つ以上のビオチン化オリゴヌクレオチドに結合する。様々な密接に関連するタンパク質、アビジン、ニュートラアビジンも使用することができる。ストレプトアビジンは、結合している複数の色素を有する。他の好適なタンパク質としては、ユビキチンおよびSNAP-タグタンパク質が挙げられる。タンパク質以外の分子も、それらが経験的に損傷を防ぐように蛍光色素の周囲に遮蔽を提供し得ることが見出されているならば、使用することができる。
【0682】
したがって、一部の実施形態では、配列決定試薬は、タンパク質上の第1の位置に結合した一過的に結合するヌクレオチド/オリゴヌクレオチドと、タンパク質上の第2の位置に結合した少なくとも1つの蛍光色素部分を含む色素成分とを含む。
【0683】
単一細胞解像配列決定
様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含む。一部の実施形態では、単一細胞は、他の細胞との結合を含まない。一部の実施形態では、単一細胞は、クラスター中または組織中で、他の細胞に付着している。一部の実施形態では、そのような細胞は、個々の非付着細胞に脱凝集される。
【0684】
一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法を含み、本方法は、以下のステップ:
i)1つ以上の細胞をフローセルに導入することと、
ii)細胞を処理して、ポリヌクレオチドを遊離することと、
iii)遊離されたポリヌクレオチドを、フローセル内で伸長することと、
iv)伸長されたポリヌクレオチドを、鋳型/配列決定標的として用いて、配列決定反応を行うことと、を含む。
【0685】
一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法を含み、本方法は、以下のステップ:
i)1つ以上の細胞を、マイクロコンテナ(micro-container)に導入することと、
ii)細胞を処理して、ポリヌクレオチドを遊離することと、
iii)容器の内容物を、フローセル内に遊離することと、
iv)ポリヌクレオチドを伸長させることと、
v)当該伸長されたポリヌクレオチドを、鋳型として使用して、配列決定反応を行うことと、を含む。
【0686】
一部の実施形態では、ポリヌクレオチドを配列決定するための方法が提供され、本方法は、以下のステップ:
i)細胞を、フローセルに曝露することであって、フローセルが、入口および出口を含む、曝露することと、
ii)当該細胞から、ポリヌクレオチドを抽出することと、
iii)当該ポリヌクレオチドの少なくとも一部分が、個別に解像可能であるように、当該ポリヌクレオチドを、当該フローセルの表面に付着させることと、
iv)オリゴを、当該ポリヌクレオチドに曝露することと、
v)当該ポリヌクレオチド上のオリゴの結合場所を、識別することと、を含む。
【0687】
一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造(例えば、フローセルまたはマイクロウェル)の入口に、流体的に移される(例えば、ピペットを使用することによって)。脱凝集は、細胞をピペッティングすることによって、プロテアーゼ、超音波処理、または物理的撹拌を適用することによって行うことができる。一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造に、流体的に移される。
【0688】
一部の実施形態では、単一細胞が単離され、ポリヌクレオチドが単一細胞から遊離され、その結果、同じ細胞に由来するすべてのポリヌクレオチドが互いに近接したまま配置され、かつ他の細胞の内容物が配置される場所とは異なる場所に配置される。一部の実施形態では、Lab Chip,2006,6,1445-1449に記載されている捕捉構造が使用される。
【0689】
一部の実施形態では、単一細胞が捕捉され、内容物が遊離され、次いで伸長される。一部の実施形態では、単一細胞は、個々のチャネルに破裂され、各個々の細胞を、トランスポザーゼ媒介の組み込みを介して固有のタグ配列と反応させ、その後、ポリヌクレオチドが組み合わされ、同じ混合物中で配列決定される。トランスポザーゼ複合体は、細胞にトランスフェクトされるか、または細胞を含む液滴に融合される液滴中にある。
【0690】
一部の実施形態では、凝集体は、細胞の小さなクラスターであり、一部の実施形態では、クラスター全体が、同じ配列決定タグでタグ付けされる。一部の実施形態では、細胞は凝集しておらず、循環腫瘍細胞(CTC)または循環胎児細胞などの遊離した浮遊細胞である。
【0691】
単一細胞配列決定において、細胞溶解後の自発的なシトシン脱アミノ化によって引き起こされるシトシンからチミンへの一塩基バリアントの問題が存在する。これは、配列決定の前に、試料をウラシルN-グリコシラーゼ(UNG)で前処理することによって克服される。(例えば、Mol Diagn Ther.2014 Oct;18(5):587-593に記載されている)
【0692】
ポリヌクレオチドの細胞特異的インデックス付け
様々な実施形態では、本方法は、複数の細胞(または核)由来のポリヌクレオチドを配列決定することにさらに適用され、各ポリヌクレオチドは、その起源の細胞の情報を保持する。
【0693】
特定の実施形態では、トランスポゾン媒介性の挿入は、細胞内で生じ、各挿入は、起源の細胞の標識としての固有のID配列タグを含む。他の実施形態では、トランスポゾン媒介性の挿入は、単一細胞が単離された容器(例えば、アガロースビーズ、油-水滴などを含む容器)内で生じる。固有のタグは、タグを有するすべてのポリヌクレオチドが同じ細胞に由来しなければならないことを示す。次いで、すべてのゲノムDNAおよび/またはRNAが抽出され、混合され、伸長され得る。次いで、SbS(または任意の他の配列決定方法)がPBSまたはプロモーターに由来する場合、それが得る第1の配列は、細胞識別配列由来であり、続いてポリヌクレオチドの配列である。細胞識別タグを、短く保つことが好ましい。10,000個の細胞について(例えば、腫瘍微量剖検から)、約65,000個の固有配列は、8ヌクレオチド長の識別子配列によって提供され得、約100万個の固有配列は、10ヌクレオチド長の識別子配列によって提供され得る。
【0694】
この同じインデックス化の原理は、その目的が、試料を混合し、それらを一緒に配列決定することだけではなく、各個々の試料に関する配列情報を回収することである場合、細胞以外の(例えば、異なる個体由来の)試料に適用され得る。
【0695】
したがって、一部の実施形態では、本方法は、
1)細胞の内容物を単離することと、
2)トランスポゾン媒介性の挿入を行い、細胞の固有配列タグを、細胞のポリヌクレオチドに挿入することと、
3)細胞のポリヌクレオチドを、固定することと、
4)タグの配列およびポリヌクレオチドの配列の読み取りを包含する、本発明の配列決定方法を実施することと、を含む。
【0696】
一部の実施形態では、ポリヌクレオチドはRNAであり、cDNAコピーが配列決定される。かかる実施形態では、タグの付加は、タグ配列を含むプライマーを用いたcDNA合成を含み得る。
【0697】
一部の実施形態では、配列の量を短く保つように維持することで、より多くの配列リードが、ポリヌクレオチド配列の配列決定自体に寄与し得るようにするために、タグ配列が、いくつかの部位にわたって分配される。ここで、複数の短い識別子配列が、例えば、3つ、各細胞または容器に導入される。次に、ポリヌクレオチドに沿って分布するタグのビットから、ポリヌクレオチドの起点を決定する。したがって、この場合、1つの場所から読み出されるタグのビットは、起源の細胞を決定するのに十分ではない可能性があるが、複数のタグビットの決定を行うには十分である。
【0698】
複数の方法による配列決定
一部の実施形態では、一過的な結合による配列決定の後、第2の方法による配列決定が、同じ分子上で開始され得る。例えば、より長いより安定なオリゴヌクレオチドが結合して、合成による配列決定を開始することができる。
【0699】
標的ポリヌクレオチド
ポリヌクレオチドという用語は、DNA、RNA、およびそれらのバリアントまたは模倣体を指し、核酸と同義的に使用され得る。単一標的ポリヌクレオチドは、1つの核酸鎖である。核酸鎖は、二本鎖であるか、または一本鎖である。ポリマーは、長鎖非コード(lnc)RNA、mRNA、染色体、ミトコンドリアDNAなどの完全長の天然ポリヌクレオチドを含み得るか、またはそれは、少なくとも200塩基長のポリヌクレオチド断片であるが、好ましくは、少なくとも数千ヌクレオチド長であり、ゲノムDNAの場合、より好ましくは、数百キロ塩基長~数メガ塩基長である。
【0700】
様々な態様および実施形態では、本発明は、例えば、生物学的環境からの抽出中にポリヌクレオチドの実質的に天然の長さを保存することによって、長い鎖長のポリヌクレオチドを得ることと、ポリヌクレオチドの長さに沿った場所をほとんどまたはまったく曖昧さなく追跡することができるように、ポリヌクレオチドを線状の状態で配置し、理想的には、ポリヌクレオチドが直線化、伸展、または伸長されることと、線状の状態で標的ポリヌクレオチドを配置する前または配置した後に、を含む。
【0701】
様々な実施形態では、単一標的ポリヌクレオチドは、染色体である。様々な実施形態では、単一標的ポリヌクレオチドは、約102、103、104、105、106、107、108、または109塩基長である。コムギの染色体3bは、9億9500万塩基長であり、一方、ヒトで最大の1番染色体は、2億4900万塩基である。様々な実施形態では、単一標的ポリヌクレオチドは、一本鎖である。様々な実施形態では、単一標的ポリヌクレオチドは、二本鎖である。
【0702】
単一標的ヌクレオチドは、好ましくは、天然ポリヌクレオチドである。単一標的ヌクレオチドは、ゲノムDNAなどの二本鎖であり得る。単一標的ポリヌクレオチドは、mRNAなどの一本鎖であり得る。単一の二本鎖標的ポリヌクレオチドは、二重鎖の各鎖がオリゴによる結合に利用可能であるように、変性され得る。単一ポリヌクレオチドは、損傷され、修復される。様々な実施形態では、単一標的ポリヌクレオチドは、染色体のDNAの全長である。染色体のDNAの全長は、抽出することなく細胞内に留まることができる。配列決定は、染色体DNAが間期に畳み込み経路をたどる細胞内で行うことができる。インサイツでのオリゴの安定した結合が実証されている:B.Beliveau,A et al Nature Communications 6 7147(2015)。そのようなインサイツでの結合オリゴおよび3D空間におけるそれらのナノメトリック位置決定は、細胞内の染色体分子の配列および領域配置を決定することを可能にすることができる。本発明は、オリゴの結合が安定しておらず、一過性であり、染色体領域の超微細解像度を可能にするという点で異なる。同様に、RNA(例えば、マイクロRNA、mRNA、lncRNA)の場所および量は、それらの結合オリゴへの結合パターンによって決定することができる。
【0703】
感度の限界への到達
分子が細胞から遊離されると、実質的にすべての分子が配列決定に利用可能になる。まず、関連する場合、分子が付着するのを防ぐために、領域を不動態化する。次に、実質的にすべての分子は、2つの方法のうちの1つで捕捉される。初めて、分子はチャネル内を流れ続け、チャネルの長さにわたって確率的に捕捉され、これは実質的にすべての分子が最終的に捕捉されるのに十分な長さである。このため、チャネルは、蛇行したチャネルであり得、小さなスペースに、非常に長い長さを詰め込むことができる。第二に、1つ以上の細胞から遊離されるすべての分子を、3D空間で個別に解像可能なように、十分に流動および分離させる。次いで、溶液をゼリー化する。すなわち、固体-ゲル転移であり、そのため、分子は3D空間に固定化されるようになる。次いで、分子を本発明の配列決定方法に供することができ、3D空間は、光シート顕微鏡法または回転ディスク顕微鏡法および3D単一分子局在化などの3D切片化法によって調べることができる。
【0704】
表面でのポリヌクレオチドの捕捉
一部の実施形態では、標的ポリヌクレオチドは、その末端との疎水性相互作用を介して、表面に付着される。一部の実施形態では、ポリヌクレオチドと表面との接触は、末端が解れ、疎水性の一本鎖が曝露されるようにする厳密な条件下で行われる。
【0705】
一部の実施形態では、フローセルを使用して、後退メニスカスを介して伸展を生成するか、またはフロー伸展を行うよりもむしろ、カバーガラスを、ポリヌクレオチドを有するトラフに浸漬し、溶液からカバーガラスを引き抜く際に、ポリヌクレオチドがコーミングされる。
【0706】
一部の実施形態では、電場を使用して、負に帯電したポリヌクレオチド(より大きな割合の試料が、サンプリングされ得るように)を、場合によっては、オリゴプローブを、表面に引き寄せることができる。
【0707】
表面でのポリヌクレオチドの固定
一端を固定化し、流動させることで、揺動、伸展および収縮などが可能になる。ポリマーの長さに沿った伸展の程度の変動(収縮および拡張)により、x-y座標は、あるサイクルと次のサイクルとの間の標的の特定の位置を保証することができない。
【0708】
一部の実施形態では、再現性のある、高い精度および正確な位置決定を得るために、ポリマーに沿った複数の場所の相対位置が変動を受けないことが望ましい。このような場合、伸長された分子は、その長さに沿った複数の接触点によって、表面に固定化または固定される必要がある。
【0709】
したがって、一部の実施形態では、ポリマーは、複数の相互作用によって表面に接触する(分子コーミング技術で行われる(Michalet et al,Science 1999))。次いで、使用条件下で、相対場所が固定されることが知られている。このような事例を見たことはないが、一部が表面から外れて、再び付着するような外れ値があることを考慮する。
【0710】
したがって、一部の実施形態では、長いポリマーが分析され、長いポリマーは、表面またはマトリックスと複数の相互作用を形成する。
【0711】
一部の態様では、本発明は、単一分子上の各塩基を複数回照合することを含む、希少バリアントの検出方法を含む。各一過的な結合事象は、1つ以上の塩基を照合し、各塩基は、複数の結合事象によって照合される。さらに、一部の実施形態では、各塩基は、配列が重複する複数のオリゴヌクレオチドによって(例えば、タイリングシリーズとして)、照合される。
【0712】
ポリヌクレオチド伸長
様々な実施形態では、本方法は、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または体液由来の単一標的ポリヌクレオチド分子を、インタクトな標的ポリヌクレオチドとして抽出することをさらに含む。標的ポリヌクレオチドは、しばしば天然の折り畳まれた状態を占める。例えば、ゲノムDNAは、染色体において高度に凝縮されているが、RNAは、二次構造を形成する。本発明の様々な実施形態では、ポリヌクレオチドを展開するためのステップが取られる。様々な実施形態では、標的ポリヌクレオチド分子は、その骨格を追跡することができるように、線状の状態で提供される。様々な実施形態では、標的ポリヌクレオチド分子は、伸長されている。かかる伸長により、結晶学的距離(ある塩基から次の塩基への0.34nmの分離)と等しく、それよりも長く、またはそれよりも短くなり得る。一部の実施形態では、ポリヌクレオチドは、結晶学的距離を超えて伸展される。
【0713】
様々な実施形態では、標的ポリヌクレオチドは、ゲルまたはマトリックス中に配置される。様々な実施形態では、標的ポリヌクレオチドは、ゲルまたはマトリックス中に抽出される。様々な実施形態では、標的ポリヌクレオチドは、マイクロ流体フローセルまたはチャネル内で抽出される。
【0714】
様々な実施形態では、標的ポリヌクレオチド分子は、表面に固定化される。ポリヌクレオチドは、平面に対して平行に、または表面に対して垂直に配置され得る。それらが平面に対して平行である場合、それらの長さは、CMOSまたはCCDカメラなどの2Dアレイ検出器内の隣接する一連の画素にわたって撮像することができる。それらが表面に対して垂直である場合、それらの長さは、光シート顕微鏡または走査ディスク共焦点顕微鏡またはそのバリアントを介して撮像することができる。
【0715】
一部の実施形態では、ポリヌクレオチドは、分子コーミングを介して伸展される(例えば、Michalet et al,Science 277:1518(1997)およびDeen et al,ACS Nano 9:809-816(2015)に記載されている)。これは、数百万および数十億の分子を並列に伸展および一方向に整列させることを可能にし得る。一部の実施形態では、分子コーミングは、表面上の流体/液体の前面を移動させることによって行われる。一部の実施形態では、分子コーミングは、Petit et al.Nano Letters 3:1141-1146(2003)に記載されている方法または方法の修正バージョンを使用して、チャネル中で行われる。
【0716】
気液界面の形状は、伸長ポリヌクレオチドの配向を決定する。一部の実施形態では、ポリヌクレオチドは、気液界面に対して垂直に伸長される。一部の実施形態では、標的ポリヌクレオチドは、その末端の一方または両方の修飾なしで、表面に付着される。一部の実施形態では、末端が疎水性相互作用によって捕捉され、後退メニスカスによる伸展は、二重鎖の部分を変性させ、表面とのさらなる疎水性相互作用をもたらす。
【0717】
一部の実施形態では、ポリヌクレオチドは、分子スレッディングを介して伸展される(例えば、Payne et al,PLoS ONE 8(7):e69058(2013)に記載されている)。一部の実施形態では、分子スレッディングは、標的が(例えば、化学変性剤、温度、または酵素によって)一本鎖化された後に行われる。一部の実施形態では、ポリヌクレオチドは、一端で繋がれ、次いで、流体の流れの中で伸展される(例えば、Greene et al,Methods in Enzymology,327:293-315に記載されている)。一部の実施形態では、ポリヌクレオチドは、一端で繋がれ、次いで電場によって伸展される(例えば、Giese et al Nature Biotechnology 26:317-325(2008)に記載されている)。
【0718】
様々な実施形態では、標的ポリヌクレオチド分子は、ゲル中に配置される。様々な実施形態では、標的ポリヌクレオチド分子は、マイクロ流体チャネルに配置される。様々な実施形態では、標的ポリヌクレオチドは、一端で表面に付着し、流れの内で伸長される。
【0719】
一部の実施形態では、伸展は、電気泳動によるものである。一部の実施形態では、伸展は、ナノ束縛によるものである。一部の実施形態では、伸展は、流体力学的抗力によるものである。一部の実施形態では、ポリヌクレオチドは、クロスフローナノスリット内で伸展される(例えば、Marie et al.Proc Natl Acad Sci U S A.110:4893-8(2013)によって記載される)。
【0720】
一部の実施形態では、マイクロ流体またはナノ流体フローセルを介してポリヌクレオチドをナノチャネルに挿入するのではなく、チャネルの壁が形成される表面を電気的に印加するような方法でチャネルを構築することによって、ポリヌクレオチドをオープントップチャネルに挿入する(例えば、Asanov A N,Wilson W W,Oldham P B.Anal Chem.1998 Mar.15;70(6):1156-6を参照されたい)。負に帯電したポリヌクレオチドがナノチャネル内に引き寄せられるように、正のバイアスが表面に印加される。チャネル壁の稜はバイアスを含まないため、ポリヌクレオチドがそこに沈着する可能性が低く、耐汚染性の特徴を有し、かつ脂質、BSA、カエシン、PEGなどで不動態化されている材料を用いて作製またはコーティングすることができる。一部の実施形態では、ナノチャネルに引き寄せられるポリヌクレオチドは、チャネル内でナノ束縛され、それによって、伸長される。一部の実施形態では、ナノ束縛後、ポリヌクレオチドは、バイアス表面上、または表面上のコーティングもしくはマトリックス上に沈着する。表面は、酸化インジウムスズ(ITO)を含み得る。
【0721】
一部の実施形態では、ポリヌクレオチドは、すべてが同じ方向にうまく整列されるわけではないか、またはそれらは直線状ではなく、むしろ2Dまたは3D空間にわたって曲線状の経路をとり、直線状にうまく整列された分子と同じ種類の情報を得ることができるが、画像処理タスクはより困難であり、異なる方向をとる分子の場合、それらが重複する可能性が高くなり、エラーにつながる。しかしながら、これは、配列決定が、細胞内で、インサイツで、ポリヌクレオチド上で行われる場合、必要悪である。
【0722】
様々な実施形態では、本方法は、ポリヌクレオチドを、単一もしくは複数の染色体、エキソソーム、核、または細胞から、フローチャネルに遊離することをさらに含む。
【0723】
様々な実施形態では、フローチャネルの壁は、ポリヌクレオチドの集積を防止する不動態化を含む。様々な実施形態では、不動態化は、カゼイン、PEG、脂質、またはウシ血清アルブミン(BSA)のコーティングを含む。
【0724】
伸長された、拡張された、伸展された、線状化された、直線化された、という用語は、互換的に使用することができ、一般に、複数の結合部位が、それらが離れているヌクレオチドの数と多かれ少なかれ相関する物理的距離によって分離されていることを意味する。物理的距離がいくつかの塩基と一致する程度の幾分の不確かさは、許容され得る。伸長または伸展が、ポリヌクレオチドの全長に沿って均一でない場合、物理的距離は、ポリヌクレオチドの全長にわたる同じ比を有する塩基の数と相関しない。これは、無視できる程度に起こり得、アルゴリズムによって効果的に無視または処理され得る。これがかなりの程度発生した場合、他の措置が必要である。例えば、ポリヌクレオチドのいくつかのセグメントでは、伸展は、結晶学的距離の90%であり、他の領域では、約50%発散し得る。それを処理する1つの方法は、アセンブリアルゴリズムを介して、連続した配列をまとめる行うことである。ある極端な例では、アルゴリズムは距離データを必要とせず、リードの順序のみを必要とする。これを処理する別の方法は、JOJO-1またはYOYO-1などの挿入色素を使用して、ポリヌクレオチドの長さを染色することであり、次いで、ポリヌクレオチドが特定のセグメントであまり伸展されていない場合、より伸展されているセグメントと比較して、より多くの色素シグナルがポリヌクレオチドのセグメント上で見られるであろう。統合された色素シグナルは、原点間の距離を計算するための方程式の一部として使用することができる。
【0725】
様々な実施形態では、標的ポリヌクレオチド分子は、インタクトである。標的が天然ゲノムDNAである場合、オリゴヌクレオチドが結合する前に、それを一本鎖にすることができる。これは、最初に、添加されたポリヌクレオチドを伸長または伸展し、次いで、変性溶液(例えば、0.5Mまたは1MのNaOH)を添加して、2つの鎖を分離することによって、行うことができる。オリゴは、より高度に安定した二重鎖を形成することができるように、修飾され得る。オリゴは、遊離3’末端を有し、そこから伸長が生じて、安定性を増大させ得る。一部の実施形態では、オリゴは、ゲノムの特異的超頻繁標的部位を標的化し得る(例えば、Liu et al BMC Genomics 9:509 2008に記載されている)。
【0726】
オリゴは、ライブラリを含み得、カスタムマイクロアレイ合成を使用して作製される。マイクロアレイ作製ライブラリは、ゲノムの特定の部位(例えば、がんパネルなどの特定の疾患のすべてのエキソンまたはパネル)を標的とするオリゴを含むことができる。マイクロアレイ作製ライブラリは、ポリヌクレオチドにわたって一定の距離間隔で場所に系統的に結合するオリゴを含むことができる。例えば、100万個のオリゴを含むライブラリは、3000塩基ごとに結合する。1000万個のオリゴを含むライブラリは、300塩基ごとに結合するように設計することができ、3000万個のオリゴを含むライブラリは、100塩基ごとに結合するように設計することができる。オリゴの配列は、参照ゲノム配列に基づいて、計算的に設計することができる。例えば、オリゴが1000塩基ごとに結合するように設計されているが、1回または数ラウンドのヌクレオチド組み込み後、距離が発散することが明らかになる場合、参照と比較して構造多型が生じていることを示す。オリゴのセットは、まず、それらを使用して、参照自体からのポリヌクレオチドの配列決定を起源とすることによって検証することができ、適切な場所への結合に失敗したオリゴは、将来のライブラリから省略することができる。
【0727】
ポリヌクレオチドに沿った緊密に間隔を置いたシグナルの検出
走査型プローブ顕微鏡法(高速AFMを含む)および電子顕微鏡法などのいくつかの検出方法は、ポリヌクレオチド分子が検出面で伸長されたときに、ナノメトリック距離を解像することができる。さらに、STED、確率的光学再構築顕微鏡法(STORM)、超解像光学ゆらぎ撮像法(SOFI)、単一分子局在顕微鏡法(SMLM)などの超解像光学法は、そのような距離を解像することが可能である。これらの方法を包含するが、本発明は、特に、ナノスケールトポグラフィーのための点集積(PAINT)に最も類似したSMLMアプローチを利用する。
【0728】
本発明は、単に単一の結合位置を短いDNA標的に位置決定することに留まらない。本発明の新規の態様は、ポリヌクレオチドの長さに沿って単一のオリゴ種の複数の結合位置を位置決定することである。本発明の別の新規の態様は、ポリヌクレオチド上の複数のオリゴヌクレオチド種の結合を位置決定することである。本発明の別の新規の態様は、単一のオリゴヌクレオチド種または複数のオリゴヌクレオチド種の結合位置間の距離を決定することである。本発明の別の新規の態様は、ポリヌクレオチドに沿った複数の結合位置のナノメトリック場所を決定することである。本発明の別の新規の態様は、ポリヌクレオチドのアレイに存在する特定のポリヌクレオチドに、プローブ結合事象を割り当てることである。本発明の別の新規の態様は、ポリヌクレオチドに沿った、複数の種類の化学実体(例えば、配列結合プローブ、エピゲノムマーク結合プローブ)の複数の結合位置のナノメトリック場所を決定することである。本発明の別の新規の態様は、ポリヌクレオチドへのエピゲノム結合プローブをナノメトリック的に位置決定することを含む。本発明の別の態様は、単一のポリヌクレオチド上の配列の反復的な照合による配列の検出において、正確度を高めることである。本発明の別の新規の態様は、オリゴヌクレオチドの完全なレパートリーの場所を決定することによって、ポリヌクレオチドの配列を決定することである。本発明の別の新規の態様は、オリゴヌクレオチドのタイリングアレイの場所を決定することによって、ポリヌクレオチドの標的セグメントの配列を決定することである。
【0729】
規則正しいアレイ
ポリヌクレオチドは、分子が所与の表面積内に最大限に充填され、それらが重複しないように、規則正しい様式で、表面上に提供され得る。これは、パターン化された表面、例えば、ポリヌクレオチド(例えば、1Mbp長)の末端が結合する場所で、次のパッチがポリヌクレオチドの末端をちょうど超える場所に、疎水性パッチの規則正しい配置を作製することによって行うことができる。代替的に、オリゴヌクレオチドの空間的にアドレス指定可能なアレイを使用して、ポリヌクレオチドを捕捉することができる。ポリヌクレオチドは、一本鎖であり、ポリAテールなどの共通の配列を有する(例えば、mRNA)。ポリヌクレオチドは、二本鎖であり、制限酵素によって生成される粘着末端を有する。例えば、レアカッティング制限酵素(例えば、Pmme1またはNOT1)を使用して、各々が共通の末端配列を含む長い断片を生成することができる。
【0730】
規則正しいアレイは、ナノ流体工学を使用して作製され得る。ある場合、表面が加工された(textured)ナノトレンチまたはナノグルーブ(例えば、幅100nm、深さ150nm)のアレイは、長いポリヌクレオチドを規則正しく並べるのに役立ち、あるポリヌクレオチドが別のポリヌクレオチドの侵入を排除する。別の場合、ナノピットアレイは、長いポリヌクレオチドのセグメントがピット中にあり、長いセグメントがピット間にある。規則正しいアレイも作製することができる。
【0731】
一過的なプローブの結合およびアセンブリによる配列決定
本発明の一部の実施形態では、配列決定リード自体は得られない。一過的なプローブの結合による配列決定の場合、リードは、ポリヌクレオチド上の特定の場所にハイブリダイズしたオリゴの相補体である。第1のレベルでは、アセンブリは、オリゴの結合によって収集された配列情報から行われる。従って、本発明の一部の実施形態は、
(i)ポリヌクレオチドを伸長することと、
(ii)ポリヌクレオチドを変性することと(例えば、標的がRNAである場合、二次構造を除去すること、または、標的がゲノムDNAなどの二本鎖DNAである場合、二重らせんを分離すること)、
(iii)不安定な相互作用で標的に結合する短いオリゴプローブを添加することと、
(iv)各短いオリゴプローブの結合場所を決定することと、を含む。
【0732】
一部の実施形態では、各オリゴ配列を、一度に1つずつ添加する。一部の実施形態では、オリゴは、その同一性がデコードされ得るタグ(例えば、直交的なオリゴのセットが結合され得るか、またはその同一性を決定する配列タグ)を有する。一部の実施形態では、一度に1つを超えるオリゴが添加される。一部の実施形態では、デコード可能な限り多くのオリゴが添加される。例えば、16個の異なるコードが利用可能である場合、コードのうちの1つを各々有する16個のオリゴ配列が同時に添加される。一部の実施形態では、実質的により多くのオリゴが添加され、DNA折り紙などの光学バーコードを使用することによって区別する(例えば、Nat Chem.10:832-9,2012に記載されている)。一部の実施形態では、オリゴの完全なセット、例えば、5塩基長または6塩基長ごと(任意選択的に、縮重位置または普遍的位置で補充される)が使用される。
【0733】
第2のレベルでは、第1のレベルでアセンブリされたポリヌクレオチドの重複によって、染色体全体のアセンブリが行われる。十分な長さの重複が存在する場合、ハプロタイプフェーズドアセンブリを行うことができる。
【0734】
競合を介してもたらされる一過的なプローブの結合
オリゴプローブの結合は、動的プロセスであり、結合されるプローブは(温度および塩濃度を含む様々な要因によって決定される速度で)常にゆらいでいること(breathing)が理解されなければならず、したがって、ある鎖が別の鎖に置換される機会がある。例えば、一実施形態では、プローブの相補体が使用され、表面上の伸展された標的DNAおよび溶液中の相補体へのアニーリング間の連続的な競合が生み出される。別の実施形態では、プローブは、3つの部分を有する。第1の部分は、標的に相補的であり、第2の部分は、標的に部分的に相補的であり、かつ溶液中のオリゴに部分的に相補的であり、第3の部分は、溶液中のオリゴに相補的である。
【0735】
一部の実施形態では、(例えば、Nature Methods 10:865(2013)に記載される)不一致標的に結合したときに競合的に不安定化される部分的二本鎖を含む、トーホールドプローブ(Toehold probe)を使用する(例えば、Nature Chemistry 5,782-789(2013)に記載される)。
【0736】
この方法は、一過的なプローブの結合による配列決定の正確度を確保することができる。本方法は、
(i)ポリヌクレオチドを伸長することと、
(ii)ポリヌクレオチドが一本鎖ではない場合、実質的に一本鎖にすることと(例えば、変性により)、
(iii)トーホールドプローブセットのレパートリーを、標的ポリヌクレオチドに適用することと、
(iv)レパートリーの各トーホールドプローブセットのトーホールドプローブセットからの1つのオリゴの結合の場所を決定することと、
(v)レパートリーのすべてのトーホールドプローブの位置決定データに基づいて、配列を再構築することと、を含む。
【0737】
一部の実施形態では、トーホールドプローブは、正しいハイブリダイゼーションを確実にするために使用される。一部の実施形態では、トーホールドプローブは、オフ反応を促進するために使用される。
【0738】
短距離配列のアセンブリおよび長距離配列を作成するための結合
一部の実施形態では、位置決定の正確度または精度は、配列ビットを一緒に繋ぎ合わせるのに十分ではない。プローブのサブセットは、特定の局所で結合することが見出されるが、厳密には、位置決定データから、それらの順序を、信頼性をもって決定することは困難である。ある場合、解像度は、回折限界である。一部の実施形態では、局所または回折限界スポット内の短距離配列は、局所またはスポット内に位置するプローブの配列重複によってアセンブリすることができる。したがって、例えば、オリゴのサブセットの個々の配列がどのように重複するかに関する情報を使用することによって、短距離配列がアセンブリされる。このようにして構築された短距離配列は、次いで、ポリヌクレオチド上のそれらの順序に基づいて、長距離配列へと一緒に繋ぎ合わされ得る。したがって、隣接または重複したスポットから得られた短距離配列を結合することによって、長距離配列が得られる。
【0739】
ホモポリマーおよび短いタンデムリピート
ホモポリマーの問題があり、長さがオリゴの長さよりも大きい場合、例えば、10塩基のホモポリマーの塩基数を列挙することは困難である。また、短いタンデムリピートは、列挙するのが難しい場合がある。これは、いくつかの方法、例えば、次のいずれかで対処することができる:
【0740】
1.反復が延びる正確な範囲を決定できるように、位置決定の正確度を高めること。
【0741】
2.領域への結合の動態が、(任意の反復配列の)複数のタンデムコピーが存在する場合、または部分的なコピーが存在する場合でも異なること。コピー数は、結合速度の増加によって推定することができ、オフ速度は、ある部位に結合したオリゴが、3D空間を通過することなく別の隣接部位に移動し得るため、影響を受ける。
【0742】
3.また、二重鎖の2つの鎖間の塩基の数は一致しなければならないこと。一致しない場合、不正確性が示唆される。
【0743】
4.ホモポリマーならびに5塩基長のレパートリーの場合、より長いホモポリマーオリゴ(例えば、6つのA、7つのA、8つのAなど)を、適切なTmで添加することができること。
【0744】
5.参照ゲノムを考慮に入れること。
【0745】
6.ホモポリマーまたは繰り返しが、一定の長さである可能性を提供すること。
【0746】
ポリヌクレオチドの識別
ポリヌクレオチドの同一性は、その長さに沿ったプローブ結合のパターンによって決定することができる。同一性は、RNA種、RNAアイソフォームの同一性であり得る。これはまた、ポリヌクレオチドが対応する参照の場所であってもよい。
【0747】
エピゲノム修飾の位置決定
メチル化分析を、配列決定とは直交的に行うことができる。一部の実施形態では、これは、配列決定の前に行われる。抗メチルC抗体またはメチル結合タンパク質(MeCP2、MBD1、MBD2、およびMBD4を含むメチル結合ドメイン(MBD)タンパク質ファミリー)、または(MBD1に基づく)ペプチドは、ポリヌクレオチドに結合することができ、標識を介してそれらの場所が検出された後、(例えば、高塩緩衝液、カオトロフィック試薬、SDS、プロテアーゼ、尿素、および/またはヘパリンを添加することによって)それらが除去される。好ましくは、オン・オフ結合を促進するか、または一過的に結合するように操作されている試薬を使用することで、試薬が一過的に結合する。
【0748】
ヒドロキシメチル化またはDNA損傷部位などの他のポリヌクレオチド修飾の場合も、同様のアプローチがとられ、そのための抗体は、入手可能であるか、または産生され得る。修飾の場所が検出され、修飾結合試薬が除去された後、配列決定が開始され得る。一部の実施形態では、抗メチル抗体および抗ヒドロキシメチル抗体などが、標的ポリヌクレオチドが一本鎖になるように変性された後に、添加される。この方法は、非常に感度が高く、長いポリヌクレオチド上の単一の修飾を検出することができる。
【0749】
メチル化などのDNA修飾用の参照エピゲノムは存在しない。有用であるためには、未知のポリヌクレオチドのメチル化マップを、核酸配列または配列ベースのマップに連結する必要がある。したがって、本発明のエピマッピング方法は、エピゲノムマップへのコンテキストを提供するために、オリゴ結合によって得られた配列ビットと相関させることができる。配列リードに加えて、配列情報を得る他の手段を、エピゲノムマップと共役することができる。これには、ニッキングエンドヌクレアーゼベースのマップ、オリゴ結合ベースのマップ、および変性および変性-再性マップが含まれる。一部の実施形態では、1つ以上のオリゴの一過的な結合を使用して、ポリヌクレオチドをマッピングすることができる。ゲノムに対する機能的修飾に加えて、同じアプローチを、DNA損傷およびタンパク質(例えば、転写因子)の部位またはリガンド結合などのゲノムにマッピングする他の特徴に適用することができる。
【0750】
本発明では、塩基配列決定またはエピゲノム配列決定のいずれかを最初に行うことができる。一部の実施形態では、両方とも同時に行うことができる。例えば、特異的エピ修飾に対する抗体は、オリゴから差次的にコードすることができ、低塩などの条件を使用することにより、両方の種類のプローブの結合が一過的になる。
【0751】
一部の実施形態では、抗体を染色体またはクロマチン上で使用して、DNA上の修飾だけでなく、ヒストンアセチル化およびメチル化などのヒストン上の修飾も検出することができる。これらの修飾の場所は、抗体の染色体またはクロマチン上の場所への一過的な結合によって決定することができる。一部の実施形態では、抗体は、オリゴタグで標識され、一過的に結合しないが、それらの結合部位に永久的または半永久的に固定され得る。この場合、場所は、抗体にタグ付けするオリゴへの相補オリゴの一過的な結合を使用することによって、検出することができる。
【0752】
リードの場所保存のための試料の処理
一部の実施形態では、ポリヌクレオチドが伸長された後、ゲルオーバーレイが適用される。表面上での伸長および変性の後、ポリヌクレオチド(二本鎖または変性)をゲル層でカバーすることができる。代替的に、ポリヌクレオチドは、既にゲル環境にある中で、伸長される。一部の実施形態では、ポリヌクレオチドが伸長された後、ゲル中に投入される。例えば、ポリヌクレオチドが一端で表面に付着し、流れの中で、または電気泳動電流によって伸展されるとき、周囲の媒体がゲル中にキャストされ得る。これは、アクリルアミド、過硫酸アンモニウム、およびTEMEDを流れに含めることによって行うことができ、設定されると、ポリアクリルアミドになる。代替的に、熱に反応するゲルを適用することができる。一部の実施形態では、ポリヌクレオチドの末端は、アクリルアミドと重合するアクリダイトで修飾することができる。次いで、天然ポリヌクレオチドの骨格が負であることを考慮して、正極に向かってポリヌクレオチドを伸長する電場を印加することができる。
【0753】
一部の実施形態では、試料は、その環境のマトリックスに架橋され、これは細胞環境である。例えば、配列決定が細胞においてインサイツで行われる場合、ポリヌクレオチドは、ヘテロ二官能性架橋剤を使用して、細胞マトリックスに架橋される。これは、FISSEQなどの技術を使用して、配列決定が細胞内に直接適用されるときに行われた(例えば、Lee et al.Science 343:1360-3(2014)に記載されている)。
【0754】
一部の実施形態では、標的化配列決定を可能にするために、プローブのパネルを使用する。標的化配列決定が行われる場合、複合試料からのポリヌクレオチドのサブセット(例えば、全ゲノムまたはトランスクリプトーム)のみが分析される必要があるため、ポリヌクレオチドは、通常よりも高い密度で表面またはマトリックス上に配置され得る。したがって、回折限界空間内に伸長されたポリヌクレオチドがいくつか存在する場合でも、シグナルが検出されると、それが標的遺伝子座の1つのみからのものである可能性が高い。次いで、標的化配列決定に必要な撮像が、標的となる試料の分画と同時に行われることを可能にする。例えば、エキソンを含むゲノムの5%未満が標的化される場合、ポリヌクレオチドの密度は20倍大きくなり得、したがって、全ゲノムが分析される場合よりも撮像時間が10倍短くなり得る。
【0755】
一部の実施形態では、標的とされるゲノムの部分は、特定の遺伝子座である。他の実施形態では、標的とされるゲノムの部分は、遺伝子座のパネル、例えば、がんに関連する遺伝子、またはゲノムワイド関連解析によって識別された染色体間隔内の遺伝子である。標的遺伝子座はまた、ゲノムの暗黒物質、典型的には、反復的であるゲノムのヘテロクロマチン領域、ならびに反復領域の近傍にある複合遺伝子座であってもよい。そのような領域としては、テロメア、セントロメア、および末端動原体染色体の短腕、ならびにゲノムの他の低複雑度領域が挙げられる。従来の配列決定方法は、ゲノムの反復部分に対処することができないが、ナノメトリック精度が高い場合、本発明の方法は、これらの領域に網羅的に対処することができる。
【0756】
本発明の利点は、高価で、時間がかかる個々の長い読み取りを実際に行うことなく、代わりに短いオリゴの結合によって得られる連続した配列情報または重複した配列情報を一緒に繋ぎ合わせることによって、長いリードを得ることができることである。複数の短い3、4、5、または6塩基ビットの配列情報が、単一のポリヌクレオチド分子の長さに沿って同時に得られ、したがって、それらはすべて連結され、ポリヌクレオチドがオン・オフ結合するオリゴで飽和した場合、それらのナノメトリック位置、解像度、および順序は、分子全体の配列を明らかにする。ポリヌクレオチドの配列決定は、分子のある場所から別の場所へのSbS反応によって得られる単一の長いリード(例えば、PacBio配列決定)ではなく、配列情報の複数のビットが同時に得られるため、現在の方法よりも時間がかからない。
【0757】
本発明の別の主要な利点は、すべての種類の構造的変動(マイクロアレイベースの技術、現在の主流のアプローチにとっては困難なバランスの取れたコピー数バリエーションおよび逆位を含む)を、大小を問わず、マイクロアレイ、細胞遺伝学、または他の現在の配列決定方法ではアプローチできない分解能およびスケールで、検出することが可能になることである。
【0758】
さらに、本方法は、ゲノムの反復領域にわたる配列決定を可能にする。従来の配列決定のために、ゲノムのそのような部分にわたるリードの問題は、まず、そのような領域が参照ゲノムに十分に表現されておらず、Illumina、Ion Torrent、Helicos/SeqLL、およびComplete Genomicsなどの技術は、典型的には、デノボアセンブリによってではなく、参照に整列させることによって、大きなゲノムに対処する。第二に、リードが反復領域の全体に及んでいない場合、その領域にわたってより短いリードを介して領域をアセンブリすることは困難である。これは、ある分子上の反復領域と別の分子上の反復領域との間の可能な複数の整列のうちのどれが正しいのか、決定することが困難であり得るからである。誤った整列は、アセンブリ内の反復領域の短縮または延長につながる可能性がある。本発明の配列決定方法では、セットを同時にまたは次々に、のいずれかで行われる複数のリードによる単一分子の完全またはほぼ完全なカバレッジがある場合、(ポリヌクレオチド自体が反復領域の全体にわたる場合)反復領域の全体にわたるアセンブリを構築することができる。本発明の方法は、反復領域にまたがる十分長いポリヌクレオチドに適用され得る。1~10Mbのポリヌクレオチドは、ゲノムのほとんどの反復領域をまたぐのに十分である。本発明の方法は、Freitagらに示されているように、および(例えば、Rasmussen,et al Lab on a Chip,11:1431-3(2011)に記載されている)で試みられているように、真核生物ゲノム由来のポリヌクレオチドの完全長の染色体に適用され得、そのため、ゲノムの可能な反復長のすべてまたは大部分をまたぐことが可能である。
【0759】
ポリヌクレオチドのインサイツ領域情報の保存
一部の実施形態では、本発明の配列決定方法は、細胞内で、インサイツで適用される。RNAおよびゲノムDNAの場合、変性された後、配列決定が開始され得る。mRNAの場合、配列決定は、二次構造を変性した後、任意に開始され得る。一部の実施形態では、配列決定は、例えば、ミクロトームによって得られる細胞のスライス上で行われる。
【0760】
本発明の配列決定方法を細胞内で実施することで、ゲノムDNAの配列決定ができるだけでなく、細胞内のゲノムDNAの場所を確立することができる。さらに、組織に適用すると、分析される組織の細胞における体細胞バリアントの分布、ならびに染色体構成の差異を可能にする。これは非常に重要である。なぜなら、ゲノムの異なる部分が、細胞内で相互作用しているからである。例えば、エンハンサーは、ループを介して遺伝子領域に接触し、インサイツのゲノム解析により、そのような相互作用の検出が可能になる。また、細胞内のゲノムまたは個々の染色体の構成を可視化または決定することができる。加えて、プロセスは、培養皿で増殖した細胞集団(例えば、線維芽細胞またはニューロン)に対して、または組織切片に対して行うことができる。実質的に三次元である細胞または組織の場合、配列決定は、細胞または組織のスライスに対して行うことができる。一部の実施形態では、細胞内のクロマチンDNAは、変性を受け(例えば、0.5MのNaOHを使用する)、次いで本発明の一過的な結合相互作用が行われる。RNAは、RNAseを添加することによって除去することができる。一部の実施形態では、一過的な結合相互作用は、非標識プローブ結合によって形成される二重鎖への挿入色素の結合から検出される。一部の実施形態では、プローブが標識され、結合は、二重鎖に挿入される色素とプローブ上の標識との間のFRETを介して検出される。
【0761】
結合プローブの同一性および空間位置
本発明の一態様は、複数の配列断片の各々に一過的に結合したプローブの同一性および空間位置を保存することである。ポリヌクレオチドに沿ったプローブの結合位置は、検出器の場所感受性アスペクトによって決定される。CCDなどの2D検出器を使用する場合、画像が投影される画素のx-y座標によって、場所が決定される。いくつかの計算フィルタを使用して、真の検出事象から、標識の擬似結合を除去する。標識は、ポリヌクレオチドが続く経路を示すために、いくつかの起点を通る線と相関していなければならない。経路が直線である場合、フィルタを通過する位置は直線上にある。
【0762】
バイオポリマーに結合するプローブの同一性は、2つの方法のうちの1つで決定することができる。ある反応体積で、複数のプローブが差次的に標識され、かつ一緒に使用される場合、オリゴの同一性は、(ポリヌクレオチドに沿った特定の場所で検出される)コード標識を検出することによって決定される。これは、標識ごとに1つずつ4つの異なるレーザを照射するか、標識ごとに1つずつ4つの異なる発光フィルタを使用するか、または異なるレーザと発光フィルタの組み合わせを使用することで行うことができる。この場合、画像を1つの波長で撮影し、ポリヌクレオチドにマッピングし、次いで、次へと同様に行う。4つの標識を連続的に検出する代わりに、4つの標識を同時に検出することもできる。これは、プリズムを使用して、2D検出器上の異なる場所に、発光を分割することによって行うことができる。また、これは、発光波長を4つのチャネルに分割するために、ダイクロイックミラーおよび発光フィルタを、4つの標識ごとに1つずつ使用することによっても行うことができる。最後に、発光波長は任意の数のチャネル間で分割することができ、各チャネルで各シグナルの強度が検出されて、標識固有なシグネチャを与える。一部の実施形態では、最初に、各フルオロフォアのチャネルにわたるシグネチャが取得され、次いで、シグネチャを使用して、標識、したがって、記録されたデータからの配列を識別する。
【0763】
タグの配列決定
一部の実施形態では、DNAのセグメントは、インサイツでタグ付けされ(すなわち、ゲノムDNAの長さに沿って、または細胞内で)、タグの場所および同一性は、本発明の一過的な結合方法を使用して決定される。タグは、配列タグであり得、一過的に結合するオリゴの小さなプールのみがそれらの同一性を決定するために使用され得るように、設計することができる。一部の実施形態では、タグの場所および同一性が決定されると、ポリヌクレオチドは、細胞から抽出されるか、または表面から遊離され得、一方、配列タグは、ポリヌクレオチド断片に結合したままである。ポリヌクレオチド+配列タグは、任意選択的に、任意の配列決定方法(例えば、高スループットIllumina配列決定)を使用して、増幅され、配列決定され得る。配列決定の出力から、タグの配列を使用して、配列の特定のセグメントを、ゲノム内の特定の場所に、位置決定することができる。
【0764】
色素光物理学
単一の蛍光色素の検出は、各特定の色素タイプの特質に影響されやすい。特定の色素は、暗状態、速い光退色、および低い量子収率などの光物理学的特徴を有し、それらは、候補色素から排除される。また、色素の化学的特徴、それらの構造、およびそれらが電荷を有するかどうかは、それらがどの程度うまく組み込まれ得るか、およびそれらがどの程度非特異的に結合するかにも影響する。色素の選択は、不良な光物理学的および化学的問題の回避、ならびに、それらが選択された装置のセットアップにおいて、どの程度励起および検出され得るか、およびそれらが他の3つの色素からどの程度識別され得るか、に依存する。本発明の一部の実施形態では、FRET効率またはクエンチ効率などの他の特徴もまた重要である。幸いにも、いくつかの色素メーカーがあり、選択される色素のリストが多数ある。うまく機能することができる4つの色素は、Atto488、Cy3b、Atto655、およびCy7またはAlexa594である。本発明で使用され得る別の4つの良好な単一分子色素が、Sobhyら[Rev.Sci.Instrum.82,113702(2011)に示されており、405nm、488nm、532nm、および640nmレーザを使用して、それぞれAtto425、Atto488、Cy3、およびAtto647Nを励起することができる。標識の各々は、異なる塩基の同一性を示す。特定の色素は、捕捉された光物理状態からそれらを放出するために、ピーク励起波長とは異なる波長の光のパルスを必要とする。光物理を最小化するいくつかのレドックス系が知られている。Trolox、β-メルカプタノール;グルコース、グルコースオキシダーゼおよびカタラーゼ;プロトカテク酸およびプロトカテク酸-3,4-ジオキシゲナーゼ;メチルビオローゲンおよびアスコルビン酸。(Ha and Tinnefeld,Annu Rev Phys Chem.2012;63:595-617を参照されたい)。連続照明の代替として、一部の実施形態では、試料は、パルス照明またはストロボスコープ照明に供され、これは、光退色を低減する。
【0765】
撮像
ポリヌクレオチドの画像は、2D検出器(例えば、電荷結合素子(CCD)カメラ)のアレイ上に投影され、それらから、デジタル化され、メモリに記憶される。次いで、メモリに記憶された画像は、画像分析アルゴリズムに供される。これらのアルゴリズムは、シグナルをバックグラウンドから区別し、シグナル特性の変化を監視し、他のシグナル処理機能を行うことができる。メモリおよびシグナル処理は、オフラインでコンピュータ上で、またはマイクロプロセッサもしくはフィールドプログラマブルゲートアレイ(FPGA)によって制御される専用デジタルシグナル処理(DSP)回路で行われる。
【0766】
画像処理
蛍光標識が伸長ポリヌクレオチドに一過的に結合している場合、2Dアレイ検出器で画像を撮影することによって検出することができる。次のタスクは、撮影した画像から、配列決定データを抽出することである。伸展された分子を、2Dアレイ検出器(例えば、CCDまたはCMOSセンサー)の画素の列または行のいずれかに沿って、2Dアレイ検出器の一軸に沿って整列させるように取り組む。
【0767】
時間遅延積分(TDI)撮像またはラインスキャナーが使用され、連続画像ストリップが得られる場合(例えば、Hesse et al.Anal Chem.2004 Oct 1;76(19):5960-4に記載されている)、本発明の一実施形態は、画像の移動(またはステージの移動)の方向をポリヌクレオチドの伸長の線形方向と一致させることを含む。これは、非常に長いポリヌクレオチド(数100ミクロン、数mm、または数10mmの長さ)の連続した画像を得ることができ、かつ画像インターフェースでの誤差にもつながり得る画像の繋ぎ合わせに余分な計算リソースを費やす必要がないようにするためである。
【0768】
一部の実施形態では、本発明のシステムは、ポリマーの迅速かつ正確な長距離画像を取得するための方法を含み、
i)ポリマーを一方向に伸展することと、
ii)時間遅延積分(TDI)を搭載した2D検出器を使用することと、
iii)試料を、検出器に対して、DNA伸展の方向に移動することと、
iv)長いポリマー分子が単一の長い画像スワス(swath)/ストリップ(strip)から(別々のフレームを繋ぎ合わせる必要なく)分析される、移動方向のラインを読み取ることと、を含む、方法。
【0769】
一部のかかる実施形態では、移動速度は、読み出し速度のほんの一部である。これにより、表面上の次の位置がセンサーによって撮像される前に、複数のシグナル事象が、センサー要素によって、各位置から捕捉されるようになる。したがって、複数の結合事象を検出することができる。特定の数の連続した画素は、位置が、隣接する場所から事象を捕捉するのに十分にシフトする前に、場所の周りの経時事象(temporal event)を捕捉する。
【0770】
他の場合、非常に長い(ultra-long)ポリヌクレオチドは、蛇行ナノチャネル内の束縛により、蛇行パターンに折り畳まれ(Frietag et alを参照されたい)、次いで、単一のCCDまたはCMOSのフレーム内で撮像される。
【0771】
伸長方向が2Dアレイ検出器の軸に対応しない場合、第1の画像処理ステップは、画像内の軸に沿ってラインが整列するように画像を変換するために行われる。本発明の一部の実施形態では、ポリヌクレオチドが単一方向にまっすぐ整列され、ポリヌクレオチドの場所は、直線軸に沿って活性化される画素を調べることによって追跡することができる。すべての画素が活性化される必要はなく、表面へのバックグラウンド/非特異的結合を超えるポリヌクレオチドを追跡できる数だけで十分である。軸に沿っていないシグナルは無視される。一部の実施形態では、ポリヌクレオチドの骨格が標識される。例えば、Sybr Goldなどの蛍光色素の結合を使用して、ポリヌクレオチドを追跡することができる。従来のDNA染色剤の代わりに、共役カチオン性ポリマーを使用することができる。
【0772】
蛍光寿命およびバックグラウンド散乱拒絶
異なる結合プローブ(一過的に結合するものを含む)は、異なる蛍光寿命を有する発光実体(例えば、色素)でコードすることができる。分子の蛍光寿命は、分子が、蛍光光子の放出によって基底状態に戻るまでの、励起状態で過ごす平均時間である。
【0773】
次いで、パルスレーザ励起を使用して、色素を励起することができ、時間相関単一光子検出器(または高分解能の時間相関検出が可能な他の検出器)を使用して、各色素の蛍光寿命プロファイルを検出する。検出器は、am強化CCD(IMCCD)である。また、光子の到達時間をビニングできるポイント検出器のアレイも可能である。また、光散乱による早期(ピコ秒範囲)の蛍光がゲートアウトされるように、発光の検出時間をゲートアウトすることができ、そうして、バックグラウンドを上回る、色素によって放出される蛍光が検出される。
【0774】
本発明の方法は、エバネッセント場の有無にかかわらず、かつ比較的高い濃度のオリゴを用いて行うことができるが、散乱によるバックグラウンド蛍光は、蛍光の早期の時間枠を拒絶することによって除去される。そのため、パルス励起および時間ゲート検出または時間相関検出を使用すれば、一石二鳥である:1つは、異なる蛍光寿命によって区別される標識を用いて、配列決定の照合試薬(ヌクレオチド、オリゴ)をコードすることができ、もう1つは、散乱によるバックグラウンド蛍光を拒絶することができる。
【0775】
溶液中の色素(散乱ではない)に起因するバックグラウンド蛍光は依然として残るが、これは、励起にエバネッセント波、ゼロモード導波路および/またはRET機構を使用することによって低減することができる。または、試薬をクエンチすることができる(例えば、分子ビーコンなど)。
【0776】
例示的なセットアップは、広視野蛍光寿命撮像顕微鏡(FLIM)システムを含み、405nmのパルスレーザダイオードを使用して試料を照射し、ICCDカメラでシフトした蛍光シグナルを収集する。最短ゲート時間が200psの4 Picos強化CCDカメラ(Stanford computer optics)を使用することができる。顕微鏡内でビームスプリッターを使用して、レーザパルスを蛍光シグナルから分離する。このビームスプリッターは、405nmの励起波長を反射し、より長い波長にシフトした試料の蛍光シグナルを透過する。広視野FLIMの設定には、パルスレーザダイオードと強化CCDカメラのトリガー同期がさらに必要である。時間分解測定の励起源は、パルスまたは変調されており、蛍光発光および動態の測定を可能にする。時間領域蛍光測定方法は、蛍光減衰曲線の真の表現を生成するため、一般により容易に理解される。典型的には、時間領域システムは、高速応答検出器と結合された励起を提供するパルス光源からなる。時間ゲートの数を増やし、多指数減衰適合を考慮するための適合アルゴリズムを開発することによって、寿命の結果を改善することができる。時間相関検出は、単一分子の位置決定と組み合わせることができる。
【0777】
流体工学
本発明は、流体デバイス(フローセルまたはウェル)で実施することができる。試薬を送達および交換する手段は、様々な形態をとることができる。シリンジポンプまたは圧力駆動システム、音響駆動システムを使用して、試薬を、それが貯蔵されている場所から、配列決定が行われる場所、次いで、廃棄物として除去される場所へ、移動させることができる。複数のプローブを送達する必要がある場合(例えば、1024個のオリゴの各々)、多数のオリゴを貯蔵し、本発明の方法を実行するために使用することができる配列決定システムにそれらを送達するための1つの手段は、Pihalk et al.Anal.Chem.2005,77,64-71に記載されている。使用することができる別のアプローチは、Linder et al Anal.Chem.2005,77,64-71に記載されている。多数の異なるプローブまたはプローブセットを送達する1つの簡単な方法は、各々がエアギャップによって分離されるキャピラリーにそれらを装填することである。洗浄液も散在させることができる。次いで、各プローブおよび洗浄液が、本発明に必要な撮像を行うのに十分な時間、表面に接触するように、ループを適切な速度で(例えば、シリンジポンプから引くことによって)実行する。
【0778】
配列品質:配列決定エラーおよびカバー率バイアスの最小化
すべての配列決定技術は、あるレベルのエラーを受け、異なる配列決定プラットフォームは、異なる種類のエラーを受けやすい。Schirmer ら(Nucl.Acids Res.2015;nar.gku1341)l,Illumina MiSeqによると、生のエラー率は、2%である。これには、ライブラリの準備、クラスター増幅、プレフェージング(初期の組み込みでのエラー)、およびフェージング(後期の組み込みでのエラー)によって導入されるエラーが含まれる。これは、コンセンサスを構築するためにリードをトリミングおよび重複させることによって削減することができる。
【0779】
本発明の実施形態では、PCRは行われないため、PCRに起因して導入されるカバレッジバイアスはなく、PCR中のポリメラーゼの組み込みミスに起因するエラーはない。Illumina、ABI SOLID、Ion Torrent、Intelligent BiosystemsおよびComplete Genomicsの配列決定において、増幅エラーは、ライブラリ調製中およびクローン増幅中(例えば、DNAナノボール、ポロニーまたはクラスター生成)に導入され得る。
【0780】
次世代配列決定におけるエラーを克服するための通常の手段は、ゲノムの複数の別個の(非アンプリコン)コピーからゲノムの同じセグメントのリードを得るために、未増幅ゲノムの複数のコピーに対して配列決定を行うことである。次いで、配列は、多数の分子のコンセンサスから割り当てられる。2つの配列が優勢である場合、それはヘテロ接合性を示し得る。これは、配列決定が単一細胞で行われる場合には、該当しない。また、複数のコピーが得られる組織または細胞が均一でない場合にも問題となる。例えば、腫瘍内では、複数のクローン集団が混在し、体細胞変異が存在し得る。ゲノムは、免疫細胞でも変化しており、直接的な単一細胞配列決定が必要である。本発明の方法は、単一のポリヌクレオチドに基づいて、そのような場合に適用される。
【0781】
いくつかの用途では、細胞の集団で生じた体細胞変異を検出することが重要である。この場合、エラーを真の稀な変異から区別することが困難である可能性があるため、多くの分子からコンセンサスリードを取得することによって、エラーが除去され得ることに頼らない方がよい。これに関する別の問題は、異なるコピーが、パラロガスであることであり、ゲノムのセグメントの異なる重複(セグメント重複)からのものであるが、小さな差異を含み得ることである。
【0782】
本発明の方法に従って配列決定を行っている場合、複数のプローブ結合事象によって配列呼び出しを強化することによって、生のエラーを低減することができる。
【0783】
HelicosおよびPacBio配列決定において行われているように、単一の色素分子で標識されたヌクレオチドの組み込みを検出することを介して単一分子上で配列決定する場合、色素が検出されないことに起因して誤差が生じ得る。これは、色素が光退色しているため、色素の点滅により検出される累積シグナルが弱いため、色素の発光が弱すぎるため、または色素が長い光物理学的な暗状態に入るためである。これは、本発明においていくつかの方法で克服することができる。第一に、好ましい光物理的特性を有する強力な個々の色素(例えば、Cy3B)で色素を標識することである。別の例は、光退色および暗い光物理的状態(例えば、β-メルカプトエタノール、Trolox、ビタミンCおよびその誘導体、レドックス系)を低減する緩衝液条件および添加剤を提供することである。別の例は、光への曝露を最小化することである(例えば、より短い曝露を必要とするより高感度の検出器を有すること、またはストロボ照明を提供すること)。第二に、単一の色素の代わりに、量子ドット(例えば、Qdot655)、フルオロスフィア、プラズモン共鳴粒子、光散乱粒子などのナノ粒子で標識することである。別の例は、単一の色素ではなく、ヌクレオチド当たり多くの色素を有することである。この場合、複数の色素は、それらの自己消光を最小化するように(例えば、それらを十分に離してDNA折り紙などの剛性ナノ構造を使用して)、または剛性リンカーを介した線形間隔で組織化される。Genovoxxは、多くのフルオロフォアを含むヌクレオチドを組み込むことができ、Mir(WO2005/040425)は、ナノ粒子が結合しているヌクレオチドを組み込むことができている。
【0784】
しかしながら、本発明に最も関連する色素光物理によるエラーを低減するための最も重要な手段は、本発明に記載される一過的な結合を利用することである。ここで、撮像ステップ中の読み出しは、異なる標識担持プローブの多くのオン/オフ相互作用の集約として得られるため、一方の標識が光退色しているか、または暗状態にある場合でも、分子に付着する他の結合プローブ上の標識は、光退色していないか、または暗状態にない可能性がある。
【0785】
検出誤差率は、溶液中の尿素、アスコルビン酸またはその塩、イソアスコルビン酸またはその塩、β-メルカプトエタノール(BME)、DTT、レドックス系、またはTroloxから選択される1つ以上の化合物の存在下で、さらに低減される(および、シグナル寿命が延びる)。
【0786】
アレイ捕捉によるリードの集約
別の実施形態では、表面上またはマトリックス中に配置される特定のポリヌクレオチドまたはポリヌクレオチドの特定のセグメントを標的とする捕捉試薬を使用して、標的ポリヌクレオチドを捕捉する。一部の実施形態では、捕捉プローブは、試料中のすべてのポリヌクレオチド上に存在する特定の一般的な配列を標的にするように設計される。例えば、オリゴ(dT)捕捉試薬は、すべてのRNAを標的とする。一部の実施形態では、共通のオリゴ配列を、標的ポリヌクレオチドに移植し、それらを捕捉することができる。異なる捕捉試薬を使用して、異なるポリヌクレオチドを捕捉することができ、異なる捕捉試薬を、マイクロアレイなどの空間的にアドレス指定可能な規則正しいアレイに配置することができる。ポリヌクレオチドが捕捉されると、それらは、流体の流れまたは電気泳動流によって伸長され得る。
【0787】
配列決定のためのセンス・アンチセンス一本鎖の作製
一部の実施形態では、ヘアピンは、二本鎖標的の末端にライゲーションされ、他の末端の一方は鎖の一方のみを介して表面に固定化される。次いで、ポリヌクレオチドが変性され、付着点から伸長/伸展される。次いで、ポリヌクレオチドが、伸長した状態で固定される。
【0788】
これは、標的が一本鎖であることを確実にする方法を提供する。さらに、端部間のセンス鎖およびアンチセンス鎖から得られたリードは、相補的なリードを提供し、これは、得られた配列決定の真偽の内部検証である。また、このようなセンス・アンチセンス鎖は、第2の鎖を合成するために自然にヘアピンを作るAMV逆転写酵素を使用して、RNA上でcDNA合成を行うことによって作製することもできる。一部の実施形態では、逆転写のためのプライマーは、表面への付着を可能にする部分で修飾される。
【0789】
一本鎖アセンブリ
本発明の一部の実施形態では、試料は、近接して天然相補鎖を有しない一本鎖ポリヌクレオチドを含む。ここで、ポリヌクレオチドに沿ったレパートリーの各々のオリゴの結合場所がコンパイルされると、配列は、それらの場所に従って、すべての配列ビットを集約し、それらを一緒に繋ぎ合わせることによって再構築することができる。実際、完全なレパートリーは、配列ビットのタイリングシリーズを提供するであろう。現実世界では、パターンは、ポリヌクレオチド上の不一致結合および非特異的結合によって複雑になり得る。しかし、不一致は、それらの経時的結合パターンによって区別することができ、したがって、配列情報の二次層とみなすことができる。この場合、その経時的結合特性により、結合シグナルが不一致であると判断された場合、配列ビットをバイオインフォマティクス的にトリミングして、推定される不一致塩基を除去し、残りの配列ビットを配列再構築に加えることができる。不一致は、ハイブリダイズするオリゴの末端で生じる可能性が最も高いため、経時的結合特性に応じて、末端から1つ以上の塩基をトリミングすることができる。どの塩基がトリミングされるのかに関しては、同じ配列空間上でタイリングしている他のオリゴからの情報によって知ることができる。
【0790】
同時二重鎖コンセンサスアセンブリ
本発明の一部の実施形態では、二重らせんの両方の鎖が近接して存在し、検出される一過的なシグナルから、どの鎖にオリゴが結合したのか区別することはできない。しかしながら、ポリヌクレオチドに沿ったレパートリーの各々のオリゴの結合場所がコンパイルされる場合、2つのオリゴ配列が同じ場所に結合するように見える可能性がある。これらのオリゴは、配列において相補的である必要がある。単一の結合事象が、一方または他方の鎖に対するものなのかを判断するために、全体的にデータが考慮される。オリゴの2つのタイリングシリーズは、問題の位置をカバーし、各タイルは、一方向または他方向のポリヌクレオチドの長さに沿った位置の漸増的なシフトである。シグナルを生成するオリゴ配列がどのシリーズと重複するかに基づいて、シグナルが属する2つのタイリングシリーズのうちのどちらかが割り当てられる。これは、
図28に例示されている。次いで、一部の実施形態では、最初に、結合および配列重複の場所を使用して、2つのタイリングシリーズの各々を構築することによって、配列が再構築される。次いで、2つのタイリングシリーズは、逆相補体として整列され、2つの鎖がこれらの場所の各々で完全な逆相補体である場合にのみ、各場所での塩基割当が受け入れられる(これは、二重鎖コンセンサス配列を提供する)。任意の不一致は、2つの可能性のうちの1つが、独立した不一致結合事象などの追加の層の情報によって裏付けられる必要がある、曖昧なベースコールであるとフラグ付けされる。一部の実施形態では、二重鎖コンセンサスが得られたら、(複数の細胞由来のDNAが利用可能であるとき)個々のハプロタイプが混合しないように注意して、ゲノムの同じ領域をカバーする他のポリヌクレオチドからのデータを比較することによって、従来の(多分子)コンセンサスを判定する。代替的に、一部の実施形態では、個々の鎖コンセンサスを得た後、個々の鎖コンセンサスの二重鎖コンセンサスを得る。本発明のかかる実施形態では、二重鎖の各々の鎖の配列は、次世代配列決定(NGS)で現在利用可能であるように、二重鎖の2つの鎖を分子バーコードで差次的にタグ付けするような追加の試料調製ステップなしで、同時に得られる(J.Salk,et al.“Detection of ultra-rare mutations by next-generation sequencing”.Proc.Natl.Acad.Sci.,vol.109 no.36.2012)。また、この同時の両方の鎖(センスおよびアンチセンス)配列の取得は、第2の鎖の配列が得られる前に、二重鎖の一方の鎖について配列を得る必要があるナノポアに対して利用可能である2Dまたは1D2コンセンサス配列決定と比較して有利である。二重鎖コンセンサス配列決定は、106の範囲の正確度、すなわち、100万塩基中に1つのエラー(他のNGSアプローチの102~103の生の正確度と比較して)を提供することができ、本発明の場合、二重鎖コンセンサスは、追加の試料調製ステップがない配列取得の本質的な部分である。これにより、本方法は、早期がん発見のために循環DNAを検出しようとしている場合、または腫瘍細胞集団の低頻度サブクローン由来のDNAを検出しようとしている場合に生じる希少バリアントを解決する必要性と非常に適合する。
【0791】
複数のポリヌクレオチドからのリードの組み込み
好ましくは、連続した配列は、デノボアセンブリを介して得られる。しかしながら、参照配列は、アセンブリを容易にするために使用することもできる。これにより、デノボアセンブリを構築することが可能になるが、非常に長い距離の個々のハプロタイプを解決するのはより困難であり、ハプロタイプに関する情報を提供する分子に沿って十分な場所に遭遇する必要がある。完全なゲノム配列決定が、ゲノムの同じセグメント(理想的には、同じ染色体に由来する分子)にわたる複数の分子からの情報の合成を必要とする場合、アルゴリズムは、複数の分子から得られた情報を処理する必要がある。1つのアルゴリズムは、複数の分子間で共通している配列に基づいて分子を整列させ、領域がカバーされているともに整列した分子からの帰属によって、各分子内のギャップを埋めるタイプのアルゴリズムである。したがって、ある分子のギャップは、別の(ともに整列した分子)分子内のリードによってカバーされる。さらに、Eugene Myersによって開発されたようなショットガンアセンブリ法は、多数のリードが予めアセンブリされているという追加の利点を用いて(例えば、互いに対するリードの場所、リード間のギャップの長さが既知である)、アセンブリを実行するように適合され得る。Mishraら(Bioinformatics,Oxford Journals,(2011)27(2):153-160)によって記載されているSUTTAなどの他のアルゴリズム的なアプローチも、データのアセンブリのために適合され得る。様々な実施形態では、参照ゲノムは、長距離ゲノム構造もしくは短距離ポリヌクレオチド配列のいずれか、またはその両方のアセンブリを容易にするために使用され得る。リードは、部分的にデノボアセンブリされ、次いで、参照に整列され、次いで、参照支援アセンブリが、デノボアセンブリされ得る。(例えば、異なる民族からの)様々な参照アセンブリを使用して、ゲノムアセンブリ用のいくつかのガイダンスを提供することができる。しかしながら、実際の分子から得られる情報(特に、2つ以上の分子によって裏付けられている場合)は、参照からの任意の情報よりも重み付けされる。従来技術では、複数の個別に検査された単一のポリヌクレオチド分子から得られた局所的配列を整列させることによって、連続した配列を再構築することができることは示されていない。
【0792】
参照なしの配列決定
様々な実施形態では、配列は、標的ポリヌクレオチド分子の別のコピーまたは標的ポリヌクレオチド分子の参照配列を使用せずに決定される。この場合、大部分のリード(例えば、90%)が合体され、合体していないそれらのリードのリード間のギャップが分かる。ポリヌクレオチドの糸尺(linear length)が追跡可能であること、およびリード間の画素数を計数し、各画素にわたるDNAの長さの知識を使用することによって、ギャップの距離を決定することができることから、ギャップ距離が分かるであろう。
【0793】
ハプロタイプ解像配列決定
ゲノム配列は、ハプロタイプ情報(単一の親染色体に由来する単一のDNA分子に沿ったアレルの関連)を長距離にわたって得ることができれば、はるかに大きな有用性を有するであろう。
【0794】
様々な態様および実施形態では、本方法は、ハプロタイプを配列決定するために使用することができる。ハプロタイプの配列決定には、本発明による方法を使用して、二倍体ゲノムのハプロタイプにわたる第1の標的ポリヌクレオチドを配列決定するステップと、本発明による方法を使用して、二倍体ゲノムのハプロタイプ分岐にわたる第2の標的ポリヌクレオチドを配列決定するステップであって、第1および第2の標的ポリヌクレオチドが相同染色体の異なるコピーに由来する、配列決定するステップと、第1および第2の標的ポリヌクレオチドの配列を比較し、それによって、第1および第2の標的ポリヌクレオチド上のハプロタイプを決定するステップと、が含まれ得る。
【0795】
細胞集団におけるハプロタイプの多様性および頻度の決定
細胞の集団におけるゲノムの不均一性を調べることを目的とする多くの既存の方法では、技術的に要求が厳しい単一細胞解析が使用される。しかしながら、本発明の注目に値する特徴は、分子が十分に長い場合、細胞集団に存在する異なる染色体、長い染色体セグメント、またはハプロタイプが決定され得るため、単一細胞の内容物を一緒に保持する必要性がなく、集団におけるゲノムの不均一性が分析され得ることである。これは、どの2つのハプロタイプが一緒に細胞内に存在するかを示すものではないが、ゲノム構造タイプ(またはハプロタイプ)の多様性およびそれらの頻度、ならびにどの異常な構造バリアントが存在するかについて報告する。本実施形態は、以下のステップ:
1.ゲノムDNAを、2つ以上の細胞から抽出することと、
2.DNAを伸長させ、本発明の配列決定方法を実施することと、
3.データを分析して、どのDNA鎖がホモログであるかを決定することと、
4.ホモログ間の異なるハプロタイプを決定することと、
5.異なるハプロタイプの頻度を決定することと、を含む。
【0796】
他の配列決定技術との相乗効果
一部の実施形態では、本発明の方法は、完全なゲノム配列決定であることにとどまらず、Illumina由来のものなどの短いリード配列決定のための足掛かりを提供するために使用される。この場合、ゲノムのより均一なカバレッジを得るために、PCR増幅ステップを除外することによって、Illuminaライブラリの調製を行うことが有利である。これらの実施形態のいくつかの1つの利点は、必要とされる配列決定のカバレッジ倍率が、例えば、約40倍から20倍に半減され得ることである。一部の実施形態では、これは、本発明の方法によって行われる配列決定および方法が提供する場所情報の追加によるものである。
【0797】
配列決定パネル
一部の実施形態では、特定の遺伝子または遺伝子座に対応するゲノムのサブセットを配列決定することが望ましい。この場合、ゲノムDNAは一本鎖にされ、配列特異的オリゴが、目的の領域にわたって一過的にアニーリングする。このように配列決定を標的化する1つの利点は、ゲノムの全体が表面に伸展されても、標的化領域のみがライトアップされることである。そのため、光検出可能な標的領域に直接赴くによって撮像時間が短縮され得る。さらに、分子のわずかな部分のみが検出される必要があるため、ゲノムを、通常よりもはるかに高い密度で表面に整列させることができる。一例として、ヒトゲノムのBRCA1領域は、BRCA1配列に相補的な複数のオリゴヌクレオチドをアニーリングすることによって、配列決定することができる。ゲノムの他の部分は検出されないままである。
【0798】
セルフリー核酸
診断に最もアクセス可能なDNAまたはRNAのいくつかは、体液または便の細胞外に見つかる。血液中を循環するDNAは、21番染色体トリソミーおよび他の染色体およびゲノム障害の出生前検査に使用される。それは、特定の病理状態のマーカーである腫瘍由来のDNAおよび他のDNAまたはRNAを検出する手段でもある。しかしながら、これらの分子は、典型的には、血液中で約200bpの長さの範囲にあり、尿中ではより短い。ゲノム領域のコピー数は、ゲノムの他の部分と比較して、参照に整列するリードの数と比較することによって、決定される。
【0799】
場合によっては、核酸がメチル化されているかどうかを、配列特異的な様式で決定することが有用である。例えば、胎児DNAを母体DNAから区別する1つの方法は、前者が目的の遺伝子座でメチル化されることであり、これは、非侵襲的産前検査(NIPT)に有用であり得る。
【0800】
本発明は、2つのアプローチによるセルフリー核酸配列の列挙または分析に適用することができる。1つ目は、変性の前または後に短い核酸を固定化することを伴う。一過性結合試薬は、核酸の同一性、そのコピー数、変異または特定のSNPアレルが存在するかどうか、ならびに検出された配列がメチル化されているか、または他の修飾(バイオマーカー)を有するかどうかを決定するために、核酸を照合するために使用され得る。
【0801】
これには、
1)体液(例えば、血液)から、セルフリー核酸を単離することと、
2)単離されたセルフリー核酸を、基板に固定化することと、
3)固定化されたセルフリー核酸へのプローブの結合によって、配列決定を行うことと、が含まれる。
【0802】
2つ目は、まず小さな断片を連結することで、コンカテマーを伸展できるようにすることである。これには、
4)血液から、セルフリーDNAを単離することと、
5)DNAを連結することと、
6)連結されたDNA上のプローブの結合によって、配列決定を行うことと、が含まれる。
【0803】
一部の実施形態では、連結は、DNAの末端を研磨し、平滑末端ライゲーションを行うことによって、行われる。代替的に、血液またはセルフリーDNAは、2つのアリコートに分割され得、一方のアリコートは、ポリAでテール付加され(ターミナルトランスフェラーゼを使用して)、他方のアリコートは、ポリTによってテール付加される。
【0804】
次いで、得られたコンカテマーを配列決定に供する。得られた「スーパー」配列リードを、次いで、参照と比較して、個々のリードを抽出する。個々のリードデータは、計算的に抽出され、次いで、他の短いリードデータと同じ様式で処理される。
【0805】
核酸は、核酸を分解することができる多数のエキソヌクレアーゼを含む媒体である便中にも見出され、エキソヌクレアーゼが機能するために必要な大量の二価カチオンのキレート剤(例えば、EDTA)を用いて、DNAを十分にインタクトで保持し、本発明の方法に従って配列決定することができる。DNAが細胞から脱落する別の方法は、エキソソーム内のカプセル化を介する。エキソソームは、超遠心分離によって、またはスピンカラム(Qiagen)を使用することによって単離され得、それに含まれるDNAまたはRNAが回収され、本発明の方法に従って配列決定することができる。
【0806】
一部の実施形態では、1つ、ただし通常は少なくとも2つ、好ましくはいくつかのオリゴヌクレオチドの核酸への結合は、その同一性、または核酸のゲノムのどの部分に由来もしくは起源しているのかを決定するのに十分である。したがって、完全なレパートリーが試験される前に、不完全な配列決定により、必要な情報が提供され得る。一部の実施形態では、異なる染色体またはゲノム領域の比率は、それらのゲノム起源に従って識別される核酸分子の数を計数することによって、決定される。一部の実施形態では、これにより、試料の胎児画分に関する情報を決定することが可能になる。一部の実施形態では、核酸分子の同一性または起源の決定とともに、1つ以上のオリゴの結合を分析することによって、一塩基バリアントまたはインデルの出現が決定される。
【0807】
オリゴヌクレオチドが結合する時間が長いほど、核酸分子の同一性または起源を決定するのに必要なオリゴヌクレオチドは少なくなる。この点で、特定の遺伝子または遺伝子座は、オリゴヌクレオチドプローブ配列のパネルの提供によって検出することができ、かかるプローブは、10ヌクレオチドを超えるオリゴ長であるか、または長さが10nt未満の複数の特定の短いオリゴヌクエルチドである。したがって、がん関連プローブのパネルを、血液から抽出された核酸分子に適用して、がん関連遺伝子を識別し、次いで、さらなるオリゴヌクレオチドの結合を使用して、一塩基バリアントまたはインデルを識別することができる。このための本発明に記載されるアプローチの利点には、バリアントを呼び出す際の信頼度を高めるための、複数の結合事象、および一部の実施形態では、両方の鎖のプロービングが含まれる。
【0808】
RNA配列決定
RNAの長さは、典型的には、ゲノムDNAよりも短いが、現在の技術を使用してRNAを一端から他端へ配列決定することは困難である。それにもかかわらず、選択的スプライシングのため、mRNAの完全な配列組成を得、決定することが非常に重要である。本発明の一部の実施形態では、mRNAは、そのポリAテールを固定化されたオリゴd(T)に結合させることによって捕捉することができ、その二次構造は、伸展力および変性条件によって除去され、そのため、表面に伸長され得る。次いで、結合試薬(エキソン特異的である)が、一過的に結合することが可能になる。RNAの長さが短いため、本発明に記載の単一分子局在化方法を用いて、エキソンを解像および区別することが有益である。一部の実施形態では、RNAに散在するわずかな結合事象は、特定のmRNAアイソフォームに関するmRNA内のエキソンの順序および同一性を決定するのに十分である。
【0809】
分析前に生体高分子の完全性を保存すること
生物学において、天然の状態の生体分子を観察することは、しばしば難しい。たいてい、天然の状態の生体分子の情報を取り出すプロセスは、天然の状態の一部の態様の破壊をもたらす。
【0810】
ゲノムの場合、天然の染色体状態のゲノムの情報内容を分析することが課題である。ヒト染色体におけるDNAは、5,000万塩基長~2億5,000万塩基長の範囲であり得るが、今日のショットガン配列決定技術は、数百塩基長しか読み取ることができない。これは、DNA配列の場所およびコピー数が表現型に重要な意味を有することがますます認識されるようになっているにもかかわらず、である。
【0811】
損傷の多くは、細胞および組織から生体分子を抽出するプロセス、ならびに(生体分子が分析される前の)生体分子のその後の取り扱いにおいて生じる。DNAの場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。機械的ストレスは、最小化することができる(例えば、ChemBioChem,11:340-343(2010)に記載されている。加えて、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。
【0812】
本発明の代替的な態様が対処しようとする問題は、分析の前に、生体高分子の天然の完全性をどのように保存するか、特に、その天然の長さ、またはその天然の長さにやや近い長さのゲノムDNAをどのように保存するかである。これは、本発明の方法を使用した配列決定、または他の方法を使用した配列決定の両方に関連する。それは、特に、ナノポア配列決定に特に関連している。
【0813】
一部の実施形態では、本発明は、分析用の生体高分子を送達するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から分析ゾーンに遊離することと、を含む。
【0814】
一部の実施形態では、本発明は、分析用の生体高分子を調製するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から遊離することと、
4)生体高分子を、分析ゾーンに通すことと、を含む。
【0815】
一部の実施形態では、本発明は、分析用の生体高分子を調製するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から分析ゾーンに遊離することと、を含む。
【0816】
さらなる実施形態では、本発明は、生体高分子を分析するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から遊離することと、
4)生体高分子を、分析ゾーンに通すことと、
5)分析ゾーンにおいて、生体高分子の少なくとも1つの特徴を検出することと、を含む。
【0817】
一部の実施形態では、本発明は、分析用のゲノムDNAを送達するための方法に関し、
1)ゲノムDNAを含む保護実体を提供することであって、当該保護実体が、その天然長に近いゲノムDNAを保存する、提供することと、
2)ゲノムDNAを含む保護実体を、分析ゾーンに近接して配置することと、
3)ゲノムDNAを、保護実体から遊離することと、
4)ゲノムDNAを、分析ゾーンに通すことと、を含む。
【0818】
さらなる実施形態では、本発明は、
1)ゲノムDNAを含むアガロースゲルを提供することであって、当該アガロースゲルが、200Kb長を超えるゲノムDNAのかなりの部分を保存する、提供することと、
2)ゲノムDNAを含む当該アガロースを、DNAが分析される表面に近接して配置することと、
3)ゲノムDNAを、アガロースから表面に遊離することと、
4)DNAを一方向に伸長することと、を含む。
【0819】
一部の実施形態では、本発明は、希少な標的分子が検出される、分析用の生体高分子を調製するための方法に関し、
1)機械的ストレスを最小化し、かつ/または高濃度の二価カチオン/没食子酸を含む環境を含む容器内で、かつ高分子の集積を最小化するために(例えば、脂質層を介して)不動態化された容器の領域内で、生体高分子を抽出することと、
2)抽出された生体高分子を、容器内の表面に固定することと、
3)本発明の方法に従って、抽出および固定化された生体高分子を分析/配列決定することと、を含む。
【0820】
一部の実施形態では、ゲノムDNAの長さは、50Kb、100Kb、200Kb、400Kb、800Kb超である。一部の実施形態では、DNAの特定の部分は、約1Mbを超える長さである。一部の実施形態では、一部の分子のDNAは、5Mbを超える長さである。一部の実施形態では、DNAの標的分子は、染色体の実質的な長さに近い。一部の実施形態では、テロメアからテロメアまでの染色体の全長が保存され、分析される。
【0821】
一部の実施形態では、アガロースゲルは、アガロースビーズの形態である。一部の実施形態では、DNAは、液滴に封入される。一部の実施形態では、DNAは、実質的にクロマチンとして残る。一部の実施形態では、DNAは、染色体として残る。一部の実施形態では、染色体は、細胞周期の中期段階の染色体である。一部の実施形態では、染色体は、細胞周期の後期段階の染色体である。
【0822】
一部の実施形態では、試料は、実質的に単一細胞の全DNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全RNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全タンパク質/ポリペプチド/ペプチド内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全DNAおよびRNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全DNA、RNA、タンパク質内容物を含む。
【0823】
一部の実施形態では、試料は、実質的に単一細胞の全細胞質内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全核内容物を含む。一部の実施形態では、試料は、RNAの全細胞質内容物およびDNAの全核内容物を含む。一部の実施形態では、試料は、実質的にタンパク質の全膜内容物を含む。
【0824】
一部の態様では、本方法は、以下を含む。
【0825】
1.生体高分子を分析ゾーンに送達するための方法:
a.生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
b.生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
c.生体高分子を、保護実体から遊離することと、
d.生体高分子を、分析ゾーンに通すことと、
e.分析ゾーンにおいて、生体高分子の少なくとも1つの特徴を検出することと、を含む、方法。
【0826】
2.保護実体が、分析ゾーンと並置される、1に記載の方法。
【0827】
3.保護実体が、生体高分子の天然環境を含む、1に記載の方法。
【0828】
4.保護実体が、染色体、染色分体、またはクロマチンを含む、3に記載の方法。
【0829】
5.保護実体が、細胞、核、オルガネラ、小胞、エキソソーム、カプシドを含む、3に記載の方法。
【0830】
6.保護実体が、コンパクトな構造における生体高分子の凝縮、折り畳み、または他のレンダリングを含む、1に記載の方法。
【0831】
7.保護実体が、液滴、ビーズ、またはゲルである、1に記載の方法。
【0832】
8.保護実体が、ゲルビーズ、ゲルプラグ、ゲルスラブ、ゲルキャピラリー、または他のゲル形成物である、5に記載の方法。
【0833】
9.ゲルが、アガロースである、8に記載の方法。
【0834】
10.生体高分子が、態様1のステップ1の前に、保護実体内に封入されるかまたは包まれる、先行態様1~9に記載の方法。
【0835】
11.生体高分子が、電場の印加を介して保護実体から遊離される、8に記載の方法。
【0836】
11a.生体高分子が、マイクロ流体構造中に遊離される方法。
【0837】
11b.マイクロ流体構造が、不動態化される、11aに記載の方法。
【0838】
11c.不動態化が、脂質コーティングを介する、11bに記載の方法。
【0839】
12.分析ゾーンが、ナノポア、ナノギャップ、または他のナノスケール検出ステーション/リーディングヘッドである、1に記載の方法。
【0840】
12b.個々のポリヌクレオチドが分析ゾーンの近くに遊離された後、個々のポリヌクレオチドに対して、ナノポア配列決定が行われる、12に記載の方法。
【0841】
13.分析ゾーンが、表面である、1に記載の方法。
【0842】
14.表面が、生体高分子上の1つ以上の部位に結合することができる薬剤を含む、12に記載の方法。
【0843】
15.分析ゾーンが、ナノチャネル、ナノグルーブ、ナノピット、またはナノスリットである、1に記載の方法。
【0844】
16.生体高分子が、流体中に存在し、かつ分析ゾーンと接触している構造中に遊離される、1に記載の方法。
【0845】
17.生体高分子が、分析ゾーンに到達する前に、マイクロ流体チャネルを通過する、15に記載の方法。
【0846】
18.生体高分子が、電気泳動または電気浸透によって遊離される、1に記載の方法。
【0847】
19.分析ゾーンへの通過速度が、分子ラチェット、分子モーター、流体力学的抗力、電場、光ピンセット、磁気ピンセットによって制御される、1に記載の方法。
【0848】
20.生体高分子が、保護実体を破壊する薬剤によって遊離される、1に記載の方法。
【0849】
21.破壊剤が、酵素、洗剤、酸性溶液、またはアルカリ性溶液である、20に記載の方法。
【0850】
22.酵素が、プロテアーゼである、21に記載の方法。
【0851】
23.破壊剤が、超音波処理、帯電スイッチ、温度変化、ヒートショック、コールドショック、解凍などを含む、20に記載の方法。
【0852】
24.保護が、剪断力からの保護である、1に記載の方法。
【0853】
25.保護が、ヌクレアーゼ、プロテアーゼからの保護である、1に記載の方法。
【0854】
26.ステップeが、生体高分子上の2つ以上の場所における2つ以上の特徴を検出することを含む、請求項1に記載の方法。
【0855】
27.生体高分子が、ポリマーである、1に記載の方法。
【0856】
28.天然状態に近い保存が、ポリマーを、実質的に長い鎖長で保存することを含む、請求項27に記載の方法。
【0857】
29.ポリマーが、DNAポリマーであり、鎖長が、40Kb、100Kb、200Kb、500Kb、1Mb、5Mb、50Mb、250Mbにわたって保存されている、28に記載の方法。
【0858】
30.生体高分子が、生体高分子の移動方向に対して垂直な流れ(クロスフロー)の試薬によって遊離される、1に記載の方法。
【0859】
31.クロスフローが、RNAse、プロテアーゼ、アルカリ、洗剤を含む、30に記載の方法。
【0860】
32.生体高分子が、その放出後、およびその分析ゾーンに入る前に、一連のピラーまたはポストを横断する、1に記載の方法。
【0861】
33.保護実体が、パラフィンを含む、1に記載の方法。
【0862】
34.保護実体が、ホルマリン固定・パラフィン包埋された生体高分子を含む、33に記載の方法。
【0863】
35.生体高分子が、その完全性を保持し、損傷を修復する溶液に曝露される、1に記載の方法。
【0864】
36.生体高分子が、DNAであり、溶液が、修復酵素(例えば、NEBによるPCR修復ミックス)を含む、35に記載の方法。
【0865】
35.生体高分子の遊離が、生体高分子を、その天然の被包(encasing)から抽出するプロセス(例えば、細胞からのDNAの抽出)である、態様1~36に記載の方法。
【0866】
36.生体高分子が保護実体から遊離された後、マイクロピペッティング、ボルテックスおよび/または遠心分離を使用せずに、ステップが実施される、1に記載の方法。
【0867】
代替的な実施形態
代替的な一実施形態では、プローブは安定して結合するが、その一過性は、環境をオフモードに切り替える外部トリガーによって制御される。かかるトリガーは、プローブの結合を解離させる、熱、pH、電場、または試薬交換である。次いで、環境がオンモードに切り替わり、プローブが再び結合できるようになる。一部の実施形態では、第1のラウンドの結合で、結合によりすべての部位が飽和されない場合、第2のラウンドは、第1の部位以外の他の部位を占有することができる。これらのサイクルは、制御可能なレートで複数回実行され得る。
【0868】
代替的な超解像および単一分子局在化方法
代替的な実施形態では、プローブは比較的安定して結合されるが、回折限界よりも近い光シグナルを解像するためのいくつかのアプローチが存在する。まず、量子ドットまたは色素などの発光標識の光学特性が既知である場合、実体の点広がり関数を使用して、ポリヌクレオチドに沿って間隔の狭い2つのシグナルを解像することが可能である。これは、間隔の狭い2つのシグナルが異なる波長で放出される場合に容易に行われる。第二に、確率的プロセスである光退色を可能にすることによって、シグナルを解決することが可能である(J Biomed Opt.2012 Dec;17(12):126008)。第三に、説明され、市販されているいくつかのハードウェアアプローチがあり、走査光学顕微鏡、4Pi、STED、およびSIMを含む。STEDの場合、特定の互換性のあるフルオロフォアセットを使用する必要がある。時間的に離れている間隔の狭いシグナルに基づいて、いくつかの分子アプローチも説明されており、これには、STORM(サブ回折限界確率的光学再構築顕微鏡(STORM) M.J.Rust,M.Bates,X.Zhuang Nature Methods 3:793-795(2006))が含まれ、この場合、互換性のあるフルオロフォアの特定のセットを使用しなければならない。
【0869】
単一分子局在化方法であるDNA PAINT(Jungmann et al Nano Lett.2010,10:4756)もまた、本発明の様々な実施形態では使用され得る。DNA PAINTの場合、各結合プローブは、オリゴタグで標識され、それに対して、相補オリゴ抗タグが一過的に結合する。結合プローブの各々は、異なる配列相補体の結合パートナー対と会合する。区別するために、結合プローブの各々と会合するアンチタグは、他のアンチタグと区別可能である。それらを区別可能にする要素は、異なる波長の発光標識(例えば、Atto488、Cy3B、Alexa594、およびAtto655/647N)、異なる寿命を有する標識であり得るか、または異なるアンチタグは、異なるオン/オフ結合動態を有するように設計され得る。
【0870】
DNA PAINTを使用して、シグナルの局在の座標を正確に割り当てることができる。局在は、シグナルを放出するフルオロフォアが、組み込まれた部位に近いままである場合、決定がより容易である。したがって、波長発光部分(例えば、フルオロフォア)を塩基に結合するリンカーまたはブリッジの長さおよび柔軟性の程度が限定されなければならず、例えば、一部の実施形態では、短鎖の剛性リンカーが使用される。
【0871】
超解像画像を得るための別の代替手段は、拡張による(例えば、Chen,Tillberg,and Boyden Science 30 January 2015:Vol.347 no.6221 pp.543-548に記載されている)。ここでは、伸長されたポリヌクレオチドが、ゲル中に提供され、次いで、拡張され、したがって、生体材料が伸展される。ポリヌクレオチドと関連付けられた特異的標識は、膨潤可能なポリマーネットワークに共有結合的に繋留される。腫脹の際、ポリヌクレオチドが破壊されていても(または、もはや連続したポリリン酸骨格を有していなくても)、断片の順序が保持され、本発明が依然として実施され得る。
【0872】
このような超解像アプローチは、一過的な結合を必要としない。したがって、各サイクルのプローブ結合は、レパートリーの異なるオリゴまたはオリゴセットを有する異なるトラフに表面(例えば、カバーガラス)を浸漬することによって行うことができる。
【0873】
一過的な結合の利点
一過的な結合アプローチ法は、結合するフルオロフォアの光退色が常に新鮮なフルオロフォアに置き換えられるため、問題にならないという利点を有する。したがって、フルオロフォアの選択、アンチフェード、レドックス系の提供はそれほど重要ではなく、例えば、カメラの視野にはない分子の照明を防止するためのfストップなしで、より単純な光学系を構築することができる。なぜなら、照明は、一過的にエバネッセント波に入る標識のみを退色し、これらの退色された標識は、バルク溶液からの分子によって連続的に置き換えられるからである。
【0874】
オン・オフ結合の利点は、単一の色素分子で標識されたプローブの暗状態または光退色の問題を回避することである。特定のプローブ分子が退色しているか、または暗状態にある場合、そのプローブの結合事象は検出されない。それにもかかわらず、標的位置は、その場所への次の結合事象によって検出される可能性が高い。
【0875】
一部の実施形態では、オン・オフ結合の利点は、検出における信頼度を増加させるために複数の測定を行うことができるようにすることである。例えば、場合によっては、分子プロセスの典型的な確率的性質のために、プローブは、不適切な場所に結合し得るが、そのような外れ値は破棄することができ、複数の検出された相互作用によって裏付けられ得るそれらの結合事象のみが、配列決定の目的のための有効な検出事象として受け入れられる。
【0876】
本発明の一部の実施形態では、一過的な結合アプローチの利点は、伸長ポリヌクレオチドに沿って配列がどのように決定されるのかについて非常に重要である。この利点は、一過的な結合が、結合されるべきすべてのプローブ場所が同時に結合されるわけではないことを意味するという事実である。これにより、光の回折限界よりも近い部位での結合事象を、検出することができるようになる。例えば、配列AAGCTTが60塩基後に繰り返される場合、およそ20nmの距離(標的が、ワトソン-クリック距離=0.34nmに伸長および直線化され、線状化されている場合)は、通常、光学撮像によって区別されない。しかしながら、撮像中の異なる時間に、プローブが2つの部位への結合する場合、それらは個別に検出することができる。これにより、ナノスケールトポグラフィーのための点集積(PAINT)として知られる方法によって、結合事象の超解像撮像を行うことができる。シグナルのナノメトリックまたはサブナノメトリック位置決定を可能にするアルゴリズム(例えば、ThunderSTORM)を使用することができる。これにより、プローブの正確な場所、したがって、結合の正確な順序を決定することができる。ナノメトリック精度は、反復を解像し、それらの数を決定するために、特に重要である。
【0877】
10x Inc.によって開発された液滴ベースの分配およびバーコード化アプローチに対するこのアプローチの利点は、ゲノム構造およびハプロタイプ情報が、推論によって、または計算再構築によってではなく、分子の直接可視化によって得ることができることである。本方法の固有の利点は、効率的に実施した場合、単一細胞由来のゲノムを配列決定し、その中のハプロタイプを解像できることである。本方法が効率的でない場合でも、分子の分配およびバーコード化を必要とするアプローチによって必要とされるものよりも、ゲノムのデノボ再構築に必要なゲノムのコピーがはるかに少ない。また、全体的な試薬使用量が少ないだけでなく、必要とされる処理ステップがより少ない。さらに、この方法は、増幅なしでゲノムDNAに対して機能し得るため、増幅バイアスに悩まされず、エラーおよびエピゲノムマークが保存され、配列の取得とは直交的に検出することができる。炭素-5(C5)のアルキル化は、哺乳動物において、いくつかのシトシンバリアント:C5-メチルシトシン(5-mC)、C5-ヒドロキシメチルシトシン(5-hmC)、C5-ホルミルシトシン、およびC5-カルボキシルシトシン、を生じる。また、真核生物および原核生物は、アデニンをN6-メチルアデニン(6-mA)にメチル化する。原核生物では、N4-メチルシトシンも頻繁に見られる。これらの修飾の各々に対する抗体は、入手可能であるか、または産生され得る。修飾を標的とするアフィマー、ナノボディ、またはアプタマーは、フットプリントがより小さい可能性があるため、特に関連している。加えて、他の天然に存在するDNA結合タンパク質、例えば、メチルタンパク質(MBD1、MBD2など)が、使用され得る。
【0878】
したがって、様々な態様および実施形態では、本発明は、エピゲノム情報を含む単一の伸長標的ポリヌクレオチド分子を配列決定する方法を提供する。
【0879】
様々な態様および実施形態では、本方法は、ハプロタイプが解像される段階的配列決定に使用され得、前段落の方法を使用して二倍体ゲノムのハプロタイプ分岐にわたる第1の標的ポリヌクレオチドを配列決定するステップと、前段落の方法を使用して二倍体ゲノムのハプロタイプ分岐にわたる第2の標的ポリヌクレオチドを配列決定するステップと、を含み得、第1および第2の標的ポリヌクレオチドは異なる相同染色体に由来し、それによって、第1および第2の標的ポリヌクレオチド上のハプロタイプ(連結されたアレル)を決定する。
【0880】
本発明の利点は、高価で、時間がかかる個々の長い読み取りを実際に行うことなく、代わりに短いオリゴの結合によって得られる連続した配列情報または重複した配列情報を一緒に繋ぎ合わせることによって、長いリードを得ることができることである。複数の短い3、4、5、または6塩基ビットの配列情報が、単一のポリヌクレオチド分子の長さに沿って同時に得られ、したがって、それらはすべて連結され、ポリヌクレオチドがオン・オフ結合するオリゴで飽和した場合、それらのナノメトリック位置、解像度、および順序は、分子全体の配列を明らかにする。ポリヌクレオチドの配列決定は、分子のある場所から別の場所へのSbS反応によって得られる単一の長いリード(例えば、PacBio配列決定)ではなく、配列情報の複数のビットが同時に得られるため、現在の方法よりも時間がかからない。
【0881】
本発明の別の主要な利点は、すべての種類の構造的変動(マイクロアレイベースの技術、現在の主流のアプローチにとっては困難なバランスの取れたコピー数バリエーションおよび逆位を含む)を、大小を問わず、マイクロアレイ、細胞遺伝学、または他の現在の配列決定方法ではアプローチできない分解能およびスケールで、検出することが可能になることである。
【0882】
さらに、本方法は、ゲノムの反復領域にわたる配列決定を可能にする。従来の配列決定のために、ゲノムのそのような部分にわたるリードの問題は、まず、そのような領域が参照ゲノムに十分に表現されておらず、Illumina、Ion Torrent、Helicos/SeqLL、およびComplete Genomicsなどの技術は、典型的には、デノボアセンブリによってではなく、参照に整列させることによって、大きなゲノムに対処する。第二に、リードが反復領域の全体に及んでいない場合、その領域にわたってより短いリードを介して領域をアセンブリすることは困難である。これは、ある分子上の反復領域と別の分子上の反復領域との間の可能な複数の整列のうちのどれが正しいのか、決定することが困難であり得るからである。誤った整列は、アセンブリ内の反復領域の短縮または延長につながる可能性がある。本発明の配列決定方法では、セットを同時にまたは次々に、のいずれかで行われる複数のリードによる単一分子の完全またはほぼ完全なカバレッジがある場合、(ポリヌクレオチド自体が反復領域の全体にわたる場合)反復領域の全体にわたるアセンブリを構築することができる。本発明の方法は、反復領域にまたがる十分長いポリヌクレオチドに適用され得る。1~10Mbのポリヌクレオチドは、ゲノムのほとんどの反復領域をまたぐのに十分である。
【0883】
様々な配列決定メトリックへの影響
速度への影響-このアプローチは単純で、試料処理ステップまたはサイクルタイムが長くならない。酵素的なステップはなく、ハイブリダイゼーションのみであり、高速化するための複数の手段がある。
【0884】
コストへの影響-このアプローチは、極めて低コストであり、必要な試薬は、極めて少量のオリゴ、例えば、0.5~3nMのオリゴプローブである。
【0885】
リード長への影響-リード長は、潜在的に、任意の長さのDNAの分子(染色体全体を含む)と同じ長さである。
【0886】
正確度への影響-提案された技術は、最高正確度の配列決定技術となる可能性がある。わずかな異常値を除いて、短いオリゴは、わずか1塩基の不一致が安定性の大幅な低下につながるため、非常に特異的である。適切な結合条件を考慮すると、完全一致は、ほとんどの場合、1つ以上の塩基の不一致から区別することができ、この能力は、各配列部位の反復的な照合によって増強することができる。さらに、本方法は、配列の決定において不一致情報を利用することができる。さらに、二重鎖の両方の鎖からの同時配列取得は、正確度を向上させる。この技術の正確度レベルは、稀な変異を検出するために十分なものとなる。
【0887】
感度への影響-本方法は、単一分子技術であるため、非常に感度が高い可能性がある。ライゲーションなどの非効率的な調製ステップがないため、分子は失われない。抽出は、配列決定の部位に近接して統合され得るため、分子が容器に付着することによって失われず、マイクロ流体デバイス自体の内壁は、分子の集積を防止するために不動態化され得る。また、細胞から遊離される実質的にすべての分子は、フローチャネル内でアクセスすることができる。さらに、本方法は、わずか1つの分子から完全に連続したリードが得られる可能性がある。これは、単一細胞からの配列決定に関連しており、本方法は、前例のないカバレッジおよび低いアレルドロップアウトを可能にする。
【0888】
配列決定の用途および使用
一部の実施形態では、本発明は、単一の伸長ポリヌクレオチドから直接得られる配列情報の使用を含み、長いポリヌクレオチド内で得られる配列リードのコンテキスト(約100Kb~染色体全体)が保存される。コンテキスト情報は、短いリードが特定のポリヌクレオチドに由来するという情報のみを含み得る。コンテキストはまた、ポリヌクレオチド内の配列決定リードの正確なまたはおよその場所を知ることにも及び得る。
【0889】
さらに、ポリヌクレオチドが、同じ染色体(または、他の種類の完全なポリヌクレオチド、例えば、RNA転写産物)に由来する類似のまたは異なる長さの複数のポリヌクレオチドの一部である場合、個々のポリヌクレオチドの長さ(サブ染色体長である場合)よりもさらに長距離の情報を得ることができる。一部の実施形態では、複数のポリヌクレオチドの各々からの配列リードは、複数のポリヌクレオチドを含む他のポリヌクレオチドからのリードとは独立して得られる。この場合、複数のポリヌクレオチドから得られた配列決定データを使用して、そのポリヌクレオチドを最初に発出した天然ポリヌクレオチド配列に、ポリヌクレオチドを再構築またはアセンブリする。これは、多くの所与の細胞型から抽出されたゲノムDNA上で配列決定が行われ、多くの同じ染色体ホモログからのDNAが存在することが予想される場合であり得る。例えば、100万個の細胞からの細胞抽出(例えば、CEPHパネルからのリンパ芽球様細胞株、例えば、NA12878)において、母体に由来する100万個の染色体相同体および父親に由来する100万個の染色体ホモログが、抽出されたDNAにおいて予想される。
【0890】
他の実施形態では、短いリードのコンテキストは、単離された長い(約50~200Kb)単一のポリヌクレオチドを配列決定することによって保存される。一部の実施形態では、短いリードのコンテキストは、伸長ポリヌクレオチドに沿って配列決定することによって保存される。一部の実施形態では、同じセグメントをカバーする(ハプロタイプ分解能を有するか否かにかかわらず)単一のポリヌクレオチドの多くのコピーを標的として使用して、標的ごとに複数の配列リードを取得し、配列リードを使用して、単一のポリヌクレオチドのうちの1つによって表され得るものよりも長距離配列のポリヌクレオチドセグメントを再構築する。したがって、ゲノムまたは大部分のゲノムのデノボアセンブリを再構築することができる。ハプロタイプ解像のデノボアセンブリを作成するために、十分な部分のポリヌクレオチドが配列決定リードでカバーされている場合、重複したセグメントを、1つの相同染色体または別の相同染色体からのセグメントに属するものとして区別することが可能である(例えば、その中で見出されるSNPまたは構造バリアントに基づいて)。本発明の方法を使用して、現在の配列決定技術によって得ることが困難なゲノムに見出され得る以下の特徴を決定または解決することができる。
【0891】
逆位
ポリヌクレオチドに沿った一連の配列リードの方向は、反転事象が生じたかどうかを報告する。参照と比較して他のリードと反対方向にある1つ以上のリードは、反転を示す。
【0892】
転座
その近傍の他のリードのコンテキストでは予想されない1つ以上のリードの存在は、参照と比較して、再編成または転座を示す。参照におけるリードの場所は、ゲノムのどの部分が別の部分にシフトしたかを示す。場合によっては、その新しい場所におけるリードは、転座ではなく重複である。
【0893】
コピー数バリエーション
特異的リードの非存在または反復は、それぞれ、欠失または増幅が生じたことを示す。本発明の方法は、ポリヌクレオチドに複数のおよび/または複雑な再編成が存在する場合、特に適用することができる。本発明の方法は、単一のポリヌクレオチドを分析することに基づいているため、上に記載の構造バリアントは、少数の細胞、例えば、集団由来のわずか1%の細胞における稀な出現まで解像することができる。
【0894】
デュプリコン
セグメント複製またはデュプリコンは、ゲノム中で持続的であり、体細胞変異を含む個々のゲノムの多くの構造バリエーションを播種する。セグメント重複は、ゲノムの遠位部分に存在し得る。現在の次世代配列決定では、リードがどのセグメント重複から生じるかを決定することは困難である。本発明の一部の実施形態では、リードは、長い分子(例えば、0.1~10メガ塩基長の範囲)にわたって得られるため、通常、単にリードを使用して、ゲノムのどのセグメントがデュプリコンに対応するゲノムの特定のセグメントに隣接しているかを決定することによって、デュプリコンのゲノムコンテキストを決定することが可能である。
【0895】
反復領域
パラロガス変異を有するリードまたは関連するリードの反復的な発生は、ゲノムの複数の場所で生じる複数のまたは非常に類似したリードとして、本発明の方法(データ分析の後)によって観察され得る。これらの複数の場所は、サテライトDNAでのように、一緒に密接に充填されているか、または偽遺伝子のように、ゲノムにわたって分散している。本発明の方法は、短いタンデムリピート(STR)、可変数タンデムリピート(VNTR)、トリヌクレオチドリピートなどに適用することができる。
【0896】
ブレークポイントの検索
構造バリアントのブレークポイントは、本発明の方法によって特定することができる。本発明は、ゲノムのどの2つの部分が融合したのかを、全体的なレベルで示すだけでなく、ブレークポイントが生じた正確な個々のリードを見ることができる。リードは、2つの融合した領域のキメラを含むだけでなく、ブレークポイントの一方の側のすべての配列は、融合したセグメントの一方に対応し、他方の側は、融合したセグメントの他方である。これにより、ブレークポイントを決定する信頼度が高くなる。ブレークポイント周辺の構造が複雑である場合でも、本発明の方法は構造を解決することができる。一部の実施形態では、正確な染色体ブレークポイント情報は、疾患機序の理解に使用され、特定の転座の発生の検出に使用され、疾患の診断に使用される。
【0897】
ハプロタイプ
一部の実施形態では、ハプロタイプの解像度は、改善された遺伝子研究を行うことを可能にする。他の実施形態では、ハプロタイプの分解能は、より良好な組織型決定を行うことを可能にする。一部の実施形態では、ハプロタイプの分解能または特定のハプロタイプの検出は、診断を行うことを可能にする。
【0898】
他の推論的または分配およびタグ付けハプロタイピング/フェージングアプローチと比較して、本発明は、可能性の高いハプロタイプのコンピュータ再構築に基づかない。本発明によって得られた情報の視覚的性質は、実際に物理的または視覚的に特定のハプロタイプを示す。
【0899】
したがって、本発明の実施形態から得られるリードおよびアセンブリは、ハプロタイプ特異的であると分類され得る。ハプロタイプ固有の情報が必ずしも長距離にわたって容易に取得されるわけではない唯一のケースは、アセンブリが断続的である場合であり、それにもかかわらず、リードの場所が提供される。ここでも、複数のポリヌクレオチドがゲノムの同じセグメントをカバーする場合、ハプロタイプを計算的に決定することができる。
【0900】
生物の識別
本発明の一実施形態は、本発明によって提供される配列、エピ情報および構造情報に基づいて、メタゲノム試料などの混合試料中に存在する異なる個々の生物を識別することである。本発明の配列決定方法は、ゲノムのわずか1つのコピーからゲノムのかなりの部分を配列決定することができるため、生物の多様なメタゲノム混合物を配列決定することができる。さらに、1塩基または数塩基の情報から得られた単一分子のマップだけで、微生物を識別するのに十分である。
【0901】
細胞株の識別と検証
一部の実施形態では、ゲノムDNAは、培養中の細胞から抽出され、伸展され、メチル化および/または配列情報は、本発明の方法を使用して伸展された分子から抽出される。この情報を使用して、細胞株の同一性を検証し、その分子表現型を決定し、継代の過程を通して、または実験が行われる際に(例えば、増殖成長条件の撹乱)、そのエピゲノムの変化を監視することができる。
【0902】
疾患検出
一部の実施形態では、本発明は、がんの早期検出、がんの診断、がんの分類、がん内の細胞の不均一性の分析、がんの病期分類、がんの発達のモニタリング、薬物治療を適用するかどうかの判断、使用する薬物または薬物の組み合わせ、治療の効果のモニタリング、再発のモニタリング、転帰の予後予測のために本発明の方法を使用することを含む。これらの場合の各々において、特定の「バイオマーカー」またはバイオマーカーのセットのいずれかが探索され、特定の配列、エピバリアントもしくは構造バリアント、または特定の閾値レベルを上回る一般的な構造バリエーションの発生が検出される。この態様は、
1.スクリーニングされている(例えば、がんの早期徴候についてスクリーニングされている)ヒト患者または個体から試料生体材料を得ることと、
2.本発明の方法に従って、配列決定および/またはエピ分析を行うことと、
3.参照と比較するか、または個体/患者由来の他の体組織と比較して、データの配列、エピバリエーションおよび/または構造バリエーションを探索することと、
4.バリエーションの量および/または種類を評価し、任意選択的に、スコアを提供することと、
5.4に基づいて、臨床判断を行うことと、を含む。
【0903】
同じ5つのステップをがん以外の疾患症例に適用することができ、家畜、イヌ、およびネコなどのヒト以外の動物にも適用することができる。配列データは、RNAおよびDNAデータを含み得る。一部の実施形態では、臨床判断を行うためには、配列のみの情報、構造のみの情報、またはメチル化もしくは他の修飾のみの情報を使用する。
【0904】
一部の実施形態では、5つのステップは、着床前スクリーニング診断またはスクリーニングにおいてどの受精卵を選択するかを決定することを含み得る。一部の実施形態では、FFPE切片が得られ、DNAが抽出および固定化され、結合剤の一過的な結合が行われる。
【0905】
遺伝子型と表現型の相関
一部の実施形態では、本発明の方法は、以下によって、遺伝子型と表現型の相関を行うために使用される:
1.集団、コホート、または家族の個体から、試料生体材料(例えば、RNAまたはDNA)を得ること、
2.本発明の方法に従って、配列決定および/またはエピ分析を行うこと、
3.任意選択的に、民族、表現型の層別化、および表現型の誤分類を考慮しながら、データ内の配列、エピマーク、および/または構造バリアントを探索し、特定の疾患、表現型、または形質について、症例と対照との間でそれらを比較すること、および
4.どの配列、エピモチーフおよび/もしくは構造的モチーフ、またはマーカーバリアントが、表現型と相関するかを決定すること。
【0906】
さらに、表現型相関配列、エピバリアントおよび/または構造バリアントは、表現型の候補バイオマーカーとして選択することができる。任意選択的に、候補バイオマーカーを微調整または検証するために、さらなる研究が行われる。
【0907】
実験方法の詳細な説明
本発明の様々な態様、実施形態、および特徴を、以下にさらに詳細に提示および説明する。しかしながら、上記および以下の説明は、例示および説明にすぎず、特許請求されるように本発明を限定するものではない。
【0908】
一部の実施形態では、本発明の方法は、プロセスの主要な機能要素間の様々な洗浄ステップを含み、様々な点での洗浄ステップの必要性は、当業者によって認識されるであろう。一般に、洗浄緩衝液は、リン酸緩衝生理食塩水、2×SSC、TEN、HEPESを含むことができ、少量のTween20、TritonX、Sarkosyl、および/またはSDSなどが補充される。典型的には、機能ステップ間に、2~3回の洗浄を挿入することができる。例えば、場合によっては、あるオリゴが別のオリゴと交換される際に、洗浄ステップが行われる。
【0909】
ほとんどの場合、特定のオリゴ長について記載されているものは、他のオリゴ長についても同様であり得ることを理解されたい。また、識別する、分析する、測定するなどの用語が使用される場合、それらは精神的な行為ではなく、むしろ計装上で実行される行為であり、かかる計装は、検出器およびコンピュータアルゴリズムと組み合わせて使用される自動化された流体工学を含むことを理解されたい。
【0910】
表面上のメガ塩基範囲のゲノムDNAの抽出および伸長
高分子量(HMW)または長い鎖長のDNAを抽出および伸長するための多くの方法が存在する。例えば、Allemand et al Biophysical Journal 73:2064-2070 1997、Michalet et al Science 277:1518-1523(1999)を参照されたい)。一部の実施形態では、Kaykov et al(Scientific Reports 6:19636 2016)から適合された方法を使用して、メガ塩基範囲の平均長を有するDNAを抽出および伸長することができる。かかる実施形態では、ゲノムDNAは、プロテイナーゼKを1時間使用して(例えば、BioradまたはGenomic Visionのプロトコルを使用するか、またはKaykovらによって記載されているように)、アガロースブロック中の細胞(1ブロック当たり1×104~105)から抽出され、洗浄ステップは、100mMのNaClを含み、アガロースブロックは、混合することなく、βアガラーゼ(NEB,USA)を42℃で長期間(例えば、16時間)使用して、トラフ中で融解および消化され、次いで、室温に戻される。DNAは、pH6の50mMのMES、100mMのNaClを含む緩衝液中でコーミングされる。(例えば、Kaykovらによって記載されているように)トラフから、基板(例えば、カバースリップ)を引き出すことができるデバイスを使用して、最小限の振動で滑らかで低摩擦のz運動を生成する。900?m/秒のコーミング速度を使用して、DNA分子を最小限の破断で均一に伸展する。約50%の分子が1Mbより長く、平均の長さが2Mbで、5%が4Mbを超える。
【0911】
表面に伸展するためのいくつかの他の方法を使用することができる(例えば、ACS Nano.2015 Jan 27;9(1):809-16に記載されている)。代替的に、表面上の伸長は、PetitおよびCarbeck(Nano.Lett.3:1141-1146(2003))によって記載されているアプローチを使用することを含めて、フローセル内で行うことができ、これは、20~100uMのチャネルでコーミングする場合、4~5μm/秒の流体の後退速度で、平坦な気液界面がもたらされ、十分に整列した一方向性のポリヌクレオチドが提供されることを示す。流体アプローチに加えて、ポリヌクレオチドは、電場を使用することによって伸展することができる(例えば、Giess et al.Nature Biotechnology 26,317-325(2008)に記載されている)。ポリヌクレオチドが表面に付着されていない場合、ポリヌクレオチドを伸長させるためのいくつかのアプローチが利用可能である(例えば、Frietag et al Biomicrofluidics.9(4):044114(2015)およびMarie et al.Proc Natl Acad Sci U S A.110:4893-8(2013)に記載されている)。
【0912】
ゲルプラグでDNAを使用する代わりに、チップ上へのローディングに好適な染色体を、Cram et al.(L.S.Cram,C.S.Bell and J.J.Fawcett,Methods Cell Sci.,2002,24,27-35)に記載されているように、ポリアミン法によって調製し、直接デバイスにピペッティングすることもできる。染色体のDNAに結合するタンパク質を、プロテアーゼを使用して消化して、実質的に裸のDNAを遊離することができる。
【0913】
分析前に生体高分子の完全性を保存すること
損傷の多くは、細胞および組織から生体分子を抽出するプロセス、ならびに(生体分子が分析される前の)生体分子のその後の取り扱いにおいて生じる。DNAの場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。機械的ストレスを最小化することができる(ChemBioChem,11:340-343(2010)。加えて、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。
【0914】
単一細胞からの核酸の抽出および単離
単一の細胞または核からバイオポリマーを抽出するために利用可能ないくつかの異なるアプローチがあり、本発明の目的のためのバイオポリマーを抽出するために使用され得る。いくつかの好適な方法は、Kim et al.Integr Biol 2009 vol.1(10)pp.574-86に概説されている。細胞をKCLで処理して、細胞膜を除去することができる。細胞は、低張液を添加することによって破裂することができる。様々な異なる化学的および物理的溶解方法は、当該技術分野で知られているように、およびマイクロフルイディクスにおいてこれまで試験されているように実施することができる。
【0915】
単一細胞用のトラップは、核酸内容物が遊離される間に、細胞を保持するマイクロ流体構造で設計することができる。これは、WO/2012/056192、WO/2012/055415***のデバイス設計を使用することを含むが、本発明では、DNAを抽出し、ナノチャネル内で伸展する代わりに、マイクロ/ナノ流体構造を密封するために使用されるカバーガラスまたは箔を、Petit et al.Nano Letters 3:1141-1146(2003)に記載されているように、流体の移動によって分子コーミングを可能にするために、ポリビニルシラン(または同様に処置される)でコーティングする。流体チップ内の条件が穏やかであると、抽出されたDNAが、長い鎖長で保持され得る。
【0916】
一部の実施形態では、本発明の方法は、Strijp et al.Sci Rep.7:11030(2017)に記載の方法の適合を含む。伸展する前、単一細胞の核成分および核外成分は、マイクロ流体デバイスの供給チャネルに少なくとも1つの細胞を提供すること、少なくとも1つの捕捉構造内に少なくとも1つの細胞を捕捉すること、第1の溶解緩衝液を細胞に供給することによって、細胞の核の完全性に影響を及ぼすことなく、少なくとも1つの捕捉構造内に捕捉された細胞を溶解すること、放出されたRNAが固定化されるフローセルに細胞の核外成分を遊離すること、第2の溶解緩衝液を核に供給することによって、細胞の核を溶解すること、細胞の核成分(例えば、ゲノムDNA)を、それが固定化されるフローセルに遊離すること、によって、別々に抽出される。細胞外成分および細胞内成分は、同じフローセルの異なる場所またはデバイス内の異なるフローセルに固定化される。
【0917】
捕捉用アダプター
非末端修飾ポリヌクレオチドを捕捉/固定化することに加えて、一部の実施形態では、(特に、短いDNAが分析される場合のもの)DNAの末端は、表面/マトリックス上の捕捉分子との相互作用に適合される。これには、ターミナルトランスフェラーゼを使用したテール付加(例えば、ポリAによるテール付加)および表面またはマトリックス上でのオリゴd(T)捕捉プローブへの結合が含まれる。オリゴd(T)捕捉プローブは、20~50nt長である。また、ライゲーションまたはタグ付けを使用して、Illumina配列決定用のアダプターを、ポリヌクレオチド上に導入し、表面またはマトリックス上の相補配列で捕捉することも含む。これにより、ユーザーは、十分に確立されたIlluminaプロトコルを使用して試料を調製することができ、次いで、本発明の方法によって捕捉し、配列決定される。好ましくは、ポリヌクレオチドは、増幅の前に捕捉され、これは、エラーおよびバイアスを導入する傾向を有する。
【0918】
一部の実施形態では、セルフリーDNAもしくはマイクロRNAなどの短い(約300nt未満)ポリヌクレオチド、またはmRNAなどの比較的短い(10,000nt未満)ポリヌクレオチドは、適切な捕捉分子を使用して修飾または非修飾末端を捕捉することによって、表面上でランダムに固定化される。ポリAテールを有する天然mRNAは、表面上のオリゴd(T)プローブのローン(lawn)上で捕捉され得る。次いで、配列決定は、表面から「垂直に」行われる。一部の実施形態では、短いまたは比較的短いポリヌクレオチドが、表面と複数の相互作用を行い、配列決定が「水平に」実行される。これにより、スプライシングアイソフォームの編成を解像することが可能になり、例えば、いくつかのアイソフォームでは、反復またはシャッフルされるエキソンの場所を描写することができる。
【0919】
一部の実施形態では、ポリヌクレオチドは、捕捉プローブの規則正しいアレイ上で捕捉される。規則正しいアレイは、空間的にアドレス指定可能なアレイである。規則正しいアレイは、DNA折り紙(Rothemund,Science)アプローチを使用して形成され得るような分子ナノ構造アレイの形態をとり得る。規則正しいアレイは、DNAの自己組織化によって形成され得るような2D分子格子の形態をとり得る(Woo and Rothemund,Nature Communications,5:4889)。規則正しいアレイは、視野ごとにより高密度の分子(高密度配列)を可能にする、分子の効率的なサブ回折充填を可能にし、本発明の単一分子局在化方法は、高密度アレイ内の分子(例えば、40nmの点間距離)を解像することを可能にする。
【0920】
ポリヌクレオチド修復
ポリヌクレオチドは、抽出、貯蔵、または調製中に損傷を受ける可能性がある。ニックおよび付加物は、天然の二本鎖ゲノムDNA分子内に形成され得る。これは、特に、試料のポリヌクレオチドがFFPE材料由来である場合に当てはまる。DNA修復溶液は、DNAが固定化される前または後に導入される。これは、ゲルプラグにおけるDNA抽出後に行うことができる。かかる修復溶液は、DNAエンドヌクレアーゼ、キナーゼ、および他のDNA修飾酵素を含んでいてもよい。かかる修復溶液は、ポリメラーゼおよびリガーゼを含み得る。かかる修復溶液は、New England BiolabsのプレPCRキットである。以下の参考文献は、それらの全体が本明細書に援用される。Karimi-Busheri et al.Nucleic Acids Res.1998 Oct 1;26(19):4395-400およびKunkel et al.(1981)Proc.Natl Acad Sci.USA,78,6734-6738。
【0921】
ポリヌクレオチドの染色
任意選択的に、一部の実施形態では、ポリヌクレオチドDNA染色の骨格を追跡するために、他のポリヌクレオチド結合試薬を使用することができる。挿入色素、主溝結合剤、標識された非特異的DNA結合タンパク質、カチオン性共役ポリマーは、DNAに結合することができる。挿入色素は、様々な核酸塩基対色素比で使用することができる。約1:5~10の色素対塩基対比での複数の挿入色素ドナーを使用すると、成長するDNA鎖に沿ったヌクレオチド付加のためのドナーとして機能するのに十分な、色素分子(例えば、Sybr Green1、Sytox Green、YOYO-1)によるDNAの標識につながる。いくつかのDNA結合試薬は、ポリヌクレオチドを実質的にカバーすることができる。これらのDNA染色剤は、均一にまたはリアルタイム配列決定においてFRETパートナーとして機能することもできる。YOYO-1などの挿入色素を添加すると、DNAを暗く保ち、BMEなどの試薬を添加して、DNAのニッキングを防止することが有用である。一部の実施形態では、ポリヌクレオチドは、事前に染色されていないが、染色剤は、変性DNAへの結合プロセス中に添加される。ポリヌクレオチド-オリゴ二重鎖が形成されると、色素が挿入され得、その時点で、プローブ上の標識なしに、蛍光が検出される。一部の実施形態では、プローブ上にFRETパートナーである標識が存在し、標識と挿入色素との間のFRET相互作用が存在する。
【0922】
一部の実施形態では、結合プローブは、結合プローブ間の二重鎖が形成された場合、挿入色素などのFRETドナーを介して励起され得る。数ナノメートルの解像度を得ることが可能である(例えば、Chemphyschem.2014 Aug 25;15(12):2431-5に記載されている)。
【0923】
単一分子局在化を使用した伸長DNAに沿った配列決定
一過的な結合の概念は、それらが反応条件下で一過的に結合することができる限り、様々な種類の結合プローブに拡張することができる。結合プローブは、標識の異なるフレーバー(例えば、異なる波長の発光)を有するフルオロフォアで標識することができる。
【0924】
一部の実施形態では、蛍光修飾DNAオリゴは、Biosynthesisから購入される。ストレプトアビジンは、Invitrogenから購入される(カタログ番号:S-888)。ウシ血清アルブミン(BSA)およびBSA-ビオチンは、Sigma Aldrichから購入される(カタログ番号:A8549)。スライドガラスおよびカバースリップは、VWRから購入される。試料の調製および撮像に、3つの緩衝液が使用される:緩衝液A(10mMのTris-HCl、100mMのNaCl、0.05%のTween-20、pH7.5)、緩衝液B(5mMのTris-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8)、および緩衝液C(1×リン酸緩衝生理食塩水、500mMのNaCl、pH8)。
【0925】
一部の実施形態では、蛍光撮像は、完全フォーカスシステムを備えた倒立Nikon Eclipse Ti顕微鏡(Nikon Instruments)上で実施され、油浸対物レンズ(CFI Apo TIRF 100×、NA1.49、Oil)を用い、Nikon TIRF照明器を使用した、対物レンズ型TIRF構成を適用する。2D撮像の場合、107nmの画素サイズに対応する?150倍の最終倍率を得るために、追加の1.5の倍率が使用される。励起には、488nm(200mW、Coherent Sapphire)、561nm(200mW、Coherent Sapphire)、647nm(300mW、MBP Communications)の3つのレーザが使用される。レーザビームは、クリーンアップフィルタ(ZT488/10、ZET561/10、およびZET640/20、Chroma Technology)を通過し、マルチバンドビームスプリッター(ZT488rdc/ZT561rdc/ZT640rdc、Chroma Technology)を使用して、顕微鏡対物レンズに結合する。蛍光は、発光フィルタ(ET525/50m、ET600/50m、およびET700/75m、Chroma Technology)でスペクトル的にフィルタリングし、EMCCDカメラ(iXon X3 DU-897、Andor Technologies)で撮像する。
【0926】
一部の実施形態では、試料調製のために、カバースリップ(No.1.5、18×18mm2、?0.17mm厚)およびスライドガラス(3×1インチ2、1mm厚)を、2枚の両面テープで一緒に挟んで、約20μLの内部体積を有するフローチャンバーを形成する。まず、20μLのビオチン標識ウシアルブミン(1mg/ml、緩衝液A中に溶解)をチャンバーに入れ、2分間インキュベートする。次いで、40μLの緩衝液Aを使用してチャンバーを洗浄する。次いで、20μLのストレプトアビジン(0.5mg/mL、緩衝液A中に溶解)をチャンバーに通し、2分間結合させる。40μLの緩衝液Aで洗浄した後、続いて、40μLの緩衝液Bで洗浄する。最後に、20μLの緩衝液B中のビオチン標識DNAオリゴ鋳型およびプライマー(約300pMのモノマー濃度)およびDNA折り紙ドリフトマーカー(約100pM)をチャンバーに入れ、5分間インキュベートする。
【0927】
理想的には、温度およびオリゴ配列を選択して、組み込みに好適な塩濃度を実施できるようにする。CCD読み出しの帯域幅は、16bitで1MHz、プリアンプゲインで5.1MHzに設定されている。撮像は、561nmで294W/cm2の励起強度を有するTIR照明を使用して行われる。
【0928】
より高速な撮像を可能にする高速なCMOSカメラが利用可能になりつつある。例えば、Andor Zyla Plusは、USB3.0接続だけで、512x1024にわたって最大398fpsを可能にし、関心領域(ROI)にわたって高速になり、またはCameraLink接続も可能である。したがって、より短いドッキング/撮像鎖で、またはより高い温度で、またはより低い塩濃度で動作することにより、短時間で必要な分解能のために十分な情報を収集することが可能である。このため、高いレーザ出力(例えば、500mW)が好ましく、高いカメラ量子収率(例えば、約80%)が好ましく、高い色素輝度が好ましい。これにより、必要な取得時間を、数秒に短縮することができる。しかし、これは回折限界法の10倍を超える分解能ゲインを与え得る。
【0929】
本発明の一実施形態では、CCDまたはCMOSカメラとの時間遅延積分を使用して、新規の撮像方法が実装され、試料ステージがカメラの読み出しと同期して移動し、時間分解能が多くの画素にわたって広がるようにする。これにより、表面上のある場所から別の場所への移動の遅延がないため、画像取得が加速する。結果は撮像ストリップであり、列の最初の1000画素は、1つの場所の撮像の10秒を表し、次の1000画素は、次の場所の10秒の撮像を表す。また、Appl Opt.54:8632-6(2015)に記載されている方法も、適合させることができる。
【0930】
光散乱ナノ粒子(例えば、金ナノ粒子)または半導体ナノ結晶が使用される場合、これらの粒子のより明るく、ほぼ非網羅的な光学応答のために、速度の実質的にさらなるステップアップがある。繰り返しになるが、このようなナノ粒子標識を使用する場合、最大速度を向上させるために、カメラのフレームレートおよび撮像剤のオン/オフ速度を調整する必要がある。
【0931】
一過的な結合アプローチの例として、光退色または暗状態の影響がほとんどなく、洗練されたフィールドストップまたはパウエルレンズが照明を制限する必要がないことが挙げられる。加えて、表面への非特異的結合の影響は、非特異的部位へのプローブ結合のかかる非存続性によって緩和され、撮像剤が非特異的結合部位(すなわち、標的ドッキング上ではない)を占有すると、その位置に留まり、その場所へのさらなる結合を遮断する。典型的には、標的ポリヌクレオチドへの撮像剤結合の解像を妨げる非特異的結合部位の大部分は、撮像の初期段階のうちに占有および退色され、撮像剤のポリヌクレオチド部位へのオン/オフ結合が、その後、容易に観察されるようになる。したがって、一実施形態では、高いレーザ出力を使用して、最初にオン特異的結合部位を占有するプローブを退色させ、任意選択的に、この段階のうちは画像を撮影せず、次いで、任意選択的に、レーザ出力を低減させ、撮像を開始して、ポリヌクレオチドへのオン・オフ結合を捕捉する。最初の非特異的結合後のさらなる非特異的結合は、頻度が低く(退色されたプローブが、非特異的結合部位に固着したままであり得るため)、例えば、ドッキング部位への特異的結合とみなされる閾値を適用することによって、計算的にフィルタリング除去され得、同じ場所への結合は、持続的でなければならない(例えば、同じ部位で、少なくとも5回または少なくとも10回発生するはずである)。典型的には、ドッキング部位への特異的な結合事象が、約20回検出される。
【0932】
本発明者らの目的のために、非特異的である結合をフィルタリング除去するための別の手段は、シグナルが表面に伸展された線状の鎖と相関しなければならないことであり、これは、線状の鎖を染色することによって、または他の持続的な結合部位を介してラインを追跡することによって、行うことができる。持続的であるかどうかにかかわらず、線に沿って落ちないシグナルは廃棄することができる。同様に、超分子格子が使用される場合、格子の構造と相関しない結合事象は破棄され得る。
【0933】
表面での単一細胞の単離、ならびにDNAおよびRNAの両方の抽出
ポリ(L)リジン(PLL)(例えば、Microsurfaces Inc.から入手可能であるか、または独自にコーティングするか)などの正電荷を有する表面は、細胞膜に結合し得ることが知られている。細胞が表面と接触する可能性が高くなるように、低い高さのフローチャネルの高さ(30ミクロン未満)が使用される。これは、フローセルの天井に、乱流を導入するヘリンボーンパターンを使用することによって強化することができる。細胞の付着は、細胞が低密度で表面に播種される必要があるため(各々の個々の細胞から抽出されるRNAおよびDNAが空間的に分離したままであるように、細胞間に十分なスペースがあることを確実にするため)、効率的である必要はない。細胞膜および核膜の両方が破壊されるように、細胞内容物が培体中に噴出され、単離された細胞の近傍の表面で捕捉されるように、プロテイナーゼ処理を使用して、細胞を破裂させる。ゲノムDNAの場合、確立された細胞遺伝学的技術であるFiber FISHのから、このアプローチが優先される。固定化されたら、DNAおよびRNAが伸展される。伸展緩衝液は、カバーガラス表面にわたって一方向に流れ、DNAおよびRNAポリヌクレオチドを、流れの方向に伸展させ、整列させる。温度、伸展緩衝液の組成、および流れの物理的な力により、RNAの二次/三次構造の大部分を除去することができ、RNAが抗体への結合に利用可能となる。RNAが伸展されると、変性形態で、変性緩衝液から結合緩衝液に切り替えることが可能である。
【0934】
代替的に、RNAは、まず、細胞膜を破壊し、一方向に流れを誘導することによって、抽出され、固定化される。次に、プロテイナーゼを使用することによって、核膜を破壊し、逆方向に流れを誘導する。一部の実施形態では、DNAは、例えば、レアカッティング制限酵素(例えば、NOT1、PMME1)を使用することによって、遊離の前または後に断片化される。この断片化は、DNAの解離を助け、個々の鎖を単離およびコーミングすることが可能になる。固定化された細胞は、各細胞から抽出されたRNAおよびDNAが混ざり合わず、十分に離れているように、システムのセットアップを確実にする。これは、細胞の破裂の前、後、または際に、液体をゲルへ転移させることによって補助され得る。
【0935】
RNAの伸展
荷電表面上の核酸の伸展は、溶液のカチオン濃度によって影響を受ける。低塩濃度では、RNAは一本鎖であり、その骨格に沿って負に帯電し、その長さに沿ってランダムに表面に結合する可能性が高い。
【0936】
これに対する1つのアプローチは、最初に、高塩を使用することによって、その球状形態を促進することであり、そのような場合、末端、特にポリAテールは、相互作用によりアクセスしやすい。球状形態で結合したら、変性緩衝液として機能する異なる緩衝液をフローセルに適用することができる。代替的に、我々は、mRNAのポリAテールを捕捉するために、PLLをオリゴd(T)で予めコーティングする選択肢を有する。複数のグループが、mRNAのポリアデニル化3’へのオリゴ(dT)結合を使用して、mRNAの表面への結合を実証している(例えば、Ozsolak F,et al.)[4]。ポリAテールのホモポリマーの性質は、さもなければ捕捉を妨げ得る二次構造を比較的含まない領域であるべきことを意味する。ポリAテールは、高等真核生物では比較的長いため(250~3000nt)、長いオリゴd(T)捕捉プローブを設計して、RNAの分子内塩基対形成のかなりの部分を融解させるのに十分な比較的高い厳密性(温度、塩条件)で、ハイブリダイゼーションを行うことができる。オリゴd(T)を、結合の安定性を増加させる修飾で試験し、架橋修飾で試験して、結合後にRNAを捕捉プローブに固定することができる。結合後、残りのRNA構造を球状状態から線状状態へ転移させることは、捕捉を無効にするのに十分ではないが、RNAの分子内塩基対形成を破壊し得る変性条件を使用することによって、および流体の流れまたは電気泳動力によって、行うことができる。
【0937】
配列決定計装とデバイス
本発明の配列決定方法は、共通の計装要件を有する。基本的に、機器は撮像および試薬の交換が可能でなければならない。撮像要件には、1つ以上のグループ:対物レンズ、リレーレンズ、ビームスプリッター、ミラー、フィルタ、カメラまたはポイント検出器が含まれる。カメラには、CCDまたはアレイCMOS検出器が含まれる。ポイント検出器には、光電子増倍管(PMT)またはアバランシェフォトダイオード(APD)が含まれる。いくつかのCESA高速カメラが使用される。その他の任意選択的な態様は、本方法の形式に応じて、照明源(例えば、ランプ、LED、またはレーザ)、および照明を基板に結合するための手段、例えば、プリズム、格子、ゾル-ゲル、レンズ、移動ステージまたは可動対物レンズ、撮像デバイスに対する試料の移動、試料の混合/撹拌、温度制御、および電気。
【0938】
本発明の単一分子の実施態様では、照明は、好ましくは、エバネッセント波の生成を介し、例えば、プリズムベースの全内部反射、対物レンズベースの全内部反射、格子ベースの導波路、ヒドロゲルベースの導波路、または好適な角度でレーザ光を基板のエッジにもたらすことによって生成されるエバネッセント導波路を介し、導波路は、コア層および第1のクラッド層を含み得る。照明は、代替的に、薄層斜光(HILO)照明またはライトシートを含み得る。いくつかの単一分子機器では、パルス照明と時間ゲート検出の同期を使用することによって、光散乱の影響を軽減する。ここでは、光散乱がゲートアウトされる。一部の実施形態では、暗視野照明が使用される。蛍光寿命測定のために設定されている器具もある。
【0939】
一部の実施形態では、機器はまた、細胞、核、オルガネラ、染色体などからポリヌクレオチドを抽出するための手段を含む。
【0940】
本発明のほとんどの実施形態に好適な機器は、IlluminaからのゲノムアナライザーIIxであり、この機器は、プリズムベースのTIR、20×乾燥対物レンズ、ライトスクランブラ、532nmおよび660nmのレーザ、赤外線ベースの自動焦点システム、発光フィルタホイール、Photometrix CoolSnap CCDカメラ、温度制御、および試薬交換用のシリンジポンプベースのシステムで構成されている。この機器を代替カメラの組み合わせを用いて改良することで、より良好な単一分子配列決定が可能になる。例えば、センサーは、好ましくは、低い電子ノイズ、2e未満を有する。また、センサーは、多数の画素を有する。シリンジ-ポンプベースの試薬交換システムは、圧力駆動フローベースのシステムに置き換えることもできる。システムは、互換性のあるIlluminaフローセル、または機器の実際の配管もしくは改良された配管に合うように適合されたカスタムのフローセルとともに使用ことができる。
【0941】
代替的に、レーザベッド(レーザは、標識の選択に依存する)またはゲノム分析デバイスからのレーザシステムおよびライトスクランブラ、EM CCDカメラ(例えば、Hamamatsu ImageEM)またはScientific CMOS(例えば、Hamamatsu Orca FLASH)と結合された電動Nikon Ti-E顕微鏡、および任意選択的に、温度制御を使用することができる。一部の実施形態では、科学用センサーではなく消費者用センサーが使用される。これは、配列決定のコストを劇的に低減する可能性を有する。これは、圧力駆動またはシリンジポンプのシステム、および特別に設計されたフローセルと結合されている。フローセルは、ガラスまたはプラスチックで製作され、それぞれ利点および欠点を有する。環状オレフィンコポリマー(COC)、例えば、TOPAS、他のプラスチック、もしくはPDMS、またはシリコンもしくはガラス中で、微細加工法を使用して。熱可塑性プラスチックの射出成形は、工業規模の製造に低コスト化の道筋を提供する。一部の光学構成では、熱可塑性プラスチックは、最小限の固有蛍光を有する良好な光学特性を有する必要がある。芳香族または共役系を除く、含むポリマーは、顕著な固有蛍光を有することが予想されるため、理想的には除外されるべきである。Zeonor1060R、Topas5013、PMMA-VSUVT(US8057852B2)は、緑色および赤色の波長範囲(例えば、Cy3およびCy5に対して)で妥当な光学特性を有することが報告されており、Zeonar1060Rが最も好ましい。このような表面のいくつかにプローブを共有結合させるための方法が利用可能である。熱可塑性プラスチックを結合するための方法が報告されている(例えば、Microfluidics and Nanofluidics,19(4),913-922)。一部の実施形態では、バイオポリマーが付着されるガラスカバーガラスは、熱可塑性プラスチックの流体アーキテクチャに結合される。ガラスは、優れた光学特性ならびにいくつかの他の利点を有するが、現在利用可能な選択肢があるものの、低コストで複雑なマイクロ流体デバイスを製造することは困難であった(Scientific Reports 5:13276(2015))。
【0942】
代替的に、手動操作のフローセルは、顕微鏡の上部で使用することができる。これは、両面粘着シートを使用してフローセルを作製し、適切な寸法のチャネルが得られるようにレーザ切断し、カバースリップとスライドガラスとの間に挟むことによって、簡単に構築することができる。
【0943】
ある試薬交換サイクルから別の試薬交換サイクルまで、フローセルは、フレーム間の位置合わせまで、機器/顕微鏡上に留めてもよい。リニアエンコーダを備えた電動ステージを使用して、広い領域を撮像する際のステージの移動を確実にし、同じ場所が正しく再訪され、正しい位置合わせを確実にするために、基準マーカーが使用され得る。代替的に、フローセルは、各撮像ラウンドの後に機器/顕微鏡から除去され、組み込み反応は、例えば、次のラウンドの撮像のために顕微鏡に戻される前に、フラットブロックを有するサーマルサイクラーで他の場所で行われる(撮像という用語は、2Dアレイまたは2D走査検出器を含むように使用される)。この場合、フローセルまたは表面のエッチングなどの基準マーキング、光学的に検出され得るフローセル内の固定化されたビーズを有することが重要である。ポリヌクレオチド骨格が染色される場合(例えば、YOYO-1によって)、それらの固定位置の分布場所を使用して、画像をあるフレームから次のフレームに整列させることができる。
【0944】
一実施形態では、本発明の方法を実施するために、レーザまたはLED照明を使用するUS7175811またはRamachandran et al(Scientific Reports 3:2133)に記載されている照明機構を、温度制御機構および試薬交換システムと結合することができる。一部の実施形態では、スマートフォンベースの撮像設定(ACS Nano7:9147)が、任意選択的な温度制御モジュールおよび試薬交換システムと結合され得る。主に、電話のカメラが使用されるが、iPhoneまたは他のスマートフォンデバイスの照明および振動機能などの他の態様も使用することができる。
【0945】
GAIIxなどの光学配列決定システムの様々な顕微鏡様構成要素を使用する代わりに、配列決定のために、より統合された一体化デバイスが構築され得る。ここで、ポリヌクレオチドは、センサーアレイ上に、またはセンサーアレイに隣接する基板上に直接結合され、任意選択的に、伸長される。センサーアレイ上での直接検出は、アレイへのDNAハイブリダイゼーションに関して、実証されている(Lamture et al Nucleic Acid Research 22:2121-2125(1994))。レイリー散乱が蛍光色素からの発光と比較して短命であることから、センサーを時間ゲートして、バックグラウンド蛍光を低減することができる。
【0946】
一実施形態では、センサーはCMOS検出器である。一部の実施形態では、複数の色が検出される(US2009/0194799)。一部の実施形態では、検出器は、Foveon検出器である(例えば、US6727521)。センサーアレイは、三重接合ダイオードのアレイ(US9105537)であり得る。一部の実施形態では、オリゴまたは他の結合試薬上の異なる標識は、発光の波長によってコードされる。一部の実施形態では、異なる標識は、蛍光寿命によってコードされる。一部の実施形態では、異なる標識は、蛍光偏光によってコードされる。一部の実施形態では、異なる標識は、波長、蛍光寿命の組み合わせによってコードされる。
【0947】
単一の波長を光源として使用し、フィルタを使用する必要がないことは、セットアップの単純さのため、およびフィルタを使用する場合に必然的に一部の光の損失があるための両方で有利である。一部の実施形態では、異なる標識は、反復的なオン・オフのハイブリダイゼーション動態によってコードされ、異なる会合定数-解離定数を有する異なる結合プローブが使用される。一部の実施形態では、プローブは蛍光強度によってコード化される。プローブは、異なる数の結合された非自己消光性フルオロフォアを有することによってコードされた蛍光強度であり得る。個々のフルオロフォアは、通常、クエンチさせないように十分に分離されている必要があり、それらを好適な距離で所定の位置に保持する剛性リンカーまたはDNAナノ構造が、これを達成するための良好な方法である。蛍光強度によるコード化のための1つの代替的な実施形態は、類似の発光スペクトルを有するが、それらの量子収率または他の測定可能な光学特性が異なる色素バリアントを使用することであり、例えば、Cy3B(558/572)は、Cy3(550/570)(量子収率0.15)よりもかなり明るいが(量子収率0.67)、類似の吸収/発光スペクトルを有する。532nmレーザを使用して、両方の色素を励起することができる。使用され得る他の色素としては、Cy3.5(591/604)が挙げられるが、これは、シフトアップした励起スペクトルおよび発光スペクトルを有する一方、それでも532nmレーザによって励起されるが、Cy3からの発光を選択するように設計されたバンドパスフィルタでは、Cy3.5が準最適な波長によって励起されているため、両方が同様の量子収率を有するにもかかわらず、明るく見えない。Atto532(532/553)は、0.9の量子収率を有し、532nmレーザがそのスイートスポットに当たるため、明るいと予想される。これらの期待にもかかわらず、使用される色素は、それらの性能を適切に測定するために経験的に試験されなければならない。前述のセットからの色素を区別することができない場合、他の色素を試験することができる。単一の励起波長を使用して複数のコードを得るための別のアプローチは、色素の発光寿命を測定することである。このために、Alexa Fluor546、Cy3B、Alexa Fluor555、およびAlexa Fluor555を含むセット、ならびに多くの他の組み合わせを使用することができる。一部の実施形態では、コードのレパートリーは、FRETペアを使用することによって、および放射光の偏光を測定することによっても拡張され得る。したがって、波長、寿命、偏光、FRETペアの所望の組み合わせで、区別可能な標識の多くのレパートリーが作成され得る。標識の数を増やすための別の手段は、複数の色でコードすることである。
【0948】
現在の光学配列決定方法は、画像処理ステップを必要とし、画像から配列シグナルが抽出される。これには、通常、画像の各フレームから関連するシグナルを抽出することが含まれる。一実施形態では、代替は、すべての画素から、すべてのサイクルを通して垂直的にシグナルを捕捉し、アルゴリズムを使用して配列を計算することである。このアプローチの1つの利点は、シグナルのトラジェクトリーが、サイクルを通して垂直的に見られる場合、非特異的シグナルまたはバックグラウンドシグナルをフィルタリングすることが容易であり、それらは通常、サイクルを通して同じ場所で生じないが、実際の組み込みは同じ場所で生じる。また、特定の伸長された分子に属するシグナルは、一連の画素を通して直線によって追跡され得るため、決定することも容易である。
【0949】
脂質不動態化
ナノ流体チャネルの表面で脂質二重層(LBL)を生成する場合、本発明者らは、蛍光顕微鏡でのLBL形成の観察を可能にするために添加される1%のリサミン(商標)ローダミンB 1,2-ジヘキサデカノイル-sn-グリセロ-3-ホスホエタノールアミン、トリエチルアンモニウム塩(ローダミン-DHPE)脂質を含む、両性イオンPOPC(1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン)脂質を使用した。各コーティング手順の前に、直径が約70nmの脂質小胞を押し出しによって作製した(ESIを参照)。押し出した小胞溶液を、流体系のマイクロチャネルの1つを通してフラッシュした。続いて、脂質小胞が表面に沈降し、破裂し、LBLのパッチを形成し、数分以内に連続的なLBLへと繋がり、マイクロチャネル全体をコーティングする。その後、脂質小胞の流れがコーティングされたマイクロチャネル内で維持されている間、LBLがナノチャネル内に自発的に拡散し、小胞の安定した供給を確保する。コーティングプロセスの間、ナノチャネルを通して対向流(約80μm/秒)が、コーティングされたマイクロチャネルに課され、ナノチャネル内のいかなる破片または小胞を回避する。少し速い代替の方法も試験され、ナノチャネルを通して、LBLでコーティングされたマイクロチャネルから、脂質小胞をフラッシュすることを伴い、ナノチャネル内の脂質小胞の沈降および破裂がもたらされた。しかしながら、この方法では、小胞および他の残渣が堆積し、ナノチャネルが潜在的に遮断されるのを防止するように注意を払う必要がある。
【0950】
エピマーキング試薬および標識方法
ポリヌクレオチド上のゲノム修飾またはエピジェネティック修飾(Epi-Marks)は、本発明の方法を使用して検出され得る。本明細書における焦点は、ヒトにおいて5-メチルシトシンの形態で、通常、CpGモチーフの文脈で生じるゲノムDNA上のメチル基への結合である。しかしながら、同じ原理を、ヒドロキシルメチルCのような他の修飾、ならびに様々な種類のDNA損傷に適用することができる。RNA上の修飾は、同様に標識することができる。1つ以上の種類の異なる数の修飾(オリゴヌクレオチド合成には、様々な修飾が利用可能である)を含むtrRNAaなどの合成DNAおよびRNAならびにRNAモデルは、商業ベンダー(例えば、IDT、Trilink)から得ることができる。DNAの場合、ゲノムメチルCに対する抗体(Diagenodeなどから入手可能)、メチル結合タンパク質1(MBD1)、およびMBD1のペプチド断片(いずれもAbcamから)の親和性結合を、試験し、最適化することができる。RNAの場合、メチルアデノシン(m6A)(Abcamから入手可能)およびm7G-cap(対照として)(SySy.comから入手可能)に対する抗体などの抗体を、試験し、最適化することができる。これらの修飾を含むDNAまたはRNAへの結合の効率は、2つのメトリックを用いて測定することができる。まず、親和性試薬の、オリゴヌクレオチド配列の修飾および非修飾バージョンへの結合、ならびにDNAおよびRNAのバージョンの両方に対する結合は、例えば、濾紙上でのスポッティングおよび結合を使用して試験することができる。標的修飾を含むか、非標的修飾を含むか、または修飾を含まない、いずれかの合成オリゴヌクレオチドに対する各抗体の結合の効率および特異性を確立することができる。抗メチル抗体については、ゲノムDNAをインサイツで変性させることが好ましい。
【0951】
局所的な枯渇と層流の軽減効果
プローブ溶液の効率的な混合または撹拌を確実に行うことによって、プローブの局所的な枯渇に対処することができる。これは、乱流を生成する粒子を溶液中に含ませることによって、および/または乱流を生成するフローセル(例えば、1つ以上の表面上のヘリンボーンパターン)を構築することによって、音響波を使用して行うことができる。加えて、フローセル内の層流のため、典型的には、混合がほとんどなく、表面に近い溶液は、バルク溶液とほとんど混合されない可能性がある。これにより、表面近くにある試薬/結合プローブを除去し、表面に新鮮な試薬/プローブをもたらす上で問題が発生する。これに対処するために、上記の乱気流生成アプローチを実施することができ、かつ/または表面での大規模な流体の流れ/交換を行うことができる。1つのアプローチは、標的分子を整列させた後、表面に非蛍光ビーズまたはスフィアを付着させ、表面のランドスケープを粗い質感にして、表面近くの流体をより効果的に混合および/または交換するのに必要な渦および流れを生成する。
【0952】
高速撮像
単一分子局在顕微鏡法(SMLM)は、高い光子計数に依存する。高い光子計数は、ガウスパターンのフルオロフォア生成の重心を決定することができる精度を向上させるが、高い光子計数の必要性は、長い画像の取得および明るく光安定なフルオロフォアへの依存性にも関連している。プロセスの速度は、高フレーム検出をプローブの濃度の増加と結合することによって増加し得る。しかしながら、高濃度の標識プローブは、高いバックグラウンド蛍光を引き起こす可能性があり、これは表面上のシグナルの検出を曖昧にする可能性がある。これは、表面に形成される二重鎖を標識するためのDNA染色剤または挿入色素を使用することによって対処することができる。色素は、標的が一本鎖の場合は挿入されず、一本鎖プローブにも挿入されないが、それらの間に二重鎖が形成された場合に挿入される。一部の実施形態では、プローブは、標識されておらず、検出されるシグナルは、挿入色素のみに起因する。一部の実施形態では、プローブは、挿入色素またはDNA染色剤に対するFRETパートナーとして機能する標識で標識される。挿入色素は、ドナーであり得、異なる波長のアクセプターと結合され得、したがって、プローブを複数のフルオロフォアでコードすることが可能になる。
【0953】
さらなる実施例
ポリヌクレオチド上のエピマークの場所の検出
【0954】
任意選択的に、オリゴ結合プロセスの前(または、時にはその後またはその間)に、エピゲノム結合試薬の一過的な結合が行われる。どの結合試薬が使用されるかに応じて、結合は、変性の前または後に行われる。一部の実施形態では、抗メチルC抗体結合は、変性DNA上で行われるが、メチル結合タンパク質の場合、任意の変性ステップの前に、二本鎖DNA上で結合が行われる。
【0955】
ステップ1-メチル結合試薬の一過的な結合。
【0956】
変性後、フローセルをPBS洗浄でフラッシュし、Cy3B標識抗メチル抗体3D3クローン(Diagenode)を一過性タンパク質結合試薬中に添加し、結合を撮像する。
【0957】
代替的に、変性の前に、フローセルをリン酸緩衝生理食塩水でフラッシュし、Cy3B標識MBD1を添加し、一過性タンパク質結合試薬中で撮像する。一過的なオリゴ結合についての撮像は、上に記載のように行われる。
【0958】
一過性結合緩衝液は、pH2.8での溶出緩衝液である。典型的な溶出緩衝液は、50mMのHEPES(pH7.9)、0.1MのNaCl、1.5mMのMgCl2、0.05%のTritonX-10を含む。一過的な相互作用はまた、0.2%のSDSおよび0.1%のTween-20で、室温で7分行うことができる。さらに、DNAとの一過的なタンパク質相互作用は、0.1MのグリシンHCl、pH2.5~3で行うことができる。この緩衝液は、タンパク質構造に永久的に影響を与えることなく、ほとんどのタンパク質または抗体の結合相互作用を効果的に解離する。しかしながら、いくつかの抗体およびタンパク質は、低いpHによって損傷されるため、溶出されたタンパク質画分を、1/10容量のアルカリ性緩衝液(1MのTris.HCl、pH8.5またはPBS緩衝液など)を添加することによって、直ちに中和することが最良である。
【0959】
一部の実施形態では、結合用にPBSが使用され、一過的な結合ではなく、安定した結合が検出され、場所が記録される。
【0960】
ステップ2-メチル結合試薬の除去
【0961】
典型的には、エピ分析は配列決定の前に行われ、したがって、任意選択的に、メチル結合試薬は、配列決定を開始する前に、ポリヌクレオチドの前にフラッシュ除去される。これは、複数のサイクルのPBS/PBSTおよび/または高塩もしくは溶出緩衝液およびSDSを流すことによって、次いで、除去が生じたことを撮像で確認することによって、行うことができる。無視できる量を超える結合試薬が残存していることが明らかな場合、カオトロピック塩、GuCLなどのより厳密な処理剤を流して、残った試薬を除去することができる。
【0962】
ステップ3-データ相関
配列決定およびエピゲノミクスデータが得られた後、配列決定の結合場所の場所間で相関を行い、エピ結合場所を相関させて、メチル化またはオミック情報の配列文脈を提供する。
【0963】
RNAの調製
ポリRNAを、表面に付着したオリゴdT(0.1~1uM)にハイブリダイズさせる。オリゴdTは、1つ以上のソラレン残基を含み、これにより、RNAをオリゴdTに架橋させる。次いで、RNAが所定の位置に固定されると、RNAは、流体の流れ、後退メニスカス、または変性溶液中で電気泳動的に伸展され、ny二次構造を開放するのに役立つ。RNAが伸展または伸長されると、本発明のオリゴ結合アプローチが適用される。
【0964】
ローリングサークル増幅を使用した長ssDNAの調製
二本鎖DNA標的を環状化し、次いでローリングサークル増幅を行い、二重鎖の一方のタンデム一本鎖コピーを生成する。dsDNAは、T4 DNAポリメラーゼ1(Roche)およびdNTP(Promega)を使用することによって研磨される。T4ポリヌクレオチドキナーゼは、5’ヒドロキシル基をリン酸化する。次いで、ステムループ(8~200塩基のdT:dAステム、ループはGGTTTTTCGCCCTTTCACGTTGGAを含む)を、T4 DNAリガーゼを使用して、研磨されたDNAの両方の末端にライゲーションする。プライミングは、ニックから、またはステムループ内で結合するプライマーから起こり得る。
【0965】
ローリングサークル増幅は、プライマーを使用して環状一本鎖標的上で行うこともでき、例えば、1μLの1nMのM13mp18鋳型(NEB)を以下のプロトコルで増幅することができる。プロトコルは、両端に結合したステムループを用いて、二本鎖DNAに適用することもできる。この場合、10μLの10×反応緩衝液(10×phi29 DNAポリメラーゼ緩衝液(B7020、Enzymatics、500mMのTris-HCl、100mMの(NH4)2SO4、40mMのDTT、100mMのMgCl2、pH7.5)、2.5μLの100nMのプライマー(TCCAACGTCAAAGGGCGAAAAACC、IDT)、および1.6μLのdNTPミックス(Enzymatics N2050L)を、水で48μLの体積にする。混合物を95℃で1分間、次いで、60℃で1分間インキュベートし、次いで、4℃にする。混合物を氷上に置き、2μLのphi29 DNAポリメラーゼ(10U/μL、Enzymatics P7020-LC-L)を添加する。混合物全体を、次いで、30℃で4時間インキュベートし、次いで、4℃にし、450μLの1×PBS(pH7.4)で希釈した。次いで、回収した溶液を、PBS中で100倍希釈する。配列決定の前に、保存溶液を、相補的配列(GGTTTTTCGCCCTTTGACGTTGGA,IDT)を含む表面にローリングサークルアンプリコンを添加し、アンプリコンが、その長さに沿った複数の相互作用を介して固定化されるようにする。
【0966】
代替的に、一本鎖オーバーハングを有する二本鎖DNAは、MES緩衝液 pH5.5で、オーバーハングの曝露された塩基と表面との間の疎水性相互作用を介してビニルシラン表面に付着する。次いで、緩衝液を変性緩衝液(0.5M~1MのNaOH)と交換し、固定化されていない鎖をフラッシュ除去され得るように数回の洗浄を行う。次いで、カバーガラスを再びMESに曝露し、DNAを後退メニスカスによって伸長させる。同様に、DNAの末端は修飾され得、例えば、ターミナルトランスフェラーゼ(NEB)によって、ホモポリマーテールを付加することができ、DNAは、次いで、相補ホモポリマーオリゴヌクレオチド上で捕捉することができる。次いで、二本鎖DNAの非捕捉鎖は、熱変性および/もしくは化学変性を使用して、または鎖を分離するヘリカーゼ(例えば、Hel308)などのモータータンパク質を使用することによって融解され得る。このため、ホンポリマーのテールは数十~数百ヌクレオチドであり得、捕捉プローブは同様に長くてもよい。代替的に、他方の鎖が変性している間、テール付加された鎖を所定の位置に保持するための架橋試薬が提供される。テール付加されたDNAはまた、二重らせんの2つの鎖を連結するために、ステムループで他端にライゲーションすることができ、その結果、DNAが捕捉されると、DNAの両方の鎖が配列決定され得る。この場合、一過性結合緩衝液は、LNA残基を含む一過的に結合するオリゴとの相互作用と比較して、二重鎖の塩基対を弱めるように(その再形成を防止し、したがって、オリゴの結合を妨げるように)構成される。
【0967】
NNNXNNNオリゴヌクレオチド種の核酸への結合
NNNXNNN(式中、Nは縮重位置であり、Xは指定された位置である)を使用した配列決定の場合、4つのオリゴヌクレオチドライブラリ5’NNNANNN3’、5’NNNCNNN3’、5’NNNGNNN3’,および5’NNNANNN3’の各々を、それぞれ、Atto488、Atto542、Alexa594、およびAtto655で差次的に標識し、各々100nM~1uMの濃度で、2.4~3.5MのTMAClまたは4×SSCおよび0.01~0.1%のTween20を含む15ulの液滴に組み合わせ、核酸分子が伸長または伸展された表面に適用する。カバーガラスは、エポキシ、カウガム、またはネイルワニスを使用してスライドガラスに密封される。カバーガラスは、Olympus 1X81倒立顕微鏡の顕微鏡IX2ノーズピース上に配置され、4つの組み合わせられたレーザ線(Agilent)、488nm、532nm、590、および640nmを使用して、クワッドバンドTIRFフィルタキューブ(Chroma)および1.45NA Olympus TIRF対物レンズを介して試料を同時に照射する。任意選択的に、光ファイバスクランブラ(点源)を使用して、ビームを均一化する。レーザ出力は、40~150mWの各波長で調整され、同等のシグナルの輝度が得られる。TIRF角度も調整され、照明チャネルの各々について最適なコントラスト画像が得られる。放射は、95B Scientific CMOSカメラ(Photometrics)に投影される前に、クワッドビュー(Quad-view)デバイス(Photometrics)の4つの象限に分割される。代替的に、4つの色素の4つの発光波長は、一連のダイクロイックミラーおよび反射ミラーを使用して複数のカメラに分割される。カメラの設定は、レーザ出力とともに調整されて、各色素についてほぼ等価のシグナル強度が得られるが、収集された結合情報はデジタルであるため、4つの色素からのシグナルの輝度は正確に等価である必要はない。各シグナルの特定は、クワッドビュー象限または複数のカメラの異なる発光チャネルにおける各色素の発光プロファイルを考慮に入れることによって、ソフトウェアによって決定される。次いで、以前に決定された発光プロファイルを使用して、色素の同一性を決定することができる。
【0968】
任意選択的に、1nMのYOYO-1または類似の挿入色素も反応混合物に添加され、最大1uMの高濃度のオリゴが使用され、カメラの高フレームレートと組み合わされる。ここでは、単一の488nmレーザのみを使用して、FRET機構を介して、4つの色素を励起させる。
【0969】
任意選択的に、基準マーカーとして、1uMのDNA折り紙グリッドとともにDNA PAINT撮像剤もまた、15ul混合物の一部として添加される。
【0970】
撮像データは、超解像画像処理パッケージ、例えば、ImageJ/FijiまたはPicassoへのプラグインであるThunderstorm(J.Schnitzbauer*, M.T.Strauss*,T.Schlichthaerle,F.Schueder,R.Jungmann Super-Resolution Microscopy with DNA-PAINT.Nature Protocols(2017).12:1198-1228 DOI:https://doi.org/10.1038/nprot.2017.024)を使用して処理される。
【0971】
次いで、超解像画像を処理して、核酸鎖に沿った結合位置の座標を見つけ、異なる定義されたヌクレオチドに対応する異なる色からのデータをコンパイルして、核酸鎖の各々の配列を再構築する。画像処理および配列アセンブリに関するより完全な情報については、PCTおよびその後継(offspring)に記載されている。
【0972】
ドリフト
最高の位置決定精度(例えば、数ナノメートルまたはサブナノメートル)を得るには、振動およびドリフト(例えば、熱変動によって引き起こされる)を制御することが重要である。ドリフトを防止するために、自動ステージを使用すべきではない。ステージが停止しているときでも、動きが残る場合が多く、数画素または数十画素のドリフトにつながるためである。基準マーカーは、ドリフトを補正するために使用することができる。蛍光標識されたラテックス粒子とともに、金粒子または銀粒子、半導体ナノ結晶、ナノダイヤモンドは、特に好ましいナノ粒子標識である。これらは、高い量子効率(QE)で光を放出し、高い光安定性、長い蛍光寿命(17ns)を有し(光散乱/自家蛍光(1~2ns)の時間ゲートに使用することができる)、小さい(例えば、40nm)場合がある。
【0973】
ドリフトは計算的に補正することもできる。ドリフト補正は、各動画の時間を通して各マーカーの位置を追跡し、検出されたすべてのマーカーの軌道を平均化して、画像の全体的に正しいドリフトを測定することを含む。また、Fiji/ThunderSTORM、ならびにMatLabには、妥当な効果があり、基準マーカーを必要とせず、むしろ自己相関によってドリフトを補正する固有のドリフト補正アルゴリズムがある。Nikon Ti顕微鏡には、Perfect Focusを有し、Olympusには、Zドリフト補償モジュール(IX3-ZDC2)がある。また、ドリフトを回避するためのローテク(low tech)方法は、試料ステージを対物レンズ(例えば、Olympus nosepieceステージ)に強固に取り付けることである。また、熱環境が十分に制御されている場合、ドリフトは、数分後に無視できるようになり、かつ/または安定化され得る。
【0974】
DNA折り紙、100nm金ナノ粒子、(Sigma Aldrich、緩衝液C中に10nM、撮像前に添加する)、100nMのTetrasppeckビーズ(Thermofisher)またはナノダイヤモンドを、ドリフトおよび整列のマーカーとして使用することができる。Photometrics Prime 95Bなどの既製カメラは、粒子追跡機能を備え、基準マーカーを焦点に合わせるために使用することができる。
【0975】
別の場合、焦点位置のドリフトは、カスタムビルドの焦点安定化によって排除され得る。近赤外線レーザ(LP785-SF20、Thorlabs)は、カバースライドおよび試料のガラス-水界面から完全に内部反射された。ビーム位置は、CMOSカメラ(UI-3240CP-NIR-GL,Imaging Development Systems,Obersulm,Germany)で監視される。LabVIEW 2015(National Instruments)に実装されたフィードバック制御は、レーザスポットの画像と参照画像の相互相関を最大化した。200msごとに軸方向の試料位置を調整する(P737.2SL and E-709.SRG,Physikalische Instrumente)。試料と対物レンズを、23℃に安定させる(H101-CRYO-BL安定化ユニット、H101-MINI試料チャンバーおよびOKO-MOC対物レンズ安定化を有する、Okolab、Ottaviano,Italy)。
【0976】
退色、三重状態、および光損傷を最小化するためのシステム
オリゴヌクエルチドを標識するために使用される色素に応じて、以下の試薬が有効である:
(a)ピラノースオキシダーゼ、カタラーゼ、グルコース、(b)プロトカテク酸-ジオキシゲナーゼ、3,4-プロトカテク酸、(c)カタラーゼ、グルコースオキシダーゼ、スクロースまたはグルコース(高安定性の商用バージョンのFluMaXx(Hypermol)が利用可能)。
(d)メチレンブルーおよびジチオトロール(DTT)、(e)βメルカプトエタノール、TCEP、またはジチオトロール(DTT)を含む還元剤、(f)Trolox、1,3,5,7シクロオクタテトラエン、および/または4-ニトロベンジルアルコールを含む三重状態消光剤/蛍光促進剤。
【0977】
酸素スカベンジャーとして、ピラノースオキシダーゼ、カタラーゼ、グルコース(PO+C)は特に有効であり、以下のように調製される:
【0978】
PO+Cを、PO+C酸素スカベンジャーシステム(1×PO、1×C、0.8%のグルコース)で測定する前に、1×Troloxを添加して1時間インキュベートする。ストック溶液:100×PO溶液は、26mgのPO(P4234-250UN、Sigma-Aldrich Chemie GmbH、Taufkirchen,Germany)、684μLの酵素緩衝液からなり、100×C溶液は、1mlの酵素緩衝液中の2mgのカタラーゼからなる。両方を遠心分離で濾過し(Ultrafree MC-GV、Merck KGaA、Darmstadt,Germany;0.22μm)、液体窒素中で急速冷凍し、?80℃で保存した。100×Trolox溶液は、100mgのTrolox(Sigma-Aldrich 238813-1G)、430μLのメタノール、および3.2mLのH2O中の345μLのNaOH(1M)からなり、?20℃で保存した。
【0979】
蛍光標識は、標的DNAに光損傷を誘発し得る。これを最小化するために、上記の添加剤のうちの1つ以上を添加することに加えて、蛍光標識を標的DNAから分離することが有用である。これは、2つの方法の一方または両方で行われる。第1は、単純に、オリゴヌクレオチド種と蛍光標識との間にスペーサーを付加することである。18塩基長スペーサーをオリゴヌクレオチドプローブに付加することができ、標識がCy3Bである場合に有効である。第2の方法は、標識とオリゴヌクレオチドとの間にタンパク質シールドを添加することであり、その結果、オリゴヌクレオチドが標的ポリヌクレオチド/核酸に結合した場合、タンパク質は、基板上の核酸に対する酸化プロセスの影響を軽減するシールドとして機能する。多数のタンパク質をシールドとして使用することができ、1つの例は、ビオチン化オリゴヌクレオチド種に連結され得、かつ1つ以上の蛍光色素で標識され得るストレプトアビジンである。
【0980】
大型エリアセンサー
長い分子のための大きな視野を得るために、多数の画素を有するカメラは、低倍率の対物レンズと連結されている。1200万の3.5ミクロン画素と低い電子ノイズを含むSony IMX253センサーを含むカメラを使用することができる。このセンサーは、高速データ転送のための10GigEインターフェースに接続されている(Emergent Vision Technologies(Canada)によるHR1200では、毎秒80フレームが可能である)。このカメラは、20×0.75NAのニコン対物レンズに連結されており、センサーの一軸に約2メガ塩基長の伸展されたDNAを撮像することができる。
【0981】
温度制御および試薬交換
温度制御および試薬交換は、CherryTemp(France)高速切り替えおよび正確な温度制御システム、ならびに固定され伸長/伸展された核酸および複数の試薬の入口および圧力駆動フローシステム(Elvesys、France)に接続された1つ以上の出口を含むカバーガラス上に結合された灌流チャンバーを含むシステムを使用して実施される。複数の試薬を送達するため、Elvesys圧力発生器パイプをスプリッター内に入れ、送達する試薬のチューブ内に圧力を加え、試薬をバルブ内に押し込み、次いで、バルブを切り替えて、キャピラリーチューブを介してフローセルに特定の試薬を送達する。流量センサーは、0~80ul/分の流速を測定し、必要な流速(例えば、10ul/分)の適切なレベルに圧力発生器を調節するためのフィードバックを提供するために、フローラインに統合される。
【0982】
本発明は、本明細書の教示および本明細書に列挙される参考文献に照らして、最も完全に理解される。本明細書内の実施形態は、本発明の実施形態の例示を提供し、本発明の範囲を限定すると解釈されるべきではない。当業者は、多くの他の実施形態が本発明によって包含されることを容易に認識する。当業者は、通常の実験のみを使用して、本明細書に記載の本発明の特定の実施形態と多くの均等物を認識するか、または確認することができるであろう。そのような均等物は、特許請求の範囲(下記)に包含されることが意図されている。
【0983】
追加の実施形態
1.単一ポリマー分子中のサブユニットの配列を識別するための方法であって、
i.ポリマーを固定化することと、
ii.ポリマーを、当該ポリマーのサブユニットを認識する分子プローブと接触させることと、
iii.分子プローブの結合部位を、位置決定することと、
iv.分子プローブの結合場所を決定することによって、サブユニットの場所を決定することと、を含む、方法。
【0984】
2.ステップ(ii)および(iii)を複数回反復することを含む、1に記載の方法。
【0985】
3.同じ特異性のプローブを、複数回結合させることを含む、2に記載の方法。
【0986】
4.(ii)の各反復において、異なる特異性の結合プローブを含む、2に記載の方法。
【0987】
5.分子プローブを接触させることが、ポリマーとのプローブの複数の一過的な結合事象を含む、1に記載の方法。
【0988】
6.単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を、配列決定するための方法であって、
i.ポリヌクレオチドを、表面またはマトリックス上に固定化することと、
ii.プローブがそれらの結合部位に一過的に結合する条件下で、1つ以上のプローブ種を添加することであって、かかる一過性は、複数のプローブが結合部位の各々に次々と結合することを可能にし、標的部位への結合が、非標的部位への結合から区別され得る(例えば、結合の持続時間の差によって)、添加することと、
iii.閾値数の結合事象が蓄積されているように、2D検出器上のポリヌクレオチドを、連続的に撮像し(または、複数のフレームを撮影し)、結合の画素座標を記録することと、
iv.iiのプローブを除去することと、
v.毎回、異なる1つ以上のプローブ種を用いて、ステップii~ivを反復することと、
vi.ステップiiiの各反復からのデータを、単一分子局在化アルゴリズムを使用してコンパイルして、プローブが持続的に結合する結合部位の各々のナノメトリックまたはサブナノメトリックな場所(例えば、結合部位への10以上の結合事象)を提供し、ナノメトリックな局在部位をプローブ種(例えば、特異的オリゴヌクレオチド配列または特異的抗体)の同一性と相関させることと、
vii.viを使用して、ナノメトリック場所の各々における結合種の順序(配列)を決定して、ポリヌクレオチドのヌクレオチド修飾および/または塩基配列をコンパイルすることと、を含む、方法。
【0989】
7.伸長ならびに固定化することと、を含む、1および6に記載の方法。
【0990】
8.各特異性のプローブの同一性が、既知であるか、または決定され得る、1に記載の方法。
【0991】
9.結合プローブが、オリゴヌクレオチドである、1および6に記載の方法。
【0992】
10.結合プローブが、抗体、アフィボディ、アフィマー、ナノボディ、アプタマー、または核酸結合タンパク質である、1および6に記載の方法。
【0993】
11.プローブ種が、区別され得る、6に記載の方法。
【0994】
12.結合が、空間的に解像可能なシグナルを介して検出される、1および6に記載の方法。
【0995】
13.空間的に解像可能なシグナルが、プローブ上の1つ以上の標識に起因する、12に記載の方法。
【0996】
14.プローブの同一性が、コード化される、13に記載の方法。
【0997】
15.結合プローブが、認識配列の完全なレパートリー(例えば、64個の3塩基長、245個の4塩基長、1024個の5塩基長、または4096個の6塩基長)を含み、任意選択的に、追加の縮重塩基または普遍的塩基を含む、9に記載の方法。
【0998】
16.単一標的ポリヌクレオチドが、染色体またはその一部分に由来する、6に記載の方法。
【0999】
17.単一標的ポリヌクレオチドが、約102、103、104、105、106、107、108、109塩基長である、6に記載の方法。
【1000】
18.単一標的ポリヌクレオチド分子を、ポリヌクレオチドの撹乱を最小化し、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または体液/物質から、抽出することをさらに含む、6に記載の方法。
【1001】
19.標的ポリマー/ポリヌクレオチド分子が、表面に固定化される、1および6に記載の方法。
【1002】
20.標的ポリマー/ポリヌクレオチド分子が、ゲルまたはマトリックス中に配置される、1および6に記載の方法。
【1003】
21.標的ポリマー/ポリヌクレオチド分子が、マイクロ流体チャネルまたはナノ流体チャネルに配置される、1および6に記載の方法。
【1004】
22.標的ポリマー/ポリヌクレオチド分子が、実質的にインタクトである、1および6に記載の方法。
【1005】
23.配列が、標的ポリヌクレオチド分子の別のコピーまたは標的ポリヌクレオチド分子の参照配列を使用せずに決定される、6に記載の方法。
【1006】
24.二倍体または倍数体ゲノムのハプロタイプ解像配列決定(haplotype resolved sequencing)の方法であって、
i.2倍体/倍数体ゲノムの第1のハプロタイプを表す第1の標的ポリヌクレオチドを、1または6の方法を使用して配列決定することと、
ii.二倍体/倍数体ゲノムの第2のハプロタイプを表す第2の標的ポリヌクレオチドを、1または6の方法を使用して配列決定することと、
iii.倍数体ゲノムについて、請求項1または6に記載の方法を使用して、倍数体ゲノムのさらなるハプロタイプを表すさらなる標的ポリヌクレオチドを配列決定し、それによって、ゲノムの第1、第2、およびさらなるハプロタイプを決定することであって、第1および第2の標的ポリヌクレオチド、ならびにさらなる標的ポリヌクレオチドが、異なる相同染色体(染色体ホモログ)由来する、配列決定することと、を含む、方法。
【1007】
25.長く連続した(long-contiguous)配列決定リードを取得する方法であって、
i.プローブ結合事象に基づいて、第1の短いリード(read)を得ることと、
ii.プローブ結合事象に基づいて、第1のリードに隣接する第2の短いリードを得ることと、
iii.プローブ結合事象に基づいて、第1または第2の短いリードに隣接するさらなる短いリードを得ることと、
iv.少なくとも2つの短いリードを一緒に繋ぎ合わせて、連続した長いリードを得ることと、を含む、方法。
【1008】
26.ハプロタイプ解像配列決定のリードの一部が、各ホモログの別個のポリヌクレオチドから(例えば、複数の細胞から)得られる、25に記載の方法。
【1009】
27.1つ以上の参照配列を使用して場所を推測することによって、ナノメトリック位置決定または順序が容易になる、6に記載の方法。
【1010】
28.標的ポリヌクレオチドが、ゲルまたはマトリックスと接触している、先行請求項に記載の方法。
【1011】
29.塩基配列決定が、塩基配列とは直交的なエピマーク(epi-mark)の標識によって、エピマークの分析(例えば、メチル化)と組み合わされる、1および10に記載の方法。
【1012】
30.ポリマーの化学構造を決定する方法であって、ポリマーを伸長することと、伸長したポリマーに沿った複数の部位に、複数の時間的に解像可能な標識を結合することであって、複数の部位が、回折限界光学撮像によって解像可能ではない、結合することと、ナノメトリックまたはサブナノメトリックの正確度で、それらの場所を決定することと、を含む、方法。
【1013】
31.一過的な結合が、能動的な解離(active unbinding)を含む、6に記載の方法。
【1014】
32.結合が、安定した結合を含む、31に記載の方法。
【1015】
33.能動的な解離が、プローブの熱、pHの変化、塩濃度の変化、化学的分解または生化学的分解を含む手段によって、結合を破壊することを含む、32に記載の方法。
【1016】
34.結合および能動的解離が、均一反応における温度サイクルを使用して行われる、31に記載の方法。
【1017】
35.結合プローブが、(明細書に従って定義されている)別個の配列ビットに結合する、先行請求項に記載の方法。
【1018】
36.結合プローブが、ナノメトリック正確度および精度で局在化される、先行請求項に記載の方法。
【1019】
37.結合部位が、サブナノメトリック正確度および精度で位置決定される、先行請求項に記載の方法。
【1020】
38.2つ以上の結合プローブが結合する2つ以上の配列ビットが、互いに対して超解像される、先行請求項に記載の方法。
【1021】
39.プローブが、直接標識される、1~38に記載の方法。
【1022】
40.プローブが、間接的に標識される、1~38に記載の方法。
【1023】
41.間接的に標識されたプローブが、標的結合ドメインおよび少なくとも1つの標識ドメインを含む、40に記載の方法。
【1024】
42.当該標的結合ドメインが、少なくとも3個のヌクレオチドを含み、標的核酸に一過的に結合することができる、41に記載の方法。
【1025】
43.当該標識ドメインが、標識される相補核酸分子に安定して結合することができる核酸配列を含む、41に記載の方法。
【1026】
44.プローブが、標的結合ドメインおよび複数の標識ドメインを含む、41に記載の方法。
【1027】
45.当該複数の標識ドメインが、各々、標識される相補核酸分子に安定して結合することができる核酸配列を含む、44に記載の方法。
【1028】
46.各結合ドメインが、異なる配列を含む、44に記載の方法。
【1029】
47.異なる各結合ドメインが、少なくとも3個のヌクレオチドのうちの1つに対応する、44に記載の方法。
【1030】
48.少なくとも3つのヌクレオチドのうちの1つの同一性が、異なる標識によって決定される、47に記載の方法。
【1031】
49.少なくとも12個の異なる標識、または11個の異なる標識および1つのブランクが使用される、48に記載の方法。
【1032】
50.標的結合ドメインが、少なくとも3個のヌクレオチドおよび1つ以上の縮重ヌクレオチド位置を含む、41および44に記載の方法。
【1033】
51.標識が、放射光、発光、または散乱光の、波長、寿命、輝度、偏光などにより異なっている、48に記載の方法。
【1034】
52.ポリヌクレオチドが、末端にテール付加され、テールに相補的な配列を介して捕捉される、先行実施形態に記載の方法。
【1035】
53.テールに相補的な配列が、規則正しいアレイに組織化されている、52に記載の方法。
【1036】
54.規則正しいアレイが、テールに相補的な空間的に規則正しいアレイを含む超分子グリッド(例えば、DNA折り紙)を含む、52に記載の方法。
【1037】
55.ターミナルトランスフェラーゼを使用して、ポリヌクレオチドがテール付加されている、52に記載の方法。
【1038】
56.標的ポリヌクレオチドが、短鎖核酸、セルフリー核酸、または循環核酸である、52に記載の方法。
【1039】
57.標的ポリヌクレオチドが、mRNAであり、かつ既に一方の末端に天然にテール付加されている、52に記載の方法。
【1040】
58.標的ポリヌクレオチドが、まだ一方の末端に天然にテール付加されていないRNAである、52に記載の方法。
【1041】
59.ポリマー/ポリヌクレオチドが、プローブ結合の前に変性される、先行実施形態に記載の方法。
【1042】
60.単一のポリマー/ポリヌクレオチドが、伸展または伸長される、先行実施形態に記載の方法。
【1043】
61.単一のポリマー/ポリヌクレオチドが、表面に固定化される、先行実施形態に記載の方法。
【1044】
62.単一のポリマー/ポリヌクレオチドが、ゲルまたはマトリックス中に固定化される、先行実施形態に記載の方法。
【1045】
63.不均一ポリマーの化学構造を識別および順序付ける方法であって、ポリマーを伸長させ、複数のプローブを結合させて、伸長されたポリマーに沿った複数の部位における化学構造を識別することを含み、複数の当該部位が、回折限界光学撮像によって解像され得るよりも近いが、それらの標識が時間的に離れることから解像可能であり、化学構造を識別するプローブの結合場所が、ナノメトリック(サブ回折)精度で決定され、それによって、不均一なポリマーの化学構造の空間的な順序が決定される、方法。
【1046】
64.ポリマーの配列が、ポリマーへの分子プローブのレパートリーの結合相互作用の出現特性を介して決定される、ポリマーを配列決定する方法。
【実施例】
【1047】
実施例1:配列決定のための試料の調製。
ステップ1:長い鎖長のゲノムDNAの抽出。
NA12878またはNA18507細胞(Coriell Biorepository)を培養物中で増殖させ、収穫する。細胞を、60℃に加熱した低融点アガロースと混合する。混合物を(例えば、Bio-Radから購入した)ゲルモールドに注ぎ、ゲルプラグにセットさせ、約4×107個の細胞をもたらす(この数は、ポリヌクレオチドの所望の密度に応じて、より多いかまたはより少ない)。ゲルプラグ内の細胞は、プラグを、プロテイナーゼKを含む溶液に浸すことによって溶解される。ゲルプラグは、TE緩衝液中で穏やかに洗浄される(例えば、15mLのファルコンチューブ中で、洗浄緩衝液で満たされるが、混合を助けるために小さな気泡を残し、チューブローテーター上に配置する)。プラグを、約1.6mL体積のトラフに配置され、DNAは、アガラーゼ酵素を使用してDNAを消化することによって抽出される。0.5MのMES pH5.5溶液を消化したDNAに適用する。FiberPrepキット(Genomic Vision、France)および付随のプロトコルを使用して、このステップを実行し、平均長が300KbのDNA分子が得られる。代替的に、これらの細胞株から抽出されたゲノムDNA自体がCorrielから入手可能であり、ワイドボアピペットを使用して、0.5MのMES pH5.5溶液に直接ピペッティングし(1.2mL中約10uL)、1μM未満の平均間隔を与える。
【1048】
ステップ2:表面での分子の伸展。
ステップ1の最後の部分は、0.5MのMESpH5.5溶液中でトラフ内に抽出されたポリヌクレオチドを提供する。ビニルシラン(例えば、Genomic VisionからのCombiSlips)でコーティングされた基板カバーガラスをトラフに浸し、(必要な標的核酸の密度に応じて)1~10分間インキュベートする。次いで、カバーガラスは、カバーガラスを把持するためにクリップが取り付けられたシリンジポンプなどの機械的プラーを使用して、ゆっくりと引き抜かれる(代替的に、Genomic VisionからのFiberCombシステムが使用される)。カバーガラス上のDNAを、架橋剤(Stratagene、USA)を使用して10,000マイクロジュールのエネルギーを使用して表面に架橋する。このプロセスが慎重に実施されると、表面に伸長された平均長が200~300Kbの高分子量(HMW)ポリヌクレオチドがもたらされ、ポリヌクレオチドの集団の中には、1Mbを超える長さの分子、または10Mb程度の長さの分子でさえ存在する。より細心の注意と最適化により、平均長は、メガベース範囲にシフトする(上記のメガベース範囲のコーミングのセクションを参照)。
【1049】
代替として、上述のように、予め抽出されたDNA(例えば、ヒト男性ゲノムDNA、Novagen cat.No.70572-3またはPromegaからの)が使用され、これは、かなりの割合が50Kbを超えるゲノム分子を含む。ここで、約0.2~0.5ng/μLの濃度で、約5分間の浸漬は、回折限界撮像を使用して高い割合の分子が個別に解像される分子密度を提供するのに十分である。
【1050】
ステップ3:フローセルの作製。
既にスライドガラスに取り付けられている両面粘着性の3Mシートから作られたフローセルのガスケットに、カバースリップを押し付ける。ガスケット(両面粘着シート上の保護層の両側)は、レーザカッターを使用して作製され、1つ以上のフローチャネルを生成する。フローチャネルの長さは、カバーガラスの長さよりも長く、そのため、カバーガラスがフローチャネルの中央に配置されると、カバーガラスによって覆われていないチャネルの両端の各々の部分が、フローチャネルに流体を出し入れするための入口および出口として、それぞれ使用される。流体は、ビニルシラン表面に付着している伸長されたポリヌクレオチドの上を通過する。一端で安全綿棒(Johnsons、USA)を使用して吸引を生じさせ、他端で流体をピペット注入すると、流体は、チャネルを通って流れる。チャネルは、リン酸緩衝生理食塩水-Tweenおよびリン酸緩衝生理食塩水(PBS洗浄)で予め湿潤される。
【1051】
ステップ4:二本鎖DNAの変性。
次の標的核酸が添加される前に、前の標的核酸を効率的に洗い流す必要がある。これは、緩衝液と最大4回交換することによって、任意選択的に、DMSOまたはアルカリ性溶液などの変性剤を使用して持続的な結合を除去することによって、行うことができる。二本鎖標的核酸は、フローセルを通してアルカリ(0.5MのNaOH)をフラッシュし、室温で約20~60分間インキュベートすることによって変性される。この後、PBS/PBST洗浄が続く。代替的に、1MのHCLで1時間インキュベーションし、続いてPBS/PBST洗浄を行う。
【1052】
ステップ5:不動態化(Passivation)
任意選択的に、BlockAid(Invitrogen、USA)などのブロッキング緩衝液を流し込み、約5~15分間インキュベートする。これに続いて、PBS/PBST洗浄を行う。
【1053】
実施例2:変性ポリヌクレオチドへのオリゴヌクレオチドの一過的な結合による配列決定
ステップ1:一過的な結合条件下でのオリゴヌクレオチドプローブ種の添加
フローセルを、PBSTおよび任意選択的に、緩衝液A(10mMのトリス-HCl、100mMのNaCl、0.05%のTween-20、pH7.5)で予め調整する。約1~10nMの各オリゴヌクレオチドプローブ種を、緩衝液B(5mMのトリス-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8)または緩衝液B+5mMのトリス-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8、1mMのPCA、1mMのPCD、1mMのTrolox)中の、伸長され変性された標的核酸に適用する。オリゴヌクレオチドプローブ種の長さは、典型的には、5~7ヌクレオチドの範囲であり、反応温度は、オリゴヌクレオチドプローブ種のTmに依存する。使用された1つのプローブタイプは、一般式5’-Cy3-NXXXXXN-3’(Xは指定された塩基、Nは縮重位置)のプローブタイプであり、LNAヌクレオチドは、位置1、2、4、6、および7にあり、DNAヌクレオチドは、位置3および5にある。プローブは、Sigma Proligoから購入し、これは、以前にPihlakらによって使用されたものである。結合の温度は、各オリゴヌクレオチドプローブ種配列のTmと関連付けられた。
【1054】
A+およびB+溶液で洗浄した後、オリゴヌクレオチドプローブ種の一過的な結合は、LNA DNAキメラオリゴヌクレオチドプローブ種3004 NTgGcGN(ここで、大文字はLNAであり、小文字はDNAヌクレオチドである)の場合、B+溶液中で、0.5~100nMのオリゴ(典型的には、3nm~10nm)を用いて、室温で行う。異なる温度条件および/または塩条件(ならびに濃度条件)を、異なるオリゴヌクレオチドプローブ種の配列に対して、それらのTmおよび結合挙動に従って使用する。検出用にFRET機構が使用される場合、最大1uMのはるかに高い濃度のオリゴが使用され得る。一部の実施形態では、FRETは、一過的に形成された二重鎖に挿入される挿入色素分子(YOYO-1、Sytox Green、Sytox Orange、Sybr Goldなど(Life Technologies)から、使用される挿入色素に応じて1000分の1~10,000分の1の希釈形態)と、オリゴ上の標識との間のFRETである。一部の実施形態では、挿入色素は、FRETなしで標識として直接使用される。この場合、オリゴヌクレオチドプローブ種は標識されない。安価であることに加えて、非標識オリゴヌクレオチドプローブ種は、二重鎖形成時の挿入された色素からのバックグラウンドが、挿入されていない色素よりも100~1000明るい(例えば、どの挿入剤が使用されるかに応じて)ため、標識されたオリゴヌクレオチドプローブ種よりも高い濃度で使用することができる。
【1055】
ステップ2:撮像-複数のフレームの撮影。
フローチャネルは、Perfect Focus、TIRFアタッチメント、およびTIRF対物レーザ、およびHamamatsu 512×512裏面入射型EMCCDカメラを備えた倒立顕微鏡(例えば、Nikon Ti-E)上に配置される。プローブは、緩衝液B+に添加され、任意選択的に、撮像剤が補充される。
【1056】
表面に配置されたポリヌクレオチドに結合するプローブは、TIRFアタッチメントを有するNikon Ti-E上の1.49 NA 100x Nikon油浸対物レンズを通じて、光ファイバスクランブラ(Point Source)を介して、約61.5°のTIRF角度で調整された75~400mWのレーザ光(例えば、532nmの緑色光)の全内部反射によって生成されたエバネッセント波によって照明される。画像は、1.5倍のさらなる倍率で同じレンズを通して収集され、ダイクロイックミラーおよびエミッションフィルタを介してHamamatsu ImageEMカメラに投影される。50~200ミリ秒の5000~30,000フレームは、Perfect Focusを使用して100~140のEMゲインで撮影される。一部の実施形態では、高いレーザ出力(例えば、400mW)を最初の数秒で使用して、初期の非特異的結合を退色させ、これにより、表面からのほとんど一面のシグナルを、より低い密度に低減し、個々の結合事象が解像される。その後、レーザ出力を、任意選択的に、低減する。
【1057】
図22A~
図22Eは、標的核酸に一過的に結合するオリゴヌクレオチドプローブ種の照明の例を示す。これらの図において、標的核酸は、ヒトDNAである。濃い斑点は、プローブ蛍光の領域を示し、より濃い斑点は、オリゴヌクレオチドプローブ種によってより頻繁に結合されたより多くの領域を示す(例えば、より多くの光子が収集された)。
図22A~
図22Eは、1つの標的核酸の配列決定中に捕捉された時系列(例えば、ビデオ)からの画像である。標的核酸の領域の例として、ポイント2202、2204、2206、2208が、時系列を通して示されており、時間の経過とともに(例えば、オリゴヌクレオチドプローブ種の異なるセットが標的核酸に曝露されたときに)、より大きい強度またはより小さい強度で結合された。
【1058】
撮像緩衝液が添加された。一部の実施形態では、撮像緩衝液は、β-メルカプトエタノール、酵素レドックス系、および/またはアスコルビン酸および没食子酸を含む緩衝液によって補充または置換される。フルオロフォアは、ラインに沿って検出され、オリゴヌクレオチドプローブ種の結合が生じたことを示す。任意選択的に、フローセルが2つ以上のチャネルで作製される場合、チャネルのうちの1つは、ポリヌクレオチドの密度およびポリヌクレオチド伸長の質をチェックするために(例えば、Intensilightまたは488nmレーザ照明を使用して)YOYO-1挿入色素で染色される。
【1059】
ステップ3:撮像-他の場所への移動(任意選択的なステップ)。
ニコンTi-eのスライドホルダーに(フローセルの一部としてスライドガラスにアタッチメントを介して)取り付けられたカバーガラスは、対物レンズ(したがって、CCD)に対して移動され、別々の場所が撮像される。撮像は、異なる場所で提供された標的核酸または標的核酸の部分に結合するオリゴヌクレオチドプローブ種が(その第1の位置でのCCDの視野の外で)撮像されるように、複数の他の場所で行われる。各場所からの画像データは、コンピュータメモリに格納される。
【1060】
ステップ4:次のオリゴのセットの添加。
次のオリゴヌクレオチドプローブ種のセットを添加し、標的核酸の全体が配列決定されるまで、ステップ1~3を反復する。
【1061】
ステップ5:結合の場所と同一性の決定。
光学活性の各事例の場所が決定され、結合した標識オリゴヌクレオチドプローブ種由来の蛍光が投影される画素の場所が記録される。結合したオリゴヌクレオチドプローブ種の同一性は、(例えば、光学フィルタによる波長選択を使用して)どの標識オリゴヌクレオチドプローブ種が結合されているのかを決定することによって決定され、フルオロフォアは、複数のフィルタにわたって検出され、この場合、フィルタセットにわたる各フルオロフォアの発光シグネチャは、フルオロフォアの同一性(したがって、オリゴヌクレオチドプローブ種の同一性)を決定するために使用される。任意選択的に、フローセルが2つ以上のチャネルで作製される場合、チャネルのうちの1つは、標的核酸の密度および標的核酸伸長の質をチェックするために(例えば、Intensilightまたは488nmレーザ照明を使用することによって)、YOYO-1挿入色素で染色される。オリゴヌクレオチドプローブ種を標識するために使用される蛍光波長ごとに1つずつ、1つ以上の画像または動画を撮影する。
【1062】
ステップ6:データ処理。
二重鎖標的核酸の両方の鎖が表面に付着したままである場合、オリゴヌクレオチドプローブ種の結合は、二本鎖標的核酸の両方の鎖上のそれらの相補的な場所に同時に生じる。次いで、全データセットを分析して、標的核酸上の特定の位置に密接な局在化シグナルを与えるオリゴヌクレオチドプローブ種のセットを見つけ、それらの場所は、ポリヌクレオチドの選択されたポイントに対応するオリゴヌクレオチドプローブ種の配列を重複させることによって確認され、これは、次いで、各ポイントでのオリゴヌクレオチドプローブ種の2つの重複したタイリングシリーズを明らかにする。局所における次のシグナルがどのタイリングシリーズに当てはまるのかは、それがどの鎖に結合しているのかを示す。
【1063】
標的核酸鎖は表面に固定されたままであるため、各オリゴヌクレオチドプローブ種について記録された結合場所は、アルゴリズムを実行するソフトウェアスクリプトを使用して重ねることができる。これにより、オリゴヌクレオチドプローブ種結合場所が、変性二重鎖標的核酸の各鎖に対する別々の経路である(しかし、それは相補的である必要がある)、2つのオリゴヌクレオチドプローブ種配列のタイリング経路のフレームワーク内にあることを示すシグナルがもたらされる。各タイリング経路は、完了している場合、鎖の全長にわたる。次に、各鎖のタイリングされた配列を比較して、二本鎖(2Dとしても知られる)コンセンサス配列を提供する。1つのタイリングパスにギャップがある場合、相補的なタイリングパスの配列が取られる。一部の実施形態では、配列は、塩基割当を助け、ギャップを埋めるために、同じ配列の複数のコピーと比較されるか、または参照と比較される。
【1064】
実施例3:ポリヌクレオチド上のエピマークの場所の検出。
任意選択的に、オリゴ結合プロセスの前(または時に、その後またはその間)に、エピゲノム結合試薬の一過的な結合が行われる。どの結合試薬が使用されるかに応じて、結合は、変性の前または後に行われる。一部の実施形態では、抗メチルC抗体の場合、結合は、変性標的核酸上で行われるが、メチル結合タンパク質の場合、任意の変性ステップの前に、二本鎖標的核酸上で結合が行われる。
【1065】
ステップ1-メチル結合試薬の一過的な結合。
変性後、フローセルをPBS洗浄でフラッシュし、Cy3Bで標識された抗メチル抗体3D3クローン(Diagenode)をPBS中に添加する。
【1066】
代替的に、変性の前に、フローセルをPBSでフラッシュし、Cy3Bで標識されたMBD1を添加する。
【1067】
撮像は、一過的なオリゴヌクレオチドプローブ種の結合について、上に記載のように行われる。
【1068】
ステップ2:メチル結合試薬の除去。
典型的には、エピ分析は、配列決定の前に行われる。したがって、任意選択的に、標的核酸の配列決定を開始する前に、メチル結合試薬をフラッシュアウトする。これは、複数サイクルのPBS/PBSTおよび/または高塩緩衝液およびSDSを流し、次いで、除去が生じたことを撮像で確認することによって行われる。無視できる量を超える結合試薬が残存していることが明らかな場合、カオトロピック塩、GuCLなどのより厳密な処理剤を流して、残った試薬を除去する。
【1069】
ステップ3:データ相関。
配列決定エピゲノミクスデータが得られた後、配列決定プローブ種の結合場所の場所間で相関を行い、エピ結合場所を相関させて、メチル化の配列文脈を提供する。
【1070】
実施例4:ラムダファージDNA中の一過的な結合から収集された蛍光。
図23A、
図23B、および
図23Cは、一過的な結合事象の例を示す。これらは、オリゴIDの一過的な結合を、まとめて示す。Lin2621、Cy3標識5’NAgCgGN3’(室温で、緩衝液B+中、1.5nMの濃度)。標的核酸は、MES pH5.5緩衝液+0.1MのNaCl中で、ビニルシラン表面(Genomic Vision)上に手動でコーミングされたラムダファージゲノムである。点源光ファイバスクランブラを介した400mWの532nmのレーザ。蛍光は、532nmの励起バンド、TIRF対物レンズ100倍1.49NA、および追加の1.5倍の倍率を含む、TIRFアタッチメントおよびマルチクロイックで収集された。防振は実装しなかった。画像を、100EM Gain設定で、Hamamatsu ImageEM 512×512上に、Perfect Focusを用いて捕捉した。10000フレームを100msにわたって収集した。オリゴヌクレオチドプローブセットのCy3の濃度は、約250nM~300nMであった。
図23Aは、ThunderSTORMにおける相互相関ドリフト補正の前に収集された蛍光を示す。
図23Bは、スケールバーとの相互相関ドリフト補正後に収集された蛍光を示す。
図23Cは、
図23Bの拡大された領域における蛍光を示す。
図23Cは、Lin2621の複数の場所への持続的な結合によって追跡された長いポリヌクレオチド鎖を示す。画像から、標的核酸鎖が、Cy3発光の回折限界よりも近い距離で、撮像面上で固定化され、伸長されたことが明らかである。
【1071】
実施例5:合成DNA中の一過的な結合から収集された蛍光
図24は、3つの異なるポリヌクレオチド鎖から収集された蛍光データの一例を示す。合成3キロ塩基変性二本鎖DNA上の、複数のプロービングおよび洗浄ステップが示されている。ビニルシラン表面上で、合成DNAをMES(pH5.5)でコーミングし、変性させた。一連の結合および洗浄ステップを行い、ビデオ記録し、ThunderSTORMを使用してImageJで処理した。周囲温度で、緩衝液B+中の10nMのオリゴで行った以下の実験シリーズについて、3つの例示的な鎖(1、2、3)を超解像画像から切り取った。オリゴヌクレオチドプローブ種3004の結合、洗浄、オリゴ2879の結合、洗浄、オリゴ3006の結合、洗浄、およびオリゴヌクレオチドプローブ種3004の結合(再度)。これは、結合マップが一過的な結合に由来し得ること、結合パターンが洗浄によって消去され得ること、次いで、異なる結合パターンが、合成DNAの同じ第1および第2の鎖上の異なるオリゴヌクレオチドプローブ種で得られることを示す。シリーズの最後にオリゴヌクレオチドプローブ種3004に戻ること、およびシリーズの最初として使用された場合のパターンと類似していることは、なんら最適化を試みることなく、プロセスが堅牢であることを指し示す。
【1072】
実験的に決定された結合場所は、予想される位置に対応し、二重鎖1および3は、4つの可能な完全一致結合部位のうちの3つを示し、二重鎖2は、4つのすべての結合場所および1つの顕著な不一致場所を示す。オリゴヌクレオチドプローブ種3004による第2のプロービングは、おそらく不一致が少ないため、よりきれいなシグナルを示すように見えることが観察される。これは、レーザ光への長時間曝露による加熱のため、温度がわずかに上昇する可能性と一致する。
【1073】
この実験に使用されたオリゴ配列は、以下の通りである(大文字の塩基は、ロックド核酸(LNA)である):
オリゴヌクレオチドプローブ種3004:5’cy3 NTgGcGN
オリゴヌクレオチドプローブ種2879:5’cy3 NGgCgAN
オリゴヌクレオチドプローブ種3006:5’cy3 NTgGgCN:
【1074】
3kbp合成鋳型の配列の配列表(文書の下部)は、以下の通りである:
(配列番号2)AAAAAAAAACCGGCCCAGCTTTCTTCATTAGGTTATACATCTACCGCTCGCCAGGGCGGCGACCTCGCGGGTTTTCGCTATTTATGAAAATTTTCCGGTTTAAGGCGTTTCCGTTCTTCTTCGTCATAACTTAATGTTTTTATTTAAAATACCCTCTGAAAAGATAGGATAGCACACGTGCTGAAAGCGAGGCTTTTTGGCCTCTGTCGTTTCCTTTCTCTGTTTTTGTCCGTGGAATGAACAATGGAAGTCAACAAAAAGCAGCTGGCTGACATTTTCGGTGCGAGTATCCGTACCATTCAGAACTGGCAGGAACAGGGAATGCCCGTTCTGCGAGGCGGTGGCAAGGGTAATGAGGTGCTTTATGACTCTGCCGCCGTCATAAAATGGTATGCCGAAAGGGATGCTGAAATTGAGAACGAAAAGCTGCGCCGGGAGGTTGAAGAACTGCGGTTCTTATACATCTAATAGTGATTATCTACATACATTATGAATCTACATTTTAGGTAAAGATTAATTGAGTACCAGGTTTCAGATTTGCTTCAATAAATTCTGACTGTAGCTGCTGAAACGTTGCGGTTGAACTATATTTCCTTATAACTTTTACGAAAGAGTTTCTTTGAGTAATCACTTCACTCAAGTGCTTCCCTGCCTCCAAACGATACCTGTTAGCAATATTTAATAGCTTGAAATGATGAAGAGCTCTGTGTTTGTCTTCCTGCCTCCAGTTCGCCGGGCATTCAACATAAAAACTGATAGCACCCGGAGTTCCGGAAACGAAATTTGCATATACCCATTGCTCACGAAAAAAAATGTCCTTGTCGATATAGGGATGAATCGCTTGGTGTACCTCATCTACTGCGAAAACTTGACCTTTCTCTCCCATATTGCAGTCGCGGCACGATGGAACTAAATTAATAGGCATCACCGAAAATTCAGGATAATGTGCAATAGGAAGAAAATGATCTATATTTTTTGTCTGTCCTATATCACCACAAAACCTGAAACTGGCGCGTGAGATGGGGCGACCGTCATCGTAATATGTTCTAGCGGGTTTGTTTTTATCTCGGAGATTATTTTCATAAAGCTTTTCTAATTTAACCTTTGTCAGGTTACCAACTACTAAGGTTGTAGGCTCAAGAGGGTGTGTCCTGTCGTAGGTAAATAACTGACCTGTCGAGCTTAATATTCTATATTGTTGTTCTTTCTGCAAAAAAGTGGGGAAGTGAGTAATGAAATTATTTCTAACATTTATCTGCATCATACCTTCCGAGCATTTATTAAGCATTTCGCTATAAGTTCTCGCTGGAAGAGGTAGTTTTTTCATTGTACTTTACCTTCATCTCTGTTCATTATCATCGCTTTTAAAACGGTTCGACCTTCTAATCCTATCTGACCATTATAATTTTTTAGAATGCGGCGTTTTCCGGAACTGGAAAACCGACATGTTGATTTCCTGAAACGGGATATCATCAAAGCCATGAACAAAGCAGCCGCGCTGGATGAACTGATACCGGGGTTGCTGAGTGAATATATCGAACAGTCAGGTTAACAGGCTGCGGCATTTTGTCCGCGCCGGGCTTCGCTCACTGTTCAGGCCGGAGCCACAGACCGCCGTTGAATGGGCGGATGCTAATTACTATCTCCCGAAAGAATCCGCATACCAGGAAGGGCGCTGGGAAACACTGCCCTTTCAGCGGGCCATCATGAATGCGATGGGCAGCGACTACATCCGTGAGGTGAATGTGGTGAAGTCTGCCCGTGTCGGTTATTCCAAAATGCTGCTGGGTGTTTATGCCTACTTTATAGAGCATAAGCAGCGCAACACCCTTATCTGGTTGCCGACGGATGGTGATGCCGAGAACTTTATGAAAACCCACGTTGAGCCGACTATTCGTGATATTCCGTCGCTGCTGTTAATTGAGTTTATAGTGATTTTATGAATCTATTTTGATGATATTATCTACATACGACTGGCGTGCCATGCTTGCCGGGATGTCAAATTTAATAAGGTGATAGTAAATAAAACAATTGCATGTCCAGAGCTCATTCGAAGCAGATATTTCTGGATATTGTCATAAAACAATTTAGTGAATTTATCATCGTCCACTTGAATCTGTGGTTCATTACGTCTTAACTCTTCATATTTAGAAATGAGGCTGATGAGTTCCATATTTGAAAAGTTTTCATCACTACTTAGTTTTTTGATAGCTTCAAGCCAGAGTTGTCTTTTTCTATCTACTCTCATACAACCAATAAATGCTGAAATGAATTCTAAGCGGAGATCGCCTAGTGATTTTAAACTATTGCTGGCAGCATTCTTGAGTCCAATATAAAAGTATTGTGTACCTTTTGCTGGGTCAGGTTGTTCTTTAGGAGGAGTAAAAGGATCAAATGCACTAAACGAAACTGAAACAAGCGATCGAAAATATCCCTTTGGGATTCTTGACTCGATAAGTCTATTATTTTCAGAGAAAAAATATTCATTGTTTTCTGGGTTGGTGATTGCACCAATCATTCCATTCAAAATTGTTGTTTTACCACACCCATTCCGCCCGATAAAAGCATGAATGTTCGTGCTGGGCATAGAATTAACCGTCACCTCAAAAGGTATAGTTAAATCACTGAATCCGGGAGCACTTTTTCTATTAAATGAAAAGTGGAAATCTGACAATTCTGGCAAACCATTTAACACACGTGCGAACTGTCCATGAATTTCTGAAAGAGTTACCCCTCTAAGTAATGAGGTGTTAAGGACGCTTTCATTTTCAATGTCGGCTAATCGATTTGGCCATACTACTAAATCCTGAATAGCTTTAAGAAGGTTATGTTTAAAACCATCGCTTAATTTGCTGAGATTAACATAGTAGTCAATGCTTTCACCTAAGGAAAAAAACATTTCAGGGAGTTGACTGAATTTTTTATCTATTAATGAATAAGTGCTTGACCTATTTCTTCATTACGCCATTATACATCTAGCCCACCGCTGCCAAAAAAAAA
【1075】
実施例6:単一細胞の統合的単離、核酸の抽出および配列決定。
ステップ1:マイクロ流体アーキテクチャの設計と製作
マイクロチャネルは、典型的な直径15umのヒトがん細胞株由来の細胞を収容するように設計されているため、マイクロ流体ネットワークは、最小限の深さおよび幅33umを有する。デバイスは、細胞用の入口、および単一のチャネルに合流し単一細胞トラップに供給するための緩衝液用の入口を備える(
図17に示す)。細胞の入口と緩衝液の入口との間の交差点で、細胞を、1つ以上のトラップが配置されている供給チャネルの側壁に沿って整列させる。各トラップは、ヒトがん細胞株から細胞を捕捉するように、寸法決定された単純なくびれである。細胞捕捉用のくびれは、断面が台形である:底部は幅4.3um、中深度は6um、上部は幅8umで、深さは33umである。各細胞トラップは、供給チャネルを分岐点に接続し、分岐の一方は、廃棄チャネルであり(
図17には示されていない)、もう一方は、(核酸の伸長および配列決定のための)フロー伸展セクションを含むチャネルであり、細胞ごとに1つある。フロー伸展セクションは、幅20um(または最大2mm)、長さ450um、深さ100nm(または最大2um)のチャネルからなる。一部の実施形態では、フロー伸展チャネルは、始まりがより狭く、記載の寸法まで広がる。
【1076】
ステップ2:デバイスの製作
本デバイスは、TOPAS5013(TOPAS)の射出成形を使用して、ニッケルシムを複製することによって製作される。簡潔には、シリコンマスターは、UVリソグラフィーおよび反応性イオンエッチングによって生成される。100nmのNiVシード層を堆積させ、ニッケルを330umの最終厚さに電気メッキする。Siマスターは、KOH中で化学的にエッチングされている。溶融温度250℃、金型温度120℃、最大保持圧力1,500barを2秒間、20cm3/s~45cm3/sの異なる射出率で射出成形を行う。最後に、カバーガラス(1.5)をデバイスに接着するか、または150umのTOPAS箔を使用するかのいずれかで、0.51MPaの最大圧力下、UV処理および熱処理を組み合わせてデバイスを密封する。箔の表面粗さは、デバイスを密封する前に、シリコンウェハーから電気的にメッキされた2つの平坦なニッケルメッキ間で、140℃および5.1MPaで20分間箔をプレスすることによって低減される。これにより、デバイスの蓋が確実に光学的に平坦であり、高NA光学顕微鏡法を可能にする。本デバイスは、油浸TIRF対物レンズ(100×/NA1.49)およびEMCCDカメラ(Hamamatsu ImageEM 512)を備えた倒立蛍光顕微鏡(ニコンTi-E)に搭載されている。液体は、0~10mbarの範囲の圧力で、圧力コントローラー(MFCS、Fluigent)を使用して、デバイスを介して駆動される。デバイスは、エタノールでプライミングされ、次に脱気され、FACS Flow Sheath Fluid(BD Biosciences)は、フロー伸展デバイスを接続するマイクロチャネルを除くすべてのマイクロチャネルにロードされる。選択的ローディングは、溶液が導入された供給チャネルの入口で正の圧力を維持しながら、フロー伸展チャネルの出口に正の圧力をかけながら、廃棄チャネルの出口に負の圧力をかけるか、または吸引することによって実現される。単一分子撮像および電気泳動に好適な緩衝液(0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のβ-メルカプトエタノール、BME)は、フロー伸展デバイスのチャネルに充填される。この緩衝液は、フロー伸展セクションにおけるDNAの固着を防止し、フロー伸展セクションの高さが低い場合、抽出されたDNAの導入に対抗し得る電気浸透流を抑制する。
【1077】
ステップ3:細胞調製
LS174T結腸直腸がん細胞を、10%のウシ胎仔血清(FBS;Autogen-Bioclear UK Ltd.)および1%のペニシリン/ストレプトマイシン(Lonza)を含むダルベッコの改変イーグル培地(DMEM;Gibco)で培養した後、10%のDMSOを含むFBS中で、1ミリリットル当たり1.7 106細胞の濃度で凍結する。解凍後、細胞懸濁液を、FACSFlow緩衝液と1:1で混合し、28.8×g(A-4-44、Eppendorf)で5分間遠心分離し、FACSFlow緩衝液中に再懸濁する。最後に、細胞を1uMのCalcein AM(Invitrogen)で染色し、1ミリリットル当たり0.35 106細胞で、チップにロードする。約5~10,000個の細胞がロードされ、各トラップに捕捉された最初の細胞が分析される。
【1078】
ステップ4:操作
細胞および緩衝液を同時に導入し、トラップが位置するマイクロチャネルの側壁に沿って、細胞を整列させる。単一細胞は、最大30nL/分のトラップを通る緩衝液の流れのために、トラップ内に捕捉され、保持される。0.5×TBE+0.5%(v/v)のTriton-X100+0.1uMのYOYO-1(Invitrogen)で構成される溶解緩衝液を、入口の1つにロードし、トラップを通して10nL/分で10分間注入する。次いで、すべてのウェルで、溶液を、YOYO-1を含まない緩衝液に交換し、染色を止める。次に、細胞核を、1nW/(um)2の線量の青色励起光に最大300秒間曝露し、DNAの部分的な光ニッキングを引き起こさせる(www.pnas.org/cgi/doi/10.1073/pnas.1804194115のSI付録を参照されたい)。次に、緩衝液を、BMEを含む溶液(0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のBME)に変え、蛍光ランプの強度を、依然として蛍光撮像が可能な最小強度に下げる。次に、温度を60℃に上げ、タンパク質分解溶液(>200μg mL-1のプロテイナーゼK(Qiagen)、0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のBME+200g/mL)を導入し、溶解物をトラップに送る。DNAは、隣接するフロー伸展セクションに移動する。油浸対物レンズを、単一分子撮像のために、所定の位置に移動する(100×、NA1.49、追加の1.5×の倍率により、120nm画素の画像サイズが得られる)。DNA断片は、フロー伸展セクションにわたる5~10Vの電圧の印加による電気泳動を使用して、マイクロチャネルからフロー伸展デバイスに導入される。DNA断片の両端が、反対側のマイクロチャネルにある場合、電圧がオフになる。100~150%で伸展された分子の450um部分は、単一細胞から抽出されたゲノムDNAの1メガ塩基超長に対応する。一部の実施形態では、タンパク質分解後、DNA内容物は、0.5×TBEを捕捉緩衝液に置き換えることによって、デバイスを通して押し出され、かかる実施形態では、フロー伸展セクションの寸法は、任意選択的に、より大きく、それのため、数千のメガ塩基の断片が(疎水性相互作用または静電相互作用によって)同時に捕捉され、チャネル内で伸展され得る。これは、pH8の緩衝液(例えば、HEPES)を使用することによって行われ、ここで、結合されるカバーガラスは、APTESまたはポリリジンなどで正に荷電しているか、またはビニルシランカバーガラスが結合され、pH5.5~5.7の0.5MのMES緩衝液を使用して、DNAに流入させ、次いで、MES緩衝液を空気で追従することによってコーミングする。または箔がZeonexを含む場合、分子コーミングは、pH5.7の0.6MのMES緩衝液で行うことができる。
【1079】
二本鎖標的核酸が固定化されると、変性溶液である0.5MのNaOHおよび/または6%のDMSOが流し込まれる。すると、単一細胞試料は、本発明の配列決定方法のための準備でき、オリゴヌクレオチドプローブ種の完全なセットが流され、オリゴヌクレオチドプローブ種の結合が撮像される。
【1080】
一部の実施形態では、細胞溶解は、2ステップであり、そのため、RNAは、フロー伸展セクション内を汚染させず、蛍光を引き起こさない。ここで、第1の溶解緩衝液(例えば、DNA挿入YOYO-1色素が添加された、0.5%(v/v)のTritonX-100を含む0.5×TBE)を適用する。この緩衝液は、細胞膜を溶解し、10~20μlのヌクレアーゼ不含H2Oで満たされたトラップ出口に細胞質内容物を遊離し、トラップ内にDNAを含む核が残る(例えば、van Strijp et al.Sci Rep.7:11030(2017)に記載されている)。各細胞の細胞質内容物は溶解後に除去され、廃液出口に流されるか、またはデバイスは、DNAのフロー伸展セクションとは別のRNAのフロー伸展セクションを有するように設計される。一部の実施形態では、RNAは、ポリA RNAを捕捉するオリゴdTでコーティングされた別個のフロー伸展セクションに送られる。一部の実施形態では、RNAのフロー伸展セクションは、ナノウェルまたはナノピットを含み(Marie et al,Nanoscale DOI:10.1039/c7nr06016e)2017)、RNAが捕捉され、酵素試薬を使用して(例えば、ターミナルトランスフェラーゼによるポリA付加を使用して)、捕捉配列を付加するために使用される。核溶解は、第2の緩衝液(0.5%(v/v)のTritonX-100およびプロテイナーゼKを含む0.5×TBE)を用いて行い、DNAは、DNAのフロー伸展セクションに流される。
【1081】
核酸の損失を最小化するために、トラップおよびフロー伸展セクションからの距離は短く、デバイス壁は十分に不動態化される(脂質を用いたコーティングによる不動態化を含む)(例えば、Persson et al,Nanoletters 12:2260-5(2012)に記載されている)。
【1082】
引用文献および代替実施形態
本明細書で引用されるすべての参考文献は、各々の個々の刊行物または特許もしくは特許出願が、あらゆる目的のために、その全体が参照により援用さることが具体的かつ個別に示されている場合と同じ程度に、あらゆる目的のために、それらの全体が参照により本明細書に援用される。
【1083】
すべての見出しおよび副見出しは、便宜上本明細書でのみ使用され、本発明を決して限定するものとして解釈されるべきではない。
【1084】
本明細書に提供される任意のおよびすべての実施例、または例示的な言語(例えば、「例えば」)の使用は、単に本発明をより良く明らかにすることを意図しており、別段の請求がない限り、範囲を限定するものではない。本明細書におけるいかなる言語も、任意の請求されていない要素を本発明の実施に不可欠であると示すものとして解釈されるべきではない。
【1085】
また、様々な要素を説明するために、本明細書では、第1、第2などの用語を使用するが、これらの要素は、これらの用語によって限定されるべきではないことも理解されたい。これらの用語は、ある要素と別の要素を区別するためにのみ使用される。例えば、第1の対象は、本開示の範囲から逸脱することなく、第2の対象と呼ぶことができ、同様に、第2の対象は、第1の対象と呼ぶことができる。最初の対象と2番目の対象は両方とも同じ対象であるが、同じ対象ではない。
【1086】
本開示で使用される専門用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図するものではない。説明および添付の特許請求の範囲で使用される場合、単数形の「a」、「an」、および「the」は、文脈により明らかにそうではないことが示されていない限り、複数形も同様に含むことが意図される。本明細書で使用される「および/または」という用語は、関連する列挙された項目の1つ以上の任意のおよびすべての可能な組み合わせを指し、それを包含することも理解されたい。さらに、「含む(comprises)」および/または「含む(comprising)」という用語は、本明細書で使用される場合、記載された特徴、整数、ステップ、操作、要素、および/または構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しないことを理解されたい。
【1087】
本明細書で使用される場合、用語「~の場合(if)」は、文脈に応じて、「~のとき(when)」または「~の際(upon)」または「決定に応じて(in response to determining)」または「検出に応じて(in response to detecting)」を意味すると解釈される。同様に、「それが決定される場合」または「[記載された状態または事象]が検出される場合」という語句は、文脈に応じて、「決定の際」または「決定に応じて」または「(記載された状態または事象)の検出の際」または「(記載された状態または事象)の検出に応じて」を意味すると解釈される。
【1088】
本明細書における特許文献の引用および援用は、ただ便宜上行われるものであり、かかる特許文献の妥当性、特許性、および/または執行可能性に関するいかなる見解も反映されない。
【1089】
本発明は、非一時的コンピュータ可読記憶媒体に埋め込まれたコンピュータプログラム機構を含むコンピュータプログラム製品として実装され得る。例えば、コンピュータプログラム製品は、
図1Aの任意の組み合わせで示されるプログラムモジュールを含み得る。これらのプログラムモジュールは、CD-ROM、DVD、磁気ディスクストレージ製品、USBキー、またはその他の非一時的コンピュータ可読データもしくはプログラムストレージ製品に記憶することができる。
【1090】
本明細書内の実施形態は、本発明の実施形態の例示を提供し、本発明の範囲を限定すると解釈されるべきではない。当業者は、多くの他の態様および実施形態が、本発明の方法によって包含されることを認識するであろう。本発明の実施形態および以下に提供される技術的詳細は、当業者によって変化させることができ、過度の実験または再発明なしに試験および体系的に最適化することができる。
【1091】
本発明は、本明細書の教示および本明細書に列挙される参考文献に照らして、最も完全に理解される。当業者には明白であるように、その趣旨および範囲から逸脱することなく、多くの修正および変形を行うことができる。本明細書に記載される特定の実施形態は、例としてのみ提供される。本実施形態は、原理およびその実用的な用途を最もよく説明するために選択および記載され、それによって、当業者は、本発明および企図された特定の使用に好適な様々な修正を有する様々な実施形態を最もよく利用することができる。本発明は、添付の特許請求の範囲の条件、およびかかる特許請求の範囲が権利を有する均等物の全範囲によってのみ限定されるべきである。
【配列表】
【国際調査報告】