IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ.ホフマン−ラ ロシュ アーゲーの特許一覧

特許7152599塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-03
(45)【発行日】2022-10-12
(54)【発明の名称】塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20221004BHJP
   C12Q 1/6855 20180101ALI20221004BHJP
   C12Q 1/6876 20180101ALI20221004BHJP
   C40B 40/06 20060101ALI20221004BHJP
   C12N 15/11 20060101ALI20221004BHJP
   C12N 15/10 20060101ALI20221004BHJP
【FI】
C12Q1/6869 Z
C12Q1/6855 Z
C12Q1/6876 Z
C40B40/06
C12N15/11 Z
C12N15/10 Z ZNA
【請求項の数】 17
(21)【出願番号】P 2021515035
(86)(22)【出願日】2019-09-19
(65)【公表番号】
(43)【公表日】2022-01-04
(86)【国際出願番号】 EP2019075144
(87)【国際公開番号】W WO2020058389
(87)【国際公開日】2020-03-26
【審査請求日】2021-04-12
(31)【優先権主張番号】62/734,809
(32)【優先日】2018-09-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】591003013
【氏名又は名称】エフ.ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100196243
【弁理士】
【氏名又は名称】運 敬太
(72)【発明者】
【氏名】ワン,アレクサンドラ・フイ
【審査官】天野 皓己
(56)【参考文献】
【文献】国際公開第2016/168351(WO,A1)
【文献】特表2017-506875(JP,A)
【文献】国際公開第2018/108328(WO,A1)
【文献】特表2007-521833(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00 - 15/90
C12Q 1/00 - 3/00
C40B 40/06 - 40/08
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
モジュール式末端配列を有する核酸のライブラリーを調製する方法であって、
異なるモジュール式核酸タグのプールを、複数の二本鎖標的核酸を含む核酸試料と組み合わせること、
前記二本鎖標的核酸の各々の末端を、前記異なるモジュール式核酸タグのプールから選択されたタグに結合させて、複数の二重にタグ付けされた標的核酸を形成すること、
前記二重にタグ付けされた標的核酸の各々を増幅し、それにより、モジュール式末端配列を有する核酸のライブラリーを調製すること、および
前記モジュール式末端配列を有する増幅された核酸のライブラリーを検出すること、
を含み、
前記異なるモジュール式核酸タグの各々が、第1の鎖および第2の鎖を有し、
前記第1の鎖が、i)前記第1の鎖の5’末端を規定するセグメントA、およびii)前記第1の鎖の3’末端を規定するセグメントBを含み、
前記第2の鎖が、i)前記第2の鎖の5’末端を規定し、前記第1の鎖の前記セグメントBと相補的なセグメントB’、およびii)前記第2の鎖の3’末端を規定し、前記第1の鎖の前記セグメントAと相補的なセグメントA’を含み、
異なるモジュール式核酸タグの各々セグメントCを含み、前記セグメントCがヘアピンを含み、i)前記セグメントAと前記セグメントB、およびii)セグメントA’とセグメントB’のうちの一方の中間に位置し、
前記セグメントA、A’、B、B’、およびCの各々が、異なる核酸配列を有するセグメントのセットから選択され、
前記セグメントのセットの各セグメントが、少なくとも10ヌクレオチドからなる規定された配列を有し、かつ
前記セグメントのセットが、少なくとも3の対ごとの編集距離を特徴とする、
方法。
【請求項2】
前記ヘアピンが好ましくはステム領域およびループ領域を含む、請求項1に記載の方法。
【請求項3】
前記異なるモジュール式核酸タグの各々がさらに、少なくとも1つの鎖開裂部位を含む、請求項1または2に記載の方法。
【請求項4】
前記二重にタグ付けされた標的核酸を開裂剤と接触させて、前記二重にタグ付けされた標的核酸を前記開裂部位で開裂させ、それによって、開裂した二重にアダプター化された標的核酸を形成することをさらに含む、請求項に記載の方法。
【請求項5】
前記二重にタグ付けされた標的核酸を連結し、それによって、連結された二重にタグ付けされた標的核酸を形成することをさらに含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記連結された二重にタグ付けされた標的核酸の各々の末端をアダプターと結合させ、それによって、複数の二重にアダプター化されたコンカテマーを形成することをさらに含む、請求項に記載の方法。
【請求項7】
前記二重にアダプター化されたコンカテマーの各々を増幅することをさらに含む、請求項に記載の方法。
【請求項8】
前記モジュール式核酸タグへ結合させることが、ライゲーションによるものである、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記開裂部位が、1つ以上のデオキシウラシルを含み、前記開裂剤が、ウラシル-DNA-N-グリコシラーゼ(UNG)およびエンドヌクレアーゼを含む請求項に記載の方法。
【請求項10】
前記エンドヌクレアーゼが、エンドヌクレアーゼIII、エンドヌクレアーゼIV、およびエンドヌクレアーゼVIIIから選択される、請求項9に記載の方法。
【請求項11】
前記開裂部位が、1つ以上の脱塩基部位を含み、前記開裂剤が、エンドヌクレアーゼIII、エンドヌクレアーゼIV、およびエンドヌクレアーゼVIIIから選択されるエンドヌクレアーゼを含む、請求項に記載の方法。
【請求項12】
前記モジュール式核酸タグがヌクレアーゼ保護ヌクレオチドを含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記ヌクレアーゼ保護ヌクレオチドが、ホスホロチオアート基を含む、請求項12に記載の方法。
【請求項14】
前記異なるモジュール式核酸タグの各々がさらに、句読点配列を含み、前記句読点配列が、少なくとも3つのブロックを含み、前記ブロックの各々が、少なくとも3つの同一ヌクレオチドからなるホモポリマーからなる、請求項1~13のいずれか1項に記載の方法。
【請求項15】
モジュール式核酸タグのプールを含む組成物であって、各タグが
i)第1の鎖の5’末端を規定するセグメントA、およびii)前記第1の鎖の3’末端を規定するセグメントBを含む、前記第1の鎖、ならびに
i)第2の鎖の5’末端を規定し、前記第1の鎖のセグメントBと相補的なセグメントB’、およびii)前記第2の鎖の3’末端を規定し、前記第1の鎖のセグメントAと相補的なセグメントA’を含む、前記第2の鎖、
を含み、
モジュール式核酸タグの各々がセグメントCを含み、前記セグメントCがヘアピンを含み、i)前記セグメントAと前記セグメントB、およびii)前記セグメントA’と前記セグメントB’のうちの一方の中間に位置し、
前記セグメントA、A’、B、B’、およびCの各々が、異なる核酸配列を有するセグメントのセットから選択され、
前記セグメントのセットの各セグメントが、少なくとも10ヌクレオチドからなる規定された配列を有し、かつ
前記セグメントのセットが、少なくとも3の対ごとの編集距離を特徴とする、
組成物。
【請求項16】
前記モジュール式核酸タグの各々が、前記第1の鎖および前記第2の鎖のうちの1つの上にある前記セグメントCを含む、請求項15に記載の組成物。
【請求項17】
モジュール式末端配列を有する前記増幅された核酸のライブラリーを塩基配列決定し、それによって複数の塩基配列決定読出しを生成し、ならびにi)前記複数の塩基配列決定読出しを重複排除すること、およびii)コンセンサス配列を決定すること、のうちの少なくとも1つによって、前記複数の塩基配列決定読出しを解析することをさらに含む、請求項1~14のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は概して、核酸分析の分野に関し、より詳細には、核酸塩基配列決定のためのテンプレートを調製することに関する。
【背景技術】
【0002】
単一分子の核酸塩基配列決定ワークフローには概して、選択した塩基配列決定技術を用いた分析に対して和合性のある標的分子のライブラリーを調製するステップが含まれる。さまざまなライブラリー調製スキームが存在するが、これらのスキームの多くは、特定の種類の試料または塩基配列決定機器に限定されている。そのため、広範な種々の試料種類および塩基配列決定システムに適用可能である改良されたライブラリー調製スキームが必要である。
【発明の概要】
【0003】
本発明は、塩基配列決定のための核酸試料調製のためのシステムおよび方法を提供することにより、上述の欠点を克服する。
【0004】
本開示の一実施形態に従って、モジュール式末端配列を有する核酸のライブラリーを調製する方法は、異なるモジュール式核酸タグのプールを、複数の二本鎖標的核酸を含む核酸試料と組み合わせることを含む。該方法はさらに、二本鎖標的核酸の各々の末端を、異なるモジュール式核酸タグのプールから選択されるタグに結合して、複数の二重タグ付き標的核酸を形成すること、二重タグ付き標的核酸の各々を増幅し、それによりモジュール式末端配列を有する核酸のライブラリーを調製すること、およびモジュール式末端配列を有する増幅された核酸のライブラリーを検出することを含む。該異なるモジュール式核酸タグの各々は、第1の鎖および第2の鎖を有する。該第1の鎖は、i)該第1の鎖の5’末端を規定するセグメントA、およびii)該第1の鎖の3’末端を規定するセグメントBを含む。該第2の鎖は、i)該第2の鎖の5’末端を規定し、該第1の鎖の該セグメントBと相補的なセグメントB’、およびii)該第2の鎖の3’末端を規定し、該第1の鎖の該セグメントAと相補的なセグメントA’を含む。
異なるモジュール式核酸タグの各々は、場合によりセグメントCを含み、該セグメントCは、i)該セグメントAと該セグメントB、およびii)該セグメントA’と該セグメントB’のうちの1つの中間に位置する。該セグメントA、A’、B、B’、およびCの各々は、異なる核酸配列を有するセグメントのセットから選択される。該セグメントのセットの各セグメントは、少なくとも10ヌクレオチドからなる規定された配列を有し、該セグメントのセットは、少なくとも3の対ごとの編集距離を特徴とする。
【0005】
一態様では、該異なるモジュール式核酸タグの各々は、該第1の鎖および該第2の鎖のうちの1つの上にあるセグメントCを含む。
【0006】
別の態様では、該異なるモジュール式核酸タグの各々は、該第1の鎖および該第2の鎖の各々の上にあるセグメントCを含む。
【0007】
別の態様では、該セグメントCは、ヘアピンを含む。
【0008】
別の態様では、該ヘアピンは、ステム領域およびループ領域を含む。
【0009】
別の態様では、該異なるモジュール式核酸タグの各々はさらに、少なくとも1つの鎖開裂部位を含む。
【0010】
別の態様では、該方法はさらに、該二重にタグ付けされた標的核酸を開裂剤と接触させて、該二重にタグ付けされた標的核酸を該開裂部位で開裂させ、それによって、開裂した二重にアダプター化された標的核酸を形成することを含む。
【0011】
別の態様では、該方法はさらに、該二重にタグ付けされた標的核酸を鎖状にし、それによって、連結された二重にタグ付けされた標的核酸を形成することを含む。
【0012】
別の態様では、該方法はさらに、該二重にタグ付けされた標的核酸を鎖状にしたものの各々の末端をアダプターと結合させ、それによって、複数の二重にアダプター化されたコンカテマーを形成することを含む。
【0013】
別の態様では、該方法はさらに、該二重にアダプター化されたコンカテマーの各々を増幅することを含む。
【0014】
別の態様では、該モジュール式核酸タグへ結合させることは、ライゲーションによるものである。
【0015】
別の態様では、該ライゲーションは、該標的核酸の粘着末端と該モジュール式核酸タグとの結合によるものである。
【0016】
別の態様では、該開裂部位は、1つ以上のデオキシウラシルを含み、該開裂剤は、ウラシル-DNA-N-グリコシラーゼ(UNG)およびエンドヌクレアーゼを含む。
【0017】
別の態様では、該エンドヌクレアーゼは、エンドヌクレアーゼIII、エンドヌクレアーゼIV、およびエンドヌクレアーゼVIIIから選択される。
【0018】
別の態様では、該開裂部位は、1つ以上の脱塩基部位を含み、該開裂剤は、エンドヌクレアーゼIII、エンドヌクレアーゼIV、およびエンドヌクレアーゼVIIIから選択されるエンドヌクレアーゼを含む。
【0019】
別の態様では、該モジュール式核酸タグは、ヌクレアーゼ保護ヌクレオチドを含む。
【0020】
別の態様では、該ヌクレアーゼ保護ヌクレオチドは、ホスホロチオアート基を含有する。
【0021】
別の態様では、該異なるモジュール式核酸タグの各々はさらに、句読点配列を含み、該句読点配列は、少なくとも3つのブロックを含み、該ブロックの各々は、少なくとも3つの同一ヌクレオチドからなるホモポリマーからなる。
【0022】
別の態様では、該異なるモジュール式核酸タグの各々はさらに、試料識別子配列および分子識別子配列のうちの少なくとも1つを含む。
【0023】
別の態様では、結合させるステップは、標的とされる。
【0024】
別の態様では、該結合させるステップは、標的とされない。
【0025】
別の態様では、該方法はさらに、モジュール式末端配列を有する増幅された核酸のライブラリーを塩基配列決定し、それによって複数の塩基配列決定読出しを生成し、ならびにi)該複数の塩基配列決定読出しを重複排除すること、およびii)コンセンサス配列を決定すること、のうちの少なくとも1つによって、該複数の塩基配列決定読出しを解析することを含む。
【0026】
本開示の別の実施形態に従って、組成物は、モジュール式核酸タグのプールを含む。該タグの各々は、i)第1の鎖の5’末端を規定するセグメントA、およびii)該第1の鎖の3’末端を規定するセグメントBを含む該第1の鎖、ならびにi)第2の鎖の5’末端を規定し、該第1の鎖の該セグメントBと相補的なセグメントB’、およびii)該第2の鎖の3’末端を規定し、該第1の鎖の該セグメントAと相補的なセグメントA’を含む該第2の鎖を含む。モジュール式核酸タグの各々は、場合によりセグメントCを含み、該セグメントCは、i)該セグメントAと該セグメントB、およびii)該セグメントA’と該セグメントB’のうちの1つの中間に位置する。該セグメントA、A’、B、B’、およびCの各々は、異なる核酸配列を有するセグメントのセットから選択される。該セグメントのセットの各セグメントは、少なくとも10ヌクレオチドからなる規定された配列を有し、該セグメントのセットは、少なくとも3の対ごとの編集距離を特徴とする。
【0027】
一態様では、該モジュール式核酸タグの各々は、該第1の鎖および該第2の鎖のうちの1つの上にあるセグメントCを含む。
【0028】
本発明の上述のおよび他の態様および利点は、次の説明から浮かび上がるであろう。該説明において、本明細書の一部を形成し、例示として本発明の好ましい実施形態が示されている添付の図面に対する参照をする。しかしながら、このような実施形態は、必ずしも本発明の完全な範囲を表すわけではなく、それゆえ、本発明の範囲を解釈するために、特許請求の範囲および本明細書に対する参照をする。
【図面の簡単な説明】
【0029】
図1A】本開示によるモジュール式核酸タグの第1の例の概略図である。
図1B】本開示によるモジュール式核酸タグの第2の例の概略図である。
図1C】本開示による二重にタグ付けされた標的核酸の第1の例の概略図である。
図1D】本開示による二重にタグ付けされた標的核酸の第2の例の概略図である。
図2A】本開示によるセグメントCを除くモジュール式核酸タグの例の概略図である。
図2B】モジュール式核酸タグの各鎖についての例となる核酸配列を詳述する図2Aのモジュール式核酸タグの代替図である。
図2C】本開示による対形成されていないループを規定するセグメントCを含むモジュール式核酸タグの概略図である。
図2D】モジュール式核酸タグの各鎖についての例となる核酸配列を詳述する図2Aのモジュール式核酸タグの代替図である。
図2E】本開示によるヘアピンおよび対形成されていないループを規定するセグメントCを含むモジュール式核酸タグの概略図である。
図2F】モジュール式核酸タグの各鎖についての例となる核酸配列を詳述する図2Aのモジュール式核酸タグの代替図である。
【発明を実施するための形態】
【0030】
I.定義
本出願では、文脈から特に明確でない限り、(i)「a」という用語は「少なくとも1つ」を意味すると理解することができ、(ii)「または」という用語は、「および/または」を意味すると理解することができ、(iii)「を含んでいる(comprising)」および「を含む(including)」という用語は、それ自体で、または1つ以上の追加の構成要素もしくはステップと一緒にあるかどうかにかかわらず、項目別の構成要素またはステップを包含すると理解することができ、(iv)「約」および「おおよそ」という用語は、当業者によって理解されるであろう標準的な変動を許容するように理解することができ、(v)範囲が提供されている場合、端点が含まれる。
【0031】
アダプター:「アダプター」という用語は、別の配列に追加の特性をもたらすために該配列に付加することができるヌクレオチド配列を意味する。アダプターは、通常、一本鎖もしくは二本鎖であることができるオリゴヌクレオチド、または一本鎖部分および二本鎖部分の両方を有していてもよい。「アダプター化された標的核酸」という用語は、アダプターが片方または両方の末端で複合体形成している核酸を指す。本明細書でアダプターに対して相互交換可能に使用される他の用語は、「タグ」および「キャップ」である。
【0032】
増幅:本明細書で使用する場合、「増幅」という用語は、標的核酸の追加のコピーを作製するプロセスを指す。増幅は、2つ以上のサイクル、例えば、指数関数的増幅の複数のサイクルを有することができる。増幅は、1サイクルしかないことがある(標的核酸の単一コピーを作製)。該コピーは、追加の配列、例えば、増幅に使用されるプライマーに存在する配列を有することがある。増幅はまた、1本鎖のみ(線形的増幅)のまたは優先的に1本鎖(非対称PCR)のコピーも生成することがある。
【0033】
おおよそ:本明細書で使用する場合、「おおよそ」または「約」という用語は、関心対象の1つ以上の値に適用される場合、記載された参照値と同様の値を指す。ある特定の実施形態では、「おおよそ」または「約」という用語は、特に記載がない限り、または文脈から特に明白でない限り、記載された参照値のいずれかの方向(より大きいかまたはより小さい)において、25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%またはそれより低い範囲内に収まる値の範囲を指す(このような数が、可能な値の100%を超過するであろう場合を除く)。
【0034】
と関係している:この用語を本明細書で使用する場合、ある事象または実体の存在、レベルおよび/または形態が、もう一方の存在、レベル、および/または形態と相関していれば、2つの事象または実体は互いに「関係している」例えば、特定の実体(例えば、ポリペプチド、遺伝子シグネチャー、代謝産物など)は、その存在、レベル、および/または形態が、特定の疾患、障害、または容態の発生率および/またはこれらに対する感受性と(例えば、関連する集団のいたるところで)相関していれば、該疾患、障害、または容態と関係していると見なされる。いくつかの実施形態では、2つ以上の実体は、それらが直接的または間接的に相互作用する場合、互いに物理的に「関係して」おり、それにより、それらは、互いに物理的に近接しているおよび/または近接したままである。いくつかの実施形態では、互いに物理的に関係している2つ以上の実体は、互いに共有結合しており、いくつかの実施形態では、互いに物理的に関係している2つ以上の実体は、互いに共有結合していないが、例えば、水素結合、ファンデルワールス相互作用、疎水性相互作用、磁性、およびこれらの組み合わせによって非共有結合している。
【0035】
バーコード:本明細書で使用する場合、「バーコード」という用語は、検出および同定することができる核酸配列を指す。バーコードは、さまざまな核酸に組み込むことができる。バーコードは十分に長く、例えば、2、5、20ヌクレオチドであり、それにより試料では、バーコードを組み込んでいる核酸をバーコードによって識別または群分けすることができる。
【0036】
生物学的試料:本明細書で使用される場合、「生物学的試料」という用語は、典型的には、本明細書に説明されるように、関心対象の生物学的供給源(例えば、組織または生物または細胞培養物)から取得または得られる試料を指す。いくつかの実施形態では、関心対象の供給源は、動物またはヒトなど、生物を含むかまたはそれからなる。いくつかの実施形態では、生物学的試料は、生物学的な組織また流体を含み、またはそれからなる。いくつかの実施形態では、生物学的試料は、骨髄;血液;血球;腹水;組織もしくは細針生検試料;細胞含有体液;浮遊性核酸;痰;唾液;尿;脳脊髄液、腹腔液;胸膜液;糞;リンパ液;婦人科系の流体;皮膚スワブ;膣スワブ;口腔スワブ;鼻スワブ;乳管洗浄液もしくは気管支肺胞洗浄液などの洗液もしくは洗浄液;吸引液;擦過物;骨髄材料;組織生検材料;外科的材料;他の体液、分泌物および/もしくは排泄物;ならびに/またはこれらに由来する細胞などであってよく、またはこれらを含んでよい。いくつかの実施形態では、生物学的試料は、個体から取得された細胞を含むか、またはそれからなる。いくつかの実施形態では、取得された細胞は、該試料を取得した個体に由来する細胞であり、またはこのような細胞を含む。いくつかの実施形態では、試料は、いずれかの適切な手段によって関心対象の供給源から直接取得された、「一次試料」である。例えば、いくつかの実施形態では、一次生物学的試料は、生検(例えば、細針吸引または組織生検)、体液(例えば、血液、リンパ液または糞など)の収集などからなる群から選択される方法によって取得される。いくつかの実施形態では、文脈から明らかなように、「試料」という用語は、一次試料を加工することによって(例えば、一次試料の1種以上の構成要素を除去し、および/または1種以上の試剤を一次試料に添加することによって)取得された調製物を指す。例えば、半透膜を使用して濾過すること、である。このような「加工された試料」は、例えば、試料から抽出された、またはmRNAの増幅もしくは逆転写、ある特定の構成要素の単離および/もしくは精製などの技術へ、一次試料を供することによって取得された、核酸またはタンパク質を含んでもよい。
【0037】
コンビナトリアル:本明細書で使用する場合、「コンビナトリアル」という用語は、該用語の通常の(すなわち、組み合わせの、組み合わせに関する、または組み合わせを包含する)意味を付与される。そのため、「コンビナトリアル」として説明される組成物は、該組成物が有限集合に属する離散要素から選択したものから構成されることを示す。コンビナトリアルセットには、ある特定の所与の基準を満たすすべての要素が含まれる。例えば、コンビナトリアル核酸タグのプールには、定義された核酸配列の有限集合から構成され、規定された順序で配置された、タグが含まれる。一例では、コンビナトリアル核酸タグは、要素A、要素B、および要素CからA-B-Cの順序で構成されることができ、ここで、要素Aは、異なる核酸からなる第1の有限集合から選択され、要素Bは、異なる核酸からなる第2の有限集合から選択され、要素Cは、異なる核酸の第3の有限集合から選択される。コンビナトリアルとして説明される方法は、該方法が、ステップまたはワークフローの有限集合から選択された1つ以上のステップまたはワークフローから構成されていることを示す。
【0038】
を含んでいる:1つ以上の名前付きの要素またはステップを「含んでいる」として本明細書に説明される組成物または方法は、オープンエンドであり、該名前付きの要素またはステップが必須であるが、他の要素またはステップが、該組成物または方法の範囲内で追加されてもよいことを意味する。1つ以上の名前付き要素またはステップ「を含んでいる」(または「を含む」)と説明された組成物または方法がまた、同じ名前付き要素またはステップ「から本質的になっている」(または「から本質的になる」)相応のより限定された組成物または方法も説明することは理解されることになっており、該組成物または方法が該名前付きの必須の要素またはステップを含み、また、該組成物または方法の基本的および新規の特徴(複数可)に実質的に影響を及ぼさない追加の要素またはステップも含んでもよいことを意味する。1つ以上の名前付きの要素またはステップ「を含んでいる」または「から本質的になる」として本明細書に説明されるいかなる組成物または方法も、名前付きの要素またはステップ「からなっている」(または「からなる」)相応の、より限定された、かつクローズエンドの組成物または方法を、その他の名前の付いていない要素またはステップを除外するために説明することも理解される。本明細書に開示されるいかなる組成物または方法においても、いずれかの名前付きの必須の要素またはステップの公知のまたは開示された同等物を、該要素またはステップの代わりに使用することができる。
【0039】
設計された:本明細書で使用する場合、「設計された」という用語は、(i)その構造が人の手によって選択されている、または選択された作用物質、(ii)人の手を必要とするプロセスによって生成される作用物質、ならびに/または(iii)天然物質および他の公知の作用物質とは異なる作用物質を指す。
【0040】
決定する:本明細書を読んでいる当業者は、「決定すること」が、例えば本明細書で明白に言及される具体的な技術を含む、当業者が利用可能なさまざまな技術のいずれかを利用することができるかまたは該技術のいずれかの使用を経て達成することができることを理解するであろう。いくつかの実施形態では、決定することは、物理的試料の操作を包含する。いくつかの実施形態では、決定することは、データまたは情報の検討および/または操作、例えば、関連する解析を実行するのに適合したコンピュータまたは他の処理装置を利用することを包含する。いくつかの実施形態では、決定することは、情報源から関連情報および/または材料を受信することを包含する。いくつかの実施形態では、決定することは、試料または実体の1つ以上の特色を、比較可能な参照と比較することを包含する。
【0041】
同一性:本明細書で使用される場合、「同一性」という用語は、ポリマー分子間、例えば、核酸分子(例えば、DNA分子および/またはRNA分子)間、および/またはポリペプチド分子間の全体的な関連性を指す。いくつかの実施形態において、ポリマー分子は、それらの配列が少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%同一である場合、互いに「実質的に同一」であると見なされる。例えば、2つの核酸またはポリペプチド配列のパーセント同一性の計算は、最適な比較目的のために2つの配列を整列させることによって実行され得る(例えば、ギャップは、最適な整列のために第1および第2の配列の一方または両方に導入され得る。同一でないシーケンスは、比較のために無視できる)。ある特定の実施形態では、比較目的のために整列させた配列の長さは、参照配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%である。次に、相応の位置のヌクレオチドが比較される。第1の配列の位置が第2の配列の相応の位置と同じ残基(例えば、ヌクレオチドまたはアミノ酸)によって占められているとき、この分子は該位置で同一である。2つの配列間のパーセント同一性は、ギャップの数、および該2つの配列の最適な整列のために導入されることを必要とする各ギャップの長さを考慮した配列によって共有される同一の位置の数の関数である。2つの配列間の配列の比較およびパーセント同一性の決定は、数学的アルゴリズムを使用して達成することができる。例えば、2つのヌクレオチド配列間のパーセント同一性は、ALIGNプログラム(第2.0版)に組み込まれているMeyers and Miller(CABIOS,1989,4:11-17)のアルゴリズムを使用して決定することができる。いくつかの例示的な実施形態では、ALIGNプログラムを用いて行われる核酸配列の比較は、PAM120重量残基表、12のギャップ長ペナルティ、および4のギャップペナルティを使用する。あるいは、2つのヌクレオチド配列間のパーセント同一性は、NWSgapdna.CMPマトリックスを使用するGCGソフトウェアパッケージのGAPプログラムを使用して決定することができる。
【0042】
ライゲーション:本明細書で使用する場合、「ライゲーション」という用語は、ある分子の5’-リン酸基が別の分子の3’-ヒドロキシル基と反応する、2つの核酸鎖を結合させる縮合反応を指す。ライゲーションは通常、リガーゼまたはトポイソメラーゼによって触媒される酵素反応である。ライゲーションは、2つの一本鎖を結合して1つの一本鎖分子を生成することができる。ライゲーションはまた、各々が二本鎖分子に属する2本の鎖を結合させる、したがって、2つの二本鎖分子を結合させることもできる。ライゲーションはまた、二本鎖分子の両方の鎖を別の二本鎖分子の両方の鎖に結合させる、したがって2つの二本鎖分子を結合させることもできる。ライゲーションはまた、二本鎖分子内の鎖の両端を結合させる、したがって二本鎖分子においてニックを修復することもできる。
【0043】
修飾ヌクレオチド:本明細書で使用する場合、「修飾ヌクレオチド」という用語は、アデノシン、グアノシン、チミジン、およびシトシンからなる4つの従来のDNA塩基以外の塩基を有するDNA中のヌクレオチドを説明する。ヌクレオチドdA、dG、dC、およびdTは従来型である。しかしながら、デオキシウラシル(dU)およびデオキシイノシン(dI)は、DNA中の修飾ヌクレオチドである。DNAに挿入されたリボヌクレオチド(rA、rC、rUおよびrG)もまた、本発明の文脈において「修飾ヌクレオチド」と見なされる。最後に、ヌクレオチドの代わりに核酸鎖に挿入された非ヌクレオチド部分(PEGなど)もまた、本発明の文脈において「修飾ヌクレオチド」と見なされる。ヌクレオチドはさらに、ホスホロチオアート結合を含む非天然結合を含めることを経るなど、さらに他の方法で修飾することができる。
【0044】
マルチプレックス識別子:「マルチプレックス識別子」または「MID」という用語は、標的核酸の供給源(例えば、核酸が由来する試料)を識別するバーコードを指す。同じ試料からのすべてまたは実質的にすべての標的核酸は、同じMIDを共有することになる。異なる供給源または試料からの標的核酸は、同時に混合および塩基配列決定することができる。MIDを使用して、配列の読み取りを、標的核酸の出自である個々の試料に割り当てることができる。相互交換可能に使用してもよいMIDについての別の用語は、「試料識別子」または「SID」である。
【0045】
核酸:本明細書で使用する場合、「核酸」という用語は、DNA、RNA、および、これらの下位区分(cDNA、mRNAなど)を含むヌクレオチドのポリマー(例えば、リボヌクレオチドおよびデオキシリボヌクレオチドであって、天然および非天然の両方)を指す。核酸は一本鎖または二本鎖であってよく、概して5’-3’ホスホジエステル結合を含有することになるが、いくつかの場合では、ヌクレオチド類似体が他の結合を有していることがある。核酸には、天然の塩基(アデノシン、グアノシン、シトシン、ウラシル、およびチミジン)および非天然の塩基が含まれることができる。非天然塩基のいくつかの例には、例えば、Seela et al.,(1999)Helv.Chim.Acta 82:1640において説明されている非天然塩基が含まれる。非天然塩基は、特定の機能、例えば、核酸二重鎖の安定性の上昇、ヌクレアーゼ消化の抑制、またはプライマー伸長もしくは鎖重合の遮断を有することができる。
【0046】
ポリヌクレオチドおよびオリゴヌクレオチド:本明細書で使用する場合、「ポリヌクレオチド」および「オリゴヌクレオチド」という用語は、相互交換可能に使用される。ポリヌクレオチドは、一本鎖または二本鎖の核酸である。オリゴヌクレオチドは、より短いポリヌクレオチドを説明するために時折使用される用語である。オリゴヌクレオチドは、当技術分野で公知のいずれかの適切な方法によって、例えば、Narang et al.(1979)Meth.Enzymol.68:90-99、Brown et al.(1979)Meth.Enzymol.68:109-151、Beaucage et al.(1981)Tetrahedron Lett.22:1859-1862、Matteucci et al.(1981)J.Am.Chem.Soc.103:3185-3191において説明されるような直接的な化学合成を包含する方法によって調製される。
【0047】
プライマー:本明細書で使用する場合、「プライマー」という用語は、標的核酸における配列(「プライマー結合部位」)とハイブリッド形成し、かつこのような合成に適した条件下で核酸の相補鎖に沿った合成の開始点として作用することができる一本鎖オリゴヌクレオチドを指す。
【0048】
試料:本明細書で使用する場合、「試料」という用語は、1つ以上の標的核酸を含有する、または含有すると推定されるいずれかの組成物を指す。該用語には、個体から分離された組織または体液の試料、例えば、皮膚、血漿、血清、脊髄液、リンパ液、滑液、尿、涙、血球、器官および腫瘍、およびまた個体から採取した細胞から確立したインビトロ培養物の試料も含まれ、ホルマリン固定/パラフィン包埋組織(FFPET)およびそこから分離した核酸を含む。試料にはまた、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含有する無細胞血液画分などの無細胞材料も含まれてもよい。
【0049】
自己プライミングアダプター:本明細書で使用する場合、「自己プライミングアダプター」という用語は、アダプター自体から鎖の伸長(鎖のコピー)を開始することができるアダプターを指す。自己プライミングアダプターは、別個のプライマー分子が従来のアダプターに結合して該プライマーからの鎖伸長を開始するプライマー結合部位を含んでいる従来のアダプターとは対照的である。
【0050】
塩基配列決定:本明細書で使用する場合、「塩基配列決定」という用語は、標的核酸中のヌクレオチドの配列を決定するいずれかの方法を指す。
【0051】
シングルパス精度:本明細書で使用する場合、「シングルパス精度」という用語は、所与のテンプレート上でのシングルパスから、該当する場合、コンセンサス配列の集合の前に、結果として生じる塩基配列決定プラットフォームによって決定される出力データ(例えば、個々の塩基呼び出し)の精度を指す。合成による塩基配列決定反応の場合、シングルパスはテンプレートの単一コピーの複製を包含するであろう。細孔または他の同様のチャネルを経た単一分子の通過に基づく単一分子塩基配列決定プラットフォームの場合、シングルパスは、チャネルを経た分子の単一の通過を包含するであろう。
【0052】
実質的に:本明細書で使用する場合、「実質的に」という用語は、関心対象の特徴または特性の全体的またはほぼ全体的な程度または度合いを呈する定性的な条件を指す。生物学分野の当業者は、生物学的および化学的現象が、たとえあったとしても、完了するおよび/もしくは進行完了する、または絶対的な結果を達成もしくは回避することが、まれであることを理解するであろう。それゆえ、「実質的に」という用語は、多くの生物学的および化学的現象に固有である完了の欠如という可能性を捉えるために本明細書で使用される。
【0053】
合成:本明細書で使用する場合、「合成」という用語は、人の手によって生成され、それゆえ、自然界には存在しない構造を有するか、あるいは1つ以上の他の構成要素、もしくは自然界では関係していない1つ以上の他の構成要素と会合しているか、または自然界では会合している1つ以上の他の構成要素と会合していないかのいずれかであるので、自然界に存在しない形態にあることを意味する。
【0054】
標的配列:本明細書で使用する場合、「標的配列」、「標的核酸」または「標的」という用語は、検出または分析されるべき試料中の核酸配列の一部を指す。標的という用語は、標的配列のすべての変異体、例えば、突然変異体の1つ以上の変異体および野生型変異体を含む。
【0055】
固有の分子識別子:本明細書で使用する場合、「固有の分子識別子」または「UID」という用語は、付着している核酸を識別するバーコードを指す。同じ試料からのすべてまたは実質的にすべての標的核酸は、異なるUIDを有することになる。元々の同じ標的核酸に由来するすべてまたは実質的にすべての後代(例えば、アンプリコン)は、同じUIDを共有することになる。
【0056】
ユニバーサルプライマー:本明細書で使用する場合、「ユニバーサルプライマー」および「ユニバーサルプライミング結合部位」または「ユニバーサルプライミング部位」という用語は、異なる標的核酸に(通常、インビトロでの付加を経て)存在するプライマーおよびプライマー結合部位を指す。ユニバーサルプライミング部位は、アダプターを使用するか、または5’部分にユニバーサルプライミング部位を有する標的特異的(非ユニバーサル)プライマーを使用して、複数の標的核酸に付加される。ユニバーサルプライマーは、ユニバーサルプライミング部位に結合し、そこからプライマー伸長を指示することができる。
【0057】
より概して、「ユニバーサル」という用語は、いずれかの標的核酸に付加され、標的核酸配列に関係なくその機能を実行することができる核酸分子(例えば、プライマーまたは他のオリゴヌクレオチド)を指す。ユニバーサル分子を相補体にハイブリッド形成すること、例えば、ユニバーサルプライマーをユニバーサルプライマー結合部位へ、またはユニバーサル環化オリゴヌクレオチドをユニバーサルプライマー配列へハイブリッド形成することによって、該ユニバーサル分子の機能を実行することができる。
【0058】
II.ある特定の実施形態の詳細な説明
先でも論議したように、さまざまな状況において、塩基配列決定のための核酸試料調製のための方法を提供することが有用である可能性がある。当業者によって理解されるであろうように、所与の核酸塩基配列決定プラットフォームの設計は、塩基配列決定することができる核酸の種類および立体配置を決定する。そのため、塩基配列決定プラットフォームを使用するために、概して、試料中に存在する核酸をまず操作して、塩基配列決定プラットフォームと和合性のあるフォーマットで核酸を提供することが必要とされる。典型的な試料調製ワークフローは、核酸を試料の残部から分離すること、核酸を二本鎖分子(通常は二本鎖DNA)へ変換すること、核酸を、均一で規定された長さまたは長さの分布を有する分子へ断片化すること、および核酸アダプターを用いて核酸の末端を修飾することなどのステップを必要とする。
【0059】
核酸試料調製におけるアダプターの適用は、これらのアダプターが場合により、プライミング部位、バーコードとしても公知のユニバーサル識別子配列(UID)、試料指標としても公知の試料識別子配列(SID)、およびマルチプレックス識別子配列(MID)などの特色を含むことがあるので、塩基配列決定にとって特に重要である。
【0060】
塩基配列決定のための核酸試料調製のための既存の方法と関係した1つの課題は、該方法が試料の種類または塩基配列決定プラットフォームのいずれにも普遍的に適用不可能であることである。つまり、既存のワークフローは、ほとんどの場合、詳細な試料の種類および具体的な塩基配列決定プラットフォームに特異的である。その上、これらのワークフローは、多くの場合、互いに異なるか、または和合性がない。その結果、ユーザーは、異なる試料の種類または塩基配列決定プラットフォームを用いて作業することが有利である場合、広くさまざまな異なるワークフローを学習し、広くさまざまな試薬および機器を入手しなければならない。
【0061】
これらのおよび他の課題は、本開示による塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法を用いて克服することができる。一態様では、本開示は、広くさまざまな試料の種類および塩基配列決定プラットフォームに対応するために混合および適合させることができる一連の和合性のある試料調製ステップおよびワークフローを準備する。次の説明は、これらの新規のステップおよびワークフローの各々を個別に説明し、次いで、これらのステップおよびワークフローが本開示によりどのように組み合わされることができるのかという例を示す。
【0062】
先に論議したように、単一分子塩基配列決定法は、アダプター化された標的核酸のライブラリーを生成するステップを包含する。いくつかの方法では、ライブラリーは線形の標的核酸でできている。線形ライブラリー調製ワークフロー中に、個々のライブラリーフラグメントを1つ以上のUID、1つ以上のSIDなど、またはそれらの組み合わせと会合させることが有利であることがある。現行のアプローチは通常、ライブラリーフラグメントをアダプター化させるために、このような識別子配列を、標的核酸フラグメントの片端または両端に付加するユニバーサルアダプター配列へ組み込む。一態様では、このようなアダプターは、ライブラリーフラグメントの下流の操作を限定定することがある。別の態様では、このようなアダプターは、さまざまな試料の種類に由来する核酸と和合性がないことがある。
【0063】
本開示の一態様は、標的核酸フラグメントの片端または両端に付加した新規のモジュール式およびコンビナトリアル核酸タグを準備する。本発明のタグには幾多の利点がある。タグは、UIDおよびSIDを含むがこれらに限定されない識別子配列と、標的核酸フラグメントの片端または両端との会合を容易にする。タグ付けされた標的核酸フラグメントは、次いで、いくつかの方法でさらに操作することができる。一例では、タグ付けされたフラグメントを一緒に鎖状にして、長い読出しを塩基配列決定するアプローチに適したより長い分子を形成することができる。別の例では、タグ付けされたフラグメントをさらに、フォーク状アダプターまたはヘアピンアダプターなどの核酸アダプターの付加を経て修飾することができる。
【0064】
本開示のタグは、ゲノムDNA(gDNA)、短いフラグメント(すなわち、約200ヌクレオチド未満)、長いフラグメント(すなわち、約200ヌクレオチド超)、核酸増幅産物など、およびこれらの組み合わせを含む異なる種類の標的核酸と和合性がある。標的核酸の長さおよびタグと和合性のある最終的に調製された塩基配列決定テンプレートの全長は、選択された塩基配列決定プラットフォームによってのみ制限される。
【0065】
本発明のタグはさらに、試料中の標的核酸の検出を容易にする。いくつかの実施形態では、試料は、対象または患者に由来する。いくつかの実施形態では、試料は、例えば生検によって、対象または患者に由来する固形組織または固形腫瘍の断片を含むことができる。試料はまた、体液(例えば、尿、痰、血清、血漿もしくはリンパ液、唾液、痰、汗、涙、脳脊髄液、羊水、滑液、心膜液、腹水、胸水、嚢胞液、胆汁、胃液、腸液、および/または糞の試料)も含むことができ、試料は、腫瘍細胞が存在することができる全血または血液画分を含むことができる。いくつかの実施形態では、試料、特に液体試料は、無細胞腫瘍DNAまたは腫瘍RNAを含む無細胞のDNAまたはRNAなどの無細胞材料を含むことができる。本発明は、希少で少量の標的を分析するのに特に適している。さらに、本発明は、多量および少量の両方の試料に対してモジュール化することができる。いくつかの実施形態では、試料は、無細胞試料、例えば、無細胞腫瘍DNAまたは腫瘍RNAが存在する無細胞血液由来試料である。他の実施形態では、試料は、培養試料、例えば、感染性試剤または感染性試剤に由来する核酸を含有するか、または含有すると疑われる培養物または培養上清である。いくつかの実施形態では、感染性作用物質は、細菌、原生動物、ウイルス、またはマイコプラズマである。
【0066】
標的核酸は、試料中に存在する可能性がある、関心対象の核酸である。いくつかの実施形態では、標的核酸は、遺伝子または遺伝子フラグメントである。他の実施形態では、標的核酸は、一塩基多型もしくは一塩基変異体(SNVまたはSNP)を含む遺伝子変異体、例えば、多型、または、例えば、遺伝子融合をもたらす遺伝子再配列を含有している。いくつかの実施形態では、標的核酸は、バイオマーカーを含む。他の実施形態では、標的核酸は、特定の生物の特徴であり、例えば、病原性生物の同定、または病原性生物の特徴、例えば、薬物感受性もしくは薬物耐性を支援する。さらに他の実施形態では、標的核酸は、ヒト対象の特徴であり、例えば、対象の固有のHLA遺伝子型またはKIR遺伝子型を規定するHLA配列またはKIR配列である。さらに他の実施形態では、試料中のすべての配列は、例えば、ショットガンゲノム塩基配列決定における標的核酸である。
【0067】
本発明の一実施形態では、二本鎖標的核酸は、本発明のテンプレート構造へと変換される。いくつかの実施形態では、標的核酸は、一本鎖形態(例えば、mRNA、マイクロRNA、ウイルスRNAを含むRNA、または一本鎖ウイルスDNA)で天然に生じる。一本鎖標的核酸は、請求する方法に関するさらなるステップを可能にするために二本鎖形態へと変換される。
【0068】
より長い標的核酸はフラグメントにすることができるが、いくつかの応用では、より長い標的核酸は、より長い読出しを達成するために所望であることがある。いくつかの実施形態では、標的核酸は、自然にフラグメントにされており、例えば、保存された試料中に見られるような、環状無細胞DNA(cfDNA)または化学的に分解されたDNAである。他の実施形態では、標的核酸は、例えば、超音波処理などの物理的手段によって、またはエンドヌクレアーゼ消化、例えば、制限消化によって、インビトロでフラグメントにされる。
【0069】
いくつかの実施形態では、本発明は、標的濃縮ステップを含む。該濃縮は、1つ以上の標的特異的プローブを介して標的配列を捕獲することによるものであってよい。試料中の核酸を変性させ、一本鎖標的特異的プローブと接触させてよい。該プローブは、ハイブリッド形成複合体が形成された後、親和性捕捉部分を提供することによって該ハイブリッド形成複合体が捕獲されるように、親和性捕獲部分に対するリガンドを含んでもよい。いくつかの実施形態では、親和性捕獲部分はアビジンまたはストレプトアビジンであり、リガンドはビオチンまたはデスチオビオチンである。いくつかの実施形態では、該部分は、固体支持体に結合している。後でさらに詳細に説明するように、該固体支持体は、DYNABEADS(商標)磁気ビーズまたは磁性ガラス粒子などの超常磁性球状ポリマー粒子を含んでよい。
【0070】
本発明のいくつかの実施形態では、アダプター分子は、標的核酸に連結される。ライゲーションは、平滑末端ライゲーション、またはより効率的な粘着末端ライゲーションであってよい。標的核酸またはアダプターは、3’末端を鎖充填することを含んでいる、すなわち3’末端をDNAポリメラーゼによって伸長して、5’オーバーハングを除去することを含んでいる「末端修復」によって、平滑末端にすることができる。いくつかの実施形態では、平滑末端になったアダプターおよび核酸は、例えばDNAポリメラーゼまたは末端トランスフェラーゼによって、アダプターの3’末端への単一ヌクレオチドおよび標的核酸の3’末端への単一相補的ヌクレオチドの付加によって粘着性にすることができる。さらに他の実施形態では、アダプターおよび標的核酸は、制限エンドヌクレアーゼを用いた消化によって粘着末端(オーバーハング)を獲得することができる。後者の選択肢は、制限酵素認識部位を含有することが公知である公知の標的配列にとってより有利である。いくつかの実施形態では、他の酵素ステップが、ライゲーションを達成するために必要とされることがある。いくつかの実施形態では、ポリヌクレオチドキナーゼは、5’リン酸を標的核酸分子およびアダプター分子へ付加するために使用されてよい。
【0071】
いくつかの実施形態では、該アダプター分子は、インビトロで合成された人工配列である。他の実施形態では、該アダプター分子は、インビトロで合成された天然配列である。さらに他の実施形態では、該アダプター分子は、単離された天然分子である。
【0072】
いくつかの実施形態では、本発明は、バーコードを含有するタグまたはアダプターのライゲーションによる標的核酸へのバーコードの導入を含む。個々の分子の塩基配列決定は通常、例えば、米国特許第7,393,665号、同第8,168,385号、同第8,481,292号、同第8,685,678号、および同第8,722,368号に説明されているような分子バーコードを必要とする。固有の分子バーコードは、通常インビトロ操作の最初の工程の間に患者の試料などの試料中の各分子に付加される、短い人工配列である。該バーコードは分子およびその後代を標識する。固有の分子バーコード(UID)には複数の用途がある。バーコードは、試料中の各個々の核酸分子を追跡して、例えば、生検なしにがんを検出および監視するために、患者の血液中の循環腫瘍DNA(ctDNA)分子の存在および量を評価することを可能にする。米国特許出願第14/209,807号および同第14/774,518号を参照されたい。固有の分子バーコードはまた、塩基配列決定のエラー訂正に使用することもできる。単一の標的分子の後代全体が同じバーコードを用いて標識され、バーコードを付されたファミリーを形成する。バーコードを付されたファミリーの全メンバーによって共有されていない配列の変動は、人工産物であって真の突然変異ではないとして廃棄される。バーコードはまた、ファミリー全体が元の試料中の単一分子であるので、位置的重複排除および標的の定量に使用することもできる。同文献を参照されたい。
【0073】
いくつかの実施形態では、アダプターは、1つ以上のバーコードを含む。バーコードは、試料が混合(マルチプレックス化)される試料の供給源を同定するために使用される試料識別子(SID)またはマルチプレックス識別子配列(MID)であってよい。バーコードはまた、各元の分子およびその後代を同定するために使用されるユニバーサル識別子配列(UID)として機能することもできる。バーコードはまた、UIDとMIDとの組み合わせであってもよい。いくつかの実施形態では、単一のバーコードが、UIDおよびMIDの両方として使用される。
【0074】
いくつかの実施形態では、各バーコードは、所定の配列を含む。他の実施形態では、バーコードは、ランダム配列を含む。バーコードは1~40ヌクレオチド長であることができる。
【0075】
本発明の方法において、タグは、鎖開裂部位を含む。開裂部位は、特異的エンドヌクレアーゼが利用可能である修飾ヌクレオチドから選択される。修飾ヌクレオチドとエンドヌクレアーゼとの対の例の非限定的なリストには、デオキシウラシルとウラシル-N-DNAグリコシラーゼ(UNG)+エンドヌクレアーゼとの対、脱塩基部位とAPヌクレアーゼとの対、8-オキソグアニンと8-オキソグアニンDNAグリコシラーゼ(FPG(ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ)としても公知)との対、デオキシイノシンとアルキルアデニングリコシラーゼ(AAG)+エンドヌクレアーゼとの対、およびリボヌクレオチドとRNアーゼHとの対が含まれる。
【0076】
異なる開裂剤は異なる生成物を生成する。いくつかの実施形態では、3’-Pを含む生成物の混合物を生成するエンドヌクレアーゼVIII(Endo VIII)が使用される。他の実施形態では、3’-ホスホ-α,β-不飽和アルデヒドを生成するエンドヌクレアーゼIII(Endo III)が使用される。さらに他の実施形態では、3’-OH末端を生成するエンドヌクレアーゼIV(Endo IV)が使用される。非伸長性末端は、個別の塩基配列決定プライマーが使用される実施形態において有利である。伸長性3’末端(3’-OH)は、個別の塩基配列決定プライマーがなく、かつ塩基配列決定反応が伸長性3’末端によって自己プライミングされる場合に有利である。
【0077】
いくつかの実施形態では、該方法は、反応混合物を、開裂部位を開裂させることができるエンドヌクレアーゼと、このような開裂が起こり得る条件下で接触させる工程を含む。
【0078】
いくつかの実施形態では、該方法は、適合した標的核酸またはいずれかの他の塩基配列決定中間体(例えば、細孔タンパク質、DNAポリメラーゼ、およびナノ細孔塩基配列決定において使用されるテンプレートの三元複合体)の親和性捕獲を含む。その目的のために、該タグは、標的が親和性捕獲部分によって(例えば、ストレプトアビジンを介して)捕獲されることができる親和性リガンド(例えば、ビオチン)を組み込むことができる。いくつかの実施形態では、デスチオビオチンが使用される。いくつかの実施形態では、親和性捕獲は、固体支持体に結合した親和性分子(例えば、ストレプトアビジン)を利用する。該固体支持体は、溶液中の懸濁液(例えば、ガラスビーズ、磁気ビーズ、ポリマービーズまたは他の同様の粒子)、または固相支持体(例えば、シリコンウェーハ、ガラススライドなど)であることができる。液相支持体の例としては、米国特許第656568号、同第6274386号、同第7371830号、同第6870047号、同第6255477号、同第6746874号、および同第6258531号において説明されるようなDYNABEADS(商標)磁気ビーズまたは磁性ガラス粒子などの超常磁性球状ポリマー粒子が挙げられる。いくつかの実施形態では、親和性リガンドは核酸配列であり、その親和性分子は相補的配列である。いくつかの実施形態では、固体基質はポリTオリゴヌクレオチドを含むのに対し、タグは少なくとも部分的に一本鎖のポリA部分を含む。
【0079】
いくつかの実施形態では、鎖分離は、一本鎖結合タンパク質から選択されるさまざまな作用物質、例えば、細菌SSB、低複雑度DNA C0t DNA(反復配列について濃縮されたDNA)、またはアルカリ、グリセロール、尿素、DMSOもしくはホルムアミドなどの化学剤によって増強される。
【0080】
いくつかの実施形態では、本発明は、タグライゲーション工程の後にエキソヌクレアーゼ消化工程を含む。エキソヌクレアーゼは、一本鎖特異的エキソヌクレアーゼ、二本鎖特異的エキソヌクレアーゼ、またはこれらの組み合わせであってよい。エキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼIII、およびエキソヌクレアーゼVIIのうちの1つ以上であってよい。
【0081】
いくつかの実施形態では、本発明は、本明細書に説明されるような、塩基配列決定に即時利用可能なタグ付き標的核酸のライブラリーを作製する方法、および該方法によって生成されるライブラリーを含む。具体的には、該ライブラリーは、試料中に存在する核酸に由来するタグ付き標的核酸の収集物を含む。該ライブラリーのタグ付き標的核酸分子は、各末端がタグ付き配列と結合した標的配列を含む。
【0082】
いくつかの実施形態では、本発明は、核酸塩基配列決定によって試料中の標的核酸を検出することを含む。試料中のすべての核酸を含む複数の核酸は、本発明のライブラリーへと変換され、塩基配列決定されることができる。
【0083】
いくつかの実施形態では、該方法はさらに、塩基配列決定する読出しの質および長さを改善するために、損傷したまたは分解された標的を該ライブラリーから除去する工程を含む。該工程は、該ライブラリーをウラシルDNA N-グリコシラーゼ(UNGまたはUDG)、APヌクレアーゼ、および8-オキソグアニンDNAグリコシラーゼとしても公知のFPG(ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ)のうちの1つ以上と接触させて、該損傷した標的核酸を分解させることを含むことができる。
【0084】
塩基配列決定は、当技術分野で公知のいずれかの方法によって行うことができる。長い標的核酸を読み取ることができる高スループットの単一分子塩基配列決定は、特に有利である。このような技術の例としては、SMRT(Pacific Biosciences,Menlo Park,Cal.)を利用するPacific Biosciencesプラットフォーム、またはOxford Nanopore Technologies(Oxford,UK)もしくはRoche Sequencing Solutions(Roche Genia,Santa Clara,Cal.)によって製造されるもののようなナノポア技術、および合成による塩基配列決定を包含するかもしくはしないいずれかの他の既存のもしくは未来のDNA塩基配列決定技術を利用するプラットフォームが挙げられる。塩基配列決定工程では、プラットフォーム特異的塩基配列決定プライマーを利用することができる。
【0085】
いくつかの実施形態では、塩基配列決定工程は、配列整列の工程を含む配列分析を包含する。いくつかの実施形態では、整列化を使用して、複数の配列、例えば、同じバーコード(UID)を有する複数の配列からコンセンサス配列を決定する。いくつかの実施形態では、バーコード(UID)は、すべてが同一のバーコード(UID)を有する複数の配列からコンセンサスを決定するために使用される。他の実施形態では、バーコード(UID)は、人工産物、すなわち、同一のバーコード(UID)を有する一部だがすべてではない配列において存在する変化物を除去するために使用される。試料調製または塩基配列決定エラーから生じるこのような人工産物は、除去することができる。
【0086】
いくつかの実施形態では、試料中の各配列の数は、試料中の各バーコード(UID)を有する配列の相対数を定量することによって定量することができる。各UIDは、元の試料中の単一の分子であり、各配列変異体と会合した異なるUIDを計数することによって、元の試料中の各配列の分率を決定することができる。当業者は、コンセンサス配列を決定するために必要な配列読出しの数を決定することができる。いくつかの実施形態では、関連する数は、正確な定量結果のために必要なUID(「配列深度(sequence depth)」)当たりの読出しである。いくつかの実施形態では、所望の深度は、UID当たり5~50読出しである。
【0087】
本開示は、塩基配列決定されるべき二本鎖DNAの片端または両端への固有の識別配列(UID)、試料識別子配列(SID)、またはこれらの組み合わせを規定するタグの付着を準備する。これらのタグは、モジュール配列セグメント/カセットから構成される二本鎖核酸であってよい。各セグメントは、第1の鎖上に規定された配列、および第2の鎖上の相補的な配列を含むことができる。そのため、二本鎖標的核酸の両方の鎖を、規定された配列(またはその相補的配列)でタグ付けすることにより、コンビナトリアル識別子、および塩基配列決定プロセス後のUID配列データの確認が準備される。得られたタグ付き二本鎖標的核酸は、塩基配列決定アダプターに直接付着するか、または長い二本鎖DNAに連結することができる。結果として得られるコンカテマーを有する各フラグメントは、両端が識別子配列で分離され(句読点が付けられ)、コンカテマーの両端は、塩基配列決定アダプターで終止する。タグ付けされた標的核酸はさらに、連結、アダプター付着、またはその両方の前または後に増幅することができる。
【0088】
本開示は、長い読出しの核酸配列の塩基配列決定機器(だが、これに限定されない)で使用するのに適した塩基配列決定ライブラリーを作成するためのいくつかの新規のアプローチを説明している。一態様では、開示された方法は、低いシングルパス精度(すなわち、約99%未満)を特徴とすることができる塩基配列決定機器と和合性がある。別の態様では、開示された方法はさらに、UID、MID、またはこれらの組み合わせを組み込むことを経る計数アプリケーションと和合性がある。
【0089】
一実施形態によると、本開示は、モジュール式コンビナトリアル核酸タグの生成に関する。該タグは、いずれかの特定の核酸試料を使用するのに限定されていない。例えば、核酸試料は、さまざまな長さ、長さ分布、配列の複雑性などを特徴とする核酸フラグメントを含むことができる。本開示はさらに、二本鎖標的核酸の両端への非対称モジュール式核酸タグの付着を含む方法を準備する。該タグには、UID、SID、またはこれらの組み合わせを含むことができる。いくつかの実施形態では、1つ以上の標的核酸を含む核酸試料は、モジュール式核酸タグの付着の前にフラグメントにされる。所与の試料がフラグメントにされる度合いはさまざまであることができる。例えば、該タグは、循環腫瘍DNAおよび無細胞胎児DNAを含む、無細胞DNAなど、非常にフラグメントにされたDNA試料に付着させることができる。結果として得られるライブラリー材料は、特に、固有の分子ID配列との連結後に増幅された場合、指数関数的に増幅され、定量情報を保有することができる。
【0090】
ここで図1Aに目を向けると、モジュール式およびコンビナトリアル核酸タグ100の実施形態は、第1の鎖102および第2の鎖104を含む。第1の鎖102は、該第1の鎖102の5’末端を規定するセグメントA、および該第1の鎖102の3’末端を規定するセグメントBを含む、複数のセグメントを含む。第2の鎖104は、第2のストランド104の5’末端を定義し、第1のストランド102のセグメントBに相補的なセグメントB’を含む複数のセグメントも含み、セグメントA’は、第2の鎖104の3’末端を規定し、第1の鎖102のセグメントAに相補的であり、かつセグメントCは、セグメントA’およびセグメントB’の中間にある。セグメントAおよびセグメントA’は、第1のモジュールまたはA/A’セグメント対を形成するのに対し、セグメントBおよびセグメントB’は第2のモジュールまたはB/B’セグメント対を形成する。
【0091】
A/A’セグメント対およびB/B’セグメント対の各々は、識別子配列を規定する。識別子配列は、UID、および識別子配列の別の区分であるSID、またはこれらの組み合わせであることができる。セグメントCは、セグメント対に寄与しないが、代わりに非対称識別子配列を個々に規定する。非対称識別子配列は、A/A’セグメント対またはB/B’セグメント対によって規定された識別子配列に寄与するか、独立型のUID、SID、または別の識別子配列を規定することができる。セグメントCを含むタグを標的核酸に付着させた後、タグ付けされた標的核酸は、例えば、ポリメラーゼ連鎖反応を介して複製することができる。結果として得られる二本鎖核酸産物は、セグメントCのコピーおよび相補体の両方を含むであろう。その結果、元のテンプレートの第1の鎖および第2の鎖は、対形成したものとして識別可能である。この情報は、当業者によって認識されるように、結果として得られる塩基配列決定データへのさまざまな異なる解析技術の応用を容易にすることができる。
【0092】
一態様では、セグメント(すなわち、A、A’、B、B’、およびC)またはセグメント対(すなわち、A/A’、B/B’)の各々は、異なる核酸配列を有するセグメントまたはセグメント対のセットから選択される。例えば、A/Aのセグメント対は、核酸セグメント対の第1のプールから選択することができ、核酸セグメント対の第1のプールの各メンバーは、異なる配列を有する。B/B’セグメント対は同様に、核酸セグメント対の第2のプールから選択することができ、ここで、核酸セグメントペアの第2のプールの各メンバーは、異なる配列を有する。一態様では、核酸セグメント対の第1のプールおよび核酸セグメント対の第2のプールは、該第1のプールと該第2のプールとの間に重複がないように、異なる配列を含むように設計することができる。一態様では、セグメント対は、少なくとも3の対ごとの編集距離を特徴とする。別の態様では、セグメント対の各々は、少なくとも10ヌクレオチドの長さを有する規定された配列を有するように設計することができる。それゆえ、このことから、核酸タグの全体的な設計は、3つのモジュールまたは部分、すなわち、第1のセグメント対(例えば、A/A’セグメント)、第2のセグメント対(例えば、B/B’セグメント)および対形成していないセグメント(例えば、セグメントC)を含むモジュール設計を有することは認識されるであろう。モジュール式核酸タグはさらに、各セグメントまたはセグメント対が先に説明したように異なるセグメントまたはセグメント対の有限セットから選択することができるという意味で、モジュール式およびコンビナトリアルとして説明される。
【0093】
図1Aを引き続き参照すると、核酸タグ100の要素は、後の説明から認識されるように、必ずしも一定の縮尺で描かれていないか、または核酸セグメントの適切な整列を示すように図示されていないことが認識されるであろう。例えば、要素Aおよび要素A’は、ヌクレオチドにおいて同じ長さを有するように設計することができるが、図1Aは、セグメントAをセグメントA’の長さよりも長い長さを有するものとして示している。その上、いくつかの実施形態では、核酸タグは、セグメントA’およびセグメントB’の中間のセグメントCの代わりに、または該セグメントCに加えて、セグメントAおよびセグメントBの中間のセグメントCを含むことができることが認識されるであろう。例えば、図1Bは、第1の鎖108および第2の鎖110を含む核酸タグ106の別の実施形態を示す。第1の鎖108は、該第1の鎖108の5’末端を規定するセグメントA、該第1の鎖108の3’末端を規定するセグメントB、および該セグメントAと該セグメントBとの中間のセグメントCを含む。第2の鎖110は、該第2の鎖110の5’末端を規定し、該第1の鎖108のセグメントBと相補的なセグメントB’、および該第2の鎖110の3’末端を規定し、該第1の鎖108のセグメントAと相補的なセグメントA’を含む。さらに別の実施形態では、モジュール式核酸タグは、まとめて、例えば、図2Aおよび図2Bに示されるように、セグメントCを完全に除外することができる。
【0094】
特に、セグメントCは、核酸タグ100および106の2つの鎖のうちの1つのみに存在する。これらの実施形態では、セグメントCは、標的核酸の方向性標識、標的核酸の非対称標識、またはこれらの組み合わせを可能にする。そのため、セグメントCは、結果として得られる塩基配列決定データに方向性情報および定量的情報の両方を埋め込むことによって、塩基配列決定された標的核酸の最終的な構築を容易にすることができる。一態様では、セグメントCは、ランダム配列、規定された配列、または部分的に規定された配列を有することができる。
【0095】
ここで図1Cおよび図1Dに目を向けると、核酸タグを標的核酸フラグメントに付着させて、二重にタグ付けされた標的核酸を提供することができる。まず図1Cを参照すると、二重にタグ付けされた標的核酸112は、二本鎖標的核酸フラグメントまたはインサート114、該インサート114の第1の末端に付着した第1の核酸タグ100a、および該インサート114の反対側の第2の末端に付着した第2の核酸タグ100bを含む。特に、該タグ100aおよび該タグ100bの各々は、図1Aにおける核酸タグ100に匹敵する、セグメントA、A’、B、B’およびCを含む全体的な構造を含む。図1Cを引き続き参照すると、該タグ100aおよび100bは、異なるモジュール式核酸タグのプールから選択される。そのため、該タグ100bは、該タグ100aと比較して、全体的な配列において1つ以上の差異を含むことができる。言い換えれば、該タグ100aは、該タグ100bと100%未満の配列同一性を有することを特徴とすることができる。
【0096】
一態様では、該タグ100aおよび100bの各々は、ライゲーションに基づくアプローチを使用して、該インサート114に付着している。例えば、図1Cは、酵素によるライゲーションのための粘着末端を提供するためのT/Aオーバーハングの使用を示しているが、いずれかの適切な方法を使用して、1つ以上のタグをインサートに付着させることができることは認識されるであろう。図示された実施形態では、該インサート114はまず、平滑末端化したフラグメントとして調製され、続いてAテーリング反応により、該インサート114の各鎖に3’単一A(すなわち、アデニンヌクレオチド)オーバーハングが提供される。該タグ100aおよび該タグ100bの各々は、該タグ100aおよび100bの各々の2つの鎖のうちの少なくとも1つに3’単一T(すなわち、チミンヌクレオチド)オーバーハングが提供され、それによって、該タグ100aおよび100bに、該インサート114と和合性のある末端を提供する。先に記載したように、タグをインサートに付着させるためのさらに他のアプローチは、本開示によって実施することができる。付着の他の例には、平滑クローニング、T/Aオーバーハング以外の和合性のある末端の(例えば、制限酵素の使用、ウラシル特異的開裂を経た)形成などが含まれる。
【0097】
一態様では、該インサート114ならびに該タグ100aおよび100bのうちの1つ以上は、自己ライゲーション(すなわち、第1のタグの第2のタグへのライゲーション、または第1のインサートの第2のインサートへのライゲーション)を防止するように設計または処理することができる)。自己ライゲーションを防止するための1つの方法は、選択的リン酸化を含み、それにより、1つ以上の末端ヌクレオチドが脱リン酸化されるか、または非リン酸化状態のままであることが可能になる。望ましくないライゲーション事象を制限するための別のアプローチには、タグの片端に5’または3’のオーバーハングを付加することが含まれる。該オーバーハングは、長さが1、2、3、4、5、または10ヌクレオチドを超えることができる。一例では、該オーバーハングは、ウラシルヌクレオチドの直後に3つの連続するシトシンヌクレオチドを含むことができる。この例では、該タグの反対側の末端を該インサートにライゲーションした後、該タグを(例えば、ウラシルデグリコシラーゼおよびエンドヌクレアーゼIVを用いて)処理して、ライゲーションに和合性のあるタグ末端を生成することができる。望ましくないライゲーション事象を防止するためのさらに別の方法は、該タグ配列へ1つ以上のウラシルヌクレオチドを導入し、それに続いて、ライゲーションを防止することができる修飾ヌクレオチドを用いて配列を終止させることを含む。修飾ヌクレオチドの非限定的な例としては、3’ジデオキシヌクレオチド、3炭素(C3)スペーサーで修飾された5’ヌクレオチド、5’キャップなど、およびこれらの組み合わせが挙げられる。タグを該インサートにライゲーションした後、該タグを(例えば、ウラシルデグリコシラーゼならびにエンドヌクレアーゼVIIIおよびエンドヌクレアーゼIVのうちの少なくとも1つを用いて)処理して、ライゲーション反応に関与することができるタグ末端を生成することができる。
【0098】
二重にタグ付けされた標的核酸112の場合、該第1の鎖116および該第2の鎖118の各々の3’領域は、セグメントCの形態で対形成していない追加の配列を含む。比較すると、図1Dは、このスキームが逆転した代替の実施形態を示している。まず図1Dを参照すると、二重にタグ付けされた標的核酸120は、二本鎖標的核酸インサート114’、該インサート114’の第1の末端に付着した第1の核酸タグ106a、および該インサート114’の反対側の第2の末端に付着した第2の核酸タグ106bを含む。特に、該タグ106aおよび該タグ106bは、図1Bにおける核酸タグ106に匹敵する、セグメントA、A’、B、B’およびCを含む全体的な構造を含む。図1Dを引き続き参照すると、該タグ106aおよび106bは、異なるモジュール式核酸タグのプールから選択される。そのため、該タグ106bは、該タグ106aと比較して、全体的な配列において1つ以上の差異を含むことができる。言い換えれば、該タグ106aは、該タグ106bと100%未満の配列同一性を有することを特徴とすることができる。
【0099】
図1Cおよび図1Dに示される実施形態に加えて、複数の異なるタグをインサートに付着させることができることが認識されるであろう。例えば、該タグ100の構造を有する第1のタグは、インサートの第1の末端に適用されることができるのに対し、該タグ106の構造を有する第2のタグは、該インサートの反対側の第2の末端に適用されることができる。当業者によって理解されるであろうように、タグおよびインサートのさらに他の組み合わせを調製することができる。
【0100】
先に論議したように、該タグ(例えば、該タグ100aおよびタグ100b)は、結果的に得られる塩基配列決定データに方向性情報および定量的情報の両方を埋め込むことによって、塩基配列決定された標的核酸の最終的な構築を容易にすることができる。例えば、二重にタグ付けされた標的核酸112の増幅および塩基配列決定に続いて、複数の読出しが、第1の鎖116および第2の鎖118に由来する増幅産物から生成されるであろう。該第1の鎖116から生成された読出しの各々は、該第1のタグ100aからのセグメントAおよびBと該第2のタグ100bからのセグメントA’、B’およびCとの組み合わせに由来する同じ固有の配列を含むであろう。比較すると、該第2の鎖118から生成される読出しの各々は、該第2のタグ100bからのセグメントAおよびBと、該第1のタグ100aからのセグメントA’、B’およびCとの組み合わせに由来する異なる固有の配列を含むであろう。特に、該第1のタグ100aからのセグメントAおよびBは、該第1のタグ100aからのセグメントA’およびB’に相補的であり、該第2のタグ100bからのセグメントAおよびBは、該第2のタグ100bからのセグメントA’およびB’に相補的である。しかしながら、該第1の鎖116および該第2の鎖118の各々は、異なるセグメントCと会合している。一態様では、該第1のタグ100aのセグメントCは、該第2のタグ100bのセグメントCとは異なる(すなわち、相補的でも同一でもない)。そのため、該第1の鎖116と会合したセグメントの固有の組み合わせを有するすべての塩基配列決定読出しを同定することによって、塩基配列決定データを重複排除する、例えば、該インサート114の存在量を計数することまたは定量が可能となることができる。
【0101】
別の態様では、二重にタグ付けされた標的核酸112の増幅は、該第1のタグ100aまたはその相補体、該第2のタグ100bまたはその相補体、および該第1のタグ100aまたは該第2のタグ100bからの該セグメントC、あるいはこれらの相補体、の組み合わせを有する生成物を結果として生じるであろう。例えば、該第1の鎖116に由来する相補鎖は、該第2のタグ100bからの5’から3’まで、すなわち、i)セグメントA、ii)セグメントCの相補体、およびiii)セグメントB、該インサート114、ならびに該第1のタグ100aからの5’から3’まで、すなわちi)セグメントB’、ii)セグメントC、およびiii)セグメントA’を含むであろう。そのため、該第1の鎖116およびその相補体に由来する塩基配列決定読出し、ならびに該第2の鎖118またはその相補体に由来する読出しは、コンセンサス解析を可能にするために一緒に明確にグループ化することができる。概して、本明細書に開示されるタグは、二重にタグ付けされた標的核酸に由来する塩基配列決定データの下流の重複排除およびコンセンサス解析を容易にすることが理解されるであろう。例えば、少なくとも1つのセグメントCを用いた標的核酸のタグ付けは、塩基配列決定データ解析中に相補的な配列の適切な構築を可能にすることができ、それにより、該標的核酸の相補的な核酸鎖からのコンセンサス塩基配列決定を容易にすることができる。
【0102】
図2A図2Fに示されるように、広くさまざまな核酸タグが、本開示による使用に適している。図2Aに示される例において、タグ200aは、セグメントCをまとめて除外する。そのため、該タグ200aの第1の鎖202aも該タグ200aの第2の鎖204aも、ヘアピンまたは対形成されていないループを含まない。図2Bに目を向けると、該タグ200bは、配列
GGAAATUAGTGCAGTCTCTCAGTCAGTAGCT(配列番号1)
を有する第1の鎖202b、および塩基配列決定
GCTACTGACTGAGAGACTGCACTAATTUC(配列番号2)を有する第2の鎖204bを含む。
該タグ200bは、該第1のスタンド202bの5’部分(すなわち、セグメントA)および該第2の鎖204bの3’部分(すなわち、セグメントA’)からなるA/A’セグメント対206を含む。該タグ200bはさらに、ならびに該第1のスタンド202bの3’部分(すなわち、セグメントB)および該第2の鎖204bの5’部分(すなわち、セグメントB’)からなるB/B’セグメント対208を含む。特に、タグ200bは、図2Aのタグ200aと同じ全体構造を有し、さらに、該第1の鎖202bも該第2の鎖202bも、ヘアピンおよび対形成されていないループを含まないことを示している。第1の鎖202bは、各々が対形成されていない5’単一Gオーバーハングおよび3’単一Tオーバーハングを含むが、しかしながら、該タグ200bは、A/A’セグメント対206およびB/B’セグメント対208の中間の非介在性の対形成されていない配列を含まないことは認識されるであろう。
【0103】
図2Aおよび図2Bに示されるタグに加えて、本開示によるタグは、ヘアピン、対形成されていないループ、またはこれらの組み合わせを規定するセグメントCを含むことができる。セグメントCが、対形成されていないループを含む場合、対形成されていないループを規定する配列は、規定された配列、ランダム配列、またはこれらの組み合わせであることができる。
【0104】
図2Cを参照すると、タグ210aは、第1の鎖212aおよび第2の鎖214aを含む。該第2の鎖214aは、対形成されていないループ216aを含む。図2Dに目を向けると、該タグ210bは、配列
GGAAATUAGTGCAGTCTCTCAGTCAGTAGCT(配列番号1)
を有する第1の鎖212b、および塩基配列決定
GCTACTGACTGNNNNAGAGACTGCACTAATTUC(配列番号3)を有する第2の鎖214bを含む。
該タグ210bは、該第1のスタンド212bの5’部分(すなわち、セグメントA)および該第2の鎖214bの3’部分(すなわち、セグメントA’)からなるA/A’セグメント対218を含む。該タグ210bはさらに、ならびに該第1のスタンド212bの3’部分(すなわち、セグメントB)および該第2の鎖214bの5’部分(すなわち、セグメントB’)からなるB/B’セグメント対220を含む。特に、タグ210bは、図2Cのタグ210aと同じ全体構造を有し、さらに、第2の鎖212bが、A/A’セグメント対218およびB/B’セグメント対220の中間にある対形成されていないループ216bを含むことを示す。対形成されていないループ216bは、該第2の鎖214b内で分子内対形成も該第2の鎖212bとの分子間対形成も呈さない、4つの連続するヌクレオチド(すなわち、「NNNN」)からなる。図2Bにおける該タグ200bの場合にあるように、該タグ210bの第1の鎖212bは、各々が対形成されていない5’単一Gオーバーハングおよび3’単一Tオーバーハングを含むが、しかしながら、該タグ210bは、A/A’セグメント対206およびB/B’セグメント対208の中間の非介在性の対形成されていない配列を含まないことは認識されるであろう。
【0105】
次に、図2Eに目を向けると、タグ222aは、第1の鎖224aおよび第2の鎖226aを含む。第2の鎖226aは、Cセグメント228aを規定するヘアピン230aおよび対形成されていないループ232aの両方を含む。図2Fに目を向けると、該タグ222bは、配列
GGAAATUAGTGCAGTCTCTCAGTCAGTAGCT(配列番号1)
を有する第1の鎖224b、および塩基配列決定
GCTACTGACTGGCTCGAGCNNNNGCTCGAGCAGAGACTGCACTAATTUC(配列番号4)を有する第2の鎖226bを含む。
該タグ222bは、該第1のスタンド224bの5’部分(すなわち、セグメントA)および該第2の鎖226bの3’部分(すなわち、セグメントA’)からなるA/A’セグメント対234を含む。該タグ222bはさらに、ならびに該第1のスタンド224bの3’部分(すなわち、セグメントB)および該第2の鎖226bの5’部分(すなわち、セグメントB’)からなるB/B’セグメント対236を含む。該タグ222bはさらに、ならびにヘアピン230bおよび対形成されていないループ232bを含むCセグメント228bを含む。特に、タグ222bは、図2のタグ222aと同じ全体構造を有する。図2Eに示され、さらに、第2の鎖ra226bが、A/A’セグメント対234およびB/B’セグメント対236の中間のCセグメント228bを含むことを示す。該ヘアピン230bは、該第2の鎖226b内で分子内対形成を呈する8ヌクレオチドの2つの相補基からなる。対形成されていないループ232bは、該第2の鎖226b内での分子内対形成も該第2の鎖226bとの分子間対形成も呈さない、4つの連続するヌクレオチド(すなわち、「NNNN」)からなる。図2Bのタグ200bの場合のように、該タグ222bの第1の鎖224bは、各々が対形成されていない5’単一Gオーバーハングおよび3’単一Tオーバーハングを含むことが認識されるであろう。
【0106】
一態様では、モジュール式核酸タグの各セグメントは、1つ以上のサブユニットから構築することができる。例えば、セグメントは、一緒に連結された単一のサブユニットまたは複数のサブユニットを含むことができる。そのため、個々のサブユニットは、選択された塩基配列決定プラットフォーム、塩基配列決定されるべき試料の種類などを含むいくつかの因子に基づいて、コンビナトリアル様式でから選択することができる。
【0107】
別の態様では、モジュール式核酸タグは、試料識別子またはSIDを含むことができる。この場合、同じSIDを有するモジュール式核酸タグを、所与の試料の標的核酸フラグメントの各々に付加することができる。あるいは、2つ以上の異なるSID配列を含むモジュール式核酸タグを、所与の試料中の標的核酸フラグメントの各々に付加することができる。標的核酸試料ごとに複数のSIDが採用される場合、モジュール式核酸タグは、核酸タグ配列全体のコンビナトリアルパワーを上昇させるために、SID/MIDとUIDとのの組み合わせを含むことができる。
【0108】
先に論議したように、いくつかの実施形態では、核酸タグは、タグ末端のライゲーションを防止するため、ライゲーションが可能なタグ末端の作製を可能にするため、またはこれらの組み合わせのための1つ以上の修飾を含むことができる。図2Bを参照すると、該第1の鎖202bの5’末端は、5’から3’まで、単一のグアニンヌクレオチドオーバーハング、5つの標準ヌクレオチド、およびウラシルヌクレオチドを含む。この例では、末端グアニンヌクレオチドは、タグ200bの相応の末端の、別の分子へのライゲーションを防ぐために、3炭素スペーサーを含むことができる。別の態様では、該第2の鎖204bの3’末端は、3’から5’まで、単一のシトシンヌクレオチド、およびウラシルヌクレオチドを含む。該タグ200bの相応の末端の、別の分子へのライゲーションをさらに防止するために、末端シトシンヌクレオチドをジデオキシシトシンヌクレオチドとして提供することができる。対照的に、該タグ200bの反対側の末端は、該末端(すなわち、該第2の鎖204bの5’末端)のライゲーションを促進するためにリン酸化することができる。該タグ200bのインサートへのライゲーション後、該タグ200bをウラシルデグリコシラーゼおよびエンドヌクレアーゼで処理することができる。該処理は、第1の鎖202bの5’末端および該第2の鎖204bの3’末端にある上述のウラシルヌクレオチドを最終的に標的とし、それにより、選択された塩基配列決定プラットフォームと和合性のある別の二重にタグ付けされた核酸インサートまたはユニバーサル核酸アダプター(例えば、フォーク状アダプターまたはヘアピンアダプター)など、別の適切な分子とのライゲーションに関与することができるA/A’セグメント対206において、とともに3’オーバーハングを形成するであろう図2Dのタグ210bおよび図2Fのタグ222bは、太字のウラシルヌクレオチドによって示されるのと同様の修飾を含むように設計することができる。
【実施例
【0109】
モジュール式核酸タグを組み立てる上での原理の証明として、116bpのKRASエキソン3のPCRアンプリコンを、TruQ1基準ヒトgDNA(HORIZON DISCOVERY GROUP)からQ5 DNAポリメラーゼ(NEW ENGLAND BIOLABS)を用いて生成した。この生成物をAMPure PCR精製キット(BECKMAN COULTER)を用いて精製し、AGILENT Bioanalyzer微細毛細管ベースの電気泳動システムおよび変性ゲルの両方を使用して確認した。TaqDNAポリメラーゼ(NEW ENGLAND BIOLABS)を使用して、3’オーバーハングdAをアンプリコンに付加した。図2Dおよび図2Fによって示される配列を有する、ウラシルを含有するオリゴデオキシヌクレオチドを取得および精製した。該オリゴデオキシヌクレオチドは、各配列特異的吸光係数とUV範囲における試料吸収とを測定することによって化学量論を決定した後にアニーリングした。アニーリングしたオリゴヌクレオチド複合体を25:1::オリゴ複合体:インサート比でA尾部つきKRASインサートに添加し、この混合物をT4 DNAリガーゼで37℃で30分間処理した。結果として得られた材料を、南極ウラシルデグリコシラーゼ(UDG)およびエンドヌクレアーゼIVを37℃で30分間用いて開裂させた。この試料をAMPure PCR精製キット(BECKMAN COULTER)で2倍量で精製した。溶離液を、15%のPEG6000中のT4 DNAリガーゼを使用してライゲートした。このライゲーション産物を、変性ゲルを使用して調べた。
図1A
図1B
図1C
図1D
図2A
図2B
図2C
図2D
図2E
図2F
【配列表】
0007152599000001.app