特許第6475171号(P6475171)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイオナノ ジェノミクス、 インコーポレイテッドの特許一覧

<>
  • 特許6475171-単分子解析方法 図000002
  • 特許6475171-単分子解析方法 図000003
  • 特許6475171-単分子解析方法 図000004
  • 特許6475171-単分子解析方法 図000005
  • 特許6475171-単分子解析方法 図000006
  • 特許6475171-単分子解析方法 図000007
  • 特許6475171-単分子解析方法 図000008
  • 特許6475171-単分子解析方法 図000009
  • 特許6475171-単分子解析方法 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6475171
(24)【登録日】2019年2月8日
(45)【発行日】2019年2月27日
(54)【発明の名称】単分子解析方法
(51)【国際特許分類】
   C12Q 1/6844 20180101AFI20190218BHJP
   C12N 15/09 20060101ALI20190218BHJP
   C12N 9/16 20060101ALN20190218BHJP
【FI】
   C12Q1/6844 Z
   C12N15/09 Z
   !C12N9/16
【請求項の数】15
【全頁数】26
(21)【出願番号】特願2015-556985(P2015-556985)
(86)(22)【出願日】2014年2月3日
(65)【公表番号】特表2016-507239(P2016-507239A)
(43)【公表日】2016年3月10日
(86)【国際出願番号】US2014014501
(87)【国際公開番号】WO2014123822
(87)【国際公開日】20140814
【審査請求日】2017年2月3日
(31)【優先権主張番号】61/761,189
(32)【優先日】2013年2月5日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】515214774
【氏名又は名称】バイオナノ ジェノミクス、 インコーポレイテッド
(74)【代理人】
【識別番号】100079049
【弁理士】
【氏名又は名称】中島 淳
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(72)【発明者】
【氏名】カオ、 ハン
(72)【発明者】
【氏名】シャオ、 ミン
(72)【発明者】
【氏名】ハスティー、 アレックス、 アール.
(72)【発明者】
【氏名】サフビニ、 マイケル、 ジー.
(72)【発明者】
【氏名】サダウスキー、 ヘンリー、 ビー.
【審査官】 市島 洋介
(56)【参考文献】
【文献】 国際公開第2011/050147(WO,A1)
【文献】 特表2011−526787(JP,A)
【文献】 Nucleic Acids Res.,2007年,Vol.35, No.3,e16
【文献】 Nano Lett.,2012年,Vol.12,pp.3861-3866
【文献】 Nat. Biotechnol.,2012年,Vol.30, No.8,pp.771-776
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12Q 1/00−3/00
CAplus/MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
(57)【特許請求の範囲】
【請求項1】
二本鎖の第一のDNAに第一の配列モチーフのところでニックを入れることであって、これにより前記第一のDNAは2以上のニックを含み、前記第一のDNAは前記ニックの隣接部でも二本鎖を維持している、前記ニックを入れること、
前記第一のDNA上の前記2以上のニックを第一の標識で標識すること、
標識された前記二本鎖の第一のDNAを線状化することであって、二本鎖の前記DNAの構造的一体性が維持されている、前記線状化すること、及び
線状化された前記二本鎖の第一のDNA上の前記第一の標識のパターンを検出すること、
を含み、
前記標識することがニックトランスレーションを含み、
前記2以上のニックのうち第一のニックは前記DNAの上鎖に存在し、前記2以上のニックのうち第二のニックは前記第一のDNAの下鎖に存在し、
前記ニックトランスレーションは、前記第一のニックと前記第二のニックとが互いに離れる方向へ移動することで前記第一のDNAの脆弱部位の形成が最小限に抑えられることを含む、DNAを特性解析する方法。
【請求項2】
前記第一のDNAを第三の標識でマーキングすることをさらに含み、前記第三の標識は配列非特異的であり、前記第三の標識は前記第一の標識とは異なる、請求項1に記載の方法。
【請求項3】
前記第一のDNA上の前記ニックの少なくとも一部を修復することをさらに含む、請求項1又は請求項2に記載の方法。
【請求項4】
前記標識することが、標識を含むdNTPの存在下にて、ポリメラーゼを用いて行われ、
前記ポリメラーゼが5’→3’エキソヌクレアーゼ活性を有し、ポリメラーゼがフラップ領域を残し、
前記修復することがリガーゼにより修復することを含み、前記フラップ領域は除去されて、リガーゼによる前記修復に先立ってライゲーション可能なニックが回復され、前記フラップ領域が、少なくとも1つのヌクレオチドが限定的な濃度で存在する条件下又は含まれない条件下にて、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される、請求項に記載の方法。
【請求項5】
前記標識することが、少なくとも1つのヌクレオチドを含めないことによりポリメラーゼの活性を調節することを含む、請求項1〜請求項3のいずれか1項に記載の方法。
【請求項6】
第二のDNAに第一の配列モチーフのところでニックを入れること、
前記第二のDNA上の前記ニックを前記第一の標識で標識すること、
前記第二のDNA上の前記ニックを修復すること、
修復された前記第二のDNAを第三の標識でマーキングすることであって、前記第三の標識は配列非特異的であり、前記第三の標識は前記第一の標識とは異なる、前記マーキングすること、
前記第二のDNAを線状化すること、及び
線状化された前記第二のDNA上の前記第一の標識のパターンを検出すること、
をさらに含む、請求項1〜請求項のいずれか一項に記載の方法。
【請求項7】
前記第一のDNAに前記第一の配列モチーフのところでニックを入れることが、第一のニッキングエンドヌクレアーゼにより、前記第一のDNAの1つの鎖に認識配列のところでニックを入れることを含み、
第二のニッキングエンドヌクレアーゼにより、第二のDNAの相補鎖に認識配列のところでニックを入れることであって、前記第二のDNAの前記相補鎖は前記第一のDNAの前記1つの鎖に対して相補的であり、前記第二のDNAは二本鎖であり、前記第二のDNAは前記ニックの隣接部でも二本鎖を維持している、前記ニックを入れること、
前記第二のDNAを前記ニックを入れる部位のところで第二の標識で標識すること、
前記第二のDNA上の前記ニックを修復すること、
前記第二のDNAを線状化すること、並びに
線状化された前記第一のDNA及び線状化された前記第二のDNA上の前記第一及び第二の標識のパターンを検出すること、
をさらに含む、請求項1に記載の方法。
【請求項8】
前記第一及び第二の標識が互いに同じ標識を含む、請求項に記載の方法。
【請求項9】
前記第一のDNA及び前記第二のDNAがそれぞれ同じ出所に由来する、請求項又は請求項に記載の方法。
【請求項10】
前記第二のニッキングエンドヌクレアーゼが前記第一のニッキングエンドヌクレアーゼと同じ配列モチーフを認識する、請求項〜請求項のいずれか一項に記載の方法。
【請求項11】
前記第二のDNAの前記相補鎖の、前記第二のニッキングエンドヌクレアーゼによりニックを入れる部位から1kb未満の部位で、前記第一のDNAに、前記第一のニッキングエンドヌクレアーゼによりニックを入れる、請求項〜請求項10のいずれか一項に記載の方法。
【請求項12】
前記線状化が、前記DNAをナノチャネル中へ輸送することを含む、請求項1〜請求項11のいずれか一項に記載の方法。
【請求項13】
温度、dNTP濃度、補助因子濃度、バッファー濃度、又はこれらの任意の組み合わせを標識付与の間で調節することにより、ポリメラーゼの活性を調整することをさらに含む、請求項1〜請求項12のいずれか一項に記載の方法。
【請求項14】
標識されたモチーフの前記パターンを用いて、標識された前記第一のDNAをアセンブルし、第一のDNAマップを構築することをさらに含む、請求項1〜請求項13のいずれか一項に記載の方法。
【請求項15】
前記第一のDNA上の前記第一の標識の前記パターンを、参照DNA上の標識のパターンと比較することをさらに含む、請求項1〜請求項14のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その全内容が参照により本明細書に援用される、2013年2月5日に出願された米国特許仮出願第61/761,189号の利益を主張するものである。
【0002】
本発明は、ナノテクノロジーの分野、及び単分子ゲノム解析の分野に関する。
【背景技術】
【0003】
次世代シーケンス(NGS)技術により、高処理量及び低コストでシーケンスデータを得ることができるようになってきた。しかし、de novoゲノムアセンブリは、特に大きいゲノムの場合に依然として課題が多い。反復配列に及び、明確なアセンブリを容易とする大きいコンティグを作製するには、NGSショートリードは不充分である場合が多い。植物ゲノムは、大量の反復エレメントを含有することで知られており、またゲノムサイズが巨大であることからも、このような大きく複雑なゲノムの正確なアセンブリは困難である。
【0004】
高処理シーケンシングの進歩にも拘らず、シーケンスリードの正確なde novoアセンブリは、ゲノムプロジェクトの弱点となっている[1、2]。ゲノムシーケンスアセンブリには、シーケンスコンティグ及びスキャフォールドの作製、並びに全ゲノム低解像度マップへのそれらのアンカリングという2つの一般的な工程がある。NGSプラットフォームでは25から500超の範囲のシーケンスリードが作製される[3]が、1000塩基までのリードはサンガーシーケンシングによって高精度に得ることができる。NGSリードは、明確なアセンブリのためには短すぎる場合が多い。ペアエンドリードにより、コンティグをつなげてスキャフォールドとすることができるが、スキャフォールド間にはギャップが存在することが多い。コンティグ及びスキャフォールドを整列させるためには、独立した技術プラットフォームからの高解像度ゲノムマップが必要とされる。それらは、染色体規模、すなわち遺伝子マップであってもよく、又は領域規模、すなわちバクテリア人工染色体(BAC)やフォスミドのコンティグであってもよい[4]。コンティグ及びスキャフォールドがマップの解像度と比較して短すぎる場合、マッピングが困難な場合がある。例えば、マップは50〜150kbの解像度を有することがある一方、多くのコンティグやスキャフォールドは数キロ塩基の範囲にしか及ばないことがある。加えて、反復配列のミスアセンブリに多くの場合は起因して、コンティグ及びスキャフォールド自体に誤りが存在する。典型的な中型から大型のゲノムは、40〜85%の反復配列を含有しており[5‐8]、効果的なde novoシーケンスアセンブリが大きく妨げられている。
【0005】
ゲノムフィニッシングは、ヒト、アラビドプシス[9]、イネ[10]、及びトウモロコシ[11、12]を含む大型で複雑なゲノムに対する物理マップをガイドとすることに依存してきた。複雑なゲノムの、BACに基づく制限酵素断片物理マッピングは、BACインサート中に反復配列(典型的には100〜220kbの長さ)が散在する場合でも、制限酵素断片の独特なパターンが作製されることから、かなり強固なものである。物理マップ構築のための現行技術としては、SNaPshot[13、14]、全ゲノムプロファイリング[15、16]、光学マッピング[17、18]、及びゲノムマッピング[19]が挙げられる。SNaPshotは、1つ以上の制限酵素及び蛍光標識を用い、続いてキャピラリー電気泳動によって断片を分離する、制限酵素フィンガープリント法である。SNaPshotは、コムギやその他のゲノムの物理マッピングに用いられてきた[14、20]。光学マッピングは、表面に固定されたDNA分子における制限部位の物理的順序を維持することにより、さらなる情報層を提供する[18]。これは、トウモロコシやイネゲノムに適用されてきた[11、12]。in silico配列モチーフマップをコンセンサス光学マップと比較することによって、シーケンスアセンブリを確認することが可能である[22‐25]。しかし、光学マップの情報密度は20kbあたり約1部位にすぎず、この技術は、高いエラー率、非均一DNA線状化、及び低処理量から、その有用性は限定される。従って、このような光学マッピングの制限を克服しうる高解像度(例:<5kb)DNAシーケンシング非依存的マッピング法が非常に必要とされている。
【発明の概要】
【課題を解決するための手段】
【0006】
いくつかの実施形態によると、DNAを特性解析する方法が提供される。この方法は、第一のDNAに第一の配列モチーフのところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れることを含んでもよい。この方法は、第一のDNA上のニックを第一の標識で標識することを含んでよい。この方法は、第一のDNAを線状化することを含んでよい。この方法は、線状化された第一のDNA上の第一の標識のパターンを検出することを含んでよい。ある実施形態では、第一のDNAは、標識付与の後に線状化される。ある実施形態では、この方法は、第一のDNAを第三の標識でマーキングすることをさらに含み、第三の標識は配列非特異的であり、第三の標識は第一の標識とは異なる。ある実施形態では、この方法は、第一のDNA上のニックの少なくとも一部を修復することをさらに含む。ある実施形態では、第一のDNA上のニックが、標識された第一のDNAを第三の標識でマーキングする前に修復される。ある実施形態では、この方法は、第二のDNAに第一の配列モチーフのところでニックを入れること、第二のDNA上のニックを第一の標識で標識すること、第二のDNAを線状化すること、及び線状化された第二のDNA上の第一の標識のパターンを検出すること、をさらに含む。ある実施形態では、この方法は、第二のDNAを第三の標識でマーキングすることをさらに含む。ある実施形態では、この方法は、第二のDNA上のニックの少なくとも一部を修復することをさらに含む。ある実施形態では、第二のDNA上のニックが、標識された第二のDNAを第三の標識でマーキングする前に修復される。ある実施形態では、この方法は第一のDNAに第二の配列モチーフのところでニックを入れることであって、修復された第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること、及び、第一のDNA上の第二の配列モチーフにおけるニックを、第二の標識で標識することであって、第二の標識は第三の標識とは異なる、標識すること、をさらに含む。ある実施形態では、この方法は、第二の標識での標識付与に続いて、第一のDNA上のニックを修復することをさらに含む。ある実施形態では、第一のDNA上のニックが、第一のDNAを第三の標識でマーキングする前に修復される。ある実施形態では、この方法は、第一のDNA上の第二の標識のパターンを検出することをさらに含む。ある実施形態では、この方法は、第二のDNAに第二の配列モチーフのところでニックを入れることを含み、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックをいれること、及び、第二のDNA上の第二の配列モチーフのニックを、第二の標識で標識することであって、第三の標識は、用いられる場合、第二の標識とは異なる、標識すること、をさらに含む。ある実施形態では、第二のDNAは、第一のモチーフでのいずれのニックも修復された後に、第二の配列モチーフにおいてニックが入れられる。ある実施形態では、この方法は、第二の標識での標識付与に続いて、第二のDNA上のニックを修復することをさらに含む。ある実施形態では、この方法は、第二のDNA上の第二の標識のパターンを検出することをさらに含む。
【0007】
ある実施形態によると、DNAを特性解析する方法が提供される。この方法は、第一のニッキングエンドヌクレアーゼにより、第一のDNAの1つの鎖に認識配列のところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れることを含んでよい。この方法は、ニッキング部位のところで第一の標識で標識することを含んでよい。この方法は第一のDNA上のニックを修復することを含んでよい。この方法は、第二のニッキングエンドヌクレアーゼにより、第二のDNAの相補鎖に認識配列のところでニックを入れることであって、第二のDNAの相補鎖は第一のDNAの1つの鎖に対して相補的であり、第二のDNAは二本鎖であり、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること、を含んでよい。この方法は、第二のDNAをニッキング部位のところで第二の標識で標識することを含んでよい。この方法は、第二のDNA上のニックを修復することを含んでよい。この方法はマーキングされた第一のDNA及びマーキングされた第二のDNAを線状化することを含んでよい。この方法は、線状化された第一のDNA及び線状化された第二のDNA上の第一及び第二の標識のパターンを検出することを含んでよい。ある実施形態では、この方法は、修復された第一及び第二のDNAを第三の標識でマーキングすることをさらに含み、第三の標識は配列非特異的である。ある実施形態では、第一のDNA及び第二のDNAが共に同じ出所に由来する。ある実施形態では、第一のDNA及び第二のDNAがそれぞれ異なる出所に由来する。ある実施形態では、第一及び第二の標識が互いに同じ標識を含む。ある実施形態では、第一及び第二の標識がそれぞれ異なる標識を含む。ある実施形態では、この方法は、第一のDNA上の標識のパターンを第二のDNA上の標識のパターンと比較することをさらに含む。ある実施形態では、この方法は、標識されたモチーフのパターンを用いて、標識された第一のDNAをアセンブルし、第一のDNAマップを構築することをさらに含む。ある実施形態では、この方法は、標識されたモチーフのパターンを用いて、標識された第二のDNAをアセンブルし、第二のDNAマップを構築することをさらに含む。ある実施形態では、この方法は標識された配列モチーフのオーバーラップを用いて、複数の第一のDNAをアセンブルし、第一のDNAマップを構築することをさらに含む。ある実施形態では、この方法は、標識された配列モチーフのオーバーラップを用いて、複数の第二のDNAをアセンブルし、第二のDNAマップを構築すること、及び、第一のDNAマップを第二のDNAマップと比較すること、をさらに含む。ある実施形態では、この方法は、第一のニッキングエンドヌクレアーゼにより、第三のDNAの1つの鎖に認識配列のところでニックを入れることにより、少なくとも1つのニッキング部位を作製することであって、第三のDNAは二本鎖であり、第三のDNAはニックの隣接部でも二本鎖を維持している、ニッキング部位を作製すること、をさらに含む。この方法はさらに、第三のDNAをニッキング部位のところで標識することを含んでよい。この方法はさらに、第二のニッキングエンドヌクレアーゼにより、第四のDNAの相補鎖に認識配列のところでニックを入れることにより、少なくとも1つのニッキング部位を作製することであって、第四のDNAの相補鎖は第三のDNAの1つの鎖に対して相補的である、ニッキング部位を作製することを含んでよい。この方法はさらに、第四のDNAをニッキング部位のところで標識することを含んでよい。この方法はさらに、修復された第三及び第四のDNAを第三の標識でマーキングすることであって、第三の標識は配列非特異的である、マーキングすること、を含んでよい。ある実施形態では、この方法は、第三のDNA上のニックを修復すること、及び、第四のDNA上のニックを修復すること、をさらに含む。ある実施形態では、第三のDNA及び第四のDNAが共に同じ第二の出所に由来する。ある実施形態では、この方法はさらに、第三のDNAが、第二の出所からの第一のサンプルを含み、第四のDNAが、第二の出所からの第二のサンプルを含むことを含んでよい。ある実施形態では、第二の出所が第一の出所とは異なる。
【0008】
ある実施形態では、本明細書で述べる方法がいずれも、第一のDNA上の第一の標識のパターンを、参照DNA上の標識のパターンと比較することをさらに含む。ある実施形態では、本明細書で述べる方法がいずれも、第一の標識のパターンを、参照DNA上の標識のパターンと比較することをさらに含む。ある実施形態では、本明細書で述べる方法は、第一の標識のパターンを、参照DNA上の第二の標識のパターンと比較することをさらに含む。ある実施形態では、本明細書で述べる方法は、第一のDNA上の第一及び第二の標識のうちの少なくとも1つのパターンを、参照DNA上の標識のパターンと比較することをさらに含む。ある実施形態では、本明細書で述べる方法は、第一のDNA上の第一及び第二の標識の各々のパターンを、参照DNA上の標識のパターンと比較することをさらに含む。
【0009】
本明細書におけるある実施形態では、線状化が、DNAをナノチャネル中へ輸送することを含む。本明細書におけるある実施形態では、第三の標識が配列非特異的標識を含む。ある実施形態では、第一及び第二の標識が、独立して、フルオロフォア、量子ドット、デンドリマー、ナノワイヤ、ビーズ、ハプテン、ストレプトアビジン、アビジン、ニュートラアビジン、ビオチン、及び反応性基からなる群より選択される。本明細書におけるある実施形態では、第一及び第二の標識が、独立して、フルオロフォア及び量子ドットからなる群より選択される。本明細書におけるある実施形態では、第一及び第二の標識のうちの少なくとも1つが、非光学的標識を含む。本明細書におけるある実施形態では、標識付与がポリメラーゼを用いて行われる。本明細書におけるある実施形態では、標識付与が、標識を含むdNTPの存在下にて、ポリメラーゼを用いて行われる。本明細書におけるある実施形態では、ポリメラーゼが5’→3’エキソヌクレアーゼ活性を有する。本明細書におけるある実施形態では、ポリメラーゼがフラップ領域を残し、フラップ領域は除去されて、リガーゼによる修復に先立ってライゲーション可能なニックが回復される。本明細書におけるある実施形態では、フラップ領域が、少なくとも1つのヌクレオチドが限定的な濃度で存在する条件下にて、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。本明細書におけるある実施形態では、フラップ領域が、少なくとも1つのヌクレオチドが反応系に含まれない条件下にて、ポリメラーゼの5’ →3’エキソヌクレアーゼ活性を用いて除去される。本明細書におけるある実施形態では、フラップ領域が、フラップエンドヌクレアーゼを用いて除去される。本明細書におけるある実施形態では、標識付与が、少なくとも1種のdNTPの存在下にて、ポリメラーゼを用いて行われる。本明細書におけるある実施形態では、少なくとも1種のdNTPが、単一種のdNTPである。本明細書におけるある実施形態では、本明細書で述べる方法は、温度、dNTP濃度、補助因子濃度、バッファー濃度、又はこれらの任意の組み合わせを標識付与の間で調節することにより、ポリメラーゼの活性を調整することをさらに含む。本明細書におけるある実施形態では、第一のモチーフ又は第二のモチーフにニックを入れることが、Nt.BspQIを用いてニックを入れることを含む。
【0010】
ある実施形態によると、DNAのいずれかの鎖上に少なくとも1つの塩基フラップを有する二本鎖DNAを含むDNAを特性解析する方法が提供される。この方法は、少なくとも1種のdNTPが、存在する他のdNTPよりも限定された濃度で存在するか、又は含まれない条件下にて、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて二本鎖DNAを処理することを含んでよい。この方法は、ニックをライゲーションしてフラップ領域のところでの鎖の一体性を回復することを含んでよい。この方法は、DNAを特性解析することを含んでよい。ある実施形態では、標識は、フルオロフォア又は量子ドットを含む。ある実施形態では、標識がタグを含み、タグはフルオロフォア又は量子ドットで標識されている。
【0011】
ある実施形態によると、DNAを特性解析する方法が提供される。この方法は、DNAに第一の配列モチーフのところでニックを入れることであって、DNAは二本鎖であり、DNAはニックの隣接部でも二本鎖を維持している、ニックを入れること、を含んでよい。この方法は、1つのニック部位あたり1つのヌクレオチドが組み込まれように、第一の標識を含むヌクレオチドを用いてDNA上のニックを標識することであって、ヌクレオチドはさらにターミネーターを含み、ターミネーターは可逆的である、標識すること、を含んでよい。この方法は、ターミネーターを除去する(reversing)ことを含んでよい。この方法は、ニックを修復することを含んでよい。この方法は、第二の標識でDNAをマーキングすることであって、第二の標識は配列非特異的であり、第二の標識は第一の標識とは異なる、マーキングすること、を含んでよい。この方法は、第一及び第二の標識を用いた標識付与に続いて、DNAを線状化することを含んでよい。この方法は、線状化されたDNA上の第一の標識のパターンを検出することを含んでよい。ある実施形態では、第一又は第二の標識のうちの少なくとも1つは、フルオロフォア又は量子ドットを含む。ある実施形態では、第一又は第二の標識のうちの少なくとも1つは、タグを含み、タグはフルオロフォア又は量子ドットで標識されている。ある実施形態では、標識は、非光学的標識を含む。
【図面の簡単な説明】
【0012】
図1図1は、ニックが互いに近接している場合(図1A)又は互いに離れている場合(図1B)における、ニックを入れた結果、脆弱部位で発生し得る断片化を示す。
【0013】
図2図2は、長さ(又は質量)が小さい分子から大きい分子へ順に並べて示されるサイズヒストグラムにおける中間点に相当するDNAの長さ(「質量中心」として示す)、参照ゲノムに対してマッピングされたDNA分子の百分率(「参照ゲノムに対するマッピング」として示す)、並びに配列決定された参照ゲノムに対するマッピングにおける、そのシミュレーションと比較した偽陽性及び偽陰性率(「偽陽性」及び「偽陰性」として示す)を、以下の処理を受けたE.coliの場合について示す:1)修復なし、2)製造元(ニューイングランド バイオラボ(New England BioLabs))の推奨に従うPreCRによる修復、3)dGTPを含まない条件下でのPreCRによる修復、4)dATP及びdGTPを含まない条件下でのPreCRによる修復、5)dGTPを含まない条件下でのTaqポリメラーゼによる修復。
【0014】
図3図3は、質量中心、参照ゲノムに対するマッピング百分率、並びに偽陽性及び偽陰性率を、以下の処理を受けたE.coliの場合について示す:1)修復なし、2)フラップ除去のためのFEN Iによる処理後、移動した(translated)ニック修復のためのリガーゼによる処理。
【0015】
図4図4は、質量中心、参照ゲノムに対するマッピング百分率、並びに偽陽性及び偽陰性率を、以下の処理を受けたショウジョウバエ(Drosophila)の場合について示す:1)Nt.BspQIによるニッキング及びPreCRによる修復、2)Nb.BbVCIによるニッキング及びPreCRによる修復。
【0016】
図5A図5は、実施例4で述べるように、IrysChipのレイアウト(5A)、ナノチャネルでの線状化(5B)、配列特異的位置での標識の分布(5C)、コンセンサスマップの配置(5D)、並びにコンセンサスマップのオーバーラップに基づくゲノム領域のマップ(5E)を含む、2つの酵素による二色ゲノムマッピングを示す。
図5B図5は、実施例4で述べるように、IrysChipのレイアウト(5A)、ナノチャネルでの線状化(5B)、配列特異的位置での標識の分布(5C)、コンセンサスマップの配置(5D)、並びにコンセンサスマップのオーバーラップに基づくゲノム領域のマップ(5E)を含む、2つの酵素による二色ゲノムマッピングを示す。
図5C図5は、実施例4で述べるように、IrysChipのレイアウト(5A)、ナノチャネルでの線状化(5B)、配列特異的位置での標識の分布(5C)、コンセンサスマップの配置(5D)、並びにコンセンサスマップのオーバーラップに基づくゲノム領域のマップ(5E)を含む、2つの酵素による二色ゲノムマッピングを示す。
図5D図5は、実施例4で述べるように、IrysChipのレイアウト(5A)、ナノチャネルでの線状化(5B)、配列特異的位置での標識の分布(5C)、コンセンサスマップの配置(5D)、並びにコンセンサスマップのオーバーラップに基づくゲノム領域のマップ(5E)を含む、2つの酵素による二色ゲノムマッピングを示す。
図5E図5は、実施例4で述べるように、IrysChipのレイアウト(5A)、ナノチャネルでの線状化(5B)、配列特異的位置での標識の分布(5C)、コンセンサスマップの配置(5D)、並びにコンセンサスマップのオーバーラップに基づくゲノム領域のマップ(5E)を含む、2つの酵素による二色ゲノムマッピングを示す。
【発明を実施するための形態】
【0017】
DNA鎖の一体性を維持及び回復することは、複雑なゲノムマッピング及び情報密度のために有用な長鎖標識分子を得るために不可欠である。本明細書で述べる方法によれば、脆弱なDNA部位の形成及びDNAの断片化を最小限に抑え、ニッキング手法の使用後にDNAの構造的一体性を回復し、並びに高解像度マップを作製する目的でDNAの情報内容を最大化するための手法が提供される。
【0018】
本明細書において、再現性良く均一にDNAを線状化するためにナノチャネルアレイと合わせて用いることができる手法を説明する。このような手法によって、(例えば、DNAを固定するのではなく、溶液中に維持することによる)ノイズ特性の改善に加えて、チャネルローディング及びイメージングのサイクルを伴って、高処理量のDNAリードを作り出すことができる。単一分子レベルでのナノチャネルアレイ上でのゲノムマッピングは、既存技術の制限の多くを克服するものであり、その全内容が参照により本明細書に援用されるLam ET et al.(Genome mapping on nanochannel arrays for structural variation analysis and sequence assembly, Nat Biotechnol 30: 771-776, 2012)に詳細に記載されている。本明細書で述べるある実施形態では、ゲノムマッピングの手法により、複数のモチーフを異なる色で標識することが可能であり、情報密度が大きく増加する。
【0019】
ある実施形態では、高解像度物理マップが構築される。この物理マップを用いて、SNaPshotフィンガープリント技術などの別の方法を用いて作製された物理マップの確認や修正を行うことができる。ある実施形態では、この物理マップを用いて、アセンブルされた領域の確認や、シーケンススキャフォールド中の不正確部分の修正を行うことができる。この物理マップはまた、シーケンススキャフォールドのアンカリングによる領域のde novoシーケンスアセンブリの促進にも用いることができる。ある実施形態では、物理マップを用いて、精度の高い完全なシーケンスアセンブリが作製される。
【0020】
本明細書で提供されるある実施形態では、解析用DNAの調製のためにニックの標識付与が用いられる。ニック標識付与プロセスの一部として、ニックは(図1Aに示されるように)互いに近付けられても、(図1Bに示されるように)又は離されてもよい。いかなる理論にも限定されるものではないが、向かい合うDNA鎖上の2つのニック間の距離が<1Kbである場合に、脆弱部位が発生することが見いだされた。脆弱部位では、例えば、1)機械的操作、2)標識付与に要する熱、3)(例えば、ポリメラーゼのエキソヌクレアーゼ活性を用いる)標識付与及び特定の種類の修復に伴う鎖伸長、又は4)DNA分子の線状化に伴うせん断力に起因して、断片化が発生し得る。一般的に、ニック間の距離が短いほど、特に標識付与によって元の距離より短くなる場合(図1A)、断片化の頻度が上がる。本明細書で述べるように、ニックの修復によってDNAの切断を回復しうることが見出された。そのため、ある実施形態では、DNAは、ニッキングの後に修復される。しかし、本明細書においては、ある状況下、例えばニックの発生頻度が非常に低く、脆弱部位が発生する可能性が低いような場合には、ニックが入れられ標識されたDNAは、ニック修復を行うことなく解析されうることも考えられる。そのため、ある実施形態では、DNAは、ニッキング後に修復されないか、又はニッキング及び標識付与の後に修復されない。
【0021】
ある実施形態では、本明細書で述べる方法は、例えば蛍光ヌクレオチド類似体によって続いて標識される配列特異的ニックを作り出すニッキング酵素を利用する。ある実施形態では、ニック標識付与DNAは、インターカレーター染料を用いて染色され、電場によってナノフルイディックチップにローディングされ、イメージングされる。ある実施形態では、DNAは、ナノチャネルアレイでの拘束によって線状化され、その結果均一な線状化が得られ、シグネチャパターンを含むDNA分子上のニック標識間の距離を精密かつ正確に測定できる。ある実施形態では、DNAローディング及びイメージングは、自動的に繰り返されてよい。ある実施形態では、第二のニッキング酵素が用いられる。ある実施形態では、この第二のニッキング酵素は、第二の標識色と共に用いられる。本明細書における実施形態に従って用いることができるニッカーゼの例としては、これらに限定されないが、Nb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBI;Nt.CviPII、及びこれらの組み合わせが挙げられる。ある実施形態では、切断部又はニックは、電磁放射線(例えばUV光)、1つ以上のフリーラジカルへなどの暴露などの物理的又は化学的プロセスによって作製される。
【0022】
ある実施形態では、脆弱部位に基づく断片化を軽減するための方法が提供される。ある実施形態では、反応推進条件(driving conditions)の低下によって標識の取り込み速度が制限され、これにより脆弱部位での断片化が最小限に抑えられる。ある実施形態では、反応推進条件の低下によって、DNA伸長に伴うせん断応力が最小限に抑えられる。ある実施形態では、反応推進は、dNTPの濃度の低下、反応温度の低下、補助因子濃度の低下、バッファー及び塩濃度の調節、又はこれらの組み合わせによって低下される。反応推進はまた、高いdNTP濃度でポリメラーゼのエキソヌクレアーゼ活性を刺激し、続いて少なくとも1つのヌクレオチドを制限するか又は取り除くことによって伸長を制限することにより、修復のレベルで低下されてもよい(枯渇状態での修復(choked repair)と称される場合がある)。好ましい実施形態では、単一種のdNTP(例:dATP)がニック部位に取り込まれ、フラップが伸長を伴わずにフラップヌクレアーゼを用いて除去され、そしてライゲーションが行われる。
【0023】
ある実施形態では、反応推進条件を低下するために、好熱性ポリメラーゼにとって準最適温度が用いられる。ある実施形態では、反応温度は、約35℃から約75℃であり、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、又は75℃などである。好ましい実施形態では、温度は、約50℃から約55℃、約55℃から約60℃、約60℃から約65℃、又は約50℃から約65℃である。
【0024】
ある実施形態では、本明細書で用いられるポリメラーゼは、熱安定性である。ある実施形態では、ポリメラーゼは、中温性である。ある好ましい実施形態では、ポリメラーゼは、プルーフリーディング能力を持たない。ある好ましい実施形態では、ポリメラーゼは、鎖置換能力を持つ。ある好ましい実施形態では、ポリメラーゼは、5’→3’エキソヌクレアーゼ活性を持つ。ある好ましい実施形態では、ポリメラーゼは、プルーフリーディング能力を持たないが、鎖置換能力及び5’→3’エキソヌクレアーゼ活性を持つ。
【0025】
いかなる理論にも限定されるものではないが、ニックトランスレーション標識付与の過程にて、向かい合う鎖上で互いに近接するニックは、互いの方向へ移動するか(断片化につながる「A型」不安定化効果)又は互いから離れる方向へ移動する(ニック間の距離の増加に伴う「B型」安定化効果)ことが見いだされた。ある実施形態では、同じ出所からの対応するDNAの上鎖のニック標識付与及び下鎖のニック標識付与を別々に行うことによって、A型効果がB型効果に変換される。ある実施形態では、脆弱部位での断片化は、同じ出所からの異なるDNAの上鎖ニック標識付与及び下鎖ニック標識付与を行うことによって最小限に抑えられる。例えば、1つの出所からのDNAの第一のアリコートに上鎖へのニック標識付与を行い、同じ出所からのDNAの第二のアリコートに下鎖へのニック標識付与を行ってよい。ある実施形態では、脆弱部位の形成を最小限に抑えるため、特定のDNA鎖を標的とするために、同じ配列モチーフを標的とするが対向する鎖にニックを入れるニッカーゼを用いる。ある実施形態では、ニッカーゼは、二本鎖DNAの1つの鎖にのみ結合するように修飾されたものである。ある実施形態では、ニッカーゼは、第一のDNA分子からの一本鎖及び第二のDNA分子からの一本鎖を標的とするために用いられる。これらの実施形態のいくつかでは、第一のDNAからの一本鎖は第一のニッカーゼの標的とされ、第二のDNA分子からの相補鎖は第一のニッカーゼと同じ配列モチーフを認識する第二のニッカーゼの標的とされる。ある実施形態では、伸長方向が一方の鎖において逆方向である。例えばある実施形態では、ニッキング部位からの伸長が、第一のDNA分子では一方方向に起こり、第二のDNA分子では逆方向に起こる。ある実施形態では、ニッキング部位からの伸長は、DNA分子の上鎖では一方方向に起こり、同じDNA分子の下鎖では逆方向に起こる。
【0026】
ある実施形態では、本明細書で述べるように、アセンブリのために参照マップが用いられる。
【0027】
ある実施形態では、情報密度を最大化するために、複数のニッカーゼが用いられる。ある実施形態では、複数のニッカーゼによってニックが入れられた分子は、参照マップを用いてアセンブルされる。
【0028】
ある実施形態では、情報密度を最大化するために、2つ以上のニッキング工程が用いられる。ある実施形態では、2つ以上のニッキング工程を経た1又は複数の分子が、参照マップを用いてアセンブルされる。
【0029】
ある実施形態では、DNAは線状化される。DNA線状化の手段としては、液体流、キャピラリー流、対流、電場、誘電場、熱勾配、磁場、これらの組み合わせ(例えば、物理的制限と電場の使用)のせん断力の使用を含んでもよく、又は当業者に公知である他のどのような方法を含んでもよい。ある実施形態では、本明細書で述べる(1又は複数の)チャネルは、マイクロメートル範囲の断面寸法を有する。ある好ましい実施形態では、チャネルは、ナノメートル範囲の断面寸法を有する。ナノチャネル及びナノチャネルの使用が組み込まれた方法の例は、その全内容が参照により本明細書に援用される米国特許出願公開第2011/0171634号及び2012/0237936号に提供されている。
【0030】
ある実施形態では、目的とする分子中の第二のモチーフが調べられる。ある実施形態では、第二のモチーフは、非切断制限酵素、ジンクフィンガータンパク質、抗体、転写因子、転写活性化因子様ドメイン、DNA結合タンパク質、ポリアミド、三重らせん形成オリゴヌクレオチド、及びペプチド核酸から選択される結合要素のための少なくとも1つの結合部位を含む。ある実施形態では、第二のモチーフのマーキング又はタグ付けは、第二の標識を含む結合要素によって行われる。ある実施形態では、マーキングは、DNAを切断せず、DNAにニックも入れない標識で行われる。ある実施形態では、タグ付けは、DNAを切断せず、DNAにニックも入れない標識で行われる。
【0031】
ある好ましい実施形態では、第二のモチーフは、ペプチド核酸の結合部位を少なくとも1つ含む。ある実施形態では、タグ付けは、第二の標識を含むペプチド核酸によって行われる。他の実施形態では、第二のモチーフは、メチルトランスフェラーゼの認識配列を少なくとも1つ含む。ある実施形態では、タグ付けは、メチルトランスフェラーゼで行われる。ある実施形態では、タグ付けは、第二の標識を有する修飾された補助因子を含むメチルトランスフェラーゼで行われる。
【0032】
ある実施形態では、修飾された補助因子が用いられる。ある実施形態では、修飾された補助因子は、メチルトランスフェラーゼ認識配列と共有結合するように移動できるタグとして機能する第二の標識を含有する。他の実施形態では、修飾された補助因子は、メチルトランスフェラーゼ認識配列と直接結合する第二の標識を含有する。
【0033】
ある実施形態では、本明細書で述べる標識は、フルオロフォア、量子ドット、デンドリマー、ナノワイヤ、ビーズ、ハプテン、ストレプトアビジン、アビジン、ニュートラアビジン、ビオチン、又は反応性基から選択される。ある好ましい実施形態では、本明細書で述べる第一及び第二の標識は、フルオロフォア又は量子ドットから選択される。
【0034】
ある実施形態では、本明細書で述べる少なくとも1つの標識は、非光学的標識を含む。本明細書の実施形態と合わせて、様々な非光学的標識が用いられてよい。ある実施形態では、非光学的標識は、電子標識を含む。電子標識の例としては、これらに限定されないが、強い電荷を持つ分子が挙げられ、例えば、金属イオン、帯電したアミノ酸側鎖、又はその他のカチオン若しくはアニオンなどのイオンなどが挙げられる。電子標識は、例えば、標識が検出器内に置かれた際の導電率(又は抵抗率)によって検出することができる。ある実施形態では、ナノチャネルは、チャネル中に置かれた物質の導電率又は抵抗率を特定することによって電子標識の有無を特定するように構成された電極を含む。ある実施形態では、非光学的標識は、金属、金属酸化物(例えば、金属酸化物)、又は酸化ケイ素部分を含む。ある実施形態では、非光学的標識は、金属、金属酸化物、又はその他の酸化物を含む部分(例えばナノ粒子)を有する。特定の金属又は酸化物部分の存在は、例えば、核磁気共鳴によって検出することができる。ある実施形態では、標識は特定の条件下(例:pHの変化)にて一部分(例えば、プロトンやアニオンなど)を放出するように構成され、放出された部分の有無が検出される。
【0035】
ある実施形態では、2つ以上の標識は同じである。例えば、第一のDNAが標識及び特性解析され、第二のDNAが標識及び特性解析される場合、第一のDNA及び第二のDNAは、同じ種類の標識、例えば同じフルオロフォア、同じ量子ドット、又は同じ非光学的標識で標識されてよい。例として、第一のDNAは第一のナノチャネル中で特性解析されてよく、第二のDNAは第二のナノチャネル中で特性解析されてよく、従って、各DNAが同じ標識部分で標識されている場合でも、これら2つのDNAの標識パターンは区別できる。ある実施形態では、例えば単一のDNAが2つ以上の異なるモチーフのところで標識される場合などに、第一の標識及び第二の標識は異なっている。
【0036】
可逆的ターミネーターを持つヌクレオチドは第一のホスホジエステル結合を形成できるが、ターミネーションを除去する前は、第二のホスホジエステル結合を形成できない(又は形成する能力が限定される)。従って、可逆的ターミネーターを持つヌクレオチドは(例えばニック部位において)ポリヌクレオチド中に取り込まれうるが、このヌクレオチドは、ターミネーターが除去されるまで、下流のホスホジエステル結合を形成できない。除去は、当業者に公知の技術を用いて行われてよい。例えば、ターミネーターは、例えば電磁放射線を介して切断することができる切断可能リンカーを介してヌクレオチドと結合されてよい。3’可逆的ターミネーターを含む標識されたヌクレオチドを用いてニックの修復が行われる場合、単一の標識されたヌクレオチドをニックに組み込んでもよいが、ターミネーターは、他の標識されたヌクレオチドがニックに組み込まれることを阻止することができる。そのため、ニックの標識付与は、1つのニックあたり1つの標識されたヌクレオチドとなるように限定することができる。1つのニックあたり1つの標識部分となるようにニックの標識付与を限定することにより、同じニックに複数の標識が組み込まれることによるバイアスの可能性を最小限に抑えることができる。例えば、1つのニックあたり1つの標識部分となるように標識付与を限定する手法が取られる場合、互いに非常に近接する2つのニックを、標識からのシグナルが比較的強いことに基づいて分離することができる(すなわち、2つの標識が単に同じニックに組み込まれてしまったという可能性を排除することができる)。例えば、ニック数の定量的評価が望まれる場合、1ニック1標識の手法により、標識シグナル強度とニック数との間の直接の相関が容易となる。可逆的ターミネーターを含むヌクレオチド上の標識は、本明細書で述べる通りであってよい。ある実施形態では、可逆的ターミネーターを含むヌクレオチドは、量子ドットを含む。ある実施形態では、可逆的ターミネーターを含むヌクレオチドは、フルオロフォアを含む。ある実施形態では、可逆的ターミネーターを含むヌクレオチドは、非光学的標識を含む。
【0037】
ある実施形態では、ニック標識付与は、可逆的ターミネーターを含む標識されたヌクレオチドを用いて行われる。各ニックに2個以上の標識が組み込まれないように、単一の可逆的ターミネーター含有標識ヌクレオチドが1つのニックに組み込まれてよい。例えば、ヌクレオチドをターミネーターと結合するリンカーが切断されてよい。ターミネーターの除去に続いて、ニックが修復されてよい。次に、DNA上の第一の標識のパターンを検出するために、標識が検出されてよい。
【0038】
ある実施形態では、標識付与は、ニックトランスレーションのプロセスを用いて、少なくとも1つの標識されたdNTPの存在下にて、ポリメラーゼを用いて行われる。標識されたdNTPは、好ましくは、フルオロフォア又は量子ドットを含有する。ある実施形態では、標識付与は、その全内容が参照により本明細書に援用される米国特許仮出願第61/713,862号に記載の通りに行われる。
【0039】
ある実施形態では、本明細書で用いられるポリメラーゼは、フラップ領域を残し、それは、修復に先立って除去されて、ライゲーション可能なニックが生成される。いかなる理論にも限定されるものではないが、1つ以上のフラップ領域の存在が、ライゲーションを妨げている可能性がある。いかなる理論にも限定されるものではないが、5’→3’エキソヌクレアーゼ活性を持つポリメラーゼを用いた伸長は、特にヌクレオチド濃度が限定された条件下でポリメラーゼ伸長が行われる場合、フラップ領域を残し得る。そのため、ある実施形態では、フラップ領域は、5’→3’活性を持つポリメラーゼによる伸長を含む標識付与の後に除去される。ある好ましい実施形態では、修復は、DNAリガーゼで行われる。DNAリガーゼの例としては、Taq DNAリガーゼ、E coli DNAリガーゼ、T7 DNAリガーゼ、T4 DNAリガーゼ、及び9°N DNAリガーゼ(ニューイングランド バイオラボ)が挙げられる。ある実施形態では、フラップ領域はエンドヌクレアーゼで除去される。例えば、ある好ましい実施形態では、フラップ領域は、フラップエンドヌクレアーゼ(例:FEN I)で除去される。ある実施形態では、フラップ領域はエキソヌクレアーゼで除去される。ある好ましい実施形態では、フラップ領域はポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある好ましい実施形態では、フラップ領域は、4つのヌクレオチド(例えば、dATP、dGTP、dCTP、dTTP/dUTP)のうちの少なくとも1つが限定的な濃度で提供される条件下で、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある好ましい実施形態では、フラップ領域は、4つのヌクレオチドのうちの少なくとも1つが含まれない条件下で、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある好ましい実施形態では、フラップ領域は、Taqポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある実施形態では、フラップは、移動したニックのライゲーション性を回復するために除去される。ある実施形態では、フラップ領域の除去及びニックの修復は、PreCR酵素ミックス(ニューイングランド バイオラボ)などのこれらの機能を実行する酵素の混合物を用いて行われる。ある実施形態では、PreCR酵素ミックスは、4つのヌクレオチドのうちの少なくとも1つが限定的な濃度で提供されるか、又は含まれない条件下で用いられる。
【0040】
フラップの除去プロセスの過程で除かれないヌクレオチドは、各々、約25nM〜約50nM、約50nM〜約100nM、約100nM〜約200nM、約200nM〜約400nM、約400nM〜約800nM、約800nM〜約1.6uM、約1.6uM〜約3.2uM、約3.2uM〜約6.4uM、約6.4uM〜約12.8uM、約12.8uM〜約25.6uM、約25.6uM〜約51.2uM、約51.2uM〜約102.4uM、約102.4uM〜約204.8uM、約204.8uM〜約409.6uM、及び約409.6uM〜約819.2uM、約819.2uM〜約1638.4uM、又は約1638.4uM〜約3276.8uMの濃度で存在してよい。ある好ましい実施形態では、除かれないヌクレオチドの濃度は、各々、約50uM〜約500uMである。ある好ましい実施形態では、存在するヌクレオチドは、等モル濃度の量で存在する。
【0041】
ある実施形態では、限定的な濃度で存在する少なくとも1つのヌクレオチドは、存在するその他のヌクレオチドのうちの少なくとも1つと比べて、2分の1以下、5分の1以下、10分の1以下、20分の1以下、30分の1以下、60分の1以下、100分の1以下、500分の1以下、1000分の1以下、又は3000分の1以下の濃度である。ある実施形態では、限定的な濃度で存在する少なくとも1つのヌクレオチドは、存在するヌクレオチドと比較して無視できる濃度である。ある好ましい実施形態では、限定的な濃度で存在する少なくとも1つのヌクレオチドは、存在するヌクレオチドと比べて100分の1以下の濃度である。
【0042】
ある実施形態では、フラップ含有DNAの修復方法が提供される。ある実施形態では、DNA特性解析の前に、少なくとも1つのヌクレオチドが取り除かれる。例えば、ある実施形態では、この方法は、少なくとも1つのヌクレオチドが含まれない条件下にて、DNAのいずれかの鎖上に少なくとも1つのフラップを含有する二本鎖DNAを、ポリメラーゼの5’→3’エキソヌクレアーゼ活性で処理すること、ニックをライゲーションしてフラップ領域のところでの鎖の一体性を回復すること、及びDNAを特性解析することを伴う。ある実施形態では、DNA特性解析の前に、少なくとも1つのヌクレオチドの濃度が限定されている。例えば、ある実施形態では、この方法は、少なくとも1つのヌクレオチドの濃度が限定された条件下にて、DNAのいずれかの鎖上に少なくとも1つのフラップを含む二本鎖DNAを、ポリメラーゼの5’→3’エキソヌクレアーゼ活性で処理すること、ニックをライゲーションしてフラップ領域のところで鎖の一体性を回復すること、及びDNAを特性解析することを伴う。
【0043】
本明細書で述べる分子を特性解析する方法としては、シーケンシング、マッピング、一塩基多型(SNP)解析、コピー数多型(CNV)解析、ハプロタイピング、又はエピジェネティック解析など、DNAの情報内容を特定するためのどのような方法でもよい。
【0044】
特に断りのない限り、本明細書で用いられる技術的及び科学的用語は、当業者によって一般的に理解されるものと同じ意味を有する。
【0045】
本明細書で述べるDNAは、いかなる長さであってもよい(例えば、0.1Kbからメガ塩基)。DNAは、高純度調製物でもよく、粗物質、又は半粗物質であってよい。DNAは、いかなる生物学的出所に由来してもよく、又は合成物であってもよい。
【0046】
ある実施形態では、同じ生物学的出所に由来する2つ以上のDNAが解析される。ある実施形態では、同じ生物学的出所に由来する2、3、4、5、6、7、8、9、10、又はそれ以上の数のDNAが解析される。ある実施形態では、宿主生物のゲノムDNAを例とする、生物学的出所に由来する単一のサンプルからの2つ以上のDNAが解析される。所望に応じて、ある出所に由来するDNAは解析前に増幅されてよい。ある実施形態では、それらのDNAは同時に(並行して)解析される。例えば、ある出所に由来するDNAの第一のアリコートを第一の方法で標識して第一のパターンを作製し、同じ出所に由来するDNAの第二のアリコートを第二の方法で標識して第二のパターンを作製してよい。ある実施形態では、同じサンプルから少なくとも2つのアリコート、例えば、2、3、4、5、6、7、8、9、10、又はそれ以上の数のアリコートが解析される。ある実施形態では、解析は、解析される複数のDNAが互いに流体として接触しない状態で行われる(例えば、各DNAが別々のアリコートに存在してよい)。ある実施形態では、第一のパターン及び第二のパターンのうちの一方又は両方が、1つ以上の参照配列と比較される。ある実施形態では、第一のパターンと第二のパターンが互いに比較される。
【0047】
ある実施形態では、2つの異なる生物学的出所に由来するDNAが解析される。ある実施形態では、異なる生物に由来するDNAが解析され、所望に応じて比較される。例えば、同じ種の2つの生物が互いに比較されてよく、又は関連する種の2つの生物が互いに比較されてよい。ある実施形態では、同じ生物に由来する異なるDNAが解析される。例えば、第一の種類の組織又は細胞に由来するDNAが、第二の種類の組織又は細胞に由来するDNAと比較されてよい。例えば、第一のタイムポイント又は発達段階で収集されたDNAが、第二のタイムポイント又は発達段階で収集されたDNAと比較されてよい。
【0048】
本明細書で用いられる場合、「ポリメラーゼ」の用語は、未修飾及び修飾ヌクレオチドを、テンプレートに依存する形で、3’ヒドロキシル末端から開始して組み込む能力を有する天然又は操作されたいずれの酵素をも意味する。
【0049】
本明細書で用いられる場合、「ニッキングエンドヌクレアーゼ」の用語は、DNA一本鎖上のホスホジエステル結合を切断して所定の配列に3’‐ヒドロキシルを残す能力を有する天然又は操作されたいずれの酵素をも意味する。ニッキングエンドヌクレアーゼは、制限酵素を修飾してDNAの1つの鎖の切断活性を失わせることによって操作されてもよく、ジンクフィンガーや転写活性化因子様エフェクターのDNA認識ドメインなどのDNA結合ドメインにニッキングサブユニットを融合することによって作製されてもよい。
【0050】
追加の別の選択肢としての実施形態
脆弱部位の影響を軽減し、ゲノムマッピングのための情報密度を向上させる方法を含むサンプル調製方法、及び単分子解析を行う方法が本明細書にて提供される。
【0051】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:第一のDNAに第一の配列モチーフのところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第一のDNA上のニックを第一の標識で標識すること;第一のDNA上のニックを第一の標識で標識すること;第一のDNA上のニックを修復すること;修復された第一のDNAを第二の標識でマーキングすることであって、第二の標識は配列非特異的であり、第二の標識は第一の標識とは異なる、マーキングすること;第一及び第二の標識で標識した後に、第一のDNAを線状化すること;及び線状化された第一のDNA上の第一の標識のパターンを検出すること、を含む。
【0052】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:第一のDNAに第一の配列モチーフのところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第一のDNA上のニックを第一の標識で標識すること;第一の標識で標識した後に、第一のDNA上のニックを修復すること;修復された第一のDNAに第二の配列モチーフのところでニックを入れることであって、修復された第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第一のDNA上の第二の配列モチーフにおけるニックを第二の標識で標識すること;第二の標識で標識した後に、第一のDNA上のニックを修復すること;第一のDNAを第三の標識でマーキングすることであって、第三の標識は配列非特異的であり、第三の標識は第一及び第二の標識とは異なる、マーキングすること;第三の標識で標識した後に、第一のDNAを線状化すること;線状化された第一のDNA上の第一及び第二の標識のうちの少なくとも1つのパターンを検出すること、を含む。
【0053】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:第一のニッキングエンドヌクレアーゼにより、第一のDNAの1つの鎖に認識配列のところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第一のDNAをニッキング部位のところで第一の標識で標識すること;第一のDNA上のニックを修復すること;第二のニッキングエンドヌクレアーゼにより、第二のDNAの相補鎖に認識配列のところでニックを入れることであって、第二のDNAは二本鎖であり、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第二のDNAをニッキング部位のところで第二の標識で標識すること;及び第二のDNA上のニックを修復すること、を含む。
【0054】
ある実施形態では、本明細書で述べる方法はさらに:第一のニッキングエンドヌクレアーゼにより第二のDNAの1つの鎖に認識配列のところでニックを入れることであって、第二のDNAは二本鎖であり、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックをいれること;第二のDNAをニッキング部位のところで標識すること;第二のDNA上のニックを修復すること;第二のニッキングエンドヌクレアーゼにより第二のDNAの相補鎖に認識配列のところでニックを入れること;第二のDNAをニッキング部位のところで標識すること;第二のDNA上のニックを修復すること;及び修復された第一及び第二のDNAを、第三の標識でマーキングすることであって、第三の標識は配列非特異的標識である、マーキングすること、を含む。
【0055】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:第一のDNAに第一の配列モチーフのところでニックを入れることであって、第一のDNAは二本鎖であり、第一のDNAはニックの隣接部でも二本鎖を維持している、ニックを入れること;第一のDNA上のニックを第一の標識で標識すること;第一のDNA上のニックを修復すること;第一のDNAに第二の配列モチーフのところで第二の標識でタグを付けることであって、第二の標識はDNAを切断しない、タグをつけること;第一のDNAを第三の標識でマーキングすることであって、第三の標識は配列非特異的標識であり、第三の標識は第一及び第二の標識とは異なる、マーキングすること;第一、第二、及び三の標識で標識した後に、第一のDNAを線状化すること;及び線状化された第一のDNA上の第一及び第二の標識を検出すること、を含む。
【0056】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:DNAのいずれかの鎖に少なくとも1つのフラップを含む二本鎖DNAを、少なくとも1種のdNTPが、存在する他のdNTPよりも限定された濃度で存在する条件下にて、ポリメラーゼの5’→3’エキソヌクレアーゼ活性によって処理すること;ニックをライゲーションしてフラップ領域のところでの鎖の一体性を回復すること;及びDNAを特性解析すること、を含む。
【0057】
ある実施形態では、DNAを特性解析する方法が提供され、その方法は:DNAのいずれかの鎖に少なくとも1つのフラップを含む二本鎖DNAを、少なくとも1種のdNTPが含まれない条件下にて、ポリメラーゼの5’→3’エキソヌクレアーゼ活性によって処理すること;ニックをライゲーションしてフラップ領域のところでの鎖の一体性を回復すること;及びDNAを特性解析すること、を含む。
【0058】
ある実施形態では、本明細書で述べる方法は、さらに:第二のDNAに第一の配列モチーフのところでニックを入れること;第二のDNA上のニックを第一の標識で標識すること;第二のDNA上のニックを修復すること;修復された第二のDNAを第二の標識でマーキングすること;第一及び第二の標識で標識した後、第二のDNAを線状化すること;及び線状化された第二のDNA上の第一又は第二の標識のパターンを検出すること、を含む。
【0059】
ある実施形態では、本明細書で述べる方法は、さらに:第二のDNAに第一の配列モチーフのところでニックを入れることであって、第二のDNAは二本鎖であり、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックをいれること;第二のDNA上のニックを第一の標識で標識すること;第一の標識で標識した後、第二のDNA上のニックを修復すること;修復された第二のDNAに第二の配列モチーフのところでニックを入れることであって、修復された第二のDNAはニックの隣接部でも二本鎖を維持している、ニックをいれること;第二のDNA上の第二の配列モチーフにおけるニックを、第二の標識で標識すること;第二の標識で標識した後、第二のDNA上のニックを修復すること;第二のDNAを第三の標識でマーキングすること;第三の標識で標識した後に、第二のDNAを線状化すること;及び線状化された第二のDNA上の第一及び第二の標識のうちの少なくとも1つのパターンを検出すること、を含む。
【0060】
ある実施形態では、本明細書で述べる方法は、さらに:第一のDNA上の第一の標識のパターンを、第二のDNA上の第一の標識のパターンと比較することを含む。ある実施形態では、本明細書で述べる方法は、さらに:標識された配列モチーフのオーバーラップを用いて複数の第一のDNAをアセンブルし、第一のDNAマップを構築すること;標識された配列モチーフのオーバーラップを用いて複数の第二のDNAをアセンブルし、第二のDNAマップを構築すること;及び第一のDNAマップを第二のDNAマップと比較すること、を含む。
【0061】
ある実施形態では、本明細書で述べる方法は、さらに、修復された第一及び第二のDNAを第三の標識でマーキングすることであって、第三の標識は配列非特異的標識である、マーキングすること、を含む。ある実施形態では、本明細書で述べる方法は、さらに:第一及び第二のDNAを線状化すること;線状化されたDNA上の第一及び第二の標識を検出すること;及び標識された配列モチーフのオーバーラップを用いて標識されたDNA分子をアセンブルし、DNAマップを構築すること、を含む。ある実施形態では、第一及び第二の標識は同じ標識である。ある実施形態では、第一及び第二の標識は異なる標識を含む。
【0062】
ある実施形態では、本明細書で述べる方法は、さらに:第二のDNAに第一の配列モチーフのところでニックを入れることであって、第二のDNAは二本鎖であり、第二のDNAはニックの隣接部でも二本鎖を維持している、ニックをいれること;第二のDNA上のニックを第一の標識で標識すること;第二のDNA上のニックを修復すること;第二のDNAに第二のモチーフのところで第二の標識でタグを付けること;第二のDNAを第三の標識でマーキングすること;第一及び第二の標識で標識した後に、第二のDNAを線状化すること;及び線状化された第二のDNA上の第一及び第二の標識を検出すること、を含む。
【0063】
ある実施形態では、線状化は、DNAをナノチャネル中へ輸送することを含む。ある実施形態では、本明細書で述べる方法は、さらに、第一のDNA上の第一又は第二の標識のうちの少なくとも1つのパターンを、参照DNA上の標識のパターンと比較することを含む。ある実施形態では、本明細書で述べる方法は、さらに、第一のDNA上の第一の標識のパターンを、参照DNA上の標識のパターンと比較することを含む。ある実施形態では、本明細書で述べる方法は、さらに、第一のDNA上の第二の標識のパターンを、参照DNA上の標識のパターンと比較することであって、第二の標識は配列特異的標識である、比較することを含む。ある実施形態では、本明細書で述べる方法は、さらに、標識された第一のDNAを、標識されたモチーフのパターンを用いてアセンブルし、第一のDNAマップを構築することを含む。ある実施形態では、本明細書で述べる方法は、さらに、標識された第二のDNAを、標識されたモチーフのパターンを用いてアセンブルし、第一のDNAマップを構築することを含む。ある実施形態では、第二の標識は配列非特異的標識である。ある実施形態では、第二の配列モチーフは、非切断制限酵素、ジンクフィンガータンパク質、抗体、転写因子、転写活性化因子様ドメイン、DNA結合タンパク質、ポリアミド、三重らせん形成オリゴヌクレオチド、及びペプチド核酸からなる群より選択されるDNA結合要素のための少なくとも1つの結合部位を含み、タグ付けは第二の標識を含む結合要素で行われ、第二の標識は、フルオロフォア、量子ドット、デンドリマー、ナノワイヤ、ビーズ、ハプテン、ストレプトアビジン、アビジン、ニュートラアビジン、ビオチン、及び安定化された反応性基からなる群より選択される。ある実施形態では、第二の配列モチーフはペプチド核酸の結合部位を少なくとも1つ含み、タグ付けは第二の標識を含むペプチド核酸によって行われ、第二の標識はフルオロフォア又は量子ドットである。ある実施形態では、第二の配列モチーフはメチルトランスフェラーゼの結合部位を少なくとも1つ含み、タグ付けは第二の標識を有する修飾された補助因子を含むメチルトランスフェラーゼで行われる。ある実施形態では、第一及び第二の標識は、独立して、フルオロフォア、量子ドット、デンドリマー、ナノワイヤ、ビーズ、ハプテン、ストレプトアビジン、アビジン、ニュートラアビジン、ビオチン、反応性基、及び非光学的標識からなる群より選択される。ある実施形態では、第一及び第二の標識は、独立して、フルオロフォア又は量子ドットからなる群より選択される。ある実施形態では、標識付与は、ポリメラーゼで行われる。ある実施形態では、標識付与は、標識を含むdNTPの存在下にて、ポリメラーゼで行われる。ある実施形態では、ポリメラーゼは、5’→3’エキソヌクレアーゼ活性を有する。ある実施形態では、ポリメラーゼはフラップ領域を残し、フラップ領域はリガーゼでの修復に先立って除去されて、ライゲーション可能なニックが回復される。ある実施形態では、フラップ領域は、少なくとも1つのヌクレオチドが限定的な濃度で存在する条件下で、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある実施形態では、フラップ領域は、少なくとも1つのヌクレオチドが反応系に含まれない条件下で、ポリメラーゼの5’→3’エキソヌクレアーゼ活性を用いて除去される。ある実施形態では、フラップ領域は、フラップエンドヌクレアーゼで除去される。ある実施形態では、標識付与は、少なくとも1種のdNTPの存在下にて、ポリメラーゼで行われる。ある実施形態では、少なくとも1種のdNTPは、単一種のdNTPである。ある実施形態では、ポリメラーゼの活性は、温度、dNTP濃度、補助因子濃度、バッファー濃度、又はこれらの任意の組み合わせを標識付与の過程で調節することによって調整される。
【実施例】
【0064】
以下の実施例は、本発明を説明することを意図するものであり、明示的にも暗示的にも、本発明をいかなる方法、形状、又は形態でも限定することを意図するものではない。これらは用いることができる典型的なものであるが、当業者に公知の他の手順、方法、又は技術を代わりに用いてもよい。
【0065】
実施例1
E.coliゲノムDNAに、Nt.BspQIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、非放射性dATP、dGTP、及びdCTPの存在下、Atto dUTP又はAlexa dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識したニックは、1)修復なし、2)製造元(ニューイングランド バイオラボ)の推奨に従うPreCRによる修復、3)dGTPを含まない条件下でのPreCRによる修復、4)dATP及びdGTPを含まない条件下でのPreCRによる修復、又は5)dGTPを含まない条件下でのTaqポリメラーゼによる修復を行った。続いて、リガーゼによるライゲーションを行った。得られたDNAを、YOYO‐1(ライフテクノロジーズ(Life Technologies))で染色し、Irysシステム(バイオナノゲノミクス(BioNano Genomics))で処理した。簡潔に述べると、DNAを、超並列ナノチャネル中で線状化し、バックボーン及び標識検出のために適切なレーザーで励起し、光学的にイメージングした。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を図2に示す。
【0066】
実施例2
E.coliゲノムDNAに、Nt.BspQIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、Atto dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識したDNAは、1)修復なし、又は2)フラップ除去のためのFEN I処理に引き続き、移動したニックの修復のためのリガーゼ処理を行った。DNAを、超並列ナノチャネル中で線状化し、バックボーン及び標識検出のために適切なレーザーで励起し、光学的にイメージングした。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を図3に示す。
【0067】
実施例3
ショウジョウバエゲノムDNAに、Nt.BspQI又はNb.BbVCIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、Atto dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識されたDNAを、PreCR試薬(ニューイングランド バイオラボ)で処理して、ニックを修復した。得られたDNAを、YOYO‐1(ライフテクノロジーズ)で染色し、Irysシステム(バイオナノゲノミクス)で処理した。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を図4に示す。
【0068】
実施例4
そのニックモチーフをそれぞれ赤色及び緑色染料で標識した2つのニッキング酵素Nb.BbvCI及びNt.BspQIを用いて、タルホコムギ(Ae. tauschii)ゲノムのプロラミン多重遺伝子族を含む2.1Mb領域のMTPを作り上げる27のBACにわたって、ゲノムマップを構築した。図5Aは、IrysChip(バイオナノゲノミクス)のレイアウトを示す。
【0069】
YOYO染色DNAをポートにロードし、ピラー構造内で巻き戻し、45nmのナノチャネル中で線状化した(図5B)。画像処理の後、配列特異的位置に分布する赤色及び緑色標識を持つ個々のBAC分子を比較し、類似するマップパターンでプールにクラスター化した(図5C、上図)。図5Cには、緑色標識付与の位置をひし形印(◆)で、赤色標識付与の位置を星印(*)で示している。BACクローンに対する密度プロットを作成して、コンセンサスピーク位置を特定した(図5C、下図)。個々のBACクローンのコンセンサスマップを、隣接するBACのコンセンサスマップのオーバーラップに基づいて整列させて(図5D)、全領域のゲノムマップを作り出した。図5Dでは、線グラフ下部に表示される印によってピーク色をまとめて示しており、赤色ピークは上の欄の印で示され、緑色ピークは下の欄の印で示される。コンセンサスマップのオーバーラップに基づくゲノム領域のマップの例を図5Eに示す。
【0070】
この二色標識法により、4.8kbあたりに1つの標識という平均情報密度が得られた(2.1Mbに437の標識)。各モチーフが独自の色でマーキングされたことにより、ピークがほとんどオーバーラップしている場合であっても、異なるモチーフのピークを互いに区別することが可能であった(図5Dの矢印)。同じモチーフのピーク(すなわち、同じ色)は、それらが少なくとも約1.5kb離れている場合に分離可能であった。長い分子長(平均で約140kb)、高解像度、正確な長さ測定、及び複数の配列モチーフを利用することにより、スキャフォールドアセンブリのための2.1Mb領域の高品質ゲノムマップを作成することができた。
【0071】
参考文献
1. Blakesley R, Hansen N, Gupta J, McDowell J, Maskeri B, et al. (2010) Effort required to finish shotgun-generated genome sequences differs significantly among vertebrates. BMC Genomics 11: 21.
【0072】
2. Chain PSG, Grafham DV, Fulton RS, FitzGerald MG, Hostetler J, et al. (2009) Genome Project Standards in a New Era of Sequencing. Science 326: 236-237.
【0073】
3. Lee H, Tang H (2012) Next-generation sequencing technologies and fragment assembly algorithms. Methods Mol Biol 855: 155-174.
【0074】
4. Green ED (2001) Strategies for the systematic sequencing of complex genomes. Nat Rev Genet 2: 573-583.
【0075】
5. McPherson TIHGMCJD (2001) A physical map of the human genome. Nature 409: 934-941.
【0076】
6. Smith DB, Flavell RB (1975) Characterisation of the wheat genome by renaturation kinetics. Chromosoma 50: 223-242.
【0077】
7. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, et al. (2001) The Sequence of the Human Genome. Science 291: 1304-1351.
【0078】
8. Zuccolo A, Sebastian A, Talag J, Yu Y, Kim H, et al. (2007) Transposable element distribution, abundance and role in genome size variation in the genus Oryza. BMC Evolutionary Biology 7: 152.
【0079】
9. Initiative TAG (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408: 796-815.
【0080】
10. Project IRGS (2005) The map-based sequence of the rice genome. Nature 436: 793-800.
【0081】
11. Zhou S, Wei F, Nguyen J, Bechner M, Potamousis K, et al. (2009) A single molecule scaffold for the maize genome. PLoS Genet 5: e1000711.
【0082】
12. Schnable PS, Ware D, Fulton RS, Stein JC, Wei F, et al. (2009) The B73 maize genome: complexity, diversity, and dynamics. Science 326: 1112-1115.
【0083】
13. Luo MC, Thomas C, You FM, Hsiao J, Ouyang S, et al. (2003) High-throughput fingerprinting of bacterial artificial chromosomes using the snapshot labeling kit and sizing of restriction fragments by capillary electrophoresis. Genomics 82: 378-389.
【0084】
14. Paux E, Sourdille P, Salse Jrm, Saintenac C, Choulet Fdr, et al. (2008) A Physical Map of the 1-Gigabase Bread Wheat Chromosome 3B. Science 322: 101-104.
【0085】
15. Philippe R, Choulet F, Paux E, van Oeveren J, Tang J, et al. (2012) Whole Genome Profiling provides a robust framework for physical mapping and sequencing in the highly complex and repetitive wheat genome. BMC Genomics 13: 47.
【0086】
16. van Oeveren J, de Ruiter M, Jesse T, van der Poel H, Tang J, et al. (2011) Sequence-based physical mapping of complex genomes by whole genome profiling. Genome Research 21(4): 618-625.
【0087】
17. Schwartz DC, Li X, Hernandez LI, Ramnarain SP, Huff EJ, et al. (1993) Ordered restriction maps of Saccharomyces cerevisiae chromosomes constructed by optical mapping. Science 262: 110-114.
【0088】
18. Teague B, Waterman MS, Goldstein S, Potamousis K, Zhou S, et al. (2010) High-resolution human genome structure by single-molecule analysis. Proc Natl Acad Sci U S A 107: 10848-10853.
【0089】
19. Lam ET, Hastie A, Lin C, Ehrlich D, Das SK, et al. (2012) Genome mapping on nanochannel arrays for structural variation analysis and sequence assembly. Nat Biotechnol 30: 771-776.
【0090】
20. Mun JH, Kwon SJ, Yang TJ, Kim HS, Choi BS, et al. (2008) The first generation of a BAC-based physical map of Brassica rapa. BMC Genomics 9: 280.
【0091】
21. Zhou S, Bechner MC, Place M, Churas CP, Pape L, et al. (2007) Validation of rice genome sequence by optical mapping. BMC Genomics 8: 278.
【0092】
22. Nagarajan N, Read TD, Pop M (2008) Scaffolding and validation of bacterial genome assemblies using optical restriction maps. Bioinformatics 24: 1229-1235.
【0093】
23. Howden BP, Seemann T, Harrison PF, McEvoy CR, Stanton JA, et al. (2010) Complete genome sequence of Staphylococcus aureus strain JKD6008, an ST239 clone of methicillin-resistant Staphylococcus aureus with intermediate-level vancomycin resistance. J Bacteriol 192: 5848-5849.
【0094】
24. Riley MC, Lee JE, Lesho E, Kirkup BC, Jr. (2011) Optically mapping multiple bacterial genomes simultaneously in a single run. PLoS One 6: e27085.
【0095】
25. Lin HC, Goldstein S, Mendelowitz L, Zhou S, Wetzel J, et al. (2012) AGORA: Assembly Guided by Optical Restriction Alignment. BMC Bioinformatics 13: 189.
【0096】
26. Xiao M, Phong A, Ha C, Chan T-F, Cai D, et al. (2007) Rapid DNA mapping by fluorescent single molecule detection. Nucleic Acids Research 35: e16.
【0097】
27. Das SK, Austin MD, Akana MC, Deshpande P, Cao H, et al. (2010) Single molecule linear analysis of DNA in nano-channel labeled with sequence specific fluorescent probes. Nucleic Acids Research 38: e177.
【0098】
28. Dvorak J (2009) Triticeae Genome Structure and Evolution. Genetics and Genomics of the Triticeae Springer Science.
【0099】
29. Li W, Zhang P, Fellers JP, Friebe B, Gill BS (2004) Sequence composition, organization, and evolution of the core Triticeae genome. Plant J 40: 500-511.
【0100】
30. Cassidy BG, Dvorak J (1991) Molecular Characterization of a Low-Molecular-Weight Glutenin Cdna Clone from Triticum-Durum. Theoretical and Applied Genetics 81: 653-660.
【0101】
31. Hernandez P, Martis M, Dorado G, Pfeifer M, Galvez S, et al. (2012) Next-generation sequencing and syntenic integration of flow-sorted arms of wheat chromosome 4A exposes the chromosome structure and gene content. Plant J 69: 377-386.
【0102】
32. Leroy P, Guilhot N, Sakai H, Bernard A, Choulet F, et al. (2012) TriAnnot: A Versatile and High Performance Pipeline for the Automated Annotation of Plant Genomes. Front Plant Sci 3: 5.
【0103】
33. Brenchley R, Spannagl M, Pfeifer M, Barker GL, D'Amore R, et al. (2012) Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature 491: 705-710.
【0104】
34. Li Y, Zheng H, Luo R, Wu H, Zhu H, et al. (2011) Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly. Nat Biotechnol 29: 723-730.
【0105】
35. Soderlund C, Longden I, Mott R (1997) FPC: a system for building contigs from restriction fingerprinted clones. Comput Appl Biosci 13: 523-535.
【0106】
36. Warren RL, Varabei D, Platt D, Huang X, Messina D, et al. (2006) Physical map-assisted whole-genome shotgun sequence assemblies. Genome Res 16: 768-775.
【0107】
様々な態様及び実施形態を本明細書で開示してきたが、その他の態様及び実施形態も当業者に明らかであろう。本明細書で開示する様々な態様及び実施形態は、説明を目的とするものであり、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。当業者であれば、本明細書で開示するこの及びその他のプロセス並びに方法において、そのプロセス及び方法で実行される機能が、異なる順序で実施されてよいことは理解されるであろう。さらに、概略的に述べた工程及び操作は、単に例として提供されるものであり、その工程及び操作の一部は、開示される実施形態の本質から逸脱することなく、所望に応じて行われてよく、より少ない工程及び操作へと組み合わされてよく、又はさらなる工程及び操作へと拡張されてもよい。
【0108】
様々な態様及び実施形態を本明細書で開示してきたが、その他の態様及び実施形態も当業者に明らかであろう。本明細書で開示する様々な態様及び実施形態は、説明を目的とするものであり、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。
【0109】
本明細書における実質的にいずれの複数及び/又は単数の用語の使用に関しても、当業者であれば、文脈及び/又は適用に対して適するように、複数から単数へ、及び/又は単数から複数へと変換することができる。様々な単数/複数の入れ替えは、本明細書にて、明確性のために示される場合がある。
【0110】
当業者であれば、一般的に、本明細書にて、特に添付の請求項(例:添付の請求項の本体)にて用いられる用語は、一般的に、オープンな用語(例:「含んでいる」の用語は、「含んでいるがそれに限定されない」として解釈されるべきであり、「持っている」の用語は、「少なくとも持っている」として解釈されるべきであり、「含む」の用語は、「含むがそれに限定されない」として解釈されるべきである、など)として意図される。当業者であればさらに、導入される請求項記載の具体的な数が意図される場合、そのような意図は請求項において明白に記載されることになり、そのような記載が存在しない場合、そのような意図は存在しないことは理解される。例えば、理解を補助するために、以下に添付する請求項は、請求項記載の導入のために「少なくとも1つの」及び「1つ以上の」の導入語句の使用を含む場合がある。しかし、そのような語句の使用は、同じ請求項が「1つ以上の」又は「少なくとも1つの」の導入語句及び「1つの(a)」又は「1つの(an)」などの不定冠詞を含む場合であっても、不定冠詞「1つの(a)」又は「1つの(an)」による請求項記載の導入が、そのような導入された請求項記載を含むいずれの特定の請求項も、そのような記載を1つだけ含む実施形態に限定することを示唆するものとして解釈されるべきではなく(例:「1つの(a)」及び/又は「1つの(an)」は、「少なくとも1つの」又は「1つ以上の」を意味するものと解釈されるべきである);同じことが、請求項記載の導入に定冠詞が用いられる場合にもあてはまる。加えて、導入される請求項記載の具体的な数が明白に記載される場合であっても、当業者であれば、そのような記載が、少なくともその記載された数を意味するものと解釈されるべきであることは理解されるであろう(例:その他の修飾語を伴わない単なる「2つの記載」の記載は、少なくとも2つの記載、又は2つ以上の記載を意味する)。さらに、「A、B、及びCなどのうちの少なくとも1つ」に類似する表現が用いられる例において、一般的に、そのような構造は、当業者がその表現を理解するであろう意味を意図している(例えば、「A、B、及びCのうちの少なくとも1つを持つシステム」は、これらに限定されないが、Aを単独で、Bを単独で、Cを単独で、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又はA、B、及びCを一緒に持つシステムを含むであろう)。「A、B、又はCなどのうちの少なくとも1つ」に類似する表現が用いられる例において、一般的に、そのような構造は、当業者がその表現を理解するであろう意味を意図している(例えば、「A、B、又はCのうちの少なくとも1つを持つシステム」は、これらに限定されないが、Aを単独で、Bを単独で、Cを単独で、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又はA、B、及びCを一緒に持つシステムを含むであろう)。さらに、当業者であれば、2つ以上の別の選択的な用語を提示する実質的にいかなる離接語及び/又は語句も、それが明細書、請求項、又は図面中であるかに関わらず、それらの用語のうちの1つ、それらの用語のうちのいずれか、又はそれらの用語の両方を含む可能性を考慮するものとして理解されるべきであることは理解されるであろう。例えば、「A又はB」の語句は、「A」、又は「B」、又は「A及びB」の可能性を含むものとして理解されるであろう。
【0111】
加えて、開示事項の特徴又は態様がマーカッシュグループとして記載される場合、当業者であれば、その開示事項は、それによって、そのマーカッシュグループのいかなる個々のメンバー又はメンバーのサブグループとしても表現されていることは理解されるであろう。
【0112】
当業者であれば理解されるように、説明的記載の提供などあらゆる目的のために、本明細書で開示されるすべての範囲は、考え得るあらゆる下位範囲及びその下位範囲の組み合わせも包含する。列挙されたいずれの範囲も、同じ範囲が少なくとも等しい半分、3分の1、4分の1、5分の1、10分の1などに分解されることを充分に記載し、それを可能とするものとして容易に認識することができる。限定されない例として、本明細書で考察される各範囲は、下側の3分の1、中間の3分の1、及び上側の3分の1などに容易に分解することができる。当業者であればさらに理解されるように、「まで」、「少なくとも」などのすべての言語は、記載された数を含み、上記で考察したように、続いて下位範囲に分解することができる範囲を意味する。最後に、当業者であれば理解されるように、範囲は、各個々の数を含む。従って、例えば、1〜3つの細胞を有する群は、1、2、又は3つの細胞を有する群を意味する。同様に、1〜5つの細胞を有する群は、1、2、3、4、又は5つの細胞を有する群を意味する、などである。
【0113】
上記内容から、本開示事項の種々の実施形態は、説明の目的で本明細書にて記載されたこと、及び本開示事項の範囲及び趣旨から逸脱することなく、種々の改変を行ってよいことは理解されるであろう。従って、本明細書で開示される種々の実施形態は、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。
図1
図2
図3
図4
図5A
図5B
図5C
図5D
図5E