【実施例】
【0064】
以下の実施例は、本発明を説明することを意図するものであり、明示的にも暗示的にも、本発明をいかなる方法、形状、又は形態でも限定することを意図するものではない。これらは用いることができる典型的なものであるが、当業者に公知の他の手順、方法、又は技術を代わりに用いてもよい。
【0065】
実施例1
E.coliゲノムDNAに、Nt.BspQIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、非放射性dATP、dGTP、及びdCTPの存在下、Atto dUTP又はAlexa dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識したニックは、1)修復なし、2)製造元(ニューイングランド バイオラボ)の推奨に従うPreCRによる修復、3)dGTPを含まない条件下でのPreCRによる修復、4)dATP及びdGTPを含まない条件下でのPreCRによる修復、又は5)dGTPを含まない条件下でのTaqポリメラーゼによる修復を行った。続いて、リガーゼによるライゲーションを行った。得られたDNAを、YOYO‐1(ライフテクノロジーズ(Life Technologies))で染色し、Irysシステム(バイオナノゲノミクス(BioNano Genomics))で処理した。簡潔に述べると、DNAを、超並列ナノチャネル中で線状化し、バックボーン及び標識検出のために適切なレーザーで励起し、光学的にイメージングした。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を
図2に示す。
【0066】
実施例2
E.coliゲノムDNAに、Nt.BspQIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、Atto dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識したDNAは、1)修復なし、又は2)フラップ除去のためのFEN I処理に引き続き、移動したニックの修復のためのリガーゼ処理を行った。DNAを、超並列ナノチャネル中で線状化し、バックボーン及び標識検出のために適切なレーザーで励起し、光学的にイメージングした。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を
図3に示す。
【0067】
実施例3
ショウジョウバエゲノムDNAに、Nt.BspQI又はNb.BbVCIニッキングエンドヌクレアーゼでニックを入れた。ニックを入れたDNAを、Atto dUTPを用いたニックトランスレーションにより、Taqポリメラーゼを用いて標識した。標識されたDNAを、PreCR試薬(ニューイングランド バイオラボ)で処理して、ニックを修復した。得られたDNAを、YOYO‐1(ライフテクノロジーズ)で染色し、Irysシステム(バイオナノゲノミクス)で処理した。参照ゲノムに対するマッピング、質量中心、並びに偽陽性(FP)及び偽陰性(FN)の算出を、nanoStudioデータ解析ソフトウェア(バイオナノゲノミクス)を用いて行った。結果を
図4に示す。
【0068】
実施例4
そのニックモチーフをそれぞれ赤色及び緑色染料で標識した2つのニッキング酵素Nb.BbvCI及びNt.BspQIを用いて、タルホコムギ(Ae. tauschii)ゲノムのプロラミン多重遺伝子族を含む2.1Mb領域のMTPを作り上げる27のBACにわたって、ゲノムマップを構築した。
図5Aは、IrysChip(バイオナノゲノミクス)のレイアウトを示す。
【0069】
YOYO染色DNAをポートにロードし、ピラー構造内で巻き戻し、45nmのナノチャネル中で線状化した(
図5B)。画像処理の後、配列特異的位置に分布する赤色及び緑色標識を持つ個々のBAC分子を比較し、類似するマップパターンでプールにクラスター化した(
図5C、上図)。
図5Cには、緑色標識付与の位置をひし形印(◆)で、赤色標識付与の位置を星印(*)で示している。BACクローンに対する密度プロットを作成して、コンセンサスピーク位置を特定した(
図5C、下図)。個々のBACクローンのコンセンサスマップを、隣接するBACのコンセンサスマップのオーバーラップに基づいて整列させて(
図5D)、全領域のゲノムマップを作り出した。
図5Dでは、線グラフ下部に表示される印によってピーク色をまとめて示しており、赤色ピークは上の欄の印で示され、緑色ピークは下の欄の印で示される。コンセンサスマップのオーバーラップに基づくゲノム領域のマップの例を
図5Eに示す。
【0070】
この二色標識法により、4.8kbあたりに1つの標識という平均情報密度が得られた(2.1Mbに437の標識)。各モチーフが独自の色でマーキングされたことにより、ピークがほとんどオーバーラップしている場合であっても、異なるモチーフのピークを互いに区別することが可能であった(
図5Dの矢印)。同じモチーフのピーク(すなわち、同じ色)は、それらが少なくとも約1.5kb離れている場合に分離可能であった。長い分子長(平均で約140kb)、高解像度、正確な長さ測定、及び複数の配列モチーフを利用することにより、スキャフォールドアセンブリのための2.1Mb領域の高品質ゲノムマップを作成することができた。
【0071】
参考文献
1. Blakesley R, Hansen N, Gupta J, McDowell J, Maskeri B, et al. (2010) Effort required to finish shotgun-generated genome sequences differs significantly among vertebrates. BMC Genomics 11: 21.
【0072】
2. Chain PSG, Grafham DV, Fulton RS, FitzGerald MG, Hostetler J, et al. (2009) Genome Project Standards in a New Era of Sequencing. Science 326: 236-237.
【0073】
3. Lee H, Tang H (2012) Next-generation sequencing technologies and fragment assembly algorithms. Methods Mol Biol 855: 155-174.
【0074】
4. Green ED (2001) Strategies for the systematic sequencing of complex genomes. Nat Rev Genet 2: 573-583.
【0075】
5. McPherson TIHGMCJD (2001) A physical map of the human genome. Nature 409: 934-941.
【0076】
6. Smith DB, Flavell RB (1975) Characterisation of the wheat genome by renaturation kinetics. Chromosoma 50: 223-242.
【0077】
7. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, et al. (2001) The Sequence of the Human Genome. Science 291: 1304-1351.
【0078】
8. Zuccolo A, Sebastian A, Talag J, Yu Y, Kim H, et al. (2007) Transposable element distribution, abundance and role in genome size variation in the genus Oryza. BMC Evolutionary Biology 7: 152.
【0079】
9. Initiative TAG (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408: 796-815.
【0080】
10. Project IRGS (2005) The map-based sequence of the rice genome. Nature 436: 793-800.
【0081】
11. Zhou S, Wei F, Nguyen J, Bechner M, Potamousis K, et al. (2009) A single molecule scaffold for the maize genome. PLoS Genet 5: e1000711.
【0082】
12. Schnable PS, Ware D, Fulton RS, Stein JC, Wei F, et al. (2009) The B73 maize genome: complexity, diversity, and dynamics. Science 326: 1112-1115.
【0083】
13. Luo MC, Thomas C, You FM, Hsiao J, Ouyang S, et al. (2003) High-throughput fingerprinting of bacterial artificial chromosomes using the snapshot labeling kit and sizing of restriction fragments by capillary electrophoresis. Genomics 82: 378-389.
【0084】
14. Paux E, Sourdille P, Salse Jrm, Saintenac C, Choulet Fdr, et al. (2008) A Physical Map of the 1-Gigabase Bread Wheat Chromosome 3B. Science 322: 101-104.
【0085】
15. Philippe R, Choulet F, Paux E, van Oeveren J, Tang J, et al. (2012) Whole Genome Profiling provides a robust framework for physical mapping and sequencing in the highly complex and repetitive wheat genome. BMC Genomics 13: 47.
【0086】
16. van Oeveren J, de Ruiter M, Jesse T, van der Poel H, Tang J, et al. (2011) Sequence-based physical mapping of complex genomes by whole genome profiling. Genome Research 21(4): 618-625.
【0087】
17. Schwartz DC, Li X, Hernandez LI, Ramnarain SP, Huff EJ, et al. (1993) Ordered restriction maps of Saccharomyces cerevisiae chromosomes constructed by optical mapping. Science 262: 110-114.
【0088】
18. Teague B, Waterman MS, Goldstein S, Potamousis K, Zhou S, et al. (2010) High-resolution human genome structure by single-molecule analysis. Proc Natl Acad Sci U S A 107: 10848-10853.
【0089】
19. Lam ET, Hastie A, Lin C, Ehrlich D, Das SK, et al. (2012) Genome mapping on nanochannel arrays for structural variation analysis and sequence assembly. Nat Biotechnol 30: 771-776.
【0090】
20. Mun JH, Kwon SJ, Yang TJ, Kim HS, Choi BS, et al. (2008) The first generation of a BAC-based physical map of Brassica rapa. BMC Genomics 9: 280.
【0091】
21. Zhou S, Bechner MC, Place M, Churas CP, Pape L, et al. (2007) Validation of rice genome sequence by optical mapping. BMC Genomics 8: 278.
【0092】
22. Nagarajan N, Read TD, Pop M (2008) Scaffolding and validation of bacterial genome assemblies using optical restriction maps. Bioinformatics 24: 1229-1235.
【0093】
23. Howden BP, Seemann T, Harrison PF, McEvoy CR, Stanton JA, et al. (2010) Complete genome sequence of Staphylococcus aureus strain JKD6008, an ST239 clone of methicillin-resistant Staphylococcus aureus with intermediate-level vancomycin resistance. J Bacteriol 192: 5848-5849.
【0094】
24. Riley MC, Lee JE, Lesho E, Kirkup BC, Jr. (2011) Optically mapping multiple bacterial genomes simultaneously in a single run. PLoS One 6: e27085.
【0095】
25. Lin HC, Goldstein S, Mendelowitz L, Zhou S, Wetzel J, et al. (2012) AGORA: Assembly Guided by Optical Restriction Alignment. BMC Bioinformatics 13: 189.
【0096】
26. Xiao M, Phong A, Ha C, Chan T-F, Cai D, et al. (2007) Rapid DNA mapping by fluorescent single molecule detection. Nucleic Acids Research 35: e16.
【0097】
27. Das SK, Austin MD, Akana MC, Deshpande P, Cao H, et al. (2010) Single molecule linear analysis of DNA in nano-channel labeled with sequence specific fluorescent probes. Nucleic Acids Research 38: e177.
【0098】
28. Dvorak J (2009) Triticeae Genome Structure and Evolution. Genetics and Genomics of the Triticeae Springer Science.
【0099】
29. Li W, Zhang P, Fellers JP, Friebe B, Gill BS (2004) Sequence composition, organization, and evolution of the core Triticeae genome. Plant J 40: 500-511.
【0100】
30. Cassidy BG, Dvorak J (1991) Molecular Characterization of a Low-Molecular-Weight Glutenin Cdna Clone from Triticum-Durum. Theoretical and Applied Genetics 81: 653-660.
【0101】
31. Hernandez P, Martis M, Dorado G, Pfeifer M, Galvez S, et al. (2012) Next-generation sequencing and syntenic integration of flow-sorted arms of wheat chromosome 4A exposes the chromosome structure and gene content. Plant J 69: 377-386.
【0102】
32. Leroy P, Guilhot N, Sakai H, Bernard A, Choulet F, et al. (2012) TriAnnot: A Versatile and High Performance Pipeline for the Automated Annotation of Plant Genomes. Front Plant Sci 3: 5.
【0103】
33. Brenchley R, Spannagl M, Pfeifer M, Barker GL, D'Amore R, et al. (2012) Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature 491: 705-710.
【0104】
34. Li Y, Zheng H, Luo R, Wu H, Zhu H, et al. (2011) Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly. Nat Biotechnol 29: 723-730.
【0105】
35. Soderlund C, Longden I, Mott R (1997) FPC: a system for building contigs from restriction fingerprinted clones. Comput Appl Biosci 13: 523-535.
【0106】
36. Warren RL, Varabei D, Platt D, Huang X, Messina D, et al. (2006) Physical map-assisted whole-genome shotgun sequence assemblies. Genome Res 16: 768-775.
【0107】
様々な態様及び実施形態を本明細書で開示してきたが、その他の態様及び実施形態も当業者に明らかであろう。本明細書で開示する様々な態様及び実施形態は、説明を目的とするものであり、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。当業者であれば、本明細書で開示するこの及びその他のプロセス並びに方法において、そのプロセス及び方法で実行される機能が、異なる順序で実施されてよいことは理解されるであろう。さらに、概略的に述べた工程及び操作は、単に例として提供されるものであり、その工程及び操作の一部は、開示される実施形態の本質から逸脱することなく、所望に応じて行われてよく、より少ない工程及び操作へと組み合わされてよく、又はさらなる工程及び操作へと拡張されてもよい。
【0108】
様々な態様及び実施形態を本明細書で開示してきたが、その他の態様及び実施形態も当業者に明らかであろう。本明細書で開示する様々な態様及び実施形態は、説明を目的とするものであり、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。
【0109】
本明細書における実質的にいずれの複数及び/又は単数の用語の使用に関しても、当業者であれば、文脈及び/又は適用に対して適するように、複数から単数へ、及び/又は単数から複数へと変換することができる。様々な単数/複数の入れ替えは、本明細書にて、明確性のために示される場合がある。
【0110】
当業者であれば、一般的に、本明細書にて、特に添付の請求項(例:添付の請求項の本体)にて用いられる用語は、一般的に、オープンな用語(例:「含んでいる」の用語は、「含んでいるがそれに限定されない」として解釈されるべきであり、「持っている」の用語は、「少なくとも持っている」として解釈されるべきであり、「含む」の用語は、「含むがそれに限定されない」として解釈されるべきである、など)として意図される。当業者であればさらに、導入される請求項記載の具体的な数が意図される場合、そのような意図は請求項において明白に記載されることになり、そのような記載が存在しない場合、そのような意図は存在しないことは理解される。例えば、理解を補助するために、以下に添付する請求項は、請求項記載の導入のために「少なくとも1つの」及び「1つ以上の」の導入語句の使用を含む場合がある。しかし、そのような語句の使用は、同じ請求項が「1つ以上の」又は「少なくとも1つの」の導入語句及び「1つの(a)」又は「1つの(an)」などの不定冠詞を含む場合であっても、不定冠詞「1つの(a)」又は「1つの(an)」による請求項記載の導入が、そのような導入された請求項記載を含むいずれの特定の請求項も、そのような記載を1つだけ含む実施形態に限定することを示唆するものとして解釈されるべきではなく(例:「1つの(a)」及び/又は「1つの(an)」は、「少なくとも1つの」又は「1つ以上の」を意味するものと解釈されるべきである);同じことが、請求項記載の導入に定冠詞が用いられる場合にもあてはまる。加えて、導入される請求項記載の具体的な数が明白に記載される場合であっても、当業者であれば、そのような記載が、少なくともその記載された数を意味するものと解釈されるべきであることは理解されるであろう(例:その他の修飾語を伴わない単なる「2つの記載」の記載は、少なくとも2つの記載、又は2つ以上の記載を意味する)。さらに、「A、B、及びCなどのうちの少なくとも1つ」に類似する表現が用いられる例において、一般的に、そのような構造は、当業者がその表現を理解するであろう意味を意図している(例えば、「A、B、及びCのうちの少なくとも1つを持つシステム」は、これらに限定されないが、Aを単独で、Bを単独で、Cを単独で、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又はA、B、及びCを一緒に持つシステムを含むであろう)。「A、B、又はCなどのうちの少なくとも1つ」に類似する表現が用いられる例において、一般的に、そのような構造は、当業者がその表現を理解するであろう意味を意図している(例えば、「A、B、又はCのうちの少なくとも1つを持つシステム」は、これらに限定されないが、Aを単独で、Bを単独で、Cを単独で、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又はA、B、及びCを一緒に持つシステムを含むであろう)。さらに、当業者であれば、2つ以上の別の選択的な用語を提示する実質的にいかなる離接語及び/又は語句も、それが明細書、請求項、又は図面中であるかに関わらず、それらの用語のうちの1つ、それらの用語のうちのいずれか、又はそれらの用語の両方を含む可能性を考慮するものとして理解されるべきであることは理解されるであろう。例えば、「A又はB」の語句は、「A」、又は「B」、又は「A及びB」の可能性を含むものとして理解されるであろう。
【0111】
加えて、開示事項の特徴又は態様がマーカッシュグループとして記載される場合、当業者であれば、その開示事項は、それによって、そのマーカッシュグループのいかなる個々のメンバー又はメンバーのサブグループとしても表現されていることは理解されるであろう。
【0112】
当業者であれば理解されるように、説明的記載の提供などあらゆる目的のために、本明細書で開示されるすべての範囲は、考え得るあらゆる下位範囲及びその下位範囲の組み合わせも包含する。列挙されたいずれの範囲も、同じ範囲が少なくとも等しい半分、3分の1、4分の1、5分の1、10分の1などに分解されることを充分に記載し、それを可能とするものとして容易に認識することができる。限定されない例として、本明細書で考察される各範囲は、下側の3分の1、中間の3分の1、及び上側の3分の1などに容易に分解することができる。当業者であればさらに理解されるように、「まで」、「少なくとも」などのすべての言語は、記載された数を含み、上記で考察したように、続いて下位範囲に分解することができる範囲を意味する。最後に、当業者であれば理解されるように、範囲は、各個々の数を含む。従って、例えば、1〜3つの細胞を有する群は、1、2、又は3つの細胞を有する群を意味する。同様に、1〜5つの細胞を有する群は、1、2、3、4、又は5つの細胞を有する群を意味する、などである。
【0113】
上記内容から、本開示事項の種々の実施形態は、説明の目的で本明細書にて記載されたこと、及び本開示事項の範囲及び趣旨から逸脱することなく、種々の改変を行ってよいことは理解されるであろう。従って、本明細書で開示される種々の実施形態は、限定することを意図するものではなく、実際の範囲及び趣旨は、以下の請求項によって示される。