特許7212224 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ジャンプコード　ゲノミクス，インク．の特許一覧

特許7212224ＤＮＡ配列の標的特異的ＲＮＡ転写のための方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-01-17

(45)【発行日】2023-01-25

(54)【発明の名称】ＤＮＡ配列の標的特異的ＲＮＡ転写のための方法

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20230118BHJP

C12Q 1/6827 20180101ALI20230118BHJP

C12Q 1/6876 20180101ALN20230118BHJP

C12N 15/09 20060101ALN20230118BHJP

【ＦＩ】

C12Q1/6869 Z ZNA

C12Q1/6827 Z

C12Q1/6876 Z

C12N15/09 100

C12N15/09 110

【請求項の数】 15

(21)【出願番号】P 2018541168

(86)(22)【出願日】2017-02-10

(65)【公表番号】

(43)【公表日】2019-02-21

(86)【国際出願番号】 US2017017530

(87)【国際公開番号】W WO2017139681

(87)【国際公開日】2017-08-17

【審査請求日】2020-02-07

(31)【優先権主張番号】62/294,875

(32)【優先日】2016-02-12

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】518274618

【氏名又は名称】ジャンプコードゲノミクス，インク．

(74)【復代理人】

【識別番号】110003797

【氏名又は名称】弁理士法人清原国際特許事務所

(74)【代理人】

【識別番号】100082072

【弁理士】

【氏名又は名称】清原義博

(72)【発明者】

【氏名】ブラウン，キース

【審査官】原大樹

(56)【参考文献】

【文献】国際公開第２０１５／１３１１０１（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１５／０１５９１７４（ＵＳ，Ａ１）

【文献】国際公開第２０１６／０２２９３１（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｎ

Ｃ１２Ｑ

ＭＥＤＬＩＮＥ／ＢＩＯＳＩＳ／ＥＭＢＡＳＥ／ＷＰＩＤＳ／ＷＰＩＸ／ＣＡｐｌｕｓ（ＳＴＮ）

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

(57)【特許請求の範囲】

【請求項1】

第１の核酸配列を判定する方法であって、該方法は、（ａ）第１の核酸配列に隣接している第２の核酸配列中に、標的配列及びプロモーターを含む標的核酸配列を挿入する工程、（ｂ）ゲノム核酸を鋳型として使用してプロモーターからＲＮＡ転写を介して線形増幅された核酸の合成を導く工程、及び（ｃ）合成された線形増幅された核酸の配列を決定する工程を含み、第２の核酸配列は可動遺伝因子、反復核酸配列、またはハンチンチン遺伝子における突然変異を含むゲノム配列であり、第１の核酸配列は、第２の核酸配列中に標的核酸配列を挿入して増幅されたゲノム配列であり、標的配列は、第２の核酸配列またはその一部と相同であり、クラスター化した規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、及びＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む、方法。

【請求項2】

ＣＲＩＳＰＲ配列は、配列番号３を含む配列と共にガイドＲＮＡを含む、ことを特徴とする請求項１に記載の方法。

【請求項3】

プロモーターは、細菌プロモーター、ウイルスプロモーター、及び真核生物プロモーターの少なくとも１つを含む、ことを特徴とする請求項１に記載の方法。

【請求項4】

細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃの少なくとも１つを含む、ことを特徴とする請求項３に記載の方法。

【請求項5】

ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓの少なくとも１つを含む、ことを特徴とする請求項３に記載の方法。

【請求項6】

真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６の少なくとも１つを含む、ことを特徴とする請求項３に記載の方法。

【請求項7】

第２の核酸配列は、前記突然変異を含む、ことを特徴とする請求項１に記載の方法。

【請求項8】

第２の核酸配列は、反復核酸配列を含む、ことを特徴とする請求項１に記載の方法。

【請求項9】

第２の核酸配列は、トリヌクレオチドリピート、タンデムリピート、及びヒト白血球抗原遺伝子の少なくとも１つを含む、ことを特徴とする請求項１に記載の方法。

【請求項10】

第２の核酸配列は、可動遺伝因子を含む、ことを特徴とする請求項１に記載の方法。

【請求項11】

可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、ＬＩＮＥ要素、Ａｌｕ要素、ＭＩＲ要素、嚢内Ａ粒子（ＩＡＰ）、ＥＴｎ、ウイルス、又はそれらのフラグメントを含む、ことを特徴とする請求項１０に記載の方法。

【請求項12】

ＲＮＡ転写は、ＲＮＡポリメラーゼの使用を含む、ことを特徴とする請求項１に記載の方法。

【請求項13】

ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、及び単一のサブユニットのＲＮＡポリメラーゼの少なくとも１つを含む、ことを特徴とする請求項１２に記載の方法。

【請求項14】

合成される核酸は、ゲノム核酸配列から直接合成され、第２の核酸配列から第１の核酸配列を介して直接はじまる、ことを特徴とする請求項１に記載の方法。

【請求項15】

配列決定は、サンガー配列決定、次世代配列決定、パイロシークエンシング、大規模並列シグネチャー配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、合成による配列決定、及びライゲーションによる配列決定の少なくとも１つを含む、ことを特徴とする請求項１に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

＜関連出願＞
本出願は、２０１６年２月１２日出願の米国仮特許出願第６２／２９４，８７５の利益を主張するものであり、その内容は、全体において参照により本明細書に組み込まれる。

【背景技術】

【0002】

本明細書中の開示は、核酸サンプルにおける反復配列に隣接している核酸配列の増幅及び識別などの、分子生物学の分野に関連する。

【0003】

ＰＣＲ、又はハイブリッドキャプチャーと併せたＰＣＲ技術の変形は、標的化配列決定の優勢な方法である。広く使用されているにもかかわらず、その両方には、ロングリードシーケンサーに対して制限がある。ハイブリッドキャプチャーは、標的ＤＮＡにハイブリダイズし且つ対象の配列を「プルダウン」するために、ビオチンと共に短いＲＮＡ又はＤＮＡプローブを使用する。長い標的配列について、この方法は非能率的なものであり、その理由として、多くのオリゴヌクレオチドプローブが必要とされ、且つこのプロセスの結果、プルダウンプロセス中に長いＤＮＡ分子の物理的な剪断が頻繁にもたらされるためである。このような欠点は、単一分子技術を使用した隣接するシーケンサーの読み取りの長さを制限してしまう。

【0004】

長い範囲のＰＣＲは、代案として使用されるだけでなく、困難をもたらしている。長い範囲のＰＣＲは多重化が困難である。頻繁に、標的領域の外側の対向する鎖の上での対向するＰＣＲプライマーの必要性のために、転座などの大きな染色体事象を検出する能力が失われてしまう。加えて、ＰＣＲのクローン増幅は、腫瘍などの不均一なサンプルにおける低頻度の体細胞の変化を検出するために感度を制限し、且つ、反応の初期のサイクルからの点突然変異又は転座などのポリメラーゼ誤差を広めかねない。更に、長い範囲のＰＣＲは時に、増幅産物に誤差を作り出す鋳型スイッチングを示す。

【発明の概要】

【0005】

ゲノム配列解析技術における進歩は、ヒトの遺伝変異及びその疾患に対する寄与についての我々の理解を大幅に増大させた。短い読み取りＤＮＡ配列決定技術（Ｉｌｌｕｍｉｎａ，ＴｈｅｒｍｏＦｉｓｈｅｒ，Ｑｉａｇｅｎ）は、一塩基変異多型の慣例的な識別及び小さな挿入と欠失を結果としてもたらす、何十億もの短い読み取りを生成する。これらの短い読み取り配列決定技術は、大きな染色体の再配置、転座、及び可動因子再配置などのより複雑な変化を検出するための感度を示していない。長い読み取り配列決定技術（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，ＯｘｆｏｒｄＮａｎｏｐｏｒｅ）は、１０，０００の塩基対の過剰において単一分子の読み取り長さを生成する能力を示すが、完全なヒトゲノムを配列決定且つ組み立てる能力を持たない。本明細書に開示される標的化戦略は、これらのより長い読み取り長さを利用する。

【0006】

ここで、我々は、元の鋳型のみが増幅されてサンプルＤＮＡ配列に対する元の標的配列のコピーの増大をもたらす、長い範囲の標的特異的増幅を記載する。増幅された産物は、サンプル鋳型の合成された増幅中間体又は以前に合成されたコピーではなく、サンプル鋳型に直接由来する。その結果、合成されたコピーは、前の合成反応から誤差を組み込まない。これにより、初期の誤差が反応中に差次的に増幅され得るという可能性が劇的に減る。合成産物は鋳型として機能しないため、合成における何らかの誤差が独立して引き出され、且つ１つの分子から次の分子まで恐らく一致しない。従って、合成された産物の比較により、合成における誤差を容易に識別し、且つサンプル配列をより容易に引き出すことができる。

【0007】

開示された主題は、本開示に伴う請求項の列挙において部分的に要約される。

【0008】

本明細書には、核酸分子の既知の配列の領域に隣接している配列を判定する方法が提供される。幾つかのそのような方法は、ａ）核酸分子の既知の領域にてプロモーター配列を含む核酸断片を付ける工程；ｂ）プロモーターにより配向されたＲＮＡポリメラーゼに核酸断片を接触させる工程；及びｃ）複数のＲＮＡ分子を合成する工程を含み；ここで、複数のＲＮＡ分子のコンセンサス配列は核酸分子の既知の領域に隣接している配列を表わす。随意に、コンセンサス配列は長さが少なくとも１０キロベースである。時に、前記方法は、複数のＲＮＡ分子の合成の後にＤＮａｓｅを使用して核酸分子を処理する工程を含む。代替的に又は組み合わせで、前記方法は複数のＲＮＡ分子を逆転写する工程を含む。前記方法は時に、複数のＲＮＡ分子の核酸配列を判定する工程を含む。随意に、複数のＲＮＡ分子のコンセンサス配列は、核酸分子から直接合成された分子の配列を含む。代替的に又は組み合わせで、前記付ける工程は、核酸分子の既知の領域にてプロモーター配列を含む核酸断片を挿入する工程を含む。場合によっては、前記付ける工程は、核酸分子の既知の配列の領域にてプロモーター配列を含む核酸断片を挿入する工程を含む。随意に、前記付ける工程は、核酸分子の既知の配列の領域の配列に特異的な切断を含む。代替的に又は組み合わせで、前記付ける工程は、ＣＲＩＳＰＲ核酸タンパク質複合体に核酸分子の既知の領域を接触させる工程を含む。随意に、ＣＲＩＳＰＲ核酸タンパク質複合体は、ＳＥＱＩＤＮＯ：３を含むガイドＲＮＡを含む。場合によっては、前記付ける工程は、プロモーター配列を含む核酸断片をライゲートする工程を含む。時に、プロモーター配列を含む核酸断片は、ウイルスプロモーターを含む。随意に、ウイルスプロモーターは、ウイルスＲＮＡポリメラーゼを結合し、且つ、Ｔ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓから成るリストから選択された少なくとも１つのプロモーターである。代替的に又は組み合わせで、プロモーター配列を含む核酸断片は細菌プロモーターを含む。場合によっては、細菌プロモーターは、細菌ＲＮＡポリメラーゼを結合し、且つ、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃから成るリストから選択された少なくとも１つのプロモーターである。時に、プロモーター配列を含む核酸断片は真核生物プロモーターを含む。随意に、真核生物プロモーターは、真核生物ＲＮＡポリメラーゼを結合し、且つ、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６から成るリストから選択された少なくとも１つのプロモーターである。代替的に又は組み合わせで、真核生物プロモーターは、ＲＮＡｐｏｌＩプロモーター、ＲＮＡｐｏｌＩＩプロモーター、及びＲＮＡｐｏｌＩＩＩプロモーターから成るリストから選択された少なくとも１つのプロモーターである。随意に、核酸分子の既知の領域は反復要素を含む。場合によっては、反復要素は、可動挿入因子（ｍｏｂｉｌｅｉｎｓｅｒｔｉｏｎｅｌｅｍｅｎｔ）を含む。時に、反復要素は、ＬＩＮＥ要素、ＳＩＮＥ要素、Ａｌｕリピート、トランスポゾン、レトロトランスポゾン、セントロメアリピート、及びテロメアリピートのうち少なくとも１つを含む。代替的に又は組み合わせで、ＬＩＮＥ要素はＳＥＱＩＤＮＯ：１を含む。

【0009】

追加の実施形態において、核酸サンプルにおける要素の複数の遺伝子座に隣接する配列を判定する方法が提供され、該方法は、ａ）プロモーターを含む核酸を要素に挿入する工程、ｂ）プロモーターによって配向された複数の核酸分子を生成する工程、及びｃ）複数の核酸分子の配列を判定する工程を含み、ここで、核酸分子は核酸サンプルから直接合成され、複数の核酸分子は遺伝子座に隣接する配列に及ぶ（ｓｐａｎ）。随意に、核酸分子はＲＮＡを含む。場合によっては、核酸分子は核酸合成を刺激することができない。時に、核酸サンプルは癌細胞核酸を含む。場合によっては、核酸サンプルは単一の核ゲノムを含む。頻繁に、核酸サンプルは単細胞から得られる。随意に、前記方法は、複数のＲＮＡ分子の合成の後にＤＮａｓｅを使用して核酸サンプルを処理する工程を含む。時に、前記方法は複数のＲＮＡ分子を逆転写する工程を含む。場合によっては、複数の核酸分子はＲＮＡ分子である。時に、複数のＲＮＡ分子のコンセンサス配列は、核酸分子から直接合成された分子の配列を含む。場合によっては、前記付ける工程は、核酸分子の既知の領域にてプロモーター配列を含む核酸断片を挿入する工程を含む。随意に、前記付ける工程は、核酸分子の既知の領域にてプロモーター配列を含む核酸断片を挿入する工程を含む。時に、前記付ける工程は、核酸分子の既知の領域の配列に特異的な切断を含む。随意に、前記付ける工程は、ＣＲＩＳＰＲ核酸タンパク質複合体に核酸分子の既知の領域を接触させる工程を含む。場合によっては、ＣＲＩＳＰＲ核酸タンパク質複合体は、ＳＥＱＩＤＮＯ：３を含むガイドＲＮＡを含む。時に、前記付ける工程は、プロモーター配列を含む核酸断片をライゲートする工程を含む。場合によっては、プロモーター配列を含む核酸断片はウイルスプロモーターを含む。ウイルスプロモーターは様々に、Ｔ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓから成るリストから選択された少なくとも１つのプロモーターである。時に、プロモーター配列を含む核酸断片は細菌プロモーターを含む。随意に、細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃから成るリストから選択された少なくとも１つのプロモーターである。場合によっては、プロモーター配列を含む核酸断片は真核生物プロモーターを含む。例えば、時に真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６から成るリストから選択された少なくとも１つのプロモーターである。随意に、真核生物プロモーターは、ＲＮＡｐｏｌＩプロモーター、ＲＮＡｐｏｌＩＩプロモーター、及びＲＮＡｐｏｌＩＩＩプロモーターから成るリストから選択された少なくとも１つのプロモーターである。時に、核酸分子の既知の領域は反復要素を含む。幾つかの反復要素は、可動挿入因子を含む。場合によっては、反復要素は、ＬＩＮＥ要素、ＳＩＮＥ要素、Ａｌｕリピート、トランスポゾン、レトロトランスポゾン、セントロメアリピート、及びテロメアリピートのうち少なくとも１つを含む。随意に、ＬＩＮＥ要素はＳＥＱＩＤＮＯ：１を含む。

【0010】

本明細書にはまた、幾つかの実施形態において、核酸サンプルにおける反復された可動因子の境界の少なくとも９０％にわたって境界に隣接した配列をコードする核酸を含む、核酸ライブラリーが提供される。時に、ライブラリーの構成要素と核酸サンプルとの間の不一致が、独立して引き出される。随意に、前記反復された要素の境界のうち少なくとも５０％が、少なくとも１００のコピーに存在する。場合によっては、ライブラリーの構成要素は、核酸サンプルに直接由来する。代替的に又は組み合わせで、ライブラリーの構成部分は、配列決定前にクローン的に増幅されない。随意に、核酸サンプルは単細胞に由来する。時に、核酸ライブラリーはＲＮＡ中間体から逆転写される。場合によっては、核酸ライブラリーはＲＮＡを含む。随意に、核酸ライブラリーの構成要素はプロモーター配列を含む。随意に、ＲＮＡプロモーター配列は、Ｔ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、ＣａＭＶ３５Ｓ、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、Ｐｔａｃ、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６のうち少なくとも１つを含む。随意に、少なくとも１つの境界隣接は、細胞周期調節、ＤＮＡ修複、及び成長調節の少なくとも１つに関連する遺伝子の欠損を示す。場合によっては、核酸ライブラリーは、核酸サンプルにおいて反復された可動因子の境界の少なくとも９５％にわたって境界に隣接する配列をコードする核酸を含む。場合によっては、核酸ライブラリーは、核酸サンプルにおいて反復された可動因子の境界の少なくとも９９％にわたって境界に隣接する配列をコードする核酸を含む。代替的に又は組み合わせで、ライブラリーの構成要素の核酸のうち少なくとも５０％が、可動因子の境界の２０ｋｂ以内に核酸上に位置付けられる。場合によっては、ライブラリー構成要素の核酸のうち少なくとも７５％が、可動因子の境界に近接した可動因子の境界の２０ｋｂ以内に核酸上に位置付けられる。随意に、ライブラリーの構成要素の核酸のうち少なくとも９０％が、可動因子の境界の２０ｋｂ以内に核酸上に位置付けられる。時に、ライブラリーの構成要素の核酸のうち少なくとも５０％が、可動因子の境界の１０ｋｂ以内に核酸上に位置付けられる。場合によっては、ライブラリー構成要素の核酸のうち少なくとも７５％が、可動因子の境界に近接した可動因子の境界の１０ｋｂ以内に核酸上に位置付けられる。場合によっては、ライブラリーの構成要素の核酸のうち少なくとも９０％が、可動因子の境界の１０ｋｂ以内に核酸上に位置付けられる。随意に、ライブラリーの構成要素の核酸のうち少なくとも５０％が、可動因子の境界の５ｋｂ以内に核酸上に位置付けられる。時に、ライブラリー構成要素の核酸のうち少なくとも７５％が、可動因子の境界に近接した可動因子の境界の５ｋｂ以内に核酸上に位置付けられる。場合によっては、ライブラリーの構成要素の核酸のうち少なくとも９０％が、可動因子の境界の５ｋｂ以内に核酸上に位置付けられる。随意に、ライブラリーの構成要素の核酸のうち少なくとも５０％が、可動因子の境界の１ｋｂ以内に核酸上に位置付けられる。場合によっては、ライブラリー構成要素の核酸のうち少なくとも７５％が、可動因子の境界に近接した可動因子の境界の１ｋｂ以内に核酸上に位置付けられる。随意に、ライブラリーの構成要素の核酸のうち少なくとも９０％が、可動因子の境界の１ｋｂ以内に核酸上に位置付けられる。時に、平均断片長は約５００ベースである。場合によっては、平均断片長は約１０００ベースである。随意に、中間の断片長は約５００ベースである。随意に、中間の断片長は約１０００ベースである。

【0011】

更なる実施形態において、標的配列及びプロモーターを含む組成物該提供され、ここで、標的配列は、核酸配列における１つ以上の特定の位置への組成物の挿入を導く核酸配列を含み、プロモーターは、プロモーターの挿入に隣接するサンプル配列からの核酸の合成を導く核酸配列を含む。随意に、標的配列は特定の位置に相同する核酸配列を含む。時に、標的配列は、特定の位置に対する塩基対をなす核酸配列を含む。場合によっては、標的配列は、特定の位置にハイブリダイズする核酸配列を含む。場合によっては、標的配列は、クラスター化した規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、及びＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む。場合によっては、ＣＲＩＳＰＲ配列は、ＳＥＱＩＤＮＯ：３を含む配列と共にガイドＲＮＡを含む。頻繁に、プロモーターは、細菌プロモーター、ウイルスプロモーター、及び真核生物プロモーターのうち少なくとも１つを含む。場合によっては、細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃのうち少なくとも１つを含む。時に、ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓのうち少なくとも１つを含む。真核生物プロモーターは頻繁に、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６のうち少なくとも１つを含む。随意に、核酸配列における特定の位置は、低複雑性の核酸配列を含む。頻繁に、核酸配列における特定の位置は、反復核酸配列を含む。随意に、低複雑性の核酸配列又は反復核酸配列は、トリヌクレオチドリピート、タンデムリピート、及びヒト白血球抗原遺伝子のうち少なくとも１つを含む。場合によっては、核酸配列における特定の位置は可動遺伝因子を含む。随意に、可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、嚢内Ａ粒子（ＩＡＰ）、ＥＴｎ、ウイルス、及びそれらのフラグメントのうち少なくとも１つを含む。レトロトランスポゾンは頻繁に、転位因子、ＬＩＮＥ、ＳＩＮＥ、及びそれらのフラグメントのうち少なくとも１つを含む。随意に、ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む。代替的に又は組み合わせで、ウイルスはレトロウイルス又はそのフラグメントを含む。時に、核酸合成は、ＲＮＡ転写とＤＮＡ合成のうち少なくとも１つを含む。

【0012】

本明細書にはまた、対象の核酸配列に隣接している核酸配列を判定する方法が提供され、該方法は：（ａ）対象の核酸配列における１つ以上の特定の位置に、標的配列及びプロモーターを含む標的核酸配列を挿入する工程、（ｂ）プロモーターからの核酸の合成を導く工程、及び（ｃ）合成された核酸を配列決定する工程を含む。幾つかの標的配列は、クラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、及びＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列のうち少なくとも１つを含む。随意に、ＣＲＩＳＰＲ配列は、ＳＥＱＩＤＮＯ：３を含む配列と共にガイドＲＮＡを含む。場合によっては、プロモーターは、細菌プロモーター、ウイルスプロモーター、及び真核生物プロモーターのうち少なくとも１つを含む。随意に、細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃのうち少なくとも１つを含む。随意に、ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓのうち少なくとも１つを含む。随意に、真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６のうち少なくとも１つを含む。場合によっては、対象の配列は、低複雑性の核酸配列を含む。対象の配列は頻繁に、反復核酸配列を含む。随意に、対象の配列は、トリヌクレオチドリピート、タンデムリピート、及びヒト白血球抗原遺伝子のうち少なくとも１つを含む。代替的に又は組み合わせで、対象の配列は可動遺伝因子を含む。随意に、可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、嚢内Ａ粒子（ＩＡＰ）、ＥＴｎ、ウイルス、又はそれらのフラグメントを含む。時に、レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、及びそれらのフラグメントのうち少なくとも１つを含む。随意に、ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む。ウイルスは頻繁に、レトロウイルス及びそのフラグメントのうち少なくとも１つを含む。随意に、核酸合成は、ＲＮＡ転写とＤＮＡ合成のうち少なくとも１つを含む。場合によっては、ＲＮＡ転写は、ＲＮＡポリメラーゼの使用を含む。随意に、ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、及び単一のサブユニットのＲＮＡポリメラーゼのうち少なくとも１つを含む。場合によっては、ＤＮＡ合成は、ＤＮＡポリメラーゼの使用を含む。随意に、ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、及びＰｆｕＤＮＡポリメラーゼのうち少なくとも１つを含む。随意に、核酸合成はプライマーを必要とする。頻繁に、合成された核酸は、対象の核酸配列から直接合成される。場合によっては、核酸は突然変異の導入無しに合成される。随意に、突然変異は、点突然変異、欠失、挿入、及びキメラのうち少なくとも１つである。随意に、合成された核酸はＤＮＡを含む。場合によっては、合成された核酸はｃＤＮＡを含む。随意に、合成された核酸はＲＮａｓｅで処理される。時に、合成された核酸はＲＮＡを含む。随意に、合成された核酸はＤＮａｓｅで処理される。場合によっては、配列決定は、サンガー配列決定、次世代配列決定、パイロシークエンシング、大規模並列シグネチャー配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、合成による配列決定、及びライゲーションによる配列決定のうち少なくとも１つを含む。場合によっては、前記方法は被験体の突然変異を検出する。随意に、前記方法は、被験体から得られた組織サンプルの突然変異を検出する。組織サンプルは頻繁に、腫瘍、血液、唾液、痰、皮膚、及び上皮の組織のうち少なくとも１つを含む。

【0013】

追加の実施形態において、本明細書には、被験体の核酸サンプルにおけるＤＮＡ要素の挿入の部位をマッピングする方法が提供され、該方法は：ｉ）ゲノムＤＮＡを、標的配列、及びＤＮＡ要素に標的配列を挿入するのに十分な１つ以上の試薬と接触させることによって、標的配列及びプロモーターを含む標的核酸配列を挿入する工程；ｉｉ）プロモーターから核酸合成を触媒する１つ以上の酵素に、挿入された標的配列を接触させ、それにより増幅核酸を作り出すことによって、ゲノムＤＮＡから直接、増幅核酸を作り出す工程；ｉｉｉ）増幅核酸を配列決定する工程を含む。随意に、標的配列は、クラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、及びＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列のうち少なくとも１つを含む。時に、ＣＲＩＳＰＲ配列は、ＳＥＱＩＤＮＯ：３を含む配列と共にガイドＲＮＡを含む。随意に、プロモーターは、細菌プロモーター、ウイルスプロモーター、及び真核生物プロモーターのうち少なくとも１つを含む。場合によっては、細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃのうち少なくとも１つを含む。代替的に又は組み合わせで、ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓのうち少なくとも１つを含む。随意に、真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６のうち少なくとも１つを含む。時に、ＤＮＡ要素は、低複雑性の核酸配列を含む。場合によっては、ＤＮＡ要素は、反復核酸配列を含む。場合によっては、ＤＮＡ要素は、トリヌクレオチドリピート、及びタンデムリピートのうち少なくとも１つを含む。随意に、ＤＮＡ要素は、可動遺伝因子を含む。随意に、可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、嚢内Ａ粒子（ＩＡＰ）、ＥＴｎ、ウイルス、及びそれらのフラグメントのうち少なくとも１つを含む。随意に、レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、及びそれらのフラグメントのうち少なくとも１つを含む。随意に、ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む。随意に、ウイルスはレトロウイルス又はそのフラグメントを含む。時に、酵素はＲＮＡポリメラーゼを含む。場合よっては、ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、及び単一のサブユニットのＲＮＡポリメラーゼのうち少なくとも１つを含む。随意に、酵素はＤＮＡポリメラーゼを含む。代替的に又は組み合わせで、ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、及びＰｆｕＤＮＡポリメラーゼのうち少なくとも１つを含む。時に、核酸合成はプライマーを必要とする。随意に、合成された核酸は、対象の核酸配列から直接合成される。場合によっては、核酸は突然変異の導入無しに合成される。場合によっては、突然変異は、点突然変異、欠失、挿入、及びキメラのうち少なくとも１つである。随意に、合成された核酸はＤＮＡである。代替的に、合成された核酸はｃＤＮＡである。随意に、合成された核酸はＲＮａｓｅで処理される。随意に、合成された核酸はＲＮＡを含む。場合よっては、合成された核酸はＤＮａｓｅで処理される。随意に、配列決定は、サンガー配列決定、次世代配列決定、パイロシークエンシング、大規模並列シグネチャー配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、合成による配列決定、及びライゲーションによる配列決定のうち少なくとも１つを含む。随意に、前記方法は被験体の突然変異を検出する。代替的に又は組み合わせで、前記方法は、被験体から得られた組織サンプルの突然変異を検出する。随意に、組織サンプルは、腫瘍、血液、唾液、痰、皮膚、及び上皮の組織のうち少なくとも１つを含む。

【0014】

本明細書には更に、反復ゲノムに領域を配列決定する方法が提供され、該方法は：ｉ）ゲノムＤＮＡを、標的配列、及び反復ゲノム領域に標的配列を挿入するのに十分な１つ以上の試薬と接触させることによって、標的配列及びプロモーターを含む標的核酸配列を挿入する工程；ｉｉ）プロモーターから核酸合成を触媒する１つ以上の酵素に、挿入された標的配列を接触させ、それにより増幅核酸を作り出すことによって、ゲノムＤＮＡから直接、増幅核酸を作り出す工程；ｉｉｉ）増幅核酸を配列決定する工程を含む。随意に、標的配列は、クラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、及びＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列のうち少なくとも１つを含む。随意に、ＣＲＩＳＰＲ配列は、ＳＥＱＩＤＮＯ：３を含む配列と共にガイドＲＮＡを含む。随意に、プロモーターは、細菌プロモーター、ウイルスプロモーター、及び真核生物プロモーターのうち少なくとも１つを含む。頻繁に、細菌プロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、及びＰｔａｃのうち少なくとも１つを含む。随意に、ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、及びＣａＭＶ３５Ｓのうち少なくとも１つを含む。真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、及びＵ６のうち少なくとも１つを含む。場合によっては、反復ゲノム領域は、低複雑性の核酸配列を含む。随意に、反復ゲノムの領域は、反復核酸配列を含む。場合によっては、反復ゲノム領域は、トリヌクレオチドリピート、及びタンデムリピートのうち少なくとも１つを含む。時に、反復ゲノム領域は、可動遺伝因子を含む。随意に、可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、嚢内Ａ粒子（ＩＡＰ）、ＥＴｎ、ウイルス、及びそれらのフラグメントのうち少なくとも１つを含む。場合によっては、レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、及びそれらのフラグメントのうち少なくとも１つを含む。随意に、ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む。随意に、ウイルスはレトロウイルス又はそのフラグメントを含む。随意に、酵素はＲＮＡポリメラーゼを含む。随意に、ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、及び単一のサブユニットのＲＮＡポリメラーゼのうち少なくとも１つを含む。随意に、酵素はＤＮＡポリメラーゼを含む。随意に、ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、及びＰｆｕＤＮＡポリメラーゼのうち少なくとも１つを含む。場合によっては、核酸合成はプライマーを必要とする。合成された核酸は頻繁に、対象の核酸配列から直接合成される。場合によっては、核酸は突然変異の導入無しに合成される。場合によっては、突然変異は、点突然変異、欠失、挿入、及びキメラのうち少なくとも１つである。随意に、合成された核酸は、ゲノム又はｃＤＮＡなどのＤＮＡである。場合よっては、合成された核酸はＲＮａｓｅで処理される。随意に、合成された核酸はＲＮＡを含む。場合よっては、合成された核酸はＤＮａｓｅで処理される。随意に、配列決定は、サンガー配列決定、次世代配列決定、パイロシークエンシング、大規模並列シグネチャー配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、合成による配列決定、及びライゲーションによる配列決定のうち少なくとも１つを含む。随意に、前記方法は被験体の突然変異を検出する。代替的に又は組み合わせで、前記方法は、被験体から得られた組織サンプルの突然変異を検出する。随意に、組織サンプルは、腫瘍、血液、唾液、痰、皮膚、及び上皮の組織のうち少なくとも１つを含む。

【図面の簡単な説明】

【0015】

本発明の原理が用いられる実施形態を説明する以下の詳細な説明と、以下の添付図面に対する言及を行う。

【図1】典型的なヒトＬＩＮＥ１（Ｌ１．４）反復要素ＤＮＡ配列（ＳＥＱＩＤＮＯ：１）を示す。

【図2】Ｌ１ＨＡの典型的なコンセンサス配列：ＬＩＮＥ－１要素の３’末端における診断配列（ＳＥＱＩＤＮＯ：２）を示す。

【図3】典型的なガイドＲＮＡ配列（ＳＥＱＩＤＮＯ：３）を示す。

【図4】典型的なＡｌｕ－Ｙ配列（ＳＥＱＩＤＮＯ：４）を示す。

【図5】標的特異的Ｔ７プロモーター配列の、ＣＲＩＳＰＲで誘導された挿入を示す。

【図6】標的鋳型の増幅ＲＮＡコピーを生成する標的ＤＮＡのインビトロ転写を示す。

【図7】標的配列の上流及び下流に特異的に挿入されたＴ７プロモーターを示す。

【図8】代替的なドナーＤＮＡ構築物を示す。

【図9】サンプルにおける挿入されたＴ７ＲＮＡポリメラーゼ部位に隣接しているゲノムの配列の線形増幅の結果を示す。

【図10】インビトロ転写されたＲＮＡのサイズ選択の結果を示す。

【図11】インビトロ転写されたＲＮＡのサイズ排除の結果をアガロースゲル上に示す。

【発明を実施するための形態】

【0016】

本明細書に開示される方法は、ＤＮＡ指向性のＲＮＡ転写が可能な細菌又はバクテリオファージプロモーター（Ｔ７、Ｔ３、又はＳＰ６などであるが、広範囲のプロモーターは本明細書中の開示に適合し、本明細書中のリストは包括的であるように意図されていない）を挿入するための、核酸編集技術（ＣＲＩＳＰＲ、ＴＡＬＥＮＳ、ジンクフィンガー、トランスポサーゼ、及び当業者に既知の他の方法）を含む。挿入されたプロモーターからのＲＮＡ分子の転写に続いて、隣接した配列の効果的な線形増幅が、鋳型としてサンプルから直接由来するＲＮＡ分子の集まりの形で存在する。ＲＮＡ分子は、任意の数の方法によって、短い読み取り又は長い読み取りの何れかのＤＮＡ配列決定ライブラリーへと変換される。

【0017】

例示的な実施形態としてＣＲＩＳＰＲを使用すると、前記方法は、対象の配列の上流で保存された且つ局所的に固有の配列を標的とする、配列特異的ガイドＲＮＡ分子の第１の設計を含む。好ましくは、特定のガイドＲＮＡ分子は、リピート要素に固有な核酸配列に結合し、且つ、ゲノムサンプルなどのサンプルにおいて複数回生じる場合もあるが、そこでは各発生がリピート要素の発生に相当する。随意に、特定のガイドＲＮＡ分子は、配列決定される特定のゲノム領域に固有な核酸配列と結合する。配列特異的分子は、高分子量サンプルＤＮＡの混合物、即ち、ＣＲＩＳＰＲ／ＣＡＳ系の構成部分（ＣＲＩＳＰＲ技術を使用する時）及びＴ７プロモーター配列を含有するドナーＤＮＡ分子に加えられる。場合によっては、ＣＲＩＳＰＲ／ＣＡＳ分子が、サンプルに接触させられる前にその関連する核酸で組み立てられる。

【0018】

特定のゲノム遺伝子座への、ＣＡＳによるＴ７プロモーターなどのＲＮＡプロモーターの挿入の後、Ｔ７ポリメラーゼなどの互換性をもつＲＮＡポリメラーゼは、必要なリボヌクレオチド及びバッファーと共にサンプルに加えられる。インビトロの転写が、ＲＮＡ中間体を通じて標的ＤＮＡ配列のおよそ１，０００倍の増幅を生成するために使用される。その後、インビトロの転写から生成されたＲＮＡは、合成による断片化、及び短い読み取り配列ライブラリーへの変換などにより、ＤＮＡライブラリー生成の鋳型として使用される。代替的に、インビトロの転写反応から生成されたＲＮＡは、ポリＡ末端付加（ｐｏｌｙ－Ａｔａｉｌｅｄ）又はポリアデニル化され、その後、ＲＮＡ鋳型の完全長の逆転写されたＤＮＡコピーを生成するためにオリゴｄＴプライマー及び逆転写酵素を使用して逆転写される。アダプターは随意に、単一分子配列決定技術を使用して完全長の逆転写されたＤＮＡ分子の後続する配列決定のために、このステップにおいてライゲートされる。

【0019】

本明細書に記載される方法の幾つかの目的は、長い読み取り配列決定に適している長い標的化鋳型を生成することである。ゲノムＤＮＡなどの高分子量サンプルＤＮＡは、ソース（例えば、血液、血清、細胞、細胞培養物、唾液、腫瘍、毛髪、皮膚、上皮組織、尿、便、羊水、痰、脳脊髄液、粘液）から最初に得られる。標準ＤＮＡ精製技術が、高分子量サンプルＤＮＡの単離のために随意に使用される。後続する反応は頻繁に細胞の外部で生じるが、幾つかの実施形態において、細胞物質は反応チャンバに残る場合もある。生菌は、多くの実施形態において適合可能な反応物においては使用されない。代替的に、標的とされた鋳型は生菌のゲノム中にある。本明細書中の方法でのサンプルＤＮＡは、任意の生物から得られる。代替的に、サンプルＤＮＡは合成である。高分子量サンプルＤＮＡを調製する方法は慣例的なものであり、且つ当該技術分野で既知である。場合によっては、サンプルＤＮＡはゲノムＤＮＡを含む。ゲノムＤＮＡを含むサンプルＤＮＡは、真核生物ゲノム、原核生物ゲノム、ユーバクテリウムゲノム、古細菌ゲノム、ウイルスゲノム、又は合成核酸源から随意に選択される。場合によっては、サンプルは腫瘍細胞又は流血中癌細胞である。代替的に、サンプルＤＮＡは、無細胞ＤＮＡ、プラスミドＤＮＡ、ウイルスＤＮＡ、合成ＤＮＡ、又は被験体から得た他の高分子量ＤＮＡサンプルを含む。

【0020】

ガイドＲＮＡは、幾つかの方法において標的特異的モチーフで設計されている。標的は、対象の遺伝子に隣接している又はその中にある、対象のプロモーターに隣接している又はその中にある、或いは、遺伝子、エキソン、イントロン、又は遺伝子間領域内にある場合がある。ガイドＲＮＡは、完全又は不完全な逆相補性であり得る、サンプルＤＮＡに結合するためにそれらの配列内のサンプルに対する逆相補性を持つ配列を使用する。ガイドＲＮＡは、標的配列の端部の何れか一方にて、又はドナー配列の挿入のための何れか又は両方の配向において、ドナー配列をコードする核酸の挿入と共に標的配列内にある又は標的配列に隣接する（ｆｌａｎｋｉｎｇ）複数の位置を標的とするように設計されてもよい。ガイドＲＮＡ設計は、ＮＧＧヌクレオチド配列から構成されるフォトスペーサー隣接モチーフ又はＰＡＭ配列の上流にある。幾つかのＣＡＳ９突然変異体は、ガイドＲＮＡ分子の標的配列に隣接するＰＡＭ配列の必要性を排除し、場合によっては、本明細書ではＰＡＭ配列が存在しない。単一のガイドＲＮＡが使用される。代替的に、多数のガイドＲＮＡが設計され、単一反応において同時に使用される。例示的な実施形態において、ガイドＲＮＡ標的配列は、標的配列にわたって間隔を置いて設計されている。ガイドＲＮＡは、二本鎖標的ＤＮＡ分子に沿って対向する配向にあるように設計される。随意に、ガイドＲＮＡは、二本鎖標的ＤＮＡ分子の対向する鎖の上にあるように設計される。前記方法は、対象の標的ゲノムＤＮＡ遺伝子座に多くのＴ７ドナー配列を挿入する場合もある。

【0021】

ドナー配列は、増幅部位、場合によっては具体的に、Ｔ７ポリメラーゼのためのプロモーター部位を含む。Ｔ３ポリメラーゼ及びＳＰ６プロモーター配列は代替的なドナー配列であるが、他の配列も当業者に利用可能である。代替的に、他のＤＮＡ依存性ＲＮＡポリメラーゼプロモーターが使用される。典型的な実施形態において、Ｔ７プロモーターが使用される。適切なＴ７プロモーター配列は５’－ＴＡＡＴＡＣＧＡＣＴＣＡＣＴＡＴＡＧ－３’（ＳＥＱＩＤＮＯ：５）であり、Ｔ７転写は３’Ｇから始まる。ＲＮＡ転写は５’－３’で生じ、５’－３’の配向でもＲＮＡ分子を生成することで、それをｃＤＮＡへの逆転写及び変換のための有用な鋳型とする。ＲＮＡポリメラーゼは、全ての１０－３０ｋｂの転写について０．５×１０＾－４又は１つの誤取込で、誤り率が非常に低い。ＲＮＡコピーは、二本鎖鋳型ＤＮＡ分子からのみ生成される。ＲＮＡポリメラーゼ断片長は、数百の塩基対から複数のキロベースにまで及び、最大３０キロベースの転写長さを報告した（Ｔ７ｒｉｂｏｍａｘ，Ｐｒｏｍｅｇａ）。マグネシウムがＲＮＡポリメラーゼ増幅のための緩衝液に必要とされている。

【0022】

インキュベーション時間は、使用されるプロモーター及びポリメラーゼによって変動する。Ｔ７ポリメラーゼを使用すると、インキュベーション時間は数分から２時間まで変動する。より長いインキュベーション時間は典型的に、結果としてより良い収量及び全体的なパフォーマンスをもたらす。インビトロの転写反応から結果として生じるＲＮＡは、ＤＮＡｓｅ又はエンドヌクレアーゼを使用するＤＮＡ分解を随意に介してＤＮＡサンプルから精製又は分離される。

【0023】

代替的に、ＤＮＡサンプルは分解されないままである。随意に、ＲＮＡフラグメントは選択された大きさである。インビトロの転写反応から生成されたＲＮＡ鋳型の下流処理は、穏やかなマグネシウム処理、物理的又は酵素的な手段を介して、随意に断片化される。短いＲＮＡフラグメントは、標準の小型ＲＮＡライブラリー調製技術を介してシーケンサーライブラリーへと随意に変換される。代替的に、長いＲＮＡ分子は、ポリＡポリメラーゼを介してポリアデニル化される。ポリアデニル化された長いＲＮＡ分子は、当該技術分野で既知の標準技術を介して逆転写される。ＳｕｐｅｒＳｃｒｉｐｔ（商標）などの逆転写酵素は、オリゴ（ｄ）Ｔプライマーと組み合わせて、長いポリＡ末端付加されたＲＮＡ分子から完全長のｃＤＮＡを効率的に生成することができる。ＲＮＡは随意に、ＲＮＡの消化を通じて逆転写されたＤＮＡ出力から除去される。単鎖の完全長の逆転写されたＤＮＡ分子はその後、標準アダプター連結反応を介してロングリードシーケンサーライブラリーへと変換され得る。

【0024】

本明細書中の開示と一致する反応における複数の工程での変更が考慮される。幾つかの変更において、ＣＲＩＳＰＲ／ＣＡＳ反応におけるドナーＤＮＡ分子は随意に、第２鎖ｃＤＮＡ合成のプライマー部位を含む（Ｔ７プロモーター配列に加えて）。これら実施形態において、ガイドＲＮＡ、加えてＣＲＩＳＰＲ／ＣＡＳ系は、ＰＡＭ配列の上流の標的部位で二本鎖切断部を作る。その後、ドナーＤＮＡ分子は、下流のユニバーサルプライマー部位でＴ７プロモーターを含む。例えば、幾つかの例において、ユニバーサルプライマー配列は、選択のシーケンサープラットフォームのための配列決定プライマー補体（ｓｅｑｕｅｎｃｉｎｇｐｒｉｍｅｒｃｏｍｐｌｉｍｅｎｔ）である。ＣＲＩＳＰＲ／ＣＡＳ反応におけるドナー分子の構築は、５’－Ｔ７のプロモーター－ユニバーサルプライマー配列－３’を含む。Ｔ７ポリメラーゼでのインビトロの転写は、Ｔ７プロモーター配列の３’Ｇから始まり、下流で及び標的ＤＮＡ配列を介してユニバーサルプライマー配列を転写する。ポリＡの付加後、オリゴ（ｄ）Ｔでプライミングした逆転写は、第１鎖のｃＤＮＡを作り出す時にユニバーサルプライマー配列を介して転写を行う。第２鎖のｃＤＮＡ合成は、ユニバーサルプライマー配列の逆補体プライマーを使用したプライマー伸長により達成される。ＮＧＳライブラリー変換に入るｃＤＮＡ分子の最終の構築は、それ故、５’－ユニバーサルプライマー－標的ＤＮＡ－ポリＡ－３’である。

【0025】

本明細書で考慮される代替的な方法において、ＣＲＩＳＰＲ／ＣＡＳ系は、標的部位に二本鎖の切断部を作る。二本鎖の切断部は、相補的配列を持つアダプター及び転写プロモーターがアニールする切断部位に単鎖ＤＮＡの粘着末端を作り出すエキソヌクレアーゼで処理され、扱われる。アニールされたアダプターは、サンプルＤＮＡにライゲートされ、サンプルＤＮＡのインビトロの転写のために準備されるプロモーター標的ＤＮＡハイブリッドを作り出す。この代替的な方法において、２つのレベルの特異性が、ＣＲＩＳＰＲ／ＣＡＳ配列に特異的な標的二本鎖ＤＮＡ切断に、及び、粘着末端を作り出したエキソヌクレアーゼのアダプターのアニーリングに導入される。随意に、アダプターは、それ自体の上で折り重なる部分及び標的とされた配列に相補的な配列を持つ第２部分を含む、ヘアピンである。ヘアピンアダプターは、改善された連結反応効率及び動態などの利点を有し得る。

【0026】

ドナーＤＮＡ分子におけるＴ７プロモーター配列（及び随意のユニバーサルプライマープライマー配列）の上流の分子バーコードの付加が、場合によって利用される。この例におけるドナーＤＮＡ配列の構築は、５’－Ｔ７プロモーター－ユニバーサルプライマー－Ｎ－ｍｅｒ－３’である。場合によっては、ＰＣＲ増幅は、シーケンサーライブラリー生成の材料の量を増大することを求められ、分子のバーコードの付加は、クローン的に増幅された長いＰＣＲ産物からの固有の分子の識別を可能にする。微小滴又は微小流体技術を介した超並列区画化を使用する単細胞の適用のために、分子バーコードは、区画の特定のバーコードと随意に置き換えられる。これにより、ＣＲＩＳＰＲ／ＣＡＳ標的挿入後のサンプルにおける全ての細胞のバルク処理が可能になり、且つ、与えられた単細胞からの配列決定された分子の固有の識別が可能になる。

【0027】

本明細書に示された手法は頻繁に、複数のリピートに隣接した核酸配列の標的とされた増幅を可能にする。故に、例えば、ゲノムなどの核酸サンプルの全体にわたる挿入部位の全体な分布を判定することができる。具体的に、ゲノムの可動因子の選択により、ゲノムにおける対象の反復要素のための挿入部位の総数の最大１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、又は１００％をも含む、可動因子が挿入される複数の領域を判定する。場合によっては、これら挿入部位の一部は、１０ｘ、１００ｘ、１０００ｘ、１００００ｘ、１０００００ｘ、１００００００ｘ、又はそれ以上に増幅される。このレベルに増幅された分画は、場合によっては挿入部位の総数の最大１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、又は１００％をも含む。

【0028】

故二本明細書に開示される方法の実施及び組成物の使用を介して、癌細胞又は癌細胞集団などの、対象の細胞又は細胞集団の全ゲノムにわたる可動リピート因子のための全体的な挿入パターンを判定することができる。更に、達成された高レベルの増幅を通じて、単細胞又は非常に小さな細胞集団を試験することができる。最終的に、増幅は多くの場合に、ＰＣＲを使用する指数的増幅の産物ではなく、サンプル鋳型から直接生成された線形増幅であるため、増幅は、点突然変異、又はライブラリー生成プロセスに従って生じる転座などの、誤差の任意の付随する増殖無しに遂行される。誤差が生じ得るが、それらはおそらく単一の産物に対し大いに固有なものであるため容易に認識される。更に、ＲＮＡ中間体を通じて増幅が生じるので、合成産物がサンプル又は別の増幅された産物へのアニーリングを行ない、且つ、更なる伸長、即ちサンプル自体における転座事象と区別するのが困難な現象をプライミングするリスクは無い。

【0029】

本明細書に開示される方法及び組成物の使用は、反復要素の他に平均の複雑性のＤＮＡ配列、例えばｍＲＮＡコーディング配列を含む、ゲノムにおける任意の標的部位にて配列を判定することを可能にする。従って、本明細書中の方法は、反復及び低複雑性のゲノム領域を配列決定することに限定されないが、ゲノムにおける任意の望ましい位置に適用することができる。

【0030】

本明細書に開示される方法の実施の結果、高度に増幅され、可動因子の総分布部位を高度に表し、且つ合成プロセスにおけるエラー伝搬に対する耐性が大きな、ライブラリーが得られる。

【0031】

マルチインサート（ｍｕｌｔｉ－ｉｎｓｅｒｔ）核酸を産生するための方法、組成物、及びキットが提供される。これらの方法、組成物、及びキットは、全ゲノム配列決定などの多くの用途での使用を見出す。本発明のこれら及び他の目的、利点、及び特徴は、以下により完全に記載されるような組成物と方法の詳細を読み込んだ後、当業者に明白となる。

【0032】

＜タグの標的化挿入＞
本明細書には、望ましい遺伝子位置にタグを挿入することによって望ましい遺伝子位置から配列を得る方法が開示される。場合によっては、タグは、遺伝子標的化技術、例えばＣＲＩＳＰＲ、ＴＡＬＥＮＳ、ジンクフィンガー、トランスポサーゼ、及び当業者に既知の他の方法を使用して、望ましい遺伝子位置に挿入される。タグは、望ましい遺伝子位置から増幅を可能にする配列を含むように設計される。タグは、望ましい増幅の方法に依存して選択される。場合によっては、望ましい遺伝子位置は転写により増幅される。望ましい遺伝子位置が転写により増幅されると、タグはプロモーター配列、例えば、Ｔ７、Ｔ３、ＳＰ６、又は他のバクテリオファージプロモーターなどのバクテリオファージプロモーターを含むように設計される。プロモーター配列は、場合によっては、ｐＬ、ＣＭＶ、ＳＶ４０、ＣａＭＶ３５Ｓ、又は他のウイルスプロモーターなどのウイルスプロモーターである。場合によっては、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、Ｕ６、又は他の哺乳動物プロモーターなどの哺乳動物プロモーターを使用することが望ましい。場合によっては、プロモーターはＲＮＡポリメラーゼＩプロモーターである。場合によっては、プロモーターはＲＮＡポリメラーゼＩＩプロモーターである。場合によっては、プロモーターはＲＮＡポリメラーゼＩＩＩプロモーターである。場合によっては、プロモーターはＲＮＡポリメラーゼＩＶプロモーターである。場合によっては、プロモーターはＲＮＡポリメラーゼＶプロモーターである。場合によっては、プロモーターは、単一のサブユニットＲＮＡポリメラーゼプロモーターである。

【0033】

配列を標的とするＣＲＩＳＰＲを含むタグは、限定されないが、以下から成る群を含む：ＡＣＴＡＧＡＡＡＡＴＣＴＡＧＡＡＧＡＡＡ（ＳＥＱＩＤＮＯ：５）、ＴＴＧＴＡＧＴＡＴＡＧＴＴＴＧＡＡＧＴＣ（ＳＥＱＩＤＮＯ：６）、ＡＡＡＡＣＣＣＴＡＧＡＡＧＡＡＡＡＣＣＴ（ＳＥＱＩＤＮＯ：７）、ＴＣＴＴＴＡＡＧＡＡＴＧＴＴＧＡＡＴＡＴ（ＳＥＱＩＤＮＯ：８）、ＡＣＡＧＣＣＡＡＴＡＴＣＡＴＡＣＴＧＡＡ（ＳＥＱＩＤＮＯ：９）、ＴＣＡＣＡＴＡＧＴＣＣＣＡＴＡＴＴＴＣＴ（ＳＥＱＩＤＮＯ：１０）、ＣＴＡＣＡＧＴＡＡＣＣＡＡＡＡＣＡＧＣＡ（ＳＥＱＩＤＮＯ：１１）、ＡＧＣＡＡＣＴＴＣＡＧＣＡＡＡＧＴＣＴＣ（ＳＥＱＩＤＮＯ：１２）、ＴＧＡＣＴＴＣＡＡＡＣＴＡＴＡＣＴＡＣＡ（ＳＥＱＩＤＮＯ：１３）、ＴＡＡＧＣＴＴＴＴＴＧＡＴＧＴＧＣＴＧＣ（ＳＥＱＩＤＮＯ：１４）、ＣＣＴＣＣＣＴＡＡＣＴＣＡＴＴＴＴＡＴＧ（ＳＥＱＩＤＮＯ：１５）、ＧＡＡＧＣＡＴＴＣＣＣＴＴＴＧＡＡＡＡＣ（ＳＥＱＩＤＮＯ：１６）、ＡＣＣＴＧＣＴＣＣＴＧＡＡＴＧＡＣＴＡＣ（ＳＥＱＩＤＮＯ：１７）、ＴＧＡＡＧＴＴＧＣＴＴＡＴＣＡＧＣＴＴＡ（ＳＥＱＩＤＮＯ：１８）、ＧＡＧＴＴＣＴＧＴＡＧＡＴＧＴＣＴＡＴＴ（ＳＥＱＩＤＮＯ：１９）、ＴＡＴＴＣＡＣＡＡＴＡＧＣＡＡＡＧＡＣＴ（ＳＥＱＩＤＮＯ：２０）、ＴＴＧＴＣＴＣＴＴＴＴＧＡＴＣＴＴＴＧＴ（ＳＥＱＩＤＮＯ：２１）、ＴＴＧＡＡＣＣＡＧＣＣＴＴＧＣＡＴＣＣＣ（ＳＥＱＩＤＮＯ：２２）、ＡＧＧＡＴＴＣＣＣＴＡＴＴＴＡＡＴＡＡＡ（ＳＥＱＩＤＮＯ：２３）、ＴＴＧＣＣＣＡＴＴＣＡＧＴＡＴＧＡＴＡＴ（ＳＥＱＩＤＮＯ：２４）、ＧＴＴＣＴＴＴＴＡＡＴＴＧＴＧＡＴＧＴＴ（ＳＥＱＩＤＮＯ：２５）、ＡＡＧＡＴＣＡＡＡＡＧＡＧＡＣＡＡＡＧＡ（ＳＥＱＩＤＮＯ：２６）、ＴＴＣＡＣＴＴＡＴＧＡＡＧＣＴＴＡＧＴＴ（ＳＥＱＩＤＮＯ：２７）、ＡＡＡＣＴＡＡＧＣＴＴＣＡＴＡＡＧＴＧＡ（ＳＥＱＩＤＮＯ：２８）、ＡＡＡＡＡＴＣＣＴＣＡＡＴＡＡＡＡＴＡＣ（ＳＥＱＩＤＮＯ：２９）、ＣＡＴＣＴＡＴＴＧＡＧＡＴＡＡＴＣＡＴＧ（ＳＥＱＩＤＮＯ：３０）、ＣＣＣＡＧＣＡＣＣＡＴＴＴＡＴＴＡＡＡＴ（ＳＥＱＩＤＮＯ：３１）、ＴＣＣＴＧＡＡＴＡＣＡＧＣＡＣＡＣＴＧＡ（ＳＥＱＩＤＮＯ：３２）、ＴＧＴＣＴＴＧＴＧＣＣＡＧＴＴＴＴＣＡＡ（ＳＥＱＩＤＮＯ：３３）、ＴＴＴＧＡＴＴＴＧＣＡＴＴＴＣＴＣＴＧＡ（ＳＥＱＩＤＮＯ：３４）、ＡＴＣＣＣＴＴＴＡＣＣＡＴＴＡＴＧＴＡＡ（ＳＥＱＩＤＮＯ：３５）、ＴＧＡＧＡＧＡＴＴＴＴＧＴＣＡＣＣＡＣＣ（ＳＥＱＩＤＮＯ：３６）、ＡＡＴＣＴＧＡＣＡＡＴＴＡＴＧＴＧＴＣＴ（ＳＥＱＩＤＮＯ：３７）、ＣＡＧＴＴＴＣＡＧＣＴＴＴＣＴＡＣＡＴＡ（ＳＥＱＩＤＮＯ：３８）、ＣＡＴＡＴＧＴＡＧＡＡＡＧＣＴＧＡＡＡＣ（ＳＥＱＩＤＮＯ：３９）、ＡＡＴＡＴＡＴＡＴＧＣＡＣＣＣＡＡＴＡＣ（ＳＥＱＩＤＮＯ：４０）、ＧＡＴＧＧＴＡＧＴＴＴＧＴＡＴＴＴＣＴＧ（ＳＥＱＩＤＮＯ：４１）、ＡＧＴＣＴＧＴＴＴＴＡＴＣＡＧＡＧＡＣＴ（ＳＥＱＩＤＮＯ：４２）、ＧＣＣＡＧＴＣＴＧＴＧＴＣＴＴＴＴＡＡＴ（ＳＥＱＩＤＮＯ：４３）、ＣＴＴＣＣＡＡＣＡＣＴＡＴＧＴＴＧＡＡＴ（ＳＥＱＩＤＮＯ：４４）、ＡＡＡＣＴＡＣＴＴＴＡＡＡＧＴＴＣＡＴＡ（ＳＥＱＩＤＮＯ：４５）、ＡＡＴＧＴＧＧＣＡＣＡＴＡＴＡＣＡＣＣＡ（ＳＥＱＩＤＮＯ：４６）、ＣＡＣＡＴＴＣＡＡＡＡＧＣＴＡＧＣＡＧＡ（ＳＥＱＩＤＮＯ：４７）、ＣＣＣＡＴＣＡＧＴＧＴＧＣＴＧＴＡＴＴＣ（ＳＥＱＩＤＮＯ：４８）、ＡＴＣＴＴＴＣＣＴＧＣＴＴＴＣＴＣＴＴＧ（ＳＥＱＩＤＮＯ：４９）、ＣＴＡＡＧＣＣＡＡＡＡＧＡＡＣＡＡＡＧＣ（ＳＥＱＩＤＮＯ：５０）、ＴＣＡＴＣＣＣＴＧＧＧＡＴＧＣＡＡＧＧＣ（ＳＥＱＩＤＮＯ：５１）、ＣＴＣＴＴＴＧＡＡＧＣＡＡＴＴＧＴＧＡＡ（ＳＥＱＩＤＮＯ：５２）、ＧＣＣＣＡＴＧＣＣＴＡＴＧＴＣＣＴＧＡＡ（ＳＥＱＩＤＮＯ：５３）、ＴＧＣＣＴＣＣＡＧＣＴＴＴＧＴＴＣＴＴＴ（ＳＥＱＩＤＮＯ：５４）、ＴＴＴＴＴＣＣＴＴＣＡＴＴＴＣＡＡＣＴＴ（ＳＥＱＩＤＮＯ：５５）、ＡＡＡＣＴＡＣＣＡＴＣＡＧＡＧＴＧＡＡＣ（ＳＥＱＩＤＮＯ：５６）、ＡＧＧＡＡＡＡＣＴＡＡＣＡＡＡＣＡＧＡＡ（ＳＥＱＩＤＮＯ：５７）、ＴＣＡＡＡＧＡＧＡＡＴＡＡＡＡＴＡＣＣＴ（ＳＥＱＩＤＮＯ：５８）、ＡＡＡＴＧＣＣＣＡＣＡＡＧＡＧＡＡＡＧＣ（ＳＥＱＩＤＮＯ：５９）、ＡＡＴＧＡＣＴＴＴＣＴＴＣＡＣＡＧＡＡＴ（ＳＥＱＩＤＮＯ：６０）、ＡＴＴＣＡＣＣＡＡＡＧＴＴＧＡＡＡＴＧＡ（ＳＥＱＩＤＮＯ：６１）、ＡＡＴＴＣＴＧＴＧＡＡＧＡＡＡＧＴＣＡＴ（ＳＥＱＩＤＮＯ：６２）、ＡＴＴＣＣＡＡＴＣＡＡＴＡＧＡＡＡＡＡＧ（ＳＥＱＩＤＮＯ：６３）、ＣＣＴＧＴＣＡＴＴＡＴＧＡＴＧＴＴＡＧＣ（ＳＥＱＩＤＮＯ：６４）、ＣＣＡＧＣＴＡＡＣＡＴＣＡＴＡＡＴＧＡＣ（ＳＥＱＩＤＮＯ：６５）、ＴＧＡＣＣＣＡＧＣＣＡＴＣＣＣＡＴＴＡＣ（ＳＥＱＩＤＮＯ：６６）、ＴＡＣＣＡＴＴＣＡＧＧＡＣＡＴＡＧＧＣＡ（ＳＥＱＩＤＮＯ：６７）、ＣＴＧＴＴＣＴＴＴＴＡＣＡＴＴＴＧＣＴＧ（ＳＥＱＩＤＮＯ：６８）、ＧＡＴＣＴＧＴＣＴＡＡＴＧＴＴＧＡＣＡＧ（ＳＥＱＩＤＮＯ：６９）、ＧＴＴＣＴＡＧＴＴＴＧＡＴＴＧＣＡＣＴＧ（ＳＥＱＩＤＮＯ：７０）、ＴＴＣＣＣＴＣＴＴＴＴＴＣＴＡＴＴＧＡＴ（ＳＥＱＩＤＮＯ：７１）、ＴＴＡＡＡＡＡＧＴＣＡＧＧＡＡＡＣＡＡＣ（ＳＥＱＩＤＮＯ：７２）、ＡＣＡＣＡＡＣＡＴＡＣＣＡＧＡＡＴＣＴＣ（ＳＥＱＩＤＮＯ：７３）、ＡＧＧＡＡＧＡＴＣＴＡＣＣＡＡＧＣＡＡＡ（ＳＥＱＩＤＮＯ：７４）、ＧＴＡＡＡＣＴＡＧＴＴＣＡＡＣＣＡＴＴＧ（ＳＥＱＩＤＮＯ：７５）、ＧＴＧＣＡＡＴＣＡＡＡＣＴＡＧＡＡＣＴＣ（ＳＥＱＩＤＮＯ：７６）、ＡＣＴＣＣＴＡＴＴＣＡＡＣＡＴＡＧＴＧＴ（ＳＥＱＩＤＮＯ：７７）、ＧＣＡＧＡＧＣＴＧＡＧＴＴＣＡＡＴＴＣＣ（ＳＥＱＩＤＮＯ：７８）、ＣＣＡＴＣＴＣＡＣＡＣＣＡＧＴＴＡＧＡＡ（ＳＥＱＩＤＮＯ：７９）、ＣＣＴＴＣＡＣＡＴＣＣＣＴＴＧＴＡＡＧＴ（ＳＥＱＩＤＮＯ：８０）、ＴＡＴＣＴＣＡＡＴＡＧＡＴＧＣＡＧＡＡＡ（ＳＥＱＩＤＮＯ：８１）、ＴＴＡＡＧＧＧＣＡＧＣＣＡＧＡＧＡＧＡＡ（ＳＥＱＩＤＮＯ：８２）、ＣＴＡＡＡＡＡＣＴＣＴＣＡＡＴＡＡＡＴＴ（ＳＥＱＩＤＮＯ：８３）、ＴＡＴＧＴＡＣＣＣＡＧＴＡＧＴＣＡＴＴＣ（ＳＥＱＩＤＮＯ：８４）、ＧＣＴＴＡＴＣＣＡＣＣＡＴＧＡＴＣＡＡＧ（ＳＥＱＩＤＮＯ：８５）、ＴＧＧＡＧＡＧＧＡＴＧＴＧＧＡＧＡＡＡＴ（ＳＥＱＩＤＮＯ：８６）、ＣＴＧＣＡＧＡＧＴＧＴＴＴＴＣＣＡＡＣＴ（ＳＥＱＩＤＮＯ：８７）、ＴＣＡＧＡＧＡＴＴＣＡＡＣＴＴＣＴＴＣＣ（ＳＥＱＩＤＮＯ：８８）、ＴＣＴＣＴＧＡＡＴＡＧＡＣＣＡＡＴＡＡＣ（ＳＥＱＩＤＮＯ：８９）、ＧＡＡＴＣＴＧＧＧＴＧＣＴＣＣＴＧＴＡＴ（ＳＥＱＩＤＮＯ：９０）、ＣＡＡＧＴＴＧＧＡＡＡＡＣＡＣＴＣＴＧＣ（ＳＥＱＩＤＮＯ：９１）、ＴＡＧＡＴＣＣＣＡＴＴＴＧＴＣＡＡＴＴＴ（ＳＥＱＩＤＮＯ：９２）、ＴＧＡＡＧＣＣＣＡＣＴＴＧＡＴＣＡＴＧＧ（ＳＥＱＩＤＮＯ：９３）、ＴＣＣＡＡＴＴＡＡＡＡＧＡＣＡＣＡＧＡＣ（ＳＥＱＩＤＮＯ：９４）、ＣＡＡＡＡＧＣＣＡＡＡＡＴＴＧＡＣＡＡＡ（ＳＥＱＩＤＮＯ：９５）、ＧＴＡＴＡＴＡＣＣＣＡＧＴＡＡＴＧＧＧＡ（ＳＥＱＩＤＮＯ：９６）、ＧＡＡＡＴＡＡＡＧＧＧＴＡＴＴＣＡＡＴＴ（ＳＥＱＩＤＮＯ：９７）、ＡＣＣＣＴＣＡＧＣＴＧＣＡＧＧＴＣＴＧＴ（ＳＥＱＩＤＮＯ：９８）、ＣＣＡＡＣＴＴＡＣＡＡＧＧＧＡＴＧＴＧＡ（ＳＥＱＩＤＮＯ：９９）、ＡＴＴＧＡＧＡＧＴＴＴＴＴＡＧＣＡＴＧＡ（ＳＥＱＩＤＮＯ：１００）、ＴＴＴＴＴＴＧＴＴＴＴＣＣＡＴＴＴＧＣＴ（ＳＥＱＩＤＮＯ：１０１）、ＴＣＴＣＴＴＣＡＡＡＧＣＴＧＴＣＡＧＡＣ（ＳＥＱＩＤＮＯ：１０２）、ＡＴＴＣＴＴＣＣＴＡＣＣＣＡＴＧＡＧＣＡ（ＳＥＱＩＤＮＯ：１０３）、ＡＡＣＡＣＴＴＴＴＡＣＡＣＴＧＴＴＧＧＴ（ＳＥＱＩＤＮＯ：１０４）、ＣＴＧＴＴＴＴＴＴＣＣＣＣＡＴＣＴＴＴＧ（ＳＥＱＩＤＮＯ：１０５）、ＣＡＡＡＣＡＡＣＣＣＣＡＴＣＡＡＡＡＡＧ（ＳＥＱＩＤＮＯ：１０６）、ＴＴＴＣＴＡＧＴＴＣＴＡＧＡＴＣＣＣＴＧ（ＳＥＱＩＤＮＯ：１０７）、ＡＧＡＡＣＴＴＣＣＣＣＡＡＴＣＴＡＧＣＡ（ＳＥＱＩＤＮＯ：１０８）、ＴＧＴＧＡＧＡＴＧＧＴＡＴＣＴＣＡＴＴＧ（ＳＥＱＩＤＮＯ：１０９）、ＴＴＴＧＡＧＴＴＣＡＴＴＧＴＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：１１０）、ＣＣＡＴＧＴＴＴＡＧＴＧＣＴＴＣＣＴＴＣ（ＳＥＱＩＤＮＯ：１１１）、ＣＡＧＴＣＴＧＡＧＡＴＣＡＡＡＣＴＧＣＡ（ＳＥＱＩＤＮＯ：１１２）、ＴＣＡＧＴＴＴＣＣＡＴＧＴＡＧＴＴＧＡＧ（ＳＥＱＩＤＮＯ：１１３）、ＴＴＡＡＴＣＣＡＧＴＣＴＡＴＣＡＴＴＧＴ（ＳＥＱＩＤＮＯ：１１４）、ＧＴＣＴＡＡＡＡＣＡＣＣＡＡＡＡＧＣＡＡ（ＳＥＱＩＤＮＯ：１１５）、ＴＧＣＣＣＴＡＡＡＡＧＡＧＣＴＣＣＴＧＡ（ＳＥＱＩＤＮＯ：１１６）、ＴＣＡＣＡＧＣＣＧＡＡＴＴＣＴＡＣＣＡＧ（ＳＥＱＩＤＮＯ：１１７）、ＡＡＴＧＴＣＣＡＡＣＡＡＴＧＡＴＡＧＡＣ（ＳＥＱＩＤＮＯ：１１８）、ＣＴＡＧＡＴＴＧＧＧＧＡＡＧＴＴＣＴＣＣ（ＳＥＱＩＤＮＯ：１１９）、ＴＴＣＴＴＴＡＴＴＡＧＴＣＴＴＧＣＴＡＧ（ＳＥＱＩＤＮＯ：１２０）、ＣＣＴＣＡＴＡＡＡＡＴＧＡＧＴＴＡＧＧＧ（ＳＥＱＩＤＮＯ：１２１）、ＧＡＡＡＡＡＡＴＧＣＴＣＡＴＣＡＴＣＡＣ（ＳＥＱＩＤＮＯ：１２２）、ＡＡＧＡＡＴＣＡＡＴＡＴＣＧＴＧＡＡＡＡ（ＳＥＱＩＤＮＯ：１２３）、ＧＧＴＴＴＧＣＣＡＧＴＡＴＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：１２４）、ＣＴＴＣＴＣＧＡＧＧＡＧＴＡＴＣＴＴＴＧ（ＳＥＱＩＤＮＯ：１２５）、ＴＴＡＡＴＧＡＴＴＧＣＣＡＴＴＣＴＡＡＣ（ＳＥＱＩＤＮＯ：１２６）、ＧＧＴＡＡＣＣＣＧＡＣＣＴＴＴＣＴＣＴＣ（ＳＥＱＩＤＮＯ：１２７）、ＡＡＣＡＡＡＧＣＣＴＣＣＡＡＧＡＡＡＴＡ（ＳＥＱＩＤＮＯ：１２８）、ＴＡＧＣＣＣＴＴＴＧＴＣＡＧＡＴＧＡＧＴ（ＳＥＱＩＤＮＯ：１２９）、ＴＡＡＡＣＡＴＧＧＡＡＡＧＧＡＡＣＡＡＣ（ＳＥＱＩＤＮＯ：１３０）、ＣＴＣＣＡＡＣＡＧＡＣＣＴＧＣＡＧＣＴＧ（ＳＥＱＩＤＮＯ：１３１）、ＧＡＴＧＡＧＴＴＣＡＴＧＴＣＣＴＴＴＧＴ（ＳＥＱＩＤＮＯ：１３２）、ＣＡＡＴＣＡＴＧＴＣＡＴＣＴＧＣＡＡＡＣ（ＳＥＱＩＤＮＯ：１３３）、ＣＴＣＴＴＴＴＡＧＧＧＣＡＧＧＣＣＴＧＧ（ＳＥＱＩＤＮＯ：１３４）、ＴＴＴＴＧＣＡＴＣＡＡＴＧＴＴＣＡＴＣＡ（ＳＥＱＩＤＮＯ：１３５）、ＣＡＴＧＡＡＣＴＣＡＴＣＡＴＴＴＴＴＴＡ（ＳＥＱＩＤＮＯ：１３６）、ＡＴＴＴＴＧＧＡＡＴＡＧＧＴＧＴＧＧＴＧ（ＳＥＱＩＤＮＯ：１３７）、ＡＡＧＴＴＣＴＧＧＣＣＡＧＧＧＣＡＡＴＣ（ＳＥＱＩＤＮＯ：１３８）、ＡＡＴＴＣＧＧＣＴＧＴＧＡＡＴＣＣＡＴＣ（ＳＥＱＩＤＮＯ：１３９）、ＧＴＧＧＡＧＣＣＣＡＣＣＡＣＡＧＣＴＣＡ（ＳＥＱＩＤＮＯ：１４０）、ＴＴＴＣＡＴＣＣＡＴＧＴＣＣＣＴＡＣＡＡ（ＳＥＱＩＤＮＯ：１４１）、ＡＡＡＡＣＡＧＡＧＡＴＡＴＡＧＡＴＣＡＡ（ＳＥＱＩＤＮＯ：１４２）、ＡＴＴＧＡＴＣＴＡＴＡＴＣＴＣＴＧＴＴＴ（ＳＥＱＩＤＮＯ：１４３）、ＴＡＡＡＡＴＣＡＧＡＧＣＡＧＡＡＣＴＧＡ（ＳＥＱＩＤＮＯ：１４４）、ＡＧＴＡＧＡＴＡＡＡＡＣＣＡＣＡＡＡＧＡ（ＳＥＱＩＤＮＯ：１４５）、ＧＡＡＣＴＡＣＡＡＡＣＣＡＣＴＧＣＴＣＡ（ＳＥＱＩＤＮＯ：１４６）、ＡＴＴＧＡＡＴＣＴＡＴＡＡＡＴＴＡＣＣＴ（ＳＥＱＩＤＮＯ：１４７）、ＡＧＴＣＡＧＴＧＴＧＧＣＧＡＴＴＣＣＴＣ（ＳＥＱＩＤＮＯ：１４８）、ＴＧＴＣＴＧＴＧＣＣＣＴＧＣＣＣＣＣＡＧ（ＳＥＱＩＤＮＯ：１４９）、ＣＧＣＣＡＣＡＣＴＧＡＣＴＴＣＣＡＣＡＡ（ＳＥＱＩＤＮＯ：１５０）、ＴＡＧＴＴＴＴＣＣＴＴＣＴＡＡＣＡＧＡＣ（ＳＥＱＩＤＮＯ：１５１）、ＡＡＡＴＧＴＡＴＡＴＴＣＴＧＴＴＧＡＴＴ（ＳＥＱＩＤＮＯ：１５２）、
ＣＴＡＣＴＴＴＴＧＧＴＣＴＴＴＧＡＴＧＡ（ＳＥＱＩＤＮＯ：１５３）、ＡＧＡＣＴＣＣＣＡＣＡＣＡＡＴＡＡＴＡＡ（ＳＥＱＩＤＮＯ：１５４）、ＧＡＡＧＣＣＣＡＴＣＡＧＡＣＴＡＡＣＡＧ（ＳＥＱＩＤＮＯ：１５５）、ＧＣＣＴＣＴＧＴＡＧＧＣＴＣＣＡＣＣＴＣ（ＳＥＱＩＤＮＯ：１５６）、ＴＧＧＡＧＣＣＴＡＣＡＧＡＧＧＣＡＧＧＣ（ＳＥＱＩＤＮＯ：１５７）、ＴＣＣＡＡＡＡＴＴＧＡＣＣＡＣＡＴＡＧＴ（ＳＥＱＩＤＮＯ：１５８）、ＧＡＴＴＴＣＴＧＣＡＴＴＴＣＣＡＴＣＴＧ（ＳＥＱＩＤＮＯ：１５９）、ＡＡＣＣＴＧＡＧＡＡＡＡＡＣＡＡＧＣＡＡ（ＳＥＱＩＤＮＯ：１６０）、ＴＡＴＴＴＣＣＴＧＡＡＴＴＴＧＡＡＴＧＴ（ＳＥＱＩＤＮＯ：１６１）、ＧＡＡＣＴＣＡＧＣＴＣＴＧＣＡＣＣＡＡＧ（ＳＥＱＩＤＮＯ：１６２）、ＣＡＡＴＡＣＡＧＡＧＡＡＧＴＧＣＴＴＡＡ（ＳＥＱＩＤＮＯ：１６３）、ＣＣＣＣＡＴＴＧＣＴＴＧＴＴＴＴＴＣＴＣ（ＳＥＱＩＤＮＯ：１６４）、ＴＴＡＣＣＡＡＣＣＡＡＡＡＡＧＡＧＴＣＣ（ＳＥＱＩＤＮＯ：１６５）、ＡＴＧＣＡＣＡＣＧＴＡＴＧＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：１６６）、ＣＣＴＴＴＣＡＡＡＡＡＡＣＣＡＧＣＴＣＣ（ＳＥＱＩＤＮＯ：１６７）、ＡＧＡＣＣＡＡＡＴＣＴＡＣＧＴＣＴＧＡＴ（ＳＥＱＩＤＮＯ：１６８）、ＣＴＴＴＡＡＧＣＡＣＴＴＣＴＣＴＧＴＡＴ（ＳＥＱＩＤＮＯ：１６９）、ＡＧＴＣＴＣＣＣＡＴＴＡＴＴＡＴＴＧＴＧ（ＳＥＱＩＤＮＯ：１７０）、ＡＴＡＣＡＡＡＡＡＴＴＡＡＴＴＣＡＡＧＡ（ＳＥＱＩＤＮＯ：１７１）、ＧＣＡＡＣＣＴＡＣＴＣＡＴＣＴＧＡＣＡＡ（ＳＥＱＩＤＮＯ：１７２）、ＴＡＡＴＧＣＣＴＡＧＧＴＴＴＴＣＴＴＣＴ（ＳＥＱＩＤＮＯ：１７３）、ＴＧＧＴＣＴＡＡＡＡＴＴＣＴＣＴＴＴＴＴ（ＳＥＱＩＤＮＯ：１７４）、ＡＧＴＣＴＣＴＴＴＧＴＡＧＧＴＣＡＣＴＣ（ＳＥＱＩＤＮＯ：１７５）、ＣＴＣＴＡＣＡＡＧＣＣＡＧＡＡＧＡＧＡＧ（ＳＥＱＩＤＮＯ：１７６）、ＡＣＡＣＣＡＡＴＣＡＧＡＣＧＴＡＧＡＴＴ（ＳＥＱＩＤＮＯ：１７７）、ＧＴＧＡＡＧＡＡＴＧＣＡＧＡＡＧＣＣＴＣ（ＳＥＱＩＤＮＯ：１７８）、ＣＴＴＧＡＡＴＴＡＡＴＴＴＴＴＧＴＡＴＡ（ＳＥＱＩＤＮＯ：１７９）、ＴＡＴＴＧＣＣＴＡＧＧＴＴＴＴＣＴＴＣＴ（ＳＥＱＩＤＮＯ：１８０）、ＧＡＣＡＧＣＴＴＴＧＡＡＧＡＧＡＧＣＡＧ（ＳＥＱＩＤＮＯ：１８１）、ＡＡＡＡＴＴＴＴＣＴＣＣＣＡＴＴＣＴＧＴ（ＳＥＱＩＤＮＯ：１８２）、ＣＣＡＧＴＴＣＣＴＣＣＴＴＧＴＡＣＣＴＣ（ＳＥＱＩＤＮＯ：１８３）、ＧＧＡＡＧＡＡＣＡＴＴＣＣＡＴＧＣＴＣＡ（ＳＥＱＩＤＮＯ：１８４）、ＧＡＡＴＧＴＡＴＡＴＴＣＴＧＴＴＧＡＴＴ（ＳＥＱＩＤＮＯ：１８５）、ＡＴＣＡＧＡＴＡＧＴＴＧＴＡＧＡＴＡＴＧ（ＳＥＱＩＤＮＯ：１８６）、ＴＡＡＧＡＴＣＡＧＡＧＣＡＧＡＡＣＴＧＡ（ＳＥＱＩＤＮＯ：１８７）、ＡＴＡＴＴＡＡＣＴＴＴＡＡＡＴＧＴＡＡＡ（ＳＥＱＩＤＮＯ：１８８）、ＧＣＡＴＴＴＴＴＴＣＡＴＧＴＧＴＴＴＴＴ（ＳＥＱＩＤＮＯ：１８９）、ＴＴＣＡＡＡＡＡＡＴＣＡＡＴＧＡＡＴＣＣ（ＳＥＱＩＤＮＯ：１９０）、ＣＡＣＣＣＴＣＣＣＡＡＧＡＣＴＡＡＡＣＣ（ＳＥＱＩＤＮＯ：１９１）、ＡＧＡＴＴＴＴＧＧＧＣＴＧＡＧＡＣＡＡＴ（ＳＥＱＩＤＮＯ：１９２）、ＣＡＣＴＣＴＣＣＣＡＡＧＡＣＴＡＡＡＣＣ（ＳＥＱＩＤＮＯ：１９３）、ＧＴＴＴＴＣＡＡＣＴＴＣＴＴＴＧＣＣＴＴ（ＳＥＱＩＤＮＯ：１９４）、ＴＡＴＧＴＡＴＡＣＡＴＧＴＧＣＣＡＴＧＣ（ＳＥＱＩＤＮＯ：１９５）、ＣＡＣＴＡＧＧＧＡＧＴＧＣＣＡＧＡＣＡＧ（ＳＥＱＩＤＮＯ：１９６）、ＡＴＣＡＴＣＣＴＧＡＴＡＣＣＡＡＡＧＣＣ（ＳＥＱＩＤＮＯ：１９７）、ＧＴＧＴＧＴＣＴＣＴＧＣＡＣＧＴＧＡＧＡ（ＳＥＱＩＤＮＯ：１９８）、ＴＴＴＣＴＡＧＴＴＴＡＴＴＴＧＣＧＴＡＧ（ＳＥＱＩＤＮＯ：１９９）、ＧＡＴＴＴＣＴＧＣＡＴＴＴＣＣＡＡＣＴＧ（ＳＥＱＩＤＮＯ：２００）、ＴＣＴＴＴＴＡＴＴＴＣＣＴＴＧＡＧＣＡＧ（ＳＥＱＩＤＮＯ：２０１）、ＴＣＡＣＧＴＧＣＡＧＡＧＡＣＡＣＡＣＡＴ（ＳＥＱＩＤＮＯ：２０２）、ＣＡＣＴＣＣＡＧＡＣＣＣＴＧＴＴＴＧＣＣ（ＳＥＱＩＤＮＯ：２０３）、ＡＴＡＴＴＡＡＣＣＴＴＡＡＡＴＧＴＡＡＡ（ＳＥＱＩＤＮＯ：２０４）、ＣＡＧＣＡＴＴＴＧＣＴＴＧＴＣＴＧＴＡＡ（ＳＥＱＩＤＮＯ：２０５）、ＧＡＧＡＴＣＣＧＣＴＧＴＴＡＧＴＣＴＧＡ（ＳＥＱＩＤＮＯ：２０６）、ＣＡＧＣＡＴＧＡＴＴＴＡＴＡＧＴＣＣＴＴ（ＳＥＱＩＤＮＯ：２０７）、ＣＣＣＴＡＣＡＡＧＣＣＡＧＡＡＧＡＧＡＧ（ＳＥＱＩＤＮＯ：２０８）、ＡＴＡＣＡＡＡＡＡＴＣＡＡＴＴＣＡＡＧＡ（ＳＥＱＩＤＮＯ：２０９）、ＡＴＴＴＡＧＣＣＣＡＴＴＴＡＣＡＴＴＴＡ（ＳＥＱＩＤＮＯ：２１０）、ＴＴＴＴＴＴＧＴＴＧＴＧＴＣＴＣＴＧＣＣ（ＳＥＱＩＤＮＯ：２１１）、ＡＧＧＧＧＴＣＡＧＧＧＡＣＣＣＡＣＴＴＧ（ＳＥＱＩＤＮＯ：２１２）、ＴＴＴＣＴＡＧＴＴＴＡＴＴＴＧＣＡＴＡＧ（ＳＥＱＩＤＮＯ：２１３）、ＣＴＴＧＡＡＴＴＧＡＴＴＴＴＴＧＴＡＴＡ（ＳＥＱＩＤＮＯ：２１４）、ＴＧＡＡＴＧＴＧＴＣＣＣＡＧＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：２１５）、ＡＡＡＡＴＴＴＴＣＴＣＣＣＡＴＴＴＴＧＴ（ＳＥＱＩＤＮＯ：２１６）、ＴＧＴＴＧＴＧＴＣＴＴＴＧＴＴＣＴＣＧＴ（ＳＥＱＩＤＮＯ：２１７）、ＡＧＣＡＡＡＧＣＣＴＣＣＡＡＧＡＡＡＴＡ（ＳＥＱＩＤＮＯ：２１８）、ＡＡＧＴＴＣＴＧＧＣＣＡＧＧＧＣＡＡＴＴ（ＳＥＱＩＤＮＯ：２１９）、ＡＴＴＧＡＡＴＣＴＧＴＡＡＡＴＴＡＣＣＴ（ＳＥＱＩＤＮＯ：２２０）、ＡＧＡＣＴＣＣＣＡＣＡＣＡＴＴＡＡＴＡＡ（ＳＥＱＩＤＮＯ：２２１）、ＣＣＡＴＴＣＴＣＣＣＣＡＴＣＡＣＴＴＴＣ（ＳＥＱＩＤＮＯ：２２２）、ＧＣＴＣＴＣＴＧＴＴＴＧＴＣＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：２２３）、ＡＧＴＣＴＣＣＣＡＴＴＡＴＴＡＡＴＧＴＧ（ＳＥＱＩＤＮＯ：２２４）、ＧＴＡＣＡＧＡＴＧＧＧＴＴＴＴＴＧＧＴＧ（ＳＥＱＩＤＮＯ：２２５）、ＴＧＣＣＴＣＣＣＡＧＴＴＡＧＧＣＴＧＣＴ（ＳＥＱＩＤＮＯ：２２６）、ＣＣＣＡＣＴＣＴＣＴＴＣＴＧＧＣＴＴＧＴ（ＳＥＱＩＤＮＯ：２２７）、ＧＣＴＧＡＴＧＧＡＧＣＴＧＡＡＡＡＣＣＡ（ＳＥＱＩＤＮＯ：２２８）、ＡＣＴＣＣＣＴＡＧＴＧＡＧＡＴＧＡＡＣＣ（ＳＥＱＩＤＮＯ：２２９）、ＴＴＣＡＡＡＡＡＡＴＴＡＡＴＧＡＡＴＣＣ（ＳＥＱＩＤＮＯ：２３０）、ＣＡＣＣＴＡＴＧＡＧＴＧＡＧＡＡＴＡＴＧ（ＳＥＱＩＤＮＯ：２３１）、ＡＣＡＴＴＣＡＡＡＧＣＡＧＴＧＴＧＴＡＧ（ＳＥＱＩＤＮＯ：２３２）、ＡＡＣＡＴＴＣＣＡＴＧＣＴＣＡＴＧＧＧＴ（ＳＥＱＩＤＮＯ：２３３）、ＣＴＴＣＴＣＣＴＧＣＣＴＡＡＴＴＧＣＣＣ（ＳＥＱＩＤＮＯ：２３４）、ＴＴＴＧＴＴＴＡＣＣＴＡＡＧＣＡＡＧＣＣ（ＳＥＱＩＤＮＯ：２３５）、ＴＣＴＴＴＴＡＴＴＴＣＡＴＴＧＡＧＣＡＧ（ＳＥＱＩＤＮＯ：２３６）、ＡＣＴＧＣＴＣＡＡＴＧＡＡＡＴＡＡＡＡＧ（ＳＥＱＩＤＮＯ：２３７）、ＣＣＴＧＡＡＡＧＴＧＡＴＧＧＧＧＡＧＡＡ（ＳＥＱＩＤＮＯ：２３８）、ＴＡＧＴＴＴＴＣＣＴＴＣＴＡＡＣＡＧＴＣ（ＳＥＱＩＤＮＯ：２３９）、ＡＴＴＴＴＧＧＣＡＴＧＡＴＴＴＴＧＣＡＧ（ＳＥＱＩＤＮＯ：２４０）、ＣＴＴＴＧＧＴＴＣＴＧＴＴＴＡＴＡＴＧＣ（ＳＥＱＩＤＮＯ：２４１）、ＧＡＣＡＣＡＡＴＡＡＡＡＡＡＴＧＡＴＡＡ（ＳＥＱＩＤＮＯ：２４２）、ＴＴＴＣＴＴＣＣＡＧＴＴＧＡＴＣＧＣＡＴ（ＳＥＱＩＤＮＯ：２４３）、ＣＴＴＴＴＣＡＡＡＡＡＡＣＣＡＧＣＴＣＣ（ＳＥＱＩＤＮＯ：２４４）、ＴＴＣＡＣＧＴＡＧＴＴＣＴＣＧＡＧＣＣＴ（ＳＥＱＩＤＮＯ：２４５）、ＧＡＧＣＧＣＣＴＣＴＣＣＴＣＣＴＣＣＡＡ（ＳＥＱＩＤＮＯ：２４６）、ＴＣＡＧＡＴＣＴＣＣＡＧＣＴＧＣＧＴＧＣ（ＳＥＱＩＤＮＯ：２４７）、ＡＡＴＴＧＡＡＣＡＡＴＧＡＧＡＡＣＡＣＡ（ＳＥＱＩＤＮＯ：２４８）、ＡＴＧＡＡＴＧＡＡＡＴＧＡＡＧＣＧＡＧＡ（ＳＥＱＩＤＮＯ：２４９）、ＣＡＧＴＴＴＣＴＴＣＣＴＡＧＴＣＴＣＧＡ（ＳＥＱＩＤＮＯ：２５０）、ＣＡＣＣＧＣＡＴＡＴＴＣＴＣＡＣＴＣＡＴ（ＳＥＱＩＤＮＯ：２５１）、ＣＴＣＡＡＡＡＣＣＧＣＴＣＡＡＣＴＡＣＡ（ＳＥＱＩＤＮＯ：２５２）、ＴＣＣＡＣＣＣＡＧＴＴＣＧＡＧＣＴＴＣＣ（ＳＥＱＩＤＮＯ：２５３）、ＴＧＴＴＧＴＧＴＣＴＴＴＧＴＴＣＴＣＡＴ（ＳＥＱＩＤＮＯ：２５４）、ＧＡＴＧＣＧＡＴＣＡＡＣＴＧＧＡＡＧＡＡ（ＳＥＱＩＤＮＯ：２５５）、ＧＴＡＣＣＡＧＴＡＣＣＡＴＧＣＴＧＴＴＴ（ＳＥＱＩＤＮＯ：２５６）、ＡＡＡＡＡＡＣＡＧＡＧＣＡＧＡＡＡＡＡＣ（ＳＥＱＩＤＮＯ：２５７）、ＣＴＴＴＧＧＴＡＴＣＡＧＧＡＴＧＡＴＧＣ（ＳＥＱＩＤＮＯ：２５８）、ＡＡＡＡＡＡＣＡＧＡＡＣＡＧＡＡＡＡＡＣ（ＳＥＱＩＤＮＯ：２５９）、ＧＴＧＣＴＴＴＡＣＴＴＣＣＡＡＣＴＡＴＧ（ＳＥＱＩＤＮＯ：２６０）、ＴＡＧＡＴＡＡＡＡＣＣＡＣＡＡＡＧＡＴＧ（ＳＥＱＩＤＮＯ：２６１）、ＴＧＡＣＣＣＣＣＧＡＧＣＡＧＣＣＴＡＡＣ（ＳＥＱＩＤＮＯ：２６２）、ＡＡＴＴＴＧＧＣＡＴＧＴＴＴＴＴＧＣＡＧ（ＳＥＱＩＤＮＯ：２６３）、ＴＡＡＡＡＧＡＧＧＡＴＡＣＡＡＡＣＡＡＡ（ＳＥＱＩＤＮＯ：２６４）、ＧＣＡＴＴＣＡＡＡＧＣＡＧＴＧＴＧＴＡＧ（ＳＥＱＩＤＮＯ：２６５）、ＧＡＧＧＡＡＣＴＧＣＧＴＴＣＣＴＴＴＧＧ（ＳＥＱＩＤＮＯ：２６６）、ＴＴＴＧＡＣＧＡＧＣＴＧＡＧＡＧＡＡＧＡ（ＳＥＱＩＤＮＯ：２６７）、ＣＴＴＴＧＧＴＡＴＣＡＧＡＡＴＧＡＴＧＣ（ＳＥＱＩＤＮＯ：２６８）、ＡＴＴＣＴＴＣＣＴＡＴＣＣＡＴＧＡＧＣＡ（ＳＥＱＩＤＮＯ：２６９）、ＴＣＣＣＴＴＴＣＣＴＡＧＴＣＡＡＡＧＡＡ（ＳＥＱＩＤＮＯ：２７０）、ＡＡＡＡＣＡＧＡＧＡＴＡＴＡＧＡＣＣＡＡ（ＳＥＱＩＤＮＯ：２７１）、ＣＴＴＣＴＣＣＴＧＣＣＴＧＡＴＴＧＣＣＣ（ＳＥＱＩＤＮＯ：２７２）、ＴＧＧＧＡＧＴＧＡＣＣＣＧＡＴＴＴＴＣＣ（ＳＥＱＩＤＮＯ：２７３）、ＡＴＧＴＡＡＡＧＡＣＣＡＴＣＧＡＧＡＣＴ（ＳＥＱＩＤＮＯ：２７４）、ＣＣＡＴＴＣＴＣＣＣＣＧＴＣＡＣＴＴＴＣ（ＳＥＱＩＤＮＯ：２７５）、ＴＣＡＣＣＡＴＣＡＴＣＡＡＡＧＡＣＣＡＡ（ＳＥＱＩＤＮＯ：２７６）、ＡＴＴＡＴＴＡＴＡＣＴＴＴＡＡＧＴＴＴＴ（ＳＥＱＩＤＮＯ：２７７）、ＴＣＡＡＴＴＴＣＡＧＡＧＣＣＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：２７８）、ＧＣＴＣＴＣＴＧＴＴＴＧＴＣＴＧＴＴＧＴ（ＳＥＱＩＤＮＯ：２７９）、ＡＡＣＧＡＧＡＣＡＧＡＡＡＧＴＣＡＡＣＡ（ＳＥＱＩＤＮＯ：２８０）、ＣＡＧＣＡＴＧＡＴＴＴＡＴＡＡＴＣＣＴＴ（ＳＥＱＩＤＮＯ：２８１）、ＧＡＴＣＡＡＡＴＴＡＣＴＣＴＧＡＧＣＴＡ（ＳＥＱＩＤＮＯ：２８２）、ＧＡＴＧＣＡＡＴＡＡＡＡＡＡＴＧＡＴＡＡ（ＳＥＱＩＤＮＯ：２８３）、ＣＴＴＴＧＧＣＴＣＴＧＴＴＴＡＴＡＴＧＣ（ＳＥＱＩＤＮＯ：２８４）、ＴＧＴＣＡＣＣＣＣＴＴＴＣＴＴＴＧＡＣＴ（ＳＥＱＩＤＮＯ：２８５）、ＧＧＴＣＡＧＧＧＡＣＣＣＡＣＴＴＧＡＧＧ（ＳＥＱＩＤＮＯ：２８６）、ＣＴＣＴＧＡＧＡＣＡＡＡＡＣＴＴＣＣＡＧ（ＳＥＱＩＤＮＯ：２８７）、ＣＴＧＧＣＣＴＣＡＴＡＡＡＡＴＧＡＧＴＴ（ＳＥＱＩＤＮＯ：２８８）、ＣＴＴＣＡＴＣＣＡＴＧＴＣＣＣＴＡＣＡＡ（ＳＥＱＩＤＮＯ：２８９）、ＣＣＴＧＡＡＡＧＴＧＡＣＧＧＧＧＡＧＡＡ（ＳＥＱＩＤＮＯ：２９０）、ＣＡＣＣＴＡＴＧＡＧＴＧＡＧＡＡＣＡＴＧ（ＳＥＱＩＤＮＯ：２９１）、ＴＡＴＴＴＣＣＴＧＡＡＴＣＴＧＡＡＣＧＴ（ＳＥＱＩＤＮＯ：２９２）、ＡＧＧＡＧＣＣＡＡＧＡＴＧＧＣＣＧＡＡＴ（ＳＥＱＩＤＮＯ：２９３）、ＡＡＧＡＡＴＣＡＡＴＡＴＣＡＴＧＡＡＡＡ（ＳＥＱＩＤＮＯ：２９４）、ＧＣＣＡＴＴＧＣＣＣＡＧＧＣＴＴＧＣＴＴ（ＳＥＱＩＤＮＯ：２９５）、ＣＧＣＡＧＣＴＧＧＡＧＡＴＣＴＧＡＧＡＡ（ＳＥＱＩＤＮＯ：２９６）、ＡＡＴＴＧＡＡＣＡＡＴＧＡＧＡＴＣＡＣＡ（ＳＥＱＩＤＮＯ：２９７）、ＣＡＡＴＣＡＴＧＴＣＧＴＣＴＧＣＡＡＡＣ（ＳＥＱＩＤＮＯ：２９８）、ＡＧＡＣＣＧＧＡＧＣＴ
ＧＴＴＣＣＴＡＴＴ（ＳＥＱＩＤＮＯ：２９９）、ＴＡＴＴＴＣＣＴＧＡＡＴＣＴＧＡＡＴＧＴ（ＳＥＱＩＤＮＯ：３００）、ＴＧＣＣＴＴＡＣＡＡＧＡＧＣＴＣＣＴＧＡ（ＳＥＱＩＤＮＯ：３０１）、ＴＴＧＧＧＡＧＡＧＴＧＴＡＴＧＴＧＴＣＧ（ＳＥＱＩＤＮＯ：３０２）、ＧＧＡＡＧＧＧＧＡＡＣＡＴＣＡＣＡＣＴＣ（ＳＥＱＩＤＮＯ：３０３）、ＴＡＡＡＴＧＴＧＴＣＣＣＡＧＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：３０４）、ＡＧＧＴＧＴＣＡＧＴＧＴＧＣＣＣＣＴＧＣ（ＳＥＱＩＤＮＯ：３０５）、ＴＴＡＧＧＡＴＴＧＡＣＴＴＧＧＣＧＡＴＧ（ＳＥＱＩＤＮＯ：３０６）、ＴＴＣＣＡＡＣＡＧＡＣＣＴＧＣＡＧＣＴＧ（ＳＥＱＩＤＮＯ：３０７）、ＡＡＣＣＴＧＡＣＡＡＡＡＡＣＡＡＧＣＡＡ（ＳＥＱＩＤＮＯ：３０８）、ＴＡＴＧＴＡＴＡＣＡＴＧＴＧＣＣＡＴＧＴ（ＳＥＱＩＤＮＯ：３０９）、ＡＡＣＣＴＧＡＣＡＡＡＡＡＣＡＡＧＡＡＡ（ＳＥＱＩＤＮＯ：３１０）、ＴＴＡＡＴＧＡＴＣＧＣＣＡＴＴＣＴＡＡＣ（ＳＥＱＩＤＮＯ：３１１）、ＧＴＣＣＴＴＣＧＣＣＣＡＣＴＴＴＴＴＧＡ（ＳＥＱＩＤＮＯ：３１２）、ＴＣＣＡＡＡＡＴＴＧＡＣＣＡＣＡＴＡＣＴ（ＳＥＱＩＤＮＯ：３１３）、ＡＧＡＴＴＴＴＧＧＧＣＴＧＡＧＡＣＧＡＴ（ＳＥＱＩＤＮＯ：３１４）、ＴＧＡＡＴＧＣＧＴＣＣＣＡＧＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：３１５）、ＡＧＡＣＴＧＧＡＧＣＴＧＴＴＣＣＴＡＴＴ（ＳＥＱＩＤＮＯ：３１６）、ＡＴＡＣＴＡＴＧＣＡＧＣＣＡＴＡＡＡＡＡ（ＳＥＱＩＤＮＯ：３１７）、ＧＧＧＣＡＧＡＣＴＧＡＣＡＣＣＴＣＡＣＡ（ＳＥＱＩＤＮＯ：３１８）、ＡＴＣＣＴＴＴＧＣＣＣＡＣＴＴＴＴＴＧＡ（ＳＥＱＩＤＮＯ：３１９）、ＧＧＡＡＧＧＧＧＡＡＴＡＴＣＡＣＡＣＴＣ（ＳＥＱＩＤＮＯ：３２０）、ＡＣＧＣＡＧＴＴＣＣＴＣＡＣＣＡＧＣＡＡ（ＳＥＱＩＤＮＯ：３２１）、ＡＡＴＧＣＴＡＧＡＴＧＡＣＧＡＧＴＴＡＧ（ＳＥＱＩＤＮＯ：３２２）、ＧＡＣＡＧＣＴＴＴＧＡＡＧＡＧＡＧＴＡＧ（ＳＥＱＩＤＮＯ：３２３）、ＧＡＧＣＴＴＴＡＣＴＴＣＣＡＡＣＴＡＴＧ（ＳＥＱＩＤＮＯ：３２４）、ＣＡＴＧＡＡＣＴＣＡＴＣＣＴＴＴＴＴＴＡ（ＳＥＱＩＤＮＯ：３２５）、ＣＴＡＡＣＴＣＧＴＣＡＴＣＴＡＧＣＡＴＴ（ＳＥＱＩＤＮＯ：３２６）、ＡＴＣＣＡＧＣＴＴＴＧＴＴＣＣＧＴＴＧＣ（ＳＥＱＩＤＮＯ：３２７）、ＡＧＴＣＴＣＴＴＴＧＴＡＧＧＴＣＴＣＴＡ（ＳＥＱＩＤＮＯ：３２８）、ＣＣＡＴＧＴＴＴＡＧＣＧＣＴＴＣＣＴＴＣ（ＳＥＱＩＤＮＯ：３２９）、ＣＣＣＣＡＴＴＧＣＴＴＧＴＴＴＴＴＧＴＣ（ＳＥＱＩＤＮＯ：３３０）、ＧＡＧＣＴＴＴＡＣＴＴＣＣＡＡＧＴＡＴＧ（ＳＥＱＩＤＮＯ：３３１）、ＧＡＣＧＣＡＡＴＡＡＡＡＡＡＴＧＡＴＡＡ（ＳＥＱＩＤＮＯ：３３２）、ＣＴＡＧＧＴＴＧＧＧＧＡＡＧＴＴＣＴＣＣ（ＳＥＱＩＤＮＯ：３３３）、ＡＴＣＡＧＡＴＧＧＴＴＧＴＡＧＡＴＧＴＧ（ＳＥＱＩＤＮＯ：３３４）、ＣＣＣＣＡＴＴＴＣＴＴＧＴＴＴＴＴＧＴＣ（ＳＥＱＩＤＮＯ：３３５）、ＧＧＧＣＡＣＡＣＴＧＡＣＡＣＣＴＣＡＣＡ（ＳＥＱＩＤＮＯ：３３６）、ＣＴＡＣＣＴＴＴＧＧＴＣＴＴＴＧＡＴＧＡ（ＳＥＱＩＤＮＯ：３３７）、ＧＡＣＴＡＡＡＡＣＡＣＣＡＡＡＡＧＣＡＡ（ＳＥＱＩＤＮＯ：３３８）、ＴＴＴＣＴＡＧＴＴＣＴＡＧＡＴＣＣＴＴＧ（ＳＥＱＩＤＮＯ：３３９）、ＧＡＡＡＡＡＡＴＧＣＴＣＡＣＣＡＴＣＡＣ（ＳＥＱＩＤＮＯ：３４０）、ＴＴＡＧＧＡＴＴＧＡＣＴＴＧＧＣＡＡＴＧ（ＳＥＱＩＤＮＯ：３４１）、ＴＴＴＴＧＴＣＴＣＡＧＡＧＧＡＧＴＡＣＣ（ＳＥＱＩＤＮＯ：３４２）、ＡＣＡＴＴＴＡＡＡＧＣＡＧＴＧＴＧＴＡＧ（ＳＥＱＩＤＮＯ：３４３）、ＣＣＡＧＣＴＣＣＴＣＣＴＴＧＴＡＣＣＴＣ（ＳＥＱＩＤＮＯ：３４４）、ＣＴＣＴＴＧＴＡＡＧＧＣＡＧＧＣＣＴＧＧ（ＳＥＱＩＤＮＯ：３４５）、ＧＡＧＡＴＣＴＧＣＴＧＴＴＡＧＴＣＴＧＡ（ＳＥＱＩＤＮＯ：３４６）、ＧＡＧＡＴＣＡＧＣＴＧＴＴＡＧＴＣＴＧＡ（ＳＥＱＩＤＮＯ：３４７）、ＡＧＧＧＣＴＣＴＧＴＴＣＴＧＴＴＣＣＡＴ（ＳＥＱＩＤＮＯ：３４８）、ＡＡＣＧＡＧＡＣＡＧＡＡＡＧＴＴＡＡＣＡ（ＳＥＱＩＤＮＯ：３４９）、ＣＴＡＡＧＣＡＡＡＡＡＧＡＡＣＡＡＡＧＣ（ＳＥＱＩＤＮＯ：３５０）、ＴＴＴＴＴＣＣＴＴＣＡＴＴＴＣＡＡＣＣＴ（ＳＥＱＩＤＮＯ：３５１）、ＣＣＡＧＣＴＣＣＴＣＴＴＴＧＴＡＣＣＴＣ（ＳＥＱＩＤＮＯ：３５２）、ＧＴＴＣＴＡＡＴＴＴＧＡＴＴＧＣＡＣＴＧ（ＳＥＱＩＤＮＯ：３５３）、ＡＡＧＡＡＴＣＡＡＴＡＴＴＧＴＧＡＡＡＡ（ＳＥＱＩＤＮＯ：３５４）、ＧＴＧＣＡＡＴＣＡＡＡＴＴＡＧＡＡＣＴＣ（ＳＥＱＩＤＮＯ：３５５）、ＡＧＣＧＴＧＡＧＣＧＡＣＧＣＡＧＡＡＧＡ（ＳＥＱＩＤＮＯ：３５６）、ＴＴＴＧＡＣＧＡＧＴＴＧＡＧＡＧＡＡＧＡ（ＳＥＱＩＤＮＯ：３５７）、ＣＡＡＡＡＧＡＣＡＡＡＡＴＴＧＡＣＡＡＡ（ＳＥＱＩＤＮＯ：３５８）、ＣＡＴＣＡＴＴＣＴＧＡＴＡＣＣＡＡＡＧＣ（ＳＥＱＩＤＮＯ：３５９）、ＣＡＧＣＴＴＴＧＴＴＣＴＴＴＴＴＧＣＴＴ（ＳＥＱＩＤＮＯ：３６０）、ＴＣＴＴＴＴＧＴＴＧＣＣＡＴＴＧＣＴＴＴ（ＳＥＱＩＤＮＯ：３６１）、ＧＡＣＴＧＴＴＧＴＧＧＧＧＴＧＧＧＧＧＧ（ＳＥＱＩＤＮＯ：３６２）、ＧＴＧＴＧＴＣＴＣＴＧＣＡＴＧＴＧＡＧＡ（ＳＥＱＩＤＮＯ：３６３）、ＴＡＴＴＴＡＣＣＣＡＧＴＡＧＴＣＡＴＴＣ（ＳＥＱＩＤＮＯ：３６４）、ＴＣＡＣＡＧＣＣＡＡＡＴＴＣＴＡＣＣＡＧ（ＳＥＱＩＤＮＯ：３６５）、ＧＴＣＴＴＣＴＧＣＧＴＣＧＣＴＣＡＣＧＣ（ＳＥＱＩＤＮＯ：３６６）、ＣＴＣＡＡＡＡＣＣＡＣＴＣＡＡＣＴＡＣＡ（ＳＥＱＩＤＮＯ：３６７）、ＴＴＴＣＴＣＴＴＧＣＣＴＧＡＴＴＧＣＣＣ（ＳＥＱＩＤＮＯ：３６８）、ＡＣＡＡＴＴＴＣＡＧＣＴＣＣＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：３６９）、ＡＧＴＴＴＧＣＣＡＧＴＡＴＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：３７０）、ＣＴＡＡＡＡＡＣＴＣＴＣＡＡＴＡＡＡＣＴ（ＳＥＱＩＤＮＯ：３７１）、ＡＧＡＡＣＴＴＣＣＣＣＡＡＣＣＴＡＧＣＡ（ＳＥＱＩＤＮＯ：３７２）、ＴＴＴＣＴＡＧＴＴＴＡＴＴＴＧＴＧＴＡＧ（ＳＥＱＩＤＮＯ：３７３）、ＴＴＧＧＧＡＧＧＧＴＧＴＡＴＧＴＧＴＣＣ（ＳＥＱＩＤＮＯ：３７４）、ＣＡＡＴＧＣＡＧＡＧＡＡＧＴＣＣＴＴＡＡ（ＳＥＱＩＤＮＯ：３７５）、ＡＣＣＴＡＣＴＣＡＡＧＣＣＴＣＡＧＣＡＡ（ＳＥＱＩＤＮＯ：３７６）、ＴＣＡＣＡＴＧＣＡＧＡＧＡＣＡＣＡＣＡＴ（ＳＥＱＩＤＮＯ：３７７）、ＧＡＧＣＡＣＣＴＣＴＣＣＴＣＣＴＣＣＡＡ（ＳＥＱＩＤＮＯ：３７８）、ＴＣＣＣＴＴＴＣＣＧＡＧＴＣＡＡＡＧＡＡ（ＳＥＱＩＤＮＯ：３７９）、ＣＧＧＣＡＧＣＧＡＧＧＣＴＧＧＧＧＧＡＧ（ＳＥＱＩＤＮＯ：３８０）、ＧＴＣＣＡＡＡＡＣＡＣＣＡＡＡＡＧＣＡＡ（ＳＥＱＩＤＮＯ：３８１）、ＧＣＡＴＴＴＴＴＴＣＡＴＧＴＧＴＣＴＧＴ（ＳＥＱＩＤＮＯ：３８２）、ＣＡＴＣＡＴＣＣＴＧＡＴＡＣＣＡＡＡＧＣ（ＳＥＱＩＤＮＯ：３８３）、ＣＣＣＡＡＴＴＡＡＡＡＧＡＣＡＣＡＧＡＣ（ＳＥＱＩＤＮＯ：３８４）、ＡＣＡＡＴＴＴＣＡＧＡＴＣＣＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：３８５）、ＴＣＡＣＡＧＣＴＧＡＡＴＴＣＴＡＣＣＡＧ（ＳＥＱＩＤＮＯ：３８６）、ＴＴＡＣＣＡＡＣＣＡＡＡＡＡＡＡＧＴＣＣ（ＳＥＱＩＤＮＯ：３８７）、ＧＴＧＴＧＴＣＴＣＴＧＣＡＣＡＴＧＡＧＡ（ＳＥＱＩＤＮＯ：３８８）、ＧＣＣＴＣＴＧＴＡＧＡＣＴＣＣＡＣＣＴＣ（ＳＥＱＩＤＮＯ：３８９）、ＡＧＧＴＧＴＣＡＧＴＣＴＧＣＣＣＣＴＡＣ（ＳＥＱＩＤＮＯ：３９０）、ＡＣＴＧＡＣＣＴＧＣＧＣＣＣＡＣＴＧＴＣ（ＳＥＱＩＤＮＯ：３９１）、ＴＣＡＴＧＴＧＣＡＧＡＧＡＣＡＣＡＣＡＴ（ＳＥＱＩＤＮＯ：３９２）、ＧＧＴＡＡＣＣＴＧＡＣＣＴＴＴＣＴＣＴＣ（ＳＥＱＩＤＮＯ：３９３）、ＧＣＡＡＴＣＴＡＣＴＣＡＴＣＴＧＡＣＡＡ（ＳＥＱＩＤＮＯ：３９４）、ＣＡＣＣＧＣＡＴＧＴＴＣＴＣＡＣＴＣＡＴ（ＳＥＱＩＤＮＯ：３９５）、ＴＡＧＣＡＡＴＣＡＧＣＧＡＧＡＣＴＣＣＧ（ＳＥＱＩＤＮＯ：３９６）、ＡＡＡＴＧＡＡＧＧＡＡＡＡＡＡＴＧＴＴＡ（ＳＥＱＩＤＮＯ：３９７）、ＡＣＡＡＡＧＡＧＡＡＴＡＡＡＡＴＡＣＣＴ（ＳＥＱＩＤＮＯ：３９８）、ＴＴＡＡＴＣＣＡＧＴＣＴＡＴＣＡＴＴＧＡ（ＳＥＱＩＤＮＯ：３９９）、ＧＴＡＡＡＴＴＡＧＴＴＣＡＡＣＣＡＴＴＧ（ＳＥＱＩＤＮＯ：４００）、ＡＧＧＡＣＣＣＴＣＣＧＡＧＣＣＡＧＧＴＧ（ＳＥＱＩＤＮＯ：４０１）、ＣＧＴＣＡＣＣＣＣＴＴＴＣＴＴＴＧＡＣＴ（ＳＥＱＩＤＮＯ：４０２）、ＡＴＧＡＧＴＴＣＡＴＧＴＣＣＴＴＴＧＴＡ（ＳＥＱＩＤＮＯ：４０３）、ＡＣＡＡＴＴＴＣＡＧＡＧＣＣＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：４０４）、ＣＣＡＴＴＣＴＣＣＣＴＧＴＣＡＣＴＴＴＣ（ＳＥＱＩＤＮＯ：４０５）、ＧＡＴＣＴＧＴＣＴＡＡＴＡＴＴＧＡＣＡＧ（ＳＥＱＩＤＮＯ：４０６）、ＡＡＴＧＴＣＣＡＴＣＡＡＴＧＡＴＡＧＡＣ（ＳＥＱＩＤＮＯ：４０７）、ＣＴＣＧＧＡＧＧＧＴＣＣＴＡＣＧＣＣＣＡ（ＳＥＱＩＤＮＯ：４０８）、ＴＴＴＡＡＧＴＴＣＴＴＴＧＴＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：４０９）、ＣＡＣＣＡＧＣＡＡＣＡＧＡＡＣＡＡＡＧＣ（ＳＥＱＩＤＮＯ：４１０）、ＴＣＡＴＣＴＣＡＣＡＣＣＡＧＴＴＡＧＡＡ（ＳＥＱＩＤＮＯ：４１１）、ＡＧＡＣＣＡＡＡＴＣＴＡＣＡＴＣＴＧＡＴ（ＳＥＱＩＤＮＯ：４１２）、ＧＡＧＡＴＣＣＡＣＴＧＴＴＡＧＴＣＴＧＡ（ＳＥＱＩＤＮＯ：４１３）、ＴＧＡＣＣＣＡＧＣＡＡＴＣＣＣＡＴＴＡＣ（ＳＥＱＩＤＮＯ：４１４）、ＡＴＣＣＡＧＣＴＴＴＧＴＴＣＣＡＴＴＧＣ（ＳＥＱＩＤＮＯ：４１５）、ＧＧＡＡＧＧＧＧＡＡＣＡＴＣＡＣＡＣＡＣ（ＳＥＱＩＤＮＯ：４１６）、ＧＣＡＴＴＴＴＴＴＣＡＴＧＴＧＴＣＴＴＴ（ＳＥＱＩＤＮＯ：４１７）、ＣＴＣＡＡＡＡＣＴＧＣＴＣＡＡＣＴＡＣＡ（ＳＥＱＩＤＮＯ：４１８）、ＴＧＣＣＴＣＣＣＡＧＴＴＡＧＧＣＴＡＣＴ（ＳＥＱＩＤＮＯ：４１９）、ＴＴＴＡＴＴＡＴＡＣＴＴＴＡＡＧＴＴＴＴ（ＳＥＱＩＤＮＯ：４２０）、ＣＣＴＧＡＴＧＧＡＧＣＴＧＡＡＡＡＣＣＡ（ＳＥＱＩＤＮＯ：４２１）、ＧＴＣＣＡＧＣＴＴＴＧＴＴＣＣＡＴＴＧＣ（ＳＥＱＩＤＮＯ：４２２）、ＧＴＣＣＴＴＴＧＣＣＣＡＣＴＴＴＴＴＧＡ（ＳＥＱＩＤＮＯ：４２３）、ＡＣＡＣＣＡＡＴＣＡＧＡＴＧＴＡＧＡＴＴ（ＳＥＱＩＤＮＯ：４２４）、ＣＡＧＣＴＣＣＡＴＣＡＧＧＴＣＣＴＴＴＡ（ＳＥＱＩＤＮＯ：４２５）、ＧＡＧＴＧＣＣＴＣＴＣＣＴＣＣＴＣＣＡＡ（ＳＥＱＩＤＮＯ：４２６）、ＡＧＡＴＴＴＴＧＧＧＣＴＧＡＧＡＴＧＡＴ（ＳＥＱＩＤＮＯ：４２７）、ＡＡＴＴＣＡＧＣＴＧＴＧＡＡＴＣＣＡＴＣ（ＳＥＱＩＤＮＯ：４２８）、ＴＡＴＴＧＧＧＴＧＣＡＴＡＴＡＴＡＴＴＴ（ＳＥＱＩＤＮＯ：４２９）、ＣＣＴＧＡＡＡＧＴＧＡＣＡＧＧＧＡＧＡＡ（ＳＥＱＩＤＮＯ：４３０）、ＡＡＡＡＣＡＡＣＣＣＣＡＴＣＡＡＡＡＡＧ（ＳＥＱＩＤＮＯ：４３１）、ＴＴＡＡＴＧＡＴＣＡＣＣＡＴＴＣＴＡＡＣ（ＳＥＱＩＤＮＯ：４３２）、ＣＴＡＣＣＡＡＣＣＡＡＡＡＡＡＡＧＴＣＣ（ＳＥＱＩＤＮＯ：４３３）、ＣＴＧＡＡＧＡＧＴＧＴＴＴＴＣＣＡＡＣＴ（ＳＥＱＩＤＮＯ：４３４）、ＣＴＴＣＴＣＡＡＧＧＡＧＴＡＴＣＴＴＴＧ（ＳＥＱＩＤＮＯ：４３５）、ＣＡＧＡＣＴＡＡＣＡＧＣＴＧＡＴＣＴＣＴ（ＳＥＱＩＤＮＯ：４３６）、ＣＡＣＣＧＴＧＣＧＣＧＡＧＣＣＧＡＡＧＣ（ＳＥＱＩＤＮＯ：４３７）、ＣＴＴＣＡＴＣＣＡＴＧＴＣＣＣＴＧＣＡＡ（ＳＥＱＩＤＮＯ：４３８）、ＧＧＣＡＡＴＧＣＣＴＣＧＣＣＣＴＧＣＴＴ（ＳＥＱＩＤＮＯ：４３９）、ＡＴＴＧＡＡＴＣＴＡＴＡＡＡＴＴＡＣＴＴ（ＳＥＱＩＤＮＯ：４４０）、ＣＴＣＴＴＴＧＴＡＧＣＡＡＴＴＧＴＧＡＡ（ＳＥＱＩＤＮＯ：４４１）、ＣＴＴＣＴＴＧＡＧＧＡＧＴＡＴＣＴＴＴＧ（ＳＥＱＩＤＮＯ：４４２）、ＴＴＴＴＴＧＣＡＴＣＧＡＴＧＴＴＣＡＴＣ（ＳＥＱＩＤＮＯ：４４３）、ＣＡＧＣＴＣＣＡＴＣＡＧＧＴＣＡＴＴＴＡ（ＳＥＱＩＤＮＯ：４４４）、ＧＡＧＴＧＡＧＡＡＣＡＴＧＣＡＧＴＧＴＴ（Ｓ
ＥＱＩＤＮＯ：４４５）、ＡＧＴＣＡＧＧＡＡＡＣＡＡＣＡＧＡＴＧＣ（ＳＥＱＩＤＮＯ：４４６）、ＣＧＡＴＡＧＴＴＴＧＣＴＧＡＧＡＡＴＧＡ（ＳＥＱＩＤＮＯ：４４７）、ＡＡＴＴＴＴＣＡＧＣＴＴＴＴＣＴＧＣＴＣ（ＳＥＱＩＤＮＯ：４４８）、ＡＴＡＣＣＣＡＧＴＡＡＴＧＧＧＡＴＴＧＣ（ＳＥＱＩＤＮＯ：４４９）、ＧＡＧＧＡＧＣＴＧＣＧＴＴＣＣＴＴＴＧＧ（ＳＥＱＩＤＮＯ：４５０）、ＡＡＴＴＧＡＡＣＡＡＴＧＡＧＡＡＣＡＣＴ（ＳＥＱＩＤＮＯ：４５１）、ＡＡＴＧＣＴＡＡＡＴＧＡＣＧＡＧＴＴＡＡ（ＳＥＱＩＤＮＯ：４５２）、ＴＴＴＴＴＴＧＣＴＴＴＣＣＡＴＴＴＧＣＴ（ＳＥＱＩＤＮＯ：４５３）、ＡＴＧＡＡＴＧＡＡＡＴＧＡＡＧＴＧＡＧＡ（ＳＥＱＩＤＮＯ：４５４）、ＡＴＴＣＴＣＡＧＣＡＡＡＣＴＡＴＣＧＣＡ（ＳＥＱＩＤＮＯ：４５５）、ＣＡＡＧＴＴＧＧＡＡＡＡＣＡＣＴＣＴＴＣ（ＳＥＱＩＤＮＯ：４５６）、ＡＴＣＡＴＴＣＴＧＡＴＡＣＣＡＡＡＧＣＣ（ＳＥＱＩＤＮＯ：４５７）、ＡＣＡＡＣＣＴＡＣＴＣＡＴＣＴＧＡＣＡＡ（ＳＥＱＩＤＮＯ：４５８）、ＴＡＧＣＡＴＣＡＡＣＡＴＣＡＡＣＡＡＡＡ（ＳＥＱＩＤＮＯ：４５９）、ＣＡＧＴＴＴＣＴＴＣＣＴＡＧＣＣＴＴＧＡ（ＳＥＱＩＤＮＯ：４６０）、ＡＡＴＴＴＧＧＣＴＧＴＧＡＡＴＣＣＡＴＣ（ＳＥＱＩＤＮＯ：４６１）、ＴＴＴＧＴＧＧＴＴＴＴＡＴＣＴＡＣＣＴＴ（ＳＥＱＩＤＮＯ：４６２）、ＧＣＴＧＡＴＧＧＡＧＣＴＧＡＡＡＧＣＣＡ（ＳＥＱＩＤＮＯ：４６３）、ＴＴＡＡＣＴＣＧＴＣＡＴＴＴＡＧＣＡＴＴ（ＳＥＱＩＤＮＯ：４６４）、ＴＧＡＴＡＧＴＴＴＧＣＴＧＡＧＡＡＴＧＡ（ＳＥＱＩＤＮＯ：４６５）、ＧＴＴＴＴＧＣＣＡＧＴＡＴＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：４６６）、ＡＴＣＣＡＧＣＴＴＴＧＴＴＣＴＧＴＴＧＣ（ＳＥＱＩＤＮＯ：４６７）、ＡＡＧＡＡＣＴＴＧＣＴＴＴＡＴＧＡＡＴＣ（ＳＥＱＩＤＮＯ：４６８）、ＣＣＴＧＡＣＣＣＣＴＴＧＣＧＣＴＴＣＣＣ（ＳＥＱＩＤＮＯ：４６９）、ＴＴＧＧＧＡＧＧＧＴＧＴＡＴＧＴＧＴＣＧ（ＳＥＱＩＤＮＯ：４７０）、ＣＡＧＡＣＴＡＡＣＡＧＣＡＧＡＴＣＴＣＴ（ＳＥＱＩＤＮＯ：４７１）、ＴＴＧＣＴＧＣＣＴＧＡＴＣＣＴＴＣＣＴＣ（ＳＥＱＩＤＮＯ：４７２）、ＴＣＴＡＡＡＡＴＴＧＡＣＣＡＣＡＴＡＡＴ（ＳＥＱＩＤＮＯ：４７３）、ＣＴＣＡＡＡＧＣＣＧＣＴＣＡＡＣＴＡＣＡ（ＳＥＱＩＤＮＯ：４７４）、ＡＴＡＣＡＡＡＡＡＴＴＡＡＣＴＣＡＡＧＡ（ＳＥＱＩＤＮＯ：４７５）、ＡＣＡＧＡＣＧＧＣＡＣＣＴＧＧＡＡＡＡＴ（ＳＥＱＩＤＮＯ：４７６）、ＴＣＡＣＣＡＡＣＡＴＣＡＡＡＧＡＣＣＡＡ（ＳＥＱＩＤＮＯ：４７７）、ＧＴＣＣＡＧＣＴＴＴＧＴＴＣＣＧＴＴＧＣ（ＳＥＱＩＤＮＯ：４７８）、ＡＴＡＣＣＣＡＧＧＣＡＡＡＣＡＧＧＧＴＣ（ＳＥＱＩＤＮＯ：４７９）、ＣＧＣＣＡＣＡＣＴＧＴＣＴＴＣＣＡＣＡＡ（ＳＥＱＩＤＮＯ：４８０）、ＣＴＴＣＣＡＡＴＡＣＴＡＴＧＴＴＧＡＡＴ（ＳＥＱＩＤＮＯ：４８１）、ＡＧＣＡＧＣＣＧＧＧＡＡＧＣＴＣＧＡＡＣ（ＳＥＱＩＤＮＯ：４８２）、ＡＣＴＣＣＴＡＴＴＣＡＡＣＡＴＡＧＴＡＴ（ＳＥＱＩＤＮＯ：４８３）、ＧＴＧＴＴＴＴＡＣＴＴＣＣＡＡＴＴＡＴＧ（ＳＥＱＩＤＮＯ：４８４）、ＡＡＡＧＧＧＡＴＣＡＡＴＴＣＡＡＣＡＡＧ（ＳＥＱＩＤＮＯ：４８５）、ＡＡＴＧＡＧＡＣＡＧＡＡＡＧＴＴＡＡＣＡ（ＳＥＱＩＤＮＯ：４８６）、ＧＡＣＧＧＡＣＧＣＡＣＣＴＧＧＡＡＡＡＴ（ＳＥＱＩＤＮＯ：４８７）、ＣＴＴＧＡＧＴＴＡＡＴＴＴＴＴＧＴＡＴＡ（ＳＥＱＩＤＮＯ：４８８）、ＡＡＡＡＴＴＴＴＣＴＣＣＣＡＴＧＴＴＧＴ（ＳＥＱＩＤＮＯ：４８９）、ＧＡＡＡＡＴＣＣＴＣＡＡＴＡＡＡＡＴＡＣ（ＳＥＱＩＤＮＯ：４９０）、ＴＴＴＣＴＣＣＴＧＣＣＴＧＡＴＴＧＣＣＣ（ＳＥＱＩＤＮＯ：４９１）、ＡＴＡＴＴＡＧＣＣＣＴＴＴＧＴＣＡＧＡＴ（ＳＥＱＩＤＮＯ：４９２）、ＧＧＴＡＡＣＣＣＡＡＣＣＴＴＴＣＴＣＴＣ（ＳＥＱＩＤＮＯ：４９３）、ＡＡＡＣＴＡＴＣＡＴＣＡＧＡＧＴＧＡＡＣ（ＳＥＱＩＤＮＯ：４９４）、ＡＡＡＡＣＡＧＡＴＡＴＡＴＡＧＡＣＣＡＡ（ＳＥＱＩＤＮＯ：４９５）、ＴＧＣＣＴＣＡＣＣＴＧＧＧＡＡＧＣＧＣＡ（ＳＥＱＩＤＮＯ：４９６）、ＴＧＣＣＡＴＴＧＣＴＴＴＴＧＧＴＧＴＴＴ（ＳＥＱＩＤＮＯ：４９７）、ＡＧＧＡＡＧＡＴＣＴＡＣＣＡＡＧＣＣＡＡ（ＳＥＱＩＤＮＯ：４９８）、ＴＧＣＣＴＴＴＴＴＴＴＧＴＴＴＴＣＣＡＴ（ＳＥＱＩＤＮＯ：４９９）、ＡＴＴＣＴＣＡＧＣＡＡＡＣＴＡＴＣＡＣＡ（ＳＥＱＩＤＮＯ：５００）、ＣＴＧＧＡＣＴＴＴＴＴＴＴＧＧＴＴＧＧＴ（ＳＥＱＩＤＮＯ：５０１）、ＣＡＧＴＴＴＣＴＴＣＣＴＡＧＣＣＴＣＧＡ（ＳＥＱＩＤＮＯ：５０２）、ＴＡＧＧＡＡＣＡＣＴＴＴＴＡＣＡＣＴＧＴ（ＳＥＱＩＤＮＯ：５０３）、ＡＣＧＡＧＡＣＴＡＴＡＴＣＣＣＡＣＡＣＣ（ＳＥＱＩＤＮＯ：５０４）、ＧＡＡＴＡＴＴＧＣＧＣＴＴＴＴＣＡＧＡＣ（ＳＥＱＩＤＮＯ：５０５）、ＴＴＴＧＡＧＴＴＣＴＴＴＧＴＡＧＡＴＴＣ（ＳＥＱＩＤＮＯ：５０６）、ＡＴＧＣＡＣＡＴＧＴＡＴＧＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：５０７）、ＴＣＡＧＧＧＡＴＴＣＡＡＣＴＴＣＴＴＣＣ（ＳＥＱＩＤＮＯ：５０８）、ＡＴＧＣＡＣＡＣＡＴＡＴＧＴＴＴＡＴＴＧ（ＳＥＱＩＤＮＯ：５０９）、ＧＣＡＧＧＧＣＡＴＡＧＣＴＧＡＡＣＡＡＡ（ＳＥＱＩＤＮＯ：５１０）、ＴＣＡＧＡＴＣＴＣＣＡＧＣＴＧＣＡＴＧＣ（ＳＥＱＩＤＮＯ：５１１）、ＡＡＴＡＡＣＡＡＧＴＴＣＴＧＡＡＡＴＴＧ（ＳＥＱＩＤＮＯ：５１２）、ＴＧＴＧＡＧＡＴＧＡＴＡＴＣＴＣＡＴＡＧ（ＳＥＱＩＤＮＯ：５１３）、ＡＴＣＡＴＣＣＴＧＡＴＡＣＣＡＡＡＡＣＣ（ＳＥＱＩＤＮＯ：５１４）、ＡＧＧＣＣＴＣＴＧＴＴＣＴＧＴＴＣＣＡＴ（ＳＥＱＩＤＮＯ：５１５）、ＴＧＡＣＣＣＣＣＧＡＧＴＡＧＣＣＴＡＡＣ（ＳＥＱＩＤＮＯ：５１６）、ＧＣＣＣＡＣＧＣＣＴＡＴＧＴＣＣＴＧＡＡ（ＳＥＱＩＤＮＯ：５１７）、ＴＣＡＡＴＴＴＣＡＧＡＡＣＴＴＧＴＴＡＴ（ＳＥＱＩＤＮＯ：５１８）、ＴＡＣＣＡＴＴＣＡＧＧＡＣＡＴＡＧＧＣＧ（ＳＥＱＩＤＮＯ：５１９）、ＣＡＣＣＡＣＡＴＧＴＴＣＴＣＡＣＴＣＡＴ（ＳＥＱＩＤＮＯ：５２０）、ＡＧＧＡＣＣＣＴＣＴＧＡＧＣＣＡＧＧＴＧ（ＳＥＱＩＤＮＯ：５２１）、ＣＡＴＡＡＴＴＧＴＣＡＧＡＴＴＣＡＣＣＡ（ＳＥＱＩＤＮＯ：５２２）、ａｎｄＧＡＡＧＡＣＣＴＴＡＡＡＴＧＡＣＣＴＧＡ（ＳＥＱＩＤＮＯ：５２３）。配列は５’から３’まで提示される。

【0034】

本明細書には、ＬＩＮＥ要素などの、望ましい位置からの配列を得る方法が提供される。幾つかの場合では、ＬＩＮＥ要素は、ＳＥＱＩＤＮＯ：１を含むヌクレオチドポリヌクレオチドを含む。幾つかの場合では、ＬＩＮＥ要素の一部が標的とされ、その一部は、ＳＥＱＩＤＮＯ：２を含む配列を有する。幾つかの場合では、ＬＩＮＥ要素は、ＳＥＱＩＤＮＯ：３を含む配列を有するガイドＲＮＡを使用して標的とされる。

【0035】

本明細書には、Ａｌｕ要素などの、望ましい位置に隣接している配列を得る方法が提供される。幾つかの場合では、Ａｌｕ要素は、ＳＥＱＩＤＮＯ：４を含む配列を有するＡｌｕ－Ｙ要素を含む。

【0036】

幾つかの場合では、望ましいゲノム位置は、ＤＮＡポリメラーゼ、例えば鎖置換ＤＮＡポリメラーゼによって増幅される。幾つかの場合では、ＤＮＡポリメラーゼは、望ましいゲノム位置を増幅するために使用される。幾つかの場合において、ＤＮＡポリメラーゼでは、プライマー配列、例えば、ＤＮＡプライマーまたはＲＮＡプライマーがタグ中に含まれる必要がある。

【0037】

タグは、当該技術分野に既知のゲノム編集または遺伝子ターゲティング法によってゲノムＤＮＡのサンプルに挿入される。幾つかの場合では、タグは、患者または培養細胞から単離した細胞などの、細胞のゲノムＤＮＡに挿入される。幾つかの場合では、タグは、患者からの細胞または組織サンプルなどの、細胞または組織から単離されたゲノムＤＮＡに挿入される。

【0038】

ゲノム編集または遺伝子ターゲティング技術は、当業者に理解されており、相同組換え、クラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）、ＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮＳ）、ジンクフィンガーヌクレアーゼ、トランスポゾン、および他の方法などの方法を含む。これらの方法のいずれかの結果は、少なくとも１つのプロモーター配列を含む１つ以上の核酸タグのゲノムへの特異的な挿入である。

【0039】

本明細書に記載される方法では、望ましいゲノム位置に挿入されるべきタグは核酸である。ゲノムターゲティングの正確なメカニズムに依存して、核酸タグはＲＮＡまたはＤＮＡである。幾つかの場合では、核酸タグはＲＮＡ／ＤＮＡのハイブリッドである。核酸タグは、当業者に既知の方法によって遺伝子ターゲティング反応のために調製される。幾つかの場合では、タグは核酸合成装置によって合成される。幾つかの場合では、タグは組換えＤＮＡ技術によって調製される。ＲＮＡ核酸タグは、幾つかの場合において、プラスミドから転写される。挿入の方法を依存して、望ましいゲノム位置に相補的な配列は、その方法に合わせて変化する。幾つかの場合において、ＣＲＩＳＰＲでは、ゲノム位置に位置しなければならないＰＡＭ配列は標的とされる必要がある。

【0040】

幾つかの場合では、ＣＲＩＳＰＲは、タグ付けされた核酸配列をゲノムＤＮＡサンプルにおける特定位置に挿入するために使用される。ＣＲＩＳＰＲは、一般に２つのコンポーネント、ガイドＲＮＡ（ｇＲＮＡ）および非特異的なＣＲＩＳＰＲ関連のエンドヌクレアーゼ（Ｃａｓ９）を使用する。幾つかの場合において、ＣＲＩＳＰＲｇＲＮＡでは、Ｃａｓ９結合のためのスキャフォールド配列およびタグおよびゲノムＤＮＡ配列を含有している約２０のヌクレオチドの標的配列が修飾される必要がある。

【0041】

本明細書にはまた、ＤＮＡサンプル中のＣＲＩＳＰＲ標的部位へのタグ付けされた核酸配列の挿入を含む方法が開示される。これらの方法では、ＣＲＩＳＰＲ／ＣＡＳヌクレアーゼは、ゲノム中の標的部位で二本鎖切断を作り出す。その後、エキソヌクレアーゼが、特異的な核酸配列を有する粘着末端を作り出す二本鎖切断の一本の鎖を分解する反応混合物に加えられる。代替的に、第２の標的とされたＣＲＩＳＰＲ／ＣＡＳヌクレアーゼが、エキソヌクレアーゼの代わりに粘着末端を作り出すために使用される。タグ付けされた核酸ポリヌクレオチドは、Ｔ７プロモーターなどの転写プロモーターを含む部分および粘着末端に相補的な核酸配列を含む部分を有している一本鎖核酸を含む。随意に、タグ付けされた核酸ポリヌクレオチドは、タグ付けされた核酸がヘアピンを形成することを可能にする自己補足的な部分を含む。

【0042】

＜核酸の線形増幅＞
本明細書に提供される方法によって、配列決定するのが困難となる当業者に既知の配列を有する核酸分子から的確且つ正確な配列情報を得ることが可能になる。本明細書の方法は、開始ゲノムＤＮＡ鋳型から直接線形の方法で増幅される、標的とされた核酸配列を使用する。当業者によって理解されるように、配列決定するのが困難であるゲノム領域は、ＴａｑポリメラーゼなどのＤＮＡポリメラーゼによって引き起こされた、挿入、欠失、および置換などの、複製エラー率が増大したと知られている特性を有している。ＰＣＲなどの増幅方法では、これらのエラーは、増幅の各ラウンドで引き継がれ、元の鋳型を反映しない増幅特異的な配列決定の誤差を作り出す。

【0043】

本明細書に開示される方法は、線形増幅、即ち、元の鋳型から直接合成された、元のゲノムＤＮＡ鋳型と同一の追加の核酸分子の生成を含む。幾つかの場合では、線形増幅は、転写、例えば、本明細書に記載されるようなプロモーター配列を含有するように特異的にタグ付けされた特異的なゲノムＤＮＡ位置からのＲＮＡのインビトロでの転写を使用して達成される。適切なＲＮＡポリメラーゼは、限定されないが、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶを含む。幾つかの場合では、ＲＮＡは、単一のサブユニットＲＮＡポリメラーゼである、ＲＮＡポリメラーゼＶによって転写される。幾つかの場合では、インビトロでの転写反応は、ＲＮＡポリメラーゼに適した１つ以上のリボヌクレオチド（ＡＴＰ、ＧＴＰ、ＵＴＰ、およびＣＴＰ）および緩衝液を必要とする。

【0044】

＜線形増幅された核酸の精製＞
本明細書に開示される方法は、ゲノムＤＮＡ鋳型からの線形増幅された核酸の精製を提供する。幾つかの事例では、精製の方法は酵素法であり、それによって、ゲノムＤＮＡ鋳型は１つ以上のＤＮａｓｅを使用して消化される。代替的に、精製の方法は、親和性に基づく精製であり、それによって、結果として生じる増幅核酸は標識され、および抗体などの試薬は標識された増幅核酸に結合し、結合していないゲノムＤＮＡ鋳型は結合された増幅核酸から洗い流される（ｗａｓｈｅｄａｗａｙ）。精製の方法はまた、蛍光ベースで選別する精製であると考えられ、それによって、蛍光標識された増幅核酸は、標識されていないゲノムＤＮＡ鋳型から選別されて除外される（ｓｏｒｔｅｄａｗａｙ）。増幅核酸が、増幅の各ラウンドの後に増幅反応から精製される、さらなる精製法が含まれる。さらなる方法では、増幅核酸は、増幅反応が完了した後に精製される。

【0045】

本明細書に開示される方法は、ＲＮＡである増幅核酸を提供する。方法で下流工程のためのＤＮＡサンプルを有することが望ましい事例では、１つ以上の逆転写酵素を使用して、ＲＮＡからＤＮＡコピーが作られる。随意に、ＲＮＡは、逆転写酵素での処理前にポリアデニル化される。代替的に、逆転写酵素は、逆転写酵素反応をプライミングするためにオリゴチミジンを使用する。逆転写酵素はまた、逆転写酵素反応をプライミングするために遺伝子特異的なプライマーを使用することが考えられる。逆転写酵素は、随意に、逆転写酵素反応をプライミングするためにランダムヘキサマープライマーを使用する。逆転写酵素が緩衝液およびデオキシリボヌクレオチドを使用することも考えられる。

【0046】

＜境界隣接ライブラリー（Ｂｏｒｄｅｒ－ａｄｊａｃｅｎｔｌｉｂｒａｒｉｅｓ）および配列データベース＞
本明細書には、ライブラリー構成分子がゲノムまたは他の核酸源内の可動因子位置を特定するために可動因子境界および可動因子に隣接する配列の両方を有するように核酸分子において対にされた、可動因子の縁または境界および可動因子に隣接するゲノム配列あるいは他の非可動因子の配列を含む分子を含む核酸ライブラリーが開示される。

【0047】

本開示の他のところで議論されるように、本開示に一致するライブラリーは、サンプル鋳型から直接、産物の反復線形増幅によって生成された分子を含む。したがって、そのようなライブラリーは、結果的に初期の増幅エラーは後の産物に広がる、続く増幅反応において鋳型として使用されている産物を産出するために初期のラウンドの増幅を含む連鎖反応ベースの増幅方法から生じる差動増幅アーチファクトに悩まされない。線形増幅によって、特に排他的ではないがＲＮＡ中間体（ｉｎｔｅｒｍｅｄｉａｒｙ）によって、増幅産物は、一意に且つ明確に、鋳型に直接由来する。増幅産物が、ライブラリー生成の連鎖反応増幅のための鋳型として機能しないため、特定の増幅産物の生成におけるエラーは続く反応において広がらない。増幅のエラーは生じるが、互いに無関係であり、個々にまれなものであり、同じ鋳型の関連する増幅産物との比較によって容易に認識される。

【0048】

しばしば、本開示に一致するライブラリーは、ゲノムＤＮＡに由来すが、他の核酸源も考えられる。本開示に一致するライブラリーは、しばしば、ライブラリーが由来するゲノムまたは他の核酸サンプルに相対的な分子を含有している、可動因子境界および境界に隣接する配列のために豊富である共通要素を共有する。すなわち、ゲノムサンプルとは相対的に、より多数の核酸分子が、可動因子境界および境界に隣接する配列の両方を含むか、あるいはライブラリーの全配列のより大きな割合が、可動因子境界に近接している。

【0049】

本明細書のライブラリーは、少なくとも１００、２００、５００、１，０００、５，０００、１０，０００、２０，０００、５０，０００、１００，０００、２００，０００、５００，０００、１，０００，０００、または１，０００，０００を超える核酸分子を含む。本明細書に開示される幾つかのライブラリーは、核酸サンプルの染色体のハプロイド相補体において少なくとも１０ｘ、２０ｘ、５０ｘ、１００ｘ、２００ｘ、５００ｘ、１，０００ｘ、２，０００ｘ、５，０００ｘ、１０，０００ｘ、２０，０００ｘ、５０，０００ｘ、１００，０００ｘ、または１００，０００ｘより多い数の染色体を含む。

【0050】

幾つかの場合では、ライブラリー構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、可動因子境界および境界に隣接する配列の両方を含む。

【0051】

「可動因子境界に近接した配列」は、可動因子境界が、配列から、２０ｋｂ、１５ｋｂ、１０ｋｂ、９ｋｂ、８ｋｂ、７ｋｂ、６ｋｂ、５ｋｂ、４ｋｂ、３ｋｂ、２ｋｂ、１ｋｂ未満、９００ベース、８００ベース、７００ベース、６００のベース、５００ベース、４００ベース、３００ベース、２００ベース、１００ベース、または１００ベース未満に位置する（与えられた塩基位置で測定された）配列を指すように種々に理解される。

【0052】

本開示に一致するライブラリーでは、可動因子境界に近接した配列は、ライブラリーが生成されるゲノムサンプルなどの関連するサンプルよりも大きなライブラリーの全配列の割合を表わす。幾つかの場合では、ライブラリー構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、可動因子境界に近接した配列を含む。

【0053】

本明細書にはまた、ライブラリー構成分子がゲノムまたは他の核酸源内の反復領域位置を特定するために反復領域境界および反復領域に隣接する配列の両方を有するように核酸分子において対にされた、反復領域の縁または境界および反復領域に隣接するゲノムまたは他の非反復領域の配列を含む分子を含む核酸ライブラリーが開示される。

【0054】

しばしば、本開示に一致するライブラリーは、ゲノムＤＮＡに由来するが、他の核酸源も考えられる。本開示に一致するライブラリーは、しばしば、ライブラリーが由来するゲノムまたは他の核酸サンプルに相対的な分子を含有している、反復領域境界および境界に隣接する配列のために豊富である共通要素を共有する。すなわち、ゲノムサンプルとは相対的に、より多数の核酸分子が、反復領域境界および境界に隣接する配列の両方を含むか、あるいはライブラリーの全配列のより大きな割合が、反復領域境界に近接している。

【0055】

幾つかの場合では、ライブラリー構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、反復領域境界および境界に隣接する配列の両方を含む。

【0056】

「反復領域境界に近接した配列」は、反復領域境界が、配列から、２０ｋｂ、１５ｋｂ、１０ｋｂ、９ｋｂ、８ｋｂ、７ｋｂ、６ｋｂ、５ｋｂ、４ｋｂ、３ｋｂ、２ｋｂ、１ｋｂ未満、９００ベース、８００ベース、７００ベース、６００のベース、５００ベース、４００ベース、３００ベース、２００ベース、１００ベース、または１００ベース未満に位置する（与えられた塩基位置で測定された）配列を指すように種々に理解される。

【0057】

本開示に一致するライブラリーでは、反復領域境界に近接した配列は、ライブラリーが生成されるゲノムサンプルなどの関連するサンプルよりも大きなライブラリーの全配列の割合を表わす。幾つかの場合では、ライブラリー構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、反復領域境界に近接した配列を含む。

【0058】

本開示に一致するライブラリーは、反復領域境界および境界に隣接する配列の両方を含む、および少なくとも５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００を超えるベースに及ぶ、フラグメントを含む。本開示に一致する幾つかのライブラリーは、反復領域境界および境界に隣接する配列の両方を含む複数のフラグメントを含み、その結果、前記複数のフラグメントは、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００ベースを超える平均のフラグメントのサイズを示す。本開示に一致する幾つかのライブラリーは、反復領域境界および境界に隣接する配列の両方を含む複数のフラグメントを含み、その結果、前記複数のフラグメントは、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００ベースを超える中央値のフラグメントのサイズを示す。

【0059】

本明細書に開示されるようなライブラリーは、ＲＮＡまたはＤＮＡを含む。幾つかのライブラリーは、ゲノムＤＮＡサンプルなどの核酸サンプル中の可動因子または他の反復領域に挿入される、例えば、選択的に挿入されるＲＮＡポリメラーゼプロモーターによって方向付けられたＲＮＡ転写から生じる。幾つかのライブラリーは、ＲＮＡポリメラーゼプロモーター配列、可動因子配列などの反復領域、および隣接するゲノム配列などの可動因子または他の反復領域に隣接する配列を随意に含む分子を含む、この転写から生成された分子を含む。幾つかのライブラリーは、挿入されたＲＮＡポリメラーゼプロモーターによって方向付けられたＲＮＡ転写から生じるＲＮＡを含む。代替的に、多くのライブラリーが、上に記載されるように生成されたＲＮＡ分子の集団の逆転写によって生成されたＤＮＡを含む。

【0060】

本明細書に開示されるようなライブラリーは、ゲノム核酸サンプルなどの鋳型から生成され、サンプル中の反復領域に隣接しているゲノム配列を反映している。幾つかの実施形態では、反復要素は、ゲノム全体にわたって様々な位置に再配置すると観察されるＡｌｕリピートまたはトランスポゾンなどの可動因子を含む。この再配置または転位は、ゲノムサンプルが由来する生物中の細胞または細胞集団にしばしば特異的である。代替的に、ライブラリーは、選択されたゲノムの領域に隣接しているゲノム配列を反映している。ライブラリーは、腫瘍細胞または健康な細胞などの細胞集団からのゲノムＤＮＡサンプルなどのサンプルに由来する。幾つかの場合では、ライブラリーは、単細胞に由来するゲノムＤＮＡから生成される。

【0061】

特に、幾つかの可動因子の挿入事象または転位事象は、しばしば癌細胞株に関係する細胞周期または細胞増殖の調節欠損などの、系譜特異的な細胞欠損に関係している。癌に関係している可動因子の挿入事象の特定を促進するために、ライブラリーは、単独で又は非癌性の細胞または組織からのライブラリーの生成と組み合わせて、癌または腫瘍の細胞または組織から得られたゲノム核酸サンプルなどの鋳型から生成される。

【0062】

本開示に一致するライブラリーは、ＨＬＡ遺伝子座などの反復遺伝子座の可動因子境界またはリピート隣接する配列（ｒｅｐｅａｔａｄｊａｃｅｎｔｓｅｑｕｅｎｃｅ）などの、反復またはリピート領域に隣接している配列を決定するように随意に配列決定される。代替的に、本開示に一致するライブラリーは、選択されたゲノムの領域に隣接している配列を決定するように随意に配列決定される。ショットガン配列決定、合成アプローチによる次世代配列決定、ＰａｃＢｉｏ、ＢｉｏＮａｎｏまたはＯｘｆｏｒｄＮａｎｏｐｏｒｅ配列決定などの長い分子配列決定（ｌｏｎｇｍｏｌｅｃｕｌｅｓｅｑｕｅｎｃｉｎｇ）などの、本明細書の他のところに開示される又はそうでなければ当業者に既知のあらゆる配列決定のアプローチを使用して、ライブラリー構築物が配列決定される。

【0063】

本明細書における作成された配列データベースは、本開示に一致するライブラリーの核酸配列または本開示に一致する方法の実施を含む。幾つかの場合では、データベース構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、可動因子配列および境界に隣接する配列などのリピート要素の両方を含む。

【0064】

本開示に一致するデータベースでは、可動因子境界に近接した配列は、ライブラリーが生成されるゲノムサンプルなどの関連するサンプルよりも大きなライブラリーの全配列の割合を表わす。幾つかの場合では、ライブラリー構築物の９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、約１００％、または１００％などの、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９％以上は、可動因子境界などのリピート要素に近接した配列を含む。

【0065】

本開示に一致するデータベースは、反復領域境界および境界に隣接する配列の両方を含む、および少なくとも５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００を超えるベースに及ぶ、配列を含む。本開示に一致する幾つかのデータベースは、反復領域境界および境界に隣接する配列の両方を含む複数の配列を含み、その結果、前記複数の配列は、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００ベースを超える平均の配列長を示す。本開示に一致する幾つかのデータベースは、反復領域境界および境界に隣接する配列の両方を含む複数の配列を含み、その結果、前記複数の配列は、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、３，０００、３，５００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００ベースまたは２０，０００ベースを超える中央値の配列長を示す。

【0066】

本明細書に開示されるようなデータベースは、幾つかの場合において完全に配列決定され、その結果、データベースエントリーは、それらが生成されるライブラリー分子のための末端間（ｅｎｄ－ｔｏ－ｅｎｄ）配列情報を含む。代替的に、幾つかの場合では、データベースのエントリーの幾つか又はすべては、ペアリードを含み、それによって、ペアリードの１つのメンバーは可動因子配列などのリピート要素配列を含み、ペアリードのもう１つのメンバーはリピート隣接する配列を含み、その結果、幾つかの場合において、可動因子境界位置は、可動因子の境界にわたって実際に配列決定することなく推測される。

【0067】

＜線形増幅された核酸の配列決定＞
本明細書に開示される方法は、本明細書に開示されるようなライブラリーの産生に従って生成された核酸などの、線形増幅された核酸を配列決定する工程を随意に含む。幾つかの場合では、該方法は、線形増幅された核酸に対する配列決定に必要とされるオリゴヌクレオチドをアニールする工程を含む。幾つかの場合では、配列決定は、線形増幅された核酸に対する配列決定に必要とされるオリゴヌクレオチドをライゲートする工程を含む。幾つかの場合では、該方法は、線形増幅された核酸を配列決定するためにアダプター配列またはその部分を利用する工程を含む。

【0068】

核酸配列決定の様々な方法が周知であり、当該技術分野において記載されている。本明細書に開示される方法は、広範囲の配列決定技術に一致している。

【0069】

線形増幅された核酸の配列の決定は、本明細書で、限定されないが、イオン検出技術、ＤＮＡナノボール技術、ナノポアベースの配列決定技術、ハイブリダイゼーションによる配列決定（ＳＢＨ）、ライゲーションによる配列決定（ＳＢＬ）、定量的な増分蛍光ヌクレオチド付加配列決定（ｑｕａｎｔｉｔａｔｉｖｅｉｎｃｒｅｍｅｎｔａｌｆｌｕｏｒｅｓｃｅｎｔｎｕｃｌｅｏｔｉｄｅａｄｄｉｔｉｏｎｓｅｑｕｅｎｃｉｎｇ）（ＱＩＦＮＡＳ）、段階的なライゲーションおよび切断、蛍光共鳴エネルギー転移（ＦＲＥＴ）、
分子ビーコン、ＴａｑＭａｎレポータープローブ消化、パイロシークエンシング、蛍光インサイチュ配列決定（ｆｌｕｏｒｅｓｃｅｎｔｉｎｓｉｔｕｓｅｑｕｅｎｃｉｎｇ）（ＦＩＳＳＥＱ）、ＦＩＳＳＥＱビーズ、ゆらぎ配列決定（ｗｏｂｂｌｅｓｅｑｕｅｎｃｉｎｇ）、多重配列決定、重合コロニー（ＰＯＬＯＮＹ）配列決定；ナノグリッドローリングサークル配列決定（ｎａｎｏｇｒｉｄｒｏｌｌｉｎｇｃｉｒｃｌｅｓｅｑｕｅｎｃｉｎｇ）（ＲＯＬＯＮＹ）、対立遺伝子特異的なオリゴライゲーションアッセイ（例えば、オリゴライゲーションアッセイ（ＯＬＡ）、ライゲートされた線形プローブを使用する単一の鋳型分子ＯＬＡおよびローリングサークル増幅（ＲＣＡ）読み出し、ライゲートされたパドロックプローブ、及び／又はライゲートされた円形のパドロックプローブを使用する単一の鋳型分子ＯＬＡおよびローリングサークル増幅（ＲＣＡ）読み出し）などを含む、様々な配列決定方法から選択される配列決定方法を使用して実行されると考えられる。随意に、Ｒｏｃｈｅ４５４、ＩｌｌｕｍｉｎａＳｏｌｅｘａ、ＡＢＩ－ＳＯＬｉＤ、ＩＯＮＴｏｒｒｅｎｔｓ、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓ、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅ、Ｈｅｌｉｃｏｓ、Ｐｏｌｏｎａｔｏｒのプラットフォームなどのプラットフォームを使用するサイクリックアレイ配列決定（ｃｙｃｌｉｃａｒｒａｙｓｅｑｕｅｎｃｉｎｇ）などのハイスループット配列決定方法が利用される。

【0070】

線形増幅された核酸の配列の決定は、随意に、次世代配列決定（ＮＧＳ）方法によって実行されると考えられる。ＮＧＳは、ゲノム配列決定、ゲノム再配列決定、トランスクリプトーム解析（ＲＮＡ－Ｓｅｑ）、ＤＮＡ－タンパク質相互作用（ＣｈＩＰ－配列決定）、およびエピゲノム特徴づけに適用される。本明細書に開示される熟考された方法は、限定されないが、超並列署名配列決定（ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｇｎａｔｕｒｅｓｅｑｕｅｎｃｉｎｇ）（ＭＰＳＳ）、Ｐｏｌｏｎｙ配列決定、４５４パイロシークエンシング、イオントレント半導体配列決定（ＩｏｎＴｏｒｒｅｎｔｓｅｍｉｃｏｎｄｕｃｔｏｒｓｅｑｕｅｎｃｉｎｇ）、Ｈｅｌｉｓｃｏｐｅ単一分子配列決定（Ｈｅｌｉｓｃｏｐｅｓｉｎｇｌｅｍｏｌｅｃｕｌｅｓｅｑｕｅｎｃｉｎｇ）、単一分子リアルタイム（ＳＭＲＴ）配列決定およびマイクロ流体サンガー配列決定から選択されるＮＧＳ方法を含む。

【0071】

＜ゲノム要素のマッピング＞
本明細書に開示される方法は、随意に、本明細書に提供される方法から得られた配列を使用して、ゲノム要素、例えば可動遺伝因子をマッピングする工程を含むと考えられる。代替的に、該方法は、ＣＲＩＳＰＲなどのゲノムＤＮＡ編集技術を使用する、ゲノム要素への、Ｔ７プロモーターなどのプロモーターを含む、核酸タグなどのタグの挿入を含む。
ＲＮＡ分子は、挿入されたタグから転写され、これによって、ゲノム要素に隣接しているＤＮＡと同じ配列を有するＲＮＡの線形増幅が可能になる。線形増幅された核酸から得られた配列は、ゲノムにおいて、得られた配列を、参照ゲノムに利用可能な配列、例えばヒトゲノム配列と比較することによって対応する位置を見つけ、それによって、ゲノム要素の挿入をマッピングすることを可能にする。随意に、ゲノム要素の挿入は、遺伝子のコード配列にマッピングされる。代替的に、ゲノム要素の挿入は、遺伝子のイントロンにマッピングされる。ゲノム要素の挿入が、遺伝子のプロモーターまたはエンハンサー配列にマッピングされることも考えられる。随意に、ゲノム要素の挿入は、遺伝子の５’または３’の非翻訳領域にマッピングされる。

【0072】

遺伝子の近く又は遺伝子への、例えば、コード配列への、イントロン中の、プロモーターまたはエンハンサーへの、あるいは５’または３’の非翻訳領域への、ゲノム要素、例えば、可動遺伝因子の挿入は、しばしば、遺伝子の機能の破壊を引き起こす。遺伝因子、例えば可動遺伝因子の挿入による遺伝子機能の破壊は、当業者に既知の多くのメカニズムのいずれか１つによって生じ得る。しばしば、遺伝子機能は、コード配列への挿入によって破壊され、それによって、遺伝子のアミノ酸配列を破壊するか又はそうでなければ変更する。代替的に、遺伝子機能は、イントロンまたは５’または３’の非翻訳領域への挿入によって破壊され、それによって、転写、例えばＲＮＡスプライシング、ＲＮＡ輸送、およびＲＮＡ翻訳の下流の遺伝子発現に影響を与える。随意に、遺伝子機能は、プロモーターまたはエンハンサーの要素への挿入によって破壊され、それによって、遺伝子のクロマチンおよび転写上への遺伝子調節タンパク質のアセンブリに影響を与える。

【0073】

ゲノム要素の挿入およびそれによる１つ以上の遺伝子の機能の破壊は、しばしば疾患の原因となる。随意に、疾患は癌である。代替的に、疾患は老化である。ゲノム要素の挿入をマッピングすることで、医療従事者が個体の処置に関する決定を下すのを助ける、医療従事者情報、例えば診断情報が通知されることが本明細書で考えられる。随意に、遺伝因子の挿入をマッピングすることで、癌のための診断が提供される。代替的に、ゲノム要素の挿入をマッピングすることで、老化のための診断が提供される。

【0074】

幾つかの場合では、本明細書には、被験体の癌を診断する方法が提供され、該方法は、被験体からサンプルを得る工程、サンプルからゲノムＤＮＡを単離する工程、Ｔ７プロモーターを含むタグポリヌクレオチドをゲノムＤＮＡサンプルのゲノム要素へと挿入する組成物とゲノムＤＮＡとを接触させる工程、ゲノムＤＮＡから線形増幅されたＲＮＡサンプルを得るためにＴ７ＲＮＡポリメラーゼでインビトロでの転写を実行する工程、サンプルからのゲノムＤＮＡを除去するためにＤＮａｓｅでサンプルを処理する工程、ｃＤＮＡを得るためにＲＮＡサンプルをポリアデニル化し、ＲＮＡサンプルを逆転写する工程、サンプルからのＲＮＡを除去するためにＲＮａｓｅＨでサンプルを処理する工程、および次世代配列決定方法を使用して結果として生じるｃＤＮＡサンプルをＤＮＡ配列決定にさらす工程であって、結果として配列がゲノム要素に隣接する、工程を含む。ゲノム要素に隣接している配列は、ゲノム要素の挿入の位置を決定する及びそれ故挿入の近くの遺伝子の同一性を判定するために、ＢＬＡＳＴなどのバイオインフォマティクスのデータベースにおいて検索される。

【0075】

＜困難なゲノム領域の配列決定＞
本明細書には、従来の配列決定方法を使用する配列決定の困難性または課題を露呈する、つまり、ポリヌクレオチドを配列決定するのが困難なゲノムの領域を配列決定する方法が提供される。幾つかの場合では、ポリヌクレオチドを配列決定することの困難性は、低複雑性のポリヌクレオチド、反復ポリヌクレオチド、ジ－ヌクレオチドのリピートポリヌクレオチド（ｒｅｐｅａｔｐｏｌｙｎｕｃｌｅｏｔｉｄｅｓ）、トリ－ヌクレオチドのリピートポリヌクレオチド、ＧＣが豊富なポリヌクレオチド、二次構造を有するポリヌクレオチド、５’－ＹＧＮ１－２ＡＲモチーフを有するポリヌクレオチド、およびそれらの組み合わせを含む。幾つかの場合では、ポリヌクレオチドを配列決定することの困難性は、ＣＡＧリピート、ＣＧＧリピート、ＧＣＣリピート、ＧＡＡリピート、またはＣＴＧリピートなどの、トリヌクレオチドリピートを含む。幾つかの場合では、ポリヌクレオチドを配列決定することの困難性は、ＨＬＡ－Ａ遺伝子、ＨＬＡ－Ｂ遺伝子、ＨＬＡ－Ｃ遺伝子、ＨＬＡ－Ｅ遺伝子、ＨＬＡ－Ｆ遺伝子、ＨＬＡ－Ｇ遺伝子、ＨＬＡ－ＤＰ遺伝子、ＨＬＡ－ＤＱ遺伝子、またはＨＬＡ－ＤＲ遺伝子を含む、ＨＬＡ遺伝子などの、配列決定することが困難な遺伝子を含む。

【0076】

幾つかの場合では、ＨＬＡ遺伝子などの、配列決定することが困難な遺伝子の配列を得ることによって、医療従事者は、そのゲノム遺伝子座で患者の遺伝子型、例えば、ＨＬＡ遺伝子型、ＨＬＡ型を得ることが可能になる。幾つかの場合では、ＨＬＡ型は、臓器または組織の移植、例えば、骨髄移植、心臓移植、肺移植、肝臓移植、腎臓移植、膵臓移植、腸移植、胸腺移植、角膜移植、皮膚移植、心臓弁移植、神経移植、または脈移植に対する適合性を判定することに有用である。

【0077】

代替的に、配列決定の課題を呈する核酸分子は、ＣＹＰ２Ｄ６遺伝子およびそれらのホモログを含む。さらに、免疫グロブリン遺伝子のＶＤＪ領域は、配列決定の課題を呈する。本明細書の方法は、これらの遺伝子およびゲノム領域を配列決定することに有用である。

【0078】

＜定義＞
関連する定義の部分的なリストは以下の通りである。

【0079】

「増幅核酸」または「増幅されたポリヌクレオチド」は、その量が、その開始量と比較して、インビトロで実行された核酸増幅または複製方法によって増加された、核酸またはポリヌクレオチド分子を含む。例えば、増幅核酸は、随意に、幾つかの事例において指数方法でＤＮＡを増幅することができる（例えば、ｎサイクルで２^ｎのコピーに増幅）ポリメラーゼ連鎖反応（ＰＣＲ）から得られ、ここでほとんどの産物が、直接サンプル鋳型からではなく中間鋳型から生成される。増幅核酸は、代替的に線形増幅から得られ、ここで、その量は、経時的に線形に増加し、これは、幾つかの場合において、サンプルから直接合成される産物を産生する。

【0080】

「増幅産物」は、ポリメラーゼ連鎖反応または線形増幅などの増幅反応から結果として生じる産物を指す。

【0081】

「アンプリコン」は、天然または人工の増幅または複製事象の源及び／又は産物であるポリヌクレオチドまたは核酸である。

【0082】

用語「生体サンプル」または「サンプル」は、一般に、生物学的存在から分離されたサンプルまたは部分を指す。生体サンプルは、幾つかの場合において、全生物学的存在の性質を示し、その例は、限定されないが、体液、解離された腫瘍の標本、培養細胞、およびそれらの組み合わせを含む。生体サンプルは１以上の個体から得られる。１以上の生体サンプルは同じ個体から得られる。１つの限定しない例において、第１のサンプルは個体の血液から得られ、第２のサンプルは個体の腫瘍生検標本から得られる。生体サンプルの例はとしては、限定されないが、血液、血清、血漿、鼻スワブ（ｎａｓａｌｓｗａｂ）または鼻咽頭洗浄液、唾液、尿、胃液、髄液、涙、便、粘液、汗、耳垢、油、腺分泌物、脳脊髄液、組織、精液、膣液、腫瘍組織由来の間質液を含む間質液、眼液、髄液、咽頭スワブ、息、毛、指の爪、皮膚、生検標本、胎盤液、羊水、臍帯血、強調液（ｅｍｐｈａｔｉｃｆｌｕｉｄｓ）、腔液、痰、膿、細菌叢、胎便、母乳及び／又は他の分泌物が挙げられる。幾つかの場合では、血液サンプルは、循環腫瘍細胞、または腫瘍ＤＮＡまたは胎児ＤＮＡなどの無細胞ＤＮＡを含む。サンプルは鼻咽頭洗浄液を含む。被験体の組織サンプルの例としては、限定されないが、結合組織、筋組織、神経組織、上皮組織、軟骨、癌または腫瘍のサンプル、あるいは骨が挙げられる。サンプルはヒトまたは動物から得られる。サンプルは、ネズミ、サル、ヒト、家畜、スポーツ動物、またはペットなどの脊椎動物を含む哺乳動物から得られる。サンプルは、生きているか又は死んでいる被験体から得られる。サンプルは、被験体から新鮮に得られるか、あるいは前処理、保存、または輸送の幾つかの形態を経ている。

【0083】

本明細書に使用されるような核酸サンプルは、配列情報が決定される核酸サンプルを指す。核酸サンプルは、幾つかの場合において上記の生体サンプルから抽出される。代替的に、核酸サンプルは、幾つかの場合において、人為的に合成されるか、合成的であるか、あるいはデノボ合成される。ＤＮＡサンプルは、幾つかの場合においてゲノムであり、一方で代替的な場合において、ＤＮＡサンプルは逆転写されたＲＮＡサンプルに由来する。

【0084】

「体液」は、一般に被験体の身体から生じる流体または分泌物について記述している。幾つかの事例では、体液は、一緒に混合された１つを超えるタイプの体液の混合物である。体液の幾つかの限定しない例としては、限定されないが、血液、尿、骨髄、髄液、胸膜液、リンパ液、羊水、腹水、痰、またはそれらの組み合わせが挙げられる。

【0085】

「相補的」または「相補性」、あるいは幾つかの場合において、より正確には「逆相補性」は、塩基対合によって関連する核酸分子を指す。相補的なヌクレオチドは、一般に、ＡおよびＴ（またはＡおよびＵ）、あるいはＣおよびＧ（またはＧおよびＵ）である。機能的に、２つの一本鎖ＲＮＡまたはＤＮＡ分子は、水素結合媒介性の塩基対合によって二本鎖分子を形成するときに相補的である。最適に整列された、および適切なヌクレオチドの挿入または欠失が伴う、１つの鎖のヌクレオチドが、少なくとも約９０％から約９５％またはそれ以上の相補性、およびより好ましくは約９８％から約１００％の相補性、およびさらにより好ましくは１００％の相補性を有して対になるときに、２つの一本鎖ＲＮＡまたはＤＮＡ分子は、実質的に相補的であると言われている。代替的に、ＲＮＡまたはＤＮＡの鎖が選択的なハイブリダイゼーション条件下でその補体にハイブリダイズするときに、相当な相補性が存在する。選択的なハイブリダイゼーション条件は、限定されないが、ストリンジェントなハイブリダイゼーション条件を含むか又は含まない。ハイブリダイゼーション温度は、一般に、融解温度（Ｔ_ｍ）より低い少なくとも約２℃から約６℃である。

【0086】

「バーコード」または「分子バーコード」は、標識化のための物質を含む。バーコードは、核酸またはポリペプチドなどの分子を標識する。標識化のための物質は情報に関連付けられている。幾つかの事例におけるバーコードは、配列識別子（例えば、配列ベースのバーコードまたは配列指標）と呼ばれる。幾つかの場合では、バーコードは特定のヌクレオチド配列を含む。バーコードは識別子として使用される。バーコードは、代替的に、異なるサイズ分子または同じ分子の異なる終点である。バーコードは、分子内の特異的配列および異なる終了配列を含む。例えば、同じプライマーから増幅される及び２５のヌクレオチド位置を有する分子は、増幅される及び２７のヌクレオチド位置を有する分子とは異なる。２７ｍｅｒ配列の追加の位置は随意にバーコードと考えられる。バーコードは、代替的にポリヌクレオチドに組み込まれる。バーコードは、幾つかの場合において、多くの方法によってポリヌクレオチドに組み込まれる。バーコードを組み込む幾つかの限定しない方法は、分子生物学的方法を含む。バーコードを組み込む分子生物学的方法の幾つかの限定しない例は、プライマー（例えば、テールのプライマー伸長）、プローブ（即ち、ライゲーションによるプローブへの伸長）、またはライゲーション（即ち、分子への既知の配列のライゲーション）による方法である。幾つかの場合では、バーコードはビオチン化される。ビオチン化されたバーコードは、精製の手段として随意に使用される。ビオチン化された分子の精製は、限定されないが、免疫沈降を含む方法によって達成される。幾つかの場合では、標的部位でビオチンが加えられ、サンプルＤＮＡは、例えば、エンドヌクレアーゼによって剪断されるか又はそうでなければ切断され、長さが随意に少なくとも１０キロベースであるサンプル配列が産出される。

【0087】

バーコードは、ガイドＲＮＡまたはポリヌクレオチドのあらゆる領域に種々に組み込まれる。幾つかの場合では、バーコードが組み込まれる領域は公知である。代替的に、領域は公知ではない。バーコードは、ガイドＲＮＡに沿った位置に加えられると考えられる。幾つかの場合では、バーコードは、ガイドＲＮＡの５’末端に加えられる。代替的に、バーコードは、ガイドＲＮＡの３’末端に加えられる。幾つかの場合では、バーコードは、ガイドＲＮＡの５’末端と３’末端の間に加えられる。バーコードは、１つ以上の他の既知の配列とともに加えられると考えられる。１つの限定しない例は、配列アダプターを有するバーコードの付加である。

【0088】

バーコードは、情報に関連付けられると考えられる。バーコードが情報に関連付けられる情報のタイプの幾つかの限定しない例は、次のものを含む：サンプルのソース；サンプルの方位；サンプルが処理された領域または容器；隣接したポリヌクレオチド；またはそれらの組み合わせ。

【0089】

幾つかの場合では、バーコードは、（コンビナトリアルバーコードとは異なる）配列の組み合わせから作られ、サンプルまたはゲノム座標および鎖の分子標識およびコピーが得られる異なる鋳型分子または一本鎖を特定するために使用される。幾つかの場合では、各生体分子に対するサンプル識別子、ゲノム座標、および具体的なラベルが、一緒に増幅される。バーコード、合成コード、または標識情報は、（エラーまたはエラー訂正を可能にする）コードの配列構成、コードの長さ、コードの方位、分子内のコードの位置から、および他の天然または合成のコードと組み合わせて得られる。

【0090】

幾つかの場合では、核酸分子へのバーコードの組み込みは、核酸が、与えられた期間に与えられたサンプル中に存在したことを示している。幾つかの場合では、共通のバーコードまたは共通のバーコード対を共有する連続して隣接する核酸配列は、特に、サンプルがバーコード導入前に２ｘ、１．５ｘ、１ｘ、０．７ｘ、０．５ｘ、または０．３ｘのハプロイドゲノムの平均未満に希釈される場合に、共通の分子に由来すると推測される。

【0091】

バーコードは、本明細書でサンプルの貯蔵前に加えられると考えられる。貯蔵されたサンプルの配列が決定されるときに、バーコードは、ポリヌクレオチドの残りとともに配列決定される。バーコードは、随意に、配列決定されたフラグメントをサンプルのソースと関連付けるために使用される。

【0092】

バーコードは、代替的に、撚り（ｓｔｒａｎｄｅｄｎｅｓｓ）のサンプルを特定するために使用される。幾つかの場合では、１つ以上のバーコードが一緒に使用される。２つ以上のバーコードは、代替的に、互いに隣接しているか、隣接していないか、またはその組み合わせである。アダプター方位が、しばしば、撚りを判定するために使用される。例えば、「Ａ」アダプターが、第１のプライマー伸張反応で常に５’－３’にある場合、Ａアダプターから開始する読み取りが、最初にプライミングされた鎖に相補的なもの（ｃｏｍｐｌｉｍｅｎｔ）であると推測される。

【0093】

バーコードは、本明細書でコンビナトリアル標識化における使用のためのものと考えられる。

【0094】

本明細書に示されるように、当該技術分野で知られているような標準の一文字アミノ酸残基（ｓｉｎｇｌｅ－ｌｅｔｔｅｒａｍｉｎｏａｃｉｄｒｅｓｉｄｕｅ）の略語が、細胞のリボソームに促進されたポリペプチド合成に関与する２０のアミノ酸を参照するために使用される。

【0095】

「コンビナトリアル標識化」は、２つ以上のバーコードが分子を標識するために使用される本明細書での方法である。２つ以上のバーコードはポリヌクレオチドを標識する。バーコードはそれぞれ、幾つかの場合において単独で、情報に関連付けられる。代替的に、バーコードの組み合わせはともに、情報に関連付けられる。幾つかの場合では、バーコードの組み合わせは、増幅が、サンプル鋳型の合成コピーではなく、元のサンプル鋳型から生じたことを無作為に増幅された分子において判定するために、一緒に使用される。幾つかの場合では、別のバーコードの配列と組み合わせた１つのバーコードの長さは、ポリヌクレオチドを標識するために使用される。幾つかの場合では、別のバーコードの方位と組み合わせた１つのバーコードの長さは、ポリヌクレオチドを標識するために使用される。他の場合では、１つのバーコードの配列は、ポリヌクレオチドを標識するために別のバーコードの方位とともに使用される。幾つかの場合では、ヌクレオチド間の距離と組み合わせた、第１および第２のバーコードの配列は、ポリヌクレオチドを標識または特定するために使用される。幾つかの場合では、ヌクレオチド間の距離およびヌクレオチド間の同一性と組み合わせた、第１および第２のバーコードの配列は、ポリヌクレオチドを標識または特定するために使用される。

【0096】

「縮重（Ｄｅｇｅｎｅｒａｔｅ）」は、ランダムな塩基で構成される核酸または核酸の領域に対して言及される。用語は「縮重」または「ランダム」は、核酸配列（例えば、「縮重プライマー」または「ランダムプライマー」または「縮重プローブ」あるいは「ランダムプローブ」）に言及するときに交換可能に使用される。縮重領域は可変長である。幾つかの場合では、縮重領域は、核酸全体の幾つかの部分（例えば半縮重プライマー）を含む。代替的に、縮重領域は、核酸全体（例えば「縮重プライマー」）を含む。縮重核酸混合物、または半縮重核酸混合物は、あらゆる考えられ得る塩基対の組み合わせ、あらゆる考えられ得る塩基対の組み合わせ未満、または塩基対の幾つかの組み合わせ、塩基対の少数の組み合わせ、あるいは単一の塩基対の組み合わせで構成される。縮重プライマー混合物、または半縮重プライマー混合物は、類似しているが同一ではないプライマーの混合物を含む。

【0097】

「二本鎖」は、幾つかの場合において、逆相補的な配向などで、相補的塩基対合によってアニールされた２つのポリヌクレオチド鎖を指す。

【0098】

「既知のオリゴヌクレオチド配列」または「既知のオリゴヌクレオチド」あるいは「既知の配列」は、知られているポリヌクレオチド配列を指す。幾つかの場合では、既知のオリゴヌクレオチド配列は、設計されたオリゴヌクレオチド、例えば、次世代配列決定プラットフォームのためのユニバーサルプライマー（例えば、Ｉｌｌｕｍｉｎａ、４５４）、プローブ、アダプター、タグ、プライマー、分子バーコード配列、識別子に対応している。既知の配列は、随意にプライマーの部分を含む。既知のオリゴヌクレオチド配列は、幾つかの場合において、特定のユーザーに実際には知られていないが、例えば、コンピューターによって利用可能なデータとして保存されることによって構造的に知られている。既知の配列は、随意に、実際に知られていないトレードシークレット（ｔｒａｄｅｓｅｃｒｅｔ）または１人以上のユーザーに対するシークレットであるが、ユーザーが使用している実験の特定のコンポーネント、キット、装置またはソフトウェアを設計した実体に知られている。

【0099】

「ライブラリー」は、幾つかの場合において核酸の集合を指す。ライブラリーは、随意に１つ以上の標的フラグメントを含有する。幾つかの事例では、標的フラグメントは増幅核酸を含む。他の事例では、標的フラグメントは、増幅されない核酸を含む。ライブラリーは、随意に、３’末端、５’末端または３’末端および５’末端の両方に加えられた１つ以上の既知のオリゴヌクレオチド配列を有する核酸を含有する。ライブラリーは、随意に、フラグメントが、ライブラリーのソース（例えば、患者またはＤＮＡ源を特定する分子識別バーコード）を特定する既知のオリゴヌクレオチド配列を含有するように調製される。幾つかの事例では、２つ以上のライブラリーが、ライブラリープール（ｌｉｂｒａｒｙｐｏｏｌ）を作り出すために貯蔵される。ライブラリーは、随意に、トランスポゾン媒介性の標識化、または当該技術分野で知られているような「タグ付け（ｔａｇｍｅｎｔａｔｉｏｎ）」などの、他のキットおよび技術を用いて生成される。キットは市販で入手可能である。キットの１つの限定しない例は、ＩｌｌｕｍｉｎａＮＥＸＴＥＲＡキット（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ）である。

【0100】

「遺伝子座特異的な（Ｌｏｃｕｓｓｐｅｃｉｆｉｃ）」または「遺伝子座特異的な（ｌｏｃｉｓｐｅｃｉｆｉｃ）」は、幾つかの場合において、核酸分子中の位置（例えば、染色体またはゲノム内の位置）に対応する１つ以上の遺伝子座に対して言及される。幾つかの事例では、遺伝子座は遺伝子型に関連付けられる。幾つかの事例では、遺伝子座は、例えば、ハイブリダイゼーション及び／又は他の配列ベースの技術に基づいて、サンプルから直接単離され、富化されるか、あるいは、代替的に配列の検出前に鋳型としてサンプルを使用して選択的に増幅される。幾つかの事例では、遺伝子座は、個体間のＤＮＡレベルの変動、特定の染色体に対する特異性、ＣＧ含量及び／又は選択される遺伝子座の必要とされる増幅条件、または本開示を読むことで当業者に明白となる他の特性に基づいて選択される。遺伝子座は、随意に、そのゲノムの参照配列によって示されるゲノム中の特異的なゲノムの座標または位置を指す。

【0101】

「長い核酸」は、幾つかの場合において、１、２、３、４、５、６、７、８、９、または１０キロベースより長いポリヌクレオチドを指す。

【0102】

用語「融解温度」または「Ｔ_ｍ」は一般に、二本鎖核酸分子の集団が一本鎖へと半分解離された温度を指す。核酸のＴ_ｍを計算するための方程式は当該技術分野で周知である。Ｔ_ｍ値の簡易な見積もりを与える１つの方程式は以下の通りであり：
Ｔ_ｍ＝８１．５＋１６．６（ｌｏｇ１０［Ｎａ^＋］）０．４１（％［Ｇ＋Ｃ］）－６７５／ｎ－１．０ｍ、
核酸が０．５Ｍ以下のカチオン濃度を有している水溶液中のあるときに、（Ｇ＋Ｃ）含量は３０％から７０％の間であり、ｎは塩基の数であり、およびｍは塩基対ミスマッチの割合である（例えば、ＳａｍｂｒｏｏｋＪｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，３ｒｄＥｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２００１）を参照）。他の基準は、より精巧な計算を含み、これは、Ｔ_ｍの計算のために構造的特徴に加えて配列特徴を考慮に入れる。

【0103】

「ヌクレオチド」は、塩基－糖－リン酸塩の組み合わせを指す。ヌクレオチドは、核酸配列の単量体単位（例えば、ＤＮＡおよびＲＮＡ）である。用語ヌクレオチドは、例えば、自然発生および非自然発生のリボヌクレオシド三リン酸ＡＴＰ、ＴＴＰ、ＵＴＰ、ＣＴＧ、ＧＴＰ、およびＩＴＰ、およびｄＡＴＰ、ｄＣＴＰ、ｄＩＴＰ、ｄＵＴＰ、ｄＧＴＰ、ｄＴＴＰ、またはそれらの誘導体などのデオキシリボヌクレオシド三リン酸を含む。そのような誘導体は、例えば、［ａＳ］ｄＡＴＰ、７－デアザ－ｄＧＴＰおよび７－デアザ－ｄＡＴＰ、および例えば、それらを含有している核酸分子に対するヌクレアーゼ耐性を与えるヌクレオチド誘導体を含む。本明細書に使用されるような用語ヌクレオチドはまた、ジデオキシリボヌクレオシド三リン酸（ｄｄＮＴＰｓ）およびそれらの誘導体を指す。ジデオキシリボヌクレオシド三リン酸の実例となる例は、例えば、ｄｄＡＴＰ、ｄｄＣＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰ、ｄｄＵＴＰおよびｄｄＴＴＰを含む。

【0104】

「ポリメラーゼ」は、鋳型として別のストランドを使用して、個々のヌクレオチドを一緒に鎖へと連結する酵素を指す。

【0105】

「ポリメラーゼ連鎖反応」または「ＰＣＲ」は、過剰な非特異的ＤＮＡが存在下でさえ、具体的な数の選択されたＤＮＡをインビトロで複製するための技術を指す。プライマーが選択されたＤＮＡに加えられ、そこでプライマーは、ヌクレオチドおよび典型的にＴａｑポリメラーゼなどを使用して、選択されたＤＮＡのコピーを開始する。温度を循環させることによって、選択されたＤＮＡは、反復して変性させられ、コピーされる。選択されたＤＮＡの単一のコピーは、他のランダムなＤＮＡと混合されたとしても、幾つかの場合において、何千、何百万、または何十億もの複製を得るために増幅される。ポリメラーゼ連鎖反応は、非常に少量のＤＮＡを検出且つ測定するために及びカスタマイズされた数のＤＮＡを作成するために使用される。

【0106】

用語「ポリヌクレオチド」または「核酸」は、限定されないが、様々なＤＮＡ、ＲＮＡ分子、それらの誘導体または組み合わせを含む。これらは、ｄＮＴＰ、ｄｄＮＴＰ、ＤＮＡ、ＲＮＡ、ペプチド核酸、ｃＤＮＡ、ｄｓＤＮＡ、ｓｓＤＮＡ、プラスミドＤＮＡ、コスミドＤＮＡ、染色体ＤＮＡ、ゲノムＤＮＡ、ウイルスＤＮＡ、細菌ＤＮＡ、ｍｔＤＮＡ（ミトコンドリアＤＮＡ）、ｍＲＮＡ、ｒＲＮＡ、ｔＲＮＡ、ｎＲＮＡ、ｓｉＲＮＡ、ｓｎＲＮＡ、ｓｎｏＲＮＡ、ｓｃａＲＮＡ、マイクロＲＮＡ、ｄｓＲＮＡ、リボザイム、リボスイッチおよびウイルスＲＮＡなどの種を含む。

【0107】

「プライマー」は、一般に、ポリメラーゼ連鎖反応の合成工程または特定の配列決定反応に使用されるプライマー伸張技術などにおいて、例えば、ヌクレオチドの伸長、ライゲーション及び／又は合成をプライミングするために使用されるオリゴヌクレオチドを指す。プライマーは、代替的に、特異的な核酸領域の検出のための捕捉オリゴヌクレオチドに対する遺伝子座の相補性を提供する手段としてハイブリダイゼーション技術に使用される。

【0108】

「プライマー伸張産物」は、鋳型として連続したポリヌクレオチドを使用するプライマー伸張反応から結果として生じる産物、および連続した配列に対する相補的な又は部分的に相補的なプライマーを指す。

【0109】

「配列決定（Ｓｅｑｕｅｎｃｉｎｇ）」、「配列決定（ｓｅｑｕｅｎｃｅｄｅｔｅｒｍｉｎａｔｉｏｎ）」などは、一般に、核酸中のヌクレオチド塩基の順序を決定するために使用され得る全ての生化学的方法を指す。

【0110】

「コンティグ」は、配列相同性の共通の又は重複する領域を共有する２つ以上の構成ヌクレオチド配列から構築されるヌクレオチド配列を指す。例えば、２つ以上の核酸断片のヌクレオチド配列が比較され、共通の又は重複する配列を特定するために整列される。共通の又は重複する配列が、２つ以上の核酸断片間に存在する場合、配列（およびそれ故それらの対応する核酸断片）は、単一の連続したヌクレオチド配列へと構築される。

【0111】

用語「ビオチン」は、本明細書に使用されるように、ビオチン（５－［（３ａＳ，４Ｓ，６ａＲ）－２－オキソヘキサヒドロ－１Ｈ－チエノ［３，４－ｄ］イミダゾール－４－イル］ペンタン酸）およびあらゆるビオチン誘導体およびアナログを指すように意図されている。そのような誘導体およびアナログは、ネイティブな又は修飾されたストレプトアビジンまたはアビジンのビオチン結合ポケットとの複合体を形成する物質である。そのような化合物は、例えば、イミノビオチン、デスチオビオチンおよびストレプトアビジンの親和性ペプチドを含み、ビオチン－．イプシロン．－Ｎ－リシン、ビオシチンヒドラジド、２－イミノビオチンおよびビオチニル－ε－アミノカプロン酸－Ｎ－ヒドロキシスクシンイミドエステルのアミノまたはスルフヒドリルの誘導体、スルフォ－スクシンイミド－イミノビオチン、ビオチンブロモアセチルヒドラジド、ｐ－ジアゾベンゾイルビオシチン、３－（Ｎ－マレイミドプロピオニル）ビオシチンも含む。「ストレプトアビジン」は、ビオチンに結合するタンパク質またはペプチドを指し、限定されないが、ネイティブな卵白アビジン、組換え型のアビジン、アビジンの脱グリコシル化形態、細菌性のストレプトアビジン、組換え型のストレプトアビジン、切断型のストレプトアビジン、及び／又はそれらの誘導体を含む。

【0112】

本明細書に使用されるような「被験体」は、核酸の源であり、幾つかの場合において、随意に複製するゲノムを有する、現在生存している生物またはかつて生きていた又は実体であった生物を指す。本開示の方法、キット、及び／又は組成物は、本明細書で、限定されないが、細菌および酵母などの微生物；および限定されないが、ヒトを含む動物；マウス、ラット、サル、およびチンパンジーなどの、実験動物；イヌおよびネコなどの家庭動物、およびウシ、ウマ、ブタ、ヒツジ、およびヤギなどの農業用動物を含む、１つ以上の単細胞または多細胞の被験体に適用されると考えられる。本開示の方法は、幾つかの場合において、ウイルスまたはウイルス粒子、あるいは１つ以上のウイルスによって感染された１つ以上の細胞などの、病原菌または感染病原体に適用される。幾つかの場合では、被験体は十分に合成した生物である。

【0113】

「支持体（ｓｕｐｐｏｒｔ）」は、本明細書で固形物、半固形物、ビーズ、表面であると考えられる。支持体は、随意に溶液中で可動性であるか又は固定される。

【0114】

用語「一意の識別子（ｕｎｉｑｕｅｉｄｅｎｔｉｆｉｅｒ）」は、限定されないが、分子バーコード、またはｄＵＴＰなどの、混合物中の核酸のパーセンテージを含む。

【0115】

本明細書に使用されるような「反復配列」は、核酸配列データセットにおいて単一の位置に一意にマッピングされない配列を指す。一部の反復配列は、随意に、与えられたサイズおよび正確な又はおよその配列の反復単位の整数または分数倍数として概念化される。

【0116】

本明細書に使用されるような「パリンドローム」または「回文配列」は、二重らせんを形成する１つの鎖上のリード５’（５プライム）から３’（３プライム）であろうと、または相補鎖上の５’から３’であろうと同じである核酸配列を指す。

【0117】

本明細書に使用されるような「反転配列（ｉｎｖｅｒｔｅｄｓｅｑｕｅｎｃｅ）」は、逆配列または別の配列に対する逆相補配列である配列を指す。１８０度で見つかる分子の回転で（概念的に）、同じ方向で読み取られる配列が同じ配列である場合、配列は反転される。

【0118】

本明細書に使用されるような「ハプロタイプ」は、一緒に遺伝されそうである染色体上の密接に関連した遺伝子のクラスターにおける特異的な対立遺伝子の集合を指す。

【0119】

本明細書に使用されるような「サブハプロタイプ」は、遺伝子のサブセットまたはハプロタイプの部分を指す。

【0120】

数字に関連して本明細書で使用されるような用語「約」は、±１０％の数を指す。

【0121】

本明細書に使用されるような用語「含む（ｃｏｍｐｒｉｓｅ）」は、少なくとも１つの要素の関連で、他の列挙されていない要素も含まれ得ることを示すように、包含的である。

【0122】

本明細書に使用されるように、反復またはリピート領域は、与えられた遺伝子座で局所に再発するか、またはゲノムサンプルなどの核酸サンプルの全体にわたって分散させた別々のゲノムまたは他の核酸セグメントを指す。例示的な反復セグメントは、ＨＬＡ遺伝子座内の領域、ｃｙｐ２ｄ６、ＶＤＪ領域、およびＡｌｕリピートおよびＬＩＮＥ要素などの可動因子を含む。

【0123】

本発明の方法、組成物およびキットがより詳細に記載される前に、本発明が、記載される特定の方法、組成物またはキットに限定されず、それ故当然のことながら変化することが理解されるべきである。また、本明細書で使用さる用語が、単に特定の実施形態について記述する目的のものであり、本発明の範囲が本明細書で解釈されるような添付の請求項によってのみ限定されるため、限定するようには意図されていないことも理解されるべきである。本発明を作成する及び使用する方法に関するより完全な開示および記載を当業者に提供するように実施例が明記され、これらは、発明者が本発明として見なすものの範囲を限定するようには意図されておらず、以下の実験が、実行されるすべての又は唯一の実験であることを表わすようにも意図されていない。使用される数（例えば量、温度など）に関する精度を確かなものとする努力がなされているが、いくらかの実験誤差および偏差があることも考慮されるべきである。特段他に示されない限り、部分は重量部である、分子量は平均分子量であり、温度は摂氏温度であり、圧力は気圧近くである。

【0124】

値の範囲が提供される場合、その範囲の上限と下限の間で、文脈が他に明確に指示していない限り下限の単位の１０分の１まで、各介入値が具体的に開示されることが理解される。明示された範囲内の明示された値または介入値とその明示された範囲内の他の明示された値または介入値との間の各々のより小さな範囲が、本発明内に包含される。これらのより小さな範囲の上限および下限は、範囲内に独立して含まれるか又は除外され、上限および下限のいずれか、またはその両方が、より小さな範囲に含まれる、あるいはいずれも含まれない各範囲も、明示された範囲内の具体的に除外された上限および下限に従って、本発明に包含される。明示された範囲が上限および下限の１つ又はその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲もまた、本発明に包含される。

【0125】

別段の定めのない限り、本明細書に記載される技術的かつ科学的な用語はすべて、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載される方法や材料と類似するまたは同等の任意の方法や材料を、本発明の実施または試験の際に随意に使用することができるが、可能性のあるおよび好ましい方法や材料がここで記載されている。本明細書で言及されるすべての出版物は、出版物の引用の際に関連付けられる方法および／または材料を開示および記載するために参照により本明細書に組み込まれる。本開示は矛盾の存在する程度まで、組み込まれた出版物の任意の開示に取って代わることが理解されよう。

【0126】

本開示を精読した当業者に明らかとなるように、本明細書で記載および例証された個々の実施形態の各々は、本発明の範囲または精神から逸脱することなく、他の複数の実施形態のいずれかの特徴から容易に分離され得るまたは該特徴と組み合わせ得る別の構成要素と特徴を有している。任意の列挙された方法を、列挙された事象の順序で、または論理上可能な他の順序で熟考することができる。

【0127】

本明細書および添付の請求項で使用されるように、単数形（「ａ」、「ａｎ」、および「ｔｈｅ」）は、文脈で特段の定めのない限り複数形を含むことを理解されたい。したがって、例えば、「細胞（ａｃｅｌｌ）」への言及はその複数の細胞を含み、「ペプチド（ｔｈｅｐｅｐｔｉｄｅ）」への言及は１つ以上のペプチドとその等価物、例えば、当業者に知られているポリペプチドなどへの言及を含んでいる。

【0128】

図に目を向けると、下記が見られる。

【0129】

図１は、典型的なヒトＬＩＮＥ１（Ｌ１．４）の反復要素ＤＮＡ塩基配列（ＳＥＱＩＤＮＯ：１）を示す。図１中のＰＡＭ配列の５’－３’が強調されている。

【0130】

図２は、Ｌ１ＨＡの典型的なコンセンサス配列：ＬＩＮＥ－１要素（ＳＥＱＩＤＮＯ：２）の３’末端における診断配列を示す。ＰＡＭ配列が強調されている。例となるガイドＲＮＡの相補的配列ＢＯＬＤ。

【0131】

図３は典型的なガイドＲＮＡ配列（ＳＥＱＩＤＮＯ：３）を示す。

【0132】

図４は典型的なＡｌｕ－Ｙ配列（ＳＥＱＩＤＮＯ：４）を示す。ＰＡＭ配列はこの図で強調されている。

【0133】

図５は、標的特異的なＴ７プロモーター配列の挿入を誘発する典型的なＣＲＩＳＰＲを示す。高分子二本鎖ゲノムＤＮＡは、標的特異的ガイドＲＮＡ、ＣＡＳ９タンパク質、ドナーＤＮＡ（Ｔ７プロモーターを含む）、およびリガーゼを含むＣＲＩＳＰＲ／ＣＡＳ構成要素と結合している。この図は、Ｔ７プロモーターが標的ＤＮＡ塩基配列に特異的に挿入されることを示す。

【0134】

図６は、標的ＤＮＡの典型的なインビトロ転写が標的鋳型の増幅されたＲＮＡ複製を生成することを示す。ＲＮＡ分子は随意にばらばらにされ、およびショートリードシーケンサーライブラリーに変換される、または末端にポリＡが形成され、および完全長ｃＤＮＡに逆転写される。この図は、完全長ｃＤＮＡ分子がロングリードシーケンサーライブラリーに変換されることを示す。

【0135】

図７は、標的配列の上流および下流に特異的に挿入された典型的なＴ７プロモーターを示す。インビトロ転写が、標的遺伝子座を覆う両方向において１０ｋｂを超えて起こる。

【0136】

図８は代替的なドナーＤＮＡ構築物を示す。これらの構築物は、Ｔ７プロモーター、アダプター／プライマー相補的配列、およびランダムシーケンスなどのプロモーター配列を含み得る。

【0137】

図９は、サンプル内で、挿入されたＴ７ＲＮＡポリメラーゼ部位に隣接しているゲノムの配列の線形増幅の結果を示す。結果は、２ｎｇ／ｕＬに希釈した１ｎｇの鋳型上で２、４、６、または１２時間処理した２つの酵素に関して示される。各結果において、Ｙ軸は、０．０から最大１．０まで、または場合によっては２．０にわたる蛍光ユニットを示す。Ｘ軸は、２５ｎｔｍ５００ｎｔおよび４０００ｎｔを標識した対数目盛で、ヌクレオチド内のライブラリー構築物の長さを表す。結果は、５００ベースから２ｋｂの間のメジアン径成分を有するライブラリーが、サンプル核酸に挿入されたＲＮＡプロモーターによって導かれた線形増幅を通じて機械的に作られることを示す。インビトロ転写を、ＭＥＧＡｓｃｒｉｐｔとＡｍｐｌｉＳｃｒｉｂｅＴ７ＲＮＡポリメラーゼキットを使用して、間隔をおき４回に分けて行った。反応は、２、４、６、または１２時間間隔で行われた。１反応につき１ｎｇのＤＮＡを使用した。転写後に反応物を１時間、ＤＮＡｓｅと共にインキュベートした。ＲＮＡを、ＱｕｂｉｔＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＲＮＡＡｓｓａｙキットを使用して定量化した。ＲＮＡ分析を、ＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＰｉｃｏｍＲＮＡＢｉｏａｎａｌｙｚｅｒを使用して行なった。

【0138】

図１０に目を向けると、下記が見られる。サイズを選択したＲＮＡインビトロ転写サンプルに関するＢｉｏａｎａｌｙｚｅｒトレースが提示される。Ｘ軸は、ヌクレオチドの長さ［ｎｔ］を、２５、５００および４０００ヌクレオチドが示された対数目盛上に示す。Ｙ軸は、１０間隔で０－２０の範囲の蛍光ユニット［ＦＵ］を示す（上列と中列）。２０間隔で０－４０（中列の右）、または２間隔で０－４（下列左）、または１間隔で０－３（下列右）。結果は、ＡｍｐｌｉｓｃｒｉｂｅとＭＥＧＡｓｃｒｉｐｔのＲＮＡポリメラーゼに関して示される。サンプルを２ｎｇ／ｕＬに希釈し、２日目に処理した。結果は、インビトロで転写されたサンプルが、より小さな成分を排除するために容易にサイズ選択されることを示す。

【0139】

図１１に目を向けると、変性のアガロースゲル上で処理された図１０のＲＮＡが見られる。右の階層は、０．５、１、１．５、２、２．５、３、４、５、６および９ｋｂのサイズを示す。サンプルレーンは左から、ＭＥＧＡｓｃｒｉｐｔ対照、ＭＥＧＡｓｃｒｉｐｔ１７ｎｔ排除、ＭＥＧＡｓｃｒｉｐｔ２００ｎｔ排除、ＭＥＧＡｓｃｒｉｐｔ６５Ｃインキュベーション＋１７ｎｔ排除、続いて、Ａｍｐｌｉｓｃｒｉｂｅ対照、Ａｍｐｌｉｓｃｒｉｂｅ１７ｎｔ排除、Ａｍｐｌｉｓｃｒｉｂｅ２００ｎｔ排除、およびＡｍｐｌｉｓｃｒｉｂｅ６５Ｃインキュベーション＋１７ｎｔ排除。結果は、インビトロ転写サンプルが、より小さな成分を除外するために容易にサイズ選択されることを示す。

【0140】

＜番号が付けられた実施形態の部分的なリスト＞
本明細書における開示は、番号が付けられた実施形態の以下に示す部分的なリストに関してさらに明確にされる。１．核酸分子の既知の配列の領域に隣接している配列を判定する方法であって、該方法はａ）核酸分子の既知の領域に、プロモーター配列を含む核酸フラグメントを付着させる工程；ｂ）プロモーターによって方向付けられたＮＡポリメラーゼに核酸フラグメントを接触させる工程；および、ｃ）複数のＲＮＡ分子を合成する工程；を含み、ここで、複数のＲＮＡ分子のコンセンサス配列は核酸分子の既知の領域に隣接している配列を表す。２．コンセンサス配列は長さが少なくとも１０キロベースである、実施形態１の方法である。３．複数のＲＮＡ分子の合成後に、ＤＮａｓｅを使用して核酸分子を処理する工程を含む、実施形態１または２のいずれか１つの方法。４．複数のＲＮＡ分子を逆転写する工程を含む、実施形態１～３のいずれか１つの方法。５．複数のＲＮＡ分子の核酸配列を判定する工程を含む、実施形態１～４のいずれか１つの方法。６．複数のＲＮＡ分子のコンセンサス配列は、核酸分子から直接合成された分子の配列を含む、実施形態１～５のいずれか１つの方法。７．付着工程は、核酸分子の既知の領域にプロモーター配列を含む核酸フラグメントを挿入する工程を含む、実施形態１～６のいずれか１つの方法。８．付着工程は、核酸分子の既知の配列の領域にプロモーター配列を含む核酸フラグメントを挿入する工程を含む、実施形態１～７のいずれか１つの方法。９．付着工程は、核酸分子の既知の配列の領域の配列特異的な切断工程を含む、実施形態１～８のいずれか１つの方法。１０．付着工程は、ＣＲＩＳＰＲ核酸タンパク質複合体に、核酸分子の既知の領域を接触させる工程を含む、実施形態１～９のいずれか１つの方法。１１．ＣＲＩＳＰＲ核酸タンパク質複合体は、ＳＥＱＩＤＮＯ：３を含むガイドＲＮＡを含む、実施形態１０の方法。１２．付着工程は、プロモーター配列を含む核酸フラグメントをライゲートする工程を含む、実施形態１～１１のいずれか１つの方法。１３．プロモーター配列を含む核酸フラグメントは、ウイルスプロモーターを含む、実施形態１～１２のいずれか１つの方法。１４．ウイルスプロモーターは、ウイルスＲＮＡポリメラーゼを結合し、およびＴ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓから成るリストから選択された少なくとも１つのプロモーターである、実施形態１３の方法。１５．プロモーター配列を含む核酸フラグメントは、バクテリアプロモーターを含む、実施形態１～１２のいずれか１つの方法。１６．バクテリアプロモーターは、バクテリアＲＮＡポリメラーゼを結合し、およびａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃから成るリストから選択された少なくとも１つのプロモーターである、実施形態１５の方法。１７．プロモーター配列を含む核酸フラグメントは、真核生物プロモーターを含む、実施形態１～１２のいずれか１つの方法。１８．真核生物プロモーターは、真核生物のＲＮＡポリメラーゼを結合し、およびＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６から成るリストから選択された少なくとも１つのプロモーターである、実施形態１７の方法。１９．真核生物プロモーターは、ＲＮＡｐｏｌＩプロモーター、ＲＮＡｐｏｌＩＩプロモーター、およびＲＮＡｐｏｌＩＩＩプロモーターから成るリストから選択された少なくとも１つのプロモーターである、実施形態１７の方法。２０．核酸分子の既知の領域は反復要素を含む、実施形態１～１９のいずれか１つの方法。２１．反復要素は可動挿入因子を含む、実施形態２０の方法。２２．反復要素は、ＬＩＮＥ要素、ＳＩＮＥ要素、Ａｌｕリピート、トランスポゾン、レトロトランスポゾン、セントロメア反復、およびテロメア反復の少なくとも１つを含む、実施形態２０の方法。２３．ＬＩＮＥ要素はＳＥＱＩＤＮＯ：１を含む、実施形態２０の方法。２４．核酸サンプル内の、遺伝子座に隣接する複数の配列を判定する方法であって、該方法は、ａ）プロモーターを含む核酸を要素に挿入する工程、ｂ）プロモーターによって方向づけられた複数の核酸分子を生成する工程、およびｃ）複数の核酸分子の配列を判定する工程を含み、ここで、核酸分子は核酸サンプルから直接合成され、および複数の核酸分子は遺伝子座に隣接する配列に及ぶ。２５．核酸分子はＲＮＡを含む、実施形態２４の方法。２６．核酸分子は核酸合成を刺激することができない、実施形態２４の方法。２７．核酸サンプルは癌細胞核酸を含む、実施形態２４の方法。２８．核酸サンプルは単一の核ゲノムを含む、実施形態２４の方法。２９．核酸サンプルは単一細胞から得られる、実施形態２４の方法。３０．複数のＲＮＡ分子の合成後に、ＤＮａｓｅを使用して核酸サンプルを処理する工程を含む、実施形態２４の方法。３１．複数のＲＮＡ分子を逆転写する工程を含む、実施形態２４の方法。３２．複数の核酸分子はＲＮＡ分子を含む、実施形態２４の方法。３３．複数のＲＮＡ分子のコンセンサス配列は、核酸分子から直接合成された分子の配列を含む、実施形態２４の方法。３４．付着工程は、核酸分子の既知の領域にプロモーター配列を含む核酸フラグメントを挿入する工程を含む、実施形態２４の方法。３５．付着工程は、核酸分子の既知の領域にプロモーター配列を含む核酸フラグメントを挿入する工程を含む、実施形態２４の方法。３６．付着工程は、核酸分子の既知の領域の配列特異的な切断工程を含む、実施形態２４の方法。３７．付着工程は、ＣＲＩＳＰＲ核酸タンパク質複合体に、核酸分子の既知の領域を接触させる工程を含む、実施形態２４の方法。３８．ＣＲＩＳＰＲ核酸タンパク質複合体は、ＳＥＱＩＤＮＯ：３を含むガイドＲＮＡを含む、実施形態２４の方法。３９．付着工程は、プロモーター配列を含む核酸フラグメントをライゲートする工程を含む、実施形態２４の方法。４０．プロモーター配列を含む核酸フラグメントは、ウイルスプロモーターを含む、実施形態２４の方法。４１．ウイルスプロモーターは、Ｔ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓから成るリストから選択された少なくとも１つのプロモーターである、実施形態４０の方法。４２．プロモーター配列を含む核酸フラグメントは、バクテリアプロモーターを含む、実施形態２４つの方法。４３．バクテリアプロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃから成るリストから選択された少なくとも１つのプロモーターである、実施形態４２の方法。４４．プロモーター配列を含む核酸フラグメントは、真核生物プロモーターを含む、実施形態２４の方法。４５．真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６から成るリストから選択された少なくとも１つのプロモーターである、実施形態４４の方法。４６．真核生物プロモーターは、ＲＮＡｐｏｌＩプロモーター、ＲＮＡｐｏｌＩＩプロモーター、およびＲＮＡｐｏｌＩＩＩプロモーターから成るリストから選択された少なくとも１つのプロモーターである、実施形態４４の方法。４７．核酸分子の既知の領域は反復要素を含む、実施形態２４の方法。４８．反復要素は可動挿入因子を含む、実施形態４７の方法。４９．反復要素は、ＬＩＮＥ要素、ＳＩＮＥ要素、Ａｌｕリピート、トランスポゾン、レトロトランスポゾン、セントロメア反復、およびテロメア反復の少なくとも１つを含む、実施形態４７の方法。５０．ＬＩＮＥ要素はＳＥＱＩＤＮＯ：１を含む、実施形態４７の方法。５１．核酸サンプル内の、反復可動因子の境界の少なくとも９０％に対する境界隣接配列をコードする核酸を含む核酸ライブラリー。５２．ライブラリー成分と核酸サンプル間の不一致が独立して抽出される、実施形態５１の核酸ライブラリー。５３．前記反復要素の境界の少なくとも５０％が、少なくとも１００の複製に存在する、実施形態５１の核酸ライブラリー。５４．ライブラリー成分は核酸サンプルから直接抽出される、実施形態５１の核酸ライブラリー。５５．ライブラリー構成要素は、配列決定に先立ってクローン的に増幅されない、実施形態５１の核酸ライブラリー。５６．核酸サンプルは単一の細胞に由来する、実施形態５１の核酸ライブラリー。５７．核酸ライブラリーはＲＮＡ中間体から逆転写される、実施形態５１の核酸ライブラリー。５８．核酸ライブラリーはＲＮＡを含む、実施形態５１の核酸ライブラリー。５９．核酸ライブラリー成分はプロモーター配列を含む、実施形態５１の核酸ライブラリー。６０．ＲＮＡプロモーター配列は、Ｔ７、Ｔ３、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、ＣａＭＶ３５Ｓ、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、Ｐｔａｃ、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６の少なくとも１つを含む、実施形態５９の核酸ライブラリー。６１．少なくとも１つの境界隣接配列は、細胞周期調節、ＤＮＡ修復および成長調節の少なくとも１つに関係する、遺伝子における欠陥を示す、実施形態５１の核酸ライブラリー。６２．核酸ライブラリーが、核酸サンプル内の、反復可動因子の境界の少なくとも９５％に対する境界隣接配列をコードする核酸を含む、実施形態５１の核酸ライブラリー。６３．核酸ライブラリーが、核酸サンプル内の、反復可動因子の境界の少なくとも９９％に対する境界隣接配列をコードする核酸を含む、実施形態６２の核酸ライブラリー。６４．ライブラリー成分核酸の少なくとも５０％は、可動因子の境界から２０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。６５．ライブラリー成分核酸の少なくとも７５％は、可動因子の境界に隣接した、可動因子の境界から２０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。６６．ライブラリー成分核酸の少なくとも９０％は、可動因子の境界から２０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。６７．ライブラリー成分核酸の少なくとも５０％は、可動因子の境界から１０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。６８．ライブラリー成分核酸の少なくとも７５％は、可動因子の境界に隣接した、可動因子の境界から１０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。６９．ライブラリー成分核酸の少なくとも９０％は、可動因子の境界から１０ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７０．ライブラリー成分核酸の少なくとも５０％は、可動因子の境界から５ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７１．ライブラリー成分核酸の少なくとも７５％は、可動因子の境界に隣接した、可動因子の境界から５ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７２．ライブラリー成分核酸の少なくとも９０％は、可動因子の境界から５ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７３．ライブラリー成分核酸の少なくとも５０％は、可動因子の境界から１ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７４．ライブラリー成分核酸の少なくとも７５％は、可動因子の境界に隣接した、可動因子の境界から１ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７５．ライブラリー成分核酸の少なくとも９０％は、可動因子の境界から１ｋｂ以内の核酸に位置づけられる、実施形態５１の核酸ライブラリー。７６．平均のフラグメント長さは約５００ベースである、実施形態５１～７５のいずれか１つの核酸ライブラリー。７７．平均のフラグメント長さは約１０００ベースである、実施形態５１
～７５のいずれか１つの核酸ライブラリー。７８．中央値のフラグメント長さは約５００ベースである、実施形態５１～７５のいずれか１つの核酸ライブラリー。７９．中央値のフラグメント長さは約１０００ベースである、実施形態５１～７５のいずれか１つの核酸ライブラリー。８０．標的とする配列およびプロモーターを含む組成物であって、該標的とする配列は、核酸配列内の１つ以上の特定位置への組成物の挿入を導く核酸配列を含み、および該プロモーターはプロモーターの挿入に隣接したサンプル配列からの核酸合成を導く核酸配列を含む。８１．標的とする配列は特定位置と一致する核酸配列を含む、実施形態８０の組成物。８２．標的とする配列は特定位置と塩基対合する核酸配列を含む、実施形態８０の組成物。８３．標的とする配列は特定位置とハイブリダイズする核酸配列を含む、実施形態８０の組成物。８４．標的とする配列は、クラスター化して規則的な配置の短い回分配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、ＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む、実施形態８０～８３のいずれか１つの組成物。８５．ＣＲＩＳＰＲ配列はＳＥＱＩＤＮＯ：３を含む配列を伴うガイドＲＮＡを含む、実施形態８４の組成物。８６．ポロモーターは、バクテリアプロモーター、ウイルスプロモーター、および真核生物プロモーターの少なくとも１つを含む、実施形態８０～８５のうちのいずれか１つの組成物。８７．バクテリアプロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃの少なくとも１つを含む、実施形態８６の組成物。８８．ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓの少なくとも１つを含む、実施形態８６の組成物。８９．真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＡＬＢ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６の少なくとも１つを含む、実施形態８６の組成物。９０．核酸配列における特定位置は低複雑性核酸配列を含む、実施形態８０～８９のいずれか１つの組成物。９１．核酸配列における特定位置は反復核酸配列を含む、実施形態８０～９０のいずれか１つの組成物。９２．低複雑性核酸配列または反復核酸配列は、トリ－ヌクレオチドリピート、縦列反復、およびヒト白血球抗原遺伝子の少なくとも１つを含む、実施形態８０～９１のいずれか１つの組成物。９３．核酸配列における特定位置は可動遺伝因子を含む、実施形態８０～９１のいずれか１つの組成物。９４．可動因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、ＩＡＰ（ｉｎｔｒａｃｉｓｔｅｒｎａｌＡｐａｒｔｉｃｌｅ）、ＥＴｎ、ウイルス、およびそれらのフラグメントの少なくとも１つを含む、実施形態９３の組成物。９５．レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、およびそれらのフラグメントの少なくとも１つを含む、実施形態９４の組成物。９６．ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む、実施形態９４の組成物。９７．ウイルスはレトロウイルスまたはそのフラグメントを含む、実施形態９４の組成物。９８．核酸合成はＲＮＡ転写およびＤＮＡ合成の少なくとも１つを含む、実施形態８０～９７のいずれか１つの組成物。９９．対象の核酸配列に隣接した核酸配列を判定する方法であって、該方法は：（ａ）標的とする配列およびプロモーターを含む、標的とする核酸配列を、対象の核酸配列内の１つ以上の特定位置に挿入する工程、（ｂ）プロモーターからの核酸合成を導く工程、および（ｃ）合成された核酸を配列決定する工程、を含む。１００．標的とする配列は、クラスター化して規則的な配置の短い回分配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、ＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む、実施形態９９の方法。１０１．ＣＲＩＳＰＲ配列はＳＥＱＩＤＮＯ：３を含む配列を伴うガイドＲＮＡを含む、実施形態１００の組成物。１０２．プロモーターは、バクテリアプロモーター、ウイルスプロモーター、および真核生物プロモーターの少なくとも１つを含む、実施形態９９～１０１のいずれか１つの実施形態の方法。１０３．バクテリアプロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃの少なくとも１つを含む、実施形態１０２の方法。１０４．ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓの少なくとも１つを含む、実施形態１０２の方法。１０５．真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６の少なくとも１つを含む、実施形態１０２の方法。１０６．対象の配列は低複雑性核酸配列を含む、実施形態９９～１０５のいずれか１つの方法。１０７．対象の配列は反復核酸配列を含む、実施形態９９～１０６のいずれか１つの方法。１０８．対象の配列は、トリ－ヌクレオチドリピート、縦列反復、およびヒト白血球抗原遺伝子の少なくとも１つを含む、実施形態９９～１０７のいずれか１つの方法。１０９．対象の配列は可動遺伝因子を含む、実施形態９９～１０８のいずれか１つの方法。１１０．可動遺伝因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、ＩＡＰ（ｉｎｔｒａｃｉｓｔｅｒｎａｌＡｐａｒｔｉｃｌｅ）、ＥＴｎ、ウイルス、およびそれらのフラグメントを含む、実施形態１０９の方法。１１１．レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、およびそれらのフラグメントの少なくとも１つを含む、実施形態１１０の方法。１１２．ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む、実施形態１１１の方法。１１３．ウイルスは、レトロウイルスおよびそのフラグメントの少なくとも１つを含む、実施形態１１０の方法。１１４．核酸合成はＲＮＡ転写およびＤＮＡ合成の少なくとも１つを含む、実施形態９９～１１３のいずれか１つの方法。１１５．ＲＮＡ転写はＲＮＡポリメラーゼの使用を含む、実施形態１１４の方法。１１６．ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、および単一のサブユニットＲＮＡポリメラーゼの少なくとも１つを含む、実施形態１１５の方法。１１７．ＤＮＡ合成はＤＮＡポリメラーゼの使用を含む、実施形態９９～１１４のいずれか１つの方法。１１８．ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、およびＰｆｕＤＮＡポリメラーゼの少なくとも１つを含む、実施形態１１７の方法。１１９．核酸合成はプライマーを必要とする、実施形態９９～１１８のいずれか１つの方法。１２０．合成された核酸は、対象の核酸配列から直接合成される、実施形態９９～１１９のいずれか１つの方法。１２１．核酸は突然変異の導入なしで合成される、実施形態９９～１２０のいずれか１つの方法。１２２．突然変異は点突然変異、欠失、挿入およびキメラの少なくとも１つである、実施形態１２１の方法。１２３．合成された核酸はＤＮＡを含む、実施形態９９～１２２のいずれか１つの方法。１２４．合成された核酸はｃＤＮＡを含む、実施形態９９～１２２のいずれか１つの方法。１２５．合成された核酸はリボヌクレアーゼで処理される、実施形態１２３または実施形態１２４の方法。１２６．合成された核酸はａＲＮＡを含む、実施形態９９～１２２のいずれか１つの方法。１２７．合成された核酸はＤＮａｓｅで処理される、実施形態１２６の方法。１２８．配列決定は、サンガー法、次世代配列決定、ピロシーケンス、ＭＰＳＳ法（Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｇｎａｔｕｒｅｓｅｑｕｅｎｃｉｎｇ）、単分子リアルタイム配列決定、イオントレントシーケンサー、合成による配列決定、およびライゲーションによる配列決定の少なくとも１つを含む、実施形態９９～１２７のいずれか１つの方法。１２９．方法は、被験体における突然変異を検知する、実施形態９９～１２８のいずれか１つの方法。１３０．方法は、被験体から得た組織サンプルにおける突然変異を検知する、実施形態９９～１２８のいずれか１つの方法。１３１．組織サンプルは、腫瘍、血液、唾液、痰、皮膚、および上皮組織の少なくとも１つを含む、実施形態１３０の方法。１３２．被験体からの核酸サンプルにおける、ＤＮＡ要素の挿入部位をマッピングする方法であって、該方法は：ｉ）ゲノムＤＮＡを、標的とする配列、および標的とする配列をＤＮＡ要素に挿入するのに十分な１つ以上の試薬と接触させることによって、標的とする配列およびプロモーターを含む標的とする核酸配列を挿入する工程；ｉｉ）プロモーターからの核酸合成を触媒する１つ以上の酵素に、挿入された標的とする配列を接触させ、それによって増幅された核酸を生じさせることで、増幅された核酸をゲノムＤＮＡから直接生成する工程；ｉｉｉ）増幅された核酸を配列決定する工程、を含む。１３３．標的とする配列は、クラスター化して規則的な配置の短い回分配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、ＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む、実施形態１３２の方法。１３４．ＣＲＩＳＰＲ配列はＳＥＱＩＤＮＯ：３を含む配列を伴うガイドＲＮＡを含む、実施形態１３３の組成物。１３５．プロモーターは、バクテリアプロモーター、ウイルスプロモーター、および真核生物プロモーターの少なくとも１つを含む、実施形態１３２～１３４のいずれか１つの方法。１３６．バクテリアプロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃの少なくとも１つを含む、実施形態１３５の方法。１３７．ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓの少なくとも１つを含む、実施形態１３５の方法。１３８．真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６の少なくとも１つを含む、実施形態１３５の方法。１３９．ＤＮＡ要素は低複雑性核酸配列を含む、実施形態１３２～１３８のいずれか１つの方法。１４０．ＤＮＡ要素は反復核酸配列を含む、実施形態１３２～１３９のいずれか１つの方法。１４１．ＤＮＡ要素は、トリ－ヌクレオチドリピート、および縦列反復の少なくとも１つを含む、実施形態１３２～１４０のいずれか１つの方法。１４２．ＤＮＡ要素は可動遺伝因子を含む、実施形態１３２～１４１のいずれか１つの方法。１４３．可動因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、ＩＡＰ（ｉｎｔｒａｃｉｓｔｅｒｎａｌＡｐａｒｔｉｃｌｅ）、ＥＴｎ、ウイルス、およびそれらのフラグメントの少なくとも１つを含む、実施形態１４２の方法。１４４．レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、およびそれらのフラグメントの少なくとも１つを含む、実施形態１４３の方法。１４５．ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む、実施形態１４４の方法。１４６．ウイルスはレトロウイルスまたはそ
のフラグメントを含む、実施形態１４３の方法。１４７．酵素はＲＮＡポリメラーゼを含む、実施形態１３２～１４６の方法。１４８．ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、および単一のサブユニットＲＮＡポリメラーゼの少なくとも１つを含む、実施形態１４７の方法。１４９．酵素はＤＮＡポリメラーゼである、実施形態１３２～１４８のいずれか１つの方法。１５０．ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、およびＰｆｕＤＮＡポリメラーゼの少なくとも１つを含む、実施形態１４９の方法。１５１．核酸合成はプライマーを必要とする、実施形態１３２～１５０のいずれか１つの方法。１５２．合成された核酸は、対象の核酸配列から直接合成される、実施形態１３２～１５１のいずれか１つの方法。１５３．核酸は突然変異の導入なしで合成される、実施形態１３２～１５２のいずれか１つの方法。１５４．突然変異は点突然変異、欠失、挿入およびキメラの少なくとも１つである、実施形態１５３の方法。１５５．合成された核酸はＤＮＡである、実施形態１３２～１５４のいずれか１つの方法。１５６．合成された核酸はｃＤＮＡである、実施形態１３２～１５４のいずれか１つの方法。１５７．合成された核酸はＲＮａｓｅで処理される、実施形態１５５の方法。１５８．合成された核酸はＲＮＡである、実施形態１３２～１５４のいずれか１つの方法。１５９．合成された核酸はＤＮａｓｅで処理される、実施形態１５８の方法。１６０．配列決定は、サンガー法、次世代配列決定、ピロシーケンス、ＭＰＳＳ法（Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｇｎａｔｕｒｅｓｅｑｕｅｎｃｉｎｇ）、単分子リアルタイム配列決定、イオントレントシーケンサー、合成による配列決定、およびライゲーションによる配列決定の少なくとも１つを含む、実施形態１３２～１５９のいずれか１つの方法。１６１．方法は、被験体における突然変異を検知する、実施形態１３２～１６０のいずれか１つの方法。１６２．方法は、被験体から得た組織サンプルにおける突然変異を検知する、実施形態１３２～１６０のいずれか１つの方法。１６３．組織サンプルは、腫瘍、血液、唾液、痰、皮膚、および上皮組織の少なくとも１つを含む、実施形態１６２の方法。１６４．反復ゲノム領域を配列決定する方法であって、該方法は：ｉ）ゲノムＤＮＡを、標的とする配列、および標的とする配列を反復ゲノム領域に挿入するのに十分な１つ以上の試薬と接触させることによって、標的とする配列およびプロモーターを含む標的とする核酸配列を挿入する工程；ｉｉ）プロモーターからの核酸合成を触媒する１つ以上の酵素に、挿入された標的とする配列を接触させ、それによって増幅された核酸を生じさせることで、増幅された核酸をゲノムＤＮＡから直接生成する工程；ｉｉｉ）増幅された核酸を配列決定する工程、を含む。１６５．標的とする配列は、クラスター化して規則的な配置の短い回分配列リピート（ＣＲＩＳＰＲ）配列、ジンクフィンガーヌクレアーゼ（ＺＦＮ）配列、ＴＡＬエフェクターヌクレアーゼ（ＴＡＬＥＮ）配列の少なくとも１つを含む、実施形態１６４の方法。１６６．ＣＲＩＳＰＲ配列はＳＥＱＩＤＮＯ：３を含む配列を伴うガイドＲＮＡを含む、実施形態１６５の組成物。１６７．プロモーターは、バクテリアプロモーター、ウイルスプロモーター、および真核生物プロモーターの少なくとも１つを含む、実施形態１６４～１６６のいずれか１つの方法。１６８．バクテリアプロモーターは、ａｒａＢＡＤ、ｔｒｐ、ｌａｃ、およびＰｔａｃの少なくとも１つを含む、実施形態１６７の方法。１６９．ウイルスプロモーターは、Ｔ７、Ｔ７ｌａｃ、ＳＰ６、ｐＬ、ＣＭＶ、ＳＶ４０、およびＣａＭＶ３５Ｓの少なくとも１つを含む、実施形態１６７の方法。１７０．真核生物プロモーターは、ＥＦ１ａ、ＰＧＫ１、Ｕｂｃ、ベータアクチン、ＣＡＧ、ＴＲＥ、ＵＡＳ、Ａｃ５、ポリヘドリン、ＣａＭＫＩＩａ、ＧＡＬ１、ＧＡＬ１０、ＴＥＦ１、ＧＤＳ、ＡＤＨ１、Ｕｂｉ、Ｈ１、およびＵ６の少なくとも１つを含む、実施形態１６７の方法。１７１．反復ゲノム領域は低複雑性核酸配列を含む、実施形態１６４～１７０のいずれか１つの方法。１７２．反復ゲノム領域は反復核酸配列を含む、実施形態１６４～１７１のいずれか１つの方法。１７３．反復ゲノム領域は、トリ－ヌクレオチドリピート、および縦列反復の少なくとも１つを含む、実施形態１６４～１７２のいずれか１つの方法。１７４．反復ゲノム領域は可動遺伝因子を含む、実施形態１６４～１７３のいずれか１つの方法。１７５．可動因子は、トランスポゾン、レトロトランスポゾン、ＤＮＡトランスポゾン、挿入配列、プラスミド、バクテリオファージ、グループＩＩイントロン、グループＩイントロン、Ａｌｕ要素、ＭＩＲ要素、ＩＡＰ（ｉｎｔｒａｃｉｓｔｅｒｎａｌＡｐａｒｔｉｃｌｅ）、ＥＴｎ、ウイルス、およびそれらのフラグメントの少なくとも１つを含む、実施形態１７４の方法。１７６．レトロトランスポゾンは、転位因子、ＬＩＮＥ、ＳＩＮＥ、およびそれらのフラグメントの少なくとも１つを含む、実施形態１７５の方法。１７７．ＬＩＮＥはＳＥＱＩＤＮＯ：１を含む、実施形態１７６の方法。１７８．ウイルスはレトロウイルスまたはその破片を含む、実施形態１７５の方法。１７９．酵素はＲＮＡポリメラーゼを含む、実施形態１６４～１７８の方法。１８０．ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、Ｔ３ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、ＲＮＡポリメラーゼＩ、ＲＮＡポリメラーゼＩＩ、ＲＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＶ、ＲＮＡポリメラーゼＶ、および単一のサブユニットＲＮＡポリメラーゼの少なくとも１つを含む、実施形態１７９の方法。１８１．酵素はＤＮＡポリメラーゼを含む、実施形態１６４～１７８のいずれか１つの方法。１８２．ＤＮＡポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ３ＤＮＡポリメラーゼ、ＳＰ６ＤＮＡポリメラーゼ、ＤＮＡポリメラーゼＩ、ＤＮＡポリメラーゼＩＩ、ＤＮＡポリメラーゼＩＩＩ、ＴａｑＤＮＡポリメラーゼ、およびＰｆｕＤＮＡポリメラーゼの少なくとも１つを含む、実施形態１８１の方法。１８３．核酸合成はプライマーを必要とする、実施形態１６４～１８２のいずれか１つの方法。１８４．合成された核酸は、対象の核酸配列から直接合成される、実施形態１６４～１８３のいずれか１つの方法。１８５．核酸は突然変異の導入なしで合成される、実施形態１６４～１８４のいずれか１つの方法。１８６．突然変異は点突然変異、欠失、挿入およびキメラの少なくとも１つである、実施形態１８５の方法。１８７．合成された核酸はＤＮＡである、実施形態１６４～１８６のいずれか１つの方法。１８８．合成された核酸はｃＤＮＡである、実施形態１６４～１８６のいずれか１つの方法。１８９．合成された核酸はＲＮａｓｅで処理される、実施形態１８７または実施形態１８８の方法。１９０．合成された核酸はａＲＮＡである、実施形態１６４～１８６のいずれか１つの方法。１９１．合成された核酸はＤＮａｓｅで処理される、実施形態１９０の方法。１９２．配列決定は、サンガー法、次世代配列決定、ピロシーケンス、ＭＰＳＳ法（Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｇｎａｔｕｒｅｓｅｑｕｅｎｃｉｎｇ）、単分子リアルタイム配列決定、イオントレントシーケンサー、合成による配列決定、およびライゲーションによる配列決定の少なくとも１つを含む、実施形態１６４～１９１のいずれか１つの方法。１９３．方法は、被験体における突然変異を検知する、実施形態１６４～１９２のいずれか１つの方法。１９４．方法は、被験体から得た組織サンプルにおける突然変異を検知する、実施形態１６４～１９２のいずれか１つの方法。１９５．組織サンプルは、腫瘍、血液、唾液、痰、皮膚、および上皮組織の少なくとも１つを含む、実施形態１９４の方法。

【0141】

本明細書で議論された出版物は、本出願の出願日よりも前に開示するためだけに提供される。本発明が先行発明によるこうした公開に先行するという資格がないという承認として解釈されるものは本明細書には何もない。さらに、提供される公開日は、独立して確認される必要があることもある実際の公開日とは異なり得る。

【実施例】

【0142】

以下の例は、本発明の様々な実施形態を例証する目的で与えられ、いかなるやり方でも本発明を制限することを意図していない。本実施例は、本明細書に記載される方法と共に、好ましい実施形態を現時点において代表するものであり、典型的なものであるが、本発明の範囲を制限する意図はない。それらにおける変更、および特許請求の範囲により定義されるような本発明の趣旨に含まれる他の用途を、当業者は見出すだろう。

【0143】

＜実施例１：ＨＬＡ遺伝子の標的特異的増幅＞
ＨＬＡ領域は、ショートリードシーケンサーで構築するのが困難なことで有名である。それらは非常に多形性であると共に、非常に反復的である。例となる座標ｃｈｒ６：２９，９４０，０００－２９，９４２，０００においてＨＬＡ－Ａ遺伝子プロモーターの上流に設計されたガイドＲＮＡは、配列の約５ｋｂにおいて全ＨＬＡ遺伝子に及ぶＴ７転写されたＲＮＡ生成物を生成する潜在力を有するだろう。

【0144】

ＨＬＡ遺伝子を配列決定するために、Ｔ７プロモーターが挿入されたＨＬＡプロモーターからの標的配列を含むように、プラスミドを設計する。標的配列を、ＣＲＩＳＰＲ系におけるＣａｓ９により最も効果的に機能するように選択する。一旦標的配列およびＴ７プロモーターを含むプラスミドが設計され調製されると、ガイドＲＮＡが転写され、および結果としてもたらされたガイドＲＮＡはゲノムＤＮＡサンプルおよび単離したＣａｓ９酵素と共にインキュベートされる。代替的に、ガイドＲＮＡを２本鎖直線鋳型から合成、または生成する。続いて、結果としてもたらされた生成物、すなわちＨＬＡ－Ａ遺伝子のプロモーター領域に挿入されたＴ７プロモーターを有するタグ付きゲノムＤＮＡサンプルを精製する。タグ付きゲノムＤＮＡサンプルを、ヌクレオチド、およびＨＬＡ－Ａ遺伝子からのＲＮＡ転写を引き起こすＴ７ＲＮＡポリメラーゼと共にインキュベートする。各転写は、タグ付きゲノムＤＮＡサンプルから直接行われ、および挿入、欠失または点突然変異などの欠陥はない。その後、ＲＮＡサンプルをタグ付きゲノムＤＮＡサンプルから精製し、およびポリアデニル化する。ｃＤＮＡは、逆転写酵素反応におけるＲＮＡサンプルおよびオリゴチミジンから作られる。ＲＮＡを、ＲＮａｓｅＨを使用してｃＤＮＡから取り除き、および、この方法において可能な限り高い精度でＨＬＡ－Ａ遺伝子の配列を判定するために、ｃＤＮＡを配列決定反応において使用する。ＨＬＡ－Ａ遺伝子の配列は、ゲノムＤＮＡサンプルを採取した被験者に関する情報を提供し、それによってＨＬＡ－Ａ遺伝子の正確なＨＬＡ型判定をもたらす。

【0145】

＜実施例２：腫瘍におけるＬＩＮＥ－１再配置などの体性可動因子の特定＞
ＬＩＮＥ－１再配置は、２０の細胞分裂ごとに１回、ゲノム物質を再配置させると推測される。転位の背後のメカニズムは、標準ＬＩＮＥ－１要素配列の外側のゲノムＤＮＡ配列のコピー・アンド・ペーストを含む場合もあり、および新しい位置にその配列を挿入し得る。この「タグに沿う」ゲノム物質の公開されている例は、場合によっては長さ１０キロベースもある。短い読み取り配列は、マッピングを基にした集合体が、短い読み取り集合体に使用された基準ゲノムと矛盾している新たな位置に、組み換えられたゲノム物質に対応する短い読み取りを配置しないため、これらの事象をマッピングする性能を持っていない。１０キロベースを超える長さの隣接する分子を通じた、および隣接するゲノム配列への配列決定能力は、これらの事象を特定し定量化する能力を有する。ヒトＬＩＮＥ－１要素の保存領域に対して相補的な標的配列を有するガイドＲＮＡは、保存されたＬＩＮＥ－１診断配列から隣接する配列の方への、Ｔ７に基づく転写を可能にする。腫瘍と生成物の正常な配列決定の比較は、比類ない精度で体細胞のＬＩＮＥ－１再配置を明らかにする。保存されたＬＩＮＥ－１要素配列にわたり、同様に３’および５’末端の両方に沿った多数のＴ７挿入は、腫瘍内の完全長の体細胞Ｌ１転位を特定する能力を付加する。腫瘍の６０％が体細胞Ｌ１事象を有すると推測される。

【0146】

腫瘍におけるＬＩＮＥ－１再配置の部位をマッピングするために、プラスミドを、ＬＩＮＥ－１要素における配列およびＴ７プロモーターに相補的な標的配列を含むように構成する。標的配列を、ＣＲＩＳＰＲ系においてＣａｓ９により最も効果的に機能するように選択する。ガイドＲＮＡは、プラスミド、標的配列を含むガイドＲＮＡ、およびＴ７プロモーターから作られる。ガイドＲＮＡは、腫瘍からのゲノムＤＮＡサンプルおよび単離したＣａｓ９酵素と共にインキュベートされる。結果としてもたらされる生成物、すなわち標的とされたＬＩＮＥ－１配列に挿入されたＴ７プロモーターを有するタグ付きゲノムＤＮＡサンプルを精製する。タグ付きゲノムＤＮＡサンプルを、ヌクレオチド、およびＬＩＮＥ－１要素からのＲＮＡ転写を引き起こすＴ７ＲＮＡポリメラーゼと共にインキュベートする。各転写は、タグ付きゲノムＤＮＡサンプルから直接行われ、および挿入、欠失または点突然変異などの欠陥はない。その後、ＲＮＡサンプルをタグ付きゲノムＤＮＡサンプルから精製し、およびポリアデニル化する。ｃＤＮＡは、逆転写酵素反応におけるＲＮＡサンプルおよびオリゴチミジンから作られる。ＲＮａｓｅＨを使用してＲＮＡをｃＤＮＡから除去し、および、ＬＩＮＥ－１要素に隣接しているゲノムＤＮＡの配列を判定し、それによってＬＩＮＥ－１要素の位置を判定するために、ｃＤＮＡを配列決定反応において使用する。腫瘍サンプルにおける要素および付加的なＬＩＮＥ－１要素の位置は、腫瘍の治療に効果があるであろう特殊療法などの診断情報を医師に与える。

【0147】

＜実施例３：ハンチントン病におけるトリ－ヌクレオチドリピート長の長さの判定＞
ハンチントン病は、筋協調、認知能力および行動に影響する神経変性の遺伝病である。ハンチンチン遺伝子における十分に立証された突然変異が疾病の原因であり、それは常染色体顕性遺伝する。突然変異は、遺伝子のコード配列で見つかったＣＡＧトリヌクレオチドのリピート伸張の、家族のある世代から次の世代への伸長である。このＣＡＧトリヌクレオチドはアミノ酸グルタミンをコードし、したがってＣＡＧリピートの伸張は、結果としてもたらされるタンパク質におけるポリグルタミンの伸張をもたらす。伸長したポリヌクレオチド領域の正確な配列を得ることが課題である。リピート領域のサイズが患者の疾患状態に影響するため、リピート領域の配列およびしたがってサイズを判定することが望ましい。

【0148】

ＣＡＧリピートのサイズを判定するために、プラスミドを、ハンチンチン遺伝子における配列およびＴ７プロモーターに相補的な標的配列を含むように構成する。標的配列を、ＣＲＩＳＰＲ系におけるＣａｓ９により最も効果的に機能するように選択する。ガイドＲＮＡは、プラスミド、標的配列を含むガイドＲＮＡ、およびＴ７プロモーターから作られる。ガイドＲＮＡは、腫瘍からのゲノムＤＮＡサンプルおよび単離したＣａｓ９酵素と共にインキュベートされる。結果としてもたらされる生成物、すなわち標的とされたハンチンチン配列に挿入されたＴ７プロモーターを有するタグ付きゲノムＤＮＡサンプルを、精製する。タグ付きゲノムＤＮＡサンプルを、ヌクレオチド、およびハンチンチン遺伝子からのＲＮＡ転写を引き起こすＴ７ＲＮＡポリメラーゼと共にインキュベートする。各転写は、タグ付きゲノムＤＮＡサンプルから直接行われ、および挿入、欠失または点突然変異などの欠陥はない。その後、ＲＮＡサンプルをタグ付きゲノムＤＮＡサンプルから精製し、およびポリアデニル化する。ｃＤＮＡは、逆転写酵素反応におけるＲＮＡサンプルおよびオリゴチミジンから作られる。ＲＮＡを、ＲＮａｓｅＨを使用してｃＤＮＡから除去し、および、ハンチンチン遺伝子におけるＣＡＧリピートの配列を判定するために、ｃＤＮＡを配列決定反応において使用する。ハンチンチン遺伝子におけるＣＡＧリピートの数は、疾患の予期される重症度に関して、医師および患者に診断情報を与える。

【0149】

＜実施例４：ヘアピンタグをゲノムに挿入するためのＣＲＩＳＰＲ／ＣＡＳの使用＞
遺伝子のゲノム座において、ゲノムの標的部位における二本鎖切断を生成するためのＣＲＩＳＰＲ／ＣＡＳを使用して、Ｃｙｐ２ｄ６遺伝子を配列決定のために選択する。標的部位の１つの鎖を露出しているエキソヌクレアーゼでＤＮＡサンプルを処理することにより、二本鎖切断を粘着末端にする。タグ付き核酸は、露出した鎖、Ｔ７プロモーター、および自己補足的でヘアピン型を形成する部分に相補的な核酸配列を有する部分を含む。ＤＮＡリガーゼは、標的部位に核酸をライゲートし、それによってＣｙｐ２ｄ６遺伝子の近くにＴ７プロモーターを組み込む。ヘアピンタグは、標的部位にタグをライゲートするのに効果的であり、およびその部位は標的とされたＣｙｐ２ｄ６遺伝子のＲＮＡ転写への準備ができている。タグは、Ｃｙｐ２ｄ６遺伝子がＣｙｐ２ｄ６偽遺伝子と区別され、配列決定のために独自にタグ付けされることを可能にする。

【0150】

＜実施例５：インビトロ転写されたＲＮＡのサイズ選択＞
インビトロでの転写を、Ｔ７プロモーターを挿入されたＤＮＡを含む１ｎｇのＤＮＡサンプルにおいて行なった。反応は、１２時間行われた。ＭＥＧＡｓｃｒｉｐｔＴ７およびＡｍｐｌｉＳｃｒｉｂｅＴ７の両方を、転写を推進するために使用した。反応物を、転写後に１時間、ＤＮＡｓｅと共にインキュベートした。ＲＮＡを、ＱｕｂｉｔＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＲＮＡＡｓｓａｙキットを使用して定量化した。ＲＮＡ分析を、ＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＰｉｃｏｍＲＮＡＢｉｏａｎａｌｙｚｅｒを使用して行なった。

【0151】

サイズ排除は、サブ１７ｎｔサイズ排除；１０分間、６５℃でのサブ２００ｎｔサイズ排除のインキュベーション、続いてサブ１７ｎｔサイズ排除；および排除されない対照、を含んでいた。生成物はホルムアルデヒド（変性の）アガロースゲル上で動かされる。

【0152】

結果は、以下の表１に示される。

【0153】

【表1】

【0154】

結果は図１０に図表で示される。

【0155】

さらにビーズに基づく（Ｂｅａｄ－ｂａｓｅｄ）サイズ選択を行った。インビトロ転写を、Ｔ７プロモーターを挿入されたＤＮＡを含む１ｎｇのＤＮＡサンプルにおいて行なった。反応は、１２時間行われた。ＭＥＧＡｓｃｒｉｐｔＴ７およびＡｍｐｌｉＳｃｒｉｂｅＴ７の両方を、転写を推進するために使用した。反応物を、転写後に１時間、ＤＮＡｓｅと共にインキュベートした。反応物を、５０ｕＬの開始容量、２ｎｇのＲＮＡ出力として、０．５ｘ、０．６ｘ、０．８ｘ、１ｘ、２ｘ、３ｘおよび対照（未選択）でインキュベートした。ＲＮＡを、ＱｕｂｉｔＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＲＮＡＡｓｓａｙキットを使用して定量化した。ＲＮＡ分析を、ＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＰｉｃｏｍＲＮＡＢｉｏａｎａｌｙｚｅｒを使用して行なった。

【0156】

本発明の好ましい実施形態が本明細書に示され、記載されたが、そのような実施形態が単なる例として提供されていることは、当業者にとって明白だろう。多くの変更、変化、および置換が、本発明から逸脱することなく、当業者に想到されるであろう。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用され得ることを理解されたい。以下の特許請求の範囲が本発明の範囲を定義するものであり、この特許請求の範囲内の方法および構造およびそれらの同等物がそれによって包含されることが意図されている。

【図1】