特表2022-551202 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アールピーアールディーダイアグノスティックス，エルエルシーの特許一覧

特表2022-551202複雑なゲノム領域を解析するための方法およびシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7A
7B
7C
8
9A
9B-C
10
11A
11B
12A
12B
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-12-07

(54)【発明の名称】複雑なゲノム領域を解析するための方法およびシステム

(51)【国際特許分類】

C12Q 1/6806 20180101AFI20221130BHJP

C12N 15/10 20060101ALI20221130BHJP

C12N 15/11 20060101ALN20221130BHJP

C12N 9/16 20060101ALN20221130BHJP

C12N 15/09 20060101ALN20221130BHJP

【ＦＩ】

C12Q1/6806 Z

C12N15/10 100Z

C12N15/11 Z ZNA

C12N9/16 A

C12N15/09 110

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2022546595

(86)(22)【出願日】2020-10-07

(85)【翻訳文提出日】2022-06-01

(86)【国際出願番号】 US2020054567

(87)【国際公開番号】W WO2021071940

(87)【国際公開日】2021-04-15

(31)【優先権主張番号】62/911,846

(32)【優先日】2019-10-07

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】522138445

【氏名又は名称】アールピーアールディーダイアグノスティックス，エルエルシー

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】シャラー，ガンター

【テーマコード（参考）】

4B050

4B063

【Ｆターム（参考）】

4B050CC07

4B050DD02

4B050EE10

4B050LL03

4B063QA08

4B063QA13

4B063QA17

4B063QA18

4B063QA19

4B063QQ34

4B063QQ44

4B063QR14

4B063QR32

4B063QS03

4B063QS12

4B063QS34

4B063QS36

4B063QS39

4B063QX02

(57)【要約】

複雑なゲノム領域の遺伝子型を判定する方法が本明細書において提供される。一部の場合では、方法は、目的のゲノム領域をゲノムＤＮＡから切り出すための、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのガイドＲＮＡの使用を伴う。方法は、目的の遺伝子領域の配列を決定するための、ロングリードシーケンシングの使用をさらに伴う。一部の場合では、方法は、増幅フリーである。複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムの必要性がまだ対処されていない。本開示は、このまだ対処されていない必要性を満たす。

【特許請求の範囲】

【請求項1】

目的のゲノム領域を解析（例えば、配列決定、遺伝子型判定、構造を解析）する方法であって、
ａ）前記目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、
ｂ）前記目的のゲノム領域を含む前記ゲノムＤＮＡを単離するステップと、
ｃ）前記切り出された目的のゲノム領域を解析するステップと
を含み、
ＤＮＡ増幅を伴わない、方法。

【請求項2】

前記解析するステップが、前記切り出された目的のゲノム領域の配列を決定することを含む、請求項１に記載の方法。

【請求項3】

前記解析するステップが、前記切り出された目的のゲノム領域の遺伝子型を判定することを含む、請求項１に記載の方法。

【請求項4】

前記解析するステップが、前記切り出された目的の領域に対する構造解析を実施することを含む、請求項１に記載の方法。

【請求項5】

前記ｂ）の単離するステップが、前記ａ）の接触させるステップの前に実施される、前記請求項のいずれか一項に記載の方法。

【請求項6】

前記ｂ）の単離するステップが、前記ａ）の接触させるステップの後に実施される、前記請求項のいずれか一項に記載の方法。

【請求項7】

前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、前記請求項のいずれか一項に記載の方法。

【請求項8】

前記異なるヌクレオチド配列が、前記目的のゲノム領域の両側に隣接する、請求項７に記載の方法。

【請求項9】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼにより、前記目的のゲノム領域が前記目的のゲノム領域の両側に隣接するゲノム部位において切断される、請求項８に記載の方法。

【請求項10】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、前記請求項のいずれか一項に記載の方法。

【請求項11】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１０に記載の方法。

【請求項12】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１０に記載の方法。

【請求項13】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、前記請求項のいずれか一項に記載の方法。

【請求項14】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、前記請求項のいずれか一項に記載の方法。

【請求項15】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１４に記載の方法。

【請求項16】

前記Ｃａｓ９変異体が、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む、請求項１４または１５に記載の方法。

【請求項17】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、前記請求項のいずれか一項に記載の方法。

【請求項18】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、前記請求項のいずれか一項に記載の方法。

【請求項19】

前記目的のゲノム領域が、複雑なゲノム領域である、前記請求項のいずれか一項に記載の方法。

【請求項20】

前記複雑なゲノム領域が、遺伝子および１つまたは複数のその偽遺伝子を含む、請求項１９に記載の方法。

【請求項21】

前記１つまたは複数の偽遺伝子が、前記遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む、請求項２０に記載の方法。

【請求項22】

前記複雑なゲノム領域が、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項２１に記載の方法。

【請求項23】

前記目的のゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。

【請求項24】

前記切り出された目的のゲノム領域の長さが、少なくとも１０キロベースである、前記請求項のいずれか一項に記載の方法。

【請求項25】

前記切り出された目的のゲノム領域の長さが、最大２５０キロベースである、前記請求項のいずれか一項に記載の方法。

【請求項26】

前記単離するステップが、高分子量ＤＮＡを単離することを含む、前記請求項のいずれか一項に記載の方法。

【請求項27】

前記高分子量ＤＮＡの長さが、少なくとも５０キロベースである、請求項２６に記載の方法。

【請求項28】

前記配列を決定することが、ロングリードシーケンシングを含む、前記請求項のいずれか一項に記載の方法。

【請求項29】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項２８に記載の方法。

【請求項30】

１つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、前記請求項のいずれか一項に記載の方法。

【請求項31】

ａ）の前に、前記ゲノムＤＮＡを脱リン酸化するステップをさらに含む、前記請求項のいずれか一項に記載の方法。

【請求項32】

前記脱リン酸化するステップが、前記ゲノムＤＮＡをホスファターゼで処理することを含む、請求項３１に記載の方法。

【請求項33】

前記ホスファターゼが、エビアルカリホスファターゼである、請求項３２に記載の方法。

【請求項34】

前記脱リン酸化するステップの後に、前記ゲノムＤＮＡをターミナルトランスフェラーゼ（ＴｄＴ）で処理するステップをさらに含む、請求項２９から３３までのいずれか一項に記載の方法。

【請求項35】

前記切り出された目的のゲノム領域の末端にテールを付加するステップをさらに含む、前記請求項のいずれか一項に記載の方法。

【請求項36】

前記末端にテールを付加するステップが、前記切り出された目的のゲノム領域の遊離の３’末端に１つまたは複数のアデノシンヌクレオチドを付加することを含む、請求項３５に記載の方法。

【請求項37】

前記方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、前記請求項のいずれか一項に記載の方法。

【請求項38】

多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項３７に記載の方法。

【請求項39】

前記ゲノムＤＮＡが、生体試料として提供される、前記請求項のいずれか一項に記載の方法。

【請求項40】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料を含む、請求項３９に記載の方法。

【請求項41】

前記生体試料が、診断用試料である、請求項３９に記載の方法。

【請求項42】

長さが少なくとも１０キロベースである目的の複雑なゲノム領域を解析する方法であって、
ａ）前記目的の複雑なゲノム領域を含むゲノムＤＮＡを提供するステップと、
ｂ）前記目的の複雑なゲノム領域を含む高分子量ＤＮＡを単離するステップと、
ｃ）前記目的の複雑なゲノム領域を切り出すために、前記ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、
前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記目的の複雑なゲノム領域の両側に隣接する、ステップと、
ｄ）前記目的の複雑なゲノム領域を解析するステップと
を含み、
ＤＮＡ増幅を伴わない、方法。

【請求項43】

前記解析するステップが、前記目的の複雑なゲノム領域の配列を決定することを含む、請求項４２に記載の方法。

【請求項44】

前記配列を決定することが、ロングリードシーケンシングを含む、請求項４３に記載の方法。

【請求項45】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項４４に記載の方法。

【請求項46】

前記解析するステップが、前記目的の複雑なゲノム領域の遺伝子型を判定することを含む、請求項４２に記載の方法。

【請求項47】

前記解析するステップが、前記目的のゲノム領域の構造解析を実施することを含む、請求項４２に記載の方法。

【請求項48】

前記ｂ）の単離するステップが、前記ｃ）の接触させるステップの前に実施される、請求項４２から４７までのいずれか一項に記載の方法。

【請求項49】

前記ｂ）の単離するステップが、前記ｃ）の接触させるステップの後に実施される、請求項４２から４７までのいずれか一項に記載の方法。

【請求項50】

前記高分子量ＤＮＡの長さが、少なくとも１０キロベースである、前記請求項のいずれか一項に記載の方法。

【請求項51】

前記目的の複雑なゲノム領域が、標的遺伝子および１つまたは複数のその偽遺伝子を含む、請求項４２から５０までのいずれか一項に記載の方法。

【請求項52】

前記１つまたは複数の偽遺伝子が、前記標的遺伝子に対して少なくとも７５％の配列同一性を有する、請求項５１に記載の方法。

【請求項53】

前記目的の複雑なゲノム領域が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む、請求項４２から５０までのいずれか一項に記載の方法。

【請求項54】

前記目的の複雑なゲノム領域が、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む、請求項４２から５０までのいずれか一項に記載の方法。

【請求項55】

前記目的の複雑なゲノム領域が、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項４２から５０までのいずれか一項に記載の方法。

【請求項56】

前記目的の複雑なゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。

【請求項57】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項４２から５６までのいずれか一項に記載の方法。

【請求項58】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項５７に記載の方法。

【請求項59】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項５７に記載の方法。

【請求項60】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項４２から５９までのいずれか一項に記載の方法。

【請求項61】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項４２から６０までのいずれか一項に記載の方法。

【請求項62】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項６１に記載の方法。

【請求項63】

【請求項64】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化も行わない、請求項４２から６３までのいずれか一項に記載の方法。

【請求項65】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、請求項４２から６４までのいずれか一項に記載の方法。

【請求項66】

前記目的の複雑なゲノム領域の長さが最大２５０キロベースである、請求項４２から６５までのいずれか一項に記載の方法。

【請求項67】

１つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項４２から６６までのいずれか一項に記載の方法。

【請求項68】

ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項４２から６７までのいずれか一項に記載の方法。

【請求項69】

多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項６８に記載の方法。

【請求項70】

前記ゲノムＤＮＡが、生体試料中で提供される、請求項４２から６９までのいずれか一項に記載の方法。

【請求項71】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である、請求項７０に記載の方法。

【請求項72】

前記生体試料が、診断用試料である、請求項７０または７１に記載の方法。

【請求項73】

ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を解析する方法であって、
ａ）前記遺伝子座を含むゲノムＤＮＡを提供するステップと、
ｂ）前記遺伝子座を前記ゲノムＤＮＡから切り出すために、前記ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、
前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する、ステップと、
ｃ）前記遺伝子座を解析するステップと
を含む方法。

【請求項74】

前記解析するステップが、前記遺伝子座の配列を決定することを含む、請求項７３に記載の方法。

【請求項75】

前記配列を決定することが、ロングリードシーケンシングを含む、請求項７４に記載の方法。

【請求項76】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項７５に記載の方法。

【請求項77】

前記解析するステップが、前記遺伝子座の遺伝子型を判定することを含む、請求項７３に記載の方法。

【請求項78】

前記解析するステップが、前記遺伝子座の構造解析を実施することを含む、請求項７３に記載の方法。

【請求項79】

前記方法が、ｃ）の前に、前記遺伝子座を含む高分子量ＤＮＡを単離するステップをさらに含む、請求項７３から７８までのいずれか一項に記載の方法。

【請求項80】

前記高分子量ＤＮＡの長さが、少なくとも１０キロベースである、請求項７９に記載の方法。

【請求項81】

前記２つまたはそれよりも多くのｇＲＮＡが、配列番号１～２６からなる群から選択されるヌクレオチド配列を含む、請求項７３から８０までのいずれか一項に記載の方法。

【請求項82】

前記遺伝子座の長さが、少なくとも４０キロベースである、請求項７３から８１までのいずれか一項に記載の方法。

【請求項83】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項７３から８２までのいずれか一項に記載の方法。

【請求項84】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項８３に記載の方法。

【請求項85】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項８３に記載の方法。

【請求項86】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項７３から８５までのいずれか一項に記載の方法。

【請求項87】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項７３から８６までのいずれか一項に記載の方法。

【請求項88】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項８７に記載の方法。

【請求項89】

【請求項90】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、請求項７３から８９までのいずれか一項に記載の方法。

【請求項91】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、請求項７３から９０までのいずれか一項に記載の方法。

【請求項92】

前記切り出された遺伝子座の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む、請求項７３から９１までのいずれか一項に記載の方法。

【請求項93】

ＤＮＡ増幅を伴わない、請求項７３から９２までのいずれか一項に記載の方法。

【請求項94】

ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項９３に記載の方法。

【請求項95】

多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項９４に記載の方法。

【請求項96】

前記ゲノムＤＮＡが、生体試料として提供される、請求項７３から９５までのいずれか一項に記載の方法。

【請求項97】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である、請求項９６に記載の方法。

【請求項98】

前記生体試料が、診断用試料である、請求項９６または９７に記載の方法。

【請求項99】

対象におけるＣＹＰ２Ｄ６の遺伝子変異を同定する方法であって、
ａ）前記対象から得たゲノムＤＮＡを含む生体試料を提供するステップと、
ｂ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、前記ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、
ｃ）前記遺伝子座のロングリードシーケンシングを実施するステップと、
ｄ）前記対象のＣＹＰ２Ｄ６の１つまたは複数の遺伝子変異を同定するステップと
を含む方法。

【請求項100】

前記遺伝子変異に基づいて、前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定するステップをさらに含む、請求項９９に記載の方法。

【請求項101】

前記同定するステップに基づいて、前記対象に対して処置または代替処置を推奨するステップをさらに含む、請求項１００に記載の方法。

【請求項102】

前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合に、前記対象に対して代替処置を推奨する、請求項１００に記載の方法。

【請求項103】

前記同定するステップに基づいて、前記対象に対して治療薬のある投薬量を推奨するステップをさらに含む、請求項１００に記載の方法。

【請求項104】

前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合に、治療薬の投薬量を変更する、請求項１００に記載の方法。

【請求項105】

ｃ）の前に、前記遺伝子座を含む高分子量ＤＮＡを単離するステップをさらに含む、請求項９９から１０４までのいずれか一項に記載の方法。

【請求項106】

前記高分子量ＤＮＡの長さが、少なくとも４０キロベースである、請求項１０５に記載の方法。

【請求項107】

前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する、請求項９９から１０６までのいずれか一項に記載の方法。

【請求項108】

前記２つまたはそれよりも多くのｇＲＮＡが、配列番号１～２６からなる群から選択されるヌクレオチド配列を含む、請求項９９から１０７までのいずれか一項に記載の方法。

【請求項109】

前記遺伝子座の長さが、少なくとも４０キロベースである、請求項９９から１０８までのいずれか一項に記載の方法。

【請求項110】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項９９から１０９までのいずれか一項に記載の方法。

【請求項111】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項９９から１１０までのいずれか一項に記載の方法。

【請求項112】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１１１に記載の方法。

【請求項113】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１１１に記載の方法。

【請求項114】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項９９から１１３までのいずれか一項に記載の方法。

【請求項115】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項９９から１１４までのいずれか一項に記載の方法。

【請求項116】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１１５に記載の方法。

【請求項117】

【請求項118】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、請求項９９から１１７までのいずれか一項に記載の方法。

【請求項119】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、請求項９９から１１８までのいずれか一項に記載の方法。

【請求項120】

１つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項９９から１１９までのいずれか一項に記載の方法。

【請求項121】

ＤＮＡ増幅を伴わない、請求項９９から１２０までのいずれか一項に記載の方法。

【請求項122】

ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項１２１に記載の方法。

【請求項123】

多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項１２１に記載の方法。

【請求項124】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である、請求項９９から１２３までのいずれか一項に記載の方法。

【請求項125】

ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；
ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに
ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）
を含む組成物。

【請求項126】

前記第１のガイドＲＮＡが、配列番号１、２、または１３～１６からなる群から選択されるヌクレオチド配列を含む、請求項１２５に記載の組成物。

【請求項127】

前記第２のガイドＲＮＡが、配列番号３～１２または１７～２６からなる群から選択されるヌクレオチド配列を含む、請求項１２５または１２６に記載の組成物。

【請求項128】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項１２５から１２７までのいずれか一項に記載の組成物。

【請求項129】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１２８に記載の組成物。

【請求項130】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１２８に記載の組成物。

【請求項131】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項１２５から１３０までのいずれか一項に記載の組成物。

【請求項132】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項１２５から１３１までのいずれか一項に記載の組成物。

【請求項133】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１３２に記載の組成物。

【請求項134】

【請求項135】

ＣＹＰ２Ｄ６の遺伝子型を判定するためのキットであって、
ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；
ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに
ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）
を含むキット。

【請求項136】

前記第１のガイドＲＮＡが、配列番号１、２、または１３～１６からなる群から選択されるヌクレオチド配列を含む、請求項１３５に記載のキット。

【請求項137】

前記第２のガイドＲＮＡが、配列番号３～１２または１７～２６からなる群から選択されるヌクレオチド配列を含む、請求項１３５または１３６に記載のキット。

【請求項138】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項１３５から１３７までのいずれか一項に記載のキット。

【請求項139】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１３９に記載のキット。

【請求項140】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１３９に記載のキット。

【請求項141】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項１３５から１４０までのいずれか一項に記載のキット。

【請求項142】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項１３５から１４１までのいずれか一項に記載のキット。

【請求項143】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１４２に記載のキット。

【請求項144】

【請求項145】

目的の複雑なゲノム領域を解析するためのシステムであって、
（ａ）
（ｉ）前記目的の複雑なゲノム領域を含むゲノムＤＮＡから高分子量ＤＮＡを単離するステップと、
（ｉｉ）前記目的の複雑なゲノム領域を切り出すために、前記ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、
前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記目的の複雑なゲノム領域の両側に隣接する、ステップと、
（ｉｉｉ）前記目的の複雑なゲノム領域を解析して前記データを生成するステップと
を含み、
ＤＮＡ増幅を伴わない、方法
により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；および
（ｂ）前記少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含む、システム。

【請求項146】

前記出力が、レポートである、請求項１４５に記載のシステム。

【請求項147】

前記出力が、前記目的の複雑なゲノム領域の遺伝子型である、請求項１４５または１４６に記載のシステム。

【請求項148】

前記出力が、前記目的の複雑なゲノム領域の遺伝子配列である、請求項１４５または１４６に記載のシステム。

【請求項149】

前記出力が、前記目的の複雑なゲノム領域の構造解析である、請求項１４５または１４６に記載のシステム。

【請求項150】

前記解析するステップが、前記目的の複雑なゲノム領域の遺伝子型を判定することを含む、請求項１４５から１４９までのいずれか一項に記載のシステム。

【請求項151】

前記解析するステップが、前記目的の複雑なゲノム領域の構造解析を実施することを含む、請求項１４５から１４９までのいずれか一項に記載のシステム。

【請求項152】

前記解析するステップが、前記目的の複雑なゲノム領域の配列を決定することを含む、請求項１４５から１４９までのいずれか一項に記載のシステム。

【請求項153】

前記配列を決定することが、ロングリードシーケンシングを含む、請求項１５２に記載のシステム。

【請求項154】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項１５３に記載のシステム。

【請求項155】

前記（ｉ）の単離するステップが、前記（ｉｉ）の接触させるステップの前に実施される、請求項１４５から１５４までのいずれか一項に記載のシステム。

【請求項156】

前記（ｉ）の単離するステップが、前記（ｉｉ）の接触させるステップの後に実施される、請求項１４５から１５４までのいずれか一項に記載のシステム。

【請求項157】

前記高分子量ＤＮＡの長さが、少なくとも１０キロベースである、請求項１４５から１５６までのいずれか一項に記載のシステム。

【請求項158】

前記目的の複雑なゲノム領域が、標的遺伝子および１つまたは複数のその偽遺伝子を含む、請求項１４５から１５７までのいずれか一項に記載のシステム。

【請求項159】

前記１つまたは複数の偽遺伝子が、前記標的遺伝子に対して少なくとも７５％の配列同一性を有する、請求項１５８に記載のシステム。

【請求項160】

前記目的の複雑なゲノム領域が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む、請求項１４５から１５９までのいずれか一項に記載のシステム。

【請求項161】

前記目的の複雑なゲノム領域が、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む、請求項１４５から１６０までのいずれか一項に記載のシステム。

【請求項162】

前記目的の複雑なゲノム領域が、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項１４５から１６１までのいずれか一項に記載のシステム。

【請求項163】

前記目的の複雑なゲノム領域が、高度に多型の遺伝子座である、請求項１４５から１６２までのいずれか一項に記載のシステム。

【請求項164】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項１４５から１６３までのいずれか一項に記載のシステム。

【請求項165】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１６４に記載のシステム。

【請求項166】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１６４に記載のシステム。

【請求項167】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項１４５から１６６までのいずれか一項に記載のシステム。

【請求項168】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項１４５から１６７までのいずれか一項に記載のシステム。

【請求項169】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１６８に記載のシステム。

【請求項170】

【請求項171】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、請求項１４５から１７０までのいずれか一項に記載のシステム。

【請求項172】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、請求項１４５から１７１までのいずれか一項に記載のシステム。

【請求項173】

前記目的の複雑なゲノム領域の長さが、最大２５０キロベースである、請求項１４５から１７２までのいずれか一項に記載のシステム。

【請求項174】

１つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項１４５から１７３までのいずれか一項に記載のシステム。

【請求項175】

前記方法が、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項１４５から１７４までのいずれか一項に記載のシステム。

【請求項176】

前記方法が、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項１７５に記載のシステム。

【請求項177】

前記ゲノムＤＮＡが、生体試料として提供される、請求項１４５から１７６までのいずれか一項に記載のシステム。

【請求項178】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料を含む、請求項１７７に記載のシステム。

【請求項179】

前記生体試料が、診断用試料である、請求項１７７または１７８に記載のシステム。

【請求項180】

対象のＣＹＰ２Ｄ６の遺伝子変異を同定するためのシステムであって、
（ａ）
（ｉｉ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、前記対象から得たゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、
（ｉｉｉ）前記遺伝子座のロングリードシーケンシングを実施して前記配列決定データを生成するステップと
を含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；および
（ｂ）前記少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含むシステム。

【請求項181】

前記出力が、レポートである、請求項１８０に記載のシステム。

【請求項182】

前記出力が、ＣＹＰ２Ｄ６の遺伝子変異を同定するものである、請求項１８０または１８１に記載のシステム。

【請求項183】

前記出力が、ＣＹＰ２Ｄ６の機能の低下、喪失、または増大を同定するものである、請求項１８０から１８２までのいずれか一項に記載のシステム。

【請求項184】

前記レポートが、前記遺伝子変異に基づいて前記対象に対して処置を推奨するものである、請求項１８１から１８３までのいずれか一項に記載のシステム。

【請求項185】

前記レポートが、前記遺伝子変異に基づいて前記対象に対して治療薬のある投薬量を推奨するものである、請求項１８１から１８３までのいずれか一項に記載のシステム。

【請求項186】

前記レポートが、前記遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである、請求項１９１から１８３までのいずれか一項に記載のシステム。

【請求項187】

前記治療薬が、ＣＹＰ２Ｄ６によって活性化または代謝される治療薬である、請求項１８５または１８６に記載のシステム。

【請求項188】

前記方法が、（ｉｉ）の前に、前記遺伝子座を含む高分子量ＤＮＡを単離するステップをさらに含む、請求項１８０から１８７までのいずれか一項に記載のシステム。

【請求項189】

前記高分子量ＤＮＡの長さが、少なくとも４０キロベースである、請求項１８８に記載のシステム。

【請求項190】

前記２つまたはそれよりも多くのｇＲＮＡが、それぞれ、前記ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する、請求項１８０から１８９までのいずれか一項に記載のシステム。

【請求項191】

前記２つまたはそれよりも多くのｇＲＮＡが、配列番号１～２６からなる群から選択されるヌクレオチド配列を含む、請求項１８０から１９０までのいずれか一項に記載のシステム。

【請求項192】

前記遺伝子座の長さが、少なくとも４０キロベースである、請求項１８０から１９１までのいずれか一項に記載のシステム。

【請求項193】

前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項１８０から１９２までのいずれか一項に記載のシステム。

【請求項194】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項１８０から１９２までのいずれか一項に記載のシステム。

【請求項195】

前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される、請求項１９４に記載のシステム。

【請求項196】

前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される、請求項１９４に記載のシステム。

【請求項197】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項１８０から１９６までのいずれか一項に記載のシステム。

【請求項198】

前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項１８０から１９７までのいずれか一項に記載のシステム。

【請求項199】

前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１９８に記載のシステム。

【請求項200】

【請求項201】

前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、請求項１８０から２００までのいずれか一項に記載のシステム。

【請求項202】

前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、請求項１８０から２０１までのいずれか一項に記載のシステム。

【請求項203】

１つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項１８０から２０２までのいずれか一項に記載のシステム。

【請求項204】

前記方法が、ＤＮＡ増幅を伴わない、請求項１８０から２０３までのいずれか一項に記載のシステム。

【請求項205】

前記方法が、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項２０４に記載のシステム。

【請求項206】

前記方法が、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項２０４に記載のシステム。

【請求項207】

前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である、請求項１８０から２０６までのいずれか一項に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

相互参照
本出願は、その全体が参照により本明細書に組み込まれる２０１９年１０月７日出願の米国仮出願第６２／９１１，８４６号の利益を主張するものである。

【背景技術】

【0002】

背景
遺伝子変異は薬物に対する応答に影響を及ぼす可能性があるので、薬理遺伝学（ＰＧｘ）は個別化された薬物応答の決定を可能にする精密医療の構成要素である。ＰＧｘの利益としては、費用および薬物有害反応（ＳＡＤＲ）のリスクの低減、ならびに薬効の改善が挙げられる。現在多数のＰＧｘ遺伝子が試験されているが、シトクロムＰ４５０２Ｄ６（ＣＹＰ２Ｄ６）の診断的価値が極めて大きく、これは、全薬物の２５％に至るまでがＣＹＰ２Ｄ６によって活性化または代謝されるからである。これらの薬物としては、がん薬、オピオイドアゴニスト、ならびに、いくつかの抗うつ薬および抗不安薬物が挙げられる。ＣＹＰ２Ｄ６酵素はＣＹＰ２Ｄ６遺伝子によってコードされ、遺伝子変異により酵素機能の低下または完全な喪失が引き起こされる可能性がある。ＣＹＰ２Ｄ６は肝臓において主に発現され、肝臓での薬物代謝およびクリアランスの主要な一因である。ＣＹＰ２Ｄ６の遺伝子変異を正しく診断することに伴う問題はＳＡＤＲが発生するリスクに直接影響を及ぼし得る。ＮＩＨＣｌｉｎｉｃａｌＰｈａｒｍａｃｏｇｅｎｅｔｉｃｓＩｍｐｌｅｍｅｎｔａｔｉｏｎＣｏｎｓｏｒｔｉｕｍ（ＣＰＩＣ）は現在、ＣＹＰ２Ｄ６の臨床試験を支持する５８種の薬物に関連するエビデンスをリストアップしており、それにより、ＣＹＰ２Ｄ６は上位遺伝子のうちの１つになっている。米国だけでＣＹＰ２Ｄ６に関する試験は２０１９年には＄５２２Ｍの市場であり、年間の成長率は６～８％であると推定される。

【0003】

現時点で、ＣＹＰ２Ｄ６に関して、高頻度のコピー数変異を含め、１００を超える薬理遺伝学的な関連性のある変更（＊スター対立遺伝子ハプロタイプとも称される）が記載されている。さらに、近接する高度に相同な（９４％に至るまで同一である）偽遺伝子（ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８）との遺伝子融合物およびハイブリッドにより変異体コーリングが複雑になる。米国では、人の約１３％がＣＹＰ２Ｄ６構造変異体を有し、これらの変異体は、当該遺伝子に関連する全ての変異のうちの７％を表す。これらの特色により、現行の試験プラットフォームを用いた遺伝子解析が複雑になり、希少なまたは複雑なハプロタイプの多くが正確に解析されない。多くのグループによる研究により、現在使用されている市販の遺伝子型判定プラットフォームでは、ＣＹＰ２Ｄ６の誤った特徴付けが生じやすいことが実証されている。これにより、間違った割り当てが導かれ、その結果、間違った投薬が推奨される。遺伝子の配列決定も、ショートリードに基づく場合（ＮＧＳ）または鋳型の長さに基づく場合（サンガーシーケンシング）に同様に妨害される。構造全体をより精密に決定するために標的化増幅、コピー数解析、および長距離ＰＣＲを組み合わせる多数の方法が開発されているが、これらの方法は、複雑なワークフロー、時間要件、および全体的な費用に起因して、常套的な臨床試験には適さない。

【発明の概要】

【課題を解決するための手段】

【0004】

概要
複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムの必要性がまだ対処されていない。本開示は、このまだ対処されていない必要性を満たす。

【0005】

一態様では、目的のゲノム領域を解析する方法であって、（ａ）目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ）（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、（ｂ）目的のゲノム領域を含むゲノムＤＮＡを単離するステップと、（ｃ）切り出された目的のゲノム領域を解析するステップとを含み、ＤＮＡ増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、切り出された目的のゲノム領域の配列を決定することを含む。一部の場合では、解析するステップは、切り出された目的のゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、切り出された目的の領域に対する構造解析を実施することを含む。一部の場合では、（ｂ）の単離するステップは（ａ）の接触させるステップの前に実施される。一部の場合では、（ｂ）の単離するステップは（ａ）の接触させるステップの後に実施される。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、異なるヌクレオチド配列は目的のゲノム領域の両側に隣接する。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼにより、目的のゲノム領域が、目的のゲノム領域の両側に隣接するゲノム部位において切断される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、切り出された目的のゲノム領域の長さは少なくとも１０キロベースである。一部の場合では、切り出された目的のゲノム領域の長さは最大２５０キロベースである。一部の場合では、単離するステップは、高分子量ＤＮＡを単離することを含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも５０キロベースである。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ａ）の前に、ゲノムＤＮＡを脱リン酸化するステップをさらに含む。一部の場合では、脱リン酸化するステップは、ゲノムＤＮＡをホスファターゼで処理することを含む。一部の場合では、ホスファターゼはエビアルカリホスファターゼである。一部の場合では、方法は、脱リン酸化するステップの後に、ゲノムＤＮＡをターミナルトランスフェラーゼ（ＴｄＴ）で処理することをさらに含む。一部の場合では、方法は、切り出された目的のゲノム領域の末端にテールを付加するステップをさらに含む。一部の場合では、末端にテールを付加するステップは、切り出された目的のゲノム領域の遊離の３’末端に１つまたは複数のアデノシンヌクレオチドを付加することを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料中で提供される。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料を含む。一部の場合では、生体試料は診断用試料である。

【0006】

別の態様では、長さが少なくとも１０キロベースである目的の複雑なゲノム領域を解析する方法であって、（ａ）目的の複雑なゲノム領域を含むゲノムＤＮＡを提供するステップと、（ｂ）目的の複雑なゲノム領域を含む高分子量ＤＮＡを単離するステップと、（ｃ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、（ｄ）目的の複雑なゲノム領域を解析するステップとを含み、ＤＮＡ増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、（ｂ）の単離するステップは（ｃ）の接触させるステップの前に実施される。一部の場合では、（ｂ）の単離するステップは（ｃ）の接触させるステップの後に実施される。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも７５％の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、目的の複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して、ａ）の前に断片化も消化も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大２５０キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料中で提供される。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である。一部の場合では、生体試料は診断用試料である。

【0007】

別の態様では、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を解析する方法であって、（ａ）当該遺伝子座を含むゲノムＤＮＡを提供するステップと、（ｂ）当該遺伝子座をゲノムＤＮＡから切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する、ステップと、（ｃ）当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、解析するステップは、当該遺伝子座の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、当該遺伝子座の遺伝子型を判定することを含む。一部の場合では、解析するステップは、当該遺伝子座の構造解析を実施することを含む。一部の場合では、方法は、ｃ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離することをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～２６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された遺伝子座の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料中で提供される。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である。一部の場合では、生体試料は診断用試料である。

【0008】

さらに別の態様では、対象におけるＣＹＰ２Ｄ６の遺伝子変異を同定する方法であって、（ａ）対象から得たゲノムＤＮＡを含む生体試料を提供するステップと、（ｂ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、（ｃ）当該遺伝子座のロングリードシーケンシングを実施するステップと、（ｄ）対象のＣＹＰ２Ｄ６の１つまたは複数の遺伝子変異を同定するステップとを含む方法が提供される。一部の場合では、方法は、遺伝子変異に基づいて、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、方法は、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、方法は、治療薬の投薬量を変更するステップをさらに含む。一部の場合では、方法は、ｃ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離することをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも４０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～２６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である。

【0009】

さらに別の態様では、（ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；（ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに（ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含む組成物が提供される。一部の場合では、第１のガイドＲＮＡは、配列番号１、２、または１３～１６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、第２のガイドＲＮＡは、配列番号３～１２または１７～２６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。

【0010】

さらに別の態様では、ＣＹＰ２Ｄ６の遺伝子型を判定するためのキットであって、（ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；（ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに（ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含むキットが提供される。一部の場合では、第１のガイドＲＮＡは、配列番号１、２、または１３～１６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、第２のガイドＲＮＡは、配列番号３～１２または１７～２６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。

【0011】

さらに別の態様では、目的の複雑なゲノム領域を解析するためのシステムであって、（ａ）（ｉ）目的の複雑なゲノム領域を含むゲノムＤＮＡから高分子量ＤＮＡを単離するステップと、（ｉｉ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、（ｉｉｉ）目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、ＤＮＡ増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能に（ｏｐｅｒａｂｌｙ）カップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子型である。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子配列である。一部の場合では、出力は、目的の複雑なゲノム領域の構造解析である。一部の場合では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、（ｉ）の単離するステップを（ｉｉ）の接触させるステップの前に実施する。一部の場合では、（ｉ）の単離するステップを（ｉｉ）の接触させるステップの後に実施する。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも７５％の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、目的の複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大２５０キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料中で提供される。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料を含む。一部の場合では、生体試料は診断用試料である。

【0012】

さらに別の態様では、対象のＣＹＰ２Ｄ６の遺伝子変異を同定するためのシステムであって、（ａ）（ｉｉ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、対象から得たゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、（ｉｉｉ）当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、ＣＹＰ２Ｄ６の遺伝子変異を同定するものである。一部の場合では、出力は、ＣＹＰ２Ｄ６の機能の低下、喪失、または増大を同定するものである。一部の場合では、レポートは、遺伝子変異に基づいて、対象に対して処置を推奨するものである。一部の場合では、レポートは、遺伝子変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。一部の場合では、レポートは、遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、ＣＹＰ２Ｄ６によって活性化または代謝される治療薬である。一部の場合では、方法は、（ｉｉ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離するステップをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも４０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～２６からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはクラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群から選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群から選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳）または固形組織試料である。
参照による組込み

【0013】

本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個別に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。

【0014】

本開示の新規の特色は、添付の特許請求の範囲において詳細に記載されている。本開示の原理が利用される例示的な実施形態が記載されている以下の詳細な説明および付属図を参照することにより、本開示の特色および利点のよりよい理解が得られよう。

【図面の簡単な説明】

【0015】

【図1】図１は、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を示す。パネルＡは、ＣＹＰ２Ｄ６遺伝子の単一コピーを含有する参照遺伝子座のＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８に対する位置付けを示す。完全なＣＹＰ２Ｄ６欠失（パネルＢ）、重複（パネルＣ）、および５’（パネルＤ）または３’（パネルＥ）のいずれかのＣＹＰＤ６／ＣＹＰＤ７ハイブリッド対立遺伝子の存在を含めたＣＹＰ２Ｄ６遺伝子コピー数変異の複雑さを例示する構造変異体の代表的な例。そのような配置での重複した遺伝子は、多くの場合、１．６ｋｂの長いスペーサー配列を含むＣＹＰ２Ｄ７様下流領域を有する。５’－３’の方向付けは参照配列に対して示されている（ＮＧ＿００８３７６．３）。

【0016】

【図2】図２は、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を単離し、配列を決定する方法を示すフローチャートの非限定的な例を示す。

【0017】

【図3】図３は、本明細書に提示される実施形態によるゲノムＤＮＡ抽出の比較の非限定的な例を示す。レーンＡは改変された高分子量プロトコールを用いてリンパ芽球様細胞株（ＬＣＬ）細胞から抽出されたｇＤＮＡ５０ｎｇ（＞５０ｋｂ）であり、レーンＢはＭａｘｗｅｌｌＲａｐｉｄＳａｍｐｌｅＣｏｎｃｅｎｔｒａｔｏｒ（ＲＳＣ）を用いて抽出されたｇＤＮＡ５０ｎｇ（約１０～４８ｋｂ）であり、レーンＣはｇＤＮＡ対照５０ｎｇ（Ｃｏｒｉｅｌｌ；約１０ｋｂ～５０ｋｂ）であり、レーンＤはラムダファージＤＮＡ（約５０ｋＤａ；ＮＥＢ）であり、レーンＥはＨＩＮＤＩＩＩラムダファージ消化物である。

【0018】

【図4】図４Ａおよび図４Ｂは、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡ設計および検証の非限定的な例を示す。図４Ａは、対立遺伝子ＣＹＰ２Ｄ６およびハイブリッド対立遺伝子を捕捉するために必要なＣＲＩＳＰＲカット部位の概略図を示す。図４Ｂは、標的部位のＣＲＩＳＰＲＣｕｔＸＬ－ＰＣＲアンプリコンを示す。試料ＡにはｓｇＲＮＡを伴わないＣａｓ９を加え、試料ＢにはｓｇＲＮＡ＿１を伴うＣａｓ９を加え、試料ＣにはｓｇＲＮＡ＿２を伴うＣａｓ９を加えた。

【0019】

【図5】図５Ａおよび図５Ｂは、本開示の実施形態によるゲノムＤＮＡ上のＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの効率の非限定的な例を示す。図５Ａは、ＣＹＰ２Ｄ６の上流および下流の領域のｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物のゲル画像を示す。レーンＣは対照である。図５Ｂは、陰性対照に対して正規化した、未カットｇＤＮＡのパーセンテージを示す。＊＝Ｐ値＜０．０１０。

【0020】

【図6】図６は、本開示の実施形態によるＸＬ－ＰＣＲおよびＮＧＳに基づく解析手法のＮＧＳアラインメントの非限定的な例を示す。

【0021】

【図7A】図７Ａ～７Ｃは、本開示の実施形態によるＣＹＰ２Ｄ６遺伝子座の代替のＣＲＩＳＰＲ／Ｃａｓ９設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Ｘは、Ａ対立遺伝子に示されている設計によりＢ～Ｅ対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。

【図7B】図７Ａ～７Ｃは、本開示の実施形態によるＣＹＰ２Ｄ６遺伝子座の代替のＣＲＩＳＰＲ／Ｃａｓ９設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Ｘは、Ａ対立遺伝子に示されている設計によりＢ～Ｅ対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。

【図7C】図７Ａ～７Ｃは、本開示の実施形態によるＣＹＰ２Ｄ６遺伝子座の代替のＣＲＩＳＰＲ／Ｃａｓ９設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Ｘは、Ａ対立遺伝子に示されている設計によりＢ～Ｅ対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。

【0022】

【図8】図８は、ＣＹＰ２Ｄ６遺伝子座の包括的な標的設計の非限定的な例を示す。カット部位がはさみで示されている。チェックマークは、Ａ対立遺伝子に示されている設計により、Ｂ～Ｅ対立遺伝子配置でオンターゲットのカットのみが生じる対立遺伝子を表す。

【0023】

【図9A】図９Ａ～９Ｃは、ＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの設計および検証の非限定的な例を示す。図９Ａは、対立遺伝子ＣＹＰ２Ｄ６およびハイブリッド対立遺伝子を捕捉するための標的に対する必要なカット部位の概略図を示す。図９Ｂおよび図９Ｃは、標的部位のＣＲＩＳＰＲＣｕｔＸＬ－ＰＣＲアンプリコンを示す。試料ＡにはｓｇＲＮＡを伴わないＣａｓ９を加え、試料ＢにはｓｇＲＮＡ＿１を伴うＣａｓ９を加え、試料ＣにはｓｇＲＮＡ＿２を伴うＣａｓ９を加えた。

【図9B-C】図９Ａ～９Ｃは、ＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの設計および検証の非限定的な例を示す。図９Ａは、対立遺伝子ＣＹＰ２Ｄ６およびハイブリッド対立遺伝子を捕捉するための標的に対する必要なカット部位の概略図を示す。図９Ｂおよび図９Ｃは、標的部位のＣＲＩＳＰＲＣｕｔＸＬ－ＰＣＲアンプリコンを示す。試料ＡにはｓｇＲＮＡを伴わないＣａｓ９を加え、試料ＢにはｓｇＲＮＡ＿１を伴うＣａｓ９を加え、試料ＣにはｓｇＲＮＡ＿２を伴うＣａｓ９を加えた。

【0024】

【図10】図１０は、本開示の実施形態による単離された高分子量ＤＮＡの非限定的な例を示す。ラムダ対照およびＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅからの予め抽出されたＤＮＡと比較した、ＬＣＬ細胞ペレットから抽出された高分子量ゲノムＤＮＡ１００ｎｇの２％ＤＮＡアガロースゲル。

【0025】

【図11A】図１１Ａおよび図１１Ｂは、本明細書に開示される実施形態による配列決定実行カバレッジの非限定的な例を示す。

【図11B】図１１Ａおよび図１１Ｂは、本明細書に開示される実施形態による配列決定実行カバレッジの非限定的な例を示す。

【0026】

【図12A】図１２Ａおよび図１２Ｂは、本明細書に開示される実施形態による配列アラインメントサイズの非限定的な例を示す。

【図12B】図１２Ａおよび図１２Ｂは、本明細書に開示される実施形態による配列アラインメントサイズの非限定的な例を示す。

【0027】

【図13】図１３は、本明細書に開示される実施形態によるアラインメントプロットの非限定的な例を示す。１２１×カバレッジの標的化される捕捉領域が実現された。囲み枠はＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７の概略である。

【0028】

【図14】図１４は、本明細書に開示される実施形態によるｓｇＲＮＡ特異性を示すＳａｓｈｉｍｉプロットの非限定的な例を示す。このプロットは、２つの配列決定実行についてアラインメントされた領域を示す。赤色のアラインメントは、目的の領域（ＲＯＩ）（ｃｈｒ２２：４２，１２２，１１５－４１，１６１，３２０）が捕捉されるように設計されたｓｇＲＮＡを使用した実行からの配列データを示す。青色のアラインメントは、同じＤＮＡ試料に対して、逆の鎖を標的とするｓｇＲＮＡを使用して実施した富化を示す。

【0029】

【図15】図１５は、本明細書に提示される実施形態に従ったコンピュータシステムの非限定的な例を示す。

【発明を実施するための形態】

【0030】

詳細な説明
目的のゲノム領域（ＲＯＩ）（例えば、ゲノムＤＮＡ由来）を解析するための方法が本明細書に開示される。目的の領域は、例えば、複雑な（例えば、高度に複雑な）ゲノム領域であり得る。複雑なゲノム領域は、例えば、高度に多型的な領域、標的遺伝子および標的遺伝子に対して高い配列相同性を有する１つまたは複数の偽遺伝子を含む領域、１つまたは複数の反復エレメント、１つまたは複数の逆位、１つまたは複数の挿入、１つまたは複数の重複、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾンを含む領域などを含み得る。本明細書に提示される方法は、一般に、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのガイドＲＮＡ（ｇＲＮＡ）を使用して目的の領域をゲノムＤＮＡから切り出すことを伴う。本明細書に提示される方法は、切り出された目的の領域を解析すること（例えば、例えばロングリードシーケンシング法によって配列を決定すること、遺伝子型を判定すること、構造解析を実施すること）をさらに伴う。ＣＹＰ２Ｄ６遺伝子座（例えば、標的遺伝子であるＣＹＰ２Ｄ６、ならびに偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）を解析する方法が本明細書にさらに提示される。有利に、一部の実施形態では、方法は、ＤＮＡ増幅の使用を伴わない（例えば、増幅フリー）。方法により、複雑な（例えば、高度に複雑な）ゲノム領域の配列決定の正確度を改善する（例えば、配列決定の誤り率を低下させる）ことができ（例えば、伝統的な方法と比較して）、かつ／または、複雑な（例えば、高度に複雑な）ゲノム領域の配列決定のための時間を短縮することができ（例えば、伝統的な方法と比較して）、かつ／または、複雑なゲノム（例えば、高度に複雑な）領域（例えば、伝統的な方法と比較して）の配列決定の費用を低減することができる。さらに、本明細書に提示される方法を実施するためのシステム、ならびに、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよびＣＹＰ２Ｄ６遺伝子座を標的とする２つまたはそれよりも多くのｇＲＮＡ（例えば、ＣＹＰ２Ｄ６遺伝子座をゲノムＤＮＡから切り出すため）を含む組成物およびキットが本明細書に提示される。

【0031】

本明細書および添付の特許請求の範囲において使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」、および「その（ｔｈｅ）」は、文脈により明確に別段の規定がなされない限り、複数の使用説明書対象を包含する。特許請求の範囲はいかなる必要に応じた要素も排除されるように起草され得ることにも留意する。したがって、この記述は、特許請求の範囲の要素の列挙に関連して、例えば「単に（ｓｏｌｅｌｙ）」、「のみ（ｏｎｌｙ）」などの排他的な用語の使用、または、「否定的な」限定の使用の前提としての機能を果たすものとする。

【0032】

ある特定の範囲または数は、本明細書では、「約」という用語が先行する数値で提示される。「約」という用語は、本明細書では、この用語が指す数のプラスまたはマイナス１％、２％、３％、４％、または５％を意味するように使用される。本明細書で使用される場合、「対象」および「個体」という用語は互換的に使用され、哺乳動物（例えば、ヒトまたは非ヒト動物）を含めた任意の動物であり得る。

【0033】

本明細書で使用される場合、「ＣＹＰ２Ｄ６」という用語は、ＣＹＰ２Ｄ６遺伝子または任意のその構造変異体または単一遺伝子コピー変異体を指し得る。ＣＹＰ２Ｄ６の構造変異体は、遺伝子融合物、近接する高度に相同な偽遺伝子（例えば、ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８）とのハイブリッド、コピー数変異（ＣＮＶ）、遺伝子重複および増倍、タンデムリピート、および再構成を含み得る。ＣＹＰ２Ｄ６構造変異体の１つの例は、ＣＹＰ２Ｄ６のエクソン９にＣＹＰ２Ｄ７由来配列が存在することである（「エクソン９変換」と称される）。単一遺伝子コピー変異体は、一塩基多型（ＳＮＰ）またはヌクレオチドの挿入もしくは欠失（インデル）を含み得る。ＣＹＰ２Ｄ６の対立遺伝子は、以下から選択される構造変異体または単一遺伝子コピー変異体であり得る：＊１、＊ｘＮ、＊２、＊２ｘＮ、＊２Ａ、＊２ＡｘＮ、＊３５、＊３５ｘＮ、＊９、＊９ｘＮ、＊１０、＊１０ｘＮ、＊１７、＊１７ｘＮ、＊２９、＊２９ｘＮ、＊３６－＊１０、＊３６－＊１０ｘＮ、＊３６ｘＮ－＊１０、＊３６ｘＮ－＊１０ｘＮ、＊４１、＊４１ｘＮ、＊３、＊３ｘＮ、＊４、＊４ｘＮ、＊４Ｎ、＊５、＊６、＊６ｘＮ、＊３６、および＊３６ｘＮ。一部の場合では、ＣＹＰ２Ｄ６の各対立遺伝子は、異なる構造変異体または単一遺伝子コピー変異体である。一部の場合では、ＣＹＰ２Ｄ６の各対立遺伝子は同一である。

【0034】

「ＣＹＰ２Ｄ６遺伝子座」という用語は、本明細書で使用される場合、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含むゲノム領域を指す。ヒトでは、ＣＹＰ２Ｄ６遺伝子座は２２番染色体上に見いだされる。一部の実施形態では、本明細書に提示される方法は、ＣＹＰ２Ｄ６遺伝子座（例えば、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）の一部分または全体を解析すること（例えば、配列を決定すること、遺伝子型を判定すること、構造解析を実施すること）を伴う。一部の実施形態では、本明細書に提示される方法は、ＣＹＰ２Ｄ６遺伝子座（例えば、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）の一部分または全体をゲノムＤＮＡから切り出すこと（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよびＣＹＰ２Ｄ６遺伝子座の両側に隣接するゲノム配列を標的とする２つまたはそれよりも多くのｇＲＮＡを使用することによって）を伴う。

【0035】

本明細書で使用される場合、「ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系」という用語は、ガイドＲＮＡ（ｇＲＮＡ）とＣＲＩＳＰＲ関連エンドヌクレアーゼ（Ｃａｓタンパク質）とで構成される複合体を指す。「ＣＲＩＳＰＲ」という用語は、クラスター化された規則的な配置の短い回文配列リピートおよびその関連する系を指し得る。ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系は、クラス１またはクラス２ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系であり得る。ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系は、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、Ｖ型、またはＶＩ型ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系であり得る。ｇＲＮＡは、Ｃａｓタンパク質と相互作用して、Ｃａｓタンパク質のヌクレアーゼ活性を標的配列に方向付けることができる。標的配列は、「プロトスペーサー」および「プロトスペーサー隣接モチーフ」（ＰＡＭ）を含み得、どちらのドメインもＣａｓに媒介される活性（例えば、切断）に必要であり得る。ｇＲＮＡは、プロトスペーサーの逆の鎖上の結合部位と対合（またはそれとハイブリダイズ）して、Ｃａｓを標的配列に方向付ける。ＰＡＭ部位は、Ｃａｓタンパク質によって認識される短い配列を指し得、一部の場合では、Ｃａｓタンパク質活性に必要である。

【0036】

本明細書で使用される場合、「Ｃａｓ」または「Ｃａｓタンパク質」という用語は、エンドヌクレアーゼ活性を有するＣＲＩＳＰＲ／Ｃａｓ系のタンパク質またはＣＲＩＳＰＲ／Ｃａｓ系に由来するタンパク質を指す。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書で使用される場合、Ｃａｓタンパク質である。Ｃａｓタンパク質は、天然に存在するＣａｓタンパク質、天然に存在しないＣａｓタンパク質、またはそれらの断片であり得る。一部の場合では、Ｃａｓタンパク質は、天然に存在するＣａｓタンパク質の変異体（例えば、天然に存在するＣａｓタンパク質と比べて１つまたは複数のアミノ酸置換、挿入、欠失などを有する）である。一部の場合では、Ｃａｓタンパク質はクラスＩＣａｓタンパク質であり、非限定的な例として、Ｃａｓ３、Ｃａｓ８ａ、Ｃａｓ５、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃａｓ１０、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。一部の場合では、Ｃａｓタンパク質はクラスＩＩＣａｓタンパク質であり、非限定的な例として、Ｃａｓ９、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ａ（Ｃｐｆ１）、Ｃａｓ１２ｂ（Ｃ２ｃ１）、Ｃａｓ１２ｃ（Ｃ２ｃ３）、Ｃａｓ１３ａ（Ｃ２ｃ２）、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、Ｃａｓタンパク質はＣａｓ９である。一部の場合では、Ｃａｓタンパク質はＣａｓ１２ａである。

【0037】

「ガイドＲＮＡ」または「ｇＲＮＡ」という用語は、本明細書では互換的に使用され、一般に、Ｃａｓタンパク質に結合し、Ｃａｓタンパク質の標的ポリヌクレオチド（例えば、ＤＮＡ）内の特定の位置へのターゲティングを補助することができるＲＮＡ分子（または集合的にＲＮＡ分子の群）を指す。ガイドＲＮＡは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）セグメント、および、必要に応じて、トランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）セグメントを含み得る。「ｃｒＲＮＡ」という用語は、本明細書で使用される場合、ポリヌクレオチド標的化ガイド配列、ステム配列、および必要に応じて５’突出配列を含むＲＮＡ分子またはその一部を指し得る。ｃｒＲＮＡは結合部位に結合することができる。「ｔｒａｃｒＲＮＡ」という用語は、本明細書で使用される場合、タンパク質結合性セグメント（例えば、タンパク質結合性セグメントは、ＣＲＩＳＰＲ関連タンパク質、例えばＣａｓ９と相互作用することが可能である）を含むＲＮＡ分子またはその一部を指し得る。「ガイドＲＮＡ」という用語は、単一ガイドＲＮＡ（ｓｇＲＮＡ）を指し得、ここで、ｃｒＲＮＡセグメントと必要に応じたｔｒａｃｒＲＮＡセグメントは同じＲＮＡ分子内に位置する。「ガイドＲＮＡ」という用語は、集合的に、２つまたはそれよりも多くのＲＮＡ分子の群も指し得、ここで、ｃｒＲＮＡとｔｒａｃｒＲＮＡは別々のＲＮＡ分子内に位置する。

【0038】

「ロングリードシーケンシング」という用語（「第３世代シーケンシング」とも称される）は、本明細書で使用される場合、一般に、第２世代シーケンシングよりも実質的に長いシーケンシングリード（＞１０，０００ｂｐ）を生成することが可能な任意の配列決定法を指す。一部の実施形態では、本明細書に提示される方法は、ロングリードシーケンシングの使用（例えば、目的の複雑なゲノム領域の遺伝子型を判定するため）を伴う。ロングリードシーケンシング系の非限定的な例としては、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｙ、Ｑｕａｎｔａｐｏｒｅ、Ｓｔｒａｔｏｓ、およびＨｅｌｉｃｏｓによって開発されたものが挙げられる。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（ＳＭＲＴ）（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓによって開発されたもの）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｙによって開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の場合では、ロングリードシーケンシングは、現在開発中であるか、または今後開発されるあらゆるロングリードシーケンシング法または系（例えば、第３世代シーケンシング方法または系）を包含する。

【0039】

「核酸増幅」という用語は、本明細書で使用される場合、一般に、単一の核酸分子から標的核酸（例えば、ＤＮＡ）の多数のコピーを生成する任意の方法を指す。標的核酸は、ＤＮＡの場合もあり（例えば、ＤＮＡ増幅）、ＲＮＡの場合もある（例えば、ＲＮＡ増幅）。核酸増幅は、ポリメラーゼ連鎖反応（ＰＣＲ）およびありとあらゆるその変形形態または改変、ならびに、例えば、これだけに限定されないが、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）などの代替的な型の核酸増幅法を含む。本開示の種々の態様では、本明細書に提示される方法は、核酸（例えば、ＤＮＡ）増幅の使用を伴わない（例えば、増幅フリー）。

【0040】

本開示の方法

【0041】

本開示の一態様では、目的のゲノム領域を解析する方法であって、（ａ）目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、（ｂ）目的のゲノム領域を含むゲノムＤＮＡを単離するステップと、（ｃ）切り出された目的のゲノム領域を解析するステップとを含み、ＤＮＡ増幅を伴わない、方法が提供される。

【0042】

種々の態様では、方法は、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを富化させることを伴う。一部の実施形態では、高分子量ゲノムＤＮＡは、少なくとも約１０キロベースの長さである。例えば、高分子量ゲノムＤＮＡは、少なくとも約１０キロベースの長さ、少なくとも約１５キロベースの長さ、少なくとも約２０キロベースの長さ、少なくとも約３０キロベースの長さ、少なくとも約３５キロベースの長さ、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムＤＮＡを単離するステップにより、インタクトな目的のゲノム領域全体が試料中に含有されることを確実にする。

【0043】

種々の態様では、方法は、高分子量ゲノムＤＮＡを単離するための任意の方法を伴う。高分子量ゲノムＤＮＡを単離するための方法の非限定的な例としては、ＮｕｃｌｅｏＢｏｎｄ（登録商標）ＧｅｎｏｍｉｃＤＮＡａｎｄＲＮＡｐｕｒｉｆｉｃａｔｉｏｎｓｙｓｔｅｍ（ＴａｋａｒａＢｉｏ製）、およびＮａｎｏｂｉｎｄＣＢＢＢｉｇＤＮＡｋｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ製）が挙げられる。

【0044】

一部の態様では、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの前に実施することができる。他の態様では、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの後（例えば、目的のゲノム領域をゲノムＤＮＡから切り出された後）に実施することができる。

【0045】

種々の態様では、目的のゲノム領域は複雑なゲノム領域または高度に複雑なゲノム領域である。一部の場合では、目的のゲノム領域は高度に多型的なゲノム領域である。一部の場合では、目的のゲノム領域は多数の反復エレメントまたは領域を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する（例えば、標的遺伝子に対して少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれよりも大きな配列同一性を有する）１つまたは複数の追加的な遺伝子を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する（例えば、標的遺伝子に対して少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれよりも大きな配列同一性を有する）１つまたは複数の偽遺伝子を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、伝統的な方法によって（例えば、ショートリードシーケンシング法によって）正確に解析することが一般に難しいまたは難易度が高いゲノム領域である。

【0046】

一部の場合では、目的の複雑なゲノム領域は、少なくとも約１０キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約１０キロベースの長さ、少なくとも約１５キロベースの長さ、少なくとも約２０キロベースの長さ、少なくとも約２５キロベースの長さ、少なくとも約３０キロベースの長さ、少なくとも約３５キロベースの長さ、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さ、少なくとも約１００キロベースの長さ、少なくとも約１１０キロベースの長さ、少なくとも約１２０キロベースの長さ、少なくとも約１３０キロベースの長さ、少なくとも約１４０キロベースの長さ、少なくとも約１５０キロベースの長さ、少なくとも約１６０キロベースの長さ、少なくとも約１７０キロベースの長さ、少なくとも約１８０キロベースの長さ、少なくとも約１９０キロベースの長さ、少なくとも約２００キロベースの長さ、少なくとも約２１０キロベースの長さ、少なくとも約２２０キロベースの長さ、少なくとも約２３０キロベースの長さ、少なくとも約２４０キロベースの長さ、または少なくとも約２５０キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約１０キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約２５０キロベースの長さよりも短い。

【0047】

種々の態様では、方法は、目的のゲノム領域を含むゲノムＤＮＡ（例えば、複雑なゲノム領域）をＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップを伴う。一部の場合では、接触させるステップにより、目的のゲノム領域の全体がゲノムＤＮＡから切り出される。一部の場合では、接触させるステップにより、目的のゲノム領域の一部が切り出される。ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。ＣａｓＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

【0048】

一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ９タンパク質またはポリペプチドである。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは、細菌種Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓに由来する。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは野生型Ｃａｓ９アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Ｃａｓ９タンパク質またはポリペプチドは野生型Ｃａｓ９アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは１つまたは複数の突然変異（例えば、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて）を有する。一部の場合では、１つまたは複数の突然変異は置換、欠失、または挿入である。Ｃａｓ９タンパク質またはポリペプチドは、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて少なくとも約５０％の配列同一性を有するアミノ酸配列を有し得る。例えば、Ｃａｓ９タンパク質またはポリペプチドは、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の配列同一性を有し得る。一部の場合では、Ｃａｓ９変異体は、野生型Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９と比べて１つまたは複数の点突然変異を含み得る。例えば、Ｃａｓ９変異体は、野生型Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群から選択される点突然変異を含み得る。

【0049】

種々の態様では、方法は、ゲノムＤＮＡを２つまたはそれよりも多くのｇＲＮＡと接触させるステップを含む。ｇＲＮＡは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）または単一ガイドＲＮＡ（ｓｇＲＮＡ）であり得る。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、それぞれが、ゲノムＤＮＡ上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、２つまたはそれよりも多くのｇＲＮＡは、標的ヌクレオチド配列に結合し、ＣＲＩＳＰＲ複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのそれぞれがゲノムＤＮＡ上の異なる標的配列に結合する。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが目的のゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、目的のゲノム領域の両側に隣接する標的配列に結合する。一般に、ｇＲＮＡは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと）により、目的のゲノム領域の全体がゲノムＤＮＡから切り出される。

【0050】

種々の態様では、方法は、切り出された目的のゲノム領域を解析するステップをさらに伴う。一部の場合では、解析するステップは、切り出されたゲノム領域の遺伝子型を判定することを含む。遺伝子型判定は、目的のゲノム領域の遺伝学的組立ての差異を、目的のゲノム領域の配列を調査するための１つまたは複数のアッセイを使用して同定し、一部の場合では配列と別の配列（例えば、参照配列）と比較するプロセスを含み得る。遺伝子型判定は、これだけに限定されないが、ＤＮＡ配列決定、制限断片長多型同定（ＲＦＬＰＩ）、ランダム増幅多型検出（ＲＡＰＤ）、増幅断片長多型検出（ＡＦＬＰＤ）、ポリメラーゼ連鎖反応（ＰＣＲ）、対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）プローブ、およびＤＮＡマイクロアレイまたはビーズへのハイブリダイゼーションを含めた任意の公知の方法によって実施することができる。一部の場合では、解析するステップは、目的のゲノム領域に対する構造解析を実施することを含む。

【0051】

一部の場合では、解析するステップは、目的のゲノム領域の配列を決定することを含む。一部の場合では、配列決定は、ロングリードシーケンシング法（例えば、第３世代シーケンシング方法）である。ロングリードシーケンシング法は、ショートリードシーケンシング法（例えば、第２世代シーケンシング方法）よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも１０，０００キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（例えば、ＳＭＲＴシーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓにより開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター（例えば、配列決定用アダプター）をライゲーションするステップをさらに伴う。方法は、一部の場合では、末端にテールを付加するステップ、脱リン酸化ステップなどを含めた、配列決定用途に適した任意の他のプロセシング法を伴い得る。

【0052】

種々の態様では、本明細書に提示される方法は、増幅フリーである（例えば、核酸増幅（例えば、ＤＮＡ増幅）ステップを伴わない）。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応（ＰＣＲ）を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）のいずれの１つも伴わない。核酸増幅技法により、多くの場合、誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。

【0053】

種々の態様では、方法は、ゲノムＤＮＡの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムＤＮＡを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムＤＮＡに対して直接実施される。

【0054】

本開示の別の態様では、長さが少なくとも１０キロベースである目的の複雑なゲノム領域を含む遺伝子座の配列を決定する方法であって、（ａ）目的の複雑なゲノム領域を含むゲノムＤＮＡを提供するステップと、（ｂ）目的の複雑なゲノム領域を含む高分子量ＤＮＡを単離するステップと、（ｃ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、複雑なゲノム領域の両側に隣接する、ステップと、ｃ）複雑なゲノム領域を解析するステップとを含む方法が提供される。一部の場合では、方法は、ＤＮＡ増幅を伴わない（例えば、増幅フリー）。

【0055】

種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する１つまたは複数の偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも約７５％（例えば、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有し得る。特定の一態様では、遺伝子座は、標的遺伝子であるＣＹＰ２Ｄ６、ならびに偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む。

【0056】

種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する１つまたは複数の追加的な遺伝子を含む。一部の場合では、１つまたは複数の追加的な遺伝子は、標的遺伝子に対して少なくとも約７５％（例えば、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有し得る。特定の一態様では、遺伝子座は、遺伝子ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、遺伝子座は、一般に、伝統的な方法によって（例えば、ショートリードシーケンシング法によって）正確に配列決定することが難しいまたはその難易度が高いものである。

【0057】

種々の態様では、複雑なゲノム領域は、高度に多型的な遺伝子座である。種々の態様では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。

【0058】

【0059】

種々の態様では、方法は、遺伝子座を含むゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップを伴う。一部の場合では、接触させるステップにより、遺伝子座全体がゲノムＤＮＡから切り出される。一部の場合では、接触させるステップにより、目的の遺伝子座の一部が切り出される。ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。クラスＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

【0060】

【0061】

種々の態様では、方法は、ゲノムＤＮＡを２つまたはそれよりも多くのｇＲＮＡと接触させるステップを含む。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、それぞれが、ゲノムＤＮＡ上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、２つまたはそれよりも多くのｇＲＮＡは、標的ヌクレオチド配列に結合し、ＣＲＩＳＰＲ複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのそれぞれがゲノムＤＮＡ上の異なる標的配列に結合する。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが目的の複雑なゲノム領域の上流の領域と相補的または実質的に相補的であり、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが目的の複雑なゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは目的の複雑なゲノム領域の両側に隣接する標的配列に結合する。一般に、ｇＲＮＡは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと）により、目的のゲノム領域の全体がゲノムＤＮＡから切り出される。

【0062】

種々の態様では、方法は、複雑なゲノム領域を解析するステップをさらに伴う。解析するステップは、切り出された目的のゲノム領域の遺伝子型を判定すること、構造解析を実施すること、および／または配列を決定することを含めた本明細書に提示される任意の方法を包含し得る。一部の場合では、配列決定は、ロングリードシーケンシング法（例えば、第３世代シーケンシング方法）である。ロングリードシーケンシング法は、ショートリードシーケンシング法（例えば、第２世代シーケンシング方法）よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも１０，０００キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（例えば、ＳＭＲＴシーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓにより開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター（例えば、配列決定用アダプター）をライゲーションするステップをさらに伴う。ＤＮＡ試料を配列決定のために調製するために適した任意の追加的な方法を使用することができる（例えば、末端にテールを付加するステップ、脱リン酸化ステップなど）。

【0063】

種々の態様では、方法は、ゲノムＤＮＡを含む試料から高分子量ゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを富化させるステップを伴う。一部の実施形態では、高分子量ゲノムＤＮＡは少なくとも約１０キロベースの長さである。例えば、高分子量ゲノムＤＮＡは、少なくとも約１０キロベースの長さ、少なくとも約１５キロベースの長さ、少なくとも約２０キロベースの長さ、少なくとも約２５キロベースの長さ、少なくとも約３０キロベースの長さ、少なくとも約３５キロベースの長さ、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムＤＮＡを単離するステップにより、インタクトな遺伝子座全体が試料中に含有されることを確実にする。

【0064】

【0065】

一部の態様では、高分子量ゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの前に実施することができる。他の態様では、高分子量ゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの後（例えば、目的のゲノム領域をゲノムＤＮＡから切り出された後）に実施することができる。

【0066】

種々の態様では、本明細書に提示される方法は、増幅フリーである（例えば、核酸増幅（例えば、ＤＮＡ増幅）ステップを伴わない）。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応（ＰＣＲ）を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）のいずれの１つも伴わない。核酸増幅技法により、多くの場合、配列決定用鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。

【0067】

【0068】

さらに別の態様では、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を解析する方法であって、ａ）当該遺伝子座を含むゲノムＤＮＡを提供するステップと、ｂ）当該遺伝子座をゲノムＤＮＡから切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の両側に隣接する、ステップと、ｃ）当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、方法は、ｂ）の前に高分子量ＤＮＡを単離するステップをさらに含む。

【0069】

一部の場合では、解析するステップは、遺伝子座（例えば、本明細書に記載の）の遺伝子型を判定することを含む。一部の場合では、解析するステップは、遺伝子座（例えば、本明細書に記載の）の構造解析を実施することを含む。一部の場合では、解析するステップは、遺伝子座（例えば、本明細書に記載の）の配列を決定すること（例えば、ロングリードシーケンシング）を含む。

【0070】

別の態様では、対象におけるＣＹＰ２Ｄ６の遺伝子変異を同定する方法であって、ａ）対象から得たゲノムＤＮＡを含む生体試料を提供するステップと、ｂ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、ｃ）遺伝子座のロングリードシーケンシングを実施するステップと、ｄ）対象のＣＹＰ２Ｄ６の１つまたは複数の遺伝子変異を同定するステップとを含む方法が提供される。

【0071】

一部の場合では、遺伝子座は少なくとも約４０キロベースの長さである。例えば、遺伝子座は、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さ、または少なくとも約１００キロベースの長さであり得る。

【0072】

種々の態様では、方法は、遺伝子座を含むゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップを伴う。一部の場合では、接触させるステップにより、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の全体がゲノムＤＮＡから切り出される。一部の場合では、接触させるステップにより、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の一部が切り出される。ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。クラスＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

【0073】

【0074】

種々の態様では、方法は、ゲノムＤＮＡを２つまたはそれよりも多くのｇＲＮＡと接触させるステップを含む。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、それぞれが、ゲノムＤＮＡ上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、２つまたはそれよりも多くのｇＲＮＡは、標的ヌクレオチド配列に結合し、ＣＲＩＳＰＲ複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのそれぞれがゲノムＤＮＡ上の異なる標的配列に結合する。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の上流の領域と相補的または実質的に相補的であり、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の下流の領域と相補的または実質的に相補的である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の両側に隣接する標的配列に結合する。一般に、ｇＲＮＡは、それぞれが、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の外側にあるゲノム配列を標的とするように設計され、したがって、接触させるステップ（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと）により、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の全体がゲノムＤＮＡから切り出される。

【0075】

一部の場合では、ｇＲＮＡのうちの少なくとも１つは、以下の表１に提示されている任意のヌクレオチド配列（例えば、配列番号１～２６）と一致するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つは、以下の表１に提示されている任意のヌクレオチド配列（例えば、配列番号１～２６）に対して少なくとも約９０％（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有するヌクレオチド配列を含む。一部の場合では、第１のｇＲＮＡは、配列番号１、２、または１３～１６のいずれか１つのヌクレオチド配列、または配列番号１、２、または１３～１６のいずれか１つに対して少なくとも９０％の配列同一性（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）を有するヌクレオチド配列を含む。一部の場合では、第２のｇＲＮＡは、配列番号３～１２または１７～２６のいずれか１つのヌクレオチド配列、または配列番号３～１２または１７～２６のいずれか１つに対して少なくとも９０％の配列同一性（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）を有するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｃｒＲＮＡである。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｓｇＲＮＡである。

【表1-1】

【表1-2】

【表1-3】

【0076】

種々の態様では、方法は、切り出された目的のゲノム領域を解析するステップ（例えば、遺伝子型を判定すること、配列を決定すること、構造解析を実施すること）をさらに伴う。一部の場合では、配列決定は、ロングリードシーケンシング法（例えば、第３世代シーケンシング方法）である。ロングリードシーケンシング法は、ショートリードシーケンシング法（例えば、第２世代シーケンシング方法）よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも１０，０００キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（例えば、ＳＭＲＴシーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓにより開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター（例えば、配列決定用アダプター）をライゲーションするステップをさらに伴う。

【0077】

種々の態様では、方法は、ゲノムＤＮＡを含む試料から高分子量ゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを富化させるステップを伴う。一部の実施形態では、高分子量ゲノムＤＮＡは少なくとも約４０キロベースの長さである。例えば、高分子量ゲノムＤＮＡは、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムＤＮＡを単離するステップにより、インタクトな遺伝子座全体が試料中に含有されることを確実にする。

【0078】

【0079】

【0080】

種々の態様では、本明細書に提示される方法は、増幅フリーである（例えば、核酸増幅（例えば、ＤＮＡ増幅）ステップを伴わない）。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応（ＰＣＲ）を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）のいずれの１つも伴わない。核酸増幅技法により、多くの場合、配列決定用鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。

【0081】

【0082】

種々の態様では、遺伝子変異は、ＣＹＰ２Ｄ６の薬理遺伝学的に関連性のある変異（例えば、スター対立遺伝子ハプロタイプ）である。一部の場合では、遺伝子変異は、ＣＹＰ２Ｄ６の構造変異である。一部の場合では、遺伝子変異に基づいて、対象を、ＣＹＰ２Ｄ６機能の低下または喪失を有すると同定する。一部の場合では、対象を、ＣＹＰ２Ｄ６機能の増大または獲得を有すると同定する。

【0083】

種々の態様では、方法は、同定するステップに基づいて、対象に対して処置を推奨するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、対象を処置するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、代替処置を推奨するステップを伴う。種々の態様では、方法は、同定するステップに基づいて、薬物のある投薬量を推奨するステップを伴う。種々の態様では、方法は、対象に投与される薬物（例えば、ＣＹＰ２Ｄ６によって活性化または代謝される）の投薬量を変更するステップ（または投薬量の変更を推奨するステップ）を伴う。一部の場合では、薬物（または治療薬）は、ＣＹＰ２Ｄ６によって活性化または代謝される薬物である。

【0084】

組成物およびキット

【0085】

一態様では、ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびにｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含む組成物が提供される。

【0086】

ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。ＣａｓＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

【0087】

【0088】

一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、それぞれが、ゲノムＤＮＡ上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、２つまたはそれよりも多くのｇＲＮＡは、標的ヌクレオチド配列に結合し、ＣＲＩＳＰＲ複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのそれぞれがゲノムＤＮＡ上の異なる標的配列に結合する。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の上流の領域と相補的または実質的に相補的であり、２つまたはそれよりも多くのｇＲＮＡのうちの少なくとも１つが遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の下流の領域と相補的または実質的に相補的である。一部の実施形態では、２つまたはそれよりも多くのｇＲＮＡは、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の両側に隣接する標的配列に結合する。一般に、ｇＲＮＡは、それぞれが、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の外側にあるゲノム配列を標的とするように設計され、したがって、接触させるステップ（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと）により、遺伝子座（例えば、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含有する）の全体がゲノムＤＮＡから切り出される。

【0089】

一部の場合では、ｇＲＮＡのうちの少なくとも１つは、表１に提示されている任意のヌクレオチド配列（例えば、配列番号１～２６）と一致するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つは、表１に提示されている任意のヌクレオチド配列（例えば、配列番号１～２６）に対して少なくとも約９０％（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｃｒＲＮＡである。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｓｇＲＮＡである。

【0090】

ＣＹＰ２Ｄ６の遺伝子型を判定するためのキットであって、ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびにｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含むキットが本明細書にさらに提示される。一部の場合では、キットは、使用説明書（例えば、ＣＹＰ２Ｄ６の遺伝子型を判定するためのキットの使用に関する）をさらに含む。

【0091】

ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。クラスＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

【0092】

【0093】

【0094】

【0095】

対象および生体試料

【0096】

対象は、遺伝子解析のための生体試料を提供することができる。生体試料は、対象によって生成された任意の物質であってよい。一般に、生体試料は、対象から取得された任意の組織または対象によって生成された任意の物質である。生体試料は、例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳などの体液であり得る。生体試料は、細胞および／または固形組織（例えば、頬組織（例えば、頬スワブから）、糞便、皮膚、毛髪、器官組織など）であり得る。一部の場合では、生体試料は、固形腫瘍または固形腫瘍の生検材料である。一部の場合では、生体試料は、ホルマリン固定された、パラフィン包埋（ＦＦＰＥ）組織試料である。生体試料は、ゲノムＤＮＡを含む任意の生体試料であってよい。

【0097】

生体試料を対象から引き出すことができる。対象は、哺乳動物、爬虫類、両生類、トリ、または魚であり得る。哺乳動物は、ヒト、類人猿、オランウータン、サル、チンパンジー、ウシ、ブタ、ウマ、齧歯類、鳥類、爬虫類、イヌ、ネコ、または他の動物であり得る。爬虫類は、トカゲ、ヘビ、ワニ、カメ（ｔｕｒｔｌｅ）、クロコダイル、およびカメ（ｔｏｒｔｏｉｓｅ）であり得る。両生類は、ヒキガエル、カエル、イモリ、およびサンショウウオであり得る。トリの例としては、これだけに限定されないが、アヒル、ガチョウ、ペンギン、ダチョウ、およびフクロウが挙げられる。魚の例としては、これだけに限定されないが、ナマズ、ウナギ、サメ、およびメカジキが挙げられる。対象はヒトであることが好ましい。対象は疾患または状態を有し得る。対象に治療薬を処方することができる。治療薬は、ＣＹＰ２Ｄ６によって活性化および／または代謝される治療薬であり得る。

【0098】

本開示のシステム

【0099】

本明細書に提示される方法を実施するためのシステムが本明細書にさらに提示される。一態様では、目的の複雑なゲノム領域を解析するためのシステムであって、（ａ）（ｉ）目的の複雑なゲノム領域を含むゲノムＤＮＡから高分子量ＤＮＡを単離するステップと、（ｉｉ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、（ｉｉｉ）目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、ＤＮＡ増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。

【0100】

種々の態様では、出力はレポートである。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子型である。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子配列である。種々の態様では、出力は、目的の複雑なゲノム領域の構造解析である。種々の態様では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。

【0101】

別の態様では、対象のＣＹＰ２Ｄ６の遺伝子変異を同定するためのシステムであって、（ａ）（ｉ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、対象から得たゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、（ｉｉｉ）当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。

【0102】

種々の態様では、出力はレポートである。種々の態様では、出力は、ＣＹＰ２Ｄ６の遺伝子変異を同定するものである。種々の態様では、出力は、ＣＹＰ２Ｄ６の機能の低下、喪失、または増大を同定するものである。種々の態様では、レポートは、遺伝子変異に基づいて、対象に対して処置を推奨するものである。種々の態様では、レポートは、遺伝子変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。種々の態様では、レポートは、遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、ＣＹＰ２Ｄ６によって活性化または代謝される治療薬である。

【0103】

本開示は、本明細書に記載の方法を実施するための、コンピュータに基づくシステムをさらに提供する。一部の態様では、システムを、本明細書に提示される方法によって生成されたデータを解析するために使用することができる。システムは、１つまたは複数のクライアントコンポーネントを含み得る。１つまたは複数のクライアントコンポーネントは、ユーザーインタフェースを含み得る。システムは、１つまたは複数のサーバーコンポーネントを含み得る。サーバーコンポーネントは、１つまたは複数のメモリ位置を含み得る。１つまたは複数のメモリ位置は、データ入力を受け取るように構成することができる。データ入力は、配列決定データを含み得る。配列決定データは、対象由来の核酸試料（例えば、ゲノムＤＮＡ）から生成することができる。本開示のシステムでの使用に適した配列決定データの非限定的な例は記載されている。システムは、１つまたは複数のコンピュータプロセッサをさらに含み得る。１つまたは複数のコンピュータプロセッサを１つまたは複数のメモリ位置に作動可能にカップリングすることができる。１つまたは複数のコンピュータプロセッサを、スクリーン上に表示するための出力を生成するようにプログラムすることができる。出力は１つまたは複数のレポートを含み得る。

【0104】

本明細書に記載のシステムは、１つまたは複数のクライアントコンポーネントを含み得る。１つまたは複数のクライアントコンポーネントは、１つまたは複数のソフトウェアコンポーネント、１つまたは複数のハードウェアコンポーネント、またはこれらの組合せを含み得る。１つまたは複数のクライアントコンポーネントは、１つまたは複数のサーバーコンポーネントを通じて１つまたは複数のサービスにアクセス可能である。１つまたは複数のクライアントコンポーネントによりネットワークを通じて１つまたは複数のサービスにアクセス可能である。ネットワークは、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信したイントラネットおよび／もしくはエクストラネットであり得る。ネットワークは、一部の場合では、電気通信および／またはデータネットワークである。ネットワークは１つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワークは、一部の場合では、コンピュータシステムを利用して、ピアツーピアネットワークをインプリメントすることができ、それにより、コンピュータシステムとカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。

【0105】

システムは、１つまたは複数のメモリ位置（例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ）、電子記憶装置（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース（例えば、ネットワークアダプター）、ならびに、キャッシュ、他のメモリ、データ記憶および／または電子ディスプレイアダプターなどの周辺機器を含み得る。メモリ、記憶装置、インターフェースおよび周辺機器は、マザーボードなどの通信バスを通じてＣＰＵと通信する。記憶装置は、データを記憶させるためのデータ記憶単位（またはデータリポジトリ）であり得る。一実施例では、１つまたは複数のメモリ位置に受け取った配列決定データを記憶させることができる。

【0106】

システムは、１つまたは複数のコンピュータプロセッサを含み得る。１つまたは複数のコンピュータプロセッサは、例えば、記憶されたデータにアクセスするために、１つまたは複数のメモリ位置に作動可能にカップリングすることができる。１つまたは複数のコンピュータプロセッサは、機械により実行可能なコードをインプリメントして、本明細書に記載の方法を実施することが可能である。

【0107】

機械により実行可能なまたは機械により可読のコードは、ソフトウェアの形式で提供することができる。使用中、コードをプロセッサによって実行することができる。一部の場合では、コードを記憶装置から検索し、プロセッサからすぐにアクセスできるようにメモリに記憶させることができる。一部の状況では、電子記憶装置を除外することができ、機械により実行可能な命令をメモリに記憶させる。

【0108】

コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。

【0109】

コンピュータシステムなどの本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械（もしくはプロセッサ）により実行可能なコードおよび／または機械可読媒体の一種で実施または具体化される関連データの形式の「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、任意のまたは全てのコンピュータの有形メモリ、プロセッサなど、または関連するそのモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための指示をもたらすことに関与する任意の媒体を指す。

【0110】

したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えば図に示されているデータベースなどをインプリメントするために使用することができる任意のコンピュータ（複数可）のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル；コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、高周波（ＲＦ）および赤外（ＩＲ）データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー（登録商標）ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データもしくは指示を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび／またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、１つまたは複数の指示の１つまたは複数の順序をプロセッサに実行のために伝えることに関与し得る。

【0111】

本明細書に開示されるシステムは、１つまたは複数の電子ディスプレイを含み得る、またはそれと通信し得る。電子ディスプレイは、コンピュータシステムの一部であってもよく、コンピュータシステムに直接またはネットワークを通じてカップリングしていてもよい。コンピュータシステムは、本明細書に開示される種々の特色および機能性を提供するためのユーザーインタフェース（ＵＩ）を含み得る。ＵＩの例としては、限定することなく、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブに基づくユーザーインタフェースが挙げられる。ＵＩにより、ユーザーがそれによって本明細書に記載の方法およびシステムを利用することができる相互作用ツールをもたらすことができる。例として、本発明で構想されるＵＩは、健康管理実践者がそれによって遺伝学的試験を要求し、試験される遺伝学的変異体の一覧をカスタマイズし、レポートを受け取り、閲覧することができる、ウェブに基づくツールであり得る。

【0112】

本明細書に開示される方法は、生物医学的データベース、ゲノムデータベース、生物医学的レポート、疾患レポート、症例対照解析、および１つもしくは複数のデータベースからのデータおよび／もしくは情報に基づいた希少な変異体発見解析、１つもしくは複数のアッセイ、１つもしくは複数のデータもしくは結果、１つもしくは複数のアッセイに基づくもしくはそれから引き出される１つもしくは複数の出力、１つもしくは複数のデータもしくは結果に基づくもしくはそれから引き出される１つもしくは複数の出力、またはこれらの組合せを含み得る。

【0113】

本明細書に記載の通り、１つまたは複数のコンピュータプロセッサにより、機械により実行可能なコードをインプリメントして本開示の方法を実施することができる。機械により実行可能なコードは、任意の数のオープンソースまたはクローズドソースソフトウェアを含み得る。機械により実行可能なコードをインプリメントして、データ入力を解析することができる。データ入力は、１つまたは複数の配列決定反応により生成された配列決定データであり得る。コンピュータプロセッサを少なくとも１つのメモリ位置に作動可能にカップリングすることができる。コンピュータプロセッサにより、少なくとも１つのメモリ位置からデータ（例えば、配列決定データ）にアクセスすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データを参照配列にマッピングすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データから遺伝学的変異体の存在または非存在を決定することができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、スクリーン上に表示するための出力（例えば、レポート）を生成することができる。

【0114】

機械により実行可能なコードは、１つまたは複数のアルゴリズムを含み得る。１つまたは複数のアルゴリズムを使用して本開示の方法をインプリメントすることができる。

【0115】

本開示のシステムは、１つまたは複数のコンピュータシステムを含み得る。図１５は、例えば、データを受け取ること、および前記データに基づいて出力を生成することなど、本開示の方法をインプリメントするようにプログラムされたまたは他のやり方で構成されたコンピュータシステム（本明細書では「システム」とも）１５０１を示す。システム１５０１は、シングルコアプロセッサもしくはマルチコアプロセッサであってもよく、並行処理のための複数のプロセッサであってもよい中央処理装置（ＣＰＵ、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも）１５０５を含む。システム１５０１はまた、メモリ１５１０（例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ）、電子記憶装置１５１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース１５２０（例えば、ネットワークアダプター）、ならびにキャッシュ、他のメモリ、データ記憶および／または電子ディスプレイアダプターなどの周辺機器１５２５を含む。メモリ１５１０、記憶装置１５１５、インターフェース１５２０および周辺機器１５２５は、ＣＰＵ１５０５とマザーボードなどの通信バス（実線）を通じて通信する。記憶装置１５１５は、データを記憶させるためのデータ記憶単位（またはデータリポジトリ）であり得る。システム１５０１はコンピュータネットワーク（「ネットワーク」）１５３０に通信インターフェース１５２０を用いて作動可能に（ｏｐｅｒａｔｉｖｅｌｙ）カップリングしている。ネットワーク１５３０は、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信するイントラネットおよび／もしくはエクストラネットであり得る。ネットワーク１５３０は、一部の場合では、電気通信および／またはデータネットワークである。ネットワーク１５３０は１つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワーク１５３０は、一部の場合では、システム１５０１を用いて、ピアツーピアネットワークをインプリメントすることが可能であり、それにより、システム１５０１とカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。

【0116】

システム１５０１は処理システム１５４０と通信する。処理システム１５４０は、例えば、配列決定データを参照配列にマッピングすることまたは分類を遺伝学的変異体に割り当てることなど、本明細書に開示される方法をインプリメントするように構成することができる。処理システム１５４０は、システム１５０１とネットワーク１５３０を通じて、または直接（例えば、有線、無線）接続によって通信させることができる。処理システム１５４０は、核酸配列解析などの解析のために構成することができる。

【0117】

本明細書に記載の方法およびシステムは、システム１５０１の電子記憶位置、例えば、メモリ１５１０または電子記憶装置１５１５などに記憶された機械（またはコンピュータプロセッサ）実行可能なコード（またはソフトウェア）によってインプリメントすることができる。使用中、コードをプロセッサ１５０５によって実行することができる。一部の実施例では、コードを記憶装置１５１５から検索し、プロセッサ１５０５からすぐにアクセスできるようにメモリ１５１０に記憶させることができる。一部の状況では、電子記憶装置１５１５を除外することができ、機械により実行可能な命令をメモリ１５１０に記憶させる。

【0118】

【0119】

本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械（もしくはプロセッサ）により実行可能なコードおよび／または機械可読媒体の一種で実施もしくは具体化される関連データの形式で「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、任意のまたは全てのコンピュータの有形メモリ、プロセッサなど、または関連するそのモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための指示をもたらすことに関与する任意の媒体を指す。

【0120】

したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えばデータベースなどをインプリメントするために使用することができる任意のコンピュータ（複数可）のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル；コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、高周波（ＲＦ）および赤外（ＩＲ）データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピーディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データもしくは指示を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび／またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、１つまたは複数の指示の１つまたは複数の順序をプロセッサに実行のために伝えることに関与し得る。

【0121】

コンピュータシステム１５０１は、ユーザーインタフェース（ＵＩ）を含む電子ディスプレイを含み得る、またはそれと通信し得る。ＵＩの例としては、限定することなく、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブに基づくユーザーインタフェースが挙げられる。

【0122】

一部の実施形態では、システム１５０１は、視覚的情報をユーザーに提供するためのディスプレイを含む。一部の実施形態では、ディスプレイはブラウン管（ＣＲＴ）である。一部の実施形態では、ディスプレイは液晶ディスプレイ（ＬＣＤ）である。さらなる実施形態では、ディスプレイは薄膜トランジスタ液晶ディスプレイ（ＴＦＴ－ＬＣＤ）である。一部の実施形態では、ディスプレイは有機発光ダイオード（ＯＬＥＤ）ディスプレイである。種々のさらなる実施形態では、ＯＬＥＤディスプレイはパッシブマトリックスＯＬＥＤ（ＰＭＯＬＥＤ）またはアクティブマトリックスＯＬＥＤ（ＡＭＯＬＥＤ）ディスプレイである。一部の実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに別の実施形態では、ディスプレイは本明細書に開示されるものなどのデバイスの組合せである。ディスプレイは、１つまたは複数の生物医学的レポートが本明細書に記載の方法によって生成されたらそれをエンドユーザーに提供することができるものである。

【0123】

一部の実施形態では、システム１５０１は、ユーザーから情報を受け取る入力デバイスを含む。一部の実施形態では、入力デバイスはキーボードである。一部の実施形態では、入力デバイスは、非限定的な例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含めたポインティングデバイスである。一部の実施形態では、入力デバイスはタッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他の音入力を取り込むマイクロホンである。他の実施形態では、入力デバイスは、動きまたは視覚的入力を取り込むためのビデオカメラである。さらに別の実施形態では、入力デバイスは、本明細書に開示されるものなどのデバイスの組合せである。

【0124】

システム１５０１は、１つまたは複数のデータベースを含んでもよく、それと作動可能にカップリングすることもできる。データベースは、ゲノムデータベース、プロテオミクスデータベース、薬理ゲノミクスデータベース、生物医学的データベース、および科学的データベースを含み得る。データベースは公的に利用可能なデータベースであり得る。その代わりにまたはそれに加えて、データベースは独自のデータベースを含み得る。データベースは市販のデータベースであり得る。データベースとしては、これだけに限定されないが、ＭｅｎｄｅｌＤＢ、ＰｈａｒｍＧＫＢ、Ｖａｒｉｍｅｄ、Ｒｅｇｕｌｏｍｅ、ｃｕｒａｔｅｄＢｒｅａｋＳｅｑｊｕｎｃｔｉｏｎｓ、ＯｎｌｉｎｅＭｅｎｄｅｌｉａｎＩｎｈｅｒｉｔａｎｃｅｉｎＭａｎ（ＯＭＩＭ）、ＨｕｍａｎＧｅｎｏｍｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ（ＨＧＭＤ）、ＮＣＢＩｄｂＳＮＰ、ＮＣＢＩＲｅｆＳｅｑ、ＧＥＮＣＯＤＥ、ＧＯ（ｇｅｎｅｏｎｔｏｌｏｇｙ）、およびＫｙｏｔｏＥｎｃｙｃｌｏｐｅｄｉａｏｆＧｅｎｅｓａｎｄＧｅｎｏｍｅｓ（ＫＥＧＧ）が挙げられる。

【0125】

データを、データのユーザーと同じ国を含む地理的な位置で生成し、かつ／またはそこから伝送することができる。データを、例えば、１つの国の地理的な位置で生成し、かつ／またはそこから伝送することができ、データのユーザーは異なる国に存在していてよい。一部の場合では、本開示のシステムによってアクセスしたデータを複数の地理的な位置のうちの１カ所からユーザーに伝送することができる。データを、例えば、ネットワーク、安全なネットワーク、安全でないネットワーク、インターネット、またはイントラネットにより、複数の地理的な位置の間で行き来するように伝送することができる。

【実施例】

【0126】

以下の実施例は、本開示の種々の実施形態を例示する目的で提示され、本開示をどのようにも限定することを意図するものではない。本実施例は、本明細書に記載の方法と共に、現在の代表的な好ましい実施形態であり、例示であり、本開示の実施形態の範囲を限定することを意図するものではない。特許請求の範囲によって定義される本開示の主旨に包含される実施例における変化および他の使用が当業者には想起されよう。

【0127】

（実施例１）

【0128】

ＣＹＰ２Ｄ６および臨床試験

【0129】

ＣＹＰ２Ｄ６遺伝子構造：ＣＹＰ２Ｄ６は、小さな遺伝子（４３８２ｂｐ）であり、９つのエクソンを有する。しかし、この高度に多型の遺伝子座の遺伝子解析は、図１に示されている通り、高度に類似した非機能性のＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８偽遺伝子が遺伝子座内に存在することに起因して難しい。ＣＹＰ２Ｄ６とＣＹＰ２Ｄ７の類似性および大きなリピート領域の存在により、遺伝子欠失および遺伝子重複だけでなく、３’ＣＹＰ２Ｄ７と５’ＣＹＰ２Ｄ６または３’ＣＹＰ２Ｄ６と５’ＣＹＰ２Ｄ７のいずれかを含有する複雑な遺伝子ハイブリッドも生じている。現在、これらの構造変異の存在を検出するために多数の試験アッセイが求められている。

【0130】

現行の試験用プラットフォーム：ＣＹＰ２Ｄ６を解析するための一般的な方法の１つは、長距離の対立遺伝子特異的ＰＣＲ産物の配列解析によるものである。簡単に述べると、対立遺伝子特異的プライマーを使用して、標的化される領域を増幅する。ＰＣＲ産物において見いだされる一塩基変異体（ＳＮＶ）はその対立遺伝子のハプロタイプを表す。対立遺伝子特異的アンプリコンは、重複した遺伝子コピーならびにＣＹＰ２Ｄ６－２Ｄ７およびＣＹＰ２Ｄ７－２Ｄ６ハイブリッド遺伝子からも生じ得る。つい最近、ＣＹＰ２Ｄ６ハプロタイプをより正確に特徴付けるために、単一分子リアルタイム（ＳＭＲＴ）シーケンシングまたはナノポアシーケンシングなどのロングリードシーケンシング技術も使用されている；しかし、ＣＹＰ２Ｄ６のロングリードシーケンシングのためのライブラリー生成が依然として限定されている。配列決定のためのＣＹＰ２Ｄ６鋳型を生成するために現在使用されているＸＬ－ＰＣＲ反応は、生成することができる産物のサイズに限界があり、プライマー特異的であり、また、複雑なハイブリッドまたは多くの公知のＣＮＶは、その変異が以前に特徴付けられており、目的の試料中に存在することが分かっている場合を除いて捕捉されない。

【0131】

要約すると、ＣＹＰ２Ｄ６は、全ての処方薬の約２５％の代謝に直接関与する高度に多型的な遺伝子である。コピー数の変化を含めたこの遺伝子の遺伝子変異は、患者の薬物代謝状態に直接影響を及ぼし得る。コピー数を含む正確な遺伝子型は極めて重要であり、現行の方法体系ではこの遺伝子領域の複雑さを十分にアッセイすることができない。

【0132】

ＣＲＩＳＰＲ／Ｃａｓ９技術および部位特異的アダプターライゲーションをロングリードシーケンシングと組み合わせて利用して、ＣＹＰ２Ｄ６解析のための診断品質の方法体系を開発するための方法が本明細書で提唱される。この手法では、単一の、試料にとらわれないＣＲＩＳＰＲ切断ステップを利用して、ロングリードシーケンシングのためのＣＹＰ２Ｄ６遺伝子座全体を単離する。この方法体系により、一塩基多型（ＳＮＰ）およびＣＮＶの両方を正確に検出すること、ならびに、最も正確な、可能性のあるフェージングされたＣＹＰ２Ｄ６遺伝子型および代謝型の状態を割り当てることが可能になる。

【0133】

ｉｎｖｉｔｒｏおよびｉｎｖｉｖｏのどちらにおいても、ＣＲＩＳＰＲ技術を使用して、目的のゲノム領域（ＲＯＩ）を標的とし、それを切り出すことができる。簡単に述べると、ＣＲＩＳＰＲ－Ｃ関連タンパク質９（Ｃａｓ９）が、合成的に生成された標的特異的ガイドＲＮＡ（ｓｇＲＮＡ）と複合体を形成すると、ガイドＲＮＡの標的特異的配列に対して相補性を有する配列において二本鎖カットが創出される。ＲＯＩの両末端の配列を標的とするようにｓｇＲＮＡを設計することにより、ＣＲＩＳＰＲ－Ｃａｓ９を使用して、メガベースの長さに至るまでであり得るＤＮＡを切り出すことができる。

【0134】

ロングリードシーケンシング：ショートリード次世代シーケンシング（ＮＧＳ）の開発によりヒト遺伝学が改革されたが、限界がよく理解されている。単離されたＨＭＷＤＮＡ断片のロングリードシーケンシングでは、フェージング情報を得ること、小さな構造変異を同定すること、および、タンデムリピートを含めた、ゲノムの高度に複雑な領域をより良好にアセンブルすることが可能になるので、最近注目を浴びている。ＤＮＡ断片を標的特異的に単離するためのＣＲＩＳＰＲ技術の使用により、ロングリードシーケンシングのためにゲノムの関連性のある領域を標的とするための革新的かつあざやかな手法がもたらされる。

【0135】

ＧｅＴ－ＲＭコホート：ＣＹＰ２Ｄ６遺伝子構造を系統的に特徴付けるための主要な取り組みの一部として、アッセイ開発、検証、品質管理および技能試験のためのよく特徴付けられた参照材料の最先端のセットを確立するためにＣＹＰ２Ｄ６遺伝子型判定データが提供された。この取り組みは、ＧｅｎｅｔｉｃＴｅｓｔｉｎｇＲｅｆｅｒｅｎｃｅＭａｔｅｒｉａｌｓＣｏｏｒｄｉｎａｔｉｏｎＰｒｏｇｒａｍ（ＧｅＴ－ＲＭ）ａｔｔｈｅＣｅｎｔｅｒｓｆｏｒＤｉｓｅａｓｅＣｏｎｔｒｏｌａｎｄＰｒｅｖｅｎｔｉｏｎ－ｂａｓｅｄＧｅｎｅｔｉｃＴｅｓｔｉｎｇＲｅｆｅｒｅｎｃｅＭａｔｅｒｉａｌＣｏｏｒｄｉｎａｔｉｏｎＰｒｏｇｒａｍ，ｔｈｅＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅｆｏｒＭｅｄｉｃａｌＲｅｓｅａｒｃｈ、ならびに他のＰＧｘコミュニティメンバーとの共同研究で行われた。この研究の一部として、複雑な構造配置および／または希少なＣＹＰ２Ｄ６遺伝子型を含有するいくつかの試料に対してＰｈａｒｍａｃｏｓｃａｎ（商標）に基づくＣＹＰ２Ｄ６遺伝子型判定を行った。このデータをＸＬ－ＰＣＲに基づくＮＧＳ解析と併せて使用して、これらの試料について現行の解析方法体系で可能な最も正確な遺伝子型を決定した。全ての細胞株およびコンセンサス遺伝子型判定に関する情報およびアノテーションデータにより、提唱された新しい配列決定および解析手法の検証の基礎が築かれる。

【0136】

研究設計および方法

【0137】

目的１（方法の開発）：（ａ）後の、ゲノムヒトＤＮＡ（例えば、血液試料）におけるサイズ解析（例えば、ゲル）のためのＣＹＰ２Ｄ６－Ｄ７ゲノム遺伝子座を含有する高分子量ＤＮＡセグメントを創出するための特定のＣＲＩＳＰＲ／Ｃａｓ９方法体系の最適化。（ｂ）標的化される領域の単離／富化および配列決定のためのＸＬ－ライブラリーの生成。（ｃ）ＣＹＰ２Ｄ６－Ｄ７ゲノム遺伝子座のゲノム変異体の長い鋳型の配列決定のためのＮＧＳ手法の確立（例えば、ＰａｃＢｉｏ、ＭｉｎＩＯＮ）。提唱されたワークフローの概略が図２に示されている。

【0138】

ＨＭＷＤＮＡの単離：ＲＯＩ（ＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７）の通常の長さは２８～３５ｋｂである。下流の解析のためにＲＯＩ全体がインタクトであることを確実にするために、ＮｕｃｌｅｏＢｏｎｄ（登録商標）ＧｅｎｏｍｉｃＤＮＡａｎｄＲＮＡｐｕｒｉｆｉｃａｔｉｏｎｓｙｓｔｅｍを使用してプロトコールを開発して高分子量ｇＤＮＡ（最大７０ｋｂ）を単離した。改変プロトコールにより、他の方法体系を用いた場合に観察される１０ｋｂ～５０ｋｂの範囲と比較して、５０ｋｂを超える分子量のｇＤＮＡを抽出することが可能になる（図３）。

【0139】

高度に特異的なｓｇＲＮＡの設計および検証：ＣＹＰ２Ｄ６遺伝子座の複雑で高度に多型的な性質に起因して、従来のＰＣＲおよびアレイに基づく技術では、ＣＮＶ解析およびＳＮＰ解析の両方を実施するために多数のアッセイが必要である。ＣＹＰ２Ｄ６遺伝子のみを標的とするＣＲＩＳＰＲＣａｓ９手法では、Ｄ６／Ｄ７ハイブリッド対立遺伝子またはＣＹＰ２Ｄ６重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。この限定を克服するために、ＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７の両方を包含する領域の両側に隣接する独特の配列を同定した。これらの独特の領域を標的とするｓｇＲＮＡを設計することにより、１つのＣＲＩＳＰＲ／Ｃａｓ９切断反応を実施して、ＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７領域全体を単離した（図４Ａ）。

【0140】

ｓｇＲＮＡの特異性および有効性を確認するために、標的化されるｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物をｇＤＮＡから生成した。ＸＬ－ＰＣＲ産物を、Ｃａｓ９と一緒に、ｓｇＲＮＡは伴わずにインキュベートしたか（図４Ｂ、試料Ａ）、またはＣａｓ９および異なるｓｇＲＮＡと一緒にインキュベートした（図４Ｂ、試料ＢおよびＣ）。Ｃａｓ９およびｓｇＲＮＡと一緒にインキュベートした全てのＰＣＲ産物が切断されて、予測されたサイズのＤＮＡ断片が生じたが、異なるｓｇＲＮＡにより異なる程度の切断効率が示された。

【0141】

ゲノムＤＮＡ内のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座のカット：ｓｇＲＮＡは、オフターゲット認識部位を含有し得るｇＤＮＡに高い効率および特異性で結合しなければならない。ＣＲＩＳＰＲのカット効率および特異性を調べるために、ゲノムＤＮＡをＣａｓ９と一緒に、ｓｇＲＮＡは伴わずにインキュベートしたか（陰性対照）、または、Ｃａｓ９ならびにＣＹＰ２Ｄ６の５’およびＣＹＰ２Ｄ７の３’をカットする２種のｓｇＲＮＡのプールと一緒にインキュベートした。予測される切断部位それぞれの両側に隣接するプライマーを用いてＰＣＲ反応を実施した。ｓｇＲＮＡが正しい結合部位に結合し、切断が起こった場合、ＰＣＲ産物の減少が予想される。実際に、これが観察される（図５Ａ、図５Ｂ）。ｓｇＲＮＡ結合部位の内側のプライマーを使用したＣＹＰ２Ｄ６遺伝子座に対するＰＣＲも実施して、ＣＹＰ２Ｄ６遺伝子内でＣａｓ９媒介性オフターゲット切断が起こるかどうかを決定した。ＣＹＰ２Ｄ６内のオフターゲット切断のエビデンスは認められなかった（図５Ａ、図５Ｂ）。

【0142】

要約すると、ＸＬ－ＰＣＲおよびゲノムＤＮＡの調査により、Ｃａｓ９－ｓｇＲＮＡ複合体により、標的化されたＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座の両側が高い効率でカットされ、遺伝子座内の著しいオフターゲット活性は伴わないことが実証された。切断により予測された２８ｋｂの断片が創出され、これを、富化後、下流のロングリードＮＧＳのために利用することができる。

【0143】

（実施例２）
ＣＲＩＳＰＲ／Ｃａｓ９方法体系のさらなる最適化

【0144】

他のｓｇＲＮＡおよびＣａｓ酵素を開発し、試験した。上記の通り試験するｓｇＲＮＡを同定および設計するために標準のソフトウェアを使用する。目的は、ＲＯＩにおいて高い効率および特異性で切断を行うｓｇＲＮＡを得ることである。より短いＤＮＡ断片が選好されるが、それでもなお、ＲＯＩ全体が含有される。より短い断片には、配列決定および処理費用が低減するという利益があり得る。ＣＲＩＳＰＲＣａｓ１２ａ酵素を用いた同じ領域の切断も試みる。Ｃａｓ１２ａエンドヌクレアーゼは、Ｃａｓ９と同様に機能するが、異なるＰＡＭ配列要件（ＴＴＴＶ）を有し、切断後に５’付着突出を生じさせる。対照的に、Ｃａｓ９では平滑末端が生じる。これは後のステップで重要である。

【0145】

（実施例３）
ゲノムＤＮＡ内のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座の富化

【0146】

概念実証として、上記の切断部位ＣＹＰ２Ｄ６の５’およびＣＹＰ２Ｄ７の３’を標的とするＣａｓ９－ｓｇＲＮＡを用いてｇＤＮＡ５μｇをカットした。切断されたＤＮＡをＢｌｕｅＰｉｐｐｅｎ（ＳａｇｅＳｃｉｅｎｃｅ）機器で、１～５０ｋｂの範囲のサイズ選択を可能にする０．７５％アガロースゲルカセットを使用して流した。溶出した試料が所望のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座を含有することを、ＰＣＲを使用して確認した。このゲルに基づく手法では、ＨＭＷ試料の単離が可能になるが、一方で、時間（ＢｌｕｅＰｉｐｐｅｎの実行当たり約１０～１２時間）、試料数が限られること（実行当たり４～５試料）、材料が著しく減少すること／回収率が不十分であること、および試料当たりの費用が高いこと（約＄５０．００）を含めたいくつかの欠点が存在する。

【0147】

これらの限定を克服するために、標的を富化させるためのいくつかの手法を試験する。これにより、様々な方法の長所と短所を同定すること、およびさらなる臨床試験開発のための最も適切な手法を最終的に同定することが可能になる。これは、臨床診断検査開発のための典型的な手法である。以下のロングリードシーケンシングの考察は、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ（ＯＮＴ）シーケンシングを指すが、プロトコールはいずれも、ＰａｃＢｉｏシーケンシング要件に合うようにわずかな改変で適合させることができる。

【0148】

方法１：標的の増幅フリー富化

【0149】

ＤＮＡの調製：この増幅フリーライブラリー調製法は、ＤＮＡ試料の脱リン酸化および３’末端キャップ形成、その後、ＣＲＩＳＰＲ処理および部位特異的ＯＮＴアダプターライゲーションを伴う。第１のステップにおいて、ｇＤＮＡを、ＤＮＡ断片の５’末端からリン酸基を除去するエビアルカリホスファターゼ、および、単一のチミジンジデオキシヌクレオチドを３’末端に付加するターミナルトランスフェラーゼで処理する。このステップにより、ｇＤＮＡ末端がライゲーション不可能なものになることが確実になる。次いで、ＤＮＡをＣＲＩＳＰＲＣａｓ９：ｇＲＮＡ複合体で処理し、その結果、平滑末端化した約２８～３５ｋｂのＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７断片が生じる（詳細については前の段落を参照されたい）。この後、ＤＮＡポリメラーゼを用いてアデノシンヌクレオチドをＤＮＡの遊離の３’末端（例えば、ｄｄＴＴＰでキャップ形成されていない末端）に付加する「Ａテール付加」ステップを行う。最後に、チミジン突出を有するＯＮＴアダプターをＤＮＡに付加する。ＣＲＩＳＰＲ－Ｃａｓ９による切断によって生じたＤＮＡ末端は相補的な３’突出および５’リン酸基を有する唯一の末端であるので、このＤＮＡ末端のみがアダプターにライゲーションする。

【0150】

配列決定：得られたライブラリーの配列をＯＮＴ機器で直接決定する。この方法によって生成されたＤＮＡライブラリーの数量ではＯＮＴシーケンシングの難易度が高いことが判明した場合、これは、試料を配列決定の前に多重化することによって、および／または入力ｇＤＮＡの数量を増加させることによって克服することができる。さらに、試料をエキソヌクレアーゼで処理し（ＯＮＴアダプターはエキソヌクレアーゼＩＩＩおよびラムダエキソヌクレアーゼに対して抵抗性である）、その結果、全てのバックグラウンドＤＮＡの分解をもたらすことにより、バックグラウンドを低減することができる。

【0151】

方法２：ｉｎｖｉｔｒｏ転写を使用した富化

【0152】

理論的根拠：前の手法で十分なＤＮＡを生成することができなかった場合、またはバックグラウンドＤＮＡが過剰に存在する場合、ｉｎｖｉｔｒｏ転写（ＩＶＴ）による標的化増幅という代替手法を評価する。ＩＶＴにはＰＣＲに対する利点がいくつかある。（１）転写により誤りが伝播する可能性がより低い。（２）転写により、最長距離ＰＣＲ産物のサイズよりも長い２０～３０ｋｂもの長さのＲＮＡ分子を産生させることができる。

【0153】

ＤＮＡの調製：ＣＲＩＳＰＲによる切断後、ＤＮＡをエキソヌクレアーゼで処理して付着末端を生成し、Ｔ７プロモーターおよびＣＹＰ２６－ＣＹＰ２Ｄ７遺伝子座の付着末端に相補的な突出を含有する二本鎖ＤＮＡ断片を標的断片とライゲーションする。ＤＮＡポリメラーゼおよびＤＮＡリガーゼを使用してギャップを埋め、あらゆるニックをふさぐ。ファージＴ７ＲＮＡポリメラーゼにより約２０ｋｂもの長さの転写物を産生させることができる。プロモーターは約２８ｋｂの遺伝子座の両末端にライゲーションするので、遺伝子座の末端のプロモーターからＴ７ＲＮＡポリメラーゼによって産生される最長転写物は、領域全体を包含するのに十分に長くなり得る。しかし、Ｔ７産物の大部分は一般には４ｋｂ未満の長さである。最近発見されたＳｙｎ５シアノファージＲＮＡポリメラーゼは、３０ｋｂもの長さの転写物を産生することができる。Ｓｙｎ５プロモーターをＴ７プロモーターと一緒に試験する。

【0154】

ｉｎｖｉｔｒｏ転写：Ｔ７ＲＮＡポリメラーゼおよびＳｙｎ５ＲＮＡポリメラーゼを用いてＩＶＴを実施する。前者の酵素は市販されているが、後者の酵素は本発明者らの研究室で発現させ、精製したものである。長いＲＮＡ転写物を産生させるために最適化された市販のＴ７ＲＮＡポリメラーゼＩＶＴキットがいくつか存在する。以前の研究により、ヒトゲノムにランダムに挿入されたＴ７プロモーター配列によりＩＶＴの間に５ｋｂよりも大きなＲＮＡ転写物がかなりの分率で産生されることが示されている。全ＲＮＡ収率、大きな転写物（＞１５ｋｂ）の割合および誤り率が、いずれのポリメラーゼおよびＩＶＴ法がより優れた選択肢であるかの決定において重要な因子である。広範囲の長さのＲＮＡ転写物が産生される可能性があるので、ＳＰＲＩビーズを使用して最も大きな転写物を選択することができる。ＲＮＡの配列をＯＮＴ機器で直接決定する。

【0155】

方法３：ｉｎｖｉｔｒｏ転写のためのプロモーターの多部位への導入

【0156】

理論的根拠：上記の手法が不十分である場合、Ｔ７またはＳｙｎ５プロモーターを標的化される領域にわたって多数の部位に挿入する。この手法の潜在的な問題は、遺伝子座の断片化により、変異体をＣＹＰ２Ｄ７またはＣＹＰ２Ｄ６に明確に割り当てること（遺伝子と偽遺伝子は約９４％の配列同一性を共有するため）、およびフェージング情報を引き出すことの難易度が高くなることである。この限定を克服するために、多数の粘着挿入部位を使用して重複する断片を生成する。

【0157】

プロモーターの導入：ＣＲＩＳＰＲによる切断は、遺伝子座内のＲＯＩの両側に隣接する部位および規則正しく間隔のあいた（約１０ｋｂ）離れた部位において起こる。切断はそれぞれ異なる標的部位のセットを用いる２つの別々の反応で行われ、したがって、配列決定後に、得られた重複する断片を使用してリードを繋ぎ合わせることができる。エキソヌクレアーゼによる処理、プロモーターを含有するアダプターのライゲーション、ＩＶＴ、およびｃＤＮＡ合成は上に記載されている。プロモーターを含有するアダプターは、プロモーターのすぐ下流に短い固定された配列を含有する。ｃＤＮＡ合成を実施した際にはこの固定された配列に対する相補性を有するプライマーが逆転写（ＲＴ）に使用される。ＩＶＴによって産生されたＲＮＡが２つの挿入部位間の長さにわたる場合、この配列に特異的なＲＴプライマーにより同じ領域にわたるｃＤＮＡ分子が選択される。

【0158】

潜在的代替：必要であれば、各ＩＶＴ産物の始めに固定された配列を使用する長距離ＰＣＲを数サイクル使用して、挿入部位にわたるｃＤＮＡ分子を選択的に増幅することができる。

【0159】

潜在的代替：ＯＮＴによるＲＮＡの配列決定には、大量のＲＮＡが必要である。必要であれば、転写開始から遠い部位（１５～２０ｋｂ）にアニーリングするプライマーを用いてｃＤＮＡ合成を実施して、長い転写物を選択する。相当な割合のシーケンシングリードが標的遺伝子座にマッピングされない場合、アダプターの非標的部位とのライゲーションの防止を試みる。ＣＲＩＳＰＲ処理前のｇＤＮＡの脱リン酸化、およびｇＤＮＡの末端にいわゆる「ダンベル」アダプターでキャップ形成することが２つの可能性のある選択肢である。

【0160】

（実施例４）
変異体の長い鋳型配列決定のためのＮＧＳ手法の確立

【0161】

方法：現在のところ、潜在的な診断検査の開発に適用できる主要な市販のプラットフォームが２つ存在する。ＰａｃＢｉｏは、ロングリードシーケンシングのための最初の卓越した技術であるが、付随する費用が甚大である。つい最近、費用効果が大きな潜在的に実行可能なプラットフォームとしてナノポアシーケンシング技術が登場した。ＯｘｆｏｒｄＮａｎｏｐｏｒｅ（ＯＮＴ）はプラットフォームとして、スループット、費用および正確度に関して成熟を続けている。したがって、これらの利点があるので、ＯＮＴに焦点が当てられている。それにもかかわらず、提唱された方法体系および方法は、主にプラットフォームによらず、現行の２つのまたは今後のロングリードプラットフォームのいずれにも合うように改変することができる。配列決定実行をＯｘｆｏｒｄＮａｎｏｐｏｒｅＭｉｎＩＯＮで実施することができる。

【0162】

目的２（検証）：（ａ）ロングリード配列アラインメントのための現行のソフトウェアおよびプラットフォームを使用して配列解析を実施して、変異体コーリング、ＣＮＶ解析およびフェージングを実施する。（ｂ）ＣＹＰ２Ｄ６－Ｄ７ロングリード配列解析結果を配列／コピー数変異と比較し、コンセンサス遺伝子型判定およびアノテーションの結果をＧｅｔ－ＲＭプロジェクトからの結果と共に特徴付けて、性能特性およびさらなる診断検査開発に向けたガイダンスを推定する。各方法の実現性を、時間対効果および費用対効果、必要なステップの最小化ならびに結果の質に関して試験し、比較する。包括的な目的は、ＣＹＰ２Ｄ６遺伝子全体の単離、富化、および配列決定に最も適した方法を選択することである。

【0163】

検証のための試料の選択：試料調製法が開発されたら、既知の遺伝子型およびハプロタイプを有する追加的な試料の増大させたセットを解析する。増大させたデータセットに対してプラットフォームを評価するために、重複、ハイブリッド、選択された欠失、および複雑な再構成などの複雑な構造を有する試料を含める。試料は、ＧｅＴ－ＲＭプロジェクト（上の「ＴｈｅＧｅＴ－ＲＭコホート」を参照されたい）から選択される。これらの細胞株およびデータにより、新規のロングリード配列データを現行のゴールドスタンダードと対照して評価することが可能になるので、独特のリソースがもたらされる。この提唱のために、これらの細胞株のサブセットを取得した－ＬＣＬ細胞株。細胞株リポジトリ由来のおよび既存の共同研究による他の関連性のある変異体およびハプロタイプを特徴付けるための追加的な試料を得る。追加的な試料を用いて方法体系をさらに検証するために、全ゲノム配列決定を含め、広範囲にわたって特徴付けられているＮＩＳＴＣｏｒｉｅｌｌコホート由来の追加的な細胞株を利用する。さらに、全血および唾液を含めた、典型的な診断用検体を代表する追加的な試料型を取得する。重複、欠失、ハイブリッドおよびタンデム配置を表す全部で４８の細胞株をこの目的での配列決定のために選択する。解析を２連で、合計９６の配列決定された試料について行う。

【0164】

変異体コーリング、ＣＮＶコーリング、およびフェージング：ロングリードＯＮＴデータのために特別に開発されたソフトウェアパッケージを使用する。Ｃｌａｉｒは、変異体の型、接合性、代替対立遺伝子および挿入／欠失の長さを予測するためのマルチタスク５層畳み込みニューラルネットワークモデルであるＣｌａｉｒｖｏｙａｎｔｅに対する最新のアップデートである。最近開発された追加的なパッケージはＭｅｇａｌｏｄｏｎである。Ｍｅｇａｌｏｄｏｎの機能性は、情報量の多いニューラルネットワークに基づくコーリングを参照配列に繋げることに重点が置かれている。Ｎａｎｏｐｏｒｅ技術の性能特性が最近Ｂｏｗｄｅｎらによって標準の参照試料を使用した全ゲノム配列決定について評価された。８２×カバレッジでのコンセンサス正確度は９９．９％であったが、データからはこのプラットフォームの現行の限定もいくつか示されている。提唱されているのはほんの小さな標的化される領域を配列決定することであるので、また、領域を極めて深く配列決定する能力を考慮すると、現行の解析プラットフォームにより、標的化される配列の十分に正確なデータが生じることが予想される。今後のソフトウェア開発もモニタリングし、新しい方法が利用可能になり次第、それを利用する。

【0165】

コンセンサスデータとの比較：データをＧｅＴ－ＲＭコンセンサス結果（全てのプラットフォームからの結果、ならびに専門家チームによる変異体の精査に基づく）と比較する。ハプロタイプコーリングＳＮＰおよびＣＮＶについての一致を決定し、ハイブリッドハプロタイプの配列の特色を同定する能力を評価し、代謝型の状態を決定するための一致を測定する。次に、追加的な変異体をＧｅＴ－ＲＭプロジェクトからの遺伝子型判定データと比較する。データをフェージング情報（例えば、決定されたハプロタイプ）と併せて解析して、フェージングされた遺伝子型判定データが結果と一致するかどうかを決定し、これにより、非帰属フェージング情報がもたらされる。最後に、配列決定単独で同定される任意の追加的な変異体を同定する。ＣＹＰ２Ｄ６とその偽遺伝子の間の配列類似性に関する探索的配列比較も実施する。

【0166】

予測される問題：問題の１つは、配列決定プラットフォームの全体的な正確度に関する。最初の手法は、極めて深く配列決定することである。この手法により、非系統的な配列決定の誤りを決定することは可能になるはずであるが、プラットフォームの技術的制約に起因する固有の誤りを決定することはより難しい。ＣＹＰ２Ｄ６参照試料のコンセンサスデータとの比較により、この影響を推定することが可能になる。さらに、ＯＮＴプラットフォームおよび改善された配列解析方法に関するさらなるベンチマーク試験により、ロングリードデータについての配列アノテーションが増大することが予測される。

【0167】

今後の方向：薬理遺伝学においては、ＣＹＰ２Ｄ６は最も広く試験されている遺伝子の１つとして突出しているが、一方で、現行の試験技術を使用した解析の技術的難易度が高い。最終目的は、不完全であり誤りを生じやすい現行のプラットフォームから置き換えることが可能な統一的な臨床試験法を開発することである。本出願は、ＣＲＩＳＰＲに基づく配列標的化、革新的な断片富化およびロングリードシーケンシングが実行可能な手法であることの概念実証としての機能を果たす。

【0168】

（実施例５）

【0169】

解析のための特定のゲノム遺伝子座の標的化

【0170】

この手法では、ＰＣＲまたはオリゴヌクレオチドハイブリダイゼーションなどの伝統的な方法と比較して、目的の領域（ＲＯＩ）のみを標的化カットするためにＣＲＩＳＰＲ／ＣＡＳ９系と遺伝子座特異的ガイドＲＮＡを使用する。富化領域選択およびｓｇＲＮＡ設計の新規の手法により、高度に類似した偽遺伝子および反復領域を含む遺伝子座全体を捕捉することが可能になる。そのような領域の例が図１に示されている。

【0171】

現行の問題

【0172】

反復領域（例えば、ＲＥＰ６など）を含み、近接する偽遺伝子と高い配列類似性を共有するＣＹＰ２Ｄ６などの高度に多型的な遺伝子に対する一般的なＤＮＡ抽出方法体系および配列決定手法には多くの欠点がある。これらの問題としては、ＰＣＲにより導入される誤り、ＰＣＲで捕捉可能なサイズの限定、オフターゲットアレイハイブリダイゼーション、多数のアッセイが必要なこと（例えば、配列決定＋ｑＰＣＲを用いたＣＮＶ解析）、オフターゲットアラインメント、変異体フェージングの欠如ならびに金銭的負担および時間的負担が大きいことが挙げられる。図６では、ＮＧＳにより配列決定された伝統的に調製されたライブラリー６例のＩＧＶアラインメントが強調されている。これらのライブラリー（Ａ～Ｆ）はＣＹＰ２Ｄ６長距離ＰＣＲ（ＸＬ－ＰＣＲ）アンプリコンから生成された。アンプリコンを、ＮＧＳ解析の前に断片化（１００～３００ｂｐ）、アダプターライゲーション、およびＰＣＲ増幅に供した。この手法にはいくつかの限定がある。第１に、ＣＹＰ２Ｄ６について示されている通り、各試料中のＣＹＰ２Ｄ６遺伝子を増幅するために、ＣＹＰ２Ｄ６のコピー数の状態およびハイブリッド対立遺伝子が存在するか否かがＸＬ－ＰＣＲの前に分かっていなければならない。正常な対立遺伝子、重複対立遺伝子、欠失対立遺伝子およびハイブリッド対立遺伝子それぞれに対して特異的なプライマーを使用しなければならない。これにはＮＧＳの前に追加的なコピー数アッセイを実施する必要がある。さらに、ＸＬ－ＰＣＲ増幅時間は一般には標的アンプリコンの長さ１ｋｂ当たり０．５～１時間である。

【0173】

ショートリード配列データの解析は、フェージング能力の低下によっても妨害され、また、高度に類似した偽遺伝子または相同な領域との、例えば、図１に示されている通り、ＣＹＰ２Ｄ６と９４％類似したＣＹＰ２Ｄ７偽遺伝子とのオフターゲットアラインメントを起こしやすい。さらに、同じ遺伝子の異なるハプロタイプは、偽遺伝子との類似性のレベルが異なり得、変異体を正しくアラインメントすることができない。

【0174】

ＰＣＲフリーライブラリーには、従来のＰＣＲに基づく手法と比べて著しい利益がある。ＰＣＲフリーライブラリーではＰＣＲ由来の配列の誤りが導入される潜在性が取り除かれ、最大ＰＣＲ産物サイズの現行の限定が克服される。ＸＬ－ＰＣＲ反応時間が除かれ、これは著しい時間の短縮を表し、また、この手法ではヘテロ接合性変異体フェージングおよびコピー数変異（ＣＮＶ）の検出が可能になる。

【0175】

ｓｇＲＮＡの設計

【0176】

上記の通り、ＣＹＰ２Ｄ６遺伝子座の複雑で高度に多型的な性質に起因して、従来のＰＣＲおよびアレイに基づく技術では、ＣＮＶ解析およびＳＮＰ解析の両方のために多数のアッセイを実施する必要がある。抽出および試料の取扱いの間のＤＮＡせん断に起因して、富化のためのインタクトな標的領域の量を最大にするために、目的の遺伝子を捕捉するために直感的に最小の可能性のあるＣＲＩＳＰＲ／Ｃａｓ９標的領域を選択する。しかし、ＣＹＰ２Ｄ６遺伝子のみを標的とするＣＲＩＳＰＲ／Ｃａｓ９手法では、検出される対立遺伝子の少なくとも２０％を構成する、Ｄ６／Ｄ７ハイブリッド対立遺伝子またはＣＹＰ２Ｄ６重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。妥当なガイドＲＮＡ設計のための高度に複雑な要件の例が図７Ａ～７Ｃに示されている。

【0177】

第１の設計の限定は、Ｃａｓ９複合体をＲＯＩにターゲティングするためのＲＮＡをＣＹＰ２Ｄ６遺伝子自体の近くに設計することができないことである。これには、２つの主要な理由がある。第１の理由は、ＣＹＰ２Ｄ６の両側に隣接するＣＹＰ２Ｄ７と同一ではない独特の配列の部位が限定されていることである。そのような独特の配列の部位は、十分に機能しないまたは重要なプロモーター領域の変異を捕捉することができる反復領域を含有する。第２の理由は、ＣＹＰ２Ｄ６ＣＮＶまたはＤ６／Ｄ７もしくはＤ７／Ｄ６ハイブリッド対立遺伝子が存在する場合、追加的なカットが生じ、正確なＣＮＶ解析および配列アラインメントができなくなることである（図７Ａ）。ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８の付近をカットする手法の同様の限定がそれぞれ図７Ｂおよび図７Ｃに示されている。

【0178】

これらの限定を克服するために、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８のいずれも包含する領域の両側に隣接する、それでもなお長距離配列解析のための妥当なサイズのカット断片を生成する独特の配列を同定した。これらの独特の領域を標的とするｓｇＲＮＡを設計することにより、１つのＣＲＩＳＰＲ／Ｃａｓ９切断反応を実施して、ＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７／ＣＹＰ２Ｄ８領域全体を単離する（図８）。さらに、下流の適用に応じて、設計は、ｓｇＲＮＡがＲＯＩの５’末端を標的とするものであるのかまたは３’末端を標的するものであるのかに応じて正しい鎖（＋または－）を標的とするものでなければならない。試験されるｓｇＲＮＡ配列の非限定的な例を以下の表２に示す。ＣＹＰ２Ｄ６は－鎖にコードされるが、ガイドＲＮＡの位置（上流または下流）は＋鎖に対して参照される。染色体上の位置が低い配列はさらに上流であるとみなされ、染色体上の位置が高い配列は下流であるとみなされる。

【表2-1】

【表2-2】

【表2-3】

【0179】

ｓｇＲＮＡの性能解析および検証

【0180】

ｓｇＲＮＡの特異性および有効性を確認するために、標的化されるｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物をｇＤＮＡから生成した。ＸＬ－ＰＣＲ産物を、Ｃａｓ９＋ｓｇＲＮＡなし（もしくはオフターゲットｓｇＲＮＡ）またはＣａｓ９＋目的のｓｇＲＮＡと一緒にインキュベートした。図９Ａは、多数の反応時点における２つの異なるｓｇＲＮＡ（Ｔ＿１およびＴ＿２）のカット効率を示す代表的なアガロースゲルを示す。Ｃａｓ９およびｓｇＲＮＡと一緒にインキュベートした全てのＰＣＲ産物が切断されて、予測されたサイズのＤＮＡ断片が生じたが、異なるｓｇＲＮＡでは異なる程度の切断効率が示された。

【0181】

ＸＬ－ＰＣＲアンプリコンの切断効率の決定後、ゲノムＤＮＡに対する切断効率を解析した。これは、特定のｓｇＲＮＡを用いたＣａｓ媒介性カットを実施し、次いで、カットされたＤＮＡに対して定量的ＰＣＲ反応を実施することによって行った。予測されるｓｇＲＮＡ標的カット部位の両側に対してプライマーを設計した。Ｃａｓ９反応または未カット対照のいずれかからの総ゲノムＤＮＡ１００ｎｇに対してＰＣＲ反応を実行した。ＤＮＡが妥当な部位で切断された場合、未カット対照試料（例えば、オフターゲット領域に対するｓｇＲＮＡを使用したＣａｓ９反応）で生成されるＰＣＲ産物の量と比較してＰＣＲ産物の減少が観察される。図９Ｂおよび図９Ｃに示されている通り、この手法を使用して、ｓｇＲＮＡによりゲノムＤＮＡ内の所望のＲＯＩを標的化することができたかどうかを決定し、そのカットの効率を決定した。ＣＹＰ２Ｄ６遺伝子全体のＸＬ－ＰＣＲにより、カットと未カット対照の間に差異は示されなかった。これにより、反応にわたってカット部位において観察されたＰＣＲ産物の量の減少がＤＮＡのランダムなカットに起因するのではなく、これらの特定の領域の標的化Ｃａｓ９媒介性カットに起因することが示される。

【0182】

高分子量（ＨＭＷ）ＤＮＡの単離

【0183】

長いセグメント（≧５０ｋｂ）の高分子量ゲノム（ＨＭＷ）ＤＮＡの単離により、ＰＣＲ増幅を伴わずに配列決定ライブラリーを生成することが可能になる。図１０に示されている通り、ＨＭＷＤＮＡを社内でリンパ芽球細胞（１８９５９および１９２１３）からＮａｎｏｂｉｎｄＣＣＢＤｉｇＤＮＡｋｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ、ＭａｄｉｓｏｎＷｉ）を使用して抽出した。抽出されたＤＮＡを２％アガロースゲルに流し、サイズをラムダＨＩＮＤＩＩＩラダー（上のバンド、２３．１ｋｂ）、ラムダＤＮＡ（４８．５ｋｂ）、およびＣｏｒｒｉｅｌＩｎｓｔｉｔｕｔｅから取得した以前に抽出されたゲノムＤＮＡ（代替の方法体系によって抽出されたもの）と比較した。社内で抽出したＤＮＡのサイズは他の方法体系によって抽出されたＤＮＡよりも有意に大きく（例としてＣｏｒｉｅｌｌｇＤＮＡ１８９９６）、大多数の実行が４８．５ｋｂのラムダＤＮＡを上回った。高分子量ＤＮＡのさらなる富化をＳｈｏｒｔＲｅａｄＥｌｉｍｉｎａｔｏｒＫｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ、ＭａｄｉｓｏｎＷｉ）を用いて行った。

【0184】

ＣＲＩＳＰＲ／Ｃａｓ９富化およびライブラリー調製

【0185】

上記のｓｇＲＮＡを用いたＣＲＩＳＰＲ／Ｃａｓ９富化をＮａｎｏｐｏｒｅＣａｓ媒介性プロトコール（ＶＮＲ＿９０８４＿ｖ１０９＿ｒｅｖＫ＿０４Ｄｅｃ２０１８）の改変バージョンを使用して実施した。プロセスに使用するｓｇＲＮＡの体積および濃度の改変を行って最適な結果を実現した（具体的にはｓｇＲＮＡ当たり３３．３μｌのｓｇＲＮＡ（３μＭ））。アンプリコンを使用し、ライゲーションプロトコール（ＳＱＫ－ＬＳＫ１０９）によってアダプターをライゲーションし、配列決定のための調製されたライブラリーにＭｉｎＩＯＮ配列決定プラットフォーム（ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＵＫ）を実行し、データ解析を実施した。

【0186】

概念実証

【0187】

ＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７－ＣＹＰ２Ｄ８領域全体（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７）を富化させるｓｇＲＮＡを利用した配列決定により、３つの重要な事柄が確認される：（１）このｓｇＲＮＡ設計により標的領域全体が首尾よく捕捉されること、（２）この戦略によりＲＯＩ全体をオフターゲットリードと比べて有意に富化させることが可能になること、および（３）この方法によりＲＯＩ全体（約４０ｋｂ）を首尾よくロングリード配列決定する能力がもたらされること。

【0188】

図１１Ａに示されている通り、ゲノム全体で、標的化されるＲＯＩを含有する２２番染色体（ｃｈｒ２２）についてのみ著しい配列富化が観察された。他の全てのゲノム領域では最小のカバレッジが示された。ｃｈｒ２２のさらなる解析により、ＲＯＩを含有する領域のみが富化され、＞１０×カバレッジを有することが見いだされた（図１１Ｂ）。全部で、ｃｈｒ２２にマッピングされた１７６リードのうち１２１リードがＲＯＩとアラインメントされる全長リードであった（６８．７５％）。全ての２２番染色体リードについてのリード当たりの平均正確度および同一性が図１１Ｂに示されている。

【0189】

実行アラインメントおよび時間

【0190】

アラインメントされたリード長の中央値は約３９．３５ｋｂ（図１２Ａ）であり、これにより、標的設計サイズの配列決定およびアラインメントが上首尾であったことが示される。注目すべきことに、アラインメントされたリードの全てがｍｉｎＩＯＮでの配列決定の最初の２．５時間のうちに捕捉された（図１２Ｂ）。これにより、本明細書に記載の方法を使用した配列決定時間を標準のロングリードシーケンシング実行時間よりも著しく短縮することができることが示される。これには結果ターンアラウンドタイムおよび機器のスループットの両方に関して大きな価値がある。

【0191】

ＩＧＶ解析

【0192】

配列データアラインメントのさらなるＩＧＶ解析により、シーケンスリードが正しいゲノム内位置（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７）にアラインメントされ、ＲＯＩ全体にわたって均一な深さおよびカバレッジを有することが示された。図１３は、標的ＣＹＰ２Ｄ６領域にアラインメントされる１２１の３８．５ｋｂのリードのＩＧＶアラインメントを示す。この手法の特異性をさらに精査するために、逆のＤＮＡ鎖（＋または－）の標的領域におけるｓｇＲＮＡ富化を実施し、配列データアラインメントを元の鎖設計でのｓｇＲＮＡ富化と比較した。図１４に示されている通り、ｓｇＲＮＡ鎖標的に応じてＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７－ＣＹＰ２Ｄ８領域（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７－図に赤色で示されている）または両側に隣接する領域（青色で示されている）のいずれかのＲＯＩにおいて１００％の配列富化が生じた。設計に応じて両側に隣接するオフターゲット領域との重複は観察されなかった。これにより、この手法の２つの極めて重要な点が実証される：（１）本発明者らの設計ＲＯＩ内で著しいオフターゲットカットは生じないこと、および（２）富化手法によりＲＯＩの著しいせん断は導かれないこと。

【0193】

本開示の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本開示から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の本開示の実施形態に対する種々の代替を本開示の実施形態の実施に使用することができることが理解されるべきである。以下の請求項により本開示の範囲が規定されること、ならびに、それにより、これらの請求項の範囲内に入る方法および構造およびそれらの均等物が包含されることが意図されている。

【図1】