IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アールピーアールディー ダイアグノスティックス, エルエルシーの特許一覧

特表2022-551202複雑なゲノム領域を解析するための方法およびシステム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-07
(54)【発明の名称】複雑なゲノム領域を解析するための方法およびシステム
(51)【国際特許分類】
   C12Q 1/6806 20180101AFI20221130BHJP
   C12N 15/10 20060101ALI20221130BHJP
   C12N 15/11 20060101ALN20221130BHJP
   C12N 9/16 20060101ALN20221130BHJP
   C12N 15/09 20060101ALN20221130BHJP
【FI】
C12Q1/6806 Z
C12N15/10 100Z
C12N15/11 Z ZNA
C12N9/16 A
C12N15/09 110
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022546595
(86)(22)【出願日】2020-10-07
(85)【翻訳文提出日】2022-06-01
(86)【国際出願番号】 US2020054567
(87)【国際公開番号】W WO2021071940
(87)【国際公開日】2021-04-15
(31)【優先権主張番号】62/911,846
(32)【優先日】2019-10-07
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522138445
【氏名又は名称】アールピーアールディー ダイアグノスティックス, エルエルシー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】シャラー, ガンター
【テーマコード(参考)】
4B050
4B063
【Fターム(参考)】
4B050CC07
4B050DD02
4B050EE10
4B050LL03
4B063QA08
4B063QA13
4B063QA17
4B063QA18
4B063QA19
4B063QQ34
4B063QQ44
4B063QR14
4B063QR32
4B063QS03
4B063QS12
4B063QS34
4B063QS36
4B063QS39
4B063QX02
(57)【要約】
複雑なゲノム領域の遺伝子型を判定する方法が本明細書において提供される。一部の場合では、方法は、目的のゲノム領域をゲノムDNAから切り出すための、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのガイドRNAの使用を伴う。方法は、目的の遺伝子領域の配列を決定するための、ロングリードシーケンシングの使用をさらに伴う。一部の場合では、方法は、増幅フリーである。複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムの必要性がまだ対処されていない。本開示は、このまだ対処されていない必要性を満たす。
【特許請求の範囲】
【請求項1】
目的のゲノム領域を解析(例えば、配列決定、遺伝子型判定、構造を解析)する方法であって、
a)前記目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、
b)前記目的のゲノム領域を含む前記ゲノムDNAを単離するステップと、
c)前記切り出された目的のゲノム領域を解析するステップと
を含み、
DNA増幅を伴わない、方法。
【請求項2】
前記解析するステップが、前記切り出された目的のゲノム領域の配列を決定することを含む、請求項1に記載の方法。
【請求項3】
前記解析するステップが、前記切り出された目的のゲノム領域の遺伝子型を判定することを含む、請求項1に記載の方法。
【請求項4】
前記解析するステップが、前記切り出された目的の領域に対する構造解析を実施することを含む、請求項1に記載の方法。
【請求項5】
前記b)の単離するステップが、前記a)の接触させるステップの前に実施される、前記請求項のいずれか一項に記載の方法。
【請求項6】
前記b)の単離するステップが、前記a)の接触させるステップの後に実施される、前記請求項のいずれか一項に記載の方法。
【請求項7】
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、前記請求項のいずれか一項に記載の方法。
【請求項8】
前記異なるヌクレオチド配列が、前記目的のゲノム領域の両側に隣接する、請求項7に記載の方法。
【請求項9】
前記CRISPR関連エンドヌクレアーゼにより、前記目的のゲノム領域が前記目的のゲノム領域の両側に隣接するゲノム部位において切断される、請求項8に記載の方法。
【請求項10】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、前記請求項のいずれか一項に記載の方法。
【請求項11】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項10に記載の方法。
【請求項12】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項10に記載の方法。
【請求項13】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、前記請求項のいずれか一項に記載の方法。
【請求項14】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、前記請求項のいずれか一項に記載の方法。
【請求項15】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項14に記載の方法。
【請求項16】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項14または15に記載の方法。
【請求項17】
前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、前記請求項のいずれか一項に記載の方法。
【請求項18】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、前記請求項のいずれか一項に記載の方法。
【請求項19】
前記目的のゲノム領域が、複雑なゲノム領域である、前記請求項のいずれか一項に記載の方法。
【請求項20】
前記複雑なゲノム領域が、遺伝子および1つまたは複数のその偽遺伝子を含む、請求項19に記載の方法。
【請求項21】
前記1つまたは複数の偽遺伝子が、前記遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む、請求項20に記載の方法。
【請求項22】
前記複雑なゲノム領域が、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項21に記載の方法。
【請求項23】
前記目的のゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。
【請求項24】
前記切り出された目的のゲノム領域の長さが、少なくとも10キロベースである、前記請求項のいずれか一項に記載の方法。
【請求項25】
前記切り出された目的のゲノム領域の長さが、最大250キロベースである、前記請求項のいずれか一項に記載の方法。
【請求項26】
前記単離するステップが、高分子量DNAを単離することを含む、前記請求項のいずれか一項に記載の方法。
【請求項27】
前記高分子量DNAの長さが、少なくとも50キロベースである、請求項26に記載の方法。
【請求項28】
前記配列を決定することが、ロングリードシーケンシングを含む、前記請求項のいずれか一項に記載の方法。
【請求項29】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項28に記載の方法。
【請求項30】
1つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、前記請求項のいずれか一項に記載の方法。
【請求項31】
a)の前に、前記ゲノムDNAを脱リン酸化するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
【請求項32】
前記脱リン酸化するステップが、前記ゲノムDNAをホスファターゼで処理することを含む、請求項31に記載の方法。
【請求項33】
前記ホスファターゼが、エビアルカリホスファターゼである、請求項32に記載の方法。
【請求項34】
前記脱リン酸化するステップの後に、前記ゲノムDNAをターミナルトランスフェラーゼ(TdT)で処理するステップをさらに含む、請求項29から33までのいずれか一項に記載の方法。
【請求項35】
前記切り出された目的のゲノム領域の末端にテールを付加するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
【請求項36】
前記末端にテールを付加するステップが、前記切り出された目的のゲノム領域の遊離の3’末端に1つまたは複数のアデノシンヌクレオチドを付加することを含む、請求項35に記載の方法。
【請求項37】
前記方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、前記請求項のいずれか一項に記載の方法。
【請求項38】
多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項37に記載の方法。
【請求項39】
前記ゲノムDNAが、生体試料として提供される、前記請求項のいずれか一項に記載の方法。
【請求項40】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料を含む、請求項39に記載の方法。
【請求項41】
前記生体試料が、診断用試料である、請求項39に記載の方法。
【請求項42】
長さが少なくとも10キロベースである目的の複雑なゲノム領域を解析する方法であって、
a)前記目的の複雑なゲノム領域を含むゲノムDNAを提供するステップと、
b)前記目的の複雑なゲノム領域を含む高分子量DNAを単離するステップと、
c)前記目的の複雑なゲノム領域を切り出すために、前記ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記目的の複雑なゲノム領域の両側に隣接する、ステップと、
d)前記目的の複雑なゲノム領域を解析するステップと
を含み、
DNA増幅を伴わない、方法。
【請求項43】
前記解析するステップが、前記目的の複雑なゲノム領域の配列を決定することを含む、請求項42に記載の方法。
【請求項44】
前記配列を決定することが、ロングリードシーケンシングを含む、請求項43に記載の方法。
【請求項45】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項44に記載の方法。
【請求項46】
前記解析するステップが、前記目的の複雑なゲノム領域の遺伝子型を判定することを含む、請求項42に記載の方法。
【請求項47】
前記解析するステップが、前記目的のゲノム領域の構造解析を実施することを含む、請求項42に記載の方法。
【請求項48】
前記b)の単離するステップが、前記c)の接触させるステップの前に実施される、請求項42から47までのいずれか一項に記載の方法。
【請求項49】
前記b)の単離するステップが、前記c)の接触させるステップの後に実施される、請求項42から47までのいずれか一項に記載の方法。
【請求項50】
前記高分子量DNAの長さが、少なくとも10キロベースである、前記請求項のいずれか一項に記載の方法。
【請求項51】
前記目的の複雑なゲノム領域が、標的遺伝子および1つまたは複数のその偽遺伝子を含む、請求項42から50までのいずれか一項に記載の方法。
【請求項52】
前記1つまたは複数の偽遺伝子が、前記標的遺伝子に対して少なくとも75%の配列同一性を有する、請求項51に記載の方法。
【請求項53】
前記目的の複雑なゲノム領域が、CYP2D6、CYP2D7、およびCYP2D8を含む、請求項42から50までのいずれか一項に記載の方法。
【請求項54】
前記目的の複雑なゲノム領域が、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む、請求項42から50までのいずれか一項に記載の方法。
【請求項55】
前記目的の複雑なゲノム領域が、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項42から50までのいずれか一項に記載の方法。
【請求項56】
前記目的の複雑なゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。
【請求項57】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項42から56までのいずれか一項に記載の方法。
【請求項58】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項57に記載の方法。
【請求項59】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項57に記載の方法。
【請求項60】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項42から59までのいずれか一項に記載の方法。
【請求項61】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項42から60までのいずれか一項に記載の方法。
【請求項62】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項61に記載の方法。
【請求項63】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項61または62に記載の方法。
【請求項64】
前記ゲノムDNAに対してa)の前に断片化も消化も行わない、請求項42から63までのいずれか一項に記載の方法。
【請求項65】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、請求項42から64までのいずれか一項に記載の方法。
【請求項66】
前記目的の複雑なゲノム領域の長さが最大250キロベースである、請求項42から65までのいずれか一項に記載の方法。
【請求項67】
1つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項42から66までのいずれか一項に記載の方法。
【請求項68】
ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項42から67までのいずれか一項に記載の方法。
【請求項69】
多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項68に記載の方法。
【請求項70】
前記ゲノムDNAが、生体試料中で提供される、請求項42から69までのいずれか一項に記載の方法。
【請求項71】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である、請求項70に記載の方法。
【請求項72】
前記生体試料が、診断用試料である、請求項70または71に記載の方法。
【請求項73】
CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を解析する方法であって、
a)前記遺伝子座を含むゲノムDNAを提供するステップと、
b)前記遺伝子座を前記ゲノムDNAから切り出すために、前記ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する、ステップと、
c)前記遺伝子座を解析するステップと
を含む方法。
【請求項74】
前記解析するステップが、前記遺伝子座の配列を決定することを含む、請求項73に記載の方法。
【請求項75】
前記配列を決定することが、ロングリードシーケンシングを含む、請求項74に記載の方法。
【請求項76】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項75に記載の方法。
【請求項77】
前記解析するステップが、前記遺伝子座の遺伝子型を判定することを含む、請求項73に記載の方法。
【請求項78】
前記解析するステップが、前記遺伝子座の構造解析を実施することを含む、請求項73に記載の方法。
【請求項79】
前記方法が、c)の前に、前記遺伝子座を含む高分子量DNAを単離するステップをさらに含む、請求項73から78までのいずれか一項に記載の方法。
【請求項80】
前記高分子量DNAの長さが、少なくとも10キロベースである、請求項79に記載の方法。
【請求項81】
前記2つまたはそれよりも多くのgRNAが、配列番号1~26からなる群から選択されるヌクレオチド配列を含む、請求項73から80までのいずれか一項に記載の方法。
【請求項82】
前記遺伝子座の長さが、少なくとも40キロベースである、請求項73から81までのいずれか一項に記載の方法。
【請求項83】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項73から82までのいずれか一項に記載の方法。
【請求項84】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項83に記載の方法。
【請求項85】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項83に記載の方法。
【請求項86】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項73から85までのいずれか一項に記載の方法。
【請求項87】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項73から86までのいずれか一項に記載の方法。
【請求項88】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項87に記載の方法。
【請求項89】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項87または88に記載の方法。
【請求項90】
前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、請求項73から89までのいずれか一項に記載の方法。
【請求項91】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、請求項73から90までのいずれか一項に記載の方法。
【請求項92】
前記切り出された遺伝子座の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む、請求項73から91までのいずれか一項に記載の方法。
【請求項93】
DNA増幅を伴わない、請求項73から92までのいずれか一項に記載の方法。
【請求項94】
ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項93に記載の方法。
【請求項95】
多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項94に記載の方法。
【請求項96】
前記ゲノムDNAが、生体試料として提供される、請求項73から95までのいずれか一項に記載の方法。
【請求項97】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である、請求項96に記載の方法。
【請求項98】
前記生体試料が、診断用試料である、請求項96または97に記載の方法。
【請求項99】
対象におけるCYP2D6の遺伝子変異を同定する方法であって、
a)前記対象から得たゲノムDNAを含む生体試料を提供するステップと、
b)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、前記ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、
c)前記遺伝子座のロングリードシーケンシングを実施するステップと、
d)前記対象のCYP2D6の1つまたは複数の遺伝子変異を同定するステップと
を含む方法。
【請求項100】
前記遺伝子変異に基づいて、前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定するステップをさらに含む、請求項99に記載の方法。
【請求項101】
前記同定するステップに基づいて、前記対象に対して処置または代替処置を推奨するステップをさらに含む、請求項100に記載の方法。
【請求項102】
前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合に、前記対象に対して代替処置を推奨する、請求項100に記載の方法。
【請求項103】
前記同定するステップに基づいて、前記対象に対して治療薬のある投薬量を推奨するステップをさらに含む、請求項100に記載の方法。
【請求項104】
前記対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合に、治療薬の投薬量を変更する、請求項100に記載の方法。
【請求項105】
c)の前に、前記遺伝子座を含む高分子量DNAを単離するステップをさらに含む、請求項99から104までのいずれか一項に記載の方法。
【請求項106】
前記高分子量DNAの長さが、少なくとも40キロベースである、請求項105に記載の方法。
【請求項107】
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する、請求項99から106までのいずれか一項に記載の方法。
【請求項108】
前記2つまたはそれよりも多くのgRNAが、配列番号1~26からなる群から選択されるヌクレオチド配列を含む、請求項99から107までのいずれか一項に記載の方法。
【請求項109】
前記遺伝子座の長さが、少なくとも40キロベースである、請求項99から108までのいずれか一項に記載の方法。
【請求項110】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項99から109までのいずれか一項に記載の方法。
【請求項111】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項99から110までのいずれか一項に記載の方法。
【請求項112】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項111に記載の方法。
【請求項113】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項111に記載の方法。
【請求項114】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項99から113までのいずれか一項に記載の方法。
【請求項115】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項99から114までのいずれか一項に記載の方法。
【請求項116】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項115に記載の方法。
【請求項117】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項115または116に記載の方法。
【請求項118】
前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、請求項99から117までのいずれか一項に記載の方法。
【請求項119】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、請求項99から118までのいずれか一項に記載の方法。
【請求項120】
1つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項99から119までのいずれか一項に記載の方法。
【請求項121】
DNA増幅を伴わない、請求項99から120までのいずれか一項に記載の方法。
【請求項122】
ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項121に記載の方法。
【請求項123】
多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項121に記載の方法。
【請求項124】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である、請求項99から123までのいずれか一項に記載の方法。
【請求項125】
a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;
b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに
c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)
を含む組成物。
【請求項126】
前記第1のガイドRNAが、配列番号1、2、または13~16からなる群から選択されるヌクレオチド配列を含む、請求項125に記載の組成物。
【請求項127】
前記第2のガイドRNAが、配列番号3~12または17~26からなる群から選択されるヌクレオチド配列を含む、請求項125または126に記載の組成物。
【請求項128】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項125から127までのいずれか一項に記載の組成物。
【請求項129】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項128に記載の組成物。
【請求項130】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項128に記載の組成物。
【請求項131】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項125から130までのいずれか一項に記載の組成物。
【請求項132】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項125から131までのいずれか一項に記載の組成物。
【請求項133】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項132に記載の組成物。
【請求項134】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項132または133に記載の組成物。
【請求項135】
CYP2D6の遺伝子型を判定するためのキットであって、
a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;
b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに
c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)
を含むキット。
【請求項136】
前記第1のガイドRNAが、配列番号1、2、または13~16からなる群から選択されるヌクレオチド配列を含む、請求項135に記載のキット。
【請求項137】
前記第2のガイドRNAが、配列番号3~12または17~26からなる群から選択されるヌクレオチド配列を含む、請求項135または136に記載のキット。
【請求項138】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項135から137までのいずれか一項に記載のキット。
【請求項139】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項139に記載のキット。
【請求項140】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項139に記載のキット。
【請求項141】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項135から140までのいずれか一項に記載のキット。
【請求項142】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項135から141までのいずれか一項に記載のキット。
【請求項143】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項142に記載のキット。
【請求項144】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項142または143に記載のキット。
【請求項145】
目的の複雑なゲノム領域を解析するためのシステムであって、
(a)
(i)前記目的の複雑なゲノム領域を含むゲノムDNAから高分子量DNAを単離するステップと、
(ii)前記目的の複雑なゲノム領域を切り出すために、前記ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記目的の複雑なゲノム領域の両側に隣接する、ステップと、
(iii)前記目的の複雑なゲノム領域を解析して前記データを生成するステップと
を含み、
DNA増幅を伴わない、方法
により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;および
(b)前記少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含む、システム。
【請求項146】
前記出力が、レポートである、請求項145に記載のシステム。
【請求項147】
前記出力が、前記目的の複雑なゲノム領域の遺伝子型である、請求項145または146に記載のシステム。
【請求項148】
前記出力が、前記目的の複雑なゲノム領域の遺伝子配列である、請求項145または146に記載のシステム。
【請求項149】
前記出力が、前記目的の複雑なゲノム領域の構造解析である、請求項145または146に記載のシステム。
【請求項150】
前記解析するステップが、前記目的の複雑なゲノム領域の遺伝子型を判定することを含む、請求項145から149までのいずれか一項に記載のシステム。
【請求項151】
前記解析するステップが、前記目的の複雑なゲノム領域の構造解析を実施することを含む、請求項145から149までのいずれか一項に記載のシステム。
【請求項152】
前記解析するステップが、前記目的の複雑なゲノム領域の配列を決定することを含む、請求項145から149までのいずれか一項に記載のシステム。
【請求項153】
前記配列を決定することが、ロングリードシーケンシングを含む、請求項152に記載のシステム。
【請求項154】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項153に記載のシステム。
【請求項155】
前記(i)の単離するステップが、前記(ii)の接触させるステップの前に実施される、請求項145から154までのいずれか一項に記載のシステム。
【請求項156】
前記(i)の単離するステップが、前記(ii)の接触させるステップの後に実施される、請求項145から154までのいずれか一項に記載のシステム。
【請求項157】
前記高分子量DNAの長さが、少なくとも10キロベースである、請求項145から156までのいずれか一項に記載のシステム。
【請求項158】
前記目的の複雑なゲノム領域が、標的遺伝子および1つまたは複数のその偽遺伝子を含む、請求項145から157までのいずれか一項に記載のシステム。
【請求項159】
前記1つまたは複数の偽遺伝子が、前記標的遺伝子に対して少なくとも75%の配列同一性を有する、請求項158に記載のシステム。
【請求項160】
前記目的の複雑なゲノム領域が、CYP2D6、CYP2D7、およびCYP2D8を含む、請求項145から159までのいずれか一項に記載のシステム。
【請求項161】
前記目的の複雑なゲノム領域が、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む、請求項145から160までのいずれか一項に記載のシステム。
【請求項162】
前記目的の複雑なゲノム領域が、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項145から161までのいずれか一項に記載のシステム。
【請求項163】
前記目的の複雑なゲノム領域が、高度に多型の遺伝子座である、請求項145から162までのいずれか一項に記載のシステム。
【請求項164】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項145から163までのいずれか一項に記載のシステム。
【請求項165】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項164に記載のシステム。
【請求項166】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項164に記載のシステム。
【請求項167】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項145から166までのいずれか一項に記載のシステム。
【請求項168】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項145から167までのいずれか一項に記載のシステム。
【請求項169】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項168に記載のシステム。
【請求項170】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項168または169に記載のシステム。
【請求項171】
前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、請求項145から170までのいずれか一項に記載のシステム。
【請求項172】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、請求項145から171までのいずれか一項に記載のシステム。
【請求項173】
前記目的の複雑なゲノム領域の長さが、最大250キロベースである、請求項145から172までのいずれか一項に記載のシステム。
【請求項174】
1つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項145から173までのいずれか一項に記載のシステム。
【請求項175】
前記方法が、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項145から174までのいずれか一項に記載のシステム。
【請求項176】
前記方法が、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項175に記載のシステム。
【請求項177】
前記ゲノムDNAが、生体試料として提供される、請求項145から176までのいずれか一項に記載のシステム。
【請求項178】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料を含む、請求項177に記載のシステム。
【請求項179】
前記生体試料が、診断用試料である、請求項177または178に記載のシステム。
【請求項180】
対象のCYP2D6の遺伝子変異を同定するためのシステムであって、
(a)
(ii)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、前記対象から得たゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、
(iii)前記遺伝子座のロングリードシーケンシングを実施して前記配列決定データを生成するステップと
を含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;および
(b)前記少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含むシステム。
【請求項181】
前記出力が、レポートである、請求項180に記載のシステム。
【請求項182】
前記出力が、CYP2D6の遺伝子変異を同定するものである、請求項180または181に記載のシステム。
【請求項183】
前記出力が、CYP2D6の機能の低下、喪失、または増大を同定するものである、請求項180から182までのいずれか一項に記載のシステム。
【請求項184】
前記レポートが、前記遺伝子変異に基づいて前記対象に対して処置を推奨するものである、請求項181から183までのいずれか一項に記載のシステム。
【請求項185】
前記レポートが、前記遺伝子変異に基づいて前記対象に対して治療薬のある投薬量を推奨するものである、請求項181から183までのいずれか一項に記載のシステム。
【請求項186】
前記レポートが、前記遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである、請求項191から183までのいずれか一項に記載のシステム。
【請求項187】
前記治療薬が、CYP2D6によって活性化または代謝される治療薬である、請求項185または186に記載のシステム。
【請求項188】
前記方法が、(ii)の前に、前記遺伝子座を含む高分子量DNAを単離するステップをさらに含む、請求項180から187までのいずれか一項に記載のシステム。
【請求項189】
前記高分子量DNAの長さが、少なくとも40キロベースである、請求項188に記載のシステム。
【請求項190】
前記2つまたはそれよりも多くのgRNAが、それぞれ、前記ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記異なるヌクレオチド配列が、前記CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する、請求項180から189までのいずれか一項に記載のシステム。
【請求項191】
前記2つまたはそれよりも多くのgRNAが、配列番号1~26からなる群から選択されるヌクレオチド配列を含む、請求項180から190までのいずれか一項に記載のシステム。
【請求項192】
前記遺伝子座の長さが、少なくとも40キロベースである、請求項180から191までのいずれか一項に記載のシステム。
【請求項193】
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項180から192までのいずれか一項に記載のシステム。
【請求項194】
前記CRISPR関連エンドヌクレアーゼが、クラス1またはクラス2 CRISPR関連エンドヌクレアーゼである、請求項180から192までのいずれか一項に記載のシステム。
【請求項195】
前記クラス1 CRISPR関連エンドヌクレアーゼが、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される、請求項194に記載のシステム。
【請求項196】
前記クラス2 CRISPR関連エンドヌクレアーゼが、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される、請求項194に記載のシステム。
【請求項197】
前記CRISPR関連エンドヌクレアーゼが、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項180から196までのいずれか一項に記載のシステム。
【請求項198】
前記CRISPR関連エンドヌクレアーゼが、Cas9またはその変異体である、請求項180から197までのいずれか一項に記載のシステム。
【請求項199】
前記Cas9が、Streptococcus pyogenes Cas9(spCas9)である、請求項198に記載のシステム。
【請求項200】
前記Cas9変異体が、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む、請求項198または199に記載のシステム。
【請求項201】
前記ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない、請求項180から200までのいずれか一項に記載のシステム。
【請求項202】
前記ゲノムDNAをa)の前に制限酵素消化に供さない、請求項180から201までのいずれか一項に記載のシステム。
【請求項203】
1つまたは複数の配列決定用アダプターを前記切り出された目的のゲノム領域の一方の末端または両方の末端にライゲーションするステップをさらに含む、請求項180から202までのいずれか一項に記載のシステム。
【請求項204】
前記方法が、DNA増幅を伴わない、請求項180から203までのいずれか一項に記載のシステム。
【請求項205】
前記方法が、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない、請求項204に記載のシステム。
【請求項206】
前記方法が、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項204に記載のシステム。
【請求項207】
前記生体試料が、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である、請求項180から206までのいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、その全体が参照により本明細書に組み込まれる2019年10月7日出願の米国仮出願第62/911,846号の利益を主張するものである。
【背景技術】
【0002】
背景
遺伝子変異は薬物に対する応答に影響を及ぼす可能性があるので、薬理遺伝学(PGx)は個別化された薬物応答の決定を可能にする精密医療の構成要素である。PGxの利益としては、費用および薬物有害反応(SADR)のリスクの低減、ならびに薬効の改善が挙げられる。現在多数のPGx遺伝子が試験されているが、シトクロムP450 2D6(CYP2D6)の診断的価値が極めて大きく、これは、全薬物の25%に至るまでがCYP2D6によって活性化または代謝されるからである。これらの薬物としては、がん薬、オピオイドアゴニスト、ならびに、いくつかの抗うつ薬および抗不安薬物が挙げられる。CYP2D6酵素はCYP2D6遺伝子によってコードされ、遺伝子変異により酵素機能の低下または完全な喪失が引き起こされる可能性がある。CYP2D6は肝臓において主に発現され、肝臓での薬物代謝およびクリアランスの主要な一因である。CYP2D6の遺伝子変異を正しく診断することに伴う問題はSADRが発生するリスクに直接影響を及ぼし得る。NIH Clinical Pharmacogenetics Implementation Consortium(CPIC)は現在、CYP2D6の臨床試験を支持する58種の薬物に関連するエビデンスをリストアップしており、それにより、CYP2D6は上位遺伝子のうちの1つになっている。米国だけでCYP2D6に関する試験は2019年には$522Mの市場であり、年間の成長率は6~8%であると推定される。
【0003】
現時点で、CYP2D6に関して、高頻度のコピー数変異を含め、100を超える薬理遺伝学的な関連性のある変更(*スター対立遺伝子ハプロタイプとも称される)が記載されている。さらに、近接する高度に相同な(94%に至るまで同一である)偽遺伝子(CYP2D7およびCYP2D8)との遺伝子融合物およびハイブリッドにより変異体コーリングが複雑になる。米国では、人の約13%がCYP2D6構造変異体を有し、これらの変異体は、当該遺伝子に関連する全ての変異のうちの7%を表す。これらの特色により、現行の試験プラットフォームを用いた遺伝子解析が複雑になり、希少なまたは複雑なハプロタイプの多くが正確に解析されない。多くのグループによる研究により、現在使用されている市販の遺伝子型判定プラットフォームでは、CYP2D6の誤った特徴付けが生じやすいことが実証されている。これにより、間違った割り当てが導かれ、その結果、間違った投薬が推奨される。遺伝子の配列決定も、ショートリードに基づく場合(NGS)または鋳型の長さに基づく場合(サンガーシーケンシング)に同様に妨害される。構造全体をより精密に決定するために標的化増幅、コピー数解析、および長距離PCRを組み合わせる多数の方法が開発されているが、これらの方法は、複雑なワークフロー、時間要件、および全体的な費用に起因して、常套的な臨床試験には適さない。
【発明の概要】
【課題を解決するための手段】
【0004】
概要
複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムの必要性がまだ対処されていない。本開示は、このまだ対処されていない必要性を満たす。
【0005】
一態様では、目的のゲノム領域を解析する方法であって、(a)目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、(b)目的のゲノム領域を含むゲノムDNAを単離するステップと、(c)切り出された目的のゲノム領域を解析するステップとを含み、DNA増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、切り出された目的のゲノム領域の配列を決定することを含む。一部の場合では、解析するステップは、切り出された目的のゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、切り出された目的の領域に対する構造解析を実施することを含む。一部の場合では、(b)の単離するステップは(a)の接触させるステップの前に実施される。一部の場合では、(b)の単離するステップは(a)の接触させるステップの後に実施される。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、異なるヌクレオチド配列は目的のゲノム領域の両側に隣接する。一部の場合では、CRISPR関連エンドヌクレアーゼにより、目的のゲノム領域が、目的のゲノム領域の両側に隣接するゲノム部位において切断される。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、遺伝子に対して少なくとも75%の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、切り出された目的のゲノム領域の長さは少なくとも10キロベースである。一部の場合では、切り出された目的のゲノム領域の長さは最大250キロベースである。一部の場合では、単離するステップは、高分子量DNAを単離することを含む。一部の場合では、高分子量DNAの長さは少なくとも50キロベースである。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、a)の前に、ゲノムDNAを脱リン酸化するステップをさらに含む。一部の場合では、脱リン酸化するステップは、ゲノムDNAをホスファターゼで処理することを含む。一部の場合では、ホスファターゼはエビアルカリホスファターゼである。一部の場合では、方法は、脱リン酸化するステップの後に、ゲノムDNAをターミナルトランスフェラーゼ(TdT)で処理することをさらに含む。一部の場合では、方法は、切り出された目的のゲノム領域の末端にテールを付加するステップをさらに含む。一部の場合では、末端にテールを付加するステップは、切り出された目的のゲノム領域の遊離の3’末端に1つまたは複数のアデノシンヌクレオチドを付加することを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料中で提供される。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料を含む。一部の場合では、生体試料は診断用試料である。
【0006】
別の態様では、長さが少なくとも10キロベースである目的の複雑なゲノム領域を解析する方法であって、(a)目的の複雑なゲノム領域を含むゲノムDNAを提供するステップと、(b)目的の複雑なゲノム領域を含む高分子量DNAを単離するステップと、(c)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、(d)目的の複雑なゲノム領域を解析するステップとを含み、DNA増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、(b)の単離するステップは(c)の接触させるステップの前に実施される。一部の場合では、(b)の単離するステップは(c)の接触させるステップの後に実施される。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも75%の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む。一部の場合では、目的の複雑なゲノム領域は、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、目的の複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して、a)の前に断片化も消化も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大250キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料中で提供される。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である。一部の場合では、生体試料は診断用試料である。
【0007】
別の態様では、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を解析する方法であって、(a)当該遺伝子座を含むゲノムDNAを提供するステップと、(b)当該遺伝子座をゲノムDNAから切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する、ステップと、(c)当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、解析するステップは、当該遺伝子座の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、当該遺伝子座の遺伝子型を判定することを含む。一部の場合では、解析するステップは、当該遺伝子座の構造解析を実施することを含む。一部の場合では、方法は、c)の前に、当該遺伝子座を含む高分子量DNAを単離することをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~26からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された遺伝子座の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法(ramification amplification method)のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料中で提供される。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である。一部の場合では、生体試料は診断用試料である。
【0008】
さらに別の態様では、対象におけるCYP2D6の遺伝子変異を同定する方法であって、(a)対象から得たゲノムDNAを含む生体試料を提供するステップと、(b)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、(c)当該遺伝子座のロングリードシーケンシングを実施するステップと、(d)対象のCYP2D6の1つまたは複数の遺伝子変異を同定するステップとを含む方法が提供される。一部の場合では、方法は、遺伝子変異に基づいて、対象がCYP2D6機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、方法は、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がCYP2D6機能の低下、喪失、または増大を有すると同定された場合、方法は、治療薬の投薬量を変更するステップをさらに含む。一部の場合では、方法は、c)の前に、当該遺伝子座を含む高分子量DNAを単離することをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも40キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~26からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である。
【0009】
さらに別の態様では、(a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;(b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに(c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含む組成物が提供される。一部の場合では、第1のガイドRNAは、配列番号1、2、または13~16からなる群から選択されるヌクレオチド配列を含む。一部の場合では、第2のガイドRNAは、配列番号3~12または17~26からなる群から選択されるヌクレオチド配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。
【0010】
さらに別の態様では、CYP2D6の遺伝子型を判定するためのキットであって、(a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;(b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびに(c)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含むキットが提供される。一部の場合では、第1のガイドRNAは、配列番号1、2、または13~16からなる群から選択されるヌクレオチド配列を含む。一部の場合では、第2のガイドRNAは、配列番号3~12または17~26からなる群から選択されるヌクレオチド配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。
【0011】
さらに別の態様では、目的の複雑なゲノム領域を解析するためのシステムであって、(a)(i)目的の複雑なゲノム領域を含むゲノムDNAから高分子量DNAを単離するステップと、(ii)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、(iii)目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、DNA増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能に(operably)カップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子型である。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子配列である。一部の場合では、出力は、目的の複雑なゲノム領域の構造解析である。一部の場合では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。一部の場合では、配列を決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、(i)の単離するステップを(ii)の接触させるステップの前に実施する。一部の場合では、(i)の単離するステップを(ii)の接触させるステップの後に実施する。一部の場合では、高分子量DNAの長さは少なくとも10キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および1つまたは複数のその偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも75%の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、CYP2D6、CYP2D7、およびCYP2D8を含む。一部の場合では、目的の複雑なゲノム領域は、CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、目的の複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対してa)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAをa)の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大250キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、ゲノムDNAは、生体試料中で提供される。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料を含む。一部の場合では、生体試料は診断用試料である。
【0012】
さらに別の態様では、対象のCYP2D6の遺伝子変異を同定するためのシステムであって、(a)(ii)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、対象から得たゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、(iii)当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、CYP2D6の遺伝子変異を同定するものである。一部の場合では、出力は、CYP2D6の機能の低下、喪失、または増大を同定するものである。一部の場合では、レポートは、遺伝子変異に基づいて、対象に対して処置を推奨するものである。一部の場合では、レポートは、遺伝子変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。一部の場合では、レポートは、遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、CYP2D6によって活性化または代謝される治療薬である。一部の場合では、方法は、(ii)の前に、当該遺伝子座を含む高分子量DNAを単離するステップをさらに含む。一部の場合では、高分子量DNAの長さは少なくとも40キロベースである。一部の場合では、2つまたはそれよりも多くのgRNAは、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する。一部の場合では、2つまたはそれよりも多くのgRNAは配列番号1~26からなる群から選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも40キロベースである。一部の場合では、ロングリードシーケンシングは単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、CRISPR関連エンドヌクレアーゼはクラス1またはクラス2 CRISPR関連エンドヌクレアーゼである。一部の場合では、クラス1 CRISPR関連エンドヌクレアーゼは、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1からなる群から選択される。一部の場合では、クラス2 CRISPR関連エンドヌクレアーゼは、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dからなる群から選択される。一部の場合では、CRISPR関連エンドヌクレアーゼは、野生型CRISPR関連エンドヌクレアーゼに対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。一部の場合では、CRISPR関連エンドヌクレアーゼは、Cas9またはその変異体である。一部の場合では、Cas9は、Streptococcus pyogenes Cas9(spCas9)である。一部の場合では、Cas9変異体は、野生型Streptococcus pyogenes Cas9(spCas9)と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される1つまたは複数の点突然変異を含む。一部の場合では、ゲノムDNAに対して(a)の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムDNAを(a)の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に1つまたは複数の配列決定用アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、DNA増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応(PCR)または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅(MDA)、鎖置換増幅(SDA)、核酸配列に基づく増幅(NASBA)、ループ媒介性等温増幅、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない。一部の場合では、生体試料は、体液(例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳)または固形組織試料である。
参照による組込み
【0013】
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個別に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。
【0014】
本開示の新規の特色は、添付の特許請求の範囲において詳細に記載されている。本開示の原理が利用される例示的な実施形態が記載されている以下の詳細な説明および付属図を参照することにより、本開示の特色および利点のよりよい理解が得られよう。
【図面の簡単な説明】
【0015】
図1図1は、本明細書に提示される実施形態によるCYP2D6遺伝子座を示す。パネルAは、CYP2D6遺伝子の単一コピーを含有する参照遺伝子座のCYP2D7およびCYP2D8に対する位置付けを示す。完全なCYP2D6欠失(パネルB)、重複(パネルC)、および5’(パネルD)または3’(パネルE)のいずれかのCYPD6/CYPD7ハイブリッド対立遺伝子の存在を含めたCYP2D6遺伝子コピー数変異の複雑さを例示する構造変異体の代表的な例。そのような配置での重複した遺伝子は、多くの場合、1.6kbの長いスペーサー配列を含むCYP2D7様下流領域を有する。5’-3’の方向付けは参照配列に対して示されている(NG_008376.3)。
【0016】
図2図2は、本明細書に提示される実施形態によるCYP2D6遺伝子座を単離し、配列を決定する方法を示すフローチャートの非限定的な例を示す。
【0017】
図3図3は、本明細書に提示される実施形態によるゲノムDNA抽出の比較の非限定的な例を示す。レーンAは改変された高分子量プロトコールを用いてリンパ芽球様細胞株(LCL)細胞から抽出されたgDNA 50ng(>50kb)であり、レーンBはMaxwell Rapid Sample Concentrator(RSC)を用いて抽出されたgDNA 50ng(約10~48kb)であり、レーンCはgDNA対照50ng(Coriell;約10kb~50kb)であり、レーンDはラムダファージDNA(約50kDa;NEB)であり、レーンEはHINDIIIラムダファージ消化物である。
【0018】
図4図4Aおよび図4Bは、本明細書に提示される実施形態によるCYP2D6遺伝子座を標的とするsgRNA設計および検証の非限定的な例を示す。図4Aは、対立遺伝子CYP2D6およびハイブリッド対立遺伝子を捕捉するために必要なCRISPRカット部位の概略図を示す。図4Bは、標的部位のCRISPR Cut XL-PCRアンプリコンを示す。試料AにはsgRNAを伴わないCas9を加え、試料BにはsgRNA_1を伴うCas9を加え、試料CにはsgRNA_2を伴うCas9を加えた。
【0019】
図5図5Aおよび図5Bは、本開示の実施形態によるゲノムDNA上のCYP2D6遺伝子座を標的とするsgRNAの効率の非限定的な例を示す。図5Aは、CYP2D6の上流および下流の領域のsgRNA結合部位を含有するXL-PCR産物のゲル画像を示す。レーンCは対照である。図5Bは、陰性対照に対して正規化した、未カットgDNAのパーセンテージを示す。*=P値<0.010。
【0020】
図6図6は、本開示の実施形態によるXL-PCRおよびNGSに基づく解析手法のNGSアラインメントの非限定的な例を示す。
【0021】
図7A図7A~7Cは、本開示の実施形態によるCYP2D6遺伝子座の代替のCRISPR/Cas9設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Xは、A対立遺伝子に示されている設計によりB~E対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。
図7B図7A~7Cは、本開示の実施形態によるCYP2D6遺伝子座の代替のCRISPR/Cas9設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Xは、A対立遺伝子に示されている設計によりB~E対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。
図7C図7A~7Cは、本開示の実施形態によるCYP2D6遺伝子座の代替のCRISPR/Cas9設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Xは、A対立遺伝子に示されている設計によりB~E対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。
【0022】
図8図8は、CYP2D6遺伝子座の包括的な標的設計の非限定的な例を示す。カット部位がはさみで示されている。チェックマークは、A対立遺伝子に示されている設計により、B~E対立遺伝子配置でオンターゲットのカットのみが生じる対立遺伝子を表す。
【0023】
図9A図9A~9Cは、CYP2D6遺伝子座を標的とするsgRNAの設計および検証の非限定的な例を示す。図9Aは、対立遺伝子CYP2D6およびハイブリッド対立遺伝子を捕捉するための標的に対する必要なカット部位の概略図を示す。図9Bおよび図9Cは、標的部位のCRISPR Cut XL-PCRアンプリコンを示す。試料AにはsgRNAを伴わないCas9を加え、試料BにはsgRNA_1を伴うCas9を加え、試料CにはsgRNA_2を伴うCas9を加えた。
図9B-C】図9A~9Cは、CYP2D6遺伝子座を標的とするsgRNAの設計および検証の非限定的な例を示す。図9Aは、対立遺伝子CYP2D6およびハイブリッド対立遺伝子を捕捉するための標的に対する必要なカット部位の概略図を示す。図9Bおよび図9Cは、標的部位のCRISPR Cut XL-PCRアンプリコンを示す。試料AにはsgRNAを伴わないCas9を加え、試料BにはsgRNA_1を伴うCas9を加え、試料CにはsgRNA_2を伴うCas9を加えた。
【0024】
図10図10は、本開示の実施形態による単離された高分子量DNAの非限定的な例を示す。ラムダ対照およびCoriell Instituteからの予め抽出されたDNAと比較した、LCL細胞ペレットから抽出された高分子量ゲノムDNA 100ngの2%DNAアガロースゲル。
【0025】
図11A図11Aおよび図11Bは、本明細書に開示される実施形態による配列決定実行カバレッジの非限定的な例を示す。
図11B図11Aおよび図11Bは、本明細書に開示される実施形態による配列決定実行カバレッジの非限定的な例を示す。
【0026】
図12A図12Aおよび図12Bは、本明細書に開示される実施形態による配列アラインメントサイズの非限定的な例を示す。
図12B図12Aおよび図12Bは、本明細書に開示される実施形態による配列アラインメントサイズの非限定的な例を示す。
【0027】
図13図13は、本明細書に開示される実施形態によるアラインメントプロットの非限定的な例を示す。121×カバレッジの標的化される捕捉領域が実現された。囲み枠はCYP2D6およびCYP2D7の概略である。
【0028】
図14図14は、本明細書に開示される実施形態によるsgRNA特異性を示すSashimiプロットの非限定的な例を示す。このプロットは、2つの配列決定実行についてアラインメントされた領域を示す。赤色のアラインメントは、目的の領域(ROI)(chr22:42,122,115-41,161,320)が捕捉されるように設計されたsgRNAを使用した実行からの配列データを示す。青色のアラインメントは、同じDNA試料に対して、逆の鎖を標的とするsgRNAを使用して実施した富化を示す。
【0029】
図15図15は、本明細書に提示される実施形態に従ったコンピュータシステムの非限定的な例を示す。
【発明を実施するための形態】
【0030】
詳細な説明
目的のゲノム領域(ROI)(例えば、ゲノムDNA由来)を解析するための方法が本明細書に開示される。目的の領域は、例えば、複雑な(例えば、高度に複雑な)ゲノム領域であり得る。複雑なゲノム領域は、例えば、高度に多型的な領域、標的遺伝子および標的遺伝子に対して高い配列相同性を有する1つまたは複数の偽遺伝子を含む領域、1つまたは複数の反復エレメント、1つまたは複数の逆位、1つまたは複数の挿入、1つまたは複数の重複、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾンを含む領域などを含み得る。本明細書に提示される方法は、一般に、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのガイドRNA(gRNA)を使用して目的の領域をゲノムDNAから切り出すことを伴う。本明細書に提示される方法は、切り出された目的の領域を解析すること(例えば、例えばロングリードシーケンシング法によって配列を決定すること、遺伝子型を判定すること、構造解析を実施すること)をさらに伴う。CYP2D6遺伝子座(例えば、標的遺伝子であるCYP2D6、ならびに偽遺伝子であるCYP2D7およびCYP2D8を含む)を解析する方法が本明細書にさらに提示される。有利に、一部の実施形態では、方法は、DNA増幅の使用を伴わない(例えば、増幅フリー)。方法により、複雑な(例えば、高度に複雑な)ゲノム領域の配列決定の正確度を改善する(例えば、配列決定の誤り率を低下させる)ことができ(例えば、伝統的な方法と比較して)、かつ/または、複雑な(例えば、高度に複雑な)ゲノム領域の配列決定のための時間を短縮することができ(例えば、伝統的な方法と比較して)、かつ/または、複雑なゲノム(例えば、高度に複雑な)領域(例えば、伝統的な方法と比較して)の配列決定の費用を低減することができる。さらに、本明細書に提示される方法を実施するためのシステム、ならびに、CRISPR関連エンドヌクレアーゼおよびCYP2D6遺伝子座を標的とする2つまたはそれよりも多くのgRNA(例えば、CYP2D6遺伝子座をゲノムDNAから切り出すため)を含む組成物およびキットが本明細書に提示される。
【0031】
本明細書および添付の特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数の使用説明書対象を包含する。特許請求の範囲はいかなる必要に応じた要素も排除されるように起草され得ることにも留意する。したがって、この記述は、特許請求の範囲の要素の列挙に関連して、例えば「単に(solely)」、「のみ(only)」などの排他的な用語の使用、または、「否定的な」限定の使用の前提としての機能を果たすものとする。
【0032】
ある特定の範囲または数は、本明細書では、「約」という用語が先行する数値で提示される。「約」という用語は、本明細書では、この用語が指す数のプラスまたはマイナス1%、2%、3%、4%、または5%を意味するように使用される。本明細書で使用される場合、「対象」および「個体」という用語は互換的に使用され、哺乳動物(例えば、ヒトまたは非ヒト動物)を含めた任意の動物であり得る。
【0033】
本明細書で使用される場合、「CYP2D6」という用語は、CYP2D6遺伝子または任意のその構造変異体または単一遺伝子コピー変異体を指し得る。CYP2D6の構造変異体は、遺伝子融合物、近接する高度に相同な偽遺伝子(例えば、CYP2D7およびCYP2D8)とのハイブリッド、コピー数変異(CNV)、遺伝子重複および増倍、タンデムリピート、および再構成を含み得る。CYP2D6構造変異体の1つの例は、CYP2D6のエクソン9にCYP2D7由来配列が存在することである(「エクソン9変換」と称される)。単一遺伝子コピー変異体は、一塩基多型(SNP)またはヌクレオチドの挿入もしくは欠失(インデル)を含み得る。CYP2D6の対立遺伝子は、以下から選択される構造変異体または単一遺伝子コピー変異体であり得る:*1、*xN、*2、*2xN、*2A、*2AxN、*35、*35xN、*9、*9xN、*10、*10xN、*17、*17xN、*29、*29xN、*36-*10、*36-*10xN、*36xN-*10、*36xN-*10xN、*41、*41xN、*3、*3xN、*4、*4xN、*4N、*5、*6、*6xN、*36、および*36xN。一部の場合では、CYP2D6の各対立遺伝子は、異なる構造変異体または単一遺伝子コピー変異体である。一部の場合では、CYP2D6の各対立遺伝子は同一である。
【0034】
「CYP2D6遺伝子座」という用語は、本明細書で使用される場合、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含むゲノム領域を指す。ヒトでは、CYP2D6遺伝子座は22番染色体上に見いだされる。一部の実施形態では、本明細書に提示される方法は、CYP2D6遺伝子座(例えば、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含む)の一部分または全体を解析すること(例えば、配列を決定すること、遺伝子型を判定すること、構造解析を実施すること)を伴う。一部の実施形態では、本明細書に提示される方法は、CYP2D6遺伝子座(例えば、CYP2D6遺伝子、ならびに高度に相同な偽遺伝子であるCYP2D7およびCYP2D8を含む)の一部分または全体をゲノムDNAから切り出すこと(例えば、CRISPR関連エンドヌクレアーゼおよびCYP2D6遺伝子座の両側に隣接するゲノム配列を標的とする2つまたはそれよりも多くのgRNAを使用することによって)を伴う。
【0035】
本明細書で使用される場合、「CRISPR/Casヌクレアーゼ系」という用語は、ガイドRNA(gRNA)とCRISPR関連エンドヌクレアーゼ(Casタンパク質)とで構成される複合体を指す。「CRISPR」という用語は、クラスター化された規則的な配置の短い回文配列リピートおよびその関連する系を指し得る。CRISPR/Casヌクレアーゼ系は、クラス1またはクラス2 CRISPR/Casヌクレアーゼ系であり得る。CRISPR/Casヌクレアーゼ系は、I型、II型、III型、IV型、V型、またはVI型CRISPR/Casヌクレアーゼ系であり得る。gRNAは、Casタンパク質と相互作用して、Casタンパク質のヌクレアーゼ活性を標的配列に方向付けることができる。標的配列は、「プロトスペーサー」および「プロトスペーサー隣接モチーフ」(PAM)を含み得、どちらのドメインもCasに媒介される活性(例えば、切断)に必要であり得る。gRNAは、プロトスペーサーの逆の鎖上の結合部位と対合(またはそれとハイブリダイズ)して、Casを標的配列に方向付ける。PAM部位は、Casタンパク質によって認識される短い配列を指し得、一部の場合では、Casタンパク質活性に必要である。
【0036】
本明細書で使用される場合、「Cas」または「Casタンパク質」という用語は、エンドヌクレアーゼ活性を有するCRISPR/Cas系のタンパク質またはCRISPR/Cas系に由来するタンパク質を指す。一部の場合では、CRISPR関連エンドヌクレアーゼは、本明細書で使用される場合、Casタンパク質である。Casタンパク質は、天然に存在するCasタンパク質、天然に存在しないCasタンパク質、またはそれらの断片であり得る。一部の場合では、Casタンパク質は、天然に存在するCasタンパク質の変異体(例えば、天然に存在するCasタンパク質と比べて1つまたは複数のアミノ酸置換、挿入、欠失などを有する)である。一部の場合では、Casタンパク質はクラスI Casタンパク質であり、非限定的な例として、Cas3、Cas8a、Cas5、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Cas10、Csx11、Csx10、およびCsf1が挙げられる。一部の場合では、Casタンパク質はクラスII Casタンパク質であり、非限定的な例として、Cas9、Csn2、Cas4、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas13a(C2c2)、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、Casタンパク質はCas9である。一部の場合では、Casタンパク質はCas12aである。
【0037】
「ガイドRNA」または「gRNA」という用語は、本明細書では互換的に使用され、一般に、Casタンパク質に結合し、Casタンパク質の標的ポリヌクレオチド(例えば、DNA)内の特定の位置へのターゲティングを補助することができるRNA分子(または集合的にRNA分子の群)を指す。ガイドRNAは、CRISPR RNA(crRNA)セグメント、および、必要に応じて、トランス活性化crRNA(tracrRNA)セグメントを含み得る。「crRNA」という用語は、本明細書で使用される場合、ポリヌクレオチド標的化ガイド配列、ステム配列、および必要に応じて5’突出配列を含むRNA分子またはその一部を指し得る。crRNAは結合部位に結合することができる。「tracrRNA」という用語は、本明細書で使用される場合、タンパク質結合性セグメント(例えば、タンパク質結合性セグメントは、CRISPR関連タンパク質、例えばCas9と相互作用することが可能である)を含むRNA分子またはその一部を指し得る。「ガイドRNA」という用語は、単一ガイドRNA(sgRNA)を指し得、ここで、crRNAセグメントと必要に応じたtracrRNAセグメントは同じRNA分子内に位置する。「ガイドRNA」という用語は、集合的に、2つまたはそれよりも多くのRNA分子の群も指し得、ここで、crRNAとtracrRNAは別々のRNA分子内に位置する。
【0038】
「ロングリードシーケンシング」という用語(「第3世代シーケンシング」とも称される)は、本明細書で使用される場合、一般に、第2世代シーケンシングよりも実質的に長いシーケンシングリード(>10,000bp)を生成することが可能な任意の配列決定法を指す。一部の実施形態では、本明細書に提示される方法は、ロングリードシーケンシングの使用(例えば、目的の複雑なゲノム領域の遺伝子型を判定するため)を伴う。ロングリードシーケンシング系の非限定的な例としては、Pacific Biosciences、Oxford Nanopore Technology、Quantapore、Stratos、およびHelicosによって開発されたものが挙げられる。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(SMRT)(例えば、Pacific Biosciencesによって開発されたもの)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologyによって開発されたMinION、GridION、およびPromethION)である。一部の場合では、ロングリードシーケンシングは、現在開発中であるか、または今後開発されるあらゆるロングリードシーケンシング法または系(例えば、第3世代シーケンシング方法または系)を包含する。
【0039】
「核酸増幅」という用語は、本明細書で使用される場合、一般に、単一の核酸分子から標的核酸(例えば、DNA)の多数のコピーを生成する任意の方法を指す。標的核酸は、DNAの場合もあり(例えば、DNA増幅)、RNAの場合もある(例えば、RNA増幅)。核酸増幅は、ポリメラーゼ連鎖反応(PCR)およびありとあらゆるその変形形態または改変、ならびに、例えば、これだけに限定されないが、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)などの代替的な型の核酸増幅法を含む。本開示の種々の態様では、本明細書に提示される方法は、核酸(例えば、DNA)増幅の使用を伴わない(例えば、増幅フリー)。
【0040】
本開示の方法
【0041】
本開示の一態様では、目的のゲノム領域を解析する方法であって、(a)目的のゲノム領域を含むゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、(b)目的のゲノム領域を含むゲノムDNAを単離するステップと、(c)切り出された目的のゲノム領域を解析するステップとを含み、DNA増幅を伴わない、方法が提供される。
【0042】
種々の態様では、方法は、目的のゲノム領域を含むゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを富化させることを伴う。一部の実施形態では、高分子量ゲノムDNAは、少なくとも約10キロベースの長さである。例えば、高分子量ゲノムDNAは、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムDNAを単離するステップにより、インタクトな目的のゲノム領域全体が試料中に含有されることを確実にする。
【0043】
種々の態様では、方法は、高分子量ゲノムDNAを単離するための任意の方法を伴う。高分子量ゲノムDNAを単離するための方法の非限定的な例としては、NucleoBond(登録商標)Genomic DNA and RNA purification system(Takara Bio製)、およびNanobind CBB Big DNA kit(Circulomics製)が挙げられる。
【0044】
一部の態様では、目的のゲノム領域を含むゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの前に実施することができる。他の態様では、目的のゲノム領域を含むゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの後(例えば、目的のゲノム領域をゲノムDNAから切り出された後)に実施することができる。
【0045】
種々の態様では、目的のゲノム領域は複雑なゲノム領域または高度に複雑なゲノム領域である。一部の場合では、目的のゲノム領域は高度に多型的なゲノム領域である。一部の場合では、目的のゲノム領域は多数の反復エレメントまたは領域を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する(例えば、標的遺伝子に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも大きな配列同一性を有する)1つまたは複数の追加的な遺伝子を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する(例えば、標的遺伝子に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも大きな配列同一性を有する)1つまたは複数の偽遺伝子を含有する。一部の場合では、目的のゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、伝統的な方法によって(例えば、ショートリードシーケンシング法によって)正確に解析することが一般に難しいまたは難易度が高いゲノム領域である。
【0046】
一部の場合では、目的の複雑なゲノム領域は、少なくとも約10キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約25キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さ、少なくとも約100キロベースの長さ、少なくとも約110キロベースの長さ、少なくとも約120キロベースの長さ、少なくとも約130キロベースの長さ、少なくとも約140キロベースの長さ、少なくとも約150キロベースの長さ、少なくとも約160キロベースの長さ、少なくとも約170キロベースの長さ、少なくとも約180キロベースの長さ、少なくとも約190キロベースの長さ、少なくとも約200キロベースの長さ、少なくとも約210キロベースの長さ、少なくとも約220キロベースの長さ、少なくとも約230キロベースの長さ、少なくとも約240キロベースの長さ、または少なくとも約250キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約10キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約250キロベースの長さよりも短い。
【0047】
種々の態様では、方法は、目的のゲノム領域を含むゲノムDNA(例えば、複雑なゲノム領域)をCRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップを伴う。一部の場合では、接触させるステップにより、目的のゲノム領域の全体がゲノムDNAから切り出される。一部の場合では、接触させるステップにより、目的のゲノム領域の一部が切り出される。CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。Cas I CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
【0048】
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される点突然変異を含み得る。
【0049】
種々の態様では、方法は、ゲノムDNAを2つまたはそれよりも多くのgRNAと接触させるステップを含む。gRNAは、CRISPR RNA(crRNA)または単一ガイドRNA(sgRNA)であり得る。一部の実施形態では、2つまたはそれよりも多くのgRNAは、それぞれが、ゲノムDNA上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、2つまたはそれよりも多くのgRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、2つまたはそれよりも多くのgRNAのそれぞれがゲノムDNA上の異なる標的配列に結合する。一部の実施形態では、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが目的のゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、2つまたはそれよりも多くのgRNAは、目的のゲノム領域の両側に隣接する標的配列に結合する。一般に、gRNAは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること(例えば、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと)により、目的のゲノム領域の全体がゲノムDNAから切り出される。
【0050】
種々の態様では、方法は、切り出された目的のゲノム領域を解析するステップをさらに伴う。一部の場合では、解析するステップは、切り出されたゲノム領域の遺伝子型を判定することを含む。遺伝子型判定は、目的のゲノム領域の遺伝学的組立ての差異を、目的のゲノム領域の配列を調査するための1つまたは複数のアッセイを使用して同定し、一部の場合では配列と別の配列(例えば、参照配列)と比較するプロセスを含み得る。遺伝子型判定は、これだけに限定されないが、DNA配列決定、制限断片長多型同定(RFLPI)、ランダム増幅多型検出(RAPD)、増幅断片長多型検出(AFLPD)、ポリメラーゼ連鎖反応(PCR)、対立遺伝子特異的オリゴヌクレオチド(ASO)プローブ、およびDNAマイクロアレイまたはビーズへのハイブリダイゼーションを含めた任意の公知の方法によって実施することができる。一部の場合では、解析するステップは、目的のゲノム領域に対する構造解析を実施することを含む。
【0051】
一部の場合では、解析するステップは、目的のゲノム領域の配列を決定することを含む。一部の場合では、配列決定は、ロングリードシーケンシング法(例えば、第3世代シーケンシング方法)である。ロングリードシーケンシング法は、ショートリードシーケンシング法(例えば、第2世代シーケンシング方法)よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも10,000キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(例えば、SMRTシーケンシング、Pacific Biosciences)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologiesにより開発されたMinION、GridION、およびPromethION)である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター(例えば、配列決定用アダプター)をライゲーションするステップをさらに伴う。方法は、一部の場合では、末端にテールを付加するステップ、脱リン酸化ステップなどを含めた、配列決定用途に適した任意の他のプロセシング法を伴い得る。
【0052】
種々の態様では、本明細書に提示される方法は、増幅フリーである(例えば、核酸増幅(例えば、DNA増幅)ステップを伴わない)。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応(PCR)を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)のいずれの1つも伴わない。核酸増幅技法により、多くの場合、誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。
【0053】
種々の態様では、方法は、ゲノムDNAの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムDNAを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムDNAに対して直接実施される。
【0054】
本開示の別の態様では、長さが少なくとも10キロベースである目的の複雑なゲノム領域を含む遺伝子座の配列を決定する方法であって、(a)目的の複雑なゲノム領域を含むゲノムDNAを提供するステップと、(b)目的の複雑なゲノム領域を含む高分子量DNAを単離するステップと、(c)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、複雑なゲノム領域の両側に隣接する、ステップと、c)複雑なゲノム領域を解析するステップとを含む方法が提供される。一部の場合では、方法は、DNA増幅を伴わない(例えば、増幅フリー)。
【0055】
種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する1つまたは複数の偽遺伝子を含む。一部の場合では、1つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも約75%(例えば、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有し得る。特定の一態様では、遺伝子座は、標的遺伝子であるCYP2D6、ならびに偽遺伝子であるCYP2D7およびCYP2D8を含む。
【0056】
種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する1つまたは複数の追加的な遺伝子を含む。一部の場合では、1つまたは複数の追加的な遺伝子は、標的遺伝子に対して少なくとも約75%(例えば、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有し得る。特定の一態様では、遺伝子座は、遺伝子CYP2C8、CYP2C9、CYP2C18、およびCYP2C19を含む。一部の場合では、遺伝子座は、一般に、伝統的な方法によって(例えば、ショートリードシーケンシング法によって)正確に配列決定することが難しいまたはその難易度が高いものである。
【0057】
種々の態様では、複雑なゲノム領域は、高度に多型的な遺伝子座である。種々の態様では、複雑なゲノム領域は、1つまたは複数の反復領域、1つまたは複数の重複、1つまたは複数の挿入、1つまたは複数の逆位、1つまたは複数のタンデムリピート、1つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。
【0058】
一部の場合では、目的の複雑なゲノム領域は、少なくとも約10キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約25キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さ、少なくとも約100キロベースの長さ、少なくとも約110キロベースの長さ、少なくとも約120キロベースの長さ、少なくとも約130キロベースの長さ、少なくとも約140キロベースの長さ、少なくとも約150キロベースの長さ、少なくとも約160キロベースの長さ、少なくとも約170キロベースの長さ、少なくとも約180キロベースの長さ、少なくとも約190キロベースの長さ、少なくとも約200キロベースの長さ、少なくとも約210キロベースの長さ、少なくとも約220キロベースの長さ、少なくとも約230キロベースの長さ、少なくとも約240キロベースの長さ、または少なくとも約250キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約10キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約250キロベースの長さよりも短い。
【0059】
種々の態様では、方法は、遺伝子座を含むゲノムDNAをCRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップを伴う。一部の場合では、接触させるステップにより、遺伝子座全体がゲノムDNAから切り出される。一部の場合では、接触させるステップにより、目的の遺伝子座の一部が切り出される。CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。クラスI CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
【0060】
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される点突然変異を含み得る。
【0061】
種々の態様では、方法は、ゲノムDNAを2つまたはそれよりも多くのgRNAと接触させるステップを含む。一部の実施形態では、2つまたはそれよりも多くのgRNAは、それぞれが、ゲノムDNA上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、2つまたはそれよりも多くのgRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、2つまたはそれよりも多くのgRNAのそれぞれがゲノムDNA上の異なる標的配列に結合する。一部の実施形態では、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが目的の複雑なゲノム領域の上流の領域と相補的または実質的に相補的であり、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが目的の複雑なゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、2つまたはそれよりも多くのgRNAは目的の複雑なゲノム領域の両側に隣接する標的配列に結合する。一般に、gRNAは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること(例えば、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと)により、目的のゲノム領域の全体がゲノムDNAから切り出される。
【0062】
種々の態様では、方法は、複雑なゲノム領域を解析するステップをさらに伴う。解析するステップは、切り出された目的のゲノム領域の遺伝子型を判定すること、構造解析を実施すること、および/または配列を決定することを含めた本明細書に提示される任意の方法を包含し得る。一部の場合では、配列決定は、ロングリードシーケンシング法(例えば、第3世代シーケンシング方法)である。ロングリードシーケンシング法は、ショートリードシーケンシング法(例えば、第2世代シーケンシング方法)よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも10,000キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(例えば、SMRTシーケンシング、Pacific Biosciences)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologiesにより開発されたMinION、GridION、およびPromethION)である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター(例えば、配列決定用アダプター)をライゲーションするステップをさらに伴う。DNA試料を配列決定のために調製するために適した任意の追加的な方法を使用することができる(例えば、末端にテールを付加するステップ、脱リン酸化ステップなど)。
【0063】
種々の態様では、方法は、ゲノムDNAを含む試料から高分子量ゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを富化させるステップを伴う。一部の実施形態では、高分子量ゲノムDNAは少なくとも約10キロベースの長さである。例えば、高分子量ゲノムDNAは、少なくとも約10キロベースの長さ、少なくとも約15キロベースの長さ、少なくとも約20キロベースの長さ、少なくとも約25キロベースの長さ、少なくとも約30キロベースの長さ、少なくとも約35キロベースの長さ、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムDNAを単離するステップにより、インタクトな遺伝子座全体が試料中に含有されることを確実にする。
【0064】
種々の態様では、方法は、高分子量ゲノムDNAを単離するための任意の方法を伴う。高分子量ゲノムDNAを単離するための方法の非限定的な例としては、NucleoBond(登録商標)Genomic DNA and RNA purification system(Takara Bio製)、およびNanobind CBB Big DNA kit(Circulomics製)が挙げられる。
【0065】
一部の態様では、高分子量ゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの前に実施することができる。他の態様では、高分子量ゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの後(例えば、目的のゲノム領域をゲノムDNAから切り出された後)に実施することができる。
【0066】
種々の態様では、本明細書に提示される方法は、増幅フリーである(例えば、核酸増幅(例えば、DNA増幅)ステップを伴わない)。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応(PCR)を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)のいずれの1つも伴わない。核酸増幅技法により、多くの場合、配列決定用鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。
【0067】
種々の態様では、方法は、ゲノムDNAの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムDNAを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムDNAに対して直接実施される。
【0068】
さらに別の態様では、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を解析する方法であって、a)当該遺伝子座を含むゲノムDNAを提供するステップと、b)当該遺伝子座をゲノムDNAから切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の両側に隣接する、ステップと、c)当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、方法は、b)の前に高分子量DNAを単離するステップをさらに含む。
【0069】
一部の場合では、解析するステップは、遺伝子座(例えば、本明細書に記載の)の遺伝子型を判定することを含む。一部の場合では、解析するステップは、遺伝子座(例えば、本明細書に記載の)の構造解析を実施することを含む。一部の場合では、解析するステップは、遺伝子座(例えば、本明細書に記載の)の配列を決定すること(例えば、ロングリードシーケンシング)を含む。
【0070】
別の態様では、対象におけるCYP2D6の遺伝子変異を同定する方法であって、a)対象から得たゲノムDNAを含む生体試料を提供するステップと、b)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、c)遺伝子座のロングリードシーケンシングを実施するステップと、d)対象のCYP2D6の1つまたは複数の遺伝子変異を同定するステップとを含む方法が提供される。
【0071】
一部の場合では、遺伝子座は少なくとも約40キロベースの長さである。例えば、遺伝子座は、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さ、または少なくとも約100キロベースの長さであり得る。
【0072】
種々の態様では、方法は、遺伝子座を含むゲノムDNAをCRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップを伴う。一部の場合では、接触させるステップにより、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の全体がゲノムDNAから切り出される。一部の場合では、接触させるステップにより、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の一部が切り出される。CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。クラスI CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
【0073】
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される点突然変異を含み得る。
【0074】
種々の態様では、方法は、ゲノムDNAを2つまたはそれよりも多くのgRNAと接触させるステップを含む。一部の実施形態では、2つまたはそれよりも多くのgRNAは、それぞれが、ゲノムDNA上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、2つまたはそれよりも多くのgRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、2つまたはそれよりも多くのgRNAのそれぞれがゲノムDNA上の異なる標的配列に結合する。一部の実施形態では、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の上流の領域と相補的または実質的に相補的であり、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の下流の領域と相補的または実質的に相補的である。一部の実施形態では、2つまたはそれよりも多くのgRNAは、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の両側に隣接する標的配列に結合する。一般に、gRNAは、それぞれが、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の外側にあるゲノム配列を標的とするように設計され、したがって、接触させるステップ(例えば、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと)により、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の全体がゲノムDNAから切り出される。
【0075】
一部の場合では、gRNAのうちの少なくとも1つは、以下の表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)と一致するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つは、以下の表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)に対して少なくとも約90%(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有するヌクレオチド配列を含む。一部の場合では、第1のgRNAは、配列番号1、2、または13~16のいずれか1つのヌクレオチド配列、または配列番号1、2、または13~16のいずれか1つに対して少なくとも90%の配列同一性(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)を有するヌクレオチド配列を含む。一部の場合では、第2のgRNAは、配列番号3~12または17~26のいずれか1つのヌクレオチド配列、または配列番号3~12または17~26のいずれか1つに対して少なくとも90%の配列同一性(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)を有するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つはcrRNAである。一部の場合では、gRNAのうちの少なくとも1つはsgRNAである。
【表1-1】
【表1-2】
【表1-3】
【0076】
種々の態様では、方法は、切り出された目的のゲノム領域を解析するステップ(例えば、遺伝子型を判定すること、配列を決定すること、構造解析を実施すること)をさらに伴う。一部の場合では、配列決定は、ロングリードシーケンシング法(例えば、第3世代シーケンシング方法)である。ロングリードシーケンシング法は、ショートリードシーケンシング法(例えば、第2世代シーケンシング方法)よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも10,000キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング(例えば、SMRTシーケンシング、Pacific Biosciences)である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング(例えば、Oxford Nanopore Technologiesにより開発されたMinION、GridION、およびPromethION)である。一部の態様では、配列決定の前に、方法は、切り出された目的のゲノム領域の末端にアダプター(例えば、配列決定用アダプター)をライゲーションするステップをさらに伴う。
【0077】
種々の態様では、方法は、ゲノムDNAを含む試料から高分子量ゲノムDNAを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムDNAを富化させるステップを伴う。一部の実施形態では、高分子量ゲノムDNAは少なくとも約40キロベースの長さである。例えば、高分子量ゲノムDNAは、少なくとも約40キロベースの長さ、少なくとも約45キロベースの長さ、少なくとも約50キロベースの長さ、少なくとも約55キロベースの長さ、少なくとも約60キロベースの長さ、少なくとも約65キロベースの長さ、少なくとも約70キロベースの長さ、少なくとも約75キロベースの長さ、少なくとも約80キロベースの長さ、少なくとも約85キロベースの長さ、少なくとも約90キロベースの長さ、少なくとも約95キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムDNAを単離するステップにより、インタクトな遺伝子座全体が試料中に含有されることを確実にする。
【0078】
種々の態様では、方法は、高分子量ゲノムDNAを単離するための任意の方法を伴う。高分子量ゲノムDNAを単離するための方法の非限定的な例としては、NucleoBond(登録商標)Genomic DNA and RNA purification system(Takara Bio製)、およびNanobind CBB Big DNA kit(Circulomics製)が挙げられる。
【0079】
一部の態様では、高分子量ゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの前に実施することができる。他の態様では、高分子量ゲノムDNAを単離するステップを、ゲノムDNAをCRISPR関連エンドヌクレアーゼおよびガイドRNAと接触させるステップの後(例えば、目的のゲノム領域をゲノムDNAから切り出された後)に実施することができる。
【0080】
種々の態様では、本明細書に提示される方法は、増幅フリーである(例えば、核酸増幅(例えば、DNA増幅)ステップを伴わない)。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応(PCR)を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅(LAMP)、核酸配列に基づく増幅(NASBA)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、および分岐増幅法(RAM)のいずれの1つも伴わない。核酸増幅技法により、多くの場合、配列決定用鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定用鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。
【0081】
種々の態様では、方法は、ゲノムDNAの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムDNAを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムDNAに対して直接実施される。
【0082】
種々の態様では、遺伝子変異は、CYP2D6の薬理遺伝学的に関連性のある変異(例えば、スター対立遺伝子ハプロタイプ)である。一部の場合では、遺伝子変異は、CYP2D6の構造変異である。一部の場合では、遺伝子変異に基づいて、対象を、CYP2D6機能の低下または喪失を有すると同定する。一部の場合では、対象を、CYP2D6機能の増大または獲得を有すると同定する。
【0083】
種々の態様では、方法は、同定するステップに基づいて、対象に対して処置を推奨するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、対象を処置するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、代替処置を推奨するステップを伴う。種々の態様では、方法は、同定するステップに基づいて、薬物のある投薬量を推奨するステップを伴う。種々の態様では、方法は、対象に投与される薬物(例えば、CYP2D6によって活性化または代謝される)の投薬量を変更するステップ(または投薬量の変更を推奨するステップ)を伴う。一部の場合では、薬物(または治療薬)は、CYP2D6によって活性化または代謝される薬物である。
【0084】
組成物およびキット
【0085】
一態様では、a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびにc)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含む組成物が提供される。
【0086】
CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。Cas I CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
【0087】
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される点突然変異を含み得る。
【0088】
一部の実施形態では、2つまたはそれよりも多くのgRNAは、それぞれが、ゲノムDNA上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、2つまたはそれよりも多くのgRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、2つまたはそれよりも多くのgRNAのそれぞれがゲノムDNA上の異なる標的配列に結合する。一部の実施形態では、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の上流の領域と相補的または実質的に相補的であり、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の下流の領域と相補的または実質的に相補的である。一部の実施形態では、2つまたはそれよりも多くのgRNAは、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の両側に隣接する標的配列に結合する。一般に、gRNAは、それぞれが、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の外側にあるゲノム配列を標的とするように設計され、したがって、接触させるステップ(例えば、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと)により、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の全体がゲノムDNAから切り出される。
【0089】
一部の場合では、gRNAのうちの少なくとも1つは、表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)と一致するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つは、表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)に対して少なくとも約90%(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つはcrRNAである。一部の場合では、gRNAのうちの少なくとも1つはsgRNAである。
【0090】
CYP2D6の遺伝子型を判定するためのキットであって、a)クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼ;b)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第1のガイドRNA(gRNA);ならびにc)ゲノムDNA内に存在するCYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第2のガイドRNA(gRNA)を含むキットが本明細書にさらに提示される。一部の場合では、キットは、使用説明書(例えば、CYP2D6の遺伝子型を判定するためのキットの使用に関する)をさらに含む。
【0091】
CRISPR関連エンドヌクレアーゼは、本明細書に記載の任意のCRISPR関連エンドヌクレアーゼであり得る。一部の場合では、CRISPR関連エンドヌクレアーゼは、クラスIまたはクラスII CRISPR関連エンドヌクレアーゼである。クラスI CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas3、Cas5、Cas8a、Cas8b、Cas8c、Cas10d、Cse1、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Csx11、Csx10、およびCsf1が挙げられる。クラスII CRISPR関連エンドヌクレアーゼの非限定的な例としては、Cas9、Cas12a、Csn2、Cas4、Cas12b、Cas12c、Cas13a、Cas13b、Cas13c、およびCas13dが挙げられる。一部の場合では、CRISPR関連エンドヌクレアーゼはCasタンパク質またはポリペプチドである。一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas12aタンパク質またはポリペプチドである。
【0092】
一部の実施形態では、CRISPR関連エンドヌクレアーゼはCas9タンパク質またはポリペプチドである。一部の場合では、Cas9タンパク質またはポリペプチドは、細菌種Streptococcus pyogenesに由来する。一部の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Cas9タンパク質またはポリペプチドは野生型Cas9アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Cas9タンパク質またはポリペプチドは1つまたは複数の突然変異(例えば、野生型Cas9タンパク質またはポリペプチドと比べて)を有する。一部の場合では、1つまたは複数の突然変異は置換、欠失、または挿入である。Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%の配列同一性を有するアミノ酸配列を有し得る。例えば、Cas9タンパク質またはポリペプチドは、野生型Cas9タンパク質またはポリペプチドと比べて少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有し得る。一部の場合では、Cas9変異体は、野生型S.pyogenes Cas9と比べて1つまたは複数の点突然変異を含み得る。例えば、Cas9変異体は、野生型S.pyogenes Cas9と比べて、R780A、K810A、K848A、K855A、H982A、K1003A、R1060A、D1135E、N497A、R661A、Q695A、Q926A、L169A、Y450A、M495A、M694A、およびM698Aからなる群から選択される点突然変異を含み得る。
【0093】
一部の実施形態では、2つまたはそれよりも多くのgRNAは、それぞれが、ゲノムDNA上の標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、2つまたはそれよりも多くのgRNAは、標的ヌクレオチド配列に結合し、CRISPR複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、2つまたはそれよりも多くのgRNAのそれぞれがゲノムDNA上の異なる標的配列に結合する。一部の実施形態では、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の上流の領域と相補的または実質的に相補的であり、2つまたはそれよりも多くのgRNAのうちの少なくとも1つが遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の下流の領域と相補的または実質的に相補的である。一部の実施形態では、2つまたはそれよりも多くのgRNAは、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の両側に隣接する標的配列に結合する。一般に、gRNAは、それぞれが、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の外側にあるゲノム配列を標的とするように設計され、したがって、接触させるステップ(例えば、CRISPR関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと)により、遺伝子座(例えば、CYP2D6、CYP2D7、およびCYP2D8を含有する)の全体がゲノムDNAから切り出される。
【0094】
一部の場合では、gRNAのうちの少なくとも1つは、表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)と一致するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つは、表1に提示されている任意のヌクレオチド配列(例えば、配列番号1~26)に対して少なくとも約90%(例えば、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の配列同一性を有するヌクレオチド配列を含む。一部の場合では、gRNAのうちの少なくとも1つはcrRNAである。一部の場合では、gRNAのうちの少なくとも1つはsgRNAである。
【0095】
対象および生体試料
【0096】
対象は、遺伝子解析のための生体試料を提供することができる。生体試料は、対象によって生成された任意の物質であってよい。一般に、生体試料は、対象から取得された任意の組織または対象によって生成された任意の物質である。生体試料は、例えば、血液(例えば、全血、血漿、血清)、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌液、眼内液、母乳などの体液であり得る。生体試料は、細胞および/または固形組織(例えば、頬組織(例えば、頬スワブから)、糞便、皮膚、毛髪、器官組織など)であり得る。一部の場合では、生体試料は、固形腫瘍または固形腫瘍の生検材料である。一部の場合では、生体試料は、ホルマリン固定された、パラフィン包埋(FFPE)組織試料である。生体試料は、ゲノムDNAを含む任意の生体試料であってよい。
【0097】
生体試料を対象から引き出すことができる。対象は、哺乳動物、爬虫類、両生類、トリ、または魚であり得る。哺乳動物は、ヒト、類人猿、オランウータン、サル、チンパンジー、ウシ、ブタ、ウマ、齧歯類、鳥類、爬虫類、イヌ、ネコ、または他の動物であり得る。爬虫類は、トカゲ、ヘビ、ワニ、カメ(turtle)、クロコダイル、およびカメ(tortoise)であり得る。両生類は、ヒキガエル、カエル、イモリ、およびサンショウウオであり得る。トリの例としては、これだけに限定されないが、アヒル、ガチョウ、ペンギン、ダチョウ、およびフクロウが挙げられる。魚の例としては、これだけに限定されないが、ナマズ、ウナギ、サメ、およびメカジキが挙げられる。対象はヒトであることが好ましい。対象は疾患または状態を有し得る。対象に治療薬を処方することができる。治療薬は、CYP2D6によって活性化および/または代謝される治療薬であり得る。
【0098】
本開示のシステム
【0099】
本明細書に提示される方法を実施するためのシステムが本明細書にさらに提示される。一態様では、目的の複雑なゲノム領域を解析するためのシステムであって、(a)(i)目的の複雑なゲノム領域を含むゲノムDNAから高分子量DNAを単離するステップと、(ii)目的の複雑なゲノム領域を切り出すために、ゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップであって、2つまたはそれよりも多くのgRNAが、それぞれ、ゲノムDNA内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域の両側に隣接するステップと、(iii)目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、DNA増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。
【0100】
種々の態様では、出力はレポートである。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子型である。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子配列である。種々の態様では、出力は、目的の複雑なゲノム領域の構造解析である。種々の態様では、解析するステップは、目的の複雑なゲノム領域の遺伝子型を判定することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の配列を決定することを含む。
【0101】
別の態様では、対象のCYP2D6の遺伝子変異を同定するためのシステムであって、(a)(i)CYP2D6、CYP2D7、およびCYP2D8を含む遺伝子座を切り出すために、対象から得たゲノムDNAを、クラスター化された規則的な配置の短い回文配列リピート(CRISPR)関連エンドヌクレアーゼおよび2つまたはそれよりも多くのgRNAと接触させるステップと、(iii)当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも1つのメモリ位置;ならびに(b)少なくとも1つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。
【0102】
種々の態様では、出力はレポートである。種々の態様では、出力は、CYP2D6の遺伝子変異を同定するものである。種々の態様では、出力は、CYP2D6の機能の低下、喪失、または増大を同定するものである。種々の態様では、レポートは、遺伝子変異に基づいて、対象に対して処置を推奨するものである。種々の態様では、レポートは、遺伝子変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。種々の態様では、レポートは、遺伝子変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、CYP2D6によって活性化または代謝される治療薬である。
【0103】
本開示は、本明細書に記載の方法を実施するための、コンピュータに基づくシステムをさらに提供する。一部の態様では、システムを、本明細書に提示される方法によって生成されたデータを解析するために使用することができる。システムは、1つまたは複数のクライアントコンポーネントを含み得る。1つまたは複数のクライアントコンポーネントは、ユーザーインタフェースを含み得る。システムは、1つまたは複数のサーバーコンポーネントを含み得る。サーバーコンポーネントは、1つまたは複数のメモリ位置を含み得る。1つまたは複数のメモリ位置は、データ入力を受け取るように構成することができる。データ入力は、配列決定データを含み得る。配列決定データは、対象由来の核酸試料(例えば、ゲノムDNA)から生成することができる。本開示のシステムでの使用に適した配列決定データの非限定的な例は記載されている。システムは、1つまたは複数のコンピュータプロセッサをさらに含み得る。1つまたは複数のコンピュータプロセッサを1つまたは複数のメモリ位置に作動可能にカップリングすることができる。1つまたは複数のコンピュータプロセッサを、スクリーン上に表示するための出力を生成するようにプログラムすることができる。出力は1つまたは複数のレポートを含み得る。
【0104】
本明細書に記載のシステムは、1つまたは複数のクライアントコンポーネントを含み得る。1つまたは複数のクライアントコンポーネントは、1つまたは複数のソフトウェアコンポーネント、1つまたは複数のハードウェアコンポーネント、またはこれらの組合せを含み得る。1つまたは複数のクライアントコンポーネントは、1つまたは複数のサーバーコンポーネントを通じて1つまたは複数のサービスにアクセス可能である。1つまたは複数のクライアントコンポーネントによりネットワークを通じて1つまたは複数のサービスにアクセス可能である。ネットワークは、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワークは、一部の場合では、電気通信および/またはデータネットワークである。ネットワークは1つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワークは、一部の場合では、コンピュータシステムを利用して、ピアツーピアネットワークをインプリメントすることができ、それにより、コンピュータシステムとカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。
【0105】
システムは、1つまたは複数のメモリ位置(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース(例えば、ネットワークアダプター)、ならびに、キャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプターなどの周辺機器を含み得る。メモリ、記憶装置、インターフェースおよび周辺機器は、マザーボードなどの通信バスを通じてCPUと通信する。記憶装置は、データを記憶させるためのデータ記憶単位(またはデータリポジトリ)であり得る。一実施例では、1つまたは複数のメモリ位置に受け取った配列決定データを記憶させることができる。
【0106】
システムは、1つまたは複数のコンピュータプロセッサを含み得る。1つまたは複数のコンピュータプロセッサは、例えば、記憶されたデータにアクセスするために、1つまたは複数のメモリ位置に作動可能にカップリングすることができる。1つまたは複数のコンピュータプロセッサは、機械により実行可能なコードをインプリメントして、本明細書に記載の方法を実施することが可能である。
【0107】
機械により実行可能なまたは機械により可読のコードは、ソフトウェアの形式で提供することができる。使用中、コードをプロセッサによって実行することができる。一部の場合では、コードを記憶装置から検索し、プロセッサからすぐにアクセスできるようにメモリに記憶させることができる。一部の状況では、電子記憶装置を除外することができ、機械により実行可能な命令をメモリに記憶させる。
【0108】
コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。
【0109】
コンピュータシステムなどの本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械(もしくはプロセッサ)により実行可能なコードおよび/または機械可読媒体の一種で実施または具体化される関連データの形式の「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、任意のまたは全てのコンピュータの有形メモリ、プロセッサなど、または関連するそのモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための指示をもたらすことに関与する任意の媒体を指す。
【0110】
したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えば図に示されているデータベースなどをインプリメントするために使用することができる任意のコンピュータ(複数可)のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、高周波(RF)および赤外(IR)データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー(登録商標)ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリチップまたはカートリッジ、データもしくは指示を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび/またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の指示の1つまたは複数の順序をプロセッサに実行のために伝えることに関与し得る。
【0111】
本明細書に開示されるシステムは、1つまたは複数の電子ディスプレイを含み得る、またはそれと通信し得る。電子ディスプレイは、コンピュータシステムの一部であってもよく、コンピュータシステムに直接またはネットワークを通じてカップリングしていてもよい。コンピュータシステムは、本明細書に開示される種々の特色および機能性を提供するためのユーザーインタフェース(UI)を含み得る。UIの例としては、限定することなく、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインタフェースが挙げられる。UIにより、ユーザーがそれによって本明細書に記載の方法およびシステムを利用することができる相互作用ツールをもたらすことができる。例として、本発明で構想されるUIは、健康管理実践者がそれによって遺伝学的試験を要求し、試験される遺伝学的変異体の一覧をカスタマイズし、レポートを受け取り、閲覧することができる、ウェブに基づくツールであり得る。
【0112】
本明細書に開示される方法は、生物医学的データベース、ゲノムデータベース、生物医学的レポート、疾患レポート、症例対照解析、および1つもしくは複数のデータベースからのデータおよび/もしくは情報に基づいた希少な変異体発見解析、1つもしくは複数のアッセイ、1つもしくは複数のデータもしくは結果、1つもしくは複数のアッセイに基づくもしくはそれから引き出される1つもしくは複数の出力、1つもしくは複数のデータもしくは結果に基づくもしくはそれから引き出される1つもしくは複数の出力、またはこれらの組合せを含み得る。
【0113】
本明細書に記載の通り、1つまたは複数のコンピュータプロセッサにより、機械により実行可能なコードをインプリメントして本開示の方法を実施することができる。機械により実行可能なコードは、任意の数のオープンソースまたはクローズドソースソフトウェアを含み得る。機械により実行可能なコードをインプリメントして、データ入力を解析することができる。データ入力は、1つまたは複数の配列決定反応により生成された配列決定データであり得る。コンピュータプロセッサを少なくとも1つのメモリ位置に作動可能にカップリングすることができる。コンピュータプロセッサにより、少なくとも1つのメモリ位置からデータ(例えば、配列決定データ)にアクセスすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データを参照配列にマッピングすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データから遺伝学的変異体の存在または非存在を決定することができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、スクリーン上に表示するための出力(例えば、レポート)を生成することができる。
【0114】
機械により実行可能なコードは、1つまたは複数のアルゴリズムを含み得る。1つまたは複数のアルゴリズムを使用して本開示の方法をインプリメントすることができる。
【0115】
本開示のシステムは、1つまたは複数のコンピュータシステムを含み得る。図15は、例えば、データを受け取ること、および前記データに基づいて出力を生成することなど、本開示の方法をインプリメントするようにプログラムされたまたは他のやり方で構成されたコンピュータシステム(本明細書では「システム」とも)1501を示す。システム1501は、シングルコアプロセッサもしくはマルチコアプロセッサであってもよく、並行処理のための複数のプロセッサであってもよい中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも)1505を含む。システム1501はまた、メモリ1510(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置1515(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース1520(例えば、ネットワークアダプター)、ならびにキャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプターなどの周辺機器1525を含む。メモリ1510、記憶装置1515、インターフェース1520および周辺機器1525は、CPU 1505とマザーボードなどの通信バス(実線)を通じて通信する。記憶装置1515は、データを記憶させるためのデータ記憶単位(またはデータリポジトリ)であり得る。システム1501はコンピュータネットワーク(「ネットワーク」)1530に通信インターフェース1520を用いて作動可能に(operatively)カップリングしている。ネットワーク1530は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1530は、一部の場合では、電気通信および/またはデータネットワークである。ネットワーク1530は1つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワーク1530は、一部の場合では、システム1501を用いて、ピアツーピアネットワークをインプリメントすることが可能であり、それにより、システム1501とカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。
【0116】
システム1501は処理システム1540と通信する。処理システム1540は、例えば、配列決定データを参照配列にマッピングすることまたは分類を遺伝学的変異体に割り当てることなど、本明細書に開示される方法をインプリメントするように構成することができる。処理システム1540は、システム1501とネットワーク1530を通じて、または直接(例えば、有線、無線)接続によって通信させることができる。処理システム1540は、核酸配列解析などの解析のために構成することができる。
【0117】
本明細書に記載の方法およびシステムは、システム1501の電子記憶位置、例えば、メモリ1510または電子記憶装置1515などに記憶された機械(またはコンピュータプロセッサ)実行可能なコード(またはソフトウェア)によってインプリメントすることができる。使用中、コードをプロセッサ1505によって実行することができる。一部の実施例では、コードを記憶装置1515から検索し、プロセッサ1505からすぐにアクセスできるようにメモリ1510に記憶させることができる。一部の状況では、電子記憶装置1515を除外することができ、機械により実行可能な命令をメモリ1510に記憶させる。
【0118】
コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。
【0119】
本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械(もしくはプロセッサ)により実行可能なコードおよび/または機械可読媒体の一種で実施もしくは具体化される関連データの形式で「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、任意のまたは全てのコンピュータの有形メモリ、プロセッサなど、または関連するそのモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための指示をもたらすことに関与する任意の媒体を指す。
【0120】
したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えばデータベースなどをインプリメントするために使用することができる任意のコンピュータ(複数可)のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、高周波(RF)および赤外(IR)データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピーディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリチップまたはカートリッジ、データもしくは指示を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび/またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の指示の1つまたは複数の順序をプロセッサに実行のために伝えることに関与し得る。
【0121】
コンピュータシステム1501は、ユーザーインタフェース(UI)を含む電子ディスプレイを含み得る、またはそれと通信し得る。UIの例としては、限定することなく、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインタフェースが挙げられる。
【0122】
一部の実施形態では、システム1501は、視覚的情報をユーザーに提供するためのディスプレイを含む。一部の実施形態では、ディスプレイはブラウン管(CRT)である。一部の実施形態では、ディスプレイは液晶ディスプレイ(LCD)である。さらなる実施形態では、ディスプレイは薄膜トランジスタ液晶ディスプレイ(TFT-LCD)である。一部の実施形態では、ディスプレイは有機発光ダイオード(OLED)ディスプレイである。種々のさらなる実施形態では、OLEDディスプレイはパッシブマトリックスOLED(PMOLED)またはアクティブマトリックスOLED(AMOLED)ディスプレイである。一部の実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに別の実施形態では、ディスプレイは本明細書に開示されるものなどのデバイスの組合せである。ディスプレイは、1つまたは複数の生物医学的レポートが本明細書に記載の方法によって生成されたらそれをエンドユーザーに提供することができるものである。
【0123】
一部の実施形態では、システム1501は、ユーザーから情報を受け取る入力デバイスを含む。一部の実施形態では、入力デバイスはキーボードである。一部の実施形態では、入力デバイスは、非限定的な例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含めたポインティングデバイスである。一部の実施形態では、入力デバイスはタッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他の音入力を取り込むマイクロホンである。他の実施形態では、入力デバイスは、動きまたは視覚的入力を取り込むためのビデオカメラである。さらに別の実施形態では、入力デバイスは、本明細書に開示されるものなどのデバイスの組合せである。
【0124】
システム1501は、1つまたは複数のデータベースを含んでもよく、それと作動可能にカップリングすることもできる。データベースは、ゲノムデータベース、プロテオミクスデータベース、薬理ゲノミクスデータベース、生物医学的データベース、および科学的データベースを含み得る。データベースは公的に利用可能なデータベースであり得る。その代わりにまたはそれに加えて、データベースは独自のデータベースを含み得る。データベースは市販のデータベースであり得る。データベースとしては、これだけに限定されないが、MendelDB、PharmGKB、Varimed、Regulome、curated BreakSeq junctions、Online Mendelian Inheritance in Man(OMIM)、Human Genome Mutation Database(HGMD)、NCBI dbSNP、NCBI RefSeq、GENCODE、GO(gene ontology)、およびKyoto Encyclopedia of Genes and Genomes(KEGG)が挙げられる。
【0125】
データを、データのユーザーと同じ国を含む地理的な位置で生成し、かつ/またはそこから伝送することができる。データを、例えば、1つの国の地理的な位置で生成し、かつ/またはそこから伝送することができ、データのユーザーは異なる国に存在していてよい。一部の場合では、本開示のシステムによってアクセスしたデータを複数の地理的な位置のうちの1カ所からユーザーに伝送することができる。データを、例えば、ネットワーク、安全なネットワーク、安全でないネットワーク、インターネット、またはイントラネットにより、複数の地理的な位置の間で行き来するように伝送することができる。
【実施例
【0126】
以下の実施例は、本開示の種々の実施形態を例示する目的で提示され、本開示をどのようにも限定することを意図するものではない。本実施例は、本明細書に記載の方法と共に、現在の代表的な好ましい実施形態であり、例示であり、本開示の実施形態の範囲を限定することを意図するものではない。特許請求の範囲によって定義される本開示の主旨に包含される実施例における変化および他の使用が当業者には想起されよう。
【0127】
(実施例1)
【0128】
CYP2D6および臨床試験
【0129】
CYP2D6遺伝子構造:CYP2D6は、小さな遺伝子(4382bp)であり、9つのエクソンを有する。しかし、この高度に多型の遺伝子座の遺伝子解析は、図1に示されている通り、高度に類似した非機能性のCYP2D7およびCYP2D8偽遺伝子が遺伝子座内に存在することに起因して難しい。CYP2D6とCYP2D7の類似性および大きなリピート領域の存在により、遺伝子欠失および遺伝子重複だけでなく、3’CYP2D7と5’CYP2D6または3’CYP2D6と5’CYP2D7のいずれかを含有する複雑な遺伝子ハイブリッドも生じている。現在、これらの構造変異の存在を検出するために多数の試験アッセイが求められている。
【0130】
現行の試験用プラットフォーム:CYP2D6を解析するための一般的な方法の1つは、長距離の対立遺伝子特異的PCR産物の配列解析によるものである。簡単に述べると、対立遺伝子特異的プライマーを使用して、標的化される領域を増幅する。PCR産物において見いだされる一塩基変異体(SNV)はその対立遺伝子のハプロタイプを表す。対立遺伝子特異的アンプリコンは、重複した遺伝子コピーならびにCYP2D6-2D7およびCYP2D7-2D6ハイブリッド遺伝子からも生じ得る。つい最近、CYP2D6ハプロタイプをより正確に特徴付けるために、単一分子リアルタイム(SMRT)シーケンシングまたはナノポアシーケンシングなどのロングリードシーケンシング技術も使用されている;しかし、CYP2D6のロングリードシーケンシングのためのライブラリー生成が依然として限定されている。配列決定のためのCYP2D6鋳型を生成するために現在使用されているXL-PCR反応は、生成することができる産物のサイズに限界があり、プライマー特異的であり、また、複雑なハイブリッドまたは多くの公知のCNVは、その変異が以前に特徴付けられており、目的の試料中に存在することが分かっている場合を除いて捕捉されない。
【0131】
要約すると、CYP2D6は、全ての処方薬の約25%の代謝に直接関与する高度に多型的な遺伝子である。コピー数の変化を含めたこの遺伝子の遺伝子変異は、患者の薬物代謝状態に直接影響を及ぼし得る。コピー数を含む正確な遺伝子型は極めて重要であり、現行の方法体系ではこの遺伝子領域の複雑さを十分にアッセイすることができない。
【0132】
CRISPR/Cas9技術および部位特異的アダプターライゲーションをロングリードシーケンシングと組み合わせて利用して、CYP2D6解析のための診断品質の方法体系を開発するための方法が本明細書で提唱される。この手法では、単一の、試料にとらわれないCRISPR切断ステップを利用して、ロングリードシーケンシングのためのCYP2D6遺伝子座全体を単離する。この方法体系により、一塩基多型(SNP)およびCNVの両方を正確に検出すること、ならびに、最も正確な、可能性のあるフェージングされたCYP2D6遺伝子型および代謝型の状態を割り当てることが可能になる。
【0133】
in vitroおよびin vivoのどちらにおいても、CRISPR技術を使用して、目的のゲノム領域(ROI)を標的とし、それを切り出すことができる。簡単に述べると、CRISPR-C関連タンパク質9(Cas9)が、合成的に生成された標的特異的ガイドRNA(sgRNA)と複合体を形成すると、ガイドRNAの標的特異的配列に対して相補性を有する配列において二本鎖カットが創出される。ROIの両末端の配列を標的とするようにsgRNAを設計することにより、CRISPR-Cas9を使用して、メガベースの長さに至るまでであり得るDNAを切り出すことができる。
【0134】
ロングリードシーケンシング:ショートリード次世代シーケンシング(NGS)の開発によりヒト遺伝学が改革されたが、限界がよく理解されている。単離されたHMW DNA断片のロングリードシーケンシングでは、フェージング情報を得ること、小さな構造変異を同定すること、および、タンデムリピートを含めた、ゲノムの高度に複雑な領域をより良好にアセンブルすることが可能になるので、最近注目を浴びている。DNA断片を標的特異的に単離するためのCRISPR技術の使用により、ロングリードシーケンシングのためにゲノムの関連性のある領域を標的とするための革新的かつあざやかな手法がもたらされる。
【0135】
GeT-RMコホート:CYP2D6遺伝子構造を系統的に特徴付けるための主要な取り組みの一部として、アッセイ開発、検証、品質管理および技能試験のためのよく特徴付けられた参照材料の最先端のセットを確立するためにCYP2D6遺伝子型判定データが提供された。この取り組みは、Genetic Testing Reference Materials Coordination Program (GeT-RM) at the Centers for Disease Control and Prevention-based Genetic Testing Reference Material Coordination Program, the Coriell Institute for Medical Research、ならびに他のPGxコミュニティメンバーとの共同研究で行われた。この研究の一部として、複雑な構造配置および/または希少なCYP2D6遺伝子型を含有するいくつかの試料に対してPharmacoscan(商標)に基づくCYP2D6遺伝子型判定を行った。このデータをXL-PCRに基づくNGS解析と併せて使用して、これらの試料について現行の解析方法体系で可能な最も正確な遺伝子型を決定した。全ての細胞株およびコンセンサス遺伝子型判定に関する情報およびアノテーションデータにより、提唱された新しい配列決定および解析手法の検証の基礎が築かれる。
【0136】
研究設計および方法
【0137】
目的1(方法の開発):(a)後の、ゲノムヒトDNA(例えば、血液試料)におけるサイズ解析(例えば、ゲル)のためのCYP2D6-D7ゲノム遺伝子座を含有する高分子量DNAセグメントを創出するための特定のCRISPR/Cas9方法体系の最適化。(b)標的化される領域の単離/富化および配列決定のためのXL-ライブラリーの生成。(c)CYP2D6-D7ゲノム遺伝子座のゲノム変異体の長い鋳型の配列決定のためのNGS手法の確立(例えば、PacBio、MinION)。提唱されたワークフローの概略が図2に示されている。
【0138】
HMW DNAの単離:ROI(CYP2D6およびCYP2D7)の通常の長さは28~35kbである。下流の解析のためにROI全体がインタクトであることを確実にするために、NucleoBond(登録商標)Genomic DNA and RNA purification systemを使用してプロトコールを開発して高分子量gDNA(最大70kb)を単離した。改変プロトコールにより、他の方法体系を用いた場合に観察される10kb~50kbの範囲と比較して、50kbを超える分子量のgDNAを抽出することが可能になる(図3)。
【0139】
高度に特異的なsgRNAの設計および検証:CYP2D6遺伝子座の複雑で高度に多型的な性質に起因して、従来のPCRおよびアレイに基づく技術では、CNV解析およびSNP解析の両方を実施するために多数のアッセイが必要である。CYP2D6遺伝子のみを標的とするCRISPR Cas9手法では、D6/D7ハイブリッド対立遺伝子またはCYP2D6重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。この限定を克服するために、CYP2D6およびCYP2D7の両方を包含する領域の両側に隣接する独特の配列を同定した。これらの独特の領域を標的とするsgRNAを設計することにより、1つのCRISPR/Cas9切断反応を実施して、CYP2D6/CYP2D7領域全体を単離した(図4A)。
【0140】
sgRNAの特異性および有効性を確認するために、標的化されるsgRNA結合部位を含有するXL-PCR産物をgDNAから生成した。XL-PCR産物を、Cas9と一緒に、sgRNAは伴わずにインキュベートしたか(図4B、試料A)、またはCas9および異なるsgRNAと一緒にインキュベートした(図4B、試料BおよびC)。Cas9およびsgRNAと一緒にインキュベートした全てのPCR産物が切断されて、予測されたサイズのDNA断片が生じたが、異なるsgRNAにより異なる程度の切断効率が示された。
【0141】
ゲノムDNA内のCYP2D6-CYP2D7遺伝子座のカット:sgRNAは、オフターゲット認識部位を含有し得るgDNAに高い効率および特異性で結合しなければならない。CRISPRのカット効率および特異性を調べるために、ゲノムDNAをCas9と一緒に、sgRNAは伴わずにインキュベートしたか(陰性対照)、または、Cas9ならびにCYP2D6の5’およびCYP2D7の3’をカットする2種のsgRNAのプールと一緒にインキュベートした。予測される切断部位それぞれの両側に隣接するプライマーを用いてPCR反応を実施した。sgRNAが正しい結合部位に結合し、切断が起こった場合、PCR産物の減少が予想される。実際に、これが観察される(図5A図5B)。sgRNA結合部位の内側のプライマーを使用したCYP2D6遺伝子座に対するPCRも実施して、CYP2D6遺伝子内でCas9媒介性オフターゲット切断が起こるかどうかを決定した。CYP2D6内のオフターゲット切断のエビデンスは認められなかった(図5A図5B)。
【0142】
要約すると、XL-PCRおよびゲノムDNAの調査により、Cas9-sgRNA複合体により、標的化されたCYP2D6-CYP2D7遺伝子座の両側が高い効率でカットされ、遺伝子座内の著しいオフターゲット活性は伴わないことが実証された。切断により予測された28kbの断片が創出され、これを、富化後、下流のロングリードNGSのために利用することができる。
【0143】
(実施例2)
CRISPR/Cas9方法体系のさらなる最適化
【0144】
他のsgRNAおよびCas酵素を開発し、試験した。上記の通り試験するsgRNAを同定および設計するために標準のソフトウェアを使用する。目的は、ROIにおいて高い効率および特異性で切断を行うsgRNAを得ることである。より短いDNA断片が選好されるが、それでもなお、ROI全体が含有される。より短い断片には、配列決定および処理費用が低減するという利益があり得る。CRISPR Cas12a酵素を用いた同じ領域の切断も試みる。Cas12aエンドヌクレアーゼは、Cas9と同様に機能するが、異なるPAM配列要件(TTTV)を有し、切断後に5’付着突出を生じさせる。対照的に、Cas9では平滑末端が生じる。これは後のステップで重要である。
【0145】
(実施例3)
ゲノムDNA内のCYP2D6-CYP2D7遺伝子座の富化
【0146】
概念実証として、上記の切断部位CYP2D6の5’およびCYP2D7の3’を標的とするCas9-sgRNAを用いてgDNA5μgをカットした。切断されたDNAをBluePippen(Sage Science)機器で、1~50kbの範囲のサイズ選択を可能にする0.75%アガロースゲルカセットを使用して流した。溶出した試料が所望のCYP2D6-CYP2D7遺伝子座を含有することを、PCRを使用して確認した。このゲルに基づく手法では、HMW試料の単離が可能になるが、一方で、時間(Blue Pippenの実行当たり約10~12時間)、試料数が限られること(実行当たり4~5試料)、材料が著しく減少すること/回収率が不十分であること、および試料当たりの費用が高いこと(約$50.00)を含めたいくつかの欠点が存在する。
【0147】
これらの限定を克服するために、標的を富化させるためのいくつかの手法を試験する。これにより、様々な方法の長所と短所を同定すること、およびさらなる臨床試験開発のための最も適切な手法を最終的に同定することが可能になる。これは、臨床診断検査開発のための典型的な手法である。以下のロングリードシーケンシングの考察は、Oxford Nanopore(ONT)シーケンシングを指すが、プロトコールはいずれも、PacBioシーケンシング要件に合うようにわずかな改変で適合させることができる。
【0148】
方法1:標的の増幅フリー富化
【0149】
DNAの調製:この増幅フリーライブラリー調製法は、DNA試料の脱リン酸化および3’末端キャップ形成、その後、CRISPR処理および部位特異的ONTアダプターライゲーションを伴う。第1のステップにおいて、gDNAを、DNA断片の5’末端からリン酸基を除去するエビアルカリホスファターゼ、および、単一のチミジンジデオキシヌクレオチドを3’末端に付加するターミナルトランスフェラーゼで処理する。このステップにより、gDNA末端がライゲーション不可能なものになることが確実になる。次いで、DNAをCRISPR Cas9:gRNA複合体で処理し、その結果、平滑末端化した約28~35kbのCYP2D6/CYP2D7断片が生じる(詳細については前の段落を参照されたい)。この後、DNAポリメラーゼを用いてアデノシンヌクレオチドをDNAの遊離の3’末端(例えば、ddTTPでキャップ形成されていない末端)に付加する「Aテール付加」ステップを行う。最後に、チミジン突出を有するONTアダプターをDNAに付加する。CRISPR-Cas9による切断によって生じたDNA末端は相補的な3’突出および5’リン酸基を有する唯一の末端であるので、このDNA末端のみがアダプターにライゲーションする。
【0150】
配列決定:得られたライブラリーの配列をONT機器で直接決定する。この方法によって生成されたDNAライブラリーの数量ではONTシーケンシングの難易度が高いことが判明した場合、これは、試料を配列決定の前に多重化することによって、および/または入力gDNAの数量を増加させることによって克服することができる。さらに、試料をエキソヌクレアーゼで処理し(ONTアダプターはエキソヌクレアーゼIIIおよびラムダエキソヌクレアーゼに対して抵抗性である)、その結果、全てのバックグラウンドDNAの分解をもたらすことにより、バックグラウンドを低減することができる。
【0151】
方法2:in vitro転写を使用した富化
【0152】
理論的根拠:前の手法で十分なDNAを生成することができなかった場合、またはバックグラウンドDNAが過剰に存在する場合、in vitro転写(IVT)による標的化増幅という代替手法を評価する。IVTにはPCRに対する利点がいくつかある。(1)転写により誤りが伝播する可能性がより低い。(2)転写により、最長距離PCR産物のサイズよりも長い20~30kbもの長さのRNA分子を産生させることができる。
【0153】
DNAの調製:CRISPRによる切断後、DNAをエキソヌクレアーゼで処理して付着末端を生成し、T7プロモーターおよびCYP26-CYP2D7遺伝子座の付着末端に相補的な突出を含有する二本鎖DNA断片を標的断片とライゲーションする。DNAポリメラーゼおよびDNAリガーゼを使用してギャップを埋め、あらゆるニックをふさぐ。ファージT7 RNAポリメラーゼにより約20kbもの長さの転写物を産生させることができる。プロモーターは約28kbの遺伝子座の両末端にライゲーションするので、遺伝子座の末端のプロモーターからT7 RNAポリメラーゼによって産生される最長転写物は、領域全体を包含するのに十分に長くなり得る。しかし、T7産物の大部分は一般には4kb未満の長さである。最近発見されたSyn5シアノファージRNAポリメラーゼは、30kbもの長さの転写物を産生することができる。Syn5プロモーターをT7プロモーターと一緒に試験する。
【0154】
in vitro転写:T7 RNAポリメラーゼおよびSyn5 RNAポリメラーゼを用いてIVTを実施する。前者の酵素は市販されているが、後者の酵素は本発明者らの研究室で発現させ、精製したものである。長いRNA転写物を産生させるために最適化された市販のT7 RNAポリメラーゼIVTキットがいくつか存在する。以前の研究により、ヒトゲノムにランダムに挿入されたT7プロモーター配列によりIVTの間に5kbよりも大きなRNA転写物がかなりの分率で産生されることが示されている。全RNA収率、大きな転写物(>15kb)の割合および誤り率が、いずれのポリメラーゼおよびIVT法がより優れた選択肢であるかの決定において重要な因子である。広範囲の長さのRNA転写物が産生される可能性があるので、SPRIビーズを使用して最も大きな転写物を選択することができる。RNAの配列をONT機器で直接決定する。
【0155】
方法3:in vitro転写のためのプロモーターの多部位への導入
【0156】
理論的根拠:上記の手法が不十分である場合、T7またはSyn5プロモーターを標的化される領域にわたって多数の部位に挿入する。この手法の潜在的な問題は、遺伝子座の断片化により、変異体をCYP2D7またはCYP2D6に明確に割り当てること(遺伝子と偽遺伝子は約94%の配列同一性を共有するため)、およびフェージング情報を引き出すことの難易度が高くなることである。この限定を克服するために、多数の粘着挿入部位を使用して重複する断片を生成する。
【0157】
プロモーターの導入:CRISPRによる切断は、遺伝子座内のROIの両側に隣接する部位および規則正しく間隔のあいた(約10kb)離れた部位において起こる。切断はそれぞれ異なる標的部位のセットを用いる2つの別々の反応で行われ、したがって、配列決定後に、得られた重複する断片を使用してリードを繋ぎ合わせることができる。エキソヌクレアーゼによる処理、プロモーターを含有するアダプターのライゲーション、IVT、およびcDNA合成は上に記載されている。プロモーターを含有するアダプターは、プロモーターのすぐ下流に短い固定された配列を含有する。cDNA合成を実施した際にはこの固定された配列に対する相補性を有するプライマーが逆転写(RT)に使用される。IVTによって産生されたRNAが2つの挿入部位間の長さにわたる場合、この配列に特異的なRTプライマーにより同じ領域にわたるcDNA分子が選択される。
【0158】
潜在的代替:必要であれば、各IVT産物の始めに固定された配列を使用する長距離PCRを数サイクル使用して、挿入部位にわたるcDNA分子を選択的に増幅することができる。
【0159】
潜在的代替:ONTによるRNAの配列決定には、大量のRNAが必要である。必要であれば、転写開始から遠い部位(15~20kb)にアニーリングするプライマーを用いてcDNA合成を実施して、長い転写物を選択する。相当な割合のシーケンシングリードが標的遺伝子座にマッピングされない場合、アダプターの非標的部位とのライゲーションの防止を試みる。CRISPR処理前のgDNAの脱リン酸化、およびgDNAの末端にいわゆる「ダンベル」アダプターでキャップ形成することが2つの可能性のある選択肢である。
【0160】
(実施例4)
変異体の長い鋳型配列決定のためのNGS手法の確立
【0161】
方法:現在のところ、潜在的な診断検査の開発に適用できる主要な市販のプラットフォームが2つ存在する。PacBioは、ロングリードシーケンシングのための最初の卓越した技術であるが、付随する費用が甚大である。つい最近、費用効果が大きな潜在的に実行可能なプラットフォームとしてナノポアシーケンシング技術が登場した。Oxford Nanopore(ONT)はプラットフォームとして、スループット、費用および正確度に関して成熟を続けている。したがって、これらの利点があるので、ONTに焦点が当てられている。それにもかかわらず、提唱された方法体系および方法は、主にプラットフォームによらず、現行の2つのまたは今後のロングリードプラットフォームのいずれにも合うように改変することができる。配列決定実行をOxford Nanopore MinIONで実施することができる。
【0162】
目的2(検証):(a)ロングリード配列アラインメントのための現行のソフトウェアおよびプラットフォームを使用して配列解析を実施して、変異体コーリング、CNV解析およびフェージングを実施する。(b)CYP2D6-D7ロングリード配列解析結果を配列/コピー数変異と比較し、コンセンサス遺伝子型判定およびアノテーションの結果をGet-RMプロジェクトからの結果と共に特徴付けて、性能特性およびさらなる診断検査開発に向けたガイダンスを推定する。各方法の実現性を、時間対効果および費用対効果、必要なステップの最小化ならびに結果の質に関して試験し、比較する。包括的な目的は、CYP2D6遺伝子全体の単離、富化、および配列決定に最も適した方法を選択することである。
【0163】
検証のための試料の選択:試料調製法が開発されたら、既知の遺伝子型およびハプロタイプを有する追加的な試料の増大させたセットを解析する。増大させたデータセットに対してプラットフォームを評価するために、重複、ハイブリッド、選択された欠失、および複雑な再構成などの複雑な構造を有する試料を含める。試料は、GeT-RMプロジェクト(上の「The GeT-RMコホート」を参照されたい)から選択される。これらの細胞株およびデータにより、新規のロングリード配列データを現行のゴールドスタンダードと対照して評価することが可能になるので、独特のリソースがもたらされる。この提唱のために、これらの細胞株のサブセットを取得した-LCL細胞株。細胞株リポジトリ由来のおよび既存の共同研究による他の関連性のある変異体およびハプロタイプを特徴付けるための追加的な試料を得る。追加的な試料を用いて方法体系をさらに検証するために、全ゲノム配列決定を含め、広範囲にわたって特徴付けられているNIST Coriellコホート由来の追加的な細胞株を利用する。さらに、全血および唾液を含めた、典型的な診断用検体を代表する追加的な試料型を取得する。重複、欠失、ハイブリッドおよびタンデム配置を表す全部で48の細胞株をこの目的での配列決定のために選択する。解析を2連で、合計96の配列決定された試料について行う。
【0164】
変異体コーリング、CNVコーリング、およびフェージング:ロングリードONTデータのために特別に開発されたソフトウェアパッケージを使用する。Clairは、変異体の型、接合性、代替対立遺伝子および挿入/欠失の長さを予測するためのマルチタスク5層畳み込みニューラルネットワークモデルであるClairvoyanteに対する最新のアップデートである。最近開発された追加的なパッケージはMegalodonである。Megalodonの機能性は、情報量の多いニューラルネットワークに基づくコーリングを参照配列に繋げることに重点が置かれている。Nanopore技術の性能特性が最近Bowdenらによって標準の参照試料を使用した全ゲノム配列決定について評価された。82×カバレッジでのコンセンサス正確度は99.9%であったが、データからはこのプラットフォームの現行の限定もいくつか示されている。提唱されているのはほんの小さな標的化される領域を配列決定することであるので、また、領域を極めて深く配列決定する能力を考慮すると、現行の解析プラットフォームにより、標的化される配列の十分に正確なデータが生じることが予想される。今後のソフトウェア開発もモニタリングし、新しい方法が利用可能になり次第、それを利用する。
【0165】
コンセンサスデータとの比較:データをGeT-RMコンセンサス結果(全てのプラットフォームからの結果、ならびに専門家チームによる変異体の精査に基づく)と比較する。ハプロタイプコーリングSNPおよびCNVについての一致を決定し、ハイブリッドハプロタイプの配列の特色を同定する能力を評価し、代謝型の状態を決定するための一致を測定する。次に、追加的な変異体をGeT-RMプロジェクトからの遺伝子型判定データと比較する。データをフェージング情報(例えば、決定されたハプロタイプ)と併せて解析して、フェージングされた遺伝子型判定データが結果と一致するかどうかを決定し、これにより、非帰属フェージング情報がもたらされる。最後に、配列決定単独で同定される任意の追加的な変異体を同定する。CYP2D6とその偽遺伝子の間の配列類似性に関する探索的配列比較も実施する。
【0166】
予測される問題:問題の1つは、配列決定プラットフォームの全体的な正確度に関する。最初の手法は、極めて深く配列決定することである。この手法により、非系統的な配列決定の誤りを決定することは可能になるはずであるが、プラットフォームの技術的制約に起因する固有の誤りを決定することはより難しい。CYP2D6参照試料のコンセンサスデータとの比較により、この影響を推定することが可能になる。さらに、ONTプラットフォームおよび改善された配列解析方法に関するさらなるベンチマーク試験により、ロングリードデータについての配列アノテーションが増大することが予測される。
【0167】
今後の方向:薬理遺伝学においては、CYP2D6は最も広く試験されている遺伝子の1つとして突出しているが、一方で、現行の試験技術を使用した解析の技術的難易度が高い。最終目的は、不完全であり誤りを生じやすい現行のプラットフォームから置き換えることが可能な統一的な臨床試験法を開発することである。本出願は、CRISPRに基づく配列標的化、革新的な断片富化およびロングリードシーケンシングが実行可能な手法であることの概念実証としての機能を果たす。
【0168】
(実施例5)
【0169】
解析のための特定のゲノム遺伝子座の標的化
【0170】
この手法では、PCRまたはオリゴヌクレオチドハイブリダイゼーションなどの伝統的な方法と比較して、目的の領域(ROI)のみを標的化カットするためにCRISPR/CAS9系と遺伝子座特異的ガイドRNAを使用する。富化領域選択およびsgRNA設計の新規の手法により、高度に類似した偽遺伝子および反復領域を含む遺伝子座全体を捕捉することが可能になる。そのような領域の例が図1に示されている。
【0171】
現行の問題
【0172】
反復領域(例えば、REP6など)を含み、近接する偽遺伝子と高い配列類似性を共有するCYP2D6などの高度に多型的な遺伝子に対する一般的なDNA抽出方法体系および配列決定手法には多くの欠点がある。これらの問題としては、PCRにより導入される誤り、PCRで捕捉可能なサイズの限定、オフターゲットアレイハイブリダイゼーション、多数のアッセイが必要なこと(例えば、配列決定+qPCRを用いたCNV解析)、オフターゲットアラインメント、変異体フェージングの欠如ならびに金銭的負担および時間的負担が大きいことが挙げられる。図6では、NGSにより配列決定された伝統的に調製されたライブラリー6例のIGVアラインメントが強調されている。これらのライブラリー(A~F)はCYP2D6長距離PCR(XL-PCR)アンプリコンから生成された。アンプリコンを、NGS解析の前に断片化(100~300bp)、アダプターライゲーション、およびPCR増幅に供した。この手法にはいくつかの限定がある。第1に、CYP2D6について示されている通り、各試料中のCYP2D6遺伝子を増幅するために、CYP2D6のコピー数の状態およびハイブリッド対立遺伝子が存在するか否かがXL-PCRの前に分かっていなければならない。正常な対立遺伝子、重複対立遺伝子、欠失対立遺伝子およびハイブリッド対立遺伝子それぞれに対して特異的なプライマーを使用しなければならない。これにはNGSの前に追加的なコピー数アッセイを実施する必要がある。さらに、XL-PCR増幅時間は一般には標的アンプリコンの長さ1kb当たり0.5~1時間である。
【0173】
ショートリード配列データの解析は、フェージング能力の低下によっても妨害され、また、高度に類似した偽遺伝子または相同な領域との、例えば、図1に示されている通り、CYP2D6と94%類似したCYP2D7偽遺伝子とのオフターゲットアラインメントを起こしやすい。さらに、同じ遺伝子の異なるハプロタイプは、偽遺伝子との類似性のレベルが異なり得、変異体を正しくアラインメントすることができない。
【0174】
PCRフリーライブラリーには、従来のPCRに基づく手法と比べて著しい利益がある。PCRフリーライブラリーではPCR由来の配列の誤りが導入される潜在性が取り除かれ、最大PCR産物サイズの現行の限定が克服される。XL-PCR反応時間が除かれ、これは著しい時間の短縮を表し、また、この手法ではヘテロ接合性変異体フェージングおよびコピー数変異(CNV)の検出が可能になる。
【0175】
sgRNAの設計
【0176】
上記の通り、CYP2D6遺伝子座の複雑で高度に多型的な性質に起因して、従来のPCRおよびアレイに基づく技術では、CNV解析およびSNP解析の両方のために多数のアッセイを実施する必要がある。抽出および試料の取扱いの間のDNAせん断に起因して、富化のためのインタクトな標的領域の量を最大にするために、目的の遺伝子を捕捉するために直感的に最小の可能性のあるCRISPR/Cas9標的領域を選択する。しかし、CYP2D6遺伝子のみを標的とするCRISPR/Cas9手法では、検出される対立遺伝子の少なくとも20%を構成する、D6/D7ハイブリッド対立遺伝子またはCYP2D6重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。妥当なガイドRNA設計のための高度に複雑な要件の例が図7A~7Cに示されている。
【0177】
第1の設計の限定は、Cas9複合体をROIにターゲティングするためのRNAをCYP2D6遺伝子自体の近くに設計することができないことである。これには、2つの主要な理由がある。第1の理由は、CYP2D6の両側に隣接するCYP2D7と同一ではない独特の配列の部位が限定されていることである。そのような独特の配列の部位は、十分に機能しないまたは重要なプロモーター領域の変異を捕捉することができる反復領域を含有する。第2の理由は、CYP2D6 CNVまたはD6/D7もしくはD7/D6ハイブリッド対立遺伝子が存在する場合、追加的なカットが生じ、正確なCNV解析および配列アラインメントができなくなることである(図7A)。CYP2D7およびCYP2D8の付近をカットする手法の同様の限定がそれぞれ図7Bおよび図7Cに示されている。
【0178】
これらの限定を克服するために、CYP2D6、CYP2D7およびCYP2D8のいずれも包含する領域の両側に隣接する、それでもなお長距離配列解析のための妥当なサイズのカット断片を生成する独特の配列を同定した。これらの独特の領域を標的とするsgRNAを設計することにより、1つのCRISPR/Cas9切断反応を実施して、CYP2D6/CYP2D7/CYP2D8領域全体を単離する(図8)。さらに、下流の適用に応じて、設計は、sgRNAがROIの5’末端を標的とするものであるのかまたは3’末端を標的するものであるのかに応じて正しい鎖(+または-)を標的とするものでなければならない。試験されるsgRNA配列の非限定的な例を以下の表2に示す。CYP2D6は-鎖にコードされるが、ガイドRNAの位置(上流または下流)は+鎖に対して参照される。染色体上の位置が低い配列はさらに上流であるとみなされ、染色体上の位置が高い配列は下流であるとみなされる。
【表2-1】
【表2-2】
【表2-3】
【0179】
sgRNAの性能解析および検証
【0180】
sgRNAの特異性および有効性を確認するために、標的化されるsgRNA結合部位を含有するXL-PCR産物をgDNAから生成した。XL-PCR産物を、Cas9+sgRNAなし(もしくはオフターゲットsgRNA)またはCas9+目的のsgRNAと一緒にインキュベートした。図9Aは、多数の反応時点における2つの異なるsgRNA(T_1およびT_2)のカット効率を示す代表的なアガロースゲルを示す。Cas9およびsgRNAと一緒にインキュベートした全てのPCR産物が切断されて、予測されたサイズのDNA断片が生じたが、異なるsgRNAでは異なる程度の切断効率が示された。
【0181】
XL-PCRアンプリコンの切断効率の決定後、ゲノムDNAに対する切断効率を解析した。これは、特定のsgRNAを用いたCas媒介性カットを実施し、次いで、カットされたDNAに対して定量的PCR反応を実施することによって行った。予測されるsgRNA標的カット部位の両側に対してプライマーを設計した。Cas9反応または未カット対照のいずれかからの総ゲノムDNA100ngに対してPCR反応を実行した。DNAが妥当な部位で切断された場合、未カット対照試料(例えば、オフターゲット領域に対するsgRNAを使用したCas9反応)で生成されるPCR産物の量と比較してPCR産物の減少が観察される。図9Bおよび図9Cに示されている通り、この手法を使用して、sgRNAによりゲノムDNA内の所望のROIを標的化することができたかどうかを決定し、そのカットの効率を決定した。CYP2D6遺伝子全体のXL-PCRにより、カットと未カット対照の間に差異は示されなかった。これにより、反応にわたってカット部位において観察されたPCR産物の量の減少がDNAのランダムなカットに起因するのではなく、これらの特定の領域の標的化Cas9媒介性カットに起因することが示される。
【0182】
高分子量(HMW)DNAの単離
【0183】
長いセグメント(≧50kb)の高分子量ゲノム(HMW)DNAの単離により、PCR増幅を伴わずに配列決定ライブラリーを生成することが可能になる。図10に示されている通り、HMW DNAを社内でリンパ芽球細胞(18959および19213)からNanobind CCB Dig DNA kit(Circulomics、Madison Wi)を使用して抽出した。抽出されたDNAを2%アガロースゲルに流し、サイズをラムダHINDIIIラダー(上のバンド、23.1kb)、ラムダDNA(48.5kb)、およびCorriel Instituteから取得した以前に抽出されたゲノムDNA(代替の方法体系によって抽出されたもの)と比較した。社内で抽出したDNAのサイズは他の方法体系によって抽出されたDNAよりも有意に大きく(例としてCoriell gDNA 18996)、大多数の実行が48.5kbのラムダDNAを上回った。高分子量DNAのさらなる富化をShort Read Eliminator Kit(Circulomics、Madison Wi)を用いて行った。
【0184】
CRISPR/Cas9富化およびライブラリー調製
【0185】
上記のsgRNAを用いたCRISPR/Cas9富化をNanopore Cas媒介性プロトコール(VNR_9084_v109_revK_04Dec2018)の改変バージョンを使用して実施した。プロセスに使用するsgRNAの体積および濃度の改変を行って最適な結果を実現した(具体的にはsgRNA当たり33.3μlのsgRNA(3μM))。アンプリコンを使用し、ライゲーションプロトコール(SQK-LSK109)によってアダプターをライゲーションし、配列決定のための調製されたライブラリーにMinION配列決定プラットフォーム(Oxford Nanopore、UK)を実行し、データ解析を実施した。
【0186】
概念実証
【0187】
CYP2D6-CYP2D7-CYP2D8領域全体(chr22:42,122,115-42,161,317)を富化させるsgRNAを利用した配列決定により、3つの重要な事柄が確認される:(1)このsgRNA設計により標的領域全体が首尾よく捕捉されること、(2)この戦略によりROI全体をオフターゲットリードと比べて有意に富化させることが可能になること、および(3)この方法によりROI全体(約40kb)を首尾よくロングリード配列決定する能力がもたらされること。
【0188】
図11Aに示されている通り、ゲノム全体で、標的化されるROIを含有する22番染色体(chr22)についてのみ著しい配列富化が観察された。他の全てのゲノム領域では最小のカバレッジが示された。chr22のさらなる解析により、ROIを含有する領域のみが富化され、>10×カバレッジを有することが見いだされた(図11B)。全部で、chr22にマッピングされた176リードのうち121リードがROIとアラインメントされる全長リードであった(68.75%)。全ての22番染色体リードについてのリード当たりの平均正確度および同一性が図11Bに示されている。
【0189】
実行アラインメントおよび時間
【0190】
アラインメントされたリード長の中央値は約39.35kb(図12A)であり、これにより、標的設計サイズの配列決定およびアラインメントが上首尾であったことが示される。注目すべきことに、アラインメントされたリードの全てがminIONでの配列決定の最初の2.5時間のうちに捕捉された(図12B)。これにより、本明細書に記載の方法を使用した配列決定時間を標準のロングリードシーケンシング実行時間よりも著しく短縮することができることが示される。これには結果ターンアラウンドタイムおよび機器のスループットの両方に関して大きな価値がある。
【0191】
IGV解析
【0192】
配列データアラインメントのさらなるIGV解析により、シーケンスリードが正しいゲノム内位置(chr22:42,122,115-42,161,317)にアラインメントされ、ROI全体にわたって均一な深さおよびカバレッジを有することが示された。図13は、標的CYP2D6領域にアラインメントされる121の38.5kbのリードのIGVアラインメントを示す。この手法の特異性をさらに精査するために、逆のDNA鎖(+または-)の標的領域におけるsgRNA富化を実施し、配列データアラインメントを元の鎖設計でのsgRNA富化と比較した。図14に示されている通り、sgRNA鎖標的に応じてCYP2D6-CYP2D7-CYP2D8領域(chr22:42,122,115-42,161,317-図に赤色で示されている)または両側に隣接する領域(青色で示されている)のいずれかのROIにおいて100%の配列富化が生じた。設計に応じて両側に隣接するオフターゲット領域との重複は観察されなかった。これにより、この手法の2つの極めて重要な点が実証される:(1)本発明者らの設計ROI内で著しいオフターゲットカットは生じないこと、および(2)富化手法によりROIの著しいせん断は導かれないこと。
【0193】
本開示の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本開示から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の本開示の実施形態に対する種々の代替を本開示の実施形態の実施に使用することができることが理解されるべきである。以下の請求項により本開示の範囲が規定されること、ならびに、それにより、これらの請求項の範囲内に入る方法および構造およびそれらの均等物が包含されることが意図されている。
図1
図2
図3
図4
図5
図6
図7A
図7B
図7C
図8
図9A
図9B-C】
図10
図11A
図11B
図12A
図12B
図13
図14
図15
【配列表】
2022551202000001.app
【国際調査報告】