IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドピクサスの特許一覧

特許7405485部位特異的核酸を用いた核酸濃縮と続いての捕捉方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】部位特異的核酸を用いた核酸濃縮と続いての捕捉方法
(51)【国際特許分類】
   C12N 15/10 20060101AFI20231219BHJP
   C12N 15/09 20060101ALI20231219BHJP
   C12Q 1/6806 20180101ALI20231219BHJP
   C12Q 1/34 20060101ALI20231219BHJP
【FI】
C12N15/10 Z
C12N15/09 100
C12Q1/6806 Z ZNA
C12Q1/34
【請求項の数】 25
(21)【出願番号】P 2021534625
(86)(22)【出願日】2019-12-12
(65)【公表番号】
(43)【公表日】2022-06-06
(86)【国際出願番号】 EP2019084983
(87)【国際公開番号】W WO2020120711
(87)【国際公開日】2020-06-18
【審査請求日】2022-06-27
(31)【優先権主張番号】18306679.4
(32)【優先日】2018-12-12
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】521259507
【氏名又は名称】ドピクサス
(74)【代理人】
【識別番号】100107342
【弁理士】
【氏名又は名称】横田 修孝
(74)【代理人】
【識別番号】100155631
【弁理士】
【氏名又は名称】榎 保孝
(74)【代理人】
【識別番号】100137497
【弁理士】
【氏名又は名称】大森 未知子
(74)【代理人】
【識別番号】100207907
【弁理士】
【氏名又は名称】赤羽 桃子
(74)【代理人】
【識別番号】100217294
【弁理士】
【氏名又は名称】内山 尚和
(74)【代理人】
【識別番号】100107342
【弁理士】
【氏名又は名称】横田 修孝
(74)【代理人】
【識別番号】100155631
【弁理士】
【氏名又は名称】榎 保孝
(74)【代理人】
【識別番号】100137497
【弁理士】
【氏名又は名称】大森 未知子
(74)【代理人】
【識別番号】100207907
【弁理士】
【氏名又は名称】赤羽 桃子
(74)【代理人】
【識別番号】100217294
【弁理士】
【氏名又は名称】内山 尚和
(72)【発明者】
【氏名】ウレット、ジミー
(72)【発明者】
【氏名】マレンダ、ジェローム
【審査官】藤山 純
(56)【参考文献】
【文献】特表2018-523977(JP,A)
【文献】米国特許出願公開第2016/0208241(US,A1)
【文献】米国特許第10081829(US,B1)
【文献】国際公開第2016/100955(WO,A2)
【文献】国際公開第2016/186946(WO,A1)
【文献】国際公開第2018/013840(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/10
C12N 15/09
C12Q 1/6806
C12Q 1/34
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
核酸標的領域を核酸分子の集団から単離する方法であって、
a)前記核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させる工程であって、前記gRNAが、前記標的領域に隣接する第1の部位に相補的であるガイドセグメントを含み、それによってクラス2タイプV Casタンパク質-gRNA-核酸複合体を形成する、工程と、
b)前記クラス2タイプV Casタンパク質-gRNA-核酸複合体を含む核酸分子の集団を、一本鎖3’~5’エキソヌクレアーゼ活性を有する少なくとも1つの酵素と接触させ、それによって、前記第1の部位に5’一本鎖オーバーハングを形成する工程と、
c)前記工程b)の集団から前記クラス2タイプV Casタンパク質-gRNA複合体を除去する工程と、
d)前記工程c)の集団をオリゴヌクレオチドプローブと接触させる工程であって、前記プローブが、前記オーバーハングと少なくとも部分的に相補的な配列を含み、それによって、前記プローブと前記オーバーハングとの間に二重鎖を形成し、前記工程c)の集団をFEN1酵素及びリガーゼと接触させることを更に含む、工程と、
e)前記工程d)の核酸分子の集団から前記二重鎖を単離することにより、前記核酸標的領域を単離する工程と、を含む、方法。
【請求項2】
前記クラス2タイプV Casタンパク質が、Cas12a又はC2c1である、請求項1に記載の方法。
【請求項3】
前記核酸分子の集団を、工程c)の前に、部位特異的エンドヌクレアーゼと接触させることを更に含む、請求項1又は2に記載の方法。
【請求項4】
前記部位特異的エンドヌクレアーゼが、TALEN、ジンクフィンガータンパク質、又はクラス2 Casタンパク質-gRNA複合体である、請求項3に記載の方法。
【請求項5】
前記部位特異的エンドヌクレアーゼが、第2のクラス2タイプV Casタンパク質-gRNA複合体であって、前記gRNAが第2の部位に相補的なガイドセグメントを含み、前記第2の部位が前記標的領域に隣接し、前記第1の部位及び前記第2の部位が前記標的領域の両側に位置する、請求項3又は4に記載の方法。
【請求項6】
前記部位特異的エンドヌクレアーゼが、第2のクラス2タイプV部位特異的エンドヌクレアーゼである場合、前記集団を、前記第2の部位において第2の5’一本鎖オーバーハングに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドプローブと接触させ、それによって第2の二重鎖を形成する、請求項5に記載の方法。
【請求項7】
一本鎖3’~5’エキソヌクレアーゼ活性を有する前記少なくとも1つの酵素が、エキソヌクレアーゼI、S1エキソヌクレアーゼ、エキソヌクレアーゼT、及びエキソヌクレアーゼVIIを含む群から選択される、請求項1~6のいずれか一項に記載の方法。
【請求項8】
一本鎖3’~5’エキソヌクレアーゼ活性を有する前記少なくとも1つの酵素が、エキソヌクレアーゼIである、請求項1~7のいずれか一項に記載の方法。
【請求項9】
記核酸分子の集団を工程b)の前又は間に断片化することを更に含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記核酸分子の集団が、前記核酸分子の集団を少なくとも1つの部位特異的エンドヌクレアーゼと接触させることによって断片化され、前記部位特異的エンドヌクレアーゼが、
前記標的領域又は前記第1の部位内で切断せず、及び
前記分子が第2の部位を含む場合、前記第2の部位内で切断しない、
請求項9に記載の方法。
【請求項11】
前記部位特異的エンドヌクレアーゼが、制限酵素である、請求項10に記載の方法。
【請求項12】
工程c)が、前記核酸分子の集団を、EDTA及び/又は少なくとも1種のプロテアーゼと接触させることを含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記プロテアーゼが、セリンプロテアーゼである、請求項12に記載の方法。
【請求項14】
前記セリンプロテアーゼが、プロテイナーゼKである、請求項13に記載の方法。
【請求項15】
前記プローブがさらにリガンドを含み、前記リガンドが捕捉剤に結合することができ、前記プローブが、任意選択で、少なくとも1つのウラシル塩基、脱塩基部位、又は制限部位を含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
工程e)が、前記二重鎖を捕捉剤と接触させることを含む、請求項15に記載の方法。
【請求項17】
前記捕捉剤が、固体支持体に固定される、請求項16に記載の方法。
【請求項18】
前記標的領域から前記二重鎖を遊離することを更に含、請求項1~17のいずれか一項に記載の方法。
【請求項19】
前記標的領域から前記二重鎖を遊離することが、前記二重鎖内で切断することを含む、請求項18に記載の方法。
【請求項20】
前記第1及び第2のプローブが、異なるリガンドを含み、前記リガンドが異なる捕捉剤に結合する、請求項に記載の方法。
【請求項21】
工程e)が、
前記第1の二重鎖を第1の捕捉剤と接触させることであって、前記第1の捕捉剤が前記第1のプローブの前記リガンドに結合する、ことと、
前記標的領域から前記第1の二重鎖を遊離することと、
前記第2の二重鎖を第2の捕捉剤と接触させることであって、前記第2の捕捉剤が前記第2のプローブの前記リガンドに結合する、ことと、
前記標的領域から前記第2の二重鎖を遊離することと、を含む、請求項20に記載の方法。
【請求項22】
前記標的領域が、反復領域、再配列、重複、転座、欠失、又はエピジェネティック修飾などの修飾された塩基、ミスマッチ、又はSNPを含む、請求項1~21のいずれか一項に記載の方法。
【請求項23】
少なくとも2つの標的領域が単離される、請求項1~22のいずれか一項に記載の方法。
【請求項24】
少なくとも5、10、20、50の標的領域が単離される、請求項1~23のいずれか一項に記載の方法。
【請求項25】
少なくとも100の標的領域が単離される、請求項1~24のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
序論
本発明は、核酸単離及び濃縮の方法に関する。実際に、標的核酸の単離及び濃縮は、核酸の研究における重要な第1の工程を表し、核酸量及び品質の両方に影響を及ぼし、これは、下流用途(例えば、感度、被覆率、堅牢性、及び再現性)で得られるデータの品質に直接影響する。これは、特定の標的核酸のみがより複雑な混合物から分析される用途、又は低量の標的核酸が存在する場合に特に重要である。一例として、ヒト「エクソーム」(タンパク質をコードする領域)は、全ゲノムの約1%を占めるにすぎないが、遺伝病に関連することが知られているDNA変異の85%を保有する。したがって、単離及び濃縮は、診断及び遺伝的リスク評価などのエクソームに関連する臨床用途を特に対象とする。
【0002】
対象となる核酸標的が少ない場合であっても全ゲノム解析を使用してもよいが、技術的、経済的、及び/又は時間的制約のために、ゲノム全体を配列決定することは多くの場合、実行不可能である。更に、全ゲノム配列決定は、生成された大量のデータを分析するために、非常に高い計算能力及び記憶装置を必要とする。したがって、核酸分子の特定のサブセットに分析を制限するために、核酸単離が望ましい。
【0003】
これまで、特定の核酸断片のサブセットを単離するために使用される主なアプローチは、ハイブリッド捕捉及び/又は標的増幅技術に基づいている(例えば、Mertes et al.,Brief Funct Genomics,2011,10(6):374-86及び国際公開第2016/014409号を参照)。しかし、ハイブリッド捕捉の現在の方法は、濃縮効率が低く、捕捉の15~25%がオフターゲットであり(Garcia-Garcia,Sci Rep.,2016,6:20948)、概して、少なくとも2回の選択を必要とする。核酸はまた、捕捉前に変性され、それによって、2本の鎖の相補性を介して、又は相補鎖自体の相補性を介してコードされる任意の情報を除去する。ハイブリッド捕捉を使用する場合、増幅は、核酸材料の量を増加させるために必要とされることも多い。しかし、増幅は、増幅される断片のAT:GC比及び二次構造に依存してバイアスを発生させ、増幅されたフラグメントの長さが増加するにつれて効率が低下する。更に、プライマー交差反応性により、多重化様式で増幅することができる標的領域の数は制限される。加えて、元の配列に存在する全ての化学修飾(例えば、塩基修飾)は、増幅プロセス中に失われる。最後に、増幅は、アーティファクト(すなわち、望ましくない又は非特異的な核酸配列)又は核酸内のエラーを導入することがある。
【0004】
これらの制限を考慮すると、標的核酸の単離及び/又は濃縮の新たな方法、具体的には、対象となる元の核酸分子の特徴(例えば、塩基修飾などの化学修飾、及びミスマッチ又はSNPなどの核酸配列情報)を保存し、複数回の選択を必要とせず、核酸配列決定などの下流分析技術と適合する核酸単離及び濃縮の方法が必要とされている。
【発明を実施するための形態】
【0005】
本発明を詳細に説明する前に、本発明は特に例示される態様に限定されるものではなく、当然ながら変化してもよいことを理解されたい。本明細書で使用される用語は、本発明の特定の実施形態を説明することのみを目的としており、限定することを意図するものではないことも理解されたい。
【0006】
本明細書に引用される全ての刊行物、特許、及び特許出願は、上記又は下記にかかわらず、参照によりその全体が本明細書に組み込まれる。更に、本発明の実施は、他の別段の指示がない限り、当業者の技術の範囲内である、タンパク質化学、分子生物学、微生物学、組み換えDNA技術、及び薬理学の従来の技術を使用する。このような技術は、文献に完全に説明されている。例えば、Ausubel et al.,Current Protocols in Molecular Biology,Eds.,John Wiley & Sons,Inc.New York,1995,Remington’s Pharmaceutical Sciences,17th ed.,Mack Publishing Co.,Easton,Pa.,1985、及びSambrook et al.,Molecular cloning:A laboratory manual 2nd edition,Cold Spring Harbor Laboratory Press-Cold Spring Harbor,NY,USA,1989を参照。
【0007】
後の請求項及び先立っての説明において、単語「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、及び他の変形形態が包括的な意味で使用され、すなわち、記述された特徴の存在を指定するために、言語又は必要な意味を表すことにより文脈に特段に必要とされる場合を除いて、本発明の様々な実施形態における更なる特徴の存在又は追加を除外するものではない。更に、本明細書で使用する場合、用語「a」、「an」、及び「the」は、本出願の内容がそうでないことを明確に指示しない限り、複数形を含む。したがって、一例として、「標的領域」は、2つ以上の標的領域も含む。
【0008】
第1の態様では、本発明は、核酸分子の集団からの核酸標的領域を単離するための新規方法に関し、当該方法は、当該集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させ、続いて一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素と接触させることを含む。実際に、本発明者らは、驚くべきことに、これらの工程が、少なくとも9ヌクレオチド長の5’一本鎖オーバーハングを有する核酸分子を生成することを見出した。その結果、ハイブリッド捕捉などの捕捉方法は、有利には、オリゴヌクレオチドを当該オーバーハングにハイブリダイズさせ、それにより、隣接する標的領域を特異的に濃縮することにより実施されてもよい。有利には、対象となる標的領域のみが、標的となるクラス2タイプV Casタンパク質-gRNA複合体として単離され、高度に特異的な部位で切断され、これは、ゲノム全体で1回のみ発生してもよい。注目すべき対照では、制限酵素は、より短い、したがって所与の配列内に複数回存在する部位を認識し、切断し、更に、比較的短いオーバーハング(例えば、3塩基)を生成する。
【0009】
本方法は、本方法の全ての工程において元の核酸分子が無傷のままであるため、標的核酸の全ての特性(例えば、化学修飾、ミスマッチ)が保存されるので、現在の方法よりも非常に有利である。ハイブリッド捕捉の既存の方法とは対照的に、本方法を介して単離された核酸は変性される必要はない。本方法では増幅工程が不要であるため、バイアスも低減される。加えて、多重アッセイは、プライマー相互作用又は交差認識のリスクがない状態で、容易に設計することができる。核酸標的単離の効率が高く、良好な特異性を有するため、標的増幅を伴わずに、より小さい試料サイズ、及び低濃度の標的核酸を有する試料を本方法で使用してもよい。有利には、単離は、単回のみが実施されるときに十分である。更に、全ての工程を同じ容器内で実施することができるため、この方法は単純であり、従来技術の方法と比較してエラーの可能性が低減される。容器間の材料移送がないため、試料の損失が更に低減される。最後に、本発明の方法は、迅速かつ安価であり、試料に対して直接実施してもよく、処理工程が少ししかなく、「第3世代」配列決定技術を含む既存の下流核酸分析プラットフォームと互換性があり、単一核酸分子がナノポア、ゼロモード導波路、又はマイクロウェルなどのミクロ構造内で分析されるため、現在の方法よりも有利である。特に、本方法は、様々なアダプタ又はリンカーを特異的にライゲーションすることができる、いずれか又は両方の末端に特異的一本鎖核酸オーバーハングを含んでもよい単離された特異的核酸標的領域を提供し、多種多様な下流分析及び用途における標的領域の使用に柔軟性を提供する。
【0010】
より具体的には、核酸標的領域を核酸分子の集団から単離する当該方法は、以下の工程、
a)核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させる工程であって、gRNAが、当該標的領域に隣接する第1の部位に相補的であるガイドセグメントを含み、それによってクラス2タイプV Casタンパク質-gRNA-核酸複合体を形成する、工程と、
b)当該クラス2タイプV Casタンパク質-gRNA-核酸複合体を含む核酸分子の集団を、一本鎖3’~5’エキソヌクレアーゼ活性を有する少なくとも1つの酵素と接触させ、それによって、当該第1の部位に5’一本鎖オーバーハングを形成する工程と、
c)工程b)の集団からクラス2タイプV Casタンパク質-gRNA複合体を除去する工程と、
d)工程c)の集団をオリゴヌクレオチドプローブと接触させる工程であって、当該プローブが、当該オーバーハングと少なくとも部分的に相補的な配列を含み、それによって、当該プローブと当該オーバーハングとの間に二重鎖を形成する、工程と、
e)工程d)の核酸分子の集団から二重鎖を単離することにより、核酸標的領域を単離する工程と、を含む。
【0011】
上記の方法では、工程は、提供された順序で順次実施され、工程a)が最初に実施され、続いて工程b)、次いで工程c)、次いで工程d)が実施される。あるいは、工程a及び工程b)は、特に標的核酸領域又は分子が二本鎖である場合に同時に行われてもよい。
【0012】
いくつかの場合、追加の工程が本方法に含まれてもよい。非限定的な例として、1つ以上の核酸分子を断片化して核酸分子の集団を得るための追加の工程は、任意の段階で、例えば工程a)の前に、工程a)と同時に、工程a)とb)の間に、又は工程b)、工程c)若しくは工程e)と同時に、上記方法に含まれてもよい。非限定的な例として、インキュベーションの更なる工程は、上記方法の任意の工程の前、間、又は後に更に含まれてもよい。非限定的な例として、保存工程は、工程c)の後、工程d)の後、又は工程e)の後に更に含まれてもよい。これらの任意選択の追加の工程は、以下に更に詳細に記載される。
【0013】
本明細書で使用する場合、用語「接触する」は、分子及び/又は産物が互いに相互作用してもよいように、同じ溶液中に2つ以上の当該分子及び/又は産物を配置することを指す。例えば、核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させることにより、これらの分子の相互作用、及びクラス2タイプV Casタンパク質-gRNA複合体が特異的部位で核酸分子に結合している複合体の形成を可能にする。同様に、核酸分子の集団をオリゴヌクレオチドプローブと接触させることにより、プローブの少なくとも一本鎖領域と、核酸分子の集団内に含まれる少なくとも部分的に相補的な一本鎖領域とのハイブリダイゼーションがもたらされる。本明細書で提供される方法の工程d)において、これは、より具体的には、当該プローブの一本鎖領域と、少なくとも部分的に相補的な5’オーバーハングとのハイブリダイゼーションに相当する。更なる例として、エキソヌクレアーゼなどの酵素と分子又は産物を「接触させる」ことは、当該分子又は産物が当該酵素の基質であるか又はそれを含む場合、酵素反応をもたらす。例えば、核酸分子の集団を、一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素と接触させることにより、これらの分子の相互作用がもたらされ、当該酵素に利用可能な酵素基質(例えば、一本鎖核酸分子又は3’遊離末端を有する領域)の分解がもたらされる。
【0014】
本明細書で使用する場合、用語「単離」又は「単離する」は、試料中の1つ以上の他の領域又は分子に対する1つ以上の核酸標的領域の割合の増加を指す。非限定的な例として、これらの他の分子は、タンパク質、脂質、炭水化物、代謝産物、核酸、又はこれらの組み合わせを含んでもよい。非限定的な例として、これらの他の領域は、当該標的領域と同じ分子上に存在するが、標的領域に含まれない核酸領域(すなわち、非標的領域」)に対応してもよい。本明細書で使用する場合、標的核酸領域の「単離」は、より具体的には、試料中の1つ以上の他の分子と比較して、又は初期試料中(すなわち、本発明の標的領域を単離する方法を実施する前)の分子の総数と比較して、試料中の1つ以上の標的核酸領域の割合が少なくとも2倍(例えば、2、3、4、5、10、20、30、40、50、60、70、80、90、100、250、500、750、1000、又は10,000倍以上)増加することを指してもよい。標的核酸領域の単離はまた、試料中の1つ以上の他の分子のレベルと比較した場合、試料中の標的核酸領域の割合が少なくとも5%(例えば、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、又は100%)増加することを指してもよい。標的核酸領域の割合が100%である場合、試料中に他の分子が含まれない。本明細書で使用する場合、用語「濃縮」は、より具体的には、試料中の他の核酸分子に対する1つ以上の標的核酸領域の単離を指す。一例として、標的領域の濃縮は、全初期核酸の量と比較した単離された標的領域の割合の増加を指し、単離された標的領域の割合は、少なくとも10%、20%、30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%増加する。好ましい実施形態によれば、単離された標的領域の割合は、全初期核酸の量と比較して、少なくとも10%、より好ましくは少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、更により好ましくは少なくとも99%又は100%増加する。
【0015】
一実施形態によれば、単離された核酸標的領域は、少なくとも10倍、少なくとも20倍、少なくとも50倍、少なくとも100倍、少なくとも250倍、少なくとも500倍、少なくとも750倍、好ましくは少なくとも1000倍、少なくとも10,000倍、少なくとも100,000倍、更により好ましくは少なくとも1,000,000倍、少なくとも2,000,000倍、又は少なくとも3,000,000倍濃縮される。特定の例として、約32億bpのヒトゲノムと等価な核酸分子の集団からの単一の1kb断片の100%濃縮は、3,000,000倍の増加を表す。
【0016】
代替的な実施形態によれば、単離された標的領域は、実質的に純粋である。「実質的に純粋」とは、単離された標的領域が、本発明の方法による標的領域の単離後に、試料中の全核酸の少なくとも99%、好ましくは少なくとも99.5%を含むことを意味する。
【0017】
好ましい実施形態によれば、標的領域は、初期試料中(例えば、本方法に従って標的領域を単離する前)の全核酸の10%未満、好ましくは5%未満、より好ましくは2%未満、0.05%未満、0.02%未満、更により好ましくは0.01%未満、0.005%未満、0.001%未満、0.0005%未満、0.0001%未満、0.00005%未満、0.00001%未満、又は0.0000005%未満を構成する。当業者であれば、試料の全核酸内の標的領域の量又は割合は、単離される標的領域の数及び単離される標的領域の長さに応じて変化することを理解するであろう。非限定的な例として、約32億bpのヒトゲノム内の対象となる1kb標的領域は、全ゲノムの0.0000005%未満を占める。
【0018】
核酸標的領域は、核酸分子の集団から単離され、当該核酸分子の集団は、概して試料中に含まれる。本明細書で使用する場合、用語「試料」は、例えば、生物学的、環境的、又は合成試料を含む、核酸分子の集団を含む任意の材料又は物質を指す。「生物学的試料」は、例えば、細菌、ウイルス、古細菌、動物、植物、及び/又は真菌などの生物学的生物を含んでもよい任意の試料であってもよい。本発明による「生物学的試料」はまた、例えば、細菌、ウイルス、古細菌、植物、真菌、動物、及び/又は他の真核生物から得られる細胞抽出物などの生物学的生物から得ることができる試料を指す。対象となる核酸の分子は、生物から直接、又は生物から得られた生物学的試料から、例えば血液、尿、脳脊髄液、精液、唾液、痰、糞便及び組織(細胞組織又は植物組織など)から得ることができる。任意の細胞、組織、又は体液は、本発明の文脈において核酸源として使用されてもよい。核酸分子はまた、初代細胞培養又は細胞株などの培養細胞から回収又は精製されてもよい。対象となる核酸が得られる細胞又は組織は、ウイルス又は他の細胞内病原体に感染することができる。試料は、生物学的試料から抽出された全核酸であることができる。「環境的試料」は、生物学的生物から直接採取されない核酸を含む任意の試料(例えば、土壌、海水、空気など)であってもよく、生物学的生物内にもはや存在しない核酸を含んでもよい。「合成試料」は、人工又は操作された核酸を含む。あるいは、試料は、標的核酸領域を含むことが疑われる任意の供給源からであってもよい。
【0019】
特定の実施形態では、本発明の方法は、本発明の方法による標的領域を含む核酸の単離を容易にするために試料を処理する1つ以上の工程を含んでもよい。非限定的な例として、試料は、濃縮、希釈、又は分解されてもよい(例えば、機械的又は酵素的溶解によって)。核酸は、本方法の工程a)の前に完全に又は部分的に精製されてもよく、又は非精製形態であってもよい。
【0020】
本明細書で使用する場合、用語「核酸」、「核酸領域」、及び「核酸分子」は、デオキシリボヌクレオチド(DNA)、リボヌクレオチド(RNA)、又はこれらの類似体、並びにこれらの組み合わせ(例えば、DNA/RNAキメラ)を含むヌクレオチドモノマーのポリマーを指す。本明細書に記載されるデオキシリボヌクレオチド及びリボヌクレオチドモノマーは、それぞれ、三リン酸基、アデニン(「A」)、シトシン(「C」)、グアニン(「G」)、チミン(「T」)、又はウラシル(U)窒素塩基、並びにデオキシリボース又はリボース糖を含むモノマー単位を指す。修飾ヌクレオチド塩基はまた、本明細書に包含され、ヌクレオチド塩基は、例えば、ヒポキサンチン、キサンチン、7-メチルグアニン、イノシン、キサンチノシン、7-メチルグアノシン、5,6-ジヒドロウラシル、5-メチルシトシン、シュードウリジン、ジヒドロウリジン、又は5-メチルシチジンである。本発明の文脈において、ヌクレオチドを記述する場合、「N」は任意のヌクレオチドを表し、「Y」は任意のピリミジンを表し、「R」は任意のプリンを表す。ヌクレオチドモノマーは、ホスホジエステル結合、又はそのリン酸類似体、及び関連する対イオン(例えば、H、NH 、Na)などのヌクレオチド間結合によって結合される。本発明の核酸分子は、二本鎖又は一本鎖であってもよく、多くの場合、二本鎖DNAである。しかし、本発明はまた、完全に対になった又は完全に対になっていない一本鎖DNA-一本鎖DNA二重鎖、あるいは完全に対になった又は完全に対になっていない一本鎖DNA-一本鎖RNA二重鎖、あるいは完全に対になった又は完全に対になっていない一本鎖RNA-一本鎖RNA二重鎖、並びに一本鎖DNA及び一本鎖RNAにも適用されることが理解される。具体的には、本発明は、単独の一本鎖DNA又は単独の一本鎖RNAの二次構造に適用される。核酸分子が一本鎖RNA(例えば、mRNA)又は一本鎖RNA-一本鎖RNA二重鎖(例えば、ウイルスdsRNA)である場合、当該RNAは、クラス2タイプV Casタンパク質-gRNA複合体と接触させる前に逆転写されてもよい。二重鎖は、異なる起源の試料から得られた2つの単一核酸鎖の少なくとも部分的な再対合からなってもよい。核酸分子は、天然に存在してもよく(例えば、真核生物又は原核起源)、又は合成であってもよい。核酸分子は、プラスミド及び/又は環状染色体、又は直鎖核酸分子を含む、共有結合的に閉じた環状DNA及び/又は環状RNAなどの環状核酸分子を含んでもよい。核酸分子は、特に、ゲノムDNA(gDNA)、cDNA、hnRNA、mRNA、rRNA、tRNA、microRNA、mtDNA、cpDNA、cfDNA(ctDNA又はcffDNAなど)、cfRNAなどを含んでもよい。
【0021】
核酸の長さは、少数のモノマー単位(例えば、長さが約15~約200個のモノマーの範囲であってもよいオリゴヌクレオチド)~数千、数万、数十万、又は数百万個のモノマー単位までの範囲であってもよい。好ましくは、核酸分子は、1つ以上のcfDNA分子を含む。第1の態様では、核酸分子の長さは、300bp未満であり、例えば約125~225bp、好ましくは130~200bpに含まれる。第2の態様では、核酸分子の長さは、300bp以上である。本出願では、別途記載のない限り、核酸分子は、左から右へ5’~3’方向に表されることを理解されたい。
【0022】
本明細書で使用する場合、用語「核酸分子の集団」は、2つ以上の核酸分子を指す。当該集団は、上で定義したように、任意の長さ、任意の配列の1つ以上の異なる核酸分子を含んでもよい。核酸分子の集団は、特に10、10、10、10、10、10、10又は1010を超える異なる核酸分子を含んでもよい。
【0023】
本明細書で使用する場合、「核酸標的領域」、「標的核酸領域」又は「標的領域」は、より複雑な核酸分子の試料又は集団内に存在する特定の核酸分子、又はより大きな核酸分子内に存在し、単離又は濃縮のために特異的に標的化される特定の核酸領域を指す。本明細書で使用する場合、用語「領域」は、任意の長さの、中断されていないヌクレオチドポリマーを指す。標的領域がより大きな核酸分子内に存在する場合、それは、好ましくは、クラス2タイプV Casタンパク質-gRNA複合体に含まれるcrRNA分子又はgRNAのガイドセグメントに少なくとも部分的に相補的な第1の部位によってその第1の側に隣接する。いくつかの場合、核酸標的領域は更に、第2の部位によってその第2の側に隣接する。したがって、当該第1の部位及び当該第2の部位は、当該標的領域の両側に位置する。当該第1の部位(及び存在する場合、当該第2の部位)は、当該標的領域に隣接して、好ましくは、当該標的領域に直接隣接して位置する。当該第1の部位及び当該標的領域(及び、存在する場合、当該第2の部位)は更に、非標的領域によって片側又は両側に隣接してもよい。本明細書で使用する場合、用語「隣接する」は、第1のヌクレオチド又は核酸領域及び第2のヌクレオチド又は核酸領域の存在を指し、2つのヌクレオチド及び/又は領域は、同一の中断されていないヌクレオチドポリマー上に存在する。したがって、クラス2タイプV Casタンパク質-gRNA複合体に含まれるcrRNA分子又はgRNAのガイドセグメントと少なくとも部分的に相補的な部位及び標的領域が同じヌクレオチドポリマー上に存在する限り、それらは隣接しているとみなされる。本明細書で使用する場合、用語「直接隣接する」は、第1のヌクレオチド又は核酸領域と第2のヌクレオチド又は核酸領域とが近接していることを指し、2つのヌクレオチド及び/又は領域は、ヌクレオチドポリマーに直接連続している(すなわち、介在するヌクレオチドが存在しない)。
【0024】
本発明の文脈では、「部位」は、100ヌクレオチド長以下、好ましくは60ヌクレオチド長以下の、中断されていないヌクレオチドポリマーに対応する。当該部位は、好ましくは二本鎖ヌクレオチドポリマーである。好ましくは、当該「部位」は、gRNAのガイドセグメントに少なくとも部分的に相補的であり、好ましくはgRNAのガイドセグメントに完全に相補的である。好ましくは、当該部位は、約12~約35ヌクレオチド長、好ましくは15~35ヌクレオチド長である。好ましくは、当該部位は、gRNAのガイドセグメントに少なくとも部分的に相補的であり、より好ましくはgRNAのガイドセグメントに完全に相補的である配列、及びPAMの両方を含む。当該PAMは、好ましくは、当該標的領域に直接隣接している。当該PAMは、好ましくはクラス2タイプV Casタンパク質-gRNA複合体(すなわち、「非標的」鎖)にハイブリダイズしない核酸鎖上に位置する。
【0025】
当該第2の部位は、好ましくは、クラス2 Casタンパク質-gRNA複合体、好ましくは第2のクラス2タイプV Casタンパク質-gRNA複合体に含まれるcrRNA分子又はgRNAのガイドセグメントに対して少なくとも部分的に相補的である。あるいは、当該第2の部位は、制限部位を含んでもよく、又は制限部位からなってもよい。この場合、当該第2の部位は、好ましくは約4~8ヌクレオチド長である。
【0026】
いくつかの実施形態では、2つ以上の異なる核酸標的領域が単離されてもよい。したがって、本発明の「標的核酸領域」は、1つ以上の異なる領域、好ましくは少なくとも2、5、10、25、50、100以上の領域を含んでもよい。核酸標的領域は、コード又は非コードであってもよく、又は2つの組み合わせであってもよい。標的領域は、ゲノム又はエピソームであってもよい。標的領域は、1つ以上の反復領域、再配列、重複、転座、欠失、ミスマッチ、SNP、及び/又はエピジェネティック修飾などの修飾された塩基を含んでもよい。いくつかの場合、核酸標的領域は、同一であってもよい(例えば、反復配列に対応する)。他の場合、核酸標的領域は異なっていてもよい。好ましくは、標的核酸領域は、少なくとも約10、20、50、100、250、500、1,000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、又は100,000ヌクレオチドの長さを有する。所与のgRNAは、標的領域を含む複数の核酸の単離を可能にし得る(例えば、非特異的結合、又は核酸分子内に2回以上存在する部位の認識に起因して)が、本発明の文脈において、各gRNAは、好ましくは核酸分子の集団内の単一部位を認識する。いくつかの場合、2つ以上のクラス2タイプV Casタンパク質-gRNA複合体は、異なる標的領域に隣接する異なる部位で結合し、それによって、2つ以上の領域を単離することを可能にする。好ましくは、当該標的領域が同じ核酸分子上に存在する場合、当該核酸標的領域は、少なくとも100、200、300、500、750、1000、2000、5000、又は10000ヌクレオチドだけ互いに分離される。
【0027】
いくつかの場合、2つのクラス2タイプV Casタンパク質-gRNA複合体は、2つの部位の間に位置する単一の標的領域が単離されるように、標的領域の両側に位置する部位に結合する。いくつかの場合、複数の標的領域が単離されている場合、上記の場合の両方は、タンデムで使用されてもよい(すなわち、いくつかの標的領域は、単一の部位に隣接しているが、他の部位は、2つの部位に隣接し、当該2つの部位は、当該標的領域の両側に位置する)。所与の標的領域に隣接する部位に結合するクラス2タイプV Casタンパク質-gRNA複合体の数の選択は、標的領域を含む核酸分子の長さ、単離された核酸分子の所望の構造(例えば、標的領域に隣接する一方又は両方の部位における一本鎖オーバーハングの存在など)、及び/又は標的領域が使用される下流用途に応じて異なってもよい。
【0028】
好ましい実施形態によれば、少なくとも2つの標的領域が単離され、より好ましくは少なくとも5、少なくとも10、少なくとも25、少なくとも50、又は少なくとも100の標的領域が単離される。好ましくは、核酸分子を、各々異なるgRNAを含む、少なくとも2つのクラス2タイプV Casタンパク質-gRNA複合体と接触させる。より好ましくは、核酸分子は、少なくとも5、少なくとも10、少なくとも25、少なくとも50、又は少なくとも100のクラス2タイプV Casタンパク質-gRNA複合体と接触し、各クラス2タイプV Casタンパク質-gRNA複合体は、異なる標的領域の単離を可能にする。
【0029】
Casタンパク質
本明細書で使用する場合、用語「Casタンパク質」は、核酸分子内の部位、この場合は標的領域に隣接する部位を特異的に認識して結合するRNAガイドエンドヌクレアーゼを指す。特定の部位を認識し、結合するために、「ガイドRNA」又は「gRNA」を有するCasタンパク質複合体は、「Casタンパク質-gRNA複合体」を形成する。Casタンパク質の結合特異性は、その配列が核酸分子内の特定の部位の配列に少なくとも部分的に相補的である必要がある「ガイドセグメント」を含むgRNAによって決定される。Casタンパク質-gRNA複合体内のガイドセグメントは、当該部位とハイブリダイズし、それによって、Casタンパク質-gRNA-核酸複合体を形成する。その部位へのCasタンパク質gRNA複合体の結合が成功するには、ハイブリダイズした領域に直接隣接して位置する核酸分子中の短い保存された配列の存在が更に必要である。この配列は、プロトスペーサー関連モチーフ又は「PAM」として知られている。したがって、核酸分子内の特定の部位に結合するCasタンパク質-gRNA複合体は、ガイドセグメントを介した部位への核酸ハイブリダイゼーション及びCasタンパク質自体とPAMとの相互作用の両方で構成される。Casタンパク質-gRNA複合体が核酸内の部位に結合した後、Casタンパク質は、典型的には、二本鎖核酸分子の各鎖の2つの隣接するヌクレオチド間のホスホジエステル結合を切断することによって核酸を切断する。具体的には、Casタンパク質の1つのドメインは、gRNAとハイブリダイズする核酸鎖を切断し、一方、Casタンパク質の第2のドメインは、ハイブリダイズしていない核酸鎖を切断する。二本鎖分子の2本の鎖の切断は、互い違いであってもよく、一本鎖オーバーハング又は平滑末端を生成してもよい。
【0030】
Casタンパク質の3つの主要なクラスがこれまでに報告されている(クラス1、クラス2、クラス3)。クラス2 Casタンパク質の中でも、少なくとも5種類の異なるタイプがこれまでに同定されている(すなわち、タイプI、II、III、IV、V)。非限定的な例として、Casタンパク質は、クラス2 Casタンパク質、具体的にはクラス2タイプV及びクラス2タイプII Casタンパク質、より具体的にはCas9、Cas12a(Cpf1とも呼ばれる)、C2c1、C2c3、及びC2c2(Cas13a)タンパク質から選択されてもよい。
【0031】
非限定的な例として、クラス2 Casタンパク質は、以下の種のうちの1つであってもよい。ストレプトコッカス・ニューモイアエ(Streptococcus pneumoniae)、化膿レンサ球菌(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ストレプトコッカス・カニス(Streptococcus canis)、黄色ブドウ球菌(Staphylococcus aureus)、髄膜炎菌(Neisseria meningitidis)、トレポネーマ・デンティコラ(Treponema denticola)、野兎病菌(Francisella tularensis)、フランシセラ・ノビシダ(Francisella novicida)、パスツレラ・ムルトシダ(Pasteurella multocida)、ストレプトコッカス・ミュータンス(Streptococcus mutans)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、カンピロバクター・ラリ(Campylobacter lari)、マイコプラズマ・ガリセプティクム(Mycoplasma gallisepticum)、ニトラチフラクター・サルスギニス(Nitratifractor salsuginis)、パルビバクラム・ラバメンティボランス(Parvibaculum lavamentivorans)、ロゼブリア・インテスティナリス(Roseburia intestinalis)、ナイセリア・シネレア(Neisseria cinerea)、グルコンアセトバクター・ジアゾトロフィカス(Gluconacetobacter diazotrophicus)、アゾスピリルム属(Azospirillum)、スピロヘータ・グロボーサ(Sphaerochaeta globosa)、フラボバクテリウム・カラムナーレ(Flavobacterium columnare)、フルヴィコラ・タフェンシス(Fluviicola taffensis)、バクテロイデス・コプロフィルス(Bacteroides coprophilus)、マイコプラズマ・モービレ(Mycoplasma mobile)、ラクトバシラス・ファルシミニス(Lactobacillus farciminis)、ストレプトコッカス・パスツーリアヌス(Streptococcus pasteurianus)、ラクトバチルス・ジョンソニー(Lactobacillus johnsonii)、スタフィロコッカス・パステウリ(Staphylococcus pasteuri)、フィリファクタ・アロシス(Filifactor alocis)、ベイヨネラ属(Veillonella sp.)、ステレラ・ワーズワーセンシス(Suterella wadsworthensis)、レプトトリキア種(Leptotrichia sp.)、コリネバクテリウム・ジフテリアエ(Corynebacterium diphtheriae)、アシダミノコッカス属(Acidaminococcus sp.)、又はラクノスピラ菌(Lachnospiraceae sp.)、プレボテラ・アルベンシス(Prevotella albensis)、ユーバクテリウム・エリゲンス(Eubacterium eligens)、ブチリビブリオ・フィブリソルベンス(Butyrivibrio fibrisolvens)、スミセラ属(Smithella sp.)、フラボバクテリウム属(Flavobacterium sp.)、ポルフィロモナス・クレビオリカニス(Porphyromonas crevioricanis)、又はラクノスピラ菌ND2006(Lachnospiraceae bacterium ND2006)。
【0032】
非限定的な例として、クラス2 Casタンパク質は、J3F2B0、Q0P897、Q6NKI3、A0Q5Y3、Q927P4、A1IQ68、C9X1G5、Q9CLT2、J7RUA5、Q8DTE3、Q99ZW2、G3ECR1、Q73QW6、G1UFN3、Q7NAI2、E6WZS9、A7HP89、D4KTZ0、D0W2Z9、B5ZLK9、F0RSV0、A0A1L6XN42、F2IKJ5、S0FEG1、Q6KIQ7、A0A0H4LAU6、F5X275、F4AF10、U5ULJ7、D6GRK4、D6KPM9、U2SSY7、G4Q6A5、R9MHT9、A0A111NJ61、D3NT09、G4Q6A5、A0Q7Q2、又はU2UMQ6であってもよい。受託番号は、UniProt(www.uniprot.org)、バージョン最終変更日は2017年1月10日である。非限定的な例として、クラス2 Casタンパク質をコードする遺伝子は、ヌクレオチド配列を含む任意の遺伝子であってもよく、当該配列は、上記に列挙したもののうちの1つなどの、対応するCasタンパク質のアミノ酸配列を生成する。当業者であれば、アミノ酸配列を変更することなく、遺伝子コードの縮重により、遺伝子のヌクレオチド配列が変化してもよいことを容易に理解するであろう。クラス2 Casタンパク質は更に、細菌(例えば、大腸菌(E.coli))、昆虫、真菌、又は哺乳類細胞における発現のためにコドン最適化されてもよい。
【0033】
クラス2 Casタンパク質及びタンパク質オルソログも、他の細菌種において同定されており、参照により本明細書に組み込まれる国際出願第2015/071474号の実施例1に特に記載されている。いくつかの場合、Casタンパク質は、ホモログ又はオルソログであってもよく、例えば、上記の種のうちの1つのクラス2 Casタンパク質であってもよい。
【0034】
野生型Casタンパク質のバリアント及び変異体が記載されている。非限定的な例として、エンドヌクレアーゼ活性を保持するが、改善された結合特異性を有するCasバリアント(例えば、Slaymaker et al.,Science,2015,351(6268):84-86に記載されているようなクラス2 Casタンパク質eSpCas9)が記載されている。
【0035】
クラス2タイプV Casタンパク質
核酸標的領域を単離する本方法の文脈で使用されるCasタンパク質は、クラス2タイプV Casタンパク質である。実際に、上記のように、標的領域を単離する方法の第1の工程(工程a)は、核酸分子の集団をクラス2タイプV Casタンパク質と接触させることを含む。具体的には、工程a)は、核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させることを含み、gRNAは、当該標的領域に隣接する少なくとも第1の部位に相補的であるガイドセグメントを含み、それによってクラス2タイプV Casタンパク質-gRNA-核酸複合体を形成する。触媒的に活性な場合、適切なgRNAと複合体を形成したクラス2タイプVタンパク質は、典型的には、二本鎖核酸分子のPAM配列に対して遠位の(例えば、PAMから少なくとも10ヌクレオチド離れて位置する)互い違いの切断(例えば、4~6ヌクレオチドの短い5’オーバーハング)を生成する(例えば、Zetsche et al.,Cell,2015,163(3):759~771を参照)。クラス2タイプVタンパク質-gRNA複合体は、切断後に核酸分子に結合したままであってもよいことが更に観察されている。加えて、本発明者らは、驚くべきことに、クラス2タイプVタンパク質-gRNA複合体が結合している核酸分子を、3’~5’一本鎖エキソヌクレアーゼ活性を有する酵素と接触させた場合に、驚くべきことに、長い5’オーバーハング(例えば、少なくとも9ヌクレオチド長、好ましくは少なくとも12ヌクレオチド長)が生成されることを本明細書に示した。理論に制限されるものではないが、クラス2タイプVタンパク質-gRNA複合体は、切断後も核酸標的鎖(PAM配列を含まない)に結合したままであってもよく、一方、反対の鎖(すなわち、PAM配列を含む鎖)は複合体から解離し、3’~5’一本鎖エキソヌクレアーゼ消化に利用可能になる。本発明者らはまた、驚くべきことに、クラス2タイプVタンパク質-gRNA複合体が3’~5’一本鎖エキソヌクレアーゼの存在下で切断する際に、切断位置の変動性を減少させることができることを見出した(例えば、図1B、1Cを参照)。
【0036】
本発明のクラス2タイプV Casタンパク質は、触媒活性である(すなわち、二本鎖分子の両方の鎖を切断する)。好ましくは、本発明のクラス2タイプV Casタンパク質は、Cas12a及びC2c1、より好ましくはCas12aから選択される。Cas12aタンパク質は、好ましくは、上記に列挙した適切な種のうちの1つのCas12aタンパク質であり、より好ましくは以下の種又は株のうちの1つのCas12aタンパク質である。F.ノビシダ(F.novicida)U112(受託番号:AJI61006.1)、P.アルベンシス(P.albensis)(受託番号:WP_024988992.1)、アシダミノコッカス属(Acidaminococcus sp)BV3L6(受託番号:WP_021736722.1)、E.エリゲンス(E.eligens)(受託番号:WP_012739647.1)、B.フィブリソルベンス(B.fibrisolvens)(受託番号:WP_027216152.1)、スミセラ属(Smithella sp.)SCADC(受託番号:KFO67988)、フラボバクテリウム属(Flavobacterium sp.)316(受託番号:WP_045971446.1)、P.クレビオリカニス(P.crevioricanis)(受託番号:WP_036890108.1)バクテロイデス経口タキソン(Bacteroidetes oral taxon)274(受託番号:WP_009217842.1)、又はラクノスピラ菌(Lachnospiraceae bacterium)ND2006(受託番号:WP_051666128.1)。好ましい実施形態では、当該アシダミノコッカス属BV3L6(Acidaminococcus sp.BV3L6)のCas12aが、以下のアミノ酸置換S542R/K607R又はS542R/K548V/N552R(Gao et al.,Nat Biotechnol.2017,35(8):789~792)を含むバリアントである。Cas12aタンパク質は、更により好ましくは、アシダミノコッカス属(Acidaminococcus sp.)のCas12a(「AsCas12a」とも呼ばれる)、ラクノスピラ菌ND2006(Lachnospiraceae bacterium ND2006)のCas12a(「LbaCas12a」とも呼ばれる)、及びF.ノビシダ(F.novicida)U112のCas12a(「FnCas12a」とも呼ばれる)から選択される。
【0037】
ガイドRNA
本明細書で使用する場合、用語「ガイドRNA」又は「gRNA」は、全般的に、crRNA分子を指す。これは、当該gRNAがクラス2タイプV gRNAである場合に注目すべきである。しかし、いくつかの場合、用語gRNAは、例えばgRNAがクラス2タイプII gRNAである場合、crRNA分子及びtracrRNA分子からなる2つのガイドRNA分子、又は単一のガイドRNA分子、又はcrRNA及びtracrRNA配列セグメントの両方を含むsgRNAを指してもよい。いくつかの場合、crRNAは、tracrメイトセグメントを含んでもよい。tracrメイトセグメント及びtracrRNAの特性(例えば、長さ、二次構造の存在など)は、当業者に周知である。更に、当業者は、そのようなセグメント又は分子がgRNA分子に含まれるべき場合を認識している。具体的には、このようなセグメント又は分子は、クラス2タイプV gRNAに含まれる必要はない。
【0038】
gRNA分子は、例えば、1つ以上のリボヌクレオチドの塩基、糖、又はリン酸修飾を含む化学修飾がなされてもよい。任意選択で、gRNA分子の5’及び/又は3’末端は、例えば、別の分子又は化学基への共有結合によって修飾されてもよい。
【0039】
crRNA分子又はセグメントは、好ましくは20~75ヌクレオチド長、より好ましくは30~60ヌクレオチド長、更により好ましくは40~45ヌクレオチド長である。crRNA分子又はセグメントは、好ましくは、本明細書において「ガイドセグメント」と称される第1の領域を含み、その配列は核酸分子中に存在する配列に対して少なくとも部分的に相補的であり、核酸分子中に存在する当該配列は、好ましくは標的領域に隣接する第1の部位に位置する配列である。好ましくは、本発明のgRNAのガイドセグメントは、核酸分子中に存在する配列と少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又はより好ましくは100%の配列相補性を含む。好ましくは、相補性が100%未満である場合、ミスマッチは、PAMから最も遠くにハイブリダイズするcrRNA末端の近くに位置する。一例として、クラス2タイプV Casタンパク質がCas12aである場合、Cas12aはcrRNAの5’末端でPAMを認識するので、ミスマッチは、好ましくはcrRNA分子又はセグメントの3’末端に含まれる(例えば、最後の7ヌクレオチド以内)。ガイドセグメントは、好ましくは少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25ヌクレオチド長であり、より好ましくは15、16、17、18、19、20、21、22、23、24、又は25ヌクレオチド長であり、更により好ましくは17、18、19、20、21、22、23、又は24ヌクレオチド長である。あるいは、ガイドセグメントは、好ましくは10~30ヌクレオチド長、より好ましくは15~25ヌクレオチド長、更により好ましくは17~24ヌクレオチド長である。
【0040】
好ましくは、クラス2タイプV Casタンパク質がCas12aである場合、gRNAは、crRNA分子のみからなる。したがって、「Cas12a-gRNA複合体」は、本明細書では互換的に、「Cas12a-crRNA複合体」とも呼ばれてもよい。gRNAがcrRNA分子のみである場合、少なくともガイドセグメントが存在する必要がある。例示的な全体的なcrRNAヌクレオチド配列を配列番号:1に示し、これは、「N」ヌクレオチドのストレッチによって表されるガイドセグメントを有する。好ましくは、crRNA分子は、二次構造を更に含む。非限定的な例として、gRNA中に存在する「二次構造」は、ステムループ又はヘアピン、バルジ、テトラループ、及び/又はシュードノットであってもよい。用語「ヘアピン」及び「ステムループ」は、gRNAの文脈において本明細書では互換的に使用され、以下に定義される(「ヘアピンアダプタ」の項を参照)。好ましい実施形態によれば、当該gRNAは、少なくとも1つのヘアピン二次構造を含む。
【0041】
好ましくは、crRNA分子は、tracrメイトセグメントを含まない。好ましくは、ガイドセグメントは、crRNA分子の3’末端に位置する。好ましくは、二次構造は、crRNA分子の5’末端に又はその付近に位置する。本明細書で使用する場合、用語「核酸分子の5’末端又はその付近」は、5’から3’までの分子の前半内のセグメント又は構造の配置を指す。同様に、本明細書で使用する場合、用語「核酸分子の3’末端又はその付近」は、分子の後半内のセグメント又は構造の配置を指す。好ましくは、当該crRNAは、40~50ヌクレオチド長である。
【0042】
本明細書で使用する場合、用語「相補的」とは、1つの核酸配列又は分子(例えば、gRNA)が、別の核酸配列又は分子(例えば、核酸分子中の配列)との配列特異的な逆平行ヌクレオチド塩基対形成相互作用を受け、二重鎖又は他のより高次構造を形成する能力を指す。相互作用の主な種類は、ワトソン・クリック及びフーグスティーン型水素結合によるヌクレオチド塩基特異的、例えばA:T、A:U及びG:Cである。これは、「核酸結合」、「ハイブリダイゼーション」、又は「アニーリング」としても知られている。核酸が標的部位の相補的領域にハイブリダイズする条件は、当該技術分野において周知である(例えば、Nucleic Acid Hybridization,A Practical Approach,Hames and Higgins,eds.,IRL Press,Washington,D.C.(1985)を参照)。ハイブリダイゼーション条件は、特定の用途に依存し、当業者によって日常的に決定することができる。
【0043】
本発明の文脈において、相補的結合は、2つの核酸配列又は分子(例えば、gRNA及び標的領域)が互いに完全に相補的である必要があることを意味しない。更に、crRNA配列セグメント又は分子が核酸分子中の配列と完全に相補的である必要はない。実際に、クラス2 Casタンパク質-gRNA複合体は、gRNAとわずか8又は9塩基の相補性を有する核酸配列に特異的に結合することができることが知られている。好ましくは、PAMに最も近いgRNAの10塩基とPAMに最も近い相補的核酸配列の対応する10塩基との間、より好ましくはPAMに最も近いgRNAの6塩基とPAMに最も近い相補的核酸配列の対応する6塩基との間、更により好ましくはPAMから4、5及び/又は6塩基に位置するgRNAの塩基とPAMから4、5及び/又は6塩基に位置する相補的核酸配列の対応する塩基との間にミスマッチは存在しない。実際に、ミスマッチが当該塩基位置の1つ以上に存在する場合、結合は不安定であり、クラス2 Casタンパク質-gRNA複合体による標的部位での切断は減少するか、又は更には消滅する。オフターゲットハイブリダイゼーションは、上記のように、crRNAセグメントの長さを増加させることによって、又は、PAMから最も遠いcrRNAセグメントの末端又はその付近にミスマッチを配置することによって、減少させることができる。あるいは、gRNAは、1つ以上の修飾された塩基又は化学修飾の存在を介して結合特異性を増加させるように修飾されてもよく、例えば、Cromwell et al.,Nat Commun.2018 Apr 13;9(1):1448又はOrden Rueda et al.,Nat Commun.2017;8:1610などに記載されているものがあり、参照により本明細書に組み込まれる。更に、核酸は、介在領域がハイブリダイゼーション事象(例えば、ループ又はヘアピン構造)に関与しないように、1つ以上の領域にわたってハイブリダイズしてもよい。当業者であれば、全般的知識に基づいて、及び上に詳述したパラメータを考慮して、ハイブリダイズされる核酸配列により、1つ以上のgRNA分子を容易に設計することができる。
【0044】
核酸対Casタンパク質対gRNAの分子数の比(核酸:Casタンパク質:gRNA)は、標的領域の単離の有効性に影響を及ぼすことが以前に示されている。標的領域:Casタンパク質:gRNAを含む核酸の分子数の比は、ここでは特に、核酸標的領域及び/又は核酸分子の集団の起源及び/又は複雑性に従って、最適化されてもよい。理論に制限されるものではないが、最適化は特にDNAの複雑性に応じて異なってもよく、より複雑な核酸集団は、より大量のCasタンパク質及びgRNAを必要とする。非限定的な例として、より複雑でない核酸集団は、反復配列又はPCR増幅断片を本質的に含んでもよく、一方で、より複雑な核酸集団はゲノムDNAを含んでもよい。非限定的な例として、当該核酸分子がPCRによって生成された核酸分子の集団内に存在する場合、本方法では少なくとも1:10:20の比を使用してもよい。対照的に、当該集団が大腸菌(E.coli)ゲノムDNAを含むか又はそれからなる場合、少なくとも1:1600:3200の比が好ましく、当該集団がヒトゲノムDNAを含むか又はそれからなる場合、少なくとも1:100000:200000の比が好ましい。複数のgRNAが使用される場合(例えば、2つのgRNAが第1の部位及び第2の部位を認識し、当該部位が標的領域に隣接して、標的領域の両側に位置し、又は異なる標的領域を含む複数の核酸分子を調製するために多重化されている)、核酸:Casタンパク質:gRNAの単一の最適化された比は、全てのgRNAに対して選択されてもよい。あるいは、最適化された比は、各gRNAに対して個別に選択されてもよい。
【0045】
好ましい実施形態によれば、比は、少なくとも1:10:10、より好ましくは少なくとも1:10:20、更により好ましくは少なくとも1:10:50である。テンプレートDNAがPCRにより生成される場合、少なくとも1:10:20の比が特に好ましい。好ましくは、ガイドRNAは、PCRテンプレートを使用して効率のために選択され、続いて、必要に応じて適切なテンプレート上の標的領域:Casタンパク質:gRNAを含む核酸の比を最適化する(例えば、当該テンプレートが異なる場合)。好ましくは、野生型Casタンパク質-gRNA複合体の切断効率は、少なくとも70%、より好ましくは少なくとも80%、更により好ましくは少なくとも90%である。好ましくは、Casタンパク質-gRNA複合体による標的領域の保護効率は、少なくとも70%、より好ましくは少なくとも80%、更により好ましくは少なくとも90%である。好ましくは、核酸が大腸菌(E.coli)などのグラム陰性菌などの細菌起源の核酸から調製される場合、核酸標的領域:Casタンパク質:gRNAの数の比は、少なくとも1:200:400、より好ましくは少なくとも1:400:800、更により好ましくは少なくとも1:800:1600、少なくとも1:1600:3200又は少なくとも1:3200:6400である。代替的な好ましい実施形態によれば、核酸標的領域:Casタンパク質:gRNAの比は、少なくとも1:10,000:20,000、より好ましくは少なくとも1:100,000:200,000である。当業者は、上記の比を考慮して、調製される標的領域及び/又は核酸分子の起源及び/又は複雑性に従って、核酸標的領域:Casタンパク質:gRNAの比を容易に適合させることができる。gRNAに対するCasタンパク質の割合は変動してもよいが、gRNAは、有利には、Casタンパク質にgRNAが首尾よくロードされることを確実にするために、Casタンパク質に対して少なくとも2倍過剰で提供される。当然のことながら、より高い比率のCasタンパク質(例えば、PCR標的に対して1:20:40、1:50:100など)及び任意選択で、gRNA(例えば、PCR標的に対して1:10:30、1:10:40など)を使用してもよい。上記の比は、好ましくは、本発明の方法の工程a)において、特に標的領域を含む核酸:クラス2タイプV Casタンパク質:gRNAの比に関して使用される。第2のクラス2 Casタンパク質が存在する場合、上記の比を使用してもよい。
【0046】
プロトスペーサー隣接モチーフ(PAM)
本明細書で使用する場合、用語「プロトスペーサー隣接モチーフ」又は「PAM」は、クラス2タイプV Casタンパク質などのCasタンパク質自体によって直接認識される短いヌクレオチド配列(例えば、2~6個のヌクレオチド)を指す。PAM配列及びその配置は、Casタンパク質によって異なり、当業者の全般的知識に従って、又はKarvelis et al.,Genome Biology,2015,16:253に記載されているような技術を使用して、当業者によって容易に決定することができる。一例として、F.ノビシダ(F.novicida)のCas12aタンパク質はPAM 5’-TTTN-3’又は5’-YTN-3’を認識し、アシダミノコッカス属(Acidaminococcus sp.)のCas12aタンパク質はPAM 5’-TTTN-3’を認識する。更なる例として、化膿レンサ球菌(S.pyogenes)のCas9タンパク質は、PAM 5’-NGG-3’を認識する。対照的に、黄色ブドウ球菌(S.aureus)のCas9タンパク質は、PAM 5’-NNGRRT-3’を認識し、一方、F.ノビシダ(F.novicida)由来の操作されたCas9タンパク質は、PAM 5’-YG-3’を認識する。PAMモチーフは、概して、二本鎖核酸分子のハイブリダイズしていない(又は「非標的」)鎖上に位置し、gRNAにハイブリダイズされる核酸部位の5’又は3’末端に直接隣接している。PAMの必要な配置は、使用されるCasタンパク質に依存する(例えば、PAMは、好ましくは、Cas9タンパク質を使用する場合、gRNAの3’末端に直接隣接して位置し、一方、PAMは、好ましくは、Cas12aタンパク質を使用する場合、gRNAの5’末端に直接隣接して位置する)。いくつかの場合、PAMモチーフは、gRNA分子自体に、又は試料に添加される別個のDNAオリゴヌクレオチドに含まれてもよい。一例として、本方法を使用して一本鎖RNA分子を単離する場合、これらの手段の1つを介したPAMの試料への添加が必要なことがある。クラス2 Casタンパク質のPAMへの結合は、二本鎖核酸をわずかに不安定化させ、それによってgRNAの核酸配列へのハイブリダイゼーションを可能にすると考えられる。
【0047】
Casタンパク質がクラス2タイプVの場合、PAMは、好ましくは、gRNAの5’末端に直接隣接する標的領域のハイブリダイズしていない鎖上に位置する。対照的に、クラス2タイプII Casタンパク質のPAMは、好ましくは、gRNAの3’末端に直接隣接する標的領域のハイブリダイズしていない鎖上に位置する。しかし、いくつかの場合、PAMは、好ましくは、gRNA分子自体又はDNAオリゴヌクレオチド上に含まれる。
【0048】
一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素
本明細書に記載の方法によれば、核酸分子の集団を少なくとも1つのクラス2タイプV Casタンパク質-gRNA複合体(例えば、工程a))と接触させた後、当該方法は、核酸分子の集団を、一本鎖3’~5’エキソヌクレアーゼ活性を有する少なくとも1つの酵素と接触させる工程(例えば、工程b))を更に含む。この工程は、一本鎖核酸分子、又は二本鎖核酸分子の一本鎖領域をそれらの3’末端から分解する。当業者であれば、酵素が一本鎖領域又は分子に特異的であるので、標的核酸が二本鎖分子である場合、この工程が工程a)と同時に実施されてもよいことを理解するであろう。しかし、標的核酸が一本鎖である場合、この工程は、核酸標的の望ましくない分解を防止するために、工程a)の後に実施する必要がある。
【0049】
本明細書で使用する場合、「一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素」は、エキソリボヌクレアーゼ若しくはエキソデオキシリボヌクレアーゼ又はその両方を指してもよい。3’~5’エキソヌクレアーゼ活性を有する当該酵素は、1つ以上の追加の酵素活性(例えば、特異的又は非特異的エンドヌクレアーゼ活性)を有しても、有さなくてもよい。しかし、当該酵素は、好ましくは二本鎖エキソヌクレアーゼ活性を含まない。好ましい実施形態によれば、当該酵素はまた、一本鎖5’~3’エキソヌクレアーゼ活性を有する。非限定的な例として、本発明で使用されてもよい一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素としては、エキソヌクレアーゼI(ExoI)、S1エキソヌクレアーゼ、エキソヌクレアーゼT、エキソヌクレアーゼVII(ExoVII)などが挙げられる。いくつかの場合、例えば上記に列挙したものから選択される2つ以上の酵素の組み合わせが使用されてもよい。特定の例として、ExoVII及びExoIを組み合わせて使用してもよい。酵素分解は、部分的(すなわち、集団が一本鎖3’~5’エキソヌクレアーゼ活性を有する酵素と接触した後であっても、一本鎖核酸領域又は分子が集団中に存在してもよい)であっても、又は完全であってもよい。これは、インキュベーション条件、試料組成、核酸集団自体(例えば、核酸構造)、又は当業者に既知の他の変数に依存してもよい。したがって、用語「分解する」は、核酸分子の集団内に存在する一本鎖核酸分子又は領域を少なくとも部分的に分解することを含む。
【0050】
好ましい実施形態によれば、エキソヌクレアーゼ活性を有する当該酵素は、エンドヌクレアーゼ活性を有さない。これは、標的領域が、部位特異的エンドヌクレアーゼによって認識されてもよい部位を含む場合、又は標的領域が非特異的エンドヌクレアーゼによる分解を受けやすい場合に有利なことがある。好ましい実施形態によれば、一本鎖3’~5’エキソヌクレアーゼ活性を有する当該少なくとも1つの酵素は、エキソヌクレアーゼI、S1エキソヌクレアーゼ、エキソヌクレアーゼT、エキソヌクレアーゼVII、又はこれらの2つ以上の組み合わせから選択される。好ましくは、一本鎖3’~5’エキソヌクレアーゼ活性を有する当該酵素は、ExoI及び/又はExoVIIである。
【0051】
一本鎖3’~5’エキソヌクレアーゼ活性を有する少なくとも1つの酵素と少なくとも第1の部位でクラス2タイプV Casタンパク質-gRNA-核酸複合体を含む、本明細書において提供される方法の工程a)の核酸集団をインキュベートすると、当該少なくとも第1の部位に5’一本鎖オーバーハングが生成される。5’一本鎖オーバーハングは、本明細書に更に記載されるように、少なくとも9個のヌクレオチド、好ましくは9、10、11、12個以上のヌクレオチドの長さを有してもよい。
【0052】
クラス2タイプV Casタンパク質-gRNA複合体の除去
クラス2タイプV Casタンパク質-gRNA複合体は、特定の部位で核酸分子に安定かつ緊密に結合して、クラス2タイプV Casタンパク質-gRNA-核酸分子複合体(本明細書でクラス2タイプV Casタンパク質-gRNA-核酸複合体とも呼ばれる)を形成する。したがって、クラス2タイプV Casタンパク質-gRNA複合体によって結合された5’-オーバーハングを下流工程で利用可能にするためには、クラス2タイプV Casタンパク質-gRNA-核酸分子複合体からクラス2タイプV Casタンパク質-gRNA複合体を除去することが必要である。したがって、本明細書で提供される方法は、工程b)の集団からクラス2タイプV Casタンパク質-gRNA複合体を除去する工程c)を更に含む。本明細書で使用する場合、用語「除去する」は、クラス2タイプV Casタンパク質-gRNA-核酸分子複合体からのクラス2タイプV Casタンパク質-gRNA複合体の物理的分離を指す。除去は部分的であっても完全であってもよい。好ましくは、除去は完全である。いくつかの場合、クラス2タイプV Casタンパク質-gRNA複合体は、核酸分子に結合していないが溶液中に存在したままであってもよいが、他の場合では、溶液から除去されてもよい。クラス2タイプV Casタンパク質-gRNA複合体は、クラス2タイプVタンパク質及び/又はgRNAの分解によって、溶液から特に除去されてもよい。非限定的な例として、クラス2タイプV Casタンパク質-gRNA複合体は、核酸分子の集団を少なくとも1種のプロテアーゼと接触させ、それによってクラス2タイプV Casタンパク質を分解することによって除去されてもよい。有利には、核酸分子の集団を少なくとも1種のプロテアーゼと接触させることはまた、存在してもよい任意の他のタンパク質(すなわち、追加のクラス2 Casタンパク質-gRNA複合体中に存在してもよいクラス2 Casタンパク質、初期試料から残存するタンパク質を汚染するタンパク質などの他の部位特異的エンドヌクレアーゼ)を分解する。非限定的な例として、プロテアーゼは、セリンプロテアーゼ、システインプロテアーゼ、スレオニンプロテアーゼ、アスパラギン酸プロテアーゼ、グルタミン酸プロテアーゼ、メタロプロテアーゼ、及び/又はアスパラギンペプチドリアーゼから選択されてもよい。
【0053】
加えて、又は代替的に、クラス2タイプV Casタンパク質-gRNA複合体は、核酸分子の集団を、EDTA又はEGTAなどの二価カチオン(特にMg2+)をキレート化することができる化合物と接触させることによって除去されてもよい。実際に、本発明者らは、驚くべきことに、クラス2タイプV Casタンパク質-gRNA複合体が、クラス2タイプV Casタンパク質を分解する酵素又は他の化学物質を必要とせずに、そのような化合物を添加したときに除去されてもよいことを示した。したがって、好ましい実施形態によれば、クラス2タイプV Casタンパク質-gRNA複合体は、核酸分子の集団を二価カチオンのキレート化剤、好ましくはMg2+カチオンをキレートするキレート剤と接触させることによって除去される。好ましくは、当該キレート化剤は、EDTA又はEGTAである。添加されるEDTA又はEGTAの量は、キレート化される二価カチオンの量よりも少なくとも2倍多く、より好ましくは、存在する二価カチオンの量よりも少なくとも3倍、4倍、5倍多く、更により好ましくは少なくとも10倍多い。当業者は、核酸分子の集団を含む溶液の組成を考慮して(例えば、カチオンの存在及び量に従って)、及び本明細書で提供される実施形態を更に考慮して、適切な量のキレート剤を容易に決定することができる。特定の例によれば、EDTAは、少なくとも20mM、より好ましくは少なくとも25mMの濃度で添加される。少なくとも1種のプロテアーゼ及び二価カチオンのキレート化剤が工程c)で使用される場合、当該少なくとも1種のプロテアーゼ及び当該二価カチオンのキレート化剤を同時に添加してもよく、当該キレート化剤は、当該少なくとも1種のプロテアーゼの活性を阻害しない。
【0054】
加えて、又は代替的に、クラス2タイプV Casタンパク質-gRNA複合体は、核酸分子の集団をRNaseA、RNaseH又はRNaseIなどの少なくとも1種のRNaseと接触させ、それによってgRNAを分解することによって除去される。別の実施形態では、RNAが高温で不安定であるため、試料は、任意選択で、二価金属イオンの存在下で、及び/又はアルカリ性pH下で加熱されてもよい(例えば、少なくとも65℃)。
【0055】
オリゴヌクレオチドプローブ
本明細書で提供される方法によれば、クラス2タイプV Casタンパク質-gRNA複合体を除去した後、核酸分子の集団をオリゴヌクレオチドプローブ(例えば、工程d)で提供されるように)と接触させる。本明細書で使用する場合、用語「オリゴヌクレオチドプローブ」は、5’一本鎖オーバーハングに少なくとも部分的に相補的な一本鎖領域を含むポリヌクレオチド分子を指す。オリゴヌクレオチドプローブは、一本鎖ポリヌクレオチドであってもよく、又は一本鎖及び二本鎖領域の両方を含んでもよい。いくつかの場合、オリゴヌクレオチドプローブは、ヘアピンアダプタであってもよい。オリゴヌクレオチドプローブは、特に、gRNA分子のガイドセグメントに相当するDNA配列(すなわち、ウラシル塩基がチミン塩基で置換され、リボース糖がデオキシリボース糖で置換されたもの)を含んでもよい。したがって、当該プローブは、5’オーバーハングに相補的な領域を含み、それにより、ハイブリダイゼーションによって当該オリゴヌクレオチドプローブと当該5’オーバーハングとの間に二本鎖領域又は二重鎖を形成することができる。非限定的な例として、5’一本鎖オーバーハングに対して少なくとも部分的に相補的であるオリゴヌクレオチドプローブの領域は、5’一本鎖オーバーハングと4、3又は2個未満のミスマッチ、より好ましくは5’一本鎖オーバーハングと3又は2個未満のミスマッチを含み、更により好ましくは、5’一本鎖オーバーハングに対して少なくとも部分的に相補的なオリゴヌクレオチドプローブの領域は、当該5’一本鎖オーバーハングに完全に相補的である(すなわち、ミスマッチを含まない)。非限定的な例として、当該5’一本鎖オーバーハングは、9~24ヌクレオチドを含む。したがって、当該5’一本鎖オーバーハングは、好ましくは9~24ヌクレオチド、好ましくは少なくとも9、10、11、12、13、14、15、16、17、18、19、20、21、22、23又は24ヌクレオチドを含む。
【0056】
5’オーバーハングが(例えば、図1Cに例示されるように)変化してもよいことを考えると、当該プローブの配列は、好ましくは、PAM部位まで続く領域に相補的であり、PAM部位を含んでもよい。あるいは、核酸分子の集団を、存在し得る5’オーバーハングの全てではないにしてもほとんど(例えば、少なくとも80%、90%、95%、99%)とプローブが首尾よくハイブリダイズし、それによって二重鎖を形成するように、異なる可能な又は予想される5’オーバーハングに相補的な配列を含む複数のオリゴヌクレオチドプローブ(例えば、2つ、3つ、4つ、又はそれ以上のオリゴヌクレオチドプローブ)と接触させてもよい。あるいは、当該オリゴヌクレオチドプローブは、その5’末端に標的領域の配列に相補的な配列(すなわち、PAM部位を超えて延びる)を更に含んでもよい。オリゴヌクレオチドプローブは、所望により、例えば下流用途のために、その3’末端(すなわち、5’オーバーハングに結合しない3’領域)で、任意の配列及び任意の長さの追加のヌクレオチドを更に含んでもよい。したがって、追加の配列はオリゴヌクレオチドプローブに含まれてもよく、当該配列は、5’一本鎖オーバーハングに少なくとも部分的に相補的である配列の片側又は両側に存在する。オリゴヌクレオチドプローブの非限定的な例示を図8に提供する。
【0057】
オリゴヌクレオチドプローブは、任意の長さのものであってもよいが、当該プローブは、200ヌクレオチド以下、好ましくは100ヌクレオチド以下、更により好ましくは50ヌクレオチド以下の長さを有することが好ましい。
【0058】
ハイブリダイゼーション後、当該プローブは、好ましくは、当該分野で周知の方法を使用して、好ましくはリガーゼ活性を有する酵素を介して、例えばTaq DNAリガーゼなどのリガーゼを介して核酸にライゲーションされる。この工程は、5’オーバーハングが12ヌクレオチド以下の長さを有する場合に特に好ましいが、5’オーバーハングが12ヌクレオチドを超える長さを有する場合にも使用されてもよい。
【0059】
一態様では、本明細書に記載の方法の工程c)で得られた核酸分子の集団を、リガーゼ活性を有する酵素と更に接触させる。好ましくは、核酸分子の当該集団を、工程d)の間、又は工程d)の後であるが工程e)の前の別個の工程に、リガーゼ活性を有する酵素と接触させる。より好ましくは、当該核酸分子の集団を、当該オリゴヌクレオチドプローブ及びリガーゼ活性を有する当該酵素と同時に接触させ、それによって二重鎖の形態で少なくとも1つの連続核酸分子(すなわち、切れ目を有さない)を生成する。当該オリゴヌクレオチドプローブ及びリガーゼ活性を有する当該酵素を同時に使用することにより、本方法を実施するのに必要な時間が有利に短縮される。
【0060】
別の更なる態様では、本明細書に記載の方法の工程c)で得られた核酸分子の当該集団を、二本鎖核酸分子からの5’核酸フラップの切断を触媒する少なくとも1つの酵素と接触させる。それによって、当該酵素は、好ましくは、切断後にオリゴヌクレオチドプローブの5’末端をリン酸化する。次いで、当該5’末端は、得られるニックな部位で核酸分子にライゲーションされてもよい。当該酵素が5’末端をリン酸化しない場合、核酸分子の当該集団を、ライゲーション前にT4ポリヌクレオチドキナーゼなどの5’末端をリン酸化する酵素と接触させてもよい。
【0061】
特定の実施形態では、核酸分子の集団は、(例えば、図5及び図6に示すように)ハイブリダイゼーション後にオリゴヌクレオチドプローブ中に存在してもよい任意の5’DNAフラップを切断するFEN1酵素と有利に接触する。核酸分子の集団をFEN1酵素と接触させる当該工程は、工程d)の間、又は工程d)の後であるが工程e)の前に別個の工程で実施されてもよい。FEN1酵素と接触させた後又はそれと同時に、核酸分子の当該集団をリガーゼと接触させて、それによってFEN1切断後に残っているニックを封止してもよい。したがって、本明細書で提供される方法は、特に、二本鎖核酸分子から5’核酸フラップを切断する工程、及び/又はライゲーション工程を更に含んでもよい。特定の実施形態によれば、クラス2タイプV Casタンパク質-gRNA複合体による切断後に得られるオーバーハングの3’末端の正確な位置を決定してもよく、当該オリゴヌクレオチドプローブは、過剰なオリゴヌクレオチドがその5’末端に存在しないように設計されている。この場合、核酸分子の集団をFEN1と接触させる必要はない。あるいは、プローブは、標的領域に相補的な配列を含むオリゴヌクレオチドプローブの全長がハイブリダイズするように、塩基修飾、骨格修飾、又は、5’又は3’オリゴヌクレオチド修飾(例えば、LNA、アクリジンなどの使用)など、5’オーバーハングに対するプローブのハイブリダイゼーションの強度を高める修飾を含んでいてもよく、又は鎖置換を行ってもよい。これらの場合、ライゲーションは必ずしも行われない。
【0062】
オリゴヌクレオチドプローブは、捕捉剤(例えば、捕捉タンパク質)に結合することができるリガンドを更に含んでもよい。本明細書で使用する場合、用語「リガンド」は、捕捉剤との親和性を有する分子、ペプチド、基質などを指す。当該リガンドは、官能基を含んでもよい。当該リガンドがペプチドである場合、特に、天然、非天然、及び/又は人工アミノ酸を含んでもよい。当該リガンドは、捕捉剤と相互作用すると、当該捕捉剤と非共有結合又は共有結合を形成してもよい。リガンド-捕捉剤相互作用を以下に更に詳述する。いくつかの場合、当該リガンドは、支持体に固定されるオリゴヌクレオチドに少なくとも部分的に、好ましくは完全に相補的な一本鎖ヌクレオチドオーバーハングであってもよい。複数のオリゴヌクレオチドプローブが複数の標的領域を単離するために使用される場合、当該プローブは、同じ又は異なるリガンド(例えば、標的領域当たりの異なるリガンド、又は標的領域の群当たりの異なるリガンド)を含んでもよい。好ましくは、複数の標的領域を単離する場合、全てのオリゴヌクレオチドプローブは同じリガンドを含む。したがって、本明細書で使用する場合、用語「ハイブリッド捕捉」は、本明細書で提供される方法の二重鎖(例えば、工程dにおけるように)を形成するためのオリゴヌクレオチドの5’オーバーハングへのハイブリダイゼーションを指し、好ましくは、当該オリゴヌクレオチドは、当該標的核酸にライゲーションされ、連続する二重鎖を形成し、その後、好ましくは、当該二重鎖を直接的又は間接的に捕捉することによって(例えば、オリゴヌクレオチドプローブ上のリガンド又は当該プローブに結合する別の分子上のリガンド、例えば第2のオリゴヌクレオチド分子、タンパク質などを介して)、当該二重鎖を本明細書で提供される方法の当該核酸分子の集団(例えば、工程eにおけるように)から単離する工程が続く。
【0063】
オリゴヌクレオチドプローブは、ウラシル塩基などの切断部位、脱塩基部位、又は制限部位を更に含んでもよい。好ましくは、当該ウラシル塩基又は脱塩基部位は、5’オーバーハングに相補的ではなく、したがって二重鎖に含まれないオリゴヌクレオチドの一本鎖領域内に含まれる。好ましくは、当該制限部位は、オリゴヌクレオチドの二本鎖領域内に含まれる。いくつかの場合では、当該制限部位は、二重鎖の形成によって生成されてもよい。これは、二重鎖が当該切断部位での切断によってリガンドから分離されてもよいので有利である。したがって、好ましい実施形態によれば、当該オリゴヌクレオチドプローブは、好ましくは切断部位、更により好ましくはウラシル塩基、脱塩基部位又は制限部位を含む。
【0064】
二重鎖
上記のように核酸の集団をオリゴヌクレオチドプローブと接触させた後、工程d)の核酸分子の集団から二重鎖を単離し、それによって本明細書で提供される方法の核酸分子の集団(例えば、工程eにおけるように)から核酸標的領域も単離する。好ましくは、工程d)の核酸分子の集団(すなわち、5’オーバーハングとオリゴヌクレオチドプローブとの間の二重鎖を含む)を捕捉剤と接触させる。これは、当該プローブがリガンドを含む場合に特に好ましい。
【0065】
本明細書で使用する場合、用語「捕捉剤」は、オリゴヌクレオチド、タンパク質、又は、相互作用するとそのリガンドと非共有結合又は共有結合を形成する他の分子を指す。非共有結合は、典型的には、概して同時に起こる疎水性結合、ファンデルワールス結合、及び水素結合などのいくつかの弱い相互作用を含む。第1の例では、当該リガンドが酵素の基質であり、当該酵素が捕捉剤である場合、当該基質は、酵素と非共有結合してもよい。第2の例では、ビオチンリガンド(又はデスチオビオチンなどのビオチン類似体)は、ストレプトアビジン捕捉剤と結合し、準共有結合を形成する。第3の例として、ジゴキシゲニンリガンドは、捕捉剤と非共有結合で結合し、当該捕捉剤は、ジゴキシゲニンに対する抗体(抗DIG)である。特定の例によれば、当該オリゴヌクレオチドプローブは、ヘアピンアダプタであり、当該ヘアピンアダプタは、抗DIG捕捉剤が結合してもよいジゴキシゲニンリガンドを含む。
【0066】
あるいは、「共有結合」は、原子間又は原子と他の共有結合との間の電子対の共有を特徴とする化学結合の形態を指す。第1の例として、当該リガンドがアミノ酸を含む場合、当該アミノ酸は、捕捉剤に共有結合してもよい。更なる例では、当該リガンドは、第1の官能基を含み、一方、当該捕捉剤は、第2の官能基を含み、当該第1及び第2の官能基は、例えばクリックケミストリーによって相互作用して共有結合を形成する。当該リガンドと当該捕捉剤との間の当該共有結合は、例えば、アミド結合、アミン-チオール結合、Cu(I)触媒アジド-アルキン環化付加、アルキン-ニトロン環化付加などであってもよい。更なる例として、当該リガンドは、タンパク質捕捉剤のカルボキシル(-COOH)又はアミン(-NH)末端と反応することができる官能基(-COOH、-NH、-OHなど)を含んでもよい。セルロースなどの捕捉剤にDNAを結合させるために酵素結合を使用する技術は、欧州特許第152886号に記載された。欧州特許第146815号はまた、DNAを捕捉剤に結合させる様々な方法を記載している。同様に、国際出願第92/16659号は、DNAを結合させるためのポリマー捕捉剤を使用する方法を提案している。オリゴヌクレオチドプローブは、リガンドが結合する「スペーサー」分子又は領域を更に含んでもよく、有利には、その専用の捕捉剤に結合するための更なる空間をリガンドに提供する。非限定的な例として、当該スペーサーは、ポリヌクレオチド領域、テトラエチレングリコール(TEG)、又は当業者に既知の任意の他のスペーサーであってもよい。あるいは、「スペーサー」は、上記のように、TEVプロテアーゼ切断部位又はウラシル塩基などの切断部位、脱塩基部位、又は制限部位を含んでもよく、又はこれらからなってもよい。
【0067】
捕捉剤は、好ましくは固体支持体に固定される。いくつかの実施形態では、複数の捕捉剤は、同じ固体支持体に固定される。非限定的な例として、捕捉剤は、より具体的には、任意の適切な構造又は機構(例えば、融合として表現され、化学的に結合され、(例えば、直接的又は間接的に)、酵素的に結合され、リンカーによって結合される(例えば、ペプチド、核酸、ポリマー、エステル結合、PEGリンカー、炭素鎖など))によって固体支持体に融合、繋ぎ止め、連結などされてもよい。非限定的な例として、可能な支持体としては、ガラス及び変性又は官能化ガラス、プラスチック(アクリル、ポリスチレン、並びにスチレン及び他の材料のコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、テフロン(商標)などを含む)、多糖類、ナイロン又はニトロセルロース、セラミックス、樹脂、シリコン及び修飾シリコンを含むシリカ又はシリカ系材料、炭素、金属、無機ガラス、プラスチック、光ファイバ束、及び様々な他のポリマーが挙げられる。固体支持体は、例えば、ウェル、チューブ、スライド、プレート、樹脂、又はビーズから選択されてもよい。いくつかの実施形態では、固体支持体(例えば、樹脂、ビーズなど)は磁性である。いくつかの実施形態では、固体支持体(例えば、樹脂、ビーズなど)は常磁性である。当該固体支持体がビーズである場合、ビーズサイズは、ナノメートル、例えば、100nm~ミリメートル、例えば1mmの範囲である。
【0068】
第1の態様によれば、捕捉剤は、核酸分子の集団を当該捕捉剤と接触させる前に、固体支持体に固定される。他の場合では、当該捕捉剤を固体支持体に固定する前に、核酸分子の集団を当該捕捉剤と接触させる。両方の場合において、核酸標的領域は、固体支持体に間接的に結合される。
【0069】
当該二重鎖と当該捕捉剤との間の結合の形成後、当該二重鎖は、例えば、当該集団から当該二重鎖を分離することによって、核酸分子の集団から単離されてもよい。好ましくは、捕捉剤(したがって、二重鎖及び関連する標的領域)が固定される支持体は、機械的分離によって、洗浄によって、又は当業者に公知の任意の方法によって、核酸分子の集団から分離される。好ましくは、当該二重鎖は、非標的核酸分子(固体支持体に結合していない)を除去しながら、当技術分野で公知の方法に従って洗浄することによって単離される。好ましくは、洗浄は少なくとも2回実施される。非限定的な例として、洗浄に使用される緩衝剤は、界面活性剤を含んでもよく、又は含まなくてもよい。当該界面活性剤は、イオン性又は非イオン性界面活性剤であってもよい。非限定的な例として、当該界面活性剤は、ポリソルバート-20(一般にTween-20として知られている、4-(1,1,3,3-テトラメチルブチル)フェニル-ポリエチレングリコール(一般にTriton X100として知られている)又はドデシル硫酸ナトリウム(SDS)であってもよい。界面活性剤は、約0.05%~約1.5%の濃度で洗浄緩衝液中に含まれてもよい。二重鎖は、単一の洗浄緩衝液で、又は複数の洗浄緩衝液で洗浄されてもよい。各洗浄は、同じ洗浄緩衝液又は異なる洗浄緩衝液を使用してもよい。例えば、界面活性剤含有洗浄緩衝液を1回の洗浄に使用してもよく、一方で、界面活性剤を含まない洗浄緩衝液を別の洗浄に使用してもよい。
【0070】
いくつかの場合、単離された標的領域を含む単離された二重鎖は、下流用途で直接使用されてもよい。あるいは、当該二重鎖の単離後、当該標的領域は、好ましくは、任意の適切な機構(例えば、化学的又は酵素的切断)によって遊離される。非限定的な例として、当該標的領域は、当該標的領域を当該二重鎖から遊離することによって、当該固体支持体(例えばビーズ)から遊離される。当該二重鎖から当該標的領域を遊離させることは、特に、例えば、当該二重鎖を適切な制限酵素と接触させることによって、当該二重鎖内の制限部位での切断など、当該二重鎖内の部位特異的切断を含んでもよい。あるいは、当該二重鎖(当該標的領域が結合している)は、それ自体が任意の適切な機構によって固体支持体から遊離される。非限定的な例として、捕捉剤と二重鎖との間に存在する切断部位(例えば、オリゴヌクレオチドプローブの一本鎖領域又はスペーサー領域内に位置する)は、切断され、(例えば、化学的、酵素的に)、二重鎖が遊離される。
【0071】
好ましい実施形態によれば、本明細書で提供される方法は、当該標的領域から当該二重鎖を遊離する工程を更に含み、当該標的領域から当該二重鎖を遊離する工程は、好ましくは、当該二重鎖内で、より好ましくは上記のように切断する工程を含む。
【0072】
別の非限定的な例として、捕捉剤とリガンドとの間の非共有結合の場合、過剰なリガンドが添加されてもよく、当該リガンドは、結合リガンド(したがって、二重鎖及び標的領域)が捕捉剤から解離するように結合リガンドと競合する。非限定的な例として、当該リガンド及び当該過剰なリガンドは、ジゴキシゲニンであってもよい。特定の例では、当該過剰なリガンドは、当該リガンドのバリアントであってもよく、当該過剰なリガンドは、オリゴヌクレオチドプローブに含まれるリガンドよりも捕捉剤に対する親和性が高い。これにより、二重鎖、したがって標的領域の解離が有利に促進される。特定の例として、当該リガンドはデスチオビオチンであってもよく、一方で、当該過剰なリガンドはビオチンである。更に他の実施形態では、捕捉剤は、それ自体が表面から遊離され、それによって捕捉剤、二重鎖、及び標的領域を含む複合体全体が遊離される。これらの代替物の各々は、固体支持体からの標的領域の遊離をもたらす。有利には、酵素的切断は、5’又は3’オーバーハング、好ましくは3’オーバーハングを生じる。
【0073】
好ましい実施形態によれば、工程e)は、
当該二重鎖を捕捉剤と接触させることであって、当該捕捉剤は、好ましくは、オリゴヌクレオチドプローブのリガンドに結合する、ことを含む。
【0074】
好ましくは、当該捕捉剤は、固体支持体に固定される。
【0075】
好ましい実施形態によれば、当該捕捉剤が固体支持体に固定される場合、標的領域を単離する方法は、好ましくは当該標的領域から当該二重鎖を遊離することによって、当該固体支持体から標的領域を遊離することを更に含む。
【0076】
特定の実施形態では、工程a)において、当該標的領域を第2のクラス2タイプV Casタンパク質-gRNA複合体と接触させる場合、工程d)において、当該核酸の集団を第2のオリゴヌクレオチドプローブと接触させてもよく、当該第2のプローブは、第1のプローブに含まれるものと同じ又は異なるリガンドを含んでもよい(例えば、両方のプローブがビオチンリガンドを含むか、又は一方のプローブがビオチンリガンドを含み、第2のプローブがジゴキシゲニンリガンドを含む)。
【0077】
当該プローブの両方が同じリガンドを含む場合、両方の二重鎖(すなわち、標的領域の両側に存在する)は、所与の捕捉剤と結合する。例えば、両二重鎖が、ビオチンが結合したオリゴヌクレオチドプローブを含む場合、両方ともストレプトアビジンコーティングビーズに結合する。これは、各標的領域が2つのリガンドの共有結合又は非共有結合を介して、固体支持体に同時に結合されるため、濃縮を有利に改善することができる。
【0078】
したがって、特定の実施形態によれば、工程e)は、
当該第1及び当該第2の二重鎖を捕捉剤と接触させることであって、当該捕捉剤が当該第1及び当該第の2プローブのリガンドに結合する、ことと、
当該標的領域から当該第1及び当該第2の二重鎖を遊離することと、を含む。
【0079】
代替的な好ましい実施形態によれば、工程e)は、
当該第1及び当該第2の二重鎖を捕捉剤と接触させることであって、当該捕捉剤が、当該第1及び当該第2のプローブのリガンドに結合し、当該捕捉剤が固体支持体に固定される、ことと、
当該核酸標的領域を固体支持体から、好ましくは当該第1の二重鎖及び当該第2の二重鎖を標的領域から遊離させることによって遊離させることと、を含む。
【0080】
代替的な特定の実施形態では、当該第2のオリゴヌクレオチドプローブが異なるリガンドを含む場合、第2の二重鎖を単離する前に、当該第1の二重鎖を単離することが好ましい。この場合、工程e)が2回目に繰り返される。これは、図5に特に示されており、各オリゴヌクレオチドプローブは異なるリガンドを含み、連続的な単離が行われる。
【0081】
好ましい実施形態によれば、工程e)は、
当該第1の二重鎖を第1の捕捉剤と接触させることであって、当該第1の捕捉剤が当該第1のプローブの当該リガンドに結合する、ことと、
当該標的領域から当該第1の二重鎖を遊離させることと、
当該第2の二重鎖を第2の捕捉剤と接触させることであって、当該第2の捕捉剤が当該第2のプローブの当該リガンドに結合する、ことと、
当該標的領域から当該第2の二重鎖を遊離することと、を含む。
【0082】
特定の実施形態によれば、工程e)は、
当該第1の二重鎖を第1の捕捉剤と接触させることであって、当該第1の捕捉剤が当該第1のプローブの当該リガンドに結合する、ことと、
当該標的領域から当該第1の二重鎖を遊離させることと、
ヘアピンアダプタを第2の捕捉剤と接触させることであって、当該第2の捕捉剤が当該ヘアピンアダプタのリガンドに結合する、ことと、
当該ヘアピンアダプタを当該標的領域から遊離させることと、を含む。
【0083】
例えば上記の実施形態のいずれかに従って、2つ以上の捕捉剤を使用する連続的な単離が行われる場合、第1及び第2の二重鎖の単離は、任意の順序で実施されてもよいことが当業者には理解されよう。
【0084】
任意選択の補足工程
断片化
本発明の特定の実施形態によれば、上記方法においてクラス2タイプV Casタンパク質-gRNA複合体と接触させる前又は後に、有利にはクラス2タイプV Casタンパク質-gRNA複合体と接触させた後に、核酸分子は断片化されてもよい。本明細書で使用する場合、用語「断片化」は、核酸分子を少なくとも2つのより小さい分子に切断することによる、核酸分子5’-及び3’の遊離末端の数の増加を指す。核酸断片は、より小さい核酸分子が本発明の方法に従ってより容易に単離することができるため、有利である。「非標的」核酸領域(例えば、クラス2タイプV Casタンパク質-gRNA複合体が結合する標的領域及び隣接部位以外の領域)は、この工程において当該標的から有利に分離され、それにより、本方法を実施する際の標的領域の濃縮が改善される。
【0085】
断片化は、例えば、超音波処理、水剪断、超音波、噴霧化による剪断によって、又は例えば制限酵素などの1つ以上の部位特異的エンドヌクレアーゼを使用することによる酵素的断片化によって行ってもよい。部位特異的エンドヌクレアーゼによって断片化が行われる場合、1つ以上の部位特異的エンドヌクレアーゼ、好ましくは1、2、3、4、5種以上の部位特異的エンドヌクレアーゼが使用されてもよい。データベースで利用可能な配列の数が増え続けることにより、当業者は、標的領域を含む核酸の外側に切断部位が位置する1つ以上の制限酵素を容易に同定することが可能になることが理解されよう。有利には、2種以上の酵素が同時に使用される場合、当該酵素は互いに適合性がある(例えば、同じ緩衝液要件、不活性化条件)。断片化は、部分的であってもよく(例えば、集団の核酸分子中に存在する全ての切断部位が制限酵素によって切断されるわけではない)、又は完全であってもよい。したがって、用語「断片化」は、クラス2タイプV Casタンパク質-gRNA複合体が結合する標的領域及び隣接部位以外の核酸を少なくとも部分的に断片化することを含む。
【0086】
したがって、いくつかの実施形態では、標的領域を含む核酸を調製する方法は、
核酸分子の集団を、好ましくは少なくとも1種の部位特異的エンドヌクレアーゼ、より好ましくは少なくとも1種の制限酵素と接触させることによって、当該集団を断片化する工程を更に含む。
【0087】
非標的領域(すなわち、クラス2タイプV Casタンパク質が結合する当該標的領域及び当該第1の部位以外の領域)のみが断片化されることが特に好ましい。第2の部位も当該標的領域に隣接して存在する場合、当該標的領域、当該第1の部位、及び当該第2の部位以外の領域のみが断片化されることが更に好ましい。
【0088】
したがって、特定の実施形態によれば、本明細書で提供される方法は、好ましくは、核酸分子の当該集団を少なくとも1種の部位特異的エンドヌクレアーゼと接触させることによって、工程b)の前又は間に核酸分子の当該集団を断片化することを更に含み、当該部位特異的エンドヌクレアーゼは、
当該標的領域又は当該第1の部位内で切断せず、
当該分子が第2の部位を含む場合、当該第2の部位内で切断せず、
好ましくは、当該部位特異的エンドヌクレアーゼは、制限酵素である。
【0089】
当業者は、断片化の上記の工程が、任意の工程で、例えば工程a)の前若しくは工程a)の間、工程a)と工程b)の間、工程b)の間、工程b)とc)の間、工程c)の間、又は工程e)の間に行われてもよいことを理解するであろう。酵素的断片化が行われ、当該部位特異的エンドヌクレアーゼがクラス2タイプV Casタンパク質-gRNA複合体と同じ条件(例えば、緩衝液、温度)で切断される場合、断片化する工程は、好ましくは、核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させる工程a)と同時に行われる。
【0090】
好ましい実施形態によれば、核酸分子は、核酸分子の集団を少なくとも1種の部位特異的エンドヌクレアーゼ、好ましくは少なくとも1、2、3、4、5種以上の部位特異的エンドヌクレアーゼと接触させることによって断片化される。好ましくは、当該部位特異的エンドヌクレアーゼは、制限酵素、より好ましくはII型、III型、又は人工制限酵素、更により好ましくはII型制限酵素、及び/又はCas12a-gRNA複合体などのクラス2タイプV Casタンパク質-gRNA複合体である。II型制限酵素としては、IIP、IIS、IIC、IIT、IIG、IIE、IIF、IIG、IIM、及びIIB型の分類が挙げられ、例えば、Pingoud and Jeltsch,Nucleic Acids Res,2001,29(18):3705-3727に記載されている。好ましくは、これらの分類からの1種以上の酵素が、本発明において核酸分子を断片化するために使用される。適切な酵素は、当業者によって選択することができる。互いに適合しない複数の制限酵素が使用される場合、断片化は、異なる制限酵素及び条件(例えば、温度、時間、緩衝液)を使用して、複数の連続的な工程を含んでもよい。好ましくは、少なくとも1種の部位特異的エンドヌクレアーゼは、非パリンドロームオーバーハングを生成する。好ましくは、切断部位の少なくとも50%、60%、70%、80%、90%、95%、又は100%が部位特異的エンドヌクレアーゼによって切断される。部位特異的エンドヌクレアーゼがクラス2タイプV Casタンパク質-gRNA複合体である場合、当該タンパク質-gRNA複合体は、調製される標的領域を含む核酸分子に結合し、外側の部位で切断する。好ましくは、部位特異的エンドヌクレアーゼは、標的領域を含む核酸領域から100~5000塩基、より好ましくは標的領域を含む核酸領域から150~1000塩基、更により好ましくは標的領域を含む核酸領域から250~750塩基に位置する配列に結合する。好ましくは、部位特異的エンドヌクレアーゼは、ヒトゲノム中のAluエレメントなどの核酸分子内に複数回存在するが、標的領域を含む核酸分子には存在しない特定の配列を標的とする。
【0091】
特定の実施形態によれば、核酸分子の集団をクラス2タイプV Casタンパク質-gRNA複合体と接触させた後、当該集団を、3’~5’一本鎖エキソヌクレアーゼ活性を有する少なくとも1種の酵素、及び上記の実施形態のいずれかによる当該核酸分子を断片化する少なくとも1種の部位特異的エンドヌクレアーゼと、同時に接触させる。これは、本方法の期間を短縮するので、特に有利である。別の好ましい実施形態によればと、3’~5’一本鎖エキソヌクレアーゼ活性を有する当該酵素はまた、部位特異的エンドヌクレアーゼ活性を有してもよい。この実施形態によれば、部位特異的エンドヌクレアーゼ活性を有する酵素の切断部位は、当該第1の部位及び当該標的領域の外側に位置する。第2の部位が存在する場合、切断部位はまた、当該第2の部位の外側に位置する。エキソヌクレアーゼ及び部位特異的エンドヌクレアーゼ活性の両方を有する単一の酵素の使用は、必要な試薬の数及びコストを低減するので、特に有利である。
【0092】
部位特異的エンドヌクレアーゼ
いくつかの場合、上記のように、本方法は、工程c)の前の任意の段階(すなわち、工程a)又は工程b)の前、間、又は後)で核酸分子の集団を部位特異的エンドヌクレアーゼと接触させる工程を更に含んでもよい。部位特異的エンドヌクレアーゼは、好ましくはCasタンパク質-gRNA複合体であり、より好ましくはクラス2 Casタンパク質-gRNA複合体であり、更により好ましくは第2のクラス2タイプV Casタンパク質-gRNA複合体である。しかし、特定の部位で核酸に安定に結合する任意の他の部位特異的ヌクレアーゼ、例えば転写活性化因子様エフェクターヌクレアーゼ(TALEN)又はジンクフィンガータンパク質も本発明の範囲に含まれる。この工程は、分子の両端が修飾される場合(例えば、標的領域の両側に1つずつ、2つの5’オーバーハングを生成する)場合に特に有利である。標的領域の一方の側に単一の5’オーバーハングを含み、標的領域の他方の側に平滑末端を含む分子を得ることが望ましい場合、核酸分子の当該集団をクラス2タイプII Casタンパク質-gRNA複合体、好ましくはCas9-gRNA複合体と有利に接触させる。
【0093】
当該部位特異的エンドヌクレアーゼは、核酸分子内に結合する。
【0094】
したがって、好ましい実施形態によれば、本発明の方法は、核酸分子の当該集団を、工程c)の前に、部位特異的エンドヌクレアーゼと接触させることを更に含み、当該部位特異的エンドヌクレアーゼは、好ましくはTALEN、ジンクフィンガータンパク質、又はクラス2 Casタンパク質-gRNA複合体であり、より好ましくは第2のクラス2タイプV Casタンパク質-gRNA複合体であり、gRNAは第2の部位に相補的なガイドセグメントを含み、当該第2の部位は当該標的領域に隣接し、当該第1の部位及び当該第2の部位は当該標的領域の両側に位置する。核酸分子の集団を複数のCasタンパク質-gRNA複合体(例えば複数のクラス2タイプV Casタンパク質-gRNA複合体)と接触させる場合、核酸分子の集団を当該Casタンパク質-gRNA複合体の全てと同時に接触させることが特に好ましい。これは、本方法の期間を短縮するので、有利である。好ましくは、当該部位特異的エンドヌクレアーゼは、Cas12a-gRNA複合体である。好ましくは、PAM部位は、核酸標的領域に直接隣接している。したがって、本方法の特定の実施形態によれば、工程a)は、核酸分子の集団を第1及び第2のCas12a-gRNA複合体の両方と接触させることを含み、当該第1及び第2の複合体は、第1及び第2の部位にそれぞれ結合し、当該第1及び第2の部位が、当該標的領域に隣接して、その両側に位置する。
【0095】
好ましい実施形態によれば、部位特異的エンドヌクレアーゼは、クラス2タイプV Casタンパク質-gRNA-核酸複合体に対して少なくとも50ヌクレオチド、好ましくは少なくとも100、250、500、1,000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、500,000、750,000、又は1,000,000ヌクレオチド離れて位置する部位に結合する。したがって、好ましい実施形態によれば、標的領域は、少なくとも50、100、250、500、1,000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、500,000、750,000、又は1,000,000ヌクレオチドの長さを有する。
【0096】
好ましい実施形態によれば、当該部位特異的エンドヌクレアーゼが第2のクラス2タイプV部位特異的エンドヌクレアーゼである場合、当該集団を、当該第2の部位において第2の5’一本鎖オーバーハングに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドプローブと接触させ、それによって第2の二重鎖を形成させる。この場合、当該第1及び第2のプローブは、好ましくは、異なるリガンドを含み、当該リガンドは、本明細書で論じられるように、異なる捕捉剤に結合する。
【0097】
ヘアピンアダプタ
いくつかの場合において、本方法は、核酸分子の集団をヘアピンアダプタと接触させる工程を更に含んでもよい。ヘアピンアダプタは、当該集団内に存在する1つ以上の核酸分子の1つ以上の遊離末端に結合する。当該工程は、クラス2タイプV Casタンパク質-gRNA複合体と接触する前又は同時に実施されてもよい。断片化が実施される場合、当該工程は、好ましくは断片化後に実施される。本明細書で使用する場合、用語「ヘアピン」又は「ヘアピンアダプタ」は、二本鎖のステム及びループを有する構造体を形成するようにそれ自体と対をなす分子を指し、一本の鎖の5’末端は、非対のループを介して他方の鎖の3’末端に物理的に結合されている。当該物理的結合は、共有結合又は非共有結合のいずれかであってもよい。優先的に、当該物理的結合は共有結合である。本明細書で使用する場合、用語「ループ」は、水素結合を介して当該核酸の同一又は別の鎖のヌクレオチドと対になっておらず、したがって一本鎖である核酸鎖の一連のヌクレオチドを指す。本明細書で使用する場合、「ステム」は、鎖内対合の領域を指す。好ましくは、ステムは、少なくとも3、5、10、又は20塩基対、より好ましくは少なくとも5、10、又は20塩基対、更により好ましくは少なくとも10又は20塩基対を含む。ヘアピンが二本鎖核酸分子の遊離末端に結合すると、ヘアピンの3’末端及び5’末端は、それぞれ二本鎖核酸分子の5’末端及び3’末端にライゲーションする。当該ヘアピンは、オーバーハング又は平滑末端に結合してもよい。したがって、ヘアピンアダプタは、特定の配列又は部位に結合する必要はない。
【0098】
好ましくは、当該ヘアピンアダプタは、核酸分子の遊離末端の一方又は両方に結合する。当該ヘアピンアダプタは、核酸分子の遊離末端のうちの1つに特異的に結合してもよく、又は全ての核酸分子の全ての遊離末端に非特異的に結合してもよい。非限定的な例として、特異的結合は、非パリンドローム制限酵素を用いて核酸分子を断片化し、それによって核酸分子の各新しい遊離末端に異なるオーバーハングを生成することによって行われてもよい。他の場合では、核酸分子は、ヘアピンアダプタがライゲーションされてもよく、したがって非特異的に結合してもよい平滑末端を含んでもよい。更なる例では、適切な「T」ヌクレオチドオーバーハングを含むヘアピンアダプタが次いでハイブリダイズし、当該部位にライゲーションされてもよいように、核酸分子の集団(断片化されているか否かにかかわらず)はAテーリングを受けてもよい。好ましい実施形態では、クラス2タイプV Casタンパク質-gRNA複合体によって結合された当該第1の部位及び当該遊離末端(したがって、当該ヘアピンアダプタ)は、当該標的領域の両側に位置する。この構造は、クラス2タイプV Casタンパク質-gRNA複合体を除去した後に、核酸の集団を、核酸標的領域に隣接する遊離末端に特異的に結合するヘアピンアダプタと接触させることによって得てもよく、当該第1の側及び当該遊離末端は、当該標的領域の両側に位置する。あるいは、当該ヘアピンアダプタは、全ての遊離末端に結合してもよく、核酸の当該集団は、当該クラス2タイプV Casタンパク質-gRNA複合体と接触する前又は同時に、当該ヘアピンアダプタと接触する(図3も参照)。
【0099】
本明細書で使用する場合、用語「遊離末端」は、5’末端にリン酸基及び/又は3’末端にヒドロキシル基を含んでもよい核酸分子の末端を指す。遊離末端は、平滑末端であってもよく、又は一本鎖オーバーハングを含んでもよい。当該一本鎖オーバーハングは、3’又は5’オーバーハングであってもよい。当該一本鎖オーバーハングは、好ましくは100、50、25、10、5、4、3、又は2ヌクレオチド未満の長さを有し、より好ましくは、当該一本鎖オーバーハングは、1ヌクレオチドの長さを有する。
【0100】
好ましい実施形態によれば、ヘアピンアダプタは、クラス2タイプV Casタンパク質-gRNA-核酸複合体に対して少なくとも50ヌクレオチド、好ましくは少なくとも100、250、500、1,000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、500,000、750,000、又は1,000,000離れて位置する遊離末端に結合する。したがって、好ましい実施形態によれば、標的領域は、少なくとも50、100、250、500、1,000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、500,000、750,000、又は1,000,000ヌクレオチドの長さを有する。
【0101】
好ましくは、当該ヘアピンアダプタは、核酸分子に結合され、好ましくは核酸分子にライゲーションされる。より好ましくは、工程a)は、核酸の集団をヘアピンアダプタと接触させ、当該ヘアピンアダプタを核酸分子遊離末端に結合することを含む。好ましい実施形態では、本方法は、必要に応じて(例えば、試料が環状核酸分子を含む場合)、当該集団をヘアピンアダプタと接触させる前に、核酸分子の集団を線形化する工程を更に含む。
【0102】
特定の実施形態によれば、複数の標的領域を単離する場合、核酸分子の集団を、クラス2タイプV Casタンパク質-gRNA複合体に加えて、部位特異的エンドヌクレアーゼ、好ましくは本明細書に記載のクラス2 Casタンパク質-gRNA複合体、及びヘアピンアダプタの両方と接触させてもよい。核酸分子の当該集団は、同時に又は任意の順序で連続的に当該分子と接触させてもよい。
【0103】
インキュベーション及び/又は保存
本発明の特定の実施形態によれば、核酸分子は、本明細書で提供される方法の工程c)、工程d)、又は工程e)の後に保存されてもよい。
【0104】
特定の実施形態によれば、核酸分子は、本明細書で提供される方法の任意の工程の前、間、又は後にインキュベートされてもよい。好ましくは、核酸分子の集団は、クラス2タイプV Casタンパク質-gRNA複合体と接触させている間又は後に(工程a)、3’~5’一本鎖エキソヌクレアーゼ活性を有する少なくとも1種の酵素と接触させている間又は後に(工程b)、タイプV Casタンパク質-gRNA複合体の除去中に、工程c)の集団をオリゴヌクレオチドプローブと接触させる工程d)の間に、及び/又は核酸分子の集団から当該二重鎖を単離する工程e)の間に、インキュベーションに供されてもよい。好ましくは、核酸分子の集団は、15分~2時間の範囲のインキュベーション時間に供される。当業者は、酵素活性を最大化するか、又は酵素活性を最大化しながら方法の期間を短縮する適切なインキュベーション時間/温度を特に認識しており、当業者は、必要に応じてインキュベーション時間/温度を更に適合させてもよい。
【0105】
下流用途
上記の方法のうちの1つに従って単離された核酸標的領域は、有利には高度に濃縮される。単離された核酸は、広範な用途において特に有用である。実際に、本発明に従って単離された核酸は、同じ容器内で行われてもよい更なる処理、反応、又は分析に供してもよく、又は供さなくてもよい。一例として、本発明に従って単離された核酸は、検出、クローニング、配列決定、増幅、ハイブリダイゼーション、cDNA合成、診断及び核酸を必要とする当業者に公知の任意の他の方法に使用されてもよい。いくつかの場合、単離された核酸標的領域は、更なる単離、濃縮、又は精製に供されてもよい。
【0106】
本方法は、1つ以上の標的領域の単離後に、ヘアピンのライブラリを生成するのに特に適しており、各ヘアピンは、少なくとも1つの核酸標的領域を含む。したがって、この方法は、例えば生物学的試料中の核酸分子の全集団から単離された対象となる標的領域、例えば特定の対立遺伝子の配列、又は対象となる標的領域のエピジェネティック修飾を検出又は決定するのに特に便利である。
【0107】
本発明の好ましい態様によれば、本発明の方法は、追加の工程を更に含んでもよい。非限定的な例として、単離された核酸は、プロテアーゼなどのタンパク質、塩、EDTA、過剰なオリゴヌクレオチドなどを除去するために周知の精製方法(例えばビーズ又はカラム精製、例えば常磁性ビーズによる精製)を使用して更に精製されてもよい。非限定的な例として、核酸分子は、標的領域又は標的領域に隣接して位置する部位にハイブリダイズ及び/又はライゲーションされてもよく、核酸分子の一本鎖ギャップは、相補鎖の合成によって埋められてもよく、及び/又は鎖置換が行われてもよい。これらの追加の工程のうちの1つ以上は、ヘアピンライブラリを生成するために特に有用であるが、他の下流用途のために単離された核酸を調製する際に必要なことがある。特定の例では、1つ以上の二本鎖核酸標的領域、又は当該標的領域を含む分子が、本発明の方法に従って単離される場合、本明細書で以前に定義されたようなヘアピン分子は、次いで、当該標的領域又は分子の一方又は両方の遊離末端にライゲーションされてもよい。好ましくは、ヘアピンは、単離された核酸標的領域又は分子の一方の遊離末端にライゲーションされる(図6も参照)。好ましくは、当該単離された核酸標的領域又は分子の少なくとも1つの遊離末端は、3’又は5’オーバーハングを含む。好ましくは、当該ヘアピンは、当該単離された核酸標的領域又は分子のそれぞれ5’又は3’オーバーハングのうちの少なくとも1つと少なくとも部分的に相補的である3’又は5’オーバーハングを含む。好ましくは、当該ヘアピンは、単離された核酸標的領域又は分子の一端の3’オーバーハングにライゲーションされる。代替例として、ヘアピンは、有利には、5’DNAフラップを切断するFEN1酵素の存在下でオーバーハングにライゲーションされる。実際に、本発明者らは、単離される断片の調製に触媒活性Cas12aが使用される場合、FEN1の存在下でヘアピンをオーバーハングにライゲーションすると、オリゴヌクレオチドの5’末端に存在する突出ヌクレオチドの切断が促進されることを見出した(図7も参照)。実際に、Cas12aなどのクラス2タイプV Casタンパク質は、図1Cに示されるように、常に同じ位置で切断するとは限らない。当該ヘアピンのライゲーション後、ギャップ埋め及びライゲーション反応は、当該技術分野において周知の方法を用いて実施されてもよい。
【0108】
したがって、第1の実施形態によれば、本発明の方法は、以下の工程、
1つ以上の一本鎖又は二本鎖核酸分子を、単離された核酸標的領域にハイブリダイズ及び/又はライゲーションすることを更に含む。
【0109】
好ましくは、当該一本鎖又は二本鎖核酸分子は、標的領域に隣接する5’-又は3’オーバーハングにハイブリダイズする。ハイブリダイゼーション後、ライゲーションを行うことが好ましい。特定の実施形態では、本方法は、以下の工程、
少なくとも1つの一本鎖核酸分子を、標的領域に隣接する5’-又は3’オーバーハングにハイブリダイズさせることと、
当該一本鎖核酸分子を二本鎖領域にライゲーションすることと、を含んでもよい。
【0110】
しかし、一本鎖核酸分子(例えば、オリゴヌクレオチド)が二本鎖領域に直接当接する標的の一本鎖領域に結合する場合、ライゲーションはハイブリダイゼーションなしで直接行われてもよい。
【0111】
好ましい実施形態によれば、当該一本鎖核酸分子は、標的領域を含む核酸分子内に残るオリゴヌクレオチドプローブの一本鎖領域にハイブリダイズする。好ましくは、当該オリゴヌクレオチドプローブは、全ての一本鎖核酸分子がハイブリダイズしてもよい一本鎖配列を含む。当該一本鎖配列は、人工配列(すなわち、天然に存在しない)であってもよい。このような一本鎖配列がプローブ内に存在することは、例えばヘアピン分子の構築のために複数の配列特異的一本鎖核酸分子を設計する必要がないため、複数の核酸標的領域が単離される場合に特に有利である。実際に、全ての一本鎖核酸分子は、全てのプローブ中に存在する同じ配列に結合してもよい。したがって、プローブ中の当該配列及び相補的配列を含む当該一本鎖核酸分子は、「ユニバーサル」であると言われる。これは、図8に特に示されている。
【0112】
別の実施形態によれば、本方法は、以下の工程、
少なくとも1つの一本鎖核酸分子を、単離された標的領域にハイブリダイズすることと、
好ましくは、当該単離された標的領域を核酸ポリメラーゼと接触させることによって、当該一本鎖核酸分子を、二本鎖領域に伸長することと、
当該伸長された一本鎖核酸分子を、二本鎖領域にライゲーションすることと、を含む。
【0113】
好ましい実施形態によれば、少なくとも1つの一本鎖核酸分子は、3’-オーバーハング上でハイブリダイズ及びポリマー化される。好ましくは、当該一本鎖核酸分子は、オリゴヌクレオチドプローブによって提供される配列上の第1の部位及び標的領域の外側に位置する領域にハイブリダイズする。好ましくは、当該一本鎖核酸分子は、オリゴヌクレオチドプローブ及び5’オーバーハングによって形成される二重鎖から2塩基以上離れて位置する領域にハイブリダイズする(例えば、図6(E)、図8も参照)。ハイブリダイゼーション、伸長、及びライゲーションの方法は、当業者に周知である。
【0114】
いくつかの場合、上記の実施形態のいずれかを繰り返して、例えば、第2の一本鎖核酸分子を単離された標的領域に付加してもよい(例えば、図6を参照)。当該第2の一本鎖核酸分子は、同じ鎖又は反対の鎖にハイブリダイズされてもよく、標識又はリガンドを含んでもよく、又は含まなくてもよい。当該一本鎖核酸分子は、単離された標的領域の配列に対してのみ部分的に相補的であってもよい。当該一本鎖核酸分子は、好ましくは、単離された標的領域に結合しない(例えば、単離された標的領域の配列と相補的ではない)スペーサー領域、例えば、12個の炭素スペーサー又は本明細書に記載されるか又は当業者に公知の任意の他のスペーサーを含んでもよい。好ましくは、一本鎖核酸分子は、ライゲーションのための5’リン酸基を含む。
【0115】
任意選択で、次いで、ハイブリダイズしていない一本鎖核酸分子などの過剰な試薬を除去する。一例として、ハイブリダイズしていない一本鎖核酸分子は、単離された標的領域を含む試料を、3’~5-エキソヌクレアーゼ活性を有する酵素、より好ましくはExoIと接触させることによって除去される。
【0116】
ヘアピン構造は、好ましくは、参照によりその全体が本明細書に組み込まれる、国際公開第2011/147931号、国際公開第2011/147929号、国際公開第2013/093005号、及び国際公開第2014/114687号に記載されているものなどの下流用途での使用に特に適合している、本明細書に記載の方法のいずれかに従って得られる。あるいは、本明細書で生成されるヘアピン構造は、ヘアピン前駆体分子(例えば、参照によりその全体が本明細書に組み込まれる、国際公開第2016/177808号に記載されているHP2分子)として使用するように特に適合されてもよい。
【0117】
好ましくは、本明細書に記載される実施形態のいずれかの1つ以上の一本鎖核酸分子は、その全体が参照により本明細書に組み込まれるZhang et al.,Nat Chem,2012,4(3):208-214に記載されているように、最適化されたハイブリダイゼーション特異性を有する。あるいは、本明細書に記載される実施形態のいずれかの当該1つ以上の一本鎖核酸分子は、縮重されてもよい。
【0118】
好ましくは、上記実施形態のいずれかの1つ以上の一本鎖核酸分子は、標識又はリガンドを含む。非限定的な例として、標識又はリガンドは、FITC、ジゴキシゲニン、ビオチン、又は当業者に公知の任意の他の標識であってもよい。当該標識又はリガンドは、化学結合及び化学的架橋剤などの技術を使用してタンパク質にコンジュゲートされてもよい。有利には、当該標的領域は、例えば、蛍光標識又は当業者に公知の他の検出可能な標識若しくはリガンドを介して、試料内で検出され、任意選択で定量されてもよい。いくつかの場合、標的領域は、当該リガンドを使用して更に単離され、又は精製されてもよい。第1の態様では、標的領域は、当業者に公知の方法に従って、例えば、オリゴヌクレオチドがビオチンで標識されている場合、ストレプトアビジンでコーティングされたビーズ上で、更なるプルダウン反応を介して単離されてもよい。第2の態様では、標的領域は、当該標識又はリガンドを介して、ビード又はチップなどの支持体に結合されてもよい。好ましくは、当該支持体は、標識された標的領域の結合を促進するように官能化され、当該標識又はリガンドは、支持体上に存在する官能基と反応する(例えば、支持体は、適切な標識又はリガンドと反応するストレプトアビジン又はCOOH基でコーティングされてもよい)。
【0119】
特定の実施形態によれば、上記実施形態のいずれかの一本鎖核酸分子のうちの少なくとも1つは、当該配列がオリゴヌクレオチドプローブに含まれない場合、固体支持体(例えば、表面)に結合したオリゴヌクレオチドに相補的な配列を含む。好ましくは、当該オリゴヌクレオチドは、伸長を防止するために、その3’末端に修飾を含む。タグの有無にかかわらず、一本鎖核酸分子のハイブリダイゼーション及び3’オーバーハングへのライゲーションは、有利には、国際公開第2011/147931号、国際公開第2011/147929号、国際公開第2013/093005号及び国際公開第2014/114687号に記載されているものなどの下流用途での使用に特に適合したヘアピン構造を生成する。好ましくは、本明細書に記載の実施形態のいずれかは、「Y」字形を有するヘアピンを生成する。
【0120】
本発明は更に、当業者が、当該配列を有する核酸分子の数を列挙することを可能にする。好ましい実施形態によれば、本発明の方法は、国際公開第2013/093005号に記載されるように核酸分子を検出及び定量することを更に含む。
【0121】
本発明の単離された標的領域は、国際公開第2011/147931号及び国際公開第2011/147929号に記載されている方法などの単一分子分析方法、国際公開第2013/093005号に記載されているような核酸検出及び定量方法、並びに国際公開第2014/114687号に記載されているような核酸へのタンパク質結合を検出するための方法による下流分析に特に適している。したがって、本方法の更なる実施形態及び用途は、参照によりその全体が本明細書に組み込まれるこれらの用途に見出すことができる。
【0122】
本発明の好ましい実施形態によれば、本方法は、単離された標的領域内に含まれるSNP又は遺伝子モザイク現象の濃縮を含む。いくつかの場合、SNP又は遺伝子モザイク現象は、標的領域自体の内部に位置する(したがって、クラス2タイプV Casタンパク質-gRNA複合体内のgRNAによって認識される部位には位置しない)。しかし、他の場合には、SNP又は遺伝子モザイク現象は、クラス2タイプV Casタンパク質-gRNA複合体内のgRNAによって認識される部位に位置してもよい。特定の実施形態では、gRNAは、SNPのマイナー対立遺伝子に対応するヌクレオチド塩基を含む。SNPの複数の対立遺伝子が所与の遺伝子座に存在する場合、複数のgRNA分子が、各対立遺伝子に対応して、好ましくは各マイナー対立遺伝子に対応して提供されてもよい。主対立遺伝子及びマイナー対立遺伝子の両方に対応するgRNA分子が提供される場合、各対立遺伝子を含む単離された標的領域の数を定量して、例えば、対象がSNP遺伝子座においてホモ接合性又はヘテロ接合性であるかどうかを決定してもよい。好ましくは、SNP遺伝子座に対応する塩基は、PAM部位に対して、-1~-10、好ましくは-1~-6、好ましくは-4、-5、又は-6の塩基のいずれか1つにおいて、gRNA配列内に位置する。実際に、これらの塩基のうちの1つ以上でミスマッチが生じる場合、SNP遺伝子座を含む領域へのgRNAのハイブリダイゼーションが低減される。エキソヌクレアーゼによる消化からの核酸領域の保護もまた、この場合には低減又は消失される。この位置決めは、SNPの有無を判定する際に、誤差の可能性を低減することができるため、特に有利である。いくつかの場合、標的核酸領域を配列決定して、SNP遺伝子座における対立遺伝子を決定する。これは、特に、SNP遺伝子座に縮重塩基を含むgRNAを使用する場合、標的領域内の隣接SNP遺伝子座に存在してもよい対立遺伝子を同定するために、又は当該SNPが標的領域自体に含まれる場合(すなわち、gRNAは、当該標的領域に隣接する部位に相補的である)に行われてもよい。実際に、当業者に周知のように、ゲノム内で互いに近接して位置するSNPは、一緒に遺伝する傾向がある。
【0123】
標的領域の切断が低減又は消失する程度は、実験条件、使用されるクラス2 Casタンパク質、及び/又は使用されるgRNAによって異なる。例えば、Cas12aは、Cas9よりも結合特異性が高いことが知られている(Strohkendl et al.,Molecular Cell,2018,71:1-9)。したがって、ミスマッチを含む領域のハイブリダイゼーション特異性又は保護は、Cas12aが使用される場合よりも、Cas9が使用される場合の方が大きくなる。最適化された結合特異性を有するCas12aタンパク質又はそのバリアントは、特に、ミスマッチを含む領域の単離が望まれるか否かに従って使用されてもよい。
【0124】
本発明の好ましい実施形態によれば、本方法は、単離された標的領域を配列決定する工程を更に含んでもよい。多くの配列決定方法が当技術分野で利用可能である。本発明の方法は、国際公開第2011/147931号又は国際公開第2011/147929号に記載されているものなどの、単一分子配列決定方法で使用するためのヘアピンを生成するのに特に適している。単離された核酸は、特異的又は非特異的ポリメラーゼ連鎖反応、ループ媒介等温増幅、鎖置換増幅、ヘリカーゼ依存性増幅、ニッキング酵素増幅反応などの等温増幅、逆転写、酵素消化、ヌクレオチド取り込み、オリゴヌクレオチドライゲーション及び/又はストランド侵入のためのテンプレートとして更に使用されてもよい。単離された核酸はまた、サンガージデオキシ配列決定又は連鎖停止反応、全ゲノム配列決定、ハイブリダイゼーションベースの配列決定、パイロシーケンシング、キャピラリー電気泳動、サイクルシーケンシング、一塩基伸長、固相配列決定、ハイスループット配列決定、大規模並列シグネチャー配列決定、ナノポアベースの配列決定、透過型電子顕微鏡配列決定、光学配列決定、質量分析、454配列決定、可逆的ターミネーターによる配列決定、「ペアードエンド」又は「メイトペア」配列決定、エキソヌクレアーゼ配列決定、ライゲーション配列決定(例えば、SOLiD技術)、ショートリード配列決定、一分子配列決定、化学分解配列決定、合成による配列決定、大規模並列配列決定、リアルタイム配列決定、半導体イオン配列決定(例えばIon Torrent)、ペアードエンドジタグの多重配列決定(MS-PET)、液滴マイクロ流体による配列決定、部分配列決定、フラグメントマッピング、並びにこれらの方法のいずれかの組み合わせなどの配列決定のための基質として使用されてもよい。
【0125】
好ましい実施形態によれば、本発明の方法は、単一分子配列決定、次世代配列決定、部分配列決定又はフラグメントマッピングによる、より好ましくは国際公開第2011/147931号又は国際公開第2011/147929号に記載されている単一分子配列決定による標的領域の配列決定を更に含む。本発明の好ましい実施形態によれば、本方法は、特定の核酸配列又は部位へのタンパク質の結合を検出することを更に含んでもよい。タンパク質結合を検出するための様々な方法が、当業者に利用可能である。本発明の方法は、国際公開第2014/114687号に記載されているような、単一分子を使用するタンパク質結合方法で使用するためのヘアピンの生成に特に適している。単離された標的領域は、核酸へのタンパク質結合を検出するための基質として、例えばエピジェネティック修飾を検出するための基質として更に使用されてもよい。単離された標的領域は、例えば、亜硫酸水素塩変換、高解像度溶融分析、免疫沈降(例えば、ChIP、enChIP)、マイクロアレイハイブリダイゼーション、及び当業者に公知の核酸/タンパク質相互作用の他の分析に使用されてもよい。本明細書で使用する場合、用語「エピジェネティック修飾」は、核酸分子の合成後に行われる当該核酸分子を構成する塩基の修飾を指す。非限定的な例として、塩基修飾は、当該塩基への損傷から生じてもよい。エピジェネティック修飾としては、例えば、とりわけ、3-メチルシトシン(3mC)、4-メチルシトシン(4mC)、5-メチルシトシン(5mC)、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)及び5-カルボキシシトシン(5caC)、並びにDNA中の6-メチルアデノシン(m6A)、RNA中の5-ヒドロキシメチルウラシル(5hmU)及びシュードウリジン、並びにDNA及びRNA中の3-メチルシトシン(3mC)及びN6-メチルアデノシン(m6A)が挙げられる。
【0126】
同様に、本方法は、DNA損傷などの核酸損傷から生じる修飾された塩基の検出を更に含んでもよい。DNA損傷は、化学物質(すなわち、インターカレート剤)のために絶えず生じ、放射線及び他の変異原が単離された核酸に対して効くこともある。これらのタイプのDNA損傷から生じるDNA塩基修飾は広範であり、生理学的状態及び疾患表現型に影響を及ぼす際に重要な役割を果たす。例としては、8-オキソグアニン、8-オキソアデニン(酸化的損傷;加齢、アルツハイマー病、パーキンソン病)、1-メチルアデニン、6-O-メチルグアニン(アルキル化;神経膠腫及び大腸癌)、ベンゾ[a]ピレンジオールエポキシド(BPDE)、ピリミジン二量体(付加物形成;喫煙、工業用化学薬品への曝露、UV光への曝露;肺癌及び皮膚癌)、及び5-ヒドロキシシトシン、5-ヒドロキシウラシル、5-ヒドロキシメチルウラシル、及びチミングリコール(電離放射線損傷;慢性炎症性疾患、前立腺癌、乳癌及び大腸癌)が挙げられる。
【0127】
好ましくは、本発明の方法は、国際公開第2014/114687号に記載されているように、特定の核酸配列へのタンパク質の結合を検出することを更に含む。
【0128】
キット
本発明の更なる目的は、本明細書に記載の本発明の方法又は実施形態のいずれかによる核酸単離に使用できるキットである。キットは、本明細書に前述した本発明による核酸単離及び濃縮のための材料及び方法を提供する。したがって、キットは、本明細書に記載の方法に従って核酸を単離するために必要な材料を含む。内容物は、本明細書に記載されるモダリティのいずれかに従って、使用されるクラス2タイプV Casタンパク質(例えば、Cas12a、C2c1)、標的化される核酸領域、捕捉方法などにしたがって変化してもよい。
【0129】
特定の実施形態によれば、本発明のキットは、
a)クラス2タイプV Casタンパク質、好ましくは触媒活性Cas12aと、
b)少なくとも1つのgRNAであって、核酸標的領域に隣接する部位に相補的である、gRNAと、
c)エキソヌクレアーゼ活性、好ましくはエキソヌクレアーゼIを有する少なくとも1種の3’~5’一本鎖酵素と、
d)オリゴヌクレオチドプローブと、
e)任意選択で、少なくとも1種のプロテアーゼと、
f)任意選択で、使用通知と、を含む。
【0130】
更なる実施形態によれば、当該キットは、少なくとも1種のプロテアーゼの代わりに、又はそれに加えて、EDTA、好ましくはEDTAの溶液を含む。
【0131】
いくつかの場合、キットは、クラス2 Casタンパク質、好ましくは第2のクラス2タイプV Casタンパク質を更に含んでもよい。好ましくは、キットは、少なくとも2つのgRNA、より好ましくは少なくとも3、4、5、6、10個のgRNAを含み、当該gRNAの各々は、特定の核酸領域に相補的である。
【0132】
特定の実施形態によれば、当該キットは、標的領域当たり2つのgRNAを含み、当該gRNAは、第1及び第2の部位に相補的であり、当該部位は、上記のように、標的領域の両側に位置する。2つのクラス2タイプV Casタンパク質-gRNA複合体の使用は、それにより、5’オーバーハングが標的領域の両側に生成されてもよいため、有利である。
【0133】
下流多重分析が望まれる場合、キットは、2つ以上のgRNAを含んでもよく、各gRNAは、異なる標的領域に隣接する部位に少なくとも部分的に相補的である。特定の実施形態によれば、当該キットは、クラス2タイプV Casタンパク質及びクラス2タイプII Casタンパク質、より好ましくはCas9を含み、対応する適切なgRNAは、それぞれ第1及び第2の部位に少なくとも部分的に相補的であり、当該部位は、標的領域の両側に位置する。あるいは、当該クラス2タイプV Casタンパク質の2つのgRNAは、2つの異なる部位を認識してもよく、当該部位は、本明細書中に記載されるように、標的領域の両側に位置する。いくつかの場合、キットは、gRNAがプレロードされた本明細書に記載の1つ以上のCasタンパク質を含み、それによって1つ以上のCasタンパク質-gRNA複合体を形成し、好ましくは1つ以上のクラス2タイプV Casタンパク質-gRNA複合体を形成する。特定の実施形態によれば、キットが複数のクラス2タイプV Casタンパク質-gRNA複合体を含む場合、当該複合体は、好ましくは、単一の容器内で一緒に混合される。好ましくは、当該キットに含まれる各Casタンパク質-gRNA複合体の比は、使いやすさのために予め定められている。
【0134】
好ましくは、gRNAのガイドセグメントは、臨床診断又は遺伝的リスク評価において対象となる標的領域に隣接する領域に相補的である。一例として、当該gRNAは、セプチン9(SEPT9)又は上皮増殖因子受容体(EGFR)のコード領域の下流に位置する非コード標的領域に隣接する部位に相補的である。実際に、これらの領域のエピジェネティック状態は、癌の転帰にとって重要であることが知られている。別の例として、当該gRNAは、脆弱X症候群に関与する遺伝子FMR1の下流の領域に隣接する部位に相補的である。この遺伝子における5’-CGG-3’リピートのコピー数の増加は、疾患の原因である。このCpGアイランドの上流領域のエピジェネティック状態(例えば、メチル化)もまた、疾患の臨床的重症度に関連することが知られている。別の例として、当該gRNAは、DMPK遺伝子に隣接する部位に相補的である。実際に、この遺伝子における5’CTG-3’反復の数の増加は、筋緊張性ジストロフィ1型に特徴的である。更なる例として、当該gRNAは、cfDNA分子内に位置する領域に相補的であり、それによって、cfDNA分子に含まれる隣接する標的領域の単離を可能にする。実際に、cffDNA又はctDNAなどの特定のcfDNAの単離は、出生前検査(例えば、Gahan,Int J Womens Health.2013,5:177~186を参照)及び癌診断及び/又はモニタリング(例えば、Ghorbian and Ardekani,Avicenna J Med Biotech.2012,4(1):3~13を参照)を含む多種多様な下流用途を特に対象とする。cfDNA内に含まれる1つ以上の標的領域は、有利には、生物学的試料(例えば、血漿、血清、又は尿試料)から直接単離されてもよい。
【0135】
本明細書に記載のキットは、好ましくは、少なくとも2つの異なる標的領域の単離を可能にする。実際に、特定のエピジェネティック癌診断試験の価値は多重化によって改善されることが示されており、2つ以上の異なる標的領域(例えば、メチル化状態)の配列又は構造の特性が単一の試験で分析される。非限定的な例として、本明細書に提供されるキットは、本明細書に記載される方法のいずれかに従って、DNAメチル化を受けるヒトGSTP1、APC及び/又はRASSF1遺伝子又はその適切な領域を含む、又はそれらからなる標的領域の単離を可能にする。次いで、当該単離された標的領域を、例えば、本明細書に提供される方法(例えば、国際公開第2014/114687号に提供されているように)に従って、メチル化状態の下流解析に供してもよい。このようなキットは、前立腺癌を発症する対象のリスクの判定において特に有利であり(Wojno et al.,American health&drug benefits,2014,7(3):129)、特に試料DNAの亜硫酸水素塩処理とそれに続くPCRを使用する既存のキットよりも有利である。本発明の方法とは対照的に、既存のキットで単離された核酸は、特に、偽陽性及び偽陰性シグナル、並びに過酷で非効率的な化学処理による試料の損失を生じやすい場合がある。
【0136】
特定の実施形態によれば、キットは、標的領域当たり2つのgRNAを含み、当該gRNAは、本明細書で定義されるヒト遺伝子GSTP1、APC、及びRASSF1の両側の部位に相補的である。
【0137】
別の非限定的な例として、本発明のキットは、ヒトゲノム内の以下の位置に位置する以下の標的領域の少なくとも1つの単離を可能にする。第17染色体上の65676359~65676418、第9染色体上の21958446~21958585、第6染色体上の336844~336903、第21染色体上の33319507~33319636、第6染色体上の166502151~166502220、第18染色体上の896902~897031、第5染色体上の32747873~32748022、第6染色体上の27949195~27949264、第7染色体上の27191603~27191672、第16染色体上の170170302~170170361、第15染色体上の30797737~30797876、第1染色体上の7936767~7936866、第1染色体上の170077565~170077634、第2染色体上の1727592~1727661、第8染色体上の72919092~72919231、好ましくは15個全ての標的領域。当該標的領域のDNAメチル化状態の下流分析を使用して膀胱癌を検出することができるので、当該標的領域の単離は有利である。既存のキットは、メチル化感受性制限酵素を使用し、続いてPCRを使用してメチル化配列を同定するので、標的領域中の適切な制限部位の存在、試験設計の複雑化、及び感度の制限によって制限されることがある。したがって、膀胱癌の単離及び検出のための改良されたキットは、好ましくは、標的領域に隣接する配列に対して少なくとも部分的に相補的な2つのgRNAと、本明細書に記載の方法に従ってこれらの15個の標的領域の各々を単離するための、好ましくは15個全ての標的領域を単離するための、当該標的領域の末端に位置する配列に少なくとも部分的に相補的な2つの追加のgRNAとを含んでもよい。
【0138】
非限定的な例として、標的領域は、特定の配列、特定の配列反復の数、1つ以上のヌクレオチド塩基修飾を含んでもよく、又は含まなくてもよい。更なる非限定的な例として、単離の標的となる領域は、特定の長さ又は当該特定の長さとは異なる長さであってもよい。好ましくは、本発明のキットは、少なくとも1つの制限酵素、及び/又はRNaseを更に含む。好ましくは、キットは、好適なクラス2タイプV Casタンパク質反応緩衝液及び好適なクラス2タイプII Casタンパク質反応緩衝液、例えば以下の例に詳述されているものを更に含む。
【0139】
キットは、所与の用途に適切な追加の要素を更に含んでもよい。例えば、キットは、1つ以上のヘアピンアダプタ又は部位特異的エンドヌクレアーゼ、リガーゼ及び/又はポリメラーゼ酵素、オリゴヌクレオチド、dNTP、適切な緩衝剤などを更に含んでもよい。特定の実施形態によれば、当該キットは、リガーゼ及び/又は5’フラップエンドヌクレアーゼ、好ましくはFEN1を更に含む。
【0140】
本発明の更なる特徴及び有利な態様は、以下の図及び実施例に示される。
【図面の簡単な説明】
【0141】
図1A】Cas12a-gRNA複合体によって結合した分子集団へのExoIの添加は、切断部位における変動性がより低い、より長い5’オーバーハングを生成する。(1A)SEPT9.2 crRNA#1の標的配列を含む断片(配列番号:2)ガイド(配列番号:3)を、その5’末端にFITC蛍光でタグ付けされたプライマーであるプライマーPS1462及びPS1464を用いて、PCRにより増幅した(配列番号:それぞれ4及び5)。次いで、断片をCas12a-gRNA複合体単独とインキュベートして非標的鎖上の切断位置を決定するか(左)、Cas12a-gRNA複合体とExoIを同時にインキュベートしてExoI処理によって3’末端の凹んだ塩基の数を決定するか(中央)、又はCas12a-gRNA複合体とインキュベートし、続いてT4 DNAポリメラーゼで埋めてgRNAとハイブリダイズした鎖上の切断位置を決定した(右)。
図1B図1Aに記載される3つの実験設定のキャピラリー電気泳動によって得られた結果の代表的なトレースにより、本発明者らは、一塩基分解能でハイブリダイズしていない鎖の3’末端の位置、並びに5’ハイブリダイズ鎖内の切断位置を決定することができた。各反応物に、マーカーとして使用したFITC(配列番号:6~8に対応する)でタグ付けした既知のサイズ(129、273、及び503bp)のPCR断片を添加した。3つの異なる実験からのトレースを、示されるように、129及び273bpのピークに従って整列させた。中央パネルの左を指す矢印は、ExoIの添加によって断片が短縮されることを示す(したがって、129塩基で、より短いマーカーに近づくように移動する)。下のパネルの右を指す矢印は、5’オーバーハングが、T4 DNAポリメラーゼによって埋められたことを示している(したがって、273bpで、より長いマーカーに近づくように移動する)。
図1C図1Aに示す実験設定に基づいて、LbaCas12a(NEB)と複合体を形成したSEPT9.2 crRNA#1に対して決定された切断位置である。図に示される位置は、PAM部位に隣接する第1の塩基から始まるgRNA配列(下線)の第1の塩基に対して提供される。
図2】単一のCas12a-gRNA複合体を使用する本発明の方法の工程a)~c)の概略図である。(A)核酸分子の集団は、任意選択で、機械的又は酵素的に断片化されて、ランダム断片を生成してもよい。(B)断片化後、核酸分子の集団を、標的領域に隣接して位置する部位に少なくとも部分的に相補的なガイドセグメントを含むCas12a-gRNA複合体と接触させる。インキュベーション中、任意の一本鎖領域は、ExoI処理による消化のために標的化される。(C)次いで、Cas12a-gRNA複合体を除去する(図中で「精製」と呼ばれる)。得られた断片は、より長く、より良好に画定された5’オーバーハングを含み、次いで、本発明の方法の工程d)及びe)に供されてもよい(ここでは図示せず)。
図3】Cas12a-gRNA複合体及びヘアピンアダプタを使用する、代替戦略による本発明の方法の工程a)~c)の概略図である。断片化及び末端修復の任意選択の第1の工程(A)に続いて、例えばT/Aクローニング(B)を使用して、ヘアピン(又は他の)アダプタを全ての遊離末端にライゲーションしてもよい。(C)断片化後、核酸分子の集団を、標的領域に隣接して位置する部位に少なくとも部分的に相補的なガイドセグメントを含むCas12a-gRNA複合体と接触させる。インキュベーション中、任意の一本鎖領域は、ExoI処理による消化のために標的化される。gRNAに対する相補的配列を含む部位のみがこの処置によって標的化され、したがって、これらの部位のみが一本鎖5’オーバーハングを含む。(D)次いで、Cas12a-gRNA複合体を除去する。次いで、5’一本鎖オーバーハングを含む核酸分子の得られた集団を、本発明の方法の工程d)及びe)に供し(ここでは図示せず)、それにより核酸標的領域を単離することができる。
図4】2つのCas12a-gRNA複合体を使用する、代替戦略による本発明の方法の工程a)~c)の概略図である。(A)内側を指す矢印によって示されるように、PAM配列が標的領域に直接隣接して位置するように設計されたgRNAを有するCas12a-gRNA複合体のgRNAによって認識される部位の図。(B)第1及び第2の側でそれぞれ標的領域に隣接する第1及び第2の部位を標的とする2つのCas12a-gRNA複合体を、Exol処理と同時に使用して、単離する標的領域の両側に5’オーバーハングを生成することができる。断片化は、この工程が任意選択であるため、ここでは図示されない。(C)次いで、Cas12a-gRNA複合体を除去する。次いで、5’オーバーハングを含む得られた核酸分子の集団を、本発明の方法の工程d)及びe)に供することができ(ここには図示せず)、それによって核酸標的領域を単離し、次いで、クローニング、ライブラリ調製、又はヘアピン生成などであるがこれらに限定されない下流用途で使用されてもよい。
図5】標的領域は、当該標的領域の両側に位置する2つのオリゴヌクレオチドプローブを使用して単離することができる。(A)から(C)は、図4の凡例に記載されているように実施される。(D)Cas12a及びExolで処理した後、核酸分子の集団を、Cas12a gRNAに少なくとも部分的に相補的な部位の5’末端に相補的な様々なリガンド(例えば、ビオチン及びジゴキシゲニンが挙げられるが、これらに限定されない)を含む合成オリゴヌクレオチドプローブと接触させる。FEN1エンドヌクレアーゼ酵素を使用してオリゴヌクレオチドプローブの5’フラップを除去し、得られたニックをリガーゼで封止する。これにより、分子の各末端におけるオリゴヌクレオチドプローブの共有結合が可能になる。(E)次いで、標的領域を、本明細書中に記載されるように単離することができる。(F)単離工程は、第2のリガンドを用いて繰り返してもよい。これは、有利には、本方法の特異性を増加させる。(G)得られた分子は、ヘアピン又はライブラリ生成などの下流用途に使用することができる。
図6】大腸菌(E.coli)ゲノムDNAからSIMDEQ装置(ヘアピン構造)に適した分子を生成するために使用される方法の概略図である。(A)内側を指す矢印によって示されるように、PAM配列が標的領域に隣接して位置するように設計されたgRNAを有するCas12a-gRNA複合体のgRNAによって認識される部位の図である。(B)対象となる領域(標的番号1及び2、配列番号:9及び10)の両側に、2つの異なるCas12a-crRNA複合体(配列番号:11~14)が隣接しており、当該複合体は、それぞれ第1及び第2の部位に結合した。3’~5’一本鎖エキソヌクレアーゼを同時に添加した。それにより、標的領域の両側に5’オーバーハングが生じた。(C)次いで、Cas12a-gRNA複合体を除去する(図中「精製」と呼ばれる)。塩及び任意の他のタンパク質も、好ましくは除去される。(D)オリゴヌクレオチドプローブPS1466及びPS1468(配列番号:15及び16)は、支持体へのハイブリダイゼーションを可能にするために必要な配列を含み(したがって、表面オリゴヌクレオチドと呼ばれる)、それらの5’末端においてCas12a crRNA配列に対応する配列を有する(したがって、標的領域に隣接する5’オーバーハングに相補的である)。これらのオリゴヌクレオチドを含む反応物にFEN1及びTaq DNAリガーゼを添加して、オリゴヌクレオチドの5’フラップ領域を除去し、5’フラップの消化により生成されたニックを封止した。(E)オリゴヌクレオチドプローブの一本鎖領域に相補的な配列を有する第2のオリゴヌクレオチド(その5’末端にビオチンを含む(正方形で示す))を反応管に添加した。当該第2のオリゴヌクレオチドは、PS1467及びPS1469(標的番号1及び2についてそれぞれ、配列番号:17及び18)である。第2のオリゴヌクレオチドと二重鎖との間のギャップは、DNAポリメラーゼによって埋め、ライゲーションした。(F)得られた断片をBsaIで消化し、合成ヘアピンを標的領域の他方の側でライゲーションした。いくつかの場合、工程Fは、方法の第1の工程として実施されてもよい(すなわち、Cas12a-gRNA複合体及びExoIで5’オーバーハングを生成する前に)。次いで、ストレプトアビジンビーズを使用して、核酸分子の集団から所望の分子を単離し、SIMDEQプラットフォームにロードした。この方法によって生成されるヘアピンの典型的なフィンガープリンティングトレースを図10A及び10Bに示す。
図7】大腸菌(E.coli)ゲノムDNAからSIMDEQ装置(ヘアピン構造)に適した分子を生成するために使用される方法の別の概略図である。(A)から(C)図6に示すものと同じ手法を使用する。(D)では、核酸分子の集団をオリゴヌクレオチドプローブと接触させることに加えて、ヘアピンを第2の部位にライゲーションする。いずれの場合も、任意の5’フラップをFEN1によって除去し、残りのニックをライゲーションによって封止してもよい。これは、標的領域の両側に存在する両方の部位を同時に処理することができ、したがって、方法の持続時間を短縮することができるため、有利である。
図8】本発明で使用されるオリゴヌクレオチドプローブの例示的な構造である。gRNAが標的とする配列を太字及び大文字で示す。オリゴヌクレオチドプローブの5’末端は、5’オーバーハングに対応する、gRNAによって標的化される配列に少なくとも部分的に相補的である配列を含む。配列は、非標的鎖上のCas12a-gRNAの切断位置の変動性を計算に入れるために、PAM配列まで伸長されてもよい。FEN1による処理によって、任意のフラップ構造を除去してもよい。プローブの一本鎖領域は、一本鎖オリゴヌクレオチド(例えば、ヘアピン生成に必要な図6(E)のビオチンオリゴヌクレオチド)が結合してもよい「ユニバーサル」配列を含む。任意選択で、オリゴヌクレオチドプローブは、プローブ(したがって標的領域)をフローセルの表面などの固体支持体に固定するための特定の配列を更に含んでもよい。いくつかの場合、「ユニバーサル」配列は、ヘアピン分子のループ領域に含まれてもよい。
図9】Cas12a-gRNA及びExoI処理から得られる5’オーバーハングは、オリゴヌクレオチドプローブのハイブリダイゼーションを促進することができる。ヒトNDGR4.1crRNA#1(配列番号:20)によって認識される部位を含む287bpのPCR断片(配列番号:19)を、5’-TTTV-3’ PAM配列を含む非標的鎖の5’末端でFITCによりタグ付けし、以下の条件でのインキュベーション後にキャピラリー電気泳動によって分析した。(A)FEN1及びTaq DNAリガーゼの存在下でLbaCas12a crRNA#1、(B)LbaCas12a crRNA#1及びExoI、(C)LbaCas12a crRNA#1及びExoVII、(D)FEN1及びTaq DNAリガーゼの存在下でLbaCas12a crRNA#1及びExoVII、又は(E)FEN1及びTaq DNAリガーゼの存在下でLbaCas12a crRNA#1及びExoIと共に、断片をインキュベートした。全ての場合において、FEN1により処理され、Taq DNAリガーゼによって標的部位にライゲーションすることができるビオチンリガンドを含むオリゴヌクレオチドプローブも存在した。ライゲーションされた産物は、断片のサイズを増加させ(星印で示す)(配列番号:21)、ピークを273bpマーカーのより近くに位置させる。図1Bで使用された同じFITCマーカーも添加され、トレースを整列させるために使用された。特に、トレースを129及び273bpの断片に基づいて整列させた。
図10】Cas12a-gRNAの切断効率並びにFEN1及びリガーゼを使用したオリゴヌクレオチドプローブのライゲーションの効率を決定するために開発されたqPCR定量アッセイの概略図である。3つの異なるプライマーセット(A/B、A/C、及びA/D、配列番号:94~97)を、図示されるように、FMR1のCas12a-crRNA#2切断部位(配列番号:29)に近接して設計した。3つのqPCR反応のいずれかで使用することができるTaqManプローブ(配列番号:93)を、切断効率の定量並びにゲノムDNAへのオリゴヌクレオチドプローブの結合を可能にするように設計した。Cas12a-crRNA#2が核酸分子を切断したか否かにかかわらず断片を増幅するプライマーA及びBを用いて得られた産物を使用して、各反応を正規化した(「総量」とも呼ばれる)。Cas12aの切断効率を定量するために、本発明者らは、濃縮される標的領域の外側に位置する第2のプライマーCを設計した。したがって、Cas12a-crRNA#2複合体がその標的を切断すると、断片はもはや増幅のテンプレートとして機能することができず、増幅可能な出発物質が減少する。切断速度を推定するために、本発明者らは、Cas12a-crRNA#2複合体とのインキュベーション後に残存する断片の比率を計算し、この数を計算された「総量」で除算した。これは、未切断断片の量を提供し、逆分率(すなわち、100-未切断断片の量=切断断片の量)を取ることによって、切断断片の量に変換することができる。最後に、FMR1断片へのオリゴヌクレオチドプローブライゲーションの効率を定量するために、ライゲーションされたオリゴヌクレオチドに特異的な断片を増幅するプライマーA及びDを使用した。プライマーA/Dを用いて得られた画分は、「FEN1ライゲーション」とも呼ばれる。
図11】Cas12a-gRNA複合体の切断効率は、反応時間及び濃度によって変化する。反応時間の関数としてのCas12-crRNA#2複合体の切断効率を決定するために、2μgのヒトゲノムDNAを、10mM DTT、及びFMR1に特異的な600fmolのCas12a-crRNA#2gRNA(配列番号:29)を添加したNEB2.1緩衝液中で、37℃で10、20、30及び60分間インキュベートした(左パネル)。qPCRを、2セットのプライマー(A/B及びA/C、それぞれ配列番号:94~95及び94~96)をTaqmanプローブ(配列番号:93)と共に使用して実施した。Cas12a-crRNA#2複合体の存在を伴わない対照反応を行い、未切断参照として使用した。切断された断片(プライマーセットA/C)の相対的な定量を、材料の「総量」(プライマーセットA/B、図10の凡例も参照)によって正規化し、次いで、未切断参照によって正規化した。反応時間を10分から30分まで増加させた場合、標的の78%の切断が達成された。Cas12a-crRNA#2複合体を10分間(68%で)インキュベートした場合の切断効率も、複合体の量を増加させることによって評価した。2μgのヒトゲノムDNAを、10mM DTTを添加したNEB2.1緩衝液中で、300、600、1200、1500fmolの、FMR1に特異的なCas12a-crRNA#2ガイドRNA(配列番号29)のいずれかと共に、37℃で10分間インキュベートした(右パネル)。Cas12a-crRNA#2複合体の量を600fmolから1200fmolに倍増することにより、切断された標的の量を84%まで増加させた。
図12A】エキソヌクレアーゼIの添加は、Cas12a-gRNA切断に影響を与えないが、FEN1とのプローブライゲーションを改善する。2μgのヒトゲノムDNAを、10mM DTTを添加したNEB2.1緩衝液中で、600fmolの、FMR1に特異的なCas12a-crRNA#2gRNA(配列番号:29)と共に、3’末端の凹んだ塩基の数を増加させるためのエキソヌクレアーゼIの存在下又は非存在下で、37℃で30分間インキュベートした。qPCRを、2セットのプライマー(A/B及びA/C、それぞれ配列番号:94/95及び94/96)をTaqmanプローブ(配列番号:93)と共に使用して実施した。Cas12a-crRNA#2複合体の存在を伴わない対照反応を未切断参照として使用した。切断された断片(プライマーセットA/C)の相対的な定量を、材料の「総量」(プライマーセットA/B)によって正規化し、次いで、未切断参照によって正規化した。エキソヌクレアーゼIの存在は、Cas12a-crRNA#2による切断に影響を及ぼさず、本明細書では、エキソヌクレアーゼIの存在下又は非存在下で、DNAの78%及び76%がそれぞれ切断された。
図12B】エキソヌクレアーゼIの添加は、Cas12a-gRNA切断に影響を与えないが、FEN1とのプローブライゲーションを改善する。図12Aに記載されるように、エキソヌクレアーゼIの存在下又は非存在下でCas12a-crRNA#2を使用して行われた切断反応物を、1mM NAD、40ユニットのTaq DNAリガーゼ、32ユニットのFEN1、及びcrRNAによって認識される部位に相補的な20塩基を有し、qPCRに使用される既知の配列を含む10pmolの標的特異的オリゴヌクレオチドプローブ(配列番号:98)を添加したThermoPol緩衝液中でインキュベートした。反応物を37℃で30分間インキュベートした。Cas12a-crRNA#2複合体の存在を伴わない対照反応を、ライゲーションされていない断片参照として使用した。プローブライゲーション断片(プライマーA/D、配列番号:94/97)の相対的な定量を、材料の「総量」(プライマーA/B、配列番号:94/95)によって正規化し、次いで、「標準参照反応」(37℃で30分間、エキソヌクレアーゼI及びFEN1の存在下でのCas12a-crRNA#2による切断反応)によって正規化した。エキソヌクレアーゼIが存在する場合、FEN1及びプローブライゲーションの効率は2倍に増加した。
図13】FEN1処理及びオリゴヌクレオチドプローブのライゲーションの効率に対する温度の影響である。2μgのヒトゲノムDNAを、10mMのDTTを添加したNEB2.1緩衝液中で、600fmolの、FMR1に特異的なCas12a-crRNA#2 gRNA(配列番号:29)と共に、エキソヌクレアーゼIの存在下又は非存在下で、37℃で30分間インキュベートして、標的特異的オリゴヌクレオチドプローブのライゲーション効率に対する5’一本鎖オーバーハングの長さの増加の影響を決定した。エキソヌクレアーゼIの存在下又は非存在下でのCas12a-crRNA#2切断反応物を、1mM NAD、40ユニットのTaq DNAリガーゼ、32ユニットのFEN1(又はFEN1なし)及びcrRNA#2によって認識される部位に相補的な20塩基を有し、qPCR反応に使用される既知の配列を含む10pmolのオリゴヌクレオチドプローブオリゴヌクレオチド(配列番号:98)を添加したThermoPol緩衝液中でインキュベートした。3つのインキュベーション温度を試験して、37℃、45℃及び55℃で30分間のプローブライゲーションの効率を観察した。qPCR反応を、2セットのプライマー(A/B及びA/D、それぞれ配列番号:94/95及び94/97)をTaqmanプローブ(配列番号:93)と共に使用して実施した。プローブライゲーション断片(プライマーセットA/D)の相対的な定量を、材料の「総量」(プライマーセットA/B)によって正規化し、次いで、定量を本発明者らの「標準参照反応」(エキソヌクレアーゼIの存在下でのCas12a切断及び37℃で30分間のFEN1反応)によって正規化した。試験した全ての温度について、エキソヌクレアーゼIの存在は、ライゲーション効率を2倍改善する。更に、ライゲーション及び/又はFEN1活性の効率は、反応物を45℃でインキュベートした場合、37℃と比較して1.8倍増加した。
図14】ヒトゲノムDNAからSIMDEQ装置(ヘアピン構造)に適した分子を生成するために使用される方法の概略図である。(A)crRNA#1及びcrRNA#2に特異的なオリゴヌクレオチドプローブ(配列番号:100及び99)を示す。支持体とのハイブリダイゼーションを可能にするのに必要な配列(したがって、表面オリゴヌクレオチドと呼ばれる)を含む第1のプローブは、その5’末端にCas12a crRNA#1配列に対応する配列を有し(画像の左側に示す)、第2のプローブは、その5’末端にビオチンを含み(正方形で示す)、脱塩基部位修飾(三角形で示す)は、その5’末端にCas12a crRNA#2配列に対応する配列を有し、それによって二重鎖を形成する。これらのオリゴヌクレオチドを含む反応物にFEN1及びTaq DNAリガーゼを添加して、各オリゴヌクレオチドの5’フラップ領域を除去し、5’フラップの消化により生成されたニックを封止した。(B)(A)においてFEN1及びリガーゼによってライゲーションされたプローブに相補的なオリゴヌクレオチドの第2のセット(配列番号:101及び97)をハイブリダイズさせ、DNA分子をDNAポリメラーゼによって埋め、ライゲーションして、完全な標的領域のための連続したdsDNA分子を生成し、一方の末端にY字形構造を作成した。(C)次いで、ストレプトアビジンビーズを使用して核酸分子の集団から二重鎖を単離した。(D)3’-ヒドロキシル末端を有する脱塩基部位でDNAホスホジエステル骨格の切断を触媒するエンドヌクレアーゼIVを使用して、ビーズから二重鎖を溶出した。(B)においてdsDNA分子を生成するために先に添加したオリゴヌクレオチドの5’末端に4bpのオーバーハングを生成した。(E)合成ヘアピン(配列番号102)をこの5’オーバーハングにライゲーションした。二重鎖を、特定のリンカー(配列番号:103及び104)でコーティングされたストレプトアビジンビーズを使用して単離し、SIMDEQプラットフォーム上にロードした。
図15A図6に示す方法は、標的領域を含むヘアピン分子の生成を成功させた。図6に示す方法を使用して大腸菌(E.coli)ゲノムDNAから標的1を単離した後の4塩基オリゴヌクレオチド(CAAG)フィンガープリント実験のトレースである。予想されるピークの全ては、CAAGの4塩基オリゴヌクレオチドを使用して両方の標的において適切に同定された。
図15B図6に示す方法は、標的領域を含むヘアピン分子の生成を成功させた。図6に示す方法を使用して大腸菌(E.coli)ゲノムDNAから標的2を単離した後の4塩基オリゴヌクレオチド(CAAG)フィンガープリント実験のトレースである。予想されるピークの全ては、CAAGの4塩基オリゴヌクレオチドを使用して両方の標的において適切に同定された。
図16A】本発明の方法を使用して、15個の異なるヒト標的に対してヒトゲノムDNAから調製されたライブラリに対して行われたIllumina配列決定からの例示的な結果である。対応するゲノム座標での濃縮のために選択された標的領域である。これらの領域は、エピジェネティックバイオマーカーの存在又はヒト疾患に関与する拡大反復を有する既知の遺伝子座のいずれかにより選択された。
図16B】本発明の方法を使用して、15個の異なるヒト標的に対してヒトゲノムDNAから調製されたライブラリに対して行われたIllumina配列決定からの例示的な結果である。本発明の方法を使用した標的領域濃縮後のIllumina配列決定から得られた読み取りアラインメントのスクリーンショットである。具体的には、リガンド(この場合、ビオチン)を含むオリゴヌクレオチドプローブを1つだけ使用した(したがって、工程Fは行わなかった)ことを除いて、図5に示す方法を用いてライブラリを生成した。黒色のボックスは、SNCA CpGアイランド、第4染色体:89,836,538~89,837,940bp)に対応する濃縮の標的領域を表す。各マッピングされた読み取りは、灰色の水平線によって表される。濃い灰色で示すように、領域は、周囲の領域(1倍未満の被覆率を示す)と比較して高い被覆率(最大614倍の被覆率)を示す。
【実施例
【0142】
以下の実施例は、本発明の好ましい実施形態を実証するために挙げられる。以下の実施例及び添付図面に記載又は示される全ての主題は、例示として解釈されるべきであり、限定的な意味で解釈されるべきではない。以下の実施例は、当業者によって決定されてもよい任意の代替物、等価物、及び修正を含む。
【0143】
実施例1:gRNAを選択する方法
以下に記載される全ての戦略に関して、1つ以上のガイドRNAは、利用可能なオンラインツールを使用して設計される。次いで、RNAガイドは、ウイルス転写系(例えば、T7、SP6又はT3 RNAポリメラーゼなど)を使用してインビトロで合成するか、又は標的領域に相補的な配列を含む単一のcrRNAガイドとして自動合成装置を使用して化学的に生成することができる。各gRNAの効率を、野生型Casヌクレアーゼを使用して標準化/対照試料(例えばPCR断片)にてインビトロで評価して、各Casタンパク質-gRNA複合体が高効率で切断される(例えば、最初のPCR断片の少なくとも80%が切断される)ことを確認する。
【0144】
本実施例では、Cas12aガイドRNAは、共通の全般的配列(配列番号:1)に従って自動合成装置を使用して化学的に生成されてもよい。
【0145】
gRNAを対応する緩衝液中95℃で5分間インキュベートし、続いてアニーリング及び/又は二次構造形成のために各工程で80℃、50℃、37℃及び室温で10分間の漸増勾配によりインキュベートする。
【0146】
実施例2:標的領域を含む核酸分子を単離するための反応プロトコルの例
1.適切な反応緩衝液(50mM NaCl、10mM Tris-HCl、10mM MgCl、10mM DTT、100μg/mL BSA、pH7.9)中、室温(例えば25℃)で10分間インキュベートすることによって、ガイドRNA(例えばcrRNA)をクラス2タイプV Casタンパク質にロードし、それによってタンパク質-RNA複合体の形成を可能にする。
2.工程1で調製したロードした複合体を、追加の10mMのDTTを添加したNEB緩衝液2.1中に核酸分子を含む試料に添加する。反応管に1μLのExo I(100ユニット)を添加し、37℃で少なくとも1時間インキュベートする。これにより、クラス2タイプV Casタンパク質-gRNA複合体が核酸標的領域に隣接する部位で核酸に結合して切断して、Exo Iが非標的鎖の3’末端を凹ませる。
3.「停止緩衝液」(1.2ユニットのプロテイナーゼK及び20mM EDTAの混合物を含む)を添加することによって反応を停止させ、それによってクラス2タイプV Casタンパク質-gRNA複合体を除去する。いくつかの場合、RNaseAを添加して、gRNAを消化してもよい。RNaseA及びプロテイナーゼK処理は、特に、37℃で15分間連続的に行われてもよい。この場合、EDTAの添加は任意選択であってもよい。
4.次いで、試料を、常磁性ビーズによる精製など、ビーズ又はカラム精製のような任意の公知の技術によって精製してもよい。
5.次いで、溶出DNAを、ThermoPol緩衝液(20mM Tris-HCl、10mM(NHSO、10mM KCl、2mM MgSO、0.1% Triton(登録商標)X-100、1mM NAD+、pH8.8)(NEB)中37℃で30分間、オリゴヌクレオチドプローブ(ただ1つの標的の場合)又は複数のプローブ(複数の標的の場合)と共にインキュベートする。第2の部位が第2のCas12aタンパク質によっても処理された場合、ヘアピンループを含むプローブ(又は標的の数に応じた複数のプローブ)を反応混合物に同時に添加することができる。各プローブは、出発物質に応じて20~50nMの濃度で添加される。また、反応物に、1μLのFEN1(例えば、32ユニット)及び1μLのTaq DNAリガーゼ(例えば、40ユニット)を添加してもよい。
6.次いで、試料を、常磁性ビーズによる精製など、ビーズ又はカラム精製のような任意の公知の技術によって精製してもよい。
7.オリゴヌクレオチドプローブがリガンドを含まない場合、Y字形構造を生成するための5’ビオチンリガンドを含むユニバーサルオリゴヌクレオチドプローブを、100nMの濃度で工程6からの溶出DNAに添加してもよい。次いで、このオリゴヌクレオチドと二重鎖領域の5’末端(及び使用される場合はヘアピンループ)との間のギャップを、Bst Full Length DNA Polymerase(0.2 mMのdNTPを有する0.2ユニット)によって埋め、ThermoPol緩衝液(NEB)中50℃で30分間、1mMのNAD及び40ユニットのTaq DNAリガーゼにより反応物を添加することによって封止する。
8.次いで、試料を、常磁性ビーズによる精製など、ビーズ又はカラム精製のような任意の公知の技術によって精製してもよい。
9.試料を、磁気ビーズ製造業者によって推奨される結合緩衝液(例えば、限定するものではないが、0.5M NaCl、20mM Tris-HCl(pH7.5)、1mM EDTA)中、室温(25℃)で30分間、ストレプトアビジンでコーティングされた常磁性ビーズと共にインキュベートする。
10.次いで、ビーズを、推奨される洗浄緩衝液(例えば、限定するものではないが、0.5M NaCl、20mM Tris-HCl(pH7.5)、1mM EDTA、0.5%Tween-20あり又はなし)を使用して洗浄し、エピジェネティック修飾の配列決定又は検出などの下流用途に使用することができる。
【0147】
実施例3:ExoIと結合したLbaCas12aによって生成されたオーバーハングの決定。
Cas12a及びExoIによる核酸の同時処理によって生じる5’オーバーハングを決定するために、SEPT9.2 crRNA#1配列により認識された部位を含む221塩基対(bp)PCR断片を、プライマーPS1462及びPS1464(配列番号:4及び5)をOneTaq DNAポリメラーゼ(NEB)(配列番号:3)と共に使用して増幅した。PS1464が5’FITCを含むので、PAM配列5’ TTTV 3’を含む鎖をFITCでタグ付けした。128、273及び503bpの3つの更なるPCR断片を、同じPS1464リバースプライマー(したがって、FITCでもタグ付けされている)を用いて生成したが、3つの異なるフォワードプライマーPS1461、PS1463及びPS1131(オリゴヌクレオチドについては配列番号:22、23及び24、及びPCR断片については配列番号:6~8)を用いて、OneTaq(NEB)を使用して生成した。これらの3つのPCR断片は、得られた反応物の断片長の分析のためのマーカーとして機能する。
【0148】
ExoI処理あり及びなしの標的鎖及び非標的鎖上のLbaCas12a(NEB)の切断位置を決定するために、FITCでタグ付けされた221bpのPCR断片150ngを、LbaCas12a:crRNA複合体(DNA:Cas12a:crRNAについて1:10:20の比で)と共に、又はLbaCas12a複合体及び25ユニットのExoIと共に同時にのいずれかでインキュベートした。PCR断片をLbaCas12a:crRNAのみと共にインキュベートし、5’オーバーハングをT4 DNAポリメラーゼ(NEB)で埋め、crRNAがハイブリダイズする標的鎖の5’上の切断位置を決定する第3の反応物を調製した(図1A~1Cを参照)。得られた3つの反応物をキャピラリー電気泳動システム(Abi 3730)で実行して、反応中に存在するFITCでタグ付けされた断片を一塩基分解能で分解した。既知のサイズのFITCでタグ付けされた3つのPCR断片を反応に添加し、未知の断片のサイズを決定するためのマーカーとして使用した。
【0149】
図1Bに示すように、ExoIでの処理は、驚くべきことに、より長い5’オーバーハングの生成を可能にする。これは、当該技術分野で説明されている5’オーバーハング長、及び本明細書でLbaCas12aのみで得られたものとは顕著に対照的である(これは、例えば、PAMに対して-13~-19の位置までわずか6塩基長であってもよい)。実際、ExoI処理は、ExoIの非存在下でLbaCas12aのPAMから最も近い切断位置と比較した場合、PAM配列を含む非標的鎖上の切断を少なくとも2つの過剰な塩基によって置換する(非標的鎖上の切断位置は更に、最大5塩基置換されてもよい)。Cas12a-gRNA及びExoI処理で得られた5’オーバーハングもまた、驚くべきことに、より良好に画定される。図1B及び1Cに示すように、ExoI処理の非存在下で観察される切断位置とは対照的に、非標的鎖の切断におけるより少ない変動性が観察される。LbaCas12a及びExoIによる同時処理によって生成された5’オーバーハングは、有利には、11又は12ヌクレオチド長である。
【0150】
実施例4:Cas12a-gRNA及びExoI処理から得られた5’オーバーハングは、オリゴヌクレオチドプローブのハイブリダイゼーションを促進することができる
ヒトNDGR4.1crRNA#1(配列番号:20)によって認識される部位を含む287bpのPCR断片(配列番号:19)を、5’-TTTV-3’ PAM配列を含む非標的鎖の5’末端でFITCによりタグ付けした。PCR断片を最初にLbaCas12a-crRNA#1複合体と共にインキュベートして、オーバーハングを作成した。反応を停止させ、精製した。3’末端にビオチンを含み、5’末端に5’オーバーハングに相補的な配列を含むオリゴヌクレオチドプローブを溶出DNAに添加し、FEN1により処理し、Taq DNAリガーゼによりPCR断片にライゲーションした。エキソヌクレアーゼVII(3’~5’及び5’~3’一本鎖エキソヌクレアーゼ活性の両方を有するExoVII)又はExoI(3’~5’一本鎖エキソヌクレアーゼ活性のみを有する)の存在下又は非存在下でLbaCas12a-crRNA#1複合体をインキュベートすることによって、別々の反応を行った。ビオチンオリゴヌクレオチドプローブのライゲーションの成功は、キャピラリー電気泳動における273bpマーカーに近接して見えるより大きいサイズの断片の存在によって明らかである。異なるトレースを整列させるために、実施例3と同じように、FITCマーカー(129、273、及び503bpのPCR断片)を使用した。129及び273bpの断片に基づいて、5つの異なる実験をそろえた。
【0151】
5’オーバーハングを有する全ての断片について、対応するライゲーションピークの蛍光強度を全蛍光で割ることによって、ライゲーション成功率を計算した。図9(A)に示すように、PCR断片をLbaCas12a-crRNA#1複合体、オリゴヌクレオチドプローブ、FEN1及びTaq DNAリガーゼと共にインキュベートした後、得られた断片の約24%がライゲーション産物に対応する。対照的に、FEN1及びTaq DNAリガーゼの非存在下では、ライゲーションされた産物は存在しない。図9(B)に示すように、ExoI処理は、Aに存在する全てのピーク(Cas12a活性によって生成される異なる末端に対応する)がPAM配列から-9及び-10の位置に対応する2つの主要なピークに崩壊することを可能にする。ExoVII処理はまた、PAM配列から-9及び-10の位置に対応するピークを生成するが(図9(C))、3’末端は、-9及び-10のピークに加えて、Cas12a切断活性に対応する追加のピークが依然として存在するので、同様に凹むことができない。
【0152】
図9(A)で得られた結果とは対照的に、ExoIであれExoVIIであれ、FEN1及びTaq DNAリガーゼの存在下で3’~5’活性を有するエキソヌクレアーゼと共に断片を更にインキュベートすると、断片のはるかに高い割合(すなわち、約50%)が、ここで、プローブでライゲーションされたPCR産物に対応する(図9(D)及び(E)を参照)。したがって、核酸分子の集団を少なくとも3’~5’エキソヌクレアーゼ活性を有する酵素と接触させた際に、有利な改善として本発明の方法を使用した標的核酸領域の単離効率となる。実際、オリゴヌクレオチドプローブは、はるかに多数の断片の5’オーバーハングと共に安定な二重鎖を形成するので、本発明の方法によって単離される二重鎖の数(したがって、標的領域の数)もまた改善される。
【0153】
実施例5:qPCRによる切断効率の定量
本発明者らは、ヒトゲノム内のCas12aの切断効率を決定するために、定量的PCRアッセイ(図10に示すqPCR)を開発した。簡潔に言えば、オリゴヌクレオチドA及びB(配列番号:94及び95)を用いたqPCRにより、管内に存在する材料の量を定量することが可能になり、オリゴヌクレオチドA及びC(配列番号:96)を用いたqPCRにより、標的がCas12a-crRNA複合体によって切断されない場合にのみ産物が生成される。特異性を高めるために、本発明者らは、アンプリコン内にTaqManプローブ(配列番号:93)を含めて、同じプローブを両方のqPCR反応に使用することができるようにした。A/Bに対するqPCR A/CのCt比(すなわちΔΔCt)を計算することによって、複合体により切断された分子の割合を決定することが可能である。
【0154】
本発明者らは、CGG反復領域を含むヒトFMR1プロモーター(配列番号:57)を標的とするCas12a-crRNA複合体を様々な時間及び複合体:ヒトゲノムDNAの様々な比でインキュベートして、切断された断片対未切断断片の割合を推定した。複合体を調製するために、AsCas12aタンパク質を、10mM DTTを添加したNEB2.1緩衝液(50mM NaCl、10mM Tris-HCl、10mM MgCl、100μg/mL BSA、25℃でpH7.9)中、室温で10分間、FMR1に特異的なcrRNA#2gRNA(配列番号:29)の2倍のモル比でインキュベートした。
【0155】
第1の実験では、Cas12a-crRNA複合体がヒトゲノム内のその標的を切断するのに必要な時間を推定した。ヒト胚性腎臓細胞株(HEK293)から精製した2μgのヒトゲノムDNAを、10mM DTTを添加したNEB2.1緩衝液中、37℃で10、20、30及び60分間、600fmolのCas12a-crRNA複合体(ヒトゲノム当たり640,000個のCas12a-crRNA複合体の比)と共にインキュベートした。対照として、同じ緩衝液条件ではあるが、Cas12a複合体なしで、37℃で同量のゲノムDNAをインキュベートした。プライマー対A及びB又はA及びCのいずれかとのqPCR反応を、全ての試料(及び三連)で、上記の定量方法を使用して行い、標的の78%がわずか30分後にこのCas12a-crRNA複合体によって切断されることが観察された(図11)。インキュベーション時間を60分まで増加させることにより、切断効率の増加は観察されなかった。
【0156】
次に、最大切断効率を得ることを考慮して、所与のインキュベーション時間(10分)におけるDNA分子当たりのCas12a-crRNA複合体の最適比を決定した。2μgのヒトゲノムDNAを、10mMのDTTを添加したNEB2.1緩衝液中、37℃で10分間、300、600、1200又は1800fmolのCas12a複合体(ヒトゲノム当たりそれぞれ320,000、640,000、1,280,000及び1,600,000の複合体の比に対応する)のいずれかと共にインキュベートした。図11に見られるように、ヒトゲノムに対するCas12a-crRNA複合体の最良の比は、切断された標的の84%がこれらの条件で得られたので、1,280,000であった。複合体の量を更に増加(1800pmol)させても、切断効率は向上しなかった。効率は84%を超えて増加しなかったので(30分間のインキュベーション時間の600pmolに類似)、本発明者らは、反応を、好ましくはヒトゲノム当たり640,000個のCas12a-crRNA複合体の比で少なくとも30分間インキュベートすることができると決定した。
【0157】
実施例6:qPCRを使用して、ExoIの有無にかかわらずCas12aによって生成されたオーバーハングにおけるオリゴヌクレオチドプローブライゲーションの効率の定量
例4においてキャピラリー電気泳動を使用して得られた結果を確認するために、本発明者らは、FEN1の効率並びにCas12a-crRNA単独又はCas12a-crRNA及びエキソヌクレアーゼExoIのいずれかによって生成されたオーバーハングでのオリゴヌクレオチドプローブのライゲーションの効率を定量するため、qPCRアッセイを開発した。この効率を定量するために、2セットのプライマーをTaqManプローブと共に使用した(図10に示す)。オリゴヌクレオチドA及びB(配列番号:94及び95)を内部標準として使用して、反応管内に存在するDNAの量を定量し、(全ての反応を正規化するため)、及びオリゴヌクレオチドA及びD(ライゲーションされたプローブに特異的、配列番号:94及び97)を使用して、オリゴヌクレオチドA及びDを使用して得られるqPCR産物が増幅されるのはライゲーションの場合にのみであるので、ライゲーションの効率を決定した。プローブライゲーション断片(プライマーセットA/D、配列番号:94/97)の量の相対的な定量を、材料の総量(プライマーセットA/B、配列番号:94/95)によって正規化した。次いで、「標準参照反応」(ExoIの存在下でのCas12a切断、及び37℃で30分間のFEN1反応)を使用して、相対的な定量を100%に正規化した。この比を、これらの実施例に記載されるように、異なる実験条件で比較して使用した。
【0158】
最初に、ヒト胚性腎臓細胞株(HEK293)から精製した2μgのヒトゲノムDNAを、10mM DTTを添加したNEB2.1緩衝液中、37℃で30分間、100ユニットのエキソヌクレアーゼIの存在下又は非存在下で、600fmolのCas12a複合体と共に精製した。対照として、同じ緩衝液条件ではあるが、Cas12a複合体なしで、37℃で同量のDNAをインキュベートした。停止反応緩衝液(1.2ユニットのプロテイナーゼK及び20mMのEDTA)を使用して反応を停止させ、次いで、製造業者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズにより精製した。
【0159】
crRNAによって認識される部位に相補的な20塩基を有する標的特異的オリゴヌクレオチド(配列番号:98)(したがって、Cas12a及びエキソヌクレアーゼIによって生成された5’オーバーハングに相補的であり、図8を参照されたい)を、ThermoPol Buffer中の耐熱性フラップエンドヌクレアーゼ1(FEN1、NEB)及びTaq DNAリガーゼ(NEB)を含む反応管に37℃で30分かけて添加した。オリゴヌクレオチドプローブはまた、qPCRオリゴヌクレオチドDに相補的なユニバーサル配列を、その3’末端に含む。これらの反応は全て、プライマー対A/B及びA/Dを使用して2つの別々の管に定量した。各qPCR反応を3連で行った。
【0160】
エキソヌクレアーゼIをCas12a-crRNAと共に反応管に添加した場合、両方の条件で断片のほぼ80%が切断されたため、切断効率の差は観察されなかった(図12A)。しかし、エキソヌクレアーゼIが存在しない場合、FEN1及びTaq DNAリガーゼによるオリゴヌクレオチドプローブのライゲーション効率の50%の低下が観察された(図12B)。対照反応物(Cas12aなし)を、相対的な定量の対照として使用した。これらの結果は、キャピラリー電気泳動(ExoIを用いない場合の24%効率から、Cas12a切断中にExoIで処理した場合の54%まで、図9)を使用して観察されたものと一致した。
【0161】
実施例7:FEN1及びTaq DNAリガーゼによる標的特異的オリゴヌクレオチドプローブのライゲーションに対する温度の影響
FEN1及びリガーゼ活性に対するインキュベーション温度の影響を決定するために、本発明者らは、それらの活性範囲内の3つの温度(37℃、45℃及び55℃)を試験し、Cas12aの切断によって生じたオーバーハングがエキソヌクレアーゼIによって拡大されたときのプローブのライゲーションの効率を決定した。この効果を決定するために、100ユニットのエキソヌクレアーゼIの存在下又は非存在下で、2μgのヒトゲノムDNA(HEK293)を、10mM DTTを添加したNEB2.1緩衝液中、37℃で30分間、600fmolの、Cas12a/FMR1に特異的なcrRNA#2ガイドRNA(配列番号:29)と共にインキュベートすることによって、2つの反応条件を準備した。停止反応緩衝液(1.2ユニットのプロテイナーゼK及び20mMのEDTA)を使用して反応を停止させ、次いで製造業者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズにより精製した。crRNAによって認識される部位に相補的な20塩基を有する10pmolの標的特異的オリゴヌクレオチド(配列番号:98)を、1mM NAD、40ユニットのTaq DNAリガーゼ(NEB)、32ユニットの熱安定性フラップエンドヌクレアーゼ1(FEN1、NEB)を含む反応管に、37℃、45℃又は55℃のいずれかで30分かけて添加した。非特異的増幅を決定するために、FEN1を含まない別の反応を各温度で行った。2セットのプライマー(A/B及びA/D、それぞれ配列番号:94~95及び94~97)をTaqmanプローブ(配列番号:93)と共に使用して定量的PCR反応を行い、各qPCR反応を3連で行った。プローブライゲーション断片(プライマーセットA/D)の相対的な定量を、材料の総量(プライマーセットA/B)によって正規化し、次いで、上記のように、定量を「標準参照反応」(エキソヌクレアーゼIの存在下でのCas12a切断及び37℃で30分間のFEN1反応)を使用して正規化した(例6)。
【0162】
図13に示すように、温度はエキソヌクレアーゼIによってもたらされるライゲーション改善に影響を与えず、ライゲーション効率を倍増させた。しかし、反応物を45℃でインキュベートした場合、ライゲーション及び/又はFEN1活性の全体的な効率の増加が観察された(37℃よりも1.8倍多いプローブライゲーション)。
【0163】
実施例8:単離された標的領域からのヘアピン構造
図6及び例2に示す方法は、1.6μgの大腸菌(E.coli)ゲノムDNAを使用して実施した。具体的には、具体的には、ゲノムDNAを、対象となる領域(標的#1及び2、配列番号:9及び10)の両側に2つの異なるCas12a-crRNA複合体(配列番号:11~14)が隣接し、当該複合体がそれぞれ第1及び第2の部位に結合する、2pmolのLbaCas12a-crRNA複合体と共にインキュベートした。標的領域当たり2つのCas12a-gRNA複合体の使用は、特異性を有利に増加させ、方法の工程数を制限する(例えば、断片化は必須ではなく、Cas12a-gRNA複合体を同時に添加してもよい)。更に、2つの異なるCas12a-gRNA複合体を使用することにより、2つの異なる特異的な5’一本鎖オーバーハングを生成することを可能にし、これを後の工程で使用して所望の下流用途に適した分子を生成することができる。LbaCas12a-crRNA反応に100ユニットのExoIを添加し、これにより、この方法が効率的に機能するために必要な5’オーバーハングが生成された。停止反応緩衝液(1.2ユニットのプロテイナーゼK及び20mMのEDTA)を使用して反応を停止させ、次いで製造者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズにより精製した。
【0164】
crRNAによって認識される部位に相補的な(したがって、Cas12a及びエキソヌクレアーゼIによって生成される5’オーバーハングに相補的である)20塩基を5’末端に有する標的特異的オリゴヌクレオチドプローブを、耐熱性フラップエンドヌクレアーゼ1(FEN1)及びTaq DNAリガーゼを含む反応管に添加する(図6も参照)。オリゴヌクレオチドプローブは、その3’末端に既知の配列の領域を更に含み、これは一本鎖のままであり、それによって3’オーバーハングを形成する(図8も参照)。有利には、全てのオリゴヌクレオチドプローブは、同じ3’配列を含んでもよく、したがって、図8に示されるように「ユニバーサル」であると考えられる。この場合、5’ビオチンリガンドを有するオリゴヌクレオチドPS1465又はPS1467(配列番号:17及び18)をオリゴヌクレオチドプローブ上の既知の配列にハイブリダイズさせ、Bst Full length DNAポリメラーゼ及びTaqリガーゼを使用してギャップを埋め、封止した。これにより、Y字形アダプタの生成が可能になり、これにより、分子がSIMDEQプラットフォームでの下流分析に使用することが可能になる。得られた核酸断片を、製造業者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズで精製する。
【0165】
これらの2つの標的は、ヘアピンアダプタPS421(配列番号:69)がハイブリダイズされライゲーションされたY-アダプタに関して標的領域の反対側に位置する部位に同じ4塩基オーバーハングを有する非パリンドローム制限酵素BsaI部位を含む。BsaI反応液を、Cutsmart(登録商標)緩衝液(50mM酢酸カリウム、20mM酢酸トリス、10mM酢酸マグネシウム、100μg/mL BSA、pH7.9)中、37℃で30分間インキュベートし、反応物を製造業者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズで精製した。次いで、10pmolのヘアピンアダプタを含むT4 DNAリガーゼ緩衝液(50mM Tris-HCl、10mM MgCl2、1mM ATP、10mM DTT、pH7.5)中のT4 DNAリガーゼを使用して、室温で30分間、ライゲーションを行った。次に、製造者の推奨事項(KAPAビーズ、Roche)を使用して、ライゲーションされた生成物を常磁性ビーズで精製する。
【0166】
次に、本方法の特異性を評価し、CAAG 4塩基オリゴヌクレオチドを使用して予想されるピークを検出するために、調製した標的領域を本発明者らのSIMDEQプラットフォームで分析した。結合位置のトレースを図15A及び15Bに示し、全ての予想されるピークが適切に同定されたことを示す。他のヘアピン分子はフローセル内に存在せず、100%の特異性を示した。これは、15~25%のオフターゲット捕捉を示すハイブリッド捕捉の既存の方法とは顕著に対照的である。
【0167】
実施例9:ヒトゲノムDNAを使用したヘアピン構築
本発明者らは、Cas12a及びエキソヌクレアーゼI、続いてFEN1及びライゲーション工程を用いて上記の図14に示すプロトコルを使用して、SIMDEQ装置で分析するのに適したヘアピン分子を構築した。簡潔には、5μgのヒトゲノムDNAを、FMR1標的領域(配列番号:65)に隣接する600fmolの各Cas12a-crRNA複合体(配列番号:28及び29)及び100ユニットのエキソヌクレアーゼIと共に、10mMのDTTを添加したNEB2.1緩衝液中、37℃で30分間インキュベートした。停止反応緩衝液(1.2ユニットのプロテイナーゼK、20mMのEDTA)を使用して反応を停止させ、次いで、製造業者の推奨事項(KAPAビーズ、Roche)を使用して常磁性ビーズにより精製した。
【0168】
次いで、得られたDNAを、各10pmolの2つのオリゴヌクレオチドプローブと共にインキュベートし、第1のオリゴヌクレオチドプローブはCas12a-crRNA#1(配列番号100)の切断部位でエキソヌクレアーゼIによって生成された5’オーバーハングに相補的であり、第2のオリゴヌクレオチドプローブはCas12a-crRNA#2(配列番号99)の5’オーバーハングに相補的であり、その3’末端にビオチンリガンドを含み、その配列内に脱塩基部位修飾(THF又はテトラヒドロフラン)、並びに30ユニットのFEN1を含み、5’Flapを切断してニックを作成した。このニックを、1mM NAD+を添加したThermoPol反応緩衝液中で40ユニットのTaq DNAリガーゼを使用することによって封止した。45℃で30分後、2つの特異的オリゴヌクレオチド(配列番号:101及び97)をオリゴヌクレオチドプローブ上の既知の配列にハイブリダイズさせ、200nMのdNTPを添加したBst Full length DNAポリメラーゼを使用してギャップを埋め、封止した。これにより、Y字形アダプタ(この分子をSIMDEQプラットフォームでの下流分析に使用することができる)及び脱塩基部位を取り囲むdsDNA二重鎖(脱塩基部位の3bp後がdsDNAである)の生成が可能になる。得られた核酸断片をストレプトアビジン常磁性ビーズで捕捉し、濃縮する。
【0169】
具体的には、標的分子をNEB3緩衝液(100mM NaCl、50mM Tris-HCl、10mM MgCl2、1mM DTT、pH7.9、25℃)中のエンドヌクレアーゼIVによって37℃で30分間ビーズから溶出し、これは加水分解による脱塩基部位でのDNAホスホジエステル骨格の切断を触媒し、3’-ヒドロキシル末端を有する1ヌクレオチドギャップを残し、4bpの5’オーバーハングを生成する。次いで、このオーバーハングを使用して、T4 DNAリガーゼ緩衝液(50mM Tris-HCl、10mM MgCl、1mM ATP、10mM DTT、pH7.5)中のT4 DNAリガーゼを10pmolのヘアピンアダプタと共に室温で30分間使用する反応によってヘアピンアダプタをライゲーションする。
【0170】
実施例10:ヒトゲノムDNAからの標的領域の濃縮
ヒトゲノムDNAをヒト胚性腎臓細胞株(HEK293)から精製した。Cas12aガイドRNA(配列番号:2、20及び25~52)を、標的領域に隣接する第1及び第2の部位(配列番号:53~68)を標的とするように設計した。本発明者らは、癌に関与するエピジェネティックマーカーであるか、又はヒトにおいて疾患を引き起こすことが知られているSTR(ショートタンデムリピート)から構成されることが知られている、15個の異なるヒト標的を選択した(図16Aを参照)。本方法の第1の工程は、10μgのゲノムDNAを、390fmolの各Cas12a-crRNA複合体及び800ユニットのエキソヌクレアーゼIと共に37℃で2時間インキュベートして、5’オーバーハングを生成することによって実施した。製造業者の説明書に従って、停止緩衝液を添加することによって反応を停止させ、KAPAビーズ(Roche)を使用して精製した。
【0171】
3’末端にビオチンリガンドを含むオリゴヌクレオチドプローブ(配列番号:21及び70~83)を、生成された5’オーバーハングにそれらの5’末端が相補的であるように合成した。非標的鎖の切断位置の変動性(図1Cを参照)のために、プローブを、それらの5’末端がPAM配列及びPAM配列の後の更なる5塩基を含むように設計した。crRNAによって認識される部位に相補的なこの5’フラップ配列は、FEN1酵素の典型的な基質に相当する。これらのオリゴヌクレオチドはまた、3つの制限酵素、DdeI(C^TNAG)、HinflI(G^ANTC)、及びAluI(AG^CT)によって認識される制限部位を含む。
【0172】
LbaCas12a-crRNA複合体及びExoIで処理した溶出DNAに、6pmolのプローブ並びに30ユニットのFEN1を添加して、5’Flapを切断し、ニックを生成した。このニックを、反応緩衝液(20mM Tris-HCl、10mM(NHSO、10mM KCl、2mM MgSO、0.1% Triton(登録商標)X-100、1mM NAD+、pH8.8)中の40ユニットのTaq DNAリガーゼを使用して封止した。したがって、プローブと5’オーバーハングとの間に二重鎖が形成された。37℃で30分後、30ユニットのRecJF(5’~3’ ssDNAエキソヌクレアーゼ)を添加して、非ライゲーションオリゴヌクレオチドを消化した。次いで、製造業者の推奨事項(KAPAビーズ、Roche)を使用して、ライゲーションされた生成物を常磁性ビーズで精製し、得られたDNA調製物を、FEN1反応と同じ反応緩衝液中で1時間、ストレプトアビジンでコーティングした常磁性ビーズ(Ocean Nanotech)を使用して捕捉した。二重鎖(したがって、DNA標的領域)に結合したビーズを3つの反応に分割し、各反応物を異なる制限酵素(DdeI、AluI又はHinfI)で処理し、これにより、DNA標的領域をビーズから切断し、Illuminaライブラリ調製用のテンプレートとすることができた。本発明者らは、低出発物質用のNEB Ultra IIキットを使用し、続いて製造業者のプロトコルに従ってライブラリを調製した。配列決定反応は、ペアエンド配列決定(各側に150塩基対)を用いたNextSeq 500 Illuminaシーケンサーで行った。ヒト参照ゲノムに対してBowtieアルゴリズムを使用して読み取りをアラインメントし、Samtoolsを使用して被覆率計算を行った。IGVソフトウェアを使用して読み取りを可視化した。標的領域(SNCA)のうちの1つの代表的な被覆率を図16Bに示す(IGVソフトウェアからのスクリーンショットの抽出)。この標的領域内で得られた最大被覆率は、平均で1倍未満であった残りのゲノムDNAと比較して非常に高かった(614倍)。
図1A
図1B
図1C
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12A
図12B
図13
図14
図15A
図15B
図16A
図16B
【配列表】
0007405485000001.app