(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-02-07
(54)【発明の名称】デザイナヌクレアーゼを用いる修飾の特徴付け方法
(51)【国際特許分類】
C12Q 1/34 20060101AFI20220131BHJP
C12Q 1/686 20180101ALI20220131BHJP
C12Q 1/6869 20180101ALI20220131BHJP
C12Q 1/6876 20180101ALN20220131BHJP
C12N 15/09 20060101ALN20220131BHJP
【FI】
C12Q1/34 ZNA
C12Q1/686 Z
C12Q1/6869 Z
C12Q1/6876 Z
C12N15/09 Z
【審査請求】未請求
【予備審査請求】有
(21)【出願番号】P 2021505776
(86)(22)【出願日】2019-09-19
(85)【翻訳文提出日】2021-01-27
(86)【国際出願番号】 EP2019075101
(87)【国際公開番号】W WO2020064478
(87)【国際公開日】2020-04-02
(32)【優先日】2018-09-25
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】520343870
【氏名又は名称】アルベルト-ルートヴィヒ-ウニヴェルズィテート フライブルク
(71)【出願人】
【識別番号】521039817
【氏名又は名称】ドイチェス・クレープスフォルシュングスツェントルム・シュティフトゥング・デス・エフェントリッヒェン・レヒツ
(74)【代理人】
【識別番号】110003007
【氏名又は名称】特許業務法人謝国際特許商標事務所
(72)【発明者】
【氏名】カトメン、トニー
(72)【発明者】
【氏名】トゥルキアノ、ジャンドメニコ
(72)【発明者】
【氏名】ブラットナー、ジョルジュ
(72)【発明者】
【氏名】モナコ、ジャンニ
(72)【発明者】
【氏名】ボリース、メラニー
(72)【発明者】
【氏名】アンドリュー、ジョフロワ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA05
4B063QA11
4B063QQ02
4B063QQ08
4B063QQ42
4B063QR14
4B063QR32
4B063QR62
4B063QS02
4B063QS12
4B063QS25
4B063QS36
(57)【要約】
デザイナヌクレアーゼの活性による細胞または組織から得られる核酸ゲノムにおけるゲノム全体修飾の高処理検出のための方法であって、
a)デザイナヌクレアーゼが、細胞のゲノムDNA中にDNA二重鎖切断(DSB)を導入できる条件下で、デザイナヌクレアーゼに暴露された細胞からゲノムDNAを抽出する工程、
b)核酸を断片化し、ランダム断片を得る工程、
c)平滑末端を得るために、末端修復を行う工程、
d)いわゆる“リンカープライマー”に相補的な配列を含むリンカーと連結する工程、
e)“リンカープライマー”及びいわゆる“オンターゲットプライマー”との第1核酸増幅反応を行う工程、(これにより、1つのプライマーがオンターゲット部位の上流に位置し、1つのプライマーがオンターゲット部位の下流に位置する。また、ここで、少なくとも1つのデコイプライマーが該反応混合物中に存在する。)、
f)第2核酸増幅反応を行う工程(これにより、いわゆる“ネストされたプライマー”が反応混合物に添加される。また、これにより、1つのプライマーがオンターゲット遺伝子座に相補的であり、1つのプライマーがリンカー配列に相補的である。)、
g)さらなる核酸増幅反応を行う工程(ここで、少なくとも1つのコードを含むプライマーが該反応混合物に添加される。)、
h)ネストされた及びバーコードされた増幅生成物の配列を決定する工程、及び
i)適切な生物情報的な手段を用いて、配列決定された生成物を参照配列に整列させ、少なくとも1つのDNA二重鎖切断に基づいて、ゲノム修飾を含む染色体位置を同定する工程
を含む、方法を開示した。
【特許請求の範囲】
【請求項1】
デザイナヌクレアーゼの活性による細胞または組織から得られる核酸ゲノムにおけるゲノム全体修飾の高処理検出のための方法であって、
a)デザイナヌクレアーゼが、細胞のゲノムDNA中にDNA二重鎖切断(DSB)を導入できる条件下で、デザイナヌクレアーゼに暴露された細胞からゲノムDNAを抽出する工程、
b)核酸を断片化し、ランダム断片を得る工程、
c)平滑末端を得るために、末端修復を行う工程、
d)いわゆる“リンカープライマー”に相補的な配列を含むリンカーと連結する工程、
e)“リンカープライマー”及びいわゆる“オンターゲットプライマー”との第1核酸増幅反応を行う工程(これにより、1つのプライマーがオンターゲット部位の上流に位置し、1つのプライマーがオンターゲット部位の下流に位置する。また、ここで、少なくとも1つのデコイプライマーが該反応混合物中に存在する。)、
f)第2核酸増幅反応を行う工程(これにより、いわゆる“ネストされたプライマー”が反応混合物に添加される。また、これにより、1つのプライマーがオンターゲット遺伝子座に相補的であり、1つのプライマーがリンカー配列に相補的である。)、
g)さらなる核酸増幅反応を行う工程(ここで、少なくとも1つのコードを含むプライマーが該反応混合物に添加される。)、
h)ネストされた及びバーコードされた増幅生成物の配列を決定する工程、及び
i)適切な生物情報的な手段を用いて、配列決定された生成物を参照配列に整列させ、少なくとも1つのDNA二重鎖切断に基づいて、ゲノム修飾を含む染色体位置を同定する工程
を含む、方法。
【請求項2】
前記核酸増幅方法が、ポリメラーゼ連鎖反応であることを特徴とする、請求項1に記載の方法。
【請求項3】
工程c)による末端修復において、相補的なTを有する工程d)で使用されるリンカーと一致する3'末端にある突起Aを有する末端が生成されることを特徴とする、請求項1または2に記載の方法。
【請求項4】
前記デコイプライマーが、前記オンターゲット部位の下流少なくとも10ヌクレオチドの距離に位置する配列に相補的であることを特徴とする、請求項1~3のいずれかに記載の方法。
【請求項5】
1つのデコイプライマーの結合部位が、標的部位の下流少なくとも10ヌクレオチドの距離に位置し、他方のデコイプライマーの結合部位が、標的部位の下流少なくとも30ヌクレオチドの距離に位置することを特徴とする、請求項1~3のいずれかに記載の方法。
【請求項6】
順方向オンターゲットプライマーは、前記オンターゲット部位の上流少なくとも25ヌクレオチドの距離に位置することを特徴とする、請求項1~3のいずれかに記載の方法。
【請求項7】
稀な染色体異常の同定を可能にすることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項8】
前記デコイプライマーは、それぞれ前記順方向オンターゲットプライマー及び前記逆方向リンカープライマーが隣接する領域において、前記オンターゲット部位に近接して結合するように設計されていることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項9】
オンターゲット部位及び/またはオフターゲット部位における染色体異常を検出できることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項10】
前記核酸増幅反応は、前記デザイナヌクレアーゼが核酸を切断するオンターゲット部位の領域で行われることを特徴とする、請求項1~9のいずれかに記載の方法。
【請求項11】
コードを含む分子が、次世代配列決定のためにバーコードを提供することを特徴とする、請求項1~10のいずれかに記載の方法。
【請求項12】
配列対合及び標的配列についてのポジティブ選択を含む生物情報を一助にし、核酸増幅で得られた情報を解析することを特徴とする、前記請求項のいずれかに記載の方法。
【請求項13】
ミスプライミング生成物またはリンカー生成物に起因する無関係の配列を除去する、請求項12に記載の方法。
【請求項14】
選択された配列を参照ゲノムに整列させ、かつ、偽陽性転位部位を除去する、請求項12または13のいずれかに記載の方法。
【請求項15】
適合されたリンカー分子、プライマー分子、デコイプライマー、及びバーコード分子を含む、請求項1~14のいずれかに記載の方法を実施するのに適したキット。
【発明の詳細な説明】
【背景技術】
【0001】
ゲノム編集は、いわゆる“デザイナヌクレアーゼ”を用いて対象となる任意種の細胞型のゲノムを標的として修飾することを表す。
【0002】
いくつかのデザイナヌクレアーゼが知られており、“プログラミング可能なヌクレアーゼ”または“操作されたヌクレアーゼ”とも呼ばれる。それらの例は、亜鉛-フィンガヌクレアーゼ(ZFN)、転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、及びクラスター化された規則的相互間隔反復(CRISPR/Cas)原核生物適応免疫系から由来し得るRNA誘導の操作されたヌクレアーゼ(RGEN)である。これらの手段は重要であり、培養細胞におけるゲノム編集だけでなく、全生物におけるゲノム編集にも広く用いられている。デザイナヌクレアーゼは、自然に起源するが、意図された方法で作用するために人工的に改変される。
【0003】
ゲノム編集は広範な用途を有し、原核生物及び真核生物、作物、家畜、研究用モデル生物、薬物スクリーニング用細胞株、及び種々の治療用細胞型または器官の遺伝子改変におけるその応用は成功された。これらの用途の大部分について、使用されるデザイナヌクレアーゼの特異性は、編集された細胞型のゲノム完全性の維持を保証するための主要なパラメーターである。
【0004】
ヒトにおける臨床用途において、デザイナヌクレアーゼを用いて編集されてきた関連の細胞型は、造血幹細胞、B及びT細胞、表皮幹細胞、多能性幹細胞、肝細胞、筋細胞、及び網膜細胞を含む。関連の標的疾患は、(これらに限定されないが)遺伝性疾患、特に優性遺伝性を有する遺伝性疾患または確実に調節された遺伝子の突然変異による疾患、感染症、または癌を含む。
【0005】
ex vivoで移植可能な細胞型におけるゲノム編集を実施する前に、またはin vivoで遺伝子編集ツールを直接患者に適用する前に、デザイナヌクレアーゼの活性及び特異性を注意深く評価する必要がある。ゲノム完全性を維持し、発癌性突然変異を誘発するリスクを低減するために、操作されたエンドヌクレアーゼの特異性は、遺伝子編集の全ての臨床的翻訳に重要である。いわゆるオフターゲット部位におけるデザイナヌクレアーゼに誘発された突然変異誘発の結果及び/またはそれによって生じる染色体異常は、しばしば、最終的に癌につながる可能性のある遺伝子毒性と呼ばれる。
【0006】
本出願において、“オンターゲット部位”という用語は、“デザイナヌクレアーゼ”を用いてDNA二重鎖切断が意図的に導入される部位を指すために用いられる。このような意図された作用部位は、通常、“オンターゲット部位”と呼ばれる。
【0007】
デザイナヌクレアーゼは、ある程度の配列特異性を有し、従って、このような“オンターゲット部位”において作用する。しかし、デザイナヌクレアーゼはまた、オンターゲット部位に対してある程度の配列相同性を示すいわゆる“オフターゲット部位”においても作用し得る。本明細書で用いられる“オフターゲット部位”という用語は、デザイナヌクレアーゼが活性を有し、かつ、通常ではデザイナ配列の標的配列と同一でない配列を有する部位を指す。“オフターゲット部位”は、デザイナヌクレアーゼによって切断される“オンターゲット部位”以外の配列に関する。デザイナヌクレアーゼが、オンターゲット部位とは異なる部位でも活性を有するという事実は、種々の理由により引き起こされ得る現象に起因する可能性がある。オフターゲット部位で切断するデザイナヌクレアーゼの否定的な面として、これが、回避すべきゲノムにおける突然変異、欠失、配列反転及び他の妨害のような望ましくない副作用をもたらす可能性がある。
【0008】
一般に、デザイナヌクレアーゼにより誘導されたオフターゲット活性は、短い挿入/欠失(indel)突然変異、大きな染色体欠失、染色体反転、ならびに染色体転位をもたらす可能性がある。分子レベルでは、デザイナヌクレアーゼのDNA結合部分が、実際の標的部位と相同性を共有するゲノム中の配列に結合するとき、オフターゲット活性が起こる。過去10年間、ゲノム編集ツールの安全性を向上させるために多大な努力が払われたことで、より高い特異性を有するより良いデザイナヌクレアーゼがもたらされてきた。
【0009】
なお、デザイナヌクレアーゼの特異性に関する完全な前臨床的評価については、ドイツのPaul Ehrlich Instituteや米国食品医薬品局(FDA)などの規制当局によって明確に規定された要件がある。高感度で、当業者が、オフターゲット突然変異誘発だけでなく、染色体異常及び/または他の予想外のゲノム修飾も高感度に測定することに適用される診断方法に対する需要がある。
【0010】
CRISPR-Casヌクレアーゼのようなデザイナヌクレアーゼの適用に関連する遺伝子毒性のリスクを評価するために、デザイナヌクレアーゼのオフターゲット活性またはデザイナヌクレアーゼに誘発された染色体異常のいずれを測定するための方法がいくつか開発されてきた。原理的に、これらの方法は、コンピュータに基づく予測アルゴリズム(in silico法)、in vitro試験法及び細胞に基づく方法に細分類できる。これらの方法の全ては、次世代配列(NGS)に頼っており、典型的には2段階のプロセスで用いられる。最初に、対象となるゲノム中の潜在的に可能な全てのオフターゲット部位を同定するために“スクリーニングアッセイ”が用いられる。次に、遺伝子編集細胞のゲノムにおけるスクリーニング試験で定義された潜在的なオフターゲット部位を配列するために“確認アッセイ”が用いられる。
【0011】
In silico予測アルゴリズムは、明確に定義されたパラメーターに基づき、該パラメーターには、標的配列に対する類似性が含まれる(Lee et al. (2016), Mol Ther 24, 475-487)。それらは、高速な、かつ比較的安価な“スクリーニングアッセイ”を提供するが、より多くの場合、それらのアルゴリズムは、重要なオフターゲット部位を当てそこなう。In silico分析とは対照的に、実験的な方法は、所定のパラメーターとは独立してオフターゲットの同定を可能にし、その結果、偏りが少ない。しかし、実験的な方法は、より困難で、より高価である。また、それらは技術的な制限を受け、いくつかは感度が不十分である。
【0012】
現在、いくつかの実験的な“スクリーニングアッセイ”が、オフターゲット部位の測定に用いられ、デザイナヌクレアーゼの特異性の前臨床的評価に十分と考えられる感度を有するようである。例えば、
a) EP 3 219 810 (全ゲノム配列決定)
b) Guide-Seq (Tsai et al. (2015), Nat Biotechnol 33, 187-197)
c) BLISS (Yan et al. (2017), Nat Commun 8, 15058)、
d) Digenome-Seq (Kim et al. (2015), Nat Methods 12, 237-243)、及び
e) Circle-Seq (Tsai et al. (2017), Nat Methods 14, 607-614)。
【0013】
Guide-Seqは、デザイナヌクレアーゼに加えて、短い二本鎖オリゴデオキシヌクレオチド(dsODN)を細胞に導入する細胞に基づく方法である。デザイナヌクレアーゼがゲノムを切断すると、短いdsODNは、細胞DNA修復機械によって得られたDNA二重鎖切断に統合され、次いで、高処理配列決定のための出発点として機能することができる。この方法は、そのゲノムが患者のゲノムとかなり異なっていてもよい特定のヒト細胞株においてのみ、うまく機能する。
【0014】
BLISSは、in vitroで利用可能なDNA末端へのオリゴ連結により、細胞中の実際のDNA二重鎖切断を検出する。連結されたDNAはin vitroで転写され、ライブラリーは高処理配列決定によって配列決定される。Digenome-Seq及びCircle-Seqは、in vitroでの方法であり、全ゲノムの切断またはCRISPR-Casを用いた環状ゲノム断片に基づく。
【0015】
Digenome-Seqについて、全ゲノム配列決定は、in vitroで切断されたゲノム上で実施され、これは、その後、計算で同定され得る切断部位において同じ5'末端を有する配列の読み取りをもたらすであろう。必要な回収及び十分な感度を達成するために、Digenome-Seqは、Illumina HiSeq lineのような高処理配列決定機械で実施されなければならない。その結果、Digenome-Seqの適用はかなり高価である。
【0016】
Circle-Seqにおいては、配列決定アダプターは、切断された5'末端に連結され、それは次に、NGSに使用されて、オフターゲット部位を同定することができる。しかし、Circle-Seqは、ゲノムDNAを循環させる必要性から生じる潜在的な偏りを受け、大量のインプットDNAを必要とする。従って、使用可能な試料の量が限られた場合(例えば、生検)には、Circle-Seqを実行することができない。全ての場合において、これらの実験的に測定されたオフターゲット部位は、多重化された標的増幅産物の配列決定のようなNGSに基づく“確認アッセイ”を用いて患者の細胞内で検証し、臨床関連の標的細胞におけるヌクレアーゼの実際の特異性プロフィールを確立しなければならない。
【0017】
重要なことは、上記の方法によって、研究者が、選択したデザイナヌクレアーゼによって切断されたオフターゲット部位を予測できるが、これらのいずれによってもプログラミング可能なヌクレアーゼによって誘導される総染色体異常を評価できない。例えば、最近の文献(Kosicki et al. (2018), Nat Biotechnol 36, 765-771)を参照されたい。
【0018】
さらに2つの方法、即ち、高処理全ゲノム転位配列決定(HTGTS)及び単方向標的配列方法論(UDiTaS)は記載されている。これらは、デザイナヌクレアーゼによって誘導される転位または他の染色体異常を同定できる。HTGTS (WO 2016/081798)及びUDiTaS (WO 2018/129368)は、ゲノム中の非特異的なDNA二重鎖切断の検出に関する方法を開示している。該2つの方法は、転位事象の同定も可能であるが、前記の生物情報的な分析ならびに偏ったゲノム断片化(UDiTaSのためのTn5タグの使用、HTGTSのための制限酵素)によって、これらの方法の感度がかなり制限される。HTGTSでは、検出下限(LLoD)も、感度も明記されていない。UDiTaSのLLoDは、
0.1%と示されている。
【0019】
全ての公知の方法は、デザイナヌクレアーゼのオフターゲット活性に関連しない染色体再配列を同定することができない。特に、これらの方法は、デザイナヌクレアーゼのオンターゲット活性によって引き起こされる相同性介在の染色体再配列を同定することができない。
【0020】
HTGTS及びUDiTaSは、未知の転位事象に関して定量的ではない。
【0021】
HTGTS及びUDiTaSは、遺伝子編集された臨床関連の細胞型、即ち造血幹細胞から採取されたゲノムDNAに作用することは示されていなかった。
【0022】
本発明の目的は、総染色体異常を含むゲノム修飾を同定できる方法、即ち、(i)高感度な、(ii)高特異的な、(iii)定量的な、(iv)予め記述されていないタイプの染色体再配列を検出でき、かつ(v)臨床関連の細胞型から単離されたゲノムDNA上で直接行われる方法を提供することである。本明細書では、該方法をCAST-Seq (単一の標的されたリンカーに媒介されるPCRによる染色体異常分析)と称する。
【0023】
CAST-Seqは、単一の標的されたリンカーに媒介されるPCR(LM-PCR)に基づくものであり、デコイプライマーを用いてシグナル/ノイズ比を向上させる。該方法は、オフターゲット部位を同定し、デザイナヌクレアーゼのオンターゲット活性及びオフターゲット活性の両方から由来したゲノム修飾を検出することを可能にし、これには、大きな欠失、反転及び不整合感度を有する転位が含まれる。重要なことは、CAST-Seqは高感度であるため、1μg未満のゲノムDNAをインプットとしてアッセイを行うことができる。従って、CAST-Seqは、移植前のex vivo遺伝子編集細胞、または遺伝子編集器官の生検から由来した細胞を含む、任意の臨床関連のヒト細胞型に直接適用することができる。このユニークなセットアップ、CAST-Seqが目的の遺伝子編集細胞型または組織において直接行われること、また、CAST-Seqは、“スクリーニング試験”と“確認試験”とを直接合体させることから、NGSに基づく確認アッセイは余計なことになる。従って、CAST-Seqは、“オンターゲット部位”及び“オフターゲット部位”における染色体異常を検出することにより、該プロセスを実質的に改善することができる。
【0024】
本発明の好ましい実施形態
本発明は、あらゆる真核細胞型におけるデザイナエンドヌクレアーゼを用いるゲノム修飾を特徴付けるために用いる新規な方法を提供する。前記真核細胞型には、ヒト細胞、非ヒト霊長類細胞、哺乳動物細胞型、脊椎動物細胞型、酵母、植物細胞が含まれるが、これらに限定されない。
【0025】
CAST-Seqは、デザイナヌクレアーゼのオフターゲット活性及びオンターゲット活性の両方による染色体異常を特徴付けることができる。このように、本発明はまた、オンターゲット部位、または該オンターゲット切断部位に由来する大きな染色体欠失における2つの姉妹染色体の融合から由来した稀な無動原体/二動原体の転位を分類するための新しい診断方法を提供する。重要なことに、CAST-Seqはまた、ゲノム中の共通破壊部位(CBS)または天然に存在する破壊部位(NBS)に始まるデザイナヌクレアーゼに誘発された染色体異常を検出することができる。
【0026】
ヒトにおける臨床ゲノム編集の応用において、例えば、高活性を高い特異性と組み合わせるエンドヌクレアーゼを選択するために、CAST-Seqは、前臨床段階で効果的に実施することができ、任意のエンドヌクレアーゼ(限定されないが、例えば、CRISPR-Cas、TALEN、ZFN、MegaTALのデザイナヌクレアーゼ)の特異性を特徴付ける。この文脈において、また、エンドヌクレアーゼの親和性、特異性及び/または安定性に影響を及ぼす修飾などの、プログラミング可能なエンドヌクレアーゼに導入される修飾の影響を特徴付けるためにも、CAST-Seqは使用され得る。
【0027】
さらに、高感度であるため、少量なゲノムDNAは完全な分析を行うのに十分である。従って、製造された遺伝子編集の製品を、患者へ適用される前の品質管理分析の一部として、CAST-Seqを用いて特徴付けることもできる。
【0028】
CAST-Seqはまた、患者追従期に用いることができる。例えば、CAST-Seqを用いて、遺伝子編集された造血幹細胞の移植後の様々な末梢血細胞型のゲノム完全性を評価することができる。
【0029】
さらに、CAST-Seqは半定量的な方法であるため、例えば、初期の前癌細胞におけるある種の修飾のクローン性拡大を評価するために、特定の修飾の頻度の変化を経時的に追跡することができる。利用可能なデータが十分になると、CAST-Seqを用いて癌の発症における遺伝子毒性的な突然変異の結果及び/またはリスクを予測することは可能となる。
【0030】
CAST-Seqの応用として、免疫系の欠損、血友病、ヘモグロビン障害、代謝障害、感染症のようなex vivoゲノム編集が適用される障害、及び癌と戦うためのT細胞系免疫療法の改善が含まれるが、これらに限定されない。
【0031】
また、in vivoで行われる遺伝子編集の結果を評価するために、CAST-Seqを実施することができる。即ち、例えばウイルス送達またはナノ粒子または他の任意の手段による送達を介して、患者にゲノム編集ツールを直接適用する。このような状況では、標的器官(例えば、肝臓)から採取される生検は、デザイナヌクレアーゼに誘発された遺伝的または染色体の修飾の影響を評価するのに十分であろう。このアプローチは、標的器官だけでなく、オフターゲット器官における遺伝子編集アプローチに対する影響を評価するためにも適用することができる。また、長期の研究で遺伝子編集された細胞の運命を追跡することができる。
【0032】
本発明の方法は、好ましくは、in vivoゲノム編集が適用される疾患、例えば血友病、代謝障害、遺伝性眼障害、遺伝性聴覚障害、遺伝性筋障害、神経筋疾患、及び中枢神経系に影響を及ぼす障害に使用することができる。
【0033】
本発明は、癌ゲノム研究のための新しい診断ツールを提供する。例えば、特定の突然変異または刺激の場合、CAST-Seqは、共通破壊部位(CBS)をマッピングし、与えられた癌原性モデルの変異シグネチャーを描写できる。このようなアプローチにおいてCAST-Seqを使用することにより、癌の結果を予測し、診断するための新しい標準的なアプローチを定義することが可能であろう。
【0034】
本発明の方法は、核酸、好ましくはデザイナヌクレアーゼの活性によるゲノム酸における望ましくない修飾の検出に関する。このような修飾は、いわゆる“オフターゲット部位”で行われることが好ましいが、いわゆる“オンターゲット部位”においても起こり得る。このような不要な修飾を検出するために、本発明の方法は、核酸増幅の工程を実施する。これは、好ましくはPCR(ポリメラーゼ連鎖反応)である。等温増幅法リガーゼ連鎖反応、ループ介在等温増幅、多重置換増幅または核酸配列に基づく増幅(NASBA)のような核酸を増幅するための他の適切な方法を用いることもできる。
【0035】
最初の工程では、デザイナヌクレアーゼが少なくとも1つのDNA二重鎖切断を導入できる条件下で、デザイナヌクレアーゼに暴露された真核細胞からライブラリーを整備する(工程a)。いわゆるデザイナヌクレアーゼの適切なものは、好ましくは、CRISPR-Casヌクレアーゼ、TALEN、ZFN、及びMegaTALなどである。
【0036】
次いで、ライブラリーの核酸を“ランダム断片”に変換する(工程b)。好ましい実施形態では、得られた断片は約350塩基対の長さを有する。これは、断片の大部分が約200~約500塩基対の範囲であり、それによって断片の中間サイズが約350塩基対であることを意味する。該断片化は、剪断力または超音波処理を用いるような物理的手段で、あるいは、ランダム部位で二本鎖核酸を切断する適切な酵素の消化でもできる。該工程は、定義された制限酵素の作用またはトランスポゾンの作用を伴わない。
【0037】
各断片上に均一な末端を有するために、3'末端に突出Aを有するように好ましく改変された末端を得るために修復を実施する(工程c)。次いで、突出Aを有するこれらの“ランダム断片”は、修復された断片のAに相補的な突出3'Tを有する適切なリンカーと結合される。これにより、リンカーの該“ランダム断片”の修復された末端への連結速度が改善される。
【0038】
好ましい実施形態では、リンカーは、順方向プライマーまたは逆方向プライマーにそれぞれ相補的な配列も含む。この構成により、該リンカーを有する断片の増幅が容易になる。
【0039】
次いで、適切な“オンターゲットプライマー”及び適切な“リンカープライマー”を用いて第1核酸増幅反応を行う。それらは、オンターゲット配列に非常に近接した配列、または好ましくはリンカーによって導入される結合位置に相補的である。好ましい実施形態では、オンターゲットプライマーの結合部位は、該オンターゲット部位の上流少なくとも25ヌクレオチド、好ましくは少なくとも35ヌクレオチド以上、好ましくは少なくとも50ヌクレオチドの距離に位置する。デコイプライマーは、本発明による方法の感度及び特異性を向上させる。
【0040】
順方向プライマー及び逆方向プライマーに加えて、少なくとも1つ、好ましくは少なくとも2つのデコイプライマーが添加される。デコイプライマーの目的は、“ランダム断片”上にオンターゲット配列のみを含み、即ち、染色体異常の事象を含まない断片の増幅を抑制するか、または少なくとも実質的に減少させることである。オンターゲットを含む断片の増幅が減少すると、オフターゲット部位を同定する可能性が高くなる。なぜならば、そのようなオフターゲット部位を含有する断片の数は、オンターゲット配列のみを含有する断片と比べて増加するからである。“オンターゲットプライマー”は、オンターゲット部位に特異的に結合するプライマーである。結合において高い特異性を提供するために、それは高い同一性及び十分な長さを有する。
【0041】
本発明の好ましい実施形態では、少なくとも2つの異なるデコイプライマーを使用し、それによって両方のデコイプライマーは、オンターゲット部位の下流の近接した配列に相補的である。所望のオンターゲット部位を囲む特定の配列に応じて、デコイプライマーが相補的である配列を選択すべきである。
【0042】
好ましい実施形態では、デコイプライマーの結合部位は重複しない。好ましい態様では、一方のプライマーは、DNA配列の上側鎖に相補的であり、他方のプライマーは、DNA配列の下側鎖に相補的である。好ましくは、該配列は、オンターゲット部位の下流少なくとも10ヌクレオチド、好ましくは少なくとも15ヌクレオチド以上、好ましくは少なくとも30ヌクレオチドの距離に位置する。デコイプライマーへの結合に適した配列の位置の最適条件は、各オンターゲット部位について評価されなければならない。デコイプライマーを用いて得られる効果は、オンターゲット部位を含む増幅配列の発生が低減され、それにより、オフターゲット部位を検出する確率が実質的に増加することである。オンターゲット部位の上流及び下流の配列が既知であるため、デコイプライマーのための適切な配列を容易に選択することができる。ポリメラーゼがデコイプライマーを伸長させるために、好ましくは、デコイプライマーは、いずれかの末端でブロックされない。
【0043】
次いで、本発明の方法により得られた配列は、高処理配列決定に供され、得られた配列の情報は、当業者に周知される生物情報的な手段により解析される。
【0044】
オフターゲット活性またはヌクレアーゼ誘発性染色体異常の検出方法は以前から記載されているが、本発明による方法は、CAST-Seqと略されるが、いくつかの重要な新規な特徴を有し、治療ゲノム編集における臨床リスクを評価するための根本的に新しいツールである。
【0045】
具体的に、本発明の方法によって得られる利点は以下の通りである。
(i) 高感度及びで高特異性、
(ii) 定量的、
(iii) 予め記述されていないタイプの染色体異常を検出でき、及び
(iv) 臨床関連の細胞型において直接に実施できる。
【0046】
これらの有利な特性は、本明細書に記載の実施例に開示される。
(i) より高い感度及び特異性
本データに示されたように、CAST-Seqは、150,000倍体ゲノム(500 ngのゲノムインプットDNA)中の10個の転位事象(=1 hit)を検出することができる。これは、検出下限(LLoD)約0.007%に相当する。デコイプライマーを使用することにより、この高感度と高特異性を達成することができる。本アプローチにおいて、これは初めての記載である。
【0047】
(ii) 定量的
アダプター連結部位と組み合わせた染色体破壊点は、ユニークな分子識別子を生成し、これにより、個々の転位の数を測定し、特定のトリガーによって促された事象にクラスター化し、そして既知量のインプットゲノムに基づいて非常に稀な事象の頻度を定量化する。定量ddPCRによって測定されるように、CAST-Seqヒット数と実際の染色体再配列数との間の線形相関は、本法の定量性及び高感度を確認する。
【0048】
(iii) 予め記述されていない染色体異常
CAST-Seqは、デザイナヌクレアーゼのオフターゲット活性に関連しない染色体再配列を初めて同定した。特に、ヌクレアーゼ誘導性DNA二重鎖切断は、転位を駆動する因子のうちのただ1つであることが見出された。CAST-Seqは、オンターゲット遺伝子と実質的な相同性を共有する領域が、オフターゲット部位を含まなくても、染色体再配列を受けやすいことを初めて示す。
【0049】
(iv) 臨床関連の細胞型における実施
CAST-Seqは、HTGTS/UDiTaSと違って、遺伝子編集された造血幹細胞、即ち臨床関連の細胞型から採取されたゲノムDNAにおいて実施できることが実証されている。
【0050】
本発明による方法を、図面、表及び実験でさらに例示し、説明する。当業者に周知されるように、開示された結果が好ましい実施形態を表し、それによって、実験または図の単一の特徴が、本明細書の他の実験に開示された他の特徴と容易に組み合わせることができる。通常では、一例の全ての特徴を一緒に使用されるしかないことの必要性はない。
【0051】
別の実施形態では、本発明は、本発明の方法を実施するためのキットにも関する。このようなキットは、本明細書に記載の具体的な方法を実施するために必要な成分を含む。具体的に、該キットは、プライマー、特異的なリンカー、及びデコイプライマー、ならびに反応を行うために必要な酵素を含有する。本明細書に開示された方法に記載された全ての成分は、単独でまたはそのようなキットにおいて一緒に含まれ得る。
【0052】
本出願の図面及び実施例で本発明の好ましい実施形態をさらに説明し、図示する。
【0053】
以下の略語は、図面、表及び実験において用いられた。
具体的に、図面では以下のように実験結果が示される。
【図面の簡単な説明】
【0054】
【
図1】CAST-Seqパイプラインの概略図(a)ライブラリー整備 細胞中のデザイナヌクレアーゼ(はさみで示される)のオンターゲット(濃い灰色染色体)及びオフターゲット(淡い灰色染色体)の同時活性は、2つのDNA二重鎖切断(DSB)間の転位を誘導し、例えば、相互転位に導くことができる。これにより、標的染色体は、セントロメア(c)部分とテロメア(t)部分とに分離される。大抵の場合、転位が生じない(右側)。未処理及び遺伝子編集された細胞に由来するゲノムDNAをランダムに断片化し、末端修復して3'-Aオーバーハングの付加を可能にする。この短いオーバーハングは、短いリンカー(黒)のその後の連結のために使用される。簡略化のために、セントロメア末端との反応のみが示されている。テロメア末端(最左側)との第2の反応が同様に行われる。第1PCRは、標的部位及びリンカー配列に結合するプライマー(オープン矢印)を用いて行われる。オンターゲット開裂部位に近接して結合するように設計されたいわゆる“デコイ”プライマー(実線矢印)が、該PCR反応に添加される。それらは、転位事象(左)に結合することはできないが、次のPCR段階ではさらに増幅できない短い増幅産物を生成することによって、修飾されていない標的部位(右)の増幅を防止する。第2PCRは、NGSにバーコードを加えるために第3PCRの工程で用いられる5'-オーバーハングを有するネストされたプライマーを用いて実施される。(b)生物情報パイプライン NGSから得られたFASTQファイルは、概略に従って処理される。ボックスには、生物情報的なフローにおける主要な工程が分類される:ペアリング及びフィルタリング、トリミング、整列、クラスター定義、及びクラスター解析。
【0055】
【
図2】カテゴリーの生物情報的な定義(a)読み取りに基づく距離 デザイナヌクレアーゼ誘発事象ではなく、偶然によってクラスターに入る読み取りの確率を計算するために、遺伝子編集された細胞からのCAST-Seq試料を、同じ読み取り数を含むin silicoで生成されたランダムな読み取りライブラリーと比較した。連続する読み取りの距離の分布は、対数スケールで示されている。この例では、2,500-bpの閾値ラインは、ランダムライブラリーにおいて<5%の面積を示す。これは、偶然に1クラスターに入る読み取りの確率が5%未満(p<0.05)未満であることを意味する。未処理細胞からのCAST-Seq分析は、対照として示されている。(b)標的配列整列スコア これらの転位部位を取り囲む500-bpゲノム領域を、500-bpの10,000個のランダム配列と比較した。スコアリング表(表12)を用いて、各部位をデザイナヌクレアーゼ標的配列に整列させた。該配列の標的配列整列スコアがランダム配列中の5%ベストスコアよりも高かった場合、該事象をオフターゲット(OT)活性由来型転位と分類した。(c)最大相同性領域ストレッチ 非OT部位については、標的領域と転位領域との間の最も長い共通の相同基質を、転位部位を囲む5 kbウィンドウ内で検索した。相同基質の長さがランダム配列中の5%最長基質よりも高かった場合、該事象は相同組換え(HR)媒介型転位と分類した。その他は、全て共通破壊部位(CBS)由来型転位と分類した。
【0056】
【
図3】デコイオリゴヌクレオチドプライマーの効果(a)デコイ試験系の概略図 412 bp断片を増幅する2つの遺伝子座特異的プライマー(オープン矢印)を用いて、CCR5遺伝子座においてデコイプライマー(実線矢印)の有効性を試験した。デコイプライマーの存在は、412 bp断片の増幅を低減または防止するはずである。F、順方向プライマー;R、逆方向プライマー。(b)ブロックされたデコイプライマーの使用 3'リン酸化(実線バー)によってブロックされたデコイプライマーと組み合わせたCCR5プライマーを用いて、PCRを実施した。以下の増幅が示されている:対照:F、CCR5順方向プライマーのみとの反応;1D、2つのデコイプライマーのうちの一方のみが使用された;H
20、反応には鋳型なし。1:1;1:5及び1:10は、CCR5オンターゲットプライマー対デコイプライマーの比を反映する。(c)ブロックされていないデコイプライマー ブロックされていないデコイプライマーと組み合わせたCCR5特異的プライマーを用いて、PCRを実施した。以下の増幅が示されている:対照H
20、反応には鋳型なし。1:1;1:5及び1:10は、CCR5オンターゲットプライマー対デコイプライマーの比を反映する。(d)単一のブロックされていないデコイプライマー 逆配向デコイプライマーのみと組み合わせたCCR5プライマーを用いて、PCRを実施した。以下の増幅が示されている:対照F、逆デコイプライマーと組み合わせたCCR5順方向プライマー。(b-d)増幅産物のサイズは左に示され、試験されたCCR5対デコイプライマーの異なる比は、下に1:1、1:5、1:10と示される。全てのプライマー配列を表2に示す。
【0057】
図3から分かるように、ブロックされていないデコイプライマーは、412 bp-断片(c)及び(d)の増幅を効率的に低減させ、または防止することができる。これは、デコイプライマーの使用が、転位事象を含むPCR鋳型の増幅に対するオンターゲット部位増幅の比をシフトさせることができることを示唆する(
図1a参照)。従って、最初の増幅ラウンドにおいて(
図1a参照)、ブロックされていないデコイプライマーは、非転位事象の増幅を実質的に防止し、または減少させるが、ブロックされたデコイプライマーを使用と、このような効果はない(b)。
【0058】
【
図4】CAST-Seqでマッピングされたゲノム修飾 CCR5遺伝子座(標的部位:5'-GTGAGTAGAGCGGAGGCAGG
AGG(配列番号:1)、下線付PAM)中のエクソン3を標的とするCRISPR-Cas9リボヌクレオシド複合体で編集されたCD34陽性造血幹細胞及び前駆細胞から単離されたゲノムDNAをCAST-Seqに付した。(a)ゲノム修飾のマッピング CAST-Seqで同定された関連のゲノム修飾部位は、全て染色体表意文字に示されている。マッピングされた部位は、3つの主要なカテゴリーに細分類できる:オフターゲット(OT)部位、相同性介在組換え(HR)、または共通破壊部位(CBS)に媒介される染色体異常。(b)OT解析 円グラフは、マッピングされた部位に見出されるミスマッチ及びバルジの画分を示す。ミスマッチ/バルジの数は、0~5以上で示されている。
【0059】
【
図5】整列 CCR5遺伝子座(標的部位:5'-GTGAGTAGAGCGGAGGCAGG
AGG(配列番号:1)、下線付PAM)中のエクソン3を標的とするCRISPR-Cas9リボヌクレオシド複合体で編集されたCD34陽性造血幹細胞及び前駆細胞から単離されたゲノムDNAをCAST-Seqに付した。(a)整列 参照標的部位(最上行:5'-GTGAGTAGAGCGGAGGCAGG
NRG(配列番号:2);下線付PAM;N、任意のヌクレオチド;R、プリン)及びCAST-Seqで同定されたトップ25のオフターゲット(OT)部位が示されている。ミスマッチされたヌクレオチド及びバルジ、即ち、参照標的部位に対するオフターゲット部位内のヌクレオチド挿入/欠失がハイライトされている。“1”は1つのヌクレオチド挿入を表し、“-1”は1つのヌクレオチド欠失を表す。クラスター開始位置は左に示されている。(b)オフターゲット配列の多様性 配列ロゴは、整列されたオフターゲット部位の集合から作成され、コンセンサス配列及びオフターゲット配列の多様性を示す。(c)ミスマッチ及びバルジに対する耐性 同定されたオフターゲット部位を23個のヌクレオチド長の標的配列に整列させ、次いで、gRNA(1-4、5-8、9-12、13-16、17-20)に認識される4個のヌクレオチド長領域、及びCas9タンパク質(PAM、21-23)に認識される3ヌクレオチド長のストレッチ結合にグループ化した。示されているのは、これらのグループのいずれに見出されたミスマッチ及びバルジの割合である。
【0060】
【
図6】CAST-Seq読み出しの概略図 エクソン3(標的部位:5'-GTGAGTAGAGCGGAGGCAGG
AGG(配列番号:1)、下線付PAM)中のCCR5遺伝子座を標的とするCRISPR-Cas9リボヌクレオシドタンパク質複合体でCD34陽性造血幹細胞及び前駆細胞を編集した。7日後にゲノムDNAを抽出し、CAST-Seqに付した。(a)CAST-Seq結果の可視化 CCR5標的遺伝子座の近傍でのCAST-Seq結果を可視化するためにIGVを使用した。マッピングされたCAST-Seq読み取りは、全てバーで表される。淡い灰色のバーは、逆方向の配向を示し、また、濃い灰色のバーは、順方向の配向を示す。カバレッジ、即ち、数またはマッピングされた読み取りは、上に示され、CCR5及びCCR2遺伝子座の位置は、下に示される。(b)染色体異常の例 結果の解釈方法について2つの実施例を示す:(1)CCR5遺伝子座及びCCR2に近接したオフターゲット部位活性における同時オンターゲット活性に誘導される二動原転位及び配列反転、(2)CCR5におけるオンターゲット部位と高い配列相同性を共有するCCR2遺伝子座における部位との相同組換え(HR)事象を誘発するCCR5遺伝子座におけるオンターゲット活性に促進される大きな欠失。(c)オンターゲット部位での開裂後にCAST-Seqで同定された全ての総染色体異常の概略
【0061】
【
図7】より限定的な生物情報パイプライン(a)概略 NGS由来のFASTQファイルは、概略に従って処理した。ボックスには、生物情報のフローにおける主要な工程が分類されている:ペアリング及びフィルタリング、トリミング、整列、クラスター定義、クラスター解析、及びフィルタリング。(b)読み取りに基づく距離 デザイナヌクレアーゼに誘発された事象ではなく、偶然にクラスターに入る読み取りの確率を計算するために、遺伝子編集された細胞からのCAST-Seq試料を、同じ数の読み取りを含むin silicoで作成されたランダムな読み取りライブラリーと比較した。連続する読み取りの距離の分布は、対数スケールで示されている。この例では、2,500-bpの閾値ラインは、該ランダムライブラリーにおける<5%の範囲を示す。これは、偶然に1つのクラスターに入る読み取りの確率が5%未満(p<0.05)であることを意味する。未処理細胞からのCAST-Seq分析を対照として示す。(c)標的配列整列スコア これらの転位部位を取り囲む500-bpゲノム領域を、500-bpの10,000個のランダム配列と比較した。全ての部位を、デザイナヌクレアーゼ標的配列に整列させた。該部位の標的配列整列スコアがランダム配列中の5%ベストスコアよりも高かった場合、該事象をオフターゲット(OT)活性由来型転位と分類した。(d)最大相同性領域ストレッチ 標的領域と転位領域との間の最も長い共通の相同基質を、転位部位を囲む5 kbウィンドウ内で検索した。相同基質の長さが24 bpよりも長い場合、該事象を相同組換え(HR)媒介型転位と分類した。その他は、全て天然に存在する破壊部位(NBS)由来型転位と分類した。
【0062】
【
図8】より限定的な生物情報アルゴリズムによるCRISPR-Cas9ヌクレアーゼを標的とするCCR5
#1のCAST-Seq分析 (a)デコイ戦略の概略 プレイ及びベイトプライマーは、それぞれリンカー及びオンターゲット部位に結合し、染色体異常を増幅する。デコイプライマーは、修飾されない標的部位(左)に完全長の増幅産物の形成を防止するために、オンターゲット部位に近接しているが、ベイトプライマーとは反対側に結合する。(b)定性的なCAST-Seq分析 組込みゲノムビューア(IGV)プロットは、33 kbのウィンドウ内の標的領域を囲むCAST-Seq読み取りを示す。全てのマッピングされたCAST-Seq読み取りは、バーで表される(上の7行のみは図示されている)。濃い灰色のバーは、ネガティブ鎖に整列する配列を示し、淡い灰色のバーは、ポジティブ鎖に整列する配列を示す。カバレッジ、即ちマッピングされた読み取りの数は、中央に示され、遺伝子位置は、下部に示されている。オンターゲット部位及びCCR2 HRクラスターの位置は、点線で強調されている。(c)標的部位整列 対照CCR5
#1標的部位は、上に示されている(N、任意のヌクレオチド;R、プリン)。ミスマッチヌクレオチド及び欠失/挿入(-1/1)がハイライトされている。ヒット数は左側に、カテゴリーは右側にリストされている。(d)挿入欠失分析 Cas9またはHiFi-Cas9で遺伝子編集した4日後に採取したゲノムDNAの同定されたHR及び/またはOT部位について、標的された深い増幅産物の配列決定を行った。統計学的有意差は、
(*)で示される(p<0.05;未処理細胞(UT)について計算された標準偏差により修正されたz検定)。(e)オンターゲット部位で見られる、選択された複合体再配列のグラフ 例えば、反転CCR2(淡い灰色)とCCR5(濃い灰色)由来の配列(上部)の組合せ、または反転/複製CCR5配列(濃い灰色、下部)の長いストレッチ。(f)染色体再配列のマッピング CAST-Seqで同定された関連の染色体異常部位は、全て染色体表意文字に示されている。マッピングされた部位を、オンターゲット部位クラスター(ON)、並びにオフターゲット開裂(OT)、相同性介在組換え(HR)、または天然に存在する破壊部位(NBS)に媒介される染色体再配列に細分類する。黄色のバーは曖昧なカテゴリー(HR/OT)を示す。(g)定量 CAST-SeqまたはddPCRで定量された染色体再配列の数は、散乱プロットで表される。線形回帰直線(点線)と二乗相関係数(R
2)は示されている。
【0063】
【
図9】より限定的な生物情報アルゴリズムによるCRISPR-Cas9またはTALENを標的とするゲノム部位のCAST-Seq分析 (a-d)染色体異常のマッピング。HBB標的TALEN対(a)、ならびにCRISPR-Cas9標的CCR5
#2(b)、FANCF(c)、及びVEGFA(d)のCAST-Seq分析を示す染色体表意文字。CAST-Seqで同定された関連の染色体異常部位が全てハイライトされている。(e-f)GUIDE-Seq及びCIRCLE-Seqとの比較。FANCF(e)及びVEGFA(f)標的化CRISPR-Cas9ヌクレアーゼのCAST-Seq分析から得られたデータを、公開されたデータGUIDE-Seq(PMC4320685)及びCIRCLE-Seq(PMC5924695)と比較し、Venn図において可視化した。
【0064】
【
図10】染色体異常動態(a-c)定性的可視化 組込みゲノムビューア(IGV)プロットは、33 kbのウィンドウ内における標的領域、CCR5
#1(a)、CCR5
#2(b)、及びHBB(c)を示す。最上列のみが示されている。白矢印は、ベイトの向きを示し、点線の垂直線は、オンターゲット部位を示す。電気穿孔の後(D1、D4、D14)の採取日を左に示す。(d-f)定量分析 プロットは、CRISPR-Casを標的とするCCR5
#1(d)及びCCR5
#2(e)またはTALENを標的とするHBB(f)のD1~D14の試料について、クラスター化されたCAST-Seq読み取り(ヒット)の数を示す。クラスターカテゴリー(HR及び/またはOT)が示される。
【0065】
【
図11】DNA修復速度論及び染色体異常の定量 (a)ddPCR法 “エッジ増幅産物”(約200 bp)は、切断部位を含み、標的部位のいずれかの部位に5'または3'増幅産物が隣接している。転位は、エッジ増幅産物の量を減少させると予想されるが、大きな欠失はまた、隣接する増幅産物の量を減少させる。増幅可能なオンターゲットコピーの相対変化を確立するために、テロメア側(telo.)に位置する増幅産物、標的部位に対する反対の染色体アーム(qアーム)、及び他の染色体上にある2つの対照増幅産物(cto.)を使用した。(b-d)標的部位コピー数の変動 プロットは、トランスフェクション後の異なる時点(1日~14日)における、CCR5
#1(b)またはCCR5
#2(c)を標的とするCRISPR-Cas、またはHBBを標的とするTALEN(d)で編集されたCD34+細胞における増幅可能な標的部位の相対的なコピー数変動(CNV)を示す。(e-g)データ要約 ddPCRの結果を用いて、D4時点のT7E1アッセイで測定された挿入欠失周波数を標準化(Norm.)した。“大きな欠失”は、隣接する増幅産物の平均数の相対的な減少を示し、“他の異常”は、エッジ増幅産物の数と隣接する増幅産物の平均数との間の相対差として特定される。
【0066】
表1 オンターゲット配列
CCR5、VEGFA及びFANCFにおけるデザイナヌクレアーゼ標的部位が挙げられている。
【0067】
表2 プライマー及びリンカーの設計
CCR5、VEGFA及びFANCFを標的とするCRISPR-Cas9ヌクレアーゼで編集された細胞における染色体異常の評価に実施するCAST-Seqに用いられるデオキシオリゴヌクレオチドが挙げられている。表2に例示される配列は、他のオンターゲット部位にもどのように適切なプライマーを設計するかの例を示す。
【0068】
表3 デコイプライマーの効果
CAST-Seqのシグナル対ノイズ比に対するデコイプライマーの影響を評価するために、デコイプライマーの存在下または非存在下でサイドバイサイド分析を行った。データは、CD34+造血幹細胞及びVEGFA遺伝子座またはFANCF遺伝子座のいずれを標的とするCRISPR-Cas9ヌクレアーゼで編集された前駆細胞から単離されたゲノムDNA上で実施されたCAST-Seqによって同定されたクラスターにおける全ての読み取りに基づいている。
【0069】
表4 CRISPR-Cas9ヌクレアーゼを標的とするCCR5のCAST-Seq分析
CD34+造血幹細胞及びCCR5遺伝子座(標的部位:5'-GTGAGTAGAGCGGAGGCAGGAGG(配列番号:1)、下線付PAM)を標的とするCRISPR-Cas9ヌクレアーゼで編集された前駆細胞におけるCAST-Seq(完全分析、即ち順方向及び逆方向)で同定された全ての部位が挙げられている。該表には、染色体異常の染色体位置、脱複製された読み取り(ヒット)の数、読み取りの数、及び割当てられた転位事象のカテゴリーが示されている。
【0070】
表5 CAST-Seqの感度
液滴デジタルPCR(ddPCR)を用いて、未処理細胞及びCCR5遺伝子座を標的とするCRISPR-Cas9ヌクレアーゼで編集された造血幹細胞におけるCCR5とCCR2遺伝子座との間に生じる大きな欠失事象の数を定量し、500 ngのゲノムDNAは、約152.000一倍体ゲノムを含有する。
【0071】
表6 CRISPR-Cas9ヌクレアーゼを標的とするVEGFAのCAST-Seq分析
CD34+造血幹細胞及びVEGFA遺伝子座(標的部位:5'-GGTGAGTGAGTGTGTGCGTGTGG(配列番号:3)、下線付PAM)を標的とするCRISPR-Cas9ヌクレアーゼで編集された前駆細胞におけるCAST-Seq(順方向の分析を例示)で同定された全ての関連部位が挙げられている。該表には、染色体異常の染色体位置、脱複製された読み取り(ヒット)の数、読み取りの数、及び割当てられた転位事象のカテゴリーが示されている。
【0072】
表7 CRISPR-Cas9ヌクレアーゼを標的とするFANCFのCAST-Seq分析
CD34+造血幹細胞及びFANCF遺伝子座(標的部位:5'-GGAATCCCTTCTGCAGCACCTGG(配列番号:4、下線付PAM)を標的とするCRISPR-Cas9ヌクレアーゼで核形成された前駆細胞におけるCAST-Seq(順方向の分析を例示)で同定された全ての関連部位が挙げられている。該表には、染色体異常の染色体位置、脱複製された読み取り(ヒット)の数、読み取りの数、及び割当てられた転位事象のカテゴリーが示されている。
【0073】
表8 CAST-Seqに使用されるソフトウェア
CAST-Seqに使用される全てのソフトウェアが挙げられている。示されたバージョンは、提供されたアドレスのもとの優先日に利用可能であった。
【0074】
表9 CAST-Seqに使用されるRパッケージ
CAST-Seqに使用されるRパッケージが挙げられている。示されたバージョンは、提供されたアドレスのもとの優先日に利用可能であった。
【0075】
表10 スコアリングマトリックス
ミスマッチ及びバルジ(挿入/欠失)の重みを含む、標的部位配列に対する転位部位の整列に使用されるヌクレオチド置換のスコアリングマトリックス。IUPACコードが使用される。A、アデニン;C、シトシン;G、グアニン;T(またはU)、チミン(またはウラシル);R、AまたはG;Y、CまたはT;S、GまたはC;W、AまたはT;K、GまたはT;M、AまたはC;B、CまたはGまたはT;D、AまたはGまたはT;H、AまたはCまたはT;V、AまたはCまたはG;N、任意の塩基。
【0076】
表11 (TALENに標的された)HBB標的部位のためのプライマー設計
標的配列、並びに増幅に必要な関連配列が示されている。
【0077】
表12 CCR5標的部位2のためのプライマー設計
関連の標的配列及び該プライマーの配列が示されている。
【0078】
表13 ddPCRのためのプライマー設計
いくつかの標的部位について、順方向プライマー及び逆方向プライマーの配列が提供されている。
【0079】
本発明の好ましい実施形態
図面及び表に示される本発明の方法を用いた実験の結果は、以下のように解釈することができる。
【0080】
オフターゲット突然変異誘発、転位、大きな欠失または大きな反転などの稀なデザイナヌクレアーゼに誘発された突然変異誘発事象を高処理配列決定で同定することは、様々な課題を提示する。コストの観点から、本法は、感度を損なうことなく、最小の配列決定要件に基づくべきである。臨床との関連性の観点から、本法は、異なる遺伝的及びエピ遺伝的背景を有する代理細胞系で実施されるのではなく、患者由来の細胞に適用できるべきである。さらに、該試験は、ゲノムDNAの最小限のインプットで実施できなければならず、よって、患者由来の貴重な細胞材料で実施することができる。最後に、偽陽性または偽陰性の結果を回避するために、PCR増幅バイアス及び生物情報パイプラインにおける欠点のような技術的及び分析バイアスを最小限に保たれなければならない。
【0081】
CAST-Seqは、これらの要件を満たし、稀な染色体異常事象をこれまでにない感度で同定するように開発された。この目的のために、CAST-Seqは、それぞれネストされた及びデコイプライマーの使用を含む3段階のPCR戦略を採用する。CAST-Seqの概要を
図1に示す。デザイナヌクレアーゼに暴露された細胞からゲノムDNAを単離した後、集束された超音波処理または酵素消化を用いてゲノムDNAを断片化し、平均サイズ350 bpの断片を生成する。末端修復及びリンカーのいずれかの末端への連結の後、第1PCR工程を実施する。これは、標的部位特異的プライマー(オンターゲットプライマー、表2)、リンカーに結合するプライマー(リンカープライマー、表2)、及び1つまたは2つのデコイプライマー(表2)を含む。デコイプライマーは、標的部位に近接しているが、オンターゲットプライマーに対して反対の部位に結合するように設計される。それらは反応に添加され、非転位事象から由来した鋳型からの完全長増幅生成物の生成を防止する(
図1a右、
図3)。デコイプライマーは、転位(または他の染色体異常)事象から由来した鋳型に結合できず(
図1a左)、よって、それらの増幅を防止しない。第2PCR工程では、第3PCRのためのアダプターを含む2個のネストされたプライマー(オンターゲットネストされたプライマー及びリンカーネストされたプライマー、表2)が使用される。デコイプライマー由来の生成物(
図1a右)は、該工程では増幅されない。最後に、第3PCRを用いて、NGSのためにイルミナアダプター及びバーコードを添加する。
【0082】
染色体異常事象を識別し、注釈するための生物情報パイプラインは、
図1bに概略的に示され、実施例2に詳細に記載されている。CAST-Seqは、転位事象だけでなく、大きな欠失及び配列反転を含む他の染色体異常も半定量的に検出するように設計された。特定の染色体領域に注釈が付された事象は、デザイナヌクレアーゼオンターゲットまたはオフターゲット活性に直接または間接的に関連する単一の作用様式から由来する可能性が高い。2,500 bpの距離内で少なくとも2つの脱複製された読み取りが発生した場合には、このような事象は、クラスターとして定義される。特定の動作モードではなく、偶然に1つのクラスターに入る読み取りの確率を計算するために、分析されたCAST-Seq試料を、同数の読み取りを含むin silicoで作成されたランダム読み取りライブラリーと比較した(
図2)。連続的な読み取りの距離の分布は、未処理の試料及びランダムコントロールライブラリーと比較し、CRISPR-Cas9ヌクレアーゼを標的とするCCR5で編集された造血幹細胞について行われたCAST-Seq分析(
図2a)について例示されている。この例では、2,500-bpの閾値ラインは、ランダムライブラリーにおいて<5%の範囲を示し、偶然に1つのクラスターに入る読み取りの確率が5%未満であることを意味する。
【0083】
CAST-Seq結果を評価する際に、本発明者らは、同定された全ての染色体異常事象がデザイナヌクレアーゼオフターゲット活性に直接に関連し得るわけではないことを理解した。大部分の細胞において活性なDNA修復経路は相同性のある修復である。相同性のある修復は、相同DNA領域間の相同組換え(HR)に基づいて、損傷部位を修復する。多くの場合、完全な修復のために、このプロセスでは姉妹染色体が使用されるが、他の相同配列も同様に使用できる。従って、オンターゲット開裂事象は、ゲノム内の相同領域を有する染色体間または染色体内(大きな欠失及び配列反転を含む)の転位を引き起こすことができる。最後に、オンターゲット部位におけるデザイナヌクレアーゼに誘発されたDNA二重鎖切断も、ゲノム中の天然に存在するDNA断片との再結合を引き起こすことができる。オフターゲット部位が同定され得るか否かに基づいて、そして転位部位で見られる相同配列の程度に基づいて、同定された事象を、オフターゲット(OT)型、相同性媒介再組換え(HR)型、または共通破壊部位(CBS)媒介型転位と分類した。下線付の生物情報は、実施例3に記載されている。簡単に言えば、デザイナヌクレアーゼ標的配列は、CAST-Seqクラスター領域に整列させ、ベストな整列スコアを選択する。整列スコアが5%閾値に合格するかどうかを検査するために、in silicoランダムライブラリーを同様の方法で交差検査する(
図2b)。該閾値に合格する全てのクラスターを、デザイナヌクレアーゼOT誘発型転位と分類した。この要件を満たしていない全てのクラスターについて、転位事象を囲む5 kbウィンドウを、標的部位に相同な配列について調べ、ランダムライブラリーと比べ、共通長さ閾値を定義した。隣接領域の長さがランダム配列中の最長基質の5%よりも高い場合には、転位事象をHRと分類した(
図2c)。その他のクラスターは、全てCBS誘発型転位とした。
【0084】
CAST-Seqデコイ戦略は、修飾されていない標的部位に由来するバックグラウンド読み取りを低減するように設計され、選択された標的部位ごとに容易に実施することができる。その効率を、CCR5標的部位について例示した(
図3a)。順方向(F)及び逆方向(R)配向の2つのデコイプライマーを使用した。デコイプライマーを3'-リン酸化で修飾し、3'-伸長をブロックした場合、それらは、412 bpの全長増幅産物の生成を低減できたが、完全にブロックしなかった(
図3b)。しかし、修飾されていなデコイプライマーを該反応に添加したときに、全長増幅産物の生成が効果的に防止された(
図3c)。代わりに、サイズが264 bp及び140 bpと予想される2つの生成物は生成された。最後に、単一デコイプライマーの存在だけで、全長増幅産物の生成を効果的に廃止させるのに十分であり(
図3d)、デコイ戦略の有効性が示された。この戦略の全体的有効性を推定するために、VEGFAまたはFANCFのいずれかを標的とするCRISPR-Casヌクレアーゼについて、デコイプライマーの存在下または非存在下でサイドバイサイドCAST-Seq分析を行った。オンターゲットクラスターから由来した読み取りを除いた全ての転位配列を考慮すると、シグナル対ノイズ比が約5倍増加したことが観測された(表3)。
【0085】
この新しい方法の潜在力を示すために、CRISPR-Cas9を標的とするCCR5で編集された造血幹細胞から単離されたゲノムDNAを用いてCAST-Seqを実施した(表4、
図4)。OT、HR及びCBSの層状になった全ての同定された転位事象は、染色体プロットに示されている(
図4a)。注目すべきことに、OT部位の大部分は、バルジと合わせて5個より多いミスマッチを含む(
図4b)。
【0086】
トップ-30の整列されたクラスターをもっと近くで観測すると、ミスマッチ及びバルジの位置、また、オフターゲット部位で同定されたPAMの特徴のようなさらなる解析が可能となる(
図5a)。注意すべきことに、全てのオフターゲット部位PAMは3位にGを有したが、2つのOT部位は2位にプリン(R:AまたはG)を含まなかった。さらに、30部位中の2部位は1位において-1バルジを許容した。先に示されたように、ミスマッチ及びバルジを受け入れる耐性は、標的部位のPAM遠位領域においてより顕著である。ロゴ解析(
図5b)は、オフターゲット部位のコンセンサス配列を示し、PAM近位領域におけるより低い無差別度を確認する。この観察は、標的部位サブグループについて行われた定量分析によってさらに確証された(
図5c)。従って、CAST-Seq介在標的配列整列は、以前に示された知見を再現する。即ち、CRISPR-Cas9標的部位中の最も保存されている領域がPAM内及びPAM近位領域におけるヌクレオチドである。一方、CAST-Seqは、PAM配列におけるミスマッチ及びバルジに対する耐性に関する新たな特徴を同定した。
【0087】
上述したように、染色体異常は、デザイナヌクレアーゼオンターゲット活性によっても引き起こされることがある。CCR2遺伝子座はCCR5標的遺伝子座に隣接して位置し、CCR5に対して高い配列相同性を共有する。この領域をより詳しく調べると、CCR5オンターゲット開裂部位の周囲に膨大な数の染色体異常が明らかになった(
図6a)。留意すべきことに、HRに誘発される大きな欠失としてCAST-Seqで注釈されたCCR2遺伝子にホットスポットがある(
図6b)。T7E1アッセイによる遺伝子型タイピングは、該部位がCRISPR-Cas9によって切断されたではないことを確認した。これにより、オンターゲット活性が、相同配列間の組換えを増強することにより、染色体異常を誘発できることが確認された。
【0088】
CAST-Seqは強制された配列配向を有するので、転位事象の配向を定義することが可能である。従って、CAST-Seqは、一動原体及び二動原体染色体の形成に導かれた染色体間転位のような、オンターゲット活性によって引き起こされるさらなる染色体異常を同定することを可能にする(
図6c)。要約すると、CAST-Seqは、以前他の方法で記載されなかった事象を含む様々な染色体異常を同定することができる。
【0089】
これは、無動原体/二動原体染色体の形成、大きな挿入/欠失及び反転につながる相同染色体への相互転位のような、オンターゲット活性によって引き起こされる染色体異常を含む。
【0090】
CAST-Seqの感度を評価するために、CRISPR-Cas9ヌクレアーゼを標的とするCCR5または未処理対照で編集されたゲノムDNA上のCCR5とCCR2との間の稀な組換え事象を評価した。500 ngのゲノムDNAを用いて、該組換え事象は、両方の試料において、それぞれ60または63,011読み取りで検出された(表5)。これらの試料中の融合CCR2-CCR5遺伝子座のコピー数を測定するために、CCR5上に1つのプライマーを配置し、CCR2上にもう1つのプライマーを配置することにより、液滴デジタルPCR(ddPCR)による定量を行った。該アッセイは、未処理の試料において9.8コピー、またCRISPR-Cas9編集の試料において1,280コピーを戻した。これは、CAST-Seqが、約152,000倍体ゲノム中9.8件の染色体異常事象を検出でき、感度が約0.006%のに相当することを意味する。CAST-Seqの感度は、分析された細胞の数に直接に比例するので、ゲノムDNAを単離するために用いる細胞の数を増加させることにより、より高い感度(即ち、<1:10,000)を達成することができ、結果として、CAST-Seqでより多くのゲノムDNAを処理することができる。
【0091】
CAST-Seqが他の標的遺伝子座に適用できることを証明するために、造血幹細胞も、VEGFA及びFANCF遺伝子座を標的とするCRISPR-Cas9ヌクレアーゼで編集した。これらの実験の結果をそれぞれ表6及び表7に示す。
【0092】
実施例1:CAST-Seqライブラリーの整備
QIAmp DNA Blood Mini kit (Qiagen)で未処理及びゲノム編集された造血細胞からのゲノムDNAを抽出し、続いて、平均サイズ約350 bpのDNA断片を得るために、超音波処理(Covaris)または酵素反応(NEBNext(登録商標)Ultra
TM II FS DNA Library Prep Kit、NEB)により断片化した(
図1a参照)。続いて、断片化されたゲノムDNAを末端修復し、A-テイル(NEBNext(登録商標)
Ultra II End Repaire/dA-Tailing Module Kit、NEB)した。次いで、プラス鎖上の3'-Tオーバーハングまたはマイナス鎖上の3'-C7-アミノ基と組み合わせた5'-リン酸化基を有する2つの非対称デオキシオリゴヌクレオチドのアニーリングによって生成されたリンカーDNAを剪断されたDNAに連結し、続いてQIA quick PCR精製キット(Qiagen)で精製した。第1PCRラウンドにおいて、500 ngのDNAをデコイオリゴ、及びリンカー特異的かつ標的部位特異的なプライマーと混合した。次の条件でPCRを行った:95℃で15秒間、63℃で20秒間、72℃で20秒間のサイクルを20回。第2PCRラウンドにおいて、リンカー特異的かつその5'末端にイルミナアダプター配列を有する標的部位特異的なプライマーを用いて、以下の条件でネストされたPCRを行った:95℃の15秒間、68℃で20秒間、72℃で20秒間のサイクルを20回。増幅後、PCR反応をQIAquick PCR精製キット(Qiagen)で精製し、NanoDrop (ThermoFisher)で定量した。両方のラウンドにおいて、Hot-start Q5ポリメラーゼ(Q5(登録商標)
High-Fidelity DNAポリメラーゼ、NEB)を50μlの反応に用いた。標準プロトコルに従って、NEBNext(登録商標)
Multiplex Oligos for Illumina(NEB)を用いて7サイクルPCR反応により、イルミナバーコード化されたアダプターを添加した。次に、AMPure XP磁気ビーズ(Beckman Coulter)を用いて増幅産物(-0.1~-1μg)を精製し、4 nMに希釈し、“ddPCR Library Quantification Kit for lllumina TruSeq”(BIORAD)を用いて、メーカーの取扱い説明書に従い、ddPCRにより定量した。600μlにおける最終濃度8~10 pMの変性DNAをMiSeq試薬キットv2カートリッジ(イルミナ)に付加し、配列決定した。
【0093】
実施例2:バイオインフォマティック分析
FLASh(v1.2.11)(httpps://ccb.jhu.edu/software/FLASH/)を用いて、イルミナ高処理配列決定からのペアードエンド読み取りを、最小及び最大オーバーラップそれぞれ10及び250と合併した。次に、PCRミスプライミング生成物を除去するため、BBmap(ver.38.22)(https://sourceforge.net/projects/bbmap/)を用いて、デザイナヌクレアーゼ標的部位を含む読み取りのポジティブ選択を最初に適用した。その後、リンカー配列、イルミナアダプター配列、及び標的された伸長配列を除去するために、読み取りをトリミングした(
図1b)。濾過手順の終了時にBBmapを用いて、短い標的配列反転についてチェックを行った。パラメーターを以下のように確定した:汚染物質を発見するためのkmer長さは、ヌクレアーゼ標的部位、リンカーまたはプライマー長さに従って定義した。参照kmerにおいて2件までのミスマッチ及び/またはバルジを許容した。ここで言及しないパラメーターは、デフォルト値に設定した。次いで、最も信頼性の高い整列を保証するために、パラメーターの非常に敏感なプリセットを用いて、選択された読み取りを、Bowtie2 (ver.2.3.4.2) のヒト参照ゲノム(GRCh38/hg38) (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)に整列させた。低品質の整列を除去し、偽陽性転位部位(MAPQ<15)を同定する可能性を低減した。FASTQ処理に使用されるソフトウェアは、表8に詳細に記載されている。室内Rスクリプトを用いて下流分析を行った。ゲノム注釈用のRパッケージのリストを表9に示す。次いで、整列された読み取りを、染色体の数、開始、終了及び鎖の値に従って脱複製した。それぞれの開始及び終了の2 bpの範囲内に入る読み取りは、“重複された”ものとみなされるため、脱複製した。続いて、転位点を測定し、連続的な読み取りの距離分布を等価数のランダム部位を含むin silicoで作成されたライブラリーと比較することによるクラスター分析に使用した。ランダム化されたライブラリーの距離分布曲線を用いて、クラスターエラー率を定量した(
図2)。2500 bpの閾値距離を適用して、試験された全ての試料において有意なp値(p<0.05)を得た。次いで、処理された試料に由来した関連クラスターを、未処理試料中のものと比較して、バックグラウンドを減算した。超幾何学的試験を実施し、読み取りの数を集団サイズ(即ち、生のFASTQファイル中の読み取りの総数)と比較することにより、遺伝子編集の試料と未処理の対照試料との差の有意性を評価した。調整されたp値(p<0.05)に従って有意なクラスターを選択した。最後に、1つの脱複製された読み取りのみを含むクラスターをいずれも拒否した。
【0094】
実施例3:転位事象の分類
転位部位を3つのカテゴリーに分類した:オフターゲット(OT)活性由来型転位、相同組換え(HR)媒介型転位、及び共通破壊部位(CBS)由来型転位(
図2)。各部位をこれらのカテゴリー中の1つに割当てるために、本発明者らは、転位部位を取り囲む500-bpゲノム領域を、500 bpの10,000個のランダム配列と比較した。次に、実際のまたはランダム配列から由来した全ての単一部位を、デザイナヌクレアーゼ標的配列に整列させた。スコアは、マッチ:1~ミスマッチ:-1の範囲内で、ギャップ開口及びギャップ延長(表10)、また、順方向及び逆方向の相補配列からのベストマッチを選択した。次に、左及び右の隣接領域を含む各配列間の最も長い共通部分を、5 kbウィンドウ内の順方向及び逆方向の相補配列で探索した。各事象は、最終的に次のように分類した:配列の標的配列整列スコアがランダム配列におけるベストスコアの5%よりも高かった場合には、OTと分類し;事象がOTではなかったが、隣接領域の長さがランダム配列中の最長基質の5%よりも高かった場合には、HRと分類した。これらの基準を満たさなかった他の全ての事象をCBSと分類した。
【0095】
実施例4:より限定的な生物情報分析(
図7)
整列
FLASH software (Bioinformatics 27 (2011) 2957-2963)を用いて、Illumina miSeq配列決定からのメイトペア読み取りを合併した。BBmap (https://sourceforge.net/projects/bbmap/)をフィルタリングに用いて、以下のようにトリミングした:デザイナヌクレアーゼ標的部位を含有する合併された読み取りをフィルタインし、一方、PCRミスプライミング生成物の読み取りをフィルタアウトした。リンカー配列、イルミナアダプター配列、標的された伸長配列、及び品質不良な読み取りをトリミングした。整列の精度を最大にするため、Bowtie2(Nat. Methods 9 (2012) 357-359)及び高感度な予め設定されたパラメーターを用いて、選択された読み取りをヒトゲノムGRCh38(hg38)に整列させた。偽陽性を見出す確率を低減するために、マッピング品質の良い(MAPQ>15)整列された読み取りを選択した。BEDTools (Bioinformatics 26(2010), 841-842)を用いて、整列されたBAMファイルをベッドファイルに変換した。
【0096】
脱複製/クラスターの定義
同じ座標上に位置する読み取りをPCR由来の複製と見なし、よって、脱複製した。転位点またはリンカー連結配列決定/配向バイアスに対処するために、+/-3 bpの耐性を加えた。従って、該+/-3 bpウィンドウ内の全ての読み取りを脱複製し、読み取りの総量を保存し、転位事象を定量した。ヒトゲノムのランダムな領域のセットを用いて読み取り密度の高い領域を測定し、2つの連続的な読み取りの間の距離分布を推定した。2,500 bpの閾値距離は、試験された全ての試料において有意なp値(p<0.05)を得た。続いて、2,500 bp未満で分離された連続的な読み取りをクラスターに合併し、全ての推定転位部位を表した。試料について2つ以上の複製を比較する場合、生物情報的プロセス(CCR5/CCR2及びHBB/HBD)中に2つの近位クラスターを合併し、境界を再設定することによって、個々のクラスターを手動で回収した。最後に、Fisher’s exact試験を用いて、同定されたクラスターの有意性を、未処理の対照試料と比較して評価した。有意性閾値を、調整されたp値(Benjmini-Hochberg) 0.05未満に設定した。
【0097】
転位事象の分類
転位部位を3つのグループに分類した:オフターゲット(OT)型転位、相同組換え(HR)介在型転位、及び天然に存在する破断部位(NBS)由来型転位。これらのグループの統計的有意性を評価するために、長さ500 bpで、10,000個のランダムに選択されたヒトゲノム配列を1組選択した。OTについては、転位部位をオンターゲット配列に整列させた。マッチ及びミスマッチのための重みにそれぞれ+1及び-1を用いたヌクレオチド置換マトリックスを構築した。ミスマッチと同じペナルティ重みでギャップを許容した。整列型“ローカルl-グローバル”のBiostrings R Package (https://rdrr.io/bioc/Biostrings/)からの対での整列を使用した。同定された転位部位及びランダム配列について、OT整列スコアを計算した。HRについては、転位部位の周りの5 kbの周囲のウィンドウを規定する、左及び右の隣接領域間の最長共通基質(LCS)、及び予想されるオンターゲットの周囲に既知の5 kbのウィンドウを選択した。ランダム配列を用いて、オンターゲットとランダム領域との間のLCSの長さを推定した。最後に、全ての単一転位部位を以下のように分類した: OT整列スコアが、ランダム配列上にトップ5%のスコアよりも高かった場合には、OTと分類し、ランダム配列にトップ5%のLCSよりもLCSが長かった場合には、HRと分類し、そうでなかった場合には、NBSと分類した。
【0098】
注釈
バイオコンダクターアノテーションパッケージTxDb.Hsapiens.UCSC.hg38.knownGene(http://bioconductor.org/packages/TxDb.Hsapiens.UCSC.hg38.knownGene/)に示されている転写開始部位(TSS)までの距離に基づいて、最も近い遺伝子または遺伝子領域(例えば、プロモーター、エキソン、イントロンなど)で、選択された転位部位を注釈付した。転位部位の周囲100 kbのウインドウ内に位置する遺伝子のセット全体を示し、特に、OncoKBデータベース(JCO Precis Oncol. 2017, 1-16)に基づいて、癌関連の遺伝子をハイライトしている。
【0099】
実施例5:分子的分析
液滴デジタルPCR(ddPCR)による分析について、150~550 ngのゲノムDNAを、5 UのHindlll HFまたはAvrll(NEB)を用いて37℃で30分間消化し、試料の粘度を低下させた。消化後、消化されたゲノムDNAの100 ng(転位)または20 ng(大きな欠失)のいずれかを、QX200TM EvaGreen ddPCR Supermix TM (Bio-Rad、Cat.#1864034)を含有するddPCR反応混合物に添加した。各反応を100 nMのプライマーと複合させ、QX200液滴発生器(Bio-Rad)に付加した。生成された液滴を96穴PCRプレート(Bio-Rad、Cat.#12001925)に移し、PX1 PCRプレートシーラー(Bio-Rad)でプレートをシールした。全てのアッセイについて、以下のようにエンドポイントPCRを行った:蓋を95℃で5分間予め加熱し、95℃で30秒間、62℃で60秒間、72℃で2分間のサイクロを50回、続いて4℃で5分間、及び90℃で5分間(昇温速度を2℃/秒に設定した)。PCRの後、QX200液滴リーダーでデータを取得し、結果をQuantaSoftTM Analysis Pro(Bio-Rad)で解析した。少なくとも10,000個の液滴/20μl反応が生成された場合には、その結果を有意であるとみなした。編集された試料における“大きな欠失”及び“他の異常”の頻度を計算するために、まず、技術的複製品の平均ddPCR値を未処理の一致させた対照試料に規準化し、アッセイ間の変動を最小化した。そして、この数を、対照遺伝子(RAD1、STAT3)について得られた2つの値の平均で除算することにより、ゲノムインプットDNAの量について規準化した。5'及び3'アッセイからの平均値を用いて、大きな欠失の割合を測定した。“エッジ”値から大きな欠失の割合を減算することにより、転位の割合を計算した。式:(100-(大きな欠失×100)-(転位×100))×挿入欠失%に基づいて、T7E1アッセイからの挿入欠失のパーセンテージを再計算した。
表1
表2
表3
表4
表5
表6
表7
表8
表9
表10
表11
表12
表13
【配列表】
【手続補正書】
【提出日】2020-09-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
デザイナヌクレアーゼの活性による細胞または組織から得られる核酸ゲノムにおけるゲノム全体修飾の高処理検出のための方法であって、
a)デザイナヌクレアーゼが、細胞のゲノムDNA中にDNA二重鎖切断(DSB)を導入できる条件下で、デザイナヌクレアーゼに暴露された細胞からゲノムDNAを抽出する工程、
b)核酸を断片化し、ランダム断片を得る工程、
c)
相補的なTを有する、工程d)で使用されたリンカーと一致する3'末端に突出したAを有する末端を得るために末端修復を行う工程、
d)いわゆる“リンカープライマー”に相補的な配列を含むリンカーと連結する工程、
e)“リンカープライマー”及びいわゆる“オンターゲットプライマー”との
ポリメラーゼ連鎖反応である、第1核酸増幅反応を行う工程(ここで、1つのプライマーがオンターゲット部位の上流に位置し、1つのプライマーがオンターゲット部位の下流に位置し、
オンターゲット上の切断部位に近接して結合するように設計された少なくとも1つのデコイプライマーが反応混合物中に存在する。)、
f) いわゆる“ネストされたプライマー”が反応混合物に添加され、1つのプライマーがオンターゲット遺伝子座に相補的であり、1つのプライマーがリンカー配列に相補的である、第2核酸増幅反応を行う工程、
g)さらに少なくとも1つのバーコードを含むプライマーが該反応混合物に添加される、核酸増幅反応を行う工程、
h)ネストされた及びバーコードされた増幅生成物の配列を決定する工程、及び
i)適切な生物情報的な手段を用いて、配列決定された生成物を参照配列に整列させ、少なくとも1つのDNA二重鎖切断に基づいて、ゲノム修飾を含む染色体位置を同定する工程
を含む、方法。
【請求項2】
前記デコイプライマーが、前記オンターゲット部位の下流少なくとも10ヌクレオチドの距離に位置する配列に相補的であることを特徴とする、請求項
1に記載の方法。
【請求項3】
1つのデコイプライマーの結合部位が、オンターゲット部位の下流少なくとも10ヌクレオチドの距離に位置し、他方のデコイプライマーの結合部位が、オンターゲット部位の下流少なくとも30ヌクレオチドの距離に位置することを特徴とする、請求項1
または2に記載の方法。
【請求項4】
順方向オンターゲットプライマーは、前記オンターゲット部位の上流少なくとも25ヌクレオチドの距離に位置することを特徴とする、請求項
1に記載の方法。
【請求項5】
稀な染色体異常の同定を可能にすることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項6】
前記デコイプライマーは、それぞれ前記順方向オンターゲットプライマー及び前記逆方向リンカープライマーが隣接する領域において、前記オンターゲット部位に近接して結合するように設計されていることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項7】
オンターゲット部位及び/またはオフターゲット部位における染色体異常を検出できることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項8】
前記核酸増幅反応は、前記デザイナヌクレアーゼが核酸を切断するオンターゲット部位の領域で行われることを特徴とする、請求項1~
7のいずれかに記載の方法。
【請求項9】
コードを含む分子が、次世代配列決定のためにバーコードを提供することを特徴とする、請求項1~
8のいずれかに記載の方法。
【請求項10】
配列対合及び標的配列についてのポジティブ選択を含む生物情報を一助にし、核酸増幅で得られた情報を解析することを特徴とする、前記請求項のいずれかに記載の方法。
【請求項11】
ミスプライミング生成物またはリンカー生成物に起因する無関係の配列を除去する、請求項
10に記載の方法。
【請求項12】
選択された配列を参照ゲノムに整列させ、かつ、偽陽性転位部位を除去する、請求項
10または
11のいずれかに記載の方法。
【国際調査報告】