IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ジェネラル ホスピタル コーポレイションの特許一覧

特許7095031シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-24
(45)【発行日】2022-07-04
(54)【発明の名称】シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)
(51)【国際特許分類】
   C12N 15/09 20060101AFI20220627BHJP
   C12Q 1/6855 20180101ALI20220627BHJP
   C12Q 1/686 20180101ALI20220627BHJP
【FI】
C12N15/09 Z ZNA
C12Q1/6855 Z
C12Q1/686 Z
【請求項の数】 25
【外国語出願】
(21)【出願番号】P 2020126325
(22)【出願日】2020-07-27
(62)【分割の表示】P 2016575174の分割
【原出願日】2015-06-23
(65)【公開番号】P2020191885
(43)【公開日】2020-12-03
【審査請求日】2020-08-19
(31)【優先権主張番号】62/015,911
(32)【優先日】2014-06-23
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/077,844
(32)【優先日】2014-11-10
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/078,923
(32)【優先日】2014-11-12
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/088,223
(32)【優先日】2014-12-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】592017633
【氏名又は名称】ザ ジェネラル ホスピタル コーポレイション
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100196966
【弁理士】
【氏名又は名称】植田 渉
(74)【代理人】
【識別番号】100104282
【弁理士】
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ジョン,ジェイ. キース
(72)【発明者】
【氏名】ツァイ,シェンダー
【審査官】田中 晴絵
(56)【参考文献】
【文献】米国特許出願公開第2013/0143204(US,A1)
【文献】特表2013-518602(JP,A)
【文献】特表2009-502202(JP,A)
【文献】米国特許出願公開第2005/0221341(US,A1)
【文献】米国特許出願公開第2005/0202490(US,A1)
【文献】米国特許出願公開第2012/0208705(US,A1)
【文献】特表2013-544498(JP,A)
【文献】特表2014-506788(JP,A)
【文献】国際公開第2014/008447(WO,A1)
【文献】nature protocols,9(6),2014年05月08日,1255-81
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/68- 1/6897
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
細胞のゲノムDNA(gDNA)内の二本鎖切断(DSB)を検出するための方法であって、
前記細胞を平滑末端の二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNの両鎖が前記細胞のゲノムにオルソゴナルであり、前記dsODNの5'末端がリン酸化されており、さらに(a)ホスホロチオエート結合が両方の3'末端に存在するか、または(b)ホスホロチオエート結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記細胞がDSBを修復するのに十分な条件で前記細胞を維持するステップ、1つまたは複数のDSBにおいてdsODNを組み込むステップ、
組み込まれたdsODNを含むgDNAの一部を増幅するステップ、並びに
前記gDNAの増幅された部分をシークエンスするステップ
を含み、それによって前記細胞の前記gDNA内のDSBを検出する、方法。
【請求項2】
gDNAの一部を増幅するステップが、
前記DNAを断片化すること、
前記細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーションすること、および
ライゲーションされたDNAに対してポリメラーゼ連鎖反応(PCR)を行うこと、
を含む、請求項1に記載の方法。
【請求項3】
前記細胞が哺乳動物細胞である、請求項1又は2に記載の方法。
【請求項4】
前記dsODNが30~35ntの長さである、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記dsODNが、5'末端でリン酸化されており、3'末端でホスホロチオエート化されている、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記dsODNが、無作為化されたDNAバーコードを含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
請求項1~6のいずれか一項に記載の方法であって、
前記gDNAを断片に切断するステップ、および
前記断片を、末端修復、aテーリング、および単一テールのシークエンシングアダプターのライゲーションによってシークエンシング用に調製するステップ
を含む方法。
【請求項8】
前記dsODNが15~50ntの間の長さである、請求項1~3および5~7のいずれか一項に記載の方法。
【請求項9】
細胞のgDNA内の二本鎖切断(DSB)を検出するための方法であって、
前記細胞を平滑末端の二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNの両鎖が前記細胞のゲノムにオルソゴナルであり、前記dsODNの5'末端がリン酸化されており、さらに(a)ホスホロチオエート結合が両方の3'末端に存在するか、または(b)ホスホロチオエート結合が両方の3'末端および両方の5'末端に存在する、ステップ、
DSBがゲノムDNA内で生じるのに十分な条件、かつ前記細胞がDSBを修復するのに十分な条件で前記細胞を維持するステップ、1つまたは複数のDSBにおいてdsODNを組み込むステップ、
組み込まれたdsODNを含むgDNAの一部を増幅するステップ、並びに
前記gDNAの増幅された部分をシークエンスするステップ
を含み、それによって前記細胞の前記gDNA内のDSBを検出する、方法。
【請求項10】
gDNAの一部を増幅するステップが、
前記DNAを断片化すること、
前記細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーションすること、および
ライゲーションされたDNAに対してポリメラーゼ連鎖反応(PCR)を行うこと、
を含む、請求項9に記載の方法。
【請求項11】
前記細胞が哺乳動物細胞である、請求項9又は10に記載の方法。
【請求項12】
前記dsODNが30~35ntの長さである、請求項9~11のいずれか一項に記載の方法。
【請求項13】
前記dsODNが15~50ntの間の長さである、請求項9~11のいずれか一項1項に
記載の方法。
【請求項14】
前記dsODNが、5'末端でリン酸化されており、3'末端でホスホロチオエート化されている、請求項9~12のいずれか一項に記載の方法。
【請求項15】
前記dsODNが、無作為化されたDNAバーコードを含む、請求項9~14のいずれか一項に記載の方法。
【請求項16】
請求項9~15のいずれか一項に記載の方法であって、
前記gDNAを断片に切断するステップ、および
前記断片を、末端修復、aテーリング、および単一テールのシークエンシングアダプターのライゲーションによってシークエンシング用に調製するステップ
を含む方法。
【請求項17】
細胞のゲノムDNA(gDNA)内の二本鎖切断(DSB)に目的の二本鎖オリゴデオキシヌクレオチド(dsODN)を効率良く組み込むための方法であって、
前記細胞を平滑末端のdsODNと接触させるステップであって、前記dsODNの両鎖が前記細胞のゲノムにオルソゴナルであり、前記dsODNの5'末端がリン酸化されており、さらに(a)ホスホロチオエート結合が両方の3'末端に存在するか、または(b)2つのホスホロチオエート結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記細胞がDSBを修復するのに十分な条件で前記細胞を維持するステップ、および1つまたは複数のDSBにおいてdsODNを組み込むステップ、
を含む、方法。
【請求項18】
組み込まれたdsODNを含むgDNAの一部を増幅するステップ、および
前記gDNAの増幅された部分をシークエンスするステップ
を含み、それによって前記細胞の前記gDNA内のDSBを検出する、請求項17に記載の方法
【請求項19】
gDNAの一部を増幅するステップが、
前記DNAを断片化すること、
前記細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーションすること、および
ライゲーションされたDNAに対してポリメラーゼ連鎖反応(PCR)を行うこと、
を含む、請求項18に記載の方法。
【請求項20】
前記細胞が哺乳動物細胞である、請求項17~19のいずれか一項に記載の方法。
【請求項21】
前記dsODNが30~35ntの長さである、請求項17~20のいずれか一項に記載の方法。
【請求項22】
前記dsODNが15~50ntの間の長さである、請求項17~20のいずれか一項に記載の方法。
【請求項23】
前記dsODNが、5'末端でリン酸化されており、3'末端でホスホロチオエート化されている、請求項17~22のいずれか一項に記載の方法。
【請求項24】
前記dsODNが、無作為化されたDNAバーコードを含む、請求項17~23のいずれか一項に記載の方法。
【請求項25】
請求項17~24のいずれか一項に記載の方法であって、
前記gDNAを断片に切断するステップ、および
前記断片を、末端修復、aテーリング、および単一テールのシークエンシングアダプターのライゲーションによってシークエンシング用に調製するステップ
を含む方法。

【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
本出願は、2014/06/23に出願された、米国仮特許出願第62/015,91
1号明細書;2014/11/10に出願された、第62/077,844号明細書;2
014/11/12に出願された、第62/078,923号明細書;および2014/
12/5に出願された、第62/088,223号明細書の利益を主張する。前述のもの
の全内容は、参照により本明細書によって組み込まれている。
【0002】
連邦政府による資金提供を受けた研究または開発
本発明は、National Institutes of Healthによって与
えられた助成金第DP1GM105378号の下で、政府の支援を受けて行われた。政府
は、本発明において一定の権利を有する。
【0003】
技術分野
生細胞において改変ヌクレアーゼの切断部位の位置を同定するための、高感度なバイア
スのないゲノムワイドな方法が提供される。
【背景技術】
【0004】
ヒトの薬の長い間保持されてきた目標は、遺伝性の遺伝疾患を治療することである。ゲ
ノム編集は、疾患を治癒させるまたは予防するために内在性遺伝子内の変異を直接に修正
するという強力な概念を包含する。このアプローチの新しい例は、HIVのコレセプター
である、CCR5を破壊するように改変されたジンクフィンガーヌクレアーゼ(ZFN)
治療薬の臨床試験である(1)。このex vivo自己細胞療法アプローチは、CCR
5におけるホモ変異を有する個体からの骨髄細胞を移植された「ベルリンの患者」、Ti
mothy BrownにおけるHIVの治癒の成功を再現することを試みるものである
。もう1つの最近の例は、6ヶ月齢の対象に由来する造血幹細胞におけるZFNでの遺伝
子ターゲティングによるX連鎖重症複合免疫不全症の修正である(2)。
【0005】
以下の4つの主なクラスの改変ヌクレアーゼがある:1)メガヌクレアーゼ、2)ジン
クフィンガーヌクレアーゼ、3)転写活性化因子エフェクター様ヌクレアーゼ(TALE
N)、および4)クラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)
Cas RNA誘導型ヌクレアーゼ(RGN)。
【発明の概要】
【0006】
しかし、これらの新しい治療および研究のツールの採用は、それらの特異性の実証に依
存しうる。ヒトおよび他の真核細胞におけるオフターゲット作用を理解および同定するこ
とは、これらのヌクレアーゼが研究および治療的適用のために広範に使用される場合には
決定的に不可欠であろう。
【0007】
GUIDE-Seqは、改変ヌクレアーゼによって誘発される変異、例えば、オフター
ゲット変異を検出するための、バイアスのないゲノムワイドかつ高感度な方法を可能にす
る。したがって、該方法は、哺乳動物生細胞においてゲノムワイドな規模で変異を評価す
るための最も包括的でバイアスのない方法を可能にする。該方法は、ヌクレアーゼで誘発
されたDSBの中にdsODNが効率良く捕捉されうるいかなる細胞型において利用され
てもよい。
【0008】
したがって、一態様では、本発明は、細胞のゲノムDNA内の、二本鎖切断(DSB)
、例えば、外来性の改変ヌクレアーゼによって誘発された、例えば、オフターゲットDS
Bを検出するための方法を提供する。該方法は、細胞を二本鎖オリゴデオキシヌクレオチ
ド(dsODN)と接触させるステップであって、好ましくは、dsODNが15および
75ntの間の長さ、例えば、15~50nt、50~75nt、30~35nt、60
~65nt、または50~65ntの長さであり、dsODNの両鎖が細胞のゲノムにオ
ルソロガスであり、好ましくは、dsODNの5’末端がリン酸化されており、さらにま
た好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホス
ホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
細胞内で外来性の改変ヌクレアーゼを、ヌクレアーゼが細胞のゲノムDNA内にDSBを
誘発するのに十分な時間、かつ細胞がDSBを修復して、1つまたは複数のDSBにおい
てdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
ゲノムDNAの増幅された部分をシークエンスするステップ
を含み、それによって細胞のゲノムDNA内のDSBを検出する。
【0009】
一部の実施形態では、ゲノムDNAの一部を増幅するステップは、
例えば切断によって、DNAを断片化すること、
細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーション
すること、
組み込まれたdsODNと相補的なプライマー(プライマーA)およびユニバーサルアダ
プターと相補的なプライマー(プライマーB)を用いて、ライゲーションされたDNAに
対して1回目のポリメラーゼ連鎖反応(PCR)を行うこと、
次いで、プライマーAと相補的な3’ネステッドプライマー(プライマーC)、プライマ
ーBと相補的な3’ネステッドプライマー(プライマーD)、およびプライマーDと相補
的なプライマー(プライマーE)を使用して2回目のPCRを行うこと
を含む。一部の実施形態では、プライマーEは、
精製または結合配列、例えば、フローセル結合配列、および
同定配列、例えば、バーコードまたは無作為の分子インデックス
のうちの1つまたは複数を含む。
【0010】
一部の実施形態では、改変ヌクレアーゼは、メガヌクレアーゼ、ジンクフィンガーヌク
レアーゼ、転写活性化因子エフェクター様ヌクレアーゼ(TALEN)、およびクラスタ
ー化された規則的な間隔の短鎖反復回文配列(CRISPR)/Cas RNA誘導型ヌ
クレアーゼ(CRISPR/Cas RGN)からなる群から選択される。
【0011】
別の態様では、本発明は、複数のガイドRNAのうちのいずれが最も特異的であるか、
すなわち、最も少ないオフターゲットDSBを誘発するかを決定するための方法を提供す
る。該方法は、第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌク
レオチド(dsODN)と接触させるステップであって、好ましくは、dsODNが15
および75ntの間の長さ、例えば、15~50nt、50~75nt、60~65nt
、30~35ntまたは50~65ntの長さであり、dsODNの両鎖が細胞のゲノム
にオルソロガスであり、好ましくは、dsODNの5’末端がリン酸化されており、さら
にまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つの
ホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、ヌクレアーゼが細胞のゲノ
ムDNA内にDSBを誘発するのに十分な時間、かつ細胞がDSBを修復して、1つまた
は複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させる
ステップ、
組み込まれたdsODNを含む、第1の細胞の集団からのゲノムDNAの一部を増幅する
ステップ、および
第1の細胞の集団からのゲノムDNAの増幅された部分をシークエンスするステップ、
dsODNが第1の細胞の集団のゲノムDNA内に組み込まれた部位の数を決定するステ
ップ、
第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(ds
ODN)と接触させるステップであって、好ましくは、dsODNが15および75nt
の間の長さ、例えば、15~50nt、50~75nt、30~35nt、60~65n
t、または50~65ntの長さであり、dsODNの両鎖が細胞のゲノムにオルソロガ
スであり、好ましくは、dsODNの5’末端がリン酸化されており、さらにまた好まし
くは、2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する
、ステップ、
第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、ヌクレアーゼが第2の細胞
の集団のゲノムDNA内にDSBを誘発するのに十分な時間、細胞がDSBを修復して、
1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性
化させるステップ、
組み込まれたdsODNを含む、第2の細胞の集団からのゲノムDNAの一部を増幅する
ステップ、および
第2の細胞の集団からのゲノムDNAの増幅された部分をシークエンスするステップ、
dsODNが第2の細胞の集団のゲノムDNA内に組み込まれた部位の数を決定するステ
ップ、
dsODNが第1の細胞の集団のゲノムDNA内に組み込まれた部位の数を、dsODN
が第2の細胞の集団のゲノムDNA内に組み込まれた部位の数と比較するステップ
を含み、より少ない(オフターゲット)部位で組み込まれたdsODNがより特異的であ
る。該方法は、第3、第4、第5、第6、またはそれより多種の細胞の集団について繰り
返されてもよい。「より少ない」オフターゲット部位とは、より少ない数のDSB部位お
よび/または(1つまたは複数の)個別の部位におけるDSBの発生の頻度の低下の両方
を含みうる。
【0012】
本明細書においてさらに、本明細書に記載の末端保護されたdsODNの使用によって
目的の短鎖dsDNAをDSBの部位の中に効率良く組み込むための方法が提供される。
【0013】
一部の実施形態では、細胞は、哺乳動物細胞である。
【0014】
一部の実施形態では、改変ヌクレアーゼはCas9ヌクレアーゼであり、方法は、Ca
s9ヌクレアーゼをゲノム内の標的配列に導くガイドRNA、例えば、単一のガイドまた
はtracrRNA/crRNA対を細胞内で発現させるステップも含む。
【0015】
一部の実施形態では、dsODNはビオチン化され、例えば、共有結合でdsODNに
付加されたビオチンを含む、かつ/または無作為化されたDNAバーコードまたはCre
もしくはLox部位を含む。dsODNがビオチン化される、上記の請求項のいずれかの
方法。
【0016】
一部の実施形態では、本明細書に記載の方法は、ゲノムgDNAを断片に切断するステ
ップ、およびdsODNを含む断片をビオチンへの結合によって単離するステップを含む
【0017】
一部の実施形態では、dsODNは、平滑末端であるまたは5’末端に1、2、3、も
しくは4ntのオーバーハンギングを有する、5’末端でリン酸化されている、および/
または3’末端でホスホロチオエート化されている。
【0018】
一部の実施形態では、dsODNは、平滑末端であり、5’末端でリン酸化されており
、3’末端でホスホロチオエート化されている。
【0019】
一部の実施形態では、dsODNは、無作為化されたDNAバーコード、Lox認識部
位、制限酵素認識部位、および/またはタグ配列を含む。
【0020】
一部の実施形態では、方法は、ゲノムgDNAを断片に切断するステップ、および断片
を、末端修復/aテーリング/シークエンシングアダプター、例えば、単一テールのシー
クエンシングアダプターのライゲーションによってシークエンシング、例えば、ハイスル
ープットシークエンシング用に調製するステップを含む。
【0021】
一部の実施形態では、DSBは、(例えば、脆弱な部位での)バックグラウンドのゲノ
ムのDSBまたは鍵となる細胞タンパク質の小分子阻害因子によって引き起こされるDS
Bである。
【0022】
他に定めがない限り、本明細書中で使用されるすべての技術的および科学的な用語は、
本発明が属する当技術分野の当業者によって一般的に理解されるのと同じ意味を有する。
方法および材料は、本発明における使用のために本明細書に記載されている;他の、当技
術分野において知られている好適な方法および材料も使用されうる。材料、方法、および
例は、単に例示的なものであって限定することを意図するものではない。本明細書中で言
及されているすべての刊行物、特許出願、特許、配列、データベースエントリー、および
他の参照は、参照によりその全体が組み込まれている。矛盾する場合には、定義を含めて
、本明細書が優先されることになる。
【0023】
本発明の他の特徴および利点は、以下の発明を実施するための形態および図面から、な
らびに特許請求の範囲から明らかであろう。
【図面の簡単な説明】
【0024】
図1図1A-B.CRISPR-Casヌクレアーゼを介したdsODN捕捉の最適化を示した図である。(a)使用される短鎖オリゴヌクレオチドタグの配列が示されている。使用されるすべてのオリゴヌクレオチドは、5’リン酸化される。タグオリゴヌクレオチドは、RFLPによる組み込み頻度の評価を可能にする診断用のNdeI制限部位も含む。(b)下のグラフは、RFLPによる短鎖dsODNの組み込み(%)を示す。5’および3’ホスホロチオエート結合の両方を有するdsODN(各セットにおける左側のバー)についての組み込み率が、5’ホスホロチオエート結合のみを有するdsODN(各セットにおける中央のバー)およびdsODNなしの対照(各セットにおける右側のバー)と比較される。
図2-1】図2A.VEGF部位1についての組み込みの特徴付けを示した図である。(a)RFLPアッセイは、VEGF部位1について示されており、Qiaxcelキャピラリー電気泳動機器上で解析されるように、NdeI制限部位を有するdsODNの好結果の組み込みを実証している。
図2-2】図2B.VEGF部位1についての組み込みの特徴付けを示した図である。(b)サンガーシークエンシングデータは、目的のVEGF部位1標的部位でのdsODN組み込みについて示されている。dsODN配列は、灰色で強調されている。VEGFA部位1を標的としたガイドRNA/Cas9複合体によって認識される部位は太字で、隣接したプロトスペーサー隣接モチーフ(PAM)配列は下線で強調されている。この部位でCas9によって誘発される、予想される二本鎖切断の位置は、小さな黒色の矢印で示されている。
図3】例示的なGUIDE-seq法の概要を示した図である。
図4-1】図4A.1GUIDE-Seq法によって発見されたCRISPR-Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1~3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。
図4-2】図4B.GUIDE-Seq法によって発見されたCRISPR-Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1~3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。
図4-3】図4C.GUIDE-Seq法によって発見されたCRISPR-Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1~3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。
図4-4】図4D.GUIDE-Seq法によって発見されたCRISPR-Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1~3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。
図4-5】図4E.GUIDE-Seq法によって発見されたCRISPR-Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1~3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。
図5-1】図5A-B.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。 (a)例示的なGUIDE-Seq法の図式的概要。 (b)ヒト細胞におけるRGNで誘発されたDSBの中へのdsODN組み込みの最適化。RFLPアッセイによって測定されるような、異なる修飾オリゴヌクレオチドについての組み込みの割合が示されている。対照反応物は、RGNをコードしているプラスミドのみでトランスフェクトされた(すなわち、dsODNなし)。
図5-2】図5C.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。 (c)ゲノム配列の読みのマッピングによりDSB部位の同定が可能とされる方法の図式的例示。二方向のマッピングの読みまたは同じ方向へのマッピングであるが異なるプライマーによって増幅された読みは、GUIDE-seqアッセイにおけるDSBのサインである。図1Aも参照されたい。
図5-3】図5D-1.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。(d1~d3)GUIDE-Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE-Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE-Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。
図5-4】図5D-2.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。(d1~d3)GUIDE-Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE-Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE-Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。
図5-5】図5D-3.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。(d1~d3)GUIDE-Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE-Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE-Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。
図5-6】図5E-F.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。 (e)本研究において解析された10種のRGNについてのGUIDE-Seqによって同定された既知および新規のオフターゲット切断部位の数。4種のRGNについてのすべての既知のオフターゲット切断は、GUIDE-seqによって同定された。 (f)本報告の10種のRGNについてのGUIDE-Seqによって検出されたオフターゲット部位の総数に対するヒトゲノム(y軸)に直交性のオンターゲット部位の散乱プロット。直交性は、オンターゲット部位に対して相対的に1から6つのミスマッチを有するヒトゲノム内の部位の総数として算出された。
図5-7】図5G.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。 (g)本報告の10種のRGNについてのGUIDE-Seqによって検出されるオフターゲット部位の総数に対するオンターゲット部位GC含量(y軸)の散乱プロット。
図5-8】図5H-I.例示的なGUIDE-Seq法の設計、最適化および適用を示した図である。 (h)EMX1を標的とするRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラム。残りのRGNについてのさらなるイデオグラムは、図13の中で見出すことができる。 (i)本研究において調査された10種のRGNについてのGUIDE-Seqによって同定されたオフターゲット切断部位のゲノム位置。
図6-1】図6A.10種のRGNについてのGUIDE-Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE-Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(a)VEGFA部位1。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。
図6-2】図6B.10種のRGNについてのGUIDE-Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE-Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(b)VEGFA部位2。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。
図6-3】図6C-E.10種のRGNについてのGUIDE-Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE-Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(c)VEGFA部位3、(d)EMX1、(e)FANCF。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。
図6-4】図6F-J.10種のRGNについてのGUIDE-Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE-Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(f)HEK293部位1、(g)HEK293部位2、(h)HEK293部位3、(i)HEK293部位4、(j)RNF2。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。
図7-1】図7A.GUIDE-Seq切断部位が真正のRGNオフターゲット変異部位であることを示した図である。 (a)GUIDE-Seq切断部位におけるインデル変異を確認するために使用される、AMPに基づいたシークエンシング法の図式的概要が、図の上半分に示されている。マップされたインデル変異のヒストグラムプロットは、3種のRGNオンターゲット部位について示されている。欠失はX軸の上に示されているのに対して、挿入は下に示されている。標的部位全体(すなわち、プロトスペーサーおよびPAM配列)の境界は点線で示され、かつプロトスペーサーとPAM配列との間の境界は他の2本の間の点線として示されている。RGN切断は、プロトスペーサーの5’端から3から4bpに生じると予測される。
図7-2】図7B-F.GUIDE-Seq切断部位が真正のRGNオフターゲット変異部位であることを示した図である。 (b)~(f)以下を標的としたRGNについてのGUIDE-Seqによって同定された切断部位についてのインデル頻度(x軸)およびGUIDE-Seqシークエンシングの読み数(y軸)の散乱プロット:VEGFA部位1、VEGFA部位2、VEGFA部位3、EMX1、およびFANCF。
図8図8A-E.RGNで誘発されるオフターゲット配列特性の解析を示した図である。 (a)(GUIDE-Seqによって検出されるように)切断される特定の数のミスマッチを有する潜在的なRGNオフターゲット部位の画分。 (b)特定の数のミスマッチを有するRGNオフターゲット切断部位についてのGUIDE-Seqの読み数のプロット(対数目盛) (c)RGNオフターゲット部位についてのGUIDE-Seqの読み数に対する、プロトスペーサー内のミスマッチ部位の影響。塩基は、1から20の番号が付けられ、20はPAMに隣接した塩基である。 (d)線形回帰解析によって推定される、ゆらぎトランジション、非ゆらぎトランジション、およびトランスバージョンのミスマッチの影響。 (e)ミスマッチ数、ミスマッチ型、ミスマッチ部位、PAM密度、発現レベル、およびゲノム位置(遺伝子間/エクソン/イントロン)の影響についての個別の一変量解析によって説明されるGUIDE-Seqの読み数相違の割合。
図9-1】図9A.RGNオフターゲット部位を同定するためのGUIDE-Seqとコンピュータ予測またはChIP-Seq法との比較を示した図である。 (a)9種のRGNについてのMIT CRISPR Design ToolおよびGUIDE-Seqによって予測されるオフターゲット部位間の重複を例示しているベン図。
図9-2】図9B.RGNオフターゲット部位を同定するためのGUIDE-Seqとコンピュータ予測またはChIP-Seq法との比較を示した図である。 (b)9種のRGNについてのE-CRISPコンピュータ予測プログラムおよびGUIDE-Seqによって予測されるオフターゲット部位間の重複を例示しているベン図。
図9-3】図9C-D.RGNオフターゲット部位を同定するためのGUIDE-Seqとコンピュータ予測またはChIP-Seq法との比較を示した図である。 (c)MIT CRISPR Design Toolによって予測される、予測されない、および考慮されない、GUIDE-Seqによって同定される真正のRGNオフターゲット部位の数を示しているヒストグラム。MIT CRISPR Design Toolによって予測される部位は、プログラムによって提供されるスコアに基づく五分位群に分けられる。各バーは、オンターゲット部位に対してミスマッチの数に基づいて細分類された部位を有する。バルジ部位は、スキップされた塩基部位をgRNA-プロトスペーサーDNA境界面に有するものである。 (d)E-CRISPコンピュータ予測ツールによって予測される、予測されない、および考慮されない、GUIDE-Seqによって同定される真正のRGNオフターゲット部位の数を示しているヒストグラム。部位は、(c)に記載のように再分割される。
図9-4】図9E-F.RGNオフターゲット部位を同定するためのGUIDE-Seqとコンピュータ予測またはChIP-Seq法との比較を示した図である。 (e)ChIP-Seqによって同定されたdCas9結合部位とGUIDE-Seqによって同定されたRGNオフターゲット切断部位との間の重複を例示しているベン図。 (f)目的のオンターゲット部位に対して配列におけるミスマッチの数によって分類された、GUIDE-Seqによって同定されたRGNオフターゲット部位およびChIP-Seqによって同定されたdCas9結合部位のヒストグラムプロット。GUIDE-SeqおよびChIP-Seqミスマッチのカーネル密度評価が示されている。点線は、各クラスの部位についてのミスマッチの平均数を示す。
図10-1】図10A.RGNによって誘発される大規模な構造変化を示した図である。 (a)転座を検出するためのAMP戦略の図式的概要。さらなる詳細は方法に。
図10-2】図10B.RGNによって誘発される大規模な構造変化を示した図である。 (b)RGNによって誘発される構造的バリエーションのCircosプロット。5種のRGNおよび細胞の対照についてのデータが示されている。染色体は円に配置されており、転座は2つの染色体位置間の弧として示されている。長さが1kbを超える欠失または逆位は、直線として示される。オンターゲット、オフターゲット、または切断点ホットスポット以外の部位は、「その他」として分類されている。
図10-3】図10C.RGNによって誘発される大規模な構造変化を示した図である。 (c)第6染色体上のVEGFA部位1オンターゲット部位と第17染色体上のオフターゲット部位との間で検出される転座の例。4つすべての可能な相互転座が、AMPを使用して検出された。
図10-4】図10C-D.RGNによって誘発される大規模な構造変化を示した図である。 (d)AMPによって検出されるVEGFA部位2における2つのオフターゲット部位間の大きな欠失および逆位の例。 (e)5種のRGNで観察される、RGN誘発性およびRGN非依存性の異なる構造的バリエーションのまとめの表。Cas9のみ、dsODNオリゴのみ、および細胞のみでの対照も示されている。
図10-5】図10F.RGNによって誘発される大規模な構造変化を示した図である。 (f)U2OSおよびHEK293細胞における切断点ホットスポットの位置を例示している染色体イデオグラム。2つのホットスポットは染色体1および10のセントロメア領域において重複する。
図11-1】図11A-B.tru-gRNAによって指向されるRGNのGUIDE-Seqプロファイルを示した図である。 (a)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについて同定された既知および新規のオフターゲット切断部位の数。全長gRNAによって指向されるRGNについてのデータは、図1eに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。 (b)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについてのオンターゲットおよびオフターゲット部位を示している染色体イデオグラム。全長gRNAによって指向されるRGNについてのイデオグラムは、図1hおよび図13A~Bに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。
図11-2】図11C-D.tru-gRNAによって指向されるRGNのGUIDE-Seqプロファイルを示した図である。 (c)~(d)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについてのオンターゲットおよびオフターゲット部位を示している染色体イデオグラム。全長gRNAによって指向されるRGNについてのイデオグラムは、図1hおよび図13A~Bに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。
図11-3】図11E.tru-gRNAによって指向されるRGNのGUIDE-Seqプロファイルを示した図である。 (e)tru-gRNAによって指向されるRGNによって誘発されるDSBのGUIDE-Seqに基づいた同定。本発明者らがGUIDESeqによって評価したtru-gRNAによって指向される3種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。RGNが全長gRNAによって指向されるので、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。
図11-4】図11F-H.tru-gRNAによって指向されるRGNのGUIDE-Seqプロファイルを示した図である。 (f)~(h)tru-gRNAによって指向されるRGNについてのGUIDE-Seqによって同定されたオフターゲット部位の配列。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDESeqシークエンシングの読み数は、それぞれの部位の右側に示されている。目的のオンターゲット部位は四角形で印がつけられており、全長gRNAおよびtru-gRNAの両方によって指向されるRGNの既知のオフターゲット部位は濃い灰色のひし形で印がつけられており、かつtru-gRNAによって指向されるRGNのみで見出される既知のオフターゲット部位は薄い灰色のひし形で印がつけられている。既知のオフターゲット部位は、以前の報告FU et al., Nat Biotechnol 32, 279-284 (2014))において0.1%以上の変異生成頻度を有することが示されていたものであった。データは、tru-gRNAによって(f)VEGFA部位1、(g)VEGFA部位3、および(h)EMX1標的部位に指向されるRGNについて示されている。
図12】dsODN挿入およびインデル変異の検証のためのGUIDE-SeqおよびAMPに基づいたシークエンシングの詳細な図式的概要を示した図である。両方のプロトコールについての詳細は、方法の中で見出すことができる。
図13-1】図A-C.GUIDE-Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。
図13-2】図D-F.GUIDE-Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。
図13-3】図G-I.GUIDE-Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。
図13-4】図J.GUIDE-Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。
図14】GUIDE-Seqの読み数に対する因子の独立した影響を示すための多重因子線形回帰モデルを示した図である。
図15-1】図15A.オフターゲット切断部位として以前に特徴付けされた7つのChIP-Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。
図15-2】図15B.オフターゲット切断部位として以前に特徴付けされた7つのChIP-Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。
図15-3】図15C.オフターゲット切断部位として以前に特徴付けされた7つのChIP-Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。
図15-4】図15D.オフターゲット切断部位として以前に特徴付けされた7つのChIP-Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。
図16-1】図16A.EGFPに対して標的化されたTALEN、ZFN、およびRFNを使用した、3つの型のdsODNの組み込み頻度を示しているグラフである。dsODNのすべてが5’リン酸化されていた。dsODNは、表示されている通り、無作為化された5’もしくは3’の4bpのオーバーハングを有していたまたは平滑末端であった。
図16-2】図16B-C.U2OS細胞における2つの内在性標的部位、CCR5およびAPCでTALENによって誘発される二本鎖切断(DSB)の中への、平滑末端の、5’リン酸化された、34bpの二本鎖オリゴデオキシヌクレオチド(dsODN)(oSQT685/686)の効率的な組み込みを示しているグラフである。(16B)RFLP解析により、2つの内在性部位、CCR5およびAPCでTALENによって誘発されるDSBの中へのdsODNタグoSQT685/686の組み込み(%)が示されている。(16C)累積の変異生成頻度は、これらの2つの内在性標的部位におけるT7E1アッセイによって測定される。
図17図17A-B.異なるdsODN末端保護の比較を示している棒グラフである;この実験において使用されたdsODNは、リン酸化されかつ平滑末端であって、かつ5’および3’ホスホロチオエート修飾の両方、または3’ホスホロチオエート修飾のみのいずれかを有していた。17A、ヒトU2OS細胞におけるRFN;17B、マウスES細胞におけるCas9。
図18-1】図18A-B.マウスES細胞における3’ホスホロチオエート修飾されたオリゴの異なる濃度での実験を示しているグラフである。18A、Nanog sgRNA/Cas9;18B、Phc1 sgRNA/Cas9。dsODNは、リン酸化されかつ平滑末端であって、かつ5’および3’ホスホロチオエート修飾の両方、または3’ホスホロチオエート修飾のみのいずれかを有していた。実験は、ヒトU2OS細胞においてダイマーRNA誘導型FokIヌクレアーゼで(図18A)、またはマウスES細胞において標準Cas9で(図18B)行われた。
図18-2】図18C.マウスES細胞における3’ホスホロチオエート修飾されたオリゴの存在下での破壊の割合のT7E1解析を示しているグラフである。
図19図19A-B.U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発される二本鎖切断(DSB)の中へのビオチン化されたdsODNタグの効率的な組み込みを示す図である。(19A)RFLP解析により、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発されるDSBの中への標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)の組み込み率(%)が示される。(19B)T7EIにより、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1での標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)での推定される変異生成頻度(%)が示される。
図20図20A-B.より長いdsODNタグは、CRISPR-Cas9で誘発されるDSBの部位において効率良く組み込むために最適化されうることを示す図である。(20A)RFLP解析により、75、50、または25pmolでトランスフェクトされるときの60bpのdsODN(oSQT1255/1256、oSQT1257/1258、およびoSQT1259/1260)の組み込み率(%)が示される。U2OS細胞において2つの内在性部位、EMX1およびFANCF1で試験された。(20B)T7EIにより、75、50、または25pmolでトランスフェクトされるときの60bpのdsODN(oSQT1255/1256、oSQT1257/1258、およびoSQT1259/1260の推定NHEJ率(%)が示される。U2OS細胞において2つの内在性部位、EMX1およびFANCF1で試験された。
図21】異なるsgRNAを使用した改変VQRおよびVRER SpCas9バリアントについてのGUIDE-seqによって同定されたオフターゲット切断部位の数を示しているグラフである。
図22】オフターゲット部位での野生型およびD1135E SpCas9バリアントの間の特異性における、GUIDE-seqで検出される変化をまとめているグラフである。D1135Eについての読み数のない部位での特異性における推定される増加(倍)は、プロットされていない。
図23図23A-B.以下を示しているグラフである。(23A)制限断片長多型解析によって推定される、オンターゲット部位でのGUIDE-seqオリゴタグ組み込みの平均頻度。エラーバーは、平均値の標準誤差、n=4を表す;(23B)GUIDE-seq実験のためにT7E1によって検出されるオンターゲット部位における平均変異生成頻度。エラーバーは、平均値の標準誤差、n=4を表す。
【発明を実施するための形態】
【0025】
本明細書に記載のシークエンシングによって評価されるゲノムワイドでバイアスのない
DSBの同定(GUIDE-Seq)法は、生細胞、例えば、非相同末端結合(NHEJ
)修復経路が有効な細胞において改変ヌクレアーゼ切断部位の位置を同定するための高感
度な、バイアスのない、かつゲノムワイドな方法を可能にする。一部の実施形態では、該
方法は、ヌクレアーゼで誘発された切断の中への短い二本鎖オリゴデオキシヌクレオチド
(dsODN)の捕捉(NHEJ経路によって媒介されると推定されるプロセス)および
次いでゲノムの挿入の部位を同定するための挿入されたdsODN配列の使用、例えば、
挿入されたdsODN配列を使用してハイスループットシークエンシングのためのゲノム
挿入の部位を選択的に増幅する、PCRに基づいたディープシークエンシングアプローチ
を使用すること、または、例えば、溶液ハイブリッド捕捉を使用して、付加されたタグ、
例えば、ビオチンなどを使用して、挿入されたdsODNを含むゲノム断片を選択的にプ
ルダウンすること、に依存する。本明細書に記載されているのは、培養ヒト細胞における
GUIDE-Seq法の開発および検証である;本明細書に記載されている一般的なアプ
ローチは、すべての哺乳動物細胞においておよびNHEJ経路が活性であるまたは活性で
あると推定されるあらゆる細胞型または生物において有効なはずである。
【0026】
この最初のシークエンシングプロセスによって同定される潜在的なオフターゲット部位
は、ヌクレアーゼ成分だけが発現される細胞におけるNHEJ修復のインデル変異特性に
ついて解析される可能性もある。これらの実験は、増幅およびその後のディープシークエ
ンシングを使用して行われてもよく、それぞれのヌクレアーゼによって誘発されるオフタ
ーゲット変異の頻度のさらなる確認および定量を可能にするはずである。
【0027】
二本鎖オリゴデオキシヌクレオチド(dsODN)
本明細書に記載の方法において、天然に存在しないdsODNは、細胞内で発現される
。本方法において、dsODNの両鎖は、細胞のゲノムにオルソロガスである(すなわち
、細胞のゲノム内に存在しないまたは細胞のゲノム内に存在する配列に相補的である、す
なわち、細胞のゲノム内に存在する配列に10%、20%、30%、40%、または50
%以下の同一性を有する)。dsODNは、好ましくは15および75ntの間の長さ、
例えば、15~50nt、50~75nt、30~35nt、60~65nt、もしくは
50~65ntの長さ、または15および50ntの間の長さ、例えば、20~40もし
くは30~35、例えば、32~34ntの長さでありうる。dsODNの各鎖は、固有
のPCRプライミング配列を含んでいなければならない(すなわち、dsODNは、それ
ぞれの鎖上に1つずつ、2つのPCRプライマー結合部位を含む)。一部の実施形態では
、dsODNは、制限酵素認識部位、好ましくは、細胞のゲノムにおいて相対的にまれな
部位を含む。
【0028】
dsODNは、好ましくは修飾される;好ましくは、dsODNの5’末端は、リン酸
化される;さらにまた好ましくは、2つのホスホロチオエート結合が、両方の3’末端お
よび両方の5’末端上に存在する。好ましい実施形態では、dsODNは、平滑末端であ
る。一部の実施形態では、dsODNは、5’または3’末端上に無作為な多様な1、2
、3、4つまたはそれより多くのヌクレオチドオーバーハングを含む。
【0029】
dsODNは、1つまたは複数のさらなる修飾、例えば、当技術分野において知られて
いるまたはPCT/US2011/060493に記載されているようなものも含んでい
てもよい。例えば、一部の実施形態では、dsODNは、ビオチン化される。GUIDE
-seq dsODNタグのビオチン化バージョンは、ゲノムのDSBの部位の中への組
み込みのための基質として使用される。ビオチンは、dsODNに対して内側のどこにあ
ってもよいが(例えば、修飾されたチミジン残基(ビオチン-dT)、またはビオチンア
ジドを使用する)、5’または3’末端上にあってはならない。実施例4に示されている
ように、こうしたオリゴを効率良く組み込むことが可能である。これは、GUIDE-s
eq dsODNタグを含む断片を回収する代替の方法を可能にする。一方、一部の実施
形態では、これらの配列は、ネステッドPCRによって検索および同定され、このアプロ
ーチでは、これらは、ビオチンを使用することによって、例えば、ストレプトアビジンコ
ーティング付き磁気ビーズに結合させることによって、または溶液ハイブリッド捕捉を使
用して、物理的にプルダウンされる;例えば、Gnirke et al., Nature Biotechnology 27
, 182 - 189 (2009)を参照されたい。主な利点は、両方のフランキング配列の検索であり
、これは、オフターゲット切断部位を同定するために参照ゲノムに配列をマップすること
への依存性を低下させる。
【0030】
改変ヌクレアーゼ
以下の4つの主なクラスの改変ヌクレアーゼがある:1)メガヌクレアーゼ、2)ジン
クフィンガーヌクレアーゼ、3)転写活性化因子エフェクター様ヌクレアーゼ(TALE
N)、および4)クラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)
Cas RNA誘導型ヌクレアーゼ(RGN)。例えば、Gaj et al., Trends Biotechno
l. 2013 Jul;31(7):397-405を参照されたい。ヌクレアーゼは、当技術分野において知ら
れている方法を使用して、細胞内で一過的にまたは安定に発現されてもよい;典型的には
、発現を得るために、タンパク質をコードしている配列は、直接的な転写のためのプロモ
ーターを含む発現ベクター中にサブクローニングされる。好適な真核発現系は、当技術分
野においてよく知られかつ、例えば、Sambrook et al., Molecular Cloning, A Laborato
ry Manual (4th ed. 2013);Kriegler, Gene Transfer and Expression: A Laboratory M
anual (2006);およびCurrent Protocols in Molecular Biology (Ausubel et al., eds.
, 2010)に、記載されている。真核細胞および原核細胞の形質転換は、標準的な技術(例
えば、上記の参考文献およびMorrison, 1977, J. Bacteriol. 132:349-351;Clark-Curti
ss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)を参照され
たい)によって行われる。
【0031】
ホーミングメガヌクレアーゼ
メガヌクレアーゼは、多様な生物、例えば、細菌、酵母、藻類および植物の細胞小器官
などに由来している配列特異的エンドヌクレアーゼである。内在性メガヌクレアーゼは、
12から30塩基対の認識部位を有する;18bpおよび24bpの長さのメガヌクレア
ーゼ認識部位を有するカスタマイズされたDNA結合部位が記載されており、いずれかが
本方法およびコンストラクトにおいて使用されてもよい。例えば、Silva, G., et al., C
urrent Gene Therapy, 11:11-27, (2011);Arnould et al., Journal of Molecular Biol
ogy, 355:443-58 (2006);Arnould et al., Protein Engineering Design & Selection,
24:27-31 (2011);およびStoddard, Q. Rev. Biophys. 38, 49 (2005);Grizot et al.,
Nucleic Acids Research, 38:2006-18 (2010)を参照されたい。
【0032】
CRISPR-Casヌクレアーゼ
近年の研究は、クラスター化された、規則的な間隔の、短鎖反復回文配列(CRISP
R)/CRISPR関連(Cas)システム(Wiedenheft et al., Nature 482, 331-338
(2012);Horvath et al., Science 327, 167-170 (2010);Terns et al., Curr Opin Mi
crobiol 14, 321-327 (2011))が、細菌、酵母およびヒト細胞において、ならびに全生物
、例えば、ショウジョウバエ、ゼブラフィッシュおよびマウスなどにおいてin viv
oで、ゲノム編集を行うための簡単かつきわめて効率的な方法の基礎として役に立ちうる
ことを実証している(Wang et al., Cell 153, 910-918 (2013);Shen et al., Cell Res
(2013);Dicarlo et al., Nucleic Acids Res (2013);Jiang et al., Nat Biotechnol
31, 233-239 (2013);Jinek et al., Elife 2, e00471 (2013);Hwang et al., Nat Biot
echnol 31, 227-229 (2013);Cong et al., Science 339, 819-823 (2013);Mali et al.
, Science 339, 823-826 (2013c);Cho et al., Nat Biotechnol 31, 230-232 (2013);G
ratz et al., Genetics 194(4):1029-35 (2013))。化膿レンサ球菌(S. pyogenes)から
のCas9ヌクレアーゼ(以下、簡単にCas9)は、17~20ヌクレオチドの改変ガ
イドRNA(gRNA)(例えば、単一ガイドRNAまたはcrRNA/tracrRN
A対)とプロトスペーサー隣接モチーフ(PAM)(例えば、PAMは配列NGGまたは
NAGに合致している)の隣にある目的の標的ゲノムDNA配列の相補鎖との間の単純な
塩基対相補性を介して誘導されうる(Shen et al., Cell Res (2013);Dicarlo et al.,
Nucleic Acids Res (2013);Jiang et al., Nat Biotechnol 31, 233-239 (2013);Jinek
et al., Elife 2, e00471 (2013);Hwang et al., Nat Biotechnol 31, 227-229 (2013)
;Cong et al., Science 339, 819-823 (2013);Mali et al., Science 339, 823-826 (2
013c);Cho et al., Nat Biotechnol 31, 230-232 (2013);Jinek et al., Science 337,
816-821 (2012))。
【0033】
一部の実施形態では、本システムは、細菌においてコードされるようなまたは哺乳動物
細胞における発現のためにコドン最適化されたいずれかの、化膿レンサ球菌(S. pyogene
s)または黄色ブドウ球菌(Staphylococcus aureus)からの野生型またはバリアントのC
as9タンパク質を利用する。ガイドRNAは、細胞内でCas9と一緒に発現される。
ガイドRNAまたはヌクレアーゼのいずれか、または両方は、細胞内で一過的にまたは安
定に発現されうる。
【0034】
TALエフェクター反復配列
キサントモナス属(Xanthomonas)の中の植物病原性細菌のTALエフェクターは、宿
主DNAを結合することおよびエフェクター特異的宿主遺伝子を活性化することによって
、疾患において重要な役割を果たす、または防御を始動させる。特異性は、エフェクター
可変数の、不完全な、典型的には約33~35アミノ酸の反復に依存する。多型は、主に
リピート部位12および13に存在し、これは、本明細書において反復可変二残基(RV
D)と呼ばれる。TALエフェクターのRVDは、それらの標的部位においてヌクレオチ
ドに、直接的、直線的な様式で、1つのRVDが1つのヌクレオチドに、一部は縮重で、
かつ見かけ上の前後関係の依存性なく、対応する。一部の実施形態では、ヌクレオチド特
異性を付与する多型領域は、三残基またはトリプレットとして発現されうる。
【0035】
それぞれのDNA結合反復は、標的DNA配列において塩基対の認識を決定するRVD
を含みうる。ここで、それぞれのDNA結合反復は、標的DNA配列内の1つの塩基対を
認識する役割を果たす。一部の実施形態では、RVDは、以下のうちの1つまたは複数:
Cを認識するためのHA;Cを認識するためのND;Cを認識するためのHI;Gを認識
するためのHN;Gを認識するためのNA;GまたはAを認識するためのSN;Tを認識
するためのYG;およびGを認識するためのNK、ならびに以下のうちの1つまたは複数
を含みうる:Cを認識するためのHD;Tを認識するためのNG;Aを認識するためのN
I;GまたはAを認識するためのNN;AまたはCまたはGまたはTを認識するためのN
S;CまたはTを認識するためのN、ここで、は、RVDの第2の部位内のギャップ
を表す;Tを認識するためのHG;Tを認識するためのH、ここで、は、RVDの第
2の部位内のギャップを表す;およびTを認識するためのIG。
【0036】
TALEタンパク質は、ゲノム工学において(例えば、植物において生物燃料または生
物再生可能材料に有用な形質を付加または促進するために)相同組換えを促進することが
できる標的化されたキメラヌクレアーゼとして研究およびバイオテクノロジーにおいて有
用でありうる。これらのタンパク質は、例えば、転写因子としても有用でありえ、かつ特
に、非限定的な例として病原体(例えば、ウイルス)に対する療法のように、きわめて高
いレベルの特異性を必要とする治療的適用のためにも有用でありうる。
【0037】
改変TALE配列を作製するための方法は、当技術分野において知られており、例えば
、米国特許出願公開第61/610,212号明細書、およびReyon et al., Nature Bio
technology 30,460-465 (2012)に記載されている高速のライゲーションに基づいた自動化
可能な固相ハイスループット(FLASH)システム;ならびにBogdanove & Voytas, Sc
ience 333, 1843-1846 (2011);Bogdanove et al., Curr Opin Plant Biol 13, 394-401
(2010);Scholze & Boch, J. Curr Opin Microbiol (2011);Boch et al., Science 326,
1509-1512 (2009);Moscou & Bogdanove, Science 326, 1501 (2009);Miller et al.,
Nat Biotechnol 29, 143-148 (2011);Morbitzer et al., T. Proc Natl Acad Sci U S A
107, 21617-21622 (2010);Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (201
1);Zhang et al., Nat Biotechnol 29, 149-153 (2011);Geissler et al., PLoS ONE 6
, e19509 (2011);Weber et al., PLoS ONE 6, e19722 (2011);Christian et al., Gene
tics 186, 757-761 (2010);Li et al., Nucleic Acids Res 39, 359-372 (2011);Mahfo
uz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011);Mussolino et al., Nuc
leic Acids Res (2011);Li et al., Nucleic Acids Res 39, 6315-6325 (2011);Cermak
et al., Nucleic Acids Res 39, e82 (2011);Wood et al., Science 333, 307 (2011)
;Hockemeye et al. Nat Biotechnol 29, 731-734 (2011);Tesson et al., Nat Biotech
nol 29, 695-696 (2011);Sander et al., Nat Biotechnol 29, 697-698 (2011);Huang
et al., Nat Biotechnol 29, 699-700 (2011);およびZhang et al., Nat Biotechnol 29
, 149-153 (2011)に記載されている方法を参照されたい;これらのすべては、参照により
本明細書にその全体が組み込まれている。
【0038】
ジンクフィンガー
ジンクフィンガータンパク質は、独立に折りたたまれた亜鉛を含むミニドメインである
、1つまたは複数のジンクフィンガーを含むDNA結合タンパク質であり、その構造は、
当技術分野においてよく知られており、かつ、例えば、Miller et al., 1985, EMBO J.,
4:1609;Berg, 1988, Proc. Natl. Acad. Sci. USA, 85:99;Lee et al., 1989, Science
. 245:635;およびKlug, 1993, Gene, 135:83に定義されている。DNAに結合したジン
クフィンガータンパク質Zif268およびそのバリアントの結晶構造は、半分保存され
た相互作用のパターンを示し、そこでは、典型的にはジンクフィンガーのアルファヘリッ
クスからの3つのアミノ酸が、DNA内の3つの隣接した塩基対すなわち「サブサイト」
と接触する(Pavletich et al., 1991, Science, 252:809;Elrod-Erickson et al., 199
8, Structure, 6:451)。したがって、Zif268の結晶構造により、ジンクフィンガ
ーDNA結合ドメインが、ジンクフィンガーとDNA配列内の3塩基対「サブサイト」と
の間の1対1の相互作用を有するモジュールの様式で機能する可能性があることが示唆さ
れる。天然に存在するジンクフィンガー転写因子において、複数のジンクフィンガーは、
典型的には、直列の配列内に一緒に結合されて、連続したDNA配列の配列特異的認識を
達成する(Klug, 1993, Gene 135:83)。
【0039】
複数の研究は、DNA結合に関与するアルファヘリックスの部位においてアミノ酸を無
作為化することおよびファージディスプレイのような選択方法を使用して目的のDNA標
的部位に結合する能力のある望ましいバリアントを同定することによって個々のジンクフ
ィンガーのDNA結合特性を人為的に改変することが可能であることを示している(Reba
r et al., 1994, Science, 263:671;Choo et al., 1994 Proc. Natl. Acad. Sci. USA,
91:11163;Jamieson et al., 1994, Biochemistry 33:5689;Wu et al., 1995 Proc. Nat
l. Acad. Sci. USA, 92: 344)。こうした組換えジンクフィンガータンパク質は、機能ド
メイン、例えば、転写活性化因子、転写抑制因子、メチル化ドメイン、およびヌクレアー
ゼと融合させて、遺伝子発現を調節し、DNAメチル化を変化させ、モデル生物、植物、
およびヒト細胞のゲノム内に標的とする変化を導入することができる(Carroll, 2008, G
ene Ther., 15:1463-68;Cathomen, 2008, Mol. Ther., 16:1200-07;Wu et al., 2007,
Cell. Mol. Life Sci., 64:2933-44)。
【0040】
「モジュール集合体」として知られている、ジンクフィンガー配列を改変するための1
つの既存の方法は、予め選択されたジンクフィンガーモジュールを配列内に単純に一緒に
連結することを提唱している(Segal et al., 2003, Biochemistry, 42:2137-48;Beerli
et al., 2002, Nat. Biotechnol., 20:135-141;Mandell et al., 2006, Nucleic Acids
Res., 34:W516-523;Carroll et al., 2006, Nat. Protoc. 1:1329-41;Liu et al., 20
02, J. Biol. Chem., 277:3850-56;Bae et al., 2003, Nat. Biotechnol., 21:275-280
;Wright et al., 2006, Nat. Protoc., 1:1637-52)。いかなる研究者によって実施され
るのにも十分に簡単であるにもかかわらず、近年の報告は、この方法のために、特に、ジ
ンクフィンガーヌクレアーゼの文脈において、高い失敗率(Ramirez et al., 2008, Nat.
Methods, 5:374-375;Kim et al., 2009, Genome Res. 19:1279-88)、いずれの所与の
標的遺伝子のためにもきわめて多数のジンクフィンガータンパク質の構築および細胞に基
づいた試験を典型的には必要とするという制限(Kim et al., 2009, Genome Res. 19:127
9-88)を示している。
【0041】
無作為化されたライブラリーからジンクフィンガー配列を同定する、組合せの選択に基
づいた方法は、モジュール集合体よりも高い成功率を有することが示されている(Maeder
et al., 2008, Mol. Cell, 31:294-301;Joung et al., 2010, Nat. Methods, 7:91-92
;Isalan et al., 2001, Nat. Biotechnol., 19:656-660)。好ましい実施形態では、ジ
ンクフィンガー配列は、国際公開第2011/017293号パンフレットおよび国際公
開第2004/099366号パンフレットに記載されている、またはこれらに記載され
ているように作製される。さらなる好適なジンクフィンガーDBDは、米国特許第6,5
11,808号明細書、第6,013,453号明細書、第6,007,988号明細書
、および第6,503,717号明細書ならびに米国特許出願公開第2002/0160
940号明細書に記載されている。
【0042】
細胞
本明細書に記載の方法は、ゲノムDNAにおいてDSBを修復する能力のあるいかなる
細胞においても使用されうる。真核細胞における2つの主要なDSB修復経路は、相同組
換え(HR)および非相同末端結合(NHEJ)である。好ましくは、該方法は、NHE
Jの能力のある細胞において行われる。NHEJ活性を検出するための方法は、当技術分
野において知られている;NHEJの標準経路および副経路の概要については、Liu et a
l., Nucleic Acids Res. Jun 1, 2014; 42(10):6106-6127を参照されたい。
【0043】
シークエンシング
本明細書中で使用される場合、「シークエンシング」は、核酸の配列を決定するいかな
る方法をも含む。鎖終結(サンガー)シークエンシングおよび色素終結シークエンシング
を含む、シークエンシングのいかなる方法も本方法において使用されうる。好ましい実施
形態では、何千または何百万ものシークエンシング反応を並行に行うハイスループットシ
ークエンシング技術である、次世代シークエンシング(NGS)が使用される。異なるN
GSプラットフォームは異なるアッセイ化学を使用するが、これらはすべて、多数の鋳型
上で同時に行われる多数のシークエンシング反応から配列データを生成する。典型的には
、配列データは、スキャナーを使用して収集され、次いで、バイオインフォマティクス的
に集結および解析される。したがって、シークエンシング反応は、並行に、実施、読み取
り、集結、および解析される;例えば、米国特許第20140162897号明細書、な
らびにVoelkerding et al., Clinical Chem., 55: 641-658, 2009;およびMacLean et al
., Nature Rev. Microbiol., 7: 287-296 (2009)を参照されたい。NGS法には、鋳型増
幅を必要とするものもあり、必要としないものもある。増幅を必要とする方法は、ピロシ
ークエンシング(例えば、米国特許第6,210,89号明細書および第6,258,5
68号明細書を参照されたい;Rocheによって商品化されている);Solexa/
Illuminaプラットフォーム(例えば、米国特許第6,833,246号明細書、
第7,115,400号明細書、および第6,969,488号明細書を参照されたい)
;ならびに補助されたオリゴヌクレオチドライゲーションおよび検出(SOLiD)プラ
ットフォーム(Applied Biosystems;例えば、米国特許第5,912
,148号明細書および第6,130,073号明細書を参照されたい)を含む。増幅を
必要としない方法(例えば、一分子シークエンシング法)は、ナノポアシークエンシング
、HeliScope(米国特許第第7,169,560号明細書;第7,282,33
7号明細書;第7,482,120号明細書;第7,501,245号明細書;第6,8
18,395号明細書;第6,911,345号明細書;および第7,501,245号
明細書);合成によるリアルタイムシークエンシング(例えば、米国特許第7,329,
492号明細書を参照されたい);ゼロモード導波路(ZMW)を使用した一分子リアル
タイム(SMRT)DNAシークエンシング法;ならびに、米国特許第7,170,05
0号明細書;第7,302,146号明細書;第7,313,308号明細書;および第
7,476,503号明細書に記載されているものを含む)、他の方法。例えば、米国特
許出願公開第2013/0274147号明細書;米国特許出願公開第2014/003
8831号明細書;Metzker, Nat Rev Genet 11(1): 31-46 (2010)を参照されたい。
【0044】
代替的に、ハイブリダイゼーションに基づいたシークエンス法または他のハイスループ
ットな方法、例えば、マイクロアレイ解析、NANOSTRING、ILLUMINA、
または他のシークエンシングプラットフォームも使用されてもよい。
実施例
【0045】
本発明は、以下の実施例においてさらに記載されるが、これは、特許請求の範囲に記載
の本発明の範囲を限定するものではない。
【実施例1】
【0046】
最初の実験では、ヌクレアーゼで誘発された二本鎖切断(DSB)の中にdsODNカ
セットを組み込むプロセスを最適化した。以前に公表された実験は、5’末端に2つのホ
スホロチオエート結合修飾を有しているdsODNを、哺乳動物細胞においてジンクフィ
ンガーヌクレアーゼ(ZFN)で誘発されたDSBの中に捕捉できたことを実証している
(Orlando et al., Nucleic Acids Res. 2010 Aug;38(15):e152)。しかし、こうしたs
sODNの捕捉を使用してきわめて低頻度のDSBでも同定するために、こうした切断の
中へのその捕捉の割合を改良するためにdsODNの特性を最適化した。当初の努力は、
化膿レンサ球菌(Streptococcus pyogenes)からのクラスター化された規則的な間隔の短
鎖反復回文配列(CRISPR)RNA誘導型ヌクレアーゼCas9によって誘発された
DSB中にdsODNを捕捉することに焦点を当てた。Cas9は、平滑末端を有するD
SBを誘発することが報告されており、したがって、dsODNバリアントは、平滑末端
化されるように設計した。最適化実験は、両方の5’末端のリン酸化および(5’末端上
のものに加えて)両方の3’末端上の2つのホスホロチオエート結合の導入により、Ca
s9で誘発されたDSBの中へのdsODNの捕捉の割合の大幅な上昇が導かれたことを
示した(図1A~B)。サンガーシークエンシングより、この特定のDSB中にdsOD
Nを成功裏に捕捉したことが検証された(図2A~B)。
【0047】
Cas9で誘発されたDSB中にdsODNが効率良く組み込まれうることが確立され
たので、次の実験では、次世代ディープシークエンシング法を哺乳動物細胞のゲノム内の
dsODN組み込み部位の捕捉、増幅および同定に使用し得るかどうかを決定することが
求められた。これを行うために、(それぞれの鎖上に1つの)2つのPCRプライマー結
合部位を含む34bpのdsODNを利用した;これらの配列が選択された理由は、それ
らがヒトゲノムにそれぞれオルソロガスであるためである。
【0048】
使用しdsODNの配列を、表1に示す:
【0049】
【表1】
【0050】
このdsODNを、Cas9をコードするプラスミド、および異なる内在性ヒト遺伝子
配列(EMX1およびVEGFA部位1、2、および3)にそれぞれ標的化された、4種
の異なる標的特異的gRNAのうちの1種をコードするプラスミドと共にヒトU2OS細
胞内にトランスフェクトした。これら4種の特定gRNAは、これらのそれぞれについて
真正のオフターゲット部位が以前に同定されていた(Fu et al., Nat Biotechnol. 2013;
Table 1)という理由で選択した。トランスフェクションは、以下のように行った:ds
ODNを、STE(100mM TrisHcl、500mM NaCl、10mM E
DTA)中でそれぞれ100uMの濃度でアニールさせる。U2OS細胞では、2E5細
胞を溶液SEおよびプログラムDN-100でヌクレオフェクトするために、500ng
のCas9発現プラスミド、250ngのgRNA発現プラスミド、および100pmo
lのdsODNを使用した。
【0051】
トランスフェクション3日後にゲノムDNAを採取し(Agencourt Ampu
re XP)、dsODNにコードされた制限部位の存在に基づいて、dsODNがこれ
らの細胞内のオンターゲット部位の中に効率良く組み込まれていることを検証するために
、PCRベースの制限断片長多型(RFLP)アッセイを使用した。
【0052】
トランスフェクトされた細胞のゲノム内のdsODN組み込みの位置を包括的に同定す
るために、これらの挿入部位を選択的に増幅してさらにそれらが次世代シークエンシング
技術を使用してシークエンスされるのを可能にするPCRベースの方法を使用した。この
戦略の一般的な概要を図3に示す。ゲノムDNAは、Covaris Adaptive
Focused Acoustic(AFA)焦点式超音波発生装置で500bpの平
均長に切断した。切断されたgDNAを末端修復し(Enzymatics)、Aテール
付加して(Enzymatics)、切断されたDNAの末端に半機能的シークエンシン
グアダプター(米国特許第20130303461号明細書)を連結した(Enzyma
tics)。これらの酵素的ステップのそれぞれを精製するために、固相可逆固定法(S
PRI)磁気ビーズ精製を使用した(Agencourt XP)。
【0053】
dsODN配列を有するDNA断片は、次いで、dsODNに特異的なプライマーを、
シークエンシングアダプターにアニールするプライマーと一緒に使用して増幅した。(上
記のようにそれぞれの鎖上に1つの)2つの潜在的なプライミング部位がdsODN内に
あるので、望ましい配列を選択的に増幅するために以下のように2つの独立したPCR反
応を行った。
【0054】
標的化されたシークエンシングライブラリーを作製するために、2ラウンドのネステッ
ドPCRを行った。第一ラウンドのPCRは、組み込みdsODNと相補的なプライマー
(プライマーA)およびユニバーサルアダプターと相補的なプライマー(プライマーB)
を使用して行った。第二ラウンドのPCRは、プライマーAと相補的な3’ネステッドプ
ライマー(プライマーC)、プライマーBと相補的な3’ネステッドプライマー(プライ
マーD)、ならびに、シークエンシングのために用意のできた「完全な」分子を作製する
ためにフローセル結合配列および無作為な分子インデックスを付加した、プライマーDと
相補的なプライマー(プライマーE)を使用して行った。各ラウンドのPCRを精製する
ために、SPRI磁気ビーズを使用した。(Agencourt Ampure XP)
【0055】
このアプローチによるdsODN含有ゲノム配列の増幅は、ゲノムDNAの無作為な切
断によって誘発された切断にシークエンシングアダプターがライゲーションされるので、
挿入地点に隣接したフランキング配列に依存することもそれによってバイアスされること
もない。dsODNに最も近い末端上に次世代シークエンシングアダプター配列およびイ
ンデクシングバーコードを付加するためにさらなるラウンドのPCRを行い、結果として
、次世代シークエンシング用に準備できた断片のライブラリーを得た。この一般的な方法
は、本明細書において、シークエンシングによって評価されるゲノムワイドでバイアスの
ないDSBの同定(Genomewide Unbiased Identification of DSBs Evaluated by Sequen
cing)として、GUIDE-Seqと呼ぶ。
【0056】
GUIDE-Seqを使用して構築されたライブラリーのディープシークエンシングに
より、共発現された4種のgRNA/Cas9ヌクレアーゼのそれぞれの存在下において
dsODNが挿入されるようになった広範囲のゲノム座位が明らかにされた。生のディー
プシークエンシングデータの解析において、挿入の真正の部位が、両方向での少なくとも
1つの読みによってカバーされたゲノム座位として同定されうることは理にかなっていた
。dsODNがいずれの方向においても挿入できたためおよびdsODN配列内の一方ま
たは他方のいずれかの鎖に特異的なプライマーを使用して増幅が行われたためという両方
の理由により、両方向での読みが可能であった。調査した4種のgRNAについて、この
基準を満たした合計465のゲノム座位を同定した。これらの465座位のうちの36%
では、使用したgRNAのオンターゲット部位と同様であり、かつ、オンターゲット部位
に対して相対的に6つものミスマッチを有する、挿入地点の25bp以内の配列も同定さ
れた(図4A~E)。この方法は、ここで調査された4種すべてのgRNAについて、す
べての既知の真正オフターゲット部位(図4に示されている既知のオフターゲット部位の
すべては、Fu et al., Nat Biotechnol. 2013からの表1にも示されている)ならびにこれ
までに知られていない多くのさらなるオフターゲット部位の発見にも成功した。
【実施例2】
【0057】
カスタマイズ可能なCRISPR-Cas RNA誘導型ヌクレアーゼ(RGN)は、
広範囲の研究および潜在的な臨床の適用を有する強力な、カスタマイズ可能なゲノム編集
試薬である1、2;しかし、ヒトにおけるRGNの治療的使用には、有害な結末のリスク
を最小限にするためにこれらのオフターゲット作用についての完全な知識が必要とされる
ことになる。化膿レンサ球菌(S. pyogenes)Cas9ヌクレアーゼによるDNA切断は
、プログラム可能な約100ntのガイドRNA(gRNA)によって指向される。タ
ーゲティングは、gRNAの5’末端にある17~20ntによって介され、これは、5
’-NGG型のプロトスペーサー隣接モチーフ(PAM)の隣にある「プロトスペーサー
」DNA部位と相補的である。非相同末端結合(NHEJ)による、プロトスペーサー内
のCas9で誘発されたDNA二本鎖切断(DSB)の修復は、可変長の挿入/欠失変異
(インデル)を誘発しうる。本発明者らのグループおよび他は、RGNで誘発された意図
されていないインデルが、プロトスペーサー内の5つもの部位によって異なるオフターゲ
ット切断部位で生じうること、または代替のPAM配列を有することを以前に示している
4~7。染色体転座は、RGNで誘発されたオンターゲットおよびオフターゲットの切断
事象の連結によって生じうる8~11。RGNを使用するex vivoおよびin-v
ivoでの治療戦略には、きわめて大きな細胞集団の修飾が必要とされることが予想され
るので、臨床的適用では、低頻度であっても変化の同定は、決定的に重要であろう。こう
した変化は好ましくない臨床的結末をもたらしうるので、細胞クローンのたとえまれなサ
ブセットにおいてでも癌化の誘導(例えば、腫瘍抑制遺伝子の変異を不活性化することま
たは腫瘍形成性染色体転座の形成)が特に懸念される。
【0058】
ゲノム内のどこにでも生じうるインデルまたは高次ゲノム再配列の包括的な同定は、簡
単には対処されない課題であり、残念なことに、生細胞におけるバイアスのない、ゲノム
ワイドな、RGNで誘発されたオフターゲット変異の同定のための高感度の方法はまだ記
載されていない12、13。全ゲノム再シークエンシングは、編集された単一細胞クロー
ンにおけるRGNオフターゲット変化を同定するための試みに使用されてきた14、15
。しかし、きわめて多数のゲノムをシークエンスする高いコストにより、この方法は、細
胞集団における低頻度の事象を見つけるのには非実用的とされる12。本発明者らおよび
他者は、オンターゲット部位に対する配列類似性4、5または部分的に変性した結合部位
ライブラリーからのin vitro選択のいずれかによって同定される潜在的なオフ
ターゲット部位におけるインデル変異を同定するために、焦点式ディープシークエンシン
グを使用してきた。しかし、これらのアプローチは、オフターゲット配列の性質について
の仮定を作るものであり、したがって、ゲノム内の他の場所の他の変異部位を見落とす可
能性がある。ChIP-Seqも、触媒的に不活性の(dead)Cas9(dCas9)と
複合体形成したgRNAについてのオフターゲット結合部位を同定するために使用されて
きたが、公表された研究の大多数は、これらの部位のうち、活性Cas9ヌクレアーゼに
よる切断のオフターゲット部位であるものは、たとえあるとしても、きわめて少ないこと
を示唆している16~19
【0059】
ここで、本発明者らは、ヒト生細胞における異なる10種のRGNについての最初の包
括的な特異性ランドスケープの作製を可能にする、シークエンシングによって評価される
ゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)のための新規な方法
の開発を記載する。これらのプロファイルにより、オフターゲットDSBの総数は、個々
のRGNについて広範に変化したことが明らかにされ、化膿レンサ球菌(S. pyogenes)
または他の種からのRGNの特異性についての広い結論は、大規模な調査に基づいていな
ければならず、少数のgRNAだけに基づいていてはならないことが示唆された。本発明
者らの発見は、オフターゲット作用がそこで生じうる配列の範囲および性質を拡大もさせ
た。直接的な比較により、GUIDE-Seqは、RGNオフターゲット部位を同定する
ための2つの広範に使用されるコンピュータのアプローチおよびChIP-Seq法より
も実質的に優れていたことが実証された。予想外なことに、GUIDE-Seqは、RG
Nで誘発されたDSBと一緒に、転座などの高次ゲノム変化に関与しうるRGN非依存性
のDNA切断点ホットスポットも同定した。最後に、本発明者らは、直接的な比較におい
て、gRNAの相補性領域をトランケートすることにより、それらのゲノムワイドなオフ
ターゲットDSBプロファイルが大きく改良されることを示しており、RGNの特異性を
改良するために設計された向上を評価するためのGUIDE-Seqの有用性を実証して
いる。ここに概説される実験は、RGNの特異性を評価するためにこれまでに記載された
中で、ならびに、治療的使用のために考慮されうる、プラットフォームに対するあらゆる
改良の中で、最も精密な戦略を提供する。
【0060】
方法
以下の材料および方法がこの実施例において使用された。
【0061】
ヒト細胞培養およびトランスフェクション
U2OSおよびHEK293細胞は、10% FBS、2mM GlutaMax(L
ife Technologies)、およびペニシリン/ストレプトマイシンを補った
Advanced DMEM(Life Technologies)中で5%のCO
と共に37℃で培養した。U2OS細胞(プログラムDN-100)およびHEK293
細胞(プログラムCM-137)は、Lonza Nucleofector 4-D上
で製造業者の説明書に従って20μlの溶液SE中でトランスフェクトした。dsODN
組み込み率は、NdeIを使用した制限断片長多型(RFLP)アッセイによって評価し
た。切断産物は、以前に記載されているように(Tsai et al., Nat. Biotechnol 32, 569
-576 (2014))、Qiaxcelキャピラリー電気泳動機器(Qiagen)によって泳
動および定量化した。
【0062】
GUIDE-SeqのためのゲノムDNAの単離および調製
ゲノムDNAは、固相可逆固定法磁気ビーズ(Agencourt DNAdvanc
e)を使用して単離し、Covaris S200超音波発生装置で500bpの平均長
に切断し、末端修復し、Aテール付加し、8ntの無作為な分子インデックスを組み込ん
でいる半機能的アダプターにライゲーションした。標的濃縮のために、オリゴタグと相補
的なプライマーでの、2ラウンドのネステッドアンカードPCRを使用した。例示的なG
UIDE-Seqプロトコールの全詳細は、本明細書中で見出すことができる。
【0063】
シークエンシングの読みの加工および統合
配列の最初の6つの同じ塩基ならびに同一の8ntの分子インデックスを共有する読み
は、それらが同じ起源のプレPCR鋳型断片に由来するとみなされるので、一緒にビニン
グされる。これらの読みは、各部位において大多数の塩基を選択することによって単一の
コンセンサスの読みに統合した。ノーコール(N)塩基は、10%より高い不一致の読み
を有する状況で割り当てた。塩基クオリティスコアは、予め統合された読みの間で最も高
くなるようにした。統合された読みは、BWA-MEM(Li and Durbin, Bioinformatic
s 26, 589-595 (2010))を使用してヒトゲノム参照(GrCh37)にマップした。
【0064】
オフターゲット切断部位の同定
マッピングのクオリティ≧50を有する読みの開始マッピング部位を表にし、10bp
のスライド式ウィンドウを使用して近くに開始マッピング部位を有する領域をグループ化
した。組み込まれたdsODNを有するゲノムウィンドウは、以下の判定基準のうちの1
つによって同定した:1)参照配列内の逆鎖に位置する2つ以上の固有の分子インデック
ス付加された読み、または2)フォワードおよびリバースプライマーによって増幅された
2つ以上の固有の分子インデックス付加された読み。推定された切断点の両側の側方の2
5bpの参照配列を目的の標的部位に対してアライメントし、目的の標的配列から8つ以
下のミスマッチを有するRGNオフターゲット部位を判定した。SNPおよびインデルは
、これらの部位において、分子インデックスおよびSAMtoolsに基づいたカスタム
ビンコンセンサスバリアント判定アルゴリズムによって判定し、参照配列と異なったオフ
ターゲット配列は、対応する細胞特異的な配列と置き換えた。
【0065】
AMPに基づいたシークエンシング
GUIDE-Seqで検出されたDSBのAMP検証のために、プライマーは、以前に
記載されているように(Zheng, Z. et al. Anchored multiplex PCR for targeted next-
generation sequencing. Nat Med 2014 Nov 10. doi: 10.1038/nm.3729 (2014))、推定
された二本鎖切断点の側方の領域に設計し、8ntの分子インデックスを付加した。可能
な場合には、本発明者らは、各DSBの側方に位置するように2つのプライマーを設計し
た。
【0066】
AMP検証データの解析
平均クオリティスコア>30を有する読みは、GUIDE-Seqで推定されたDSB
部位とオーバーラップした挿入、欠失、および組み込みについてPythonを使用して
解析した。PCRまたはシークエンシングの誤りからのノイズが入るのを最小限にするた
めに、1bpのインデルは、それらが予測されたDSB部位の1bp以内であった場合の
みに含めた。組み込みおよびインデルの頻度は、統合された分子インデックス付加された
読みに基づいて算出した。
【0067】
構造的バリエーション
転座、大きな欠失、および逆位は、スプリットBWA-MEMアライメントに基づいた
カスタムアルゴリズムを使用して同定した。同一染色体上の50塩基以内の候補の融合切
断点は、Cas9切断部位の周囲の潜在的な切断を含むようにグループ化した。融合事象
は、独自にマップされた少なくとも3つのスプリットの読みで判定し、パラメーターもs
egemehlツールにより使用した(Hoffmann, Genome biology, 2014))。マッピン
グストランデッドネスは、2つの関与しているDSBの間の相互融合の同定のため、およ
び欠失または逆位を決定するために維持した。1kbの染色体部位内にDSBを含む融合
は、単一のCas9切断によって引き起こされる大きなインデルが考えられるために無効
とした。残りの融合DSBは、以下の4つのカテゴリーに分類した:GUIDE-seq
に基づく「オンターゲット」、「オフターゲット」もしくは「バックグラウンド」、また
は他に「その他」。
【0068】
GUIDE-SeqおよびChIP-Seqによって検出される部位ならびにコンピュー
タ上での予測の比較
本発明者らは、MIT CRISPR Design Toolを使用して、10種す
べてのRGNについての潜在的なオフターゲット部位を同定した。このツールは、それぞ
れの潜在的なオフターゲット部位に、対応する百分位数を定める。本発明者らは、次いで
、これらの百分位数を可視化目的で五分位群にグループ化した。E-CRISPツールは
オフターゲットをランク付けしないので、本発明者らは、単純に、E-CRISPによっ
て正確に予測されたGUIDE-seqオフターゲットを見つけた。これらのGUIDE
-Seq対コンピュータ上での予測の両方について、本発明者らは、さらに、コンピュー
タ上での方法によって予測されなかったGUIDE-Seq結果を、MITツール(最大
4つ)およびECRISPR(最大3つ)の範囲内のミスマッチ数を有するオフターゲッ
ト、ならびにこれらの予測ツールの閾値を超えるミスマッチ数を有するものに分割した。
ChIP-Seq予測とのGUIDE-Seqオフターゲットの比較において、同じ技術
を使用し、ChIP-Seqによって正確に予測されたGUIDE-Seqオフターゲッ
トを見つけた。これらの比較のそれぞれについて、なされたすべてのグループ化は、オフ
ターゲットミスマッチ数によって再分割し、正しくおよび誤って予測されたRGNオフタ
ーゲットの特性をより良好に特徴付けした。
【0069】
オフターゲット切断率に対する、ミスマッチ、DNAアクセシビリティおよび局所的PA
M密度の影響の解析
本発明者らは、推定される切断率に適合した線形回帰モデルを使用して、4つ以下のミ
スマッチを有する潜在的なオフターゲット部位において特異性に対する、ミスマッチ部位
、ミスマッチ型およびDNAアクセシビリティの影響を評価した。ミスマッチ部位の共変
動は、PAMの上流のオーバーラップしていない5つの4bpのウィンドウのそれぞれの
中のミスマッチされた塩基の数として定義した。ミスマッチ型の共変動は、i)(標的T
がCによって置き換えられ、標的GがAによって置き換えられた)ゆらぎ対形成を結果と
して生じるミスマッチの数、ii)(標的CがTによって置き換えられ、標的AがGによ
って置き換えられた)非ゆらぎプリン-ピリミジン塩基対形成を結果として生じるミスマ
ッチの数、およびiii)プリン-プリンまたはピリミジン-ピリミジン対形成を結果と
して生じるミスマッチとしての数と定義した。
【0070】
3つの因子のそれぞれは、別々のモデルにおいて、log(1+GUIDE-Seq
読み数)によって推定される、相対切断率の予測因子として使用した。作用の大きさの推
定は、標的部位間変動性のために調整した。各因子によって説明されるサイト内切断率変
動性の比率は、回帰平方和(SS)に基づく偏イータ二乗統計:η =SSfacto
/(SSfactor+SSerror)によって評価した。一因子モデルに加えて、
本発明者らは、3つすべての因子、発現レベル、および1kbのウィンドウ内のPAM密
度を含む組み合わされた線形回帰モデルも適合させて、オフターゲット切断可能性に対す
るそれらの独立した寄与を評価した。
【0071】
Guide-seqライブラリー調製のための例示的な試薬および装置
室温で保存
品目 販売会社
Covaris S220マイクロチューブ、 Covaris
エタノール、200プルーフ(100%) Sigma Aldrich
MicroAmp Optical 96ウェルプレート Applied Bios
ystems
ヌクレアーゼ非含有HO Promega
Qubitアッセイチューブ、500チューブ/パック Invitrogen
Qubit dsDNA BRキット-500アッセイ Invitrogen
TMACバッファー、5M Sigma Aldrich
- 塩化テトラメチルアンモニウム
1×TEバッファー/10mM トリス-HCl、pH8.0 Invitrogen
UltraPure 0.5M EDTA、pH8.0(Gibco)(4×100m
L) Life Technologies
【0072】
4℃で保存
品目 販売会社
Agencourt AMPure XPビーズ - 60mL Beckman C
oulter
【0073】
-20℃で保存
品目 カタログ#
25mM dNTP溶液ミックス Enzymatics,Inc.
Slowライゲーションバッファー Enzymatics,Inc.
末端修復ミックス(低濃度) Enzymatics,Inc.
T4 DNAリガーゼ Enzymatics,Inc.
- 10× T4 DNAリガーゼバッファー(Slowライゲーションバッファ
ー)
Platinum(登録商標)Taq DNAポリメラーゼ Life Techno
logies
- 10× PCRバッファー(MgClなし)
- 50mM MgCl
qPCR Illuminaライブラリー定量化キット KAPA Biosyste
ms,Inc.
【0074】
機器
96ウェルプレート磁気スタンド Invitrogen
Qubit蛍光光度計2.0 Life Technologies
Covaris S-2 Focused Ultra-sonicator(商標)
機器 Covaris
卓上遠心分離機 Thermo Scientific
卓上ボルテクサー Thermo Scientific
サーモサイクラー Eppendorf
Miseq Illumina
【0075】
GUIDE-seqライブラリー調製のための例示的なプロトコール
Yアダプター調製
Yアダプターは、Miseq共通オリゴを試料バーコードアダプター(A01からA1
6、表3を参照されたい)のそれぞれとアニールすることによって作製される。アダプタ
ーは、8merのNNWNNWNN(N=A、C、T、またはG;W=AまたはT)分子
インデックスも含む。
1×TEバッファー 80.0μL
A##(100μM) 10.0μL
MiSeq Common Adapter_MI(100μM) 10.0μL
合計 100.0μL
アニーリングプログラム:95℃1秒間;60℃1秒間;4℃まで緩徐な傾斜の低下(
約-2℃/分);4℃で維持する。-20℃で保存する。
【0076】
インプット定量化および切断
1. dsDNAは、Qubitによって定量化され、1×TEバッファーを使用して
400ngが120ulの最終容量にされる。
2. 各試料は、Covaris S2のための標準操作プロトコールに従って500
bpの平均長に切断される。
3. 120ulのAMPure XP SPRIビーズ(1×比率)での精製は、製
造業者のプロトコールに従って行い、15ulの1×TEバッファー中に溶出される。
【0077】
末端修復、A-テーリングおよびライゲーション
末端修復
4. 200μLのPCRチューブまたは96プレート中のウェルに、以下を(反応ごと
に)添加する:
ヌクレアーゼ非含有HO 0.5μL
dNTPミックス、5mM 1.0μL
SLOWライゲーションバッファー、10× 2.5μL
末端修復ミックス(低濃度) 2.0μL
Taqポリメラーゼ用のバッファー、10×(Mg2+なし) 2.0μL
Taqポリメラーゼ(非ホットスタート) 0.5μL
合計 8.5μL
+(前のステップからの)DNA試料 14.0μL
合計 22.5μL
末端修復サーモサイクラープログラム:12℃15分間、37℃15分間;72℃15
分間;4℃で維持する
【0078】
アダプターライゲーション
5. 試料反応チューブまたはウェルに、以下の試薬を順番に添加する(ピペッティング
によって混合する):
アニールされたY adapter_MI(10μM) 1.0μL
T4 DNAリガーゼ 2.0μL
+(前のステップからの)DNA試料 22.5μL
合計 25.5μl
アダプターライゲーションサーモサイクラープログラム:16℃30分間、22℃30
分間、4℃で維持する
6. 0.9× SPRI clean(22.95ul Ampure XPビーズ)
、12uLの1×TEバッファー中に溶出
【0079】
PCR
PCR1(オリゴタグプライマー[発見]または大規模なプライマープール[ディープシ
ークエンシング検証])
7. 以下のマスターミックスを調製する:
ヌクレアーゼ非含有HO 11.9μL
Taqポリメラーゼ用のバッファー、10×(MgClなし) 3.0μL
dNTPミックス、10mM 0.6μL
MgCl、50mM 1.2μL
Platinum Taqポリメラーゼ、5U/μl 0.3μL
GSP1プライマー(10uM)/プライマープール() 1.0μL
TMAC(0.5M) 1.5μL
P5_1、10μM 0.5μL
合計 20.0μL
+(ステップ6からの)DNA試料 10.0μL
合計 30.0μL
発見用には、+/(センス)および-/(アンチセンス)反応について別々のマ
スターミックスを作製して、別々のPCR反応を行う。
ディープシークエンシング検証用には、1種のマスターミックスが作製されうる
。プライマープールは、30ulの反応物中に30pmolの総量に標準化されるべきで
ある。
発見サーモサイクラープログラム(タッチダウン):
95℃5分間、
15サイクルの[95℃30秒間、70℃(-1℃/サイクル)2分間、72℃30
秒間]、
10サイクルの[95℃30秒間、55℃1分間、72℃30秒間]、
72℃5分間、
4℃維持
検証サーモサイクラープログラム:
95℃5分間、
14サイクルの[95℃30秒間、20%の傾斜で65℃まで下げる、65℃5分間
]、
72℃5分間、
4℃維持
8. 1.2× SPRI clean(36.0uL)、15ulの1×TEバッファ
ー中に溶出
【0080】
PCR2(オリゴタグプライマー[発見]または大規模なプライマープール[ディープシ
ークエンシング検証])
9. 以下のマスターミックスを調製する:
ヌクレアーゼ非含有HO 5.4μL
Taqポリメラーゼ用のバッファー、10×(Mg2+なし) 3.0μL
dNTPミックス、10mM 0.6μL
MgCl、50mM 1.2μL
Platinum Taqポリメラーゼ、5U/μL 0.3μL
GSP2プライマー(10uM)/プライマープール() 1.0μL
TMAC(0.5M) 1.5μL
P5_2、10μM 0.5μL
合計 13.5μL
+P7_#(10uM) 1.5μL
+(ステップ8からの)ビーズ付きのDNA試料 15.0μL
合計 30.0μL
プライマー濃度は、PCR1に記載の詳細に従うべきである
P7_#では、Illuminaシークエンサー上での良好な画像記録のために、1
つのシークエンシング泳動において少なくとも4種は使用されるべきである(例えば、P
701~P704またはP705~P708)
発見サーモサイクラープログラム(タッチダウン):
PCR1用と同じ
検証サーモサイクラープログラム:
PCR1用と同じ
10. 0.7× SPRI clean(21.0uL)、30uLの1×TEバッフ
ァー中に溶出
【0081】
qPCRによるライブラリー定量化およびシークエンシング
qPCR定量化
11. 製造業者の説明書に従って、Illuminaライブラリー定量化キット用のK
apa Biosystemsキットを使用してライブラリーを定量化する。
【0082】
標準化およびシークエンシング
12. 各試料についてqPCR操作によって得られる1uLあたりの分子の数の平均量
推定値を使用して、全セットのライブラリーを1.2×10^10分子に標準化すること
を行ない、シークエンシング用に一緒にプールされるライブラリーの数によって分割する
。これは、各試料についての分子によるインプット、およびさらに、各試料についての容
量によるインプットを与えることになる。
プーリング後、Vacufugeでライブラリーをシークエンシング用に10uLの最
終容量までSpeedvac(乾燥減量)する。
ライブラリーを変性させ、Illumina Miseq試薬キットV2-300サイ
クル(2×150bp対末端)でのシークエンシングのために、以下を除き、Illum
ina標準プロトコールに従ってMiseq上にロードする:
1)3ulの100μMのカスタムシークエンシングプライマーIndex 1をMi
seq試薬カートリッジ部位13に添加する(Indexプライマーミックス)。3ul
の100μMのカスタムシークエンシングプライマーRead 2をMiseq試薬カー
トリッジ部位14に添加する(Read 2プライマーミックス)。
2)対末端Nexteraシークエンシングプロトコールで以下の数のサイクル「15
1|8|16|151」でシークエンスする。
下流のバイオインフォマティクス解析のために関連する管路に対してbclまたはfas
tqフォーマットのいずれかでシークエンシングデータを出す。
【0083】
【表2-1】
【0084】
【表2-2】
【0085】
結果
例示的なGUIDE-Seq法の概要
一部の実施形態では、GUIDE-Seqは、2つのステージからなる(図5B):ス
テージIでは、ヒト生細胞のゲノム内のDSBが、これらの切断における平滑末端二本鎖
オリゴデオキシヌクレオチド(dsODN)の組み込みによってタグ付けされる。ステー
ジIIでは、バイアスのない増幅および次世代シークエンシングを使用して、ゲノムDN
A内のdsODN組み込み部位がヌクレオチドレベルで正確にマップされる。
【0086】
ステージIのために、本発明者らは、ヒト細胞においてRGNで誘発されたDSBの中
に平滑末端の、5’リン酸化されたdsODNを組み込む条件を最適化した。最初の実験
では、本発明者らは、こうしたdsODNがRGNで誘発されたDSB中に組み込まれる
のを観察するのに失敗した。細胞内でオリゴを安定させるために設計された両方のDNA
鎖の5’末端に2つのホスホチオレート結合を有するdsODN20を使用して、本発明
者らは、適度な検出可能な組み込み頻度だけを観察した(図5B)。しかし、両鎖の3’
末端でのホスホチオレート結合の付加は、強力な組み込み効率をもたらした(図5B)。
これらの組み込み率は、これらの部位においてRGNのみによって(すなわち、dsOD
Nの非存在下で)誘発されるインデルの頻度よりも2分の1から3分の1低いだけであっ
た。
【0087】
ステージIIのために、本発明者らは、組み込まれたdsODNを有する断片のみを、
バイアスのない様式で、選択的に増幅およびシークエンスすることを可能にする新規戦略
を開発した(図5A)。本発明者らは、dsODN、およびRGN成分をコードしている
プラスミドがトランスフェクトされた細胞からの無作為に切断されたゲノムDNAに最初
に「単一テール」次世代シークエンシングアダプターをライゲーションすることによって
、これを達成した。本発明者らは、次いで、dsODNに特異的にアニールする1つのプ
ライマーおよびシークエンシングアダプターにアニールするもう1つのプライマーによっ
て開始される一連のPCR反応を行った(図5Aおよび図12)。シークエンシングアダ
プターが単一テールのみ付加されているので、これは、他の方法、例えば直線的増幅を介
する(LAM)-PCR21、22などに特有のバイアスなしで、dsODNに隣接した
配列の特異的な一方向の増幅を可能にする。本発明者らは、我々の戦略を単一テールアダ
プター/タグ(single-tail adapter/tag:STAT)-PCR法と称する。dsODN
鎖のそれぞれにアニールするプライマーを使用してSTAT-PCR反応を行うことによ
り、本発明者らは、それぞれの組み込まれたタグの両側上の隣接ゲノム配列の読みを得る
ことができた(図5C)。増幅プロセス中の無作為な8bpの分子バーコードの組み込み
図12)により、PCRバイアスの修正が可能となり、それによって、ハイスループッ
トシークエンシングから得られた固有のシークエンシングの読みの正確な定量化が可能と
なる。
【0088】
ヒト細胞におけるCRISPR RGNのゲノムワイドなオフターゲット切断プロファイ

本発明者らは、U2OSまたはHEK293ヒト細胞系のいずれかにおいて、Cas9
、および多様な内在性ヒト遺伝子を標的とする異なる10種のgRNAでGUIDE-S
eqを行った(表1)。dsODN組み込み部位を解析すること(方法)によって、本発
明者らは、ヌクレオチドレベルまでマップされた、10種のRGNのそれぞれによって誘
発されたDSBの正確なゲノム部位を同定することができた(図5D)。これらのゲノム
ウィンドウのうちの>80%については、本発明者らは、オンターゲット部位であるまた
はそれに関連するいずれかの重複標的配列を同定することができた(方法)。興味深いこ
とに、各RGNについて本発明者らが同定したオフターゲット部位の総数は広範に変化し
、ゼロから>150までの範囲に及び(図5E)、いずれの特定のRGNについても望ま
しくない切断のゲノムワイドな程度が極端に多くまたは少なくなりうることが示された。
本発明者らは、(1から6つのミスマッチを有するゲノム部位の総数によって測定される
ような)ヒトゲノムに対するgRNAプロトスペーサー配列の直交性と、GUIDE-S
eqによって本発明者らが観察したオフターゲット部位の総数との間にいかなる明らかな
相関も観察しなかった(図5F)。オフターゲット配列は、ゲノムの全体にわたって分散
して見出され(図5Ggおよび図13A~J)、エクソン、イントロン、および非コード
遺伝子間領域において減少する(図5H)。本発明者らが同定したオフターゲット配列の
中に含まれていたのは、すべてRGNのうちの4種についての既知の真正のオフターゲッ
ト部位4、5であった(図6A~J)。さらに重要なことには、GUIDE-Seqは、
ヒトゲノムの全体にわたって位置する、多数の新しい、これまでに知られていないオフタ
ーゲット部位を同定した(図5E、5G、6A~Jおよび13A~J)。
【0089】
【表3】
【0090】
本発明者らは、次に、(図6A~Jに示される)GUIDE-Seqによって同定され
た各オフターゲット部位についてのシークエンシングの読みの数が、RGNのみによって
(すなわち、dsODNの非存在下で)誘発されるはずであったインデルの相対頻度の代
わりになっているかどうかを試験した。ヌクレアーゼ成分が発現されたヒトU2OS細胞
における5種のRGNについての、アンカードマルチプレックスPCR(AMP)に基づ
いた次世代シークエンシング(方法)によるこれらの部位の試験より、>80%(132
からの106)がRGN切断に特徴的な可変長のインデルを有していたことが示され、G
UIDE-Seqが真正のRGNオフターゲット部位を同定するという本発明者らの結論
がさらに支持される(図7A)。検出されたインデル頻度の範囲は、0.03%から60
.1%までの範囲に及んだ。重要なことに、本発明者らは、5つすべてのRGNオフター
ゲット部位についてGUIDE-Seqの読み数とインデル変異頻度との間に陽性の直線
的相関を認めた(図7A~F)。したがって、本発明者らは、所与の部位についてのGU
IDE-Seqの読み数が、RGNによるその配列の切断効率の定量的尺度を表すと結論
する。
【0091】
RGNで誘発されるオフターゲット配列特性の解析
10種すべてのRGNについてのGUIDE-Seqによって本発明者らが同定したオ
フターゲット部位の視覚的検査により、RGNがそこで切断可能なバリアント配列の多様
性が強調される。これらの部位は、プロトスペーサー配列内の6つものミスマッチ(最大
7つのミスマッチを有する部位のin vitroの切断を示している以前の報告と一
致する)、非標準PAM(以前に記載されているNAGおよびNGA配列5、23だけで
なく、新規なNAA、NGT、NGC、およびNCG配列も)、およびgRNA/プロト
スペーサー境界面での1bpの「バルジ」型ミスマッチ24を有しうる(図6A~J)。
プロトスペーサーミスマッチは、標的部位の5’末端に生じる傾向にあるが、特定の3’
末端部位でも見出されることがあり、部位に基づいてミスマッチ作用を予測するための簡
単な法則はないという考えが支持される。興味深いことに、一部のオフターゲット部位
は、実際に、それらの適合したオンターゲット部位よりも高いシークエンシング読み数を
有し(図6A~D、6J)、オフターゲット変異頻度は、特定の場合において、目的のオ
ンターゲット部位でのものよりも高くなりうるという本発明者らの以前の知見と一致し
ている。特に、RGNのうちの4種についての既知のオフターゲット部位の多くは、高い
読み数を有し(図6A~D)、以前の解析は、最も効率良く切断される部位を主に同定し
ていたことが示唆される。
【0092】
10種すべてのRGNにおける本発明者らのGUIDE-Seqデータの定量的解析は
、本発明者らが異なる可変のもの、例えば、オフターゲット部位切断におけるミスマッチ
数、位置、および型などの寄与および影響を定量化するのを可能にした。本発明者らは、
RGNによって切断される特定の数のプロトスペーサーミスマッチを有する全ゲノム部位
の割合は、ミスマッチの数の増大と共に低下することを見出した(図8A)。さらに、シ
ークエンシングの読み数は、ミスマッチの数の増大と共に全体的な下降傾向を示す(図8
B)。一般に、標的部位の5’末端のより近くに位置するプロトスペーサーミスマッチは
、3’末端のより近くのものよりもGUIDE-Seqの読み数におけるより小さい減少
と関連する傾向にあるが、PAMから1から4bp離れて位置するミスマッチは、驚くべ
きことに、5から8bp離れて位置するものよりもいくらか良好な耐容性を示す(図8C
)。興味深いことに、ミスマッチの性質も、GUIDE-Seqの読み数に対する影響に
関連する。ゆらぎミスマッチは、オフターゲット部位において頻繁に生じ、本発明者らの
解析は、それらが、他の非ゆらぎミスマッチよりもより小さい、GUIDE-Seqの読
み数に対する影響に関連することを示唆している(図8D)。これらの結果と一致して、
本発明者らは、一変量回帰分析においてオフターゲット切断における最も程度の大きいバ
リエーションを説明する単一因子が、ミスマッチ数、部位、および型であることを見出し
ている。対照的に、近位PAM配列の密度、遺伝子発現レベル、またはゲノム位置(遺伝
子間/イントロン/エクソン)などの他の因子は、GUIDE-Seq切断読み数におい
てきわめてより小さな割合の相違を説明する(図8E)。ミスマッチ部位、ミスマッチ型
、遺伝子発現レベル、および近位PAM配列の密度を含む複数の因子を考慮した組み合わ
された線形回帰モデルは、一変量分析と一致した結果を得た(図14)。この分析により
、本発明者らは、それぞれのさらなるゆらぎミスマッチがオフターゲット切断率を、平均
において、かつそれらの部位に依存して、約2分の1~3分の1だけ低下させるのに対し
て、さらなる非ゆらぎミスマッチは切断率を約3分の1だけ低下させることを独立的に推
定することも可能となった(図14)。
【0093】
既存のオフターゲット予測法でのGUIDE-Seqの比較
GUIDE-Seqの効力が確立されたので、本発明者らは、次に、オフターゲット変
異部位を予測するための以下の2つの普及している既存のコンピュータの方法との本発明
者らの新しい方法の直接的な比較を行った:MIT CRISPR Design To
ol25(crispr.mit.edu)およびE-CRISPプログラム26(ww
w.e-crisp.org/E-CRISP/)。これらの両方のプログラムは、ミス
マッチ数および部位についての特定の「法則」に基づいて潜在的なオフターゲット部位を
同定することを試みるものであり、これまでの刊行物においてオフターゲット部位を同定
するために使用されてきた。GUIDE-Seqによって本発明者らが特徴付けした10
種のRGNを使用した本発明者らの比較において、本発明者らは、両方のプログラムが、
実験的に検証されたオフターゲット部位のきわめて大多数を同定できなかったことを見出
した(図9A~B)。これらの部位の多くは、E-CRISPおよびMITプログラムが
、単に、それぞれ3つおよび4つを超えるミスマッチを有するオフターゲットを考慮しな
いので見落とされた(図9C~D)。考慮された配列の中でも、これらのプログラムは、
依然として真正のオフターゲット部位の大多数を同定することができず(図9C~D)、
切断が生じることになるまたは生じないことになるか否かを決定する因子を説明するため
のこれらの現在限られた能力を強調している。MITプログラムによって割り当てられた
ランク付けスコアは、それが正確に同定する部位の中でいくらかの予測的能力を有するが
、特に、見落とされた部位が、わずか1つのミスマッチを有するものを含むことは留意す
べきことである(図9C~D)。最後に、両方のプログラムが、GUIDE-Seqによ
って同定されない多くの「偽陽性」部位を出すことに留意することは重要である(図9A
~B)。本発明者らは、MITおよびE-CRISPの両方が、真正のRGNオフターゲ
ット部位の同定において本発明者らのGUIDE-Seq法よりも実質的に低い有効性で
機能すると結論する。
【0094】
dCas9結合部位の決定についてのChIP-Seq法とのGUIDE-Seqの比較
本発明者らは、RGNオフターゲット部位の同定について、GUIDE-Seqを、以
前に記載されているChIP-Seq法と直接に比較することも探求した。本発明者らが
GUIDE-Seqによって評価したRGNのうちの4つは、オフターゲット結合部位の
大規模なセットの同定につながった、触媒的に不活性なCas9(dCas9)でのCh
IP-Seq実験において以前に特徴付けされていたgRNA18を使用した。直接的な
比較により、GUIDE-Seqによって同定されたCas9オフターゲット切断部位と
、ChIP-Seqによって同定されたdCas9オフターゲット結合部位との間できわ
めて少ない重複しか示されない;4種のgRNAについて本発明者らが同定した、RGN
で誘発された149個のオフターゲット切断部位の中で3つだけが、以前に公表された同
じgRNAを使用したdCas9 ChIP-Seq実験によって以前に同定されている
ものであった(図9E)。この重複の欠如は、dCas9オフターゲット結合部位がCa
s9オフターゲット切断部位とは基本的に異なるからである可能性が高く、本発明者らの
データによって支持される仮説は、GUIDE-Seqによって同定されたこれらの4種
のgRNAについてのCas9オフターゲット切断部位が、ChIP-Seq(図9F
および、きわめて少ないdCas9結合部位が活性Cas9の存在下でインデルの証拠を
示すことを示している、以前の研究の結果16~19によって同定されたそれらの結合部
位よりも平均ではるかに少ないミスマッチを有することを示している。GUIDE-Se
qは、ChIP-Seqによって以前に同定された4つのオフターゲット部位を同定する
ことができず、かつ次いで、Cas9による変異生成の標的であることが示されたが、本
発明者らは、これは、それらの部位がその以前の研究18において真正のオフターゲット
切断部位として誤って同定されたからであると考えている。その研究からのシークエンシ
ングデータの注意深い解析により、それらの部位において見出されたインデル変異のきわ
めて大多数は、RGN切断活性によってではなく、PCRまたはシークエンシングの誤り
によって代わりに生じた可能性が高いことが示唆される(図15A~D)。まとめると、
これらの発見により、GUIDE-Seqが、真正のオフターゲット切断部位の同定につ
いてChIP-Seqよりも実質的に優れていることが実証され、ChIP-Seqによ
って発見された(たとえあるとしても)きわめて少ないdCas9オフターゲット結合部
位が実際のCas9オフターゲット切断部位を表すという考えについての実験的支持が得
られる。
【0095】
GUIDE-Seqによるヒト細胞におけるRGN非依存性DSBホットスポットの同定
本発明者らのGUIDE-Seq実験は、本発明者らの研究のために使用されたU2O
SおよびHEK293細胞における合計30個の固有のRGN非依存性DSBホットスポ
ットの存在も予想外に明らかにした(表2)。本発明者らは、RGNをコードしているプ
ラスミドなしでdsODNのみをトランスフェクトしたU2OSおよびHEK293細胞
での対照実験からのゲノムDNAを解析するときには、これらの部位を明らかにした(方
法)。特異的な塩基対部位に正確に位置するRGNで誘発されたDSBとは対照的に、R
GN非依存性DSBは、それらが生じるそれぞれの座位においてより広く分散したdsO
DN組み込みパターンを有する(方法)。これらの30個の切断点ホットスポットは、多
くの染色体にわたって分布していて、セントロメアもしくはテロメア領域にまたはその近
くに存在するように見えた(図10F)。興味深いことに、少数のこれらのDSB(2つ
)のみが両方の細胞系に共通であって、大多数は細胞系特異的であるようであった(U2
OSにおける25つおよびHEK293細胞における7つ;図10Fおよび表2)。知る
限りでは、GUIDE-Seqは、ヒト生細胞において、直接的でかつバイアスのない、
切断点ホットスポットの同定を、それらの存在を明らかにするために潜在的に有毒な薬剤
(例えば、アフィジコリンなどのDNA複製阻害剤)を必要とすることなく、可能にする
最初の方法である。
【0096】
【表4】
【0097】
大規模なゲノム再編成におけるRGNで誘発されたDSBおよびRGN非依存性DSBの
両方の関与
RGNで誘発されたDSBおよびRGN非依存性DSBにおけるインデルを同定するた
めに設計された本発明者らの次世代シークエンシング実験の結果を解析する過程において
、本発明者らは、これらの切断の一部が、転座、逆位および大きな欠失に関与しうること
も発見した。使用されたAMP法により、本発明者らがこれらの大規模なゲノムの変化を
観察することが可能となった。これは、調査される各DSB部位について、この方法では
、1対の隣接座位特異的なプライマーではなく、ただ1つの固定された末端にアンカーさ
れる、座位特異的なネステッドプライマーのみが使用されるからである(図10A)。し
たがって、AMPに基づいたシークエンシングは、DSBにおいてインデル変異が生じて
いるかどうかを同定するだけでなく、DSBが別の配列に結合されているかどうかも検出
することができる。
【0098】
本発明者らが調査した5種のRGNについて、AMPシークエンシングにより、RGN
で誘発されるオンターゲットおよびオフターゲットのDSBが多様な転座に関与しうるこ
とが明らかにされた(図10B)。少なくとも1つの場合において、本発明者らは、1対
のDSBから結果として生じる4種すべての起こりうる転座事象を観察することができた
図10C)。2つのDSBが同じ染色体上に存在した場合に、本発明者らは、大きな欠
失および逆位も観察した(図10B)。少なくとも1つの場合では、本発明者らは、RG
Nで誘発された2つの切断間の大きな欠失ならびに同じ介在性配列の逆位の両方を観察し
た(図10D)。重要なことに、本発明者らの結果は、RGNで誘発されたDSBとRG
N非依存性DSBとの間の転座(および欠失または逆位)も明らかにし(図10B)、細
胞ゲノムに対するRGNのオフターゲット作用を評価するときに、これらの2つの型の切
断の間の相互作用が考慮される必要があることが示唆された。本発明者らのデータは、こ
れらの大規模なゲノム再編成の頻度がきわめて低くなる可能性が高いことを示唆している
が、正確な定量化は、本発明者らの既存のデータセットのシークエンシングの深さではで
きなかった。シークエンシングの読みの数を増やすことにより、検出の感度が高められ、
これらの重要なゲノムの変化のより良好な定量化が可能となるはずである。
【0099】
トランケートされたgRNAによって指向されるRGNのGUIDE-Seqプロファイ

本発明者らのグループによる以前の研究は、全長gRNAs27によって指向されるR
GNの既知のオフターゲット部位におけるトランケートされた17または18ntの相補
性領域を有するgRNAの使用により、変異頻度が低下されうることを示している27
しかし、この解析は少数の既知のオフターゲット部位に限定されていたので、これらのト
ランケートされたgRNA(tru-gRNA)のゲノムワイドな特異性は、本発明者ら
の以前の実験では不明確なままであった。本発明者らは、3種のtru-gRNAによっ
て指向されるRGNのゲノムワイドなDSBプロファイルを得るためにGUIDE-Se
qを使用したが、そのそれぞれは、本発明者らが上記でアッセイした10種の全長gRN
Aのうちの1つのより短いバージョンである。
【0100】
本発明者らの結果は、3つのすべての場合において、GUIDESeqによって同定さ
れるオフターゲット部位の総数は、tru-gRNAの使用で実質的に減少されたことを
示している(図11A~D)。GUIDE-Seqの読みのマッピングにより、本発明者
らが、オンターゲット(図11E)およびオフターゲット(図示せず)部位の切断位置を
正確に同定することが可能となった。予想されたように、かつ本発明者らが全長gRNA
で観察したように、オフターゲット部位のリストに含まれていたのは、3種のtru-g
RNAによって指向されるRGNについての12個の既知のオフターゲット部位のうちの
10個であった(図11F~H)。本発明者らが同定したオフターゲット部位の配列は、
プロトスペーサー内に1つまたは2つのミスマッチを主に有していたが、一部の部位は、
4つも有していた(図11F~H)。さらに、一部の部位は、NAG、NGA、およびN
TGの形態の代替のPAM配列を有していた(図11F~H)。これらのデータは、gR
NAのトランケーションがRGNのオフターゲット作用を実質的に低減できることのゲノ
ムワイドな規模での確認を可能にし、RGNプラットフォームについての特異性の向上を
評価するためにGUIDESeqが使用されうる方法を示す。
【0101】
考察
GUIDE-Seqは、RGNで誘発されたDSBを検出するための、バイアスのない
、高感度、かつゲノムワイドな方法を可能にする。該方法は、オフターゲット部位の性質
についての仮説をたてること(例えば、オフターゲット部位が配列においてオンターゲッ
ト部位に密接に関連すると推定すること)なくDSBを検出するのでバイアスがない。G
UIDE-Seqは、エクソン、イントロン、および遺伝子間領域内を含む、オフターゲ
ット部位をゲノムワイドに同定し、最大6つのプロトスペーサーミスマッチおよび/また
は、以前の研究5、23に記載されている代替のNAGおよびNGA配列以外の、新しい
ミスマッチのPAM部位を有していた。この実施例において本発明者らが調査したRGN
では、GUIDE-Seqにより、すべての既知のオフターゲット部位の同定が成功した
だけでなく、何百もの新しい部位も同様に明らかにされた。
【0102】
ヒト細胞においてすべてのRGNオフターゲット部位を包括的に同定するための実際的
な黄金標準方法が現在ないことにより、本発明者らはGUIDE-Seqの確実性を有す
る感度を知ることができなくなっているが、本発明者らは、以下の理由で、それが低い偽
陰性率を有する可能性がきわめて高いと考えている:第一に、RGNで誘発された平滑末
端化されたすべてのDSBは、平滑末端化されたdsODNをNHEJによって取り込む
はずであり、仮説は、GUIDE-Seqの読み数(これはdsODNの取り込みを測定
する)とRGNの存在下におけるインデル頻度(これはDSB形成およびそれらのうちの
変異誘発性修復の率を測定する)との間で本発明者らが観察する強い相関によって支持さ
れた(図7B~F)。本発明者らは、これらの相関が、広範囲のインデル変異生成頻度を
示す130を超える部位を含むことを注記する。第二に、以前に同定されたオフターゲッ
ト部位をベンチマークとして使用して(これは、現在、成功を判断する唯一の方法である
)、GUIDE-Seqは、0.12%の低さまで広がっている一範囲の変異生成頻度を
示す40個のこれらの部位のうちの38個を検出することができた。この方法は、4種の
全長gRNAについての28個すべての既知のオフターゲット部位および3種のtru-
gRNAについての12個の既知のオフターゲット部位のうちの10個を検出した。検出
されなかった2つのオフターゲット部位のうちの1つは、本発明者らの生のデータにおい
て捕捉の証拠を示したが、シークエンシングの読みが一方向だけであってかつただ1つの
プライマーに由来していたので本発明者らの読みの判定アルゴリズムによって除かれた(
方法)。(この部位についての二方向のマッピングの読みがないのは、読みを正確にマッ
プすることを難しくさせている片側のオフターゲット部位上の反復領域が原因である可能
性があった。)他の検出されないオフターゲット部位は以前に記載されている。
【0103】
重要なことに、本発明者らが評価したRGNのうちの1つは、(GUIDE-Seq法
の現在の検出限界で)いかなる検出可能なオフターゲット作用も生じず、一部のgRNA
がきわめて少ない望ましくない変異を誘導する、またはおそらく全く誘導しない、という
興味深い可能性を高めた。
【0104】
本発明者らの検証実験は、GUIDE-Seqが、0.1%という低い頻度でRGNに
よって変異誘発されるオフターゲット部位を感度良く検出できることを示しているが、そ
の検出能力は、いくらかの簡単な変更でさらに改良されうる。インデルを検出するために
次世代シークエンシングを使用する戦略は、プラットフォームの誤り率(典型的には約0
.1%)によって制限される。対照的に、GUIDE-Seqは、インデルではなくds
ODN挿入部位を同定するためにシークエンシングを使用し、したがって、誤り率によっ
て制限されるのではなく、シークエンシングの深さによって制限される。例えば、本発明
者らは、本発明者らのシークエンシング検証実験において本発明者らがインデルを見出さ
なかった本発明者らのGUIDE-Seq実験において検出される少数の部位が、0.1
%未満のインデル変異頻度を有する可能性の高い部位を実際に表すと考えている。これと
一致して、本発明者らは、これらの26部位のうち3つ以外のすべては、100未満のG
UIDE-Seq読み数を有したことを注記する。まとめると、これらの知見により、本
発明者らが、単にシークエンシングの読みの数を増加させることによって(および増幅の
ために鋳型として使用されるゲノムの数を増大させることによって)GUIDE-Seq
の感度を増大させることができうることが示唆される。例えば、1000倍多くの読みが
得られるシークエンシングプラットフォームの使用により、検出が可能となるはずである
【0105】
本発明者らのGUIDE-Seq実験によって可能となった直接的な比較により、RG
Nオフターゲット部位を予測するための2つの既存のコンピュータプログラムの限界が示
される。これらのプログラムは、GUIDE-Seqによって見出される真正のオフター
ゲット部位を同定するのに失敗していただけでなく、切断を示さない多くの部位を過判定
もしていた。これは、これらのプログラムによって使用されるパラメーターが、本発明者
らのGUIDE-Seq実験によって同定されたより多数のプロトスペーサーミスマッチ
および代替のPAM配列を説明しないというオフターゲット部位の性質についてのより限
定的な仮定に基づいていたのであれば全く驚くべきことではない。より良好な予測的プロ
グラムが将来開発されうる可能性があるが、そうするためには、より多数のRGNについ
ての実験的に決定されたゲノムワイドなオフターゲット部位が必要とされることになる。
こうしたプログラムが開発されうるまで、オフターゲット部位の同定は、GUIDE-S
eqなどの実験法によって最も効果的に対処されることになる。
【0106】
本発明者らの実験結果は、dCas9のオフターゲット結合部位とCas9のオフター
ゲット切断部位との間の明らかな相違を詳しく説明する。4種の異なるgRNAについて
のdCas9のChIP-SeqおよびCas9のGUIDE-Seqのデータの比較に
より、2セットの部位間でごくわずかな直接的な重複があることおよび2クラスの部位に
おけるミスマッチの平均数が実際に実質的に異なることが示される。さらに、本発明者ら
は、Cas9によって変異誘発されると以前に報告されている少数のdCas9結合部位
でさえも、RGNで誘発される真正の切断部位ではない可能性がきわめて高いことを示し
ている。まとめると、本発明者らの結果は、ChIP-Seqで捕捉されているDNA部
位に対するdCas9の結合が、Cas9ヌクレアーゼによるDNA部位の切断というよ
りも異なる生物学的プロセスを表していることを示し、プロトスペーサーとのgRNAの
5’末端の結合が効率的な切断に必要とされることを示している近年の研究の結果19
一致している。ChIP-Seqアッセイは、dCas9融合タンパク質のゲノムワイド
な結合の特徴付けにおける役割を疑いなく有するであろうが、その方法は、触媒的に活性
なRGNのゲノムワイドなオフターゲット切断部位を決定するのには明らかに有効でない
【0107】
GUIDE-Seqは、細胞内のDSB部位を同定するための以前に記載されている他
のゲノムワイドな方法を超えるいくつかの重要な利点を有する。最近記載されたBLES
S(breaks labeling, enrichment on streptavidin and next-generation sequencing:
切断標識、ストレプトアビジン上での濃縮および次世代シークエンシング)オリゴヌクレ
オチドタギング法は、固定され、浸透性にされた細胞上でin situで行われる27
。細胞固定に伴う人為的結果を生じやすいことに加えて、BLESSは、一瞬存在する切
断物だけを捕捉することになる。対照的に、GUIDE-Seqは、生細胞上で行われ、
より長期間の時間(日)にわたって生じるDSBを捕捉し、それによって感度がより高く
かつ包括的なアッセイとなっている。DSBの近くの領域内への組み込み欠損レンチウイ
ルス(IDLV)DNAの捕捉およびLAM-PCRによるそれらの座位の同定は、ヒト
細胞において改変ジンクフィンガーヌクレアーゼ(ZFN)22および転写活性化因子様
エフェクターヌクレアーゼ(TALEN)28についての少数のオフターゲット部位を同
定するために使用されてきた。しかし、IDLV組み込み事象は、一般に数が少なく、か
つ実際のオフターゲットDSBから500bpも遠くの距離にわたって広範に分散してお
22、28、切断事象の位置を正確にマップすることおよび実際のオフターゲット部位
の配列を推定することの両方を難しくさせている。さらに、LAM-PCRは、配列のバ
イアスおよび/またはシークエンシングの読みの低い効率を欠点としている。まとめると
、これらの制約により、IDLV捕捉によるより低頻度のZFNオフターゲット切断部位
を検出するのは明らかに不可能であることも説明されうる29。対照的に、dsODNは
、GUIDE-SeqでDSB内にきわめて効率良くかつ正確に組み込まれ、単一ヌクレ
オチド分解能での切断のマッピングおよびヌクレアーゼオフターゲット切断部位の簡単で
直接的な同定を可能にする。さらに、LAM-PCRとは対照的に、本発明者らのSTA
T-PCR法は、効率的な、バイアスのない増幅、およびdsODNが組み込まれている
ゲノムDNA断片のシークエンシングを可能にする。本発明者らは、STAT-PCRが
、GUIDE-Seqにおけるその使用を超えたより一般的な有用性を有しうることを注
記する;例えば、ゲノムワイドな規模でウイルスの組み込み部位をマップしようとするこ
とは研究に有用でありうる。
【0108】
GUIDE-Seqは高感度であるが、その検出能力は、いくらかの簡単な変更でさら
に改良しうる。インデルを検出するために次世代シークエンシングを使用する戦略は、プ
ラットフォームの誤り率(典型的には約0.1%)によって制限される。対照的に、GU
IDE-Seqは、インデルではなくdsODN挿入部位を同定するためにシークエンシ
ングを使用し、したがって、誤り率によって制限されるのではなく、シークエンシングの
深さによって制限される。例えば、本発明者らは、本発明者らのシークエンシング検証実
験において本発明者らがインデルを見出さなかった本発明者らのGUIDE-Seq実験
において検出される少数の部位が、0.1%未満の変異頻度を有する可能性の高い部位を
実際に表すと考えている。これと一致して、本発明者らは、これらの26部位のうち3つ
以外のすべては、100未満のGUIDE-Seq読み数を有したことを注記する。まと
めると、これらの知見により、本発明者らが、単にシークエンシングの読みの数を増加さ
せることによって(および増幅のために鋳型として使用されるゲノムの数を増大させるこ
とによって)GUIDE-Seqの感度を増大させることができうることが示唆される。
例えば、1000倍多くの読みが得られるシークエンシングプラットフォームの使用によ
り、位の3桁低い(すなわち、0.0001%の)変異生成頻度を有する部位の検出が可
能となるはずであり、本発明者らは、技術における継続した改良でさらなる増大が生じる
のを期待する。
【0109】
本発明者らの実験の予想外の結果は、GUIDE-Seqが、RGNの非存在下でも細
胞内で生じる切断点ホットスポットも同定することができたという認識であった。本発明
者らのAMPに基づいたシークエンシング実験は、dsODNの捕捉だけでなくこれらの
部位におけるインデルの形成も検証したので、本発明者らは、これらのDSBはGUID
E-Seqのただの人為的結果ではないと考えている。重要なことに、多くのホットスポ
ットは本発明者らの研究において調査された2種の細胞系のそれぞれに固有であるが、い
くつかは両方に共通しているようである。将来の研究において、1つの細胞型においてい
くつかの部位が切断点ホットスポットであるが別の細胞型ではそうではない理由を律する
パラメーターを定義することは興味深いであろう。さらに、本発明者らの結果は、これら
の切断点ホットスポットが転座に関与しうることを示しているので、細胞型特異的な切断
点ホットスポットの存在は、特定のゲノム再編成が特定の細胞型のみに生じて他では生じ
ない理由を説明するための一助となる可能性がある。知る限りでは、GUIDE-Seq
は、ヒト生細胞において、DNA複製を阻害する薬剤の添加を必要とすることなく、切断
点ホットスポットを同定できることが記載される最初の方法である27。したがって、本
発明者らは、それが、これらの切断を同定および試験するための有用なツールを提供する
ことになると予想する。
【0110】
本発明者らの研究は、RGNによって誘発される転座を同定するためのこれまでに記載
された最も包括的な定性的アプローチを確立する。GUIDE-Seqによって発見され
たRGN誘発性およびRGN非依存性のDSB部位のAMPに基づいた標的化されたシー
クエンシングは、両クラスの部位に関与する転座、欠失、および逆位を含む大規模なゲノ
ム再編成を見出すことができ、大規模なゲノム再編成を同定するときに両クラスの切断を
考慮することの重要性を強調している。さらに、おそらく必ずしもすべてのRGN誘発性
またはRGN非依存性のDSBが大規模な変化に関与するわけではないであろうし、いく
つかの部位がそれらの再編成に寄与して他の部位はしない理由を理解することは、さらな
る研究のために重要な領域となるであろう。
【0111】
GUIDE-Seqは、ゲノムワイドな規模におけるRGNプラットフォームに対する
特異性の改良を評価する重要な手段も提供することになる。この報告において、本発明者
らは、トランケートされたgRNAの導入によってどのようにゲノム規模でオフターゲッ
ト作用を低減させることができるかを示すためにGUIDE-Seqを使用し、このアプ
ローチが、適合された全長gRNAの既知のオフターゲット部位における変異を低減させ
うるという本発明者らのグループによる以前の結果30を拡張した。これは、他の細菌も
しくは古細菌からの代替のCas9ヌクレアーゼの、または5’オーバーハングを生成す
る二量体ZFN、TALEN、およびCRISPR RNA誘導型FokIヌクレアーゼ
31、32または5’もしくは3’オーバーハングを生成する対になったCas9ニッカ
ーゼ33、34などのヌクレアーゼの、ゲノムワイドな特異性を評価するように適合され
てもよい;しかし、GUIDE-Seqを拡張してこれらの他の型のDSBを検出するた
めには、こうした切断の中へのその効率的な捕捉を確実にするためのdsODNのさらな
る修飾および最適化が疑いなく必要となるであろう。この方法は、他の細菌または古細菌
からの代替のCas9ヌクレアーゼ35の特異性を評価するためにも使用されうる。本発
明者らは、本発明者らが評価した10種のgRNAについてのオフターゲット部位の数に
おけるきわめて広い変動性を見出したので、1つの重要な注意は、任意の新しいCas9
プラットフォームの特異性についての結論を広く出す前に多数のgRNAを調査する必要
性である。
【0112】
GUIDE-SeqおよびAMPに基づいたシークエンシングを使用する本発明者らの
例示的なアプローチは、RGNによって誘発されるオフターゲット変異およびゲノム再編
成の評価のための新しい黄金標準を確立する。本発明者らは、GUIDE-Seqが、N
HEJが活性でありかつ必要とされる成分が効率良く導入されうるあらゆる細胞における
使用のために拡張されうることを期待する;例えば、本発明者らは、ヒトK562および
マウス胚性幹細胞において効率的なdsODN組み込みをすでに達成している(データは
示されていない)。最も重要なことに、ここに概説されている戦略は、厳しい前臨床経路
の一部として、治療的使用のために提唱されるあらゆるRGNの潜在的なオフターゲット
作用を客観的に評価して、それによって診療所におけるこれらの試薬の使用のための見込
みを実質的に改善するために使用しうる。
【実施例3】
【0113】
本方法の一部の実施形態において使用されうるdsODNについての必要条件を探索す
るために、さらなる実験を行った。
【0114】
以下のdsODNsを、実施例3の実験において使用した:
【0115】
【表5】
【0116】
最初に、EGFPに対して標的化されたTALEN、ZFN、およびRFNを使用して
、3つの型のdsODNの組み込み頻度を評価した。2E5 U2OS-EGFP細胞は
、500ngの各TALENモノマー(合計1ug)、500ngの各ZFNモノマー(
合計1ug)、または325ngのマルチプレックスgRNAプラスミドおよび975n
gのFokI-dCas9発現プラスミドならびに100pmolのdsODNでヌクレ
オフェクトした。使用された3種のdsODNは、5’ホスホロチオエート結合を有する
4bpの5’オーバーハング、3’ホスホロチオエート結合を有する4bpの3’オーバ
ーハングのいずれかを有していた、または5’および3’ホスホロチオエート結合を有す
る平滑末端であった。すべてのdsODNは、5’リン酸化されていた。組み込み頻度は
、NdeI制限断片長多型(RFLP)アッセイで推定し、キャピラリー電気泳動を使用
して定量化した;簡単に説明すると、標的部位は、単離されたゲノムDNAからPCRに
よって増幅した。PCRは、NdeI制限酵素(20U)で37℃で3時間消化し、1.
8× Ampure XPで精製した。精製された切断産物は、Qiaxcelキャピラ
リー電気泳動機器(Qiagen)によって泳動および定量化した。図16Aは、5’リ
ン酸化され、かつ3’ホスホロチオエート化された、平滑末端化したdsODNが最も高
い組み込み率を有していたことを示している。
【0117】
上記で使用された同じオリゴ(配列番号1および2)を、Lonza Nucleof
ector 4-D上で製造業者の説明書に従って20μlの溶液SE(Lonza)中
でU2OS細胞内にトランスフェクトした(プログラムDN-100)。500ngの各
TALENモノマー(CCR5についてはTAL1252/TAL1301かつAPCに
ついてはTAL2294/2295)および100pmolのdsODNをトランスフェ
クトした。図16B~Cは、(上記の)NdeI制限断片長多型(RFLP)解析または
T7E1アッセイによって決定されるような、U2OS細胞における2つの内在性標的部
位、CCR5およびAPCでTALENによって誘発される二本鎖切断(DSB)の中へ
の、平滑末端の、5’リン酸化された、34bpの二本鎖オリゴデオキシヌクレオチド(
dsODN)(oSQT685/686)の効率的な組み込みの証拠を示している(簡単
に説明すると、標的部位は、単離されたゲノムDNAからPCRによって増幅した。PC
Rは、1.8× Ampure XPで精製した。精製されたPCR産物(200ng)
は、以下のプロトコールに従ってハイブリダイズした:95℃5分間、-2℃/秒で95
~85℃、-1℃/10秒で85~25℃;10℃で維持する。T7エンドヌクレアーゼ
I(10U)を反応物に添加し、これを37℃で15分間インキュベートした。反応物は
、EDTA(25mM)の添加によって停止し、1.8× Ampure XPで精製し
た。精製された切断産物は、Qiaxcelキャピラリー電気泳動機器(Qiagen)
によって泳動および定量化した)。
【0118】
さらなる実験を行い、2E5 U2OS-EGFP細胞を、325ngのマルチプレッ
クスgRNAプラスミドおよび975ngのFokI-dCas9発現プラスミドならび
に100pmolのdsODNでヌクレオフェクトした。さらに、3E5マウスES細胞
を、200ngの単一gRNAプラスミドおよび600ngのCas9発現プラスミド、
ならびに100pmolのdsODNでヌクレオフェクトした。2種のdsODNについ
て以下を比較した:1)平滑末端、リン酸化、5’および3’ホスホロチオエート修飾お
よび2)平滑末端、リン酸化、3’ホスホロチオエート修飾のみ。組み込み頻度は、Nd
eI制限断片長多型(RFLP)アッセイで推定し、キャピラリー電気泳動を使用して定
量化した。
【0119】
実験は、ヒトU2OS細胞においてダイマーRNA誘導型FokIヌクレアーゼで(図
17A)、またはマウスES細胞において標準Cas9で(図17B)行い、3’ホスホ
ロチオエート修飾のみを有するdsODNが最も高い割合の組み込みを有していたことが
示された。
【0120】
マウスES細胞において異なる濃度の3’ホスホロチオエート修飾されたオリゴを試験
するために、さらなる実験を行った。3E5マウスES細胞は、200ngの単一gRN
Aプラスミドおよび600ngのCas9発現プラスミド、ならびに下記のような異なる
量のdsODNでヌクレオフェクトした。平滑末端の、リン酸化された、3’のみホスホ
ロチオエート修飾されたdsODNをこの実験において使用した。精製dsODNと未精
製dsODNとの間の比較では、アニールされたオリゴは、Sephadex G-25
カラムを使用して精製した。dsODNは、1、2、5、10、25、50、および10
0pmolの濃度で試験した。組み込み頻度は、NdeI制限断片長多型(RFLP)ア
ッセイで推定し、キャピラリー電気泳動を使用して定量化した。結果は、図18Aおよび
18Bに示されており、50pmolまたは100pmolが最高の活性をもたらしたこ
とを示した。Sephadex G-25カラムを通してのオリゴの精製は、割合を有意
に高めなかった(図18Aおよび18Bを参照されたい)。変異生成頻度はT7E1アッ
セイによって推定し、これにより、3’修飾されたdsODNの存在下であっても、破壊
の一般的な割合が高かったことが示された。
【0121】
dsODNの長さも評価した。図20A~Bは、より長い(例えば、60bp)dsO
DNタグが、CRISPR-Cas9で誘発されたDSBの部位で効率良く組み込まれた
ことを示している。これらのより長いdsODNは、PCR増幅の人為的結果のバイオイ
ンフォマティクス的選別を可能にすることによってGUIDE-seqの精度を向上させ
るために使用されうる。これらの配列は、より長いタグ内に存在する配列が含まれていな
かったすべてのものとして認識されうる。
【0122】
【表6】
【0123】
これらの実験により、dsODNタグ取り込みの効率は、5’および3’末端の両方よ
りもむしろ3’上のみで修飾されている、より長い、オリゴを使用することによって高め
られうること、および形質転換したがん細胞系由来ではない細胞(例えば、マウスES細
胞)を含む多様な細胞系においてdsODNタグの効率的な捕捉が生じることが示される
【実施例4】
【0124】
この実施例では、GUIDE-seq dsODNタグのビオチン化バージョンを、ゲ
ノムのDSBの部位の中への組み込みのための基質として使用した。実施例4に示されて
いるように、こうしたオリゴを効率良く組み込むことが可能であった。実験は、IDT
DNAから得られた、ビオチン化dsODNを使用して、上記のように行った。
【0125】
【表7】
【0126】
図19A~Bは、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX
1、およびFANCF1でCas9によって誘発される二本鎖切断(DSB)の中へのビ
オチン化されたdsODNタグの効率的な組み込みについての証拠を提供する。この向上
により、ビオチンとストレプトアビジンの強固な結合親和性を利用することによるタグ付
き断片の直接的な物理的捕捉を可能にしうる。(A)RFLP解析により、U2OS細胞
における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas
9によって誘発されるDSBの中への標準dsODN(oSQT685/686)と比較
した、ビオチン化されたdsODN(oSQT1261/1262)の組み込み率(%)
が示される。(b)T7EIにより、U2OS細胞における3つの内在性標的部位、VE
GFA3、EMX1、およびFANCF1での標準dsODN(oSQT685/686
)と比較した、ビオチン化されたdsODN(oSQT1261/1262)での推定変
異生成頻度(%)が示される。
【0127】
ビオチン化が細胞内で維持されるとすると、これを使用して、ビオチン化されたssO
DNを含むDNA断片を物理的にプルダウンすること、ならびに捕捉された断片をシーク
エンスおよびマップすることができる。
【実施例5】
【0128】
本実施例では、例示的なGUIDE-Seq法を、バリアントCas9タンパク質と共
に使用する。
【0129】
バリアントの化膿レンサ球菌(Streptococcus pyogenes)Cas9(SpCas9)お
よび黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質は
、参照により本明細書に組み込まれている、米国特許出願公開第61/127,634号
明細書および第62/165,517号明細書、ならびにKleinstiver et al., "Enginee
red CRISPR-Cas9 nucleases with altered PAM specificities." Nature (2015) doi:10.
1038/nature14592に記載のように作製した。オフターゲット作用は、上記のように評価し
た。
【0130】
図21は、EMX1、FANCF、RUNX1、VEGFA、またはZNF629を標
的とするsgRNA(配列については表4を参照されたい)を使用した、D1135V/
R1335Q/T1337R(VQRバリアント)またはD1135V/G1218R/
R1335E/T1337R(VRERバリアント)における変異を含む改変SpCas
9バリアントについてのGUIDE-seqによって同定されたオフターゲット切断部位
の数を示している。これは、GUIDE-seqが、Cas9の改変バージョンのゲノム
ワイドな特異性をプロファイルするのにも使用されうることを実証している。GUIDE
-seqは、ヒト細胞においてNGAまたはNGCG PAMを含む内在性部位を標的と
することによってVQRおよびVRER SpCas9バリアントの特異性プロファイル
を決定するためにも使用した。
【0131】
【表8】
【0132】
図22は、本明細書に記載の例示的なGUIDE-seq法を使用して検出されたオフ
ターゲット部位での野生型とD1135E SpCas9バリアントとの間の特異性にお
ける変化を示している。GUIDE-seqは、3つの内在性のヒト細胞の部位での野生
型SpCas9とD1135Eとの間の読み数の相違を決定するためにも使用した。
【0133】
GUIDE-seq dsODNタグ組み込みも、野生型および改変Cas9 D11
35Eバリアントで3つの遺伝子において行った。結果は、図23A~Bに示されている
が、GUIDE-seqが改変Cas9バリアントのプロファイルに使用されうるという
さらなる証拠を示している。
【0134】
参考文献
1. Sander, J.D. & Joung, J.K. CRISPR-Cas systems for editing, regulating and ta
rgeting genomes. Nat Biotechnol 32, 347-355 (2014).
2. Hsu, P.D., Lander, E.S. & Zhang, F. Development and applications of CRISPR-C
as9 for genome engineering. Cell 157, 1262-1278 (2014).
3. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive
bacterial immunity. Science 337, 816-821 (2012).
4. Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nu
cleases in human cells. Nat Biotechnol 31, 822-826 (2013).
5. Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat
Biotechnol 31, 827-832 (2013).
6. Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage r
eveals RNA-programmed Cas9 nuclease specificity. Nat Biotechnol 31, 839-843 (201
3).
7. Cradick, T.J., Fine, E.J., Antico, C.J. & Bao, G. CRISPR/Cas9 systems target
ing beta-globin and CCR5 genes have substantial off-target activity. Nucleic Aci
ds Res 41, 9584-9592 (2013).
8. Cho, S.W. et al. Analysis of off-target effects of CRISPR/Cas-derived RNA-gu
ided endonucleases and nickases. Genome Res 24, 132-141 (2014).
9. Ghezraoui, H. et al. Chromosomal translocations in human cells are generated
by canonical nonhomologous end-joining. Mol Cell 55, 829-842 (2014).
10. Choi, P.S. & Meyerson, M. Targeted genomic rearrangements using CRISPR/Cas
technology. Nat Commun 5, 3728 (2014).
11. Gostissa, M. et al. IgH class switching exploits a general property of two
DNA breaks to be joined in cis over long chromosomal distances. Proc Natl Acad S
ci U S A 111, 2644-2649 (2014).
12. Tsai, S.Q. & Joung, J.K. What's changed with genome editing? Cell Stem Cell
15, 3-4 (2014).
13. Marx, V. Gene editing: how to stay on-target with CRISPR. Nat Methods 11, 1
021-1026 (2014).
14. Veres, A. et al. Low incidence of off-target mutations in individual CRISPR
-Cas9 and TALEN targeted human stem cell clones detected by whole-genome sequenc
ing. Cell Stem Cell 15, 27-30 (2014).
15. Smith, C. et al. Whole-genome sequencing analysis reveals high specificity
of CRISPR/Cas9 and TALEN-based genome editing in human iPSCs. Cell Stem Cell 15,
12-13 (2014).
16. Duan, J. et al. Genome-wide identification of CRISPR/Cas9 off-targets in hu
man genome. Cell Res 24, 1009-1012 (2014).
17. Wu, X. et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammal
ian cells. Nat Biotechnol 32, 670-676 (2014).
18. Kuscu, C., Arslan, S., Singh, R., Thorpe, J. & Adli, M. Genome-wide analysi
s reveals characteristics of off-target sites bound by the Cas9 endonuclease. Na
t Biotechnol 32, 677-683 (2014).
19. Cencic, R. et al. Protospacer Adjacent Motif (PAM)-Distal Sequences Engage
CRISPR Cas9 DNA Target Cleavage. PLoS One 9, e109213 (2014).
20. Orlando, S.J. et al. Zinc-finger nuclease-driven targeted integration into
mammalian genomes using donors with limited chromosomal homology. Nucleic Acids
Res 38, e152 (2010).
21. Schmidt, M. et al. High-resolution insertion-site analysis by linear amplif
ication-mediated PCR (LAM-PCR). Nat Methods 4, 1051-1057 (2007).
22. Gabriel, R. et al. An unbiased genome-wide analysis of zinc-finger nuclease
specificity. Nat Biotechnol 29, 816-823 (2011).
23. Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided edi
ting of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31, 233-239 (
2013).
24. Lin, Y. et al. CRISPR/Cas9 systems have off-target activity with insertions
or deletions between target DNA and guide RNA sequences. Nucleic Acids Res 42,
7473-7485 (2014).
25. Ran, F.A. et al. Genome engineering using the CRISPR-Cas9 system. Nat Proto
c 8, 2281-2308 (2013).
26. Heigwer, F., Kerr, G. & Boutros, M. E-CRISP: fast CRISPR target site identi
fication. Nat Methods 11, 122-123 (2014).
27. Crosetto, N. et al. Nucleotide-resolution DNA double-strand break mapping b
y next-generation sequencing. Nat Methods 10, 361-365 (2013).
28. Osborn, M.J. et al. TALEN-based gene correction for epidermolysis bullosa.
Mol Ther 21, 1151-1159 (2013).
29. Sander, J.D. et al. In silico abstraction of zinc finger nuclease cleavage
profiles reveals an expanded landscape of off-target sites. Nucleic Acids Res (2
013).
30. Fu, Y., Sander, J.D., Reyon, D., Cascio, V.M. & Joung, J.K. Improving CRISP
R-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol 32, 279-28
4 (2014).
31. Tsai, S.Q. et al. Dimeric CRISPR RNA-guided FokI nucleases for highly speci
fic genome editing. Nat Biotechnol 32, 569-576 (2014).
32. Guilinger, J.P., Thompson, D.B. & Liu, D.R. Fusion of catalytically inactiv
e Cas9 to FokI nuclease improves the specificity of genome modification. Nat Bio
technol 32, 577-582 (2014).
33. Mali, P. et al. CAS9 transcriptional activators for target specificity scre
ening and paired nickases for cooperative genome engineering. Nat Biotechnol 31,
833-838 (2013).
34. Ran, F.A. et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced geno
me editing specificity. Cell 154, 1380-1389 (2013).
35. Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability
of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids
Res 42, 2577-2590 (2014).
【0135】
他の実施形態
本発明は、その詳細な説明と併せて記載されているが、上記の記載は、例示することが
意図されるものであり、添付の特許請求の範囲の範囲によって定義される、本発明の範囲
を制限するものではないことは理解されるべきである。他の態様、利点および改変は、添
付の特許請求の範囲の範囲内である。

本発明の様々な実施形態を以下に示す。
1.細胞のゲノムDNA内の二本鎖切断(DSB)を検出するための方法であって、
前記細胞を二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであ
って、前記dsODNが好ましくは15および50ntの間の長さであり、前記dsOD
Nの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5'
末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3
'末端に存在する、または2つのホスホロチオエート結合が両方の3'末端および両方の5
'末端に存在する、ステップ、
前記細胞内で外来性の改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞の前記ゲノムD
NA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つ
または複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化さ
せるステップ、
組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
前記ゲノムDNAの増幅された部分をシークエンスするステップ
を含み、それによって前記細胞の前記ゲノムDNA内のDSBを検出する、方法。
2.細胞のゲノムDNA内の二本鎖切断(DSB)を検出するための方法であって、
前記細胞を二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであ
って、前記dsODNが好ましくは50および75ntの間の長さであり、前記dsOD
Nの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5'
末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3
'末端に存在する、または2つのホスホロチオエート結合が両方の3'末端および両方の5
'末端に存在する、ステップ、
前記細胞内で外来性の改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞の前記ゲノムD
NA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つ
または複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化さ
せるステップ、
組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
前記ゲノムDNAの増幅された部分をシークエンスするステップ
を含み、それによって前記細胞の前記ゲノムDNA内のDSBを検出する、方法。
3.ゲノムDNAの一部を増幅するステップが、
前記DNAを断片化すること、
前記細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーシ
ョンすること、
前記組み込まれたdsODNと相補的なプライマー(プライマーA)および前記ユニバー
サルアダプターと相補的なプライマー(プライマーB)を用いて、ライゲーションされた
DNAに対して1回目のポリメラーゼ連鎖反応(PCR)を行うこと、
次いで、プライマーAと相補的な3'ネステッドプライマー(プライマーC)、プライマ
ーBと相補的な3'ネステッドプライマー(プライマーD)、およびプライマーDと相補
的なプライマー(プライマーE)を使用して2回目のPCRを行うこと
を含む、上記1または2に記載の方法。
4.プライマーEが、
精製もしくは結合配列、および/または同定配列
のうちの1つまたは複数を含む、上記3に記載の方法。
5.前記改変ヌクレアーゼが、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写
活性化因子エフェクター様ヌクレアーゼ(TALEN)、およびクラスター化された規則
的な間隔の短鎖反復回文配列(CRISPR)/Cas RNA誘導型ヌクレアーゼ(C
RISPR/Cas RGN)からなる群から選択される、上記1または2に記載の方法

6.前記DSBがオフターゲットDSBである、上記1~5に記載の方法。
7.前記DSBが、外来性の改変ヌクレアーゼによって誘発された、上記1~5に記載の
方法。
8.複数のガイドRNAのうちのいずれが最も特異的であるか、すなわち、最も少ないオ
フターゲットDSBを誘発するかを決定する方法であって、
第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(ds
ODN)と接触させるステップであって、前記dsODNが好ましくは15および50n
tの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、
好ましくは、前記dsODNの5'末端がリン酸化されており、さらにまた好ましくは、
ホスホロチオエート結合が両方の3'末端に存在する、または2つのホスホロチオエート
結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前
記細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSB
を修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発
現または活性化させるステップ、
組み込まれたdsODNを含む、前記第1の細胞の集団からのゲノムDNAの一部を増幅
するステップ、および
前記第1の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステ
ップ、
前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
決定するステップ、
第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(ds
ODN)と接触させるステップであって、前記dsODNが好ましくは15および50n
tの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、
好ましくは、前記dsODNの5'末端がリン酸化されており、さらにまた好ましくは、
ホスホロチオエート結合が両方の3'末端に存在する、または2つのホスホロチオエート
結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前
記第2の細胞の集団のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞
が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十
分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含む、前記第2の細胞の集団からのゲノムDNAの一部を増幅
するステップ、および
前記第2の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステ
ップ、
前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
決定するステップ、
前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
、前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数
と比較するステップ
を含み、より少ない(オフターゲット)部位で組み込まれた前記dsODNがより特異的
である、方法。
9.複数のガイドRNAのうちのいずれが最も特異的であるか、すなわち、最も少ないオ
フターゲットDSBを誘発するかを決定する方法であって、
第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(ds
ODN)と接触させるステップであって、前記dsODNが好ましくは50および75n
tの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、
好ましくは、前記dsODNの5'末端がリン酸化されており、さらにまた好ましくは、
ホスホロチオエート結合が両方の3'末端に存在する、または2つのホスホロチオエート
結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前
記細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSB
を修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発
現または活性化させるステップ、
組み込まれたdsODNを含む、前記第1の細胞の集団からのゲノムDNAの一部を増幅
するステップ、および
前記第1の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステ
ップ、
前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
決定するステップ、
第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(ds
ODN)と接触させるステップであって、前記dsODNが好ましくは50および75n
tの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、
好ましくは、前記dsODNの5'末端がリン酸化されており、さらにまた好ましくは、
ホスホロチオエート結合が両方の3'末端に存在する、または2つのホスホロチオエート
結合が両方の3'末端および両方の5'末端に存在する、ステップ、
前記第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前
記第2の細胞の集団のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞
が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十
分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含む、前記第2の細胞の集団からのゲノムDNAの一部を増幅
するステップ、および
前記第2の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステ
ップ、
前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
決定するステップ、
前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を
、前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数
と比較するステップ
を含み、より少ない(オフターゲット)部位で組み込まれた前記dsODNがより特異的
である、前記方法。
10.前記細胞が哺乳動物細胞である、上記1~9のいずれかに記載の方法。
11.前記改変ヌクレアーゼがCas9ヌクレアーゼであり、前記方法が、前記Cas9
ヌクレアーゼを前記ゲノム内の標的配列に導くガイドRNAを前記細胞内で発現させるス
テップも含む、上記1~10のいずれかに記載の方法。
12.前記dsODNが30~35ntの長さまたは60~65ntの長さである、上記
のいずれかに記載の方法。
13.前記dsODNがビオチン化される、上記のいずれかに記載の方法。
14.前記ゲノムgDNAを断片に切断するステップ、および
dsODNを含む断片を前記ビオチンへの結合によって単離するステップ
を含む、上記13に記載の方法。
15.前記dsODNが平滑末端である、上記のいずれかに記載の方法。
16.前記dsODNが前記5'末端に1、2、3、または4ntのオーバーハンギング
を有する、上記のいずれかに記載の方法。
17.前記dsoDNが、5'末端でリン酸化されており、3'末端でホスホロチオエート
化されている、上記のいずれかに記載の方法。
18.前記dsODNが、無作為化されたDNAバーコードを含む、上記のいずれかに記
載の方法。
19.上記のいずれかに記載の方法であって、
前記ゲノムgDNAを断片に切断するステップ、および
前記断片を、末端修復/aテーリング/単一テールのシークエンシングアダプターのライ
ゲーションによってシークエンシング用に調製するステップ
を含む方法。


図1
図2-1】
図2-2】
図3
図4-1】
図4-2】
図4-3】
図4-4】
図4-5】
図5-1】
図5-2】
図5-3】
図5-4】
図5-5】
図5-6】
図5-7】
図5-8】
図6-1】
図6-2】
図6-3】
図6-4】
図7-1】
図7-2】
図8
図9-1】
図9-2】
図9-3】
図9-4】
図10-1】
図10-2】
図10-3】
図10-4】
図10-5】
図11-1】
図11-2】
図11-3】
図11-4】
図12
図13-1】
図13-2】
図13-3】
図13-4】
図14
図15-1】
図15-2】
図15-3】
図15-4】
図16-1】
図16-2】
図17
図18-1】
図18-2】
図19
図20
図21
図22
図23
【配列表】
0007095031000001.app