(58)【調査した分野】(Int.Cl.,DB名)
ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、またはブレオマイシンによって切断され得る候補ヌクレアーゼ標的部位を含む、請求項1〜4のいずれか一項に記載のライブラリー。
少なくとも5kDa、少なくとも6kDa、少なくとも7kDa、少なくとも8kDa、少なくとも9kDa、少なくとも10kDa、少なくとも12kDa、または少なくとも15kDaの分子量の核酸分子を含む、請求項1〜6のいずれか一項に記載のライブラリー。
目的のヌクレアーゼが、ZFN、TALEN、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、またはブレオマイシンである、請求項11に記載のライブラリー。
部分的に無作為化された部位が、二項分布的に、平均して5%超、10%超、15%超、20%超、25%超、または30%超、コンセンサス部位と異なる、請求項9〜12のいずれか一項に記載のライブラリー。
【発明を実施するための形態】
【0018】
定義
本明細書および特許請求の範囲において使用する場合、単数形「a」、「an」、および「the」は、他に明示されない限り、単数および複数への言及を含む。したがって、例えば、「薬剤(an agent)」への言及は、1つの薬剤および複数のそのような薬剤を含む。
【0019】
用語「コンカテマー」は、核酸分子の文脈において本明細書で使用する場合、連続して連結した、同じDNA配列の複数コピーを含有する核酸分子を指す。例えば、特定のヌクレオチド配列を10コピー含むコンカテマー(例えば、[XYZ]
10)は、連続して互いに連結した同じ特定配列を10コピー、例えば、5’−XYZXYZXYZXYZXYZXYZXYZXYZXYZXYZ−3’として含むことになる。コンカテマーは、反復単位または反復配列の任意の数のコピー、例えば、少なくとも2コピー、少なくとも3コピー、少なくとも4コピー、少なくとも5コピー、少なくとも10コピー、少なくとも100コピー、少なくとも1000コピー等を含むことができる。ヌクレアーゼ標的部位と一定の挿入配列とを含む核酸配列のコンカテマーの一例は、[(標的部位)−(一定の挿入配列)]
300である。コンカテマーは、線状の核酸分子であっても環状であってもよい。
【0020】
用語「コンジュゲートしている」、「コンジュゲートされた」、および「コンジュゲーション」は、2つの実体、例えば、2つのタンパク質、2つのドメイン(例えば、結合ドメインと切断ドメイン)、またはタンパク質と薬剤(例えばタンパク質ドメインと小分子)などの2つの分子の結合を指す。この結合は、例えば、直接的または間接的な(例えば、リンカーを介する)共有結合であることも、非共有結合的相互作用であることもある。一部の実施形態では、この結合は共有結合である。一部の実施形態では、2つの分子が両方の分子を連結するリンカーを介してコンジュゲートする。例えば、2つのタンパク質、例えば、操作されたヌクレアーゼの結合ドメインと切断ドメインとを、互いにコンジュゲートして、タンパク質融合体を形成させる一部の実施形態では、2つのタンパク質は、ポリペプチドリンカー、例えば、一方のタンパク質のC末端を他方のタンパク質のN末端に結合するアミノ酸配列、を介してコンジュゲートさせることができる。
【0021】
核酸配列の文脈において本明細書で使用する場合、用語「コンセンサス配列」は、複数の類似配列の各位置で最も頻度高く見出されるヌクレオチド残基を表す計算上の配列を指す。典型的には、コンセンサス配列は、類似配列を互いに比較し、類似配列モチーフを評価する配列アラインメントにより決定される。ヌクレアーゼ標的部位配列の文脈では、ヌクレアーゼ標的部位のコンセンサス配列は、一部の実施形態では、所与のヌクレアーゼにより、最も頻度高く結合される配列であっても、最も高い親和性で結合される配列であってもよい。
【0022】
用語「有効量」は、本明細書で使用する場合、所望の生物反応を誘発するのに十分な生理活性物質の量を指す。例えば、一部の実施形態では、ヌクレアーゼの有効量は、ヌクレアーゼが特異的に結合して切断する標的部位の切断を誘導するのに十分なヌクレアーゼの量を指すことができる。当業者が認識するように、薬剤、例えばヌクレアーゼ、ハイブリッドタンパク質、またはポリヌクレオチドの有効量は、例えば、所望の生物反応、特定の対立遺伝子、ゲノム、標的部位、細胞、または標的組織、および使用する薬剤のような種々の因子に依存して異なり得る。
【0023】
用語「エンジイン」は、本明細書で使用する場合、二重結合により分離された2つの三重結合を含有する9員環および10員環のいずれかを特徴とする細菌性天然物のクラスを指す(例えば、K.C.Nicolaou;A.L.Smith;E.W.Yue(1993).“Chemistry and biology of natural and designed enediynes”.PNAS 90(13):5881−5888を参照のこと;この内容全体は、参照により本明細書に組み込まれる)。一部のエンジインは、Bergman環化を受けることができ、その結果生じるジラジカルである1,4−デヒドロベンゼン誘導体は、DNAの糖骨格から水素原子を引き抜き、DNA鎖切断をもたらすことができる(例えば、S.Walker;R.Landovitz;W.D.Ding;G.A.Ellestad;D.Kahne(1992).“Cleavage behavior of calicheamicin gamma 1 and calicheamicin T”.Proc Natl Acad Sci U.S.A.89(10):4608−12を参照のこと;この内容全体は、参照により本明細書に組み込まれる)。DNAとのエンジインの反応性は、多くのエンジインに抗生物質的特性を付与し、一部のエンジインは、抗癌抗生物質として臨床試験されている。エンジインの非限定例として、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシンがある(例えば、Adrian L.Smith and K.C.Bicolaou,“The Enediyne Antibiotics”J.Med.Chem.,1996,39(11),pp2103−2117;およびDonald Borders,“Enediyne antibiotics as antitumor agents,”Informa Healthcare;1
st edition(November 23,1994,ISBN−10:0824789385を参照のこと;これらの内容全体は、参照により本明細書に組み込まれる)。
【0024】
用語「ホーミングエンドヌクレアーゼ」は、本明細書で使用する場合、イントロンまたはインテインにより通常コードされる一種の制限酵素を指す、Edgell DR(February 2009).“Selfish DNA:homing endonucleases find a home”.Curr Biol 19(3):R115−R117;Jasin M(Jun 1996).“Genetic manipulation of genomonth with rare−cutting endonucleases”.Trends Genet 12(6):224−8;Burt A,Koufopanou V(December 2004).“Homing endonuclease genes:the rise and fall and rise again of a selfish element”.Curr Opin Genet Dev 14(6):609−15;これらの内容全体は、参照により本明細書に組み込まれる。ホーミングエンドヌクレアーゼの認識配列は、極めて低い確率でのみ無作為に生じるほど十分に長く(7×10
10bpごとに約1つ)、通常、1ゲノム当たりわずか1つの実例が見つかるだけである。
【0025】
用語「ライブラリー」は、核酸またはタンパク質の文脈において本明細書で使用する場合、それぞれ、2つ以上の異なる核酸またはタンパク質の集団を指す。例えば、ヌクレアーゼ標的部位のライブラリーは、異なるヌクレアーゼ標的部位を含む少なくとも2つの核酸分子を含む。一部の実施形態では、ライブラリーは、少なくとも10
1、少なくとも10
2、少なくとも10
3、少なくとも10
4、少なくとも10
5、少なくとも10
6、少なくとも10
7、少なくとも10
8、少なくとも10
9、少なくとも10
10、少なくとも10
11、少なくとも10
12、少なくとも10
13、少なくとも10
14、または少なくとも10
15の異なる核酸またはタンパク質を含む。一部の実施形態では、ライブラリーのメンバーは、無作為化された配列、例えば、完全にまたは部分的に無作為化された配列を含んでもよい。一部の実施形態では、ライブラリーは、互いに無関係な核酸分子、例えば、完全に無作為化された配列を含む核酸を含む。他の実施形態では、ライブラリーの少なくとも一部のメンバーは、関連していることがあり、例えば、それらは、コンセンサス標的部位配列などの特定の配列の変異体または派生体であることがある。
【0026】
用語「リンカー」は、本明細書で使用する場合、2つの隣接した分子または部分、例えば、ヌクレアーゼの結合ドメインと切断ドメイン、を連結する化学基または分子を指す。典型的には、リンカーは、2つの基、分子、もしくは他の部分の間に位置するかまたはそれらに挟まれており、共有結合を介して互いに連結して、その2つを連結する。一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分である。
【0027】
用語「ヌクレアーゼ」は、本明細書で使用する場合、核酸分子中のヌクレオチド残基を連結するリン酸ジエステル結合を切断することができる薬剤、例えばタンパク質または小分子を指す。一部の実施形態では、ヌクレアーゼは、タンパク質、例えば、核酸分子に結合し、核酸分子内のヌクレオチド残基を連結するリン酸ジエステル結合を切断することができる酵素である。ヌクレアーゼは、ポリヌクレオチド鎖内のリン酸ジエステル結合を切断するエンドヌクレアーゼであっても、ポリヌクレオチド鎖の末端にあるリン酸ジエステル結合を切断するエキソヌクレアーゼであってもよい。一部の実施形態では、ヌクレアーゼは、特定のヌクレオチド配列内の特定のリン酸ジエステル結合に結合し、かつ/またはそれを切断する部位特異的ヌクレアーゼであり、この特定のヌクレオチド配列は、本明細書では「認識配列」、「ヌクレアーゼ標的部位」、または「標的部位」とも呼ばれる。一部の実施形態では、ヌクレアーゼは、一本鎖の標的部位を認識するが、他の実施形態では、ヌクレアーゼは、二本鎖の標的部位、例えば、二本鎖のDNA標的部位を認識する。多くの天然のヌクレアーゼ、例えば、多くの天然のDNA制限ヌクレアーゼの標的部位は、当業者には周知である。多くの場合、EcoRI、HindIII、またはBamHIなどのDNAヌクレアーゼは、長さが4〜10塩基対のパリンドロームの二本鎖DNA標的部位を認識し、標的部位内の特定の位置で2つのDNA鎖のそれぞれを切断する。一部のエンドヌクレアーゼは、二本鎖の核酸標的部位を対称的に切断する、すなわち、同じ位置で両方の鎖を切断し、その結果、その末端は塩基対を形成したヌクレオチドを含む。これは、本明細書で平滑末端とも呼ばれる。他のエンドヌクレアーゼは、二本鎖の核酸標的部位を非対称的に切断する、すなわち、異なる位置でそれぞれの鎖を切断し、その結果その末端は対を形成していないヌクレオチドを含む。二本鎖DNA分子の末端にある、対を形成していないヌクレオチドは、「オーバーハング」とも呼ばれ、例えば、1つまたは複数の対を形成していないヌクレオチドがそれぞれのDNA鎖の5’末端か5’末端のいずれを形成するかに応じて、「5’−オーバーハング」または「3’−オーバーハング」と呼ばれる。1つまたは複数の対を形成していないヌクレオチドで終わる二本鎖DNA分子の末端は、対を形成していない、1つまたは複数の相補的なヌクレオチドを含む他の二本鎖DNA分子の末端「に粘着する」ことができるため、粘着末端とも呼ばれる。ヌクレアーゼタンパク質は、典型的には、このタンパク質と核酸基質との相互作用を媒介し、一部の場合には、さらに標的部位に特異的に結合する「結合ドメイン」と、核酸骨格内のリン酸ジエステル結合の切断を触媒する「切断ドメイン」とを含む。一部の実施形態では、ヌクレアーゼタンパク質は、単量体の形態で核酸分子に結合し切断することができるが、他の実施形態では、ヌクレアーゼタンパク質は、標的核酸分子を切断するために、二量体または多量体を形成しなければならない。天然ヌクレアーゼの結合ドメインおよび切断ドメイン、ならびに融合して特定の標的部位に結合するヌクレアーゼを形成することができるモジュール性の結合ドメインおよび切断ドメインが当業者に周知である。例えば、ジンクフィンガーまたは転写活性化因子様エレメントを、所望の標的部位に特異的に結合する結合ドメインとして使用し、切断ドメイン、例えばFokIの切断ドメインに融合またはコンジュゲートして、標的部位を切断する操作されたヌクレアーゼを形成させることができる。
【0028】
用語「核酸」および「核酸分子」は、本明細書で使用する場合、核酸塩基および酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドポリマーを指す。典型的には、ポリマー核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は線状分子であり、隣接したヌクレオチドはホスホジエステル結合を介して互いに連結している。一部の実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指す。一部の実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用する場合、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば、少なくとも3つのヌクレオチドのストリング)を指すために互換的に使用することができる。一部の実施形態では、「核酸」は、RNAならびに一本鎖DNAおよび/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然核酸分子の文脈において、天然であってもよい。一方、核酸分子は、非天然分子、例えば、組換えのDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または合成のDNA、RNA、DNA/RNAハイブリッド、または非天然のヌクレオチドもしくはヌクレオシドを含むものであってもよい。さらに、用語「核酸」、「DNA」、「RNA」、および/または同様の用語には、核酸アナログ、すなわちリン酸ジエステル骨格以外を有するアナログが含まれる。核酸は、天然供給源から精製すること、組換え発現系を使用して産生し、場合によっては精製すること、化学的に合成すること等が可能である。適切な場合、例えば化学的に合成された分子の場合には、核酸は、化学的に修飾された塩基または糖を有するアナログなどのヌクレオシドアナログおよび骨格修飾を含んでもよい。他に指示がない限り、核酸配列は5’から3’方向で提示される。一部の実施形態では、核酸は、天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシドアナログ(例えば、2−アミノアデノシン、2−チオチミジン、イノシン、ピロロ−ピリミジン、3−メチルアデノシン、5−メチルシチジン、2−アミノアデノシン、C5−ブロモウリジン、C5−フルオロウリジン、C5−ヨードウリジン、C5−プロピニル−ウリジン、C5−プロピニル−シチジン、C5−メチルシチジン、2−アミノアデノシン、7−デアザアデノシン、7−デアザグアノシン、8−オキソアデノシン、8−オキノグアノシン、O(6)−メチルグアニン、および2−チオシチジン);化学的に修飾された塩基;生物学的に修飾された塩基(例えば、メチル化された塩基);インターカレートされた塩基;修飾された糖(例えば、2’−フルオロリボース、リボース、2’−デオキシリボース、アラビノース、およびヘキソース);ならびに/または修飾されたリン酸基(例えば、ホスホロチオエートおよび5’−N−ホスホラミダイト結合)であるかまたはそれらを含む。
【0029】
用語「医薬組成物」は、本明細書で使用する場合、疾患または障害の治療の文脈において、被験体に投与することができる組成物を指す。一部の実施形態では、医薬組成物は、活性成分、例えばヌクレアーゼ、ヌクレアーゼをコードする核酸と、薬学的に許容される賦形剤とを含む。
【0030】
用語「増殖性疾患」は、本明細書で使用する場合、細胞または細胞集団が異常に高い増殖速度を示すという点で、細胞または組織ホメオスタシスを撹乱する任意の疾患を指す。増殖性疾患には、新生物発生前の過形成症状および新生物疾患など、過剰増殖性疾患が含まれる。新生物疾患は、異常な細胞増殖を特徴とし、良性および悪性の新生物を含む。悪性新生物は、癌とも呼ばれる。
【0031】
用語「タンパク質」、「ペプチド」、および「ポリペプチド」は、本明細書で互換的に使用され、ペプチド(アミド)結合により相互に連結されるアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質を指しても、タンパク質の集合を指してもよい。タンパク質、ペプチド、またはポリペプチド中の1つまたは複数のアミノ酸は、例えば、コンジュゲーション、官能化、または他の修飾等のために、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカーなどの化学成分を付加することによって修飾してもよい。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であっても、複数分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然のタンパク質またはペプチドの単に断片であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然、組換え体、もしくは合成、またはそれらの任意の組合せであってもよい。タンパク質は、異なるドメイン、例えば、核酸結合ドメインと核酸切断ドメインとを含んでもよい。一部の実施形態では、タンパク質は、タンパク質部分、例えば、核酸結合ドメインを構成するアミノ酸配列と、有機化合物、例えば、核酸切断剤として作用することができる化合物とを含む。
【0032】
用語「無作為化された」は、核酸配列の文脈において本明細書で使用する場合、遊離ヌクレオチドの混合物、例えば、4つのヌクレオチドであるA、T、G、およびCのすべての混合物を組み込むように合成された配列またはその配列内の残基を指す。無作為化された残基は、通常、ヌクレオチド配列内で文字Nによって表す。一部の実施形態では、無作為化された配列または残基は、完全に無作為化されており、その場合には、無作為化された残基は、それぞれの配列残基の合成ステップの間に組み込まれるヌクレオチドを等量(例えば、25%のT、25%のA、25%のG、および25%のC)加えることにより合成される。一部の実施形態では、無作為化された配列または残基は、部分的に無作為化されており、その場合には、無作為化された残基は、それぞれの配列残基の合成ステップの間に組み込まれるヌクレオチドを非等量(例えば、79%のT、7%のA、7%のG、および7%のC)加えることにより合成される。部分的な無作為化は、所与の配列のテンプレートになるが、所望の頻度で突然変異を組み込んだ配列の生成を可能にする。例えば、公知のヌクレアーゼ標的部位を合成テンプレートとして使用する場合、各ステップに、それぞれの残基で表されるヌクレオチドをその合成に79%で加え、他の3つのヌクレオチドをそれぞれ7%で加える部分的無作為化により、部分的に無作為化された標的部位の混合物が合成されることになり、それは依然として、元の標的部位のコンセンサス配列を表すが、そのように合成された各残基について、21%の統計的頻度(二項分布)で各残基が元の標的部位と異なる。一部の実施形態では、部分的に無作為化された配列は、二項分布的に、平均して5%超、10%超、15%超、20%超、25%超、または30%超、コンセンサス配列と異なる。一部の実施形態では、部分的に無作為化された配列は、二項分布的に、平均して10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下、コンセンサス部位と異なる。
【0033】
用語「小分子」および「有機化合物」は、本明細書において互換的に使用し、天然であるかまたは人為的に形成させたもの(例えば、化学合成を介して)であるかにかかわらず、比較的低分子量の分子を指す。典型的には、有機化合物は炭素を含有する。有機化合物は、複数の炭素−炭素結合、立体中心、および他の官能基(例えば、アミン、ヒドロキシル、カルボニル、または複素環)を含有することができる。一部の実施形態では、有機化合物は、単量体であり、約1500g/モル未満の分子量を有する。特定の実施形態では、小分子の分子量は、約1000g/モル未満または約500g/モル未満である。特定の実施形態では、小分子は、薬物、例えば、適切な政府機関または規制団体によりヒトまたは動物での使用が安全かつ効果的であるとすでに認められた薬物である。特定の実施形態では、有機分子は、核酸に結合および/切断することが公知である。一部の実施形態では、有機化合物はエンジインである。一部の実施形態では、有機化合物は、抗生物質、例えば、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、ブレオマイシン、またはそれらの誘導体などの抗癌抗生物質である。
【0034】
用語「被験体」は、本明細書で使用する場合、個々の生物、例えば、個々の哺乳動物を指す。一部の実施形態では、被験体はヒトである。一部の実施形態では、被験体は非ヒト哺乳動物である。一部の実施形態では、被験体は非ヒト霊長類である。一部の実施形態では、被験体はげっ歯類である。一部の実施形態では、被験体は、ヒツジ、ヤギ、ウシ、ネコ、またはイヌである。一部の実施形態では、被験体は、脊椎動物、両生類、爬虫類、魚類、昆虫、ハエ、または線虫である。
【0035】
用語「標的核酸」および「標的ゲノム」は、ヌクレアーゼの文脈において本明細書で使用する場合、所与のヌクレアーゼの少なくとも1つの標的部位を含む、それぞれ核酸分子またはゲノムを指す。
【0036】
用語「ヌクレアーゼ標的部位」と本明細書で互換的に使用する用語「標的部位」は、ヌクレアーゼが結合および切断する核酸分子内の配列を指す。標的部位は、一本鎖であっても二本鎖であってもよい。二量体を形成するヌクレアーゼ、例えば、FokI DNA切断ドメインを含むヌクレアーゼの文脈では、標的部位は、典型的には、左ハーフサイト(ヌクレアーゼの一方の単量体が結合する)、右ハーフサイト(ヌクレアーゼの他方の単量体が結合する)、および切断がなされる、ハーフサイト間のスペーサー配列を含む。この構造([左ハーフサイト]−[スペーサー配列]−[右ハーフサイト])は、本明細書ではLSR構造と呼ばれる。一部の実施形態では、左ハーフサイトおよび/または右ハーフサイトは、10〜18ヌクレオチド長の間である。一部の実施形態では、ハーフサイトのいずれかまたは両方がより短いかまたはより長い。一部の実施形態では、左ハーフサイトと右ハーフサイトは異なる核酸配列を含む。
【0037】
用語「転写活性化因子様エフェクター」(TALE)は、本明細書で使用する場合、DNA結合ドメインを含む細菌タンパク質を指し、これは、高度に可変な2つのアミノ酸モチーフ(反復可変二残基(Repeat Variable Diresidue)、RVD)を含む、高度に保存された33〜34アミノ酸配列を含有する。RVDモチーフは、核酸配列への結合特異性を決定し、所望のDNA配列に特異的に結合するように、当業者に周知の方法によって操作することができる(例えば、Miller,Jeffrey;et.al.(February 2011).“A TALE nuclease architecture for efficient genome editing”.Nature Biotechnology 29(2):143−8;Zhang,Feng;et.al.(February 2011).“Efficient construction of sequence−specific TAL effectors for modulating mammalian transcription”.Nature Biotechnology 29(2):149−53;Geiβler,R.;Scholze,H.;Hahn,S.;Streubel,J.;Bonas,U.;Behrens,S.E.;Boch,J.(2011),Shiu,Shin−Han.ed.“Transcriptional Activators of Human Genes with Programmable DNA−Specificity”.PLoS ONE 6(5):e19509;Boch,Jens(February 2011).“TALEs of genome targeting”.Nature Biotechnology 29(2):135−6;Boch,Jens;et.al.(December 2009).“Breaking the Code of DNA Binding Specificity of TAL−Type III Effectors”.Science 326(5959):1509−12;およびMoscou,Matthew J.; Adam J.Bogdanove(December 2009).“A Simple Cipher Governs DNA Recognition by TAL Effectors”.Science 326(5959):1501を参照のこと;これらそれぞれの内容全体は、参照により本明細書に組み込まれる)。アミノ酸配列とDNA認識との間に簡単な関係があるため、適切なRVDを含有する反復セグメントの組合せを選択することにより、特定のDNA結合ドメインの操作が可能になっている。
【0038】
用語「転写活性化因子様エレメントヌクレアーゼ」(TALEN)は、本明細書で使用する場合、DNA切断ドメイン、例えばFokIドメインに加えて転写活性化因子様エフェクターのDNA結合ドメインを含む人為的なヌクレアーゼを指す。操作されたTALE構築物を作製するためのいくつかのモジュール構築スキームが報告されている(Zhang,Feng;et.al.(February 2011).“Efficient construction of sequence−specific TAL effectors for modulating mammalian transcription”.Nature Biotechnology 29(2):149−53;Geiβler,R.;Scholze,H.;Hahn,S.;Streubel,J.;Bonas,U.;Behrens,S.E.;Boch,J.(2011),Shiu,Shin−Han.ed.“Transcriptional Activators of Human Genes with Programmable DNA−Specificity”.PLoS ONE 6(5):e19509;Cermak,T.;Doyle,E.L.;Christian,M.;Wang,L.;Zhang,Y.;Schmidt,C.;Baller,J.A.;Somia,N.V.et al.(2011).“Efficient design and assembly of custom TALEN and other TAL effector−based constructs for DNA targeting”.Nucleic Acids Research;Morbitzer,R.;Elsaesser,J.;Hausner,J.;Lahaye,T.(2011).“Assembly of custom TALE−type DNA binding domains by modular cloning”.Nucleic Acids Research;Li,T.;Huang,S.;Zhao,X.;Wright,D.A.;Carpenter,S.;Spalding,M.H.;Weeks,D.P.;Yang,B.(2011).“Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes”.Nucleic Acids Research.;Weber,E.;Gruetzner,R.;Werner,S.;Engler,C.;Marillonnet,S.(2011).Bendahmane,Mohammed.ed.“Assembly of Designer TAL Effectors by Golden Gate Cloning”.PLoS ONE 6(5):e19722;これらそれぞれの内容全体は、参照により本明細書に組み込まれる)。
【0039】
用語「治療」、「治療する」、および「治療すること」は、本明細書に記載するように、疾患もしく障害、またはその1つもしくは複数の症候の反転、緩和、発症の遅延、もしくは進行の抑制を目的とした臨床的介入を指す。本明細書で使用する場合、用語「治療」、「治療する」、および「治療すること」は、本明細書に記載するように、疾患もしく障害、またはその1つもしくは複数の症候の反転、緩和、発症の遅延、もしくは進行の抑制を目的とした臨床的介入を指す。一部の実施形態では、治療は、1つまたは複数の症候が発症した後に、かつ/または疾患が診断された後に実施してもよい。他の実施形態では、治療は、例えば、症候の発症を防止もしくは遅延させるために、または疾患の発症もしくは進行を抑制するために、症候のない状態で実施してもよい。例えば、治療は、症候の発症前に、罹患しやすい個体に(例えば、症候履歴に照らして、かつ/または遺伝的因子もしくは他の感受性因子に照らして)実施してもよい。治療はまた、症候が消散した後に、例えば、再発を防止または遅延させるために継続することができる。
【0040】
用語「ジンクフィンガー」は、本明細書で使用する場合、折り畳みおよびその折り畳みを安定化する1つまたは複数の亜鉛イオンの配位を特徴とする、小さな核酸結合タンパク質構造モチーフを指す。ジンクフィンガーは、多種多様の異なるタンパク質構造を包含する(例えば、その内容全体が参照により本明細書に組み込まれる、Klug A,Rhodes D(1987).“Zinc fingers:a novel protein fold for nucleic acid recognition”.Cold Spring Harb.Symp.Quant.Biol.52:473−82を参照のこと)。特定のヌクレオチド配列に結合するように、ジンクフィンガーを設計することができ、また所望の任意の標的配列に実際に結合するように、一連のジンクフィンガーの融合物を含むジンクフィンガーアレイを設計することができる。そのようなジンクフィンガーアレイを、例えば核酸切断ドメインにコンジュゲートすれば、タンパク質、例えばヌクレアーゼの結合ドメインを形成することができる。異なるタイプのジンクフィンガーモチーフが当業者に公知であり、それには、これらに限定されないが、Cys
2His
2、Gag knuckle、Treble clef、亜鉛リボン、Zn
2/Cys
6、およびTAZ2ドメイン様モチーフが含まれる(例えば、Krishna SS,Majumdar I,Grishin NV(January 2003).“Structural classification of zinc fingers:survey and summary”.Nucleic Acids Res.31(2):532−50を参照のこと)。典型的には、単一ジンクフィンガーモチーフは、核酸分子の3または4ヌクレオチドに結合する。したがって、2つのジンクフィンガーモチーフを含むジンクフィンガードメインは、6〜8ヌクレオチドに結合することができ、3つのジンクフィンガーモチーフを含むジンクフィンガードメインは、9〜12ヌクレオチドに結合することができ、4つのジンクフィンガーモチーフを含むジンクフィンガードメインは、12〜16ヌクレオチドに結合することができる等がある。ジンクフィンガーのDNA結合特異性を変更するために、かつ/または長さが3〜30ヌクレオチドの所望の任意の標的配列に実際に結合するような新規のジンクフィンガー融合物を設計するために、任意の適切なタンパク質工学手法を使用することができる(例えば、Pabo CO,Peisach E,Grant RA(2001).“Design and selection of novel cys2His2 Zinc finger proteins”.Annual Review of Biochemistry 70:313−340;Jamieson AC,Miller JC,Pabo CO(2003).“Drug discovery with engineered zinc−finger proteins”.Nature Reviews Drug Discovery 2(5):361−368;およびLiu Q,Segal DJ,Ghiara JB,Barbas CF(May 1997).“Design of polydactyl zinc−finger proteins for unique addressing within complex genomes”.Proc.Natl.Acad.Sci.U.S.A.94(11)を参照のこと;これらそれぞれの内容全体は、参照により本明細書に組み込まれる)。操作されたジンクフィンガーアレイと核酸を切断するタンパク質ドメインとの間を融合して、「ジンクフィンガーヌクレアーゼ」を生成することができる。ジンクフィンガーヌクレアーゼは、典型的には、核酸分子内の特定の標的部位に結合するジンクフィンガードメインと、結合ドメインが結合した標的部位内またはその近傍の核酸分子を切断する核酸切断ドメインとを含む。典型的な操作されたジンクフィンガーヌクレアーゼは、3〜6個の間の個々のジンクフィンガーモチーフを有し、長さが9塩基対〜18塩基対の範囲にある標的部位に結合する結合ドメインを含む。より長い標的部位は、所与のゲノムにユニークな標的部位に結合し切断することが望ましい状況では特に魅力的である。
【0041】
用語「ジンクフィンガーヌクレアーゼ」は、本明細書で使用する場合、ジンクフィンガーアレイを含む結合ドメインにコンジュゲートした核酸切断ドメインを含むヌクレアーゼを指す。一部の実施形態では、切断ドメインは、II型制限酵素FokIの切断ドメインである。切断する所与の核酸分子中の任意の所望の配列を実際に標的にするように、ジンクフィンガーヌクレアーゼを設計することができ、設計のジンクフィンガー結合ドメインが複雑なゲノムの文脈においてユニークな部位に結合する可能性があれば、例えば、治療価値のある標的ゲノム改変を達成するような、生細胞中の単一ゲノム部位の標的切断が可能になる。所望のゲノム遺伝子座に対する二本鎖切断のターゲティングは、非相同DNA修復経路の誤りがちな性質のため、遺伝子のコード配列にフレームシフト突然変異を導入するように使用することができる。ジンクフィンガーヌクレアーゼは、当業者に周知の方法により目的の部位を標的にするように作製することができる。例えば、所望の特異性を有するジンクフィンガー結合ドメインは、特異性の知られた個々のジンクフィンガーモチーフを組み合わせることにより設計することができる。DNAに結合したジンクフィンガータンパク質Zif268の構造が、この分野の研究の多くに伝えられ、64通りの可能な塩基対トリプレットのそれぞれに対するジンクフィンガーを得て、次いでこれらのジンクフィンガーモジュールを混合し、マッチさせて、所望の任意の配列特異性を有するタンパク質を設計するという概念が記載された(Pavletich NP,Pabo CO(May 1991).“Zinc finger−DNA recognition:crystal structure of a Zif268−DNA complex at 2.1 A”.Science 252(5007):809−17、この内容全体は、本明細書に組み込まれる)。一部の実施形態では、3塩基対DNA配列をそれぞれ認識する別々のジンクフィンガーを組み合わせて、長さが9塩基対〜18塩基対の範囲にある標的部位を認識する3−、4−、5−、または6−フィンガーアレイを作製する。一部の実施形態では、より長いアレイを企図する。他の実施形態では、6〜8ヌクレオチドを認識する2−フィンガーモジュールを組み合わせて、4−、6−、または8−ジンクフィンガーアレイを作製する。一部の実施形態では、細菌またはファージのディスプレイを使用して、所望の核酸配列、例えば、長さが3〜30bpの所望のヌクレアーゼ標的部位を認識するジンクフィンガードメインを開発する。ジンクフィンガーヌクレアーゼは、一部の実施形態では、リンカー、例えばポリペプチドリンカーを介して互いに融合した、またはそうでなければコンジュゲートしたジンクフィンガー結合ドメインおよび切断ドメインを含む。リンカーの長さは、ジンクフィンガードメインが結合する核酸配列から切断箇所までの距離を決定する。短いリンカーを使用すると、切断ドメインは、結合核酸配列に近い核酸を切断することになり、一方、長いリンカーでは、切断と結合との核酸配列間の距離が大きくなる。一部の実施形態では、ジンクフィンガーヌクレアーゼの切断ドメインは、結合した核酸を切断するために二量体を形成しなければならない。一部のそのような実施形態では、二量体は、それぞれが異なるジンクフィンガー結合ドメインを含む2つの単量体のヘテロ二量体である。例えば、一部の実施形態では、二量体は、FokI切断ドメインにコンジュゲートしたジンクフィンガードメインAを含む1つの単量体と、FokI切断ドメインにコンジュゲートしたジンクフィンガードメインBを含む1つの単量体とを含むことができる。この非限定例では、ジンクフィンガードメインAは、標的部位の一方の側にある核酸配列に結合し、ジンクフィンガードメインBは、標的部位の反対側にある核酸配列に結合し、二量体形成したFokIドメインは、ジンクフィンガードメイン結合部位の間にある核酸を切断する。
【0042】
本発明の特定の実施形態の詳細な説明
緒言
部位特異的ヌクレアーゼは、ゲノムの標的改変のための強力なツールである。一部の部位特異的ヌクレアーゼは、理論的には、他のいかなるゲノム部位にも影響を及ぼすことなく、切断のための、ゲノム中の単一のユニーク部位を標的にすることを可能にする、標的切断部位に対する特異性レベルを達成することができる。生細胞におけるヌクレアーゼ切断は、切断され修復されたゲノム配列の改変をもたらすことが多い、例えば相同組換えを介するDNA修復機序を誘発することが報告されている。したがって、ゲノム内の特定のユニーク配列の標的切断により、多くのヒト体細胞または胚性幹細胞など、従来の遺伝子ターゲティング法により操作することが困難である細胞を含む生細胞における遺伝子ターゲティングおよび遺伝子改変のための新しい手段が開かれる。疾患関連配列、例えばHIV/AIDS患者のCCR−5対立遺伝子、または腫瘍血管新生に必要な遺伝子のヌクレアーゼ媒介の改変は、臨床的文脈において使用することが可能であり、現在、2つの部位特異的ヌクレアーゼが臨床試験中である。
【0043】
部位特異的ヌクレアーゼを媒介とする改変の分野で重要な一側面は、オフターゲットヌクレアーゼ効果、例えば、目的の標的配列と1つまたは複数のヌクレオチドが異なるゲノム配列の切断である。オフターゲット切断の望ましくない副作用の範囲としては、遺伝子ターゲティング事象の間の望まれない遺伝子座への挿入から臨床的シナリオにおける重度の合併症まである。被験体に投与されたヌクレアーゼによる、必須遺伝子機能または癌抑制遺伝子をコードする配列のオフターゲット切断は、被験体に疾患または死さえもたらす可能性がある。したがって、ヌクレアーゼの有効性および安全性を決定するために、実験室または病院でそれを使用する前に、その切断選択性を特徴づけることが望ましい。さらに、ヌクレアーゼ切断特性の特徴づけにより、一群の候補ヌクレアーゼから特定の課題に最も適したヌクレアーゼを選択すること、または既存のヌクレアーゼから得られる放出産物を選択することが可能になる。また、ヌクレアーゼ切断特性のそのような特徴づけにより、向上した特異性または有効性などの向上した特性を有するヌクレアーゼの新規設計がもたらされ得る。
【0044】
ヌクレアーゼが核酸の標的操作のために使用される多くのシナリオでは、切断特異性が重要な特徴になる。操作されたヌクレアーゼ結合ドメインの一部の不完全な特異性は、in vitroおよびin vivoの両方において、オフターゲット切断および望ましくない作用をもたらす可能性がある。ELISAアッセイ、マイクロアレイ、ワンハイブリッドシステム、SELEXおよびその変形、ならびにRosettaベースの計算予測を含む、部位特異的ヌクレアーゼの特異性を評価する現行の方法はすべて、ヌクレアーゼ分子の結合特異性がその切断特異性に等価または比例しているという仮定を前提としている。
【0045】
しかしながら、ここに提示した研究は、オフターゲット結合作用の予測が、望ましくない生物学的作用をもたらし得るヌクレアーゼ切断作用の不完全な近似を与えるという発見に基づいている。この発見は、一部の部位特異的DNAヌクレアーゼに関して報告された毒性が、単にオフターゲット結合によるのではなく、オフターゲットDNA切断に起因するという考えと一致する。
【0046】
本明細書に提供する方法および試薬は、所与のヌクレアーゼの標的部位特異性の正確な評価を可能にし、適切なユニークな標的部位の選択および複雑なゲノムの文脈において、単一部位の標的切断に対して高度に特異的なヌクレアーゼの設計のための戦略を提供する。さらに、本明細書に提供する方法、試薬、および戦略により、当業者が所与の任意の部位特異的ヌクレアーゼの特異性を向上させ、かつオフターゲット作用を最小化させることが可能になる。一方、DNAおよびDNA切断ヌクレアーゼに具体的に関連して、本明細書に提供する発明概念、方法、戦略、および試薬は、この点において限定されないが、任意の核酸:ヌクレアーゼ対に適用することができる。
【0047】
部位特異的ヌクレアーゼにより切断されたヌクレアーゼ標的部位の同定
本発明の一部の態様は、任意の部位特異的ヌクレアーゼにより切断された核酸標的部位を決定するための方法および試薬を提供する。一般に、そのような方法は、ヌクレアーゼが標的部位に結合し切断するのに適した条件下で所与のヌクレアーゼと標的部位のライブラリーとを接触させるステップと、ヌクレアーゼが実際に切断する標的部位を決定するステップとを含む。実際の切断に基づいた、ヌクレアーゼの標的部位プロファイルの決定は、部位特異的ヌクレアーゼの望ましくないオフターゲット作用の媒介に関連するパラメーターを測定するという、結合に基づく方法にまさる利点を有する。
【0048】
一部の実施形態では、ヌクレアーゼの標的部位を同定する方法を提供する。一部の実施形態では、この方法は、(a)二本鎖核酸の標的部位を切断し、5’オーバーハングを生成するヌクレアーゼを準備するステップであって、標的部位が[左ハーフサイト]−[スペーサー配列]−[右ハーフサイト](LSR)構造を含み、ヌクレアーゼがスペーサー配列内の標的部位を切断するステップを含む。一部の実施形態では、この方法は、(b)ヌクレアーゼがヌクレアーゼの標的部位を含む候補核酸分子を切断するのに適切な条件下で、候補核酸分子のライブラリーにヌクレアーゼを接触させるステップであって、各核酸分子が、候補ヌクレアーゼ標的部位および一定の挿入配列を含む配列のコンカテマーを含むステップを含む。一部の実施形態では、この方法は、(c)ヌクレアーゼにより2回切断され、一方の側に左ハーフサイトおよび切断スペーサー配列が隣接し、他方の側に右ハーフサイトおよび切断スペーサー配列が隣接した一定の挿入配列を含む核酸分子の5’オーバーハングを充填し、それによって平滑末端を作製するステップを含む。一部の実施形態では、この方法は、(d)ステップ(c)の核酸分子の左ハーフサイト、右ハーフサイト、および/またはスペーサー配列の配列を決定することにより、ヌクレアーゼにより切断されたヌクレアーゼ標的部位を同定するステップを含む。一部の実施形態では、この方法は、ヌクレアーゼを準備するステップと、そのヌクレアーゼを、候補標的部位を含む候補核酸分子のライブラリーと接触させるステップとを含む。一部の実施形態では、候補核酸分子は二本鎖核酸分子である。一部の実施形態では、候補核酸分子はDNA分子である。一部の実施形態では、ヌクレアーゼは標的部位で二量体を形成し、標的部位はLSR構造([左ハーフサイト]−[スペーサー配列]−[右ハーフサイト])を含む。一部の実施形態では、ヌクレアーゼは、スペーサー配列内の標的部位を切断する。一部の実施形態では、ヌクレアーゼは、二本鎖の核酸標的部位を切断し、5’オーバーハングを生成するヌクレアーゼである。一部の実施形態では、ライブラリー中の各核酸分子は、候補ヌクレアーゼ標的部位と一定の挿入配列とを含む配列のコンカテマーを含む。
【0049】
例えば、一部の実施形態では、ライブラリーの候補核酸分子は、構造R
1−[(LSR)−(定常領域)]
X−R
2を含み、式中、R1およびR2は独立して、[(LSR)−(定常領域)]反復単位の断片を含み得る核酸配列であり、Xは2とyとの間の整数である。一部の実施形態では、yは、少なくとも10
1、少なくとも10
2、少なくとも10
3、少なくとも10
4、少なくとも10
5、少なくとも10
6、少なくとも10
7、少なくとも10
8、少なくとも10
9、少なくとも10
10、少なくとも10
11、少なくとも10
12、少なくとも10
13、少なくとも10
14、または少なくとも10
15である。一部の実施形態では、yは、10
2未満、10
3未満、10
4未満、10
5未満、10
6未満、10
7未満、10
8未満、10
9未満、10
10未満、10
11未満、10
12未満、10
13未満、10
14未満、または10
15未満である。定常領域は、一部の実施形態では、単一反復単位の効率的な自己連結反応を可能にする長さである。適切な長さは当業者には明らかである。例えば、一部の実施形態では、定常領域の長さは、100〜1000塩基対の間であり、例えば、約100塩基対、約200塩基対、約300塩基対、約400塩基対、約450塩基対、約500塩基対、約600塩基対、約700塩基対、約800塩基対、約900塩基対、約1000塩基対であり、一部の実施形態では、定常領域は、約100塩基対よりも短いか、または約1000塩基対よりも長い。
【0050】
ヌクレアーゼとライブラリー核酸とのインキュベーションにより、ヌクレアーゼが結合し切断することができる標的部位を含む、ライブラリー中のコンカテマーが切断されることになる。所与のヌクレアーゼが特異的な標的部位を高効率に切断する場合、標的部位を含むコンカテマーは、複数回切断されて、単一の反復単位を含む断片が生成することになる。ヌクレアーゼ切断によりコンカテマーから放出された反復単位は、構造S
2R−(定常領域)−LS
1になる。式中、S
1およびS
2は、ヌクレアーゼにより切断された後の相補的なスペーサー領域断片を表す。次いで、ライブラリー候補分子から放出された任意の反復単位を単離することができ、かつ/または放出された反復単位のS
2RおよびLS
1領域をシークエンシングすることにより、ヌクレアーゼにより切断されたLSRの配列を同定することができる。
【0051】
反復単位の単離およびシークエンシングに適した任意の方法を使用して、ヌクレアーゼにより切断されたLSR配列を解明することができる。例えば、定常領域の長さが既知であるので、放出された個々の反復単位を、より大きな未切断ライブラリー核酸分子および複数の反復単位を含むライブラリー核酸分子の断片(ヌクレアーゼによる非効率的な標的切断を示す)から、そのサイズに基づいて分離することができる。サイズに基づいて核酸分子を分離および/または単離するのに適した方法は、当業者には周知であり、例えば、ゲル電気泳動法、密度勾配遠心分離法、および適切な分子カットオフ値を有する半透膜上の透析などのサイズ分画法が挙げられる。次いで、分離/単離した核酸分子は、例えば、切断末端にPCRおよび/またはシークエンシングのアダプターを連結し、かつそれぞれの核酸を増幅および/またはシークエンシングすることにより、さらに特徴づけることができる。さらに、定常領域の長さが、放出された個々の反復単位の自己連結反応が容易になるように選択されている場合、そのような放出された個々の反復単位は、ヌクレアーゼで処理されたライブラリー分子をリガーゼと接触させ、次いで、自己連結した個々の反復単位の環状特性に基づいて増幅および/またはシークエンシングすることにより濃縮することができる。
【0052】
標的核酸の切断の結果として5’オーバーハングを生成するヌクレアーゼを使用する一部の実施形態では、切断された核酸分子の5’オーバーハングを充填する。5’オーバーハングを充填するための方法は当業者に周知であり、例えば、エキソヌクレアーゼ活性(Klenow(3’→5’エキソ−))を欠くDNAポリメラーゼI Klenow断片を使用する方法が挙げられる。5’オーバーハングの充填により、陥凹鎖のオーバーハングをテンプレートとした伸張が起こり、次いで平滑末端が得られる。ライブラリーコンカテマーから放出された単一反復単位の場合には、得られる構造は、平滑末端のS
2’R−(定常領域)−LS
1’であり、S
1’およびS
2’が平滑末端を含む。次いで、PCRおよび/またはシークエンシングのアダプターを、平滑末端連結反応により末端に付加することができ、それぞれの反復単位(S
2’RおよびLS
1’領域を含む)を配列決定することができる。配列データから、元のLSR領域を推定することができる。ヌクレアーゼ切断過程の間に生成したオーバーハングの平滑末端化はまた、それぞれのヌクレアーゼにより適切に切断された標的部位と、例えば、物理的な剪断などの非ヌクレアーゼ作用に基づいて非特異的に切断された標的部位との間の識別を可能にする。正確に切断されたヌクレアーゼ標的部位は、オーバーハングの充填の結果としてオーバーハングヌクレオチドの重複を含む、相補的なS
2’RおよびLS
1’領域の存在により認識することができるが、それぞれのヌクレアーゼにより切断されなかった標的部位は、オーバーハングヌクレオチドの重複を含まないと考えられる。一部の実施形態では、この方法は、放出された個々の反復単位の左ハーフサイト、右ハーフサイト、および/またはスペーサー配列の配列を決定することにより、ヌクレアーゼにより切断されたヌクレアーゼ標的部位を同定するステップを含む。それぞれのヌクレアーゼにより切断された標的部位のLSR配列を同定するために、増幅および/またはシークエンシングのための任意の適切な方法を使用することができる。核酸分子の増幅および/またはシークエンシングのための方法は当業者に周知であり、本発明はこの点において限定されない。
【0053】
本明細書に提供する方法および戦略の一部は、所与の任意のヌクレアーゼに対する可能な切断標的として複数の候補標的部位を同時に評価することを可能にする。したがって、そのような方法から得られたデータを使用して、所与のヌクレアーゼにより切断された標的部位のリストを編集することができ、これは、本明細書において標的部位プロファイルとも呼ばれる。定量的なシークエンシングデータの生成を可能にするシークエンシング法を使用する場合、それぞれのヌクレアーゼにより切断される、任意のヌクレアーゼ標的部位の検出された相対存在量を記録することも可能である。ヌクレアーゼがより効率的に切断する標的部位は、シークエンシングステップにおいてより頻度高く検出されることになるが、効率的に切断されない標的部位では、候補コンカテマーから個々の反復単位が放出されることはほとんどなく、したがって、何らかのシークエンシングリードがあっても、この標的部位が生成することはほとんどないであろう。このような定量的シークエンシングデータを標的部位プロファイルに統合して、高度に好まれるヌクレアーゼ標的部位およびあまり好まれないヌクレアーゼ標的部位のランク付けされたリストを作成することができる。
【0054】
本明細書に提供する、ヌクレアーゼ標的部位プロファイリングの方法および戦略は、例えば、ZFN、TALEN、およびホーミングエンドヌクレアーゼを含む、任意の部位特異的ヌクレアーゼに適用することができる。本明細書に詳細に記載するように、ヌクレアーゼ特異性は、通常は、ヌクレアーゼ濃度の増加と共に低下し、本明細書に記載の方法は、所与のヌクレアーゼがその目的の標的部位を効率的に切断するが、いかなるオフターゲット配列も効率的に切断することがない濃度を決定するために使用することができる。一部の実施形態では、目的のヌクレアーゼ標的部位を切断するが、10を超える、5を超える、4を超える、3を超える、2を超える、1を超える、またはいかなる新たなヌクレアーゼ標的部位も切断しない治療用ヌクレアーゼの最大濃度を決定する。一部の実施形態では、治療用ヌクレアーゼは、上記に記載のように決定された最大濃度以下の最終濃度が生じるのに有効な量で、被験体に投与される。
【0055】
ヌクレアーゼ標的部位ライブラリー
本発明の一部の実施形態は、ヌクレアーゼ標的部位プロファイリングのための核酸分子ライブラリーを提供する。一部の実施形態では、そのようなライブラリーは複数の核酸分子を含み、それぞれの核酸分子は、候補ヌクレアーゼ標的部位および一定の挿入配列スペーサー配列のコンカテマーを含む。例えば、一部の実施形態では、ライブラリーの候補核酸分子は、構造R
1−[(LSR)−(定常領域)]
X−R
2を含み、式中、R1およびR2は独立して、[(LSR)−(定常領域)]反復単位の断片を含み得る核酸配列であり、Xは2とyとの間の整数である。一部の実施形態では、yは、少なくとも10
1、少なくとも10
2、少なくとも10
3、少なくとも10
4、少なくとも10
5、少なくとも10
6、少なくとも10
7、少なくとも10
8、少なくとも10
9、少なくとも10
10、少なくとも10
11、少なくとも10
12、少なくとも10
13、少なくとも10
14、または少なくとも10
15である。一部の実施形態では、yは、10
2未満、10
3未満、10
4未満、10
5未満、10
6未満、10
7未満、10
8未満、10
9未満、10
10未満、10
11未満、10
12未満、10
13未満、10
14未満、または10
15未満である。定常領域は、一部の実施形態では、単一反復単位の効率的な自己連結反応を可能にする長さである。一部の実施形態では、定常領域は、2つ以上の反復単位を含む断片から単一反復単位を効率的に分離することを可能にする長さである。一部の実施形態では、その集合物は、1つのシークエンシングリードでの完全な反復単位の効率的なシークエンシングを可能にする長さを超えている。適切な長さは当業者には明らかである。例えば、一部の実施形態では、定常領域の長さは、100〜1000塩基対の間であり、例えば、約100塩基対、約200塩基対、約300塩基対、約400塩基対、約450塩基対、約500塩基対、約600塩基対、約700塩基対、約800塩基対、約900塩基対、約1000塩基対であり、一部の実施形態では、定常領域は、約100塩基対よりも短いか、または約1000塩基対よりも長い。
【0056】
LSR部位は、典型的には、[左ハーフサイト]−[スペーサー配列]−[右ハーフサイト]構造を含む。ハーフサイトおよびスペーサー配列の長さは、評価する特定のヌクレアーゼに依存することになる。一般に、ハーフサイトは6〜30ヌクレオチド長、好ましくは、10〜18ヌクレオチド長である。例えば、各ハーフサイトは個々に、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド長であってよい。一部の実施形態では、LSR部位は、30ヌクレオチドよりも長くてもよい。一部の実施形態では、LSRの左ハーフサイトと右ハーフサイトは、同じ長さである。一部の実施形態では、LSRの左ハーフサイトと右ハーフサイトは、異なる長さである。一部の実施形態では、LSRの左ハーフサイトと右ハーフサイトは、異なる配列である。一部の実施形態では、FokI切断ドメイン、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、および/またはブレオマイシンにより切断され得るLSRを含む候補核酸を含むライブラリーを提供する。
【0057】
一部の実施形態では、少なくとも10
5、少なくとも10
6、少なくとも10
7、少なくとも10
8、少なくとも10
9、少なくとも10
10、少なくとも10
11、または少なくとも10
12の異なる候補ヌクレアーゼ標的部位を含む候補核酸分子のライブラリーを提供する。一部の実施形態では、ライブラリーの候補核酸分子は、ローリングサイクル増幅によって、環状化されたテンプレートから産生されるコンカテマーである。一部の実施形態では、ライブラリーは、少なくとも5kDa、少なくとも6kDa、少なくとも7kDa、少なくとも8kDa、少なくとも9kDa、少なくとも10kDa、少なくとも12kDa、または少なくとも15kDaの分子量の核酸分子、例えば、コンカテマーを含む。一部の実施形態では、ライブラリー内の核酸分子の分子量は、15kDaより大きくてもよい。一部の実施形態では、ライブラリーは、特定のサイズ範囲、例えば、5〜7kDa、5〜10kDa、8〜12kDa、10〜15kDa、もしくは12〜15kDa、もしくは5〜10kDa、または任意の可能な部分範囲の範囲内にある核酸分子を含む。本発明の一部の態様による、核酸コンカテマーの生成に適した一部の方法が、大幅に異なる分子量の核酸分子の生成をもたらすが、核酸分子のそのような混合物は、所望のサイズ分布を得るためにサイズ分画することができる。所望のサイズの核酸分子の濃縮または所望のサイズの核酸分子の排除に適した方法は、当業者に周知であり、本発明は、この点において限定されない。
【0058】
一部の実施形態では、部分的に無作為化された左ハーフサイト、部分的に無作為化された右ハーフサイト、および/または部分的に無作為化されたスペーサー配列を有する標的部位を含む候補核酸分子を含むライブラリーを提供する。一部の実施形態では、部分的に無作為化された左ハーフサイト、完全に無作為化されたスペーサー配列、および部分的に無作為化された右ハーフサイトを有する標的部位を含む候補核酸分子を含むライブラリーを提供する。一部の実施形態では、部分的に無作為化された部位は、二項分布的に、平均して5%超、10%超、15%超、20%超、25%超、または30%超、コンセンサス部位と異なる。一部の実施形態では、部分的に無作為化された部位は、二項分布的に、平均して10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下、コンセンサス部位と異なる。例えば、一部の実施形態では、部分的に無作為化された部位は、5%超であるが10%以下;10%超であるが20%以下;20%超であるが25%以下;5%超であるが20%以下等、コンセンサス部位と異なる。ライブラリー中の部分的に無作為化されたヌクレアーゼ標的部位の使用は、コンセンサス部位に密接に関連のある、例えば、1残基のみ、2残基のみ、3残基のみ、4残基のみ、または5残基のみコンセンサス部位と異なる標的部位を含むライブラリーメンバーの濃度を増加させるのに有用である。この背後にある理論的根拠は、所与のヌクレアーゼ、例えば所与のZFNがその目的の標的部位および密接に関連する任意の標的部位を切断する可能性はあるが、目的の標的部位と大幅に異なるか完全に関連のない標的部位を切断する可能性は低いということである。したがって、部分的に無作為化された標的部位を含むライブラリーの使用は、所与の任意のヌクレアーゼに関する、いかなるオフターゲット切断事象の検出においても、感度を損なうことなく、完全に無作為化された標的部位を含むライブラリーの使用よりも効率がよくなり得る。したがって、部分的に無作為化されたライブラリーの使用は、所与のヌクレアーゼの実際上すべてのオフターゲット部位を包含する可能性が高いライブラリーを作製するのに必要なコストおよび負担を顕著に軽減する。しかしながら、一部の実施形態では、例えば、所与のヌクレアーゼの特異性を、所与のゲノム中の任意の可能な部位の文脈において評価しなければならない実施形態では、標的部位の完全に無作為化されたライブラリーを使用することが望ましい場合がある。
【0059】
部位特異的ヌクレアーゼの選択および設計
本発明の一部の態様は、複雑なゲノムの文脈において、単一のユニークな部位の標的切断が可能である部位特異的ヌクレアーゼの選択および設計のための方法および戦略を提供する。一部の実施形態では、同じコンセンサス配列を切断するように設計されたかまたは切断することが公知である複数の候補ヌクレアーゼを準備するステップと、各候補ヌクレアーゼにより実際に切断された標的部位をプロファイリングし、それによりあらゆる切断されたオフターゲット部位(コンセンサス標的配列とは異なる標的部位)を検出するステップと、そのように同定された1つまたは複数のオフターゲット部位に基づいて候補ヌクレアーゼを選択するステップとを含む方法を提供する。一部の実施形態では、この方法は、一群の候補ヌクレアーゼ、例えば、コンセンサス標的部位を最高の特異性で切断するヌクレアーゼ、切断するオフターゲット部位の数が最少であるヌクレアーゼ、標的ゲノムの文脈において、切断するオフターゲット部位の数が最少であるヌクレアーゼ、またはコンセンサス標的部位以外の標的部位をまったく切断しないヌクレアーゼ、から最も特異的なヌクレアーゼを選択するために使用される。一部の実施形態では、この方法は、被験体のゲノムの文脈において、ヌクレアーゼの治療有効濃度以上の濃度で、いかなるオフターゲット部位も切断しないヌクレアーゼを選択するために使用される。
【0060】
本明細書に提供する方法および試薬は、例えば、同じ目的標的部位を標的とする複数の異なるヌクレアーゼ、例えば、所与の部位特異的ヌクレアーゼ(例えば、所与のジンクフィンガーヌクレアーゼ)の複数の変異体を評価するために使用することができる。したがって、このような方法は、特異性が改善した新規の部位特異的ヌクレアーゼの展開または設計における選択ステップとして使用することができる。
【0061】
ゲノム内のユニークなヌクレアーゼ標的部位の同定
本発明の一部の実施形態は、ゲノム内のヌクレアーゼ標的部位を選択するための方法を提供する。本明細書の他の箇所で詳細に記載するように、驚くべきことに、所与のヌクレアーゼにより切断されたオフターゲット部位が、通例、コンセンサス標的部位に高度に類似している、例えば、コンセンサス標的部位と、1ヌクレオチド残基のみ、2ヌクレオチド残基のみ、3ヌクレオチド残基のみ、4ヌクレオチド残基のみ、または5ヌクレオチド残基のみ異なることが発見された。この発見に基づいて、ゲノム内のヌクレアーゼ標的部位を選択して、この部位を標的とし、ゲノム内のいかなるオフターゲット標的部位も切断しないヌクレアーゼの可能性を増大させることができる。例えば、一部の実施形態では、候補ヌクレアーゼ標的部位を同定するステップと、候補ヌクレアーゼ標的部位をゲノム内の他の配列と比較するステップとを含む方法を提供する。候補ヌクレアーゼ標的部位をゲノム内の他の配列と比較するための方法は、当業者に周知であり、例えば、汎用コンピューター上でBLASTなどの配列アラインメントソフトウェアまたはアルゴリズムを使用する、配列アラインメント法などが挙げられる。次いで、配列比較の結果に基づいて、適切なユニークなヌクレアーゼ標的部位を選択することができる。一部の実施形態では、候補ヌクレアーゼ標的部位が、ゲノム内の他のいかなる配列とも、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチド異なる場合、そのヌクレアーゼ標的部位は、ゲノム内のユニークな部位として選択され、一方、その部位がこの基準を満たさない場合、その部位は廃棄することができる。一部の実施形態では、上記に概説するように、配列比較に基づいていったん部位が選択されると、その選択部位を標的とする部位特異的ヌクレアーゼが設計される。例えば、ジンクフィンガーヌクレアーゼは、標的部位に結合するジンクフィンガーアレイを構築し、そのジンクフィンガーアレイにDNA切断ドメインをコンジュゲートすることにより、任意の選択された標的部位を標的とするように設計することができる。DNA切断ドメインがDNAを切断するために二量体形成する必要がある実施形態では、それぞれがヌクレアーゼのハーフサイトに結合し、それぞれが切断ドメインにコンジュゲートするジンクフィンガーアレイが設計される。一部の実施形態では、ヌクレアーゼの設計および/または作製は、組換え技術により行われる。適切な組換え技術は当業者に周知であり、本発明はこの点において限定されない。
【0062】
一部の実施形態では、本発明の態様に従って設計または作製した部位特異的ヌクレアーゼを、単離および/または精製する。本発明の態様による部位特異的ヌクレアーゼを設計するための方法および戦略は、これらに限定されないが、ジンクフィンガーヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジインヌクレアーゼ、抗生物質ヌクレアーゼ、およびジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、ブレオマイシン、またはそれらの誘導体、変異体または誘導体を含む、任意の部位特異的ヌクレアーゼの設計または作製に適用することができる。
【0063】
部位特異的ヌクレアーゼ
本発明の一部の態様は、本明細書に記載の方法および戦略を使用して設計される、特異性が向上した単離の部位特異的ヌクレアーゼを提供する。本発明の一部の実施形態は、そのようなヌクレアーゼをコードする核酸を提供する。本発明の一部の実施形態は、そのようなコード核酸を含む発現構築物を提供する。例えば、一部の実施形態では、ゲノム内の所望の標的部位を切断するように操作され、本明細書に提供する方法に従って、ヌクレアーゼがその目的の標的部位を切断するのに有効な濃度で、1未満、2未満、3未満、4未満、5未満、6未満、7未満、8未満、9未満、または10未満のオフターゲット部位を切断すると評価された単離ヌクレアーゼを提供する。一部の実施形態では、ゲノム内の他のいかなる部位とも、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチド残基、異なるように選択された所望のユニークな標的部位を切断するように操作された単離ヌクレアーゼを提供する。一部の実施形態では、単離ヌクレアーゼは、ジンクフィンガーヌクレアーゼ(ZFN)もしくは転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼであるか、あるいは有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ジネミシン、ネオカルチノスタチン、カリチアマイシン、エスペラマイシン、ブレオマイシン、もしくはそれらの誘導体であるかまたはそれらを含む。一部の実施形態では、単離ヌクレアーゼは、疾患または障害に関連する対立遺伝子内のコンセンサス標的部位を切断する。一部の実施形態では、単離ヌクレアーゼは、その切断が疾患または障害の治療または予防をもたらすコンセンサス標的部位を切断する。一部の実施形態では、この疾患はHIV/AIDSまたは増殖性疾患である。一部の実施形態では、対立遺伝子は、CCR5(HIV/AIDSの治療用)またはVEGFA対立遺伝子(増殖性疾患の治療用)である。
【0064】
一部の実施形態では、単離ヌクレアーゼは、医薬組成物の一部として提供される。例えば、一部の実施形態は、本明細書に提供するヌクレアーゼまたはそのようなヌクレアーゼをコードする核酸と、薬学的に許容される賦形剤とを含む医薬組成物を提供する。医薬組成物は、場合によっては、1つまたは複数のさらなる治療上活性な物質を含むことができる。
【0065】
一部の実施形態では、被験体、例えばヒト被験体に、その被験体内に標的ゲノム改変をもたらすために、本明細書に提供する組成物を投与する。一部の実施形態では、細胞を被験体から採取し、ヌクレアーゼまたはヌクレアーゼをコードする核酸とex vivoで接触させ、所望のゲノム改変が細胞にもたらされたか検出された後に、被験体に戻す。本明細書に提供する医薬組成物の説明は、ヒトへの投与に適した医薬組成物に主に向けられるが、そのような組成物は、一般に、あらゆる種類の動物への投与に適していることを、当業者ならば理解している。種々の動物への投与に適する組成物にするために、ヒトへの投与に適した医薬組成物を改変することは、十分理解されることであり、普通に熟練した獣医学の薬理学者は、もしあるとしても通常の実験作業のみでそのような改変を設計および/または実施することができる。医薬組成物の投与が企図される被験体としては、これらに限定されないが、ヒトおよび/または他の霊長類;哺乳動物、例えば、ウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に価値のある哺乳動物;および/または鳥類、例えば、ニワトリ、アヒル、ガチョウ、および/またはシチメンチョウなどの商業的に価値のある鳥類が挙げられる。
【0066】
本明細書に記載する医薬組成物の製剤は、薬理学の技術分野で公知であるかまたは今後開発される任意の方法によって調製することできる。一般に、そのような調製方法は、活性成分を賦形剤および/または1つもしくは複数の副成分と一緒に合わせ、次いで、必要かつ/または所望ならば、所望の単回または複数回用量単位にその製品を成形および/または包装するステップを含む。
【0067】
医薬製剤は、薬学的に許容される賦形剤をさらに含むことができ、賦形剤としては、本明細書で使用する場合、所望の特定の投与剤形に適する、すべての溶媒、分散媒、希釈剤、または他の液体ビヒクル、分散または懸濁の補助剤、界面活性剤、等張剤、増粘剤または乳化剤、防腐剤、固体結合剤、滑沢剤等が挙げられる。Remington’s The Science and Practice of Pharmacy,21
st Edition,A.R.Gennaro(Lippincott,Williams & Wilkins,Baltimore,MD,2006;参照により本明細書に組み込まれる)に、医薬組成物の製剤化において使用する種々の賦形剤および医薬組成物の調製のための公知の手法が開示されている。任意の従来の賦形剤媒体が、例えば、何らかの望ましくない生物学的作用をもたらすことによって、またはそうでなければ医薬組成物の他のいずれかの構成要素と有害性をもたらすように相互作用することによって、物質またはその誘導体と適合しない場合を除いて、その使用は、本発明の範囲内であることが企図される。
【0068】
本発明のこれらおよび他の実施形態の機能および利点は、以下の実施例からより完全に理解されるであろう。以下の実施例は、本発明の利点を示し、特定の実施形態を説明することを意図するものであるが、本発明の全範囲を例示することを意図するものではない。したがって、実施例は本発明の範囲を限定することを意図するものではないことが理解されるであろう。
実施例
【0069】
実施例1−ジンクフィンガーヌクレアーゼ
緒言
ジンクフィンガーヌクレアーゼ(ZFN)は、所望の標的DNA配列を認識し切断するように操作された酵素である。ZFN単量体は、非特異的なFokI制限エンドヌクレアーゼ切断ドメイン
1と融合したジンクフィンガーDNA結合ドメインからなる。FokIヌクレアーゼドメインは、DNAを切断するためには、二量体を形成して、2つのDNAハーフサイトを架橋しなければならないため
2、ZFNは、二量体としてDNAに結合する場合にのみ、可変長のスペーサー配列を挟む2つのユニークな配列を認識し、切断するように設計される。ZFNは、非相同末端結合または相同組換えのいずれかを促進することにより、哺乳動物を含む種々の生物におけるゲノム工学のために使用されてきた
3−9。強力な研究ツールの提供に加えて、ZFNには、遺伝子治療剤としての能力もある。実際、2つのZFNが最近臨床試験に入った:一つは、抗HIV治療のアプローチ(NCT00842634、NCT01044654、NCT01252641)の一部としてであり、もう一つは、抗癌治療(NCT01082926)として使用される細胞を改変するためのものである。
【0070】
DNA切断特異性はZFNの重要な特徴である。操作されたジンクフィンガードメインの一部にある不完全な特異性は、細胞毒性に結びついており
10、したがって、ZFNの特異性を決定することは、重大な関心事である。ELISAアッセイ
11、マイクロアレイ
12、細菌ワンハイブリッドシステム
13、SELEXおよびその変形
14−16、Rosettaベースの計算予測
17はすべて、単離状態の単量体ジンクフィンガードメインのDNA結合特異性を特徴づけるために使用されている。しかしながら、ZFNの毒性は、単に結合によるのではなく、DNA切断に起因すると考えられる
18、19。その結果、ジンクフィンガーヌクレアーゼの特異性に関する情報は、これまで、以下の証明されていない仮定に基づいていた、すなわち、(i)二量体ジンクフィンガーヌクレアーゼは、単離の単量体ジンクフィンガードメインがDNAに結合する場合と同じ配列特異性でDNAを切断すること;および(ii)所与のZFNにおいて、一方のジンクフィンガードメインの結合は、他方のジンクフィンガードメインの結合には影響を及ぼさないこと。単量体ジンクフィンガードメインのDNA結合特異性は、ゲノムにおける、二量体ZFNの潜在的なオフターゲット切断部位を予測するために使用されているが
6、20、本発明者らが知る限りでは、これまでの研究では、活性な二量体ジンクフィンガーヌクレアーゼの幅広いDNA切断特異性を決定するための方法は報告されていない。
【0071】
この研究において、本発明者らは、活性なZFNのDNA切断特異性を幅広く検討するためのin vitro選択法を提示する。本発明者らの選択は、10
11の潜在的な標的部位のそれぞれを切断する能力について、2つの真正ヘテロ二量体のZFN、すなわち、現在臨床試験(NCT00842634、NCT01044654、NCT01252641)中のCCR5−224
6およびヒトVEGF−Aプロモーターを標的とするVF2468
4を評価するためのハイスループットDNAシークエンシング手法と結びついている。本発明者らは、CCR5−224によりin vitroで切断され得る、ヒトゲノム中に存在する37個の部位、VF2468によりin vitroで切断され得る、ヒトゲノム中の2,652個の部位、およびヒトゲノム中に存在しない、両ZFNがin vitroで切断可能な数十万の部位を同定した。本発明者らのin vitro選択により同定された部位が、細胞においてもZFNにより切断され得ることを実証するために、本発明者らは、CCR5−224またはVF2468のZFNを発現する培養ヒトK562細胞における、ZFN誘導の突然変異誘発を証明するために、それぞれ34個または90個の部位を検討した。試験したCCR5−224部位のうちの10個、VF2468部位のうちの32個が、ヒト細胞において、ZFN媒介の切断と一致するDNA配列の変化を示した。ただし、本発明者らは、切断は、細胞型およびZFN濃度に依存するであろうと予想する。1つのCCR5−224オフターゲット部位が悪性腫瘍に関連するBTBD10遺伝子のプロモーターに存在する。
【0072】
単量体ジンクフィンガードメイン単独の結合特異性の決定によっては得ることができなかったであろう本発明者らの結果は、過剰なDNA結合エネルギーが、オフターゲットZFN切断活性の増加をもたらすことを示し、結合特異性が低下したZFNを設計することにより、ZFN発現レベルを低下させることにより、またゲノムにおいて、最も近縁な配列と少なくとも3塩基対異なる標的部位を選ぶことによりZFN特異性が向上する可能性があることを示唆する。
【0073】
結果
ZFN媒介のDNA切断に対するin vitro選択
潜在的な切断部位のライブラリーを、合成プライマーおよびPCRを使用して二本鎖DNAとして調製した(
図5)。プライマー中の部分的に無作為化された位置はそれぞれ、79%の野生型ホスホラミダイトと、他の3つのホスホラミダイトすべての等量混合物との混合物を組み込むことにより合成した。したがって、ライブラリーの配列は、二項分布的に、平均して21%が、正規のZFN切断部位と異なった。平滑連結反応の戦略を使用して、10
12メンバーの小環状ライブラリーを作製した。ローリングサークル増幅を使用して、このライブラリーの10
11超のメンバーを増幅すると共に、連結して高分子量(12kb超)DNA分子にした。理論上、このライブラリーは、野生型標的配列から7つ以下の突然変異があるDNA配列をすべて、少なくとも10倍過剰量で包含する。
【0074】
CCR5−224またはVF2468のDNA切断部位ライブラリーを14nMの全切断部位濃度で、0.5nM〜4nMの範囲の2倍希釈系列のin vitro翻訳の粗CCR5−224またはVF2468とインキュベートした(
図6)。消化後、得られたDNA分子(
図7)を、DNA切断に対するin vitro選択およびその後の対末端ハイスループットDNAシークエンシングに供した。手短に言えば、3つの選択ステップ(
図1)によって、切断されなかった配列から切断された配列を分離できるようになった。第1に、切断された部位のみが、シークエンシングに必要となるアダプターの連結に必要な5’リン酸を含有した。第2に、PCRの後、ゲル精製ステップにより、切断されたライブラリーメンバーが濃縮された。最後に、標的部位コンカテマー切断のホールマークである両末端上の充填された相補的5’オーバーハングを有する、考慮すべき配列のみをシークエンシングした後、計算フィルターを適用した(
図2およびプロトコール1〜9)。ライブラリー配列に隣接したPvuI制限ヌクレアーゼ認識部位でライブラリーを切断し、ZFN消化のライブラリー配列と同じプロトコールに消化産物を供することによって、シークエンシングのためのプレ選択ライブラリー配列を準備した。ハイスループットシークエンシングにより、ローリングサークルで増幅したプレ選択ライブラリーが予想される突然変異分布を含有することが確認された(
図8)。
【0075】
ZFN媒介のDNA切断に対するin vitro選択の設計
活性ZFNのDNA切断特異性を包括的に特徴づけるために、ノイズを増幅しバイアスを導入する可能性のある反復濃縮ステップを必要とすることなく、1ステップでDNA切断に対して選択することができる、潜在的なDNA基質の大規模なライブラリーを最初に作製した。ライブラリー中の各分子が10
11超の潜在的な基質配列のうちの1つのコンカテマーであるように、基質ライブラリーを設計した(
図5)。ZFNとのインキュベーションにより、切断されない分子、1回切断された分子、および少なくとも2回切断された分子が得られる。少なくとも2回切断された分子には、切断されたDNA配列の各半分からなる末端がある(
図1)。切断されたライブラリーメンバーは、3つの方法で、切断されないライブラリーメンバーに対して濃縮される(
図1)。第1に、2回切断された配列には、2つの相補的5’オーバーハングがあり、これらは、本物の切断産物のホールマークとして、DNAシークエンシング後に計算的に同定することができる。第2に、ZFN媒介の切断により、プレ選択ライブラリー中に存在しない5’リン酸が現れるので、切断を受けたDNAのみにシークエンシングアダプター連結反応が可能である。第3に、シークエンシングアダプターに相補的なプライマーを使用するPCRの後に、ゲル精製ステップにより、配列決定される材料すべてが、2つの隣接した部位で切断されたライブラリーメンバーと一致する長さであることが保証される。このゲル精製材料は、イルミナ法を使用するハイスループットDNAシークエンシングに供される(Bentley,D.R.et al.Accurate whole human genome sequencing using reversible terminator chemistry.Nature 456,53−9(2008))。理想的には、ZFN切断選択に使用されるライブラリーは、ZFNにより認識される長さのあらゆる可能なDNA配列からなるであろう。しかしながら、そのようなライブラリーの105メンバーごとに1つのメンバーのみが、24塩基対の認識配列のうち突然変異が7つ以内である配列を含有するであろう。オフターゲット認識配列は標的認識部位に類似している可能性が極めて高いため、その代わりとして、野生型認識配列と最大7つの突然変異だけ異なるハーフサイト配列をすべて10倍超で含有するバイアスのかかったライブラリーを使用した。ライブラリーメンバーは、認識部位の5’末端に隣接した完全に無作為化された塩基対、4−、5−、6−、または7−bpの完全に無作為化されたスペーサーを挟む2つの部分的に無作為化されたハーフサイト、および認識部位の3’末端に隣接した、別の完全に無作為化された塩基対からなる。完全に無作為化された5塩基対タグが、各ライブラリーメンバーに続く。このタグは、無作為化された隣接塩基対および無作為化されたスペーサー配列と共に、各ライブラリーメンバーに対するユニークな識別子「キー」として使用した。このユニークなキーが同一のライブラリーメンバーを含有する2つ以上の配列リードと関連する場合、これらの重複したシークエンシングリードは、PCR増幅の間に生じたと考えられ、したがって、1つのデータポイントとして処理される。
【0076】
DNA切断選択を使用する、CCR5−224およびVF2468のZFNに関する分析
配列対の各メンバーは、スペーサーの断片、全ハーフサイト、隣接したヌクレオチド、および一定配列から構成された。スペーサーの一方の末端は、通例、一方の配列に見出され、他方の末端は、その対応する対配列に見出されるが、アダプターの連結前に伸長によってオーバーハングが平滑化されるので、オーバーハング配列は両方の対配列のリードの中に存在する。スペーサー配列は、共有のオーバーハング配列を最初に同定し、次いで、オーバーハング配列とハーフサイト配列との間に存在するすべてのヌクレオチドを同定することにより再構築した。曖昧さのないヌクレオチドおよび少なくとも4ヌクレオチドのオーバーハングを含有する配列のみを分析した。全体として、同一のライブラリーメンバー上の2つの切断事象に由来するユニーク配列に対する計算スクリーニングから、切断されたライブラリーメンバーのリードを合計200万取得した(表2)。0.5nM、1nM、および2nMのCCR5−224およびVF2468の選択について分析された配列は、上記のユニークな識別子キーの使用により同定されたが、数多くの配列反復のために、4nMの選択と比較してはるかに少ない。反復配列が除去される前における、0.5nM、1nM、および2nMの選択における、大量の反復配列の存在は、それらの選択で得られたシークエンシングリードの数が、すべての実験的選択ステップで残存した個々のDNA配列の数よりも大きいことを示す。すべての対のリードにおける一定ヌクレオチドの分析によって、シークエンシングのエラー率をヌクレオチド当たり0.086%と推定した。このエラー率を使用して、ポスト選択のZFN標的部位配列の98%はエラーを含有しないと推定した。
【0077】
オフターゲット切断は、ZFN濃度に依存する
予想されるように、ライブラリーメンバーのサブセットのみが各酵素により切断された。CCR5−224およびVF2468に対するプレ選択ライブラリーはそれぞれ、完全な標的部位(2つのハーフサイト)当たり平均4.56および3.45の突然変異を含有したが、使用した最高濃度のZFN(4nMのCCR5−224および4nMのVF2468)に曝露されたポスト選択ライブラリーはそれぞれ、標的部位当たり平均2.79および1.53の突然変異を有した(
図8)。ZFN濃度が低下するにつれて、両方のZFNのオフターゲット配列に対する許容性が低下した。最低濃度(0.5nMのCCR5−224および0.5nMのVF2468)において、切断された部位はそれぞれ、平均1.84および1.10の突然変異を含有した。新しいDNAの文脈において、同定された部位の小規模なサブセットを設けて、2nMのCCR5−224または1nMのVF2468と、37℃で4時間、in vitroでインキュベートした(
図9)。試験した部位すべてについて切断が観察され、よりストリンジェントな(低いZFN濃度)選択から得られた部位は、低ストリンジェントな選択に由来する部位よりも効率的に切断された。試験した配列はすべて、幾つかの突然変異を含有するが、配列の中には、設計された標的よりも効率的にin vitroで切断されるものがあったことに留意されたい。
【0078】
二量体CCR5−224 ZFNのDNA切断特異性プロファイル(
図2aおよび
図10a、b)は、SELEXにより以前に決定されたCCR5−224単量体のDNA結合特異性プロファイル
6と顕著に異なっていた。例えば、SELEX研究によって予測されなかった、(+)A5および(+)T9などの一部の位置が、本発明者らの切断選択においては、オフターゲット塩基対に対する許容性を示した。VF2468は、DNA結合特異性に関してもDNA切断特異性に関しても以前に特徴づけがなされていないが、限定的な配列選択性を示す2つの位置、(−)C5および(+)A9を示し、これらの位置がZFNにより認識されにくいことが示唆された(
図2bおよび
図10c、d)。
【0079】
ハーフサイト間の補償はDNA認識に影響を及ぼす
本発明者らの結果は、一方のハーフサイト中に突然変異を含むZFN基質は、プレ選択ライブラリーに比較して、同じハーフサイト中の近傍の位置にさらなる突然変異を有する可能性が高く、他方のハーフサイト中にさらなる突然変異を有する可能性が低いことを示す。この効果は、最も強力に認識される塩基対が変異した場合に最大であることが見出されたが(
図11)、CCR5およびVEGFターゲティングZFNの両方に対する指定のハーフサイト位置すべてについてこの補償現象が観察された(
図3および
図12)。VF2468標的部位位置(+)G1、(−)G1、(−)A2、および(−)C3などの切断部位の少数派となるヌクレオチドの場合は、変異により、他方のハーフサイト中の塩基対における突然変異許容性が低下し、また、同じハーフサイトにおける突然変異許容性も、増大ではなくわずかに低下した。これらの突然変異のうちの2つ、(+)G1および(−)G1が同時に実行された場合は、他のすべての位置での突然変異許容性が低下した(
図13)。まとめると、これらの結果から、一方のハーフサイトの突然変異許容性が他方のハーフサイトにおけるDNA認識によって影響を受けることがわかる。
【0080】
ZFN部位認識についてのこの補償モデルは、理想的でないハーフサイトのみならず、理想的でない長さのスペーサーにも当てはまる。一般に、ZFNはスペーサー内の特定の位置で切断し(
図14)、5および6塩基対のスペーサーが4および7塩基対のスペーサーよりも好まれる(
図15および16)。しかしながら、5または6塩基対のスペーサーの切断部位は、4または7塩基対のスペーサーの部位よりも、隣接するハーフサイトの配列許容性が大きいことを示す(
図17)。したがって、スペーサーの不完全性により、ハーフサイトの突然変異と同様に、DNA基質の他の領域のin vitro認識がよりストリンジェントになる。
【0081】
ZFNは、最大3つの突然変異を含む多くの配列を切断することができる
ポスト選択ライブラリー中の各配列の出現頻度をプレ選択ライブラリー中のその出現頻度で割ることにより、3つ以下の突然変異を含有する配列すべてについて濃縮係数を算出した。切断により濃縮された配列(濃縮係数>1)の中で、CCR5−224は、すべてのユニークな単一突然変異配列、すべてのユニークな二重突然変異配列の93%、およびすべての可能な三重突然変異配列の半分を、使用した最高酵素濃度で切断することができた(
図4aおよび表3a)。VF2468は、すべてのユニークな単一突然変異配列の98%、すべてのユニークな二重突然変異配列の半分、およびすべての三重突然変異配列の17%を切断することができた(
図4bおよび表3b)。
【0082】
本発明者らの手法では、活性なZFN二量体をアッセイするので、切断され得るZFN部位の完全な配列が示される。スペーサーの配列を無視すると、選択により、CCR5−224によりin vitroで切断され得る5または6塩基対のスペーサーを有する、ヒトゲノム中の37部位(表1および表4)、およびVF2468により切断され得る、ヒトゲノム中の2,652部位(VF2468のデータ)が明らかになった。VF2468によりin vitroで切断されるゲノム部位の中で、1,428部位は、正規の標的部位(スペーサー配列を除く)に対して3つ以下の突然変異を有していた。CCR5−224に比較して、VF2468による、単一、二重、および三重突然変異配列に対する大きな識別力にもかかわらず(
図4および表3)、in vitroで切断可能なVF2468部位の数が多いことは、VF2468標的部位(3,450部位)と3つ以下の突然変異だけ異なる、ヒトゲノム中の部位の数と、CCR5−224標的部位(8部位)と3つ以下の突然変異だけ異なる、ヒトゲノム中の部位の数との差を反映している(表5)。
【0083】
同定された部位は、ヒト細胞においてZFNにより切断される
K562細胞においてCCR5−224を発現させることにより、そしてZFN誘導の突然変異を証明するために、PCRおよびハイスループットDNAシークエンシングを使用して、ヒトゲノム内の34個の潜在的な標的部位を調べることにより、ヒト細胞において、選択により同定された部位でCCR5−224が切断することができるか否かを試験した。空ベクターを含有する対照細胞と比較して、活性なCCR5−224を発現する細胞において有意(P<0.05)に濃縮された、非相同末端結合(NHEJ)修復に特徴的な挿入または欠失突然変異(インデル)を有する部位を(表6)、ZFN媒介の切断の証拠となる部位と定義した。分析する各部位について、約100,000配列以上を取得し、これによって、10,000中に約1の頻度で有意に改変された部位の検出が可能になった。分析により、10のそのような部位が同定された、すなわち、CCR5における目的の標的配列、CCR2において以前に同定された配列、および8つのオフターゲット配列(表1、4、および6)、そのうちの1つはBTBD10遺伝子のプロモーター内に位置する。8つの新たに同定されたオフターゲット部位は、1/300〜1/5,300の頻度で改変されている。さらに、培養K562細胞においてVF2468を発現させ、in vitro選択により同定された、90の最も高度に切断された部位について上記の分析を実施した。分析された90のVF2468部位のうち32が、K562細胞において、ZFN媒介ターゲティングと一致するインデルを示した(表7)。3つのCCR5−224部位および7つのVF2468部位について、部位特異的PCR増幅を得ることができなかったため、それらの遺伝子座でのNHEJの発生を分析することができなかった。まとめると、これらの観察から、in vitro選択法により同定されたオフターゲット配列には、ヒト細胞において、ZFNにより切断され得る多くのDNA配列が含まれることがわかる。
【0084】
考察
ここに提示した方法により、ヒト細胞のゲノム中に存在し、かつ切断され得る多くの配列を含めて、2つの活性な二量体ZFNにより切断され得る数十万の配列が同定された。CCR5−224 ZFNについて新たに同定された切断部位の1つは、BTBD10遺伝子のプロモーター内にある。ダウンレギュレートされると、BTBD10は、悪性腫瘍
21および膵臓β細胞のアポトーシス
22と関連した。アップレギュレートされると、BTBD10は、Aktファミリータンパク質
22、23のリン酸化を介して、神経細胞の増殖
23および膵臓β細胞の増殖を促進することが示された。この潜在的に重要なオフターゲット切断部位および本発明者らが細胞において観察した7つの他の部位は、in vitro単量体結合データを使用して、潜在的なCCR5−224基質を予測する最近の研究
6では同定されなかった。
【0085】
本発明者らは、1つの細胞株において複数部位で切断することができるZFNが、おそらくはクロマチン構造の局所的な相違により、異なる細胞株
4で必ずしも機能することができるとは限らないことを以前示した。したがって、CCR5−224またはVF2468が異なる細胞株で発現された場合、in vitroで切断可能なオフターゲット部位の異なるサブセットが、それらにより改変される可能性がある。ホーミングエンドヌクレアーゼオフターゲット切断
24に関する最近の研究など、エンドヌクレアーゼ特異性に関する純粋に細胞レベルの研究も、同様に細胞株の選択により影響を受けることがある。本発明者らのin vitroの方法は、細胞内DNAのいくつかの特徴を考慮しないが、この方法は、目的の細胞型で実施されるその後の研究に伝えることができる、エンドヌクレアーゼ特異性およびオフターゲット部位に関する、細胞型に依存しない一般的な情報を提供する。加えて、本発明者らのプレ選択ライブラリーは、目的のZFN標的部位の突然変異が7つ以内のすべての配列を少なくとも10倍のカバレッジでオーバーサンプリングしているが、選択当たり得られる配列リードの数(約100万)は、ポスト選択ライブラリー中に存在するすべての切断配列をカバーするには不十分であるように思われる。したがって、シークエンシング性能の改善が続いているので、CCR5−224およびVF2468についてのさらなるオフターゲット切断部位が、ヒトゲノムにおいて同定され得る可能性がある。
【0086】
本発明者らが分析したZFNは両方とも、ヒトゲノム中のユニーク配列に対して操作されたが、両方とも細胞中の相当数のオフターゲット部位を切断する。この結果は、4フィンガーCCR5−224対の理論上の特異性が、3フィンガーVF2468対よりも4,096倍優れていることを考えると、4フィンガーCCR5−224対については、特に驚くべきことである(CCR5−224は、18塩基対のVF2468部位よりも6塩基対長い24塩基対の部位を認識するはずである)。CCR5−224およびVF2468の切断プロファイル(
図2)ならびに3つ以下の突然変異を含む配列の突然変異許容性(
図4)を検討すると、オフターゲット切断活性が低下した、これらのZFNの変異体を操作するための異なる戦略が必要となり得ることが示唆される。4フィンガーCCR5−224 ZFNは、3フィンガーVF2468 ZNFよりも、広範囲の位置で特異性が緩和しており、かつ3つ以下の突然変異を含む突然変異配列に高い許容性を示した。VF2468の場合は、フィンガーのサブセットのみの再最適化により、望ましくない切断事象の実質的な減少を可能することができる。これに対して、CCR5−224の場合は、フィンガーの多くまたはすべての広範囲な再最適化が、オフターゲット切断事象を除去するために必要となる可能性がある。
【0087】
4フィンガーおよび3フィンガーのすべてのZFNが、この研究で試験した2つのZFNほど特異的であるとは必ずしも限らないことに留意する。CCR5−224およびVF2468は両方とも、ZFNの結合活性を最適化するように設計する方法を使用して操作された。以前の研究から、3フィンガーおよび4フィンガーの両方のZFNの場合、ZFN対を操作するために使用する具体的な方法が、ヌクレアーゼの品質および特異性に多大な影響を及ぼし得ることがわかっている
7、13、25、26。
【0088】
本発明者らの発見は、特異性が向上したZFNの設計および適用にとって重要な意味をもつ。1つまたは2つの部位に突然変異を有するすべての潜在的な基質の半分以上がZFNにより切断される可能性があり、このことは、ZFNとDNA基質との間の結合親和性が、突然変異した位置での分子相互作用が最適以下の場合でも切断を起こすのに十分高いことを示唆する。本発明者らはまた、一方のハーフサイト中に突然変異を有する部位を提示されたZFNは、突然変異したハーフサイト内の他の部位でのより高い突然変異許容性および他方のハーフサイトの位置でのより低い許容性を示すことを観察した。これらの結果をまとめると、切断のための最小の親和性閾値を満たすためには、オフターゲット塩基対を包含するハーフサイトからの結合エネルギーの不足が、別のハーフサイトにおける過剰なジンクフィンガー:DNA結合エネルギーによってエネルギー的に補償されなければならず、これには、変異していないハーフサイトでの配列認識ストリンジェンシーの増大が要求される(
図S18)。逆に、変異したハーフサイトの他の位置でのストリンジェンシーの緩和は、全体のZFN結合エネルギーへの変異したハーフサイトの寄与が低下したことにより説明することができる。この仮説は、ZFNにおけるジンクフィンガーの数が減少すると、実際には、活性が低下するよりもむしろ増大することを示す最近の研究によって支持される
27。
【0089】
このモデルはまた、おそらくZFNによりそれほど有利に結合されない、スペーサーの長さが最適以下の部位が、スペーサーの長さが最適な部位よりも高いストリンジェンシーで認識されたという本発明者らの観察を説明する。in vitroでのスペーサー選択性は、必ずしも細胞でのスペーサー選択性を反映するものではない
28、29;しかしながら、本発明者らの結果は、二量体のFokI切断ドメインがZFN標的部位認識に影響を及ぼすことができることを示唆する。このモデルと一致して、Wolfeおよび共同研究者は、ジンクフィンガードメインは同じであるが、FokIドメイン変異体が異なる2つのZFNにおける、ゼブラフィッシュでのオフターゲット事象の頻度の差を最近観察した
20。
【0090】
まとめると、本発明者らの発見は、以下のことを示唆する、すなわち、(i)ZFNの特異性は、過剰なDNA結合エネルギーを有するZFNの設計を回避することにより、向上させることができること;(ii)オフターゲット切断は、突然変異が3つ以内の類縁部位をゲノム中に有さない標的部位に対して、ZFNを設計することにより、最小化することができること;および(iii)ZFNは、標的配列を所望の程度に切断するのに必要な最低濃度で使用されるべきであること。この研究はZFNに焦点を合わせたが、本発明者らの方法は、操作されたホーミングエンドヌクレアーゼおよび操作された転写活性化因子様エフェクター(TALE)ヌクレアーゼを含む、in vitroでDNAを切断する配列特異的エンドヌクレアーゼすべてに適用可能である。この手法は、配列特異的エンドヌクレアーゼのためにゲノム中の標的部位を選ぶ場合、および特に治療用途のためにこれらの酵素を操作する場合、重要な情報を提供することができる。
【0091】
方法
オリゴヌクレオチドおよび配列。オリゴヌクレオチドはすべて、Integrated DNA TechnologiesまたはInvitrogenから購入したものであり、表8に収載する。縮重した位置を有するプライマーは、指定の塩基を79%および他の標準DNA塩基のそれぞれを7%含有する、手動で混合したホスホラミダイトを使用して、Integrated DNA Technologiesにより合成された。
【0092】
この研究で使用したZFNの配列。この研究で使用したZFNについてのDNAおよびタンパク質の配列を示す。T7プロモーターに下線を付し、開始コドンを太字で示す。
【数1】
【数2】
【0093】
ライブラリーの構築。標的部位のライブラリーを、プライマーの「N5−PvuI」および「CCR5−224−N4」、「CCR5−224−N5」、「CCR5−224−N6」、「CCR5−224−N7」、「VF2468−N4」、「VF2468−N5」、「VF2468−N6」、または「VF2468−N7」を用い、pUC19開始テンプレート上でのTaq DNAポリメラーゼ(NEB)によるPCRによって、二本鎖DNAに組み込み、ライブラリー配列に隣接してPvuI制限部位を含む約545bpの産物を生じさせ、Qiagen PCR精製キットで精製した。
【0094】
ライブラリーをコードするオリゴヌクレオチドは、5’骨格−PvuI部位−NNNNNN−部分的に無作為化されたハーフサイト−N
4−7−部分的に無作為化されたハーフサイト−N−骨格3’の形態にした。精製したオリゴヌクレオチド混合物(約10μg)を平滑化し、1×NEBNext末端修復反応緩衝液(50mM Tris−HCl、10mM MgCl
2、10mMジチオスレイトール、1mM ATP、0.4mM dATP、0.4mM dCTP、0.4mM dGTP、0.4mM dTTP、pH7.5)中の50単位のT4ポリヌクレオチドキナーゼと15単位のT4 DNAポリメラーゼとの混合物を用いて、室温で1.5時間リン酸化した。平滑末端を有しリン酸化されたDNAを、製造業者のプロトコールに従ってQiagen PCR精製キットにより精製し、NEB T4 DNAリガーゼ緩衝液(50mM Tris−HCl、10mM MgCl
2、10mMジチオスレイトール、1mM ATP、pH7.5)中で10ng/μLに希釈し、200単位のT4DNAリガーゼ(NEB)による、室温で15.5時間の連結反応により環状化した。環状単量体を、1%のTAE−アガロースゲル上でゲル精製した。70ngの環状単量体を、Illustra TempliPhi 100増幅キット(GE Healthcare)を用いて、100μLの反応液中にて、30℃で20時間、ローリングサークル増幅の基質として使用した。反応を65℃で10分間のインキュベーションにより停止させた。標的部位ライブラリーは、Quant−iT PicoGreen dsDNA試薬(Invitrogen)により定量した。部分的に無作為化されたハーフサイト間にN
4、N
5、N
6、およびN
7のスペーサー配列を含むライブラリーを、CCR5−224およびVF2468の両方のために、等モル濃度でプールした。
【0095】
ジンクフィンガーヌクレアーゼの発現および特徴づけ。CCR5−224およびVF2468のための3×FLAGタグ付きジンクフィンガータンパク質を、pMLM290およびpMLM292に由来する哺乳動物発現ベクター
4中の、FokI真正ヘテロ二量体への融合物として発現させた。DNAおよびタンパク質の配列は、本明細書の他の箇所に示す。完全なベクター配列は、要請により入手可能である。ZFNをコードするベクター2μgを、TNT Quick Coupledウサギ網状赤血球システム(Promega)を使用して、in vitroで転写および翻訳した。塩化亜鉛(Sigma−Aldrich)を500μMで加え、転写/翻訳反応を30℃で2時間実施した。グリセロールを50%の最終濃度まで加えた。ウエスタンブロットを用い、抗FLAG M2モノクローナル抗体(Sigma−Aldrich)を使用してタンパク質を視覚化した。ZFN濃度は、ウエスタンブロットを行い、N末端FLAGタグ付き細菌アルカリホスファターゼ(Sigma−Aldrich)の標準曲線と比較することにより決定した。
【0096】
CCR5−224およびVF2468に対する試験基質は、pUC19のHindIII/XbaI部位にクローニングすることにより構築した。プライマーの「test fwd」および「test rev」ならびにTaq DNAポリメラーゼを用いるPCRにより、適切なZFNによりサイズが約300bpおよび約700bpの2つの断片に切断され得る、1kbの線状DNAが得られた。ジンクフィンガーヌクレアーゼに対する活性プロファイルは、Millerら
30およびCradickら
31が使用したin vitro切断プロトコールを改変して取得した。1kbの線状DNA1μgを、1×NEBuffer 4(50mM酢酸カリウム、20mM Tris−酢酸、10mM酢酸マグネシウム、1mMジチオスレイトール、pH7.9)中で、種々の濃度のZFNにより37℃で4時間消化した。RNアーゼA(Qiagen)100μgを、室温で10分間反応物に加えて、精製およびゲル分析を妨害する可能性のあるRNAをin vitroの転写/翻訳混合物から除去した。反応物をQiagen PCR精製キットにより精製し、1%のTAEアガロースゲルで分析した。
【0097】
in vitro選択。種々の濃度のZFN、タンパク質をコードするDNAテンプレートをまったく含まない、使用したZFNの最大濃度に等しい量のTNT反応混合物(「溶解物」)、または50単位のPvuI(NEB)を、1×NEBuffer 4(50mM酢酸カリウム、20mM Tris−酢酸、10mM酢酸マグネシウム、1mMジチオスレイトール、pH7.9)中で、37℃で4時間、ローリングサークル増幅ライブラリー1μgとインキュベートした。RNアーゼA(Qiagen)100μgを、室温で10分間反応物に加えて、精製およびゲル分析を妨害する可能性のあるRNAをin vitroの転写/翻訳混合物から除去した。反応物をQiagen PCR精製キットにより精製した。反応混合物の1/10を、1%のTAEアガロースゲル上でのゲル電気泳動およびSYBR Gold核酸ゲル染色(Invitrogen)による染色によって視覚化した。
【0098】
精製したDNAを、室温で30分間、500μM dNTP混合物(Bio−Rad)を含有する1×NEBuffer 2(50mM NaCl、10mM Tris−HCl、10mM MgCl
2、1mMジチオスレイトール、pH7.9)中で、5単位のDNAポリマラーゼI、ラージ(Klenow)フラグメント(NEB)により平滑化した。反応混合物をQiagen PCR精製キットにより精製し、最終容量50μLにて、240μM dATP(Promega)を含有する1×NEBuffer 2(50mM NaCl、10mM Tris−HCl、10mM MgCl
2、1mMジチオスレイトール、pH7.9)中で、37℃で30分間、5単位のKlenowフラグメント(3’exo
−)(NEB)とインキュベートした。10mM Tris−HCl、pH8.5を90μL容量まで加え、反応物を75℃で20分間インキュベートして、酵素を不活性化した後、12℃に冷却した。酵素濃度に従ってバーコードが付けられた、300fmolの「アダプター1/2」またはPvuI消化のための6pmolの「アダプター1/2」を、10×NEB T4 DNAリガーゼ反応緩衝液(500mM Tris−HCl、100mM MgCl
2、100mMジチオスレイトール、10mM ATP)10ulと共に、反応混合物に加えた。アダプターを、室温で17.5時間、400単位のT4DNAリガーゼにより平滑DNA末端上に連結し、連結したDNAを、Illustra Microspin S−400 HRセファクリルカラム(GE Healthcare)を用いて精製し、連結していないアダプターを除去した。アダプターが連結したDNAを、2単位のPhusion Hot Start II DNAポリメラーゼ(NEB)ならびにそれぞれ10pmolのプライマー「PE1」および「PE2」を用いて、3%DMSOおよび1.7mM MgCl
2を添加した1×Phusion GC緩衝液中で増幅した。PCR条件は、98℃で3分間に続く、98℃で15秒間、60℃で15秒間、および72℃で15秒間のサイクル、および72℃での最終的な5分間伸長とした。PCRは、ゲル上で産物を可視化するのに十分なサイクル(典型的には20〜30)行った。反応物を等モル量でプールし、Qiagen PCR精製キットにより精製した。精製したDNAを、1%のTAEアガロースゲル上でゲル精製し、Illumina36塩基対末端シークエンシングのために、Harvard Medical School Biopolymers Facilityに提出した。
【0099】
データ解析。Illuminaシークエンシングリードを、C++で書かれたプログラムを使用して解析した。アルゴリズムは、本明細書の他の箇所(例えば、プロトコール1〜9)に別記されており、要請によりソースコードは入手可能である。両方の対配列上に同じバーコードを含有し、品質スコアが「B」の位置を含有しない配列をバーコードによりビニングした(binned)。ハーフサイト配列、オーバーハングおよびスペーサー配列、ならびに隣接した無作為化された位置を、一定配列との位置的関係および設計したCCR5−224およびVF2468の認識配列に類似した配列の検索により決定した。これらの配列を、2つの隣接しかつ同一の部位で切断されたローリングサークルコンカテマーに対応する、少なくとも4塩基対の相補的な充填されたオーバーハング末端に対する計算選択ステップに供した。特異性スコアを以下の式により算出した:正の特異性スコア=(その位置の塩基対の頻度[ポスト選択]−その位置の塩基対の頻度[プレ選択])/(1−その位置の塩基対の頻度[プレ選択])および負の特異性スコア=(その位置の塩基対の頻度[ポスト選択]−その位置の塩基対の頻度[プレ選択])/(その位置の塩基対の頻度[プレ選択])。
【0100】
正の特異性スコアは、所与の位置において、出発ライブラリーよりもポスト選択ライブラリーで高い頻度で出現する塩基対を反映する;負の特異性スコアは、所与の位置において、出発ライブラリーよりもポスト選択ライブラリーで頻度が低い塩基対を反映する。+1のスコアは絶対的な選択性を示し、−1のスコアは完全な非許容性を示し、0のスコアは選択性がないことを示す。
【0101】
ヒト細胞における切断部位でのゲノム改変のアッセイ。CCR5−224 ZFNを、CMV駆動哺乳動物発現ベクターの中にクローニングした。この発現ベクターでは、両方のZFN単量体が、以前に記載のベクター
32と同様の自己切断T2Aペプチド配列を使用して、化学量論的量で同じmRNA転写物から翻訳される。このベクターはまた、ZFN発現カセットの下流にあるPGKプロモーターから高感度緑色蛍光タンパク質(eGFP)を発現する。eGFPのみを発現する空ベクターを、陰性対照として使用した。
【0102】
細胞内にZFN発現プラスミドを送達するために、活性なCCR5−224 ZFNのDNAまたは空ベクターDNAのいずれか15μgを、Cell Line Nucleofector Kit V(Lonza)についての製造業者の使用説明書に従って、Nucleofect 2×10
6 K562細胞に二つ組の反応で使用した。GFP陽性細胞をトランスフェクションの24時間後にFACSにより単離し、増殖させ、トランスフェクションの5日後にQIAamp DNA Blood Mini Kit(Qiagen)により回収した。
【0103】
37の潜在的なCCR5−224基質および97の潜在的なVF2468基質に対するPCRを、Phusion DNAポリメラーゼ(NEB)およびプライマー「[ZFN][#]fwd」および「[ZFN][#]rev」(表9)を用いて、3%DMSOを添加した1×Phusion HF緩衝液中で実施した。プライマーはPrimer3
33を使用して設計した。増幅したDNAを、Qiagen PCR精製キットにより精製し、10mM Tris−HCl、pH8.5で溶出し、LabChip GX機器(Caliper Life Sciences)上で、1K Chipにより定量し、触媒活性ベクター試料および空ベクター対照試料について、別々の等モルプールにまとめた。3つのCCR5部位および7つのVF2468部位に対するPCR産物は得られなかったので、これらの試料はさらなる解析から除外した。多重Illuminaライブラリーの調製を、アダプター連結反応およびPCR濃縮ステップの後に精製のためにAMPure XPビーズ(Agencourt)を使用することを除いて、製造業者の説明書に従って実施した。Illuminaインデックス11(「GGCTAC」)および12(「CTTGTA」)をZFN処理ライブラリー用に使用し、インデックス4(「TGACCA」)および6(「GCCAAT」)を空ベクター対照用に使用した。ライブラリー濃度は、Illuminaゲノムアナライザープラットフォーム(Kapa Biosystems)用のKAPAライブラリー定量キットにより定量した。活性ベクターおよび空ベクター処理細胞に由来する、等量のバーコード付きライブラリーを10nMに希釈し、Harvard University FAS Center for Systems Biology Core facilityのIllumina HiSeq 2000上のシングルリードシークエンシングに供した。活性ZFN試料および空ベクター対照について、プロトコール9を使用して配列を解析した。
【0104】
統計解析。
図8では、P値を、CCR5−224またはVF2468に関し、プレ選択、0.5nMのポスト選択、1nMのポスト選択、2nMのポスト選択、および4nMのポスト選択のライブラリー間のあらゆる可能なペアワイズ比較における、標的部位の突然変異数の平均値の差の片側検定について算出した。t−統計は、t=(x_bar
1−x_bar
2)/sqrt(l×p_hat
1×(1−p_hat
1)/n
1+l×p_hat
2×(1−p_hat
2)/n
2)として算出した。式中、x_bar
1およびx_bar
2は比較する分布の平均であり、lは標的部位の長さ(CCR5−224については24;VF2468については18)であり、p_hat
1およびp_hat
2は各ライブラリーついての突然変異の計算確率(x_bar/l)であり、n
1およびn
2は各選択について分析した配列の総数である(表2)。プレ選択ライブラリーおよびポスト選択ライブラリーはすべて、二項分布すると仮定した。
【0105】
表4および7では、P値を、活性なZFN試料および空ベクター対照試料に由来する挿入または欠失を含む配列の割合における差の片側検定について算出した。t−統計は、t=(p_hat
1−p_hat
2)/sqrt((p_hat
1×(1−p_hat
1)/n
1)+(p_hat
2×(1−p_hat
2)/n
2))として算出した。式中、p_hat
1およびn
1はそれぞれ、活性な試料に由来する配列の割合および総数であり、p_hat
2およびn
2はそれぞれ、空ベクター対照試料に由来する配列の割合および総数である。
【0106】
プロット。ヒートマップはすべて、下記のコマンドを用いて、Rソフトウェアパッケージで生成した:image([variable],zlim =c(−1,1),col=colorRampPalette(c(”red”,”white”,”blue”),space=”Lab”)(2500)。
【0107】
プロトコール1:品質スコアフィルタリングおよび配列ビニング(binning)。
1)シークエンシングリードの両方の対のそれぞれの位置を品質スコアについて検索し、いずれかの位置が品質スコア=「B」である場合、拒絶する。
2)対中の最初の配列がバーコード(「AAT」、「ATA」、「TAA」、「CAC」、「TCG」)で開始するすべての配列リードを別々のファイルに出力し、各バーコードに対応する配列の数をカウントする。
【0108】
プロトコール2:ZFN(「AAT」、「ATA」、「TAA」、「CAC」)によるフィルタリング
各ビニングされたファイルについて、
1)対中の両方の配列が同じバーコードで開始する配列対のみを受け入れる。
2)定常領域の検索によってシークエンスリードの配向を同定する。
−配向1は、定常領域「CGATCGTTGG」により同定する。
−配向2は、定常領域「CAGTGGAACG」により同定する。
3)同定された定常領域に対応する、CCR5−224およびVF2468のハーフサイトと比較して最少の突然変異を有する部分配列について、位置4(バーコード後)から定常領域の最初の位置までの配列を検索する。
−「GATGAGGATGAC」(CCR5−224(+))および「GACGCTGCT」(VF2468(−))について、配向1の配列を検索する。
−「AAACTGCAAAAG」(CCR5−224(−))および「GAGTGAGGA」(VF2468(+))について、配向2の配列を検索する。
4)両方のハーフサイトにわたって最少の突然変異について調べることによって、CCR5−224またはVF2468として配列をビニングする。
5)ハーフサイトおよび一定配列の位置を使用して、オーバーハング/スペーサー配列、隣接するヌクレオチド配列、およびタグ配列を決定する。
−配向1のハーフサイトと定常領域との間の部分配列はタグ配列である。
oタグ配列がない場合は、タグ配列は「X」と表示される。
−オーバーハング配列は、バーコードの後に開始する、配向1と配向2の部分配列間の最長の逆相補的部分配列を検索することにより決定する。
−スペーサー配列は、オーバーハングとハーフサイト(もしあれば)との間にある、配向1の部分配列の逆相補鎖を、オーバーハングとハーフサイトとの間にある、配向2の部分配列に連結することにより決定する。
oオーバーハングとハーフサイトとの間にオーバーラップがある場合は、オーバーハングの中に存在するオーバーラップしていない部分配列のみをスペーサーの一部としてカウントする。
6)重複配列を除去するために、各配列対をツリーの中にソートする。
−ツリーの各レベルは配列の位置に対応する。
−各レベルの各ノードは、特定の塩基(A、C、G、T、またはX=not(A、C、G、またはT))に対応し、次の位置の塩基(A、C、G、T、X)を指す。
−配列対をノードにコードし、スペーサー配列、隣接するヌクレオチド配列、およびタグ配列の連結からなる部分配列をツリーにソートする。
−ツリーの終端ノードにおいて、新たに加わる各配列を、重複を回避するためにノードにおける他のすべての配列と比較する。
7)ツリーのコンテンツを、バーコードおよびZFNに基づいて別々のファイルに再帰的に出力する。
【0109】
プロトコール3:ライブラリーのフィルタリング(「TCG」)
1)対中の両方の配列が同じバーコードで開始する配列対のみを受け入れる。
2)配列「TCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGAC」を含有しない配列対を分析する(他方の対はライブラリー配列を含有する)。
3)ZFNハーフサイトについて配列を検索し、突然変異がより少ないZFN部位によってビニングする。
−「GTCATCCTCATC」および「AAACTGCAAAAG」(CCR5−224)ならびに「AGCAGCGTC」および「GAGTGAGGA」(VF2468)について検索する。
4)ハーフサイトの位置に基づいて、スペーサー、隣接するヌクレオチド、およびヌクレオチドタグ配列を同定する。
5)ZFNによるフィルタリングの下で、ステップ6のツリーアルゴリズムを使用して、重複配列を除去する。
【0110】
プロトコール4:配列プロファイル
1)「N」位置を含有せず、スペーサーの長さが4〜7の間である配列のみを分析する。
2)突然変異の総数、スペーサーの長さ、オーバーハングの長さ、(+)および(−)ハーフサイトに関するヌクレオチド頻度、長さが4−bp、5−bp、6−bp、および7−bpのスペーサーに関するヌクレオチド頻度、および隣接するヌクレオチドおよびタグ配列に関するヌクレオチド頻度を表にする。
3)ライブラリー配列について、ステップ1および2を反復する。
4)各位置での特異性スコアを、正の特異性スコア=(その位置の塩基対の頻度[ポスト選択]−その位置の塩基対の頻度[プレ選択])/(1−その位置の塩基対の頻度[プレ選択])、負の特異性スコア=(その位置の塩基対の頻度[ポスト選択]−その位置の塩基対の頻度[プレ選択])/(その位置の塩基対の頻度[プレ選択])を使用して算出する。
【0111】
プロトコール5:ゲノムのマッチ
1)ヒトゲノム配列を、5または6塩基のすべてのスペーサー配列を受け入れた正規標的部位の9つの突然変異(CCR5−224)または6つの突然変異(VF2468)以内のすべての部位について、24および25の塩基ウィンドウ(CCR5−224)および18および19の塩基ウィンドウ(VF2468)で検索した。
2)各ポスト選択配列を、CCR5−224およびVF2468のそれぞれ9つおよび6つの突然変異以内のゲノム配列セットと比較した。
【0112】
プロトコール6:0、1つ、2つ、または3つの突然変異を含む配列に対する濃縮係数
1)各配列について、ポスト選択ライブラリー中の出現頻度を、プレ選択ライブラリー中の出現頻度で割る。
【0113】
プロトコール7:フィルタリングされた配列のプロファイル
1)配列プロファイルにおいて、プレ選択およびポスト選択の両方のデータについて、所与の位置にオフターゲット塩基を有する配列のみをさらに分析することを除いて、上記のアルゴリズムを使用する。
【0114】
プロトコール8:補償差マップ
1)両方のハーフサイトにおけるあらゆる位置での突然変異について、フィルタリングされた配列プロファイルアルゴリズムを使用する。
2)Δ(特異性スコア)=フィルタリングされた特異性スコア−フィルタリングされていない特異性スコア、を計算する。
【0115】
プロトコール9:NHEJ検索
1)正確な隣接配列を検索することにより部位を同定する。
2)計算部位の長さを予測部位の長さと比較し、非改変標的部位(目的部位と比較して5つ以下の突然変異を含む配列を非改変とカウントした)との類似性を検索することにより、挿入または欠失の塩基の数をカウントする。
3)本当の挿入または欠失を同定するために、CCR5、CCR2、およびVEGF−Aプロモーター以外のすべての部位を手動で点検する。
【0116】
参考文献
1. Kim, Y.G., Cha, J. & Chandrasegaran, S. Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proc Natl Acad Sci U S A 93, 1156−60 (1996).
2. Vanamee, E.S., Santagata, S. & Aggarwal, A.K. FokI requires two specific DNA sites for cleavage. J Mol Biol 309, 69−78 (2001).
3. Hockemeyer, D. et al. Efficient targeting of expressed and silent genes in human ESCs and iPSCs using zinc−finger nucleases. Nat Biotechnol 27, 851−7 (2009).
4. Maeder, M.L. et al. Rapid “open−source” engineering of customized zinc−finger nucleases for highly efficient gene modification. Mol Cell 31, 294−301 (2008).
5. Zou, J. et al. Gene targeting of a disease−related gene in human induced pluripotent stem and embryonic stem cells. Cell Stem Cell 5, 97−110 (2009).
6. Perez, E.E. et al. Establishment of HIV−1 resistance in CD4+ T cells by genome editing using zinc−finger nucleases. Nat Biotechnol 26, 808−16 (2008).
7. Urnov, F.D. et al. Highly efficient endogenous human gene correction using designed zinc−finger nucleases. Nature 435, 646−51 (2005).
8. Santiago, Y. et al. Targeted gene knockout in mammalian cells by using engineered zinc−finger nucleases. Proc Natl Acad Sci U S A 105, 5809−14 (2008).
9. Cui, X. et al. Targeted integration in rat and mouse embryos with zinc−finger nucleases. Nat Biotechnol 29, 64−7 (2011).
10. Cornu, T.I. et al. DNA−binding specificity is a major determinant of the activity and toxicity of zinc−finger nucleases. Mol Ther 16, 352−8 (2008).
11. Segal, D.J., Dreier, B., Beerli, R.R. & Barbas, C.F., 3rd. Toward controlling gene expression at will: selection and design of zinc finger domains recognizing each of the 5’−GNN−3’ DNA target sequences. Proc Natl Acad Sci U S A 96, 2758−63 (1999).
12. Bulyk, M.L., Huang, X., Choo, Y. & Church, G.M. Exploring the DNA−binding specificities of zinc fingers with DNA microarrays. Proc Natl Acad Sci U S A 98, 7158−63 (2001).
13. Meng, X., Thibodeau−Beganny, S., Jiang, T., Joung, J.K. & Wolfe, S.A. Profiling the DNA−binding specificities of engineered Cys2His2 zinc finger domains using a rapid cell−based method. Nucleic Acids Res 35, e81 (2007).
14. Wolfe, S.A., Greisman, H.A., Ramm, E.I. & Pabo, C.O. Analysis of zinc fingers optimized via phage display: evaluating the utility of a recognition code. J Mol Biol 285, 1917−34 (1999).
15. Segal, D.J. et al. Evaluation of a modular strategy for the construction of novel polydactyl zinc finger DNA−binding proteins. Biochemistry 42, 2137−48 (2003).
16. Zykovich, A., Korf, I. & Segal, D.J. Bind−n−Seq: high−throughput analysis of in vitro protein−DNA interactions using massively parallel sequencing. Nucleic Acids Res 37, e151 (2009).
17. Yanover, C. & Bradley, P. Extensive protein and DNA backbone sampling improves structure−based specificity prediction for C2H2 zinc fingers. Nucleic Acids Res (2011).
18. Beumer, K., Bhattacharyya, G., Bibikova, M., Trautman, J.K. & Carroll, D. Efficient gene targeting in Drosophila with zinc−finger nucleases. Genetics 172, 2391−403 (2006).
19. Bibikova, M., Golic, M., Golic, K.G. & Carroll, D. Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc−finger nucleases. Genetics 161, 1169−75 (2002).
20. Gupta, A., Meng, X., Zhu, L.J., Lawson, N.D. & Wolfe, S.A. Zinc finger protein−dependent and −independent contributions to the in vivo off−target activity of zinc finger nucleases. Nucleic Acids Res 39, 381−92 (2011).
21. Chen, J. et al. Molecular cloning and characterization of a novel human BTB domain−containing gene, BTBD10, which is down−regulated in glioma. Gene 340, 61−9 (2004).
22. Wang, X. et al. Glucose metabolism−related protein 1 (GMRP1) regulates pancreatic beta cell proliferation and apoptosis via activation of Akt signalling pathway in rats and mice. Diabetologia 54, 852−63 (2011).
23. Nawa, M., Kanekura, K., Hashimoto, Y., Aiso, S. & Matsuoka, M. A novel Akt/PKB−interacting protein promotes cell adhesion and inhibits familial amyotrophic lateral sclerosis−linked mutant SOD1−induced neuronal death via inhibition of PP2A−mediated dephosphorylation of Akt/PKB. Cell Signal 20, 493−505 (2008).
24. Petek, L.M., Russell, D.W. & Miller, D.G. Frequent endonuclease cleavage at off−target locations in vivo. Mol Ther 18, 983−6 (2010).
25. Hurt, J.A., Thibodeau, S.A., Hirsh, A.S., Pabo, C.O. & Joung, J.K. Highly specific zinc finger proteins obtained by directed domain shuffling and cell−based selection. Proc Natl Acad Sci U S A 100, 12271−6 (2003).
26. Ramirez, C.L. et al. Unexpected failure rates for modular assembly of engineered zinc fingers. Nat Methods 5, 374−5 (2008).
27. Shimizu, Y. et al. Adding Fingers to an Engineered Zinc Finger Nuclease Can Reduce Activity. Biochemistry 50, 5033−41 (2011).
28. Bibikova, M. et al. Stimulation of homologous recombination through targeted cleavage by chimeric nucleases. Mol Cell Biol 21, 289−97 (2001).
29. Handel, E.M., Alwin, S. & Cathomen, T. Expanding or restricting the target site repertoire of zinc−finger nucleases: the inter−domain linker as a major determinant of target site selectivity. Mol Ther 17, 104−11 (2009).
30. Miller, J.C. et al. An improved zinc−finger nuclease architecture for highly specific genome editing. Nat Biotechnol 25, 778−85 (2007).
31. Cradick, T.J., Keck, K., Bradshaw, S., Jamieson, A.C. & McCaffrey, A.P. Zinc−finger nucleases as a novel therapeutic strategy for targeting hepatitis B virus DNAs. Mol Ther 18, 947−54 (2010).
32. Doyon, Y. et al. Heritable targeted gene disruption in zebrafish using designed zinc−finger nucleases. Nat Biotechnol 26, 702−8 (2008).
33. Rozen, S. & Skaletsky, H. Primer3 on the WWW for general users and for biologist programmers. Methods Mol Biol 132, 365−86 (2000).
【0117】
本明細書に記述のすべての刊行物、特許、およびデータベースエントリーは、上記に収載のアイテムを含めて、あたかも個々の刊行物または特許がそれぞれ、具体的かつ個別に参照により組み込まれるように指示されたかのように、その内容全体が参照により本明細書に組み込まれるものとする。矛盾がある場合は、本出願が、本明細書のいかなる定義も含めて、統制するものとする。
【0118】
実施例2−TALEN
種々のTALENの部位選択性を、上記のZFNプロファイリングについてなされた研究と同様にしてプロファイリングした。実験および結果を
図19〜49に記載する。選択1は、+28リンカー対+63リンカーのTALEN間の比較を含む。選択2は、TALドメインの長さが異なるTALENの比較を含む。
【0119】
TAL DNA結合ドメインは、in vitroおよび細胞の両方において、標的DNAを具体的に調節する変形技術に基づいている。設計可能なTAL DNA結合ドメインは、他のDNA結合ドメイン、例えばジンクフィンガーと比較して、標的化可能な配列空間および構築の容易さにおいて利点を有する。これらのTAL DNA結合ドメインは、標的DNA配列中の単一塩基対の認識をコードする高度に可変なジ−アミノ酸(RVD)を含有する、34アミノ酸のドメインの反復で構成される(
図20)。このRVDコードの頑健性およびそのDNA標的に結合したTALの結晶構造に基づくと、単一反復の塩基対への結合は、隣接する反復結合に比較的左右されないように思われる。TAL DNA結合ドメイン(反復アレイ)は、ヘテロ二量体性のヌクレアーゼドメインの単量体に連結して、TALヌクレアーゼを形成することができる。したがって、2つの別々のTALヌクレアーゼが、隣接する標的ハーフサイトに結合して、特定配列を切断することにより、in vivoでゲノム改変がもたらされ得る(
図19および20)。いくつかの研究で、TAL DNA結合の特異性について検討がなされているが、本発明者らが知るかぎり、TALヌクレアーゼの特異性を大規模にプロファイリングした研究はない。本発明者らは、容易に設計可能なことから予測されるTAL反復の独立したモジュール結合を確認するだけでなく、治療に関連するTALヌクレアーゼによるゲノムオフターゲット配列を同定するためにも、実施例1のZFNについて概説した、ヌクレアーゼ特異性に対するハイスループットin vitro選択の概念を適用した。
【0120】
in vitroライブラリースクリーニングを介してTALヌクレアーゼの特異性をプロファイリングするための選択スキームは、実施例でZFNについて記載された選択スキームと同様であった。詳細なプロトコールを、以下に示す。
【0121】
部分的に無作為化された標的部位のライブラリーの調製
2ul 10pmolのTALNCCR5ライブラリーOligo(各oligoに対して別々の反応)
2ul 10×CircLigase II 10×反応緩衝液
1ul 50mMのMnCl2
1ul CircLigase II ssDNAリガーゼ(100U)[Epicentre]
Xulの水で全容積20uLにする
60℃で16時間インキュベートする。85℃で10分間インキュベートして不活化する。
各Circligase II反応液(精製していない)2.5ulを加える。
TempliPhi(商標)[GE Healthcare]100試料緩衝液25ulを加える。
95℃で3分間インキュベートする。4℃に徐々に冷却する。
TempliPhi(商標)反応緩衝液25ul/酵素混合物1ulを加える。
30℃で16時間インキュベートする。55℃で10分間熱不活化する。
Quant−iT(商標)PicoGreen(登録商標)dsDNA[Invitrogen]を使用して、dsDNA量を定量する。
等モルのTempliPhi(商標)反応液を合わせて、切断部位の数に関して最終2uMにする。
【0122】
TALN発現
16ul TnT(登録商標)Quick Coupled[Promega]
0.4ul 1mMメチオニン
2uL .8ugのTALNベクター発現プラスミドまたは空溶解物のための水
1.6uL 水
30で1.5時間インキュベートした後、4℃で一晩保存する。
ウエスタンブロットにより、溶解物中のTALN量を定量する。
【0123】
TALN消化
25uL 10×NEB Buffer 3[New England Biolabs]
10uL 2uMのTempliPhライブラリーDNA
165uL 水
レフトTALN溶解物を20nMの全レフトTALNに加える。
ライトTALN溶解物を20nMの全ライトTALNに加える。
空溶解物を合計50uLの溶解物に加える。
37℃で2時間インキュベートする。5ul(50ug)のRNアーゼA(Qiagen)を加える。室温で10分間インキュベートする。Qiagen PCR精製キットにより精製する。50uLの1mM Tris、pH8.0に溶出する。
【0124】
TALN消化物のアダプター連結反応、PCR、およびゲル精製
50ul 消化されたDNA
3ul dNTP混合物
6ul NEB 2
1ul Klenow[New England Biolabs]
室温で30分間インキュベートする。Qiagen PCR精製キットにより精製する。
50ul 溶出DNA
5.9ul T4DNAリガーゼ緩衝液(NEB)
2ul(20pmol)の加熱/冷却アダプター(選択ごとに異なるアダプター)
1ul T4DNAリガーゼ(NEB、400単位)
室温で20時間インキュベートする。Qiagen PCR精製キットにより精製する。
6uL TALN消化DNA
30uL 5×Buffer HF
1.5uL 100uMのIllumina_fwdプライマー
1.5uL 100uMのPE_TALN_rev1プライマー
3ul 10mMのdNTP
1.5uL Phusion Hot Start II
106.5uL 水
98℃で3分間、そして98℃で15秒間、60℃で15秒間、72℃で1分間を15サイクル行う。QiagenPCR精製キットにより精製する。
10%グリセロール40uL中の溶出DNA1ugを負荷して、2%アガロースゲル上でゲル精製する。135Vで35分間、ゲル上で泳動させる。切断ハーフサイト+完全ハーフサイト+アダプターに相当する長さのバンドを、濾紙を用いてゲル精製する。濾紙を除去して、上清を回収する。Qiagen PCR精製キットにより精製する。
6uL TALN消化DNA(5−26−12)
30uL 5×Buffer HF
1.5uL 100uMのIllumina_fwdプライマー
1.5uL 100uMのPE_TALN_rev2プライマー
3ul 10mMのdNTP
1.5uL Phusion Hot Start II
106.5uL 水
98℃で3分間、そして98℃で15秒間、60℃で15秒間、72℃で1分間を6サイクル行う。Qiagen PCR精製キットにより精製する。
【0125】
プレ選択ライブラリーの調製
25uL 10×NEB Buffer 4
10uL 2uMのTempliPhライブラリーDNA
165uL 水
5uL 適切な制限酵素[New England Biolabs]
210uL 水
37℃で1時間インキュベートする。Qiagen PCR精製キットにより精製する。
50ul 溶出DNA
5.9ul T4DNAリガーゼ緩衝液(NEB)
2ul(20pmol)の加熱/冷却アダプター(4アダプター配列のプール)
1ul T4DNAリガーゼ(NEB、400単位)
室温で20時間インキュベートする。Qiagen PCR精製キットにより精製する。
6uL 制限酵素消化DNA(5−26−12)
30uL 5×Buffer HF
1.5uL 100uMのIllumina_revプライマー
1.5uL 100uMのTALNLibPCRプライマー
3ul 10mMのdNTP
1.5uL Phusion Hot Start II
106.5uL 水
98℃で3分間、そして98℃で15秒間、60℃で15秒間、72℃で1分間を12サイクル。Qiagen PCR精製キットにより精製する。
【0126】
ハイスループットシークエンシング
RT−qPCRにより定量する
12.5uL IQ SYBR Green Supermix
1uL 10uMのIllumina_rev
1uL 10uMのIllumina_fwd
9.5uL 水
1uL DNAテンプレート(プレ選択ライブラリーおよびTALN消化の両方)
95℃で5分間、そして95℃で30秒間、65℃で30秒間、72℃で40秒間を30サイクル行う。
DNAを2nMに希釈する(シークエンシング標準に比較して)
5uL TALN消化 2nMのDNA
2.5uL プレ選択ライブラリー 2nMのDNA
10uL .1NのNaOH
室温で5分間インキュベートする
Illumina Mi−Seqによりシークエンシングする
【0127】
計算フィルタリング
TALN消化配列について、2つの適切に間隔があいた一定オリゴ配列を見出す。
プレ選択ライブラリー配列について、適切に間隔があいた一定オリゴ配列およびライブラリーアダプター配列を見出す。
切断オーバーハング、左ハーフサイト、スペーサー、右ハーフサイトに配列を構文解析する。
ハーフサイト中に悪いIllumina塩基スコアを有する配列を除去する(<B=拒絶)。
【0132】
結論
ハーフサイトの突然変異の数と濃縮との間の比較的規則的な(対数的な関係)傾向は、塩基対結合する1つのTAL反復結合が他の反復結合に左右されないことと一致している。補償差分析では、切断部位の1つの突然変異が他の突然変異の分布を顕著に変化させることはなく、TAL反復ドメインが独立して結合することが示唆される。+28のリンカーのTALN構築物は、+63のリンカーのTALN構築物よりも特異的である。より大きな標的部位を認識するTALNほど、より多くの突然変異を許容することができるという点で、特異性が低下するが、突然変異したより大きな配列の存在量は、濃縮の増加よりも少なく、したがって、in vitro選択データおよびオフターゲット部位の存在量からは、より長いTALN対ではオフターゲット切断が起こる可能性がかなり低いことが示される。全体の標的部位突然変異が増加するにつれて、切断効率(濃縮)が規則的に低下することと各位置での濃縮とを組み合わせると、任意の配列のオフターゲット部位切断を予測することが可能になる。大体において、TALN選択では、濃縮は両方のハーフサイトにおける突然変異の合計に依存し、ジンクフィンガーヌクレアーゼ(ZFN)の場合に観察されたようにハーフサイト間の突然変異の分布に依存することはない。この観察をZFNの文脈依存の結合と組み合わせるとTALENは、そのZFN相当物と同等またはそれより高い特異性に容易に操作することができることがわかる。
【0133】
本明細書に記述のすべての刊行物、特許、およびデータベースエントリーは、上記に収載のアイテムを含めて、あたかも個々の刊行物または特許がそれぞれ、具体的かつ個別に参照により組み込まれるように指示されたかのように、その内容全体が参照により本明細書に組み込まれるものとする。矛盾がある場合は、本出願が、本明細書のいかなる定義も含めて、統制するものとする。
【0134】
均等物および範囲
当業者ならば、単なるルーチン的な実験作業を使用して、本明細書に記載する本発明の特定の実施形態に対する多くの均等物を認識するか、または確認することができるであろう。本発明の範囲は、上記の説明に限定するように意図されるものではなく、添付の特許請求の範囲に示されるとおりである。
【0135】
特許請求の範囲において、「a」、「an」、および「the」などの冠詞は、それに反する指示がない限り、または別途文脈から明らかでない限り、1つまたは複数を意味することができる。ある群の1つまたは複数のメンバー間に「または」を含む特許請求の範囲または説明は、それに反する指示がない限り、または別途文脈から明らかでない限り、その群のメンバーの1つ、2つ以上、またはすべてが、所与の生成物または方法に存在するか、使用されるか、またはそうでなければ関連する場合に満足されると見なされる。本発明は、その群の正確に1つのメンバーが所与の生成物または方法に存在するか、使用されるか、またはそうでなければ関連する実施形態を含む。本発明はまた、その群のメンバーの2つ以上またはすべてが所与の生成物または方法に存在するか、使用されるか、またはそうでなければ関連する実施形態を含む。
【0136】
さらに、本発明は、あらゆる変更、組合せ、および置換を包含し、そこでは、特許請求の範囲の1つもしくは複数からの、または説明の関連部分からの1つまたは複数の限定、要素、条項、記述用語等が、別の請求項に導入されると理解されたい。例えば、別の請求項に従属している任意の請求項は、同じ基本請求項に従属する他の任意の請求項に見られる1つまたは複数の限定を含むように修飾され得る。さらに、請求項が組成物を列挙する場合、別途指示されない限り、または矛盾もしくは不一致が生じることが当業者に明らかでない限り、本明細書に開示される任意の目的のために組成物を使用する方法が含まれ、また本明細書に開示の任意の製造方法または当技術分野で公知の他の方法に従って組成物を製造する方法が含まれることを理解されたい。
【0137】
要素が一覧として、例えば、マーカッシュ群形式で提示される場合、それらの要素の各部分群もまた開示されること、また任意の要素がその群から除去され得ることを理解されたい。さらに、用語「含む」は、オープンであることを意図し、さらなる要素または工程の包含を許容することに留意されたい。一般に、本発明または本発明の態様が特定の要素、特徴、工程等を含むとして言及される場合、本発明または本発明の態様の特定の実施形態は、そのような要素、特徴、工程等からなるか、またはそれらから本質的になると理解されたい。単純化の目的のために、それらの実施形態は、本明細書中に、これらの言葉で具体的に示されていない。したがって、1つまたは複数の要素、特徴、工程等を含む、本発明の各実施形態に対して、本発明は、それらの要素、特徴、工程等からなるか、またはそれらから本質的になる実施形態も提供する。
【0138】
範囲が与えられる場合、端点は含まれる。さらに、別途指示されないか、文脈および/または当業者の理解から別途明らかでない限り、範囲として表示される値は、別途文脈から明確に指示されない限り、本発明の種々の実施形態で記述の範囲内の任意の特定の値を、その範囲の下限の単位の1/10まで想定することができると理解されたい。さらに、別途指示されないか、文脈および/または当業者の理解から別途明らかでない限り、部分範囲の端点が、その範囲の下限の単位の1/10と同程度の正確さで表示されている、所与の範囲内の任意の部分範囲を想定することができると理解されたい。
【0139】
加えて、本発明の特定の任意の実施形態は、特許請求の範囲の任意の1つまたは複数から明示的に除外され得ると理解されたい。範囲が与えられる場合、その範囲内の任意の値は、特許請求の範囲の1つまたは複数から明示的に除外され得る。本発明の組成物および/または方法の任意の実施形態、要素、特徴、用途、態様は、特許請求の範囲の1つまたは複数から除外され得る。簡潔さのために、1つまたは複数の要素、特徴、目的、または態様が除外される実施形態のすべてが、本明細書に明示的に示されることはない。
【0141】
表1:ヒトK562細胞のゲノム中のCCR5−224オフターゲット部位。小文字は、標的部位に対する突然変異を示す。「X」マークが付いた部位は、対応するin vitro選択データセット中に見出された部位である。「T」は、部位中の突然変異の総数を指し、「(+)」および「(−)」はそれぞれ、(+)および(−)のハーフサイト中の突然変異の数を指す。部位の配列は、5’(+)ハーフサイト/スペーサー/(−)ハーフサイト3’として記載しており、したがって、(+)ハーフサイトは、配列プロファイルとは逆のセンスで記載されている。K562改変頻度は、空ベクターを発現する細胞に比較した、活性ZFNを発現する細胞における、非相同末端結合修復(方法を参照のこと)の重要な証拠となる観察配列の頻度である。統計的に有意な改変の証拠を示さなかった部位は、検出されない(n.d.)として記載し、ゲノムからの非特異的PCR増幅のため、分析されなかった3つの部位についてのK562改変頻度は空白とした。表4に、K562改変頻度を決定するために使用した試験部位の配列数およびP値を示し、表6に、各部位について得られた改変配列を示す。
【0143】
表2:シークエンシングの統計。解釈可能な配列の総数(「全配列」)、および各in vitro選択条件ごとの分析配列の数を示す。分析配列は、ポスト選択配列の場合は、ZFN媒介切断のホールマークとしてこの研究で使用したサインである、少なくとも4塩基の逆相補的オーバーハング配列を含有した、曖昧なヌクレオチドを含有しない非反復配列である。「不適合オーバーハング」は、少なくとも4塩基の逆相補的オーバーハング配列を含有しなかった配列を指す。0.5nM、1nM、および2nMの選択において反復配列が多く存在することは、反復配列が除去される前の、それらの選択で得られたシークエンシングリードの数が、すべての実験的選択ステップで残存した個々のDNA配列の数よりも大きかったことを示す。
【0145】
表3:試験した両方のZFNには、3つ以下の突然変異を含む標的部位の大部分を切断する能力がある。(a)CCR5−224 ZFNおよび(b)VF2468 ZFNにより切断され得る、1つ、2つ、または3つの突然変異(mut)を含む配列セットの百分率を示す。選択で同定された各配列に対する濃縮係数(EF)を、ポスト選択配列決定ライブラリー中のその配列の観察頻度を、プレ選択ライブラリー中のその配列の観察頻度で割ることによって算出した。各in vitro選択ストリンジェンシーについて計算した、野生型配列(wt EF)に対する濃縮係数を表の第1列に示す。
【0147】
表4:潜在的なCCR5−224ゲノムオフターゲット部位。ヒトゲノムを、CCR5−224切断に対するin vitro選択で残存したDNA配列について検索した。「X」マークが付いた部位は、in vitro選択データセット中に見出された部位である。「T」は、部位中の突然変異の総数を指し、「(+)」および「(−)」はそれぞれ、(+)および(−)のハーフサイト中の突然変異の数を指す。ヒトゲノムのビルド(build)36からの染色体座標を記載する。各部位の突然変異頻度は、活性なCCR5−224を発現する培養K562細胞に由来する、配列決定されたDNA中の挿入または欠失(インデル)を含む配列の百分率である。赤色太字の部位は、空ベクターを含有する細胞に比較して、活性なヌクレアーゼ試料中に有意に濃縮されたインデル百分率を有する。部位の配列は、5’(+)ハーフサイト/スペーサー/(−)ハーフサイト3’として記載しており、したがって、(+)ハーフサイトは、配列プロファイルとは逆のセンスで記載されている。3つの部位は、部位特異的PCR増幅産物を生じなかったので、試験しなかった。試験しなかったそれらの部位のインデルおよび合計は示していない。表示したP値は、インデル頻度が、ZFNを発現しない細胞に対してよりも活性ZFN処理細胞に対して大きいという片側対立仮説に対するものである。
【0149】
表5:CCR5−224標的部位よりも多くの潜在的なゲノムVF2468標的部位がある。ヒトゲノムを、正規CCR5−224標的部位と最大9つの突然変異だけ異なる部位、および正規VF2468標的部位と最大6つの突然変異だけ異なる部位について、計算的に検索した。反復配列を含む、ゲノム中の5または6塩基対スペーサーを含有する部位の出現数を表に記載する。
【0151】
表6:培養ヒトK562細胞において同定されたCCR5−224媒介ゲノムDNA改変配列。CCR5−224を発現する培養K562細胞に由来する潜在的なCCR5−224オフターゲット部位をシークエンシングした後に同定された挿入(青)および欠失(赤)を含む配列を示す。出現数を各配列の右側に示す。他の突然変異は小文字で示すが、PCRまたはシークエンシングの間に発生した突然変異を反映している可能性がある。非改変部位は、遺伝子名または座標(ビルド36)の下に記載し、またスペーサー配列に下線を付した。
【0153】
表7:潜在的なVF2468ゲノムオフターゲット部位。97の潜在的なVF2468ゲノム標的部位のうちの90に対するDNAを、活性なVF2468 ZFNを発現する培養K562細胞から、または空発現ベクターを含有する細胞からPCRによって増幅した。各部位の突然変異頻度は、活性なVF2468を発現する培養K562細胞に由来する、配列決定されたDNA中の挿入または欠失(インデル)を含む配列の百分率である。赤色太字の部位は、ヌクレアーゼを発現しない細胞に比較して、活性なヌクレアーゼ試料中に有意に濃縮されたインデル百分率を有する。部位の配列は、5’(+)ハーフサイト/スペーサー/(−)ハーフサイト3’として記載されており、したがって、(+)ハーフサイトは、配列プロファイルとは逆のセンスで記載されている。7つの部位は、部位特異的PCR増幅産物を生じなかったので、試験しなかった。試験しなかったそれらの部位のインデルおよび合計は示していない。表示したP値は、インデル頻度が、ZFNを発現しない細胞に対してよりも活性ZFN処理細胞に対して大きいという片側対立仮説に対するものである。
【0157】
表8:この研究で使用したオリゴヌクレオチド。オリゴヌクレオチド「[ZFN][#]fwd/rev」は、Invitrogenに注文した。他のすべてのオリゴヌクレオチドは、Integrated DNA Technologiesに注文した。「N」は、「A」、「C」、「G」、または「T」の機械的な混合取り込みを指す。アスタリスクは、その前のヌクレオチドが、そのヌクレオチドを79モル%含有し、かつ他の正規ヌクレオチドのそれぞれを7モル%含有する混合物として取り込まれたことを示す。「/5Phos」/は、合成の間に付加された5’リン酸基を示す。
【0158】
VF2468データ
潜在的なVF2468ゲノムオフターゲット部位。ヒトゲノムを、VF2468切断に対するin vitro選択で残存したDNA配列について検索した。「X」マークが付いた部位は、in vitro選択データセット中に見出された部位である。「T」は、部位中の突然変異の総数を指し、「(+)」および「(−)」はそれぞれ、(+)および(−)のハーフサイト中の突然変異の数を指す。部位の配列は、ゲノム中に出現するとおりに記載しており、したがって、(−)ハーフサイトは、配列プロファイルとは逆のセンスで記載されている。