(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-20
(45)【発行日】2023-10-30
(54)【発明の名称】タンパク質製造用の改善された真核細胞およびそれらの作製方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20231023BHJP
C12N 5/10 20060101ALI20231023BHJP
C12P 21/02 20060101ALN20231023BHJP
【FI】
C12N15/09 110
C12N5/10 ZNA
C12P21/02 C
(21)【出願番号】P 2018531548
(86)(22)【出願日】2016-12-23
(86)【国際出願番号】 EP2016082567
(87)【国際公開番号】W WO2017109177
(87)【国際公開日】2017-06-29
【審査請求日】2019-11-07
【審判番号】
【審判請求日】2021-12-27
(32)【優先日】2015-12-24
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】512051918
【氏名又は名称】セレクシス エス.エー.
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】マーモッド,ニコラス
(72)【発明者】
【氏名】デュロイ,ピエール-オリバー
(72)【発明者】
【氏名】ボッシャード,サンドラ
(72)【発明者】
【氏名】ル メルシエル,フィリップ
【合議体】
【審判長】長井 啓子
【審判官】飯室 里美
【審判官】藤井 美穂
(56)【参考文献】
【文献】Science,2015年11月27日,Vol.350,p.1101-1104
【文献】J.Virol.,1994年,Vol.68,p.7840-7849
(58)【調査した分野】(Int.Cl.,DB名)
C12N15/00
C12N5/00
BIOSIS/MEDLINE/CAplus/EMBASE/REGISTRY(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
操作されたCHO細胞であって、
前記細胞のゲノムであって、前記ゲノムが、Gagタンパク質をコードする配列を含む1個または複数個の内在性レトロウイルス(ERV)エレメントを含む、ゲノム、
を含み、前記Gagタンパク質が、
配列番号30、または
、配列番号30と少なくとも90%の配列同一性を有
する配列中に、少なくとも1つの欠失、および/または少なくとも1つの付加、および/または少なくとも1つの置換
による変化を含む改変配列であって、前記改変配列を含む前記1個または複数個のERVエレメントが、機能的Gagタンパク質をコードしない、改変配列
を含む、操作された細胞。
【請求項2】
前記ERVエレメントの1つ以上が、コアラ伝染性ウイルス(KoRV)、マウス乳腺腫瘍ウイルス(MMTV)、マウス白血病ウイルス(MLV)ERVを含む、ガンマレトロウイルスERV由来であり、かつ1つまたは複数の変化が、1つまたは複数の、好ましくは60%、70%、80%、90%、95%超または100%の前記ERVの放出を抑制するか完全に抑えるように適応される、請求項1に記載の操作された細胞。
【請求項3】
前記1個または複数個のERVエレメントが、MA(基質)、CA(カプシド)、NC(ヌクレオカプシド)、pp12またはp6などのタンパク質をコードするさらなるドメインをコードする、gag遺伝子に由来し、かつ/あるいはERVの長い末端反復配列(LTR)である、請求項1~2のいずれか1項に記載の操作された細胞。
【請求項4】
前記1個または複数個のERVエレメントが、Gag(グループ抗原)タンパク質をコードする、請求項3に記載の操作された細胞。
【請求項5】
前記欠失、付加または置換が、2個、3個、4個、5個、10個、15個、20個、25個、30個、40個、45個、50個、55個、60個、65個、70個、75個、80個、85個、90個、95個、100個、150個または200個を超える核酸を含む、請求項1~4のいずれか1項に記載の操作された細胞。
【請求項6】
前記1個または複数個のERVエレメントが、gag遺伝子に由来し、かつ少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個もしくは10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%またはすべての前記エレメントが、前記変化を含む、請求項1~5のいずれか1項に記載の操作された細胞。
【請求項7】
前記変化が、前記1個または複数個のERVエレメントのコンセンサス配列中にあり、前記コンセンサス配列が、少なくとも5塩基対、10塩基対、15塩基対または20塩基対の長さ、好ましくは15~25塩基対または30~50塩基対の長さである、請求項1~6のいずれか1項に記載の操作された細胞。
【請求項8】
ERVを全く放出しない、または実質的に全く放出しない、請求項1~7のいずれか1項に記載の操作された細胞。
【請求項9】
相同組換え(HR)経路の1つまたは複数のタンパク質をコードする異種核酸配列、ならびに/あるいは相同組換え(HR)経路の1つまたは複数のタンパク質、好ましくはRad51、リガーゼ1および/またはリガーゼ3の発現を抑制する1つまたは複数の配
列をコードする異種核酸配列を含む、請求項1~8のいずれか1項に記載の操作された細胞。
【請求項10】
前記異種核酸配列が、前記細胞のゲノム中に組み込まれないベクターとして存在する、請求項9に記載の操作された細胞。
【請求項11】
好ましくはベクター上に、GFP(緑色蛍光タンパク質)などの1つまたは複数のマーカータンパク質をコードする異種ドナーDNAをさらに含む、請求項1~10のいずれか1項に記載の操作された細胞。
【請求項12】
導入遺伝子をさらに含む、請求項1~11のいずれか1項に記載の操作された細胞。
【請求項13】
前記導入遺伝子が、前記ゲノム中に好ましくは組み込まれるGFP(緑色蛍光タンパク質)などのマーカータンパク質および/または生物学的治療薬をコードするマーカー遺伝子である、請求項
12に記載の操作された細胞。
【請求項14】
前記細胞が、前記1個または複数個のERVエレメントを含むCHO細胞であり、かつ(i)PPYPモチーフをコードする配列および/または(i)中の配列に隣接する最大20個の核酸の配列が、前記変化を含む、請求項1~13のいずれか1項に記載の操作された細胞。
【請求項15】
前記操作された細胞が、1つまたは複数の配列番号1、
2またはそれと90%もしくは95%超の配列同一性を有する配列中に、欠失、および/または付加、および/または置換を有するCHO細胞である、請求項1~14のいずれか1項に記載の操作された細胞。
【請求項16】
ゲノム編集のための方法であって、
(i)Gagタンパク質をコードする配列を含むERVエレメントに一本鎖または二本鎖の切断(break)を導入するための異種系を導入することであって、前記Gagタンパク質をコードする配列が、
配列番号30、または
、配列番号30と少なくとも90%の配列同一性を有
する配列中に、少なくとも1つの欠失、および/または少なくとも1つの付加、および/または少なくとも1つの置換
による変化を含む改変配列であって、前記改変配列を含む前記ERVエレメントが、機能的Gagタンパク質をコードしない、改変配列
を含む
ように、導入することと、さらに
(ii)前記細胞中に
(a)1つまたは複数の相同組換え(HR)経路の1つまたは複数のタンパク質をコードする異種核酸配列、ならびに/あるいは
(b)1つまたは複数の相同組換え(HR)経路の前記1つまたは複数のタンパク質の発現を抑制する、siRNAの1つまたは複数の配
列をコードする異種配列
を導入することと
を含み、前記(i)の異種系ならびに/あるいは(ii)(a)および/または(ii)(b)の配列が、前記細胞中で好ましくは少なくとも一過的に発現される、
方法。
【請求項17】
前記異種配列が、Rad51をコードする、請求項16に記載の方法。
【請求項18】
GFP(緑色蛍光タンパク質)などのマーカー遺伝子が、相同組換えを介して前記標的核酸配列中に挿入され、かつ前記マーカー遺伝子を含む細胞が、好ましくは選択される、請求項16または17に記載の方法。
【請求項19】
前記(a)の異種核酸配列が、Nbs1および/またはMre11などの、MRN複合体のタンパク質をコードし、かつ/あるいは前記(b)の異種配列が、Rad51などの前記HR経路の1つまたは複数のタンパク質の発現を抑制する配
列をコードする、請求項16~18のいずれか1項に記載の方法。
【請求項20】
欠失または挿入が、非相同末端結合(NHEJ)またはマイクロホモロジー媒介末端結合(MMEJ)を介して前記1個または複数個のERVエレメント中に導入される、請求項16~19のいずれか1項に記載の方法。
【請求項21】
前記異種配列が、組込み型ベクターまたは非組込み型ベクターの一部である、請求項16~20のいずれか1項に記載の方法。
【請求項22】
標的核酸配列中に一本鎖または二本鎖の切断(break)を導入するための非天然に起こる系が、CRISPR/Cas9系である、請求項16~21のいずれか1項に記載の方法。
【請求項23】
操作されたCHO-K1を含む、操作されたCHO細胞を作製するための、請求項16~22のいずれか1項に記載の方法であって、前記細胞のゲノムが、1個または複数個、一般に10個、20個、30個、40個、50個、60個、80個、90個または100個を超える内在性レトロウイルス(ERV)エレメント中に1個または複数個の核酸の
(a)欠失、
(b)付加、および/または
(c)置換
を含む1つまたは複数の変化を含む、方法。
【請求項24】
(i)1つの容器中にCRISPRなどの、少なくとも1つのヌクレアーゼをコードする少なくとも1つの非組込み型ベクターと、
(ii)同じ容器または別の容器中にERVエレメント中のモチーフを標的とする1つもしくは複数のガイドRNAまたは前記1つもしくは複数のガイドRNAをコードする配列であって、前記ERVエレメントが、gag遺伝子である、またはgag遺伝子に由来し、前記モチーフが、PPYPモチーフである、配列と、
(iii)同じ容器または別の容器中にHR経路の遺伝子に対し指向される1つもしくは複数のsiRNAまたは1つもしくは複数のsiRNAをコードする配列と、
別の容器中にCHO細胞内に(i)、(ii)および(iii)を供給する方法の指示書と
を含み、
前記ERVエレメント中のモチーフが、
配列番号30、または
、配列番号30と少なくとも90%の配列同一性を有
する配列である、キット。
【請求項25】
前記ERVエレメント中の前記モチーフを標的とする前記1つもしくは複数のガイドRNAをコードする前記配列および/または前記1つもしくは複数のsiRNAをコードする配列が、ベクターの一部である、請求項24に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2015年12月24日に出願された米国特許仮出願第62/387,375号の権益を主張するものであり、上記出願の全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
現在、治療薬の組換えタンパク質製造に使用される安定で高収量の哺乳動物細胞株が多数ある。工程の最適化および改善により細胞株の開発が8~12か月から4か月に短縮されると同時に、タンパク質を産生する哺乳動物細胞株の収量および安定性も改善されてきた。
【0003】
しかし、安全性プロファイルがさらに優れた哺乳動物細胞株sを供給することが未だ必要とされている。
【0004】
特に、組換えタンパク質を産生する哺乳動物細胞株を分析し実証するためのより効率的な方法を考案し、それにより候補薬物開発のスループット、速度および効果を増大させ、規制に関わるバリデーションにかかるコストおよびタンパク質治療薬に対する予測不可能で望ましくない影響を抑えることが一般に必要とされている。さらに、操作手順の中でより効率的な細胞特徴付け工程を実施することにより、検出されなかった細胞株混入物(例えば、マイコプラズマまたは外来ウイルス性因子)が原因で製造施設が閉鎖されるという危険性が低減されると考えられる。
【0005】
特徴付けされた哺乳動物細胞株および生物体は必ず、レトロウイルスを含む過去のウイルスの感染の残遺物を含み、それによりウイルス遺伝子が細胞ゲノム中に組み込まれている。これらのウイルス残遺物は多くの場合、損なわれ変異されているが、それらのいくつかは、それでもなお発現されたままであり、例えば電子顕微鏡を用いて検出可能なウイルス様粒子を生じる。
【0006】
CHO細胞は、それらが異種遺伝子の発現に安定な宿主であり得、長年にわたって安全性が確認されており、ヒト様の翻訳後修飾を有するタンパク質を産生し、かつバイオリアクター中の無血清合成培地中で付着に依存しない迅速な増殖に順応させるのが比較的容易であることから、最も広く用いられている。それでも、バイオリアクターでの培養のために極めて効率的なクローン細胞株を開発し実証文書により裏付けることは時間がかかりかつ多大な労力を要することが多く、依然として一連の障壁および低タンパク質収量という問題を抱えている。
【0007】
CHO細胞は、他の細胞株に比べて治療用タンパク質を生産するうえで安全であると考えられる。それでも、それらはまた感染性ウイルス粒子の残遺物を含み、これらの残遺物はCHO細胞によるウイルス粒子を引き起こすため規制に関わる文書の提示を必要とする(Lie,Y.S.ら,1994)。さらに、組み込まれたプロウイルスゲノムは、低頻度であるが、組換えや変異を起こしそれにより特性を変化させる可能性がある。
【0008】
発現されるウイルス残遺物がそのゲノムから除かれ、したがって治療用タンパク質を生産のためのより安全な哺乳動物細胞宿主をもたらすCHO細胞が、非常に望ましい。
【0009】
タンパク質生産に用いられる細胞(例えば、CHO細胞)のゲノムを特徴付けるためのハイスループットDNAシーケンシング(次世代DNAシーケンシングまたはNGS)に基づく技術の最近の発展は、導入遺伝子の組込み部位の特徴付けの成功をもたらした(Kostyrkoら,2016)。
【0010】
本発明を説明するためおよび、特に、実施に関してさらに詳述するために本明細書で用いられる、特許および特許出願を含む刊行物およびその他の資料は、参照により組み込まれる。刊行物は便宜上、後に続く文章中で著者および日付によって参照され、付録の参考文献一覧に著者のアルファベット順で記載される。
【0011】
治療薬生産施設で使用される細胞内に外来性因子が継続的に検出されれば、FDAなどの規制当局から、遺伝的によりよく特徴付けされた生産細胞株を使用するよう圧力がかかる。FDAは外来性因子を定義しており、細胞のゲノム内に組み込まれるレトロウイルスをこれに含めている(FDA’s Guidance for Industry Characterization and Qualification of Cell Substrates and Other Biological Materials Used in the Production of Viral Vaccines for Infectious Disease Indications,February 2010を参照されたい)。しかし、現在、様々なCHO細胞亜株のゲノムの完全な組み立てのため、およびそのゲノム配列の解析および解釈のために必要とされる分析ツールおよびバイオインフォマティクスツールがないことが多い。
【図面の簡単な説明】
【0012】
【
図1a-1b】内在性レトロウイルス(ERV)の生成(a)および宿主ゲノム内に潜伏した後の同ウイルスの脱出(b)を示す図である。レトロウイルスの増殖には、逆転写酵素およびウイルスサイクルの他の成分をコードする遺伝子の組込みが必要である。ERVはほぼ動物界のみにみられる。
【
図2A】ESCRT(輸送のためのエンドソーム選別複合体)複合体(ESCRT-0、ESCRT-I、ESCRT-II、およびESCRT-IIIとして知られる細胞質タンパク質複合体とALIXを含むいくつかのアクセサリータンパク質とを含む)の成分および、それによりウイルス粒子放出をもたらすウイルスp6タンパク質の相互作用を示す図である。
【
図2B】翻訳されるgag(グループ特異的抗原)オープンリーディングフレーム(ORF)から隠れマルコフモデリング(HMM)により決定した、出芽を可能にするERVの様々なアミノ酸モチーフ(「出芽モチーフ」)を示す図である。
【
図3】gag領域にコードされるpp12でHMM(隠れマルコフモデル)により出芽モチーフ(
図1Cを参照されたい)を決定する方法を示す図である。ガンマレトロウイルスに共通であることがわかっているPPXYモチーフに基づき、グループ1およびグループ2のCHO細胞ERV由来の重複するPPYPモチーフを決定し、変異誘発の標的とした。また、列挙される通り比較した配列の最初の塩基対の番号も示される。
【
図4A】CHO-Mと呼ばれるCHO-K1細胞由来細胞株の細胞ゲノムの配列(PacBio(登録商標によるシーケンシングおよびゲノム組立て作業から得た)と、典型的なレトロウイルスエレメント(gag、pol、env、LTR(長い末端反復配列))由来の配列との比較に基づき、細胞のゲノム中でどのようにERVエレメントを見つけられるかを模式的に示す図である。本発明者らのPacBio(登録商標)CHO-M細胞ゲノムから77のヒットが得られた。これらのヒットをのちのコンセンサス配列の検討および決定のために選択した。
【
図4B】コンセンサス配列のさらなる決定および解析の様々な段階ならびに公開されているチャイニーズハムスターゲノムとの比較を示す図である。
【
図4C】CHO-M細胞のゲノム中で同定された特異的ガンマレトロウイルスERV様配列の実験的検証を示す図である。ERVの検証は、組込みが予測されるウイルスゲノムのどちらかの側でCHOゲノム配列にハイブリダイズするPCRプライマーを用いて実施した(バイオインフォマティクス解析を用いて見つかったC型ガンマレトロウイルス配列の検証)。ゲル上で、長い方の配列(上側の3つの丸)は組み込まれたゲノムを有する対立遺伝子であり、ウイルス組込みのない対立遺伝子はゲル上をより速く移動する(下側の3つの丸)。
【
図5】潜在的に危険なERV、したがって例えば細胞/ゲノムのストレスにより覚醒する可能性のあるERVを、どのように決定できるかを示す図である。ストレスは、様々な時間に、様々な種類の培養中に、かつ/または複数回の形質移入の後に加わり得る。エピジェネティックデータは、ERVエレメントが転写されるか否かを示唆する(iRNAの評価およびメチル化状態を含むエピジェネティックデータ)。これらのストレス期間中に、感染性ERVは覚醒する可能性が高く、検出され得る。
【
図6】ガイドRNA(一本鎖ガイドRNAまたはsgRNAとも呼ばれる)を用いるCRISPR/Cas9系を示す図であり、(a)Carrolら(2013)による系および(b)Guilingerら(2014)による系を示し、これらの系では、二本鎖ブレーキ(DSB)によって遺伝子標的化(GT)が誘発され、ヌクレアーゼがGTを促進することを示している。部位指向型DSBはGTを最大10000倍に増大するが、望ましくないオフターゲット変異も誘発し得る。ヌクレアーゼ活性は10~80%の間で変化する。
【
図7】DSBの修復に関して競合する3種類の主な修復経路、すなわち、非相同末端結合(NHEJ)、マイクロホモロジー媒介末端結合(MMEJ)および相同組換え(HR)を示す図である。修復の経路はゲノム編集の結果に影響を及ぼし、それにより欠失、遺伝子変換または元の配列の効果的な回復が起こり得る。
【
図8】CRISPR/Cas9系を用いる、DG44 CHO細胞ゲノム中のGFPの一部をコードするドナープラスミドからの機能的GFPコード配列の回復を示す図である。結果は、CRISPR/Cas9+ドナー(a)、CRISPR/Cas9単独(b)、およびドナー単独(c)について示される。GFP再構成にはCRISPR/Cas9およびドナープラスミドが必要である((a)での形質移入細胞中でGFPの約0.4%が修復される)ことがわかる。DG44系では、CRISPR/Cas9単独またはドナープラスミド単独で測定可能なGFPはなかった。
【
図9】様々な修復経路に影響を及ぼす遺伝子の発現抑制/ノックダウン(siRNAを介する)による、
図8(DG44 CHO細胞)のドナープラスミドを介する遺伝子修正の%を示す図である。NHEJ経路の遺伝子の発現抑制は修正の%を増大する(リガーゼ4およびXRCC4の発現抑制/ノックダウンによる20%の増大)。HDR(相同性指向型修復経路、HRおよびMMEJ)での遺伝子の発現抑制/ノックダウンは大部分の修正の%を減少する。HDRでの特定の遺伝子の発現抑制は修正の%を増大する(Nbs4、MRN複合体の一部)。(x軸は、修復経路に従って整理した、使用した様々なサイレンシングRNAを示し、
*は有意差を表す)。
【
図10】CRISPR/Cas9系を用いる、CHO-M(CHO-K1バリアント)細胞ゲノム中のGFPの一部をコードするドナープラスミドからの機能的GFP-コード配列の回復を示す図である。CRISPR/Cas9およびドナープラスミドでの形質移入は0.7%の修復されたGFPをもたらす。CHO-M細胞はしたがって、DG44細胞より修復されやすい。
【
図11】異なる修復経路に影響を及ぼす遺伝子の発現抑制/ノックダウン(siRNAを介する)による
図10(CHO-K1細胞)のドナープラスミド組込みの%を示す図である。HDR(相同性指向型修復経路、HRおよびMMEJ)での遺伝子の発現抑制は遺伝子修正の%を減少した。図はまた、検討した3種類のクローンからの結果の高い再現性を示す。Rad51の発現抑制(siRad51を介する)、ひいては修復経路であるHRの低下/停止は、全3種類のクローンでGFP陽性細胞を有意に減少させたが、siXrcc4によるNHEJの低下/停止は、GFP陽性細胞の百分位数に実質的に全く影響を及ぼさなかった。
【
図12A】異なる修復経路に影響を及ぼす遺伝子の発現抑制(siRNAを介する)による
図10(CHO-K1細胞)からの遺伝子修正の増大または減少を示す図である。HR(相同修復)での遺伝子の発現抑制は、修正の%を部分的に減少し(Rad51の発現抑制/ノックダウン)、修正の%を部分的に増大する(Mre11のサイレンシング/ノックダウン)。(x軸は、修復経路に従って整理した、使用した異なるサイレンシングRNAを示し、
*は有意差を表す)。
【
図12B】律速的なHRタンパク質および/またはMMEJタンパク質の発現増大が遺伝子修正を用量依存性に刺激することを示す図である。図からわかるように、空ベクターを基準レベルの1とした場合、示される律速タンパク質を生じる発現ベクターの特定の量は、遺伝子修正を0.05倍超、0.1倍超、0.2倍、0.3倍、0.4倍または0.5倍増大させる(それぞれの遺伝子をアップレギュレートする)。
【
図13】細胞のゲノム内に組み込まれてガンマレトロウイルス関連ERVを形成すると考えられる3つのクラスのガンマレトロウイルスを示す図である。図は、GAL配列、POL配列、ENV配列、LTR配列を検索する(カバレッジ80%、配列同一性80%)PACBIOシーケンシングにより得たCHOゲノムを解析した際に、存在し活性であることが見出された各クラス(I~III)内のウイルスを示す。159種類のIAP(嚢内A型粒子)配列および144種類のC型マウスERV様配列(太く丸で囲った部分)ならびにGALV(テナガザル白血病ウイルス)に関連する6種類の配列が見出された。
【
図14】CHOゲノム由来のガンマレトロビスス(gammaretrovisus)様ERVの77種類のGAG/POL/ENV連結配列(concatenated sequence)に基づく近接結合コンセンサス系統樹を示す図である。グループ1とグループ2は、本明細書の他の箇所に記載される通りに区別される。
【
図15】CHO-M細胞から特徴付けられたCHOガンマレトロウイルス様ERV転写産物の選択からのGAG RNAのアライメントを示す図である。アライメントされた配列の下の印は、GAGオープンリーディングフレームにおける変異を表す。両グループともよく保存されており、チャイニーズハムスターの進化で最近起こった組込みを構成する。
【
図16】CHO-M細胞で同定された具体的なERVエレメントのCpG DNAメチル化状態を示す図である。これらの具体例では5’LTR ERVは低メチル化状態にあり、これらは転写されるERVに対応することを示唆する。
【
図17】CHOゲノム由来のガンマレトロウイルス様ERVの121種類のGAG配列に基づく近接結合コンセンサス系統樹を示す図である。グループ1および2はともに転写活性のあるERVを含む。グループ2中の囲まれた配列は、活性であると見出されたが、停止コドンを含み、グループ1中の複数の囲まれた配列は、活性でありかつコード配列中に停止コドンを含ないと見出された。GagおよびPolのcDNA解析は、機能的ERVの存在と一致した。発現する可能性のあるERVを黒い四角で囲む。それらの配列に基づき、CRISPR/Cas9プロセシングに関するグループ1のウイルスのコンセンサス配列を決定した。
【
図18】標的としてPPYPモチーフおよびミリストイル化モチーフのいずれかを用いる(いずれもERV出芽に干渉する)、
図17の配列のCRISPR/Cas9媒介性ERV不活性化に用いた戦略を示す図である。矢印は二本鎖切断が行われたた場所を示す。sgRNAの設計については「材料および方法」を参照されたい。
【
図19】ERV不活性化のための2種類の実験手順を示す図であり、一方はHDR修復経路を阻害せず、他方は、ここではRad51 siRNAを介して、HDR修復経路を阻害する。ERV破壊を、エンドポイントPCRまたはリーディングフレームを決定するシーケンシングによる分析で、mRNA(すなわち、cDNA)により検証した。
【
図20】非特異的陰性対照siRNAで処理した細胞のレベルに相対的な、Rad51 mRNAレベルおよび相同組換え修復活性に及ぼす3種類の個々のRad51標的化siRNAの形質移入の効果を示す図である。四角:値を1に設定した非特異的陰性対照siRNAで処理した細胞のレベルに相対的な、Rad51 mRNAレベル(x軸)および相同組換え修復活性(y軸)に及ぼす3種類のRad51標的化siRNAの混合物(siRad51 3×)の形質移入の効果。黒丸:Rad51およびHR阻害に対して3種類のsiRNAの混合物と同様の効果を示す、3種類のsiRNA(siRad51_1、siRad51_2、siRad51_3)をそれぞれ個別に用いて実施した同様のアッセイ。図からわかるように、Rad51 siRNAは効率的で特異的である。
【
図21】cDNA PCRアッセイで特異的sgRNAとともに使用したときのCRISPR-Cas9の効果を示す図であり、ERV特異的プライマーを用いてERV発現の減少を示す。第一および第二のCRISPR実験は再現性を示し、第三の実験は、CRISPR-Cas9処理前の追加のRAD51 siRNAが媒介する阻害の効果を示す。PPYP5 sgRNAおよびRAD51ノックダウンにより大幅なERV mRNAシグナル減少が観察された(上のゲル)。下のグラフでは、上にERVグループ1のコンセンサス配列が示され(配列番号30)、中央に対照(未処理細胞)グループ1のPPYPモチーフ配列が示され(配列番号31)、下にPPYP7 sgRNA処理細胞から得られたアウトオブフレーム欠失の例が示される(配列番号32)。
【
図22】
図21に示される第一のCRISPR実験(試料1)および第二の(試料2)CRISPR実験から得た、未処理CHO細胞(CHO WT)からの、またはPPYP6 sgRNAプログラムCas9ヌクレアーゼで処理したCHO細胞からの、増幅したGAG ERV配列のシーケンシング電気泳動図を示す図である。Cas9切断部位が垂直線で示され、その後で処理細胞について配列の混合物を観察し、GAG配列の50%以上が変異したことを示す。
【発明の概要】
【0013】
本発明は、一実施形態では、操作された細胞、好ましくはCHO-M細胞などの操作されたCHO-K1を含む、操作されたCHO細胞などの哺乳動物細胞株の操作された細胞であって、
その細胞のゲノムを含み、ゲノムが、上記ゲノムの一部である1個または複数個の、一般に10個、20個、30個、40個、50個、60個、80個、90個または100個を超える内在性レトロウイルス(ERV)エレメントに1個または複数個の核酸の
欠失、
付加/組込み、および/または
置換
を含む1つまたは複数の変化を含む、
操作された細胞に関する。
【0014】
ERVエレメントは、コアラ伝染性ウイルス(KoRV)、マウス乳腺腫瘍ウイルス(MMTV)、マウス白血病ウイルス(MLV)のERVを含むガンマレトロウイルスERV由来であり得る。1つまたは複数の変化は、好ましくは、1つまたは複数の、好ましくは60%、70%、80%、90%、95%超または100%の上記ERVの放出を抑制するか完全に抑える、または上記ERVを抑制するか完全に抑えるよう適応され得る。
【0015】
1個または複数個の変化した(ERV)エレメントは、gag遺伝子、pol遺伝子および/またはenv遺伝子である、またはこれに由来し、好ましくはMA(基質)、CA(カプシド)、NC(ヌクレオカプシド)およびpp12またはp6などのタンパク質をコードする別のドメインをコードする、gag遺伝子に由来し、かつ/あるいはERVの長い末端反復配列(LTR)であり得る。
【0016】
1個または複数個のERVエレメントは、特にGag(グループ抗原)タンパク質、Pol(逆転写酵素)タンパク質および/またはEnv(エンベロープ)タンパク質をコードし得る。
【0017】
付加/挿入、欠失または置換は、2個、3個、4個、5個、10個、15個、20個、25個、30個、40個、45個、50個、55個、60個、65個、70個、75個、80個、85個、90個、95個、100個、150個または200個を超える核酸を含み得る。
【0018】
変化は1つまたは複数の(ERV)エレメントを標的にしてよく、それは1つまたは複数のgag遺伝子、pol遺伝子および/またはenv遺伝子、好ましくはgag遺伝子、であってよく、またはこれに由来してよく、その遺伝子の配列は例えば、GFP(緑色蛍光タンパク質)などのマーカータンパク質をコードする導入遺伝子、の標的化組込みに供される、またはドミナントネガティブ表現型を生じるアミノ酸置換に供されてよい。
【0019】
ERVエレメントはgag遺伝子に由来してよく、および少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個もしくはそれより多いまたは10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%あるいはすべてのエレメントが上記変化を含み得る。
【0020】
変化はEVRエレメントのコンセンサス配列中であってよく、コンセンサス配列は少なくとも5塩基対、10塩基対、15塩基対、20塩基対、25塩基対、30塩基対、35塩基対、40塩基対、45塩基対、50塩基対の長さ、好ましくは、15~25塩基対または30~50塩基対の長さであってよい(
図21Bを比較されたい)。
【0021】
操作された細胞は、ERVを全く放出しない、または実質的に全く放出しない。
【0022】
細胞はまた、組換え経路の1つまたは複数のタンパク質をコードする、阻害するまたは活性化する異種核酸配列、ならびに/あるいは組換え経路の1つまたは複数のタンパク質、好ましくはNbs1、Mre11、Rad51、リガーゼ1および/またはリガーゼ3の発現を抑制する1つまたは複数の配列またはタンパク質をコードする異種核酸配列を含み得る。
【0023】
異種核酸配列は、好ましくは細胞のゲノム中に組み込まれないベクターとして存在する/ベクターにより発現され得る。
【0024】
操作された細胞はまた、好ましくはベクター上に、GFP(緑色蛍光タンパク質)などの1つまたは複数のマーカータンパク質をコードする、異種ドナーDNAをさらに含み得る。操作された細胞は導入遺伝子をさらに含み得る。導入遺伝子は、ゲノム中に組み込まれたベクターから好ましくは発現し得るGFPなどのマーカータンパク質および/または生物学的治療薬をコードするマーカー遺伝子であり得る。
【0025】
1つまたは複数の変化は、gag遺伝子またはgag遺伝子に由来するERVエレメントなどの、1つまたは複数のERVエレメント中のミリストイル化モチーフ内の1つまたは複数のミリストイル化アミノ酸の、非ミリストイル化アミノ酸との置換であるかそれを含み得る。
【0026】
この目的のために、Pad51、Lig3、Ercd、Pold3などのHRタンパク質および/またはMMEJタンパク質をコードする一過的に発現されるベクターの形態でなどの配列、ならびに/あるいはsiMRe11などのsiRNA配列またはそれをコードするベクターなどの配列を少なくとも一過的に細胞に供給する/細胞で発現することにより、上記細胞がHR/MMEJ発現を増大するよう改変される(
図12Aおよび12Bを参照されたい)。
【0027】
gag遺伝子またはgag遺伝子に由来するERVエレメントなどのERVエレメント(1つまたは複数)は、PPYPモチーフを含み得、かつ(i)PPYPモチーフをコードする配列および/または(i)中の配列に隣接する最大20個または30個の核酸の配列は変化を含み得る。
【0028】
操作された細胞はCHO細胞であり得、1つまたは複数の配列番号1、2、3、4またはそれと90%もしくは95%超の配列同一性を有する配列中に、好ましくは上記配列のERVエレメント内に1つまたは複数の欠失、付加、および/または置換を有し得る。
【0029】
操作された細胞はCHO細胞であり得、配列番号30などのERVグループ1コンセンサス配列中に、またはそれと90%超の配列同一性を有する配列中に1つまたは複数の欠失、付加、および/または置換を有し得、ここで欠失、付加、および/または置換を有する配列は、もはや機能的Gagタンパク質をコードしない。
【0030】
本発明はまた、改善されたゲノム編集の方法であって、
(i)細胞、好ましくは目的の細胞の標的核酸配列、例えばERVエレメント、好ましくはgag遺伝子であるまたはこれに由来するERVエレメントのコンセンサス配列などに一本鎖または二本鎖のブレーキ(brake)を生じるための非天然に起こる/異種の系を供給するまたは導入することと、さらに
(ii)細胞中に
(a)1つまたは複数の組換え経路の1つまたは複数のタンパク質をコードするまたは活性化する異種核酸配列、ならびに/あるいは
(b)1つまたは複数の組換え経路の1つまたは複数のタンパク質の発現を抑制する/減少させる、siRNAまたはタンパク質などの、1つまたは複数の配列をコードする異種配列
を供給または導入することと
を含み、ここで(i)の上記異種の系ならびに/あるいは(ii)(a)および/または(ii)(b)の配列が、目的の細胞中で好ましくは一過的に発現される、
方法に関する。
【0031】
異種配列は、組換え経路の1つまたは複数のタンパク質、特に相同組換え(HR)経路の1つまたは複数のタンパク質、特にRad51、Nbs1、Mre11、リガーゼ1および/またはリガーゼ3をコードする、活性化するまたは不活性化し得る。
【0032】
GFPなどのマーカー遺伝子を相同組換えにより標的核酸配列中に挿入し得る。マーカー遺伝子を含む細胞を好ましくは選択する。
【0033】
上の(a)の異種配列は、Nbs1および/またはMre11など、MNR複合体のタンパク質をコードする、活性化するまたは不活性化し得、かつ/あるいは、(b)の上記異種配列は、Rad51、Nbs1、Mre11、リガーゼ1および/またはリガーゼ3などの相同組換え(HR)経路の1つまたは複数のタンパク質の発現を抑制する配列またはタンパク質をコードし得る。
【0034】
欠失または挿入は、非相同末端結合(NHEJ)またはマイクロホモロジー媒介末端結合(MMEJ)により1個または複数個のERVエレメント中に導入され得る。
【0035】
異種配列は、組込み型ベクターまたは好ましくは非組込み型ベクターの一部である、または同ベクターから発現され得る。
【0036】
標的核酸配列中に一本鎖または二本鎖のブレーキ(brake)を導入する非天然に起こる/異種の系は、CRISPR/Cas9系である、またはこれに基づくものであり得る。
【0037】
1個または複数個のERVエレメント中のミリストイル化モチーフ内の1つまたは複数のミリストイル化アミノ酸は、非ミリストイル化アミノ酸で置換され得る。PPYPモチーフをコードする配列および/または同モチーフに隣接する最大10個、20個または30個の核酸の配列は、変化を含み得る。
【0038】
例えばRad51などのHRタンパク質の発現を抑制する配列は、細胞中で一過的にのみ発現され得る。
【0039】
本発明はまた、操作された細胞、好ましくはCHO-K1細胞を含む操作されたCHO細胞などの哺乳動物細胞に関し、この細胞は、特に標準培養条件下および/またはストレス培養条件下で、好ましくはウイルス粒子を放出せず/実質的に全く放出せず、およびこの細胞のゲノムが1個または複数個、一般に10個、20個、30個、40個、50個、60個、80個、90個または100個を超える内在性レトロウイルス(ERV)エレメント中に1個または複数個の核酸の
(a)欠失、
(b)付加/組込み、および/または
(c)置換
を含む1つまたは複数の変化を含み、かつ本明細書に記載されるいずれか1つの方法によって好ましくは作製される。
【0040】
本発明はまた、
(i)1つの容器中にCRISPRなどの、少なくとも1つのヌクレアーゼをコードする少なくとも1つの非組込み型ベクターと、
(ii)同じ容器または別の容器中にERVエレメント中のモチーフを標的とする1つもしくは複数のガイドRNAまたはその1つもしくは複数のガイドRNAをコードする配列と、
(iii)同じまたは別の容器中に1つもしくは複数のsiRNAまたは1つもしくは複数のsiRNAをコードする配列と、
別の容器中に細胞内に(i)、(ii)および(iii)を供給する方法の指示書と
を含む、キットに関する。
【0041】
ERVエレメント中のモチーフを標的とする1つもしくは複数のガイドRNAをコードする配列および/または1つもしくは複数のsiRNAをコードする配列は、ベクターの一部であり得る。本明細書に記載されるいずれかのベクターは、一過的にのみ発現され得、かつ/または(i)の非組込み型ベクターであり得る。ERVエレメントはGagタンパク質をコードし得る。モチーフはミリストイル化モチーフまたはPPXYモチーフ、特にPPYPモチーフであり得る。siRNA(1つまたは複数)は、HR経路の遺伝子に対し指向され得る。
【発明を実施するための形態】
【0042】
(本発明の様々な実施形態および好ましい実施形態の説明)
本発明により操作された細胞を産生するよう操作される細胞、好ましくは哺乳動物細胞/真核細胞は、細胞培養条件下で維持することが可能である。標準的な細胞培養条件は、例えば組換えタンパク質の産生に使用される完全合成培地中で、30~40℃、好ましくは37℃または約37℃である。このタイプの細胞の非限定的な例は、CHO-K1(ATCC CCL61)細胞およびSURE CHO-M細胞(CHO-K1の派生物)を含むチャイニーズハムスター卵巣(CHO)細胞、ならびにベビーハムスター腎細胞(BHK、ATCC CCL10)などの非霊長類真核細胞である。霊長類真核宿主細胞としては、例えば、ヒト子宮頸癌細胞(HELA、ATCC CCL2)および293[ATCC CRL1573]ならびに3T3[ATCC CCL163]およびサル腎臓CV1系[ATCC CCL70]、SV40で形質転換されたもの(COS-7、ATCC CRL-1587)が挙げられる。操作されたという用語は、例えば、例えば形質転換配列による形質移入によりおよび/または変異により改変された細胞を意味する。当業者には容易に理解されるように、これらの細胞は、本明細書に記載される通りの操作の前であっても、非天然の細胞である。上記の細胞、特に種々のCHO細胞は、生物工学用途で治療用タンパク質の産生などによく用いられ、本明細書では目的の細胞と呼ぶ。当業者には容易に理解されるように、上記以外の細胞であっても、生物工学用途で特に例えば治療用タンパク質の発現に用いられる限り、目的の細胞であり得る。
【0043】
レトロウイルスゲノム内でコードされる3種類の主要なタンパク質は、Gag、Pol、およびEnvである。gag遺伝子にコードされるGag(グループ抗原)はポリタンパク質であり、これは、レトロウイルスのコアを決定する核タンパク質コア粒子を含む、マトリックスタンパク質および他のコアタンパク質へとプロセシングされる。Polは、pol遺伝子にコードされる逆転写酵素であり、RNアーゼHおよびインテグラーゼ機能を有する。その活性により、組み込まれる前の形態のウイルスの二本鎖DNAが生じ、インテグラーゼ機能を介して宿主ゲノム中への組込みが起こり、またRNアーゼ機能を介して宿主のゲノム中への組み込み後に逆転写が起こる。Envはenv遺伝子にコードされるエンベロープタンパク質であり、ウイルスの脂質層中に存在し、ウイルスの指向性を決定する。
【0044】
コアラ伝染性ウイルス(KoRV)、マウス乳腺腫瘍ウイルス(MMTV)、マウス白血病ウイルス(MLV)を含む、ガマレトロウイルス(gamaretrovirus)属由来のウイルスなどの内在性レトロウイルス(ERV)は、例えばハムスターゲノムおよびその近縁種のゲノムを含むあらゆる動物ゲノム中にみられる外来性因子である。ERVはゲノム中で維持され、それらがゲノム中に組み込まれる細胞にとって、遺伝的多様性の源および他のウイルス病原体からの防御をもたらすことを含む、いくつかの利点を有し得る。しかし、ERVは感染性になることもある。癌および/またはエピジェネティックな修飾はERVの覚醒を増大させることがある。Lewisらは、115種類のウイルスのデータベースとの相同性の比較に基づき、CHO細胞中の403種類の予想されるレトロウイルスタンパク質を同定した。Lewisらは、それらのmRNAの40%が発現されると報告し、したがってその多くが依然としてレトロウイルス成分を合成している可能性を示唆する(Lewisら,2013,Supplement)。ここでは、マウスレトロウイルスC型配列を比較ツールとして用いた(1994年の公表文献から入手したデータ)。SIB(スイスバイオインフォマティクス研究所)が主催するViralzoneのウェブサイト(2015年12月)に記載されるように、このグループには4つの種がある。これらはまたマウスのゲノム中で高頻度でみられ、マウスで癌を引き起こすことが知られている。しかし、当業者に理解されるように、多数の他のレトロウイルスの配列を、目的の細胞中のERVの検索に用いることができる。本発明による操作された細胞は、その由来であるCHO-K1細胞などの細胞のゲノムと大部分が同一であるゲノムを含み得る。しかし、これらのゲノムの一部である、少なくとも1つまたは複数の、多くの場合多数のERVエレメントは、本明細書に記載される変化を含む。
【0045】
本発明によるERVエレメントは主として、対応する非組込みウイルス中で機能的実体をもたらすERV核酸配列の区域を表す。当業者に理解されるように、組込まれたウイルスDNA中で、これらの区域の一部が破壊されている、または欠失していることが多い。したがって、この定義には、以下に記載され
図2Bに示されるあらゆる遺伝子(gag、pol、env)および副次的にその一部が含まれ、細胞のゲノム中に存在する切り詰められたおよび/または改変されたものも含まれる。ERVエレメントは、gag遺伝子がそれらの供給源である場合、例えばgagに由来すると言われるが、それらは必ずしも完全に機能的なGagタンパク質をコードするわけではない。Gagタンパク質をコードすると言われるERVエレメントは、機能的なGagタンパク質をコードする。
【0046】
gag遺伝子はGag前駆体タンパク質を生じ、これはスプライスされないウイルスmRNAから発現される。Gag前駆体タンパク質は、ウイルスの成熟過程中に、一般にMA(基質)、CA(カプシド)、NC(ヌクレオカプシド)と呼ばれるタンパク質とさらなるタンパク質ドメイン(例えば、マウス白血病ウイルスでのpp12またはHIVでのp6)の4つのより小型のタンパク質へと、ウイルスがコードするプロテアーゼ(pol遺伝子の産物)により切断される。
【0047】
MAポリペプチドは、N末端の、前駆体タンパク質のミリストイル化末端から生じる。MA分子の大部分はビリオン脂質二重層の内表面に結合したままであり、粒子を安定化する。
【0048】
CAタンパク質はウイルス粒子の円錐形のコアを形成する。
【0049】
GagのNC領域は、レトロウイルスのいわゆるパッケージングシグナルを特異的に認識する役割を担っている。パッケージングシグナルは、ウイルスRNAの5’末端付近に位置する4つのステムループ構造を含み、ビリオン中への異種RNAの取り込みを媒介するのに十分である。NCは、2つの亜鉛フィンガーモチーフを介する相互作用によりパッケージングシグナルに結合する。
【0050】
もう1つのタンパク質ドメインは、前駆体タンパク質Gagとアクセサリータンパク質Vprの間の相互作用を媒介し、集積するビリオン中へのVprの取り込みをもたらす。HIV中のp6領域はまた、感染細胞からの出芽ビリオンの効率的な放出に必要な、いわゆる後期ドメインを含む(HopeおよびTrono,2000)。
【0051】
ウイルスのプロテアーゼ(Pro)、インテグラーゼ(IN)、RNアーゼH、および逆転写酵素(RT)はGag-Pol融合タンパク質という枠内で発現する。Gag-Pol前駆体は一般に、リボソームフレームシフト事象によって生成し、この事象は特異的なシス作用性RNAモチーフ(Gag RNAの遠位領域中のヘプタヌクレオチド配列とそれに続く短いステムループ)により誘発される。リボソームがこのモチーフと遭遇すると、翻訳を妨げることなく約5%の確率でpolリーディングフレームにシフトする。このリボソームフレームシフトの頻度は、GagとGag-Pol前駆体が約20:1の比で産生される理由を説明する。
【0052】
ウイルス成熟中に、ウイルスがコードするプロテアーゼがPolポリペプチドをGagから切断し、さらにそれを消化してプロテアーゼ、RT、RNアーゼH、およびインテグラーゼ活性に分離する。このような切断は必ずしも効率的に起こるわけではなく、例えば、RTタンパク質の約50%が単一ポリペプチド(p65)としてRNアーゼHに結合したままである(HopeおよびTrono,2000)。
【0053】
pol遺伝子は逆転写酵素をコードする。逆転写の過程中に、ポリメラーゼによりビリオン中に存在する一本鎖ゲノムRNA二量体の二本鎖DNAのコピーが生じる。RNアーゼHが第一のDNA鎖から元のRNA鋳型を除去し、DNAの相補鎖の合成を可能にする。ポリメラーゼの主な機能的種はヘテロ二量体である。放出されるビリオンのカプシド内にあらゆるpol遺伝子産物がみられる。
【0054】
INタンパク質は、感染細胞のゲノムDNA中へのプロウイルスDNAの挿入を媒介する。この過程はINの3つの異なる機能を介する。
【0055】
Envタンパク質は単独でスプライスされたmRNAから発現される。Envは最初、小胞体で合成され、ゴルジ複合体の中を移動しながらグリコシル化を受ける。Envのグリコシル化は一般に、感染性に必要とされる。細胞内プロテアーゼがこのタンパク質を膜貫通ドメインと表面ドメインとに切断する(HopeおよびTrono,2000)。
【0056】
ゲノムのERVには、ウイルス様粒子の形態で細胞から放出されるものもあれば、そうでないものもある。しかし一般的には、放出されるERVの方が感染性となる可能性が高い。このため、一般的には、本明細書に記載されるように、好ましくは標準的な培養条件下またはストレスのかかる培養条件下で、ERVを全く発現できないおよび放出できない、または実質的に全く発現できないおよび放出できないように細胞を操作するのが有利である。そのように操作された細胞を含む細胞培養物が、本明細書に記載されるERV放出減少法を実施していない対応物に比べ50%未満、40%未満、30%未満、20%未満、10%未満、好ましくは5%のERVを放出する場合、実質的にERVは全く放出されない。このような対応物は、例えば市販のCHO-K1細胞であろう。全く発現しない、または実質的に全く発現しないとは、50%未満、40%未満、30%未満、20%未満、10%未満、好ましくは5%の未変異Gag mRNA配列がPCRおよびシーケンシング解析によって検出できることを意味する。全く放出されないとは、例えば
図21に示される、またはQIAGEN社のQuantiTect Rev.Transcription Kit(登録商標)で得られる、cDNA PCRアッセイによる評価で、検出可能なウイルス配列の放出が全く、または実質的に全く起こらないことを意味する。当業者にまた理解されるように、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個のERVエレメント中にタンパク質/ペプチド産生を不活性化する核酸配列の変化を含むよう操作された細胞も有利であり、かつ本発明の一部である。実際に、ある特定の実施形態では、目的の細胞のゲノムの一部である1個または複数個のERVエレメントを1つまたは複数の変異によってのみ変化させて、必要に応じて、細胞内でERVが果たすと考えられる有益な役割を維持することが有利である。しかし、のちに記載するように、本発明の特定の実施形態は、特に高コピー数のERV(1細胞当たり30個、40個または50個のERV)に適しており、改変細胞がそれぞれのERV成分の発現を全く示さないようにすることができる。
【0057】
異種核酸配列は、本発明に従って操作する前の細胞にはみられない核酸配列であるが、関連するタイプの核酸配列は細胞中に非常によく存在し得る。本発明に関連して使用される導入遺伝子は、そのような異種核酸配列であり、特に所与の成熟タンパク質をコードするデオキシリボヌクレオチド(DNA)配列(本明細書ではタンパク質をコードするDNAとも呼ばれる)、前駆体タンパク質またはタンパク質をコードしない機能性RNA(非コードRNA)をコードするデオキシリボヌクレオチド(DNA)配列である。導入遺伝子を単離し細胞内に導入して導入遺伝子産物を得る。本発明によるいくつかの好ましい導入遺伝子は、GFP(緑色蛍光タンパク質)などのマーカータンパク質をコードする。このような導入遺伝子を用いて、ERVエレメント中への組込み、したがってERVエレメントの変化/不活性化の成功を検出できる。その他の導入遺伝子は、例えば、問題の細胞により最終的に産生されるであろうタンパク質、例えば免疫グロブリン(Ig)およびFc融合タンパク質ならびに他のタンパク質、特に治療活性を有するタンパク質(「生物学的治療薬」)をコードするものである。本発明では、付加は、標的化組込みなどの組込みを含む。しかし、当業者には、組込み過程中にレシピエントゲノム中の特定のヌクレオチドが失われる可能性のあることが理解されよう。上記の組込みは本発明の一部であり、付加と見なされる。
【0058】
本明細書で使用される導入遺伝子という用語は、タンパク質をコードするDNAとの関連において、RNA転写開始シグナル、プロモーターまたはエンハンサーなどの転写されない隣接領域を含まない。他の好ましい導入遺伝子としては、機能性RNAをコードするDNA配列が挙げられる。したがって、導入遺伝子という用語は、この関連において、形質移入(本発明との関連では、形質導入、すなわち、ウイルスベクターによる導入も含む)により真核宿主細胞などの細胞中に導入され目的の産物(「導入遺伝子発現産物」、例えば「異種タンパク質」)をコードするDNA配列に言及する際に使用される。導入遺伝子は、シグナルペプチドをコードするシグナルペプチドコード配列に機能的に結合していてよく、シグナルペプチドは次に、小胞体および/または細胞質膜を横断する移行および/または分泌を媒介および/または促進し、かつ分泌前または分泌時に除去される。
【0059】
プロモーター配列または単にプロモーターは、1つまたは複数の核酸配列の発現のため宿主細胞によって認識される核酸配列である。プロモーター配列は、ポリヌクレオチドの発現を調節する転写制御配列を含む。プロモーターは、選択した宿主細胞中で転写活性を示す変異体プロモーター、切り詰められたプロモーターおよびハイブリッドプロモーターを含む任意の核酸配列であり得、宿主細胞に対して同種または異種である細胞外ポリペプチドまたは細胞内ポリペプチドをコードする遺伝子から得られてよい。本発明によるプロモーターは、誘導性プロモーターおよび非誘導性プロモーターを含む。プロモーターが核酸に対してその機能を発揮する場合、その核酸配列はそのプロモーターの制御下にある。本発明の細胞/ベクターは、そのようなプロモーターをしばしば含む。
【0060】
核酸配列の変化とは、本発明に従って操作する前の細胞中では起こらない付加/挿入、欠失および/または置換などの変化である。
【0061】
本明細書で使用される「ゲノム編集」は、ゲノム配列の改変(「編集」)を指し、少なくとも1つヌクレオチドの欠失、少なくとも1つヌクレオチドの付加/挿入、または少なくとも1つヌクレオチドの置換を含み得る。本明細書では、編集されるゲノム配列を標的核酸配列と呼ぶ。標的化挿入とは、予め定められた特定の標的部位で起こる挿入である。ゲノム編集ツールは、例えばヌクレアーゼまたはニッカーゼにより、ゲノム中に二本鎖または一本鎖の切断を導入し、少なくとも部分的には、このような切断を修復する細胞内組換え機構に依存する(のちの記載を参照されたい)。これらのツールは一般に、配列特異的DNA結合モジュールも含む。ZFN(亜鉛フィンガーヌクレアーゼ)およびTALEN(転写活性化因子様エフェクターヌクレアーゼ)は、特定のゲノム位置で変異性非相同末端結合(NHEJ)または相同指向修復(HDR)を刺激するDNA二本鎖切断を導入することにより、多岐にわたる遺伝子改変を可能にする。
【0062】
CRISPR(クラスター化され規則的にスペーサーが入った短い回文型の反復配列)系の配列特異性は低分子RNAにより決定される。CRISPR座位は、バクテリオファージおよび他の移動性遺伝子エレメントのゲノムと適合する「スペーサー」配列によって隔てられる一連の反復配列からなる。反復配列とスペーサーのアレイは長い前駆体として転写され、反復配列内でプロセシングされて、CRISPR系によって切断される標的配列(プロトスペーサーとしても知られる)を特定する小型のcrRNAを生じる。切断には多くの場合、標的領域のすぐ下流にプロトスペーサー隣接モチーフ(PAM)として知られる配列モチーフが存在する必要がある。CRISPR関連(cas)遺伝子は通常、反復配列とスペーサーのアレイに隣接し、crRNA(CRISPR RNA)の生合成および標的化を担う酵素的機構をコードする。Cas9は、crRNAガイドを利用して切断部位を特定するdsDNAエンドヌクレアーゼである。Cas9へのcrRNAガイドの搭載はcrRNA前駆体のプロセシング中に起こり、前駆体に対する低分子RNAアンチセンス、tracrRNA、およびRNアーゼIIIを必要とする。ZFNまたはTALENを用いるゲノム編集とは対照的に、Cas9の標的特異性の変更はタンパク質工学を必要とせず、sgRNAとも呼ばれる短鎖crRNAガイドの設計のみを必要とする。
【0063】
これまでに、3種類の異なるCas9ヌクレアーゼのバリアントがゲノム編集プロトコールで採用されてきた。最初のものは野生型Cas9であり、これは二本鎖DNAを部位特異的に切断し、二本鎖切断(DSB)修復機構の活性化をもたらし得る。DSBは、細胞内の非相同末端結合(NHEJ)経路によって修復され、標的座位を破壊する挿入および/または欠失(挿入欠失)を生じ得る。あるいは、標的座位に相同なドナー鋳型(
図7を参照されたい)が供給される場合、DSBは相同指向修復(HDR)経路によって修復され、精度の高い置換変異を起こさせる。
【0064】
Cas9系は、ニッカーゼ活性のみを有する、Cas9D10Aとして知られる変異型を開発することにより、精度が高くなるようさらに操作された。このことは、Cas9D10Aが1つのDNA鎖のみを切断し、NHEJを活性化しないことを意味する。代わりに、相同な修復鋳型を供給すると、DNA修復は高忠実度のHDR経路のみを介して行われ、それにより挿入欠失変異が減少する。Cas9D10Aはこのため多数の用途において、隣接するDNAニックが生じるよう設計される対のCas9複合体により座位を標的化する場合に、標的特異性の点でさらに魅力的である。
【0065】
本発明との関連において、ERVエレメントの特異的配列またはコンセンサス配列は、例えば上記の系の1つにより切断部位を特定するよう決定される。このような特異的配列またはコンセンサス配列は、好ましくは5~50塩基対の長さ、好ましくは10~50塩基対、15~25塩基対、25~50塩基対または30~50塩基対の長さである。コンセンサス配列は、切断がなおも実施され得る限り、例えば、1つ、2つ、3つ、4つまたは5つのミスマッチ(互いに60%、70%、80%、90%または95%を超える相補性を有する)を含み得る。例えば、
図21を参照されたい。上記の系は非天然系または異種系と呼ばれ、これは、上記の系が、本発明に従って操作する前の細胞の一部であるのではなく、細胞に導入されることを意味する。
【0066】
本発明によるベクターは、このベクターにより発現される導入遺伝子などの別の核酸を運搬できる核酸分子であり、別の核酸がそれに連結され、一般にはその中に組込まれている。例えば、プラスミドは1つのタイプのベクターであり、レトロウイルスまたはレンチウイルスは別のタイプのベクターである。本発明の好ましい実施形態では、形質移入の前にベクターを直線化する。発現ベクターは異種調節エレメントを含む、またはその発現ベクターにより運ばれる導入遺伝子などの核酸配列の転写および/または発現を促進するよう設計されるそのような調節エレメントの制御下にある。調節エレメントはエンハンサーおよび/またはプロモーターを含み、本明細書に記載される様々な他のエレメントも含む。非ウイルスベクターのうちトランスポゾンは、宿主ゲノム内の複数の座位にDNA配列の単一コピーを高頻度で組み込むそれらの能力のため特に魅力的である(組込み型ベクター)。ウイルスベクターとは異なり、いくつかのトランスポゾンは細胞内遺伝子付近に優先的に統合しないと報告されており、それらはしたがって有害な変異を導入する可能性が低い。さらに、トランスポゾンは作製および取扱いが容易であり、一般に、逆方向反復配列に隣接するカーゴDNAを含むトランスポゾンドナーベクターと、トランスポザーゼ発現ヘルパープラスミドまたはmRNAとからなる。内在性トランスポゾンのコピーに干渉することなく様々な細胞株中でDNAを動員するトランスポゾン系がいくつか開発された。例えば、最初にキャベツシャクトリムシのガから単離されたPiggyBac(PB)トランスポゾンは、カーゴDNAを様々な哺乳動物細胞中に効率的に転移させる。
【0067】
本発明との関連で、ベクター、特に非組込み型ベクターもまた、遺伝子または機能性RNAの一過的発現のために使用され得る。一過的発現は、限られた長さの時間の間の発現であり、発現の時間はベクターの設計および培養条件に左右される。しかし、一過的発現は、少なくとも24時間であるが一般には7日以下の期間にわたる発現を意味する。
【0068】
カーゴDNAがプラスミドベクター上の導入遺伝子付近に位置する場合、カーゴDNAを望ましくないエピジェネティック効果から保護するためエピジェネティックな調節エレメントを使用できる。例えば、強力なヒトMAR1-68により例示されるように、ヘテロクロマチンサイレンシングを防ぎながらカーゴDNAのゲノム組込みおよび転写を増大させるための、マトリックス結合領域(MAR)と呼ばれるエレメントが提案された。これらのエレメントはまた、インスレーターとして作用し、それにより近隣の細胞内遺伝子の活性化を防ぐことができる。MARエレメントはこのため、プラスミドまたはウイルスベクターにおいて持続的な高発現を媒介するのに使用されてきた。一過的遺伝子発現には、プラスミドまたは非組込み型レンチウイルス(NIL)ベクターなどの非組込み型ベクター(エピソームベクターと呼ばれることもある)を使用し得る。これらのベクターは、宿主細胞内で安定にまたは一過的に維持され複製され得る。
【0069】
ベクターのベクター配列は、導入遺伝子などの「他の」核酸およびMARエレメントなどの遺伝子エレメントをすべて除いたベクターのDNA配列またはRNA配列である。
【0070】
配列同一性という用語は、ヌクレオチド配列またはアミノ酸配列の同一性の尺度を指す。一般に、配列は最大の一致が得られるように整列される。「同一性」そのものは当該技術分野で認められた意味を有し、公開済みの技術を用いて算出できる(例えば、Computational Molecular Biology,Lesk,A.M.編,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.編,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part I,Griffin,A.M.およびGriffin,H.G.編,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;ならびにSequence Analysis Primer,Gribskov,M.およびDevereux,J.編,M Stockton Press,New York,1991を参照されたい)。2つのポリヌクレオチド配列またはポリペプチド配列の間の同一性を測定する方法は多数存在するが、「同一性」という用語は、配列中の所与の位置において一致するヌクレオチドまたはアミノ酸を定義するものとして当業者に周知である(Carillo,H.およびLipton,D.,SIAM J Applied Math 48:1073(1988))。
【0071】
DNAsisソフトウェア(日立ソフトウェア、サンブルーノ、カリフォルニア州)などの既知のコンピュータプログラムを最初の配列アライメントに用い、次いでESEEバージョン3.0 DNA/タンパク質配列ソフトウェア(cabot@trog.mbb.sfu.ca)を多重配列アライメントに用いる従来の方法で、任意の特定の核酸分子が、例えば配列番号1、2、3もしくは4のガンマレトロウイルス様配列またはその一部(例えば、
図18に開示される配列を参照されたい)と少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%同一であるかどうかを決定できる。
【0072】
BESTFITプログラム(Wisconsin Sequence Analysis Package、Version 8 for Unix、Genetics Computer Group、University Research Park、575 Science Drive、マディソン、ウィスコンシン州、53711)などの既知のコンピュータプログラムを用いる従来の方法で、アミノ酸配列が、例えば配列番号1、2、3もしくは4、またはその一部により発現されるタンパク質と少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%同一であるかどうかを決定できる。BESTFITは、SmithおよびWaterman(Advances in Applied Mathematics 2:482-489(1981))の局所相同性アルゴリズムを用いて、2つの配列間の相同性が最大のセグメントをみつける。
【0073】
DNAsis、ESEE、BESTFITまたは任意の他の配列アライメントプログラムを用いて特定の配列が例えば本発明による参照配列と95%同一であるかどうかを決定する場合、参照核酸配列または参照アミノ酸配列の長さ全体にわたる同一性の割合が算出され、かつ参照配列中の総ヌクレオチド数の最大5%まで相同性でのギャップが許容されるようパラメータを設定する。
【0074】
クエリ配列(本発明の配列)と対象配列との間で最適な全体マッチを決定するための別の好ましい方法はグローバル配列アライメントとも呼ばれ、Brutlagら(Comp.App.Biosci.(1990)6:237-245)のアルゴリズムを土台とするFASTDBコンピュータプログラムを用いて決定できる。配列アライメントでは、クエリ配列と対象配列はともにDNA配列である。RNA配列はUをTに変換することにより比較できる。上記グローバル配列アライメントの結果はパーセント同一性で表される。パーセント同一性を算出するためにDNA配列のFASTDBアライメントで用いられる好適なパラメータは以下の通りである:Matrix=Unitary、k-tuple=4、Mismatch Penalty=1、Joining Penalty=30、Randomization Group Length=0、Cutoff Score=1、Gap Penalty=5、Gap Size Penalty=0.05、Window Size=500または対象ヌクレオチド配列の長さのいずれか短い方。
【0075】
例えば、本発明の参照ヌクレオチド配列と95%の「同一性」を有するポリヌクレオチドは、そのポリヌクレオチド配列がポリペプチドをコードする参照ヌクレオチド配列のヌクレオチド100個当たり平均で最大5つの点変異を含み得ること以外は、参照配列と同一である。換言すれば、参照ヌクレオチド配列と少なくとも95%同一であるヌクレオチド配列を有するポリヌクレオチドを得るのに、参照配列中の最大5%のヌクレオチドが欠失されるか別のヌクレオチドで置換されてよい、あるいは参照配列中の総ヌクレオチドの最大5%の複数のヌクレオチドが参照配列中に組み込まれてよい。クエリ配列は、配列全体、ORF(オープンリーディングフレーム)、または本明細書に記載される任意の特定のフラグメントであり得る。
【0076】
配列解析プログラムのblastp、blastn、blastx、tbiastnおよびtbiastxと関連した使用のために、NCBI Basic Local Alignment Search Tool(BLAST)(Altschulら,J.Mol.Biol.215:403-410,1990)が、米国立生物工学情報センター(NCBI、ベセスダ、メリーランド州)を含むいくつかの入手源およびインターネット上から入手できる。それはNCBIのウェブサイトで、このプログラムを用いて配列同一性および配列類似性を求める方法の説明とともに、アクセスできる。
【0077】
本発明は、本明細書に開示される配列およびその任意のフラグメント、特にPPYPモチーフの左側および右側40bps、30bpsまたは20bpsに及ぶフラグメントと80%、85%、90%もしくはそれを超える、95%もしくはそれを超える、98%の配列同一性または完全な配列同一性を有する核酸分子および/またはアミノ酸分子を含む。
【0078】
組換え経路
DNA組換え経路としても知られる組換え経路は、DNA損傷の修復、例えば染色体二本鎖切断(DSB)後のDNA分子末端の結合を、および染色体DNA分子と非染色体DNA分子との間のDNA配列の交換または融合、例えば減数分裂時の染色体乗換えまたはリンパ球細胞の免疫グロブリン遺伝子の再構成など、を引き起こす細胞内経路である。主な組換え経路は、相同組換え経路(HR)、非相同末端結合経路(NHEJ)ならびにマイクロホモロジー媒介末端結合(MMEJ)および代替的末端結合(Alt-EJ)経路である。
【0079】
本発明との関連で言えば、1つまたは複数の経路の特定の要素のノックアウトが相補的核酸配列を介してしばしば生じる。DNAまたはRNAなどの、ある核酸配列は、例えば2つの一本鎖DNA鎖または2つの一本鎖RNA鎖のヌクレオチドが安定な水素結合、例えばグアニン(G)とシトシン(C)の間の水素結合などを形成できる場合、もう一方のDNAまたはRNAに対して相補的である。細胞中で、相補的な塩基対形成によって、例えば、細胞が世代から世代へと情報を複製できる。RNA干渉(RNAi)では、相補的な塩基対形成は特定の標的遺伝子のサイレンシングまたは完全なノックアウトを可能にする。siRNA配列、shRNA配列またはmiRNA配列は基本的に、一本鎖RNA鎖(例えば、siRNAのアンチセンス鎖)をRNA、特に宿主細胞のmRNAと並べることにより標的遺伝子の発現を特異的に低下またはノックアウトする。2つの核酸鎖の間の相補性の度合いは、完全な相補性(各ヌクレオチドはその相手と向かい合う)~部分的な相補性(50%、60%、70%、80%、90%または95%)と様々であり得る。相補性の度合いは複合体の安定性を決定し、ひいては例えば遺伝子のノックアウトの成功率を決定する。このため、完全な相補性または少なくとも95%相補性が好ましい。
【0080】
相同組換え(HR)、NHEJおよびMMEJの機序
導入遺伝子は組換え機構を用いて二本鎖切断部分で宿主ゲノム中に統合する。
二本鎖切断(DSB)は生物学的に最も有害なタイプのゲノム損傷であり、細胞死または多種多様な遺伝子再構成を引き起こす可能性がある。正確な修復が、遺伝情報の維持および伝搬に成功するために不可欠である。2種類の主なDSB修復機構NHEJおよびHRがある。MMEJと呼ばれる3つ目の機構は多くの場合、これらの2つの主要なDSB修復機構が機能しないときに作用する。相同組換えは、互いに相同性を有するDNA配列の間で遺伝子を交換する過程であり、主として細胞周期のS/G2期に作動し、一方NHEJは、通常は配列相同性のない2つの切断されたDNA末端を単につなぎ合わせ、細胞周期のあらゆる相で機能するが、有糸分裂細胞のG0~G1期およびS期初期で特に重要である。脊椎動物では、DSBの性状および細胞周期の相に応じて、HR、NHEJおよびMMEJがDSB修復に異なって寄与する。
【0081】
NHEJ:基本的機序
NHEJ過程の分子機序は概念的には単純であると思われ:1)1組の酵素が切断されたDNA分子を捕捉し、2)2つのDNA末端をつなぎ合わせる分子架橋が形成され、3)切断された分子が再び連結される。このような反応を実施するために、哺乳動物細胞中のNHEJ機構は、2種類のタンパク質複合体である、DNA-PKcs(DNA依存性プロテインキナーゼの触媒サブユニット)と結合したヘテロ二量体Ku80/Ku70およびDNAリガーゼIVとその補因子XRCC4(X線補完チャイニーズハムスター遺伝子4)のならびにArtemisおよびXLF(XRCC4様因子;またはCernunnos)などの、多数のタンパク質因子を含む。NHEJは、通常は配列相同性のない2つの切断されたDNAを単につなぎ合わせ、わずかな挿入および/または欠失が生じることから、変異性DSB修復であるとしばしば考えられる。NHEJは細胞周期全体にわたってDSBの修復の機構をもたらすが、有糸分裂細胞のG0-G1期およびS期初期で特に重要である。NHEJによるDSBの修復は、細菌から哺乳動物に及ぶ生物体中で観察され、それが進化の過程で保存されてきたことを示唆する。
【0082】
DSB形成後にNHEJ修復経路で重要な段階は、切断されたDNA末端を物理的に並べることである。NHEJは、切断されたDNA分子の両端へのKu70/80ヘテロ二量体タンパク質複合体の結合により開始されて、両末端を捕捉し、つなぎ止め、かつ他のNHEJの重要な因子の集積のための足場を作る。DNAと結合したKuヘテロ二量体複合体は、PIKK(プロテインキナーゼのホスホイノシチド3キナーゼ様ファミリー)に属する460kDaのタンパク質であるDNA-PKcsをDSBに動員し、そのセリン/トレオニンキナーゼ機能を活性化する。DSBをはさんで2つのDNA-PKcs分子が相互作用し、2つの切断されたDNA末端の間に分子架橋を形成し、それらの分解を阻害する。次いで、DNA末端同士が直接連結されるが、DSBから生じた末端の大部分は、連結の前に適切にプロセシングされる必要がある。切断の性状に応じて、切断部位周辺にあるギャップを埋め、損傷を受けたDNAまたは二次構造を除去することにより、適合するオーバーハングを生じさせるために様々な組合せのプロセシング酵素の作用が必要とされ得る。NHEJ過程のこの段階は、NHEJ修復と関連するヌクレオチドの時々起こる損失の原因であると考えられる。哺乳動物でのNHEJの重要な末端プロセシング酵素の1つは、酵素のメタロ-β-ラクタマーゼスーパーファミリーに属するArtemisであり、同酵素は、放射性感受性の重症複合免疫不全(SCID)患者の大部分での変異遺伝子として発見された。Artemisは、DNA含有ds-ss転移およびDNAヘアピンに対する5’→3’エキソヌクレアーゼ活性およびDNA-PKcs依存性エンドヌクレアーゼ活性の両方を有する(Maら,2002)。その活性はまたATMにより制御される。したがって、Artemisは複数のDNA損傷応答に関与している可能性があると思われる。しかし、Artemis欠損細胞でDSB修復の大きな欠陥は観察されなかったことから、一部のDNA損傷のみがArtemisによって修復されると思われる。
【0083】
修復を可能にするためにDNAギャップを埋めなければならない。DSBへのヌクレオチド付加はポリメラーゼμおよびポリメラーゼλに限られる。XRCC4との相互作用により、ポリヌクレオチドキナーゼ(PNK)もDNA末端に動員されて、DNAの重合および連結の両方が起こる。最後に、NHEJは、XRCC4、DNAリガーゼIVおよびXLFを含む複合体により行われる段階である、DNA末端の連結により完了する。NHEJはXRCC4とリガーゼIVの不在下でも起こり得るため、他のリガーゼがDNAリガーゼIVに部分的に置き換わることもある。さらに、XRCC4およびリガーゼIVはNHEJ以外で役割をもたず、それとは対照的に、KUは転写、アポトーシス、および微小環境に対する応答などの他の過程でも作用することが、研究により示された。
【0084】
NHEJは様々な方法で低下されまたは停止され、その多くが上に挙げたタンパク質(例えば、ヘテロ二量体Ku80/Ku70、DNA-PKcs、特にDNAリガーゼIV、XRCC4、ArtemisおよびXLF(XRCC4様因子;またはCernunnos)、PIKK(プロテインキナーゼのホスホイノシチド3キナーゼ様ファミリー)に直接影響を及ぼす。しかし、NHEJは多くの用途で望ましくないものであり、二本鎖切断の不正確な修復が、その二本鎖切断が起こる遺伝子の機能性を一般的に破壊するが、このことは多くの場合、本発明との関連で必要とされる全てである。このため、本発明はNHEJの増大が望ましい実施形態も含まれる。
【0085】
HR:基本的機序
相同組換え(HR)は極めて精度の高い修復機構である。相同な染色分体が、切断された鎖の修復のための鋳型として役割を果たす。HRは、細胞周期のうち姉妹染色分体が利用可能なS期およびG2期に起こる。古典的なHRは主に3つの段階:1)切断された末端の5’の切除、2)相同DNA二本鎖による鎖の侵入および交換、および3)組換え中間体の解離、を特徴とする。鎖の侵入を行う能力によって、様々な経路がDSB修復を完了でき、合成依存的鎖対合(SDSA)経路、古典的二本鎖切断修復(DSBR)、切断により誘導される複製(BIR)、および別法として単鎖対合(SSA)経路がこれに含まれる。全てのHR機構は相互に関連し、多くの酵素的段階を共有する。
【0086】
全てのHR反応の第一段階は、MRN複合体(MRE11、RAD50、NBN(以前はナイミーヘン染色体不安定症候群1のNBS1))およびCtIP(CtBP相互作用タンパク質)を用いるヌクレアーゼによる5’末端の切断DNA鎖の切除に対応する。その結果得られる3’一本鎖DSBの相同配列を検索できる。相同二本鎖の侵入は、RAD51リコンビナーゼタンパク質で覆われた3’ss-DNAからなるヌクレオフィラメントにより行われる。RAD51-フィラメントの組立てには、ヘテロ三量体ssDNA結合タンパク質であり真核生物中のssDNAに関係のあるDNA代謝過程に関与する、複製タンパク質A(RPA)が必要である。次いで、RAD51が、RPA分子と置き換わりRAD51の搭載を促進する環状構造を有するRAD52と相互作用する。Rad52は酵母での組換え過程に重要である。しかし、脊椎動物では、RAD52ではなくBRCA2(乳癌2型感受性タンパク質)が鎖の侵入および交換に重要な役割を果たしているように思われる。RAD51/RAD52相互作用は、RAD54により安定化される。RAD54はまた、Dループ形成後の組換え中間体の成熟に何らかの役割を果たしている。一方、BRCA1(乳癌1)は、BARD1(BRCA1関連RINGドメイン1)およびBACH1(BTBおよびCNCホモロジー1)と相互作用して、それぞれリガーゼDSB修復作業およびヘリカーゼDSB修復作業を行う。BRCA1はまた、CDK依存的にCtIPと相互作用し、DNA損傷に応答してユビキチン化を受ける。したがって、BRCA1、CtIPおよびMRN複合体は、細胞周期のS期およびG2期のHR媒介性DNA修復の活性化において何らかの役割を果たしている。
【0087】
ヌクレオフィラメントの侵入は置換ループ(Dループ)と呼ばれるヘテロ二本鎖の形成をもたらし、侵入鎖による二本鎖のうちの1本の鎖の置き換えおよび他方の鎖との対形成を含む。次いで、いくつかのHR経路が、相同配列を鋳型に用いてDSB周辺の配列と置き換わり、修復を完了し得る。用いられる機構によって、相同鋳型と切断DNA分子との間の相互交換(乗換え)がHR修復と関係する場合もあれば、そうでない場合もある。乗換えは、ゲノム再構成またはヘテロ接合性喪失などの、重要な遺伝的影響を及ぼし得る。
【0088】
5種類のRad51パラログ:Xrcc2、Xrcc3、Rad51B、Rad51C、Rad51Dもまた相同組換えに関与する。Rad51パラログは2種類の複合体を形成し:BCDX2と呼ばれる複合体はRad51B、Rad51C、Rad51DおよびXrcc2を含み、もう一方はRad51CおよびXrcc3(CX3)を含む。第一の複合体はRad51-DNA複合体の形成および/または安定化に関与すると考えられている。2つ目の複合体の役割は、分岐点移動およびホリデイジャンクションの解離であると思われる。
【0089】
既に報告されているように、NHEJに比してHRを相対的に増大させること(全体が参照により本明細書に組み込まれる米国特許出願公開第20120231449号を参照されたい)を用いて、導入遺伝子発現を増強および/または促進できる。
【0090】
HRを低下または停止させることの利点もまた既に記載されている(全体が参照により本明細書に組み込まれる国際公開第2014/118619号および米国特許出願公開第20150361451号)。HRは様々な方法で低下または停止させることができ、その多くが上に挙げたタンパク質に直接影響を及ぼす(表Cも参照されたい;ただし、HDRの様々な経路の間に明確な差違がないことに留意されたい)。siRNAまたはshRNAなどのRNAが、低下または停止を行うために一般的に用いられる。
【0091】
マイクロホモロジー媒介末端結合(MMEJ)
他の組換え経路が機能しない場合または不活性である場合、別の、変異性の修復機構、すなわちMMEJによりDSBを修復できる。この経路は、十分に特徴づけられる必要が依然としてあり、代替的末端結合(alt-EJ)と呼ばれることもあるが、これらの2つの過程が同じ機構に基づくかどうかは明らかではない。この経路をNHEJと区別する最も特徴的な特性は、切断されたDNA鎖のアライメントの際に5~25bpのマイクロホモロジーを用いることであり、その結果、NHEJ経路とは対照的に、標的ゲノム中のより長い一続きの核酸、例えば20bp、40bp、60bp、80bp、100bp、150bp、200bpを超える核酸が欠失し、このことは本発明の多くの実施形態で有利である。
【0092】
MMEJは細胞周期のいずれの時点でも起こり得、NHEJおよびHRの中心的因子、すなわちKu70遺伝子、リガーゼIV遺伝子およびRad52遺伝子に依存しない。代わりに、MMEJの開始はそれ独自のタンパク質のセットに依存し、その最も重要なものは、Mre11、Rad50およびNbs1(酵母ではXrs2)を含みHRの最初の段階にも関与するとされる(Maら,2003)、MRN複合体(酵母ではMRX)の成分である。MRN複合体以外にも多数の他の因子、例えば、CTBP相互作用タンパク質、ポリ(ADP-リボース)ポリメラーゼ1(PARP1)、リガーゼIII/Xrcd複合体、リガーゼI、DNAポリメラーゼθ(YuおよびMcVey,2010)およびERCC1/XPF複合体が、MMEJおよび、関連するDNA合成依存性SD-MMEJ機構に関与すると考えられている。しかし、さらに多くのタンパク質がこの過程に関与している可能性もある。
【0093】
他のDNA末端結合タンパク質(KuまたはRad51など)の不在下でDSBはPARP1により認識され、これが次いでMMEJを介してそれらの修復を開始することが示唆されている。この修復過程は、HRと同様に、5’末端から3’末端への切除で始まり、それが切断部位の両側に短いホモロジー領域を露出させる。このプロセシング段階は、MRN複合体によって行われ、CtlPによって調節される。相補的な領域(3’ssDNAフラグメントに存在する)は共に対を形成し、非相補的なセグメント(フラップ)は、おそらくERCC1/XPF複合体により除去される。次いで、ポリメラーゼ(例えば、DNAポリメラーゼθまたはδ)によりギャップ(存在する場合)が埋められ、リガーゼIまたはリガーゼIll/Xrcc1複合体により切断が結合される。
【0094】
最も頻繁にみられることであるが、DNA末端にマイクロホモロジー領域が存在しない場合、精度の高いDNAポリメラーゼ(例えば、ポリメラーゼθ)を用いて、さらに遠位の修復された分子のフラグメントが複製され得る。この複製された領域が次いでDNA末端の整列に関与し、それが生じた結合部での挿入をもたらす。このさらに複雑なマイクロホモロジー媒介修復の変形は、合成依存性MMEJ(SD-MMEJ)と呼ばれている。
【0095】
MMEJは、代替的な組換え修復経路としての役割を果たすと考えられていたが、それがBリンパ球でのIgHのクラススイッチ組換え過程で極めて効率的であることが示されており、それが単なるバックアップ機構にとどまらない可能性を示唆する。また、いくつかのDSB、例えば不整合なオーバーハングまたは平滑末端(それらはNHEJおよび/またはHRの標的には適さない)は、MMEJによってより効率的に修復されるという可能性も考えられる。
【0096】
図12Bは、律速的なHRタンパク質および/またはMMEJタンパク質の発現増大が用量依存的に遺伝子修正を刺激することを示す。図からわかるように、空ベクターを基準レベルの1とした場合、示される律速タンパクを生じる発現ベクターの特定の量は0.05倍超、0.1倍超、0.2倍、0.3倍、0.4倍または0.5倍、遺伝子修正を増大させる、したがってアップレギュレートする。しかし、当業者に理解されるように、例えば表Cに示されるいずれかのタンパク質がしたがってアップレギュレートされ得る。
【0097】
ウイルスなどの考え得る予想外の外来性因子の検出
CHOゲノムなどの目的の細胞のゲノム中のあらゆるウイルス様要素の特徴付けは、預託されたマスター細胞株からの潜在的な新たな外来性因子の特徴付けを可能にする。この方法は、細胞株により生産される任意の生物学的治療薬の規制承認に必要とされる、産生細胞クローンの特徴付けに現在適用されている多数のアッセイの多くと置き換わり得る。この特徴付けはまた、生産ロットの分析でルーチンに用いることができる。例えば相同組換えを介する標的化遺伝子編集による効率的なCHOゲノム編集を用いて、CHO-K1細胞などのCHO細胞を含む、培養される目的の細胞のゲノム中に存在する発現したレトロウイルスエレメントを除去し、その結果ウイルスゲノム量を減少させ得る。
【0098】
現在、相同組換え機構に依存する遺伝子編集または導入遺伝子の標的化組込みのための商業サービスがいくつかある。それらは、例えば、米国のSAFC-SANGAMO、フランスのCELLECTIS、およびイギリスのHORIZONのZnフィンガーヌクレアーゼ、Talenヌクレアーゼ、CRISPR/Cas9ヌクレアーゼおよびアデノウイルスベクターを含む。しかし、上記のツールのうちZnフィンガーおよびTalenの2つは、編集されるゲノム配列それぞれに対して特異的なヌクレアーゼおよび/またはベクターを設計する必要があるため、未だ入手および使用が困難であり、一方で3つ目のヌクレアーゼ(CRISPR)は使用可能性が未だ極めて不明確である。さらに、相同組換えは細胞中で未だにかなり非効率的であり、多数の候補細胞株のスクリーニングを必要とする。このため、所与の遺伝子の2つの対立遺伝子を欠失させるには、複数回の変異誘発ならびに細胞クローンの単離および特徴付けをしばしば必要とする。このため、これらの現在の技術は多くの場合、例えばCHOゲノム中に分散した複数の発現ウイルス遺伝子残遺物を除去するのに必要な、細胞内ゲノムの系統的操作を可能にするには時間およびコストがかかり過ぎる。CHO細胞中の代謝経路および組換え機構の操作は、組換え経路の1つによるより効率的なゲノム編集法への道を開き、ここでほとんどの場合、相同組換えが好ましい。
【0099】
発現されるERVエレメントを同定するため、PACBIO(Pacific Bioscience社)技術を用いて、約120倍のカバレッジでCHO細胞株(例えば、SELEXIS社のCHO-K1由来CHO-M細胞)のゲノム配列を決定した。ゲノムシーケンシングは、例えばPacBio RS II(商標)ロングリードシーケンサーで実施できる。
【0100】
CHOゲノムは6.1MbのN50サイズを示す約7200のコンティグに組み立てられた。
【0101】
CHOゲノム中の発現ERVエレメントの同定および特徴付け
BLASTアルゴリズムを用い、少なくとも80%の配列保存で、ウイルスのGAG、POLおよびENVエレメントのコード配列、ならびにウイルスの長い末端反復配列(LTR)の有無を検索して、既知のマウスレトロウイルス配列に配列類似性を示すCHOゲノム配列を同定した。
【0102】
図13に示されるように、3つのクラスのガンマレトロウイルスが同定され、そのいずれもが、目的の細胞にみられるERVまたはERVエレメントに寄与し得る。ここでは、発現して機能性タンパク質を産生するERVエレメントに特に注目する。ウイルスの、特に目的の細胞内のレトロウイルスの配列および/または微生物様配列のデータベースが出発点となる。目的の細胞の各RNA配列の対応するデータベースは、どのDNAエレメントが実際に発現され機能性タンパク質をコードするのかに関する情報を与える。
【0103】
関連するDNAエレメントのデータベース構築
目的の細胞、例えば生物学的治療薬の産生に使用される細胞のゲノム中の過去のウイルスおよびレトロウイルスの組込みならびにレトロトランスポジション事象に由来する分散した反復配列、特に依然として発現されるエレメントを同定する。
【0104】
発現ERVエレメントを同定する第一段階として、約120倍のカバレッジでCHO細胞株(SELEXIS社のCHO-K1由来CHO-M)のゲノム配列を決定した。これには、PACBIO(Pacific Bioscience社)技術を用いた。このような広範囲にわたるシーケンシングは、例えば初代ロングリードシーケンサーのPacBio RS II(商標)で実施できる。しかし、当業者に理解されるように、他の単分子DNAシーケンシング技術および装置も同じように十分に用いることができる。得るべき関連する座位の特異的PCR増幅および標的化DNAシーケンシング、例えばCHO-Mゲノム配列バージョン3.0を実施した。
【0105】
CHO-Mゲノムを6.1MbのN50サイズを示す約7200のコンティグに組み立てた。
【0106】
そのスクリーニングが現在FDAなどの機関により要請される外来性因子のリストに基づく、潜在的な外来性微生物汚染物質に関するDNA指標配列またはcDNA指標配列のデータベースを構築するため、既知のマウスレトロウイルス配列に配列類似性を示すゲノム配列を同定した。
【0107】
CHO-Mゲノムスキャフォールド内のそれらの位置をマッピングするため、BLASTアルゴリズムを用い、少なくとも80%の配列保存で、ウイルスのGAG、POLおよびENVのコード配列を検索して、既知のマウスレトロウイルス配列(例えば、Lieら,2014のML2G配列)に配列類似性を示すCHO-Mゲノム配列を同定した。これらの各コード配列について別個にBlastアライメントを実行した。さらに、同じく閾値80%でBlastにより、ウイルスの長い末端反復配列(LTR)の存在を調べた。ML2G配列とウイルスのGAG、POLおよびENVとの間の平均の配列同一性は、92%であると決定された。GAG、POLおよびENVとマウス白血病ウイルスとの間の平均の配列同一性は66%である。いくつかの場合には、ERVは不完全であり、特定のERVエレメントのみが認められた。
【0108】
同定されたERVの配列は、嚢内A型粒子(IAP)クラスIIレトロウイルスの159種類のメンバー、144種類のC型ガンマレトロウイルス(クラスI ERV)、および8種類の他のガンマレトロウイルス、特にGALVを含んだ(これらのウイルス配列の主要なクラスおよび系統学的関係については
図13を参照されたい)。CHO細胞中のマウスC型レトロウイルス配列の典型的な検索の概略を
図4Aに示す。
【0109】
C型ガンマレトロウイルスのERV配列をさらに検討し、見つかったERVエレメントの数を表Aに示す:
【表1】
【0110】
アライメントにより配列を見つけた後、プライマーを設計し、これらのプライマーを用いて、PCRおよびDNAシーケンシングを用いる実験的検証のために、対応する配列を探索した。隣接する配列を遺伝子、特異的組込みの印、DNAメチル化および発現などについて探索した。
【0111】
解析したERV配列の77配列のみがERVを産生するためのエレメント(gag遺伝子、pol遺伝子、env遺伝子)をすべて有した。それらをさらに解析し、その結果を
図14に示す。これらの77種類のERV配列を系統学的にも解析し、2つのグループ、すなわちグループ1(52)およびグループ2(14)のERVに分類できた。これらのグループ内では97~99%の配列同一性があり、2つのグループ間では84~97%の配列同一性があった。2つのグループはLTRが異なっていた。GAGコード配列はよく保存されていた。
【0112】
配列比較は、2回のレトロウイルスの爆発的感染がチャイニーズハムスターの進化の過程で比較的最近に起こり、これらのよく保存され機能的であると考えられるERVが生じた可能性を示す(
図15)。
【0113】
さらに、GAG機能に重要なPPXY関連PPYPモチーフをコードするDNA配列も存在することがわかった。グループ1のERVは、ゲノム中に1~12の差または30bpの組込みを示し、グループ2のERVは、関連する機能的gag遺伝子と比較してgag遺伝子中に0~6の差を示した。
【0114】
同定されたDNAエレメントが発現する可能性の検討
どのERVエレメント(1つまたは複数)が転写され得るかを評価するため、PACBIO配列データ(Suzukiら,(2016))を用いてそれらのCpG DNAメチル化状態を解析した。これにより、
図16に例示するように、発現を許容するクロマチン構造および転写活性のあるLTRプロモーター配列について予想される通り、そのLTR配列が低メチル化されたいくつかのERVが同定された。
【0115】
RNAデータベースの構築
CHO-Mマスター細胞などの預託細胞の複数の独立したmRNA調製物のシーケンシングおよび解析をさらに実施して、ゲノムおよび/または指標となる外来配列データベースに位置するRNA(すなわち、cDNA)配列のデータベースを構築し得る。生成物は、発現されるレトロウイルス/ウイルス、レトロトランスポゾンならびに細菌マーカー遺伝子およびファミリーの収集物であり、各種のエレメントの相対的発現レベルの表をもたらす。
【0116】
ゲノムDNAにもミトコンドリアゲノムDNAにも帰属できない大量のRNA配列を、RT-qPCRにより実験的に検証する。実験的に検証される配列を、トランススプライシングが起こった可能性について調べる。残りの正体不明の配列を、ウイルス配列、原核生物配列および真核真核配列の入手可能なゲノムとの相同性についてスクリーニングして、同定済みの微生物種にそれらを場合により帰属させる。関連するヒットを発現配列のデータベースに加える。
【0117】
同定されたDNAエレメントにより発現されるRNAのRNAデータベースの具体的な構築の例
ここでは、特定のERVエレメントの転写を全CHOの逆転写、ここではCHO-MのcDNA、細胞RNAおよびPCR増幅を用いて作成したGAGのcDNAの配列との直接比較により、さらに評価した。これは、グループ1および2のERVエレメントがいずれも転写的に活性であったことを示した。ゲノム配列およびcDNA配列の比較はさらに、グループ2のERVの1つは転写されたが、停止コドンにより機能的なGAGタンパク質を発現できなかったことを示した(
図17)。一方で、同定されたグループ1のERV配列のいくつかは発現され、それらのRNA配列は未熟な停止コドンをもたず、それらはしたがって機能的GAGタンパク質の発現を媒介するようであった。近接するPOLコード配列の解析は、それらも機能的であることを明らかにし、CHO細胞からのレトロウイルス粒子の発現および放出の極めて有力な候補として複数の発現され、保存されたERVの同定に至った。これらの機能的なグループ1のERVの全コンセンサスDNA配列を配列番号1に示し、一方ここで同定されたグループ2のERVのコンセンサス配列、IAPエレメントおよびその他のガンマレトロウイルス配列を配列番号2、3および4に記載する。
【0118】
全ゲノム/エピソームのシーケンシングからの外来性エレメントの特徴付け:
(i)全ゲノムおよびエピソームのシーケンシングからの新規な移動性遺伝子エレメント、および外来性エレメント、ならびに(ii)既知の微生物様遺伝子の発現レベルの有意な変化は、外来性因子による細胞培養物の混入の指標となり得ることから、これらを迅速に同定するバイオインフォマティクスパッケージを提供する。混入を染色体再構築から識別する必要がある。
【0119】
ここでは、小さいゲノム変化(転位またはウイルスゲノム組込みなど)と大きい染色体再構築(大きい染色体転座または重複事象など)または他の培養細胞による汚染とを識別するために、ゲノム比較プログラムを用いて自動化工程を考案する。
【0120】
CHO-M細胞などの預託細胞およびそれに由来する細胞クローンから得たゲノム配列およびRNA配列を用い、従来の手段により外来性因子が存在しないことを既に確認されたクローンを用いて、上記の識別工程のパラメータを決定する。
【0121】
上記の工程を上で得られたデータベースとともに用いて、新規なCHO細胞クローンの単離中に起こる可能性のあるゲノム変化を同定する。関連するヒットをPCRおよび小規模DNAシーケンシングにより実験的に検証する。
【0122】
同様の解析を、例えばCHO-M細胞クローンのトランスクリプトームを用いて実施する。新たなRNA配列、またはその発現レベルが有意に変化したRNA配列を、バイオインフォマティクス解析を用いて同定する。ヒットをRT-qPCRにより実験的に検証する。
【0123】
検出工程を、バイオインフォマティクスモデリングにより感度に関して最初に検証し、次いでCHO-Mの核酸調製物と既知量のレトロウイルス様配列または細菌(例えば、マイコプラズマ)配列および参照物質でスパイクイン実験を行う。これにより、所与の深度(またはゲノムカバレッジ)の「次世代シーケンシング」により明らかにできる、細胞ゲノム当量当たりのウイルスゲノム数に関して感度閾値が得られる。
【0124】
CHO細胞のゲノムおよび/またはトランスクリプトームのより効率的な編集のための工程
組換え活性に関与するタンパク質のノックダウンまたは過剰発現を介するHRおよびHDRの標的化導入遺伝子組込みおよびCHO細胞ゲノムからの除去のための、定量的アッセイを提供する。
【0125】
ここでは、単一ゲノムを組み込んだGFP導入遺伝子を含む複数の独立した指標CHO細胞株を構築し(例えば、転移ベクターを介して)、導入遺伝子組込みを定量的PCRおよび組込み部位のマッピングにより検証する。指標プラスミドを、GFPコード配列の末端に対応する配列でdsRed発現カセットを挟むことにより構築する。GFP配列の自然変異およびdsRed発現カセットの非標的化組込みの頻度を、蛍光定量的アッセイおよびqPCRアッセイを用いて、適切な標的化組込みに対し記録する。あるいは、1つまたは複数の欠失GFPコード配列を細胞ゲノム中に組み込み、HRまたはHDRが関連する機構を用いてそれらを修復して、機能的GFPコード配列および蛍光細胞を回復する。
【0126】
効率的なHR機構を妨害し得る制限活性を同定するため、上記のアッセイをMMEJタンパク質およびNHEJタンパク質の一過的なsiRNA媒介ノックダウンの後に用いる。同様のアッセイをCas9およびGFP標的化CRISPRガイドRNAの発現ベクターの存在下で実施してHDRを評価する。同時に、CHOのHRタンパク質およびHDRタンパク質をコードするcDNAをクローン化し、発現ベクター中に組み込む。これらのcDNAをdsRed指標プラスミドと同時形質移入して、CHO-M細胞中でHRまたはHDRの効率を制限する活性を同定する。
【0127】
上記のノックダウンまたは過剰発現の組み合わせを実施して、HR様事象の頻度を改善する(
図9~12を参照されたい)。最も効率的な組合せを、i)上記の単一活性のアッセイの結果、ii)CHO-M細胞中の特定の組換え遺伝子のmRNAレベル、ならびにiii)組換え経路およびタンパク質が形成する多量体構造での相対的位置、に基づき評価し選択する。CHOゲノムから発現配列を効率的に削除する過程を同定するため、これらの組合せをアッセイしてGFP内に組み込まれたdsRed配列を除去し、機能的GFPを回復する。
【0128】
感染性因子であるDNA残遺物またはRNA残遺物を除去するCHO-Mの遺伝子編集またはエピジェネティック編集
ここでは、CHO細胞株から発現するウイルスゲノム残遺物を除去または発現抑制する。機能的ウイルス配列、好ましくはウイルス粒子放出を媒介するgag配列を破壊するよう最適化した上記の方法を用いて、上で決定されたCHO-Mにより発現されるウイルス様エレメントおよびレトロウイルス様エレメントをHRまたはHDRにより標的化する。代わりに、または同時に、HRまたはHDRを媒介する機構を阻害して、DNA切断部位での欠失を促進する修復機構、例えばNHEJおよびMMEJが関連する機構によるウイルス配列中のDSBの修復を促進し、ウイルス粒子放出に必要なgag配列を削除する。
【0129】
ゲノム編集を複数ラウンド実施し、定量的PCRによりゲノムウイルス配列およびRNA配列の減少を追跡する。各ラウンド後に細胞分裂のタイミングを特徴づけて、追加的なゲノム変化が細胞の代謝特性を損なわないことを確認する。
【0130】
CHO-M細胞集団などの適切に操作された細胞を、それらの安定性およびマーカータンパク質(例えば、GFP)または治療用タンパク質(例えば、免疫グロブリン)を発現する能力について試験する。サブクローンを作製し、同じようにアッセイする。本明細書に記載される検出方法を用いて、適切なサブクローンに追加的な外来性因子が存在する可能性がないことを裏付ける。
【0131】
CHO-Mサブクローンなどの最も効率的な細胞のゲノム配列を決定し組み立てて、ゲノム変化および外来性ウイルス様配列の減少を裏付ける。
【0132】
CRISPR/Cas9ゲノム編集法を用いてグループ1の発現ERVを特異的に切断し変異させるため、GAG配列のPPYPモチーフまたはミリストイル化配列(
図18および配列番号5~12)付近の配列を優先的に認識するガイドRNAを設計した。ノックアウト法にはPPYPモチーフを選択し、それにより、非HR DNA修復機構がGAGコード配列での欠失を引き起こし、それはウイルス粒子出芽を媒介する機能型のこのタンパク質の発現を阻害し得る。ミリストイル化モチーフは、HIV出芽にHIV1 GAGタンパク質のミリストイル化が必要であることがわかっている(Abdusetir Cerfoglioら(2014))ことを踏まえ、ホモロジー指向型HR DNA修復によってミリストイル化アミノ酸が修飾不可能な対応物に置換されるよう標的化し、非機能性でありかつおそらく残存している未変異GAGタンパク質の機能を阻害し得るドミナントネガティブ型のGAGを生じさせた。
図6に示されるように、一本鎖ガイドRNA(sgRNA)を、単量体型のCRIPR/Cas9に適合するよう設計した(Carrol 2013)。
【0133】
Cas9/sgRNA発現ベクターをdsRed発現ベクターと共にCHO細胞中に同時形質移入し、効率的に形質移入され導入遺伝子を発現する細胞を濃縮するためにdsRed発現細胞を選別した(
図19)。あるいは、Rad51発現を減少させ相同組換え機構によるDNA修復を抑えるために、Rad51を標的とする3種類のsiRNAの混合物で細胞を形質移入した。Rad51ノックダウンの効率を、Rad51のmRNAレベルおよび相同組換え修復による変異GFP導入遺伝子の機能回復の阻害の両方から評価し、設計したsiRNAはいずれもRad51発現およびHRを特異的に阻害したことが示された(
図20)。
【0134】
CRISPR/Cas9処理が発現ERVを適切に標的としたかどうかを直接評価するため、GAG RNAを逆転写し、PCRで増幅した。独立した形質移入実験(
図21の第一および第二のCRISPR実験)において、予想通り、GAG RNAは対照細胞から容易に検出されたが、PPYP5 sgRNA Cas9で処理した細胞は一貫して低レベルまたは検出不可能なレベルを生じた。PPYP6をプログラムしたCas9およびPPYP13をプログラムしたCas9での処理は、単独で用いた場合GAGのRNAレベルを有意に変えなかったため、Rad51活性のsiRNA媒介性ノックダウンがHR機構による切断gag遺伝子の効率的な修復を阻害し、それにより欠失を起こしやすい代替的DNA修復経路を導く場合に予想されるように、そのようなノックダウンがこれらのCRISPR/Cas9処理の効果を増大させ得るかどうかを評価した。Rad51を事前にノックダウンすることにより、PPYP6またはPPYP13とCas9による処理でGAGのmRNAシグナルが消失したことから、このことが当てはまるのがわかった(
図21の第三のCRISPR実験)。
【0135】
CRISPR/Casまたはその他のヌクレアーゼベースの変異誘発系を用いて遺伝子を変異させるこれまでの試みは、低コピーの遺伝子に対してでさえコードされるmRNAの消失をもたらさなかった。哺乳動物ゲノムにみられるように、細胞中に30超、40超、またはさらに50超のコピー数で存在するERVを含む、高コピー数のERVの場合はさらに困難であることが予想された。このため、PPYP5 sgRNA Cas9ヌクレアーゼで処理した細胞中でレトロウイルスRNAが検出されないことが観察されたのは非常に驚くべきことであった(
図21の第一のCRISPR実験)。62の関連する内在性レトロウイルスエレメントのPOL遺伝子を欠失または変異させるこれまでの試みは、一過的形質移入を用いてブタ細胞からされらの遺伝子を除去できず、転移ベクターまたはウイルスベクターを用いるCRISPR/CAS9エレメントの安定な発現に至った(Yangら,2015)。とはいえ、17日間の継続的なCRISPR/Casの活性は細胞の37%の最大標的化頻度をもたらしたのみであり、おそらくこれは、長期間にわたるCRISPR/CASの活性が有害なオフターゲット切断効果を引き起こしたためである。
【0136】
実施した実験は、Rad51などのHRタンパク質のノックダウンを用いて、siRNAの形質移入なしではみられない頻度での有害な欠失によりGAG遺伝子不活性化の頻度を増大できることを示す。
【0137】
1つの例としてRad51のノックダウンを提供するが、当業者は、他のHRタンパク質のノックダウンが同等の結果を与えることを理解するであろう。したがって、他のHRタンパク質をノックダウンしたCHO細胞も本発明の範囲内である。また、53BP1、CtIP、Mre11、Rad50、リガーゼIII、Pold3(DNAポリメラーゼデルタサブユニット3)、XpfおよびBlm(ブルーム症候群RecQ様ヘリカーゼ)をノックダウンした細胞(
図9を参照されたい)が本発明に具体的に含まれる。表Cは、ノックダウンされ得るHRタンパク質およびノックダウンまたは過剰発現され得る他の組換え経路のタンパク質の例を提供する。ただし、当業者に理解されるように、表Cは単純化したものであり、表Cに挙げたタンパク質のいくつかは二重の機能を有し(例えば、リガーゼIII)、異なるカテゴリーに記載され得ることもある。
【0138】
いかなる特定の理論にも限定されるものではないが、Cas9により切断されるERVは、多数の他のERVの1つを相同鋳型とする相同組換えによって修復され得、この修復はRad51などの、ホモロジーに基づく経路のタンパク質の不活性化により抑制され得る。これに対し、CRISPR/Cas9成分の発現の前にRad51発現をノックダウンするいくつかのこれまでの試みは、ホモロジー指向型DNA修復経路の増大をもたらし、これは、遺伝子不活性化を引き起こす欠失が好ましい場合にはむしろ回避されなければならない(Davis,LおよびMaizels,N.2014および2016)。他の研究は、Rad51の過剰発現が、CRISPR/Cas9媒介性またはTALEN媒介性のDNA切断に続く標的化遺伝子組込み(すなわち、ノックイン)実験でホモロジー指向型DNA修復を増大し得ることを見出した(Songら(2016))。ここでは、様々な種類のCHO細胞でRAD51がHDR遺伝子修正に有利に働くこと(
図9および12)、および相同組換え活性の阻害をERV特異的DNAヌクレアーゼとともに用いると、ERVの変異が大幅に増大し得ることが示された。このため、複数の対立遺伝子を不活性化する場合、したがって高コピー数ERVの場合、特にHR経路のsiRNAノックダウンを、特にCRISPR/Cas9法と組み合わせる実施形態が、本発明のまた別の実施形態であるCRISPR/Cas9単独の使用よりも好ましいことが多い。
【0139】
全体をまとめると、CRISPR/Cas9成分の非常に高い変異誘発活性は、最新技術と比較して驚くべき高い。いかなる特定の理論にも限定されるわけではないが、その理由として、Cas9ヌクレアーゼが不活性なERVではなく発現されるERVを特異的に標的とすることが考えられる。しかし、これは最も効率的な状況でウイルスRNAが検出不可能なレベルに減少したことを説明できない。したがって、特異的DNA切断事象が発現ERVの転写サイレンシングを引き起こすという可能性も考えられる。
【0140】
最後に、未熟停止コドンを有する非コード変異RNAは多くの場合、ナンセンス介在mRNA分解(NMD)機構により細胞内で分解される(BakerおよびParker(2004))。このため、次に、PPYP sgRNAが、NMD媒介性のGAG RNA分解を引き起こすと考えられるアウトオブフレーム変異を媒介するかどうかを評価した。1つの例として、グループ1のERVのPPYPモチーフから11個のヌクレオチドを欠失させることによって生じる、そのようなフレームシフトを
図21に示す。
【0141】
図22は、CRISPR/Casで処理したCHO細胞のポリクローナル集団に含まれるGAG遺伝子のPCR増幅およびシーケンシングの結果を示す。結果は、中程度に活性なPPYP6 sgRNAを使用しsiRAD51処理を実施しない場合でも、GAGコード配列の大部分がCRISPR/Cas9ヌクレアーゼ成分の発現ベクターの一過的形質移入後に変異したことを明確に示している。
【0142】
全体をまとめると、CHO細胞内在性ERVを標的とする提案されるCRISPR/Cas9法を用いて、ウイルス粒子放出を媒介するGAGタンパク質の発現を完全になくす、または減少させることが可能であり、これには、長期間にわたるCRISPR/Casの発現または、それらの発現ベクターの細胞ゲノム中への安定な組込みは必要なく、かつ細胞培養に対するそれらの潜在的な悪影響はない、という結論が導かれた。したがって、この方法を用いて、そのようなレトロウイルスタンパク質を発現できない、より安全なCHO細胞株を作製できる。
【0143】
材料および方法
細胞株
編集された細胞株はSURE CHO-M細胞株(商標)(SELEXIS社、スイス)(参照により本明細書に組み込まれる米国特許第7,129,062号および同第8,252,917号ならびに米国特許出願公開第20110061117号、同第20120231449号および同第20130143264号を参照されたい)であった。
【0144】
CRISPR/Cas9系
ゲノム編集用に、本発明者らは、哺乳動物コドン最適化した化膿性連鎖球菌(Streptococcus pyogenes)Cas9ヌクレアーゼを用いた。一本鎖ガイドRNA(sgRNA)配列を、既に記載されている(Fuら,2013)通りに哺乳動物gRNA発現ベクターMLM3636中にクローン化した。高いノックアウト効率を得るため、1標的部位当たり複数個のsgRNA標的部位を検討した(PPYP:n=5;Myr:n=3)。CRISPRseek Rパッケージ(Zhuら,2014)を用いて、本発明者らの自社CHO-Mゲノムを参照配列として、最小のオフターゲット部位を有するERV特異的sgRNAを同定した。sgRNA配列を、標的部位付近、より厳密にはMyrモチーフおよびPPYPモチーフにハイブリダイズするよう設計して、これらの座位にCRISPR/Cas9による変異誘発が起こる可能性を最大限に高めた。CRISPRseek Rパッケージ(Zhuら,2014)を用いて、5’20nt NGG 3’配列構造を含み、かつ変異誘発部位から最大25bp離れた位置でDSBを媒介する、可能性のあるsgRNA配列を得た。可能性のある全sgRNA配列で、CRISPRseek(Zhuら,2014)、Sequence Scan for CRISPR(SSC;ダナ・ファーバー研究所のcrisprのウェブサイト)およびsgRNAスコア1.0(ダナ・ファーバー研究所のcrisprのウェブサイト)を含む様々なスコアリングツールを用いて、sgRNAの効率を予測した。さらに、CRISPRseek Rパッケージ(Zhuら,2014)を用いて、本発明者らの自社CHO-Mゲノムを参照ゲノムとして用い最小のターゲット部位を有するERV特異的sgRNAを同定した。1標的部位当たり複数個のsgRNA配列を最終的に選択し検討して(Myr:n=3,PPYP:n=5)、変異能が最も大きいsgRNAを同定した。Cas9(番号43861)およびgRNA発現プラスミド(番号43860)はADDGENE社(ケンブリッジ、マサチューセッツ州、米国)から入手可能である。
【0145】
【0146】
RNA干渉
Rad51 CHO相同に対する低分子干渉RNA(siRNA)をMICROSYNTH社(バルガッハ、スイス)により設計および合成した。3種類の特異的Rad51 siRNAの混合物を用いてRad51のmRNAレベルを抑制してオフターゲット効果を最小限に抑えた。BLAST解析は他の標的に対する相同性を除外した。対照として3種類の非標的化siRNA(siNeg)の混合物を用いた。
【0147】
CHO-Mゲノムの改変
Neon Transfection System(登録商標)(INVITROGEN社)を製造業者のプロトコール通りに用いてCHO-M細胞に形質移入を実施した。簡潔に述べれば、400000個の細胞を100nMのsiRNA混合物で形質移入し、48時間後に、700000個の細胞を、dsRedをコードするプラスミドを形質移入対照に用いてCRISPR/Cas9系で再び形質移入した。形質移入細胞を濃縮するために、フローサイトメトリーを用いて形質移入から48~72時間後に、約100000個のdsRed陽性細胞を多クローン的に選別した。
【0148】
当業者に理解されるように、上の記載は限定的ではなく、本発明の特定の実施形態の例を提供する。当業者は、上記の指示に従い、本明細書に具体的に記載されていない多種多様な代替物を考案することが可能である。
【0149】
表Cは、3種類の経路それぞれにおけるいくつかの重要な遺伝子を列挙する(全体が参照により本明細書に組み込まれる米国特許出願公開第20120231449号も参照されたい)。同表には、MDC1およびMHS2などのDNA修復タンパク質も含まれる。MDC1は、DNA損傷に応答してS期中期およびG2/M期の細胞周期チェックポイントを活性化するのに必要とされる。一方、MDC1は、クロマチン中にRad51を保持することによりRad51媒介性相同組換えにおいても機能する(配列については、全体が参照により本明細書に組み込まれる国際公開第2014/118619号、米国特許出願公開第20150361451号を参照されたい)。
【0150】
【0151】
(参考文献一覧)
Abdusetir Cerfoglioら,Structural elements in the Gag polyprotein of feline immunodeficiency virus involved in Gag self-association and assembly,Journal of General Virology 95,2050-2059(2014).
Baker,K.E.;Parker,R.,Nonsense-mediated mRNA decay:Terminating erroneous gene expression”.Current Opinion in Cell Biology 16:293-299(2004).
Carrolら,Staying on target with CRISPR-Cas,Nature Biotechnology 31,807-809(2013).
Davis,L.およびMaizels N.,Homology-directed repair of DNA nicks via pathways distinct from canonical double-strand break repair.Proc.Natl.Acad.Sci.USA111,E924-E932(2014).
Davis,L.およびMaizels,N.,Two Distinct Pathways Support Gene Correction by Single-Stranded Donors at DNA Nicks.Cell Reports 17,1872-1881(2016).
米国食品医薬品局(FDA),FDA’s Guidance for Industry Characterization and Qualification of Cell Substrates and Other Biological Materials Used in the Production of Viral Vaccines for Infectious Disease Indications,February 2010(Fda.govのウェブサイトで入手可能).
Fuら,High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells.Nat.Biotechnol.31,822-6(2013).
Guilingerら,Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification,Nature Biotechnology 32,577-582(2014)
HopeおよびTrono,HIV,Structure,Expression,and Regulation of the HIV Genome,Site Knowledge Base Chapter November 2000.
国際公開第2014/118619号(2014).
Kostyrkoら,MAR-Mediated transgene integration into permissive chromatin and increased expression by recombination pathway engineering,Biotechnology & Bioengineering,2016年10月30日オンライン版.
Lewisら,Genomic landscapes of Chinese hamster ovary cell lines as revealed by the Cricetulus griseus draft genome,Nature Biotechnology 31,759-765(2013),Supplement)
Lie,Y.S.ら,Chinese hamster ovary cells contain transcriptionally active full-length type C proviruses.J.Virol.68:7840-7849(1994).
Maら,Hairpin opening and overhang processing by an Artemis:DNA-PKcs complex in V(D)J recombination and in nonhomologous end joining.Cell 108,781-794(2002).
Song Jら,RS-1 enhances CRISPR/Cas9-and TALEN-mediated knock-in efficiency,Nature Communications 7:10548(2016).
Suzukiら,Agin:measuring the landscape of CpG methylation of individual repetitive elements.Bioinformatics 32:291 1-2919(2016).
米国特許出願公開第20120231449号(2012).
米国特許出願公開第20150361451号(2015).
Yang L.ら,Genome-wide inactivation of porcine endogenous retroviruses(PERVs),Science 350:1 101-1 104(2015).
Zhuら,CRISPRseek:A Bioconductor package to identify target-specific guide RNAs for CRISPR-Cas9 genome-editing systems.PLoS One.9(2014).
【配列表】