(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-17
(45)【発行日】2022-02-28
(54)【発明の名称】部位特異的DNA開裂及び修復による標的化原位置タンパク質多様化
(51)【国際特許分類】
C12N 15/09 20060101AFI20220218BHJP
C12Q 1/04 20060101ALI20220218BHJP
C12Q 1/68 20180101ALI20220218BHJP
G01N 33/53 20060101ALI20220218BHJP
C40B 40/08 20060101ALN20220218BHJP
C12N 5/10 20060101ALN20220218BHJP
【FI】
C12N15/09 100
C12Q1/04
C12Q1/68
G01N33/53 M
C40B40/08 ZNA
C12N5/10
(21)【出願番号】P 2019504755
(86)(22)【出願日】2017-07-31
(86)【国際出願番号】 EP2017069271
(87)【国際公開番号】W WO2018020050
(87)【国際公開日】2018-02-01
【審査請求日】2020-07-14
(32)【優先日】2016-07-29
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】508348956
【氏名又は名称】マックス-プランク-ゲゼルシャフト ツア フェルデルンク デア ヴィッセンシャフテン エー.ファウ.
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【氏名又は名称】武居 良太郎
(72)【発明者】
【氏名】ダービト エンゲー
(72)【発明者】
【氏名】オリバー グリースベック
(72)【発明者】
【氏名】ムートル エルドガン
【審査官】松田 芳子
(56)【参考文献】
【文献】欧州特許出願公開第02319918(EP,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現され、前記方法が、
a)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導し、ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含み、
b)
工程a)の細胞に対して、前記誘導されたDSB又は一本鎖ニックの相同組換えによる修復のための、複数の異なるドナー核酸テンプレートのライブラリーを提供し、ここで前記ライブラリーの前記複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に、異なる突然変異を含むと共に、相同標的化修復(homology-directed repair:HDR)により、前記不活性化突然変異を除去し、
c)前記不活性化突然変異が除去された細胞を選択及び/又は濃縮し、
d)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供し、ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現されている
ことを含む方法。
【請求項2】
前記不活性化突然変異が前記所期のタンパク質の発現を妨げる、請求項1の方法。
【請求項3】
前記所期のタンパク質をコードする遺伝子が、前記細胞のゲノム内に、融合遺伝子として含まれており、ここで前記融合遺伝子が、前記所期のタンパク質をコードする遺伝子の下流にマーカー遺伝子を含み、ここで前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が、前記マーカー遺伝子の発現を妨げる、請求項1又は2の方法。
【請求項4】
前記マーカー遺伝子によりコードされるタンパク質が蛍光タンパク質である、請求項1~3の何れか一項の方法。
【請求項5】
前記
二本鎖切断が部位特異的ヌクレアーゼを用いて実施されると共に、前記部位特異的ヌクレアーゼが、Cas9ヌクレアーゼ、Cpf1ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZNF)、転写アクティベーター様ヌクレアーゼ(TALEN)、及びmegaTALエンドヌクレアーゼからなる群より選択され、或いは前記
二本鎖切断が部位特異的ニッカーゼを用いて実施されると共に、前記部位特異的ニッカーゼがCas9ニッカーゼである、請求項1~4の何れか一項の方法。
【請求項6】
前記細胞が哺乳類細胞である、請求項1~5の何れか一項の方法。
【請求項7】
前記方法が更に、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体をコードする遺伝子の1又は2以上の核酸配列を決定すること、或いは、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体の1又は2以上のアミノ酸配列を決定することを含む、請求項1~6の何れか一項の方法。
【請求項8】
前記所期のタンパク質が蛍光タンパク質、抗体、酵素、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、又は膜貫通タンパク質である、請求項1~7の何れか一項の方法。
【請求項9】
(i)前記所期のタンパク質が抗体であり、ここで前記突然変異誘発標的部位が、前記抗体の重鎖又は軽鎖をコードする核酸配列のCDRコーディング領域内に存在する、或いは、(ii)前記所期のタンパク質が酵素であり、ここで前記突然変異誘発標的部位が、前記酵素又は前記酵素の制御性サブユニットの活性中心をコードする核酸領域内に存在する、請求項1~8の何れか一項の方法。
【請求項10】
前記所期のタンパク質の前記複数の突然変異体
が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで前記方法が更に、e)前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮することを含む、請求項1~9の何れか一項の方法。
【請求項11】
前記所期のタンパク質の複数の突然変異体
が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含む、請求項1~9の何れか一項の方法。
【請求項12】
野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、前記所期のタンパク質の複数の突然変異体を同定する方法であって、前記方法は、
a)請求項1~9の何れか
一項の方法の結果得られる前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮し、
b)前記第二のパネルにより発現される前記所期のタンパク質の突然変異体のアミノ酸配列を決定し、及び/又は、前記第二のパネルにより発現される前記所期のタンパク質の突然変異体をコードする遺伝子の核酸配列を決定することを含む方法。
【請求項13】
前記方法は更に、前記a)の前に、請求項1~9の何れか一項の所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法を含む、請求項12の方法。
【請求項14】
野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、前記所期のタンパク質の複数の突然変異体を同定する方法であって、
前記方法は、a)請求項1~9の何れか
一項の所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法を含み、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含み、且つ、
前記方法は更に、b)前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の少なくとも1つのアミノ酸配列を決定し、及び/又は、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体をコードする遺伝子の少なくとも1つの核酸配列を決定することを含む方法。
【請求項15】
(i)前記所期のタンパク質が抗体であると共に、前記第一の活性及び/又は前記新たな活性が抗原結合性であり、又は、(ii)前記所期のタンパク質が酵素であると共に、前記第一の活性及び/又は前記新たな活性が前記酵素の酵素活性である、請求項10~
14の何れか
一項の方法。
【請求項16】
請求項10~
15の何れか
一項の方法により得られる細胞ライブラリー。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、種々の異なる所期のタンパク質の複数の突然変異体を発現する細胞のパネル(即ち細胞ライブラリー)であって、各細胞が前記複数の突然変異体のうち1つのみを単一の遺伝子コピーから発現する、細胞のパネルを作製するための方法に関する。また、本発明は、対応する野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、所期のタンパク質の複数の突然変異体を同定するための方法又は細胞ライブラリーにも関する。本発明によれば、同定された所期のタンパク質の複数の突然変異体は、例えばホワイト・バイオテクノロジーに応用可能である。
【背景技術】
【0002】
ホワイト・バイオテクノロジー(即ち工業生産に適用されるバイオテクノロジー)は、持続可能な開発のために極めて有望である。ホワイト・バイオテクノロジーでは、生存細胞及び酵素を用いて、分解されやすく、従来品と比較して製造時に必要なエネルギーがより少なく、発生する廃棄物がより少ない製品を合成する。例えば、幾つかの酵素は食品製造において、また、人工界面活性剤の量を減らすために粉末洗剤の活性成分として、広く使用されている。また、洗浄剤での使用のために、脂肪を分解する酵素が設計されている。更に、抗体やヒトインシュリン等の医薬品を大規模発酵槽で製造するためにトランスジェニック微生物が使用されている。ホワイト・バイオテクノロジーの利点は多数存在する。即ち、化石資源に依存せず、従来のプロセスやその基質と比較してエネルギー効率に優れ、製品や廃棄物が生物学的に分解可能である等。これらの利点は何れも、その環境影響を低下するのに利する。代替の基質及びエネルギー源を用いることで、ホワイト・バイオテクノロジーは化学、繊維、食品、包装、及びヘルスケア業界に多数の革新をもたらし得る。
【0003】
ホワイト・バイオテクノロジーにおいて、例えば工業プロセスや医薬において、タンパク質は重要なツールとなっているが、天然型のままで使用されることはめったにない。所与の酵素、抗体、又は他の所期のタンパク質から、有用性に優れた突然変異体を産生するには、多数回の逐次改善が必要となる場合が多い。構造と機能との関係に関する詳細な知識がない状況では、突然変異誘発及びスクリーニングによるタンパク質の多様化が、有用な特性を有するタンパク質を進化させるための最適な選択となっている。
【0004】
部位特異的及びランダム突然変異誘発法の双方を実施し、ある段階ではしばしば両者を組み合わせて実施するために、広範な技術が用いられている。部位特異的突然変異誘発は、改変PCR技術により達成可能であり(QuickChange Kit, Stratagene; Kunkel, 1985, Proc Natl Acad Sci U S A. 82(2): 488-492; Vandeyar, Gene 65(1): 129-133)、所与のタンパク質の機能に関する知識が既に存在する場合には有用である。本手法を用いれば、試験対象の変異体の数を比較的少なく抑えながら、個々のアミノ酸を他の広範なアミノ酸に置換することができる。更に、突然変異誘発のために個々のアミノ酸を選択するには、所期のタンパク質における種々のアミノ酸残基の機能的重要性に関する、極めて正確な知識が必要である。
【0005】
ランダム突然変異誘発は、機能的部位の候補についての予備知識を要することなく、タンパク質内の配列スペースを探索することを目的とする。斯かる技術は、例えば化学的又は物理的突然変異誘発や、エラー許容性(error-prone)PCR法など多数存在する。化学的又は物理的突然変異誘発では、DNA修飾性物質又はUV光を用いて(Bridges, 1985, Proc. Natl. Acad. Sci. USA 82: 4193-4197)DNAに損傷を与える。斯かるエラーが修復される際に、異なるヌクレオチドが導入される結果、コードされるタンパク質にアミノ酸置換が生じることになる。この目的に使用される物質としては、メタンスルホン酸エチル等のアルキル化化合物(Lai, 2004, Biotechnol. Bioeng. 86: 622-627)、亜硝酸等の脱アミノ化物質(Myers, 1985, Science 229: 242-247)、2-アミノプリン等の塩基類似体(Freese, 1959, J. Mol. Biol. 1: 87-105)等が挙げられる。これらの化学的又は物理的突然変異誘発技術の欠点は、所期の遺伝子のみならず、細胞全体及びゲノム内の全ての遺伝子に影響を与えてしまう点である。従って、毒性及び改変された細胞の恒常性は、スクリーニング結果に深刻な影響を与える。更に、これらの技術は突然変異時のバイアス性が強く、特定のヌクレオチドに対して突然変異を生じやすい強い選好性がある(Myers, 1985, 1985, Science 229: 242-247; Lai, 2004, Biotechnol. Bioeng. 86: 622-627)。従って、これらの技術は主に、遺伝子の不活性化による研究に使用される。
【0006】
現在好ましい遺伝子多様化のための方法は、エラー許容性(error-prone)PCRの変法である(Leung, 1989, Technique 1: 11-15)。この方法では、所期の遺伝子がポリメラーゼによりインビトロ(in vitro)で複製され、その際に種々の手段で誤りが導入される。PCRの各周回毎に誤りが蓄積される。この技術は所期の遺伝子の配列スペースをサンプリングするのに有用である。しかし、この突然変異誘発は、可能な全てのアミノ酸をコードするようにコドンを多様化させることができず、この方法では突然変異にバイアスが生じてしまう。その理由は、多くのアミノ酸の変換には、各コドン当たり最大3つのヌクレオチド置換が必要なのに対し、エラーPCRでは多くの場合、1コドン当たりせいぜい1つのヌクレオチドしか変換されないからである。結果として、最初のコドンによっては、アミノ酸は通常3~7種の他のアミノ酸にしか変換されず、所与の位置における可能なアミノ酸の殆どの機能は探索されないまま終わってしまう(Wong, 2006, Journal of Molecular Biology, 355(4): 858-871)。更に、ある遺伝子内の隣接する複数のアミノ酸残基や、ある短い領域の残基群を突然変異させるのは困難である。従って、隣接する(close-by)複数の突然変異間の相乗効果やエピスタシス相互作用をサンプルすることはできない。この方法の他の欠点は、操作がインビトロ(in vitro)で行われるため、所望の表現型をスクリーニングするには、多様化されたライブラリーを所期の細胞又は生物に導入しなければならないという点である。ライブラリーの増殖及びスクリーニングのための大腸菌(Escherichia coli)への形質転換は効率的に実施可能であるが、このアプローチを哺乳類細胞に用いるには多くの課題がある。その主たる課題は、1のライブラリーの単一種の複数の変異体(即ち単一種の複数の突然変異体)を、1つの所与の細胞内で発現させて、その機能を明確に評価する必要がある点に存する。残念ながら、哺乳類細胞のための主なトランスフェクション法である、リン酸カルシウム媒介性トランスフェクションやリポソーム媒介性トランスフェクションを用いると、大量のDNAコンストラクトが単一の細胞へと共トランスフェクションされることになる。この側面は研究用途では利点となる場合が多いが、ライブラリーの個々の突然変異体をスクリーニングし、機能的に評価する際には、重大な課題を生じることになる。ウイルストランスフェクションは、1の変異体の多重感染を超えないようにウイルス粒子を調節することが可能であり、斯かる共トランスフェクションの課題を克服するのに原則として有用である。しかし、多様化された遺伝子ライブラリーをレンチウイルス産生用プラスミド等の大型ウイルスシャトルプラスミドにクローニングするのは非常に時間がかかる上に、極めて非効率であることが知られている。斯かる非効率性ゆえに、産生されたライブラリーの豊富度は大きく損なわれてしまう。更に、感染した細胞による外来遺伝子の発現レベルには大きなばらつきがあるため、突然変異されたタンパク質の機能活性が埋もれてしまうことになる。
【0007】
従って、現在のところ、標的化されたタンパク質の多様化は非効率である。特に、所定の位置に異なるアミノ酸残基を有する所期のタンパク質の複数の異なる変異体を産生する細胞ライブラリーの作製には、時間が斯かる上に労力も必要である。特に、ここで所期のタンパク質の変異体が一細胞当たり1種のみ発現される細胞ライブラリーを得る場合には、必要な労力及び資源は更に増加することになる。しかし、斯かるライブラリーは、有益な特性を有するタンパク質変異体の迅速かつ網羅的なスクリーニングを可能とすることから、非常に大きな利点を有する。
【0008】
従って、本発明の基となる技術的課題は、タンパク質の多様化のための改善された方法を提供することである。特に、本発明の目的は、タンパク質の複数の異なる変異体を産生する細胞のパネル(即ち細胞のライブラリー)であって、タンパク質の変異体が一細胞当たり1種のみ発現された細胞のパネルを、効率的に作製する手段及び方法を提供することである。
【発明の概要】
【課題を解決するための手段】
【0009】
前記の技術的課題は、本開示にて提供され、添付の特許請求の範囲にて特定されるような態様の提供により解決される。
【0010】
従って、本発明は、タンパク質ライブラリーを作製する方法、特に、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現されると共に、以下の工程を含む方法に関する。
a)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導する。ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。
b)好ましくは、(工程a)の)細胞に対して、前記誘導されたDSB又は一本鎖ニックの相同組換えによる修復のための、複数の異なるドナー核酸テンプレートのライブラリーを提供する。ここで前記ライブラリーの前記複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に、異なる突然変異を含み、相同標的化修復(homology directed repair:HDR)、特に相同組換えにより、前記不活性化突然変異を除去する。
c)前記不活性化突然変異が除去された細胞を選択及び/又は濃縮する。
d)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供する。ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。
【0011】
ゲノムDNA内にDSB又は一本鎖ニックが存在することで、非相同末端連結(non-homologous end joining:NHEJ)等の細胞内修復機構が引き起こされる。従って、工程b)の他でも、本発明の方法によって、所望のタンパク質の複数の異なる変異体が得られ得る。実際に、NHEJによる修復では、多種のランダムな欠失や挿入が導入され、ひいては所期のタンパク質の多様化が達成される。従って、本発明の一側面は、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現されると共に、以下の工程を含む方法に関する。
i)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導する。ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。
(ii)前記不活性化突然変異が除去された細胞を、細胞DNA修復プロセスにより選択及び/又は濃縮する。
iii)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供する。ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。
【0012】
本発明の方法の工程a)に関して以下に提供される全ての記載及び定義が、上記の工程i)にも準用される。更に、本発明の方法の工程c)に関して以下に提供される全ての記載及び定義が、上記の工程ii)にも準用される。これに伴い、本発明の方法の工程d)に関して以下に提供される全ての記載及び定義が、上記の工程iii)にも準用される。
【0013】
しかし、以下においてより詳細に説明するように、DSB又は一本鎖ニックが相同標的化修復(HDR)によって修復されれば、所望のタンパク質の多様化の程度を顕著に同化させることができる。従って、本発明の方法は、好ましくは工程b)を含むと共に、ここでHDR修復がドナー核酸テンプレートによって誘導される。
【0014】
従って、本発明は、製造方法(即ち、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法)に関する。この方法では、突然変異誘発標的部位の近傍にDSB又は一本鎖ニック(好ましくはDSB)が誘導される(即ち導入される)。このDSB又は一本鎖ニックは、好ましくは相同標的化修復(HDR)、特に相同組換えにより修復される。工程(b)において複数の異なる核酸テンプレートを使用することで、前記所期のタンパク質の幾つかの異なる突然変異体を、一の工程で生成することが可能となり有利である。更に、所期のタンパク質が首尾よく改変された(特に突然変異された)細胞を容易に選択することができる。なぜなら、所望の突然変異の(好ましくはHDRによる)導入の際に、所期のタンパク質内の不活性化突然変異(例えばフレームシフト突然変異)が除去されるからである。従って、所期のタンパク質の突然変異が首尾よく生じた細胞のみが、活性な所期のタンパク質を発現することになり、惹いては容易に選択する(又は濃縮する)ことが可能となる。このタンパク質ライブラリー生成方法を用いることで、複数の異なる細胞、例えば哺乳類細胞内で発現される、所期のタンパク質の幾つかの変異体を調製することが可能となる。従って、本開示にて提供される方法によれば、各々異なる所期のタンパク質の複数の突然変異体を発現する細胞を含む細胞のパネル(即ち細胞ライブラリー)が調製される。特に、本開示にて提供される生成方法によれば、一細胞当たり単一の所期のタンパク質の突然変異体が発現される、細胞(例えば哺乳類細胞)のパネルが提供される。斯かる細胞のパネルは、特性が改善された所期のタンパク質の複数の突然変異体を選択及び/又は同定する有用なツールである。例えば、得られた細胞のパネルは、所期のタンパク質を単一のコピーから、及び任意により同一のプロモーターから発現する細胞との比較により、表現型分析等の下流分析のために使用される。従って、本発明は、タンパク質の多様化のための効率的且つ費用効率に優れた方法を提供する。このアプローチの容易さ、効率性、細胞コンテクスト性、及び突然変異の偏好性の不在は、タンパク質工学を促進する点で有利である。
【0015】
更に、本発明の製造方法では、標的化された一本鎖ニック又はDSBと、対応するその(好ましくはHDRによる)修復との組合せによって、所期のタンパク質の多様性が、所望の程度のバイアスを以て導入される。これによって、生存細胞のコンテクストで所与のタンパク質内における一連のアミノ酸群の影響を連続的にスキャンするという、従来にない機会が提供されることになる。従って、本開示にて提供される手段及び方法によれば、特性が改善された新たなタンパク質変異体の同定が促進され、これによってホワイト・バイオテクノロジーによるアプローチの適用可能性が顕著に拡大される可能性がある。例えば、本開示にて提供される手段及び方法は、工業生産に使用できる新たな酵素変異体や、疾患の治療及び/又は予防に使用できる新たな抗体変異体の同定に繋がるかも知れない。以下に記載するように、本開示にて提供される手段及び方法によれば、成長因子の新規な変異体も得られる可能性がある。
【0016】
本発明の製造方法の使用により、既存の技術を超える多数の利点が提供される。例えば、本発明の製造方法を用いることにより、単回のトランスフェクションにて、所期のタンパク質を迅速に多様化させることが可能となる。更に、得られた細胞のパネル内では、各細胞が単一のタンパク質変異体を含むので、選択されたタンパク質変異体の更なる分析及び処理が容易である。更に、トランスフェクトされた(例えばCRISPR)プラスミドが希釈により除外されると、得られた細胞はタンパク質変異体を安定に発現する。更に、突然変異誘発時に除去される不活性化突然変異を使用することにより、多様化を受けたタンパク質を発現する細胞を容易に同定して、親(即ち野生型)タンパク質を発現する細胞から分離することができる。また、本発明の製造方法は、導入される突然変異の性質の点でも、極めて大きな柔軟性を有する。例えば、少なくとも最大12個のクラスター化されたアミノ酸残基の列に対して、並行に飽和突然変異誘発を行うことが可能である。更に、本開示にて提供される製造方法は、実質的に突然変異のバイアスがなく、全ての可能な変異体を生成することができる。しかし、所望の場合には、ドナー核酸テンプレートの相同性の設計により、潜在的なバイアスを導入することも可能である。しかし、本開示にて提供される製造方法は、前記細胞のゲノム内に不所望の突然変異が生成されることがなく、極めて特異性が高い。例えば、所期のタンパク質内の重要な残基は変化せず維持される一方で、その周辺の残基は改変されるように、ドナー核酸テンプレートを容易に設計することが可能である。更に、本開示にて提供される製造方法を用いることで、生存細胞内で首尾よく発現される突然変異体を、直接選択(及び/又は濃縮)することが可能である。更に、本開示にて提供される製造方法に使用される試薬は、何れも費用効率に優れている。
【0017】
本開示にて提供される製造方法の更なる利点としては、これにより得られる細胞のパネルに含まれる細胞が各々、所期のタンパク質の変異体をコードする遺伝子の単一のコピー(即ち一のアレル)のみを担持するという点が挙げられる。(従来技術の方法の場合のように)第二のコピーが存在すると、得られる細胞は、所期のタンパク質の2種以上の突然変異体を発現することになる。これは下流分析に顕著な影響を及ぼす。従って、単一の遺伝子コピーを用いることで、得られる細胞のパネルには確実に、所期のタンパク質の単一の突然変異体のみを発現する細胞のみが含まれることになり、有利である。
【0018】
従って、本発明によれば、有利なことに、哺乳類細胞を用いた場合でも、一細胞当たり単一の変異体が発現された、極めて豊富に多様化されたタンパク質ライブラリーを、簡便且つ迅速に生成することが可能である。斯かる多様化は、好ましくはCRISPR/Cas9系及びHDR(特に相同組換え)を用いて達成される。本発明の製造方法は、例えば以下のように実現される。リーディングフレームシフト等の不活性化突然変異を、所期のタンパク質内の突然変異誘発の標的部位に、或いはその近傍に導入すればよい。この目的のためには、所期のタンパク質を単一のコピー数で、細胞内に、例えば哺乳類細胞内に、安定に形質転換すればよい。その後、例えばDSB又は一本鎖ニック(好ましくはDSB)を、突然変異誘発標的部位の近傍に、例えばCRISPR系を用いて導入すればよい。前記の一本鎖ニック又はDSBは、細胞修復機構により、好ましくは細胞HDR系を用いることにより修復すればよい。HDRを誘発するために特別に設計された、修復テンプレートとして機能するオリゴヌクレオチド(即ちドナー核酸テンプレート)は、2つの相同性アーム及び所望の多様化配列を含む。HDRによれば、有利なことに、所望の多様化が挿入されると共に、不活性化突然変異が除去され、例えばリーディングフレームが再生される。
【0019】
例えば、本開示にて提供される製造方法によれば、前記所期のタンパク質の突然変異体として、直接的に選択可能な(即ち陽性選択可能な)突然変異体を調製することができる。直接選択可能なタンパク質の例としては、蛍光タンパク質が挙げられる。所期のタンパク質を直接選択することができれば、例えば蛍光が増加した突然変異体を選択(及び/又は濃縮)することにより、特性が改善された突然変異体を容易に選択(及び/又は濃縮)することができる。直接選択できないタンパク質(例えば非蛍光タンパク質)を加工する場合には、所期のタンパク質の下流側(即ちC末端側)にインフレームで、蛍光タンパク質をタグ化すればよい。この場合、HDR又はNHEJ(好ましくはHDR)により前記不活性化突然変異(例えばフレームシフト突然変異)を除去することによっても、蛍光タンパク質の発現を再生することができ、惹いては多様化されたタンパク質変異体の全てを蛍光選別法により収穫(即ち選択及び/又は濃縮)することが可能となる。
【0020】
上述したように、本発明の製造方法によれば、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを生成することが可能となる。具体的に、各細胞が単一の遺伝子コピーから個別の突然変異体を発現する、細胞のパネルを生成することが可能となる。即ち、前記細胞のパネルに含まれる細胞は各々、異なる所期のタンパク質の複数の突然変異体を発現する。
【0021】
本発明の一側面によれば、本開示にて提供される製造方法は更に、工程a)に使用される細胞を生成する工程を含む。本開示にて提供される製造方法では、所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)の単一のコピーは、内因性遺伝子のコピーであってもよい。しかし、本開示にて提供される製造方法では、所期のタンパク質をコードする遺伝子の単一のコピーは、外因性遺伝子のコピーである(即ち、使用される細胞内に天然では存在しない)ことが好ましい。もし、本開示にて提供される製造方法において、前記所期のタンパク質をコードする遺伝子の単一のコピーが外因性である場合、工程a)の細胞の生成は、前記所期のタンパク質をコードする遺伝子の単一のコピーを、細胞のゲノム内に導入することを含む。所期のタンパク質をコードする遺伝子の単一の外因性のコピーをゲノム内に導入する方法は、本技術分野で周知であり、例えば部位特異的相同組換え系が挙げられる。例えば、所期の遺伝子の単一のコピーの細胞への組み込みは、標準的な抗生物質による選択、Flp-In又はJump-in組換え、レンチウイルスによるトランスフェクション及び選択、或いは、Cas9標的化切断と、例えばAAVS1遺伝子座等の相同性ドメインを用いた組換えとにより達成することができる。
【0022】
本発明の一側面によれば、工程a)に使用される細胞の生成は、前記所期のタンパク質をコードする遺伝子の単一のコピー内に、前記の不活性化突然変異を導入することを含む。前記の不活性化突然変異は、例えばフレームシフト突然変異であってもよい。斯かるフレームシフト突然変異は、例えば、前記所期の遺伝子のコーディングリーディングフレーム内で、1、2、3又は4塩基の付加又は除去を行うことにより導入できる。即ち、斯かるフレームシフトは、フレームシフトを生じさせるのに必要な欠失よりも大きな欠失により、例えば幾つかのアミノ酸をコードするヌクレオチドの欠失により生じさせてもよい。このように、より大きな領域を欠失させると、修復テンプレートに対する相同性が増加し、惹いては組換え効率が向上しうるため、有利な場合がある。例えば、より大きな欠失(例えば標的化された全アミノ酸をコードするヌクレオチドプラス1~2塩基の除去)によりフレームシフトを生じさせて所期の遺伝子を不活性化すると、DSBの誘導直後に、染色体の自由端にドナー核酸テンプレートとの直接の相同部位を共有させることができる。相同組換え反応を損ないうる中間的な原DNAも生じない。しかし、選択(又は導入)されたPAM部位の下流の4塩基を除去してフレームシフトを作成することにより、1アミノ酸を除去してフレームシフトを生じさせることもできる。前記所期のタンパク質をコードする単一の遺伝子が外因性である場合、前記不活性化突然変異の導入は、前記所期のタンパク質をコードする遺伝子の単一コピーの細胞ゲノムへの導入前に行ってもよく、当該導入後に行ってもよい。原則として、本技術分野で公知の任意の突然変異誘発方法を用いて、前記所期の遺伝子を細胞内に組み込む前に、当該遺伝子内に不活性化突然変異を導入することができる。斯かる突然変異誘発方法の非限定的な例としては、標的化された制限酵素消化及び連結や、PCRを用いた部位特異的突然変異誘発方法が挙げられる(Quick Change Kit, Stratagene; Kunkel, 1985, Proc Natl Acad Sci U S A. 82(2): 488-492)。本発明では、(不活性化突然変異を有さない)所期の遺伝子のコピーを細胞ゲノム内に導入した後で、不活性化突然変異を導入してもよい。これは本技術分野で公知の遺伝子工学的手法により達成することができる。斯かる遺伝子工学的手法としては、例えばフレームシフトを含む適切なドナー核酸テンプレートを用いた、CRISPR/Cas媒介遺伝子編集が挙げられる。斯かる方法は本技術分野で周知であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。
【0023】
前記所期のタンパク質をコードする遺伝子の単一のコピーが内因性である場合、工程a)に使用される細胞の生成は、例えば前記細胞のゲノム内の所期のタンパク質をコードする遺伝子内に、部位特異的相同組換え系を用いて、不活性化突然変異を導入することを含んでいてもよい。部位特異的相同組換え系、例えばCRISPR/Cas9系は、本技術分野で周知であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。
【0024】
本開示にて提供される製造方法によれば、所期のタンパク質の複数の突然変異体を発現する細胞のパネルであって、各細胞当たり単一の遺伝子コピーから、所期のタンパク質の複数の突然変異体のうち一つが発現される、細胞のパネルが製造される。即ち、本開示にて提供される製造方法の工程a)では、所期のタンパク質をコードする遺伝子が、細胞内に単一のコピーとして存在する。従って、工程a)の細胞の生成は、所期のタンパク質をコードする遺伝子が一細胞当たり単一コピーのみとなるよう、所期のタンパク質をコードする遺伝子の他のコピーの不活性化(好ましくは欠失)を含んでいてもよい。多くの細胞培養系及び植物では、3つ以上のアレルが存在する。従って、工程a)に使用される細胞を生成するには、最終的に単一のコピーとするために、(1つを除く)他の全てのアレルを不活性化(好ましくは欠失)させなければならない。従って、もし所期のタンパク質をコードする遺伝子が、ゲノム内に2コピー以上存在する内因性遺伝子である場合は、工程a)の細胞の生成は、前記所期のタンパク質をコードする遺伝子を一細胞当たり単一コピーとするために、前記所期のタンパク質をコードする遺伝子の内因性コピーの不活性化(好ましくは欠失)を含んでいてもよい。特定の遺伝子のコピー(即ち特定のアレル)の不活性化又は欠失の方法は、本技術分野では周知である。例えば、CRISPR/Cas9系を用いた遺伝子の一コピーの欠失は、Ran, 2013, Nature Protocols 8 (11): 2281-2308に記載されている。或いは、所期の遺伝子を単一のコピーのみ含む細胞は、例えば国際公開第2013/079670A1号に記載された単数体細胞培養等を用いて得ることができる。
【0025】
本開示にて提供される方法の工程a)は、DSB又は一本鎖ニック(好ましくはDSB)を、細胞のゲノム内に導入することを含む。前記のDSB又は一本鎖ニックはそれぞれ、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを用いて実施することが好ましい。従って、工程a)の細胞の生成は、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードする核酸配列を細胞内に導入することを含んでいてもよい。更に、工程a)の細胞の生成は更に、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための対応する認識部位を、所期の遺伝子の単一のコピー内に含んでいてもよい。
【0026】
例えば、部位特異的ヌクレアーゼがCas9又はCpf1である場合、或いは部位特異的ニッカーゼがCas9である場合、前記認識配列は開裂部位の直ぐ下流にプロトスペーサー隣接モチーフ(protospacer-adjacent motif:PAM)を含むことが好ましい。種々のCRISPRヌクレアーゼ及びその変異体のPAM標的配列(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT、Cpf1の場合は5’-TTN)は、哺乳類ゲノム内に豊富に存在する。従って、本開示にて提供される方法を用いれば、PAM配列を導入しなくとも、殆どの遺伝子を標的化することができる。しかし、所望の開裂部位の直ぐ下流にPAM配列が存在しない場合には、PAM配列(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT、Cpf1の場合は5’-TTN)を所期のタンパク質内に、所望の開裂部位の下流に導入してもよい。従って、使用される部位特異的ヌクレアーゼ又はニッカーゼに応じて、もし所期の遺伝子の所望の位置に存在しない場合には、前記部位特異的ヌクレアーゼ又はニッカーゼによる開裂のための認識部位(例えばCas9又はCpf1を使用する場合にはPAM配列、或いはジンクフィンガーヌクレアーゼ、転写アクティベーター様エフェクターヌクレアーゼ又はmegaTALエンドヌクレアーゼの特異的認識部位)を、所期の遺伝子内に、フレームシフトと共に形成してもよい。
【0027】
工程a)の細胞の生成は更に、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを、前記認識部位に対して標的化する手段を、細胞内に導入することを含んでいてもよい。例えばガイドRNA、又は前記ガイドRNAをコードするポリヌクレオチドを、工程a)の細胞に導入してもよい。ガイドRNAは、小型合成キメラtracr/crRNA(「単一ガイドRNA」(single-guide RNA)又はsgRNA)であってもよい。或いは、ガイドRNAは、2つの小型合成tracr/crRNA(「二重ガイドRNA」(dual guide RNA)又はdgRNA)であってもよい。一部の部位特異的ヌクレアーゼ(例えばCpf1)の場合、小型合成crRNAがガイドRNAとして機能しうる。本開示にて提供される方法の一側面によれば、Cas9は認識部位に対して、sgRNA又はdgRNAを介して標的化される。Cpf1は認識部位に対してcrRNAを介して標的化することができる。
【0028】
従って、工程a)の細胞の生成は、細胞に対して外部から、所期のタンパク質をコードするヌクレオチド配列を、単一のコピーとして導入することを含んでいてもよい。例えば、所期のタンパク質をコードするヌクレオチド配列により、細胞を形質転換、トランスフェクト、又は形質導入すればよく、その結果として所期のタンパク質をコードする遺伝子の単一のコピーが発現されることになる。細胞のトランスフェクション、形質転換、又は形質導入のための手段及び方法は、本技術分野では周知であるが、例としてはリポソーム媒介トランスフェクション、Ca2+-リン酸媒介トランスフェクション、ウイルスベクター媒介送達(例えばGreen, Sambrook, 2012, Molecular Cloning. A laboratory manual. Cold Spring Harbor Laboratory Pressを参照)。得られた細胞は、所期のタンパク質を安定に発現することが好ましい。上述したように、工程a)の細胞の生成は更に、部位特異的ヌクレアーゼ又はニッカーゼ、或いは、部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドを、例えばトランスフェクション、形質転換又は形質導入により、細胞内に導入することを含んでいてもよい。更に、工程a)の細胞の生成は更に、ガイドRNA、或いはガイドRNAをコードするポリヌクレオチドを、例えばトランスフェクション、形質転換又は形質導入により、細胞内に導入することを含んでいてもよい。最後に、工程a)の細胞の生成は、認識部位(例えばPAM配列)を、部位特異的ヌクレアーゼ又はニッカーゼの所望の開裂部位の下流に導入することを含んでいてもよい。
【0029】
或いは、工程a)では、既に所期のタンパク質を(対応する遺伝子の単一のコピーから)発現する細胞を用いてもよい。斯かる所期のタンパク質は、既に不活性化(例えばフレームシフト)突然変異及び/又は認識部位(例えばPAM配列)を、所望の開裂部位の下流に含んでいてもよい。前記の細胞は、既に部位特異的ヌクレアーゼ又はニッカーゼ、或いは前記部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドを含んでいてもよい。また、前記の細胞は、既にガイドRNA、或いは前記ガイドRNAをコードするポリヌクレオチドを含んでいてもよい。
【0030】
「所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位」(target site for mutagenesis in the gene encoding for the protein of interest)とは、a)の細胞内の所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)の単一コピーの核酸配列内における位置であって、前記所期のタンパク質の突然変異体を生成するための多様化/突然変異誘発の対象として想定された位置に対応する位置である。従って、突然変異誘発標的部位は、原則として、突然変異を導入すべき所期の遺伝子のコーディング配列内における、任意の特定の位置とすることができる。例えば、所期のタンパク質内の特定のアミノ酸を突然変異させる場合には、突然変異誘発標的部位は、突然変異させるべきアミノ酸をコードする3つのヌクレオチドからなるトリプレットとすればよい。幾つかのアミノ酸を突然変異させる場合には、突然変異誘発の標的部位は、斯かる複数のアミノ酸をコードするヌクレオチド配列とすればよい。
【0031】
誘導されたDSB又は一本鎖ニックの位置は、所期のタンパク質をコードする遺伝子の単一のコピー内の所定の突然変異誘発標的部位に(直接)存在するか、又はその近傍に存在する。本開示において「突然変異誘発標的部位の近傍」(close proximity to the target site for mutagenesis)とは、以下の様に定義される。例えば、フレームシフトがアミノ酸の欠失及び/又は導入(例えば欠失)によって導入された場合、DSB又は一本鎖ニックは、例えば前記欠失及び/又は導入の上流又は下流1~100bpの位置に存在する。
【0032】
本発明の方法の工程a)は、DSB又は一本鎖ニック(single-strand nick)(別称一本鎖切断(single-strand break))の誘導(即ち導入)を含み、或いは斯かる誘導からなる。前記のDSB又は一本鎖ニックは、「細胞のゲノム内に」導入される。即ち、DSB又は一本鎖ニックは、細胞ゲノムDNA内に誘導される。前記のゲノムDNAは、例えば内因性ゲノムDNAであってもよい。しかし、前記ゲノムDNAは、例えば安定なトランスフェクション、形質転換、又は形質導入により、ゲノムDNAに対して挿入されたプラスミドに由来するものであってもよい。
【0033】
本技術分野で公知のように、DSBは、DNA二重螺旋の両DNA鎖の中断である。DSBは、平滑断端(即ち両鎖が同一の位置で切断された端)であってもよく、粘着末端(即ち両鎖が異なる位置で切断され、短い一本鎖の相補性配列がDSBの両端に形成された端)であってもよい。本技術分野では一本鎖ニック(single-strand nick)(又は一本鎖切断(single-strand break))としても知られているのは、DNA二重螺旋の一方のDNA鎖のみの中断である。「中断」(interruption)とは、DSBに関しては、両鎖の2つのヌクレオチド間のホスホジエステル結合の切断を意味し、一本鎖ニックに関しては、二重螺旋の2つの鎖のうち一方のみのホスホジエステル結合の切断を意味する。好ましくは、DSBは、工程a)の細胞のゲノムに誘導(即ち導入)される。
【0034】
本発明との関連において、前記のDSB又は一本鎖ニックは、前記突然変異誘発標的部位から、例えば120塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導することができる。同様に、前記不活性化突然変異は、前記突然変異誘発標的部位から120塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離とすることができる。従って、前記不活性化突然変異(例えばフレームシフト)と前記のDSB又は一本鎖切断との距離は、例えば0~120塩基対(これは0~40アミノ酸に相当する)とすることができる。
【0035】
前記のDSB又は一本鎖ニックは、原則として、部位特異的DSB又は部位特異的一本鎖ニックを生成するための本技術分野で公知の任意の方法により達成することができる。DSBは、部位特異的ヌクレアーゼ(別名「配列特異的ヌクレアーゼ」)により誘導(即ち導入)されることが好ましく、工程a)の所期のタンパク質をコードする遺伝子の不活性化された単一のコピーは、前記部位特異的ヌクレアーゼのための対応する認識部位を含むことが好ましい。同様に、一本鎖ニックは、部位特異的ニッカーゼ(別名「配列特異的ニッカーゼ」)により導入されることが好ましく、工程a)の所期のタンパク質をコードする遺伝子の不活性化された単一のコピーは、前記部位特異的ニッカーゼのための対応する認識部位を含むことが好ましい。従って、本発明の工程a)に使用される細胞は、部位特異的ヌクレアーゼ若しくは部位特異的ニッカーゼ、又は、部位特異的ヌクレアーゼ若しくは部位特異的ニッカーゼをコードするポリヌクレオチドを含んでいてもよい。本発明の一側面によれば、工程a)の細胞のゲノムは、使用される部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための更なる認識部位を含んでいなくともよい。これにより、細胞のゲノムDNAに対する更なる修飾を回避できるという利点が得られる。前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードするポリヌクレオチドは、工程a)の細胞に含まれるベクター(例えばプラスミドベクター)にコードされていてもよく、或いは、前記細胞のゲノムに安定に組み込まれていてもよい。細胞を(プラスミド)ベクターで一過的に形質転換若しくはトランスフェクトし、又は、ポリヌクレオチドを細胞のゲノム内に安定に組み込む手段及び方法は、本技術分野で公知である。プラスミドの一過性トランスフェクションは、DNAのリン酸カルシウム沈殿又はリポソーム媒介性トランスフェクションを用いて簡便に達成することができる。斯かる技術を実施するための指針は、Green, Sambrook, 2012, Molecular Cloning. A laboratory manual. Cold Spring Harbor Laboratory Pressにより提供される。リン酸カルシウムトランスフェクションは、例えばKingston, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.3に記載されている。DEAE-デキストランを用いたトランスフェクションは、例えばGulick, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.4Tに記載されている。電気穿孔法によるトランスフェクションは、例えばPotter, 2011, Curr Protoc Cell Biol. Chapter 20: Unit 20.5に記載されている。陽イオン性脂質試薬を用いた培養真核細胞のトランスフェクションは、例えばHawley-Nelson, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.6に記載されている。前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードするポリヌクレオチドは、とりわけ、使用される細胞内で活性な恒常的(即ち恒常的に活性な)プロモーターに作動式に融合されていてもよい。即ち、部位特異的ヌクレアーゼ又はニッカーゼは、恒常的(即ち恒常的に活性な)プロモーターの制御下で発現されてもよい。本技術分野で公知の恒常的プロモーター系の非限定的な例としては、CMV、ユビキチンプロモーター、及びCAGプロモーターが挙げられる。例えば、一側面によれば、前記の部位特異的ヌクレアーゼ又はニッカーゼは、CMVプロモーターの制御下で発現される。或いは、前記の部位特異的ヌクレアーゼ又はニッカーゼは、誘導性プロモーターの制御下で発現されてもよい。即ち、前記の部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドは、誘導性プロモーターに作動式に融合されてもよい。誘導性プロモーター系の非限定的な例は本技術分野で公知であり、例えばTetオン/オフ系、ヒートショックプロモーター、及び光誘導性プロモーターが挙げられる。誘導性プロモーター系を使用すると、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼの発現が、惹いては、DSB又は一本鎖ニックの誘導が、適時に制御できるという利点が得られる。例えば、斯かる誘導可能な系によれば、DSB又は一本鎖ニックが導入されるのに十分な時間の経過後に、発現を停止することが可能となる。即ち、発現は、例えば24~48時間経過後に停止されてもよい。誘導性発現系によれば、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼの発現を、所定の時点で開始することも可能となる。これは、前記の部位特異的ヌクレアーゼ又はニッカーゼが、使用される細胞内で安定に発現される場合に有利である。
【0036】
好ましくは、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼは、工程a)の細胞に含まれるプラスミドから発現される。このプラスミドは、細胞から除去されてもよい。プラスミドの除去は、例えば、プラスミドを希釈除去(diluting out)することにより達成できる。希釈除去(diluting out)とは、トランスフェクトされたヌクレアーゼ/ニッカーゼをコードするプラスミドがエピソーム性であり、哺乳類細胞において増幅されないことにより、その後の細胞分裂周期において、新たに生成された細胞がこれらのプラスミドの全てを徐々に消失することを意味する。しかし、上述したように、工程a)の細胞は、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを安定に発現してもよい。
【0037】
本発明の方法に使用される部位特異的ヌクレアーゼは、公知の何れの部位特異的ヌクレアーゼであってもよい。具体的に、「部位特異的ヌクレアーゼ」(site-specific nuclease)(又は「配列特異的ヌクレアーゼ」(sequence-specific nuclease))という語は、DNA二本鎖にDSBを導入するべく、DNA二本鎖の両鎖を所定の標的部位で切断可能な任意の酵素を意味する。同様に、本発明の方法に使用される部位特異的ニッカーゼは、公知の何れの部位特異的ニッカーゼであってもよい。具体的に、「部位特異的ニッカーゼ」(site-specific nickase)(又は「配列特異的ニッカーゼ」(sequence-specific nickase))という語は、DNA二本鎖に一本鎖ニックを導入するべく、DNA二本鎖の一方の鎖を所定の標的部位で切断可能な酵素を意味する。
【0038】
本発明では、ジンクフィンガーヌクレアーゼ(zinc finger nucleases:ZFN)又は転写アクティベーター様エフェクターヌクレアーゼ(transcription activator-like effector nucleases:TALEN)を、それぞれ部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用してもよい。なぜなら、これらの分子は、従来からHDR媒介性ゲノム編集に使用されているからである(Li, 2011, Nature 475: 217-221; Bedell, 2012, Nature 491: 114-118; Genovese, 2014, Nature 510: 235-240)。本発明において有用な他の部位特異的ヌクレアーゼとしてはmegaTALエンドヌクレアーゼが挙げられる。これは高い標的特異性を有し、オフ-標的開裂を最小化できることから、遺伝子編集に特に適している。例えばBoissel, 2014, Nucleic Acids Res. 42(4): 2591-2601を参照。しかし、クラスター化規則的間隔形成短小回文配列リピート(clustered regularly interspaced short palindromic repeat:CRISPR)関連(Cas)エフェクタータンパク質、例えばCas9やCpf1によれば、遥かに簡単で汎用性の高いゲノム編集法が提供される。従って、本発明では、前記の部位特異的ヌクレアーゼ又はニッカーゼがCas9であるか、部位特異的ヌクレアーゼがCpf1であることが好ましい。最も好ましくは、Cas9ヌクレアーゼ(別名「CRISPR/Cas9ヌクレアーゼ」)を、本発明の製造方法における部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用することである。
【0039】
ZFNはジンクフィンガーDNA結合ドメインを含む。これは各標的遺伝子及びFokIヌクレアーゼに合わせて設計すべきである。同様に、TALENはDNA結合ドメインを含む。これは各標的遺伝子及びFokIヌクレアーゼに合わせて設計すべきである。FokIヌクレアーゼは、ジンクフィンガーDNA結合ドメイン又はDNA結合ドメインと結合すると、所定の標的部位においてDNAに一本鎖ニック又は二本鎖切断を導入する活性を有する。実際に、ZFN及びTALENは、所定の標的側のDNAに一本鎖ニックを導入できることから、それぞれジンクフィンガーニッカーゼ(ZFニッカーゼ)及び転写アクティベーター様エフェクターニッカーゼ(TALEニッカーゼ)と呼ばれる場合が多い。従って、本発明では上記のように、ZFN又はTALENを部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用してもよい。Cas9ヌクレアーゼは主にDSBを誘導する。しかし、タンパク質のヌクレアーゼ機能をニック形成機能へと変更した改変Cas9ヌクレアーゼも報告されている。換言すれば、二本鎖標的DNAの両鎖を切断する天然Cas9ヌクレアーゼを、二本鎖の一方のみを切断する(即ちニック形成する)ニッカーゼへと改変することができる。幾つかのCas9ニッカーゼは本技術分野で公知であり、例えばTsai, 2016, Nature Reviews Genetics 17.5: 300-312に記載されている。部位特異的ニッカーゼを得るためにCas9タンパク質を修飾する手段及び方法は、本技術分野で周知であるが、例えばヌクレアーゼドメインの一つを不活性にするアミノ酸置換をCas9に導入することを含む。より具体的には、Cong, 2013, Science, 339: 819-823に示すように、例えば化膿連鎖球菌(Streptococcus pyogenes)Cas9の位置10のアスパラギン酸をアラニンに置換することができる。
【0040】
ニック形成機能を有する改変Cas9タンパク質を用いることで、ゲノム内に導入されたDNA損傷が非相同末端連結ではなく、相同組換えにより修復される可能性が高まるという利点がある。従って、本発明の方法では、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとしてCas9を使用してもよい。本開示にて提供される方法では、部位特異的ヌクレアーゼとしてCpf1を使用してもよい。
【0041】
Foklヌクレアーゼのヌクレオチド配列及びアミノ酸配列は、本技術分野では周知である。Foklヌクレアーゼのアミノ酸配列は、本開示では配列番号19として示される。好ましくは、本開示で使用される部位特異的ヌクレアーゼとして使用されるFoklヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、配列番号19のアミノ酸配列に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性 を有するアミノ酸配列を含む。
【0042】
部位特異的ヌクレアーゼ活性は、標的化された遺伝子配列を含むプラスミド又は直鎖dsDNAを用いて、インビトロ(in vitro)で試験することができる。標的化されたDNAを部位特異的ヌクレアーゼと混合し、1時間消化させ、開裂の成否をゲル電気泳動で可視化する。
【0043】
本開示にて提供される方法において、Foklヌクレアーゼを部位特異的ニッカーゼとして用いる場合には、斯かるFoklヌクレアーゼは部位特異的ニッカーゼ活性を有すると共に、配列番号19に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列をふくむことが好ましい。
【0044】
部位特異的ニッカーゼ活性を試験するための方法は、本技術分野では周知であり、例えばMcConnell, 2009, Proceedings of the National Academy of Sciences of the United States of America. 106(13): 5099-5104に記載されている。要すれば、ニック形成部位の上流及び下流を200bpで挟んだニッカーゼアッセイ標的断片をPCRで生成する。50mM トリス(pH7.5)、100mM NaCl、10mM MgCl2、及び1mM DTTを含む10μLの反応液内で、ニック形成反応を37℃で1時間進行させる。消化後、2μLの5×停止溶液[0.1M トリス・HCl(pH7.5)、0.25M EDTA、5% SDS]を加え、脱イオン化ホルムアミド、0.1%キシレンシアノール、及び0.1%ブロモフェノールブルーと共に、試料を95℃で5分間変性させ、急速冷却した後、6%ポリアクリルアミド変性ゲルを用いた電気泳動で分離する。ゲルを乾燥し、リン酸画像化法(phosphorimaging)により分析する。
【0045】
メガヌクレアーゼとTALエフェクターとの融合体であるmegaTALエンドヌクレアーゼは、高い活性及び特異性を有する新たなクラスのDNA標的化エンドヌクレアーゼである。MegaTALエンドヌクレアーゼ のヌクレオチド配列及びアミノ酸配列は、本技術分野では周知であり、例えばBoissel, 2014, Nucleic Acids Res. 42(4): 2591-2601に示されている。本開示において部位特異的ヌクレアーゼとして使用されるmegaTALエンドヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、配列番号20のアミノ酸配列に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
【0046】
Cfp1ヌクレアーゼのヌクレオチド配列及びアミノ酸配列は、本技術分野で周知であり、例えばhttp://www.ncbi.nlm.nih.gov/protein/U2UMQ6.1又はhttp://www.addgene.org/browse/sequence/124373/に示されている。AsCpf1及びLbCpf1のアミノ酸配列を、それぞれ本開示の配列番号21及び22に示す。本発明において使用されるCpf1ヌクレアーゼは、例えば、部位特異的ヌクレアーゼ活性を有すると共に、配列番号21又は22のアミノ酸配列に対して、少なくとも80%、好ましくは、少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
【0047】
Cas9ヌクレアーゼは、CRISPR/Cas9ファミリーの酵素である。Cas9ヌクレアーゼの非限定的な例は、本技術分野では公知である。本発明では、DSBを誘導するのに、任意の(DSB誘導性)Cas9ヌクレアーゼを使用することができる。同様に、一本鎖ニックを誘導するのに、任意の(一本鎖切断誘導性)Cas9ヌクレアーゼを使用することができる。本開示で使用されるCas9ヌクレアーゼは、細菌種に由来することが好ましい。本開示で使用できるCas9ヌクレアーゼの非限定的な例としては、化膿連鎖球菌(Streptococcus pyogenes)由来のSpCas9ヌクレアーゼ、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来のSt1Cas9ヌクレアーゼ、及び、黄色ブドウ球菌(Staphylococcus aureus)由来のSaCas9ヌクレアーゼが挙げられる。これらのタンパク質のアミノ酸配列は、本技術分野で公知であり、例えばhttp://www.ncbi.nlm.nih.gov/protein/500000239?report=genbank&log$=protalign&blast_rank=1&RID=T6UUUEV901R又はhttp://www.ncbi.nlm.nih.gov/protein/J7RUA5.1に示されている。SpCas9、St1Cas9、及びSaCas9のアミノ酸配列は、それぞれ本開示の配列番号23、24、及び25として提供される。本開示で使用されるCas9ヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、任意の既知のCas9ヌクレアーゼのアミノ酸配列、例えばそれぞれ配列番号23、24、又は25に示される、SpCas9、St1Cas9、又はSaCas9のアミノ酸配列に対して、少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、より好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含む。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。本開示にて提供される方法において、部位特異的ニッカーゼとしてCas9ヌクレアーゼを使用する場合、斯かるCas9ヌクレアーゼは、部位特異的ニッカーゼ活性を有すると共に、任意の既知のCas9ヌクレアーゼのアミノ酸配列、例えばSpCas9、St1Cas9、又はSaCas9のアミノ酸配列に対して、少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、より好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ニッカーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
【0048】
従って、本発明において、部位特異的ヌクレアーゼは、例えばCas9ヌクレアーゼ、Cpf1ヌクレアーゼ、ZFN、TALEN、及びmegaTALエンドヌクレアーゼからなる群より選択される。Cas9をヌクレアーゼ又はニッカーゼとして使用することで、標的特異性を規定する単一の短い合成キメラtracr/crRNA(「単一ガイドRNA」(single-guide RNA)、sgRNA)又は二つの短い合成tracr/crRNA(「二重ガイドRNA」(dual-guide RNA)、dgRNA)との組合せで、Cas9タンパク質を発現させればよいという利点が得られる。同様に、ヌクレアーゼとしてCpf1として使用することで、標的特異性を規定する単一の短い合成crRNAとの組合せで、Cpf1タンパク質を発現させればよいという利点が得られる。従って、部位特異的ヌクレアーゼ又はニッカーゼとしてCas9又はCpf1を使用することにより、標的特異的な一本鎖若しくは二本鎖切断(Cas9)又は二本鎖切断(Cpf1)を生成するための構成を、大幅に簡素化することが可能となる。従って、本発明においては、部位特異的DNAヌクレアーゼがCas9又はCpf1であることが好ましく、或いは、部位特異的ニッカーゼがCas9であることが好ましい。最も好ましくは、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼがCas9(即ちCas9ヌクレアーゼ)であることである。
【0049】
SpCas9、St1Cas9、及びSaCas9の他にも、幾つかのCas9オルソログが知られており、本発明ではそれらを使用してもよい。斯かるCas9オルソログとしては、髄膜炎菌(Neisseria meningitides)及びフランシセラ・ノビシダ(Francisella novicida)に由来するものが挙げられる。本発明の方法に適用可能な幾つかの既知のCas9ヌクレアーゼの配列は、本技術分野で公知であり、例えば国際公開第2014/131833号に記載されている。本開示において、Cas9ヌクレアーゼは、SpCas9変異体、例えばeSpCas9(Ian, 2016, Science, 351: 84-88)又はSpCas9-HF1(Kleinstiver, 2016, Nature, 529: 490-495)であってもよい。これらは、元のSpCas9よりもより特異的に開裂を誘導することができる。更に、複数の異なるPAMを認識するSpCas9変異体や(Kleinstiver, 2015, Nature 523(7561): 481-485)、PAM特異性が改変された変異体(例えばKleinstiver, 2015, Nature 523(7561): 481-485に記載のVQR及びEQR変異体)も存在し、それらを本開示にて提供される方法に使用してもよい。また、他の既知のCas9変異体、例えばスプリット(split)Cas9、インテイン(intein)Cas9、遺伝子操作(engineered)Cas9、又は二量体RNAガイドFokI-dCas9ヌクレアーゼ(RNA-guided FokI-dCas9 nuclease:RFN)等を、本開示にて提供される方法に使用してもよい。これらのCas9変異体は、例えばZetsche, 2015, Nat Biotechnol. 33(2):139-142; Truong, 2015, Nucleic Acids Res. 43(13): 6450-6458; Tsai, 2014, Nat Biotechnol. 32(6): 569-576等に記載されている。これらのCas9変異体の何れかを本開示にて提供される方法に使用する場合、本技術分野で周知のように実験を適合させなければならない。特にスプリットCas9及びRFNには、それぞれ複数のプラスミド及びテンプレートが必要となり、インテインCas9には、4-ヒドロキシタモキシフェンの添加が必要となる。しかし、これらは当業者には周知の微細な変更に過ぎない。
【0050】
本開示にて提供される方法は、従来に匹敵するオン-標的開裂活性を維持しつつ、オフ-標的作用が最小化されたCas9変異体、又はオフ-標的作用を有さないCas9変異体を用いることで、その特異性を更に強化することもできる(Kleinstiver, 2016, Nature, 529: 490-495; Slaymaker, 2016, Science 351, 84-88)。しかし、本発明においては、Cas9ヌクレアーゼがSpCas9、St1Cas9又はSaCas9であることが好ましい。最も好ましいCas9ヌクレアーゼはSpCas9である。
【0051】
ZFN及びTALENによれば、タンパク質ドメインを介した特異的なDNA結合が達成されることから、各ヌクレアーゼ毎に個別の標的部位を挿入しなければならない。或いは、所与の配列に合わせて特異的なヌクレアーゼをカスタマイズする必要がある(Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44)。これに対して、Cas9は特異性決定ガイドRNA配列(CRISPR RNA(crRNA))によってガイドされる。斯かるcrRNAは、トランス活性化crRNA(tracrRNA)と関連し、相補的DNA標的配列とワトソン・クリック(Watson-Crick)塩基対を形成することにより、部位特異的二本鎖切断を生じさせる(Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44)。(Cas9と、tracrRNA-crRNA二本鎖の「単一ガイドRNA」(single-guide RNA:sgRNA)に対する複合体とからなる)シンプルな二成分系、或いは、(Cas9と、tracrRNA分子と、crRNA分子とからなり、ここで2つのRNA分子は「二重ガイドRNA」(dual-guided RNA)、即ちdgRNAを形成する)シンプルな三成分系を用いることにより、任意の所期のゲノム遺伝子座でDNA開裂を達成することができる。Cpf1、単一のRNAガイドヌクレアーゼ(crRNAのみを使用し、tracrRNAを使用しない)も、部位特異的DSBの誘導に使用できる。それゆえ、ガイドRNAの短い特異性決定部分を変えるだけで、異なるCasタンパク質を特定のDNA配列に標的化することができる。斯かる特異性決定部分の変更は、一回のクローニング工程で容易に達成することができる。
【0052】
従って、本開示にて提供される方法が、部位特異的ヌクレアーゼとしてCas9を使用する場合には、工程a)の細胞は更に、
(i)少なくとも1つの標的配列特異的CRISPR RNA(crRNA)分子と、少なくとも1つのトランス活性化crRNA(tracrRNA)分子(「二重ガイドRNA」、dgRNA)とからなる、少なくとも1つのガイドRNA、
(ii)前記(i)のRNA分子をコードするポリヌクレオチド、
(iii)少なくとも1つの標的配列特異的crRNAと、少なくとも1つのtracrRNA(「単一ガイドRNA」、sgRNA)とを含むキメラRNA分子である、少なくとも1つのガイドRNA、及び/又は、
(iv)前記(iii)のキメラRNAをコードするポリヌクレオチド
を含んでいてもよい。
【0053】
前記のガイドRNAは、前記の部位特異的ヌクレアーゼ(例えばCas9又はCpf1)又は部位特異的ニッカーゼ(例えばCas9)を、所望のDSB又は一本鎖ニックの部位に標的化する。例えば、アミノ酸の欠失及び/又は導入(例えば欠失)によりフレームシフトが誘導される場合、前記ガイドRNA(例えばsgRNA)は、例えば前記の部位特異的ヌクレアーゼ又はニッカーゼを、それぞれ前記のDSB又は一本鎖ニックの所望の位置に標的化する。斯かる標的化位置は、例えば、前記欠失及び/又は導入の上流又は下流側の1~100bpの位置(1~33アミノ酸に相当)である。部位特異的DNAヌクレアーゼ(例えばCas9又はCpf1)及びガイドRNAを用いたゲノム編集は、本技術分野では周知であり、例えば"CRISPR-Cas: A Laboratory Manual", 2016, edited by Jennifer Doudna, ISBN 978-1-621821-31-1に記載されている。
【0054】
本開示にて提供される方法の好ましい側面によれば、工程a)の細胞は、少なくとも1つのsgRNAをコードするポリヌクレオチド(例えばプラスミドベクター)を含む。このポリヌクレオチドは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)長さ約20ヌクレオチドの配列と、それに続く長さ約76ヌクレオチドのガイドRNAスキャフォールド配列とをコードする配列を含んでいてもよい。このスキャフォールド配列は、ダイレクトリピート(direct repeat:DR)配列と、tracrRNAとをコードする。
【0055】
上述のように、本発明の一態様によれば、前記部位特異的ヌクレアーゼはCpf1である。この態様では、ゲノム編集機構は更に、
(i)標的配列特異的crRNA分子を含む少なくとも1つのガイドRNA、又は、
(ii)(i)のRNA分子をコードするポリヌクレオチド
を含んでいてもよい。
【0056】
本発明において、Cas9又はCpf1ヌクレアーゼをコードするポリヌクレオチドと、ガイドRNAをコードするポリヌクレオチドとは、単一の核酸配列に、例えば単一のプラスミドベクターに含まれていてもよい。或いは、各々Cas9/Cpf1ヌクレアーゼ及びガイドRNAをコードする複数の個別の核酸配列、例えば複数の個別のプラスミドベクターが、工程a)の細胞内に存在し(或いは工程a)の細胞内に送達され)てもよい。しかし、予め構築されたCas9タンパク質-ガイドRNAリボ核タンパク質複合体(RNP)が、本開示にて提供される製造方法の工程a)の細胞内に存在し(或いは工程a)の細胞内に送達され)てもよい。
【0057】
記述のように、Cas9ヌクレアーゼは、標的配列特異的crRNA分子及びtracrRNA分子を含むガイドRNAと組み合わされると、一本鎖又は二本鎖切断、好ましくは二本鎖切断を、所定の標的部位のDNAに導入する活性を有する。本発明の好ましい側面によれば、Cas9ヌクレアーゼ(例えばSpCas9)及びsgRNAをコードするプラスミドベクターが、工程a)の細胞内に存在する(或いは工程a)の細胞内に送達される)。本発明の他の好ましい側面によれば、Cas9ヌクレアーゼは細胞内で安定に発現される一方、sgRNAは細胞に対して、例えばsgRNAをコードするプラスミドベクターを介して送達される。
【0058】
本記載の前又は後に示すように、本開示にて提供される製造方法の工程a)の細胞は、使用された部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための認識部位を、前記のDSB又は一本鎖ニックの標的部位又はその近傍に含むことが好ましい。Cas9を部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用する場合、又は、Cpf1を部位特異的ヌクレアーゼとして使用する場合、所定の認識部位(即ちプロトスペーサー隣接モチーフ、PAM)は、前記のDSB又は一本鎖ニックの標的部位の直ぐ下流にあることが好ましい。本開示において、「前記のDSB又は一本鎖ニックのための標的部位」(target site for the DSB or single-strand nick)とは、前記のDSB又は一本鎖ニックが導入されるポリヌクレオチド内の位置のことである。種々のCRISPRヌクレアーゼ及びその変異体のPAM配列は、本技術分野では周知であり(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT(配列番号50)又は5’-NNGRR(N)(配列番号51)、St1Cas9の場合は5’-NNAGAAW(配列番号52)、Cpf1の場合は5’-TTN)、哺乳類のゲノムには豊富に存在する。従って、前記のCas9ヌクレアーゼ又はCpf1ヌクレアーゼを用いれば、PAM配列を人工的に導入することなく、殆どの遺伝子を標的化することができる。しかし、所期の野生型遺伝子内で、適用される部位特異的ヌクレアーゼ又はニッカーゼのためのPAM配列が、前記のDSB又は一本鎖ニックのための所望の標的部位の直ぐ下流に存在しない場合には、PAM配列を外部から導入してもよい。前記のDSB又は一本鎖ニックの標的部位の直ぐ下流に、所望のPAM配列の一部が既に存在している場合には、PAM配列の欠落しているヌクレオチドを外部から導入することにより(即ち、天然では所期の遺伝子内の所望の位置に存在しないPAM配列のヌクレオチドを外部から導入することにより)、完全PAM配列を生成することができる。
【0059】
c)で選択され、及び/又は、d)で提供される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体には、認識部位(例えばPAM配列が存在していてもいなくてもよい。例えば、前記のDSB又は一本鎖ニックの導入及び細胞修復、例えば HDR又はNHEJの際に、前記認識部位が除去されてもよい。特に、工程b)で提供されるドナー核酸テンプレートを、前記所期の遺伝子から前記認識部位を除去するように設計してもよい。例えば、前記のドナー核酸テンプレートは、前記所期の遺伝子内の前記認識部位に対応する位置の認識部位に対応する配列を、含んでいなくてもよい。従って、本発明の一側面によれば、前記認識部位は、工程c)で選択及び/又は濃縮される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体内に存在していなくてもよい。これにより、Cas9又はCpf1による繰り返しの切断を防止することができる。
【0060】
認識部位又はその部分の外部からの導入は、所期の遺伝子を前記細胞のゲノム内に導入する前に、前記認識部位又はその部分をその所期の遺伝子に導入することにより、達成することができる。所期の遺伝子が内因性タンパク質である場合には、本技術分野で公知の遺伝子工学的手法、特に相同組換えにより、外因性認識部位又はその部分を組み込んでもよい。
【0061】
本発明の好ましい側面によれば、工程a)の細胞は所期の遺伝子を含み、ここで、適用される部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための認識部位(例えばPAM配列)は、それぞれ前記のDSB又は一本鎖ニックのための標的部位の直ぐ下流又は上流に存在する。上述したように、本開示にて提供される方法では、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼが、Cas9であることが好ましい。更に、本開示にて提供される方法では、工程a)の細胞が、前記Cas9ヌクレアーゼを前記認識部位(例えば前記PAM配列)に対して標的化するsgRNA又はdgRNAを発現することがより好ましい。例えば、PAM部位は、所望の切断部位(例えば前記のDSB又は一本鎖ニックのための所望の部位)の1~100bp下流又は上流とすることができる。
【0062】
上に示すように、ZRN、TALEN、又はmegaTALエンドヌクレアーゼを部位特異的ヌクレアーゼ/ニッカーゼとして使用する場合には、所与の配列に応じて特異的なヌクレアーゼをカスタマイズする必要がある。TALENは、所定の程度の特異性を達成するために、標的特異的なDNA配列、例えば12塩基の配列に合わせて、カスタム設計することが可能である。TALENは、各々特定の塩基を認識する複数のタンパク質モジュールから構成される。例えば、12塩基のDNA配列を認識するには、各々が正確に塩基を認識する12のタンパク質モジュールを融合しなければならない。配列に応じた正しいTALENの設計は、従来技術により定型的に実施することができ、例えばオンラインツールを使用して実施可能である。更に、TALENによる設計及び標的化のための指針は、インターネット上で、例えばTALENターゲッターチュートリアル (TALEN targeter tutorial: https://tale-nt.cac.cornell.edu/tutorials/talentargeterupdated及びhttp://www.e-talen.org/E-TALEN/designtalens.html)等に掲載されている。更に、DNA標的化用のTALENや他のTALエフェクター系コンストラクトのカスタム設計及び組立は、科学文献、例えばCermak, 2011, Nucleic Acids Res. 39(12): e82等に掲載されている。
【0063】
本開示にて提供される生成方法の工程a)におけるDSBは、前記所期のタンパク質をコードする遺伝子の二本鎖の各々に、2つの一本鎖ニックにより誘導(即ち導入)されてもよい。前記の2つの一本鎖ニックは、同一のニッカーゼにより導入されてもよく、2つの異なるニッカーゼにより導入されてもよい。従って、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーは、2つの認識部位(例えばPAM配列)を含んでいてもよい。両方の一本鎖ニックに同一のニッカーゼを使用する場合には、両者の認識部位は同一であってもよい。両方の一本鎖ニックに2つの異なるニッカーゼを用いる場合には、両者の認識部位は互いに異なっていてもよい。前記第一及び/又は第二のニッカーゼとしては、例えば部位特異的ニック形成活性を有するCas9ヌクレアーゼであってもよい。例えばCas9ヌクレアーゼを用いることで、単一の酵素を用いて2つのニックを導入することが可能となる。これは、酵素をそれぞれの認識部位へと標的化するよう媒介する2つの異なるガイドRNA(例えば2つの異なるsgRNA)を提供することで達成できる。Cas9ヌクレアーゼの場合、2つの異なるsgRNAにより、Cas9ヌクレアーゼを2つの異なる標的部位に標的化することができる。ここで、所望のDSBを導入するのに、少なくとも1つのPAM配列を用いてもよい(例えばTsai, Shengdar Q., and J. Keith Joung. "Defining and improving the genome-wide specificities of CRISPR-Cas9 nucleases." Nature Reviews Genetics 17.5 (2016): 300-312参照)。Cas9ヌクレアーゼ及び/又は2つのガイドRNA(例えば2つの異なるsgRNA)は、それぞれ個別のプラスミドから発現されてもよいが、同一のプラスミドから発現されることが好ましい。ニック形成活性を有するCas9ヌクレアーゼのための認識部位として機能するPAM配列は、本技術分野では公知である。例えば、Cas9n(Cas9のD10A変異体)のPAM配列は5’-NGGである。
【0064】
ゲノムDNA内にDSB又は一本鎖ニックが存在することで、細胞内修復機構が作動する。典型的には、一本鎖ニックが存在し、修復テンプレートが利用可能であれば、斯かる切断部は相同標的化修復(HDR)により、特に相同組換えにより修復される。一方、二本鎖切断は通常は非相同末端連結(NHEJ)又はHDRにより修復される。なお、一本鎖ニックの場合にもNHEJによる修復は生じうるが、その頻度はHDRによるものよりも遙かに低い。一般的に、一本鎖又は二本鎖切断の導入後、ドナー核酸テンプレートが存在すればHDRが誘導される。例えばHeidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44; Cong, 2013, Science, 339: 819-23; Doudna, 2014, Science, 346: 1258096; Hsu, 2014,Cell 157: 1262-78参照。HDRにより、突然変異誘発標的部位における所望の配列の正確な挿入、欠失又は置換を含む、精密なゲノム編集が可能となる。これに対して、NHEJによる修復によれば、任意の種類のランダムな欠失又は挿入が導入されることから、「INDEL突然変異」とも呼ばれる。斯かるINDEL突然変異により挿入されるヌクレオチドの数や種類は制御困難である。なお、INDEL突然変異は1又は2以上のヌクレオチド挿入の及び/又は欠失二限定されるため、所期のタンパク質に対してHDRと同程度の多様化を達成することはできない。従って、本発明の優先される側面によれば、前記のDSB又は一本鎖ニックは、少なくとも優先的にHDRにより修復されることが想定される。これは、ドナー核酸テンプレートのライブラリーを細胞に供することで達成される。従って、本発明の方法では、NHEJによるHDRの導入を抑制(即ち防止)する必要はない。実際に、前記所期のタンパク質の突然変異体を更に多様化するには、所定の割合のNHEJが存在することが望ましい。
【0065】
本発明の方法が工程b)を有するか否かとは独立に、NHEJは所期のタンパク質の多様化に寄与する場合がある。工程a)において所期の遺伝子の単一のコピーに含まれる不活性化突然変異がNHEJにより除去される場合、工程c)において斯かる前記所期のタンパク質の突然変異体を発現する細胞を選択してもよく、惹いては斯かる細胞が工程d)により提供される細胞のパネルの一部を構成してもよい。従って、本発明の一側面によれば、工程d)により提供される細胞のパネルは更に、NHEJにより前記のDSB又は一本鎖ニックの修復が生じた細胞を含んでいてもよい。NHEJにより前記のDSB又は一本鎖ニックの修復が生じた細胞は、不活性化突然変異を除去した少なくとも1つのランダムな突然変異を含んでいてもよい。ここで前記ランダムな突然変異は、工程a)で前記のDSB又は一本鎖ニックが導入された位置に直接隣接する位置に、1又は2以上のヌクレオチドの挿入及び/又は欠失を含むことが好ましい。上述したように、斯かるランダムな突然変異は、INDEL突然変異とも呼ばれる。
【0066】
所望の場合には、工程a)及びb)において、NHEJに対する相同組換えの比率が上昇するような条件下で細胞を培養してもよい。前記条件としては、例えば、NHEJに関与する酵素の阻害又は不活性化、NHEJを阻害するタンパク質の発現、NHEJを阻害する物質の添加、複製フォーク信仰の遅延化、及び/又は、細胞周期のG2/M期での停止誘発等が挙げられる(例えばWu, 2005, Proceedings of the National Academy of Sciences of the United States of America 102.7: 2508-2513参照)。NHEJに関与すると考えられ、抑制対象となる酵素としては、KU70及び/又はDNAリガーゼIVが挙げられる。NHEJを抑制するタンパク質としては、例えばE1B55K及びE4orf6からなるタンパク質複合体、又はこれらを含むタンパク質複合体が挙げられる。NHEJを阻害する物質としては、例えばScr7-ピラジン、ESCR7、L755507、ブレフェルジンA及びL189(CAS64232-83-3)からなる群より選択される物質が挙げられる(例えばYu, 2015, Cell stem cell 16.2: 142-147又はhttp://www.tocris.com/pdfs/5342.pdf参照)。斯かる培養条件ゆえに、NHEJに対する相同組換えの比率は、例えば少なくとも1倍、好ましくは少なくとも3倍、最も好ましくは少なくとも15倍に増加する。NHEJを媒介する酵素、例えばDNAリガーゼIVやKU70等は、適切な細胞系列内で完全にノックアウトされ、或いは対応するタンパク質の変異体で置換されうる。不安定化アミノ酸配列がN-又はC-末端に融合された、安定化薬物によって斯かる酵素を機能的に維持する一方、斯かる薬物を除去すれば、タンパク質は迅速に分解される。例えば Egeler, 2011, Journal of Biol Chemistry 286: 31328-31336を参照。続いて、NHEJの酵素が分解により一過的に除去されるような条件下で、本願のタンパク質多様化プロトコールを用いればよい。タンパク質の多様化の後、再度リガンドを加えることで、新たに発現されるNHEJを媒介する酵素を安定化してもよい。
【0067】
本開示にて提供される製造方法の工程b)では、ドナー核酸テンプレートのライブラリーを細胞に供する。前記のドナー核酸テンプレートが、所期のタンパク質をコードする遺伝子内の不活性化突然変異を除去する。従って、前記核酸テンプレートは不活性化突然変異を除去するように設計される。換言すれば、前記ドナー核酸テンプレートの核酸配列は、供給されたドナー核酸テンプレートを用いた前記のDSB又は一本鎖ニックのHDR(特に相同組換え)により、所期のタンパク質をコードする遺伝子内の不活性化突然変異が除去されるように設計される。
【0068】
前記の複数の異なるドナー核酸テンプレートは、二本鎖DNA分子を含んでいてもよく、二本鎖DNA分子であってもよい。例えば、前記複数の異なるドナー核酸テンプレートは、ベクター、例えばプラスミドベクター内に含まれていてもよい。この場合、前記複数の異なるドナー核酸テンプレートは、各々個別のベクターに含まれていてもよい。或いは、前記複数の異なるドナー核酸テンプレートは、一本鎖オリゴヌクレオチドを含んでいてもよく、一本鎖オリゴヌクレオチドであってもよい。例えば、前記一本鎖オリゴヌクレオチドは、ロックド核酸(LNA)及び/又はホスホロチオエート修飾を含んでいてもよい。
【0069】
「ロックド核酸」(locked nucleic acid)又は「LNA」という語は、本技術分野では周知である。LNAは、リボース部分が2'酸素と4'炭素とを連結する余剰の架橋により修飾されたヌクレオチドである。A型二重鎖にしばしば見られるように、この架橋がリボースを3'-エンド(North)立体構造で「ロック」しているのである。ロックされた立体構造により、オリゴヌクレオチドのハイブリダイゼーション特性、標的特異性、及びヌクレアーゼに対する抵抗性が向上する。
【0070】
「ホスホロチオエート修飾」(phosphorothioate modification)という語は、当業者には周知であるが、ホスホロチオエート結合によって、オリゴヌクレオチドのリン酸骨格中の非架橋酸素が硫黄原子で置換された構造を意味する。この修飾により、ヌクレオチド間の結合がヌクレアーゼ分解に対して抵抗性を有することになる。
【0071】
前記複数の異なるドナー核酸テンプレートは各々、突然変異誘発標的部位の両側に存在する領域に対して相同な相同核酸配列を含む。これらの相同核酸配列は、前記の所望の突然変異をコードする領域を挟み込んでいる。例えば、ドナー核酸テンプレートがプラスミドに含まれる場合には、相同配列の長さは例えば少なくとも800ヌクレオチド(即ち、所望の突然変異の両側に各々少なくとも400ヌクレオチド)、好ましくは少なくとも1600(即ち、所望の突然変異の両側に各々少なくとも800ヌクレオチド)、最も好ましくは少なくとも2000ヌクレオチド(即ち、所望の突然変異の両側に各々少なくとも1000ヌクレオチド)である。ドナー核酸テンプレートがssODNの場合、相同配列の長さは例えば約40ヌクレオチド(即ち、所望の突然変異の両側に各々20ヌクレオチド)~約200ヌクレオチド(即ち、所望の突然変異の両側に各々100)、好ましくは約60ヌクレオチド(即ち、所望の突然変異の両側に各々30ヌクレオチド)~約120ヌクレオチド(即ち、所望の突然変異の両側に各々60ヌクレオチド)、最も好ましくは約80ヌクレオチド(即ち、所望の突然変異の両側に各々40ヌクレオチド)~約100ヌクレオチド(即ち、所望の突然変異の両側に各々50ヌクレオチド)である。従って、前記複数の異なるドナー核酸テンプレートは各々、前記突然変異誘発標的部位に対応する位置の上流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第一の相同核酸配列を含んでいてもよい。或いは更に、前記突然変異誘発標的部位に対応する位置の下流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第二の相同核酸配列を含んでいてもよい。
【0072】
前記第一の相同核酸配列は、前記突然変異誘発標的部位に対応する位置のすぐ上流に存在してもよく、又は、前記突然変異誘発標的部位に対応する位置のすぐ上流から10核酸以内に存在してもよい。同様に、前記第二の相同核酸配列は、前記突然変異誘発標的部位に対応する位置のすぐ下流に存在してもよく、又は、前記突然変異誘発標的部位に対応する位置のすぐ下流から10核酸以内に存在してもよい。
【0073】
ドナー核酸テンプレート内の相同配列は、突然変異誘発標的部位を挟み込む領域に対して、例えば少なくとも80%の配列同一性、好ましくは少なくとも95%の配列同一性、最も好ましくは少なくとも99%の同一性を有していてもよい。
【0074】
上述したように、本発明によれば、前記のドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に、複数の異なる突然変異を含んでいてもよい。特に、各ドナー核酸テンプレートは、所期のタンパク質内(の前記突然変異誘発標的部位)に生成するべき所望の突然変異を含んでいてもよい。前記突然変異誘発標的部位に対応する位置における、前記の複数の異なる突然変異は、1又は2以上のヌクレオチドの置換、欠失、又は挿入である。即ち、野生型(即ち非改変)の所期のタンパク質をコードするヌクレオチド配列と比較して、1又は2以上のヌクレオチドの置換、欠失、又は挿入である。例えば、所期のタンパク質に対して内因性のヌクレオチドと、変異されたヌクレオチドとの組み合わせにより、前記の突然変異誘発標的部位結果に異なるアミノ酸配列が形成されうる。或いは、前記の突然変異誘発標的部位に新たに挿入されたヌクレオチドが、野生型(即ち非改変)の所期のタンパク質の対応する位置に存在するアミノ酸残基と比較して、異なる1又は2以上のアミノ酸残基をコードしてもよい。
【0075】
本発明において、前記ドナー核酸テンプレートは、HDR、特に相同組換えにより、(所期のタンパク質をコードする遺伝子の)不活性化突然変異を除去する。斯かるドナー核酸テンプレート内で、前記不活性化突然変異を除去する核酸配列は、例えば所期のタンパク質をコードする遺伝子に対応する野生型配列であってもよく、及び/又は、所期のタンパク質をコードする遺伝子内のフレームシフト突然変異を除去する配列であってもよい。
【0076】
典型的には、本開示にて提供される方法では、相同性アームによって挟まれ、プログラムされた多様性を含む、ドナー核酸テンプレートの1バッチが使用される。通常は、全てのドナー核酸テンプレートが1バッチで合成され、これらは同一の相同性アームを共有するが、数百万の異なるドナー分子を構成する。特に、「ドナー核酸配列」(donor nucleic acid sequences)が異なるゆえに、斯かるドナー核酸テンプレートのライブラリーは、少なくとも2、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも100、少なくとも1000、少なくとも10000、又は少なくとも1000000の異なるドナー核酸テンプレートを含む。従って、本発明の一側面は、本開示にて提供される方法であって、複数の異なるドナー核酸テンプレートのライブラリーが、少なくとも2つの異なるドナー核酸テンプレート、好ましくは少なくとも5の異なるドナー核酸テンプレート、より好ましくは少なくとも10の異なるドナー核酸テンプレート、更に好ましくは少なくとも15の異なるドナー核酸テンプレート、更に好ましくは少なくとも20の異なるドナー核酸テンプレート、更に好ましくは少なくとも100の異なるドナー核酸テンプレート、更に好ましくは少なくとも1000の異なるドナー核酸テンプレート、更に好ましくは少なくとも10000の異なるドナー核酸テンプレート、又は更に好ましくは少なくとも1000000の異なるドナー核酸テンプレートを含む方法に関する。上述したように、斯かるドナー核酸テンプレートは、複数の異なる突然変異を含む。1つのドナー核酸分子当たり1つの突然変異を含むことが好ましい。各ドナー核酸テンプレート内の「突然変異」(mutation)は、所期の遺伝子内の対応する配列と比較して異なるヌクレオチド又はヌクレオチド配列である。各ドナー核酸テンプレート内の「突然変異」は、別名「多様化配列」とも呼ばれる。前記の「突然変異」又は「多様化配列」により、所期のタンパク質内に、1又は2以上のアミノ酸置換、置き換え、及び/又は挿入が生じることが好ましい。前記の多様化配列は、1又は2以上の具体的なアミノ酸をコードしていてもよく、及び/又は、縮重コドンを含んでいてもよい。多様化配列の縮重コードとしては、例えばNNN、NNK/NNS、NNB、及び/又は、MAX系が挙げられる。本技術分野で公知のように、Nは、DNAの何れかのヌクレオチド、即ちアデニン(A)、グアニン(G)、シトシン(C)、又はチミン(T)を表す。Bは、アデニン以外の何れかのヌクレオチドを表す。従って、縮重コードNNBは、停止コドン(即ちTAA、TGA)を導入する可能性を低下させる。本技術分野で公知のように、縮重コードにおいて、Kは、アデニン(A)又はシトシン(C)以外、即ち、グアニン(G)又はチミン(T)を表す。Sは、アデニン(A)又はチミン(T)以外、即ち、シトシン(C)又はグアニン(G)を表す。MAX系も本技術分野では公知であり、例えばHughes, 2003, J. Mol. Biol. 331: 973-979に記載されている。この系では、標的化された各部位で、最大20のプライマーが(1アミノ酸アミノ酸当たり1つずつ)生成される。これらは十分にランダム化されたテンプレート(標的化された残基のNNN)にアニールされ、連結されてバイアスのないライブラリーが形成される。
【0077】
前記のドナー核酸テンプレートは、特定の(1又は2以上の)アミノ酸を、変化させないまま維持すると共に、隣接するアミノ酸(即ち変化しないアミノ酸の両側にあるアミノ酸)が改変されるように設計されてもよい。従って、ドナー核酸テンプレート内の縮重コドンが、所期のタンパク質の元のアミノ酸配列由来の(1又は2以上の)アミノ酸で中断されていてもよい。例えば、突然変異誘発標的部位内の一部のアミノ酸のみが重要と考えられる場合には、これらは多様化すべきではない。
【0078】
前記の複数の異なるドナー核酸テンプレートのライブラリーは、前記突然変異誘発標的部位に対応する位置に含まれる突然変異が異なる複数のドナー核酸テンプレートを含む。例えば、斯かる複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置でコードされるアミノ酸が異なっていてもよい。或いは、斯かる複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置でコードされる複数の異なるアミノ酸の量が異なっていてもよい。例えば、複数の異なるドナー核酸テンプレートのライブラリー内において、一部のドナー核酸テンプレートが前記突然変異誘発標的部位に対応する位置で1アミノ酸をコードし、他のテンプレートが前記突然変異誘発標的部位に対応する位置で少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、及び/又は、少なくとも12のアミノ酸(例えば3~5のアミノ酸)をコードしてもよい。
【0079】
例えば、不活性化された所期の遺伝子(即ち、不活性化突然変異を含む所期の遺伝子)内において、少なくとも1つのアミノ酸のコドンが欠失していてもよい。この場合、ドナー核酸テンプレートは、欠失されるアミノ酸を置換し、フレームシフトを除去し、置換されたアミノ酸に隣接する少なくとも1つのアミノ酸(例えば1又は2アミノ酸)をランダム化するように設計される。
【0080】
本開示にて提供される製造方法では、工程b)は工程a)の前に実施してもよいが、工程a)と同時に実施することが好ましい。工程a)とb)を同時に実施する場合、前記の部位特異的ヌクレアーゼ又はニッカーゼが、同時にドナー核酸テンプレートの一部を切断してしまってもよい。これにより、本発明の方法が顕著に妨害されることはない。しかし、所望の場合には、斯かるドナー核酸テンプレートの切断を、当業者に周知の幾つかの方法により防止することができる。例えば前記ドナー核酸テンプレートが、例えばプラスミドに含まれた、二本鎖DNA(dsDNA)である場合、サイレント突然変異又は少なくとも中立突然変異を、前記ドナー核酸テンプレートのPAM配列内に導入すればよい。前記ドナー核酸テンプレートがssODNである場合、例えばsgRNA配列と対応するssODN配列とを同一の鎖に配置することで、ssODNの切断を防止することができる。
【0081】
本発明の工程a)の製造方法において、DSB又は一本鎖ニックは、所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)内の突然変異誘発標的部位又はその近傍に導入される。この場合、細胞はそのゲノム内に、所期の遺伝子の不活性化されたコピーを一つのみ(即ち、所期の遺伝子の不活性化されたアレルを一つのみ)含む。具体的に、前記所期の遺伝子の単一のコピーは、アミノ酸配列を多様化すべき(特に突然変異を誘発すべき)突然変異誘発標的部位又はその近傍に、少なくとも1つの不活性化突然変異を含むことにより不活性化されてなる。
【0082】
従って、所期のタンパク質をコードする遺伝子の単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。前記の不活性化突然変異は、前記のDSB又は一本鎖ニックが導入される位置又はその近傍に存在していてもよい。例えば、選択(又は導入)されたPAM部位の1~21ヌクレオチド(1~7アミノ酸に相当する)下流の4塩基対を除去することで、1アミノ酸を除去すると共にフレームシフトを生じさせてもよい。
【0083】
不活性化突然変異を含む遺伝子は、不活性化された遺伝子、又は、突然変異により不活性化された遺伝子とも呼ばれる。従って、所期の遺伝子に含まれる不活性化突然変異は、対応するタンパク質の発現を少なくとも抑制し、又はより好ましくは防止する遺伝子の核酸配列内の、何らかの改変/修飾であることが好ましい。換言すれば、前記不活性化突然変異は、不活性化突然変異を有さない対応する野生型遺伝子によりコードされるタンパク質と比較して、所期のタンパク質の発現を少なくとも抑制し、又はより好ましくは防止するものであってもよい。前記不活性化突然変異は、対応する野生型タンパク質と比較して、より活性の低いタンパク質を発現させるものであってもよい。換言すれば、不活性化された所期の遺伝子(即ち、不活性化突然変異を有する所期の遺伝子によりコードされる所期のタンパク質)から発現されるタンパク質は、前記野生型の所期のタンパク質(即ち、不活性化突然変異のない所期の遺伝子によりコードされるタンパク質)と比較して、より活性が低いものであってもよい。例えば、斯かるより低活性のタンパク質の活性は、対応する野生型の所期のタンパク質の活性と比較して、70%以下、好ましくは50%以下、より好ましくは30%以下、更に好ましくは10%以下、最も好ましくは0%である。斯かるより低活性のタンパク質は、対応する野生型タンパク質と比較して、例えば酵素活性(所期のタンパク質が酵素の場合)がより低く、又は、特定のエピトープに対する結合活性(所期のタンパク質が抗体の場合)がより低い。所期のタンパク質が蛍光タンパク質である場合、斯かるより低活性のタンパク質は、例えば蛍光がより低い(或いは、好ましくは蛍光を有さない)。しかし、所期のタンパク質は、酵素、抗体、及び蛍光タンパク質に限定されるものではない。従って、所期のタンパク質によっては、斯かるより低活性のタンパク質は、例えば、親和性物質又は分子構造(例えばDNA、RNA、タンパク質、又はペプチド)に対する結合親和性がより低く、インビボで観察される化学反応(例えば呈色反応)の誘導活性がより低く、或いは、薬物及び/又は抗生物質への抵抗性がより低い。
【0084】
本発明において、前記不活性化突然変異により生じる所期のタンパク質の活性低下を、工程c)において、相同組換えにより前記不活性化突然変異が除去された細胞の選択及び/又は濃縮に使用することもできる。斯かる例では、前記不活性化突然変異が蛍光活性の低下を生じる場合、蛍光を発する細胞(及び/又は、強い蛍光を発する細胞)を、工程c)で選択及び/又は濃縮すればよい。即ち、蛍光活性化細胞分別(fluorescence-activated cell sorting:FACS)技術を用いることができる。斯かるFACS技術を実施するための非限定的な例は、後述の実施例に記載されている。
【0085】
不活性化突然変異の例は、所期のタンパク質をコードする遺伝子内にフレームシフトを生じさせる突然変異(即ち、所期の遺伝子のリーディングフレームの改変を生じさせる突然変異)、前記所期のタンパク質をコードする遺伝子内に未成熟停止コドンを導入し、又は、前記所期のタンパク質をコードする遺伝子内に突然変異を導入し、これにより不活性化アミノ酸置換を生じさせる突然変異を含む。前記の不活性化アミノ酸置換は、対応するタンパク質の活性(例えば酵素活性又は結合活性)を抑制又は防止するものであってもよく、或いは対応するタンパク質の発現を好ましくは抑制し、又はより好ましくは防止するものであってもよい。最も好ましい前記不活性化突然変異は、所期のタンパク質をコードする遺伝子(即ちヌクレオチド配列)内のフレームシフト突然変異である。
【0086】
分子的観点からは、不活性化突然変異は、例えば塩基対の置換、1又は2以上のヌクレオチドの挿入、或いは、1又は2以上のヌクレオチドの欠失であってもよい。例えば、前記不活性化突然変異は、塩基対置換、塩基対挿入、塩基対欠失、停止コドン、又は不活性化アミノ酸置換であってもよく、これらを含んでいてもよい。前記の不活性化アミノ酸置換は、例えば正しく折り畳まれないタンパク質及び/又は触媒的に不活性なタンパク質を生じさせるものであってもよい。当業者であれば、上記の何れかの種類の不活性化突然変異を達成するのに、どのような突然変異が必要であるかを理解するであろう。
【0087】
上述したように、所期のタンパク質をコードする遺伝子の単一のコピー内の前記不活性化突然変異は、前記突然変異誘発標的部位又はその近傍に存在する。本明細書で使用する場合、「突然変異誘発標的部位の近傍」(close proximity to the target site for mutanogenesis)という語は、前記突然変異誘発標的部位に所望の突然変異を導入し、不活性化突然変異を除去するようなドナー核酸テンプレートの設計を可能とする、突然変異誘発標的部位に対する距離を意味する。従って、「突然変異誘発標的部位近傍」という語は、例えば100ヌクレオチド以下、好ましくは80ヌクレオチド以下、より好ましくは60ヌクレオチド以下、更に好ましくは40ヌクレオチド以下、更に好ましくは30ヌクレオチド以下、最も好ましくは10ヌクレオチド以下の距離を意味する。なお、前記不活性化突然変異は、ちょうど前記突然変異誘発標的部位に存在していてもよい。
【0088】
本発明において、前記不活性化突然変異は、所期のタンパク質の選択可能な活性(例えば蛍光活性)を防止するものであってもよい。この場合、本開示にて提供される製造方法の工程c)は、前記選択可能な活性(例えば蛍光活性)を有する細胞の選択及び/又は濃縮であってもよく、又はこれらを含んでいてもよい。中でも、前記不活性化突然変異は、所期のタンパク質の発現を防止するものであることが好ましい。この場合、所期のタンパク質の発現は、不活性化突然変異の首尾よき除去を示すものであり、惹いては有利なことには、所期のタンパク質の首尾よき突然変異誘発を示すものである。この場合、本開示にて提供される製造方法の工程c)は、前記所期のタンパク質を発現する細胞の選択及び/又は濃縮であってもよく、これらを含んでいてもよい。前記所期のタンパク質が直接選択可能でない(即ち、例えば蛍光等の固有の特性により選択可能でない)場合、所期のタンパク質を発現する細胞は、前記所期のタンパク質に特異的に結合する抗体を用いることにより、選択及び/又は濃縮されてもよい。
【0089】
例えばFACSと、所期のタンパク質に特異的に結合する抗体とを用いて、所期のタンパク質を発現する細胞を選択及び/又は濃縮してもよい。斯かる方法は、所期のタンパク質が細胞表面に提示される場合には、とりわけ有用である。これは、市販のベクター、例えばpDisplay等を用いることにより、達成することが可能である。特に、細胞ゲノム内への単一のコピー数の挿入前に、前記所期のタンパク質の突然変異体を細胞表面に送達する標的化配列を、所期のタンパク質をコードする遺伝子カセットにそのまま加えることができる。斯かる技術は非常に強力な手法であり、細胞、例えば哺乳類細胞、例えばHEK293細胞の表面における、タンパク質(例えばFab断片、単一鎖抗体、又は全IgG)の機能的提示を、効率的に達成することを可能とする。効率的な提示及びスクリーニングのためのプロトコールは、本技術分野では既に標準的となっており、例えばHo, 2008, Methods in Molecular Biology, 525: pp 337-352; and Zhou, 2012, Methods in Molecular Biology, 907: 293-302によって提供される。
【0090】
或いは、所期のタンパク質が抗体等の結合分子である場合、前記所期のタンパク質を発現する細胞の突然変異体を、例えばパニングアプローチにより同定することができる。この目的のためには、特異的な表面に所望の抗原を結合させればよい。抗体ライブラリーを細胞表面に発現する細胞を、この表面上でインキュベートする。有効な抗体を発現する細胞が、この表面に結合する。非結合細胞を洗い流した後、加える可溶性抗原の量を増加させると共に、更なる洗浄によりストリンジェンシーを上昇させてもよい。何ラウンドかの洗浄の後、表面に結合して残存する細胞を、何らかの適切な方法、例えばトリプシン処理等で収穫して回収すればよい。
【0091】
或いは、斯かるパニングアプローチを逆転させ、抗体を表面に吸着させて、所期のタンパク質を細胞の表面に提示させてもよい。このパニングは、細胞の濃縮に使用することができる。
【0092】
また、免疫タグ、例えばmycエピトープ又はHAタグ等を、(蛍光タンパク質又は薬物抵抗性タンパク質の代わりに、或いはこれらに加えて)選択可能マーカーとして用い、所期のタンパク質と融合させた融合タンパク質を形成してもよい。
【0093】
(例えば、所期のタンパク質が蛍光タンパク質である場合には)所期のタンパク質は単量体であることが望ましい。惹いては、発現される所期のタンパク質の二量体又は多量体形成を防止するように、所期の遺伝子を改変してもよい。
【0094】
或いは、所期のタンパク質をコードする遺伝子が、前記細胞のゲノム内に融合遺伝子として存在していてもよく、ここで前記融合遺伝子が、所期のタンパク質をコードする遺伝子の下流に、マーカー遺伝子を含んでいてもよい。マーカー遺伝子(別名「選択可能マーカー遺伝子」(selectable marker gene))とは、人工的な選択に適した特性を付与する遺伝子である。斯かるマーカー遺伝子は、マーカー(別名「マーカータンパク質」(marker protein))をコードする。「陽性マーカー」とは、宿主生物に対して選択的な利点を付与する選択可能マーカー、或いは、その固有の特性(例えば蛍光等)に基づき選択可能な選択可能マーカーである。「陰性マーカー」(negative marker)(別名「反選択可能マーカー」(counter-selectable marker))とは、選択対象ではない宿主生物の成長を阻害又は抑制する選択可能マーカーである。
【0095】
上述の融合遺伝子において、マーカー遺伝子と所期のタンパク質をコードする遺伝子とはインフレームで存在する。特に、融合遺伝子においては、所期のタンパク質及びマーカー遺伝子のコーディング配列は、互いに作動式に融合され、単一のmRNA分子として発現されて、対応する融合タンパク質の発現を可能とするように構成される。前記の融合タンパク質は、互いに作動式に連結/融合された所期のタンパク質及びマーカータンパク質を含む。特に、前記融合タンパク質は、所期のタンパク質を含むと共に、そのC末端にマーカータンパク質を含む。
【0096】
本発明では、前記融合遺伝子に含まれる所期のタンパク質内の前記不活性化突然変異は、マーカー遺伝子の発現をも防止することが好ましい。この場合、前記不活性化突然変異が除去され、それにより所期のタンパク質の多様化が生じた細胞は、マーカー遺伝子を発現する細胞を選択及び/又は濃縮することによって、容易に選択することができる。従って、本開示にて提供される製造方法の一側面によれば、工程c)が、マーカー遺伝子によりコードされるタンパク質を発現する細胞の選択及び/又は濃縮であるか、或いはこれらを含む。好ましくは、マーカー遺伝子によりコードされるタンパク質の発現は、直接選択である(即ち、その固有の特性、例えばその蛍光に基づき選択可能である)。例えば、マーカー遺伝子によりコードされるタンパク質は、蛍光タンパク質であってもよい。この場合、工程c)の選択及び/又は濃縮は、斯かる蛍光タンパク質を発現する細胞の単離を含むことが好ましい。細胞の集団を選択的に単離するための方法としては、幾つかの方法が本技術分野で公知である。例えば、細胞の単離は、FACS又はマイクロ流体細胞選別で達成することができるところ、これらを使用してもよい。所望の(例えばマーカー遺伝子が蛍光タンパク質をコードする場合)、マーカータンパク質(例えばマーカー遺伝子によりコードされるタンパク質)は単量体であることが望ましい。従って、上述したように、発現されるマーカータンパク質の二量体又は多量体形成を防止するように、マーカー遺伝子を改変してもよい。
【0097】
上述の融合遺伝子(即ち、所期のタンパク質をコードする遺伝子とマーカー遺伝子とを含む融合遺伝子)を発現する細胞の選択及び/又は濃縮は、蛍光による選別以外の機構によっても達成される。例えば、マーカー遺伝子によりコードされるタンパク質の発現は、薬物抵抗性を付与するものであってもよく、抗生物質抵抗性を付与するものであってもよく、栄養要求性を補完するものであってもよく、検出可能な酵素活性を付与するものであってもよく、又は免疫エピトープであってもよい。工程c)において、前記不活性化突然変異が除去された細胞を選択及び/又は濃縮するのに、マーカータンパク質のこれらの特性を用いてもよい。
【0098】
例えば、マーカー遺伝子によりコードされ、酵素活性を付与するタンパク質としては、例えばβ-ラクタマーゼ、又はプロテアーゼ、例えばエンテロキナーゼ、又はTEV等が挙げられる。薬物(例えば抗生物質)や、斯かる薬物に対する抵抗性を付与するタンパク質をコードする遺伝子は、種々知られている。例えば、ピューロマイシンは、翻訳時にペプチドのリボソームへの移送を妨害し、未成熟鎖終了を生じさせることにより、タンパク質合成を阻害する。ピューロマイシンN-アセチル-トランスフェラーゼをコードするpac遺伝子は、ピューロマイシン抵抗性遺伝子である。ハイグロマイシンBはアミノグリコシド抗生物質であって、転座を妨害し、80Sリボソームの誤訳を促進することにより、タンパク質合成を阻害する。アミノシクリトールホスホトランスフェラーゼをコードするhyg遺伝子は、ハイグロマイシンBに対する抵抗性を付与する。ゼオシンは、DNA内に侵入して切断することにより、細胞死を生じさせる。Sh ble遺伝子産物はゼオシンに結合し、ゼオシンのDNAへの結合を防止することで、抵抗性を付与する。ブラストサイジンは原核細胞及び真核細胞の何れにおいても翻訳阻害剤である。ブラストサイジンに対する抵抗性は、bsd遺伝子産物により付与される。G-418は、80Sリボソームの機能に干渉し、真核細胞でのタンパク質合成を阻害する。neor遺伝子はG-418に対する抵抗性を付与する。マーカー遺伝子によりコードされるタンパク質が、薬物抵抗性若しくは抗生物質抵抗性を付与し、又は栄養要求性を補完する場合、工程c)の選択及び/又は濃縮は、細胞を選択的な条件下で培養することを含むことが好ましい。
【0099】
本発明では、所期のタンパク質の発現は、陰性選択可能であってもよい。換言すれば、非マーカー遺伝子によりコードされるタンパク質の発現が、所期のタンパク質の発現を示すものであってもよい。即ち、マーカー遺伝子によりコードされるタンパク質が、前記不活性化突然変異の存在下で発現されてもよく、前記不活性化突然変異が除去された細胞では、マーカー遺伝子が発現されなくてもよい。本開示において「発現されない」(not expressed)とは、タンパク質がインフレームで発現されないことを含む概念である。従って、本開示では、マーカー遺伝子のリーディングフレームとは異なるリーディングフレームが転写される場合には、マーカー遺伝子は発現されないものと見做される。従って、本発明の一側面は、本開示にて提供される製造方法において、前記所期のタンパク質をコードする遺伝子内に前記不活性化突然変異が存在すると、マーカー遺伝子によりコードされるタンパク質が発現されると共に、前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞では、前記マーカー遺伝子が発現されない、又はインフレームでは発現されないことを含む方法に関する。この場合、本開示にて提供される製造方法の工程c)は、マーカー遺伝子によりコードされるタンパク質を発現しない細胞の選択及び/又は濃縮であるか、これを含むことが好ましい。マーカー遺伝子によりコードされるタンパク質が発現されない場合に所期のタンパク質の発現を達成するための系として、本技術分野で公知のものは少数であるが存在する。例えば、マーカー遺伝子によりコードされるタンパク質は、チミジンキナーゼ(HSVtk)であってもよい。このタンパク質は、哺乳類細胞では条件付き致死マーカーとして機能する。ガンシクロビル等の特定のヌクレオシド類似物をリン酸化して、毒性DNA複製阻害剤に転換するからである。
【0100】
上述の融合遺伝子(即ち、所期のタンパク質をコードする遺伝子とマーカー遺伝子とを含む融合遺伝子)は、前記所期のタンパク質をコードする遺伝子と前記マーカー遺伝子との間に、リンカー核酸配列を含んでいてもよい。前記のリンカー核酸配列は、自己開裂ペプチドをコードする核酸配列であってもよく、当該配列を含んでいてもよい。自己開裂ペプチドとしては幾つかのものが本技術分野で周知である。例えば、自己開裂ペプチドは、T2Aペプチド、P2Aペプチド、E2Aペプチド、及びF2Aペプチドからなる群より選択されるものであってもよい。2Aペプチドのアミノ酸配列、特にT2A、P2A、E2A、及びF2Aのアミノ酸配列を本開示において配列番号1~4として示す。
【0101】
また、リンカー核酸配列は、部位特異的プロテアーゼの標的部位をコードする核酸配列であってもよく、当該配列を含んでいてもよい。例えば、前記部位特異的プロテアーゼの標的部位は、例えば配列番号5に示すアミノ酸配列を有するTEVプロテアーゼの標的部位、配列番号6に示すアミノ酸配列を有するジェネナーゼI(Genenase I)の標的部位、配列番号7に示すアミノ酸配列を有するエンテロキナーゼの標的部位、及び、配列番号8に示すアミノ酸配列を有するヒトライノウイルス(HRV)3Cプロテアーゼの標的部位からなる群より選択されてもよい。好ましさの面では劣るが、部位特異的プロテアーゼの標的部位は、配列番号9に示すアミノ酸配列を有する因子Xaの標的部位、又は、配列番号10に示すアミノ酸配列を有するトロンビンの標的部位であってもよい。前記リンカー核酸配列が、部位特異的プロテアーゼの標的部位をコードする核酸配列であるか、当該配列を含む場合、前記細胞(即ち、本開示にて提供される製造方法の工程a)~d)何れかの細胞)は更に、前記標的部位を切断するための、対応する部位特異的プロテアーゼを発現してもよい。前記の部位特異的プロテアーゼは、例えばTEVプロテアーゼ、ジェネナーゼI(Genenase I)、エンテロキナーゼ、ヒトライノウイルス(HRV)3Cプロテアーゼ、因子Xa、及びトロンビンからなる群より選択されてもよい。
【0102】
好ましくは、本開示にて提供される製造方法の工程a)及びb)の後に、多様化を受けた細胞が、所期のタンパク質に融合されたマーカータンパク質を産生してもよい。マーカー遺伝子は所期の遺伝子と同一のレベルで発現され、マーカータンパク質として蛍光タンパク質を用いた場合には、斯かる蛍光タンパク質はタンパク質濃度の指標として使用できる。従って、所期のタンパク質を利用した結合アッセイの場合、発現レベルに対して結合を校正すればよい。更に、蛍光マーカー遺伝子を発現する細胞は、FACS又はマイクロ流体選別を用いて収集することができ、抗生物質選択よりも迅速なプロセスで回収できる。
【0103】
マーカー遺伝子が陽性又は陰性の選択可能マーカータンパク質をコードする場合、適切に多様化された変異体からなる細胞集団を得るためには、幾つかの可能性が存在する。複数の開裂可能なペプチドリンカー、例えばT2A又はF2Aと共に、陽性及び陰性の両マーカーを用いることにより、例えば単純ヘルペスウイルス1型チミジンキナーゼ等の遺伝子により、陰性選択で非フレームシフト変異体を除去して、ガンシクロビルに対して選択することができる。細胞が同質となり、本発明の製造方法による多様化に供される際には、残存する不所望のフレームシフト変異体を、陽性選択遺伝子、例えばハイグロマイシンホスホトランスフェラーゼ及びハイグロマイシンB等で除去することができる。しかし、本開示にて上述したように、他の選択マーカーも使用可能である。
【0104】
本発明の方法の工程c)において、前記不活性化突然変異が除去された細胞が、選択及び/又は濃縮(例えば濃縮)される。前記不活性化突然変異が除去された細胞の選択及び/又は濃縮は、選択を更に少なくとも1回(例えば1~10回、例えば3回)実施することで、更に改善することができる。例えば、工程c)で選択/濃縮された細胞を培養し、所望のフラクション(例えば最も高いタンパク質発現を示す1~30%の細胞、例えば5%の細胞)を選択して更に培養してもよい。斯かる手順を1~10回、例えば3回繰り返すことができる。所期のタンパク質が蛍光タンパク質である場合、又は蛍光タンパク質を含む融合タンパク質の場合、最も高いタンパク質発現を示す1~30%の細胞の選択は、例えば、最も高い蛍光を示す1~30%の細胞を、例えばFACS等により選択することで実施できる。
【0105】
工程c)により選択される細胞は、工程a)で誘導されたDSB又は一本鎖ニックの修復により、所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞を含み、或いはこうした細胞からなる。ここで前記不活性化突然変異の除去とは、好ましくは、所期のタンパク質の突然変異体が発現されるように、所期のタンパク質をコードする不活性化された単一のコピーの配列が改変されることを意味する。以下に詳述するように、前記突然変異体は所期のタンパク質に対して、少なくとも80%の配列同一性を有する。従って、完全に異なるタンパク質(例えば所期のタンパク質をコードする遺伝子のリーディングフレームとは異なるリーディングフレームの転写により生じたタンパク質)は、所期のタンパク質の突然変異体とは見做されない。上述したように、前記不活性化突然変異により、活性が低下しているか、或いは活性を全く有さない、所期のタンパク質の変異体が発現されてもよい。この場合、前記不活性化突然変異を除去することで、前記所期のタンパク質の突然変異体の少なくとも一部において、所期のタンパク質の活性が回復する。しかし、本開示にて提供される方法では、前記所期のタンパク質の幾つかの異なる突然変異体が産生されるところ、これらの突然変異体の多くは通常、改善対象となるタンパク質活性の面では非機能的である。例えば、前記不活性化突然変異の除去により、対応する所期のタンパク質の活性の少なくとも80%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、更に好ましくは少なくとも100%の活性を有する、所期のタンパク質の突然変異体が発現される。最も好ましくは、突然変異体が所期のタンパク質の活性の100%超(例えば少なくとも101%、少なくとも110%、少なくとも120%、又は少なくとも150%)の活性を有することである。
【0106】
本開示にて提供される製造方法の工程d)においては、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルが提供される。所期のタンパク質のアミノ酸配列は、不活性化突然変異を有さない所期の遺伝子によりコードされる。換言すれば、所期のタンパク質(本開示では「野生型の所期のタンパク質」とも称する)とは、工程a)の細胞における所期のタンパク質をコードする遺伝子が不活性化突然変異を含まなければコードしていたであろうタンパク質である。所期のタンパク質の別名は「野生型の所期のタンパク質」であるものの、原則としては特定のタンパク質の既知の突然変異体であってもよい。例えば、特性の改善されたタンパク質の突然変異体が本技術分野で公知であってもよく、その場合には、斯かる既知の突然変異体に対して更なる突然変異を加えることで、より優れた性能のタンパク質が生じるか否かを検証することが望ましい。
【0107】
従って、所期のタンパク質は、本開示にて提供される手段及び方法において変異対象となる任意のタンパク質であり得る。所期のタンパク質としては、例えば蛍光タンパク質、抗体、酵素、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、又は膜貫通タンパク質等が挙げられる。所期のタンパク質は、酵素、抗体、又は蛍光タンパク質であることが好ましい。前記所期のタンパク質が蛍光タンパク質である場合、mNeonGreen、mRuby2/3、dTomato、TagRFP、Citrine、Venus、YPet、mTFP1、EGFP、Kusabira Orange、mOrange、mApple、mCerulean3、mTurquoise2、mCardinal、EosFP、Dronpa、Dreiklang、及び赤外iRFPからなる群より選択される蛍光タンパク質であってもよい。所期のタンパク質が蛍光タンパク質である場合、mNeonGreen2であることが好ましい。所期のタンパク質が抗体である場合、前記突然変異誘発標的部位は、斯かる抗体の重鎖又は軽鎖をコードする核酸配列のCDRコーディング領域内に存在することが好ましい。所期のタンパク質が酵素である場合、前記突然変異誘発標的部位は、前記酵素又は前記酵素の制御性サブユニットの活性中心をコードする核酸領域内に存在することが好ましい。
【0108】
所期のタンパク質の突然変異体とは、所期のタンパク質のアミノ酸配列と同一ではないが、関連するアミノ酸配列を有するタンパク質である。特に、所期の突然変異体のアミノ酸配列は、所期のタンパク質のアミノ酸配列に対して、少なくとも80%、更に好ましくは少なくとも85%、更に好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは98%、最も好ましくは少なくとも99%の配列同一性を有していてもよい。本発明の製造方法の一側面によれば、工程d)により提供される細胞のパネルに含まれる細胞が発現する、前記所期のタンパク質の複数の異なる突然変異体は、所期のタンパク質と比較して、1又は2以上のアミノ酸の交換、1又は2以上のアミノ酸の挿入、及び/又は 1又は2以上のアミノ酸の欠失を含む。前記1又は2以上のアミノ酸の交換は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5のアミノ酸の交換とすることができる。同様に、前記1又は2以上のアミノ酸の挿入は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の挿入とすることができる。同様に、前記1又は2以上のアミノ酸の欠失は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の欠失とすることができる。
【0109】
好ましくは、前記所期のタンパク質の突然変異体のアミノ酸配列は、所期のタンパク質と比較して、1又は2以上のアミノ酸置換(即ち交換)、1又は2以上のアミノ酸の挿入、及び/又は、1又は2以上のアミノ酸の欠失を有する他は、所期のタンパク質のアミノ酸配列と同一である。これら1又は2以上のアミノ酸の置換、挿入、及び/又は欠失は、突然変異誘発標的部位に生じる。置換、挿入、及び/又は欠失されるアミノ酸の数は、例えば1~25アミノ酸、好ましくは1~20アミノ酸、より好ましくは1~15アミノ酸、更に好ましくは1~12アミノ酸、更に好ましくは1~5アミノ酸、最も好ましくは3~5アミノ酸とすることができる。
【0110】
本開示にて提供される製造方法の工程d)により提供される細胞のパネルは、複数の異なるドナー核酸テンプレート内の、所期のタンパク質をコードする遺伝子内の前記突然変異誘発標的部位に対応する位置に含まれる複数の異なる突然変異を、突然変異誘発標的部位に含む細胞を濃縮することが好ましい。突然変異誘発標的部位に対応する位置は、例えば、本開示の別の場所で言及され、及び/又は、本技術分野で公知である、配列アラインメント法により決定することができる。好ましくは、細胞のパネル内で濃縮される細胞は、工程b)で提供される複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートとの相同組換えにより、前記DSB又は一本鎖ニック(好ましくはDSB)のHDRが生じた細胞であることが好ましい。換言すれば、本発明の方法の工程d)により提供される細胞のパネルは、所期の遺伝子に変異を形成した変異体によりコードされる前記所期のタンパク質の複数の異なる突然変異体を発現する細胞を濃縮することが好ましい。特に、上述したように、本開示にて提供される製造方法の工程a)では、所期の遺伝子が不活性化突然変異を含む。即ち、所期のタンパク質の活性が低下し、及び/又は、発現が低下する。所期のタンパク質が全く発現されないことが好ましい。本開示にて提供される製造方法の工程b)では、ドナー核酸テンプレートを提供することでHDRが生じ、これにより不活性化突然変異が除去される。結果として、所期のタンパク質の活性及び/又は発現が回復される。更に、ドナー核酸テンプレートに含まれる突然変異が、HDRにより所期のタンパク質に導入される。所期の遺伝子の突然変異誘発標的部位に突然変異が導入される。従って、d)で提供される細胞のパネルは、提供された複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートを用いて、誘導されたDSB又は一本鎖ニックのHDRが生じた細胞を含み、或いは斯かる細胞が濃縮されテイルことが好ましい。工程d)により提供される細胞のパネルは、少なくとも4%、好ましくは少なくとも6%、より好ましくは少なくとも8%、更に好ましくは少なくとも12%、更に好ましくは少なくとも15%、更に好ましくは少なくとも20%、更に好ましくは少なくとも30%、更に好ましくは少なくとも40%、更に好ましくは少なくとも50%、最も好ましくは少なくとも60%の細胞が、複数の異なるドナー核酸テンプレートに含まれる突然変異のうちの一つを、突然変異誘発標的部位に含むことが好ましい。
【0111】
本開示にて提供される方法において、複数の異なるドナー核酸テンプレートのライブラリーを使用することにより、得られる細胞のパネルは、前記所期のタンパク質の複数の異なる突然変異体を含む。従って、本開示にて提供される製造方法では、工程d)において提供される前記細胞のパネルが、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のプールを含み(或いは、好ましくは斯かる細胞のプールであり)、ここで各細胞において、前記複数の異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。従って、前記作製された細胞のパネルが、所期のタンパク質の異なる突然変異体を発現する異なる複数の細胞を含む。前記の異なる複数の細胞を一つのプールとして培養してもよい。或いは、前記異なる複数の細胞を個別に培養してもよい。これらの細胞を個別に培養することで、所期のタンパク質の個別の突然変異体の精製及び/又は分析が容易となる。従って、本開示にて提供される製造方法の一側面によれば、工程d)において提供される前記細胞のパネルは、それぞれ異なる突然変異体を発現する細胞が個別に培養された細胞のライブラリーである。本発明のこの側面によれば、本開示にて提供される製造方法は更に、工程c)とd)との間に、工程c)で選択及び/又は濃縮された細胞から、それぞれ異なる突然変異体を発現する細胞を分離する工程を含んでいてもよい。
【0112】
本発明によれば、(作製された細胞のパネルに含まれる)前記所期のタンパク質の1又は2以上の突然変異体の核酸及び/又はアミノ酸配列を決定してもよい。所期のタンパク質の突然変異体のヌクレオチド又はアミノ酸配列の分析は、生成された突然変異を決定し、及び/又は、所望の突然変異体をクローニングするのに有用である。従って、本発明の一側面によれば 本開示にて提供される製造方法 更に、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体をコードする遺伝子の1又は2以上の核酸配列を決定すること、或いは、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体の1又は2以上のアミノ酸配列を決定することを含む。
【0113】
前記細胞のパネル(別名「細胞ライブラリー」又は「細胞集団」)は、100,000から数十億の細胞を含むことが好ましい。例えば、FACSの場合、通常は2~3億個の細胞(例えば100,000,000~300,000,000個の細胞)が使用される。パニングの場合、例えば1mL当たり約500,000個の細胞を含むリットル単位の懸濁細胞培養が使用されうる。従って、パニングの場合、数十億の細胞が適用されうる。本発明の方法で使用される細胞は、細胞修復、例えばHDR(特に相同組換え)が生じうる限り、原則としてどのような細胞であってもよい。斯かる細胞は本技術分野で周知である。全ての2倍体生物(複製細菌や複製単数体酵母のように、たとえ2倍体性が一過的なものであったとしても)において、原則としてHDRを誘導することができる。例えば、本開示にて提供される手段及び方法によれば、細胞は(例えばHDR、特に相同組換えが生じうる)如何なる原核細胞又は(例えばHDR、特に相同組換えが生じうる)如何なる真核細胞であってもよい。例えば、本発明で使用される細胞は、例えば酵母細胞、(例えばHDR、特に相同組換えが生じうる)非哺乳類脊椎動物細胞、(例えばHDR、特に相同組換えが生じうる)植物細胞、(例えばHDR、特に相同組換えが生じうる)昆虫細胞、又は(例えばHDR、特に相同組換えが生じうる)哺乳類細胞からなる群より選択される。好ましくは、哺乳類細胞又は非哺乳類脊椎動物細胞が使用される。最も好ましくは、哺乳類細胞が使用される。特に好ましい非哺乳類脊椎動物細胞は、DT-40細胞である。これは、トリ白血病ウイルスによりホワイトレグホーン(white leghorn)種の鶏に誘導された滑液嚢リンパ腫由来のB細胞系列の細胞である。本発明での使用に特に好ましい哺乳類細胞としては、HEK293細胞(別名として、ヒト胚性腎293細胞、HEK-293、293細胞、293T細胞又はHEK細胞と呼ばれる場合もある)、リンパ腫細胞系(例えばNS0、Sp2/0-Ag14)、白血病細胞系、ジャーカット(Jurkat)細胞、チャイニーズハムスター卵巣(Chinese hamster ovary:CHO)細胞、HeLa細胞、PC12細胞、抗体産生ハイブリドーマ細胞系、不死化ヒトB細胞系、又は本技術分野で公知の他の不死化ヒト細胞系等が挙げられる。
【0114】
本開示にて提供される製造方法では、培養期間は、使用される個々の細胞型に応じて調整すればよい。HDRの誘導後の培養期間(即ち工程a)及びb)の後の培養期間)の間に、前記所期のタンパク質の突然変異体の発現が生じる。その後、本開示にて提供される製造方法の工程c)において、所期のタンパク質を(例えば所期のタンパク質及びマーカータンパク質を含む融合タンパク質の形で)含む細胞を選択及び/又は濃縮することができる。例えば、細胞が哺乳類細胞である場合、工程a)及びb)の後に、斯かる細胞を少なくとも48時間、好ましくは少なくとも72時間最も好ましくは少なくとも96時間に亘って培養すればよい。本開示において記載するように、工程a)及びb)は同時に実施することが好ましい。従って、工程a)及びb)を同時に実施した後に、上述の培養期間を設けることが好ましい。
【0115】
本開示にて提供される製造方法で製造される細胞のパネルは、前記野生型の所期のタンパク質と比較して、第一の活性が改善された、及び/又は、新たな活性を有する、(所期のタンパク質の)突然変異体を発現する細胞を含んでいてもよい。従って、本開示にて提供される方法の工程d)において細胞のパネルを提供した後、第一の活性が改善された、及び/又は、新たな活性を有する突然変異体を特異的に濃縮するための更なる工程e)を実施してもよい。従って、本発明の一側面は、本開示にて提供される製造方法であって、前記所期のタンパク質の前記複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで前記方法が更に、e)前記の細胞のパネルから、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮することを含む方法に関する。
【0116】
或いは、本開示にて提供される製造方法の工程c)において、改善された第一の活性及び/又は新たな活性を直接、特に前記改善された第一の活性及び/又は新たな活性を有する突然変異体を発現する細胞の選択及び/又は濃縮に用いてもよい。例えば、所期のタンパク質が蛍光タンパク質である場合、本開示にて提供される方法の工程c)において、改善された蛍光(例えば改善された第一の活性)を有する前記所期のタンパク質の突然変異体を発現する細胞を、選択的に濃縮してもよい。
【0117】
従って、本発明の更なる側面は、本開示にて提供される製造方法であって、前記所期のタンパク質の複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含む方法に関する。
【0118】
本開示にて提供される製造方法は、所期のタンパク質と比較して異なる活性又は改変された活性を有する(所期のタンパク質の)突然変異体のスクリーニングを可能とする点で有利である。従って、本発明は、前記野生型の所期のタンパク質と比較して異なる又は改変された(例えば生物学的)活性を有する所期のタンパク質の複数の突然変異体をスクリーニングするための方法、即ち、同定するための方法であって、
a)本発明の製造方法により得られた前記の細胞のパネルから、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を発現する、第二の細胞のパネルを選択及び/又は濃縮し、
b)前記第二のパネルにより発現される前記所期のタンパク質の突然変異体のアミノ酸配列を決定し及び/又は前記第二のパネルにより発現される前記所期のタンパク質の突然変異体をコードする遺伝子の核酸配列を決定する
ことを含む方法を提供する。
【0119】
上述のように、本開示にて提供される製造方法の工程c)において、改善された第一の活性及び/又は新たな活性を直接、改善された第一の活性及び/又は新たな活性を有する突然変異体を発現する細胞の選択及び/又は濃縮に使用してもよい。従って、本発明は、前記野生型の所期のタンパク質と比較して異なる又は改変された(例えば生物学的)活性を有する、所期のタンパク質の複数の突然変異体をスクリーニングするための、即ち、同定するための更なる方法であって、
a)本開示にて提供される製造方法において、工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含み、更に、
b)前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の少なくとも1つのアミノ酸配列を決定し;及び/又は前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体をコードする遺伝子の少なくとも1つの核酸配列を決定する
ことを含む方法を提供する。
【0120】
本開示にて提供される製造方法又は本開示にて提供されるスクリーニング方法は更に、前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、前記所期のタンパク質を発現させること、及び、任意により斯かる細胞を採取することを含んでいてもよい。前記野生型の所期のタンパク質と比較して、第一の活性が改善された、及び/又は、新たな活性を有する突然変異体を発現する細胞を選択及び/又は濃縮するために使用できる方法として、本技術分野では幾つかの方法が公知である。例えば、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の選択及び/又は濃縮は、例えばFACS、磁気活性化細胞選別法、マイクロ流体細胞選別法、及び/又は、ビーズを用いた細胞単離法等を用いて実施することができる。
【0121】
上述のように、「所期のタンパク質」(protein of interest)及び「野生型の所期のタンパク質」(wild-type protein of interest)という語は、本開示では相互交換可能に使用され、本開示にて提供される方法において突然変異型性の対象となるタンパク質を指す。従って、斯かる既知の変異体を更に修飾することが所望される場合には、「野生型の所期のタンパク質」という語は、特定のタンパク質の既知の変異体を指す場合もある。本開示において「第一の活性」(first activity)とは、新たに同定される又は本技術分野で公知の所期のタンパク質の活性を指す。本開示において「新たな活性」(new activity)という語は、前記「第一の活性」とは異なる更なる活性を意味する。従って、「新たな活性」とは、「第一の活性」とは異なる活性であれば、新たに同定される活性であってもよく、本技術分野で公知であってもよい。異なる活性又は改変された活性は、増加した活性であることが好ましい。例えば、増加した活性を有する所期のタンパク質の複数の突然変異体は、野生型の所期のタンパク質の当該活性と比較して、例えば少なくとも101%、好ましくは少なくとも110%、より好ましくは少なくとも120%、又は最も好ましくは少なくとも150%の活性を有していてもよい。
【0122】
例えば、本開示にて提供される製造方法又はスクリーニング方法の一側面によれば、前記所期のタンパク質が蛍光タンパク質であると共に、前記第一の活性及び/又は前記新たな活性(例えば前記第一の活性)は、蛍光である。細胞を蛍光に基づいて選別する方法は、本技術分野では周知であり、例えばFACS等が挙げられる。本開示にて提供される製造方法又はスクリーニング方法の他の側面によれば、所期のタンパク質が抗体であると共に、前記第一の活性及び/又は前記新たな活性(例えば前記第一の活性)が抗原結合性である。前記抗体の潜在的な「新たな活性」としては、例えば他の生物内の対応する抗原に対する交差反応性などが挙げられる。ヒト抗原に対する抗体であって、非ヒト動物の対応する抗原に対する交差反応性を有する抗体は、前臨床動物実験を実施する際に望ましい。本開示にて提供される製造方法又はスクリーニング方法の他の側面によれば、前記所期のタンパク質が酵素であると共に、前記第一の活性及び/又は前記新たな活性 (例えば前記第一の活性)が前記酵素の酵素活性である。タンパク質のプールから所望の活性を有する細胞を同定するための方法は、本技術分野で周知であり、例えばWojcik, 2015, Int. J. Mol. Sci. 16: 24918-24945; and Xiao, 2015, Ind. Eng. Chem. Res. 54: 4011-4020等に記載されている。
【0123】
上述のように、本開示にて提供される手段及び方法によれば、所期のタンパク質は、例えば抗体であってもよい。例えば、天然変異体と比較して新たな特異性又はより高い親和性を有するFab断片、単一鎖抗体、又は全長IgG等の遺伝子操作及び選択において、本発明は多数の利点を提供する。
【0124】
この目的のために、Fab断片、単一鎖抗体、又は軽鎖及び重鎖IgGをコードする遺伝子を、細胞内に単一コピーとして挿入してもよい。本開示にて上述及び後述するように、フレームシフト又は他の不活性化突然変異を、前記突然変異誘発標的部位の近傍に挿入してもよい。この例では、前記突然変異誘発標的部位は、CDR(complementarity determining regions:相補性決定領域)をコードする領域内、即ち、抗原結合ドメインの領域内に位置することが好ましい。しかし、前記突然変異誘発標的部位は、抗体機能に影響を及ぼす他の部位に存在してもよい。必要であれば(例えば、ヒト細胞系においてヒト化抗体遺伝子を多様化するなどの場合には)、外因性遺伝子のみが多様化されるように、内因性抗体遺伝子配列とはコドンを区別してもよい。
【0125】
まずはライブラリーから、リーディングフレームが有効に回復した細胞、及び/又は、融合されたマーカー遺伝子(例えば蛍光タンパク質又は抵抗性マーカー)が生成した細胞をスクリーニングする。抗体ライブラリーによる効率的な提示及びその後のスクリーニングのために、表面ディスプレイ技術を用いて、抗体変異体が細胞表面に発現させてもよい。所期のタンパク質をコードする遺伝子カセットの単一コピーを細胞ゲノム内に挿入する前に、抗体変異体を細胞表面に移送するための標的化配列を、斯かる遺伝子カセットに付加してもよい。斯かる技術は非常に強力なツールとなっており、例えばFab断片、単一鎖抗体、又は全長IgGを、細胞、例えば哺乳類細胞、例えばHEK293細胞の表面に機能的に提示させる上で有効である。有効なディスプレイ及びスクリーニングのためのプロトコールは、本技術分野では標準的であり、例えばHo, 2008, Methods in Molecular Biology, 525: pp 337-352; and Zhou, 2012, Methods in Molecular Biology, 907: 293-302により提供されている。斯かる表面ディスプレイ抗体ライブラリーのスクリーニングは、例えばFACS選別により行うことができる。
【0126】
この目的のために、フルオロフォア結合抗原を用いて、斯かる特定の抗原に親和性を有する抗体を提示する細胞のみを標識することができる。FACS選別を行うことで、これらの細胞を収穫することができる。スクリーニングを繰り返し実施することで、ストリンジェンシーを上昇させることができる。ここで非標識抗原の量を増やして細胞を洗浄し、更にFACSによる選別を行ってもよい。これにより、所与の抗原に対して高い親和性を有する変異体を同定することが可能となる。
【0127】
或いは、パニングアプローチにより、所望の抗体を同定することも可能である。この目的のためには、例えば、特定の表面に所望の抗原を結合させればよい。この表面上で、抗体ライブラリーを細胞表面に発現する細胞をインキュベートする。有効な抗体を発現する細胞は当該表面に結合する。非結合細胞を洗い落とし、加える可溶性抗原を増やして更に洗浄を繰り返すことで、ストリンジェンシーを上昇させることができる。数回の洗浄の後、表面に結合して残った細胞を、トリプシン処理等の適切な方法で採集し、回収すればよい。
【0128】
選択された抗体変異体をコードする遺伝子を単離するには、これらの細胞からポリA-RNAを調製し、RT-PCRを実施してこれらの遺伝子をcDNAへと転写すればよい。その後、それらを適切なベクターにサブクローニングして、更なる分析に供すればよい。
【0129】
上述のように、本開示にて提供される製造方法によれば、非所望の突然変異のバイアスを受けることなく、細胞ライブラリー(即ち細胞のパネル)を効率的に産生できる点で有利である。従って、作製された細胞ライブラリー内では、複数のアミノ酸がそれらのコドン占有率に応じた割合で、ランダムに挿入、欠失、及び/又は置換されている。しかし、所望の突然変異のバイアスを誘導するよう特別に設計されたドナー核酸テンプレートを用いることにより、所望の突然変異のバイアスをプログラムすることも可能である。従って、本開示にて提供される細胞ライブラリーは、突然変異のバイアスを有さない、特定の部位がランダムに改変された突然変異体、又は、特定のドナー核酸テンプレートを有することにより生成された所望の突然変異のバイアスを有する、特定の部位がランダムに改変された突然変異体を含む。結果として、本開示にて提供される細胞ライブラリーは、広範なバリエーションを有する。
【0130】
例えば、本開示にて提供される製造方法を用いれば、例えば僅か8アミノ酸という小さな領域を標的化した場合でも、結果として250億を超える変異体のライブラリーを得ることができる。斯かる大規模なプールからライブラリーを作製するので、重複は殆ど生じない。
【0131】
これに対して、従来技術の突然変異誘発方法、例えばエラープローン(Error Prone)PCR等では、バイアスを排したコドンの使用は不可能である上に、より重要な点として、PCR複製プロセスゆえに冗長性が極めて高くなってしまう(即ち、ライブラリーの大部分を同一変異体の多数のコピーが占めることとなる)。これにより、スクリーニングの手間の大部分が無駄になってしまう。エラープローン(Error Prone)PCRは、例えばFirth, 2005, Bioinformatics 21(15): 3314-3315に記載されている。本文献の実験によれば、1億個の変異体のライブラリーの中で、6以上の突然変異を有する変異体は僅か約100,000にすぎず、550万もの複製が生じていることになる。
【0132】
本開示にて提供される製造方法により作製される細胞ライブラリーは、従来技術の細胞ライブラリー、例えば欧州特許公開第2319918A1号等に開示の細胞ライブラリーとは顕著に異なる。本文献では、多様化された配列をレンチウイルスプラスミドにクローン化してレンチウイルスを生成し、これを細胞に感染させて安定に組み込ませる。欧州特許公開第2319918A1号では、レンチウイルスがゲノム内の異なる部位に組み込まれているため、異なる複数の細胞内で発現されたレンチウイルスによりコードされるタンパク質は、(隣接する制御性配列が異なるために)強い変動要因に晒されることになる。これに対して、本開示にて提供される方法により作製される細胞ライブラリーでは、多様化された(即ち説く禅変異を生じさせた)所期のタンパク質は、同一のゲノム遺伝子座から発現されるために、異なる複数の細胞内で発現されたタンパク質であっても、高い再現性及び比較可能性を有することになる。更に、(欧州特許公開第2319918A1号に記載のように)DNAライブラリーを大型のレンチウイルスプラスミドにクローニングするのは、極めて効率が悪く、惹いては、作製される所期のタンパク質の変異体(即ち突然変異体)の多様性も大幅に損なわれることになる。従って、本発明の方法により提供される細胞ライブラリーの方が、所期のタンパク質の異なる変異体をより多く含むことになる。更に、欧州特許公開第2319918A1号に記載のレンチウイルスを用いた方法では、小型のタンパク質しか多様化できない。
【0133】
本開示にて提供される製造方法を用いると、例えば6つのアミノ酸位置をランダム化する場合、以下の式で計算されるように、1000万個の変異体のライブラリーを得ることができる。
【数1】
ここで
pは被覆率(Coverage)
sは試料の数、
nは変異体の数である。
【数2】
p=14.47%、即ち9.26百万(p×n)個の異なる変異体が、1千万のプールから得られることになる。
【0134】
従って、本開示にて提供される細胞ライブラリーでは、一細胞集団当たりの異なる突然変異体の数は、従来技術の細胞ライブラリーと比較して多くなる。従って、提供される細胞ライブラリーは、本技術分野で公知の細胞ライブラリーと比較して、特性の改善された所期のタンパク質の複数の突然変異体をより効率的にスクリーニングするツールとなる点で有利である。従って、本発明の更なる側面は、本開示にて提供される方法により得られる細胞ライブラリーに関する。
【0135】
本発明によれば、本開示にて提供される細胞ライブラリーを、前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、所期のタンパク質の複数の突然変異体の同定に使用してもよい。同定された所期のタンパク質の突然変異体は、ホワイト・バイオテクノロジーに適用することができる。例えば、同定される突然変異体は、疾患の処置、即ち治療及び/又は予防に使用される抗体であってもよい。また、同定される突然変異体は、例えば生分解性プラスチック等の工業生産等に使用される酵素であってもよい。改変された酵素(例えばセルラーゼ)の変異体を、繊維や紙の産生に使用してもよい。或いは、同定された酵素の突然変異体を、バイオ燃料の製造に使用してもよい。例えば、バイオテクノロジーによって製造されたエタノールを、ガソリンの代替燃料として使用することができる。また、所期のタンパク質は、疾患の処置に有用となるように改変したサイトカイン又は成長因子であってもよい。
【0136】
本開示にて提供される方法を実現する手段は、キットの一部であってもよく、これを用いて本開示にて提供される細胞のパネル(即ち細胞のライブラリー)を作製してもよい。従って、本発明は、
(i)所期の遺伝子を1コピーのみ含む細胞、
(ii)本開示にて定義した複数の異なるドナー核酸テンプレートのライブラリー、及び/又は
(iii)部位特異的ヌクレアーゼ又はニッカーゼ、或いは、部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチド
を含むキットに関する。
【0137】
本発明のキットにおいて、所期の遺伝子は、本開示において記載する不活性化突然変異を含んでいてもよい。本発明のキットは更に、(1又は2以上の)反応緩衝剤、保存溶液、洗浄溶液、及び/又は、本開示に記載される方法の実施に必要なその他の試薬若しくは材料を含む。更に、本発明のキットの要素を、個別のバイアル又はボトルに梱包してもよく、或いは、容器又はマルチコンテナーユニットに纏めて梱包してもよい。斯かるキットは更に、使用指示書を含んでいてもよい。本発明のキットは、標準的な手順により製造することが好ましい。斯かる手順は当業者には既知である。上述したように、本開示にて提供されるキットは、本開示にて提供される方法を実施するのに、特に本発明の細胞ライブラリーを製造する方法の実施に有用である。
【0138】
本発明では、「同一性」(identity)又は「%同一性」(percent identity)という語は、アミノ酸又はヌクレオチド配列が、本開示に示す配列に対して、例えば少なくとも80%、好ましくは少なくとも90%、より好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%の同一性を有することを意味する。ここで、同一性の値が高い配列ほど、同一性の値が低い配列と比較して好ましい。本発明によれば、2以上の核酸又はアミノ酸配列に関して「同一性」又は「%同一性」とは、比較ウィンドウ内で最大限対応するよう比較及びアラインした場合に、或いは本技術分野で公知の配列比較アルゴリズムを用いて指定領域内を測定した場合に、或いは手動でアラインメントし、目視で検証した場合に、2以上の配列が同一であるか、指定された百分率のアミノ酸残基又はヌクレオチドが同一である(例えば、例えば配列番号19~25の何れかのアミノ酸配列と、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%同一である)ことを意味する。前記指定の同一性は、全長のアミノ酸又はヌクレオチド全体に亘って存在することが好ましい。
【0139】
本技術分野では公知のように、当業者であれば、種々のアルゴリズム、例えばCLUSTALWコンピューター プログラム(Thompson, 1994, Nucl Acids Res, 2: 4673-4680)又はFASTDB(Brutlag, 1990, Comp App Biosci, 6: 237-245)等を用いて、複数の配列間の%同一性を決定する手法を理解しうる。また、当業者であれば、BLAST及びBLAST 2.0 アルゴリズムも利用可能である(Altschul, 1997, Nucl Acids Res 25: 3389-3402; Altschul, 1993, J Mol Evol, 36: 290-300; Altschul, 1990, J Mol Biol 215: 403-410)。例えば、BLAST 2.0(BLASTはBasic L℃al Alignment Search Toolの略称:Altschul, 1997, loc. cit.; Altschul, 1993, loc. cit.; Altschul, 1990, loc. cit.)を用いて、局所的な配列アラインメントを行うことができる。上述のBLASTによれば、両ヌクレオチド配列及びアミノ酸配列のアラインメントを行って配列の類似性を決定することができる。BLASTはアラインメントの局所性ゆえに、同様の配列の正確なマッチ及び同定に特に有用である。BLASTを用いた類似のコンピューター技術(Altschul, 1997, loc. cit.; Altschul, 1993, loc. cit.; Altschul, 1990, loc. cit.)を用いて、例えばGenBankやEMBL等のヌクレオチドデータベースにおける同一または関連する分子の検索を行うことも可能である。
【0140】
本明細書で使用される「標的配列特異的CRISPR RNA」(target sequence specific CRISPR RNA)又は「crRNA」という語は、本技術分野では一般に知られている語であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。crRNAは通常、長さ10~30、好ましくは15~25(例えば約20)ヌクレオチドの標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)配列を、長さ21~46ヌクレオチドの2つのダイレクトリピート(direct repeats:DR)に挟まれた状態で含む。crRNAの3'に配置されたDRは、対応するtracrRNAに相補的で且つそれにハイブリダイズする。そのtracrRNAは、Cas9タンパク質にハイブリダイズする。SpCas9又はSaCas9ヌクレアーゼとの使用に好ましいDR配列は、配列番号11(即ちGTTTTAGAGCTA)に示す配列である。他の細菌種のCas9ヌクレアーゼと共に機能するDR配列は、Deltcheva, 2011, Nature, 471: 602-607に示すように、それぞれのCRISPR/Casオペロンに生じる配列リピートのバイオインフォマティクス分析、及び、Cas9ヌクレアーゼ及びtracrRNAと仮想的DR配列で挟まれた標的配列との実験的結合試験で同定される。
【0141】
本明細書で使用する場合、「トランス活性化crRNA」(trans-activating crRNA)又は「tracrRNA)」という語は、本技術分野で周知であり、例えばHsu, 2014, Cell 157: 1262-78, Yang, 2014, Nature Protocols, 9:1956-1968 and Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44に記載されている。「tracrRNA」とは、crRNAと相補的且つ塩基対をなす小型RNAであり、これによりcrRNArとRNA二本鎖を形成する。また、tracrRNAは、pre-crRNAと相補的且つ塩基対をなす小型RNAであってもよい。ここで、このpre-crRNAは、RNA特異的リボヌクレアーゼによって切断され、crRNA/tracrRNAハイブリッドを形成する。特に、この「tracrRNA」は、crRNA又はpre-crRNAのパリンドロミック・リピートに相補的な配列を含む。これにより、ダイレクトリピートを有するcrRNA又はpre-crRNAとハイブリダイズすることができる。このcrRNA/tracerRNAハイブリッドは通称「ガイドRNA」といい、侵入した核酸をCas9ヌクレアーゼが切断するのを補助する。SpCas9又はSaCas9ヌクレアーゼと使用するのに好ましいtracrRNA配列を、本開示では配列番号12に示す(即ちTAGCAAGTTAAAATAAGGCTAGTCCGTTTTTである)。
【0142】
所望の標的配列 (例えばa 所望の突然変異誘発標的部位)を標的とする少なくとも1つの標的配列特異的crRNA及び少なくとも1つのtracrRNA(即ち単一ガイドRNA、sgRNA)を含むキメラRNA分子は、常用の技術を用いて容易に設計することができる。例えば、sgRNAは、PAM部位に隣接する配列(例えばSpCas9の場合はNGG)に対して相補的な、長さ少なくとも17ヌクレオチド(例えば約19塩基対)の配列を含んでいてもよい。加えて、sgRNAは、前記細胞のゲノム内の配列とは(所期の遺伝子を除いて)実質的に相動性を有しないことが好ましい。例えば、斯かるキメラRNAは、例えばJinek, Science, 337: 816-821に示すものであってもよい。単一ガイドRNAを得るための更なる方法は、Ran, 2013, Nat Protoc 8 2281-2308に記載されている。特に、単一ガイドRNAをバイアスのないゲノムワイド分析により設計し、Cas9によるオフ標的開裂の可能性を最小化してもよい(Ran, 2013, Nat Protoc 8 2281-2308)。このためにオンラインツール(例えばCRISPR設計ツール、http://crispr.mit.edu/)を用いてもよい。
【0143】
当業者であれば、所望の標的配列(例えば所望の突然変異誘発標的部位)を標的とする二重ガイドRNA(即ち、少なくとも1つの標的配列特異的CRISPR RNA(crRNA)分子及び少なくとも1つのtracrRNA分子を含むガイドRNA)を設計する方法を、容易に知ることができる。例えば、斯かる二重ガイドRNAの設計は、crRNA及びtracrRNAを個別に設計することにより行うことができる。crRNAは、標的配列に対して相補的な配列と、DR配列の部分または全体配列とを用いて設計することができる。tracrRNAの合成は、Jinek, Science, 337: 816-821に示す方法で行うことができる。
【0144】
Cpf1ヌクレアーゼのためのガイドRNAの生成は、本技術分野で周知である。例えば、斯かるガイドRNAは、Zetsche, 2015, Cell, 163: 759-71に記載の方法で設計できる。斯かるcrRNAは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)長さ10~30、好ましくは15~25ヌクレオチドの配列を含むと想定される。斯かるCpf1のためのcrRNAは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)、長さ約20ヌクレオチドの配列と、それに続く長さ約19ヌクレオチドのヌクレオチド配列とを含むことが好ましい。この19ヌクレオチド配列は、ダイレクトリピート内の短いステムループ構造である。Cpf1は更なるtracrRNAを必要としない。
【0145】
本開示において「相同標的化修復」又は「HDR」とは、通常は相同組換えにより実施される、細胞内でDSB又は一本鎖ニックを修復する機構を指す。例えばCong, 2013, Science 339 819-23; Pardo, 2009, Cellular and Molecular Life Sciences 66 (6): 1039-1056; Bolderson, 2009, Clinical Cancer Research, 15: 6314-6320を参照。即ち、「相同標的化修復」又は「HDR」という語は、好ましくは相同組換えを指す。HDR修復機構は、核内にDNAの騒動断片(即ちドナー核酸テンプレート)が存在する場合にのみ、細胞が使用することができる。相同DNA断片が不在だと、代わりに非相同末端連結(non-homologous end joining:NHEJ)と呼ばれる他のプロセスが生じうる。斯かる極めてエラー許容性(error-prone)の高いNHEJ経路は、種々の長さの挿入及び欠失(insertions and deletions:INDELS)を誘導することにより、フレームシフト突然変異を生じさせ、結果として遺伝子をノックアウトする。これに対して、HDR経路は、相同DNAドナーテンプレート(即ち、ドナー核酸テンプレート)と損傷を受けたDNA部位との間に精密な組換え事象を生じさせ、結果として一本鎖又は二本鎖切断が正確に修正される。従って、HDRは、突然変異又はトランス遺伝子をゲノム内に特異的に導入するのに使用される。斯かるドナー核酸テンプレート(通常はssODN)は、修復されるべき領域と相同な配列の領域を含む必要がある。相同組換えがHDRの優先的な手法と考えられているが、単鎖化したオリゴヌクレオチド(ssODN)を修復テンプレートとしてライブラリーに挿入する場合には、別の第二の機構がHDRに関与していることを示す証拠がある。Aarts and te Riel (2010, J. Cell. Mol. Med. 14(6B): 1657-1667)の教示は、オリゴ媒介性HDRが、複製フォークのコンテクストにおいて、ゲノム内の標的領域に対するオリゴヌクレオチドの相同性領域のアニーリングを伴うことを示している。本研究は、岡崎断片様のプライミングの関与を示唆している。即ち、複製フォークの進行の際に斯かるオリゴヌクレオチドが遺伝子標的部位物理的に組み込まれるものと考えられる。
【0146】
「相同組換え」(homologous recombination)という語は、同様のヌクレオチド配列を含む二本のDNA鎖が遺伝材料を交換する遺伝子組換え機構を指す。細胞は相同組換えを、損傷を受けたDNAの修復、特に一本鎖又は二本鎖切断の修復のために使用する。相同組換えの機構は当業者には周知であり、例えばPaques, 1999, Microbiol Mol Biol Rev, 63: 349404に記載されている。
【0147】
本発明の方法によれば、前記の部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)が、工程a)の細胞内に存在し、或いは斯かる細胞内に導入されてもよい。例えば、前記の部位特異的ヌクレアーゼ又はニッカーゼは、タンパク質として存在し、或いは導入されてもよい。或いは、前記の部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)は、前記タンパク質をコードするポリヌクレオチドの形態で導入されてもよい。当然ながら、斯かるポリヌクレオチドは、前記部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)、及び/又は、前記ガイドRNAを、発現可能な形態でコードし、これが工程a)の細胞内で発現することにより、機能的な部位特異的ヌクレアーゼ又はニッカーゼと機能的なガイドRNAとが生じることになる。機能的なポリペプチド又はRNAの発現を実現する手段及び方法は、本技術分野で周知である。例えば、斯かるコーディング配列がベクター内、例えばプラスミド、コスミド、ウイルス、バクテリオファージ、又は遺伝子工学等で従来使用されている他のベクター内に存在していてもよい。斯かるベクターは、プラスミドベクターであることが好ましい。ベクター内に挿入されるコーディング配列は、例えば標準的な方法により合成することができ、或いは天然材料から単離することができる。斯かるコーディング配列は更に、転写制御要素、及び/又は、他のアミノ酸コーディング配列と連結されていてもよい。斯かる制御性配列は当業者には周知であり、例としては、限定されるものではないが、転写の開始を誘導する制御性配列、内部リボソーム侵入部位(internal ribosomal entry sites:IRES)(Owens, 2001, Proc Natl Acad Sei, USA, 98: 1471-1476)、及び任意により、転写の終了及び転写産物の安定化を誘導する制御要素が挙げられる。転写の開始を誘導する制御要素の非限定的な例としては、翻訳開始コドン、転写エンハンサー、例えばSV40エンハンサー、インシュレーター、及び/又はプロモーター、例えばサイトメガロウイルス(cytomegalovirus:CMV)プロモーター、SV40プロモーター、RSV(Rous sarcome virus)プロモーター、lacZプロモーター、鶏βアクチンプロモーター、CAGプロモーター(鶏βアクチンプロモーターとサイトメガロウイルス前初期エンハンサーとの組み合わせ)、gai10プロモーター、ヒト伸長因子1αプロモーター、AOX1プロモーター、GAL1プロモーターCaMキナーゼプロモーター、lac、trp又はtacプロモーター、lacUV5プロモーター、又はカリフォルニアガマキンウワバ多核ポリヘドロシスウイルス(autographa californica multiple nuclear polyhedrosis virus:AcMNPV)多面性(polyhedral)プロモーター等が挙げられる。転写終了を誘導する制御要素の非限定的な例としては、V40ポリA部位、tk-ポリA部位、又はSV40、lacZ若しくはAcMNPV多面性(polyhedral)ポリアデニル化シグナル等が挙げられる。更なる制御要素としては、翻訳エンハンサー、コザック(Kozak)配列、及びRNAスプライシングのドナー及びアクセプター部位に挟まれた介在配列等が挙げられる。更に、例えば複製起点、薬物抵抗遺伝子又はレギュレーター(誘導性プロモーターの一部として)等の要素が含まれていてもよい。
【0148】
本開示において「ポリヌクレオチド」(polynucleotide)、「核酸」(nucleic acid)、「核酸配列」(nucleic acid sequence)、又は「ヌクレオチド配列」(nucleotide sequence)という語は、本開示では相互交換可能に使用され、DNA、例えばcDNA又はゲノムDNA、及びRNAを指す。本発明で使用されるポリヌクレオチドは、天然でもよく、(半)合成由来のものでもよい。従って、斯かるポリヌクレオチドは、例えば従来の有機化学のプロトコールに従って合成された核酸分子であってもよい。当業者であれば、ポリヌクレオチドの調製及び使用には精通しているであろう(例えばSambrook and Russel “Molecular Cloning, A Laboratory Manual”, Cold Spring Harbor Laboratory, N.Y. (2001)等を参照)。本発明で使用されるポリヌクレオチドは、本技術分野で公知の核酸模倣分子を含んでいてもよく、斯かる核酸模倣分子からなるものであってもよい。当業者であれば容易に理解するように、これらは更なる非天然又は誘導体化ヌクレオチド塩基を含んでいてもよい。本発明に係る核酸模倣分子又は核酸誘導体としては、限定されるものではないが、ホスホロチオエート核酸、ホスホロアミド核酸、モルフォリノ核酸、ヘキシトール核酸(hexitol nucleic acid:HNA)、ペプチド核酸(peptide nucleic acid:PNA)、及びロックド核酸(locked nucleic acid:LNA)が挙げられる。
【0149】
本開示において「遺伝子」(gene)という語は、ヌクレオチドからなるDNAの座(又は領域)を指す。遺伝子は、生物のゲノム内における遺伝の分子単位である。しかし、本開示において「遺伝子」という語は、生物のゲノム内に存在するヌクレオチド配列には限定されない。本開示において「遺伝子」という語は、タンパク質をコードする各ヌクレオチド配列を対象とする。従って、本開示において「遺伝子」という語は、人工的に作成されたヌクレオチド配列、例えばイントロンのないヌクレオチド配列も含む。従って、本開示において「遺伝子」という語は、cDNA配列も含む。従って、本開示において「所期の遺伝子」(gene of interest)又は「所期のタンパク質をコードする遺伝子」(gene encoding (for) the protein of interest)という語は、相互交換可能に使用され、所期のタンパク質をコードするヌクレオチド配列を指す。前記のヌクレオチド配列は、所期のタンパク質をコードするcDNAであることが好ましい。「コードする」を意味する“encode”又は“encoding”という語は、それぞれ“encode for”又は“encoding for”という語と相互交換可能に使用される。更に、本開示において「遺伝子コピー」(gene copy)という語は、ヌクレオチド配列のコピーを指す。従って、「単一の遺伝子コピー」(a single gene copy)という語は、特定のヌクレオチド配列の単一のコピーを指すと共に、前記ヌクレオチド配列が特定の細胞のゲノム内で一つしか存在しないことを意味する。
【0150】
本開示において「ドナー核酸テンプレート」(donor nucleic acid template)(別名「DNAドナーテンプレート」(DNA donor template)、例えばHeidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44参照)という語は、HDRのプロセス、好ましくは相同組換えのプロセスにおいてテンプレートとして機能する、標的配列に導入されるべき修飾を含む核酸配列を意味する。このドナー核酸テンプレートをテンプレートとして使用することで、斯かる修飾を含む遺伝子情報が、所期の遺伝子内にコピーされる。例えば、ドナー核酸テンプレートは、1~36ヌクレオチドが異なる点を除いては、所期の遺伝子の一部と同一であってもよい。これにより、相同組換えで1~12アミノ酸が導入又は置換される。斯かるドナー核酸テンプレートは、相同組換えによって一部アミノ酸、例えば1~12のアミノ酸が欠失するように設計してもよい。本開示において、ドナー核酸テンプレートは、一本鎖核酸分子(即ちssODN)であることが好ましい。しかし、プラスミドベクターをドナー核酸テンプレートとして用いてもよい。即ち、(プラスミドに基づく)二本鎖DNAをドナー核酸テンプレートとして用いてもよい。
【0151】
ドナー核酸テンプレートは、挿入されるべき突然変異(即ち、所期の遺伝子に対する修飾)を有する「ドナー核酸配列」(donor nucleic acid sequence)を含む。ドナー核酸テンプレートは更に、ドナー核酸テンプレートの標的配列に対して相同な領域を含む。ここで「ドナー核酸テンプレートの標的配列」(target sequence of the donor nucleic acid template)とは、所期の遺伝子内の突然変異誘発標的部位を取り囲む配列領域である。本開示において「ドナー核酸テンプレートの標的配列に対して相同な領域」(regions homologous to the target sequence of the donor nucleic acid template)とは、いわゆる「相同性アーム」(homology arms)を意味する。相同性アームとは、ドナー核酸テンプレートの標的配列に対して特異的な結合を達成するのに十分な配列同一性を有する領域である。ドナー核酸テンプレートの標的配列に対して相同な領域(相同性アーム)は、所期の遺伝子に挿入されるべき突然変異(即ち修飾)を含む「ドナー核酸配列」の両側に隣接して存在する。換言すれば、相同性アームはドナー核酸配列の5’及び3’末端に存在する。従って、本開示にて提供される方法で使用されるドナー核酸テンプレートは、第一の相同性アームと、それに続くドナー核酸配列と、更にそれに続く第二の相同性アームとを含む。相同性アームは、ドナー核酸配列(即ち突然変異を有する配列)の両側の、好ましくは>30ヌクレオチド、より好ましくは30~150ヌクレオチド、更に好ましくは30~80(例えば40~55)ヌクレオチドの範囲に隣接して存在する。
【0152】
「ドナー核酸テンプレートの標的配列に対して相同な領域」(regions homologous to the target sequence of the donor nucleic acid template)は、対応するドナー核酸テンプレートの標的配列と、少なくとも95%、好ましくは少なくとも97%、より好ましくは少なくとも98%、更に好ましくは少なくとも99%、更に好ましくは少なくとも99.9%、最も好ましくは100%の配列同一性を有することが好ましい。前記所定の配列同一性は、相同性アームの結合部位として機能する「ドナー核酸テンプレートの標的配列」との関係においてのみ定められる。従って、所期の遺伝子の突然変異誘発標的部位(即ちドナー核酸配列)に挿入されるべき部分がドナー核酸テンプレート内に存在する場合には、全ドナー核酸テンプレートと「ドナー核酸テンプレートの標的配列」との全体の配列同一性は、前記所定の配列同一性とは異なる場合もあり得る。
【0153】
所望の突然変異誘発標的部位にHDR(特に相同組換え)を誘導するドナー核酸テンプレートは、常用の技術、例えばRan, 2013, Nat Protoc 8 2281-2308に記載の技術等を用いて、容易に設計することができる。
【0154】
記述のように、本発明において、ドナー核酸テンプレートは一本鎖オリゴデオキシヌクレオチド(ssODN)であってもよい。「オリゴデオキシヌクレオチド(ODN)」という語は、本技術分野では周知であり、デソキシヌクレオチド残基の配列からなる核酸ポリマーである。ODNは、第二の異なる(即ち、相補的又は部分的に相補的な)オリゴヌクレオチド鎖とハイブリダイズしない場合には、一本鎖ODN(ssODN)である。但し当然ながら、ssODNが自身に対して折り畳まれることにより、1本のオリゴデオキシヌクレオチド鎖からなる部分的又は完全な二本鎖分子を形成する場合もある。しかし、ssODNは、自身に対して折り畳まれて部分的又は完全な二本鎖分子を形成するのではなく、その全長に亘って一本鎖であることが好ましい。本発明において、ODNとは、オリゴデオキシヌクレオチド及びポリデソキシヌクレオチドの双方を指し、その長さは30~600ヌクレオチド、好ましくは50~500ヌクレオチド、更に好ましくは70~350ヌクレオチド、最も好ましくは90~150ヌクレオチドである。例えば、短い配列(例えば長さ1~36ヌクレオチドのヌクレオチド配列)を挿入揺する場合、約90~150ヌクレオチド長のssODNを使用することができる。ここで、ssODNは、ドナー核酸配列(即ち突然変異を含む配列)の両側に隣接して、長さ>30ヌクレオチド、より好ましくは30~150ヌクレオチド、更に好ましくは40~55ヌクレオチド(例えば約50ヌクレオチド)の相同性アームを含むことが好ましい。
【0155】
本開示にて上述及び後述するように、本開示にて提供される手段及び方法を用いることにより、インビボにおいて、例えばCRISPR/Cas9系及び相同組換え修復を用いて、外因性組換遺伝子を哺乳類細胞系に対して、1コピーのみ安定に導入し、多様化することが可能となる。例として、蛍光タンパク質mNeonGreenを用いることにより、添付の実施例に示すように、CRISPRにより所期の部位を標的化して、長さの異なる多様化されたアミノ酸配列の大きなライブラリーを、相同修復により挿入することが可能となる。この目的のために、リーディングフレームシフトを標的化部位の近傍に選択的に導入し、非蛍光タンパク質としてもよい。添付の実施例において実証するように、切断及び修復によって、所望の多様化が挿入され、リーディングフレームが復元される。変異体を(例えばFACSで)分析することにより、大量の変異体及び配列スペースをスクリーニングすることが可能となる。添付の実施例において実証するように、本開示にて提供される方法により、mNeonGreen2というより高い明度(brightness)を有する緑色蛍光変異体の作出に成功している。また、添付の実施例に示すように、このアプローチを非蛍光タンパク質標的に拡大し、多様化されたタンパク質を採集して更なる機能分析に供するために、蛍光タンパク質又は選択マーカーの融合を用いることも可能である。
【0156】
上述のように、本発明では、タンパク質mNeonGreen2を改変した。このタンパク質は、mNeonGreenと比較してより高い明度を有する点で有利である。従って、本発明はmNeonGreen2にも関する。従って、本発明の一側面は、
(a)配列番号91に示す核酸配列を有する核酸分子によりコードされるアミノ酸配列を含むポリペプチド、
(b)配列番号92に示すアミノ酸配列を含むポリペプチド、
(c)配列番号92に示すアミノ酸配列を含むポリペプチドをコードする核酸分子によりコードされるポリペプチド、
(d)(a)~(c)の何れかのポリペプチドに対して、少なくとも80%の相同性、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%の同一性を有するポリペプチドであって、配列番号28に示すmNeonGreenの位置147~150に対応する位置に、アミノ酸「DACW」を含むポリペプチド、及び、
(e)(a)又は(c)に示す核酸分子のヌクレオチド配列に対する遺伝子コードの結果として縮重した核酸分子によりコードされるアミノ酸配列を含むポリペプチド
からなる群より選択されるポリペプチドに関する。
【0157】
本開示にて提供されるmNeonGreen2は蛍光活性を有する。実際に、量子収量と消散係数(extinction coefficient)との積により決定されるmNeonGreen2の全体明度(overall brightness)は、(例えば配列番号28に示される)mNeonGreenよりも高い。例えば、本開示にて提供されるmNeonGreen2の全体明度は、(例えば配列番号28に示される)mNeonGreenよりも、少なくとも1%、好ましくは少なくとも2%、より好ましくは少なくとも4%、更に好ましくは少なくとも6%、最も好ましくは少なくとも8%、又は少なくとも10%は明るい。
【0158】
本発明の一側面は、以下の項に関する。
【0159】
1.所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現され、前記方法が、
a)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導し、ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含み、
b)工程a)の細胞に対して、前記誘導されたDSB又は一本鎖ニックの相同組換えによる修復のための、複数の異なるドナー核酸テンプレートのライブラリーを提供し、ここで前記ライブラリーの前記複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に異なる突然変異を含むと共に、相同標的化修復(HDR)、特に相同組換えにより、前記不活性化突然変異を除去し、
c)前記不活性化突然変異が除去された細胞を選択及び/又は濃縮し、
d)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供し、ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現されている
ことを含む方法。
【0160】
2.前記d)で提供される前記細胞のパネルにおいて、前記複数の異なるドナー核酸テンプレート内の、前記突然変異誘発標的部位に対応する位置に含まれていた複数の異なる突然変異を、前記突然変異誘発標的部位に含む細胞が濃縮される、1項の方法。
【0161】
3.前記細胞のパネルにおいて濃縮される細胞が、前記複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートとの相同組換えにより、前記DSB又は一本鎖ニックの修復が生じた細胞を含む、2項の方法。
【0162】
4.前記d)で提供される前記細胞のパネルにおける、少なくとも4%、好ましくは少なくとも20%、最も好ましくは少なくとも60%の細胞が、前記複数の異なるドナー核酸テンプレートに含まれる突然変異の一つを含む、1~3項の何れか一項の方法。
【0163】
5.前記d)で提供される前記細胞のパネルが更に、前記のDSB又は一本鎖ニックの修復が非相同末端連結(NHEJ)により生じた細胞を含む、1~4項の何れか一項の方法。
【0164】
6.前記のDSB又は一本鎖ニックの修復がNHEJにより生じた細胞が、前記不活性化突然変異を除去した少なくとも1つのランダムな突然変異を含み、ここで好ましくは、前記ランダムな突然変異が、工程a)で前記のDSB又は一本鎖ニックが導入された位置に直接隣接する位置に、1又は2以上のヌクレオチドの挿入及び/又は欠失を含む、5項の方法。
【0165】
7.前記不活性化突然変異が、所期のタンパク質をコードする遺伝子の前記単一のコピー内に導入されてなる、1~6項の何れか一項の方法。
【0166】
8.前記不活性化突然変異が、前記所期のタンパク質の発現を妨げる、1~7項の何れか一項の方法。
【0167】
9.前記不活性化突然変異が、塩基対置換、塩基対挿入、塩基対欠失、停止コドン、又は不活性化アミノ酸置換であるか、或いはこれらの何れかを含む、1~8項の何れか一項の方法。
【0168】
10.前記不活性化突然変異が、所期のタンパク質の選択可能な活性を阻害する、1~9項の何れか一項の方法。
【0169】
11.工程c)が、前記選択可能な活性を有する細胞の選択及び/又は濃縮を含むか、或いは斯かる選択及び/又は濃縮である、10項の方法。
【0170】
12.前記不活性化突然変異が、 前記所期のタンパク質をコードする遺伝子内にフレームシフトを導入するか、前記所期のタンパク質をコードする遺伝子内に未成熟停止コドンを導入するか、或いは前記所期のタンパク質をコードする遺伝子内に突然変異を導入し、結果として不活性化アミノ酸置換を生じさせる、1~11項の何れか一項の方法。
【0171】
13.工程c)が、前記所期のタンパク質を発現する細胞の選択を含むか、或いは斯かる選択である、1~12項の何れか一項の方法。
【0172】
14.前記所期のタンパク質をコードする遺伝子が、前記細胞のゲノム内に融合遺伝子として含まれており、ここで前記融合遺伝子が、前記所期のタンパク質をコードする遺伝子の下流にマーカー遺伝子を含む、12又は13項の方法。
【0173】
15.前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が、前記マーカー遺伝子の発現を妨げる、14項の方法。
【0174】
16.前記マーカー遺伝子によりコードされるタンパク質の発現が、直接選択可能である、14又は15項の方法。
【0175】
17.工程c)が、前記マーカー遺伝子によりコードされるタンパク質を発現する細胞の選択を含むか、或いは斯かる選択である、14~16項の何れか一項の方法。
【0176】
18.前記マーカー遺伝子によりコードされるタンパク質が、蛍光タンパク質である、14~17項の何れか一項の方法。
【0177】
19.前記工程c)の選択及び/又は濃縮が、斯かる蛍光タンパク質を発現する細胞の単離を含む、18項の方法。
【0178】
20.前記細胞の単離が、蛍光活性化細胞分別(FACS)又はマイクロ流体細胞選別であるか、或いはこれらの手法を含む、19項の方法。
【0179】
21.前記マーカー遺伝子によりコードされるタンパク質の発現が、抗生物質抵抗性を付与するか、薬物抵抗性を付与するか、栄養要求性を補完するか、或いは検出可能な酵素活性を付与する、14~17項の何れか一項の方法。
【0180】
22.前記工程c)の選択及び/又は濃縮が、選択的な条件下で細胞を培養することを含む、21項の方法。
【0181】
23.前記マーカー遺伝子によりコードされるタンパク質が、前記所期のタンパク質をコードする遺伝子内に前記不活性化突然変異が存在する場合には発現され、ここで前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞では、前記マーカー遺伝子が発現されないか、或いはインフレームでは発現されない、14項の方法。
【0182】
24.前記所期のタンパク質の発現が、陰性選択可能である、14又は23項の方法。
【0183】
25.工程c)が、前記マーカー遺伝子によりコードされるタンパク質を発現しない細胞の選択及び/又は濃縮を含むか、或いは斯かる選択及び/又は濃縮である、14、23又は24項の方法。
【0184】
26.前記マーカー遺伝子によりコードされるタンパク質が、チミジンキナーゼ(HSVtk)である、14及び23~25項の何れかの方法。
【0185】
27.前記融合遺伝子が更に、前記所期のタンパク質をコードする遺伝子と前記マーカー遺伝子との間に、リンカー核酸配列を含む、14~26項の何れか一項の方法。
【0186】
28.前記リンカー核酸配列が、自己開裂ペプチドをコードする核酸配列を含むか、或いは斯かる配列からなる、27項の方法。
【0187】
29.前記自己開裂ペプチドが、T2Aペプチド、P2Aペプチド、E2Aペプチド、及びF2Aペプチドからなる群より選択される。28項の方法。
【0188】
30.前記リンカー核酸配列が、部位特異的プロテアーゼの標的部位をコードする核酸配列を含むか、或いは斯かる配列からなる、27項の方法。
【0189】
31.前記部位特異的プロテアーゼの標的部位が、配列番号5に示すアミノ酸配列を有するTEVプロテアーゼの標的部位、配列番号6に示すアミノ酸配列を有するジェネナーゼI(Genenase I)の標的部位、配列番号7に示すアミノ酸配列を有するエンテロキナーゼの標的部位、及び配列番号8に示すアミノ酸配列を有するヒトライノウイルス (HRV)3Cプロテアーゼの標的部位からなる群より選択される、30項の方法。
【0190】
32.前記細胞が更に、前記標的部位を切断する対応の部位特異的プロテアーゼを含む、30又は31項の方法。
【0191】
33.前記部位特異的プロテアーゼが、TEVプロテアーゼ、ジェネナーゼI(Genenase I)エンテロキナーゼ、ヒトライノウイルス(HRV)3Cプロテアーゼ、因子Xa、及びトロンビンからなる群より選択される、30又は32項の方法。
【0192】
34.所期のタンパク質をコードする遺伝子の単一のコピーが、外因性遺伝子のコピーである、1~33項の何れか一項の方法。
【0193】
35.所期のタンパク質をコードする遺伝子の単一のコピーが、内因性遺伝子のコピーである、1~34項の何れか一項の方法。
【0194】
36.前記方法が更に、a)で使用される細胞を生成する工程を含む、1~35項の何れか一項の方法。
【0195】
37.前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピー内に、前記不活性化突然変異を導入することを含む、36項の方法。
【0196】
38.前記所期のタンパク質をコードする遺伝子の単一のコピーが外因性であると共に、前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピーを、細胞のゲノム内に導入することを含む、36又は37項の方法。
【0197】
39.前記の所期のタンパク質をコードする遺伝子の単一の外因性のコピーをゲノム内に導入する工程が、部位特異的相同組換え系を含む、38項の方法。
【0198】
40.前記所期のタンパク質をコードする遺伝子の単一のコピーを前記細胞のゲノム内に導入する工程の前又は後に、前記不活性化突然変異が導入される、38又は39項の方法。
【0199】
41.前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピーを前記細胞のゲノム内に導入する工程の前又は後に、前記所期の遺伝子内に前記不活性化突然変異を導入することを含む、38又は39項の方法。
【0200】
42.前記所期のタンパク質をコードする遺伝子の単一のコピーが内因性であると共に、前記生成する工程が、部位特異的相同組換えを用いて、系前記細胞のゲノム内の所期のタンパク質をコードする遺伝子内に、前記不活性化突然変異を導入することを含む、36又は37項の方法。
【0201】
43.前記所期のタンパク質をコードする遺伝子が、ゲノム内に2コピー以上存在する内因性遺伝子であると共に、前記生成が、前記所期のタンパク質をコードする遺伝子の一部の内因性コピーを不活性化して、一細胞当たり前記所期のタンパク質をコードする遺伝子の単一コピーを得ることを含む、36、37、又は42項の方法。
【0202】
44.前記生成する工程が、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードする核酸配列を、細胞内に導入することを含む、36~43項の何れか一項の方法。
【0203】
45.前記生成する工程が更に、前記所期の遺伝子の単一のコピー内における、前記部位特異的ヌクレアーゼ又は前記部位特異的ニッカーゼに対応する認識配列を、細胞内に導入することを含む、44項の方法。
【0204】
46.前記生成する工程が更に、前記部位特異的ヌクレアーゼ又は前記部位特異的ニッカーゼを前記認識部位に標的化する手段を、細胞内に導入することを含む、44又は45項の方法。
【0205】
47.前記DSBが誘導される、1~46項の何れか一項の方法。
【0206】
48.前記DSBが部位特異的ヌクレアーゼにより誘導されると共に、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーが、前記部位特異的ヌクレアーゼに対応する認識部位を含む、1~47項の何れか一項の方法。
【0207】
49.前記部位特異的ヌクレアーゼが、恒常性又は誘導性プロモーターの制御下で発現される、48項の方法。
【0208】
50.前記部位特異的ヌクレアーゼがプラスミドにコードされる、48又は49項の方法。
【0209】
51.前記方法が更に、工程c)とd)との間、又は工程d)の後に、前記部位特異的ヌクレアーゼをコードするプラスミドを、選択及び/又は提供された細胞から除去することを含む、50項の方法。
【0210】
52.前記所期のタンパク質をコードする遺伝子内の、前記部位特異的ヌクレアーゼの認識部位が、前記所期のタンパク質をコードする遺伝子の単一のコピー内に内因的に存在するか、或いは完全又は部分的に外から導入されたものである、33~36項の何れか一項の方法。
【0211】
53.前記部位特異的ヌクレアーゼの認識部位が、完全又は部分的に外から導入されると共に、前記外から導入された配列が、c)で選択される細胞又はd)で提供される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体内には存在しない、48~52項の何れか一項の方法。
【0212】
54.前記部位特異的ヌクレアーゼが、Cas9ヌクレアーゼ、Cpf1ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZNF)、転写アクティベーター様ヌクレアーゼ(TALEN)、及びmegaTALエンドヌクレアーゼからなる群より選択される、48~53項の何れか一項の方法。
【0213】
55.前記部位特異的ヌクレアーゼが、CRISPR/Cas9ヌクレアーゼである、48~53項の何れか一項の方法。
【0214】
56.前記Cas9ヌクレアーゼが、化膿連鎖球菌(Streptococcus pyogenes)由来のSpCas9、ストレプトコッカス サーモフィルス(Streptococcus thermophiles)由来のSt1Cas9、黄色ブドウ球菌(Staphylococcus aureus)由来のSaCas9、Cas9 VQR変異体、Cas9 EQR変異体、スプリット(Split)Cas9、インテリン(Intein)Cas9、遺伝子改変Cas9、及び、二量体RNAガイドFokI-dCas9ヌクレアーゼ(RFN)からなる群より選択される、54又は55項の方法。
【0215】
57.工程a)の細胞が、前記Cas9ヌクレアーゼを前記認識部位に対して標的化するsgRNAを含む、54~56項の何れか一項の方法。
【0216】
58.前記Cas9ヌクレアーゼの対応する認識部位が、前記Cas9ヌクレアーゼによって認識されるPAM部位を含む、54~57項の何れか一項の方法。
【0217】
59.前記二本鎖切断が、前記所期のタンパク質をコードする遺伝子内の異なる鎖における2つの一本鎖ニックによって認識される、1~47項の何れか一項の方法。
【0218】
60.前記2つの単鎖ニックが、1又は2以上のニッカーゼによって導入されると共に、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーが、第一の部位特異的ニッカーゼのための第一の認識部位と、第二の部位特異的ニッカーゼのための第二の認識部位とを含む、59項の方法。
【0219】
61.前記第一の部位特異的ニッカーゼと前記第二の部位特異的ニッカーゼとが同一である、59項の方法。
【0220】
62.前記第一のニッカーゼ及び/又は前記第二のニッカーゼが、Cas9ニッカーゼである、60~61項の何れか一項の方法。
【0221】
63.工程a)の細胞が、前記第一の部位特異的ニッカーゼを前記第一の認識部位に、前記第二の部位特異的ニッカーゼを前記第二の認識部位にそれぞれ標的化する、第一のsgRNAを含む、62項の方法。
【0222】
64.前記第一の認識配列及び/又は前記第二の認識配列が、PAM配列を含む、63項の方法。
【0223】
65.前記一本鎖ニックが、部位特異的ニッカーゼによって認識されると共に、前記所期のタンパク質をコードする遺伝子の単一のコピーが、前記部位特異的ニッカーゼのための対応する認識部位を含む、1~46項の何れか一項の方法。
【0224】
66.前記所期のタンパク質をコードする遺伝子内の、前記部位特異的ニッカーゼのための前記認識部位が、前記所期のタンパク質をコードする遺伝子内に内因的に存在するか、或いは完全又は部分的に外から導入される、65項の方法。
【0225】
67.前記部位特異的ニッカーゼのための前記認識部位が、完全又は部分的に外から導入されると共に、前記の外から導入される配列が、c)で選択される細胞又はd)で提供される細胞に含まれる所期のタンパク質をコードする遺伝子の突然変異体内には存在しない、65又は66項の方法。
【0226】
68.前記部位特異的ニッカーゼが、Cas9ニッカーゼである、65~67項の何れか一項の方法。
【0227】
69.前記Cas9ニッカーゼのための対応する認識配列が、前記CRISPR/Cas9ニッカーゼによって認識されるPAM配列である、68項の方法。
【0228】
70.前記細胞が、原核細胞又は真核細胞である、1~69項の何れか一項の方法。
【0229】
71.前記細胞が、酵母細胞、非哺乳類脊椎動物細胞、植物細胞、昆虫細胞、又は哺乳類細胞である、1~69項の何れか一項の方法。
【0230】
72.前記細胞が哺乳類細胞である、1~69項の何れか一項の方法。
【0231】
73.前記哺乳類細胞が、HEK293細胞、リンパ腫 細胞系 (例えばNS0又はSp2/0-Ag14),白血病 細胞系、ジャーカット(Jurkat)細胞、チャイニーズハムスター卵巣(CHO)細胞、HeLa細胞、PC12細胞、抗体産生ハイブリドーマ細胞系、不死化ヒトB細胞系、及び不死化ヒト細胞系からなる群より選択される、71又は72項の方法。
【0232】
74.前記非哺乳類脊椎動物細胞が、DT40鶏細胞である、71項の方法。
【0233】
75.前記DSB又は前記一本鎖ニックが、前記突然変異誘発標的部位に対して100塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導される、1~74項の何れか一項の方法。
【0234】
76.前記不活性化突然変異が、前記突然変異誘発標的部位に対して100塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導される、1~75項の何れか一項の方法。
【0235】
77.前記複数の異なるドナー核酸テンプレートが、二本鎖DNA分子を含むか、或いは二本鎖DNA分子である、1~76項の何れか一項の方法。
【0236】
78.前記複数の異なるドナー核酸テンプレートが各々、個別のベクターに含まれる、77項の方法。
【0237】
79.前記複数の異なるドナー核酸テンプレートが、一本鎖オリゴヌクレオチドを含むか、或いは一本鎖オリゴヌクレオチドである、1~78項の何れか一項の方法。
【0238】
80.前記一本鎖オリゴヌクレオチドが、ロックド核酸及び/又はホスホロチオエート修飾を含む、79項の方法。
【0239】
81.前記複数の異なるドナー核酸テンプレートの各々が、前記所期のタンパク質をコードする遺伝子と相同な相同核酸配列を含む、1~80項の何れか一項の方法。
【0240】
82.前記相同核酸配列が、20~100ヌクレオチド、好ましくは30~60ヌクレオチド、最も好ましくは40~50ヌクレオチドを含む、81項の方法。
【0241】
83.前記複数の異なるドナー核酸テンプレートの各々が、前記突然変異誘発標的部位に対応する位置の上流に、長さ少なくとも20ヌクレオチド、例えば 20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第一の相同核酸配列を含むと共に、更に、前記突然変異誘発標的部位に対応する位置の下流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第二の相同核酸配列を含む、1~82項の何れか一項の方法。
【0242】
84.相同が、少なくとも80%の配列同一性、好ましくは少なくとも95%の配列同一性、最も好ましくは少なくとも99%の同一性を意味する、81~83項の何れか一項の方法。
【0243】
85.前記突然変異誘発標的部位に対応する位置における、前記複数の異なる突然変異が、1又は2以上のヌクレオチドの置換、欠失、又は挿入である、1~84項の何れか一項の方法。
【0244】
86.d)で提供される細胞のパネルの細胞内で発現される、前記所期のタンパク質の前記複数の異なる突然変異体が、前記所期のタンパク質と比較して、1又は2以上のアミノ酸の置換、1又は2以上のアミノ酸の挿入、及び/又は、1又は2以上のアミノ酸の欠失を含む、1~85項の何れか一項の方法。
【0245】
87.前記1又は2以上のアミノ酸の置換が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5のアミノ酸の置換である、86項の方法。
【0246】
88.前記1又は2以上のアミノ酸の挿入が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の挿入である、86項の方法。
【0247】
89.前記1又は2以上のアミノ酸の欠失が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の欠失である、86項の方法。
【0248】
90.前記不活性化突然変異を除去する核酸配列が、所期のタンパク質をコードする遺伝子に対応する野生型配列であるか、及び/又は、前記所期のタンパク質の遺伝子内のフレームシフト突然変異を除去する、1~89項の何れか一項の方法。
【0249】
91.工程b)が工程a)の前に、或いは好ましくは工程a)と同時に実施される、1~90項の何れか一項の方法。
【0250】
92.工程a)及びb)において細胞が、NHEJに対する相同組換えの比率を増加させる条件下で培養される、1~91項の何れか一項の方法。
【0251】
93.前記条件が、NHEJに関与する酵素の阻害又は不活性化、NHEJを制御するタンパク質の発現、NHEJを抑制する物質の添加、複製フォークの進行の遅延化、又は細胞周期のG2/M期での停止の誘発である、92項の方法。
【0252】
94.NHEJに関与する酵素が、KU70又はDNAリガーゼIVであると共に、NHEJに関与する酵素が抑制される、93項の方法。
【0253】
95.NHEJを制御するタンパク質が、E1B55K及びE4orf6を含む、又はこれらからなるタンパク質複合体、93項の方法。
【0254】
96.前記NHEJを抑制する物質が、Scr7-ピラジン、ESCR7、L755507、ブレフェルジンA、及びL189(CAS 64232-83-3)からなる群より選択される、93項の方法。
【0255】
97.NHEJに対する相同組換えの比率が、少なくとも1倍、好ましくは少なくとも3倍、最も好ましくは少なくとも15倍に増加される、92~96項の何れか一項の方法。
【0256】
98.前記細胞が哺乳類細胞であると共に、工程a)及び/又はb)と工程c)との間に、少なくとも48時間、好ましくは少なくとも72時間、最も好ましくは少なくとも96時間に亘って培養される、1~97項の何れか一項の方法。
【0257】
99.d)で提供される前記細胞のパネルが、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のプールであると共に、各細胞毎に前記複数の異なる突然変異体のうちの一つが単一の遺伝子コピーから発現される、1~98項の何れか一項の方法。
【0258】
100.d)で提供される前記細胞のパネルが、それぞれ異なる突然変異体を発現する細胞が個別に培養された細胞のライブラリーである、1~98項の何れか一項の方法。
【0259】
101.前記方法が更に、工程c)と工程d)との間に、工程c)により選択される細胞から、それぞれ異なる突然変異体を発現する細胞を分離する工程を含む、100項の方法。
【0260】
102.前記方法が更に、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体をコードする遺伝子の1又は2以上の核酸配列を決定すること、或いは、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体の1又は2以上のアミノ酸配列を決定することを含む、1~101項の何れか一項の方法。
【0261】
103.前記所期のタンパク質が、蛍光タンパク質、抗体、酵素、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、又は膜貫通タンパク質である、1~102項の何れか一項の方法。
【0262】
104.前記所期のタンパク質が、mNeonGreen、mRuby2/3、dTomato、TagRFP、Citrine、Venus、YPet、mTFP1、EGFP; Kusabira Orange、mOrange、mApple、mCerulean3、mTurquoise2、mCardinal、EosFP、Dronpa、Dreiklang、及び赤外iRFPからなる群より選択される蛍光タンパク質である、1~102項の何れか一項の方法。
【0263】
105.前記所期のタンパク質が抗体であり、ここで 前記突然変異誘発標的部位が、前記抗体の重鎖又は軽鎖をコードする核酸配列のCDRコーディング領域内に存在する、1~102項の何れか一項の方法。
【0264】
106.前記所期のタンパク質が酵素であり、ここで前記突然変異誘発標的部位が、前記酵素又は前記酵素の制御性サブユニットの活性中心をコードする核酸領域内に存在する、1~102項の何れか一項の方法。
【0265】
107.前記所期のタンパク質の前記複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで前記方法が更に、
e)前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮する
ことを含む、1~106項の何れか一項の方法。
【0266】
108.前記所期のタンパク質の複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含む、1~106項の何れか一項の方法。
【0267】
109.野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、所期のタンパク質の複数の突然変異体を同定する方法であって、前記方法が、
a)1~106項の何れか一項から得られる前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮し、
b)前記第二のパネルにより発現される前記所期のタンパク質の突然変異体のアミノ酸配列を決定し及び/又は前記第二のパネルにより発現される前記所期のタンパク質の突然変異体をコードする遺伝子の核酸配列を決定する
ことを含む方法。
【0268】
110.前記野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、所期のタンパク質の複数の突然変異体を同定する方法であって、前記方法が、
a)1~106項の何れか一項の所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法を含み、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含み、
b)前記方法が更に、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の少なくとも1つのアミノ酸配列を決定し;及び/又は前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体をコードする遺伝子の少なくとも1つの核酸配列を決定することを含む、方法。
【0269】
111.前記方法が更に、野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する所期のタンパク質の発現及び任意により収集を含む、109又は110項の方法。
【0270】
112.前記前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、所期のタンパク質の突然変異体の選択及び/又は濃縮が、FACS細胞選別、磁気活性化細胞選別、マイクロ流体細胞選別、及び/又はビーズを用いた細胞単離を含む、107~111項の何れか一項の方法。
【0271】
113.前記所期のタンパク質が蛍光タンパク質であると共に、前記第一の活性及び/又は前記新たな活性が蛍光である、107~112項の何れか一項の方法。
【0272】
114.前記所期のタンパク質が抗体であると共に、前記第一の活性及び/又は前記新たな活性が抗原結合性である、107~112項の何れか一項の方法。
【0273】
115.前記所期のタンパク質が酵素であると共に、前記第一の活性及び/又は前記新たな活性が前記酵素の酵素活性である。107~112項の何れか一項の方法。
【0274】
116.1~115項の何れか一項の方法により得られる細胞ライブラリー。
【0275】
117.前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、所期のタンパク質の複数の突然変異体の同定のための、116項の細胞ライブラリーの使用。
【0276】
118.同定された所期のタンパク質の突然変異体が、ホワイト・バイオテクノロジーに適用される、117項の使用。
【0277】
119.前記所期のタンパク質が、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、及び膜貫通タンパク質から選択される何れかのタンパク質である、1~115項の何れか一項の方法、116項の細胞ライブラリー、又は117又は118項の使用。
【0278】
本開示では、特許公報及び学術文献を含む多数の文献を引用する。これらの文献の開示は、本発明の特許性に関連するわけではないが、それらの全体が引用により本明細書に組み込まれる。
【図面の簡単な説明】
【0279】
【
図1】
図1:本発明のタンパク質ライブラリー生成ための方法の例示的且つ非限定的な態様のスキームである。所期の遺伝子、この場合は蛍光タンパク質mNeonGreenをコードする遺伝子の発現カセットが、適切な細胞系列のゲノム内に一コピーのみ安定に形質転換される。改変された細胞系のゲノム内の単独のFRT部位内に挿入するのが適切な手法である。mNeonGreen内の突然変異誘発の標的化対象部位近傍にフレームシフトが導入される。斯かるフレームシフトにより、mNeonGreenの発現と、mNeonGreenの3’末端に融合された他の選択可能マーカータンパク質、この場合は蛍光タンパク質mKate2の発現とが阻害される。Cas9/sgRNAのトランスフェクションによって、まず、フレームシフトに隣接してゲノムに組み込まれた標的遺伝子mNeonGreen内に、標的化された開裂が生成される。共形質転換されたssDNAライブラリー(オリゴライブラリー)は、mNeonGreenの切断部位に隣接する相同領域を含むことで、相同標的化修復が可能となっている。mNeonGreen遺伝子内への組み込みにより、フレームシフトが修復されて、所望のランダムさで多様化されたライブラリーが標的部位に挿入される。
【0280】
【
図2】
図2:プラスミド及びクローニングスキーム。mNeonGreenの遺伝子が細菌発現プラスミドpSLICE3(pRSETB由来)内に挿入され、フレームシフトが、PCR技術を用いて、mNeonGreen内の標的部位に隣接するように導入される。フレームシフトされたmNeonGreenの下流にmKate2が第二のマーカー遺伝子として融合され、斯かるカセットが哺乳類発現プラスミドpcDNA5FRT内に挿入される。pcDNA5FRT-mNeonフレームシフト-mKate2が、ゲノム内に単一のFRT部位を有する適切な細胞系(例えばHEK293細胞にトランスフェクトされる。mNeonフレームシフト-mKate2の発現カセットが単独のFRT部位内に一コピーのみ組み込まれる。斯かるカセットを安定に発現する細胞が選択される。Cas9及び適切なガイドRNA(sgRNA)をコードする発現プラスミドが細胞内にトランスフェクトされる。Cas9による切断で、対応する相同性アームを有する共トランスフェクトオリゴヌクレオチドライブラリーによる相同標的化修復が可能となり、これによってmNeonGreen内のフレームシフトが修復されて、所望のランダム化された一連の多様化された配列が、遺伝子内の選択された標的部位に挿入される。
【0281】
【
図3】
図3:a)3残基(mNeonGreenの残基148~150)ライブラリー及びb)5残基(mNeonGreenの残基145~149)ライブラリーについて4ラウンドのスクリーニングの間に得られた生細胞の明度のヒストグラム。最初の選別(短い点線で塗りつぶし)では、蛍光の中央値は極めて低い。続くFACS選別のラウンド(中抜き灰色丸~黒丸)では、明度が大幅に上昇し、低蛍光mNeonGreen変異体は集団から排除されている(FITC-A:緑色蛍光チャンネル)。
【0282】
【
図4】
図4:前記3残基及び5残基ライブラリーのFACS選別の最終ラウンド後の生細胞の明度のヒストグラム。比較のために、親mNeonGreen発現細胞の集団も示す。
【0283】
【
図5】
図5:安定に形質転換されたmNeonGreen発現HEK293細胞(a)、3残基ライブラリーの成員(b)、及び5残基ライブラリーの成員(c)の蛍光顕微鏡画像。発光は530/20nm。細胞のサイトゾル及び核の全体に亘って、蛍光は等しく分布しており、凝集の兆候は見られなかった。
【0284】
【
図6】
図6:FACS選別の初回ラウンド後の多様化されたmNeonGreen変異体のアミノ酸配列。本技術を用いて3アミノ酸(残基147~149)の配列が多様化された。この図は、選択された10の変異体のDNA配列(左)及び翻訳されたタンパク質配列(右)を示す。多様化されたアミノ酸配列をハイフンで挟んで示す。mNeonGreen内の標的部位の親アミノ配列はDWCであった。
【0285】
【
図7】
図7:mNeonGreen2の特性決定。グラフは、大腸菌(E. coli)から精製された組換mNeonGreen2の励起及び発光スペクトルを示す。変異体の量子収量は0.8と決定された。消散係数は124.000M
-1・cm
-1と、親mNeonGreenの消散係数(116.000)よりも高かった。従って、量子収量と消散係数との積により決定される全体明度によれば、mNeonGreen2は親mNeonGreenよりも最大10%明るかった。
【0286】
【
図8】
図8:mNeonGreen内の標的選択。mNeonGreenの構造(上図)及び一次アミノ酸配列(下図)を示す。多様化の対象として選択した5つの領域を、構造中では黒色で、アミノ酸配列中では番号及び下線を付して示す。二量体及び三量体形成を阻止する残基をアミノ酸配列中に網掛けで示す。これらの残基は改変せずに残し、その周囲の残基を多様化した。各部位について、Cas9標的化のために近隣のNGG PAM部位を同定し、プラスミドpSpCas9(BB)-2A-Puroと共同することで適切なsgRNAを生成するようにプライマーを設計した。
【0287】
【
図9】
図9:
図7に示すmNeonGreen内の部位を標的化するためのsgRNAを生成するのに用いたプライマーのリスト。
【0288】
【
図10】
図10:本発明を実施するための一般化したスキーム。
【0289】
【
図11】
図11:突然変異及びスクリーニング手順のための他のコンストラクトの設計。マーカータンパク質であるN-アセチルトランスフェラーゼピューロマイシン抵抗性タンパク質を、P2Aペプチドを介して蛍光タンパク質mRuby2のC末端に融合する。mRuby2内の標的部位の近傍に導入されたフレームシフトが修復され、ピューロマイシン抵抗性が生成されることで、多様化されたmRuby2ライブラリーの収穫及び濃縮が、薬物選択を用いて可能になる。Cas9/sgRNAでトランスフェクトされた細胞を、2日間連続でピューロマイシンで処理することにより、標的蛍光タンパク質ライブラリーを適切に発現しない細胞を除去する。
【0290】
【
図12】
図12:ピューロマイシンを用いた2日間の選択後における、mRuby2の発色団領域内に挿入された(mRuby2のアミノ酸残基67~69が多様化された)3残基アミノ酸ライブラリーの次世代シークエンシング結果。X軸は、観察された突然変異型の百分率(0~100%)を示す。総ライブラリーサイズは7292配列であった。「インフレーム」は、野生型mRuby2遺伝子に対してインフレームであった観察された変異体配列の数を示す(6639配列)。「インフレーム、停止なし」は、インフレームであり且つ早い段階で停止コドンを有しない配列の数を示す(6537配列)。「インフレーム、停止なし、正しい長さ」は、インフレームであり、早期に停止コドンを含まず、且つ野生型mRuby2遺伝子と同じ長さの配列の数を示す(3077配列)。「ライブラリーの要請を充足」は、インフレームで挿入された正しいライブラリーを提示する配列の数を示す(2550配列)。「インフレームでない」は、野生型mRuby2遺伝子と比較してインフレームでない配列を示す(653配列)。「インフレーム、停止あり」は、野生型mRuby2遺伝子と比較して早い段階で停止コドンを有する変異体配列の数を示す(102配列)。ピューロマイシン処理による効果は、ライブラリーにおいて「インフレームでない」配列及び「インフレーム、停止あり」配列の存在割合が低いことに表れている。
【0291】
【
図13】
図13:次世代シークエンシングにより検証された、翻訳後の多様化ライブラリータンパク質の長さ分布。単独の配列のみを考慮した。軸は、観察された多様化後のmRuby2タンパク質の長さ分布及びそれぞれの存在割合を示す。親mRuby2タンパク質の長さは236アミノ酸である。INDEL(挿入・欠失)事象があったことが見て取れるが、これはおそらくは非相同末端連結による。これによって、突然変異誘発により多様化されたアミノ酸配列の長さが異なる種々のタンパク質変異体が生じ、結果としてライブラリーの多様性が更に上昇している。
【0292】
【
図14】
図14:mRuby2の発色団領域内の多様化された3-アミノ酸残基配列(アミノ酸67~69)の各位置におけるヌクレオチド頻度の次世代シークエンシング分析。ドナー単鎖オリゴヌクレオチドに、予め設計した合成型NNB(ここでNは任意のヌクレオチドであり、BはA(アデニン)以外の任意のヌクレオチドである)という3コドンを有するライブラリーを組み込んだ。斯かる設計により、TAA及びTGA停止コドンの生成が防止される。このように停止コドンを忌避するバイアスを予めプログラムした他は、ヌクレオチドは突然変異誘発位置に対して概ね均等に、即ちランダムに配分された。即ち、ここで提案する方法によれば、既定のバイアスを有する極めて不均一且つ複雑なライブラリーが生成される。
【0293】
【
図15】
図15: mRuby2のアミノ酸残基43~47における標的化された突然変異誘発。a)mRuby2の構造。ベータシートの黒色の配列は、Cas9を用いて多様化される領域を示す。これは残基43~47に対応する5アミノ酸領域である。親mRuby2におけるこの改変領域の元の一次配列は、Q43、T44、M45、R46、及びI47である。b)mRuby2の突然変異誘発に用いられた発現カセットの基本構造。この一連の実験のために、選択マーカーであるピューロマイシンRに加えて、蛍光タンパク質TagBFP2をmRuby2に融合した。第二のフルオロフォアを使用することで、追加の波長によるFACS選別を可能とした。
【0294】
【
図16】
図16:Cas9編集及びそれに続く一連のFACS選別のラウンド後のmRuby2明度の進化を示す蛍光ヒストグラム。mRuby2をアミノ酸43~47の領域で多様化した。縦の点線は、FACSラウンドのカットオフゲートを示す。a)対照は、編集前のフレームシフトを有するmRuby2ベクターを発現する細胞を示す。b)Cas9編集開始から72時間後の細胞集団の蛍光ヒストグラム。1億個の細胞の集団を用いて選択を開始した。所定のカットオフラインを超える赤色を示す細胞を選別し、繁殖させ、増幅し、FACS選別の新たなラウンドに使用した。c)第2ラウンドのFACS選別。1%のカットオフを用いて発光細胞を選択した。d)第3ラウンドの選別。mRuby2対照集団よりも明るい細胞集団を選択した。e)第3ラウンドの選択及び増幅後の細胞集団のヒストグラム。f)親mRuby2を発現する対照集団のヒストグラム。
【0295】
【
図17】
図17:Cas9編集及び3ラウンドのFACS選別後における、融合マーカータンパク質「mTagBFP2」を基準とした、mRuby2の蛍光強度の進化を示す蛍光ドットプロット表示。a~f)
図16と同様。
【0296】
【
図18】
図18:第1ラウンドのFACS選別後の7つの蛍光組換タンパク質の蛍光発光グラフ。各タンパク質の多様化領域のアミノ酸配列を右側に示す。蛍光に基づく選別後、mRNAを細胞から単離し、逆転写し、そのcDNAを細菌発現ベクターpRSETBにクローニングした。細菌で発現させた後、本分野で標準的な手順を用いて蛍光タンパク質を抽出し、蛍光分光計を用いて組換タンパク質を分析した。融合タグBFP2を標準として用いてタンパク質レベルを正規化した。斯かるデータは、これらの細胞系からタンパク質変異体を簡便に抽出し、他の分析系へと移送できることを示している。線上の数値は発光ピーク波長(単位:nm)を示す。右上の配列QTMRIは親mRuby2配列を示す。
【0297】
【
図19】
図19:
図18に示す7つの異なるmRuby2変異体のDNA及びタンパク質配列。変異体の多様化領域のDNA配列を濃網掛けで強調して示す。薄網掛けは、sgRNAと複数の再切断部位との再結合を除去するために、修復テンプレートによって導入されたサイレント突然変異により改変されたコドンを強調して示す。AAAは変更されていない親配列を示す。ここから分かるように、この場合における多様化は非相同末端連結(NHEJ)の結果であるのに対し、AAGは相同テンプレートに基づく修復により導入される。従って、NHEJはタンパク質の多様化に極めて有効である。最右側のパネルは、変異体の多様化領域における対応するアミノ酸配列を示す。mRuby2は親配列を示す。mRuby2のDNA配列内の2つの下付の「aa」は、親mRuby2タンパク質の不活性化のためにフレームシフトを導入するべく欠失された2つのヌクレオチドを示す。その後、Cas9編集により変異体内のフレームシフトが修復されて、リーディングフレームが再建される。これは相同標的化修復によるが、NHEJを通じて行われる場合もある。
【0298】
【
図20】
図20:図に結果を示す実験の手順を模式的に示すスキーム。その目的は、相同標的化修復の総比率を決定すると共に、何らかの薬物処理がこの比率に影響を及ぼすか否かを調べることである。a)mRuby2のDNAの標的化Cas9編集のためのスキーム。この特定の例では、親mRuby2に修復テンプレートと共にフレームシフトが導入された。ガイドRNA及び修復テンプレート(SSODN HDRテンプレート)を共送達し、フレームシフトを含むmRuby2を生成した。HA-L:左側相同性アーム;HA-R:右側相同性アーム、ssODN:一本鎖オリゴヌクレオチド。黒点部分はフレームシフト導入領域を示す。b)HDR誘導ストラテジーの次世代シークエンシング分析の概略。4つの連続する工程として設計した。mRuby2が不活性化された約2百万の細胞から非発光細胞を選別した(1)。この集団からmRNAを単離し、逆転写し、次世代シークエンシングに供した(2)。フレームシフト部位周囲の2百万の配列をディープシークエンシングで得た(3)。最後に、配列をアラインし、重複を除去し、残る600.000の結果を分析した。UMI:独自分子識別子(Unique Molecular Identifier)、15のランダムなヌクレオチドの配列。GSP:遺伝子特異的プライマー。縞模様はUMI変異体を示す。配列決定した領域は250bpであった。
【0299】
【
図21】
図21:次世代シークエンシングにより分析したmRuby2の相同標的化修復(HDR)率に対し、8種の異なる薬物介入が与える影響。実験の詳細を
図20に示す。相同標的化修復率をX軸に示す。Cas9編集のための72時間の期間内に、細胞を医薬化合物で処理した。全ての場合において、同一のsgRNA及び同一の修復テンプレートを適用した(SGのみの場合を除く)。NU7441:NU7441による処理;SCR7:SCR7による処理;SG+SS:対照実験、更なる薬物処理を行わず、sgRNA及びHDRテンプレートのみを適用した;BFA:ブレフェルジンAによる処理;NOCOD:ノコダゾールによる処理;RS-1:RS-1による処理;NOCOD+RAD51:ノコダゾール及びRAD51mRNAによる同時処理;RAD51:RAD51mRNAによる処理。SGのみ:ガイドsgRNAのみ、相同テンプレートは使用しなかった。
【実施例】
【0300】
以下、非限定的な実施例を参照しながら、本発明を更に説明及び/又は例示する。
【0301】
実施例1:mNeonGreenのタンパク質多様化及び標的化突然変異誘発
【0302】
タンパク質ライブラリー生成の模式的な概略
実施した実験の基本的な構成を
図1及び2に模式的に示す。具体的に、第一の工程では、mNeonGreen遺伝子の単一のコピーをCMVプロモーターの制御下に含むベクター(pcDNA5-FRT-NGFSと呼ぶ)を生成した。このベクターにクローニングで導入された単一のmNeonGreen遺伝子コピーは、mNeonGreen遺伝子内に不活性化フレームシフト突然変異を含み、これにより前記ベクターからのmNeonGreenタンパク質の発現が防止される。遺伝子をベクターにクローニングする前に、部位特異的突然変異誘発によりフレームシフト突然変異を遺伝子に導入した。具体的に、予め定めた位置の4塩基対を欠失させることにより、特定の標的部位にフレームシフト突然変異を導入し、配列番号26に示すmNeonGreenヌクレオチド配列のフレームシフト版を作製した。ここでいう予め定めた位置とは、以下に説明する更なる工程において複数の異なる突然変異を導入する標的部位として選択された部位である。
【0303】
次工程では、pcDNA5-FRT-NGFSベクターの単一のコピーが前記細胞のゲノムに導入された安定な細胞系列を生成した。具体的に、これはFlp-In-293細胞系列(Thermofisher)にFlp-In組換えを導入することにより達成した。従って、不活性化mNeonGreen変異体(NGFSと呼ぶ)の単一のコピーを、CMVプロモーターの制御下に含む安定な細胞系列を生成した。
【0304】
その後、生成された細胞系列を用いて、mNeonGreenの複数の異なる突然変異体を発現する細胞のパネル(換言すれば細胞のライブラリー)を生成した。突然変異体の産生は、組換え系アプローチにより、まず二本鎖切断(double-strand break:DSB)を、前記細胞のゲノム内のNGFS遺伝子の単一のコピー内における、不活性化フレームシフト突然変異の近傍の位置に導入する。特にここでは、欠失部位の1bp上流に切断を導入した。この例では、CRISPR/Cas9系を用いて部位特異的DSBを導入した。このために、Cas9ヌクレアーゼ(即ち SpCas9)をコードするベクターを用いて、安定な細胞系列を形質転換した。この同一のベクターには、DSBが導入された部位にCas9ヌクレアーゼを標的化するsgRNAもコードされていた。斯かるCas9ヌクレアーゼ及びsgRNAをコードするベクターに加えて、オリゴヌクレオチドのライブラリーも細胞系列に共形質転換した。このライブラリーのオリゴヌクレオチドは、導入されたDSBの相同組換えによる修復のためのドナー核酸テンプレートとして機能するための配列も有していた。相同組換えのためのドナー核酸テンプレートとして機能するために、これらのオリゴヌクレオチドは、DSBに隣接する領域に対して相同な配列を含んでいた。更に、これらのオリゴヌクレオチドは、3又は5アミノ酸に対応する、突然変異を有するコドンを有していた。斯かるオリゴヌクレオチドのライブラリーは、それぞれ3アミノ酸(mNeonGreenの残基147~149)又は5アミノ酸(mNeonGreenの残基146~150)の標的部位に、複数の異なる突然変異を有する複数の異なるオリゴヌクレオチドを有しており、これにより基本的に全ての可能なコドンをカバーすることが可能であった。同様に、これらのオリゴヌクレオチドは、フレームシフトを導入した前述の不活性化突然変異を有していなかった。こうして、これらのオリゴヌクレオチドを用いた相同組換えにより、フレームシフト突然変異が除去されるように設計した。
【0305】
結果及び考察
ここで使用された、所期のタンパク質の複数の突然変異体を発現する細胞を生成するための方法(即ち、あるタンパク質の複数の異なる突然変異体を発現する細胞のライブラリーを生成するための方法)の基本的な考え方を
図1及び2に示す。具体的に、Flp-リコンビナーゼ系を用いて、タンパク質をコードする遺伝子の単一のコピーを哺乳類細胞系列に挿入した。本実施例では、蛍光タンパク質mNeonGreen(Shaner, 2013, Nature methods 10.5: 407-409)を改変した。前記ライブラリーの成員を親mNeonGreenから識別するために、不活性化突然変異をフレームシフトの形でmNeonGreenのリーディングフレーム内に挿入し、標的タンパク質の正しい発現、惹いてはそれによるC末端融合タンパク質の正しい発現を防止した。フレームシフト部位の近傍を特異的に切断するようにCas9/sgRNA系を設計した。具体的には、欠失部位の1bp上流に切断を導入した。二本鎖切断を修復するために、適切な相同性アームを両端に有するオリゴヌクレオチド(即ち、ドナー核酸テンプレート)を細胞に共トランスフェクトし、修復テンプレートとして機能させた。これらの修復テンプレートは、相同配列に加えて、mNeonGreen内の標的部位(即ち突然変異誘発標的部位)にインフレームで融合されるべき、多様化されたDNA配列を含んでいた。修復テンプレートを合成する前に予め、DNA及びタンパク質の多様化配列の多様化の程度及び長さを設計した。その後、二本鎖切断部位における修復テンプレートの組換えにより、所望の多様化が挿入されると共に、mNeonGreen内のフレームシフトが修復され、発現が復旧される。これにより、得られる蛍光細胞は、適切に折り畳まれると共に機能性を維持している、多様化された遺伝子の変異体を有することとなった。
【0306】
詳細には、mNeonGreenのフレームシフト/欠失を含むHEK293細胞を、標的化されたCas9/sgRNAベクターを用いて形質転換した。ここで、3つの多様化されたアミノ酸を有する修復テンプレートのライブラリー、又は、5つの多様化されたアミノ酸を有する修復テンプレートのライブラリーを、形質転換に一緒に用いた。これらの修復テンプレートにより、3つ又は5つの多様化されたアミノ酸が、mNeonGreen遺伝子内の選択された部位に導入された。このライブラリーはヌクレオチドNNBによってコードされていた(ここでNは4種のヌクレオチドの何れかを表し、BはA以外の任意のヌクレオチドを表す)。これにより、停止コドン(TAA、TGA)が導入される可能性を低減した。しかし、原則としては、任意のヌクレオチドについての選好性やバイアスを組み込むことが可能である。3アミノ酸ライブラリーのための標的として、当初はmNeonGreen内のアミノ配列NSLTAAD*WCRSK(配列番号30)を選択した。ここでアスタリスク(「*」)は、アスパラギン酸147をコードするコドンの直後の二本鎖切断部位を指す。下線を付したアミノ酸は、3残基ライブラリーによって置換された残基を指す。これらのオリゴヌクレオチド修復テンプレートは、多様化されたライブラリーを挟み込むと共に、mNeonGreenのCas9切断部位の両側の配列に対して、それぞれ48又は45塩基対の相同性を有していた。最後に、この修復テンプレート内の可変ドメインは、欠失された塩基対を含むことにより、正しいリーディングフレームを復元できると共に、残りのC末端ドメインを正確に発現するように構成されていた。トランスフェクションの後、蛍光顕微鏡で毎日観察したところ、トランスフェクションから48時間後に細胞内に緑色蛍光が生じ始め、その後に蛍光mNeonGreen変異体を発現する細胞の明度及び数は増加し続け、トランスフェクションから96時間後には最大となった。斯かる遅れは、第一のCas9、その後のゲノムDNAの特異的な開裂、それに続く相同性修復、その後のCMVプロモーター誘導性のmNeonGreen変異体の発現が、連続的に進行するのに時間を要したためと考えられる。対して、フレームシフトを親mNeonGreenの状態に修復するだけのテンプレートを用いた対照反応によれば、効率は5%に過ぎなかった。なお、蛍光細胞の百分率はサイトメトリーにより検出した。
【0307】
この段階で、細胞を明度に基づくFACSに供した。mNeonGreenウェルのスペクトルプロファイルに合わせたFITCチャンネルを、FACSAria IIIソーター(BD)と組み合わせて用いた。その後のシークエンシングに向けてライブラリーサイズを最大化するために、このシグナルを示す細胞を、ベースラインを超えるものも含めて全て採取した。選別した細胞を更に3ラウンドのスクリーニングに供し、各ラウンドで上位5%の細胞を取得して培養した。
図3に示すように、多様化された変異体からの初回の細胞の選択では、蛍光強度の分布は広く、平均強度は極めて低かった。斯かる低レベルの平均蛍光は、蛍光タンパク質の構造に悪影響を及ぼす変異体が多数存在していたことによる。
【0308】
多様化された残基が所望の部位に正しく挿入されたことを確認するために、第1ラウンドのFACS選別後に細胞を採取し、ゲノムDNAを抽出した。多様化されたmNeonGreen遺伝子をPCRで抽出し、大腸菌(E. coli)発現ベクターにクローン化した。形質転換の後、細菌コロニーのランダム選択を選び出し、変異体の配列を決定した。複数のクローンのシークエンシング結果を
図6に示す。変異体は所期の所望の部位で多様化されていた。更に、多様性を有する配列を検証したところ、何れのコドンのバイアスも観察されなかった。
【0309】
更なるラウンドの選別を行う毎に、暗い変異体(即ち、蛍光強度が低レベルの変異体)が除去され、ライブラリー集団の平均蛍光は上昇した。
図4に、最後の第3ラウンドの選別の後の結果を、親mNeonGreenと比較して示す。両ライブラリー集団の平均明度から分かるように、親mNeonGreenと比較して、本発明者らが選別した多様化変異体の蛍光の方が高かった。
【0310】
最終ラウンドのFACS選別で得られた細胞の画像を
図5に示す。細胞は均一な蛍光を示し、細胞小器官内に隔離された凝集体は見られなかった。FACs選別の最終ラウンドの後、mNeonGreenのより明るい変異体をコードする遺伝子をRT-PCRで抽出し、cDNAへと転写し、細菌発現ベクターにクローン化した。斯かるmNeonGreen変異体の一つを、暫定的にmNeonGreen2(配列番号91及び92)と命名し、精製してその特性をより詳細に決定した(
図7)。
【0311】
このアプローチを用いて多様化されるmNeonGreen内の更なる標的部位の概要を
図8に示す。It is expected that これらの標的部位を多様化することで、より強い白光を有するmNeonGreenの変異体が得られることが期待される。最後に、本願内で提示したプロトコールを用いて、これらの多様化された部位を全て組み合わせれば、超高発光のmNeonGreenの変異体が得られるかも知れない。
【0312】
図8に示したmNeonGreen内の他の部位に対してCas9を標的化するのに使用できるsgRNAの配列を
図9に示す。
【0313】
材料及び方法
【0314】
不活性化突然変異を有するmNeonGreenを含むmNeonGreen基質プラスミドの構築
プラスミドpSLiCE3-NeonGreen(Shaner, 2013, Nature methods 10.5: 407-409)mNeonGreenのコーディング領域(Allele Biotechnology;核酸配列については配列番号27参照;アミノ酸配列については配列番号28参照)を、プライマー5’-TCGCTGACCGCTGCGGACGCAGGTCGAAGAAGACTTACC-3’-フォワード(配列番号13)及び5’-GTCCGCAGCGGTCAGCGAGTTGGTC-3’-リバース(配列番号14)を用いた部位特異的突然変異誘発に供し、4塩基対を削除した。特に、mNeonGreenのヌクレオチド配列の位置442~445が欠失された。欠失位置は、切断部位の1bp下流、選択されたPAM部位の3bp上流であった。選択されたPAM部位は、mNeonGreenのヌクレオチド配列の位置448~450であった。換言すれば、塩基対442、443、444及び445が欠失され、位置446及び447(2bp)が維持された。選択されたPAM部位は位置448、449及び450であった。これにより、一アミノ酸が除去され、フレームシフトが導入されて、非蛍光タンパク質が生じた。この非蛍光タンパク質をNGFSと命名した。mNeonGreenの突然変異を形成したコーディング領域の核酸配列を配列番号29に示す。
【0315】
突然変異誘発PCRの後、NGFSのコーディングドメインを、以下のプライマーを用いて増幅した。
5’-TCGCTGACCGCTGCGGACGCAGGTCGAAGAAGACTTACC-3’(フォワードプライマー、配列番号15);及び
5’-CGGCCGCCACTGTGCTGGATCTATTATCACTTGTACAGCTCGTCCATGC-3’(リバースプライマー、配列番号16)。
【0316】
上記のプライマーは、pcDNA5-FRT ベクター(Thermofisher)との重複配列を含んでおり、PCRで生成したコーディングドメイン断片を、SLiCEクローニング(Methods Mol Biol. 2014; 1116: 235-244)を用いて、AflII-Not1で切断したpcDNA5-FRT(Thermofisher)ベクターに組み込むことにより、結果としてコンストラクトpcDNA5-FRT-NGFSを生成した。このコンストラクトの配列をDNAシークエンシングにより検証した。
【0317】
sgRNA/Cas9プラスミドの構築
プラスミドpSpCas9(BB)-2A-Puro(Ran, 2013, Nat Protoc. 8(11): 2281-2308)を制限酵素BbsI(NEB)で二重に切断し、ゲル精製し(NucleoSpinゲル及びPCR Clean-up、Macherey-Nagel)、予めアニールしたプライマー5’-CACCGCGCTGACCGCTGCGGACGC-3’(フォワード、配列番号17)及び5’-AAACGCGTCCGCAGCGGTCAGCGC-3’(リバース、配列番号18)に連結して、4塩基対欠失の上流のNGFS配列を標的化するsgRNA配列をコードする核酸配列を生成した。特に、4bp欠失は20bpのNGFSの認識配列内に存在した。sgRNAをコードする配列をプラスミドpSpCas9(BB)-2A-Puro内に、U6プロモーターから発現されるように導入した。最終コンストラクト(pSpCas9(BB)-2A-Puro-NGFSと命名した)をシークエンシングで確認した。このpSpCas9(BB)-2A-Puro-NGFSを用いることで、Cas9ヌクレアーゼ及び対応するsgRNAを発現させ、Cas9ヌクレアーゼを、NGFS遺伝子配列の4塩基対欠失の上流の所定の部位に標的化することができる。
【0318】
ドナー核酸テンプレートライブラリーの構築/設計
合成されたssDNAの105塩基対の修復テンプレート(即ちドナー核酸テンプレート)、名称NSFS-R(配列番号30参照)は、NGFS欠失の両側にそれぞれ50bpの相同配列を含むと共に、NGFS配列内の4bpが欠失された配列である。本テンプレートを用いて、Cas9系の効率を試験した。また、欠失されたアミノ酸及びフレームシフトを置換し、欠失に隣接する1又は2アミノ酸をランダム化するために、やはり50bpの相同性フランキング配列と、縮重NNBコドンとを含む2つのドナー核酸テンプレートのライブラリーも生成した。これらのライブラリーは、それぞれランダム化されたアミノ酸の数に因んで、NGFS-3M及びNGFS-5Mと命名した。
【0319】
全てのクローニング工程は、大腸菌(E. coli)XL1-ブルー(Agilent)内で、アンピシリンを補充したLBプレート及びLB培地を用いて、37℃で培養することにより行った。
【0320】
安定な細胞系列の生成
Flp-In-293細胞系列(Thermofisher)の培養は、10%のFBS、100U/mLのペニシリン、100μg/mLのストレプトマイシン、及び2.5mMのL-グルタミンを補充したDMEMを用いて行い、pcDNA5-FRT-NGFSと、Flp-リコンビナーゼをコードする遺伝子を含むpOGG44プラスミド(Thermofisher)とを用いて共形質転換を行った。形質転換にはリポフェクタミン3000を用い、標準的なプロトコールに従って行った。細胞を100μMのハイグロマイシン選択に供し、同質なコロニーが生成されたら、斯かるコロニーをプールし、標準プロトコールに従って維持した。結果として、NGFS遺伝子の単一のコピーを含む安定な細胞系列が得られた。注目すべきは、使用されたFlp-Inストラテジーによって、単一のpcDNA5-FRT-NGFSベクターがFlp-In-293細胞系列内の所定の標的部位に(Flp媒介組換えにより)導入され、NGFS遺伝子の単一のコピーがゲノムに組み込まれることになる。Flp-In組換えの基本原理は、本技術分野で公知であり、例えばhttps://www.thermofisher.com/de/de/home/references/protocols/proteins-expression-isolation-and-analysis/protein-expression-protocol/flp-in-system-for-generating-constitutive-expression-cell-lines.htmlに記載されている。
【0321】
HEK293 Cas9発現、ドナー修復テンプレートライブラリーの提供、及びFACS選別
細胞を10cmのプレートで80%の集密度となるまで培養した後、pSpCas9(BB)-2A-Puro-NGFSと、ドナー核酸テンプレートのライブラリーNGSF-3M、NGFS-5M、及びNGFS-Rの何れかとの共形質転換に供した。細胞を蛍光顕微鏡(Axiovert 135TV, Zeiss)で観察したところ、96時間後に最大の蛍光が観察された。細胞をFACS細胞選別(FACSAria III, BD Biosciences)用に調製した。FITC チャンネルで蛍光を発する全ての細胞を選別し、増幅した。
【0322】
第1ラウンドでは、NSFS-3M及びNGFS-5M選別細胞を、10cmのプレート上で密集するまで培養し、その時点で5百万の細胞を採取し、DNeasy Blood & Tissueキット(Qiagen)を用いたゲノムDNA抽出に供した。残る細胞を培養し、その後のラウンドのFACSに供し、各ラウンド毎に上位5%の明度を有する細胞を選択して増幅した。最終ラウンドの後、最もパフォーマンスの良い変異体、即ち最も蛍光の強い変異体からゲノムDNAを抽出した。
【0323】
DNA分析及び標的遺伝子の突然変異の検証、並びにタンパク質の発現及び分析
上記の手順で単離されたゲノムDNAをテンプレートとして用い、プライマー5’-ATAAGGATCCGGCCACCATGGTGAGCAAGGGCGAGGAGGAT-3’フォワード(配列番号38)及び5’-TATAGGAATTCCTATTATCACTTGTACAGCTCGTCCATGCCC-3’ リバース(配列番号39)を用いて、修復されたmNeonGreenのコーディングドメインを抽出した。これらのプライマーは、EcoRV切断ベクターpSLiCE3との重複領域を有する。SLiCEクローニング及びその後の大腸菌(E. coli)XL1-ブルーの熱ショック形質転換により、蛍光コロニーを生成した。初回ラウンドのNGFS-3M及びNGFS-5M選別では、蛍光強度には大きなばらつきが見られた。シークエンシング及びその後の大腸菌(E. coli)株BL-21(NEB)内での発現のために、コロニーを選択してプラスミド調製(NucleoSpin Plasmid, Macherey-Nagel)に供した。
【0324】
要すれば、LB+アンピシリン中、37℃、振盪下で培養した形質転換BL21の初回培養物4mLを、200mLの自己誘導性Studier培地に接種し、RT、震盪下で48h培養した。細胞を採取し、リゾチームで溶解し、凍結融解サイクルに供し、10mの超音波処理に供した後、超遠心分離を行った。10-Hisタグ化タンパク質を、NI-NTA樹脂(Jena Bioscience)で精製し、25mMのイミジゾール(Imidizole)で洗浄し、250mMのイミジゾール(Imidizole)で溶出した。3MグアナジンHCl中95℃で5mの熱変性後、蛍光タンパク質の濃度をBradfordアッセイで決定した。480nmの励起を用い、0.01~0.1吸光度単位の希釈スペクトルの統合蛍光スペクトルにより量子収量を決定し、0.1NのNaCl中フルオレセインの発光で較正した(QE0.95)。
【0325】
実施例2:多様化及び標的化された突然変異誘発の方法の考えられる変形例
【0326】
本発明の手段及び方法によれば、標的タンパク質内のペプチド配列に対し、複合飽和突然変異誘発(complex saturated mutanogenesis)が可能となる。一般的な手順の流れを
図10に示す。
【0327】
本プロセスはまず、培養された細胞系列に対する初期の遺伝子(gene-of-interest:GOI)の安定且つ単一コピーのみの組み込みを達成する。斯かる単一コピーの組み込みプロセスは、種々の手段により達成できる。例としては、標準的な抗生物質による選択、Flp-In及びJump-In組換え、レンチウイルストランスフェクション及び選択、又は、例えばAAVS1遺伝子座内等における、相同性ドメインを用いたCas9標的化切断及び組換え等が挙げられる。以下の記載では安定な単一コピーの細胞系を生成するためのFlp-In系に絞って説明するが、これに限定されるものではない。
【0328】
GOIはフレームシフト突然変異を受容するが、これは多様化の標的部位に位置する。また、斯かる部位は、部位特異的ヌクレアーゼによる開裂の標的としても好適である。当該GOIは、蛍光タンパク質でも非蛍光タンパク質でもよい。所望の場合には、斯かるGOIによりコードされるタンパク質産物は、種々のマーカー遺伝子、例えば更なる蛍光レポーター又は薬物抵抗遺伝子等と融合されたものであってもよい。その場合、これらのマーカーは直接融合していてもよく、開裂可能な又は自己開裂ペプチドリンカーにより融合していてもよい。GOI内のフレームシフトゆえ、斯かるマーカーは当初は正しく発現されない。斯かるフレームシフトは、GOIのクローニングの際に、部位特異的突然変異誘発によって生じるものであってもよく、或いはGOI・マーカー融合体を含む細胞系内で直接的、以下に記載するようなヌクレアーゼプロセスによって生じるものでもよい。
【0329】
所期の遺伝子内に標的化二本鎖切断を導入するには、ヌクレアーゼとしてCRISPR/Cas9を用いることが好ましい。効率的であり、且つ、遺伝子内の多くの部位を標的とするようプログラム可能だからである。しかし、一本鎖ニック、又は好ましくは二本鎖切断を導入する他の酵素及び手段、例えばジンクフィンガーヌクレアーゼ(ZNF)又は転写アクティベーター様エフェクターヌクレアーゼ(TALEN)も適用可能である。所期の遺伝子内の正しい位置に存在しない場合、CRISPR (PAM部位)による開裂の標的部位や、TALEN又はジンクフィンガーヌクレアーゼの標的部位を、所期の遺伝子内にフレームシフトと共に組換え導入することができる。切断及び修復により、斯かる部位は多様化された遺伝子から除去することができる。
【0330】
切断/修復プロトコールの効率を向上させることが可能な手段は幾つか存在する。トランスフェクションプロトコールや、sgRNA及びCas9又は他のヌクレアーゼを細胞内に送達する方法は、最適化することができる。更に、例えばE1B55K及びE4orf6を共発現する方法や、阻害剤Scr7を用いてKU70及びDNAリガーゼIVを抑制する方法を介して、非相同末端連結(NHEJ)を抑制することにより、相同組換え修復の効率を改善することができる。
【0331】
GOI内のゲノムDNAの開裂を標的化するには、単鎖DNAを相同組換え修復のテンプレート(即ちドナー核酸テンプレート)として使用する。斯かるオリゴヌクレオチドは、多様化に必要な縮重コドンと、フレームシフトを修正する塩基対とを含む。多様化配列の両側には、開裂部位に隣接する領域に対して相同な、長さ30~80塩基対の領域が配置される。斯かる多様化配列は、あらゆるアミノ酸の発現を可能とするべく、特定のアミノ酸や縮重コドン、例えばNNN、NNK/NNS、NNB、又はMAX系を含んでいてもよい。縮退コドンの間には、重要であり、多様化すべきでない、元のペプチド配列由来のアミノ酸が介在していてもよい。縮重の数や具体的なコドンの数は種々変更してもよく、それによって最終タンパク質の長さが延長又は短縮されてもよい。
【0332】
多様化の後、正しい処理を受けた細胞は、融合されたマーカー遺伝子を発現する。この遺伝子はGOIと同一のレベルで発現される。蛍光タンパク質を使用する場合、この遺伝子はタンパク質濃度の推定根拠ともなる。従って、GOIを利用した結合アッセイのためには、発現レベルに基づき結合を較正することができる。蛍光マーカー遺伝子を発現する細胞は、抗生物質選択よりも迅速なプロセスである、FACS又はマイクロ流体選別により迅速に採取可能である。
【0333】
融合マーカーが陽性又は陰性の抵抗性遺伝子である場合、多様化された変異体のみからなる細胞集団を得るには、幾つかの可能性が存在する。複数の開裂可能なペプチドリンカー、例えばT2A又はF2Aと共に、陽性マーカーと陰性マーカーの両方を使用する場合は、元のGOIを上記のプロセスでフレームシフト変異体に変換し、陰性選択を用いて非フレームシフト変異体を除去すればよい。このためには、例えば単純ヘルペスウイルス1型チミジンキナーゼ等の遺伝子を用い、ガンシクロビル等で選択を行えばよい。こうして同質な細胞が得られたら、上記のプロセスによる多様化を行った後、残存する不所望のフレームシフト変異体を、陽性選択遺伝子、例えばハイグロマイシンホスホトランスフェラーゼ等と、ハイグロマイシンB等を用いて除去すればよい。但し、他の選択マーカーを使用することも可能である。
【0334】
本開示にて提供される製造方法の用途の例として、既知の最も明るい単量体蛍光タンパク質である、mNeonGreenをコードする遺伝子の多様化を挙げて説明する。本開示にて提供される方法を用いることで、種々のタンパク質、例えばmNeonGreen等を多様化し、明度が増した変異体をFACSにより選別することができる。単量体mNeonGreenは、三量体蛍光タンパク質LanYFPから改変されたものである。赤色蛍光マーカー遺伝子mKate2を、mNeonGreenのC末端に融合してもよい。フレームシフト修正の後も蛍光は維持されるが、多様化されたmNeonGreenの変異体は、明度が低下した場合や非蛍光の場合でも採取することが可能である。選別の際にはmKate2を利用して、タンパク質発現レベルを修正してもよい。実験プロセスの例を
図10に示す。
【0335】
予測される結晶構造、及び、mNeonGreenの開発に際し公開された研究結果によれば、複合飽和突然変異誘発のために標的化可能な領域は5つ存在する。mNeonGreen内の標的選択の例を
図8に示す。mNeonGreen内の部位を標的とするsgRNAの生成に使用可能なプライマーのリストを
図9に示す。本開示にて提供される方法を用いることにより、例えば各遺伝子座において、5つのアミノ酸に飽和突然変異誘発を生じさせることで、一遺伝子座当たり3百2十万の組合せ変異体を生じさせることが可能となる。更に、多様化対象の配列内において、一部の部位で特定の残基が改変されないように、本開示にて提供される方法を実施することも可能である。例えば、二量体及び三量体形成を防止し、単量体mNeonGreenを生成する目的で従前導入された残基を、改変されないようにブロックしてもよい。これらの残基の改変を防ぐことで、二量体による干渉の形成を防止することが可能となる。斯かる本開示にて提供される方法の例は、本発明が可能とする突然変異誘発が、極めて高いフレキシビリティーを有することを示している。
【0336】
初回の選別で、組換えが首尾よく行われたことを示す赤色蛍光変異体の全てを選別した後、mNeoGenシークエンシングを用いて多様化領域の配列を決定し、多様化の範囲を正確に確認してもよい。斯かるシークエンシングには、例えばIllumina MiSeq NextGen シークエンシングプラットフォームを使用できる。
【0337】
変異体の各セットを複数ラウンドのスクリーニングに供し、最も優れた特性を有する蛍光タンパク質変異体を選択してもよい。最終的な変異体を、任意により特性決定後、DNAシャッフリングに供することにより、野生型の所期のタンパク質、この場合には前駆体であるmNeonGreenと比較すべき、最終セットとなる変異体の組み合わせを生成してもよい。
【0338】
材料及び方法
【0339】
融合遺伝子(例えばmNeonGreen及びmKate2)を多様化するための材料及び方法を以下に示す。
【0340】
オリゴアニーリング及び骨格ベクターへのクローニング:
【0341】
1.1μgのpSpCas9(BB)-2A-Puroを、BbsIにより37℃で30分間消化:
1μg プラスミド (pSpCas9(BB)-2A-Puro)
1μL BbsI
1μL アルカリホスファターゼ
2μL 10×緩衝剤
XμL ddH
2
O
20μL 総量
2.消化されたプラスミドをゲルで精製
3.オリゴの各対をリン酸化及びアニール:
1μL オリゴ1(100mM)
1μL オリゴ2(100mM)
1μL 10× T4ライゲーション緩衝剤(NEB)
6.5μL ddH2O
0.5μL T4 PNK(NEB)
10μL 総量
アニールはサーモサイクラーで、以下のパラメーターを用いて実施:
37℃ 30分、
95℃ 5分、その後
25℃まで5℃/分ずつ降温。
4.ライゲーション反応を設定し、室温で10分間:
XμL 工程2のBbsI消化プラスミド(50ng)
1μL 工程3のリン酸化及びアニールされたオリゴ二本鎖(1:200希釈)
5μL 2× Quickライゲーション緩衝剤(NEB)
XμL ddH
2
O
10μL 部分総量
1μL Quickリガーゼ(NEB)
11μL 総量
5.プラスミドをXL1-ブルーに形質転換。
6.シークエンシングによりクローンを確認、Midiprepでベクターを増幅。
【0342】
PCR突然変異誘発のためのフレームシフト用プライマー
【表1】
【0343】
PCR突然変異誘発
【0344】
1.PCR pSLiCE3-NeonGreen
1μL プラスミド
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
35μL ddH
2
O
50μL 総量
95℃/30s変性、60℃/30sアニーリング、72℃/3m伸長:
2.Dpn1消化
50μLのPCR反応混合物中2.5μL
37℃で60分:
3.分析ゲル + PCRクリーンアップ。
【0345】
FRT ベクター 生成
1.PCR NeonGreen-フレームシフト
1μL pSLiCE3-NeonGreenフレームシフト
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
35μL ddH
2
O
50μL 総量
95℃/30s変性、60℃/30sアニーリング、72℃/30s伸長:
2.PCR mKate2
1μL pSlice3-mKate2
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
35μL ddH
2
O
50μL 総量
95℃/30s変性、60℃/30sアニーリング、72℃/30s伸長:
3.1μgのpcDNA5FRT-APMA-ap-IRES-H2BGFPをAflII及びNotIにより37℃で3時間消化:
1μg プラスミド
1μL AflII
1μL NotI
2μL 10×緩衝剤
XμL ddH
2
O
20μL 総量:
4.消化されたDNAのゲル精製:
5.DNA断片を37℃で30分間、SLiCEでライゲート:
1μL 工程3の切断プラスミド
3μL 工程1の断片
3μL 工程2断片の
1μL T4ライゲーション緩衝剤
1μL SLiCE 試薬
1μL ddH
2
O
10μL 総量:
6.形質転換:
7.シークエンシングによるクローンの確認。
【0346】
安定な細胞系列の生成
1.3×30mmプレートでFlp-In-293細胞を80%の集密度となるまで培養。
2.形質転換する with 10:1のpOG44プラスミド及びpcDNA5-FRT-NGFSプラスミドをリポフェクタミン3000で形質転換。
3.抗生物質の不在下、30℃で一晩培養。
4.コロニーが形成されるまで30、60、及び120μg/mLのハイグロマイシンで選択。
【0347】
ライブラリー生成
1.4×10cmプレートで各mNeonGreen-mKate2変異体を80%の集密度となるまで培養。
2.pSpCas9(BB)-2A-Puro-NGFS1-5プラスミドをリポフェクタミン3000により形質転換。100pM/ulテンプレートを1000×に希釈し、培地の最終体積とする(100nM)。
3.FACS前に96時間培養。
【0348】
FACS 第1ラウンド
1.細胞をトリプシンで処理。
2.2百万細胞/mLとなるよう再懸濁。
3.NeonGreen-mKate2 対照系を含め、各細胞系列につき1百万事象を記録。
4.mNeonGreen-mKate2対照系により決定される、mKate2蛍光を示す全細胞を選別。
mKate2にはPE-TexasRed又はPE-Cy5を用い、最も優れたシグナルのものを使用。
15mLファルコンチューブに2mLの培地を入れ、各コンストラクト当たり4本を作製。
400k細胞毎に採取チューブを交換。
5.コンストラクト当たり約1.6百万細胞を予想(5%効率)。
6.2×10cmプレートで密集するまで培養。
7.各ライブラリー変異体につき、細胞をトリプシン処理し、プールし、洗浄し、5百万細胞を採取して、DNeasy Kitを用いてゲノムDNA抽出。DNAを-80℃で保存。
8.残る細胞をFACS用に2×10cmプレートに播種。
【0349】
FACS 第2ラウンド以降
1.細胞をトリプシンで処理。
2.2百万細胞/mLとなるよう再懸濁。
3.NeonGreen-mKate2 対照系を含め、各細胞系列につき1百万事象を記録。
4.FITCチャンネルの全ての細胞を選別。
Forward ScatteringによりFITCをプロット。
明度が上位10%の細胞を取得、但しサイズにより較正。
15mLファルコンチューブに2mLの培地を入れ、各細胞系当たり4本を作製。
400k細胞毎に採取チューブを交換。
5.コンストラクト当たり約1.6百万細胞を予想。
6.2×10cmプレートで密集するまで培養。
【0350】
実施例3:蛍光タンパク質mRuby2の原位置標的化突然変異誘発及びその後の変異体のディープシークエンシング分析
【0351】
この実施例3では、Flp-リコンビナーゼ系を用いて、タンパク質をコードする遺伝子の単一のコピーを哺乳類細胞系列に挿入する。本実施例においては、蛍光タンパク質mRuby2(Lam, 2012, Nature methods 9.10: 1005-1012)(配列番号31)を、ピューロマイシン抵抗性遺伝子(ピューロマイシンR)(配列番号32)に対し、P2Aペプチド(配列番号2)を介してC末端で連結したものを作製した。前記ライブラリーの成員を親mRuby2から識別するために、不活性化突然変異をフレームシフトの形態で、mRuby2のリーディングフレーム内に挿入し、標的タンパク質の正しい発現、惹いてはC末端に融合されたタンパク質ピューロマイシンRの正しい発現を阻害した。変異体ライブラリー生成手順は、2つの連続する工程を含む。要すれば、第一の工程では、Cas9/mRuby2-P2A-puroR二重安定細胞を、まずインビトロ(in vitro)転写フレームシフト用ssODNトでランスフェクトすることにより、発色団領域内の2つのヌクレオチドを欠失させて特異的なフレームシフトを生じさせる。その後、フレームシフトにより非発光性となった細胞をFACSで選択する。その後の第二の工程では、フレームシフトされたmRuby2-P2A-puroRカセットを発現する非発光細胞を、フレームシフトされたmRuby2に結合する他のインビトロ(in vitro)転写sgRNA及びssODNにより、ランダム化しながらトランスフェクトすることにより、mRuby2変異体ライブラリーを生成する。C末端に融合されたピューロマイシン抵抗性遺伝子により、mRuby2ライブラリーを適切に発現する細胞を陽性選択して濃縮すると共に、フレームシフトを含む親細胞を取り除くことが可能となる。第二の工程の最後に、ピューロマイシンによる抗生物質処置を行う。実験の詳細は方法の欄で説明する。
【0352】
多様化対象の蛍光タンパク質のコンストラクト設計を、
図11に模式的に示す。
【0353】
第二のmRuby2コンストラクトには、青色蛍光タンパク質TagBFP2に加えて、ピューロマイシン抵抗性遺伝子がC末端マーカーとして組み込まれている(配列番号94)。これにより、青色レーザーラインによる更なるFACS選別が可能となる。斯かるコンストラクトを
図15に模式的に示す。
【0354】
結果及び考察
【0355】
詳細には、まず、マーカータンパク質であるN-アセチルトランスフェラーゼピューロマイシン抵抗性タンパク質の単一のコピーを含むプラスミドベクター(pcDNA5-FRT-mRuby2-P2A-ピューロマイシンR)を生成する。マーカータンパク質は、P2Aペプチドを介して蛍光タンパク質mRuby2のC末端に連結され、CMVプロモーターの制御下で発現される。並行して、ネオマイシン抵抗性遺伝子に融合されたCas9遺伝子を安定に発現するHEK293細胞系列を生成した。
【0356】
次工程では、pcDNA5-FRT-mRuby2-P2A-ピューロマイシンRプラスミドベクターの単一のコピーがゲノムに組み込まれたCas9安定化細胞を用いて、二重安定細胞系列を生成した。具体的には、これはFlp-In-293細胞系列(Thermofisher)へのFlp-In組換えを用いて達成した。最後に、mRuby2-P2A-ピューロマイシン遺伝子カセットの単一のコピーを含み、Cas9-ネオマイシンR遺伝子を発現する二重安定細胞系列が生成された。
【0357】
生成された二重安定細胞系列を、2つの工程からなる突然変異誘発プロトコールに利用した。これにより最終的に、mRuby2の複数の異なる突然変異体を発現する細胞のパネルが生成された。斯かるライブラリー生成手順は、連続する2つの工程を含む。第一の工程では、mRuby2+/Cas9+二重陽性細胞を、まずmRuby2の発色団領域内の2つのヌクレオチドの欠失により特異的にフレームシフトを導入するssODNでトランスフェクトする。その後、mRuby2にフレームシフトを生じることで暗くなった細胞を、FACSにより選択した。それに続く第二の工程では、フレームシフトを含むmRuby2-P2A-ピューロマイシンRタンパク質を発現する非発光細胞を、フレームシフトを修復することにより変異体細胞ライブラリーを生成するssODNにより、ランダム化しながらトランスフェクトした。第一及び第二の工程の何れにおいても、変異体は組換え系アプローチにより、本実施例の場合は部位特異的二本鎖切断(double-strand break:DSB)を導入するCRISPR/Cas9系により生成した。
【0358】
第一の工程では、前記細胞のゲノムにおける、Met-67のコドンの最後のヌクレオチドに対応する位置に、DSBが導入された。これは、mRuby2の発色団領域の一部に当たる。この第一のDSBによって、mRuby2-P2A-ピューロマイシンRカセットの単一のコピー内にフレームシフト突然変異が生じる。斯かる目的の下、mRuby2タンパク質を不活性するために、特異的にインビトロ(in vitro)で転写されたsgRNAで、mRuby2/Cas9二重安定細胞系列をトランスフェクトすると共に、フレームシフトを生じさせるssODNドナーテンプレートを細胞系列に共トランスフェクトした。斯かるオリゴヌクレオチドは、相同標的化修復により、導入されたDSBを修復するためのドナー核酸テンプレートとして機能させるための配列を有する。相同標的化修復のためのドナー核酸テンプレートとして機能するために、斯かるオリゴヌクレオチドは、DSBに隣接する領域に相同な配列を含む。更に、斯かるオリゴヌクレオチドは、mRuby2の発色団領域のすぐ上流側に、2つのヌクレオチドを欠失させ、フレームシフトを生じさせる配列を含む。
【0359】
Tフレームシフトを生じさせるssODNトランスフェクションの2日後、mRuby2のフレームシフト変異体を発現する細胞を採取するべく、細胞をFACSに供した。TexasRedチャンネルを、mRuby2のスペクトルプロファイルに適合させたFACSAria IIIソーター(BD)で用いた。mRuby2を発現しないHEK293細胞系列の基底シグナルに基づきオフセットされた上で、ゼロ値シグナルを示す全ての細胞を、フレームシフトを生じた非発光細胞として採取した。FACS選別データによれば、全集団に対する非発光細胞の百分率は、即ち突然変異効率は40%であった。選別した細胞を更に4日間培養した上で、突然変異誘発プロトコールの第二の工程に供した。非発光細胞の選別後の4日目に、細胞の半分を保存用に凍結し、残る半分を第二の工程で用いた。
【0360】
第二の工程では、前記細胞のゲノム内における、mRuby2遺伝子の発色団領域のすぐ上流側に相当する位置に、DSBを導入した。この第二のDSB、及び、それに続く共送達されたssODNライブラリーを通じた相同標的化修復によって、フレームシフトを修正すると共に、変異体mRuby2細胞ライブラリーを生成した。相同標的化修復のドナー核酸テンプレートとして機能するために、一本鎖オリゴヌクレオチド(ssODNs)は、DSBに隣接する領域に相同な配列を含む。更に、斯かるオリゴヌクレオチドは、mRuby2の発色団領域タンパク質を含む、アミノ酸Met67-Try68-Gly69を置換する多様化されたコドンを含む。斯かるオリゴにおけるコドンの多様化のために、合成スキームNNBを使用した。ここで、Nは任意のヌクレオチドを表し、BはA(アデニン)以外の任意のヌクレオチドを表す。オリゴヌクレオチドはリバース鎖に結合するため、多様化されるコドンは配列VNNでコードされる。ここで、VはT(チミジン)以外の任意のヌクレオチドを表す(配列番号33参照)。従って、逆鎖から読んだ場合、生成される配列はNNBとなる。
【0361】
ssODNは全長109ヌクレオチドであった。ssODNの5’及び3’の両部位には50塩基の相同性領域が存在し、それらの間には9つのランダム化されたヌクレオチドが存在する(配列番号34)。NNBコドンは、第一及び第二のヌクレオチド位置(NN)における4種のヌクレオチドの何れかと、第3の位置(B)におけるA以外のヌクレオチドとからなる。実験の詳細は方法の部に示す。また、斯かるオリゴヌクレオチドは、mRuby2内のフレームシフト突然変異を、相同標的化修復によって除去するように構成される。適切なsgRNA及び修復オリゴヌクレオチドとのトランスフェクションから24時間後、培地を交換し、培地に新鮮なピューロマイシンを補充しながら、3日間連続で2μg/μLのピューロマイシンを細胞に適用した。最初の2日間の適用後には、相当数の細胞死が観察されるが、3日目には、それほどの細胞死は見られなくなったので、ピューロマイシン処理を終了した。ピューロマイシン処理により、インフレーム変異体が陽性選択され、親フレームシフト細胞が、不所望の早期の停止コドンを有する細胞と共に除去された。最終的に、この抗生物質処置により、所望のライブラリーを含む細胞が濃縮された。
【0362】
最後に、全ライブラリーを、MiSeq次世代シークエンシング系(Illumina)によるディープシークエンシングに直接用いた。全変異体遺伝子ライブラリーを採取するために、RNeasyミニキット(Qiagen)を用いて総RNA単離を実施した。総RNAの採取後、遺伝子特異的プライマー(配列番号35)を用いて、mRuby2配列をcDNAライブラリーに逆転写し、続いてMachery Nagelゲル&PCRクリーンアップキットで精製した。次に、これらのcDNAライブラリーを10サイクルのPCRで増幅し、ディープシークエンシングに供した。mRuby2配列の所期の小さな領域のみをPCR増幅した。増幅された配列は、野生型mRuby2のDNA配列内のヌクレオチド位置86~313内の領域に対応する。10サイクルのPCRにはフォワード及びリバースプライマーを用いた。これらは何れも、ライブラリーアンプリコンがIllumina MiSeqプラットフォームのフローに結合するのを可能とする、アダプターフランキング配列を有する(配列番号36及び配列番号37)。
【0363】
図12に示すように、配列の91%はインフレームであった。これは、ピューロマイシン選択が効率的に行われ、フレームシフトmRuby2-P2A-ピューロマイシンRカセット及び/又は早期の停止コドンを含む細胞の殆どが除去されたことを示している。他方、ライブラリーの要請を完全には満たさない配列が存在することも分かる。これらは、おそらくは相同標的化修復により、ヌクレオチド及びコドンの更なる挿入又は欠失が導入されたものと考えられる。しかし、本発明者らは、このように多様化された標的配列の長さに更なるばらつきが生じたことは、プロトコールの好ましい副作用であり、興味ある表現型の検出に有用かもしれないと考えた。オリゴヌクレオチドによって導入されたライブラリーの長さを完全に反映した配列の百分率は35%であった。
【0364】
図13に示すディープシークエンシングデータは、突然変異を形成したタンパク質の長さには、218~243アミノ酸の間のばらつきがあることがあることを示している。それにもかかわらず、観察された主なタンパク質の長さは236であった。これは、野生型mRuby2タンパク質の長さである。これらのデータは、提案した突然変異誘発系によって、タンパク質の長さの点では、極めて高い正確さで、タンパク質ライブラリーを生成することができたことを示している。
【0365】
3コドン、9ヌクレオチドからなるmRuby2の発色団領域に対して、5’側及び3’側にそれぞれ50塩基の相同性アームを有し、これらの相同性アームの間に3つの連続するNNBコドン(ここでNは任意のヌクレオチドを示し、BはA(アデニン)以外の任意のヌクレオチドを示す)を有する一本鎖DNAオリゴヌクレオチドを用いて、突然変異形成を誘導した。斯かる設計によって、TAA及びTGA停止コドンの生成が除かれる。
図14は、何れのコドンでも3番目の位置にはAヌクレオチドが観察されないことを示している。更に、突然変異形成位置全体に亘って、ヌクレオチドは概ね均等に、即ちランダムに分布している。これは、提案した方法により、意図的にプログラムされたバイアスを以て、極めて不均一且つ複雑なライブラリーが生成されたことを示している。
【0366】
第二の親コンストラクトでは、mRuby2が青色蛍光タンパク質TagBFP2及びピューロマイシン抵抗性遺伝子に融合された(
図15)。このコンストラクトを用いて、アミノ酸43~47を多様化した。結晶構造の情報によれば、残基Q43、T44、M45、R46、及びI47は発色団と相互作用する領域の一部であることから、多様化の標的として期待される。まずは
図15に示す、mRuby2-TagBFP2-ピューロマイシンをコードする発現カセットを、HEK293細胞のゲノム内に単一コピーのみ挿入した。これは、上述のようにFlp-In-293細胞系列に対するFlp-In組換えにより実施した。導入されたmRuby2-TagBFP2-ピューロマイシン遺伝子の単一のコピーは、不活性化されたフレームシフト突然変異をmRuby2遺伝子内に含んでおり、これによりカセットからのmRuby2タンパク質の発現が防止される。斯かる遺伝子のベクター内へのクローニングに先立ち、当該遺伝子に部位特異的突然変異誘発によりフレームシフト突然変異を導入した。具体的に、フレームシフト突然変異の特定の標的部位への導入は、所定の位置における2つの塩基対を欠失させ、mRuby2のフレームシフト型ヌクレオチド配列を生成することにより行った。その後、生成された細胞系列を用いて、mRuby2の異なる突然変異体を発現する細胞のライブラリーを生成した。具体的に、ここでは欠失部位の6bp下流に切断を導入した。
【0367】
変異体ライブラリーの生成及びmRuby2タンパク質の指向進化の手順は、2つの連続する工程を含む。要すれば、第一の工程では、Cas9/mRuby2-P2A-puroR二重安定細胞を、改変されるべきDNA領域の近傍に結合するインビトロ(in vitro)転写sgRNA、及び、所期領域の多様化を生じさせるssODNで共トランスフェクトした。このssODNの長さは115塩基であった。5’側50塩基と3’側50塩基は相同性アームであり、中間の15塩基はNNBの5つのコドンを有するライブラリーに組み込まれる。斯かる相同テンプレートは、所期領域の多様化を生じさせると共に、その相同性アームによって、事前に導入されたフレームシフトを除去し、再度フレーム化する。トランスフェクションの72時間後、細胞をFACSAria IIIソーター(BD)で選別することにより、第二の工程が開始される(
図16、17)。
【0368】
第二の工程、即ち新たな蛍光変異体の選択及び濃縮は、4つの連続するインフレーム選別プロセスを含み、FACSにより蛍光細胞が選択された。
図16に示すように、3回の逐次ラウンドのFACSを適用することにより、より明るい変異体を徐々に選択及び濃縮した。第1ラウンドのFACSでは、約100百万個の細胞を処理し、その結果として、第1回目のラウンドの終わりに約250k個の蛍光細胞を採取した。ラウンド1の後、採取された細胞からmRNAを採取し、DNAへと逆転写し、細菌発現ベクターpRSETBにクローン化し、大腸菌(E. coli)BL21に形質転換した。Ni
2+親和性カラムを用いて、大腸菌(E. coli)から7つの異なるmRuby2タンパク質変異体を精製し、蛍光分光計により発光スペクトルを取得した(
図18)。多様化された変異体の配列を
図19に示す。何れの変異体も、意図したとおりに残基43~47が多様化されていた。sgRNA結合領域内におけるサイレント突然変異の導入又は欠落から判断するに、7つの変異体のうち5つがHDRにより多様化されており、他はNHEJによるものであった(
図19)。
【0369】
FACS選別のラウンド1後の細胞集団(
図16、17)を、続いて更に2回のFACSラウンドにより処理し、より高い蛍光強度を有する細胞の割合を増加させた。各FACSラウンドの間に、採取された細胞を10cmプレートで、プレート内で完全に密集するまで培養した。プレート内で完全に密集したところで、濃縮された細胞を更なるFACSラウンドにより処理した。
【0370】
本発明者等の興味は、所期のタンパク質の修復及び多様化における、NHEJ等の他の機構に対するHDRの比率が、薬物処理又は他の条件によって変化するか否かを決定する点にもあった(
図20、21)。種々のストラテジーによるHDR経路の誘導活性を試験するために、本発明者等は複数の異なる処理アプローチを検証した。HDR活性の分析にはディープシークエンシング技術を用いた。実験の概要を
図20に示す。この実験では、前述したように、HEK293細胞に単一コピーとして挿入された、mRuby2の無傷の単純コーディング配列を発現する細胞に、フレームシフトを生じさせるssODNテンプレートを導入した。ssODNを、フレームシフトを導入した領域の近傍に結合するsgRNAと共に送達した。PAM部位の直ぐ上流の2つのヌクレオチドを欠失させることによりフレームシフトを生じさせた。ssODNの長さは100塩基対であった。これは所定の2つのヌクレオチドの欠失の5’及び3’末端に相補的であった。
【0371】
8種の異なるストラテジーを検証し、1つの対照と比較した。対照としては、HDRssODNテンプレートを用いず、sgRNAのみで細胞をトランスフェクトした。全ての例で同じsgRNAを用いると共に、対照を除く全ての例で同じssODN HDRテンプレートを用いた。ノコダゾールを用いた例を除く全ての例において、処理薬物、sgRNA、及びHDRテンプレートを一緒に送達した。共送達から24時間後、細胞培地を前記薬物を含まないものに交換した。ノコダゾールを用いた例では、細胞を予めノコダゾールで18時間処理してから、sgRNA、ssODN、及び処置試薬の共送達に供した。18時間が経過した時点で、細胞を同期させ、トランスフェクションを実施した。トランスフェクションから72時間後、細胞をFACSソーターに供した。mRuby2チャンネルでゼロ値シグナルを示す全ての細胞と、青色チャンネルにおいて0から最大の間の任意のレベルのシグナルを示す細胞を、編集された細胞として採取した。この採取された全集団は、HDRテンプレートにより導入されたフレームシフトと、NHEJにより生じたバラツキを含む、可能性のある何れかの編集を示している。合計2百万個の細胞を選別した後、全ライブラリーをMiSeq次世代シークエンシング系(Illumina)によるディープシークエンシングに直接使用した。全変異体遺伝子ライブラリーを採取するために、RNeasyミニキット(Qiagen)を用いて総RNA単離を実施した。総RNAの採取後、遺伝子特異的プライマーを用いて、mRuby2配列をcDNAライブラリーに逆転写し、続いてMachery Nagelゲル&PCRクリーンアップキットで精製した。その後、これらのcDNAライブラリーを10サイクルのPCRで増幅し、ディープシークエンシングに供した。mRuby2配列の所期の小さな領域のみをPCR増幅した(配列番号95)。増幅された配列は、親mRuby2の元のDNA配列内における、ヌクレオチド位置75~324の間の領域に対応する。フォワード及びリバースプライマーを用いて、10サイクルのPCRを実施した。これらのプライマーは何れも、Illumina MiSeqプラットフォームのフローへのライブラリーアンプリコンの結合を可能とする、アダプターフランキング配列を有していた。異なる処理がHDRに及ぼす影響の結果を
図21に示す。
【0372】
材料及び方法
FRT ベクター 生成
1.PCR mRuby2
1μL pSLiCE3-mRuby2
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
35μL ddH
2
O
50μL 総量
95℃/30sの変性、60℃/30sのアニーリング、72℃/30sの伸長。
2.PCR P2A-ピューロマイシン抵抗性遺伝子
1μL pSLiCE3-P2A-ピューロマイシン抵抗性遺伝子
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
35μL ddH
2
O
50μL 総量
95℃/30sの変性、60℃/30sのアニーリング、72℃/30sの伸長。
3.1μgのpcDNA5FRT-APMA-ap-IRES-H2BGFPを、AflII及びNotIにより、37℃で3h消化:
1μg プラスミド
1μL AflII
1μL NotI
2μL 10×緩衝剤
XμL ddH
2
O
20μL 総量。
4.消化されたDNAをゲルで精製。
5.DNA断片を37℃で30分間SLiCEライゲート:
1μL 工程3の切断プラスミド
3μL 工程1の断片
3μL 工程2の断片
1μL T4ライゲーション緩衝剤
1μL SLiCE試薬
1μL ddH
2
O
10μL 総量。
6.形質転換。
7.シークエンシングによるクローンの確認。
【0373】
安定な細胞系列の生成
安定なFRT-mRuby2-P2A-ピューロマイシンR発現細胞系列の生成:
1.Flp-In-293細胞を3×30mmのプレートで80%の集密度となるまで培養。
2.10:1のpOG44-pcDNA5-FRT-mRuby2-P2A-ピューロマイシンRプラスミド及びリポフェクタミン3000でトランスフェクト。
3.抗生物質の不在下、30℃で一晩培養。
4.30、60及び120μg/mLのハイグロマイシンで、コロニーが形成されるまで選択。
安定なCas9発現FRT-mRuby2-P2A-ピューロマイシンR陽性細胞系列の生成:
1.FRT-mRuby2-P2A-ピューロマイシンR発現細胞系列を3×30mmのプレートで80%の集密度となるまで培養。
2.10:1の、ネオマイシン抵抗性遺伝子に融合された化膿連鎖球菌(Streptococcus pyogenes)由来のCas9ヌクレアーゼを含むpSpCas9プラスミドベクターと、リポフェクタミン3000とでトランスフェクト。
3.抗生物質の不在下、30℃で一晩培養。
4.600μg/mLのG418 抗生物質で、コロニーが形成されるまで選択。
【0374】
ライブラリー生成xc
ライブラリー生成プロトコールは、2つの連続工程を含む。第一の工程では、細胞をまず、発色団領域内の2つのヌクレオチドの欠失によって特異的にフレームシフトを生じさせるssODNによりトランスフェクトする。それに続く第二の工程では、フレームシフトが形成されたタンパク質を発現する細胞を、ライブラリーの生成を誘導するssODNにより、ランダム化しながらトランスフェクトする。
【0375】
プロトコールは以下の通り:
第一の工程:
1.細胞をトリプシン処理した後、10cmの細胞培養プレートに、70~80%の集密度となるように播種する。
2.播種の翌日、10μgのsgRNA+10μgのフレームシフト形成用ssODN(mixed in 200μLのOptimemと混合)、及び、(別の200μLのOptimemチューブに入れた)7.5μLのリポフェクタミンMessengerMax試薬を混合する。その後、これら2つの200μLの溶液を混合して一つとし、RTで15分間インキュベートする。総溶液を10cmのプレートに播種する。
3.翌日、培地を交換し、さらに一日インキュベートする。トランスフェクションから2日後、フレームシフトを含む非発光細胞をFACSで選別し、10cmプレートで増幅する。60~70%の集密度となるまで4日間かかる。
4.70%の集密度に達した後、プレートを2つの10cmプレートに分割する。これらのプレートの一方を保存用に冷凍し、他のプレートを一晩培養して、ランダム化及びライブラリー生成プロセスに供する。
第二の工程:
5.翌日、フレームシフト形成mRuby2発現細胞内の所期の領域を、NNB含有ランダム化ssODNにより、上述したのと同一のトランスフェクションパラメーターを用いて、リポフェクタミンMessengerMaxでトランスフェクトする。トランスフェクションから24時間後、培地を交換する。その後、細胞を15cmのプレートに移す。再播種から24時間後、培地に新鮮なピューロマイシンを補充することにより、2μg/μLのピューロマイシンを3日間連続で細胞に適用する。最初の2日間の適用の間は、顕著な数の細胞死が観察されたが、3日目には細胞死はほとんど見られなくなった。この時点でピューロマイシン処理を終了する。ピューロマイシン処理によって、インフレーム変異体と共に、早期の停止コドンを含まない細胞が陽性選択される。これにより、所望のライブラリーが組み込まれた細胞が濃縮される。
【0376】
cDNAライブラリー生成及び次世代シークエンシングの調製
1.RNeasyミニキット(Qiagen)のデータシートに従って総RNA単離を実施する。
2.RevertAid H Minus First Strand cDNA合成キット(Thermo Fisher)に従って、配列番号4のmRuby2特異的リバースプライマーにより、42℃で50分間cDNA変換を実施する。
3.配列番号5及び配列番号6のプライマー対を用い、24の個別のPCRチューブにより、全cDNAライブラリーに対して10サイクルの次世代シークエンシングPCRを実施する。各PCR反応チューブの反応条件は以下の通り:
2μL cDNA
1μL プライマーF 10×希釈
1μL プライマーR 10×希釈
1μL dNTP
1μL Herculase II
10μL 5×Herculase緩衝剤
34μL ddH2O
50μL 総量
95℃/10sの変性、60℃/10sのアニーリング、72℃/10sの伸長。
4.PCR精製
5.MiSeq(Illumina)によるディープシークエンシング。
【0377】
実施例4:多様化及び標的化突然変異誘発のための方法を用いた抗体の改変
【0378】
上述のように、本開示にて提供される手段及び方法によれば、所期のタンパク質は抗体であってもよい。例えば、本発明は、天然変異体と比較して新たな特異性又は親和性を有するFab断片、単一鎖抗体、又は全長IgGの遺伝子操作及び選択において、数々の利点を提供する。
【0379】
この目的のために、Fab断片、単一鎖抗体、又は軽鎖及び重鎖IgGをコードする遺伝子を、細胞に単一コピー挿入してもよい。フレームシフト又は他の不活性化突然変異が、前記突然変異誘発標的部位の近傍に挿入される。この例では、突然変異誘発標的部位は、CDR(相補性決定領域)をコードする領域内に、即ち抗原結合ドメインの領域内に存在することが好ましい。しかし、突然変異誘発標的部位は、抗体機能に影響を与える他の部位内に存在していてもよい。
【0380】
必要であれば(例えばヒト細胞系においてヒト化抗体遺伝子を多様化する場合)、内因性抗体遺伝子配列と異なるコドンを用いることで、外因性遺伝子のみが多様化されるように構成してもよい。
【0381】
まずはライブラリーを、リーディングフレームの有効な回復、及び/又は、生成 of a 融合されたマーカー遺伝子(例えば蛍光タンパク質又は抵抗性マーカー)の生成に基づいてスクリーニングしてもよい。抗体ライブラリーの効率的な提示及びその後のスクリーニングのために、表面ディスプレイ技術を用いて、抗体変異体を細胞表面に局在化させてもよい。所期のタンパク質をコードする遺伝子カセットを細胞ゲノム内に単一コピー挿入する前に、抗体変異体を細胞表面に送達するための標的化配列を、斯かる遺伝子カセットに付加してもよい。斯かる技術は現在では非常に有効となっており、例えばFab断片、単一鎖抗体、又は全長IgGを、細胞、例えば哺乳類細胞、例えばHEK293細胞等の表面に機能的に提示させる上で、極めて有効である。効率的ディスプレイ及びスクリーニングのためのプロトコールは、本技術分野では標準的となっており、例えばHo, 2008, Methods in Molecular Biology, 525: pp 337-352; and Zhou, 2012, Methods in Molecular Biology, 907: 293-302によって提供されている。
【0382】
斯かる表面に提示された抗体ライブラリーのスクリーニングは、FACS選別によって行うことができる。この目的のために、フルオロフォアに連結した抗原を用いて、この特異的な抗原に親和性を示す抗体を提示する細胞を標識してもよい。FACS選別によって、これらの細胞を収穫することができる。更なるスクリーニングのラウンドにおいて、未標識抗原の量を増加させながら細胞を洗浄することで、ストリンジェンシーを上昇させてから、更なるFAC選別に供してもよい。これにより、所与の抗原に対してより高い親和性を示す変異体を同定することが可能である。
【0383】
或いは、所望の抗体をパニングアプローチにより同定することもできる。この目的のためには、特異的な表面に所望の抗原を連結させればよい。抗体ライブラリーを細胞表面に発現する細胞を、この表面上でインキュベートする。有効な抗体を発現する細胞は、斯かる表面に結合する。非結合細胞を洗い流した後、加える可溶性抗原の量を増加させることにより、ストリンジェンシーを増加させることができる。数回の洗浄ラウンドの後、表面に結合して残存する細胞を、適切な方法、例えばトリプシン処理により収穫して回収することができる。
【0384】
選択された抗体変異体をコードする遺伝子を単離するには、これらの細胞に由来するポリA-RNAを調製し、RT-PCRを実施してこれらの遺伝子をcDNAへと転写し、これらを適切なベクターにサブクローニングして更なる分析に供すればよい。
【配列表フリーテキスト】
【0385】
本発明では以下のヌクレオチド配列及びアミノ酸配列を参照する。
・配列番号1:2AペプチドT2Aのアミノ酸配列:
EGRGSLLTCGDVEENPGP
・配列番号2:2AペプチドP2Aのアミノ酸配列:
ATNFSLLKQAGDVEENPGP
・配列番号3:2AペプチドE2Aのアミノ酸配列:
QCTNYALLKLAGDVESNPGP
・配列番号4:2AペプチドF2Aのアミノ酸配列:
VKQTLNFDLLKLAGDVESNPGP
・配列番号5:TEVプロテアーゼの標的部位:Xは任意のアミノ酸でよい。
Glu、X、X、Tyr、X、Gln、Gly/Ser
・配列番号6:ジェネナーゼI(Genenase I)の標的部位:
Pro-Gly-Ala-Ala-His-Tyr
・配列番号7:エンテロキナーゼの標的部位:
Asp-Asp-Asp-Asp-Lys
・配列番号8:ヒトライノウイルス (HRV)3Cプロテアーゼの標的部位:
Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro
・配列番号9:因子Xaの標的部位:
Ile-(Glu又はAsp)-Gly-Arg
・配列番号10:トロンビンの標的部位:
Leu-Val-Pro-Arg-Gly-Ser
・配列番号11:SpCas9又はSaCas9ヌクレアーゼと使用される好ましいダイレクトリピート(DR)配列:
GTTTTAGAGCTA
・配列番号12:SpCas9又はSaCas9ヌクレアーゼと使用される好ましいtracrRNA配列:
TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT
・配列番号13:部位特異的突然変異誘発のフォワードプライマー:
5’-TCGCTGACCGCTGCGGACGCAGGTCGAAGAAGACTTACC-3’-フォワード
・配列番号14:部位特異的突然変異誘発のリバースプライマー:
5’-GTCCGCAGCGGTCAGCGAGTTGGTC-3’-リバース
・配列番号15:フォワード増幅プライマー:
5’-TCGCTGACCGCTGCGGACGCAGGTCGAAGAAGACTTACC-3’
・配列番号16:リバース増幅プライマー:
5’-CGGCCGCCACTGTGCTGGATCTATTATCACTTGTACAGCTCGTCCATGC-3’
・配列番号17:予めアニールされるフォワードプライマー:
5’-CACCGCGCTGACCGCTGCGGACGC-3’
・配列番号18:予めアニールされるリバースプライマー:
5’-AAACGCGTCCGCAGCGGTCAGCGC-3’
・配列番号19:FokIヌクレアーゼのアミノ酸配列:
【表2】
・配列番号20:megaTALエンドヌクレアーゼのアミノ酸配列:
【表3】
・配列番号21:AsCpf1のアミノ酸配列:
【表4-1】
【表4-2】
・配列番号22:LbCpf1のアミノ酸配列:
【表5】
・配列番号23:SpCas9のアミノ酸配列:
【表6-1】
【表6-2】
・配列番号24:St1Cas9のアミノ酸配列:
【表7】
・配列番号25:SaCas9のアミノ酸配列:
【表8-1】
【表8-2】
・配列番号26:フレームシフト型mNeonGreenのヌクレオチド配列:
【表9】
・配列番号27: mNeonGreenのコーディング領域のヌクレオチド配列:
【表10】
・配列番号28:mNeonGreenのアミノ酸配列:
【表11】
・配列番号29:mNeonGreenの突然変異形成コーディング領域のヌクレオチド配列:
【表12-1】
【表12-2】
・配列番号30:105塩基対のドナー核酸テンプレート、通称NSFS-R:
【表13】
・配列番号31:mRuby2のアミノ酸配列:
【表14】
・配列番号32:ピューロマイシン抵抗性遺伝子のアミノ酸配列:
【表15】
・配列番号33:mRuby2発色団領域のコドン多様化のためのオリゴヌクレオチド(リバース鎖に結合):
5’ TGT TTA AAG AAA TCA GGA ATG CCT TTC GGG TAC TTG ATA AAA GTA CGG CT VNNVNNVNN GAACGAC GTG GCA AGA ATG TCA AAG GCA AAT GGC AGG GGT CCT CCC TCG A 3’
・配列番号34:mRuby2の発色団領域近傍にフレームシフト(2ヌクレオチドの欠失)を誘導するのに使用されるオリゴ:
5’ AGTCATCGAGGGAGGACCCCTGCCATTTGCCTTTGACATTCTTGCCACGTCGTTCGTATGGCAGCCGTACTTTTATCAAGTACCCGAAAGGCATTCCTGATTTCTTTAAACAGTCCT 3’
・配列番号35:RT PCRのための遺伝子特異的プライマー:
5’ CTTGTACAGCTCGTCCATCCC 3’
・配列番号36:ディープシークエンシングプライマー1:
5’ TACACGACGCTCTTCCGATCTATGCACAGGTGAAGGAGAAGG 3’
・配列番号37:ディープシークエンシングプライマー2:
5’ CAGACGTGTGCTCTTCCGATCCTCCACCATCTTCGTATCTCG 3’
・配列番号38:修復されたmNeonGreenのコーディングドメインを抽出するためのフォワードプライマー:
5’-ATAAGGATCCGGCCACCATGGTGAGCAAGGGCGAGGAGGAT-3’ フォワード
・配列番号39:修復されたmNeonGreenのコーディングドメインを抽出するためのリバースプライマー:
5’-TATAGGAATTCCTATTATCACTTGTACAGCTCGTCCATGCCC-3’ リバース
・配列番号40:PCR突然変異誘発のためのフレームシフト導入用プライマー、1.F:
CTTTAAGTGGACACCACTGGAAATGGCAAGC
・配列番号41:PCR突然変異誘発のためのフレームシフト導入用プライマー、1.R:
CCAGTGGTGTCCACTTAAAGGTACTGATGATGGTTTTG
・配列番号42:PCR突然変異誘発のためのフレームシフト導入用プライマー、2.F:
CTGGTGCAGGAGAAGACTTACCCCAACGACAAAAC
・配列番号43:PCR突然変異誘発のためのフレームシフト導入用プライマー、2.R:
TAAGTCTTCTCCTGCACCAGTCCGCAGC
・配列番号44:PCR突然変異誘発のためのフレームシフト導入用プライマー、3.F:
CAGGTGAAGGTGGTTTCCCTGCTGACGGTC
・配列番号45:PCR突然変異誘発のためのフレームシフト導入用プライマー、3.R:
AGGGAAACCACCTTCACCTGGGCCTCTCC
・配列番号46:PCR突然変異誘発のためのフレームシフト導入用プライマー、4.F:
TCGGGTATGGCATCAGTACCTGCCCTACCCTGAC
・配列番号47:PCR突然変異誘発のためのフレームシフト導入用プライマー、4.R:
GGTACTGATGCCATACCCGATATGAGGGACCAG
・配列番号48:PCR突然変異誘発のためのフレームシフト導入用プライマー、5.F:
GTCCGCAGCGGTCAGCGAGTTGGTC
・配列番号49:PCR突然変異誘発のためのフレームシフト導入用プライマー、5.R:
GCAACCGTAAAGTTCAAGTACAAAGG
・配列番号50:SaCas9の場合のPAM配列:
5’-NNGRRT
・配列番号51:SaCas9の場合のPAM配列:
5’-NNGRR(N)
・配列番号52:St1Cas9の場合のPAM配列:
5’-NNAGAAW
・配列番号53~90:添付の図に示す。
・配列番号91:mNeonGreen2のヌクレオチド配列(多様化配列を斜体下線太字で示す):
【表16】
・配列番号92:mNeonGreen2のアミノ酸配列(多様化配列を斜体下線太字で示す):
【表17】
・配列番号93:mNeonGreen2内のアミノ酸配列:
Asp Ala Cys Trp
・配列番号94:mRuby2-TagBFP2-ピューロマイシンのアミノ酸配列:
【表18】
・配列番号95:元の親mRuby2配列内の配列決定領域のヌクレオチド配列:
【表19】
【配列表】