IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユナイテッド キングダム リサーチ アンド イノベーションの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-28
(54)【発明の名称】微生物及びその使用
(51)【国際特許分類】
   C12N 1/21 20060101AFI20240521BHJP
   C12P 1/04 20060101ALI20240521BHJP
   C12N 9/00 20060101ALI20240521BHJP
   C12N 15/11 20060101ALI20240521BHJP
   C12N 1/15 20060101ALI20240521BHJP
   C12N 1/19 20060101ALI20240521BHJP
   C12N 5/10 20060101ALI20240521BHJP
   C12N 1/00 20060101ALI20240521BHJP
【FI】
C12N1/21 ZNA
C12P1/04
C12N9/00
C12N15/11 Z
C12N1/15
C12N1/19
C12N5/10
C12N1/00 T
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023573070
(86)(22)【出願日】2021-05-28
(85)【翻訳文提出日】2024-01-24
(86)【国際出願番号】 EP2021064391
(87)【国際公開番号】W WO2022248061
(87)【国際公開日】2022-12-01
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TWEEN
2.PYTHON
(71)【出願人】
【識別番号】518160355
【氏名又は名称】ユナイテッド キングダム リサーチ アンド イノベーション
(74)【代理人】
【識別番号】100107984
【弁理士】
【氏名又は名称】廣田 雅紀
(74)【代理人】
【識別番号】100182305
【弁理士】
【氏名又は名称】廣田 鉄平
(74)【代理人】
【識別番号】100096482
【弁理士】
【氏名又は名称】東海 裕作
(74)【代理人】
【識別番号】100131093
【弁理士】
【氏名又は名称】堀内 真
(74)【代理人】
【識別番号】100150902
【弁理士】
【氏名又は名称】山内 正子
(74)【代理人】
【識別番号】100141391
【弁理士】
【氏名又は名称】園元 修一
(74)【代理人】
【識別番号】100221958
【弁理士】
【氏名又は名称】篠田 真希恵
(74)【代理人】
【識別番号】100192441
【弁理士】
【氏名又は名称】渡辺 仁
(72)【発明者】
【氏名】ロバートソン ウェスリー イー.
(72)【発明者】
【氏名】ファンケ ルイーズ エフ. エイチ.
(72)【発明者】
【氏名】デ ラ トレ ダニエル
(72)【発明者】
【氏名】フレデンス ジュリウス
(72)【発明者】
【氏名】エリオット トーマス エス.
(72)【発明者】
【氏名】ダンケルマン ダニエル エル.
(72)【発明者】
【氏名】ウィリス ジュリアン シー. ダブリュー.
(72)【発明者】
【氏名】ビーティー アダム ティー.
(72)【発明者】
【氏名】チン ジェイソン ダブリュー.
【テーマコード(参考)】
4B064
4B065
【Fターム(参考)】
4B064AG01
4B064CA02
4B064CA19
4B064CC24
4B065AA26X
4B065AA26Y
4B065AB01
4B065AC14
4B065BA02
4B065BA21
4B065CA24
(57)【要約】
本発明は、非標準アミノ酸を含有するポリマーの産生のための原核細胞、及び前記細胞を作製する方法に関する。本発明はまた、本発明の細胞によって産生された新たに得ることができるポリマーにも関する。加えて、本発明は、対で使用され、これらに限定されないが、本発明の原核細胞などの宿主細胞において有用性が見出され得る新規直交性アミノアシルtRNAシンテターゼ(aaRS)及び直交性tRNAに関する。
【特許請求の範囲】
【請求項1】
原核細胞であって、
第1の内因性tRNA及び第2の内因性tRNAを発現せず;並びに
前記第1の内因性tRNA及び前記第2の内因性tRNAが不必要であるように、第1のタイプのセンスコドン及び第2のタイプのセンスコドンが再コード化されているゲノムを含む、前記原核細胞。
【請求項2】
ゲノムの必須遺伝子が、第1のタイプのセンスコドンの出現を含有せず、第1の内因性tRNAが、前記第1のタイプのセンスコドンの同族のtRNAであり;及び/又は
ゲノムの必須遺伝子が、第2のタイプのセンスコドンの出現を含有せず、第2の内因性tRNAが、前記第2のタイプのセンスコドンの同族のtRNAである、請求項1に記載の原核細胞。
【請求項3】
ゲノムが、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第1の内因性tRNAが、前記第1のタイプのセンスコドンの同族のtRNAであり;及び/又は
ゲノムが、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第2の内因性tRNAが、前記第2のタイプのセンスコドンの同族のtRNAである、請求項1又は2に記載の原核細胞。
【請求項4】
第1のタイプのセンスコドンがTCAであり、第1の内因性tRNAがtRNASer UGAであり;及び/又は
第2のタイプのセンスコドンがTCGであり、第2の内因性tRNAがtRNASer CGAである、
請求項1~3のいずれかに記載の原核細胞。
【請求項5】
親株におけるTCAコドンの複数の出現が、AGTに置き換えられており;及び/又は
親株におけるTCGコドンの複数の出現が、AGCに置き換えられている、請求項4に記載の原核細胞。
【請求項6】
第1の内因性終結因子を発現せず;及び
前記第1の内因性終結因子が不必要であるように、第1のタイプの終止コドンがゲノム内で再コード化されている、
請求項1~5のいずれかに記載の原核細胞。
【請求項7】
ゲノムの必須遺伝子が、第1のタイプの終止コドンの出現を含有せず、第1の内因性終結因子が前記第1のタイプの終止コドンの同族の終結因子である、請求項6に記載の原核細胞。
【請求項8】
ゲノムが、第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、及び第1の内因性終結因子が、前記第1のタイプの終止コドンの同族の終結因子である、請求項6又は7に記載の原核細胞。
【請求項9】
第1のタイプの終止コドンがTAGであり、第1の内因性終結因子がRF-1である、請求項6~8のいずれかに記載の原核細胞。
【請求項10】
親株におけるTAGコドンの出現がTAAに置き換えられている、請求項9に記載の原核細胞。
【請求項11】
配列番号3~8のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを含む原核細胞。
【請求項12】
第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAを発現し、
前記第3の直交性アミノアシルtRNAシンテターゼ及び前記第3の直交性tRNAが、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第3の直交性tRNAが、第1のタイプの終止コドンを解読することが可能である、
請求項6~11のいずれかに記載の原核細胞。
【請求項13】
第3の直交性アミノアシルtRNAシンテターゼ-tRNA対が、
AfTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY;又は
MjTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYY
である、請求項12に記載の原核細胞。
【請求項14】
第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、
前記第1の直交性アミノアシルtRNAシンテターゼ及び前記第1の直交性tRNAが、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第1の直交性tRNAが、第1のタイプのセンスコドンを解読することが可能である、
請求項1~13のいずれかに記載の原核細胞。
【請求項15】
第1の直交性アミノアシルtRNAシンテターゼが、MmPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであり、及び第1の直交性tRNAが、MmtRNAPylY YYY又はMmtRNAPyl UGAである、請求項14に記載の原核細胞。
【請求項16】
第2の直交性アミノアシルtRNAシンテターゼ及び第2のtRNAを発現し、
前記第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAが、第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第2の直交性tRNAが、第2のタイプのセンスコドンを解読することが可能である、
請求項1~15のいずれかに記載の原核細胞。
【請求項17】
第2の直交性アミノアシルtRNAシンテターゼが、1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであり、及び第2の直交性tRNAがAlvtRNAΔNPyl(8) YYY又はAlvtRNAΔNPyl(8) CGAである、請求項16に記載の原核細胞。
【請求項18】
原核細胞の増殖速度が、親株の参照原核細胞の増殖速度より速い、請求項1~17のいずれかに記載の原核細胞。
【請求項19】
参照原核細胞が、第1のタイプのセンスコドンと、第2のタイプのセンスコドンと、第1のタイプの終止コドンとを除去するためのゲノムの再コード化により直接得られた親株の細胞である、請求項18に記載の原核細胞。
【請求項20】
参照原核細胞が、第1の内因性tRNAと、第2の内因性tRNAと、第1の内因性終結因子との除去後に直接得られた親株の細胞である、請求項18に記載の原核細胞。
【請求項21】
ファージ感染及び/又はFプラスミドの水平伝播に対して耐性である、請求項1~20のいずれかに記載の原核細胞。
【請求項22】
ファージ感染及び/又はFプラスミドの水平伝播に対して完全に耐性である、請求項1~20のいずれかに記載の原核細胞。
【請求項23】
細菌細胞又は大腸菌細胞である、請求項1~22のいずれかに記載の原核細胞。
【請求項24】
生存可能である、請求項1~23のいずれかに記載の原核細胞。
【請求項25】
改変された原核細胞を産生する方法であって、
(i)第1のタイプのセンスコドンを解読するために適切な第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現させるように原核細胞を改変するステップであって、前記原核細胞が、第1の内因性tRNAが不必要であるように前記第1のタイプのセンスコドンが再コード化されているゲノムを含む前記ステップ;
(ii)前記第1の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下で前記原核細胞をインキュベートするステップ;並びに
(iii)前記第1の内因性tRNAが発現しないように、前記第1の内因性tRNAをコードする内因性遺伝子を改変するステップ
を含む、前記方法。
【請求項26】
ステップ(i)及び(ii)がステップ(iii)の前に実施される、請求項25に記載の方法。
【請求項27】
(a)第2のタイプのセンスコドンを解読するために適切な第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように原核細胞を改変するステップであって、前記原核細胞が、第2の内因性tRNAが不必要であるように前記第2のタイプのセンスコドンが再コード化されているゲノムを含む前記ステップ;
(b)前記第2の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下で前記原核細胞をインキュベートするステップ;及び
(c)前記第2の内因性tRNAが発現しないように、前記第2の内因性tRNAをコードする内因性遺伝子を改変するステップ
をさらに含む、請求項25又は26に記載の方法。
【請求項28】
ステップ(i)及び(ii)がステップ(iii)の前に実施され、及び/又はステップ(a)及び(b)がステップ(c)の前に実施される、請求項27に記載の方法。
【請求項29】
ステップ(a)、(b)、及び(c)が、ステップ(i)、(ii)、(iii)の前に実施されるか;又は
ステップ(a)が、ステップ(i)と同時に実施され、ステップ(b)がステップ(ii)と同時に実施され、及びステップ(c)がステップ(iii)と同時に実施されるか;又は
ステップ(a)、(b)、及び(c)が、ステップ(i)、(ii)、(iii)の後に実施される、
請求項27又は28に記載の方法。
【請求項30】
ゲノムの必須遺伝子が、第1のタイプのセンスコドンの出現を含有せず、又はゲノムが、前記第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まない、請求項25~29のいずれかに記載の方法。
【請求項31】
第1のタイプのセンスコドンがTCAであり、第1の内因性tRNAがtRNASer UGAである、請求項25~30のいずれかに記載の方法。
【請求項32】
TCAコドンがAGTに置き換えられている、請求項31に記載の方法。
【請求項33】
第1の直交性アミノアシルtRNAシンテターゼが、MmPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであり、第1の直交性tRNAが、MmtRNAPylY YYY又はMmtRNAPyl UGAである、請求項25~32のいずれかに記載の方法。
【請求項34】
ゲノムの必須遺伝子が、第2のタイプのセンスコドンの出現を含まないか、又はゲノムが、前記第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まない、請求項25~33のいずれかに記載の方法。
【請求項35】
第2のタイプのセンスコドンがTCGであり、第2の内因性tRNAがtRNASer CGAである、請求項25~34のいずれかに記載の方法。
【請求項36】
TCGコドンがAGCに置き換えられている、請求項35に記載の方法。
【請求項37】
第2の直交性アミノアシルtRNAシンテターゼが、1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであり、第2の直交性tRNAがAlvtRNAΔNPyl(8) YYY又はAlvtRNAΔNPyl(8) CGAである、請求項25~36のいずれかに記載の方法。
【請求項38】
方法が適用される原核細胞のゲノムが、GenBank受託番号CP040347.1、配列番号3、又は配列番号4のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一である、請求項25~37のいずれかに記載の方法。
【請求項39】
第1のタイプの終止コドンを解読するために適切な第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように原核細胞を改変するステップであって、第1のタイプの終止コドンが、第1の内因性終結因子が不必要であるようにゲノム内で再コード化されている前記ステップをさらに含む、請求項25~38のいずれかに記載の方法。
【請求項40】
ゲノムの必須遺伝子が、第1のタイプの終止コドンの出現を含まないか、又はゲノムが、前記第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まない、請求項39に記載の方法。
【請求項41】
第1のタイプの終止コドンがTAGであり、前記第1のタイプの終止コドンの同族の終結因子がRF-1である、請求項39又は40に記載の方法。
【請求項42】
TAGコドンがTAAに置き換えられている、請求項41に記載の方法。
【請求項43】
第3の直交性アミノアシルtRNAシンテターゼ-tRNA対が、
AfTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYYであるか;又は
MjTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYYである、
請求項39~42のいずれかに記載の方法。
【請求項44】
ステップ(i)及び(a)の前に、
再コード化されたゲノムを含む原核細胞を含む細胞培養物において変異導入を誘発するステップ、
前記細胞培養物を指数関数的な増殖条件下で維持するステップ、
前記細胞培養物から、培養初期と比較して増殖速度が増加した原核細胞を選択するステップ
を含み;
ステップ(i)又は(a)が、前記選択された原核細胞に適用される、請求項25~43のいずれかに記載の方法。
【請求項45】
変異導入、変異、及び選択が、平行変異導入及び動的平行選択プロセスの一部である、請求項44に記載の方法。
【請求項46】
変異導入の誘発が、変異導入プラスミドの使用を含む、請求項44又は45に記載の方法。
【請求項47】
変異導入プラスミドがMP6である、請求項46に記載の方法。
【請求項48】
ステップ(i)の前に、2ラウンドの変異導入及び選択が適用される、請求項44~47のいずれかに記載の方法。
【請求項49】
ステップ(iii)及び/又は(c)の後に、
原核細胞から細胞培養物を得るステップ、
前記細胞培養物において変異導入を誘発するステップ、
前記細胞培養物を指数関数的な増殖条件下で維持するステップ、及び
前記細胞培養物から、培養初期と比較して増殖速度が増加した原核細胞を選択するステップ
をさらに含む、請求項25~48のいずれかに記載の方法。
【請求項50】
変異導入、変異、及び選択が、平行変異導入及び動的平行選択プロセスの一部である、請求項49に記載の方法。
【請求項51】
変異導入の誘発が、変異導入プラスミドの使用を含み、前記変異導入プラスミドが、第1若しくは第2のタイプのセンスコドンのいかなる出現を含有することも、第1のタイプの終止コドンのいかなる出現を含有することもない、請求項49又は50に記載の方法。
【請求項52】
変異導入プラスミドがMP6であり、前記MP6が、変異導入第1又は第2のタイプのセンスコドンのいかなる出現を含有することも、第1のタイプの終止コドンのいかなる出現を含有することもないように再コード化されている、請求項51に記載の方法。
【請求項53】
3ラウンドの変異導入及び選択が適用される、請求項49~52のいずれかに記載の方法。
【請求項54】
変異導入が、5、10、15、17、20、30、45、60、70、80、100、150、又は200以上の世代にわたって行われる;及び/又は
細胞培養物が、5、10、15、20、30、40、50、52、60、70、80、100、又は200以上の世代にわたって指数増殖条件で維持される、請求項44~53のいずれかに記載の方法。
【請求項55】
原核細胞が、細菌細胞又は大腸菌細胞である、請求項25~54のいずれかに記載の方法。
【請求項56】
ポリマーを合成する方法であって、
i)請求項1~24のいずれかに記載の原核細胞、又は請求項25~55のいずれかに記載の方法に従って生成された原核細胞を提供するステップであって、前記原核細胞が、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を含むステップ;及び
前記原核細胞を、ポリマーをコードする核酸配列と接触させるステップであって、前記核酸配列が第1のタイプのセンスコドンを含むステップ;
ii)前記原核細胞を、前記第1の直交性アミノアシルtRNAシンテターゼの基質である第1の非標準アミノ酸の存在下でインキュベートするステップ;並びに
iii)前記原核細胞をインキュベートして、前記第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して前記第1の非標準アミノ酸の前記ポリマーへの組み込みを可能にするステップ
を含む、前記方法。
【請求項57】
原核細胞が、第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を含み、核酸配列が第2のタイプのセンスコドンを含み、及び
ステップii)が、前記第2の直交性アミノアシルtRNAシンテターゼの基質である第2の非標準アミノ酸の存在下で前記原核細胞をインキュベートするステップを含み;及び
ステップiii)が、前記原核細胞をインキュベートして、第2の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して前記第2の非標準アミノ酸のポリマーへの組み込みを可能にするステップを含む、請求項56に記載の方法。
【請求項58】
原核細胞が、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含み、核酸配列が第1のタイプの終止コドンを含み、及び
ステップii)が、第3の直交性アミノアシルtRNAシンテターゼの基質である第3の非標準アミノ酸の存在下で前記原核細胞をインキュベートするステップを含み;及び
ステップiii)が、前記原核細胞をインキュベートして、第3の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して前記第3の非標準アミノ酸のポリマーへの組み込みを可能にするステップを含む、請求項56又は57に記載の方法。
【請求項59】
iv)合成されたポリマーを精製するステップ
をさらに含む、請求項56~58のいずれかに記載の方法。
【請求項60】
合成されたポリマーが、別の非標準アミノ酸に直接隣接する少なくとも1つの非標準アミノ酸を含む、請求項56~59のいずれかに記載の方法。
【請求項61】
ポリマーが、互いに直接隣接する2、3、4、5、6、7、8、9、10、15、又は20以上の非標準アミノ酸の鎖を含む、請求項56~60のいずれかに記載の方法。
【請求項62】
ポリマーが大環状分子である、請求項56~61のいずれかに記載の方法。
【請求項63】
非標準アミノ酸が、BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-Nitro-Tyr、及びp-Az-Pheのいずれか1つ又は任意の組合せを含む、請求項56~62のいずれかに記載の方法。
【請求項64】
請求項56~63のいずれかに記載の方法によって得られた、又は得ることができるポリマー。
【請求項65】
単離された1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項66】
配列番号9と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり、以下の変異の群:i)L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iv)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;及びv)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223Aのいずれか1つを含む、請求項65に記載の単離された1R26PylRS。
【請求項67】
配列番号10~14のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項65に記載の単離された1R26PylRS。
【請求項68】
単離されたアーケオグロブス・フルギダスチロシルtRNAシンテターゼ(AfTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項69】
配列番号16と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり、以下の変異の群:i)Y36I、L69M、H74L、Q116E、D165T、I166G、及びN190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;及びiii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190Nのいずれか1つを含む、請求項68に記載の単離されたAfTyrRS。
【請求項70】
配列番号16~19のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項68に記載の単離されたAfTyrRS。
【請求項71】
単離されたLum1PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項72】
Lum1PylRSが、配列番号32と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり、以下の変異の群:i)L121L、L125L、Y126G、M129L、V168V;及びii)L121M、L125I、Y126F、M129A、V168Fのいずれか1つを含む、請求項71に記載の単離されたLum1PylRS。
【請求項73】
Lum1PylRSが、配列番号32~34のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項71に記載の単離されたLum1PylRS。
【請求項74】
単離されたNitroPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項75】
NitroPylRSが、配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり、以下の置換L123M、L127I、Y128F、M131A、及びV169Fを含む、請求項74に記載の単離されたNitroPylRS。
【請求項76】
NitroPylRSが、配列番号35又は配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項74に記載の単離されたNitroPylRS。
【請求項77】
単離されたClosΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項78】
ClosΔNTDPylRSが、配列番号37と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり、以下の変異の群:i)Y126G、M129L、Y208Y、及びii)Y126Y、M129A、Y208Fのいずれか1つを含む、請求項77に記載の単離されたClosΔNTDPylRS。
【請求項79】
ClosΔNTDPylRSが、配列番号37~39のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項77に記載の単離されたClosΔNTDPylRS。
【請求項80】
単離されたTronΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項81】
TronΔNTDPylRSが、配列番号40と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項80に記載の単離されたTronΔNTDPylRS。
【請求項82】
単離されたGemmΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項83】
GemmΔNTDPylRSが、配列番号41と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項82に記載の単離されたGemmΔNTDPylRS。
【請求項84】
単離されたPGA8ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項85】
PGA8ΔNTDPylRSが、配列番号42と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項84に記載の単離されたPGA8ΔNTDPylRS。
【請求項86】
単離されたI2ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項87】
I2ΔNTDPylRSが、配列番号43と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項86に記載の単離されたI2ΔNTDPylRS。
【請求項88】
単離されたD121ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項89】
D121ΔNTDPylRSが、配列番号44と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項88に記載の単離されたD121ΔNTDPylRS。
【請求項90】
単離されたD416ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント。
【請求項91】
D416ΔNTDPylRSが、配列番号45と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である、請求項90に記載の単離されたD416ΔNTDPylRS。
【請求項92】
tRNAシンテターゼが、AllocK、AlkK、BocK、Bta、CbzK、CypK、3-Nitro-Tyr、NMH、p-I-Phe、及びp-Az-Phe、及びo-メチル-チロシンのいずれかに対して変更された選択性を有する、請求項65~91のいずれかに記載のtRNAシンテターゼ。
【請求項93】
配列番号15、20、46~52、54~58、61~66のいずれか1つと少なくとも80%、90%、95%、99%、又は100%同一である、単離されたtRNA。
【請求項94】
請求項65~92のいずれかに記載のtRNAシンテターゼ及びtRNAを含む宿主細胞であって、前記tRNAシンテターゼ及びtRNAが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、前記宿主細胞。
【請求項95】
以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞:
(i)直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、請求項65~67のいずれかに記載のtRNAシンテターゼ及びtRNA;
(ii)AfTyrRS及びAf-tRNATyr(A01) YYYが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、アーケオグロブス・フルギダスチロシル-tRNAシンテターゼ(AfTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY
(iii)MmPylRStRNAシンテターゼ及びMmtRNAPyl YYYが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、MmPylRStRNAシンテターゼ、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びMmtRNAPyl YYY
【請求項96】
以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞:
(i)直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、請求項65~67のいずれかに記載のtRNAシンテターゼ及びtRNA;
(ii)AfTyrRS及びAf-tRNATyr(A01) YYYが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、AfTyrRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY
(iii)MjTyrRS及びMjtRNATyr YYYが直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、M・ヤンナスキイチロシル-tRNAシンテターゼ(MjTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYY
【請求項97】
以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞:
i)クラスA ΔNPylRS/ΔNPyltRNA対;
ii)クラスB ΔNPylRS/ΔNPyltRNA対;及び
iii)MmPylRS/SpePyltRNA対。
【請求項98】
原核細胞、又は真核細胞、細菌細胞、大腸菌細胞、哺乳動物細胞、昆虫細胞、又はヒト細胞である、請求項94~96のいずれかに記載の宿主細胞。
【請求項99】
ゲノムが再コード化されている原核細胞の増殖速度を改善する方法であって
再コード化されたゲノムを含む前記原核細胞を含む細胞培養物において変異導入を誘発するステップ、
前記細胞培養物を指数関数的な増殖条件下で維持するステップ、
前記細胞培養物から、培養初期と比較して増殖速度が増加した原核細胞を選択するステップ
を含む、前記方法。
【請求項100】
変異導入、変異、及び選択が、平行変異導入及び動的平行選択プロセスの一部である、請求項99に記載の方法。
【請求項101】
変異導入の誘発が、変異導入プラスミドの使用を含み、任意で前記変異導入プラスミドが再コード化された変異導入プラスミドである、請求項99又は100に記載の方法。
【請求項102】
変異導入プラスミドがMP6である、請求項101に記載の方法。
【請求項103】
2ラウンドの変異導入及び選択が適用される、請求項99~102のいずれかに記載の方法。
【請求項104】
変異導入が、5、10、15、17、20、30、45、60、70、80、100、150、又は200以上の世代にわたって行われる;及び/又は
細胞培養物が、5、10、15、20、30、40、50、52、60、70、80、100、又は200以上の世代にわたって指数関数的な増殖条件下で維持される、
請求項99~103のいずれかに記載の方法。
【請求項105】
原核細胞が、細菌細胞又は大腸菌細胞である、請求項99~104のいずれかに記載の方法。
【請求項106】
原核細胞の増殖速度が、親株の参照原核細胞の増殖速度より速い、請求項99~105のいずれかに記載の方法から得られた、又は得ることができる原核細胞。
【請求項107】
原核細胞が、第1の内因性tRNAを発現せず;
前記第1の内因性tRNAが不必要であるように第1のタイプのセンスコドンが再コード化されているゲノムを含み;
第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、
前記第1の直交性アミノアシルtRNAシンテターゼ及び前記第1の直交性tRNAが、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第1の直交性tRNAが、前記第1のタイプのセンスコドンを解読することが可能である、
原核細胞。
【請求項108】
ゲノムの必須遺伝子が、第1のタイプのセンスコドンの出現を含有せず、第1の内因性tRNAが前記第1のタイプのセンスコドンの同族のtRNAである、請求項107に記載の原核細胞。
【請求項109】
ゲノムが、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第1の内因性tRNAが、前記第1のタイプのセンスコドンの同族のtRNAである、請求項107又は108に記載の原核細胞。
【請求項110】
第1のタイプのセンスコドンがTCAであり、第1の内因性tRNAがtRNASer UGAであるか;又は
前記第1のタイプのセンスコドンがTCGであり、前記第1の内因性tRNAがtRNASer CGAである、請求項107~109のいずれかに記載の原核細胞。
【請求項111】
親株におけるTCAコドンの複数の出現がAGTに置き換えられている;及び/又は
前記親株におけるTCGコドンの複数の出現がAGCに置き換えられている、
請求項110に記載の原核細胞。
【請求項112】
原核細胞が、第2の内因性tRNAを発現せず;
前記第2の内因性tRNAが不必要であるように第2のタイプのセンスコドンが再コード化されているゲノムを含み;
第2の直交性アミノアシルtRNAシンテターゼ及び第2のtRNAを発現し、
前記第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAが、第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第2の直交性tRNAが、前記第2のタイプのセンスコドンを解読することが可能である、
請求項107~111のいずれかに記載の原核細胞。
【請求項113】
ゲノムの必須遺伝子が、第2のタイプのセンスコドンの出現を含有せず、第2の内因性tRNAが前記第2のタイプのセンスコドンの同族のtRNAである、請求項112に記載の原核細胞。
【請求項114】
ゲノムが、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第2の内因性tRNAが前記第2のタイプのセンスコドンの同族のtRNAである、請求項112又は113に記載の原核細胞。
【請求項115】
第2のタイプのセンスコドンがTCAであり、第2の内因性tRNAがtRNASer UGAであるか;又は
前記第2のタイプのセンスコドンがTCGであり、前記第2の内因性tRNAがtRNASer CGAである、請求項112~114のいずれかに記載の原核細胞。
【請求項116】
原核細胞が、第1の内因性終結因子を発現せず;
前記第1の内因性終結因子が不必要であるように、第1のタイプの終止コドンがゲノム内で再コード化されており;
前記原核細胞が、第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAを発現し、
前記第3の直交性アミノアシルtRNAシンテターゼ及び前記第3の直交性tRNAが、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び
前記第3の直交性tRNAが、前記第1のタイプの終止コドンを解読することが可能である、
請求項107~115のいずれかに記載の原核細胞。
【請求項117】
ゲノムの必須遺伝子が、第1のタイプの終止コドンの出現を含有せず、第1の内因性終結因子が、前記第1のタイプの終止コドンの同族の終結因子である、請求項116に記載の原核細胞。
【請求項118】
ゲノムが、第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第1の内因性終結因子が、前記第1のタイプの終止コドンの同族の終結因子である、請求項116又は117に記載の原核細胞。
【請求項119】
第1のタイプの終止コドンがTAGであり、第1の内因性終結因子がRF-1である、請求項116~118のいずれかに記載の原核細胞。
【請求項120】
親株におけるTAGコドンの出現がTAAに置き換えられている、請求項119に記載の原核細胞。
【請求項121】
細菌細胞又は大腸菌細胞である、請求項107~120のいずれかに記載の原核細胞。
【請求項122】
生存可能である、請求項107~121のいずれかに記載の原核細胞。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、非標準(non-canonical)アミノ酸を含有するポリマーの産生のための新規原核細胞、及び前記細胞を作製する方法に関する。本発明はまた、本発明の原核細胞によって産生された新たに得ることができるポリマーにも関する。加えて、本発明は、対(pair)で使用され、これらに限定されないが、本発明の原核細胞などの宿主細胞において有用性が見出され得る新規直交性(orthogonal)アミノアシルtRNAシンテターゼ(aaRS)及び直交性tRNAに関する。
【背景技術】
【0002】
自然界は、64個のトリプレットコドンを使用して20個の標準アミノ酸で構成されるタンパク質の合成をコード化し、ほとんどのアミノ酸は、1つより多くの同義コドンによってコードされる。センスコドン及びそれらを読み取るtRNAをゲノムから除去すると、新規ウイルス耐性様式及び非標準ヘテロポリマーの生合成をコード化する能力を含む、天然の生物学に見出されないいくつかの特性を有する細胞の作製を可能にし得るという仮説が広く立てられている(非特許文献1、2、3、及び4)。しかし、これらの仮説は、実験によって試験されておらず、推測のままである。
【0003】
大腸菌(E.coli)から終結因子-1(RF-1)(したがってTAG終止コドンで翻訳を効率的に停止させる能力)を除去すると、ファージの限定的なサブセットに対して何らかの耐性を提供する。しかしながら、この耐性は一般的ではなく、TAG終止コドンが翻訳の終止のために使用されることはほとんどないため、及びウイルス遺伝子がアンバーコドンで実際に終止する場合であっても、終止コドンを読み取ることができなくても全長のウイルスタンパク質の合成を制限しないため、ファージはしばしばRF-1の非存在下で繁殖する(非特許文献5)。これに対し、センスコドンは一般的に、ウイルスゲノムにおいてアンバーコドンより少なくとも10倍多く、ウイルス遺伝子の長さにわたって存在する。
【0004】
細胞において新規モノマーをコードするための現在の戦略は、無効であるか又はコードする連続するモノマーと不適合である(非特許文献8、9、10、11、12、及び13)単一のタイプのモノマー(一般的にアンバー終止コドンに応答して)(非特許文献1、6、7)をコードすることに限定されており、これらの限定は、完全に非標準モノマーからなる非標準ヘテロポリマー配列の合成を除外している。
【0005】
最近、2つのセンスコドン(セリンコドンTCG及びTCA)及び終止コドン(TAG)の全てのアノテートされた出現(occurrence)が同義コドンに置き換えられた、合成の再コード化されたゲノムを用いて大腸菌株Syn61が作製された(非特許文献14)。この株は、それが派生した(derived)株より1.6倍遅く増殖する。
【0006】
したがって、非標準アミノ酸を含有するポリマーの合成のための新規プラットフォームがなおも必要である。
【0007】
非標準アミノ酸を含有するポリマーの合成のための現在のプラットフォームの一部は、直交性aaRS/tRNA対を利用する。そのような対を使用して、タンパク質合成の際に非標準アミノ酸を挿入してもよい。これらの対は、別個の(distinct)標的コドンを解読する(decode)及び他のaaRSの基質ではない一意的モノマーを使用するためにさらに改変しなければならない。
【0008】
複数の非標準アミノ酸をポリマーに挿入することが可能なプラットフォームを開発するためには、複数のaaRS/tRNA対を利用する必要がある。別個のコドンを認識し、別個の非標準アミノ酸(ncAA)を組み込む複数の改変された相互直交性aaRS/tRNA対の同定は、なおも未解決の問題である。各々の新規ncAA、aaRS、tRNA、及びコドンは、共に機能しなければならず、各内因性のアミノ酸、aaRS、及びイソアクセプターtRNA群及びその同族(cognate)コドン群に対して直交性でなければならない。したがって、各々の新規ncAA:aaRS:tRNA:コドンセットに関して、新規セットと内因性の翻訳機構との間の3つの相互作用(ncAA:aaRS、aaRS:tRNA、及びtRNA:コドン)を確立し、及び120の相互作用(6×20個の相互作用;この解析は、天然アミノ酸に関する全てのイソアクセプターを1と計数し、アミノ酸の全てのコドンを1と計数し、したがって制御しなければならない相互作用の保存的推定値を提供する)を最小限にしなければならない。その上、1より多くのncAAを組み込む場合、追加のncAA:aaRS:tRNA:コドンセットの成分間の相互作用の可能性があり、これらもまた最小限にしなければならない。3つの別個のncAAをコードするためにncAA:aaRS:tRNA:コドンセットをポリペプチドに生成することは、9の特異的相互作用を確立する必要があり、3セットの成分間の18の相互作用を含む、少なくとも378の特異的相互作用を最小限にすることが必要である。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】J. W. Chin, Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017)
【非特許文献2】D. de la Torre, J. W. Chin, Reprogramming the genetic code. Nature Reviews Genetics 22, 169-184 (2020)
【非特許文献3】T. Passioura, H. Suga, Reprogramming the genetic code in vitro. Trends Biochem Sci 39, 400-408 (2014)
【非特許文献4】A. C. Forster et al., Programming peptidomimetic syntheses by translating genetic codes designed de novo. Proc Natl Acad Sci U S A 100, 6353-6357 (2003)
【非特許文献5】N. J. Ma, F. J. Isaacs, Genomic Recoding Broadly Obstructs the Propagation of Horizontally Transferred Genetic Elements. Cell Systems 3, 199-207 (2016)
【非特許文献6】D. D. Young, P. G. Schultz, Playing with the Molecules of Life. ACS Chemical Biology 13, 854-870 (2018)
【非特許文献7】C. C. Liu, P. G. Schultz, Adding New Chemistries to the Genetic Code. Annual Review of Biochemistry 79, 413-444 (2010)
【非特許文献8】Y. Zhang et al., A semi-synthetic organism that stores and retrieves increased genetic information. Nature 551, 644-647 (2017)
【非特許文献9】E. C. Fischer et al., New codons for efficient production of unnatural proteins in a semisynthetic organism. Nature Chemical Biology 16, 570-576 (2020)
【非特許文献10】H. Neumann, K. Wang, L. Davis, M. Garcia-Alai, J. W. Chin, Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)
【非特許文献11】K. Wang et al., Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nature Chemistry 6, 393-403 (2014)
【非特許文献12】D. L. Dunkelmann, J. C. W. Willis, A. T. Beattie, J. W. Chin, Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non-canonical amino acids. Nature Chemistry 12, 535-544 (2020)
【非特許文献13】J. S. Italia et al., Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. Journal of the American Chemical Society 141, 6204-6212 (2019)
【非特許文献14】J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019)
【発明の概要】
【発明が解決しようとする課題】
【0010】
そのため、新規直交性aaRS/tRNA対を提供すること、及び組み合わせて使用した場合に機能的であるaaRS/tRNA対を同定することが必要である。
【課題を解決するための手段】
【0011】
本明細書において、非標準アミノ酸を含有するポリマーの産生にとって適切な原核細胞を提供する。本発明者らは、例えば生存可能な細胞をもたらすために内因性遺伝子の欠失によって、原核細胞から1、2、又はそれより多くの内因性tRNAを除去することが可能であることを実証する。本発明者らは、除去した内因性tRNAを、直交性tRNAに置き換えてもよいことを実証する。本発明者らはさらに、これらのプロセスによって導入され得る任意の増殖欠損を克服する方法も提供する。本発明者らはまた、改変原核細胞がファージに対して完全に耐性であることを示す実験データも提供する。
【0012】
本発明の一態様では、原核細胞であって、第1の内因性tRNA及び第2の内因性tRNAを発現せず;並びに第1の内因性tRNA及び第2の内因性tRNAが不必要である(dispensable)ように、第1のタイプのセンスコドン及び第2のタイプのセンスコドンが再コード化(recode)されているゲノムを含む原核細胞が提供される。
【0013】
一部の実施形態では、ゲノムの必須遺伝子は、第1のタイプのセンスコドンの出現を含有せず、第1の内因性tRNAは、第1のタイプのセンスコドンの同族の(cognate)tRNAであり;及び/又はゲノムの必須遺伝子は、第2のタイプのセンスコドンの出現を含有せず、第2の内因性tRNAは、第2のタイプのセンスコドンの同族のtRNAである。
【0014】
一部の実施形態では、ゲノムは、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第1の内因性tRNAは、第1のタイプのセンスコドンの同族のtRNAであり;及び/又はゲノムは、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、第2の内因性tRNAは、第2のタイプのセンスコドンの同族のtRNAである。
【0015】
一部の実施形態では、第1のタイプのセンスコドンは、TCAであり、第1の内因性tRNAはtRNASer UGAであり;及び/又は第2のタイプのセンスコドンはTCGであり、第2の内因性tRNAはtRNASer CGAである。親株におけるTCAコドンの複数の出現が、AGTに置き換えられていてもよく;及び/又は親株におけるTCGコドンの複数の出現がAGCに置き換えられていてもよい。
【0016】
一部の実施形態では、原核細胞は、第1の内因性終結因子(release factor)を発現せず;及び第1のタイプの終止コドンは、第1の内因性終結因子が不必要であるようにゲノム内で再コード化されている。
【0017】
ゲノムの必須遺伝子は、第1のタイプの終止コドンの出現を含有しなくてもよく、第1の内因性終結因子は、第1のタイプの終止コドンの同族の終結因子であってもよい。
【0018】
ゲノムは、第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよく、第1の内因性終結因子は、第1のタイプの終止コドンの同族の終結因子であってもよい。第1のタイプの終止コドンは、TAGであってもよく、第1の内因性終結因子はRF-1であってもよい。親株におけるTAGコドンの出現が、TAAに置き換えられていてもよい。
【0019】
一部の実施形態では、ゲノムは、配列番号3~8のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一である。
【0020】
一部の実施形態では、原核細胞は、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAは、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び第1の直交性tRNAは、第1のタイプのセンスコドンを解読することが可能である。
【0021】
第1の直交性アミノアシルtRNAシンテターゼは、MmPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであってもよく、第1の直交性tRNAは、MmtRNAPylY YYY又はMmtRNAPyl UGAであってもよい。
【0022】
一部の実施形態では、原核細胞は、第2の直交性アミノアシルtRNAシンテターゼ及び第2のtRNAを発現し、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAは、第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、第2の直交性tRNAは、第2のタイプのセンスコドンを解読することが可能である。
【0023】
第2の直交性アミノアシルtRNAシンテターゼは、1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであってもよく、第2の直交性tRNAは、AlvtRNAΔNPyl(8) YYY又はAlvtRNAΔNPyl(8) CGAであってもよい。
【0024】
一部の実施形態では、原核細胞は、第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAを発現し、第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAは、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び第3の直交性tRNAは、第1のタイプの終止コドンを解読することが可能である。
【0025】
第3の直交性アミノアシルtRNAシンテターゼ-tRNA対は、AfTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY;又はMjTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYYであってもよい。
【0026】
原核細胞の増殖速度は、親株の参照原核細胞の増殖速度より速くてもよい。参照原核細胞は、第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び第1のタイプの終止コドンを除去するためにゲノムを再コード化することによって直接得られた親株の細胞であってもよい。参照原核細胞は、第1の内因性tRNA、第2の内因性tRNA、及び第1の内因性終結因子の除去時に直接得られた親株の細胞であってもよい。
【0027】
原核細胞は、ファージ感染及び/又はFプラスミドの水平伝播に対して耐性であり得る。原核細胞は、ファージ感染及び/又はFプラスミドの水平伝播に対して完全に耐性であり得る。
【0028】
原核細胞は、細菌細胞又は大腸菌(Escherichia coli)細胞であり得る。原核細胞は生存可能である。
【0029】
本発明の一態様では、配列番号3~8のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを有する原核細胞が提供される。配列同一性の計算は、外因性の配列、例えば直交性aaRS/tRNA対の挿入のための任意の配列を除外し得る。
【0030】
本発明の別の態様では、改変原核細胞を産生する方法であって、
(i)第1のタイプのセンスコドンを解読するために適切な第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように原核細胞を改変するステップであって、原核細胞が、第1の内因性tRNAが不必要であるように第1のタイプのセンスコドンが再コード化されているゲノムを含むステップ;
(ii)原核細胞を、第1の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下でインキュベートするステップ;及び
(iii)第1の内因性tRNAが発現しないように第1の内因性tRNAをコードする内因性遺伝子を改変するステップ
を含む方法が提供される。
【0031】
一実施形態では、ステップ(i)及び(ii)は、ステップ(iii)の前に実施される。別の実施形態では、ステップ(iii)は、ステップ(i)及び(ii)の前に実施される。
【0032】
方法は、
(a)第2のタイプのセンスコドンを解読するために適切な第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように、原核細胞を改変するステップであって、原核細胞が、第2の内因性tRNAが不必要であるように第2のタイプのセンスコドンが再コード化されているゲノムを含むステップ;
(b)原核細胞を、第2の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下でインキュベートするステップ;及び
(c)第2の内因性tRNAが発現しないように、第2の内因性tRNAをコードする内因性遺伝子を改変するステップ
をさらに含み得る。
【0033】
一実施形態では、ステップ(i)及び(ii)は、ステップ(iii)の前に実施され、並びに/又はステップ(a)及び(b)は、ステップ(c)の前に実施される。別の実施形態では、ステップ(iii)はステップ(i)及び(ii)の前に実施され、並びに/又はステップ(c)は、ステップ(a)及び(b)の前に実施される。
【0034】
一部の実施形態では、ステップ(a)、(b)、及び(c)は、ステップ(i)、(ii)、(iii)の前に実施され;又はステップ(a)は、ステップ(i)と同時に実施され、ステップ(b)は、ステップ(ii)と同時に実施され、及びステップ(c)は、ステップ(iii)と同時に実施され;又はステップ(a)、(b)、及び(c)は、ステップ(i)、(ii)、(iii)の後に実施される。
【0035】
ゲノムの必須遺伝子は、第1のタイプのセンスコドンの出現を含有しなくてもよく、又はゲノムは、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい。第1のタイプのセンスコドンは、TCAであってもよく、第1の内因性tRNAは、tRNASer UGAであってもよい。TCAコドンは、AGTに置き換えられていてもよい。
【0036】
第1の直交性アミノアシルtRNAシンテターゼは、MmPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであってもよく、第1の直交性tRNAは、MmtRNAPylY YYY又はMmtRNAPyl UGAであってもよい。
【0037】
ゲノムの必須遺伝子は、第2のタイプのセンスコドンの出現を含有しなくてもよく、又はゲノムは、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい。第2のタイプのセンスコドンは、TCGであってもよく、第2の内因性tRNAは、tRNASer CGAであってもよい。TCGコドンは、AGCに置き換えられてもよい。
【0038】
第2の直交性アミノアシルtRNAシンテターゼは、1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントであってもよく、及び第2の直交性tRNAは、AlvtRNAΔNPyl(8) YYY又はAlvtRNAΔNPyl(8) CGAであってもよい。
【0039】
方法が適用される原核細胞のゲノムは、GenBank受託番号CP040347.1、配列番号3、又は配列番号4のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であり得る。
【0040】
方法は、第1のタイプの終止コドンを解読するために適切な第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように原核細胞を改変するステップであって、第1の内因性終結因子が不必要であるように、第1のタイプの終止コドンがゲノム内で再コード化されているステップをさらに含み得る。ゲノムの必須遺伝子は、第1のタイプの終止コドンの出現を含有しなくてもよく、又はゲノムは、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい。第1のタイプの終止コドンは、TAGであってもよく、第1のタイプの終止コドンの同族の終結因子は、RF-1であってもよい。TAGコドンは、TAAに置き換えられてもよい。
【0041】
第3の直交性アミノアシルtRNAシンテターゼ-tRNA対は、AfTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY;又はMjTyrRS、若しくは非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYYであってもよい。
【0042】
方法は、ステップ(i)及び(a)の前に、
再コード化されたゲノムを含む原核細胞を含む細胞培養において変異導入(mutagenesis)を誘発する(inducing)ステップ、
細胞培養物を指数関数的な(exponential)増殖条件下で維持するステップ、
培養初期と比較して増殖速度が増加した原核細胞を、前記細胞培養物から選択するステップ
を含んでもよく、並びに
ステップ(i)又は(a)は選択された原核細胞に適用され得る。
【0043】
変異導入、変異、及び選択は、平行(parallel)変異導入及び動的平行(dynamic parallel)選択プロセスの一部であり得る。変異導入の誘発は、変異導入プラスミドの使用を含み得る。変異導入プラスミドは、MP6であり得る。
【0044】
一実施形態では、ステップ(i)の前に、2ラウンドの変異導入及び選択を適用する。
【0045】
方法は、ステップ(iii)及び/又は(c)の後に、
原核細胞からの細胞培養物を得るステップ、
細胞培養物において変異導入を誘発するステップ、
細胞培養物を指数関数的な増殖条件下で維持するステップ、及び
培養初期と比較して増殖速度が増加した原核細胞を、前記細胞培養物から選択するステップ
をさらに含み得る。
【0046】
変異導入、変異、及び選択は、平行変異導入及び動的平行選択プロセスの一部であり得る。変異導入の誘発は、変異導入プラスミドの使用を含んでもよく、変異導入プラスミドは、第1又は第2のタイプのセンスコドンのいかなる出現を含有することも、第1のタイプの終止コドンのいかなる出現を含有することもない。変異導入プラスミドは、MP6であってもよく、MP6は、第1若しくは第2のタイプのセンスコドンのいかなる出現を含有することも、第1のタイプの終止コドンのいかなる出現を含有することもないように再コード化されている。3ラウンドの変異導入及び選択を適用してもよい。
【0047】
本発明の方法において、変異導入を、5、10、15、17、20、30、45、60、70、80、100、150又は200以上の世代にわたって行ってもよく;及び/又は細胞培養物を、5、10、15、20、30、40、50、52、60、70、80、100又は200以上の世代にわたって指数関数的な増殖条件下で維持してもよい。
【0048】
一部の実施形態では、原核細胞は、細菌細胞又は大腸菌細胞である。
【0049】
本発明のさらなる態様では、ポリマーを合成する方法であって、
i)本発明の、又は本発明の方法に従って生成された原核細胞を提供するステップであって、原核細胞が、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を含むステップ;及び前記原核細胞を、ポリマーをコードする核酸配列と接触させるステップであって、前記核酸配列が第1のタイプのセンスコドンを含むステップ;
ii)原核細胞を、第1の直交性アミノアシルtRNAシンテターゼの基質である第1の非標準アミノ酸の存在下でインキュベートするステップ;及び
iii)原核細胞をインキュベートして、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第1の非標準アミノ酸をポリマーに組み込むことを可能にするステップ
を含む方法が提供される。
【0050】
一実施形態では、原核細胞は、第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を含み、核酸配列は、第2のタイプのセンスコドンを含み、及び
ステップii)は、第2の直交性アミノアシルtRNAシンテターゼの基質である第2の非標準アミノ酸の存在下で原核細胞をインキュベートするステップを含み;及び
ステップiii)は、原核細胞をインキュベートして、第2の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第2の非標準アミノ酸のポリマーへの組み込みを可能にするステップを含む。
【0051】
別の実施形態では、原核細胞は、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含み、核酸配列は第1のタイプの終止コドンを含み、及び
ステップii)は、原核細胞を、第3の直交性アミノアシルtRNAシンテターゼの基質である第3の非標準アミノ酸の存在下でインキュベートするステップを含み;及び
ステップiii)は、原核細胞をインキュベートして、第3の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第3の非標準アミノ酸のポリマーへの組み込みを可能にするステップを含む。
【0052】
ポリマーを合成する方法はいずれも、合成されたポリマーを精製するステップをさらに含み得る。
【0053】
合成されたポリマーは、別の非標準アミノ酸に直ちに隣接する少なくとも1つの非標準アミノ酸を含み得る。ポリマーは、互いに直ちに隣接する2、3、4、5、6、7、8、9、10、15、又は20以上の非標準アミノ酸の鎖を含み得る。ポリマーは、大環状分子(macrocycle)であり得る。非標準アミノ酸は、BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-Nitro-Tyr、及びp-Az-Pheのいずれか1つ又は任意の組合せであり得る。
【0054】
本発明の一態様では、本発明のポリマーを合成する方法によって得られた又は得ることができるポリマーが提供される。
【0055】
本発明の一態様では、単離された1R26PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。単離された1R26PylRSは、配列番号9と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であってもよく、以下の変異の群:i)L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iv)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;及びv)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223Aのいずれか1つを含み得る。単離された1R26PylRSは、配列番号10~14のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0056】
本発明の一態様では、単離されたアーケオグロブス・フルギダス(Archaeoglobus fulgidus)チロシル-tRNAシンテターゼ(AfTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。単離されたAfTyrRSは、配列番号16と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であってもよく、以下の変異の群:i)Y36I、L69M、H74L、Q116E、D165T、I166G、及びN190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;及びiii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190Nのいずれか1つを含み得る。単離されたAfTyrRSは、配列番号16~19のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0057】
本発明の一態様では、単離されたLum1PylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。Lum1PylRSは、配列番号32と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であってもよく、以下の変異の群:i)L121L、L125L、Y126G、M129L、V168V;及びii)L121M、L125I、Y126F、M129A、V168Fのいずれか1つを含み得る。Lum1PylRSは、配列番号32~34のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0058】
本発明の一態様では、単離されたNitroPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。NitroPylRSは、配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であってもよく、以下の置換L123M、L127I、Y128F、M131A、及びV169Fを含む。NitroPylRSは、配列番号35又は配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0059】
本発明の一態様では、単離されたClosΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。ClosΔNTDPylRSは、配列番号37と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であってもよく、以下の変異の群:i)Y126G、M129L、Y208Y、及びii)Y126Y、M129A、Y208Fのいずれか1つを含む。ClosΔNTDPylRSは、配列番号37~39のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0060】
本発明の一態様では、単離されたTronΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。TronΔNTDPylRSは、配列番号40と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0061】
本発明の一態様では、単離されたGemmΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。GemmΔNTDPylRSは、配列番号41と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0062】
本発明の一態様では、単離されたPGA8ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。PGA8ΔNTDPylRSは、配列番号42と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0063】
本発明の一態様では、単離されたI2ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。I2ΔNTDPylRSは、配列番号43と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0064】
本発明の一態様では、単離されたD121ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。D121ΔNTDPylRSは、配列番号44と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0065】
本発明の一態様では、単離されたD416ΔNTDPylRS、又は非標準アミノ酸に対して変更された選択性を有するバリアントが提供される。D416ΔNTDPylRSは、配列番号45と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0066】
本発明のtRNAシンテターゼは、AllocK、AlkK、BocK、Bta、CbzK、CypK、3-Nitro-Tyr、NMH、p-I-Phe、及びp-Az-Phe、及びo-メチルチロシンのいずれかに対して変更された選択性を有し得る。
【0067】
本発明の一態様では、単離されたtRNAが提供され、単離されたtRNAは、配列番号15、20、46~52、54~58、61~66のいずれか1つと少なくとも80%、90%、95%、99%、又は100%同一である。
【0068】
本発明の一態様では、本発明に従うtRNAシンテターゼ及びtRNAを含む宿主細胞であって、tRNAシンテターゼ及びtRNAが直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、宿主細胞が提供される。
【0069】
本発明の一態様では、以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞が提供される:
(i)直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、本発明に従うtRNAシンテターゼ及びtRNA;
(ii)AfTyrRS及びAf-tRNATyr(A01) YYYが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、アーケオグロブス・フルギダスチロシル-tRNAシンテターゼ(AfTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY
(iii)MmPylRStRNAシンテターゼ及びMmtRNAPyl YYYが、直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、MmPylRStRNAシンテターゼ、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びMmtRNAPyl YYY
【0070】
本発明の一態様では、以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞が提供される:
(i)直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、本発明に従うtRNAシンテターゼ及びtRNA;
(ii)AfTyrRS及びAf-tRNATyr(A01) YYYが直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、AfTyrRS、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びAf-tRNATyr(A01) YYY
(iii)MjTyrRS及びMjtRNATyr YYYが直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、M.ヤンナスキイ(M jannaschii)チロシル-tRNAシンテターゼ(MjTyrRS)、又は非標準アミノ酸に対して変更された選択性を有するバリアント、及びMjtRNATyr YYY
【0071】
本発明の一態様では、以下のリストから選択される2つ又は3つの項目の任意の組合せを含む宿主細胞が提供される:i)クラスA ΔNPylRS/ΔNPyltRNA対;ii)クラスB ΔNPylRS/ΔNPyltRNA対;及びiii)MmPylRS/SpePyltRNA対。
【0072】
宿主細胞は、原核細胞又は真核細胞、細菌細胞、大腸菌細胞、哺乳動物細胞、昆虫細胞、又はヒト細胞であり得る。
【0073】
本発明の一態様では、ゲノムが再コード化されている原核細胞の増殖速度を改善する方法であって、
再コード化されたゲノムを含む原核細胞を含む細胞培養物において変異導入を誘発するステップ、
細胞培養物を指数関数的な増殖条件下で維持するステップ、
培養初期と比較して増殖速度が増加した原核細胞を、前記細胞培養物から選択するステップ
を含む方法が提供される。
【0074】
変異導入、変異、及び選択は、平行変異導入及び動的平行選択プロセスの一部であり得る。変異導入の誘発は、変異導入プラスミドの使用を含み得る。変異導入プラスミドは、再コード化された変異導入プラスミド、例えば第1及び/又は第2のタイプのセンスコドン、及び任意で第1のタイプの終止コドンを除去するように再コード化された変異導入プラスミドであり得る。変異導入プラスミドは、MP6であり得る。2ラウンドの変異導入及び選択を適用してもよい。変異導入を、5、10、15、17、20、30、45、60、70、80、100、150又は200以上の世代にわたって行ってもよく;及び/又は細胞培養物を、5、10、15、20、30、40、50、52、60、70、80、100、200、又はそれより多くの世代にわたって指数関数的な増殖条件下で維持してもよい。原核細胞は、細菌細胞又は大腸菌細胞であり得る。
【0075】
本発明の一態様では、本発明の原核細胞の増殖速度を改善する方法のいずれかによって得られた又は得ることができる原核細胞であって、原核細胞の増殖速度が、親株の参照原核細胞の増殖速度より速い原核細胞が提供される。
【0076】
本発明の一態様では、原核細胞であって、第1の内因性tRNAを発現せず;第1の内因性tRNAが不必要であるように、第1のタイプのセンスコドンが再コード化されているゲノムを含み;第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAが第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び第1の直交性tRNAが第1のタイプのセンスコドンを解読することが可能である原核細胞が提供される。
【0077】
ゲノムの必須遺伝子は、第1のタイプのセンスコドンの出現を含有しなくてもよく、第1の内因性tRNAは、第1のタイプのセンスコドンの同族のtRNAであってもよい。ゲノムは、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい、及び第1の内因性tRNAは、第1のタイプのセンスコドンの同族のtRNAであってもよい。第1のタイプのセンスコドンは、TCAであってもよく、第1の内因性tRNAは、tRNASer UGAであってもよい;又は第1のタイプのセンスコドンは、TCGであってもよく、第1の内因性tRNAは、tRNASer CGAであってもよい。親株におけるTCAコドンの複数の出現がAGTに置き換えられていてもよく;及び/又は親株におけるTCGコドンの複数の出現がAGCに置き換えられていてもよい。
【0078】
さらなる実施形態では、原核細胞は、第2の内因性tRNAを発現せず;第2の内因性tRNAが不必要であるように、第2のタイプのセンスコドンが再コード化されているゲノムを含み;第2の直交性アミノアシルtRNAシンテターゼ及び第2のtRNAを発現し、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAが第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し;及び第2の直交性tRNAが、第2のタイプのセンスコドンを解読することが可能である。ゲノムの必須遺伝子は、第2のタイプのセンスコドンの出現を含有しなくてもよく、第2の内因性tRNAは、第2のタイプのセンスコドンの同族のtRNAであってもよい。ゲノムは、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよく、第2の内因性tRNAは、第2のタイプのセンスコドンの同族のtRNAであってもよい。第2のタイプのセンスコドンはTCAであってもよく、及び第2の内因性tRNAは、tRNASer UGAであってもよく;又は第2のタイプのセンスコドンはTCGであってもよく、及び第2の内因性tRNAは、tRNASer CGAであってもよい。
【0079】
さらなる実施形態では、原核細胞は、第1の内因性終結因子を発現せず;第1のタイプの終止コドンは、第1の内因性終結因子が不必要であるようにゲノム内で再コード化されており;原核細胞は、第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAを発現し;第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAは、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し;及び第3の直交性tRNAは、第1のタイプの終止コドンを解読することが可能である。ゲノムの必須遺伝子は、第1のタイプの終止コドンの出現を含有しなくてもよく、及び第1の内因性終結因子は、第1のタイプの終止コドンの同族の終結因子であってもよい。ゲノムは、第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよく、第1の内因性終結因子は、第1のタイプの終止コドンの同族の終結因子であってもよい。第1のタイプの終止コドンはTAGであってもよく、第1の内因性終結因子はRF-1であってもよい。親株におけるTAGコドンの出現は、TAAに置き換えられていてもよい。
【0080】
原核細胞は、細菌細胞又は大腸菌細胞であり得る。原核細胞は生存可能である。
【図面の簡単な説明】
【0081】
図1】株の進化及びSyn61Δ3の作製を示す図である。(A)株進化の概略図である。セリン及びタンパク質終止をコードするコドンを、tRNAのアンチコドン又はそれらを解読することが予測される終結因子に黒い線でつなぐ。対応するtRNA及び終結因子をコードする遺伝子を黒色の枠で示す。Syn61の解読規則を有する細胞を、全体を通してピンク色の枠で示す。2ラウンドの平行変異導入及び動的選択により、Syn61、Syn61(ev2)を作製した。serT、serU、及びprfAを欠失させてSyn61Δ3を作製した。最後に、3ラウンドの平行変異導入及び動的選択を適用してSyn61Δ3(ev5)を作製した;Syn61Δ3及びSyn61Δ3(ev5)を、全体を通して淡い青緑色の枠で表す。(B)Syn61及びSyn61Δ3(ev5)の発達における全ての中間株の増殖速度。増殖速度を、各株についてn=8の同型培養について測定した増殖曲線に基づいて計算した。統計学に関しては方法を参照されたい。
図2-1】~
図2-2】溶解性ファージの繁殖及び細胞溶解がSyn61Δ3において妨害されることを示す図である。(A)Syn61Δ3のウイルス感染の概略図。serU(tRNASer CGAをコードする)、serT(tRNASer UGAをコードする)、及びprfA(RF-1をコードする)の欠失は、UCG、UCA及びUAGコドンを読み取り不可にし、リボソームは、ここでウイルスmRNAに関して示されるように、それらを含有するmRNA内のこれらのコドンで停滞する(stall)。(B)T6ファージのゲノムにおけるTCG、TCA、及びTAGコドンの数及びその位置の概略図である。(C)培養物に、T6ファージを感染多重度(MOI)5×10-2で感染させ、総力価(細胞内ファージプラス遊離のファージ)を4時間にわたってモニターした。ゲンタマイシンによる処置を使用して、タンパク質合成を除去し、ウイルスタンパク質を合成することができない、又は新たなウイルス粒子を産生することができない細胞の制御を提供する。(D)T6は、Syn61バリアントを効率よく溶解するが、Syn61Δ3は溶解しない。培養物にパネル(C)を感染させ、OD600を4時間後に測定した。(E)各表記のファージにおけるkb当たりの表記のコドンの数である。(F~G)Syn61Δ3は、複数のファージを同時感染させても生存する:(F)感染後(+)又は非感染後(-)の表記の時点での培養物の写真である。培養物にファージλ、P1、T4、T6、及びT7をそれぞれ、MOI=1×10-2で感染させた。(G)培養物のOD600を、4時間後に測定した。全ての実験を3回の独立した同型培養で実施し、ドットは、独立した同型培養を表し、線(パネル(C))又はバー(パネル(D)及び(G))は平均値を表す。写真(パネル(F))は、3つの独立した同型培養からのデータの代表である。
図3-1】~
図3-3】Syn61Δ3における2つのセンスコドン及び終止コドンの非標準アミノ酸(ncAA)への再定義(reassignment)を示す図である。(A)各コドンの再定義の概略図である。直交性アミノアシルtRNAシンテターゼ/tRNAYYY対(YYYは、直交性tRNA(O-tRNAによってコードされる)のアンチコドンの配列である)のSyn61Δ3(淡い青緑色の枠、図1Aに記載されるように)への導入は、所望の遺伝子に導入された同族のコドン(XXX)の解読を可能にする。直交性対は、XXXコドンに応答した非標準アミノ酸(ncAA)の組み込みを方向付ける。これらのコドン再定義を、濃い灰色の枠で示す。(B)TCG、TCA及びTAGコドンは、Syn61Δ3における翻訳機構によって読み取られず、コドン再定義は、ncAAのUb11XXXへの組み込みを可能にする。11位での単一のTCG、TCA、又はTAGコドン(Ub11XXX)を含む、又は標的コドンを含まない(wt)直交性MmPylRS/MmtRNAPyl YYY対及びC末端Hisタグユビキチンをコードするプラスミドを、Syn61Δ3に導入した。「XXX」は、標的コドンを指し、「YYY」は、同族のアンチコドンを指す。ユビキチン-Hisの発現を、MmPylRSのncAA基質であるBocKの非存在下(-)又は存在下(+)で実施した。全長のユビキチン-Hisが、抗His抗体によって等しい数の細胞からの細胞溶解物において検出された。(C)表記の標的コドンを有するUb11XXX遺伝子からのBocKを組み込むユビキチン-His、Ub-(11BocK)-Hisの産生を、エレクトロスプレーイオン化質量分析法(ESI-MS)によって確認した。理論的質量:9487.7Da;実測質量:9487.8Da(TCG)、9487.8Da(TCA)、9488.0(TAG)。100Da小さいピークは、BocKからのtert-ブトキシカルボニルの喪失に起因する。(D)パネル(B)と同様であるが、しかしUb遺伝子の11位及び65位で標的コドンを含有するUb11XXX,65XXXを使用する。(E)表記の標的コドンを有するUb11XXX65XXX遺伝子からの11位及び65位でBocKを組み込むユビキチン-Hisの産生を、ESI-MSによって確認した。理論的質量:9629.0Da;実測質量:9629.2Da(TCG)、9629.0Da(TCA)、9629.0Da(TAG)。-100Daのより小さいピークはBocKからのtert-ブトキシカルボニルの喪失に対応する。(F)パネル(B)と同じであるが、Ub遺伝子の11、14、及び65位で標的コドンを含有するUb11XXX,14XXX,65XXXを使用する。(G)表記の標的コドンを有するUb11XXX,14XXX,65XXXの11、14、及び65位でBocKを組み込むユビキチン-Hisの産生を、ESI-MSによって確認した。理論的質量:9756.1Da;実測質量:9756.2Da(TCG)、9756.0Da(TCA)、9756.0Da(TAG)。-100Da又は-200Daのより小さいピークはそれぞれ、1つ又は2つのBocK残基からのtert-ブトキシカルボニルの喪失に対応する。(H)パネル(B)と同じであるが、Ub遺伝子の9、11、14、及び65位で標的コドンを含有するUb9XXX,11XXX,14XXX,65XXXを使用する。(I)表記の標的コドンを有するUb9XXX,11XXX,14XXX,65XXXの9、11、14、及び65位でBocKを組み込むユビキチン-Hisの産生をESI-MSによって確認した。理論的質量:9883.3Da;実測質量:9883.2Da(TCG)、9883.2Da(TCA)、9883.2Da(TAG)。-100Da又は-200Daのより小さいピークはそれぞれ、1つ又は2つのBocK残基からのtert-ブトキシカルボニルの喪失に対応する。全ての実験を、生物学的反復実験で3回実施し、類似の結果を得た。
図4-1】~
図4-2】Syn61Δ3細胞におけるTCG、TCA、及びTAGコドンへの別個の非標準アミノ酸の2重(double)及び3重(triple)の組み込みを示す図である。(A)Syn61Δ3における、TCG(青色の枠)、TCA(金色の枠)及びTAG(緑色の枠)コドンの別個のncAAへの再定義である。単一細胞において3つ全てのコドンを別個のncAAに再定義することは、3つの改変された3重直交性(triply orthogonal)アミノアシルtRNAシンテターゼ/tRNA対を必要とする。各対は、別個のncAAを認識し、別個のコドンを解読しなければならない。これらの3重直行性対からのtRNAを、O-tRNA1-3と表示する。(B)単一の遺伝子におけるTCG及びTAGコドンに応答した2つの別個の非標準アミノ酸の組み込みである。1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA対及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA対(30)(それぞれ、Nε-(カルボベンジルオキシ)-L-リシン(CbzK)のTCGへの組み込み、及び(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(p-I-Phe)のTAGへの組み込みを方向付ける)を含有するSyn61Δ3(ev4)に、CbzK及びp-I-Pheを提供した。細胞はまた、Ub11TCG,65TAG(TCG/TAG)又はUb9TCG,11TCG,14TAG,65TAG(2×TCG/2×TAG)、又は標的コドンを含有しないwt Ubも含有した。ユビキチン-Hisの発現を、ncAAの非存在下(-)又は存在下で実施した。全長のユビキチン-Hisが、抗His抗体によって等しい数の細胞からの細胞溶解物中で検出された。(C)パネル(E)に記載されるようにCbzK及びp-I-Pheの存在下で発現させ、Ni2+-NTAクロマトグラフィーによって精製した、精製Ub-(11CbzK、65p-I-Phe)(黒色の軌跡)及びUb-(11CbzK、14CbzK、57p-I-Phe、65p-I-Phe)(灰色の軌跡)のESI-MS解析である。これらのデータはそれぞれ、TCG及びTAGコドンに応答したCbzK及びp-I-Pheの定量的組み込みを確認する。Ub-(11CbzK、65p-I-Phe)、理論的質量:9707.81Da;実測質量:9707.40Da.Ub-(11CbzK、14CbzK、57p-I-Phe、65p-I-Phe)、理論的質量:10055.00Da;実測質量:10055.60Da。(D)単一の遺伝子における3つの別個の非標準アミノ酸のTCG、TCA及びTAGコドンへの組み込みである。1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA対、MmPylRS/MmtRNAPyl UGA対及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA対を含有するSyn61Δ3(ev4)に、CbzK、BocK及びp-I-Pheを提供した。細胞はまた、Ub9TAG,11TCG,14TCA(TCG/TCA/TAG)も含有した。この遺伝子の発現を、ncAAの非存在下(-)又は存在下(+)で実施した。全長のUb-(9p-I-Phe、11CbzK、14BocK)-Hisは、抗His抗体によって、等しい細胞数からの細胞溶解物中で検出された。(E)精製Ub-(9p-I-Phe、11CbzK、14BocK)のESI-MS、理論的質量:9820.97Da;実測質量:9820.80Da。ウェスタンブロット実験(パネル(B)及び(D))を、5つの生物学的反復実験において実施し、類似の結果を得た。ESI-MSデータ(パネル(C)及び(E))を1回収集した。
図5-1】~
図5-3】非標準ヘテロポリマー及び大環状分子のプログラム可能なコード化された合成を示す図である。(A)2つの別個のncAAモノマー(A(濃い青色)及びB(緑色)と表示される)のリボソーム重合化における基本ステップ。A及びBで構成される全ての線状ヘテロポリマー配列を、これらの4つの基本ステップからコード化することができる。(B)ヘテロポリマー配列(非標準モノマーを星印で示す)のコード化。ヘテロポリマーにおけるモノマーの配列を、ユーザーによって記載されるコドンの配列によってプログラムする。モノマー(A及びB)の同一性を、細胞に添加したアミノアシルtRNAシンテターゼ/tRNA対によって定義する。細胞を、単一のDNA配列からの異なるヘテロポリマー配列をコードするようにリプログラムすることができる。配列は、sfGFP-Hisの3位での挿入としてコードされた。再定義スキーム1(r.s.1)は、MmPylRS/MmtRNAPyl CGA対を使用してAllocKをモノマーAとして定義し、及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA対を使用してCbzKをモノマーBとして定義する(図S7、D~E)。r.s.2は、MmPylRS/MmtRNAPyl CGA対を使用してBocKをモノマーAとして定義し、AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA対を使用してp-I-PheをモノマーBとして定義する。r.s.3は、1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA対を使用して、CbzKをモノマーAとして定義し、AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA対を使用してp-I-PheをモノマーBとして定義する。(C~E)表記のncAAで構成されるコードされた配列の重合化、及びSyn61Δ3(ev5)における得られたsfGFP-His6発現は、培地への両方のncAAの添加に依存した。(F)表記のncAA六量体を含有する精製sfGFP-His6バリアントのエレクトロスプレーイオン化(ESI)MS。BocK/p-I-Phe(N末端メチオニンの喪失後の予想される質量:29172.07Da;観察された質量:29171.8Da)、CbzK/p-I-Phe(N末端メチオニンの喪失後の予想される質量:29274.13Da;観察された質量:29274.0Da)及びAllocK/CbzK(N末端メチオニンの喪失後の予想される質量:29091.64Da;観察された質量:29092.2Da)。ESI-MSデータを1回収集した。(G)遊離の非標準ポリマーのコード化された合成。四量体及び六量体をコードするDNA配列を、r.s.1(B)と同じ対を含有するSyn61Δ3(ev5)細胞において、SUMOと、キチン結合ドメイン(CBD, chitin-binding domain)にカップリングしたGyrAインテインとの間に挿入した。コンストラクトの発現後のUlp1切断及びGyrAトランス-チオエステル化切断は、遊離の非標準四量体及び六量体ポリマーの単離をもたらした。追加のシステインをポリマー配列のすぐ上流に付加すると、大環状非標準ポリマーの自己切断及び放出をもたらす。(H~J)精製された線状及び環状AllocK/CbzKヘテロポリマーの化学構造及びESI-MSスペクトル。生のESI-MSスペクトルは、異なる非標準ペプチドに関して相対強度及び観察されたm/z比を示す。予想される[M+H]又は[M+2H]2+イオンに対応する観察された質量を、太字で強調する。他の付加物及び断片イオンを、これらと比較して表示する。
図6-1】~
図6-3】(S1)Syn61株の進化及びノックアウトを示す図である。(A)自動平行進化の概略図である。クローン培養物を淡黄色で示し、各ウェル中の変異導入集団を別個の影によって表す。変異誘発培養物を、ロボットプラットフォームにおいてランダム変異誘発後に6サイクルの動的平行選択を行って17~70世代にわたって増殖させた。吸光度(OD600)を定期的に評価し、3つのウェルのOD600が0.5に達すると全てのウェルを再希釈し、およそ52世代にわたる指数関数相での連続的な増殖を可能にする。最後に単コロニーを、変異導入集団から単離し、増殖の測定及び全ゲノムシーケンシングによって特徴付けた。図面を、許可を得てSchmied et al.(J. S. Italia et al., Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. Journal of the American Chemical Society 141, 6204-6212 (2019))から改作した。(B)進化させたプールから単離したSyn61及びSyn61Δ3子孫の系列。着色したブロックは、各ラウンド後に独立して進化したプールから単離した個々のクローンを表す。下線を付したクローンは続くラウンドの進化のために選択された。灰色のブロックは、増殖によって特徴付けられたクローンを表し、一部(C02.6、C04.7、A11.3、E7.2)をシーケンシングしたが、図S2においてさらなるORF変異分析のために検討しなかった。進化した株のシーケンシング分析において同定した全ての変異のリストを、データファイルS1に提供する。Syn61Δ3によるラウンド1で示されなかった16の追加のクローンは、G5.2、F8.2、A11.1、F11.3、E10.1、F11.10、F5.2、G8.1、D1.2、D11.1、F11.8、F11.2、D8.4、A9.1、F8.1、F11.6である。(C)Syn61からSyn61Δ3(ev5)への株の発達の概略図である。セリン及びタンパク質終止をコードするコドンを、tRNAのアンチコドン又はそれらを解読すると予想される終結因子に黒色の線でつなぐ;全ての配列は5’から3’に書かれている。対応するtRNA及び終結因子をコードする遺伝子を黒色の枠で示す。本発明者らは、自動平行変異導入及び動的選択を実施して、より急速増殖型のSyn61、Syn61(ev1)を作製した。次に、この株を、Syn61(ev2)へとさらに進化させた。各株において獲得した変異を、オープンリーディングフレーム(ORF,open reading frame)における変異、非コード変異、及び遺伝子間領域の変異として分離する。株発達の際に獲得した全ての変異の詳細なリストに関しては、データファイルS1を参照されたい。serT、serU、及びprfAの標的化欠失により、Syn61Δ3を作製した。このプロセスにおいて、本発明者らは、2つの座で再配列を観察した:i)429bpの欠失をもたらすCRISPRアレイの崩壊、及びii)リボソームオペロンrrnCの高度に相同なリボソームオペロンrrnBからの重複したセグメントによる部分的置き換え。wt Syn61と比較した対応する変化は19の変異に上る。さらに3ラウンドのその後の進化後、本発明者らはそれぞれ、Syn61Δ3(ev3)、Syn61Δ3(ev4)、及びSyn61Δ3(ev5)を単離した。(D)約17世代の変異導入による1ラウンドのSyn61の進化後に増殖速度が増加した単離された4つのクローンの増殖速度である。96の平行進化プール中2つ(C02及びC04)が、改善された増殖を有するクローンを生じた。同じプールから派生したクローン(C02.5及びC02.7、又はC04.7及びC04.4)の配列は、ほぼ同一であり、したがってそれらはクローン性であると考えられた。1より多くの変異を有するオープンリーディングフレームを図S2に記載する。増殖速度を、各株に関してn=8の同型培養から計算した。統計学に関しては、方法を参照されたい。(E)C04.4(Syn61(ev1))の約17世代の変異導入から出発する第2ラウンドのSyn61の進化後に増殖速度が増加した単離された3つのクローンの増殖速度である。96の平行進化プール中2つ(E10及びA11)が、改善された増殖を有するクローンを生じた。増殖速度を、各株に関してn=8の同型培養から計算した。統計学に関しては、方法を参照されたい。(F)11の独立したプールから派生した、約70世代の変異導入による1ラウンドのSyn61Δ3の進化後に増殖速度が増加した単離された22個のクローンの増殖速度である。増殖速度を、各株についてn=5の同型培養又はn=1(赤色の星印で示す)の培養物について計算した。統計学に関しては、方法を参照されたい。(G)F11.9(Syn61Δ3(ev3))の約45世代の変異導入から出発する第2ラウンドのSyn61Δ3の進化後に増殖速度が増加した独立したプールから単離された7つのクローンの増殖速度である。増殖速度を、各株に関してn=6の同型培養について計算した。統計学に関しては、方法を参照されたい。(H)E7.4(Syn61Δ3(ev4))の約60世代の変異導入から出発する第3ラウンドのSyn61Δ3の進化後に増殖速度が増加した独立したプールから単離された5つのクローンの増殖速度である。増殖速度を、各株に関してn=6の同型培養から計算した。統計学に関しては、方法を参照されたい。(I)最も進化したSyn61派生物(derivative)(Syn61Δ3(ev5))の倍加時間を、標準的な実験条件下で記録された増殖曲線から計算した。3つの独立した培養物を、振とうフラスコ中、37℃で増殖させ、OD600の測定を、指数関数的な増殖の間10分毎に行った。各独立培養物に関して、指数関数相の間の60分のウィンドウを選択して、Syn61Δ3(ev5)に関して平均増殖速度0.026±5×10-4、及び倍加時間38.72±1.02分を計算した。統計学に関しては、方法を参照されたい。
図7-1】~
図7-2】(S2)オープンリーディングフレームが、Syn61進化の間に1回より多く変異したことを示す図である。(A)この解析に関して、本発明者らは、14のクローンを選択し、1つは各プールからシーケンシングされたクローンであり、図S1Bに着色したブロックで示す。本発明者らは、単一の株又は進化的に関連する株においてSyn61とSyn61Δ3の間で1回より多く変異したオープンリーディングフレームを同定した。単一の株又は進化の歴史を通して関連する株に生じる変異は、独立でなくてもよい。例えば、E10.4のnrdEに導入された有害なフレームシフト変異は、遺伝子が既に不活化されていることから、nrdEにおける追加の変異が好都合であるように又は不都合であるように選択されないことを意味し得る。本発明者らは、平均で世代あたりbpあたり2×10-6の変異が、誘発されたランダム変異導入により導入されたことを観察した。平均すると、本発明者らは、変異導入及び選択のラウンドあたりゲノム内のORFに87.25の変異を蓄積した。各変異が独立であると仮定すると、同じオープンリーディングフレーム(大腸菌において3556のORFを与える)において少なくとも2つの変異を発見する確率は0.65である。したがって、これらの変異は、偶然に同じORFで見出される可能性がないわけではない。本発明者らのデータは、それらが、再コード化された株の適合性を改善する広く多様な方法であることで一貫している。赤色の星印は、未成熟終止コドン及び典型的に1bpの挿入又は欠失によるフレームシフトを含む有害な変異を示す。赤色の枠は、必須遺伝子を表示し、パネル(A)及び(B)の緑色の枠は、ノックアウト後進化の際に1つの追加の変異によって影響を受けた遺伝子を表示する。進化した株のシーケンシング解析において同定された全ての変異のリストを、データファイルS1に提供する。(B)独立して派生した株におけるSyn61とSyn61Δ3の間で1回より多く変異したオープンリーディングフレーム。23S rRNAメチルトランスフェラーゼであるrrmJは、最初の進化の間にSyn61再コード化事象(S197)に非常に近位の互いに40bp以内に2つのナンセンス変異(P190L、V203A)を獲得した。平均すると、本発明者らは、変異導入及び選択のラウンドあたりゲノム内のORFにおいて87.25の変異を蓄積した。各変異が独立であると仮定すると、同じオープンリーディングフレーム(Syn61において3556のORFを与える)において少なくとも2つの変異を発見する確率は0.65である。したがって、これらの変異は、偶然に同じORFで見出される可能性がないわけではない。全体として、独立して進化した株に生じた変異の間に重複はほとんどなかった。本発明者らのデータは、それらが、再コード化された株の適合性を改善する広く多様な方法であることで一貫している。(C)単一の株又は関連する株におけるSyn61Δ3とSyn61Δ3(ev5)との間で1回より多く変異したオープンリーディングフレーム。染色体分離に関与する必須の遺伝子であるparEは、全体的に最高の変異数を蓄積した。パネル(C)、(D)及び(E)の緑色の枠は、解読要素のノックアウト前にSyn61進化の間で派生した株における1つの追加の変異によって影響を受けた遺伝子を表示する。平均すると、本発明者らは、変異導入及び選択のラウンドあたりゲノム内のORFにおいて62.3の変異を蓄積した。各変異が独立であると仮定すると、同じリーディングフレーム(Syn61において3556のORFを与える)において少なくとも2つの変異を発見する確率は0.41である。したがって、これらの変異は、偶然に同じORFで見出される可能性がないわけではない。全体として独立して進化した株に生じた変異の間に重複はほとんどなかった。これらのデータは、それらが、再コード化された株の適合性を改善する広く多様な方法であることで一貫している。(D)同じ進化ラウンド内で独立して派生した株におけるSyn61Δ3とSyn61Δ3(ev5)の間で1回より多く変異したオープンリーディングフレーム。独立して進化した株において同じ進化ラウンド内で影響を受けたORFは、先祖に対する強い進化圧を示し得る。4つの同一の変異が、ラウンド2後に派生した全ての株においてtopAに記録された。本発明者らは、F11.9のシーケンシング後で株を個別の変異導入プールに分割する前に1bpの欠失が起こったことを疑う。sbcD及びnuoGは、Syn61Δ3の初回進化における独立した変異によって最も影響を受ける。全体として、独立して進化した株に生じた変異の間に重複はほとんどなく、再コード化された株の適合性を改善する広く多様な方法を示している。平均すると、本発明者らは、変異導入及び選択のラウンドあたりゲノム内のORFにおいて62.3の変異を蓄積した。各変異が独立であると仮定すると、同じオープンリーディングフレーム(Syn61において3556のORFを与える)における少なくとも2つの変異を発見する確率は0.41である。したがって、これらの変異は、偶然に同じORFで見出される可能性がないわけではない。全体として独立して進化した株に生じた変異の間に重複はほとんどなかった。これらのデータは、それらが、再コード化された株の適合性を改善する広く多様な方法であることで一貫している。(E)個別の進化ラウンド内で独立して派生した株におけるSyn61Δ3及びSyn61Δ3(ev5)の間で1回より多く変異したオープンリーディングフレーム。2以下の変異が、Syn61Δ3進化のラウンドにわたって独立して現れた。平均すると、本発明者らは、変異導入及び選択のラウンドあたりゲノム内のORFにおいて62.3の変異を蓄積した。各変異が独立であると仮定すると、同じオープンリーディングフレーム(Syn61において3556のORFを与える)において少なくとも2つの変異を発見する確率は0.41である。したがって、これらの変異は、偶然に同じORFで見出される可能性がないわけではない。全体として独立して進化した株に生じた変異の間に重複はほとんどなかった。これらのデータは、それらが、再コード化された株のその適合性を改善する広く多様な方法であることで一貫している。
図8-1】~
図8-2】(S3)ファージの繁殖がSyn61Δ3において除去されることを示す図である。(A)Syn61バリアントの感染4時間後の相対的総ファージ力価(図2Cを参照されたい)。感染に起因する遊離及び細胞内ファージの力価を、培養物からファージを単離し、単離物を連続希釈し、それを使用してプレート上で大腸菌MG1655に感染させることによって決定した。Syn61Δ3、及びタンパク質合成、したがってファージ産生が阻害されるゲンタマイシン処置Syn61(ev2)の培養物は、4時間後に同じ量のファージを含有するが、Syn61(ev2)及びSyn61ΔRF-1は、ファージを繁殖させ、感染をもたらす。示したプレートは、表記の希釈である。(B)タンパク質合成は、ゲンタマイシン処置細胞において除去される。Syn61(ev2)対照及びゲンタマイシンによって処置したSyn61(ev2)を、35S-Met/Cysによって増殖させ、標識されたタンパク質を、SDS-PAGE及びホスフォイメージングによって可視化した。ホスホスクリーンに2週間露出した後、ゲンタマイシン処置試料ではシグナルは観察されなかった。(C)Syn61及びその派生物の感染時のT7ファージの総力価。培養物を、ファージにMOI=5×10-5(感染多重度)で感染させ、総力価を4時間にわたってモニターした。(D)T7は、Syn61バリアントを効率的に溶解したが、Syn61Δ3を溶解しなかった。培養物をパネル(C)の通りに感染させ、OD600を4時間後に測定した。(E)図2Bと同様の、ファージλ、P1、T4、及びT7のゲノムにおけるTCG、TCA、及びTAGコドン密度の概略図。
図9-1】~
図9-3】(S4)MS-MSスペクトルが、Syn61Δ3において1、2、3、又は4個のTCGコドンを含有するレポーターへの部位特異的非標準アミノ酸(ncAA)の組み込みを確認することを示す図である。(A)11位でBocKを含有するUb11TCGレポーター(Ub-(11BocK))(図3、B及びCを参照されたい)を、Ni2+-NTAによって精製し、トリプシン消化に供した後、LC/MS-MS解析を行った(完全な詳細は方法を参照されたい)。トリプシンペプチドは、TCGコドンの11位でのBocKの部位特異的組み込みを確認する。(B~C)(A)と同様の、Ub-(11BocK、65BocK)のLC/MS-MS解析(図3、D及びEを参照されたい)。トリプシンペプチドは、11位(B)及び65位(C)でTCGコドンへのBocKの部位特異的組み込みを確認する。(D~E)(A)と同様の、Ub-(11BocK、14BocK、65BocK)のLC/MS-MS解析(図3、F及びGを参照されたい)。トリプシンペプチドは、11位、14位(D)及び65位(E)でTCGコドンへのBocKの部位特異的組み込みを確認する。(F~G)(A)と同様の、Ub-(9BocK、11BocK、14BocK、65BocK)のLC/MS-MS解析(図3、H及びIを参照されたい)。残基9、11、及び14(F)を含有するトリプシンペプチドは、3つのBocK質量を有する正確な親イオン質量で見出された。この親イオンの断片化パターンは、11及び14位でTCGコドンへのBocKの部位特異的組み込みを確認したが、BocKを9位に局在化させるほど十分なb及びyシリーズイオンはなかった。(G)トリプシンペプチドは、65位でTCGコドンへのBocKの部位特異的組み込みを確認する。
図10】(S5)Syn61Δ3(ev5)におけるセンスコドン及びアンバーコドン抑制のGST-MBP比較を示す図である。直交性aaRS/tRNA対及びその対応するncAAを有するSyn61Δ3(ev5)細胞は、センスコドン又はアンバーコドンに応答して全長のGST-MBPタンパク質を効率よく生成する。本発明者らは、Syn61Δ3(ev5)細胞又はMDS42細胞(対照)に、直交性MmPylRS/MmtRNAPyl YYY対をコードするプラスミド及び同族のGST-XXX-MBPレポーターをコードするプラスミドを共トランスフェクトした;XXXは、野生型(wt)コドン、TCGセンスコドン、又はTAG終止コドンのいずれかをコードし、及びYYYは、その同族のアンチコドンを指す。BocK(5mM)の非存在下(-)又は存在下(+)でのGST-XXX-MBP発現の誘発後、発現したタンパク質を、グルタチオンセファロースビーズによってプルダウンした。結合した試料を、還元グルタチオンによって溶出させ、得られた全長のGST-MBP又は切断型GST産物を、SDS-PAGEによって分析した。Syn61Δ3(ev5)細胞におけるTCGセンスコドン及びTAG終止コドンの両方に関して、効率的なGST-MBP全長の合成は、BocKの存在時に限って検出された(収量に関してはデータファイルS4を参照されたい)。
図11】(S6)Syn61Δ3(ev4)が、9個のセンスコドンの、エラスチン様ポリペプチド(ELP)における非標準アミノ酸(ncAA)への再定義を可能にすることを示す図である。(A)Syn61Δ3(ev4)は、ELP9x(TCG)における9個のTCGコドンへの複数部位のncAAの組み込みを可能にする。本発明者らは、直交性MmPylRS/MmtRNAPyl CGA対をコードするプラスミド及びELP9x(TCG)をコードするプラスミドを共形質転換した;これは、ELPコード化配列の9個のリピートを含有し、各リピートはTCGコドンを含有し、Hisタグは、3’末端でコードされる。「VPGVGVPGVGVPGXGVPGVGVPGVG」の各ELPリピート(配列番号1)。プラスミドの配列は、GenBank受託番号MW879732であり、本明細書において配列番号2として提供され、24の標準アミノ酸及び1つのncAA残基(X)を含有する。MmPylRS/MmtRNAPyl CGAプラスミドによって形質転換した細胞では、ELP9x(TCG)発現が、BocKの非存在下(-)又は存在下(+)で誘発された。次に、本発明者らは、抗His抗体を使用して、正規化した細胞溶解物からの全長タンパク質(ELP9x(BocK))産生をモニターし、効率的なELP9x(BocK)合成が、アラビノース(Ara)及びBocKの両方の存在下に限って検出された。直交性aaRS/tRNA対の効率に関する比較として、細胞を、EctRNAAla CGAをコードするプラスミド、TCGコドンに応答してアラニン組み込みを方向付けるCGAアンチコドンを有するキメラアラニルtRNAによって個別に形質転換し、そこから本発明者らは、アラビノース(Ara)の存在下で効率的なELP9x(Ala)の合成を検出した。ウェスタンブロットを、3回の生物学的反復実験で実施し、類似の結果を得た。(B)(A)に記載した実験からのNi2+-NTA精製ELP9x(BocK)-HisのESI-MSは、BocKの9個のTCGコドンへの組み込みを確認する。理論的質量:23222.32Da;実測質量:23221.80Da.ESI-MSデータは1回収集した。
図12-1】~
図12-2】(S7)2重及び3重の非標準アミノ酸組み込みのために使用したaaRS/tRNA対の相互直交性を示す図である。(A~C)図4及び図5における2重及び3重の別個の非標準アミノ酸組み込みのために使用したaaRS/tRNA対は、相互に直交性である。1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA対、MmPylRS/MmtRNAPyl UGA対及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA対を含有するSyn61Δ3(ev4)(それぞれ、CbzKのTCGへの組み込み、BocKのTCAへの組み込み、及びp-I-PheのTAGへの組み込みを方向付ける)に、CbzK、BocK及びp-IPheを提供した。細胞はまた、GFP3TCG(パネルA)、GFP3TCA(パネルB)、又はGFP3TAGも含有した(パネルC)。GFP3TCGを含有する細胞から精製したGFP-Hisのエレクトロスプレーイオン化(ESI)MS解析は、CbzKを組み込んだが、BocK又はp-I-Pheは組み込まなかった。GFP3TCAはBocKの組み込みをもたらし、GFP3TAGは、p-I-Pheの組み込みをもたらした。(D、E)MmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA対は、Syn61Δ3(ev4)において別個のコドンに応答して別個のncAAを組み込む。直交性aaRS/tRNA対MmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUAは、各々、その別個の同族のコドンに応答してその別個の同族のncAAを組み込む。GFP3XXXレポータープラスミドを有するSyn61Δ3(ev4)細胞におけるMmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUAの両方の存在下で、本発明者らは、AllocK及びCbzKの両方の存在下(+/+)でGFPを発現させた。(D)Ni2+-NTA精製GFP3TCGのESI-MSは、AllocKの組み込みに対応する質量を生じたが、CbzKの組み込みに対応する質量は生じず、したがってその同族のncAA及び同族のコドンに関するMmPylRS/MmtRNAPyl CGAの直交性を実証している。(E)Ni2+-NTA精製GFP3TAGのESIMSは、CbzKの組み込みに対応する質量を生じたが、AllocKの組み込みに対応する質量を生じず、したがってその同族のncAA及び同族のコドンに関する1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA対の直交性を実証している。
図13-1】~
図13-3】(S8)MS-MSスペクトルが、Syn61Δ3(ev4)における2重、2重-2重、及び3重のユビキチンレポーターへの別個の非標準アミノ酸(ncAA)の部位特異的組み込みを確認することを示す図である。(A、B)Ub-(11CbzK、65p-I-Phe)2重(図4Bを参照されたい)、Ub-(11CbzK、14CbzK、57p-I-Phe、65p-IPhe)2重-2重(図4Bを参照されたい)、及びUb-(9p-I-Phe、11CbzK、14BocK)3重(図4Dを参照されたい)ncAA組み込みを、Ni2+-NTAによって精製し、トリプシン消化後にLC-MS/MS解析に供して、別個のセンス及び終止コドンへの別個のncAAの部位特異的組み込みを確認した(完全な詳細に関しては方法を参照されたい)。2重のUb11TCG,65TAG遺伝子への2重の別個のncAA組み込みに関して、精製タンパク質Ub-(11CbzK、65p-I-Phe)は、CbzKの11TCGコドン(A)への、及びp-I-Pheの65TAGコドン(B)への部位特異的組み込みに対応するトリプシンペプチドを生じた。(C、D、E)Ub11TCG,14TCG,57TAG,65TAG遺伝子における2重-2重の別個のncAA組み込みに関して、精製タンパク質Ub-(11CbzK、14CbzK、57p-I-Phe、65p-I-Phe)は、CbzKの11TCG及び14TCGコドン(C)への、並びにp-I-Pheの57TAG(D)及び65TAGコドン(E)への部位特異的組み込みに対応するトリプシンペプチドを生じた。(F)Ub9TAG,11TCG,14TCA遺伝子への3重の別個のncAA組み込みに関して、精製タンパク質Ub-(9p-I-Phe、11CbzK、14BocK)は、p-I-Pheの9TAGコドンへの、CbzKの11TCGコドンへの、及びBocKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。
図14】(S9)Syn61Δ3(ev4)における単一のタンパク質への3つの別個の非標準アミノ酸をコードする複数の例を示す図である。(A)Syn61におけるコドン再定義及び3重ncAA組み込みを実証するために使用した8個の非標準アミノ酸(ncAA)の化学構造。数字は、(B)で提供されたncAAの同一性を示す。(B)Syn61Δ3(ev4)における単一のタンパク質に3つの別個のncAAをコードする7つの例。細胞を、His-タグUb9TAG,11TCG,14TCA(又はwt Ub)レポータープラス3つの相互直交性aaRS/tRNA対をコードするプラスミドによって形質転換し、レポーターの発現を、ncAAの非存在下(-)又は存在下(+)でL-アラビノースの添加によって誘発した。全長のレポーター発現を、OD600分光光度法による測定によって正規化した等しい数の細胞から抗His抗体によるウェスタンブロットによって検出した。wt Ubの発現及びCbzK、p-I-Phe及びBocK/AllocK/CypK/AlkK(レーン1~6)の組み込みに関して、細胞は、対1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA、AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA及びMmPylRS/MmtRNAPyl UGAを含有した。AllocK、3-Nitro-Tyr及びCbzK(レーン7及び8)の組み込みに関して、細胞は対MmPylRS/MmtRNAPyl CGA、MjTyrRS(3-Nitro-Tyr)/MjtRNATyr CUA(参考文献J. N. Beyer et al., Overcoming Near-Cognate Suppression in a Release Factor 1-Deficient Host with an Improved Nitro-Tyrosine tRNA Synthetase. Journal of Molecular Biologyから))及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8)UGAを含有した。p-Az-Phe、CbzK及びAllocK/AlkK(レーン9~11)の組み込みに関して、細胞は対MmPylRS/MmtRNAPyl CGA、MjTyrRS(p-Az-Phe)/MjtRNATyr CUA(参考文献K. C. Schultz et al., A Genetically Encoded Infrared Probe. Journal of the American Chemical Society 128, 13984-13985 (2006)から)及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGAを含有した。全ての例において、Ub9TAG,11TCG,14TCAの発現は、3つの同族のncAAの提供に依存した。(C)本発明者らは、Syn61Δ3(ev4)においてNi2+-NTAビーズによってUb-Hisレポーターを精製し(方法を参照されたい)、(B)で詳述した非天然アミノ酸の7つの異なる組合せのESI-MS解析を実施した。各軌跡は、数字で示される位置で指定されたncAAを有する異なるユビキチン種に対応する。Ub(9p-I-Phe、11CbzK、14BocK)理論的質量:9820.97Da;観察された質量:9820.8Da~100Daのピークは、BocKのtertブトキシカルボニルの喪失に対応する。Ub(9p-I-Phe、11CbzK、14AllocK)理論的質量:9804.94Da;観察された質量:9805.0Da.Ub(9p-I-Phe、11CbzK、14CypK)理論的質量:9830.97Da;観察された質量:9830.8Da.Ub(9p-I-Phe、11CbzK、14AlkK)理論的質量:9802.88Da;観察された質量:9803.0Da.Ub(9(3-Nitro-Tyr)、11AllocK、14CbzK)理論的質量:9740.09Da;観察された質量:9740.0Da.Ub(9p-Az-Phe、11AllocK、14CbzK)理論的質量:9720.09Da;観察された質量:9720.2Da.Ub(9p-Az-Phe、11AlkK、14CbzK)理論的質量:9717.99Da;観察された質量:9718.6Da。ESI-MSデータを1回収集した。標的コドンに応答する3重のncAA組み込みのさらなる確認に関しては図S10を参照されたい。収量に関してはデータファイルS4を参照されたい。
図15-1】~
図15-3】(S10)6つの追加の3重の別個の非標準アミノ酸(ncAA)の組合せからのMS-MSスペクトルが、対象となる3つのncAAのUb9TAG,11TCG,14TCAレポーターへの部位特異的組み込みを確認することを示す図である。(A)3つの別個のncAAのUb9TAG,11TCG,14TCA遺伝子への組み込みをコード化するために、本発明者らは、3つの直交性aaRS/tRNA対を発現させ、及び対応する3つのncAAをSyn61Δ3(ev4)細胞に添加した。ncAAを含有するユビキチンを、Ni2+-NTAによって精製し、トリプシン消化後にLC/MS-MS解析に供し、別個のncAAの別個のTCG、TCA、及びTAGコドンへの部位特異的組み込みを確認した(完全な詳細に関しては方法を参照されたい)。TAG、TCG、及びTCAコドンにそれぞれ応答したp-I-Phe、CbzK、及びAllockの3重のncAA組合せをコードするために、図4Dと同じaaRS/tRNA対を使用した。精製されたタンパク質Ub-(9p-IPhe、11CbzK、14AllocK)は、p-I-Pheの9TAGコドンへの、CbzKの11TCGコドンへの、及びAllocKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。(B)TAG、TCG、及びTCAコドンにそれぞれ応答したp-I-Phe、CbzK、及びCypKの3重を組み込むncAA組合せに関して、図4Dと同じaaRS/tRNA対を使用した。精製タンパク質Ub-(9p-I-Phe、11CbzK、14CypK)は、残基9(p-I-Phe)、11(CbzK)、及び14(CypK)を含有する正確な親イオン質量を有するトリプシンペプチドを生じた。この親イオンの断片化パターンは、CbzKの11TCGコドンへの、及びCypKの14TCAコドンへの部位特異的組み込みを確認したが、p-I-Pheを9位に局在化するほど十分なb及びyシリーズイオンが存在しなかった。(C)TAG、TCG、及びTCAコドンにそれぞれ応答したp-I-Phe、CbzK、及びAlkKを組み込む3重ncAAの組合せに関して、図4Dと同じaaRS/tRNA対を使用した。精製タンパク質Ub-(9p-I-Phe、11CbzK、14AlkK)は、p-I-Pheの9TAGコドンへの、CbzKの11TCGコドンへの、及びAlkKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。(D)TAG、TCG、及びTCAコドンにそれぞれ応答した3-Nitro-Tyr、AllocK、及びCbzKを組み込む3重のncAAの組合せに関して、本発明者らは、直交性aaRS/tRNA対MmPylRS/MmtRNAPyl CGA、MjTyrRS(3-Nitro-Tyr)/MjtRNATyr CUA(参考文献J. N. Beyer et al., Overcoming Near-Cognate Suppression in a Release Factor 1-Deficient Host with an Improved Nitro-Tyrosine tRNA Synthetase. Journal of Molecular Biologyから)、及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGAを使用した。精製タンパク質Ub-(9(3-Nitro-Tyr)、11AllocK、14CbzK)は、3-Nitro-Tyrの9TAGコドンへの、AllocKの11TCGコドンへの、及びCbzKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。(E)TAG、TCG、及びTCAコドンにそれぞれ応答したp-Az-Phe、AllocK、及びCbzKを組み込む3重のncAAの組合せに関して、本発明者らは、直交性aaRS/tRNA対MmPylRS/MmtRNAPyl CGA、MjTyrRS(p-Az-Phe)/MjtRNATyr CUA(参考文献K. C. Schultz et al., A Genetically Encoded Infrared Probe. Journal of the American Chemical Society 128, 13984-13985 (2006)から)、及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGAを使用した。精製タンパク質Ub-(9p-Az-Phe、11AllocK、14CbzK)は、p-Az-Pheの9TAGコドンへの、AllocKの11TCGコドンへの、及びCbzKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。(F)TAG、TCG、及びTCAコドンにそれぞれ応答したp-Az-Phe、AlkK、及びCbzKを組み込む3重のncAAの組合せに関して、パネル(E)と同じ直交性aaRS/tRNA対を使用した。精製タンパク質Ub-(9p-Az-Phe、11AllocK、14CbzK)は、p-Az-Pheの9TAGコドンへの、AlkKの11TCGコドンへの、及びCbzKの14TCAコドンへの部位特異的組み込みに対応するトリプシンペプチドを生じた。
図16-1】~
図16-2】(S11)非標準の基本ステップ及びヘテロ四量体のコード化された細胞合成を示す図である(A)BocK及びp-I-Pheで作製され、GFPの3位での挿入としてコードされるヘテロポリマー配列の合成にとって必要な基本ステップ。BocK(モノマーA)及びp-I-Phe(モノマーB)はそれぞれ、図5Bにおける再定義スキーム2(r.s.2)と同様に、対MmPylRS/MmtRNAPyl CGA及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUAを使用してTCG及びTAGコドンに方向付けられる。重合化及びsfGFP発現はncAAの培地への添加に依存した。(B)CbzK及びp-I-Pheで作製され、図5Bにおける再定義スキーム3(r.s.3)と同様に、対1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUAを使用してTCG及びTAGにそれぞれ方向付けられるコード化基本ステップ。(C)AllocK及びCbzKで作製され、図5Bにおける再定義スキーム1(r.s.1)と同様に、対MmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUAを使用してTCG及びTAGにそれぞれ方向付けられるコード化基本ステップ。(D)図5と同様に、TCG及びTAGコドンを有するヘテロ四量体配列の遺伝子コード化の概略図。(E)BocK及びp-I-Pheで作製され図5Bにおける再定義スキーム2(r.s.2)と同様に、対MmPylRS/MmtRNAPyl CGA及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUAを使用してTCG及びTAGにそれぞれ方向付けられるコード化四量体。(F)CbzK及びp-I-Pheで作製され、図5Bにおける再定義スキーム3(r.s.3)と同様に、対1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA及びAfTyrRS(p-I-Phe)/AftRNATyr(A01) CUAを使用してTCG及びTAGにそれぞれ方向付けられるコード化四量体。(G)AllocK及びCbzKで作製され、図5Bにおける再定義スキーム1(r.s.1)と同様に、対MmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUAを使用してTCG及びTAGにそれぞれ方向付けられるコード化四量体。
図17】(S12)非標準ヘテロ八量体のコード化細胞合成を示す図である。(A)AllocK及びCbzKで作製され、sfGFPの3位での挿入として合成された、図5Bにおける再定義スキーム1(r.s.1)と同様に、対MmPylRS/MmtRNAPyl CGA及び1R26PylRS(CbzK)/AlvtRNAΔNPyl(8)CUAを使用してTCG及びTAGにそれぞれ方向付けられるヘテロ八量体のコード化。(B)AllocK及びCbzKで構成されたコード化配列の重合化、及び得られたsfGFP-His6発現は、培地への両方のncAAの添加に依存する。(C)8個の連続するncAAの表記のセットを含有する精製されたsfGFP-(3AllocK、4CbzK、5AllocK、6CbzK、7AllocK、8CbzK、9AllocK、10CbzK)のエレクトロスプレーイオン化(ESI)MS。N末端メチオニンの喪失及びアセチル化後の予想質量:29608.28Da;観察された質量:29607.60Da。ESI-MSデータを2回収集した。
図18】(S13)線状及び環状非標準ヘテロポリマーの切除を示す図である。ヘテロポリマーは、His-SUMO及びGyrAインテイン(41)-CBD融合体との間でコードされ、発現され、及びSUMO後のシステインの付加は自己環化を可能にする。単一のステップで、ペプチドは、Ulp1及びDTTの添加を通して切除又は環化される。Ulp1は、急速にN末端SUMOを除去するが、C末端GyrAインテインは、DTT又はN末端システインによるトランスチオエステル化を通して切断される。放出されたヘテロポリマーは、C18カラムでの反応から精製することができ、又は不溶性の場合は、遠心分離によって、及び熱酸性メタノールによる抽出によって分離することができる。環化は、N→Sアシルシフトによってペプチド結合の形成を通して不可逆的であるが、DTTチオエステルは加水分解する。
図19】ラムダファージに対するRF1媒介(ΔRF1)耐性は、ssrAのKO時に元に戻ることを示す図である。これとは逆に、トリプルノックアウト(Δ3)細胞におけるラムダファージ耐性はΔssrAによって低減されない。
図20-1】~
図20-2】様々なaaRSの配列アライメントを提供することを示す図である。「」は、全ての整列したaaRS配列において見出される残基を示す。「:」は、整列させた配列間で強い類似性を有する残基を示し、及び「.」は、整列させた配列間の一部の類似性を示す残基を示す。Mmは、メタノサルシナ・マゼイ(Methanosarcina mazei)であり;Mbは、メタノサルシナ・バルケリ(Methanosarcina barkeri)であり;1R26は、メタノメチロフィルス種(Methano methylophilus sp.)である。1R26;Lum1は、メタノマシリコッカス・ルミンエンシス(Methanomassiliicoccus luminyensis)1であり;Nitroは、ニトロソスフェリア・アルカエオン(Nitrososphaeria archaeon)であり;Tronは、メタノナトロンアーカエウム・サーモフィルム(Methanonatronarchaeum thermophilum)であり;Gemmは、ゲンマティモナス門(Gemmatimonadetes)の細菌であり;PGA8は、ペプトストレプトコッカス科(Peptostreptococcaceae)の細菌pGA-8であり;I2は、デスルホスポロシヌス種(Desulfosporosinus sp.)I2であり;Closは、クロストリジウム目(Clostridiales)の細菌であり;D121は、デルタプロテオバクテリウム(Deltaproteobacteria)細菌であり;及びD416は、別のデルタプロテオバクテリア(Deltaproteobacteria)である。
【発明を実施するための形態】
【0082】
本発明者らは、本明細書において、例えば内因性遺伝子の欠失によって原核細胞から第1の内因性tRNA及び第2の内因性tRNAを除去して、生存可能な細胞をもたらすことが可能であることを実証する。
【0083】
このように、本発明の第1の態様では、原核細胞であって、第1の内因性tRNA及び第2の内因性tRNAを発現せず;並びに第1の内因性tRNA及び第2の内因性tRNAが不必要であるように第1のタイプのセンスコドン及び第2のタイプのセンスコドンが再コード化されているゲノムを含む原核細胞が提供される。
【0084】
内因性tRNAは、内因性tRNAが、その同族のコドン(複数可)を解読することを可能にする形態で存在しない場合、発現していないと考えられる。このように、内因性tRNAは、原核細胞内で内因性tRNAの機能的形態の産生を防止する任意の方法を使用して除去され得る。例えば、内因性遺伝子が欠失されてもよく、又は遺伝子の一部が発現を防止するために欠失されてもよい。調節配列を欠失させてもよく、又は発現を防止するように変更してもよい。或いは、ナンセンス、フレームシフト、又はミスセンス変異が、機能的形態でのtRNAの発現を防止してもよい。
【0085】
内因性tRNAの除去は、ゲノムが、特定のタイプのセンスコドンの出現を除去するために再コード化されている原核細胞において実施される。「再コード化(Recoding)」とは、本明細書で使用される場合、コドンの出現がゲノムから除去されるように、あるタイプのコドンの出現を異なるコドンに置き換えることである。再コード化されたセンスコドンを、同義コドンに置き換えて、コードされるポリペプチドを変化させることなく、異なるコドン使用をもたらしてもよい。或いは、例えばコードされるポリペプチドの配列の変更が生存率に影響を及ぼさない場合、センスコドンを、非同義コドンに置き換えてもよい。欠失した内因性tRNAは、再コード化の観点から不必要であるtRNAである。「不必要(Dispensable)」とは、本明細書で使用される場合、原核細胞の生存にとって必要ではないことを意味する。
【0086】
生存可能な原核細胞は、代謝的に活性であることが可能な細胞である。特定の実施形態では、本発明の生存可能な原核細胞は、適した培地中及び特定の種又は株の適した条件下で培養した場合に増殖することが可能であり得る。そのような原核細胞は、培養することが可能であると呼ばれ得る。一例として、原核細胞が大腸菌などの細菌細胞である場合、生存率の評価は、LB培地を含む培地中、又はLBアガーを含むアガー上、37℃で前記細菌を培養することによって実施され得る。培地又はアガーに、2%グルコースを補充してもよい。細菌の増殖を、標準的なアプローチ、例えばOD600の測定を使用してモニターしてもよい。代替のアプローチ、又は特定の原核細胞、細菌株、細菌種に適合させたアプローチ、又はマーカー遺伝子を含むことに関するアプローチは、当業者に公知である。
【0087】
置き換えられている(又は欠失している)1又は2以上のセンスコドンを解読するtRNAを欠失させてもよく、原核細胞は、tRNAが、置き換えられている(又は欠失している)1又は2以上のセンスコドンのみを解読する場合;又は或いはtRNAが、置き換えられている(又は欠失している)1又は2以上のセンスコドン、及び置き換えられていない(又は欠失していない)1又は2以上のセンスコドンを解読する場合、tRNAが、置き換えられていない(又は欠失していない)1又は2以上のセンスコドンが不必要である場合(すなわち、tRNAが解読する1つ又は残りのセンスコドンは、1又は2以上の代替tRNAによって解読される)、生存可能のままである。例えば、原核細胞のゲノムが、TCAセンスコドンを欠如する場合、tRNASer UGAをコードするserTを欠失させてもよく、及び/又はゲノムがTCGセンスコドンを欠如する場合、tRNASer CGAをコードするserUを欠失させてもよい。このように、一実施形態では、原核細胞は、tRNASer UGAもtRNASer CGAも発現しない。
【0088】
再コード化される第1及び第2のタイプのセンスコドンの出現数は、原核細胞の生存率を維持しながら前記センスコドンに対応する同族のtRNAの除去を可能にするために妥当である。例えば、これは、必須遺伝子からの第1及び第2のタイプのセンスコドンの全ての出現を除去することによって達成され得る。遺伝子の産物が原核細胞の生存にとって必要である場合、遺伝子は、本明細書で使用される場合、「必須」である。例えば、遺伝子によってコードされるタンパク質の機能的形態の発現の防止が原核細胞の非生存をもたらす場合、遺伝子は、必須であると考えられる。特に、遺伝子内の「ブランク」コドン(すなわち、細胞が対応するtRNA又は終結因子を含有しないコドン)が細胞生存率の喪失をもたらす場合、遺伝子は必須であると考えられる。したがって、一実施形態では、生存率を失うことなくブランクコドンを認容することができない原核細胞の遺伝子は全て再コード化されるが、ブランクコドンを認容することができる遺伝子は再コード化されなくてもよい。このように、当業者は、同族のtRNAが不必要であるか否かを評価することによって、全ての必須遺伝子が再コード化されているか否かを評価することができる。
【0089】
特定の実施形態では、原核細胞であって、原核細胞が、第1の内因性tRNA及び第2の内因性tRNAを発現せず;原核細胞の必須遺伝子が第1のタイプのセンスコドンの出現を含有せず、及び第1の内因性tRNAが、第1のタイプのセンスコドンの同族のtRNAであり;及び原核細胞の必須遺伝子が第2のタイプのセンスコドンの出現を含有せず、及び第2の内因性tRNAが、第2のタイプのセンスコドンの同族のtRNAである、原核細胞が提供される。
【0090】
特定の実施形態では、ゲノムは、第1及び/又は第2のタイプのセンスコドンの出現を含まない、100以上、200以上、又は300以上の必須遺伝子を含む。例えば、ゲノムにおける全て又は実質的に全ての必須遺伝子が、第1及び/又は第2のタイプのセンスコドンの出現を含まなくてもよい。
【0091】
一部の実施形態では、必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストの1又は2以上から選択され得る。
【0092】
特に、必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストの1又は2以上から選択され得る。
【0093】
他の実施形態では、本発明の原核細胞は、第1及び/又は第2のタイプのセンスコドンの5以下の出現を含むゲノムを含み得る。ゲノムは、親ゲノムから派生してもよく、又は第1及び/又は第2のタイプのセンスコドンの出現の10%未満、5%未満、2%未満、1%未満、0.5%未満、0.1%未満を含んでもよい。ゲノムは、第1及び/又は第2のタイプのセンスコドンの出現を含まない、100以上、200以上、又は1000以上の遺伝子を含み得る。特にゲノムにおける全て又は実質的に全ての遺伝子が、第1及び/又は第2のタイプのセンスコドンの出現を有しなくてもよい。
【0094】
このように、特定の実施形態では、原核細胞であって、原核細胞が第1の内因性tRNA及び第2の内因性tRNAを発現せず;原核細胞のゲノムが、第1のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、及び第1の内因性tRNAが、第1のタイプのセンスコドンの同族のtRNAであり;並びに原核細胞のゲノムが、第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含むか、又は出現を含まず、及び第2の内因性tRNAが、第2のタイプのセンスコドンの同族のtRNAである、原核細胞が提供される。
【0095】
特定の実施形態では、ゲノムは、第1のタイプのセンスコドンの出現を含まず、及び第2のタイプのセンスコドンの出現を含まない。
【0096】
ゲノムは、親ゲノムから派生してもよく、天然の第1及び/又は第2のタイプのセンスコドンの5以下(例えば、5、4、3、2、若しくは1)の出現を含んでもよく、又は出現を含まなくてもよい。特定の実施形態では、ゲノムは、親ゲノムから派生し、天然の第1及び第2のタイプのセンスコドンの出現を含まない。
【0097】
一部の実施形態では、ゲノムは、100以上、200以上、300以上、400以上、500以上、600以上、700以上、800以上、900以上、1000以上、1500以上、又は2000以上の再コード化された遺伝子を含む。一部の実施形態では、遺伝子は、翻訳の証拠及び/又は予想されるタンパク質産物の証拠が存在する遺伝子である。例えば、ゲノムは、翻訳の証拠及び/又は予想されるタンパク質産物の証拠が存在する、100以上、200以上、300以上、400以上、500以上、600以上、700以上、800以上、900以上、1000以上、1500以上、又は2000以上の再コード化された遺伝子を含み得る。
【0098】
一実施形態では、ゲノム内の全てのアノテートされたオープンリーディングフレームは、第1及び第2のタイプのセンスコドンの出現を有しない。本発明の原核細胞は、細菌細胞、好ましくは大腸菌であってもよく、大腸菌のゲノムは、GenBank受託番号CP040347.1にアノテートされているように、第1及び第2のタイプのセンスコドンの出現を含有しなくてもよい。
【0099】
特定の実施形態では、タンパク質をコードする遺伝子は、第1及び第2のタイプのセンスコドンの出現を有しない。特定の実施形態では、第1及び/又は第2のタイプのセンスコドンの残りの出現のいずれからもタンパク質は翻訳されず、及び/又は第1及び/又は第2のタイプのセンスコドンの残りの出現を含む遺伝子は、推定の又は非コード遺伝子である。一部の実施形態では、第1及び/又は第2のタイプのセンスコドンの残りの出現を含む遺伝子の翻訳は、低減される及び/又は防止される(例えば、遺伝子は、5’配列に終止コドンを含み得る)。
【0100】
センスコドンの任意の残りの出現は、ゲノムが確実に生存可能であるために必要であり得る。例えば、ゲノムにおける第1及び/又は第2のタイプのセンスコドンの1又は2以上、特に全ての残りの出現は、必須遺伝子の調節エレメントに存在し得る;並びに/又は第1及び/又は第2のタイプのセンスコドンの1又は2以上、特に全ての残りの出現は、翻訳の証拠又は予想されるタンパク質産物の証拠が存在しない遺伝子(すなわち、推定の又は非コード遺伝子)に存在し得る。
【0101】
本明細書で使用される場合、「センスコドン」は、アミノ酸をコードするヌクレオチドトリプレットである。このように、センスコドンは、遺伝子予測によって、すなわちタンパク質をコードするゲノムの領域(すなわち、遺伝子)及び対応するオープンリーディングフレーム(ORF)を同定することによって、ゲノムにおいて同定され得る。典型的に、ゲノムは、天然に61のセンスコドン:GCT、GCC、GCA、GCG、CGT、CGC、CGA、CGG、AGA、AGG、AAT、AAC、GAT、GAC、TGT、TGC、CAA、CAG、GAA、GAG、GGT、GGC、GGA、GGG、CAT、CAC、ATT、ATC、ATA、TTA、TTG、CTT、CTC、CTA、CTG、AAA、AAG、ATG、TTT、TTC、CCT、CCC、CCA、CCG、TCT、TCC、TCA、TCG、AGT、AGC、ACT、ACC、ACA、ACG、TGG、TAT、TAC、GTT、GTC、GTA、及びGTG(DNAのコード鎖上で5’から3’に読み取る)を含む。標準的な遺伝子コードは、61のトリプレットコドンを使用して20の標準アミノ酸をコードする。アミノ酸20個中18個は、1つより多くの同義コドンによってコードされる。第1又は第2のタイプのセンスコドンは天然のセンスコドン、すなわち、親ゲノムに存在するセンスコドンであり得る。
【0102】
DNAにおける61のセンスコドンは、その対応するmRNAに転写され、その後1又は2以上のtRNAによって解読される。tRNAは、mRNA中のセンスコドンによって方向付けられるようにアミノ酸をリボソームへと運ぶ。tRNAは、相補的アンチコドンを介して1又は2以上のセンスコドンを認識し得る。センスコドンの配列はその後、ポリペプチド(すなわち、アミノ酸の配列)へと翻訳される。大腸菌ゲノムにおけるコドン及びアンチコドンの相互作用は、国際公開第2020/229592号パンフレット(参照により本明細書に組み入れられる)の図17に示される。
【0103】
第1及び/又は第2のタイプのセンスコドンをゲノム全体に除去するが、他のセンスコドンを除去しないことは、前記第1又は第2のタイプのセンスコドンに対応する同族のtRNAを、ゲノムに残っているセンスコドンを解読する能力を除去することなく、欠失させることを可能にする。
【0104】
セリンのアミノアシルtRNAシンテターゼは、その同族のtRNAのアンチコドンを認識しない。これは、内因性のシンテターゼによるミスアミノアシル化を方向付けない同族のアンチコドンを有するtRNAの導入を通して新規アミノ酸へのコドンの定義を容易にし得る。このように、再コード化されたセンスコドンは、TCG、TCA、TCT、TCC、AGT、又はAGCから選択され得る。特定の実施形態では、第1及び第2のタイプのセンスコドンは、TCA及びTCGである。
【0105】
センスコドンの除去を達成するために、それらを同義センスコドンに置き換えてもよい。これは、コードされるタンパク質配列を確実に変化させないために好ましい。例えば、原核細胞は、親ゲノムにおける第1又は第2のタイプのセンスコドンの出現の90%以上、95%以上、98%以上、99%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上、99.9%以上、又は100%が同義センスコドンに置き換えられているゲノムを有し得る。当業者は、適切な同義センスコドンの置き換えを推定することができる。例えば、大腸菌において、典型的にTCG、TCA、TCT、TCC、AGT及びAGCは全て、セリンをコードする。
【0106】
一部の実施形態では、置き換えは規定の置き換えであり、すなわち1つのセンスコドンが単一の同義センスコドンに置き換えられる。好ましくは、親ゲノムにおける第1又は第2のタイプのセンスコドンの出現の90%以上、95%以上、98%以上、99%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上、99.9%以上、又は100%が規定の(すなわち、単一の)同義センスコドンに置き換えられる。
【0107】
例えば、規定の置き換えは、TCGの、TCT、TCC、AGT、又はAGCのいずれか1つによる置き換え;又はTCAの、TCT、TCC、AGT、又はAGCのいずれか1つによる置き換えであり得る。
【0108】
特に、置き換えは、TCGのAGT若しくはAGCのいずれかへの置き換え;又はTCAのAGT若しくはAGCのいずれか1つへの置き換えの1又は2以上から選択される。特定の実施形態では、TCGは、AGCに置き換えられ、及びTCAはAGTに置き換えられる。
【0109】
好ましくは、これらのコドン置き換えのいずれも、大腸菌において高度に保存された制御配列であるリボソーム結合部位(AGGAGG)に影響を及ぼさない。選択されたコドン置き換えを、小さい試験領域(例えば、必須の標的遺伝子及び標的コドンの両方において豊富なゲノムの20kb領域)において試験して、生存率を評価してもよい。コドンの置き換えが、小さい試験領域で実行可能でない場合、それらを無視してもよい。
【0110】
親ゲノムにおけるセンスコドンの既定の置き換えによる同義センスコドンとの置き換えが生存可能な原核細胞をもたらさない場合、代替の置き換え同義センスコドンを使用してもよい。例えば、親ゲノムにおける第1及び/又は第2のタイプのセンスコドンの出現の99.9%が、規定の(すなわち、単一の)同義センスコドンに置き換えられてもよく、及び残りの0.1%が代替の同義センスコドンに置き換えられてもよい。例えば、TCGの出現の99.9%が、AGCに置き換えられてもよく、0.1%が、TCT、TCC、AGT、若しくはAGCに置き換えられてもよく;及び/又はTCAの出現の99.9%が、AGTに置き換えられてもよく、0.1%が、TCT、TCC、AGT若しくはAGCに置き換えられてもよい。
【0111】
一部の例では、センスコドンの特定の出現を、生存率に影響を及ぼすことなく、潜在的同義センスコドンのいずれかに置き換えなくてもよい。生存率を保持するために、センスコドンを生存率に影響を及ぼさない非同義センスコドンと置き換えてもよい。例えば、親ゲノムにおける第1及び/又は第2のタイプのセンスコドンの出現の99.9%を、規定の(すなわち、単一の)同義センスコドンに置き換えてもよく、残りの0.1%を代替の非同義センスコドンに置き換えてもよい。
【0112】
本発明者らは、さらに、得られた細胞が、少なくとも2つの内因性tRNAを発現しないように、及び少なくとも1つの内因性終結因子を発現しないように、生存率を保持しながら本発明の原核細胞から内因性の終結因子を除去することが可能であることを実証している。このように、一実施形態では、原核細胞は、第1の内因性終結因子を発現せず、第1のタイプの終止コドンは、第1の内因性終結因子が不必要であるように原核細胞のゲノム内で再コード化されている。
【0113】
第1の内因性終結因子の除去は、ゲノムが、第1のタイプの終止コドンの出現を除去するために再コード化されている原核細胞において実施され得る。任意で、除去された終止コドンを同義コドンに置き換える。欠失させた内因性終結因子は、再コード化に関して不必要である因子である。
【0114】
特定の実施形態では、原核細胞であって、原核細胞が第1の内因性tRNA、第2の内因性tRNA、及び第1の内因性終結因子を発現せず;並びに原核細胞のゲノムが、第1及び第2の内因性tRNAが同族である複数のセンスコドンを除去するために、及び第1の内因性終結因子が同族である複数の終止コドンを除去するために、再コード化されている原核細胞が提供される。
【0115】
内因性終結因子は、内因性終結因子が、その同族のコドン(複数可)を解読することを可能にする形態で存在しない場合、発現していないと考えられる。このように、内因性終結因子は、原核細胞内の内因性終結因子の機能的形態の産生を防止する任意の方法を使用して除去され得る。例えば、発現を防止するために、内因性遺伝子を欠失させてもよく、又は遺伝子の一部を欠失させてもよい。発現を防止するために、制御配列を欠失又は変更してもよい。或いは、ナンセンス、フレームシフト、又はミスセンス変異は、機能的形態での終結因子の発現を防止し得る。
【0116】
本明細書で使用される場合、「終止コドン」は、タンパク質への翻訳の終止をコードするヌクレオチドトリプレットである。典型的に、ゲノムは天然に、3つの終止コドン:TAA(「オークル(ochre)」)、TGA(「オパール(opal)」又は「褐色(umber)」)及びTAG(「アンバー(amber)」)。を含む。
【0117】
除去される第1のタイプの終止コドンの出現数は、原核細胞の生存率を維持しながら前記終止コドンに対応する同族の終結因子の除去を可能にするために妥当である。
【0118】
このように、一部の実施形態では、原核細胞の必須遺伝子は、第1のタイプの終止コドンの出現を含有しない。必須遺伝子は、本明細書で考察される任意の遺伝子、特に第1又は第2のタイプのセンスコドンの除去に関連して考察される遺伝子であり得る。特定の実施形態では、ゲノムは、第1のタイプの終止コドンの出現を含まない、100以上、200以上、又は300以上の必須遺伝子を含む。例えばゲノムにおける全て又は実質的に全ての必須遺伝子が、第1のタイプの終止コドンの出現を含まなくてもよい。
【0119】
例えば、ゲノムは、第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び第1のタイプの終止コドンの出現を含まない、100以上、200以上、又は300以上の必須遺伝子を含み得る。特に、ゲノムにおける全て又は実質的に全ての必須遺伝子が、第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び第1のタイプの終止コドンの出現を含まなくてもよい。
【0120】
一部の実施形態では、ゲノムは、第1のタイプの終止コドンの10以下、若しくは5以下の出現を含むか、又は出現を含まない。例えば、第1のタイプの終止コドンの5、4、3、2、若しくは1の例を含むか、又は例を含まない。
【0121】
特定の実施形態では、第1のタイプの終止コドンはTAGであり、及び第1の内因性終結因子はRF-1である。そのような実施形態ではアンバー終止コドン(TAG)の10以下、若しくは5以下の出現が存在してもよく、又は出現が存在しなくてもよい。他の例では、親ゲノムにおけるTAGの90%以上、95%以上、98%以上、99%以上、又は全ての出現が、TAA(オークル終止コドン)に置き換えられる。特定の実施形態では、ゲノムは、アンバー終止コドン(TAG)の出現を含まず、任意で親ゲノムにおけるTAGの全ての出現が、TAA(オークル終止コドン)に置き換えられる。
【0122】
一実施形態では、ゲノム内の全てのアノテートされたオープンリーディングフレームは、第1のタイプの終止コドンの出現を有しない。本発明の原核細胞は、細菌細胞、好ましくは大腸菌であってもよく、大腸菌のゲノムは、GenBank受託番号CP040347.1にアノテートされているように、第1のタイプの終止コドンの出現を含有しなくてもよい。
【0123】
特定の実施形態では、タンパク質をコードする遺伝子は、第1のタイプの終止コドンの出現を有しない。特定の実施形態では、第1のタイプの終止コドンの残りの出現のいずれからもタンパク質は翻訳されず、及び/又は第1のタイプの終止コドンの残りの出現を含む遺伝子は、推定の又は非コード遺伝子である。一部の実施形態では、第1のタイプの終止コドンの残りの出現を含む遺伝子の翻訳は、低減及び/又は防止される(例えば、遺伝子は5’配列に終止コドンを含み得る)。
【0124】
第1のタイプの終止コドンの任意の残りの出現は、ゲノムが生存可能であることを確保するために必要であり得る。例えば、ゲノムにおける第1のタイプの終止コドンの1又は2以上、特に全ての残りの出現が、必須遺伝子の制御エレメントに存在してもよく;及び/又は第1のタイプの終止コドンの1又は2以上、特に全ての残りの出現が、翻訳の証拠又は予想されるタンパク質産物の証拠が存在しない遺伝子(すなわち、推定又は非コード遺伝子)に存在し得る。
【0125】
したがって、一部の実施形態では、ゲノムは、第1及び第2のタイプのセンスコドンの出現を含まず、及び1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない。特定の実施形態では、ゲノムは、センスコドンTCG及びTCAの出現を含まず、及びアンバー終止コドン(TAG)の出現を含まず、任意で親ゲノムにおけるTCG、TCA及びTAGは、同義コドンに置き換えられ、例えば親ゲノムにおけるTCGの出現の99.9%以上が、AGCに置き換えられ、親ゲノムにおけるTCAの出現の99.9%以上がAGTに置き換えられ、及び親ゲノムにおけるTAGの出現の全てがTAAに置き換えられる。
【0126】
特定の実施形態では、原核細胞のゲノムは、センスコドンTCGがAGCに置き換えられているように、センスコドンTCAがAGTに置き換えられているように、及び終止コドンTAGがTAAに置き換えられているように再コード化されており、及び十分数の前記コドンが、2つの同族のtRNA及び同族の終結因子が不必要であるように再コード化されている。
【0127】
特定の実施形態では、本発明の原核細胞は、tRNASer UGA、tRNASer CGA、又はRF-1を発現しない大腸菌細胞であり、センスコドンTCAの出現は、tRNASer UGAが不必要である(例えば、親株の必須遺伝子におけるTCAの出現がAGTに置き換えられている)ように再コード化されており、センスコドンTCGの出現は、tRNASer CGAが不必要である(例えば、親株の必須遺伝子におけるTCGの出現がAGCに置き換えられている)ように再コード化されており、及び終止コドンTAGの出現は、RF-1が不必要である(例えば、親株の必須遺伝子におけるTAGの出現がTAAに置き換えられている)ように再コード化されている。原核細胞はまた、TCA、TCG、及びTAGコドンを解読することが可能な第1、第2,及び第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含むように、並びにポリマー形成の際にそのような部位に非標準アミノ酸を取り込むように改変されていてもよい。
【0128】
一部の実施形態では、本発明の原核細胞のゲノムは、GenBank受託番号CP040347.1に提供される配列と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含み、ゲノムは、tRNASer UGA及びtRNASer CGAが機能的に発現しないように(例えば、serT及びserUを欠失させることによって)さらに変更されている。ゲノムは、RF-1が機能的に発現しないように(例えば、prfAを欠失させることによって)さらに変更されていてもよい。GenBank受託番号CP040347.1に従うゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61 WTと呼ぶ。
【0129】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号3と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含み、ゲノムは、tRNASer UGA及びtRNASer CGAが機能的に発現しないように(例えば、serT及びserUを欠失させることによって)さらに変更されている。ゲノムは、RF-1が機能的に発現しないように(例えば、prfAを欠失させることによって)さらに改変されていてもよい。配列番号3に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61(ev1)と呼ぶ。
【0130】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号4と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含み、ゲノムは、tRNASer UGA及びtRNASer CGAが機能的に発現しないように(例えば、serT及びserUを欠失させることによって)さらに変更されている。ゲノムは、RF-1が機能的に発現しないように(例えば、prfAを欠失させることによって)さらに改変されていてもよい。配列番号4に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61(ev2)と呼ぶ。
【0131】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号5と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含む。配列番号5に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61Δ3と呼ぶ。
【0132】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号6と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含む。配列番号6に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61Δ3(ev3)と呼ぶ。
【0133】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号7と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含む。配列番号7に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61Δ3(ev4)と呼ぶ。
【0134】
一部の実施形態では、本発明の原核細胞のゲノムは、配列番号8(GenBank受託番号CP071799.1としても提供される)と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含む。配列番号8に記載のゲノムを含む大腸菌株を、本明細書に開示される実施例においてSyn61Δ3(ev5)と呼ぶ。
【0135】
本明細書において、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、及び配列番号8のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを含む原核細胞が提供される。原核細胞は、細菌、例えば大腸菌である。一部の実施形態では、配列同一性パーセンテージの計算は、直交性アミノアシルtRNAシンテターゼ-tRNA対又は複数の直交性対の発現を可能にするために挿入されている任意の配列を除外する。配列同一性パーセンテージの計算は、ゲノムにさらに導入されている任意の外因性配列もさらに除外し得る。100%未満の同一性を有するゲノムは、本明細書に開示される再コード化されたセンスコドン及び終止コドンを含んでもよく、したがってそのような実施形態では、バリエーションは、第1のタイプのセンスコドン、第2のタイプのセンスコドン、又は第1のタイプの終止コドンを再導入しない。
【0136】
本発明者らは、前記原核細胞の産生の際に特定のステップを講じなければ、再コード化されたゲノムを有する、又は第1及び/若しくは第2の内因性tRNAを欠如する原核細胞が、増殖欠損を有し得ることを同定した。これらのステップを、本明細書に記載する。
【0137】
本発明者らは、変異導入を誘発する何らかの方法、例えば変異導入プラスミドの使用を伴う方法が、本発明の原核細胞において機能的ではないことにさらに注目した。本発明者らは、具体的に適合させた試薬の提供を通してこの問題を克服している。
【0138】
このように、特定の実施形態では、原核細胞の増殖速度は、親株の参照原核細胞の増殖速度より速い。
【0139】
増殖速度は、本発明の原核細胞の細胞培養物、及び参照原核細胞の細胞培養物を調製すること、並びに培養培地の吸光度の変化の割合を比較することによって比較され得る。一部の実施形態では、原核細胞は細菌細胞、例えば大腸菌であり、及び増殖速度は、LB培地中、37℃、25℃、又は42℃での倍加時間を決定することによって比較される。本発明の原核細胞の倍加時間は、参照原核細胞の倍加時間より1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、又は3倍速くなり得る。
【0140】
「親株」は、本発明の原核細胞の発達の一部として存在するか、又は作製された株である。したがって、本発明の原核細胞は、親株から直接又は間接的に派生する。親株はまた、「祖先系統(progenitor strain)」とも呼ばれ得る。
【0141】
親株は、特定のタイプのセンスコドン及び/又は終止コドンを除去するためにゲノムの再コード化時であるがさらなるステップを講じる前に得られた原核細胞株であり得る。親株は、第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び第1のタイプの終止コドンが、本発明の原核細胞と同じ方法で再コード化されているゲノムを含んでもよく、親株は、全ての内因性tRNAs及び終結因子を含有する。例えば、親株は、TCG、TCA、及びTAGコドン数を除去又は低減するためにゲノムの再コード化時に得られた株であり得る。特定の実施形態では、親株はSyn61であってもよく、又はSyn61(すなわち、GenBank受託番号CP040347.1の配列)のゲノムを含んでもよい。
【0142】
親株は、第1の内因性tRNA、第2の内因性tRNA、及び/又は終結因子の除去時であるが、さらなるステップを講じる前に得られた原核細胞株であり得る。例えば、親株は、tRNASer UGA、tRNASer CGA、及びRF-1の除去時に得られた株であり得る。特定の実施形態では、親株は、Syn61Δ3であってもよく、又はSyn61Δ3(配列番号5)のゲノムを含んでもよい。
【0143】
本発明者らは、本発明の原核細胞がファージに耐性であることを実証する本明細書の実験データを提供する。細胞tRNAの除去がファージ耐性を提供することは以前に仮説が立てられていたが、本発明者らは、第1の及び第2の内因性tRNAの除去が、完全な耐性を提供することを見出した。ファージ耐性のこのレベルは、これらの2つのtRNAを除去する相加効果から予測されるレベルを超えている。特定の理論に拘束されるわけではないが、本発明者らは、内因性tRNAが、それらが解読することができるコドンにおいて重複すること、及びtRNAがコドンに会合することが通常既知ではない場合であっても何らかの程度の読み飛ばしが起こり得ることに注目する。そのため、第1及び第2の内因性tRNAの除去は、相乗作用を示して完全に耐性の原核細胞を提供する。
【0144】
先の段落に加えて、本発明者らは、本明細書において本発明の原核細胞が、ウイルス繁殖のレスキューをもたらし得る変異の蓄積に対してより耐性であることを実証するデータを提供する。例えば、本発明者らは、少なくとも何らかのファージ耐性を有する他の株において遺伝子ssrAをノックアウトすることが、ウイルス繁殖をレスキューすることができることに注目する。これに対し、本発明の原核細胞からのssrAのノックアウトは、ウイルス繁殖をレスキューしない(図19)。そのため、本発明の原核細胞は、たとえさらなる変異が蓄積する場合であっても、驚くほど強力なファージ耐性を実証する。
【0145】
したがって、一実施形態では、本発明の原核細胞は、ファージ感染に対して耐性である。ファージは、ゲノムにおいて第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び/又は第1のタイプの終止コドンを含有する任意のファージであり得る。例えば、本発明の原核細胞は、T4ファージ、T6ファージ、T7ファージ、λファージ、又はP1virファージに対して耐性であり得る。一部の実施形態では、本発明の原核細胞は、これらの例の5つ全てに対して耐性である。
【0146】
本発明の原核細胞は、遺伝子の水平伝播、例えばFプラスミドの水平伝播に対して耐性であり得る。
【0147】
本発明の原核細胞は、親株の細胞である参照原核細胞より感染又は遺伝子の水平伝播に対して耐性であり得る。親株は、本明細書に記載される任意の株であり得る。
【0148】
一部の実施形態では、本発明の原核細胞は、ファージに対して完全に耐性である。原核細胞は、T4ファージ、T6ファージ、T7ファージ、λファージ、及びP1virファージに対して完全に耐性であり得る。「完全に耐性」という用語は、本明細書で使用される場合、本発明の原核細胞の培養物の増殖速度が前記培養物中の関連するファージを含むことによって実質的又は完全に影響を受けないことを意味する。対照は、同量の殺滅されたファージを含むことであり得る。関連するファージは、原核細胞の親株を感染させることが可能であるファージであろう。
【0149】
特定の実施形態では、本発明の原核細胞は、細菌細胞である。細菌細胞は、異種タンパク質産生、特に1つ又は2以上の非標準アミノ酸を含むポリペプチドの産生にとって適切な任意の種の細胞であり得る(例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの)。適切な細菌宿主細胞としては、エスケリキア属(escherichia)(例えば、大腸菌)、カウロバクテリア(caulobacteria)(例えば、カウロバクター・クレセンタス(Caulobacter crescentus))、光栄養細菌(例えば、ロドバクター・スフェロイデス(Rodhobacter sphaeroides))、低温適応細菌(例えば、シュードアルテロモナス・ハロプランクチス(Pseudoalteromonas haloplanktis)、シェワネラ種(Shewanella sp)株Ac10)、シュードモナス菌(pseudomonads)(例えば、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)、シュードモナス・プチダ(Pseudomonas putida)、緑膿菌(Pseudomonas aeruginosa))、好塩性細菌(例えば、ハロモナス・エロンガタ(Halomonas elongate)、クロモハロバクター・サレキシゲンス(Chromohalobacter salexigens))、ストレプトマイセス属(streptomycetes)(例えば、ストレプトマイセス・リビダンス(Streptomyces lividans)、ストレプトマイセス・グリセウス(Streptomyces griseus))、ノカルジア属(nocardia)(例えば、ノカルジア・ラクタムデュランス(Nocardia lactamdurans))、マイコバクテリア属(mycobacteria)(例えば、マイコバクテリウム・スメグマチス(Mycobacterium smegmatis))、コリネフォーム(coryneform)細菌(例えば、コリネバクテリウム・グルタミクム(Corynebacterium glutamicum)、コリネバクテリウム・アンモニアゲネス(Corynebacterium ammoniagenes)、ブレビバクテリウム・ラクトファーメンタム(Brevibacterium lactofermentum))、バシラス綱(bacilli)(例えば、枯草菌(Bacillus subtilis)、バシラス・ブレビス(Bacillus brevis)、バシラス・メガテリウム(Bacillus megaterium)、バシラス・リケニホルミス(Bacillus licheniformis)、バシラス・アミロリケファシエンス(Bacillus amyloliquefaciens))、ビブリオ(vibrio)菌(例えば、ビブリオ・コレラ(Vibrio cholera)、ビブリオ・ナトリゲンス(Vibrio natriegens))、及び乳酸菌(例えば、ラクトコッカス・ラクチス(Lactococcus lactis)、ラクトバシラス・プランタルム(Lactobacillus plantarum)、ラクトバシラス・カゼイ(Lactobacillus casei)、ラクトバシラス・レウテリ(Lactobacillus reuteri)、ラクトバシラス・ガセリ(Lactobacillus gasseri))が挙げられる。一部の実施形態では、細菌は、グラム陰性菌である。
【0150】
特定の実施形態では、細菌は、大腸菌、サルモネラ・エンテリカ(Salmonella enterica)、又は志賀赤痢菌(Shigella dysenteriae)である。より好ましくは、細胞は大腸菌である。適切な大腸菌細胞としては、K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7 Express、SHuffle Express、C41(DE3)、C43(DE3)、及びm15 pREP4、又はそれらの派生物(Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172).が挙げられる。特に、細胞は、MG1655又はBL21、又はその派生物であり得る。MG1655は、大腸菌の野生型株であると考えられている。この株のゲノム配列のGenBankIDは、U00096である。BL21は、広く市販されている。例えば、これは、New England BioLabs社のカタログ番号C2530Hから購入することができる。
【0151】
原核細胞は、同じ種又は株から派生するゲノムを含有し得るか、又は異なる種から派生し得る。例えば、原核細胞が大腸菌である場合、ゲノムは大腸菌ゲノムであり得る。
【0152】
直交性アミノアシルtRNAシンテターゼ-tRNA対を含む原核細胞
本発明者らは、本明細書において、直交性対を形成する第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAが、内因性tRNAを置き換えるために本発明の原核細胞に導入され得ることを実証する実験データを提供する。第1の直交性tRNAは、ゲノムから除去されているタイプのセンスコドンを解読してもよく、例えば、第1のタイプのセンスコドンは、本明細書に開示される任意の方法でゲノムから除去されていてもよい。第1の直交性アミノアシルtRNAシンテターゼは、非標準アミノ酸であり得るアミノ酸によって直交性の同族のtRNAを特異的にアミノアシル化する。したがって、原核細胞は、第1のタイプのセンスコドンが非標準アミノ酸をコードするために再利用されるように、内因性tRNAが、第1の直交性tRNAに置き換えられているシステムを含有し得る。
【0153】
加えて、本発明者らは、本明細書において、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対及び第2の直交性アミノアシルtRNAシンテターゼ-tRNA対が、本発明の原核細胞に導入され得ることを実証する実験データを提供する。第1のtRNAは、ゲノムから除去されたセンスコドンの1つを解読してもよく、及び第2のtRNAは、他のセンスコドンを解読してもよい。直交性アミノアシルtRNAシンテターゼは、その直交性の同族のtRNAを、非標準アミノ酸であり得るアミノ酸によって特異的にアミノアシル化する。したがって、原核細胞は、2又は3以上のセンスコドンが、非標準アミノ酸をコードするために再利用されているシステムを含有し得る。
【0154】
終止コドンが再コード化されている細胞において、第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を、原核細胞に導入し、第3の非標準アミノ酸をコードするために再コード化された終止コドンを使用することを可能にしてもよい。したがって、原核細胞は、2又は3以上のセンスコドン及び1又は2以上の終止コドンが、第1、第2、及び第3の非標準アミノ酸をコードするために再利用されているシステムを含有し得る。特定の実施形態では、原核細胞は、TCA、TCG、及びTAGが、第1、第2、及び第3の非標準アミノ酸をコードするシステムを含有する。第1、第2、及び第3の非標準アミノ酸(amino)は、互いに異なり得る。
【0155】
このように、直交性アミノアシルtRNAシンテターゼ(aaRS)-tRNA対は、原核細胞のタンパク質合成装置を使用して、非標準アミノ酸のポリマーへの組み込みを方向付けることが可能であり得る。直交性シンテターゼは、内因性tRNAを認識せず、及び直交性同族のtRNA(内因性シンテターゼの効率的な基質ではない)を細胞に提供される(又は細胞によって合成される)非標準アミノ酸によって特異的にアミノアシル化する(Chin, J.W., 2017. Nature, 550(7674), 53-60)。
【0156】
一実施形態では、原核細胞であって、原核細胞が第1の内因性tRNAを発現せず、原核細胞が、第1の内因性tRNAが不必要であるように、第1のタイプのセンスコドンが再コード化されているゲノムを含み、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAが第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、及び第1の直交性tRNAが第1のタイプのセンスコドンを解読することが可能である、原核細胞が提供される。
【0157】
別の実施形態では、原核細胞であって、原核細胞が、第1の内因性tRNA及び第2の内因性tRNAを発現せず、第1の内因性tRNA及び第2の内因性tRNAが不必要であるように、第1のタイプのセンスコドン及び第2のタイプのセンスコドンが再コード化されているゲノムを含み、
原核細胞が、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAは第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、第1の直交性tRNAが、第1のタイプのセンスコドンを解読することが可能であり、並びに
原核細胞が、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAを発現し、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAは第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、第2の直交性tRNAが、第2のタイプのセンスコドンを解読することが可能である、
原核細胞が提供される。
【0158】
なお別の実施形態では、原核細胞であって、
原核細胞が、第1の内因性tRNA、第2の内因性tRNA、及び第1の内因性終結因子を発現せず、
原核細胞が、第1の内因性tRNA及び第2の内因性tRNAが不必要であるように、第1のタイプのセンスコドン及び第2のタイプのセンスコドンが再コード化されている、並びに第1の内因性終結因子が不必要であるように第1のタイプの終止コドンが再コード化されているゲノムを含み、
原核細胞が、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAを発現し、第1の直交性アミノアシルtRNAシンテターゼ及び第1の直交性tRNAが第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、第1の直交性tRNAが第1のタイプのセンスコドンを解読することが可能であり、
原核細胞が、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAを発現し、第2の直交性アミノアシルtRNAシンテターゼ及び第2の直交性tRNAが第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、第2の直交性tRNAが第2のタイプのセンスコドンを解読することが可能であり;並びに
原核細胞が、第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAを発現し、
第3の直交性アミノアシルtRNAシンテターゼ及び第3の直交性tRNAが第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を形成し、並びに
第3の直交性tRNAが第1のタイプの終止コドンを解読することが可能である、
原核細胞が提供される。
【0159】
本明細書で使用されるアミノアシルtRNAシンテターゼは、多様であり得る。実施例では特定のtRNAシンテターゼ配列が使用されている場合があるが、本発明は、これらの実施例のみに限定されないと意図される。原則として、tRNAチャージ(アミノアシル化)機能を提供する任意のアミノアシルtRNAシンテターゼを使用することができる。例えば、tRNAシンテターゼは、古細菌などの任意の適切な種、例えばメタノサルシナ(Methanosarcina)、例えばアレタノサルシナ・バルケリ(Alethanosarcina barkeri)MS;メタノサルシナ・バルケリ・フサロ種(Methanosarcina barkeri str. Fusaro);メタノサルシナ・マゼイG01;メタノサルシナ・アセチボランス(Methanosarcina acetivorans)C2A;メタノサルシナ・サーモフィラ(Methanosarcina thermophila);又はメタノコッコイデス(Methanococcoides)、例えばメタノコッコイデス・ブルトニイ(Methanococcoides burtonii)に由来し得る。或いは、tRNAシンテターゼは、細菌、例えばデスルフィトバクテリウム(Desulfitobacterium)、例えばデスルフィトバクテリウム・ハフニエンス(Desulfitobacterium hafniense)DCB-2;デスルフィトバクテリウム・ハフニエンスY51;デスルフィトバクテリウム・ハフニエンスPCP1;又はデスルホトマクルム
・アセトキシダンス(Desulfotomaculum acetoxidans)DSM 771に由来し得る。
【0160】
アミノアシルtRNAシンテターゼは、ピロリシルtRNAシンテターゼ(PylRS)であり得る。PylRSは、野生型又は遺伝子改変されたPylRSであり得る。遺伝子改変されたPylRSは、例えばNeumann et al. (Nat Chem Biol 4:232, 2008)、及びT. Yanagisawa et al., Multistep Engineering of Pyrrolysyl-tRNA Synthetase to Genetically Encode Ne-(o-Azidobenzyloxycarbonyl) lysine for Site-Specific Protein Modification. Chemistry & Biology 15, 1187-1197 (2008)によって、欧州特許第EP2192185A1号明細書、及び国際公開第2016/066995号パンフレット(各々が、参照により本明細書に組み込まれる)に記載されている。適切には、非標準アミノ酸(複数可)の組み込み効率を増加させる遺伝子改変されたtRNAシンテターゼ遺伝子を選択する。PylRSは、メタノサルシナ・バルケリ(MbPylRS)又はメタノサルシナ・マゼイ(MmPylRS)であり得る。
【0161】
本明細書で使用されるtRNAは、多様であり得る。特定のtRNAが実施例で使用されているが、本発明は、これらの実施例のみに限定されないと意図される。原則として、任意のtRNAを使用することができ、但し、選択したtRNAシンテターゼと適合性であることを条件とする。
【0162】
tRNAは、古細菌、例えばメタノサルシナ、例えばメタノサルシナ・バルケリMS;メタノサルシナ・バルケリ・フサロ種;メタノサルシナ・マゼイG01;メタノサルシナ・アセチボランスC2A;メタノサルシナ・サーモフィラ;又はメタノコッコイデス、例えばメタノコッコイデス・ブルトニイなどの任意の適切な種に由来し得る。或いは、tRNAは、細菌、例えばデスルフィトバクテリウム、例えばデスルフィトバクテリウム・ハフニエンスDCB-2;デスルフィトバクテリウム・ハフニエンスY51;デスルフィトバクテリウム・ハフニエンスPCP1;又はデスルホトマクルム・アセトキシダンスDSM771に由来し得る。
【0163】
tRNA遺伝子は、野生型tRNA遺伝子であり得るか、又は変異したtRNA遺伝子であり得る。適切には、非天然アミノ酸(複数可)の組み込み効率を増加させる変異したtRNA遺伝子を選択する。一実施形態では、変異したtRNA遺伝子は、Biochemistry (2013) 52, 10(参照により本明細書に組み込まれる)に記載されるPylTのU25Cバリアントである。
【0164】
一実施形態では、変異したtRNA遺伝子は、Fan et al. (Nucleic Acids Research doi:10.1093/nar/gkv800)(参照により本明細書に組み込まれる)に記載されるPylTのOptバリアントである。
【0165】
一実施形態では、変異したtRNA遺伝子は、U25C及びPylTのOptバリアントの両方を含み、すなわちこの実施形態では、tRNA、例えばPylTtRNACUA遺伝子は、U25C及びOpt変異の両方を含む。
【0166】
一実施形態では、tRNAをコードする配列は、tRNAPylをコードするメタノサルシナ・マゼイピロリシンのピロリシンtRNA(PylT)遺伝子である。
【0167】
アミノアシルtRNAシンテターゼ及びtRNA対は、D. Cervettini et al., Rapid discovery and evolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs. Nature Biotechnology 38, 989-999 (2020)、又はDunkelmann et al. (Engineered triply orthogonal pyrrolysyl-tRNAsynthetase/tRNA pairs enable the genetic encoding of three distinct non-canonical amino acids, Nature Chemistry, Vol 12, June 2020 P535-544)に開示され得るか、又は開示されたものから改作され得る。これらの文書の各々は、参照により本明細書に組み込まれる。
【0168】
背景の節で言及したように、aaRS、tRNA、及びコドンは、好ましくは共に機能し、各々の内因性アミノ酸、aaRS、及びイソアクセプターtRNA基、及びそれらの同族のコドン群に対して直交性である。加えて、第1、第2、及び第3のncAA:aaRS:tRNA:コドンセットの構成要素間の相互作用の可能性があるが、これらもまた、好ましくは最小限となる。
【0169】
そのため、別個のコドンを認識し、別個の非標準アミノ酸を組み込み、及び組み合わせて使用することができる複数の改変された相互直交性aaRS/tRNA対の同定は、当技術分野に貴重な貢献を提供する。本発明者らは、本明細書において新規aaRS及びtRNA対を提供し、及び同様に、本明細書において組み合わせて機能することが実証された前記対の新規組合せも提供する。
【0170】
このように、本発明の一態様では、メタノメチロフィルス種のaaRSが提供される。
【0171】
1R26PylRS(1R26PylRS)。1R26PylRSは、以下の配列:
MAEHFTDAQIQRLREYGNGTYKDMEFADVSAREKAFTKLMSDASRDNESALKGMIAHPARQGLSRLMNDIADALVADGFIEVRTPIIISKDALAKMTITPDKPLFKQVFWIDDKRALRPMLAPSLYTVMRSLRDHTDGPVKIFEMGSCFRKESHSGMHLEEFTMLNLVDMGPAGDATESLKKYIGIVMKAAGLPDYQLVHEESDVYKETIDVEINGQEVCSAAVGPHYLDAAHDVHEPWAGAGFGLERLLTIRQGYSTVMKGGASTTYLNGAKMD(配列番号9)
を有し得る。
【0172】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含む1R26PylRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:L121、L125、Y126、M129、N166、V168、Y206、A223で置換の任意の1つ又は組合せを含む、配列番号9に従い得る。前述の残基での変異を使用して、非標準アミノ酸に対して変更された選択性を有する1R26PylRSのバリアントを生成してもよい。
【0173】
シンテターゼは、1R26PylRS(CbzK)であり得る。1R26PylRS(CbzK)は、以下の変異:i)Y126G及びM129L、又はii)M129A及びY206Fを含む1R26PylRSのミュータントであり得る。1R26PylRS(CbzK)は、Nε-(カルボベンジルオキシ)-l-リシン(CbzK)の組み込みを方向付けるために適切である。1R26PylRS(CbzK)は、配列番号10又は11に従い得る。
【0174】
シンテターゼは、1R26PylRS(AllocK)であり得る。1R26PylRS(AllocK)は、変異N166Q及びY206Fを含む1R26PylRSのミュータントであり得て、6-N-Alloc-L-リシン(AllocK)の組み込みを方向付けるために適切である。1R26PylRS(AllocK)は、配列番号12に従い得る。
【0175】
シンテターゼは、1R26PylRS(Bta)であり得る。1R26PylRS(Bta)は、変異N166S、V168M、Y206F、及びA223Gを含む1R26PylRSのミュータントであり得て、及び3-ベンゾチエニル-L-アラニン(Bta)の組み込みを方向付けるために適切である。1R26PylRS(Bta)は、配列番号13に従い得る。
【0176】
シンテターゼは、1R26PylRS(NMH)であり得る。1R26PylRS(NMH)は、変異L121M、L125I、Y126F、M129A、V168Fを含む1R26PylRSのミュータントであり得て、3-N-メチル-L-ヒスチジン(NMH)の組み込みを方向付けるために適切である。1R26PylRS(NMH)は、配列番号14に従い得る。
【0177】
一実施形態では、aaRSは、配列番号9~14のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一である。aaRSは、配列番号9と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の変異の群:i)L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iv)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;及びv)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223Aのいずれか1つを含む。
【0178】
図20は、配列アライメントであって、「」は、全ての整列させたaaRS配列に見出される残基を示し、「:」は、整列させた配列間の強い類似性内の残基を示し、及び「.」は、整列させた配列間で何らかの類似性がある残基を示す、配列アライメントを提供する。aaRSは、配列番号9~14のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基のみに見出される。
【0179】
1R26PylRS、及びそのバリアント及び派生物は、tRNAメタノメチロフィルス・アルブス(Methanomethylophilus alvus)(Alv)tRNAΔNPyl(8)と対を形成し得る。
【0180】
このように、本発明の別の態様では、AlvtRNAΔNPyl(8)が提供される。AlvtRNAΔNPyl(8)は、以下の配列:
GGGGGACGGTCCGGCGACCAGCGGGTCTNNNAAACCTAGCcttgCGGGGTTCGACaCCCCGGTCTCTCGCCA(配列番号61)を有し得て、アンチコドンは、「NNN」トリプレットである。
【0181】
特定の実施形態では、AlvtRNAΔNPyl(8)は、以下の配列:
GGGGGACGGTCCGGCGACCAGCGGGTCTCTAAAACCTAGCcttgCGGGGTTCGACaCCCCGGTCTCTCGCCA(配列番号15)を有し得る。
【0182】
AlvtRNAΔNPyl(8)は、任意のアンチコドンを含むように改変され得る。AlvtRNAΔNPyl(8) CGAは、本明細書に例示されるが、本発明は、この様式に限定される必要はない。tRNAは、配列番号15又は61と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0183】
本発明の一態様では、本明細書に開示される任意の1R26PylRS、又はそのバリアント又は派生物、並びに本明細書に開示される任意のAlvtRNAΔNPyl(8)、又はそのバリアント若しくは派生物を含む宿主細胞であって、1R26PylRS及びAlvtRNAΔNPyl(8)が直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する、宿主細胞が提供される。宿主細胞は、異種タンパク質産生、特に1又は2以上の非標準アミノ酸を含むポリペプチドの産生にとって適切な任意の細胞であり得る。宿主細胞は、原核細胞又は真核細胞であり得る。宿主細胞は、細菌細胞、例えば大腸菌であり得る。宿主細胞は真核細胞、例えば哺乳動物又は昆虫細胞株であり得る。宿主細胞は、ヒト細胞であり得る。宿主細胞は、本明細書で開示される本発明の任意の細菌であり得る。
【0184】
1R26PylRS及びAlvtRNAΔNPyl(8)はまた、単離された形態で本明細書に提供される。分子は、それが天然の環境で見出されない場合(すなわち、それが天然に存在する細胞において野生型タンパク質として発現されない場合)、本明細書で使用される場合、「単離された」と考えられる。分子は、単離されてもよく、別の組成物の一部として見出されてもよい(例えば、分子を天然に発現しない宿主細胞によって発現される場合)。
【0185】
本明細書に開示される別のaaRSは、アーケオグロブス・フルギダスチロシル-tRNAシンテターゼ(AfTyrRS)である。AfTyrRSは、本発明の原核細胞において使用するために適切である。AfTyrRSは、以下の配列:
MDITEKLRLITRNAEEVVTEEELRQLIETKEKPRAYVGYEPSGEIHLGHMMTVQKLMDLQEAGFEIIVLLADIHAYLNEKGTFEEIAEVADYNKKVFIALGLDESRAKFVLGSEYQLSRDYVLDVLKMARITTLNRARRSMDEVSRRKEDPMVSQMIYPLMQALDIAHLGVDLAVGGIDQRKIHMLARENLPRLGYSSPVCLHTPILVGLDGQKMSSSKGNYISVRDPPEEVERKIRKAYCPAGVVEENPILDIAKYHILPRFGKIVVERDAKFGGDVEYASFEELAEDFKSGQLHPLDLKIAVAKYLNMLLEDARKRLGVSV(配列番号16)
を有し得る。
【0186】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むAfTyrRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:Y36、L69、H74、Q116、D165、I166、又はN190で置換の任意の1つ又は組合せを含む配列番号16に従い得る。前述の残基での変異を使用して、非標準アミノ酸に対して変更された選択性を有するAfTyrRSのバリアントを生成してもよい。
【0187】
別の実施形態では、シンテターゼは、AfTyrRS(p-I-Phe)であり得る。AfTyrRS(p-I-Phe)は、以下の変異:Y36I、L69M、H74L、Q116E、D165T、及びI166Gを含むAfTyrRSのミュータントであり得て、p-I-Pheの組み込みを方向付けるために適切である。AfTyrRS(p-I-Phe)は、配列番号17に従い得る。
【0188】
別の実施形態では、シンテターゼは、AfTyrRS(p-Az-Phe)であり得る。AfTyrRS(p-Az-Phe)は、以下の変異:Y36T、H74L、Q116E、D165T、I166G、及びN190Kを含むAfTyrRSのミュータントであり得て、p-Az-Pheの組み込みを方向付けるために適切である。AfTyrRS(p-Az-Phe)は、配列番号18に従い得る。
【0189】
別の実施形態では、シンテターゼは、AfTyrRS(o-メチル-チロシン)であり得る。AfTyrRS(o-メチル-チロシン)は、以下の変異:Y36I、H74L、Q116E、D165T、I166Gを含むAfTyrRSのミュータントであり得て、o-メチル-チロシンの組み込みを方向付けるために適切である。AfTyrRS(o-メチル-チロシン)は、配列番号19に従い得る。
【0190】
一実施形態では、aaRSは、配列番号16~19のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号16と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の群:i)Y36I、L69M、H74L、Q116E、D165T、I166G、N190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;及びiii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190Nのいずれか1つを含む。
【0191】
AfTyrRS、及びそのバリアント及び派生物は、tRNAAf-tRNATyr(A01) YYYと対を形成し得る。Af-tRNATyr(A01) YYYは、以下の配列:
CCCGCCCTAGCTCAGAGGTAGAGCGTGCTTCTNNNAAAAGCATGGTCCCCGGTTCAAATCCTGGGGGCGGGACCA(配列番号62)を有し得て、アンチコドンは、「NNN」トリプレットである。
【0192】
特定の実施形態では、Af-tRNATyr(A01)は、以下の配列:
CCCGCCCTAGCTCAGAGGTAGAGCGTGCTTCTctaAAAAGCATGGTCCCCGGTTCAAATCCTGGGGGCGGGACCA(配列番号20)を有し得る。
【0193】
Af-tRNATyr(A01) YYYは、任意のアンチコドンを含むように改変され得る。Af-tRNATyr(A01) CUAは、本明細書に例示されるが、本発明は、この様式に限定される必要はない。tRNAは、配列番号20又は62と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0194】
本明細書に開示される別のaaRSは、MmPylRSである。MmPylRSは、本発明の原核細胞に使用するために適切なaaRSである。MmPylRSは、以下の配列:
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(配列番号21)
を有し得る。
【0195】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むMmPylRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:L301、A302、L305、Y306、L309、N346、C348、Y384、V401、又はW417の置換の任意の1つ又は組合せを含む、配列番号21に従い得る。前述の残基での変異は、非標準アミノ酸に対して変更された選択性を有するMmPylRSのバリアントを生成するために使用され得る。
【0196】
シンテターゼは、MmPylRS(Bpa)であり得る。MmPylRS(Bpa)は、変異A302T、N346T、C348T、及びW417Cを含むMmPylRSのミュータントであり得て、p-ベンゾイル-L-フェニルアラニン(Bpa)の組み込みを方向付けるために適切である。MmPylRS(Bpa)は、配列番号22に従い得る。
【0197】
シンテターゼは、MmPylRS(Bta)であり得る。MmPylRS(Bta)は、変異N346S、C348M、Y384F、及びV401Gを含むMmPylRSのミュータントであり得て、3-ベンゾチエニル-L-アラニン(Bta)の組み込みを方向付けるために適切である。MmPylRS(Bta)は、配列番号23に従い得る。
【0198】
シンテターゼは、MmPylRS(CbzK)であり得る。MmPylRS(CbzK)は、変異:i)Y306G、又はii)L309A、C348V、Y384Fを含むMmPylRSのミュータントであり得て、N6-Cbz-L-リシン(CbzK)の組み込みを方向付けるために適切である。MmPylRS(CbzK)は、配列番号24又は配列番号25に従い得る。
【0199】
シンテターゼは、MmPylRS(NMH)であり得る。MmPylRS(NMH)は、変異L301M、L305I、Y306F、L309A、及びC348Fを含むMmPylRSのミュータントであり得て、3-N-メチル-L-ヒスチジン(NMH)の組み込みを方向付けるために適切である。MmPylRS(NMH)は、配列番号26に従い得る。
【0200】
他の実施形態では、MmPylRSは、BocK、AllocK、p-I-Phe、CypK、又はAlkKの組み込みを方向付けるために適切となるように適合され得る。
【0201】
一実施形態では、aaRSは、配列番号21~26のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号21と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の群:i)L301L、A302T、L305L、Y306Y、L309L、N346T、C348T、Y384Y、V401V、W417C;ii)L301L、A302A、L305L、Y306Y、L309L、N346S、C348M、Y384F、V401G、W417W;iii)L301L、A302A、L305L、Y306G、L309L、N346N、C348C、Y384Y、V401V、W417W、iv)L301L、A302A、L305L、Y306Y、L309A、N346N、C348V、Y384F、V401V、W417W;及びv)L301M、A302A、L305I、Y306F、L309A、N346N、C348F、Y384Y、V401V、W417Wのいずれか1つを含む。
【0202】
図20は、配列アライメントを提供する。aaRSは、配列番号21~26のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基のみに見出される。
【0203】
MmPylRS及び派生物は、tRNAMmtRNAPyl YYYと対を形成し得る。MmtRNAPyl YYYは、以下の配列を有し得て:
GGaAACCTGATCATGTAGATCGAATGGACTNNNAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCA(配列番号63)、アンチコドンは、「NNN」トリプレットである。
【0204】
一実施形態では、MmtRNAPylは、以下の配列:
GGaAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCA(配列番号27)を有し得る。
【0205】
MmtRNAPyl YYYは、任意のアンチコドンを含むように改変され得る。MmtRNAPyl UGAを、本明細書に例示するが、本発明は、この様式に限定される必要はない。tRNAは、配列番号27又は63と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0206】
本明細書に開示される別のaaRSは、M・ヤンナスキイチロシル-tRNAシンテターゼ(MjTyrRS)である。MjTyrRSは、本発明の原核細胞において使用するために適切なaaRSである。MjTyrRSは、J. N. Beyer et al., Overcoming Near-Cognate Suppression in a Release Factor 1-Deficient Host with an Improved Nitro-Tyrosine tRNA Synthetase. Journal of Molecular Biology(参照により本明細書に組み込まれる)に開示され得る。
【0207】
MjTyrRSは、以下の配列:
MDEFEMIKRNTSEIISEEELREVLKKDEKSAYIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSEFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNDIHYLGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL(配列番号28)
を有し得る。
【0208】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むMjTyrRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:Y32、L65、H70、F108、Q109、D158、I159、又はL162の置換のいずれか1つ又は組合せを含む、配列番号28に従い得る。前述の残基での変異を使用して、非標準アミノ酸に対して変更された選択性を有するMjTyrRSのバリアントを生成してもよい。
【0209】
別の実施形態では、シンテターゼは、MjTyrRS(3-Nitro-Tyr)であり得る。MjTyrRS(3-Nitro-Tyr)は、変異Y32H、H70T、D158H、I159A、及びL162Rを含むMjTyrRSのミュータントである。MjTyrRS(3-Nitro-Tyr)は、3-Nitro-Tyrの組み込みを方向付けるために適切である。MjTyrRS(3-Nitro-Tyr)は、配列番号29に従い得る。
【0210】
別の実施形態では、シンテターゼは、MjTyrRS(p-Az-Phe)であり得る。MjTyrRS(p-Az-Phe)は、変異Y32L、L65V、F108W、Q109M、D158G、及びI159Aを含むMjTyrRSのミュータントである。MjTyrRS(p-Az-Phe)は、p-Az-Pheの組み込みを方向付けるために適切である。MjTyrRS(p-Az-Phe)は、配列番号30に従い得る。
【0211】
一実施形態では、aaRSは、配列番号28~30のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号28と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の群:i)Y32H、L65L、H70T、F108F、Q109Q、D158H、I159A、L162R;及びii)Y32L、L65V、H70H、F108W、Q109M、D158G、I159A、L162Lのいずれか1つを含む。
【0212】
MjTyrRS及び派生物は、tRNAMjtRNATyr YYYと対を形成し得る。MjRNATyr YYYは、J. N. Beyer et al., Overcoming Near-Cognate Suppression in a Release Factor 1-Deficient Host with an Improved Nitro-Tyrosine tRNA Synthetase. Journal of Molecular Biologyに開示され得る。MjtRNATyr YYYは、以下の配列:
CCGGCGGTAGTTCAGCAGGGCAGAACGGCGGACTNNNAATCCGCATGGCAGGGGTTCAAATCCCCTCCGCCGGACCA(配列番号64)を有し得て、アンチコドンは、「NNN」トリプレットである。
【0213】
一実施形態では、MjtRNATyrは、以下の配列:
CCGGCGGTAGTTCAGCAGGGCAGAACGGCGGACTCTAAATCCGCATGGCAGGGGTTCAAATCCCCTCCGCCGGACCA(配列番号31)を有し得る。
【0214】
MjtRNATyr YYYは、任意のアンチコドンを含むように改変され得る。MjtRNATyr CGAを本明細書に例証するが、本発明は、この様式に限定される必要はない。tRNAは、配列番号31又は64と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0215】
本明細書に開示される別のaaRSは、メタノマシリコッカス・ルミンエンシス1(Lum1)PylRSである。Lum1PylRSは、本発明の原核細胞において使用するために適切なaaRSである。Lum1PylRSは、以下の配列:
MDTRLTPAQAQRIREMGGTVDPSLAFSSEAERESAFQRISADLQGANLAKIRRCAEAPERHPIGSLENTLACALAAKGFIEVKTPMMIPADGLVKMGIDESHPLWNQVFWVGPKKALRPMLAPNLYFLMRHLRRSVPAPLLLFEIGPCFRKESRGSNHLEEFTMLNLVELAPQADATERLKEHIATVMNAVGLPYELVVEGSEVYGTTIDVEVDGVELASGAVGPLPMDKPHGITEPWAGVGFGLERIALMRTKEQNIKKVGRSLVYVNGARIDI(配列番号32)
を有し得る。
【0216】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むLum1PylRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:L121、L125、Y126、M129、及びV168で置換の任意の1つ又は組合せを含む、配列番号32に従い得る。前述の残基での変異を使用して、非標準アミノ酸に対して変更された選択性を有するLum1PylRSのバリアントを生成してもよい。
【0217】
シンテターゼは、Lum1PylRS(CbzK)であり得る。Lum1PylRS(CbzK)は、変異Y126G及びM129Lを含むLum1PylRSのミュータントであり得て、CbzKの組み込みを方向付けるために適切である。Lum1PylRS(CbzK)は、配列番号33に従い得る。
【0218】
シンテターゼは、Lum1PylRS(NMH)であり得る。Lum1PylRS(NMH)は、変異L121M、L125I、Y126F、M129A、及びV168Fを含むLum1PylRSのミュータントであり得て、3-N-メチル-L-ヒスチジン(NMH)の組み込みを方向付けるために適切である。Lum1PylRS(NMH)は、配列番号34に従い得る。
【0219】
一実施形態では、aaRSは、配列番号32~34のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号32と50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の群:i)L121L、L125L、Y126G、M129L、V168V;及びii)L121M、L125I、Y126F、M129A、V168Fのいずれか1つを含む。
【0220】
図20は、配列アライメントを提供する。aaRSは、配列番号32~34のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0221】
Lum1PylRS及び派生物は、M・インテンスチナリス(M. intenstinalis)tRNAと対を形成し得る。そのようなtRNAは、以下の配列:
GGCGAACTGGTCCGGGACCACCAGGCCTNNNAAGCCACGGTTAGCCGGGTTCAACTCCCGGGTTCGTCGCCA(配列番号65)を有し得て、アンチコドンは、「NNN」トリプレットである。
【0222】
一実施形態では、M・インテンスチナリスtRNAは、以下の配列:
GGCGAACTGGTCCGGGACCACCAGGCCTctaAAGCCACGGTTAGCCGGGTTCAACTCCCGGGTTCGTCGCCA(配列番号66)を有し得る。
【0223】
M・インテンスチナリスtRNAは、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号65又は66と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0224】
本明細書に開示される別のaaRSは、NitroPylRSであり、これは、ニトロソスフェリア・アルカエオン(NCBIタンパク質受託番号はHHP52415.1である)のaaRSである。NitroPylRSは、本発明の原核細胞に使用するために適切なaaRSである。NitroPylRSは、以下の配列:
MSKIRFTRGQIHRLIELGAEPTELERDFETEAERDKEFNKIAENLARKNLKNIKDFLEQRRKPLVRVIEEKLRTTALRLGFSEVVTPIIIPRLFIKRMGIDEGDPLWKQVMLIDDKRALRPMLAPNLYVLMAKLSNIVRPVKIFEIGPCFRRETGGRYHLEEFTMFNMVELAPEGDPKERLLDYIDTIMRDIGLNYTISVEPSNVYGETLDVVVNGIEVASAAIGPKPIDANWGVREPWIGVGFGVERLAMLVGGYNSIARIAKSLSYLDGSTLSVIKLRW(配列番号35)
を有し得る。
【0225】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むNitroPylRSのバリアントである。
【0226】
シンテターゼは、NitroPylRS(NMH)であり得る。NitroPylRS(NMH)は、変異L123M、L127I、Y128F、M131A、及びV169Fを含むNitroPylRSのミュータントであり得て、NMHの組み込みを方向付けるために適切である。NitroPylRS(NMH)は、配列番号36に従い得る。
【0227】
一実施形態では、aaRSは、配列番号35又は配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の置換L123M、L127I、Y128F、M131A、及びV169Fを含む。
【0228】
図20は、配列アライメントを提供する。aaRSは、配列番号35又は配列番号36と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0229】
NitroPylRS及び派生物は、メタノハラルケウム・サーモフィルム(Methanohalarchaeum thermophilum)から派生するtRNAと対を形成し得る。そのようなtRNAは、以下の配列:GGGGGGCTGGTCGGGTGGCCAAGGGGGCTCTAAACCCTCGGTTGCCGGGTTCAACTCCCGGGCTCCCCACCA(配列番号53)を有し得る。
【0230】
配列番号53は、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号53と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0231】
本明細書に開示される別のaaRSは、ClosΔNTDPylRSであり、これはクロストリジウム目細菌(受託番号NLY82529.1)のaaRSである。ClosΔNTDPylRSは、本発明の原核細胞に使用するために適切なaaRSである。ClosΔNTDPylRSは、以下の配列:
MENFTITQTERLKQLNCENDVLELEFEDSEARNSKFREIEIGRVKKGKENIKNLLKEKHITISDEVGNKLSDWLMSKDYTKVLTPTIISKDQLKAMTIDEENHLFSQVFWIDNNKCLRPMLAPNLYIVMRELKRITNEPVKIFEIGSCFRKESQGARHMNEFTMLNMVELASVEDGKQLDTLKALAHEAMESLGVESYELVIEESAVYGSTLDIEIDGIEVASGSYGPHELDANWDIFDTWVGIGFGIERLAMAINGGSTIKKYGRSINFIDGETMKL(配列番号37)
を有し得る。
【0232】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むClosΔNTDPylRSのバリアントである。特定の実施形態では、aaRSは、以下の残基:Y126、M129、Y208で置換の任意の1つ又は組合せを含む、配列番号37に従い得る。前述の残基での変異を使用して、非標準アミノ酸に対して変更された選択性を有するClosΔNTDPylRSのバリアントを生成してもよい。
【0233】
シンテターゼは、ClosΔNTDPylRS(CbzK)であり得る。ClosΔNTDPylRS(CbzK)は、変異:i)Y126G及びM129L、又はii)M129A及びY208Fを含むClosΔNTDPylRSのミュータントであり得て、及びCbzKの組み込みを方向付けるために適切である。ClosΔNTDPylRS(CbzK)は、配列番号38又は配列番号39に従い得る。
【0234】
一実施形態では、aaRSは、配列番号37~39のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。aaRSは、配列番号37と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、以下の群:i)Y126G、M129L、及びY208Y、又はii)Y126Y、M129A、又はY208Fのいずれか1つを含む。
【0235】
図20は、配列アライメントを提供する。aaRSは、配列番号37~39のいずれか1つと少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0236】
ClosΔNTDPylRS並びにそのバリアント及び派生物は、以下の配列:
GGGGAACGGATCGGATGGATCACATAGACTCTAAATCTATGTAGCCGAGTGAAACTCTCGGGTTCCTCGCCA(ClostRNA;配列番号56)に従うtRNAと対を形成し得る。
【0237】
ClostRNAは、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号56と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0238】
本明細書に開示される別のaaRSは、メタノナトロンアルカエウム・サーモフィルム(Methanonatronarchaeum thermophilum)(TronΔNTDPylRS)から派生したaaRSである。TronΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。TronΔNTDPylRSは、以下の配列:
MEFTVTQKQRLQELGFEGVFPSDFEDVDERNRFFEELVGRLRDRNRKRFERLVGNKIPFWRKVSSDLRNRFYELGFVEVRTPEIISYSLLEKMEISDDLREQVYWLEEDNRCLRPMLAPNLYNELRHFNRISNQSKVRIFEIGTCFRREKSSSEHLNEFTMLNAVEMGDIGDTEERLDRLIEEVFGEFTDYKKVGEESSLYGKTVDVLVDGVEVASCIAGPHPLDSNWSIDQPWVGIGLGVERLAMLLDDGSTAKAYGNSYIYQDGVRLDIK(配列番号40)
を有し得る。
【0239】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むTronΔNTDPylRSのバリアントである。
【0240】
一実施形態では、aaRSは、配列番号40と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0241】
図20は、配列アライメントを提供する。aaRSは、配列番号40と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0242】
TronΔNTDPylRS並びにそのバリアント及び派生物は、以下の配列:
GGGGGGCTGGTCGGGGTGACCACGGAGGCTCTAAACCTCCCTTAGCCGGGTTCAACTCCCGGGTCCCTCGCCA(TrontRNA;配列番号52)に従うtRNAと対を形成し得る。
【0243】
TrontRNAは、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号52と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0244】
本明細書に開示される別のaaRSは、GemmΔNTDPylRSであり、これは、ゲンマティモナス門(Gemmatimonadetes)細菌(受託番号NNM03691.1)のaaRSである。GemmΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。GemmΔNTDPylRSは、以下の配列:
MGITWSKTQKDRLRALRADGARLADSFEGRPQRDQAFQDLEGALAKARRKELEDLRAGHGRPGLCRLQTTLEGTLVGAGFVQVATPTIMSRGLLAKMGVTKNHDLFEQVFWLDRDRCLRPMLAPHLYYVIKDLLRLWEKPLGIFEVGSCFRKDSQGARHSNEFTMLNLCEFGLPEEDRGGRLREMAEVVTRAAGVHEYELEESASTVYGGTLDVVSVDGLELGSGAMGPHPLDHAWRITDTWVGIGFGLERLLMTVNRETSIGKMGRSLAYLDGIPLSI(配列番号41)
を有し得る。
【0245】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むGemmΔNTDPylRSのバリアントである。
【0246】
一実施形態では、aaRSは、配列番号41と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0247】
図20は、配列アライメントを提供する。aaRSは、配列番号41と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0248】
GemmΔNTDPylRS及び派生物は、tRNAGemmtRNAと対を形成し得る。GemmtRNAは、以下の配列:
GGGGAGTGGATCGATACAAGATCGTGTGGGCTCTAAACCCACATAGCTCGGTGTGACTCCGGGGCTCCCCACCA(配列番号46)を有し得る。
【0249】
GemmtRNAは、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号46と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0250】
本明細書に開示される別のaaRSは、PGA8ΔNTDPylRSであり、これはペプトストレプトコッカス科(Peptostreptococcaceae)細菌pGA-8(受託番号SFE25427.1)のaaRSである。PGA8ΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。PGA8ΔNTDPylRSは、以下の配列:
MQYSNTQRERLVQLNIDASLLEATFEDAEARDASFRSLEKELAKKAKTHLRSLLSSDAVTGSQAVGNTLCSWLQQKGFTRVDTPTIISDKMLDKMSIDDKHHLREQVFWIDRHKCLRPMLAPNLYIVMRELKKTLNTPVKIFEMGSCFRKESQGARHMNEFTMLNFVELATVKDGEQKEYLEKMAREAMAALKIDDYELIIEESTVYGTTVDIEIDGIEVASGAYGPHELDSAWAVFDTWVGIGFGIERLAMAMNGGKTIKRFGRSTNYLDGVPISL(配列番号42)
を有し得る。
【0251】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むPGA8ΔNTDPylRSのバリアントである。
【0252】
一実施形態では、aaRSは、配列番号42と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0253】
図20は、配列アライメントを提供する。aaRSは、配列番号42と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0254】
PGA8ΔNTDPylRS並びにバリアント及び派生物は、tRNAPGA8tRNAと対を形成し得る。PGA8tRNAは、以下の配列:
GGGGAGTGGATCGTATTGATCGTATGGACTCTAAATCCATAAAGCCGAGTGAGACTCTCGGACTCCTCGCCA(配列番号54)を有し得る。
【0255】
PGA8tRNAは、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号54と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0256】
本明細書に開示される別のaaRSは、I2ΔNTDPylRSであり、これは、デスルホスポロシヌス種I2(受託番号WP_045576271.1)のaaRSである。I2ΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。I2ΔNTDPylRSは、以下の配列:
MGIIWTPIQKQRLQELNASEAQREMCFESQQARDRAFQEQEHSLVVEGKRRLMELRDIKRRPSLSVLEQQLVEALTQQGFVQVVTPTIISKTSLAKMSVSDDHPLFSQVFWLDSKRCLRPMLAPNLYTLWKDLLRLWEKPIRIFEIGTCYRKESKGSLHLNEFTMLNLTELGLPEDQRHQRLEELASLVMETVGIADYEMELTTSVVYGDTLDVVKGIELGSSAMGPHPLDDQWGIIDPWVGIGFGLERLLMIKEGSQNVQSMGRSLTYLNGVRLNI(配列番号43)
を有し得る。
【0257】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むI2ΔNTDPylRSのバリアントである。
【0258】
一実施形態では、aaRSは、配列番号43と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0259】
図20は、配列アライメントを提供する。aaRSは、配列番号43と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0260】
I2ΔNTDPylRS及び派生物は、以下のtRNA:
GGGGGGTAGATCGGATTGATCGCGTGGACTCTAAATCCGCGCTAGACGGGTGAAACTCCCGTACTCCTCGCCA(I2CUAG;配列番号47)
GGGGCGTCGATCGGATTGATCGCGTGGACTCTAAATCCGCGCGCAACGGGTGAAACTCCCGTACGCCTCGCCA(I2b8;配列番号48)
GGGGTGTTGATCGGATTGATCGCGTGGACTCTAAATCCGCGGTAGACGGGTGAAACTCCCGTACACCTCACCA(I2b32;配列番号49)
GGGGTGTAGATCGGATTGATCGCGTGGACTCTAAATCCGCGAACAACGGGTGAAACTCCCGTACACCTCGCCA(I2b72;配列番号50)
GGGGCGTTGATCGGATTGATCGCGTGGACTCTAAATCCGCGGCCGACGGGTGAAACTCCCGTACACCTCTCCA(I2H52;配列番号51)
GGGGGGTAGATCGGATTGATCGCGTGGACTCTAAATCCGCGTAGACGGGTGAAACTCCCGTACTCCTCGCCA(I2;配列番号55)
のいずれかと対を形成し得る。
【0261】
配列番号47~51及び55は、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号47~51及び55のいずれか1つと少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0262】
本明細書で開示される別のaaRSは、D121ΔNTDPylRSであり、これはデルタプロテオバクテリア(受託番号RLC04121.1)のaaRSである。D121ΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。D121ΔNTDPylRSは、以下の配列:
MIPWTQTQTQRLNELNAPDSALKKSFDGEPAREKAYQALEKSLVTTQRRRLAEFQTTHRRPELCRLENKLAEMLTQDGFAQVTTPIIMSRGLLKKMSIDSKHPLNSQIFWLQEDKCLRPMLAPHLYYLLVDLLRIWKRPVRIFEIGPCFRKESRGSKHASEFTMLNLVEMGTPENTRRERIQDVGSRVATAAGVKNYRFETVTSEIYGDTIDIVAGKDGLEIASAAMGPHPLDRPWKINESWIGIGFGLERLLMASHRSRNLARFGRSLAYLDGVRLNI(配列番号44)
を有し得る。
【0263】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むD121ΔNTDPylRSのバリアントである。
【0264】
一実施形態では、aaRSは、配列番号44と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0265】
図20は、配列アライメントを提供する。aaRSは、配列番号44と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0266】
D121ΔNTDPylRS及び派生物は、以下のtRNA:
GGGGGGTGGATCGTAATGAGATCGTGTGGACTCTAAATCCACATAGACGGGTGCAACTCCCGTACTCCCCGCCA(配列番号57)と対を形成し得る。
【0267】
配列番号57は、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号57と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0268】
本明細書で開示される別のaaRSは、D416ΔNTDPylRSであり、これはデルタプロテオバクテリア(受託番号RTZ99416.1)のaaRSである。D416ΔNTDPylRSは、本発明の原核細胞において使用するために適切なaaRSである。D416ΔNTDPylRSは、以下の配列:
MNSSWTEVQRHRLKELNGAEKDLETAFGDDLQRNRAFQKLEKQLVYQERKRLDRLLDTRFRPLRCELESLLIDALKCEGFTRVETPTIISQNDLERMSIDRSHPFNDQVYRVDSKHCLRPMLAPGLYRLMKDLARIRSGKPVRIFEIGPCFRKETSGARHAGEFTMLNLVEMRIEKGSRRFRIETLAKRIMHAAGIDTYDLVDEPSEVYNTTLDIVCGSDPLEVASCAMGPHPLDAAWGIIDTWVGLGFGLERLLMARENSPGIGKWCKSVSYLDGIRLTL(配列番号45)
を有し得る。
【0269】
一実施形態では、シンテターゼは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するために必要な変異をさらに含むD416ΔNTDPylRSのバリアントである。
【0270】
一実施形態では、aaRSは、配列番号45と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%類似又は同一であり得る。
【0271】
図20は、配列アライメントを提供する。aaRSは、配列番号45と少なくとも50%、60%、70%、80%、90%、95%、99%、又は100%同一であり得て、バリエーションは、i)「」;ii)「」若しくは「:」、又はiii)「」、「:」、若しくは「.」によって印を付けられていない残基に限って見出される。
【0272】
D416ΔNTDPylRS及び派生物は、以下のtRNA:
GGGGAGTGGATCGGATGAGATCGCATGGGCTCTAAACCCATGTAGCCGGGTGCGACTCCCGGGCTTCCCTCCA(配列番号58)と対を形成し得る。
【0273】
配列番号58は、任意のアンチコドンを含むように改変され得る。tRNAは、配列番号58と少なくとも80%、90%、95%、99%、又は100%同一であり得る。
【0274】
特定の実施形態では、本明細書に開示される任意のaaRSは、AllocK、AlkK、BocK、Bta、CbzK、CypK、3-Nitro-Tyr、NMH、p-I-Phe、及びp-Az-Phe、及びo-メチル-チロシンのいずれかの認識を可能にする、又はそれらに対する特異性を変更するように改変され得る。
【0275】
本発明の一態様では、本明細書に開示される任意のaaRS、又はそのバリアント若しくは派生物、及び本明細書に開示される任意のtRNA、又はそのバリアント若しくは派生物を含む宿主細胞であって、aaRS及びtRNAが直交性アミノアシルtRNAシンテターゼ-tRNA対を形成する宿主細胞が提供される。宿主細胞は、異種タンパク質産生、特に1又は2以上の非標準アミノ酸を含むポリペプチドの産生にとって適切な任意の細胞であり得る。宿主細胞は、原核細胞又は真核細胞であり得る。宿主細胞は、細菌細胞、例えば大腸菌であり得る。宿主細胞は、真核細胞、例えば哺乳動物又は昆虫細胞株であり得る。宿主細胞は、ヒト細胞であり得る。宿主細胞は、本明細書に開示される本発明の任意の細菌であり得る。
【0276】
aaRS及びtRNAはまた、本明細書において単離された形態で提供される。
【0277】
本発明者らは、本明細書において、以下の直交性tRNAシンテターゼ-tRNA対が、2つ又は3つの対:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)AfTyrRS/Af-tRNATyr(A01) YYYのいずれかの組合せで使用され得ることを実証するデータを提供する。
【0278】
このように、本発明の一態様では、群:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)AfTyrRS/Af-tRNATyr(A01) YYYから選択される任意の1つ、2つ、又は3つの直交性tRNAシンテターゼ-tRNA対を含む宿主細胞が提供される。aaRSは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するように改変され得る。aaRSは、本明細書に開示されるバリアントのいずれかであり得る。tRNAは、本明細書に開示されるバリアントのいずれかであり得る。
【0279】
本発明者らは、本明細書において、以下の直交性tRNAシンテターゼ-tRNA対が、2つ又は3つの対:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)MjTyrRS/MjtRNATyr YYYの任意の組合せで使用され得ることを実証するデータを提供する。
【0280】
このように、本発明の一態様では、群:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)MjTyrRS/MjtRNATyr YYYから選択される任意の1つ、2つ、又は3つの直交性tRNAシンテターゼ-tRNA対を含む宿主細胞が提供される。aaRSは、非標準アミノ酸の認識を可能にする、又は非標準アミノ酸に対する特異性を変更するように改変され得る。aaRSは、本明細書に開示される任意のバリアントであり得る。tRNAは、本明細書に開示される任意のバリアントであり得る。
【0281】
本発明の別の態様では、群:i)クラスAΔNPylRS/ΔNPyltRNA対;ii)クラスBΔNPylRS/ΔNPyltRNA対;及びiii)MmPylRS/SpePyltRNA対から選択される任意の1つ、2つ、又は3つの直交性tRNAシンテターゼ-tRNA対を含む宿主細胞が提供される。aaRS及びtRNAのクラスは、Dunkelmann et al. (Engineered triply orthogonal pyrrolysyl-tRNAsynthetase/tRNApairs enable the genetic encoding of three distinct non-canonical amino acids, 2020)に記載されている。
【0282】
直交性tRNAシンテターゼ-tRNA対を、宿主細胞において発現させてもよい。宿主細胞は、異種タンパク質産生、特に1又は2以上の非標準アミノ酸を含むポリペプチドの産生にとって適切な任意の細胞であり得る。宿主細胞は、原核細胞又は真核細胞であり得る。宿主細胞は、細菌細胞、例えば大腸菌であり得る。宿主細胞は、真核細胞、例えば哺乳動物又は昆虫細胞株であり得る。宿主細胞は、ヒト細胞であり得る。宿主細胞は、本明細書に開示される本発明の任意の細菌であり得る。
【0283】
本明細書において、配列番号8と少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるポリヌクレオチド配列を含むゲノムを含む細菌であって、センスコドンTCGを解読することが可能な第1の直交性アミノアシルtRNAシンテターゼ-tRNA対、センスコドンTCAを解読することが可能な第2の直交性アミノアシルtRNAシンテターゼ-tRNA対、及び終止コドンTAGを解読することが可能な第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含む細菌が提供される。ゲノムの配列同一性の計算は、直交性アミノアシルtRNAシンテターゼ-tRNA対(すなわち、細菌は、直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するようにさらに改変された株Syn61Δ3(ev5)の細菌であり得る)の発現にとって必要な配列を除外すべきである。一実施形態では、直交性tRNAシンテターゼ-tRNA対は、i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)AfTyrRS/Af-tRNATyr(A01) CUAであり、MmtRNAPyl YYYはMmtRNAPyl UGAであり得て、1R26PylRSは、1R26PylRS(CbzK)であり得て、AlvtRNAΔNPyl(8) YYYはAlvtRNAΔNPyl(8) CGAであり得て、及びAfTyrRSは、AfTyrRS(p-I-Phe)であり得る。別の実施形態では、直交性tRNAシンテターゼ-tRNA対は、i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びiii)MjTyrRS/MjtRNATyr CUAであり、MmtRNAPyl YYYは、MmtRNAPyl UGAであり得て、1R26PylRSは、1R26PylRS(CbzK)であり得て、AlvtRNAΔNPyl(8) YYYは、AlvtRNAΔNPyl(8) CGAであり得て、及びMjTyrRSは、MjTyrRS(3-Nitro-Tyr)又はMjTyrRS(p-Az-Phe)であり得る。
【0284】
本発明の原核細胞において発現される直交性tRNAシンテターゼの基質は、任意の非標準アミノ酸であり得る。したがって、本発明の原核細胞を使用して、第1の非標準アミノ酸、第2の非標準アミノ酸、及び任意で第3の非標準アミノ酸を含むポリマーを生成してもよい。
【0285】
本明細書で使用される場合、「非標準アミノ酸」という用語は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リシン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-トレオニン、L-バリン、L-トリプトファン、及びL-チロシンを除く任意のアミノ酸を意味する。
【0286】
非標準アミノ酸は、非天然アミノ酸であり得る。本明細書で使用される場合、「非天然アミノ酸」は、遺伝子コードにおいて天然にコードされることも見出されることもない任意のアミノ酸である。そのようなアミノ酸は、タンパク質を構成しないアミノ酸であり得る。このように、非天然アミノ酸は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リシン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-トレオニン、L-バリン、L-トリプトファン及びL-チロシン、L-ピロリシン、及びL-セレノシステインを除く任意のアミノ酸であり得る。
【0287】
本発明と共に使用するために適切な非標準アミノ酸は、特に限定されない。適切な非標準アミノ酸は、当業者に周知であり、例えばNeumann, H., 2012. FEBS letters, 586(15), pp.2057-2064;及びC. C. Liu, P. G. Schultz, Adding New Chemistries to the Genetic Code. Annual Review of Biochemistry 79, 413-444 (2010)(参照により本明細書に組み込まれる)に開示されるアミノ酸である。一部の実施形態では、非標準アミノ酸は、p-アセチルフェニルアラニン、m-アセチルフェニルアラニン、O-アリルチロシン、フェニルセレノシステイン、セレノシステイン、p-プロパルギルオキシフェニルアラニン、p-アジドフェニルアラニン、p-ボロノフェニルアラニン、O-メチルチロシン、p-アミノフェニルアラニン、p-シアノフェニルアラニン、m-シアノフェニルアラニン、p-フルオロフェニルアラニン、p-ヨードフェニルアラニン、p-ブロモフェニルアラニン、p-ニトロフェニルアラニン、L-DOPA、3-アミノチロシン、3-ヨードチロシン、p-イソプロピルフェニルアラニン、3-(2-ナフチル)アラニン、ビフェニルアラニン、ホモグルタミン、D-チロシン、p-ヒドロキシフェニル乳酸、2-アミノカプリル酸、ビピリジルアラニン、HQ-アラニン、p-ベンゾイルフェニルアラニン、o-ニトロベンジルシステイン、o-ニトロベンジルセリン、4,5-ジメトキシ-2-ニトロベンジルセリン、o-ニトロベンジルリシン、o-ニトロベンジルチロシン、2-ニトロフェニルアラニン、ダンシルアラニン、p-カルボキシメチルフェニルアラニン、3-ニトロチロシン、スルホチロシン、アセチルリシン、メチルヒスチジン、2-アミノノナン酸、2-アミノデカン酸、ピロリジン、Cbz-リシン、Boc-リシン、アリルオキシカルボニルリシン、Nε-((tert-ブトキシ)カルボニル)-L-リシン(BocK)、Nε-(カルボベンジルオキシ)-L-リシン(CbzK)、Nε-アリルオキシカルボニル-L-リシン(AllocK)、(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(p-I-Phe)、CypK、AlkK、3-Nitro-Tyr、及びp-Az-Pheの1又は2以上から選択される。第1、第2、及び第3の非標準アミノ酸は、前述の非標準アミノ酸の任意の組合せであり得る。
【0288】
特定の実施形態では、非標準アミノ酸は、BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-Nitro-Tyr、及びp-Az-Phe(図S9を参照されたい)のいずれか1つであり得る。第1、第2、及び第3の非標準アミノ酸は、BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-Nitro-Tyr、及びp-Az-Pheの任意の組合せであり得る。
【0289】
本発明の原核細胞の使用
本発明の原核細胞は、第1、第2、及び/又は第3の非標準アミノ酸を含むポリマー又はタンパク質を合成するために使用され得る。特定の実施形態では、本発明の原核細胞は、2つ又は3つの異なるタイプの非標準アミノ酸を含むポリマー又はタンパク質を合成するために使用され得る。非標準アミノ酸は、本明細書に開示される任意のアミノ酸であり得る。
【0290】
このように、本発明の一態様では、ポリマーを合成する方法であって、
i)第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を含む本発明の原核細胞を提供するステップ;及び前記原核細胞を、ポリマーをコードする核酸配列と接触させるステップであって、前記核酸配列が第1のタイプのセンスコドンを含むステップ;
ii)原核細胞を、第1の直交性アミノアシルtRNAシンテターゼの基質である第1の非標準アミノ酸の存在下でインキュベートするステップ;並びに
iii)原核細胞をインキュベートして、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第1の非標準アミノ酸のポリマーへの組み込みを可能にするステップ
を含む方法が提供される。
【0291】
特定の実施形態では、ポリマーを合成する方法であって、
i)第1及び第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を含む本発明の原核細胞を提供するステップ;及び前記原核細胞を、ポリマーをコードする核酸配列と接触させるステップであって、前記核酸配列が第1のタイプのセンスコドン及び/又は第2のタイプのセンスコドンを含むステップ;
ii)原核細胞を、第1及び第2の非標準アミノ酸の存在下でインキュベートするステップであって、第1の非標準アミノ酸が、第1の直交性アミノアシルtRNAシンテターゼの基質であり、及び第2の非標準アミノ酸が、第2の直交性アミノアシルtRNAシンテターゼの基質であるステップ;並びに
iii)原核細胞をインキュベートして、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介しての第1の非標準アミノ酸のポリマーへの組み込み、及び第2の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介しての第2の非標準アミノ酸のポリマーへの組み込みを可能にするステップ
を含む方法が提供される。
【0292】
一実施形態では、ポリマーを合成する方法であって、
i)第1、第2、及び第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含む本発明の原核細胞を提供するステップ;並びに前記原核細胞を、ポリマーをコードする核酸配列と接触させるステップであって、前記核酸配列が第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び/又は第1のタイプの終止コドンを含むステップ;
ii)原核細胞を、第1、第2、及び第3の非標準アミノ酸の存在下でインキュベートするステップであって、第1の非標準アミノ酸が第1の直交性アミノアシルtRNAシンテターゼの基質であり、第2の非標準アミノ酸が第2の直交性アミノアシルtRNAシンテターゼの基質であり、及び第3の非標準アミノ酸が第3の直交性アミノアシルtRNAシンテターゼの基質であるステップ;
iii)原核細胞をインキュベートして、第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第1の非標準アミノ酸のポリマーへの組み込み、第2の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第2の非標準アミノ酸のポリマーへの組み込み、及び/又は第3の第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を介して第3の非標準アミノ酸のポリマーへの組み込みを可能にするステップ
を含む方法が提供される。
【0293】
原核細胞を、核酸配列と接触させるステップは、核酸配列がタンパク質などのポリマーを産生するために解読され得るように、原核細胞に核酸を提供する任意の形態を取り得る。
【0294】
本発明の方法に使用するための原核細胞は、第1、及び任意で第2の直交性アミノアシルtRNAシンテターゼ-tRNA対、及び任意で第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含む、本明細書に記載される任意の細胞であり得る。例えば、一実施形態では、本発明の方法に使用するための原核細胞は、第1の内因性tRNA、第2の内因性tRNA、及び第1の内因性終結因子を発現せず;及び第1のタイプのセンスコドン及び第2のタイプのセンスコドンが、第1の内因性tRNA及び第2の内因性tRNAが不必要であるように、原核細胞のゲノム内で再コード化されており、並びに第1のタイプの終止コドンが、第1の内因性終結因子が不必要であるように原核細胞のゲノム内で再コード化されている、原核細胞である。再コード化の性質は、本明細書に開示される本発明の任意の原核細胞について記載されている通りであり得る。第1の直交性tRNAは、第1のタイプのセンスコドンを解読することが可能であり、第2の直交性tRNAは、第2のタイプのセンスコドンを解読することが可能であり、及び第3の直交性tRNAは、第1のタイプの終止コドンを解読することが可能である。原核細胞は、大腸菌であり得る。
【0295】
特定の実施形態では、本発明の方法に使用するための原核細胞は、tRNASer UGA、tRNASer CGA、又はRF-1を発現せず、センスコドンTCAの出現が、tRNASer UGAが不必要であるように再コード化されており(例えば、親株の必須遺伝子におけるTCAの出現がAGTに置き換えられている)、センスコドンTCGの出現が、tRNASer CGAが不必要であるように(例えば、親株の必須遺伝子におけるTCGの出現がAGCに置き換えられているように)再コード化されており、及び終止コドンTAGの出現が、RF-1が不必要であるように(例えば、親株の必須遺伝子におけるTAGの出現がTAAに置き換えられているように)再コード化されている大腸菌細胞である。細菌は、TCA、TCG、及びTAGコドンを解読することが可能であり、並びに第1、第2、及び第3の非標準アミノ酸を、ポリマー形成の際にそのような部位に組み込むことが可能である第1、第2、及び第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を含むように改変されている。
【0296】
特定の実施形態では、本発明の方法に使用するための原核細胞は、Syn61Δ3、Syn61Δ3(ev3)、Syn61Δ3(ev4)、又はSyn61Δ3(ev5)である。そのため、原核細胞は、配列番号5~8のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを含み得る。配列同一性パーセンテージの計算は、直交性アミノアシルtRNAシンテターゼ-tRNA対の発現を可能にするために挿入されている任意の配列を除外する。
【0297】
直交性tRNAシンテターゼ-tRNA対は、本明細書に記載される任意の対であり得る。
【0298】
特定の実施形態では、直交性tRNAシンテターゼ-tRNA対は、MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びAfTyrRS/Af-tRNATyr(A01) YYYである。MmtRNAPyl YYYは、MmtRNAPyl UGAであり得る。1R26PylRSは、1R26PylRS(CbzK)であり得る。AlvtRNAΔNPyl(8) YYYは、AlvtRNAΔNPyl(8) CGAであり得る。AfTyrRSは、AfTyrRS(p-I-Phe)であり得る。Af-tRNATyr(A01) YYYは、Af-tRNATyr(A01) CUAであり得る。
【0299】
他の実施形態では、直交性tRNAシンテターゼ-tRNA対は、MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びMjTyrRS/MjtRNATyr YYYである。MmtRNAPyl YYYは、MmtRNAPyl UGAであり得る。1R26PylRSは、1R26PylRS(CbzK)であり得る。AlvtRNAΔNPyl(8) YYYは、AlvtRNAΔNPyl(8) CGAであり得る。MjTyrRSは、MjTyrRS(3-Nitro-Tyr)又はMjTyrRS(p-Az-Phe)であり得る。MjtRNATyr YYYは、MjtRNATyr CUAであり得る。
【0300】
図S5は、センスコドン又は終止コドンに応答してncAAを含有するタンパク質を作製するためのSyn61Δ3(ev5)の使用に関するデータを表す。対照として、MDS42細胞も、終止コドンに応答してncAAを含有するタンパク質を作製するために使用した。この図から見ることができるように、アンバーコドンに応答して組み込まれたncAAを含有するレポータータンパク質の収量(野生型と比較した比率)は、対照と比較してSyn61Δ3(ev5)に関して大きく改善した。そのため、本明細書に開示される原核細胞及び前記原核細胞を使用する方法は、同じ産物を産生する場合であっても、先行技術を超える驚くべき改善である。
【0301】
タンパク質の収量に関するさらなるデータを表1(データファイルS4)に提供する。
【0302】
原核細胞、例えば大腸菌細胞は、典型的にはほとんどの真核細胞翻訳後修飾、例えばユビキチン化、グリコシル化、リン酸化を組み込むことも、典型的に他の真核細胞成熟プロセス及びタンパク質分解タンパク質成熟も行うこともできない。加えて、正確なジスルフィド結合形成及びリポ多糖類(lipolysaccharide)夾雑物は厄介であり得る(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15を参照されたい)。しかしながら、治療タンパク質、例えば抗体、酵素、及びサイトカインは、一般的に翻訳後修飾及びジスルフィド結合を有し、しばしばその正確にフォールディングされた状態を達成するためにタンパク質分解成熟を必要とする。このように、治療タンパク質の大部分は、真核細胞及び哺乳動物細胞系において産生される。しかしながら、原核細胞、例えば大腸菌における発現は一般的により安価であり、遺伝子改変をより受けやすく、ミュータントライブラリ開発に関して多用途であり、工業規模での発酵にとって適切である(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15)。
【0303】
このように、一部の実施形態では、合成されたポリマーは、治療ポリペプチドであり、任意で、哺乳動物タンパク質改変が1又は2以上の非標準アミノ酸を介して導入されている。合成されたポリマーは、非標準アミノ酸の少なくとも3つの別個のタイプを含む治療タンパク質などのタンパク質であり得る。
【0304】
本発明の原核細胞を使用して、その各々が他方とは異なり得る第1、第2、及び第3の非標準アミノ酸を含有するポリマーが生成され得ることを示す実験データを本明細書に提供する。驚くべきことに、本発明者らは、互いに直接隣接する非標準アミノ酸を含有するポリマーが産生され得ることを示す。実際に、ポリマーは、非標準アミノ酸のみを含有し得る。リボソームが同時に1つの非標準アミノ酸を認容することができることは公知であったが、同じリボソーム内の同時に2つの非標準アミノ酸が生産的ペプチド合成を可能にすることはこれまで示されていなかった。実施例に考察されるように、2つの別個のモノマー(A及びB)で構成される線状ポリマーに関して、4つの基本的な重合化ステップ(A+B->AB、B+A->BA、A+A->AA、B+B->BB)が存在し、そこから任意の配列を構成することができる(図5A)。リボソーム媒介重合化に関して、これらの4つの基本ステップは、A部位又はP部位基質として作用する各モノマーに対応し、同じモノマーの別のコピー又は別個のモノマーと結合を形成する(図5A)。実施例に提示される実験データは、本発明者らが知る限り、これらの4つの重合化ステップの各々が可能であることを示した最初のデータである。
【0305】
このように、一部の実施形態では、合成されたポリマー、ポリペプチド、又はタンパク質は、別の非標準アミノ酸に直接隣接する少なくとも1つの非標準アミノ酸を含み得る。このポリマー、ポリペプチド、又はタンパク質は、互いに直接隣接する2、3、4、5、6、7、8、9、10,15又は20以上の非標準アミノ酸の鎖を含み得る。鎖は、2つ又は3つの別個の非標準アミノ酸を含み得る。
【0306】
一部の実施形態では、ポリペプチドは、合成されたポリマーから切除可能であり得る。例えば、核酸は、対象となる産物のいずれかの側に切断又は切断可能部位をコードし得る。切除された産物は、非標準アミノ酸のみで形成され得るか、又は1つ若しくは2以上の標準アミノ酸を含み得る。切除された産物は、本明細書に記載される非標準アミノ酸の鎖であり得る。
【0307】
線状若しくは環状ポリマーを含む合成されたポリマー、又はタンパク質は、合成方法後に精製され得る。精製は、ポリマー又はタンパク質を細胞及びそれが作製される培養物から分離するために当技術分野で公知の任意の形態を取り得る。
【0308】
本発明者らは、本明細書において環状ポリマーを産生するために本発明の原核細胞の使用を実証する。環状ポリマーは、本明細書に記載されるポリマーの合成を介して生成してもよく、ポリマーは自己環化することが可能である。方法は、ポリマーからのペプチドの切除を含み得て、ペプチドは、自己環化することが可能である。前記自己環化は、切除プロセスの一部であり得るが、必ずしもその必要はない。最終産物は大環状分子であり得る。
【0309】
大環状分子は4、5、6、7、8、9、10、15又は20以上のモノマーを含み得る。大環状分子は、少なくとも第1、第2、及び第3の非標準アミノ酸を含み得る。
【0310】
本発明の原核細胞を使用して、任意の他の方法で得ることができない産物を生成することができる。そのため、本発明の一態様において、本発明の方法から得られる又は本発明の方法によって得ることができるポリマーが提供される。一実施形態では、ポリマーは、少なくとも1つの第1の非標準アミノ酸、少なくとも1つの第2の非標準アミノ酸、及び任意で少なくとも1つの第3の非標準アミノ酸を含み、第1、第2、及び第3の非標準アミノ酸は、互いに異なる。ポリマーは、別の非標準アミノ酸に直接隣接する少なくとも1つの非標準アミノ酸を含み得る。ポリマーは、互いに直接隣接する2、3、4、5、6、7、8、9、10、15、又は20以上の非標準アミノ酸の鎖を含み得る。ポリマーは、大環状分子であっても線状であってもよい。本発明の大環状分子は、4、5、6、7、8、9又は10個以上のモノマーを含み得る。
【0311】
本発明の原核細胞は、少なくとも1つの非標準アミノ酸を組み込む標的ポリマー又はタンパク質の産生にとって適切であり得て、産生速度は、野生型対照の産生速度の少なくとも5%、10%、15%、25%、35%、50%、60%、70%、80%、90%、100%、110%、又は140%である。
【0312】
本発明の原核細胞は、少なくとも1つの非標準アミノ酸を組み込む標的ポリマー又はタンパク質の産生にとって適切であり得て、収量は、少なくとも0.5、1、2、5、7.5、10、15、20、又は25mg/lであり得る。
【0313】
本発明の原核細胞を作製する方法
本発明の原核細胞を生成する方法を本明細書に提供する。前記方法の態様は、前記原核細胞を生成するための驚くほど有効なプロセスを提供し、驚くほど有益な特性を有する原核細胞をもたらす。
【0314】
このように、本発明の一態様では、原核細胞を産生する方法であって、
(i)原核細胞を、第1のタイプのセンスコドンを解読するために適切な第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように改変するステップであって、原核細胞が、第1の内因性tRNAが不必要であるように第1のタイプのセンスコドンが再コード化されているゲノムを含むステップ;
(ii)原核細胞を、第1の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下でインキュベートするステップ;及び
(iii)第1の内因性tRNAが発現しないように、第1の内因性tRNAをコードする内因性遺伝子を改変するステップ
を含む方法が提供される。
【0315】
ステップ(ii)及び(iii)は、ステップ(i)の前に実施されてもよい。
【0316】
特定の実施形態では、上記の方法のステップ(i)及び(ii)は、ステップ(iii)の前に実施される。本発明者らは、この特定の順序が驚くほど有効であること、及び原核細胞が、方法の間改善された増殖を有することを発見した。理論に拘束されるわけではないが、本発明者らは、有益な効果が、ゲノムに残存し得るアノテートされていないセンスコドンの停滞の低減から生じるという仮説を立て、したがってステップのこの特定の順序は、この停滞を軽減し、増殖を改善する。
【0317】
特定の実施形態では、原核細胞を産生する方法であって、
(i)原核細胞を、第1のタイプのセンスコドンを解読するために適切な第1の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現させるように改変するステップであって、原核細胞が、第1の内因性tRNAが不必要であるように第1のタイプのセンスコドンが再コード化されているゲノムを含むステップ;
(ii)原核細胞を、第1の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下でインキュベートするステップ;及び
(iii)第1の内因性tRNAが発現しないように第1の内因性tRNAをコードする内因性遺伝子を改変するステップ;及び
(a)原核細胞を、第2のタイプのセンスコドンを解読するために適切な第2の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現させるように改変するステップであって、原核細胞が、第2の内因性tRNAが不必要であるように第2のタイプのセンスコドンが再コード化されているゲノムを含むステップ;
(b)原核細胞を、第2の直交性アミノアシルtRNAシンテターゼの基質である非標準アミノ酸の存在下でインキュベートするステップ;及び
(c)第2の内因性tRNAが発現しないように第2の内因性tRNAをコードする内因性遺伝子を改変するステップ
を含む方法が提供される。
【0318】
第1又は第2の内因性tRNAが発現しないように、第1又は第2の内因性tRNAをコードする内因性遺伝子を改変することは、原核細胞内の内因性tRNAの機能的形態の産生を防止する任意の技術に従い得る。内因性tRNAの機能的形態は、tRNA同族コドン(複数可)を解読することを可能にする形態である。例えば、内因性遺伝子を、発現を防止するために、欠失させてもよく、又は遺伝子の一部を欠失させてもよい。調節配列を欠失させてもよく、又は発現を防止するために変更してもよい。或いは、ナンセンス、フレームシフト、又はミスセンス変異は、機能的形態のtRNAの発現を防止し得る。
【0319】
ステップ(ii)及び(iii)を、ステップ(i)の前に実施してもよく、並びにステップ(b)及び(c)を、ステップ(a)の前に実施してもよい、
【0320】
特定の実施形態では、上記の方法のステップ(i)及び(ii)は、ステップ(iii)の前に実施される。加えて又は或いは、ステップ(a)及び(b)は、ステップ(c)の前に行ってもよい。本発明者らは、この特定の順序が驚くほど有効であることを発見し、及び原核細胞は、方法の間改善された増殖を有する。理論に拘束されるわけではないが、本発明者らは、有益な効果が、ゲノムに残存し得るアノテートされていないセンスコドンの停滞の低減から生じるという仮説を立て、したがってステップのこの特定の順序は、この停滞を軽減し、増殖を改善する。
【0321】
不必要な内因性tRNAの欠失を伴う第2の直交性tRNAシンテターゼ-tRNA対を導入するステップ(ステップ(a)、(b)、及び(c))は、第1の直交性tRNAシンテターゼ-tRNA対を導入して第1の内因性tRNAを欠失させるステップ((ステップ(i)、(ii)、及び(iii))の前、同時、又は後に実施してもよい。
【0322】
一実施形態では、方法は、原核細胞を、第1のタイプの終止コドンを解読するために適切な第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現させるように改変するステップをさらに含み、第1のタイプの終止コドンは、第1の内因性終結因子が不必要であるように原核細胞のゲノム内で再コード化されている。
【0323】
このことは、本明細書において考察される第1及び第2のタイプのセンスコドンの出現が低減された再コード化されたゲノムを含む任意の原核細胞に当てはまり得る。例えば、必須遺伝子(本明細書において考察されるように)は、第1又は第2のタイプのセンスコドンの出現を含有しなくてもよい。或いは又は加えて、ゲノムは、第1又は第2のタイプのセンスコドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい。
【0324】
方法は、第1のタイプの終止コドンを解読するために適切な第3の直交性アミノアシルtRNAシンテターゼ-tRNA対を発現するように原核細胞を改変するステップをさらに含んでもよく、第1のタイプの終止コドンは、第1の内因性終結因子が不必要であるように原核細胞のゲノム内で再コード化されている。このことは、本明細書において考察される第1のタイプの終止コドンの出現が低減された再コード化されたゲノムを含む任意の原核細胞に当てはまり得る。例えば、必須遺伝子(本明細書において考察されるように)は、第1のタイプの終止コドンの出現を含有しなくてもよい。或いは又は加えて、ゲノムは、第1のタイプの終止コドンの5、4、3、2、若しくは1の出現を含んでもよく、又は出現を含まなくてもよい。
【0325】
原核細胞を産生する方法は、例えば、tRNASer UGA、tRNASer CGA、又はRF-1を発現しない大腸菌細胞に適用してもよく、センスコドンTCAの出現は、tRNASer UGAが不必要であるように再コード化されており(例えば、親株の必須遺伝子におけるTCAの出現は、AGTに置き換えられている)、センスコドンTCGの出現は、tRNASer CGAが不必要であるように再コード化されており(例えば、親株の必須遺伝子におけるTCGの出現は、AGCに置き換えられている)、及び終止コドンTAGの出現は、RF-1が不必要であるように再コード化されている(例えば、親株の必須遺伝子におけるTAGの出現は、TAAに置き換えられている)。
【0326】
特に、方法は、Syn61、Syn61(ev1)、又はSyn61(ev2)に適用され得る。そのため、方法は、GenBank受託番号CP040347.1、配列番号3、又は配列番号4のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを含む細菌に適用され得る。
【0327】
細胞に挿入された直交性tRNAシンテターゼ-tRNA対は、本明細書に記載される任意のものを含む、任意の適切な対であり得る。
【0328】
特定の実施形態では、直交性tRNAシンテターゼ-tRNA対は、MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びAfTyrRS/Af-tRNATyr(A01) CUAである。MmtRNAPyl YYYは、MmtRNAPyl UGAであり得る。1R26PylRSは、1R26PylRS(CbzK)であり得る。AlvtRNAΔNPyl(8) YYYは、AlvtRNAΔNPyl(8) CGAであり得る。AfTyrRSは、AfTyrRS(p-I-Phe)であり得る。
【0329】
他の実施形態では、直交性tRNAシンテターゼ-tRNA対はMmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;及びMjTyrRS/MjtRNATyr CUAである。MmtRNAPyl YYYは、MmtRNAPyl UGAであり得る。1R26PylRSは、1R26PylRS(CbzK)であり得る。AlvtRNAΔNPyl(8) YYYは、AlvtRNAΔNPyl(8) CGAであり得る。MjTyrRSは、MjTyrRS(3-Nitro-Tyr)又はMjTyrRS(p-Az-Phe)であり得る。
【0330】
本発明者らは、特定のステップを講じなければ、原核細胞を産生する方法が、増殖欠損をもたらし得ることを発見した。これらの増殖欠損を克服するために、本発明者らは、変異導入及び選択方法を利用する。特定の実施形態では、そのような方法ステップは、本明細書に開示される原核細胞を産生する方法ステップの前に実施される。そのような方法は、本発明の文脈に応用され得ることは驚くべきである。本発明者らは、当初、増殖欠損が、限定量のserVが原因であり得ると仮定したが、さらなる実験は、このことが正しくないことを明らかにした(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))。そのため、増殖欠損を克服できるか否かは不明であった。加えて、本発明者らは、ランダム変異導入及び選択がゲノムの再コード化の一部を元に戻し得ること、及びブランクコドンの読み飛ばしをもたらす可能性があり得ると仮定した。しかしながら、本明細書に開示される実験によって実証されるように、本発明者らは、所望の機能性を失うことなく増殖欠損を元に戻すことができた。
【0331】
このように、一実施形態では、原核細胞を産生する方法のステップの前に、方法は、本明細書に開示される再コード化されたゲノムを含む任意の原核細胞を含む細胞培養物において変異導入を誘発するステップ;細胞培養物を指数関数的な増殖条件下で維持するステップ;前記細胞培養物から培養初期と比較して増殖速度が増加した原核細胞を選択するステップを含み、原核細胞を産生する方法のステップは、選択された原核細胞に適用される。
【0332】
変異導入、変異、及び選択ステップは、本明細書に開示される平行変異導入及び動的平行選択プロセスの一部であり得る。平行変異導入及び動的平行選択プロセスは、W. H. Schmied et al., Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018)(参照により本明細書に組み入れられる)に開示されているものであり得る。
【0333】
一実施形態では、変異導入の誘発は、変異導入プラスミドの使用を含む。
【0334】
特定の実施形態では、変異導入の誘発は、変異導入プラスミド「MP6」の使用を含む。MP6は、A. H. Badran, D. R. Liu, Development of potent in vivo mutagenesis plasmids with broad mutational spectra. Nature Communications 6, 8425 (2015)(参照により本明細書に組み入れられる)に記載されている。MP6は、配列番号59に従い得る。
【0335】
一部の実施形態では、変異導入は、5、10、15、17、20、30、45、60、70、80、100、150、又は200以上の世代にわたって行われ得る。特定の実施形態では、変異導入は、およそ1~200、5~100、10~25、15~20、又は17世代にわたって行われ得る。
【0336】
一部の実施形態では、変異導入後、変異誘発(mutator)培養物を、連続的な増殖で維持してもよい。例えば、変異誘発培養物を、複数の容器(例えば、96ウェルプレートのウェル)に移してもよい。培養物のOD600を、移入後、及び増殖速度に応じてその後2~9時間毎に測定してもよい。OD600が少なくとも3つの変異誘発培養物に関して0.5の閾値に到達すると、全ての培養物を、新しい容器に希釈してもよい(例えば、1/400)。培養物が閾値に達しない場合、3つの最高OD600値を使用して次のOD600測定時点、すなわち閾値に達するまでに要する時間を推定してもよい。3つより少ない培養物が、3回の連続するOD600測定後に閾値に達する場合、培養物をさらに12時間インキュベートした後、測定された細胞密度にかかわらず希釈ステップを行う。全体として、このプロセスは、急速に増殖する培養物を指数関数的な増殖で維持するための努力において選択圧を柔軟に調節する。
【0337】
一部の実施形態では、細胞培養物は、5、10、15、20、30、40、50、52、60、70、80、100、又は200以上の世代にわたって指数関数的な増殖条件下で維持され得る。特定の実施形態では、細胞培養物は、およそ20~80、30~70、40~60、又は50世代にわたって指数関数的な増殖条件下で維持され得る。例示的な実施形態では、世代数は52である。
【0338】
変異導入、維持、及び選択の複数のラウンドを細胞培養物に適用してもよい。例えば、1、2、3、4、5、又は10以上のラウンドを適用してもよい。特定の実施形態では、2ラウンドが適用される。一実施形態では、各ラウンドは、およそ10~25(例えば17)世代にわたる変異導入の誘発、及びおよそ20~80(例えば50)世代にわたる指数関数的な増殖条件下での維持を含む。
【0339】
変異導入、変異、及び選択ステップは、Syn61、Syn61(ev1)、又はSyn61(ev2)に適用され得る。そのため、方法は、GenBank受託番号CP040347.1、配列番号3、又は配列番号4に提供される配列のいずれか1つと少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%、又は100%同一であるゲノムを含む細胞に適用され得る。
【0340】
本発明者らは、特定のステップを講じなければ、第1の内因性tRNA、第2の内因性tRNA、及び/又は第1の内因性終結因子の除去が増殖欠損をもたらし得ることをさらに発見した。これらの増殖欠損を克服するために、本発明者らは、変異導入及び選択方法を利用する。特定の実施形態では、そのような方法ステップは、本明細書に開示される原核細胞を産生する方法ステップの後に実施される。内因性遺伝子の除去前のステップに関して、ランダム変異導入及び選択は、原核細胞の所望の技術的特色の一部を元に戻し、例えばブランクコドンの読み飛ばしをもたらし得ると仮定された。しかしながら、再度、本発明者らは驚くべきことに、増殖欠損が、所望の機能性を失うことなく、改善され得ることを見出した。
【0341】
このように、一実施形態では、原核細胞を産生する方法のステップの後に、方法は、原核細胞から細胞培養物を得るステップ;細胞培養物において変異導入を誘発するステップ;細胞培養物を指数関数的な増殖条件下で維持するステップ;及び前記細胞培養物から、培養初期と比較して増殖速度が増加した原核細胞を選択するステップをさらに含む。
【0342】
変異導入、変異、及び選択ステップは、本明細書に開示される平行変異導入及び動的平行選択プロセスの一部であり得る。平行変異導入及び動的平行選択プロセスは、W. H. Schmied et al., Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018)(参照により本明細書に組み入れられる)に開示され得る。
【0343】
本発明者らは、変異導入プラスミドMP6が、内因性tRNAを欠如する細胞において機能的でないことを発見した。この問題を回避するために、本発明者らは、「再コード化されたMP6」と呼ばれる新規プラスミドを設計した。このプラスミドは、配列番号67に従い得る。
【0344】
他の実施形態では、変異導入プラスミドは、公知のプラスミドであり得て、プラスミドは、第1のタイプのセンスコドン、第2のタイプのセンスコード、及び/又は第1のタイプの終止コドンを除去するように、及び前記コドンを同義コドンに置き換えるように再コード化されている。例えば、変異導入プラスミドは、第1のタイプのセンスコドン、第2のタイプのセンスコドン、又は第1のタイプの終止コドンの5、4、3、2、若しくは1のみの出現を含有してもよく、又は出現を含有しなくてもよい。特定の実施形態では、変異導入プラスミドは、第1又は第2のタイプのセンスコドンのいかなる出現を含有することも、第1のタイプの終止コドンのいかなる出現を含有することもない。
【0345】
そのため、本明細書において再コード化された原核細胞において変異導入を誘発するために再コード化されたMP6又は再コード化された変異導入プラスミドの使用が提供される。そのような使用は、本明細書に開示される本発明の原核細胞を産生する方法の一部を形成し得る。
【0346】
一部の実施形態では、変異導入は、5、10、15、17、20、30、45、60、70、80、100、150、又は200以上の世代にわたって行われ得る。特定の実施形態では、変異導入は、少なくとも20、25、30、35、又は40世代にわたって行われる。特定の実施形態では、変異導入は、およそ1~200、5~100、10~90、又は25~75世代にわたって行われ得る。特定の例では、変異導入は、少なくとも又は約45、60、70世代にわたって行われ得る。
【0347】
一部の実施形態では、変異導入後、変異誘発培養物を、連続的な増殖で維持してもよい。このプロセスは、内因性tRNA及び終結因子の除去前に実施されるステップに関連して考察したものと同じであり得る。
【0348】
一部の実施形態では、細胞培養物は、5、10、15、20、30、40、50、52、60、70、80、100、又は200以上の世代にわたって指数関数的な増殖条件下で維持され得る。特定の実施形態では、細胞培養物は、およそ20~80、30~70、40~60、又は50世代にわたって指数関数的な増殖条件下で維持され得る。例示的な実施形態では、世代数は52である。
【0349】
変異導入、維持、及び選択の複数のラウンドを細胞培養物に適用してもよい。例えば、1、2、3、4、5、又は10以上のラウンドを適用してもよい。特定の実施形態では、3ラウンドが適用される。一実施形態では、各ラウンドは、少なくとも20世代にわたる変異導入の誘発、及びおよそ20~80(例えば、50)世代にわたる指数関数的な増殖条件下での維持を含む。特定の実施形態では、第1のラウンドは、およそ70世代を含み得る。第2のラウンドは、45世代を含み得る、及び第3のラウンドは、60世代の変異導入を含み得る。
【0350】
本発明の原核細胞を産生する方法の間の任意の段階において、方法は、表現型決定アッセイを含み得る。表現型決定アッセイは、第1のタイプのセンスコドン、第2のタイプのセンスコドン、及び第1のタイプの終止コドンが再コード化されたままであるか否かの解析を含む。アッセイは、原核細胞を、レポーター、例えばGFP(適切なレポーターは実施例で考察する)に連結された再コード化されたコドンを含むレポータープラスミドによって形質転換することを含み得る。ncAAを組み込むために再コード化されたコドンを解読することが可能な直交性aaRS/tRNA対もまた、挿入される。次に、アッセイは、ncAAに依存するレポーターシグナルが存在するか否かを決定するためにncAA基質の存在下又は非存在下で細胞をインキュベートすることを含み得る。さらなる詳細を実施例に提供する。
【0351】
上記のように、本発明者らは、驚くべきことに、変異導入及び選択方法が、再コード化に影響を及ぼすことなく再コード化されたゲノムを有する原核細胞に適用され得ることを発見した。
【0352】
このように、本発明の一態様では、ゲノムが再コード化されている原核細胞の増殖速度を改善する方法であって
再コード化されたゲノムを含む原核細胞を含む細胞培養物において変異導入を誘発するステップ
細胞培養物を指数関数的な増殖条件下で維持するステップ
前記細胞培養物から、培養初期と比較して増殖速度が増加した原核細胞を選択するステップ
を含む方法が提供される。
【0353】
原核細胞は、第1のタイプのセンスコドンが再コード化されているゲノムを含み得る。第1のタイプのセンスコドンの再コード化は、本明細書に開示される任意の再コード化されたタイプのセンスコドンを含む任意のセンスコドンであり得る。原核細胞は、第1及び第2のタイプのセンスコドンが再コード化されているゲノムを含み得る。第1及び第2のタイプのセンスコドンの再コード化は、本明細書に開示される任意の再コード化されたタイプのセンスコドンを含む任意の2つのセンスコドンであり得る。
【0354】
変異導入を誘発する、細胞を維持する、及び細胞を選択する方法は、本明細書に開示される任意の方法であり得る。
【0355】
ゲノムを再コード化する方法
以下の方法は、センス又は終止コドンを同義コドンに置き換えるために当業者がゲノムを再コード化することを可能にする。さらなる情報は、i)K. Wang et al., Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016); ii)J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019);iii)国際公開第2018/020248号パンフレット、及びiv)国際公開第2020/229592号パンフレット(その各々が参照により本明細書に組み入れられる)において入手可能である。
【0356】
一例では、好ましくは1又は2以上の組換え媒介遺伝子操作のラウンドを使用して、親ゲノムの10~1000kb、50~1000kb、100~1000kb、又は100~500kbを編集し、2又は3以上の異なる部分的に合成されたゲノムを提供する。このように、好ましい例では、組換え媒介遺伝子操作の各ラウンドは、親ゲノムにおけるDNAの10kb以上、50kb以上、100kb以上、又は約100kbを挿入又は置き換える。
【0357】
本明細書で使用される場合、「組換え媒介遺伝子操作」(同様に「組換え」としても公知である)という用語は、相同組換え系に基づく遺伝子操作のための方法(すなわち、ゲノムの編集)である。典型的に、組換えは、バクテリオファージタンパク質、RacファージのRecE/RecT、又はバクテリオファージラムダのRedαβδのいずれかによって媒介される大腸菌における相同組換えに基づく。組換え媒介遺伝子操作の任意の適切な方法を使用してもよい。組換え媒介遺伝子操作の方法は、当業者に周知である。
【0358】
「古典的組換え」(大腸菌におけるラムダred媒介組換えによって例証される)の場合、合成DNAの短い領域をゲノムに挿入してもよく、又は合成DNAの短い領域を使用して、2ステッププロセス:i)陽性選択マーカーにカップリングされ、及び各々の末端で相同性領域(HR)によってゲノムの標的領域に隣接する、合成DNAのストレッチを有する線状二本鎖DNA(dsDNA)による細胞の形質転換、及びii)相同領域によって媒介される組換え後の陽性選択マーカーによるゲノム組み込みに関する選択で、ゲノムDNAを置き換えてもよい。このアプローチを使用して、ゲノムDNAの2~3kbを挿入又は置き換えることができる。このように、古典的組換えを使用する場合、親ゲノムの100~500kbを編集するためには、多くのラウンドの組換え媒介遺伝子操作が必要であろう。
【0359】
このように、好ましい例では、1又は2以上のラウンドの組換え媒介遺伝子操作は、1又は2以上のラウンドのプログラムされた組換えを通してのゲノム操作増強のためのレプリコン切除(REXER,replicon excision for enhanced genome engineering through programmed recombination)を含む。
【0360】
REXERは、国際公開第2018/020248号パンフレットに記載されている。REXERの各ラウンドを使用して、親ゲノムにおけるDNAの約50kb~250kb、又は約100kbを挿入又は置き換えてもよい。
【0361】
このように、1又は2以上のラウンドの組換え媒介遺伝子操作は
i)エピソームレプリコン(例えば、プラスミド又は細菌人工染色体)及び標的核酸(例えば、ゲノム)を含む宿主細胞(例えば、大腸菌)を提供するステップであって、エピソームレプリコンがドナー核酸配列(すなわち、合成領域)を含み、ドナー核酸配列が以下の順:5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を含み、所望の配列が陽性選択マーカーを含み、及び標的核酸が以下の順:5’-相同組換え配列1-陰性選択マーカー-相同組換え配列2-3’を含むステップ;
ii)前記宿主細胞において核酸の組換えを支持することが可能なヘルパータンパク質(複数可)(例えば、ラムダRedタンパク質)を提供するステップ;
iii)前記宿主細胞において核酸切除を支持することが可能なヘルパータンパク質(複数可)及び/又はRNA(例えばCRISPR/Cas9タンパク質/RNA)を提供するステップ;
iv)前記ドナー核酸配列の切除を誘発するステップ;
v)切除されたドナー核酸と前記標的核酸との間の組換えを可能にするためにインキュベートするステップ;及び
vi)前記ドナー核酸を前記標的核酸に組み込んだ組換え体に関して選択するステップ
を含み得る。
【0362】
前記ドナー核酸が前記標的核酸に組み込まれた組換え体を適切に選択することは、ドナー核酸の陽性選択マーカーの獲得及び標的核酸の陰性選択マーカーの喪失に関して選択することを含む。ドナー核酸の陽性選択マーカーの獲得及び標的核酸の陰性選択マーカーの喪失に関する適切な選択は、同時に行われる。適切には、前記所望の配列は、陽性選択マーカー及び陰性選択マーカーの両方を含む。適切には、陰性選択マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、及びpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択マーカーは、Cm(クロラムフェニコール耐性)、Kan(カナマイシン耐性)、Hyg(ヒグロマイシン耐性)、ゲンタマイシン(ゲンタマイシン耐性)、及びテトラサイクリン(テトラサイクリン耐性)からなる群から選択される。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの連続的選択、又は前記陰性及び陽性マーカーの連続的選択を含む。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの同時の選択を含む。
【0363】
適切には、上記の前記方法は、標的核酸配列において少なくとも1つの二本鎖切断を誘発するステップをさらに含み、前記二本鎖切断は、前記相同組換え配列1と前期相同組換え配列2の間である。適切には、少なくとも2つの二本鎖切断が標的核酸配列に誘発され、前記二本鎖切断は、前記相同組換え配列1と前期相同組換え配列2の間である。
【0364】
適切には、前記切除されたドナー核酸は、前記相同組換え配列1で始まり、前記相同組換え配列2で終わる。
【0365】
適切には、前記エピソームレプリコンは、ドナー核酸配列とは無関係に陰性選択マーカーを含む。適切には、前記方法は、ドナー核酸配列とは無関係に前記陰性選択マーカーの喪失に関して選択することによってエピソームレプリコンの喪失に関して選択するさらなるステップを含む。適切には、前記エピソームレプリコンは、以下の順序を含む:切除切断部位1-ドナー核酸配列-切除切断部位2。適切には、前記標的核酸は、前記宿主細胞内で機能することが可能な自身の複製開始点を保有する。適切には、前記エピソームレプリコンは、プラスミド核酸である。適切には、前記エピソームレプリコンは、細菌人工染色体(BAC, bacterial artificial chromosome)である。適切には、前記標的核酸は、宿主細胞ゲノムである。
【0366】
エピソームレプリコン(例えば、BAC)を、例えばS・セレビジエ(S. cerevisiae)において、Kouprina、N.、et al., 2004. Methods Mol Biol 255, 69-89に記載されるように相同組換えによってアセンブルしてもよい。アセンブリは、各々が6~13kbの長さである7~14ストレッチの合成DNA;選択コンストラクト(陰性選択マーカー及び/又は陽性選択マーカーを含む);及びBACシャトルベクターバックボーンを結合させ得る。合成DNAのストレッチは集合的に、エピソームレプリコン中のドナー核酸配列(すなわち、合成領域)に対応し、各ストレッチは、互いに重複するDNA配列の80~200bpを含み、重複する領域は、いかなる再コード化標的も含まない。ストレッチは、適切な制限部位(例えば、BsaI、AvrII、SpeI、又はXbaI)が隣接するpSC101又はpSTベクターにおいて供給され得る。このように、アセンブリの間、合成DNAストレッチを、対応する制限酵素による消化によって切除してもよい。エピソームレプリコンのアセンブリをシーケンシングによって確認してもよい。
【0367】
適切には、2つの相同性領域は、30~100bp、又は40~50bp、又は約50bpの長さであり得る。
【0368】
CRISPR/Cas9機構を切除のために使用してもよい。一部の例では、CRISPR/Cas9機構は、Cas9、tracrRNA及び2つのスペーサーRNAを含み、スペーサーRNAは、切除のために2つの相同性領域を標的とする。好ましい実施形態では、スペーサーRNAは、線状二本鎖スペーサーである。他の実施形態では、CRISPR/Cas9機構は、Cas9及び2つのsgRNAを含み、sgRNAは、切除のために2つの相同性領域を標的とする。
【0369】
ラムダred組換え機構を、組換えのために使用してもよい。ラムダred組換え機構は、ラムダアルファ/ベータ/ガンマを含み得る。
【0370】
方法は、1又は2以上のラウンドのREXER、すなわち第1のドナー核酸配列による上記のステップを実施すること、前記ドナー核酸配列に連続するさらなるドナー配列(複数可)を選択すること、及び前記ステップを、部分的に合成されたゲノムがアセンブルされるまで前記さらなるドナー核酸配列(複数可)によって繰り返すことを含み得る。これは、Wang, K. et al., 2016. Nature 539, 59-64に記載され、国際公開第2020/229592号パンフレットの図4に図示されているゲノム段階的交換合成(GENESIS,genome stepwise interchange synthesis)として公知である。
【0371】
好ましい例では、ドナー配列(複数可)は、合成ゲノムの領域に対応する。
【0372】
このように、ドナー配列(複数可)(すなわち、合成領域)は、1つ又は2つ以上のセンスコドンの20以下の出現を含んでもよく;及び/又はドナー配列(複数可)は、1又は2以上のセンスコドンの出現を含まない、10以上、20以上、又は100以上の遺伝子を含んでもよい。
【0373】
ドナー配列(複数可)(すなわち、合成領域)は、1又は2以上のセンスコドンの各々の50以下、20以下、10以下、5以下の出現を有するか、又は出現を有さず;及び/又は親ゲノムにおける対応する領域と比較して1又は2以上のセンスコドンの各々の10%未満、5%未満、2%未満、1%未満、0.5%未満、0.1%未満の出現を含む;及び/又は1又は2以上のセンスコドンの出現を含まない、10以上、20以上、又は100以上の遺伝子を含むことを除き、親ゲノムの配列(すなわち、非合成領域)と同一であり得る。
【0374】
ドナー配列(複数可)(すなわち、合成領域)をまた、親ゲノム配列(すなわち、非合成領域)と比較してリファクタリングを行ってもよい。3’,3’重複(すなわち、反対方向での遺伝子対)の場合、合成インサートを遺伝子の間に挿入してもよい。3’,3’重複の場合、合成インサートは、重複領域を含み得る。5’,3’重複の場合(すなわち、同じ方向の遺伝子対)、合成インサートは、遺伝子の間に挿入され得る。5’,3’重複の場合、合成インサートは:(i)終止コドン;(ii)重複領域の上流から約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複領域を含み得る。好ましくは、合成インサートは、(i)終止コドン;(ii)重複領域の上流から約20bp;及び(iii)重複領域を含む。好ましい実施形態では、終止コドンは、下流の遺伝子の当初の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
【0375】
好ましくは、ドナー配列(複数可)(すなわち、合成領域)は、集合的に50~10000kb、100~5000kb、100~2000kb、100~1000kb、又は100~500kbのサイズである。好ましくは、各ドナー配列は、50~300kb、100~200kb、又は約100kbのサイズである。
【0376】
したがって、ドナー配列は、各々約100kbのサイズであり得て、1又は2以上のセンスコドンの出現を含まないこと、及び親ゲノムにおける1又は2以上のセンスコドンを含む重複領域を共有する全ての遺伝子対がリファクタリングされること、遺伝子対が、センスコドンの置き換えが遺伝子の対の両方又は片方のコードされるタンパク質配列を変化させる対であることを除き、親ゲノムの対応する配列と同一である。
【0377】
好ましい例では、ゲノムの生存率は、組換え媒介遺伝子操作の各ラウンド後に試験される。一部の例では、ゲノムの配列は、組換え媒介遺伝子操作の各ラウンド後に確認される。
【0378】
一部の実施形態では、ゲノムは、低減された合成ゲノム又は最小の合成ゲノムである。「低減されたゲノム」は、親ゲノムのサイズが、非必須遺伝子及び/又は非コード領域を除去することによって低減されているゲノムである。「最小ゲノム」は、その最小サイズまで低減されているが、なおも、例えばゲノムの全ての非必須領域を欠失させることによって生存したままであるゲノムである。
【0379】
リファクタリング
ゲノムは、複数の重複するオープンリーディングフレーム(ORF)を含有し、これは、3’、3’(反対方向のORFの間)又は5’、3’(同じ方向のORFの間)として分類することができる。置き換えられるセンスコドンは、親ゲノムにおける両方のクラスの重複内で見出され得る。
【0380】
重複内の各ORFのセンスコドンの置き換えは、いずれかのORF(すなわち、同義コドン(複数可)を導入することによって)のコードされるタンパク質配列を変化させることなく達成することができ、次にこれは、必ずしも親ゲノムを編集(例えば、リファクタリング)する必要はない。しかしながら、コードされるタンパク質配列が、センスコドンの置き換えによって変化する(すなわち、1又は2以上の同義センスコドンが、ORFの1つ又は両方に導入されない)場合、親ゲノムを編集(例えば、リファクタリング)する必要があり得る。
【0381】
このように、一部の例では、親ゲノムにおけるセンスコドンを含む重複領域を共有する1又は2以上の遺伝子対がリファクタリングされる。「リファクタリングされた」とは、遺伝子が、コードされるタンパク質配列に対する変化を防止するために再構築されることを意味する。好ましくは、遺伝子対は、センスコドンの置き換え(例えば、定義された同義コドン置き換え)が、遺伝子対の両方又は片方のコードされたタンパク質配列を変化させる遺伝子対である。最も好ましくは、親ゲノムにおけるセンスコドンを含む重複領域を共有する全ての遺伝子対はリファクタリングされ、遺伝子対は、センスコドンの置き換え(例えば、定義された同義コドンの置き換え)が、遺伝子対の両方又は片方のコードされたタンパク質配列を変化させる遺伝子対である。
【0382】
3’,3’重複(すなわち、反対方向の遺伝子対)の場合、合成インサートを、遺伝子の間に挿入してもよい。3’,3’重複の場合、合成インサートは、重複領域を含み得る。
【0383】
5’,3’重複(すなわち、上流の遺伝子及び下流の遺伝子を含む同じ方向の遺伝子対)の場合、合成インサートを、遺伝子の間に挿入してもよい。5’,3’重複の場合、合成インサートは、(i)終止コドン;(ii)重複領域の上流から約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複領域を含み得る。好ましくは、合成インサートは、(i)終止コドン;(ii)重複領域の上流から約20bp;及び(iii)重複領域を含む。これは、下流のORFに関してRBSの配列及びこのRBSとその開始コドンの間の距離を保存する。
【0384】
好ましい実施形態では、終止コドンは、下流の遺伝子の元の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
【0385】
全般
全ての例において、「原核細胞」と記載される場合、本発明はまた、複数の原核細胞を含有する細胞培養物にも拡大される。同様に、「細菌」と記載される場合、本発明はまた、複数の細菌を含有する細菌培養物にも拡大される。
【0386】
配列比較は、容易に入手可能な配列比較プログラムの助けを借りて行うことができる。これらの公開された及び市販のコンピュータープログラムは、2つ又は3つ以上の配列間の配列同一性を計算することができる。
【0387】
当業者は、2つの核酸配列間のパーセンテージ同一性を計算する方法を認識している。2つの核酸配列間のパーセンテージ同一性を計算するためには、2つの配列のアライメントを最初に準備しなければならず、その後に配列同一性の値を計算する。2つの配列のパーセンテージ同一性は、(i)配列を整列させるために使用される方法、例えば、Needleman-Wunschのアルゴリズム(例えば、Needle(EMBOSS)又はStretcher(EMBOSS)によって適用される)、Smith-Watermanのアルゴリズム(例えば、Water(EMBOSS)によって適用される)、又はLALIGNアプリケーション(例えば、Matcher(EMBOSS)によって適用される);及び(ii)アライメント方法、例えばローカル対グローバルアライメント、使用される行列によって使用されるパラメーター、及びギャップに適用されるパラメーターに応じて異なる値を取り得る。
【0388】
アライメントを作製した後、2つの配列間のパーセンテージ同一性を計算する多くの異なる方法が存在する。例えば、同一性の数を:(i)最も短い配列の長さ;(ii)アライメントの長さ;(iii)配列の長さの平均値;(iv)非ギャップ位置の数;又は(v)オーバーハングを除外する等価の位置の数によって除算してもよい。さらに、パーセンテージ同一性はまた、強い長さ依存性であることも認識される。したがって、配列対がより短ければ、偶然に起こると予想され得る配列同一性はより高くなる。
【0389】
次に、2つの核酸配列間のパーセンテージ同一性の計算を、(N/T)100のようなアライメントから計算してもよく、式中Nは、配列が同一残基を共有する位置の数であり、Tは、ギャップを含むがオーバーハングを除くものと比較した位置の総数である。
【0390】
配列アライメントは、ペアワイズ配列アライメントであり得る。適切なサービスは、Needle(EMBOSS)、Stretcher(EMBOSS)、Water(EMBOSS)、Matcher(EMBOSS)、LALIGN、又はGeneWiseを含む。一例として、2つの核酸配列間の同一性は、デフォルトパラメーター、例えば行列(BLOSUM62)、ギャップオープン(10)、ギャップ伸長(0.5)、エンドギャップペナルティ(偽)、エンドギャップオープン(10)、及びエンドギャップ伸長(0.5)に設定したサービスNeedle(EMBOSS)を使用して計算してもよい。別の例では、2つの核酸配列の間の同一性は、デフォルトパラメーター、例えば行列(BLOSUM62)、ギャップオープン(1)、ギャップ伸長(1)に設定したサービスMatcher(EMBOSS)を使用して計算され得る。
【0391】
本明細書に記載される(任意の添付の特許請求の範囲、要約書、及び図面を含む)全ての特色、及び/又はそのように開示された任意の方法又はプロセスのステップの全てを、そのような特色の少なくとも一部及び/又はステップが相互に排他的である組合せを除く任意の組合せで上記の態様のいずれかと組み合わせてもよい。
【0392】
本発明をよりよく理解するために、及び同じ実施形態がどのように行われ得るかを示すために、本発明を制限することを意図しない以下の実施例を参照する。
【実施例
【0393】
細胞tRNAを除去して、その同族のコドンを読み取り不能にすることは、ウイルス感染症に対する遺伝的ファイアウォールを作製し、センスコドンの再定義を可能にするとする仮説が広がっている。しかしながら、これらの仮説を試験することは、そのような細菌が作製されていなかったことから不可能であった。本明細書において、大腸菌における同義コドン圧縮及び実験的進化後、本発明者らは、通常、2つのセンスコドン及び終止コドンを解読するtRNA及び終結因子-1を欠失させ;得られた細胞は、標準的な遺伝子コードを読み取ることができず、ウイルスのカクテルに対して完全に耐性である。本発明者らは、これらのコドンを再定義して、3つの別個の非標準アミノ酸を含有するタンパク質の効率的な合成を可能にする。重要なことに、本発明者らは、多様な非標準ヘテロポリマー及び大環状分子のコード化された翻訳のための細胞の容易なリプログラミングを実証する。
【実施例1】
【0394】
Syn61Δ3の作製
本発明者らは、細菌細胞のゲノムにおけるアノテートされたTCA、TCG及びTAGコドンを置き換えることが、単一の株におけるこれらのコドンを解読するserT及びserU(tRNASer UGA及びtRNASer CGAをコードする)及びprfA(RF-1をコードする)の欠失を可能にすると予測した(図1A)。本発明者らは、serT、serU及びprfAを、Syn61から派生した個別の株において欠失させることができることを以前に示した(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019));しかしながら、これは、これらの遺伝子間の潜在的なエピスタシスをとらえたものではない。そのため、本明細書に開示される実験では、serT、serU及びprfAを、Syn61から派生した単一の株で欠失させることができるか否かを調べた。
【0395】
Syn61は、それが派生した株より1.6倍遅く増殖する(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))。serT、serU及びprfA欠失前の株の増殖速度を増加させるために、以前に記載されたランダム平行変異導入及び自動動的平行選択ストラテジーを適用した(W. H. Schmied et al., Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018));このアプローチは、フィードバック制御を使用して、増殖速度に基づいて変異した培養物を劇的に希釈し、それによって変異した集団内から速く増殖する株を選択する(図S1A)。変異導入及び選択の2連続ラウンドを通して、株Syn61(ev2)を作製し、これは1.3倍速く増殖した(図1B図S1B、C、D、及びE、及びデータファイルS1及びS2)。
【0396】
次に、serU、serT及びprfAを、Syn61(ev2)から切除して、Syn61Δ3を作製した(図1A図S1C、及びデータファイルS1及びS2)。これは、Syn61における標的コドンを除去することが、同じ株における標的コドンの全ての解読体の欠失を可能にするために十分であることを実証した。しかしながら、Syn61Δ3は、Syn61(ev2)より1.7倍遅く増殖した(図1B)。この増殖の減少は、アノテートされていない及び標的化されなかったSyn61のゲノムにおける標的コドンの存在に起因し得て(M. R. Hemm et al., Small Stress Response Proteins in Escherichia coli: Proteins Missed by Classical Proteomic Studies. Journal of Bacteriology 192, 46 (2010)、S. Meydan et al., Retapamulin-Assisted Ribosome Profiling Reveals the Alternative Bacterial Proteome. Mol Cell 74, 481-493 e486 (2019))、及びtRNAが果たし得る他の非標準的役割に起因し得る(A. Katz, S. Elgamal, A. Rajkovic, M. Ibba, Non-canonical roles of tRNAs and tRNA mimics in bacterial cell biology. Mol Microbiol 101, 545-558 (2016)、Z. Su, B. Wilson, P. Kumar, A. Dutta, Noncanonical Roles of tRNAs: tRNA Fragments and Beyond. Annu Rev Genet 54, 47-69 (2020))。
【0397】
Syn61Δ3をSyn61Δ3(ev5)に進化させるために、ランダム平行変異導入及び自動動的平行選択の3連続ラウンドを実施したところ、Syn61Δ3(ev5)はSyn61Δ3より1.6倍速く増殖した(図1A及びB、図S1B、C、F、G、及びH、及びデータファイルS1)。振とうフラスコ中のLB培地中で増殖させると、Syn61Δ3(ev5)の倍加時間は、38.72+/-1.02分であった(図S1I)。Syn61Δ3(ev5)は、482個の追加の変異、つまり420個の置換及び62個のインデルを含み、そのうち72個はSyn61に関して遺伝子間領域にある(データファイルS1及びS3、図S2)。標的コドンは、元に戻らず、本発明者らの再コード化スキームの安定性をさらに実証した。非必須遺伝子における16のセンスコドンを、標的コドン(5×TCG、3×TCA、8×TAG)に変換した;これらの頻度は、他のコドンに関して観察された頻度と同等である(データファイルS1)。その後の実験は、Syn61Δ3又は(入手可能であれば)その進化した派生物を使用してこれらの株の新規特性を調べた。
【0398】
材料及び方法-実施例1
遺伝子の再コード化
この研究で使用した遺伝子及びプラスミドに関して、遺伝子コードを圧縮する必要があった。タンパク質CDSの遺伝子コードを、カスタムPythonスクリプト(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))を使用して、Syn61(TCGからAGC、TCAからAGT、TAGからTAA)の設計において実行された再コード化規則を使用して圧縮した。配列の詳細に関してはデータファイルS2を参照されたい。
【0399】
再コード化されたヘルパー及びMP6プラスミドの構築
この節からの全てのクローニング手順を、いずれもストレプトマイシンに対する耐性のためにrpsLK43R変異を含有する大腸菌DH10b又はMDS42において実施した。全てのラムダred媒介組換え実験のために本試験を通して使用したヘルパープラスミドは、参考文献(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))に記載された再コード化型の「ヘルパー」プラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAであり、これは、本明細書において「再コード化されたヘルパー」と呼ばれる;配列の詳細に関してはデータファイルS2を参照されたい。
【0400】
再コード化されたヘルパープラスミドを構築するために、配列を最初に、20~25bpのオーバーラップを有する以下の5つの区分に分割した:i)araC、pBADプロモーター及びラムダredガンマをコードする区分1、ii)ラムダredベータ及びアルファの後に一意的BsaI部位をコードする区分2、iii)BsaI部位に隣接するCas9をコードする区分3、iv)apraR選択マーカーをコードする区分4、及びv)pCDF起源、tracrRNAカセット、及びアンピシリンプロモーターをコードする区分5。
【0401】
区分1~3は、Genewiz社が合成し、区分4は、gBlock(IDT)として合成され、及び区分5は、当初のヘルパープラスミドからPCRによって増幅した(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))。
【0402】
再コード化されたヘルパープラスミドをアセンブルするために、最初に区分4及び5を、オーバーラップ伸長PCRによって組み合わせた。次に産物を、HiFi Assembly(NEB)によって、区分1及び2と共に中間プラスミドにアセンブルした。中間プラスミドを大腸菌MDS42に形質転換し、その配列を、次世代シーケンシング(NGS)によって確認した。最後に、中間プラスミドをBsaIによって消化し、HiFi Assemblyによって区分3と共にアセンブルして、再コード化されたヘルパープラスミドを生成した。プラスミド配列を、NGSによって確認した。
【0403】
本発明者らは、Syn61株進化のために再コード化型のMP6変異導入プラスミドを設計した(A. H. Badran, D. R. Liu, Development of potent in vivo mutagenesis plasmids with broad mutational spectra. Nature Communications 6, 8425 (2015))。再コード化された配列を、クローニングの間、変異導入構成要素の発現を最小限にするために以下の4つの重複する区分に分割した:i)araC及びpBADプロモーターをコードする区分1、ii)dnaQ926の大部分の後にAvrII部位、PmCDA1、及びクロラムフェニコール耐性のためのcatをコードする区分2、iii)dnaQ926のN末端の後にdam、seqA、emrR、及びugiをコードする区分3、及びiv)pCDF起源を含有する区分4。区分1~3を、Genewiz及びTwist Bioscienceが合成し、区分4は、元のMP6プラスミドからPCRによって増幅した(A. H. Badran, D. R. Liu, Development of potent in vivo mutagenesis plasmids with broad mutational spectra. Nature Communications 6, 8425 (2015))。区分4を、HiFi Assembly(NEB)によって区分1及び2と組み合わせ、中間プラスミドを生成し、及び区分間の重複を、Sangerシーケンシングによって確認した。最後に、中間プラスミドを、AvrIIによって消化し、HiFi Assemblyによって区分3と共にアセンブルして再コード化されたMP6を生成した。プラスミド配列をNGSによって確認した(配列の詳細に関してはデータファイルS2を参照されたい)。
【0404】
自動平行進化及び株の単離
2ラウンドの平行変異導入及び自動動的平行選択を、Syn61に適用し、次にSyn61Δ3に3ラウンドを適用した。変異導入に関して、Syn61を、変異導入プラスミドMP6(A. H. Badran, D. R. Liu, Development of potent in vivo mutagenesis plasmids with broad mutational spectra. Nature Communications 6, 8425 (2015))(又はSyn61Δ3及び派生進化物に関しては再コード化されたMP6)によって形質転換し、細胞を2%グルコース及び20μg/mLクロラムフェニコールを含有したLBアガー上で増殖させた。96個の個々のコロニーを採取して2%グルコース及び20μg/mLクロラムフェニコールを補充したLB培地200μLを含有するウェルに入れ、コロニーを37℃、220rpmで一晩増殖させた。密度の高い終夜培養物を、20μg/mLクロラムフェニコールを補充した新鮮なLB培地に1/400倍希釈し、OD600が約0.1となるまで増殖させた。変異導入を、Lアラビノースを0.5%の最終濃度まで添加することによって誘発し、各ウェルにおいて独立した変異誘発培養物を作製した。変異誘発培養物を、37℃、220rpmで24時間増殖させた。新しい誘発培地(20μg/mlクロラムフェニコール及び0.5%L-アラビノースを有するLB)への1/400倍希釈ステップ後、培養物を、37℃、220rpmでさらに24時間増殖させた。これは、誘発された変異導入によるおよそ17世代の増殖相に等しい(2xlog(400))。後の進化ラウンドでは、変異導入の誘発を70世代まで延長した。変異導入を、Syn61進化のラウンド1及び2に関しておよそ17世代の間誘発した。Syn61Δ3進化の間、変異導入を、ラウンド1で約70世代、ラウンド2で約45世代、及びラウンド3で約60世代の間誘発した。
【0405】
変異導入後、変異誘発培養物を、変異導入を抑制するために2%グルコースを補充したLB培地200μlを有する新しい96ウェルプレートに1/2倍希釈した。プレートを、ロボティクスプラットフォーム(Thermofisher社製のCytomat 2CインキュベーターシェーカーにアクセスするBeckman Coulter社製のBiomek FXp、及びMolecular Devices社製のSpectraMax I3プレートリーダー)に移して連続的に増殖させ(37℃、400rpm)、最も速く増殖するクローンに関して自動動的平行選択を行った(スクリプトはhttps://github.com/JWChin-Labで入手可能)。OD600を、各ウェルにおいて開始時に測定し、その後、増殖速度に応じて2~9時間毎に定期的に測定した。OD600が少なくとも3つの変異誘発ウェルに関して0.5の閾値に達すると、全ての培養物を、2%グルコースを補充したLB 200μLを有する新しいプレートに1/400倍希釈した。いずれのウェルも閾値に達しなかった場合、プレート間で3つの最高のOD600値を使用して、次のOD600測定時点、すなわち、閾値に達するまでに要する時間を推定した。連続する3回のOD600測定後に閾値に達したウェルが3個未満であった場合、プレートをさらに12時間インキュベートして測定された細胞密度にかかわらず、希釈ステップを実行した。全体として、このプロセスは、最も速く増殖するウェルを指数関数的な増殖に維持するための努力における選択圧を柔軟に調整する。6回の希釈ステップ(推定で52世代の増殖に等しい)後、ワークフローを終了し、以下に記載される最終プレートにおける全ての進化した変異誘発ウェルの増殖速度を決定した。最も低い倍加時間を有する進化集団のウェルを、2%グルコース及び200μg/mlストレプトマイシンを有するLBアガープレートで画線培養し、37℃で終夜インキュベートして、単コロニーを得た。4~12個の個々の進化したコロニーを、各画線培養集団から採取し、進化前の祖先株と直接比較して個々のクローンに関して増殖速度を測定した。最も早く増殖するクローンを、次世代シーケンシング及び以下のようにさらなる解析のために調製した。
【0406】
1ラウンドのSyn61進化後、96ウェルプレートの10個の独立したウェルからの細胞を、画線培養して、単コロニーを得た。80個のクローンをこれらの画線培養から採取し、その倍加時間をスクリーニングした。最初に単離されたスクリーニングしたクローン80個中20個は、単一の反復実験で低減された倍加時間を示した。しかし、これらのクローン中4個のみが、反復実験で行われたその後の測定で改善された増殖を示した。これらの4つのクローンのうち2つ(C02.5及びC02.6)は、単一のウェルから派生し、他の2つのクローンは、いずれも別個の単一のウェルから派生する(C04.4及びC04.7)。4つ全てのクローンをシーケンシングした(全ての蓄積された変異の完全なリストに関してはデータファイルS1を参照されたい)。これらのクローンのうち1つ(C04.4)を先に進めてSyn61(ev1)と再度命名した。
【0407】
Syn61(ev1)の進化後、96ウェルプレートの12個の独立したウェルからの細胞を画線培養して、単コロニーを得た。88個のクローンをこれらの画線培養から採取して、その倍加時間をスクリーニングした。最初に単離されたスクリーニングされたクローン88個中18個が、1回の反復実験で低減された倍加時間を示した。しかし、これらのクローンのうち3個のみが、反復実験で実施したその後の測定で改善された増殖を示した。これらのクローンのうち2個(A11.2及びA11.3)は、単一のウェルから派生し、第3のクローン(E10.4)は、別個のウェルに由来した。3つのクローンを全てシーケンシングした(全ての蓄積された変異の完全なリストに関してはデータファイルS1を参照されたい)。これらのクローン中1個(A11.2)を先に進めてSyn61(ev2)と再度命名した。Syn61(ev2)を使用してSyn61Δ3を生成した。
【0408】
Syn61Δ3を、2つの96ウェルプレートで進化させた。42個の独立したウェルからの細胞を画線培養し、全体で184個のクローンをこれらの画線培養細胞から採取し、その倍加時間をスクリーニングした(クローンの88個は、プレート1の22個のウェルに由来し、96個のクローンは、プレート2の20個のウェルに由来した)。クローン184個中130個は、当初Syn61Δ3と比較して顕著に低減された倍加時間を示した。最も速く増殖するクローン22個を(ほとんどの)反復増殖実験において特徴付けた。これらのクローンは、11個の独立したウェルから派生した(プレート2:F11.2、F11.3、F11.5、F11.6、F11.7、F11.8、F11.9、F11.10(全て、ウェルF11から)、E10.1、E5.1、F5.2、F8.1、F8.2、G5.2、A11.1;プレート1:A7.4、D8.2、D8.4、A9.1、G8.1、D1.2、D11.1)。以下のクローンをシーケンシングして、さらなるシーケンシング解析のために選択した(全ての蓄積された変異の完全なリストに関してはデータファイルS1を参照されたい):A7.4、F11.9、E5.1、D8.2。これらのクローンの1つ(F11.9)を先に進めて、Syn61Δ3(ev3)と再度命名した。
【0409】
Syn61Δ3(ev3)の96個の独立したウェルを進化させた。最も低い全体的倍加時間(overall doubling time)を有する19個のウェルを画線培養し、1つのウェルが画線培養において生存しなかったために18個のウェルから90個のクローンを単離した。37個のクローンは、単一の反復測定では低減された倍加時間を示した。最も速く増殖する22個のクローンを、反復測定のために選択し、5つの別個のウェルからの8個のクローンを、先祖と比較して改善された増殖を有すると特定した:E7.4、E7.2(ウェルE7から);E10.3、E10.4(ウェルE10から);D5.3、D5.1(ウェルD5から);D8.1、B9.1。4つのクローンをシーケンシングし、さらなるシーケンシング解析のために選択した:E7.4、E7.2、E10.4、D5.3及びD8.1(データファイルS1)。最も改善された増殖を有する1つのクローン(E7.4)を、次の進化ラウンドのために選択し、これをSyn61Δ3(ev4)と再度命名した。
【0410】
Syn61Δ3(ev4)を、1つの96ウェルプレート(プレート1)において進化させ、実験が初回のプログラム(次の希釈までの増殖の最大時間12時間)により改善された倍加時間を有するいかなるウェルも生じなかった後、選択プログラムを適合させた(次の希釈までの増殖の最大時間を12時間ではなくて6.5時間に設定した)。同様に、プレート1において中間の変異導入を行うことなく、連続の選択ラウンドも実施し、得られた進化したプールセットをプレート2と呼ぶ。全体として、適合させた動的選択後に生存したウェルは少なかった。13個のウェルを、プレート1から画線培養し、7個のウェルをプレート2から画線培養し、全体で152個のクローンを、単一の反復測定でスクリーニングした(プレート1から96個及びプレート2から56個)。43個のクローンが最初に改善された増殖を示したが、非進化前駆体と比較して反復測定で再現性よく速い増殖を示したのは5個のクローンに過ぎず、全て別個のウェルからであった:プレート1:B12.3、D5.3、G12.6、E7.3;プレート2:E8.4。1つのクローンを、この試験で使用した最も進化したSyn61派生物として選択し(B12.3)、これをSyn61Δ3(ev5)と再度命名した。
【0411】
ラムダred組換えによりSyn61Δ3を生成するためのprfA、serU及びserTの欠失
Syn61(ev2)におけるserU、serT及びprfAのスカーレス欠失を実施し、各欠失を連続する2つのラムダred媒介組換えを通して進行させた。第1の組換えでは、2倍選択マーカーカセットをレシピエント細胞に提供し標的遺伝子を置き換えた。第2の組換えでは修復鋳型を提供し、2倍選択マーカーを除去して、これを、標的遺伝子に対応する配列のみが欠失している標的座の天然の環境と置き換えた。
【0412】
再コード化型のrpsL-kan選択マーカーカセット(J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019))を、全ての欠失のために使用した。再コード化されたrpsL-kanを、serU、serT及びprfAの隣接するゲノム配列に対して約50bpの相同性を含有するオリゴによって増幅した。serU、serT及びprfAの修復鋳型を、オーバーラップ伸長PCRを通して構築した;標的遺伝子の直ちに上流及び下流の500~600bpの領域を、約40bp重複するように設計されたオリゴによってSyn61ゲノムDNA鋳型から増幅した。次に、これらの2つの断片を、オーバーラップ伸長PCRによって1つのPCR産物に組み合わせ、これを修復鋳型として使用した。全てのオリゴヌクレオチド配列をデータファイルS2に提供する。
【0413】
第1の組換えに関して、Syn61(ev2)細胞を、再コード化されたヘルパープラスミドによって形質転換した。単コロニーを、50μg/mlアプラマイシンを有する2xYT培地に接種し、37℃、220rpmで振とうさせながら終夜増殖させた。終夜培養物を、50μg/mlアプラマイシンを有する2xYT培地500mLにOD600=0.05となるように希釈し、細胞を、37℃で振とうさせながらOD600=約0.2となるまで増殖させた。ラムダred発現を誘発するために、L-アラビノース粉末を培養物に最終濃度0.5重量/体積%となるように添加し、37℃で振とうさせながらさらに1時間インキュベートした。細胞を、OD600=約0.6で回収し、細胞を、以前に記載されたように(K. Wang et al., Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016))エレクトロコンピテントにした。エレクトロコンピテント細胞100μLを、serU座と相同性を有するrpsL-kan PCR産物約4μgによって電気穿孔し、SOB 4mL中で1時間回復させた後、50μg/mlアプラマイシンを補充した2xYT 100mLに移した。4時間後、細胞を遠心沈降させ、HO 500μL中に再懸濁させ、2%グルコース、50μg/mlアプラマイシン及び50μg/mlカナマイシンを補充した2xYTアガープレートにおいて連続希釈して播種した。プレートを37℃で終夜インキュベートし、その後個々のコロニーを採取した。これらのコロニーを、2%グルコース、50μg/mlアプラマイシン及び50μg/mlカナマイシンを補充した2xYTアガープレート上に再度画線培養した。37℃で終夜インキュベーション後、対象となる欠失を、所望の座に隣接するプライマーによるコロニーPCRによって確認した。このプロセスを、得られた株Syn61(ev2)ΔserU∴rpsL-kanにおいて再度繰り返し、serU修復鋳型を提供し、2%グルコース、50μg/mlアプラマイシン及び200μg/mlストレプトマイシンを補充した2xYTアガープレート上で対比選択した。rpsL-kanカセットの除去を、コロニーPCR及びSangerシーケンシングによって確認した。類似の2ステッププロセスを通してのserT及びprfAの連続的欠失は、Syn61Δ3の作製をもたらした。
【0414】
増殖速度の測定及び解析
細菌コロニーを、200μg/mLストレプトマイシンを補充したLB中、37℃で終夜増殖させた。終夜培養物を、96ウェルプレートに新しい培地200μL中で1:200倍希釈した。増殖を、Infinite 200 Proプレートリーダー(Tecan AG社、Switzerland)によって、37℃、高速の線形振とうによってモニターした。OD600の測定を、5分毎に18時間行った。倍加時間を決定するために、増殖曲線を、log変換し、全ての連続する時点での一次導関数を決定した(d(log(x))/dt)。本発明者らは、log導関数の最大値を有する連続する10個の時点に対する平均値を使用して、倍加時間を計算した(1/平均値(log導関数の最大値))。増殖速度を、log導関数の最大値を有する連続する10個の時点に対する線形フィットの勾配として計算した(上記で決定した通り)。カーブフィッティング(直線回帰)を、Prism7(Graphpad)を使用して同時に反復実験について実施した。エラーバーは、±フィットの標準誤差を示す。
【0415】
標準的な実験条件下での増殖を決定するために、Syn61Δ3(ev5)の終夜培養物を、250mlコニカルフラスコ中新しい培地80ml中に1:100倍希釈した。3つの反復実験培養物を、37℃で振とうさせながら(220rpm)インキュベートし、OD600測定を、指数関数相の間に10分毎、10~30分毎に行った。各独立した培養物に関して、本発明者らは増殖曲線をlog変換し、指数関数相の間の最も速い増殖を有する60分間のウィンドウを選択した。増殖速度(勾配)及び倍加時間(1/勾配)を、ウィンドウ内の連続する6つの時点でlog導関数への線形フィットから計算した。カーブフィッティング(直線回帰)をPrism7(Graphpad)によって各反復実験について実施し、平均倍加時間及び増殖速度を計算した。エラーバーは、±平均値の標準誤差を示す。
【0416】
次世代シーケンシングのための全ゲノムライブラリの調製
所望のクローンからコロニーを採取し、これを使用して、200μg/mLストレプトマイシンを補充したLB 5mLに接種し、37℃、220rpmで振とうさせながら終夜インキュベートした。ゲノムDNAを、DNEasy血液組織キット(QIAgen社)によって、製造元の使用説明書に従ってこれらの培養物から抽出した。精製されたゲノムDNAから、Nextera XT DNAライブラリ調製キット(Illumina社)によって手作業で、又はBiomek FXp(Beckman Coulter社、スクリプトはhttps://github.com/JWChin-Labで入手可能)によって、容量を低減させて製造元のプロトコールに従ってペアードエンドシーケンシングライブラリを調製した:投入gDNA(0.2ng/μL、1μL)、TD緩衝液(2μL)、ATM(1μL)、NT緩衝液(1μL)、インデックス(1μL)、NPM(3μL)。インデックス配列は、「Illumina Adapter Sequence」サポート文書(Nextera DNAインデックス、16頁、2020年6月)から生成し、Biomers社から購入し、10μMで使用した。次にライブラリを、AMPure XP磁気ビーズ(Beckman Coulter社)によって製造元の使用説明書に従って(6:10のビーズ:反応体積比)で精製した。ライブラリを、Qubit(Thermofisher社)によって定量し、その後プールして変性させ、v3 MiSeq試薬キットを使用してMiSeq(Illumina社)において製造元の使用説明書に従って600サイクル(2×300サイクル)又は150サイクル(2×75サイクル)のいずれかのペアードエンドシーケンシングを行った。
【0417】
Syn61ノックアウト及び進化した株の解析
この作業で生成されたSyn61派生物のゲノム配列を分析するために、本発明者らは、次世代シーケンシング読み取りデータ(上記で生成したもの)を参照ゲノムと整列させ、変異、欠失、及び挿入を同定する(D. E. Deatherage, J. E. Barrick, Identification of mutations in laboratory-evolved microbes from next-generation sequencing data using breseq. Methods Mol Biol 1151, 165-188 (2014))ソフトウェアパッケージであるbreseqを使用した。プログラムを使用して、各進化ラウンド又は標的遺伝子ノックアウト(serT、serU、prfA)後の単離されたクローンを解析し、これらの株の生成の間に生じる変異を同定する(データファイルS1は、全ての中間株及び変異のリストを含有する)。加えて、以前に記載されたワークフロー(K. Wang et al., Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016))(スクリプトはhttps://github.com/TiongSun/iSeqで入手可能)を使用して、読み取りデータを参照Syn61ゲノム配列と整列させ、Integrative Genomics Viewer( H. Thorvaldsdottir, J. T. Robinson, J. P. Mesirov, Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics 14, 178-192 (2013))において読み取りデータのアライメントを可視化した。さらに、本発明者らは、1つより多くの変異を有するORFを同定した(図S2)。これらの同じ進化したプールから派生したクローンは、その配列がほぼ同一であることが見出されたことから、本発明者らは、解析のためにプールあたり、最も全体的な変異を有する1つのみのクローンを選択した。本発明者らは、解読要素の除去後に遺伝的背景の変更によりSyn61Δ3の進化において獲得された変異とは別個に、serT、serU及びprfAの欠失の前に、進化の間に蓄積したORFにおける全ての変異を比較した。変異が独立した事象であると仮定して、本発明者らは、少なくとも2つの変異が1つのORFにおいて偶然生じる確率を
【0418】
【数1】
【0419】
(式中、aは、ORFの総数(Syn61では、a=3556)であり、bは、1ラウンドの進化後のORFに蓄積した変異の平均数である)によって計算した。
【実施例2】
【0420】
tRNA欠失は、Syn61Δ3におけるウイルス産生を除去する
本発明者らは、tRNASer CGA及びtRNASer UGA及びRF-1をコードする遺伝子の欠失がファージ増殖に及ぼす影響を、Syn61Δ3(図2A)により改変された1ステップ増殖実験(L. You, P. F. Suthers, J. Yin, Effects of Escherichia coli Physiology on Growth of Phage T7 In Vivo and In Silico. Journal of Bacteriology 184, 1888 (2002))において調べた。
【0421】
Syn61(ev2)に関して、ファージT6(溶解性のT-evenファミリーの代表(図2B))の総力価は、感染した細胞が新規ファージ粒子を産生するために投入力価より2-logs10上に上昇する前に短期間低下した(ファージ感染細胞として)(図2C図S3A)。予想されたように、Syn61(ev2)のOD600は、溶解性であるT6ファージの感染により減少した(図2D)。Syn61ΔRF-1(データファイルS1)及びSyn61(ev2)は、同等のタイムスケールで同等のレベルのファージを産生し、感染時にOD600の類似の変化を示した。本発明者らは、RF-1単独の欠失が、T6ファージ産生又は細胞溶解に対して、もしあるとしてもほとんど効果を有しないという結論に達する。
【0422】
Syn61Δ3のT6ファージによる感染は、総ファージ力価の着実な減少をもたらした。重要なことに、この減少は、タンパク質合成の際に観察されたものと同等であり、したがって細胞におけるファージ産生は、ゲンタマイシンの添加により完全に阻害された(図2C図S3B)。その上、T6感染は、Syn61Δ3の増殖にほとんど影響を及ぼさなかった(図2D)。本発明者らは、Syn61Δ3が、T6ファージによる感染時に新規ファージ粒子を産生しない、及びT6ファージがこれらの細胞を溶解しないという結論に達する。類似の結果が、その40kbゲノムに57個のTCGコドン、114個のTCAコドン、及び6個のTAGコドンを有するT7ファージについても得られた(図S3A、C及びD)。本発明者らは、そのゲノムにアンバー終止コドンより10~58倍多くのTCA又はTCGセンスコドンを有するラムダ、P1vir、T4、T6及びT7を含有するファージのカクテルによって細胞を処置し(図2E図S3E)、このファージカクテルによる処置がSyn61(ev2)及びSyn61ΔRF-1の溶解をもたらすが、Syn61Δ3の増殖にはほとんど影響を及ぼさなかったことを見出し(図2、F及びG)、このことは、Syn61Δ3におけるtRNAの欠失が広範囲のファージに対する耐性を提供することを示唆した。
【0423】
材料及び方法-実施例2
全般的なファージの方法
ファージλ、P1vir、T4、及びT6は、George Salmond(University of Cambridge、Department of Biochemistry)から提供された。ファージT7は、ATCC(BAA-1025-B2)から得た。各ファージストックの力価を、ファージ緩衝液(1mM MgSO4、1mM Tris-HCl、0.1%ゼラチン)中でストックを連続希釈することによって推定し、トップアガー(0.35%アガーを有するLBアガー)において大腸菌MG1655に感染させ、プラークを37℃で終夜成熟させた。プラークを計数し、各ストックについてPFU/mLを計算した。
【0424】
感染性ファージの総力価
大腸菌Syn61バリアントの終夜培養物を2xYTにおいてOD600=0.5となるように希釈した後、50mL Falconチューブに3mLを移し、それらにファージT6又はT7(それぞれ、MOI=5×10-2及び5×10-5)を感染させた。各ファージに関して、ファージを2xYT 3mLに添加した無細胞対照を含んだ。次に、感染した培養物を、37℃で4時間インキュベートし、220rpmで振とうさせた。適当な時点で、試料の100μLを、氷中で各培養物からファージ緩衝液400μL及びクロロホルム50μLを含有する微量遠心チューブに移した。試料を直ちに十分ボルテックス処理し、13000×gで4分間遠心分離し、LoBind微量遠心チューブ(Eppendorf社)に移し、4℃で保存した。ファージ力価を定量するために、各試料をファージ緩衝液中で連続希釈した。適当な希釈液10μLを使用して、2xYT中で増殖させた大腸菌MG1655の終夜培養物200μLに感染させた。感染した細胞を、moltenトップアガー4mLと混合し、TYEアガープレートに注いだ。乾燥後、プレートを37℃で終夜インキュベートして、菌叢を増殖させ、ファージプラークを発達させた。プラークの数を計数し、希釈倍数を乗算することによって元の試料のファージ力価を計算した。
【0425】
バックグラウンド対照として、大腸菌Syn61を、代謝的に不活性にした:本発明者らは、終夜培養物を、2xYT 10mL中でOD600=1となるように希釈し、ゲンタマイシンを1000μg/mLの最終濃度で添加し、細胞を37℃、220rpmで振とうさせながら6時間インキュベートした。細胞を4000×gで10分間遠心分離した後、抗生物質を含有する上清を吸引した。不活性な細胞を、2xYT中でOD600=0.5となるように再懸濁させ、それらに上記のようにファージを感染させた。本発明者らは、ゲンタマイシン処置細胞の代謝活性を、新たに合成されたタンパク質への35S組み込みによって評価した。ゲンタマイシン処置大腸菌Syn61培養物(OD600=0.5)1mLを、メチオニン及びシステインの35S標識混合物(11mCi/mL、1175Ci/mmol、Perkin Elmer社NEG072)1.5μLの存在下、37℃で1時間インキュベートした。
【0426】
本発明者らは、インキュベーション終了時のOD600を測定し、細胞を4000×gで10分間遠心沈降させ、細胞を冷PBSによって洗浄した。上記のOD600測定に基づいて、細胞を、1xBugBusterタンパク質抽出試薬(Merck社)に1.4×10個/mL(光路長1cmでOD600 1.0=1×10個/mLと仮定する)の密度で再懸濁させた。細胞を1時間溶解し、細胞2.8×10個の等価物を、4~12%Bis-trisポリアクリルアミドゲルの各レーンにロードした。次に、本発明者らは、溶解物をSDS-PAGEによって分析した後、Quickクマシー染色(Neo Biotech社)によって製造元の使用説明書に従って染色した。得られたゲルを乾燥させ、ストレージ蛍光スクリーン(GE Healthcare Life Sciences社)に2週間露光した後、Amersham Typhoon(GE Healthcare Life Sciences社)においてイメージングした。
【0427】
ファージ感染アッセイ
複数のファージに同時に感染させるために、本発明者らは、上記のようにSyn61バリアントの培養物を調製し、5つ全てのファージのカクテル(λ、P1vir、T4、T6、及びT7、各ファージに関してMOI=1×10-2)を添加した。細胞増殖及び溶解を、4時間後のOD600の測定によってモニターし、非感染培養物と比較した。
【0428】
ファージゲノムTCG、TCA、TAGコドン計数
本発明者らは、カスタムPython3.7スクリプトを使用して異なるファージのゲノムにおけるTCG、TCA及びTAGコドンの数及び位置を同定した。簡単に説明すると、スクリプトは、Biopython(P. J. A. Cock et al., Biopython: freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics 25, 1422-1423 (2009))を使用して所望のファージのアノテートされたゲノムを含有するGenBankファイルを開き、次にコード配列をスキャンして、標的コドン及びその位置を同定し、それらをメモリーに保存する。Pythonライブラリのmatplotlib(J. D. Hunter, Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering 9, 90-95 (2007))を使用して、各標的コドンの位置が垂直線で表されるゲノムのプロットを生成する。スクリプトは、https://github.com/JWChin-Labで入手可能である。
【実施例3】
【0429】
ncAAの組み込み
ncAA組み込みのための標的コドンの再定義
本発明者らは、Syn61Δ3(ev5)においてUb11XXX遺伝子(11位にTCG、TCA又はTAGを有するユビキチン-His)、及び同族の直交性MmPylRS/MmtRNAPyl YYY対をコードする遺伝子(T. Yanagisawa et al., Multistep Engineering of Pyrrolysyl-tRNA Synthetase to Genetically Encode Ne-(o-Azidobenzyloxycarbonyl) lysine for Site-Specific Protein Modification. Chemistry & Biology 15, 1187-1197 (2008))(アンチコドンは、Ub遺伝子の11位のコドンと相補的である)を発現させた(図3A、データファイルS2)。
【0430】
ncAAを添加しない場合、11位で標的コドンを有するUb遺伝子からユビキチンはほとんど又は全く検出されなかったが、対照実験は、ユビキチンが、任意の標的コドンを含有しない「野生型」遺伝子から産生されることを実証した(図3B)。このように、標的コドンはいずれも、Syn61Δ3における内因性の翻訳機構によって読み取られなかった。このことは、標的コドンの全てが、この株において直交性であることをさらに実証する。
【0431】
MmPylRS/MmtRNAPyl対(Nε-((tert-ブトキシ)カルボニル)-L-リシン(BocK))のncAA基質を添加すると(T. Yanagisawa et al., Multistep Engineering of Pyrrolysyl-tRNA Synthetase to Genetically Encode Ne-(o-Azidobenzyloxycarbonyl) lysine for Site-Specific Protein Modification. Chemistry & Biology 15, 1187-1197 (2008))、ユビキチンが、野生型対照と同等のレベルで産生された(図3B、データファイルS4)。ESI-MS及びMS/MSは、相補的なMmPylRS/MmtRNAPyl YYY対を使用して各標的コドンに応答してUbの11位でBocKの遺伝的に方向付けられた組み込みを実証した(図3C図S4A)。追加の実験は、GST-MBPにおけるセンス及び終止コドンに応答してncAAの効率的な組み込みを実証した(図S5、データファイルS4)。本発明者らは、標的コドンの各々に応答して、2、3、又は4個のncAAを単一のポリペプチドに組み込むUb-Hisの良好な収量を実証し(データファイルS4、図3、D~I、及び図S4、B~G)、及び単一の反復タンパク質における9個のTCGコドンに応答した9個のncAAの組み込みをさらに実証した(図S6)。併せると、これらの結果は、センスコドンTCG及びTCA、及び終止コドンTAGが、Syn61Δ3派生物においてncAAを有効に再定義することができることを実証した。
【0432】
別個の標的コドンに応答した別個のncAAのコード化
次に、本発明者らは、別個のncAAを認識し、別個のコドンを解読する改変された相互直交性aaRS/tRNA対を使用してSyn61Δ3(ev4)においてTCG、TCA及びTAGコドンを別個のncAAに定義した(図4A図S7)。本発明者らは、TCG及びTAGコドンに応答して2つの別個のncAAをユビキチンに組み込み(図4B図S8A~B)、及びユビキチンの4つの部位での2つの別個のncAAの組み込みを実証し、各ncAAは、タンパク質における2つの異なる位置で組み込まれる(図4B及びC、及び図S8C~E、及びデータファイルS4)。本発明者らは、TCG、TCA及びTAGコドンに応答して、3つの別個のncAAをユビキチンに組み込んだ(図4D、E、及び図S8F)。本発明者らは、各々が3つの別個のncAAを組み込むユビキチンの7つの異なる型を合成することによってそのアプローチの全般性を実証した(図S9図S10、データファイルS4)。
【0433】
コードされた非標準ポリマー及び大環状分子
2つの別個のモノマー(A及びB)で構成される線状ポリマーに関して、任意の配列を構成することができる4つの基本重合化ステップ(A+B->AB、B+A->BA、A+A->AA、B+B->BB)が存在する(図5A)。リボソーム媒介重合化に関して、これらの4つの基本ステップは、A部位又はP部位基質として作用する各モノマーに対応し、同じモノマーの別のコピーと、又は別個のモノマーと結合を形成する(図5A)。本発明者らは、sfGFP遺伝子のコドン3にTCG-TCG(AAをコードする;モノマーAは、この命名法ではTCGコドンに任意に定義された)、TAG-TAG(BBをコードする;モノマーBは、TAGコドンに定義された)、TCG-TAG(ABをコードする)及びTAG-TCG(BAをコードする)を挿入することによって各基本ステップをコード化した。本発明者らは、モノマーの3つの対の基本ステップを実証した:A=BocK、B=p-IPhe;A=CbzK、B=p-I-Phe;A=Nε-アリルオキシカルボニル-L-リシン(AllocK)、B=CbzK(図5B図S11)。本発明者らは、6つの完全に非天然の四量体配列及びモノマーの各対に関して六量体配列、並びにAllocK、CbzK対に関しては八量体配列(全体で22個の合成ポリマー配列)を遺伝的にコード化した(図S11図5、C、D、及びE、図S12)。全てのコード化された重合化は、ncAA依存的であり(図S11図5、C、D及びE、図S12B)、ESI-MSは、本発明者らがsfGFP融合体としての非標準六量体及び八量体を合成したことを確認した(図5F図S12C)。本発明者らは、SUMO及びGyrA-CBD及び精製された遊離のポリマーの間でAllocK及びCbzKで構成される四量体及び六量体配列をコード化した(図5、G、H、及びI、図S13)。最後に、本発明者らは、非リボソームペプチドシンテターゼの産物に類似の非天然大環状分子の合成をコード化した(図5、G及びJ)。
【0434】
【表1】
【0435】
材料及び方法-実施例3
ユビキチン及びGFPを発現させるためのベクターの構築
全てのクローニングを、大腸菌DH10bにおいて行った。ユビキチン(Ub)又はsfGFPを発現させるためのプラスミドを、pBAD発現系に基づいて構築した(T. S. Elliott et al., Proteome labeling and protein identification in specific tissues and at specific developmental stages in an animal. Nature Biotechnology 32, 465-472 (2014))。再コード化された野生型ユビキチン、sfGFP、apra、及びaraCを、gBlocks(IDT)として注文した。次にプラスミドを、HiFi DNA Assembly Mix(NEB)との4ピースアセンブリを通して構築し、重複する断片は、PCRによって増幅された、i)再コード化された野生型Ub又はsfGFP、ii)再コード化されたapra、iii)再コード化されたaraC、及びiv)pBADベクター起源領域のいずれかであった。これは、プラスミドpBAD_Ub-wt_rec及びpBAD_sfGFP-wt_recを生成した。TCG、TCA、又はTAGコドンがUb又はsfGFP遺伝子に導入されているこれらのプラスミドのバリアントを、pBAD_Ub-wt_rec及びpBAD_sfGFP-wt_recの部位特異的変異導入によって生成した。全てのプラスミドの配列の詳細に関してはデータファイルS2を参照されたい。
【0436】
TCG、TCA、又はTAGコドンを解読するためのaaRS/tRNAプラスミドの構築
全てのクローニングを、大腸菌DH10bにおいて行った。1つのタイプのncAAを組み込むために、本発明者らは、ncAA組み込みを方向付ける、aaRS/tRNA対をコードするpMB1ベースのプラスミドを使用した。アンチコドンCGA及びUGAを有するtRNAPylコンストラクトの場合、本発明者らは、アンチコドンステムループ(ASL-アンチコドンプラスいずれかの側に6ヌクレオチド)全体が、アンチコドンCGA及びUGAを有するserU(CGAの場合)又はserT(UGAの場合)大腸菌遺伝子のASL配列と置き換えられるように、pylTtRNA遺伝子(参考文献C. Fan, H. Xiong, N. M. Reynolds, D. Soll, Rationally evolving tRNAPyl for efficient incorporation of noncanonical amino acids. Nucleic Acids Research 43, e156-e156 (2015)からのpylTopt変異を含む)を設計した。
【0437】
pMB1ベースのaaRS/tRNAプラスミドを、i)gBlock(IDT)として合成された、構成的glnSプロモーターの制御下の再コード化されたaaRS、ii)gBlock(IDT)として合成された、lppプロモーターとrrnCターミネーターの間に配置されたtRNA遺伝子、iii)再コード化されたkan遺伝子、及びiv)以前に記載されたpMB1ベースのプラスミド(T. S. Elliott et al., Proteome labeling and protein identification in specific tissues and at specific developmental stages in an animal. Nature Biotechnology 32, 465-472 (2014))からPCRによって増幅されたpMB1ベクター起源を含む、複数の断片のHiFi Assemblyによって構築した。この戦略によって、プラスミドpMB1_MmPylRS_tRNA-Pyl-opt(CGA/UGA/CUA)をアセンブルした。全てのプラスミド配列は、データファイルS2に記載されるそのGenBank受託番号を介して入手可能である。
【0438】
2重又は3重ncAA組み込みのためにaaRS/tRNA対をコードするプラスミドの設計及び構築
2重及び3重の別個のncAA組み込み実験に関して、本発明者らは、2つのaaRS/tRNA対(D. L. Dunkelmann, J. C. W. Willis, A. T. Beattie, J. W. Chin, Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non-canonical amino acids. Nature Chemistry 12, 535-544 (2020))をポリシストロニックにコードするプラスミドを設計した。本発明者らは、glnSプロモーターの下流に2つのaaRS CDSを配置し;aaRS遺伝子の間の遺伝子間領域を、RBS計算プログラム(https://salislab.net/software/)によって最適化した。両方のtRNA遺伝子を、lppプロモーターの下流に配置した。tRNA遺伝子間の遺伝子間領域は、大腸菌ゲノムにおけるalaX及びalaW遺伝子の間の遺伝子間領域に基づいた。
【0439】
2つのaaRS/tRNA対をコードするプラスミドを構築するために、本発明者らは、個々のgBlock(IDT)としてその対応するRBS配列がその前にある再コード化されたaaRS遺伝子を注文した。ポリシストロニックtRNAを、lppプロモーター、rrnCターミネーター、及び遺伝子間領域と共に、単一のgBlock(IDT)として注文した。本発明者らは、HiFi Assembly(NEB)によって、kan(上記)を含有するpMB1バックボーンと共にaaRS遺伝子及びtRNAを共にコードする合成DNA断片をアセンブルした。このように、本発明者らは、プラスミドpMB1_1R26PylRS(CbzK)_AfTyrRS(p-I-Phe)_AlvtRNA-ΔNPyl(8)(CGA)_AftRNA-Tyr(A01)(CUA)、pMB1_MmPylRS_1R26PylRS(CbzK)_MmtRNAPyl-opt(CGA)_AlvtRNA-ΔNPyl(8)(CUA)、pMB1_MmPylRS_AfTyrRS(p-I-Phe)_MmtRNA-Pylopt(CGA)-AftRNA-Tyr(A01)(CUA)及びpMB1_MmPylRS_1R26PylRS(CbzK)_MmtRNA-Pylopt(CGA)_AlvtRNA-ΔNPyl(8)(UGA)を生成した。プラスミド配列は、データファイルS2に記載されるそのGenBank受託番号を介して入手可能である。
【0440】
3つの別個のncAAを組み込むために、本発明者らは、pMB1_MmPylRS_tRNA-Pyl-opt(UGA)を鋳型として、i)glnSプロモーターの制御化でMmPylRS、及びii)lppプロモーターとrrnCターミネーターの間にpylT-serT(UGA)キメラtRNA遺伝子(上記を参照されたい)を包含するDNA断片をPCR増幅した。次に、本発明者らは、部位特異的変異導入を使用して、ユビキチンのコドン9、11及び14位がそれぞれ、TAG、TCG及びTCAに置換されている中間pBAD_Ub派生物を個別に作製した。次に、MmPylRS/pylTserT(UGA)断片をHiFi Assemblyによって中間プラスミドにおけるユビキチン遺伝子の下流に挿入した。最後に、部位特異的変異導入を、得られたプラスミドにおいて、参考文献C. Fan, H. Xiong, N. M. Reynolds, D. Soll, Rationally evolving tRNAPyl for efficient incorporation of noncanonical amino acids. Nucleic Acids Research 43, e156-e156 (2015)と同様にtRNAPylの配列に「opt」変異の導入を方向付けるプライマーによって実施し、pBAD_Ub9TAG11TCG14TCA-MmPylRS_MmtRNA-Pyl-opt(UGA)を生成した。本発明者らは、このプラスミドを開始点として使用して、親プラスミドのaaRS/tRNA対を、HiFi assemblyによってMjTyrRS(p-Az-Phe)又はMjTyrRS(3-Nitro-TyrRS)の再コード化された合成DNA断片、又はその対応するtRNAと置き換えることによって、pBAD_Ub9TAG11TCG14TCA-MjTyrRS(p-Az-Phe)_tRNA-Mj-Tyr(CUA)及びpBAD_Ub9TAG11TCG14TCA-MjTyrRS(3-Nitro-TyrRS)_tRNA-Mj-Tyr(CUA)を作製した。配列をデータファイルS2に詳述する。
【0441】
BocK及びp-I-PheのsfGFPへの組み込みを記載する実験(図5C及びF)は、pBAD_sfGFP_MmPylRS_MmtRNA-Pyl-opt(CGA)の派生物を使用した。pBAD_Ub9TAG11TCG14TCA-MmPylRS_MmtRNA-Pyl-opt(UGA)から開始して、本発明者らは、HiFi AssemblyによってUb遺伝子を野生型sfGFPに置き換えた。本発明者らは、次に、部位特異的変異導入によって異なるコドンの組合せを導入することによってsfGFPの3位を派生物化(derivatize)した。最後に、部位特異的変異導入を使用して、得られたプラスミドの各々においてASLをserTからserUに置き換え、pBAD_sfGFP_MmPylRS_MmtRNA-Pyl-opt(CGA)派生物のセットを生成した(プラスミドの完全なリストに関してはデータファイルS2を参照されたい)。
【0442】
標的コドンを含有するユビキチンのSyn61発現のウェスタンブロット分析
ユビキチンバリアントを発現させるために、本発明者らは、エレクトロコンピテントSyn61Δ3、Syn61Δ3(ev3)又はSyn61Δ3(ev4)細胞60μLを、pMB1_MmPylRS_tRNA-Pyl-opt(YYY)プラスミド(serU(CGA)、serT(UGA)、又はCUAアンチコドンのいずれかを有する、データファイルS2を参照されたい)及び関連するpBAD_Ubプラスミド(プラスミドあたり1μL)によって共形質転換した。電気穿孔した細胞を、予め37℃に加温したSOB 1mL中に回収し、卓上サーモミキサー(Eppendorf社)において1000rpmで1時間30分振とうさせた。回収後、細胞1mLを、50μg/mLカナマイシン及び50μg/mLアプラマイシンを含有する予め加温した2xYT 6mL中に希釈した。次に、希釈した細胞を220rpmで振とうさせながら37℃で18時間インキュベートした。終夜培養物を、50μg/mLカナマイシン、50μg/mLアプラマイシン、0.2重量/体積%L-アラビノース、及び0mM又は5mMのいずれかの(BocK)を含有する予め加温した2xYT 5~50mLに1:100倍希釈することによって、ユビキチンの発現を開始させた。220rpmで振とうさせながら37℃で8時間発現させた後、細胞を、遠心分離(4,000×gで20分間)により回収し、沈降物をさらに使用するまで-20℃で凍結した。発現後ウェスタンブロット分析のために、本発明者らは、細胞5×10個(光路長1cmでOD600 1.0=1×10個/mLと仮定する)を、1.5mL微量遠心管での遠心分離(10000×g、1分間)によって回収した。細胞沈降物を、5%β-メルカプトエタノールを有する1×LDS試料緩衝液(BioRad社)50μL中に再懸濁させ、95℃で5分間沸騰させた後、5分間ボルテックス処理した。各試料10μLを、4~12%Bis-Tris NuPAGE SDS-PAGEゲル(Invitrogen社)にロードし、180Vで45分間電気泳動させた。PVDF膜への転写は、iBlot 2 semi-wet転写システムによって行った。次に膜を、Odysseyブロッキング緩衝液5mLによって30分間ブロックし、0.2%Tween-20を有するブロッキング緩衝液中で1:1000倍希釈した抗His-タグ一次抗体(Abcam社、カタログ番号ab18184)5mLと共にインキュベートした。室温で1時間後、膜を、各々0.2%Tween-20を含有するPBS 5mLによって5分間の洗浄を3回行った。二次抗体を、5mL体積中で1:15000倍希釈で添加し、ブロッキング緩衝液と0.01%SDSを補充した0.2%Tween-20との50/50ミックス中に希釈した。二次抗体(IRDye 925-68070、LiCor)を、室温で30分間インキュベートした後、各々0.2%Tween-20を含有するPBS 5mLによる5分間の洗浄を3回行った。ウェスタンブロットのイメージングは、Typhoon Trioホスホイメージャー(GE Life Sciences社)において実施した。
【0443】
GFP発現の測定
本発明者らは、ユビキチン遺伝子の発現と同じ培地条件下(上記の節を参照されたい)で、単一又は複数のTCG、TCA、又はTAGコドンを有する再コード化されたsfGFP遺伝子の発現を実施した。簡単に説明すると、細胞(Syn61Δ3(ev4))50μLに、pMB1に基づくaaRS/tRNAプラスミド(1μL)並びにpBAD_sfGFPレポータープラスミド(1μL)の両方を同時に電気穿孔した。形質転換した細胞を、37℃、1000rpmで絶えず振とうさせながらSOB 1mL中で1時間30分間回復させ、その後、細胞1mL全体を、50μg/mLカナマイシン及び50μg/mLアプラマイシンを含有する2xYT 6mLに接種し、220rpmで振とうさせながら37℃で終夜インキュベートした。本発明者らは、96ウェルマイクロタイタープレートのフォーマットで発現を実施し、終夜培養物を、カナマイシン(50μg/mL)、アプラマイシン(50μg/mL)、L-アラビノース(0.2%)を含有する2xYT 0.5mLに、及び2mM ncAAの存在下又は非存在下、1:100で接種した。96ウェルプレートを、Thermo-Shaker(Grant-bio社)において750rpmで振とうさせながら37℃で16時間インキュベートした。3200gで10分間遠心分離後、細胞沈降物をPBS 150μLに再懸濁させた。細胞密度によって正規化したGFP発現を測定するために、再懸濁させた細胞100μLを、Costar社製の96ウェル透明平底プレートに移し、OD600及びGFP蛍光(λex:485nm;λem:520nm)測定を、PHERAstar FSプレートリーダー(BMG LABTECH社)においてゲインを200に設定し、焦点調整を3.5mmに設定して記録した。
【0444】
大腸菌からのHis6x-タグレポータータンパク質の精製
i)aaRS/tRNA対を有するpMB1ベースのプラスミド、及びii)pBAD_sfGFP又はpBAD_Ub派生物を有する細胞(Syn61Δ3(ev4)又はSyn61Δ3(ev5))を、220rpmで振とうさせながら37℃で終夜増殖させた。終夜培養物を、単一の標的コドンを含有するレポーターに関して10mL容量で、及び複数のコドンを含有するレポーターに関してはより大きい容量(20~50mL)で調製した。発現培養物を、4000×gで10分間遠心分離させ、沈降物を氷中で冷却した後、細胞を、溶解緩衝液(1×PBS、1×Bugbuster(登録商標)タンパク質抽出試薬(Novagen(登録商標)社)、50μg/mL DNase1、100μg/mLリゾチーム、1mM PMSF、及び20mMイミダゾール)の当初の培養体積の1/20に再懸濁させた。細胞再懸濁液を、4℃で30分間インキュベートし、溶解物を遠心分離(16000×g、4℃、30分間)によって透明にした。透明にした溶解物の上清を、Ni2+-NTAスラリー(Qiagen社)50~100μLを含有する新しい微量遠心チューブに移した。Ni2+-NTA混合物を、軽く反転させながら4℃で1時間インキュベートした。本発明者らは、Ni2+-NTAビーズをフリット付きカラム(fritted column)上での重力濾過により収集し、それらを洗浄緩衝液(PBS、40mMイミダゾール、pH8)500μLに再懸濁させ、3回の洗浄を実施した。ポリヒスチジンタグタンパク質を溶出させるために、本発明者らは、次に洗浄したビーズを、溶出緩衝液(PBS、300mMイミダゾール、pH8)100μL中に再懸濁させた。遠心分離(1000×g、4℃、1分間)後、溶出したタンパク質を含む上清を、新しい微量遠心チューブに移し、溶出手順を3回繰り返した。タンパク質発現収量(mg/L)を定量するために、本発明者らは、QubitTMタンパク質アッセイキット(ThermoScientific社)を、製造元のプロトコールに従って使用し、精製タンパク質をその後に解析するまで-20℃で保存した。
【0445】
大腸菌からのGSTタグレポータータンパク質の精製
細胞を、溶解物をグルタチオンセファロース(商標)4Bビーズ(GE Healthcare社)100μLと共に製造元のプロトコールに従ってインキュベートしたことを除き、His-タグレポーター発現と同一の方法で、10mL容量で調製した。軽く攪拌しながら4℃で1時間インキュベーション後、本発明者らは、ビーズをPBS1mLによって3回洗浄した。次に、本発明者らは、ビーズに結合したGSTタグタンパク質を、50mM Tris-HCl pH8.0中の10mM還元グルタチオン150μLによって溶出させた。溶出させたタンパク質を、1×LDS試料緩衝液(BioRad社)の最終濃度と混合し、各試料10μLを、4~12%Bis-Tris NuPAGEゲルにロードした。電気泳動後、ゲルを、InstantBlue(Expedeon社)によって30分間染色した後、水ですすいだ。
【0446】
His-SUMO-ncペプチド-GyrAを発現させるためのベクターの構築
再コード化された野生型GyrA-CBD及びHis-SUMOを、gBlocks(IDT)として注文した。プラスミドを、HiFi DNA Assembly Mix (NEB社)によって4ピースアセンブリにアセンブルし、重複する断片は、SUMOとGyrAの間にGS4リンカーを含有した。アセンブリは、i)PCR増幅GS-GyrA-CBD;ii)His-SUMO-GS;iii)MmPylRS/MmtRNAPyl CGA)対を含有するDNA断片;及びiv)pBAD_Ub-wt_recからPCRによって増幅されたpBADバックボーンを含有した。これにより、プラスミドpBAD_SUMO-GS-GyrACBD_MmPylRS_MmtRNA-Pyl-opt(CGA)が生成された。非標準ペプチドコード化配列及び/又はシステインコドンがSUMOとGyrAの間に埋め込まれているこのプラスミドのバリアントを、部位特異的変異導入によって生成した。全てのプラスミドの配列の詳細に関してはデータファイルS2を参照されたい。
【0447】
His6-SUMO-ncペプチド-GyrA-CBD融合タンパク質の発現
本発明者らは、pMB1_MmPylRS_1R26PylRS(CbzK)_MmtRNA-Pyl-opt(CGA)_AlvtRNA-ΔNPyl(8)(CUA)プラスミドを含有するエレクトロコンピテントSyn61Δ3(ev5)細胞60μLを、pBAD_SUMO-XXX-GyrA-CBD_MmPylRS_MmtRNA-Pyl-opt(CGA)又はpBAD_SUMO-Cys-XXX-GyrA-CBD_MmPylRS_MmtRNA-Pyl-opt(CGA)派生物(XXXは、標的ペプチドのコード配列を示す)によって形質転換した。電気穿孔した細胞を、SOB 1mL中、37℃、200rpmで振とうさせながら回復させ、2時間後、細胞を、50μg/mLカナマイシン及び50μg/mLアプラマイシンを含有する2xYT 20mL中で希釈した。発現培養物を、TB培地500mL中に増殖させた予備培養物を添加することによって接種し、抗生物質選択を維持した。TB培養物を、37℃で、攪拌しながら(200rpm)OD600が2.5~3.0(約12時間)となるまで増殖させた。発現を、0.4%L-アラビノースの添加によって誘発し、2mMの両方のncAA(AllocK、CbzK)を添加した。14時間後、培養物を、250mLアリコートに分配し、遠心分離(4000rpm、20分間、4℃)によって細胞を回収した。細胞沈降物をPBSによって洗浄し、-20℃で保存した。
【0448】
His6-SUMO-ncペプチド-GyrA-CBD融合タンパク質の精製及びペプチドの切除
凍結した細胞アリコートを融解し、DNAse(0.01mg/mL)及びリゾチーム(0.1mg/mL)を補充した氷冷MES緩衝液(20mM MES pH6.9、150mM NaCl)中に再懸濁させた。再懸濁させた細胞を、空気圧ホモジナイザーの中に2回通過させ、溶解物を遠心分離(25000rpm、25分間)によってきれいにした。上清を、Ni2+-NTAスラリー(20%エタノール中の50%ビーズ)1mLと共に混合し、軽く攪拌しながら4℃で1時間インキュベートした。Poly-Prepカラム(BioRad社)を使用して、Ni2+-NTAアガロースを、重力濾過を通して上清から分離した。濾液30mMイミダゾールを補充したMES緩衝液30mLによって洗浄し、次にタンパク質を、200mMイミダゾールを含有するMES緩衝液2mLによって溶出させた。溶出液を、およそ10mg/mLに濃縮し、緩衝液をMES緩衝液に交換した。タンパク質4mg(ペプチド約100μg)を、10又は200mM DTT(環化又はDTT誘発切断)及び0.04mg Ulp1を含有するMES緩衝液500μL中で調製した各切除反応に使用した。反応物を、37℃でインキュベートし、反応の進行をLC-MSによってモニターし、終了時(18~48時間)、遊離のペプチドを、C18スピンカラム精製(線状AllocK/CbzK四量体)又は熱酸性メタノール抽出(線状AllocK/CbzK六量体、環状AllocK/CbzK四量体)のいずれかによって精製した。
【0449】
C18スピンカラム(Pierce(商標))精製に関して、プロトコールは、本質的に製造元の使用説明書の記載通りに実施し、唯一の変更点は、タンパク質を除去するために70%ACN、0.1%AcOHによるさらなる洗浄ステップ及び溶出緩衝液を90%MeOH、0.2%AcOHに置換したことであった。簡単に説明すると、試料を、4×試料緩衝液(20%ACN、2%AcOH)と混合し、活性化して平衡にしたC18スピンカラムに200μLずつをロードした。反応物を、1500×gで30秒間遠心分離させることによってカラムを2回通過させた。次に、カラムを洗浄緩衝液(5%ACN及び0.5%AcOH)200μLによって2回洗浄し、タンパク質洗浄緩衝液(70%ACN、0.2%AcOH)200μLによって1回洗浄した。次に、ペプチドを、90%MeOH、0.2%AcOHの20μLによって2回溶出し、メタノールを空気流下で蒸発させた(乾固させない)。次に、試料に0.2%AcOHの初回容量を再充填し、ESI-MSによって分析した。
【0450】
熱酸性メタノール抽出の場合、線状AllocK/CbzK六量体及び環状AllocK/CbzK四量体ペプチドが、反応混合物から沈殿し、これを遠心分離(5分間、20000rpm)によって収集することができ、上清を捨てた。ペプチドを、90%メタノール1%AcOH 200μL中に55℃で2時間再溶解した(より長いインキュベーションはAlloc及びCbz保護基の喪失を増加させる)。試料を、空気流下での蒸発によって40μLに低減させ、この時点で、メタノール濃度は、溶解度を確保するために20%より上に維持された。試料を、線状AllocK/CbzK四量体ペプチドに関して上記の通りに分析した。
【0451】
インタクトタンパク質質量分析
本発明者らは、改変されたnanoAcquity LCシステムを備えたWaters Xevo G2質量分析計を使用してESI-MSを行った。簡単に説明すると、注入されたタンパク質を、BEH C4 UPLCカラム(1.7μm;1.0×100mm;Waters社)上で流速50μL/分で分離した。ポンプは、2体積/体積%~80体積/体積%(0.1体積/体積%ギ酸)から始まるアセトニトリル勾配を20分間かけて送達した。カラムの出口を、ハイブリッド4重極子飛行時間型質量分析計(Waters社)を備えたエレクトロスプレーイオン化ソースに直接接続した。コーン電圧30Vを使用して、データをポジティブイオンモードで、300~2000m/zの範囲で獲得した。スキャンを、MassLynxソフトウェア(Waters社)内のMaxEnt1関数を使用してデコンボリュートした。本発明者らは、GPMAW(Lighthouse Data社)ソフトウェアによって理論上の野生型タンパク質の分子量を計算し、それらを手作業で編集してncAAの分子量に適合させた。
【0452】
ncAA含有トリプシンペプチドのタンデム質量分析(MS/MS)
本発明者らは、上記のようにncAAを含有するユビキチン又はGFPタンパク質を、そのC末端Hisタグによって精製し、及び4~12%NuPAGE Bis-Trisゲル(Invitrogen社)上で試料を精製した。InstantBlue(Expedeon社)染色後、本発明者らは、予想される標的タンパク質のおよその分子量で移動したゲル片を切除し、それらを以前に記載されたように(T. S. Elliott et al., Proteome labeling and protein identification in specific tissues and at specific developmental stages in an animal. Nature Biotechnology 32, 465-472 (2014))ゲル内トリプシン消化に供した。切除したタンパク質ゲル片を、50mM重炭酸アンモニウムを有する50体積/体積%アセトニトリルによって脱染した。10mM DTTによる還元及び55mMヨードアセトアミドによるアルキル化後、タンパク質を、6ng/μLトリプシン(Promega社、UK)によって37℃で終夜消化した。トリプシンペプチドを、2体積/体積%アセトニトリルを有する2体積/体積%ギ酸中で抽出し、その後、Ultimate U3000 HPLC(ThermoScientific Dionex社、San Jose、USA)を備えたナノスケールキャピラリーLC-MS/MSによって流速を300nL/分に設定して分析した。ペプチドをC18 Acclaim PepMap100 5μm、100μm×20mm nanoViper(ThermoScientific Dionex社、San Jose、USA)で捕捉した後、C18 T3 1.8μm、75μm×250mm nanoEaseカラム(Waters社、Manchester、UK)で分離した。アセトニトリルの勾配により、ペプチドを溶出させ、分析的カラムの出口を、4重極子Orbitrap質量分析計(Q-Exactive HFX、ThermoScientific社、USA)と共にナノフローエレクトロスプレーイオン化ソースに直接接続した。データ依存的解析の場合、完全なMSスペクトルの60,000の解像度を使用した後、12のMS/MSを使用した。MSスペクトルを、300~1,800のm/z範囲で収集した。得られたLC-MS/MSスペクトルを、Mascot検索エンジンプログラムを使用してタンパク質データベース(UniProt KB)に対して検索した。データベース検索パラメーターを、断片化イオントレランス0.1Daを有する前駆体イオントレランス5p.p.mに限定した。本発明者らは、検索パラメーターの複数の改変:2つの欠失した酵素切断、メチオニン酸化の多様な改変、システインカルバミドメチル化、ピログルタミン酸、リシンのncAAへの、トレオニンのncAAへの、及びセリンのncAAへの(ncAA変数は実験に基づく)改変を設定した。プロテオミクスソフトウェアScaffold 4を使用して、断片化スペクトルを可視化した。
【実施例4】
【0453】
考察
本発明者らは、Syn61を進化させ、TCG、TCA及びTAGコドンを解読するtRNAs及び終結因子を欠失させた。それらは、得られた株がウイルスのカクテルに対して完全な耐性を提供することを示す。その上、それらは、3つ全てのコドンに応答したコードされた非標準アミノ酸(ncAAs)の組み込み、並びに完全に非標準のヘテロポリマー及び大環状分子のコード化されたプログラム可能な細胞合成を実証する。
【0454】
このように、本発明者らは、標準コードを読む能力からこの株を合成的に切り離し、この進歩は、ウイルス混入及び溶解(V. Bethencourt, Virus stalls Genzyme plant. Nature Biotechnology 27, 681-681 (2009)、J. Zahn, M. Halter, in Surveillance and Elimination of Bacteriophage Contamination in an Industrial Fermentation Process. (2018))に関連する劇症型リスクなく、生物生産に関する潜在的根拠を提供する。本発明者らは、合成コドン圧縮及びそれらが実行されるコドン再定義戦略が、天然の進化の過程でコドン捕捉に関して提唱されるモデルと類似であることに注目する(S. Osawa, T. H. Jukes, Codon reassignment (codon capture) in evolution. Journal of Molecular Evolution 28, 271-278 (1989))。
【0455】
今後の研究は、遺伝子コードをさらに圧縮及び再定義するために本明細書に例示される原理を拡大する。本発明者らは、細胞の翻訳機構の操作における現行の進歩と組み合わせると(D. de la Torre, J. W. Chin, Reprogramming the genetic code. Nature Reviews Genetics 22, 169-184 (2020))、この研究が、緊急の潜在的に有用な特性を有する非標準ヘテロポリマーの拡大セットのプログラム可能でコード化された細胞合成を可能にすると予測する。
【0456】
(参考文献)
1. F. H. C. Crick, L. Barnett, S. Brenner, R. J. Watts-Tobin, General Nature of the Genetic Code for Proteins. Nature 192, 1227-1232 (1961)
2. P. Marliere, The farther, the safer: a manifesto for securely navigating synthetic species away from the old living world. Systems and Synthetic Biology 3, 77 (2009)
3. J. W. Chin, Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017)
4. D. de la Torre, J. W. Chin, Reprogramming the genetic code. Nature Reviews Genetics 22, 169-184 (2020)
5. T. Passioura, H. Suga, Reprogramming the genetic code in vitro. Trends Biochem Sci 39, 400-408 (2014)
6. A. C. Forster et al., Programming peptidomimetic syntheses by translating genetic codes designed de novo. Proc Natl Acad Sci U S A 100, 6353-6357 (2003)
7. M. J. Lajoie et al., Genomically Recoded Organisms Expand Biological Functions. Science 342, 357-360 (2013)
8. N. J. Ma, F. J. Isaacs, Genomic Recoding Broadly Obstructs the Propagation of Horizontally Transferred Genetic Elements. Cell Systems 3, 199-207 (2016)
9. G. Korkmaz, M. Holm, T. Wiens, S. Sanyal, Comprehensive analysis of stop codon usage in bacteria and its correlation with release factor abundance. J Biol Chem 289, 30334-30342 (2014)
10. D. D. Young, P. G. Schultz, Playing with the Molecules of Life. ACS Chemical Biology 13, 854-870 (2018)
11. C. C. Liu, P. G. Schultz, Adding New Chemistries to the Genetic Code. Annual Review of Biochemistry 79, 413-444 (2010)
12. Y. Zhang et al., A semi-synthetic organism that stores and retrieves increased genetic information. Nature 551, 644-647 (2017)
13. E. C. Fischer et al., New codons for efficient production of unnatural proteins in a semisynthetic organism. Nature Chemical Biology 16, 570-576 (2020)
14. H. Neumann, K. Wang, L. Davis, M. Garcia-Alai, J. W. Chin, Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)
15. K. Wang et al., Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nature Chemistry 6, 393-403 (2014)
16. D. L. Dunkelmann, J. C. W. Willis, A. T. Beattie, J. W. Chin, Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non-canonical amino acids. Nature Chemistry 12, 535-544 (2020)
17. J. S. Italia et al., Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. Journal of the American Chemical Society 141, 6204-6212 (2019)
18. J. Fredens et al., Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019)
19. W. H. Schmied et al., Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018)
20. M. R. Hemm et al., Small Stress Response Proteins in Escherichia coli: Proteins Missed by Classical Proteomic Studies. Journal of Bacteriology 192, 46 (2010)
21. S. Meydan et al., Retapamulin-Assisted Ribosome Profiling Reveals the Alternative Bacterial Proteome. Mol Cell 74, 481-493 e486 (2019)
22. A. Katz, S. Elgamal, A. Rajkovic, M. Ibba, Non-canonical roles of tRNAs and tRNA mimics in bacterial cell biology. Mol Microbiol 101, 545-558 (2016)
23. Z. Su, B. Wilson, P. Kumar, A. Dutta, Noncanonical Roles of tRNAs: tRNA Fragments and Beyond. Annu Rev Genet 54, 47-69 (2020)
24. L. You, P. F. Suthers, J. Yin, Effects of Escherichia coli Physiology on Growth of Phage T7 In Vivo and In Silico. Journal of Bacteriology 184, 1888 (2002)
25. T. Yanagisawa et al., Multistep Engineering of Pyrrolysyl-tRNA Synthetase to Genetically Encode Ne-(o-Azidobenzyloxycarbonyl) lysine for Site-Specific Protein Modification. Chemistry & Biology 15, 1187-1197 (2008)
26. V. Bethencourt, Virus stalls Genzyme plant. Nature Biotechnology 27, 681-681 (2009)
27. J. Zahn, M. Halter, in Surveillance and Elimination of Bacteriophage Contamination in an Industrial Fermentation Process. (2018)
28. S. Osawa, T. H. Jukes, Codon reassignment (codon capture) in evolution. Journal of Molecular Evolution 28, 271-278 (1989)
29. D. Cervettini, K. C. Liu, J. W. Chin, Scripts for Sense Codon Reassignment Enables Viral Resistance and Encoded Polymer Synthesis. Zenodo, (2021)
30. D. Cervettini et al., Rapid discovery and evolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs. Nature Biotechnology 38, 989-999 (2020)
31. A. H. Badran, D. R. Liu, Development of potent in vivo mutagenesis plasmids with broad mutational spectra. Nature Communications 6, 8425 (2015)
32. K. Wang et al., Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016)
33. D. E. Deatherage, J. E. Barrick, Identification of mutations in laboratory-evolved microbes from next-generation sequencing data using breseq. Methods Mol Biol 1151, 165-188 (2014)
34. H. Thorvaldsdottir, J. T. Robinson, J. P. Mesirov, Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics 14, 178-192 (2013)
35. P. J. A. Cock et al., Biopython: freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics 25, 1422-1423 (2009)
36. J. D. Hunter, Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering 9, 90-95 (2007)
37. T. S. Elliott et al., Proteome labeling and protein identification in specific tissues and at specific developmental stages in an animal. Nature Biotechnology 32, 465-472 (2014)
38. C. Fan, H. Xiong, N. M. Reynolds, D. Soll, Rationally evolving tRNAPyl for efficient incorporation of noncanonical amino acids. Nucleic Acids Research 43, e156-e156 (2015)
39. J. N. Beyer et al., Overcoming Near-Cognate Suppression in a Release Factor 1-Deficient Host with an Improved Nitro-Tyrosine tRNA Synthetase. Journal of Molecular Biology 432, 4690-4704 (2020)
40. K. C. Schultz et al., A Genetically Encoded Infrared Probe. Journal of the American Chemical Society 128, 13984-13985 (2006)
41. A. Telenti et al., The Mycobacterium xenopi GyrA protein splicing element: characterization of a minimal intein. Journal of Bacteriology 179, 6378 (1997)
【0457】
本明細書において言及されるデータファイルS1、データファイルS2、及びデータファイルS3は、刊行物:Wesley E. Robertson, Louise F. H. Funke, Daniel de la Torre, Julius Fredens, Thomas S. Elliott, Martin Spinck, Yonka Christova, Daniele Cervettini, Franz L. Boge, Kim C. Liu, Salvador Buse, Sarah Maslen, George P. C. Salmond, & Jason W. Chin, Sense Codon Reassignment Enables Viral Resistance and Encoded Polymer Synthesis, Scienceに見出され、その全体が参照により本明細書に組み込まれる。
図1
図2-1】
図2-2】
図3-1】
図3-2】
図3-3】
図4-1】
図4-2】
図5-1】
図5-2】
図5-3】
図6-1】
図6-2】
図6-3】
図7-1】
図7-2】
図8-1】
図8-2】
図9-1】
図9-2】
図9-3】
図10
図11
図12-1】
図12-2】
図13-1】
図13-2】
図13-3】
図14
図15-1】
図15-2】
図15-3】
図16-1】
図16-2】
図17
図18
図19
図20-1】
図20-2】
【配列表】
2024521175000001.app
【国際調査報告】