(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-24
(54)【発明の名称】タンパク質産生を最適化する方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20240717BHJP
C12N 15/113 20100101ALI20240717BHJP
C12N 1/21 20060101ALI20240717BHJP
C07K 2/00 20060101ALI20240717BHJP
G16B 30/00 20190101ALI20240717BHJP
C12N 15/70 20060101ALN20240717BHJP
【FI】
C12N15/09 Z
C12N15/113 Z
C12N1/21
C07K2/00
G16B30/00
C12N15/70 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024501657
(86)(22)【出願日】2022-07-14
(85)【翻訳文提出日】2024-03-04
(86)【国際出願番号】 EP2022069744
(87)【国際公開番号】W WO2023285596
(87)【国際公開日】2023-01-19
(32)【優先日】2021-07-14
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
(71)【出願人】
【識別番号】518160355
【氏名又は名称】ユナイテッド キングダム リサーチ アンド イノベーション
(74)【代理人】
【識別番号】100107984
【氏名又は名称】廣田 雅紀
(74)【代理人】
【識別番号】100182305
【氏名又は名称】廣田 鉄平
(74)【代理人】
【識別番号】100096482
【氏名又は名称】東海 裕作
(74)【代理人】
【識別番号】100131093
【氏名又は名称】堀内 真
(74)【代理人】
【識別番号】100150902
【氏名又は名称】山内 正子
(74)【代理人】
【識別番号】100141391
【氏名又は名称】園元 修一
(74)【代理人】
【識別番号】100221958
【氏名又は名称】篠田 真希恵
(74)【代理人】
【識別番号】100192441
【氏名又は名称】渡辺 仁
(72)【発明者】
【氏名】ダンケルマン ダニエル エル.
(72)【発明者】
【氏名】オーム セバスチャン ビー.
(72)【発明者】
【氏名】ビーティー アダム ティー.
(72)【発明者】
【氏名】チン ジェイソン ダブリュー.
【テーマコード(参考)】
4B065
4H045
【Fターム(参考)】
4B065AA01X
4B065AA26X
4B065AB01
4B065AC14
4B065BA01
4B065CA24
4H045AA10
4H045AA20
4H045BA50
4H045FA74
(57)【要約】
本発明は、タンパク質産生を最適化する新規の方法に関する。これらの方法は、直交性mRNAを最適化する方法、外因性tRNAを含む最適なオペロンを設計及び産生する方法、並びに外因性遺伝子、例えば直交性アミノアシル-tRNAシンテターゼ(O-aaRS)をコードする外因性遺伝子を含む最適なオペロンを設計及び産生する方法を含む。本発明はまた、前記方法の産物に関する。本発明の部分として提供されるのはまた、これらの革新技術の産物を含む宿主細胞、前記細胞を使用する方法、及びその産物である。本発明の宿主細胞は、遺伝学的に組み込まれた非標準アミノ酸を含むタンパク質及びポリペプチドの産生の向上のために使用されてもよい。
【特許請求の範囲】
【請求項1】
直交性リボソーム(O-リボソーム)による翻訳に好適な直交性メッセンジャーRNA(O-mRNA)であるメッセンジャーRNA(mRNA)を設計する方法であって、前記mRNAが5’非翻訳領域(5’UTR)及びオープンリーディングフレーム(ORF)を含み、前記方法が、
(a)前記mRNAの自由にフォールディングした状態と前記mRNAの前記O-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(O-ribo))を予測するステップ;
(b)前記5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔG
tot(O-ribo)(ΔG
tot
new(O-ribo))を予測するステップ;
(d)前記ΔG
tot
new(O-ribo)が、先行するΔG
tot(O-ribo)よりも負である場合に前記改変を許容し、
前記ΔG
tot
new(O-ribo)が、前記先行するΔG
tot(O-ribo)よりも正である場合に確率分布に従って前記改変を許容又は拒絶するステップ;及び
(e)前記許容された改変を含む前記5’UTRを含むO-mRNA配列を生成するステップ;
を含む、前記方法。
【請求項2】
ΔG
tot(O-ribo)が、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔG
unfolding)と、前記mRNAがO-リボソームに結合して、O-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔG
o-ribo binding)との和である、請求項1に記載の方法。
【請求項3】
O-リボソームが直交性16S rRNAを含み、mRNAがシャインダルガルノ配列を含み、ΔG
tot(O-ribo)が、以下:
ΔG
tot(O-ribo)=(ΔG
mRNA-O-rRNA+ΔG
start+ΔG
spacing-ΔG
standby)+ΔG
unfolding
に従って予測され;
ΔG
mRNA-O-rRNAが、前記直交性16S rRNAの最後の9ヌクレオチド及び前記mRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔG
startが、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔG
spacingが、前記シャインダルガルノ配列と前記開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔG
standbyが、前記シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔG
unfoldingが、前記mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである;
請求項2に記載の方法。
【請求項4】
ΔG
tot
new(O-ribo)が先行するΔG
tot(O-ribo)よりも正である場合、前記ΔG
tot
new(O-ribo)と前記ΔG
tot(O-ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、請求項1~3のいずれかに記載の方法。
【請求項5】
改変がそれに従って許容又は拒絶される確率分布が、
【数1】
であり、T
SAがシミュレートされたアニーリング温度である、請求項1~4のいずれかに記載の方法。
【請求項6】
T
SAが、5~20%の許容率を維持するように調整される、請求項5に記載の方法。
【請求項7】
第2のリボソーム(2
nd-リボソーム)も含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計するための、請求項1~6のいずれかに記載の方法であって、
ステップ(a)が、前記mRNAの自由にフォールディングした状態と前記mRNAの前記2
nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(2
nd-ribo))を予測することを含み;
ステップ(c)が、改変後の新たなΔG
tot(2
nd-ribo)(ΔG
tot
new(2
nd-ribo)を予測することを含み;
ステップ(d)が、ΔG
tot
new(O-ribo)が先行するΔG
tot(O-ribo)よりも負であり、前記ΔG
tot
new(2
nd-ribo)が前記先行するΔG
tot(2
nd-ribo)よりも正である場合に前記改変を許容し、
前記ΔG
tot
new(O-ribo)が前記先行するΔG
tot(O-ribo)よりも正である場合又は前記ΔG
tot
new(2
nd-ribo)が前記先行するΔG
tot(2
nd-ribo)よりも負である場合に確率分布に従って前記改変を許容又は拒絶することを含む;
前記方法。
【請求項8】
第2のリボソーム(2
nd-リボソーム)も含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、前記mRNAが5’UTR及びORFを含み、前記方法が、
(a)前記mRNAの自由にフォールディングした状態と前記O-mRNAの前記O-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(O-ribo))を予測し、前記mRNAの前記自由にフォールディングした状態と前記mRNAの前記2
nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(2
nd-ribo))を予測するステップ;
(b)前記5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔG
tot(O-ribo)(ΔG
tot
new(O-ribo))及び新たなΔG
tot(2
nd-ribo)(ΔG
tot
new(2
nd-ribo)を予測するステップ;
(d)前記ΔG
tot
new(O-ribo)が、先行するΔG
tot(O-ribo)よりも負であり、前記ΔG
tot
new(2
nd-ribo)が前記先行するΔG
tot(2
nd-ribo)よりも正である場合に前記改変を許容し、
前記ΔG
tot
new(O-ribo)が、前記先行するΔG
tot(O-ribo)よりも正である場合又は前記ΔG
tot
new(2
nd-ribo)が前記先行するΔG
tot(2
nd-ribo)よりも負である場合に確率分布に従って前記改変を許容又は拒絶するステップ;及び
(e)前記許容された改変を含む前記5’UTRを含むO-mRNA配列を生成するステップ;
を含む、前記方法。
【請求項9】
ΔG
tot(2
nd-ribo)が、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔG
unfolding)と、前記mRNAが2
nd-リボソームに結合して、2
nd-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔG
2nd ribo binding)との和である、請求項7又は8に記載の方法。
【請求項10】
2
nd-リボソームが16S rRNAを含み、mRNAがシャインダルガルノ配列を含み、ΔG
tot(2
nd-ribo)が、以下:
ΔG
tot(2
nd-ribo)=(ΔG
mRNA-2nd-rRNA+ΔG
start+ΔG
spacing-ΔG
standby)+ΔG
unfolding
に従って予測され;
ΔG
mRNA-2nd-rRNAが、前記16S rRNAの最後の9ヌクレオチド及び前記mRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔG
startが、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔG
spacingが、前記シャインダルガルノ配列と前記開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔG
standbyが、前記シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔG
unfoldingが、前記mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである;
請求項9に記載の方法。
【請求項11】
ΔG
tot
new(O-ribo)が、先行するΔG
tot(O-ribo)よりも正であるか、又はΔG
tot
new(2
nd-ribo)が、先行するΔG
tot(2
nd-ribo)よりも負である場合、前記ΔG
tot
new(O-ribo)と前記ΔG
tot(O-ribo)との間又は前記ΔG
tot
new(2
nd-ribo)と前記ΔG
tot(2
nd-ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、請求項7~10のいずれかに記載の方法。
【請求項12】
ステップ(a)が、式:
ΔG
tot(opt)=ΔG
tot(O-ribo)-X*ΔG
tot(2
nd-ribo)
に従ってΔG
tot(opt)を算出することを含み;
ステップ(c)が、式:
ΔG
tot
new(opt)=ΔG
tot
new(O-ribo)-X*ΔG
tot
new(2
nd-ribo)
に従ってΔG
tot
new(opt)を算出することを含み;
ステップ(d)が、前記ΔG
tot
new(opt)が前記先行するΔG
tot(opt)よりも負である場合に改変を許容し、
前記ΔG
tot
new(opt)が前記先行するΔG
tot(opt)よりも正である場合に確率分布に従って前記改変を許容又は拒絶すること
を含み;
Xが0.1~2であるか、又はXが0.5である;
請求項7~11のいずれかに記載の方法。
【請求項13】
ΔG
tot
new(opt)が先行するΔG
tot(opt)よりも正である場合、前記ΔG
tot
new(opt)と前記ΔG
tot(opt)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、請求項12に記載の方法。
【請求項14】
改変がそれに従って許容又は拒絶される確率分布が、
【数2】
であり、T
SAがシミュレートされたアニーリング温度である、請求項12又は13に記載の方法。
【請求項15】
T
SAが、5~20%の許容率を維持するように調整される、請求項14に記載の方法。
【請求項16】
改変が、単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む、請求項1~15のいずれかに記載の方法。
【請求項17】
ステップ(b)が、5’UTR中に改変を導入すること、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換することを含み;
ステップ(e)が、許容された改変を含む前記5’UTR及び前記ORFを含むO-mRNA配列を生成することを含む;
請求項1~16のいずれかに記載の方法。
【請求項18】
ステップ(b)が、単一のヌクレオチドの変化、挿入、若しくは欠失を含む改変を5’UTR中に導入すること、又はORF内のコドン2~12のいずれか1つを同義コドンと交換することを含む、請求項17に記載の方法。
【請求項19】
ステップ(b)~(d)が、少なくとも200、300、400、500、1000、5000、又は10000回反復される、請求項1~18のいずれかに記載の方法。
【請求項20】
ステップ(b)~(d)が、少なくとも10、50、100、250、又は500回の連続する反復がより負のΔG
tot
new(O-ribo)につながらなくなるまで反復される、請求項1~18のいずれかに記載の方法。
【請求項21】
ステップ(b)~(d)が、少なくとも10、50、100、250、又は500回の連続する反復がより負のΔG
tot
new(O-ribo)又はより正のΔG
tot
new(2
nd-ribo)につながらなくなるまで反復される、請求項7~18のいずれかに記載の方法。
【請求項22】
ステップ(b)~(d)が、少なくとも10、50、100、250、又は500回の連続する反復がより負のΔG
tot
new(opt)につながらなくなるまで反復される、請求項12~18のいずれかに記載の方法。
【請求項23】
ステップ(a)の5’UTRが、35ヌクレオチド長であるか;又は改変が、開始コドンに最も近接した5’UTRの35ヌクレオチドのいずれかにある;
請求項1~22のいずれかに記載の方法。
【請求項24】
ステップ(a)の5’UTRが、ランダムに生成された核酸の配列によるものである、請求項1~23のいずれかに記載の方法。
【請求項25】
ステップ(a)の5’UTRが、野生型シャインダルガルノ配列を含む、請求項1~24のいずれかに記載の方法。
【請求項26】
O-リボソームが、直交性アンチシャインダルガルノ配列を含み、ステップ(a)の5’UTRが、前記直交性アンチシャインダルガルノ配列に完全に相補的であることが予測される直交性シャインダルガルノ配列(O-SD)を含む、請求項1~24のいずれかに記載の方法。
【請求項27】
ステップ(b)が、O-SDの5ヌクレオチドコア中に改変を導入することを含まない、請求項26に記載の方法。
【請求項28】
シャインダルガルノ配列が、ORFの開始コドンからの5ヌクレオチドである、請求項25~27のいずれかに記載の方法。
【請求項29】
2
ndリボソームが野生型リボソームである、請求項1~28のいずれかに記載の方法。
【請求項30】
2
ndリボソームが、第1のO-リボソームとは異なるO-リボソームである、請求項1~28のいずれかに記載の方法。
【請求項31】
コンピューター上で実行される、請求項1~30のいずれかに記載の方法。
【請求項32】
O-リボソームによる翻訳のための外因性タンパク質をコードする核酸配列を産生する方法であって、O-mRNAの配列が、請求項1~31のいずれかに記載の方法に従って設計され、次に、前記配列をコードする核酸分子が産生される、前記方法。
【請求項33】
直交性リボソーム(O-リボソーム)による翻訳のための直交性メッセンジャーRNA(O-mRNA)を設計するためのシステムであって、
プロセッサー;及び
請求項1~31のいずれかに記載の方法を実施するための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体;
を含む、前記システム。
【請求項34】
コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、前記コンピューターシステムが請求項1~31のいずれかに記載の方法を実行させるプログラムコードを記憶する非一時的な機械可読媒体を含む、コンピュータープログラム製品。
【請求項35】
内因性tRNAをコードする内因性ゲノムを含む宿主細胞中での発現のための少なくとも2つの外因性tRNAをコードするオペロンを設計する方法であって、
(i)前記少なくとも2つの外因性tRNAの配置の並べ替えを生成するステップ;
(ii)前記内因性ゲノム内で、前記少なくとも2つの外因性tRNAの各々の並べ替え内の外因性tRNAの各々の隣接するペアに対して最も高いレベルの配列同一性を有する内因性tRNAの隣接するペアを同定するステップ;
(iii)内因性tRNAの前記同定された隣接するペアの各々の間の前記内因性ゲノム中の遺伝子間領域を同定するステップ;
(iv)前記少なくとも2つの外因性tRNAの各々の並べ替えをコードし、前記外因性tRNAの各々の関連付けられた隣接するペアの間に位置付けられる前記同定された遺伝子間領域を含む複数の配列を生成するステップ;及び
(v)前記少なくとも2つの外因性tRNAをコードする前記オペロン中に含めるための前記複数の配列からの配列を選択するステップ;
を含む、前記方法。
【請求項36】
ステップ(v)の選択が、複数の配列の順位付けされたリストから行われ、前記順位付けされたリストが、少なくとも2つの外因性tRNAと、遺伝子間領域を定義するために使用された対応する内因性tRNAとの間の配列同一性の和に基づいて前記複数の配列の各々を順位付けすることにより作出される、請求項35に記載の方法。
【請求項37】
ステップ(ii)の配列同一性が、内因性tRNAのアクセプターステム配列を外因性tRNAのアクセプターステム配列と比較することにより算出される、請求項35又は36に記載の方法。
【請求項38】
tRNAの最初の7ヌクレオチドと、CCA末端を含まない最後の8ヌクレオチドとが比較される、請求項37に記載の方法。
【請求項39】
考慮される最小遺伝子間領域が、5、10、15、20、又は25塩基対であり、最大遺伝子間領域が、50、75、100、125、又は150塩基対である、請求項35~38のいずれかに記載の方法。
【請求項40】
考慮される最小遺伝子間領域が10塩基対であり、最大遺伝子間領域が100塩基対である、請求項39に記載の方法。
【請求項41】
少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つの外因性tRNAをコードするオペロンを設計するための方法である、請求項35~40のいずれかに記載の方法。
【請求項42】
コンピューター上で実行される、請求項35~41のいずれかに記載の方法。
【請求項43】
少なくとも2つの外因性tRNAを含むオペロンをコードする核酸配列を産生する方法であって、前記核酸の前記配列が、請求項35~42のいずれかに記載の方法に従って設計され、次に、前記配列をコードする核酸が産生される、前記方法。
【請求項44】
少なくとも2つの外因性tRNAを含むオペロンを設計するためのシステムであって、
プロセッサー;及び
請求項35~42のいずれかに記載の方法を実施するための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体;
を含む、前記システム。
【請求項45】
コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、前記コンピューターシステムが請求項35~42のいずれかに記載の方法を実行させるプログラムコードを記憶する非一時的な機械可読媒体を含む、コンピュータープログラム製品。
【請求項46】
請求項43に記載の方法により得られた又は得ることができるオペロンを含む、核酸。
【請求項47】
内因性ゲノムを含む宿主細胞であって、前記宿主細胞が、少なくとも2つの外因性tRNAを含むオペロンをコードする核酸を含み、外因性tRNAの各々のペアの間の核酸配列が、内因性ゲノムに由来する遺伝子間配列である、前記宿主細胞。
【請求項48】
オペロンが、請求項43に記載の方法により得られた又は得ることができる、請求項47に記載の宿主細胞。
【請求項49】
宿主細胞が原核細胞である、請求項35~43のいずれかに記載の方法又は請求項47若しくは48に記載の宿主細胞。
【請求項50】
原核細胞が細菌細胞である、請求項49に記載の方法又は宿主細胞。
【請求項51】
細菌細胞が大腸菌であり、内因性ゲノムが大腸菌ゲノムである、請求項50に記載の方法又は宿主細胞。
【請求項52】
宿主細胞中での発現のための少なくとも2つの外因性ORFを含むオペロンを設計する方法であって、
(i)前記少なくとも2つの外因性ORFの各々のための複数の5’UTR配列を生成するステップであって、各々の5’UTR配列が、前記5’UTR配列及び前記外因性ORFを含むmRNAの自由にフォールディングした状態と、前記mRNAのリボソームに結合した開始適格状態との間の負の予測される自由エネルギー差(ΔG
tot(ribo))について最適化されている、ステップ;
(ii)前記5’UTRが最適化された前記外因性ORFに対して5’に位置付けられ、前記少なくとも2つの外因性ORFの残りの各々の外因性ORFに対して3’に位置付けられた場合の前記5’UTR配列の各々についてのΔG
tot(ribo)を予測するステップ;並びに
(iii)前記5’UTR配列及び前記少なくとも2つの外因性ORFの配置を選択するステップ;
を含む、前記方法。
【請求項53】
ステップ(iii)が、5’UTR配列及び少なくとも2つの外因性ORFの配置を選択することを含む、請求項52に記載の方法であって、
すべての5’UTR/外因性ORFペアについてのΔG
tot(ribo)の和が最も負であり;及び/又は
すべての5’UTR/外因性ORFペアについての前記ΔG
tot(ribo)の平均値が最も負であり;及び/又は
各々の5’UTR/外因性ORFペアが、標的ΔG
tot(ribo)よりも負のΔG
tot(ribo)を有する;
前記方法。
【請求項54】
ステップ(i)が、少なくとも2つの外因性ORFの各々のための2、3、4、5、又は6以上の5’UTR配列を生成することを含む、請求項52又は53に記載の方法。
【請求項55】
少なくとも2つの外因性ORFの少なくとも1つ又はすべてがアミノアシル-tRNAシンテターゼである、請求項52~54のいずれかに記載の方法。
【請求項56】
少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つの外因性ORFをコードするオペロンを設計するための方法である、請求項52~55のいずれかに記載の方法。
【請求項57】
ΔG
tot(ribo)が、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔG
unfolding)と、前記mRNAがリボソームに結合して、前記リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔG
ribo binding)との和である、請求項52~56のいずれかに記載の方法。
【請求項58】
5’UTRがシャインダルガルノ配列を含み、ΔG
tot(ribo)が、以下:
ΔG
tot(ribo)=(ΔG
mRNA-rRNA+ΔG
start+ΔG
spacing-ΔG
standby)+ΔG
unfolding
に従って予測され;
ΔG
mRNA-rRNAが、16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔG
startが、外因性ORFをコードする配列の開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔG
spacingが、前記シャインダルガルノ配列と前記外因性ORFをコードする前記配列の前記開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔG
standbyが、前記シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔG
unfoldingが、前記mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである;
請求項57に記載の方法。
【請求項59】
ステップ(i)が、
(a)5’UTR中に改変を導入すること;
(b)改変後の新たなΔG
tot(ribo)(ΔG
tot
new(ribo))を予測すること;
(c)前記ΔG
tot
new(ribo)が、先行するΔG
tot(ribo)よりも負である場合に前記改変を許容し、
前記ΔG
tot
new(ribo)が、前記先行するΔG
tot(ribo)よりも正である場合に確率分布に従って前記改変を許容又は拒絶すること;及び
(d)前記許容された改変を含む5’UTR配列を生成すること;
を含む、請求項52~58のいずれかに記載の方法。
【請求項60】
ΔG
tot
new(ribo)、が先行するΔG
tot(ribo)よりも正である場合、前記ΔG
tot
new(ribo)と前記ΔG
tot(ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、請求項59に記載の方法。
【請求項61】
改変がそれに従って許容又は拒絶される確率分布が、
【数3】
であり、T
SAがシミュレートされたアニーリング温度である、請求項59又は60に記載の方法。
【請求項62】
T
SAが、5~20%の許容率を維持するように調整される、請求項61に記載の方法。
【請求項63】
改変が、単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む、請求項59~62のいずれかに記載の方法。
【請求項64】
ステップ(a)が、5’UTR中に改変を導入すること、又は外因性ORFをコードする配列内でコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換することを含み;
ステップ(d)が、許容された改変を含む前記5’UTR及び前記ORFを含む配列を生成することを含む;
請求項59~63のいずれかに記載の方法。
【請求項65】
ステップ(a)が、単一のヌクレオチドの変化、挿入、若しくは欠失を含む改変を5’UTR中に導入すること、又はORF内のコドン2~12のいずれか1つを同義コドンと交換することを含む、請求項64に記載の方法。
【請求項66】
ステップ(a)~(c)が、少なくとも200、300、400、500、1000、5000、又は10000回反復される、請求項59~65のいずれかに記載の方法。
【請求項67】
ステップ(a)~(c)が、少なくとも10、50、100、250、又は500回の連続する反復がより負のΔG
tot
new(ribo)につながらなくなるまで反復される、請求項59~65のいずれかに記載の方法。
【請求項68】
コンピューター上で実行される、請求項52~67のいずれかに記載の方法。
【請求項69】
少なくとも2つの外因性ORFを含むポリシストロン性オペロンをコードする核酸配列を産生する方法であって、前記核酸の前記配列が、請求項52~68のいずれかに記載の方法に従って設計され、次に、前記配列に従って核酸が産生される、前記方法。
【請求項70】
少なくとも2つの外因性ORFを含むポリシストロン性オペロンを設計するためのシステムであって、
プロセッサー;及び
請求項52~68のいずれかに記載の方法を実施するための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体;
を含む、前記システム。
【請求項71】
コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、前記コンピューターシステムが請求項52~68のいずれかに記載の方法を実行させるプログラムコードを記憶する非一時的な機械可読媒体を含む、コンピュータープログラム製品。
【請求項72】
請求項69に記載の方法により得られた又は得ることができるオペロンを含む、核酸。
【請求項73】
請求項69に記載の方法により得られた又は得ることができるオペロンをコードする核酸を含む、宿主細胞。
【請求項74】
宿主細胞が原核細胞である、請求項52~69のいずれかに記載の方法又は請求項73に記載の宿主細胞。
【請求項75】
原核細胞が細菌細胞である、請求項74に記載の方法又は宿主細胞。
【請求項76】
細菌細胞が大腸菌であり、内因性ゲノムが大腸菌ゲノムである、請求項75に記載の方法又は宿主細胞。
【請求項77】
外因性タンパク質をコードするO-mRNAをコードする核酸配列であって、前記O-mRNAが、請求項32に記載の方法により得られた又は得ることができるものであり、前記O-mRNAが少なくとも2つのタイプの直交性コドンを含む、核酸配列;
少なくとも2つの直交性tRNAをコードするO-tRNAオペロンを含む核酸配列であって、前記少なくとも2つの直交性tRNAが、前記少なくとも2つのタイプの直交性コドンをデコードする能力を有し、前記オペロンが、請求項43に記載の方法により得られた又は得ることができる、核酸配列;
少なくとも2つのO-aaRSをコードする直交性アミノアシル-tRNAシンテターゼ(O-aaRS)を含む核酸配列であって、前記少なくとも2つのO-aaRSが、前記少なくとも2つの直交性tRNAとO-aaRS - O-tRNAペアを形成し、前記オペロンが、請求項69に記載の方法により得られた又は得ることができる、核酸配列;及び
直交性リボソーム;
を含む、宿主細胞。
【請求項78】
O-mRNAが少なくとも3つのタイプの直交性コドンを含み;
O-tRNAオペロンが、前記少なくとも3つの直交性コドンをデコードする能力を有する少なくとも3つの直交性tRNAをコードし;
O-aaRSオペロンが、前記少なくとも3つの直交性tRNAとO-aaRS-O-tRNAペアを形成する少なくとも3つのO-aaRSをコードする;
請求項77に記載の宿主細胞。
【請求項79】
O-mRNAが少なくとも4つのタイプの直交性コドンを含み;
O-tRNAオペロンが、前記少なくとも4つの直交性コドンをデコードする能力を有する少なくとも4つの直交性tRNAをコードし;
O-aaRSオペロンが、前記少なくとも4つの直交性tRNAとO-aaRS-O-tRNAペアを形成する少なくとも4つのO-aaRSをコードする;
請求項77に記載の宿主細胞。
【請求項80】
原核細胞である、請求項77~79のいずれかに記載の宿主細胞。
【請求項81】
原核細胞が細菌細胞である、請求項80に記載の宿主細胞。
【請求項82】
細菌細胞が大腸菌である、請求項81に記載の宿主細胞。
【請求項83】
ポリペプチドを産生する方法であって、
請求項77~82のいずれかに記載の宿主細胞を用意するステップ;
第1の非標準アミノ酸の存在下で前記宿主細胞をインキュベートするステップであって、前記第1の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
前記宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介する前記ポリペプチド中への前記第1の非標準アミノ酸の組込みを可能とするステップ;
を含む、前記方法。
【請求項84】
第2の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、前記第2の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
前記宿主細胞をインキュベートして、O-aaRS-O-tRNAペアを介するポリペプチド中への前記第2の非標準アミノ酸の組込みを可能とするステップ;
を含む、請求項83に記載の方法。
【請求項85】
第3の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、前記第3の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
前記宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への前記第3の非標準アミノ酸の組込みを可能とするステップ;
を含む、請求項78に従属する請求項83又は84に記載の方法。
【請求項86】
第4の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、前記第4の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
前記宿主細胞をインキュベートして、O-aaRS-O-tRNAペアを介するポリペプチド中への前記第4の非標準アミノ酸の組込みを可能とするステップ;
を含む、請求項79に従属する請求項83~85のいずれかに記載の方法。
【請求項87】
請求項86に記載の方法により得られた又は得ることができるポリペプチド。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タンパク質産生を最適化する新規の方法に関する。これらの方法は、直交性(orthogonal)mRNAを最適化する方法、外因性tRNAを含む最適なオペロンを設計及び産生する方法、並びに外因性遺伝子、例えば直交性アミノアシル-tRNAシンテターゼ(O-aaRS、orthogonal aminoacyl-tRNA synthetase)をコードする外因性遺伝子を含む最適なオペロンを設計及び産生する方法を含む。本発明はまた、前記方法の産物に関する。本発明の部分として提供されるのはまた、これらの革新技術の産物を含む宿主細胞、前記細胞を使用する方法、及びその産物である。本発明の宿主細胞は、遺伝学的に組み込まれた非標準アミノ酸を含むタンパク質及びポリペプチドの産生の向上のために使用されてもよい。
【背景技術】
【0002】
タンパク質中への複数の別個の非標準アミノ酸(ncAA、non-canonical amino acid)の組込みを遺伝学的にコードする能力は、タンパク質機能の操作及び指向性進化のための新たな機会を提供し、生物学的発見及び生物学的プロセスの理解のための新たな戦略を可能にし、非標準バイオポリマーのコードされた細胞合成のための基礎を提供する(Chin, J.W. Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017)、de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020))。細胞中で合成されるタンパク質中に複数の別個のncAAをコードすることは、同じ細胞中での天然タンパク質合成をコードするために使用されるコドン以外に、直交性コドンを要求し;これらは、クアドルプレットコドン(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403 (2014)、Anderson, J.C. et al. An expanded genetic code with a functional quadruplet codon. Proc. Natl. Acad. Sci. U.S.A. 101, 7566-7571 (2004))、センスコドン圧縮から生じるコドン(Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514- 518 (2019)、Wang, K. et al. Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016))、及び非標準塩基を組み込むコドン(Malyshev, D.A. et al. A semi-synthetic organism with an expanded genetic alphabet. Nature509, 385-388 (2014)、Zhang, Y. et al. A semi-synthetic organism that stores and retrieves increased genetic information. Nature 551, 644-647 (2017)、Zhang, Y. et al. A semisynthetic organism engineered for the stable expansion of the genetic alphabet. Proc. Natl. Acad. Sci. U.S.A. 114, 1317-1322 (2017)、Fischer, E.C. et al. New codons for efficient production of unnatural proteins in a semisynthetic organism. Nat. Chem. Biol. 16, 570-576 (2020))を含む。直交性コドンは、操作された相互に直交性のアミノアシル-tRNAシンテターゼ(aaRS)/tRNAペアを使用してncAAに割り当てられなければならない。これらのペアは、天然の翻訳のために宿主生物により使用されるシンテターゼ及びtRNAに関して、並びに同じ細胞中でncAAを方向付けるために使用される他の直交性aaRS及びtRNAに関してそれらのアミノアシル化特異性において直交性であるべきであり;さらに、それらは、別個のncAA単量体を特異的に認識し、別個の直交性コドンをデコードするべきである(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Neumann, H., Slusarczyk, A.L. & Chin, J.W. De Novo Generation of Mutually Orthogonal Aminoacyl-tRNA Synthetase/tRNA Pairs. J. Am. Chem. Soc. 132, 2142-2144 (2010)、Chatterjee, A., Sun, S.B., Furman, J.L., Xiao, H. & Schultz, P.G. A Versatile Platform for Single- and Multiple-Unnatural Amino Acid Mutagenesis in Escherichia coli. Biochemistry 52, 1828-1837 (2013)、Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018)、Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020)、Cervettini, D. et al. Rapid discovery and evolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs. Nat. Biotechnol. 38, 989-999 (2020)、Zhang, M.S. et al. Biosynthesis and genetic encoding of phosphothreonine through parallel selection and deep sequencing. Nat. Methods 14, 729-736 (2017)、Italia, J. et al. Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. J. Am. Chem. Soc. 141, 6204-6212 (2019))。
【0003】
直交性リボソーム(O-リボソーム)は、大腸菌(Escherichia coli、E. coli)において野生型(wt)リボソームの基質ではない、直交性mRNA(O-mRNA)に対して方向付けられた非天然リボソームである。これらのリボソームは天然リボソームと並行して作動するが、直交性メッセージの5’非翻訳領域(5’UTR)内のO-リボソーム結合部位(O-RBS)にそれらを方向付ける変更をそれらのリボソームRNA中に含有する(Rackham, O. & Chin, J.W. A network of orthogonal ribosome・mRNA pairs. Nat. Chem. Biol. 1, 159-166 (2005))。O-リボソームはプロテオームの合成に関与しないので、それらは、新たなデコーディング及び新たな内因性重合機能を含む、天然リボソームによりアクセスされない新たな機能を行うために操作され得る(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007)、Schmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018))。O-riboQ1(進化型O-リボソーム)は、コグネイトtRNAを使用して、O-mRNA上のアンバーコドン及びクアドルプレットコドンを効率的にデコードし、そのため、直交性メッセージ上で選択的にデコードされる直交性コドンを提供する(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007))。
【0004】
別個のncAAを認識し、別個のコドンをデコードする、操作された相互に直交性のaaRS/tRNAペアが、タンパク質中に2又は3つの別個のncAAを組み込むために使用されている(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403 (2014)、Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018)、Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020)、Italia, J. et al. Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. J. Am. Chem. Soc. 141, 6204-6212 (2019)、Venkat, S. et al. Genetically Incorporating Two Distinct Post-translational Modifications into One Protein Simultaneously. ACS Synth. Biol. 7, 689-695 (2018))。相同的なメタノサルシナ・マゼイ(Methanosarcina mazei、Mm)又はメタノサルシナ・バルケリ(Methanosarcina barkeri、Mb)ピロリシル-tRNAは、遺伝コード拡張のための広く使用される直交性aaRS/tRNAペアである(de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020)、Chin, J.W. Expanding and Reprogramming the Genetic Code of Cells and Animals. Annu. Rev. Biochem. 83, 379-408 (2014))。本発明者らは最近、多様な生物からのPylRS/tRNAPylペアを調べ、天然のPylRS及びtRNAPyl配列は別個の特異性を有する複数のサブクラスにクラスター化することを発見し;この洞察により、本発明者らは、別個のncAAを認識し、別個のコドンをデコードする二重及び三重に直交性のPylRS/tRNAPylペアを操作することが可能となった(Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018)、Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020))。
【0005】
O(trans)-strepGFP(40TAG、136AGGA又は150AGTA)
His6(O-リボソーム結合部位(O(trans))を含有し、2つのクアドルプレットコドン(AGGA及びAGTA)並びにアンバーコドン(TAG)を含有する以前に記載された5’UTRから翻訳される
StrepGFP
His6オープンリーディングフレーム(ORF)のためのO-mRNA)のO-riboQ1媒介性翻訳を、操作された三重に直交性のPylRS/tRNA
Pylペアと組み合わせることにより、本発明者らは、組換えStrepGFP(40BocK、136NmH、150CbzK)
His6中への3つのncAAの組込みを実証した(Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020))。しかしながら、本発明者らが気付いたように(Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018)、Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020))、この発現システムからのタンパク質の収率は低く、最適化されていない。O(trans)-
strepGFP
His6及びwt RBSを含有する5’UTRを有する
strepGFP
His6オープンリーディングフレームを用いた追加の実験は、O-リボソームによるO(trans)-
strepGFP
His6の翻訳は、wtリボソームにより産生されるよりも31倍低い
StrepGFP
His6タンパク質につながることを実証した。さらに、O(trans)5’UTRを他のORFに移すこともまた、タンパク質合成のレベルの実質的な減少につながる(
図1及び補足
図1)。O(trans)5’UTR配列は、GST融合タンパク質を産生するためのコンストラクトに由来し、該コンストラクトにおいて、O(trans)5’UTR配列は、wt RBSを含有する5’UTRからのO-リボソーム非依存的翻訳と同等のレベルでのO-リボソーム依存的翻訳を指令した(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007))。これらの観察は、O(trans)配列は一部のORFについて効率的な直交翻訳を指令するが、ORFの効率的な翻訳のための一般的な解決策を提供しないことを実証した。
【0006】
そのため、直交翻訳においてタンパク質収率を最大化するO-mRNAの作出のための一般的な解決策が要求されている。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Chin, J.W. Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017)
【非特許文献2】de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020)
【非特許文献3】Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)
【非特許文献4】Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403 (2014)
【非特許文献5】Anderson, J.C. et al. An expanded genetic code with a functional quadruplet codon. Proc. Natl. Acad. Sci. U.S.A. 101, 7566-7571 (2004)
【非特許文献6】Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514- 518 (2019)
【非特許文献7】Wang, K. et al. Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016)
【非特許文献8】Malyshev, D.A. et al. A semi-synthetic organism with an expanded genetic alphabet. Nature509, 385-388 (2014)
【非特許文献9】Zhang, Y. et al. A semi-synthetic organism that stores and retrieves increased genetic information. Nature 551, 644-647 (2017)
【非特許文献10】Zhang, Y. et al. A semisynthetic organism engineered for the stable expansion of the genetic alphabet. Proc. Natl. Acad. Sci. U.S.A. 114, 1317-1322 (2017)
【非特許文献11】Fischer, E.C. et al. New codons for efficient production of unnatural proteins in a semisynthetic organism. Nat. Chem. Biol. 16, 570-576 (2020)
【非特許文献12】Neumann, H., Slusarczyk, A.L. & Chin, J.W. De Novo Generation of Mutually Orthogonal Aminoacyl-tRNA Synthetase/tRNA Pairs. J. Am. Chem. Soc. 132, 2142-2144 (2010)
【非特許文献13】Chatterjee, A., Sun, S.B., Furman, J.L., Xiao, H. & Schultz, P.G. A Versatile Platform for Single- and Multiple-Unnatural Amino Acid Mutagenesis in Escherichia coli. Biochemistry 52, 1828-1837 (2013)
【非特許文献14】Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018)
【非特許文献15】Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020)
【非特許文献16】Cervettini, D. et al. Rapid discovery and evolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs. Nat. Biotechnol. 38, 989-999 (2020)
【非特許文献17】Zhang, M.S. et al. Biosynthesis and genetic encoding of phosphothreonine through parallel selection and deep sequencing. Nat. Methods 14, 729-736 (2017)
【非特許文献18】Italia, J. et al. Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. J. Am. Chem. Soc. 141, 6204-6212 (2019)
【非特許文献19】Rackham, O. & Chin, J.W. A network of orthogonal ribosome・mRNA pairs. Nat. Chem. Biol. 1, 159-166 (2005)
【非特許文献20】Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007)
【非特許文献21】Schmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018)
【非特許文献22】Venkat, S. et al. Genetically Incorporating Two Distinct Post-translational Modifications into One Protein Simultaneously. ACS Synth. Biol. 7, 689-695 (2018)
【非特許文献23】Chin, J.W. Expanding and Reprogramming the Genetic Code of Cells and Animals. Annu. Rev. Biochem. 83, 379-408 (2014)
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明者らは、タンパク質産生を最適化する高度に有効な方法を本明細書において提供する。
【課題を解決するための手段】
【0009】
本発明の態様において、直交性リボソーム(O-リボソーム)による翻訳に好適な直交性メッセンジャーRNA(O-mRNA)であるメッセンジャーRNA(mRNA)を設計する方法であって、mRNAが5’非翻訳領域(5’UTR)及びオープンリーディングフレーム(ORF)を含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測するステップ;
(b)5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtotnew(O-ribo))を予測するステップ;
(d)前記ΔGtotnew(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変を許容し、
前記ΔGtotnew(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;及び
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。
【0010】
ΔGtot(O-ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAがO-リボソームに結合して、O-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔGo-ribo binding)との和であってもよい。
【0011】
O-リボソームは直交性16S rRNAを含んでもよく、mRNAはシャインダルガルノ配列を含んでもよく、ΔGtot(O-ribo)は、以下:
ΔGtot(O-ribo)=(ΔGmRNA-O-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
に従って予測されてもよく;
ΔGmRNA-O-rRNAは、直交性16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0012】
ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合、前記ΔGtot
new(O-ribo)と前記ΔGtot(O-ribo)との間の差異の規模は許容の確率を決定してもよく、より小さい規模は、より大きい規模と比較して許容のより高い可能性と関連付けられる。
【0013】
改変がそれに従って許容又は拒絶される確率分布は、
【数1】
であってもよく、T
SAはシミュレートされたアニーリング温度である。
【0014】
TSAは、5~20%の許容率を維持するように調整されてもよい。
【0015】
実施形態において、方法は、第2のリボソーム(2nd-リボソーム)も含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計するための方法であり、
ステップ(a)は、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測することを含み;
ステップ(c)は、改変後の新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測することを含み;
ステップ(d)は、前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶することである。
【0016】
特定の実施形態において、第2のリボソーム(2nd-リボソーム)も含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測するステップ;
(b)5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶するステップ;並びに
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。
【0017】
ΔGtot(2nd-ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAが2nd-リボソームに結合して、2nd-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔG2nd ribo binding)との和であってもよい。
【0018】
2nd-リボソームは16S rRNAを含んでもよく、mRNAはシャインダルガルノ配列を含んでもよく、ΔGtot(2nd-ribo)は、以下:
ΔGtot(2nd-ribo)=(ΔGmRNA-2nd-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
に従って予測されてもよく;
ΔGmRNA-2nd-rRNAは、16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0019】
実施形態において、ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正であるか、又はΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合、前記ΔGtot
new(O-ribo)と前記ΔGtot(O-ribo)との間又は前記ΔGtot
new(2nd-ribo)と前記ΔGtot(2nd-ribo)との間の差異の規模は許容の確率を決定し、より小さい規模は、より大きい規模と比較して許容のより高い可能性と関連付けられる。
【0020】
実施形態において、
ステップ(a)は、式:ΔGtot(opt)=ΔGtot(O-ribo)-X*ΔGtot(2nd-ribo)に従ってΔGtot(opt)を算出することを含み;
ステップ(c)は、式:ΔGtot
new(opt)=ΔGtot
new(O-ribo)-X*ΔGtot
new(2nd-ribo)に従ってΔGtot
new(opt)を算出することを含み;
ステップ(d)は、前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に改変を許容し、
前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って改変を許容又は拒絶することであり;
Xは0.1~2であるか、又はXは0.5である。
【0021】
実施形態において、ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合、前記ΔGtot
new(opt)と前記ΔGtot(opt)との間の差異の規模は許容の確率を決定し、より小さい規模は、より大きい規模と比較して許容のより高い可能性と関連付けられる。
【0022】
改変がそれに従って許容又は拒絶される確率分布は、
【数2】
であってもよく、T
SAはシミュレートされたアニーリング温度である。
【0023】
TSAは、5~20%の許容率を維持するように調整されてもよい。
【0024】
改変は、単一のヌクレオチドの変化、挿入、若しくは欠失であってもよいか又はそれを含んでもよい。
【0025】
実施形態において、ステップ(b)は、5’UTR中に改変を導入すること、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換することを含み;ステップ(e)は、許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成することを含む。
【0026】
実施形態において、ステップ(b)は、単一のヌクレオチドの変化、挿入、若しくは欠失を含む改変を5’UTR中に導入すること、又はORF内のコドン2~12のいずれか1つを同義コドンと交換することを含む。
【0027】
実施形態において、ステップ(b)~(d)は、少なくとも200、300、400、500、1000、5000、若しくは10000回反復されるか;又はステップ(b)~(d)は、少なくとも10、50、100、250、若しくは500回の連続する反復がより負のΔGtot
new(O-ribo)につながらなくなるまで反復されるか;又はステップ(b)~(d)は、少なくとも10、50、100、250、若しくは500回の連続する反復がより負のΔGtot
new(O-ribo)若しくはより正のΔGtot
new(2nd-ribo)につながらなくなるまで反復されるか;又はステップ(b)~(d)は、少なくとも10、50、100、250、若しくは500回の連続する反復がより負のΔGtot
new(opt)につながらなくなるまで反復される。
【0028】
実施形態において、ステップ(a)の5’UTRは35ヌクレオチド長であるか;又は改変は、開始コドンに最も近接した5’UTRの35ヌクレオチドのいずれかにある。ステップ(a)の5’UTRは、ランダムに生成された核酸の配列によるものであってもよい。ステップ(a)の5’UTRは野生型シャインダルガルノ配列を含んでもよい。
【0029】
O-リボソームは直交性アンチシャインダルガルノ配列を含んでもよく、ステップ(a)の5’UTRは、直交性アンチシャインダルガルノ配列に完全に相補的であることが予測される直交性シャインダルガルノ配列(O-SD)を含んでもよい。
【0030】
一部の実施形態において、ステップ(b)は、O-SDの5ヌクレオチドコア中に改変を導入することを含まない。
【0031】
シャインダルガルノ配列はORFの開始コドンからの5ヌクレオチドであってもよい。
【0032】
実施形態において、2ndリボソームは野生型リボソームであるか、又は2ndリボソームは、第1のO-リボソームとは異なるO-リボソームである。
【0033】
O-mRNAを設計する方法はコンピューター上で実行されてもよい。
【0034】
本発明の態様において、O-リボソームによる翻訳のための外因性タンパク質をコードする核酸配列を産生する方法であって、O-mRNAの配列が、本明細書に開示されるO-mRNAを設計する任意の方法に従って設計され、次に前記配列をコードする核酸分子が産生される、方法が提供される。
【0035】
本発明の態様において、直交性リボソーム(O-リボソーム)による翻訳のための直交性メッセンジャーRNA(O-mRNA)を設計するためのシステムであって、
プロセッサー;及び
本明細書に開示されるO-mRNAを設計する任意の方法を実施するための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体
を含む、システムが提供される。
【0036】
本発明の態様において、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本明細書に開示されるO-mRNAを設計する任意の方法を実行させるプログラムコードを保存する非一時的な機械可読媒体を含むコンピュータープログラム製品が提供される。
【0037】
本発明の別の態様において、内因性tRNAをコードする内因性ゲノムを含む宿主細胞中での発現のための少なくとも2つの外因性tRNAをコードするオペロンを設計する方法であって、
(i)少なくとも2つの外因性tRNAの配置の並べ替えを生成するステップ;
(ii)内因性ゲノム内で、少なくとも2つの外因性tRNAの各々の並べ替え内の外因性tRNAの各々の隣接するペアに対して最も高いレベルの配列同一性を有する内因性tRNAの隣接するペアを同定するステップ;
(iii)内因性tRNAの同定された隣接するペアの各々の間の内因性ゲノム中の遺伝子間領域を同定するステップ;
(iv)少なくとも2つの外因性tRNAの各々の並べ替えをコードし、外因性tRNAの各々の関連付けられた隣接するペアの間に位置付けられる同定された遺伝子間領域を含む複数の配列を生成するステップ;及び
(v)少なくとも2つの外因性tRNAをコードするオペロン中に含めるための前記複数の配列からの配列を選択するステップ
を含む、方法が提供される。
【0038】
ステップ(v)の選択は、複数の配列の順位付けされたリストからなされてもよく、順位付けされたリストは、少なくとも2つの外因性tRNAと、遺伝子間領域を定義するために使用された対応する内因性tRNAとの間の配列同一性の和に基づいて複数の配列の各々を順位付けすることにより作出される。
【0039】
ステップ(ii)の配列同一性は、内因性tRNAのアクセプターステム配列を外因性tRNAのアクセプターステム配列と比較することにより算出されてもよい。tRNAの最初の7ヌクレオチド、及びCCA末端を含まない最後の8ヌクレオチドが比較されてもよい。
【0040】
考慮される最小遺伝子間領域は、5、10、15、20、又は25塩基対であってもよく、最大遺伝子間領域は、50、75、100、125、又は150塩基対であってもよい。実施形態において、考慮される最小遺伝子間領域は10塩基対であり、最大は100塩基対である。
【0041】
方法は、少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つの外因性tRNAをコードするオペロンを設計するための方法であってもよい。
【0042】
少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれも、コンピューター上で実行されてもよい。
【0043】
本発明の態様において、少なくとも2つの外因性tRNAを含むオペロンをコードする核酸配列を産生する方法であって、核酸の配列が、本明細書に開示される少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれかに従って設計され、次に、前記配列をコードする核酸が産生される、方法が提供される。
【0044】
本発明の態様において、少なくとも2つの外因性tRNAを含むオペロンを設計するためのシステムであって、
プロセッサー;及び
本明細書に開示される少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれかを行うための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体
を含む、システムが提供される。
【0045】
本発明の態様において、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本明細書に開示される少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれかを実行させるプログラムコードを保存する非一時的な機械可読媒体を含む、コンピュータープログラム製品が提供される。
【0046】
本発明の態様において、本明細書に開示される少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれかにより得られるか又は得ることが可能であるオペロンを含む、核酸が提供される。
【0047】
本発明の態様において、内因性ゲノムを含む宿主細胞であって、宿主細胞が、少なくとも2つの外因性tRNAを含むオペロンをコードする核酸を含み、外因性tRNAの各々のペアの間の核酸配列が、内因性ゲノムに由来する遺伝子間配列である、宿主細胞が提供される。
【0048】
宿主細胞は、本明細書に開示される少なくとも2つの外因性tRNAをコードするオペロンを設計する方法のいずれかにより得られるか又は得ることが可能であるオペロンを含んでもよい。
【0049】
宿主細胞は、原核細胞、例えば細菌細胞であってもよい。細菌細胞は大腸菌であってもよく、内因性ゲノムは大腸菌ゲノムであってもよい。
【0050】
本発明の別の態様において、宿主細胞中での発現のための少なくとも2つの外因性ORFを含むオペロンを設計する方法であって、
(i)少なくとも2つの外因性ORFの各々のための複数の5’UTR配列を生成するステップであって、各々の5’UTR配列が、前記5’UTR配列及び外因性ORFを含むmRNAの自由にフォールディングした状態と、前記mRNAのリボソームに結合した開始適格状態との間の負の予測される自由エネルギー差(ΔGtot(ribo))について最適化されている、ステップ;
(ii)前記5’UTRが最適化された外因性ORFに対して5’に位置付けられ、少なくとも2つの外因性ORFの残りの各々の外因性ORFに対して3’に位置付けられた場合の5’UTR配列の各々についてのΔGtot(ribo)を予測するステップ;並びに
(iii)5’UTR配列及び少なくとも2つの外因性ORFの配置を選択するステップ
を含む、方法が提供される。
【0051】
ステップ(iii)は、5’UTR配列及び少なくとも2つの外因性ORFの配置を選択することを含んでもよく、
すべての5’UTR/外因性ORFペアについてのΔGtot(ribo)の和は最も負であり;及び/又は
すべての5’UTR/外因性ORFペアについてのΔGtot(ribo)の平均値は最も負であり;及び/又は
各々の5’UTR/外因性ORFペアは、標的ΔGtot(ribo)よりも負のΔGtot(ribo)を有する。
【0052】
ステップ(i)は、少なくとも2つの外因性ORFの各々のための2、3、4、5、又は6以上の5’UTR配列を生成することを含んでもよい。
【0053】
実施形態において、少なくとも2つの外因性ORFの少なくとも1つ又はすべてはアミノアシル-tRNAシンテターゼである。
【0054】
方法は、少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つの外因性ORFをコードするオペロンを設計するための方法であってもよい。
【0055】
ΔGtot(ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAがリボソームに結合して、リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔGribo binding)との和であってもよい。
【0056】
ΔGtot(ribo)は、以下:
ΔGtot(ribo)=(ΔGmRNA-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
に従って予測されてもよく;
ΔGmRNA-rRNAは、16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、外因性ORFをコードする配列の開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と外因性ORFをコードする配列の開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0057】
実施形態において、ステップ(i)は、
(a)5’UTR中に改変を導入すること;
(b)改変後の新たなΔGtot(ribo)(ΔGtot
new(ribo))を予測すること;
(c)前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶すること;及び
(d)許容された改変を含む5’UTR配列を生成すること
を含む。
【0058】
実施形態において、ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも正である場合、前記ΔGtot
new(ribo)と前記ΔGtot(ribo)との間の差異の規模は許容の確率を決定し、より小さい規模は、より大きい規模と比較して許容のより高い可能性と関連付けられる。
【0059】
改変がそれに従って許容又は拒絶される確率分布は、
【数3】
であってもよく、T
SAはシミュレートされたアニーリング温度である。
【0060】
TSAは、5~20%の許容率を維持するように調整されてもよい。
【0061】
改変は、単一のヌクレオチドの変化、挿入、若しくは欠失であってもよいか又はそれを含んでもよい。実施形態において、ステップ(a)は、5’UTR中に改変を導入すること、又は外因性ORFをコードする配列内でコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換することを含み;ステップ(d)は、許容された改変を含む5’UTR及びORFを含む配列を生成することを含む。特定の実施形態において、ステップ(a)は、単一のヌクレオチドの変化、挿入、若しくは欠失を含む改変を5’UTR中に導入すること、又はORF内のコドン2~12のいずれか1つを同義コドンと交換することを含む。
【0062】
ステップ(a)~(c)は、少なくとも200、300、400、500、1000、5000、又は10000回反復されてもよい。代替的に、ステップ(a)~(c)は、少なくとも10、50、100、250、又は500回の連続する反復がより負のΔGtot
new(ribo)につながらなくなるまで反復されてもよい。
【0063】
本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれも、コンピューター上で実行されてもよい。
【0064】
本発明の態様において、少なくとも2つの外因性ORFを含むポリシストロン性オペロンをコードする核酸配列を産生する方法であって、核酸の配列が、本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれかに従って設計され、次に、前記配列に従って核酸が産生される、方法が提供される。
【0065】
本発明の態様において、少なくとも2つの外因性ORFを含むポリシストロン性オペロンを設計するためのシステムであって、
プロセッサー;及び
本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれかを行うための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体
を含む、システムが提供される。
【0066】
本発明の態様において、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれかを実行させるプログラムコードを保存する非一時的な機械可読媒体を含む、コンピュータープログラム製品が提供される。
【0067】
本発明の態様において、本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれかにより得られるか又は得ることが可能であるオペロンを含む、核酸が提供される。
【0068】
本発明の態様において、本明細書に開示される少なくとも2つの外因性ORFを含むオペロンを設計する方法のいずれかにより得られるか又は得ることが可能であるオペロンをコードする核酸を含む、宿主細胞が提供される。
【0069】
宿主細胞は、原核細胞、例えば細菌細胞であってもよい。細菌細胞は大腸菌であってもよく、内因性ゲノムは大腸菌ゲノムであってもよい。
【0070】
本発明の態様において、
外因性タンパク質をコードするO-mRNAをコードする核酸配列であって、O-mRNAが、本明細書に開示されるO-mRNAを設計する方法のいずれかにより得られるか又は得ることが可能であり、O-mRNAが少なくとも2つのタイプの直交性コドンを含む、核酸配列;
少なくとも2つの直交性tRNAをコードするO-tRNAオペロンを含む核酸配列であって、少なくとも2つの直交性tRNAが、前記少なくとも2つのタイプの直交性コドンをデコードする能力を有し、オペロンが、本明細書に開示されるO-tRNAオペロンを設計する方法のいずれかにより得られるか又は得ることが可能である、核酸配列;
少なくとも2つのO-aaRSオペロンをコードする直交性アミノアシル-tRNAシンテターゼ(O-aaRS)を含む核酸配列であって、少なくとも2つのO-aaRSが、少なくとも2つの直交性tRNAとO-aaRS - O-tRNAペアを形成し、オペロンが、本明細書に開示される少なくとも2つの外因性遺伝子をコードするオペロンを設計する方法のいずれかにより得られるか又は得ることが可能である、核酸配列;及び
直交性リボソーム
を含む、宿主細胞が提供される。
【0071】
実施形態において、
O-mRNAは少なくとも3つのタイプの直交性コドンを含み;
O-tRNAオペロンは、前記少なくとも3つの直交性コドンをデコードする能力を有する少なくとも3つの直交性tRNAをコードし;
O-aaRSオペロンは、少なくとも3つの直交性tRNAとO-aaRS - O-tRNAペアを形成する少なくとも3つのO-aaRSをコードする。
【0072】
実施形態において、
O-mRNAは少なくとも4つのタイプの直交性コドンを含み;
O-tRNAオペロンは、前記少なくとも4つの直交性コドンをデコードする能力を有する少なくとも4つの直交性tRNAをコードし;
O-aaRSオペロンは、少なくとも4つの直交性tRNAとO-aaRS - O-tRNAペアを形成する少なくとも4つのO-aaRSをコードする。
【0073】
宿主細胞は、原核細胞、例えば細菌細胞であってもよい。細菌細胞は大腸菌であってもよく、内因性ゲノムは大腸菌ゲノムであってもよい。
【0074】
本発明の態様において、ポリペプチドを産生する方法であって、
本明細書に開示されているO-リボソーム、O-tRNAオペロン、及びO-aaRSオペロンを含む宿主細胞を用意するステップ;
第1の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、第1の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;並びに
宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への第1の非標準アミノ酸の組込みを可能とするステップ
を含む、方法が提供される。
【0075】
実施形態において、方法は、
第2の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、第2の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への第2の非標準アミノ酸の組込みを可能とするステップ
を含む。
【0076】
実施形態において、方法は、
第3の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、第3の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への第3の非標準アミノ酸の組込みを可能とするステップ
を含む。
【0077】
実施形態において、方法は、
第4の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、第4の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への第4の非標準アミノ酸の組込みを可能とするステップ
を含む。
【0078】
本発明の別の態様において、本明細書に開示されるポリペプチドを産生する任意の方法により得られた又は得ることができるポリペプチドが提供される。
【図面の簡単な説明】
【0079】
【
図1-2】O-リボソームにより特異的かつ効率的に翻訳されるO-mRNA配列の自動化された発見。 a、mRNA上のwt及びO-リボソームによるタンパク質合成の開始についての熱力学的モデル。開始複合体の形成のための自由エネルギー(ΔG
tot)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔG
unfolding)と、mRNAがリボソーム30Sサブユニット及びtRNA
fMet
CAU(黒色の三叉槍及び黄色の星)への結合を通じて開始複合体を形成する場合に放出される自由エネルギー(ΔG
ribo binding)との和である。O-リボソームの30Sサブユニット(薄茶色)はO-16S rRNAの3’末端において直交性アンチシャインダルガルノ(O-aSD)を含有し、wtリボソームの30Sサブユニット(暗褐色)はその16S rRNAの3’末端においてwtアンチシャインダルガルノ(wt aSD)を含有する。wt及び直交性30SとのアンフォールディングしたmRNAからの開始複合体の形成で放出される自由エネルギーは、それぞれΔG
wt ribo binding及びΔG
O-ribo bindingである。算出に関する詳細は方法において提供される。ORFオープンリーディングフレーム(橙色)、開始コドン(紫色)、SD/O-SD それぞれシャインダルガルノ配列又は直交バージョン(緑色)、SD/O-SDと開始コドンとの間のスペーシング(青色)。5’UTRの残りの部分は灰色で示される。 b、O-リボソームにより効率的かつ特異的に翻訳されるO-mRNA配列を予測するために開発されたアルゴリズム。アルゴリズムvol 1は、wt SD配列を含有するランダムな35ヌクレオチド5’UTRを生成し、そのΔG
tot(O-ribo)を予測する。反復処理において、変異が5’UTR中に導入される(単一のヌクレオチドの変化、挿入、又は欠失)。アルゴリズムは次に、新たな直交性ΔG
tot
new(O-ribo)を予測する。ΔG
tot
new(O-ribo)がΔGtot(O-ribo)よりも負である場合、変化は許容され;変異がより正のΔG
tot
new(O-ribo)につながる場合、変化は、何らかの条件付き確率と共に拒絶される(方法を参照)。アルゴリズムは10,000回の反復後に終了される。アルゴリズムvol 2は、開始コドンからの最適な5ヌクレオチドスペーシングにおいてO-SD配列を含有するランダムな35ヌクレオチド5’UTRを生成し、そのΔG
tot(wt ribo)及びΔG
tot(O-ribo)を予測する。反復処理において、変異が5’UTR中に導入される(単一のヌクレオチドの変化、挿入、又は欠失)。アルゴリズムは次に、新たな予測される値、ΔG
tot
new(wt ribo)及びΔG
tot
new(O-ribo)を算出する。ΔG
tot
new(wt ribo)がΔG
tot(wt ribo)よりも正であり、ΔG
tot
new(O-ribo)がΔG
tot(O-ribo)よりも負である場合、変化は許容され;さもなければ、変異は、何らかの条件付き確率と共に拒絶される(方法を参照)。500回の連続する反復がΔG
tot値の向上をもたらさない場合(収束基準)、アルゴリズムは配列及びその予測されるΔG
tot値を出力する。アルゴリズムvol 3はvol 2に基づくが、2つの顕著な差異を有する:(1)Vol 3はまた、コドン2~12が同義コドンとランダムに交換されたORFと共に開始し、その結果、コードされるアミノ酸配列は保存される。(2)反復処理において、5’UTR中の単一のヌクレオチドの変化、挿入又は欠失に加えて、ORF中の同義コドン置換は、許容される変異機序である。 c、アルゴリズムは、Oリボソームにより特異的かつ効率的に翻訳されるO-mRNA配列を発見する。y軸は、O-リボソームによるO-mRNAからの
strepGFP
His6の産生を示し;データは、wtメッセージからwtリボソームにより産生される
strepGFP
His6のパーセンテージとして示される。x軸はO-mRNAの直交性を示し;これは、O-リボソームの存在下でO-mRNAから産生される
strepGFP
His6を、wtリボソームの存在下でO-mRNAから産生される
strepGFP
His6で割ることで算出される。タンパク質産生レベルはGFP吸収及び蛍光データから算出され;我々のシステムにおいて、wtシステムは30.6±1.6mg/mLの
strepGFP
His6を生成する。各々のドットは1つのO-mRNAを表す。トランス(黒色ドット)はO(trans)-strepGFPHis6である。有色のドットは、アルゴリズムの指し示されるボリューム(volume)からの配列を表す。d、eはcと同じであるが、それぞれE2Crimson(d)及びmCherry(e)について行ったものである。
【
図2-2】3つの別個のncAAを含有するタンパク質の効率的な産生が、新たなO-mRNAにより可能になる。 a、この研究において使用されたアミノ酸の構造。N
6-(tert-ブトキシカルボニル)-L-リジン(BocK) 1;N
π-メチル-L-ヒスチジン(NmH) 2;N
6-((ベンジルオキシ)カルボニル)-L-リジン(CbzK) 3;N
6-((アリルオキシ)カルボニル)-L-リジン(AllocK) 4;(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(PheI) 5。 b、2つの異なる直交性メッセージを使用する3つの別個のncAAの組込みのための操作された三重に直交性のピロリシル-tRNAシンテターゼtRNAペア。1つのメッセージは、我々のアルゴリズムのvol 1により生成されるO1-
strepGFP
His6 5’UTRを含有し、他のメッセージはO-(trans)5’UTRを使用した。 c、O(trans)-又はO1-
strepGFP-
His6 5’UTRを有する
strepGFP(40TAG、136 AGGA及び150 AGTA)
His6コンストラクトを含有する大腸菌細胞からの
strepGFP(40BocK、136NmH、150CbzK)
His6の産生。細胞はまた、O-riboQ1及びaaRS3/tRNA3オペロン(MmPylRS/MspetRNA
Pyl
CUA、MlumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCU及びM1r26PylRS(CbzK)/MalvtRNA
Pyl-8
UACUをコードする)を含有した。ncAA BocK 1、NmH 2、CbzK 3を細胞に加えた。 d、(b)において記載される細胞から精製されたニッケル-NTA精製
strepGFP(40BocK、136NmH、150CbzK)
His6のポジティブエレクトロスプレーTOF-MSの結果。
StrepGFP(40BocK、136NmH、150Cbz)
His6の予測された質量:29314.5、実測された質量:29312.0。
【
図3】4つの直交性クアドルプレットコドンをデコードする4つの直交性aaRS/tRNAペアは、aaRSオペロン及びコンピューターにより生成されたtRNAオペロンから発現され、それらのアミノアシル化特異性において相互に直交性であり、別個のncAAを認識し、別個の直交性コドンをデコードする。 a~d、O1-
strepGFP(40XXXX)
His6を含有する細胞からの蛍光であり、XXXXはsfGFP中の40位におけるコドン:TAGA、CTAG、AGGA又はAGTAである。大腸菌はまた、O-riboQ1並びにaaRS及びtRNAオペロン(aaRS4_1-2/tRNA4(quad))を含有し;これらのオペロンは、MmPylRS/MspetRNA
Pyl-evol
UCUA、MrumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCU、AfTyrRS(PheI)/AftRNA
Tyr-A01
CUAG及びMg1PylRS(CbzK)/MalvtRNA
Pyl-8
UACUを発現した。指し示されるncAA:N
π-メチル-L-ヒスチジン(NmH) 2、N
6-((ベンジルオキシ)カルボニル)-L-リジン(CbzK) 3、N
6-((アリルオキシ)カルボニル)-L-リジン(AllocK) 4、(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(PheI) 5を細胞に加えたか、又は省略した(-)。各々のコドンは、それぞれのクアドルプレットコドンに割り当てられたaaRS/tRNAペアのコグネイトncAAの存在下でのみ効率的にデコードされた:(a)MmPylRS/MspetRNA
Pyl-evol
UCUAによりデコードされるO1-
strepGFP(TAGA)
His6、(b)MrumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCUによりデコードされるO1-
strepGFP(AGGA)
His6、(c)Mg1PylRS(CbzK)/MalvtRNA
Pyl-8
UACUによりデコードされるO1-
strepGFP(AGTA)
His6、及び(d)AfTyrRS(PheI)/AftRNA
Tyr-A01
CUAGによりデコードされるO1-
strepGFP(CTAG)
His6。 e~h、NmH 2、CbzK 3、AllocK 4、PheI 5の存在下での、O1-
strepGFP(40XXXX)
His6から発現されるニッケル-NTA精製
strepGFP
His6のポジティブエレクトロスプレーTOF-MSであり、XXXXは、TAGA(e)、AGGA(f)、AGTA(g)又はCTAG(h)のいずれかである。細胞はまたO-riboQ1及びオペロンaaRS4_2-1/tRNA4(quad)を含有した。
strepGFP(40AllocK)
His6の予測された質量29113.2、実測された質量29114.8。
strepGFP(40NmH)
His6の予測された質量29052.1、実測された質量29052.5。
strepGFP(40CbzK)
His6の予測された質量29163.3、実測された質量29164.2。
strepGFP(40PheI)
His6の予測された質量29174.03、実測された質量29174.2。
【
図4-2】24個のアミノ酸、68個のコドン遺伝コードを使用してタンパク質中に4つの別個のncAAを遺伝学的にコードする。 a、4つの直交性クアドルプレットコドンに応答した4つの別個のncAAの組込みのために使用される4つの相互に直交性のaaRS/tRNAペアの図式的な表現。 b、全長
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6の効率的な産生は、4つすべてのncAA(N
π-メチル-L-ヒスチジン(NmH) 2、N
6-((ベンジルオキシ)カルボニル)-L-リジン(CbzK) 3、N
6-((アリルオキシ)カルボニル)-L-リジン(AllocK) 4、(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(PheI) 5)の追加に依存的であった。NmH(2)、CbzK(3)、AllocK(4)、PheI(5)の組合せの存在又は非存在下でのO1-
strepGFP(40CTAG、50TAGA、136AGGA、150AGTA)
His6、O-riboQ1、オペロンaaRS4/tRNA4(quad)(MmPylRS/MspePyltRNA
UCUA、MrumPylRS(NMH)/MintPyltRNA(
A17,
VC10)
UCCU、AfTyrRS/AftRNA
CUAG及びMg1PylRS(CbzK)/MalvPyltRNA(8)
UACUをコードする)を含有する細胞からの蛍光。 c、指し示されるncAAの存在下でのO1-
strepGFP(40CTAG、50TAGA、136AGGA、150AGTA)
His6、O-riboQ1及びaaRS4_1-2/tRNA4(quad)を含有する細胞からのニッケル-NTA精製
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6のポジティブエレクトロスプレーTOF-MS。予測された質量29470.4、実測された質量29468.2。
【
図5-2】(補足
図1) 指し示されるアルゴリズムにより生成されたO-mRNAからのレポータータンパク質産生の蛍光測定。我々は、標準化されたp15Aレポーターコンストラクト中に配列(
strepGFP
His6のためのO1-O12
strepGFP
His6(a及びb)、E2CrimsonのためのO1-O8 E2Crimson(c)の他に、mCherryのためのO1-O8 mCherry(d))をクローニングし、O-リボソーム又はwtリボソームの追加のコピーのいずれかをコードするプラスミドの存在下でタンパク質を産生した。対照実験では、我々の研究室において一般的に使用される5’UTR及びRBSを有するコンストラクト(wt)、並びに高度に効率的なO-GST-CaM産生のために以前に使用されたO(trans)5’UTRを有するコンストラクト(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007))を使用した。バーは、3つの生物学的複製物の平均値±標準偏差を表す。ドットは個々の実験を表す。
【
図6-3】(補足
図2)
strepGFP(40BocK、136NmH、150CbzK)
His6のトリプシン消化後に得られたncAA含有ペプチドのMS/MSスペクトル。前駆体イオンはncAAの組込みを裏付けている。各々のペプチドの断片化は、bイオンのシリーズ(青色)及びyイオンのシリーズ(赤色)の他に、断片化処理におけるリジン保護基の喪失に対応するイオンをもたらすことが予測される(a及びc)。イオンピークを手動で割り当てたところ;前駆体イオン質量と共に、これらはその予想される位置における各々のncAAの組込みを裏付けた。質量分析を3回行ったところ、類似した結果であった。a、40位におけるBocK 1組込みを裏付けるMS/MSスペクトル。b、136位におけるNmH 2組込みを裏付けるMS/MSスペクトル。c、150位におけるCbzK 3組込みを裏付けるMS/MSスペクトル。
【
図7】(補足
図3) 4つの相互に直交性のaaRS(AfTyrRS(PheI)、MrumPylRS(NmH)、Mg1PylRS(CbzK)及びMmPylRS)のための遺伝子を含有するポリシストロン性オペロンの生成のためのアセンブリーパイプライン。各々のシンテターゼのために、最大ΔG
tot(wt ribo)について最適化されたオンラインのRBS計算機(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009)、Salis, H.M. in Methods in Enzymology, Vol. 498 19-42 (Academic Press, Cambridge, MA, USA; 2011)、Espah Borujeni, A., Channarasappa, A.S. & Salis, H.M. Translation rate is controlled by coupled trade-offs between site accessibility, selective RNA unfolding and sliding at upstream standby sites. Nucleic Acids Res. 42, 2646-2659 (2014)、Espah Borujeni, A. & Salis, H.M. Translation Initiation is Controlled by RNA Folding Kinetics via a Ribosome Drafting Mechanism. J. Am. Chem. Soc. 138, 7016-7023 (2016)、Espah Borujeni, A. et al. Precise quantification of translation inhibition by mRNA structures that overlap with the ribosomal footprint in N-terminal coding sequences. Nucleic Acids Res. 45, 5437-5448 (2017))(参照により本明細書に組み込まれる)を使用して5つの5’UTR配列を生成した。次に、形態aaRSX-5’_UTR(Y1-Y5)-aaRSY(X及びYは、4つのシンテターゼのうちの2つの任意の組合せを指す)の各々のアライメントについてのΔG
tot(wt ribo)をオンラインツール(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009)、Salis, H.M. in Methods in Enzymology, Vol. 498 19-42 (Academic Press, Cambridge, MA, USA; 2011)、Espah Borujeni, A., Channarasappa, A.S. & Salis, H.M. Translation rate is controlled by coupled trade-offs between site accessibility, selective RNA unfolding and sliding at upstream standby sites. Nucleic Acids Res. 42, 2646-2659 (2014)、Espah Borujeni, A. & Salis, H.M. Translation Initiation is Controlled by RNA Folding Kinetics via a Ribosome Drafting Mechanism. J. Am. Chem. Soc. 138, 7016-7023 (2016)、Espah Borujeni, A. et al. Precise quantification of translation inhibition by mRNA structures that overlap with the ribosomal footprint in N-terminal coding sequences. Nucleic Acids Res. 45, 5437-5448 (2017))を使用して算出した。最後に、4つすべてのシンテターゼを、各々のシンテターゼについて高いΔG
tot(wt ribo)を保証するように手動でアライメントした。2つの独立した解法は類似した結果をもたらした。実験的検証後に、1つのシンテターゼの好都合な配列コンテキストを他のオペロンにコピーして最終コンストラクトを得た(すべての5’UTR配列及びΔG
tot(wt ribo)を補足表3に与えている)。
【
図8】(補足
図4) O1-
strepGFP(XXXX)
His6を含有する細胞からの蛍光であり、XXXXは、TAG、CTAG、AGGA又はAGTAのいずれかである。大腸菌はまた、O-riboQ1及びMmPylRS/MspePyltRNA
CUAG、MrumPylRS(NMH)/MintPyltRNA(
A17,
VC10)
UCCU、AfTyrRS/AfRNA
CUA及びMg1PylRS(CbzK)/MalvPyltRNA(8)
UACU及びncAA:NmH 2、CbzK 3、BocK 1又はPheI 5のうちの1つを含有した。シンテターゼを最初に、オペロンRS4_1/tRNA4又はRS4_2/tRNA4のいずれかに配置した(補足
図3及び補足表3を参照)。RS4_1/tRNA4(a)は、TAG、CTAG及びAGTAの抑制についてより良好な結果をもたらしたが;AGGAは、RS4_2/tRNA4(b)における効率の半分でのみ抑制された。したがって、MrumPylRSの上流の150nt領域をRS4_1/tRNA4にコピーして、MrumPylRSよりも2.6高い活性につながるオペロン1 RS4_1-2/tRNA4(c)を得た。
【
図9-2】(補足
図5)
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6のトリプシン消化後に得られたncAA含有ペプチドのMS/MSスペクトル。前駆体イオンはncAAの組込みを裏付けている。各々のペプチドの断片化は、bイオンのシリーズ(青色)及びyイオンのシリーズ(赤色)の他に、断片化処理におけるリジン保護基の喪失に対応するイオンをもたらすことが予測される(d)。イオンピークを手動で割り当てたところ;前駆体イオン質量と共に、これらはその予想される位置における各々のncAAの組込みを裏付けた。質量分析を3回行ったところ、類似した結果であった。a、40位におけるPheI 5組込みを裏付けるMS/MSスペクトル。b、50位におけるAllocK 4組込みを裏付けるMS/MSスペクトル。c、136位におけるNmH 2組込みを裏付けるMS/MSスペクトル。d、150位におけるCbzK 3組込みを裏付けるMS/MSスペクトル。
【
図10】(補足
図6) 1つのアンバーコドン及び3つの直交性クアドルプレットコドンをデコードする4つの直交性aaRS/tRNAペアは、aaRSオペロン及びコンピューターにより生成されたtRNAオペロンから発現され、それらのアミノアシル化特異性において相互に直交性であり、別個のncAAを認識し、別個の直交性コドンをデコードする。a~d、O1-
strepGFP(40XXXX)
His6を含有する細胞からの蛍光であり、XXXXは、sfGFP中の40位におけるコドン:TAG、CTAG、AGGA又はAGTAである。大腸菌はまた、ribo-Q1並びにaaRS及びtRNAオペロン(aaRS4_1-2/tRNA4)を含有し;これらのオペロンは、MmPylRS/MspetRNA
Pyl-evol
CUAG、MrumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCU、AfTyrRS(PheI)/AftRNA
Tyr-A01
CUA及びMg1PylRS(CbzK)/MalvtRNA
Pyl-8
UACUを発現した。指し示されるncAA:N
π-メチル-L-ヒスチジン(NmH) 2、N
6-((ベンジルオキシ)カルボニル)-L-リジン(CbzK) 3、N
6-(tertブトキシカルボニル)-L-リジン(BocK) 1、(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(PheI) 5を細胞に加えたか、又は省略した(-)。各々のコドンは、それぞれのクアドルプレットコドンに割り当てられたaaRS/tRNAペアのコグネイトncAAの存在下でのみ効率的にデコードされた:(a)AfTyrRS(PheI)/AftRNA
Tyr-A01
CUAによりデコードされるO1-
strepGFP(TAG)
His6、(b)MrumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCUによりデコードされるO1-
strepGFP(AGGA)
His6、(c)Mg1PylRS(CbzK)/MalvtRNA
Pyl-8
UACUによりデコードされるO1-
strepGFP(AGTA)
His6、及び(d)MmPylRS/MspetRNA
Pyl-evol
CUAGによりデコードされるO1-
strepGFP(CTAG)
His6。 e~h、NmH 2、CbzK 3、BocK 1、PheI 5の存在下での、O1-
strepGFP(40XXXX)
His6から発現されたニッケル-NTA精製
strepGFP
His6のポジティブエレクトロスプレーTOF-MSであり、XXXXは、TAG(e)、AGGA(f)、AGTA(g)又はCTAG(h)のいずれかである。細胞はまた、O-riboQ1及びオペロンaaRS4_2-1/tRNA4を含有した。
strepGFP(40PheI)
His6の予測された質量29174.03、実測された質量29174.2。
strepGFP(40BocK)
His6の予測された質量29129.4、実測された質量29129.0。
strepGFP(40NmH)
His6の予測された質量29052.1、実測された質量29052.5。
strepGFP(40CbzK)
His6の予測された質量29163.3、実測された質量29164.2。
strepGFP(40BocK)
His6の予測された質量29129.4、実測された質量29129.0。
【
図11】(補足
図7) アンバーコドン及び3つの別個のクアドルプレットコドンに応答してタンパク質中に4つの別個のncAAを遺伝学的にコードする。 a、アンバーコドン及び3つの別個のクアドルプレットコドンに応答した4つの別個のncAAの組込みのために使用される4つの相互に直交性のaaRS/tRNAペアの図式的な表現。 b、全長
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6の効率的な産生は、4つすべてのncAA(BocK 1、NmH 2、CbzK 3及びPheI 5)の追加に依存的であった。BocK 1、NmH 2、CbzK 3、PheI 5の組合せの存在又は非存在下でのO1-
strepGFP(40TAG、50CTAG、136AGGA、150AGTA)
His6、O-riboQ1、オペロンaaRS4_1-2/tRNA4(MmPylRS/MspetRNA
Pyl-evol
CUAG、MrumPylRS(NMH)/MinttRNA
Pyl-A17VC10
UCCU、AfTyrRS(PheI)/AftRNA
Tyr-A01
CUA及びMg1PylRS(CbzK)/MalvtRNA
Pyl-8
UACUをコードする)を含有する細胞からの蛍光。 c、8mMのBocK 1、4mMのNmH 2、2mMのPheI 5及び2mMのCbzK 3の存在下でのO1-
strepGFP(40TAG、50CTAG、136AGGA、150AGTA)
His6、O-riboQ1及びオペロンRS4_1-2/tRNA4を含有する細胞から精製された精製
strepGFP(40PheI、50BocK、136NmH、150CbzK)
His6のTOF-MS ES+。予測された質量29482.0、実測された質量29483.0。
【
図12-2】(補足
図8)
strepGFP(40PheI、50BocK、136NmH、150CbzK)
His6のトリプシン消化後に得られたncAA含有ペプチドのMS/MSスペクトル。前駆体イオンはncAAの組込みを裏付けている。各々のペプチドの断片化は、bイオンのシリーズ(青色)及びyイオンのシリーズ(赤色)の他に、断片化処理におけるリジン保護基の喪失に対応するイオンをもたらすことが予測される(b及びd)。イオンピークを手動で割り当てたところ;前駆体イオン質量と共に、これらはその予想される位置における各々のncAAの組込みを裏付けた。質量分析を3回行ったところ、類似した結果であった。a、40位におけるPheI 5組込みを裏付けるMS/MSスペクトル。b、50位におけるBocK 1組込みを裏付けるMS/MSスペクトル。c、136位におけるNmH 2組込みを裏付けるMS/MSスペクトル。d、150位におけるCbzK 3組込みを裏付けるMS/MSスペクトル。
【発明を実施するための形態】
【0080】
外因性タンパク質、特には非天然アミノ酸を含む外因性タンパク質を産生するための細胞ベースタンパク質発現システムの使用は、複数の理由のために困難であり得る。1つの課題は、細胞は、生存のために必須の内因性タンパク質も生成できなければならないということである。例えば、タンパク質発現システムが、外因性タンパク質中への非天然アミノ酸の組込みを可能とするために改変されている場合、内因性タンパク質中への非天然アミノ酸の組込みを回避することが所望され得る。これを克服するための1つのアプローチは、2つのリボソーム:宿主細胞にとって内因性のタンパク質の産生のための野生型リボソーム及び外因性タンパク質をコードする直交性mRNAを翻訳することが可能である直交性リボソームを含むシステムを使用することである。
【0081】
細胞ベースタンパク質発現システムは、他の理由のためにO-リボソームを含んでもよい。内因性リボソームに対する変異は毒性であり得、一部のリボソーム変異は、内因性リボソームのほんの一部のコピー中に存在する場合であっても細胞にとって致死的であり得る(すなわち変異は優性致死的であり得る)ことが見出されている。しかしながら、O-リボソームはこれらのリボソーム変異を許容することができ、その理由は、本明細書において議論されるように、それらは宿主細胞の他の機能から切り離されているからである。そのため、O-リボソームは、新たな所望される機能のために操作され得る。例えば、O-リボソームは、新たな直交性コドン(クアドルプレットコドン、(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)))又は新たな内因性重合機能(Schmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018))をデコードするために進化され得る。
【0082】
しかしながら、背景技術のセクションにおいて議論されるように、O-リボソームを含む発現システムからのタンパク質の収率は、低くかつ最適化されていないものであり得る。特に、収率は、異なる外因性タンパク質について測定される場合に一貫していない。
【0083】
天然の翻訳についてのタンパク質収率を決定する要因の理解は不完全であり、実験研究の設計は、観察されるタンパク質収率における変動の半分のみが既知のパラメーターにより説明され得ることを示唆する(Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018))。それにもかかわらず、本発明者らは、タンパク質合成の開始は一般的に翻訳の律速ステップであり(Plotkin, J.B. & Kudla, G. Synonymous but not the same: the causes and consequences of codon bias. Nat. Rev. Genet. 12, 32-42 (2011))、多数の研究は、5’UTR及びコーディング配列の最初の30nt中のRNA二次構造は翻訳開始及びタンパク質収率の鍵となる決定因子であることを示唆する(Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018)、Tuller, T. & Zur, H. Multiple roles of the coding sequence 5′ end in gene expression regulation. Nucleic Acids Res. 43, 13-28 (2015))ことに気付いた。実際に、自由にフォールディングしたmRNAから最終の「開始適格」状態への全自由エネルギー変化(ΔG
tot(wt ribo))を予測する熱力学的モデルを使用して、天然の翻訳についての相対的なタンパク質収率を予測することができる(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009)、Na, D., Lee, S. & Lee, D. Mathematical modeling of translation initiation for the estimation of its efficiency to computationally design mRNA sequences with desired expression levels in prokaryotes. BMC Syst. Biol. 4, 1-16 (2010)、Seo, S.W. et al. Predictive design of mRNA translation initiation region to control prokaryotic translation efficiency. Metab. Eng. 15, 67-74 (2013))(参照により本明細書に組み込まれる)。開始コドンの直ちに上流の5’UTRにおける異なる35ntでの先行する研究は、所与のORFについてのタンパク質収率(翻訳開始の速度を反映するとして解釈される)は、フォールディングしたmRNAからの開始適格状態の形成についての平衡定数に比例している(すなわち、ΔG
tot(wt ribo)のlogに比例している)ことを指し示す(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009)、Salis, H.M. in Methods in Enzymology, Vol. 498 19-42 (Academic Press, Cambridge, MA, USA; 2011)、Espah Borujeni, A., Channarasappa, A.S. & Salis, H.M. Translation rate is controlled by coupled trade-offs between site accessibility, selective RNA unfolding and sliding at upstream standby sites. Nucleic Acids Res. 42, 2646-2659 (2014)、Espah Borujeni, A. & Salis, H.M. Translation Initiation is Controlled by RNA Folding Kinetics via a Ribosome Drafting Mechanism. J. Am. Chem. Soc. 138, 7016-7023 (2016)、Espah Borujeni, A. et al. Precise quantification of translation inhibition by mRNA structures that overlap with the ribosomal footprint in N-terminal coding sequences. Nucleic Acids Res. 45, 5437-5448 (2017))(参照により本明細書に組み込まれる)。ΔG
tot(wt ribo)は、mRNAアンフォールディング(ΔG
unfolding)、並びに、mRNAへの、正確な位置における塩基対合を通じた、wt-リボソーム及びtRNA
fMet
CAUの結合(ΔG
wt ribo binding)に分解され得る(
図1a)。
【0084】
ここで、本発明者らは、開始の熱力学的モデル及びシミュレートされたアニーリング最適化アルゴリズム(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009))を使用して、ORFの直交翻訳のための5’UTR配列の発見を自動化している。本発明者らはまた、O-リボソームに結合するが、他のリボソームに結合しないメッセージを明示的に選択するためのアルゴリズムを開発し、5’UTR及びORFのアミノ酸、例えばアミノ酸2~12をコードする同義コドンの両方におけるバリエーションを探索することにより検索における自由度を増加させている。O-mRNAの発見を自動化することは、先行するO-mRNAよりも、最大40倍多くのタンパク質を提供し、最大50倍直交性である配列につながり;新たなO-mRNAからのタンパク質収率は、WT mRNAからの場合に匹敵するか、又はそれを上回る。これらの進歩は、操作された三重に直交性のPylRS/tRNAPylペアを使用してアンバーコドン及び2つのクアドルプレットコドンに応答して3つの別個のncAAを組み込むための収率における33倍の増加に直接的に翻訳される。
【0085】
そのため、本発明の態様において、O-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測するステップ;
(b)5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;及び
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。
【0086】
「O-リボソーム」は、本明細書において使用される場合、内因性リボソームと比較して特定の宿主細胞にとって内因性のmRNAを翻訳する能力が低いか、又は翻訳する能力を有さず;内因性mRNAとは異なるmRNA(すなわちO-mRNA)を翻訳する能力を有するリボソームである。
【0087】
「O-mRNA」は、本明細書において使用される場合、内因性mRNAの翻訳と比較して特定の宿主細胞にとって内因性のリボソームによってより低い効率で翻訳され;内因性リボソームとは異なるリボソーム(すなわちO-リボソーム)により翻訳される能力を有するメッセンジャーRNAである。
【0088】
形容詞「直交性の」は、本明細書において使用される場合、O-リボソーム及びO-mRNAに関連するが内因性のリボソームにもmRNAにも関連しない構成要素又は特色を記載する。例えば、直交性シャインダルガルノ配列は、O-リボソームの直交性アンチシャインダルガルノ配列と相互作用する能力を有するとしてO-mRNAと関連付けられる。直交性シャインダルガルノ配列は内因性リボソームに対する低減された結合のみを可能とし、直交性アンチシャインダルガルノ配列は内因性mRNAに対する低減された結合のみを可能とする。
【0089】
本明細書において使用される場合、O-リボソーム及びO-mRNAは一緒になって機能する。そのため、O-リボソームは、O-mRNAを翻訳する能力を有する。
【0090】
1つより多くのO-リボソームを特色とする実施形態において、O-mRNAの第1のセットはO-リボソームのうちの1つにのみ適用可能であり得、O-mRNAの第2のセットは他のO-リボソームに適用可能であり得る。
【0091】
例において、O-リボソームは、野生型リボソームとは異なる人工的に変更又は改変されたリボソームであってもよい。O-mRNAは、野生型リボソームの基質ではないmRNAであってもよい。
【0092】
O-リボソームは、変更された16S rRNAを含んでもよい。特に、16 rRNAは、mRNAのリボソーム結合部位(RBS)への結合に影響する方式において変更されてもよい。O-リボソームは、野生型シャインダルガルノ配列に結合する能力を有しないか、又は該能力が最小である変更されたアンチシャインダルガルノ配列を含んでもよい。そのような事例において、O-mRNAは、O-リボソームに結合する能力を有する変更されたRBS、例えば変更されたシャインダルガルノ配列を含む。
【0093】
実施形態において、宿主細胞の文脈において、O-リボソームは、内因性プロテオームを合成しないか、又は最小に合成する。そのような実施形態において、O-mRNAは、内因性リボソームにより翻訳されないか、又は最小に翻訳される。宿主細胞は、特に制限されず、任意の宿主細胞、特には異種タンパク質産生に好適な任意の宿主細胞であってもよい。一部の例において、宿主細胞は、原核細胞、例えば細菌細胞である。特に、宿主細胞は大腸菌細胞であってもよい。
【0094】
一部の例において、O-リボソームはO-riboQ1であってもよい。追加的に、O-リボソームは、国際公開第2008/065398A1号パンフレットにおいて開示されるか、又は国際公開第2008/065398A1号パンフレットにおいて開示される方法により得ることが可能である任意のO-リボソームであってもよい。追加的に、O-リボソームは、国際公開第2011/077075A1号パンフレットにおいて開示されるか、又は国際公開第2011/077075A1号パンフレットにおいて開示される方法により得ることが可能である任意のO-リボソームであってもよい。国際公開第2008/065398A号パンフレット及び国際公開第2011/077075A1号パンフレットの両方は参照により本明細書に組み込まれる。O-リボソームは、(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010);Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007);又はSchmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018))(これらの各々は参照により本明細書に組み込まれる)のいずれかにおいて開示されるか又は開示される方法により得ることが可能である任意のO-リボソームであってもよい。
【0095】
用語「5’UTR」は、当分野におけるその普通の意味に従って本明細書において使用される。簡潔に述べれば、5’UTRは、ポリペプチドに翻訳されず、ORFの5’にあり、リボソームによる認識に関与するmRNAの領域である。
【0096】
用語「ORF」は、当分野におけるその普通の意味に従って本明細書において使用される。簡潔に述べれば、ORFは、コードされるタンパク質に翻訳される能力を有するmRNAの部分である。
【0097】
mRNAの自由にフォールディングした状態は、mRNAがリボソームに結合しておらず、二次構造を自由に形成する場合に存在する状態である。
【0098】
mRNAのリボソームに結合した開始適格状態は、mRNAがリボソームに結合しており、開始tRNAが結合しており、翻訳の開始が始まり得る場合に存在する状態である。
【0099】
実施形態において、改変は、5’UTR中に導入された単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む。
【0100】
本発明の方法の間に、改変は、前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に許容される。「先行する」ΔGtot(O-ribo)は、改変がなされる前のmRNA配列について予測されたΔGtot(O-ribo)である。本明細書において議論されるように、本発明の方法は反復されてもよく、そのため、先行するΔGtot(O-ribo)は、先行する反復の間に算出されたΔGtot
new(O-ribo)であってもよい。
【0101】
本発明の方法の間の改変の許容は、改変により導入された配列変更が、方法の次の反復のために維持されるか、又は、方法のさらなる反復がない場合、方法の出力であるO-mRNAの配列において維持されることを意味する。
【0102】
本発明の方法の間に、改変は、前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って許容又は拒絶される。「先行するΔGtot(O-ribo)」は上記に議論される通りである。確率分布は、ΔGtot
new(O-ribo)とΔGtot(O-ribo)との間の差異が増加するにつれて許容の可能性が減少する条件付き確率に基づいてもよい。確率はモンテ-カルロ最適化であってもよい。
【0103】
実施形態において、改変がそれに従って許容又は拒絶される確率分布は、
【数4】
であり、T
SAはシミュレートされたアニーリング温度である。
【0104】
特定の実施形態において、TSAは、少なくとも0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、又は10%の許容率を維持するように調整される。特に、TSAは、少なくとも5%の許容率を維持するように調整されてもよい。
【0105】
特定の実施形態において、TSAは、75%、50%、40%、30%、25%、20%、15%、若しくは10%よりも低いか、又は75%、50%、40%、30%、25%、20%、15%、若しくは10%に等しい許容率を維持するように調整される。特に、TSAは、20%よりも低いか、又は20%に等しい許容率を維持するように調整されてもよい。
【0106】
特定の実施形態において、TSAは、0.1%~75%、1%~50%、2%~40%、3%~30%、4%~25%、又は、特に、5~20%の許容率を維持するように調整される。
【0107】
TSAの調整は、許容率がある特定の回数の反復について上述の値の外側に入る場合に、TSAが、補償するために増加又は減少されることを意味し得る。例えば、許容率が、5、10、20、30、40、50、60、70、100、200、又は500回の反復について下方閾値を下回るか、又は上方閾値を上回る場合に、許容率が訂正されるようにTSAは低下又は上昇されてもよい。特定の実施形態において、許容率は、50回の反復について考慮される。特定の実施形態において、TSAは、値を2倍又は半分にすることにより調整される。
【0108】
本発明の方法の間の改変の拒絶は、改変により導入された配列変更が元に戻され、そのため方法の次の反復のために維持されないか、又は出力配列において維持されないことを意味する。
【0109】
一部の実施形態において、改変は、特定の配列制約が破られた場合に拒絶されてもよい。例えば、改変された配列が、基礎となる熱力学的モデルの仮定のうちの1つを無効にする場合に、改変は拒絶されてもよい。本明細書に開示されるO-mRNAを設計する方法の任意のステップ(d)は、これらの制約に基づく改変の拒絶を含んでもよく、これは、本明細書に開示されている確率分布に基づく許容又は拒絶に加えて含まれてもよい。配列制約は、(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009))(参照により組み込まれる)において開示されるようないずれかであってもよい。
【0110】
そのような制約の例として、実施形態において、mRNA配列上の16S rRNA結合部位をアンフォールディングさせるために要求されるエネルギーが特定の閾値を上回る、例えば6kcal/molを超える場合に、改変は拒絶される。代替的に又は追加的に、ロングレンジヌクレオチド相互作用の存在が定量化されてもよく、特定の条件が満たされない場合に改変は拒絶されてもよい。例えば、溶液中で塩基対を形成するヌクレオチドi及びjの平衡確率がP=|i-j|-1.44に比例していると考えられ、配列S中の各々の塩基対についてPが算出される場合に、最小pが6×10-3未満である場合に改変は拒絶されてもよい。他の制約のいずれかの代替又は追加として含まれてもよい、制約の別の例として、リボソーム結合配列内の新たなAUG又はGUG開始コドンの作出は拒否されてもよく、そのため、前記コドンを導入する任意の改変は拒絶されてもよい。
【0111】
改変が確率分布に従って許容又は拒絶される本明細書に開示されるすべての実施形態において、代替として改変は単純に拒絶されてもよい。そのため、実施形態において、前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変は拒絶される。これはまた、本明細書に開示されるさらなる実施形態に適用可能である。
【0112】
O-mRNA配列の生成は、最終配列が、許容された改変のすべての累積的な効果を含む出力であることを意味する。
【0113】
実施形態において、本発明の方法の第1のラウンドは、ランダムに生成された5’UTRを有する潜在的なmRNA配列に対して行われる。5’UTRの長さは特に限定されない。方法の間に、5’UTRの長さは、挿入又は欠失改変に起因して増加又は減少されてもよい。特定の実施形態において、初期5’UTRは、30~40ヌクレオチド長、又は特に35ヌクレオチドである。代替的に、5’UTRはより長くてもよいが、30~40、又は特に35ヌクレオチドウィンドウが改変のために本発明の方法により考慮される。35ヌクレオチドウィンドウは、開始コドンに最も近接した5’UTRの35ヌクレオチドであってもよい。他の実施形態において、初期5’UTRは、より短い、例えば15、20、若しくは25ヌクレオチドの5’UTR、又はより長い、例えば少なくとも40、50、若しくは51以上のヌクレオチドであってもよい。特定の長さの5’UTRを生成することが望ましいことがあり、その場合、出力配列の特定の長さが達成され得るように15、20、25、30、35、45、50ヌクレオチドウィンドウが考慮されてもよい。
【0114】
ステップ(a)が適用される5’UTRは、野生型シャインダルガルノ配列、又は野生型シャインダルガルノ配列の5ヌクレオチドコアを含んでもよい。他の実施形態において、ステップ(a)が適用される5’UTRは、本明細書において議論されるように、直交性シャインダルガルノ配列を含んでもよい。5’UTRは、シャインダルガルノ配列以外はランダムな配列であってもよい。シャインダルガルノ配列は、最適なスペーシングであることが予測される、ORFの開始コドンからの5ヌクレオチドであってもよい。
【0115】
本発明の方法はΔGtot(O-ribo)の予測を要求する。この値の予測方法は実施例セクションにおいて詳細に記載される。実施形態において、ΔGtot(O-ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAがO-リボソームに結合して、O-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔGo-ribo binding)との和である。
【0116】
実施形態において、ΔGtot(O-ribo)は、以下:
ΔGtot(O-ribo)=(ΔGmRNA-O-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
のように算出されてもよく;
ΔGmRNA-O-rRNAは、直交性16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0117】
特定の実施形態において、上記の値は、(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009))(参照により組み込まれる)において開示されるように算出される。例えば、ΔGspacingは、この刊行物の補足的方法のセクション3において開示されるように算出されてもよい。
【0118】
本発明の方法は反復されてもよく、その結果、複数の改変が許容又は拒絶のために考慮され、最終出力配列は、前記許容された改変のすべての累積的な効果を含む。特に、本発明の方法のステップ(b)~(d)は反復されてもよい。実施形態において、方法は、少なくとも200、300、400、500、1000、5000、又は、特に、10000回反復される。他の実施形態において、方法は、本明細書に開示されるように、連続する反復がより負のΔGtot
new(O-ribo)につながらなくなるまで反復されてもよい。
【0119】
特定の実施形態において、O-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測するステップであって、5’UTRが野生型シャインダルガルノ配列を含む、ステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む改変を5’UTR中に導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップであって;前記ΔGtot
new(O-ribo)と前記ΔGtot(O-ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、ステップ;及び
(e)ステップ(b)~(d)を少なくとも500、1000、5000、又は、特に、10000回反復し、次に
許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。
【0120】
特定の実施形態において、O-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(O-ribo))を予測するステップであって、5’UTRが野生型シャインダルガルノ配列を含む、ステップ;
(b)ORFに最も近接した5’UTRの35ヌクレオチドのいずれか1つにおいて単一のヌクレオチドの変化、挿入、又は欠失を含む改変を導入するステップ;
(c)改変後の新たなΔG
tot(O-ribo)(ΔG
tot
new(O-ribo))を予測するステップ;
(d)前記ΔG
tot
new(O-ribo)が先行するΔG
tot(O-ribo)よりも負である場合に改変を許容し、
前記ΔG
tot
new(O-ribo)が先行するΔG
tot(O-ribo)よりも正である場合に
【数5】
に従って改変を許容又は拒絶するステップ;及び
(e)ステップ(b)~(d)を少なくとも500、1000、5000、又は、特に、10000回反復し、次に
許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。
【0121】
一部の実施形態において、本発明の方法は、O-リボソームによる翻訳の効率が増加され、第2のリボソーム(2nd-リボソーム)による翻訳の効率が減少されるようにO-mRNAを最適化することを含んでもよい。
【0122】
そのため、追加の実施形態において、本発明の方法は、第2のリボソーム(2nd-リボソーム)も含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測するステップ;
(b)5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶するステップ;並びに
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0123】
ステップ(a)の5’UTR配列は、O-mRNAの増加された翻訳が最適化されているO-リボソームのアンチシャインダルガルノ配列に完全に相補的であることが予測されるシャインダルガルノ配列を含んでもよい。このシャインダルガルノ配列は直交性シャインダルガルノ配列(O-SD)として参照される。ステップ(a)の5’UTR配列はO-SDの5ヌクレオチドコアを含んでもよい。実施形態において、O-SDはORFの開始コドンからの5ヌクレオチドである。実施形態において、改変はO-SDの5ヌクレオチドコア中に導入されない。例えば、O-SDはTAATCCCATであってもよく、改変はTCCCA中に導入されない。一部の実施形態において、改変はO-SD中に導入されない。他の実施形態において、5’UTR配列は野生型シャインダルガルノ配列を含んでもよい。
【0124】
本発明の方法の第1のラウンドは、ランダムに生成された5’UTRを有する潜在的なmRNA配列に対して行われてもよい。初期の長さ、最終の長さ、又は考慮されるヌクレオチドのウィンドウの長さは、本明細書に開示されるいずれかであってもよい。5’UTRは、シャインダルガルノ配列以外はランダムな配列であってもよい。シャインダルガルノ配列は、最適なスペーシングであることが予測される、ORFの開始コドンからの5ヌクレオチドであってもよい。
【0125】
2nd-リボソームは野生型リボソーム(「WT-リボソーム)であってもよい。「WT-リボソーム」は、本明細書において使用される場合、対象となる宿主細胞内の内因性mRNAを翻訳する能力を有し、O-mRNAを翻訳する能力がより低いか、又は該能力を有しないリボソームである。例えば、WT-リボソームは、mRNAのRBSと相互作用するための野生型領域を含んでもよい。WT-リボソームの16S rRNA(野生型16S rRNAとして参照される)は野生型配列を含んでもよい。特に、WT-リボソームは野生型アンチシャインダルガルノ配列を含んでもよい。特定の例において、WT-リボソームのすべての構成要素は野生型であってもよい。
【0126】
代替的に、2nd-リボソームは別のO-リボソームであってもよい。例えば、2nd-リボソームは、第1のリボソーム(すなわち、mRNAの増加された翻訳が最適化されているリボソーム)の直交性アンチシャインダルガルノ配列とは異なる第2の直交性アンチシャインダルガルノ配列を含むO-リボソームであってもよい。第2のO-リボソームは、第1のリボソームにより効率的に翻訳されるO-mRNAとは異なるO-mRNAのセットを効率的に翻訳してもよい。
【0127】
ΔGtot(2nd-ribo)値の予測方法は、実施例セクションにおいて詳細に記載される。実施形態において、ΔGtot(2nd-ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAが2nd-リボソームに結合して、2nd-リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔG2nd-ribo binding)との和である。
【0128】
実施形態において、ΔGtot(2nd-ribo)は、以下:
ΔGtot(2nd-ribo)=(ΔGmRNA-2nd-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
のように算出されてもよく;
ΔGmRNA-2nd-rRNAは、16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、ORFの開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0129】
上記の算出は、ΔGtot(O-ribo)について議論されたように行われてもよい。
【0130】
実施形態において、改変は、5’UTR中に導入された単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む。
【0131】
改変は、前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って許容又は拒絶される。「先行するΔGtot(O-ribo)」は上記に議論される通りであり、「先行するΔGtot(2nd-ribo)」は同じ方式において解釈されるべきである。確率分布は、ΔGtot
new(O-ribo)とΔGtot(O-ribo)との間の差異が増加するか、又はΔGtot
new(2nd-ribo)とΔGtot(2nd-ribo)との間の差異が増加するにつれて許容の可能性が減少する条件付き確率に基づいてもよい。確率はモンテ-カルロ最適化であってもよい。
【0132】
本発明の方法は反復されてもよく、その結果、複数の改変が許容又は拒絶のために考慮され、最終出力配列は、前記許容された改変のすべての累積的な効果を含む。特に、本発明の方法のステップ(b)~(d)は反復されてもよい。方法は、少なくとも10、50、100、250、500、1000、2000、3000、5000、又は10000回の連続する反復がより負のΔGtot
new(O-ribo)又はより正のΔGtot
new(2nd-ribo)につながらなくなるまで反復されてもよい。代替的に、方法は、本明細書に開示されるように、設定された回数だけ反復されてもよい。
【0133】
特定の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測するステップであって、5’UTRがO-SDを含む、ステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む改変を5’UTR中に導入するステップであって、改変がO-SD 5ヌクレオチドコア中に導入されない、ステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶するステップであって;前記ΔGtot
new(O-ribo)と前記ΔGtot(O-ribo)との間又は前記ΔGtot
new(2nd-ribo)と前記ΔGtot(2nd-ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、ステップ;並びに
(e)少なくとも10、50、100、250、又は、特に、500回の連続する反復がより負のΔGtot
new(O-ribo)又はより正のΔGtot
new(2nd-ribo)につながらなくなるまでステップ(b)~(d)を反復し;
許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0134】
特定の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測し、式:ΔGtot(opt)=ΔGtot(O-ribo)-X*ΔGtot(2nd-ribo)に従ってΔGtot(opt)を算出するステップ;
(b)単一のヌクレオチドの変化、挿入、又は欠失を含む改変を5’UTR中に導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測し、式:ΔGtot
new(opt)=ΔGtot
new(O-ribo)-X*ΔGtot
new(2nd-ribo)に従ってΔGtot
new(opt)を算出するステップ;
(d)前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に改変を許容し、
前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0135】
一部の実施形態において、Xは、0.1~2の数、特に0.5である。他の例において、Xは、0.1~2、0.15~1.5、0.2~1、0.25~0.9、0.3~0.8、0.35~0.7、0.4~0.6、0.45~0.55、又は0.5の数であってもよい。当業者が理解するように、重み付けが同じ結果のためにΔGtot
new(O-ribo)に対して適用されてもよく、これは上記の式により包含される。重み付けは、特定の特性を優先させるように調整されてもよく、例えば、より高いXは2nd-リボソームによる翻訳の最小化を優先させる一方、より低いXは第1のリボソーム(すなわち、O-mRNAがそのために対象となるO-リボソーム)による翻訳の最大化を優先させる。
【0136】
改変は、前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に許容される。「先行する」ΔGtot(opt)は、改変がなされる前のmRNA配列について予測されたΔGtot(opt)である。本明細書において議論されるように、本発明の方法は反復されてもよく、そのため、先行するΔGtot(opt)は、先行する反復の間に算出されたΔGtot
new(opt)であってもよい。
【0137】
改変は、前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って許容又は拒絶される。「先行するΔGtot(opt)」は上記に議論される通りである。確率分布は、ΔGtot
new(opt)とΔGtot(opt)との間の差異が増加するにつれて許容の可能性が減少する条件付き確率に基づいてもよい。確率はモンテ-カルロ最適化であってもよい。
【0138】
実施形態において、改変がそれに従って許容又は拒絶される確率分布は、以下である:
【数6】
【0139】
TSAは、本明細書に開示されている任意の方式において調整されてもよい。特定の実施形態において、TSAは、5~20%の許容率を維持するように調整される。
【0140】
一部の実施形態において、改変は、本明細書において議論されるように、特定の配列制約が破られた場合に拒絶されてもよい。既に議論された制約に追加して、又はその代替として、改変は、第2のO-SD又は第2のO-SDコアが配列中に導入された場合に拒絶されてもよい。これは、誤った部位からの開始を予防するためである。例えば、配列「TCCCA」(O-SDコアの例)が導入された場合、改変は拒絶されてもよい。
【0141】
本発明の方法は反復されてもよく、その結果、複数の改変が許容又は拒絶のために考慮され、最終出力配列は、前記許容された改変のすべての累積的な効果を含む。特に、本発明の方法のステップ(b)~(d)は反復されてもよい。方法は、少なくとも10、50、100、250、500、1000、2000、3000、5000、又は10000回の連続する反復がより負のΔGtot
new(opt)につながらなくなるまで反復されてもよい。他の実施形態において、方法は、本明細書において議論されるように、設定された回数だけ反復されてもよい。
【0142】
特定の実施形態において、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測し、式:ΔGtot(opt)=ΔGtot(O-ribo)-X*ΔGtot(2nd-ribo)に従ってΔGtot(opt)を算出するステップであって;5’UTRがO-SDを含む、ステップ;
(b)5’UTR中に改変を導入するステップであって、改変がO-SD 5ヌクレオチドコア中に導入されない、ステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測し、式:ΔGtot
new(opt)=ΔGtot
new(O-ribo)-X*ΔGtot
new(2nd-ribo)に従ってΔGtot
new(opt)を算出するステップ;
(d)前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に改変を許容し、
前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップであって;前記ΔGtot
new(opt)と前記ΔGtot(opt)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、ステップ;並びに
(e)少なくとも10、50、100、250、又は、特に、500回の連続する反復がより負のΔGtot
new(opt)につながらなくなるまでステップ(b)~(d)を反復し、次に
許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含み;
Xが、0.1~2の数、特に0.5である、方法が提供される。
【0143】
特定の実施形態において、2
nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2
nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(2
nd-ribo))を予測し、式:ΔG
tot(opt)=ΔG
tot(O-ribo)-X*ΔG
tot(2
nd--ribo)に従ってΔG
tot(opt)を算出するステップであって;5’UTRがO-SDを含む、ステップ;
(b)単一のヌクレオチドの変化、挿入、又は欠失である改変を5’UTR中に導入するステップであって、改変がO-SD 5ヌクレオチドコア中に導入されない、ステップ;
(c)改変後の新たなΔG
tot(O-ribo)(ΔG
tot
new(O-ribo))及び新たなΔG
tot(2
nd-ribo)(ΔG
tot
new(2
nd-ribo)を予測し、式:ΔG
tot
new(opt)=ΔG
tot
new(O-ribo)-X*ΔG
tot
new(2
nd-ribo)に従ってΔG
tot
new(opt)を算出するステップ;
(d)前記ΔG
tot
new(opt)が先行するΔG
tot(opt)よりも負である場合に改変を許容し、
前記ΔG
tot
new(opt)が先行するΔG
tot(opt)よりも正である場合に
【数7】
に従って改変を許容又は拒絶するステップ;
(e)少なくとも10、50、100、250、又は、特に、500回の連続する反復がより負のΔG
tot
new(opt)につながらなくなるまでステップ(b)~(d)を反復し、次に
許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を含み;
Xが、0.1~2の数、特に0.5である、
方法が提供される。
【0144】
O-mRNAを設計する方法は、第1のO-リボソームによる翻訳の効率が増加され、第2のO-リボソーム及びWT-リボソームによる翻訳の効率が減少されるようにO-mRNAを最適化することを含んでもよい。
【0145】
そのような方法は上記に開示される通りであり、mRNAの自由にフォールディングした状態とリボソームに結合した開始適格状態との間の自由エネルギー差は、リボソームの各々について予測される。議論されるように、この予測は、mRNA配列への改変の導入の前及び後になされる。2つより多くのリボソームを含む実施形態において、改変は、ΔGtotが、第1のリボソーム(すなわち、翻訳効率がそのために増加されるリボソーム)についてより負となり、他のリボソームについてより正となる場合に許容されてもよい。ΔGtot値がすべて好都合に変更されない場合、改変は、本明細書に開示されるように確率分布に従って許容又は拒絶されてもよい。ΔGtot値は、許容又は拒絶のために考慮される単一の値を形成するために組み合わせられてもよい。例えば、ΔGtot値は、以下の式ΔGtot(opt)=X*ΔGtot(1st-O-ribo)-Y*ΔGtot(WT-ribo)-Z*ΔGtot(2nd-O-ribo)に従って組み合わせられてもよく、X、Y、及びZは重み付けである。これらの重み付けは、特定の特性(例えば、第1のO-リボソームによる翻訳の最適化又は第2のO-リボソームによる翻訳における減少)を優先させるように調整されてもよい。ΔGtot(opt)は、本明細書に開示されるように許容又は拒絶のために考慮されてもよい。
【0146】
当業者に明らかなように、上記は、第1のO-リボソームによる翻訳の効率が増加され、2、3、4、又は5以上の他のリボソームによる翻訳の効率が減少されるように適合されてもよい。同じ又は異なる重み付けが、翻訳の効率がそのために減少されるリボソームの各々についてのΔGtot値と関連付けられてもよい。ΔGtot(1st-O-ribo)もまた、重み付けと関連付けられてもよい。
【0147】
ORF内のコドンを同義コドンで置き換えることは、O-mRNAの向上につながり得ることを本発明者らはさらに同定した。同義コドンは、同じアミノ酸をコードするコドンであり、それゆえ、シノニムでのセンスコドンの置換えは、コードされるタンパク質の配列を変更しない。そのため、実施形態において、ステップ(b)の改変は、ORF内のコドン2~20、2~15、2~12、2~10、又は2~5のいずれか1つを同義コドンと交換することを含んでもよい。特定の実施形態において、ステップ(b)の改変は、ORF内のコドン2~12のいずれか1つを同義コドンと交換することを含んでもよい。
【0148】
シノニムへのコドンの交換は、5’UTR中への単一のヌクレオチドの変化、挿入、又は欠失の導入の代替であり得る。そのため、ステップ(b)は、単一のヌクレオチドの変化、挿入、若しくは欠失である改変を5’UTR中に導入すること、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つ(特に2~12)を同義コドンと交換することを含んでもよい。
【0149】
そのような実施形態において、生成されるO-mRNA配列は、許容された改変を含む5’UTR及びORFを含む。
【0150】
そのため、追加の実施形態において、本発明の方法は、O-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測するステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む改変を5’UTR中に導入するか、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;並びに
(e)許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0151】
追加の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測するステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む改変を5’UTR中に導入するか、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶するステップ;並びに
(e)許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0152】
特定の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とO-mRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測するステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか若しくはそれを含む改変を5’UTR中に導入するか、又はORF内のコドン2~12のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負であり、前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも正である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合又は前記ΔGtot
new(2nd-ribo)が先行するΔGtot(2nd-ribo)よりも負である場合に確率分布に従って改変を許容又は拒絶するステップであって;前記ΔGtot
new(O-ribo)と前記ΔGtot(O-ribo)との間又は前記ΔGtot
new(2nd-ribo)と前記ΔGtot(2nd-ribo)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、ステップ;並びに
(e)許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法である。
【0153】
別の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測し、式:ΔGtot(opt)=ΔGtot(O-ribo)-X*ΔGtot(2nd-ribo)に従ってΔGtot(opt)を算出するステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失であるか若しくはそれを含む改変を5’UTR中に導入するか、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo))を予測し、式:ΔGtot
new(opt)=ΔGtot
new(O-ribo)-X*ΔGtot
new(2nd-ribo)に従ってΔGtot
new(opt)を算出するステップ;
(d)前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に改変を許容し、
前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;
(e)許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法である。任意に、Xは本明細書に開示されている数である。例えば0.1~2又は、特に、0.5である。
【0154】
別の実施形態において、本発明の方法は、2nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(2nd-ribo))を予測し、式:ΔGtot(opt)=ΔGtot(O-ribo)-X*ΔGtot(2nd-ribo)に従ってΔGtot(opt)を算出するステップであって、5’UTRがO-SDを含む、ステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失である改変を5’UTR中に導入するステップであって、改変がO-SD 5ヌクレオチドコア中に導入されない、ステップ、又はORF内のコドン2~12のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))及び新たなΔGtot(2nd-ribo)(ΔGtot
new(2nd-ribo)を予測し、式:ΔGtot
new(opt)=ΔGtot
new(O-ribo)-X*ΔGtot
new(2nd-ribo)に従ってΔGtot
new(opt)を算出するステップ;
(d)前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも負である場合に改変を許容し、
前記ΔGtot
new(opt)が先行するΔGtot(opt)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップであって;前記ΔGtot
new(opt)と前記ΔGtot(opt)との間の差異の規模が許容の確率を決定し、より小さい規模が、より大きい規模と比較して許容のより高い可能性と関連付けられる、ステップ;並びに
(e)少なくとも10、50、100、250、又は、特に、500回の連続する反復がより負のΔGtot
new(opt)につながらなくなるまでステップ(b)~(d)を反復し、次に
許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法である。任意に、Xは本明細書に開示されている数である。例えば0.1~2又は、特に、0.5である。
【0155】
さらに別の実施形態において、2
nd-リボソームも含む細胞中でのO-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計する方法であって、mRNAが5’UTR及びORFを含み、方法が、
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(O-ribo))を予測し、mRNAの自由にフォールディングした状態とmRNAの2
nd-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔG
tot(2
nd-ribo))を予測し、式:ΔG
tot(opt)=ΔG
tot(O-ribo)-X*ΔG
tot(2
nd-ribo)に従ってΔG
tot(opt)を算出するステップであって、5’UTRがO-SDを含む、ステップ;
(b)単一のヌクレオチドの変化、挿入、若しくは欠失である改変を5’UTR中に導入するステップであって、改変がO-SD 5ヌクレオチドコア中に導入されない、ステップ、又はORF内のコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換するステップ;
(c)改変後の新たなΔG
tot(O-ribo)(ΔG
tot
new(O-ribo))及び新たなΔG
tot(2
nd-ribo)(ΔG
tot
new(2
nd-ribo)を予測し、式:ΔG
tot
new(opt)=ΔG
tot
new(O-ribo)-X*ΔG
tot
new(2
nd-ribo)に従ってΔG
tot
new(opt)を算出するステップ;
(d)前記ΔG
tot
new(opt)が先行するΔG
tot(opt)よりも負である場合に改変を許容し、
前記ΔG
tot
new(opt)が先行するΔG
tot(opt)よりも正である場合に
【数8】
に従って改変を許容又は拒絶するステップ;
(e)少なくとも10、50、100、250、又は、特に、500回の連続する反復がより負のΔG
tot
new(opt)につながらなくなるまでステップ(b)~(d)を反復し、次に
許容された改変を含む5’UTR及びORFを含むO-mRNA配列を生成するステップ
を含む、方法が提供される。任意に、Xは本明細書に開示されている数である。例えば0.1~2又は、特に、0.5である。
【0156】
O-mRNAを設計する方法のいずれも、増強された速度でO-リボソームにより翻訳されるようにO-mRNAを最適化するため及び/又はより直交性となるようにO-mRNAを最適化するために使用されてもよい。最適化された直交性は、O-リボソームによるO-mRNAの翻訳効率と2nd-リボソーム(例えばWT-リボソーム又は第2のO-リボソーム)によるO-mRNAの翻訳効率との間の差異が増加されるようなものであってもよい。これは、O-リボソームの存在下でO-mRNAから産生されるタンパク質の収率を測定すること、及びそれを、2nd-リボソームの存在下でO-mRNAから産生されるタンパク質の収率で割ることにより算出されてもよい。
【0157】
O-mRNAがO-リボソームの存在下にある場合に得られる収率は、最適化されていない配列からの産生と比較して、少なくとも2倍、5倍、10倍、15倍、20倍、25倍、30倍、35倍、又は40倍増加されてもよい。
【0158】
O-mRNAの直交性は、最適化されていない配列の直交性と比較して少なくとも2倍、5倍、10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、又は50倍増加されてもよい。
【0159】
O-mRNAを設計する方法のいずれも、前記O-mRNAをコードする核酸分子を産生するステップをさらに含んでもよい。核酸はDNA配列であってもよく、対象となる宿主細胞への送達に好適なベクター中に含まれてもよい。そのため、前記O-mRNAをコードする核酸分子を含む宿主細胞もまた提供される。
【0160】
O-mRNAを設計する方法のいずれも、O-mRNAを実験的に検証するステップをさらに含んでもよい。そのような実施形態において、O-mRNAからのコードされるタンパク質の収率は、最適化されていないmRNA配列からのタンパク質の収率、又はWT-mRNAによりコードされWT-リボソームにより翻訳される場合のタンパク質の収率と比較されてもよい。追加的に、又は代替的に、実験的検証は、本明細書において議論されるように、O-mRNAの直交性を測定すること、及び任意に、それを最適化されていないmRNAの直交性と比較することを含んでもよい。
【0161】
O-mRNAを設計する方法は、コンピューター上で行われてもよい。そのため、プロセッサー;及び本発明の方法を行うための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体を含む、システムが提供される。追加的に、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本発明の方法を実行させるプログラムコードを保存する非一時的な機械可読媒体を含む、コンピュータープログラム製品もまた提供される。
【0162】
例えば、実施形態において、O-リボソームによる翻訳に好適なO-mRNAであるmRNAを設計するコンピューターにより実行される方法であって、mRNAが5’UTR及びORFを含み、方法が、1又は2以上のプロセッサー上でプログラムコードを実行して、以下のステップ:
(a)mRNAの自由にフォールディングした状態とmRNAのO-リボソームに結合した開始適格状態との間の自由エネルギー差(ΔGtot(O-ribo))を予測するステップ;
(b)5’UTR中に改変を導入するステップ;
(c)改変後の新たなΔGtot(O-ribo)(ΔGtot
new(O-ribo))を予測するステップ;
(d)前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(O-ribo)が先行するΔGtot(O-ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;及び
(e)許容された改変を含む5’UTRを含むO-mRNA配列を生成するステップ
を実行することを含む、方法が提供される。この方法は、本明細書に開示される他の特色又は限定のいずれかを含んでもよい。
【0163】
上記に加えて、本発明者らは、少なくとも2つの外因性tRNAを含むオペロンを設計する驚くべきほどに有効な方法をさらに提供する。本発明者らは、直交性tRNAであってもよい別個のtRNAのコンパクトな、拡張可能な発現のためのオペロンの作出を自動化した。例として、本発明者らは、操作された三重に直交性のPylRS/tRNAPylペア及びアルカエオグロブス・フルギダス(Archaeoglobus fulgidus)チロシル-tRNAシンテターゼ(AfTyrRS)/tRNATyr由来ペアを発現するコンパクトなオペロンを開発し、オペロンは非常に有効であることを実証する。
【0164】
そのため、本発明の態様において、内因性tRNAをコードする内因性ゲノムを含む宿主細胞中での発現のための少なくとも2つの外因性tRNAをコードするオペロンを設計する方法であって、
(i)少なくとも2つの外因性tRNAの配置の並べ替えを生成するステップ;
(ii)内因性ゲノム内で、少なくとも2つの外因性tRNAの各々の並べ替え内の外因性tRNAの各々の隣接するペアに対して最も高いレベルの配列同一性を有する内因性tRNAの隣接するペアを同定するステップ;
(iii)内因性tRNAの同定された隣接するペアの各々の間の内因性ゲノム中の遺伝子間領域を同定するステップ;
(iv)少なくとも2つの外因性tRNAの各々の並べ替えをコードし、外因性tRNAの各々の関連付けられた隣接するペアの間に位置付けられる同定された遺伝子間領域を含む複数の配列を生成するステップ;及び
(v)少なくとも2つの外因性tRNAをコードするオペロン中に含めるための前記複数の配列からの配列を選択するステップ
を含む、方法が提供される。
【0165】
方法は、少なくとも3つ、4つ、5つ、6つ、又は7以上の外因性tRNAをコードするオペロンを設計するための方法であってもよい。しかしながら、外因性tRNAの数は、本発明の方法が応用可能であるために特定の上限を有しない。
【0166】
結果的なオペロンは、第1及び第2の外因性tRNAを含んでもよく、そのため、ステップ(i)は、配置:a)第1及び次に第2のtRNA並びにb)第2及び次に第1のtRNAを生成することを含んでもよい。他の実施形態は、第1、第2、及び第3の外因性tRNAを含んでもよく、そのため、ステップ(i)は、配置:a)第1、次に第2、次に第3のtRNA、b)第1、次に第3、次に第2のtRNA、c)第2、次に第1、次に第3のtRNAなどを生成することを含んでもよい。一部の実施形態において、すべての可能な並べ替えが生成される。
【0167】
上記の並べ替えの各々について、方法は次に、並べ替え内の外因性tRNAの各々のペアを、オペロンがそのために対象となる宿主細胞の内因性ゲノム内の内因性tRNAのペアと関連付けることを含む。関連付けは、隣接する外因性tRNAペアに対して最も高いレベルの配列同一性を有する内因性ゲノム内の隣接するtRNAペアを同定することに基づいてなされる。例えば、並べ替えが「第1、次に第3、次に第2のtRNA」である場合、第1及び第3のtRNAに対して最も高いレベルの配列同一性を有する内因性の隣接するtRNAペアが同定され、第3及び第2のtRNAに対して最も高いレベルの配列同一性を有する内因性の隣接するtRNAペアが同定される。
【0168】
配列同一性は、内因性tRNAのアクセプターステム配列を外因性tRNAのアクセプターステム配列と比較することにより決定されてもよい。特に、tRNAの最初の7ヌクレオチド、及びCCA末端を含まない最後の8ヌクレオチドが比較されてもよい。
【0169】
tRNAの内因性ペアの間の遺伝子間領域が同定される場合、方法は、考慮される最小及び/又は最大遺伝子間領域に関する限度を任意に設定してもよい。例えば、考慮される最小遺伝子間領域は、5、10、15、20、又は25塩基対であってもよい。特定の実施形態において、考慮される最小遺伝子間領域は10塩基対である。考慮される最大遺伝子間領域は、50、75、100、125、又は150塩基対であってもよい。特定の実施形態において、考慮される最大遺伝子間領域は100塩基対である。1つの実施形態において、考慮される最小遺伝子間領域は10塩基対であり、最大は100塩基対である。
【0170】
外因性tRNAの並べ替え及び遺伝子間配列をコードする複数の配列が次に生成されてもよい。例えば、配列の1つは、先行する例「第1、次に第3、次に第2のtRNA」をコードすることができ、第1のtRNAと第3のtRNAとの間に、第1及び第3のtRNAに最も類似した内因性tRNAのペアと関連付けられる遺伝子間配列があり、第3のtRNAと第2のtRNAとの間に、第3及び第2のtRNAに最も類似した内因性tRNAのペアと関連付けられる遺伝子間配列がある。
【0171】
配列は次に、外因性tRNAをコードするオペロン中に含めるために複数の配列から選択されてもよい。一部の実施形態において、複数の配列は、少なくとも2つの外因性tRNAと、遺伝子間領域を定義するために使用される対応する内因性tRNAとの間の配列同一性の和に基づいて順位付けされる。選択は次に、順位付けされたリストからなされてもよく、例えば、最も高い同一性の配列が選択されてもよい。
【0172】
tRNAオペロンを設計する方法のステップが、先行するステップの出力に対して行われる場合を除いて、ステップの順序は限定されない。例えば、内因性ゲノム内の内因性tRNAの隣接するペア及び遺伝子間領域は、本発明の方法が開始される前又は前記方法の間に同定されてもよい。内因性ゲノム内の内因性tRNAの隣接するペア及び遺伝子間領域のリストは、本発明の方法のステップ(i)の前に予め用意されてもよい。
【0173】
tRNAオペロンを設計する方法は、第1のtRNAをコードする第1の配列及び第2のtRNAをコードする第2の配列、並びに対象となる宿主細胞に由来する遺伝子間配列を少なくとも含むオペロンを結果としてもたらす。
【0174】
一部の実施形態において、オペロンは他のORFを含んでもよい。tRNAは、複数のmRNAが1つのプロモーターから生成され得るように他のORFを置くために使用されてもよい。そのような実施形態において、tRNAオペロンを設計する方法は、これらのtRNAの隣接領域を最適化するために使用されてもよい。
【0175】
tRNAオペロンを設計する方法のいずれも、前記tRNAオペロンをコードする核酸分子を産生するステップをさらに含んでもよい。核酸はDNA配列であってもよく、対象となる宿主細胞への送達に好適なベクター中に含まれてもよい。そのため、前記tRNAオペロンをコードする核酸分子を含む宿主細胞もまた提供される。
【0176】
tRNAオペロンを設計する方法のいずれも、tRNAオペロンを実験的に検証するステップをさらに含んでもよい。そのような実施形態において、コードされるtRNAの収率は、オペロンが好適な宿主細胞中に挿入された場合に測定されてもよい。
【0177】
本発明の態様において、内因性ゲノムを含む宿主細胞であって、宿主細胞が、少なくとも2つの外因性tRNAを含むオペロンをコードする核酸を含み、外因性tRNAの各々のペアの間の核酸配列が、内因性ゲノムに由来する遺伝子間配列である、宿主細胞が提供される。オペロンは、本発明のtRNAオペロンを設計する方法により得られた又は得ることができるものであってもよい。そのため、遺伝子間配列は、外因性tRNAに対して最も高い同一性を有する内因性tRNAのペアの間からの遺伝子間配列である。宿主細胞はまた、遺伝子間配列が由来した内因性tRNAを含んでもよい。他の実施形態において、1又は2以上の内因性tRNAが宿主細胞から欠失する。
【0178】
tRNAオペロンを設計する方法はコンピューター上で実行されてもよい。そのため、プロセッサー;及び本発明の方法を行うための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体を含む、システムが提供される。選択ステップは、手動で行われてもよいか、又は自動化されてもよい。追加的に、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本発明の方法を実行させるプログラムコードを保存する非一時的な機械可読媒体を含む、コンピュータープログラム製品もまた提供される。
【0179】
そのため、内因性tRNAをコードする内因性ゲノムを含む宿主細胞中での発現のための少なくとも2つの外因性tRNAをコードするオペロンを設計するコンピューターにより実行される方法であって、1又は2以上のプロセッサー上でプログラムコードを実行して、以下のステップ:
(i)少なくとも2つの外因性tRNAの配置の並べ替えを生成するステップ;
(ii)内因性ゲノム内で、少なくとも2つの外因性tRNAの各々の並べ替え内の外因性tRNAの各々の隣接するペアに対して最も高いレベルの配列同一性を有する内因性tRNAの隣接するペアを同定するステップ;
(iii)内因性tRNAの同定された隣接するペアの各々の間の内因性ゲノム中の遺伝子間領域を同定するステップ;及び
(iv)少なくとも2つの外因性tRNAの各々の並べ替えをコードし、外因性tRNAの各々の関連付けられた隣接するペアの間に位置付けられる同定された遺伝子間領域を含む複数の配列を生成するステップ;及び任意に
(v)少なくとも2つの外因性tRNAをコードするオペロン中に含めるための前記複数の配列からの配列を選択するステップ
を実行することを含む、方法が提供される。この方法は、本明細書に開示される他の特色又は限定のいずれかを含んでもよい。
【0180】
本発明者らは、宿主細胞中での発現のための少なくとも2つの外因性遺伝子をコードするポリシストロン性オペロンを設計する驚くべきほどに有効な方法をさらに提供する。本発明者らは、本明細書に記載される方法が、宿主細胞中での4つの外因性aaRSの高発現を達成するために使用され得ることを実証する実験データを本明細書において提供する。
【0181】
そのため、本発明の態様において、宿主細胞中での発現のための少なくとも2つの外因性ORFを含むオペロンを設計する方法であって、
(i)少なくとも2つの外因性ORFの各々のための複数の5’UTR配列を生成するステップであって、各々の5’UTR配列が、前記5’UTR配列及び外因性ORFを含むmRNAの自由にフォールディングした状態と、前記mRNAのリボソームに結合した開始適格状態との間の負の予測される自由エネルギー差(ΔGtot(ribo))について最適化されている、ステップ;
(ii)前記5’UTRが最適化された外因性ORFに対して5’に位置付けられ、少なくとも2つの外因性ORFの残りの各々の外因性ORFに対して3’に位置付けられた場合の5’UTR配列の各々についてのΔGtot(ribo)を予測するステップ;並びに
(iii)5’UTR配列及び少なくとも2つの外因性ORFの配置を選択するステップ
を含む、方法が提供される。
【0182】
ステップ(i)は、少なくとも2つの外因性ORFの各々のための2、3、4、5、又は6以上の5’UTR配列を生成することを含んでもよい。一部の例において、6、7、8、9、10、15、20又は21以上の5’UTR配列が生成される。特定の実施形態において、5つの5’UTR配列が各々の外因性ORFのために生成される。例えば、オペロンが3つの外因性ORFを含む場合、各々の外因性ORFのための5つのセットである15個の5’UTR配列が生成されてもよい。
【0183】
各々の5’UTR配列は、前記5’UTR配列及び外因性ORFを含むmRNAの自由にフォールディングした状態と、前記mRNAのリボソームに結合した開始適格状態との間の負の予測される自由エネルギー差(ΔGtot(ribo))について最適化される。そのため、各々の5’UTRは、リボソームによる効率的な翻訳について最適化される。
【0184】
ΔGtot(ribo)の予測方法は実施例セクションにおいて詳細に記載される。実施形態において、ΔGtot(ribo)は、mRNAをアンフォールディングさせるために要求される自由エネルギー(ΔGunfolding)と、mRNAがリボソームに結合して、リボソームに結合した開始適格状態を形成する際に放出される自由エネルギー(ΔGribo binding)との和である。
【0185】
実施形態において、ΔGtot(ribo)は、以下:
ΔGtot(ribo)=(ΔGmRNA-rRNA+ΔGstart+ΔGspacing-ΔGstandby)+ΔGunfolding
に従って予測され;
ΔGmRNA-rRNAは、16S rRNAの最後の9ヌクレオチド及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり;
ΔGstartは、外因性ORFをコードする配列の開始コドンへの開始tRNAの結合から放出されるエネルギーであり;
ΔGspacingは、シャインダルガルノ配列と外因性ORFをコードする配列の開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーであり;
ΔGstandbyは、シャインダルガルノ配列の上流の4ヌクレオチドを隔離する二次構造をアンフォールディングさせるために要求されるエネルギーであり;
ΔGunfoldingは、mRNA中の二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0186】
さらなる情報がO-mRNA最適化に関して提供される。
【0187】
リボソームによる効率的な翻訳のために5’UTRを最適化する方法は、
(a)5’UTR中に改変を導入するステップ;
(b)改変後の新たなΔGtot(ribo)(ΔGtot
new(ribo))を予測するステップ;
(c)前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも負である場合に改変を許容し、
前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも正である場合に確率分布に従って改変を許容又は拒絶するステップ;及び
(d)許容された改変を含む5’UTR配列を生成するステップ
を含んでもよい。
【0188】
方法は、O-mRNA最適化に関して記載される通りであってもよい。
【0189】
本発明の方法の間に、前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも負である場合に改変は許容される。「先行する」ΔGtot(ribo)は、改変がなされる前に予測されたΔGtot(ribo)である。本明細書において議論されるように、本発明の方法は反復されてもよく、そのため、先行するΔGtot(ribo)は、先行する反復の間に算出されたΔGtot
new(ribo)であってもよい。
【0190】
本発明の方法の間の改変の許容は、改変により導入された配列変更が、方法の次の反復のために維持されるか、又は、方法のさらなる反復がない場合、方法の出力である配列において維持されることを意味する。
【0191】
本発明の方法の間に、改変は、前記ΔGtot
new(ribo)が先行するΔGtot(ribo)よりも正である場合に確率分布に従って許容又は拒絶される。「先行するΔGtot(ribo)」は上記に議論される通りである。確率分布は、ΔGtot
new(ribo)とΔGtot(ribo)との間の差異が増加するにつれて許容の可能性が減少する条件付き確率に基づいてもよい。確率はモンテ-カルロ最適化であってもよい。
【0192】
実施形態において、改変がそれに従って許容又は拒絶される確率分布は、
【数9】
であり、T
SAはシミュレートされたアニーリング温度である。
【0193】
TSAは、本明細書に開示されている任意の方式において調整されてもよい。特定の実施形態において、TSAは、5~20%の許容率を維持するように調整される。
【0194】
本発明の方法の間の改変の拒絶は、改変により導入された配列変更が、元に戻され、そのため方法の次の反復のために維持されないか、又は出力配列において維持されないことを意味する。
【0195】
実施形態において、改変は、単一のヌクレオチドの変化、挿入、若しくは欠失であるか又はそれを含む。別の実施形態において、改変は、5’UTR中に導入されるか、又は外因性ORFをコードする配列内でコドン2~20、2~15、2~12、2~10、若しくは2~5のいずれか1つを同義コドンと交換することである。特定の実施形態において、改変は、5’UTR中への単一のヌクレオチドの変化、挿入、若しくは欠失、又はORF内のコドン2~12のいずれか1つを同義コドンと交換することを含む。
【0196】
少なくとも2つの外因性ORFを含むオペロンを設計する方法は反復されてもよく、その結果、複数の改変が許容又は拒絶のために考慮され、最終出力配列は、前記許容された改変のすべての累積的な効果を含む。反復は、本明細書に開示されているいずれかであってもよい。特に、本発明の方法のステップ(a)~(c)は反復されてもよい。実施形態において、方法は、少なくとも200、300、400、500、1000、5000、又は、特に、10000回反復される。他の実施形態において、方法は、本明細書に開示されるように、連続する反復がより負のΔGtot
new(ribo)につながらなくなるまで反復されてもよい。例えば、ステップ(a)~(c)は、少なくとも10、50、100、250、500、1000、2000、3000、5000、又は10000回の連続する反復がより負のΔGtot
new(ribo)につながらなくなるまで反復されてもよい。
【0197】
最適化のために考慮される初期5’UTRは、O-mRNA最適化に関して記載されるような長さ及び特性を有してもよい。特に、初期5’UTRは、30~40ヌクレオチド長、又は特に35ヌクレオチドであってもよい。代替的に、5’UTRはより長くてもよいが、30~40、又は特に35ヌクレオチドウィンドウが改変のために本発明の方法により考慮される。35ヌクレオチドウィンドウは、開始コドンに最も近接した5’UTRの35ヌクレオチドであってもよい。他の実施形態において、初期5’UTRは、より短い、例えば15、20、若しくは25ヌクレオチドの5’UTR、又はより長い、例えば少なくとも40、50、若しくは51以上のヌクレオチドであってもよい。特定の長さの5’UTRを生成することが望ましいことがあり、その場合、出力配列の特定の長さが達成され得るように15、20、25、30、35、45、50ヌクレオチドウィンドウが考慮されてもよい。ステップ(a)が適用される5’UTRは、野生型シャインダルガルノ配列、又は野生型シャインダルガルノ配列の5ヌクレオチドコアを含んでもよい。5’UTRは、シャインダルガルノ配列以外はランダムな配列であってもよい。シャインダルガルノ配列は、最適なスペーシングであることが予測される、ORFの開始コドンからの5ヌクレオチドであってもよい。
【0198】
少なくとも2つの外因性ORFを含むオペロンを設計する方法は、外因性ORFの特有の数に限定されない。例えば、方法は、少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つの外因性ORFを含むオペロンを設計するために使用されてもよい。
【0199】
少なくとも2つの外因性ORFを含むオペロンを設計する方法は、外因性ORFの特定のタイプとの使用に限定されない。本明細書において提供される実験データは、aaRSをコードする複数の配列を含むオペロンのための原理の証明を提供する。そのため、実施形態において、外因性ORFのうちの少なくとも1つはaaRSをコードする。別の実施形態において、方法は、少なくとも2、3、4、5、又は6つのaaRSをコードするポリシストロン性オペロンを設計するための方法であってもよい。
【0200】
ポリシストロン性オペロンを設計する方法のステップ(ii)は、前記5’UTRが最適化された外因性ORFに対して5’に位置付けられ、少なくとも2つの外因性ORFの残りの各々の外因性ORFに対して3’に位置付けられた場合の5’UTR配列の各々についてのΔG
tot(ribo)を予測することを含む(
図7、補足
図3を参照)。そのため、外因性ORFのうちの1つの翻訳について最適化された5’UTRは次に、他の外因性ORFのうちの1つの3’に位置付けられている文脈において考慮され、翻訳効率が再び測定される。これは、他の外因性ORFの各々について行われる。例えば、オペロンが3つの外因性ORFを有する実施形態において、第1の外因性ORFについて最適化された特定の5’UTRは、第2の外因性ORFの3’に配置されている場合に、及び別々に、第3の外因性ORFの3’に配置されている場合に考慮される。
【0201】
ポリシストロン性オペロンを設計する方法のステップ(iii)は、5’UTR配列及び少なくとも2つの外因性ORFの配置の選択を含む。選択される配置は、各々の外因性ORFが高いレベルで翻訳されることが予測されるように選択されてもよい。例えば、オペロン内の各々の5’UTR/外因性ORFペアについてのΔGtot(ribo)が予測され、加えられてもよく、最も負の累積的なΔGtot(ribo)を有する配置が選択されてもよい。他の実施形態において、オペロン内のすべての5’UTR/外因性ORFペアについての最も負の平均ΔGtot(ribo)を有する配置が選択されてもよい。平均は平均値(mean)であってもよい。追加的に、各々の5’UTR/外因性ORFペアが標的ΔGtot(ribo)よりも負のΔGtot(ribo)を有する配置が選択されてもよい。標的は、宿主細胞内での各々の外因性ORFの産物の特定の収率を確実にするために選択されてもよい。例えば、標的は、タンパク質生成物がその機能を達成するために十分なレベルで外因性ORFが翻訳されることを確実にするレベルであってもよい。例えば、外因性ORFがaaRSをコードする場合、標的ΔGtot(ribo)は、十分なaaRSタンパク質が、所望される宿主細胞中で産生されて、aaRSがタンパク質合成の間にそのコグネイトtRNAと共に機能することを確実にするようなものであってもよい。
【0202】
特定の実施形態において、ステップ(iii)は、オペロン内のすべての5’UTR/外因性ORFペアについての最も負の平均ΔGtot(ribo)を有する配置の選択を含み、各々の5’UTR/外因性ORFペアは、標的ΔGtot(ribo)よりも負のΔGtot(ribo)を有する。
【0203】
外因性ORFを含むオペロンを設計する方法のいずれも、前記オペロンをコードする核酸分子を産生するステップをさらに含んでもよい。核酸は、DNA配列であってもよく、対象となる宿主細胞への送達に好適なベクター中に含まれてもよい。
【0204】
外因性ORFをコードするオペロンを設計する方法のいずれも、オペロンを実験的に検証するステップをさらに含んでもよい。そのような実施形態において、コードされるタンパク質の収率は、オペロンが好適な宿主細胞中に挿入された場合に測定されてもよい。実験的検証は、5’UTR配列及び少なくとも2つの外因性ORFの配置を選択することの部分を形成してもよい。
【0205】
本発明の態様において、少なくとも2つの外因性ORFを含むオペロンをコードする核酸を含む、宿主細胞であって、オペロンが、本明細書に開示されるオペロンを設計する方法により得られた又は得ることができる、宿主細胞が提供される。
【0206】
少なくとも2つの外因性ORFを含むポリシストロン性オペロンを設計する方法はコンピューター上で実行されてもよい。一部の実施形態において、ステップ(iii)は手動で行われてもよい。そのため、プロセッサー;及び本発明の方法を行うための前記プロセッサー上の実行のための命令が記憶された1又は2以上のコンピューター可読ストレージ媒体を含む、システムが提供される。追加的に、コンピューターシステムの1又は2以上のプロセッサーにより実行された場合に、コンピューターシステムが本発明の方法を実行させるプログラムコードを保存する非一時的な機械可読媒体を含む、コンピュータープログラム製品もまた提供される。
【0207】
そのため、宿主細胞中での発現のための少なくとも2つの外因性ORFを含むオペロンを設計するコンピューターにより実行される方法であって、1又は2以上のプロセッサー上でプログラムコードを実行して、以下のステップ:
(i)少なくとも2つの外因性ORFの各々のための複数の5’UTR配列を生成するステップであって、各々の5’UTR配列が、前記5’UTR配列及び外因性ORFを含むmRNAの自由にフォールディングした状態と、前記mRNAのリボソームに結合した開始適格状態との間の負の予測される自由エネルギー差(ΔGtot(ribo))について最適化されている、ステップ;
(ii)前記5’UTRが最適化された外因性ORFに対して5’に位置付けられ、少なくとも2つの外因性ORFの残りの各々の外因性ORFに対して3’に位置付けられた場合の5’UTR配列の各々についてのΔGtot(ribo)を予測するステップ;並びに任意に
(iii)5’UTR配列及び少なくとも2つの外因性ORFの配置を選択するステップ
を実行することを含む、方法が提供される。この方法は、本明細書に開示される他の特色又は限定のいずれかを含んでもよい。
【0208】
本発明者らは、上記の進歩のすべてを組み合わせて、68コドン、24アミノ酸の遺伝コードを作出すること、及び、O-mRNAのO-リボソーム媒介性翻訳を介して、4つの別個の直交性コドンに応答して4つの別個のncAAを効率的に組み込むことに成功した。実施例セクションにおいて議論されるように、本発明者らは、初めて、20個の標準アミノ酸及び4個の非標準アミノ酸を含むタンパク質を生成するためにこのシステムを使用する。
【0209】
そのため、本発明の態様において、宿主細胞であって、
外因性タンパク質をコードするO-mRNAをコードする核酸配列であって、O-mRNAが、本発明のO-mRNAを設計する任意の方法により得られた又は得ることができ、O-mRNAが少なくとも2つのタイプの直交性コドンを含む、核酸配列;
少なくとも2つの直交性tRNAをコードするO-tRNAオペロンを含む核酸配列であって、少なくとも2つの直交性tRNAが、前記少なくとも2つのタイプの直交性コドンをデコードする能力を有し、オペロンが、本発明のtRNAオペロンを設計する任意の方法により得られた又は得ることができる、核酸配列;
少なくとも2つのO-aaRSオペロンをコードする直交性アミノアシル-tRNAシンテターゼ(O-aaRS)を含む核酸配列であって、少なくとも2つのO-aaRSが、少なくとも2つの直交性tRNAとO-aaRS - O-tRNAペアを形成し、オペロンが、本発明のtRNAオペロンを設計する任意の方法により得られた又は得ることができる、核酸配列;及び
直交性リボソーム
を含む、宿主細胞が提供される。
【0210】
実施形態において、O-tRNA及びO-aaRSオペロンは、同じ核酸配列内に存在する。例えば、これらの2つのオペロンは、単一のベクターを介して宿主細胞中に導入されていてもよい。
【0211】
O-mRNAによりコードされる外因性タンパク質は、産生が所望される任意のタンパク質であってもよい。例えば、外因性タンパク質は、治療用タンパク質、例えば抗体又はサイトカインであってもよい。
【0212】
宿主細胞は、少なくとも2つのO-aaRS及び少なくとも2つのO-tRNAを含む。これらはペアにおいて機能し、すなわち、それらは第1のaaRS/tRNAペア及び第2のaaRS/tRNAペアを形成する。1つのペアは、直交性コドンのタイプのうちの1つをデコードする能力を有し、他のペアは、直交性コドンの他のタイプをデコードする能力を有する。両方のペアは、O-リボソームと共に機能する能力を有する。
【0213】
他の実施形態において、本発明の宿主細胞は、少なくとも第3及び任意に少なくとも第4のO-aaRS - O-tRNAペアを含む。そのような実施形態において、O-mRNAは、少なくとも第3及び任意に少なくとも第4のタイプの直交性コドンを含んでもよい。第3のaaRS-tRNAペアは、第3のタイプの直交性コドンをデコードする能力を有し、第4のaaRS-tRNAペアは、第4のタイプの直交性コドンをデコードする能力を有する。O-aaRS、O-tRNA、及び直交性コドンのさらなるセットが含まれてもよい。すべての直交性構成要素は、O-リボソームと共に機能する能力を有する。
【0214】
O-aaRSは、内因性tRNAを認識せず、細胞に提供される(又は細胞により合成される)非標準アミノ酸を用いて直交性コグネイトtRNA(内因性シンテターゼのための効率的な基質ではない)を特異的にアミノアシル化する(Chin, J.W. Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017))。
【0215】
O-リボソームは、本明細書に開示されるいずれかであってもよい。特に、O-リボソームは、O-riboQ1、国際公開第2008/065398A1号パンフレットにおいて開示されているか若しくは該文献において開示されている方法により得ることが可能である任意のO-リボソーム、国際公開第2011/077075A1号パンフレットにおいて開示されているか若しくは該文献において開示されている方法により得ることが可能である任意のO-リボソーム、又は(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010);Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007);若しくはSchmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018))のいずれかにおいて開示されているか若しくは該文献において開示されている方法により得ることが可能である任意のO-リボソームであってもよい。
【0216】
本明細書において使用されるアミノアシル-tRNAシンテターゼは様々であってもよい。特有のtRNAシンテターゼ配列が実施例において使用されている場合があるが、本発明は、それらの実施例のみに限定されることは意図されない。原理的に、tRNAを荷電させる(アミノアシル化)機能を提供し、O-リボソームと共に機能する任意のアミノアシル-tRNAシンテターゼが用いられ得る。例えば、tRNAシンテターゼは、任意の好適な種、例えば古細菌、例えばメタノサルシナ(Methanosarcina)、例えばメタノサルシナ・バルケリ(Alethanosarcina barkeri)MS;メタノサルシナ・バルケリFusaro株;メタノサルシナ・マゼイG01;メタノサルシナ・アセチボランス(Methanosarcina acetivorans)C2A;メタノサルシナ・サーモフィラ(Methanosarcina thermophila);又はメタノコッコイデス(Methanococcoides)、例えばメタノコッコイデス・ブルトニイ(Methanococcoides burtonii)からのものであってもよい。代替的に、tRNAシンテターゼは、細菌、例えばデスルフィトバクテリウム(Desulfitobacterium)、例えばデスルフィトバクテリウム・ハフニエンセDCB-2;デスルフィトバクテリウム・ハフニエンセY51;デスルフィトバクテリウム・ハフニエンセPCP1;又はデスルフォトマクラム・アセトキシダンス(Desulfotomaculum acetoxidans)DSM 771からのものであってもよい。
【0217】
アミノアシル-tRNAシンテターゼはピロリシルtRNAシンテターゼ(PylRS)であってもよい。PylRSは、野生型又は遺伝子操作されたPylRSであってもよい。遺伝子操作されたPylRSは、例えば、Neumann et al. (Nat Chem Biol 4:232, 2008)及びYanagisawa et al. (Chem Biol 2008, 15:1187)、欧州特許出願公開第2192185A1号明細書、及び国際公開第2016/066995号パンフレット(各々は参照により本明細書に組み込まれる)において記載されている。好適には、非標準アミノ酸の組込み効率を増加させる遺伝子操作されたtRNAシンテターゼ遺伝子が選択される。PylRSはメタノサルシナ・バルケリ(MbPylRS)又はメタノサルシナ・マゼイ(MmPylRS)であってもよい。
【0218】
本明細書において使用されるtRNAは様々であってもよい。特有のtRNAが実施例において使用されている場合があるが、本発明は、それらの実施例のみに限定されることは意図されない。原理的に、選択されたtRNAシンテターゼ及びO-リボソームと適合性である限り、任意のtRNAが使用され得る。
【0219】
tRNAは、任意の好適な種、例えば古細菌、例えばメタノサルシナ、例えばメタノサルシナ・バルケリMS;メタノサルシナ・バルケリFusaro株;メタノサルシナ・マゼイG01;メタノサルシナ・アセチボランスC2A;メタノサルシナ・サーモフィラ;又はメタノコッコイデス、例えばメタノコッコイデス・ブルトニイからのものであってもよい。代替的に、tRNAは、細菌、例えばデスルフィトバクテリウム、例えばデスルフィトバクテリウム・ハフニエンセDCB-2;デスルフィトバクテリウム・ハフニエンセY51;デスルフィトバクテリウム・ハフニエンセPCP1;又はデスルフォトマクラム・アセトキシダンスDSM 771からのものであってもよい。
【0220】
tRNA遺伝子は野生型tRNA遺伝子であることができるか、又は変異型tRNA遺伝子であってもよい。好適には、非天然アミノ酸の組込み効率を増加させる変異型tRNA遺伝子が選択される。1つの実施形態において、変異型tRNA遺伝子は、Biochemistry (2013) 52, 10(参照により本明細書に組み込まれる)に記載されているPylTのU25Cバリアントである。
【0221】
1つの実施形態において、変異型tRNA遺伝子は、Fan et al. (Nucleic Acids Research doi:10.1093/nar/gkv800)(参照により本明細書に組み込まれる)に記載されているPylTのOptバリアントである。
【0222】
1つの実施形態において、変異型tRNA遺伝子は、PylTのU25Cバリアント及びOptバリアントの両方を有し、すなわちこの実施形態において、tRNA、例えばPylT tRNACUA遺伝子は、U25C変異及びOpt変異の両方を含む。
【0223】
1つの実施形態において、tRNAをコードする配列は、tRNAPylをコードするメタノサルシナ・マゼイピロリシンからのピロリシンtRNA(PylT)遺伝子である。
【0224】
アミノアシル-tRNAシンテターゼ及びtRNAペアは、(Cervettini, D. et al. Rapid discovery and evolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs. Nat. Biotechnol. 38, 989-999 (2020))又は(Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020))において開示されているか、又は開示されているものから適合されたものであってもよい。これらの文献の各々は参照により組み込まれる。
【0225】
aaRS、tRNA、及びコドンセットは、好ましくは、一緒に機能し、各々の内因性アミノ酸、aaRS及びイソアクセプターtRNAの基及びコドンのそれらのコグネイト基に対して直交性である。
【0226】
直交性コドンのうちの少なくとも1つはクアドルプレットコドンであってもよい。直交性コドンのうちの少なくとも1つは、終止コドン、例えばアンバーコドンであってもよい。直交性コドンのうちの少なくとも1つは、ゲノム再コードされた原核細胞における再割り当てされたセンスコドンであってもよい(国際公開第2020/229592号パンフレット;又はRobertson et al.; Sense codon reassignment enables viral resistance and encoded polymer synthesis; Science; 2021; Vol. 372, Issue 6546, pp. 1057-1062を参照)。特定の実施形態において、直交性コドンのすべてはクアドルプレットコドンであってもよい。特定の実施形態において、O-mRNAは、第1、第2、第3、及び第4のタイプの直交性コドンを含み、これらの各々はクアドルプレットコドンである。
【0227】
宿主細胞は原核細胞であってもよい。宿主細胞は、細菌細胞、例えば大腸菌であってもよい。宿主細胞は、20個すべての標準アミノ酸及び少なくとも4個の非標準アミノ酸を含むタンパク質を産生する能力を有してもよい。
【0228】
直交性tRNAシンテターゼの基質は任意の非標準アミノ酸であってもよい。それゆえ、本発明の細胞は、少なくとも第1の非標準アミノ酸、少なくとも第2の非標準アミノ酸、少なくとも第3の非標準アミノ酸、及び少なくとも第4の非標準アミノ酸を含むポリペプチドを生成するために使用されてもよい。
【0229】
そのため、本発明の別の態様において、ポリペプチドを産生する方法であって、
本発明の宿主細胞を用意するステップ;
第1の非標準アミノ酸の存在下で宿主細胞をインキュベートするステップであって、第1の非標準アミノ酸がO-aaRSのうちの1つの基質である、ステップ;及び
宿主細胞をインキュベートして、O-aaRS - O-tRNAペアを介するポリペプチド中への第1の非標準アミノ酸の組込みを可能とするステップ
を含む、方法が提供される。
【0230】
議論されるように、宿主細胞は、第1、第2、第3、及び第4の直交性aaRS-tRNAペアを含んでもよい。第1のペアは、第1のタイプのコドンをデコードして第1の非標準アミノ酸を組み込む能力を有し、第2のペアは、第2のタイプのコドンをデコードして第2の非標準アミノ酸を組み込む能力を有し、第3のペアは、第3のタイプのコドンをデコードして第3の非標準アミノ酸を組み込む能力を有し、第4のペアは、第4のタイプのコドンをデコードして第4の非標準アミノ酸を組み込む能力を有する。
【0231】
本明細書において使用される場合、用語「非標準アミノ酸」は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リジン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-スレオニン、L-バリン、L-トリプトファン、及びL-チロシンを除く任意のアミノ酸を意味する。
【0232】
非標準アミノ酸は非天然アミノ酸であってもよい。本明細書において使用される場合、「非天然アミノ酸」は、天然にコードされることも遺伝コード中に見出されることもない任意のアミノ酸である。そのようなアミノ酸は非タンパク質構成性アミノ酸であってもよい。そのため、非天然アミノ酸は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リジン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-スレオニン、L-バリン、L-トリプトファン及びL-チロシン、L-ピロリシン、及びL-セレノシステインを除く任意のアミノ酸であってもよい。
【0233】
本発明と共に使用するのに好適な非標準アミノ酸は特に限定されない。好適な非標準アミノ酸は当業者に周知であり、例えばNeumann, H., 2012. FEBS letters, 586(15), pp.2057-2064;及びLiu, C.C. and Schultz, P.G., 2010. Annual review of biochemistry, 79, pp.413-444(参照により本明細書に組み込まれる)において開示されているものがある。一部の実施形態において、非標準アミノ酸は、p-アセチルフェニルアラニン、m-アセチルフェニルアラニン、O-アリルチロシン、フェニルセレノシステイン、セレノシステイン、p-プロパルギルオキシフェニルアラニン、p-アジドフェニルアラニン、p-ボロノフェニルアラニン、O-メチルチロシン、p-アミノフェニルアラニン、p-シアノフェニルアラニン、m-シアノフェニルアラニン、p-フルオロフェニルアラニン、p-ヨードフェニルアラニン、p-ブロモフェニルアラニン、p-ニトロフェニルアラニン、L-DOPA、3-アミノチロシン、3-ヨードチロシン、p-イソプロピルフェニルアラニン、3-(2-ナフチル)アラニン、ビフェニルアラニン、ホモグルタミン、D-チロシン、p-ヒドロキシフェニル乳酸、2-アミノカプリル酸、ビピリジルアラニン、HQ-アラニン、p-ベンゾイルフェニルアラニン、o-ニトロベンジルシステイン、o-ニトロベンジルセリン、4,5-ジメトキシ-2-ニトロベンジルセリン、o-ニトロベンジルリジン、o-ニトロベンジルチロシン、2-ニトロフェニルアラニン、ダンシルアラニン、p-カルボキシメチルフェニルアラニン、3-ニトロチロシン、スルホチロシン、アセチルリジン、メチルヒスチジン、2-アミノノナン酸、2-アミノデカン酸、ピロリシン、Cbz-リジン、Boc-リジン、アリルオキシカルボニルリジン、Nε-((tert-ブトキシ)カルボニル)-L-リジン(BocK)、Nε-(カルボベンジルオキシ)-L-リジン(CbzK)、Nε-アリルオキシカルボニル-L-リジン(AllocK)、(S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(p-I-Phe)、CypK、AlkK、3-ニトロ-Tyr、及びp-Az-Pheのうちの1又は2以上から選択される。第1、第2、及び第3の非標準アミノ酸は、上述の非標準アミノ酸の任意の組合せであってもよい。
【0234】
特定の実施形態において、非標準アミノ酸は、BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-ニトロ-Tyr、及びp-Az-Pheの任意の組合せであってもよい。
【0235】
本発明の宿主細胞は、任意の他の方法では得ることが可能でない産物を生成するために使用され得る。そのため、本発明の態様において、本明細書に開示される方法により得られた又は得ることができる、少なくとも4つの遺伝子的に組み込まれた非標準アミノ酸を含有するポリペプチド又はタンパク質が提供される。
【0236】
配列比較は、容易に利用可能な配列比較プログラムの補助と共に実行され得る。これらの公的に及び商業的に利用可能なコンピュータープログラムは、2又は3以上の配列の間の配列同一性を算出することができる。
【0237】
当業者は、2つの核酸配列の間の同一性パーセンテージを算出する方法を理解する。2つの核酸配列の間の同一性パーセンテージを算出するために、2つの配列のアライメントが最初に用意されなければならず、続いて配列同一性の値が算出される。2つの配列についての同一性パーセンテージは、(i)配列をアライメントするために使用される方法、例えば、Needleman-Wunschアルゴリズム(例えばNeedle(EMBOSS)若しくはStretcher(EMBOSS)により適用されるもの、Smith-Watermanアルゴリズム(例えばWater(EMBOSS)により適用されるもの))、又はLALIGN適用(例えばMatcher(EMBOSS)により適用されるもの;並びに(ii)アライメント方法、例えば、局所対大域アライメントにより使用されるパラメーター、使用されるマトリックス、及びギャップに適用されるパラメーターに依存して、異なる値を取ってもよい。
【0238】
アライメントがなされたら、2つの配列の間の同一性パーセンテージを算出する多くの異なる仕方がある。例えば、同一性の数を、(i)最短の配列の長さ;(ii)アライメントの長さ;(iii)配列の平均の長さ;(iv)非ギャップ位置の数;又は(iv)オーバーハングを除く同等の位置の数で割ってもよい。さらには、同一性パーセンテージは強く長さ依存的であることもまた理解される。したがって、配列のペアがより短くなればなるほど、偶然に起こることが予想され得る配列同一性はより高くなる。
【0239】
2つの核酸配列の間の同一性パーセンテージの算出は次に、そのようなアライメントから(N/T)*100(ここで、Nは、配列が同一の残基を共有する位置の数であり、Tは、ギャップを含むがオーバーハングを除く比較される位置の総数である)として算出されてもよい。
【0240】
配列アライメントはペアワイズの配列アライメントであってもよい。好適なサービスは、Needle(EMBOSS)、Stretcher(EMBOSS)、Water(EMBOSS)、Matcher(EMBOSS)、LALIGN、又はGeneWiseを含む。例において、2つのアミノ酸配列の間の同一性は、デフォルトのパラメーター、例えばマトリックス(BLOSUM62)、ギャップオープン(10)、ギャップ伸長(0.5)、末端ギャップペナルティー(偽)、末端ギャップオープン(10)、及び末端ギャップ伸長(0.5)に設定されたサービスNeedle(EMBOSS)を使用して算出されてもよい。別の例において、2つのアミノ酸配列の間の同一性は、デフォルトのパラメーター、例えばマトリックス(BLOSUM62)、ギャップオープン(14)、ギャップ伸長(4)、選択的マッチ(1)に設定されたサービスMatcher(EMBOSS)を使用して算出されてもよい。例において、2つの核酸配列の間の同一性は、デフォルトのパラメーター、例えばマトリックス(DNAfull)、ギャップオープン(10)、ギャップ伸長(0.5)、末端ギャップペナルティー(偽)、末端ギャップオープン(10)、及び末端ギャップ伸長(0.5)に設定されたサービスNeedle(EMBOSS)を使用して算出されてもよい。別の例において、2つの核酸配列の間の同一性は、デフォルトのパラメーター、例えばマトリックス(DNAfull)、ギャップオープン(16)、ギャップ伸長(4)、選択的マッチ(1)に設定されたサービスMatcher(EMBOSS)を使用して算出されてもよい。
【0241】
本明細書(任意の付随する特許請求の範囲、要約書及び図面を含む)に記載される特色のすべて、並びに/又はそこで開示される任意の方法若しくはプロセスのステップのすべては、そのような特色及び/又はステップの少なくとも一部が相互に排他的である組合せを除いて、任意の組合せで上記の態様のいずれかと組み合わせられてもよい。
【0242】
本発明のより良好な理解のために、及びその実施形態がどのように実行され得るのかを示すために、これより実施例が参照され、実施例はいかなるようにも本発明を限定することは意図されない。
[実施例]
【0243】
本発明者らは、自動化された直交性mRNAの発見により可能にされる、4つの別個の非標準アミノ酸の組込みのための68コドン遺伝コードを実証する。
【0244】
O-mRNAの直交性(O-)リボソーム媒介性翻訳は、大腸菌中でタンパク質への最大3つの別個の非標準アミノ酸(ncAA)の組込みを可能にする。しかしながら、O-リボソームによる複数の別個のncAAの一般的な及び効率的な組込みは、効率的に及び特異的に翻訳されるO-mRNAの作出、並びに複数のO-アミノアシル-tRNAシンテターゼ(O-aaRS)/O-tRNAペアのコンパクトな発現の両方のための拡張可能な戦略を要求する。本発明者らは、先行するO-mRNAよりも、最大40倍多くのタンパク質につながり、最大50倍直交性であるO-mRNAの発見を自動化し;我々のO-mRNAからのタンパク質収率は野生型mRNAからの場合に匹敵するか又は上回る。これらの進歩は、3つの別個のncAAを組み込むための収率における33倍の増加を可能にする。追加的に、本発明者らは、O-tRNAのためのオペロンの作出を自動化し、O-aaRSのためのオペロンを開発する。最後に、本発明者らは、これらの進歩を組み合わせて、68コドン、24アミノ酸の遺伝コードを作出し、4つの別個のクアドルプレットコドンに応答して4つの別個のncAAを効率的に組み込む。
【実施例1】
【0245】
O-リボソームによる効率的な翻訳のための5’UTRの発見の自動化
wt RBSを含有する5’UTR上の我々の
strepGFP
His6 ORFについて予測されるΔG
tot(wt ribo)は-0.5kcal/molである。対照的に、熱力学的モデルにおいて使用されるアンチシャインダルガルノ配列(aSD)をO-リボソームのものに変更した場合、O(trans)-
StrepGFP
His6の直交翻訳のための算出される自由エネルギー変化(ΔG
tot(O-ribo))は+3.5kcal/molであった。我々は、wt翻訳のために開発された、シミュレートされたアニーリング最適化アルゴリズム(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009))と組み合わせられた開始の平衡モデルが、O(trans)-
strepGFP
His6よりもO-リボソームによってより効率的に翻訳されるO-mRNA配列を設計するために適合され得るかどうかを試験することを決定した(
図1a、b)。我々はしたがって、+1の転写部位と
strepGFP
His6 ORFとの間の5’UTR配列を変更し、このORFについて非常に好都合なΔG
tot(O-ribo)を有する配列を、シミュレートされたアニーリング最適化アルゴリズム(Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009))を通じて検索した。
【0246】
このアルゴリズム(vol 1)を使用して、我々は、O-リボソームによる
strepGFP
His6タンパク質の産生のための最適化された5’UTR領域(O1-
strepGFP
His6~O4-
strepGFP
His6)を有する4つの新たな
strepGFP
His6コンストラクトを同定した。これらのコンストラクトについてのΔG
tot(O-ribo)は、O1-
strepGFP
His6 -5.8kcal/mol、O2-
strepGFP
His6 -4.9kcal/mol、O3-
strepGFP
His6 -5.1kcal/mol、O4-
strepGFP
His6 -6.6kcal/molであった。そのため、これらのコンストラクトはO(trans)-
strepGFP
His6よりも高いタンパク質レベルにつながり得ると我々は予測した。我々は、各々のコンストラクト及びO-リボソームを含有する細胞から
strepGFP
His6を産生した。最適化された配列(O1-
strepGFP
His6~O4-
strepGFP
His6)は、O(trans)-
strepGFP
His6と比較して直交翻訳を伴うタンパク質産生における大きい(11~31倍)増加につながった(
図1c及び補足
図1)。O-リボソームによりO1-
strepGFP
His6から産生される
strepGFP
His6タンパク質のレベルは、wt RBSを含有し、wtリボソームにより翻訳される元々のコンストラクトからの場合と同等であった。新たな配列についてのΔG
tot(wt-ribo)(
図1a)は、すべての場合において+5kcal/molよりも高かった。そのため、ΔG
orthogonality(
図1a)は、これらのコンストラクトはO-リボソームにより選択的に翻訳されることを予測する。この予測と合致して、追加の実験は、各々の新たな5’UTRからの
strepGFP
His6の翻訳はO-リボソーム依存的であり、新たな配列の直交性は、O(trans)-
strepGFP
His6の場合よりも12~19倍、143高いことを実証した(
図1c及び補足
図1a)。
【実施例2】
【0247】
拡張可能、効率的かつ選択的な直交翻訳のための5’UTR及びORFの発見の自動化
wtリボソームによる効率的な翻訳を指令せず、O-リボソームによる最大のタンパク質産生を指令する5’UTRの発見を完全に自動化するための努力において、我々は、新たな自動化された検索(vol 2)を設計した(
図1b)。我々の新たな検索は、wtリボソームの基質であることが予測され、最適にスペーシングされた標準的なO-RBS配列を含有する配列に向けてバイアスされた5’UTR配列のための明示的なペナルティーを導入した。
【0248】
vol 2検索は、O-16S rRNAの3’末端において直交性aSD配列と完全なワトソン-クリック塩基対を形成することが予測される9nt直交性SD(O-SD)配列を含有する35nt 5’UTRから開始した。O-SD配列と開始コドンとの間のスペーシングは5ヌクレオチドに設定し、O-SDを除いて、5’UTRの配列をランダム化した。我々は次に、ΔG
tot(O-ribo)を最大化するがΔG
tot(wt ribo)を最小化する配列を検索した。我々は、O-16S rRNAと塩基対合するがwt 16S rRNAとは塩基対合しないことが予測され、そのため直交性を決定する、O-SD部位の5ヌクレオチドコア(TGGGA)における変異を許容しなかった。vol 2アルゴリズムを使用して、我々は、
strepGFP
His6のための新たな5’UTR(O5~O8-
strepGFP
His6)を作出した。これらの配列は、vol 1に由来する場合(-5.6±0.8kcal/mol)よりも高い平均ΔG
tot(O-ribo)(-7.7±0.4kcal/mol)を有した(補足表1)。これらの配列は、O(trans)-
strepGFP
His6よりも最大18倍多くの
strepGFP
His6タンパク質を提供した(
図11及び補足
図1b)。タンパク質産生を増強するためのvol 2アルゴリズムの一般性を調べるために、我々は、2つの追加のORF、mCherry及びE2Crimsonの直交翻訳を調べた。O(trans)-mCherry、及びO(trans)-E2Crimson(O(trans)5’UTRが転写の+1塩基とATG開始コドンとの間に置かれていた)は、低いレベルの直交翻訳につながった。vol 2アルゴリズムの適用は、O(trans)-mCherryよりもO-リボソームと共に最大10倍高い活性の、また最大8倍高い直交性のmCherry発現コンストラクトにつながった(
図1d及び補足
図1c)。同様に、vol 2アルゴリズムの適用は、O(trans)-E2CrimsonよりもO-リボソームと共に最大14倍高い活性の、最大9倍高い直交性のE2Crimson産生コンストラクトにつながり;E2Crimsonは、wtリボソームを使用してwt RBSから産生されたレベルと同等のレベルにおいてO1-E2Crimson(vol 2アルゴリズムを使用して発見された)からO-リボソームにより産生された(
図1e及び補足
図1d)。
【0249】
ORF配列の最初の35ヌクレオチドはタンパク質収率に実質的に寄与することができる(Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018)、Tuller, T. & Zur, H. Multiple roles of the coding sequence 5′ end in gene expression regulation. Nucleic Acids Res. 43, 13-28 (2015)、Seo, S.W. et al. Predictive design of mRNA translation initiation region to control prokaryotic translation efficiency. Metab. Eng. 15, 67-74 (2013))。しかしながら、この配列においてコドンをそれらのシノニムに変化させることが、別個のイソアクセプターtRNAを用いる異なるシノニムのデコードの結果としてもたらされる効果と対比してmRNA二次構造に対する効果を通じて翻訳にどの程度まで影響を及ぼすのかは依然として議論の余地がある(Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018)、Plotkin, J.B. & Kudla, G. Synonymous but not the same: the causes and consequences of codon bias. Nat. Rev. Genet. 12, 32-42 (2011)、Tuller, T. & Zur, H. Multiple roles of the coding sequence 5′ end in gene expression regulation. Nucleic Acids Res. 43, 13-28 (2015)、Kudla, G., Murray, A.W., Tollervey, D. & Plotkin, J.B. Coding-Sequence Determinants of Gene Expression in Escherichia coli. Science 324, 255-258 (2009)、Allert, M., Cox, J.C. & Hellinga, H.W. Multifactorial Determinants of Protein Expression in Prokaryotic Open Reading Frames. J. Mol. Biol. 402, 905-918 (2010)、Goodman, D.B., Church, G.M. & Kosuri, S. Causes and Effects of N-Terminal Codon Bias in Bacterial Genes. Science 342, 475-479 (2013))。ORFの最初の35ヌクレオチド内のコドンを同義コドンに変更することは、ΔG
tot(O-ribo)を最大化するがΔG
tot(wt ribo)を最小化するmRNAのコンピューターによる検索における追加の自由度を提供することを我々は認識した。また、一部の場合において、これは、O-リボソームによってより効率的に翻訳され、wtリボソームによる翻訳に関してより直交性であるmRNAを発見することを可能とし得るという仮説を我々は立てた。この仮説を調べるために、我々は、各々のORFのコドン2~12をそれらのシノニムに変更した。我々はそれにより、vol 2に基づく第3のアルゴリズム(vol 3)を作出して、ORF及び5’UTRにおける同時のバリエーションを探索した(
図1b)。
【0250】
vol 3アルゴリズムは、vol 2(
strepGFP
His6:-7.7±0.4;mCherry:-9.6±0.5kcal/mol;E2Crimson:-8.9±0.5kcal/mol)に対してΔG
tot(O-ribo)における顕著な増加(
strepGFP
His6:-12.6±0.2kcal/mol;mCherry:-13.5±0.3kcal/mol;E2Crimson:-13.2±0.0kcal/mol)を提供し、vol 2からの最小化されたΔG
tot(wt ribo)を維持した。我々は、vol 2アルゴリズムからの場合よりも直交性であり、wtメッセージからwtリボソームにより産生される場合よりも高いレベルでタンパク質を産生する
strepGFP
His6及びmCherryのためのO-mRNA配列を発見した(
図1c~e及び補足
図1b~d)。全体的に、我々のvol 2及びvol 3アルゴリズムは、O(trans)5’UTRが各々のORFと共に使用された場合よりも41、31及び14倍(それぞれ
strepGFP
His6、mCherry、及びE2Crimsonについて)高いタンパク質収率を提供し、これらの収率は、wtメッセージにおけるwtリボソームからの収率に匹敵するか、又はそれを上回る。我々が発見した最良の配列の直交性は、O(trans)5’UTRが各々のORFと共に使用された場合よりも31、49及び9倍(それぞれ
strepGFP
His6、mCherry、及びE2Crimsonについて)高い。
【実施例3】
【0251】
最適化された直交性mRNAは、3つの別個のncAAを含有するタンパク質の収率の増加を可能にする
次に、我々は、最適化されたO-mRNAからのタンパク質発現収率における増加は、直交翻訳を介して、3つの別個のncAAを含有するタンパク質の収率における増加を可能にすることを実証した。この研究は、上記されるアルゴリズム開発と並行して進行したので、我々は、vol 1アルゴリズムに由来する、その時点において利用可能な最良の配列、O1-
strepGFP
His6を用いて我々の実験を行った(
図2a)。我々は、O1-
strepGFP(40TAG、136AGGA、150AGTA)
His6を作出し、三重に直交性のPylRS/tRNA
Pylペア(MmPylRS/メタノサルシナ・スペラエイ(Methanosarcina spelaei)(Mspe)tRNA
Pyl
CUA(N
6-(tert-ブトキシカルボニル)-L-リジン(BocK) 1の組込みを指令する)、メタノマッシリイコッカス・ルミニュエンシス(Methanomassiliicoccus luminyensis)1(Mlum)PylRS(NmH)/メタノマッシリイコッカス・インテスティナリス(Methanomassiliicoccus intestinalis)(Mint)tRNA
Pyl-A17VC10
UCCU(Nπ-メチル-L-ヒスチジン(NmH) 2の組込みを指令する、L121M、L125I、Y126F、M129A、V168Vミュータント)及びメタノメチロフィラス属菌(Methanomethylophilus sp.)1R26(M1r26)PylRS(CbzK)/メタノメチロフィラス・アルバス(Methanomethylophilus alvus)(Malv)tRNA
Pyl-8
UACU(N
6-((ベンジルオキシ)カルボニル)-L-リジン(CbzK) 3の組込みを指令する、Y126G、M129Lミュータント)から構成される)を含有する細胞中でO-riboQ1を用いてこれを翻訳した。全長
strepGFP(40BocK、136NmH、150CbzK)
His6をBocK 1、NmH 2及びCbzK 3の追加で産生した。このシステムを使用して、我々は2.6±0.4mg/Lの
strepGFP(40BocK、136NmH、150CbzK)
His6を合成した。この収率は、O(trans)-
strepGFP(40TAG、136AGGA又は150AGTA)
His6からの収率よりも33倍高く、(
図2b及び補足表2)、O1-
strepGFP(wt)
His6から産生される
strepGFP(wt)
His6の9%、及びwtリボソームによりwt RBSから翻訳される
strepGFP(wt)
His6から産生される
strepGFP(wt)
His6の11%に対応する。観察された収率は、45%のステップ当たりの平均ncAA組込み効率を示唆する。質量分析により正確なタンパク質の合成が確認された(
図2c、補足
図2)。
【実施例4】
【0252】
四重に直交性のaaRS/tRNAペアのための機能的なオペロンの設計
次に、我々は、各々のncAAが別個のクアドルプレットコドンに応答してコードされる4つの別個のncAAの単一のタンパク質への組込みを可能にするために効率的なO-mRNAの開発に基礎を置くことを試みた。これは、(1)アミノアシル化特異性において相互に直交性であり、(2)4つの相互に直交性の活性部位を有し、(3)4つの相互に直交性のクアドルプレットコドンに割り当てられる、4つの直交性aaRS/tRNAペアを要求した。我々は、PylRS/tRNAPylトリプレット - メタノマッシリイコッカルス目(Methanomassiliicoccales)古細菌RumEn M1(Mrum)Pyl(NmH)RS/MinttRNAPyl-A17VC10
UCCU(NmH 2の組込みを指令する、L121M、L125I、Y126F、M129A、V168Vミュータント)、メタン生成古細菌ISO4-G1(Mg1)Pyl(CbzK)RS/MalvtRNAPyl-8
UACU(CbzK 3の組込みを指令する、Y125G、M128Lミュータント)及びMmPylRS/MspetRNAPyl-evol
CUAG(BocK 1又はN6-((アリルオキシ)カルボニル)-L-リジン(AllocK) 4を含む、複数のncAAの組込みを指令する) - を我々のアプローチのための出発点として選択した。我々は、AfTyrRS(PheI)/AftRNATyr-A01
CUA((S)-2-アミノ-3-(4-ヨードフェニル)プロパン酸(PheI) 5の組込みを指令する、Y36I、L69M、H74L、Q116E、D165T、I166G、F274V、L298G、D299Rミュータント)を第4のaaRS/tRNAペアのための出発点として選択し;我々は、このペアは複数のピロリシルシンテターゼ及びtRNAPylに対して直交性であることを以前に示している。複数のncAAをコードするための努力は、対応するシンテターゼ及びtRNAの効率的かつコンパクトな発現のための戦略を要求する。我々はしたがって、4つの外因性tRNAの共発現及びそれらのコグネイトシンテターゼの共発現のためのオペロンベースシステムを確立した。
【0253】
大腸菌中で、多くのtRNAはポリシストロン性オペロンにおいて転写され、成熟tRNAの5’及び3’末端は転写後RNaseプロセシングにより生成される(Phizicky, E.M. & Hopper, A.K. tRNA biology charges to the front. Genes Dev. 24, 1832-1860 (2010)、El Yacoubi, B., Bailly, M. & de Crecy-Lagard, V. Biosynthesis and Function of Posttranscriptional Modifications of Transfer RNAs. Annu. Rev. Genet. 46, 69-95 (2012))。我々は、外因性tRNAの間の遺伝子間配列が、外因性tRNAに最も類似した大腸菌tRNAの間の配列に由来する合成tRNAオペロンを自動的に設計するためのプログラムを作出した。プログラムは最初に、外因性tRNAのすべての可能な順序化(orderings)を生成した。順序化中の隣接する外因性tRNAの各々のペアのために、それは、外因性ペアに対して最も高い配列同一性を有する大腸菌ゲノム中の隣接する天然tRNAを同定する。それは次に、これらの天然tRNAの間に見出される遺伝子間領域の配列を外因性tRNAの間に挿入する。このプロセスは、外因性tRNAの各々の順序化のための合成オペロン配列を生成する。プログラムは次に、各々のtRNA順序の結果としてもたらされる合成オペロンを比較し、外因性tRNAと、オペロン中の遺伝子間領域を定義するために使用される対応する天然tRNAとの間の配列同一性の和に基づいてそれらを順位付けする。
【0254】
我々は、AftRNATyr-A01、MspetRNAPyl-evol、MinttRNAPyl-A17VC10、及びMalvtRNAPyl-8を有するtRNAオペロンを生成するために我々のプログラムを使用した。最上位に順位付けされたオペロンは、MinttRNAPyl-A17VC10
UCCU-inter(glyX,glyY)-MalvtRNAPyl-8
UACU-inter(glyW-cysT)-MspetRNAPyl-evol
CUAG-inter(argY,argZ)-AftRNATyr-A01
CUA(ここで、inter(x,y)は、大腸菌tRNA xとyとの間の遺伝子間スペーサー配列を表す)であった。4つの別個のクアドルプレットコドンをデコードするtRNAを発現するためにこのオペロンを適合させるために、我々は、MspetRNAPyl-evol
CUAGをMspetRNAPyl-evol
UCUA(我々が以前にMbtRNAPylにおいて進化させたアンチコドンステムをMspetRNAPyl中に移植することにより作出される)で、及びAftRNATyr-A01
CUAをAftRNATyr-A01
CUAG(AftRNATyr-A01
CUAのアンチコドン変異により作出される)により置き換えた。我々は、結果としてもたらされるtRNAオペロンをtRNA4(quad)と命名した。
【0255】
4つの外因性aaRS(MmPylRS、AfTyr(PheI)RS、Mg1(CbzK)PylRS及びMrum(NmH)PylRS)の高発現を可能とするオペロンを同定するために、我々は最初に、各々のシンテターゼ遺伝子のための5つの最適化された5’UTR領域を生成し、次に他の3つのaaRSのいずれかを5’配列コンテキストとして使用して各々の5’UTRについてのフォールディングしたmRNAから開始適格翻訳複合体への進行についてのΔG
totを予測した。我々は、4つすべてのaaRSについて好都合なΔG
totを有する2つの配置、RS4_1及びRS4_2を選択した。我々は、aaRSオペロンの各々を、tRNA4をコードするプラスミド中にクローニングして、コンパクトなシンテターゼ及びtRNA発現モジュール(RS4_1/tRNA4及びRS4_2/tRNA4)を生成した(補足
図3)。我々は、各々のオペロンにおける各々のaaRSの活性を試験した(補足
図4、補足表3)。これらの実験により我々は、最適化されたキメラaaRSオペロンを設計し、該オペロンにおいて、我々は、Mrum(NmH)PylRSの最適化された5’UTRの上流の150ntをRS4_2からRS4_1に移植して、RS4_1-2を作出した。このオペロンは、RS4_2及びRS4_1の最良の特性を兼ね備えていた(補足
図4c)。
【0256】
我々は、単一のベクター中にRS4_1-2及びtRNA4(quad)オペロンを組み合わせ(279個のRS4_1-2/tRNA4(quad))、O1-
strepGFP(40XXXX)
His6(ここで、XXXXは、TAGA、AGGA、AGTA又はCTAGを表す)から産生されるGFP蛍光を測定することにより産生された各々のaaRS/tRNAペアの活性及び直交性を体系的に試験した。細胞は、O-riboQ1を含有し、各々の個々のncAA(NmH 2、CbzK 3、AllocK 4、PheI 5)を含有したか又は含有せず、RS4_1-2/tRNA4(quad)を含有した(
図3a~d)。RS4_1-2/tRNA4(quad)及び4つすべてのncAA(NmH 2、CbzK 3、PheI 5、AllocK 4)の存在下でO1-
strepGFP(150XXXX)
His6(ここで、XXXXは、TAGA、AGGA、AGTA又はTAGAを表す)からO-riboQ1により産生される
strepGFP(40X)
His6(ここで、Xは、NmH 2、CbzK 3、AllocK 4、PheI 5を表す)のESI-MSは、各々のaaRS、tRNA及びコドンは、互いに対して機能的に直交性であることを実証した(
図3e~h)。
【実施例5】
【0257】
4つの別個のクアドルプレットコドンを使用して4つの別個のncAAを遺伝学的にコードすること
我々は、直交性ペアのためのaaRS/tRNAオペロンの生成における我々の進歩を、O-riboQ1により効率的に読まれる最適化されたO-mRNAの作出における我々の進歩と組み合わせて、4つの別個のクアドルプレットコドンに応答して単一のタンパク質中に4つの別個のncAAを組み込んだ(
図4a)。我々は、RS4_1-2/tRNA4(quad)を含有し、4つすべてのncAA基質(NmH 2、CbzK 3、PheI 4、AllocK 5)を提供された細胞中でO1-
strepGFP(40CTAG、50TAGA、136AGGA、50AGTA)
His6のO-riboQ1媒介性翻訳により
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6を産生した(
図4b)。
strepGFP(40PheI、50AllocK、136NmH、150CbzK)
His6の産生は、4つすべてのncAAの追加に依存的であり、0.41±0.03mg/mLのタンパク質が産生された(補足表2)。観察された収率は、38%のステップ当たりの平均ncAA組込み効率を示唆する。質量分析により、4つの別個のクアドルプレットコドンに応答した4つすべてのncAAの組込みが確認された(
図4c、補足
図5)。追加の実験において、我々はまた、3つのクアドルプレットコドン及びアンバーコドンに応答した4つの別個のncAAの組込みを実証した(補足
図6~8、補足表2)。
【実施例6】
【0258】
実施例1~5の考察
我々は、O-リボソームにより効率的かつ選択的に翻訳されるO-mRNA配列を設計するためのコンピューターによるアプローチを開発した。新たなO-mRNAは、所望のORFの前にO-RBSを含有する以前に使用された5’UTRを移植することにより作出されるO-mRNAよりも、最大40倍多くのタンパク質につながり、最大50倍直交性である。我々が作出したO-mRNAは、wtリボソームにより翻訳されるwt mRNAからの場合と同等又はそれより高いレベルにおいて直交性タンパク質産生を指令する。O-mRNA発見のための我々の自動化された、迅速かつ拡張可能な方法は、複数のncAAを組み込み、新たな単量体を重合させる直交翻訳システムの設計及び指向性進化(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Rackham, O. & Chin, J.W. A network of orthogonal ribosome・mRNA pairs. Nat. Chem. Biol. 1, 159-166 (2005)、Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007)、Schmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018))の他に、直交性遺伝子発現システムの作出及び応用(An, W. & Chin, J.W. Synthesis of orthogonal transcription-translation networks. Proc. Natl. Acad. Sci. U.S.A. 106, 8477-8482 (2009)、Darlington, A.P.S., Kim, J., Jimenez, J.I. & Bates, D.G. Dynamic allocation of orthogonal ribosomes facilitates uncoupling of co-expressed genes. Nat. Commun. 9, 1-12 (2018))を大きく加速させる。
【0259】
我々のO-mRNA最適化戦略は、5’UTR及びORF配列の直交性及び共最適化のための明示的な選択を含む。我々は、ORFにおける5’UTR及び同義コドン選択の共最適化は、5’UTRを単純に変更することを通じて得られる場合よりも大きい(より負の)ΔGtot(O-ribo)についての予測される値を有するO-mRNA配列につながり;これらの配列はまた、ΔGtot(wt ribo)についての大きい(正の)予測される値を有することを見出した。我々は、ORF内の5’UTR配列及び同義コドンの共最適化は、タンパク質収率を向上させることができることを発見し、4つのクローンの試験は、試験された各々の場合において高いレベルの翻訳につながった。これらの観察は、mRNAフォールディングは、既知のパラメーターの中でも、タンパク質収率の主要な予測因子であるという見解(Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018))と合致する。コドン適合を含む他のパラメーターがタンパク質収率に影響を及ぼし得ることに我々は気付き、アルゴリズムの将来の反復においてこれらの考慮を含めることでよりいっそう高い予測力につながるかどうかを調べることは興味深い。将来の研究はまた、wtリボソームからの発現困難なタンパク質の産生を向上させるための5’UTR配列及びコーディング配列の共最適化を探索する。
【0260】
我々の自動化されたO-mRNA設計を、我々の以前に開発された三重に直交性のPylRS/tRNAPylペアと組み合わせることにより、我々は、3つの別個のncAAを含有するタンパク質の収率を33倍増加させた。我々は、多くの外因性aaRS及びtRNAの効率的かつコンパクトな共発現のためのパイプラインを確立した。我々は、大腸菌における内因性転写システムを模倣するポリシストロン性tRNAオペロンを産生するためのコンピュータープログラムを開発した。我々のアルゴリズムは、1つのプラスミド上の同じプロモーターの下で大腸菌中で複数の別個のtRNAを産生するための一般的な解決策を提供し、他の生物のために容易に適合され得る。我々はまた、tRNAオペロンと並んで4つの相互に直交性のシンテターゼの効率的な発現のためのポリシストロン性aaRSオペロンを開発した。我々は、我々の進歩を組み合わせて、初めてインビボで24個のアミノ酸、すなわち標準的な20個のアミノ酸及び4個のncAA、からなるタンパク質を産生した。各々のncAAは、O-mRNA上で選択的に翻訳され、天然の翻訳において使用されないクアドルプレットコドンを使用してコードされ、68コドン遺伝コードを有する生物が作出される。
【0261】
別個のncAAを認識し、別個のクアドルプレットコドンをデコードする相互に直交性のaaRS/tRNAペアの作出における新生の開発がクアドルプレットコードの拡張を可能とし得ることを我々は予期する。クアドルプレットデコーディングの効率は、トリプレットコドンをもはや読まないリボソームを選択することにより、又は、競合性トリプレットデコーディングtRNAが除去されている圧縮された遺伝コードを有する生物においてクアドルプレットデコーディングを開発することによりさらに向上され得る(Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514- 518 (2019)、Chatterjee, A., Lajoie, M.J., Xiao, H., Church, G.M. & Schultz, P.G. A Bacterial Strain with a Unique Quadruplet Codon Specifying Non-native Amino Acids. ChemBioChem 15, 1782- 1786 (2014))。
【0262】
実施例1~6及び図のレジェンド5~12(補足
図1~8)のための参考文献
1. Chin, J.W. Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017).
2. de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020).
3. Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010).
4. Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403 (2014).
5. Anderson, J.C. et al. An expanded genetic code with a functional quadruplet codon. Proc. Natl. Acad. Sci. U.S.A. 101, 7566-7571 (2004).
6. Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514-518 (2019).
7. Wang, K. et al. Defining synonymous codon compression schemes by genome recoding. Nature 539, 59-64 (2016).
8. Malyshev, D.A. et al. A semi-synthetic organism with an expanded genetic alphabet. Nature509, 385-388 (2014).
9. Zhang, Y. et al. A semi-synthetic organism that stores and retrieves increased genetic information. Nature 551, 644-647 (2017).
10. Zhang, Y. et al. A semisynthetic organism engineered for the stable expansion of the genetic alphabet. Proc. Natl. Acad. Sci. U.S.A. 114, 1317-1322 (2017).
11. Fischer, E.C. et al. New codons for efficient production of unnatural proteins in a semisynthetic organism. Nat. Chem. Biol. 16, 570-576 (2020).
12. Neumann, H., Slusarczyk, A.L. & Chin, J.W. De Novo Generation of Mutually Orthogonal Aminoacyl-tRNA Synthetase/tRNA Pairs. J. Am. Chem. Soc. 132, 2142-2144 (2010).
13. Chatterjee, A., Sun, S.B., Furman, J.L., Xiao, H. & Schultz, P.G. A Versatile Platform for Single- and Multiple-Unnatural Amino Acid Mutagenesis in Escherichia coli. Biochemistry 52, 1828-1837 (2013).
14. Willis, J.C.W. & Chin, J.W. Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs. Nat. Chem. 10, 831-837 (2018).
15. Dunkelmann, D.L., Willis, J.C.W., Beattie, A.T. & Chin, J.W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non canonical amino acids. Nat. Chem. 12, 535-544 (2020).
16. Cervettini, D. et al. Rapid discovery and evolution of orthogonal aminoacyl-tRNA
synthetase-tRNA pairs. Nat. Biotechnol. 38, 989-999 (2020).
17. Zhang, M.S. et al. Biosynthesis and genetic encoding of phosphothreonine through parallel selection and deep sequencing. Nat. Methods 14, 729-736 (2017).
18. Italia, J. et al. Mutually Orthogonal Nonsense-Suppression Systems and Conjugation Chemistries for Precise Protein Labeling at up to Three Distinct Sites. J. Am. Chem. Soc. 141, 6204-6212 (2019).
19. Rackham, O. & Chin, J.W. A network of orthogonal ribosome・mRNA pairs. Nat. Chem. Biol. 1, 159-166 (2005).
20. Wang, K., Neumann, H., Peak-Chew, S.Y. & Chin, J.W. Evolved orthogonal ribosomes enhance the efficiency of synthetic genetic code expansion. Nat. Biotechnol. 25, 770-777 (2007).
21. Schmied, W.H. et al. Controlling orthogonal ribosome subunit interactions enables evolution of new function. Nature 564, 444-448 (2018).
22. Venkat, S. et al. Genetically Incorporating Two Distinct Post-translational Modifications into One Protein Simultaneously. ACS Synth. Biol. 7, 689-695 (2018).
23. Chin, J.W. Expanding and Reprogramming the Genetic Code of Cells and Animals. Annu. Rev. Biochem. 83, 379-408 (2014).
24. Cambray, G., Guimaraes, J.C. & Arkin, A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005-1015 (2018).
25. Plotkin, J.B. & Kudla, G. Synonymous but not the same: the causes and consequences of codon bias. Nat. Rev. Genet. 12, 32-42 (2011).
26. Tuller, T. & Zur, H. Multiple roles of the coding sequence 5’ end in gene expression regulation. Nucleic Acids Res. 43, 13-28 (2015).
27. Salis, H.M., Mirsky, E.A. & Voigt, C.A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950 (2009).
28. Na, D., Lee, S. & Lee, D. Mathematical modeling of translation initiation for the estimation of its efficiency to computationally design mRNA sequences with desired expression levels in prokaryotes. BMC Syst. Biol. 4, 1-16 (2010).
29. Seo, S.W. et al. Predictive design of mRNA translation initiation region to control prokaryotic translation efficiency. Metab. Eng. 15, 67-74 (2013).
30. Salis, H.M. in Methods in Enzymology, Vol. 498 19-42 (Academic Press, Cambridge, MA, USA; 2011).
31. Espah Borujeni, A., Channarasappa, A.S. & Salis, H.M. Translation rate is controlled by coupled trade-offs between site accessibility, selective RNA unfolding and sliding at upstream standby sites. Nucleic Acids Res. 42, 2646-2659 (2014).
32. Espah Borujeni, A. & Salis, H.M. Translation Initiation is Controlled by RNA Folding Kinetics via a Ribosome Drafting Mechanism. J. Am. Chem. Soc. 138, 7016-7023 (2016).
33. Espah Borujeni, A. et al. Precise quantification of translation inhibition by mRNA structures that overlap with the ribosomal footprint in N-terminal coding sequences. Nucleic Acids Res. 45, 5437-5448 (2017).
34. Kudla, G., Murray, A.W., Tollervey, D. & Plotkin, J.B. Coding-Sequence Determinants of Gene Expression in Escherichia coli. Science 324, 255-258 (2009).
35. Allert, M., Cox, J.C. & Hellinga, H.W. Multifactorial Determinants of Protein Expression in Prokaryotic Open Reading Frames. J. Mol. Biol. 402, 905-918 (2010).
36. Goodman, D.B., Church, G.M. & Kosuri, S. Causes and Effects of N-Terminal Codon Bias in Bacterial Genes. Science 342, 475-479 (2013).
37. Phizicky, E.M. & Hopper, A.K. tRNA biology charges to the front. Genes Dev. 24, 1832-1860 (2010).
38. El Yacoubi, B., Bailly, M. & de Crecy-Lagard, V. Biosynthesis and Function of Posttranscriptional Modifications of Transfer RNAs. Annu. Rev. Genet. 46, 69-95 (2012).
39. An, W. & Chin, J.W. Synthesis of orthogonal transcription-translation networks. Proc. Natl. Acad. Sci. U.S.A. 106, 8477-8482 (2009).
40. Darlington, A.P.S., Kim, J., Jimenez, J.I. & Bates, D.G. Dynamic allocation of orthogonal ribosomes facilitates uncoupling of co-expressed genes. Nat. Commun. 9, 1-12 (2018).
41. Chatterjee, A., Lajoie, M.J., Xiao, H., Church, G.M. & Schultz, P.G. A Bacterial Strain with a Unique Quadruplet Codon Specifying Non-native Amino Acids. ChemBioChem 15, 1782-1786 (2014).
【0263】
方法
翻訳開始の熱力学的モデル
熱力学的モデルは以前に記載されている(Chin, J.W. Expanding and reprogramming the genetic code. Nature 550, 53-60 (2017))。簡潔に述べれば、モデルは、自由にフォールディングしたmRNAの予測されるエネルギー、ΔGunfolding、及び開始適格リボソーム結合状態の予測されるエネルギー、ΔGribo_bindingの自由エネルギー差、ΔGtotを特定する。
ΔGtot=ΔGribo_binding+ΔGunfolding
【0264】
ここで、ΔGunfoldingは、mRNA二次構造をアンフォールディングさせるために要求されるエネルギーである。開始適格状態の形成において放出される自由エネルギー、ΔGribo_bindingは4つの構成要素からなる。
ΔGribo_binding=ΔGmRNA-rRNA+ΔGstart+ΔGspacing-ΔGstandby
【0265】
ΔGmRNA-rRNAは、16S rRNAの最後の9nt及びmRNAの予測される共同フォールディングした二次構造の自由エネルギーであり、主なエネルギー的寄与は、mRNAのシャインダルガルノ(SD)又は直交性シャインダルガルノO-SD配列と16S rRNAとの間のハイブリダイゼーションエネルギーから来る。リボソームフットプリントを反映して、ハイブリダイゼーション部位の下流のmRNAフォールディングは許容されない。ΔGstartは、開始コドンへの開始tRNAの結合から放出されるエネルギーである。ΔGspacingは、SD部位と開始コドンとの間の最適でないスペーシング長のためのエネルギーペナルティーである。ΔGstandbyは、ここではSD部位の上流の4ヌクレオチドとして定義されるスタンドバイ部位を隔離する二次構造をアンフォールディングさせるために要求されるエネルギーである。
【0266】
自動化されたO-mRNAの発見のためのシミュレートされたアニーリング最適化アルゴリズム
RNA二次構造予測は、「mfe」アルゴリズムを使用してNuPACKスイートにおいて行われる。算出は、5’UTR及びORF中の最大で35ntのウィンドウを考慮し;より長い配列が使用される場合、開始コドンに最も近接した35ntのみが考慮される。
【0267】
vol 1アルゴリズムは、以前に記載されたシミュレートされたアニーリング最適化アルゴリズム1に由来するが、ΔG
mRNA-rRNAの算出のために標準的な配列(ACCTCCTTA)の代わりに直交性16S rRNAの最終9nt(ATGGGATTA)を使用する。簡潔に述べれば、アルゴリズムは、標準的なSD配列を含有するランダムな5’UTR配列から開始する。5’UTR及びORFのΔG
tot(O-ribo)が、熱力学的モデルを使用して評価され、標的関数ΔG
targetと比較される。ΔG
targetは、アルゴリズムの標的が可能な限り負となるように任意に又は無限に負の値に設定されてもよい。反復手順において、変異(単一のヌクレオチドの変化、挿入又は欠失のいずれか)が5’UTR中に導入され、新たなΔG
tot
new(O-ribo)が算出される。変異した配列が配列制約を破る場合、変異は拒絶される。変異した配列が、ΔG
targetにより近いΔG
tot
new(O-ribo)につながる場合、変異は許容される。ΔG
tot
new(O-ribo)値が元々のΔG
tot(O-ribo)よりもΔG
targetから異なる場合、変異は以下の確率と共に許容される:
【数10】
【0268】
ここで、TSAはシミュレートされたアニーリング温度であり、これは5~20%の許容率を維持するように調整される。アルゴリズムは、10,000回の反復の後に終了し、5’UTR及び予測されるΔGtot(O-ribo)を出力する。
【0269】
vol 2アルゴリズムはvol 1アルゴリズムに基づく。ランダムな出発5’UTRは、ATG開始コドンから5ヌクレオチドの最適なスペーシングにおいてO-16S rRNA(ATGGGATTA)に完全に相補的であることが予測される9ヌクレオチドO-SD部位(TAATCCCAT)を含有する。5’UTR及びORFのΔG
tot(wt ribo)及びΔG
tot(O-ribo)が、熱力学的モデルを使用して評価され、仮説的なΔG
tot(opt)がΔG
tot(opt)=ΔG
tot(O-ribo)-0.5*ΔG
tot(wt ribo)に従って算出される。vol 1アルゴリズムとは対照的に、ΔG
target値は特定されない。反復手順において、変異(単一のヌクレオチドの変化、挿入又は欠失のいずれか)が5’UTR中に導入され、新たなΔG
tot
new値が算出される。変異した配列が配列制約を破るか、又はO-SD配列の5ヌクレオチドコア(TCCCA)を除去する場合、変異は拒絶される。変異した配列が向上した(より負の)ΔG
tot
new(opt)値につながる場合、変異は許容される。ΔG
tot
new(opt)値が元々のΔG
tot(opt)よりも大きい(より正の)場合、変異は以下の確率と共に許容される。
【数11】
【0270】
500回の連続する反復がΔGtot(opt)における向上をもたらさない場合、アルゴリズムは終了し、5’UTR及びΔGtot値を出力する。我々は、典型的には、アルゴリズムを複数回実行し、最も好都合なΔGtot値を有する配列を選択し;我々は、これは、出発配列当たりでより多くの反復のためにアルゴリズムを実行するよりも、高度に翻訳される5’UTRを同定するために算出的に効率的であることを見出した。この研究において、我々は、24個の予測される5’UTRから4個の配列を選択した。
【0271】
vol 3アルゴリズムはvol 2アルゴリズムに基づく。ランダムな出発5’UTRに加えて、2~12位におけるアミノ酸は、同義コドンのランダムに選択される選択によりコードされる。5’UTR中の単一のヌクレオチドの変化、挿入、又は欠失に加えて、ORF中の2~12位における同義コドン変化は、シミュレートされたアニーリング最適化の間の変異機序として許容される。
【0272】
tRNAオペロンデザイナー
プログラムは、その遺伝子が互いに隣接しており、同じ鎖上にある宿主生物中のtRNAのすべてのペアのリストを生成する。それは次に、これらの内因性tRNAペアの遺伝子配列の他に、対応する遺伝子間配列を抽出する。任意に、ユーザーは、プログラムにより考慮される遺伝子間配列の最小及び最大の長さを特定してもよい。この研究において使用されたtRNAオペロンのために、我々は、10及び100塩基対のそれぞれ最小及び最大の遺伝子間配列長を有する、大腸菌K-12株MG1655亜株ゲノム(バージョンU00096.3、最終更新日:2018年9月24日)を宿主ゲノムとして使用した。
【0273】
次に、プログラムは、外因性tRNAのすべての順序化されたペアを生成する。外因性tRNAの各々の順序化されたペアについて、これらのtRNAのアクセプターステム配列は内因性tRNAペアのアクセプターステム配列と比較される。一貫性のために、我々は、標準的な大腸菌tRNAアクセプターステム及び識別的な塩基領域を含む、tRNAの最初の7ヌクレオチド及び最後の8ヌクレオチド(CCA末端を除く)を考慮する。各々の内因性tRNAペアは、アクセプターステムの配列同一性として算出される、外因性tRNAペアに対する類似性により順位付けされる。外因性tRNAペアは次に、最も類似した内因性tRNAペアのアクセプターステムの配列同一性として定義されるスコアを割り当てられる。
【0274】
最後に、プログラムは、外因性tRNAのすべての順序化、又は並べ替えを生成する。各々の並べ替えに対応する合成tRNAオペロンは、並べ替え中の外因性tRNA遺伝子の各々の順序化されたペアの間に内因性tRNA遺伝子間領域を挿入することにより作出される。各々の順序化された外因性ペアについて、最も類似した内因性tRNAペアに対応する遺伝子間領域が選択される。各々のオペロンは、並べ替え中のすべての順序化されたペアのスコアの和として算出されるスコアを割り当てられる。
【0275】
オペロンの配列及びスコアは、選択されたtRNA及び遺伝子間領域の順序に関する情報と共に、Office Open XMLスプレッドシート中のエントリーの順位付けされたリストとして提示される。
【0276】
aaRSオペロンのアセンブリー
オペロンのアセンブリーについての詳細は補足
図3において与えられる。アライメントについてのΔGtot(wt ribo)と共にすべての予測される5’UTRを補足表3に与えている。
【0277】
DNAコンストラクト
レポーター遺伝子(strepGFPHis6、mCherry及びE2Crimson)をGibsonアセンブリーにより、テトラサイクリン耐性カセットを含有するp15Aプラスミド中にクローニングし、lacプロモーターから発現させた。最適化された5’UTRを+1転写部位とORFとの間にquick-change PCR Gibsonアセンブリーにより挿入した。最適化された5’UTR及びORFを+1転写部位とコドン13との間にquick change PCR Gibsonアセンブリーにより挿入した。O(trans)-strepGFP(40TAG、136AGGA、150AGTA)His6を、以前に記載されたp15Aプラスミド(de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020))から発現させた。O1-strepGFP(40TAG、136AGGA、150AGTA)His6、O1-strepGFP(40TAG、50CTAG、136AGGA、150AGTA)His6及びO1-strepGFP(40CTAG、50TAGA、136AGGA、150AGTA)His6をIDTによりgBlock二本鎖DNA断片として合成し、標準的なp15Aレポーター骨格中にGibsonアセンブリーによりクローニングした。リボソームを、カナマイシン耐性カセットを含有する以前に記載されたpRSFプラスミド上にコードさせ、trcプロモーターから発現させた(Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J.W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444 (2010)、Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403 (2014))。
【0278】
シンテターゼオペロンRS3及びtRNAオペロンtRNA3を、スペクチノマイシン耐性カセットを含有する以前に記載されたpMB1プラスミド(de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020))上にコードさせた。シンテターゼオペロンRS4_1及びRS4_2をIDTによりgBlockとして合成し、glnS’のプロモーターの+1転写部位の後にGibsonアセンブリーにより挿入した(de la Torre, D. & Chin, J.W. Reprogramming the genetic code. Nat. Rev. Genet., 1-16 (2020))。RS4_1-2をRS4_1及びRS4_2からの断片のGibsonクローニングによりアセンブルした。tRNAオペロンtRNA4をIDTによりgBlockとして合成し、同じpMB1プラスミド中にシンテターゼオペロンとしてGibsonクローニングによりlppプロモーターの制御下でアセンブルした。tRNA4(quad)をquick change PCR GibsonアセンブリーによりtRNA4からアセンブルした。
【0279】
蛍光レポーターの活性及び直交性の測定
各々の蛍光レポーター(strepGFPHis6、mCherry及びE2Crimson)の活性及び直交性を測定するために、我々は、蛍光レポーターをコードする0.5μLのp15Aプラスミドで、O-リボソーム又はwtリボソームのコピーをコードするpRSFプラスミドを保有する8μLの化学コンピテント大腸菌DH10B細胞を形質転換した。我々は、96ウェルマイクロタイタープレートフォーマットにおいて180μLのSOC培地中37℃及び750rpmで1hにわたり形質転換された細胞を回収した。30μLのレスキューされた細胞を使用して、1.2mLの96ウェルプレートフォーマットにおける500μLの選択2xYT-kt(50μg/mLのカナマイシン、12.5μg/mLのテトラサイクリンを含有する2xYT培地)培地への接種を行い、培養物を37℃及び750rpmで終夜生育した。30μLの終夜培養物を使用して、1.2mLの96ウェルプレートフォーマットにおける500μLの2xYT-kt培地への接種を行った。細胞を37℃及び750rpmで2h増殖させ、蛍光レポーター並びにリボソームの産生を、2mMのIPTGの最終濃度を与える10μLの0.1M IPTGの追加により誘導した。細胞を37℃及び750rpmで18h増殖させた。180μLの各々の培養物を96ウェル平底Costarプレートに移し、PHERAstar FSプレートリーダーを使用して蛍光及び光学密度を測定した。
【0280】
O1-
strep
GFP(40TAG、136AGGA、150AGTA)
His6
又はO(trans)-
strep
GFP(40TAG、136AGGA、150AGTA)
His6
からの三重の組込みの効率の比較分析
移植又は最適化された直交性5’UTRを含有するレポーターからのstrepGFP(40TAG、136AGGA、150AGTA)His6中への3つの別個のncAAの組込みの効率を比較するために、我々は、オペロンRS3/tRNA3をコードする0.4μLのpMB1プラスミドと共に、O1-strepGFPHis6、O1-strepGFP(40TAG、136AGGA、150AGTA)His6又はO(trans)-strepGFP(40TAG、136AGGA、150AGTA)His6をコードする0.4μLのp15Aプラスミドで、O-riboQ1のコピーをコードするpRSFプラスミドを保有する8μLの化学コンピテント大腸菌DH10B細胞を形質転換した。我々は、96ウェルマイクロタイタープレートフォーマットにおける180μLのSOC培地中37℃及び750rpmで1hにわたり形質転換された細胞を回収した。30μLのレスキューされた細胞を使用して、1.2mLの96ウェルプレートフォーマットにおける500μLの2xYT-kts培地(25μg/mLのカナマイシン、12.5μg/mLのテトラサイクリン及び37.5μg/mLのスペクチノマイシンを含有する2xYT)への接種を行い、培養物を37℃及び750rpmで終夜生育した。100μLの終夜培養物を使用して、10mLの24ウェルプレートフォーマットにおける4mMのBocK 1、4mMのNmH 2及び2mMのCbzK 3のいずれかを含有するか又はncAAを含有しない4mLの2xYT-kts培地への接種を行った。細胞を37℃及び220rpmで2h増殖させ、strepGFPHis6並びにO-riboQ1の産生を、2mMのIPTGの最終濃度を与える8μLの1M IPTGの追加により誘導した。細胞を37℃及び750rpmで18h増殖させた。180μLの各々の培養物を96ウェル平底Costarプレートに移し、PHERAstar FSを使用して蛍光及び光学密度を測定した。培養物の残りを3200rcfで10分間遠心分離し、Roche社製cOmpleteプロテイナーゼ阻害剤を含有するOD600を調整された量のBugBuster中に採取した。細胞を1hにわたり上下回転の下で室温で溶解させた。溶解液を1.5mLのEppendorfチューブに移し、15000rcfで20分間遠心沈降させた。180μLの清澄化された細胞溶解液を96ウェル平底Costarプレートに移し、PHERAstar FSを使用して蛍光を測定した。
【0281】
aaRS/tRNAオペロンの活性及び直交性の評価
我々のオペロンにおける各々のaaRS/tRNAペアの活性及び直交性を評価するために、我々は、オペロン(aaRS4_1/tRNA4、aaRS4_2/tRNA4、aaRS4_1-2/tRNA4及びaaRS4_1-2/tRNA(quad))をコードする0.4μLのpMB1プラスミドで、O-riboQ1のコピーをコードするpRSFプラスミドの他に、O1-strepGFP(40XXXX)His6(ここで、XXXXは、TAG(aaRS4_1-2/tRNA4(quad)を除くすべてのオペロン)、TAGA(aaRS4_1-2/tRNA4(quad)のみ)、AGGA、AGTA又はCTAGのいずれかを表す)をコードするp15Aプラスミドを宿す8μLの化学コンピテント大腸菌DH10B細胞を形質転換した。我々は、96ウェルマイクロタイタープレートフォーマットにおける180μLのSOC培地中37℃及び750rpmで1hにわたり形質転換された細胞を回収した。30μLのレスキューされた細胞を使用して、1.2mLの96ウェルプレートフォーマットにおける500μLの選択2xYT-kts培地への接種を行い、培養物を37℃及び750rpmで終夜生育した。30μLの終夜培養物を使用して、1.2mLの96ウェルプレートフォーマットにおける4mMのBocK 1、4mMのNmH 2、2mMのCbzK 3、4mMのAllocK 4、2mMのPheI 5のいずれかを含有するか又はncAAを含有しない500μLの選択2xYT-kts培地への接種を行った。細胞を37℃及び750rpmで2h増殖させ、strepGFP(40XXXX)His6の他にO-riboQ1の発現を、2mMのIPTGの最終濃度を与える10μLの0.1M IPTGの追加により誘導した。細胞を37℃及び750rpmで18h増殖させた。180μLの各々の培養物を96ウェル平底Costarプレートに移し、PHERAstar FSを使用して蛍光及び光学密度を測定した。
【0282】
MS分析のための
strep
GFP(40X)
His6
の産生
aaRS/tRNAオペロンの直交性を評価するためにMS分析用のタンパク質を単離するために、オペロンRS4_1-2/tRNA4又はRS4_1-2/tRNA4(quad)をコードする0.4μLのpMB1プラスミドを、O1-strepGFP(40XXXX)His6(ここで、XXXXは、TAG(RS4_1-2/tRNA4のみ)、TAGA(RS4_1-2/tRNA4(quad)のみ)、AGGA、AGTA及びCTAGのいずれかを表す)のいずれかをそれぞれコードする0.4μLのp15Aプラスミドと共に、O-riboQ1のコピーをコードするpRSFプラスミドを宿す50μLの化学コンピテント大腸菌DH10B細胞に入れた。我々は、1.5mLのEppendorfチューブ中の400μLのSOC培地中で37℃及び750rpmで1hにわたり形質転換された細胞を回収した。100μLのレスキューされた細胞を使用して、250mLのErlenmeyerフラスコ中50mLの選択2xYT-kts培地への接種を行い、培養物を37℃及び220rpmで終夜生育した。5mLの終夜培養物を使用して、使用されたコンストラクトに従ってncAA BocK 1、NmH 2、CbzK 3、AllocK 4及びPheI 5の組合せ(1、2、3、5と共にRS4_1-2/tRNA4 - 2、3、4、5と共にRS4_1-2/tRNA4(quad))を含有する100mLの選択2xYTkts培地への接種を行った。培養物をOD600 0.5まで37℃及び220rpmで2~3h生育し、2mMのIPTGの最終濃度まで200μLの1M IPTGで誘導した。細胞を37℃及び220rpmで18h増殖させた。細胞を3200rcfで12分間遠心分離し、Roche社製cOmpleteプロテイナーゼ阻害剤を含有する10mLのBugBuster中に再懸濁し、1.5分間音波処理(40%の振幅で2秒のオン、2秒のオフ)し、溶解液を4℃、15000rcfで20分間遠心分離した。溶解液を40μLのニッケルNTAビーズに終夜結合させた。ビーズをPBS中の240μLの20mMイミダゾールで6回洗浄した。タンパク質を20μLの250mMイミダゾール中で9回溶出させた。MS及びMS/MS分析のために3kDa Amicon ultra columnを使用して緩衝液を水に交換した。
【0283】
O1-
strep
GFP(40CTAG、50TAGA、136AGGA、150AGTA)
His6
からの4つの別個のクアドルプレットコドンに応答した4つの別個のncAAの組込みの直交性及び効率の評価
4つの別個のクアドルプレットコドン中への4つの別個のncAAの組込みの効率及び直交性を評価するために、我々は、オペロンRS4_1-2/tRNA4(quad)をコードする0.4μLのpMB1プラスミドと共にO1-strepGFPHis6又はO1-strepGFP(40CTAG、50TAGA、136AGGA、150AGTA)His6のいずれかをコードする0.4μLのp15Aプラスミドで、O-riboQ1のコピーをコードするpRSFプラスミドを保有する8μLの化学コンピテント大腸菌DH10B細胞を形質転換した。我々は、96ウェルマイクロタイタープレートフォーマットにおける180μLのSOC培地中37℃及び750rpmで1hにわたり形質転換された細胞を回収した。30μLのレスキューされた細胞を使用して、1.2mLの96ウェルプレートフォーマットにおける500μLの選択2xYT-kts培地への接種を行い、培養物を37℃及び750rpmで終夜生育した。100μLの終夜培養物を使用して、24ウェルプレートフォーマットにおける4つのncAA:4mMのNmH 2、2mMのCbzK 3、4mMのAllocK 4及び2mMのPheI 5のうちの3つの各々の組合せのいずれか、若しくはすべてのncAAを含有するか、又はいずれも含有しない4mLの選択2xYT-kts培地への接種を行った(O1-strepGFPHis6はすべてのncAAの存在下でのみ生育させた)。細胞を37℃及び220rpmで2h増殖させ、strepGFPHis6並びにO-riboQ1の産生を2mMのIPTGの最終濃度を与える8μLの1M IPTGの追加により誘導した。細胞を37℃及び750rpmで18h増殖させた。180μLの各々の培養物を96ウェル平底costarプレートに移し、PHERAstar FSを使用して蛍光及び光学密度を測定した。
【0284】
O1-strepGFP(40TAG、50CTAG、136AGGA、150AGTA)His6中への1つのアンバーコドン及び3つの別個のクアドルプレットコドンに応答した4つの別個のncAAの組込みの直交性及び効率評価のために同じ手順を使用した。しかしながら、RS4_1-2/tRNA4をオペロンとして使用し、O1-strepGFP(40TAG、50CTAG、136AGGA、150AGTA)His6をクアドルプレット組込み用のレポーターとして使用した。4mMのBocK 1を4mMのAllocK 4の代わりに使用した。
【0285】
3及び4つの別個のncAAの組込みのMS分析及び単離された収率の決定のための
strep
GFP(XXXX)
His6
の産生
strepGFP(XXXX)His6の質量分析のためと同じタンパク質産生のための手順をレポーター、オペロン及びncAAの以下の組合せと共に使用した:RS3/tRNA3及び4mMのBocK 1、4mMのNmH 2、2mMのCbzK 3と共にO1-strepGFP(40TAG、136AGGA、150AGTA)His6、又はRS4_1-2/tRNA4及び4mMのBocK 1、4mMのNmH 2、2mMのCbzK 3、2mMのPheI 5と共にO1-strepGFP(40TAG、50CTAG、136AGGA、150AGTA)His6、又はRS4_1-2/tRNA4(quad)及び4mMのNmH 2、2mMのCbzK 3、4mMのAllocK 4、2mMのPheI 5と共にO1-strepGFP(40CTAG、50TAGA、136AGGA、150AGTA)His6。
【0286】
単離された収率を決定するために、180μLの単離されたタンパク質の蛍光を、PHERAstar FSを使用して測定し、strepGFPHis6標準品を用いて生成された標準曲線に基づいてタンパク質濃度を算出した。MS及びMS/MS分析のために3kDa Amicon ultra columnを使用して緩衝液を水に交換した。
【0287】
エレクトロスプレーイオン化質量分析
変性タンパク質試料(約10μM)をLC-MS分析に供した。簡潔に述べれば、約50μl/分の流量を与えるために改変されたnanoAcquity(Waters社製、UK)を使用してC4 BEH 1.7μm、1.0×100mm UPLCカラム(Waters社製、UK)上でタンパク質を分離した。カラムを0.1%v/vのギ酸中のアセトニトリルの勾配(2%v/v→80%v/v)と共に20分にかけて展開した。分析カラムの出口をエレクトロスプレーイオン化供給源を介してハイブリッド四重極飛行時間質量分光計(Xevo G2、Waters社製、UK)と直接的に接続した。30Vのコーン電圧と共にポジティブイオンモードにおいて、300~2000のm/z範囲にかけてデータを取得した。スキャンを手動で足し合わせ、MaxEnt1(Masslynx、Waters社製、UK)を使用してデコンボリューションした。オンラインツール(http://web.expasy.org/protparam/)を使用して野生型タンパク質の理論的な分子量を最初に計算し、次にncAAの理論的な分子量のための補正を手動で行うことによりncAAを有するタンパク質の理論的な分子量を算出した。
【0288】
タンデムMS/MS分析
タンパク質をMES緩衝液と共に4-12% NuPAGE Bis-Tris gel(Invitrogen社製)上に流し、InstantBlue(Expedeon社製)を使用して短時間染色した。バンドを切除し、水中に貯蔵した。トリプシン消化及びタンデムMS/MS分析はMark Skehel(Biological Mass Spectrometry and Proteomics Laboratory、MRC Laboratory of Molecular BIology)により行われた。
【0289】
方法セクションのための参考文献
1. Salis, H. M., Mirsky, E. A. & Voigt, C. A. Automated design of synthetic ribosome binding sites to control protein expression. Nat. Biotechnol. 27, 946-950, doi:10.1038/nbt.1568 (2009).
2. Dunkelmann, D. L., Willis, J. C. W., Beattie, A. T. & Chin, J. W. Engineered triply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encoding of three distinct non-canonical amino acids. Nat. Chem. 12, 535-544, doi:10.1038/s41557-020-0472-x (2020).
3. Neumann, H., Wang, K., Davis, L., Garcia-Alai, M. & Chin, J. W. Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome. Nature 464, 441-444, doi:10.1038/nature08817 (2010).
4. Wang, K. et al. Optimized orthogonal translation of unnatural amino acids enables spontaneous protein double-labelling and FRET. Nat. Chem. 6, 393-403, doi:10.1038/nchem.1919 (2014).
【0290】
【0291】
【0292】
補足表3及び表4は、刊行物:Daniel L. Dunkelmann1, Sebastian B. Oehm, Adam T. Beattie, Jason W. Chin; 「A 68-codon genetic code to incorporate four distinct non-canonical amino acids enabled by automated orthogonal mRNA discovery」において見出され、その全体が参照により組み込まれる。
【国際調査報告】