(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-23
(45)【発行日】2023-01-06
(54)【発明の名称】ユーザー定義の機能性を有する哺乳動物プロモーターのインシリコ設計
(51)【国際特許分類】
C12N 15/113 20100101AFI20221226BHJP
C12N 15/67 20060101ALI20221226BHJP
C12N 15/85 20060101ALI20221226BHJP
C12N 1/15 20060101ALI20221226BHJP
C12N 1/19 20060101ALI20221226BHJP
C12N 1/21 20060101ALI20221226BHJP
C12N 5/10 20060101ALI20221226BHJP
C40B 40/06 20060101ALI20221226BHJP
【FI】
C12N15/113 Z
C12N15/67 Z ZNA
C12N15/85 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C40B40/06
(21)【出願番号】P 2019556682
(86)(22)【出願日】2018-04-19
(86)【国際出願番号】 EP2018060125
(87)【国際公開番号】W WO2018193072
(87)【国際公開日】2018-10-25
【審査請求日】2021-03-23
(32)【優先日】2017-04-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】506042265
【氏名又は名称】メディミューン リミテッド
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】ブラウン,アダム,ジェイ
(72)【発明者】
【氏名】ジェームズ,デビッド,シー
(72)【発明者】
【氏名】ギブソン,スザンヌ,ジェイ
(72)【発明者】
【氏名】ハットン,ダイアン
【審査官】小倉 梢
(56)【参考文献】
【文献】特表2016-537987(JP,A)
【文献】特表2009-529855(JP,A)
【文献】国際公開第2012/099279(WO,A1)
【文献】特開2001-054391(JP,A)
【文献】Nucleic Acids Res.,2015年,Vol. 43, No. 11,p. 5318-5330
【文献】Oncogene,1997年,Vol. 15,p. 3091-3102
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00 - 15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
GenBank/EMBL/DDBJ/GeneSeq
(57)【特許請求の範囲】
【請求項1】
(a)4~20個の転写因子調節エレメント(TFRE)を含むヌクレオチド配列及び(b)プロモーターコアを含む合成プロモーターであって、前記TRFEを含む前記ヌクレオチド配列が前記プロモーターコアの上流にあり、且つ少なくとも3分の1の前記TFREが、抗酸化RE(ARE)、ETS結合部位1(EBS1)、小胞体ストレスRE(ERSE)、及びダイオキシンRE(DRE)のTFREからなる群から個別に選択され、前記プロモーターが配列番号37を含む、合成プロモーター。
【請求項2】
前記ヌクレオチド配列が、前記TFRE間にスペーサーを含み、前記スペーサーが50個以下のヌクレオチドである、請求項1に記載の合成プロモーター。
【請求項3】
前記スペーサーが、25個以下のヌクレオチドである、請求項2に記載の合成プロモーター。
【請求項4】
前記スペーサーが、12個以下のヌクレオチドである、請求項3に記載の合成プロモーター。
【請求項5】
前記スペーサーが、約6個のヌクレオチドである、請求項4に記載の合成プロモーター。
【請求項6】
前記TFREを含む前記ヌクレオチド配列が、10個以下のCpGジヌクレオチドを含む、請求項1~5のいずれか一項に記載の合成プロモーター。
【請求項7】
前記TFREを含む前記ヌクレオチド配列が、5個以下のCpGジヌクレオチドを含む、請求項6に記載の合成プロモーター。
【請求項8】
前記TFREを含む前記ヌクレオチド配列が、20個よりも大きいヌクレオチド長の任意の反復配列を含有しない、請求項1~7のいずれか一項に記載の合成プロモーター。
【請求項9】
前記TFREを含む前記ヌクレオチド配列が、いずれのEcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、又はPacI制限エンドヌクレアーゼ部位も含有しない、請求項1~8のいずれか一項に記載の合成プロモーター。
【請求項10】
前記TFREの順序が、前記合成プロモーターの活性
に影響を及ぼさない、請求項1~9のいずれか一項に記載の合成プロモーター。
【請求項11】
前記TFREの配向が、前記合成プロモーターの活性
に影響を及ぼさない、請求項1~10のいずれか一項に記載の合成プロモーター。
【請求項12】
前記プロモーターの活性が、各TFREのコピーの数と相関する、請求項1~11のいずれか一項に記載の合成プロモーター。
【請求項13】
前記合成プロモーターが、細胞増殖
に影響を及ぼさない、請求項1~12のいずれか一項に記載の合成プロモーター。
【請求項14】
前記合成プロモーターが、細胞生存率
に影響を及ぼさない、請求項1~13のいずれか一項に記載の合成プロモーター。
【請求項15】
前記合成プロモーターが、ヘテロタイプのプロモーターにおいて転写的に不活性なTFREを含有しない、請求項1~14のいずれか一項に記載の合成プロモーター。
【請求項16】
前記合成プロモーターが、ヘテロタイプのプロモーターにおいて転写的に抑制されているTFREを含有しない、請求項1~15のいずれか一項に記載の合成プロモーター。
【請求項17】
前記ARE TFREが、配列番号7のヌクレオチド配列を含む、請求項1~16のいずれか一項に記載の合成プロモーター。
【請求項18】
前記EBS1 TFREが、配列番号10のヌクレオチド配列を含む、請求項1~17のいずれか一項に記載の合成プロモーター。
【請求項19】
前記ERSE TFREが、配列番号15のヌクレオチド配列を含む、請求項1~17のいずれか一項に記載の合成プロモーター。
【請求項20】
前記DRE TFREが、配列番号31のヌクレオチド配列を含む、請求項1~17のいずれか一項に記載の合成プロモーター。
【請求項21】
追加のCHO細胞TFREをさらに含む、請求項1~20のいずれか一項に記載の合成プロモーター。
【請求項22】
少なくとも1つの前記追加のCHO細胞TFREが、配列番号6、9、及び23のいずれか1つのヌクレオチド配列を含む、請求項21に記載の合成プロモーター。
【請求項23】
TFREを含む前記ヌクレオチド配列が、少なくとも2コピーの同じTRFEを含む、請求項1~22のいずれか一項に記載の合成プロモーター。
【請求項24】
TFREを含む前記ヌクレオチド配列が、少なくとも3コピーの同じTRFEを含む、請求項1~23のいずれか一項に記載の合成プロモーター。
【請求項25】
前記合成プロモーターがプロモーターサイレンシングを回避する、請求項1~24のいずれか一項に記載の合成プロモーター。
【請求項26】
前記合成プロモーターが、タンパク質産生を支える重要な細胞プロセスに対するオフターゲット作用を最小化する、請求項1~25のいずれか一項に記載の合成プロモーター。
【請求項27】
請求項1~26のいずれか一項に記載の合成プロモーターを含むベクター。
【請求項28】
前記合成プロモーターが、タンパク質をコードする遺伝子に作動可能に連結される、請求項27に記載のベクター。
【請求項29】
前記タンパク質が、レポータータンパク質、治療用タンパク質、又は酵素である、請求項28に記載のベクター。
【請求項30】
請求項1~26のいずれか一項に記載の合成プロモーター又は請求項27~29のいずれか一項に記載のベクターを含む細胞。
【請求項31】
前記細胞が哺乳動物細胞である、請求項30に記載の細胞。
【請求項32】
前記哺乳動物細胞がCHO細胞である、請求項31に記載の細胞。
【請求項33】
前記哺乳動物細胞がヒト細胞である、請求項31に記載の細胞。
【請求項34】
請求項1~26のいずれか一項に記載の合成プロモーターを含むライブラリー。
【請求項35】
少なくとも100種の異なる合成プロモーターを含む、請求項34に記載のライブラリー。
【発明の詳細な説明】
【背景技術】
【0001】
文脈特異的なプロモーターの性能は、プロモーター活性動態、長期間の遺伝子発現カセットの挙動(例えば、サイレンシングに関する性質、他の遺伝的成分との適合性(1))、及びプロモーター-細胞相互作用(例えば、細胞プロセスに対するオフターゲット作用、例えば、転写装置成分の隔離による(2、3))の関数である。自然に進化した配列の固有の制限、例えば、望ましくないサイズ及び予測不可能な発現動態を考慮して、合成プロモーターは通常、大部分の用途のために好ましい。合成プロモーター構築の最も単純な方法は、配列エレメントを除去(4、5)、挿入(6、7)、又は変異(8、9)することによって既存のプロモーターの機能を強化することを伴う(合成プロモーターの構築法の包括的な総説については(10)を参照のこと)。しかしながら、この戦略により、内在性/ウイルスプロモーター性能において増加性の改善が可能である一方で、準最適の開始配列が、再設計を介して機能に関して十分に最適化され得る可能性は低い。反対に、完全に合成的な構築物のボトムアップの構築は、プロモーター設計空間の広範囲の拡張を可能にする。
【0002】
同種の結合部位(転写因子調節エレメント(TFRE))を含有する合成プロモーターをトランス活性化する合成転写因子(すなわち、ジンクフィンガー(11)、転写活性化因子様エフェクター(12)、キメラ(13)、及びCRISPR転写因子(14))を含む完全に合成的な系は、最小限の宿主細胞-プロモーター相互作用を課す。しかしながら、関連する代謝的負荷及び他の外来性組換えタンパク質の導入は、遺伝子治療及び生物学的製剤の生産などの、いくつかの用途においてこれらの系の魅力を制限し得る。宿主細胞の既存のレパートリーの転写因子(TF)と相互作用する人工プロモーターを構築することは、補助的なTFの必要を除去するが、合成プロモーター-内在性TF-内在性プロモーターのインタラクトームは、合成及び内在性プロモーターの両方の活性動態に負の影響を及ぼす可能性がある(2、3、15)。したがって、現在利用可能なプロモーター構築法を使用する場合、プロモーター、発現カセット及び宿主細胞性能を同時に最適化することは困難である。これらの相互に関係のある機能性の同時の最適化は、インシリコでのプロモーター(相補的な合成TFを必要としない)のカスタム設計を介してのみ可能となり得る。実際に、遺伝子部分の新規の合成設計に向けた動きは、哺乳動物の合成生物学にとって重要な目標である。
【0003】
インシリコプロモーター設計は、複合性TFREの配向、空間配置、及び順序、並びにそれらの同種のTFの機能、発現レベル、及び活性を含むプロモーター活性を統御する複雑な規則によって制限される(16、17)。しかしながら、Smithらは近年、数千個の人工配列においてTFRE機構の規則を体系的に試験し、プロモーター活性の大部分が単に、関連しているTFREのコピー数の関数であることを見出した(18)。これらの知見は、TFRE機構のビルボードモデルを支持し、ここで結合部位の配置、順序、及び配向は大部分が無視され得る(19、20)。しかしながら、Smithらによって構築されたプロモーターにおいて(18)、活性は、種々のTFREペアの間の組み合わせの相互作用によって影響された。複合性のTFREが相乗作用し、且つ/又は相互作用を妨害できるとき、相対的なTFREの順序は、プロモーター活性に著しく影響を及ぼす場合があり、インシリコプロモーター設計の複雑性を実質的に増大させる。しかしながら、研究により、TF間の組み合わせの相互作用が、比較的まれであることが示されている(21)。さらに、Smithらは、プロモーター構築のために使用された12種のTFREの間の(考えられる66種のうち)8種の組み合わせのTFRE相互作用のみを同定した(18)。比較的単純な設計規則を有するプロモーターを構築するための協同的に機能しないTFREを選択する方法が必要とされている。
【発明の概要】
【課題を解決するための手段】
【0004】
本明細書で提供される方法は、協同的に機能しないモジュラーTFREの組み合わせを特異的に選択し、且つ比較的単純な設計規則を有するプロモーターを構築するためにそれらを利用することが可能であることを実証する。TF濃度レベルが、同種の結合部位活性と十分に相関すると仮定すると(22、23)、インシリコプロモーター設計は、i)宿主細胞におけるTF発現をプロファイリングすること、ii)相乗的に機能しないTFREを同定すること、及びiii)ヘテロタイプのエレメント内のTF-TFRE相互作用の相対的な転写活性(すなわち、各TFREの単一コピーにより提供される全体的なプロモーター活性への寄与)を決定することによって達成され得る。この測定モデルを操作する規範を適用することによって、この研究は、初めて、インビトロで設計された機能性を呈するインシリコでの合成プロモーターのモデルに従う設計を報告する。ヘテロタイプのプロモーター活性の単純化されたモデルにより、合成エレメントの新規の設計が可能になったが、ここで、モジュラーTFREブロックの組成及び順序は、長期間の発現安定性及び所望の活性動態などの文脈特異的な要求に従って最適化され得る。プロモーターが単純な設計規則に従って合成的に設計され得ることを実証することによって、この研究は、真核生物の転写調節機構に新たな洞察示し、且つ哺乳動物の合成生物学を可能にする重要なツールを提供する。
【0005】
したがって、本明細書では、合成プロモーターが提供される。一態様では、合成プロモーターは、(a)4~20個の転写因子調節エレメント(TFRE)を含むヌクレオチド配列及び(b)プロモーターコアを含み、ここで、TRFEを含むヌクレオチド配列はプロモーターコアの上流にあり、且つ少なくとも3分の1のTFREは、抗酸化RE(ARE)、ETS結合部位1(EBS1)、小胞体ストレスRE(ERSE)、及びダイオキシンRE(DRE)のTFREからなる群から個別に選択される。一態様では、ヌクレオチド配列は、TFRE間のスペーサーを含み、スペーサーは、50個以下のヌクレオチド、25個以下のヌクレオチド、又は12個以下のヌクレオチドである。一態様では、スペーサーは、約6個のヌクレオチドである。一態様では、コアプロモーターは、CMVコアプロモーターであり、任意選択によりCMVコアプロモーターは、配列番号33のヌクレオチド配列を含む。
【0006】
本明細書で提供されるとおり、合成プロモーターは、配列番号37~50のいずれか1つのヌクレオチド配列を含み得る。
【0007】
本明細書では又、合成プロモーターを設計する方法が提供される。一態様では、合成プロモーターを設計する方法は、(i)転写因子(TF)発現をプロファイリングしてTFを選択すること、(ii)ホモタイプのプロモーターにおいて転写的に活性な選択されたTFと相互作用する転写因子調節エレメント(TFRE)を同定すること、及び(iii)ヘテロタイプのプロモーター内のTF-TFRE相互作用の相対的な転写活性を決定することを含む。一態様では、本方法はさらに、(iv)所望の転写活性を有するTFREを選択することを含む。一態様では、本方法はさらに、(v)(a)所望の転写活性を有する選択されたTFREを含むヌクレオチド配列及び(b)プロモーターコアを含む合成プロモーターを生成することを含み、ここで、TRFEを含むヌクレオチド配列はプロモーターコアの上流にある。
【0008】
一態様では、TF発現をプロファイリングすることは、TFの存在量を決定することを含む。一態様では、TFの存在量を決定することは、TFのRNA又はタンパク質レベルを測定することを含む。一態様では、TF発現をプロファイリングすることは、少なくとも2種の細胞型におけるTF発現をプロファイリングすることを含む。一態様では、少なくとも2種の細胞型は、哺乳動物の細胞型である。一態様では、少なくとも2種の哺乳動物の細胞型は、CHO細胞である。一態様では、少なくとも2種の細胞株は、組換えタンパク質を発現する細胞株及びその親細胞株を含む。一態様では、少なくとも2種の細胞型は、同じ生物由来の2種の細胞型であり、任意選択により、生物はヒトである。
【0009】
一態様では、高度に発現されるTFが選択される。一態様では、上位50%、45%、40%、35%、30%、25%、20%、15%又は10%内の発現レベルを有するTFが選択される。
【0010】
一態様では、TF発現をプロファイリングすることは、少なくとも2種の細胞型、少なくとも2期の細胞培養、及び/又は少なくとも2種の培養条件にわたってTFの安定性を決定することを含む。一態様では、本方法はさらに、少なくとも2種の細胞型、少なくとも2期の細胞培養、及び/又は少なくとも2種の培養条件にわたって発現レベルにおける2、又は1.5、又は1以下の最大倍率変化を有するTFを選択することを含む。
【0011】
一態様では、TF発現をプロファイリングすることは、少なくとも2期の細胞培養においてTF発現をプロファイリングすることを含む。一態様では、少なくとも2期の細胞培養は、定常期及び指数増殖期を含む。一態様では、目的の宿主細胞において優先的に上方制御され、且つ/又はオフターゲットの宿主細胞において優先的に下方制御されるTFが選択される。一態様では、目的の細胞周期において優先的に上方制御され、且つ/又はオフターゲットの細胞周期において下方制御されるTFが選択される。
【0012】
一態様では、少なくとも100種のTFの発現がプロファイリングされる。
【0013】
一態様では、ホモタイプのプロモーターは、2~20コピーのTFREを含む。一態様では、ホモタイプのプロモーターは、4~10コピーのTFREを含む。
【0014】
一態様では、相対的な転写活性を決定することは、TFREのコピー数の関数としてヘテロタイプのプロモーター活性をモデル化することを含む。一態様では、ヘテロタイプのプロモーターは、2~20コピーのTFREを含む。
【0015】
本明細書では又、本明細書で提供される方法に従って生成される合成プロモーターが提供される。一態様では、合成プロモーターは、4~20個のTFREを含むヌクレオチド配列及びプロモーターコアを含み、ここで、TRFEを含むヌクレオチド配列はプロモーターコアの上流にある。一態様では、少なくとも1つのTFREは、抗酸化RE(ARE)、ETS結合部位1(EBS1)、小胞体ストレスRE(ERSE)、及びダイオキシンRE(DRE)のTFREからなる群から選択される。一態様では、ヌクレオチド配列は、TFRE間のスペーサーを含み、スペーサーは、50個以下のヌクレオチド、25個以下のヌクレオチド、又は12個以下のヌクレオチドである。一態様では、スペーサーは、約6個のヌクレオチドである。一態様では、コアプロモーターは、CMVコアプロモーターであり、任意選択によりCMVコアプロモーターは、配列番号33のヌクレオチド配列を含む。
【0016】
本明細書で提供され、且つ/又は本明細書で提供される方法に従って生成されるプロモーターの一態様では、TFREを含むヌクレオチド配列は、10個以下のCpGジヌクレオチドを含む。一態様では、TFREを含むヌクレオチド配列は、5個以下のCpGジヌクレオチドを含む。一態様では、TFREを含むヌクレオチド配列は、20個よりも大きいヌクレオチド長の任意の反復配列を含有しない。一態様では、TFREを含むヌクレオチド配列は、いずれのEcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、又はPacI制限エンドヌクレアーゼ部位も含有しない。一態様では、TFREを含むヌクレオチド配列は、いずれのEcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、PacI、XhoI、又はKpnI制限エンドヌクレアーゼ部位も含有しない。一態様では、TFREの順序は、合成プロモーターの活性に著しくは影響を及ぼさない。
【0017】
一態様では、TFREの配向は、合成プロモーターの活性に著しくは影響を及ぼさない。一態様では、プロモーターの活性は、各TFREのコピーの数と相関する。
【0018】
一態様では、合成プロモーターは、細胞増殖に著しい影響を及ぼさない。一態様では、合成プロモーターは、細胞生存率に著しい影響を及ぼさない。一態様では、合成プロモーターは、ヘテロタイプのプロモーターにおいて転写的に不活性なTFREを含有しない。一態様では、合成プロモーターは、ヘテロタイプのプロモーターにおいて転写的に抑制されているTFREを含有しない。
【0019】
一態様では、ARE TFREは、配列番号7のヌクレオチド配列を含む。一態様では、EBS1 TFREは、配列番号10のヌクレオチド配列を含む。一態様では、ERSE TFREは、配列番号15のヌクレオチド配列を含む。一態様では、DRE TFREは、配列番号31のヌクレオチド配列を含む。
【0020】
一態様では、合成プロモーターはさらに、追加のCHO細胞TFREを含む。一態様では、少なくとも1つの追加のCHO細胞TFREは、配列番号6、9、及び23のいずれか1つのヌクレオチド配列を含む。
【0021】
一態様では、TFREを含むヌクレオチド配列は、少なくとも2コピーの同じTRFEを含む。一態様では、TFREを含むヌクレオチド配列は、少なくとも3コピーの同じTRFEを含む。
【0022】
一態様では、合成プロモーターは、プロモーターサイレンシングを回避する。一態様では、合成プロモーターは、タンパク質産生を支える重要な細胞プロセスに対するオフターゲット作用を最小化する。
【0023】
本明細書では又、本明細書で提供される合成プロモーターを含むベクターが提供される。一態様では、そのベクターの合成プロモーターは、タンパク質をコードする遺伝子に作動可能に連結される。一態様では、タンパク質は、レポータータンパク質、治療用タンパク質、又は酵素である。
【0024】
本明細書では又、本明細書で提供される合成プロモーター又は本明細書で提供されるベクターを含む細胞が提供される。一態様では、細胞は、哺乳動物細胞である。一態様では、哺乳動物細胞は、CHO細胞である。一態様では、哺乳動物細胞は、ヒト細胞である。
【0025】
本明細書では又、本明細書で提供される合成プロモーターを含むライブラリーが提供される。一態様では、ライブラリーは、少なくとも100種の異なる合成プロモーターを含む。
【図面の簡単な説明】
【0026】
【
図1】
図1A及び1B:比較的豊富な宿主細胞成分に結合するモジュラーの転写的に活性なTFREの同定。
図1A)CHO細胞トランスクリプトームのRNA-seq分析により、宿主細胞転写因子(TF)の相対的な発現レベルを決定した。点は、対数期及び定常期の培養液(n=6)で採取された、3種の別々のCHO細胞株における各TFの平均発現レベルを表す。挿入されたグラフは、各種CHO細胞株及び増殖期にわたる高い発現(TFのmRNA発現レベルの上位30%に位置する)及び安定な発現を呈する、67種のTFの発現レベルを示す(最大倍率変化<1.5)。FPKM=マッピングされた100万個の断片当たりのキロベース転写物当たりの断片
図1B)適切な発現動態を有するTFの同種の結合部位が、SEAPレポーターベクターにおける最小CMVコアプロモーターの上流のシリーズ(6×コピー)において同定及びクローン化された。CHO細胞を、各TFREレポーターで一過的にトランスフェクトし、SEAP活性をトランスフェクション後24時間測定した。データを、最も強力なホモタイプのプロモーターによって呈される産生のパーセンテージとして表した。バーは、それぞれ三つ組で実施された3回の独立した実験の平均値+SDを表す。
【
図2】
図2A及び2B:モジュラーTFREブロックのヘテロタイプの集合体は、2桁を超える転写活性を呈する。
図2A)ホモタイプ構造において転写的に活性であったTFRE(
図1を参照のこと)を様々な組み合わせで組み合わせて、ヘテロタイプのプロモーターのライブラリーを構築した。およそ20個の構築物が各ライブラリー内で作製されたが、複合性TFREの順序、配向、空間配置及びコピー数は異なった。
図2B)ヘテロタイプのエレメントが、SEAPレポーターベクターにおける最小CMVコアプロモーターの上流に挿入され、且つCHO細胞に一過的にトランスフェクトされた。SEAP発現は、トランスフェクション後24時間定量化された。データを、最も強力なヘテロタイプのプロモーターによって呈される産生のパーセンテージとして表した。制御hCMV-IE1-SEAPレポーターからのSEAP産生は、水平の黒線(「CMV」)として示される。各バーは、2つのトランスフェクションの平均を表し;各プロモーターについて、SEAP産生における10%未満の変動が観察された。細胞培養液の上清における相対的なタンパク質活性を確認したSEAP転写物存在量の定量的PCR(qPCR)分析は、SEAPのmRNAレベルと直線的に相関した(
図6を参照のこと)。
【
図3】
図3A、3B及び3C:ヘテロタイプのプロモーター構造におけるモジュラーTFREブロックの機能は、結合部位の順序及びスペーシングに依存しない。
図3A)ヘテロタイプのエレメント内の別々のTFREの機能は、複数の「規則」によって影響され得る。本発明者らは、唯一の予測変数としてTFREのコピー数を使用してヘテロタイプのプロモーター活性(
図2を参照のこと)をモデル化した。
図3B)線形回帰モデルの予測能を、1個抜き及び5倍交差検定(CV)を用いて分析した。
図3C)ヘテロタイプのプロモーター内各モジュラーTFREブロックの単一コピーの相対的な転写活性を、モデル係数を分析することによって決定した。
【
図4】
図4A及び4B:合成的に設計されたプロモーターは、インビトロにおいて予測可能な活性を呈する。
図4A)同一のTFRE組成を有するが様々なTFRE順序を有するプロモーターを、インシリコで設計した。各合成エレメントのインビトロ活性を、ヘテロタイプのプロモーター活性の本発明者らのモデルを用いて予測した(
図3を参照のこと)。
図4B)合成プロモーターが、SEAPレポーターベクターにおける最小CMVコアエレメントの上流に化学的に合成され、挿入され、且つCHO細胞に一過的にトランスフェクトされた。SEAP発現は、トランスフェクション後24時間定量化された。データを、インビトロで構築された最も強力なヘテロタイプのプロモーターであるIVC1(100に等しい相対プロモーター単位(RPU);
図2を参照のこと)によって呈される産生のパーセンテージとして表した。値は、三つ組で実施された3つの独立した実験の平均値+SDを表す。
【
図5】
図5A、5B、5C及び5D:インシリコで設計された配列は、インビトロでカスタム定義の機能性を呈する。
図5A)数百万のTFREの組み合わせを、ヘテロタイプのエレメント活性の本発明者らのモデルを用いてインシリコで構築し、試験した(
図3を参照のこと)。選択基準を適用して、CHO細胞における生物学的製剤の生産の文脈に最適な組み合わせを同定した。次に、各プロモーター内の成分TFREを特異的に配置して、プロモーターサイレンシングに寄与する可能性のある配列の特徴の出現を防止した。
図5B)様々に設計された活性を有する合成プロモーターが、SEAPレポーターベクターにおける最小CMVコアエレメントの上流に化学的に合成され、挿入され、且つCHO細胞に一過的にトランスフェクトされた。SEAP発現は、トランスフェクション後24時間定量化された。データを、最も強力なプロモーターによって呈される産生のパーセンテージとして表した。
図5C)CHO細胞を、グルタミンシンターゼの選択マーカー遺伝子を共発現する合成プロモーター-レポータープラスミドで安定的にトランスフェクトした。メチオニンスルホキシイミンを含有する培地中での選択後、プロモーター活性を、7日間のバッチ産生プロセスの間測定した。SEAP力価及びmRNA存在量を、増殖の対数期中期及び定常期において決定した。データを、最も強力なプロモーターによって呈される発現のパーセンテージとして表した。
図5D)安定的なプールを、60世代間選択培地中で継代培養した。SEAP発現を、7日間のバッチ産生プロセスの最後に定量化した。データを、15世代目の各プールによって呈される産生のパーセンテージとして表した。値は、三つ組で実施された3回の独立した実験の平均値+SDを表す。
【
図6】細胞培養液の上清におけるSEAP活性は、SEAPのmRNAレベルと直線的に相関した。インビトロで構築されたヘテロタイプのプロモーターが、SEAPレポーターベクターにおける最小CMVコアプロモーターの上流に挿入され、且つCHO細胞に一過的にトランスフェクトされた(
図2を参照のこと)。SEAP発現は、トランスフェクション後24時間定量化された。データを、最も強力なヘテロタイプのプロモーターによって呈される産生のパーセンテージとして表した。バーは、それぞれ三つ組で実施された3回の独立した実験の平均値+SDを表す。
【
図7】一過的なトランスフェクション力価。種々のプロモーターの制御下での免疫活性化タンパク質の発現レベルは、CHO細胞における一過的なトランスフェクションの後に示される。
【
図8】安定的なプールの力価。種々のプロモーターの制御下での免疫活性化タンパク質のフェドバッチ発現レベルは、安定的なCHOプールにおいて示される。
【発明を実施するための形態】
【0027】
I.定義
本明細書で使用する場合、用語「プロモーター」は、RNAポリメラーゼを指示してDNAに結合させ、且つRNA合成を開始することによって転写の開始を媒介する制御性のDNA配列を定義する。プロモーターは、一般に、遺伝子の上流に位置する。プロモーターは、例えば、コアプロモーター及び転写因子調節エレメントを含み得る。
【0028】
「合成プロモーター」は、転写因子調節エレメントを含む人工的であり、操作され、且つ/又は組み立てられたプロモーターを指す。
【0029】
「転写因子調節エレメント」(TFRE)は、転写因子のための結合部位であるヌクレオチド配列である。例示的なTFREは、表1において提供される。
【0030】
「転写因子」(TF)は、TFREに結合するタンパク質であり、遺伝子の転写速度に影響を及ぼす(正又は負のいずれか)。
【0031】
「コアプロモーター」は、転写を開始するのに必要なプロモーターの最小の部分であるヌクレオチド配列を指す。コアプロモーター配列は、例えばCMV最初期遺伝子プロモーター又はSV40を含む原核生物遺伝子又は真核生物遺伝子に由来し得る。コアプロモーターは、例えば、TATAボックスを含み得る。コアプロモーターは、例えば、イニシエーターエレメントを含み得る。コアプロモーターは、例えば、TATAボックス及びイニシエーターエレメントを含み得る。
【0032】
本明細書で使用する場合、用語「エンハンサー」は、遺伝子の転写、遺伝子の同一性に依存しないこと、遺伝子に関連した配列の位置、及び配列の配向を増強するために作用するヌクレオチド配列を定義する。
【0033】
用語「機能上連結した」及び「作動可能に連結した」は互換的に使用され、2種以上のDNAセグメント(例えば、発現される遺伝子及び遺伝子の発現を制御する配列)間の機能的関係性を指す。例えば、シス作用性転写調節エレメントの任意の組み合わせを含むプロモーター及び/又はエンハンサー配列は、適切な宿主細胞又は他の発現系におけるコード配列の転写を刺激するか、又は調節する場合、コード配列に作動可能に連結される。転写される遺伝子配列に作動可能に連結されるプロモーター調節配列は、転写される配列に物理的に隣接している。
【0034】
「配向」は、所与のDNA配列におけるヌクレオチドの順序を指す。例えば、別のDNA配列に対して逆方向にあるDNA配列の配向とは、別の配列に対して配列の5’~3’の順序が、配列が得られたDNA中の基準点と比較するときに反転される配向である。このような基準点には、供給源であるDNAの他の指定されたDNA配列の転写方向、及び/又はこの配列を含有する複製可能なベクターの複製起点が含まれ得る。
【0035】
本明細書で使用する場合、用語「発現ベクター」は、適切な宿主細胞へとトランスフェクションされると、宿主細胞内で組換え遺伝子産物の発現をもたらす単離DNA分子及び精製DNA分子を含む。組換え体又は遺伝子産物をコードするDNA配列に加えて、発現ベクターは、宿主細胞株における、DNAコード配列のmRNAへの効率的な転写及び任意選択によりmRNAのタンパク質への効率的な翻訳に必要となる制御性DNA配列を含む。
【0036】
本明細書で使用する場合、用語「宿主細胞」又は「宿主細胞株」は、任意の細胞、特に、培養物中で成長し、所望の組換え産物タンパク質を発現することが可能な哺乳動物細胞を含む。
【0037】
本明細書で使用する場合、用語「CpG部位」は、直鎖状の塩基配列中のその全長にわたってグアニンヌクレオチドの隣にシトシンヌクレオチドが現れるDNAの領域を含む。「CpG」とは、「-C-リン酸-G-」、すなわち1つのリン酸のみで隔てられたシトシン及びグアニンの略称であり;リン酸により、任意の2つのヌクレオシドが、DNA中で一体に連結されている。「CpG」という表記は、この直鎖状配列を、シトシンとグアニンとによるCG塩基対合から識別するのに使用される。
【0038】
本明細書で使用する場合、用語「発現カセット」は、発現されるポリペプチドと、シス作用性転写調節エレメントの任意の組み合わせを含む、プロモーター、及び任意選択により、エンハンサー配列などのその発現を制御する配列とをコードするポリヌクレオチド配列を含む。遺伝子の発現、すなわち、その転写及び転写産物の翻訳を制御する配列は一般に、調節単位と呼ばれる。調節単位の大部分は、遺伝子のコード配列の上流に位置し、それへと作動可能に連結されている。発現カセットは又、ポリアデニル化部位を含む下流の3’側非翻訳領域も含有し得る。本発明の調節単位は、発現される遺伝子、すなわち、転写単位に作動可能に連結されているか、又は、例えば、異種遺伝子の5’非翻訳領域によるなど、介在するDNAによりそこから隔てられている。発現カセットのベクターへの挿入及び/又はベクターからのその切出しを可能にするために、発現カセットは、好適な1つ以上の制限部位に隣接されることが好ましい。したがって、本発明による発現カセットは、発現ベクター、特に、哺乳動物の発現ベクターを構築するために使用され得る。本発明の発現カセットは、プロモーターの下流に1種以上、例えば、2種、3種又はそれ以上の非翻訳ゲノムDNA配列を含み得る。
【0039】
用語「ポリヌクレオチド」及び「ヌクレオチド配列」は、細胞から単離され得る天然に存在する核酸分子又は組換えで発現される核酸分子、及び、例えば、化学合成又はポリメラーゼ連鎖反応(PCR)などの酵素的方法によって調製され得る合成分子を含む。
【0040】
本明細書で使用する場合、用語「ポリペプチドをコードするポリヌクレオチド配列」は、ポリペプチドを発現する遺伝子、好ましくは、異種遺伝子をコードするDNAを含む。
【0041】
用語「異種コード配列」、「異種遺伝子配列」、「異種遺伝子」、「組換え遺伝子」、又は「遺伝子」は、互換的に用いられる。これらの用語は、宿主細胞において、好ましくは、哺乳動物細胞において発現され、採取することが求められる組換え体、特に、組換え異種タンパク質産物をコードするDNA配列を指す。遺伝子産物は、ポリペプチドであり得る。異種遺伝子配列は、天然では宿主細胞内に存在せず、同じ種又は異なる種の生物に由来し、遺伝的に改変されている場合がある。
【0042】
用語「タンパク質」及び「ポリペプチド」は互換的に使用されて、隣接残基のα-アミノ基及びカルボキシ基間のペプチド結合によって他方に連結される一連のアミノ酸残基を含む。
【0043】
II.合成プロモーターを作製する方法
本明細書で提供される方法を使用して、プロモーターは、特定の機能性、例えば、所望の発現レベル、細胞増殖の所望の期における発現、及び/又は所望の細胞型における発現を有するように設計され得る。プロモーターを設計するための方法は、(i)転写因子(TF)発現をプロファイリングしてTFを選択すること、(ii)ホモタイプのプロモーターにおいて転写的に活性な選択されたTFと相互作用する転写因子調節エレメント(TFRE)を同定すること、及び(iii)ヘテロタイプのプロモーター内のTF-TFRE相互作用の相対的な転写活性を決定することを含み得る。任意選択により、方法はさらに、(iv)所望の転写活性を有するTFREを選択すること、及び(v)選択されるTFREを含む合成プロモーターを生成することを含み得る。
【0044】
TF発現のプロファイリングは、実験的に(例えば、TFのRNA及び/又はタンパク質レベル(例えば、本明細書の実施例1において例示される))達成され得るか、又はTF発現パターンのデータを精査することによって達成され得る。このようなプロファイリングは、個々の細胞型、増殖期、若しくは培養条件におけるTF(RNA又はタンパク質)の量又は存在量、及び/又は複数の細胞型、増殖期、又は培養条件にわたるTF(RNA又はタンパク質)の量又は存在量の変動性を決定することを含み得る。したがって、本明細書で提供される方法は、少なくとも2種の細胞型、少なくとも2種の増殖期(例えば、定常期及び指数増殖期)、及び/又は少なくとも2種の培養条件における発現を比較することによってTF発現をプロファイリングすることを含み得る。本明細書で提供される方法は、少なくとも3種の細胞型、少なくとも3種の増殖期、及び/又は少なくとも3種の培養条件における発現を比較することによってTF発現をプロファイリングすることを含み得る。本明細書で提供される方法は、少なくとも2種の増殖期における少なくとも2種の細胞型、又は少なくとも2種の培養条件における少なくとも2種の細胞型における発現を比較することによってTF発現をプロファイリングすることを含み得る。本明細書で提供される方法は、少なくとも2種の増殖期における少なくとも3種の細胞型、又は少なくとも2種の培養条件における少なくとも3種の細胞型における発現を比較することによってTF発現をプロファイリングすることを含み得る。本明細書で提供される方法は、少なくとも3種の増殖期における少なくとも2種の細胞型、又は少なくとも3種の培養条件における少なくとも2種の細胞型における発現(例えば、RNA又はタンパク質発現レベル、例えば、本明細書の実施例1において例示される)を比較することによってTF発現をプロファイリングすることを含み得る。
【0045】
本明細書で実証されるとおり、TF発現は、1種の哺乳動物の細胞型又は複数種の哺乳動物の細胞型においてプロファイリングされ得る。TF発現は、1種のCHO細胞型又は複数種のCHO細胞型(例えば、CHO-S、CHO-K1、CHO-DG44及び/又はCHO-DXB11細胞)においてプロファイリングされ得る。TF発現は、組換えタンパク質を発現する細胞株及びその親細胞株(すなわち、組換えタンパク質を発現しない細胞株)においてプロファイリングされ得る。TF発現は、同じ生物に由来する2種以上の異なる細胞型においてプロファイリングされ得る。
【0046】
発現プロファイルに基づいて、TFは、所望の目的を達成するために選択され得る。例えば、特定の細胞型、増殖期、及び/又は培養条件において高度に発現されるTFが選択され得る。複数の細胞型、増殖期、及び/又は培養条件にわたって高度に発現されるTFが選択され得る。特定の細胞型、増殖期、及び/又は培養条件において中間のレベルで発現されるTFが選択され得る。
【0047】
本明細書で提供されるいくつかの方法に従って、複数の条件(例えば、複数の細胞株及び/又は複数の増殖条件)にわたって安定的に発現されるTFが選択される。発現の安定性は、複数の条件にわたる発現レベル(タンパク質又はRNA(例えば、本明細書の実施例1において例示される))における最大の倍率変化(MFC)を測定することによって決定され得る。MFCは、複数の条件にわたる最大及び最小の発現レベル間の比である。ある種の態様では、安定的に発現される転写因子のMFCは、3以下、2.5以下、2以下、1.5以下、1以下、又は0.5以下である。
【0048】
あるいは、特定の所望の細胞型、増殖期、及び/又は培養条件において高度に発現されるのみのTFが選択され得る。したがって、いくつかの方法において、目的の宿主細胞において優先的に上方制御され、且つ/又はオフターゲットの宿主細胞において優先的に下方制御されるTFが選択される。いくつかの方法では、目的の細胞周期において優先的に上方制御され、且つ/又はオフターゲットの細胞周期において下方制御されるTFが選択される。
【0049】
本明細書で提供される方法に従って、少なくとも25種、少なくとも50種、少なくとも150種、少なくとも200種、少なくとも250種、少なくとも500種、又は少なくとも1000種のTFの発現がプロファイリングされ得る。
【0050】
選択されたTF(すなわち、選択されたTFと相互作用する転写因子調節エレメント(TFRE))のための同種の結合部位が、例えば、公開されている研究及びオンラインデータベースの精査によって決定され得る。次に、選択されたTFと相互作用するTFREは、ホモタイプのプロモーターにおいて転写的に活性であるものを選択するためにスクリーニングされ得る。ホモタイプのプロモーターは、連続して特定のTFREの反復コピーを含む。例えば、ホモタイプのプロモーターは、2~20コピーのTFREを含み得る。ホモタイプのプロモーターは、4~10コピーのTFREを含み得る。ホモタイプのプロモーターは、約5、約6、約7、又は約8コピーのTFREを含み得る。ホモタイプのプロモーターは、5、6、7、又は8コピーのTFREを含み得る。
【0051】
ホモタイプのプロモーターにおけるTFREは、スペーサーによって隔てられ得る。スペーサーは、例えば、50個以下のヌクレオチド、25個以下、又は12個以下のヌクレオチドであり得る。スペーサーは、例えば、4~50個のヌクレオチド、4~25個のヌクレオチド、又は4~12個のヌクレオチドであり得る。スペーサーは、約6個のヌクレオチドであり得る。スペーサーは、6個のヌクレオチドであり得る。ホモタイプのプロモーターにおけるTFREは、同じスペーサーによって隔てられ得るか、又は異なるスペーサーによって隔てられ得る。
【0052】
ホモタイプのプロモーターにおいて転写的に活性であるTFREは、TFREの複数の上流のコピーを有するコアプロモーターに作動可能に連結されたレポーター遺伝子を含有する構築物を作製することによって同定され得る。レポーターの発現レベル(RNA又はタンパク質)は、例えば、目的の細胞(例えば、CHO-S、CHO-K1、CHO-DG44、及び/又はCHO-DXB11細胞などのCHO細胞)における一過的なトランスフェクションの後に評価され得る。レポーターの発現は、TFREがホモタイプのプロモーターにおいて活性であることを示す。
【0053】
続いて、選択されたTFと相互作用し、且つホモタイプのプロモーターにおいて活性であるTFREの活性は、ヘテロタイプのプロモーターの文脈において評価され得る。ヘテロタイプのプロモーターは、連続してTFREの組み合わせを連結することによって作製され得る。
【0054】
ヘテロタイプのプロモーターは、例えば、少なくとも2種、少なくとも3種、又は少なくとも4種の異なるTFREを含む、合計で2~20個のTFREを含み得る。ヘテロタイプのプロモーターは、例えば、2~10種、3~9種、又は4~8種の異なるTFREを含む、合計で2~20個のTFREを含み得る。
【0055】
ヘテロタイプのプロモーターにおけるTFREは、スペーサーによって隔てられ得る。スペーサーは、例えば、50個以下のヌクレオチド、25個以下、又は12個以下のヌクレオチドであり得る。スペーサーは、例えば、4~50個のヌクレオチド、4~25個のヌクレオチド、又は4~12個のヌクレオチドであり得る。スペーサーは、約6個のヌクレオチドであり得る。スペーサーは、6個のヌクレオチドであり得る。ヘテロタイプのプロモーターにおけるTFREは、同じスペーサーによって隔てられ得るか、又は異なるスペーサーによって隔てられ得る。ヘテロタイプのプロモーターは、例えば、TFREブロックの組み合わせを、例えば様々な量又は濃度において混合することによって作製され得る。
【0056】
ヘテロタイプのプロモーターにおけるTFREの相対的な転写活性(すなわち、各TFREの単一コピーによって提供される全体的なプロモーター活性への寄与)は、例えば、TFREのコピー数の関数としてヘテロタイプのプロモーター活性をモデル化することによって決定され得る。
【0057】
次に、プロモーターは、例えば、特定の発現レベルなどの所望の活性をもたらすTFREの組み合わせを(例えば、様々な細胞型、増殖期、及び/若しくは培養条件にわたって、又は特定の細胞型、増殖期、及び/若しくは培養条件において)選択することによって設計され得る。
【0058】
次に、TFREの選択された組み合わせを含有する合成プロモーターは、例えば、化学合成によるか、組換えヌクレオチド技術を用いるか、又はポリメラーゼ連鎖反応(PCR)などの酵素的方法を用いることによって生成され得る。
【0059】
III.合成プロモーター
本明細書で提供されるとおり、プロモーターは、特定の機能性、例えば、所望の発現レベル、細胞増殖の所望の期における発現、及び/又は所望の細胞型における発現を有するように設計され得る。
【0060】
本明細書で提供されるプロモーターは、転写因子調節エレメント(TFRE)及びプロモーターコアを含むヌクレオチド配列を含み得る。TFREを含むヌクレオチド配列は、プロモーターコアの上流にあり得る。
【0061】
本明細書で提供されるプロモーターは、複数のTFRE、例えば、2~20、2~18、2~16、2~15、2~14、3~20、3~18、3~16、3~15、3~14、4~20、4~18、4~16、4~15、4~14、5~20、5~18、5~16、5~15、5~14、6~20、6~18、6~16、6~15、又は6~14個のTFREを含み得る。
【0062】
TFREは、4~100個のヌクレオチド、4~75個のヌクレオチド、4~50個のヌクレオチド、4~30個のヌクレオチド、4~25個のヌクレオチド、4~20個のヌクレオチド、4~15個のヌクレオチド、又は4~12個のヌクレオチドを含み得るか、それから本質的になり得るか、又はそれからなり得る。TFREは、6~100個のヌクレオチド、6~75個のヌクレオチド、6~50個のヌクレオチド、6~30個のヌクレオチド、6~25個のヌクレオチド、6~20個のヌクレオチド、6~15個のヌクレオチド、又は6~12個のヌクレオチドを含み得るか、それから本質的になり得るか、又はそれからなり得る。TFREは、8~100個のヌクレオチド、8~75個のヌクレオチド、8~50個のヌクレオチド、8~30個のヌクレオチド、8~25個のヌクレオチド、8~20個のヌクレオチド、8~15個のヌクレオチド、又は8~12個のヌクレオチドを含み得るか、それから本質的になり得るか、又はそれからなり得る。TFREは、4~30個のヌクレオチドを含み得るか、それから本質的になり得るか、又はそれからなり得る。
【0063】
TFREは、哺乳動物のTFREであり得る。TFREは、CHO細胞のTFREであり得る。TFREは、配列番号1~32のいずれか1つのヌクレオチド配列を含み得る。TFREは、抗酸化RE(ARE)(任意選択により配列番号7のヌクレオチド配列を含む)、ETS結合部位1(EBS1)(任意選択により配列番号10のヌクレオチド配列を含む)、小胞体ストレスRE(ERSE)(任意選択により配列番号15のヌクレオチド配列を含む)、及びダイオキシンRE(DRE)(任意選択により配列番号31のヌクレオチド配列を含む)のTRFEからなる群から選択され得る。TFREは、抗酸化RE(ARE)、ETS結合部位1(EBS1)、及びダイオキシンRE(DRE)からなる群から選択され得る。任意選択により、本明細書で提供されるプロモーターはさらに、核因子RE(NF1-RE)(任意選択により配列番号6のヌクレオチド配列を含む)、GC-ボックス(任意選択により配列番号9のヌクレオチド配列を含む)、及び/又はCCAATエンハンサー結合RE(C/EBP-RE)(任意選択により配列番号23のヌクレオチド配列を含む)のTFREを含み得る。
【0064】
本明細書で提供されるある種のプロモーターは、小胞体ストレスRE(ERSE)のTFREを含まない。
【0065】
本明細書で提供されるある種のプロモーターは、核因子1RE(NF1-RE)のTFREを含まない。本明細書で提供されるある種のプロモーターは、GC-ボックスのTFREを含まない。本明細書で提供されるある種のプロモーターは、CCAATエンハンサー結合タンパク質RE(C/EBP-RE)のTFREを含まない。本明細書で提供されるある種のプロモーターは、NF1-RE、GC-ボックス、又はC/EBP-REのTFREを含まない。
【0066】
本明細書で提供されるとおり、プロモーターは、TFREを含むヌクレオチド配列を含み得るが、少なくとも2つのTFREは同じであり、例えば、少なくとも2つのTFREはAREのTFREであり、少なくとも2つのTFREはEBS1のTFREであり、少なくとも2つのTFREはERSEのTFREであり、且つ/又は少なくとも2つのTFREはDREのTFREである。本明細書で提供されるとおり、プロモーターは、TFREを含むヌクレオチド配列を含み得るが、少なくとも3つのTFREは同じであり、例えば、少なくとも3つのTFREはAREのTFREであり、少なくとも3つのTFREはEBS1のTFREであり、少なくとも3つのTFREはERSEのTFREであり、且つ/又は少なくとも3つのTFREはDREのTFREである。
【0067】
本明細書で提供されるプロモーターは又、例えば、TFRE間にスペーサーを含み得る。スペーサーは、例えば、50個以下のヌクレオチド、25個以下、又は12個以下のヌクレオチドであり得る。スペーサーは、例えば、4~50個のヌクレオチド、4~25個のヌクレオチド、又は4~12個のヌクレオチドであり得る。スペーサーは、約6個のヌクレオチドであり得る。スペーサーは、6個のヌクレオチドであり得る。
【0068】
本明細書で提供されるプロモーターは、同じスペーサー(すなわち、指定された配列及び長さのスペーサー)の複数のコピーを含み得るか、又は異なるスペーサー(すなわち、異なる配列及び/又は様々な長さのスペーサー)の組み合わせを含み得る。したがって、プロモーターは、各TFRE間で同じスペーサーを含み得るか、又はTFRE間で異なるスペーサーを含有し得る。
【0069】
TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列は、最大1500個のヌクレオチド、最大1000個のヌクレオチド、最大750個のヌクレオチド、最大500個のヌクレオチド、又は最大250個のヌクレオチドであり得る。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列は、少なくとも20個のヌクレオチドであり得る。
【0070】
TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、TFREは25個のヌクレオチドを超えず、且つスペーサーは50個のヌクレオチドを超えない。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、TFREは25個のヌクレオチドを超えず、且つスペーサーは25個のヌクレオチドを超えない。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、TFREは25個のヌクレオチドを超えず、且つスペーサーは20個のヌクレオチドを超えない。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、TFREは25個のヌクレオチドを超えず、且つスペーサーは15個のヌクレオチドを超えない。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、TFREは25個のヌクレオチドを超えず、且つスペーサーは10個のヌクレオチドを超えない。本明細書で提供されるとおり、このようなヌクレオチド配列は、少なくともお4つのTRFEを含み得る。
【0071】
TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、各TFREは6~20個のヌクレオチドであり、且つ各スペーサーは50個超のヌクレオチドである。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、各TFREは6~20個のヌクレオチドであり、且つ各スペーサーは25個超のヌクレオチドである。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、各TFREは6~20個のヌクレオチドであり、且つ各スペーサーは20個超のヌクレオチドである。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、各TFREは6~20個のヌクレオチドであり、且つ各スペーサーは15個超のヌクレオチドである。TRFE(及び任意選択によりスペーサー)を含むヌクレオチド配列はTFREを含み得るが、各TFREは6~20個のヌクレオチドであり、且つ各スペーサーは10個超のヌクレオチドである。本明細書で提供されるとおり、このようなヌクレオチド配列は、少なくともお4つのTRFEを含み得る。
【0072】
本明細書で提供されるとおり、コアプロモーターは、TATAボックス及び/又はイニシエーターエレメントを含み得るが、任意選択によりコアプロモーターは25~100個のヌクレオチドである。本明細書で提供されるとおり、コアプロモーターは、細胞、例えばCHO細胞において高度に発現される内在性遺伝子の転写開始部位を取り囲むヌクレオチド配列であり得る。コアプロモーターは、本明細書で提供されるとおり、CMVコアプロモーターであり得る。したがって、コアプロモーターは、配列番号33のヌクレオチド配列を含み得るか、それから本質的になり得るか、又はそれからなり得る。
【0073】
本明細書で提供されるプロモーターを設計して、CpGジヌクレオチドの数を制限することができる。CpGジヌクレオチドにおけるシトシンのメチル化は、不安定性をもたらし得る。したがって、TFREを含むヌクレオチド配列は、20個未満、15個未満、10個未満、9個未満、8個未満、7個未満、又は6個未満のCpGジヌクレオチドを有し得る。TFREを含むヌクレオチド配列は、20個以下、15個以下、10個以下、9個以下、8個以下、7個以下、6個以下、又は5個以下のCpGジヌクレオチドを有し得る。同様に、本明細書で提供されるプロモーターは、20個未満、15個未満、10個未満、9個未満、8個未満、7個未満、又は6個未満のCpGジヌクレオチドを有し得る。本明細書で提供されるプロモーターは、20個以下、15個以下、10個以下、9個以下、8個以下、7個以下、6個以下、又は5個以下のCpGジヌクレオチドを有し得る。
【0074】
本明細書で提供されるプロモーターを設計して、反復配列の数を制限することができる。したがって、TFREを含むヌクレオチド配列は、20個超のヌクレオチド、25個超のヌクレオチド、30個超のヌクレオチド、35個超のヌクレオチド、又は40個超のヌクレオチドの反復配列を有し得ない。同様に、本明細書で提供されるプロモーターは、20個超のヌクレオチド、25個超のヌクレオチド、30個超のヌクレオチド、35個超のヌクレオチド、又は40個超のヌクレオチドの反復配列を有し得ない。TFREを含むヌクレオチド配列は、1個超の反復配列、例えば、20個超のヌクレオチド、25個超のヌクレオチド、30個超のヌクレオチド、35個超のヌクレオチド、又は40個超のヌクレオチドの反復配列を有し得ない。本明細書で提供されるプロモーターは、1個超の反復配列、例えば、20個超のヌクレオチド、25個超のヌクレオチド、30個超のヌクレオチド、35個超のヌクレオチド、又は40個超のヌクレオチドの反復配列を有し得ない。
【0075】
本明細書で提供されるプロモーターを設計して、制限エンドヌクレアーゼ部位の数を制限することができる。例えば、本明細書で提供されるTFRE又はプロモーターを含むヌクレオチド配列は、EcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、PacI、KpnI、及び/又はXhoI制限エンドヌクレアーゼ部位を欠き得る。例えば、本明細書で提供されるTFRE又はプロモーターを含むヌクレオチド配列は、EcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、及び/又はPacI制限エンドヌクレアーゼ部位を欠き得る。いくつかの実施形態では、本明細書で提供されるTFRE又はプロモーターを含むヌクレオチド配列は、TFRE間及び/又はスペーサー間に制限部位(例えば、KpnI又はXhoI制限部位)を含み得る。
【0076】
本明細書で実証されるとおり、TFREの順序、スペーシング、及び配向がプロモーター活性に最小の影響及ぼすプロモーターを設計することができる。したがって、プロモーターの活性は、プロモーター内に含有される各TFREのコピーの数と相関し得る。したがって、プロモーターの活性は、プロモーター内に含有される各TFREのコピーの数に基づいて予測され得る。
【0077】
本明細書で実証されるとおり、プロモーターを設計して、細胞増殖、及び/又は細胞生存率に対する著しい影響を回避することもできる。本明細書で提供されるプロモーターは、プロモーターサイレンシングを回避することができ、且つ/又はタンパク質産生を支える重要な細胞プロセスに対するオフターゲット作用を最小化することができる。
【0078】
IV.ベクター、細胞、及びライブラリー
本明細書では又、本明細書で提供されるプロモーターを含むベクター、細胞、及びライブラリーが提供される。
【0079】
ベクターは、例えば、発現される遺伝子に作動可能に連結された本明細書で提供されるプロモーター又は転写可能なポリヌクレオチドを含み得る。発現される遺伝子は、例えば、分泌型アルカリホスファターゼ(SEAP)、β-ガラクトシダーゼ(GAL)、ルシフェラーゼ(LUC)、又は緑色蛍光タンパク質(GFP)などのレポーター遺伝子であり得る。発現される遺伝子は又、抗体(又はその重鎖若しくは軽鎖、又はその重鎖可変領域若しくは軽鎖可変領域)、抗体の抗原結合断片(例えば、ScFv)、又はFc融合タンパク質などの治療用タンパク質であり得る。発現される遺伝子は又、酵素であり得る。転写可能なポリヌクレオチドは、例えば、RNAi又はshRNAであり得る。
【0080】
細胞は、本明細書で提供されるプロモーター又は本明細書で提供されるベクターを含み得る。細胞は、チャイニーズハムスター卵巣(CHO)細胞などの哺乳動物細胞であり得る。CHO細胞は、例えば、CHO-S、CHO-K1、CHO-DG44、又はCHO-DXB11細胞であり得る。細胞は、例えば、ヒト細胞であり得る。細胞は又、例えば、非ヒト細胞、例えば、非ヒト哺乳動物細胞であり得る。本明細書で提供されるプロモーター又はベクターを含む細胞は、一過的にトランスフェクトされ得るか、又は安定的にトランスフェクトされ得る。
【0081】
本明細書で提供される細胞は、単離細胞(すなわち、生物内に含有されない細胞)又は培養細胞(すなわち、培養物中の細胞)であり得る。
【0082】
ライブラリーは、本明細書で提供されるプロモーター、本明細書で提供されるベクター、又は本明細書で提供される細胞を含み得る。ライブラリーは、少なくとも50種、少なくとも100種、少なくとも150種、少なくとも200種、少なくとも250種、又は少なくとも500種の異なるプロモーター、ベクター、又は細胞を含み得る。
本発明は、例えば以下の実施形態を包含する:
[実施形態1](a)4~20個の転写因子調節エレメント(TFRE)を含むヌクレオチド配列及び(b)プロモーターコアを含む合成プロモーターであって、前記TRFEを含む前記ヌクレオチド配列が前記プロモーターコアの上流にあり、且つ少なくとも3分の1の前記TFREが、抗酸化RE(ARE)、ETS結合部位1(EBS1)、小胞体ストレスRE(ERSE)、及びダイオキシンRE(DRE)のTFREからなる群から個別に選択される、合成プロモーター。
[実施形態2]前記ヌクレオチド配列が、前記TFRE間にスペーサーを含み、前記スペーサーが50個以下のヌクレオチドである、実施形態1に記載の合成プロモーター。
[実施形態3]前記スペーサーが、25個以下のヌクレオチドである、実施形態2に記載の合成プロモーター。
[実施形態4]前記スペーサーが、12個以下のヌクレオチドである、実施形態3に記載の合成プロモーター。
[実施形態5]前記スペーサーが、約6個のヌクレオチドである、実施形態4に記載の合成プロモーター。
[実施形態6]前記コアプロモーターが、CMVコアプロモーターであり、任意選択により前記CMVコアプロモーターが、配列番号33のヌクレオチド配列を含む、実施形態1~5のいずれかに記載の合成プロモーター。
[実施形態7]前記合成プロモーターが、配列番号37~50のいずれか1つの前記ヌクレオチド配列を含む、実施形態1に記載の合成プロモーター。
[実施形態8]合成プロモーターを設計する方法であって:(i)転写因子(TF)発現をプロファイリングしてTFを選択すること、(ii)ホモタイプのプロモーターにおいて転写的に活性な選択されたTFと相互作用する転写因子調節エレメント(TFRE)を同定すること、及び(iii)ヘテロタイプのプロモーター内のTF-TFRE相互作用の相対的な転写活性を決定することを含む、方法。
[実施形態9](iv)所望の転写活性を有するTFREを選択することをさらに含む、実施形態8に記載の方法。
[実施形態10](v)(a)前記所望の転写活性を有する選択された前記TFREを含むヌクレオチド配列及び(b)プロモーターコアを含む合成プロモーターを生成することをさらに含む実施形態9に記載の方法であって、前記TRFEを含む前記ヌクレオチド配列が前記プロモーターコアの上流にある、方法。
[実施形態11]前記TF発現をプロファイリングすることが、前記TFの存在量を決定することを含む、実施形態8~10のいずれかに記載の方法。
[実施形態12]前記TFの存在量を決定することが、前記TFのRNA又はタンパク質レベルを測定することを含む、実施形態11に記載の方法。
[実施形態13]前記TF発現をプロファイリングすることが、少なくとも2種の細胞型におけるTF発現をプロファイリングすることを含む、実施形態8~12のいずれかに記載の方法。
[実施形態14]前記少なくとも2種の細胞型が、哺乳動物の細胞型である、実施形態13に記載の方法。
[実施形態15]前記少なくとも2種の哺乳動物の細胞型が、CHO細胞である、実施形態14に記載の方法。
[実施形態16]前記少なくとも2種の細胞株が、組換えタンパク質を発現する細胞株及びその親細胞株を含む、実施形態14又は15に記載の方法。
[実施形態17]前記少なくとも2種の細胞型が、同じ生物由来の2種の細胞型であり、任意選択により、前記生物がヒトである、実施形態13又は14に記載の方法。
[実施形態18]高度に発現されるTFが選択される、実施形態8~17のいずれかに記載の方法。
[実施形態19]上位50%、45%、40%、35%、30%、25%、20%、15%又は10%内の発現レベルを有するTFが選択される、実施形態8~17のいずれかに記載の方法。
[実施形態20]前記TF発現をプロファイリングすることが、少なくとも2種の細胞型、少なくとも2期の細胞培養、及び/又は少なくとも2種の培養条件にわたってTFの安定性を決定することを含む、実施形態8~19のいずれかに記載の方法。
[実施形態21]前記方法がさらに、前記少なくとも2種の細胞型、少なくとも2期の細胞培養、及び/又は少なくとも2種の培養条件にわたって発現レベルにおける2、又は1.5、又は1以下の最大倍率変化を有するTFを選択することを含む、実施形態20に記載の方法。
[実施形態22]前記TF発現をプロファイリングすることが、少なくとも2期の細胞培養におけるTF発現をプロファイリングすることを含む、実施形態8~21のいずれかに記載の方法。
[実施形態23]前記少なくとも2期の細胞培養が、定常期及び指数増殖期を含む、実施形態22に記載の方法。
[実施形態24]目的の宿主細胞において優先的に上方制御され、且つ/又はオフターゲットの宿主細胞において優先的に下方制御されるTFが選択される、実施形態8~23のいずれかに記載の方法。
[実施形態25]目的の細胞周期において優先的に上方制御され、且つ/又はオフターゲットの細胞周期において下方制御されるTFが選択される、実施形態8~23のいずれかに記載の方法。
[実施形態26]少なくとも100種のTFの発現がプロファイリングされる、実施形態8~25のいずれかに記載の方法。
[実施形態27]前記ホモタイプのプロモーターが、2~20個のTFREのコピーを含む、実施形態8~26のいずれかに記載の方法。
[実施形態28]前記ホモタイプのプロモーターが、4~10個のTFREのコピーを含む、実施形態27に記載の方法。
[実施形態29]前記相対的な転写活性を決定することが、TFREのコピー数の関数として前記ヘテロタイプのプロモーター活性をモデル化することを含む、実施形態8~28のいずれかに記載の方法。
[実施形態30]前記ヘテロタイプのプロモーターが、2~20個のTFREを含む、実施形態8~29のいずれかに記載の方法。
[実施形態31]実施形態8~30のいずれかに記載の方法に従って生成される合成プロモーター。
[実施形態32]前記合成プロモーターが、4~20個のTFREを含むヌクレオチド配列及びプロモーターコアを含み、前記TRFEを含む前記ヌクレオチド配列が前記プロモーターコアの上流にある、実施形態31に記載の合成プロモーター。
[実施形態33]抗酸化RE(ARE)、ETS結合部位1(EBS1)、小胞体ストレスRE(ERSE)、及びダイオキシンRE(DRE)のTFREからなる群から選択される少なくとも1つのTFREを含む、実施形態32に記載の合成プロモーター。
[実施形態34]前記ヌクレオチド配列が、前記TFRE間にスペーサーを含み、前記スペーサーが50個以下のヌクレオチドである、実施形態32又は33に記載の合成プロモーター。
[実施形態35]前記スペーサーが、25個以下のヌクレオチドである、実施形態34に記載の合成プロモーター。
[実施形態36]前記スペーサーが、12個以下のヌクレオチドである、実施形態35に記載の合成プロモーター。
[実施形態37]前記スペーサーが、約6個のヌクレオチドである、実施形態36に記載の合成プロモーター。
[実施形態38]前記コアプロモーターが、CMVコアプロモーターであり、任意選択により前記CMVコアプロモーターが、配列番号33のヌクレオチド配列を含む、実施形態32~37のいずれかに記載の合成プロモーター。
[実施形態39]前記TFREを含む前記ヌクレオチド配列が、10個以下のCpGジヌクレオチドを含む、実施形態1~6及び32~38のいずれかに記載の合成プロモーター。
[実施形態40]前記TFREを含む前記ヌクレオチド配列が、5個以下のCpGジヌクレオチドを含む、実施形態39に記載の合成プロモーター。
[実施形態41]前記TFREを含む前記ヌクレオチド配列が、20個よりも大きいヌクレオチド長の任意の反復配列を含有しない、実施形態1~6及び32~40のいずれかに記載の合成プロモーター。
[実施形態42]前記TFREを含む前記ヌクレオチド配列が、いずれのEcoRI、BamHI、HindIII、TaqI、NotI、SmaI、PvuI、又はPacI制限エンドヌクレアーゼ部位も含有しない、実施形態1~6及び32~41のいずれかに記載の合成プロモーター。
[実施形態43]前記TFREの順序が、前記合成プロモーターの活性に著しくは影響を及ぼさない、実施形態1~6及び32~42のいずれかに記載の合成プロモーター。
[実施形態44]前記TFREの配向が、前記合成プロモーターの活性に著しくは影響を及ぼさない、実施形態1~6及び32~43のいずれかに記載の合成プロモーター。
[実施形態45]前記プロモーターの活性が、各TFREのコピーの数と相関する、実施形態1~6及び32~44のいずれかに記載の合成プロモーター。
[実施形態46]前記合成プロモーターが、細胞増殖に著しい影響を及ぼさない、実施形態1~6及び31~45のいずれかに記載の合成プロモーター。
[実施形態47]前記合成プロモーターが、細胞生存率に著しい影響を及ぼさない、実施形態1~6及び31~46のいずれかに記載の合成プロモーター。
[実施形態48]前記合成プロモーターが、ヘテロタイプのプロモーターにおいて転写的に不活性なTFREを含有しない、実施形態1~6及び31~47のいずれかに記載の合成プロモーター。
[実施形態49]前記合成プロモーターが、ヘテロタイプのプロモーターにおいて転写的に抑制されているTFREを含有しない、実施形態1~6及び31~48のいずれかに記載の合成プロモーター。
[実施形態50]前記ARE TFREが、配列番号7のヌクレオチド配列を含む、実施形態1~6及び33~49のいずれかに記載の合成プロモーター。
[実施形態51]前記EBS1 TFREが、配列番号10のヌクレオチド配列を含む、実施形態1~6及び33~50のいずれかに記載の合成プロモーター。
[実施形態52]前記ERSE TFREが、配列番号15のヌクレオチド配列を含む、実施形態1~6及び33~50のいずれかに記載の合成プロモーター。
[実施形態53]前記DRE TFREが、配列番号31のヌクレオチド配列を含む、実施形態1~6及び33~50のいずれかに記載の合成プロモーター。
[実施形態54]追加のCHO細胞TFREをさらに含む、実施形態1~6及び33~53のいずれかに記載の合成プロモーター。
[実施形態55]少なくとも1つの前記追加のCHO細胞TFREが、配列番号6、9、及び23のいずれか1つのヌクレオチド配列を含む、実施形態54に記載の合成プロモーター。
[実施形態56]TFREを含む前記ヌクレオチド配列が、少なくとも2コピーの同じTRFEを含む、実施形態1~6及び32~55のいずれかに記載の合成プロモーター。
[実施形態57]TFREを含む前記ヌクレオチド配列が、少なくとも3コピーの同じTRFEを含む、実施形態1~6及び32~56のいずれかに記載の合成プロモーター。
[実施形態58]前記合成プロモーターがプロモーターサイレンシングを回避する、実施形態1~6及び31~57のいずれかに記載の合成プロモーター。
[実施形態59]前記合成プロモーターが、タンパク質産生を支える重要な細胞プロセスに対するオフターゲット作用を最小化する、実施形態1~6及び31~58のいずれかに記載の合成プロモーター。
[実施形態60]実施形態1~7及び31~59のいずれかに記載の合成プロモーターを含むベクター。
[実施形態61]前記合成プロモーターが、タンパク質をコードする遺伝子に作動可能に連結される、実施形態50に記載のベクター。
[実施形態62]前記タンパク質が、レポータータンパク質、治療用タンパク質、又は酵素である、実施形態61に記載のベクター。
[実施形態63]実施形態1~7及び31~59のいずれかに記載の合成プロモーター又は実施形態60~62のいずれかに記載のベクターを含む細胞。
[実施形態64]前記細胞が哺乳動物細胞である、実施形態63に記載の細胞。
[実施形態65]前記哺乳動物細胞がCHO細胞である、実施形態64に記載の細胞。
[実施形態66]前記哺乳動物細胞がヒト細胞である、実施形態64に記載の細胞。
[実施形態67]実施形態1~6及び31~59のいずれかに記載の合成プロモーターを含むライブラリー。
[実施形態68]少なくとも100種の異なる合成プロモーターを含む、実施形態67に記載のライブラリー。
【実施例】
【0083】
V.実施例
実施例1:材料及び方法
宿主細胞転写因子発現動態の分析
全RNAを、RNAeasyミニキット(Qiagen、Crawley、UK)を使用して、増殖の対数期及び定常期中に3つのCHO-K1由来細胞株(親宿主株、並びにグルタミンシンターゼ(GS)又はGS及びIgG抗体のいずれかを発現する宿主)から抽出した。RNAの純度及び完全性を、NanoDrop分光光度計(Thermo Fisher Scientific、Paisley、UK)及び2100 Bioanalyzer(Agilent Technologies、Wokingham、UK)を使用して確認した。RNA-seqライブラリーを、TruSeq RNAライブラリー調製キット(Illumina、Essex、UK)を使用して調製し、Illumina HiSeq 2000システム(Illumina)を使用して配列決定した。シークエンスリードを、Tophatを使用してCHO-K1基準ゲノムにマッピングし(24、25)、各転写物の相対的存在量を、Cufflinksを使用して計算した(26)。実験的に検証されたマウス転写因子(TF)の精選されたデータベースを、TFcheckpointから得た(27、28)。6つ全ての実験条件にわたる各TF遺伝子の平均転写物存在量を決定し、70番目のパーセンタイル以上の発現レベルを有する遺伝子を、さらなる分析のために選択した。遺伝子発現安定性を、全トランスクリプトームにわたる転写物存在量における最大倍率変化(MFC)を計算することによって測定した。安定に発現されるTF(MFC<1.5)の同種の結合部位を、以前に公開された研究及びオンラインデータベースから得た((29);表1を参照のこと)。
【0084】
【0085】
ホモタイプ及びヘテロタイプのプロモーターのインビトロ構築
最小CMVコアプロモーター(Genbankアクセッション番号M60321.1、ヌクレオチド1109-1193:
【化1】
)を合成し(Sigma、Poole、UK)、以前に記載されたプロモーターを持たないレポーターベクターにおける分泌型アルカリホスファターゼ(SEAP)遺伝子の上流に挿入した(30)。ホモタイプのTFREレポーターを構築するために、連続した特定のTFREの6個の反復コピーを含有する合成オリゴヌクレオチド(表1を参照のこと)を、CMVコアプロモーターの上流に挿入した。ヘテロタイプのプロモーターのライブラリーを作製するために、別々のTF結合配列の単一のコピーを含有するブロックを構築するTFREを、以前に記載されたとおりに構築し(31)、T4 DNAリガーゼ(Thermo Fisher Scientific)により様々な組み合わせにおいて結合した。KpnI及びXhoI制限エンドヌクレアーゼ部位を含有する「クローニングブロック」は、TFREブロックに対して1:20のモル比でのライゲーション混合物に含まれた。ランダムTFREブロック構築物を、KpnI及びXhoI(Promega、Southampton、UK)で消化し、ゲル抽出し(Qiaquickゲル抽出キット、Qiagen)、SEAPレポーターベクターにおけるCMVコアプロモーターの上流に挿入した。プラスミドを配列決定して、インビトロで構築された各合成プロモーターのTFRE組成を決定した。
【0086】
ヘテロタイプのプロモーター活性のモデル化
インビトロで構築されたヘテロタイプのプロモーター活性を、成分TF結合部位のコピー数の関数としてモデル化した。各種モデル化手法(線形回帰、一般化線形、一般化加法、ガウス過程)の比較により、全てのモデルが等価な予測能を有することが判明した。したがって、複雑性を最小化するために、本発明者らは、多重線形回帰モデル
【数1】
を使用したが、ここで、
【数2】
は、プロモーター活性を表し、x
1~x
12は、12種の個々のTFREブロックである。回帰係数(β
1~β
12;最小二乗推定を使用して計算される、
【数3】
)を分析して、ヘテロタイプのプロモーター構造内の各TFREブロックの単一コピーの相対的な転写活性を決定した。モデルの予測能、及び過剰適合の可能性を、1個抜き及び5倍交差検定を用いて評価した。
【0087】
ヘテロタイプのプロモーターのインシリコ設計
12種の別々のTF結合部位の全ての可能な1~14ブロックの組み合わせ(n=9,657,699)を、Rの「combination」関数を用いて生成した。各TFREの組み合わせの相対的な転写活性を、インビトロで構築されたヘテロタイプのプロモーター活性の発明者らのモデルを用いて決定した。所望の設計基準を有するTFREの組み合わせを、連続的なフィルタリングステップを適用することによってライブラリーから選択した(実施例2~5において記載される)。成分TFREを配置して、CpGジヌクレオチド、反復配列、及び制限エンドヌクレアーゼ部位の出現を最小化した。このプロセスを支援するために、結合部位を、特別に設計された6塩基対(bp)のスペーサー配列で隔てた。設計されたプロモーター配列を、FAIR(http://bioserver1.physics.iisc.ernet.in/fair/)及びWebcutter(http://rna.lundberg.gu.se/cutter2/)を用いて、反復配列及びエンドヌクレアーゼ部位の存在について分析した。意図的でない、追加のTF結合部位が、TFREスペーサー接合点で作製されなかったことを確認するために、プロモーターを、MatInspector(https://www.genomatix.de/matinspector.html)及びTranscription Affinity Predictionツール(TRAP:http://trap.molgen.mpg.de/cgi-bin/trap_form.cgi)を使用して分析した(33、34)。設計された配列を分析し(GeneArt、Regensburg、Germany)、SEAPレポーターベクターにおける最小CMVコアプロモーターの上流にクローン化した。
【0088】
CHO細胞培養液及びトランスフェクション
チャイニーズハムスター卵巣(CHO)細胞(CHO-K1由来)を、通気エルレンマイヤーフラスコ(Corning、UK)中のCD-CHO培地(Thermo Fisher Scientific)において、5%(v/v)CO2中37℃にて140rpmで振盪させながら通常どおりに培養し、2×105細胞/mlの播種密度で3~4日毎に継代培養した。細胞濃度及び生存率を、Vi-Cell細胞生存率分析機器(Beckman-Coulter、High Wycombe、UK)を用いて自動化されたトリパンブルー排除アッセイによって決定した。一過的なトランスフェクションの2時間前に、対数期中期の培養液から2×105細胞を、24ウェルプレート(Nunc、Stafford、UK)の個々のウェルに播種した。細胞を、製造業者の指示書に従って調製された、DNA及びリポフェクタミン(Thermo Fisher Scientific)を含むDNA-脂質複合体でトランスフェクトした。内部標準(hCMV-IE1-SEAP、SV40-SEAP、NFkB-RE-SEAP)が、各プレートに含まれて、再現可能なトランスフェクション性能を確認し、且つ合成プロモーター活性を標準化した。トランスフェクト細胞を、Sensolyte pNPP SEAP比色分析レポーター遺伝子アッセイキット(Cambridge Biosciences、Cambridge、UK)を用いるSEAPタンパク質発現の定量化の前に24時間インキュベートした。細胞培養液の上清におけるSEAP活性が、SEAPのmRNAレベルと相関したことを確認するために、全RNAを選択されたトランスフェクト細胞から抽出し、定量的PCR(qPCR)により分析した。
【0089】
安定的なプールを構築するために、グルタミンシンターゼ選択マーカーを共発現する合成プロモーター-SEAPレポータープラスミド(5μg)を、Amaxa Nucleofectorシステム(Lonza、Slough、UK)を使用するエレクトロポレーションによって、CHO細胞にトランスフェクトした(1×107;三つ組のトランスフェクション)。安定的なトランスフェクタントを、50μMメチオニンスルホキシイミン(Sigma)中で選択した。バッチ産生プロセスのために、対数期中期の培養液から6×106個の細胞を、通気エルレンマイヤーフラスコ中の30mLのCD-CHO培地に播種した。細胞濃度、培養生存率及びSEAP発現(mRNA及びタンパク質レベル)を、対数増殖期(4日目)及び定常増殖期(7日目)中に測定した。長期間の発現安定性を検証するために、7日のバッチ産生プロセスを、高産生株及び低産生株の安定的なプールが8週間(60細胞世代)MSX含有培地において継代培養された後に繰り返した。
【0090】
RNA抽出、逆転写、及びqPCR分析
全RNAを、RNeasyミニキット(Qiagen、UK)を使用して細胞から抽出した。RNAの純度及び完全性を、NanoDrop分光光度計(Thermo Fisher Scientific)及び2100 Bioanalyzer(Agilent Technologies)を使用して確認した。800ngの抽出RNAを、製造業者の指示書に従ってQuantitect逆転写キット(Qiagen)を使用して逆転写した(ゲノムDNAはこの手順の間に除去された)。cDNAを、7500 fast リアルタイムPCRシステム(Applied Biosystems、Cheshire、UK)を用いるqPCR分析の前にヌクレアーゼフリー水中において1:10で希釈した。12.5μlのQuantiFast SYBRグリーンPCRマスターミックス(Qiagen)、2μlのcDNA、2.5μlのプライマーミックス(プライマー当たりの最終濃度200nM)、及び8μlのヌクレアーゼフリー水を含有する反応混合物を、MicroAmp fast光学96ウェルプレート(Applied Biosystems)中において調製した。増幅条件は以下のとおりであった:95℃で5分間、その後95℃で15秒及び60℃で60秒を40サイクル。融解曲線分析を60~95℃で実施した。Gnb1及びFkbp1aを、内部標準の基準遺伝子として使用した(Brown AJ e al.Transcriptome-based identification of the optimal reference CHO genes for normalisation of qPCR data.Biotechnology Journal 13:1700259(2017))。鋳型を含有しないか、又は逆転写酵素の非存在下で実施された逆転写反応に由来する産物を含有する反応混合物を、陰性対照として使用した。全ての試料を三つ組で実施し、平均Ct(サイクル閾値)値をさらなる分析のために使用した。プライマー配列は、表2において列記される。増幅効率は、式E=10(-1/勾配)を用いて標準曲線(プールされたcDNA試料の10倍の段階希釈)から決定した。
【0091】
【0092】
実施例2:宿主細胞TF発現動態の分析により、文脈特異的な機能性を有するモジュラー結合部位の同定を容易にする
カスタムプロモーター設計のプロセスを実証するために、生物学的製剤の製造に最も有力な宿主であるCHO細胞における使用のための配列を作製した。転写調節は以前にCHO細胞において実証されているが、インビトロでの構築方法は、プロモーターサイレンシングを防止し、且つタンパク質産生を支える重要な細胞プロセスに対するオフターゲット作用を最小化するための、配列の特徴のカスタマイズ可能な仕様を可能にしていない(31、35、56)。CHO細胞のTFレパートリーをプロファイリングするために、培養液の対数期及び定常期で採取される3つの別々のCHO細胞株(CHO-K1由来の親宿主細胞株、及びGS、又はGS及びIgG抗体のいずれかを発現する宿主)においてTF発現レベルを分析した。効果的なTF濃度(すなわち、核において適切に修飾され、且つ局在化されるTF)を直接的に測定する困難さを考慮して、TF発現は、mRNAレベルで決定された。これは、活性のTFレベルの正確な定量化を可能にしないが、それは全体的なTF発現パターン(例えば、なし/低/高/特異的な発現)の情報を提供し、対応する活性動態を有する同種のTFREの同定を可能にする(22、23、37)。さらに、この方法は、大部分の哺乳動物細胞型に関するプロモーター設計に容易に適用可能であり、そのためにトランスクリプトームのデータセットが通常は利用可能である(38)。
【0093】
哺乳動物ゲノムは、約2,000種のTFをコード化する遺伝子を含有すると推定されているが、これらのうちごく一部のみが、DNA結合TFとして実験的に検証されている(39、40)。したがって、分析は、配列特異的DNA結合を呈し、且つRNAポリメラーゼII依存的転写を調節することの両方が示されている774種のTFに限定された(27)。6つ全ての実験条件にわたって、各TFの平均発現レベルが決定された。
図1に示されるとおり、388/774のTFがCHO細胞で発現され、ここで発現レベルは3桁超に及ぶ。必要となる機能性に応じて、利用可能な宿主細胞のTF部分の任意の組み合わせと相互作用するように合成プロモーターを設計することができる。例えば、細胞型特異性は、目的の宿主細胞において優先的に上方制御され、且つオフターゲット活性が望ましくない細胞型において特異的に下方制御されるTFに結合するプロモーターを設計することによって達成することができた。本実施例では、プロモーターは、増殖及び細胞生存などのタンパク質産生を支えるCHO細胞プロセスに対して最小の影響有するように設計された。したがって、CHO細胞において比較的高度に発現されるTF(TFのmRNA発現レベルの上位30%に位置する)は、異種プロモーターが、宿主細胞トランスクリプトームに影響を及ぼさずにこれらの豊富な細胞成分と相互作用することができるという推論に基づいて標的化された(すなわち、これらのTFは、核におけるそれらの同種の結合部位のコピーが適度に増加する場合、制限される可能性は低い)。さらに、プロモーターは、1.5未満の最大倍率変化(最高及び最低の発現レベルの間の比率)として測定される6つ全てのCHO細胞トランスクリプトームにわたる高い発現安定性を示したTFの探索に着目することによって、各種CHO細胞株及び増殖期の文脈において安定的な活性を呈するように設計された。最後に、サイレンシングのリスクを最小化するために、プロモーターは、主としてリプレッサーとして機能するTFと相互作用しないように設計された(42、43)。これらの選択基準の適用により、必須の発現プロファイル及び機能性を有する67種のCHO細胞のTFが同定された(
図1A)。
【0094】
図1Bに示されるとおり、結合部位の冗長性(重複)によって、67個の同定されたTFが、32個の別々の調節エレメントと理論的に相互作用する。ホモタイプのプロモーターの文脈において転写的に活性であるTFREは、ヘテロタイプ構造において合わせて組み合わされるときに相乗的に機能する可能性は低い(18)。したがって、協同的に相互作用しないモジュラーTFREを同定するために、本発明者らは、最小の哺乳動物コアプロモーター(TATAボックス及びイニシエーターエレメントを含有するhCMV-IE1コア;hCMV-IE1コアプロモーター及びTFREコンセンサス配列は、それぞれ配列番号33及び表1において示される)の上流の連続した特定のTFREの6つの反復コピーをそれぞれ含有したSEAPレポーター構築物を作製した。各TFREレポータープラスミドによるCHO細胞の一過的なトランスフェクション後のSEAPレポーターベクターの産生の測定は、12/32のTFREが、組換え遺伝子転写(E-ボックス、CRE、AARE、NFkB-RE、ARE、GC-ボックス、EBS1、ERSE、C/EBP-RE、D-ボックス、HRE、DRE)の活性化を独立して媒介することができることを示した。
図1Bに示されるとおり、関連しているTFREの活性は、同種のTFの発現レベルに比例しなかった。これは、mRNAの発現レベルと効果的なTF濃度との間に相関がないことによって説明され得る。加えて、転写を推進するために、一部のTFは、組み合わせの相互作用、又はCHO細胞において十分に発現されないコアクチベーターを必要とし得る。
【0095】
実施例3:ヘテロタイプのプロモーター構造におけるモジュラーTFREブロックの機能は、結合部位の順序及びスペーシングに依存しない
ヘテロタイプ構造の文脈において合わせて組み合わされるとき、ホモタイプのプロモーターにおいて転写的に活性であるTFREは相乗的に機能しないという仮説を試験するために、プロモーターを様々なTFRE組成により構築した。ホモタイプのプロモーターにおいて活性であると同定された12種のTFREの各々のために、ブロックを構築するオリゴヌクレオチドを、TF結合配列の単一コピーを含有するように合成した。TFREブロックを結合して、SEAPレポータープラスミドにおける最小CMVコアプロモーターの上流に挿入されたTF結合部位のランダムな連なりを組み立てた。
図2Aに示されるとおり、7種の別々のプロモーターライブラリーを、TFREブロックの様々な組み合わせを混合することによって構築した。ライブラリーのTFRE組成を設計して、様々なプロモーター(例えば、異なる強度、様々なTFREの組み合わせ)及び結合部位(例えば、様々なコピー数、配向、及び空間配置)の文脈における各個別のTFREの活性を試験した。140種の別々の合成プロモーター-レポータープラスミドによるCHO細胞のトランスフェクション後のSEAP産生の測定は、
図2Bにおいて示される。これらのデータは、プロモーター活性が2桁に及ぶことを示し、大部分の活性プロモーターは、強力なヒトサイトメガロウイルス最初期1プロモーター(hCMV-IE1;GenBankアクセッション番号M60321.1、ヌクレオチド517~1193)を含有する対照ベクターから得られるものと比較して、SEAP産生において2.3倍の増加を呈した。ライブラリー5を除いて、各ライブラリー内のプロモーター活性は、少なくとも1桁異なったが、ここで、各ライブラリーの平均活性は、5.2~61.5の相対プロモーター単位(RPU)の範囲であった。細胞培養液の上清におけるSEAP活性が、SEAPのmRNAレベルと直線的に相関したことを確認するために、mRNAを、トランスフェクト細胞から抽出し、qPCRにより分析した。この分析により、各プラスミドからのSEAP産生が、相対的なプロモーター活性に正比例することを確認した(
図6)。
【0096】
TFREがヘテロタイプ構造におけるそれらの推定上のモジュラー機能に関して特異的に選択されたとすれば、プロモーター活性は単に、TFREの配向、スペーシング、又は順序に依存せずに各TF結合部位によってもたらされた相対的な転写活性の関数であろうと仮定された。この仮定を試験し、且つヘテロタイプ構造における各TFREの活性を決定するために、プロモーターを配列決定してそれらのTFRE組成を明らかにし、プロモーター活性をTFREのコピー数の関数としてモデル化した(プロモーターの長さは、4~18個のTF結合部位の間で変動した(平均=9))。得られた線形回帰モデルは高い予測能を有し、プロモーター活性に関して、観察された値と予測された値が高く相関した(1個抜きの交差検定 r
2=0.90)(
図3B)。過剰適合の可能性を評価するために、モデルを、5倍交差検定を用いて分析した(
図3B)。観察されたプロモーター活性と予想されたプロモーター活性の間の相関は同様に高く(r
2=0.87)、モデルの予測能が実証された。これらのデータは、プロモーター活性が主として成分TFREの種類及び量の関数であったことを示す。したがって、これらの構築された配列は「ビルボードプロモーター」として機能し、複合性のTF結合部位の相対編成はプロモーター活性に対して最小限の影響を及ぼす(19、20)。したがって、当初の仮説が確認され、組み合わせ的に相互作用しないモジュラーTFREを同定し、且つ単純なインシリコプロモーター設計のための方法を容易にする発明者らの方法が実証された。
【0097】
モデルにおける唯一の予測変数は、各TF結合部位のコピーの数であるため、モデル係数は、全体的なプロモーター活性に対する各TFRE型の単一のコピーの寄与を表す。モデル係数の分析により、ヘテロタイプのプロモーターの文脈において、7/12のみのTFREが転写的に活性であることが同定され(NFkB-RE、ARE、DRE、ERSE、GC-ボックス、C/EBP-RE、EBS1;p≦0.01)、ここで、残りの5種は、転写的に不活性であるか(AARE、HRE、E-ボックス)、又は転写的に抑制されている(D-ボックス、CRE;p≦0.01)かのいずれかであった。
図3Cに示されるとおり、ヘテロタイプ構造におけるTFREの転写活性は、-35~100の相対的なTFRE活性単位の範囲であった。したがって、ホモタイプのプロモーターの文脈における活性は、ヘテロタイプのプロモーターにおけるTFRE活性を予測するものではなかった。TFREは、連鎖状の結合部位の量に応じて差次的な機能を呈し得ることがよく知られている(16、18、44、45)。TFREがホモタイプのプロモーターにおいて6×反復コピー、又ヘテロタイプのプロモーターにおいては通常1×反復コピーで存在するとすれば、いくつかは前者において活性であり、後者において不活性/抑制的であったことは驚くべきことではない。したがって、単一部位コピーのホモタイプのプロモーターにおけるTFRE活性を評価することが理想的であろうが、単一のTF結合部位からの転写出力は、検出可能なレベルの組換え遺伝子発現を十分に推進することはまれである(16、18)。したがって、単一コピーの反復において転写的に活性であるモジュラーTFREの同定のために、i)多部位コピーのホモタイプのプロモーターを作製して組み合わせ的に相互作用しないTFREを同定し、且つii)複数のTFRE合成エレメントを構築して、ヘテロタイプのプロモーターにおける各TFREの相対的な活性を決定する、本明細書で開発された2段階のスクリーニング方法が推奨される。
【0098】
実施例4:文脈特異的な機能性を有するプロモーターのインシリコ設計
プロモーター活性のモデルが、高い予測能及び単純な説明変数(すなわち、TFREのコピー数)の両方を有したとすれば、インビトロで予測可能な活性を呈する哺乳動物プロモーターのインシリコ設計を初めて実証することが可能であろうと仮定された。これを試験するために、ヘテロタイプ構造において転写的に活性であった各TFREの単一コピーを含有する7種のプロモーター(NFkB-RE、ARE、DRE、ERSE、GC-ボックス、C/EBP-RE、EBS1)を設計した。TFREの順序及びスペーシングがプロモーター活性に最小の影響及ぼすことをさらに確認するために、7つの成分TF結合部位を、各構築物内に完全に異なる順序で配置した(
図4A)。モデルによれば、これらのプロモーターは同一のTFRE組成を共有するため、それらはインビトロで同じレベルの活性を呈するはずである(37.3RPU)。合成プロモーターが、化学的に合成され、且つSEAPレポーターベクターにおける最小CMVコアプロモーターの上流に挿入された。各レポータープラスミドによるCHO細胞の一過的なトランスフェクション後のSEAP産生の測定は、プロモーター活性が30.2~43.3RPU(変動係数=9.8%)の範囲であることを示した(
図4B)。したがって、全ての設計されたプロモーターのインビトロ活性は、予測された活性の7RPU内であり、±18%の誤差範囲に相当したが、ここで、最も強力なプロモーターと最も弱いプロモーターの間の発現は1.4倍の差にすぎなかった。同じTFRE組成であるが異なるTFRE順序を有するプロモーターは、成分結合部位が組み合わせの相互作用を呈するときに、活性において5倍も変動し得ることが以前に示されている(18)。したがって、本明細書で提供されるデータはさらに、推定上のモジュラー機能(すなわち、ホモタイプ構造において転写的に活性)に関して特異的に選択されたTFREが、ヘテロタイプのプロモーターと合わせて組み合わされるときに協同的に相互作用しないという結論を支持する。さらに、それらは、プロモーターが予測可能な活性を呈するために合成的に設計され得るという当初の仮説を確証している。
【0099】
カスタマイズ可能な組み合わせ及び順序においてTFREを組み合わせる能力により、文脈特異的な機能性を有するプロモーターの設計が可能になる。これを実証するために、CHO細胞における組換えタンパク質産生の文脈において機能するように特別に最適化されているプロモーターを設計した。プロモーター内に存在し得るTF結合部位の総数は、最も強力なインビトロで構築されたヘテロタイプのプロモーターにおいて含有される量である14個に制限された。CHO細胞における転写活性の以前の研究は、100RPUを超えてプロモーター活性を著しく増加させることができないことを示唆している(hCMV-IE1より2.3倍高い)(31))。したがって、14個を超える結合部位量の増加は、不必要に細胞機構の負担の増大を課すことになり、CHO細胞トランスクリプトームに対するオフターゲット作用についての可能性を増大させると仮定された(2、3)。
【0100】
12個のモジュラーTFRE部分を利用して、9,657,699個のTFREの組み合わせを、1~14の範囲の全結合部位のコピー数で作製することができる。これらの組み合わせの各々は、相対的な合成プロモーター強度を決定するためにヘテロタイプのプロモーター活性のモデルを使用して、インシリコで構築され、且つ試験された。次に、CHO細胞における生物学的製剤の産生に必要となる特定のプロモーターの設計基準に従って、組み合わせが選択された。例えば、プロモーターサイレンシングのリスクを最小化するために、ヘテロタイプのプロモーター(CRE、D-ボックス;
図3C)(42、43)において転写抑制機能を呈すると示されたTFREを含有する任意の組み合わせは無視された。さらに、CHO細胞における組換えタンパク質の過剰発現が、小胞体ストレス応答を誘導し得ると仮定すると(46)、ERストレス応答エレメント(ERSE)を含有する全てのプロモーターも又、タンパク質恒常性の回復を阻害し得るERストレス組換え遺伝子発現の正のフィードバックループの形成を阻害するために考慮されなかった(47、48)。さらに、重要なCHO細胞プロセスにオフターゲット作用を引き起こす合成エレメントの可能性を低減するために、i)ヘテロタイプ構造において不活性であったTFREを含有するプロモーターは無視され(AARE、HRE、E-ボックス;
図3C)、且つii)各TFREのコピー数が最小化された組み合わせが選択された(2、3、15)。後者に関して、各TFREに関して閾値の部位コピー数があり、それを超えてさらにコピーを追加することにより、内在性遺伝子の発現プロファイルに変化を引き起こすのに十分なTFの隔離のレベルをもたらすことになると仮定された。しかしながら、TFREは、CHO細胞におけるそれらの同種のTFの高発現に従って特異的に選択されたため、この「最大量」は各結合部位について比較的高いであろう結論づけられた。したがって、最も豊富な成分TFREのコピー数を制限するためにプロモーターが選択された(例えば、4つの異なるTFREのうちの1つのコピーを含有するプロモーターが、2つの異なるTFREのうちの2つのコピーを含有する構築物に好ましかった)。最後に、最適の転写率は、ポリペプチド特異的フォールディング及び構築率に応じて各組換え遺伝子について異なるため、複数の別々のTFREの組み合わせが、広範囲の異なる転写出力を可能にするために選択された(5、10、20、40、60、80、及び100RPU)。例として、TFRE組成2×ARE:1×C/EBP-RE:1×GC-ボックス:1×EBS1:1×DRE:1×NFkBを有するプロモーターは、それが全ての必須の設計基準を満たし、且つ40.2RPUの予測された活性を有したため選択された。
【0101】
TFREの順序、スペーシング、及び配向がプロモーター活性に最小の影響及ぼすとき、成分TF結合部位は、任意選択により望ましくない配列の特徴の出現を最小化するように配置され得る。さらに、インシリコ構築により、配列の特徴をさらに向上させるために利用され得るスペーサー配列の組み込みが容易になる。したがって、成分TFREは、組換え遺伝子の発現安定性を最大化するために、各プロモーター内で配置され、且つ特別に設計された6bpのスペーサーにより隔てられた。例えば、プロモーターのメチル化に媒介されるエピジェネティックなサイレンシングが、CHO細胞において産生の不安定性を引き起こすと示されているという状況から、各々の中のCpGジヌクレオチドの数は最小化された(35、49)。さらに、遺伝子サイレンシングは又、相同組換えを介するDNAセグメントの欠失によって引き起こされ得るため(50、51)、反復配列の出現は特に防止された。真核生物の機構が40bpより長い同一の配列を組み換えることができると仮定して、20bpより大きなプロモーター内反復を防止し、且つ任意の2つが連なったTFREブロック(例えば、ARE-DRE)の反復を回避することにより、相同組換えに媒介されるサイレンシングに対して強固な保護をもたらすことになると結論づけられた(52)。さらに、複数のプロモーターが組み合わされて使用されるとき(例えば、モノクローナル抗体の発現)に組換えに媒介される遺伝子欠失から保護するために、35bpより大きいプロモーター間の反復配列は、特に排除された(53~55)。TFRE及びスペーサーのインシリコ配置を利用して、合成的に設計されたプロモーターは、平均で5.2個のCpGジヌクレオチド及び0個の20bpより大きいプロモーター内リピートを含有した。平均で20.7個のCpGジヌクレオチド及び3.8個の20bpより大きいプロモーター内反復、並びにhCMV-IE1プロモーター(34個のCpGジヌクレオチド、1個の20bpより大きい反復)を含有したインビトロで構築されたヘテロタイプのプロモーターとの比較は、インシリコでのプロモーター設計の利点を強調している。さらに、種々の発現ベクターへのクローニングを容易にするために、プロモーターを設計して、制限エンドヌクレアーゼ部位の出現を最小化した(263/308の分析された制限部位は、いずれのプロモーターにおいても出現しない)。最後に、プロモーター活性の不適当な調節を防止するために、全ての配列を確認して、追加の「偶発的なTF結合部位」がTFREスペーサー接合点で作製されなかったことを保証した。
【0102】
実施例5:カスタム設計された配列は、インビトロにおいて予測可能な機能性を呈する
各所望のプロモーター活性レベルのために、2つの合成配列を、異なるTFRE組成を用いて設計した(表3)(
図5A)。
【0103】
【0104】
【0105】
合成プロモーターが、化学的に合成され、且つSEAPレポーターベクターにおける最小CMVコアプロモーターの上流に挿入された。各レポータープラスミドによるCHO細胞の一過的なトランスフェクション後のSEAP産生の測定は、設計された活性及び観察された活性が高く相関することを示した(r
2=0.92;
図5B)。非常に低レベル~高レベルの転写(5~60RPU)で、全てのプロモーターのインビトロ活性は、予測された活性の5RPU以内であった。しかしながら、転写出力が非常に高かったとき(80~100RPU)、観察された活性と予測された活性の間の差は、10~22RPU(11~22%)で変動した。転写ノイズは、プロモーター活性及びTF結合部位のコピー数の両方に付随して増大することが以前に示されている(56、57)。これは、4つの最も強力なプロモーター(最も大きいTFREのコピー数を有する)が、観察された活性と予測された活性の間で最も大きな偏差を呈した理由を説明し得る。しかしながら、80以上の設計された活性を有する全てのプロモーターはインビトロで78以上の活性を呈したため、非常に強力なプロモーターをインシリコで通常どおりに作製することができるが、この発現レベルでは、非常に正確な転写の調節は困難である場合があると結論づけられた。
【0106】
ゲノム内の文脈において設計された配列の機能を試験するために、CHO細胞を、グルタミンシンターゼ選択マーカー遺伝子を共発現する合成プロモーター-レポータープラスミドで安定的にトランスフェクトした(58)。全範囲の転写調節を分析するために、5、10、20、80、及び100のRPUの活性を有するプロモーターを評価した。安定的にトランスフェクトしたCHO細胞のプールを、メチオニンスルホキシミンを含有し、懸濁培養液に再適応した培地中で選択した。工業的に妥当なバイオプロダクションの文脈におけるプロモーター性能を評価するために、プロモーター活性を、7日のバッチ産生プロセスの間に測定した。
図5Cに示されるとおり、一過的な発現系において観察されるプロモーター活性を、染色体の文脈において維持した。SEAPのmRNA存在量のqPCR分析により、安定的な発現系における相対的なプロモーター強度の比(100:72:28:16:8)が、当初設計されたプロモーター活性の比(100:80:20:10:5)と非常に類似することが明らかになった。さらに、相対的なプロモーター活性は、増殖の対数期(4日目)と定常期(7日目)の間で維持された。これらのデータは、プロモーター活性動態が、同調的な発現プロファイルを有するTFに結合する配列を設計することによって特異的に調整され得るという仮定を確証している。さらに、細胞増殖又は生存率に著しい影響を及ぼす合成プロモーターはなく(生存細胞濃度及び培養生存率は、4日目と7日目の全ての細胞プールの間で20%未満変動した;データは示さず)、細胞の性能に対するオフターゲット作用を最小化するように特別に設計されたTFREの組み合わせの選択が実証された。最後に、遺伝子発現の安定性を評価するために、高産生株及び低産生株の安定的なプールを、60世代の間MSX含有培地中で継代培養した。
図5Dに示されるとおり、SEAPの産生は、長期間の培養後に著しく減少しなかったが、これは、合成配列がプロモーターサイレンシングを防止するように首尾良く設計されたことを確証している。
【0107】
実施例6:結論
結論として、インビトロでカスタム設計の機能性を呈する哺乳動物プロモーターのインシリコモデルに従う構築が、初めて実証された。記載された設計プロセスを適用して、任意の特定の宿主細胞型又は遺伝子発現の文脈のための最適化されたプロモーター配列を作製することができる。ヘテロタイプのエレメント活性を説明する本明細書で提供されるモデルは、哺乳動物のプロモーター活性の以前に公開されたいずれかのモデルよりも高い予測能を有し、真核生物の転写調節機構に新たな洞察を提供する。記載されたプロモーター調節の単純化されたモデルは、OMICSデータセットからのインシリコでのプロモーターの設計を全体的に容易にし、例えば、ヘテロタイプ構造の文脈内における別々のTF-TFRE相互作用機能の数の詳細な理解を用いて、インビトロスクリーニングの必要性を取り除く。実際に、新規のヘテロタイププロモーター設計のためのモジュラーTFREブロックの組み合わせは、複数の合成TFを使用する遺伝的回路を構築する際に、特に適用可能であり得る。比較的単純な設計規則に従ってプロモーターをインシリコで作製できることを実証することによって、本研究は、哺乳動物の合成生物学について新たなツールを提供する。
【0108】
実施例7:合成プロモーターは、安定的なトランスフェクト細胞株における組換えタンパク質の発現において予測可能な活性を呈する
hCMV-IE1、及びGS選択マーカーを含有するベクター骨格において3種の異なる設計された活性レベル(RPU100、RPU60、及びRPU10)を有する合成プロモーターを含有する発現ベクターを構築した。プロモーターは、免疫活性化タンパク質の上流に挿入された。各構築物は三つ組で試験され、生産性のデータを3回の繰り返しから平均した。発現レベルを、一過的なトランスフェクション(
図7)及びフェドバッチ条件における安定的なプール(
図8)において比較した。免疫活性化タンパク質の定量化を、八つ組のアッセイによって測定した。一過的なトランスフェクション実験において、RPU100のプロモーターの制御下での免疫活性化タンパク質の発現レベルは、hCMV-IE1の制御下と比較して1.33倍に増加した。RPU60のプロモーターの制御下での発現レベルは向上せず、RPU10のプロモーターの制御下での発現レベルは、hCMV-IE1の制御下と比較して6倍減少した。安定的なプールでは、免疫活性化タンパク質の発現レベルは、13日を通して徐々に増加した。最大の生産性は、RPU100のプロモーターの制御下での1.8g/Lであった。RPU100のプロモーターの制御下での発現レベルは、hCMV-IE1の制御下よりも1.1倍高かったが、RPU60及びRPU10のプロモーターの制御下では、hCMV-IE1と比較して、それぞれ2.8倍及び18倍減少した。これらの結果は、発現レベルが、異なる強度を有するように設計されたプロモーターを用いて変えることができることを実証し、それらは、一過的なトランスフェクション及び安定的なプールの両方において一貫性を示す。力価は、hCMV-IE1と比較して、RPU100の合成プロモーターを使用する場合、9、11、及び13日目において、それぞれ1.51倍、1.56倍、及び1.1倍高かった。9日目及び11日目において著しく増加した力価を考慮すると、RPU100のプロモーターは、より短い産生プロセスの使用を推進することができる。
【0109】
さらなる一貫性は、異なる宿主細胞、CHO-Sで以下のTFREを有する合成プロモーターを試験することによって実証された:
100RPU 構築物A:
(GC-ボックス)-(ARE)-(NFkB-RE)-(DRE)-(EBS1)-(ARE)-(DRE)-(NFkB-RE)-(GC-ボックス)-(NFkB-RE)-(ARE)
100RPU 構築物B:
(NFkB-RE)-(DRE)-(GC-ボックス)-(ARE)-(NFkB-RE)-(C/EBP-RE)-(DRE)-(NFkB-RE)-(EBS1)-(NFkB-RE)-(ARE)
【0110】
試験されたプロモーターの活性は、CHO-S細胞において維持された。
【0111】
hCMV-IE1と比較して、100RPUを使用することによって促進された生産性の増加は、特定の発現の文脈において減少した(SEAPの生産性において見られる作用と比較して)。これは、利用される特定の組換えタンパク質、産生プロセス、又はベクターによってもたらすことができた。実際に、合成プロモーターによって可能になった生産性の相対的な増加(hCMV-IE1と比較して)及び発現レベルの正確な比は、様々な文脈において変動することになる。しかしながら、これらの結果は、合成プロモーターの機能の頑強性を強調し、最小数の構築物を試験することによって、実質的に異なる発現の文脈において、収量の著しい増加(hCMV-IE1と比較して)、及びタンパク質発現の予測可能で適正量を決めることができる調節の両方が可能になった。合成プロモーターがhCMV-IE1に対して著しい生産性の増加を提供しない状況においてさえ、それらの使用は依然として好ましい場合があるが、その理由は、i)それらがプロモーターサイレンシングを最小化するように設計され、且つii)それらは、サイズが著しく低減されるためである。
【0112】
References
1.Mutalik,V.K.,Guimaraes,J.C.,Cambray,G.,Lam,C.,Christoffersen,M.J.,Mai,Q.-A.,Tran,A.B.,Paull,M.,Keasling,J.D.and Arkin,A.P.(2013)Precise and reliable gene expression via standard transcription and translation initiation elements.Nat.Methods,10,354-360.
2.Brewster,R.C.,Weinert,F.M.,Garcia,H.G.,Song,D.,Rydenfelt,M.and Phillips,R.(2014)The transcription factor titration effect dictates level of gene expression.Cell,156,1312-1323.
3.Karreth,F.A.,Tay,Y.and Pandolfi,P.P.(2014)Target competition:transcription factors enter the limelight.Genome Biol.,15,114.
4.Fan,L.,Kadura,I.,Krebs,L.E.,Larson,J.L.,Bowden,D.M.and Frye,C.C.(2013)Development of aHighly-efficient CHO cell line generation system with engineered SV40E promoter.J.Biotechnol.,168,652-658.
5.Chen,J.,Haverty,J.,Deng,L.,Li,G.,Qiu,P.,Liu,Z.and Shi,S.(2013)Identification of a novel endogenous regulatory element in ChineseHamster ovary cells by promoter trap.J.Biotechnol.,167,255-261.
6.Sumitomo,Y.,Higashitsuji,H.,Higashitsuji,H.,Liu,Y.,Fujita,T.,Sakurai,T.,Candeias,M.M.,Itoh,K.,Chiba,T.and Fujita,J.(2012)Identification of a novel enhancer that binds Sp1 and contributes to induction of cold-inducible RNA-binding protein(cirp)expression in mammalian cells.BMC Biotechnol.,12,72.
7.Mariati,Yeo,J.H.,Koh,E.Y.,Ho,S.C.and Yang,Y.(2014)Insertion of core CpG island element intoHuman CMV promoter for enhancing recombinant protein expression stability in CHO cells.Biotechnol.Prog.,30,523-534.
8.Ferreira,J.P.,Peacock,R.W.,Lawhorn,I.E.and Wang,C.L.(2011)Modulating ectopic gene expression levels by using retroviral vectors equipped with synthetic promoters.Syst.Synth.Biol.,5,131-138.
9.Kwasnieski,J.C.,Mogno,I.,Myers,C.A.,Corbo,J.C.and Cohen,B.A.(2012)Complex effects of nucleotide variants in a mammalian cis-regulatory element.Proc.Natl.Acad.Sci.,109,19498-19503.
10.Brown,A.J.and James,D.C.(2015)Precision control of recombinant gene transcription for CHO cell synthetic biology.Biotechnol.Adv.,34(5),492-503
11.Gaj,T.,Gersbach,C.A.and Barbas,C.F.(2013)ZFN,TALEN,and CRISPR/Cas-based methods for genome engineering.Trends Biotechnol.,31,397-405.
12.Perez-Pinera,P.,Ousterout,D.G.,Brunger,J.M.,Farin,A.M.,Glass,K.A.,Guilak,F.,Crawford,G.E.,Hartemink,A.J.and Gersbach,C.A.(2013)Synergistic and tunableHuman gene activation by combinations of synthetic transcription factors.Nat.Methods,10,239-242.
13.Roessger,K.,Charpin-El-Hamri,G.and Fussenegger,M.(2014)Bile acid-controlled transgene expression in mammalian cells and mice.Metab.Eng.,21,81-90.
14.Chavez,A.,Scheiman,J.,Vora,S.,Pruitt,B.W.,Tuttle,M.,Iyer,E.P.,Lin,S.,Kiani,S.,Guzman,C.D.and Wiegand,D.J.(2015)Highly efficient Cas9-mediated transcriptional programming.Nat.Methods,12,326-328.
15.Hansen,A.S.and O’Shea,E.K.(2013)Promoter decoding of transcription factor dynamics involves a trade-off between noise and control of gene expression.Mol.Syst.Biol.,9,704.
16.Sharon,E.,Kalma,Y.,Sharp,A.,Raveh-Sadka,T.,Levo,M.,Zeevi,D.,Keren,L.,Yakhini,Z.,Weinberger,A.and Segal,E.(2012)Inferring gene regulatory logic fromHigh-throughput measurements of thousands of systematically designed promoters.Nat.Biotechnol.,30,521-530.
17.Weingarten-Gabbay,S.and Segal,E.(2014)The grammar of transcriptional regulation.Hum.Genet.,133,701-711.
18.Smith,R.P.,Taher,L.,Patwardhan,R.P.,Kim,M.J.,Inoue,F.,Shendure,J.,Ovcharenko,I.and Ahituv,N.(2013)Massively parallel decoding of mammalian regulatory sequences supports a flexible organizational model.Nat.Genet.,45,1021-1028.
19.Arnosti,D.N.and Kulkarni,M.M.(2005)Transcriptional enhancers:Intelligent enhanceosomes or flexible billboards? J.Cell.Biochem.,94,890-898.
20.Rastegar,S.,Hess,I.,Dickmeis,T.,Nicod,J.C.,Ertzer,R.,Hadzhiev,Y.,Thies,W.-G.,Scherer,G.and Strahle,U.(2008)The words of the regulatory code are arranged in a variable manner inHighly conserved enhancers.Dev.Biol.,318,366-377.
21.Ravasi,T.,Suzuki,H.,Cannistraci,C.V.,Katayama,S.,Bajic,V.B.,Tan,K.,Akalin,A.,Schmeier,S.,Kanamori-Katayama,M.and Bertin,N.(2010)An atlas of combinatorial transcriptional regulation in mouse and man.Cell,140,744-752.
22.Gertz,J.and Cohen,B.A.(2009)Environment-specific combinatorial cis-regulation in synthetic promoters.Mol.Syst.Biol.,5,244.
23.Segal,E.,Raveh-Sadka,T.,Schroeder,M.,Unnerstall,U.and Gaul,U.(2008)Predicting expression patterns from regulatory sequence in Drosophila segmentation.Nature,451,535-540.
24.Trapnell,C.,Pachter,L.and Salzberg,S.L.(2009)TopHat:discovering splice junctions with RNA-Seq.Bioinformatics,25,1105-1111.
25.Xu,X.,Nagarajan,H.,Lewis,N.E.,Pan,S.,Cai,Z.,Liu,X.,Chen,W.,Xie,M.,Wang,W.andHammond,S.(2011)The genomic sequence of the ChineseHamster ovary(CHO)-K1 cell line.Nat.Biotechnol.,29,735-741.
26.Trapnell,C.,Williams,B.A.,Pertea,G.,Mortazavi,A.,Kwan,G.,Van Baren,M.J.,Salzberg,S.L.,Wold,B.J.and Pachter,L.(2010)Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation.Nat.Biotechnol.,28,511-515.
27.Chawla,K.,Tripathi,S.,Thommesen,L.,Laegreid,A.and Kuiper,M.(2013)TFcheckpoint:a curated compendium of specific DNA-binding RNA polymerase II transcription factors.Bioinformatics,29(19),2519-20.
28.Tripathi,S.,Vercruysse,S.,Chawla,K.,Christie,K.R.,Blake,J.A.,Huntley,R.P.,Orchard,S.,Hermjakob,H.,Thommesen,L.and Laegreid,A.(2016)Gene regulation knowledge commons:community action takes care of DNA binding transcription factors.Database,2016,baw088.
29.Mathelier,A.,Zhao,X.,Zhang,A.W.,Parcy,F.,Worsley-Hunt,R.,Arenillas,D.J.,Buchman,S.,Chen,C.-y.,Chou,A.and Ienasescu,H.(2013)JASPAR 2014:an extensively expanded and updated open-access database of transcription factor binding profiles.Nucleic Acids Res.,gkt997.
30.Brown,A.J.,Mainwaring,D.O.,Sweeney,B.and James,D.C.(2013)Block decoys:transcription-factor decoys designed for in vitro gene regulation studies.Anal.Biochem.,443,205-210.
31.Brown,A.J.,Sweeney,B.,Mainwaring,D.O.and James,D.C.(2014)Synthetic promoters for CHO cell engineering.Biotechnol.Bioeng.,111,1638-1647.
32.Senthilkumar,R.,Sabarinathan,R.,Hameed,B.S.,Banerjee,N.,Chidambarathanu,N.,Karthik,R.and Sekar,K.(2010)FAIR:A server for internal sequence repeats.Bioinformation,4,271.
33.Manke,T.,Roider,H.G.and Vingron,M.(2008)Statistical modeling of transcription factor binding affinities predicts regulatory interactions.PLoS Comput.Biol.,4,e1000039.
34.Cartharius,K.,Frech,K.,Grote,K.,Klocke,B.,Haltmeier,M.,Klingenhoff,A.,Frisch,M.,Bayerlein,M.and Werner,T.(2005)MatInspector and beyond:promoter analysis based on transcription factor binding sites.Bioinformatics,21,2933-2942.
35.Kim,M.,O’Callaghan,P.M.,Droms,K.A.and James,D.C.(2011)A mechanistic understanding of production instability in CHO cell lines expressing recombinant monoclonal antibodies.Biotechnol.Bioeng.,108,2434-2446.
36.Dahodwala,H.and Sharfstein,S.T.(2014)Role of epigenetics in expression of recombinant proteins from mammalian cells.Pharm.Bioprocess.,2,403-419.
37.Gertz,J.,Siggia,E.D.and Cohen,B.A.(2009)Analysis of combinatorial cis-regulation in synthetic and genomic promoters.Nature,457,215-218.
38.Sheng,X.,Wu,J.,Sun,Q.,Li,X.,Xian,F.,Sun,M.,Fang,W.,Chen,M.,Yu,J.and Xiao,J.(2016)MTD:a mammalian transcriptomic database to explore gene expression and regulation.Brief.Bioinform.,18(1),28-36.
39.Vaquerizas,J.M.,Kummerfeld,S.K.,Teichmann,S.A.and Luscombe,N.M.(2009)A census ofHuman transcription factors:function,expression and evolution.Nat.Rev.Genet.,10,252-263.
40.Tripathi,S.,Christie,K.R.,Balakrishnan,R.,Huntley,R.,Hill,D.P.,Thommesen,L.,Blake,J.A.,Kuiper,M.and Laegreid,A.(2013)Gene Ontology annotation of sequence-specific DNA binding transcription factors:setting the stage for a large-scale curation effort.Database,2013,bat062.
41.van Dijk,D.,Sharon,E.,Lotan-Pompan,M.,Weinberger,A.,Segal,E.and Carey,L.B.(2017)Large-scale mapping of gene regulatory logic reveals context-dependent repression by transcriptional activators.Genome Res.,27,87-94.
42.Wajapeyee,N.,Malonia,S.K.,Palakurthy,R.K.and Green,M.R.(2013)Oncogenic RAS directs silencing of tumor suppressor genes through ordered recruitment of transcriptional repressors.Genes Dev.,27,2221-2226.
43.Smith,Z.D.and Meissner,A.(2013)DNA methylation:roles in mammalian development.Nat.Rev.Genet.,14,204-220.
44.Grskovic,M.,Chaivorapol,C.,Gaspar-Maia,A.,Li,H.and Ramalho-Santos,M.(2007)Systematic identification of cis-regulatory sequences active in mouse andHuman embryonic stem cells.PLoS Genet.,3,e145.
45.Giniger,E.and Ptashne,M.(1988)Cooperative DNA binding of the yeast transcriptional activator GAL4.Proc.Natl.Acad.Sci.,85,382-386.
46.Hussain,H.,Maldonado-Agurto,R.and Dickson,A.J.(2014)The endoplasmic reticulum and unfolded protein response in the control of mammalian recombinant protein production.Biotechnol.Lett.,36,1581-1593.
47.Gorman,A.M.,Healy,S.J.,Jager,R.and Samali,A.(2012)Stress management at the ER:regulators of ER stress-induced apoptosis.Pharmacol.Ther.,134,306-316.
48.Sano,R.and Reed,J.C.(2013)ER stress-induced cell death mechanisms.BBA-Mol.Cell Res.,1833,3460-3470.
49.Yang,Y.,Chusainow,J.and Yap,M.G.(2010)DNA methylation contributes to loss in productivity of monoclonal antibody-producing CHO cell lines.J.Biotechnol.,147,180-185.
50.Moynahan,M.E.and Jasin,M.(2010)MitoticHomologous recombination maintains genomic stability and suppresses tumorigenesis.Nat.rev.Mol.cell biol.,11,196-207.
51.Jasin,M.and Rothstein,R.(2013)Repair of strand breaks byHomologous recombination.Cold SpringHarb.Perspect.Biol.,5,a012740.
52.Baudin,A.,Ozier-Kalogeropoulos,O.,Denouel,A.,Lacroute,F.and Cullin,C.(1993)A simple and efficient method for direct gene deletion in Saccharomyces cerevisiae.Nucleic Acids Res.,21,3329.
53.Sleight,S.C.,Bartley,B.A.,Lieviant,J.A.and Sauro,H.M.(2010)Designing and engineering evolutionary robust genetic circuits.J.Biol.Eng.,4,12.
54.Lambert,S.,Saintigny,Y.,Delacote,F.,Amiot,F.,Chaput,B.,Lecomte,M.,Huck,S.,Bertrand,P.and Lopez,B.(1999)Analysis of intrachromosomalHomologous recombination in mammalian cell,using tandem repeat sequences.Mutat.Res.,DNA Repair,433,159-168.
55.Read,L.R.,Raynard,S.J.,Ruksc,A.and Baker,M.D.(2004)Gene repeat expansion and contraction by spontaneous intrachromosomalHomologous recombination in mammalian cells.Nucleic Acids Res.,32,1184-1196.
56.Sharon,E.,van Dijk,D.,Kalma,Y.,Keren,L.,Manor,O.,Yakhini,Z.and Segal,E.(2014)Probing the effect of promoters on noise in gene expression using thousands of designed sequences.Genome Res.,24,1698-1706.
57.Murphy,K.F.,Balazsi,G.and Collins,J.J.(2007)Combinatorial promoter design for engineering noisy gene expression.Proc.Natl.Acad.Sci.,104,12726-12731.
58.Cockett,M.,Bebbington,C.and Yarranton,G.(1990)High level expression of tissue inhibitor of metalloproteinases in ChineseHamster ovary cells using glutamine synthetase gene amplification.Nat.Biotechnol.,8,662-667.
【配列表】