IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ.ホフマン−ラ ロシュ アーゲーの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-04
(45)【発行日】2022-10-13
(54)【発明の名称】培養装置の性能を検証する方法
(51)【国際特許分類】
   C12Q 1/02 20060101AFI20221005BHJP
   C12N 1/00 20060101ALI20221005BHJP
   G16B 5/00 20190101ALI20221005BHJP
   C12P 21/02 20060101ALN20221005BHJP
   C12P 21/08 20060101ALN20221005BHJP
【FI】
C12Q1/02
C12N1/00 B
G16B5/00
C12P21/02 C
C12P21/08
【請求項の数】 11
(21)【出願番号】P 2021510653
(86)(22)【出願日】2019-08-23
(65)【公表番号】
(43)【公表日】2021-12-16
(86)【国際出願番号】 EP2019072538
(87)【国際公開番号】W WO2020043601
(87)【国際公開日】2020-03-05
【審査請求日】2021-04-05
(31)【優先権主張番号】18190942.5
(32)【優先日】2018-08-27
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】591003013
【氏名又は名称】エフ.ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【弁理士】
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】グロスコフ トビアス
(72)【発明者】
【氏名】ポップ オリバー
(72)【発明者】
【氏名】ヴァロシャ トビアス
【審査官】竹内 祐樹
(56)【参考文献】
【文献】特開2011-034208(JP,A)
【文献】WOLFGANG P et al.,Innovative metabolic data integration applicable for Therapeutic Protein Development 2.0,ECI Digital Archives [online], [令和4年4月21日検索],インターネット<URL: https://dc.engconfintl.org/ccexvi/161/>
(58)【調査した分野】(Int.Cl.,DB名)
C12M 1/00-3/10
C12Q 1/00-3/00
C12P 1/00-41/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
哺乳動物細胞または細菌細胞の培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法であって、
- 組換え異種ポリペプチドを発現している前記哺乳動物細胞または細菌細胞の前記培養中に取得した前記プロセスデータを、同じ組換え異種ポリペプチドを発現している同じ哺乳動物細胞または細菌細胞に対して生成された代謝モデルを使用してフィッティングするステップと、
- (i)モデル化されたフィットが未加工データに対して10%を上回るオフセットを示すか
または
(ii)モデル化されたフィットのピアソンのカイ二乗検定によって決定されたカイ値が5よりも大きい
場合に、前記培養が問題による影響を受けていると決定するステップと
を含む、前記方法。
【請求項2】
異種ポリペプチドを発現している細胞を選択するための方法であって、
a)同じ異種ポリペプチドを生成する多数の哺乳動物細胞クローンまたは細菌細胞クローンを別々に培養し、それにより前記培養中に時間的なプロセスデータが記録されるステップと、
b)同じ哺乳動物細胞または細菌細胞に対して生成された同じ代謝モデルを使用して、ステップa)で取得した各クローンの前記プロセスデータを個別にフィッティングするステップと、
c)前記代謝モデルにおいてステップa)で取得した前記培養の前記プロセスデータに対してステップb)で得られたフィットが(i)未加工データに対して10%を上回るオフセットを示すか、または(ii)前記フィットに対するピアソンのカイ二乗検定によって決定された前記カイ値が5以上である場合に、ステップa)の培養が問題による影響を受けていると決定するステップと、
d)ステップc)で決定されるように前記培養で問題があった前記クローンを用いてステップa)からc)を繰り返すステップか、
または
ステップc)で決定されるように前記培養で問題のあるクローンがない場合、(i)最大の力価、および/または(ii)最高レベルの意図される生成物の品質特性(複数可)、および/または(iii)代謝性能指標において好ましい代謝表現型/最大ラングを有する異種ポリペプチドを発現している細胞として前記多数のクローンの中から前記クローンを選択するステップと
を含む、前記方法。
【請求項3】
前記フィットに対するピアソンのカイ二乗検定によって決定されたカイ値が、1以上である、請求項1~2のいずれか一項に記載の方法。
【請求項4】
前記細胞が、(i)CHO細胞である哺乳動物細胞、および/または(ii)大腸菌(E.coli)である細菌細胞である、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記異種ポリペプチドが抗体である、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記プロセスデータが、少なくとも15のプロセスパラメータの時間的な値を含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記プロセスデータが、少なくとも12のオンラインプロセスパラメータと少なくとも28のオフラインプロセスパラメータの時間的な値を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記プロセスデータが、各プロセスパラメータに対して少なくとも6つの時間的な値を含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
- 前記代謝モデルが、ゲノムベースの代謝モデルであり、かつ/または
- 前記代謝モデルが、5つの区画であるサイトゾル、ミトコンドリア、小胞体、ゴルジ体およびバイオリアクターを含み、かつ/または
- 前記代謝モデルが、解糖、クエン酸回路、ペントースリン酸経路、および呼吸鎖の中心代謝経路と、主要なバイオマス構成要素のタンパク質、脂質、RNA、DNA、および炭水化物の生合成と、C1代謝と、アミノ酸分解経路と、を含む、
請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記代謝モデルが、少なくとも600の反応、500の代謝物および250の遺伝子を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記問題が技術的な問題である、請求項1~10のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞培養の分野、より正確には、高スループットの細胞培養の分野に関する。本明細書では、細胞培養が問題による影響を受けているかどうかを判定するための方法が報告される。実験によって決定されたデータのアライメントまたは/および一貫性の制御は、特にインシリコ代謝モデリングで利用されている。細胞モデルによる代謝フラックス解析を用いることにより、モデルと実験とのフィットに基づいてインビトロデータの一貫性をチェックすることができる。
【背景技術】
【0002】
発明の背景
現代のバイオ治療薬(biotherapeutics)は、癌、糖尿病、または関節リウマチのような複雑な多因子疾患の治療において高まる需要に応えている。ほとんどのバイオ治療薬は、例えば、チャイニーズハムスター卵巣(CHO)細胞のような確立された哺乳動物細胞株または大腸菌(Escherichia coli:E.coli)のようなよく特徴づけられた細菌株で産生される。
【0003】
細胞株の開発およびプロセスの開発は、特に遺伝子増幅およびクローン選択が必要であるために、細胞ベースのバイオプロセスでは従来から時間がかかり、煩雑であった。このことは、前臨床および臨床評価を受けている多くの薬剤候補に十分な材料を迅速に提供する必要性と対立する。
【0004】
バイオ治療薬の生産のための細胞株開発のスピードアップは、時間と労力のかかるインビトロおよびインビボでの方法を支えるインシリコ方法の開発に強い推進力を生み出した。
【0005】
高生産細胞株およびバイオプロセスの徹底的な特徴づけは、前臨床および臨床応用のための多量かつ高品質のバイオ治療薬の頑健で一貫した生産に適したクローンをしっかりと確実に選択するために不可欠である。これには、バイオプロセス開発中に適切な方法を適用して、細胞クローンおよびプロセスの有意義な特徴づけを可能にすることが必要である。
【0006】
プロセス分析技術(PAT)を使用したオンラインプロセスの監視の最近の進歩と、工業的細胞培養における重要な生成物の品質特性への注目の高まりにより、現在利用できるプロセスデータの幅および量は大幅に増加した。
【0007】
このような豊富なプロセスデータから情報を取り出し、バイオプロセス性能を予測するために、統計モデルに基づく多変量データ分析が、現在適用されている方法の中で優位に立っている(Paisら,Curr.Opin.Biotechnol.30C(2014)161-167(非特許文献1);Schaubら,in:Hu WS,Zeng A-P,editors.Genomics and systems biology of mammalian cell culture.Berlin Heidelberg:Springer.2012,133-163.http://link.springer.com/chapter/10.1007/10_2010_98(非特許文献2))。並行して、いくつかの哺乳動物細胞株について、機構的代謝モデルが開発された(Dietmairら,Biotechnol.Bioeng.109(2012)1404-1414(非特許文献3);Nolan and Lee,Metab.Eng.13(2011)108-124(非特許文献4);Provostら,Bioprocess Biosyst.Eng.29(2006)349-366(非特許文献5);Selvarasuら,Mol.Biosyst.6(2010)152-161(非特許文献6);Sheikhら,Biotechnol.Prog.21(2005)112-121(非特許文献7))。このようなモデルは、新たに利用可能なゲノム情報(Birzeleら,Nucl.Acids Res.38(2010)3999-4010(非特許文献8);Brinkrolfら,Nat.Biotechnol.31(2013)694-695(非特許文献9);Lewisら,Nat.Biotechnol.31(2013)759-765(非特許文献10))と、定量的な代謝物測定を活用して、細胞外データのみに基づいて、細胞内の状態を包括的に評価することができるため、魅力的である。このように、プロセス開発およびクローン選択においても、そのようなモデルはマイクロバイオリアクターのようなスケールダウン発酵システムともうまく連動する(Bareither and Pollard,Biotechnol.Prog.27(2011)2-14(非特許文献11);Hsuら,Cytotechnol.64(2012)667-678(非特許文献12))。これらのシステムでは、プロセス条件を大規模プロセスなどの制御されたプロセスシナリオに近づけることができるので、より予測的なクローンの特徴づけが提供され、受け入れが進んでいる(Porterら,Biotechnol.Prog.26(2010)446-1454 and 1455-1464(非特許文献13);Rameezら,Biotechnol.Prog.30(2014)718-727(非特許文献14))。
【0008】
Charaniya,S.ら(J.Biotechnol.147(2010)186-197)(非特許文献15)は、生産性の高いプロセスの特徴を発見するための製造データのマイニングを開示した。そこでは、最大マージンベースのサポートベクター回帰アルゴリズムと組み合わせたカーネルベースのアプローチを使用して、すべてのプロセスパラメータを統合し、主要な細胞培養性能パラメータの予測モデルが開発された。また、このモデルは、プロセスの結果を予測する際の関連性に応じて、プロセスパラメータを特定し、ランク付けするためにも使用された。
【0009】
Popp,O.ら(Biotechnol.Bioeng.113(2016)2005-2019)(非特許文献16)は、代謝クローン性能の包括的な特徴づけをサポートするためのハイブリッドアプローチを開示した。このアプローチは、代謝物プロファイリングと多変量データ解析およびフラクソミクスを組み合わせて、目的の細胞表現型に関連する主要な代謝形質のデータ駆動型の機構的解析を可能にした。著者らは、10の組換えCHO-K1生産クローンおよび宿主細胞株のセットで代謝性能を定量化して比較する方法論を適用し、成長および生成物形成をキャプチャするだけでなく、細胞内クローンの生理学およびプロセス中の代謝の変化に関する情報も取り入れたクローンの性能の判定基準の拡張されたセットを得ることができた。これらの基準を使用することにより、定量的なクローンのランク付けが可能になり、比較的高い生成物力価を生じる高生産CHO-K1クローン間の代謝の違いを識別することができた。
【0010】
国際公開第2011/140093号(特許文献1)明細書は、対象における非アルコール性脂肪性肝疾患、非アルコール性脂肪性幹疾患、および/または肝線維症の重症度を評価する方法を開示した。この方法には、対象から身体サンプルを取得し、健康な個体のサンプルと比較した場合のサンプル中の少なくとも1つの酸化脂肪酸生成物のレベルを決定することが含まれる。
【0011】
国際公開第2011/136515号(特許文献2)明細書は、ごく最近に、ゲノム規模の技術により、哺乳動物細胞におけるタンパク質生成の複雑な生体分子基盤を解明するシステムレベルの解析が可能になったことを開示した。これにより、プロセスの理解が深まり、さらなるプロセスの最適化のための知識ベースのアプローチを演繹することが期待される。この文書は、このような知識ベースのアプローチを使用する合理的な細胞培養プロセスの方法を説明した。
【0012】
Paul,W.ら(https://dc.engconfintl.org/ccexvi/161/)(非特許文献17)は、代謝/プロセスのモデリングおよび結果において新しいアプローチを開示した。彼らは、ハイブリッド代謝モデルが、細胞内代謝フラックス計算および明日の細胞の代謝状態の予測のための新しいアプローチを可能にすることを見出した。これらのモデルは代謝駆動型のプロセス制御を可能にする。人工ニューラルネットワークは、信頼度が高く、2乗平均平方根誤差(RMSE)が約20%と低い(POC)代謝フラックス値の推定に成功した。
【0013】
現在の代謝モデルベースの方法は、開発されたモデルに手動で挿入されたデータに依存している。破損したデータ入力が生じ、モデル出力全体に損害を与える可能性がある。仮に実行された場合、外れ値の検出方法は、不規則なデータ構造に依存するが、生物学的関連性およびデータの相互検証には依存しない。
【先行技術文献】
【特許文献】
【0014】
【文献】国際公開第2011/140093号
【文献】国際公開第2011/136515号
【非特許文献】
【0015】
【文献】Paisら,Curr.Opin.Biotechnol.30C(2014)161-167
【文献】Schaubら,in:Hu WS,Zeng A-P,editors.Genomics and systems biology of mammalian cell culture.Berlin Heidelberg:Springer.2012,133-163.http://link.springer.com/chapter/10.1007/10_2010_98
【文献】Dietmairら,Biotechnol.Bioeng.109(2012)1404-1414
【文献】Nolan and Lee,Metab.Eng.13(2011)108-124
【文献】Provostら,Bioprocess Biosyst.Eng.29(2006)349-366
【文献】Selvarasuら,Mol.Biosyst.6(2010)152-161
【文献】Sheikhら,Biotechnol.Prog.21(2005)112-121
【文献】Birzeleら,Nucl.Acids Res.38(2010)3999-4010
【文献】Brinkrolfら,Nat.Biotechnol.31(2013)694-695
【文献】Lewisら,Nat.Biotechnol.31(2013)759-765
【文献】Bareither and Pollard,Biotechnol.Prog.27(2011)2-14
【文献】Hsuら,Cytotechnol.64(2012)667-678
【文献】Porterら,Biotechnol.Prog.26(2010)446-1454 and 1455-1464
【文献】Rameezら,Biotechnol.Prog.30(2014)718-727
【文献】Charaniya,S.ら(J.Biotechnol.147(2010)186-197)
【文献】Popp,O.ら(Biotechnol.Bioeng.113(2016)2005-2019)
【文献】Paul,W.ら(https://dc.engconfintl.org/ccexvi/161/)
【発明の概要】
【0016】
本発明の1つの目的は、インシリコでのモデリングおよび代謝フラックス解析を使用して、問題による影響を受ける細胞培養の特定または決定のための方法、すなわち、実験によって決定されたデータのアライメントおよび/または一貫性の制御のための方法を提供することであった。モデルと実験データとの適合度を決定することにより、問題による影響を受けている培養を特定することができる。この問題は、技術的問題または生物学的問題のいずれかであり得る。技術的問題は、培養を行うために使用されるハードウェアの故障に基づく。生物学的問題は、例えば培養物の細菌または真菌による汚染に起因する細胞自体に基づいている。好ましくは、問題は、培養を実行および/または監視するために使用されるハードウェア、すなわち、プローブ、容器、電子、デバイス、分析などに関連する技術的問題である。
【0017】
したがって、(確立された)代謝モデルに対する実験データの適合度(GoF)を決定することによって培養性能を検証するための方法が本発明において提供される。
【0018】
本発明によるすべての方法は、以下の第1の一連のステップ:
- 組換え異種ポリペプチド、好ましくは抗体を発現する細胞クローンの培養中に取得したプロセスデータを、同じ組換え異種ポリペプチドを発現する同じ細胞に対して生成された代謝モデルを使用してフィッティングするステップ、および
- 得られたフィットが未加工データに対して10%を超えるオフセットを示す場合に、培養が問題による影響を受けていると判定するステップ;
あるいは以下の第2の一連のステップ:
- 細胞クローンの培養のプロセスデータを受け取るステップであって、該細胞クローンが前記細胞に対して異種のポリペプチド、好ましくは抗体を産生するステップ、
- 前記細胞に対して確立された代謝モデルを使用してデータをフィッティングし、統計的相関法、好ましくはピアソンのカイ二乗検定によって決定されたカイ(χとも表記される)値によってそのフィットを特徴づけるステップ、および
- カイ値が5よりも大きい場合に、問題による影響を受けているとプロセスデータを特定するステップ
のいずれかを含む。
【発明を実施するための形態】
【0019】
本発明の実施形態の詳細な説明
定義
本明細書において使用される「フラックス解析」という用語は、生化学的化学量論的反応および経路の数学的検査を意味する。
【0020】
本明細書において使用される「フラックスバランス解析」という用語、略して「FBA」は、所与の目的関数を最大化または最小化するための線形代数による生化学的化学量論的モデルの最適化を意味する。
【0021】
本明細書において使用される「制約フラックス解析」という用語は、代謝モデルにおける各反応の最大および最小許容フラックス値が規定値を超えないように制約されるフラックス解析を意味する。
【0022】
本明細書において使用される「ゲノム規模」という用語は、生物の遺伝子の能力の生化学的化学量論的反応への徹底的なマッピングを意味する。ゲノム規模モデルは、生物の配列決定されたゲノム情報から導き出され、文献情報および実験的検証によってさらに精選される。
【0023】
本明細書において使用される「インプロセス制御」という用語は、培養プロセスを制御し、分析し、解釈するために必要な物理的培養パラメータならびに細胞表現型および代謝型パラメータの連続値(例えば、数分以内の値)または離散値(例えば、毎日1回の値)、量およびレベルを評価するための方法およびアプローチを意味する。パラメータは、この目的のためにオンライン、アットライン、またはオフラインのいずれかで生成することができる。
【0024】
本明細書において使用される「プロセスデータ」という用語は、速度などの(計算された)結果変数を含む、オンラインおよびオフラインで取得した時間的プロセスパラメータ値の合計を意味する。「プロセスデータ」は、経時的に取得され、アーカイブ、すなわち保存される。本明細書において使用される「プロセスデータ」という用語は、少なくとも、生存度;生細胞密度;生細胞体積;栄養素、例えばグルコース、リン酸、アミノ酸、脂肪酸など、ならびに代謝物、例えば乳酸、アンモニアなどの消費および生成速度;生成物;プロセス関連パラメータ、例えば、物理的パラメータ温度、溶存酸素濃度、pH、通気速度、反応器質量、追加された補正液、および/または追加された供給などの変数を含む。プロセスデータを形成するプロセスパラメータは分析値であるため、これらには技術的な問題が生じやすい。これらの技術的な問題は、特に、サンプリング、使用された分析装置、または人間が関与している場合にはヒューマンエラーに関連している。
【0025】
本明細書において使用される「哺乳動物細胞クローン」という用語は、分泌された異種ポリペプチドをコードする核酸でトランスフェクトされており、前記分泌された異種ポリペプチドを発現している哺乳動物細胞を意味する。
【0026】
本明細書において使用される「代謝フラックス解析」という用語、略して「MFA」は、生化学反応にわたる測定されたフラックスの生化学的化学量論的モデルへのマッピング、およびその後のモデル内の全エラーの最小化を意味する。
【0027】
本明細書において使用される「代謝ネットワーク(再)構築」という用語は、代謝反応ネットワークの構築につながる活性の組合せを意味する。生化学経路情報の収集に加えて、代謝ネットワークの精選および検証が、機能的な代謝ネットワークの再構築を得るために必要である。
【0028】
本明細書において使用される「多変量データ分析」という用語は、統計的または数学的分析と組み合わせた/統計的または数学的分析に関連する複数のパラメータの観察および分析を意味する。
【0029】
本明細書において使用される「ネットワークモデル」という用語は、生物の生化学反応ネットワークの数学的表現を意味する。
【0030】
本明細書において使用される「親哺乳動物細胞」という用語は、分泌された異種ポリペプチドをコードする核酸でトランスフェクトされる前の哺乳動物細胞を意味する。
【0031】
本明細書において使用される「インプロセス記録データの検証」という用語は、発酵システム内で生成されたデータを測定によって信憑性がるかどうかチェックすることを意味する。
【0032】
本明細書において使用される「統計的相関法」という用語は、変数の対が互いに、i)関連しているかどうか、およびii)どれほど強く関連しているかを示すことができる統計的方法を意味する。
【0033】
本明細書において使用される「ピアソンのカイ二乗検定」という用語は、観測された度数分布が理論分布と異なるかどうかを計算するための方法を意味する。これは相関係数であり、2つの変数の共分散をその標準偏差の積で除算したものである。その結果は、2つの変数XとYの間の線形相関の尺度である。その値は+1と-1の間であり、1は完全な正の線形相関であり、0は線形相関がなく、-1は完全な負の線形相関である。
【0034】
モデルの生成
以下のモデルの生成の説明は、単に本発明を実施するために有用な方法の記述を提供するために提供されていることが明確に指摘されている。これは、本発明を例示するために行われるものであって、本発明を制限するためではない。モデル構築のための多数の異なる方法およびアプローチは、当業者に公知であり、本発明による方法においても同様に適用することができる。
【0035】
本発明による方法は、同じモデルが本発明による方法のすべてのステップで使用される限り、どんな代謝モデルで実行されてもよい。
【0036】
本発明による方法は、細胞の代謝モデルが利用可能であるか、または標準的な方法によって取得することができる限り、どんな哺乳動物細胞で実行されてもよい。
【0037】
以下に、本発明による方法において有用な代謝モデルを生成するための例示的な方法が概説される。
【0038】
CHOネットワークモデルの構築、フラックス分析、性能測定、および多変量データ分析
Popp,O.ら(Biotechnol.Bioeng.113(2016)2005-2019;また、参照により本明細書に援用される同文献中で引用された参考文献)に報告されたようなアプローチが、本発明による方法で使用されるモデルを生成するための例示的な方法として次に行われる。これは以下に要約され、実施例の項でより詳細に概説される。
【0039】
5つの区画(サイトゾル、ミトコンドリア、ER、ゴルジ体、バイオリアクター)を含むゲノムベースのCHOネットワークモデルが、データベースおよび一次文献を含む公開情報源から、確立された手順に従って、以下に概説されるアプローチに基づいて構築された(すべて参照により本明細書に組み込まれる)。
【0040】
-Oberhardtら(Mol.Syst.Biol.5(2009)320)は、ゲノム規模の代謝再構築のアプリケーションを開示した。その中で、モデルの構築および分析のためのいくつかのリソースが存在することが概説されている。著者らによれば、これまで、すべての信頼性の高いゲノム規模の代謝再構築は、4段階のプロセスで手動で構築されてきた。第1に、最初の再構築は、既知遺伝子を機能的カテゴリーにリンクさせ、遺伝子型と表現型の間のギャップを埋めるのに役立つ、KEGGおよびEXPASYなどのオンラインデータベースからの情報と組み合わせた遺伝子アノテーションデータから構築される。第2に、最初の再構築は、一次文献の調査を通じて精選される。次に、再構築は、制約ベースのアプローチによって分析することができる数学モデルに変換される。第3に、再構築は、モデル予測と表現型データの比較を通じて検証される。最後の第4ステップでは、代謝再構築は、ウェットラボおよびドライラボのサイクルに付される。これにより、精度が向上し、主要な仮説の調査が可能になる。
【0041】
再構築には、配列決定されたゲノムから得られたBLAST相同性スコアに基づく、半自動化された遺伝子アノテーションデータが含まれ、これはモデル構築中のギャップ分析のために、生物に特有の文献からの詳細な、場合により手作業で収集されたデータで増強されている。それにより、以前にアノテーションされていなかった遺伝子機能が、不完全ではあるが本質的な代謝経路を解析することによって、遺伝子アノテーションの知識に組み込まれる。文献検索によって補完されたギャップ分析プロセスにより、以前は見過ごされていた表現型データが明らかになり、生物に存在する可能性が高いが、対応する遺伝子に現在アノテーションされていない酵素の仮説を立てることが可能になる。このプロセスは、特定の生物で行われた作業を圧縮するのに役立つ。ギャップ分析ステップは、知識ベースとしてのゲノム規模の再構築を、その分析に向けて完全な一揃いのネットワークツールを適用することができる機能モデルとしての代謝GENREに変換するためにも重要である。
【0042】
再構築の努力により、比フラックス、P/O比、およびATPの維持費用などの細胞のパラメータの質の高い推定値が提供され、これらの理論値が、生物学的研究における仮説の構築または検証によく使用されることは一般的である。ホモサピエンス代謝の2つの既存の再構築を除いて、平均の真核生物ネットワークのサイズは、800、800、および1300(それぞれ、代謝物、遺伝子、および反応)である。真核生物ゲノムの全ORFの6~13%が、代謝GENREに一般に含まれている。
【0043】
細胞内代謝フラックスは、13C標識グルコース実験の使用を通して決定されることができる。この実験ではケモスタット培養の細胞の増殖の間に標識された炭素が追跡され、計算による方法を用いて、増殖中に炭素が細胞の内部でとった経路が再構築される。代謝GENREは、代謝物濃度データを解釈するためのフレームワークとしても使用されている。ある研究では、ハイスループットGC-MS法を使用して、S.セレビシエ(S.cerevisiae)中の52の代謝物の濃度が決定された。既知の環境条件下での代謝物濃度の違いは、改変S.セレビシエ代謝GENREにマッピングされ、次に、このマッピングは、細胞内の代謝調節のエフェクターを調べるためにトランスクリプトームデータと組み合わされた。トランスクリプトームデータは、特に、タンパク質発現データ、タンパク質-タンパク質相互作用データ、タンパク質-代謝物相互作用データ、および物理的相互作用データなどの他のデータタイプに関連している場合が多い。特に、複数のデータタイプを考慮すると、代謝GENREは、データ解釈の貴重なツールになり得る。
【0044】
代謝GENREは、他のシステム、制約、および摂動をその上に重ね合わせることができる低解像度の青写真と見るのが最適である。規制データおよびシグナル伝達データ、ならびにその他の高次システムを制約セットに組み込むことで、代謝GENREはますます機敏になり、現実的な細胞表現型を表すようになってきている。
【0045】
FBAは、制約ベースのモデリングにおいて最も単純で情報量の多い方法の1つとして、この分野での標準となっており、通常はバイオマス反応を目的とする。FBAはネットワークを介して代謝フラックス値を予測する。FBAは特に、1つの最適解しか生成しないが、等しく有効な複数の最適条件が存在することは極めて一般的である。この概念は、フラックス変動解析と呼ばれるFBAの延長線上で検討されてきた。フラックス変動解析は、最適解を1つだけ選ぶのではなく最適解空間全体を調査するが、FBA結果の解釈を抑制する重要な注意点がある。
【0046】
場合によっては、少数の重要なパラメータを知っていることが、代謝および調節のダイナミクスを予測するのに十分であり得ることが示されている。
【0047】
代謝GENREは、インシリコ表現型とインビボデータのさまざまなセットを比較することに検証される場合が多い。モデルをどのように検証すべきかについての標準は存在しない。これは既存のモデルの検証における方法の分散した表現から明らかある。近年、インシリコとインビボの代謝表現型の間で予想される不一致のレベルを定量化するための努力がなされてきた。ある注目すべき研究では、S.セレビシエの465の単一遺伝子変異体が、それぞれ16の異なる増殖条件下で増殖され定量化された。公開されている2つのS.セレビシエ代謝GENREの性能の分析により、感受性(非必須遺伝子の総数に対して正確に予測した非必須遺伝子)は約95%、特異性(必須遺伝子の総数に対して正確に予測した必須遺伝子)は50~60%の間であることが明らかになった。これらの数は、さらなる分析で誤りであることが判明したいくつかのインビボ実験の失格によって、約95~98%および69~86%(それぞれ)と大幅に改善された。
【0048】
-Sheikhら(Biotechnol.Prog.21(2005)112-121)は、再構築した代謝ネットワークを開示した。アノテーションされたORFだけが再構築されたネットワークで説明された。追加の遺伝子産物は、文献の生化学的証拠に基づいて含められた。全遺伝子生成物から、特有の反応が定義された。輸送プロセスも、さらなる反応を説明した。輸送プロセスを数に入れない場合、最大の経路には、アミノ酸、炭水化物、およびヌクレオチド代謝が含められた。これらも炭素および窒素代謝の骨格を構成した。輸送反応のほとんどは、アミノ酸および炭水化物のプロトン結合輸送に関連している。輸送反応の多くは、生理学的考察に基づいて推測される。このようなネットワークは一般的であり、組織または細胞種間の違いを考慮していないことに注意することが重要である。
【0049】
バイオマス合成の代謝物の排出量は、バイオマス組成に関する文献で入手可能な情報に基づいて計算された。この情報は、ハイブリドーマを含むさまざまな細胞株を調査するさまざまな情報源から収集された。平均細胞組成が計算され、バイオマス方程式の各成分の要件を推定するために使用された:(単位は%、w/w)タンパク質、74.2;DNA、1.6;RNA、6.1;炭水化物、4.5;脂質、10.1。平均アミノ酸組成が構築された。コレステロールは、膜にかなりの量で存在することが知られているため、バイオマス方程式に含まれる唯一のステロイドであった。
【0050】
成長および非成長に関連するATP要件は、文献の推定値であるかまたは文献で入手可能な実験データから計算される。P/O比(電子伝達系によって運ばれる電子1molあたりに産生されるmol ATP)で表される酸化的リン酸化の効率は、文献データに基づいて2.5とされた。ATPに関する重合コストは、大腸菌に見出されるものと同じであると仮定された。つまり、以下の高分子の合成および処理のコストは、mol ATP/molで表して、タンパク質、4.3;RNA、0.4;およびDNA、1.4である。アミノ酸、リボヌクレオチド、およびデスオキシリボヌクレオチドの合計に、ATPのそれぞれのコストを乗算すると、合計コストは、29.2mmol/g DWと計算された。ATP収量(YxATP)および維持(mATP)は、総ATP生成量が、酸素取り込みおよび乳酸生成の関数として表され得ると仮定して、連続ハイブリドーマ培養から推定した。rATP=rlac+5*rO2、ここでrATPはATP生成速度であり、rlacは乳酸生成速度であり、rO2は酸素消費速度である。増殖速度、μを用いる維持エネルギーモデルの加重線形回帰:rATP=YxATP*μ+mATPは、mATPについて1.55mmol ATP/g DW/h、YxATPについて37.8mmol ATP/g DW/hの推定値をもたらした。したがって、成長関連維持ATPは、8.6mmol ATP/g DW/hと推定された。
【0051】
所与制約下でのインシリコ成長に必要な反応は比較的少なく、これは代謝ネットワークに含まれる柔軟性を反映している。これらは主に、主要な異化経路(解糖、TCAサイクル、およびPP経路)、ヌクレオチド代謝、および酸化的リン酸化に関与している。また、バイオマス前駆体の生合成経路での(主に脂質およびヌクレオチド代謝での)反応を削除すると、細胞は成長できなくなる。すべての細胞成分を考慮に入れると、必須反応の数は増加する。また、制御により、実際の細胞では代替経路が実現不可能になる場合がある。しかし、一般的なインシリコ細胞には、さまざまな細胞種の反応が含まれており、これは所与細胞で決して共存しない可能性がある。
【0052】
しかし、培養動物細胞は、大腸菌およびS.セレビシエに類似するオーバーフロー代謝を示し、中枢炭素代謝に共有性がある可能性を示唆する。
【0053】
動物細胞は、しばしば、高いグルタミン取り込み率、ミトコンドリアのグルタミナーゼによるアンモニアの放出、およびそれによりアラニンおよび/またはアスパラギン酸に生成されるグルタミン酸の部分酸化を特徴とするグルタミノリシスとして公知の第2の特徴を示す。その名前が示すように、グルタミノリシスは、乳酸の生成に似たエネルギー論を基準にして合理化されている。しかし、解糖とは異なり、グルタミノリシスは、TCAサイクルおよび酸化的リン酸化に依存してエネルギーを生成する。
【0054】
グルコース、酸素、およびグルタミンの取り込みは、実験で観察される速度に固定されるが、乳酸、アンモニア、グルタミン酸、アスパラギン酸、およびアラニンの取り込みは制約がないままであった。ネズミハイブリドーマはグルタミンを合成することができないため、グルタミンシンセターゼはモデルから除去された。同様に、ハイブリドーマ系統の必須アミノ酸の取り込みは、推定した生合成要求量と同一であり、異化作用がほとんどまたは全くないことを示すため、必須アミノ酸の異化作用反応は除去された。最後に、他の非必須アミノ酸(セリン、アスパラギン、グリシン、およびプロリン)の取り込み速度または生成速度は、モノクローナル抗体の生成速度と同様に実際の速度に固定された。これは、モデリングの人為的結果、例えば、主要な窒素基質としてのグルタミンの代わりにアスパラギンを使用することを防ぐために行われた。
【0055】
これらのシミュレーションでは、特に非必須アミノ酸の取り込みについて、複数の解が本質的に見出される。これらは多くの経路(例えば、解糖におけるセリン/グリシン、TCAサイクルにおけるアスパラギン酸/グルタミン酸/グルタミン/、グルタミノリシスにおけるアスパラギン/プロリン)で相互作用するため、非必須アミノ酸に関連するフラックス分布のいくつかの解によって目的関数を達成することができる。
【0056】
組換えタンパク質の生成は細胞の目的関数ではない可能性が高いとしても、理論上の生成速度と実験上の生成速度を比較することはなお重要である。さまざまな増殖速度のモノクローナル抗体の最大理論生成速度を計算し、実験によって決定した非成長関連値の0.0084mmol/g DW/hと比較した。これらのシミュレーションでは、必須アミノ酸は制約されていなかった。すなわち、それらはバイオマス要件を満たすために自由に取り込むことができた。炭素収支は、グルコースおよび非必須アミノ酸を制約することによって閉じられていた。窒素収支および酸化還元収支は、それぞれ、アンモニア生成速度および酸素取り込み速度を制約することによって閉じられていた。廃棄物代謝は大量の乳酸生成をもたらした。解糖とグルタミノリシスは、炭素とエネルギー代謝の両方において相互作用する。大量の解糖NADHは、乳酸デヒドロゲナーゼによって再酸化される。NADPHはグルタミノリシスに関与しており、グルタミノリシスでは、グルタミン酸デヒドロゲナーゼ酵によるグルタミン窒素のバイオマスへの同化でNADPHが生成される。NADHとNADPH代謝の相互作用は、トランスヒドロゲナーゼ反応(E.C.1.6.1.2)および両方の補因子を使用することが可能なアイソザイムによって起こる。
【0057】
-Selvarasuら(Biotechnol.Bioeng.102(2009)923-934)は、大腸菌iJR904のゲノム規模のインシリコ代謝モデルを使用した。これは、DH5a大腸菌株の挙動を模倣するようにわずかに変更された。このモデルは、762の代謝物(外部代謝物を含む)と932の生化学反応(輸送プロセスを含む)で構成されている。代謝フラックスを決定するために、Selvarasuらは、化学量論的制約(代謝物の物質収支)と熱力学的制約(反応の可逆性)を受ける代謝ネットワークモデルの制約ベースのフラックス解析を行った。測定されたすべての栄養素および生成物(グルコース、トレハロース、アミノ酸および酢酸を含む)の残留濃度プロファイルを前処理してそれらの比消費量または生成速度を計算し、その後、モデルの容量制約として指定した。酸素取り込み速度および二酸化炭素発生速度は制約されなかった。最後に、増殖期の細胞の目的である細胞増殖速度を、線形計画法(LP)を使用して最大化し、それによって最適な表現型に対応する一連の代謝フラックス分布が得られた。Selvarasuらは、スタンドアロン型のフラックス解析プログラムMetaFluxNetを使用してLP問題を解決した。指数増殖期の光学密度値(OD600)測定から得られた比増殖速度は、結果を検証するためのインシリコモデルによって予測された細胞増殖と比較された。
【0058】
発酵培養は、主にSelvarasuらによって、3つの異なる増殖期:高い増殖速度を特徴とする初期の指数増殖期(第1期、1~3時間)、後期の指数増殖期(第2期、4~6時間)および酢酸塩を主要な炭素源として消費する酢酸塩消費期(早期定常期;第3期、8~10時間)の間で調査された。インシリコフラックス解析は、3つすべての期で実施された。第1期および第2期の間に測定されたすべての栄養素の比消費速度がランク付けされた。
【0059】
Selvarasuらの知見は、アルギニン、セリン、グルコースおよびトレハロースなどの感受性の高い栄養素は細胞代謝の機能に重要な役割を果たすため、複合培地中でのこれらの正確な測定の必要性を強調する。そのような測定は、効率的な培地成分を設計するための重要な情報も提供する場合がある。
【0060】
フラックス分布に基づいて、細胞内での特定の代謝物の消費および生成を分析するために、特定の代謝物の周囲に流入または流出するすべてのフラックスの総和(フラックス合計)が計算された。
【0061】
Selvarasuらによって報告されたインシリコ代謝モデルは、細胞増殖速度をかなりよく予測したが、補充培地中の他の重要な代謝物を考慮することによって、予測はさらに改善することができる。また、このことは、複合培地条件下で細胞代謝を正確に評価するために、他の主要な代謝物を定義し、正確に測定する必要性も示している。
【0062】
早期定常期の表現型の状態および代謝挙動は、他の栄養素/生成物の増殖速度および消費/生成速度を実験値に制約しながら、ATPフラックスを最小化することによって最もよく特徴づけることができる。それにもかかわらず、結果として得られたシミュレートされた代謝フラックスは、シミュレートされた代謝挙動を、遺伝子発現プロファイルから得られる内部フラックスの変化と、または実験によって決定されたフラックスとを比較することによって、定性的または定量的に検証されなければならない。
【0063】
-Selvarasuら(Mol.Biosyst.6(2010)152-161)は、マウス代謝ネットワークのゲノム規模の再構築について報告した。マウスのゲノム規模の代謝ネットワークは、以前のモデルおよびさまざまなリソースからの関連情報に基づいて体系的に再構築された。
【0064】
マウス26の以前の一般的なモデルが、Selvarasuらによって出発点として検討された。最初に、モデルにおいて繰り返される反応または冗長な反応が特定され、除去された。次に、モデルのさまざまなシミュレーションを実行して、異なる炭素源からバイオマスを規定する各細胞成分を生成するその能力を検証した。これにより、Selvarasuらは、ネットワーク内の欠落しているリンクまたはギャップを見つけ出し、その後にいくつかのオンラインリソース(KEGG、RIKEN、MGI、BRENDA、およびExPaSy)および関連文献から得られた関連する酵素反応および輸送反応をハツカネズミ(M.musculus)に追加することによってそれらを埋めることができた。さらに、新しいオープンリーディングフレーム(ORF)およびGPRの関連に関する情報も含まれていたため、モデルの範囲は大幅に拡大している。
【0065】
Selvarasuらの再構築されたゲノム規模のマウスネットワークの視覚化および統計解析は、すべてネットワーク分析ソフトウェア、BioNetMiner(http://bio.netminer.com)を使用して実行された。大規模なマウスネットワークは、BioNetMiner埋め込みグラフレイアウトアルゴリズム、Force-Directed Kamada-Kawai、およびGEMによって効率的に視覚化され得る。その上、高度に連結された代謝物と架橋代謝物を、度数および媒介中心性をそれぞれ使用して特定することによって、ネットワークトポロジーを統計的に解析することができる。
【0066】
再構築されたゲノム規模の代謝ネットワークが化学量論的にバランスが取れていれば、制約ベースのフラックス解析を利用することにより、モデルの予測能力を定量的にも定性的にも調べることができる。最初に、細胞増殖期の定常的な仮定の下では、細胞のバイオマス生成は、細胞増殖表現型を定量化するために最大化される、妥当な細胞の目的として考えることができる。次に、得られる増殖速度を実験的に観察された比増殖速度と比較する。その後、最少培地要件および遺伝子欠失解析をシミュレートすることにより、モデルを定性的に評価することができる。最小栄養成分は、培地から消費されたすべての基質の総和を最小化することによって決定することができる。決定された最小培地条件下で、細胞増殖を最大化し、各反応フラックスをゼロになるように制約した。反応および対応する遺伝子は、除去するとゼロ成長となった場合に、必須であると見なされた。同様に、細胞増殖条件下で各代謝物のフラックス合計を強制的にゼロにすることにより、必須代謝物を同定することができる。最後に、マウスの代謝の機能的構成は、遺伝子/代謝物の必須性と、ネットワークの構造的特徴とのその相関に基づいて調べることができる。これらの線形最適化の問題はすべて、MetaFluxNetおよびGAMS/CPLEX 10.0によって解決された。
【0067】
マウス26の以前のモデルと比較して、Selvarasuらは新しく490の反応を追加し、遺伝子-タンパク質反応(GPR)関連に関する最新情報と、脂質、アミノ酸、炭水化物およびヌクレオチドの代謝に関する詳細な説明を提供した。このモデルは、724の遺伝子、715の酵素、1162の内部代謝物、および1494の反応で構成され、1246の反応はサイトゾル(1085)およびミトコンドリア(161)内の生化学変換であり、248の反応は、細胞内膜と細胞外膜間(171)およびサイトゾルとミトコンドリア間(77)の代謝物輸送を説明する交換反応である。生化学反応に加えて、Selvarasuらは、タンパク質、脂質、炭水化物、DNA、RNA、および他の細胞成分のような生合成前駆体のドレインからの細胞バイオマスをその実験組成およびそれらの変換および構築のための関連するエネルギー補因子で表現するための1つのバランス式を導出した。再構築プロセスの間に、シミュレーション結果が定量的にも定性的にも実験的観察と一致するまで、モデルの一貫性、正確性、完成度をチェックすることにより、結果として得られるネットワークの手動キュレーションが反復的に実行された。これにより、Selvarasuらはモデルを改良するための知識ギャップを見出すことができた。
【0068】
マウスモデルの予測能力は、プロリン、アスパラギンおよびアスパラギン酸を添加したDMEM培地で増殖させた、抗Fモノクローナル抗体を産生するマウスハイブリドーマ細胞のバッチ培養データに基づく制約ベースのフラックス解析を使用して試験された。バイオマス生成は、培養中の栄養素/生成物の測定された比消費/生成速度を制約する細胞増殖条件をシミュレートするために最大化された。得られた増殖速度(0.048h-1)は、バッチ培養全体の平均比増殖速度(0.0362h-1)よりも高かった。Selvarasuらは、インシリコシミュレーションに関連する測定値を使用して、指数増殖期のより現実的な運用条件を反映させることで、増殖予測を改善することができると考えた。
【0069】
定性的モデル予測のために、Selvarasuらは、細胞増殖のための最小培地要件についてインシリコ解析を行い、最終的に必要な培地成分を特定した。Selvarasuらは、必須アミノ酸、葉酸およびリン酸を含めた。これらは実験的に観察された必須成分および実験動物の栄養要件とほぼ一致する。しかし、インシリコ解析では、一部の最少培地成分、例えば増殖因子、補因子、およびミネラル(ビオチン、チアミン、ビタミン、カルシウムおよびマグネシウムイオンなど)などを特定することができなかった。当然のことながら、予測されたマウス細胞の増殖は、グルコースの取り込みだけの影響を直接受けたわけではなかった。代わりに、それは必須アミノ酸の取り込みによって決定されたため、グルコースが不足しているか制限されている条件下では、微生物細胞とは違って、哺乳動物系は必須アミノ酸のような他の栄養素を利用することによって生き残ることができるという以前の観察が確認された。
【0070】
遺伝子必須性解析によっても、Selvarasuらは、新しいマウスモデルを反復的に検証し、改善することができた。現在および以前のモデルを使用して予測されたすべての必須遺伝子は、KOMP(KnockOut Mouse Project)データベースの実験によって報告された必須遺伝子と比較された。ほとんどのインシリコ必須遺伝子は実験によって確認されたが、Selvarasuらは、いくつかの誤検出予測も見出した。このような情報をモデルに新たに含めて、予測を改善することができる。
【0071】
再構築されたモデルの特徴的な機能は、構造的および機能的な観点から調査された。まず、統計的ネットワーク分析により、弱い連結反応の大規模クラスター(全反応の89%)と、1~17の連結反応を有する119の小さなクラスターが特定された。次に、Selvarasuらは、ネットワークの直径を計算し、一方、補因子代謝物(例えば、ATP、HO、COなど)は、ネットワークの主要なハブとしてそれらを特定する生物学的に無意味な結果を防ぐために除外された。結果として得られた、大規模クラスターのネットワークの直径は40と測定された。平均経路長(APL)も8.51と計算され、ネットワーク内の代謝物のほとんどが、ほぼ3B4の反応によって相互間で変換され得ることが明らかになった。同様の分析が、以前のモデルから大幅に改善された3つの主要なサブネットワーク、炭水化物、アミノ酸および脂質代謝について行われ、その結果さまざまなネットワーク直径およびAPLが得られた。
【0072】
Selvarasuらは、代謝物の度数および媒介中心性を計算することによりネットワークトポロジーも調査し、したがってネットワーク内の高度に接続された重要な(橋渡しの)成分を特定した。Selvarasuらは、必須代謝物とその中心性スコアを比較することによりネットワークのトポロジー特性をさらに調査した。細胞増殖の必須代謝物は、フラックス合計アプローチを使用して得られた。必須代謝物の平均中心性スコア(度数:6.37および媒介中心性:0.00198)は、非必須代謝物のスコア(度数2.55および媒介中心性:0.00039)よりもはるかに高いことが観察された。予想外に、代謝物の中心性は代謝物の必須性と明確に相関していなかった。
【0073】
Selvarasuらは、限定培地での細胞増殖用の一連の必須遺伝子を特定した。最初に、単一遺伝子反応の関連は、富栄養培地(RM)ならびに最小培地(MM)条件下で遺伝子欠失解析を実行することを想定した。RM条件下の109の必須反応のうち、93は遺伝子関連、6は非遺伝子関連、10はアミノ酸の輸送のための反応であった。興味深いことに、必須反応のうち最も高い割合(59%)は脂質代謝(脂肪酸生合成および脂肪酸代謝)によるものであり、それが環境外乱に対して最も脆弱なサブシステムの1つでありうることが示されている。MM条件下でのさらなる6つの反応は、アミノ酸(5)および炭水化物(1)の代謝によるものである。GPRの関連を考慮した場合、現在のゲノム規模のモデルには多くのアイソザイムおよび多機能タンパク質が存在するため、72の必須遺伝子のみが特定された。例えば、多機能タンパク質の一つである脂肪酸シンターゼ(fasN)は、単独で脂質代謝の37の反応を触媒したが、他の遺伝子またはタンパク質は、代謝ネットワークの少なくとも2以上の反応に関連している。
【0074】
必須反応の割合(10%)が低いということは、マウスの代謝が、代替経路によって同じ表現型を得るために内部変化に対して非常に柔軟で頑健であることを意味し、それにより、2つの反応/遺伝子が必須でなくなり、ネットワークが柔軟になる。このような組合せ遺伝子/反応を調査する観点で、Selvarasuらはダブルノックアウト解析を行った。9.5*10組以上の1385の非必須反応から、Selvarasuらは114の特有の反応を含む139組の致命的な反応しか特定することができなかった。最も必須な組は次の2つのカテゴリーに属する:(i)同じ代謝物を生成する2つの反応、および(ii)同じ代謝物を生成し消費する後続の2つの反応。同様の分析がうまく適用され、H.ピロリの機能的特徴が解明された。その結果、細胞の頑健性が実証され、創薬ターゲットを特定するための複数の欠失解析が示唆される。
【0075】
本発明を実証するために使用される例示的なモデル(以下の実施例の項の材料および方法を参照)では、中心代謝経路(解糖、クエン酸サイクル、ペントースリン酸経路、呼吸鎖)に加えて、主要なバイオマス構成要素(タンパク質、脂質、RNA、DNA、炭水化物)の生合成、C-代謝、およびアミノ酸分解経路が含まれている。組換えタンパク質生成物形成の調査のために、組換えタンパク質のアミノ酸組成および代表的なグリコシル化構造(生成物分子あたり2つのシアル酸付加された(sialilated)二分岐グリカン)を説明する、対応する一組の生成物形成反応を定式化した。結果として得られたモデルは、654の反応、583の代謝物を含み、266のORFを表した。バイオマス組成は、CHO細胞またはマウス細胞株に関する以前の研究に匹敵するものが選択された(例えば、Altamiranoら,Biotechnol.Prog.17(2001)1032-1041;Bonariusら,Biotechnol.Bioeng.50(1996)299-318;Selvarasuら,Biotechnol.Bioeng.109(2012)1415-1429)。
【0076】
モデルの再構築およびモデルのシミュレーションは、市販のソフトウェアパッケージを使用して実行された。モデルの検証では、元素収支および電荷収支がすべての反応で閉じられていることが確認された。さらに、フラックスバランス解析(例えば、SavinellおよびPaulson,J.Theor.Biol.154(1992)421-454および455-473参照)を使用して個々の経路の機能性が検証された。CHO発酵中に収集された時系列の転写データは、ネットワーク内の(不)活性代謝経路を描写するのに役立ち、優勢なアイソザイム種の特定を支援した。
【0077】
細胞の取り込み速度および生成速度の推定は、最初に発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行された。これは、例えば、プロセスフェーズの最適な数がχベースの適合度検定を使用して決定される、計算最適化手順によって実行され得る。各プロセスフェーズの間に、一定の細胞生理が想定され、バイオマス特異的速度が一定であることを意味していた。これらのバイオマス特異的速度は、非線形回帰を使用して決定された。結果として得られる取り込み速度および生成速度は、代謝フラックス解析を実行するための入力として役立つ場合がある(例えば、Maierら,Biotechnol.Bioeng.100(2008)355-370;Niklasら,Curr.Opin.Biotechnol.21(2010)63-69;Stephanopoulosら,1998,Metabolic engineering:Principles and methodologies.San Diego:Academic Press参照)。計算されたフラックス分布の熱力学的一貫性が確認された。
【0078】
代謝物データ、プロセスデータ、および細胞内フラックス分布のピアソン相関とスピアマン相関の計算は、市販のソフトウェアパッケージ(以下の実施例の項の材料および方法を参照)を使用して実行された。
【0079】
本発明の実施形態
機構的代謝モデリングは以下の場合に有用であり得る:
- 高産生クローンの効率的かつ迅速な選択/評価、
- 培地組成、供給体制、およびプロセスパラメータの調節/最適化による体積力価の増加、
- 培地組成、供給体制、およびプロセスパラメータの調節/最適化による生成物の質の向上、および/または
- 高スループットデータおよび圧縮の、読み取りおよび解釈可能な形式への統合。
【0080】
機構的モデリングにより、細胞内代謝フラックス(MFA)およびその最適化(FBA)の時間分解能および分析が可能になる。機構的モデリングの全体的な目標は、自動化されたCHO細胞性能分析のための高スループット方法であり、それによりプロセスの最適化および/またはクローンの選択が可能になる。
【0081】
しかし、この方法では、有用かつ信頼性の高い結果/読み出しを得るために、信頼性が高く一貫した入力(未加工)データが必要である。
【0082】
今回、本発明者らが見出したのは、機構的代謝モデリングは、次のような高スループット培養データの品質管理にも使用することができることである。
- 培養実行中の技術的な問題、例えば、プローブのシャットダウン、センサドリフト、パイプの詰まり、インプロセス制御解析エラー、オフライン解析エラー、培地調製の問題などの特定、
および/または
- プロセス制御における前処理/データ一貫性のチェック。
【0083】
したがって、本発明は、任意のインプロセスおよび最終培養データについて、効率的で、一貫性があり、場合によりユーザーに依存しないデータ一貫性チェックのための方法を含む。本発明による方法は、高スループット用途に特に適している。
【0084】
ここでは、一般的なモデル、すなわち、例えば、インライン、アットラインおよびオフラインのさまざまな異なるデータからの発酵データの効率的なデータ統合ならびに解釈および/またはデータ解析のポイントとして、すべてのCHOクローンおよびCHOベースのプロセスならびに大腸菌クローンおよび大腸菌ベースのプロセスに使用することができるモデルの使用が報告されている。このモデルは、データのクロスチェックが可能であり、データの自由度を低下させる(「その値は意味があるか?」)。データの不適合度(lack-of-fit)は、破損した/不一致のデータソース(複数可)(例えば、欠陥センサ、欠落データ、ヒューマンエラーなど)を特定するために使用される。これにより、より信頼性が高く、より効率的かつ迅速な高産生クローンの特定および/または選択および/または評価のための機構的代謝モデリング;培地組成、供給体制、およびプロセスパラメータの調節/最適化により体積力価を増加させるためのスクリーニングプロセス;培養中の技術的問題の特定(例えば、プローブのシャットダウン)、IPK分析;高スループットデータおよび圧縮の、読み取りおよび解釈可能な形式への統合;信頼性の高い知識の生成;または/およびプロセス制御における前処理/データ一貫性チェックを使用することが可能になる。
【0085】
一例では、すべて同じ組換えモノクローナルIgG4抗体を安定して発現する、さまざまなCHO-K1細胞クローンが使用された。包括的な代謝プロファイリングを実行するために、培地を毎日サンプリングした。
【0086】
培養全体にわたる代謝細胞の性能を詳細に評価するために、CHO代謝ネットワークモデルが用いられた。各培養は、以下の表1に示されるように、生理学的および代謝的に異なる5つのプロセスフェーズ、第1期(Ph1)から第5期(Ph5)に細分化された。細胞取り込みおよび生成速度は、実施例1に記載されるように決定された。
【0087】
(表1)例示的な代謝モデルに用いられた宿主細胞株(HCL)および組換えCHOクローンの代謝フェーズ。HCLおよび組換えCHOクローンの異なる代謝フェーズが特定された(HCLおよび10クローン、3データセット)。
【0088】
このステップには、供給およびサンプリングイベントを含むプロセス全体の物質収支が含まれていた。各プロセスフェーズについて、細胞内フラックス分布を、ネットワークモデルを使用して計算した。細胞生理学の経時的変化を考慮し、エンドポイントデータのみに依存しないことにより、これは各細胞/クローン/フェーズの包括的な特徴づけをもたらした。
【0089】
正規化されたスコアを使用することにより、指標の種類(細胞外濃度測定、取り込み速度、細胞内フラックスなど)を組み合わせたスコアリングスキームに統合することができる。その上、時系列データの入手可能性に基づいて、個々の指標の最も関連性の高いプロセスの部分での定量化は、経時的なスコアを割り当てることによって可能となった。例えば、速い細胞増殖はプロセスの早い段階でより重要であると点数が付けられたが、高い比生産性は6日目以降、すなわち、高い細胞数が確立され、生成物形成の大部分が行われた後に特に注目された。
【0090】
合計で約40の異なる指標が定義され、組換えタンパク質とバイオマスの形成および代謝効率に関するCHO細胞とクローンの代謝性能が特徴づけられた(以下の表2を参照)。
【0091】
(表2)定義された代謝性能の指標。CHOネットワークモデルによって計算された選択された代謝性能パラメータをクラスタリングすることにより、6つの代謝性能基準がCHO代謝の主要な特徴として定義された:「生成物形成」、「細胞増殖」、「乳酸形成」、「アンモニウム形成」、「代謝クローン効率」、および「呼吸」。ランク順は、性能指標の高レベル(「1」)または低レベル(「0」)のどちらが優先されるかを示す。
【0092】
関心のある特定の形質は、2以上の指標(例えば、ハイエンドの力価および高い比生産性の両方が優れた生産クローンに望ましいであろう)によって特徴づけられたため、関連する指標は、異なるカテゴリー:生成物形成、細胞増殖、乳酸形成、アンモニウム放出、呼吸代謝、および代謝クローン効率に分類される。
【0093】
クローンの特性評価に適したモデルは、いくつかの要件を満たす必要がある。(i)性能判定基準のためのクローン間の高感度の識別、(ii)クローン形質の包括的な特徴づけ、および(iii)培養実行の通常の変動を平準化するための評価手順の頑健性。
【0094】
第1の目的に関して、生成物力価および細胞増殖は、クローン性能の高感度の尺度として日常的に機能している。変動係数を分散の尺度として使用すると、「代謝クローン効率」のカテゴリーも高感度のクローン特徴づけ基準に貢献したが、乳酸形成および呼吸代謝はあまり情報価値がなかった。それにもかかわらず、それらは、特に大規模でプロセス性能に大きな影響を与える細胞特性を反映するため、包括的なクローンの特徴づけに貢献する。
【0095】
細胞外代謝物データならびに細胞内フラックス分布は、生成物力価、生存細胞密度の積分(IVCD)、および比生産性だけでなく、バイオマスおよび生成物形成の炭素収量、細胞内グルタミンシンセターゼの速度、および維持のための予測ATP要件をはじめとする代謝細胞性能の事前に定義された尺度を計算するのに役立った。
【0096】
したがって、このモデルは、CHO培養の詳細な代謝分析を利用した経験に基づいている。これは、組換えCHOクローンおよびプロセス変動の機構的特徴づけおよび同定のための統合的なマルチレベルワークフローである。より具体的には、このモデルは、シェーカーフラスコまたはマルチウェルプレートでの小規模培養に適用可能である。同様に、制御された多重小規模バイオリアクターおよび詳細な高スループット分析を、プロセスパラメータ、主要な代謝性能マーカー、および重要な生成物の品質特性を決定するために使用することができる。
【0097】
本発明では、代謝ネットワークシミュレーション環境が、CHOクローンの特徴づけおよび高スループットデータ検証に適用される。
【0098】
ひとたび確立され、インシリコで細胞プロセスをミラーリングするために適切であることが証明された、細胞外測定値(例えば、2-オキソグルタル酸塩、5-オキソプロリン、酢酸塩、β-アラニン、β-D-グルコース、β-メチルノルロイシン、バイオマス、酪酸塩、コリン、クエン酸塩、CO、D-グルコン酸塩、D-マンノース、エタノールアミン、蟻酸塩、フマル酸塩、GABA、グリシン、H2S、カリウム、L-アラニン、L-アルギニン、L-アスパラギン、L-アスパラギン酸塩、L-シトルリン、L-システイン、L-シスチン、L-グルタミン酸塩、L-グルタミン、L-ヒスチジン、L-イソロイシン、L-乳酸、L-ロイシン、L-リジン、L-メチオニン、L-オルニチン、L-フェニルアラニン、L-プロリン、L-セリン、L-トレオニン、L-トリプトファン、L-チロシン、L-バリン、ミオ-イノシトール、N-アセチルプトレッシン、N1-アセチルスペルミジン、N1-アセチルスペルミン、N8-アセチルスペルミジン、ナトリウム、O、リン酸、オルトリン酸、生成物、プトレシン、ピルビン酸塩、スペルミジン、スペルミン、コハク酸塩、硫酸塩、ウリジンなど)に基づいて細胞内生化学反応をシミュレートするために使用される同じ機構的モデルは、新しい培養データセットのプロセス中に記録されたデータの検証または/および一貫性チェックに使用することができることが見出された。
【0099】
既存の代謝モデルを使用してフィッティングされた高スループットスクリーニング(HTS)インプロセスデータは、モデルフィットの質の偏差が不規則に大きいこと、すなわち、モデルに基づいて計算されたフィッティングされた線が実験データから大きく逸脱していた、すなわち、不良にフィッティングされたことを示した。このような不良なフィットには、クローンの分散、データの(不)一貫性、技術的な問題など、さまざまな理由が考えられる。
【0100】
これらの理由のうち、技術的な問題が最も危険であり、それによって潜在的に適しているクローンが廃棄される。とりわけ、技術的な問題は、例えば、オフガス(CO、O)が発生しない、培養中のpHセンサのドリフト、パイプが詰まっていてポンプが作動しているにもかかわらず供給が追加されない、デブリが測定されていない、代謝物(例えば、有機酸およびその前駆体、ポリアミンおよびその前駆体、糖類およびその前駆体、活性化糖類およびその前駆体、ヌクレオチドおよびその前駆体、ヌクレオシドおよびその前駆体、酸化還元等価物およびその前駆体、酸化還元活性化合物およびその前駆体、脂質およびその前駆体、内因性宿主タンパク質など)が測定されていない、サンプル図面がない、バイオマスまたは代謝物の測定が不正確である、誤った値になる解析誤差などであり得る。
【0101】
図1では、不完全な供給データに起因する例示的な技術的問題の影響が示される。図1Aでは、不完全な供給データに基づく培養の分析が示される。図1Bでは、完全な供給データによる同じ培養の分析が示される。不完全なデータのために、結果として得られる、代謝モデルに基づくフィットが不良であることがはっきりと分かる(不良なモデルフィットは、モデル化されたフィット(線)と未加工データ(箱)のオフセットで示される)。データを疑ったり確認したりするまでもなく、これは、それぞれのクローンがうまく動作していないことを示唆する。しかし、実際にはデータ入力に誤りがあった。すなわち、間違ったグルコース濃度が入力されていた。データの一貫性についてデータのチェックが実行されないならば、この問題は発見されないことになる。
【0102】
一般に発酵データセットは2週間に及び、オンラインの約15のパラメータおよびオフラインの約30のパラメータの毎日のデータポイントを含む。このプロセスデータセットは、細胞クローンの生物学的分散ならびに用いる装置および培養方法のプロセスの分散の影響を受ける。
【0103】
生物学的分散は、例えば、バイオマス蓄積、生成物形成(速度)、栄養消費(速度)、廃棄物形成(速度)、または細胞生存度の頑健性におけるクローン間の差異が原因である。
【0104】
プロセスの分散は、許容範囲内での技術的変動、例えば、開始濃度、容器サイズ/形状、温度、撹拌速度および均一性、ガス化、供給、質量/体積バランス、その上/補正剤の添加/量などの技術的変動を反映している。
【0105】
生物学的および技術的分散の組合せは、プロセスデータに反映される。
【0106】
信頼性の高い代謝モデルの生成には、広範囲のクローン、生成物、規模、データ密度、宿主細胞株、および培養プラットフォームで得られた入力データが使用される。
【0107】
データの質の評価に使用される例示的なデータセットが以下の表3に示される。
【0108】
(表3)モデル開発のための51の異なる培養実験(バッチ)の概要表。「HCP」:宿主細胞タンパク質;「+」:データあり;「-」:データなし;「na」:宿主細胞株(複数可)が生成物を生成していないため、該当しない。
【0109】
上の表に示すような再現を用いて、モデルを訓練し、採用した。これにより、不一致のある実行を特定することが可能であった。分析は、図2の実行9、14、および51について例となるように示されている。
【0110】
発酵51は、一部のデータポイントが1:1の線からずれていることから、モデルと矛盾していることがわかる。この1:1の線からのオフセットは、それぞれのパラメータのデータの一貫性が悪いことを示している。
【0111】
この分析は、複数の発酵のために再度行われている。それぞれのデータおよびその相関関係を図3に示す。高いχ(カイ^2)値>5または0に近い値(例えば、<0.1)である発酵は、それぞれの使用されたモデルバリアントで失敗した。特定の実行は、培養されたクローンに基づくのではなく、実験的技術的欠陥に基づく不一致を示すことが分かる。
【0112】
この説明に限定されるものではないが、一部の不一致は、データポイントの数が限られていること(培養フェーズごとに3未満、または全体で6未満)、オンラインまたはアットラインの分析装置の技術的な問題、あるいはオフガス分析によるHCP(宿主細胞タンパク質)またはOUR(酸素取り込み速度)の決定のエラーが原因である。
【0113】
本発明による方法は、不一致の、すなわち間違った入力データを特定するために使用することができる。これは、誤ったオフガス測定により、実験とモデル予測との間に偏差が生じた、以下の実施例に示される。
【0114】
カイ値は、それぞれのパラメータのモデルと実験の間のフィットの質を決定するために使用される。この分析により、1つを除くすべてのシナリオで、カイ値が同じ範囲にあることが明らかになった。例外的なシナリオでは、酸素取り込みの測定値は解析に含まれていた(表4参照)。これらのデータの不適合度は、根本的な理由を特定することによって解決することができ得る。この不一致を解決した後、カイ値は、調査したすべてのシナリオで許容可能であった。
【0115】
(表4)シナリオごとに分析されたカイ値の中央値。シナリオ「モデル1」には、誤っている精選されたOURデータを含むデータセットが使用された。他のすべてのシナリオでは、精選されたOURデータセットが使用された。
【0116】
OURデータが間違っているシナリオ「モデル1」のカイ値から、モデルと実験との間に不良なフィットがあることが分かる。修正データを使用した場合に、許容可能なモデルフィットが得られる。
【0117】
酸素は動物細胞の代謝における重要な基質である。酸素取り込み速度(OUR)は細胞の活性の優れた指標であり、一部の条件下でも生細胞の数の優れた指標であることが報告されている。OURの測定は多くのさまざまな理由で困難である。特に、比消費速度が非常に低いこと(0.2×10-12mol細胞h-1)、溶存酸素濃度の変動に対する細胞の感受性、および細胞を損傷することなく酸素を提供することの困難さは、OURの測定方法の開発のために考慮に入れなければならない問題である。液相かまたは反応器全体の周囲のいずれかの酸素収支に基づく、溶存酸素の濃度が変わりやすいかまたは安定しているさまざまな溶液が報告されている。OURを決定するために、次の2つのアプローチのうちの1つが一般に使用される。酸素物質収支を書くために、反応器全体(方程式(1))または液相のみ(方程式(2))を考慮することが可能である:
(Ruffieux,P-A.ら,J.Biotechnol.63(1998)85-95参照)。
【0118】
したがって、OURは直接測定可能な値ではない。これはさまざまな追加の変数に依存し、計算を必要とする。
【0119】
現在のケースで入力データを見直すことにより、計算に使用された数式に誤り(間違った因数1000)が含まれていたことがわかった。本発明による方法に基づいてそれを同定した後、データを精選された式で再処理し、表4(上記参照)に示されるように改善されたカイ値が得られた。
【0120】
本発明による方法は、一方では、上記で概説したようにデータ生成中の技術的および運用上の問題を特定することができ、また、入力データおよび計算データの正確性を検証することもできる。これにより、決定されたデータが実際にはそれぞれのクローンの特性、すなわちその表現型であり、技術的または運用上のエラーによるものではないことが確認される。これは以下の例に示される。
【0121】
2つのクローンを同じ培養条件下で培養した。生細胞密度はクローン1とクローン2の間で同等であったが(図4A参照)、培養培地中の乳酸濃度は異なっていた(図4B参照)。ここで、クローン2で観察された低い乳酸レベルが信頼できるかどうか、したがってクローンの遺伝子型/表現型の特性が信頼できるかどうかが疑問視される可能性がある。本発明による方法を使用することにより、第2のクローンの表現型が技術的な逸脱または問題によるものではなく、データによって正しく反映されていることを確立することができる。これは、対応する代謝モデルを使用する分析によって例証される。すべての代謝フェーズ1~5の良好なモデルフィット(調整された速度とブラックボックス速度が一致、図5参照)は、測定された速度の実現可能性を示している。低レベルの乳酸は、機構的代謝モデリングによって有意義に説明することができる。
【0122】
したがって、本発明は、
- 細胞クローンを選択/評価する、
- 培地組成、供給体制、およびプロセスパラメータの調節/最適化により細胞クローンの体積力価を増加させる、
- 培地組成、供給体制、およびプロセスパラメータの調節/最適化により生成物の質を向上させる、
- 培養の実行またはインプロセス制御分析中の技術的問題を特定する、
- プロセス制御における前処理/データ一貫性をチェックする
ための方法を含む。
【0123】
これらの方法の本質的な要素は同じである:それぞれの細胞株の機構的モデルへのフィットを使用してデータセットを制御する。
【0124】
本発明の目的は、本明細書に概説されているように、独立した請求項および態様に規定される、培養プロセスデータが技術的問題による影響を受けているかどうかを判定するための改良された方法を提供することである。本発明の実施形態は従属請求項に記載されている。本発明の実施形態は、相互に排他的でなければ、互いに自由に組み合わせることができる。
【0125】
細胞を培養する間、例えば副生成物を生成するために、経時的な、すなわち時間的なプロセスデータが取得され、アーカイブされる。このプロセスデータは、オンラインおよびオフラインの時間的プロセスパラメータの合計である。したがって、プロセスデータは、それぞれのプロセスパラメータおよび結果変数、例えば特定の速度などの時間力学を反映する。結果変数は、例えば、変形、正規化、統合、および欠測値の計算を伴う前処理ステップで取得される場合が多い。
【0126】
培養装置は、一般に自動制御システムおよびデータロギングシステムを備えており、これにより、取得したプロセスデータはオンラインで電子的に記録され、アーカイブされる。取得したオンラインプロセスパラメータには、制御パラメータおよび制御動作パラメータが含まれる。制御パラメータには、溶存酸素(DO)、pH、および特定のレベルに制御される容器温度(例えば、37℃の容器温度)などのパラメータが含まれるのに対して、制御動作パラメータには、コントローラーの応答、DOを制御するための空気および酸素の散布速度、ならびにpHを制御するための塩基添加および二酸化炭素散布速度などのパラメータが含まれる。容器容積およびオーバーレイガス流量などの他の重要なパラメータもオンラインで取得される。体積酸素取り込み速度(OUR)は約4時間ごとに推定されるが、他のすべてのオンラインパラメータは、数日間続く実施の全期間にわたってほぼ連続的に(少なくとも毎日、数秒に1回まで)取得される。値が連続しているこれらのパラメータに加えて、さまざまな弁の状態のような「離散」パラメータがある。これは、多くの場合、バイナリ(「オフ/オン」状態)である。これらの弁は、特に、接種材料、培地、塩基、消泡剤、およびガス散布を追加するためのさまざまなポートを制御する。さらに、栄養素の消費および代謝物の生成に関連するいくつかのパラメータは、バイオリアクターから定期的にサンプルを引き出すことによりオフラインで測定される(例として以下の表5参照)。パラメータには、物理的および状態パラメータ、化学的パラメータ、および生理学的パラメータが含まれる。オフラインパラメータのサンプリング周波数の違いのために、すべてのオフライン測定値は、線形補間法を使用して前処理することができる(例えば、Charaniya,S.ら,J.Biotechnol.147(2010)186-197参照)。
【0127】
(表5)細胞培養中の一部の従来のオフライン、アットラインおよびインラインで測定されたパラメータの概説。
【0128】
一態様では、本発明は、以下のステップを含む、細胞クローンの培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法を提供する。
- 場合により、哺乳動物細胞クローンまたは細菌細胞クローン(組換え異種ポリペプチドを発現)の代謝モデルを提供するステップ、
- 場合により、組換え異種ポリペプチドを発現している哺乳動物細胞クローンまたは細菌細胞クローンの培養のためのプロセスデータを取得するステップ、
- 組換え異種ポリペプチドを発現している哺乳動物細胞クローンまたは細菌細胞クローンの培養中に取得したプロセスデータを、同じ組換え異種ポリペプチドを発現している同じ哺乳動物細胞または細菌細胞に対して生成された代謝モデルを使用してフィッティングするステップ、および
- モデル化されたフィットが未加工データに対して10%を超えるオフセットを示す場合に、培養が問題による影響を受けていると判定するステップ。
【0129】
一態様では、本発明は、以下のステップを含む、細胞クローンの培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法を提供する。
- 細胞クローン培養のプロセスデータを受け取るステップであって、細胞クローンが前記細胞に対して異種のポリペプチドを生成するステップ、および
- 前記細胞に対して確立された代謝モデルを使用してデータをフィッティングし、完全フィットを表す値1を用いる統計的相関法によって、好ましくはピアソンのカイ二乗検定によって決定されたカイ値によって、フィットを特徴づけるステップであって、
これにより、相関値(カイ値)が5よりも大きい場合に、プロセスデータが問題による影響を受けているステップ。
【0130】
一態様では、本発明は、異種ポリペプチドを発現している(および生成している)細胞クローンを選択するための方法を提供し、該方法は、以下のステップを含む:
a)同じ異種ポリペプチドを生成する多数の(単離されたまたは単一の)細胞クローンを別々に培養し、それにより培養中に時間的なプロセスデータが記録されるステップ、
b)同じ細胞に対して作製された代謝モデル(場合により同じ組換え異種ポリペプチドを発現する)を使用して、各クローンのステップa)で取得したプロセスデータを個別にフィッティングし、それにより、すべてのクローンに同じモデルが使用されるステップ、
c)前記代謝モデルにおいてステップa)で取得した前記培養のプロセスデータに対してステップb)で得られたフィットが(i)未加工データに対して10%を上回るオフセットを示すか、または(ii)フィットに対する、統計的相関法で決定された相関値、好ましくはピアソンのカイ二乗検定によって決定されたカイ値が5以上であり、値1が完全フィットである場合に、ステップa)の多数の培養のうちのある培養が問題による影響を受けていると決定するステップ、
d)ステップc)で決定されるように培養で問題があった細胞クローンを用いて、ステップa)からc)を繰り返すか、
または
ステップc)で決定されるように培養で問題のあるクローンがない場合、多数のクローンの中から、(i)最大の力価、および/または(ii)生成物の質、および/または(iii)代謝性能指標値の組合せの中での最大スコアを有するクローンを選択するステップ(実施例4参照)。
【0131】
一態様では、本発明は、異種ポリペプチドを発現している(および生成している)細胞のための改善された培養条件を特定するための方法を提供し、該方法は、以下のステップを含む:
a)異種ポリペプチドを生成または分泌する哺乳動物細胞または細菌細胞を培養条件の第1のセットで培養し、それにより、培養中に時間的なプロセスデータが記録されるステップ、
b)同じ哺乳動物細胞または細菌細胞に対して作製された代謝モデル(場合により、生成された同じ組換え異種ポリペプチドを発現する)を使用して、ステップa)で取得したプロセスデータをフィッティングするステップ、
c)前記代謝モデルにおいてステップa)で取得した前記培養のプロセスデータに対してステップb)で得られたフィットが(i)未加工データに対して10%を上回るオフセットを示すか、または(ii)フィットに対する、統計的相関法で決定された相関値、好ましくはピアソンのカイ二乗検定によって決定されたカイ値が5以上であり、値1が完全フィットである場合に、ステップa)の培養が問題による影響を受けていると決定するステップ、
d)i)ステップc)で決定されるように培養に問題があった場合には、培養条件の第1のセットを用いてステップa)からc)を繰り返すステップ
または
ii)ステップc)で決定されるように培養に問題がなかった場合には、培養条件の第1のセットとは異なる培養条件の第2のセットを用いてステップa)からc)を繰り返すステップ
e)i)培養条件の第2のセットで得られた(i)力価、および/または(ii)生成物の質、および/または(iii)代謝性能指標値の組合せのスコアが、培養条件の第1のセットで得られた(i)力価、および/または(ii)生成物の質、および/または(iii)代謝性能指標値の組合せのスコアと比較して改善されていない場合に、第1の培養条件の同じセットと、以前に使用されたどんな培養条件のセットとも異なる(すなわち、それは前記第1および前記第2の培養条件のセットとも、以前の方法で使用された他のすべての培養条件のセットとも異なる)第2の培養条件の新しいセットを用いてステップa)からd)を繰り返すか、
または
ii)培養条件の第2のセットで得られた(i)力価、および/または(ii)生成物の質、および/または(iii)代謝性能指標値の組合せのスコアが、培養条件の第1のセットで得られた(i)力価、および/または(ii)生成物の質、および/または(iii)代謝性能指標値の組合せのスコアと比較して改善されている場合に、培養条件の第2のセットを改善された培養条件として特定するステップ。
【0132】
すべての態様および実施形態の一実施形態では、問題は技術的な問題である。
【0133】
すべての態様および実施形態の一実施形態では、異種ポリペプチドを分泌する哺乳動物細胞または哺乳動物細胞クローンは、異種ポリペプチドをコードする核酸を哺乳動物細胞にトランスフェクトし、前記異種ポリペプチドを発現させ、前記異種ポリペプチドを培養培地に分泌させることにより得られたものである。
【0134】
すべての態様および実施形態の一実施形態では、フィットのための統計的相関法によって決定された相関値は、2またはそれ以上である。すべての態様および実施形態の一実施形態では、フィットのための統計的相関法によって決定された相関値は、1またはそれ以上である。
【0135】
すべての態様および実施形態の一実施形態では、フィットに対するピアソンのカイ二乗検定によって決定されたカイ値は、2またはそれ以上である。すべての態様および実施形態の一実施形態では、フィットに対するピアソンのカイ二乗検定によって決定されたカイ値は、1またはそれ以上である。
【0136】
すべての態様および実施形態の一実施形態では、オフセットは、モデル化され測定されたデータの1:1の線から10%を超えるオフセットである。
【0137】
すべての態様および実施形態の一実施形態では、哺乳動物細胞はCHO細胞である。1つの好ましい実施形態では、CHO細胞はCHO-K1細胞である。
【0138】
すべての態様および実施形態の一実施形態では、異種ポリペプチドは組換えポリペプチドである。
【0139】
すべての態様および実施形態の一実施形態では、異種ポリペプチドはモノクローナル抗体である。一実施形態では、モノクローナル抗体は、治療用モノクローナル抗体である。
【0140】
すべての態様および実施形態の一実施形態では、プロセスデータは、少なくとも15のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも20のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも30のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも40のプロセスパラメータの時間的な値を含む。1つの好ましい実施形態では、プロセスデータは、少なくとも12のオンラインプロセスパラメータおよび少なくとも28のオフラインプロセスパラメータの時間的な値を含む。
【0141】
すべての態様および実施形態の一実施形態では、プロセスデータは、各プロセスパラメータに対して少なくとも6つの時間的な値を含む。
【0142】
すべての態様および実施形態の一実施形態では、代謝モデルは、ゲノムベースの代謝モデルである。一実施形態では、ゲノムベースの代謝モデルは、5つの区画を含む。一実施形態では、5つの区画は、サイトゾル、ミトコンドリア、小胞体、ゴルジ体およびバイオリアクターである。好ましい一実施形態では、代謝モデルは、解糖、クエン酸回路、ペントースリン酸経路、および呼吸鎖の中心代謝経路と、主要なバイオマス構成要素のタンパク質、脂質、RNA、DNA、および炭水化物の生合成と、C1代謝と、アミノ酸分解経路と、を含む。
【0143】
すべての態様および実施形態の一実施形態では、代謝モデルには、最大1200の代謝物、最大800の遺伝子、および最大1500の反応が含まれる。
【0144】
すべての態様および実施形態の一実施形態では、代謝モデルには、少なくとも600の反応、500の代謝物および250の遺伝子(オープンリーディングフレーム)が含まれる。好ましい一実施形態では、代謝モデルには、少なくとも654の反応、583の代謝物および266のオープンリーディングフレームが含まれる。
【0145】
すべての態様および実施形態の一実施形態では、炭素収支は代謝モデルでは閉じられている。一実施形態では、炭素収支の閉鎖は、グルコースおよび非必須アミノ酸を制約することによる。
【0146】
すべての態様および実施形態の一実施形態では、窒素および酸化還元収支は代謝モデルでは閉じられている。一実施形態では、窒素収支および酸化還元収支の閉鎖は、それぞれ、アンモニア生成速度および酸素取り込み速度を制約することによる。
【0147】
すべての態様および実施形態の一実施形態では、細胞の取り込み速度および生成速度の推定は、最初に発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行される(場合により計算最適化手順によって;かつ/または場合によりプロセスフェーズの最適な数はχベースの適合度検定を使用して決定される)。一実施形態では、各プロセスフェーズ中には、一定の細胞生理学が想定され、かつ/または一定のバイオマス特異的速度が想定される。一実施形態では、バイオマス特異的速度は、非線形回帰を使用して決定される。
【0148】
すべての態様および実施形態の一実施形態では、代謝モデルは、(i)既知の遺伝子を機能的カテゴリーに関連付けるデータベースからの情報と組み合わせた遺伝子アノテーションデータから初期再構築を構築するステップ;(ii)一次文献からのデータを使用し、制約ベースのアプローチで数学モデルに変換することによってモデルを改良するステップ;(iii)モデル予測と表現型データの比較を通じてモデルを検証するステップ;および(iv)精度を向上させるために、モデルを継続的なウェットラボおよびドライラボのサイクルに付すことにより、代謝再構築を改善するステップを含む4段階のプロセスを使用して構築されている。
【0149】
すべての態様および実施形態の一実施形態では、代謝モデルは、哺乳動物細胞のアノテーションされたオープンリーディングフレームのみを含む。一実施形態では、モデルは、文献で検証された遺伝子産物をさらに含む。一実施形態では、モデルは、アミノ酸生合成と代謝経路、炭水化物生合成と代謝経路、およびヌクレオチド生合成と代謝経路をさらに含む。一実施形態では、代謝モデルは、輸送プロセスをさらに含む。一実施形態では、代謝モデルは、繰り返される反応または冗長な反応を特定し、除去することにより、さらに洗練される。
【0150】
すべての態様および実施形態の一実施形態では、代謝モデルは、バイオマス式の各成分の要件を推定するために、平均細胞組成(w/w)74.2%のタンパク質、1.6%のDNA、6.1%のRNA、4.5%の炭水化物、および10.1%の脂質に基づいている。一実施形態では、バイオマス式は、コレステロールをさらに含む。
【0151】
すべての態様および実施形態の一実施形態では、酸化的リン酸化の効率は、電子伝達系によって運ばれる電子のモルあたりに生成されるモルATPの比で表される2.5である。一実施形態では、代謝モデルは、29.2mmol ATP/g乾重の、生体高分子(RNA、DNA、タンパク質)生成のためのATPのコストを使用する。一実施形態では、代謝モデルは、維持に1.55mmol ATP/g DW/h、ATP収量に37.8mmol ATP/g DW/h、成長関連の維持に8.6mmol ATP/g DW/hの値をさらに使用する。
【0152】
すべての態様および実施形態の一実施形態では、代謝モデルは、必須アミノ酸、葉酸およびリン酸の取り込み速度、代謝速度、および分泌速度を含む。一実施形態では、代謝モデルは、ビオチン、チアミン、ビタミン、カルシウムおよびマグネシウムイオンの取り込み速度、代謝速度、および分泌速度をさらに含む。
【0153】
すべての態様および実施形態の一実施形態では、グルコース、酸素、およびグルタミンの取り込みは、代謝モデルでは実験的に観察された速度に固定されている。一実施形態では、さらに、乳酸、アンモニア、グルタミン酸、アスパラギン酸、およびアラニンの取り込み、代謝、および分泌速度が代謝モデルにおいて制約されないままである。
【0154】
すべての態様および実施形態の一実施形態では、必須アミノ酸の取り込み速度は、代謝モデルでは除去されている。一実施形態では、さらに、非必須アミノ酸の(好ましくはセリン、アスパラギン、グリシン、およびプロリンの)取り込みまたは生成速度は、代謝モデルでは実験的に観察された速度に固定されている。
【0155】
すべての態様および実施形態の一実施形態では、代謝モデルは、ハイブリッドモデルアプローチにおいて、遺伝子およびシグナル伝達調節エレメント、酵素反応速度および物理化学パラメータを組み合わせる。
【0156】
すべての態様および実施形態の一実施形態では、モノクローナル抗体の最大生成速度は、0.0084mmol抗体/g DW/h(DW=乾重)の値に設定されている。
【0157】
すべての態様および実施形態の一実施形態では、代謝モデルの代謝フラックスは、化学量論的制約(代謝物の物質収支)および熱力学的制約(反応の可逆性)を受ける代謝ネットワークモデルの制約ベースのフラックス分析によって決定される。
【0158】
すべての態様および実施形態の一実施形態では、代謝モデルは3つの異なるフェーズを含む。好ましい一実施形態では、3つのフェーズは、(i)1日目から3日目まで続く最初の初期の指数増殖期;(ii)4日目から6日目まで続く後期の指数増殖期;および(iii)8日目から10日目まで続く初期の定常期を含む。
【0159】
すべての態様および実施形態の一実施形態では、代謝モデルの第1のフェーズでの細胞の目的は、バイオマス生成である(そしてこれは最大化される)。
【0160】
すべての態様および実施形態の一実施形態では、代謝モデルの第2のフェーズでの細胞の目的は、エネルギー最適化である(そしてこれは最小化される)。
【0161】
すべての態様および実施形態の一実施形態では、代謝モデルの第3のフェーズでの細胞の目的は、タンパク質生成である(そしてこれは最大化される)。
【0162】
すべての態様および実施形態の好ましい一実施形態では、代謝モデルの第1のフェーズでの細胞の目的はバイオマス生成であり(そしてこれは最大化される)、代謝モデルの第2のフェーズでの細胞の目的はエネルギー最適化であり(そしてこれは最小化される)、代謝モデルの第3のフェーズでの細胞の目的はタンパク質生成である(そしてこれは最大化される)。
【0163】
すべての態様および実施形態の一実施形態では、代謝ネットワークモデルおよびそのハイブリッドモデルは、(i)取り込み速度および消費速度をシミュレートするため、(ii)細胞内フラックスおよび濃度をシミュレートするため、ならびに(iii)データの一貫性、精度、および完全性をチェックするための、バッチ、スプリットバッチ、フェドバッチ、灌流、強化および連続培養のようなあらゆる種類の細胞培養戦略に使用される。
【0164】
すべての態様および実施形態の一実施形態では、代謝モデルは、再構築プロセス中に、シミュレーション結果を実験結果と比較することによって一貫性、精度、および完全性について繰り返しチェックされ、シミュレーション結果が(場合により定量的にも定性的にも)実験結果の10%以内になるまで採用/調整される。
【0165】
統計モデルの適合度は、根本的なモデル化プロセスに関してモデルの質、すなわち、モデルと実験データの相関がどの程度良好であるかを特徴づけるために使用することができる。一般に、適合度は、実験値とモデルによる予測値との間の偏差を合計する。
【0166】
適合度を説明する1つの方法は、ピアソンのカイ二乗検定である。これは、実験結果とモデル化された結果の頻度の差の合計に基づいており、それぞれが2乗され、期待値で除算される:
[式中、
は、bin iの実験によって決定された頻度(すなわち、カウント)を意味し
は、帰無仮説によって主張されたbin iのモデル化された頻度を意味する]。
【0167】
は、次式によって計算することができる:
[式中、
Fは、分析対象の分布の累積分布関数を意味し
は、クラスiの上限を意味し、
は、クラスiの下限を意味し、かつ
Nは、データポイントの数を意味する]。
【0168】
得られた値をカイ二乗分布と比較して適合度を決定することができる。
【0169】
平均すると、各項は約1であると予想することができる。したがって、同様に、合計はデータポイントの数と相関するはずであると予想される。フィッティングされた関数で自動的にヒットできなかったデータポイントの数は「自由度」の数と呼ばれる。
【0170】
決定的なのは、偏差とエラーバーの相対的なサイズである。「良好な」点は、誤差(σ)に対する偏差(Δ)の比率が小さい(1未満)点であり、「不良な」点は、誤差に対する偏差の比率が1よりも大きいため、曲線が誤差バーを通過できない点である(第3のデータポイントの場合と同様)。平均して、良好なフィットは、異常に大きな偏差と異常に小さな偏差が同じくらい多い、つまり、平均して、偏差と誤差の比率は約1になる。(もちろん、完璧なフィットでは、曲線はすべてのデータ点を通過する:偏差はゼロ)。χは、各データポイントの偏差と誤差の比の二乗の和として定義される:
【0171】
自由度(d.f.)は、調整可能なパラメータの数によって削減されたデータポイントの数に等しい。
【0172】
以下の実施例および図は、本発明の理解を助けるために提供されており、その真の範囲は、添付の特許請求の範囲に記載されている。本発明の精神から逸脱することなく、記載された手順に変更を加えることができることが理解される。
【図面の簡単な説明】
【0173】
図1A】破損し、修正された供給濃度データを用いる14日間の流加培養実験の代謝モデルフィット。14日間の流加培養は、離散測定されたインプロセスデータ(一般的な誤差分散のあるブラックボックス)に基づいて、5つの異なる段階的な代謝(水平線)に分けられる。黒線は、生成された代謝物の消費の速度(ドリフト量に基づく)にフィットする。測定およびモデル化されたデータのオフセット(A)は、破損したデータ入力を示す。測定データとモデル化データの一致が、修正されたデータセット(B)について示される。
図1B図1Aの説明を参照のこと。
図2】調整されたモデル速度に対してプロットされた測定量から決定された速度からの平均と標準偏差の相関プロット。発酵9(薄い灰色の円)、14(灰色の逆三角形)および51(黒色の四角形)が示される。破線は、1:1の相関線を意味する。速度は、測定量から決定される。
図3-1】さまざまな培養とモデルシナリオの組合せのχ値。表示されるχは、試験された発酵バッチの各代謝フェーズおよびモデルバリアント(モデル1からモデル6)におけるχの中央値である(表3も参照)。ヒートマップの右側の番号は再現グループである。
図3-2】図3-1の説明を参照のこと。
図4】同じ産物を発現する2つの異なる組換えCHOクローン(クローン1およびクローン2)の生細胞密度および乳酸動態が示されている。細胞は流加プロセスによって培養され、プロセス制御分析の離散アットラインによって分析された。
図5】14日間の流加プロセスで同じ生成物を発現する組換えCHOクローン1およびクローン2のモデル化された速度。測定された(調整された)速度(一般的なエラー分散のあるブラックボックス)およびモデル化された(ブラックボックス)速度が、5つすべての代謝フェーズ(水平線)について表示される。
【実施例
【0174】
材料および方法
生成物の定量化、代謝物およびアミノ酸分析:
発酵ブロス中の生成物力価、代謝産物およびアミノ酸濃度の定量化のために、細胞を遠心分離によって取り除いた。グルコース、乳酸、およびアンモニウムの濃度は、Cedex Bio HTバイオプロセスアナライザー(Roche Diagnostics GmbH、マンハイム)を使用して、特定の検定を使用して測定した。無細胞上清は、その後のタンパク質定量化またはアミノ酸分析のために、それぞれ0.2μmまたは3kDa膜で滅菌フィルタにかけた。生成物力価は、以前に記載されたPoros A HPLC法によって定量化した[Zeckら、2012]。発酵上清中のアミノ酸レベルは、Agilent RRLC 1200システム(Agilent Technologies,サンタクララ)および蛍光検出器を使用して社内の方法によって測定した。
【0175】
タンパク質の測定:
細胞タンパク質含有量の抽出には、Mem-PER(商標)Plus Membrane Protein Extractionキット(Thermo Scientific,ダルムシュタット)およびCedex HiResアナライザーを適用した。第1のステップでは、Cedex HiResアナライザーを使用して特定量の生細胞を収集し、ファルコンチューブに移した。次に、同封の浮遊哺乳動物細胞用Mem-PER(商標)取扱説明書(取扱説明書番号89842、Thermo Scientific、ダルムシュタット)のプロトコール2に従って、細胞タンパク質を抽出した。タンパク質を抽出し、1.5mLチューブに収集した後、Bradford Coomassie(登録商標)PlusTMアッセイキットおよびマイクロプレート手順A(取扱説明書第23236、Thermo Scientific、ダルムシュタット)を使用して、タンパク質濃度を測定した。この場合、通常のBSAタンパク質標準の代わりに、独自のCHO宿主細胞タンパク質標準を使用して、所与サンプルの測定されたCHOタンパク質と、独自の宿主細胞タンパク質混合物から作成した標準曲線との間の公平性を利用した。
【0176】
その後、測定されたタンパク質含有量cタンパク質,測定を、Cedex HiResアナライザーからの総細胞密度TCDおよび生存度Vデータと、そしてもちろん試験管の容積Vタンパク質,試験管および細胞含有サンプルの体積Vサンプルと組み合わせて、細胞あたりのタンパク質含有量を以下のように計算する:
【0177】
平均単一細胞質量、体積および密度の決定:
平均細胞質量の決定には、まずCedex HiResアナライザー(Roche Diagnostics GmbH、マンハイム、ドイツ)機を使用して所与サンプルの細胞濃度を決定する。さらに、Cedex HiRes装置により、細胞直径(装置内の細胞体積の計算に使用)、細胞生存度および凝集速度のような形態学的パラメータを得る。
【0178】
細胞質量の決定は、細胞全体の質量m細胞全体が、細胞のバイオマスm細胞バイオマス(細胞膜、細胞成分、タンパク質など)および水mの合計からなるという仮定に基づいて行われる。
細胞全体=m細胞バイオマス+m
【0179】
細胞含有サンプルをバランスの取れたファルコンチューブにピペットで移し、上清から分離した。洗浄ステップは、細胞だけが確実にファルコン内に残るようにする。その後、ファルコンを乾燥キャビネット内で80℃で少なくとも24時間乾燥させて水を除去した。したがって、細胞バイオマスは、空のファルコンチューブmファルコン,空および乾燥バイオマスを含むファルコンチューブmファルコン,乾燥の重量差によって測定することができる。測定した総細胞密度TCDおよびサンプル体積Vサンプルと組み合わせて、平均細胞質量を以下の通り計算することができる:
【0180】
酸素取り込み速度(OUR)の決定:
酸素取り込み速度OURの決定には、動力学的方法を適用した。動力学的方法はよく知られた標準的手順であり、一般に液内細胞培養の酸素消費量に基づく。発酵中、バイオリアクター内の溶存酸素濃度(クラーク電極で測定)は定義された値に調整されているため、溶存酸素の時間的変化は0と見なすことができる。
【0181】
動力学的方法を適用する場合、ガス処理は一定時間の間中断され、酸素プローブによって記録され得る細胞の呼吸活動によってのみ溶存酸素が減少する。
【0182】
OURは、ガス処理が再開されるまで、溶存酸素の枯渇によって決定することができる。
【0183】
CHOネットワークモデルの再構築およびフラックス解析:
5つの区画(サイトゾル、ミトコンドリア、ER、ゴルジ体、バイオリアクター)を含むゲノムベースのCHOネットワークモデルが、確立された手順に従って、データベースおよび一次文献を含む公開情報源から構築された[Sheikhら,Biotechnol.Prog.21(2005)112-121;Selvarasuら,Mol.Biosyst.6(2010)152-161;Oberhardtら,Mol.Syst.Biol.5(2009)320]。中心代謝経路(解糖、クエン酸回路、ペントースリン酸経路、呼吸鎖)に加えて、モデルは、主要なバイオマス構成要素(タンパク質、脂質、RNA、DNA、および炭水化物)の生合成、C1代謝、およびアミノ酸分解経路を説明する。調査した組換えタンパク質生成物について、組換えタンパク質のアミノ酸組成および代表的なグリコシル化構造(生成物分子あたり2つのシアル酸付加された(sialilated)二分岐グリカン)を説明する、対応する一組の生成物形成反応を定式化した。結果として得られたモデルは、654の反応、583の代謝物を含み、266のORFを表した。バイオマス組成は、CHO細胞またはマウス細胞株に関する以前の研究に匹敵するものが選択された(例えば、Altamiranoら,Biotechnol.Prog.17(2001)1032-1041;Bonariusら,Biotechnol.Bioeng.50(1996)299-318;Selvarasuら,Biotechnol.Bioeng.109(2012)1415-1429)。下記の表6および7を参照されたい。
【0184】
(表6)ネットワークシミュレーションで用いたCHO-K1細胞のバイオマス組成
【0185】
(表7)ネットワークシミュレーションで用いたCHO-K1細胞の高分子組成
【0186】
モデルの再構築およびモデルのシミュレーションは、Insilico Discovery802(商標)ソフトウェアv3.2(Insilico Biotechnology AG,シュトゥットガルト)を使用して実行された。モデルの検証では、元素収支および電荷収支がすべての反応で閉じていることが確認された。さらに、フラックスバランス解析[SavinellおよびPaulson,J.Theor.Biol.154(1992)421-454および455-473]を使用して個々の経路の機能性が検証された。CHO発酵中に収集された時系列の転写データは、ネットワーク内の(不)活性代謝経路を描写するのに役立ち、優勢なアイソザイム種の特定を支援した。結果として得られるネットワークモデルには、それでも細胞外代謝物の測定とネットワークの化学量論だけでは解決できない内部自由度が含まれていた。このような場合、得られたフラックス分布の比較可能性を確保するために、最もエネルギー効率の高い代謝経路が活性化され、他の経路は不活性化されていると考えられた。重要なことに、この選択は、測定値から推測される細胞の取り込みおよび生成速度の調整された値に影響を与えなかった。
【0187】
細胞の取り込み速度および生成速度の推定は、最初に、計算による最適化手順を通じて、発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行された。この最適化は、細胞数、タンパク質生成物、および細胞外代謝物の測定された時系列データ入力として使用する進化戦略[Mullerら,2009,Proceedings of the 11th Annual conference on Genetic and evolutionary computation.モントリオール、カナダ:ACM pp.1411-1418.http://dl.acm.org/citation.cfm?id=1570090で利用可能]を用いて実行された。プロセスフェーズの最適数は、LeightyおよびAntoniewiczによって報告された方法に類似したχベースの適合度検定を使用して決定された[Metab.Eng.13(2011)745-755]。各プロセスフェーズの間に、一定の細胞生理が想定され、バイオマス特異的速度が一定であることを意味していた。これらのバイオマス特異的速度は、非線形回帰を使用して決定された。個々の栄養素の取り込み速度は、必要に応じて接種せずに実行された対照発酵から決定された半減期データに基づいて、化学分解の影響について修正された。結果として得られた取り込み速度および生成速度は、代謝フラックス解析を実行するための入力として機能し[Maierら,Biotechnol.Bioeng.100(2008)355-370;Niklasら,Curr.Opin.Biotechnol.21(2010)63-69;Stephanopoulosら,1998,Metabolic engineering:Principles and methodologies.San Diego:Academic Press]、計算されたフラックス分布の熱力学的一貫性が確認された(すなわち、既知の不可逆反応の方向性の違反はない)。
【0188】
性能測定、および多変量データ分析の定義:
代謝物データ、プロセスデータ、および細胞内フラックス分布のピアソン相関とスピアマン相関の計算は、統計ソフトウェアR v2.13.2、Statsパッケージ[R Core Team、2013]、JMP(SAS、Marlow)、およびQlucore(Qlucore AB、Lund)を使用して実行された。多重検定のp値の補正は、FDR<0.05で、または示される通りに、偽発見率(FDR)を制御するために、BenjaminiおよびHochbergの方法[BenjaminiおよびHochberg,1995]を使用して実行された。各培養の複合選択スコアは、以下のように計算された:複合スコアCSは、カテゴリースコア(CAS)の加重和として定義された。
ここで、
である。重み係数は、所与の選択プロセスに応じて選択された。各カテゴリースコアCASは、カテゴリーに含まれる個々の指標(INDi,j)の加重平均として指定された。
この場合も、
である。各指標INDi,jは、所与性能の尺度PMスケーリングのスケーリングされた時間加重平均として決定された:
上記の重み係数について記載したのと同じ制限が
に適用され、
である。
【0189】
ここでは、濃度、モル量、バイオマス特異的取り込み/生成速度、細胞内フラックスまたは速度が性能の測定値として採用され、適切な基準値を使用して帰無の無次元量に正規化された。異なるスケーリング手順を採用して、これらの特性を達成し、高い値が望ましいと考えられる特性(例えば、製品力価)と低い値が好ましいと考えられる特性(例えば、副生成物収量)を区別することができる。ここで使用したスケーリングの観測値の範囲は以下の通りである。
性能測定値PMi,jは、非負の値のみを想定して定義され、
および
は、それぞれすべてのクローンおよびすべての時間点での性能測定値の最大値と最小値を表す。スケーリングされた性能指標および重み係数をこのように選択すると、複合スコアCSの達成可能な値は0から1の範囲になる。後者の値は、1つのクローンが、すべての指標およびこの指標がゼロ以外の重みを受けるすべての時間点について、最大の指標値を示した場合にのみ想定される。
【0190】
単一クローンの力価スコアの例示的計算
最終的な力価を考慮する際には、生成物形成カテゴリーのスコアをw生成物形成=1、それ以外のカテゴリーiについてはw=0とした。生成物力価は唯一の能動的基準であるため、生成物形成(ProductFormation)カテゴリー内での重み付けは
となるが、
、および
となる。スケーリングされた性能の尺度の場合、これは、
となり、i=「生成物形成(ProductFormation)」であり、j=「代謝フェーズでの最大力価」である。高い力価値が好ましいため、スケーリングされた性能の尺度は、次式から計算される。
【0191】
例示的なクローンについて、これらの値を以下の表8に示す。
【0192】
(表8)本明細書に概説されている重み付け手順に従った最終的な力価スコアの計算例
【0193】
実施例1
組換えCHOクローンの比較と代謝性能指標によるランキング
クローン比較実験のために、同じモノクローナルIgG4抗体を発現している10の組換えCHO-K1クローン(CL4~CL13)を使用した。異なる生成物の比較研究のために、上記と同じモノクローナルIgG4抗体を発現しているさらなるクローンCL14と、モノクローナルIgG1抗体を発現している他の2つの生成クローン(CL2およびCL3)を使用した。組換えCHO-K1クローンは、シードトレインおよびその後の流加実験のために、タンパク質を含まない、化学的に定義された独自の培地で培養した。シードトレイン培養は、設定点が7%COおよび37℃に制御された加湿インキュベーターを使用して振盪フラスコで実行した。クローンは3~4日ごとに分割した。すべての実験で、実験開始までの培養(21日)で同じ年齢のクローンを使用した。流加クローン比較実験では、CL4からCL13を、タンパク質を含まない化学的に定義された独自のベース培地を使用して、500mL振盪フラスコ内の230mL培地で13日間培養した。2つのタンパク質を含まない化学的に定義された独自のフィード培地(フィードAおよびフィードB)を、3日目(フィードA、1日あたり開始培養量の3%)または6日目(フィードB、1日あたり開始培養量の2%)以降に毎日補充した。完全に制御されたクローン培養流加実験は、2Lの小規模バイオリアクター(Sartorius Stedim、Goettingen)で、前記と同じタンパク質を含まない化学的に定義された独自のベースおよびフィード培地を使用して14日間実行された。生成のようなプロセスでは、同じ2つのタンパク質を含まない化学的に定義された独自のフィード培地(フィードAおよびフィードB)を、3日目(フィードA、1日あたり開始培養量の2%)または6日目(フィードB、1日あたり開始培養量の2%)から14日目まで毎日補充した。すべての培養実験は3回繰り返して行った。生細胞および総細胞密度および細胞直径の分析には、自動化されたCedex HiResシステム(Roche Diagnostics GmbH、マンハイム)を使用した。生細胞密度および総細胞密度は、製造業者の説明書に従ってトリパンブルー排除染色法を使用して識別した。発酵ブロス中の生成物力価、代謝産物およびアミノ酸濃度は、以前に記載されているように定量化されたZeckら、2012)。
【0194】
組換えCHOクローンの代謝フィンガープリントおよび全体的な性能の評価のために、代謝フラックスモデルを使用して、予め定義された代謝性能指標(表2参照)およびそれぞれのスコアリングシステムを計算して、集計および累積値を生成した(表8参照)。これにより、CHOクローンの開発および選択のためのクローンランキングの自動かつユーザー非依存性の(個人の解釈を回避する)生成が可能になる。
【0195】
実施例2
組換えCHOクローン培養のための異なる発酵スケールの比較
代謝フラックス解析アプローチは、高スループット使用のための自動化されたCHO細胞性能分析を確立するために適用された。この目的のために、さまざまなモノクローナル抗体を発現する、さまざまな規模で実施された培養を危うくする(compromising)豊富なデータセットを利用し、必要に応じて精選した(表3参照)。パイプラインの設計に使用された方法には、ゲノム規模の代謝ネットワークモデリング、プロセスフェーズの特定、代謝フラックス解析、およびクローン性能指標の分析が含まれていた。実行された統計解析には、縮小χ検定、相互検証、および反復分析が含まれていた。解析の結果、データセットの変換および変形エラーを解決し、χ検定の許容ウィンドウを決定することができた。さらに、宿主細胞のタンパク質および酸素取り込み測定の形で追加の測定パラメータを考慮に入れた場合の影響を分析した。
【0196】
初期のフェーズでは、代謝分析のための統合されたデータ基準が確立された。モデル設定におけるさまざまな仮定(さまざまな細胞バイオマス組成)の影響、および縮小されたχおよび性能指標値にデータを含めるための影響をテストするためのモデルシナリオに基づくアプローチは、流加培養データを、さまざまな細胞株、クローン、生成物またはプラットフォームで実行された、さまざまな規模のCHOプロセスからの包括的な細胞分析データおよび元素分析とともに使用して分析された。さまざまな仮定およびパラメータの結果、モデル1から6が得られた(表4および図3参照)。
【0197】
実施例3
OURおよびHCP測定によるCHOクローン性能分析
この目的のために、追加の測定値を含めることの影響、HCPおよびOURデータセットを表す培養のサブセットを分析した(表3参照)。ここで、どちらの場合も、追加データを考慮すると、χを増やすことにより、実験から取得した情報量が改善されることが見出された。詳細には、宿主細胞タンパク質(13%ポイント増加)および酸素取り込み速度(25%ポイント増加)の測定値を考慮すると、CHO発酵の情報量の有意な増加が得られた(表9参照)。
【0198】
(表9)χ検定の詳細な結果。HCPおよびOURの測定モデルの影響を分析するために、HCPおよびOURが測定された培養のみを使用してシナリオ1(モデル1)を再評価した。
【0199】
実施例4
乳酸代謝型の異なるCHOクローンの代謝表現型の解析
乳酸はCHO培養の最も顕著な副生成物であり、それにより、培養ブロス中の濃度レベルおよび細胞特異的な形成および消費速度はプロセス制御分析において発酵として日常的に分析されている。CHOクローン開発評価プロセスの最終候補は、多くの場合、同じまたは関連するCHO親細胞および/またはプールに由来する。それでも、代謝型(培養における代謝表現型)は大きく異なる可能性がある。
【0200】
クローン評価プロセスでは、同じ組換え生成物を発現する2つの異なるCHOクローンを流加実験で評価した。それにより、クローン1とクローン2の細胞増殖はわずかにしか変化しないが、測定された乳酸濃度はかなりの違いを示した(図4)。クローン1は、培養の途中で4000mg/Lの最大乳酸レベルに達し、その後に再代謝の表現型が見られた。対照的に、クローン2は最大で500mg/Lの乳酸にさえ到達せず、プロセス時間のほとんどの全体的なレベルは測定不能であった。クローン2起源のこの乳酸測定値が真の代謝型に由来するのか、または例えば間違った測定値、破損したデータなどに由来するのかを評価するために、本発明による代謝フラックス解析アプローチを使用して乳酸値の確率を解析した。そのために、モデルは、乳酸と乳酸以外のすべての測定されたインプロセス制御パラメータを検討する。クローン1とクローン2の特定された5つすべての代謝フェーズすべてについて、調整された乳酸速度とモデル化された「ブラックボックス」速度の一致により、クローン2の乳酸代謝型が正しいことが確認された(図5)。
【0201】
引用文献(すべて参照により本明細書に組み込まれる):
図1A
図1B
図2
図3-1】
図3-2】
図4
図5