IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インシリコ バイオテクノロジー アーゲーの特許一覧

特表2022-537799生物工学的生産を最適化するための方法および手段
<>
  • 特表-生物工学的生産を最適化するための方法および手段 図1
  • 特表-生物工学的生産を最適化するための方法および手段 図2
  • 特表-生物工学的生産を最適化するための方法および手段 図3
  • 特表-生物工学的生産を最適化するための方法および手段 図4
  • 特表-生物工学的生産を最適化するための方法および手段 図5
  • 特表-生物工学的生産を最適化するための方法および手段 図6
  • 特表-生物工学的生産を最適化するための方法および手段 図7A
  • 特表-生物工学的生産を最適化するための方法および手段 図7B
  • 特表-生物工学的生産を最適化するための方法および手段 図8
  • 特表-生物工学的生産を最適化するための方法および手段 図9
  • 特表-生物工学的生産を最適化するための方法および手段 図10
  • 特表-生物工学的生産を最適化するための方法および手段 図11
  • 特表-生物工学的生産を最適化するための方法および手段 図12
  • 特表-生物工学的生産を最適化するための方法および手段 図13
  • 特表-生物工学的生産を最適化するための方法および手段 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-08-30
(54)【発明の名称】生物工学的生産を最適化するための方法および手段
(51)【国際特許分類】
   C12M 1/36 20060101AFI20220823BHJP
   C12M 1/00 20060101ALI20220823BHJP
   G16B 40/00 20190101ALI20220823BHJP
   C12N 1/00 20060101ALI20220823BHJP
   C12N 5/00 20060101ALI20220823BHJP
   G06N 3/00 20060101ALI20220823BHJP
【FI】
C12M1/36
C12M1/00 A
C12M1/00 C
G16B40/00
C12N1/00 A
C12N5/00
G06N3/00 140
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021566183
(86)(22)【出願日】2019-05-08
(85)【翻訳文提出日】2021-11-05
(86)【国際出願番号】 EP2019061878
(87)【国際公開番号】W WO2020224779
(87)【国際公開日】2020-11-12
(81)【指定国・地域】
(71)【出願人】
【識別番号】521485623
【氏名又は名称】インシリコ バイオテクノロジー アーゲー
(74)【代理人】
【識別番号】110002572
【氏名又は名称】特許業務法人平木国際特許事務所
(72)【発明者】
【氏名】ニーベル,バスティアン
(72)【発明者】
【氏名】マウヒ,クラウス
(72)【発明者】
【氏名】シュミット,ヨアヒム
(72)【発明者】
【氏名】ボーナー,マティアス
【テーマコード(参考)】
4B029
4B065
【Fターム(参考)】
4B029AA02
4B029BB11
4B029CC01
4B029DF10
4B029DG10
4B065AA91X
4B065AB01
4B065AC14
4B065BA02
4B065CA25
4B065CA44
4B065CA60
(57)【要約】
媒体組成および/または供給プロファイルを最適化することによって、製品濃度、生産性、バイオマス濃度、および製品品質を増加させる目的のために、バイオテクノロジー製品の生産のためのデジタルツインを自動生成および検証し、ならびにデジタルツインを適用するための新しい方法。デジタルツインはオンライン最適化のために生産に直接リンクすることもできるし、意思決定支援のためにオフラインでリンクすることもできる。
【選択図】図1
【特許請求の範囲】
【請求項1】
細胞培養プロセスのためのデジタルツインを構築する方法であって、前記デジタルツインは、生物学的細胞、細胞外反応、およびリアクタシステムのうち複数を表し、前記方法は、
・実細胞培養プロセスから動的培養データを提供するステップ;
・実際の生物細胞の代謝フラックスから抽出されたエレメンタリフラックスモードのモードマトリクスMを提供するステップ;
【数24】
・前記ベースフラックスモードを前記細胞培養プロセスの細胞外反応と結びつけるステップ;
・前記ベースフラックスモードを前記細胞培養プロセスのリアクタシステムの流入および流出と結びつけるステップ;
・基質、産物、バイオマスのマスバランスを解くステップ;
・前記動的培養データによってH行列と前記ニューラルネットワークを訓練するステップ;
を有する方法。
【請求項2】
【数25】
請求項1記載の方法。
【請求項3】
基質、生成物、およびバイオマスのマスバランスは、再帰代謝ネットワークモデル(RNN)によって解かれ、前記再帰代謝ネットワークは、
・適正なマスバランスを確保しながら、ある時間ステップにわたる時間の連続関数として培養体積および状態ベクトルの変化を記述する中間状態モデル;
【数26】
・次の時間ステップt+Δtの前記状態ベクトルを計算する指数関数的成長モデル;
を備える、
請求項1または2記載の方法。
【請求項4】
前記RNNをトレーニングするステップは、前記培養データの第1サブセット(トレーニングセット)を使用して、下記損失関数を最小化することによって実行される:
【数27】
請求項3記載の方法。
【請求項5】
前記方法はさらに、
・前記培養データの第2サブセット(評価セット)に基づいて前記損失関数Lossを計算することによって、前記トレーニングされたRNNを評価するステップであって、前記第2サブセットは前記第1サブセットとは異なる、ステップ、
を有する、
請求項4記載の方法。
【請求項6】
前記エレメンタリフラックスモードの前記モードマトリクスMがモード分解によって得られ、前記方法はさらに、
・全ての代謝フラックスを変換して可逆反応を分離し、全ての不可逆反応を得るステップ;
・目的関数を最小化することと不活性リアクタを不活性化することを再帰的に適用してエレメンタリフラックスモードを取得するステップであって、前記目的関数は、
min(Numrxns,vnonzero
Numrxns,vnonzeroはゼロではない反応の個数
によって表される、ステップ;
・識別したすべてのエレメンタリフラックスモードを収集し、それらをモードマトリクスMに積み重ねるステップ;
を有する、
請求項1から6いずれか1項記載の方法。
【請求項7】
細胞培養プロセスの培養データからリアクタシステムにおける細胞培養プロセスのための最適化されたプロセス仕様を提供する方法であって、
・前記細胞培養プロセスの培養データを取得するステップ;
・請求項1から6のいずれか1項記載の方法により得られるデジタルツインを適用することにより、取得した培養データから少なくとも1つの最適化されたプロセス仕様を調整または生成するステップ;
を有する方法。
【請求項8】
リアクタシステムにおいて生物細胞を培養する方法であって、
・前記リアクタシステムにおいて前記生物細胞を培養するステップ;
・前記リアクタシステムにおける細胞培養から培養データを取得するステップ;
・請求項1から6のいずれか1項記載の方法によって得られるデジタルツインを適用することによって、取得した培養データから少なくとも1つの最適化されたプロセス仕様を調整または生成するステップ;
・前記少なくとも1つの最適化されたプロセス仕様を前記リアクタシステムに対して適用するステップ;
を有する方法。
【請求項9】
前記プロセス仕様は、
供給ストラテジー、培地組成物、重量モル浸透圧濃度、培地pH、pO、温度、
から選択される1つ以上の仕様に関して最適化される、請求項8記載の方法。
【請求項10】
リアクタシステムにおいて実行中の生物学的細胞培養物を自動制御するための装置であって、
・プロセッサを含むコンピューティングデバイス;
・プログラムコードおよび請求項1から6のいずれか1項記載の方法にしたがって取得可能なデジタルツインを格納したメモリ;
を備え、
前記プログラムコードは、前記プロセッサが実行すると前記コンピューティングデバイスに、
・前記リアクタシステムにおいて実行中の細胞培養から培養データを取得するステップ;
・前記取得した培養データから前記リアクタシステムのプロセス仕様を調整または生成するステップ;
を実施させる、
装置。
【請求項11】
請求項10記載の装置およびリアクタを備える、生物学的細胞培養物を培養するためのリアクタシステム。
【請求項12】
細胞培養プロセスのためのデジタルツインを構築するプログラムコードを収容した非一時的コンピュータ読取可能記憶媒体であって、前記デジタルツインは、生物学的細胞、細胞外反応、およびリアクタシステムのうち複数を表し、前記プログラムコードはコンピュータによって実行されると、前記コンピュータに、
・実際の細胞培養プロセスから動的培養データを提供するステップ;
・実際の生体細胞の代謝フラックスから抽出されたエレメンタリフラックスモードのモードマトリクスMを提供するステップ;
【数28】
・前記ベースフラックスモードを前記細胞培養プロセスの細胞外反応に結びつけるステップ;
・前記ベースフラックスモードを前記細胞培養プロセスのリアクタシステムの流入および流出に結び付けるステップ;
・得られた基質、生成物、およびバイオマスのマスバランスを解くステップ;
・前記動的培養データによって前記H行列と前記ニューラルネットワークをトレーニングするステップ;
を実施させる、
非一時的コンピュータ読取可能記憶媒体。
【請求項13】
コンピュータによって実行されると、前記コンピュータに、請求項2から6のいずれか1項記載の方法の命令ステップを実行させるプログラムコードを収容した、請求項12記載の非一時的コンピュータ読取可能記憶媒体。
【請求項14】
細胞培養プロセスのためのデジタルツインを構築する計算システムであって、前記デジタルツインは、生物学的細胞、細胞外反応、およびリアクタシステムのうち複数のを表し、前記計算システムは、
・プロセッサを含むコンピューティングデバイス;
・前記デジタルツインを構築するための命令を記憶するメモリ;
を備え、
前記命令は前記プロセッサによって実行されると、前記コンピューティングデバイスに、
・実際の細胞培養プロセスから動的培養データを提供するステップ;
・実際の生体細胞の代謝フラックスから抽出されたエレメンタリフラックスモードのモードマトリクスMを提供するステップ;
【数29】
・前記ベースフラックスモードを前記細胞培養プロセスの細胞外反応に結びつけるステップ;
・前記ベースフラックスモードを前記細胞培養プロセスのリアクタシステムの流入および流出に結び付けるステップ;
・得られた基質、生成物、およびバイオマスのマスバランスを解くステップ;
・前記動的培養データによって前記H行列と前記ニューラルネットワークをトレーニングするステップ;
を実施させる、
計算システム。
【請求項15】
前記メモリは前記プロセッサによって実行されると、前記コンピューティングデバイスに、請求項2から6のいずれか1項記載の方法の命令ステップを実行させる命令を記憶する、請求項14記載の計算システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、媒体組成および/または供給プロファイルを最適化することによって、製品濃度、生産性、バイオマス濃度、および製品品質を増加させる目的で、バイオテクノロジー製品の生産のためのデジタルツインの自動生成および検証、ならびにデジタルツインの応用のための新規な方法を提供する。デジタルツインはオンライン最適化のために生産に直接リンクすることもできるし、意思決定支援のためにオフラインでリンクすることもできる。
【0002】
今日、デジタルツインは、機械工学、電気工学、化学工業、およびその他の関連産業において使用されている。機械、工業製品、およびサプライチェーンの設計、最適化、および制御を大幅に改善および高速化する可能性があるためである。デジタルツインはそれらの予測品質を通じて、生産に直接介入するために、または資産およびサプライチェーンの全体的な挙動を予測し、改善するために使用することができる。このような利点にもかかわらず、デジタルツインは、生物工学的生産プロセスには適用されない。
【0003】
バイオテクノロジープロセスのモデルは過去に開発されているが、これらのモデルの大部分は3つの主要な問題に取り組むことができない:(i)モデルが予測品質をほとんど有していない、(ii)必要な実験データを必要に応じて提供することができない、(iii)モデルの作成は、細胞系の複雑さのためにコストが高すぎる、または未知数が多すぎるために不可能である。
【発明の概要】
【0004】
本発明者らは、初めて、細胞モデル、リアクタモデル、増殖モデル、および細胞外反応動態を機械学習と組み合わせることによって、高度に予測的なデジタルツインのための方法および手段を見出した(図1参照)。細胞内濃度の準定常的な記述を通して、デジタルツインは、基質、生成物(すなわち、「化合物」)およびバイオマスの動態のみに基づいて、訓練および検証することができる。これらの実験データは日常的な基礎に基づいて容易に提供することができ、ほとんどのバイオ医薬品製造プロセスにおける標準的な測定データである。本発明は、a)周知の代謝ネットワークのメカニズムと周知の培養システム、および、b)機械学習による未知の細胞メカニズムのデータ駆動学習を利用する。
【0005】
デジタルツインの訓練、検証、および応用は完全に自動化され、連続、バッチおよび流加培養のような異なるプロセスフォーマット間で交換可能であり、モノクローナル抗体、抗体フラグメント、ビタミン、アミノ酸、ホルモン、または成長因子のような異なる産物間で交換可能である。さらに、この方法は、代謝ネットワークが再構築されているか、または再構築され得るすべての生物および細胞株に対して適用できる。
【図面の簡単な説明】
【0006】
図1】本発明によるデジタルツインの構造の概略図を示す。
図2】デジタルツインの機能および実際の細胞培養システムにおけるその応用を概略的に示す。
図3】本発明の好ましい実施形態による方法のワークフローのフローチャートである。
図4】フェーズおよび交換レート推定アルゴリズムのフローチャートである。
図5】代謝フラックス分析アルゴリズムのフローチャートである。
図6】モード分解アルゴリズムのフローチャートである。
図7A】反復代謝ネットワークモデルの模式図を示す。
図7B】反復代謝ネットワークモデルの模式図を示す。
図8】本発明による行列乗算アルゴリズムの概略図である。
図9】反復代謝ネットワークモデルのための訓練および評価アルゴリズムのフローチャートである。
図10】プロセス最適化アルゴリズムのフローチャートである。
図11】本発明による方法の完全なワークフローのフローチャートである。
図12】本発明によるデジタルツインの性能に関するグラフを示す。
図13】バイオマスおよび生成物の測定および予測濃度に関するグラフを示す。
図14】バイオマスおよび生成物の測定および予測濃度に関するグラフを示す。
【発明を実施するための形態】
【0007】
細胞培養プロセスのためのデジタルツインを提供する。デジタルツインは、複数の生物学的細胞、細胞外反応、およびリアクタシステムを表す。
【0008】
【数1】
【0009】
H行列は、本発明のこの実施形態の独特の特徴である。本発明によれば、Hは2つの機能を有する訓練可能な行列である:
(i)エレメンタリフラックスモードの数Nummodesを減少した数Nummodes,redに変換する(すなわち、次元数低減)
(ii)行列乗算演算(すなわち、モード結合)を介してモードを結合する。
【0010】
【数2】
【0011】
【数3】
【0012】
【数4】
【0013】
【数5】
【0014】
その好ましい変形形態において、訓練されたRNNの評価は、培養データの第2サブセット、いわゆる評価セットに基づいてLossを計算することによって実行され、第2サブセット(評価セット)は訓練に使用されるデータの第1サブセット(訓練セット)とは異なる。
【0015】
本発明の方法の特定の実施形態において、エレメンタリフラックスモードのモード行列Mは、モード分解の方法によって得られる。好ましくは、本方法は以下のステップを含む:
・全ての代謝フラックスのセットを変換して可逆反応を分離し、全ての不可逆反応のセットを得る;
・エレメンタリフラックスモードを得るために再帰的に適用される目的関数および不活性リアクタの不活性化を最小化する、目的関数は以下で表される:
min(Numrxns,vnonzero
Numrxns,vnonzeroは非ゼロフラックスの反応の個数
・すべての同定されたエレメンタリフラックスモードを収集し、それらをモード行列Mに積み重ねる。
【0016】
この態様によれば、本発明は(i)リアクタモデル、細胞外反応モデル、および細胞モデル、(ii)機械学習ステップ(すなわち、ニューラルネットワーク)、および(iii)実際の生物学的システムに対して適用されるプロセス最適化ステップ、を表すデジタルツインを提供する。
【0017】
リアクタモデルは、培養システムへの/培養システムからのすべての入出力を含む。これは、供給、サンプリング(および補償)、細胞出血、および透過物流出を含むが、これらに限定されない。従ってリアクタモデルは、液体および気体の交換を表しているとともに、培養システムへの/培養システムからの基質、生成物、およびバイオマスの関連する交換を表している。
【0018】
細胞外反応モデルは、培養培地中で起こる全ての化学反応を含む。これは、グルタミンのような代謝産物の酸化または抗体のような産物の断片化のような分解プロセスを含むが、これらに限定されない。
【0019】
細胞モデルには、すべての既知の代謝経路が含まれる。これは、解糖、アミノ酸代謝、アミノ酸分解、DNA/RNA、タンパク質、脂質、炭水化物の形成、グリコシル化、呼吸および細胞内コンパートメント間の輸送ステップ、ならびにサイトゾルと細胞外環境との間の輸送ステップなどの輸送ステップを含む。エレメンタリフラックスモードの計算のために、セルモデルにおける個々の化学量論的反応および輸送ステップの元素および電荷バランスが保証されなければならない。
【0020】
機械学習ステップは、訓練のための入力として実際の(すなわち、実験的である)培養データを受信するニューラルネットワークf(t)を含む。次に、この訓練されたニューラルネットワークは、前の時点のプロセス状態に基づいて、各時点におけるプロセスに関与するバイオマスを含む全ての化合物の消費および生産速度を含むベースモードのフラックスを予測する。
【0021】
【数6】
【0022】
本発明の好ましい実施形態によるマトリックスを以下により詳細に説明する:
【0023】
【数7】
【0024】
【数8】
【0025】
本発明の好ましい実施形態において、ニューラルネットワーク構造はニューラルネットワークf(t)ハイパーパラメータに基づいてセットアップされる。ニューラルネットワークのハイパーパラメータは以下を含むことができるが、これらに限定されない:一般化パラメータ(バッチサイズおよびドロップアウト速度)、学習速度、オプティマイザタイプ、およびニューラルネットワークのトポロジ(すなわち、隠れ層の数および層当たりのニューロンの数)。
【0026】
本発明の好ましい実施形態において、培養データの前処理が実施される。培養データの前処理の好ましい変形は以下のステップを含む:(i)量子化:実際の測定の時点をデータサンプリング期間にマッピングするステップ、(ii)ユニット変換:すべてのデータのユニットが一貫するように変換するステップ、(iii)欠落データ点の補償:特に補間によって欠落データ点を埋めることを目的とするステップ。
【0027】
本発明の好ましい実施形態において、デジタルツインは、3つの連続するステップ、すなわち、フラックス解析、モード分解、および再帰的ニューラルネットワーク(RNN)による訓練/検証、によって構築することができる。
【0028】
以下では本発明の好ましい実施形態によるフラックス分析のステップをより詳細に説明する:細胞フラックスを定量化するために、フラックス分析は以下の2つの連続するステップによって実施される:(i)フェーズ探索および交換速度推定、続いて(ii)代謝フラックス分析(MFA)。
【0029】
【数9】
【0030】
バイオマス増殖は、各フェーズ内の準定常状態を考慮して異なるフェーズに分けられる。これは、増殖速度、バイオマス特異的フラックス、および交換レートが一定であると考えられることを意味する。
【0031】
その好ましい態様によれば、フェーズ探索の全体的な手順は、3回ネストされた最適化アルゴリズム(図4)である。本発明のこの好ましい態様は、以下を提供する:
【0032】
・バイオマスの成長速度と、バイオマス以外のすべての化合物の速度を推定することに関する線形凸問題であり、各推定フェーズに対応する。
【0033】
・フェーズ境界の最適化された位置を見つけるグローバル連続問題であり、局所最小値を有し、グローバルオプティマイザを使用してそれを解くことができる。
【0034】
・推定された量と測定された量との間の2乗誤差の和(SSE)を最小化することによって、フェーズの最良の数を定義する、離散最適化問題。
【0035】
要約すると、線形凸問題の解は交換レートを提供し、グローバル連続問題はフェーズ境界の最適化された位置を見出し、離散最適化問題はフェーズの最良の数を推定する。フェーズ探索および交換レート推定への入力は培養データであり、出力は推定された細胞外レート(すなわち交換レート)および推定されたフェーズ境界である。フェーズ探索および交換速度推定を適用することによって、各推定フェーズに対応するすべての化合物の細胞交換速度が定量化される。
【0036】
以下では本発明の好ましい実施形態による代謝フラックス分析(MFA)をより詳細に説明する:各フェーズ内のすべての化合物の推定交換速度が与えられると、本発明のこの好ましい実施形態の次のステップは、各フェーズに対応する細胞内速度を定量化することである。
【0037】
細胞内フラックスはAntoniewiczら[1]の研究に基づいて計算されるが、本発明のこの好ましい実施形態によれば、目的関数は加重平均2乗誤差(WMSE)であり、複雑さを制御するペナルティ係数が目的関数に追加されるという実質的な違いがある:
【0038】
【数10】
【0039】
【数11】
【0040】
さらに、本発明の好ましい実施形態によれば、タンパク質鎖伸長のためのエネルギ消費が考慮される。それぞれの個々の伸長工程は、ADPおよび無機リン酸Pへ加水分解される4つのATP分子と同等のものを犠牲にして実施される。対応する部分反応ATP+HO→ADP+Pは、加水分解反応を提供する他の等価なエネルギを表す。例えばGTP+HO→GDP+Pまたは0.5ATP+HO→0.5AMP+Pである。
【0041】
【数12】
【0042】
別の実施態様において、本発明はグリコシル残基などのアミノ酸以外の他の成分を含む生成物の形成も含む。
【0043】
以下では、本発明の好ましい実施形態によるエレメンタリフラックスモードを得るためのモード分解のステップを説明する。標準的な方法でエレメンタリフラックスモードの完全なセットを計算することは、計算コストが高く、ゲノム規模の代謝ネットワークにおいては組み合わせ爆発につながる。本発明の好ましい態様によるエレメンタリフラックスモードを導出するために、Chan 等[2](c.f.図6)によって提案された方法を、目的関数の修正とともに適用する:
min(Numrxns,vnonzero
ここで、Numrxns,vnonzeroは、ゼロでないフラックスの反応数である。この変更は使用される反応の数を最小限にし、エレメンタリフラックスモードの反応数を最小にする。次いで、エレメンタリフラックスモードは、本発明の再帰的ニューラルネットワーク(RNN)を訓練するための入力としてモード行列Mの形態で使用することができる。
【0044】
以下では、本発明の好ましい実施形態による再帰的ニューラルネットワーク(RNN)をより詳細に説明する。RNNは、中間状態モデル、ニューラルネットワークf(t)、フラックスベースのレート推定、および指数成長モデルからなる(図7)。RNNは、細胞の供給、代謝、および成長をシミュレートするために使用される。中間状態モデルは培養量を更新し、ニューラルネットワークf(t)への入力である中間状態ベクトルを計算する。次に、ニューラルネットワークf(t)は、ベースフラックスモードを更新する。更新されたベースフラックスモードは、次の時間ステップにおける細胞とそれらの環境との間の交換レートを得るために、減少された化学量論的マトリックス上に再投影される。次に、指数成長モデルを使用して、代謝ネットワークからの細胞外速度に基づいて次の時間ステップの状態ベクトルを更新する(図7)。
【0045】
【数13】
【0046】
【数14】
【0047】
【数15】
【0048】
【数16】
【0049】
【数17】
【0050】
【数18】
【0051】
以下では、本発明の好ましい実施形態によるRNNのトレーニングおよび評価または検証をより詳細に説明する。RNNの訓練中、ニューラルネットワークの重みW、バイアスb、およびHマトリックスは、培養データの訓練セット、すなわちいくつかの培養ランのサブセットに基づいて訓練される。ニューラルネットワークは細胞の動態を表し、H行列は、モード縮小/組み合わせ行列である。
【0052】
【数19】
【0053】
本発明の好ましい実施形態において、培養データのトレーニングセットを使用してRNNのトレーニングに成功した後、トレーニングされたRNNの性能は、トレーニングセットとは異なる培養データの評価セットを使用して評価される(図9参照)。トレーニングされたRNNの性能は、培養工程化合物の測定された濃度と予測された濃度との間のR2尺度を用いて評価される。トレーニングされたRNNのパフォーマンスを評価するために、代替的にまたは追加的に、他のパフォーマンス測定値を使用することができる。
【0054】
このモデルは、ハイパーパラメータを使用する。本発明の好ましい実施形態において、格子探索を使用して、モデルの最高の予測能力につながるハイパーパラメータの最適値を自動的に見つける(すなわち、最良のR2 測度に基づいて実施する、上記を参照)。本発明の好ましい実施形態において、最良のハイパーパラメータセットが与えられると、モデルは完全なトレーニングセットで再トレーニングされる。
【0055】
トレーニングおよびRNNの評価を終了した後、デジタルツインは、プロセスを最適化するために容易に使用することができる。
【0056】
第2態様において、本発明は、このデジタルツインを使用するための方法を提供し、これにより、特定のプロセス最適化目的を達成するために、実際のバイオテクノロジープロセスのプロセス仕様を最適化する。プロセス仕様は特に、供給媒体の組成物および供給戦略から選択されるが、これらに限定されない。プロセス最適化目的は特に以下から選択されるが、これらに限定されるものではない:所与のプロセス最適化制約(例えば発酵槽容量、供給量、供給時点、および化合物濃度など)内における、生成物濃度の最大化、生産性、生成物品質の改善、およびバイオマス濃度の最大化。
【0057】
この態様によれば、本発明は、細胞培養プロセスの培養データからリアクタシステムにおける細胞培養プロセスのための最適化されたプロセス仕様を提供するための方法を提供する。本法は以下を有する:
・細胞培養工程の培養データを取得するステップ;
・本発明の第1態様の方法によって得られるデジタルツインを適用することによって、取得した培養データから、少なくとも1つの最適化されたプロセス仕様を適合または生成するステップ。
【0058】
【数20】
【0059】
第3の態様において、本発明は、リアクタシステムにおける生物細胞の培養のための方法を提供する。この方法は、本発明の第2態様による方法によって提供される少なくとも1つの最適化されたプロセス仕様を用いて、リアクタシステム内で生物細胞を培養するステップを含む。より詳細には、この態様によれば、本発明は、細胞培養プロセスの培養データからリアクタシステムにおける細胞培養プロセスのための最適化されたプロセス仕様を提供するための方法に関するものであり、以下のステップを有する:
・細胞培養工程の培養データを取得するステップ;
・本発明の第1態様の方法によって得られるデジタルツインを適用することによって、取得した培養データから、少なくとも1つの最適化されたプロセス仕様を適合または生成するステップ。
【0060】
この態様によれば、最適化されたプロセス仕様は、バイオテクノロジー生産プラントを運転するために使用される。例えば、供給スキームが最適化される本発明の好ましい実施形態においては、供給ポンプを制御する装置(例えば、コンピュータ)は、最適化された供給スキームを入力として使用するソフトウェアに従って動作する。
【0061】
好ましくは、プロセス仕様は、以下から選択される1つ以上の仕様に関して最適化される:供給ストラテジー、培地組成物、重量モル浸透圧濃度、培地pH、pO、温度。
【0062】
第4の態様において、本発明は、リアクタシステムにおける生物学的細胞培養の自動制御のためのデバイスを提供する。より詳細にはこの態様によれば、本発明は、リアクタシステムにおける実施中の生物学的細胞培養プロセスの自動制御のための装置に関する。本デバイスは以下を備える:
・プロセッサを含むコンピューティングデバイス、および
・プログラムコードおよび本発明の第1態様の方法に従って入手可能なデジタルツインを記憶するメモリ。
【0063】
本発明によれば、プログラムコードは、前記プロセッサ上で実行されると、コンピューティングデバイスに次のことを実施させる:
・リアクタシステム内の実施中の細胞培養から培養データを取得する、
・取得した培養データからリアクタシステムのプロセス仕様を調整または生成する。
【0064】
プログラムされたコントローラは、好ましくはオンラインでの生体細胞培養プロセスの実行におけるプロセス仕様を適応または最適化するために適用される。細胞培養プロセスは好ましくは閉ループフィードバックシステムで制御され、ここで、デジタルツインはリアクタに取り付けられたオンラインセンサから、および離散時間点におけるサンプリングから、リアルタイム情報、すなわち細胞培養データを受け取る。このサンプリングされた情報はデジタルツインを更新し、その結果、プロセスの連続的な最適化につながる。オンラインセンサは、pH、酸素飽和度、バイオマス濃度、温度、赤外線、またはラマンスペクトルなどを測定する。離散サンプリングは、化合物の濃度および/または生成物の品質に関する情報を与える。化合物は、好ましくは以下から選択されるがこれらに限定されない:アンモニア、グルタミン、グルコース、および乳酸。生成物の品質は、以下から選択されるがこれらに限定されない:生成物の断片化、およびグリコシル化パターン。
【0065】
この態様によれば、本発明はまた、生物学的細胞培養物の培養のためのリアクタシステムに関する。このリアクタシステムは、生物学的細胞培養物の自動制御のための前記デバイスおよびリアクタを含む。
【0066】
さらなる態様において、本発明は、第1態様による実際の生物学的細胞培養工程のデジタルツインを構築するための本発明の方法を実行する自動計算手段に関する。したがって本発明は、細胞培養プロセスのためのデジタルツインを構築するプログラムコードを格納した、一時的でないコンピュータ可読記憶媒体を提供する。このプログラムコードはコンピュータによって実行されると、コンピュータに、第1態様の方法の命令ステップを実行させる。
【0067】
【数21】
【0068】
このさらなる態様によれば、本発明はまた、デジタルツインの構築のための計算システムを提供する。計算システムは以下を含む:
・プロセッサを含むコンピューティングデバイス、および
・前記プロセッサによって実行されると、コンピュータに第1態様の方法の命令ステップを実行させるデジタルツインを構築するための命令を記憶するメモリ。
【0069】
【数22】
【0070】
【表1】
【0071】
【0072】
【0073】
【0074】
【0075】
【0076】
【0077】
【表2】
【0078】
<図面の詳細な説明>
図1は、本発明によるデジタルツイン(100)の構成ブロックおよび構造を概略的に示す。デジタルツイン (100)は、培養系への全てのインレットおよびアウトレットを記述するリアクタモデル(110)、培養培地中の全ての化学反応を記述する細胞外反応モデル(120)、および、細胞代謝と増殖を含む細胞の動態を記述する細胞モデル(130)を含む。細胞モデル(130)の動態は、細胞代謝、すなわち代謝ネットワーク(131)をニューラルネットワーク(132)と結合させることによって得られる。
【0079】
図2は、本発明による動作モードにおけるデジタルツイン(200)を概略的に示す。実際の細胞培養物(210)からの培養データ(211)は、デジタルツイン(200)の訓練および確認のために使用される。デジタルツイン(200)は次に、細胞培養性能(例えば、生産性および増殖)および/または細胞培養(210)によって産生される産物の品質を最適化すること(201)を目的とする予測のために使用される。
【0080】
図3は、本発明の好ましい実施形態による方法のための実施されたワークフローを示す:プロセス仕様を開始(300)、すなわち培養データが受信され、プロセス仕様(320)は改善されたプロセスを得るために自動的に最適化される。本発明の方法(310)の戦略は、完全に自動かつ自律的なプロセスに基づく。自律プロセスは好ましくは、細胞培養データの初期前処理(311)、そこから細胞内フラックスの最良の推定を得るためのフラックス分析(312)、計算されたフラックスデータのモード分解(313)、および計算されたフラックスデータに基づいて訓練される新規な再帰代謝ネットワークモデル(RNN)(314)の適用を含む。次に、訓練されたRNN(314)を自動化されたプロセス最適化ステップ(315)に対して適用して、改善されたプロセス仕様(320)を得る。
【0081】
図4は、本発明の好ましい実施形態による、フェーズ検索および交換レート推定アルゴリズム(400)のプロセスのフローチャートを示す。フェーズ探索アルゴリズムは、3回ネストされた最適化問題である。線形凸問題は、交換レートの推定を解く。大域的連続問題はフェーズ境界の最適化位置を見つけ、離散最適化問題は最良のフェーズ数を推定する。一点鎖線は、それぞれ、線形凸問題(410)を示す。線形凸問題は、大域最適化問題(420)内でネストしている。大域最適化問題(420)は、離散最適化問題(430)内でネストしている。フェーズ探索および交換速度推定への入力は、培養プロセス仕様(401)および(代謝産物)濃度測定の時系列(402)によって反映される培養データである。このモジュールのアウトプットは、推定された細胞外速度(441)、すなわち、交換速度、および培養プロセスの増殖フェーズの検出されたフェーズ境界(442)である。
【0082】
図5は、本発明の好ましい実施形態による代謝フラックス分析(MFA)アルゴリズム(500)のフローチャートを示す:MFAへの入力は、フェーズ探索および交換速度推定(図4参照)から得られる推定細胞外速度(501)、および現在の培養プロセスの代謝ネットワーク(502)である。MFAの出力は、推定された細胞内代謝フラックスのセットである(510)。
【0083】
図6は、本発明の好ましい実施形態によるモード分解アルゴリズム(600)のフローチャートを示す:モード分解アルゴリズム(600)への入力は、MFAから導出された代謝フラックス(601)(図5参照)、および現在の培養プロセスの代謝ネットワーク(602)である。出力はエレメンタリフラックスモード(EFM)の行列M(603)であり、「F_removed」は、アルゴリズムの各反復ステップで識別されたエレメンタリフラックスを除去した後に残ったフラックスの総数を示す。
【0084】
図7Aおよび7Bは、本発明の好ましい実施形態によるトレーニング可能な再帰代謝ネットワークモデル(RNN)のフローチャートを示す:RNNは、4つの別個の部分、すなわち、中間状態モデル(710)、ニューラルネットワーク(720)、フラックスベースのレート推定(730)、および指数成長モデル(740)を含む。パネル(700)は、単一のRNNステップの数学的表現を詳細に示す。各RNNステップへの入力は、初期状態(第1ステップ)または先行するRNNステップのいずれかからの化合物濃度および培養体積である。各RNNステップの出力は、「更新された」化合物濃度および培養体積である。RNNの各ステップへのさらなる入力は、連続的な(すなわち、供給に関連する)培養体積変化ΔV(t)、供給ΔN(t)に起因する化合物量変化、および非連続的な(すなわち、サンプリングに関連する)培養体積変化ΔV(t)である。
【0085】
【数23】
【0086】
図9は、本発明の好ましい実施形態によるRNNのトレーニングおよび検証のフローチャートを示す:入力は、代謝ネットワーク(902)、エレメンタリフラックスモードのマトリックス(901)、培養データのトレーニングセット(905)、培養データ全体のサブセット、ハイパーパラメータである。バイパーパラメータは例えば、縮減モードの数(904)、隠れ層の数、またはニューラルネットワークの層当たりのニューロン数である。破線は、RNNをトレーニングするための最適化ループ(910)を示す。トレーニングが成功した後、RNNは、訓練されたH行列(907)と、ニューラルネットワークの学習された重み(W)およびバイアス(b)(906)とを返す。
【0087】
図10は、本発明の好ましい実施形態によるプロセス最適化アルゴリズム(1000)のフローチャートを示す:プロセス最適化への入力は、事前設定されたプロセス最適化制約(1001)、訓練された再帰代謝ネットワーク(H,W,b)(1002)(図9参照)、および意図しているプロセス最適化の1つまたは複数の最適化目標(1003)である。出力は、最適化された培養プロセス仕様のセットである(1004)。
【0088】
図11は、本発明の好ましい実施形態による、自動化プロセス全体およびプロセス内部のすべてのデータフローのフローチャートを示す。
【0089】
図12は、訓練データセット(左パネル)および評価データセット(右パネル)に対する本発明によるモデルの性能をそれぞれ示す。R2 は、このモデルの予測能力を定量化するために使用される。両方のパネルについて、x軸およびy軸は、それぞれ、測定された濃度および予測された濃度を示す。
【0090】
図13は、本発明による単一細胞培養プロセス全体にわたるバイオマス(左パネル)および生成物(右パネル)についての、測定された(正方形)、予測された(破線)、最適化された(実線)、および実験的に実施された(星印)濃度のグラフを示す。この実施例において、プロセス最適化の目的は、生成物力価を増加させることであった。本発明によるアルゴリズムによって提供される最適化されたプロセス仕様は、より高い生成物力価をもたらす(星形を正方形と比較されたい)。
【0091】
図14は、バイオマスおよび生成物に加えて、すべての化合物について実験的に測定された(正方形)、予測された(破線)、および最適化された(実線)濃度を示す。
【0092】
<実施例>
以下に、本発明の教示を用いることによって最終力価を増加させるために、供給および培地がどのように最適化されるかを示す。
【0093】
リアクタセットアップを含む実験セットアップ。グルタミン合成酵素(GS)発現系を介してIgGモノクローナル抗体(mAb)を発現する工業的組み換えチャイニーズハムスター卵巣(CHO)細胞系を、この実施例で使用する。モノクローナル抗体のアミノ酸組成(モル%)は、Ala 5.4、Arg 3.9、Asn 2.6、Asp 4.3、Cys 4.1、Glu 5.8、Gln 4.2、Gly 3.0、His 4.2、Ile 4.1、Leu 6.3、Lys 4.3、Met 2.2、Phe 3.0、Pro 8.3、Ser 10.2、Thr 5.3、Try 5.5、Tyr 4.2、Val 9.1であった。
【0094】
増殖の間、細胞を振盪フラスコ中で培養し、36℃および5% CO2の加湿インキュベーター中で維持した。細胞を化学的に規定された培地中で3~4日ごとに継代した後、0.5~1×106細胞/mlで24ambr(登録商標)15リアクター(サルトリウス、ゴッティンゲン、ドイツ)に播種した。基礎培地ActiCHO-P(GEヘルスケア)に4mM L-グルタミンを補充し、播種前にリアクタに添加して、接種後の開始体積が10mLになるようにした。3つの供給システムを使用した:供給者の情報に基づくActiCHO FeedTM-A(feed)およびActiCHO FeedTM-B(feed、GEヘルスケア)および2500mMグルコースを含むグルコース供給(feed)。feedとfeedの1日の供給量は、細胞培養量の3%および0.3%であった。feedを追加することにより、グルコース濃度を3g/L超に維持した。さらなる分析のために、1mLを3、5、7、10、12および14日目に試料採取した。
【0095】
細胞数、生存率、および細胞直径は、ViCell(Beckman Coulter、Brea、カリフォルニア、USA)によって測定した。試料中のグルコース、乳酸塩、およびアンモニア濃度を、BioProfile Flex分析器(Nova Biomedical、Waltham、マサチューセッツ、USA)によって分析し、アミノ酸を高速液体クロマトグラフィー(HP-LC)によって測定した。モノクローナル抗体(mAb)の力価を、プロテインAカラムを用いたHPLCによって測定した。
【0096】
代謝ネットワーク。Hefziら[3]のCHO代謝ネットワークを、ソフトウェアInsilico Discovery(商標)(Insilico Biotechnology AG、Stuttgart、ドイツ)を使用してインポートした。次いで、代謝ネットワークの化学量論的マトリックスSを、さらなる処理のためにデジタルツインに移した。
【0097】
細胞外ネットワーク。この実施例では、細胞外反応ネットワークは考慮されなかった。
【0098】
トレーニングと評価。データセットをトレーニングセット(80%)および評価セット(20%)に分割した。デジタルツインは、トレーニングセット内の測定濃度を学習した。その後、評価セットを用いてデジタルツインの予測力を評価した(図12参照)。ニューラルネットワークf(t)は各層にそれぞれ30個および20個のニューロンを有する2つの隠れ層を含み、ベースフラックスモードの数は10であった。
【0099】
プロセス最適化。デジタルツインを用いてプロセスを最適化した。最適化は、feedとfeedの供給レジームおよび培地組成を適合させることによって、産物力価を実験的に増加させることを目的とした(図13の正方形と星形を比較されたい)。各供給の毎日の体積添加は、0~1mLの間に制限した。供給は、リアクタの動作範囲(10~15mL)によってさらに制限された。媒体成分は、それらの溶解限界によって境界を定められた。バイオマスおよび生成物とは別に、デジタルツインは、プロセス期間にわたる全ての化合物の濃度を学習した(図14を参照のこと)。
【0100】
結論として、この特定の実施例において、プロセス最適化の目的は、生成物力価を増加させることであった。この実施例は、本発明によって提案される最適化されたプロセス仕様が有意に高い産物力価をもたらすことを証明している(図13)。
【0101】
<引用文献>
[1] Antoniewicz, M. R., Kelleher, J. K., & Stephanopoulos, G. (2006). Determination of confidence intervals of metabolic fluxes estimated from stable isotope measurements. Metabolic engineering, 8(4), 324-337.
[2] Chan, S.H.J. & Ji, P. (2011). Decomposing flux distributions into elementary flux modes in genome-scale metabolic networks. Bioinformatics 27, 2256-2262.
[3] Hefzi et al. (2016). A Consensus genome-scale reconstruction of Chinese Hamster Ovary (CHO) cell metabolism. Cell Systems, 3(5), 434-44.
図1
図2
図3
図4
図5
図6
図7A
図7B
図8
図9
図10
図11
図12
図13
図14
【国際調査報告】