(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-19
(54)【発明の名称】細胞培養の予測モデル化及び制御
(51)【国際特許分類】
C12N 1/00 20060101AFI20231012BHJP
C12M 1/00 20060101ALI20231012BHJP
C12M 1/34 20060101ALI20231012BHJP
【FI】
C12N1/00 B
C12M1/00 D
C12M1/34 D
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023519646
(86)(22)【出願日】2021-09-22
(85)【翻訳文提出日】2023-05-25
(86)【国際出願番号】 US2021051570
(87)【国際公開番号】W WO2022072198
(87)【国際公開日】2022-04-07
(32)【優先日】2020-10-01
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】500049716
【氏名又は名称】アムジエン・インコーポレーテツド
(74)【代理人】
【識別番号】110001173
【氏名又は名称】弁理士法人川口國際特許事務所
(72)【発明者】
【氏名】コダバンデル,ハミド
(72)【発明者】
【氏名】ワン,トニー・ワイ
(72)【発明者】
【氏名】トゥルシャン,アディティア
【テーマコード(参考)】
4B029
4B065
【Fターム(参考)】
4B029AA02
4B029AA07
4B029BB01
4B029DF03
4B029DF06
4B029FA11
4B029FA12
4B065AA01X
4B065AA57X
4B065AA72X
4B065AA87X
4B065BD36
4B065CA44
(57)【要約】
細胞培養プロセスを制御する方法は、細胞培養プロセス中の1つ以上の時間区間の各時間区間について、細胞培養物に関連する1つ以上の細胞培養物属性の現在値を取得すること、細胞培養物に関連する特定の細胞培養物属性の1つ以上の将来値を予測すること、及び細胞培養プロセスへの1つ以上の物理的入力を制御することを含む。将来値を予測することには、細胞培養物属性の現在値、及び細胞培養物属性のうちの少なくとも1つの以前の値を、履歴データを使用したデータ駆動型予測モデルへの入力として適用することが含まれる。物理的入力を制御することには、将来値をモデル予測制御器への入力として適用することが含まれる。
【特許請求の範囲】
【請求項1】
細胞培養プロセスを制御する方法であって、前記細胞培養プロセス中の1つ以上の時間区間について、
手動サンプリング又はシミュレーションから、細胞培養物に関連する1つ以上の細胞培養物属性の現在値を取得すること;
データ駆動型予測モデルへの入力として、(i)前記1つ以上の細胞培養物属性の前記現在値、及び(ii)以前の時間区間において手動サンプリング又はシミュレーションから取得された、前記1つ以上の細胞培養物属性のうちの少なくとも1つの以前の値を少なくとも適用することにより、処理ハードウェアによって、前記細胞培養物に関連する特定の細胞培養物属性の1つ以上の将来値を予測すること;並びに
モデル予測制御器への入力として前記1つ以上の将来値を適用する前記処理ハードウェアによって、前記細胞培養プロセスへの1つ以上の物理的入力を制御すること、
を含む、方法。
【請求項2】
前記データ駆動型予測モデルが、回帰モデルである、請求項1に記載の方法。
【請求項3】
前記現在値を取得することが、現在の時間区間の間に前記現在値を取得することを含み;且つ
前記特定の細胞培養物属性の前記1つ以上の将来値を予測することが、前記1つ以上の細胞培養物属性の第1の細胞培養物属性について、前記データ駆動型予測モデルへの入力として、(i)前記第1の細胞培養物属性の前記現在値、(ii)前記現在の時間区間の前に生じた第1の先行する時間区間の間に取得された前記第1の細胞培養物属性の値、及び(iii)前記第1の先行する時間区間の前に生じた第2の先行する時間区間の間に取得された前記第1の細胞培養物属性の値を適用することを含む、請求項2に記載の方法。
【請求項4】
前記1つ以上の時間区間の前に生じる1つ以上の追加の時間区間について、
現在の時間区間の間に、前記1つ以上の細胞培養物属性の追加の現在値を取得すること;
異なる回帰モデルへの入力として取得された、(i)前記1つ以上の細胞培養物属性の前記追加の現在値、(ii)前記第1の細胞培養物属性の追加の値を少なくとも適用することにより、前記処理ハードウェアによって、前記特定の細胞培養物属性の追加の1つ以上の将来値を予測すること;及び
前記モデル予測制御器への入力として前記追加の1つ以上の将来値を適用する前記処理ハードウェアによって制御すること、
を更に含む、請求項3に記載の方法。
【請求項5】
前記データ駆動型予測モデルが、ニューラルネットワークである、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記ニューラルネットワークが、フィードフォワードニューラルネットワークである、請求項5に記載の方法。
【請求項7】
前記細胞培養物に関連する前記1つ以上の細胞培養物属性の前記現在値を取得することが、
前記細胞培養物の1つ以上のラマン分光法測定値を取得すること;及び
前記1つ以上のラマン分光法測定値に基づいて、前記1つ以上の細胞培養物属性のうちの少なくとも1つの前記現在値を決定すること、
を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記1つ以上の細胞培養物属性が、(i)1つ以上の代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、(iv)生存率、又は(v)添加された供給量のうちの1つ以上を含み;且つ
前記特定の細胞培養物属性が、(i)代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、又は(iv)生存率のうちの1つである、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記特定の細胞培養物属性の前記1つ以上の将来値を予測することが、少なくとも2つの異なる日のそれぞれについて将来値を予測することを含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記細胞培養プロセスへの前記1つ以上の物理的入力を制御することが、前記細胞培養物に導入されるグルコースの量を制御することを含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
1つ以上の非一時的コンピュータ可読媒体格納命令であって、計算システムの処理ハードウェアによって、且つ細胞培養プロセス中の1つ以上の時間区間に対して実行されたとき、前記計算システムを、
手動サンプリング又はシミュレーションから、細胞培養物に関連する1つ以上の細胞培養物属性の現在値を取得するようにさせる;
データ駆動型予測モデルへの入力として、(i)前記1つ以上の細胞培養物属性の前記現在値、及び(ii)以前の時間区間において手動サンプリング又はシミュレーションから取得された、前記1つ以上の細胞培養物属性のうちの少なくとも1つの以前の値を少なくとも適用することにより、前記細胞培養物に関連する特定の細胞培養物属性の1つ以上の将来値を予測するようにさせる;且つ
モデル予測制御器への入力として前記1つ以上の将来値を適用することにより、前記細胞培養プロセスへの1つ以上の物理的入力を制御するようにさせる、
1つ以上の非一時的コンピュータ可読媒体格納命令。
【請求項12】
前記データ駆動型予測モデルが、回帰モデルである、請求項11に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項13】
前記現在値を取得することが、現在の時間区間の間に前記現在値を取得することを含み;且つ
前記特定の細胞培養物属性の前記1つ以上の将来値を予測することが、前記1つ以上の細胞培養物属性の第1の細胞培養物属性について、前記データ駆動型予測モデルへの入力として、(i)前記第1の細胞培養物属性の前記現在値、(ii)前記現在の時間区間の前に生じた第1の先行する時間区間の間に取得された前記第1の細胞培養物属性の値、及び(iii)前記第1の先行する時間区間の前に生じた第2の先行する時間区間の間に取得された前記第1の細胞培養物属性の値を適用することを含む、請求項12に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項14】
前記データ駆動型予測モデルが、ニューラルネットワークである、請求項13に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項15】
前記1つ以上の細胞培養物属性が、(i)1つ以上の代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、(iv)生存率、又は(v)添加された供給量のうちの1つ以上を含み;且つ
前記特定の細胞培養物属性が、(i)代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、又は(iv)生存率のうちの1つである、請求項11~14のいずれか一項に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項16】
前記細胞培養プロセスへの前記1つ以上の物理的入力を制御することが、前記細胞培養物に導入されるグルコースの量を制御することを含む、請求項11~15のいずれか一項に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項17】
細胞培養プロセス中に細胞培養物を保持するように構成されたバイオリアクタと;
前記細胞培養プロセスへの物理的入力を提供するように構成された、1つ以上の電子制御可能な入力デバイスと;
前記細胞培養物に関連する1つ以上の細胞培養物属性を測定するように構成された1つ以上の分析機器と;
前記細胞培養プロセス中の1つ以上の時間区間について、
データ駆動型予測モデルへの入力として、(i)手動サンプリング又はシミュレーションからの前記1つ以上の細胞培養物属性の現在値、及び(ii)以前の時間区間において手動サンプリング又はシミュレーションから取得された、前記1つ以上の細胞培養物属性のうちの少なくとも1つの以前の値を少なくとも適用することにより、前記細胞培養物に関連する特定の細胞培養物属性の1つ以上の将来値を予測し;且つ
少なくとも、前記1つ以上の将来値をモデル予測制御器への入力として適用して前記1つ以上の電子制御可能な入力デバイスの1つ以上の制御設定値を生成することにより、前記細胞培養プロセスへの1つ以上の物理的入力を制御するように構成された、計算システムと、
を備えた、システム。
【請求項18】
前記データ駆動型予測モデルが、回帰モデルである、請求項17に記載のシステム。
【請求項19】
前記現在値を取得することが、現在の時間区間の間に前記現在値を取得することを含み;且つ
前記特定の細胞培養物属性の前記1つ以上の将来値を予測することが、前記1つ以上の細胞培養物属性の第1の細胞培養物属性について、前記データ駆動型予測モデルへの入力として、(i)前記第1の細胞培養物属性の前記現在値、(ii)前記現在の時間区間の前に生じた第1の先行する時間区間の間に取得された前記第1の細胞培養物属性の値、及び(iii)前記第1の先行する時間区間の前に生じた第2の先行する時間区間の間に取得された前記第1の細胞培養物属性の値を適用することを含む、請求項18に記載のシステム。
【請求項20】
前記データ駆動型予測モデルが、ニューラルネットワークである、請求項19に記載のシステム。
【請求項21】
前記1つ以上の細胞培養物属性が、(i)1つ以上の代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、(iv)生存率、又は(v)添加された供給量のうちの1つ以上を含み;且つ
前記特定の細胞培養物属性が、(i)代謝産物レベル、(ii)生細胞密度、(iii)総細胞密度、又は(iv)生存率のうちの1つである、請求項17~20のいずれか一項に記載のシステム。
【請求項22】
前記1つ以上の電子制御可能な入力デバイスが、グルコースポンプを含み;且つ
前記細胞培養プロセスへの前記1つ以上の物理的入力を制御することが、前記グルコースポンプを介して前記細胞培養物に導入されるグルコースの量を制御することを含む、請求項17~21のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、全般的に、(例えば、バイオリアクタ内での)細胞培養に関し、より具体的には、測定された細胞培養物属性値に基づいた、(測定された又は非測定の)細胞培養物属性の予測及び制御に関する。
【背景技術】
【0002】
特定のバイオ医薬品(例えば、バイオ治療用タンパク質)の製造では、バイオリアクタを使用して細胞を培養した後、所望の医薬品を回収する。そのような医薬品の安定した生産には、一般に、バイオリアクタが均衡のとれた一定のパラメータ(例えば、細胞代謝濃度)を維持することが必要であり、これは、ひいては、厳密なプロセス監視及び制御を必要とする。しかしながら、細胞培養環境は動的且つ複雑であるため、一般に、物理的入力(例えば、供給量、温度、グルコース注入など)を、所望の細胞培養物属性(例えば、生細胞密度、グルコースレベルなど)がもたらされるように細胞培養プロセスに適用することは困難である。細胞培養プロセスをモデル化して細胞培養プロセスへの物理的入力を制御する取り組みを含めた、細胞培養プロセスを最適化するための様々な取り組みがなされてきた。しかしながら、モデル化及び制御は、ある程度は進展しているものの、細胞培養プロセスの複雑で非線形の挙動、関連する測定値の欠如、及び利用可能な実験データの欠如により、依然として相当な難題である。
【0003】
従来、バイオリアクタ内の栄養素レベルは、手動で、又はボーラス供給を介して従来の比例積分微分(PID)制御器を使用して制御されている(Mehdizadeh et al.,Generic Raman-Based Calibration Models Enabling Real-Time Monitoring of Cell Culture Bioreactors,Biotechnol.Prog.31(4),pp.1004-1013(2015)を参照されたい)。手動及びPID制御器がもたらす結果は許容可能ではあるが、製造プロセスには、例えば、増殖、収量の最大化、又は製品品質の最適な制御のための、更なる最適化に対する多くの可能性が依然として含まれている。バイオプロセスをモデル化するための機構的数理モデルも提案されている。例えば、パイロットプラントのバイオリアクタでグルコースレベルを制御するために、モデル予測制御器(MPC)とともに第一原理的な機構的モデルが提案されており(Craven et.al.,Glucose Concentration Control of a Fed-Batch Mammalian Cell Bioprocess Using a Nonlinear Model Predictive Controller,Journal of Process Control,24(4),pp.359-366(2014)を参照されたい)、この中で、モデルはプロセス状態変数の変化率及び非線形MPCを使用してバイオリアクタを制御した。そのアプローチでは、複数の一次常微分方程式がバイオリアクタのモデル化に使用される。しかしながら、バイオリアクタの正確な最終モデルを得るためには、この機構的アプローチではプロセスに関する広範な知識をモデルに適用する必要があり、結果として複雑なハイブリッドモデルとなる。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Mehdizadeh et al.,Generic Raman-Based Calibration Models Enabling Real-Time Monitoring of Cell Culture Bioreactors,Biotechnol.Prog.31(4),pp.1004-1013(2015)
【非特許文献2】Craven et.al.,Glucose Concentration Control of a Fed-Batch Mammalian Cell Bioprocess Using a Nonlinear Model Predictive Controller,Journal of Process Control,24(4),pp.359-366(2014)
【発明の概要】
【課題を解決するための手段】
【0005】
本明細書に記載のシステム及び方法は、一般に、履歴測定値及び機械学習を使用して、細胞培養プロセスの動的モデルを構築する。例えば、実世界の細胞培養プロセスからの履歴的(測定された)代謝産物濃度を使用して、動的なデータ駆動型予測モデルを訓練することができる。実世界のプロセスに適用した場合、モデルは、細胞培養物の現在の(例えば、リアルタイムの)測定値に基づいて、将来の細胞培養物属性(例えば、将来の代謝産物レベル)を予測することができる。モデルは、1つ以上の以前の時間区間で取得された測定値も、(例えば、当日及び更に当日の1日以上前に測定された代謝産物レベルを使用することにより)使用する。モデルは、例えば、ニューラルネットワーク又は回帰モデルであってよい。モデルにより出力された予測を、モデル予測制御器(MPC)に入力することができ、MPCには、所望の細胞培養物属性(例えば、生細胞密度、総細胞密度など)を最大化するように設定された目的関数がある。次に、MPCは、1つ以上の適切な制御処置(例えば、バイオリアクタにグルコースを添加する)を行って、細胞培養プロセスを所望の目的(例えば、最大生細胞密度など)に導くように細胞培養を管理及び制御することができる。
【0006】
本明細書に開示される技法は、細胞培養物属性の手動サンプリング及び/又は制御設定値の手動調整の必要性をなくすことができる。更に、非線形の細胞培養挙動及び履歴測定値を考慮に入れることにより、これらの技法は、他のモデル化及び制御技法と比較して予測精度の改善をもたらすことができる。MPCを用いた動的プロセスモデルにより、リアルタイムで細胞培養プロセスを調整及び学習することができるデータの双方向フローが可能となり得る。
【0007】
当業者には、本明細書に記載の図面が例証目的のために含まれており、本開示を限定するものではないことが理解されよう。図面は、必ずしも一定の縮尺ではなく、その代わりに本開示の原理を例証することに重点が置かれている。いくつかの例では、記載されている実施態様の理解を促進するべく、記載されている実施態様の様々な態様が誇張又は拡大された状態で示されている場合があることを理解されたい。図面中、様々な図面を通して同様の参照符号は、全般的に、機能的に類似する及び/又は構造的に類似する構成要素を指す。
【図面の簡単な説明】
【0008】
【
図1】細胞培養プロセスを監視及び制御するために使用することができる例示的システムの簡略化されたブロック図である。
【
図2】
図1のシステムに実装することができる例示的モデルのブロック図である。
【
図3】
図1及び/又は
図2のモデル予測制御器として使用することができるモデル予測制御器の例示的動作を示す。
【
図4】
図1及び/又は
図2の予測モデルによって行われる予測の例示的シーケンスを示す。
【
図5】
図1及び/又は
図2の予測モデルとして使用することができる例示的ニューラルネットワークを示す。
【
図6A】ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図6B】ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図6C】ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図6D】ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図6E】ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図7A】2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図7B】2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図7C】2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図7D】2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図7E】2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図8A】3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図8B】3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図8C】3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図8D】3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図8E】3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9A】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9B】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9C】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9D】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9E】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9F】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9G】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9H】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9I】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図9J】ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10A】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10B】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10C】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10D】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10E】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10F】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10G】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10H】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10I】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図10J】2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11A】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11B】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11C】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11D】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11E】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11F】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11G】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11H】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11I】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図11J】3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【
図12】細胞培養プロセスを制御する例示的方法のフロー図である。
【発明を実施するための形態】
【0009】
上記で導入として説明され、以下でより詳細に論じられる様々な概念は、多くの方法のうちのいずれかで実施することができ、記載される概念は、いかなる特定の実施態様の様式にも限定されるものではない。実施態様の例は、例証を目的として提供されている。
【0010】
図1は、細胞培養プロセスを手動で監視及び制御するために使用することができる例示的システム100の簡略化されたブロック図である。システム100は、バイオリアクタ102、1つ以上の分析機器104、計算システム106、モデルサーバ108、ネットワーク110、及び1つ以上の入力デバイス112を含む。
【0011】
バイオリアクタ102は、細胞培養物(培地内の生物及び/又はそこから得られる物質を含んでいてもよい)を支持する任意の適切な容器、デバイス、又はシステムであってよい。バイオリアクタ102は、例えば、研究目的、臨床使用、商業的販売、又は他の流通などのために、細胞培養物によって発現する組換えタンパク質を含有していてもよい。監視されるバイオ医薬品プロセスに応じて、培地は、特定の流体(例えば、「ブロス」)及び特定の栄養素を含んでいてもよく、目標pHレベル又は範囲、目標温度又は温度範囲などを有していてもよい。
【0012】
分析機器104は、計算システム106に通信可能に接続されており、バイオリアクタ102内の細胞培養物の1つ以上の属性を測定するように構成された1つ以上の任意のインライン、アトライン、及び/又はオフラインの機器を含んでいてもよい。例えば、分析機器104は、1つ以上の培地成分濃度、例えば、代謝産物レベル(例えば、グルコース、ラクテート、ナトリウム、カリウム、グルタミン、アンモニウムなど)を測定することができる。追加的に又は代替的に、分析機器104は、重量オスモル濃度、生細胞密度(VCD)、総細胞密度(TCD)、生存率、及び/又はバイオリアクタ102の内容物に関連する1つ以上の他の細胞培養物属性を測定することができる。
【0013】
いくつかの実施形態では、分析機器104は、破壊分析技法を使用することができるが、他の実施形態では、分析機器104のうちの1つ、数個、又は全てが非破壊分析(例えば、「ソフトセンシング」)技法を使用する。例えば、分析機器104は、分光器と1つ以上のプローブとを備えたラマン分析計を含んでいてもよい。ラマン分析計は、レーザ光をそれぞれの光ファイバケーブルを介してプローブに送出するレーザ光源を含んでいてもよく、また、それぞれの光ファイバケーブルの別のチャネルを介してプローブから受信される信号を記録する電荷結合素子(CCD)又は他の適切なカメラ/記録デバイスを含んでいてもよい。代替的に、レーザ光源は、プローブ内に一体化されてもよい。各プローブは、浸漬プローブ、又は他の任意の適切な種類のプローブ(例えば、反射プローブ若しくは透過プローブ)であってよい。分析器及びプローブは、細胞培養プロセスの分子「フィンガープリント」を励起させ、観察し、且つ記録することによって、バイオリアクタ102内の関連する細胞培養物属性を非破壊的に走査することができる。分子フィンガープリントは、生物学的に活性な内容物がプローブによって送出されるレーザ光によって励起される場合、その内容物内の分子の振動モード、回転モード、及び/又は他の低周波モードに対応する。この走査プロセスの結果として、ラマン分析計は、それぞれがラマンシフト(周波数)の関数として強度を表す1つ以上のラマン走査ベクトルを生成する。次に、ラマン分析計は、対応する細胞培養物属性(例えば、グルコース及び/又は他の代謝産物濃度)の値を決定(例えば、推測)するために、ラマン走査ベクトルを分析することができる。
【0014】
入力デバイス112もまた、計算システム106に通信可能に接続されており、このデバイスは、バイオリアクタ102の内容物に物理的入力を送出する任意の1つ以上のデバイスであってよい。例えば、入力デバイス112は、グルコースポンプ、制御された量の供給物をバイオリアクタに添加するデバイス、並びに/又はバイオリアクタ102及びその内容物を加熱及び/若しくは冷却するデバイスを含むことができる。一般に、入力デバイス112は、ポンプ、バルブ、及び/又は任意の他の適切な種類の制御要素を含むことができる。入力デバイス112は、比例積分微分(PID)制御器を含み、例えば、PID制御器への入力として計算システム106から設定値を受信することができる。
【0015】
モデルサーバ108は、処理ハードウェア及びメモリ(
図1に示さず)を含み、以下で更に詳細に論じられる予測モデル114を格納する。本明細書に記載されるモデルサーバ108の機能は、例えば、モデルサーバ108のメモリに格納された命令を実行する際に、モデルサーバ108の処理ハードウェアによって提供され得る。ネットワーク110は、モデルサーバ108を計算システム106に接続しており、単一の通信ネットワークであっても、又は1つ以上の種類の複数の通信ネットワーク(例えば、1つ以上の有線及び/又は無線ローカルエリアネットワーク(LAN)、並びに/或いは例えばインターネット又はイントラネットなどの1つ以上の有線及び/又は無線ワイドエリアネットワーク(WAN))を含んでいてもよい。
【0016】
計算システム106は、サーバ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットデバイス、又は他の任意の適切な種類の1つ以上の計算デバイスであってよい。
図1に示される例示的な実施形態では、計算システム106は、処理ハードウェア120、ネットワークインターフェース122、表示デバイス124、ユーザ入力デバイス126、及びメモリユニット128を含む。しかしながら、いくつかの実施形態では、計算システム106は、互いに同位置にあるか又は互いに離れている2つ以上のコンピュータを含む。これらの分散型実施形態では、処理ハードウェア120、ネットワークインターフェース122、及び/又はメモリユニット128に関する本明細書に記載の動作は、それぞれ、複数の処理ユニット、ネットワークインターフェース、及び/又はメモリユニットの間で分担されてもよい。
【0017】
処理ハードウェア120は、1つ以上のプロセッサを含み、プロセッサの各々は、メモリユニット128に格納されたソフトウェア命令を実行して本明細書に記載される計算システム106の機能のいくつか又は全てを実行するプログラム可能マイクロプロセッサであってよい。代替的に、処理ハードウェア120内のプロセッサのいくつかは、他の種類のプロセッサ(例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など)であってよく、本明細書に記載される計算システム106の機能のいくつかは、代わりに、一部又は全てがそのようなハードウェアで実装されてもよい。メモリユニット128は、揮発性及び/又は不揮発性メモリを含む1つ以上の物理メモリデバイス又はユニットを含んでいてもよい。読み取り専用メモリ(ROM)、ソリッドステートドライブ(SSD)、ハードディスクドライブ(HDD)などの、任意の適切な1つ以上の種類のメモリが使用されてもよい。
【0018】
ネットワークインターフェース122は、1つ以上の通信プロトコルを使用してネットワーク110を介して通信するように構成された任意の適切なハードウェア(例えば、フロントエンド送信機及び受信機ハードウェア)、ファームウェア、並びに/又はソフトウェアを含んでいてもよい。例えば、ネットワークインターフェース122は、イーサネットインターフェースであってもよく、又はイーサネットインターフェースを含んでいてもよい。
【0019】
表示デバイス124は、情報をユーザに提示するために任意の適切な表示技術(例えば、LED、OLED、LCDなど)を使用してもよく、ユーザ入力デバイス126は、キーボード又は他の適切な入力デバイスであってもよい。いくつかの実施形態では、表示デバイス124及びユーザ入力デバイス126は、単一のデバイス(例えば、タッチスクリーンディスプレイ)内で一体化されている。一般に、表示デバイス124及びユーザ入力デバイス126は共同で、例えば、バイオリアクタ102内で生じている細胞培養プロセスを監視するなどの目的で、計算システム106が提供するグラフィカルユーザインターフェース(GUI)とユーザとの対話を可能にすることができる。しかしながら、いくつかの実施形態では、計算システム106は、表示デバイス124及び/又はユーザ入力デバイス126を含まない。
【0020】
メモリユニット128は、細胞培養プロセス(CCP)制御アプリケーション130を含む1つ以上のソフトウェアアプリケーションの命令を格納している。CCP制御アプリケーション130は、処理ハードウェア120によって実行されたときに、分析機器104、モデルサーバ108、及び入力デバイス112と通信して、細胞培養物属性の測定された(又は測定に基づく)値を取得すること、測定値/取得値に基づいて細胞培養物属性の将来値を予測すること、並びに予測された将来値に基づいて細胞培養プロセスへの1つ以上の入力を制御することを(例えば、全てリアルタイムで)行うように、一般に構成されている。この目的のために、CCP制御アプリケーション130は、測定ユニット140、予測ユニット142、及びモデル予測制御器(MPC)144を含んでいる。CCP制御アプリケーション130の様々なユニットが、異なるソフトウェアアプリケーション間で分散されてもよいこと、及び/又はそのようなユニットのいずれか1つの機能が異なるソフトウェアアプリケーション間で分割されてもよいことが理解されよう。
【0021】
測定ユニット140は、任意の所望の数の時間区間について、時間区間ごとに1回(例えば、1日に1回、1時間に1回など)、分析機器104によって生成された測定値を取得する(例えば、要求する、又は別の方法で監視する)ことができる。いくつかの実施形態では、測定ユニット140は、分析機器104から取得された値を処理することによって、1つ以上の細胞培養物属性値を決定する。例えば、測定ユニット140は、分析機器104のうちの1つによってより高頻度に(例えば、15分に1回、1時間に1回など)提供される代謝産物測定値に基づいて、時間区間ごとに1回(例えば、1日に1回)、平均代謝産物濃度を決定することができる。別の例として、測定ユニット140は、分析機器104の分光器によって提供されるラマン走査ベクトルを分析して、1つ以上の細胞培養物属性の値を(前述のように)決定又は推測することができる。いくつかの実施形態では、測定ユニット140(又は別のユニット、アプリケーション、デバイス、若しくは計算システム)は、2019年10月23日出願の「Automatic Calibration and Automatic Maintenance of Raman Spectroscopic Models for Real-Time Predictions」と題されたPCT特許出願第PCT/US2019/057513号パンフレット(この開示はその全体が参照により本明細書に組み込まれる)に記載されている実施形態のいずれかに従って、ジャストインタイム学習(JITL)を使用したラマン走査ベクトルに基づいて細胞培養物属性値(例えば、代謝産物濃度)を決定する。一般に、説明を容易にするために本明細書で使用される場合、「測定された」及び「測定値」などの用語は、それらを用いた文脈からより具体的な意味が明確に示されない限り、物理的/直接的に測定された値、ソフトセンシングされた値、又は物理的/直接的に測定された若しくはソフトセンシングされた値から導出された(例えば、それらを使用して算出された)値を指すために広く使用される。
【0022】
予測ユニット142は、計算システム106に、ネットワークインターフェース122及びネットワーク110を介してモデルサーバ108へ測定データを送信させることにより、細胞培養物属性の測定値をモデルサーバ108に提供することができる。次いで、モデルサーバ108は、細胞培養物属性値を予測モデル114への入力として適用する。予測モデル114は、モデル入力に基づいて少なくとも1つの細胞培養物属性の1つ以上の将来値を予測する、データ駆動型機械学習モデルである。モデル入力には、時間区間ごとの細胞培養物属性の1つ以上の現在の測定値、及び1つ以上の先行する時間区間からの測定値、又はそれらの細胞培養物属性のうちの少なくとも1つのシミュレーション値が含まれる。例えば、予測モデル114は、当日及び前日に測定されたグルコース濃度に基づいて、将来のグルコース濃度を(例えば、x個(xは0より大きい整数である)の将来の時間区間の各々において)予測することができる。別の例として、予測モデル114は、当日及び過去2日間の各日に測定された様々な代謝産物濃度に基づいて、将来のVCD、TCD、又は生存率を(例えば、x個(xは0より大きい整数である)の将来の時間区間の各々において)予測することができる。
【0023】
予測モデル114は、測定された細胞培養物属性の履歴値(即ち、モデル入力)及び対応する実世界の結果(即ち、教師あり訓練用のラベル)を使用して訓練された、ニューラルネットワーク、例えばフィードフォワードニューラルネットワーク又はリカレントニューラルネットワークであってよい。そのようなニューラルネットワークの例は、
図5に関連して後述される。
【0024】
他の実施形態では、予測モデル114は、回帰モデルである。例えば、予測モデル114は、2次、3次、又はより高次(4次、5次、6次など)の回帰モデル、又は異なる次数の回帰モデルの組み合わせであってよい。本明細書で使用される場合、「次」という用語は、1つ以上の将来の時間区間の値の予測を形成する際にモデル入力として使用される測定値に反映される、異なる時間区間の最大数を指す。明確化のために述べると、n次の回帰モデルを、(n及びn-1、n-2…のうちの1つ以上を含む次数を用いるモデルにおいて)少なくとも1回使用する回帰モデルは、n次の回帰モデルと見なされる。一例では、2次モデルと3次モデルの両方を使用するモデルは、3次回帰モデルと見なされる。したがって、例えば、当日及び前日に測定された代謝産物濃度を基に動作する回帰モデルは2次回帰モデルと称され、他方、当日、前日、及び前々日の代謝産物濃度を基に動作する回帰モデルは3次回帰モデルと称される。より一般的には、2次回帰モデルは、モデル入力として使用される少なくとも1つの細胞培養物属性について、時間区間k及び(k-x)で取得された測定値を基に動作し、3次回帰モデルは、モデル入力として使用される少なくとも1つの細胞培養物属性について、時間区間k、(k-x)、及び(k-y)で取得された測定値を基に動作する(ここで、xは0より大きい任意の整数であり、yはxより大きい任意の整数である)。回帰モデル114は、実施形態に応じて、線形又は非線形であり得る。
【0025】
3次回帰モデルでは、以前の2つの時間区間(例えば、前の2日間)からの測定値が必要であるため、最初の2つの時間区間(例えば、0日目及び1日目)にはそのようなモデルを使用できない場合がある。したがって、いくつかの実施形態では、
図1の予測ユニット142は、最初は2次回帰モデルを使用し(例えば、第2の時間区間で開始し)、次いで、その後に3次回帰モデルに切り替える(例えば、第3の時間区間で開始する)。他の実施形態では、予測ユニット142は、最初の時間区間に他の技法を使用する(例えば、第1の時間区間において、現在の測定値と等しい2つの「先行する測定」値を単に設定する)。
【0026】
他のモデルの種類もまた可能である。しかしながら、ニューラルネットワーク及び高次回帰モデルは、他の特定のモデルの種類よりも利点をもたらす可能性がある。例えば、サポートベクトル回帰モデル、ガウス過程回帰モデル、及びランダムフォレスト回帰モデルは、予測誤差が比較的大きいことが判明している。更に、エコーステートネットワーク(ESN)は、測定誤差に対する感度が極めて高いことが判明しているが、そのようなモデルは最初の時間区間(例えば、1日目)における予測に適している場合がある。
【0027】
モデルサーバ108は、例えばウェブサービスモデルの一部として、予測モデル114を実行して計算システム106とデータを交換することができる。しかしながら他の実施形態では、システム100はモデルサーバ108を含んでおらず、計算システム106は、予測モデル114をローカルに(例えば、メモリユニット128に)格納し(且つ場合によっては訓練して)、予測モデル114をローカルに(例えば、予測ユニット142の命令を実行する場合は処理ハードウェア120により)実行する。示される例示的な実施形態では、モデルサーバ108は、時間区間ごとに、関連する入力(測定された細胞培養物属性値)を予測モデル114に適用し、予測された将来値をネットワーク110を介して予測ユニット142に返信する。CCP制御アプリケーション130は、将来値をメモリユニット128(又は別の適切なメモリ)内に格納することができ、将来値(又はCCP制御アプリケーション130がそこから導出する値)をMPC144への入力として適用する。
【0028】
MPC144は、予測された将来の細胞培養物属性値を基に、及び場合によってはまた他の情報を基に動作して、入力デバイス112のうちの1つに対する制御信号を生成する。例えば、計算システム106は、入力デバイス112のグルコースポンプに、ポンプによって認識されたプロトコルに一致しており、且つポンプがバイオリアクタ102の内容物に添加又は適用すべき所望のグルコース注入量(又は注入期間など)を指定する、指令を送ることができる。MPC144として使用することができるMPCについては、
図2及び
図3を参照して以下で更に詳細に論じられる。
【0029】
モデルサーバ108は、1つの予測モデル114のみを格納することができ、又は異なる細胞培養物属性の将来値をそれぞれ出力/予測する複数の予測モデルを格納することができる。後者の場合、様々なモデルは、実施形態に応じて、モデル入力の同じ又は異なるセットを基に動作することができる。予測モデルは、同じ種類(例えば、全てが3次回帰モデル)のものであっても、又は異なる種類(例えば、VCDを予測するためのフィードフォワードニューラルネットワーク、及びグルコース及びラクテートの濃度を予測するための3次回帰モデル)のものであってもよい。これらの実施形態のそれぞれにおいて、予測ユニット142は、ネットワーク110を介してモデルサーバ108に必要な入力(例えば、現在及び過去の細胞培養物属性値)を提供することができ、モデルサーバ108は、予測モデルを実行して、予測された異なる細胞培養物属性(例えば、VCD、TCD、グルコース濃度など)の各々に関する1つ以上の将来値を予測する(且つ計算システム106に返信する)ことができる。そのような実施形態におけるMPC144は、予測された細胞培養物属性につき1つのMPC(例えば、VCD用の1つのMPC、TCD用の1つのMPCなど)を含むことができ、各MPCは、入力デバイス112のうちの異なる1つに対する制御信号を生成する。代替的に、CCP制御アプリケーション130は、複数の細胞培養物属性の予測値を単一のMPCに適用する。以下の記述は、単一のMPC144への入力として使用される単一の細胞培養物属性の予測された将来値に焦点を当てているが、別の予測された細胞培養物属性及び/又は別のMPCが存在し得ることが理解される。
【0030】
いくつかの実施形態では、CCP制御アプリケーション130はまた、(例えば、細胞培養プロセスの同時手動監視/監督を可能にするために)測定値(例えば、予測モデル114への入力)及び/又は予測モデル114によって出力される将来値などの情報の(ユーザへの)提示を用意する。例えば、CCP制御アプリケーション130は、細胞培養物属性の過去値、現在値、及び予測値/将来値を示すグラフを生成及び/又はポピュレートし、表示デバイス124にグラフを表示させることができる。代替的又は追加的に、CCP制御アプリケーション130は、表示デバイス124に表形式及び/又は何らかの他の適切な形式で値を示させることができる。更に別の実施形態では、CCP制御アプリケーション130は、ユーザに情報を表示する役割を持たない。
【0031】
図1に示されるものの代わりに、他の構成及び/又は構成要素が使用されてもよいことが理解されよう。例えば、異なる計算デバイス又はシステム(
図1には図示せず)が、分析機器104によって提供された測定値をモデルサーバ108に送信すること、1つ以上の追加の計算デバイス又はシステムが、計算システム106とモデルサーバ108とを仲介する役割を果たすこと、本明細書に記載の計算システム106の機能のいくつかをモデルサーバ108及び/又は別のリモートサーバが代替して遠隔的に遂行することなども可能である。
【0032】
図2は、
図1のシステム100などのシステムに実装することができる例示的なアーキテクチャ200のブロック図である。
図2では、細胞培養プロセス202は、容器内(例えば、
図1のバイオリアクタ102内)で行われる。様々な細胞培養物測定値204(即ち、測定された細胞培養物属性値)は、
図1の分析機器104などの1つ以上の機器を使用して取得される。細胞培養物測定値204は、細胞培養物中の一連の代謝産物(例えば、グルコース、ラクテート、ナトリウム、カリウム、アンモニウム、及び/又はグルタミン)の1つ、数個、又は全ての濃度を含み得る。いくつかの実施形態では、細胞培養物測定値204は、更に(又は代わりに)、VCD、TCD、生存率、重量オスモル濃度などの1つ以上の他の種類の測定された細胞培養物属性を含む。
【0033】
細胞培養物測定値204は、例えば
図1の予測モデル114と同じであってよい予測モデル206への入力として(例えば、予測ユニット142及び/又はモデルサーバ108によって)提供される。
図2では、遅延要素(z
-1及びz
-2)は、過去の細胞培養物測定値204も予測モデル206への入力として提供されていることを示すために使用されている。
図2は、3次(回帰又はニューラルネットワーク)モデルの実施形態を示しており、ここで、予測モデル206は、細胞培養物測定値204の全てについて、現在の時間区間(例えば、当日、又は現在時間など)及び先行する2つの時間区間(例えば、過去2日間)からの値を基に動作する。しかしながら、他の実施形態では、過去値は細胞培養物測定値204のサブセットにのみ使用され、且つ/又は予測モデルは異なる次数(例えば、2次、4次など)のものである。
【0034】
各時間区間において、予測モデル206は、モデル入力(即ち、現在及び過去の測定値)を処理し、MPC208の有限制御ホライズン(例えば、次の4つの時間区間、又は次の6つの時間区間など)にわたる細胞培養物属性の予測値を生成する。将来値が予測される属性は、実施形態に応じて、測定もされモデル入力としても使用された属性であってもよく、又は測定されずモデル入力として使用された属性であってもよい。予測モデル206は、例えば、将来の代謝産物(例えば、グルコース)濃度を予測することができる。いくつかの実施形態では、アーキテクチャ200は、予測モデル206と同様であるがそれぞれが異なる細胞培養物属性の値を予測する、複数の予測モデルを含む。
【0035】
各時間区間において、例示的なMPC208は、予測された将来値を基に、及び場合によってはまた他の情報を基に動作して、例えば予測バッチ軌道最適化を使用して入力デバイス112のうちの少なくとも1つに対する制御信号(例えば、設定値)を生成する。MPC208は、測定された/入力された細胞培養物属性値を、1つ以上の項を有する目的関数の独立変数として適用することができ、目的関数の従属変数は予測値である。次に、MPC208は、従属変数及び/又は独立変数に対するいくつかの制約を受けて、最適な独立変数値、例えば、目的(又は「コスト」)関数を最小化する値を決定することができる。制約には、例えば、最小代謝産物濃度としての「ゼロ」、グルコースポンプに関連する最大注入速度、及び/又は他の適切な制約が含まれ得る。目的関数は、対応する細胞培養物属性(例えば、代謝産物濃度)がある所望の所定値に達したときに最適化が達成されるように設定された、又は特定の細胞培養物属性(例えば、VCD、TCD、生存率など)を最大化させるために設定された、1つの項又は複数の項(例えば、CCP制御アプリケーション130が制御している複数のプロセス入力の各々に関する1つの項、例えば、グルコース濃度、添加された供給量など)を含み得る。次に、MPC208は、細胞培養プロセスを所望の目的(例えば、VCDの最大化など)に導くための制御設定値を決定することができる。
【0036】
図2の例では、MPC208は、バイオリアクタ(例えば、バイオリアクタ102)に添加される供給量を含む1つ以上の設定値を提供し、MPC208は、細胞培養プロセス202(又はより正確には、添加された供給量を制御する入力デバイス)のみならず、予測モデル206にも供給量を提供する。予測モデル206は、この例では、細胞培養物測定値204に加えてモデル入力の1つとして供給量設定値を使用する。
【0037】
図3は、特定の実施形態及びシナリオにおける例示的なMPCの動作300を示す。
図3では、x軸は時間区間(k、k+1など)を表し、y軸は振幅(例えば、設定値など)を表す。y軸の左側の領域(k-1、k-2など)は過去の時間区間を表し、y軸の右側の領域(k+1、k+2など)は将来の時間区間を表し、kは現在の時間区間を表す。
図3は、過去の(測定された)細胞培養物属性値302及び過去の制御設定値304、並びに予測モデル(例えば、予測モデル142又は206)によって予測された将来の細胞培養物属性値306、及び有限制御ホライズン310にわたってMPC(例えば、MPC144又は208)によって計算された将来の制御設定値308を示す。
【0038】
この特定の例では、有限制御ホライズン310、及び同じく予測モデル(例えば、予測モデル206)の予測ホライズンは、n個の将来の時間区間を包含する(nは、1より大きい任意の適切な整数であり得る)。いくつかの実施形態では、最初のいくつかの予測はより信頼性が高くなければならないため、MPC(例えば、MPC144及び/又は208)は、4日間のみ、又は3日間のみなどの予測ホライズンを有する。予測ホライズンをより短く、且つ有限制御ホライズン310をより短くすることによって、システムが撹乱を受けた場合に安定性をもたらすことができ、且つ/又はシステムを最適化して最良の最終結果を得ることができる。システムは新たな細胞培養物測定値を取得し続けることから、後の日の予測は経時的に改善され得る。4日超(例えば、6日など)の予測ホライズンが達成されるように、特にシステムが連続製造(CM)プロセスなどの定常状態にある場合、モデルの改善を行うことができる。
【0039】
ここで
図2に戻ると、いくつかの実施形態では、細胞培養物測定値204は、
図1を参照して前述したように、ジャストインタイム学習(JITL)を使用して生成された値を含む。これらの実施形態のいくつかでは、JITL出力を予測モデル206に入力することができる。代替実施形態では、JITL出力を、動的モード分解(DMD)又は非線形力学のスパース同定(SINDY)モデルに入力することができる。モデルは、例えばODEベースのモデルであってよい。DMD/SINDYモデルは、次に、例えば、GEKKOオプティマイザを利用することができるMPC208にその出力を提供することができる。
【0040】
図4は、
図1の予測モデル142及び/又は
図2の予測モデル206によって行われる予測の例示的シーケンス400を示す。
図4では、パラメータkは現在の時間区間を表す。したがって、各時間区間が1日である例では、kは当日、k+1は翌日、k-1は前日であり、以下同様である。シーケンス400は、現在の時間区間kについての3次予測モデル(例えば、ニューラルネットワーク又は3次回帰モデル)の予測進行を示す。破線枠のボックスは、分析測定値(例えば、分析機器104が測定値を採取する時間区間)を表し、実線枠のボックスは、3次予測モデルによって予測される値を表す。この例に見られるように、現在(k)並びに過去2つ(k-1及びk-2)の時間区間の細胞培養物属性の分析測定値が、(場合によっては他の細胞培養物属性の測定値とともに)予測モデルに入力され、これにより、予測モデルは次の時間区間k+1での細胞培養物属性の値を予測することができる。次に、予測モデルは、時間区間k+1の予測値をk及びk-1の測定値とともに使用して、次の時間区間k+2での細胞培養物属性の値を予測する。次に、予測モデルは、時間区間k+1及びk+2の予測値をkの測定値とともに使用して、次の時間区間k+3での細胞培養物属性の値を予測し、この例では、4つの時間区間の予測ホライズンまで(k+4まで)以下同様である。
【0041】
上記のように、予測モデル(例えば、
図1の予測モデル142及び/又は
図2の予測モデル206)は、ニューラルネットワーク又は高次(2次以上)の回帰モデルであってよい。ニューラルネットワーク500の簡略化された例を
図5に示す。ニューラルネットワークは、立証済みの一般的な関数近似器である。即ち、ニューラルネットワークは、層の数及び訓練データの利用性を操作すること、並びに適切な訓練方法を使用することにより、あらゆる非線形の入出力挙動を近似させることができる。
図5に見られるように、ニューラルネットワーク500は、入力層502内のいくつかの入力、いくつかの中間層又は隠れ層504-1~504-L(Lは0より大きい任意の適切な整数である)の各々における内部ノード、及び出力層506内のいくつかの出力を含む。この例では、ニューラルネットワーク500は、(m+1)次のニューラルネットワークであり、当日又は他の時間区間(x(k))からの、並びに先行するm次の時間区間x(k-m)に遡る(及びそれを含む)先行する時間区間の各々からの入力を基に動作する(mは0より大きい任意の適切な整数である)。
図5は層506のn個の出力を示しているが、いくつかの実施形態では、ニューラルネットワーク500は、次の時間区間における予測値(即ち、y(k+1))のみを含む。次に、
図4のシーケンス400と同様の予測シーケンスを使用して、ニューラルネットワーク500の複数のイテレーションを行うことにより、所望の予測/有限制御ホライズンの長さにわたって追加の予測値(例えば、y(k+2)、y(k+3)など)を生成することができる。
【0042】
ニューラルネットワーク500の支配方程式は、
【数1】
と表すことができる。
方程式1において、x(k)及び
【数2】
は、それぞれ層502で適用されるネットワーク入力ベクトル及び層506で生成されるネットワーク出力ベクトルであり、U及びWは、訓練コスト関数を最適化することによって求められるネットワーク重み行列である。ニューラルネットワークの訓練コスト関数は、従来の「二乗和誤差」(SSE):
【数3】
であると仮定することができる。
方程式2において、y(k)は測定された出力であり、Nは訓練サンプルの数である。方程式2の関数などの訓練コスト関数を最適化することによってネットワーク重みパラメータを求めるために、様々な局所的及び全体的な最適化アプローチが提案されている。局所的最適化アプローチは、比較的高速であるものの、最適化問題の局所的最小値で捕捉される傾向があり、これが汎化性能の低下をもたらす。いくつかの実施形態では、スケーリング共役勾配アプローチを使用して、訓練コスト関数を最適化し、ネットワーク重みパラメータを求める。「スケーリング共役勾配」は、高速且つ自動化された訓練アルゴリズムであり、他の多くの訓練アルゴリズムとは異なり、ユーザ依存のパラメータを有しておらず、最適化問題の局所的最小値で捕捉される可能性が低くなる。いくつかの実施形態では、ニューラルネットワーク500(例えば、フィードフォワードニューラルネットワーク)は、履歴的なグルコース及びラクテートの測定濃度を使用して、VCD及びグルコース濃度を予測するように訓練される。ニューラルネットワーク500の訓練用の入力として、他のオフライン測定値及び動作測定値も使用することができる。
【0043】
他の実施形態では、2次以上の線形又は非線形回帰モデルが、予測モデル142及び/又は206として使用される。2次モデルの場合、現在の細胞培養物属性の測定値及び以前の時間区間(例えば、前日)からの測定値は、それぞれベクトルa及びbに格納することができる。これら2つのベクトルは、予測値とのそれらの異なる組み合わせとともに(例えば、
図4のシーケンス400におけるように)、回帰モデルへの入力である。ベクトルa及びbを組み合わせて、2次モデル用の入力ベクトルx(k)を形成することができる。
【0044】
3次モデルの場合、入力構造は2次モデルの入力と同様である。但し、3次モデル入力には、より以前の時間区間(例えば、前々日)からの測定値がベクトルcとして更に含まれる。同様に、これにより回帰モデルの入力次元が増加する。ベクトルa、b、及びcを組み合わせて、3次モデル用の入力ベクトルx(k)が形成される。
【0045】
2次モデルと3次モデルとを組み合わせることにより、実験2日目から代謝産物を予測することができ(即ち、2次モデルを介して0日目及び1日目のデータを使用する)、実験3日目から3次モデルを使用することにより、予報精度が上昇する。
【0046】
x(k)が回帰モデルの入力ベクトルであり、
【数4】
が回帰モデルの出力(予測)であると仮定すると、回帰モデルの支配方程式は、
【数5】
と記述することができる。
方程式3において、αはモデル係数のベクトルであり、e(k)は、同定誤差及び測定ノイズを表す。コスト関数
【数6】
方程式4のコスト関数に
【数7】
(αの第2ノルムの2乗)を追加することで、モデルの出力に対する不要なリグレッサの影響が低減され、将来のモデルプルーニング(即ち、モデル入力数の低減)への取り組みが活用される。
【0047】
ニューラルネットワークであろうと回帰モデルであろうと、予測モデルの訓練は、細胞培養プロセスから利用可能な詳細な実世界の履歴データが限られていることを考慮すると、困難な場合がある。例えば、代謝産物濃度が毎日測定及び記録されていない可能性がある。したがって、いくつかの実施形態では、より多くのデータポイント(即ち、「欠落」値)を比較的大きな訓練データセットに提供するために線形補間が使用されるが、そのような補間は不正確になる傾向がある。いくつかの実施形態では、予測モデル(例えば、予測モデル114及び/又は206)は、予測モデルの後続の訓練において(即ち、予測モデルが最初に訓練され使用された後で)細胞培養物属性の測定値及び予測値をそれぞれラベル及び入力として使用することにより、連続的に適合する。このようにして、予測精度を経時的に上昇させ続けることができる。
【0048】
図6~11は、本明細書で論じられるインテリジェント制御技法の様々な実施形態の性能を示している。具体的には、
図6A~6Eは、ニューラルネットワークと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットであり、
図7A~7Eは、2次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットであり、
図8A~8Eは、3次回帰モデルと代謝産物測定値の短縮セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
図9A~9Jは、ニューラルネットワークと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットであり、
図10A~10Jは、2次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットであり、
図11A~11Jは、3次回帰モデルと代謝産物測定値の完全セットとを使用した場合の様々な細胞培養物属性の測定値と予測値とを比較する例示的プロットである。
【0049】
図6~11の各プロットでは、示された細胞培養物属性(例えば、
図6AのVCD、
図6BのTCDなど)の実世界の値の分析測定値は、プラス(「+」)記号として示され、「z日目の予測」(例えば、3日目、5日目など)と明示されたトレースは、z-1日目までの分析測定値が(例えば、予測モデル114又は206によって)使用され、z日目から運転最終日(これらの例では11日目)まで、示された細胞培養物属性の値が予測される場合に対応する。
図6A~6Eの各プロット及び
図7A~7Eの各プロットなどは、異なるモデルによって行われた予測に対応する(例えば、第1のニューラルネットワークが
図6AでVCDを予測し、第2のニューラルネットワークが
図6BでTCDを予測するなどのように)。
図6~11の様々なモデルについて、後続の時間区間(例えば、k+2など)に対応する値の予測は、
図4に示されるシーケンス400と同様の形で測定値と予測値とを組み合わせることによって行われる。
【0050】
図7A~7E及び8A~8E(並びに
図10A~10J及び11A~11J)に見られるように、2次回帰モデルによって2日目から予測を行うことができ、他方、3次回帰モデルによって3日目から予測を行うことができる。
図6A~6E(及び
図9A~9J)は、3次ニューラルネットワークを反映しているため、予測は3日目から行われる。2次及び3次回帰モデルの場合、非制約多変量最小化(unconstrained multivariate minimization)を訓練アルゴリズムとして使用した。いずれの場合も、1リットルのバイオリアクタ容積をモデルの訓練及びテストに使用し、訓練データセットのサイズを線形補間を使用して増加させた。測定変数をベクトルに連結し、モデル入力として表した。
【0051】
図9~11に関しては、基本的なモデル構造は、それぞれ
図6~8に対して変更していない。但し、モデル化のためにより多くのパラメータ(細胞培養物属性)を測定したか又は他の方法で取得した(具体的には、供給量、VCD、TCD、生存率、ラクテート濃度、グルコース濃度、ナトリウム濃度、カリウム濃度、アンモニウム濃度、及びグルタミン濃度)。これらのパラメータの大半は測定値であるが、供給量は制御設定値から取得することができるか、又は測定することができる。この代謝産物のより大きなセットの測定値を使用することで、入力及びモデルの次元が増加し、ひいては各モデルを効果的に訓練するためにより多くの訓練データが必要になる。しかしながら、得られた訓練されたモデルは、
図6~11に見られるように、代謝産物レベル及び/又は他の細胞培養物属性値をより正確に予測することができる。
【0052】
図7A~7E及び10A~10Jに見られるように、2次回帰モデルの場合、予測の質/精度は一般に経時的に上昇する。しかしながら、2次モデルの予測精度は一般に、ニューラルネットワーク(
図6A~6E、9A~9J)又は3次回帰モデル(
図8A~8E、11A~11J)の予測精度よりも低くなる。
【0053】
図12は、細胞培養プロセスを制御する例示的方法1200のフロー図である。方法1200は、
図1のシステム100などのシステムによって(例えば、CCP制御アプリケーション130の命令を実行する処理ハードウェア120によって、及び/又はモデルサーバ108によって)実施することができる。方法1200は、細胞培養プロセス中、1つ以上の時間区間(例えば、複数日のそれぞれ)について、(例えば、リアルタイムで)繰り返すことができる。
【0054】
ブロック1202で、(例えば、バイオリアクタ102などのバイオリアクタ内の)細胞培養物に関連する1つ以上の細胞培養物属性の現在値が、手動サンプリング又はシミュレーションから取得される。ブロック1202は、例えば、別のデバイス若しくはシステムから(例えば、分析機器104から)現在値を受信すること、値のいくつか若しくは全てを(例えば、分析機器104によって)直接測定すること、及び/又は値のいくつか若しくは全てを(例えば、ラマン分光法測定値/走査ベクトルに基づき、且つJITLを使用して)推測若しくは予測することを含んでもよい。値が取得される細胞培養物属性には、1つ以上の代謝産物レベル(例えば、濃度)、VCD、TCD、生存率、添加された供給量、及び/又は細胞培養物の1つ以上の他の属性が含まれてもよい。
【0055】
ブロック1204で、細胞培養物に関連する特定の細胞培養物属性の1つ以上の将来値が予測される。ブロック1204は、データ駆動型予測モデル(例えば、予測モデル114又は206)への入力として、現在値、及び少なくとも1つの細胞培養物属性の少なくとも1つの以前の値を適用することを含む。細胞培養物属性の以前の値は、例えば、以前の時間区間で行われた手動サンプリング又はシミュレーションから取得された値であってよい。いくつかの実施形態では、例えば、ブロック1202の現在値とブロック1204の以前の値の両方が、JITLを使用して、ラマン分光法測定値/走査ベクトルに基づいてそれらの値を推測又は予測することによって取得される/された。予測モデルは、ニューラルネットワーク(例えば、フィードフォワードニューラルネットワーク)又は少なくとも2次(例えば、3次)の回帰モデルであってよい。将来値が予測される特定の細胞培養物属性には、代謝産物レベル(例えば、濃度)、VCD、TCD、生存率、又は細胞培養物の異なる属性が含まれてもよい。予測される将来値の数は一般に、任意の適切な長さ(例えば、4日、又は2~6日間などの任意の適切な長さ)であってよい所望の有限制御ホライズンに依存する。
【0056】
ブロック1206で、細胞培養プロセスへの1つ以上の物理的入力が制御される。ブロック1206は、将来値(ブロック1204で予測されたもの)をMPCへの入力として適用することを含む。MPCは、(例えば、CCP制御アプリケーション130によって)使用される値を出力して、入力デバイス112のうちの1つなどの入力デバイス(制御要素)に送信される制御信号(例えば、設定値を指定する指令)を生成することができる。
【0057】
いくつかの実施形態では、方法1200は、
図12に示されていない1つ以上の追加のブロックを含む。例えば、ブロック1204及び1206(並びに場合によっては更にブロック1202)と同様のブロックは、他の細胞培養物属性の将来値を予測する1つ以上の他の予測モデルに関して並行して遂行されてもよい。
【0058】
次に、本開示に関する追加的な考察について述べる。
【0059】
本明細書に記載される図面のいくつかは、1つ以上の機能的構成要素を有する例示的なブロック図を示す。このようなブロック図は、例証を目的としたものであり、記載され示されるデバイスが例証されるものよりも多い、少ない、又は代替的な構成要素を有し得ることが理解されよう。更に、様々な実施形態では、構成要素(及びそれぞれの構成要素が提供する機能)は任意の適切な構成要素に関連付けられるか、又は別途その一部として一体化されてもよい。
【0060】
本開示の実施形態は、様々なコンピュータ実装動作を遂行するためのコンピュータコードを有する非一時的コンピュータ可読格納媒体に関する。「コンピュータ可読格納媒体」という用語は、本明細書に記載される動作、手法、及び技法を遂行するための一連の命令又はコンピュータコードを格納又は符号化することができる任意の媒体を含むように本明細書において使用される。媒体及びコンピュータコードは、本開示の実施形態を目的として特別に設計及び構築されたものであってもよく、又はコンピュータソフトウェア技術の当業者に周知且つ利用可能な種類のものであってもよい。コンピュータ可読格納媒体の例としては、ハードディスク、フロッピーディスク、及び磁気テープなどの磁気媒体、CD-ROM及びホログラフィデバイスなどの光媒体、光ディスクなどの光磁気媒体、並びにASIC、プログラマブルロジックデバイス(「PLD」)、及びROMやRAMデバイスなどのプログラムコードを格納及び実行するために特別に構成されたハードウェアデバイスが挙げられるが、これらに限定されるものではない。
【0061】
コンピュータコードの例としては、コンパイラにより生成されるものなどの機械コード、及びインタープリタ又はコンパイラを用いてコンピュータにより実行される相対的に高水準のコードを含むファイルが挙げられる。例えば、本開示の一実施形態は、Java、C++、又は他のオブジェクト指向プログラミング言語及び開発ツールを用いて実装されてもよい。コンピュータコードの更なる例としては、暗号化コード及び圧縮コードが挙げられる。更に、本開示の一実施形態は、コンピュータプログラム製品としてダウンロードされてもよく、これは、リモートコンピュータ(例えば、サーバコンピュータ)から送信チャネルを介して要求元コンピュータ(例えば、クライアントコンピュータ又は異なるサーバコンピュータ)に転送されてもよい。本開示の別の実施形態は、機械実行可能なソフトウェア命令の代わりに、又はこれと組み合わせてハードワイヤード回路に実装されてもよい。
【0062】
本明細書で使用される場合、単数形の用語「a」、「an」、及び「the」は、別途文脈が明確に示さない限り、複数の参照物を含み得る。
【0063】
本明細書で使用される場合、「ほぼ」、「実質的に」、「実質的な」、及び「約」という用語は、小さな変動を記述及び説明するために使用される。事象又は状況と併せて使用される場合、これらの用語は、事象又は状況が厳密に生じている場合だけでなく、極めて近い事象又は状況が生じている場合も指す場合がある。例えば、数値と併せて使用される場合、これらの用語は、当該数値の±10%以下、例えば、±5%以下、±4%以下、±3%以下、±2%以下、±1%以下、±0.5%以下、±0.1%以下、又は±0.05%以下などの変動幅を指す場合がある。例えば、2つの数値の差がこれらの数値の平均の±10%以下、例えば、±5%以下、±4%以下、±3%以下、±2%以下、±1%以下、±0.5%以下、±0.1%以下、又は±0.05%以下であれば、2つの数値は「実質的に」同一と見なすことができる。
【0064】
更に、本明細書では、量、比、及び他の数値は、範囲形式で提示される場合がある。このような範囲形式が、利便性及び簡潔性を目的として使用されること、並びに範囲の限界値として明示的に指定された数値を含むが、当該範囲に包含される全ての個々の数値又は部分範囲も、あたかも各数値及び部分範囲が明示的に指定されているように含むものとして柔軟に理解されるべきであることを理解されたい。
【0065】
本開示について、その具体的な実施形態を参照しながら記載及び例証してきたが、これらの記載及び例証は本開示を限定するものではない。当業者には、添付の特許請求の範囲により規定される本開示の真の趣旨及び範囲から逸脱することなく、様々な変更を行うことができ、且つ等価物で代替できることを理解されるはずである。図は必ずしも一定の縮尺で描かれていない。製造プロセス、許容誤差及び/又は他の理由により、本開示における技術的描写と実際の装置が異なっている場合がある。具体的に例証されていない本開示の他の実施形態が存在し得る。(特許請求の範囲以外の)本明細書及び図面は、限定的ではなく、例証的なものと見なされるべきである。特定の状況、材料、物質の組成、技法、又はプロセスを本開示の目的、趣旨、及び範囲に適合させるために変更がなされる場合がある。そのような変更は全て、本明細書に添付する特許請求の範囲内であるように意図されている。本明細書に開示される技法について、特定の順序で遂行される特定の動作を参照して記載してきたが、これらの動作が、本開示の教示から逸脱することなく、等価な技法を形成するために組み合わされ、細分化され、又は再順序付けされ得ることが理解されよう。したがって、本明細書において具体的に示されていない限り、動作の順序及びグループ分けは、本開示を限定するものではない。
【国際調査報告】