(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-10
(54)【発明の名称】バイオ医薬品製造プロセスの性能を予測するための方法およびシステム
(51)【国際特許分類】
G06Q 50/04 20120101AFI20231227BHJP
【FI】
G06Q50/04
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023521513
(86)(22)【出願日】2021-10-07
(85)【翻訳文提出日】2023-06-02
(86)【国際出願番号】 EP2021077793
(87)【国際公開番号】W WO2022074167
(87)【国際公開日】2022-04-14
(32)【優先日】2020-10-07
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523125183
【氏名又は名称】ナショナル インスティテュート フォー バイオプロセッシング リサーチ アンド トレーニング
(74)【代理人】
【識別番号】110001726
【氏名又は名称】弁理士法人綿貫国際特許・商標事務所
(72)【発明者】
【氏名】コリン クラーク
(72)【発明者】
【氏名】ジョナサン ボーンズ
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC04
(57)【要約】
本発明は、バイオ医薬品製造プロセスの性能を予測するための方法およびシステムであって、前記プロセスのn回の実行について測定される前記バイオ医薬品製造プロセスのパラメータを所定のサンプリング頻度で測定することと、前記n回の実行のパラメータデータを単一の連続的な時系列方式で順次結合して変換データを生成することと、複数のパラメータに対応して生成された複数の変換データに基づいて、前記バイオ医薬品製造プロセスの性能を予測するために時系列分析モデルを訓練することと、所定の時点で前記複数のパラメータを測定し、前記訓練された時系列分析モデルを強化および改善するために前記測定の値を使用することと、前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実行のために前記複数のパラメータを予測することと、によってバイオ医薬品製造プロセスの性能を予測するための方法およびシステムに関する。
【特許請求の範囲】
【請求項1】
バイオ医薬品製造プロセスの性能を予測するための方法であって、
前記バイオ医薬品製造プロセスのパラメータを所定のサンプリング頻度で測定するステップであって、前記パラメータは、前記プロセスのn回の実行について測定されるステップと、
前記n回の実行のパラメータデータを単一の連続的な時系列方式で順次結合して、前記n回の実行の期間にわたるパラメータデータを示す変換データを生成するステップと、
複数のパラメータに対応して生成された複数の変換データに基づいて、前記バイオ医薬品製造プロセスの性能を予測するために時系列分析モデルを訓練するステップと、
所定の時点で前記複数のパラメータを測定し、前記訓練された時系列分析モデルを強化および改善するために前記測定の値を使用するステップと、
前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実行のために前記複数のパラメータを予測するステップと、
を含む方法。
【請求項2】
実行の終了からの前記パラメータデータは、次の実行の開始時のパラメータデータに結合される、請求項1に記載の方法。
【請求項3】
前記複数のパラメータは、複数の重要工程パラメータ(Critical Process Parameter:CPP)と、複数の重要品質特性(Critical Quality Attribute:CQA)と、を含む、請求項1に記載の方法。
【請求項4】
前記時系列分析モデルは、多変量時系列分析モデルである、請求項1に記載の方法。
【請求項5】
前記多変量時系列分析モデルは、ベクトル誤差修正モデルである、請求項4に記載の方法。
【請求項6】
前記時系列分析モデルは、単変量時系列分析モデルである、請求項1に記載の方法。
【請求項7】
前記変換データは、前記n回の実行の前記期間にわたる前記パラメータデータの季節性の態様を捉えることを可能にする、請求項1から6のいずれかに記載の方法。
【請求項8】
複数の重要工程パラメータは、生細胞密度と、オスモル濃度と、少なくとも1つの代謝物の定性分析と、少なくとも1つの代謝物の定量分析と、を含む、請求項1から7のいずれかに記載の方法。
【請求項9】
複数の重要品質特性は、力価と、凝集プロファイルと、チャージバリアント分析と、疎水性相互作用と、親水性相互作用と、ミドルアップ質量分析と、を含む、請求項1から8のいずれかに記載の方法。
【請求項10】
ミドルアップ質量分析は、グリカン分析を含む、請求項9に記載の方法。
【請求項11】
前記バイオ医薬品は、モノクローナル抗体である、請求項1から10のいずれかに記載の方法。
【請求項12】
前記バイオ医薬品製造プロセスは、細胞培養プロセスである、請求項1から11のいずれかに記載の方法。
【請求項13】
バイオ医薬品製造プロセスの性能を予測するためのシステムであって、前記システムは、
前記バイオ医薬品製造プロセスのパラメータを所定のサンプリング頻度で測定するように構成された変数測定モジュールであって、前記パラメータは、前記プロセスのn回の実行について測定される変数測定モジュールと、
前記n回の実行のパラメータデータを単一の連続的な時系列方式で順次結合して、前記n回の実行の期間にわたるパラメータデータを示す変換データを生成するように構成されたデータ変換モジュールと、
複数のパラメータに対応して生成された複数の変換データに基づいて、前記バイオ医薬品製造プロセスの性能を予測するために時系列分析モデルを訓練するように構成されたデータ訓練モジュールと、
前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実行のために前記複数のパラメータを予測するように構成された性能予測モジュールと、
を備え、
前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実前記変数測定モジュールは、所定の時点で前記複数のパラメータを測定し、前記訓練された時系列分析モデルを強化および改善するために前記測定の値を使用するように構成されている、
システム。
【請求項14】
実行の終了からの前記パラメータデータは、次の実行の開始時のパラメータデータに結合される、請求項13に記載のシステム。
【請求項15】
前記複数のパラメータは、複数の重要工程パラメータ(Critical Process Parameter:CPP)と、複数の重要品質特性(Critical Quality Attribute:CQA)と、を含む、請求項13に記載のシステム。
【請求項16】
前記時系列分析モデルは、多変量時系列分析モデルである、請求項13に記載のシステム。
【請求項17】
前記多変量時系列分析モデルは、ベクトル誤差修正モデルである、請求項16に記載のシステム。
【請求項18】
前記時系列分析モデルは、単変量時系列分析モデルである、請求項13から17のいずれかに記載のシステム。
【請求項19】
複数の重要工程パラメータは、生細胞密度と、オスモル濃度と、少なくとも1つの代謝物の定性分析と、少なくとも1つの代謝物の定量分析と、を含む、請求項13から18のいずれかに記載のシステム。
【請求項20】
複数の重要品質特性は、力価と、凝集プロファイルと、チャージバリアント分析と、疎水性相互作用と、親水性相互作用と、ミドルアップ質量分析と、を含む、請求項13から19のいずれかに記載のシステム。
【請求項21】
トップ、ミドル、またはボトムアップ質量分析は、グリカン分析も含む、請求項20に記載のシステム。
【請求項22】
前記バイオ医薬品は、モノクローナル抗体である、請求項13から21のいずれかに記載のシステム。
【請求項23】
前記バイオ医薬品製造プロセスは、細胞培養プロセスである、請求項13から22のいずれかに記載のシステム。
【請求項24】
バイオ医薬品製造プロセスの性能を予測するための方法であって、
a)少なくとも1つの単位操作について、複数の重要品質特性および複数の重要工程パラメータを所定のサンプリング頻度で測定するステップと、
b)各単位操作について、前記複数の重要品質特性の各々の値を順次マージするステップと、
c)各単位操作について、前記複数の重要工程パラメータの各々の値を順次マージするステップと、
d)前記複数の重要品質特性および前記複数の重要工程パラメータを所定の時点で測定するステップと、
e)ステップ(b)およびステップ(c)の前記マージされた値ならびにステップ(d)の前記測定された値を入力することによって時系列分析モデルを訓練するステップと、
f)前記訓練された時系列分析モデルを適用することによって、各単位操作について、前記複数の重要品質特性の各々および前記複数の重要工程パラメータの各々の値を予測するステップと、
を含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、バイオ医薬品製造プロセスおよび/またはバイオ製造プロセスの性能を予測するための方法およびシステムに関する。
【背景技術】
【0002】
近年、バイオ医薬品産業は、バイオ医薬品製造プロセスをより深く理解するために、プロセス開発のために、およびバイオ医薬品製造プロセスに関する様々な品質パラメータの値を予測するために、様々な多変量統計解析法および機械学習アルゴリズムを適用しようと努めている。
【0003】
このような多変量統計法および機械学習アルゴリズムを採用する際に、当技術分野で既知の主な問題は、バイオ医薬品製造プロセスを構成する複数の単位操作からのデータの連続取得に伴う課題と、将来の事象を正確に予測するために機械学習アルゴリズムを訓練するのに十分多い数のサンプル点を生成することに伴う課題と、を含む。これらの問題は、部分的には、重要工程パラメータの測定と、重要品質特性のリアルタイムの取得とを同時に行うための高分解能の分析計測システムを利用できないことにより生じる。最近、このような測定を行うことができる計測システムが開発されているが、その可能性を最大限に利用するには、好適な複雑なデータ分析法が必要である。
【0004】
バイオ医薬品産業で多変量統計解析および機械学習分析を適用するための当技術分野で既知の方法は、既定の数の異なるプロセス実行からのデータを分析し、分析されたデータを2次元または3次元のフォーマットで維持する。しかしながら、このような既知の方法は、多数のプロセス実行からのデータの生成を必要とし、非常に複雑なアルゴリズムであることが多い。モデル開発の一部の複雑なアプローチは、「ブラックボックス」とみなされる。「ブラックボックスモデル」は正確であり得るが、その構造および動作は解釈できず、その結果、規制承認のために簡単な言葉で詳細に説明することは困難である。
【0005】
バイオ医薬品製造プロセスの性能を予測するための当技術分野で既知の機械学習アルゴリズムは、多くの場合、多数の訓練サンプルデータセットを必要とし、多くの場合、非実用的な訓練サンプルデータセットを必要とし、それは、非常に費用がかかり、および/または生成に時間がかかりすぎる。オーバーフィッティングのリスク、すなわち、モデルが訓練データには適合するが、将来の未知のサンプルが誤分類されるリスクを減らすためにも、従来の機械学習アルゴリズムは、多数の訓練サンプルデータセットを必要とする。
【0006】
バイオ医薬品製造プロセスデータの分析には、「Unscrambler」および「JMP」などの様々な市販のソフトウェアパッケージも当技術分野で既知である。しかしながら、上記の市販のソフトウェアパッケージは、バイオプロセスから連続的に捕捉される高分解能のデータの有用性を最大化することができず、性能を監視および予測するために重要工程パラメータ(Critical Process Parameter:CPP)および重要品質特性(Critical Quality Attribute:CQA)の時系列分析も利用しない。さらに、時間データは、データ分析のために直接的に利用されるのではなく、利用可能なデータを階層化するために使用されるか、またはカテゴリ変数として符号化される。
【0007】
国際公開第2018/229802号は、バイオリアクタでサンプルを製造するために使用されるプロセスの結果を予測するための方法に関する。説明に記載されるモデルは、異なるバッチからのデータをマトリックス内で縦に積み重ねる。国際公開第2019100040号は、初期の測定濃度および過去のデータに基づいて将来のパラメータ濃度を予測できる予測モデルを開示する。欧州特許出願公開第3702439号は、多変量プロセスチャートを決定するための方法、コンピュータプログラム、およびプロセス制御デバイスを開示する。Huong Leら、名称「プロセスインジケータとしての細胞培養プロセスバイオプロセスデータ-乳酸消費の多変量解析(Multivariate analysis of cell culture process bio-process data-lactate composition as process indicator)」、バイオテクノロジージャーナル(Journal of Biotechnology)、vol.162、2012に掲載された文書のサポートベクターマシン回帰で、部分最小二乗法は、データを水平に積み重ねることを必要とする。しかしながら、上述の文書の各々は、複雑なモデルを利用しており、性能を監視および予測するために時系列分析を利用していない。
【発明の概要】
【発明が解決しようとする課題】
【0008】
したがって、当技術分野で、解釈が簡単で、操作のために大量のデータを必要とせず、上述の問題のうち少なくとも1つを克服する、バイオ医薬品製造プロセスの性能を予測するための改善されたシステムおよび方法について満たされていない未解決のニーズが存在する。
【課題を解決するための手段】
【0009】
本発明は、添付の特許請求の範囲で述べられるような、所定のサンプリング頻度で測定される複数の重要品質特性および複数の重要工程パラメータの順次マージされた値によって訓練される時系列分析モデルを使用した、バイオ医薬品製造プロセスおよび/またはバイオ製造プロセスの性能を予測するための方法およびシステムに関する。
【0010】
本発明の好ましい実施形態では、バイオ医薬品製造プロセスの性能を予測するための方法が提供される。前記方法は、前記バイオ医薬品製造プロセスのパラメータを所定のサンプリング頻度で測定することであって、前記パラメータは、前記プロセスのn回の実行について測定される、ということと、前記n回の実行のパラメータデータを単一の連続的な時系列方式で順次結合して、前記n回の実行の期間にわたるパラメータデータを示す変換データを生成することと、複数のパラメータに対応して生成された複数の変換データに基づいて、前記バイオ医薬品製造プロセスの性能を予測するために時系列分析モデルを訓練することと、所定の時点で前記複数のパラメータを測定し、前記訓練された時系列分析モデルを強化および改善するために前記測定の値を使用することと、前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実行のために前記複数のパラメータを予測することと、を含む。
【0011】
本発明の実施形態では、前記複数のパラメータは、複数の重要工程パラメータ(CPP)と、複数の重要品質特性(CQA)と、を含む。
【0012】
本発明の実施形態では、前記変換データは、前記n回の実行の前記期間にわたる前記パラメータデータの季節性の態様を捉えることを可能にする。
【0013】
本発明の好ましい実施形態では、バイオ医薬品製造プロセスの性能を予測するための方法が提供される。前記方法は、前記バイオ医薬品製造プロセスの1つ以上の単位操作について、複数の重要品質特性および複数の重要工程パラメータを所定のサンプリング頻度で連続的に測定する第1のステップを含む。本発明の実施形態では、前記測定された重要工程パラメータは、生細胞密度と、オスモル濃度と、少なくとも1つの代謝物の定性分析と、少なくとも1つの代謝物の定量分析と、を含み、前記測定された重要品質特性は、力価と、凝集プロファイルと、チャージバリアント分析と、疎水性相互作用と、親水性相互作用と、ミドルアップ質量分析と、を含む。ミドルアップ質量分析は、グリカン分析も含む。
【0014】
各単位操作についての各重要工程パラメータおよび各重要品質特性の前記測定された値は、各単位操作に対応付けられた傾向を捉えるために順次マージされる。次いで、所定の時点での各重要品質特性および各重要工程パラメータの値が測定される。さらに、時系列分析モデルは、各重要工程パラメータおよび各重要品質特性の前記順次マージされた値、ならびに所定の時点での各重要工程パラメータおよび各重要品質特性の前記値を使用して、連続的に訓練(または強化)される。前記時系列分析モデルは、多変量時系列分析モデルまたは単変量時系列分析モデルであり得る。本発明の実施形態では、使用される前記多変量時系列分析モデルは、ベクトル誤差修正モデルである。前記訓練された時系列分析モデルは、各単位操作について、前記重要品質特性の各々および前記重要工程パラメータの各々の将来の値を予測するために使用される。
【0015】
本発明の好ましい実施形態では、バイオ医薬品製造プロセスの性能を予測するためのシステムが提供される。前記システムは、計算デバイスに動作可能に接続されたメモリ手段を備える。前記メモリ手段は、バイオ医薬品製造プロセスの少なくとも1つの単位操作について、複数の重要工程パラメータおよび複数の重要品質特性を所定のサンプリング頻度で連続的に測定するように前記計算デバイスを構成する複数の命令を前記メモリ手段上に記憶している。前記計算デバイスはさらに、各単位操作について、前記測定された重要品質特性および重要工程パラメータの各々の値を順次マージし、所定の時点で前記重要工程パラメータおよび重要品質特性の各々の値を測定するように構成されている。前記順次マージされた値、ならびに前記所定の時点の前記重要工程パラメータおよび前記重要品質特性の前記測定された値は、入力として、時系列分析モデルを連続的に訓練するために使用される。前記訓練された時系列分析モデルは、前記バイオ医薬品製造プロセスの各単位操作について、前記重要品質特性の各々および前記重要工程パラメータの各々の値を予測するために利用される。
【0016】
本発明の好ましい実施形態では、バイオ医薬品製造プロセスの性能を予測するためのシステムが提供される。前記システムは、前記バイオ医薬品製造プロセスのパラメータを所定のサンプリング頻度で測定するように構成された変数測定モジュールであって、前記パラメータは、前記プロセスのn回の実行について測定される変数測定モジュールと、前記n回の実行のパラメータデータを単一の連続的な時系列方式で順次結合して、前記n回の実行の期間にわたるパラメータデータを示す変換データを生成するように構成されたデータ変換モジュールと、複数のパラメータに対応して生成された複数の変換データに基づいて、前記バイオ医薬品製造プロセスの性能を予測するために時系列分析モデルを訓練するように構成されたデータ訓練モジュールと、前記訓練された時系列分析モデルに基づいて、前記バイオ医薬品製造プロセスの将来の実行のために前記複数のパラメータを予測するように構成された性能予測モジュールと、を備え、前記変数測定モジュールは、所定の時点で前記複数のパラメータを測定し、前記訓練された時系列分析モデルを強化および改善するために前記測定の値を使用するように構成されている。
【0017】
本発明は、幅広い産業用途を有し、細胞培養バイオプロセスを最適化するために、すべての主要なバイオ医薬品企業によって、プロセス開発活動、知見向上、商業生産の監視、および既存製品のリバースエンジニアリングに使用され得る可能性がある。本発明はまた、例えば、細胞培養プロセス、組換えタンパク質製造プロセス、アデノ随伴ウイルス製造、またはCAR-T細胞製造プロセス、ワクチン、ウイルスワクチンなどを作製するプロセスなどのバイオ医薬品製造プロセスの任意の単位操作から所与の頻度でデータを取得する任意のプラットフォームまたは測定システムと共に使用され得る。
【0018】
本発明はまた、漸進的な改良の余地を与える。すなわち、本発明に係る時系列分析モデルは、連続的に生成される新しい訓練データを用いて、連続的に強化され、かつより正確にされ得る。各重要品質特性および各重要工程パラメータについての複数のデータ点を取得し、その後、値をマージすることで、予測分析に利用可能なサンプルデータセットが最大化され、これにより、漸進的にモデルをより正確にすることができる。
【0019】
さらに、本発明は、実装が容易であり、当技術分野で既知の機械学習モデルよりもはるかに複雑ではない。したがって、本発明は、オーバーフィッティングしにくく、容易に解釈可能であり、そしてこれにより、バイオ医薬品企業は容易に、適用可能な規制法に従うことができる。
【0020】
記録媒体、キャリア信号、またはリードオンリーメモリ上に具現化され得る上記方法をコンピュータプログラムに行わせるためのプログラム命令を含むコンピュータプログラムも提供される。
【0021】
本発明は、あるバッチの終了から別のバッチの開始までデータを結合して、単位操作に対応付けられた傾向を捉えることによって、ならびに知見生成、プロセス監視、および予測のために十分に確立された単変量または多変量の時系列分析法の使用を可能にすることによって、以前使用された機械学習アプローチに伴う問題を克服する。また、プロセスの過程で各変数について複数のデータ点を取得し、その後、プロセスデータを結合することで、分析に利用可能なサンプル数が最大化される。多数の時系列分析は、より新しい機械学習アプローチよりもはるかに複雑ではなく、当該時系列分析をオーバーフィッティングしにくくし、かつ決定的な解釈を可能にし、バイオ医薬品企業に対して規制承認への道筋をより明瞭にする。
【0022】
したがって、本発明は、当技術分野で識別された問題に対する堅牢なソリューションを提供する。
【図面の簡単な説明】
【0023】
本発明は、添付の図面を参照して、例示としてのみ与えられる本発明の実施形態の以下の説明から、より明確に理解されるであろう。
【
図1】本発明の実施形態に係る、バイオ医薬品製造プロセスの性能を予測するためのシステムを示す。
【
図2A】本発明の実施形態に係る、
図1のシステムの変数測定モジュールによって取得されたデータを示す。
【
図2B】本発明の実施形態に係る、
図1のシステムのデータ変換モジュールによって生成された変換データを示す。
【
図2C】本発明の実施形態に係る、変換データのグラフ表示を示す。
【
図3】本発明の好ましい実施形態を使用した複数の重要品質特性の予測を示すグラフ表示である。
【
図4】本発明の実施形態に係る、バイオ医薬品製造プロセスの性能を予測するための方法を示すフローチャートである。
【発明を実施するための形態】
【0024】
図1は、本発明の実施形態に係る、バイオリアクタ102でのバイオ医薬品製造プロセスの性能を監視および予測するためのシステム100を示す。バイオ医薬品は、バイオリアクタ102で培養された細胞によって生成される製品を指す。バイオリアクタ102は、細胞培養媒体と、バイオ医薬品を生成するように構成されたプロデューサ細胞と、を含む。このような細胞またはプロデューサ細胞の例には、細菌などの原核細胞、ならびにチャイニーズハムスター卵巣(Chinese Hamster Ovary:CHO)細胞およびヒト胚性腎臓(Human Embryonic Kidney:HEK)細胞などの真核細胞が含まれるが、これらに限定されない。バイオ医薬品の例には、モノクローナル抗体、二重特異性抗体、多重特異性抗体、抗体薬物複合体、タンパク質、血液因子、血栓溶解剤、ホルモン、インターフェロン、造血成長因子、ならびに遺伝子治療の薬、治療薬、および製品などの核酸系バイオ医薬品が含まれる。
【0025】
システム100は、バイオリアクタ102の各々の実行の間に、製造プロセスに関する変数パラメータを測定するように構成された変数測定モジュール104を含む。本発明の文章中では、実行は、エンドツーエンドのバイオ医薬品製造プロセスに対応する。本発明全体を通じて、実行は互換的にバッチと称され、その逆もまた同様である。バイオ医薬品製造は、バッチ式または半連続式で実行される。すべてのプロセスには、プロセスを停止させる終了点が定められている。プロセスは、ダウンタイムの期間の後、再びスタートから始まる。したがって、測定により生成されるデータは、不連続な繰り返しの時系列であるとみなされ得る。
【0026】
本発明の実施形態では、バイオ医薬品製造プロセスは、細胞培養プロセスであり、変数パラメータは、バイオリアクタ環境の特性決定と、収量および品質などの製品の態様と、を含み得る。本明細書で、変数パラメータは、重要工程パラメータ(CPP)および重要品質特性(CQA)の2種類であり得る。CPPの例には、生細胞密度、オスモル濃度、少なくとも1つの代謝物の定性分析、および少なくとも1つの代謝物の定量分析が含まれるが、これらに限定されない。CQAの例には、力価、凝集プロファイル、チャージバリアント分析、疎水性相互作用、親水性相互作用、およびミドルアップ質量分析が含まれるが、これらに限定されない。
【0027】
本発明の実施形態では、変数測定モジュール104は、バイオリアクタの複数のバッチについて、所定のサンプリング頻度で各パラメータを測定する。したがって、各バッチの間、変数測定モジュール104は、各CPPまたはCQAについて複数のサンプルを取得する。例えば、
図2Aを参照すると、所与の変数について、第1のバッチ/実行の間に第1のセットのサンプル202(1)が、第2のバッチ/実行の間に第2のセットのサンプル202(2)が、第3のバッチ/実行の間に第3のセットのサンプル202(3)が、第nのバッチ/実行の間に第nのセットの複数のサンプル202(n)が取得される。
【0028】
図1に戻って参照すると、システム100は、(
図2Aに示されるような)垂直形式のパラメータデータを(
図2Bに示されるような)水平形式に変換するように構成されたデータ変換モジュール106をさらに含む。各変数について、データ変換モジュール106は、第1のバッチから第nのバッチまでのパラメータデータを順次結合して、変換データを生成する。例えば、
図2Bを参照すると、データ変換モジュール106は、第1、第2、第3、および第nのセットのサンプル202(1)、202(2)、202(3)、..、202(n)を順次結合して、所定のパラメータについて変換データ204を生成する。変換データ204は、n回の実行の期間にわたるパラメータデータを示し、時間分解されたデータのパターンを維持する単一の時系列であり、バイオ医薬品製造プロセスへの時系列分析の適用を可能にする。したがって、本願の進歩性は、データを、変換データ204などの単一の横行のデータに展開するデータ変換にある。
【0029】
図2Cは、本発明の実施形態に係る、複数のバイオリアクタの実行の間の所与のパラメータについての変換データ204を示す。変換データ204は、時間分解されたデータのパターンを維持する時系列を形成しており、1つ以上の変数パラメータの将来の値を処理および予測するために時系列分析を適用可能にする。変換データ204はまた、所与の変数の季節性などの態様を捉えることを可能にし、ある期間にわたる所与の変数の傾向を確立するのにも役立つ。
【0030】
図1に戻って参照すると、データ訓練モジュール108は、複数のパラメータについての複数の変換データを訓練サンプルデータとして使用して、時系列分析モデルを訓練する。時系列分析モデルは、多変量時系列分析モデルまたは単変量時系列分析モデルであり得る。本発明の目的に使用され得る単変量および多変量時系列分析モデルの例には、「自己回帰、自己回帰移動平均」、「自己回帰和分移動平均(Autoregressive Integrated Moving Average:ARIMA)」、「季節自己回帰和分移動平均(Seasonal Autoregressive Integrated Moving-Average:SARIMA)」、「外因性回帰変数を用いた季節自己回帰和分移動平均(Seasonal Autoregressive Integrated Moving-Average with Exogenous Regressor:SARIMAX)」、「ベクトル自己回帰(Vector Autoregression:VAR)」、「ベクトル自己回帰移動平均(Vector Autoregression Moving-Average:VARMA)」、「ベクトル誤差修正モデル(Vector Error Correction Model:VECM)」、および「外因性回帰変数を用いたベクトル自己回帰移動平均(Vector Autoregression Moving-Average with Exogenous Regressor:VARMAX)」が含まれる。したがって、天気予報および金融などの領域で従来から使用されている、確立された単変量および多変量アルゴリズムが、バイオ医薬品製造プロセスでの性能予測に利用され得る。
【0031】
データ変換モジュール106によって記述される特定の変換がなければ、バイオプロセスデータセット202(1)、202(2)、202(3)、..、202(n)は、十分に確立された時系列法と互換性がないことに留意されたい。単一の連続した時系列として各バッチを共に結合することによる、複数のバッチからのバイオプロセスデータの変換は、バイオ医薬品製造プロセスを理解するための、およびこのようなプロセスの将来の性能を予測するための従来の時系列分析法の使用を可能にする。
【0032】
訓練された時系列分析モデルは、バイオ医薬品製造プロセスの単位操作の各々について、CPPおよびCQAの各々の将来の値を予測するために使用される。変数測定モジュール104はさらに、時刻「t」で1つ以上の変数を測定し、測定された値をデータ訓練モジュール108に提供して、時系列分析モデルを連続的に強化および改善するように構成されている。
【0033】
システム100は、訓練された時系列モデルに基づいて1つ以上の変数パラメータを予測するように構成された性能予測モジュール110をさらに含む。性能予測モジュール110は、バイオリアクタ102の将来のプロセス性能に関する見識または予測を提供する。
【0034】
図3は、システム100を使用した、バイオリアクタ102内の組換え治療プロセスでの細胞培養性能を予測するグラフ表示である。
【0035】
変数測定モジュール104は、モノクローナル抗体を生成するCHO細胞株についてバイオリアクタからデータを取得する。変数測定モジュール104は、細胞培養環境からの様々な測定の値および組換えタンパク質の重要な測定値を特徴付ける自動測定システムを採用する。合計で4回のバイオリアクタの実行が行われ、データ変換モジュール106は、
図2Bに示すような方式で、得られたデータを端から端まで結合した。
【0036】
データ訓練モジュール108は、ベクトル誤差修正モデル(VECM)と呼ばれる多変量時系列分析を採用し、将来の性能を予測して、時系列分析を用いた所与のアプローチの利用を示す。個々のVECM時系列予測モデルは、対象のCPPデータ(乳酸、アンモニア、グルタミン、生細胞密度、生存率、およびオスモル濃度)ならびに単一のCQAを使用して訓練される。CPPデータは、テストバイオリアクタの今後24時間について各時点でのCQAの値を予測するために使用される。24時間の予測に達すると、測定されたデータは、モデルを強化するために使用され、新しい予測が生成される。
図3では、テストバイオリアクタの事象において、マーカーは、予測された値の各々を示し、黒線は、CQAの実際の測定の値を示す。
【0037】
予測された値および実際の測定の値は、新しいデータ変換およびその後の時系列分析の正確さを示している。時系列モデルは、わずか4バッチで正確に訓練されて、コストおよび開発時間を低減し得る。重要なのは、最終的なモデルが解釈されて、製造中のプロセス変更に関する根拠を示せるだけでなく、承認プロセス中に規制当局に提示できる式として最終的なモデルを解けることである。
【0038】
本発明の好ましい実施形態では、システム100は、計算デバイスと、計算デバイスに動作可能に接続された有形の非一時的メモリ手段と、を含み得る。計算デバイスは、パーソナルコンピュータか、タブレットコンピュータ、ラップトップ、スマートフォン、接続された家庭用デバイスなどのポータブルデバイスか、または任意のオペレーティングシステムベースのポータブルデバイスであり得る。計算デバイス上で展開されるオペレーティングシステムは、Windows、OSX、Linux(登録商標)、iOS、Androidなどであり得る。メモリ手段は、データを記憶するように適合した任意の内部もしくは外部デバイスまたはウェブベースのデータ記憶機構であり得る。
【0039】
メモリ手段は、バイオ医薬品製造プロセスの1つ以上の単位操作から複数のCPPおよびCQAを測定および処理するように計算デバイスを構成するための複数の命令をメモリ手段上に記憶している。
【0040】
計算デバイスは、バイオ医薬品製造プロセスの少なくとも1つの単位操作について所定のサンプリング頻度でCPPおよびCQAを連続的に測定するように構成されている。計算デバイスはさらに、各単位操作について、測定されたCPPおよびCQAの各々の値を順次マージし、所定の時点でCPPおよびCQAの各々の値を測定するように構成されている。順次マージされた値、ならびに所定の時点のCPPおよびCQAの測定された値は、入力として、時系列分析モデルを連続的に訓練するために使用される。時系列分析モデルは、多変量時系列分析モデルまたは単変量時系列分析モデルであり得る。訓練された時系列分析モデルは、バイオ医薬品製造プロセスの各単位操作について、CQAの各々およびCPPの各々の将来の値を予測するために利用される。上記実施形態に係るシステムは、CPPおよびCQAの予測された値を訓練データとして利用して、訓練された時系列分析モデルを連続的に強化する。システムは、グラフィカルユーザインターフェースをさらに備え、当該グラフィカルユーザインターフェースは、計算デバイスに動作可能に接続されており、各単位操作について、重要品質特性の各々および複数の重要工程パラメータの各々の予測された値をグラフィカルに表示するように構成されている。
【0041】
本発明の文脈では、本明細書に記載されたシステムおよび方法は、CQAからCPPを予測できるように逆に機能することができることが理解されるであろう。上流のパラメータを下流の予測に使用できるように、1つ以上の単位操作をプロセスでリンクさせることができる。このアプローチの利点は、連続的な製造が可能なことである。
【0042】
図4は、バイオ医薬品製造プロセスの性能を予測するための方法400を示すフローチャートである。ステップ402で、バイオ医薬品製造プロセスのパラメータは、所定のサンプリング頻度で測定され、上記パラメータは、上記プロセスのn回の実行について測定される。
【0043】
ステップ404で、n回の実行のパラメータデータは、n回の実行の期間にわたるパラメータデータを示す変換データを生成するために単一の連続的な時系列方式で順次結合される。
【0044】
ステップ406で、時系列分析モデルは、複数のパラメータに対応して生成された複数の変換データに基づいて、バイオ医薬品製造プロセスの性能を予測するために訓練される。
【0045】
ステップ408で、複数のパラメータは、所定の時点で測定され、上記測定の値は、訓練された時系列分析モデルを強化および改善するために使用される。
【0046】
ステップ410で、複数のパラメータは、訓練された時系列分析モデルに基づいて、バイオ医薬品製造プロセスの将来の実行のために予測される。
【0047】
本発明を特定の実施形態を参照して記載したが、この説明は、限定的な意味で解釈されることを意図していない。開示された実施形態の様々な修正、および主題の代替の実施形態は、主題の説明を参照すると当業者に明らかになるであろう。したがって、定められた本発明の趣旨または範囲から逸脱することなく、このような修正が行われ得ることが想定される。
【0048】
さらに、当業者は、本明細書で開示される実施形態と関連して記載される様々な例示的な方法ステップが、電子ハードウェア、またはハードウェアおよびソフトウェアの組合せを使用して実装され得ることを理解するであろう。ハードウェア、ならびにハードウェアおよびソフトウェアの組合せのこの互換性を明確に示すために、様々な例示およびステップをそれらの機能性の観点で一般的に上述してきた。このような機能性が、ハードウェアとして実装されるか、ハードウェアおよびソフトウェアの組合せとして実装されるかは、当業者の設計選択に依存する。このような当業者は、各々の特定の用途について様々な方法で、記載された機能性を実装し得るが、このような明白な設計選択は、本発明の範囲からの逸脱をもたらすものと解釈されるべきではない。
【0049】
本開示に記載される方法は、様々な手段を使用して実装され得る。例えば、本開示に記載されるシステムは、ハードウェア、ファームウェア、ソフトウェア、またはこれらの任意の組合せで実装され得る。ハードウェア実装について、処理ユニットまたはプロセッサもしくはコントローラは、1つ以上の特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、デジタル信号プロセッサ(Digital Signal Processor:DSP)、デジタル信号処理デバイス(Digital Signal Processing Device:DSPD)、プログラマブルロジックデバイス(Programmable Logic Device:PLD)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載される機能を実行するように設計された他の電子ユニット、またはこれらの組合せの内部に実装され得る。
【0050】
ファームウェアおよび/またはソフトウェア実装について、ソフトウェアコードは、メモリ手段に保存され、プロセッサによって実行され得る。メモリ手段は、プロセッサユニットの内部またはプロセッサユニットの外部に実装され得る。本明細書で使用されるとき、「メモリ」という用語は、揮発性メモリまたは不揮発性メモリのいずれかの種類を指す。
【0051】
図面を参照して記載される本発明の実施形態は、コンピュータ装置および/またはコンピュータ装置で実行されるプロセスを含む。しかしながら、本発明はまた、コンピュータプログラム、特に、本発明を実行するように適合した担体上または当該担体内に記憶されたコンピュータプログラムに及ぶ。プログラムは、部分的にコンパイルされた形態などのソースコード、オブジェクトコード、もしくはソースコードおよびオブジェクトコードの中間のコードの形態、または本発明に係る方法の実装で使用するのに好適な任意の他の形態であり得る。担体は、ROMなどの記憶媒体、例えば、メモリスティックまたはハードディスクを備え得る。担体は、電気ケーブルもしくは光ケーブルを介して、または無線もしくは他の手段によって送信され得る電気信号または光信号であり得る。
【0052】
本明細書では、「備える(comprise)、備える(comprises)、備わる(comprised)、および備えている(comprising)」という用語またはこの任意の変形、ならびに「含む(include)、含む(includes)、含まれる(included)、および含んでいる(including)」という用語またはこの任意の変形は、完全に相互に交換可能であるとみなされ、これらすべてに、可能な限り広い解釈が与えられるべきであり、逆もまた同様である。
【0053】
本発明は、本明細書で前述した実施形態に限定されるものではなく、構造および細部の両方で変更され得る。
【国際調査報告】