IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェネンテック, インコーポレイテッドの特許一覧

特表2024-512609メカニスティッククロマトグラフィモデルの不確実性の推定
<>
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図1
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図2
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図3
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図4
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図5
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図6
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図7
  • 特表-メカニスティッククロマトグラフィモデルの不確実性の推定 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】メカニスティッククロマトグラフィモデルの不確実性の推定
(51)【国際特許分類】
   G16C 20/80 20190101AFI20240312BHJP
【FI】
G16C20/80
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023558948
(86)(22)【出願日】2022-03-25
(85)【翻訳文提出日】2023-11-09
(86)【国際出願番号】 US2022021843
(87)【国際公開番号】W WO2022204453
(87)【国際公開日】2022-09-29
(31)【優先権主張番号】63/166,939
(32)【優先日】2021-03-26
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】ライアル, ジェシカ ヤン
(72)【発明者】
【氏名】トンプソン, コナー ジェームズ
(72)【発明者】
【氏名】バージェス, ショーン マッケンジー
(57)【要約】
メカニスティッククロマトグラフィモデルの不確実性を推定するための方法、システム、および非一時的コンピュータ可読媒体。複数のパラメータを含むクロマトグラフィのメカニスティックモデルが受信される(302)。複数のパラメータの各々について、複数のパラメータの値の間の関係に基づいて、対応する値の領域が特定される(304)。複数のパラメータの各パラメータが、各パラメータの対応する値の領域内でサンプリングされ、複数のシミュレーションセットが形成される(306)。メカニスティックモデルの不確実性が、複数のシミュレーションセットを使用して定量化される(308)。
【選択図】図2
【特許請求の範囲】
【請求項1】
メカニスティッククロマトグラフィモデルの不確実性を推定するための方法であって、
複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることと、
前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することと、
各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することと、
前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化することと
を含む、方法。
【請求項2】
前記複数のパラメータの各々について、前記対応する値の領域を特定することは、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することを含む、請求項1に記載の方法。
【請求項3】
前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、請求項2に記載の方法。
【請求項4】
前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算することは、
前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定することと、
前記探索領域に関する前記選択された損失関数の極値を計算することと
を含む、請求項2に記載の方法。
【請求項5】
前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算することは、前記極値について前記共分散行列を計算することをさらに含む、請求項4に記載の方法。
【請求項6】
前記複数のパラメータの各々について、前記対応する値の領域を特定することは、
前記複数のパラメータをサンプリングして複数のパラメータセットを形成することと、
前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択することと、
前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することと
を含む、請求項1に記載の方法。
【請求項7】
前記不確実性を定量化することは、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成することを含む、請求項1に記載の方法。
【請求項8】
前記不確実性を定量化することは、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定することをさらに含む、請求項7に記載の方法。
【請求項9】
実験データを受け取ることと、
前記実験データを使用して前記メカニスティックモデルを生成することと
をさらに含む、請求項1に記載の方法。
【請求項10】
メカニスティッククロマトグラフィモデルの不確実性を推定するためのシステムであって、
クロマトグラフィのメカニスティックモデルを取得するように構成されたデータソースと、
前記データソースから前記クロマトグラフィのメカニスティックモデルを受け取るように構成されたプロセッサと
を備え、
前記メカニスティックモデルは、複数のパラメータを含み、
前記プロセッサは、
前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定し、
各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成し、
前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化する
ようにさらに構成される、システム。
【請求項11】
前記プロセッサは、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算するようにさらに構成される、請求項10に記載のシステム。
【請求項12】
前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、請求項11に記載のシステム。
【請求項13】
前記プロセッサは、前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定し、前記探索領域に関する前記選択された損失関数の極値を計算するようにさらに構成される、請求項10に記載のシステム。
【請求項14】
前記プロセッサは、前記極値について前記共分散行列を計算することによって前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算するようにさらに構成される、請求項13に記載のシステム。
【請求項15】
前記プロセッサは、前記複数のパラメータをサンプリングして複数のパラメータセットを形成し、前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択し、前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算するようにさらに構成される、請求項10に記載のシステム。
【請求項16】
前記プロセッサは、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成し、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定するようにさらに構成される、請求項15に記載のシステム。
【請求項17】
前記プロセッサは、実験データを受け取り、前記実験データを使用して前記メカニスティックモデルを生成するようにさらに構成される、請求項10に記載のシステム。
【請求項18】
プログラムを格納した非一時的コンピュータ可読媒体であって、前記プログラムは、メカニスティッククロマトグラフィモデルの不確実性を推定するための方法をコンピュータに実行させるように構成され、
前記方法が、
複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることと、
前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することと、
各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することと、
前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化することと
を含む、非一時的コンピュータ可読媒体。
【請求項19】
前記方法は、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することをさらに含む、請求項18に記載の非一時的コンピュータ可読媒体。
【請求項20】
前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、請求項19に記載の非一時的コンピュータ可読媒体。
【請求項21】
前記方法は、
前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定することと、
前記探索領域に関する前記選択された損失関数の極値を計算することと
をさらに含む、請求項19に記載の非一時的コンピュータ可読媒体。
【請求項22】
前記方法は、前記極値について前記共分散行列を計算することをさらに含む、請求項21に記載の非一時的コンピュータ可読媒体。
【請求項23】
前記方法は、
前記複数のパラメータをサンプリングして複数のパラメータセットを形成することと、
前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択することと、
前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することと
をさらに含む、請求項18に記載の非一時的コンピュータ可読媒体。
【請求項24】
前記方法は、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成することをさらに含む、請求項18に記載の非一時的コンピュータ可読媒体。
【請求項25】
前記方法は、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定することをさらに含む、請求項24に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年3月26日に出願された米国仮出願第63/166,939号の優先権および利益を主張し、その内容は、その全体が本明細書に組み込まれる。
【0002】
開示の分野
本明細書は、一般に、メカニスティッククロマトグラフィモデリングに関する。より具体的には、本明細書は、メカニスティッククロマトグラフィモデルに関連する不確実性を推定するための方法およびシステムを提供する。
【背景技術】
【0003】
緒言
一般に、クロマトグラフィは、バイオ医薬品を精製するために使用される主要なプロセスである。メカニスティックモデリングを使用して、クロマトグラフィプロセスを改善し、これらのプロセスに関する問題を調査し、クロマトグラフィシミュレーションを実行し得る。メカニスティックモデルは、複雑なシステムまたはプロセスを、システムまたはプロセスの個々の部分がどのように機能するか、およびそれらの部分を結合する方法を調べることによって、理解することができると仮定する。次いで、メカニスティックモデルは、この複雑なシステムまたはプロセスを、複雑なシステムまたはプロセスの基本原理を依然として捉える単純化されたやり方で数学的に表す。クロマトグラフィプロセスなどのプロセスのためのメカニスティックモデルの広範な適用または体系的な適用に対する1つの障壁は、メカニスティックモデルにおける信頼性の認定および確立に関連する困難であり得る。例えば、メカニスティックモデルの不確実性を推定するためのいくつかの現時点において利用可能な方法は、所望よりも時間がかかり、計算コストが高い。
【発明の概要】
【0004】
概要
1つ以上の実施形態において、メカニスティッククロマトグラフィモデルの不確実性を推定するための方法が提供される。複数のパラメータを含むクロマトグラフィのメカニスティックモデルが受け取られる。複数のパラメータの各々について、複数のパラメータについての値の間の関係に基づいて、対応する値の領域が特定される。複数のパラメータの各パラメータが、各パラメータについての対応する値の領域においてサンプリングされ、複数のシミュレーションセットが形成される。メカニスティックモデルについての不確実性が、複数のシミュレーションセットを使用して定量化される。
【0005】
1つ以上の実施形態において、メカニスティッククロマトグラフィモデルの不確実性を推定するためのシステムが提供される。システムは、クロマトグラフィのメカニスティックモデルを取得するように構成されたデータソースと、データソースからクロマトグラフィのメカニスティックモデルを受け取るように構成されたプロセッサとを備え、メカニスティックモデルは、複数のパラメータを含む。プロセッサは、複数のパラメータの各々について、複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定し、各パラメータについての対応する値の領域内の複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成し、複数のシミュレーションセットを使用してメカニスティックモデルについての不確実性を定量化するようにさらに構成される。
【0006】
1つ以上の実施形態において、プログラムを格納した非一時的コンピュータ可読媒体であって、プログラムが、メカニスティッククロマトグラフィモデルの不確実性を推定するための方法をコンピュータに実行させるように構成される、非一時的コンピュータ可読媒体が提供される。方法は、複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることと、複数のパラメータの各々について、複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することと、各パラメータについての対応する値の領域内の複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することと、複数のシミュレーションセットを使用してメカニスティックモデルについての不確実性を定量化することとを含む。
【図面の簡単な説明】
【0007】
本明細書に開示される原理およびそれらの利点のさらに完全な理解のために、ここで、以下の説明が添付の図面と併せて参照される。
【0008】
図1】種々の実施形態によるクロマトグラフィシステムの概略図である。
【0009】
図2】種々の実施形態によるモデル分析システムのブロック図である。
【0010】
図3】種々の実施形態によるメカニスティックモデルの不確実性を推定するためのプロセスのフローチャートである。
【0011】
図4】種々の実施形態によるメカニスティッククロマトグラフィモデルの不確実性を予測するためのプロセスのフローチャートである。
【0012】
図5】種々の実施形態によるメカニスティックモデルについて共分散行列を計算するためのプロセスのフローチャートである。
【0013】
図6】種々の実施形態によるメカニスティックモデルについて生成された2つの異なる種類のマルチパラメトリックプロットの横並びでの比較である。
【0014】
図7】ヘッセ法によって生成された不確実性値とマルコフ連鎖モンテカルロ法を使用して生成された不確実性値とを比較する表を示している。
【0015】
図8】種々の実施形態によるコンピュータシステムのブロック図である。
【0016】
図が必ずしも一定の縮尺で描かれているわけではなく、図中の物体が必ずしも互いに比例尺で描かれているわけでもないことを、理解されたい。図は、本明細書に開示される装置、システム、および方法のさまざまな実施形態に明確さおよび理解をもたらすことを意図して示されている。可能な限り、同じ参照番号が、図面全体を通して、同じ部分または同様の部分を指して使用される。さらに、図面が決して本教示の範囲を限定することを意図するものではないことを、理解すべきである。
【発明を実施するための形態】
【0017】
詳細な説明
I.概要
メカニスティックモデリングは、種々のシステムおよびプロセスがどのように機能するかを理解するための重要なツールである。例えば、メカニスティッククロマトグラフィモデリングは、種々の生物学、薬学、および生物医薬の用途のための重要なツールとなり得る。メカニスティッククロマトグラフィモデリングは、シミュレートされたクロマトグラフィプロセス(例えば、シミュレートされたクロマトグラフィ精製)の最中の分子属性の非破壊でのリアルタイム測定を可能にし、シミュレートされるクロマトグラフィプロセスへの有意義な洞察を提供することができる。
【0018】
検証され、あるいは他のやり方で正当化される場合、メカニスティッククロマトグラフィモデリングは、メカニスティッククロマトグラフィモデリングによって生成された結果からの内挿および外挿の信頼性を可能にするやり方で、クロマトグラフィを説明し得る。さらに、メカニスティッククロマトグラフィモデリングは、プロセス最適化、リアルタイムプロセス監視、制御クロマトグラフィプロセス、およびクロマトグラフィプロセスへの洞察を提供する他の操作を可能にし得る。またさらに、この種のモデリングは、クロマトグラフィプロセスにとって重要な特定の動作パラメータの特定を可能にし得る。
【0019】
所与の用途に関して信頼性のあるメカニスティッククロマトグラフィモデルを使用できるために、メカニスティッククロマトグラフィモデルの予測力を理解することが必要となり得る。例えば、メカニスティッククロマトグラフィモデルによって行われる予測の精度を理解することが重要となり得る。そのようなメカニスティッククロマトグラフィモデルを評価するためのいくつかの現時点において利用可能な方法は、モデルの個々のパラメータに関連する不確実性を評価または推定する。しかしながら、パラメータの不確実性は、全体的なメカニスティッククロマトグラフィモデルの予測力の指標をもたらさないかもしれない。さらに、メカニスティッククロマトグラフィモデルの不確実性を評価するためのいくつかの現時点において利用可能な方法は、計算コストが高く、時間がかかる。例えば、メカニスティッククロマトグラフィモデルの不確実性を評価するための現時点において利用可能な1つの方法は、数日間の処理リソース(例えば、10または10の関数呼び出し)を必要とし得る。したがって、そのような方法に関して必要とされる時間、コスト、および処理リソースゆえに、これらの方法の使用が、特定の用途に関して、現実的に実行不可能になる可能性がある。
【0020】
所与の用途に使用されるメカニスティッククロマトグラフィモデルにおいて信頼性を有することの重要性を認識および考慮して、本明細書に記載の種々の実施形態は、メカニスティッククロマトグラフィモデルを評価するための方法およびシステムを提供する。例えば、本明細書に記載の種々の実施形態は、メカニスティッククロマトグラフィモデルがどの程度正確であるかを、メカニスティッククロマトグラフィモデルに関連する不確実性の推定に基づいて決定するための方法およびシステムを提供する。本明細書に記載の方法およびシステムは、現時点において利用可能な方法およびシステムの少なくともいくつかよりも高速かつ計算コストが低いやり方でメカニスティッククロマトグラフィモデルの不確実性を推定することを可能にする。例えば、限定するものではないが、本明細書に記載の種々の実施形態は、現時点において利用可能ないくつかの方法において必要とされる数日間と比較して、数時間(例えば、場合によっては、6時間未満)でメカニスティッククロマトグラフィモデルの不確実性を計算することを可能にし得る。1つ以上の実施形態において、これらの時間の節約は、現時点において利用可能ないくつかの方法において必要とされる105または106の関数呼び出しと比較して、使用される関数呼び出しの数が少ない(例えば、10~10の関数呼び出し)ことに少なくとも部分的に起因し得る。したがって、時間、コスト、および処理リソースに関する節約を達成し得る。
【0021】
II.定義
本開示は、これらの例示的な実施形態および用途に限定されず、例示的な実施形態および用途の動作の様相、あるいは例示的な実施形態および用途の本明細書において説明される様相に限定されない。さらに、図は、簡略化した図または部分的な図を示している場合があり、図における要素の寸法は、誇張されている場合があり、あるいは比例尺でない場合がある。
【0022】
さらに、「・・・の上にある(on)」、「・・・に取り付けられている(attached to)」、「・・・に接続されている(connected to)」、「・・・に結合している(coupled to)」という用語、または同様の用語が本明細書において使用される場合、或る要素(例えば、構成要素、材料、層、基板、など)が別の要素「の上にある」、「に取り付けられている」、「に接続されている」、または「に結合している」ことができ、或る要素が、別の要素の上に直接あるか、別の要素に直接取り付けられているか、別の要素に直接接続されているか、または別の要素に直接結合しているか、あるいは或る要素と別の要素との間に1つ以上の介在要素が存在するかは、どちらでもよい。さらに、要素のリスト(例えば、要素a、b、c)を参照する場合、そのような参照は、リストに挙げられた要素のうちのいずれか1つを単独で含み、リストに挙げられた要素の全てではない一部からなる任意の組み合わせを含み、さらには/あるいはリストに挙げられた全ての要素からなる組み合わせを含むように意図される。本明細書における節の分割は、単に検討を容易にするためのものであって、考察される要素のいかなる組み合わせも限定するものではない。
【0023】
別段の定めがない限り、本明細書に説明される本教示と併せて使用される科学用語および技術用語は、当業者によって一般的に理解される意味を有するものとする。さらに、文脈がとくに必要としない限り、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。一般に、本明細書に記載される化学、生化学、分子生物学、薬理学、および毒物学に関連して利用される命名法およびこれらの技術は、当技術分野において周知かつ一般的に使用されている命名法および技術である。
【0024】
本明細書において使用されるとき、「実質的に」は、意図される目的に関して機能するために充分であることを意味する。したがって、「実質的に」という用語は、例えば当業者であれば予想すると考えられるが、全体的な性能に明らかには影響しない絶対的または完全な状態、寸法、測定値、結果、などからの小さな取るに足らない変動を許容する。数値、あるいは数値として表すことができるパラメータまたは特性に関して使用される場合、「実質的に」は、10パーセント以内を意味する。
【0025】
「複数」という用語は、2つ以上を意味する。
【0026】
本明細書において使用されるとき、用語「複数」は、2、3、4、5、6、7、8、9、10、またはそれ以上であってよい。
【0027】
本明細書において使用されるとき、用語「~のセット」は1つ以上を意味する。例えば、アイテムのセットは、1つ以上のアイテムを含む。
【0028】
本明細書において使用されるとき、「~のうちの少なくとも1つ」という語句は、アイテムのリストと共に使用されるとき、リストに挙げられたアイテムのうちの1つ以上のアイテムからなるさまざまな組み合わせが使用されてよく、リスト中のアイテムのうちのただ1つが必要とされてもよいことを意味する。アイテムは、特定の物体、事物、ステップ、動作、プロセス、またはカテゴリであってよい。換言すると、「~のうちの少なくとも1つ」は、アイテムの任意の組み合わせ、またはいくつかのアイテムが、リストから使用されてよいが、リスト中の全てのアイテムが必要とされるわけではない。例えば、限定されないが、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、アイテムA;アイテムAとアイテムB;アイテムB;アイテムAとアイテムBとアイテムC;アイテムBとアイテムC;またはアイテムAとアイテムCを意味する。場合によっては、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、これら限られるわけではないが、アイテムAが2つとアイテムBが1つとアイテムCが10個;アイテムBが4つとアイテムCが7つ、または何らかの他の適切な組み合わせを意味する。
【0029】
本明細書において使用されるとき、「モデル」は、1つ以上のアルゴリズム、1つ以上の数学的手法、1つ以上の機械学習アルゴリズム、またはこれらの組み合わせを含んでよい。
【0030】
本明細書において使用されるとき、「分析物」は、1つ以上の個別の成分を含む混合物を指す。クロマトグラフィの文脈において、分析物は、個々の成分または分子を分離および分析すべき混合物であってよい。
【0031】
本明細書において使用されるとき、「クロマトグラフィ」は、分析物を目的のさまざまな成分(例えば、分子)に分離するための技術またはプロセスを指す。分析物は、典型的には、一般に「移動相」またはキャリアと呼ばれる流体(例えば、ガス、溶媒、水、など)に溶解させられる。移動相は、一般に固定相または吸着剤と呼ばれる材料が固定されたシステム(例えば、カラム、毛細管、プレート、シート、など)を通って溶質を運ぶ。固定相は、例えば、シリカゲルビーズ、または固定および充てんが可能な何らかの他の種類の粒子を含み得るが、これらに限定されない。分析物のさまざまな分子は、固定相に関して異なる親和性を有してもよく、分析可能な固定相との異なる相互作用を有してもよい。さらに、クロマトグラフィは、例えば、対流、分散、拡散、および吸着などのさまざまな流体力学原理を含む。拡散には、例えば、膜拡散および細孔拡散が含まれる。
【0032】
本明細書において使用されるとき、「対流」は、流体のバルク運動による質量移動の機構を指す。この流体の移動は、外力によって誘発される。クロマトグラフィに関して、対流とは、分析物が移動相の移動によってカラムを通って輸送されるときに、移動相内の分析物が固定相に向かって移動することを意味する。移動相の移動が、圧力勾配などの外力によって駆動される一方で、固定相に向かう分析物の移動は、濃度勾配によって駆動される。
【0033】
本明細書において使用されるとき、「分散」は、高濃度領域から低濃度領域への質量の拡散をもたらす非理想的な流体の流れのパターンによる質量移動の機構を指す。クロマトグラフィにおいて、カラム内の充てん物は、粒子(例えば、ビーズ)からなり、これらの粒子の間に流路が形成される。充てんおよび粒子形状の違いにより、異なる流路において移動相の速度に違いが生じ得る。さらに、移動相内を流れる分析物の分子は、異なる流路に沿って異なる速度で移動し得る。速度の差および他の流れの乱れは、軸方向の質量の広がりをもたらす。
【0034】
本明細書において使用されるとき、「拡散」は、流体中の粒子のランダムな運動(ブラウン運動)による高濃度領域から低濃度領域への質量移動の機構を指す。この動きは、流体の流れとは無関係の微視的効果であり、流体内の濃度勾配によって駆動される。クロマトグラフィカラムに、多孔質の粒子(または、ビーズ)を充てんし得る。クロマトグラフィにおいて、移動相がこれらのビーズの細孔に進入し、移動相(流体)の停滞層がビーズの周囲に「膜」を形成する。移動相における拡散は、対流によって記述される。膜拡散は、分子がビーズの膜を通過して、例えば細孔に進入するときに生じる。細孔拡散は、細孔における分子の動きである。
【0035】
本明細書において使用されるとき、「吸着」は、固定相の細孔中に存在する分析物がビーズの内面に付着するプロセスを指す。吸着は、分子および固定相の特性に応じて、例えば、限定されないが、電荷、疎水性、および極性などのさまざまな機構によって駆動され得る。
【0036】
本明細書において使用されるとき、「メカニスティックモデル」は、自然科学の基本法則に基づくモデルを指す。物理的および生化学的原理が、メカニスティックモデルを構成するモデル方程式を構成する。例えば、メカニスティックモデルは、複雑なシステムまたはプロセス、その個々の部分、およびそれらの部分がどのように互いに結合し、もしくは使用されるかを表す数学的方程式から構成されてよい。メカニスティックモデルは、モデルを較正し、未知のモデルパラメータを決定するために、少数の実験データまたはデータ点を必要とし得る。例えば、場合によっては、メカニスティックモデルについてのパラメータを、約3~10回の実験で決定することができる。一般に、メカニスティックモデルのパラメータは、実際の物理的意味を有し、これは、メカニスティックモデルによって行われる予測の解釈を容易にするのに役立ち得る。さらに、パラメータが実際の物理的意味を有するため、メカニスティックモデルは、異なるプロセスをモデル化するためにパラメータを容易に変更することを可能にする。したがって、単一のメカニスティックモデルを使用して、多種多様なモデルアプリケーションを捕捉し、場合によっては、設計を介して品質義務を保証し得る。
【0037】
本明細書において使用されるとき、「メカニスティッククロマトグラフィモデル」は、クロマトグラフィプロセスを表すために使用されるメカニスティックモデルである。メカニスティッククロマトグラフィモデルは、吸着係数、拡散特性、材料特性、他の種類の特性、またはこれらの組み合わせなどの種々のパラメータを含み得るが、これらに限定されない。自然科学の法則を頼りに、メカニスティッククロマトグラフィモデルは、例えば、流体力学、物質移動現象、および相平衡の熱力学を含むクロマトグラフィに関与する種々の作用を表す。例えば、メカニスティッククロマトグラフィモデルは、対流、分散、拡散(膜拡散および細孔拡散)、吸着、またはこれらの組み合わせを考慮に入れてもよい。一般に、メカニスティッククロマトグラフィモデルは、モデル方程式に多数のプロセスパラメータを直接含む。さらに、メカニスティッククロマトグラフィモデルから生成されたシミュレーション結果から、多数のさまざまなプロセス品質属性を計算することができる。このようにして、メカニスティッククロマトグラフィモデルを使用して、コンピュータでクロマトグラフィプロセスに対する影響を試験または分析し得る。
【0038】
III.メカニスティッククロマトグラフィモデリング
図1が、種々の実施形態によるクロマトグラフィシステム100の概略図である。クロマトグラフィシステム100は、クロマトグラフィシステム100において使用され得るカラムまたはシステムの種類の一例であるカラム102を含む。カラム102は、粒子106(例えば、ビーズ、シリカゲルビーズ)が充てん床を形成するように充てんされた流体104で満たされる。
【0039】
目的の分子108を、カラム102に注入し得る。種々の実施形態において、分子108はタンパク質の形態を取る。種々の実施形態において、クロマトグラフィシステム100を、タンパク質精製を実施するために使用し得る。1つ以上の実施形態において、分子108は、抗体、抗体断片、抗体複合体、核酸、および/または他の種類の分子を含む。
【0040】
カラム102に注入された後に、分子108は、矢印110の方向にカラム102内の流体104内の対流によって輸送される。この流れは、例えば、限定はしないが、圧力、力、またはその両方を使用して引き起こされてよい。1つ以上の実施形態においては、対流を促進するために、ポンプがカラム102に接続される。より高い速度のポンプ作用は、カラム102内により大きな対流をもたらし得る。
【0041】
クロマトグラフィシステム100内で、分子108は、分散の原理によって、粒子106間に形成された間隙空間内を移動する。これらの間隙空間は、粒子106間に作り出された流路または経路である。さまざまな要因が、カラム102内の分子108の間隙速度に影響を及ぼし得る。
【0042】
さまざまな分子108が、膜拡散によってさまざまな粒子106の膜を通過し、これらの粒子の細孔に進入し得る。例えば、分子112が、粒子116の膜114を通過する。細孔内のこれらの異なる分子の移動は、細孔拡散によって支配される。例えば、粒子116の細孔120内の分子118の移動は、細孔拡散によって支配される。さらに、分子118などの分子は、吸着によって粒子116の内面122に付着し得る。
【0043】
IV.メカニスティックモデリングの不確実性の予測
図2が、種々の実施形態によるモデル分析システム200のブロック図である。モデル分析システム200は、メカニスティックモデル202に関する情報を分析および提供するために使用される。メカニスティックモデル202は、クロマトグラフィのメカニスティックモデルとも呼ばれ得るメカニスティッククロマトグラフィモデルである。1つ以上の実施形態において、メカニスティックモデル202は、これに限られるわけではないが図1のクロマトグラフィシステム100などのクロマトグラフィシステムまたはプロセスを研究し、分析し、シミュレートし、制御し、修正し、あるいは他のやり方で評価するために使用される。
【0044】
種々の実施形態において、モデル分析システム200は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせを使用して実装されてよい。種々の実施形態において、モデル分析システム200は、コンピューティングプラットフォーム204を使用して実装されてよい。コンピューティングプラットフォーム204は、さまざまな形を取り得る。1つ以上の実施形態において、コンピューティングプラットフォーム204は、単一のコンピュータ(または、コンピュータシステム)あるいは互いに通信する複数のコンピュータを含む。他の例において、コンピューティングプラットフォーム204は、クラウドコンピューティングプラットフォームの形態を取る。
【0045】
1つ以上の実施形態において、コンピューティングプラットフォーム204を、データ記憶装置206、表示システム208、入力装置210のセット、またはこれらの組み合わせに、通信可能に結合させ得る。種々の実施形態において、データ記憶装置206、表示システム208、入力装置210のセット、またはこれらの組み合わせは、コンピューティングプラットフォーム204の一部と見なされても、あるいは他のやり方でコンピューティングプラットフォーム204と統合されてもよい。したがって、いくつかの例において、コンピューティングプラットフォーム204、データ記憶装置206、および表示システム208は、互いに通信する別個の構成要素であってよいが、他の例においては、これらの構成要素の何らかの組み合わせが統合されてもよい。
【0046】
モデル分析システム200は、メカニスティックモデル202を分析するために使用される。1つ以上の実施形態において、モデル分析システム200は、処理のためにメカニスティックモデル202を受け取る。例えば、これに限定されないが、モデル分析システム200は、遠隔ソース(例えば、別のコンピューティングプラットフォーム)からメカニスティックモデル202を受け取り得る。1つ以上の実施形態において、モデル分析システム200は、1つ以上の有線通信リンク、1つ以上の無線通信リンク、1つ以上の光通信リンク、またはこれらの組み合わせを介してメカニスティックモデル202を受け取る。種々の実施形態において、メカニスティックモデル202は、データ記憶装置206から取得される。
【0047】
種々の実施形態において、モデル分析システム200は、実験データ212に基づいてメカニスティックモデル202を生成するために使用される。実験データ212は、例えば、1つ、2つ、3つ、または何らかの他の数の実験を行うことによって取得または生成されたデータを含み得る。1つ以上の実施形態において、実験データ212は、約3~約10回の実験からのデータを使用して生成される。1つ以上の実施形態において、実験データ212は、データ記憶装置206に格納される。
【0048】
メカニスティックモデル202は、複数のパラメータ214を含む。種々の実施形態において、パラメータ214の少なくとも一部は、実際の物理的意味を有し得る。1つ以上の実施形態において、複数のパラメータ214の各々は、クロマトグラフィのプロセス、流体力学、物質移動現象、あるいは他の特性または因子に対応する実際の物理的意味を有する。このようにして、パラメータ214の各々は、メカニスティックモデル202の出力をクロマトグラフィの実際のプロセスと関連付けるやり方を提供し得る。
【0049】
モデル分析システム200は、まず、初期パラメータセット216を特定する。1つ以上の実施形態において、初期パラメータセット216は、パラメータ214についてのランダムまたはほぼランダムに選択された値のセットである。種々の実施形態において、初期パラメータセット216は、前回のパラメータセット処理の結果である。初期パラメータセット216を、初期パラメータ値と呼ぶこともできる。1つ以上の実施形態において、モデル分析システム200は、ラテン超立方体サンプリング(LHS)(ラテン超立方体スクリーンとも呼ばれる)を使用して、初期パラメータセット216をランダムまたはほぼランダムに選択する。種々の実施形態においては、損失関数または最小化アルゴリズムが、初期パラメータセット216を特定するために使用される。
【0050】
モデル分析システム200は、選択された損失関数を使用してメカニスティックモデル202についての極値218を見つける。1つ以上の実施形態において、選択された損失関数は、最大対数尤度関数、負対数尤度関数、または最大尤度関数の形態を取る。最適化アルゴリズムを、選択された損失関数についての極値218を特定するために選択し得る。選択された損失関数は、一般に、初期パラメータセット216に鑑みて極値に達することができることを保証するように選択される。最適化アルゴリズムは、任意の数のアルゴリズムまたはアルゴリズムの組み合わせを含み得る。1つ以上の実施形態において、最適化アルゴリズムは、Levenberg-Marquardt(LM)最小化アルゴリズムを含み得る。さまざまな実施形態において、最適化アルゴリズムは、最急降下法、Gauss-Newton法、Broden-Fletcher-Goldfarb-Shanno法(BFGS)、または他の勾配に基づく非ヒューリスティック最適化アルゴリズムを含み得る。
【0051】
モデル分析システム200は、パラメータ214間の関係について仮定を行う。種々の実施形態において、モデル分析システム200は、基礎となる分布がマルチパラメトリック(多変量)ガウス分布であると仮定する。この仮定は、時間、コスト、処理リソース、またはこれらの組み合わせに関する節約をもたらすために行われる。この仮定により、各パラメータ214からサンプリングされるべき値の範囲を狭くして、同時に見たときにパラメータが最も相関する場所でパラメータ214の各々についてサンプリングが実行される可能性を向上させることができる。すなわち、マルチパラメトリック(多変量)ガウス分布に基づいて、パラメータ214のより尤度の高い値からサンプリングが行われる。
【0052】
この仮定に基づいて、共分散行列220を極値218において計算し得る。共分散行列220は、パラメータ214にわたるマルチパラメトリック(多変量)ガウス分布を記述し、メカニスティックモデル202の不確実性を確実に決定するためにパラメータ214をサンプリングし得る「狭められた空間」を特定する役に立つ。
【0053】
モデル分析システム200は、パラメータ214の各々をサンプリングして、複数のシミュレーションセット222を形成する。モデル分析システム200は、シミュレーションセット222を使用してメカニスティックモデル202のシミュレーションを実行し、メカニスティックモデル202を使用してさまざまな予測を生成する。これらの予測は、メカニスティックモデル202についての不確実性を定量化するために使用される。例えば、1つ以上の実施形態において、予測は、メカニスティックモデル202についての不確実性出力224を生成するために使用される。不確実性出力224は、例えば、これに限定されないが、メカニスティックモデル202の精度の表示を含み得る。1つ以上の実施形態において、不確実性出力224は、メカニスティックモデル202についての信頼区間または1つ以上の信頼値を特定する。例えば、不確実性出力224は、95%の信頼度、99.7%の信頼度、何らかの他のレベルの信頼度、またはこれらの組み合わせに関する値を特定し得る。メカニスティックモデル202に関連する精度についての情報を提供することにより、モデル分析システム200は、メカニスティックモデル202における信頼性を提供することができる。
【0054】
不確実性出力224は、さまざまな形態を取り得る。例えば、不確実性出力224は、1つ以上の値、信頼区間を含む報告、信頼区間を特定するアラート、プロット、不確実性の何らかの他の種類の視覚的表現、またはこれらの組み合わせであってよい。1つ以上の実施形態において、モデル分析システム200は、表示システム208上に不確実性出力224を表示する。種々の実施形態において、モデル分析システム200は、表示システム上に不確実性出力224に基づいて生成された出力を表示する。例えば、不確実性出力224は、1つ以上の信頼値(例えば、95%信頼値、5%および95%信頼値、など)を含み得る。モデル分析システム200は、これらの信頼値が許容可能である(例えば、選択されたしきい値を上回り、あるいは下回る)かどうかを示すアラートまたは報告を、表示システム208上に表示し得る。
【0055】
図3が、種々の実施形態によるメカニスティックモデルの不確実性を推定するためのプロセス300のフローチャートである。種々の実施形態において、プロセス300は、図2に記載のモデル分析システム200を使用して実装される。とくには、プロセス300を使用して、例えば、これに限定されないが、図2のメカニスティックモデル202などのメカニスティッククロマトグラフィモデルからの予測に関連する不確実性の指標を提供する不確実性出力を生成し得る。
【0056】
ステップ302が、複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることを含む。メカニスティックモデルは、複数のパラメータを含み得る。1つ以上の実施形態において、これらのパラメータの各々は、実際の物理的意味を有し得る。種々の実施形態において、単一のメカニスティックモデルを、多種多様な用途に使用することができる。
【0057】
ステップ304は、複数のパラメータの各々について、複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することを含む。1つ以上の実施形態において、ステップ304は、パラメータについての分布がガウス分布またはほぼガウス分布であると仮定することを含む。例えば、ステップ304は、メカニスティックモデルの各パラメータの分布がガウス分布であるか、あるいはガウス分布に類似していると仮定することを含み得る。したがって、パラメータにわたって、1つ以上の実施形態において、メカニスティックモデルはマルチパラメトリック(多変量)ガウス分布を有し得る。1つ以上の実施形態において、ステップ304は、各パラメータについての分布のピーク、およびピークを中心とし、あるいは他のやり方でピークの周りに位置するそのパラメータについての値の範囲を特定することを含む。
【0058】
パラメータ間の関係に基づいて、対応する値の領域を特定することにより、パラメータに同時に注目して、パラメータのより完全かつ徹底的な全体像、およびパラメータの最大尤度値が予想される場所を得ることができる。さらに、あまり可能性のないパラメータについての値の分析に費やされかねない時間を、回避することができる。特定された対応する値の領域は、新しいサンプリング空間を使用してモデルの不確実性を判定可能にするフレームワークを提供する。
【0059】
ステップ306は、各パラメータについての対応する値の領域内の複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することを含む。ステップ306は、例えば、限定はしないが、N個のシミュレーションセットを生成することを含む。各シミュレーションセットは、メカニスティックモデルの各パラメータについてのサンプル値を含む。各パラメータについての利用可能な空間全体ではなく、対応する値の領域内から各パラメータをサンプリングすることにより、時間、コスト、および処理リソースを節約することができる。
【0060】
ステップ308は、複数のシミュレーションセットを使用してメカニスティックモデルについての不確実性を定量化することを含む。種々の実施形態において、ステップ308は、メカニスティックモデルについての不確実性出力を生成すること、メカニスティックモデルについての信頼区間を特定すること、またはこれらの組み合わせを含む。ステップ306において実行されるサンプリングは、ステップ308において実行される不確実性の定量化がメカニスティックモデルの予測の精度の信頼できる尺度であることを確実にするのに役立つ正確なやり方で行われる。
【0061】
図4が、種々の実施形態によるメカニスティッククロマトグラフィモデルの不確実性を予測するためのプロセス400のフローチャートである。種々の実施形態において、プロセス400は、図2に記載のモデル分析システム200を使用して実装される。とくには、プロセス400を使用して、例えば、これに限定されないが、図2のメカニスティックモデル202などのメカニスティッククロマトグラフィモデルの不確実性を予測し得る。
【0062】
ステップ402が、複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることを含む。1つ以上の実施形態において、メカニスティックモデルは、20回未満の実験から生成されたモデルである。
【0063】
ステップ404は、複数のパラメータについてのマルチパラメトリック確率分布を記述するメカニスティックモデルについて共分散行列を計算することを含む。1つ以上の実施形態において、マルチパラメトリック確率分布は、マルチパラメトリック(多変量)マルチパラメトリックガウス分布の形態を取る。
【0064】
ステップ406は、複数のパラメータの各々について、選択された精度基準に基づいて複数のパラメータのマルチパラメトリック確率分布から対応する値の領域を特定し、複数のシミュレーションセットを形成することを含む。選択された精度基準は、所与のパラメータについてサンプリングされる値の範囲を狭めるためのさまざまな基準を含み得る。1つ以上の実施形態において、選択された精度基準は、複数のパラメータの各パラメータについて、発生のしきい値尤度を満たす値の範囲を含む。
【0065】
ステップ408は、各パラメータについての対応する値の領域内の複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することを含む。
【0066】
ステップ410は、複数のシミュレーションセットを使用してメカニスティックモデルについてのモデル予測分布を生成することを含む。このモデル予測分布は、シミュレーションセットに基づいてメカニスティックモデルによって生成された種々の予測を取り込む。
【0067】
ステップ412は、モデル予測分布を使用してメカニスティックモデルについての不確実性出力を生成することを含む。ステップ410で生成された不確実性出力は、メカニスティックモデルの予測がどの程度正確であるかの表示を提供する。不確実性出力は、例えば、限定するものではないが、メカニスティックモデルについての信頼区間(例えば、95%信頼区間、99.7%信頼区間、など)、メカニスティックモデルにおける不確実性の何らかの他の表現、信頼区間を含むアラート、信頼区間を含む報告、何らかの他の種類の出力、またはこれらの組み合わせを含み得る。
【0068】
図5が、種々の実施形態によるメカニスティックモデルについて共分散行列を計算するためのプロセス500のフローチャートである。図5のプロセス500は、メカニスティックモデルについて共分散行列を計算するために使用されるプロセスの一例であってよく、図4のステップ404を実施するために使用することができる1つ以上のステップを含み得る。
【0069】
ステップ502は、メカニスティックモデルの複数のパラメータをサンプリングして、複数のパラメータセットを形成する。1つ以上の実施形態において、ステップ502は、処理のための初期パラメータセットを見つけるために、ほぼランダムなサンプリングプロセス(または、ランダムパラメータスクリーン)を実行することを含む。1つ以上の実施形態においては、ラテン超立方体サンプリングを使用して、ほぼランダムなサンプリングプロセスを実行し得る。
【0070】
ステップ504は、メカニスティックモデルについての複数のパラメータセットから初期パラメータセットを選択することを含む。例えば、ステップ504において、最良適合パラメータセットを、初期パラメータセットとして使用し得る。1つ以上の実施形態において、ステップ504を、グローバル最適化ステップと呼んでもよく、例えば、いくつかの異なる種類の損失関数のいずれかを使用して実行し得る。使用可能な損失関数の例として、二乗平均平方根誤差(RMSE)アルゴリズム、最大対数尤度(または、対数尤度)アルゴリズム、負対数尤度アルゴリズム、または最大尤度アルゴリズムが挙げられるが、これらに限られるわけではない。ステップ504で形成される初期パラメータセットは、さらなる最適化を実行可能にするパラメータセットである。1つ以上の実施形態において、ステップ504は、極値を特定すべき探索領域を特定することを含む。
【0071】
ステップ506は、初期パラメータセットを使用して、選択された損失関数についての極値を計算することを含む。1つ以上の実施形態において、選択された損失関数は、最大対数尤度(または、対数尤度)、負の対数尤度、または最大尤度アルゴリズムである。したがって、場合によって、ステップ506において使用される選択された損失関数は、ステップ504において使用される損失関数と同じであっても、異なっていてもよい。選択された損失関数が負の対数尤度である場合、計算される極値は、極小値である。選択された損失関数が最大対数尤度(または、対数尤度)である場合、計算される極値は、極大値である。選択された損失関数が最大尤度である場合、計算される極値は、極大値である。1つ以上の実施形態においては、1つ以上の異なる種類の最適化アルゴリズムを使用して、極値を特定し得る。例えば、Levenberg-Marquardt(LM)最小化アルゴリズムなどの最小化アルゴリズムを使用して、選択された損失関数についての所望の極値を特定し得る。
【0072】
ステップ508は、選択された損失関数に基づいてメカニスティックモデルについて共分散行列を計算することを含む。共分散行列は、複数のパラメータの基礎となるマルチパラメトリック(多変量)ガウス分布を記述する。
【0073】
選択された損失関数が負の対数尤度である場合、選択された損失関数のヘッセ行列が極小値において計算され、共分散行列を得るために反転される。選択された損失関数が最大対数尤度(または、対数尤度)である場合、選択された損失関数のヘッセ行列が極大値において計算され、このヘッセ行列の反転ネガが、共分散行列を得るために使用される。選択された損失関数が最大尤度であるとき、ヘッセ行列が、極大値における選択された損失関数の対数について計算され、このヘッセ行列の反転ネガが、共分散行列を得るために使用される。
【0074】
V.実施例/結果
図6が、種々の実施形態によるメカニスティックモデルについて生成された2つの異なる種類のマルチパラメトリックプロットの横並びでの比較である。図6において、第1のマルチパラメトリックプロット602は、ヘッセ法を使用して生成されている。第2のマルチパラメトリックプロット604は、マルコフ連鎖モンテカルロ(MCMC)法を使用して生成されている。第1のマルチパラメトリックプロット602および第2のマルチパラメトリックプロット604は、メカニスティックモデルのパラメータについての分布606および分布608をそれぞれ特定する。さらに、第1のマルチパラメトリックプロット602および第2のマルチパラメトリックプロット604は、メカニスティックモデルのパラメータ間の共分散610および共分散612をそれぞれ特定する。
【0075】
図6に示されるように、両方の手法のプロットは、よく似ているように見受けられる。より具体的には、第1のマルチパラメトリックプロット602の分布606と第2のマルチパラメトリックプロット604の分布608とが、よく似ているように見受けられる。さらに、第1のマルチパラメトリックプロット602の相関610と第2のマルチパラメトリックプロット604の相関612とが、よく似ているように見受けられる。これらの類似性は、メカニスティックモデルを使用して行われた予測の不確実性を推定するためのサンプリングにヘッセ法が使用されてよいという考えを補強する。さらに、ヘッセ法は、時間、コスト、および処理リソースに関する節約を提供し得る。例えば、第2のマルチパラメトリックプロット604は、より多くのサンプルおよびデータ点を必要とするため、第1のマルチパラメトリックプロット602よりも濃く、より多くの時間および処理リソースを必要とすると思われる。
【0076】
図7が、ヘッセ法によって生成された不確実性値とMCMC法を使用して生成された不確実性値とを比較する表700を示している。表700に示される最良値および95%信頼値は、ヘッセ法とMCMC法とが同様のデータを生成することを示している。したがって、ヘッセ法を、メカニスティックモデルの不確実性、とくにはメカニスティッククロマトグラフィモデルの不確実性の判断に関連する時間、コスト、および処理リソースを削減するために、さまざまな用途に使用し得る。
【0077】
VI.コンピュータ実装システム
図8が、種々の実施形態によるコンピュータシステムのブロック図である。コンピュータシステム800は、図2において上述したコンピューティングプラットフォーム204の一実装形態の例であり得る。1つ以上の例において、コンピュータシステム800は、情報を通信するためのバス802または他の通信機構と、情報を処理するためのバス802に結合したプロセッサ804とを含むことができる。さまざまな実施形態において、コンピュータシステム800は、プロセッサ804によって実行される命令を決定するためにバス802に結合したランダムアクセスメモリ(RAM)806または他の動的記憶装置であってよいメモリをさらに含むことができる。メモリを、プロセッサ804によって実行される命令の実行中にテンポラリ変数または他の中間情報を記憶するために使用することもできる。さまざまな実施形態において、コンピュータシステム800は、静的な情報およびプロセッサ804のための命令を記憶するためにバス802に結合した読み出し専用メモリ(ROM)808または他の静的記憶装置をさらに含むことができる。情報および命令を記憶するために、磁気ディスクまたは光ディスクなどの記憶装置810を設け、バス802に結合させることができる。
【0078】
種々の実施形態において、コンピュータシステム800を、情報をコンピュータユーザに表示するために、バス802を介して陰極線管(CRT)または液晶ディスプレイ(LCD)などの表示装置812に結合させることができる。英数字キーおよびその他のキーを含む入力装置814を、情報およびコマンド選択をプロセッサ804へと通信するためにバス802に結合させることができる。別の種類のユーザ入力装置は、方向情報およびコマンド選択をプロセッサ804に通信し、ディスプレイ812上のカーソル移動を制御するためのマウス、ジョイスティック、トラックボール、ジェスチャ入力装置、視線に基づく入力装置、またはカーソル方向キーなどのカーソル制御部816である。この入力装置814は、典型的には、装置によって平面内の位置を指定することを可能にする2つの軸、すなわち第1の軸(例えば、x)および第2の軸(例えば、y)における2つの自由度を有する。しかしながら、3次元(例えば、x、y、およびz)のカーソル移動を可能にする入力装置814も本明細書において考えられることを、理解すべきである。
【0079】
本教示の特定の実装形態によれば、RAM806に含まれる1つ以上の命令の1つ以上のシーケンスのプロセッサ804による実行に応答して、結果をコンピュータシステム800によって提供することが可能である。そのような命令を、記憶装置810などの別のコンピュータ可読媒体またはコンピュータ可読記憶媒体からRAM806に読み込むことが可能である。RAM806に含まれる命令のシーケンスの実行は、本明細書に記載のプロセスをプロセッサ804に実行させることができる。あるいは、本教示を実施するために、ソフトウェア命令に代え、あるいはソフトウェア命令と組み合わせて、ハードワイヤード回路を使用することが可能である。したがって、本教示の実装形態は、ハードウェア回路およびソフトウェアのいかなる特定の組み合わせにも限定されない。
【0080】
本明細書において使用されるとき、「コンピュータ可読媒体」(例えば、データストア、データストレージ、記憶装置、データ記憶装置、など)または「コンピュータ可読記憶媒体」という用語は、実行のためのプロセッサ804への命令の提供に関与する任意の媒体を指す。そのような媒体は、限定はされないが、不揮発性媒体、揮発性媒体、および伝送媒体を含む多数の形態を取り得る。不揮発性媒体の例として、限定はされないが、記憶装置810などの光ディスク、ソリッドステートディスク、磁気ディスクを挙げることができる。揮発性媒体の例として、限定はされないが、RAM806などの動的メモリを挙げることができる。伝送媒体の例として、限定はされないが、バス802を含む配線などの同軸ケーブル、銅線、および光ファイバを挙げることができる。
【0081】
コンピュータ可読媒体の一般的な形態として、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気媒体、CD-ROM、任意の他の光媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的媒体、RAM、PROM、およびEPROM、フラッシュEPROM、任意の他のメモリチップまたはカートリッジ、あるいはコンピュータにとって読み取り可能な任意の他の有形の媒体が挙げられる。
【0082】
コンピュータ可読媒体に加えて、命令またはデータを、1つ以上の命令からなるシーケンスを実行のためにコンピュータシステム800のプロセッサ804に提供するために、通信装置またはシステムに含まれる伝送媒体上の信号として提供することが可能である。例えば、通信装置は、命令およびデータを表す信号を有するトランシーバを含んでよい。命令およびデータは、1つ以上のプロセッサに、本明細書における開示に概説される機能を実施させるように構成される。データ通信伝送接続の代表例として、限定はされないが、電話モデム接続、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続、光通信接続、などを挙げることができる。
【0083】
本明細書、フローチャート、図、および付随の開示に記載の方法を、コンピュータシステム800をスタンドアロンデバイスとして使用し、あるいはクラウドコンピューティングネットワークなどの共有コンピュータ処理リソースの分散ネットワーク上で使用して実装できることを、理解すべきである。
【0084】
本明細書に記載の方法は、用途に応じてさまざまな手段によって実装されてよい。例えば、これらの方法は、ハードウェア、ファームウェア、ソフトウェア、またはこれらの任意の組み合わせにて実装されてよい。ハードウェア実装の場合、処理ユニットは、1つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載の機能を実行するように設計された他の電子ユニット、またはこれらの組み合わせに実装されてよい。
【0085】
種々の実施形態において、本教示の方法は、C、C++、Python、などの従来からのプログラミング言語で記述されたファームウェアならびに/あるいはソフトウェアプログラムおよびアプリケーションとして実装されてよい。ファームウェアおよび/またはソフトウェアとして実装される場合、本明細書に記載の実施形態を、コンピュータに上述の方法を実行させるためのプログラムを格納した非一時的コンピュータ可読媒体上に実装することができる。本明細書に記載の種々のエンジンを、コンピュータシステム800などのコンピュータシステム上に提供することによって、プロセッサ804が、メモリ構成要素のRAM806、ROM808、または記憶装置810のいずれか1つ、またはこれらの組み合わせによって提供される命令、ならびに入力装置814を介して提供されるユーザ入力に従って、これらのエンジンによって提供される分析および判断を実行することになることを、理解すべきである。
【0086】
本教示は、さまざまな実施形態に関連して説明されているが、本教示は、そのようなさまざまな実施形態に限定されない。むしろ、本教示は、当業者によって理解されるような種々の代替物、改変物、および均等物を包含する。
【0087】
種々の実施形態の説明において、本明細書は、方法および/またはプロセスを、ステップの特定の並びとして提示している場合がある。しかしながら、方法またはプロセスが、本明細書に記載されたステップの特定の順序に依存していない限りにおいて、方法またはプロセスは、記載されたステップの特定の並びに限定されるべきではなく、当業者であれば容易に理解できるように、並びは変更してもよく、それでもなお種々の実施形態の趣旨および範囲にとどまり得る。
【0088】
実施形態の列挙
実施形態1.メカニスティッククロマトグラフィモデルの不確実性を推定するための方法であって、複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることと、前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することと、各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することと、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化することと、を含む方法。
【0089】
実施形態2.前記複数のパラメータの各々について前記対応する値の領域を特定することは、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することを含む、実施形態1に記載の方法。
【0090】
実施形態3.前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、実施形態2に記載の方法。
【0091】
実施形態4.前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算することは、前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定することと、前記探索領域に関する前記選択された損失関数についての極値を計算することと、を含む、実施形態2に記載の方法。
【0092】
実施形態5.前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算することは、前記極値について前記共分散行列を計算することをさらに含む、実施形態4に記載の方法。
【0093】
実施形態6.前記複数のパラメータの各々について前記対応する値の領域を特定することは、前記複数のパラメータをサンプリングして複数のパラメータセットを形成することと、前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択することと、前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することと、を含む、実施形態1~5のいずれか1つに記載の方法。
【0094】
実施形態7.前記不確実性を定量化することは、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成することを含む、実施形態1~6のいずれか1つに記載の方法。
【0095】
実施形態8.前記不確実性を定量化することは、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定することをさらに含む、実施形態7に記載の方法。
【0096】
実施形態9.実験データを受け取ることと、前記実験データを使用して前記メカニスティックモデルを生成することと、をさらに含む、実施形態1~8のいずれか1つに記載の方法。
【0097】
実施形態10.メカニスティッククロマトグラフィモデルの不確実性を推定するためのシステムであって、クロマトグラフィのメカニスティックモデルを取得するように構成されたデータソースと、前記データソースから前記クロマトグラフィのメカニスティックモデルを受け取るように構成されたプロセッサと、を備え、前記メカニスティックモデルは、複数のパラメータを含み、前記プロセッサは、前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定し、各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成し、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化するようにさらに構成される、システム。
【0098】
実施形態11.前記プロセッサは、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算するようにさらに構成される、実施形態10に記載のシステム。
【0099】
実施形態12.前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、実施形態11に記載のシステム。
【0100】
実施形態13.前記プロセッサは、前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定し、前記探索領域に関する前記選択された損失関数についての極値を計算するようにさらに構成される、実施形態10~12のいずれか1つに記載のシステム。
【0101】
実施形態14.前記プロセッサは、前記極値について前記共分散行列を計算することによって前記選択された損失関数に基づいて前記メカニスティックモデルについて前記共分散行列を計算するようにさらに構成される、実施形態13に記載のシステム。
【0102】
実施形態15.前記プロセッサは、前記複数のパラメータをサンプリングして複数のパラメータセットを形成し、前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択し、前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算するようにさらに構成される、実施形態10~14のいずれか1つに記載のシステム。
【0103】
実施形態16.前記プロセッサは、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成し、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定するようにさらに構成される、実施形態15に記載のシステム。
【0104】
実施形態17.前記プロセッサは、実験データを受け取り、前記実験データを使用して前記メカニスティックモデルを生成するようにさらに構成される、実施形態10~16のいずれか1つに記載のシステム。
【0105】
実施形態18.プログラムを格納した非一時的コンピュータ可読媒体であって、前記プログラムは、メカニスティッククロマトグラフィモデルの不確実性を推定するための方法をコンピュータに実行させるように構成され、前記方法が、複数のパラメータを含むクロマトグラフィのメカニスティックモデルを受け取ることと、前記複数のパラメータの各々について、前記複数のパラメータについての値の間の関係に基づいて、対応する値の領域を特定することと、各パラメータについての前記対応する値の領域内の前記複数のパラメータの各パラメータをサンプリングして、複数のシミュレーションセットを形成することと、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについての不確実性を定量化することとを含む、非一時的コンピュータ可読媒体。
【0106】
実施形態19.前記方法は、選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することをさらに含む、実施形態18に記載の非一時的コンピュータ可読媒体。
【0107】
実施形態20.前記選択された損失関数は、負対数尤度アルゴリズム、最大対数尤度アルゴリズム、または最大尤度アルゴリズムのうちの少なくとも1つを含む、実施形態19に記載の非一時的コンピュータ可読媒体。
【0108】
実施形態21.前記方法は、前記選択された損失関数または別の損失関数の少なくとも一方を使用して探索領域を特定することと、前記探索領域に関する前記選択された損失関数についての極値を計算することと、をさらに含む、実施形態19に記載の非一時的コンピュータ可読媒体。
【0109】
実施形態22.前記方法は、前記極値について前記共分散行列を計算することをさらに含む、実施形態21に記載の非一時的コンピュータ可読媒体。
【0110】
実施形態23.前記方法は、前記複数のパラメータをサンプリングして複数のパラメータセットを形成することと、前記メカニスティックモデルについて前記複数のパラメータセットから初期パラメータセットを選択することと、前記初期パラメータセットを使用する選択された損失関数に基づいて前記メカニスティックモデルについて共分散行列を計算することと、をさらに含む、実施形態18~22のいずれか1つに記載の非一時的コンピュータ可読媒体。
【0111】
実施形態24.前記方法は、前記複数のシミュレーションセットを使用して前記メカニスティックモデルについてモデル予測分布を生成することをさらに含む、実施形態18~23のいずれか1つに記載の非一時的コンピュータ可読媒体。
【0112】
実施形態25.前記方法は、前記モデル予測分布を使用して前記メカニスティックモデルについて信頼区間を特定することをさらに含む、実施形態24に記載の非一時的コンピュータ可読媒体。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】