IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アムジエン・インコーポレーテツドの特許一覧

特表2023-522695治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択
<>
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図1
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図2
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図3
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図4A
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図4B
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図5A
  • 特表-治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択 図5B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-31
(54)【発明の名称】治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択
(51)【国際特許分類】
   C07K 1/16 20060101AFI20230524BHJP
   G01N 30/88 20060101ALI20230524BHJP
【FI】
C07K1/16
G01N30/88 J
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022563389
(86)(22)【出願日】2021-04-21
(85)【翻訳文提出日】2022-12-16
(86)【国際出願番号】 US2021028291
(87)【国際公開番号】W WO2021216635
(87)【国際公開日】2021-10-28
(31)【優先権主張番号】63/014,273
(32)【優先日】2020-04-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500049716
【氏名又は名称】アムジエン・インコーポレーテツド
(74)【代理人】
【識別番号】110001173
【氏名又は名称】弁理士法人川口國際特許事務所
(72)【発明者】
【氏名】ダン,オー
(72)【発明者】
【氏名】ハート,ロジャー
(72)【発明者】
【氏名】ウォン,ハン-チュン
【テーマコード(参考)】
4H045
【Fターム(参考)】
4H045AA10
4H045AA30
4H045AA50
4H045EA20
4H045GA22
4H045GA23
4H045GA26
(57)【要約】
治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択を促進する方法において、仮説的クロマトグラフィープロセスと関連する1つ以上のプロセスパラメータ値及び治療用タンパク質を記述する1つ以上の分子記述子が受け取られる。本方法は、機械学習モデルを使用して、少なくとも1つ以上のプロセスパラメータ及び1つ以上の分子記述子を分析することにより、仮説的クロマトグラフィープロセスの性能指標値を予測する工程も含む。機械学習モデルは、回帰木モデル、eXtreme勾配ブーストモデル又はエラスティックネットモデルである。本方法は、予測された性能指標値及び/又は予測された性能指標値が1つ以上の合格判定基準を満たすかどうかの指標を、ユーザインターフェースを介してユーザに提示させる工程も含む。
【特許請求の範囲】
【請求項1】
治療用タンパク質の製造中の精製プロセスのためのクロマトグラフィーパラメータの選択を促進する方法であって、
コンピューティングシステムの1つ以上のプロセッサにより、仮説的クロマトグラフィープロセスと関連する1つ以上のプロセスパラメータ値を受け取る工程;
前記1つ以上のプロセッサにより、前記治療用タンパク質を記述する1つ以上の分子記述子を受け取る工程;
前記1つ以上のプロセッサにより、機械学習モデルを使用して、少なくとも前記1つ以上のプロセスパラメータ及び前記1つ以上の分子記述子を分析することにより、前記仮説的クロマトグラフィープロセスの性能指標値を予測する工程であって、前記機械学習モデルは、(i)回帰木モデル、(ii)eXtreme勾配ブーストモデル、及び(iii)エラスティックネットモデルからなる群から選択されるモデルである、工程;及び
前記1つ以上のプロセッサにより、(i)前記予測された性能指標値、及び(ii)前記予測された性能指標値が1つ以上の合格判定基準を満たすかどうかの指標を、ユーザインターフェースを介してユーザに提示させる工程
を含む方法。
【請求項2】
治療用タンパク質の製造中の精製プロセスのためのクロマトグラフィーパラメータの選択を促進する方法であって、
コンピューティングシステムの1つ以上のプロセッサにより、仮説的クロマトグラフィープロセスと関連する1つ以上の性能指標値を受け取る工程;
前記1つ以上のプロセッサにより、前記治療用タンパク質を記述する1つ以上の分子記述子を受け取る工程;
前記1つ以上のプロセッサにより、機械学習モデルを使用して、少なくとも前記1つ以上の性能指標値及び前記1つ以上の分子記述子を分析することにより、前記仮説的クロマトグラフィープロセスのプロセスパラメータ値を予測する工程であって、前記機械学習モデルは、(i)回帰木モデル、(ii)eXtreme勾配ブーストモデル、及び(iii)エラスティックネットモデルからなる群から選択されるモデルである、工程;及び
前記1つ以上のプロセッサにより、(i)前記予測されたプロセスパラメータ値、及び(ii)前記予測されたプロセスパラメータ値の予測された精度範囲の一方又は両方を、ユーザインターフェースを介してユーザに提示させる工程
を含む方法。
【請求項3】
前記仮説的クロマトグラフィープロセスは、
仮説的カチオン交換クロマトグラフィー(CEX)プロセス;
仮説的サイズ排除クロマトグラフィー(SEC)プロセス;及び
プロテインAクロマトグラフィープロセス
からなる群から選択されるプロセスである、請求項1又は2に記載の方法。
【請求項4】
前記1つ以上のプロセッサにより、前記治療用タンパク質と関連する配列情報に基づいて、前記1つ以上の分子記述子の少なくとも1つを決定する工程を更に含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記1つ以上のプロセッサにより、前記治療用タンパク質の物理的特性の実験的測定に基づいて、前記1つ以上の分子記述子の少なくとも1つを決定する工程を更に含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記1つ以上の分子記述子の少なくとも1つは、pHレベルの関数である、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記1つ以上のプロセスパラメータ値は、
緩衝液のpH;
溶出緩衝液のpH;
溶出緩衝液の伝導度;
溶出緩衝液のモル濃度;
勾配の傾斜;
線速度;
負荷伝導度;
負荷因子;
負荷pH;又は
収集停止
の1つ以上を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記機械学習モデルは、前記回帰木モデルである、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記性能指標値は、
nrCE-SDS LC+HC(%);
rCE-SDS プレ-LC(%);
CEX 塩基性(%);
SEC HMW(%);
SEC メイン(%);
SEC LMW(%);
rCE-SDS HC(%);
rCE-SDS HMW(%);
rCE-SDS プレ-LC+LC_HC(%);
プール伝導度;又は
nrCE-SDS プレピーク(%)
を含む、請求項8に記載の方法。
【請求項10】
前記機械学習モデルは、前記eXtreme勾配ブーストモデルである、請求項1~7のいずれか一項に記載の方法。
【請求項11】
前記性能指標値は、
CEX 酸性(%);
CEX メイン(%);
工程収率;
rCE-SDS メイン(%);
rCE-SDS LMW(%);
cIEF 酸性(%);
cIEF 塩基性(%);又は
cIEF メイン(%)
を含む、請求項10に記載の方法。
【請求項12】
前記性能指標値は、SEC HMW(%)を含む、請求項9に記載の方法。
【請求項13】
前記1つ以上のプロセッサにより、追加の機械学習モデルを使用して、少なくともプロセスパラメータ及び分子記述子を分析することにより、前記仮説的クロマトグラフィープロセスの収率を予測する工程であって、前記追加の機械学習モデルは、別のeXtreme勾配ブーストモデルである、工程;及び
前記1つ以上のプロセッサにより、(i)前記予測された収率、及び(ii)前記予測された収率が1つ以上の追加の合格判定基準を満たすかどうかの指標を、前記ユーザインターフェースを介して前記ユーザに提示させる工程
を更に含む、請求項12に記載の方法。
【請求項14】
前記機械学習モデルは、前記エラスティックネットモデルである、請求項1~7のいずれか一項に記載の方法。
【請求項15】
前記性能指標値は、
rCE-SDS LC+HC(%);又は
rCE-SDS LC(%)
を含む、請求項14に記載の方法。
【請求項16】
前記提示された性能指標値及び/又は前記提示された指標に基づいて、前記治療用タンパク質のためのクロマトグラフィープロセスの1つ以上のプロセスパラメータ値を選択する工程;及び
前記選択されたプロセスパラメータ値に従って前記治療用タンパク質のための前記クロマトグラフィープロセスを実施する工程
を更に含む、請求項1又は3~15のいずれか一項に記載の方法。
【請求項17】
前記提示された予測されたプロセスパラメータ値及び/又は前記予測された精度範囲に基づいて、前記治療用タンパク質のためのクロマトグラフィープロセスの1つ以上のプロセスパラメータ値を選択する工程;及び
前記選択されたプロセスパラメータ値に従って前記治療用タンパク質のための前記クロマトグラフィープロセスを実施する工程
を更に含む、請求項2~15のいずれか一項に記載の方法。
【請求項18】
コンピューティングシステムの1つ以上のプロセッサによって実行されると、前記コンピューティングシステムに、請求項1~17のいずれか一項に記載の方法を実施させる命令を保存する1つ以上の非一時的コンピュータ可読媒体。
【請求項19】
コンピューティングシステムであって、
1つ以上のプロセッサ;及び
前記1つ以上のプロセッサによって実行されると、前記コンピューティングシステムに、請求項1~15のいずれか一項に記載の方法を実施させる命令を保存する1つ以上の非一時的コンピュータ可読媒体
を含むコンピューティングシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、概して、バイオ医薬製品の製造に関し、より詳細には、治療用タンパク質を製造する場合のクロマトグラフィーパラメータの選択を促進するための、クロマトグラフィープロセス(クロマトグラフィー精製プロセスなど)をモデリングするための技術に関する。
【背景技術】
【0002】
バイオ医薬産業では、バイオ医薬品又は治療用タンパク質として公知の大きく複雑なタンパク質分子は、生物系に由来する。高レベルにおいて、治療用タンパク質を製造するプロセスは、以下の工程:(1)選択ステージにある宿主細胞、所望のタンパク質が生成される遺伝子を含有する万能細胞株が(例えば、チャイニーズハムスター卵巣(CHO)細胞を使用して)生成される、宿主細胞の選択ステージ;(2)バイオリアクター内でタンパク質を生成する極めて多くの細胞を増殖させるために規定の培養培地が使用される、細胞培養ステージ;(3)タンパク質を単離させるために以前のステージからの生成物の回収及び精製が実施される、精製ステージ;及び(4)タンパク質が医師又は患者による使用のために調製される、製剤化及び充填-仕上げ-パッケージステージ程を含む。
【0003】
図2は、典型的な治療用タンパク質の製造プロセス10を示す。第1のステージ12では、高濃度の所望のタンパク質を産生する最適な細胞がバイアル又は細胞バッグ内で工学的に作製されて凍結保存された後、凍結保存細胞を受領することによって「上流」製造プロセスが開始される。細胞は、典型的には、小型のT型フラスコ、振とうフラスコ又はスピナーフラスコ内に解凍され、且つステージ14でシードバイオリアクターの接種を達成するために、増加した数及び増大させたフラスコサイズで増殖される。増殖プロセスを通して、細胞は、持続的増殖のために制御された条件(温度、pH及び/又は栄養分)で維持される。培養液量拡大の1つ以上のステージ(図2においてステージ16と表示した)後、細胞は、ステージ18で製造バイオリアクターに接種される。ステージ18中、治療用タンパク質は、細胞によって発現される。この工程後、「下流」プロセスが始まる。下流プロセスでは、ステージ20において、細胞から培養培地を分離し、且つ/又はバイオリアクター内の他の分子から所望のタンパク質を分離するために、遠心分離濾過又は深層濾過が実施される。ステージ22では、クロマトグラフィー精製プロセスは、所望のタンパク質を宿主細胞及び不純物又は他の所望ではない物質(例えば、劣化若しくは凝集したタンパク質など)から更に単離する。様々な濾過テクノロジーは、ステージ22でそのサイズ、分子量及び電荷に基づいてタンパク質を単離及び精製するために使用され得る。結果として生じた物質は、ステージ24でウイルス濾過を受ける。精製されたタンパク質は、典型的には、注射又は注入され得る無菌溶液を生成するために、賦形剤を用いて調製される。ステージ26では、物質は、濃縮されて標的緩衝液中に配置され、ラベリング、長期保存及び輸送のために容器(例えば、バイアル又はシリンジ)内に配置される製剤が生成される。この例示的治療薬製造プロセス10は、例示的目的のために提供されるが、本明細書に記載するクロマトグラフィーパラメータの選択は、クロマトグラフィーを含む、他の治療用タンパク質製造プロセスに容易に適用できることが理解されるであろう。
【0004】
一般に、(例えば、ステージ22で実施されているような)「クロマトグラフィー」は、分子が2つの相:(1)多くの場合にクロマトグラフィー樹脂である固定相;及び(2)タンパク質分離の場合に水又はクロロホルムなどの溶媒である移動相間に分布する分離プロセスを指す。より強力に固定相に引き付けられる分子は、移動相により強力に引き付けられる分子と比較して、系を通してより緩徐に引き付けられる。商業的製造精製のために、クロマトグラフィーは、典型的には、スケールの考察に起因して、カラムクロマトグラフィーとして実施される。一般的なクロマトグラフィー操作では、ある量のサンプルがカラム内に注入される。溶出液は、次に、カラムを通してポンプ送出され、分子が、固定相の樹脂及び溶出液に対するその相対的な親和性に基づいて分離される。様々な分子は、カラムから様々な時点及び異なる量の溶出液がカラムを通過した後に溶出するであろう。したがって、治療用タンパク質は、様々な時点において、カラムから溶出する他の物質から分離することができる。この情報は、カラムから出る濃度対時間のプロットであるクロマトグラムで捕捉される。
【0005】
疎水性相互作用クロマトグラフィーは、その疎水性の差に基づいてタンパク質を分離するために使用することができ、親和性クロマトグラフィーは、クロマトグラフィー樹脂に付着した標的リガンドに対するその親和性の差に基づいて分子を分離するために使用することができ、及びイオン交換クロマトグラフィーは、分子電荷の差に基づいて分子を分離するために使用することができる。より特定の例として、カチオン交換クロマトグラフィー(CEX)は、関心対象の分子が正荷電した場合に使用されるイオン交換クロマトグラフィーである。タンパク質は、酸性及び塩基性側鎖を備えるアミノ酸を有する。バイオ医薬品を取り囲んでいる溶液の酸性レベル(pH)に依存して、分子は、正電荷、負電荷又は中性であり得る。等電点(pI)は、プロトン化基及び脱プロトン化基の数が等しいpHであり、タンパク質は、正味電荷を有しない。pHがpIより高い場合、タンパク質は、正味負電荷を有し、及びpHがpI未満である場合、タンパク質は、正味正電荷を有することになる。タンパク質のpIは、タンパク質の一次アミノ酸配列によって決定され、したがって計算され得、関心対象のタンパク質の公知の正味電荷を保証する緩衝液を選択することができる。異なるpI値を備えるタンパク質は、所与のpHで様々な電荷度を有するため、様々なタンパク質は、異なる強度を備える樹脂に結合し、カラムを通したその分離を促進するであろう。他の一般的なタイプのクロマトグラフィーは、溶液中の分子がサイズ及び/又は分子量によって分離されるサイズ排除クロマトグラフィー(SEC)及びプロテインAクロマトグラフィーである。
【発明の概要】
【発明が解決しようとする課題】
【0006】
慣例的に、クロマトグラフィーパラメータ(例えば、溶出緩衝液のpH、溶出緩衝液の導電性、溶出緩衝液のモル濃度、勾配の傾斜、線速度、負荷及び収集時間)を選択すること及び精製ステージが特定の生成物/分子に対して(例えば、特定の溶液、特定のpHなどを用いて)どのように実施されるかを決定することは、時間、費用、労働力及び装置の使用に関して高度に資源集約的であり得、且つ経験的測定値を得るために、多くの実験をセットアップして実行することにより、極めて多くの試行錯誤を必要とする可能性がある。しかしながら、バイオテクノロジーのペースが進むにつれて、且つパイプライン内の追加の分子をプロセッシングすることが一層大きく強調されるにつれて、クロマトグラフィー精製プロセスを含む製造プロセスをより迅速に設計及び実行する必要性が一層増加している。
【課題を解決するための手段】
【0007】
本明細書に記載する実施形態は、治療用タンパク質の製造における精製プロセスの性能を予測する1つ以上のモデルを作成及び適用するシステム及び方法に関する。治療用タンパク質は、例えば、モノクローナル抗体(「mAb」)又は二重特異性若しくは他の多重特異性抗体などの任意の好適なタイプのタンパク質であり得る。より詳細には、これらの実施形態では、例えば、CEX、SEC、プロテインA若しくは任意の他の好適なクロマトグラフィープロセスなどのクロマトグラフィー精製プロセスの性能指標値(例えば、製品収率及び/又は品質尺度)を、様々なプロセスパラメータ(例えば、緩衝液及び/又は溶出緩衝液及び/又は負荷pH、溶出緩衝液のモル濃度、溶出緩衝液の伝導度、勾配の傾斜、線速度、負荷伝導度、負荷因子、収集停止、カラム体積、実質的CEX負荷(CEXが使用される場合)、負荷流量、溶出流量、緩衝液濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了)並びに分子記述子(例えば、分子の物理的特性の数学的表現)に基づいて予測するために機械学習モデルが使用される。このプロセスは、従来型プロセスと比較して、クロマトグラフィープロセスパラメータのより良好な選択を生じさせることができ、(例えば、実験を実施する必要性を除去又は低減することによって)下流製造プロセスを設計/開発/実行するために必要とされる時間量の実質的減少及び/又は他の(例えば、労働力、装置、費用などの)資源の使用の実質的低減を生じさせることができる。更に、このプロセスは、異なる分子の(様々な分子記述子に関連する)物理的特徴量がクロマトグラフィーの性能にどのような影響を及ぼすかを解明することができ、それにより分子設計に関する洞察を提供する。
【0008】
性能指標値は、典型的には、プロセスパラメータに依存することが企図される。本明細書に記載するように、ヌルでないプロセスパラメータは、1つ以上の性能指標値に基づいて予測することができ、これは、1つ以上の所望のプロセスパラメータに基づくプロセスパラメータ(又はその精度範囲)の効率的な予測を許容する。本明細書の幾つかの実施形態は、1つ以上の所望の性能指標値に基づいて、精製プロセスのためのクロマトグラフィーパラメータの選択を促進する1つ以上のモデルを作製及び適用するシステム及び方法に関する。これらの方法は、治療用タンパク質の製造中の精製プロセスのためのクロマトグラフィーパラメータの選択を促進するために使用することができる。これらの実施形態では、様々なプロセスパラメータ及び分子記述子(例えば、分子の物理的特性の数学的表現)に基づいて、例えばCEX、SEC、プロテインA又は任意の他の好適なクロマトグラフィープロセスの1つ以上の性能指標値(例えば、製品収率及び/又は品質尺度)に基づいて、プロセスパラメータ(例えば、緩衝液及び/又は溶出緩衝液及び/又は負荷pH、溶出緩衝液のモル濃度、溶出緩衝液の伝導度、勾配の傾斜、線速度、負荷伝導度、負荷因子、収集停止、カラム体積、実質的CEX負荷(CEXが使用される場合)、負荷流量、溶出流量、緩衝液濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了)を予測するために機械学習モデルが使用される。
【0009】
更に、解釈可能な機械学習アルゴリズムを使用して、正確な予測を行うために最も重要である入力特徴量(例えば、分子記述子及びプロセスパラメータ又は性能指標)を同定することができる。これは、特に、プロセスパラメータ、性能指標の数及び特に潜在的な分子記述子の数が膨大である(例えば、数百又は更に数千の潜在的分子記述子)ことを前提にすると、特に有益であり得る。したがって、例えば、比較的少数の入力特徴量を使用する精製プロセスのために十分に正確な記述子を作成することと、多くの他のパラメータ及び/又は記述子を測定又は計算する必要性を排除することとが可能になり得る。入力パラメータ/記述子と予測標的との間の相関の知識は、科学的洞察を提供し得、且つ将来的なバイオプロセスの改善を導き得る更なる研究のための仮説も生じ得る。
【0010】
当業者は、本明細書で説明する図が説明のために含まれ、本開示を限定しないことを理解するであろう。図面は、必ずしも縮尺通りではなく、代わりに本開示の原理を示すことに重点が置かれている。幾つかの場合、記載される実施形態の種々の態様は、記載される実施形態の理解を促進するために誇張又は拡大して示される場合があることを理解されたい。図面では、種々の図面を通して同様の参照符号は、全般的に、機能的に類似する及び/又は構造的に類似する構成要素を指す。
【図面の簡単な説明】
【0011】
図1】本明細書に記載される技術が実装され得る例示的なシステムの簡略化したブロック図である。
図2】原薬を製造するための先行技術のプロセスを示す。
図3図1のシステムで使用するための機械学習モデルを生成するための例示的プロセスのフロー図である。
図4A】eXtreme勾配ブーストモデルを使用して実験的収率又はSE-HPLC HMWを予測するための例示的な特徴量の重要度尺度を示す。
図4B】eXtreme勾配ブーストモデルを使用して実験的収率又はSE-HPLC HMWを予測するための例示的な特徴量の重要度尺度を示す。
図5A】治療用タンパク質の製造中の生成プロセスのためのクロマトグラフィーパラメータの選択を促進するための例示的方法のフロー図である。
図5B】治療用タンパク質の製造中の生成プロセスのためのクロマトグラフィーパラメータの選択を促進するための例示的方法のフロー図である。
【発明を実施するための形態】
【0012】
上記で導入として説明され、以下でより詳細に論じられる種々の概念は、多くの方法のいずれかで実施することができ、説明される概念は、いかなる特定の実施形態の様式にも限定されない。実施形態の例は、説明を目的として提供される。
【0013】
図1は、本明細書で記載される技術が実装され得る例示的なシステム100の簡略化されたブロック図である。システム100は、ネットワーク106を介してトレーニングサーバ104に通信可能に接続されたコンピューティングシステム102を含む。概して、コンピューティングシステム102及び/又はトレーニングサーバ104は、1つ以上の機械学習(ML)モデル108をトレーニングするように構成され、トレーニングされたモデルを使用して、治療用タンパク質の製造において使用できる仮説的クロマトグラフィープロセスの性能(例えば、収率及び/又は製品品質尺度)を予測する。本明細書で使用する用語「仮説的」は、対応する現実世界のプロセスが存在しないことを必ずしも意味しないことを理解されたい。例えば、予測された性能は、対応する現実世界のクロマトグラフィー精製プロセスと同時に又は更にその後にMLモデル108の1つを実行することにより、測定された性能と比較することができる。クロマトグラフィー精製プロセスは、CEXプロセス、SECプロセス、プロテインAクロマトグラフィープロセス又は任意の他の好適なクロマトグラフィープロセスの少なくとも1つを含み得る。
【0014】
MLモデル108は、プロセスパラメータ(例えば、溶出緩衝液のpH、塩濃度、カラム体積など)、分子記述子(例えば、分子電荷を含むか又は分子電荷に関するパラメータ、疎水性、等電点、双極子モーメントなど)及び/又は他の数的及び/又はカテゴリーパラメータ(例えば、モノクローナル抗体(mAb)などの様式)又は二重特異性抗体など)に基づいて性能を予測することができる。コンピューティングシステム102は、概して、ローカル又は遠隔に配置され得る1人以上の使用者がコンピューティングシステム102の予測能力を利用し、且つ本明細書の他の箇所で考察するように使用者に様々なインタラクティブ能力を提供することを可能にするようにも構成される。
【0015】
ネットワーク106は、単一の通信ネットワークであり得るか、或いは1つ以上の種類の複数の通信ネットワーク(例えば、1つ以上の有線及び/若しくは無線ローカルエリアネットワーク(LAN)並びに/又はインターネットなどの1つ以上の有線及び/若しくは無線広域ネットワーク(WAN))を含み得る。様々な実施形態では、トレーニングサーバ104は、「クラウド」サービス(例えば、Amazon Web Services)としてMLモデル108をトレーニング及び/若しくは使用するか、又はトレーニングサーバ104は、ローカルサーバであり得る。しかしながら、図示した実施形態では、MLモデル108は、サーバ104によってトレーニングされ、必要に応じてネットワーク106を介してコンピューティングシステム102に転送される。他の実施形態では、MLモデル108の1つ、幾つか又は全ては、コンピューティングシステム102上でトレーニングされ、次いでサーバ104にアップロードされ得る。更に他の実施形態では、コンピューティングシステム102は、その場合にシステム100がネットワーク106及びトレーニングサーバ104の両方を排除し得るモデル108をトレーニングし、且つ維持/保存するか、又はサーバ104は、コンピューティングシステム102の一部であり得る。
【0016】
コンピューティングシステム102は、本明細書で考察した操作を実施するために特別にプログラミングされた1つ以上の汎用コンピュータを含み得、且つ/又は1つ以上の特殊用途のコンピューティングデバイスを含み得る。図1から明らかなように、コンピューティングシステム102は、プロセッシングユニット120、ネットワークインターフェース122、ディスプレイ124、ユーザ入力装置126及びメモリユニット128を含む。コンピューティングシステム102が2つ以上のコンピュータ(相互に同じ場所又は離れた場所に所在するのいずれか)を含む実施形態では、少なくともプロセッシングユニット120、ネットワークインターフェース122及び/又はメモリユニット128に関連する本明細書に記載した操作は、複数のプロセッシングユニット、複数のネットワークインターフェース及び/又は複数のメモリユニットの各々の間で分割することができる。更に、ディスプレイ124及びユーザ入力装置126は、本明細書では単数形で言及されるが、複数のディスプレイ及び複数のユーザ入力装置各々を含むことができる。例えば、ディスプレイ124は、多くの遠隔のユーザ特異的クライアント装置のそれぞれで少なくとも1つのディスプレイを含み得、及びユーザ入力装置126は、そのクライアント装置のそれぞれについて少なくとも1つのユーザ入力装置を含み得る。
【0017】
プロセッシングユニット120は、1つ以上のプロセッサを含み、それらのそれぞれは、本明細書に記載したコンピューティングシステム102の機能の幾つか又は全てを実行するためにメモリユニット128に保存されたソフトウェア命令を実行する、プログラム可能なマイクロプロセッサであり得る。プロセッシングユニット120は、例えば、1つ以上の中央プロセッシングユニット(CPU)及び/又は1つ以上のグラフィックスプロセッシングユニット(GPU)を含み得る。代わりに又は加えて、プロセッシングユニット120内のプロセッサの幾つかは、他のタイプのプロセッサ(例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など)であり得、本明細書に記載したコンピューティングシステム102の機能の幾つかは、代わりに、ハードウェアに実装され得る。
【0018】
ネットワークインターフェース122は、1つ以上の通信プロトコルを使用して、ネットワーク106を介してトレーニングサーバ104と通信するように構成された任意の適切なハードウェア(例えば、フロントエンド送信機及び受信機ハードウェア)、ファームウェア及び/又はソフトウェアを含み得る。例えば、ネットワークインターフェース122は、コンピューティングシステム102がインターネット又はイントラネットなどの上でトレーニングサーバ104と通信することを可能にするイーサネットインターフェースであり得るか又はそれを含み得る。
【0019】
ディスプレイ124は、ユーザに情報を提示するために任意の適切なディスプレイ技術(例えば、LED、OLED、LCDなど)を使用し得、ユーザ入力装置126は、キーボード又は他の適切な入力装置であり得る。幾つかの実施形態では、ディスプレイ124及びユーザ入力装置126は、単一装置(例えば、タッチスクリーンディスプレイ)内に一体化される。概して、ディスプレイ124及びユーザ入力装置126は、ユーザが、コンピューティングシステム102によって提供されたグラフィカルユーザインターフェース(GUI)と相互作用することを可能にするために結び付けることができる。しかしながら、コンピューティングシステム102は、その装置又はシステムのユーザによる相互作用を可能にするために、コンピューティングシステム102が他のコンピューティング装置又はシステム(例えば、サードパーティーのクライアント装置)と相互作用する所定の実施形態では、ディスプレイ124及び/又はユーザ入力装置126を排除することができる。
【0020】
メモリユニット128は、1つ以上の揮発性及び/又は不揮発性メモリを含み得る。読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリ、ソリッドステートドライブ(SSD)、ハードディスクドライブ(HDD)など、1つ以上の任意の適切なメモリタイプを含めることができる。メモリユニット128は、まとめて、1つ以上のソフトウェアアプリケーション、そのアプリケーションによって受け取られる/使用されるデータ及びそのアプリケーションによって出力/生成されるデータを保存し得る。これらのアプリケーションは、プロセッシングユニット120によって実行された場合、治療用タンパク質の製造中の精製のための仮説的クロマトグラフィープロセスの性能(例えば、収率及び/又は品質尺度)を予測するクロマトグラフィーモデリングアプリケーション130を含む。幾つかの実施形態では、本明細書で考察したアプリケーション130の様々な「ユニット」は、様々なソフトウェアアプリケーション間に分配され得、及び/又は任意の1つのそのような装置の機能性は、2つ以上のソフトウェアアプリケーション間で分割され得る。
【0021】
例示的システム100では、アプリケーション130は、データ収集ユニット132、予測ユニット134及び可視化ユニット136を含む。一般に、データ収集ユニット132は、予測ユニット134が、性能指標値(例えば、収率若しくは製品品質尺度)又はプロセスパラメータ(又はその精度範囲)を予測するために、ローカル機械学習(ML)モデル138への入力として適用されるパラメータを受信する(例えば、読み出す)。図示した実施形態では、MLモデル138は、トレーニングサーバ104によってトレーニングされたモデル108の1つのローカルコピーであり、例えばメモリユニット128のRAMに保存することができる。上述したように、しかしながら、サーバ104は、幾つかの実施形態では、全モデル108を利用/実行することができ、いずれの場合にもメモリユニット128内に存在する必要のあるローカルコピーがないか、又はモデル108の全ては、必要に応じてトレーニングサーバ104から読み出されるのではなく、むしろメモリユニット128の継続的なメモリ中に存在し得る。データ収集ユニット132は、可視化ユニット136により生成又は追加されるGUI(例えば、ディスプレイ124上で)ユーザ入力パラメータ/値からの値を受信することができ、且つ/又は例えば1つ以上のファイル若しくは他のデータ転送として(例えば、そのようなGUIを介してユーザによって指定されたファイルパスを用いて)値を受信することができる。
【0022】
可視化ユニット136は、例えば、モデル化プロセスの予測された結果(例えば、性能指標値出力又はモデル138を使用した予測ユニット134によるプロセスパラメータ出力の値)を見て、且つ/又は相互作用するためにGUIを生成及び/若しくは追加することもできる。実施形態に依存して、可視化ユニット136は、ユーザが有用なモデルを開発する(例えば、所与性能指標値又はプロセスパラメータについての最も予測的な特徴量を同定する、モデルについてのハイパーパラメータを最適化するなど)のためのツール、及び/又はユーザが(例えば、高度に一貫性/再現性などである高収率及び優れた品質属性を備えるプロセスを達成するための)クロマトグラフィー精製プロセスを設計する(例えば、最適化する)ときにそのようなモデルを利用するツールも提供することができる。
【0023】
例示的システム100では、メモリユニット128は、関心対象の治療用タンパク質のためのホモロジーモデリングを提供する分子操作環境(MOE)アプリケーション139のソフトウェア命令も保存する。概して、MOEアプリケーション139は、分子についての入力情報に基づいて、分子についての記述子(例えば電荷、疎水性、双極子モーメント、等電点などの分子の物理的特徴量の数学的表現)を生成するように構成される。例えば、ユーザは、MOEアプリケーション139を使用して、(例えば、ユーザ入力装置126を介して)分子のアミノ酸配列を入力し、且つ適切な分子鋳型を選択することができる。MOEアプリケーション139は、次に、アミノ酸配列を、選択された鋳型に「適合させる」ことを試みることができる。代わりに又は加えて、MOEアプリケーション139は、分子についての実験的/測定結果に基づいて記述子を生成することができる。代替実施形態では、MOEアプリケーション139は、コンピューティングシステム102以外の(例えば、サードパーティコンピューティング装置又はシステムによって)コンピューティング装置又はシステムによって保存及び実行される。
【0024】
ここで、一実施形態によるシステム100の作動を更に詳細に記載する。最初に、トレーニングサーバ104は、トレーニングデータベース140に保存された歴史的データを使用してMLモデル108をトレーニングする。トレーニングデータベース140は、単一のメモリ(例えば、HDD、SSDなど)に保存された単一のデータベース又は1つ以上のメモリに保存された複数のデータベースを含み得る。MLモデル108は、例えば、eXtreme勾配ブースト(又は「xgboost」)モデル、回帰(又は「決定」若しくは「ID」)木モデル、エラスティックネット(elastic net)モデル、投げ縄モデル、リッジモデル、確率的勾配降下法(SGD)正規化損失線形モデル、線形サポートベクターマシン(SVM)モデル、部分最小二乗法(PLS)回帰モデル及び/又は1つ以上の他の好適なモデルタイプなどの多くの様々なタイプの機械学習モデルを含み得る。更に、MLモデル108の様々なモデルは、異なる性能指標値(例えば、収率、特定のCEX読み出し、特定のSEC読み出しなど)又は異なるプロセスパラメータ(例えば、緩衝液及び/又は溶出緩衝液及び/又は負荷pH、溶出緩衝液モル濃度、溶出緩衝液の伝導度、勾配の傾斜、線速度、負荷伝導度、負荷因子、収集停止、カラム体積、実際のCEX負荷(CEXが使用される場合)、負荷流量、溶出流量、緩衝液濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了)を予測するためにトレーニングすることができる。幾つかの実施形態では、例えば、MLモデル108は、詳細には、第1のセットの1つ以上の性能指標値を予測するための回帰木モデル、異なる第2のセットの1つ以上の性能指標値を予測するためのxgboostモデル及び異なる第3のセットの1つ以上の性能指標値を予測するためのエラスティックネットモデルを含む。幾つかの実施形態では、例えば、MLモデル108は、詳細には、第1のセットの1つ以上のプロセスパラメータを予測するための回帰木モデル、異なる第2のセットの1つ以上のプロセスパラメータを予測するためのxgboostモデル及び異なる第3のセットの1つ以上のプロセスパラメータを予測するためのエラスティックネットモデルを含む。更に、幾つかの実施形態では、MLモデル108は、任意の所与のタイプの2つ以上のモデル(例えば、異なる特徴量セットを使用し、且つ/又は異なるハイパーパラメータを有する異なる歴史的データセット上でトレーニングされた同一タイプの2つ以上のモデル)を含むことができる。幾つかの実施形態において且つ図4A及び4Bと結び付けて更に詳細に考察したように、MLモデル108のそれぞれは、いずれの特徴量(例えば、プロセスパラメータ、分子記述子など)が特定の性能指標値の最高の予測因子であるか(適用可能な場合)を識別するために使用され得、且つ/又は特定の性能指標値若しくはプロセスパラメータの最高の予測因子である特徴量のみを含む特徴量セットを用いてトレーニング若しくは再トレーニングされ得る。
【0025】
MLモデル108内のそれぞれの異なるモデルに対して、トレーニングデータベース140は、トレーニングデータの対応するセット(例えば、入力/特徴量データ及び対応するラベル)を保存し得、場合によりトレーニングデータセット間で重複することもある。収率パーセンテージを予測するモデルをトレーニングするために、例えば、トレーニングデータベース140は、それぞれが歴史的プロセスパラメータ(例えば、pHレベル、負荷流量、塩濃度など)を含む、分析機器によって作製されている可能性がある多くのセットの入力/特徴量並びに製造されているタンパク質のためのソフトウェア(例えば、MOEアプリケーション139又は類似のソフトウェア)によって計算された分子記述子(例えば、電荷、疎水性、等電点などに関する記述子)及び場合により他の情報(例えば、製造中のタンパク質の様式)を、それぞれの特徴量セットのためのラベルと一緒に含むことができる。この実施例では、それぞれの特徴量セットについてのラベルは、特定のタンパク質がクロマトグラフィープロセスにおいて測定された場合の収率パーセンテージを示す。幾つかの実施形態では、全ての特徴量及びラベルは、数値であり、数値でない分類又はカテゴリーは、数値にマッピングされる(例えば、モダリティ機能/入力の許容値[Monoclonal、Bispecific Format 1、Bispecific Format 2、Bispecific Format 1又は2]は、値[00、10、01、11]にマッピングされる)。
【0026】
幾つかの実施形態では、トレーニングサーバ104は、トレーニングされたMLモデル108を検証するために(例えば、MLモデル108の所与の1つが少なくともいくらかの最小許容可能性正確性を提供することを確認するために)、トレーニングデータベース140内の追加のラベル付きデータセットを使用する。幾つかの実施形態では、トレーニングサーバ104は、継続的に1つ以上のMLモデル108も更新/改良する。例えば、MLモデル108が十分な精度レベルを提供するために最初にトレーニングされた後、クロマトグラフィー性能指標値(及び対応する入力/特徴量)の追加の測定を使用すると、予測精度を改善することができる。
【0027】
アプリケーション130は、ネットワーク106及びネットワークインターフェース122を介してトレーニングサーバ104から、関心対象の性能指標値に対応するMLモデル108の特定の1つを読み出し得る。性能指標値は、例えば、可視化ユニット136によって生成又は追加されたGUIを介してユーザによって指示された1つであり得る。モデルを読み出すと、コンピューティングシステム102は、ローカルMLモデル138としてローカルコピーを保存する。他の実施形態では、上述したように、モデルは、読み出されず、代わりに、入力/データは、トレーニングサーバ104(若しくは他のサーバ)に、必要に応じてモデル108の適切なモデルを使用するために送信されるか、又は全てのモデル108は、コンピューティングシステム102にのみ存在し得る。
【0028】
特定モデル108又はモデル138が予測するためにトレーニングされる性能指標値は、例えば収率又は製品品質(例えば、純度)などの性能の任意の態様の指標値を含み得る。更に、性能指標値は、異なるタイプのクロマトグラフィーにとって一般的である(例えば、収率)又は特定タイプのクロマトグラフィーにとって特異的である(例えば、CEX、SEC、プロテインAなど)可能性がある。例えば且つ限定なしに、MLモデル108又は138は、以下の指標値:工程収率、CEX 酸性(%)、CEX メイン(%)、CEX 塩基性(%)、SEC 高分子量(HMW)(%)、SEC メイン(%)、SEC 低分子量(LMW)(%)、還元サンプル調製(rCE-SDS) メイン(%)、rCE-SDS LMW(%)、rCE-SDS軽鎖(LC)+重鎖(HC)(%)を伴うキャピラリー電気泳動ドデシル硫酸ナトリウム、還元サンプル調製(nrCE-SDS)メイン(%)、rCE-SDSプレ-LC(%)、rCE-SDS LC(%)、rCE-SDS非グリコシル化重鎖(NGHC)(%)、rCE-SDS HC(%)、rCE-SDS HMW(%)、rCE-SDSプレ-LC+LC+HC(%)を伴わないキャピラリー電気泳動ドデシル硫酸ナトリウム(nrCE-SDS)、プール伝導度(mS/cm)、キャピラリー等電点電気泳動法(cIEF)酸性(%)、cIEF塩基性(%)、cIEF メイン(%)、nrCE-SDSプレピーク(%)、宿主細胞タンパク質(HCP)及びSE-HPLC HMWのいずれかを予測することができる。幾つかの実施形態では、特定モデル108又はモデル138が予測するためにトレーニングされるプロセスパラメータは、プロセスの任意の態様又はその精度範囲の指標値(例えば、80%、85%、90%又は95%の信頼区間などの信頼区間)を含み得る。例えば且つ限定なしに、MLモデル108又は138は、以下のプロセスパラメータ:緩衝液及び/又は溶出緩衝液及び/又は負荷pH、溶出緩衝液のモル濃度、溶出緩衝液の伝導度、勾配の傾斜、線速度、負荷伝導度、負荷因子、収集停止、カラム体積、実際のCEX負荷(CEXが使用される場合)、負荷流量、溶出流量、緩衝液濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了のいずれかを予測することができる。
【0029】
データ収集ユニット132は、モデル138によって使用される特徴量セットに従って、必要なデータを収集する。例えば、データ収集ユニット132は、ユーザが入力したプロセスパラメータ(又は必要に応じて性能指標値)並びに関心対象の治療用タンパク質のためのMOEアプリケーション139による分子記述子出力(例えば、ユーザがMOEアプリケーション139にタンパク質のアミノ酸配列を入力又はさもなければ提供した後に)を受信することができる。プロセスパラメータ及び性能指標値は、本明細書に記載したとおりであり得る。例えば、プロセスパラメータは、例えば且つ限定なしに、緩衝液のpH、溶出緩衝液の伝導度(mS/cm)、溶出緩衝液のモル濃度(mM)、溶出緩衝液のpH、勾配の傾斜(mM/CV)、線速度(cm/hr)、負荷伝導度(mS/cm)、負荷因子(g/Lr)、負荷pH、収集停止(%)、カラム体積、実際のCEX負荷、負荷流量、溶出流量、緩衝液の濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了などの仮説的クロマトグラフィープロセスの条件又は特徴量に関連する任意のパラメータを含み得る。
【0030】
MOEアプリケーション139によって生成された分子記述子は、例えば且つ限定なしに、MOEソフトウェアのユーザに公知である以下の記述子:pH、HI、pro_Fv_net_charge、U、asa_hyd、viscosity、hyd_idx、pro_helicity、apol、asa_hph、pro_net_charge、hyd_idx_cdr、pro_henry、b_1rotR、volume、amphipathicity、hyd_strength、pro_hyd_moment、b_rotR、mobility、ASPmax、hyd_strength_cdr、pro_mass、density、helicity、BSA、Packing Score、pro_mobility、ens_dipole、henry、BSA_HC、pro_affinity、pro_pI_3D、mass、net_charge、BSA_LC_HC、pro_app_charge、pro_pI_seq、pI_seq、app_charge、contact energy、pro_asa_hph、pro_r_gyr、pI_3D、dipole_moment、DRT、pro_asa_hyd、pro_r_solv、coeff_fric、hyd_moment、E bond、pro_asa_vdw、pro_sed_const、coeff_diff、zeta、E ele、pro_cdr_net_charge、pro_stability、r_gyr、zdipole、E sol、pro_coeff_diff、pro_volume、r_solv、zquadrupole、E vdw、pro_coeff_fric、pro_zdipole、sed_const、Eint_VL_VH、pro_dipole_moment、pro_zeta、eccen、GB/VI、pro_eccen、pro_zquadrupole及び/又はasa_vdwのいずれか又は全てなどの任意の好適な記述子タイプを含み得る。好ましくは、幾つかの実施形態では、分子記述子は、分子の環境のpHレベル及び場合により多くのそのような記述子の関数(又はさもなければそれらに依存する)少なくとも1つの記述子を含む。例えば、様々な記述子は、タンパク質分子の表面電荷に依存する可能性があり、表面電荷は、順に分子環境のpHに依存する可能性がある。
【0031】
データ収集ユニット132がプロセスパラメータ(又は該当する場合には性能指標値)及び特定の仮説的クロマトグラフィープロセスのための分子記述子(場合により例えばユーザが入力したタンパク質の様式などの他のデータと一緒に)を収集した後、予測ユニット134は、MLモデル138が、仮説的クロマトグラフィープロセスのための所望の性能指標値(又はプロセスパラメータ)を予測するためにその入力/特徴量上で作動することを誘発する。幾つかの実施形態及び/又はシナリオでは、予測ユニット134は、同一の仮説的クロマトグラフィープロセスのための異なる性能指標値(又は適用可能な場合にはプロセスパラメータ)を(例えば、並行して又は連続的に)予測するためにトレーニングサーバ104から複数の異なるローカルMLモデル138を入手し得、ここで、ローカルMLモデル138は、各予測因子を生成するために同一の又は異なる特徴量上で作動すると理解されている。
【0032】
可視化ユニット136は、ディスプレイ124上に描出されたGUIが予測された性能指標値(又は適用可能な場合にはプロセスパラメータ)及び/又は予測された性能指標値(又は適用可能な場合にはプロセスパラメータ)に由来する他の情報を提示させる。例えば、可視化ユニット136は、(例えば、アプリケーション130が性能指標値を1つ以上のそれぞれの閾値と比較した後に)予測された性能指標値が1つ以上の合格判定基準を満たすかどうかの表示をGUIに提示させ得る。例えば、可視化ユニット136は、GUIに予測されたプロセスパラメータの精度範囲を提示させ得る。
【0033】
上記の予測/可視化プロセスは、(例えば、プロセスパラメータと治療用タンパク質のための固定セットの分子記述子との異なる組み合わせについて)多くの異なる仮説的クロマトグラフィープロセスにわたって繰り返すことができ、それによりユーザが異なるプロセス設計を迅速に試験することを可能にする。ユーザは、小さい摂動が、例えば、特定の入力に予測された性能指標値にどの程度影響を及ぼすか(例えば、溶出緩衝液のpH又は負荷流量などにおける予測範囲を反映する)など、設計の特定の態様を迅速に試験することもできる。可視化ユニット136は、視聴しているユーザが様々な仮説的クロマトグラフィープロセスについての予測の結果を理解及び考察するのに役立つ1つ以上のGUIを生成又は追加することができる。この方法で、視聴しているユーザは、(任意の必要な認定試験を受ける)現実世界の商業的製造プロセスにおいて、いずれのクロマトグラフィープロセスパラメータを使用するかについて情報を得た上で選択することができる。クロマトグラフィープロセスパラメータの選択は、概して、(場合により使用事例/プロジェクトのゴールに依存する他のゴールよりむしろこれらのゴールの1つに重点を置いて)不純物を最小限に抑えながら収率を最大化することを試みなければならず、且つ表示された情報に基づいて一人以上のユーザによって決定され得るか、又は幾つかの規定の選択基準に従って完全に自動化され得る。幾つかの場合、本明細書に記載した技術は、クロマトグラフィープロセスパラメータを選択するためだけではなく、更に又は代わりに、新規の分子と精製プロセスとの間の相互関係に関する相対的洞察も提供するために(例えば、分子記述子を微調整し、様々な性能指標値に及ぼす影響を観察することによって)使用することができる。これらの洞察は、精製有効性に影響を及ぼす重要な分子特性を同定することにより、将来的に分子設計を誘導するのに役立ち得る。
【0034】
極めて大量の標識された歴史的データを実施且つ収集するために必要とされる時間及び費用を回避するために、解釈可能な機械学習モデルをモデル108として使用することができる。例えば、トレーニングサーバ104は、何百もの特徴量について、モデル108の1つをトレーニングすることができ、その後、トレーニングサーバ104(又は人間のレビューア)は、トレーニングされたモデル(例えば、各特徴に割り当てられた重み)を分析して、最も予測的な特徴量(例えば、約10の特徴量又は約50の特徴量など)を決定することができる。その後、その特定のモデル108又は最も予測的な特徴量のみを使用してトレーニングされたそのモデル108の新しいバージョンは、はるかに小型の特徴量セットと共に使用され得る。高度に予測的な特徴量を同定することは、新たな仮説を生じ得る新たな科学的洞察を提供するなど(これは、次にバイオプロセスの改善につながり得る)、他の目的にも有用であり得る。
【0035】
いずれのモデルが特定の性能指標値(及び/又はプロセスパラメータ)に最も適しているかを決定し、且つ所与のモデル又は使用事例について最も予測的な特徴量を識別するための様々な技術を、図3及び4を参照して以下に説明する。
【0036】
概して、特異的性能指標値について良好に機能するモデルは、以前のクロマトグラフィー精製プロセスからの現実世界の歴史的トレーニングデータを使用する多くの様々なモデルタイプをトレーニングし、且つ結果を比較することによって同定することができる。図3は、特定の関心対象の性能指標値に対して、この目的で使用され得る例示的プロセス300を図示している。プロセス300の第1のステージ302では、性能指標値に関連するデータが選択(即ち、同定して入手)される。しかしながら、歴史的データは、例えば、異なる薬物製品若しくはプロジェクトについて捕捉されている異なるタイプ及び/又は様式のデータとは不一致であることが多い。したがって、ステージ304では、トレーニングデータのロバストなセットを保証するために、欠測値を帰属させ、且つ/又は他の(例えば、正規化する、外れ値を除去するなどの)工程を実施することが必要になる場合がある。
【0037】
ステージ306では、候補モデルのそれぞれは、それぞれの候補モデルについて最適化されたハイパーパラメータを用いて、歴史的データの少なくとも一部分についてトレーニングされる。ステージ306は、各モデルについてk倍の確認を実施することを含み得る(例えば、k=10(ここで、モデルは、ステージ302で選択され、ステージ304で増強されたデータセットの様々な90/10区画にわたって10回トレーニング且つ評価される)又はk=5などを用いて)。ステージ306は、ベイズ検索技法を用いて、各モデルのハイパーパラメータをチューニングすることを含み得る。ベイズ技法は、グリッド探索又はランダム探索よりも計算上効率的なベイズガイド探索を実行するが、ランダム探索と同様のレベルの性能を得る。ステージ306は、ベイズ検索の幾つかの反復及びk倍の確認を通してモデルハイパーパラメータを選択することを含み得る。
【0038】
ステージ308では、様々な候補モデル(その微調整されたハイパーパラメータを含む)が評価され、(関心対象の性能指標値又はプロセスパラメータのための)最良モデルが選択される。任意の適切な基準を使用すると、「最良」モデルを選択することができる。例えば、決定係数(R)及び/又は二乗平均平方根誤差(RMSE)などのアルゴリズム性能尺度を各モデルについて捕捉することができ、それぞれの平均値は、クロス確認プロセスに基づいて得られる。Rは、
【数1】
として計算され得る。方程式1では、nは、クロス確認倍率当たりのサンプル数を表し、yは、真の標的出力を表し、及びfは、モデルによって予測される出力を表す。平均Rは、
【数2】
(式中、kは、クロス確認倍率数を表す)
として計算され得る。RMSEは、
【数3】
として計算され得る。モデルについての平均RMSEは、
【数4】
として計算され得る。
【0039】
RMSEは、RMSEが予測されている性能指標値(又はプロセスパラメータ)の容易に理解されるユニット内のモデルの精度/誤差を示すため、Rよりも優れた尺度であり得る。更に、R尺度は、場合により、幾つかのクロス確認セットを用いると極端な負の値を生じさせることがあり、これは、セット全体で平均化したときにモデル比較を歪め得る。RMSEは、更に平均絶対誤差(MAE)よりも好ましい可能性があり、それは、前者が、予測と実際の結果との間により大きい誤差を課すためである。
【0040】
その後、ステージ310では、性能指標値(又はプロセスパラメータ)を予測するための最終モデルは、例えば、異なるモデルについてのRMSE(及び/又は1つ以上の他の尺度)の比較に基づいて、出力/選択される。最終モデルは、全データセットについて再トレーニングされ得る。最終生成モデルは、次にトレーニングされたモデル(例えば、MLモデル108の1つ)として保存され、新規/将来のクロマトグラフィープロセスのための予測をする準備が整う。
【0041】
一実施形態では、プロセス300は、図1のトレーニングサーバ104によって(場合により関心対象の性能指標値を選択する、候補としてのモデルを選択することなどの様々なステージでヒト入力を用いて)実施される。プロセス300は、関心対象の各性能指標値について且つ本明細書の他の箇所で考察された例示的性能指標値のいずれかなど、性能指標値の任意の好適な数(例えば、5、10、20など)について繰り返すことができる。異なる性能指標値に対する最終モデルは、ステージ310の各反復で出力されると、トレーニングサーバ104は、その最終モデルをMLモデル108に追加することができる。その後且つ本明細書で考察した方法で特定の仮説的クロマトグラフィー精製プロセスについての予測を行う前に(例えば、図1を参照して)、コンピューティングシステム102又はトレーニングサーバ104は、MLモデル108から適切な最終モデルを選択することができる。選択は、例えば、所望の性能指標値を示しているユーザ入力に基づいて行うことができる。
【0042】
概して、プロセス300に従い、多くのモデルは、RMSEに基づいて且つ以下の表1に示したように、治療用タンパク質の製造中のクロマトグラフィー精製プロセスについて様々な異なる性能指標値に関する優れた性能を有すると同定されている。
【0043】
【表1】
【0044】
表1の結果は、全て様々なモノクローナル抗体についての歴史的データセットに関連する。各性能指標値については、最低RMSEを生じさせたモデルは、「最良実行」モデルであると解釈された。表1から明らかなように、全性能指標値を予測するために最良に実行されたモデルは1つもなかった。むしろ、回帰木モデルは、12種の性能指標値に対して最良に実行し、xgboostモデルは、8種の性能指標値に対して最良に実行し、及びエラスティックネットは、2種の性能指標値に対して最良に実行した。プロセス300を用いて評価された他のモデル(投げ縄、リッジ、SGD、線形SVM及びPLS)は、表1における性能指標のいずれに対しても最良に実行しなかった。回帰木及びxgboostモデルは、特に、多数及び少数の両方の観察所見(トレーニングデータセット)を伴って良好に実行した。
【0045】
他のプロセスは、異なる性能指標値に基づいて(及び/又は異なる性能指標値の組み合わせに基づいて)モデルを評価する、異なる尺度(RMSE以外)を用いてモデルを評価するなどのより多数又は少数のトレーニングデータセットに起因して、異なる性能特性を有する可能性がある。例えば、収率を予測するため及びR尺度に従って(特にモノクローナル抗体に対して)SEC-HMWパーセンテージを予測するための機械学習モデルを評価する場合、最良に実行するモデルは、xgboostモデルであることが見出された。この後者の評価のために、xgboostモデルへのプロセスパラメータ入力は、カラム体積、負荷pH、実際のCEX負荷、負荷流量、溶出流量、緩衝液濃度、溶出pH、勾配の傾斜、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了を含んでいた。
【0046】
上述したように、ステージ310で「最良」モデルが同定/出力された場合、所望の性能指標値を最高に予測するその特徴量のみが利用されるように、いずれの特徴量が特定モデルにとって最重要であるかを学習することは、有益であり得る。図4A及び4Bは、いずれもeXtreme勾配ブースト(xgboost)モデルを用いて、実験的収率を予測し、且つSE-HPLC HMWを予測することの両方のために、例示的な特徴量の重要度尺度(それぞれ相対的特徴量の重要度と特徴量との相関)のプロット400、420を示す。プロット400、420は、例えば、可視化ユニット136によって生成され、ディスプレイ124を介してGUI上に提示することができる。
【0047】
例えばプロット400、420などのプロットは、ユーザ(例えば、科学者)が特異的性能指標値を予測するために(ここでは実験的収率及びSE-HPLC HMWを予測するために)、最重要因子を容易に同定することを可能にさせ得る。これは、分子の構造が精製プロセスにどのように影響を及ぼすかについてのより大きい洞察を提供することもできる。例えば、CEXプロセスにおいて不純物を増加させることに疎水性が役割を果たすことは常識であるが、概して、分子の電荷が最大の影響を及ぼすであろうと考えられている。しかしながら、プロット400及び/又は420(又は相関熱マップなど)に類似する特徴量の重要度プロットは、一貫して且つ驚くべきことに、CEXプロセスに従って疎水性をより高度の不純物(詳細には高いHMW)のより重要な指標であるとランク付けする。更に、全ての形態の疎水性が不純物のレベルに同等に影響を及ぼすわけではない。例えば、プロット420(又は相関熱マップなど)に類似するプロットは、少なくとも他の疎水性に比較して、幾つかの形態の疎水性は、より低い不純物の指標(特に、低HMW)であることを示す。
【0048】
図5Aは、治療用タンパク質の製造中の精製プロセスのためのクロマトグラフィーパラメータの選択を促進するための例示的方法500のフロー図である。方法500は、少なくとも一部には、メモリユニット128に保存されたアプリケーション130のソフトウェア命令を実行する場合、コンピューティングシステム102のプロセッシングユニット120又は例えばサーバ104の(例えば、クラウドサービスの実行において)1つ以上のプロセッサによって実行され得る。
【0049】
ブロック502では、仮説的クロマトグラフィー(例えば、CEX、SEC又はプロテインAクロマトグラフィー)プロセスに関連する1つ以上のプロセスパラメータ値が受け取られる。プロセスパラメータ値は、ユーザインターフェースを介して、且つ/又は例えばファイル若しくは他のデータなどをインポートすることによって受け取られ得る。例として且つ限定なしに、プロセスパラメータ値は、以下:緩衝液のpH、溶出緩衝液の伝導度(mS/cm)、溶出緩衝液のモル濃度(mM)、溶出緩衝液のpH、勾配の傾斜(mM/CV)、線速度(cm/hr)、負荷伝導度(mS/cm)、負荷因子(g/Lr)、負荷pH、収集停止(%)、カラム体積、実際のCEX負荷、負荷流量、溶出流量、緩衝液の濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了のいずれかの1つ以上の値を含み得る。先行するリストに例示的単位を示したが、これらの単位は、例示するためのみのものであることと、これらのパラメータは、任意の好適な単位で伝達され得ることとを理解されたい。したがって、例示的単位が先行リスト又は本明細書のプロセスパラメータの任意の他のリストから排除され得ることが理解されるであろう。
【0050】
ブロック504では、治療用タンパク質を記述する1つ以上の分子記述子が受け取られる。分子記述子は、ユーザインターフェースを介して、且つ/又は例えばファイル若しくは(例えば、MOEアプリケーション139から)他のデータなどをインポートすることによって受け取られ得る。幾つかの実施形態では、方法500は更に、治療用タンパク質と関連する配列情報(例えば、MOEソフトウェアに入力されるアミノ酸配列情報)及び/又は治療用タンパク質の物理的特性の実験的測定(例えば、MOEソフトウェアに入力される測定結果)に基づいて1つ以上の分子記述子を決定することも含む。幾つかの実施形態では、少なくとも1つの分子記述子は、分子を取り囲んでいる環境のpHの関数(例えば、pHが知られている/特定されている場合に変動する数学的関数)である。例として且つ限定なしに、分子記述子は、以下:pH、HI、pro_Fv_net_charge、U、asa_hyd、viscosity、hyd_idx、pro_helicity、apol、asa_hph、pro_net_charge、hyd_idx_cdr、pro_henry、b_1rotR、volume、amphipathicity、hyd_strength、pro_hyd_moment、b_rotR、mobility、ASPmax、hyd_strength_cdr、pro_mass、density、helicity、BSA、Packing Score、pro_mobility、ens_dipole、henry、BSA_HC、pro_affinity、pro_pI_3D、mass、net_charge、BSA_LC_HC、pro_app_charge、pro_pI_seq、pI_seq、app_charge、contact energy、pro_asa_hph、pro_r_gyr、pI_3D、dipole_moment、DRT、pro_asa_hyd、pro_r_solv、coeff_fric、hyd_moment、E bond、pro_asa_vdw、pro_sed_const、coeff_diff、zeta、E ele、pro_cdr_net_charge、pro_stability、r_gyr、zdipole、E sol、pro_coeff_diff、pro_volume、r_solv、zquadrupole、E vdw、pro_coeff_fric、pro_zdipole、sed_const、Eint_VL_VH、pro_dipole_moment、pro_zeta、eccen、GB/VI、pro_eccen、pro_zquadrupole及び/又はasa_vdwの任意の1つ以上を含み得る。
【0051】
ブロック506では、仮説的クロマトグラフィープロセスの性能指標値は、機械学習モデルを使用して、少なくともブロック502で受け取られたプロセスパラメータ及びブロック504で受け取られた分子記述子を分析することによって予測される。機械学習モデルは、回帰木モデル、eXtreme勾配ブースト(xgboost)モデル又はエラスティックネットモデルのいずれかであり得る。例として且つ限定なしに、予測される性能指標値は、以下:工程収率、CEX 酸性(%)、CEX メイン(%)、CEX 塩基性(%)、SEC HMW(%)、SEC メイン(%)、SEC 低分子量(LMW)(%)、還元サンプル調製を伴うキャピラリー電気泳動ドデシル硫酸ナトリウム(rCE-SDS) メイン(%)、rCE-SDS LMW(%)、rCE-SDS 軽鎖(LC)+重鎖(HC)(%)、還元サンプル調製(nrCE-SDS)を伴わないキャピラリー電気泳動ドデシル硫酸ナトリウム(nrCE-SDS) メイン(%)、rCE-SDS プレ-LC(%)、rCE-SDS LC(%)、rCE-SDS 非グリコシル化重鎖(NGHC)(%)、rCE-SDS HC(%)、rCE-SDS 高分子量(HMW)(%)、rCE-SDS プレ-LC+LC+HC(%)、プール伝導度(mS/cm)、キャピラリー等電点電気泳動法(cIEF) 酸性(%)、cIEF 塩基性(%)、cIEF メイン(%)、nrCE-SDS プレピーク(%)、HCP及び/又はSE-HPLC HMWの1つであり得る。
【0052】
幾つかの実施形態では、ブロック506は、nrCE-SDS LC+HC(%)、rCE-SDS プレ-LC(%)、CEX 塩基性(%)、SEC HMW(%)、SEC メイン(%)、SEC LMW(%)、rCE-SDS HC(%)、rCE-SDS HMW(%)、rCE-SDS プレ-LC+LC_HC(%)、プール伝導度(%)又はnrCE-SDS プレピーク(%)を予測するために回帰木モデルを使用することを含む。他の実施形態では、ブロック506は、CEX 酸性(%)、CEX メイン(%)、工程収率、rCE-SDS メイン(%)、rCE-SDS LMW(%)、cIEF 酸性(%)、cIEF 塩基性(%)又はcIEF メイン(%)を予測するために、eXtreme勾配ブーストモデルを使用することを含む。代わりに、ブロック506は、SEC HMW(%)又は収率を予測するために、eXtreme勾配ブーストモデルを使用することを含み得る。更に他の実施形態では、ブロック506は、rCE-SDS LC+HC(%)を予測するか又はrCE-SDS LC(%)を予測するために、エラスティックネットモデルを使用することを含む。
【0053】
ブロック508では、ブロック506で予測された性能指標値及び/又は予測された性能指標値は、治療用タンパク質の製造中の現実世界の精製プロセスのためのクロマトグラフィーパラメータの選択(例えば、ユーザによる手動選択)を促進するために、1つ以上の合格判定基準を満たす(例えば、幾つかの閾値を超えるか又は下回る)かどうかの指標がユーザインターフェース(例えば、可視化ユニット136によって生成又は追加され、図1のディスプレイ124上に提示されたGUI)を介してユーザに提示される。
【0054】
幾つかの実施形態では、方法500は、図5Aに図示されてない1つ以上の追加のブロックを含む。例えば、方法500は、いずれもブロック502前に行われる2つの追加のブロック:関心対象の性能指標値を示すデータがユーザからユーザインターフェース(例えば、可視化ユニット136によって生成又は追加されてディスプレイ124上に提示されるGUI)を介して受け取られる第1の追加のブロック及び機械学習モデル(後にブロック506で使用される)が異なる性能指標を予測するためにトレーニングされた複数の機械学習モデル(例えば、MLモデル108)の中から選択される第2の追加のブロックを含み得る。
【0055】
別の例として、方法500は、第2の機械学習モデルを使用して、関心対象の第2の性能指標値を発生させるために、ブロック506及び508(又は502~508)に類似する、4つの追加のブロックを含み得る。例えば、第1及び第2の機械学習モデルは、一方は実験的収率パーセンテージを予測し、他方は、SEC HMWパーセンテージを予測する、異なる目的のためにトレーニングされたxgboostモデルであり得る。
【0056】
更に別の例として、方法500は、いずれもブロック506後に発生する2つの追加のブロック:1つ以上のプロセスパラメータ値がブロック508で提示された性能指標値及び/又は指示に基づいて治療用タンパク質のための(現実世界の)クロマトグラフィープロセスに対して選択される第1の追加のブロック及びクロマトグラフィープロセスが1つ以上の選択されたプロセスパラメータ値に従って治療用タンパク質に対して実施される第2の追加のブロックを含み得る。
【0057】
図5Bは、治療用タンパク質の製造中の精製プロセスのためのクロマトグラフィーパラメータの選択を促進するための別の例示的方法520のフロー図である。方法520は、少なくとも一部には、メモリユニット128に保存されたアプリケーション130のソフトウェア命令を実行する場合、コンピューティングシステム102のプロセッシングユニット120又は例えばサーバ104の(例えば、クラウドサービスの実行において)1つ以上のプロセッサによって実行され得る。
【0058】
ブロック522では、仮説的クロマトグラフィー(例えば、CEX、SEC又はプロテインAクロマトグラフィー)プロセスに関連する1つ以上の性能指標値が受け取られる。性能指標値は、ユーザインターフェースを介して、且つ/又は例えばファイル若しくは他のデータなどをインポートすることによって受け取られ得る。例として且つ限定なしに、性能指標値は、以下:工程収率、CEX 酸性(%)、CEX メイン(%)、CEX 塩基性(%)、SEC HMW(%)、SEC メイン(%)、SEC 低分子量(LMW)(%)、還元サンプル調製を伴うキャピラリー電気泳動ドデシル硫酸ナトリウム(rCE-SDS) メイン(%)、rCE-SDS LMW(%)、rCE-SDS 軽鎖(LC)+重鎖(HC)(%)、還元サンプル調製(nrCE-SDS)を伴わないキャピラリー電気泳動ドデシル硫酸ナトリウム(nrCE-SDS) メイン(%)、rCE-SDS プレ-LC(%)、rCE-SDS LC(%)、rCE-SDS 非グリコシル化重鎖(NGHC)(%)、rCE-SDS HC(%)、rCE-SDS 高分子量(HMW)(%)、rCE-SDS プレ-LC+LC+HC(%)、プール伝導度(mS/cm)、キャピラリー等電点電気泳動法(cIEF) 酸性(%)、cIEF 塩基性(%)、cIEF メイン(%)、nrCE-SDS プレピーク(%)、HCP及び/又はSE-HPLC HMWのいずれかの1つ以上の値を含み得る。
【0059】
ブロック524では、治療用タンパク質を説明する1つ以上の分子記述子が受け取られる。分子記述子は、ユーザインターフェースを介して、且つ/又は例えばファイル若しくは他のデータ(例えば、MOEアプリケーション139から)などをインポートすることによって受け取られ得る。幾つかの実施形態では、方法520は更に、治療用タンパク質と関連する配列情報(例えば、MOEソフトウェアに入力されるアミノ酸配列情報)及び/又は治療用タンパク質の物理的特性の実験的測定(例えば、MOEソフトウェアに入力される測定結果)に基づく1つ以上の分子記述子を決定することも含む。幾つかの実施形態では、少なくとも1つの分子記述子は、分子を取り囲んでいる環境のpHの関数(例えば、pHが知られている/特定されている場合に変動する数学的関数)である。例として且つ限定なしに、分子記述子は、以下:pH、HI、pro_Fv_net_charge、U、asa_hyd、viscosity、hyd_idx、pro_helicity、apol、asa_hph、pro_net_charge、hyd_idx_cdr、pro_henry、b_1rotR、volume、amphipathicity、hyd_strength、pro_hyd_moment、b_rotR、mobility、ASPmax、hyd_strength_cdr、pro_mass、density、helicity、BSA、Packing Score、pro_mobility、ens_dipole、henry、BSA_HC、pro_affinity、pro_pI_3D、mass、net_charge、BSA_LC_HC、pro_app_charge、pro_pI_seq、pI_seq、app_charge、contact energy、pro_asa_hph、pro_r_gyr、pI_3D、dipole_moment、DRT、pro_asa_hyd、pro_r_solv、coeff_fric、hyd_moment、E bond、pro_asa_vdw、pro_sed_const、coeff_diff、zeta、E ele、pro_cdr_net_charge、pro_stability、r_gyr、zdipole、E sol、pro_coeff_diff、pro_volume、r_solv、zquadrupole、E vdw、pro_coeff_fric、pro_zdipole、sed_const、Eint_VL_VH、pro_dipole_moment、pro_zeta、eccen、GB/VI、pro_eccen、pro_zquadrupole及び/又はasa_vdwの任意の1つ以上を含み得る。
【0060】
ブロック526では、仮説的クロマトグラフィープロセスのプロセスパラメータ値は、機械学習モデルを使用して、少なくともブロック522で受け取られた性能指標値及びブロック524で受け取られた分子記述子を分析することによって予測される。機械学習モデルは、回帰木モデル、eXtreme勾配ブースト(xgboost)モデル又はエラスティックネットモデルのいずれかであり得る。例として且つ限定なしに、それに対して値が予測されるプロセスパラメータは、以下:緩衝液のpH、溶出緩衝液の伝導度(mS/cm)、溶出緩衝液のモル濃度(mM)、溶出緩衝液のpH、勾配の傾斜(mM/CV)、線速度(cm/hr)、負荷伝導度(mS/cm)、負荷因子(g/Lr)、負荷pH、収集停止(%)、カラム体積、実際のCEX負荷、負荷流量、溶出流量、緩衝液の濃度、勾配長、勾配始点、勾配終点、プール体積、タンパク質濃度、プール開始及び/又はプール終了の1つであり得る。先行するリストに例示的単位を示したが、これらの単位は、例示するためのみのものであることと、これらのパラメータは、任意の好適な単位で伝達され得ることとを理解されたい。したがって、例示的単位が先行リスト又は本明細書のプロセスパラメータの任意の他のリストから排除され得ることが理解されるであろう。
【0061】
幾つかの実施形態では、ブロック526は、分子記述子並びにnrCE-SDS LC+HC(%)、rCE-SDS プレ-LC(%)、CEX 塩基性(%)、SEC HMW(%)、SEC メイン(%)、SEC LMW(%)、rCE-SDS HC(%)、rCE-SDS HMW(%)、rCE-SDS プレ-LC+LC_HC(%)、プール伝導度及び/又はnrCE-SDS (%)プレピークの1つ以上に基づいてプロセスパラメータ値を予測するために、回帰木モデルを使用することを含む。他の実施形態では、ブロック526は、分子記述子並びにCEX 酸性(%)、CEX メイン(%)、工程収率、rCE-SDS メイン(%)、rCE-SDS LMW(%)、cIEF 酸性(%)、cIEF 塩基性(%)及び/又はcIEF メイン(%)の1つ以上に基づいてプロセスパラメータを予測するために、eXtreme勾配ブーストモデルを使用することを含む。代わりに、ブロック506は、分子記述子並びにSEC HMW(%)及び収率の一方又は両方に基づいてプロセスパラメータ値を予測するために、eXtreme勾配ブーストモデルを使用することを含み得る。更に他の実施形態では、ブロック506は、分子記述子及びrCE-SDS LC+HC(%)又は分子記述子及びrCE-SDS LC(%)に基づいてプロセスパラメータ値を予測するために、エラスティックネットモデルを使用することを含む。
【0062】
ブロック528では、ブロック526で予測されたプロセスパラメータ値及び/又は予測されたプロセスパラメータ値の予測された精度範囲は、治療用タンパク質の製造中の現実世界の精製プロセスのためのクロマトグラフィーパラメータの選択(例えば、ユーザによる手動選択)を促進するために、ユーザインターフェース(例えば、可視化ユニット136によって生成又は追加され、図1のディスプレイ124上に提示されるGUI)を介してユーザに提示される。
【0063】
幾つかの実施形態では、方法520は、図5Bに図示されてない1つ以上の追加のブロックを含む。例えば、方法520は、いずれもブロック522前に行われる2つの追加のブロック:関心対象のプロセスパラメータを示すデータがユーザからユーザインターフェース(例えば、可視化ユニット136によって生成又は追加されてディスプレイ124上に提示されるGUI)を介して受け取られる第1の追加のブロック及び(後にブロック526で使用される)機械学習モデルが異なるプロセスパラメータの値を予測するためにトレーニングされた複数の機械学習モデル(例えば、MLモデル108)の中から選択される第2の追加のブロックを含み得る。
【0064】
別の例として、方法520は、第2の機械学習モデルを使用して、関心対象の第2のプロセスパラメータを発生させるために、ブロック526及び528(又は522~528)に類似する、追加のブロックを含み得る。例えば、第1及び第2の機械学習モデルは、一方は緩衝液のpHを予測し、他方は、負荷因子を予測する、異なる目的のためにトレーニングされたxgboostモデルであり得る。
【0065】
更に別の例として、方法520は、いずれもブロック526後に発生する2つの追加のブロック:1つ以上のプロセスパラメータ値がブロック528で提示された情報に基づいて、治療用タンパク質のための(現実世界の)クロマトグラフィープロセスに対して選択される第1の追加のブロック及びクロマトグラフィープロセスが1つ以上の選択されたプロセスパラメータ値に従って治療用タンパク質に対して実施される第2の追加のブロックを含み得る。
【0066】
システム、方法、装置及びその構成要素を例示的な実施形態の観点から説明してきたが、それらは、これらの例示的な実施形態に限定されない。詳細な説明は、例としてのみ解釈されるものとし、可能な実施形態の全てを説明することは、不可能ではないとしても非現実的であることから、本発明の全ての可能な実施形態を説明しているわけではない。現在の技術又は本特許の申請日以降に開発された技術のいずれかを使用して、多くの代替的な実施形態を実施することができ、それは、本発明を定義する請求項の範囲内に依然として含まれる。
【0067】
当業者であれば、本発明の範囲から逸脱することなく、上記の実施形態に対する多様な修正形態、変形形態及び組み合わせをなすことができ、そうした修正形態、変形形態及び組み合わせが本発明の概念の範囲内であると解釈されることを理解するであろう。
図1
図2
図3
図4A
図4B
図5A
図5B
【国際調査報告】