(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-21
(54)【発明の名称】タンパク質製剤のための粘度低減賦形剤のデジタル選択
(51)【国際特許分類】
G16C 20/70 20190101AFI20240514BHJP
【FI】
G16C20/70
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023569631
(86)(22)【出願日】2022-05-09
(85)【翻訳文提出日】2024-01-09
(86)【国際出願番号】 EP2022062389
(87)【国際公開番号】W WO2022238278
(87)【国際公開日】2022-11-17
(32)【優先日】2021-05-10
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】591032596
【氏名又は名称】メルク パテント ゲゼルシャフト ミット ベシュレンクテル ハフツング
【氏名又は名称原語表記】Merck Patent Gesellschaft mit beschraenkter Haftung
【住所又は居所原語表記】Frankfurter Str. 250,D-64293 Darmstadt,Federal Republic of Germany
(74)【代理人】
【識別番号】110003971
【氏名又は名称】弁理士法人葛和国際特許事務所
(72)【発明者】
【氏名】ローゼンクランツ,トビアス
(72)【発明者】
【氏名】フォンダー ハール,マーセル
(72)【発明者】
【氏名】ショシッチ,アドリアン
(72)【発明者】
【氏名】ブランデンブルク,ヤン ゲリット
(72)【発明者】
【氏名】バニク,ニールス
(57)【要約】
少なくとも1つの未知のタンパク質(11)を含有する製剤(8)のための少なくとも1つの粘度変化賦形剤(2)を、コンピュータ(6)を介して選択する方法であって、以下のステップ、少なくとも1つのタンパク質および任意に少なくとも1つの粘度変化賦形剤(2)を含有するいくつかの既知の製剤の粘度を記述するデータベースから、データセット(1)を提供すること;賦形剤のリストから少なくとも1つの賦形剤(2)の表現を、コンピュータ(6)により、インシリコシミュレーションを介して生成すること;生成された少なくとも1つの賦形剤(2)の表現を使用してデータセット(1)中のパターンを認識する、コンピュータ(6)上で遂行される機械学習モデル(5)を使用して、少なくとも1つの未知のタンパク質(11)の提供されたデータに、認識されたパターンを適用することにより、少なくとも1つの未知のタンパク質(11)および少なくとも1つの粘度変化賦形剤(2)を含有する新しい製剤(8)に対する、賦形剤のリストから選択された少なくとも1つの粘度変化賦形剤(2)の粘度変化効果を評価すること;評価結果に応じて、取得基準に従ってリストから少なくとも1つの賦形剤を選択し、およびそれを未知のタンパク質(11)に適用すること、を含み、ここで、少なくとも1つの未知のタンパク質(11)の提供されたデータは、少なくとも1つの未知のタンパク質(11)および任意に少なくとも1つの粘度変化賦形剤(2)を一緒に含有するタンパク質組成物の粘度を記述するデータである、前記方法。
【特許請求の範囲】
【請求項1】
少なくとも1つの未知のタンパク質(11)を含有する製剤(8)のための少なくとも1つの粘度変化賦形剤(2)を、コンピュータ(6)を介して選択する方法であって、以下のステップ:
・少なくとも1つのタンパク質および任意に少なくとも1つの粘度変化賦形剤(2)を含有するいくつかの既知の製剤の粘度を記述するデータベースから、データセット(1)を提供すること;
・賦形剤のリストから少なくとも1つの賦形剤(2)の表現を、コンピュータ(6)により、インシリコシミュレーションを介して生成すること;
・生成された少なくとも1つの賦形剤(2)の表現を使用してデータセット(1)中のパターンを認識する、コンピュータ(6)上で遂行される機械学習モデル(5)を使用して、少なくとも1つの未知のタンパク質(11)の提供されたデータに、認識されたパターンを適用することにより、少なくとも1つの未知のタンパク質(11)および少なくとも1つの粘度変化賦形剤(2)を含有する新しい製剤(8)に対する、賦形剤のリストから選択された少なくとも1つの粘度変化賦形剤(2)の粘度変化効果を評価すること;
・評価結果に応じて、取得基準に従ってリストから少なくとも1つの賦形剤を選択し、およびそれを未知のタンパク質(11)に適用すること、
を含み、
ここで、少なくとも1つの未知のタンパク質(11)の提供されたデータは、少なくとも1つの未知のタンパク質(11)および任意に少なくとも1つの粘度変化賦形剤(2)を一緒に含有するタンパク質組成物の粘度を記述するデータである、
前記方法。
【請求項2】
少なくとも1つの粘度変化賦形剤(2)の粘度変化効果の評価が、少なくとも1つの未知のタンパク質(11)および少なくとも1つの粘度変化賦形剤(2)を含有する新しい製剤(8)の粘度(3)を予測することによって行われる、請求項1に記載の方法。
【請求項3】
データセット(1)が実験測定(10)によって生成され、コンピュータ(6)を介してデータベースに格納される、請求項1または2に記載の方法。
【請求項4】
新しい製剤(8)の粘度を最も十分に変化させるリストの少なくとも1つの賦形剤として、リストから2つ以上の賦形剤の組合せを使用する、請求項1~3のいずれか一項に記載の方法。
【請求項5】
少なくとも1の特定の実験測定(10)が、製剤スペシャリスト(9)に提案され、製剤スペシャリスト(9)は予測された粘度(3)を検証するために、少なくとも1つのそれぞれの実験(10)をラボで行い、および検証した結果をコンピュータ(6)を介してデータベース中に提供されたデータセット(1)に加えることによって、機械学習モデル(5)を訓練する、請求項1~4のいずれか一項に記載の方法。
【請求項6】
機械学習モデル(5)が、少なくとも1つのプロトタイプタンパク質製剤(8)の粘度を記述するデータセット(1)と、少なくとも1つの粘度変化賦形剤(2)またはそれらの組み合わせの表現とを組み合わせることによって作成および訓練される、請求項1~5のいずれか一項に記載の方法。
【請求項7】
所与の製剤(8)の粘度値が、ガウス過程の形で機械学習モデル(5)を介してモデル化され、モデル予測(3)が、ベイズ最適実験計画によって製剤スペシャリスト(9)を導くために使用される、請求項6に記載の方法。
【請求項8】
コンピュータ(6)上での機械学習モデル(5)の訓練が、以下のステップ:
・訓練データの周辺尤度を最大化することにより、データセット(1)からの訓練データで機械学習モデルパラメータを最適化すること;
・機械学習モデル(5)に基づいて、未試験の賦形剤(2)またはその組み合わせの粘度値の事後分布を評価し、それによって粘度(3)を予測すること;
・計算された事後分布から得られる取得スコアを最適化することにより、賦形剤(2)またはその組み合わせの新しいセットを選択すること;
・新しい賦形剤(2)またはその組み合わせを製剤スペシャリスト(9)に提案し、製剤スペシャリストは次いでラボでそれぞれの実験(10)を行い、得られた粘度を測定すること;
・得られた測定値(10)を訓練データに加えること:
を少なくとも1回実行することによって行われる請求項6または請求項7に記載の方法。
【請求項9】
粘度値(3)の事後分布から得られる粘度(3)の予測が、考慮される製剤(8)に使用される賦形剤(2)を特徴付けるpH依存特徴ベクトルおよび使用される賦形剤濃度レベルに基づいている、請求項8に記載の方法。
【請求項10】
取得基準がどの粘度変化賦形剤(2)が粘度を最も低減させるかである請求項1~9のいずれか一項に記載の方法。
【請求項11】
賦形剤(2)の表現が、物理的パラメータおよび分子フィンガープリントの形態でコンピュータ(6)により生成される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
生成された賦形剤(2)の表現が実験的に交差検証される、請求項1~11のいずれか一項に記載の方法。
【請求項13】
生成された賦形剤(2)の表現が、量子力学的特徴を包含し、任意にトポロジカル分子フィンガープリントのセットで補完される、請求項1~12のいずれか一項に記載の方法。
【請求項14】
請求項5~13に従って作成されおよび訓練されたコンピュータ上で実行される機械学習モデル。
【請求項15】
ガウス過程が、同じ目的を満たす他のモデルアーキテクチャ、特に他のタイプの確率過程、ディープベイズネットワーク、一般化線形性モデル、ニューラルネットワーク、サポートベクターマシン、ツリーベースモデル、アンサンブルモデルなどで置き換えられた、請求項14に記載の機械学習モデル。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータを介したタンパク質組成物の粘度低減賦形剤の粘度の選択方法に関する。
【背景技術】
【0002】
背景および先行技術の記述
モノクローナル抗体(mAB)および他のタンパク質治療薬は、通常、非経口的に投与される。皮下注射は、患者投与を単純化(速い低容積の注射)および処置費用を低減(より短い医療支援)するその潜在力に起因してタンパク質治療薬の送達のために特に人気が高い。患者のコンプライアンスを確保するために、皮下注射剤形は等張性であり、少量(注射部位あたり<2.0ml)で注射できることが望ましい。
注射量を低減するために、タンパク質はしばしば、1mg/ml~150mg/mlの濃度で投与される。
【0003】
同時に、mABベースの治療は通常、数mg/kgの投与を必要とする。したがって、高い治療用量と低い注射量の組み合わせは、治療用抗体の高濃度製剤の必要性をもたらす。
しかし、抗体は大きなタンパク質であるため、複雑な立体構造に加えて多数の官能基を有する。これは、特に高濃度が必要な場合に、それらの製剤化を困難にする。
【0004】
高濃度タンパク質溶液の主な問題の1つは粘度である。タンパク質は主に非天然の自己会合(self-association)のために高粘性の溶液を形成する傾向がある。さらに、タンパク質は、そのような高濃度で凝集および粒子形成の速度の増加を示す。
【0005】
これらの問題は、製造プロセスと患者への投与の両方に関係する。製造プロセスにおいて、高い粘性の高濃度タンパク質製剤は、限外濾過および滅菌濾過に特に困難をもたらす。
さらに、タンジェンシャルフロー(tangential flow)濾過は、緩衝液交換やタンパク質濃度の増加にしばしば、使用される。しかし、粘性溶液は注射および濾過中に背圧とずり応力の増加を示すため、治療用タンパク質が不安定になる、および/または、処理時間が長くなる可能性がある。前記ずり応力の増加は、頻繁に製品の損失をもたらす。どちらの側面もプロセスの経済性に悪影響を及ぼす。
【0006】
同時に、高粘度はタンパク質の注射性を著しく制限するので、投与に関しては許容できない。
【0007】
特定の賦形剤および賦形剤の組み合わせは、タンパク質製剤の粘度を低減させることが特定されている。しかし、最良の賦形剤または賦形剤の組み合わせを特定するためのスクリーニングアプローチの使用は時間を要する。
特に、競争の激しいタイムラインと限られた量の試験材料(タンパク質)に照らして、実験の数を減らし、賦形剤の選択を加速するデータ主導のアプローチは高度に有益である。
【0008】
最先端の技術では、機械学習モデルを包含するタンパク質製剤設計のためのいくつかのアプローチが知られている。例えば、論文“Machine learning models of antibody-excipient preferential interactions for use in computational formulation design” (Mol. Pharmaceutics 2020, 17, 3589‐3599, DOI. 10.1021/acs.molpharmaceut.0c00629)は、コンピュータシミュレーションを用いて製剤賦形剤と溶液中のタンパク質との相互作用を記述する能力を開示している。これにより、新しい抗体治療薬の開発の早い段階で製剤設計を始めることができる。
そのようにするために、それは機械学習アプリケーションで使用するために抗体表面の局所領域を数値的に記述する特徴セット(feature set)を開示する。
【0009】
別のアプローチは、2020年12月2日にJournal of Pharmaceutical Sciencesに掲載されたレビュー「Prediction Machines: Applied Machine Learning for Therapeutic Protein Design and Development」に要約されている。それはタンパク質溶液の非線形濃度依存性粘度をよりよく理解し、タンパク質の酸化速度と脱アミド速度を予測し、目に見えない粒子を分類し、タンパク質の物理的安定性を比較するための機械学習モデルの適用について記述する。さらに、さまざまな機械学習アプローチを使用して、以前に公開されたデータの回帰と分類の改善されたモデリング結果をもたらす。
【0010】
別のアプローチは、国際特許出願WO2021/0413S4A1から知られており、これは、潜在的なタンパク質製剤の特性を予測するための方法を開示しており、この場合、製剤記述子のセットは、それぞれが前記タンパク質製剤特性についての異なる値範囲に対応する複数の所定のグループのうちの特定の1つに属するものとして分類される;記述子のセットを分類することは、記述子のセットの少なくとも第1の部分を第1の機械学習モデルへの入力として適用することを包含する。この方法はまた、分類に基づいて、異なるグループに対応する複数のモデルの中から第2の機械学習モデルを選択することを包含する。この方法はまた、選択されたモデルへの入力として製剤記述子のセットの少なくとも第2の部分を適用することによって、記述子のセットに対応するタンパク質製剤特性の値を予測することを包含する。この方法はまた、タンパク質製剤特性の値をユーザに表示させ、および/またはメモリに格納させることを包含する。
【0011】
ただし、これらの刊行物は、タンパク質溶液の粘度をシミュレートする方法を示しているが、いまだなおいくつかの重要な欠点を有する。まず、それらはすべて、データ、記述子、特性、または構造的な詳細のいずれかの形で、標的タンパク質に関する事前知識を必要とする。タンパク質開発者は、タンパク質候補に関する詳細情報を共有することに乗り気ではなく、またはそれらの情報は単純に利用できないため、これは重大な欠点である。これらのパラメータを得るための実験は、面倒で時間を要し、したがってコストがかかる可能性がある。さらに、タンパク質記述子の収集は複雑であり、タンパク質の特性を十分に反映しない可能性がある。製剤設計のタスクに関して、既存のアプローチの最も深刻な欠点は、固定タンパク質製剤の濃度依存性粘度を予測することに限定されており、ユーザが他の製剤を探索するのに役立つ実験計画を提供しないことである。したがって、現在の最先端技術では、他のタンパク質は言うまでもなく、他の賦形剤を伴う製剤を最適化するために、その予測から得られた洞察を直接使用する方法を提供しない。別の問題は、これらの文書が単一の賦形剤の使用のみを考慮していることである。賦形剤を組み合わせることは、異なる賦形剤が、類似の粘度低減効果を有する単一の賦形剤と比較して相乗的な粘度低減および/または改善されたタンパク質安定性を示す可能性があるので有益である。賦形剤の組み合わせは、上記の参考文献のモデルではカバーされていない。
【0012】
この特許出願の課題は、上記の問題を解決することである。タンパク質製剤の粘度を変化させるための最良の賦形剤または賦形剤の組み合わせを決定および特定するための、より効率的な機械学習ベースのアプローチを見出すことはさらなる課題である。タンパク質製剤の粘度を変化させるための最適な賦形剤または賦形剤の組み合わせを見出すための最良の実験デザインを特定するための機械学習アプローチを見出すことはさらなる課題である。
【発明の概要】
【0013】
発明の概要
この課題は、
少なくとも1つの未知のタンパク質を含有する製剤のための少なくとも1つの粘度変化賦形剤を、コンピュータを介して選択する方法であって、以下のステップ:少なくとも1つのタンパク質および任意に少なくとも1つの粘度変化賦形剤を含有するいくつかの既知の製剤の粘度を記述するデータベースから、データセットを提供すること;賦形剤のリストから少なくとも1つの賦形剤の表現を、コンピュータにより、インシリコシミュレーションを介して生成すること;生成された少なくとも1つの賦形剤の表現を使用してデータセット中のパターンを認識する、コンピュータ上で遂行される機械学習モデルを使用して、少なくとも1つの未知のタンパク質の提供されたデータに、認識されたパターンを適用することにより、少なくとも1つの未知のタンパク質および少なくとも1つの粘度変化賦形剤を含有する新しい製剤に対する、賦形剤のリストから選択された少なくとも1つの粘度変化賦形剤の粘度変化効果を評価すること;評価結果に応じて、取得基準に従ってリストから少なくとも1つの賦形剤を選択し、およびそれを未知のタンパク質に適用すること、を含み、ここで、少なくとも1つの未知のタンパク質の提供されたデータは、少なくとも1つの未知のタンパク質および任意に少なくとも1つの粘度変化賦形剤を一緒に含有するタンパク質組成物の粘度を記述するデータである、前記方法
によって解決された。
【0014】
この手順は、最先端のアプローチと比較して、タンパク質賦形剤製剤の粘度を探索するためのより効率的な方法を提供する。主な利点は、訓練された機械学習モデルを使用することにより、使用される賦形剤が到達する結果として生じる粘度をそれぞれ決定するために行う必要がある実際のラボテストの数を大幅に削減できることである。そのようにするために、使用されるモデルは、表現の作成に使用されるデータセットの賦形剤のリストから追加された少なくとも1つの粘度変化賦形剤の粘度変化効果を評価する。評価の1つの選択肢は、未知のタンパク質と賦形剤の最も好適な組み合わせを選択できるように、モデルがすべての可能な賦形剤(データセットに使用される賦形剤)の結果の粘度を予測することであるが、モデルがリストから選択された賦形剤の結果の粘度を予測するか、または他の評価方法を用いることもできる。モデルの予測精度が高いほど、実行される必要のある、時間、リソースを消費する実際の試験が少なくなる。モデルの予測精度は、通常、提供される粘度測定の数とともに増加する。利用可能な測定値がないか、またはごくわずかである場合、機械学習モデルは、主に、賦形剤表現および他の既知の製剤のデータ、好ましくは新しい製剤に類似したものを使用する。
【0015】
機械学習モデルが新しい製剤の粘度を予測し、最も好適な賦形剤が選択された後、製剤のグラウンドトゥルース(ground truth)粘度を測定し、それぞれのデータがモデルにフィードバックされて、後続の予測の精度を高めるように使用されることができる。機械学習モデルを走らせるには、プロセッサとそれぞれの作業用メモリとストレージメモリを備えたすべての標準的なパーソナルまたは産業用コンピュータを使用できる。インシリコシミュレーションと機械学習モデルの実行に同じコンピュータを使用することは可能であるが、ほとんどの場合、それぞれのアプリケーションを実行するように特別に構成された2つの異なるコンピュータを使用する方が効率的である。十分性の基準は、例えば、粘度を最も低減させると予測される賦形剤、または最大の情報利得をもたらすような賦形剤を示唆することができる。タスクの解決策はまた、コンピュータ可読記憶媒体に格納され、コンピュータによって遂行されたとき、コンピュータに前のチャプタにおいて開示された方法ステップを実施させる命令を含むソフトウェア製品を含む。
【0016】
本明細書で定義されるように、「未知のタンパク質」とは、記述された方法によって試験されるべきタンパク質を意味する。これらのタンパク質について、特定のタンパク質記述子のような特性および/または特徴は、開示された方法が実行される時点では必ずしも知られていない。特に、未知のタンパク質は、上述の方法のデータベースにないタンパク質である。より詳細には、少なくとも1つの未知のタンパク質を含有し、および、任意に少なくとも1つの粘度変化賦形剤を含有するタンパク質組成物の粘度を記述するデータを除いては、粘度変化賦形剤の有無にかかわらず、包括的な粘度測定は利用できないが、それは上記のメソッドに提供されるデータとして必要である。使用されるタンパク質に関する特定の情報を知る必要がなく、その結果、未知のタンパク質も使用できることは、既知の先行技術に対する開示された方法の利点の一つである。その対極は、「少なくとも1種のタンパク質および任意に少なくとも1種の粘度変化賦形剤を含有する既知の製剤」であり、タンパク質自体およびその特性および/または特徴の一部または全部が既知であるタンパク質組成物を指す。特に、それらのタンパク質はデータベースにあり、より詳細には、粘度を変化させる賦形剤の有無にかかわらず粘度測定が可能である。任意に、製剤は1つ以上の既知の粘度変化賦形剤を含むことができる。
【0017】
本明細書で定義されるように、「少なくとも1つの未知のタンパク質および少なくとも1つの粘度変化賦形剤を含有する新しい製剤」とは、上記で定義される未知のタンパク質および少なくとも1つの粘度変化賦形剤を含有するタンパク質組成物を指す。製剤は、1つ以上の既知の粘度変化賦形剤を含有する。本発明によれば、上記で定義したような新しい製剤の粘度が予測される。好ましくは、複数の製剤の粘度が予測され、例えば、少なくとも1つの未知のタンパク質および少なくとも1つの粘度変化賦形剤Aを含有する製剤および少なくとも1つの未知のタンパク質および少なくとも1つの粘度変化賦形剤Bを含有する製剤が予測される。より好ましくは、考えられるすべての製剤の粘度が予測される。この文脈において、「すべての可能な組み合わせ」とは、データセットを生成するために使用される賦形剤のリストから選択された少なくとも1つの粘度変化賦形剤と少なくとも1つの未知のタンパク質とのすべての組み合わせを意味する。さらなる実施態様では、少なくとも1の粘度変化賦形剤群が賦形剤のリストから選択される。
【0018】
本明細書で定義されるように、「提供される少なくとも1つの未知のタンパク質のデータ」とは、粘度変化賦形剤無し、または少なくとも1つの粘度変化賦形剤有りで、少なくとも1つの未知のタンパク質を含有するタンパク質組成物の粘度を記述するデータである。この文脈において、「粘度を記述するデータ」とは、タンパク質組成物の少なくとも1つの粘度測定によって作成されるデータを意味する。タンパク質組成物は、少なくとも1つの未知のタンパク質を含有し、ここで、タンパク質自体およびその特性および特徴は未知である。任意に、タンパク質組成物は、1つ以上の既知の粘度変化賦形剤を含有することができる。1以上の既知の粘度変化賦形剤は、データセットの生成にも使用された粘度変化賦形剤である。
【0019】
提供される少なくとも1つの未知のタンパク質のデータは、タンパク質の記述子や特性には言及していない。他の手法で使用されるようなタンパク質記述子の収集は複雑であり、タンパク質の特性をうまく反映していないかもしれない。
【0020】
さらに、タンパク質開発者はタンパク質候補の機密情報を共有する必要がない。また、コストのかかるMDシミュレーションやホモロジーモデリングを避けることができる。さらに、他の方法で必要とされるようなタンパク質の構造的な詳細は、利用できないかもしれない。本発明の好ましい実施態様では、必要なのは粘度測定の限定されたセット、1つの粘度測定のみ、または粘度測定は必要ない。
【0021】
本発明の有利な、したがって好ましいさらなる展開が、関連するサブクレーム、記述および関連する図面から現れる。
【0022】
開示された方法のそれらの好ましいさらなる展開の1つは、データセットが実験測定によって生成され、コンピュータを介してデータベースに格納されることを含む。実際のラボテストは、後で機械学習モデルによって使用されるデータセットを生成するための推奨される方法でもある。このデータセットがより精度が高く代表的なものであるほど、機械学習モデルの結果は優れている。この点は、既知の製剤の粘度および賦形剤を含有するデータセットと、新しい製剤のデータセットの両方を説明する。
【0023】
開示された方法の好ましいさらなる展開の別の1つは、新しい製剤(8)の粘度を最も十分に変化させるリストからの少なくとも1つの賦形剤として、リストからの2以上の賦形剤の組み合わせが使用されることを含む。
2以上の賦形剤の組み合わせは、異なる賦形剤が類似の粘度低減効果を有する単一の賦形剤と比較して相乗的な粘度低減および/または改善されたタンパク質安定性を示すかもしれないので有益であり得る。
【0024】
開示された方法の好ましいさらなる展開の別の1つは、特定の実験測定が製剤スペシャリストに提案され、製剤スペシャリストは、予測された粘度を検証するためにラボでこれらのそれぞれの実験を行い、検証された結果を、コンピュータを介してデータベース内の提供されたデータセットに追加することにより、機械学習モデルを訓練することを含む。さらに、機械学習モデルから予測された粘度値は、製剤スペシャリストに提案することもできる。言及された新しい製剤における結果としての粘度の測定は、好ましくは製剤スペシャリストによって遂行される。スペシャリストがロボット機械とソフトウェアにサポートされて測定を実行することも可能である。好適なハードおよびソフトウェアがあれば、測定は完全に自動で実行することもまたできる。
【0025】
開示された方法のそれらの好ましい更なる展開の別の1つは、賦形剤なしの新しい製剤および/または既に検証された賦形剤の粘度を記述する初期データが、新しい製剤データの提供データとして使用されることを含む。より具体的には、新しい製剤について、例えば以前の測定または他の情報源から既に知られているデータがある場合、このデータは機械学習モデルに提供され、これにより、正確な予測を達成するために必要な試験または測定の量がさらに低減される。
【0026】
開示された方法の好ましいさらなる展開の別の1つは、機械学習モデルが、少なくとも1つのプロトタイプタンパク質製剤の粘度を記述するデータセットと、少なくとも1つの賦形剤またはそれらの組み合わせの表現とを組み合わせることによって作成および訓練されることを含む。最初に機械学習モデルを作成するために使用されるデータセットは、既知の製剤とそれらの賦形剤を含むものである。機械学習モデルが、新しい、おそらく未知の製剤の粘度を予測するために使用される場合、機械学習モデルはさらに、賦形剤の有無にかかわらず、その製剤の既知の特性(入手可能な場合)、および/または、確認ラボテストの結果得られた実験測定データによって訓練される。既知の特性が必要なデジタル表現形式で利用できない場合は、それらをそれぞれ変換する必要がある。
【0027】
開示された方法の好ましいさらなる展開の別の1つは、所与のタンパク質製剤の粘度値がガウス過程の形態でモデル化され、モデル予測がベイズ最適実験計画によって製剤スペシャリストを導くために使用されることを含む。この導きにより、次いで、製剤スペシャリストは、機械学習モデルによって提案された賦形剤またはその組み合わせについて必要な測定を実行することができる。
【0028】
開示された方法の好ましいさらなる展開の別の1つは、コンピュータ上での機械学習モデルの訓練が、以下のステップ:訓練データの周辺尤度を最大化することによって、データセットからの訓練データで機械学習モデルパラメータを最適化すること;機械学習モデルに基づいて、未試験の賦形剤またはその組み合わせの粘度値の事後分布を評価し、それによって粘度を予測すること;計算された事後分布から得られる取得スコアを最適化することにより、賦形剤またはその組み合わせの新しいセットを選択すること;新しい賦形剤またはその組み合わせを製剤スペシャリストに提案し、製剤スペシャリストは次いでラボでそれぞれの実験を行い、得られた粘度を測定すること;および得られた測定値を訓練データに加えることを少なくとも1回実行することによって行われることを含む。
【0029】
開示された方法の好ましいさらなる展開の別の一つは、粘度値の事後分布から得られる粘度の予測が、考慮された製剤に使用される賦形剤を特徴付けるpH依存特徴ベクトルおよび使用される賦形剤濃度レベルに基づいていることを含む。これは、機械学習モデルが粘度を予測する最も好ましい方法を表す。しかし、機械学習モデルはこの方法に限定されるものではない。粘度値を予測する別の方法がある場合、それらを機械学習モデルに組み込んで実行することができる。
【0030】
開示された方法の好ましいさらなる展開の別の1つは、取得基準が、どの粘度変化賦形剤が粘度を最も低減させると予想されるかを査定することを含む。代替的な実施態様は、例えば、最大の情報利得をもたらすと期待される実験、最大のモデル変化をもたらす実験、観察された最良の設定のレベルを超えて製剤粘度を改善する最大の確率を提供する実験、現在の最適な製剤化に対する最大の期待される改善をもたらす実験、または製剤探索空間の探索とこれまでに収集された知識の利用との間の他の任意の体系的なトレードオフを提供する実験を示唆する他の取得基準を包含してもよい。
【0031】
開示された方法の好ましいさらなる展開の別の1つは、少なくともタンパク質、少なくとも1つの粘度変化剤、少なくとも1つの緩衝剤、少なくとも1つの安定剤および少なくとも1つの界面活性剤を水溶液中に含有するタンパク質製剤中で粘度を測定することを含む。このコンポーネントの組み合わせは最も一般的なものであり、したがって好ましく使用される。しかしながら、請求される方法に必要なおよび/またはより好適な他の組み合わせがあれば、それらもまた使用することができる。
【0032】
開示された方法の好ましいさらなる展開の別の1つは、賦形剤の表現が、分子フィンガープリントと同様に物理的パラメータの形でコンピュータにより生成されることを含む。物理的パラメータは、機械学習モデルがパラメータを処理し、特定のタンパク質製剤においてそれらが引き起こす粘度を予測するために使用できるように、賦形剤およびその特性を記述する。可能なパラメータには、電荷分布、双極子モーメント、四極子モーメントのトレースと異方性、分極率、分子ロンドン分散係数(C6)、logP水/ヘキサン分配係数、溶媒アクセス可能表面積、分子軌道エネルギーHOMO-LUMOギャップなどが包含されるが、これらに限定されない。
【0033】
この特許出願の課題に対するもう一つの解決策は、コンピュータ上で遂行される機械学習モデルであり、これは前の章で記述したように作成され、訓練される。
【0034】
開示された機械学習モデルの好ましいさらなる展開の別の1つは、ガウス過程を、同じ目的を果たす他の任意のモデルアーキテクチャ、特に他のタイプの確率過程、一般化線形モデル、ニューラルネットワーク、サポートベクターマシン、ツリーベースモデル、アンサンブルモデルなどに置き換えることを含む。
【0035】
発明の詳細な記述
本発明による方法、機械学習モデル、およびソフトウェア製品、ならびにそれらの機能的に有利な展開について、少なくとも1つの好ましい例示的な実施態様を用いて、関連する図面を参照しながら以下にさらに詳細に記述する。図面において、互いに対応する要素には同じ参照数字が付されている。
図面は以下を示す:
【図面の簡単な説明】
【0036】
【
図2】
図2は関係するシステムコンポーネントの概要。
【
図4】
図4は本発明手法の実行性能を示す結果チャート。
【0037】
この問題に対する解決策は、データ主導の意思決定をなすユーザが、製剤の課題を解決できるようにするソフトウェアツールである。このツールは3つのコンポーネントで構成されている:
1.実験データ10:様々なプロトタイプのタンパク質製剤の粘度が測定され、600データポイント(data points)のデータセット1が生成された。
2.賦形剤2を、関連する物理的パラメータと分子フィンガープリントの形で表現する。これらはインシリコシミュレーションを通じて生成され、実験的にクロスバリデーションされた。
3.ステップ2からの表現2を使用して、ステップ1からのデータにおけるパターンを認識し、新しいタンパク質賦形剤製剤8の粘度3を予測する機械学習モデル5。
【0038】
開発されたソフトウェアツール7との意図された相互作用を
図1に概略的に記述する。
図2は、参加するハードウェアの概要を示している。必要な実験装置を除けば、ハードウェアは主に、使用される機械学習モデル5を操作するソフトウェア7をホストする好適なコンピュータ6から構成される。それぞれのソフトウェア7と共に使用するのに適切なあらゆる種類のコンピュータ6、例えば標準的なパーソナルコンピュータや産業用PCを使用することができる。
データセット1は、タンパク質を含有する溶液/製剤8の粘度、および同じタンパク質溶液を含有し、およびさらに少なくとも1つの粘度低減賦形剤2を含有する溶液の粘度を測定することによって生成される。好ましくは、少なくとも1つの粘度低減賦形剤2は、単一の粘度低減賦形剤または2つの粘度低減賦形剤の組み合わせである。
【0039】
粘度低減の測定には、粘度低減賦形剤2または粘度低減賦形剤の組み合わせを含有しないタンパク質組成物の粘度を、粘度低減賦形剤または粘度低減賦形剤の組み合わせを含有するタンパク質組成物の粘度と比較する。
測定は、定義された濃度の異なるタンパク質を用いて実行される。異なる粘度低減賦形剤2または粘度低減賦形剤の組み合わせを定義された濃度で使用する。
【0040】
通常、タンパク質組成物は液体組成物であり、さらに少なくとも1つの緩衝剤と少なくとも1つの安定剤を含有する。緩衝剤およびpHはタンパク質に応じて選択され、pHは通常NaOHまたはHClを用いて調整される。組成物はさらに、薬学的に許容される希釈剤、溶媒、担体、接着剤、結合剤、保存剤、可溶化剤、安定剤、界面活性剤、浸透促進剤、乳化剤または生物学的利用能増強剤を含んでもよい。当業者9は、液体組成物に適切な添加剤およびパラメータを選択する方法を知っている。
【0041】
好ましい実施態様において、本発明による組成物は液体製剤8であり、タンパク質は治療用タンパク質である。
治療用タンパク質には、抗体医薬、Fc融合タンパク質、抗凝固剤、血液因子、骨形成タンパク質、人工タンパク質足場、酵素、成長因子、ホルモン、インターフェロン、インターロイキン、抗体薬物複合体(ADC)、血栓溶解剤などが包摂される。治療用タンパク質は、天然に存在するタンパク質であることもあれば、組換えタンパク質であることもある。その配列は天然のものであることも、人工的に作られたものであることもある。
特に好ましい実施態様では、本発明による組成物および製剤中のタンパク質は抗体、特に治療用抗体である。
さらに特に好ましい実施態様において、本発明による組成物および製剤中のタンパク質は、血漿由来タンパク質、特にIgGまたはhyperIgGである。血漿タンパク質を含有するいくつかの医薬製剤は、異なる血漿タンパク質の混合物で構成される。
【0042】
本明細書において「血漿由来タンパク質(plasma derived proteins)」という用語は、血漿分画によりドナーの血漿から得られるタンパク質を指す。前記ドナーは、ヒトまたは非ヒトであり得る。血漿タンパク質の一例は、免疫グロブリンである。
本明細書において「IgG」という用語は、免疫グロブリンG型を指す。本明細書において「IgM」という用語は、免疫グロブリンM型を指す。本明細書において「IgA」という用語は、免疫グロブリンA型を指す。
本明細書において「ハイパーIgG」という用語は、特定の疾患に感染した、またはワクチン接種を受けたドナーから精製されたIgGの製剤を指す。前記ドナーはヒトであっても非ヒトであってもよい。
本明細書において「抗体」という用語は、モノクローナル抗体(全長または無傷(intact)なモノクローナル抗体を包含する)、ポリクローナル抗体、多価抗体、多重特異性抗体(例えば、二重特異性抗体)、および抗体断片を指す。
【0043】
抗体フラグメントは、無傷の抗体の一部のみを含み、一般に無傷の抗体の抗原結合部位を包含するため、抗原結合能を保持する。本定義に包摂される抗体フラグメントの例は、以下:Fabフラグメント、Fab'フラグメント、Fdフラグメント、Fd'フラグメント、Fvフラグメント、dAbフラグメント、単離されたCDR領域、F(ab')2フラグメント、ならびに単鎖抗体分子、ダイアボディ、直鎖抗体を包含する。
一実施態様では、タンパク質はバイオシミラーである。「バイオシミラー」とは、本明細書において、既に承認されている別の生物学的医薬品と高度に類似している生物学的医薬品として定義される。好ましい実施態様において、バイオシミラーはモノクローナル抗体である。
一実施態様において、本発明による組成物および製剤は、1種以上のタンパク質種を含む。
本発明は、特定の分子量範囲のタンパク質に限定されない。好ましくは、タンパク質分子量は120kDa~250kDaの間、好ましくは130kDa~180kDaの間である。
【0044】
粘度低減賦形剤2による粘度低減を試験するために、溶液8の粘度を増加させる1つ以上のタンパク質濃度が選択される。結果溶液8の粘度は、少なくとも20~25mPas-1の粘度を有するべきである。
【0045】
好ましい実施態様において、本発明による組成物および製剤中のタンパク質濃度は、少なくとも1mg/ml、少なくとも50mg/ml、好ましくは少なくとも75mg/ml、およびより好ましくは少なくとも100mg/mlである。別の好ましい実施態様において、タンパク質濃度は90mg/ml~300mg/mlの間であり、より好ましくはタンパク質濃度は100~250mg/mlの間であり、さらに好ましくは120~210mg/mlの間である。本発明は、これらの高濃度タンパク質組成物に特に有用である。
【0046】
データセットを生成するタンパク質の選択には制限はない。例えば、以下のタンパク質: セツキシマブ、エボロクマブ、インフリキシマブ、レスリズマブ、エタネルセプト(融合タンパク質)を使用してデータセットを設定することができる。
【0047】
本明細書で定義されるように、「粘度」は、物質(substance)(典型的には液体)の流れに対する抵抗を指す。粘度は、ずり応力の概念に関する;それは、ずり応力を発揮する流体の異なる層の、互いに対する、または、他の表面に対する、それらが互いに対抗して移動するときの、効果として理解され得る。数個の粘度基準が存在する。粘度の単位は、パスカル秒(Pa-s)としても知られる、Ns/m2である。粘度は、「運動学的」または「絶対的(absolute)」であってもよい。運動学的な粘度は、運動量が流体を通して伝わる速度の基準である。それは、ストークス(St)で測定される。運動学的な粘度は、重力の影響下で、流体の流れ抵抗の基準である。
等しい容積および異なる粘度の2つの流体は、同一のキャピラリー粘度計に配置され、および、重力によって流れることが可能となると、より粘度の高い流体は、より粘度の低い流体がキャピラリーを通って流れるよりも、長い時間がかかる。もし、例えば、1つの流体が、その流れを完了するのに200秒(s)かかり、および、別の流体が400sかかるのであれば、第二の流体は、運動学的粘度スケールで、第一のものよりも2倍粘度が高い。運動学的な粘度の寸法は、長さ2/時間である。一般的に、運動学的な粘度は、センチストークス(cSt)で表される。運動学的な粘度のSI単位は、mm2/sであり、これは、1cStに等しい。「絶対的粘度」(ときには「動的粘度」または「単純粘度」と呼ばれる)は、運動学的粘度および流体密度の産物である。絶対的粘度は、センチポイズ(cP)の単位で表される。絶対的粘度のSI単位は、ミリパスカル-秒(mPa-s)であり、ここで、1cP=1mPasである。
【0048】
粘度は、例えば粘度計を用いて所与のせん断速度または複数のせん断速度で測定することができる。「ゼロずり外挿(extrapolated zero-shear)」粘度は、絶対粘度対せん断速度のプロット上の4つの最高ずり点のベストフィット線を作成し、粘度をゼロずりまで直線的に外挿することによって決定することができる。あるいは、ニュートン流体については、複数のせん断速度における粘度値を平均することによって粘度を決定することができる。粘度はまた、マイクロ流体粘度計を使用して、単一または複数のせん断速度(流量とも呼ばれる)で測定することもでき、ここで絶対粘度は、液体が流路を流れるにあたっての圧力の変化から得られる。粘度は、せん断速度に対するずり応力に等しい。マイクロ流体粘度計で測定された粘度は、いくつかの実施態様では、外挿されたゼロずり粘度、例えば、コーンおよびプレート粘度計を使用して複数のせん断速度で測定された粘度から外挿された粘度と直接比較することができる。本発明によれば、上記の方法の少なくとも1つが安定化効果を示す場合、組成物および製剤8の粘度は低減する。好ましくは、粘度はmVROC(商標)Technologyを用いて20℃で測定される。より好ましくは、粘度は20℃でmVROC(商標) Technologyを用いて測定される。最も好ましくは、粘度は、mVROC(商標)技術を使用し、500μlのシリンジ、3000s-1または2000s-1のせん断速度、および200μlの容量を使用して、20℃で測定される。当業者であれば、mVROC(商標) テクノロジーを用いた粘度測定、特に上記のパラメータの選択に精通している。詳細な仕様、方法、設定は、901003.5.1-mVROC_User's_Manualに記載されている。
【0049】
本明細書において「せん断速度」(shear rate)とは、流体のある層が隣接する層の上を通過する際の速度の変化率をいう。速度勾配は、プレートからの距離による速度の変化率である。この単純なケースは、(cm/sec)/(cm)=1/secの単位で、せん断速度(v1-v2)/hの一様な速度勾配を示している。したがって、せん断速度の単位は秒の逆数、または一般的には時間の逆数である。マイクロ流体粘度計の場合、圧力と流量の変化はせん断速度に関係する。「せん断速度」とは、材料が変形する速度のことである。タンパク質および粘度低減剤を含有する製剤8は、典型的には、コーンおよびプレート粘度計と、目的のサンプルの粘度範囲の粘度を正確に測定するために当業者によって適切に選択されたスピンドルを使用して測定する場合、約0.5s-1から約200s-1の範囲のせん断速度で測定される(すなわち、DV2T粘度計(Brookfield)に取り付けたCPE40スピンドルで、20cPのサンプルが最も正確に測定される);マイクロ流体粘度計を使用して測定する場合、約20s-1~約3,000s-1より大きい。
【0050】
古典的な「ニュートン」流体は、本明細書で一般に使用されるとき、粘度は、本質的にせん断速度とは無関係である。しかしながら、「非ニュートン流体」について、粘度は、増大するせん断速度とともに、減少するかまたは増加するかのいずれかであり、例として、流体は、夫々「ずり流動化」または「ずり増粘」である。濃縮(すなわち、高濃度)タンパク質溶液の場合、これは、偽塑性ずり流動化挙動(すなわち、せん断速度とともに速度の低下)として明らかとなり得る。
【0051】
ある実施態様において、本発明の組成物および製剤は、少なくとも1の第1の賦形剤を含まない同一の組成物と比較して、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%または75%の粘度の低減を示す。
ある実施態様において、本発明の組成物および製剤は、少なくとも1の第1の賦形剤および少なくとも1の第2の賦形剤2を含まない同一の組成物と比較して、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%または75%の粘度の低減を示す。
【0052】
本発明はさらに、粘度が1mPas~60mPas、好ましくは1mPas~50mPas、より好ましくは1mPas~30mPas、最も好ましくは1mPas~20mPasである、本発明による医薬製剤8を提供する。
組成物は通常、4~8の間、好ましくは5~7.2の間のpHを有する。一実施態様では、組成物および製剤8は、正確に5または正確に7.2のpHを有する。pHはタンパク質に応じて選択され、pHは通常NaOHまたはHClを用いて調整される。当業者は、タンパク質組成物のpHを選択する方法を知っている。
【0053】
少なくとも1つの安定剤は、タンパク質の安定性を高めるのに好適な化合物である。好適な安定剤は当該技術分野で知られており、好適な糖および/または界面活性剤を包含する。安定剤として好適な糖は、文献において公知であり、例えば、スクロースまたはトレハロースである。好ましい実施態様において、糖はスクロースである。好適な界面活性剤は、文献において例えばポリソルベート20またはポリソルベート80またはポロキサマー188などと知られている。別の好ましい実施態様では、界面活性剤はポリソルベート80である。さらなる安定剤の添加は、本発明による組成物の製剤8の効果をさらに増幅する。好ましくは、糖は50~100mg/ml、より好ましくは50mg/mlのスクロースの濃度を有する。好ましくは、界面活性剤は、0.01~0.2mg/ml、より好ましくは0.05mg/mlのポリソルベート80の濃度を有する。
タンパク質溶液に好適な少なくとも1つの緩衝剤を加えて緩衝液を調製する。好適な緩衝剤は当該技術分野で知られており、例えば、酢酸-クエン酸塩-またはリン酸塩リン酸塩緩衝剤である。緩衝液の濃度は通常1~50mMである。
【0054】
本発明によれば、「粘度変化賦形剤2(viscosity changing excipient 2)」とは、液体製剤の粘度に影響を与えることができる化合物である。この定義には、以下に定義する濃度範囲で製剤8に添加したときに液体製剤8の粘度を低減させるのに好適な「粘度低減賦形剤2」が包含される。好ましくは、液体製剤8はタンパク質溶液である。
【0055】
データセット1を作成するための粘度低減賦形剤2の選択に制限はない。以下の粘度低減賦形剤2:グアニジン塩酸塩、L-アルギニン、L-カルニチン塩酸塩、L-オルニチン塩酸塩、L-セリン、リジン、メグルミン、キニーネ塩酸塩、チアミン塩酸塩、アスコルビン酸、ベンゼンスルホン酸、カンファースルホン酸、チアミンピロリン酸塩、コハク酸ジナトリウム酒石酸ナトリウム、葉酸、グルコン酸、グルクロン酸、ピリドキシン、p-トルエンスルホン酸ナトリウム、チアミン一リン酸、尿素、アミノカプロン酸、カフェイン、シアノコバラミン、グリシン、イソロイシン、ロイシン、ニコチン酸アミド、フェニルアラニン、プロリン、塩化ナトリウム、バリン、を使用してデータセットを設定することができる。
【0056】
このような粘度低減剤は、タンパク質溶液8の粘度を低減させるのに好適な濃度で使用される。好ましい実施態様において、本発明による組成物および製剤中のタンパク質濃度は、少なくとも1mg/ml、少なくとも50mg/ml、好ましくは少なくとも75mg/ml、より好ましくは少なくとも100mg/mlである。別の好ましい実施態様において、タンパク質濃度は90mg/mlと300mg/mlの間であり、より好ましくはタンパク質濃度は100と250mg/mlの間であり、さらに好ましくは120と210mg/mlの間である。好ましくは、1つの粘度変化賦形剤2が、最大200mM、より好ましくは最大150mM、最も好ましくは75mMまたは150mMの濃度で使用される。2つの粘度変化賦形剤2が使用される場合、好ましくは、各々が最大150mMの濃度であり、より好ましくは、各々が最大100mMの濃度であり、最も好ましくは、各々が75mMの濃度である。結果として300mMを超える濃度レベルは好ましくないので、両方の賦形剤2の濃度は150mMを超えてはならない。何らかの理由で、好ましい2つの賦形剤2の間に不均等な分布がある場合、比率はそれぞれ変化する。2つ以上の賦形剤2が使用される場合も同じ規則に則る。これらの濃度レベルが粘度低減に最も効果的であり、したがって、好ましい。しかし、この方法はこれらの特定の値に限定されるものではない。
【0057】
賦形剤データセット1は、簡素化された分子入力ライン入力システム(simplified molecular-input line-entry system、SMILES)表現に基づいている。すべての粘度測定は、pH値によって特徴付けられる、定義された、しかし異なる環境で実行される。賦形剤のプロトン化の変化を取り入れるために、ChemAxons予測を使用してpH依存の微小種分布を生成する。pH依存性はpH4~pH8である。各微小種はMarvin molconverterを用いて三次元構造に変換される。三次元のトライアル構造から、室温で存在する水溶液中のすべてのコンフォーマのアンサンブルを計算する。このために、CREST アルゴリズムが採用されるが、これは、一般化されたボーン(born)および地表アクセス可能な領域の暗黙的溶媒和モデル (GFN2-xTB+GBSA(水))を包含する拡張タイトバインディングレベルの量子力学的ポテンシャルエネルギー曲面上で走るメタ力学、構造交差、焼きなまし法(simulated annealing)に基づくグローバル探索である。
【0058】
ゼロ点および熱力学的な寄与は、剛体-回転子-調和-振動子(rigid-rotor-harmonic-oscillator)(RRHO)モデルによって包含される。個々の形状は、2019.0.4パラメトライゼーション内の実溶媒のための導体のようなスクリーニングモデル(COSMO-RS)内の密度汎関数近似B97-3cでさらに精密化される。コンフォーマアンサンブルのボルツマン集団に使用される最終的な一点は、電子エネルギー、RRHO寄与、および溶媒和自由エネルギーで構成される。寄与率が1%以下の構造は無視される。
【0059】
これらの微小種アンサンブルは、密度汎関数理論レベルでの量子化学計算の基礎であり、電荷分布、双極子モーメント、四極子モーメントの軌跡と異方性、分極率、分子ロンドン分散係数(C6)、logP水/ヘキサン分配係数、溶媒アクセス可能表面積、分子軌道エネルギーHOMO-LUMOギャップなどの分子観測値をシミュレートする。これらの量子力学的特徴は、トポロジカル分子フィンガープリントのセットで補完される。この200の標準化されたフィンガープリントの拡張セットは、RDKitを使用して同じ微小種アンサンブルに基づいて生成される。共にこれによって、賦形剤2ごとに高次元のpH依存特徴ベクトルが得られる。
【0060】
開発された機械学習モデル5は、ラボで得られた実験データと計算されたインシリコ賦形剤の特徴を組み合わせて、製剤粘度の予測モデルを組み立てる。このモデル5に基づいて、最適な実験スケジュールが提供される。製剤スペシャリスト9は、これらの提案を使用し、推奨される実験10を実行し、続いて
図3に例示的に示すように、新たに得られた粘度データをシステムに供給する。このプロセスを通じて、粘度低減の可能性が最も高い製剤に焦点を当てて実験が遂行される。
【0061】
所与のタンパク質について、粘度値はガウス過程(GP)の形でモデル化され、モデル5の予測は、ベイズ最適実験計画によって製剤スペシャリスト9を導くために好ましい実施態様で使用される。このガイダンスはいくつかのステップ:
1.特定の賦形剤/賦形剤の組み合わせ(=訓練データ)に対する粘度測定値のセットが空である可能性がある場合、GPモデルパラメータは訓練データの周辺尤度(Marginal likelihood)を最大化することによって最適化される。
2.未試験の賦形剤/賦形剤の組み合わせの粘度値の事後分布は、GPモデルに基づいて評価される。
3.賦形剤/賦形剤の組み合わせの新しいセットは、計算された事後分布から得られる取得スコアを最適化することによって選択される。
4.賦形剤/賦形剤の組み合わせの新しいセットは製剤スペシャリスト9に提案され、製剤スペシャリストはその後、ラボでそれぞれの実験を行って、結果として得られる粘度を決定する。
5.取得された測定値が訓練データに追加され、プロセスがステップ1から繰り返される。
を含む。
【0062】
ステップ2の予測は、検討中の製剤8で使用される賦形剤2を特徴付けるpH依存の特徴ベクトルおよび賦形剤濃度レベルに基づいている。
この手順のステップ1~5の課題は、測定された粘度が、選択した賦形剤の組み合わせだけでなく、測定ごとに異なる可能性があるグラウンドトゥルースのタンパク質濃度にも依存することである。目標濃度からの偏差を考えるために、GPモデル5は絶対粘度値ではなく粘度の相対変化を予測するように設計されている。より正確には、賦形剤を使用しない実際のタンパク質濃度で達成される理論上の粘度レベルに対する相対的な粘度の低減を予測する。必要な理論値は、未製剤のタンパク質溶液の濃度依存性の粘度測定値から計算された指数回帰モデルから得られる。
【0063】
ステップ1~5で検討された実験計画は典型的な最適化手順に従うが、GPyTorch、BoTorch、GPflowなどの主要なソフトウェアスイートによって提供される既存のブラックボックスGPモデル5は、エンコードする必要がある特定のデータ特性のため所与のシナリオに適用できない。したがって、次のドメインおよび問題固有の特性を考えて、特殊なGPカーネル構造が設計されている。それらのプロパティは以下のとおりである:
・所与の製剤に含有される賦形剤2の組み合わせには自然な順序はない、つまり、賦形剤A+賦形剤Bを追加することは、賦形剤B+賦形剤Aを追加することと同等である。使用されるカーネルは、添加された賦形剤2に関して順列不変となるように設計されている。
・所与の製剤8には、さまざまな数の賦形剤2を含有することができる。カーネルは、柔軟な賦形剤の数を処理できるように構築されている。
・製剤8の誘発された粘度低減効果は、所与のタンパク質濃度と適用される賦形剤濃度の両方に依存する。これらの濃度への依存性は、使用されるカーネルの構造に明確に反映される。
・賦形剤2を組み合わせることで、各賦形剤の特性を通じては記述できない相乗的な粘度低減効果が得られ得る。個々の特徴次元の自動関連性検出に基づく一般的な汎用カーネル構造では、これらの多変量関係を十分に捉えることができない。測定データから未試験の賦形剤の組み合わせまでを一般化するために、使用されるカーネルはパラメーターフィッティングプロセス中に最適化される線形部分空間投影を使用する。
【0064】
特に難しいのは、予測された粘度3を新しいタンパク質に一般化することである。これは、タンパク質の全体的および局所的な相互作用を特徴付ける化学情報が欠落しているためである。したがって、さらに拡張された好ましい実施態様が推奨される。これは、タンパク質と賦形剤2の間の典型的な相互作用パターンを成すさまざまな製剤8の粘度測定値を含有するデータベースを含む。これらの相互作用パターンは、一致するタンパク質と賦形剤のパターンの予測にバイアスを与える追加のカーネルコンポーネントの形で、新しいタンパク質の予測された粘度3のための事前情報として使用できる。
これを達成するための1つのアプローチは、他にも可能ではあるが、固有の共同領域化モデルやその変形などのマルチタスクカーネルモデルを介してタンパク質の影響を捕捉することである。本発明の代替実施態様では、ガウス過程が他の機械学習モデルに置き換えられ、タンパク質全体を一般化するタスクを他の適切なモデルコンポーネントが引き継ぐことができる。
【0065】
以下では、次の実験がランダムに選択される無情報検索の実行と比較して、ソフトウェアツール7を使用することの利点を実証するために、特定の実施例が開示される。
目標は、タンパク質溶液8の粘度を指定された閾値以下に下げることである。市場で入手可能な賦形剤2の膨大な状況を前提にすると、好適な賦形剤の組み合わせを見出すのは困難である。すべての候補製剤を試験する徹底的なスクリーニング研究を回避するために、提案されたソフトウェアツール7の助けとともに、情報に基づいたデータ主導の検索が実施される。
【0066】
この目的を達成するために、次のステップ:
1)特定の製剤条件、特にpH値、およびどの賦形剤2が潜在的な候補として考慮され得るかが定義される。
2)少なくとも1つの粘度低減剤を伴わない新しいタンパク質を含有する溶液の濃度依存性の粘度測定が少数実行される。このデータはソフトウェアツール7に入力され、予測された粘度3に基づいて未製剤タンパク質の基本粘度曲線が推定される。
各測定を行った後にソフトウェアツール7を調べることによって、ユーザは次にどのタンパク質濃度を考慮すべきかを指示され、十分な量のデータが収集されるとその情報が得られる。
3)ソフトウェアツール7は、次に、試験すべき第1の賦形剤2または賦形剤の組み合わせを推奨する。ユーザはラボでそれぞれの実験10を行い、測定された粘度をツールに報告する。反復プロセスでは、ユーザは、十分に低い粘度を有する製剤8が見つかるまで、ツール7に報告された最新の測定値に応じてさらなる実験を実行するよう促される。
が遂行される。
【0067】
ツール7を使用する前に測定がすでに行われている場合、例えば:候補リストにない賦形剤2については、ユーザはプロセスを開始する前に対応する粘度を報告できる。それにより、ツール7は最初から改善された推奨事項をもたらせる。
【0068】
代替実施態様では、ユーザは、各反復後にソフトウェアツール7を調べる前に、一度にいくつかの実験を実行することができる。このいわゆる「バッチモード」では、ユーザは例えば研究室のリソースをスケジュールする目的で、次の反復中に並行して実行する希望の実験数を入力できる。次に、ソフトウェアツール7は、実験を同時に行うことによって得られる期待される情報利得を最適化するような方法で、その推奨を最適化する。
【0069】
図4は、ユーザが行った実験回数に応じて両方の検索戦略で達成された粘度の減少を示す。所与の例では、6つのタンパク質と33の賦形剤をカバーする合計629の実験が考慮された。試験したすべてのタンパク質の結果を平均するために、測定された粘度減少はタンパク質ごとに観察された最大の減少と比較して報告され、実験ステップ数はタンパク質ごとに行われた実験10の総数と比較して示される。数回の実験の繰り返しから得られた平均値(実線)と標準偏差(斜線領域)が示されている。これらの繰り返しは、ソフトウェアツール7に提供される初期測定の異なるセットと、ランダムベースライン戦略のための異なるランダム実験パスを考慮することによって得られる。
【0070】
必要なステップの理論的数と一致して、ランダム戦略は、すべての可能な実験の50%を行った後、予想される最適な賦形剤の組み合わせを見出す。発明されたアプローチを使用すると、この数を平均して半分に減らすことができる。
【0071】
本発明のさらなる実施態様は、上で提供された方法により選択された少なくとも1つの粘度変化賦形剤2を含有する新しい製剤8である。
【0072】
本発明のさらなる実施態様は、新しい製剤8および上記の方法により選択された少なくとも1つの粘度変化賦形剤2を含有する医薬製剤である。
【0073】
本発明のさらなる実施態様は、新しい製剤8および上記の方法により選択された少なくとも1つの粘度変化賦形剤2を含有する医薬製剤である。
【0074】
例
例1.実験データの生成/粘度測定
実験の一般的概念
データセット1の実験データを生成するために、さまざまなタンパク質組成物が調製され、さまざまな粘度低減賦形剤の粘度低減が試験された。
以下の市販のタンパク質:セツキシマブ、エボロクマブ、インフリキシマブ、レスリズマブ、エタネルセプト、を使用した。
以下の市販の粘度低減賦形剤2:塩酸グアニジン、L-アルギニン、塩酸L-カルニチン、塩酸L-オルニチン、L-セリン、リジン、メグルミン、塩酸キニーネ、塩酸チアミン、アスコルビン酸、ベンゼンスルホン酸、カンファースルホン酸、チアミンピロリン酸、コハク酸二ナトリウム、酒石酸二ナトリウム、葉酸、グルコン酸、グルクロン酸、ピリドキシン、p-トルエンスルホン酸ナトリウム、チアミン一リン酸、尿素、アミノカプロン酸、カフェイン、シアノコバラミン、グリシン、イソロイシン、ロイシン、ニコチン酸アミド、フェニルアラニン、プロリン、塩化ナトリウム、バリン、およびそれらの組み合わせを使用した。
以下に、インフリキシマブ溶液における粘度低減賦形剤2としてのバリンの粘度低減の測定を例示する。この特定の例の一般的な概念は、使用される他のすべてのタンパク質および粘度低減剤に取り込める。
【0075】
単一の粘度低減剤を使用した場合、粘度は一般に150mMの濃度で測定された。2つの賦形剤2の組み合わせを使用した場合、粘度は一般に各賦形剤の濃度75mMで測定された。場合によって、粘度低減賦形剤2の濃度は、賦形剤2の溶解度に応じて調整された。
使用するタンパク質に応じて、緩衝液、pH、タンパク質濃度、および任意の安定剤および/または界面活性剤が選択された。通常、タンパク質を含有する市販製品の緩衝剤、pH、安定剤および/または界面活性剤が使用された。タンパク質溶液を濃縮して、少なくとも20mPas-1の粘度を有する溶液を得た。場合によって、粘度は複数のタンパク質濃度で測定された。
【0076】
粘度測定
緩衝液調整
リン酸二水素ナトリウムおよびリン酸水素二ナトリウムを適切に混合してpH7.2を生じさせること、および、混合物を超純水に溶解することにより、5mMリン酸緩衝液を調製した。比率は、ヘンダーソン・ハッセルバルヒ式を使用して決定した。pHは、必要であれば、HClおよびNaOHを使用して調整した。50mg/mlスクロースおよび0.05mg/mlポリソルベート80は、安定剤として添加した。
【0077】
試料調製
個々の150mMバリンの賦形剤溶液をリン酸緩衝液pH7.2中に調製した。必要に応じて、HClまたはNaOHを使用してpHを調製した。
所望の賦形剤を含有する濃縮インフリキシマブ溶液を、遠心フィルター(Amicon、30kDaMWCO)を使用して調製し、元の緩衝液をそれぞれの賦形剤を含有する緩衝液と交換し、および、溶液8の容積を低減させた。タンパク質は、続いて、夫々122mg/mlおよび143mg/mlに希釈した。同様の方法で、バリンを含有しない点以外は同一のタンパク質溶液を調製した。
【0078】
タンパク質濃度の測定
タンパク質濃度は、ランベルト・ベールの法則を適用した吸収分光法を使用して決定された。賦形剤自体が280nmで強い吸光度を持っている場合は、ブラッドフォードアッセイが使用された。
濃縮タンパク質溶液は、測定時の予想濃度が0.3~1.0mg/mLの間になるように希釈した。
吸収分光法では、BioSpectrometer(登録商標)kinetic(Germany,Hamburg,Eppendorf製)を使用して、タンパク質吸光係数A0.1%、280nm=1.428で280nmでの吸光度を決定した。
一部の賦形剤2はそれ自体280nmで強い吸収を示すため、濃度測定にブラッドフォードアッセイを使用する必要がある。ブラッドフォードアッセイでは、Thermo Scientific(商標)(USA,Massachusetts,Waltham、Thermo Fisher製)のキットおよびウシガンマグロブリンスタンダードを使用した。吸光度は、Thermo Scientific(商標)(USA,Massachusetts,Waltham、Thermo Fisher製)を使用して595nmで測定した。タンパク質濃度は、125~1500μg/mlの標準曲線の線形回帰によって決定された。
【0079】
粘度測定
粘度測定には、mVROC(商標)Technology (USA, California, San Ramon,Rheo Sense製)を使用した。
測定は、500μlシリンジおよび3000s-1のせん断速度を使用して20℃で実行された。200μlの量を使用した。すべてのサンプルは3回繰り返して測定された。粘度低減は、バリンを含むタンパク質組成物とバリンを含まないタンパク質組成物の絶対粘度を比較することによって計算された。
【0080】
2.原料タンパク質溶液の濃度依存性粘度測定
以下に、インフリキシマブの濃度依存性粘度の測定を例に挙げる。この特定の例の一般的な概念は、他のすべてのタンパク質に取り込める。
緩衝液とサンプルの調製は上記のように実行された。続いて、タンパク質をそれぞれ13、30、42、68、79、80、103、110、117.30、121、および148.2mg/mlに希釈した。ランベルト・ベールの法則を適用した吸収分光法を使用したタンパク質濃度測定は、上記のように実行された。mVROC(商標)Technology(米国カリフォルニア州サンラモンRheoSense製)を使用して、異なるインフリキシマブ濃度の粘度測定を実行した。
【0081】
参照リスト
1 データセット
2 賦形剤(表現)
3 予測された粘度
4 選ばれた賦形剤(組み合わせ)
5 機械学習モデル
6 使用コンピュータ
7 ソフトウェアツール
8 新しい製剤
9 ユーザ(製剤スペシャリスト)
10 実験測定データ
11 未知のタンパク質
【国際調査報告】