(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025141184
(43)【公開日】2025-09-29
(54)【発明の名称】実験支援システム、実験支援方法、および実験支援プログラム
(51)【国際特許分類】
G16C 20/30 20190101AFI20250919BHJP
【FI】
G16C20/30
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2024040995
(22)【出願日】2024-03-15
(71)【出願人】
【識別番号】000004455
【氏名又は名称】株式会社レゾナック
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100128381
【弁理士】
【氏名又は名称】清水 義憲
(74)【代理人】
【識別番号】100169454
【弁理士】
【氏名又は名称】平野 裕之
(74)【代理人】
【識別番号】100144440
【弁理士】
【氏名又は名称】保坂 一之
(72)【発明者】
【氏名】永井 裕希
(57)【要約】 (修正有)
【課題】組成物を効率的に探索する実験支援システム並びに実験支援方法及びプログラムを提供する。
【解決手段】実験支援システムは、目的組成物を生成するための条件を示すパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、パラメータセットと特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新し、計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定し、新たなパラメータセットに基づく実験によって目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含むサンプルデータを用いて計算モデルを更新する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新し、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定し、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新する、
実験支援システム。
【請求項2】
前記少なくとも一つのプロセッサが、前記計算モデルの前記更新において、
前記実験によって得られた前記特性値を含む1以上のペアを実験サンプルグループとして前記サンプルデータから特定し、
前記実験サンプルグループを用いた前記回帰分析によって前記計算モデルを仮に更新し、
前記実験によって前記特性値が得られなかった1以上のパラメータセットのそれぞれについて、前記仮に更新された計算モデルにおいて該パラメータセットに対応する前記信頼区間に基づいて前記仮の特性値を設定し、該パラメータセットと該仮の特性値とのペアを生成し、
前記実験サンプルグループと、前記生成された1以上のペアにより構成される非実験サンプルグループとによって構成される前記サンプルデータを用いた前記回帰分析によって、前記計算モデルを更新する、
請求項1に記載の実験支援システム。
【請求項3】
前記少なくとも一つのプロセッサが、
前記更新された計算モデルに基づく最適化手法によって前記新たなパラメータセットを決定し、
前記新たなパラメータセットに基づいて前記新たな特性値が得られなかった場合に、前記新たなパラメータセットに対応する前記信頼区間と、前記最適化手法の目標値とに基づいて、前記仮の特性値を設定する、
請求項1または2に記載の実験支援システム。
【請求項4】
前記少なくとも一つのプロセッサが、前記新たなパラメータセットに対応する前記信頼区間において、前記目標値に対応する限界値から最も離れた値を、前記仮の特性値として設定する、
請求項3に記載の実験支援システム。
【請求項5】
少なくとも一つのプロセッサを備える実験支援システムによって実行される実験支援方法であって、
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新するステップと、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定するステップと、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新するステップと、
を含む実験支援方法。
【請求項6】
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新するステップと、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定するステップと、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新するステップと、
をコンピュータに実行させる実験支援プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の一側面は、実験支援システム、実験支援方法、および実験支援プログラムに関する。
【背景技術】
【0002】
組成物に関する実験を支援するためのコンピュータシステムが知られている。例えば特許文献1には、1以上のモノクローナル抗体(mAb)に関連する実験データおよび計算導出データに基づいて複数の候補予測モデルを決定することと、複数の候補予測モデルから最適な予測モデルを決定することとを含む方法を実施するように構成された計算デバイスと、予測モデルの出力を表示するように構成されたユーザデバイスとを備えるシステムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
組成物を生成するための条件を示すパラメータと該組成物の特性値との関係を示す計算モデルを更新しながら実験を繰り返す場合に、パラメータによっては実際には特性値が得られないことがある。このような状況が発生した場合にも組成物を効率的に探索するための仕組みが望まれている。
【課題を解決するための手段】
【0005】
本開示の一側面に係る実験支援システムは、少なくとも一つのプロセッサを備え、少なくとも一つのプロセッサが、目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、パラメータセットと特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新し、計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定し、新たなパラメータセットに基づく実験によって目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含むサンプルデータを用いて計算モデルを更新する。
【0006】
回帰分析によって得られる計算モデルではパラメータセットと特性値との関係が数学的に示される。しかし、実際には、パラメータセットに基づいて実験を行っても特性値を得られない場合があり得る。上記の側面においては、計算モデルの信頼区間を用いて仮の特性値を設定してサンプルデータを増やした上で計算モデルを更新することで、実験のための新たなパラメータセットを決定できる。その結果、組成物を効率的に探索できる。
【発明の効果】
【0007】
本開示の一側面によれば、組成物を効率的に探索できる。
【図面の簡単な説明】
【0008】
【
図1】実験支援システムの機能構成の例を示す図である。
【
図2】実験支援システムによる処理の例を示すフローチャートである。
【
図3】計算モデルの更新に関する第1の例を示すフローチャートである。
【
図4】計算モデルの更新に関する第2の例を示すフローチャートである。
【
図5】第1の例における計算モデルの更新の一場面を示す図である。
【
図6】第2の例における計算モデルの更新の一場面を示す図である。
【発明を実施するための形態】
【0009】
以下、添付図面を参照しながら本開示での様々な例を詳細に説明する。図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
【0010】
[システムの構成]
本開示に係る実験支援システムは、目的組成物を生成するための実験を支援するコンピュータシステムである。本開示において、目的組成物とは、実験者が所望の組成物を得るために生成を試みる組成物をいう。最終的には或る目的組成物が所望の組成物として採用され得る。実験支援システムは実験を支援するためにパラメータセットを決定する。パラメータセットとは、目的組成物を生成するための条件を示す1以上のパラメータの集合をいう。個々のパラメータは、組成物を生成するための原料の属性を示してもよいし、実験で行われるプロセスの条件を示してもよい。実験支援システムは、実験者が望むかもしれない目的組成物の生成が期待されるパラメータセットを自動で生成および提供する。このパラメータセットを用いることで、組成物を効率的に探索できると期待される。
【0011】
典型的には、パラメータセットに基づく実験によって、目的組成物が生成され、該目的組成物の特性を示す特性値が得られる。特性値は目的組成物の化学的または物理的な性質を示す値である。しかし、或るパラメータセットに基づく実験では、目的組成物を生成できなかったり、特性値を測定できなかったりする等の理由によって、目的組成物の特性値が得られないかもしれない。
【0012】
実験支援システムは、パラメータセットおよび特性値の1以上のペアを含むサンプルデータに基づいて、新たなパラメータセットを生成する。実験支援システムはそのサンプルデータを用いた回帰分析を実行して、パラメータセットと特性値との関係を示す計算モデルを生成し、その計算モデルに基づいて新たなパラメータセットを生成する。新たなパラメータセットとは、計算モデルを生成するために用いられた複数のペアのいずれによっても示されていないパラメータセットをいう。回帰分析とは入力と出力との関係を求める処理をいう。回帰分析によって得られる計算モデルは、パラメータセットと特定値との関係を推定する役割を担う。一例では、計算モデルは、入力値であるパラメータセットと出力値である特性値との関係を示す関数と、その関係がどれくらい確からしいかを示す信頼区間とを含む。すなわち、計算モデルはパラメータセットと特性値との関係を信頼区間と共に示す。
【0013】
実験者はその新たなパラメータセットに基づく実験を行う。この実験によって新たな特性値が得られた場合には、新たなパラメータセットと新たな特性値との新たなペアがサンプルデータに追加される。すなわち、サンプルデータはその新たなペアを更に含むように更新される。実験支援システムは更新されたサンプルデータに基づいて計算モデルを更新し、その更新された計算モデルに基づいて次の新たなパラメータセットを生成する。実験支援システムは、新たなペアの取得と、計算モデルの更新と、新たなパラメータセットの生成とを繰り返す。
【0014】
上記のとおり、実験が繰り返される間に、或るパラメータセットに基づく実験において特性値が得られない可能性がある。この場合には、実験支援システムはそのパラメータセットに対応する仮の特性値を設定する。そして、実験支援システムは、そのパラメータセットと仮の特性値との新たなペアが追加されたサンプルデータに基づいて、計算モデルを更新する。実験支援システムはその更新された計算モデルに基づいて次の新たなパラメータセットを生成する。実際の特性値が得られなかった場合にも、実験システムは計算モデルを更新して新たなパラメータセットを提供するので、実験者はその新たなパラメータセットに基づく実験を行うことができる。
【0015】
このように、実験者は実験支援システムを用いることで、実際の特性値が得られたか否かにかかわらず、実験を繰り返すことができる。したがって、組成物を効率的に探索することが可能になる。
【0016】
実験支援システムは1以上のコンピュータで構成される。複数のコンピュータが用いられる場合には、これらのコンピュータが例えばインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの実験支援システムが構築される。
【0017】
実験支援システムを構成するコンピュータは、一般にハードウェア装置としてプロセッサ、メモリ、および通信インタフェースを備える。プロセッサは例えばCPUであり、メモリはフラッシュメモリ、ハードディスク等で構成される。実験支援システムの各機能は、プロセッサが、メモリに格納されているプログラムを実行することで実現される。コンピュータは、キーボード、マウス等の入力装置と、モニタ、スピーカ等の出力装置とを更に備え得る。
【0018】
コンピュータを実験支援システムとして機能させるための実験支援プログラムは、実験支援システムの各機能モジュールを実現するためのプログラムコードを含む。この実験支援プログラムは、例えばCD―ROM、DVD―ROM、または半導体メモリの有形の記録媒体に非一時的に記録された上で提供されてもよい。あるいは、実験支援プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された実験支援プログラムは例えばメモリに記録される。
【0019】
図1は一例に係る実験支援システム10の機能構成を示す図である。この例では、実験支援システム10は、インターネット、イントラネット等の通信ネットワークを介してユーザ端末20と接続する。
【0020】
実験支援システム10はプロセッサ101およびメモリ102を備える。一例では、プロセッサ101は、取得部11、更新部12、決定部13、および選択部14として機能する。取得部11は一実験分の実験データを取得する機能モジュールである。取得部11はその実験データをメモリ102に格納する。更新部12はメモリ102に記憶されているサンプルデータを用いた回帰分析によって計算モデルを更新する機能モジュールである。更新部12はその計算モデルをメモリ102に格納する。決定部13は更新された計算モデルに基づいて新たなパラメータセットを決定する機能モジュールである。決定部13は新たなパラメータセットをメモリ102内のサンプルデータに追加し、該新たなパラメータセットをユーザに提示する。選択部14は、サンプルデータのうち最適な特性値に対応するパラメータセットを、最適解としてユーザに提示する機能モジュールである。
【0021】
ユーザ端末20は実験支援システム10のユーザ(例えば実験者)によって用いられるコンピュータである。ユーザ端末20は、パーソナルコンピュータ、ワークステーション、タブレット端末、スマートフォン、ウェアラブル端末等の様々なコンピュータであり得る。
【0022】
[システムの動作]
図2を参照しながら、実験支援システム10による処理の例を説明するとともに、本開示に係る実験支援方法の例を説明する。
図2はその例を処理フローS1として示すフローチャートである。処理フローS1は、メモリ102が、一回以上の実験によって得られた1以上の実際の特性値を含む実験データと、該実験データに基づくサンプルデータと、該サンプルデータを用いた回帰分析によって生成された現在の計算モデルとを記憶していることを前提とする。
【0023】
ステップS11では、取得部11が一実験分の実験データを取得する。ユーザはユーザ端末20を操作して、新たなパラメータセットに基づく実験の結果を実験データとして入力する。実験データは新たなパラメータセットを少なくとも含み、該パラメータセットに基づく実験によって得られた目的組成物の新たな特性値と、その実験によって新たな特性値が得られなかったことを示すフラグ情報とのうちのいずれか一方を更に含む。ユーザ端末20は実験データを実験支援システム10に送信し、取得部11はその実験データを受信してもよい。あるいは、ユーザ端末20は実験データを所定の記憶装置に格納して実験支援システム10に通知し、取得部11はその通知に応答して記憶装置からその実験データを読み出してもよい。いずれにしても、取得部11は一実験分の実験データをメモリ102に格納する。
【0024】
ステップS12では、更新部12がその実験データと既存のサンプルデータとを用いて計算モデルを更新する。
図3および
図4を参照しながら、この更新の詳細についていくつかの例を示す。
図3は計算モデルの更新に関する第1の例をステップS12Aとして示すフローチャートである。
図4はその更新に関する第2の例をステップS12Bとして示すフローチャートである。ステップS12A,S12BはいずれもステップS12の一例である。
【0025】
第1の例を説明する。ステップS1201では、更新部12が、実験データが新たな特性値を含むか否かを判定する。すなわち、更新部12は実験によって目的組成物の新たな特性値が実際に得られたか否かを判定する。実験データが新たな特性値を含む場合には(ステップS1201においてYES)、処理はステップS1202に進む。
【0026】
ステップS1202では、更新部12が実験データに基づいて、新たなパラメータセットおよび新たな特性値の新たなペアをメモリ102内のサンプルデータに追加する。この処理によってサンプルデータが更新される。
【0027】
一方、実験データが新たな特性値を含まない場合、すなわち実験データがフラグ情報を含む場合には(ステップS1201においてNO)、処理はステップS1203に進む。
【0028】
ステップS1203では、更新部12が現在の計算モデルに基づいて仮の特性値を設定する。更新部12は、新たなパラメータセットに対応する信頼区間を現在の計算モデルから特定し、その信頼区間に基づいて仮の特性値を設定する。
【0029】
ステップS1204では、更新部12が新たなパラメータセットと仮の特性値との新たなペアを、メモリ102内のサンプルデータに追加する。この処理によってサンプルデータが更新される。
【0030】
ステップS1202またはステップS1204の後に処理はステップS1205に進む。ステップS1205では、更新部12が、更新されたサンプルデータを用いた回帰分析によって計算モデルを更新する。ステップS1204においてサンプルデータが更新された場合には、更新部12は、新たなパラメータセットと仮の特性値との新たなペアを更に含むサンプルデータを用いて計算モデルを更新する。更新部12はガウス過程回帰、カーネル密度推定、または深層ニューラルネットワークを回帰分析のアルゴリズムとして用いて、パラメータセットと特性値との関係を示す関数を含む計算モデルを生成し得る。深層ニューラルネットワークによって生成される学習済みモデルは、関数の一例である。ガウス過程回帰、カーネル密度推定、および深層ニューラルネットワークのいずれを用いた場合にも、更新部12は信頼区間を含む計算モデルを生成し得る。例えば、更新部12は生成された関数についての分散に基づいて信頼区間を算出または設定する。
【0031】
次に第2の例を説明する。ステップS1211では、更新部12が、実験データが新たな特性値を含むか否かを判定する。この処理はステップS1201と同じである。実験データが新たな特性値を含む場合には(ステップS1211においてYES)、処理はステップS1212に進む。実験データが新たな特性値を含まない場合、すなわち実験データがフラグ情報を含む場合には(ステップS1211においてNO)、処理はステップS1212をスキップしてステップS1213に進む。
【0032】
ステップS1212では、更新部12が実験データに基づいて、新たなパラメータセットおよび新たな特性値の新たなペアをメモリ102内のサンプルデータに追加する。この処理はステップS1202と同じである。
【0033】
ステップS1213では、更新部12が、実験によって実際の特性値が得られなかったパラメータセットが存在するか否かを判定する。実際の特性値が得られなかったパラメータセットは、メモリ102に格納されており仮の特性値に対応する1以上のパラメータセットかもしれないし、ステップS11においてフラグ情報と共に取得されたパラメータセットかもしれない。
【0034】
実際の特性値が得られなかったパラメータセットが存在する場合には(ステップS1213においてYES)、処理はステップS1214に進む。そのようなパラメータセットが存在しない場合には(ステップS1213においてNO)、処理はステップS1214~S1216をスキップしてステップS1217に進む。
【0035】
ステップS1214では、更新部12が、実際の特性値を含む1以上のペアを実験サンプルグループとしてメモリ102内のサンプルデータから特定する。すなわち、実験サンプルグループは、目的組成物が生成されて該目的組成物の特性値が実際に得られた1以上の実験に対応する。
【0036】
ステップS1215では、更新部12が、仮の特性値を含む1以上のペアを用いることなく、実験サンプルグループを用いた回帰分析によって計算モデルを仮に更新する。ステップS1205と同様に、この処理においても、回帰分析のために様々なアルゴリズムが用いられ得る。ここでの回帰分析では仮の特性値が用いられないので、仮に更新された計算モデルでは、1以上の仮の特性値に対応する1以上のパラメータセットのそれぞれでは信頼区間が再び設定される。
【0037】
ステップS1216では、更新部12が、仮に更新された計算モデルに基づいて仮の特性値を設定して、非実験サンプルグループを設定する。更新部12は、実際の特性値が得られなかった1以上のパラメータセットのそれぞれについて次のように仮の特性値を設定する。すなわち、更新部12は、仮に更新された計算モデルにおいてパラメータセットに対応する信頼区間に基づいて仮の特性値を設定する。サンプルデータの一部として仮の特性値に関連付けられていたパラメータセットについては、その設定によって仮の特性値が更新され得る。フラグ情報と共に取得されたパラメータセットについては、仮の特性値が初めて設定される。更新部12はパラメータセットと設定された仮の特性値とのペアを生成する。更新部12は、生成された1以上のペアを非実験サンプルグループとして設定する。非実験サンプルグループは、目的組成物の特性値が得られなかった1以上の実験に対応する。
【0038】
更新部12は、特定された実験サンプルグループと設定された非実験サンプルグループとの集合を最新のサンプルデータとして特定する。この処理によってサンプルデータが更新される。
【0039】
ステップS1217では、更新部12が、更新されたサンプルデータ(すなわち、実験サンプルグループおよび非実験サンプルグループ)を用いた回帰分析によって計算モデルを更新する。この処理も、新たなパラメータセットと仮の特性値との新たなペアを更に含むサンプルデータを用いた計算モデルの更新の一例である。更新部12はステップS1215で用いられたアルゴリズムによる回帰分析を実行する。
【0040】
図2に戻って、ステップS13では、決定部13が、更新された計算モデルに基づいて新たなパラメータセットを決定する。一例では、決定部13はその計算モデルに基づく最適化手法によって新たなパラメータセットを決定する。決定部13は、計算モデルに基づいて予測される特性値が、計算モデルを生成するために使用された特性値、すなわち、更新されたサンプルデータによって示される複数の特性値よりも、最適化手法の目標値に近い値となるように、新たなパラメータセットを生成してもよい。目標値は、最適化手法によって扱われる最適化問題での最適値をいう。目標値の例として、最小化問題における最小値と、最大化問題における最大値とが挙げられる。あるいは、決定部13は、パラメータセットと特性値との関係の少なくとも一部において信頼区間が減少するように、新たなパラメータセットを生成してもよい。
【0041】
一例では、実験支援システムは計算モデルの更新と新たなパラメータセットの生成とを(すなわちステップS12,S13を)ベイズ最適化によって実行する。この場合、更新部12はガウス過程回帰を用いて、パラメータセットと特性値との関係を示す関数を推定し、その関数の信頼区間を算出する。決定部13はそのガウス過程回帰の結果に基づく所与の獲得関数を計算し、その獲得関数が最大になるパラメータセットを新たなパラメータセットとして生成する。
【0042】
ステップS14では、決定部13が新たなパラメータセットをユーザに提示する。一例では、決定部13はそのパラメータセットをユーザ端末20に送信する。ユーザ端末20はそのパラメータセットを受信および表示する。
【0043】
ステップS15に示すように、実験データの取得から新たなパラメータセットの提示までの一連の処理は繰り返し実行され得る。処理が繰り返される場合には(ステップS15においてNO)、実験者は新たなパラメータセットに基づいて実験を行う。実験者はこの実験の結果として、新たな特性値を特定するか、または特性値が得られなかったことを確認する。繰り返されるステップS11では、取得部11がその実験に関する新たな実験データを取得する。繰り返されるステップS12では、更新部12がその実験データと既存のサンプルデータとを用いて計算モデルを再び更新する。繰り返されるステップS13では、決定部13が更新された計算モデルに基づいて次の新たなパラメータセットを決定する。ステップS14では、決定部13がそのパラメータセットをユーザに提示する。このように、実験支援システム10は、パラメータセットと特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって計算モデルを繰り返し更新する。実験支援システム10は、計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定する。
【0044】
一連の実験が終わることを受けて新たなパラメータセットの提示を終了する場合には(ステップS15においてYES)、処理はステップS16に進む。ステップS16では、選択部14が最適解をユーザに提示する。例えば、選択部14はメモリ102内のサンプルデータを参照して、最適化問題の目標値に一致するかまたは該目標値に最も近い実際の特性値を特定し、この特性値に対応するパラメータセットをそのサンプルデータから選択する。選択部14はそのパラメータセットを最適解としてユーザに提示する。選択部14は選択されたパラメータセットと対応する特性値とのペアを最適解としてユーザに提示してもよい。一例では、決定部13は最適解をユーザ端末20に送信する。ユーザ端末20はその最適解を受信および表示する。実験者またはユーザはその最適解を参照して、追加の実験、検証、製品の設計または開発等のような後続の作業を行うことができる。
【0045】
図5および
図6を参照しながら、計算モデルの更新について更に説明する。
図5は第1の例における計算モデルの更新の一場面を示す図である。
図6は第2の例における計算モデルの更新の一場面を示す図である。
図5および
図6のいずれにおいても、回帰分析がガウス過程回帰であり、最適化手法がベイズ最適化であることを前提とする。
【0046】
図5は計算モデル200の更新を三つの状態ST11,ST12,ST13によって示す。計算モデル200は、パラメータセットxおよび特性値yの関係を示す関数fと、信頼区間と、獲得関数とを含む。
図5は、その関数f、信頼区間、および獲得関数をそれぞれ、曲線210、領域220、および曲線230で表す。
【0047】
更新部12は、パラメータセットと特性値との4個のペア201~204によって構成されるサンプルデータを用いたガウス過程回帰によって計算モデル200を更新する(ステップS1205)。状態ST11はその計算モデル200を示す。決定部13は、獲得関数が最大になる新たなパラメータセットxnewを生成する(ステップS13)。
【0048】
パラメータセットxnewに基づく実験により新たな特性値が得られなかったとする(ステップS1201においてNO)。この場合には、更新部12はパラメータセットxnewに対応する信頼区間221に基づいて仮の特性値を設定する(ステップS1203)。状態ST12はその設定を示す。更新部12は信頼区間221とベイズ最適化の目標値とに基づいて仮の特性値を設定してもよい。この例では、目標値は最小化問題における最小値であるとする。更新部12は信頼区間221での最小値240から最も離れた値を仮の特性値として設定し、パラメータセットxnewと該仮の特性値との新たなペア205をサンプルデータに追加する(ステップS1204)。最小値240は、最小化問題における目標値に対応する限界値(下限値)である。このような仮の特性値の設定は、パラメータセットxnewが最小化問題の解決、すなわち目標値の探索に寄与しなかったことを受けての処理であると言える。
【0049】
更新部12は、5個のペア201~205によって構成されるサンプルデータを用いたガウス過程回帰によって計算モデル200を更新する(ステップS1205)。状態ST13はその計算モデル200を示す。決定部13は獲得関数が最大になる次の新たなパラメータセットxnew2を生成する(ステップS13)。
【0050】
図6は計算モデル300の更新を四つの状態ST21,ST22,ST23,ST24によって示す。計算モデル300は、パラメータセットxおよび特性値yの関係を示す関数fと、信頼区間と、獲得関数とを含む。
図6は、その関数f、信頼区間、および獲得関数をそれぞれ、曲線310、領域320、および曲線330で表す。
【0051】
更新部12は、パラメータセットと特性値との5個のペア301~305によって構成されるサンプルデータを用いたガウス過程回帰によって計算モデル300を更新する(S1217)。ペア301~304は実際の特性値を含み、ペア305はパラメータセットxtmpと仮の特性値とを含むとする。状態ST21はその計算モデル300を示す。決定部13は、獲得関数が最大になる新たなパラメータセットxnewを生成する(ステップS13)。
【0052】
パラメータセットxnewに基づく実験により新たな特性値が得られたとする(ステップS1211においてYES)。この場合には、更新部12はパラメータセットxnewと新たな特性値との新たなペア306をサンプルデータに追加する(ステップS1212)。実験によって実際の特性値が得られなかったパラメータセットXtmpが存在するので(ステップS1213においてYES)、更新部12はペア301~304,306を実験サンプルグループとして特定する(ステップS1214)。更新部12は、ペア305を用いることなく、実験サンプルグループを用いた回帰分析によって計算モデルを仮に更新する(ステップS1215)。状態ST22は、仮に更新された計算モデル300を示す。更新部12はパラメータセットxtmpに対応する信頼区間321に基づいて仮の特性値を設定する(ステップS1216)。この例では、目標値は最小化問題における最小値であるとする。更新部12は信頼区間321での最小値340から最も離れた値を仮の特性値として設定する。最小値340は、最小化問題における目標値に対応する限界値(下限値)である。状態ST23はその設定を示す。このような仮の特性値の設定は、パラメータセットxtmpが最小化問題の解決、すなわち目標値の探索に寄与しなかったことを受けての処理であると言える。更新部12はパラメータセットxtmpと設定された仮の特性値とのペア305´を非実験サンプルグループとして設定する(ステップS1216)。ペア305´は、更新されたペア305であると言える。更新部12は特定された実験サンプルグループと設定された被実験サンプルグループとの集合を最新のサンプルデータとして特定する。
【0053】
更新部12は、6個のペア301~304,305´,306によって構成されるサンプルデータを用いたガウス過程回帰によって計算モデル300を更新する(ステップS1217)。状態ST24はその計算モデル300を示す。決定部13は獲得関数が最大になる次の新たなパラメータセットxnew2を生成する(ステップS13)。
【0054】
[変形例]
以上、本開示に係る技術をその様々な例に基づいて詳細に説明した。しかし、本開示は上記の例に限定されるものではない。本開示に係る技術については、その要旨を逸脱しない範囲で様々な変形が可能である。
【0055】
本開示に係る実験支援システムは選択部を備えなくてもよい。すなわち、実験支援システムとは異なるコンピュータシステムが最適解をユーザに提示してもよい。
【0056】
上記の例では、実験支援システムはクライアント-サーバシステムにおけるサーバとして構築される。別の例として、実験支援システムはスタンドアロンのコンピュータに実装されてもよい。あるいは、実験支援システムは、実験データ、サンプルデータ、または計算モデルを記憶する所定のデータベースに通信ネットワークを介してアクセス可能なユーザ端末に実装されてもよい。
【0057】
少なくとも一つのプロセッサにより実行される方法の処理手順は上記の例に限定されない。例えば、上述したステップの一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。
【0058】
本開示における二つの数値の大小関係の比較では、「以上」および「よりも大きい」という二つの基準のどちらが用いられてもよく、「以下」および「未満」の二つの基準のうちのどちらが用いられてもよい。
【0059】
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体、すなわちプロセッサ、が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
【0060】
[付記]
上記の様々な例から把握されるとおり、本開示は以下に示す態様を含む。
(付記1)
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新し、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定し、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新する、
実験支援システム。
(付記2)
前記少なくとも一つのプロセッサが、前記計算モデルの前記更新において、
前記実験によって得られた前記特性値を含む1以上のペアを実験サンプルグループとして前記サンプルデータから特定し、
前記実験サンプルグループを用いた前記回帰分析によって前記計算モデルを仮に更新し、
前記実験によって前記特性値が得られなかった1以上のパラメータセットのそれぞれについて、前記仮に更新された計算モデルにおいて該パラメータセットに対応する前記信頼区間に基づいて前記仮の特性値を設定し、該パラメータセットと該仮の特性値とのペアを生成し、
前記実験サンプルグループと、前記生成された1以上のペアにより構成される非実験サンプルグループとによって構成される前記サンプルデータを用いた前記回帰分析によって、前記計算モデルを更新する、
付記1に記載の実験支援システム。
(付記3)
前記少なくとも一つのプロセッサが、
前記更新された計算モデルに基づく最適化手法によって前記新たなパラメータセットを決定し、
前記新たなパラメータセットに基づいて前記新たな特性値が得られなかった場合に、前記新たなパラメータセットに対応する前記信頼区間と、前記最適化手法の目標値とに基づいて、前記仮の特性値を設定する、
付記1または2に記載の実験支援システム。
(付記4)
前記少なくとも一つのプロセッサが、前記新たなパラメータセットに対応する前記信頼区間において、前記目標値に対応する限界値から最も離れた値を、前記仮の特性値として設定する、
付記3に記載の実験支援システム。
(付記5)
少なくとも一つのプロセッサを備える実験支援システムによって実行される実験支援方法であって、
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新するステップと、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定するステップと、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新するステップと、
を含む実験支援方法。
(付記6)
目的組成物を生成するための条件を示す1以上のパラメータの集合であるパラメータセットと、該パラメータセットに基づく実験によって得られた該目的組成物の特性値との関係を信頼区間と共に示す計算モデルを、前記パラメータセットと前記特性値との1以上のペアを含むサンプルデータでの該ペアの個数を増やしながら、該サンプルデータを用いた回帰分析によって繰り返し更新するステップと、
前記計算モデルが更新される度に、該更新された計算モデルに基づいて新たなパラメータセットを決定するステップと、
前記新たなパラメータセットに基づく前記実験によって前記目的組成物の新たな特性値が得られなかった場合に、該新たなパラメータセットに対応する前記信頼区間に基づいて仮の特性値を設定し、該新たなパラメータセットと該仮の特性値との新たなペアを更に含む前記サンプルデータを用いて前記計算モデルを更新するステップと、
をコンピュータに実行させる実験支援プログラム。
【0061】
回帰分析によって得られる計算モデルではパラメータセットと特性値との関係が数学的に示される。しかし、実際には、パラメータセットに基づいて実験を行っても特性値を得られない場合があり得る。付記1,5,6においては、計算モデルの信頼区間を用いて仮の特性値を設定してサンプルデータを増やした上で計算モデルを更新することで、実験のための新たなパラメータセットを決定できる。その結果、組成物を効率的に探索できる。例えば、目的組成物を得るための実験の回数、時間、またはコストを節約できる。加えて、仮の特性値を導入してサンプルデータを増やした上で回帰分析を実行することで、計算モデルの精度の向上も期待できる。
【0062】
付記2によれば、仮の特性値を用いずに更新された計算モデルの信頼区間は、実験に基づく計算結果であるので、仮の特性値も用いて計算モデルを更新した場合よりも尤度が高いと言える。したがって、その信頼区間を用いることで仮の特性値をより尤もらしく再設定できる。そして、再設定された仮の特性値を含むサンプルデータを用いて計算モデルを更新することで、より精度の高い計算モデルを得ることが可能になる。その結果、目的組成物の探索をより効率的に進めることができる。
【0063】
付記3によれば、信頼区間に加えて最適化手法の目標値も考慮して仮の特性値を設定することで、最適化手法による処理をより早く収束させることが可能になる。その結果、目的組成物の探索をより効率的に進めることができる。
【0064】
実際の特性値が得られないパラメータセットについては、計算モデル上での特性値を最適化手法の目標値からできるだけ離した方が、計算モデルが実際の状況をより反映すると言える。付記4によれば、そのように仮の特性値を設定することで、計算モデルの精度を上げて、最適化手法による処理をより早く収束させることができる。
【符号の説明】
【0065】
10…実験支援システム、11…取得部、12…更新部、13…決定部、14…選択部、20…ユーザ端末、200,300…計算モデル。