IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツングの特許一覧

特開2023-48151物理的なプロセス又は化学的なプロセスを制御するためのシステム、装置及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023048151
(43)【公開日】2023-04-06
(54)【発明の名称】物理的なプロセス又は化学的なプロセスを制御するためのシステム、装置及び方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230330BHJP
   G05B 23/02 20060101ALI20230330BHJP
【FI】
G06N20/00
G05B23/02 T
【審査請求】未請求
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022152669
(22)【出願日】2022-09-26
(31)【優先権主張番号】10 2021 210 774.5
(32)【優先日】2021-09-27
(33)【優先権主張国・地域又は機関】DE
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ペトル ティギネヤヌ
(72)【発明者】
【氏名】アッティラ ライス
(72)【発明者】
【氏名】フェリックス ベアケンカンプ
(72)【発明者】
【氏名】ユリア ヴィノグラツカ
(72)【発明者】
【氏名】カトリン スクプヒ
(72)【発明者】
【氏名】パウル ゼバスティアン バイロイター
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA01
3C223AA11
3C223BA01
3C223CC01
3C223DD01
3C223EB01
3C223FF04
3C223FF05
3C223FF12
3C223FF23
3C223FF24
3C223FF26
3C223FF42
3C223GG01
3C223HH03
(57)【要約】      (修正有)
【課題】物理的なプロセス又は化学的なプロセスを制御するシステム、装置及び方法を提供する。
【解決手段】方法は、物理的なプロセス/化学的なプロセスに関連するプロセスの入力変数と出力変数との間の関係を表す第1の事後モデルに基づいて、物理的なプロセス又は化学的なプロセスの入力変数と出力変数との間の関係を表す第2の事後モデルを求める。第2の事後モデルを求めることは、関数が第1の事後モデルから引き出されて、ガウスプロセスの期待値を形成することによって各ガウスプロセスを求め、共通の共分散関数を用いて複数のガウスプロセスを求めることと、複数のガウスプロセスの平均値として事前モデルを求め、既知の測定点に合わせて事前モデルを調整することによって第2の事後モデルを求めること又は既知の測定点に合わせて各ガウスプロセスを調整し、調整された複数のガウスプロセスの平均値として第2の事後モデルを求めることと、を含む。
【選択図】なし
【特許請求の範囲】
【請求項1】
物理的なプロセス又は化学的なプロセスを制御するための方法(400)であって、
既知の測定点の各測定点は、前記物理的なプロセス又は前記化学的なプロセスの少なくとも1つの入力変数の入力パラメータ値と、前記入力パラメータ値に割り当てられている、前記物理的なプロセス又は前記化学的なプロセスの少なくとも1つの出力変数の出力値とを有しており、
第1の事後モデルは、前記物理的なプロセス又は前記化学的なプロセスに関連する別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表しており、
前記方法は、
・前記第1の事後モデルを取り入れて第2の事後モデルを求めること(402)を含み、前記第2の事後モデルは、前記物理的なプロセス又は前記化学的なプロセスの前記少なくとも1つの入力変数と前記少なくとも1つの出力変数との間の前記関係を表しており、前記第1の事後モデルを取り入れて第2の事後モデルを求めること(402)は、
・関数が前記第1の事後モデルから引き出されて、ガウスプロセスの期待値を形成することによって各ガウスプロセスを求め、共通の共分散関数を用いて複数のガウスプロセスを求めること(402A)と、
・前記複数のガウスプロセスの平均値として事前モデルを求め、前記既知の測定点を使用して、前記第1の事後モデルの共分散関数の少なくとも1つのハイパーパラメータが不変のまま保たれるように、前記モデルのハイパーパラメータを最適化することによって、前記第2の事後モデルを求め、前記既知の測定点に合わせて前記モデルを調整すること(402B)、又は、
・前記既知の測定点に合わせて前記複数のガウスプロセスの各ガウスプロセスを調整し、調整された前記複数のガウスプロセスの平均値として前記第2の事後モデルを求めること(402B)と、
を含み、
前記方法は、さらに、
・前記第2の事後モデルを使用して前記物理的なプロセス又は前記化学的なプロセスを制御すること(404)を含む、
方法(400)。
【請求項2】
前記方法は、さらに、
・前記第2の事後モデルに基づいて、獲得関数を用いて、前記物理的なプロセス又は前記化学的なプロセスの前記少なくとも1つの入力変数の新たな入力パラメータ値を選択することを含み、
・前記少なくとも1つの出力変数の、前記新たな入力パラメータ値に割り当てられている前記出力値を測定することを含み、選択された前記新たな入力パラメータ値と、測定された前記新たな出力値とが新たな測定点を形成し、
・前記新たな測定点を使用して前記第2の事後モデルの適応化を行うことを含み、適応化が行われた前記第2の事後モデルは、前記既知の測定点及び前記新たな測定点に対する前記物理的なプロセス又は前記化学的なプロセスを表し、
・適応化が行われた前記第2の事後モデルを使用して、前記物理的なプロセス又は前記化学的なプロセスを制御する、
請求項1に記載の方法(400)。
【請求項3】
第3の事後モデルは、前記物理的なプロセス又は前記化学的なプロセスに関連するさらに別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表しており、既知の他の測定点の各別の測定点は、前記別のプロセスの少なくとも1つの入力変数の入力パラメータ値と、前記別のプロセスの少なくとも1つの出力変数の、前記入力パラメータ値に割り当てられている出力値とを含み、
前記方法は、
・前記第3の事後モデルを取り入れて前記第1の事後モデルを求めることを含み、前記第3の事後モデルを取り入れて前記第1の事後モデルを求めることは、
・関数が前記第3の事後モデルから引き出されて、前記ガウスプロセスの期待値を形成することによって各別のガウスプロセスを求め、別の共通の共分散関数を用いて複数の他のガウスプロセスを求めることと、
・前記複数の他のガウスプロセスの平均値として別の事前モデルを求め、前記既知の他の測定点に合わせて前記別の事前モデルを調整することによって前記第1の事後モデルを求めること、又は、
・前記既知の他の測定点に合わせて前記複数の他のガウスプロセスの各別のガウスプロセスを調整し、調整された前記複数の他のガウスプロセスの平均値として前記第1の事後モデルを求めることと、
を含む、
請求項1又は2に記載の方法(400)。
【請求項4】
前記第2の事後モデルを使用して前記物理的なプロセス又は前記化学的なプロセスを制御すること(404)は、
・前記第2の事後モデルに従って、前記物理的なプロセス又は前記化学的なプロセスの前記少なくとも1つの出力変数の所望の出力値に割り当てられている、前記少なくとも1つの入力変数の入力パラメータ値を求めることと、
・求められた前記入力パラメータ値に従って、前記物理的なプロセス又は前記化学的なプロセスを制御することと、
を含む、
請求項1乃至3のいずれか一項に記載の方法(400)。
【請求項5】
請求項1乃至4のいずれか一項に記載の方法(400)を実施するように構成されている装置(208)。
【請求項6】
・物理的なプロセス又は化学的なプロセスを実行するように構成されている装置(208)と、
・請求項1乃至4のいずれか一項に記載の方法(400)に従って求められた第2の事後モデル(214,234)を用いて、前記物理的なプロセス又は前記化学的なプロセスの前記少なくとも1つの出力変数の所望の出力値(222)に対して、前記所望の出力値(222)に割り当てられている入力パラメータ値(226,246)を求め、求められた前記入力パラメータ値(226,246)に従って前記物理的なプロセス又は前記化学的なプロセスを実行するように前記装置(208)を制御するように構成されている制御装置(206)と、
を含むシステム(200)。
【請求項7】
前記物理的なプロセス又は前記化学的なプロセスは、
・ワークピースの加工、
・装置の調整、
・製品の製造、又は、
・ロボットアームの移動
である、
請求項6に記載のシステム(200)。
【請求項8】
プロセッサによる実行時に、請求項1乃至4のいずれか一項に記載の方法(400)を前記プロセッサに実施させるための命令を含むコンピュータプログラム。
【請求項9】
プロセッサによる実行時に、請求項1乃至4のいずれか一項に記載の方法(400)を前記プロセッサに実施させるための命令を格納しているコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
種々の実施例は、概して、物理的なプロセス又は化学的なプロセスを制御するためのシステム、装置及び方法に関する。
【背景技術】
【0002】
生産プロセス及び加工プロセス(例えば、穿孔、フライス加工、熱処理等)においては、プロセスパラメータ、例えば、プロセス温度、プロセス時間、真空又はガス雰囲気等が調整され、これによって、所望の特性、例えば、ワークピースの硬度、強度、熱伝導率、導電率、密度、マイクロ構造、マクロ構造、化学組成等が得られる。これらのプロセスパラメータを、モデルに基づく最適化法、例えばベイズ最適化法によって求めることができる。その際、生産プロセス又は加工プロセスに関するモデルを、測定データに基づいて求めることができる。しかし、これは、大量の測定データ、ひいては多大なコスト(例えば、時間的なコスト及び/又は費用支出)を必要とし得る。生産プロセス又は加工プロセスに関連するプロセスを表す、既に学習済みのモデルに基づいて、これらの測定データに関連してモデルを求めること(転移学習とも称される)によって、このようなコストを削減することができる。例えば、2つのモデルは、種々異なる機械における(及び同等のプロセスパラメータにおける)穿孔又はフライス加工を表すことができる。この場合、既に学習済みのモデルを、学習されるべきモデルに対する基礎として用いることができ、従って、必要とされる測定データの量が低減される。
【0003】
D.Golovin等著の刊行物「Google Vizier: A Service for Black-Box Optimization」(KDD 2017 Applied Data Science Paper、2017年)(以下においては、参考文献[1]と記す)には、階層的な転移学習が記載されており、ここでは、既にガウスプロセスとして学習済みのモデルに基づいて、及び、測定データに基づいて、モデルがガウスプロセスとして求められる。
【0004】
ベイズ最適化法に従ってモデルを学習するために、各反復において、獲得関数を用いて、新たな測定点を求めることができる。獲得関数の例は、D.Jones等著の刊行物「Efficient global optimization of expensive black-box functions」(Journal of Global optimization、1998年)(以下においては、参考文献[2]と記す)、及び、N.Srinivas等著の刊行物「Gaussian process optimization in the bandit setting: No regret and experimental design」(Proc. International Conference on Machine Learning(ICML)、2010年)(以下においては、参考文献[3]と記す)に記載されている。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】刊行物「Google Vizier: A Service for Black-Box Optimization」、D.Golovin等著(KDD 2017 Applied Data Science Paper、2017年)
【非特許文献2】刊行物「Efficient global optimization of expensive black-box functions」、D.Jones等著(Journal of Global optimization、1998年)
【非特許文献3】刊行物「Gaussian process optimization in the bandit setting: No regret and experimental design」、N.Srinivas等著(Proc. International Conference on Machine Learning(ICML)、2010年)
【発明の概要】
【発明が解決しようとする課題】
【0006】
生産プロセス又は加工プロセスの少なくとも1つの特性、及び/又は、ワークピースに対する、このプロセスの少なくとも1つの作用を特徴付ける測定は、プロセスパラメータが同一の場合であっても、変動することがある。このような変動は、プロセス自体からも、ワークピースからも、測定エラーからも生じ得る。このような変動及び/又は比較的少ない測定データによって、学習済みのモデルは、測定データが少ない領域又は測定データがない領域において、高い不正確性及び/又は不確かさを有することがある。種々の実施形態によれば、既に学習済みのモデルの不確かさも、学習されるべきモデルの不確かさも考慮される場合に、転移学習における学習コスト(例えば最適化効率)が低減可能であることが認識された。
【課題を解決するための手段】
【0007】
独立請求項1の特徴を有する方法、独立請求項5の特徴を有する装置、及び、独立請求項6の特徴を有するシステムは、モデルの効率的な最適化を可能にする。この場合、必要な測定データの数が低減させられ、これによって、モデルの学習のためのコスト(例えば、時間的なコスト及び/又は費用支出)を低減させることができる。具体的には、転移学習の枠内においては、既に、類似プロセスに関して学習済みのモデルを新たなプロセスに適合させるためにわずかな測定しか必要とされない。さらに、本明細書において説明した、既に学習済みのモデルの不確かさの考慮によって、新たなプロセスに関して学習済みのモデルの精度が高められる(例えば、学習済みのモデルの期待値の高められた精度、及び、この期待値に関する考慮された不確かさの高められた精度)。種々の実施形態においては、わずかなデータしか存在しない場合、及び/又は、既に類似のプロセスに関して学習済みのモデルが高い不確かさを有する場合であっても、モデルを学習することが可能である。
【0008】
独立請求項1の特徴を有する方法は、第1の例を構成する。この場合、具体的には、第1の事後モデルの少なくとも1つの(例えば、厳密に1つ又は1つよりも多くの)ハイパーパラメータを、再度、最適化することはできない。
【0009】
本明細書において説明されるモデルは、統計モデルであるものとしてよく、ガウスプロセスによる、物理的なプロセス又は化学的なプロセスの入力変数と出力変数との関係を表す、あらゆる種類の数学的な表現であるものとしてよい。物理的なプロセス又は化学的なプロセスの入力変数及び/又は出力変数は、別のシステムの入力変数又は出力変数であるものとしてもよい。例えば、入力変数は、(例えば、物理的なプロセス又は化学的なプロセスの)シミュレーションのパラメータであるものとしてよい。例えば、出力変数は、近似誤差であるものとしてよい。例えば、出力変数は、機械学習に基づくモデルのハイパーパラメータ及び1つ又は複数の損失値であるものとしてよい。
【0010】
第2の事後モデルを求める際に、第1の事後モデルの共分散関数のすべてのハイパーパラメータを不変のまま保つことができる。この段落において説明した特徴は、第1の例と組み合わせられて、第2の例を構成する。具体的には、第2の事後モデルを、第2のモデルのハイパーパラメータの最適化及び既知の第2の測定点に合わせた調整を用いて求めることができ、ここでは、第1の事後モデルのハイパーパラメータを不変のまま保つことができる。ここでは、具体的には、第1の事後モデルのすべてのハイパーパラメータを再度、最適化することはできない。
【0011】
第1の例による、第2の事後モデルを求めるためのこれら2つの手法は、第1の事後モデルのハイパーパラメータを定めることによって、計算複雑性、ひいては計算コストの削減を可能にする(例えば、表1及び属する説明を参照)。
【0012】
この方法は、さらに、
第2の事後モデルに基づいて、獲得関数を用いて、物理的なプロセス又は化学的なプロセスの少なくとも1つの入力変数の新たな入力パラメータ値を選択することを含み得るものであり、
少なくとも1つの出力変数の、入力パラメータ値に割り当てられている出力値を測定することを含み得るものであり、選択された新たな入力パラメータ値と、測定された新たな出力値とが新たな測定点を形成し、
この新たな測定点を使用して第2の事後モデルの適応化を行うことを含み得るものであり、適応化が行われた第2の事後モデルは、既知の測定点及び新たな測定点に対する物理的なプロセス又は化学的なプロセスを表し、
適応化が行われた第2の事後モデルを使用して、物理的なプロセス又は化学的なプロセスを制御する。この段落において説明した特徴は、第1の例又は第2の例と組み合わせられて、第3の例を構成する。
【0013】
第1の例又は第2の例による、第2の事後モデルを求めるためのこれら2つの手法は、同様に不確さの伝達を可能にする他の方法に比較して、低減された計算複雑性を有し得る(例えば、表1及び属する説明を参照)。
【0014】
第3の事後モデルは、物理的なプロセス又は化学的なプロセスに関連するさらに別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができ、既知の他の測定点の各別の測定点は、別のプロセスの少なくとも1つの入力変数の入力パラメータ値と、別のプロセスの少なくとも1つの出力変数の、入力パラメータ値に割り当てられている出力値とを有し得る。
この方法は、
第3の事後モデルを取り入れて第1の事後モデルを求めることを含み得るものであり、第3の事後モデルを取り入れて第1の事後モデルを求めることは、
関数が第3の事後モデルから引き出されて、ガウスプロセスの期待値を形成することによって各別のガウスプロセスを求め、別の共通の共分散関数を用いて複数の他のガウスプロセスを求めることと、
複数の他のガウスプロセスの平均値として別の事前モデルを求め、既知の他の測定点に合わせて別の事前モデルを調整することによって第1の事後モデルを求めること、又は、
既知の他の測定点に合わせて複数の他のガウスプロセスの各別のガウスプロセスを調整し、調整された複数の他のガウスプロセスの平均値として第1の事後モデルを求めることと、
を含み得るものである。この段落において説明した特徴は、第1の例から第3の例のうちの1つ又は複数の例と組み合わせられて、第4の例を構成する。選択的に、第1の事後モデルは、別の方法により求めることができる。例えば、第1の事後モデルは、β=1である、参考文献[1]による階層的なガウスプロセスを用いて求めることができる。
【0015】
第2の事後モデルは、具体的には、複数の他のモデル(例えば、第3の事後モデル及び第1の事後モデル)のシーケンスとして求めることができる。第1の例から第3の例のうちの1つ又は複数の例による、第2の事後モデルを求めるためのこれらの2つの手法は、他の方法と比較して、複数の他のモデルに基づいたモデルの学習の効率を大幅に向上させることができる(例えば、図3Bにおけるイラスト352を参照)。
【0016】
第2の事後モデルを使用して物理的なプロセス又は化学的なプロセスを制御することは、
第2の事後モデルに従って、物理的なプロセス又は化学的なプロセスの少なくとも1つの出力変数の所望の出力値に割り当てられている、少なくとも1つの入力変数の入力パラメータ値を求めることを含み得るものであり、
求められた入力パラメータ値に従って物理的なプロセス又は化学的なプロセスを制御することを含み得るものである。この段落において説明した特徴は第1の例から第4の例のうちの1つ又は複数の例と組み合わせられて、第5の例を構成する。
【0017】
具体的には、第2の事後モデルは、第1の事後モデル(及び第4の例による第3の事後モデル)の不確かさを考慮することができ、このことは、第2の事後モデルの(例えば、期待値及び/又は不確かさに関する情報の)精度の向上をもたらす。
【0018】
装置は、第1の例から第5の例のうちの1つ又は複数の例に従って、この方法を実施するように構成されるものとしてよい。この段落において説明した特徴を備えた装置は、第6の例を構成する。
【0019】
本明細書において説明される、(例えば、物理的又は化学的な)プロセスを実行するための装置は、例えば、ロボット(例えば、製造ロボット、メンテナンスロボット、家事ロボット、医療ロボット等)、車両(例えば自律車両)、家事用の機器、生産機械、パーソナルアシスタント、アクセス制御システム等である、あらゆる種類のコンピュータ制御された装置であるものとしてよい。しかし、本明細書において説明される、(例えば、物理的な又は化学的な)プロセスを実行するための装置は、コンピュータ制御されていない装置であるものとしてもよい。例えば、装置は、(例えば、物理的又は化学的な)プロセスを実行するために、ユーザによって手動により制御されるものとしてよい。概して、装置は、例えば、製品を製造するための生産装置又はワークピースを加工するための加工装置(例えば、ドリル装置又はフライス装置)、例えば運動を行うロボット装置、例えば医薬品の作用物質設計のための装置、例えば航空飛行及び宇宙飛行用のシステムを設計するための装置等であるものとしてよい。
【0020】
システムは、
物理的なプロセス又は化学的なプロセスを実行するように構成されている装置と、
第1の例から第5の例のうちの1つ又は複数の例に従って求められた第2の事後モデルを用いて、物理的なプロセス又は化学的なプロセスの少なくとも1つの出力変数の所望の出力値に対して、所望の出力値に割り当てられている入力パラメータ値を求め、求められた入力パラメータ値に従って物理的なプロセス又は化学的なプロセスを実行するように装置を制御するように構成されている制御装置と、
を含み得るものである。この段落において説明した特徴を備えたシステムは、第7の例を構成する。
【0021】
このシステムにおいては、物理的なプロセス又は化学的なプロセスは、
ワークピースの加工、
装置(例えば、機器及び/又は測定機器)の調整(例えば較正)、
製品の製造、又は、
ロボットアームの移動
であるものとしてよい。この段落において説明した特徴は、第7の例と組み合わせられて、第8の例を構成する。
【0022】
コンピュータプログラムは、プロセッサによる実行時に、第1の例から第5の例のうちの1つ又は複数の例に従った方法をプロセッサに実施させるための命令を含み得るものである。この段落において説明した特徴を有するコンピュータプログラムは、第9の例を構成する。ここで、プロセッサは、物理的なプロセス又は化学的なプロセスを制御するための命令(例えば、装置を制御するための命令)を生成することができることを理解されたい。
【0023】
コンピュータ可読媒体(例えば、コンピュータプログラム製品、非一時的な記憶媒体、非一過性の記憶媒体、不揮発性記憶媒体)は、プロセッサによる実行時に、第1の例から第5の例のうちの1つ又は複数の例に従った方法をプロセッサに実施させるための命令を格納し得るものである。この段落において説明した特徴を有するコンピュータ可読媒体は、第10の例を構成する。
【0024】
本発明の実施例を図面に示し、以下において、より詳細に説明する。
【図面の簡単な説明】
【0025】
図1A】種々の実施形態による、第1の装置によって実行されるプロセスを表す第1の事後モデルの学習を示す図である。
図1B】種々の実施形態による、第1の装置によって実行されるプロセスを表す第1の事後モデルの学習を示す図である。
図1C】種々の実施形態による、学習済みの第1の事後モデルによる第1の装置の制御を示す図である。
図2A】種々の実施形態による、第2の装置を用いた物理的なプロセス又は化学的なプロセスの実行を示す図である。
図2B】種々の実施形態による、学習済みの第2の事後モデルによる第2の装置の制御を示す図である。
図2C】種々の実施形態による、第2の事後モデルの適応化を示す図である。
図2D】種々の実施形態による、適応化が行われた第2の事後モデルによる第2の装置の制御を示す図である。
図3A】種々の実施形態による、種々のモデルの例示的な視覚化又は種々のモデルに基づく最適化の経過を示す図である。
図3B】種々の実施形態による、種々のモデルの例示的な視覚化又は種々のモデルに基づく最適化の経過を示す図である。
図4】種々の実施形態による、物理的なプロセス又は化学的なプロセスを制御するための方法を示す図である。
【発明を実施するための形態】
【0026】
1つの実施形態においては、「コンピュータ」は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組合せとすることができるあらゆる種類の論理実装エンティティとして理解され得る。従って、1つの実施形態においては、「コンピュータ」を、ハードワイヤード論理回路又はプログラマブル論理回路、例えばプログラマブルプロセッサ、例えばマイクロプロセッサ(例えば、CISC(大きい命令ストックを有するプロセッサ)又はRISC(低減された命令ストックを有するプロセッサ))とすることができる。「コンピュータ」は、1つ又は複数のプロセッサを含むものとしてよい。「コンピュータ」は、プロセッサによって実装又は実行されるソフトウェアであるものとしてもよく、これは例えば、あらゆる種類のコンピュータプログラム、例えば、Javaのような仮想機械コードを使用するコンピュータプログラムである。以下において詳細に説明する各機能の他の様式の各実装を、選択的な実施形態との一致において、「コンピュータ」と理解することができる。
【0027】
種々の実施例は、物理的なプロセス又は化学的なプロセスを制御するためのシステム、装置及び方法に関する。ここでは、物理的なプロセス又は化学的なプロセスを表すモデルの学習が、転移学習を用いて、物理的なプロセス又は化学的なプロセスに関連するプロセスを表す、既に学習済みの別のモデルに基づいて行われるものとしてよく、ここでは、既に学習済みの別のモデルの不確かさも、学習されるべきモデルの不確かさも考慮される。具体的には、これは、学習効率を著しく高めることができる。これによって、著しく少ないデータ量でモデルの学習を行うことができ、及び/又は、モデルを求めるための計算コストを削減することができる。これによって、学習の時間的なコスト及び/又は費用支出の削減だけではなく、物理的なプロセス又は化学的なプロセスに関して学習済みのモデルの精度の向上も行われる。
【0028】
種々の実施形態によれば、第2の装置208は、物理的なプロセス又は化学的なプロセスを実行する(例えば、完遂する)ことができる。図1Aには、第1の装置108を備えた第1のシステム100が示されている。第1の装置108は、物理的なプロセス又は化学的なプロセスに関連する別のプロセスを実行するように構成されるものとしてよい。
【0029】
本明細書において使用されるような物理的なプロセス又は化学的なプロセスは、例えば、製造プロセス(例えば、製品又は中間製品の製造)、加工プロセス(例えば、ワークピースの加工)、制御プロセス(例えば、ロボットアームの移動)、調整プロセス(例えば、測定機器の較正)等のあらゆる種類の技術的なプロセスであるものとしてよい。例えば、装置の種々異なる操作変数を(例えば、較正の範囲内において)調整することが必要とされることがあり、物理的なプロセス又は化学的なプロセスは、このような調整であるものとしてよい。例えば、炉を用いた熱処理時の物理的なプロセス又は化学的なプロセスは、炉の温度及び/又は真空の較正であるものとしてよい。
【0030】
物理的なプロセス又は化学的なプロセスに関連する別のプロセスも、本明細書において説明されているような物理的なプロセス又は化学的なプロセスであり得ることを理解されたい。
【0031】
2つのプロセスは、相互に異なる方法により関連するものとしてよい。例えば、これは、一般的な同様のプロセス、例えば、構成部分の穿孔又はフライス加工であるものとしてよく、これは、種々異なる機械によって実行される。種々異なる機械における一般的な同様のプロセスも、個別の結果をもたらし得ることを理解されたい。同一の機械において実行される2つのプロセスが、同様に、相互に関連するものとしてよい。例えば、1つのプロセスは、金属の構成部分の穿孔であるものとしてよく、別のプロセスは、セラミックの構成部分の穿孔であるものとしてよい。概して、各プロセスの入力変数が少なくとも部分的に重複しており、かつ、各プロセスの出力変数が少なくとも部分的に重複している場合に、2つのプロセスが相互に関連するものとしてよい。具体的には、相互に関連する2つのプロセスは、1つ又は複数の同一の入力変数(例えば、プロセス温度、プロセス時間、及び/又は、熱処理の場合の真空圧)と、1つ又は複数の同一の出力変数(例えば、硬度、強度、密度、マイクロ構造、マクロ構造、及び/又は、熱処理の場合の化学組成)とを有するものとしてよい。2つのプロセスは、その各モデルが転移学習に適している場合に、相互に関連するものとしてよい。
【0032】
第1のシステム100は、第1の制御装置106を含むものとしてよい。第1の制御装置106は、少なくとも1つの(即ち、厳密に1つ又は1つよりも多くの)入力変数の各(提供された)第1の入力パラメータ値102に従って第1の装置108を制御するように構成されるものとしてよい。具体的には、第1の制御装置106は、第1の装置108と周囲との相互作用を、1つ(又は複数の)第1の入力パラメータ値102に従って制御することができる。(少なくとも1つの入力変数の)各入力変数に対して各第1の入力パラメータ値102を提供することができるので、これは、以下においては、少なくとも1つの第1の入力パラメータ値102とも称される。
【0033】
「制御装置」(「制御機構」とも称される)という用語は、例えば、記憶媒体に格納されているソフトウェア、ファームウェア、又は、それらの組合せを実行することができ、さらに、例えば、この例において、プロセスを実行するように装置に指示を与えることができる回路及び/又はプロセッサを含み得るあらゆる種類の論理的な実装ユニットと理解され得る。制御装置は、例えばプログラムコード(例えばソフトウェア)によって、システム、例えば、生産システム、加工システム、ロボットの動作及び/又は調整(例えば較正)を制御するように構成されるものとしてよい。
【0034】
本明細書において使用されるような入力パラメータ値は、入力変数、例えば、物理的な変数又は化学的な変数、印加される電圧、弁の開口等を表すパラメータ値であるものとしてよい。例えば、入力変数は、1つ又は複数の材料のプロセスに関連する特性、例えば、硬度、熱伝導率、導電率、密度、マイクロ構造、マクロ構造、化学組成等であるものとしてよい。
【0035】
第1の装置108は、少なくとも1つの第1の入力パラメータ値102に従って、物理的なプロセス又は化学的なプロセスに関連する別のプロセスを実行するように構成されるものとしてよい。
【0036】
第1のシステム100は、1つ又は複数の第1のセンサ110を含むものとしてよい。1つ又は複数の第1のセンサ110は、プロセスの結果を検出するように構成されるものとしてよい。プロセスの結果は、例えば、製造された製品の特性又は加工されたワークピースの特性(例えば、硬度、強度、密度、マイクロ構造、マクロ構造、化学組成等)、ロボットの技能(例えば、対象物のピックアップ)の成功又は失敗、カメラによって撮影された画像の解像度等であるものとしてよい。プロセスの結果を、少なくとも1つの(即ち、厳密に1つ又は1つよりも多くの)出力変数を用いて表すことができる。1つ又は複数の第1のセンサ110は、少なくとも1つの出力変数の第1の出力値112を検出するように構成されるものとしてよい。例えば、複数の出力変数のうちの各出力変数に対する各第1の出力値112が検出可能である。(少なくとも1つの出力変数の)各出力変数に対する各第1の出力値112が検出可能であるので、これは、以下においては、少なくとも1つの第1の出力値112とも称される。
【0037】
本明細書において説明したように、1つ又は複数のセンサを用いたプロセスの結果の検出は、プロセスの実行中(例えば、in-situ)及び/又はプロセスの実行後(例えば、ex-situ)に行われるものとしてよい。例えば、このモデルは、1つ又は複数の入力変数と少なくとも2つの出力変数との間の関係を表すことができ、ここでは、少なくとも2つの出力変数のうちの1つの出力変数の出力値をプロセス中に検出することができ、少なくとも2つの出力変数のうちの別の出力変数の出力値を、プロセスの実行後に検出することができる。プロセス実行後の出力値の検出に関する具体例として、プロセスは、入力変数としての温度を有する炉内におけるワークピースの硬化であるものとしてよい。この場合、出力変数は、硬化プロセス後の室温におけるワークピースの硬度であるものとしてよい。
【0038】
本明細書において使用されるような出力値は、プロセスの出力変数を表す値であるものとしてよい。プロセスの出力変数は、製品、ワークピース、撮影された画像、又は、その他の成果物の特性であるものとしてよい。しかし、プロセスの出力変数が、(例えば、ロボットの技能の)成功又は失敗であるものとしてもよい。具体的には、少なくとも1つの第1の出力値112を、少なくとも1つの第1の入力パラメータ値102から結果として得ることができる。出力変数は、アプリケーション固有の品質基準を含むものとしてよい。出力変数は、構成部分に関連するパラメータ、例えば、寸法又は層厚であるものとしてよく、又は、材料に関連するパラメータ、例えば、硬度、熱伝導率、導電率、密度、化学組成等であるものとしてよい。
【0039】
少なくとも1つの第1の入力パラメータ値102及び少なくとも1つの第1の出力値112は、第1の測定点130を形成することができる。第1の制御装置106は、第1の装置108を、少なくとも1つの入力変数の(例えば、相互に異なる)各入力パラメータ値に対して相前後して制御するように構成されるものとしてよい。1つ又は複数の第1のセンサ110は、それぞれ少なくとも1つの第1の出力値112を検出することができる。具体的には、複数の第1の測定点を求めることができる。求められた第1の測定点は、既知の第1の測定点Ds(2)(即ち、D又はDs2)とも称される。
【0040】
既知の第1の測定点Ds(2)は、式(1)によって表すことができる。
【数1】
ここで、Ns(2)は、既知の第1の測定点の数であり、xs(2),iは、各既知の第1の測定点iの少なくとも1つの入力パラメータ値102であり、ys(2),iは、各既知の第1の測定点iの少なくとも1つの出力値112である。
【0041】
第1のシステム100は、少なくとも1つのメモリを備えた記憶装置を含み得る。既知の第1の測定点Ds(2)は、メモリに格納されているものとしてよく、又は、メモリに格納可能である。メモリは、プロセッサによって実行される処理の際に使用することができる。
【0042】
この実施形態において使用されるメモリは、揮発性メモリ、例えばDRAM(ダイナミック・ランダム・アクセス・メモリ)、又は、不揮発性メモリ、例えば、PROM(プログラマブルROM)、EPROM(消去可能PROM)、EEPROM(電気的消去可能PROM)、又は、フラッシュメモリ、例えば、浮動ゲート型メモリ装置、チャージトラップ型メモリ装置、MRAM(磁気抵抗メモリ)若しくはPCRAM(相変化メモリ)であるものとしてよい。
【0043】
種々の実施形態において、モデルのトレーニング又は学習が説明される(例えば、アルゴリズム1、2、4及び5を参照)。モデルのトレーニング又は学習時に、事前モデル(モデルのアプリオリとも称される)が規定される。この事前モデルは、具体的には、データを伴わずに(例えば、既知の測定点を伴わずに)存在するものとしてよい。モデルは、このモデルによって表された分布の一般的な特性を特定するハイパーパラメータを含むものとしてよい。モデルのトレーニング又は学習時に、モデルのハイパーパラメータの最適化(ハイパーパラメータ最適化とも称される)を実行することができる。モデルのハイパーパラメータ最適化を、既知の測定点(例えば、測定された測定点及び/又はシミュレートされた測定点)に基づいて行うことができる。最適化されたハイパーパラメータを備えたモデルを、ハイパーパラメータ最適化モデルと称することもできる。具体的には、ハイパーパラメータを、既知の測定点を用いて適合させることができる。例えば、既知の測定点から、入力パラメータ値が変更されるときに、出力値が比較的大きく変化することが明らかになった場合には、例えば、より迅速に変化する関数の確率が高くなるようにモデルを適合させることができる。モデルのトレーニング又は学習時に、さらに、モデル(例えば、ハイパーパラメータ最適化モデル)を既知の測定点に合わせて調整することによって、事後モデル(モデルのアポステリオリとも称される)を求めることができる。ここでは、ハイパーパラメータに関連する乱数変数の事後分布を求める(例えば、計算する)ことができる。この場合、ハイパーパラメータを不変のまま保つことができる。種々の実施形態によれば、既知の測定点に基づいて、ハイパーパラメータの値を最適化することができる。種々の実施形態によれば、このようにして、少なくとも1つの第1のモデル及び第2のモデルのトレーニング又は学習を行うことができる(例えば、アルゴリズム1、2、4及び5を参照)。種々の実施形態によれば、第2のモデルの学習を、第1のモデルに基づいて行うことができ、第2のモデルのトレーニング又は学習時に、第1のモデルの予め最適化されたハイパーパラメータを不変のまま保つことができる。
【0044】
学習又はトレーニング済みの事後モデルを新たな測定点に合わせて適合させる場合、上述したように、ハイパーパラメータ最適化も調整も実行可能である。
【0045】
種々の実施形態によれば、既知の第1の測定点Ds(2)を使用して、第1の事後モデル114(第1のモデルのアポステリオリとも称される)を求めることができる。第1の事後モデル114は、別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができる。具体的には、入力パラメータ値又は出力値が既知の第1の測定点の一部ではない場合においても、第1の事後モデル114を用いて、入力パラメータ値に対して、割り当てられている期待される出力値を求めることができ、出力値に対して、入力パラメータ値に対する所属の確率密度を求めることができる。続いて、例えば、最も高い確率密度を有する入力値を選択することができる。具体的には、第1の事後モデル114は、別のプロセスを表す。
【0046】
各第1の測定点に対して、ユーザがそれぞれ少なくとも1つの第1の入力パラメータ値102を選択することによって、既知の第1の測定点Ds(2)を測定することができる。しかし、既知の第1の測定点Ds(2)のサブセットを測定することも可能である。図1Bに示されているように、既知の第1の測定点Ds(2)のサブセットに対して、一時的な第1の事後モデル113を求めることができる。一時的な第1の事後モデル113は、既知の第1の測定点Ds(2)のサブセットに対する別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表し得るものである。種々の実施形態によれば、第1の制御装置106は、(例えば、参考文献[2]及び/又は参考文献[3]による)獲得関数を用いて、新たな測定点132に対して、少なくとも1つの入力パラメータ値116(新たな入力パラメータ値とも称される)を求めるように構成されるものとしてよい。第1の制御装置106は、求められた少なくとも1つの入力パラメータ値116に従って第1の装置108を制御することができ、1つ又は複数の第1のセンサ110は、新たな測定点132の属する出力値118を検出することができる。例えば、このようにして、既知の第1の測定点Ds(2)のうちの1つ又は複数の測定点を求めることができる。この場合には、第1の事後モデル114を求めるために、求められた新たな測定点に基づいて、一時的な第1の事後モデル113の適応化を行うことができる。従って、第1の事後モデル114は、別のプロセスのすべての既知の第1の測定点Ds(2)に対して、少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができる。
【0047】
しかし、既知の第1の測定点Ds(2)を、シミュレーションを用いて求めることもできる。この場合には、システム100は、コンピュータを含むものとしてよい。第1の例においては、シミュレーションは、新たな測定点132に対して入力パラメータ値116を求めることも、物理的なプロセス又は化学的なプロセスをシミュレーションすることも含むものとしてよい。第1の例のこのケースにおいては、第1の制御装置106、第1の装置108及び1つ又は複数の第1のセンサ110は、不要である。第2の例においては、シミュレーションは、物理的なプロセス又は化学的なプロセスのシミュレーションのみを含むものとしてよい。第2の例のこのケースにおいては、例えば第1の制御装置106はさらに、新たな測定点132に対する入力パラメータ値116を求めることができ、第1の装置108及び1つ又は複数の第1のセンサ110は、不要である。コンピュータは、処理時にメモリを使用することができる。コンピュータは、上述したように、あらゆる種類の回路であるものとしてよく、即ち、あらゆる種類の論理実装エンティティであるものとしてよい。コンピュータは、別のプロセスをシミュレートし、そのようにして、少なくとも1つの入力パラメータ値102に対して、少なくとも1つの属する出力値112を複数回求めるように構成されるものとしてよい。具体的には既知の第1の測定点Ds(2)の出力値が測定ではなく、シミュレートされるものとしてよい。
【0048】
図1Cは、種々の実施形態による、学習済みの第1の事後モデル114による第1の装置108の制御を示している。例えば、第1の事後モデル114を用いて、別のプロセスの少なくとも1つの出力変数の所望の出力値122に基づいて、少なくとも1つの入力変数の属する入力パラメータ値126を求めることができる。第1の制御装置106は、第1の装置108を、求められた入力パラメータ値126に従って制御するように構成されるものとしてよい。任意選択的に、1つ又は複数の第1のセンサ110が、実質的に所望の出力値122に相当し得る出力値を検出するものとしてよい。
【0049】
図2Aは、物理的なプロセス又は化学的なプロセスを実施することができる第2の装置208を備えた第2のシステム200を示している。
【0050】
第2のシステム200は、第1のシステム100に類似するものとしてよい。従って、第2のシステム200は、第2の制御装置206と、1つ又は複数の第2のセンサ210とを含むものとしてよい。第2の制御装置206は、少なくとも1つの(即ち、厳密に1つ又は1つよりも多くの)入力変数の各(提供された)第2の入力パラメータ値202に従って第2の装置208を制御するように構成されるものとしてよい。具体的には、第2の制御装置206は、第2の装置208と周囲との相互作用を、1つ(又は複数)の第2の入力パラメータ値202に従って制御することができる。(少なくとも1つの入力変数の)各入力変数に対して各第2の入力パラメータ値202を提供することができるので、これは、以下においては、少なくとも1つの第2の入力パラメータ値202とも称される。第2の装置208は、少なくとも1つの第2の入力パラメータ値202に従って、物理的なプロセス又は化学的なプロセスを実行するように構成されるものとしてよい。
【0051】
1つ又は複数の第2のセンサ210は、物理的なプロセス又は化学的なプロセスの結果を検出するように構成されるものとしてよい。物理的なプロセス又は化学的なプロセスの結果は、例えば図1Aに関して説明したように、例えば、製造された製品の特性又は加工されたワークピースの特性(例えば、硬度、強度、密度、マイクロ構造、マクロ構造、化学組成等)、ロボットの技能(例えば、対象物のピックアップ)の成功又は失敗、カメラによって撮影された画像の解像度等であるものとしてよい。プロセスの結果を、少なくとも1つの(即ち、厳密に1つ又は1つよりも多くの)出力変数を用いて表すことができる。例えば、別のプロセスの結果を複数の第1の出力変数を用いて表し、物理的なプロセス又は化学的なプロセスの結果を複数の第2の出力変数を用いて表すことができる。この場合、複数の第1の出力変数は、第2の出力変数のうちの1つ又は複数の(例えばすべての)出力変数を有するものとしてよく、又は、その逆であるものとしてよい。例えば、複数の第1の出力変数のうちの1つ又は複数の出力変数と、複数の第2の出力変数のうちの1つ又は複数の出力変数とが一致するものとしてよい。この結果を、1つ又は複数のセンサ110に関連して説明したように、物理的なプロセス若しくは化学的なプロセスの間に、又は、物理的なプロセス若しくは化学的なプロセスに続いて求めることができる。
【0052】
1つ又は複数の第2のセンサ210は、少なくとも1つの出力変数の第2の出力値212を検出するように構成されるものとしてよい。例えば、複数の出力変数のうちの各出力変数に対する各第2の出力値212の検出が可能である。少なくとも1つの第2の入力パラメータ値202及び少なくとも1つの第2の出力値212は、第2の測定点230を形成することができる。種々の実施形態によれば、複数の第2の測定点を、既知の第2の測定点Dとして求めることができる。
【0053】
既知の第2の測定点Dを、式(2)によって表すことができる。
【数2】
ここで、Nは、既知の第2の測定点の数であり、xt,iは、各既知の第2の測定点iの少なくとも1つの入力パラメータ値202であり、yt,iは、各既知の第2の測定点iの少なくとも1つの出力値212である。
【0054】
第1のシステム100と同様に、第2のシステム200は、既知の第2の測定点Dを格納する少なくとも1つのメモリを備える記憶装置を含むものとしてよい。
【0055】
第1の事後モデル114も、第2の事後モデル214も、特定の少なくとも1つの入力変数に対して、少なくとも1つの出力変数の精度、ひいては各モデルの精度に関する不確かさを有し得る。これらの不確かさは、既知の測定点に関連する。各モデルの予測は、期待値もこの期待値に関する不確かさの尺度も含むものとしてよい。即ち、各モデルの予測は、各出力値に対する、値における分布(例えば正規分布)を含むものとしてよい。具体的には、事後モデルは、既知の測定点に関する入力変数と出力変数との間の関係を表すことができ、ここでは、既知の測定点間の領域も予測される。予測されたこれらの領域h、ある程度の不確かさを有しており、測定点の数が多くなるほど、不確かさが減少し得ることを理解されたい。このような不確かさは、例えば、測定点がわずかしか存在していない場合には、極めて重要であり得る。ノイズ及び/又は妨害に起因して、各測定点が不確かさを有し得ることも理解されたい。
【0056】
種々の実施形態によれば、第1の事後モデル114及び既知の第2の測定点Dを取り入れて、第2の事後モデル214を求めることができる。種々の実施形態によれば、第2の事後モデル214を求める際に、既知の第1の測定点Ds(2)に関する第1の事後モデル114の不確かさも、既知の第2の測定点Dに関する第2の事後モデル214の不確かさも考慮される。ここでは、測定された第1の出力値が存在していない測定箇所における第1の事後モデルの不確かさ(即ち、1つ又は複数の入力変数の入力パラメータ値)は、極めて重要であり得る。以下においては、2つの事後モデル114、214の不確かさを考慮することができる2つのコンセプト(アプローチとも称される)を説明する。種々の実施形態によれば、システム200は、第2の事後モデル214を求めるように構成されているコンピュータを含むものとしてよい。
【0057】
I)第2の事後モデル214を求めるための第1のコンセプト(シーケンシャルな階層的なガウスプロセスとも称される):
第1の事後モデル114は、第1の事後確率分布p(fs(2)|Ds(2))を含むものとしてよい。
【0058】
コンピュータは、第1の事後確率分布p(fs(2)|Ds(2))(例えば、p(f|D))に基づいて、ガウスプロセスを求めるように構成されるものとしてよく、これは、第1の事後確率分布p(f|D)(ひいては第1の事後モデル114)から関数
【数3】
を引き出すことによって行われる。この関数を、ランダムに、第1の事後確率分布p(f|D)から引き出すことができ、ここでは用語「ランダム」によって、この関数が、第1の事後確率分布p(f|D)の確率に関連することを示すことができる。この関数は、第2の事後モデル214の例示的な期待値関数であるものとしてよい。コンピュータは、このようにして、各ガウスプロセスに対して、第1の事後モデル114から事前期待値関数
【数4】
を引き出すことによって、複数のガウスプロセスを求めることができる。種々の実施形態によれば、複数のガウスプロセスの各ガウスプロセスは、同一の共通の共分散関数kを含む。従って、複数のガウスプロセスの各ガウスプロセスを、
【数5】
として表すことができ、ここでは、複数のガウスプロセスの事前期待値関数
【数6】
は、相互に相違するものとしてよい。
【0059】
コンピュータは、(例えば、ベイズモデル平均(英語でBayesian Model Averaging)を用いて)、複数のガウスプロセスの平均値
【数7】
として、第2の事前モデルf(第2のモデルのアプリオリとも称される)を求めるように構成されるものとしてよい。第2の事前モデルfは、期待値関数として、複数のガウスプロセスの期待値関数の平均値
【数8】
を含むものとしてよい。複数のガウスプロセスの期待値関数
【数9】
は、相互に相違するものとしてよいので、平均化された第2の事前モデルfは、共分散関数を有することができ、これは、共通の共分散kも、別の共分散も有しており、別の共分散は、複数のガウスプロセスの期待値関数
【数10】
の散乱を表している。従って、この別の共分散は、第1の事後確率分布p(f|D)、ひいては第1の事後モデル114の不確かさに関連する。具体的には、第2の事前モデルfの共分散関数は、共分散kに加えて、第1の事後モデル114の不確かさを表している。第2の事前モデルfの平均化されたガウスプロセスを、
【数11】
として表すことができ、ここでは、cov(f|D)は、別の共分散である。別の共分散は、第1の事後モデル114のガウスプロセスの共分散関数であるものとしてよい。
【0060】
コンピュータは、既知の第2の測定点Dに合わせて第2の事前モデルfを調整することによって、第2の事後モデル214(第2のモデルのアポステリオリとも称される)を求めるように構成されるものとしてよい。第2の事後モデル214は、第2の事後確率分布p(f|D)を含むものとしてよい。
【0061】
概して、モデルの事前モデルは、既知の測定点に合わせたモデルの調整前の、事前ビリーフ(英語でprior belief)であるものとしてよい。事前モデルの事前ビリーフを、期待値関数m(・)及び共分散関数(カーネル関数とも称される)k(・,・)を有するガウスプロセスgp(m,k)として表すことができる。既知の測定点に合わせて事前モデルを調整することによって、属する事後モデルを求めることができる。事後モデルは、事後モデルの1つの評価値点Xにおける、属する事後期待値関数と属する事後共分散関数とを有するガウスプロセスとして、事後確率分布を含むものとしてよい。概して、2つの点の間の共分散が規定されるものとしてよい。特に、これらの2つの点は、同一の点であるものとしてもよい。評価値点Xにおけるガウスプロセスの事後期待値関数が、例示的に、既知の第2の測定点Dに合わせた第2の事前モデルfの調整に対して、式(3)において示されており、属する事後共分散関数が式(4)において示されている。
【数12】
【数13】
ここで
【数14】
は、既知の第2の測定点の入力パラメータ値202、xt,i(ただし、i=1、乃至、i=N,)であり、
【数15】
は、各属する出力値212、yt,iである。各出力値212、yt,iを、期待値E(f|xt,i,D)及び分散cov(f|xt,i,D)+σtを有する正規分布によって表すことができる。同様に、式(3)及び式(4)に従って、第1の事前モデルfを既知の第1の測定点Dに合わせて調整することによって第1の事後モデル114を求めることができる。
【0062】
第2の事後モデル214の共分散関数を、第1の事後モデルの共分散関数k(第1のカーネル関数とも称される)及び共通の共分散関数k(複数のガウスプロセスの第2のカーネル関数又は共通の共分散関数とも称される)に基づいて表すことができる。第1のモデル及び第2のモデルの共通の共分散関数を、式(5)に従って表すことができる。
【数16】
ここでは、第1の事前モデルも第2の事前モデルも、第1のカーネル関数kを取り入れて求めることができる。第2の事前モデルの共分散関数を、第1の事後共分散関数cov(f|D)と第2のカーネル関数kとの和として求めることができる。転移学習において、第2の事前モデルfを、具体的には、第1の事後モデルに対する差(例えば差分)として学習することができる。ここでは、この差が、第1の事後モデルの不確かさを考慮する(式(5)を参照)。種々の実施形態によれば、この差の学習を、高められた効率で行うことができ、これによって、モデルの学習時及びベイズ最適化によるプロセスの最適化時に、収束が(先行するモデルの不確かさが考慮されない転移学習と比較して)より速くなり得る。
【0063】
ベイズ最適化時に、カーネル関数(例えば、第1のカーネル関数及び/又は第2のカーネル関数)のハイパーパラメータの適応化を行うことができる(ハイパーパラメータ最適化とも称される)。例えば、第1の事前モデルのハイパーパラメータの適応化(例えば最適化)を、既知の第1の測定点Dがこの第1の事前モデルによって表される確率が高くなる(例えば、最大になる)ように行うことができる。例えば、第2の事前モデルのハイパーパラメータの適応化(例えば最適化)を、既知の第2の測定点Dがこの第2の事前モデルによって表される確率が高くなる(例えば、最大になる)ように行うことができる。この場合、第1の事前モデルのハイパーパラメータを一定に保つことができる。第1のカーネル関数kのハイパーパラメータを固定することによって、第2の事前モデルが既知の第2の測定点に合わせて調整される際に、第1の事後モデル114の不確かさを維持することができる。
【0064】
種々の実施形態によれば、既知の第1の測定点D、既知の第2の測定点D、第1のカーネル関数k及び第2のカーネル関数kに基づいて、第1の事後モデル114を取り入れて、第2の事後モデル214をアルゴリズム1に従って求めることができる。
【0065】
アルゴリズム1:第1のコンセプトに従った第2の事後モデル214の学習
入力:D、D、k、k
出力:p(f|D
1.(既知の第1の測定点が事前に正規化されている場合には、例えば、
【数17】
として)第1の事前モデルを規定する。
2.第1のモデルを、既知の第1の測定点Dがこの第1のモデルによって表される確率が最大になるように、最適化する。
3.最適化されたハイパーパラメータを使用して、既知の第1の測定点Dに合わせて第1のモデルfを調整することによって、(第2の事後モデルに対して定式化されているが、第1の事後モデルにも同様に当てはまる)式(3)及び式(4)を使用して、第1の事後モデル114を求める。
4.第2の事前モデルを規定する。
【数18】
5.第2のモデルのハイパーパラメータを、既知の第2の測定点Dがこのモデルによって表される確率が最大になるように、最適化する(第1のモデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
6.第2のモデルの最適化されたハイパーパラメータを使用して、既知の第2の測定点Dに合わせて第2のモデルfを調整することによって、式(3)及び式(4)を使用して、第2の事後モデル214を求める。
【0066】
ここで、上述したように、第2の事前モデルfを複数のガウスプロセスの平均値
【数19】
として求めることによって、(アルゴリズム1における3.において)第2の事前モデルを規定することができる。
【0067】
上述のように、第1のカーネル関数kのハイパーパラメータを不変のまま保つことができる。具体的には、新たな測定点に対して、アルゴリズム1の4.だけを実行することによって、第2の事後モデル214をベイズ最適化によって学習することができる。
【0068】
第2の事前モデル及び第2の事後モデルへの第1の事後モデル114の不確かさの伝送(不確かさの伝達/伝搬とも称される)によって、データ効率も最適化効率も高くなる。なぜなら、必要な測定データの数が減少し、これによって、モデルの学習にかかるコスト(例えば、時間的なコスト及び/又は費用支出)を削減することができるからである。
【0069】
II)第2の事後モデル214を求めるための第2のコンセプト(強化された階層的なガウスプロセスとも称される):
第1のコンセプトと同様に、第2のコンセプトにおいて、複数のガウスプロセスを
共通の共分散関数kによって、
【数20】
に従って求めることができる。複数のガウスプロセス
【数21】
の期待値関数
【数22】
の差分は、第1の事後モデルの不確かさを特徴付けることができる。第1のコンセプトとは異なり、第2のコンセプトにおいては、複数のガウスプロセス
【数23】
の各ガウスプロセスを、それぞれ、既知の第2の測定点Dに合わせて、式(3)及び式(4)に従って調整することができる。種々の実施形態によれば、第2の事後モデルを、調整された複数のガウスプロセスの平均値として求めることができる。この場合、複数のガウスプロセス
【数24】
の期待値関数
【数25】
の差分は、第2の事後モデルの共分散関数に直接的に影響を及ぼし、従って、第2の事後モデルの共分散関数は、第1の事後モデルの不確かさも考慮する。
【0070】
2つのモデルの共通のカーネル関数を、第1の事後モデルの第1のカーネル関数k及び第2のカーネル関数kに基づいて、式(6)に従って表すことができる。
【数26】
ここで、「*」は、評価点を表し、
【数27】
は、第1の事後モデルから伝送された不確かさを表す付加的な共分散項である。
【数28】
は、式(7)に従って表すことができる。
【数29】
ここで、
【数30】
であり、
【数31】
は、既知の第2の測定点及び評価点において評価された、第1の事後モデルの共分散行列のブロックである。
【0071】
第2の事後モデル214の学習をアルゴリズム2に従って行うことができる。
【0072】
アルゴリズム2:第2のコンセプトに従った第2の事後モデルの学習
入力:D、D、k、k
出力:p(f|D
1.(既知の第1の測定点が事前に正規化されている場合には、例えば、
【数32】
として)第1の事前モデルを規定する。
2.第1のモデルを、既知の第1の測定点Dがこの第1のモデルによって表される確率が最大になるように、最適化する。
3.最適化されたハイパーパラメータを使用して、既知の第1の測定点Dに合わせて第1のモデルfを調整することによって、(第2の事後モデルに対して定式化されているが、第1の事後モデルにも同様に当てはまる)式(3)及び式(4)を使用して、第1の事後モデル114を求める。
4.第2の事前モデルを規定する。
【数33】
5.第2のモデルのハイパーパラメータを、既知の第2の測定点Dがこのモデルによって表される確率が最大になるように、最適化する(第1の事前モデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
6.最適化されたハイパーパラメータを使用して、既知の第2の測定点Dに合わせて第2のモデルfを調整することによって、式(3)、式(4)を使用して、及び、式(7)による付加的な共分散項を追加して、第2の事後モデル214を求める。
【0073】
図2Bには、種々の実施形態による、学習済みの第2の事後モデル214による第2の装置208の制御が示されている。第2の制御装置206には、少なくとも1つの出力変数の所望の出力値222が供給されるものとしてよい。選択的に、制御装置206は、他のパラメータ値及び/又は調整に基づいて所望の出力値を求めることができる。制御装置206は、第2の事後モデル214に従って所望の出力値222に割り当てられている、少なくとも1つの入力変数の入力パラメータ値226を求めるように構成されるものとしてよい。制御装置206は、物理的なプロセス又は化学的なプロセスを実行するために、第2の装置208を、少なくとも1つの入力変数の求められた入力パラメータ値に従って制御することができる。任意選択的に、1つ又は複数の第2のセンサ210は、実質的に所望の出力値222に相当し得る出力値を検出することができる。
【0074】
図2Cには、種々の実施形態による第2の事後モデル214の適応化が示されている。種々の実施形態によれば、第2の事後モデル214の適応化を、ベイズ最適化を用いて行うことができる。ここでは、ベイズ最適化を用いて付加的な第2の測定点を求めることができ、付加的に、付加的な第2の測定点に合わせて第2の事後モデル214を調整することができる。新たな第2の測定点を、第2の事後モデル214に基づいて、獲得関数α(f|x,D)(例えば、参考文献[2]及び/又は参考文献[3]に従った獲得関数)を用いて、例えば、式(8)に従って選択することができる。
【数34】
ここで、Dは、少なくとも1つの入力変数の許容されたすべての値である。具体的には、少なくとも1つの入力変数の入力パラメータ値
【数35】
を求めることができ、属する出力値を測定することができる。求められた入力パラメータ値
【数36】
及び測定された出力値は、新たな第2の測定点を形成することができる。
【0075】
例えば、制御装置206は、獲得関数を用いて、新たな第2の測定点232の入力パラメータ値216を選択することができる。制御装置206は、求められた入力パラメータ値216に従って第2の装置208を制御することができ、1つ又は複数の第2のセンサ210は、新たな第2の測定点232の属する出力値218を検出することができる。種々の実施形態によれば、付加的に、新たな第2の測定点232に合わせて第2の事後モデル214を調整することができる。この適応化が行われた第2の事後モデル234は、少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を、事前に既知の第2の測定点D及び新たな第2の測定点232に対して表すことができる。具体的には、既知の第2の測定点Dが同様に、新たな第2の測定点232を含むものとしてよい。このようにして、任意の頻度で新たな第2の測定点を求めることができ、各反復において、ここで新たに既知となった第2の測定点に合わせて各第2の事後モデルを調整することができる。ここでも、第1のコンセプト及び第2のコンセプトにおいて、第1のカーネル関数kのハイパーパラメータを不変のまま保つことができる。このことによって、ベイズ最適化の効率を高めることができる。複数のガウスプロセスを明示的に求めることは必要ではなく、無限に多くのこのようなガウスプロセスの限界を表す実効式が評価可能であることを理解されたい。この実効式は、例えば、第2の事後モデルのハイパーパラメータが、新たな測定点に基づいて再び最適化される場合に評価可能である。
【0076】
新たな第2の測定点を求めること及び第2の事後モデルの適応化を行うことを、アルゴリズム3に従って説明することができる。
【0077】
アルゴリズム3:第2の事後モデル214のベイズ最適化
for i←1,2,…do:
1.第2の事後モデルを介した獲得関数の最適化x=argmaxα(f|x,D)を用いて入力パラメータ値xを見出す。
2.入力パラメータ値xに属する出力値y=y(x)を求める。
3.既知の第2の測定点Dに、新たな測定点(x,y)を追加する。
【数37】
4.既知の第2の測定点Dに基づいて、第2の事後モデルの適応化を行う。
end for
【0078】
図2Dには、種々の実施形態による、適応化が行われた第2の事後モデル234による第2の装置208の制御が示されている。これを、図2Bに関連して説明した、第2の装置208の制御に類似して行うことができる。第2の制御装置206には、少なくとも1つの出力変数の所望の出力値222が供給されるものとしてよく、制御装置206は、適応化が行われた第2の事後モデル234に従って割り当てられている、少なくとも1つの入力変数の入力パラメータ値246を求めることができる。制御装置206は、物理的なプロセス又は化学的なプロセスを実行するために、少なくとも1つの入力変数の求められた入力パラメータ値246に従って第2の装置208を制御することができる。
【0079】
種々の実施形態によれば、第2の事後モデルの学習を、複数の他のモデルに基づいてシーケンシャルに行うことができる。具体的には、第2の事後モデルを学習するために第1の事後モデルを使用する前に、さらに別の事後モデル(以下においては、第3の事後モデルと称される)に基づいて、第1の事後モデルの学習を行うことができる。このさらに別の事後モデルは、同様に、またさらに別の事後モデルに基づいて学習されたものであるものとしてよい。
【0080】
例えば、第3の事後モデルは、物理的なプロセス又は化学的なプロセスに関連するさらに別のプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができる。第1の事後モデルを、第3の事後モデルを取り入れて、アルゴリズム1又はアルゴリズム2に従って、第1の事後モデルを取り入れて第2の事後モデルを求めるために上記で説明したように、求めることができる。第3の事後モデルは、既知の第3の測定点Ds(1)に基づいて求めることができ、又は、第3の事後モデルは、既知の第3の測定点Ds(1)に基づいて求められているものとしてよい。本明細書において説明されるように、既知の第3の測定点のような既知の測定点を、シミュレーションを用いて求めることもできる。
【0081】
このような転移学習の具体例として、既知の第3の測定点をシミュレーションから求めることができ、第3の事後モデルはこの関係を表すことができる;既知の第1の測定点を、生産システムと類似の実験装置において、実験室で測定することができ、第1の事後モデルはこの関係を表すことができる;既知の第2の測定点を生産システムにおいて測定することができ、第2の事後モデルは、生産システムの入力変数と出力変数との関係を表すことができる。
【0082】
種々の実施形態によれば、複数の他のn個のモデルに対して、第2の事後モデル214の学習がシーケンシャルに行われるものとしてよい。ここでは、別の各モデルを、先行する各別のモデルを取り入れて、本明細書において第1の事後モデルを取り入れた第2の事後モデルの学習に対して説明されたように、求めることができる。具体的には、第2の事後モデル214を、n個の相互に積層されたガウスプロセスのスタックとみなすことができる。
【0083】
第1のコンセプトに関して、すべてのモデルの共通のカーネル関数を式(9)に従って表すことができる。
【数38】
【0084】
第2の事後モデル214を、第1のコンセプトに従ってアルゴリズム4を用いて求めることが可能である(例えば、学習が可能である)。
【0085】
アルゴリズム4:第1のコンセプトに従った第2の事後モデル214の学習
入力:各既知の測定点(Ds1,Ds2,…,D)及び各カーネル関数(ks1,ks2,…,k
出力:p(f|D
1.(属する既知の測定点Ds1が事前に正規化されている場合には、例えば、
【数39】
として)i=1に対する事前モデルを規定する。
2.i=1のモデルのハイパーパラメータを、属する既知の測定点Ds1がこのモデルによって表される確率が最大になるように、最適化する。
3.最適化されたハイパーパラメータを使用して、属する既知の測定点Ds1に合わせてモデルfs1を調整することによって、i=1に対する事前モデルp(fs1|Ds1)を求める。
4.i=2に対する事前モデルを規定する。
【数40】
5.i=2のモデルのハイパーパラメータを、属する既知の測定点Ds3がこのモデルによって表される確率が最大になるように、最適化する(i=1のモデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
6.最適化されたハイパーパラメータを使用して、属する既知の測定点Ds2に合わせてモデルfs2を調整することによって、i=2に対する事前モデルp(fs2|Ds2)を求める。
7.…
8.第2の事前モデルを規定する。
【数41】
9.第2の事前モデルのハイパーパラメータを、既知の第2の測定点Dがこの第2のモデルによって表される確率が最大になるように、最適化する(i=1,…,nのモデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
10.最適化されたハイパーパラメータを使用して、既知の第2の測定点Dに合わせて第2のモデルfを調整することによって、第2の事後モデル214を求める。
【0086】
第2のコンセプトに関して、他のすべてのn個のモデルの共分散を有するために、第2の事後モデル214の共分散関数を拡張することができる。この場合、すべてのモデルの共通のカーネル関数を式(10)に従って表すことができる。
【数42】
【0087】
具体的には、拡張された共分散関数は、ブロック対角線における他のすべてのn個のモデルの共分散を含むものとしてよい。選択的に、第1の別のモデルを除く各他のモデルを予測するために、付加的な共分散項が追加されるものとしてもよい。これによって、サイズ(2n-1)*(2n-1)のカーネル関数マトリクスが得られる。この場合には、式(6)における表現
【数43】
は、i=1を除く他のすべてのモデルに対して拡張可能であり、かつ、式(11)に従ってすべてのモデルの共通のカーネル関数が表され得る。
【数44】
【0088】
第2の事後モデル214を、第2のコンセプトに従ってアルゴリズム5を用いて求めることが可能である(例えば、その学習が可能である)。
【0089】
アルゴリズム5:第2のコンセプトに従った第2の事後モデルの学習
入力:各既知の測定点(Ds1,Ds2,…,D)及び各カーネル関数(ks1,ks2,…,k
出力:p(f|D
1.(属する既知の測定点Ds1が事前に正規化されている場合には、例えば、
【数45】
として)i=1に対する事前モデルを規定する。
2.i=1のモデルのハイパーパラメータを、属する既知の測定点Ds1がこのモデルによって表される確率が最大になるように、最適化する。
3.最適化されたハイパーパラメータを使用して、属する既知の測定点Ds1に合わせてモデルfs1を調整することによって、i=1に対する事前モデルp(fs1|Ds1)を求める。
4.i=2に対する事前モデルを規定する。
【数46】
5.i=2のモデルのハイパーパラメータを、属する既知の測定点Ds3がこのモデルによって表される確率が最大になるように、最適化する(i=1のモデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
6.最適化されたハイパーパラメータを使用して、属する既知の測定点Ds2に合わせてモデルfs2を調整することによって、i=2に対する事前モデルp(fs2|Ds2)を求める。
7.…
8.第2の事前モデルを規定する。
【数47】
9.第2のモデルのハイパーパラメータを、既知の第2の測定点Dがこの第2のモデルによって表される確率が最大になるように、最適化する(i=1,…,nのモデルのハイパーパラメータはこのステップにおいて一定に保たれる)。
10.最適化されたハイパーパラメータを使用して、既知の第2の測定点Dに合わせて第2のモデルfを調整することによって、及び、式(7)による付加的な共分散項を追加して、第2の事後モデル214を求める。
【0090】
他のn個のモデルに基づく(例えば、アルゴリズム1、アルゴリズム2、アルゴリズム3又はアルゴリズム4による)第2の事後モデル214の、本明細書において説明された学習では、モデルの不確かさを考慮する従来のベイズカーネル方法と比較して、第2の事後モデル214を求めるための全体的な計算複雑性が低減される。全体的な計算複雑性は、(i)別のモデルの学習のための計算複雑性と、(ii)すべての他のモデルが学習済みであると仮定した、事後モデル(例えば、第2の事後モデル214)の学習に対する計算複雑性と、(iii)学習済みのモデルによる予測に対する計算複雑性とに分割可能である。表1は、従来のベイズカーネル方法、参考文献[1]による階層的なガウスプロセス、第1のコンセプトによるシーケンシャルな階層的なガウスプロセス、及び、第2のコンセプトによる強化された階層的なガウスプロセスの計算複雑性(i)、(ii)、(iii)の対比を示している。表1においては、Nは、v=1,2,…,nであるとして、
【数48】
に従った、すべての他のn個のモデルの既知の測定点の数であり、Nは、学習されるべき目標モデルの既知の測定点の数(例えば、既知の第2の測定点の数)である。
【0091】
【表1】
【0092】
他のモデルは、ベイズ最適化の開始時に学習可能であり、ベイズ最適化中の再度の学習は不要である。従って、他のモデルの学習の計算複雑性(i)は、全体的な計算複雑性に対して比較的小さい影響を有する。事後モデルの学習は、ベイズ最適化の各反復において一度、実行されるものとしてよく、これによって、各反復において新たに検出された測定点に関して事後モデルの適応化が行われる(例えば、アルゴリズム3における4.を参照)。表1に示されているように、従来のベイズカーネル方法による事後モデルの学習は、既知の測定点の全体数N+Nで三乗に(即ち、3の累乗によって)スケーリングされ、従って、これはベイズ最適化における制限的なファクタとなり得る。通常、学習されるべき目標モデルの既知の測定点の数Nは、他のすべてのn個のモデルの既知の測定点の数Nよりも格段に小さいものとしてよい(即ち、N<<N)。このような一般的な場合には、第1のコンセプトによる事後モデルの学習及び第2のコンセプトによる事後モデルの学習は、計算複雑性を、三乗のスケーリングからNにおける二乗の関係へ低減させることができる。さらに、第1のコンセプトによる事後モデルの学習時及び第2のコンセプトによる事後モデルの学習時には、学習されるべきモデルのハイパーパラメータの最適化しか必要ではないので、すべてのモデルが一緒に最適化される従来のベイズカーネル方法に比較して、最適化されるハイパーパラメータが少なくなり、これによって計算複雑性がさらに低減される。学習済みのモデルの予測は、獲得関数の最適化の間、ベイズ最適化の各反復において複数回実行されるものとしてよい(例えば、アルゴリズム3における1.を参照)。従って、学習済みのモデルの予測に対する計算複雑性(iii)は、同様に、全体的な計算複雑性にとって関連性を有する。表1に示されているように、第1のコンセプト及び第2のコンセプトの計算複雑性(iii)は、従来のベイズカーネル方法の計算複雑性(iii)に相当する。参考文献[1]は、このような計算複雑性(iii)を低減させるが、参考文献[1]は、他のn個のモデルの不確実性を考慮するための根拠のある手法を提示していない。基本的に、他のモデルの個々の測定値間の共分散をマッピングすることはできない。統計的なモデルの枠内において、他のn個のモデルの不確かさを正しく考慮することによって、ベイズ最適化の効率を高めることができる。
【0093】
説明のために図3Aにおいては、β=1である、参考文献[1]による階層的なガウスプロセス316、第1のコンセプトによるシーケンシャルな階層的なガウスプロセス320、及び、第2のコンセプトによる強化された階層的なガウスプロセス318が例示的に視覚化されている。図3Aには、例示的な第1の事後モデルによってモデル化されたソース関数308と、例示的な第2の事後モデルによってモデル化された目的関数314とが示されており、これらは、それぞれ入力パラメータ値302と出力値304との間の関係を表している。ソース関数308を表す第1の事後モデルは、既知の第1の測定点D,306に基づいて求められているものとしてよく、又は、ソース関数308を表す第1の事後モデルは、既知の第1の測定点D,306に基づいて求めることができる。第2の事後モデルによって表される目的関数314に対しては、既知の第2の測定点D、312が存在し得る。イラストa)は、既知の第1の測定点D、306が存在していない右側の領域において、第1の事後モデルが、比較的高い不確かさ310を有することを示している。イラスト(b)は、β=1である、参考文献[1]による階層的なガウスプロセス316を用いて学習された事後モデルが、この右側の領域における不確かさを低く見積もることを示している。これに対して、イラスト(b)及びイラスト(c)は、第1のコンセプトによるシーケンシャルな階層的なガウスプロセス320を用いて学習済みの事後モデルと、第2のコンセプトによる強化された階層的なガウスプロセス318を用いて学習済みの事後モデルとの双方が、この右側の領域における不確かさを考慮していることを示している。
【0094】
図3Bは、従来のベイズカーネル方法360(転移学習を伴わない)と、β=1である、参考文献[1]による従来のガウスプロセス316と、第1のコンセプトによるシーケンシャルな階層的なガウスプロセス320と、第2のコンセプトによる強化された階層的なガウスプロセス318との対比を示している。イラスト332は、別のモデル(n=1)に対するベイズ最適化を示しており、これは、例示的に、1次元Forrester関数338、2次元Brain関数340、3次元Hartmann3関数342及び6次元Hartmann6関数344に対して、最適化反復336の関数としてシンプルリグレット334を伴っている。イラスト352は、複数の他のモデルに対するベイズ最適化を示しており、これは、例示的に、3つの他のモデル(n=3)を含むHartmann6関数354、5つの他のモデル(n=5)を含むAlpine関数356に対して、最適化反復336の関数としてシンプルリグレット334を伴っている。シンプルリグレット値が小さいほど、見出される最適化はより良好になり、小さいシンプルリグレット値が見出される最適化反復336が少なくなるほど、ベイズ最適化の効率が高くなる。具体的には、図3Bは、第1のコンセプト及び第2のコンセプトによるベイズ最適化の効率の改善が、他の方法と比較して、次元数が増すほど向上することを示している(イラスト332、例えば、6次元Hartmann6関数344を参照)。複数の他のモデル(n>1)の場合についても著しい効率の向上が示されている(イラスト352、例えば、n=5であるAlpine関数356を参照)。
【0095】
具体的には、すべての上述のモデルの不確かさが伝達される(即ち、不確かさの伝搬)本明細書において説明された転移学習のコンセプトによって、ベイズ最適化が促進される。(例えば、相対的に極めて高いコスト(例えば、時間的なコスト、エネルギ消費、費用支出等)によって)、例えば、モデルを求めるためにわずかな測定点しか存在しない又はわずかな測定点しか検出可能でない場合には、本明細書において説明された転移学習は、不確かさの伝達に基づいて、学習の効率を大幅に高めることができる。従来のベイズ最適化方法は、不確かさを完全に考慮することによって計算技術的なコストを増加させ、又は、不確かさを全く考慮しないことによって学習済みのモデルの欠陥を生じさせ、かつ、測定点がわずかにしか存在していない場合には、モデルの顕著な不正確さを生じさせ得る。本明細書において説明されたコンセプトは、不確かさの考慮も、学習の比較的高い効率も実現することができる。本明細書において説明された転移学習は、不確かさが伝達されることによって、比較的高いデータ効率及び最適化効率を提供する。
【0096】
図4は、種々の実施形態による、物理的なプロセス又は化学的なプロセスを制御するための方法400のフローチャートを示している。
【0097】
方法400は、第1の事後モデルを取り入れて第2の事後モデルを求めることを含み得るものである(402において)。第2の事後モデルは、物理的なプロセス又は化学的なプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができる。第1の事後モデルは、物理的なプロセス又は化学的なプロセスに関連するプロセスの少なくとも1つの入力変数と少なくとも1つの出力変数との間の関係を表すことができる。
【0098】
(402において)第1の事後モデルを取り入れて第2の事後モデルを求めることは、共通の共分散関数を用いて複数のガウスプロセスを求めることを含み得るものである(402Aにおいて)。関数が第1の事後モデルから引き出されて、各ガウスプロセスの期待値を形成することによって複数のガウスプロセスのうちの各ガウスプロセスを求めることができる。
【0099】
種々の実施形態によれば、第2の事後モデルを、少なくとも、2つのコンセプトのうちの1つのコンセプト(アプローチとも称される)を用いて求めることができる。第1のコンセプトによれば、複数のガウスプロセスを、共通の共分散関数によって最初に平均化し、次いで既知の測定点に合わせて、平均化されたガウスプロセスを調整することができる。第2のコンセプトによれば、既知の測定点に合わせて複数のガウスプロセスをそれぞれ調整することができ、続いて、調整された複数のガウスプロセスを平均化することができる。
【0100】
第1のコンセプトによれば、(402において)第1の事後モデルを取り入れて第2の事後モデルを求めることは、さらに、複数のガウスプロセスの平均値として第2の事前モデルを求め、既知の測定点に合わせた事前モデルの調整を用いて第2の事後モデルを求めることを含み得るものである(402Bにおいて)。例えば、(402において)第1の事後モデルを取り入れて第2の事後モデルを求めることは、既知の第2の測定点Dが第2の事前モデルによって表される確率が高められる(例えば、最大になる)ように第2の事後モデルのハイパーパラメータを最適化することと、最適化されたハイパーパラメータを使用して、既知の第2の測定点Dに合わせて第2の事前モデルfを調整することとを含み得るものである。
【0101】
種々の実施形態によれば、第2のモデルのトレーニング又は学習(例えば、ハイパーパラメータ最適化)の際に、第1のモデルの共分散関数のハイパーパラメータが不変のまま保たれ得る。
【0102】
第2のコンセプトによれば、(402において)第1の事後モデルを取り入れて第2の事後モデルを求めることは、さらに、既知の測定点に合わせて複数のガウスプロセスの各ガウスプロセスを調整し、調整された複数のガウスプロセスの平均値として第2の事後モデルを求めることを含み得るものである(402Bにおいて)。第2のコンセプトにおいても、第1のモデルのハイパーパラメータが、第2のモデルのトレーニング時に新たに最適化される必要がないという利点を得ることができる。
【0103】
方法400は、さらに、第2の事後モデルを使用して、物理的なプロセス又は化学的なプロセスを制御することを含み得るものである(404において)。
図1A
図1B
図1C
図2A
図2B
図2C
図2D
図3A
図3B
図4
【外国語明細書】