IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

特開2022-185927評価装置、評価方法、およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022185927
(43)【公開日】2022-12-15
(54)【発明の名称】評価装置、評価方法、およびプログラム
(51)【国際特許分類】
   G06Q 50/04 20120101AFI20221208BHJP
【FI】
G06Q50/04
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021093865
(22)【出願日】2021-06-03
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100109210
【弁理士】
【氏名又は名称】新居 広守
(74)【代理人】
【識別番号】100137235
【弁理士】
【氏名又は名称】寺谷 英作
(74)【代理人】
【識別番号】100131417
【弁理士】
【氏名又は名称】道坂 伸一
(72)【発明者】
【氏名】潮田 幹生
(72)【発明者】
【氏名】原 伸夫
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC03
(57)【要約】
【課題】最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することができる評価装置を提供する。
【解決手段】評価装置100は、実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価する装置であって、実験済みの実験点および既知の特性点を示す実験結果データ222と、最適化目的を示す目的データ212と、制約条件を示す制約条件データ213とを取得する受信制御部10と、実験結果データ222、目的データ212および制約条件データ213に基づいて、未知の特性点の評価値を算出する評価値算出部12と、評価値を出力する評価値出力部13とを備え、評価値算出部13は、制約条件の適合度合いに応じた重み付けを、少なくとも1つの目的特性に対する評価値に付与する。
【選択図】図4
【特許請求の範囲】
【請求項1】
実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価する評価装置であって、
前記実験済みの実験点および前記既知の特性点を示す実験結果データを取得する第1受信手段と、
前記未知の特性点は、1または複数の目的特性の値を示し、少なくとも1つの目的特性が最適化目的を有し、当該最適化目的を示す目的データを取得する第2受信手段と、
前記少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データを取得する第3受信手段と、
前記実験結果データ、前記目的データおよび前記制約条件データに基づいて、前記未知の特性点の評価値を算出する算出手段と、
前記評価値を出力する出力手段と、を備え、
前記算出手段は、前記制約条件の適合度合いに応じた重み付けを、前記少なくとも1つの目的特性に対する評価値に付与する、
評価装置。
【請求項2】
前記制約条件は、少なくとも1つの制約範囲であり、
前記最適化目的には、目的特性を前記少なくとも1つの制約範囲のうちの何れかの制約範囲内に収める第1目的と、目的特性を最小化または最大化する第2目的とがあり、
前記算出手段は、
前記少なくとも1つの目的特性のそれぞれについて、
(i)前記評価値を算出するために用いられる当該目的特性の区間が前記少なくとも1つの制約範囲のそれぞれの外にある場合と、
(ii)前記区間が前記少なくとも1つの制約範囲のうちの何れかの制約範囲内であって、かつ、前記最適化目的が前記第1目的である場合と、
(iii)前記区間が前記少なくとも1つの制約範囲のうちの何れかの制約範囲内であって、かつ、最適化目的が前記第2目的である場合とで、
互いに異なる重み付け処理を行うことによって、前記評価値を算出する、
請求項1に記載の評価装置。
【請求項3】
複数の制御因子のそれぞれの所定の条件を満たす値を組み合わせることによって、前記候補実験点を作成する候補実験点作成手段をさらに備える、
請求項2に記載の評価装置。
【請求項4】
前記算出手段は、
前記少なくとも1つの制約範囲のうち、矩形と異なる形状の制約範囲に基づいて、前記評価値を算出する、
請求項2または3に記載の評価装置。
【請求項5】
前記少なくとも1つの制約範囲として複数の制約範囲がある場合、
前記算出手段は、
前記(ii)の場合を、さらに、複数の場合に場合分けし、前記複数の場合のそれぞれで互いに異なる重み付け処理を行うことによって、前記評価値を算出し、
前記複数の場合のそれぞれでは、前記複数の制約範囲のうちの互いに異なる制約範囲に前記区間が含まれている、
請求項2~4の何れか1項に記載の評価装置。
【請求項6】
前記算出手段は、
前記少なくとも1つの目的特性のそれぞれに優先度を付与し、
付与された前記優先度を用いて前記評価値を算出する、
請求項1~5の何れか1項に記載の評価装置。
【請求項7】
前記算出手段は、さらに、
前記候補実験点と1以上の前記実験済みの実験点のそれぞれとの間の距離のうちの最小距離を算出し、
前記出力手段は、さらに、
前記候補実験点に対応する前記最小距離を出力する、
請求項1~6の何れか1項に記載の評価装置。
【請求項8】
前記算出手段は、
モンテカルロ法を用いて前記評価値を算出する、
請求項1~7の何れか1項に記載の評価装置。
【請求項9】
前記算出手段は、
それぞれ評価方法であるPI(Probability of Improvement)およびEI(Expected Improvement)のうちの少なくとも1つを用いて、前記評価値を算出する、
請求項1~8の何れか1項に記載の評価装置。
【請求項10】
評価装置が、実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価する評価方法であって、
前記実験済みの実験点および前記既知の特性点を示す実験結果データを取得する第1受信ステップと、
前記未知の特性点は、1または複数の目的特性の値を示し、少なくとも1つの目的特性が最適化目的を有し、当該最適化目的を示す目的データを取得する第2受信ステップと、
前記少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データを取得する第3受信ステップと、
前記実験結果データ、前記目的データおよび前記制約条件データに基づいて、前記未知の特性点の評価値を算出する算出ステップと、
前記評価値を出力する出力ステップと、を含み、
前記算出ステップにおいて、前記制約条件の適合度合いに応じた重み付けを、前記少なくとも1つの目的特性に対する評価値に付与する、
評価方法。
【請求項11】
コンピュータが、実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価するためのプログラムであって、
前記実験済みの実験点および前記既知の特性点を示す実験結果データを取得する第1受信ステップと、
前記未知の特性点は、1または複数の目的特性の値を示し、少なくとも1つの目的特性が最適化目的を有し、当該最適化目的を示す目的データを取得する第2受信ステップと、
前記少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データを取得する第3受信ステップと、
前記実験結果データ、前記目的データおよび前記制約条件データに基づいて、前記未知の特性点の評価値を算出する算出ステップと、
前記評価値を出力する出力ステップと、を前記コンピュータに実行させ、
前記算出ステップにおいて、前記制約条件の適合度合いに応じた重み付けを、前記少なくとも1つの目的特性に対する評価値に付与する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般の工業製品開発または製造プロセス開発などに用いられる実験条件を評価する技術に関する。
【背景技術】
【0002】
工業製品開発または製造プロセス開発において、要求される目的特性の要件を満たすように、制御因子を最適な条件で制御する必要がある。例えば、電池の開発では、制御因子として正極厚み、負極厚み、セパレータ枚数、電解液イオン伝導度等を設定し、目的特性として容量、寿命、費用コスト等を設定する。
【0003】
制御因子と目的特性との間の関係性が物理式で表すことができるのであれば、数学的最適化手法で制御因子の最適解を探索することができる。しかし、その関係性が未知である場合、実験条件として制御因子の値の組み合わせ(すなわち実験点)を一組選択し、実際の実験を行う。実験結果として、その実験点に対応する目的特性の値の組み合わせ(すなわち特性点)を獲得する。この実験を繰り返すことで制御因子の最適解を探索する。
【0004】
一般に、複雑な工業製品開発または製造プロセス開発では、一回実験を実行するために、多大な金銭的または時間的コストを費やす。よって、効率的な開発業務遂行のためには、極力少ない実験回数で最適解を探索することが重要である。
【0005】
従来、実験計画法および応答曲面法を用いたアプローチがその最適解の探索に用いられてきた。しかし、それらの手法では、予測モデルの作成または最適解の探索段階において、解析者の試行錯誤を必要とし、一貫した手続きでの定量評価が困難である。
【0006】
近年、機械学習の分野において、ベイズ最適化を用いたデータ駆動型アプローチが注目されている(例えば、特許文献1、非特許文献1、および非特許文献2参照)。ベイズ最適化は、入出力の間の対応関係を表現する数理モデルとしてガウス過程を仮定した最適化手法である。実験結果が得られるごとに、設定された各実験点について、特性点の予測分布を算出する。各特性点の予測分布に基づいて、獲得関数と呼ばれる評価基準を使用して、最適な次の実験条件を選択する。これにより、解析者の力量に依らない定量的な評価が可能になり、最適解探索作業の自動化にも貢献できる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2019-113985号公報
【非特許文献】
【0008】
【非特許文献1】M.Emmerich, A.Deutz, J.W.Klinkenberg, "The computation of the expected improvement in dominated hypervolume of Pareto front approximations," Repport Technique, Leiden University, Vol.34, 2008.
【非特許文献2】M.Abdolshah, A.Shilton, S.Rana, S.Gupta, S.Venkatesh, "Expected Hypervolume Improvement with Constraints," International Conference on Pattern Recognition (ICPR), 2018.
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、上記各文献に記載の手法を用いた評価装置では、適用場面が限定的であるという課題がある。
【0010】
そこで、本開示は、最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用した評価装置を提供する。
【課題を解決するための手段】
【0011】
本開示の一態様に係る評価装置は、実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価する評価装置であって、前記実験済みの実験点および前記既知の特性点を示す実験結果データを取得する第1受信手段と、前記未知の特性点は、1または複数の目的特性の値を示し、少なくとも1つの目的特性が最適化目的を有し、当該最適化目的を示す目的データを取得する第2受信手段と、前記少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データを取得する第3受信手段と、前記実験結果データ、前記目的データおよび前記制約条件データに基づいて、前記未知の特性点の評価値を算出する算出手段と、前記評価値を出力する出力手段と、を備え、前記算出手段は、前記制約条件の適合度合いに応じた重み付けを、前記少なくとも1つの目的特性に対する評価値に付与する。
【発明の効果】
【0012】
本開示の評価装置によれば、最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することができる。
【図面の簡単な説明】
【0013】
図1図1は、実施の形態に係る評価装置の概略的な動作を説明するための図である。
図2図2は、実施の形態に係る各候補実験点および各特性点のそれぞれをグラフで表した一例を示す図である。
図3図3は、実施の形態に係る評価装置の構成を示す図である。
図4図4は、実施の形態に係る演算回路の機能構成を示すブロック図である。
図5図5は、実施の形態に係る設定情報の入力を受け付けるために表示部に表示される受付画像の一例を示す図である。
図6図6は、実施の形態に係る制御因子データの一例を示す図である。
図7図7は、実施の形態に係る目的データおよび制約条件データの一例を示す図である。
図8A図8Aは、実施の形態に係る規格範囲の一例を示す図である。
図8B図8Bは、実施の形態に係る規格範囲の他の例を示す図である。
図9図9は、実施の形態に係る評価装置の処理動作を示すフローチャートである。
図10A図10Aは、実施の形態に係る候補実験点データの一例を示す図である。
図10B図10Bは、実施の形態に係る候補実験点データの他の例を示す図である。
図11図11は、実施の形態に係る実験結果データの一例を示す図である。
図12図12は、実施の形態に係る評価値算出部による処理を説明するための図である。
図13図13は、実施の形態に係る予測分布データの一例を示す図である。
図14A図14Aは、実施の形態に係る改善領域の一例を示す図である。
図14B図14Bは、実施の形態に係る改善領域の他の例を示す図である。
図15A図15Aは、実施の形態に係る、改善領域の体積の算出方法を説明するための図である。
図15B図15Bは、実施の形態に係る、特性空間の全体を複数の小領域に分割する例を示す図である。
図15C図15Cは、実施の形態に係る小領域の下端点および上端点の一例を示す図である。
図16図16は、実施の形態に係る評価値データの一例を示す図である。
図17図17は、実施の形態の変形例1に係る規格範囲および管理範囲の一例を示す図である。
図18図18は、実施の形態の変形例2に係る評価値算出部による処理を説明するための図である。
図19図19は、実施の形態の変形例2に係る最小距離の一例を示す図である。
図20図20は、実施の形態の変形例2に係る最小距離データの一例を示す図である。
図21図21は、実施の形態の変形例2に係る評価値データの一例を示す図である。
【発明を実施するための形態】
【0014】
(本発明の基礎となった知見)
本発明者は、「背景技術」の欄において記載した上記特許文献1、非特許文献1、および非特許文献2に関し、以下の課題が生じることを見出した。
【0015】
複数の目的特性を同時に最適化する多目的ベイズ最適化に関する手法がいくつか提案されている。例えば、上記非特許文献1では、その一種であるEHVI(Expected Hypervolume Improvement)の最適解探索原理および具体的な算出法が開示されている。これにより、最適化したい目的特性が複数存在していても、最適解探索の定量評価が可能になる。
【0016】
また、工業製品開発または製造プロセス開発において、目的特性の値に関する制約条件として規格範囲が設けられている場合がある。例えば、「電池容量は1850~1950[mAh]の規格範囲に収まってほしい」、「寿命は3年を最小値として長いほどよい(すなわち、寿命の規格範囲の最小値は3年で、最大値は+∞)」等の規格範囲である。規格範囲がある場合に、従来のベイズ最適化を適用すると、計算効率の悪い探索をしたり、最適解ではない、別の領域に探索が進んだりする恐れがある。
【0017】
そこで、制約条件付きベイズ最適化に関する手法もいくつか提案されている。例えば、上記特許文献1の手法では、各候補実験点について、ガウス過程回帰により求まった予測分布から、規格範囲に収まる確率を算出し、その確率が或るしきい値を上回る候補実験点のみを抽出して、獲得関数を評価する。これにより、制約条件付き最適化問題に対応している。
【0018】
上記特許文献1の手法に、獲得関数としてEHVIを採用することもできる。しかし、複数の候補実験点のうち、規格範囲内に入った場合には暫定の最適解から大幅な改善が見込めるが、目的特性の値が規格範囲内に入る確率が低い候補実験点は、獲得関数の評価対象から除外されてしまう。したがって、EHVIが採用された上記特許文献1の手法では、計算コスト削減には貢献するが、必ずしも真の最適解を探索できるとは限らない。
【0019】
また、例えば、上記非特許文献2では、EHVIを制約条件がある場合に拡張したEHVIC(Expected Hypervolume Improvement with Constraints)が開示されている。上記非特許文献2に記載の獲得関数の設計手法は、規格範囲内に入る確率と改善量とを総合的に指標化し、すべての候補実験点について評価する。そのため、探索効率が向上する(すなわち、真の最適解が求まる)可能性が高い。しかしながら、上記非特許文献2に記載の獲得関数の設計手法では、最大化または最小化したい目的特性と、規格範囲内に収めたい目的特性とが異なっている。したがって、先述の例を用いると、「電池容量は1850~1950[mAh]であり、かつ、寿命を最大化させる実験点を探索したい」といった最適化問題には適用可能である。しかしながら、「寿命を3年以上として最大化させる実験点を探索したい」のように、最大化または最小化などの目的を有する目的特性に、規格範囲などの制約条件が付与された最適化問題には、上記非特許文献2の手法は適用できない。
【0020】
そこで、本開示の評価装置は、最適化問題の目的を有する目的特性に対して、制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することを目的とする。
【0021】
本開示の一態様に係る評価装置は、実験済みの実験点に対応する既知の特性点に基づいて、候補実験点に対応する未知の特性点をベイズ最適化によって評価する評価装置であって、前記実験済みの実験点および前記既知の特性点を示す実験結果データを取得する第1受信手段と、前記未知の特性点は、1または複数の目的特性の値を示し、少なくとも1つの目的特性が最適化目的を有し、当該最適化目的を示す目的データを取得する第2受信手段と、前記少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データを取得する第3受信手段と、前記実験結果データ、前記目的データおよび前記制約条件データに基づいて、前記未知の特性点の評価値を算出する算出手段と、前記評価値を出力する出力手段と、を備え、前記算出手段は、前記制約条件の適合度合いに応じた重み付けを、前記少なくとも1つの目的特性に対する評価値に付与する。
【0022】
これにより、算出手段が、実験結果データ、目的データおよび制約条件データに基づいて、未知の特性点の評価値を算出するときには、制約条件の適合度合いに応じた重み付けを、少なくとも1つの目的特性に対する評価値に付与する。この少なくとも1つの目的特性は最適化目的を有する。したがって、最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することができる。その結果、適用場面を拡張することができる。
【0023】
また、前記制約条件は、少なくとも1つの制約範囲であり、前記最適化目的には、目的特性を前記少なくとも1つの制約範囲のうちの何れかの制約範囲内に収める第1目的と、目的特性を最小化または最大化する第2目的とがあり、前記算出手段は、前記少なくとも1つの目的特性のそれぞれについて、(i)前記評価値を算出するために用いられる当該目的特性の区間が前記少なくとも1つの制約範囲のそれぞれの外にある場合と、(ii)前記区間が前記少なくとも1つの制約範囲のうちの何れかの制約範囲内であって、かつ、前記最適化目的が前記第1目的である場合と、(iii)前記区間が前記少なくとも1つの制約範囲のうちの何れかの制約範囲内であって、かつ、最適化目的が前記第2目的である場合とで、互いに異なる重み付け処理を行うことによって、前記評価値を算出してもよい。例えば、少なくとも1つの制約範囲は、1つの規格範囲であってもよく、規格範囲および管理範囲であってもよい。また、目的特性の区間は、例えば、少なくとも1つの目的特性によって表現される特性空間において、制約範囲および1以上の実験点(より具体的にはパレート点)などによって区分けされた区間である。
【0024】
これにより、各候補実験点に対して算出された評価値が出力されるため、評価装置のユーザは、それらの評価値に基づいて候補実験点を次の実験点として選択し、その実験点を用いた実験によって得られる特性点を、次の各候補実験点の評価値の算出に利用することができる。このような実験と評価値の算出および出力との繰り返しによって、各目的特性の最適化目的を満たす候補実験点の解、すなわち最適解を得ることができる。
【0025】
また、本開示の一態様に係る評価装置では、少なくとも1つの目的特性のそれぞれについて(i)~(iii)の場合で互いに異なる重み付け処理が行われる。したがって、目的特性の最適化目的が第1目的であっても、第2目的であっても、候補実験点の評価値をベイズ最適化に基づいて適切に算出することができる。つまり、目的特性の最適化目的が制約範囲内であっても、最大化または最小化であっても、候補実験点の評価値をベイズ最適化に基づいて適切に算出することができる。また、(iii)の場合は、目的特性の区間が制約範囲内であって、かつ、最適化目的が第2目的であるため、非特許文献2の手法とは異なり、最適化目的が最大化または最小化である目的特性に、制約条件として制約範囲がある場合であっても、評価値を定量的に適切に算出することができる。
【0026】
その結果、規格範囲などの制約範囲、すなわち制約条件がある最適化問題に対しても適用することができる。つまり、適用場面を拡張し、最適解の探索効率向上のための定量評価を行うことができる。
【0027】
また、複数の制御因子のそれぞれの所定の条件を満たす値を組み合わせることによって、前記候補実験点を作成する候補実験点作成手段をさらに備えてもよい。
【0028】
例えば、所定の条件は、複数の制御因子のそれぞれの比率変数の値の和が1であるという条件である。より具体的な一例では、その比率変数は、制御因子に対応する化合物などの材料の配合比である。したがって、複数種の化合物の配合比の組み合わせごとに、その組み合わせに対する評価値を算出することができる。その結果、それらの化合物の配合によって得られる合成材料の少なくとも1つの目的特性に対する最適解を適切に探索することができる。
【0029】
また、前記算出手段は、前記少なくとも1つの制約範囲のうち、矩形と異なる形状の制約範囲に基づいて、前記評価値を算出してもよい。
【0030】
これにより、例えば2つの目的特性によって表現される特性空間において、円形、楕円形、星形などの制約範囲に基づいて評価値が算出されるため、制約範囲の形状が矩形の場合に限定されることなく、適用場面をさらに拡張することができる。
【0031】
また、前記少なくとも1つの制約範囲として複数の制約範囲がある場合、前記算出手段は、前記(ii)の場合を、さらに、複数の場合に場合分けし、前記複数の場合のそれぞれで互いに異なる重み付け処理を行うことによって、前記評価値を算出し、前記複数の場合のそれぞれでは、前記複数の制約範囲のうちの互いに異なる制約範囲に前記区間が含まれていてもよい。
【0032】
例えば、複数の制約範囲は、規格範囲と、その規格範囲に含まれる管理範囲である。そして、(ii)の場合は、区間が規格範囲内および管理範囲外であって、かつ、最適化目的が第1目的である第1の場合と、区間が管理範囲内であって、かつ、最適化目的が第1目的である第2の場合とに、場合分けされる。また、例えば、第1の場合よりも第2の場合の方が大きい重みを用いた重み付け処理が行われる。このように、複数の制約範囲があり、(ii)の場合をさらに複数の場合に場合分けすることによって、複数の制約範囲のそれぞれに段階的に重み付けを行うことができる。したがって、目的特性の値が規格範囲に収まり、可能な限り管理範囲に収まって欲しいような場合であっても、評価値を適切に算出することができる。その結果、最適化問題に対する適用場面をさらに拡張することができる。
【0033】
また、前記算出手段は、前記少なくとも1つの目的特性のそれぞれに優先度を付与し、付与された前記優先度を用いて前記評価値を算出してもよい。
【0034】
これにより、少なくとも1つの目的特性に優先度が付されるため、高い優先度が付された目的特性を、低い優先度が付された目的特性よりも早く最適化目的に近づけることができる。
【0035】
また、前記算出手段は、さらに、前記候補実験点と1以上の前記実験済みの実験点のそれぞれとの間の距離のうちの最小距離を算出し、前記出力手段は、さらに、前記候補実験点に対応する前記最小距離を出力してもよい。
【0036】
これにより、各候補実験点に対応する最小距離が出力されるため、評価装置のユーザは、評価値だけでなく、その最小距離にも基づいて、次の実験点となる候補実験点を選択することができる。例えば、最適解探索の初期段階では、既に実験に用いられた実験点に近い候補実験点の評価値が大きくなる傾向があり、そのような候補実験点が次の実験に選択されても、最適化に大きく貢献しない可能性がある。したがって、ユーザは、例えば、評価値が比較的大きく、かつ、最小距離が比較的長い評価値に対応する候補実験点を次の実験点に選択することによって、評価値の精度を向上し、適切な最適化を行うことができる。
【0037】
また、前記算出手段は、モンテカルロ法を用いて前記評価値を算出してもよい。
【0038】
これにより、モンテカルロ法が近似手法であるため、評価値の算出の処理負担を軽減することができる。
【0039】
また、前記算出手段は、それぞれ評価方法であるPI(Probability of Improvement)およびEI(Expected Improvement)のうちの少なくとも1つを用いて、前記評価値を算出してもよい。
【0040】
これにより、各候補実験点について、特性空間における制約範囲内の体積を、最適化の改善量として算出し、その改善量から評価値を適切に算出することができる。
【0041】
以下、実施の形態について、図面を参照しながら具体的に説明する。
【0042】
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、同じ構成部材については同じ符号を付している。
【0043】
(実施の形態)
[概要]
図1は、本実施の形態における評価装置の概略的な動作を説明するための図である。
【0044】
本実施の形態における評価装置100は、複数の候補実験点のそれぞれに対する評価値を算出し、それらの評価値を示す評価値データ224を表示する。候補実験点は、実験点の候補とされる点である。実験点は、実験条件(実験空間上における各制御因子の値の組み合わせ)を示す。評価値は、その候補実験点にしたがった実験によって得られると予測される目的特性の評価結果を示す値である。例えば、評価値は、実験によって得られると予測される目的特性が最適化目的に合致している度合いを示し、評価値が大きいほど、その度合いは大きい。
【0045】
ユーザは、その評価値データ224によって示される各候補実験点の評価値を参照し、それらの候補実験点のうちの1つを次の実験点として選択する。ユーザは、その選択された実験点にしたがった実験を、実験設備を用いて行う。実験によって、その実験点に対応する特性点が得られる。特性点は、例えば目的特性の値を示し、複数の目的特性があれば、複数の目的特性の値の組み合わせとして示される。ユーザは、その得られた特性点を実験点に対応付けて評価装置100に入力する。その結果、評価装置100は、その実験によって得られた特性点を用いて、未選択の各候補実験点に対する評価値を再び算出し、それらの評価値を示す評価値データ224を再表示する。つまり、評価値データ224が更新される。評価装置100は、このような評価値データ224の更新を繰り返すことによって、目的特性の最適解を探索する。
【0046】
図2は、各候補実験点および各特性点のそれぞれをグラフで表した一例を示す図である。具体的には、図2の(a)のグラフは、実験空間に配置される各候補実験点を示し、図2の(b)のグラフは、特性空間に配置される各特性点を示す。
【0047】
実験空間における候補実験点は、図2の(a)に示すように、第1制御因子および第2制御因子の値の組み合わせに対応する格子点上に配置される。図2の(a)に示す各候補実験点に対応する特性点は、図2の(b)に示すように、特性空間に配置される。具体的には、候補実験点が実験点として選択され、その実験点にしたがった実験によって第1目的特性および第2目的特性のそれぞれの値が得られる場合、その実験点に対応する特性点は、その第1目的特性の値と第2目的特性の値との組み合わせによって表現される位置に配置される。ここで、候補実験点と特性点との間には1対1の対応関係があるが、その対応関係(すなわち、図2中の関数f)は未知である。
【0048】
実験を一回実行するとは、一つの候補実験点を選択し、その選択された候補実験点に対応する特性点との対応関係を一組獲得すること、として換言できる。
【0049】
また、図2の(b)に示すように、設定された規格範囲により、特性空間は規格範囲内領域と規格範囲外領域に分割される。例えば、目的特性の最適化目的は、目的特性の値の最大化または最小化であってもよい。また、本実施の形態では、最適化目的を有する目的特性に対して、規格範囲である制約条件が付与されていてもよい。制約条件は、目的特性に付与される条件であって、例えば、目的特性の値の範囲を条件として指定する制約範囲がある。制約範囲として、例えば、目的特性の規格によって定められる規格範囲や、ユーザが適宜設定可能な管理範囲などがある。
【0050】
なお、本実施の形態では、第1制御因子および第2制御因子のように、制御因子の数が2つであり、かつ、第1目的特性および第2目的特性のように、目的特性の数が2つである例について主に説明するが、制御因子の数および目的特性の数は2つに限らない。制御因子の数は1つであっても、3つ以上であってもよく、目的特性の数は1つであってもよく、3つ以上であってもよい。また、制御因子の数と目的特性の数とは等しくても異なっていてもよい。
【0051】
[ハードウェア構成]
図3は、本実施の形態における評価装置100の構成を示す図である。
【0052】
評価装置100は、入力部101a、通信部101b、演算回路102、メモリ103、表示部104、および、記憶部105を備える。
【0053】
入力部101aは、ユーザによる入力操作を受け付けるHMI(Human Machine Interface)である。入力部101aは、例えばキーボード、マウス、タッチセンサ、タッチパッドなどである。
【0054】
例えば、入力部101aは、ユーザからの入力として、設定情報210を受け付ける。設定情報210は、制御因子データ211、目的データ212、および制約条件データ213を含む。制御因子データ211は、例えば、図2の(a)に示すように、制御因子の取り得る値を示すデータである。制御因子の値は、連続値でも離散値でもよい。目的データ212は、例えば、最小化/最大化などの目的特性の最適化目的を示すデータである。制約条件データ213は、例えば、制約範囲などの制約条件を示すデータである。
【0055】
通信部101bは、他の機器と有線または無線で接続し、他の機器とデータを送受信する。例えば、通信部101bは、他の装置(例えば、実験装置)から特性点データ201を受信する。
【0056】
表示部104は、画像または文字などを表示する。表示部104は、例えば液晶ディスプレイ、プラズマディスプレイ、有機EL(Electro-Luminescence)ディスプレイなどである。なお、表示部104は、入力部101aと一体となっているタッチパネルでもよい。
【0057】
記憶部105は、演算回路102への各命令が記述されたプログラム(すなわちコンピュータプログラム)200および各種データを格納している。記憶部105は、不揮発性の記録媒体であって、例えば、ハードディスクなどの磁気記憶装置、SSD(Solid State Drive)などの半導体メモリ、光ディスクなどである。なお、プログラム200および各種データは、例えば、上述の他の機器から通信部101bを介して評価装置100に提供され、記憶部105に格納されてもよい。記憶部105は、各種データとして、候補実験点データ221、実験結果データ222、予測分布データ223、評価値データ224を格納する。
【0058】
候補実験点データ221は、各候補実験点を示すデータである。図2の(a)の例では、各候補実験点は、第1制御因子および第2制御因子の値の組み合わせによって表現される。候補実験点データ221は、第1制御因子および第2制御因子の値の組み合わせが列挙されたテーブル形式のデータであってもよい。このような候補実験点データ221の具体例については、図10Aおよび図10Bを用いて詳細に説明する。
【0059】
実験結果データ222は、実験に用いられた1以上の実験点と、その1以上の実験点のそれぞれに対応する特性点とを示すデータである。例えば、実験結果データ222は、図2の(a)の実験空間上の実験点と、その実験点を用いた実験によって得られた図2の(b)の特性空間上の特性点との組み合わせを示す。その実験点は、第1制御因子および第2制御因子の値の組み合わせによって表現され、特性点は、第1目的特性および第2目的特性の値の組み合わせによって表現される。実験結果データ222は、その実験点および特性点の組み合わせが列挙されたテーブル形式のデータであってもよい。この実験結果データ222の具体例については、図11を用いて詳細に説明する。
【0060】
予測分布データ223は、候補実験点データ221によって示される各候補実験点のうち、実験点として選択されていない各候補実験点の予測分布を示すデータである。予測分布は、上述のようにガウス過程回帰によって求まる分布であって、例えば、平均および分散によって表現される。例えば、予測分布データ223は、各候補実験点に対して、第1目的特性の予測分布と、第2目的特性の予測分布とを対応付けて示すテーブル形式のデータであってもよい。この予測分布データ223の具体例については、図13を用いて詳細に説明する。
【0061】
評価値データ224は、例えば図1に示すように、複数の候補実験点のそれぞれに対する評価値を示すデータである。例えば、評価値データ224は、複数の候補実験点のそれぞれに評価値を関連付けて示すテーブル形式のデータであってもよい。この評価値データ224の他の具体例については、図16を用いて詳細に説明する。
【0062】
演算回路102は、記憶部105からプログラム200をメモリ103に読み出し、展開されたプログラム200を実行する回路である。演算回路102は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)などである。
【0063】
[機能構成]
図4は、演算回路102の機能構成を示すブロック図である。
【0064】
演算回路102は、プログラム200を実行することによって、評価値データ224を生成するための複数の機能を実現する。具体的には、演算回路102は、受信制御部(第1受信手段、第2受信手段、および第3受信手段)10、候補実験点作成部(候補実験点作成手段)11、評価値算出部(算出手段)12、および評価値出力部(出力手段)13を備える。
【0065】
受信制御部10は、入力部101aまたは通信部101bを介して、特性点データ201、制御因子データ211、目的データ212、および制約条件データ213を受信する。例えば、受信制御部10は、ユーザによる入力部101aへの入力操作によって特性点データ201が入力されると、その特性点データ201に示される特性点を実験点に対応付けて記憶部105の実験結果データ222に書き込む。これにより、実験結果データ222が更新される。この実験結果データ222が更新されると、受信制御部10は、評価値算出部12に対して、その更新後の実験結果データ222を用いた処理を実行させる。つまり、受信制御部10は、評価値算出部12に対して評価値の算出を実行させる。なお、このときには、評価値算出部12は、記憶部105に既に格納されている候補実験点データ221を用いて評価値の算出を実行する。このように、受信制御部10は、特性点データ201の入力をトリガーに、評価値算出部12に対して評価値の算出を開始させる。
【0066】
また、受信制御部10は、他のトリガーに応じて、評価値算出部12に対して評価値の算出を開始させてもよい。例えば、実験結果データ222が記憶部105に既に格納されていれば、受信制御部10は、ユーザによる実験点の水準の入力をトリガーに、評価値算出部12に対して評価値の算出を開始させてもよい。なお、実験点の水準は、例えば、制御因子が取り得る値の最小値、最大値、および離散幅などである。つまり、受信制御部10は、ユーザによって実験点の水準が入力され、その水準に基づいて候補実験点データ221が生成されると、その候補実験点データ221と実験結果データ222と基づく評価値の算出を評価値算出部12に対して開始させる。
【0067】
あるいは、候補実験点データ221が記憶部105に既に格納されていれば、受信制御部10は、ユーザによる実験結果データ222の入力をトリガーに、評価値算出部12に対して評価値の算出を開始させてもよい。受信制御部10は、ユーザによって実験結果データ222が入力されると、その実験結果データ222と候補実験点データ221と基づく評価値の算出を評価値算出部12に対して開始させる。
【0068】
あるいは、候補実験点データ221が記憶部105に既に格納されていれば、受信制御部10は、通信部101bによる実験結果データ222の受信をトリガーに、評価値算出部12に対して評価値の算出を開始させてもよい。例えば、実験設備、実験装置、または製造装置などが実験結果データ222を評価装置100に送信し、通信部101bがその実験結果データ222を受信する。受信制御部10は、通信部101bによって実験結果データ222が受信されると、その実験結果データ222と候補実験点データ221と基づく評価値の算出を評価値算出部12に対して開始させる。
【0069】
このように、受信制御部10は、候補実験点データ221および実験結果データ222があれば、それらに基づく評価値の算出を評価値算出部12に対して開始させる。なお、実験結果データ222が記憶部105に既に格納されていれば、受信制御部10は、ユーザによる候補実験点データ221の入力をトリガーに、評価値算出部12に対して評価値の算出を開始させてもよい。また、候補実験点データ221および実験結果データ222が記憶部105に既に格納されていれば、受信制御部10は、ユーザによる開始指示の入力をトリガーに、評価値算出部12に対して評価値の算出を開始させてもよい。
【0070】
候補実験点作成部11は、受信制御部10によって取得された制御因子データ211に基づいて、候補実験点データ221を生成する。つまり、候補実験点作成部11は、複数の候補実験点のそれぞれを、1以上の制御因子のそれぞれの値を用いて作成する。そして、候補実験点作成部11は、その生成された候補実験点データ221を記憶部105に格納する。
【0071】
評価値算出部12は、候補実験点データ221および実験結果データ222を記憶部105から読み出し、それらのデータに基づいて予測分布データ223を生成し、その予測分布データ223を記憶部105に格納する。さらに、評価値算出部12は、その予測分布データ223と、受信制御部10によって取得された目的データ212および制約条件データ213とに基づいて、評価値データ224を生成し、その評価値データ224を記憶部105に格納する。
【0072】
評価値出力部13は、記憶部105から評価値データ224を読み出して、その評価値データ224を表示部104に出力する。あるいは、評価値出力部13は、通信部101bを介して、評価値データ224を外部の装置に出力してもよい。つまり、評価値出力部13は、各候補実験点の評価値を出力する。なお、評価値出力部13は、評価値算出部12から評価値データ224を直接取得して、その評価値データ224を表示部104に出力してもよい。同様に、評価値出力部13は、記憶部105から予測分布データ223を読み出して、その予測分布データ223を表示部104に出力する。なお、評価値出力部13は、評価値算出部12から予測分布データ223を直接取得して、その予測分布データ223を表示部104に出力してもよい。
【0073】
[入力]
図5は、設定情報210の入力を受け付けるために表示部104に表示される受付画像の一例を示す図である。
【0074】
受付画像300は、制御因子領域310と、目的特性領域320とを含む。制御因子領域310は、制御因子データ211の入力を受け付けるための領域である。目的特性領域320は、目的データ212および制約条件データ213の入力を受け付けるための領域である。
【0075】
制御因子領域310は、入力フィールド311~314を有する。入力フィールド311は、第1制御因子の名称を入力するためのフィールドである。例えば、入力フィールド311には、第1制御因子の名称として「X1」が入力される。入力フィールド312は、第1制御因子の値を入力するためのフィールドである。例えば、この入力フィールド312には、第1制御因子の値として「-5,-4,-3,-2,-1,0,1,2,3,4,5」が入力される。同様に、入力フィールド313は、第2制御因子の名称を入力するためのフィールドである。例えば、入力フィールド313には、第2制御因子の名称として「X2」が入力される。入力フィールド314は、第2制御因子の値を入力するためのフィールドである。例えば、この入力フィールド314には、第2制御因子の値として「-5,-4,-3,-2,-1,0,1,2,3,4,5」が入力される。
【0076】
このような入力フィールド311~314への入力によって、その入力結果に応じた制御因子データ211が評価装置100に入力される。
【0077】
目的特性領域320は、入力フィールド321~328を有する。入力フィールド321および325は、第1目的特性の名称および第2目的特性の名称を入力するためのフィールドである。例えば、入力フィールド321には、第1目的特性の名称として「Y1」が入力され、入力フィールド325には、第2目的特性の名称として「Y2」が入力される。入力フィールド322および326は、第1目的特性および第2目的特性の最適化目的を選択するためのフィールドである。具体的には、その入力フィールド322および326のそれぞれは、「最大化」、「最小化」、および「規格範囲内」のうちの何れか1つを目的として選択するための3つのラジオボタンを有する。目的としての「最大化」は、第1目的特性または第2目的特性の値の最大化を目的とし、「最小化」は、第1目的特性または第2目的特性の値の最小化を目的とする。「規格範囲内」は、第1目的特性または第2目的特性の値が規格範囲内に収まることを目的とする。例えば、ユーザによる入力部101aへの入力操作によって、「規格範囲内」を示すラジオボタンが選択された場合、評価装置100は、第1目的特性または第2目的特性の最適化目的として規格範囲内を選択する。入力フィールド323および324は、第1目的特性の規格範囲を示す最小値および最大値をそれぞれ入力するためのフィールドである。例えば、入力フィールド323には、最小値として「30」が入力され、入力フィールド324に、最大値として「40」が入力された場合、評価装置100は、規格範囲を30~40とする。入力フィールド327および328は、第2目的特性の規格範囲における最小値および最大値をそれぞれ入力するためのフィールドである。例えば、入力フィールド327に、規格範囲の最小値として「10」が入力され、入力フィールド328が未入力である場合、評価装置100は、規格範囲を0~+∞とする。なお、入力フィールド327が未入力の場合には、評価装置100は、規格範囲の最小値を-∞とする。
【0078】
このような入力フィールド321~328への入力によって、その入力結果に応じた目的データ212および制約条件データ213が評価装置100に入力される。つまり、受信制御部10は、入力フィールド322および326への入力に応じた目的データ212を取得し、入力フィールド323、324、327、および328への入力に応じた制約条件データ213を取得する。図5の例では、その目的データ212は、第1目的特性の最適化目的として、その第1目的特性の値が規格範囲内に収まることを示し、かつ、第2目的特性の最適化目的として、その第2目的特性の値の最小化を示す。さらに、制約条件データ213は、第1目的特性の規格範囲が30~40であることを示し、かつ、第2目的特性の規格範囲が10~+∞であることを示す。
【0079】
図6は、制御因子データ211の一例を示す図である。
【0080】
例えば、図6の(a)に示す制御因子データ211の例では、第1制御因子および第2制御因子は、-5から5まで1ずつ離散した値を取り得る。図6の(a)に示す例では、第1制御因子および第2制御因子は、連続変数である。連続変数は、連続値を取り得るが、連続値のままでは演算処理が困難である。そのため、各制御因子の値を離散化し、有限個の候補実験点を設定することが好ましい。したがって、制御因子が連続変数の場合、ユーザが制御因子の水準(最小値、最大値、離散幅)を入力して、評価装置100は、制御因子の取り得る値を決定する。つまり、受信制御部10は、ユーザによる入力部101aへの入力操作に応じて制御因子の水準を受信し、その水準に基づいて制御因子の取り得る値を決定する。そして、受信制御部10は、その決定された制御因子の取り得る値を示す制御因子データ211を生成し、例えば図5の受付画像300の制御因子領域310に含まれる入力フィールド312または314に表示する。
【0081】
なお、変数には、連続変数とは異なる離散変数がある。制御因子が離散変数である場合、その離散変数は「リンゴ、ミカン、バナナ」または「触媒あり、触媒なし」のように、大小関係および数値的な大きさを持たない。
【0082】
図6の(a)の例では、第1制御因子および第2制御因子は、それぞれ同じ値を取り得るが、これに限らない。例えば、図6の(b)に示すように、第1制御因子および第2制御因子が取り得る値は、互いに異なっていてもよい。図6の(b)に示す制御因子データ211の例では、第1制御因子は、10~50まで10ずつ離散した値を取り得る。一方、第2制御因子は、100~500まで100ずつ離散した値を取り得る。
【0083】
図6の(a)および(b)に示す例では、制御因子の値が絶対値であるが、これに限らない。制御因子の値が、他の制御因子の値または全制御因子の値の総和に対する比率などの相対値であってもよい。図6の(c)に示す例では、制御因子データ211は、連続変数の値とは異なる比率変数の値を示す。比率変数は、上述の比率などの相対値を取り得る。例えば、制御因子データ211は、図6の(c)に示すように、第1制御因子の連続変数の値と、第2制御因子の比率変数の値と、第3制御因子の比率変数の値とを示してもよい。具体的には、第1制御因子の連続変数の値は、例えば10から30まで10ずつ離散した値を取り得る。第2制御因子の比率変数の値は、例えば「0.0, 0.2, 0.4, 0.6, 0.8, 1.0」であり、第3制御因子の比率変数の値は、例えば「0.0, 0.2, 0.4, 0.6, 0.8, 1.0」である。比率変数は、例えば、第1制御因子の材料と、第2制御因子の材料とが配合されることによって生成される合成材料において、第1制御因子または第2制御因子の材料の配合比を示す。
【0084】
図7の(a)は、目的データ212の一例を示す図であり、図7の(b)は、制約条件データ213の一例を示す図である。
【0085】
図5の受付画像300の目的特性領域320によって入力された目的データ212は、例えば図7の(a)に示すように、第1目的特性の最適化目的と、第2目的特性の最適化目的とを示す。また、図5の受付画像300の目的特性領域320によって入力された制約条件データ213は、例えば図7の(b)に示すように、第1目的特性の規格範囲と、第2目的特性の規格範囲とを示す。具体的には、目的データ212には、第1目的特性の最適化目的として「規格範囲内」が示され、第2目的特性の最適化目的として「最小化」が示されている。また、制約条件データ213には、第1目的特性の規格範囲として、最小値「30」~最大値「40」の範囲が示され、第2目的特性の規格範囲として、最小値「10」~最大値「+∞」の範囲が示されている。したがって、第2目的特性の最適化目的は、最小値「10」以上の規格範囲内での第2目的特性の値の最小化である。
【0086】
図8Aは、規格範囲の一例を示す図である。
【0087】
図7の(b)の制約条件データ213によって示される規格範囲は、例えば図8Aのように、特性空間上において矩形の範囲で表現される。なお、図8Aに示す例では、規格範囲の形状は矩形であるが、他の形状であってもよい。つまり、規格範囲の形状は、後述の評価値の算出が実装可能であれば、任意の形状であってもよい。
【0088】
図8Bは、規格範囲の他の例を示す図である。
【0089】
規格範囲は、図8Bに示すように、例えば円形であってもよい。具体的な一例では、第1目的特性および第2目的特性の特性空間における規格範囲は、円の中心(20,20)と半径10とによって表現される。なお、その規格範囲の形状は、円形以外の形状であってもよく、楕円形、星形などであってもよい。
【0090】
このように、本実施の形態では、評価値算出部12は、矩形と異なる形状の規格範囲に基づいて、各候補実験点の評価値を算出してもよい。これにより、特性空間において、円形、楕円形、星形などの規格範囲に基づいて評価値が算出されるため、規格範囲の形状が矩形の場合に限定されることなく、適用場面をさらに拡張することができる。
【0091】
[処理動作]
評価装置100は、上述のように入力された各データを用いて評価値の算出および出力に関する処理を行う。
【0092】
図9は、本実施の形態における評価装置100の処理動作を示すフローチャートである。
【0093】
まず、候補実験点作成部11は、制御因子データ211を用いて候補実験点データ221を生成する(ステップS1)。
【0094】
次に、受信制御部10は、目的データ212を取得する(ステップS2)。つまり、受信制御部10は、最適化目的を示す目的データを取得する第2受信ステップを実行する。さらに、受信制御部10は、制約条件データ213を取得する(ステップS3)。つまり、受信制御部10は、少なくとも1つの目的特性に対して付与された制約条件を示す制約条件データ213を取得する第3受信ステップを実行する。さらに、受信制御部10は、実験結果データ222を記憶部105から読み出す(ステップS4)。つまり、受信制御部10は、実験済みの実験点および既知の特性点を示す実験結果データ222を取得する第1受信ステップを実行する。なお、実験結果データ222に、何れの特性点も示されていない場合には、このステップS4を含むステップS4~S6の処理はスキップされる。
【0095】
そして、評価値算出部12は、目的データ212、制約条件データ213、候補実験点データ221、および実験結果データ222に基づいて、各候補実験点の評価値を算出する(ステップS5)。つまり、評価値算出部12は、それらのデータに基づいて、未知の特性点の評価値を算出する算出ステップを実行する。具体的には、評価値算出部12は、候補実験点データ221に示される複数の候補実験点のうち、未だ実験に用いられていない各候補実験点の評価値を算出する。また、この算出ステップにおいて、評価値算出部12は、後述の(式4)および(式5)のように、制約条件の適合度合いに応じた重み付けを、少なくとも1つの目的特性に対する評価値に付与する。そして、評価値算出部12は、その算出された各候補実験点の評価値を示す評価値データ224を生成する。
【0096】
次に、評価値出力部13は、ステップS5で算出された評価値、すなわち評価値データ224を表示部104に出力する(ステップS6)。つまり、評価値出力部13は、
評価値を出力する出力ステップを実行する。これにより、評価値データ224が、例えば表示部104に表示される。
【0097】
そして、受信制御部10は、ユーザによる入力部101aへの入力操作に応じて、その入力部101aから操作信号を取得する。操作信号は、最適解の探索の終了、または、最適解の探索の続行を示す。なお、最適解の探索は、新規実験結果に基づく各候補実験点の評価値の算出および出力を行う処理である。受信制御部10は、その操作信号が最適解の探索の終了を示すか、続行を示すかを判定する(ステップS7)。
【0098】
ここで、受信制御部10は、操作信号が最適解の探索の終了を示すと判定すると(ステップS7の「終了」)、全ての処理を終了する。一方、受信制御部10は、操作信号が最適解の探索の続行を示すと判定すると(ステップS7の「続行」)、次の実験点として選択された候補実験点を、記憶部105の実験結果データ222に書き込む。例えば、ユーザが入力部101aに対する入力操作を行うことによって、受信制御部10は、評価値データ224から候補実験点を次の実験点として選択する。受信制御部10は、このように選択された候補実験点を実験結果データ222に書き込む。そして、ユーザは、次の実験点に対応する特性点が実験によって得られると、入力部101aに対する入力操作を行うことによって、その特性点を示す特性点データ201を評価装置100に入力する。受信制御部10は、その入力された特性点データ201を取得し、その特性点データ201によって示される特性点を、記憶部105の実験結果データ222に書き込む。このとき、その特性点は、直近に選択されて書き込まれた実験点に対応付けられる。これにより、新規実験結果が実験結果データ222に記録される(ステップS8)。つまり、実験結果データ222が更新される。実験結果データ222が更新されると、評価値算出部12は、ステップS4からの処理を繰り返し実行する。
【0099】
以上のようなフローを経る過程で、過去の実験結果から、次に行うべき最適な実験条件(すなわち候補実験点)を定量的に解析することができる。その結果、ユーザなどの解析者の力量に依らず開発サイクルの短縮が期待できる。
【0100】
図10Aは、候補実験点データ221の一例を示す図である。
【0101】
候補実験点作成部11は、例えば図6の(b)に示す制御因子データ211に基づいて、図10Aに示す候補実験点データ221を生成する。例えば、候補実験点作成部11は、制御因子データ211によって示される全ての制御因子のそれぞれの値が連続変数の値であって、その値に関して制約がない場合には、各制御因子の値の組み合わせ全通りのそれぞれを候補実験点として作成する。図6の(b)に示す制御因子データ211の場合、その制御因子データ211は、第1制御因子の連続変数の値「10,20,30,40,50」と、第2制御因子の連続変数の値「100,200,300,400,500」とを示す。したがって、候補実験点作成部11は、第1制御因子の値「10」と第2制御因子の値「100」との組み合わせ、第1制御因子の値「10」と第2制御因子の値「200」との組み合わせなど、全ての組み合わせのそれぞれを候補実験点として作成する。候補実験点作成部11は、その作成された候補実験点に対して実験点番号を関連付け、その実験点番号が関連付けられた候補実験点を示す候補実験点データ221を生成する。
【0102】
具体的な一例では、候補実験点データ221は、図10Aに示すように、実験点番号「1」に関連付けられた候補実験点(10,100)、実験点番号「2」に関連付けられた候補実験点(10,200)、実験点番号「3」に関連付けられた候補実験点(10,300)などを示す。なお、これらの候補実験点の第1成分は、第1制御因子の値を示し、第2成分は、第2制御因子の値を示す。
【0103】
ここで、値の組み合わせ全通りのうち、ある制約を満たす値の組み合わせのみが候補実験点として作成されてもよい。例えば、材料開発において、第1制御因子と第2制御因子として第1化合物と第2化合物がそれぞれ設定され、値としてそれらの配合比が設定される場合、候補実験点作成部11は、和が1を満たす値の組み合わせのみを候補実験点として採用する。図10Bの候補実験点データ221には、その一例が示されている。
【0104】
図10Bは、候補実験点データ221の他の例を示す図である。
【0105】
候補実験点作成部11は、例えば図6の(c)に示す制御因子データ211に基づいて、図10Bに示す候補実験点データ221を生成する。この場合、制御因子データ211は、第2制御因子の比率変数の値として「0.0, 0.2, 0.4, 0.6, 0.8, 1.0」を示し、第3制御因子の比率変数の値として「0.0, 0.2,0.4, 0.6, 0.8, 1.0」を示す。これらの比率変数の値の組み合わせは、上述の第1化合物と第2化合物との配合比に相当する。したがって、候補実験点作成部11は、第2制御因子の比率変数の値と、第3制御因子の比率変数の値との和が1を満たすように、第1制御因子の値と、第2制御因子の値と、第3制御因子の値との組み合わせを、候補実験点として作成する。例えば、候補実験点作成部11は、第1制御因子の値「10」と、第2制御因子の値「0.2」と、第3制御因子の値「0.8」との組み合わせなど、比率変数の値の和が1を満たす値の組み合わせを候補実験点として作成する。候補実験点作成部11は、その作成された候補実験点に対して実験点番号を関連付け、その実験点番号が関連付けられた候補実験点を示す候補実験点データ221を生成する。
【0106】
具体的な一例では、候補実験点データ221は、図10Bに示すように、実験点番号「1」に関連付けられた候補実験点(10, 0.0, 1.0)、実験点番号「2」に関連付けられた候補実験点(10, 0.2, 0.8)、実験点番号「3」に関連付けられた候補実験点(10, 0.4, 0.6)などを示す。なお、これらの候補実験点の第1成分は、第1制御因子の値を示し、第2成分は、第2制御因子の値を示し、第3成分は、第3制御因子の値を示す。
【0107】
このように、本実施の形態では、複数の制御因子がある場合、候補実験点作成部11は、複数の候補実験点のそれぞれを作成するときには、その複数の制御因子のそれぞれの、所定の条件を満たす値を組み合わせることによって、当該候補実験点を作成する。例えば、所定の条件は、図10Bに示すように、複数の制御因子のそれぞれの比率変数の値の和が1であるという条件である。より具体的な一例では、その比率変数は、制御因子に対応する化合物などの材料の配合比である。したがって、複数種の化合物の配合比の組み合わせごとに、その組み合わせに対する評価値を算出することができる。その結果、それらの化合物の配合によって得られる合成材料の1以上の目的特性に対する最適解を適切に探索することができる。
【0108】
図11は、実験結果データ222の一例を示す図である。
【0109】
評価値算出部12は、評価値を算出するために、記憶部105に格納されている実験結果データ222を読み出す。この実験結果データ222は、図11に示すように、実験番号ごとに、その実験番号によって識別される実験で用いられた実験点と、その実験によって得られた実験結果である特性点とを示す。実験点は、各制御因子の値の組み合わせによって表現される。例えば、実験点は、第1制御因子の値「10」と、第2制御因子の値「100」との組み合わせである値の組み合わせによって表現される。特性点は、実験で得られた各目的特性の値の組み合わせによって表現される。なお、目的特性の値は、以下、目的特性値とも呼ばれる。例えば、特性点は、第1目的特性の値「8」と、第2目的特性の値「0.0」との組み合わせによって表現される。
【0110】
具体的な一例では、実験結果データ222は、図11に示すように、実験番号「1」に関連付けられた実験点(10,100)および特性点(8, 0.0)、実験番号「2」に関連付けられた実験点(10,500)および特性点(40, 1.6)、実験番号「3」に関連付けられた実験点(50,100)および特性点(40, 1.6)などを示す。
【0111】
[評価値の算出処理]
図12は、評価値算出部12による処理を説明するための図である。評価値算出部12は、候補実験点作成部11によって生成された候補実験点データ221と、記憶部105にある実験結果データ222とに基づいて、予測分布データ223を生成する。そして、評価値算出部12は、各目的特性の最適化目的を示す目的データ212と、各目的特性の規格範囲を示す制約条件データ213と、予測分布データ223とに基づいて、評価値データ224を生成する。
【0112】
ここで、実験結果データ222は、複数の候補実験点のうちの、既に実験に用いられた1以上の候補実験点である1以上の実験点と、その1以上の実験点のそれぞれに対応する特性点であって、その実験点を用いた1以上の目的特性の実験結果とを示す。したがって、本実施の形態における評価値算出部12は、(a)1以上の目的特性のそれぞれの最適化目的および規格範囲と、(b)複数の候補実験点のうちの、既に実験に用いられた1以上の候補実験点である1以上の実験点と、(c)1以上の実験点のそれぞれに対応する特性点であって、当該実験点を用いた1以上の目的特性の実験結果を示す特性点とに基づいて、複数の候補実験点のうちの1以上の実験点を除く残りの各候補実験点の評価値をベイズ最適化に基づいて算出する。
【0113】
評価値算出部12は、その生成された評価値データ224を評価値出力部13に出力する。なお、評価値算出部12は、予測分布データ223も評価値出力部13に出力してもよい。または、評価値算出部12は、予測分布データ223を記憶部105に格納し、評価値出力部13は、ユーザによる入力部101aへの入力操作に応じて、その記憶部105から予測分布データ223を読み出してもよい。
【0114】
評価値算出部12は、候補実験点と特性点との対応関係をガウス過程で記述する。ガウス過程は、有限個の候補実験点のベクトルxに対応する特性点のベクトルf(x)がN次元正規分布に従うと仮定する確率過程である。実験点xと実験点x’の距離を正定値カーネルk(x,x’)で定め、共分散行列をこのカーネルを用いて表す。なお、Nは、1以上の整数であって、実行済み実験結果の数である。
【0115】
また、多次元正規分布は一部の要素で条件付けても、正規性が保存される。この性質を用いて、候補実験点と既知の対応関係にある実行済み実験結果と、候補実験点と未知の対応関係にある次の実験結果との同時分布を考え、既知の対応関係で条件付けた分布を予測分布として定義する。予測分布の平均は各次元について、以下の(式1)によって算出され、予測分布の分散は各次元について、以下の(式2)によって算出される。
【0116】
【数1】
【0117】
(式1)および(式2)において、x=(x(1),…,x(N)は過去の実験点をまとめた行列を表し、x(N+1)は新規候補実験点を表す。y=(y(1),…,y(N)は過去の実験点に対応する特性点をまとめた行列を表す。kN+1は第i成分にk(x(i),x(N+1))をとるN次元ベクトルを表し、KN,Nは(i,j)成分にk(x(i),x(j))をとるN×Nグラム行列を表す。σは観測誤差を表し、想定される観測誤差の影響度に応じて適切な値に設定される。IはN次単位行列を表す。カーネルk(・,・)およびそのハイパーパラメータは、例えばユーザなどの解析者によって適宜設定される。なお、iおよびjは、それぞれ1以上N以下の整数である。また、mは、平均関数と呼ばれ、x(N+1)に対するy(N+1)の挙動がある程度既知である場合は、適切な関数に設定される。その挙動が未知である場合は、0等の定数に設定されてもよい。
【0118】
評価値算出部12は、上記ステップS4において記憶部105から読み出された実験結果データ222に示される既知の実験結果に対して、上記(式1)および(式2)を用いた演算を行うことにより、予測分布データ223を生成する。
【0119】
図13は、予測分布データ223の一例を示す図である。予測分布データ223は、各候補実験点における予測分布の平均と分散を示す。この予測分布は、各目的特性についてガウス過程による条件付き分布として、(式1)および(式2)によって算出された分布である。例えば、予測分布データ223は、図13に示すように、実験点番号ごとに、その実験点番号に対応する、第1目的特性の予測分布の平均および分散と、第2目的特性の予測分布の平均および分散とを示す。
【0120】
具体的な一例では、予測分布データ223は、図13に示すように、実験点番号「1」に対応する第1目的特性の平均「23.5322」および分散「19.4012」と、第2目的特性の平均「0.77661」および分散「0.97006」とを示す。さらに、予測分布データ223は、実験点番号「2」に対応する第1目的特性の平均「30.2536」および分散「21.5521」と、第2目的特性の平均「1.11268」および分散「1.07761」とを示す。なお、実験点番号は、図10Aまたは図10Bに示すように、候補実験点に対応付けられている。
【0121】
評価値算出部12は、ベイズ最適化における獲得関数と呼ばれる評価基準に基づき評価値を算出する。この評価値の算出には、上述の予測分布が用いられる。また、本実施の形態における獲得関数は、制約条件があるベイズ最適化における獲得関数である。
【0122】
まず、本実施の形態における獲得関数の説明の前に、制約条件のないベイズ最適化の獲得関数(すなわち非特許文献1のEHVI)について説明する。ただし、最大化と最小化については、それらのうちの一方の符号を反転させると、他方と等価になるため、最小化に統一して説明する。EHVIでは、改善領域の体積(改善量とも呼ばれる)が大きいほど、暫定の実験結果から大きく改善された特性点が得られたと考えられる。その改善領域は、行った実験から既に得られている少なくとも1つの特性点の中のパレート点(すなわち非劣解)の座標から定まるパレート境界と、新規特性点が観測された際に新たに定まるパレート境界とで囲まれた領域である。なお、パレート点は、現時点で暫定的にパレート解とされている特性点である。例えば、第1目的特性および第2目的特性のそれぞれの最適化目的が最小化である場合には、パレート点よりも第1目的特性および第2目的特性のそれぞれの値が小さい他の特性点は存在しない。
【0123】
図14Aは、改善領域の一例を示す図である。
【0124】
例えば、図14Aに示すように、4つのパレート点21~24から定まるパレート境界31と、1つの新規特性点ynewが得られた際に新たに定まるパレート境界32とで囲まれた領域が、改善領域として特定される。
【0125】
ここで、ガウス過程回帰により、各候補実験点を選択した場合の各目的特性値の振る舞いは正規分布の形で表現されており、観測された特性点の位置によって改善量も変動する。EHVIは、以下の(式3)のように、各候補実験点について、予測分布で改善量の期待値を取った量として定義される。EHVIによって得られる値が大きい候補実験点ほど改善量の期待値が大きく、次に実行すべき実験点を表している。
【0126】
【数2】
【0127】
(式3)において、Dは目的特性の数(すなわち次元数)を表し、
【数3】
はD次元ユークリッド空間を表し、I(ynew)は改善量を表す。また、p(ynew|xnew)は、少なくとも1つの候補実験点の中から1つの候補実験点を新規実験点xnewとして選択した際の、その新規実験点xnewに対応する特性点ynewの予測分布を表す。その特性点ynewの各次元の予測分布、すなわち平均および分散は、上記(式1)および(式2)により求まっている。
【0128】
次に、本実施の形態における獲得関数について説明する。本実施の形態における獲得関数は、制約条件がある場合のベイズ最適化の獲得関数である。D個の目的特性のうち、y~yDminimizeのDminimize個の目的特性の最適化目的が最小化であり、残りのyDminimize+1~yのDrange(=D-Dminimize)個の目的特性の最適化目的が規格範囲内であるとする。このとき、本実施の形態における獲得関数、すなわち制約条件付きEHVICは、以下の(式4)のように定義される。
【0129】
【数4】
【0130】
(式4)において、Rminimizeは、最適化目的が最小化である目的特性y~yDminimizeについて、すべて規格範囲内である領域を表す。Rrangeは、最適化目的が規格範囲内である目的特性yDminimize+1~yについて、すべて規格範囲内である領域を表す。なお、RminimizeおよびRrangeのそれぞれの領域は、その領域に対応する規格範囲の形状を示す関数によって表現される。図8Bに示すように規格範囲の形状が円であれば、RminimizeおよびRrangeのそれぞれの領域は、その円を示す関数によって表現される。また、規格範囲の形状が星形であれば、RminimizeおよびRrangeのそれぞれの領域は、その星形を示す関数によって表現される。ynew,minimizeは、特性点ynewの全ての次元から、最適化目的が最小化である目的特性の各次元を抽出することによって得られるベクトルを表す。ynew,rangeは、特性点ynewの全ての次元から、最適化目的が規格範囲内である目的特性の各次元を抽出することによって得られるベクトルを表す。IC(ynew)は、制約条件がある場合の改善量であり、既存のパレート境界と、新たに定まるパレート境界とで囲まれた領域の体積を表す。その既存のパレート境界は、規格範囲内に存在する少なくとも1つのパレート点およびその規格範囲のそれぞれの座標から定まる境界である。新たに定まるパレート境界は、新規特性点が観測された際に、その新規特性点であるパレート点および規格範囲のそれぞれの座標から定まる境界である。Pr{A}は、事象Aが成立する確率を表し、例えば(式1)および(式2)の平均および分散を用いて表現される。
【0131】
図14Bは、本実施の形態における改善領域の他の例を示す図である。本実施の形態と非特許文献2との大きな違いは、最適化目的が最小化である目的特性について、本実施の形態では積分範囲が特性空間全体から規格範囲内に制限されていて、改善量の測り方が規格範囲に応じて変わっていることである。規格範囲における最大値および最小値が指定されない場合は、最大値は+∞として設定され、最小値は-∞として設定される。最適化目的が最小化であるすべての目的特性の規格範囲における最大値および最小値がそれぞれ+∞および-∞で、かつ、Drange=0のとき、本実施の形態における獲得関数であるEHVICは、非特許文献1のEHVIに帰着される。また、最適化目的が最小化であるすべての目的特性の規格範囲における最大値および最小値がそれぞれ+∞および-∞で、かつ、Drange>=1のとき、本実施の形態における獲得関数であるEHVICは、非特許文献2のEHVICに帰着される。したがって、本実施の形態における評価装置100は、従来手法でも評価値を算出することができる。
【0132】
また、非特許文献2では、最適化目的が最小化である目的特性が一つ以上存在する最適化問題、つまり、Dminimize>=1を想定しているが、本実施の形態における獲得関数では、Dminimize=0(すなわちDrange=D)の場合でも不都合なく定式化が可能である。したがって、本実施の形態における獲得関数は、すべての目的特性の最適化目的が規格範囲内である最適化問題にも自然に拡張される。
【0133】
次に、本実施の形態における獲得関数であるEHVICの具体的な算出方法に関して説明する。
【0134】
図15Aは、改善領域の体積の算出方法を説明するための図である。なお、図15Aの(a)は、特性空間における改善領域を示し、図15Aの(b)は、分割の対象とされるその改善領域を示し、図15Aの(c)は、改善領域の分割によって得られる複数の小領域を示す。
【0135】
評価値算出部12は、最適化目的が最小化である目的特性の次元については、図15Aのように、改善領域の体積である改善量(すなわちIC(ynew))を算出する。つまり、評価値算出部12は、パレート点および新規特性点のそれぞれの座標で改善領域を複数の小領域に分割し、各小領域の体積の期待値を算出したのち、それらの期待値の和を取ることで改善量(すなわちIC(ynew))を算出する。また、評価値算出部12は、最適化目的が規格範囲内である目的特性の次元については、各目的特性値が規格範囲に入る確率を算出する。
【0136】
図15Bは、特性空間の全体を複数の小領域に分割する例を示す図である。
【0137】
評価値算出部12は、最適化目的が最小化である目的特性の次元と、最適化目的が規格範囲内である目的特性の次元とについて、図15Bのように特性空間全体を複数の小領域に分割し、以下の(式5)を用いることによって、獲得関数を統一的に算出する。つまり、評価値算出部12は、パレート点、新規特性点、および規格値のそれぞれの座標で特性空間全体を複数の小領域に分割し、各小領域の体積の算出を以下の(式5)のような場合分け計算で実行する。なお、上述の規格値は、規格範囲の最大値および最小値である。そして、評価値算出部12は、それらの小領域の体積を期待値処理したものの和を取ることで、制約条件がある場合の獲得関数を統一的に算出する。なお、その体積は、N次元超体積とも呼ばれる。
【0138】
【数5】
【0139】
(式5)において、yは、小領域の下端点(y,…,y)の第d成分を表し、y’は、小領域の上端点(y’,…,y’)の第d成分を表す。
【0140】
図15Cは、小領域の下端点および上端点の一例を示す図である。
【0141】
D=2の場合、図15Cに示すように、(y,y)は、小領域の下端点を表し、(y’,y’)は、小領域の上端点を表す。
【0142】
また、(式5)における(i)は、区間[y,y’]が次元dに関して規格範囲外であるときに適用される。(ii)は、区間[y,y’]が次元dに関して規格範囲内であり、かつ、次元dの目的特性の最適化目的が規格範囲内であるときに適用される。(iii)は、区間[y,y’]が次元dに関して規格範囲内であり、かつ、次元dの目的特性の最適化目的が最小化であるときに適用される。cは、重み係数であり、目的特性の次元dごとに探索の優先度を付与する際等に適宜設定される。例えば、次元dの優先度が高いほど小さい重み係数cが用いられ、逆に、次元dの優先度が低いほど大きい重み係数cが用いられる。重み係数cの逆数が優先度であってもよい。特に指定がなければ、すなわち、各次元dの優先度が等しい場合には、各次元dのcは、例えばすべて1に設定される。以上が本実施の形態における獲得関数と、その獲得関数の具体的な算出方法の説明である。
【0143】
以上の獲得関数の算出方法は、厳密解を求めるための方法であり、特に最適化目的が最小化である目的特性の数が多い場合には、計算量が膨大になってしまう可能性がある。そこで、計算効率向上のために、モンテカルロ法等の近似手法で獲得関数を算出してもよい。その場合でも、特性空間の小領域への分割および改善領域等は、上述の説明と変わらない。
【0144】
[出力]
評価値出力部13は、評価値算出部12によって上述のように算出された各候補実験点の評価値を示す評価値データ224を取得し、その評価値データ224を表示部104に表示させる。なお、評価値出力部13は、評価値算出部12からその評価値データ224を直接取得してもよく、評価値算出部12によって記憶部105に格納された評価値データ224を読み出すことによって、その評価値データ224を取得してもよい。
【0145】
図16は、評価値データ224の一例を示す図である。評価値データ224は、例えば図16に示すように、各候補実験点における評価値およびその順位を示す。具体的には、評価値データ224は、実験点番号ごとに、その実験点番号に対応する評価値と、その評価値の順位とを示す。各実験点番号は、図10Aおよび図10Bに示すように、候補実験点に対応付けられている。したがって、評価値データ224は、候補実験点ごとに、その候補実験点に対応する評価値と、その評価値の順位とを示していると言える。また、順位は、評価値が大きいほど小さい数値を示し、逆に、評価値が小さいほど大きい数値を示す。
【0146】
具体的な一例では、評価値データ224は、図16に示すように、実験点番号「1」に対応する評価値「0.00000」および順位「23」、実験点番号「2」に対応する評価値「0.87682」および順位「1」、実験点番号「3」に対応する評価値「0.62342」および順位「4」などを示す。
【0147】
このような評価値データ224が表示部104に表示されることによって、ユーザは、最適解の探索を続行するか終了するかを判断することができる。さらに、ユーザは、最適解の探索を続行する場合には、表示されている各評価値および各順位に基づいて、表示されている全ての実験点番号、すなわち全ての候補実験点から、次の実験点とされる候補実験点を選択することができる。例えば、ユーザは、最も大きい評価値(すなわち、順位が1である評価値)に対応する候補実験点を選択する。このとき、ユーザは、入力部101aに対する入力操作を行うことによって、評価値データ224の各評価値を大きい順に並び替えさせてもよい。つまり、評価値出力部13は、評価値データ224の各評価値が降順となり、各順位が昇順となるように、それらをソートする。これにより、最も大きい評価値を見つけやすくすることができる。
【0148】
以上のように、本実施の形態における受信制御部10は、実験結果データ222、目的データ212および制約条件データ213を取得する。評価値算出部12は、実験結果データ222、目的データ212および制約条件データ213に基づいて、未知の特性点の評価値を算出し、評価値出力部13は、その評価値を出力する。ここで、評価値算出部12は、制約条件の適合度合いに応じた重み付けを、少なくとも1つの目的特性に対する評価値に付与する。これにより、評価値算出部12が、実験結果データ222、目的データ212および制約条件データ213に基づいて、未知の特性点の評価値を算出するときには、制約条件の適合度合いに応じた重み付けを、少なくとも1つの目的特性に対する評価値に付与する。この少なくとも1つの目的特性は最適化目的を有する。したがって、最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することができる。その結果、適用場面を拡張することができる。
【0149】
また、本実施の形態では、制約条件は規格範囲であり、最適化目的には、目的特性を規格範囲内に収める第1目的と、目的特性を最小化または最大化する第2目的とがある。そして、評価値算出部12は、少なくとも1つの目的特性のそれぞれについて、(i)評価値を算出するために用いられる当該目的特性の区間が規格範囲外にある場合と、(ii)その区間が規格範囲内であって、かつ、最適化目的が第1目的である場合と、(iii)その区間が規格範囲内であって、かつ、最適化目的が第2目的である場合とで、互いに異なる重み付け処理を行うことによって、評価値を算出する。つまり、上記(式4)および(式5)に基づいて評価値が算出される。これにより、目的特性の最適化目的が第1目的であっても、第2目的であっても、候補実験点の評価値をベイズ最適化に基づいて適切に算出することができる。つまり、目的特性の最適化目的が規格範囲内であっても、最大化または最小化であっても、候補実験点の評価値をベイズ最適化に基づいて適切に算出することができる。また、(iii)の場合は、目的特性の区間が規格範囲内であって、かつ、最適化目的が第2目的であるため、非特許文献2の手法とは異なり、最適化目的が最大化または最小化である目的特性に、制約条件として規格範囲がある場合であっても、評価値を定量的に適切に算出することができる。
【0150】
その結果、規格範囲などの制約条件がある最適化問題に対しても適用することができる。つまり、適用場面を拡張し、最適解の探索効率向上のための定量評価を行うことができる。
【0151】
また、評価値算出部12は、(式5)のcのように、少なくとも1つの目的特性のそれぞれに優先度を付与し、付与された優先度を用いて各候補実験点の評価値を算出する。これにより、1以上の目的特性に優先度が付されるため、高い優先度が付された目的特性を、低い優先度が付された目的特性よりも早く最適化目的に近づけることができる。
【0152】
また、評価値算出部12は、モンテカルロ法を用いて各候補実験点の評価値を算出してもよい。これにより、モンテカルロ法が近似手法であるため、評価値の算出の処理負担を軽減することができる。具体的には、評価値算出部12は、(式4)の演算のために、小領域ごとに(式5)によって定まるその小領域の体積の期待値の和を取る。したがって、例えば、小領域の数が多い場合には、(式4)の演算に多大な計算量を要する。そこで、(式4)の演算を厳密に行わずに、モンテカルロ法を用いることによって、処理負担を軽減することができる。なお、近似手法であれば、モンテカルロ法に限らず、他の手法が用いられてもよい。
【0153】
(変形例1)
上記実施の形態では、制約条件として規格範囲が設けられている。本変形例では、規格範囲だけでなく、その規格範囲とは別に範囲が設けられる。例えば、特性点が最低限収まってほしい規格範囲の中に、特性点が可能な限り収まってほしい管理範囲が設定されているケースも、実務においてしばしば要請される。なお、規格範囲および管理範囲は、それぞれ制約条件である制約範囲の一例である。
【0154】
図17は、規格範囲および管理範囲の一例を示す図である。
【0155】
例えば、第1目的特性の規格範囲は、最小値「10」~最大値「50」であり、第2目的特性の規格範囲は、最小値「10」~最大値「50」である。また、第1目的特性の管理範囲は、その規格範囲よりも狭い範囲、すなわち最小値「20」~最大値「40」であり、第2目的特性の管理範囲は、その規格範囲よりも狭い範囲、すなわち最小値「20」~最大値「40」である。このように、管理範囲は規格範囲に含まれる。
【0156】
このような場合、評価値算出部12は、以下の(式6)のように、0と1との間にある例えば0.5等の中間的な値を、l(yd,yd’)に対してさらに設定することで評価値を算出する。なお、0.5は一例であって、他の数値であってもよい。
【0157】
【数6】
【0158】
(式6)における(i)は、区間[y,y’]が次元dに関して管理範囲および規格範囲のそれぞれの外にあるときに適用される。(ii)は、区間[y,y’]が次元dに関して規格範囲内および管理範囲外であり、かつ、次元dの目的特性の最適化目的が制約範囲内であるときに適用される。(iii)は、区間[y,y’]が次元dに関して管理範囲内であり、かつ、次元dの目的特性の最適化目的が制約範囲内であるときに適用される。(iv)は、区間[y,y’]が次元dに関して管理範囲内であり、かつ、次元dの目的特性の最適化目的が最小化であるときに適用される。
【0159】
以上のように、本変形例では、制約条件として複数の制約範囲が設けられる場合には、それらの制約範囲に応じて場合分けの数を増やし、それらの場合に互いに異なる重み付け処理を行う。つまり、制約条件として複数の制約範囲がある場合、評価値算出部12は、(式5)の(ii)の場合を、(式6)の(ii)の場合および(iii)の場合のように、さらに、複数の場合に場合分けし、その複数の場合のそれぞれで互いに異なる重み付け処理を行うことによって、評価値を算出する。その複数の場合のそれぞれでは、複数の制約範囲のうちの互いに異なる制約範囲に区間が含まれている。例えば、(式6)の(ii)および(iii)のように、その(ii)の場合では、管理範囲外の規格範囲に区間が含まれ、その(iii)の場合では、管理範囲に区間が含まれている。このように、複数の制約範囲があり、(ii)の場合をさらに複数の場合に場合分けすることによって、複数の制約範囲のそれぞれに段階的に重み付けを行うことができる。したがって、目的特性の値が規格範囲に収まり、可能な限り管理範囲に収まって欲しいような場合であっても、評価値を適切に算出することができる。すなわち、上述のような実務の要請に対しても獲得関数を適切に適用することができる。その結果、最適化問題に対する適用場面をさらに拡張することができる。
【0160】
なお、上記(式6)の(i)~(iv)の場合分けの条件に用いられる規格範囲を管理範囲に置き換えてもよく、逆に、管理範囲を規格範囲に置き換えてもよい。また、本変形例では、規格範囲および管理範囲がそれぞれ制約範囲の例として用いられるが、さらに、これら以外の制約範囲が用いられてもよい。つまり、3つ以上の制約範囲が用いられてもよい。また、複数の制約範囲のそれぞれの形状は同一であってもよく、互いに異なっていてもよい。さらに、それらの形状は、矩形、円形、楕円形、星形など任意の形状であってもよい。また、本変形例では、規格範囲に管理範囲が含まれているように、複数の制約範囲に包含関係があるが、このような包含関係に限定されることなく、それぞれの制約範囲が互いに離れていてもよく、それぞれの制約範囲の一部のみが重なっていてもよい。
【0161】
また、上記実施の形態および本変形例のように、本開示では、制約範囲は少なくとも1つあればよい。したがって、上述の(式5)における(i)~(iii)の場合の条件と第1目的に用いられる規格範囲は、少なくとも1つの制約範囲のうちの何れかの制約範囲に置き換えられてもよい。さらに、上述の(式5)における(i)~(iii)のそれぞれの場合の条件、および第1目的に用いられる制約範囲は、同一の制約範囲であってもよく、互いに異なる制約範囲であってもよい。
【0162】
(変形例2)
上記実施の形態では、評価値算出部12は評価値を算出する。本変形例における評価値算出部12は、その評価値だけでなく最小距離も算出する。最小距離は、候補実験点と、既に実験に用いられた各実験点との間の距離のうちの最小の距離である。
【0163】
図18は、本変形例における評価値算出部12による処理を説明するための図である。
【0164】
評価値算出部12は、候補実験点データ221および実験結果データ222に基づいて、各候補実験点の最小距離を算出する。この最小距離は、上述のように、実験空間上における、候補実験点と、既に実験に用いられた少なくとも1つの実験点のそれぞれとの間の距離のうちの、最小の距離である。そして、評価値算出部12は、各候補実験点の最小距離を示す最小距離データ225を生成する。評価値算出部12は、上記実施の形態と同様に評価値データ224を評価値出力部13に出力するとともに、最小距離データ225も評価値出力部13に出力する。なお、評価値算出部12は、最小距離データ225を記憶部105に格納し、評価値出力部13は、ユーザによる入力部101aへの入力操作に応じて、その記憶部105から最小距離データ225を読み出してもよい。
【0165】
評価値算出部12は、例えば以下の(式7)のように、Lp距離等を用いて、候補実験点と、既に実験に用いられた実験点との間の距離を算出してもよい。
【0166】
【数7】
【0167】
(式7)において、Dは、制御因子の数を表し、xおよびx’のうちの一方は、候補実験点を表し、他方は、既に実験に用いられた実験点を表す。p=2のとき、Lp(x,x’)は、ユークリッド距離(すなわち直線距離)を示し、p=1のとき、Lp(x,x’)は、マンハッタン距離(すなわち道のり距離)を示す。また、p=0のとき、Lp(x,x’)は、異水準因子の数を示し、p=∞のとき、Lp(x,x’)は、最大水準差を示す。
【0168】
図19は、最小距離の一例を示す図である。
【0169】
評価値算出部12は、例えば図19に示すように、p=2である場合のLp距離(すなわちL距離)を算出する。図19に示す例の場合、評価値算出部12は、実験空間において、候補実験点Aと、既に実験に用いられた候補実験点である実験点B、C、D、およびEのそれぞれとの間のL距離を算出する。例えば、評価値算出部12は、候補実験点Aと実験点Bとの間のL距離として、L(A,B)=3を算出し、候補実験点Aと実験点Cとの間のL距離として、L(A,C)=1.41412を算出する。同様に、評価値算出部12は、候補実験点Aと実験点Dとの間のL距離として、L(A,D)=4.47214を算出し、候補実験点Aと実験点Eとの間のL距離として、L(A,E)=4.12311を算出する。そして、評価値算出部12は、これらのL距離のうち最小の距離である「1.41412」を最小L距離として決定する。なお、図19の例では、距離が各制御因子のスケールに依存しないように、評価値算出部12は、各制御因子における2つの値の差の最小値を基準距離1に設定してLp距離を算出する。
【0170】
図20は、最小距離データ225の一例を示す図である。
【0171】
最小距離データ225は、実験点番号ごとに、その実験点番号に対応する最小距離を示す。各実験点番号は、図10Aおよび図10Bに示すように、候補実験点に対応付けられている。したがって、最小距離データ225は、候補実験点ごとに、その候補実験点に対応する最小距離を示していると言える。
【0172】
具体的な一例では、最小距離データ225は、図20に示すように、実験点番号「1」に対応する最小距離「0.00000」、実験点番号「2」に対応する最小距離「1.00000」、実験点番号「3」に対応する最小距離「2.00000」などを示す。なお、最小距離「0.00000」に対応する実験点番号の候補実験点は、既に実験に用いられた実験点である。
【0173】
評価値出力部13は、評価値データ224に最小距離データ225の内容を含めることによって、その評価値データ224を変更し、その変更後の評価値データ224を表示部104に表示してもよい。
【0174】
図21は、表示部104に表示される変更後の評価値データ224の一例を示す図である。
【0175】
変更後の評価値データ224は、例えば図21に示すように、評価値の順位ごとに、その順位に該当する評価値と、その評価値に対応する候補実験点と、その候補実験点に対応する最小距離とを示す。また、評価値の各順位は昇順に配列されている。つまり、評価値の大きい順に各候補実験点が配列されている。例えば、評価値データ224は、順位「1」に該当する評価値「0.87682」と、その評価値に対応する候補実験点(10,200)と、その候補実験点に対応する最小距離「1.00000」とを示す。さらに、評価値データ224は、順位「2」に該当する評価値「0.87682」と、その評価値に対応する候補実験点(20,100)と、その候補実験点に対応する最小距離「1.00000」とを示す。
【0176】
このような評価値データ224が表示部104に表示されることによって、ユーザは、最適解の探索を続行するか終了するかを判断することができる。さらに、ユーザは、最適解の探索を続行する場合には、評価値データ224に示される1以上の候補実験点から次の実験点を選択する。ここで、本変形例では、ユーザは、評価値と最小距離とに基づいて次の実験点を決定する。具体的には、ユーザは、基本的に大きい評価値の候補実験点を次の実験点に決定する。しかしながら、特に実験結果の数が少ない段階においては、過去の実験結果の中でのベストスコアの実験点付近の候補実験点等、過去の実験点に近い候補実験点の評価値が上位に登場する傾向にある。そのような候補実験点で実験を実行しても、大きい改善量の特性点が得られない可能性が高くなる。また、複数の実験点を選択してバッチ処理をしたい場合は、互いの距離が遠い実験点を選択すると、次に算出する予測分布および評価値の精度が向上しやすくなる。よって、ユーザは、次の実験点の決定の材料として、評価値に加えて最小距離を参考にするとよい。
【0177】
また、ユーザは、最適解の探索を続行するか終了するかの判断材料にも、評価値および最小距離を参考にしてもよい。例えば、評価値が非ゼロである候補実験点はすべて実行済み実験点付近に存在し、実行済み実験点から距離が遠い候補実験点の評価値がすべてほぼ0であるような場合、それ以上実験を続けても、改善が見込めない。したがって、このような場合には、ユーザは探索を終了するとよい。
【0178】
以上のように、本変形例における評価値算出部12は、各候補実験点について、当該候補実験点と1以上の実験点のそれぞれとの間の距離のうちの最小距離を算出する。そして、評価値出力部13は、各候補実験点に対応する最小距離を出力する。これにより、評価装置100のユーザは、評価値だけでなく、その最小距離にも基づいて、次の実験点となる候補実験点を選択することができる。例えば最適解探索の初期段階において、ユーザは、評価値が比較的大きく、かつ、最小距離が比較的長い評価値に対応する候補実験点を次の実験点に選択することによって、評価値の精度を向上し、適切な最適化を行うことができる。
【0179】
(その他の変形例)
以上、本開示の一態様に係る評価装置100について、上記実施の形態および各変形例に基づいて説明したが、本開示は、その実施の形態および各変形例に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を上記実施の形態または各変形例に施したものも本開示に含まれてもよい。
【0180】
例えば、上記実施の形態および各変形例では、評価値算出部12は、EI(Expected Improvement)がベースであるEHVIを用いて評価値を算出するが、PI(Probability of Improvement)を用いて評価値を算出してもよい。すなわち、上記実施の形態では、(式4)および(式5)のように、EHVIの応用によって評価値が算出される。しかし、PIの応用によって評価値が算出されてもよい。PIが用いられる場合には、評価値算出部12は、(式5)の代わりに、以下の(式8)を用いて評価値を算出する。
【0181】
【数8】
【0182】
評価値算出部12は、EHVIと同様、(式8)によって算出される体積に対して期待値処理を行うことによって、評価値を算出する。なお、(式8)における(i)~(iii)の場合分けの条件は、(式5)と同様である。また、PIを用いた評価値の算出と、EIを用いた評価値の算出とを組み合わせてもよい。例えば、第1目的特性にはPIが用いられ、第2目的特性にはEIが用いられてもよい。
【0183】
このように、本開示の評価値算出部12は、それぞれ評価方法であるPIおよびEIのうちの少なくとも1つを用いて、各候補実験点の評価値を算出する。これにより、各候補実験点について、特性空間における制約範囲内の体積を、最適化の改善量として算出し、その改善量から評価値を適切に算出することができる。
【0184】
また、上記実施の形態では、第1目的特性および第2目的特性のように、目的特性の次元数が2である場合について説明したが、その次元数は1であってもよく、3以上であってもよい。同様に、上記実施の形態では、第1制御因子および第2制御因子のように、制御因子の総数が2である場合について主に説明したが、その総数は1であってもよく、3以上であってもよい。
【0185】
なお、上記実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記実施の形態の評価装置などを実現するソフトウェアは、例えば図9に示すフローチャートの各ステップをコンピュータに実行させるプログラムである。
【0186】
なお、以下のような場合も本開示に含まれる。
【0187】
(1)上記の少なくとも1つの装置は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。そのRAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、上記の少なくとも1つの装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
【0188】
(2)上記の少なくとも1つの装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
【0189】
(3)上記の少なくとも1つの装置を構成する構成要素の一部または全部は、その装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。ICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
【0190】
(4)本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、コンピュータプログラムからなるデジタル信号であるとしてもよい。
【0191】
また、本開示は、コンピュータプログラムまたはデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD(Compact Disc)-ROM、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されているデジタル信号であるとしてもよい。
【0192】
また、本開示は、コンピュータプログラムまたはデジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
【0193】
また、プログラムまたはデジタル信号を記録媒体に記録して移送することにより、またはプログラムまたはデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
【産業上の利用可能性】
【0194】
本開示の評価装置は、最適化問題の目的を有する目的特性に対して制約条件が付与されている最適化問題に対して、ベイズ最適化を適用することができるという効果を奏し、工業製品開発または製造プロセス開発などに限らず、例えば材料開発等、一般の開発業務における最適制御の装置またはシステムに適用できる。
【符号の説明】
【0195】
10 受信制御部
11 候補実験点作成部
12 評価値算出部
13 評価値出力部
100 評価装置
101a 入力部
101b 通信部
102 演算回路
103 メモリ
104 表示部
105 記憶部
200 プログラム
201 特性点データ
210 設定情報
211 制御因子データ
212 目的データ
213 制約条件データ
221 候補実験点データ
222 実験結果データ
223 予測分布データ
224 評価値データ
225 最小距離データ
300 受付画像
310 制御因子領域
311~314 入力フィールド
320 目的特性領域
321~328 入力フィールド
図1
図2
図3
図4
図5
図6
図7
図8A
図8B
図9
図10A
図10B
図11
図12
図13
図14A
図14B
図15A
図15B
図15C
図16
図17
図18
図19
図20
図21