IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メモリ株式会社の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024122544
(43)【公開日】2024-09-09
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240902BHJP
   G06F 18/27 20230101ALI20240902BHJP
【FI】
G06N20/00
G06F18/27
【審査請求】未請求
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2023030138
(22)【出願日】2023-02-28
(71)【出願人】
【識別番号】318010018
【氏名又は名称】キオクシア株式会社
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118843
【弁理士】
【氏名又は名称】赤岡 明
(74)【代理人】
【識別番号】100103263
【弁理士】
【氏名又は名称】川崎 康
(72)【発明者】
【氏名】横田 怜
(72)【発明者】
【氏名】吉沢 竜太
(72)【発明者】
【氏名】梅澤 裕介
(57)【要約】

【課題】 探索範囲を適切に設定して迅速に最適化を行う。
【解決手段】 情報処理装置は、パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる探索範囲シフト部と、前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、を備える。
【選択図】 図1
【特許請求の範囲】
【請求項1】
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、
前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、
前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる探索範囲シフト部と、
前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、
を備える、情報処理装置。
【請求項2】
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、
前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、
前記第1範囲の中心値を含むように前記第2範囲をシフトさせる探索範囲シフト部と、
前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、
を備える、情報処理装置。
【請求項3】
前記探索範囲シフト部は、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる、
請求項2に記載の情報処理装置。
【請求項4】
前記探索範囲シフト部は、前記第2範囲の幅を伸縮させて前記第2範囲をシフトさせる、
請求項2に記載の情報処理装置。
【請求項5】
前記探索範囲シフト部は、
前記第2範囲の下限値が前記第1範囲の下限値よりも小さい場合には、前記第2範囲の下限値が前記第1範囲の下限値以上になるように、前記第2範囲の幅を変えずに、又は前記第2範囲の幅を短くして前記第2範囲をシフトさせ、
前記第2範囲の上限値が前記第1範囲の上限値よりも大きい場合には、前記第2範囲の上限値が前記第1範囲の上限値以下になるように、前記第2範囲の幅を変えずに、又は前記第2範囲の幅を短くして前記第2範囲をシフトさせる、
請求項1又は2に記載の情報処理装置。
【請求項6】
前記探索範囲シフト部は、前記第2範囲をシフトさせたときに前記第1範囲と重複しなくなった部分範囲を前記第2範囲から除外する、
請求項5に記載の情報処理装置。
【請求項7】
前記探索範囲シフト部は、前記データセットの評価値が最善となる設定値と前記第1範囲の中心値との大小関係に基づいて、前記第2範囲の上限値又は下限値の少なくとも一方を設定する、
請求項1又は2に記載の情報処理装置。
【請求項8】
前記探索範囲シフト部は、
前記データセットの評価値が最善となる設定値が前記第1範囲の中心値より小さい場合、前記第1範囲の中心値と前記第2範囲の下限値との差分を、前記第2範囲の上限値と前記第1範囲の中心値との差分よりも大きくし、
前記データセットの評価値が最善となる設定値が前記第1範囲の中心値以上の場合、前記第2範囲の上限値と前記第1範囲の中心値との差分を、前記第1範囲の中心値と前記第2範囲の下限値との差分よりも大きくする、
請求項7に記載の情報処理装置。
【請求項9】
前記探索範囲シフト部は、
前記第1範囲の中心値が前記第2範囲の上限値よりも大きい場合、前記第1範囲の中心値と前記第2範囲の上限値との差分だけ、前記第2範囲の中心値が大きくなるように前記第2範囲をシフトさせ、
前記第2範囲の下限値が前記第1範囲の中心値よりも大きい場合、前記第2範囲の下限値と前記第1範囲の中心値との差分だけ、前記第2範囲の中心値が小さくなるように前記第2範囲をシフトさせる、
請求項1又は2に記載の情報処理装置。
【請求項10】
前記探索範囲シフト部は、
前記第1範囲の中心値が前記第2範囲の上限値よりも大きい場合、前記第1範囲の中心値と前記第2範囲の上限値との差分だけ、前記第2範囲の上限値をより大きくシフトさせ、
前記第2範囲の下限値が前記第1範囲の中心値よりも大きい場合、前記第2範囲の下限値と前記第1範囲の中心値との差分だけ、前記第2範囲の下限値をより小さくシフトさせる、
請求項1又は2に記載の情報処理装置。
【請求項11】
前記評価値と所定の終了条件とに基づいて、最適な前記設定値を決定するか否かを判定する判定部を備え、
前記判定部にて前記最適な設定値を決定すると判定されるまでの少なくとも一部の期間において、前記モデル訓練部、前記探索範囲生成部、前記探索範囲シフト部、及び前記獲得関数最適化部の一連の処理が繰り返される、
請求項1又は2に記載の情報処理装置。
【請求項12】
前記探索範囲生成部は、前記一連の処理を繰り返している間に、直前に実行された前記一連の処理で生成された前記第2範囲とは無関係に、前記獲得関数最適化部で算出された前記新たな設定値に基づいて、新たな前記第2範囲を生成する、
請求項11に記載の情報処理装置。
【請求項13】
前記一連の処理は、前記判定部にて前記最適な設定値が決定されるまで、繰り返し実行される、
請求項11に記載の情報処理装置。
【請求項14】
前記一連の処理は、前記第2範囲に前記第1範囲の中心値が含まれない場合に実行される、
請求項11に記載の情報処理装置。
【請求項15】
前記一連の処理は、前記一連の処理の実行回数が所定の回数に到達するまで実行される、
請求項11に記載の情報処理装置。
【請求項16】
前記設定値は、カテゴリカル変数、整数変数、連続値変数、又は二値変数の少なくとも一つを含む、
請求項1又は2に記載の情報処理装置。
【請求項17】
前記獲得関数最適化部で算出された前記新たな設定値を出力する出力部と、
前記新たな設定値の評価値を取得する入力部と、を備える、
請求項1又は2に記載の情報処理装置。
【請求項18】
前記新たな設定値と対応する前記評価値とを組にしたデータセットを記憶する記憶部を備える、
請求項1又は2に記載の情報処理装置。
【請求項19】
コンピュータは、
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練する手順と、
前記訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する手順と、
前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に前記第2範囲の幅を変えずに前記第2範囲をシフトさせるか、又は前記第1範囲の中心値を含むように前記第2範囲をシフトさせる手順と、
前記訓練された前記予測モデルに、前記シフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する手順と、
を実行する、情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一実施形態は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
パラメータの設定値の評価値を用いて、パラメータの最適な設定値を探索する技術が提案されている。高次元のパラメータの最適化問題を効率よく解くために、探索範囲を調整しながら、最適化を行う手法が提案されているが、探索範囲の設定の仕方が適切でない場合には、最適化を行うまでの計算時間が長くなるおそれがある。特に、パラメータの次元数が多くて、探索データ数が増えると、計算時間が長くなりやすくなる。また、パラメータを構成する変数の種類によっても、最適化を正しく行えるとは限らない。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許公開公報2022/0374778号
【特許文献2】米国特許公開公報2022/0036194号
【特許文献3】米国特許公開公報2021/0357555号
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の一実施形態では、探索範囲を適切に設定して迅速に最適化を行うことが可能な情報処理装置及び情報処理方法を提供するものである。
【課題を解決するための手段】
【0005】
上記の課題を解決するために、本発明の一実施形態によれば、パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、
前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、
前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる探索範囲シフト部と、
前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、
を備える、情報処理装置が提供される。
【図面の簡単な説明】
【0006】
図1】第1の実施形態に係る情報処理装置の概略構成を示すブロック図。
図2】データセットを構成する設定値と評価値の正規化の一例を示す図。
図3】第1の実施形態に係る情報処理装置の処理動作を示すフローチャート。
図4】局所探索範囲生成部の処理を説明する図。
図5】一比較例に係る情報処理装置の概略構成を示すブロック図。
図6図5の情報処理装置の処理動作を示すフローチャート。
図7】一比較例に係る情報処理装置における局所探索範囲生成部の処理を説明する図。
図8】第2の実施形態に係る推薦設定値決定部の処理動作を示すフローチャート。
図9A図8のステップS30とS31の処理を説明する図。
図9B】第2の実施形態と一比較例とで、局所探索範囲生成部の処理を対比させた図。
図10】第3の実施形態に係る推薦設定値決定部の処理動作を示すフローチャート。
図11A】評価値が最善値を取るときの設定値が0.5より小さい場合の局所探索範囲Xlocalのシフト設定例を示す図。
図11B】評価値が最善値を取るときの設定値が0.5以上の場合の局所探索範囲Xlocalのシフト設定例を示す図。
図12】第4の実施形態に係る推薦設定値決定部の処理動作を示すフローチャート。
図13A】パラメータ探索範囲の中心値と局所探索範囲の上限値との差分だけ、局所探索範囲の中心値を右にシフトさせる例を示す図。
図13B】局所探索範囲の下限値とパラメータ探索範囲の中心値との差分だけ、局所探索範囲の中心値を左にシフトさせる例を示す図。
図14】第5の実施形態に係る推薦設定値決定部の処理動作を示すフローチャート。
図15A】パラメータ探索範囲の中心値と局所探索範囲の上限値との差分だけ、局所探索範囲の上限値を右にシフトさせる例を示す図。
図15B】局所探索範囲の下限値とパラメータ探索範囲の中心値との差分だけ、局所探索範囲Xlocalの下限値を左にシフトさせる例を示す図。
【発明を実施するための形態】
【0007】
以下、図面を参照して、情報処理装置及び情報処理方法の実施形態について説明する。以下では、情報処理装置の主要な構成部分を中心に説明するが、情報処理装置には、図示又は説明されていない構成部分や機能が存在しうる。以下の説明は、図示又は説明されていない構成部分や機能を除外するものではない。
【0008】
(第1の実施形態)
図1は第1の実施形態に係る情報処理装置1の概略構成を示すブロック図である。図1の情報処理装置1は、推薦設定値決定部2を備える。推薦設定値決定部2は、モデル訓練部3と、局所探索範囲生成部4と、局所探索範囲シフト部5と、獲得関数最適化部6とを有する。
【0009】
モデル訓練部3は、パラメータの設定値と設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練する。パラメータの設定値とは、例えばメモリセルの電源電圧の設定値、又はメモリセルの読み書きモードの設定値などであり、特定の設定値に限定されるものではない。評価値とは、メモリの読み書き速度などの性能、又はメモリの読み書きの誤り率などのように、設定値の信頼性を表す値である。
【0010】
局所探索範囲生成部4は、モデル訓練部3で訓練された予測モデルとデータセットとに基づいて、予測モデルに入力可能な設定値の最大可変範囲であるパラメータ探索範囲よりも狭い局所探索範囲を生成する。本明細書では、パラメータ探索範囲を第1範囲、局所探索範囲を第2範囲と呼ぶことがある。予測モデルの具体的な形態は任意であるが、例えば、ガウス過程回帰モデル、又はラッソ回帰モデルなどを予測モデルとして適用可能である。
【0011】
局所探索範囲生成部4は、予測モデルのレンクススケールに基づいて局所探索範囲の幅を伸縮させてもよい。レンクススケールとは、設定値の変化に対して評価値がどの程度変化するかを表す感度の逆数である。
【0012】
局所探索範囲シフト部5は、例えば、パラメータ探索範囲の中心値を含むように局所探索範囲をシフトさせる。局所探索範囲シフト部5は、局所探索範囲をシフトさせる前後で、局所探索範囲の幅を変えてもよいし、変えなくてもよい。
【0013】
獲得関数最適化部6は、モデル訓練部3で訓練された予測モデルに局所探索範囲内の設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな設定値を算出する。
この他、図1の情報処理装置1は、出力部7と、入力部8と、判定部9と、記憶部10とを備えていてもよい。
【0014】
出力部7は、獲得関数最適化部6で計算された新たな設定値を出力する。出力部7から出力された設定値は、評価装置11に入力されて、評価値が算出される。評価装置11は、シミュレータであってもよい。図1では、評価装置11を情報処理装置1とは別に配置しているが、情報処理装置1の内部に評価装置11を設けてもよい。評価装置11で算出された評価値は、入力部8で取得される。入力部8で取得された評価値は、対応する設定値とともに記憶部10に記憶される。
【0015】
判定部9は、評価値と所定の終了条件とに基づいて、最適な設定値を決定するか否かを判定する。判定部9が最適な設定値を決定すると判定するまで、モデル訓練部3、局所探索範囲生成部4、局所探索範囲シフト部5、及び獲得関数最適化部6の一連の処理が繰り返される。本明細書では、この一連の処理の一回分をイタレーションと呼ぶ。
【0016】
局所探索範囲生成部4は、一連の処理を繰り返している間に、直前に実行された一連の処理で生成された局所探索範囲とは無関係に、獲得関数最適化部6で算出された新たな設定値に基づいて、新たな局所探索範囲を生成する。
【0017】
一連の処理は、判定部9にて最適な設定値が決定されるまで、繰り返し実行されてもよい。あるいは、一連の処理は、局所探索範囲にパラメータ設定範囲の中心値が含まれない場合に実行されてもよい。あるいは、一連の処理は、一連の処理の実行回数が所定の回数に到達するまで実行されてもよい。
【0018】
記憶部10は、設定値と対応する評価値とを組にしたデータセットを記憶する。イタレーションのたびに新たなデータセットが記憶部10に記憶される。
【0019】
モデル訓練部3は、データセットを構成する設定値と評価値を正規化した値に基づいて、予測モデルを訓練してもよい。図2はデータセットを構成する設定値と評価値の正規化の一例を示す図である。データセットを構成する設定値は、カテゴリカル変数、整数変数、連続値変数、又は二値変数の少なくとも一つを含む。図2は、カテゴリカル変数、整数変数、及び二値変数からなる3つの設定値と評価値とを組にしたデータセットの一例を示す。設定値は説明変数、評価値は目的変数と呼ばれることもある。
【0020】
カテゴリカル変数とは、例えば0及び1を含むビット列であり、各ビット列がそれぞれ異なる水準を表す。図2の例では、水準x1=0、1、2のそれぞれをワンホット表現したカテゴリカル変数x10=[1,0,0]、変数x11=[0,1,0]、変数x12=[0,0,1]を示す。
【0021】
また、図2は、整数変数x2=1、5、6を正規化して0から1までの連続変数x2=0.1、0.9、1.0にする例を示す。
【0022】
さらに、図2に示すように、二値変数x3=1、0、1は、正規化しても、そのままの変数x3=1、0、1である。評価値yは、例えば、評価値yから評価値yの平均を引いた値を、評価値の標準偏差で割る標準化を行ってもよい。評価値yの大きさの順位情報を保存しながら、大きさが標準正規分布に従うように変換するコピュラ変換又は対数変換をしてもよい。
【0023】
図3は第1の実施形態に係る情報処理装置1の処理動作を示すフローチャートである。まず、獲得関数最適化部6は、パラメータの設定値の初期値を出力する(ステップS1)。この初期値は、出力部7から出力されて、評価装置11に入力される。後述するように、本実施形態に係る情報処理装置1は、図3のフローチャートの処理を繰り返し行い、そのたびに、出力部7は設定値を出力する。
【0024】
評価装置11は、出力部7から出力された設定値の評価値を算出する(ステップS2)。評価装置11は、入力された設定値に基づいてシミュレーション又は実験を行って、シミュレーション結果又は実験結果に基づいて評価値を算出する。評価装置11は、入力された設定値が初期値の場合には、初期値に対応する評価値を算出する。
【0025】
入力部8は、評価装置11で算出された評価値を取得する。記憶部10は、出力部7から出力された設定値と、評価装置11で算出されて入力部8で取得された評価値とを組とするデータセットを記憶する(ステップS3)。記憶部10は、情報処理装置1がイタレーションを繰り返すたびに、新たなデータセットを記憶する。
【0026】
次に、判定部9は、記憶部10に新たに記憶されたデータセットの評価値と所定の終了条件に基づいて、最適な設定値を決定するか否かを判定する(ステップS4)。上述したように、終了条件の具体的な内容は任意である。終了条件は、例えば、イタレーションの回数が予め定めた回数に到達した場合、又は図3の処理を開始してからの経過時間が予め定めた時間に到達した場合、同じ設定値が規定回数以上連続で設定された場合などである。
【0027】
ステップS4で最適な設定値を決定しないと判定されると、モデル訓練部3は、データセットを構成する設定値と評価値を正規化した値に基づいて予測モデルを訓練し、訓練済みの予測モデルを出力する(ステップS5)。
【0028】
次に、局所探索範囲生成部4は、訓練済みの予測モデルとデータセットとに基づいて、局所探索範囲を生成する(ステップS6)。局所探索範囲生成部4は、イタレーションのたびに局所探索範囲を伸縮してもよいし、伸縮させなくてもよい。
【0029】
次に、局所探索範囲シフト部5は、パラメータ探索範囲の中心値を含むように局所探索範囲をシフトさせる(ステップS7)。このように、局所探索範囲は、パラメータ探索範囲の中心値を含むようにシフトされるため、パラメータ探索範囲からずれた範囲に局所探索範囲がシフトされるおそれがなくなり、短時間で設定値の絞り込みをかけることができる。
【0030】
次に、獲得関数最適化部6は、訓練済みの予測モデルに、局所探索範囲内の設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな設定値を算出する(ステップS8)。その後、ステップS2以降の処理が繰り返される。
【0031】
一方、ステップS4の判定がYESの場合には、これまでの設定値の中から最適値を決定して出力する(ステップS9)。
【0032】
図3のステップS2~S8の一連の処理が1回分のイタレーションであり、判定部9が最適な設定値を決定するまで、複数回のイタレーションが繰り返される。
【0033】
図4は、局所探索範囲生成部4の処理を説明する図である。図4の上段は、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalに含まれない例を示す。この場合、局所探索範囲生成部4は、図4の中段に示すように、局所探索範囲Xlocalの幅を変えずにパラメータ探索範囲Xの中心値が含まれるように局所探索範囲Xlocalを右側にシフトさせる。あるいは、局所探索範囲生成部4は、図4の下段に示すように、局所探索範囲Xlocalの幅を変えるとともに、パラメータ探索範囲Xの中心値が含まれるように局所探索範囲Xlocalを右側にシフトさせてもよい。
【0034】
図4では、その上段に示す初期状態で、パラメータ探索範囲Xの中心値よりも左側に局所探索範囲Xlocalの上限値が存在する例を示したが、パラメータ探索範囲Xの中心値よりも右側に局所探索範囲Xlocalの下限値が存在する場合には、パラメータ探索範囲Xの中心値が含まれるように局所探索範囲Xlocalを左側にシフトさせる。
【0035】
図5は一比較例に係る情報処理装置100の概略構成を示すブロック図である。図5の情報処理装置100は、図1と共通する構成部分には同一の符号を付しており、以下では相違点を中心に説明する。
【0036】
図5の情報処理装置100には、図1の情報処理装置1における局所探索範囲シフト部5は存在しない。また、図5の情報処理装置100は、図1の情報処理装置1には存在しなかった絞り込み停止判定部12と最適化ロジック切替判定部13を備える。
【0037】
絞り込み停止判定部12は、局所探索範囲Xlocalの幅が狭くなりすぎたか否かを判定し、狭くなりすぎた場合には局所探索範囲Xlocalの絞り込みを停止する。最適化ロジック切替判定部13は、局所探索範囲Xlocalの幅が狭くなりすぎたときに、別の場所に局所探索範囲Xlocalを生成して最適化処理をやり直すか否かを判定する。
【0038】
図6図5の情報処理装置100の処理動作を示すフローチャートである。図6のステップS11~S15は図3のステップS1~S5と共通する。ステップS15において訓練済みの予測モデルが出力されると、局所探索範囲生成部4は、訓練済みの予測モデルと、データセットと、絞り込み停止判定部12の判定結果とに基づいて、局所探索範囲Xlocalを生成する(ステップS16)。より具体的には、局所探索範囲生成部4は、局所探索範囲Xlocalの幅が狭くなりすぎた場合には、別の場所に局所探索範囲Xlocalを生成する。
【0039】
次に、獲得関数最適化部6は、訓練済みの予測モデルに局所探索範囲Xlocal内の設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな設定値を算出する(ステップS17)。より具体的には、獲得関数最適化部6は、局所探索範囲Xlocalが離散的に十分に小さい場合、絞り込み停止判定部12で局所探索範囲Xlocalの絞り込みを停止し、最適化ロジック切替判定部13の判断に基づいて、網羅的な探索を行う。その後、ステップS12以降の処理が繰り返される。
【0040】
図7は一比較例に係る情報処理装置100における局所探索範囲生成部4の処理を説明する図である。パラメータ探索範囲Xの例えば下限値よりもさらに下側に局所探索範囲Xlocalがはみ出している場合、図7の中段に示すように、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの下限値にシフトされる。局所探索範囲Xlocalの下限値が最善値に選ばれると、図7の下段に示すように局所探索範囲Xlocalの幅が急速に縮小して、パラメータ探索範囲X内の特定の値しか選択できなくなるおそれがある。そこで、絞り込み停止判定部12を設けて、局所探索範囲Xlocalの幅が小さくなりすぎた場合は、絞り込みを停止させる。そして、最適化ロジック切替判定部13は、別の場所を網羅的に探索して、別の場所に局所探索範囲Xlocalを設定する。
【0041】
図5図7に示す一比較例に係る情報処理装置100は、図1図4に示す第1の実施形態に係る情報処理装置1と比べて、局所探索範囲Xlocalを適切に設定できないことがあり、最適化ロジック切替判定部13で別の場所に局所探索範囲Xlocalを設定し直すと、設定値の最適化処理に時間がかかる。また、一比較例に係る情報処理装置100は、データセットに含まれる設定値がカテゴリカル変数などの特定の変数を処理できないおそれがある。
【0042】
このように、第1の実施形態では、予測モデルに局所探索範囲Xlocal内の設定値を入力して獲得関数の最適化を行う際、パラメータ探索範囲Xの中心値を含むように局所探索範囲Xlocalをシフトさせるため、局所探索範囲Xlocalの絞り込みを適切に行うことができ、かつ局所探索範囲Xlocalが特定の点に固定化される不具合、又は急激に局所探索範囲Xlocalの幅が狭くなる不具合も起きなくなる。よって、設定値の最適化を迅速かつ精度よく行うことができる。
【0043】
(第2の実施形態)
第2の実施形態は、局所探索範囲生成部4の処理動作が第1の実施形態とは異なる。第2の実施形態に係る情報処理装置1は、図1と同様のブロック構成を備える。
【0044】
図8は第2の実施形態に係る情報処理装置1内の推薦設定値決定部2の処理動作を示すフローチャートである。第2の実施形態に係る情報処理装置1は、図3のステップS4の判定がNOの場合に図8のフローチャートの処理を行う。すなわち、図8のフローチャートは、図3のステップS5~S8とステップS2の処理を詳細に示すものである。
【0045】
まず、モデル訓練部3は、設定値と評価値を含むデータセットを生成する(ステップS21)。より具体的には、モデル訓練部3は、二値変数を0又は1とし、カテゴリカル変数をワンホット表現にし、整数変数及び連続変数を正規化し、探索範囲Xを[0,1]d∈Rdに変換したデータセットDnormを生成する。
【0046】
次に、モデル訓練部3は、データセットDnormのうち、設定値を説明変数x、評価値を目的変数yとしてガウス過程回帰を行い、ガウス過程回帰の予測モデルy=fpred(x)を学習する(ステップS22)。
【0047】
次に、局所探索範囲生成部4は、最新のイタレーションのデータセットDnormに基づいて、最新のイタレーションの評価値がそれ以前のイタレーションの評価値の最善値よりもよいか否かを判定する(ステップS23)。ステップS23の判定がYESの場合、更新連続成功カウンタのカウント値をインクリメントし、更新連続失敗カウンタのカウント値をゼロにリセットする(ステップS24)。ステップS23の判定がNOの場合、更新連続失敗カウンタのカウント値をインクリメントし、更新連続成功カウンタのカウント値をゼロにリセットする(ステップS25)。
【0048】
ステップS24又はS25の処理が終わると、局所探索範囲生成部4は、更新連続成功カウンタのカウント値が所定の閾値以上か否かを判定する(ステップS26)。ステップS26の判定がYESの場合、局所探索範囲Xlocalの幅Lを2倍に広げるとともに、更新連続成功カウンタと更新連続失敗カウンタのカウント値をともにゼロにリセットする(ステップS27)。
【0049】
ステップS26の判定がNOの場合、更新連続失敗カウンタのカウント値が所定の閾値以上か否かを判定する(ステップS28)。ステップS28の判定がYESの場合、局所探索範囲Xlocalの幅Lを1/2に狭めるとともに、更新連続成功カウンタと更新連続失敗カウンタのカウント値をともにゼロにリセットする(ステップS29)。
【0050】
このように、連続した所定回数のイタレーションにおいて評価値が改善する場合には局所探索範囲Xlocalの幅を広げ、連続した所定回数のイタレーションにおいて評価値が悪化した場合には居所探索範囲の幅を狭める。
【0051】
ステップS27又はS29の処理が終わった場合、又はステップS28の判定がNOの場合、局所探索範囲生成部4は、局所探索範囲Xlocalの中心値xcenterをデータセットDnormのうち評価値が最善となる設定値とした局所探索範囲Xlocalを生成する(ステップS30)。
【0052】
次に、局所探索範囲シフト部5は、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの下限値よりも小さい場合には、両方の下限値の差分だけ、局所探索範囲Xlocalの中心値を右にシフトさせるとともに、局所探索範囲Xlocalの上限値がパラメータ探索範囲Xの上限値よりも大きい場合には、両方の上限値の差分だけ、局所探索範囲Xlocalの中心値を左にシフトさせる(ステップS31)。なお、右にシフトとは、局所探索範囲Xlocalの中心値がより大きくなる方向にシフトさせることを意味し、左にシフトとは、中心値がより小さくなる方向にシフトさせることを意味する。
【0053】
次に、局所探索範囲シフト部5は、局所探索範囲Xlocalのうち、パラメータ探索範囲Xに含まれない部分を局所探索範囲Xlocalから除外した新たな局所探索範囲Xlocalを出力する(ステップS32)。
【0054】
次に、獲得関数最適化部6は、獲得関数fpred(x)に基づいて、局所探索範囲Xlocal上でトンプソンサンプリングを行って最適な設定値xoptを算出する(ステップS33)。
【0055】
獲得関数最適化部6は、最適な設定値xoptの二値変数、カテゴリカル変数、整数変数、及び連続変数に対応する次元について、正規化時の逆変換を掛けて離散値に戻し、その離散値を次に評価すべき設定値として出力する(ステップS34)。
【0056】
図9A及び図9B図8のステップS30とS31の処理を説明する図である。図9Aは、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの下限値よりも小さい場合に、局所探索範囲Xlocalの下限値とパラメータ探索範囲Xの下限値との差分だけ、局所探索範囲Xlocalの中心値を右にシフトさせる例を示す。これにより、局所探索範囲Xlocalの全域がパラメータ探索範囲Xに含まれることになる。また、図9Aの例では、局所探索範囲Xlocalの中心値を右にシフトさせることで、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalに含まれることになり、設定値の最適化を行うことができる。図9Aの例では、局所探索範囲Xlocalの幅を変えずに局所探索範囲Xlocalをシフトさせているが、局所探索範囲Xlocalを伸縮させてもよい。
【0057】
図9Bは、第2の実施形態と一比較例とで、局所探索範囲生成部4の処理を対比させた図である。図9Bの左下に示すように、第2の実施形態では、局所探索範囲Xlocalの限界値(例えば下限値)がパラメータ探索範囲Xの限界値(例えば下限値)に一致するように、局所探索範囲Xlocalの幅を変えることなく、右(又は左)にシフトさせる。これに対して、一比較例では、図9Bの右下に示すように、局所探索範囲Xlocalの下限値をパラメータ探索範囲Xの下限値に一致させる点では第2の実施形態と同じであるが、局所探索範囲Xlocalの幅を短くするため、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalに含まれなくなり、ステップS34の逆変換を掛けた際に二値変数、カテゴリカル変数の値が固定化され、設定値の最適化を行えなくなるおそれがある。
【0058】
このように、第2の実施形態では、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの下限値よりも小さい場合、又は、局所探索範囲Xlocalの上限値がパラメータ探索範囲Xの上限値よりも大きい場合、局所探索範囲Xlocalの下限値(上限値)とパラメータ探索範囲Xの下限値(上限値)との差分だけ、局所探索範囲Xlocalの中心値を右又は左にシフトさせ、かつシフト後の局所探索範囲Xlocalのうち、パラメータ探索範囲Xの下限値又は上限値からはみ出している部分を除外するため、局所探索範囲Xlocalの全域をパラメータ探索範囲Xに含めることができ、設計値の最適化を迅速かつ精度よく行うことができる。
【0059】
(第3の実施形態)
第3の実施形態は、局所探索範囲生成部4の処理動作が第1又は第2の実施形態とは異なる。第3の実施形態は、局所探索範囲Xlocalの中心をパラメータ探索範囲Xの中心と必ず一致させ、常に局所探索範囲Xlocalにパラメータ探索範囲Xの中心を含めるように局所探索範囲Xlocalをシフトさせることを特徴とする。第3の実施形態に係る情報処理装置1は、図1と同様のブロック構成を備える。
【0060】
図10は第3の実施形態に係る情報処理装置1内の推薦設定値決定部2の処理動作を示すフローチャートである。図10のステップS41~S49は、図8のステップS21~S29と同様の処理を行う。
【0061】
ステップS47又はS49の処理が終わった場合、又はステップS48の判定がNOの場合、局所探索範囲生成部4は、局所探索範囲Xlocalの中心値xcenterをデータセットDnormのうち評価値が最善となる設定値とした局所探索範囲Xlocalを生成する(ステップS50)。
【0062】
次に、局所探索範囲シフト部5は、局所探索範囲Xlocalのうち、カテゴリカル変数と二値変数に対応する次元については、データセットDnormの評価値が最善値を取るときの設定値がパラメータ探索範囲Xの中心値0.5より小さいか否かを判定する(ステップS51)。ここで、S41のデータセットを作る際にパラメータ探索範囲Xの中心値は0.5となるように正規化されており、設定値が正規化されていることに注意する。
【0063】
ステップS51の判定がYESの場合、局所探索範囲Xlocalの上限値をパラメータ探索範囲Xの中心値+L/3とし、局所探索範囲Xlocalの下限値をパラメータ探索範囲Xの中心値-2L/3とする(ステップS52)。
【0064】
ステップS51の判定がNOの場合、局所探索範囲Xlocalの上限値をパラメータ探索範囲Xの中心値+2L/3とし、局所探索範囲Xlocalの下限値をパラメータ探索範囲Xの中心値-L/3とする(ステップS53)。
【0065】
ステップS52又はS53の処理が終わると、図8のステップS32~S34と同様の処理を行う(ステップS54~S56)。
【0066】
図11A及び図11B図10のステップS51~S53の処理動作を説明する図である。図11A及び図11Bは、パラメータ探索範囲Xの中心値が0.5に正規化されていることを前提として、局所探索範囲Xlocalの上限と下限を設定する過程を示す。図11Aは、評価値が最善値を取るときの設定値が0.5より小さい場合の局所探索範囲Xlocalのシフト設定例を示す図である。この場合、局所探索範囲Xlocalは、上限がパラメータ探索範囲Xの中心値(=0.5)+L/3に設定され、下限が中心値(=0.5)-2L/3に設定される。
【0067】
図11Bは、評価値が最善値を取るときの設定値が0.5以上の場合の局所探索範囲Xlocalのシフト設定例を示す図である。この場合、局所探索範囲Xlocalは、上限がパラメータ探索範囲Xの中心値(=0.5)+2L/3に設定され、下限が中心値(=0.5)-L/3に設定される。
【0068】
このように、第3の実施形態では、局所探索範囲Xlocalが常にパラメータ探索範囲Xの中心値を含むように局所探索範囲Xlocalをシフトさせることを特徴とし、評価値が最善値を取るときの設定値がパラメータ探索範囲Xの中心値より大きいか小さいかによって、局所探索範囲Xlocalのシフト位置を変更するため、上述したステップS56を行った際に常に二値変数、カテゴリカル変数の設定値が固定されるのを避け、局所探索範囲Xlocalを設定値の最適値付近に設定できる。
【0069】
(第4の実施形態)
第4の実施形態は、パラメータ探索範囲Xの中心値が必ず局所探索範囲Xlocalに含まれるように局所探索範囲Xlocalをシフトさせるものである。
【0070】
第4の実施形態は、局所探索範囲生成部4の処理動作が第1~第3の実施形態とは異なる。第4の実施形態に係る情報処理装置1は、図1と同様のブロック構成を備える。
【0071】
図12は第4の実施形態に係る情報処理装置1内の推薦設定値決定部2の処理動作を示すフローチャートである。図12のステップS61~S69は、図8のステップS21~S29と同様の処理を行う。
【0072】
ステップS67又はS69の処理が終わった場合、又はステップS68の判定がNOの場合、局所探索範囲生成部4は、局所探索範囲Xlocalの中心値xcenterをデータセットDnormのうち評価値が最善となる設定値とした局所探索範囲Xlocalを生成する(ステップS70)。
【0073】
局所探索範囲シフト部5は、局所探索範囲Xlocalのうち、カテゴリカル変数と二値変数に対応する次元について、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalの上限値より大きいか否かを判定する(ステップS71)。ステップS71の判定がYESの場合、パラメータ探索範囲Xの中心値と局所探索範囲Xlocalの上限値との差分だけ、局所探索範囲Xlocalの中心値を右にシフトさせる(ステップS72)。
【0074】
ステップS71の判定がNOの場合、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの中心値より大きいか否かを判定する(ステップS73)。ステップS73の判定がYESの場合、局所探索範囲Xlocalの下限値とパラメータ探索範囲Xの中心値との差分だけ、局所探索範囲Xlocalの中心値を左にシフトさせる(ステップS74)。
【0075】
ステップS72又はS74の処理が終わった場合、又はステップS73の判定がNOの場合、図8のステップS32~S34と同様の処理を行う(ステップS75~S77)。
【0076】
図13A及び図13B図12のステップS71~S74の処理動作を説明する図である。図13Aは、パラメータ探索範囲Xの中心値と局所探索範囲Xlocalの上限値との差分だけ、局所探索範囲Xlocalの中心値を右にシフトさせる例を示す図である。図13Bは、局所探索範囲Xlocalの下限値とパラメータ探索範囲Xの中心値との差分だけ、局所探索範囲Xlocalの中心値を左にシフトさせる例を示す図である。
【0077】
このように、第4の実施形態では、パラメータ探索範囲Xの中心値が必ず局所探索範囲Xlocalに含まれるように局所探索範囲Xlocalの中心値をシフトさせるため、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalに含まれるようになり、局所探索範囲Xlocalがパラメータ探索範囲Xから大きくずれなくなる。
【0078】
(第5の実施形態)
第5の実施形態は、パラメータ探索範囲Xの中心値が必ず局所探索範囲Xlocalに含まれるように局所探索範囲Xlocalをシフトさせるものである。
【0079】
第5の実施形態は、局所探索範囲生成部4の処理動作が第1~第4の実施形態とは異なる。第5の実施形態に係る情報処理装置1は、図1と同様のブロック構成を備える。
【0080】
図14は第5の実施形態に係る情報処理装置1内の推薦設定値決定部2の処理動作を示すフローチャートである。図14のステップS81~S89は、図8のステップS21~S29と同様の処理を行う。
【0081】
ステップS87又はS89の処理が終わった場合、又はステップS88の判定がNOの場合、局所探索範囲生成部4は、局所探索範囲Xlocalの中心値xcenterをデータセットDnormのうち評価値が最善となる設定値とした局所探索範囲Xlocalを生成する(ステップS90)。
【0082】
局所探索範囲シフト部5は、局所探索範囲Xlocalのうち、カテゴリカル変数と二値変数に対応する次元について、パラメータ探索範囲Xの中心値が局所探索範囲Xlocalの上限値より大きいか否かを判定する(ステップS91)。ステップS91の判定がYESの場合、パラメータ探索範囲Xの中心値と局所探索範囲Xlocalの上限値との差分だけ、局所探索範囲Xlocalの上限値を右にシフトさせる(ステップS92)。
【0083】
ステップS91の判定がNOの場合、局所探索範囲Xlocalの下限値がパラメータ探索範囲Xの中心値より大きいか否かを判定する(ステップS93)。ステップS92の判定がYESの場合、局所探索範囲Xlocalの下限値とパラメータ探索範囲Xの中心値との差分だけ、局所探索範囲Xlocalの下限値を左にシフトさせる(ステップS94)。
【0084】
ステップS92又はS94の処理が終わった場合、又はステップS93の判定がNOの場合、図8のステップS32~S34と同様の処理を行う(ステップS95~S97)。
【0085】
図15A及び図15B図14のステップS91~S94の処理動作を説明する図である。図15Aは、パラメータ探索範囲Xの中心値と局所探索範囲Xlocalの上限値との差分だけ、局所探索範囲Xlocalの上限値を右にシフトさせる例を示す図である。図15Bは、局所探索範囲Xlocalの下限値とパラメータ探索範囲Xの中心値との差分だけ、局所探索範囲Xlocalの下限値を左にシフトさせる例を示す図である。
【0086】
このように、第5の実施形態では、パラメータ探索範囲Xの中心値が必ず局所探索範囲Xlocalに含まれるように局所探索範囲Xlocalの上限値又は下限値をシフトさせるため、局所探索範囲Xlocalの幅を伸縮させることで、パラメータ探索範囲Xの中心値を局所探索範囲Xlocalに含めることができる。
【0087】
(第6の実施形態)
上述した第1~第5の実施形態では、判定部9が最適な設定値を決定するまでの複数回のイタレーションのそれぞれにおいて、局所探索範囲Xlocalの生成とシフトを行う例を説明したが、一部のイタレーションのみについて、局所探索範囲Xlocalの生成とシフトを行うようにしてもよい。
【0088】
局所探索範囲Xlocalの生成とシフトを行う条件は任意であるが、ここでは、代表的な第1~第3条件について説明する。
【0089】
第1条件は、第1~第5の実施形態で説明したように、判定部9が最適な設定値を決定するまでに行われる複数回のイタレーションのそれぞれにおいて、局所探索範囲Xlocalの生成とシフトを行うものである。この場合、直前のイタレーションで生成された局所探索範囲Xlocalとシフト結果を使用して、次のイタレーションで局所探索範囲Xlocalの生成とシフトを行うのではなく、イタレーションごとに局所探索範囲Xlocalの生成とシフトを行う。
【0090】
第2条件は、局所探索範囲Xlocalにパラメータ探索範囲Xの中心値が含まれていない場合に局所探索範囲Xlocalの生成とシフトを行うものである。第2条件は、一部のイタレーションのみで局所探索範囲Xlocalの生成とシフトを行うため、処理の迅速化を図れる。
【0091】
第3条件は、イタレーションの回数が所定の回数に到達するまでは局所探索範囲Xlocalの生成とシフトを行うものである。終盤のイタレーションでは、局所探索範囲Xlocalも設定値の最適値付近に絞り込まれるため、局所探索範囲Xlocalの生成とシフトを行わなくても、設定値の最適化を適正に行うことができる。例えば、序盤のイタレーションでのみ局所探索範囲Xlocalの生成とシフトを行うことで、処理の迅速化を図ることができる。
【0092】
(第7の実施形態)
上述した第1~第6の実施形態では、ガウス過程回帰モデルに基づく最適化手法(ベイズ最適化とも呼ばれる)を利用して設定値の最適化を行う例を説明したが、本開示に係る情報処理装置1が利用する予測モデルは、ベイズ最適化を行う予測モデルだけに適用されるものではない。例えば、ランダムフォレスト、LightGBM、又はXGBoost等の予測モデルを用いてもよいし、ニューラルネットワークを用いてもよい。
【0093】
上述した実施形態で説明した情報処理装置1の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理装置1の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0094】
また、情報処理装置1の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
[付記]
【0095】
[項目1]
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、
前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、
前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる探索範囲シフト部と、
前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、
を備える、情報処理装置。
[項目2]
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練するモデル訓練部と、
前記モデル訓練部で訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する探索範囲生成部と、
前記第1範囲の中心値を含むように前記第2範囲をシフトさせる探索範囲シフト部と、
前記モデル訓練部で訓練された前記予測モデルに、前記探索範囲シフト部でシフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する獲得関数最適化部と、
を備える、情報処理装置。
[項目3]
前記探索範囲シフト部は、前記第2範囲の幅を変えずに前記第2範囲をシフトさせる、
項目2に記載の情報処理装置。
[項目4]
前記探索範囲シフト部は、前記第2範囲の幅を伸縮させて前記第2範囲をシフトさせる、
項目2に記載の情報処理装置。
[項目5]
前記探索範囲シフト部は、
前記第2範囲の下限値が前記第1範囲の下限値よりも小さい場合には、前記第2範囲の下限値が前記第1範囲の下限値以上になるように、前記第2範囲の幅を変えずに、又は前記第2範囲の幅を短くして前記第2範囲をシフトさせ、
前記第2範囲の上限値が前記第1範囲の上限値よりも大きい場合には、前記第2範囲の上限値が前記第1範囲の上限値以下になるように、前記第2範囲の幅を変えずに、又は前記第2範囲の幅を短くして前記第2範囲をシフトさせる、
項目1乃至4のいずれか一項に記載の情報処理装置。
[項目6]
前記探索範囲シフト部は、前記第2範囲をシフトさせたときに前記第1範囲と重複しなくなった部分範囲を前記第2範囲から除外する、
項目5に記載の情報処理装置。
[項目7]
前記探索範囲シフト部は、前記データセットの評価値が最善となる設定値と前記第1範囲の中心値との大小関係に基づいて、前記第2範囲の上限値又は下限値の少なくとも一方を設定する、
項目1乃至4のいずれか一項に記載の情報処理装置。
[項目8]
前記探索範囲シフト部は、
前記データセットの評価値が最善となる設定値が前記第1範囲の中心値より小さい場合、前記第1範囲の中心値と前記第2範囲の下限値との差分を、前記第2範囲の上限値と前記第1範囲の中心値との差分よりも大きくし、
前記データセットの評価値が最善となる設定値が前記第1範囲の中心値以上の場合、前記第2範囲の上限値と前記第1範囲の中心値との差分を、前記第1範囲の中心値と前記第2範囲の下限値との差分よりも大きくする、
項目7に記載の情報処理装置。
[項目9]
前記探索範囲シフト部は、
前記第1範囲の中心値が前記第2範囲の上限値よりも大きい場合、前記第1範囲の中心値と前記第2範囲の上限値との差分だけ、前記第2範囲の中心値が大きくなるように前記第2範囲をシフトさせ、
前記第2範囲の下限値が前記第1範囲の中心値よりも大きい場合、前記第2範囲の下限値と前記第1範囲の中心値との差分だけ、前記第2範囲の中心値が小さくなるように前記第2範囲をシフトさせる、
項目1乃至4のいずれか一項に記載の情報処理装置。
[項目10]
前記探索範囲シフト部は、
前記第1範囲の中心値が前記第2範囲の上限値よりも大きい場合、前記第1範囲の中心値と前記第2範囲の上限値との差分だけ、前記第2範囲の上限値をより大きくシフトさせ、
前記第2範囲の下限値が前記第1範囲の中心値よりも大きい場合、前記第2範囲の下限値と前記第1範囲の中心値との差分だけ、前記第2範囲の下限値をより小さくシフトさせる、
項目1乃至4のいずれか一項に記載の情報処理装置。
[項目11]
前記評価値と所定の終了条件とに基づいて、最適な前記設定値を決定するか否かを判定する判定部を備え、
前記判定部にて前記最適な設定値を決定すると判定されるまでの少なくとも一部の期間において、前記モデル訓練部、前記探索範囲生成部、前記探索範囲シフト部、及び前記獲得関数最適化部の一連の処理が繰り返される、
項目1乃至10のいずれか一項に記載の情報処理装置。
[項目12]
前記探索範囲生成部は、前記一連の処理を繰り返している間に、直前に実行された前記一連の処理で生成された前記第2範囲とは無関係に、前記獲得関数最適化部で算出された前記新たな設定値に基づいて、新たな前記第2範囲を生成する、
項目11に記載の情報処理装置。
[項目13]
前記一連の処理は、前記判定部にて前記最適な設定値が決定されるまで、繰り返し実行される、
項目11又は12に記載の情報処理装置。
[項目14]
前記一連の処理は、前記第2範囲に前記第1範囲の中心値が含まれない場合に実行される、
項目11又は12に記載の情報処理装置。
[項目15]
前記一連の処理は、前記一連の処理の実行回数が所定の回数に到達するまで実行される、
項目11又は12に記載の情報処理装置。
[項目16]
前記設定値は、カテゴリカル変数、整数変数、連続値変数、又は二値変数の少なくとも一つを含む、
項目1乃至15のいずれか一項に記載の情報処理装置。
[項目17]
前記獲得関数最適化部で算出された前記新たな設定値を出力する出力部と、
前記新たな設定値の評価値を取得する入力部と、を備える、
項目1乃至16のいずれか一項に記載の情報処理装置。
[項目18]
前記新たな設定値と対応する前記評価値とを組にしたデータセットを記憶する記憶部を備える、
項目1乃至17のいずれか一項に記載の情報処理装置。
[項目19]
コンピュータは、
パラメータの設定値と前記設定値の評価値とを組にしたデータセットに基づいて、予測モデルを訓練する手順と、
前記訓練された前記予測モデルと前記データセットとに基づいて、前記予測モデルに入力可能な前記設定値の最大可変範囲である第1範囲よりも狭い第2範囲を生成する手順と、
前記第1範囲の中心値が前記第2範囲に入らない状態から入る状態に前記第2範囲の幅を変えずに前記第2範囲をシフトさせるか、又は前記第1範囲の中心値を含むように前記第2範囲をシフトさせる手順と、
前記訓練された前記予測モデルに、前記シフトさせた後の前記第2範囲内の前記設定値を入力して最適化された獲得関数に基づいて、次に評価するべき新たな前記設定値を算出する手順と、
を実行する、情報処理方法。
【0096】
本開示の態様は、上述した個々の実施形態に限定されるものではなく、当業者が想到しうる種々の変形も含むものであり、本開示の効果も上述した内容に限定されない。すなわち、特許請求の範囲に規定された内容およびその均等物から導き出される本開示の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【符号の説明】
【0097】
1 情報処理装置、2 推薦設定値決定部、3 モデル訓練部、4 局所探索範囲生成部、5 局所探索範囲シフト部、6 獲得関数最適化部、7 出力部、8 入力部、9 判定部、10 記憶部、11 評価装置、12 停止判定部、13 最適化ロジック切替判定部、100 情報処理装置
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10
図11A
図11B
図12
図13A
図13B
図14
図15A
図15B