(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023184242
(43)【公開日】2023-12-28
(54)【発明の名称】設定プログラム、設定方法及び情報処理装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20231221BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022098283
(22)【出願日】2022-06-17
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】▲濱▼田 祐介
(57)【要約】
【課題】学習時のハイパーパラメータの管理の煩雑さを軽減する設定プログラム、設定方法及び情報処理装置を提供する。
【解決手段】機械学習モデルに含まれる複数のハイパーパラメータの全体についての第1設定値及びそれぞれが第1設定値に対する差分を示す1以上の第2設定値の指定を受け付け、受け付けた第1設定値及び第2設定値に基づいて生成される複数のハイパーパラメータ群を機械学習モデルに設定させる処理をコンピュータに実行させる。
【選択図】
図4
【特許請求の範囲】
【請求項1】
機械学習モデルに含まれる複数のハイパーパラメータの全体についての第1設定値及びそれぞれが前記第1設定値に対する差分を示す1以上の第2設定値の指定を受け付け、
指定された前記第1設定値及び前記第2設定値に基づいて生成される複数のハイパーパラメータ群をを前記機械学習モデルに設定させる
処理をコンピュータに実行させることを特徴とする設定プログラム。
【請求項2】
前記コンピュータに、
前記第1設定値に各前記第2設定値で示される差分を加えることで、前記複数のハイパーパラメータ群を生成する処理を実行させることを特徴とする請求項1に記載の設定プログラム。
【請求項3】
前記第2設定値は前記第1設定値における異なる部分の差分のグループが複数設定され、
前記コンピュータに、
2以上の前記グループのそれぞれにおける1以上の前記第2設定値を受け付け、
前記第1設定値に対して、各前記第2設定値で示される差分を前記グループ毎に個別に加えることで前記複数のハイパーパラメータ群を生成する
処理を実行させることを特徴とする請求項1に記載の設定プログラム。
【請求項4】
前記機械学習モデルに設定した前記ハイパーパラメータ群を用いて機械学習処理が試行された場合、試行に用いられた試行済ハイパーパラメータ群を記憶装置に格納し、
前記試行済ハイパーパラメータ群の指定を受けて、前記試行済ハイパーパラメータ群を前記記憶装置から取得して前記機械学習モデルに設定させる
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の設定プログラム。
【請求項5】
前記機械学習モデルに設定した前記ハイパーパラメータ群を用いて機械学習処理が試行された場合、試行に用いられた試行済ハイパーパラメータ群の生成に用いた前記第1設定値及び前記第2設定値の情報が登録された試行済ハイパーパラメータ情報を記憶装置に格納し、
前記試行済ハイパーパラメータ情報の表示要求を受け付けて、記憶装置から前記試行済ハイパーパラメータ情報を取得して表示装置に表示させる
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の設定プログラム。
【請求項6】
情報処理装置に、
機械学習モデルに含まれる複数のハイパーパラメータの全体についての第1設定値及びそれぞれが前記第1設定値に対する差分を示す1以上の第2設定値の指定を受け付けさせ、
指定された前記第1設定値及び前記第2設定値に基づいて生成される複数のハイパーパラメータ群を前記機械学習モデルに設定させる
ことを特徴とする設定方法。
【請求項7】
機械学習モデルに含まれるハイパーパラメータの全体についての第1設定値及びそれぞれが前記第1設定値に対する差分を示す第2設定値を格納するデータ格納部と、
前記第1設定値の指定を受け付けて、指定された前記第1設定値を前記データ格納部から取得する第1取得部と、
1以上の前記第2設定値の指定を受け付けて、指定された前記第2設定値を前記データ格納部から取得する第2取得部と、
前記第1取得部により取得された前記第1設定値及び前記第2取得部により取得された前記第2設定値に基づいて生成される複数のハイパーパラメータ群を前記機械学習モデルに設定させる外部ファイル作成部と、
を備えたことを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、設定プログラム、設定方法及び情報処理装置に関する。
【背景技術】
【0002】
近年、製造業や医療をはじめとする多岐にわたる分野において、機械学習の利用が盛んである。機械学習では、例えば、学習データを用いて所定のタスクを機械学習モデルに学習させる。所定のタスクには、時系列予測、画像分類、音声認識などが含まれる。より具体的には、所定のタスクとしては、画像から製造された物品の欠陥の判別や、従業員の出勤簿データに基づく当該従業員の健康状態の判定などが挙げられる。学習完了後、学習済みの機械学習モデルに所定のタスクに関する未知のデータが入力されることで、推定結果が得られる。また、推定結果を用いて、推定を行った機械学習モデルの推定精度の評価が行われる。機械学習の一例として、ニューラルネットワーク(NN:Neural Network)を学習モデルとして用いる深層学習が知られている。
【0003】
このような機械学習において、機械学習モデルの学習を行う際、様々なハイパーパラメータを用いて試行を行い、最適なパラメータを選定する作業が実施される。このハイパーパラメータを学習ツールに読み込ませる一般的な手法として、以下の3つが挙げられる。
【0004】
1つは、利用者がハイパーパラメータをコードに直接記述する方法である。他の1つは、データベースなどの外部ファイルからハイパーパラメータを読み込む方法である。残りの1つは、最適化ツールからハイパーパラメータを自動生成する方法である。
【0005】
なお、従来、設計知識の乏しい設計者であっても効率の良い最適化が行なえるように、ハイパーパラメータとして好ましい改善パラメータを決定する技術が提案されている。例えば、実績のある情報を教師データとして機械学習モデルの活性化関数のパラメータとして好ましい改善パラメータを決定し、改善パラメータを用いた機械学習モデルからの出力の評価値を用いて改善パラメータを再度決定する技術が提案されている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、ハイパーパラメータは数十~数百にわたる場合も多く、各パラメータ間に依存関係がある場合も多い。外部ファイルからハイパーパラメータを読み込む場合に、単純に学習の試行毎のハイパーパラメータを外部ファイルとして定義すると、新しい試行を行う度に全てのパラメータを定義した外部ファイルを作成することになり、管理が煩雑になる。
【0008】
また、実績のある情報を教師データとして用いて改善パラメータを決定する技術は、ハイパーパラメータを自動生成する手法であり、外部ファイルとしてハイパーパラメータを定義する手法に応用することは困難である。
【0009】
開示の技術は、上記に鑑みてなされたものであって、学習時のハイパーパラメータの管理の煩雑さを軽減する設定プログラム、設定方法及び情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本願の開示する設定プログラム、設定方法及び情報処理装置の一つの態様において、機械学習モデルに含まれる複数のハイパーパラメータの全体についての第1設定値及びそれぞれが前記第1設定値に対する差分を示す1以上の第2設定値の指定を受け付け、受け付けた前記第1設定値及び前記第2設定値に基づいて複数のハイパーパラメータ群を生成して、生成した各前記ハイパーパラメータ群を前記機械学習モデルに設定させる処理をコンピュータに実行させる。
【発明の効果】
【0011】
1つの側面では、本発明は、学習時のハイパーパラメータの管理の煩雑さを軽減することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、実施例に係る情報処理装置のブロック図である。
【
図2】
図2は、パラメータ選択のためのGUIの一例を示す図である。
【
図3】
図3は、試行済ハイパーパラメータ情報の一例を示す図である。
【
図4】
図4は、実施例に係るハイパーパラメータの生成及び利用に関するフローチャートである。
【
図5】
図5は、情報処理装置のハードウェア構成図である。
【発明を実施するための形態】
【0013】
以下に、本願の開示する設定プログラム、設定方法及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する設定プログラム、設定方法及び情報処理装置が限定されるものではない。
【実施例0014】
図1は、実施例に係る情報処理装置のブロック図である。情報処理装置1は、機械学習モデルの学習に用いるハイパーパラメータが登録された外部ファイルを生成し、機械学習装置2へ出力する。情報処理装置1は、
図1に示すように、外部ファイル作成部11、入出力装置12、ベース取得部13、差分取得部14、試行済データ管理部15及びデータ格納部16を有する。
【0015】
データ格納部16は、ハイパーパラメータ情報101及び試行済ハイパーパラメータ情報102を格納する。ハイパーパラメータ情報101には、1つ又は複数のベースパラメータ111及び複数の差分パラメータ112が含まれる。ハイパーパラメータ情報101は、機械学習モデルの学習を実施する開発者により作成されて、入出力装置12などを用いてデータ格納部16により格納される。以下では、機械学習モデルの学習を実施する開発者を単に「利用者」と呼ぶ。
【0016】
ここで、機械学習モデルに含まれるハイパーパラメータは複数存在する。そこで、以下では機械学習モデルに含まれる複数のハイパーパラメータをまとめて「ハイパーパラメータ群」と呼ぶ。すなわち、機械学習モデルの学習を行う場合、1回の学習の試行において、ハイパーパラメータ群に含まれる全てのハイパーパラメータの値が設定される。
【0017】
ベースパラメータ111は、それぞれが機械学習モデルの学習の1回の試行に使用する基本となるハイパーパラメータ群に含まれる全てのハイパーパラメータの設定値を含んだハイパーパラメータの設定値のセットである。ベースパラメータ111に含まれるハイパーパラメータの設定値は、機械学習モデルの学習が効率よく進むように選択された値であることが好ましい。
【0018】
ベースパラメータ111には、それぞれにパラメータ名が付けられる。特に、ベースパラメータ111には、それぞれの特徴を表すパラメータ名、言い換えれば、そのベースパラメータ111の意図が推測できるようなパラメータ名が付けられることが好ましい。ベースパラメータ111が、「第1設定値」の一例にあたる。
【0019】
差分パラメータ112は、それぞれがベースパラメータ111の差分となる設定値の情報である。差分パラメータ112は、ベースパラメータ111に含まれる複数のハイパーパラメータの設定値うちのいくつかのハイパーパラメータの差分を含む。
【0020】
さらに、差分パラメータ112は、ベースパラメータ111における異なる部分の差分のグループが複数設定されてもよい。例えば、同じハイパーパラメータの差分となる差分パラメータ112同士をグループ化して分類してもよい。
【0021】
差分パラメータ112にも、それぞれにパラメータ名が付けられる。特に、差分パラメータ112にも、それぞれの特徴を表すパラメータ名、言い換えれば、その差分パラメータ112の意図が推測できるようなパラメータ名が付けられることが好ましい。差分パラメータ112が、「第2設定値」の一例にあたる。
【0022】
試行済ハイパーパラメータ情報102は、機械学習モデルの学習の試行で使用されたハイパーパラメータを示す情報である。試行済ハイパーパラメータ情報102は、試行済データ管理部15により生成される。
【0023】
入出力装置12は、モニタなどの表示装置及びキーボードやマウスなどの入力装置を含む。利用者は、入出力装置12を用いてベースパラメータ111や差分パラメータ112を選択し、選択したベースパラメータ111や差分パラメータ112の情報を情報処理装置1に入力する。
【0024】
例えば、入出力装置12は、GUI(Graphical User Interface)を用いて利用者にベースパラメータ111及び差分パラメータ112の選択及び入力を行わせることができる。
図2は、パラメータ選択のためのGUIの一例を示す図である。入出力装置12は、自己が有する表示装置に
図2に示すGUI201を表示させる。パラメータ選択画面201は、ベースパラメータ選択領域202と差分パラメータ選択領域203とを有する。ベースパラメータ選択画面201は、ドロップダウンリストを用いてベースパラメータ111を表示する。また、差分パラメータ選択領域203は、リストボックスを用いて差分パラメータ112を表示する。
【0025】
入出力装置12は、利用者がマウスなどを用いてドロップダウンボタンを押下すると、ベースパラメータ111のリストをベースパラメータ選択領域202に表示させる。そして、入出力装置12は、ベースパラメータ選択領域202に表示された複数のベースパラメータ111の中から機械学習モデルの学習に使用するベースパラメータ111の1つ以上の選択を受け付ける。
【0026】
また、入出力装置12は、差分パラメータ選択領域203に表示された複数の差分パラメータ112のリストの中から1以上の差分パラメータ112の選択を受け付ける。ただし、差分パラメータ112が選択されない場合、機械学習モデルの学習はベースパラメータ111により行われる。例えば、差分パラメータ112がハイパーパラメータの種類によりグループ分けされている場合、利用者は、いくつかのグループ毎に1つ又は複数の差分パラメータ112を選択することができる。これにより、情報処理装置1は、異なる種類の差分パラメータ112の組み合わせをベースパラメータ111の差分として用いることができる。
【0027】
その後、利用者によりベースパラメータ111及び差分パラメータ112の選択が確定されると、入出力装置12は、パラメータ選択画面201において選択されたベースパラメータ111の情報をベース取得部13へ出力する。また、入出力装置12は、パラメータ選択画面201において選択された差分パラメータ112の情報を差分取得部14へ出力する。
【0028】
他にも、利用者は、CLI(Command Line Interface)を用いてベースパラメータ111及び差分パラメータ112を指定することができる。具体的には、入出力装置12は、ベースパラメータ111及び差分パラメータ112のそれぞれのパラメータ名の入力を受ける。入出力装置12は、ファイル名やデータベースレコード名をファイル名として用いることができる。例えば、入出力装置12は、「$ train -b base_param2 -d diff_param1 diff_param3」といったシンタックスの入力をCLI経由で受ける。この場合も、入出力装置12は、ベースパラメータ111及び差分パラメータ112のいずれについても複数の指定を受けることが可能である。入出力装置12は、入力されたデータからベースパラメータ111及び差分パラメータ112のパラメータ名を特定する。そして、入出力装置12は、特定したベースパラメータ111の情報をベース取得部13へ出力する。また、入出力装置12は、特定した差分パラメータ112の情報を差分取得部14へ出力する。
【0029】
ベース取得部13は、利用者により選択されたベースパラメータ111の情報の入力を入出力装置12から受ける。そして、ベース取得部13は、指定されたベースパラメータ111をデータ格納部16から取得する。その後、ベース取得部13は、取得したベースパラメータ111を外部ファイル作成部11へ出力する。このベース取得部13が、「第1取得部」の一例にあたる。
【0030】
差分取得部14は、利用者により選択された差分パラメータ112の情報の入力を入出力装置12から受ける。例えば、差分パラメータ112がハイパーパラメータの種類によりグループ分けされている場合、差分取得部14は、各グループの差分パラメータ112の情報の入力を入出力装置12から受けてもよい。すなわち、第2設定値について第1設定値における異なる部分の差分のグループが複数設定された場合に、差分取得部14は、2以上の前記グループのそれぞれにおける1以上の第2設定値を受け付ける。
【0031】
そして、差分取得部14は、指定された差分パラメータ112をデータ格納部16から取得する。その後、ベース取得部13は、取得した差分パラメータ112を外部ファイル作成部11へ出力する。この差分取得部14が、「第2取得部」の一例にあたる。
【0032】
外部ファイル作成部11は、ベースパラメータ111の入力をベース取得部13から受ける。また、外部ファイル作成部11は、差分パラメータ112の入力を差分取得部14から受ける。次に、外部ファイル作成部11は、ベースパラメータ111と差分パラメータ112とを組み合わせて学習に用いるハイパーパラメータ群を複数作成する。すなわち、外部ファイル作成部11は、第1設定値に各第2設定値で示される差分を加えることで、数のハイパーパラメータ群を生成する。
【0033】
例えば、差分パラメータ112がハイパーパラメータの種類によりグループ分けされている場合、外部ファイル作成部11は、いくつかのグループの差分パラメータ112の入力を差分取得部14から受けてもよい。その場合、外部ファイル作成部11は、ベースパラメータ111に対して各グループの差分パラメータ112を組み合わせた差分を与えることで、ハイパーパラメータ群を作成することができる。すなわち、第2設定値について第1設定値における異なる部分の差分のグループが複数設定された場合に、外部ファイル作成部11は、前記第1設定値に対して、各第2設定値で示される差分をグループ毎に個別に加えることで前記複数のハイパーパラメータ群を生成する。
【0034】
例えばベースパラメータ111が5種類選ばれているとする。また、含まれるハイパーパラメータの種類によりグループ化された差分パラメータ112のうち、1つのグループから3種類の差分パラメータ112が選ばれ、他の1つのグループから5種類の差分パラメータ112が選ばれたとする。この場合、外部ファイル作成部11は、差分パラメータ112を用いずにベースパラメータ111そのものを学習に用いるハイパーパラメータ群とする場合も含めて、5×4×6=120種類のハイパーパラメータ群を生成する。そして、外部ファイル作成部11は、生成した120種類のハイパーパラメータを登録した外部ファイルを作成する。この際、外部ファイル作成部11は、ハイパーパラメータ群それぞれにパラメータ名を付与する。
【0035】
次に、外部ファイル作成部11は、機械学習モデルの学習の実行のために機械学習装置2からの外部ファイルの送信要求を受けると、作成した外部ファイルを機械学習装置2へ送信する。これにより、外部ファイル作成部11は、外部ファイルに登録された各ハイパーパラメータ群の設定値を機械学習モデルに設定させる。すなわち、外部ファイル作成部11は指定された第1設定値及び第2設定値に基づいて複数のハイパーパラメータ群を生成して、生成した各ハイパーパラメータ群を機械学習モデルに設定させる。
【0036】
その後、外部ファイル作成部11は、送信した外部ファイルを用いた機械学習モデルの学習の完了通知を機械学習装置2から受ける。そして、外部ファイル作成部11は、送信した外部ファイルに登録されたハイパーパラメータ群を試行済ハイパーパラメータとして、その試行済ハイパーパラメータの情報を試行済データ管理部15に通知する。例えば、外部ファイル作成部11は、送信した外部ファイルを試行済データ管理部15に送信することで、試行済ハイパーパラメータの情報を通知できる。
【0037】
試行済データ管理部15は、試行済ハイパーパラメータの情報の入力を外部ファイル作成部11から受ける。そして、試行済データ管理部15は、試行済ハイパーパラメータを試行毎にデータ格納部16が有するデータベースに登録する。さらに、試行済データ管理部15は、試行済ハイパーパラメータであるハイパーパラメータ群の生成に用いたベースパラメータ111及び差分パラメータ112を登録した試行済ハイパーパラメータ情報102をデータ格納部16に格納する。
【0038】
図3は、試行済ハイパーパラメータ情報の一例を示す図である。試行済データ管理部15は、例えば、試行済ハイパーパラメータ情報102に、試行済ハイパーパラメータのパラメータ名を登録する。また、試行済データ管理部15は、試行済ハイパーパラメータ情報102に、試行済ハイパーパラメータの生成に用いたベースパラメータ111及び差分パラメータ112のパラメータ名を登録する。例えば、試行済データ管理部15は、「trial-1」という試行済ハイパーパラメータに対して、「basic_cnn」というベースパラメータ111と、「high_lr」及び「deep_cnn」という差分パラメータ112とを登録する。
【0039】
その後、試行済データ管理部15は、特定の試行の再現のためにその特定の試行で用いられたハイパーパラメータ群の送信要求を機械学習装置2から受ける。そして、試行済データ管理部15は、データ格納部16が有するデータベースから要求に応じた試行済ハイパーパラメータを取得する。そして、試行済データ管理部15は、取得した試行済ハイパーパラメータを機械学習装置2へ送信して、機械学習モデルに設定させる。これにより、機械学習装置2は、試行済ハイパーパラメータを用いて既に行った試行を容易に再現することができる。
【0040】
すなわち、試行済データ管理部15は、機械学習モデルに設定したハイパーパラメータ群を用いて機械学習処理が試行された場合、試行に用いられた試行済ハイパーパラメータ群をデータ格納部16に格納する。そして、試行済データ管理部15は、試行済ハイパーパラメータ群の指定を受けて、試行済ハイパーパラメータ群をデータ格納部16から取得して機械学習モデルに設定させる。
【0041】
また、試行済データ管理部15は、入出力装置12を介して利用者からの試行済ハイパーパラメータの情報の表示要求の入力を受ける。その場合、試行済データ管理部15は、試行済ハイパーパラメータ情報102をデータ格納部16から取得して、入出力装置12へ出力して表示装置に表示させる。利用者は、試行済ハイパーパラメータ情報102に表示されたベースパラメータ111及び差分パラメータ112のパラメータ名から、試行に用いられたハイパーパラメータ群の元となったベースパラメータ111及び差分パラメータ112の組合せを確認できる。
【0042】
すなわち、試行済データ管理部15は、機械学習モデルに設定したハイパーパラメータ群を用いて機械学習処理が試行された場合、試行済ハイパーパラメータ情報102をデータ格納部16に格納する。試行済ハイパーパラメータ情報102には、試行に用いられた試行済ハイパーパラメータ群の生成に用いた第1設定値及び第2設定値の情報が登録される。そして、試行済データ管理部15は、試行済ハイパーパラメータ情報102の表示要求を受け付けて、データ格納部16から試行済ハイパーパラメータ情報102を取得して入出力装置12に表示させる。
【0043】
また、試行済データ管理部15は、入出力装置12を介して利用者からのデータベースログの表示要求の入力を受ける。そして、試行済データ管理部15は、試行済ハイパーパラメータが試行毎に登録されたデータベースのデータベースログを入出力装置12へ出力して表示装置に表示させる。利用者は、データベースログを参照して、どの試行でどのパイパーパラメータ群が用いられたかが判定できる。この情報と試行済ハイパーパラメータ情報102とを用いることで、利用者は、特定の試行で用いられたハイパーパラメータ群が、どのベースパラメータ111及び差分パラメータ112から生成されたものか容易に確認できる。
【0044】
図4は、実施例に係るハイパーパラメータの生成及び利用に関するフローチャートである。次に、
図4を参照して、実施例に係る情報処理装置1によるハイパーパラメータの生成処理及びハイパーパラメータ利用時の動作の流れについて説明する。
【0045】
データ格納部16は、利用者などにより作成されたベースパラメータ111及び差分パラメータ112を含むハイパーパラメータ情報101を格納する(ステップS1)。
【0046】
入出力装置12は、機械学習モデルの学習に使用するベースパラメータ111及び差分パラメータ112の指定を受け付ける(ステップS2)。
【0047】
入出力装置12は、指定されたベースパラメータ111の情報をベース取得部13へ出力する。また、入出力装置12は、指定された差分パラメータ112の情報を差分取得部14へ出力する。ベース取得部13は、取得した情報で指定されたベースパラメータ111をデータ格納部106から取得する。また、差分取得部14は、取得した情報で指定された差分パラメータ112をデータ格納部106から取得する(ステップS3)。
【0048】
ベース取得部13は、取得したベースパラメータ111を外部ファイル作成部11へ出力する。また、差分取得部14は、取得した差分パラメータ112を外部ファイル作成部11へ出力する。外部ファイル作成部11は、取得したベースパラメータ111と差分パラメータ112とを組み合わせて複数のハイパーパラメータ群を生成し、生成した複数のハイパーパラメータ群を登録した外部ファイルを生成する(ステップS4)。
【0049】
その後、外部ファイル作成部11は、外部ファイルの取得要求を受けて、生成した外部ファイルを機械学習装置2へ送信して、機械学習モデルに外部ファイルに登録されたハイパーパラメータ群の設定値を設定させる。機械学習装置2は、取得した外部ファイルに登録されたハイパーパラメータ群の設定値を機械学習モデルに順次設定して学習の試行を繰り返す(ステップS5)。
【0050】
機械学習装置2は、外部ファイルを用いた学習が完了すると、受信した外部ファイルによる試行の完了を外部ファイル作成部11へ通知する。外部ファイル作成部11は、試行済ハイパーパラメータの情報を試行済データ管理部15へ出力する。試行済データ管理部15は、試行済ハイパーパラメータの情報を登録した試行済ハイパーパラメータ情報102をデータ格納部16に格納する(ステップS6)。また、試行済データ管理部15は、データ格納部16が有するデータベースに、試行済ハイパーパラメータを試行毎に登録する。
【0051】
試行済データ管理部15は、試行済ハイパーパラメータの取得要求を機械学習装置2から受ける。そして、試行済データ管理部15は、指定された試行済ハイパーパラメータをデータ格納部16が有するデータベースから取得する。そして、試行済データ管理部15は、取得した試行済ハイパーパラメータを機械学習装置2へ送信する(ステップS7)。
【0052】
機械学習装置2は、取得要求で指定した試行済ハイパーパラメータを試行済データ管理部15から受信する。そして、機械学習装置2は、受信した試行済ハイパーパラメータの設定値を用いて機械学習モデルの学習の試行を再現する(ステップS8)。
【0053】
また、試行済データ管理部15は、入出力装置12を介して試行済ハイパーパラメータ情報102の表示要求を受け付ける。そして、試行済データ管理部15は、試行済ハイパーパラメータ情報102をデータ格納部16から取得する。その後、試行済データ管理部15は、試行済ハイパーパラメータ情報102を入出力装置12へ送信して表示装置に試行済ハイパーパラメータ情報102を表示させる(ステップS9)。
【0054】
以上に説明したように、本実施例に係る情報処理装置は、機械学習モデルの学習時に使用するハイパーパラメータ群を、指定されたベースパラメータ及び差分パラメータの組合せにより生成する。そして、情報処理装置は、生成した複数のハイパーパラメータを登録した外部ファイルを機械学習装置に送って、機械学習モデルに設定させる。このように、ベースパラメータ及び差分パラメータの組合せにより、ハイパーパラメータ群を生成することで、元から用意するデータを少なく抑えることができる。したがって、学習時のハイパーパラメータの管理の煩雑さを軽減することが可能となる。
【0055】
例えば、5種類のベースパラメータ、及び、異なるハイパーパラメータを含む2グループの中からそれぞれ3種類の差分パラメータと5種類の差分パラメータとを用いてハイパーパラメータ群を生成する場合について説明する。この場合、本実施例に係る情報処理装置1は、5つのベースパラメータ及び8種類の差分パラメータが作成されれば、5×4×6=120種類のハイパーパラメータ群を含む外部ファイルを生成できる。これに対して、ハイパーパラメータ群を1つずつ登録して外部ファイルを生成する場合、試行させる120種類のハイパーパラメータ群を全て作成することになる。このように、本実施例に係る情報処理装置を用いることで、機械学習モデルの学習を実施する開発者は全ての試行に対するハイパーパラメータ群を個別に作成しなくてもよくなり、少ない工程で多くの試行を実施することが可能となる。また、試行毎にハイパーパラメータ群を変更する場合であっても、全てのハイパーパラメータ群を試行毎に変更しなくてもよいため、効率的に機械学習モデルの学習を実施することが可能となる。
【0056】
また、データベースログや試行済ハイパーパラメータ情報を参照することで、試行結果に対する使用したベースパラメータ及び差分パラメータを容易に特定できるため、ハイパーパラメータ群の管理の煩雑さを軽減することが可能となる。また、全ての試行済のパラメータ群がベースパラメータと差分パラメータとの組み合わせで表現されるため、開発者及び利用者ともにパラメータ設定の意図が理解しやすくなる。
【0057】
(ハードウェア構成)
図5は、情報処理装置のハードウェア構成図である。次に、
図5を参照して、情報処理装置1の各機能を実現するためのハードウェア構成の一例について説明する。
【0058】
図5に示すように、情報処理装置1は、例えば、CPU(Central Processing Unit)91、メモリ92、ハードディスク93、ネットワークインタフェース94、入力装置95及びモニタ96を有する。CPU91は、バスを介して、メモリ92、ハードディスク93及びネットワークインタフェース94に接続される。
【0059】
入力装置95は、例えば、キーボードやマウスなどである。入力装置95及びモニタ96は、入出力装置12に含まれる。
【0060】
ネットワークインタフェース94は、情報処理装置1と外部装置との間の通信のためのインタフェースである。ネットワークインタフェース94は、例えば、機械学習装置2とCPU91との間の通信を中継する。
【0061】
ハードディスク93は、補助記憶装置である。ハードディスク93は、
図1に例示したデータ格納部16の機能を実現する。また、ハードディスク93は、
図1に例示した、外部ファイル作成部11、入出力装置12の一部、ベース取得部13、差分取得部14及び試行済データ管理部15の機能を実現するためのプログラムを含む各種プログラムを格納する。
【0062】
メモリ92は、主記憶装置である。メモリ92は、例えば、DRAM(Dynamic Random Access Memory)を用いることができる。
【0063】
CPU91は、ハードディスク93から各種プログラムを読み出して、メモリ92に展開して実行する。これにより、CPU91は、
図1に例示した、外部ファイル作成部11、入出力装置12の一部、ベース取得部13、差分取得部14及び試行済データ管理部15の機能を実現する。