(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-24
(45)【発行日】2024-10-02
(54)【発明の名称】モデル生成支援装置、モデル生成支援方法及びプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240925BHJP
【FI】
G06N20/00
(21)【出願番号】P 2023528801
(86)(22)【出願日】2021-06-15
(86)【国際出願番号】 JP2021022691
(87)【国際公開番号】W WO2022264262
(87)【国際公開日】2022-12-22
【審査請求日】2023-12-08
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】市原 悦子
(72)【発明者】
【氏名】榮 純明
(72)【発明者】
【氏名】多賀戸 裕樹
(72)【発明者】
【氏名】小梨 貴史
(72)【発明者】
【氏名】西岡 淳
(72)【発明者】
【氏名】小林 佑嗣
(72)【発明者】
【氏名】児玉 純
【審査官】千葉 久博
(56)【参考文献】
【文献】特開2020-4080(JP,A)
【文献】特開2018-109906(JP,A)
【文献】特許第5885875(JP,B1)
【文献】米国特許出願公開第2017/0206451(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得手段と、
複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定手段と、
前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力手段と、
を備えるモデル生成支援装置。
【請求項2】
前記表示データに含まれる複数の前記ノードは、前記試行を行った順に配列される、
請求項1に記載のモデル生成支援装置。
【請求項3】
前記試行情報は、
第1のパラメータ及び前記第1のパラメータとは異なる第2のパラメータを含み、
前記推定手段は、前記第1のパラメータが共通し前記第2のパラメータが変化する複数の試行を、関連する第1の試行群として抽出し、
前記出力手段は、前記第1の試行群を示す複数のノードと当該複数のノード間を接続するリンクとを含む前記表示データを出力する、
請求項1又は2に記載のモデル生成支援装置。
【請求項4】
前記試行情報は、
前記第1のパラメータ及び前記第2のパラメータとは異なる第3のパラメータをさらに含み、
前記推定手段は、前記第2のパラメータ及び前記第3のパラメータが共通し前記第1のパラメータが変化する複数の試行を、関連する第2の試行群として抽出し、
前記第2の試行群のうちの時間的に先頭の試行に対して前記第1のパラメータ及び前記第2のパラメータが共通する、前記第1の試行群における試行を、前記第1の試行群における分岐点として特定し、
前記出力手段は、
前記第2の試行群を示す前記ノード及び前記リンクが、前記第1の試行群を示す複数のノードのうちの前記分岐点の試行を示すノードから分岐して接続された前記表示データを出力する、
請求項3に記載のモデル生成支援装置。
【請求項5】
前記表示データでは、前記第1の試行群及び前記第2の試行群に含まれる複数の試行に対応する複数のノードが、試行を行った順に所定の方向に配置される、
請求項4に記載のモデル生成支援装置。
【請求項6】
前記表示データは、各前記試行において得られる前記AIモデルの性能を示す情報を含む、
請求項1から5のいずれか1項に記載のモデル生成支援装置。
【請求項7】
前記表示データは、各試行で用いたパラメータを含む、
請求項1から6のいずれか1項に記載のモデル生成支援装置。
【請求項8】
前記推定手段は、前記複数の試行のうち、前記関連性を有する前段の試行に比べて前記AIモデルの性能が向上した試行、又は性能が劣化した試行を特定し、
前記出力手段は、前記特定した試行を示すノードと、当該ノードと前記前段の試行を示すノードとを接続するリンクとの一方又は両方を、他のノード又は他のリンクと異なる態様で出力する、
ことを特徴とする請求項1から7のいずれか1項に記載のモデル生成支援装置。
【請求項9】
前記出力手段は、前記特定した試行を示すノードの色調、当該ノードの大きさ、形状、当該リンクの色調、及び当該リンクの太さのうちの少なくともいずれかを、他のノード又は他のリンクと異なる態様で出力する、
ことを特徴とする請求項8に記載のモデル生成支援装置。
【請求項10】
前記表示データは、性能の向上又は劣化の程度に応じた態様のノードを含む、
ことを特徴とする請求項8又は9に記載のモデル生成支援装置。
【請求項11】
前記表示データは、前記特定した試行で得られた前記AIモデルの性能と、前記前段の試行で得られた前記AIモデルの性能との差が所定の閾値以内である場合、前記特定した試行を示すノードと、前記前段の試行を示すノードとを、これらのノードの少なくとも一部を重ねた態様で含む、
ことを特徴とする請求項8から10のいずれか1項に記載のモデル生成支援装置。
【請求項12】
少なくとも1つのプロセッサが、
AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得し、
複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定し、
前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する、
ことを含むモデル生成支援方法。
【請求項13】
コンピュータに、
AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得処理と、
複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定処理と、
前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力処理と、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、モデル生成支援装置、モデル生成支援方法及びプログラムに関する。
【背景技術】
【0002】
近年、予測モデルに基づいて、さまざまな事象の予測が行われている。例えば、特許文献1には、予測モデルから出力された予測結果と、当該予測モデルの予測ロジックを示す決定論理とを提示する計算機システムが開示されている。
【0003】
また、例えば特許文献2には、分析対象の学習データが非常に少ない段階では、対象の学習データ及び類似する学習データを用いて予測モデルを構築し、対象の学習データが十分に蓄積された段階では、対象の学習データのみを用いて予測モデルを構築する学習モデル選択システムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2020-126510号公報
【文献】国際公開2015/146026号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、より精度のよい予測モデルを構築する過程では、構築条件等を変化させながら予測モデルを構築する処理が繰り返される。このような構築の過程は、他の予測モデルを構築する際に参考にできる場合がある。また、このような構築の過程は、当該予測モデルの性能の良さを示す根拠として提示できる場合がある。しかしながら、特許文献1、2に記載された技術では、どのような経過で予測モデルが構築されたのかがわかりにくく、モデルの生成を支援することが難しいという問題があった。
【0006】
本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、モデルの構築の過程をより理解し易く提示することにより、モデルの生成を支援する技術を提供することである。
【課題を解決するための手段】
【0007】
本発明の一側面に係るモデル生成支援装置は、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得手段と、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定手段と、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力手段と、を備える。
【0008】
本発明の一側面に係るモデル生成支援方法は、少なくとも1つのプロセッサが、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得し、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定し、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する、ことを含む。
【0009】
本発明の一側面に係るプログラムは、コンピュータに、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得処理と、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定処理と、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力処理と、を実行させる。
【発明の効果】
【0010】
本発明の一態様によれば、モデルの構築の過程をより理解し易く提示することにより、モデルの生成を支援することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の例示的実施形態1に係る情報処理装置の構成を示すブロック図である。
【
図2】例示的実施形態1に係る情報処理装置が出力するノード及びリンクの表示要素の一例である。
【
図3】例示的実施形態1に係る情報処理方法S1の流れを示すフローチャートである。
【
図4】本発明の例示的実施形態2に係る情報処理システムの構成を示すブロック図である。
【
図5】ユーザが実行する1回の試行の処理の流れを示す概念図である。
【
図6】例示的実施形態2に係るモデル構築装置に入力される入力データとパラメータデータの一例である。
【
図7】データベースに記録されたすべての試行情報表の一部を示す例である。
【
図8】例示的実施形態2に係る情報処理装置が取得する試行情報表の一例である。
【
図9】例示的実施形態2に係る情報処理装置が試行間の関連性を推定した推定データの一例である。
【
図10】例示的実施形態2に係る情報処理装置が生成して出力する表示データの一例である。
【
図11】例示的実施形態3に係る情報処理装置が推定した、各試行を示すノードの色濃度を含む色濃度表の一例である。
【
図12】例示的実施形態3に係る情報処理装置が推定した、ノードを接続するリンクの太さを含む太さ表の一例である。
【
図13】例示的実施形態3に係る情報処理装置が出力した、ノードの色濃度とリンクの太さをロス値に基づいて強調表示した表示データの一例である。
【
図14】例示的実施形態3に係る情報処理装置が出力した別の態様の表示データの一例である。
【
図15】例示的実施形態3に係る情報処理装置が出力した別の態様の表示データの一例である。
【
図16】例示的実施形態3に係る情報処理装置が出力した別の態様の表示データの一例である。
【
図17】例示的実施形態3に係る情報処理装置が出力した別の態様の表示データの一例である。
【
図18】ソフトウェアによって各部を構成する図である。
【発明を実施するための形態】
【0012】
〔例示的実施形態1〕
本発明の第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。
【0013】
(情報処理装置の構成)
本例示的実施形態に係る情報処理装置1の構成について、
図1を参照して説明する。
図1は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、モデル構築装置がモデルを構築する過程を可視化する装置である。モデル構築装置は、情報処理装置1とは物理的に異なる装置であってもよいし、同一の装置であってもよい。なお、情報処理装置1は、請求の範囲に記載した「モデル生成支援装置」の一形態である。
【0014】
本例示的実施形態におけるモデルは、入力情報に対する推論結果を出力する。モデルが行う推論の内容は限定されないが、例えば、回帰、分類、予測、最適化等を含む。この場合、推論結果とは、回帰結果、分類結果、予測結果、最適結果等を含む。モデルの種類は限定されないが、例えば、背景知識を参照して生成されるルールベースモデルであってもよいし、機械学習アルゴリズムによって生成される機械学習モデルであってもよい。また、機械学習モデルは、回帰分析モデル、サポートベクターマシン、決定木モデル、遺伝的アルゴリズムモデル、ニューラルネットワークモデル等を含む。以降、本実施形態におけるモデルを、「AI(Artificial Intelligence)モデル」ともいう。
【0015】
本例示的実施形態では、AIモデルを生成又は改変する試行を繰り返すことを、「モデルを構築する」と称する。また、このような試行は、ユーザ操作に基づいてモデル構築装置が繰り返すものであってもよいし、ユーザ操作によらずにモデル構築装置が繰り返すものであってもよい。本例示的実施形態では、このような試行は、ユーザ操作に基づいてモデル構築装置が繰り返すものとする。以下、構築する対象のAIモデルを、「対象モデル」と称することがある。
【0016】
図1に示すように、情報処理装置1は、取得部11、推定部12及び出力部13を備えている。なお、取得部11は請求の範囲に記載した「取得手段」の一形態であり、推定部12は請求の範囲に記載した「推定手段」の一形態であり、出力部13は請求の範囲に記載した「出力手段」の一形態である。また、情報処理装置1は、少なくとも1つのプロセッサを含み、取得部11、推定部12及び出力部13は、請求の範囲に記載した「少なくとも1つのプロセッサ」によって実現される構成の一形態である。
【0017】
モデル構築装置は、ユーザ操作に基づき、AIモデルを構築するために複数の試行を実行する。取得部11は、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する。以下では、試行の各々を示す情報の全体、又は個々の情報を「試行情報」とも称する。試行情報には、一例として、当該試行において用いられたパラメータ、評価結果等を示す情報が含まれる。例えば、試行情報は、モデル構築装置によって情報処理装置1の外部にあるデータベースに記録されており、取得部11は、試行情報をデータベースから取得する。取得部11は、取得した情報を推定部12に送信する。あるいは、この試行情報は、情報処理装置1の図示しないメモリに記録されており、取得部11は、メモリから試行情報を取得してもよい。試行情報の具体例については後述する。
【0018】
推定部12は、取得部11から受信した複数の試行それぞれの試行情報の差異に基づいて、複数の試行の間の関連性を推定する。推定部12は、推定した関連性に関する事項を、出力部13に送信する。試行情報の差異又は変化と試行の関連性の具体例については後述する。
【0019】
出力部13は、推定部12から受信した関連性に関する事項を参照して、複数の試行それぞれを示す複数のノードと、関連性を示すリンクとを含む表示データを出力する。表示データは、出力部13が生成してもよい。出力部13は、生成した表示データを、図示しない出力インタフェースを介して表示装置(例えばディスプレイ)に出力する。これにより、表示データが表示装置に表示される。
【0020】
本例示的実施形態におけるノードとは、1つの試行を表す表示要素であり、例えば、矩形、楕円形、菱形等の枠で表示されてもよい。リンクは、試行間の関連性を示す表示要素であり、例えば、ノードとノードとを接続する線分又は矢印で表示されてもよい。
【0021】
図2は、出力部13が生成するノードN及びリンクRの一例である。
図2に示す例では、試行1を表すノードN1と試行2を表すノードN2とが、矢印であるリンクR1によって接続されている。ノードN1とノードN2とがリンクR1によって接続されているということは、試行1と試行2とに関連性があるということである。同様に、ノードN2とノードN3とがリンクR2によって接続され、ノードN3とノードN4とがリンクR3によって接続され、ノードN4とノードN5とがリンクR4によって接続されている。後述するように、表示データは、ノードNの内部又は近傍に、当該ノードNに対応する試行情報の少なくとも一部を含んでもよい。また、表示データは、リンクRの内部又は近傍に、当該リンクRが示す関連性を有する試行間で変化した試行情報の少なくとも一部を含んでもよい。
【0022】
試行とは、一例として、ユーザ操作により設定又は更新した入力情報を用いて対象モデルを生成する処理と、生成された対象モデルから出力された推論結果を評価する処理とを含む一連の処理である。通常、このような試行は、入力情報の一部又は全部を変化させながら複数回繰り返される。例えば、対象モデルが機械学習モデルである場合は、学習フェーズとしてこのような試行が繰り返し実行される。なお、「対象モデルを生成する」とは、当該対象モデルを初めて生成すること、及び、生成した対象モデルの性能等を調整するために当該対象モデルを改変することを含むものとする。
【0023】
なお、
図1では、取得部11、推定部12及び出力部13は、物理的に一体に形成された1つの装置にまとめて配置されているように記載しているが、必ずしもその必要はない。即ち、これらの機能ブロックは物理的に異なる複数の装置に分散して配置され、これらの装置が有線又は無線で互いに情報通信可能に接続されていてもよい。また、これらの機能ブロックのうちの少なくとも一部がクラウド上に配置されていてもよい。
【0024】
また、情報処理装置1は、少なくとも1つのプロセッサを備えており、このプロセッサが、図示しないメモリに記録されたプログラムを読み込んで、取得部11、推定部12及び出力部13として機能する構成を有していてもよい。このような構成については後述する。
【0025】
(情報処理装置1の効果)
以上のように、本例示的実施形態に係る情報処理装置1においては、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得部と、複数の試行それぞれの試行情報の差異に基づいて、複数の試行の間の関連性を推定する推定部と、複数の試行それぞれを示す複数のノードと、関連性を示すリンクとを含む表示データを出力する出力部と、を備える構成が採用されている。このため、本例示的実施形態に係る情報処理装置1によれば、ユーザは、AIモデルの構築の過程を、試行を示すノードとノード間を接続するリンクとによって視認できる。その結果、当該過程をより理解し易く提示することにより、モデルの生成を支援することができる、という効果が得られる。
【0026】
(情報処理方法)
次に、情報処理装置1が実行する、AIモデルを構築する過程を可視化する情報処理方法S1の流れについて説明する。
図3は、情報処理方法S1の流れを示すフローチャートである。
図3に示すように、情報処理方法S1はステップS11、ステップS12及びステップS13を含む。なお、情報処理方法S1は、請求の範囲に記載した「モデル生成支援方法」の一形態である。
【0027】
ステップS11において、取得部11は、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する。ステップS12において、推定部12は、複数の試行それぞれの試行情報の差異に基づいて、複数の試行の間の関連性を推定する。ステップS13において、出力部13は、複数の試行それぞれを示す複数のノードと、関連性を示すリンクとを含む表示データを出力する。出力された表示データは、例えば
図2に示すように、表示装置に表示される。
【0028】
(情報処理方法S1の効果)
以上のように、本例示的実施形態に係る情報処理方法S1においては、情報処理装置1が、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得し、複数の試行それぞれの試行情報の差異に基づいて、複数の試行の間の関連性を推定し、複数の試行それぞれを示す複数のノードと、関連性を示すリンクとを含む表示データを出力する、という構成が採用されている。このため、本例示的実施形態に係る情報処理方法S1によれば、ユーザは、AIモデルの構築の過程を、試行を示すノードとノード間を接続するリンクとによって視認できる。その結果、当該過程をより理解し易く提示することにより、モデルの生成を支援することができる、という効果が得られる。
【0029】
〔例示的実施形態2〕
本発明の第2の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。本例示的実施形態に係る情報処理装置2は、例示的実施形態1で説明した情報処理装置1の機能に加えて、あるいはそれに代えて以下に説明する機能を実行することができる。
【0030】
図4は、例示的実施形態2に係る情報処理システム3の構成を示すブロック図である。
図4に示すように、情報処理システム3は、モデル構築装置50、データベース60、情報処理装置2及びディスプレイ70を備えている。モデル構築装置50は、ユーザが対象モデルLを生成するために用いる装置である。データベース60には、モデル構築装置50が出力した各試行における出力情報が記録される。情報処理装置2は、データベース60に記録された出力情報を用いて、複数の試行間の関連性を推定し、表示データを生成してディスプレイ70に出力する。ディスプレイ70は、表示データを表示する。
【0031】
情報処理装置2は、取得部21、推定部22及び出力部23を備える。取得部21、推定部22及び出力部23の機能は、基本的に例示的実施形態1で説明した取得部11、推定部12及び出力部13と同様であるが、これらと異なる機能については順次説明する。
【0032】
(試行Tの処理の流れ)
前述のように、ユーザは、モデル構築装置50を用いて対象モデルLを構築する。
図5は、ユーザがモデル構築装置50を用いて行う1回の試行Tの処理の流れを示す概念図である。
図5に示すように、ある試行において、ユーザは、入力装置(図示せず)を用いて入力情報100をモデル構築装置50に入力する。モデル構築装置50は、対象モデルLに入力情報100を入力して推論させ、推論結果を評価する。推論結果を評価するとは、例えばロス値を導出することである。モデル構築装置50は、入力情報100と評価結果を示す情報とを含む出力情報200を生成する。ユーザは、モデル構築装置50から出力された出力情報200に基づいて対象モデルLを改変する。具体的には、ユーザは、対象モデルLを構成するパラメータを更新する。ユーザは、出力情報200に基づいて、次の試行で入力する入力情報100を決定し、モデル構築装置50に入力する。また、ユーザは、出力情報200に基づいて、対象モデルLの種類を変更することを決定し、当該対象モデルLの種類を示す情報を入力情報100に含めてもよい。
【0033】
入力情報100は、一例として、入力データ101、パラメータデータ102、モデルID103及びタグデータ104を含む。入力データ101は、対象モデルLに入力するデータである。入力データ101は、例えば、当該入力データ101に付与されたラベルを含んでいる。パラメータデータ102は、対象モデルLを構成するパラメータ群に適用される重み係数、ハイパーパラメータ等を含む。モデルID103は、当該試行において生成すべき対象モデルLを識別するIDである。タグデータ104は、一連の試行を識別するIDである。
【0034】
一例として、
図6に示すように、入力データ101は、センサ1、センサ2、センサ3、センサ4の出力値の経時データを含む。入力データ101の1行はある時点での各センサの出力値であり、これが時間の経過に沿って配列されている。入力データ101は、X.cvsという名称のデータファイルに保存されている。このようなデータは、例えば、あるプラント設備のセンサデータであり、センサデータに基づき設備の異常を検出する対象モデルLを構築する際の入力データの例である。
【0035】
また、パラメータデータ102は、一例として、4つのパラメータの名称と値を含む。具体的には、パラメータAとその値である10、パラメータBとその値である0.005、パラメータCとその値である1000、パラメータInput File(つまり入力データ101を示すパラメータ)とそのデータファイル名であるX.cvsである。ファイルX.cvsに含まれるデータは、例えば、生データ(各センサからの出力値)をフーリエ変換処理したデータである。換言すると、この例では、入力データ101は多数のデータを含むため、そのデータファイル名がパラメータとしてパラメータデータ102に含まれる。
【0036】
パラメータA~Cは、例えば、対象モデルLを構成するパラメータ群に適用される重み係数(重み)を含んでいてもよいし、ハイパーパラメータを含んでもよい。例えば、対象モデルLがニューラルネットワークモデルである場合、ハイパーパラメータの一例としては、ニューラルネットワークの総数、ユニット数、活性化関数、ドロップアウト率、最適化関数等が挙げられるが、これらに限られない。
【0037】
モデル構築装置50は、入力データ101の少なくとも一部及びパラメータデータ102を対象モデルLに入力して当該入力データ101に付与されたラベルが出力されるよう、対象モデルLを生成する。例えば、対象モデルLが機械学習モデルである場合、対象モデルLを生成する処理は、対象モデルLを構成するパラメータ群を更新する処理を繰り返す処理である。この場合、モデル構築装置50は、当該パラメータ群の更新処理を、当該パラメータ群が収束するまで又は設定された回数に達するまで繰り返すことにより、対象モデルLを生成する。
【0038】
また、モデル構築装置50は、対象モデルLに、入力データ101の少なくとも一部を入力することにより出力される推論結果を評価する。例えば、モデル構築装置50は、評価結果として、後述するロス値201、異常度202等を算出する。
【0039】
図5に戻り、モデル構築装置50から出力される出力情報200は、一例として、ロス値201、異常度202、試行時刻203、入力データ101、パラメータデータ102、モデルID103、及びタグデータ104を含む。
【0040】
ロス値201又は異常度202は、対象モデルLの性能を示す指標の一例であり、対象モデルLの種類により、例えばいずれか1つが出力される。ロス値201は、入力情報に対して対象モデルLが出力すべき正解値がある場合に、対象モデルLの出力値と正解値との誤差を示す誤差関数値である。異常度202は、対象モデルLが入力データ101の中の異常なデータを抽出するAIモデルである場合に、異常なデータの特定とそれがどの程度正常な値から異なっているかを示す数値である。あるいは、対象モデルLの種類により、ロス値201又は異常度202とは異なる指標が出力されてもよい。試行時刻は、試行Tを開始した時刻であり、例えば対象モデルLに入力データを入力した時刻である。
【0041】
入力データ101、パラメータデータ102、モデルID103、及びタグデータ104は、入力情報100に含まれる情報と同じである。
【0042】
出力情報200は、データベース60に送信され、試行情報として記録される。一例として、データベース60には、対象モデルLの構築の過程における7回の試行T1~T7の出力情報200が送信され、試行情報として記録されている。なお、データベース60には、他のAIモデルを構築する過程における試行情報が記録されていてもよい。記録された試行情報のうち、対象モデルLの構築の過程における一連の試行を示す試行情報は、一例として、モデルID103及びタグデータ104の一方又は両方により区別することができる。
【0043】
本例示的実施形態に係る情報処理装置2は、モデル構築装置50を用いて行った試行T1~T7における試行情報を取得し、これらの試行の間の関連性を推定する。具体的には、まず、取得部21は、データベース60に記録されたすべての試行情報のうち、モデルID及びタグデータの両方が類似する試行情報を抽出(取得)する。
【0044】
図7は、データベース60に記録されたすべての試行情報を記録した試行情報表250の一部である。試行情報表250は、一例として、試行ID、モデルID、タグデータ、試行時刻、ロス値、パラメータA、パラメータB、パラメータC、及び入力データファイル名の各欄に記録されたデータで構成される。
【0045】
図7において、試行IDの欄に記録されたT1~T7、S1、R3は、それぞれの試行を識別するIDである。モデルIDの欄に記録された「L001」は、対象モデルLに付されたIDである。モデルIDは、一連の試行で同じ符号を用いてもよく、試行ごとに一部を変更した符号を用いてもよい。本例示的実施形態では、一連の試行で同じ符号を用いるものとし、以降、モデルID「L001」が付されたAIモデルを、モデルL001とも記載する。また、タグデータの欄に記録された「TAG001」は、対象モデルL001を構築する過程における一連の試行T1~T7に共通して付されたデータである。また、タグデータの欄に記録された「TAG002」は、対象モデルL001を構築する過程における試行S1を含む他の一連の試行に共通して付されたデータである。換言すると、
図7の例では、同じ対象モデルL001を構築するために、TAG001が付された一連の試行T1~T7と、TAG001とは異なるアプローチがなされた一連の試行(試行S1を含む)とが行われている。また、モデルIDの欄にL002と記録され、タグデータの欄にTAG003と記録された試行情報は、対象モデルL001とは異なるAIモデルL002を構築するために行われた試行R3を示すものである。
【0046】
図8は、データベース60に記録されたすべての試行情報から、取得部21が抽出した試行情報を記録した試行情報表300の一例である。前述のように、取得部21は、データベース60に記録されたすべての試行情報のうち、モデルID及びタグデータの両方が類似する試行情報を試行情報表300のように抽出(取得)する。ここで、「モデルIDが類似する」とは「モデルIDが一致する(同じである)」こととするが、これに限らず、モデルIDが所定の類似条件を示すことであってもよい。また、「タグデータが類似する」とは、「タグデータが一致する」こととするが、これに限らず、タグデータが所定の類似条件を示すことであってもよい。類似条件とは、例えば、モデルID又はタグデータを示すテキストの一部が一致することであってもよい。また、取得部21は、対象モデルLの構築の過程における一連の試行として、モデルID及びタグデータの少なくとも一方が類似する複数の試行を抽出してもよい。
【0047】
本例示的実施形態では、
図8に示すように、取得部21は、モデルIDが同じかつタグデータが同じである試行T1~T7を抽出している。なお、取得部21は、モデルID及びタグデータの少なくとも一方が同じ試行情報を抽出してもよく、モデルID及びタグデータの少なくとも一方が類似の試行情報を抽出してもよい。
【0048】
図9は、推定部22が試行間の関連性を推定した推定データ表400の一例である。具体的には、推定部22は、複数の試行の時系列において連続する2つの試行間の関連性を推定する。例えば、試行T1と試行T2とは、連続する試行である。連続する試行とは、複数の試行を行った順(試行開始時刻の順)に並べた時系列において、隣接する試行である。つまり、推定部22は、複数の試行から連続する試行T1と試行T2とを抽出し、これらの間には、時系列において前段(スタート)の試行T1で生成された対象モデルLを改変するために、後段(エンド)の試行T2が行われた、という関連性があることを推定する。
【0049】
同様に、推定部22は、連続する試行T2と試行T3を抽出し、前段の試行T2で生成された対象モデルLを改変するために、後段の試行T3が行われた、という関連性があることを推定する。このように、推定部22は、時系列において連続する2つの試行の組み合わせ全てについて抽出してその関連性を推定する。
【0050】
(試行間の関連性の推定の具体例)
推定部22が実行する、試行間の関連性の推定について、具体例を説明する。一例として、推定部22は、第1のパラメータが共通し第2のパラメータが変化する複数の試行を、関連する第1の試行群として抽出する。第1のパラメータと第2のパラメータは試行情報の一例である。第2のパラメータは、第1のパラメータとは種類が異なるパラメータである。本例示的実施形態では、前段の試行に対して後段の試行において変更するパラメータの個数が1つであり、それ以外のパラメータは変更しないことを想定している。ただし、変更するパラメータの個数は、2以上であってもよい。
【0051】
具体的には、
図8に示す試行情報表300を参照し、
図8の例では、推定部22は、試行T1~T7のうち、パラメータBが共通するとともにパラメータAが前段の試行に対して変化している試行T2、T3、T4を抽出する。パラメータBは、第1のパラメータの一例であり、パラメータAは第2のパラメータの一例である。そこで、推定部22は、試行T1から試行T4までを第1の試行群として抽出する。そして、抽出した試行T1から試行T4までのうち、連続する試行T1及びT2、T2及びT3、T3及びT4の間に、それぞれ上述した関連性があると推定する。
【0052】
また、試行情報は、第1のパラメータ及び第2のパラメータとは異なる第3のパラメータをさらに含み、推定部22は、第2のパラメータ及び第3のパラメータが共通し第1のパラメータが変化する複数の試行を、関連する第2の試行群として抽出する。
【0053】
具体的には、
図8の例で、入力データファイル名を第3のパラメータとすると、試行T5から試行T7までは、第2のパラメータ(A)と第3のパラメータ(入力データファイル名)は同じ値である一方、第1のパラメータ(B)はすべて異なっている。そこで、推定部22は、試行T5から試行T7までを第2の試行群の試行Tとして抽出する。そして、抽出した試行T5から試行T7のうち、連続する試行T2及びT5、T5及びT6、T6及びT7の間に、それぞれ上述した関連性があると推定する。なお、入力データファイル名が異なるのは、データの前処理方法が異なるためである。本例示的実施形態では、ファイルX.cvsに含まれるデータは、生データ(各センサからの出力値)をフーリエ変換したデータである。一方、ファイルY.cvsに含まれるデータは、生データを極座標変換したデータである。
【0054】
さらに、推定部22は、第2の試行群のうちの時間的に先頭の試行に対して第1のパラメータ及び第2のパラメータが共通する、第1の試行群における試行を、第1の試行群における分岐点として特定する。
【0055】
具体的には、推定部22は、第2の試行群の時間的に先頭の試行(試行T5)における第1のパラメータ(B)及び第2のパラメータ(A)が共通する第1の試行群における試行T2を、第1の試行群における分岐点として特定する。さらに、推定部22は、第2の試行群の先頭である試行T5と試行T2とを、分岐したリンクR4で関連付ける。以上の処理を行うことにより、推定部22は、
図9に示す推定データ表400を生成する。
【0056】
図10は、出力部23が生成して出力する表示データ500の一例である。出力部23は、推定データ表400を参照して、
図10に示すように、ノードN1~N7とリンクR1~R6を含む表示データを生成する。ノードN1~N7は、試行T1~T7を示す表示要素である。リンクR1~R6は、試行T1~T7のうち該当する2つの試行T間の関連性を示す表示要素である。このように図示することで、第2の試行群(ノードN5~ノードN7)が示す試行T5~T7は、分岐点であるノードN2が示す試行T2から別のアプローチでパラメータを変化させて行った一連の試行であることが容易に視認できる。
【0057】
ノードN1~N7は、それぞれ矩形の枠で表されている。また、ノードを特定しない場合はノードNと記載し、リンクを特定しない場合はリンクRと記載する。リンクRは、向きを有し、例えば、矢印で表されている。リンクRの始点には、対応する関連性を有する2つの試行Tのうち、時系列において前段の試行Tを示すノードNが接続される。リンクRの終点には、対応する関連性を有する2つの試行Tのうち、時系列において後段の試行Tを示すノードNが接続される。これにより、ノードN1~N7及びリンクR1~R6は、有向グラフを表す。以下、前段の試行を示すノードを前段ノード、後段の試行を示すノードを後段ノードとも称する。
【0058】
表示データに含まれる複数のノードは、試行を行った順に配列される。つまり、出力部23は、複数のノードNを、各試行を行った順に配列した表示データを生成する。具体的には、
図10に示すように、出力部23は、複数のノードNを、試行を行った順に図の左から右に向かって配列した表示データ500を生成して出力する。換言すると、表示データ500では、時間的に早い試行Tを示すノードNがリンクRの左側に、時間的に遅い試行Tを示すノードNがリンクRの右側に配列される。
【0059】
また、出力部23は、
図10に示すように、第1の試行群を示す複数のノード(N1~N4)と当該複数のノード間を接続するリンク(R1~R3)とを含む表示データを第1の列として出力する。この際、出力部23は、試行群に含まれるノードを試行を行った順に配列した表示データを出力する。さらに、出力部23は、
図10に示すように、第2の試行群を示すノード(N5~N7)及びリンク(R4~R6)が、第1の試行群を示す複数のノードのうちの分岐点の試行を示すノード(R2)から分岐して接続された表示データを第2の列として出力する。
【0060】
図10に示すように、表示データ500は、途中でリンクR2とR4とに分岐している。分岐先のそれぞれのノードNの列は、異なるパラメータが対象モデルLの性能に与える影響を探索した過程を示している。つまり、ユーザは、対象モデルLの構築過程を
図10のようなグラフ構造で視認することにより、対象モデルLの構築の過程を容易に理解することができる。
【0061】
(情報処理装置2の効果)
以上のように、本例示的実施形態に係る情報処理装置2においては、表示データに含まれる複数のノードは、試行を行った順に配列されるという構成が採用されている。このため、本例示的実施形態に係る情報処理装置2によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、対象モデルLの構築の経時的な過程が容易に理解できるという効果が得られる。
【0062】
さらに、情報処理装置2においては、推定部22は、第1のパラメータが共通し第2のパラメータが変化する複数の試行を、関連する第1の試行群として抽出し、出力部23は、第1の試行群を示す複数のノードと当該複数のノード間を接続するリンクとを含む表示データを出力するという構成が採用されている。さらに、情報処理装置2においては、試行情報として第1のパラメータ及び第2のパラメータとは異なる第3のパラメータをさらに含み、推定部22は、第2のパラメータ及び第3のパラメータが共通し第1のパラメータが変化する複数の試行を、関連する第2の試行群として抽出し、第2の試行群のうちの時間的に先頭の試行に対して第1のパラメータ及び第2のパラメータが共通する、第1の試行群における試行を、第1の試行群における分岐点として特定し、出力部は、第2の試行群を示すノード及びリンクが、第1の試行群を示す複数のノードのうちの分岐点の試行を示すノードから分岐されて接続された表示データを出力するという構成が採用されている。このため、情報処理装置2によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、対象モデルLを改変するために、複数通りに入力情報を異ならせてそれぞれ試行を行ったという経過を容易に理解することができるという効果が得られる。
【0063】
〔例示的実施形態3〕
本発明の第3の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。
【0064】
(情報処理装置の構成)
例示的実施形態3に係る情報処理装置4は、例示的実施形態2に係る情報処理装置2を、以下のように変形した態様である。以下では、情報処理装置4の各機能ブロックについて、例示的実施形態2から変形した点について、順次説明する。
【0065】
情報処理装置4の取得部21は、データベース60から一連の試行の試行情報を取得する。本例示的実施形態では、一連の試行情報は、例示的実施形態2で説明した試行情報表300(
図8参照)と同じである。従って、推定部22は、試行情報表300から、推定データ表400(
図9参照)を生成する。そして出力部23は、表示データ500(
図10参照)を生成してディスプレイ70に出力する。
【0066】
(異なる態様の表示)
本例示的実施形態では、推定部22は、複数の試行のうち、関連性を有する前段の試行に比べてAIモデルの性能が向上した試行、又は性能が劣化した試行を特定する。さらに、出力部23は、特定した試行を示すノードと、当該ノードと前段の試行を示すノードとを接続するリンクとの一方又は両方を、他のノード又は他のリンクと異なる態様で出力する。異なる態様ということは、例えば、他よりも強調するということである。あるいは、異なる態様ということは、逆に他よりも目立たなくすることでもよい。
【0067】
具体的には、推定部22は、試行情報表300のロス値を参照して、推定データ表400のリンクRで接続された2つのノードの組み合わせのうち、前段のノードに対してロス値が減少又は増加した後段のノードを特定する。出力部23は、その後段ノードと、前段ノードと後段ノードを接続するリンクと、の一方又は両方の態様を、他と異ならせた表示データを出力する。
【0068】
ノード又はリンクを他と異ならせた態様とする方法は限定されないが、一例として、出力部23は、特定した試行を示すノード(後段ノード)の色調、当該ノードの大きさ、形状、当該リンクの色調、及び当該リンクの太さのうちの少なくともいずれかを、他のノード又は他のリンクと異ならせることができる。
【0069】
例えば、ロス値は小さいほうが性能が良いことを示すため、一例として、出力部23は、ロス値が小さくなった後段ノードと、後段ノードと前段ノードを接続するリンクに対して強調表示を行う。強調表示の方法は限定されないが、例えば、ノードの色調を薄くし、リンクの太さを太くすることにより、強調表示をすることができる。逆に、出力部23は、あるノードを小さくすることにより、他のノードよりも目立たなくすることができる。本例示的実施形態では、色調とは色の種類又は色の濃度を指す。
【0070】
図11は、試行情報表300に各試行を示すノードの色濃度を加えた色濃度表600の一例である。色濃度表600の右端の欄は、ノードの色の濃度(%)を示す。試行IDがT1で示されるノードN1は、試行の最初でロス値が最も大きいため、濃度100%とする。出力部23は、これを基準として、各ノードNの濃度を計算する。
【0071】
色濃度表600の各ノードNの濃度Cは、以下の式(1)で計算した値である。
C(%)=100×(LossT-Lossmin)/(Lossmax-Lossmin)…(1)
ここで、LossTは各ノードNのロス値、Lossminは最小ロス値、Lossmaxは最大ロス値である。上記式(1)は、一連の試行のうち、ロス値が最大のノードを100%の濃度とし、ロス値が最小のノードを0%の濃度とするための計算式である。つまり、性能が良いノードほど色が薄くなるように表示する。なお、ノードの色の濃度を求める方法は上記の方法に限らず任意である。
【0072】
図12は、ノードNを接続するリンクRの太さを示す太さ表700の一例である。太さ表700は、推定データ表400にリンクの太さを加えた表である。太さ表700のリンクの太さは、前段ノードと後段ノードとのロス値の差に基づいて求めた値である。具体的には、前段ノードのロス値から後段ノードのロス値を差し引き、その差が0.5未満ならリンクの太さを1.0とし、差が0.5以上0.7未満なら太さを2.0とし、差が0.7以上であれば太さを3.0とする。
【0073】
例えば、ノードN2からノードN5のリンクR4は、ロス値の減少量が1.0と大きく減少しているため、太さが3.0である。一方、ノードN2とノードN3を接続するリンクR2、ノードN3とノードN4を接続するリンクR3等はロス値の減少量が小さいため、太さが1.0である。太さの単位は任意であるが、ロス値の減少が大きいほど太さを太くする。なお、リンクの太さを求める方法は上記の方法に限らず任意である。
【0074】
以上の方法で求めたノードの色濃度とリンクの太さが反映された、強調された表示データ801を
図13に示す。
図13に示すように、最初のノードN1は黒色で塗りつぶされている。しかしロス値が小さくなる(性能が良くなる)ほど、ノードNの色が薄く表示されている。また、リンクRの太さは、ロス値の減少量が大きいリンクR4は太い矢印で表示されている。この表示データは、ディスプレイ70に表示される。つまり、ディスプレイ70上で、リンクの太さが太いルートに従って、色が薄くなるようにノードを辿ることにより、対象モデルLの性能を高める構築過程を視覚的に理解し易くすることができる。
【0075】
なお、
図13に示すように、出力部23は、分岐されたノードを含む複数のノードが、試行を行った時刻に対応させて所定の方向に配置された表示データを出力する。言い換えれば、表示データでは、第1の試行群及び第2の試行群に含まれる複数の試行に対応する複数のノードが、試行を行った順に所定の方向に配置される。一例として、表示データにおいて時間的な順序を示す方向をx軸とする座標系を定め、第1の列に含まれる第1の試行を示す第1のノードのx座標と、第2の列に含まれる第2の試行を示す第2のノードのx座標との関係が、第1の試行と第2の試行との時間的な順序関係を表すように、第1のノード及び第2のノードを配置している。つまり、
図13では、左側ほど時間的に早く試行されたノードNが配置されており、図の右側ほど時間的に後で試行されたノードNが配置されている。より具体的には、時間軸802に示すように、各試行Tの試行開始時刻は、ノードNの矩形の左辺の位置で示されている。例えば、ノードN3及びノードN5の配置関係により、試行T2から分岐した一方の列に含まれる試行T3は、他方の列に含まれる試行T5より時間的に先行して行われていることが容易に視認できる。このように、複数のノードNを時間的な前後関係を保って配列することにより、対象モデルLが構築された過程の時間的な前後関係を視覚的に理解し易くすることができる。なお、時間軸802は表示データ801に含める必要はない。
【0076】
また、
図13に示すように、表示データは、各試行において得られるAIモデルの性能を示す情報を含む。出力部23は、各試行において得られるAIモデルの性能を示す情報を含む表示データを出力する。つまり、表示データ801の各ノードNの矩形の中に、ロス値を表示している。このように、対象モデルLの性能を示す情報を表示することにより、性能の向上を具体的な数値として確認し易くすることができる。
【0077】
さらに、
図13に示すように、表示データは、各試行で用いたパラメータを含む。出力部23は、前段の試行で用いたパラメータのうち、少なくとも後段の試行で変更されたパラメータを含む表示データを出力する。例えば、ノードN1とノードN2を接続するリンクR1に対応する下方位置に、パラメータAが10から50に変更されたことを示す情報「A:10→50」が表示されている。また、リンクR4に対応する下方位置に、入力ファイルがX.csvからY.csvに変更されたことを示す情報「入力ファイル変更 入力ファイル:X.csv→Y.csv」が表示されている。このように、変化させたパラメータを表示することにより、性能の変化がどのパラメータによるものかを視覚的に理解し易くすることができる。
【0078】
また、
図13に示すように、最後のノードN7で用いたモデルID、入力ファイル名、パラメータの値は、ノードN7の内側に表示できないため、ノードN7の外側にまとめて表示されている。これは、最終的に構築された対象モデルLの仕様を表すデータである。最終的に構築された対象モデルLとは、本例示的実施形態では、最も性能値が良い対象モデルLを指す。従って、必ずしも時間的に最後に試行したAIモデルとは限らない。
【0079】
また、最初の試行T1から最も結果が良くなった試行T7までの最短ルートのみノードとリンクの色を変更してもよい。例えば、
図9に示すリンク情報が得られたとして、最初に試行した試行T1から最も良かった試行T7までに通る全てのノード(N1,N2,N5~N7)とリンク(R1,R4~6)の色を変更する。このような強調表示により、類似の実験をする場合にどのパラメータをどの程度変更すればよいか追跡しやすい効果がある。
【0080】
また、表示データは、性能の向上又は劣化の程度に応じた態様のノードを含んでもよい。例えば、性能向上の程度が大きいほど、ノードの色は濃く、大きさを大きくしてもよい。逆に、性能劣化の程度が大きいほど、ノードの色は薄く、大きさを小さくしてもよい。このような強調表示により、性能向上に寄与したノードを見分けることが容易となる。
【0081】
(他の強調表示例)
次に、出力部23が生成する表示データの強調表示の他の例について、図面を参照して説明する。
図14は、出力部23が生成した他の態様の表示データ803である。表示データ803では、出力部23は、複数のノードを仮想的な三次元空間に配置して表示データに含め、特定した試行を示すノードを、前段の試行を示すノードに対して三次元空間の視点からの距離を異ならせて配置している。具体的には、
図14では、ノードN1、N2、N3、及びN4を、他のノードNよりも視点から遠い距離にあるように表示している。表示データ803は、仮想的な三次元空間に各ノードNを配置した時に見える様子を模擬した表示データである。
【0082】
具体的には、出力部23は、対象モデルLの性能の向上の程度が相対的に大きい試行を示すノードNは、大きさを大きくかつ色を濃く表示し、対象モデルLの性能の向上の程度が相対的に小さい試行を示すノードNは、大きさを相対的に小さくかつ色を薄く表示する。三次元空間では、視点(見る人の眼)に近い位置にあるものは大きく、濃く見え、視点から遠い位置にあるものは小さく、薄く見える。各ノードNの大きさと濃さは、そのノードNのロス値の大きさから適宜導出することができる。このように、仮想的な三次元空間に各ノードNを配置した時に見える様子を模擬することにより、対象モデルLの性能の向上の過程を視覚的に理解し易くすることができる。
【0083】
図15は、出力部23が生成した他の態様の表示データ804である。表示データ804は、特定した試行で得られたAIモデルの性能と、前段の試行で得られたAIモデルの性能との差が所定の閾値以内である場合、特定した試行を示すノードと、前段の試行を示すノードとを、これらのノードの少なくとも一部を重ねた態様で含む。出力部23は、このような表示データ804を出力する。
【0084】
例えば、ユーザは、連続するノード間でロス値の差の閾値を0.2と設定する。
図15に示すように、ノードN3とノードN4とのロス値の差は0.1であるので、ノードN3とノードN4とを一部重ねて表示している。これにより、重ねて表示されたノードは、性能があまり向上しないノードであると容易に理解することができる。なお、ノードN2とノードN3とのロス値の差は0であり、閾値よりも小さいが、ノードN2は分岐するノードであるため、ノードN2とノードN3とを重ねる表示はしていない。
【0085】
図16は、出力部23が生成した他の態様の表示データ805である。表示データ805では、連続するノード間でロス値の差が所定の閾値より小さい場合は、その連続するノードの表示を目立たなくしている。具体的には、所定の閾値を0.2として、
図16に示すように、ノードN3とノードN4とのロス値の差は0.1であるので、ノードN3とノードN4の大きさを、他のノードよりも小さくするとともに、ロス値とパラメータの変化の情報を省略している。これにより、ノードN3とノードN4は他のノードに比べて目立たない。従って、これらのノードで示される試行は対象モデルLの性能の向上に寄与しなかったということ視覚的に容易に理解することができる。なお、ノードN2は分岐するノードであるため、ノードN2の表示を簡略化することはしていない。
【0086】
図17は、出力部23が生成した他の態様の表示データ806である。表示データ806では、入力データはどのような前処理によって生成されたかの前処理情報を表示している。例えば、ユーザは入力情報100に、生データの前処理方法を加えておく。これにより、出力情報200にも前処理方法の情報が加えられる。出力部23は、この前処理情報を表示データとしてリンクRに関連させて表示する。
【0087】
より具体的には、表示データ806では、生データのノードRDが表示され、リンクR0でノードN1に接続されている。そして、リンクR0には、前処理情報の表示枠PT1が表示され、表示枠PT1には前処理方法がFFT(高速フーリエ変換)であることを示す「前処理:FFT」が表示されている。さらに、ノードN2からノードN5へのリンクR4には、表示枠PT2が追加され、表示枠PT2には、使用した入力データが生データを極座標変換処理をして得られたデータに変更されたことを示す「前処理:FFT→極座標」が表示されている。
【0088】
このように、生データを前処理した方法によってロス値が変わる場合、前処理方法を表示データに加えることにより、ロス値の変化が前処理方法の変更の効果であることを視覚的に理解し易くすることができる。
【0089】
(情報処理装置4の効果)
以上のように、本例示的実施形態に係る情報処理装置4においては、推定部22は、複数の試行のうち、関連性を有する前段の試行に比べてAIモデルの性能が向上した試行、又は性能が劣化した試行を特定する。さらに、出力部23は、特定した試行を示すノードと、当該ノードと前段の試行を示すノードとを接続するリンクとの一方又は両方を、他のノード又は他のリンクと異なる態様で出力する、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置4によれば、例示的実施形態1、2に係る情報処理装置1、2の奏する効果に加えて、異なる態様で表示されたノードとリンクを辿ることにより、対象モデルの性能を高める構築の過程を視覚的に理解し易くすることができる、という効果が得られる。
【0090】
〔変形例〕
なお、上述した例示的実施形態2、3において、入力情報100は、入力データ101、パラメータデータ102、モデルID103、及びタグデータ104の一部又は全部に替えて、又は加えて、他のデータを含んでいてもよい。また、出力情報200は、ロス値201、異常度202、試行時刻203、入力データ101、パラメータデータ102、モデルID103、及びタグデータ104の一部又は全部に替えて、又は加えて、他のデータを含んでいてもよい。また、各試行において対象モデルLの評価結果を示す情報は、ロス値201及び異常度202の一方又は両方に替えて、又は加えて、他の指標であってもよい。
【0091】
また、上述した例示的実施形態2、3において、第1の列、及び第2の列を抽出して分岐点を特定する手法は、第1のパラメータ、第2のパラメータ、及び、第3のパラメータを参照する手法に限らず、その他の手法であってもよい。
【0092】
また、上述した例示的実施形態2、3において、性能が向上又は劣化した試行を示すノード及び関連するリンクの態様は、上述した態様に限られず、その他の態様であってもよい。
【0093】
〔ソフトウェアによる実現例〕
情報処理装置1,2,4の一部又は全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
【0094】
後者の場合、情報処理装置1,2,4は、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例(以下、コンピュータCと記載する)を
図18に示す。コンピュータCは、少なくとも1つのプロセッサC1と、少なくとも1つのメモリC2と、を備えている。メモリC2には、コンピュータCを情報処理装置1,2,4として動作させるためのプログラムPが記録されている。コンピュータCにおいて、プロセッサC1は、プログラムPをメモリC2から読み取って実行することにより、情報処理装置1,2,4の各機能が実現される。
【0095】
プロセッサC1としては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリC2としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又は、これらの組み合わせなどを用いることができる。
【0096】
なお、コンピュータCは、プログラムPを実行時に展開したり、各種データを一時的に記憶したりするためのRAM(Random Access Memory)を更に備えていてもよい。また、コンピュータCは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータCは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。
【0097】
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
【0098】
〔付記事項1〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
【0099】
〔付記事項2〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
【0100】
(付記1)
AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得手段と、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定手段と、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力手段と、を備えるモデル生成支援装置。
【0101】
上記の構成によれば、モデルの構築の過程をより理解し易く提示することにより、モデルの生成を支援することができる。
【0102】
(付記2)
前記表示データに含まれる複数の前記ノードは、前記試行を行った順に配列される、ことを特徴とする付記1に記載のモデル生成支援装置。
【0103】
上記の構成によれば、対象モデルの構築の経時的過程を容易に理解することができる。
【0104】
(付記3)
前記試行情報は、第1のパラメータ及び前記第1のパラメータとは異なる第2のパラメータを含み、前記推定手段は、前記第1のパラメータが共通し前記第2のパラメータが変化する複数の試行を、関連する第1の試行群として抽出し、前記出力手段は、前記第1の試行群を示す複数のノードと当該複数のノード間を接続するリンクとを含む前記表示データを出力する、、ことを特徴とする付記1又は2に記載のモデル生成支援装置。
【0105】
上記の構成によれば、対象モデルを改変するために、複数通りに入力情報を異ならせてそれぞれ試行を行ったという経過を容易に理解することができる。
【0106】
(付記4)
前記試行情報は、前記第1のパラメータ及び前記第2のパラメータとは異なる第3のパラメータをさらに含み、前記推定手段は、前記第2のパラメータ及び前記第3のパラメータが共通し前記第1のパラメータが変化する複数の試行を、関連する第2の試行群として抽出し、前記第2の試行群のうちの時間的に先頭の試行に対して前記第1のパラメータ及び前記第2のパラメータが共通する、前記第1の試行群における試行を、前記第1の試行群における分岐点として特定し、前記出力手段は、前記第2の試行群を示す前記ノード及び前記リンクが、前記第1の試行群を示す複数のノードのうちの前記分岐点の試行を示すノードから分岐して接続された前記表示データを出力する、ことを特徴とする付記3に記載のモデル生成支援装置。
【0107】
上記の構成によれば、対象モデルを改変するために、複数通りに入力情報を異ならせてそれぞれ試行を行ったという経過を容易に理解することができる。
【0108】
(付記5)
前記表示データでは、前記第1の試行群及び前記第2の試行群に含まれる複数の試行に対応する複数のノードが、試行を行った順に所定の方向に配置される、ことを特徴とする付記4に記載のモデル生成支援装置。
【0109】
上記の構成によれば、複数のノードを時間的な前後関係を保って配列することにより、対象モデルが構築された過程の時間的な前後関係を視覚的に理解し易くすることができる。
【0110】
(付記6)
前記表示データは、各前記試行において得られる前記AIモデルの性能を示す情報を含む、ことを特徴とする付記1から5のいずれか1つに記載のモデル生成支援装置。
【0111】
上記の構成によれば、対象モデルの性能を示す情報を表示することにより、性能の向上を具体的な数値として確認し易くすることができる。
【0112】
(付記7)
前記表示データは、各試行で用いたパラメータを含む、ことを特徴とする付記1から6のいずれか1つに記載のモデル生成支援装置。
【0113】
上記の構成によれば、変化させたパラメータを表示することにより、性能の変化がどのパラメータによるものかを視覚的に理解し易くすることができる。
【0114】
(付記8)
前記推定手段は、前記複数の試行のうち、前記関連性を有する前段の試行に比べて前記AIモデルの性能が向上した試行、又は性能が劣化した試行を特定し、前記出力手段は、前記特定した試行を示すノードと、当該ノードと前記前段の試行を示すノードとを接続するリンクとの一方又は両方を、他のノード又は他のリンクと異なる態様で出力する、ことを特徴とする付記1から7のいずれか1つに記載のモデル生成支援装置。
【0115】
上記の構成によれば、異なる態様で表示されたノードとリンクを辿ることにより、対象モデルの性能を高める構築過程を視覚的に理解し易くすることができる。
【0116】
(付記9)
前記出力手段は、前記特定した試行を示すノードの色調、当該ノードの大きさ、形状、当該リンクの色調、及び当該リンクの太さのうちの少なくともいずれかを、他のノード又は他のリンクと異なる態様で出力する、ことを特徴とする付記8に記載のモデル生成支援装置。
【0117】
上記の構成によれば、ノード又はリンクの少なくとも一方を、他のそれと異ならせることで、他よりも強調する、あるいは目立たなくすることができる。
【0118】
(付記10)
前記表示データは、性能の向上又は劣化の程度に応じた態様のノードを含む、、ことを特徴とする付記8又は9に記載のモデル生成支援装置。
【0119】
上記の構成によれば、対象モデルの性能の向上の過程を視覚的に理解し易くすることができる。
【0120】
(付記11)
前記表示データは、前記特定した試行で得られた前記AIモデルの性能と、前記前段の試行で得られた前記AIモデルの性能との差が所定の閾値以内である場合、前記特定した試行を示すノードと、前記前段の試行を示すノードとを、これらのノードの少なくとも一部を重ねた態様で含む、ことを特徴とする付記8から10のいずれか1項に記載のモデル生成支援装置。
【0121】
上記の構成によれば、重ねて表示されたノードは、性能があまり向上しないノードであると容易に理解することができる。
【0122】
(付記12)
少なくとも1つのプロセッサが、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得し、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定し、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する、ことを含むモデル生成支援方法。
【0123】
上記の構成によれば、モデルの構築の過程をより理解し易く提示することにより、モデルの生成を支援することができる。
【0124】
(付記13)
コンピュータに、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得処理と、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定処理と、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力処理と、を実行させるプログラム。
【0125】
〔付記事項3〕
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。
【0126】
少なくとも1つのプロセッサを備え、前記プロセッサは、AIモデルの構築過程の試行で用いられるパラメータを含む試行情報を取得する取得処理と、複数の前記試行それぞれの前記試行情報の差異に基づいて、前記複数の試行の間の関連性を推定する推定処理と、前記複数の試行それぞれを示す複数のノードと、前記関連性を示すリンクとを含む表示データを出力する出力処理と、を実行するモデル生成支援装置。
【0127】
なお、このモデル生成支援装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記推定処理と、前記出力処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。
【符号の説明】
【0128】
1,2,4・・・情報処理装置(モデル生成支援装置)
3・・・情報処理システム(モデル生成支援システム)
11,21・・・取得部
12,22・・・推定部
13,23・・・出力部
50・・・モデル構築装置
60・・・データベース
70・・・ディスプレイ
100・・・入力情報
101・・・入力データ
102・・・パラメータデータ
200・・・出力情報
250,300・・・試行情報表
400・・・推定データ表
500・・・表示データ
600・・・色濃度表
700・・・太さ表
801,802,803,804,805,806・・・表示データ