(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024123391
(43)【公開日】2024-09-12
(54)【発明の名称】表示プログラム,情報処理装置および表示制御方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20240905BHJP
G06N 3/045 20230101ALI20240905BHJP
【FI】
G06N20/00 130
G06N3/045
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023030752
(22)【出願日】2023-03-01
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110003649
【氏名又は名称】弁理士法人真田特許事務所
(74)【代理人】
【識別番号】100189201
【弁理士】
【氏名又は名称】横田 功
(72)【発明者】
【氏名】岩倉 聡子
(72)【発明者】
【氏名】成田 顕一郎
(72)【発明者】
【氏名】小林 健一
(72)【発明者】
【氏名】中澤 克仁
(57)【要約】
【課題】第1の機械学習モデルと第2の機械学習モデルとの精度差の検証を容易にできるようにする。
【解決手段】第1の機械学習モデル104と第2の機械学習モデル105とに複数のデータを入力し、入力に応じて、第1の機械学習モデル104が出力した第1の複数の出力と第2の機械学習モデル105が出力した第2の複数の出力とを取得し、複数のデータのうちの第1のデータに対する第1の機械学習モデル104の第1の出力と第2の機械学習モデル105の第2の出力との内容が異なり、第1の出力の確信度が第1の閾値未満であって、第2の出力の確信度が第2の閾値以上である場合、第1の複数の出力と第2の複数の出力とのそれぞれの比較結果のうち、第1の出力と第2の出力との比較結果以外の他の比較結果を優先して表示する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1の機械学習モデルと、前記第1の機械学習モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされた前記データを用いた機械学習により得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの第1のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理をコンピュータに実行させることを特徴とする表示プログラム。
【請求項2】
前記表示する処理は、前記第1の機械学習モデルの精度が基準値以下となったことが検知された場合に、実行される、
ことを特徴とする請求項1に記載の表示プログラム。
【請求項3】
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第2のデータに対する前記第1の機械学習モデルの第3の出力と前記第2の機械学習モデルの第4の出力との内容が等しく、前記第3の出力の確信度が前記第1の閾値以上であって、前記第4の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第3の出力と前記第4の出力との比較結果以外の他の比較結果を優先して表示する処理を含む、
ことを特徴とする請求項1または2に記載の表示プログラム。
【請求項4】
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第3のデータに対する前記第1の機械学習モデルの第5の出力と前記第2の機械学習モデルの第6の出力との内容が異なり、前記第5の出力の確信度が前記第1の閾値以上であって、前記第6の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第5の出力と前記第6の出力との比較結果を優先して表示する処理を含む、
ことを特徴とする請求項1または2に記載の表示プログラム。
【請求項5】
前記複数のデータのうちの第4のデータに対する前記第1の機械学習モデルの第7の出力と前記第2の機械学習モデルの第8の出力の内容の差を示す差異情報と、前記複数のデータのうち前記比較結果が前記差異情報が示す差と同一であるデータの数とを対応づけた第1の参照情報を出力する、
処理を前記コンピュータに実行させることを特徴とする請求項1または2に記載の表示プログラム。
【請求項6】
前記複数のデータのうちの第4のデータと、前記第4のデータに対する前記第1の機械学習モデルの第7の出力と、前記第4のデータに対する前記第2の機械学習モデルの第8の出力とを対応付けた第2の参照情報を出力する
処理を前記コンピュータに実行させることを特徴とする請求項1または2に記載の表示プログラム。
【請求項7】
前記第7の出力の確信度を表す値と前記第8の出力の確信度を表す値とを出力する、
処理を前記コンピュータに実行させることを特徴とする請求項6に記載の表示プログラム。
【請求項8】
第1の機械学習モデルと、前記第1の機械学習モデルの出力に基づいてラベル付けされたデータを用いて前記第1の機械学習モデルのパラメータを調整することによって得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの同一のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理部を有することを特徴とする情報処理装置。
【請求項9】
第1の機械学習モデルと、前記第1の機械学習モデルの出力に基づいてラベル付けされたデータを用いて前記第1の機械学習モデルのパラメータを調整することによって得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの同一のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理をコンピュータが実行することを特徴とする表示制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示プログラム,情報処理装置および表示制御方法に関する。
【背景技術】
【0002】
一般的に、AI(Artificial Intelligence)システムにおいては、運用中、流行の変化などのデータの特徴の変化により機械学習モデルの推定の精度が低下し陳腐化する。そのため、機械学習モデルの推定の精度を定期的に監視(検証)し、精度が低下していれば、機械学習モデルの再訓練を行なう必要がある。しかし、精度監視にも再訓練にも、人手で正解を付けたデータが必要となり、正解付きデータを作成するコスト(運用コスト)が上昇していた。
【0003】
第1の械学習モデルと第2の学習モデルとのそれぞれの実行結果が論理式を満たすか否かに基づいて、第1の学習モデルと第2の学習モデルとの振舞いの等価性を評価する技術がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-4178号公報
【特許文献2】特開2020-35039号公報
【特許文献3】米国特許出願公開第2016/0232457号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記技術において、2つの機械学習モデルの出力の等価性が判断されるが、2つの機械学習モデルの推定精度の比較には、例えば、正解付きの検証用データ、もしくは、推定結果の全ての人手によるチェックが必要である。いずれも工数の負荷が高い。
【0006】
1つの側面では、本発明は、第1の機械学習モデルと第2の機械学習モデルとの推定結果の差の検証を容易にできるようにすることを目的とする。
【課題を解決するための手段】
【0007】
このため、この表示プログラムは、第1の機械学習モデルと、前記第1の機械学習モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされた前記データを用いた機械学習により得られた第2の機械学習モデルとに複数のデータを入力し、前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、前記複数のデータのうちの第1のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する。
【発明の効果】
【0008】
一実施形態によれば、第1の機械学習モデルと第2の機械学習モデルとの推定結果の差を容易に検証できる。
【図面の簡単な説明】
【0009】
【
図1】実施形態の一例としての計算機システムの機能構成を例示する図である。
【
図2】監視部における第2の機械学習モデルの生成方法を説明するための図である。
【
図3】監視部による第1の機械学習モデルの精度測定方法を説明するための図である。
【
図4】実施形態の一例としての計算機システムにおけるモデル補正情報を例示する図である。
【
図5】実施形態の一例としての計算機システムにおけるモデル補正情報を例示する図である。
【
図6】実施形態の一例としての計算機システムの分類実行部の処理を説明するための図である。
【
図7】実施形態の一例としての計算機システムにおけるラベルスコアを例示する図である。
【
図8】実施形態の一例としての計算機システムにおけるラベルスコアを例示する図である。
【
図9】実施形態の一例としての計算機システムにおけるラベル補正によるラベル変化と分類結果に対する自信の有無との関係を示す図である。
【
図10】実施形態の一例としての計算機システムにおける詳細情報表示画面の他の例を示す図である。
【
図11】実施形態の一例としての計算機システムにおけるラベル補正によるラベル変化と分類結果に対する自信の有無との関係を示す図である。
【
図12】実施形態の一例としての計算機システムにおける処理を説明するためのフローチャートである。
【
図13】実施形態の一例としての計算機システムにおけるアラート発生時のユーザの処理を説明するためのフローチャートである。
【
図14】実施形態の一例としての計算機システムのハードウェア構成を例示する図である。
【
図15】実施形態の一例としての計算機システムにおけるサンプル比較情報の他の例を示す図である。
【
図16】実施形態の一例としての計算機システムにおける詳細情報表示画面の変形例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本表示プログラム,情報処理装置および表示制御方法にかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
【0011】
(A)構成
図1は実施形態の一例としての計算機システム1の機能構成を例示する図である。
計算機システム1は、例えば、分類問題を解くAIシステムの一例である。分類問題では、機械学習モデルが入力データのラベルを推論(分類)する。
【0012】
本実施形態においては、入力データが自動車の画像であり、機械学習モデルによりこの自動車の画像に対してラベルA,B,Cを推定する例について示す。例えば、ラベルAは国産車、ラベルBは外車、ラベルCはその他の特殊車両を示す。
【0013】
本計算機システム1は、
図1に示すように監視部101および表示制御部102を備える。
【0014】
監視部101は、AIシステムの運用監視支援,性能監視および再訓練などの維持管理を行なう。
【0015】
例えば、監視部101は、本計算機システム1において運用中の第1の機械学習モデル104の精度測定を行なう。第1の機械学習モデル104は、例えば、CNN(Convolutional Neural Network)である。第1の機械学習モデル104は、その他の機械学習アルゴリズムを用いて生成されたモデルであっても良い。運用中の機械学習モデルとは、AIシステムを利用するユーザに提供される分類問題の推定結果を出力する機械学習モデルを意味する。
【0016】
また、監視部101は、精度が基準値以下となった第1の機械学習モデル104の代替として提案する第2の機械学習モデル105を生成する機能を有する。
【0017】
監視部101は、例えば、第1の機械学習モデル104のパラメータを流用して第2の機械学習モデル105を生成しても良い。監視部101は、運用中に第1の機械学習モデル104に入力されるデータを第2の機械学習モデル105にも入力する。監視部101は、入力されたデータに対して第2の機械学習モデル105の推定結果を出力する出力層より手前の特定の層にて算出された値を、特徴量空間におけるデータの特徴量(ベクトル)として取得する。
【0018】
監視部101は、取得した特徴量に基づいて特徴量空間でデータをクラスタリングし、生成された各クラスタに各ラベルを対応付けることによって、データのラベル(推定ラベル)を特定する。監視部101は、特定した推定ラベルを正解ラベルとする訓練データに基づいて、第2の機械学習モデル105を再訓練する。再訓練によって第2の機械学習モデル105のパラメータは逐次更新されるため、運用中にデータの特徴が変化した場合であっても、第1の機械学習モデル104の推定結果よりも第2の機械学習モデル105の推定結果の方が正しい可能性が高い。特定の層は、例えば、出力層より特定の数手前の層であってもよく、畳み込み層のうちの最終層であってもよい。
第2の機械学習モデル105は、第1の機械学習104モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされたデータを用いた機械学習により得られた機械学習モデルに相当する。
【0019】
監視部101は、第1の機械学習モデル104の精度が基準値(閾値)以下となった場合に、アラートを表示制御部102に出力する。また、監視部101がアラートを出力すると、その旨の通知(精度低下アラート)がユーザに対して、電子メール等で通知されてもよい。
【0020】
また、監視部101は、アラートとともに、第1の機械学習モデル104と第2の機械学習モデル105とを表示制御部102に出力する。以下、運用中の第1の機械学習モデル104に代えて、第2の機械学習モデル105を運用中の機械学習モデルとして用いることを、「モデル補正」もしくは、単に「補正」という場合がある。また、「モデル補正」を「モデル更新」という場合もある。アラートはモデル補正の提案を通知する情報である。以下、第2の機械学習モデル105を単に補正モデルという場合がある。
【0021】
図2は監視部における第2の機械学習モデルの生成方法を説明するための図である。
監視部101は、データ分布の特徴をデータ群として表現した特徴量空間で、データをクラスタリングし、生成された各クラスタに各ラベルを対応付けることによって、データのラベル(推定ラベル)を特定する。これにより、監視部101は、入力データに対する正解ラベルを推定する。
【0022】
本計算機システム1において、監視部101は、例えば、機械学習モデルの精度劣化を自動修復する手法として既知の技術を用いて、正解ラベルの推定を行なってよい。
【0023】
特徴量空間においては、データの特性変化を追うことで、より正しい可能性が高いラベルを推定できる。監視部101は、入力データと当該入力データに対する正しいラベルとのペアを正解として深層学習を行なうことで、第2の機械学習モデル105を生成する。
【0024】
なお、監視部101は、第1の機械学習モデル104の推定結果を正解ラベルとする訓練データに基づいて、第2の機械学習モデル105を生成してもよい。この場合、第1の機械学習モデル104のパラメータに基づいて出力される推定結果を用いて、第1の機械学習モデル104の推定の分類境界を近似した分類境界を有する第2の機械学習モデル105が生成される。
【0025】
さらに、監視部101は、算出した運用中の第1の機械学習モデル104の精度も表示制御部102に通知する。
【0026】
図3は監視部101による第1の機械学習モデルの精度測定方法を説明するための図である。
【0027】
監視部101は、同じ入力データを第1の機械学習モデル104と第2の機械学習モデル105とに入力し、第1の機械学習モデル104と第2の機械学習モデル105とのそれぞれの推定結果(ラベル)を取得する。監視部101は、第2の機械学習モデル105の推定結果を正解とみなして、第2の機械学習モデル105の推定結果と第1の機械学習モデル104の推定結果とを比較(照合)することによって、第1の機械学習モデル104の推定結果の精度を測定する。
【0028】
より具体的には、監視部101は、同じ入力データを第1の機械学習モデル104と第2の機械学習モデル105とに入力し、第1の機械学習モデル104の推定結果と、第2の機械学習モデル105のパラメータに基づいて算出された入力データの特徴量とを取得する。監視部101は、特徴量を特徴量空間におけるベクトルとみなして、特徴量に基づいて入力データをクラスタリングする。監視部101は、クラスタリングにより生成された各クラスタに各分類を対応付けることによって、入力データのラベル(推定ラベル)を特定する。監視部101は、推定ラベルを正解(正解ラベル)とみなして、推定ラベルと第1の機械学習モデル104の推定結果とを比較することによって、第1の機械学習モデル104の推定結果の精度を測定しても良い。
【0029】
表示制御部102は、監視部101からアラートと第1の機械学習モデル104と第2の機械学習モデル105とが入力されると、
図4および
図5に例示するようなモデル補正情報200を生成し、ユーザに提示(出力)する。
【0030】
図4および
図5は、それぞれ実施形態の一例としての計算機システム1におけるモデル補正情報200を例示する図である。
図4はモデル補正情報200のメイン画面200aを例示する図、
図5はその詳細情報表示画面200bを例示する図である。
【0031】
モデル補正情報200は、第1の機械学習モデル104および第2の機械学習モデル105に関する情報であって、運用中の第1の機械学習モデル104に代えて第2の機械学習モデル105を採用することで生じる影響を示す情報を提示する。モデル補正情報200は、例えば、ウェブブラウザに表示されるウェブ画面として構成され、本計算機システム1に備えられたモニタ14a(
図14参照)等に表示される。
【0032】
モデル補正情報200は、例えば、メイン画面200a(
図4参照)と詳細情報表示画面200b(
図5参照)とを有する。
【0033】
メイン画面200aは、
図4に示すように、アラート情報201,第1の機械学習モデル推定精度情報202,サンプル比較情報203,モデル情報204,モデル補正実施入力ボタン205a,見送り入力ボタン205bおよび提案メッセージ206を備える。
【0034】
アラート情報201は、監視部101からアラートが出力されたことを示す情報である。
図4に示す例においては、アラートが出力された日付と、「アラートがあります」とのメッセージが表示されている。
【0035】
ユーザは、メイン画面200aのアラート情報201を参照することで、監視部101からアラートが出力されたことを知ることができる。
第1の機械学習モデル推定精度情報202は、監視部101が判定した第1の機械学習モデル104の精度を表す情報である。
【0036】
図4に示す例においては、第1の機械学習モデル推定精度情報202として、第1の機械学習モデル104の精度(Accuracy)をパーセント値として表すとともに、ラベル(A,B,C)毎のPrecisionおよびRecallが示されている。さらに、
図4に示す例においては、第1の機械学習モデル104の精度の推移をグラフでも表している。
【0037】
なお、第1の機械学習モデル推定精度情報202は、
図4に例示されたものに限定されるものではなく、適宜変更して実施することができる。例えば、第1の機械学習モデル推定精度情報202として、
図4に例示したうちの一部だけを表示してもよく、また、
図4に例示したもの以外の情報を表示してもよい。
【0038】
ユーザは、メイン画面200aの第1の機械学習モデル推定精度情報202を参照することで、第1の機械学習モデル104の精度やその推移を知ることができる。
【0039】
サンプル比較情報203は、第1の機械学習モデル104から第2の機械学習モデル105に使用する機械学習モデルを変更した場合に生じる出力結果の変化を示す。以下、第1の機械学習モデル104に代えて第2の機械学習モデル105を用いることをモデル補正といってもよい。
図4に例示するサンプル比較情報203においては、モデル補正(補正)を行なうことにより生じる分類結果の変化(ラベル変化)と、当該変化が生じるデータの数とを対応付けて示している。
【0040】
例えば、
図4において、補正によるラベル変化 “C→B”にデータ数“34”が対応付けられている。これは、第1の機械学習モデル104の分類結果はラベルCであるが、第2の機械学習モデル105の分類結果はラベルBとなるデータが34個あることを示している。
【0041】
すなわち、サンプル比較情報203は、同一のデータに対する、第1の機械学習モデル104の分類結果と第2の機械学習モデル105の分類結果との差異情報(ラベル変化)と、同一の差異情報が生じるデータの数(データ数)とを対応づけた第1の参照情報に相当する。
【0042】
サンプル比較情報203は、複数のデータのうちのデータ(第4のデータ)に対する第1の機械学習モデル104の出力(第7の出力)と第2の機械学習モデル105の出力(第8の出力)の内容の差を示す差異情報(ラベル変化)と、複数のデータのうち比較結果が差異情報が示す差と同一であるデータの数(データ数)とを対応づけた第1の参照情報に相当する。
【0043】
なお、
図4に例示するサンプル比較情報203においては、ラベル変化が生じない(ラベルA→A,B→B,C→C)入力データについての情報も表示しているが、これに限定されるものではない。サンプル比較情報203において、分類表示が生じない入力データについては非表示にしてもよく、また、非表示/表示をユーザが任意に選択できるようにしてもよい。
【0044】
また、
図4に例示するサンプル比較情報203において、各データ数には関連する情報がリンクされていることを表す下線が付されている。ユーザが、これらの下線が付された値を選択(クリック)することで、
図5に例示するような対応する詳細情報表示画面200bが表示される。すなわち、サンプル比較情報203における各データ数にはそれぞれ対応する詳細情報表示画面200bがリンク付けられている。
【0045】
詳細情報表示画面200bは、ラベル変化が生じた入力データを示す。
図5に示す例においては、詳細情報表示画面200bに、入力データの画像(もしくはそのサムネイル)に対応させて、当該画像のファイル名,第1の機械学習モデル104の推定結果および第2の機械学習モデル105(補正モデル)の推定結果を対応付けて示す。
【0046】
図5に示す例においては、
図4に例示するメイン画面200aのサンプル比較情報203において、補正によるラベル変化“C→B”のデータ数“34”を選択した場合に表示される詳細情報表示画面200bを示す。
【0047】
すなわち、
図5に例示する詳細情報表示画面200bは、第1の機械学習モデル104の推定結果はラベルC(その他の特殊車両)であるが、モデル補正を行なうことで推定結果がラベルB(外車)に変更される34個の入力データの画像一覧を示す。
【0048】
詳細情報表示画面200bは、複数のデータのうちのデータ(第4のデータ)と当該第4のデータに対する第1の機械学習モデル104の出力(第7の出力)と、第4のデータに対する第2の機械学習モデル105の出力(第8の出力)とを対応付けた第2の参照情報に相当する。
【0049】
ユーザは、詳細情報表示画面200bを参照することで、例えば、モデル補正を行なうことで、外車を正しく分類できるケースが増える傾向を目視で確認することができる。また、詳細情報表示画面200bに表示される複数の入力データの情報は、後述する表示優先度設定部107によって設定された優先度に従って並べられている。
【0050】
ユーザは、詳細情報表示画面200bを参照することで、モデル補正を実施することにより、第1の機械学習モデル104に比べて外車を正しく分類できるようになるケースが増える傾向を視認することができる。
図4に示すメイン画面200aの説明に戻る。
【0051】
モデル情報204は、当該メイン画面200aのサンプル比較情報203の元となる第1の機械学習モデル104および第2の機械学習モデル105等に関する各種情報である。モデル情報204は、例えば、第1の機械学習モデル104を特定する第1の機械学習モデルID(identification)や更新日等である。
【0052】
提案メッセージ206は、モデル補正を行なうことで精度改善が見込めることを示すメッセージである。なお、当該提案メッセージ206の形態は、この
図4に限定されるものではなく、適宜変更して実施することができる。例えば、提案メッセージ206と同様の内容のメッセージを、アラート情報201に含めて表示してもよい。
【0053】
モデル補正実施入力ボタン205aは、モデル補正の実行の指示を入力するための入力ボタンである。ユーザは、モデル補正情報200を参照してモデル補正を行なうと決定した場合に、このモデル補正実施入力ボタン205aを選択(クリック)する。このモデル補正実施入力ボタン205aを選択する入力が行なわれると、本計算機システム1においては、第2の機械学習モデル105のパラメータを用いて第1の機械学習モデル104が更新される。すなわち、第2の機械学習モデル105が新たな運用中の機械学習モデルとして用いられる。
【0054】
見送り入力ボタン205bは、モデル補正の実行の指示を行なわない旨の入力を行なうための入力ボタンである。ユーザは、モデル補正情報200を参照してモデル補正を行なわないことを決定した場合に、この見送り入力ボタン205bを選択(クリック)する。この見送り入力ボタン205bを選択する入力が行なわれると、本計算機システム1においては、モデル補正の実行が回避される。すなわち、第2の機械学習モデル105のパラメータを用いた第1の機械学習モデル104の更新は抑止される。
【0055】
ユーザは、モデル補正情報200に表示された各情報を参照し、必要に応じてモデル補正実施入力ボタン205aや見送り入力ボタン205bを用いて入力操作を行なう。すなわち、モデル補正情報200は、ユーザに提供されるGUI(Graphical User Interface)として機能する。
【0056】
表示制御部102は、
図1に示すように、分類実行部103,データ集合作成部106および表示優先度設定部107を備える。
【0057】
分類実行部103は、機械学習モデルである第1の機械学習モデル104および第2の機械学習モデル105にそれぞれデータを入力することで、それぞれの推定結果を得る分類を実行する。
【0058】
第1の機械学習モデル104は、分類問題を解くAIモデル(機械学習モデル)であって、図示しない深層学習処理部によるニューラルネットワークを用いた深層学習のアルゴリズムによって生成されても良い。
【0059】
ニューラルネットワークは、ハードウェア回路であってもよいし、プロセッサ11(
図14参照)等によりコンピュータプログラム上で仮想的に構築される階層間を接続するソフトウェアによる仮想的なネットワークであってもよい。
【0060】
本計算機システム1は、上述した深層学習処理部としての機能を備えてもよく、また、深層学習処理部としての機能を、当該計算機システム1とネットワーク等を介して接続された他の情報処理装置に備えてもよく、適宜変更して実施することができる。
【0061】
第2の機械学習モデル105は、分類問題を解くAIモデル(機械学習モデル)であって、監視部101により、第1の機械学習モデル104の運用中に入力されたデータを訓練データとして再訓練されることによってパラメータが更新される機械学習モデルである。分類実行部103が使用する第2の機械学習モデル105としては、アラートが発生したタイミングの最新のパラメータを有する第2の機械学習モデル105が採用されても良い。
【0062】
分類実行部103は、第1の機械学習モデル104および第2の機械学習モデル105のそれぞれに入力データを入力することで、入力データのラベルを取得する。
【0063】
なお、第1の機械学習モデル104は、監視部101からアラートが入力される以前において、例えば、前述した分類タスクを実現するために分類処理を実行してもよい。また、第2の機械学習モデル105についても同様に、監視部101からアラートが入力される以前において、例えば、精度監視や自動修復(自動ラベル付け)を実現するために分類処理を実行してもよい。
【0064】
分類実行部103は、第1の機械学習モデル104が分類タスクの実行に用いたデータを入力データとしてラベルを取得してもよく、また、第1の機械学習モデル104が分類タスクの実行に用いたデータ以外のデータを入力データとしてラベルを取得してもよい。また、分類実行部103は、第2の機械学習モデル105が精度監視や自動修復の実行に用いたデータを入力データとしてラベルを取得してもよく、また、第2の機械学習モデル105が精度監視や自動修復の実行に用いたデータ以外のデータを入力データとしてラベルを取得してもよい。
【0065】
図6は実施形態の一例としての計算機システム1の分類実行部103の処理を説明するための図である。
【0066】
分類実行部103には、監視部101から第1の機械学習モデル104の精度が閾値以下となったことを表すアラートと、第1の機械学習モデル104と、第2の機械学習モデル105とが入力される。分類実行部103は、複数の入力データを第1の機械学習モデル104に入力して、推定結果である各入力データのラベルを取得する。分類実行部103は、同じ複数の入力データを第2の機械学習モデル105にも入力して、推定結果である各入力データのラベルを取得する。
【0067】
また、分類実行部103は、第1の機械学習モデル104および第2の機械学習モデル105のそれぞれから、第1の機械学習モデル104および第2の機械学習モデル105がそれぞれ推定した各ラベルのスコアも取得する。スコアは、機械学習モデルがそのラベルと推定する確信度を表す値である。スコアは、機械学習モデルの出力層の各ラベルに対応する値が採用されても良い。また、スコアは、機械学習モデルの出力に基づいて各ラベルに対して既知の手法で算出されても良い。ラベルのスコアをラベルスコアといってよい。
【0068】
図7および
図8は、それぞれ実施形態の一例としての計算機システム1におけるラベルスコアを例示する図であり、
図7は第1の機械学習モデル104によって設定されたラベルスコアを示し、
図8は第2の機械学習モデル105によって設定されたラベルスコアを示す。
【0069】
第1の機械学習モデル104および第2の機械学習モデル105は、それぞれ入力データに対してラベル毎のスコアを設定し、各ラベルのうちスコアが最も高いラベルを判定ラベルとして決定する。また、以下においては、例えば、入力データに対してラベルAを推定した分類を分類Aと表す。同様に、入力データに対してラベルBを推定した分類を分類Bと表し、入力データに対してラベルCを推定した分類を分類Cと表す。
【0070】
例えば、
図7に示す例において、第1の機械学習モデル104は、“入力2”として表される入力データに対して、分類Aのスコアを0.1、分類Bのスコアを0.9、分類Cのスコアを0と設定している。このような場合に、第1の機械学習モデル104は、“入力2”として表される入力データに対して、スコアが0.9と最も高い分類Bを判定ラベルとして決定する。
【0071】
分類実行部103は、取得した各ラベルおよびラベルスコアをメモリ部12や記憶装置13(
図14参照)等の記憶領域に記憶させる。
【0072】
データ集合作成部106は、分類実行部103が第1の機械学習モデル104および第2の機械学習モデル105に入力データを入力することで得られた分類結果に基づき、分類結果間のラベル変化を集計する。
【0073】
データ集合作成部106は、同一の入力データを、第1の機械学習モデル104と第2の機械学習モデル105とのそれぞれに入力し、分類結果であるラベルを比較する。この比較の結果、第2の機械学習モデル105の分類結果であるラベルが、第1の機械学習モデル104の分類結果であるラベルと相違する場合(ラベル補正の前後でラベルが変化した場合)、そのラベル変化(例えば、C→B)に対応するデータ数の値をインクリメントする。データ集合作成部106は、このような処理を全入力データに対して行なうことでサンプル比較情報203を生成する。
【0074】
また、データ集合作成部106は、第1の機械学習モデル104により分類されたラベルと比べて第2の機械学習モデル105により分類されたラベルに変化が生じた入力データを、当該ラベル変化を示す情報に対応付けて記憶させる。このように、データ集合作成部106は、複数の入力データをラベル変化に応じて分類する。
【0075】
以下、第1の機械学習モデル104と第2の機械学習モデル105とのそれぞれの分類結果であるラベルに変化が生じた複数の入力データ(入力データ群)をラベル変化があるデータ群という場合がある。また、第1の機械学習モデル104と第2の機械学習モデル105とのそれぞれの分類結果であるラベルに変化がない複数の入力データ(入力データ群)をラベル変化がないデータ群という場合がある。
【0076】
表示優先度設定部107は、データ集合作成部106によりラベル変化に応じて分類(仕分け)された複数の入力データに対して優先度(表示優先度)を設定する。この優先度は、例えば、詳細情報表示画面200bにおいて複数の入力データ(画像)を一覧として表示させる際の表示優先度を表す。
【0077】
表示優先度設定部107は、ラベルスコアの値に基づいて入力データに対する優先度を設定する。
【0078】
ラベルスコアの値が基準値(閾値:例えば、0.66)以上である場合に、当該ラベルは確信度(確度)が高いとみなすことができる。以下、第1の機械学習モデル104の出力のラベルスコアの値が基準値(第1の閾値:例えば、0.66)以上である場合に、第1の機械学習モデル104の出力の推定結果に自信があると表現する場合がある。
【0079】
また、第2の機械学習モデル105の出力のラベルスコアの値が基準値(第2の閾値:例えば、0.66)以上である場合に、第2の機械学習モデル105の出力の推定結果に自信があると表現する場合がある。
【0080】
一方、ラベルスコアの値が基準値(閾値:例えば、0.66)未満である場合に、当該ラベルは確信度(確度)が低いとみなすことができる。以下、第1の機械学習モデル104の出力のラベルスコアの値が基準値(第1の閾値:例えば、0.66)未満である場合に、第1の機械学習モデル104の出力の推定結果に自信がないと表現する場合がある。
【0081】
また、第2の機械学習モデル105の出力のラベルスコアの値が基準値(第2の閾値:例えば、0.66)未満である場合に、第2の機械学習モデル105の出力の推定結果に自信がないと表現する場合がある。
【0082】
なお、第1の閾値と第2の閾値とは同じであってもよく、また、異なる値であってもよい。第1の閾値と第2の閾値とは、0.66以外の値であっても良い。本実施形態においては、これらの第1の閾値と第2の閾値とが同じ値(例えば、0.66)である例を示す。
図9は実施形態の一例としての計算機システム1におけるモデル補正によるラベル変化と推定結果に対する自信の有無との関係を示す図である。
【0083】
この
図9においては、ラベル変化がある入力データについて、第1の機械学習モデル104および第2の機械学習モデル105の各推定結果を自信あり/自信なしでグループ分けすることで、4象限マトリクスが形成されている。このように構成された4象限マトリクスを確信度スコア区分といってもよい。
【0084】
表示優先度設定部107は、第1の機械学習モデル104による推定結果に対する自信の有無と、第2の機械学習モデル105による推定結果に対する自信の有無との組み合わせが、この4象限マトリクスのいずれの象限に位置するかに基づき、該当するデータの優先度を設定し、ユーザに対する当該入力データの提示手法を決定する。
【0085】
ここで、ラベル変化がある入力データ群の中で、第1の機械学習モデル104および第2の機械学習モデル105のそれぞれの推定に自信があるデータ群(
図9の符号P1参照)は、これらの機械学習モデルの分類結果が対立する状態であるといえる。表示優先度設定部107は、このようなラベル変化がある入力データ群の中で、第1の機械学習モデル104および第2の機械学習モデル105のそれぞれの推定に自信があるデータ群を、ユーザ(人間)の目視による正解判断が必要なデータ群として扱ってもよい。例えば、表示優先度設定部107は、これらのデータ群を構成する入力データに対して高い優先度を設定してもよい。
【0086】
すなわち、表示制御部102は、複数のデータのうちの一部のデータ(第3のデータ)に対する第1の機械学習モデル104の出力(第5の出力)と第2の機械学習モデル105の出力(第6の出力)との内容が異なり(ラベル変化があり)、第5の出力の確信度が閾値(第1の閾値)以上(自信あり)であって、第6の出力の確信度も閾値(第2の閾値)以上(自信あり)である場合、第1の複数の出力と第2の複数の出力とのそれぞれの比較結果のうち、第5の出力と第6の出力との比較結果を優先して表示する。
【0087】
表示制御部102は、表示優先度設定部107により設定された優先度に従って、優先度が高い入力データが優先して詳細情報表示画面200bに表示されるように表示制御を行なう。すなわち、高い優先度が設定された入力データが、詳細情報表示画面200bにおいて、画面の先頭等のユーザによる視認性の良い位置に優先的に配置される。優先度が高い入力データは、ユーザに優先的に提示される。
図10は実施形態の一例としての計算機システム1における詳細情報表示画面200bの他の例を示す図である。
【0088】
この
図10に例示する詳細情報表示画面200bは、
図5に示した詳細情報表示画面200bに加えて、各入力データの画像に対応させて、各ラベルに対するラベルスコアを付している(
図10の符号P1参照)。
【0089】
この
図10に示すように、表示制御部102は、ユーザが、第1の機械学習モデル104および第2の機械学習モデル105によってそれぞれ推定された各ラベルに、これらの各ラベルのラベルスコアを付して表すことで、ユーザに対して、モデル補正を行なうことにより生じるスコアの変化(スコア変化)を提示し、確認させる。
【0090】
これにより、ユーザは、詳細情報表示画面200bを参照することで、モデル補正を行なうことで生じるスコア変化を知り、第1の機械学習モデル104および第2の機械学習モデル105により分類される各ラベルの信頼性を把握することができる。
【0091】
また、このようなラベル変化がある入力データ群の中で、第1の機械学習モデル104および第2の機械学習モデル105のそれぞれの分類に自信があるデータ群を構成する各入力データに対して、それぞれ、正解をユーザに入力させてもよい。例えば、表示制御部102は、これらの入力データのそれぞれに対して、正解を入力させるための入力画面をモニタ14a等に表示させてもよい。表示制御部102は、例えば、詳細情報表示画面200bに表示させた入力データの画像に対応付けて、ユーザに正解を入力(フィードバック入力)させるための入力インタフェースを表示させてもよい。
【0092】
また、ラベル変化があるデータ群の中で、第1の機械学習モデル104の推定に自信がなく、且つ、第2の機械学習モデル105の推定に自信があるデータ群(
図9の符号P2参照)は、当該第2の機械学習モデル105へのモデル補正により精度が向上すると考えられる。
【0093】
このようなラベル変化がある入力データ群の中で、当該第2の機械学習モデル105へのモデル補正により精度が向上すると考えられる入力データは、ユーザ(人間)の目視による正解判断を積極的に行なう必要がないとして、低い優先度を設定してよい。
【0094】
表示優先度設定部107は、これらの第1の機械学習モデル104の推定に自信がなく、且つ、第2の機械学習モデル105の推定に自信があるデータ群の入力データ(第1の出力と第2の出力との比較結果)以外の比較結果を優先して、詳細情報表示画面200bに表示させる。
【0095】
また、表示優先度設定部107は、これらの第1の機械学習モデル104の推定に自信がなく、且つ、第2の機械学習モデル105の推定に自信があるデータ群の入力データについては、例えば、
図5に例示した、スコア変化を含まない詳細情報表示画面200bをユーザに提示してよい。
ただし、これに限定されるものではなく、表示優先度設定部107は、
図10に例示したスコア変化を含む詳細情報表示画面200bを提示してもよい。
【0096】
また、表示制御部102は、ラベル変化がない入力データ群についても、ラベル変化がある入力データ群と同様に、スコア変化を、スコアに応じた優先順位の設定や詳細情報表示画面200b等に表示させてもよい。
図11は実施形態の一例としての計算機システム1におけるラベル補正によるラベル変化と推定結果に対する自信の有無との関係を示す図である。
【0097】
この
図11においては、ラベル変化がない入力データについて、第1の機械学習モデル104および第2の機械学習モデル105の各推定結果を自信あり/自信なしでグループ分けすることで、4象限マトリクスが形成されている。
【0098】
ラベル変化がない入力データ群については、正しい分類がされている可能性が高く、また、モデル補正の影響を受けないデータ群であると考えられる。従って、これらのラベル変化がないデータ群をユーザの視認によるチェック対象から除外してもよい。すなわち、表示優先度設定部107は、ラベル変化のない入力データ群を構成する入力データには低い優先度を設定してもよい。
【0099】
すなわち、表示制御部102は、複数のデータのうちの一部のデータ(第2のデータ)に対する第1の機械学習モデル104の出力(第3の出力)と第2の機械学習モデル105の出力(第4の出力)との内容が等しく、第3の出力の確信度が閾値(第1の閾値)以上(自信あり)であって、第4の出力の確信度が閾値(第2の閾値)以上(自信あり)である場合、第1の複数の出力と第2の複数の出力とのそれぞれの比較結果のうち、第3の出力と第4の出力との比較結果以外の他の比較結果を優先して表示する。
【0100】
なお、表示制御部102は、ラベル変化のない入力データ群を構成する入力データに対する優先度の設定を抑止してもよい。これにより、本計算機システム1における負荷を軽減することができる。これらのラベル変化がない入力データ群は、詳細情報表示画面200b等に表示させる必要はない。
【0101】
また、例えば、ラベル変化がない入力データ群の中で、第2の機械学習モデル105による推定に自信がないデータ群を構成する各入力データに対して、それぞれ、正解をユーザに入力させてもよい。例えば、第1の機械学習モデル104では自信ありだが、第2の機械学習モデル105では自信なしとなる入力データ群を構成する入力データに対して、正解をユーザに入力させてもよい。
【0102】
例えば、表示制御部102は、これらの入力データのそれぞれに対して、正解を入力させるための入力画面をモニタ14a等に表示させてもよい。表示制御部102は、例えば、詳細情報表示画面200bに表示させた入力データの画像に対応付けて、ユーザに解を入力(フィードバック入力)させるための入力インタフェースを表示させてもよい。
【0103】
また、モニタ14aに、上述の如き、第1の機械学習モデル104および第2の機械学習モデル105の各推定結果を自信あり/自信なしでグループ分けすることで形成した4象限マトリクス等を表示させ、ユーザがいずれかの象限を選択することで、当該選択された位置に対応するデータ群を詳細情報表示画面200bに表示させてもよい。
【0104】
(B)動作
上述の如く構成された実施形態の一例としての計算機システム1における処理を、
図12に示すフローチャート(ステップS1~S4)に従って説明する。
【0105】
監視部101は、第2の機械学習モデル105を既に生成した状態において、第1の機械学習モデル104の精度が基準値(閾値)以下となったことを検知すると、アラートと第1の機械学習モデル104と第2の機械学習モデル105とを表示制御部102に出力する。表示制御部102がアラートと第1の機械学習モデル104と第2の機械学習モデル105とを受信すると、以下の処理が開始される。
【0106】
ステップS1において、分類実行部103は、複数の入力データを、第1の機械学習モデル104および第2の機械学習モデル105にそれぞれ入力する。これにより、分類実行部103は、各入力データに対する、第1の機械学習モデル104によるラベルと、第2の機械学習モデル105によるラベルとを取得する。
【0107】
ステップS2において、データ集合作成部106は、分類実行部103が第1の機械学習モデル104および第2の機械学習モデル105に入力データを入力することで取得した各ラベルに基づき、モデル補正の前後におけるラベル変化を集計(分類)する。これにより、データ集合作成部106は、サンプル比較情報203を生成する。
【0108】
ステップS3において、表示優先度設定部107は、データ集合作成部106によりラベル変化に応じて仕分けされた複数の入力データに対して優先度(表示優先度)を設定する。
【0109】
ステップS4において、表示制御部102は、モデル補正情報200(メイン画面200a,詳細情報表示画面200b)を生成する。
【0110】
例えば、表示制御部102は、メイン画面200aのアラート情報201に相当する位置に、監視部101から通知されたアラートの内容を表示させる。
【0111】
また、表示制御部102は、メイン画面200aの第1の機械学習モデル推定精度情報202に相当する位置に、第1の機械学習モデル104から通知された第1の機械学習モデル104の精度の情報を表示させる。
【0112】
表示制御部102は、メイン画面200aのサンプル比較情報203に相当する位置に、データ集合作成部106が作成したサンプル比較情報203を表示させる。
【0113】
また、表示制御部102は、メイン画面200aのモデル情報204に相当する位置に、サンプル比較情報203の元となった第1の機械学習モデル104および第2の機械学習モデル105等に関する各種情報を表示させる。これらの情報は、例えば、第1の機械学習モデル104や第2の機械学習モデル105から取得してもよく、監視部101から取得してもよく、適宜変更して実施することができる。
【0114】
また、表示制御部102は、メイン画面200aに、モデル補正実施入力ボタン205aや見送り入力ボタン205bを表示させる。さらに、表示制御部102は、第2の機械学習モデル105の精度が第1の機械学習モデル104よりも高い場合に、メイン画面200aの提案メッセージ206に相当する位置に、モデル補正を行なうことで精度改善が見込めることを示すメッセージを表示させる。
【0115】
また、表示制御部102は、入力データの画像に対応させて、当該画像のファイル名,第1の機械学習モデル104により付与されたラベル,第2の機械学習モデル105により付与されたラベルを対応付けて表示させることで、詳細情報表示画面200bを生成する。詳細情報表示画面200bにおいては、複数の入力データを、表示優先度設定部107によって設定された優先度に従った順序で表示させる。表示制御部102は、各ラベルに対応させてラベルスコアを表示させてもよい。その後、処理を終了する。
【0116】
次に、実施形態の一例としての計算機システム1におけるアラート発生時のユーザの処理を、
図13に示すフローチャートに従って説明する。
【0117】
監視部101がアラートと第1の機械学習モデル104と第2の機械学習モデル105とを出力すると、ユーザは、精度低下アラートを電子メール等で受信する(ステップS11)。
【0118】
精度低下アラートを受信したユーザは、本計算機システム1にログインする。計算機システム1のモニタ14aにモデル補正情報200(メイン画面200a)が表示される。すなわち、ユーザに対して、モデル補正情報200により第2の機械学習モデル105の情報が提示される。
ユーザは、モデル補正情報200を参照することで第2の機械学習モデル105のチェックを行なう(ステップS12)。
【0119】
ユーザは、例えば、メイン画面200aや詳細情報表示画面200bを参照することで、モデル補正を行なうことでラベル変化が生じる入力データ等をチェックする。
【0120】
また、ユーザは、モニタ14aに表示された、第1の機械学習モデル104および第2の機械学習モデル105の各推定結果を自信あり/自信なしでグループ分けすることで形成された4象限マトリクスにおいて、いずれかの象限を選択することで、検証する入力データ群の絞り込みを行なってもよい。
【0121】
このように、ユーザは、モデル補正情報200を参照することでモデル補正を実施するか否(見送り)かを決定する(ステップS13)。ユーザは、モデル補正を実施する場合にはモデル補正実施入力ボタン205aを選択する入力を行ない、モデル補正を実施しない場合には、見送り入力ボタン205bを選択する入力を行なう(ステップS14)。
【0122】
モデル補正実施入力ボタン205aの選択入力が行なわれた場合には、本計算機システム1は、第2の機械学習モデル105を用いて顧客が運用中の機械学習モデルを更新するとともに、分類実行部103が管理する第1の機械学習モデル104を第2の機械学習モデル105を用いて更新する。
その後、処理を終了する。
【0123】
(C)効果
このように、実施形態の一例としての計算機システム1によれば、監視部101からアラートが出力された場合に、表示制御部102がモデル補正情報200を生成してユーザに提示する。
【0124】
これにより、モデル補正機能を用いるか否か、すなわち、第2の機械学習モデル105を用いて第1の機械学習モデル104を更新するか否かをユーザが判断するために用いる情報を低コストで提供することができる。
【0125】
ユーザは、例えば、メイン画面200aの提案メッセージ206や第1の機械学習モデル推定精度情報202を参照することで、モデル補正を行なうか否かを容易に決定することができ、利便性が高い。
【0126】
また、ユーザは、メイン画面200aのサンプル比較情報203を参照することで、モデル補正を行なうことによりラベル変化が生じるデータ数を容易に把握することができ、モデル補正を行なうか否かの判断に役立てることができる。
【0127】
さらに、ユーザは、詳細情報表示画面200bを参照することで、ラベル変化が生じる各入力データについて、第1の機械学習モデル104により分類されたラベルと第2の機械学習モデル105により分類されたラベルとを比較して、モデル補正を行なうか否か決定することができ利便性が高い。
【0128】
また、詳細情報表示画面200bにおいて、ラベル変化が生じる各入力データについて、第1の機械学習モデル104により分類されたラベルと第2の機械学習モデル105により分類されたラベルとのそれぞれにラベルスコアを表示させる。これにより、ユーザが設定された各ラベルの確信度を容易に知ることができ、モデル補正を行なうか否かの判断に役立てることができる。
【0129】
詳細情報表示画面200bにおいて複数の入力データ(画像)を一覧として表示させるに際して、表示優先度設定部107が入力データに対して設定した優先度に従って、並び替えや絞り込みを行なう。
【0130】
例えば、ラベル変化ありの場合において、第1の機械学習モデル104による推定が自信なしである一方で、第2の機械学習モデル105による推定が自信ありの入力データに関する表示優先度を低くする。これにより、ユーザが他のより重要な情報に着目してモデル補正の実施を判断することができ、利便性が高い。
【0131】
また、ラベル変更ありの場合において、第1の機械学習モデル104による推定および第2の機械学習モデル105による推定がいずれも自信ありの入力データに関する表示優先度を高くする。これにより、第1の機械学習モデル104と第2の機械学習モデル105とで推定結果が対立する状態である入力データに対して、ユーザが迅速に判断を行なうことができ、信頼性を向上させることができる。
【0132】
さらに、ラベル変更なしの場合において、第1の機械学習モデル104による推定および第2の機械学習モデル105による推定がいずれも自信ありの入力データに関する表示優先度を低くする。これにより、ユーザが他のより重要な情報に着目してモデル補正の実施を判断することができ、利便性が高い。
【0133】
監視部101が、データ分布の特徴をデータ群として表現した特徴量空間で、入力データに対する正解ラベルを推定することで正解データが不要となり、訓練データの作成コストを低減することができる。これにより、低コストで第1の機械学習モデル104の評価や運用を行なうことができる。また、第2の機械学習モデル105を容易に生成することができる。
【0134】
(D)その他
図14は実施形態の一例としての計算機システム1のハードウェア構成を例示する図である。
【0135】
計算機システム1は、情報処理装置(コンピュータ)によって実現され、例えば、プロセッサ11,メモリ部12,記憶装置13,グラフィック処理装置14,入力インタフェース15,光学ドライブ装置16,機器接続インタフェース17およびネットワークインタフェース18を構成要素として有する。これらの構成要素11~18は、バス19を介して相互に通信可能に構成される。
【0136】
プロセッサ(処理部)11は、計算機システム1全体を制御する。プロセッサ11は、マルチプロセッサであってもよい。プロセッサ11は、例えばCPU,MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ11は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
【0137】
そして、プロセッサ11が制御プログラム(監視制御プログラム,表示プログラム:図示省略)を実行することにより、
図1に例示する、監視部101および表示制御部102としての機能が実現される。
【0138】
なお、計算機システム1は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム{監視制御プログラムやOS(Operating System)プログラム}を実行することにより、監視部101としての機能を実現する。また、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム(表示プログラムやOSプログラム)を実行することにより、表示制御部102としての機能を実現する。
【0139】
計算機システム1に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、計算機システム1に実行させるプログラムを記憶装置13に格納しておくことができる。プロセッサ11は、記憶装置13内のプログラムの少なくとも一部をメモリ部12にロードし、ロードしたプログラムを実行する。
【0140】
また、計算機システム1(プロセッサ11)に実行させるプログラムを、光ディスク16a,メモリ装置17a,メモリカード17c等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ11からの制御により、記憶装置13にインストールされた後、実行可能になる。また、プロセッサ11が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
【0141】
メモリ部12は、ROM(Read Only Memory)およびRAM(Random Access Memory)を含む記憶メモリである。メモリ部12のRAMは計算機システム1の主記憶装置として使用される。RAMには、プロセッサ11に実行させるOSプログラムや制御プログラムの少なくとも一部が一時的に格納される。また、メモリ部12には、プロセッサ11による処理に必要な各種データが格納される。
【0142】
記憶装置13は、ハードディスクドライブ(Hard Disk Drive:HDD)、SSD(Solid State Drive)、ストレージクラスメモリ(Storage Class Memory:SCM)等の記憶装置であって、種々のデータを格納するものである。記憶装置13は、計算機システム1の補助記憶装置として使用される。記憶装置13には、OSプログラム,制御プログラムおよび各種データが格納される。制御プログラムには監視制御プログラムや表示プログラムが含まれる。
【0143】
なお、補助記憶装置としては、SCMやフラッシュメモリ等の半導体記憶装置を使用することもできる。また、複数の記憶装置13を用いてRAID(Redundant Arrays of Inexpensive Disks)を構成してもよい。
【0144】
また、記憶装置13には、上述した監視部101および表示制御部102が各処理を実行する際に生成される各種データを格納してもよい。
【0145】
例えば、分類実行部103が用いる第1の機械学習モデル104やそのコピーを実現するための情報や、第2の機械学習モデル105を実現するための情報を記憶装置13に格納してもよい。また、第1の機械学習モデル104および第2の機械学習モデル105の各出力(分類)や、データ集合作成部106や表示優先度設定部107によって生成された各情報や、モデル補正情報200を構成するための構造化文書等を記憶装置13に格納してもよい。さらに、モデル補正情報200に対してユーザが入力した情報を記憶装置13に格納してもよい。
【0146】
グラフィック処理装置14には、モニタ14aが接続されている。グラフィック処理装置14は、プロセッサ11からの命令に従って、画像をモニタ14aの画面に表示させる。モニタ14aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置等が挙げられる。なお、グラフィック処理装置14に備えられたGPU(Graphics Processing Unit)が、上述した制御プログラム(監視制御プログラム,表示プログラム)を実行することにより、
図1に例示する、監視部101および表示制御部102としての機能を実現してよい。
【0147】
入力インタフェース15には、キーボード15aおよびマウス15bが接続されている。入力インタフェース15は、キーボード15aやマウス15bから送られてくる信号をプロセッサ11に送信する。なお、マウス15bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル,タブレット,タッチパッド,トラックボール等が挙げられる。
【0148】
光学ドライブ装置16は、レーザ光等を利用して、光ディスク16aに記録されたデータの読み取りを行なう。光ディスク16aは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク16aには、DVD(Digital Versatile Disc),DVD-RAM,CD-ROM(Compact Disc Read Only Memory),CD-R(Recordable)/RW(ReWritable)等が挙げられる。
【0149】
機器接続インタフェース17は、計算機システム1に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース17には、メモリ装置17aやメモリリーダライタ17bを接続することができる。メモリ装置17aは、機器接続インタフェース17との通信機能を搭載した非一時的な記録媒体、例えばUSB(Universal Serial Bus)メモリである。メモリリーダライタ17bは、メモリカード17cへのデータの書き込み、またはメモリカード17cからのデータの読み出しを行なう。メモリカード17cは、カード型の非一時的な記録媒体である。
【0150】
ネットワークインタフェース18は、ネットワークに接続される。ネットワークインタフェース18は、ネットワークを介して他の情報処理装置や通信機器等が接続されてもよい。
【0151】
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
【0152】
上述した実施形態において、モデル補正情報200のメイン画面200aには、第1の機械学習モデル104の精度(Accuracy 74%)が示されているが、これに限定されるものではない。例えば、モデル補正後の精度を表示させてもよい。例えば、「第1の機械学習モデルの精度 61% ⇒ モデル補正後の精度100%」のような情報をユーザに提示してもよい。
【0153】
また、
図4に例示したメイン画面200a(モデル補正情報200)においては、モデル補正(補正)を行なうことにより生じるラベル変化と、当該変化が生じるデータの数とを対応付けたサンプル比較情報203を示しているが、これに限定されるものではなく、種々変形して実施することができる。
【0154】
図15は実施形態の一例としての計算機システム1におけるサンプル比較情報203の他の例を示す図である。
【0155】
この
図15においては、
図4に例示したサンプル比較情報203を混同行列(Confusion Matrix)で表した例を示す。
【0156】
この
図15においては、混同行列内の各データ数に各データ数には関連する情報がリンクされていることを表す下線が付されている。ユーザが、これらの下線が付された値を選択(クリック)することで、
図5に例示する詳細情報表示画面200bが表示される。
【0157】
また、上述した実施形態においては、入力データが1データ1ファイルの画像である例について示しているが、これに限定されるものではなく、種々変形して実施することができる。例えば、入力データは、CSV(Comma Separated Value)形式のファイルのように、1つのファイルが複数のデータを含むものであってもよく、種々変形して実施することができる。
【0158】
図16は実施形態の一例としての計算機システム1における詳細情報表示画面200bの変形例を示す図である。
【0159】
この
図16においては、入力データがニュースタイトルであり、第1の機械学習モデル104および第2の機械学習モデル105によりこれらのニュースタイトルを、スポーツ(B)やテクノロジ(C)等に分類する例を示す。
【0160】
図16に例示する詳細情報表示画面200bは、データ(ニュースタイトル)に対して、補正後回答および第1の機械学習モデル回答を対応付けたテーブルとして構成されている。このように、入力データの種類に応じて、詳細情報表示画面200bのフォーマットを適宜変更してもよい。
【0161】
また、この
図16に例示する詳細情報表示画面200bにおいて、ラベルスコア等の他の情報を表示させてもよく、種々変形して実施することができる。
【0162】
さらに、上述した実施形態においては、
図9に示したように、ラベルの推定結果を「自信あり/自信なし」の2つにグループ分けすることで4象限マトリクスで管理する例を示したが、これに限定されるものではない。例えば、ラベルの推定結果を「高/中/低」や「A/B/C/D」等のように3つ以上にグループ分けして管理してもよく、種々変形して実施することができる。
【0163】
また、上述した実施形態においては、表示優先度設定部107が、第1の機械学習モデル104および第2の機械学習モデル105の2つの機械学習モデルの確信度スコア区分に基づき、入力データを絞り込む例を示したが、これに限定されるものではない。例えば、監視部101が算出する他のスコアを利用してもよい。
【0164】
監視部101は、特徴量空間上でのラベル確信度スコアを出力する。特徴量空間上でのラベル確信度スコアは、特徴量空間上でこのラベルだと推定されるスコアであり、特徴量空間内でのクラスタ中心からの距離を表す。
【0165】
表示優先度設定部107は、特徴量空間上でのラベル確信度スコアに基づき、入力データの絞り込みを行なってもよい。
【0166】
また、上述した実施形態においては、計算機システム1が監視部101および表示制御部102としての機能を備えているが、これに限定されるものではない。
【0167】
監視部101としての機能を、当該計算機システム1とネットワーク等を介して接続された他の情報処理装置に備えてもよく、適宜変更して実施することができる。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
【0168】
(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
第1の機械学習モデルと、前記第1の機械学習モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされた前記データを用いた機械学習により得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの第1のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理をコンピュータに実行させることを特徴とする表示プログラム。
【0169】
(付記2)
前記表示する処理は、前記第1の機械学習モデルの精度が基準値以下となったことが検知された場合に、実行される、
ことを特徴とする、付記1記載の表示プログラム。
【0170】
(付記3)
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第2のデータに対する前記第1の機械学習モデルの第3の出力と前記第2の機械学習モデルの第4の出力との内容が等しく、前記第3の出力の確信度が第1の閾値以上であって、前記第4の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第3の出力と前記第4の出力との比較結果以外の他の比較結果を優先して表示する処理を含む、
ことを特徴とする、付記1または2に記載の表示プログラム。
【0171】
(付記4)
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第3のデータに対する前記第1の機械学習モデルの第5の出力と前記第2の機械学習モデルの第6の出力との内容が異なり、前記第5の出力の確信度が前記第1の閾値以上であって、前記第6の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第5の出力と前記第6の出力との比較結果を優先して表示する処理を含む、
ことを特徴とする、付記1または2に記載の表示プログラム。
【0172】
(付記5)
前記複数のデータのうちの第4のデータに対する前記第1の機械学習モデルの第7の出力と前記第2の機械学習モデルの第8の出力の内容の差を示す差異情報と、前記複数のデータのうち前記比較結果が前記差異情報が示す差と同一であるデータの数とを対応づけた第1の参照情報を出力する、
処理を前記コンピュータに実行させることを特徴とする、付記1または2に記載の表示プログラム。
【0173】
(付記6)
前記複数のデータのうちの第4のデータと前記第4のデータに対する前記第1の機械学習モデルの第7の出力と、前記第4のデータに対する前記第2の機械学習モデルの第8の出力とを対応付けた第2の参照情報を出力する
処理を前記コンピュータに実行させることを特徴とする、付記1または2に記載の表示プログラム。
【0174】
(付記7)
前記第7の出力の確信度を表す値と前記第8の出力の確信度を表す値とを出力する
処理を前記コンピュータに実行させることを特徴とする、付記6に記載の表示プログラム。
【0175】
(付記8)
第1の機械学習モデルと、前記第1の機械学習モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされた前記データを用いた機械学習により得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの第1のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理部を有することを特徴とする情報処理装置。
【0176】
(付記9)
前記処理部が、
前記表示する処理を、前記第1の機械学習モデルの精度が基準値以下となったことが検知された場合に、実行する
ことを特徴とする、付記8記載の情報処理装置。
【0177】
(付記10)
前記処理部が、
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理において、前記複数のデータのうちの第2のデータに対する前記第1の機械学習モデルの第3の出力と前記第2の機械学習モデルの第4の出力との内容が等しく、前記第3の出力の確信度が前記第1の閾値以上であって、前記第4の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第3の出力と前記第4の出力との比較結果以外の他の比較結果を優先して表示する、
ことを特徴とする、付記8または9に記載の情報処理装置。
【0178】
(付記11)
前記処理部が、
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理において、前記複数のデータのうちの第3のデータに対する前記第1の機械学習モデルの第5の出力と前記第2の機械学習モデルの第6の出力との内容が異なり、前記第5の出力の確信度が前記第1の閾値以上であって、前記第6の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第5の出力と前記第6の出力との比較結果を優先して表示する、
ことを特徴とする、付記8または9に記載の情報処理装置。
【0179】
(付記12)
前記処理部が、
前記複数のデータのうちの第4のデータに対する前記第1の機械学習モデルの第7の出力と前記第2の機械学習モデルの第8の出力の内容の差を示す差異情報と、前記複数のデータのうち前記比較結果が前記差異情報が示す差と同一であるデータの数とを対応づけた第1の参照情報を出力する
処理を実行することを特徴とする、付記8または9に記載の情報処理装置。
【0180】
(付記13)
前記処理部が、
前記複数のデータのうちの第4のデータと前記第4のデータに対する前記第1の機械学習モデルの第7の出力と、前記第4のデータに対する前記第2の機械学習モデルの第8の出力とを対応付けた第2の参照情報を出力する
処理を実行することを特徴とする、付記8または9に記載の情報処理装置。
【0181】
(付記14)
前記処理部が、
前記第7の出力の確信度を表す値と前記第8の出力の確信度を表す値とを出力する
処理を実行することを特徴とする、付記13に記載の情報処理装置。
【0182】
(付記15)
第1の機械学習モデルと、前記第1の機械学習モデルのパラメータに基づいてデータから抽出された特徴量に応じてラベル付けされた前記データを用いた機械学習により得られた第2の機械学習モデルとに複数のデータを入力し、
前記入力に応じて、前記第1の機械学習モデルが出力した第1の複数の出力と前記第2の機械学習モデルが出力した第2の複数の出力とを取得し、
前記複数のデータのうちの第1のデータに対する前記第1の機械学習モデルの第1の出力と前記第2の機械学習モデルの第2の出力との内容が異なり、前記第1の出力の確信度が第1の閾値未満であって、前記第2の出力の確信度が第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する、
処理をコンピュータが実行することを特徴とする表示制御方法。
【0183】
(付記16)
前記表示する処理は、前記第1の機械学習モデルの精度が基準値以下となったことが検知された場合に、実行される
ことを特徴とする、付記15記載の表示制御方法。
【0184】
(付記17)
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第2のデータに対する前記第1の機械学習モデルの第3の出力と前記第2の機械学習モデルの第4の出力との内容が等しく、前記第3の出力の確信度が第1の閾値以上であって、前記第4の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第3の出力と前記第4の出力との比較結果以外の他の比較結果を優先して表示する処理を含む、
ことを特徴とする、付記15または16に記載の表示制御方法。
【0185】
(付記18)
前記第1の出力と前記第2の出力との比較結果以外の他の比較結果を優先して表示する処理は、前記複数のデータのうちの第3のデータに対する前記第1の機械学習モデルの第5の出力と前記第2の機械学習モデルの第6の出力との内容が異なり、前記第5の出力の確信度が前記第1の閾値以上であって、前記第6の出力の確信度が前記第2の閾値以上である場合、前記第1の複数の出力と前記第2の複数の出力とのそれぞれの比較結果のうち、前記第5の出力と前記第6の出力との比較結果を優先して表示する処理を含む、
ことを特徴とする、付記15または16に記載の表示制御方法。
【0186】
(付記19)
前記複数のデータのうちの第4のデータに対する前記第1の機械学習モデルの第7の出力と前記第2の機械学習モデルの第8の出力の内容の差を示す差異情報と、前記複数のデータのうち前記比較結果が前記差異情報が示す差と同一であるデータの数とを対応づけた第1の参照情報を出力する
処理を前記コンピュータが実行することを特徴とする、付記15または16に記載の表示制御方法。
【0187】
(付記20)
前記複数のデータのうちの第4のデータと前記第4のデータに対する前記第1の機械学習モデルの第7の出力と、前記第4のデータに対する前記第2の機械学習モデルの第8の出力とを対応付けた第2の参照情報を出力する
処理を前記コンピュータが実行することを特徴とする、付記15または16に記載の表示制御方法。
【0188】
(付記21)
前記第7の出力の確信度を表す値と前記第8の出力の確信度を表す値とを出力する
処理を前記コンピュータが実行することを特徴とする、付記20に記載の表示制御方法。
【符号の説明】
【0189】
1 計算機システム
11 プロセッサ(処理部)
12 メモリ部
13 記憶装置
14 グラフィック処理装置
14a モニタ
15 入力インタフェース
15a キーボード
15b マウス
16 光学ドライブ装置
16a 光ディスク
17 機器接続インタフェース
17a メモリ装置
17b メモリリーダライタ
17c メモリカード
18 ネットワークインタフェース
18a ネットワーク
19 バス
101 監視部
102 表示制御部
103 分類実行部
104 第1の機械学習モデル
105 第2の機械学習モデル
106 データ集合作成部
107 表示優先度設定部
200 モデル補正情報
200a メイン画面
200b 詳細情報表示画面
201 アラート情報
202 第1の機械学習モデル推定精度情報
203 サンプル比較情報
204 モデル情報
205a モデル補正実施入力ボタン
205b 見送り入力ボタン
206 提案メッセージ