(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-28
(45)【発行日】2025-05-09
(54)【発明の名称】機械学習データセット評価支援装置及び機械学習データセット評価支援方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20250430BHJP
G06F 18/10 20230101ALI20250430BHJP
G06F 18/214 20230101ALI20250430BHJP
【FI】
G06N20/00 130
G06F18/10
G06F18/214
(21)【出願番号】P 2022005461
(22)【出願日】2022-01-18
【審査請求日】2024-03-12
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】來間 啓伸
(72)【発明者】
【氏名】明神 智之
(72)【発明者】
【氏名】佐藤 直人
(72)【発明者】
【氏名】野口 秀人
【審査官】新井 則和
(56)【参考文献】
【文献】国際公開第2020/259416(WO,A1)
【文献】国際公開第2021/111832(WO,A1)
【文献】特開2021-179859(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06F 18/10
G06F 18/214
(57)【特許請求の範囲】
【請求項1】
教師あり機械学習に用いる学習データセット及びラベル情報を保持する学習データセット保持部と、
所定の評価データセットを複数の学習済みAIモデルに入力し、複数の推論結果を得る推論実行部と、
前記複数の推論結果の間の差異を、前記複数の学習済みAIモデルそれぞれにおける推論結果の確信度及び推論結果の安定度から解析する差異解析部と、
前記差異の解析結果に基づいて、前記評価データセットを評価するデータ評価部と、
前記評価データセットの評価結果に基づいて前記学習データセット保持部に保持されている学習データセット及びラベル情報を編集する学習データセット編集部と、
を備えることを特徴とする機械学習データセット評価支援装置。
【請求項2】
前記解析結果を出力装置に表示する処理をさらに実行するものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項3】
前記推論実行部は、前記複数の学習済みAIモデルとして、学習時に学習データセットないしモデル構造を変化させて訓練したAIモデルを用いる、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項4】
前記推論実行部は、前記複数の学習済みAIモデルとして、推論時にモデル構造を変化させた学習済みAIモデルを用いる、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項5】
前記推論実行部は、前記複数の学習済みAIモデルを逐次的に実行して複数の推論結果を得るものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項6】
前記推論実行部は、前記複数の学習済みAIモデルを並列に実行して複数の推論結果を同時に得るものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項7】
前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より大きい評価データに類似しかつ評価対象データの推論結果と正解ラベルが異なる学習データを、前記学習データセットから削除する処理をさらに実行するものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項8】
前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より小さい評価データに類似する学習データを、前記学習データセットから削除する処理をさらに実行するものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項9】
前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より大きく、安定度が所定の閾値より小さい評価データに類似する学習データを生成し、前記学習データセットに追加する処理をさらに実行するものである、ことを特徴とする請求項1に記載の機械学習データセット評価支援装置。
【請求項10】
情報処理装置が、
教師あり機械学習に用いる学習データセット及びラベル情報を記憶装置で保持し、
所定の評価データセットを複数の学習済みAIモデルに入力し、複数の推論結果を得る処理と、前記複数の推論結果の間の差異を、前記複数の学習済みAIモデルそれぞれにお
ける推論結果の確信度及び推論結果の安定度から解析する処理と、前記差異の解析結果に基づいて、前記評価データセットを評価する処理と、前記評価データセットの評価結果に基づいて前記記憶装置に保持されている学習データセット及びラベル情報を編集する処理を、
実行することを特徴とする機械学習データセット評価支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習データセット評価支援装置及び機械学習データセット評価支援方法に関するものである。
【背景技術】
【0002】
IoTデータなど各種ビッグデータを活用した、様々な装置類の監視や制御、故障予知、或いは自動運転時の物体認識など、実に広範な分野で機械学習技術が導入されている。そうした分野での機械学習技術においては、人が正解データを付与するため学習精度が高く、学習速度も早い、教師あり機械学習が有用である。
【0003】
教師あり機械学習に際しては、実世界からデータを収集し、当該データがAIモデルに入力された際に期待する出力値、つまり正解ラベルを付与した学習データセット(訓練データとテストデータ)を作成する。このうち訓練データを教師データとしてAIモデルに学習させ、テストデータを使って学習済みAIモデルの精度を評価する。
【0004】
こうした機械学習に関連する従来技術としては、例えば、データの適切なクレンジング処理が困難であるといった課題を踏まえ、入力データから機械学習アルゴリズムに適した学習用データを生成するための学習データ生成装置(特許文献1参照)などが提案されている。
【0005】
この技術は、学習データを生成するために入力データに対してクレンジング処理を行う処理手段と、機械学習アルゴリズムを備え、前記機械学習アルゴリズムを用いて、学習データに基づいて学習モデルを生成する生成手段と、を有する学習データ生成装置であって、前記生成手段は、前記機械学習アルゴリズムとして、種類が異なる、複数の機械学習アルゴリズムを備え、前記処理手段は、入力データに対して、複数の前記機械学習アルゴリズムのそれぞれに対応して、第1のクレンジング処理を行うことを特徴とする学習データ生成装置である。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述の学習データセットに望まれる要件は以下のとおりである。想定する入力データを学習データセットがカバーしていること、頑健(入力値の微小なずれに対して安定)なAIモデルが構成できること、及び、学習データに付与されているラベルが妥当であること、である。
【0008】
しかし、特段の工夫なく素朴に収集した学習データセットでは、学習の進行を制御することが困難である。そのため、意図しない学習が行われる可能性がある。例えば、学習データが不足するケース、正解ラベルが異なる学習データの不用意な近接が生じるケース、及び、学習意図とは異なる特徴が優勢となるケースが該当する。
【0009】
一方、従来技術によれば、学習データのクレンジングを機械学習アルゴリズムの特徴に基づいて行う構成となっている。そのため、生成された学習モデルによる推論の特性をフ
ィードバックする形での、学習データの洗練はできない。
【0010】
そこで本発明の目的は、不適切な学習や学習不足を回避する、洗練された学習データセットの構成を可能とする技術を提供することにある。
【課題を解決するための手段】
【0011】
上記課題を解決する本発明の機械学習データセット評価支援装置は、教師あり機械学習に用いる学習データセット及びラベル情報を保持する学習データセット保持部と、所定の評価データセットを複数の学習済みAIモデルに入力し、複数の推論結果を得る推論実行部と、前記複数の推論結果の間の差異を、前記複数の学習済みAIモデルそれぞれにおける推論結果の確信度及び推論結果の安定度から解析する差異解析部と、前記差異の解析結果に基づいて、前記評価データセットを評価するデータ評価部と、前記評価データセットの評価結果に基づいて前記学習データセット保持部に保持されている学習データセット及びラベル情報を編集する学習データセット編集部と、を備えることを特徴とする。
【0012】
また、本発明の機械学習データセット評価支援方法は、情報処理装置が、教師あり機械学習に用いる学習データセット及びラベル情報を記憶装置で保持し、所定の評価データセットを複数の学習済みAIモデルに入力し、複数の推論結果を得る処理と、前記複数の推論結果の間の差異を、前記複数の学習済みAIモデルそれぞれにおける推論結果の確信度及び推論結果の安定度から解析する処理と、前記差異の解析結果に基づいて、前記評価データセットを評価する処理と、前記評価データセットの評価結果に基づいて前記記憶装置に保持されている学習データセット及びラベル情報を編集する処理を、実行することを特徴とする。
【発明の効果】
【0013】
本発明によれば、不適切な学習や学習不足を回避する、洗練された学習データセットの構成が可能となる。
【図面の簡単な説明】
【0014】
【
図1】本実施形態の学習データセット評価支援装置の機能構成の一例を示すブロック図である。
【
図2】本実施形態の学習データセット評価支援装置のハードウェア構成例を示す図である。
【
図3】本実施形態の学習データセット評価支援方法のフロー例を示す図である。
【
図4】本実施形態における学習データセットを変化させて訓練したAIモデルを取得する処理のフロー図である。
【
図5】本実施形態におけるモデル構造を変化させて訓練したAIモデルを取得する処理のフロー図である。
【
図6】本実施形態における推論実行処理のフロー図であり、学習済みAIモデルの推論を順次実行する処理のフロー図である。
【
図7】本実施形態における推論実行処理のフロー図であり、学習済みAIモデルの推論を並列に実行する処理のフロー図である。
【
図8】本実施形態における推論実行処理のフロー図であり、推論時にモデルの構造を変化させたAIモデルを用いる処理のフロー図である。
【
図9】本実施形態における推論結果差異解析処理のフロー図である。
【
図10】本実施形態における推論結果の確信度と安定度の計算方法の一例を示す図である。
【
図11】本実施形態における差異解析部の解析結果例を示す図である。
【
図12】本実施形態におけるデータ評価処理のフロー図である。
【
図13】本実施形態におけるデータ評価部が行う閾値設定処理の一例を示す図である。
【
図14】本実施形態における学習データセット編集処理のフロー図である。
【
図15】本実施形態における学習データセット編集処理部が行う類似データの判定方法の一例を示す図である。
【
図16】本実施形態における類似データの生成方法の一例を示す図である。
【
図17】実施例1における学習データセット評価支援装置の機能構成を示すブロック図である。
【
図18】実施例1における評価データの例ならびに推論結果と差異解析結果の例を示す図である。
【
図19】実施例1における高確信度の閾値の例、低確信度の閾値の例、低安定度の閾値の例を示す図である。
【
図20】実施例1における評価データの評価結果の例を示す図である。
【
図21】実施例1における学習データセット編集処理の例であり、学習データのラベルと推論結果が一致する場合を示す図である。
【
図22】実施例1における学習データセット編集処理の例であり、学習データのラベルと推論結果が一致しない場合を示す図である。
【
図23】実施例1における学習データセット編集処理の例を示す図である。
【
図24】実施例1における学習データセット編集処理の例を示す図である。
【
図25】実施例2における学習データセット評価支援装置の機能構成を示すブロック図である。
【
図26】実施例2における推論結果の確信度の表示例を示す図である。
【
図27】実施例2における推論結果の安定度の表示例を示す図である。
【
図28】実施例2における高確信度の閾値の例、低確信度の閾値の例、低安定度の閾値の例を示す図である。
【
図29】実施例2における評価データの評価結果の例を示す図である。
【発明を実施するための形態】
【0015】
<機械学習データセット評価支援装置の構成例>
以下に本発明の実施形態について図面を用いて詳細に説明する。
図1は、本実施形態の機械学習データセット評価支援装置100の機能構成例を示す図である。
図1に示す機械学習データセット評価支援装置100は、不適切な学習や学習不足を回避する、洗練された学習データセットの構成を可能とするコンピュータである。
【0016】
本実施形態の機械学習データセット評価支援装置100は、
図1で示すように、評価データセット保持部110、推論実行部111、学習済みAIモデル保持部112、差異解析部113、データ評価部114、学習データセット編集部115、及び、学習データセット保持部116を有している。
【0017】
このうち評価データセット保持部110は、評価データセット125を保持している。また、学習済みAIモデル保持部112は、学習済みAIモデル118を保持している。また、学習データセット保持部116は、学習データセット126及びラベル情報127を保持している。
【0018】
学習データセット126は、例えば、実世界から収集された訓練データである。また、ラベル情報127は、訓練データである学習データセットがAIモデルに入力されたときに期待する出力つまり正解ラベルの情報である。
【0019】
また、評価データセット125は、そうして学習が進んだAIモデルすなわち学習済みAIモデル118のそれぞれに入力する対象となる。その場合、学習済みAIモデル118から、複数の推論結果を得ることとなる。
【0020】
機械学習データセット評価支援装置100は、具体的には、サーバ装置、パーソナルコンピュータなどを想定できる。
【0021】
<ハードウェア構成>
また、本実施形態の機械学習データセット評価支援装置100のハードウェア構成は、
図2に以下の如くとなる。
【0022】
すなわち機械学習データセット評価支援装置100は、記憶装置101、メモリ103、演算装置104、入力装置105、出力装置106、および通信装置107を備える。
【0023】
このうち記憶装置101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
【0024】
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
【0025】
また、演算装置104は、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
【0026】
また、入力装置105は、ユーザからのキー入力や音声入力を受け付けるキーボードやマウス、マイクといった装置である。
【0027】
また、出力装置106は、演算装置104での処理結果の出力を行うディスプレイやスピーカー等の装置である。
【0028】
また、通信装置107は、適宜なネットワークと接続して、ユーザ端末等との通信処理を担うネットワークインターフェイスカード等を想定する。ただし、機械学習データセット評価支援装置100がスタンドアロンマシンである場合、本通信装置107は省略可能である。
【0029】
なお、記憶装置101内には、本実施形態の機械学習データセット評価支援装置として必要な機能を実装する為のプログラム102に加えて、評価データセット保持部110における評価データセット125、学習データセット保持部115における学習データセット126及びラベル情報127、学習済みAIモデル保持部112における学習済みAIモデル118が少なくとも記憶されている。ただし、これらについての詳細は後述する。
【0030】
また、プログラム102は、演算装置104により実行されることで、推論実行部111、差異解析部113、データ評価部114、及び学習データセット編集部115、の各機能を実装することになる。
【0031】
このうち推論実行部111は、評価データセット保持部110で保持する評価データセットを複数の学習済みAIモデル118に入力し、複数の推論結果を得るものである。
【0032】
なお、この推論実行部111は、複数の学習済みAIモデル118として、学習時に学習データセットないしモデル構造を変化させて訓練したAIモデルを用いる、ものとしてもよい。
【0033】
また、推論実行部111は、複数の学習済みAIモデルとして、推論時にモデル構造を変化させた学習済みAIモデルを用いる、ものとしてもよい。
【0034】
また、推論実行部111は、複数の学習済みAIモデルを逐次的に実行して複数の推論結果を得るものとしてもよい。
【0035】
また、推論実行部111は、複数の学習済みAIモデルを並列に実行して複数の推論結果を同時に得るものとしてもよい。
【0036】
また、差異解析部113は、上述の推論実行部111で得た複数の推論結果の間の差異を、複数の学習済みAIモデル118それぞれにおける推論結果の確信度及び推論結果の安定度から解析するものである。
【0037】
また、データ評価部114は、差異解析部113にて得た上述の差異の解析結果に基づいて、評価データセット125を評価するものである。
【0038】
また、学習データセット編集部115は、評価データセット125の評価結果に基づいて、学習データセット保持部116に保持されている学習データセット126及びラベル情報127を編集するものである。
【0039】
なお、上述の学習データセット編集部115は、推論実行部111による推論結果の確信度が所定の閾値より大きい評価データに類似しかつ評価対象データの推論結果と正解ラベルが異なる学習データを、学習データセット126から削除するものとしてもよい。
【0040】
また、学習データセット編集部115は、推論実行部111による推論結果の確信度が所定の閾値より小さい評価データに類似する学習データを、学習データセット126から削除するものとしてもよい。
【0041】
また、学習データセット編集部115は、推論実行部111による推論結果の確信度が所定の閾値より大きく、安定度が所定の閾値より小さい評価データに類似する学習データを生成し、学習データセット126に追加するものとしてもよい。
【0042】
なお、
図1ではなく
図25に基づき後述するが、機械学習データセット評価支援装置100は、上述の他にも、解析結果表示部117を有する。この解析結果表示部117は、差異解析部113での解析結果を出力装置106に表示するものである。
【0043】
<フロー例>
以下、本実施形態における機械学習データセット評価支援方法の実際手順について図に基づき説明する。以下で説明する機械学習データセット評価支援方法に対応する各種動作は、機械学習データセット評価支援装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
【0044】
図3は、本実施形態における機械学習データセット評価支援方法のフロー例を示す図である。この場合、機械学習データセット評価支援装置100は、学習済みAIモデル118を取得する(301)。この学習済みAIモデル118は、記憶装置101の学習済みAIモデル保持部112で予め保持しているものである。
【0045】
続いて、機械学習データセット評価支援装置100の推論実行部111は、評価データセット保持部110の評価データセット125から1つの評価データを、ステップ301で得ている学習済みAIモデル118に入力し、推論処理を実行する(302)。この推論処理の詳細は
図4~
図8に基づき後述する。
【0046】
次に、機械学習データセット評価支援装置100の差異解析部113は、ステップ302での推論処理の結果の確信度と安定度を解析し、これを例えばメモリ103に記録する(303)。
【0047】
続いて、機械学習データセット評価支援装置100は、ここまでのステップでの処理対象が、評価データセット125に含まれる未処理の評価データのうち最後の評価データであったか判定する(304)。
【0048】
上述の判定の結果、最後の評価データではない場合(304:NO)、機械学習データセット評価支援装置100は、処理をステップ302に戻す。
【0049】
一方、上述の判定の結果、最後の評価データである場合(304:YES)、機械学習データセット評価支援装置100のデータ評価部114は、当該評価データを評価し、その結果を、例えばメモリ103に記録する(305)。このデータ評価部114の処理の詳細は
図12などに基づき後述する。
【0050】
また、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部116の学習データセット126とラベル情報127を編集し(306)、本フローを終了する。この学習データセット編集部115の処理の詳細は、
図14などに基づき後述する。ここまでの処理により、不適切な学習や学習不足を回避する、洗練された学習データセットが生成された。
【0051】
<推論実行部のフロー例1>
続いて
図4において、本実施形態の推論実行部111が、学習データセットを変化させた学習データセットによる学習で、複数のAIモデルを生成する処理のフロー例を示す。
【0052】
この場合、機械学習データセット評価支援装置100の推論実行部111は、例えば、入力装置105から学習前AIモデルを取得する(401)。
【0053】
続いて、機械学習データセット評価支援装置100の推論実行部111は、引数iに1をセットする(402)。
【0054】
次に、機械学習データセット評価支援装置100の推論実行部111は、学習データセット保持部115の学習データセット126から、複数の学習データを取得する(403)。
【0055】
続いて、機械学習データセット評価支援装置100の推論実行部111は、学習データセット保持部115のラベル情報127から、上述のステップ403で得た学習データのラベルを取得する(404)。
【0056】
次に、機械学習データセット評価支援装置100の推論実行部111は、ステップ403、ステップ404で得た学習データとラベルを教師データとして、ステップ401で得ている学習前AIモデルを訓練する(405)。
【0057】
また、機械学習データセット評価支援装置100の推論実行部111は、ステップ405での訓練で得た学習済みAIモデル118を学習済みAIモデル保持部112に格納する(406)。
【0058】
ここで機械学習データセット評価支援装置100の推論実行部111は、引数iの値を
インクリメントし(407)、ステップ408に遷移する。
【0059】
次に、機械学習データセット評価支援装置100の推論実行部111は、上述の引数iが予め定めた値Tを越えたか判定する(408)。
【0060】
上述の判定の結果、引数iの値がTを越えていない場合(408:NO)、推論実行部111は、処理をステップ403に戻す。ここでステップ403に戻る場合、学習データセット126が含む学習データのうち未処理のものを次の学習対象とすることの他、学習データの追加、変更、削除を、所定ルールまたはユーザ操作に応じて実行して学習対象とすることも想定できる。
【0061】
一方、上述の判定の結果、引数iの値がTを越えた場合(408:YES)、推論実行部111は、本フローを終了する。
【0062】
<推論実行部のフロー例2>
続いて
図5において、本実施形態の推論実行部111が、モデル構造を変化させて訓練したAIモデルを取得する処理のフロー例を示す。
【0063】
この場合、機械学習データセット評価支援装置100の推論実行部111は、例えば、入力装置105から学習前AIモデルを取得する(501)。
【0064】
続いて、機械学習データセット評価支援装置100の推論実行部111は、引数iに1をセットする(502)。
【0065】
次に、機械学習データセット評価支援装置100の推論実行部111は、学習データセット保持部115の学習データセット126から、複数の学習データを取得する(503)。
【0066】
続いて、機械学習データセット評価支援装置100の推論実行部111は、学習データセット保持部115のラベル情報127から、上述のステップ503で得た学習データのラベルを取得する(504)。
【0067】
次に、機械学習データセット評価支援装置100の推論実行部111は、ステップ501で得ている学習前AIモデルの構造を改変する(505)。この構造の改変は、例えば、AIモデルを構成するニューラルネットワークのうち、所定層(例えば、中間層のうちの或る層)のノードの1つランダムに削除するか、当該ノードと他層の所定ノードとの間の1つのエッジを削除する、といったものを想定できる。
【0068】
また、機械学習データセット評価支援装置100の推論実行部111は、ステップ505で構造を改変した学習前AIモデルに、ステップ503、ステップ504で得ている学習データとラベルを教師データとして与えることで訓練する(506)。
【0069】
また、機械学習データセット評価支援装置100の推論実行部111は、ステップ506での訓練で得た学習済みAIモデル118を学習済みAIモデル保持部112に格納する(507)。
【0070】
ここで機械学習データセット評価支援装置100の推論実行部111は、引数iの値をインクリメントし(507)、ステップ508に遷移する。
【0071】
次に、機械学習データセット評価支援装置100の推論実行部111は、上述の引数i
が予め定めた値Tを越えたか判定する(509)。
【0072】
上述の判定の結果、引数iの値がTを越えていない場合(509:NO)、推論実行部111は、処理をステップ505に戻す。一方、上述の判定の結果、引数iの値がTを越えた場合(509:YES)、推論実行部111は、本フローを終了する。
【0073】
<推論実行部のフロー例3>
続いて
図6において、本実施形態の推論実行部111による推論実行処理のフローであり、学習済みAIモデルの推論を順次実行する処理のフロー例を示す。
【0074】
この場合、機械学習データセット評価支援装置100の推論実行部111は、評価データセット保持部110の評価データセット125から、評価データを1つ取得する(601)。
【0075】
続いて、機械学習データセット評価支援装置100の推論実行部111は、学習済みAIモデル保持部112から、T個の学習済みAIモデル118を取得する(602)。
【0076】
次に、機械学習データセット評価支援装置100の推論実行部111は、引数iの値として1をセットする(603)。
【0077】
続いて、機械学習データセット評価支援装置100の推論実行部111は、k番目の学習済みAIモデル118に、ステップ601で得ている評価データを入力して推論を実行する(604)。
【0078】
また、機械学習データセット評価支援装置100の推論実行部111は、上述のステップ605での推論の結果を、例えばメモリ103に格納する(605)。
【0079】
また、機械学習データセット評価支援装置100の推論実行部111は、引数iの値を1つインクリメントする(606)。
【0080】
続いて、機械学習データセット評価支援装置100の推論実行部111は、上述の引数iの値がTを越えたか判定する(607)。
【0081】
上述の判定の結果、引数iの値がTを越えていない場合(607:NO)、推論実行部111は、処理をステップ604に戻す。
【0082】
一方、上述の判定の結果、引数iの値がTを越えた場合(607:YES)、推論実行部111は本フローを終了する。
【0083】
<推論実行部のフロー例4>
続いて
図7において、本実施形態における推論実行処理のフローであり、学習済みAIモデルの推論を並列に実行する処理のフロー例を示す。
【0084】
この場合、機械学習データセット評価支援装置100は、評価データセット保持部110から評価データを1つ取得する(701)。
【0085】
続いて、機械学習データセット評価支援装置100は、学習済みAIモデル保持部112からT個の学習済みAIモデル118を取得する(702)。
【0086】
次に、機械学習データセット評価支援装置100は、ステップ702で得たT個の学習
済みAIモデル118を、推論実行部111に展開する(703)。
【0087】
続いて、機械学習データセット評価支援装置100の推論実行部111は、ステップ703で展開したT個の学習済みAIモデル118に、ステップ701で得ている評価データを入力して推論を実行する(704)。
【0088】
次に、機械学習データセット評価支援装置100の推論実行部111は、ステップ704での推論の結果を、例えばメモリ103に格納し(705)、本フローを終了する。
【0089】
<推論実行部のフロー例5>
続いて
図8において、本実施形態における推論実行処理のフローであり、推論時にモデルの構造を変化させたAIモデルを用いる処理のフロー例を示す。
【0090】
この場合、機械学習データセット評価支援装置100の推論実行部111は、評価データセット保持部110から評価データを1つ取得する(801)。
【0091】
また、機械学習データセット評価支援装置100の推論実行部111は、学習済みAIモデル保持部112から学習済みAIモデル118を取得する(802)。
【0092】
次に、機械学習データセット評価支援装置100の推論実行部111は、引数iの値として1をセットする(803)。
【0093】
続いて、機械学習データセット評価支援装置100の推論実行部111は、ステップ802で得た学習済みAIモデル118の構成要素を一部不活性化する(804)。この場合、構成要素とは、例えば、ニューラルネットワークを構成するノードやエッジであり、一部不活性化とは、ノードの重み値をゼロにする措置やエッジを削除するといったものを想定できる。
【0094】
次に、機械学習データセット評価支援装置100の推論実行部111は、ステップ804で一部不活性化の措置を施した学習済みAIモデル118に、ステップ801で得ている評価データを入力して推論を実行する(805)。
【0095】
また、機械学習データセット評価支援装置100の推論実行部111は、ステップ805での推論の結果を、例えばメモリ103に格納する(806)。
【0096】
続いて、機械学習データセット評価支援装置100の推論実行部111は、引数iの値をインクリメントし(807)、当該引数iの値が、予め定めたTの値を越えたか判定する(808)。
【0097】
上述の判定の結果、引数iの値がTを越えていない場合(808:NO)、推論実行部111は、処理をステップ804に戻す。
【0098】
一方、上述の判定の結果、引数iの値がTを越えた場合(808:YES)、推論実行部111は、本フローを終了する。
【0099】
<差異解析部のフロー例>
続いて
図9において、本実施形態の差異解析部113における、推論結果差異解析処理のフロー例を示す。また
図10に、本実施形態における推論結果の確信度と安定度の計算方法の一例を示す。
【0100】
この場合、機械学習データセット評価支援装置100の差異解析部113は、推論実行部111によるK個の推論結果をメモリ103より取得する(901)。
【0101】
また、機械学習データセット評価支援装置100の差異解析部113は、ステップ901で得た推論結果の確信度を計算し、例えば、メモリ103に格納する(902)。
【0102】
次に、機械学習データセット評価支援装置100は、ステップ901で得た推論結果の安定度を計算し、例えば、メモリ103に格納し(903)、本フローを終了する。
【0103】
なお、上述の差異解析部113による確信度および安定度の計算手法としては、例えば、
図10で示すように、分類問題の推論結果を式1201とし、T個の学習済みAIモデル118の推論結果の確率の平均値の式1202とした場合、確信度は式1203で、また、安定度は式1204で算定できる。
【0104】
同様に、回帰問題の推論結果を式1205とし、T個の学習済みAIモデル118の推論結果の確率の平均値の式1206とした場合、確信度は式1207で、また、安定度は式1208で算定できる。
【0105】
なお、上述のように算定した確信度および安定度の結果は、例えば、
図11に示すような構成として出力できる。確信度の分布
図1401において、各点は、1つの評価データに対する複数の推論結果について、クラスkであると判定される確率の平均値と推論結果の確信度を表す。また、安定度の分布
図1402において、各点は、1つの評価データに対する複数の推論結果について、クラスkであると判定される確率の平均値と推論結果の安定度を表す。
【0106】
<データ評価部のフロー例>
続いて
図12において、本実施形態におけるデータ評価部114のフロー例を示す。この場合、機械学習データセット評価支援装置100のデータ評価部114は、高確信度の閾値、低確信度の閾値、低安定度の閾値を設定する(1001)。
【0107】
この場合の設定手法としては、例えば、予め与えられたデフォルト値を使用するもの、分類される評価データが一定割合になるよう機械的に設定するもの、データ密度の高い領域が低い領域と分離されるよう機械的に設定するもの、及び差異解析結果(
図11参照)を参照してオペレータが設定するもの、のいずれかを想定する。
【0108】
具体的な閾値設定の概念例としては、
図13の分布
図1401に示すように、「1」の周辺のデータは推論結果が「クラスkである」ことの確信度が高く、また、「2」の周辺のデータは推論結果が「クラスkでない」ことの確信度が高いため、「1」と「2」の周辺のデータをカバーするよう高確信度の閾値を設定する。
【0109】
また、分布
図1402で示すように、推論結果の確信度が低いデータは推論結果が安定せず、確実な認識が困難、という状況の場合、高確信度の閾値>低確信度の閾値となる低確信度の閾値を確信度の低いデータの分布から設定する。
【0110】
また、分布
図1403で示すように、推論結果の安定度が低いデータは学習によって推論結果が安定して収束する可能性がある状況の場合、安定度の低いデータの分布から低安定度の閾値を設定する。
【0111】
また、機械学習データセット評価支援装置100のデータ評価部114は、確信度が高確信度の閾値(ステップ1001で設定したもの)以上の評価データを抽出し記録する(
1002)。
【0112】
次に、機械学習データセット評価支援装置100のデータ評価部114は、確信度が低確信度の閾値(ステップ1001で設定したもの)未満の評価データを抽出し記録する(1003)。
【0113】
続いて、機械学習データセット評価支援装置100のデータ評価部114は、安定度が低安定度の閾値(ステップ1001で設定したもの)未満の評価データを抽出して記録し(1004)、本フローを終了する。
【0114】
<学習データセット編集部のフロー例>
続いて
図14において、本実施形態における学習データセット編集部115での処理フロー例を示す。この場合、機械学習データセット評価支援装置100の学習データセット編集部115は、評価データセット保持部110から評価データを取得する(1101)。
【0115】
続いて、機械学習データセット評価支援装置100の学習データセット編集部115は、当該評価データが低確信度を示すものか判定する(1102)。
【0116】
上述の判定の結果、評価データが低確信度を示すものである場合(1102:YES)、学習データセット編集部115は、学習データセット保持部116の学習データセット126から、ステップ1101で得ている評価データに類似する全ての学習データを取得する(1109)。
【0117】
また、学習データセット編集部115は、学習データセット保持部116のラベル情報127から、ステップ1109で得ている学習データのラベルを取得し(1110)、処理をステップ1111に遷移させる。
【0118】
一方、上述の判定の結果、評価データは低確信度を示さないものである場合(1102:NO)、機械学習データセット評価支援装置100の学習データセット編集部115は、当該評価データが高確信度を示すものか判定する(1103)。
【0119】
上述の判定の結果、当該評価データが高確信度を示すものではない場合(1103:NO)、機械学習データセット評価支援装置100の学習データセット編集部115は、処理を1116に遷移させる。
【0120】
一方、上述の判定の結果、評価データが高確信度を示すものである場合(1103:YES)、機械学習データセット評価支援装置100の学習データセット編集部115は、当該評価データが低安定度を示すものか判定する(1104)。
【0121】
上述の判定の結果、当該評価データが低安定度を示すものではない場合(1104:NO)、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部116の学習データセット126から、当該評価データに類似する全ての学習データを取得する(1105)。
【0122】
なお、上述の「類似」について判定する手法としては、例えば、
図15で示す式1501及び式1502を用いたものを想定できる。或いは、
図16で示すように、類似するデータとその類似度を学習データとして学習させたAIモデルを用意し、類似度を判定する構成1503も想定できる。
【0123】
続いて、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部16のラベル情報127から、ステップ1105で得ている学習データのラベルを取得する(1106)。
【0124】
また、機械学習データセット評価支援装置100の学習データセット編集部115は、ステップ1106で取得したラベルと、ステップ1101で得ている評価データの推論結果を比較する(1107)。
【0125】
上述の比較の結果、上述のラベルと推論結果が一致する場合(1108:YES)、機械学習データセット評価支援装置100の学習データセット編集部115は、処理をステップ1116に遷移させる。
【0126】
他方、上述の判定の結果、ラベルと推論結果が一致しない場合(1108:NO)、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部116の学習データセット126から、当該学習データを削除する(1111)。
【0127】
また、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部116のラベル情報127から、当該学習データのラベルを削除し(1112)、処理をステップ1116に遷移させる。
【0128】
こうした、評価データにおける確信度と安定度が高いケースにおいて、当該評価データと類似の学習データのラベルと評価データの推論結果が一致しない場合、当該学習データやラベルの削除処理を行うことで、正解ラベルが不適切な学習データの排除が可能となる(
図22参照)。なお、学習データセット編集部115は、削除する学習データやラベルの情報を、出力装置106にて表示しても良い。
【0129】
一方、評価データにおける確信度が低いケースにおいて、正解ラベルが異なる学習データの不用意な近接の排除、学習意図とは異なる特徴量が優勢な学習データの排除が可能となる(
図23参照)。なお、学習データセット編集部115は、削除する学習データやラベルの情報を、出力装置106にて表示しても良い。
【0130】
また、評価データにおける確信度が高く、安定度が低いケースにおいて、不足している学習データの補足が可能となる(
図24参照)。なお、学習データセット編集部115は、補足する学習データの情報を、出力装置106にて表示しても良い。
【0131】
ここで、上述の処理1104での判定の結果、評価データが低安定度を示すものである場合(1104:YES)、機械学習データセット評価支援装置100の学習データセット編集部115は、当該評価データに類似するデータを生成する(1113)。
【0132】
なお、この類似するデータの生成は、
図16で示すように、生成元のデータの特徴量を微小変化させたデータを生成する手法1601、生成元のデータを微小回転、変形、変色させたデータを生成する手法1602、及びデータ生成ニューラルネットワークを利用してデータを生成する手法1603、などを想定できる。
【0133】
また、機械学習データセット評価支援装置100の学習データセット編集部115は、学習データセット保持部116の学習データセット126に、ステップ1113で生成した学習データを追加する(1114)。
【0134】
続いて、機械学習データセット評価支援装置100の学習データセット編集部115は
、学習データセット保持部116のラベル情報127に、ステップ1113で生成した学習データに関するラベルを追加し(1115)、処理をステップ1116に遷移させる。
【0135】
また、機械学習データセット評価支援装置100の学習データセット編集部115は、評価データセット125の評価データのうち未処理のものが残っていないか判定し(1116)、未処理のものが残っている、すなわち今次のフローでの処理対象とした評価データが最後の評価データではない場合(1116:NO)、機械学習データセット評価支援装置100の学習データセット編集部115は、処理を1101に戻す。
【0136】
一方、上述の判定の結果、未処理のものが残っていない、すなわち今次のフローでの処理対象とした評価データが最後の評価データであった場合(1116:YES)、機械学習データセット評価支援装置100の学習データセット編集部115は、本フローを終了する。
【0137】
<具体例:実施例1>
続いて、より具体的な例に沿って本実施形態の機械学習データセット評価支援技術について説明する。
図17は、実施例1における機械学習データセット評価支援装置100の機能構成を示すブロック図である。
【0138】
基本的な構成については
図1で示したものと同様であり、異なる部分は、推論実行部111における学習済みAIモデル保持部112で保持するAIモデルが、標識識別AIモデル118A、である点である。つまり、この場合の学習済みAIモデルは、道路標識のイメージから当該道路標識を判別するものである。
【0139】
そこで
図18にて、「60」なる数値を示す道路標識に関する、1~4までの計4つの評価データ1801、その推論結果1802、及び差異解析結果1803の各例を示す。また、そうした差異解析結果等に関する閾値1901~1903を
図19にて例示する。
【0140】
また、各評価データに関する評価結果2001を、
図20で示す。評価データ1の評価結果は、「確信度が高確信度の閾値以上、安定度が低安定度の閾値以上であり、確信度が高く安定度も高い」というものである。評価データ2の評価結果は、「確信度が低確信度の閾値未満であり、確信度が低い」というものである。評価データ3の評価結果は、「安定度が低安定度の閾値未満であり、安定度が低い」というものである。また、評価データ4の評価結果は、「確信度が高確信度の閾値以上、安定度が低安定度の閾値以上であり、確信度が高く安定度も高い」というものである。
【0141】
こうした評価結果を踏まえると、
図21で示すように評価データ1については、推論結果とラベルが一致する類似データを残す。また
図22で示すように評価データ4については、推論結果とラベルが一致しない類似データはラベルとともに削除する。また
図23で示すように評価データ2については、ラベルとともに学習データを削除する。また
図24で示すように評価データ3については、類似データを追加する。
【0142】
<具体例:実施例2>
また、機械学習データセット評価支援装置100が、
図25で示すように解析結果表示部117をさらに備える形態についても想定できる。この場合、解析結果表示部117は、
図26で示すように、推論結果の確信度を示す分布
図2601、2602を出力装置106に表示させる。同様に、解析結果表示部117は、
図27で示すように、推論結果の安定度を示す分布
図2701、2702を出力装置106に表示させる。
【0143】
また、解析結果表示部117は、
図28で示すように、
図26及び
図27で示す推論結
果を踏まえた、高確信度、低確信度、及び低安定度の各閾値2801~2803を出力装置106に表示させる。
【0144】
また、解析結果表示部117は、
図29で示すように、評価データの評価結果2901を出力装置106に表示させる。
【0145】
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
【0146】
こうした本実施形態によれば、学習済みAIモデルの推論特性を確信度と安定度から分析することで、不適切な学習の原因となるデータを除去し、学習が不足しているデータを追加した、学習データセットを構成可能である。ひいては、不適切な学習や学習不足を回避する、洗練された学習データセットの構成が可能となる。
【0147】
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の機械学習データセット評価支援装置において、前記解析結果を出力装置に表示する処理をさらに実行するものである、としてもよい。
【0148】
これによれば、複数の推論結果の間の差異を、推論結果の確信度及び推論結果の安定度の観点でユーザに明示できる。
【0149】
また、本実施形態の機械学習データセット評価支援装置において、前記推論実行部は、前記複数の学習済みAIモデルとして、学習時に学習データセットないしモデル構造を変化させて訓練したAIモデルを用いる、としてもよい。
【0150】
これによれば、推論結果として、学習データセットやモデル構造のゆらぎを踏まえたものを効率良く得られることとなる。
【0151】
また、本実施形態の機械学習データセット評価支援装置において、前記推論実行部は、前記複数の学習済みAIモデルとして、推論時にモデル構造を変化させた学習済みAIモデルを用いる、としてもよい。
【0152】
これによれば、1つのモデルを順次変化させることによるモデル数の削減、モデルの推論結果の履歴をモデルの変化に反映することによる推論結果の解析の高精度化を図ることができる。ひいては、不適切な学習や学習不足を回避する、より洗練された学習データセットの構成が可能となる。
【0153】
また、本実施形態の機械学習データセット評価支援装置において、前記推論実行部は、前記複数の学習済みAIモデルを逐次的に実行して複数の推論結果を得るものである、としてもよい。
【0154】
これによれば、一度に実行されるのが1つのモデルのみであることによる推論実行に要する計算資源の減少を図ることができる。
【0155】
また、本実施形態の機械学習データセット評価支援装置において、前記推論実行部は、前記複数の学習済みAIモデルを並列に実行して複数の推論結果を同時に得るものである、としてもよい。
【0156】
これによれば、複数の推論結果を同時に得ることによる処理時間の短縮を図ることができる。
【0157】
また、本実施形態の機械学習データセット評価支援装置において、前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より大きい評価データに類似しかつ評価対象データの推論結果と正解ラベルが異なる学習データを、前記学習データセットから削除する処理をさらに実行するものである、としてもよい。
【0158】
これによれば、正解ラベルが不適切な学習データの排除を図ることができる。
【0159】
また、本実施形態の機械学習データセット評価支援装置において、前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より小さい評価データに類似する学習データを、前記学習データセットから削除する処理をさらに実行するものである、としてもよい。
【0160】
これによれば、正解ラベルが異なる学習データの不用意な近接の排除、学習意図とは異なる特徴量が優勢な学習データの排除を図ることができる。
【0161】
また、本実施形態の機械学習データセット評価支援装置において、前記学習データセット編集部は、前記推論結果の確信度が所定の閾値より大きく、安定度が所定の閾値より小さい評価データに類似する学習データを生成し、前記学習データセットに追加する処理をさらに実行するものである、としてもよい。
【0162】
これによれば、不足している学習データの補足が可能となる。
【符号の説明】
【0163】
100 機械学習データセット評価支援装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
110 評価データセット保持部
111 推論実行部
112 学習済みAIモデル保持部
113 差異解析部
114 データ評価部
115 学習データセット編集部
116 学習データセット保持部
117 解析結果表示部
118 学習済みAIモデル
125 評価データセット
126 学習データセット
127 ラベル情報