IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝ソリューション株式会社の特許一覧

特開2022-162454評価装置、評価方法、およびプログラム
<>
  • 特開-評価装置、評価方法、およびプログラム 図1
  • 特開-評価装置、評価方法、およびプログラム 図2
  • 特開-評価装置、評価方法、およびプログラム 図3
  • 特開-評価装置、評価方法、およびプログラム 図4
  • 特開-評価装置、評価方法、およびプログラム 図5
  • 特開-評価装置、評価方法、およびプログラム 図6
  • 特開-評価装置、評価方法、およびプログラム 図7
  • 特開-評価装置、評価方法、およびプログラム 図8
  • 特開-評価装置、評価方法、およびプログラム 図9
  • 特開-評価装置、評価方法、およびプログラム 図10
  • 特開-評価装置、評価方法、およびプログラム 図11
  • 特開-評価装置、評価方法、およびプログラム 図12
  • 特開-評価装置、評価方法、およびプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022162454
(43)【公開日】2022-10-24
(54)【発明の名称】評価装置、評価方法、およびプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20221017BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021067322
(22)【出願日】2021-04-12
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(71)【出願人】
【識別番号】301063496
【氏名又は名称】東芝デジタルソリューションズ株式会社
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】仲 義行
(72)【発明者】
【氏名】大平 英貴
(72)【発明者】
【氏名】高橋 信太郎
(72)【発明者】
【氏名】櫻田 招宏
(72)【発明者】
【氏名】長 健太
(57)【要約】
【課題】複数の観点での学習モデルの評価を包括的に行うことが可能な評価装置、評価方法、およびプログラムを提供することである。
【解決手段】実施形態の評価装置は、取得部と、第1評価部と、第2評価部と、表示制御部とを持つ。取得部は、評価対象の学習モデルおよび評価データを取得する。第1評価部は、前記学習モデルに前記評価データを入力することで得られる出力データに基づいて、前記学習モデルの機能面の品質を評価する。第2評価部は、前記出力データに基づいて、前記学習モデルの非機能面の品質を評価する。表示制御部は、前記第1評価部による第1評価結果および前記第2評価部による第2評価結果を含む評価結果画面を、表示装置に表示させるように出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
評価対象の学習モデルおよび評価データを取得する取得部と、
前記学習モデルに前記評価データを入力することで得られる出力データに基づいて、前記学習モデルの機能面の品質を評価する第1評価部と、
前記出力データに基づいて、前記学習モデルの非機能面の品質を評価する第2評価部と、
前記第1評価部による第1評価結果および前記第2評価部による第2評価結果を含む評価結果画面を表示装置に表示させるように出力する表示制御部と、
を備える評価装置。
【請求項2】
前記第1評価部は、前記機能面の品質を示す第1指標値を算出し、
前記第2評価部は、前記非機能面の品質を示す少なくとも1つの第2指標値を算出し、
前記表示制御部は、前記第1指標値および前記第2指標値を含む前記評価結果画面を、前記表示装置に表示させる、
請求項1に記載の評価装置。
【請求項3】
前記評価結果画面は、前記第1指標値および前記第2指標値のうち、少なくとも1つの指標値のユーザによる指定を受け付ける第1受付部を備え、
前記評価装置は、
前記第1受付部により受け付けられた前記指標値の指定に基づいて、前記学習モデルの学習方針を決定する学習方針決定部と、
決定された前記学習方針に基づく学習の実行指示を出力する指示出力部と、
をさらに備える、
請求項2に記載の評価装置。
【請求項4】
前記第1受付部は、学習処理により品質の向上が不可能な指標値については前記ユーザによる指定を受け付けない、
請求項3に記載の評価装置。
【請求項5】
前記取得部は、評価対象の複数の学習モデルを取得し、
前記第1評価部は、前記複数の学習モデルの各々に前記評価データを入力することで得られる複数の出力データに基づいて、前記複数の学習モデルの各々の機能面の品質を評価し、
前記第2評価部は、前記複数の出力データに基づいて、前記複数の学習モデルの各々の非機能面の品質を評価し、
前記表示制御部は、前記複数の学習モデルの評価結果が重畳された前記評価結果画面を、前記表示装置に表示させる、
請求項1から4の何れか一項に記載の評価装置。
【請求項6】
前記評価結果画面は、前記複数の学習モデルのうち、運用に利用する学習モデルのユーザによる指定を受け付ける第2受付部を備え、
前記評価装置は、前記第2受付部により受け付けられた前記学習モデルの指定に基づいて、指定された前記学習モデルを用いた運用の実行指示を出力する指示出力部をさらに備える、
請求項5に記載の評価装置。
【請求項7】
前記第2評価部は、
前記評価データに対して、人が知覚可能な第1ノイズを付与して第1拡張データを生成し、
前記第1拡張データを前記学習モデルに入力することで得られる出力データに基づいて、前記第1ノイズに対する耐性を評価する、
請求項1から6の何れか一項に記載の評価装置。
【請求項8】
前記第2評価部は、
前記評価データに対して、人が知覚不可能な第2ノイズを付与して第2拡張データを生成し、
前記第2拡張データを前記学習モデルに入力することで得られる出力データに基づいて、前記第2ノイズに対する耐性を評価する、
請求項7に記載の評価装置。
【請求項9】
前記第2評価部は、前記出力データに基づいて算出される多軸で表される指標値を、1軸で表される前記第2指標値に変換する、
請求項2に記載の評価装置。
【請求項10】
前記表示制御部は、前記学習モデルの学習時に用いた第1評価データを用いた評価結果と、前記学習モデルの比較評価時に準備された前記第1評価データとは異なる第2評価データを用いた評価結果とを比較可能に表示する前記評価結果画面を、前記表示装置に表示させる、
請求項1から9の何れか一項に記載の評価装置。
【請求項11】
前記学習モデルの評価結果が所定の閾値を下回った場合に、前記学習モデルの再学習を促す通知を行う通知部をさらに備える、
請求項1から10の何れか一項に記載の評価装置。
【請求項12】
前記表示装置をさらに備える、
請求項1から11の何れか一項に記載の評価装置。
【請求項13】
コンピュータが、
評価対象の学習モデルおよび評価データを取得し、
前記学習モデルに前記評価データを入力することで得られる出力データに基づいて、前記学習モデルの機能面の品質を評価し、
前記出力データに基づいて、前記学習モデルの非機能面の品質を評価し、
前記学習モデルの機能面の第1評価結果および前記学習モデルの非機能面の第2評価結果を含む評価結果画面を、表示装置に表示させるように出力する、
評価方法。
【請求項14】
コンピュータに、
評価対象の学習モデルおよび評価データを取得させ、
前記学習モデルに前記評価データを入力することで得られる出力データに基づいて、前記学習モデルの機能面の品質を評価させ、
前記出力データに基づいて、前記学習モデルの非機能面の品質を評価させ、
前記学習モデルの機能面の第1評価結果および前記学習モデルの非機能面の第2評価結果を含む評価結果画面を、表示装置に表示させるように出力させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、評価装置、評価方法、およびプログラムに関する。
【背景技術】
【0002】
近年、様々な産業分野において、ディープラーニングなどの機械学習により生成されたモデルを利用した製品およびサービスの開発が進められている。これに伴い、生成されたモデルの品質を評価する手法についての研究も進められている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2018-81442号公報
【特許文献2】特開2020-140365号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のような機械学習により生成されるモデルに要求される品質は、その利用分野、利用状況などによって変化する。このため、モデルの品質を担保するためには様々な観点での評価が必要となる。例えば、モデルの精度についての評価や、入力データに混入する可能性のあるノイズに対する耐性についての評価などの複数の評価が必要となる。しかしながら、従来の評価手法では、このような様々な観点での評価が個別に行われているため、評価の実施者は複数の評価結果を個別に確認する必要があった。
【0005】
また、通常、機械学習により生成されるモデルは評価基準を満たすために、繰り返し学習処理が行われる。また、運用環境の変化などに適応するために、再学習処理が行われてモデルの更新が行われることもある。このような学習処理の進め方、学習データの選別方法、生成された複数のモデルの中から最適なモデルを選択する方法なども評価の観点に加わるため、様々な観点での評価を包括的に行うことができる評価手法が求められていた。
【0006】
本発明が解決しようとする課題は、複数の観点での学習モデルの評価を包括的に行うことが可能な評価装置、評価方法、およびプログラムを提供することである。
【課題を解決するための手段】
【0007】
実施形態の評価装置は、取得部と、第1評価部と、第2評価部と、表示制御部とを持つ。取得部は、評価対象の学習モデルおよび評価データを取得する。第1評価部は、前記学習モデルに前記評価データを入力することで得られる出力データに基づいて、前記学習モデルの機能面の品質を評価する。第2評価部は、前記出力データに基づいて、前記学習モデルの非機能面の品質を評価する。表示制御部は、前記第1評価部による第1評価結果および前記第2評価部による第2評価結果を含む評価結果画面を、表示装置に表示させるように出力する。
【図面の簡単な説明】
【0008】
図1】第1の実施形態に係る評価装置1の機能構成の一例を示す機能ブロック図。
図2】第1の実施形態に係る第2評価部105の詳細な機能構成の一例を示す機能ブロック図。
図3】第1の実施形態に係る評価装置1による評価処理の流れの一例を示すフローチャート。
図4】第1の実施形態に係る第2評価部105により算出された第1非機能指標値の一例を示す図。
図5】第1の実施形態に係る第2評価部105により算出された第2非機能指標値の一例を示す図。
図6】第1の実施形態に係る変換部205による変換処理の一例を説明する図。
図7】第1の実施形態に係る評価結果画面の一例を示す図。
図8】第1の実施形態に係る評価結果画面の他の例を示す図。
図9】第2の実施形態に係る評価装置1による評価処理の流れの一例を示すフローチャート。
図10】第2の実施形態に係る評価結果画面の一例を示す図。
図11】第2の実施形態に係る評価装置1による再学習の実行処理の流れの一例を示すフローチャート。
図12】第2の実施形態に係る評価装置1による運用の実行処理の流れの一例を示すフローチャート。
図13】第3の実施形態に係る評価結果画面の一例を示す図。
【発明を実施するための形態】
【0009】
以下、実施形態の評価装置、評価方法、およびプログラムを、図面を参照して説明する。
【0010】
(第1の実施形態)
第1の実施形態の評価装置は、機械学習により生成された学習済みのモデル(以下、「学習モデル」と呼ぶ)の品質の評価を行う。評価装置1は、学習モデルの機能面の品質に関する評価に加えて、学習モデルの非機能面の品質の評価を行い、これらの様々な観点での評価結果を包括的に表示装置に表示させる。
【0011】
図1は、第1の実施形態に係る評価装置1の機能構成の一例を示す機能ブロック図である。図1においては、説明のため、評価装置1とネットワークNを介して通信可能に接続される1以上の運用装置(学習装置)3も示している。
【0012】
運用装置3は、運用段階においては、学習モデルを用いて、所望の機能を実現する。運用装置3は、例えば、工場において各種検査を行う検査装置、車両やロボットなどの自動運転の制御を行う制御装置、各種画像の認識を行う画像認識装置などである。運用装置3は、学習モデルM、学習モデルMの学習処理において使用された学習データTD、学習モデルMを用いた運用処理において取得および生成される運用データODなどを記憶部に記憶している。一方、運用装置3は、学習段階においては、学習データTDを学習することにより学習モデルMを生成する学習装置として動作する。教師あり学習の場合、学習データTDは、入力データと、この入力データに対する出力データ(正解データ)との組であるデータ(教師データ)を複数含む。教師なし学習の場合、学習データTDは、様々なパターンの入力データを複数含む。
【0013】
ネットワークNは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、専用回線などを含む。
【0014】
評価装置1は、例えば、制御部10と、通信装置20と、入力インターフェース30と、表示装置40と、記憶部50とを備える。制御部10は、例えば、取得部101と、第1評価部103と、第2評価部105と、表示制御部107と、学習方針決定部109と、指示出力部111と、通知部113とを備える。
【0015】
取得部101は、通信装置20を介して、運用装置3から評価対象となる少なくとも1つの学習モデルMを取得する。なお、取得部101は、入力インターフェース30を介した評価装置1のユーザの操作に基づいて、学習モデルMを取得してもよい。また、取得部101は、入力インターフェース30を介して、学習モデルMを評価するための評価データを取得する。評価データは、例えば、入力データと、この入力データに対する出力データ(正解データ)との組を複数含む。評価データは、学習データとは異なるデータである。また、取得部101は、記憶部50に予め記憶された評価データEDを記憶部50から読み出すことで、評価データを取得してもよい。或いは、取得部101は、通信装置20を介して運用装置3から取得した運用データODを、評価データとしてもよい。すなわち、取得部101は、評価対象の学習モデルおよび評価データを取得する。取得部101は、「取得部」の一例である。
【0016】
第1評価部103(以下、「第1指標値算出部」とも呼ぶ)は、学習モデルの機能面の品質を評価し、評価結果(以下、「第1評価結果ER1」と呼ぶ)を記憶部50に記憶させる。機能面の品質には、機能の正確性であり、例えば、学習モデルの出力結果の精度(推論結果の正解率)が含まれる。例えば、第1評価部103は、評価データに含まれる入力データを学習モデルに入力することにより得られる出力結果と、評価データに含まれる出力データ(正解データ)とが一致するか否かに基づいて、学習モデルの精度を示す第1指標値を算出する。すなわち、第1評価部103は、学習モデルに評価データを入力することで得られる出力データに基づいて、学習モデルの機能面の品質を評価する。第1評価部103は、機能面の品質を示す第1指標値を算出する。第1評価部103は、「第1評価部」の一例である。
【0017】
第2評価部105は、学習モデルの非機能面の品質を評価し、評価結果(以下、「第2評価結果ER2」と呼ぶ)を記憶部50に記憶させる。非機能面の品質には、上記の機能面の品質(機能の正確性)以外の様々な特性が含まれる。非機能面の品質には、例えば、頑健性、公平性、学習データの十分性、学習データの被覆性、学習データの均一性、再学習による互換性などの観点に基づく特性が含まれる。
【0018】
頑健性とは、入力データに何らかの変化があっても安定して性能を達成する特性である。頑健性とは、例えば、入力データが画像データであり、画像データにノイズが含まれる場合や、画像データに映り込む着目物体の向きや位置がずれる場合、画像の撮像時の照明条件やカメラ感度が変化する場合などにおいても、所望の性能を達成する程度を示す。
【0019】
公平性とは、利用者から見て偏りのない結果となる出力を達成する特性である。公平性とは、例えば、人種、社会的属性、性別などの推論結果が不適切なものとならず、所望の性能を達成する程度を示す。学習データの十分性とは、学習モデルの性能を担保する上で、学習処理に利用された学習データのデータ量の十分さの程度を示す。学習データの被覆性とは、学習処理に利用された学習データが運用上想定される入力データのパターンを網羅できていることの程度を示す。学習データの均一性とは、学習処理に利用された学習データのパターンに偏りがなく、均一であることの程度を示す。再学習による互換性とは、学習モデルに対して再学習を行った後も、再学習前と同様な性能を再現できることの程度を示す。
【0020】
図2は、第1の実施形態に係る第2評価部105の詳細な機能構成の一例を示す機能ブロック図である。第2評価部105は、例えば、データ拡張部201と、第2指標値算出部203と、変換部205とを備える。データ拡張部201は、評価データに変更を加えることで、非機能面の品質の評価に利用される拡張データを生成する。例えば、非機能面の品質として頑健性(ノイズ耐性)の評価が行われる場合、データ拡張部201は、評価データに含まれる入力データに対してノイズを付与することで、拡張データを生成する。
【0021】
ノイズには、例えば、人が知覚可能(目視可能)なノイズ(ホワイトノイズ)(以下、「第1ノイズ」と呼ぶ)と、人が知覚不可能(目視不可能)な敵対的摂動(以下、「第2ノイズ」と呼ぶ)とが含まれる。第1ノイズは、学習モデルを用いた運用時に偶発的に発生するノイズである。第1ノイズは、人が知覚可能な程度のノイズ量を有する。一方、第2ノイズは、学習モデルが持つ脆弱性を狙うために意図的に生成されたノイズである。第2ノイズは、人が知覚できない程度の微小なノイズ量を有する。データ拡張部201は、評価の目的に応じて、評価データに含まれる入力データに対して、第1ノイズまたは第2ノイズを付与し、拡張データを生成する。
【0022】
すなわち、変換部205は、評価データに対して、人が知覚可能な第1ノイズを付与して第1拡張データを生成する。また、変換部205は、評価データに対して、人が知覚不可能な第2ノイズを付与して第2拡張データを生成する。
【0023】
第2指標値算出部203は、学習モデルの非機能面の品質を示す少なくとも1つの指標値(以下、「非機能指標値」と呼ぶ)を算出する。非機能指標値は、例えば、上記の第1ノイズに対する耐性を示す第1非機能指標値と、上記の第2ノイズに対する耐性を示す第2非機能指標値などを含む。非機能指標値は、例えば、多軸の評価観点により表される。第2指標値算出部203の処理の詳細については後述する。非機能指標値は、「第2指標値」の一例である。
【0024】
変換部205は、第2指標値算出部203により算出された多軸の評価観点により表される非機能指標値を、1軸の指標値(評価値)に変換する。変換部205の処理の詳細については後述する。この1軸の指標値は、「第2指標値」の一例である。
【0025】
すなわち、第2評価部105は、学習モデルに評価データを入力することで得られる出力データに基づいて、学習モデルの非機能面の品質を評価する。第2評価部105は、非機能面の品質を示す少なくとも1つの第2指標値を算出する。第2評価部105は、第1拡張データを学習モデルに入力することで得られる出力データに基づいて、第1ノイズに対する耐性を評価する。第2評価部105は、第2拡張データを学習モデルに入力することで得られる出力データに基づいて、第2ノイズに対する耐性を評価する。第2評価部105は、出力データに基づいて算出される多軸で表される指標値を、1軸で表される第2指標値に変換する。第2評価部105は、「第2評価部」の一例である。
【0026】
図1に戻り、表示制御部107は、第1評価部103による第1評価結果ER1、第2評価部105による第2評価結果ER2などを、表示装置40に表示させる。また、表示制御部107は、評価装置1のユーザからの各種指示を受け付けるためのGUI(Graphical User Interface)を、表示装置40に表示させる。すなわち、表示制御部107は、第1評価部103による第1評価結果および第2評価部105による第2評価結果を含む評価結果画面を、表示装置40に表示させるように出力する。表示制御部107は、第1指標値および第2指標値を含む評価結果画面を、表示装置40に表示させる。表示制御部107は、「表示制御部」の一例である。
【0027】
学習方針決定部109は、入力インターフェース30を介したユーザによる指示に基づいて、学習モデルMの再学習の方針を決定する。学習方針決定部109の処理の詳細については後述する。学習方針決定部109は、「学習方針決定部」の一例である。
【0028】
指示出力部111は、学習方針決定部109により決定された再学習の方針に沿った学習処理の実行指示を、ネットワークNを介して、運用装置3に出力する。運用装置3は、この学習処理の実行指示に基づいて、学習モデルMの再学習を実行する。また、指示出力部111は、入力インターフェース30を介したユーザによる指示に基づいて、指定された学習モデルを用いた運用処理の実行指示を、ネットワークNを介して、運用装置3に出力する。運用装置3は、運用処理の実行指示に基づいて、指定された学習モデルを用いた運用処理を実行する。指示出力部111は、「指示出力部」の一例である。
【0029】
通知部113は、第1評価部103による第1評価結果ER1または第2評価部105による第2評価結果ER2が、再学習の必要と判定される所定の条件を満たした場合に、運用装置3の管理者などに再学習の必要性が生じたことを知らせる通知を行う。通知部113は、例えば、電子メールなどにより、上記の通知を行う。通知部113は、「通知部」の一例である。
【0030】
制御部10の各機能部は、CPU(Central Processing Unit)(コンピュータ)がプログラムを実行することによって、実現される。また、制御部10の機能部一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働することにより実現されてもよい。プログラムは、予め記憶部50(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
【0031】
通信装置20は、ネットワークNを介して、1以上の運用装置3と通信する。通信装置20は、例えば、NICなどの通信インターフェースを含む。
【0032】
入力インターフェース30は、評価装置1のユーザによる各種の入力操作を受け付け、受け付けた入力操作の内容を示す電気信号を制御部10に出力する。入力インターフェース30は、例えば、キーボード、マウス、タッチパネルなどにより実現される。
【0033】
表示装置40は、各種の情報を表示する。例えば、表示装置40は、評価結果画面、評価装置1のユーザによる各種操作を受け付けるGUIなどを表示する。表示装置40は、例えば、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ、タッチパネルなどである。なお、表示装置40は、評価装置1とは別体に設けられ、評価装置1と通信を行うことで、各種の情報を表示してもよい。また、表示装置40は、タッチパネルにより実現される場合、上記の入力インターフェース30の機能を兼ね備えるものであってよい。なお、表示装置40は、必ずしも評価装置1内に設けられる必要はない。表示装置40は、評価装置1と通信可能に接続されるものであってもよい。
【0034】
記憶部50は、例えば、評価データED、第1評価結果ER1、第2評価結果ER2、閾値情報THなどを記憶する。記憶部50は、HDD(Hard Disk Drive)、RAM(Random Access Memory)、フラッシュメモリなどの記憶装置である。
【0035】
次に、第1の実施形態の評価装置1の処理の一例について説明する。図3は、第1の実施形態に係る評価装置1による評価処理の流れの一例を示すフローチャートである。図3に示す処理は、例えば、評価装置1のユーザが、入力インターフェース30を操作して、評価処理の開始を指示した場合に開始される。
【0036】
まず、取得部101は、評価対象となる1つの学習モデルMおよび評価データEDを取得する(ステップS101)。例えば、取得部101は、ネットワークNを介して、運用装置3から、学習モデルMを取得する。また、取得部101は、入力インターフェース30を介して、学習モデルMを評価するための評価データを取得する。
【0037】
次に、第1評価部103は、学習モデルMの機能面の品質を評価して、第1評価結果ER1を生成し、記憶部50に記憶させる(ステップS103)。例えば、第1評価部103は、評価データEDを用いて、学習モデルMの出力結果の精度(正解率)を算出する。
【0038】
次に、第2評価部105のデータ拡張部201は、評価データEDに変更を加えることで評価データEDを拡張し、拡張データを生成する(ステップS105)。例えば、データ拡張部201は、評価データEDの入力データに対して第1ノイズを付与し、第1拡張データを生成する。また、データ拡張部201は、評価データEDの入力データに対して第2ノイズを付与し、第2拡張データを生成する。
【0039】
次に、第2評価部105の第2指標値算出部203は、学習モデルMの非機能面の品質を評価して、非機能指標値を算出する(ステップS107)。例えば、第2指標値算出部203は、第1ノイズに対する耐性を示す第1非機能指標値、および第2ノイズに対する耐性を示す第2非機能指標値を算出する。
【0040】
第1非機能指標値を算出処理において、第2指標値算出部203は、RS(Randomized Smoothing)を用いて推論結果を保つノイズの大きさを算出し、算出した値をPSNR(Peak signal-to-noise ratio,単位はデシベル(dB))で定量指標化する。
【0041】
RSとは、学習モデルの推論結果が変化するノイズの理論的な最小値を、ノイズを加えた際に出力される推論結果(画像分類問題であれば,どのラベルが出力されるか)の期待値を使って算出する手法である。第2指標値算出部203は、例えば、第1ノイズによって変化する推論結果の期待値をRSに適用して、推論結果が50%の確率で変化する第1ノイズの大きさを算出する。算出した第1ノイズは、期待値が最も高い推論結果が2番目に期待値が高い推論結果に変化する最小値である。この最小値より小さい第1ノイズであれば期待値が最も高い推論結果は変わらないことが保証されるため、このノイズの値を基に第1ノイズに対する耐性の評価が可能になる。
【0042】
PSNRは、信号が取り得る最大パワーに対するノイズの比率を示すものであり、非可逆な画像圧縮での画質劣化の指標としても利用されている。PSNRは、ノイズがゼロで無限大となり、ノイズが大きいほど小さい値となる。PSNRは、人間の主観画質とは必ずしも一致しないが、概ね40dB以下になると、劣化が知覚されるようになる。推論結果が変化する第1ノイズの最小値をPSNRで表現することで、ノイズ耐性の目標値を定量的にわかりやすく設定することが可能になる。
【0043】
図4は、第1の実施形態に係る第2評価部105により算出された第1非機能指標値の一例を示す図である。第1非機能指標値は、横軸にPSNR(Peak signal-to-noise ratio,単位はデシベル(dB))と、縦軸に結果が変わらないデータ数の割合(すなわち、PSNR値の大きさの第1ノイズを付加しても推論結果が変わらないデータ数の割合)と、の2軸で表されている。図4は、モデルA、モデルB、モデルCの3つの学習モデルについてのノイズ耐性の比較結果を示す。モデルAは、無加工の学習データを用いて生成された。モデルBは、学習データに対してホワイトノイズを加えることで、水増ししたデータを用いて生成された。モデルCは、モデルBよりもホワイトノイズを大きくしてモデルBと同様に生成された。学習条件は3つのモデルとも同一である。
【0044】
図4は、これらの3つのモデルについて、テストデータに対してRSで算出したノイズの最小値をPSNRで指標化し、ノイズ耐性を測定したグラフを示す。ここでは、推論結果の正解/不正解ではなく、ノイズによって推論結果に変化あり/変化なしの変化を判定することで、ノイズ耐性が評価される。この場合、小さいPSNRでも推論結果が変わらないデータが多い学習モデルほど、ノイズ耐性が高いことになる。図4においては,モデルCのノイズ耐性が最も高いことがわかる。また、人が知覚可能なノイズの大きさのPSNR値を参照して、例えば「70%以上のデータが40dB以上のノイズに耐性があることを目標値にする」など、目標値を設定して評価することが可能となる。
【0045】
一方、第2非機能指標値を算出処理において、第2指標値算出部203は、第2ノイズを検知するように学習された検知器を使いて、第2非機能指標値を算出する。第2ノイズ(敵対的摂動)は人が知覚できないほど微小であるため、その大きさが実感しにくく、第1ノイズ(偶発的なノイズ)のようにノイズ量の大きさによる妥当な基準値を設けることが難しい。そのため、第2ノイズに対しては、大きさを人がイメージしやすい他の指標が必要である。そこで、第2指標値算出部203は、第2ノイズを検知するように学習した検知器を使い、第2ノイズを加えたデータ(以下、「敵対的データ」と呼ぶ)を含むデータセットに対して、検知器が第2ノイズを検知する割合(以下、「検知率」と呼ぶ)を測定する。検知率は、いわば学習モデルにとってのノイズの見分けやすさであり、これをノイズの大きさの指標とすることで、より人にわかりやすい目標値を設定できるようにした。例えば、検知率が高い摂動は、学習モデルにとっては見分けやすい大きな摂動となる。
【0046】
図5は、第1の実施形態に係る第2評価部105により算出された第2非機能指標値の一例を示す図である。図5は、モデルDおよびモデルEの2つの学習モデルについてのノイズ耐性の比較結果を示す。モデルDは、無加工の学習データを学習することで生成された。モデルEは、モデルDの学習データに、学習データから生成された敵対的データを加えたデータを、モデルDと同じ学習条件で学習することで生成された。モデルEは、モデルDよりもノイズ耐性を向上させたモデルである。敵対的データの生成手法にはFGM(Fast Gradient Method)が用いられた。図5は、このようなモデルDおよびモデルEの検知器を生成して、テストデータから生成された敵対的データと、無加工のテストデータとに対する検知率を、敵対的摂動(第2ノイズ)の大きさを変えながら測定した測定結果を示す。
【0047】
図5の第2非機能指標値は、横軸に敵対的データに対する検知器の検知率と、縦軸に敵対的データに対する学習モデルの精度との2軸で表されている。図5のepsはFGMに使用される入力パラメータの1つで、生成する摂動の大きさに乗じる値であり、摂動の大きさを調整するために用いる。そのためepsを大きくすると、摂動が大きくなる。図5の結果から、第2ノイズの大きさと検知率との相関が確認でき、検知率を摂動の大きさを表す指標として使用できることが確認できる。検知率と摂動の大きさとの相関から、検知率が高いノイズに対しても精度が高い学習モデルが、ノイズ耐性が高いモデルになる。図5では、モデルEがモデルDよりもノイズ耐性が高いと相対評価できる。摂動の大きさを検知率で示すことで、例えば「検知率が0.8以下となる大きさの第2ノイズに対しては、モデルの精度が70%以上となること」など、定量的かつ人がイメージしやすい目標値を設定して、各々のモデルを評価することが可能となる。
【0048】
次に、第2評価部105の変換部205は、第2指標値算出部203により算出された非機能指標値を、1軸の指標値に変換する(ステップS109)。図6は、第1の実施形態に係る変換部205による変換処理の一例を説明する図である。図6の(a)は、図4に示す2軸で表されている第1非機能指標値を、1軸の指標値に変換する変換処理の一例を説明する図である。この例では、評価を行うための横軸(PSNR)の目標値(範囲)として下限目標値LX1および上限目標値LX2が設定され、この目標値(範囲)におけるグラフカーブの下の面積A(すなわち、下限目標値LX1、上限目標値LX2、X軸、およびグラフカーブで囲まれる面積A)を算出して、1軸の指標値とする。
【0049】
あるいは、図6の(b)に示すように、縦軸(結果が変わらないデータ数の割合)の目標値として目標値LY1を設定し、基準となる面積B(すなわち、下限目標値LX1、上限目標値LX2、目標値LY1、およびX軸で囲まれる面積B)を算出して、A/Bを評価値として算出してもよい。例えば、A⊇Bかつ評価値>1であれば、目標を満たしているといえる。
【0050】
次に、表示制御部107は、第1評価部103による第1評価結果ER1、第2評価部105による第2評価結果ER2などを含む評価結果画面を生成する(ステップS111)。次に、表示制御部107は、生成した評価結果画面を、表示装置40に表示させる(ステップS113)。
【0051】
図7は、第1の実施形態に係る評価結果画面の一例を示す図である、図7に示す評価結果画面P1においては、第1評価部103による第1評価結果ER1に含まれる学習モデルMの精度と、第2評価部105による第2評価結果ER2に含まれる第1非機能指標値に基づく1軸の指標値と、第2評価部105による第2評価結果に含まれる第2非機能指標値に基づく1軸の指標値と、を含む3つの観点での評価結果がレーダーチャートで表されている。評価装置1のユーザは、このような複数の観点での評価結果を含む評価結果画面を確認することで、学習モデルの評価を様々な観点から行うことができる。
【0052】
図8は、第1の実施形態に係る評価結果画面の他の例を示す図である、図8に示す評価結果画面P2においては、第1評価部103による第1評価結果ER1に含まれる学習モデルMの精度と、第2評価部105による第2評価結果ER2に含まれる4つの非機能指標値に基づく4つの指標値と、を含む計5つの観点の評価結果がレーダーチャートで表されている。評価装置1のユーザは、このような複数の観点での評価結果を含む評価結果画面を確認することで、学習モデルの評価を様々な観点から行うことができる。
【0053】
なお、評価結果画面に示される評価結果の数は、2種以上であれば任意である。例えば、評価結果画面において、第1評価結果に含まれる学習モデルMの機能面の1つの評価結果と、第2評価結果に含まれる非機能面の1つの評価結果とが、2軸グラフ上で表されてもよい。また、例えば、評価結果画面において、第1評価結果に含まれる学習モデルMの機能面の1つの評価結果と、第2評価結果に含まれる非機能面の3つあるいは5つ以上の評価結果とが、レーダーチャートで表されてもよい。また、結果の表示のやり方は、グラフ表示、レーダーチャート表示に限定されず、複数の評価結果を比較可能に表示するものであれば任意である。以上により、本フローチャートの処理が完了する。
【0054】
以上のように構成された第1の実施形態の評価装置1によれば、複数の観点での学習モデルの評価を包括的に行うことが可能となる。
【0055】
(第2の実施形態)
次に、第2の実施形態について説明する。第1の実施形態と比較して、第2の実施形態の評価装置1は、評価対象として複数の学習モデルを取得し、これら複数の学習モデルに対する評価を行う点が異なる。このため、以下において、第1の実施形態との相違点を中心に説明し、第1の実施形態と共通する点については説明を省略する。第2の実施形態の説明において、第1の実施形態と同じ部分については同一符号を付して説明する。
【0056】
図9は、第2の実施形態に係る評価装置1による評価処理の流れの一例を示すフローチャートである。図9に示す処理は、例えば、評価装置1のユーザが、入力インターフェース30を操作して、評価処理の開始を指示した場合に開始される。
【0057】
まず、取得部101は、評価対象となる複数の学習モデルMおよび1つの評価データEDを取得する(ステップS201)。例えば、取得部101は、ネットワークNを介して、運用装置3から、複数の学習モデルMを取得する。これらの複数の学習モデルは、互いに異なる学習データを用いて生成されたモデル、或いは、互いに異なる学習方法で生成されたモデルである。また、取得部101は、入力インターフェース30を介して、学習モデルMを評価するための評価データを取得する。
【0058】
次に、第1評価部103は、複数の学習モデルMの各々の機能面の品質を評価して、第1評価結果ER1を生成し、記憶部50に記憶させる(ステップS203)。例えば、第1評価部103は、評価データEDを用いて、複数の学習モデルMの各々の出力結果の精度(正解率)を算出する。すなわち、第1評価部103は、複数の学習モデルの各々に評価データを入力することで得られる複数の出力データに基づいて、複数の学習モデルの各々の機能面の品質を評価する。
【0059】
次に、第2評価部105のデータ拡張部201は、評価データEDに変更を加えることで評価データEDを拡張し、拡張データを生成する(ステップS205)。例えば、データ拡張部201は、評価データEDの入力データに対して第1ノイズを付与し、第1拡張データを生成する。また、データ拡張部201は、評価データEDの入力データに対して第2ノイズを付与し、第2拡張データを生成する。
【0060】
次に、第2評価部105の第2指標値算出部203は、学習モデルMの各々の非機能面の品質を評価して、非機能指標値を算出する(ステップS207)。例えば、第2指標値算出部203は、第1ノイズに対する耐性を示す第1非機能指標値、および、第2ノイズに対する耐性を示す第2非機能指標値を算出する。
【0061】
次に、第2評価部105の変換部205は、第2指標値算出部203により算出された学習モデルMの各々の非機能指標値を、1軸の指標値に変換する(ステップS209)。すなわち、第2評価部105は、複数の学習モデルの各々に評価データを入力することで得られる複数の出力データに基づいて、複数の学習モデルの各々の非機能面の品質を評価する。
【0062】
次に、表示制御部107は、第1評価部103による第1評価結果ER1、第2評価部105による第2評価結果ER2などを含む評価結果画面を生成する(ステップS211)。次に、表示制御部107は、生成した評価結果画面を、表示装置40に表示させる(ステップS213)。
【0063】
図10は、第2の実施形態に係る評価結果画面の一例を示す図である、図10に示す評価結果画面P3においては、第1学習モデルM1、第2学習モデルM2、および第3学習モデルM3の3つの学習モデルの各々について、第1評価部103による第1評価結果ER1に含まれる学習モデルの精度と、第2評価部105による第2評価結果ER2に含まれる4つの非機能指標値に基づく4つの指標値と、を含む計5つの観点の評価結果がレーダーチャートで表されている。この評価結果画面P3においては、3つの評価モデルの各々の評価結果が重畳して表示されている。すなわち、表示制御部107は、複数の学習モデルの評価結果が重畳された評価結果画面を、表示装置40に表示させる。また、評価結果画面P3においては、評価結果の一部または全部の詳細を表示する領域AR1が設けられている。3つの学習モデルのうち、入力インターフェース30に含まれるマウスを介したユーザの操作に基づいて選択された学習モデル(例えば、複数の学習モデルのレーダーチャートのうちクリックされた学習モデル)の詳細が、領域AR1に表示されるようにしてもよい。評価装置1のユーザは、このような複数の評価結果を含む評価結果画面を確認することで、学習モデルの評価を様々な観点から行うことができる。以上により、本フローチャートの処理が完了する。
【0064】
また、図10に示す評価結果画面P3には、複数の学習モデルの中から、特定の1つの学習モデルを選択して、選択した学習モデルの再学習の実行を指示するための機能が含まれている。以下、この再学習の実行を指示するための処理について説明する。図11は、第2の実施形態に係る評価装置1による再学習の実行処理の流れの一例を示すフローチャートである。
【0065】
取得部101は、評価装置1のユーザによる入力インターフェース30を介した操作指示に基づいて、再学習の対象とする学習モデルの選択指示を受け付ける(ステップS301)。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3に表示された複数の学習モデルのレーダーチャートの何れか1つをクリック(押下)(矢印CL)することで、再学習の対象とする学習モデルを指示することができる。或いは、ユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3の領域AR2に表示されたモデルの選択ボタンをクリック(押下)することで、再学習の対象とする学習モデルを指示することができる。
【0066】
次に、取得部101は、評価装置1のユーザによる入力インターフェース30を介した操作指示に基づいて、指標の選択指示を受け付ける(ステップS303)。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3において指標値の各々と関連付けして表示されたラジオボタンRB0、RB1、RB3、およびRB4の何れかを選択することで、再学習時に高めたい指標を選択することができる。なお、この例では、第2非機能指標値については、その特性上、再学習により高めることが可能ではない指標値であるため、ラジオボタンが表示されていない。なお、ラジオボタンに限られず、例えば、評価結果画面P3において指標値の各々と関連付けしてチェックボックスを表示することで、学習により高めることを希望する指標値を複数個選択できるようにしてもよい。なお、複数個の指標値を選択できる場合であっても、同時に高めることができない指標の組み合あわせについては、選択不可能となるようにしてよい。例えば、データの被覆性に係る指標値と、データの均一性に係る指標値とは相反する指標であるため、この組み合あわせについては、選択不可能となるようにしてよい。
【0067】
次に、取得部101は、評価装置1のユーザによる入力インターフェース30を介した操作指示に基づいて、学習の実行指示を受け付ける(ステップS305)。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3に表示された「指定のモデルをベースに再学習」ボタンBT2をクリック(押下)することで、再学習の実行を指示することができる。学習方針決定部109は、上記のように受け付けた学習モデルの選択指示、指標の選択指示、および学習の実行指示に基づいて、学習方針を決定する。
【0068】
次に、指示出力部111は、学習方針決定部109により決定された学習方針に基づく学習の実行指示を、ネットワークNを介して、運用装置3に出力する(ステップS307)。運用装置3は、この学習処理の実行指示に基づいて、学習モデルMの再学習を実行する。
【0069】
すなわち、評価結果画面P3は、第1指標値および第2指標値のうち、少なくとも1つの指標値のユーザによる指定を受け付ける第1受付部を備える。評価結果画面P3に表示された選択可能な複数の学習モデルのレーダーチャート、領域AR2に表示されたモデルの選択ボタン、およびは、評価結果画面P3に表示された「指定のモデルをベースに再学習」ボタンBT2は、「第1受付部」の一例である。また、学習方針決定部109は、第1受付部により受け付けられた指標値の指定に基づいて、学習モデルの学習方針を決定する。また、指示出力部111は、決定された学習方針に基づく学習の実行指示を出力する。また、第1受付部は、学習処理により品質の向上が不可能な指標値についてはユーザによる指定を受け付けない。
【0070】
また、図10に示す評価結果画面P3には、複数の学習モデルの中から、特定の1つの学習モデルを選択して、選択された学習モデルを用いた運用の実行を指示するための機能が含まれている。以下、この運用の実行を指示するための処理について説明する。図12は、第2の実施形態に係る評価装置1による運用の実行処理の流れの一例を示すフローチャートである。
【0071】
取得部101は、評価装置1のユーザによる入力インターフェース30を介した操作指示に基づいて、運用に利用することを希望する学習モデルの選択指示を受け付ける(ステップS401)。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3に表示された複数の学習モデルのレーダーチャートの何れか1つをクリック(押下)(矢印CL)することで、運用に利用することを希望する学習モデルを指示することができる。或いは、ユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3の領域AR2に表示されたモデルの選択ボタンをクリック(押下)することで、運用に利用することを希望する学習モデルを指示してもよい。
【0072】
次に、指示出力部111は、取得部101により受け付けられた選択指示に基づく学習モデルを用いた運用の実行指示を、ネットワークNを介して、運用装置3に出力する(ステップS403)。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P3に表示された「指定のモデルを運用で使用する」ボタンBT1をクリック(押下)することで、運用の実行指示を行うことができる。運用装置3は、この運用の実行指示に基づいて、指定された学習モデルを用いた運用を開始する。
【0073】
すなわち、評価結果画面P3は、複数の学習モデルのうち、運用に利用する学習モデルのユーザによる指定を受け付ける第2受付部を備える。評価結果画面P3に表示された選択可能な複数の学習モデルのレーダーチャート、領域AR2に表示されたモデルの選択ボタン、評価結果画面P3に表示された「指定のモデルを運用で使用する」ボタンBT1は、「第2受付部」の一例である。指示出力部111は、第2受付部により受け付けられた学習モデルの指定に基づいて、指定された学習モデルを用いた運用の実行指示を出力する。
【0074】
以上のように構成された第2の実施形態の評価装置1によれば、複数の観点での学習モデルの評価を包括的に行うことが可能となる。また、複数の学習モデルの評価を比較可能に行うことが可能となる。さらに、学習モデルの再学習の実行指示や、指定された学習モデルを用いた運用の実行指示を可能とすることで、学習モデルの評価から、学習モデルの再学習或いは運用に利用する学習モデルの変更までを行うことが可能となり、ユーザの利便性をさらに向上させることが可能となる。
【0075】
(第3の実施形態)
次に、第3の実施形態について説明する。第1の実施形態と比較して、第3の実施形態の評価装置1は、学習時の評価データと、比較用の評価データとの2種類の評価データを用いて学習モデルに対する評価を行う点が異なる。このため、以下において、第1の実施形態との相違点を中心に説明し、第1の実施形態と共通する点については説明を省略する。第3の実施形態の説明において、第1の実施形態と同じ部分については同一符号を付して説明する。
【0076】
図13は、第3の実施形態に係る評価結果画面の一例を示す図である、図13に示す評価結果画面P4は、1つの学習モデルMと、学習時の評価データED1と、比較評価データED2と、を入力データとして用いることで生成される。学習時の評価データED1は、学習モデルMの生成時に使用された評価データである。比較評価データED2は、比較用に別途準備された、学習時の評価データED1とは異なるデータである。比較評価データED2は、例えば、運用装置3において運用が進むにつれて変化した事象が考慮されたデータである。比較評価データED2は、例えば、直近の運用処理において実際に利用された学習モデルMへの入力データなどである。
【0077】
図13に示す評価結果画面P4においては、学習モデルMについて、学習時の評価データED1を用いた評価結果と、比較評価データED2を用いた評価結果とがレーダーチャートで重畳して表示されている。また、評価結果画面P4においては、評価結果の一部または全部の詳細を表示する領域AR3が設けられている。この領域AR3には、各評価結果の時間遷移による状況が表示される。また、評価結果画面P4においては、領域AR3に表示させる評価結果の選択指示を受け付けるための領域AR4が設けられている。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P4の領域AR4に表示された評価データを選択するための選択ボタンをクリック(押下)することで、領域AR3に表示させる評価結果を選択することができる。或いは、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P4に表示された評価結果のレーダーチャートの何れか1つをクリック(押下)することで、領域AR3に表示させる評価結果を選択することできる。また、評価結果画面P4において、記憶部50に予め記憶された指標値ごとの閾値(基準線)を表示するようにしてもよい。評価装置1のユーザは、このような複数の評価結果を含む評価結果画面を確認することで、学習モデルの評価を様々な観点から行うことができる。
【0078】
すなわち、表示制御部107は、学習モデルの学習時に用いた第1評価データを用いた評価結果と、学習モデルの比較評価時に準備された第1評価データとは異なる第2評価データを用いた評価結果とを比較可能に表示する評価結果画面を、表示装置40に表示させる。
【0079】
また、図13に示す評価結果画面P4には、学習モデルMの再学習の実行を指示するための機能が含まれている。例えば、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P4において評価結果の各々と関連付けして表示されたラジオボタンRB0、RB1、RB3、およびRB4の何れかを選択することで、再学習時に高めたい指標を選択することができる。さらに、評価装置1のユーザは、入力インターフェース30に含まれるマウスを操作して、評価結果画面P4に表示された「モデルを再学習」ボタンBT3をクリック(押下)することで、再学習の実行を指示することができる。学習方針決定部109は、上記のように受け付けた指標の選択指示、および学習の実行指示に基づいて、学習方針を決定する。指示出力部111は、学習方針決定部109により決定された学習方針に基づく学習の実行指示を、ネットワークNを介して、運用装置3に出力する。運用装置3は、この学習処理の実行指示に基づいて、学習モデルMの再学習を実行する。また、評価結果画面P4において、再学習に利用する学習データの種類の選択指示を受け付ける構成を設けてもよい。
【0080】
また、通知部113は、第1評価部103による第1評価結果ER1、第2評価部105による第2評価結果ER2が再学習の必要と判定される所定の条件を満たした場合に、運用装置3の管理者などに再学習の必要性が生じたことを知らせる通知を行う。例えば、通知部113は、第1評価部103による第1評価結果ER1または第2評価部105による第2評価結果ER2に含まれる少なくとも一つの指標値と、記憶部50に予め記憶された閾値情報THとを比較することで、再学習の必要性の有無を判定する。通知部113は、例えば、電子メールなどにより、上記の通知を行う。すなわち、通知部113は、学習モデルの評価結果が所定の閾値を下回った場合に、学習モデルの再学習を促す通知を行う。
【0081】
以上のように構成された第3の実施形態の評価装置1によれば、複数の観点での学習モデルの評価を包括的に行うことが可能となる。また、例えば、学習時の評価データED1を用いた評価結果と、比較評価データED2とを用いて評価を行うことで、学習モデルの詳細な評価(性能低下の有無の評価など)を行うことが可能となる。
【0082】
なお、上記の実施形態においては、評価装置1が、表示制御機能(表示制御部107)を備える構成を例に挙げて説明したが、本発明はこれに限られない。例えば、評価装置1は、非機能面の評価を行う第2評価部105の機能のみが別体の装置として実現されたものであってもよい。
【0083】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0084】
1…評価装置、3…運用装置(学習装置)、10…制御部、20…通信装置、30…入力インターフェース、40…表示装置、50…記憶部、101…取得部、103…第1評価部、105…第2評価部、107…表示制御部、109…学習方針決定部、111…指示出力部、113…通知部、201…データ拡張部、203…第2指標値算出部、205…変換部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13