(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-12
(45)【発行日】2023-09-21
(54)【発明の名称】情報処理方法、および、情報処理システム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230913BHJP
G06T 7/00 20170101ALI20230913BHJP
【FI】
G06N20/00
G06T7/00 350C
(21)【出願番号】P 2021505506
(86)(22)【出願日】2019-11-25
(86)【国際出願番号】 JP2019045997
(87)【国際公開番号】W WO2020183807
(87)【国際公開日】2020-09-17
【審査請求日】2022-09-12
(32)【優先日】2019-03-14
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】P 2019164054
(32)【優先日】2019-09-09
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】514136668
【氏名又は名称】パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
【氏名又は名称原語表記】Panasonic Intellectual Property Corporation of America
(74)【代理人】
【識別番号】100109210
【氏名又は名称】新居 広守
(74)【代理人】
【識別番号】100137235
【氏名又は名称】寺谷 英作
(74)【代理人】
【識別番号】100131417
【氏名又は名称】道坂 伸一
(72)【発明者】
【氏名】デニス グドフスキー
(72)【発明者】
【氏名】アレック ホジキンソン
(72)【発明者】
【氏名】山口 拓也
(72)【発明者】
【氏名】築澤 宗太郎
【審査官】真木 健彦
(56)【参考文献】
【文献】特開2016-161823(JP,A)
【文献】中尾 尭理,AIを活用した映像解析ソリューション“kizkia”,三菱電機技報 第92巻 第8号 ,日本,三菱電機エンジニアリング株式会社,2018年08月20日,Vol.92 No.8 2018,P.2-6
【文献】今井 拓司,画像認識ディープニューラルネットの挙動を“デバッグ” 分類への寄与部を探すLIME技術、日立超LSIが活用,NIKKEI Robotics 第45号 ,日本,日経BP社,2019年03月10日,P.22-26
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06N 20/00
G06N 3/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータにより実行される情報処理方法であって、
第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得し、
前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、
前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出し、
前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する
情報処理方法。
【請求項2】
前記第1データは、前記推論器の誤推論データである
請求項1に記載の情報処理方法。
【請求項3】
前記第2データを追加すべきと決定された場合、前記第2データが追加された前記推論器の訓練データを用いて前記推論器を訓練する
請求項1又は2に記載の情報処理方法。
【請求項4】
前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、
複数の前記第2データのうち、前記第1寄与と前記第2寄与との類似度が高い前記第2データが、他の前記第2データより優先的に前記推論器の訓練データに追加されるように、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する
請求項1~3のいずれか1項に記載の情報処理方法。
【請求項5】
前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、
複数の前記第1データそれぞれについての前記第1寄与を含む複数の前記第1寄与を算出し、
算出した前記複数の前記第1寄与それぞれと前記第2寄与との類似度を含む複数の類似度を用いて算出される代表値にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する
請求項1~4のいずれか1項に記載の情報処理方法。
【請求項6】
前記複数の類似度は、前記複数の前記第1寄与それぞれと、複数の前記第2データそれぞれについての前記第2寄与を含む複数の前記第2寄与それぞれと、の類似度を含み、
前記代表値を算出する際には、
前記複数の前記第1データごとに、前記複数の類似度から所定数の類似度を選択し、
前記複数の第2データごとに、選択された前記所定数の類似度を用いて前記代表値を算出し、
前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、
算出した複数の前記代表値にしたがって、当該第2データを前記推論器の訓練データに追加すべきか否かを決定する
請求項5に記載の情報処理方法。
【請求項7】
前記推論器は、識別器又は検出器である
請求項1~6のいずれか1項に記載の情報処理方法。
【請求項8】
前記第1データおよび前記第2データは、センシングデータである
請求項1~7のいずれか1項に記載の情報処理方法。
【請求項9】
前記第1関連データは、前記第1出力データであり、
前記第2関連データは、前記第2出力データである
請求項1~8のいずれか1項に記載の情報処理方法。
【請求項10】
前記推論器の訓練データに追加すべきと決定された前記第2データを示す情報を提示装置を介して提示する
請求項1~9のいずれか1項に記載の情報処理方法。
【請求項11】
第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得する取得部と、
(a)前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、(b)前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出する、算出部と、
前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する決定部とを備える
情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、および、情報処理システムに関する。
【背景技術】
【0002】
機械学習を利用した画像の識別処理において、既存の学習画像に対して、画像特徴量の類似度が低い画像を訓練データに追加することで、画像の識別精度を向上させる技術がある(特許文献1参照)。
【0003】
なお、識別処理は、推論処理ともいわれる。推論処理には、識別処理のほか、検出処理も含まれる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1のような従来技術では、推論器によっては推論の性能があまり向上しないことがある。言い換えると、学習の効率がよくないという問題がある。
【0006】
そこで、本発明は、推論器による推論の性能を効率よく向上させることができる情報処理方法などを提供する。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出し、前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する。
【0008】
なお、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
【発明の効果】
【0009】
本発明の情報処理方法は、推論器による推論の性能を効率よく向上させることができる。
【図面の簡単な説明】
【0010】
【
図2】
図2は、モデルの生成のための機械学習による訓練に用いられる訓練データの例を示す説明図である。
【
図3】
図3は、認識器による認識の結果の例を示す説明図である。
【
図4】
図4は、実施の形態における処理システムの構成の第一例を示すブロック図である。
【
図5】
図5は、実施の形態における処理システムの構成の第二例を示すブロック図である。
【
図6】
図6は、実施の形態における算出部による寄与度の算出と、類似度の算出とを具体的に示す説明図である。
【
図7】
図7は、実施の形態における決定部による追加データの決定方法の第一例を示す説明図である。
【
図8】
図8は、実施の形態における決定部による追加データの決定方法の第二例を示す説明図である。
【
図9】
図9は、実施の形態における決定部による追加データの決定方法の第三例を示す説明図である。
【
図10】
図10は、実施の形態における処理システムが実行する処理の第一例を示すフロー図である。
【
図11】
図11は、実施の形態における処理システムが実行する処理の第二例を示すフロー図である。
【
図12】
図12は、実施の形態の変形例1における処理システムが実行する処理を示すフロー図である。
【
図13】
図13は、実施の形態の変形例2における処理システムが実行する処理を示すフロー図である。
【発明を実施するための形態】
【0011】
(本発明の基礎となった知見)
本発明者は、「背景技術」の欄において記載した、推論処理に関し、以下の問題が生じることを見出した。
【0012】
機械学習を利用した推論処理を実行する推論器の性能を向上させるには、訓練データの拡充が有効である。訓練データは、画像と、当該画像が示す情報であるラベルとを含む。訓練データの拡充には、一般に、推論器の訓練に用いられた訓練データに含まれていない新たなデータを追加した、新たな訓練データが用いられる。新たなデータを追加するには、既知の画像にラベルを付す作業が必要である。ラベルを付す作業は、例えば人手によりなされる。
【0013】
ここで、既知の画像は容易に用意され得るが、そのような既知の画像のうち、推論器による推論の性能の向上、又は、推論器の誤動作の修正に有効なデータがどれであるかを特定することは困難であるのが現状である。そのため、推論の性能の向上、又は、誤動作の修正のために、推論の性能の向上、又は、誤動作の修正に貢献する画像であるか否かに関わらず、新たなデータを大量に追加することが行われている。しかし、大量のデータを生成し追加するには、画像にラベルを付す作業などを大量に行う必要があり、工数又は時間の観点で効率がよくない。
【0014】
このように、現状、推論器による推論の性能を向上させる際の効率がよくないという問題がある。
【0015】
これに対し、上述したような従来技術では、画像特徴量の類似度が低い画像を訓練データとして選んでいる。
【0016】
しかし、画像特徴量の類似度が低くても、当該画像を用いて訓練される推論器にとって有効なデータであるとは限らない。そのため、推論器によっては推論の性能があまり向上しないことがある。言い換えると、依然として、学習の効率がよくないという問題がある。
【0017】
そこで、本発明は、推論器による推論の性能を効率よく向上させることができる情報処理方法などを提供する。
【0018】
このような問題を解決するために、本発明の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出し、前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する。
【0019】
上記態様によれば、第1データと類似した寄与を有する第2データを訓練データに追加すべきと決定する。寄与とは、推論器による推論の処理において、推論の結果に影響を与えたことを示している。そのため、当該推論器にとって、推論の結果に与える影響が第1データと類似している第2データを選出することができる。そして、選出された第2データを訓練データとして用いて当該推論器を訓練すれば、第1データおよび当該第1データと類似したデータに対して当該推論器が誤推論することが抑制されやすくなる。また、当該推論器にとって有効なデータが訓練データに追加されることにより、無作為に大量のデータを追加することを回避できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0020】
例えば、前記第1データは、前記推論器の誤推論データであってもよい。
【0021】
上記態様によれば、誤推論データと類似した寄与を有する第2データを訓練データに追加すべきと決定する。そして、この決定に基づいて上記第2データが追加された訓練データを用いて推論器を訓練すれば、誤推論したデータと類似したデータに対して再び誤推論することが抑制され得る。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0022】
例えば、前記第2データを追加すべきと決定された場合、前記第2データが追加された前記推論器の訓練データを用いて前記推論器を訓練してもよい。
【0023】
上記態様によれば、第2データを訓練データに追加すべきという決定に基づいて第2データが追加された訓練データによって推論器が訓練される。これにより、第1データと類似したデータに対して再び誤推論することが実際に抑制できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0024】
例えば、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、複数の前記第2データのうち、前記第1寄与と前記第2寄与との類似度が高い前記第2データが、他の前記第2データより優先的に前記推論器の訓練データに追加されるように、前記第2データを前記推論器の訓練データに追加すべきか否かを決定してもよい。
【0025】
上記態様によれば、予め用意された複数の第2データのうちから、第1データと寄与がより一層類似する第2データを選択して、訓練データに追加すべきという決定をすることができる。よって、上記態様によれば、推論器による推論の性能をより一層効率よく向上させることができる。
【0026】
例えば、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、複数の前記第1データそれぞれについての前記第1寄与を含む複数の前記第1寄与を算出し、算出した前記複数の前記第1寄与それぞれと前記第2寄与との類似度を含む複数の類似度を用いて算出される代表値にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定してもよい。
【0027】
上記態様によれば、複数の第1データがある場合には、複数の第1データそれぞれについて算出される複数の類似度から算出される代表値を用いて、訓練データに追加すべき第2データを決定する。複数の第1データがある場合、複数の類似度が算出されるが、どの第2データを訓練データに追加すべきであるかについて、複数の類似度を用いて決定することが難しい。そこで、複数の類似度から算出される代表値を用いることで、どの第2データを訓練データに追加すべきであるかを容易に決定することができる。よって、上記態様によれば、推論器による推論の性能をより容易に向上させることができる。
【0028】
例えば、前記複数の類似度は、前記複数の前記第1寄与それぞれと、複数の前記第2データそれぞれについての前記第2寄与を含む複数の前記第2寄与それぞれと、の類似度を含み、前記代表値を算出する際には、前記複数の前記第1データごとに、前記複数の類似度から所定数の類似度を選択し、前記複数の第2データごとに、選択された前記所定数の類似度を用いて前記代表値を算出し、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する際には、算出した複数の前記代表値にしたがって、当該第2データを前記推論器の訓練データに追加すべきか否かを決定してもよい。
【0029】
上記態様によれば、複数の第1データがある場合に、特定の第1データばかりに寄与が類似した第2データが訓練データに追加されると決定されることを抑制できる。複数の第1データがある場合に、特定の第1データばかりに寄与が類似した第2データが訓練データに追加されると決定されることがある。その場合、その特定の第1データに類似したデータに対して再び誤推論することが抑制できる一方、複数の第1データのうちその特定の第1データを除く第1データについては、再び誤推論することが抑制されないことになり、複数の第1データについて均等に誤推論を抑制することができない。上記態様によれば、複数の第1データについて均等に誤推論を抑制することができる。よって、上記態様によれば、複数の第1データについて均等に、推論器による推論の性能を効率よく向上させることができる。
【0030】
例えば、前記推論器は、識別器又は検出器であってもよい。
【0031】
上記態様によれば、識別器による識別処理における誤識別、又は、検出器による検出処理における誤検出を抑制できる。よって、上記態様によれば、識別器による識別の精度、又は、検出器による検出の精度を効率よく向上させることができる。
【0032】
例えば、前記第1データおよび前記第2データは、センシングデータであってもよい。
【0033】
上記態様によれば、センシングデータを対象とした推論の性能を効率よく向上させることができる。
【0034】
例えば、前記第1関連データは、前記第1出力データであり、前記第2関連データは、前記第2出力データであってもよい。
【0035】
上記態様によれば、第1関連データとして第1出力データを用いて、より容易に、推論器による推論の性能を効率よく向上させることができる。
【0036】
例えば、前記推論器の訓練データに追加すべきと決定された前記第2データを示す情報を提示装置を介して提示してもよい。
【0037】
上記態様によれば、訓練データに追加すべきと決定された第2データを示す情報が提示される。提示装置は、上記情報に基づいて第2データをユーザに提示し、第2データを示す情報についてのラベルの入力をユーザから受け付ける。このように入力されたラベルを用いて、訓練データへのデータの追加がなされる。よって、追加すべきデータのラベルをユーザから受け付けることに基づいて、推論器による推論の性能をより一層効率よく向上させることができる。
【0038】
また、本発明の一態様に係る情報処理システムは、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得する取得部と、(a)前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、(b)前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出する、算出部と、前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する決定部とを備える。
【0039】
上記態様によれば、上記情報処理方法と同様の効果を奏する。
【0040】
なお、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
【0041】
以下、実施の形態について、図面を参照しながら具体的に説明する。
【0042】
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0043】
(実施の形態)
本実施の形態において、推論器による推論の性能を効率よく向上させることができる情報処理システム、及び、情報処理方法などについて説明する。
【0044】
まず、
図1~
図3を参照しながら、認識器10の動作の概要を説明する。
【0045】
【0046】
図1に示されるように、認識器10は、入力データが入力されると、入力データに対する認識処理を実行し、その実行結果を出力データとして出力する装置である。入力データが画像である場合を例として説明するが、入力データは、画像のほかにも、音声又は文章を用いることもできる。入力データが画像である場合、認識処理は、入力データである画像に何が示されているかを認識する処理である。
【0047】
なお、認識器10は推論器の一例である。推論器の他の例は検出器である。検出器は、入力データが入力されると、入力データに対する検出処理を実行し、その実行結果を出力データとして出力する装置である。入力データが画像である場合、検出処理は、例えば、入力データである画像において、特定の被写体を検出する処理である。
【0048】
入力データは、認識器10による認識の対象となる画像データである。
【0049】
認識器10は、機械学習による訓練によって生成された認識モデルであり、認識処理の実行に用いられる。認識器10は、内部に複数のパラメータを有しており、適切なパラメータが設定されることにより、入力データに対して適切な出力データを出力するように訓練されて生成されたものである。認識器10は、例えば、ニューラルネットワークの数理モデルであり、より具体的には、SSD(Single Shot multibox Detector)、Faster-RCNN(Faster Region-based Convolutional Neural Network)、又は、YOLO(You Only Look Once)等のような物体検出方法に対応する認識モデルが用いられてもよい。
【0050】
出力データは、認識器10が出力するデータであって、認識器10による認識の結果を示す。出力データは、具体的には、入力データである画像に何が示されているかを示す。
【0051】
図2は、認識器10の生成のための機械学習による訓練に用いられる訓練データの例を示す説明図である。ここでは、認識器10が、0から9までの10個の数字が描かれた画像を入力データとして取得し、その画像に描かれた数字を認識して出力する場合を例として説明する。
【0052】
図2に示されるように、訓練データは、画像とラベルとの組を複数含む。
【0053】
訓練データに含まれる画像は、0から9までの10個の数字が描かれた画像である。訓練データには、1つの数字をさまざまなパターンで描いた画像が含まれており、例えば数千個~数万個の画像が含まれている。
【0054】
ラベルは、当該ラベルと組になっている画像につき1つ付されており、その画像に描かれた数字を示している。
【0055】
認識器10は、
図2に示される訓練データを用いた機械学習により生成される。具体的には、認識器10は、訓練データに含まれる画像が入力データとして入力された場合に、入力された画像と組になっているラベルの数値を出力するように、内部パラメータが調整されることにより生成されたものである。
【0056】
図3は、認識器10による認識の結果の例を示す説明図である。
図3には、認識器10に入力データを入力したときに出力される出力データの例が示されている。
【0057】
例えば、認識器10は、
図3に示される入力データ1(つまり「5」が描かれた画像)が入力された場合、出力データとして「5」を出力したことが示されている。また、認識器10は、
図3に示される入力データ2(つまり「1」が描かれた画像)が入力された場合、出力データとして「1」を出力したことが示されている。
【0058】
これらは、それぞれ、入力された画像に描かれた数字と同じ数字を認識器10が認識したことを示しており、認識器10が正しい認識をしたことを意味している。
【0059】
一方、例えば、認識器10は、
図3に示される入力データ3(つまり「4」が描かれた画像)が入力された場合、出力データとして「7」を出力したことが示されている。また、認識器10は、
図3に示される入力データ4(つまり「1」が描かれた画像)が入力された場合、出力データとして「9」を出力したことが示されている。
【0060】
これらは、それぞれ、入力された画像に描かれた数字と異なる数字を認識器10が認識したことを示しており、認識器10が誤認識をしたことを意味している。
【0061】
認識器10が誤認識をしたことが判明した場合、そのような誤認識を防ぐことが想定される。そのような誤認識を防ぐには、訓練データの拡充が有効である。訓練データの拡充には、認識器10の訓練に用いられた訓練データに含まれていない新たなデータを追加した、新たな訓練データを用いて、認識器10を生成することが行われる。
【0062】
しかし、追加すべき新たなデータを決定することは難しい。例えば、
図3に示される入力データ3(つまり「4」が描かれた画像)が入力された場合に、出力データとして「4」を出力するようにするには、「4」又は「7」が描かれた画像であって入力データ3とは異なる画像を含むデータを訓練データに追加するとよいとも考えられるが、具体的にどのような画像を追加するのが適切であるのかを特定することは難しい。
【0063】
本実施の形態の処理システムは、上記のように認識器10が誤認識をした場合に、その後、そのような誤認識を防ぐためにどのようなデータを訓練データに追加すべきかを適切に決定することによって、認識器10による認識の精度を効率よく向上させることができる情報処理システムである。
【0064】
以降において、本実施の形態における処理システムについて説明する。
【0065】
まず、本実施の形態における処理システムについて説明する。
【0066】
図4は、本実施の形態における処理システムの構成の第一例を示すブロック図である。
【0067】
図4に示されるように、処理システム20Aは、取得部51と、算出部52と、決定部53とを備える情報処理システムである。
【0068】
取得部51は、コンピュータによって、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得する。
【0069】
算出部52は、コンピュータによって、(a)機械学習を用いて訓練された推論器に第1データを入力して得られる第1関連データを用いて、推論器に第1データを入力して推論器から出力される第1出力データに対する第1データの各部分の寄与である第1寄与を算出し、(b)推論器に第2データを入力して得られる第2関連データを用いて、推論器に第2データを入力して推論器から出力される第2出力データに対する第2データの各部分の寄与である第2寄与を算出する。
【0070】
決定部53は、コンピュータによって、第1寄与と第2寄与との類似度にしたがって、第2データを推論器の訓練データに追加すべきか否かを決定する。
【0071】
次に、本実施の形態における処理システムについてより詳細に説明する。
【0072】
図5は、本実施の形態における処理システムの構成の第二例を示すブロック図である。
【0073】
図5に示されるように、処理システム20は、制御部21と、蓄積部22と、算出部23と、決定部24と、訓練部25とを備える。処理システム20は、認識器10に接続されており、認識器10にデータを入力したり、認識器10からデータを取得したりする。また、処理システム20は、管理装置30に接続されている。処理システム20は、例えば、コンピュータにより実現される。
【0074】
制御部21は、認識器10に入力データを入力し、また、認識器10が出力する出力データを取得する処理部である。
【0075】
具体的には、制御部21は、第1データと第2データとを少なくとも認識器10に提供することで、認識器10に入力する。ここで、第1データは、例えば、評価用データであって、認識器10に入力され、認識器10が誤認識したデータ(以下、誤認識データともいう)である。制御部21は、例えば以下のようにして誤認識データを得る。
【0076】
制御部21は、画像に描かれた数字が既知である画像(評価用画像ともいう)を入力データとして認識器10に入力して得られる出力データである数字と、上記入力データである画像に描かれた数字とを比較する。制御部21は、これらの数字が一致しない場合、上記入力データを、認識器10による誤認識がなされたデータ、つまり誤認識データとする。制御部21は、このようにして誤認識データを取得する。
【0077】
また、第2データは、認識器10の訓練(言い換えれば、認識器10の生成のために行われた訓練)に用いられた訓練データに含まれていないデータである。制御部21は、蓄積部22に蓄積されている画像を、第2データとして取得する。第2データは、後に訓練データに追加される候補であるので、候補データともいう。
【0078】
蓄積部22は、画像を蓄積している記憶装置である。蓄積部22に蓄積されている画像には、ラベルが付されていない。蓄積部22に蓄積されている画像は、制御部21により、第2データとして取得される。
【0079】
なお、第1データおよび第2データの具体例は、センシングデータであり、より具体的には、カメラによるセンシング(撮像)によって取得した画像データである。
【0080】
算出部23は、認識器10に入力データを入力して出力される出力データに対する、入力データの各部分の寄与を算出する処理部である。具体的には、算出部23は、認識器10に第1データを入力して得られる第1関連データを用いて、認識器10に第1データを入力して認識器10から出力される第1出力データに対する第1データの各部分の寄与である第1寄与を算出する。また、算出部23は、認識器10に第2データを入力して得られる第2関連データを用いて、認識器10に第2データを入力して認識器10から出力される第2出力データに対する第2データの各部分の寄与である第2寄与を算出する。
【0081】
ここで、第1データが画像である場合、「第1データの各部分」とは第1データを構成する各画素である。また、「第1出力データに対する第1データの各部分の寄与」とは、認識器10がその認識結果である数字を認識したことに対して、第1データを構成する各画素がどの程度寄与したかを示す量である。この量を数値化したものを、寄与した度合い、つまり寄与度ともいう。「第2データの各部分」および「第2出力データに対する第2データの各部分の寄与」についても同様である。
【0082】
なお、第1関連データ及び第2関連データの具体例は、第1出力データ及び第2出力データである。また、第1関連データ及び第2関連データは、第1データ及び第2データをそれぞれ推論器に入力した場合の推論器の中間層がそれぞれ出力したデータであってもよい。当該中間層は、最終層(言い換えると出力層)に近い層であってよい。
【0083】
決定部24は、算出部23が算出した第1寄与と第2寄与との類似度にしたがって、第2データを認識器10の訓練データに追加すべきか否かを決定する処理部である。決定部24は、第2データを訓練データに追加すべきと決定した場合には、第2データを示す情報を管理装置30に提供する。
【0084】
訓練部25は、認識器10を生成する処理部である。訓練部25は、訓練データ格納部26を有しており、訓練データ格納部26に格納された訓練データを用いた機械学習により認識器10を生成する。具体的には、認識器10は、訓練データ格納部26に格納された訓練データの画像が入力データとして入力された場合に、訓練データ上でその画像に付されたラベルの数値を出力データとして出力するように、内部パラメータを調整することによって生成される。
【0085】
また、訓練部25は、訓練データ格納部26に新たな訓練データ(追加データともいう)を追加する。訓練部25は、管理装置30から、追加データを追加する指示(追加指示ともいう)を受ける。追加指示には、第2データを特定する情報と、その第2データに描かれた数字であるラベルとが含まれている。訓練部25は、追加指示に含まれる情報に基づいて第2データを蓄積部22から取得し、取得した第2データと追加指示に含まれるラベルとを組にして、訓練データに追加する。訓練部25は、第2データを追加すべきという決定が決定部24によってなされた場合、新たな訓練データが追加された後に訓練データ格納部26に格納されている訓練データを用いて、認識器10を訓練する。
【0086】
管理装置30は、第2データを示す情報が決定部24から提供された場合、その情報をユーザUに提示する。ここで、管理装置30は提示装置に相当する。ユーザUは、提示された情報に基づいて、第2データに描かれている数字を判断し、判断した数字をラベルとして管理装置30に入力する。
【0087】
管理装置30は、第2データに含まれている数字を示すラベルをユーザUから受け付ける。管理装置30は、第2データを特定する情報と、ラベルとを含む追加指示を訓練部25に送信する。管理装置30がこのように送信した追加指示により、訓練部25による訓練データの生成がなされる。
【0088】
図6は、本実施の形態における算出部23による寄与度の算出と、類似度の算出とを具体的に示す説明図である。
【0089】
図6に示される画像31は、認識器10に入力される入力データの一例であり、例えば、認識器10が誤認識したデータである。すなわち、画像31は、「4」が描かれた画像であるが、認識器10は画像31を「4」と異なる数字である「7」と識別したものとする。
【0090】
算出部23は、画像31を認識器10に入力して得られる関連データを取得する。関連データは、認識器10の出力データである。算出部23は、関連データに基づいて寄与度35を算出する。寄与度35は、出力データに対する入力データの各部分の寄与の度合いである。例えば、寄与度35は、画像31を構成する画素ごとに、画像31が認識器10によって所定の数字と認識されるのに寄与した度合いである。なお、所定の数字は、認識器10が出力データとして出力した「7」であってもよいし、入力データに描かれた「4」であってもよい。寄与度35は、グレースケールで表現されている。白が最も寄与度が高い画素を示しており、黒が最も寄与度が低い画素を示しており、グレーは、白に近いほど、寄与度がより高い画素であることを示している。
【0091】
図6に示される画像32は、認識器10に入力される入力データの一例であり、蓄積部22に蓄積されているが、訓練データには含まれていない画像の一例である。画像32は、「4」が描かれた画像であるが、ラベルが付されていない。
【0092】
算出部23は、画像32を認識器10に入力して得られる関連データを取得し、また、関連データに基づいて寄与度36を算出する。関連データもまた、認識器10の出力データである。例えば、寄与度36は、画像32に含まれる画素ごとに、画像32が認識器10によって所定の数字と認識されるのに寄与した度合いである。なお、所定の数字は、上記のように認識器10に画像31が入力されて関連データが出力されたときに使用された所定の数字と同じである。
【0093】
算出部23は、寄与度35と寄与度36との類似度を算出する。類似度の算出は、公知の技術によりなされ、具体例として、固定次元のベクトルにプーリングしたうえで、内積又はコサイン距離を算出することでなされる。なお、算出部23は、類似度を所定の数値範囲で表現するように、適切な演算により数値範囲を変更してもよい。ここでは、類似度を1~10までの整数により10段階で表現するとする。類似度1は、類似度が最も低いことを意味し、類似度10は、類似度が最も高いことを意味することとする。
【0094】
図7は、本実施の形態における決定部24による追加データの決定方法の第一例を示す説明図である。
図7には、一例として、1つの誤認識データがある場合に、蓄積部22に含まれている複数の画像P、Q、R及びSのうちのどれを訓練データに追加すべきかを決定する方法が示されている。
【0095】
算出部23は、上記1つの誤認識データの寄与度と、蓄積部22に含まれている複数の候補データである画像P、Q、R及びSの寄与度それぞれとの類似度を算出する。ここでは、画像P、Q、R及びSについての寄与度の類似度が、それぞれ、6、7、5及び1となったとする(
図7の(a)参照)。
【0096】
決定部24は、候補データを訓練データに追加すべきか否かを決定するときに、蓄積部22に含まれる複数の候補データのうち、1つの誤認識データの寄与度と、当該候補データについての寄与度との類似度が高い候補データを、より優先的に訓練データに追加するように上記決定をする。
【0097】
例えば、決定部24は、寄与度の類似度が大きいデータから順に、優先度1、2、・・・を割り当てる。ここで優先度は、数値が小さいほど、より優先されることを意味している。具体的には、決定部24は、類似度が最大である7である画像Qの優先度を1とし、類似度が7の次に大きい6である画像Pの優先度を2とし、以下同様に、画像R及びSの優先度をそれぞれ3及び4とする。
【0098】
そして、決定部24は、類似度が高い画像から順に所定数個、つまり優先度が小さい画像から所定数個の画像を選択して訓練データに追加する。例えば、訓練データに追加する画像の個数が2である場合、決定部24は、優先度が1及び2である画像Q及びPが訓練データにされるように、画像P及びQについて訓練データに追加すべきと決定し、画像R及びSについて訓練データに追加すべきでないと決定する。
【0099】
なお、誤認識データが複数ある場合には、複数の誤認識データに基づいて、訓練データに追加すべき画像を決定する。このような場合の追加データの決定方法について、2つの例を以下で説明する。
【0100】
(1)すべての候補データの類似度を利用する例
図8は、本実施の形態における決定部24による追加データの決定方法の第二例を示す説明図である。
【0101】
図8には、一例として、3つの誤認識データA、B及びCがある場合に、蓄積部22に含まれている複数の候補データである画像P、Q、R及びSのうちのどれを訓練データに追加すべきかを決定する方法が示されている。
【0102】
算出部23は、上記3つの誤認識データA、B及びCの寄与度と、蓄積部22に含まれている複数の候補データである画像P、Q、R及びSそれぞれの寄与度との類似度を算出する。ここでは、誤認識データAの寄与度と、画像P、Q、R及びSそれぞれについての寄与度との類似度が6、7、5及び1となったとする。また、誤認識データBの寄与度と、画像P、Q、R及びSそれぞれについての寄与度との類似度が2、2、3及び4となったとする。また、誤認識データCの寄与度と、画像P、Q、R及びSそれぞれについての寄与度との類似度が1、3、1及び3となったとする(
図8参照)。
【0103】
決定部24は、複数の誤認識データそれぞれについての寄与度を含む複数の寄与度を算出し、算出した複数の寄与度それぞれと、候補データについての寄与度との類似度を含む複数の類似度から算出される代表値にしたがって、上記決定をする。
【0104】
例えば、複数の類似度の代表値は、複数の類似度のうちの最大値を用いることができる。
図8の例では、画像Pについての類似度の代表値は、誤認識データA、B及びCそれぞれの寄与度と、画像Pの寄与度との類似度である6、2及び1の最大値である6である。同様に、画像Q、R及びSについての類似度の代表値は、それぞれ、7、5及び4である。
【0105】
そして、決定部24は、類似度の代表値が高いデータから順に所定数個のデータを訓練データに追加すべきと決定する。訓練データに追加すべきデータを決定する処理については、誤認識データが1つである場合(
図7参照)と同様であるので、説明を省略する。
【0106】
なお、複数の類似度の代表値として、複数の類似度の平均値を用いることもできる。
【0107】
このようにして、誤認識データが複数ある場合に、すべての候補データの類似度を利用して、訓練データに追加すべき画像を決定することができる。
【0108】
(2)誤認識データごとに所定数個の候補データの類似度を利用する例
図9は、実施の形態における決定部24による追加データの決定方法の第三例を示す説明図である。
【0109】
図9には、
図8に示される類似度が算出された後、誤認識データごとに所定数個の候補データを利用する方法が示されている。
【0110】
ここで、複数の類似度は、複数の第1寄与それぞれと、複数の第2データそれぞれについての第2寄与を含む複数の第2寄与それぞれと、の類似度を含んでいる。
【0111】
そして、決定部24は、代表値を算出する際には、複数の第1データごとに、複数の類似度から所定数の類似度を選択し、複数の第2データごとに、選択された所定数の類似度を用いて代表値を算出する。そして、決定部24は、第2データを訓練データに追加すべきか否かを決定する際には、算出した複数の代表値にしたがって、当該第2データを訓練データに追加すべきか否かを決定する。
【0112】
例えば、所定数が2である場合、決定部24は、誤認識データA、B及びCについてそれぞれ2個の類似度を選択する。2個の類似度の選択の仕方は、例えば類似度が大きいデータをより優先的に選択する方法を採用することができ、この方法を説明するが、これに限られない。
【0113】
決定部24は、誤認識データAについて、比較的大きい2個の類似度として、類似度7(画像Qに相当)と、類似度6(画像Pに相当)とを選択する。ここで、選択されなかったデータである画像R及びSについては、類似度を考慮しないという意味で「N/A」と記載している(
図9参照)。
【0114】
同様に、決定部24は、誤認識データBについて、比較的大きい2個の類似度として、類似度4(画像Sに相当)と、類似度3(画像Rに相当)とを選択する。また、決定部24は、誤認識データCについて、比較的大きい2個の類似度として、類似度3(画像Qに相当)及び類似度3(画像Sに相当)を選択する。
【0115】
そして、決定部24は、上記のように決定した類似度を用いて類似度の代表値を算出する。具体的には、決定部24は、画像P、Q、R及びSについて、選択しなかったデータつまり「N/A」と記載されたデータを除外して類似度の代表値を、6、7、3及び4と算出する。
【0116】
そして、決定部24は、類似度の代表値が高いデータから順に所定数個のデータを選択して訓練データに追加する。訓練データに追加すべきデータを選択する処理については、誤認識データが1つである場合(
図7参照)と同様であるので、説明を省略する。
【0117】
このようにすることで、特定の誤認識データばかりに寄与度が類似した候補データが訓練データに追加されると決定されることを抑制できる。誤認識データと、蓄積部22に蓄積されている画像P、Q、R及びSとの類似度によっては、誤認識データA、B及びCのうち、誤認識データAばかりに寄与が類似した候補データが訓練データに追加されることがある(
図8参照)。その場合、誤認識データAに類似した画像に対して再び誤推論することが抑制できる一方、誤認識データB及びCに類似した画像については、再び誤推論することが抑制されない。そこで、上記のように選択しなかったデータを除外して類似度の代表値を算出することで、複数の誤認識データA、B及びCについて均等に誤推論を抑制することができる。
【0118】
以上のように構成された処理システムの処理の方法、つまり情報処理方法を説明する。
【0119】
図10は、本実施の形態における処理システムが実行する処理の第一例を示すフロー図である。
【0120】
図10に示される処理は、コンピュータにより実行される情報処理方法である。
【0121】
図10に示されるように、ステップS1において、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得する。
【0122】
ステップS2において、機械学習を用いて訓練された推論器に第1データを入力して得られる第1関連データを用いて、推論器に第1データを入力して推論器から出力される第1出力データに対する第1データの各部分の寄与である第1寄与を算出する。
【0123】
ステップS3において、推論器に第2データを入力して得られる第2関連データを用いて、推論器に第2データを入力して推論器から出力される第2出力データに対する第2データの各部分の寄与である第2寄与を算出する。
【0124】
ステップS4において、第1寄与と第2寄与との類似度にしたがって、第2データを推論器の訓練データに追加すべきか否かを決定する。
【0125】
図11は、本実施の形態における処理システムが実行する処理を示すフロー図である。
【0126】
ステップS101において、制御部21は、評価用データを取得し、取得した評価用データを入力データとして認識器10に入力し、出力データを取得する。また、算出部23は、上記入力データを認識器10に入力して得られる関連データを取得する。
【0127】
ステップS102において、制御部21は、ステップS101で取得した出力データと、評価用データに付されているラベルとが一致するか否かを判定し、一致していないと判定した場合に、ステップS101で認識器10に入力した評価用データを誤認識データとして選別する。
【0128】
ステップS103において、算出部23は、ステップS102で選別した誤認識データについて、ステップS101で取得した関連データを用いて、ステップS101で取得した出力データに対する入力データの各部分の寄与度を算出する。
【0129】
ステップS104において、制御部21は、蓄積部22に蓄積されているデータを候補データとして取得し、取得した候補データを入力データとして認識器10に入力し、出力データを取得する。また、算出部23は、上記入力データを認識器10に入力して得られる関連データを取得する。
【0130】
ステップS105において、算出部23は、ステップS104で認識器10に入力した候補データについて、ステップS104で取得した関連データを用いて、ステップS104で取得した出力データに対する入力データの各部分の寄与度を算出する。
【0131】
ステップS106において、算出部23は、ステップS103で算出した寄与度と、ステップS104で算出した寄与度との類似度を算出する。
【0132】
ステップS107において、決定部24は、候補データのうち、誤認識データの寄与度との類似度が高いデータを追加データとして決定する。決定部24は、決定した追加データを特定する情報を管理装置30に送信し、ユーザUに提示する。ユーザUは、追加データを参照し、追加データに付すラベルを管理装置30に入力する。管理装置30は、入力されたラベルを訓練部25に、通信回線を通じて送信するなどして提供する。
【0133】
ステップS108において、訓練部25は、追加データに付すラベルを管理装置30から、通信回線を通じて受信するなどして取得する。
【0134】
ステップS109において、訓練部25は、ラベルを付した追加データを訓練データに追加する。
【0135】
ステップS110において、訓練部25は、ステップS109で追加データを追加した訓練データを用いて機械学習によって認識器10を生成する。ステップS110を終えたら、
図11に示される一連の処理を終了する。
【0136】
以上の処理によって、処理システムは、認識器10による認識の精度を効率よく向上させることができる。
【0137】
(変形例1)
本変形例では、推論器による推論の性能を効率よく向上させることができる情報処理方法について、認識器10の性能を所定以上に向上させることができる技術を説明する。
【0138】
本変形例に係る処理システムの構成は、実施の形態における処理システム20の構成と同じである(
図5参照)。
【0139】
本変形例に係る処理システムが実行する処理について、実施の形態における処理システム20におけるものと異なる部分について説明する。なお、本変形例に係る処理システムが実行する処理のうち、実施の形態における処理システム20における処理(
図11参照)と同じ処理については、同じ符号を付し、詳細な説明を省略する。
【0140】
図12は、本変形例における処理システムが実行する処理を示すフロー図である。
【0141】
図12に示されるステップS101~ステップS110は、
図11に示される処理と同じである。
【0142】
ステップS111において、制御部21は、ステップS110で生成された認識器10の性能の評価を行う。性能の評価では、制御部21は、評価用データを入力データとして認識器10に入力し、出力データを取得する。そして、評価用データに予め付されているラベルと出力データとが一致する割合を性能値として算出する。例えば、評価用データの個数が100であり、100のうち95の評価用データについてラベルと出力データとが一致し、100のうち5の評価データについてラベルと出力データとが一致しない場合、性能値として「95%」と算出する。
【0143】
ステップS112において、制御部21は、ステップS111で評価された性能が所定以上であるか否かを判定する。具体的には、制御部21は、ステップS111で算出した性能値と所定値(例えば90%)との大小比較をし、性能値が所定値以上であると判定した場合に、性能が所定以上であると判定する。認識器10の性能が所定以上であると判定した場合(ステップS112でYes)には、
図12に示された一連の処理を終了し、そうでない場合(ステップS112でNo)には、ステップS101を再び実行する。
【0144】
このようにすることで、認識器10の性能が所定以上になるまで訓練データを追加し、認識器10の性能を所定以上に向上させることができる。
【0145】
なお、ステップS112において性能値が所定以上でないと判定されることが所定回数以上続いた場合には、ステップS101を実行せずに処理を中止してもよい。その場合、処理を中止したことを示すエラーメッセージを提示してもよい。
【0146】
以上の一連の処理により、処理システムは、認識器による認識の精度を効率よく向上させる際に、認識器の性能を所定以上に向上させることができる。
【0147】
(変形例2)
本変形例では、推論器による推論の性能を効率よく向上させることができる情報処理方法について、推論の性能の向上を繰り返し実行する技術を説明する。
【0148】
図13は、本変形例における処理システムが実行する処理を示すフロー図である。
【0149】
本変形例に係る処理システムの構成は、実施の形態における処理システム20の構成と同じである(
図5参照)。
【0150】
本変形例に係る処理システムが実行する処理について、実施の形態における処理システム20におけるものと異なる部分について説明する。なお、本変形例に係る処理システムが実行する処理のうち、実施の形態における処理システム20における処理(
図11参照)と同じ処理については、同じ符号を付し、詳細な説明を省略する。
【0151】
図13は、本変形例における処理システムが実行する処理を示すフロー図である。
【0152】
ここで、蓄積部22には、繰り返し新たな画像が蓄積される前提である。例えば、蓄積部22は、車載カメラによる数分おきのセンシングにより得られた画像が、通信回線を経由して蓄積されるとする。
【0153】
ステップS121において、制御部21は、蓄積部22に所定数以上のデータが蓄積されているか否かを判定する。蓄積されていると判定した場合(ステップS121でYes)には、ステップS122を実行し、そうでない場合(ステップS121でNo)には、ステップS121を再び実行する。すなわち、制御部21は、蓄積部22に所定数以上のデータが蓄積されるまでステップS121で待機する。なお、所定数は例えば1000程度とする。
【0154】
図13に示されるステップS101~ステップS110は、
図11に示される処理と同じである。
【0155】
ステップS122において、制御部21は、蓄積部22に蓄積されているデータを消去する。
【0156】
ステップS122を終えたら、制御部21は再びステップS121を実行する。このようにすることで、処理システム20は、蓄積部22に他の手段によりデータが蓄積されていく状況において、所定数以上のデータが蓄積部22に蓄積されるごとに、ステップS101~S110の処理によって追加データを訓練データに追加する。
【0157】
以上の一連の処理により、処理システムは、認識器による認識の精度を効率よく向上させる際に、認識の精度を繰り返し向上させることができる。
【0158】
以上のように、実施の形態及び各変形例に示される情報処理方法は、第1データと類似した寄与を有する第2データを訓練データに追加すべきと決定する。寄与とは、推論器による推論の処理において、推論の結果に影響を与えたことを示している。そのため、当該推論器にとって、推論の結果に与える影響が第1データと類似している第2データを選出することができる。そして、選出された第2データを訓練データとして用いて当該推論器を訓練すれば、第1データおよび当該第1データと類似したデータに対して当該推論器が誤推論することが抑制されやすくなる。また、当該推論器にとって有効なデータが訓練データに追加されることにより、無作為に大量のデータを追加することを回避できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0159】
また、誤推論データと類似した寄与を有する第2データを訓練データに追加すべきと決定する。そして、この決定に基づいて上記第2データが追加された訓練データを用いて推論器を訓練すれば、誤推論したデータと類似したデータに対して再び誤推論することが抑制され得る。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0160】
また、第2データを訓練データに追加すべきという決定に基づいて第2データが追加された訓練データによって推論器が訓練される。これにより、第1データと類似したデータに対して再び誤推論することが実際に抑制できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。
【0161】
また、予め用意された複数の第2データのうちから、第1データと寄与がより一層類似する第2データを選択して、訓練データに追加すべきという決定をすることができる。よって、上記態様によれば、推論器による推論の性能をより一層効率よく向上させることができる。
【0162】
また、複数の第1データがある場合には、複数の第1データそれぞれについて算出される複数の類似度から算出される代表値を用いて、訓練データに追加すべき第2データを決定する。複数の第1データがある場合、複数の類似度が算出されるが、どの第2データを訓練データに追加すべきであるかについて、複数の類似度を用いて決定することが難しい。そこで、複数の類似度から算出される代表値を用いることで、どの第2データを訓練データに追加すべきであるかを容易に決定することができる。よって、上記態様によれば、推論器による推論の性能をより容易に向上させることができる。
【0163】
また、複数の第1データがある場合に、特定の第1データばかりに寄与が類似した第2データが訓練データに追加されると決定されることを抑制できる。複数の第1データがある場合に、特定の第1データばかりに寄与が類似した第2データが訓練データに追加されると決定されることがある。その場合、その特定の第1データに類似したデータに対して再び誤推論することが抑制できる一方、複数の第1データのうちその特定の第1データを除く第1データについては、再び誤推論することが抑制されないことになり、複数の第1データについて均等に誤推論を抑制することができない。上記態様によれば、複数の第1データについて均等に誤推論を抑制することができる。よって、上記態様によれば、複数の第1データについて均等に、推論器による推論の性能を効率よく向上させることができる。
【0164】
また、識別器による識別処理における誤識別、又は、検出器による検出処理における誤検出を抑制できる。よって、上記態様によれば、識別器による識別の精度、又は、検出器による検出の精度を効率よく向上させることができる。
【0165】
また、センシングデータを対象とした推論の性能を効率よく向上させることができる。
【0166】
また、第1関連データとして第1出力データを用いて、より容易に、推論器による推論の性能を効率よく向上させることができる。
【0167】
また、訓練データに追加すべきと決定された第2データを示す情報が提示される。提示装置は、上記情報に基づいて第2データをユーザに提示し、第2データを示す情報についてのラベルの入力をユーザから受け付ける。このように入力されたラベルを用いて、訓練データへのデータの追加がなされる。よって、追加すべきデータのラベルをユーザから受け付けることに基づいて、推論器による推論の性能をより一層効率よく向上させることができる。
【0168】
なお、上記実施の形態及び各変形例において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記実施の形態及び各変形例の処理システムなどを実現するソフトウェアは、次のようなプログラムである。
【0169】
すなわち、このプログラムは、コンピュータに、コンピュータにより実行される情報処理方法であって、第1データと、推論器の訓練に用いられた訓練データに含まれていない第2データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第1データを入力して得られる第1関連データを用いて、前記推論器に前記第1データを入力して前記推論器から出力される第1出力データに対する前記第1データの各部分の寄与である第1寄与を算出し、前記推論器に前記第2データを入力して得られる第2関連データを用いて、前記推論器に前記第2データを入力して前記推論器から出力される第2出力データに対する前記第2データの各部分の寄与である第2寄与を算出し、前記第1寄与と前記第2寄与との類似度にしたがって、前記第2データを前記推論器の訓練データに追加すべきか否かを決定する情報処理方法を実行させるプログラムである。
【0170】
以上、一つまたは複数の態様に係る処理システムなどについて、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。
【産業上の利用可能性】
【0171】
本発明は、推論器による推論の性能を効率よく向上させる処理システムに利用可能である。
【符号の説明】
【0172】
10 認識器
20、20A 処理システム
21 制御部
22 蓄積部
23、52 算出部
24、53 決定部
25 訓練部
26 訓練データ格納部
30 管理装置
31、32、P、Q、R、S 画像
35、36 寄与度
51 取得部
A、B、C 誤認識データ
U ユーザ