(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-10
(45)【発行日】2023-10-18
(54)【発明の名称】解析装置、解析プログラム及び解析方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20231011BHJP
【FI】
G06T7/00 350C
(21)【出願番号】P 2019200866
(22)【出願日】2019-11-05
【審査請求日】2022-07-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】久保田 智規
(72)【発明者】
【氏名】中尾 鷹詔
(72)【発明者】
【氏名】村田 康之
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2009-223414(JP,A)
【文献】特開2013-131077(JP,A)
【文献】久保田智規他,CNNを用いた物体認識における誤認識の原因を可視化する一手法,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM) 2019-CVIM-218 [online] ,日本,情報処理学会,2019年08月28日,pp.99-104
【文献】Ramprasaath R. SELVARAJU et al.,Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization,2017 IEEE International Conference on Computer Vision(ICCV),IEEE,2017年10月,pp.618-626,DOI: 10.1109/ICCV.2017.74
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 3/00 - 3/60
G06T 5/00 - 5/50
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
CSDB(日本国特許庁)
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成する注目度合いマップ生成部と、
前記誤推論画像と前記リファイン画像と
の差分に基づいて演算される差分画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、を乗算することで得られる乗算画像を、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する可視化部と
を有する解析装置。
【請求項2】
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示すマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップとを、重畳することで、正解ラベルを推論するための各画素の重要度を示す重要特徴指標マップを生成する重要特徴指標マップ生成部と、
前記重要特徴指標マップの画素値をピクセルの集合単位で加算し、加算値が所定の条件を満たすピクセルの集合を抽出する抽出部と、
抽出されたピクセルの集合を、前記注目度合いマップの所定レベルの領域に絞り込む絞り込み部と
を有する、請求項
1に記載の解析装置。
【請求項3】
前記可視化部は、
前記差分画像から、前記注目度合いマップの
前記所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
前記SSIM画像から、前記注目度合いマップの
前記所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップから、前記注目度合いマップの所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
を乗算することで得られる乗算画像を、画素単位で強度調整処理する、請求項
2に記載の解析装置。
【請求項4】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成し、
前記誤推論画像と前記リファイン画像と
の差分に基づいて演算される差分画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、を乗算することで得られる乗算画像を、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する、
処理をコンピュータに実行させるための解析プログラム。
【請求項5】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成し、
前記誤推論画像と前記リファイン画像と
の差分に基づいて演算される差分画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、を乗算することで得られる乗算画像を、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する、
処理をコンピュータが実行する解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、解析装置、解析プログラム及び解析方法に関する。
【背景技術】
【0002】
近年、CNN(Convolutional Neural Network)を用いた画像認識処理において、誤ったラベルが推論された場合の誤推論の原因を解析する解析技術が提案されている。一例として、スコア最大化法(Activation Maximization)が挙げられる。また、画像認識処理において推論時に注目される画像箇所を解析する解析技術が提案されている。一例として、Grad-CAM法、BP(Back Propagation)法、GBP(Guided Back Propagation)法等が挙げられる。
【0003】
スコア最大化法は、推論の正解ラベルが最大スコアとなるように入力画像を変更した際の変更部分を、誤推論の原因となる画像箇所として特定する方法である。また、Grad-CAM法は、推論したラベルから逆伝播した情報を用いて推論の際の注目部分を算出し、ヒートマップにより可視化する方法である。更に、BP法、GBP法は、推論したラベルから逆伝播し、入力画像までたどることで、推論の際に反応した特徴部分を可視化する方法である。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-097807号公報
【文献】特開2018-045350号公報
【文献】Ramprasaath R. Selvariju, et al.: Grad-cam: Visual explanations from deep networks via gradient-based localization. The IEEE International Conference on Computer Vision (ICCV), pp. 618-626, 2017.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した解析技術の場合、いずれも誤推論の原因となる画像箇所を十分な精度で特定することができないという問題がある。
【0006】
一つの側面では、誤推論の原因となる画像箇所を特定する際の精度を向上させることを目的としている。
【課題を解決するための手段】
【0007】
一態様によれば、解析装置は、
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成する注目度合いマップ生成部と、
前記誤推論画像と前記リファイン画像との差分に基づいて演算される差分画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、を乗算することで得られる乗算画像を、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する可視化部とを有する。
【発明の効果】
【0008】
誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図2】解析装置のハードウェア構成の一例を示す図である。
【
図3】誤推論原因抽出部の機能構成の一例を示す第1の図である。
【
図4】画像リファイナ部の処理の具体例を示す図である。
【
図6】リファイン画像に含まれるオブジェクトの位置及び大きさの算出方法の一例を示す図である。
【
図7】リファイン画像に含まれるオブジェクトの存在確率の一例を示す図である。
【
図8】リファイン画像に含まれるオブジェクトのIoUの算出方法の一例を示す図である。
【
図10】注目度合いマップ生成部の処理の具体例を示す図である。
【
図11】詳細原因解析部の機能構成の一例を示す第1の図である。
【
図12】詳細原因解析部の処理の具体例を示す第1の図である。
【
図13】誤推論原因抽出処理の流れを示す第1のフローチャートである。
【
図14】スコア最大化リファイン画像生成処理の流れを示すフローチャートである。
【
図15】詳細原因解析処理の流れを示す第1のフローチャートである。
【
図16】誤推論原因抽出処理の具体例を示す第1の図である。
【
図17】誤推論原因抽出部の機能構成の一例を示す第2の図である。
【
図18】重要特徴指標マップ生成部の処理の具体例を示す図である。
【
図19】選択的BP法を用いた重要特徴マップの生成方法の一例を示す図である。
【
図20】スーパーピクセル分割部の処理の具体例を示す図である。
【
図21】重要スーパーピクセル決定部の処理の具体例を示す図である。
【
図22】絞り込み部の処理の具体例を示す図である。
【
図23】詳細原因解析部の機能構成の一例を示す第2の図である。
【
図24】詳細原因解析部の処理の具体例を示す第2の図である。
【
図25】誤推論原因抽出処理の流れを示す第2のフローチャートである。
【
図26】オブジェクト単位絞り込み重要スーパーピクセル抽出処理の流れを示すフローチャートである。
【
図27】詳細原因解析処理の流れを示す第2のフローチャートである。
【
図28】誤推論原因抽出処理の具体例を示す第2の図である。
【
図29】絞り込み部の処理の詳細を示す第1の図である。
【
図30】絞り込み部の処理の詳細を示す第2の図である。
【発明を実施するための形態】
【0010】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
[第1の実施形態]
<解析装置の機能構成>
はじめに、第1の実施形態に係る解析装置の機能構成について説明する。
図1は、解析装置の機能構成の一例を示す図である。解析装置100には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置100は、推論部110、誤推論画像抽出部120、誤推論原因抽出部140として機能する。
【0012】
推論部110は、学習済みのCNNを用いて画像認識処理を行う。具体的には、推論部110は、入力画像10が入力されることで、入力画像10に含まれるオブジェクト(推論対象)の種類(本実施形態では、車両の種類)を示すラベルを推論し、推論したラベルを出力する。
【0013】
誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの種類を示すラベル(正解ラベル)と、推論部110により推論されたラベルとが一致するか否かを判定する。また、誤推論画像抽出部120は、一致しないと判定した(誤ったラベルが推論された)入力画像を、"誤推論画像"として抽出し、誤推論画像格納部130に格納する。
【0014】
あるいは、誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの正解位置と、推論部110により推論されたオブジェクトの位置とが一致するか否かを判定する。また、誤推論画像抽出部120は、オブジェクトの正解位置と、推論されたオブジェクトの位置とがずれていると判定された入力画像、または、オブジェクトの位置が推論されなかった入力画像を、"誤推論画像"として抽出し、誤推論画像格納部130に格納する。なお、オブジェクトの正解位置は、例えば、入力画像10に教師情報として付加されていてもよいし、正しく推論できる状態で推論することで取得してもよい。あるいは、他の手段を用いてオブジェクトの正解位置を特定してもよい。
【0015】
誤推論原因抽出部140は、誤推論画像について、誤推論の原因となる画像箇所を特定し、作用結果画像を出力する。具体的には、誤推論原因抽出部140は、リファイン画像生成部141と、注目度合いマップ生成部142と、詳細原因解析部143とを有する。
【0016】
リファイン画像生成部141は画像生成部の一例である。リファイン画像生成部141は、誤推論画像格納部130に格納された誤推論画像を読み出す。また、リファイン画像生成部141は、読み出した誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
【0017】
注目度合いマップ生成部142は、誤推論の原因を解析する既知の解析技術等を用いて、推論時に注目した注目度合いが同レベルとなる画素の領域を示すヒートマップ(以下、注目度合いマップと称す)を生成する。
【0018】
詳細原因解析部143は可視化部の一例であり、誤推論画像とリファイン画像とに基づいて演算される画像のうち、注目度合いマップ生成部142により生成された注目度合いマップの所定レベルの領域に対応する画像を切り出して画素単位で強度調整処理する。これにより、詳細原因解析部143では、誤推論の原因となる画像箇所を可視化した作用結果画像を出力する。
【0019】
このように、誤推論画像とリファイン画像とに基づいて演算される画像のうち、注目度合いマップの所定レベルの領域について、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を精度よく特定することができる。
【0020】
<解析装置のハードウェア構成>
次に、解析装置100のハードウェア構成について説明する。
図2は、解析装置のハードウェア構成の一例を示す図である。
図2に示すように、解析装置100は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
【0021】
また、解析装置100は、補助記憶装置204、表示装置205、操作装置206、I/F(Interface)装置207、ドライブ装置208を有する。なお、解析装置100の各ハードウェアは、バス209を介して相互に接続されている。
【0022】
CPU201は、補助記憶装置204にインストールされている各種プログラム(例えば、解析プログラム等)を実行する演算デバイスである。なお、
図2には示していないが、演算デバイスとしてアクセラレータ(例えば、GPU(Graphics Processing Unit)など)を組み合わせてもよい。
【0023】
ROM202は、不揮発性メモリである。ROM202は、補助記憶装置204にインストールされている各種プログラムをCPU201が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM202はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
【0024】
RAM203は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM203は、補助記憶装置204にインストールされている各種プログラムがCPU201によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
【0025】
補助記憶装置204は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。例えば、誤推論画像格納部130は、補助記憶装置204において実現される。
【0026】
表示装置205は、誤推論原因情報等を含む各種表示画面を表示する表示デバイスである。操作装置206は、解析装置100のユーザが解析装置100に対して各種指示を入力するための入力デバイスである。
【0027】
I/F装置207は、例えば、不図示のネットワークと接続するための通信デバイスである。
【0028】
ドライブ装置208は記録媒体210をセットするためのデバイスである。ここでいう記録媒体210には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体210には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0029】
なお、補助記憶装置204にインストールされる各種プログラムは、例えば、配布された記録媒体210がドライブ装置208にセットされ、該記録媒体210に記録された各種プログラムがドライブ装置208により読み出されることでインストールされる。あるいは、補助記憶装置204にインストールされる各種プログラムは、不図示のネットワークよりダウンロードされることでインストールされてもよい。
【0030】
<誤推論原因抽出部の機能構成>
次に、第1の実施形態に係る解析装置100において実現される機能のうち、誤推論原因抽出部140の機能構成の詳細について説明する。
図3は、誤推論原因抽出部の機能構成の一例を示す図である。以下、誤推論原因抽出部140の各部(ここでは、リファイン画像生成部141、注目度合いマップ生成部142)の詳細について説明する。
【0031】
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部141の詳細について説明する。
図3に示すように、リファイン画像生成部141は、画像リファイナ部301、画像誤差演算部302、推論部303、誤差演算部304を有する。
【0032】
画像リファイナ部301は、例えば、画像の生成モデルとしてCNNを用いて、誤推論画像からリファイン画像を生成する。
【0033】
なお、画像リファイナ部301では、生成したリファイン画像を用いて推論した際に、正解ラベルのスコアが最大となるように、誤推論画像を変更する。また、画像リファイナ部301では、画像の生成モデルを用いてリファイン画像を生成するにあたり、例えば、誤推論画像に含まれるオブジェクトに関する情報が、オブジェクトに関する正解情報に近づくように、リファイン画像を生成する。更に、画像リファイナ部301では、画像の生成モデルを用いてリファイン画像を生成するにあたり、例えば、誤推論画像からの変更量(リファイン画像と誤推論画像との差分)が小さくなるように、リファイン画像を生成する。
【0034】
より具体的には、画像リファイナ部301では、
・生成したリファイン画像を用いて推論した際のスコアと、正解ラベルのスコアを最大にしたスコアとの誤差であるスコア誤差と、
・生成したリファイン画像を用いてラベルを推論した際のオブジェクト(推論対象)に関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差と、
・生成したリファイン画像と誤推論画像との差分である画像差分値(例えば、画像差分(L1差分)やSSIM(Structural Similarity)やそれらの組み合わせ)と、
が最小化するようにCNNの学習を行う。
【0035】
画像誤差演算部302は、誤推論画像と、学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。画像誤差演算部302では、例えば、画素ごとの差分(L1差分)演算やSSIM(Structural Similarity)演算を行うことにより、画像差分値を算出し、画像リファイナ部301に入力する。
【0036】
推論部303は、学習済みのCNNを用いて画像認識処理を行う。推論部303が有する学習済みのCNNは、画像リファイナ部301により生成されたリファイン画像(またはスコア最大化リファイン画像)を入力してラベルを推論し、スコアを出力する。
【0037】
また、推論部303は、リファイン画像を入力してラベルを推論する際、リファイン画像に含まれるオブジェクトに関する情報を算出し、スコアとともに、誤差演算部304に通知する。
【0038】
誤差演算部304は、推論部303より通知されたスコアと、正解ラベルのスコアを最大にしたスコアとの誤差であるスコア誤差を算出し、画像リファイナ部301に通知する。また、誤差演算部304は、推論部303より通知されたオブジェクトに関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差を算出し、画像リファイナ部301に通知する。
【0039】
誤差演算部304により通知されたスコア誤差及びオブジェクト誤差は、画像誤差演算部302により通知された画像差分値とともに、画像リファイナ部301において、CNNの学習に用いられる。
【0040】
なお、画像リファイナ部301が有するCNNの学習中に画像リファイナ部301から出力されるリファイン画像は、リファイン画像格納部305に格納される。画像リファイナ部301が有するCNNの学習は、
・予め定められた学習回数分(例えば、最大学習回数=N回分)、あるいは、
・正解ラベルのスコアが所定の閾値を超えるまで、あるいは、
・正解ラベルのスコアが所定の閾値を超え、かつ、画像差分値が所定の閾値より小さくなるまで、あるいは、
・オブジェクト誤差が所定の閾値より小さくなるまで、
行われる。これにより、推論部303より出力される正解ラベルのスコアが最大化した際のリファイン画像であるスコア最大化リファイン画像が、リファイン画像格納部305に格納される。
【0041】
(2)注目度合いマップ生成部の詳細
次に、注目度合いマップ生成部142の詳細について説明する。
図3に示すように、注目度合いマップ生成部142は、注目領域導出部311を有する。
【0042】
注目領域導出部311は、推論部303がスコア最大化リファイン画像を用いて正解ラベルを推論した際の、推論部構造情報(CNNのネットワークの構造、モデルパラメータ等)と特徴マップとを、推論部303より取得する。
【0043】
また、注目領域導出部311は、Grad-CAM法を用いることで、推論部構造情報及び特徴マップに基づいて、誤推論画像上の各画素の注目度合いを算出し、注目度合いマップを生成する。
【0044】
具体的には、注目領域導出部311は、推論部構造情報と特徴マップとに基づいて、以下の手順により、注目度合いマップを生成する。
・推論部303が推論したラベルから、そのラベルのみ誤差があるとして逆伝播し、畳み込み最終層、あるいは、選択した層で得られる勾配情報についてチャネルごとに平均値を求め、各チャネルの重要度を決定する。
・各チャネルの特徴マップに重要度を重みとして乗算し、全てのチャネルの同一座標の値を足し合わせた結果に、活性化関数(ReLU)を適用することで正値のみの画像を生成する。
・生成した画像において、画素値が大きい(勾配が大きい)注目部分をヒートマップ(注目度合いが同レベルとなる画素の領域を示すマップ)により可視化することで、注目度合いマップを生成する。
【0045】
なお、注目領域導出部311は、生成した注目度合いマップを、注目度合いマップ格納部312に格納する。
【0046】
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部(リファイン画像生成部141、注目度合いマップ生成部142、詳細原因解析部143)の処理の具体例について説明する。なお、以下では、誤推論画像内に、推論対象として、複数のオブジェクト(本実施形態では複数の車両)が含まれているものとして説明を行う。
【0047】
(1)リファイン画像生成部の処理の具体例
はじめに、リファイン画像生成部141の各部(ここでは、画像リファイナ部301、推論部303、誤差演算部304)の処理の具体例について説明する。
【0048】
(1-1)画像リファイナ部の処理の具体例
図4は、画像リファイナ部の処理の具体例を示す図である。
図4に示すように、画像リファイナ部301に、誤推論画像410が入力されると、画像リファイナ部301では、入力された誤推論画像410に含まれる、それぞれのオブジェクト(車両411、412)についてスコア最大化リファイン画像を生成する。
【0049】
なお、
図4において、
・車両411は、正解ラベル="車種A"のところ、"車種B"と誤推論した車両、
・車両412は、正解ラベル="車種B"のところ、"車種C"と誤推論した車両、
であるとする。
【0050】
画像リファイナ部301では、車両411、車両412について、スコア最大化リファイン画像を生成する際、2通りの生成方法(第1及び第2の生成方法)のうちのいずれかの生成方法を選択的に実行する。
【0051】
画像リファイナ部301が実行する第1の生成方法は、誤推論画像に含まれる全てのオブジェクトの正解ラベルのスコアが最大化するように、スコア最大化リファイン画像を生成する方法である。
【0052】
図4(a)は、画像リファイナ部301が、誤推論画像410に対して、第1の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(a)の例の場合、
・車両411のヘッドライト421の色、道路標示422の色、車両411のフロントグリルの色、車両411のフロントグリル423と左側ヘッドライト421との間の車体424の色、
・車両412のフロントグリル425の色、道路標示426の色、
を変更することで、車両411を"車種A"、車両412を"車種B"と正しく推論することが可能な、1のスコア最大化リファイン画像420が生成された様子を示している。
【0053】
一方、画像リファイナ部301が実行する第2の生成方法は、誤推論画像に含まれるオブジェクトごとに、スコアが最大化するように、スコア最大化リファイン画像を生成する方法である。第2の生成方法によれば、誤推論画像に含まれるオブジェクトの数に応じた数のスコア最大化リファイン画像が生成される。
【0054】
図4(b-1)は、画像リファイナ部301が、誤推論画像410に含まれる車両411に対して、第2の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(b-1)の例の場合、車両411のヘッドライト421の色を変更することで、車両411を"車種A"と正しく推論することが可能なスコア最大化リファイン画像430が生成された様子を示している。
【0055】
また、
図4(b-2)は、画像リファイナ部301が、誤推論画像410に含まれる車両412に対して、第2の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(b-2)の例の場合、車両412のフロントグリル425の色を変更することで、車両412を"車種B"と正しく推論することが可能なスコア最大化リファイン画像440が生成された様子を示している。
【0056】
(1-2)推論部の処理の具体例
図5は、推論部の処理の具体例を示す図である。
図5の例の場合、画像リファイナ部301において、第1の生成方法により生成されたリファイン画像500(スコア最大化リファイン画像を生成する途中過程で生成されるリファイン画像)を推論部303に入力した様子を示している。
【0057】
図5に示すように、推論部303では、車両411のラベル、スコアに加えて、車両411に関する情報として、"位置及び大きさ"、"存在確率"、"IoU"、"Pr"を算出する。同様に、推論部303では、車両412のラベル、スコアに加えて、車両412に関する情報として、"位置及び大きさ"、"存在確率"、"IoU"、"Pr"を算出する。
【0058】
以下、推論部303が算出する、オブジェクトに関する情報(車両411、412に関する情報)について、
図6~
図8を用いて詳説する。
【0059】
(i)位置及び大きさ
図6は、リファイン画像に含まれるオブジェクトの位置及び大きさの算出方法の一例を示す図である。推論部303では、リファイン画像500に含まれるオブジェクト(車両411、412)の外接矩形601、602を特定することで、オブジェクトの位置及び大きさを算出する。
【0060】
なお、推論部303は、オブジェクトの位置及び大きさの算出方法として、3通りの算出方法(第1乃至第3の算出方法)を有しており、いずれかの算出方法により、オブジェクトの位置及び大きさを算出するものとする。
【0061】
推論部303が有する第1の算出方法は、外接矩形601、602それぞれの、左上頂点の座標、右下頂点の座標を算出する方法である。第1の算出方法によれば、符号611に示すように、
・車両412の位置及び大きさとして、(x11,y11)、(x12,y12)が、
・車両411の位置及び大きさとして、(x21,y21)、(x22,y22)が、
それぞれ算出される。
【0062】
一方、推論部303が有する第2の算出方法は、外接矩形601、602それぞれの、特定の位置からの左上頂点までの距離、右下頂点までの距離を算出する方法である。第2の算出方法によれば、符号612に示すように、
・車両412の位置及び大きさとして、dx11、dy11、dx12、dy12が、
・車両411の位置及び大きさとして、dx21、dy21、dx22、dy22が、
それぞれ算出される。
【0063】
一方、推論部303が有する第3の算出方法は、外接矩形601、602それぞれの、左上頂点の座標、高さ、幅を算出する方法である。第3の算出方法によれば、符号613に示すように、
・車両412の位置及び大きさとして、(x1,y1)、h1、w1が、
・車両411の位置及び大きさとして、(x2,y2)、h2、w2が、
それぞれ算出される。
【0064】
なお、
図6では、3通りの算出方法を例示したが、推論部303は、
図6に示した算出方法以外の算出方法により、リファイン画像内のオブジェクトの位置及び大きさを算出してもよい。
【0065】
例えば、第2の算出方法では、特定の位置を基準としたが、特定の位置として、基準となる矩形の左上頂点を用いてもよい(第4の算出方法)。
【0066】
また、第3の算出方法では、外接矩形の左上頂点の座標を算出したが、外接矩形の中心位置の座標を算出してもよい(第5の算出方法)。
【0067】
(ii)存在確率
図7は、リファイン画像に含まれるオブジェクトの存在確率の一例を示す図である。推論部303では、リファイン画像500を複数のブロックに分割して、それぞれのブロックにおいてオブジェクトが存在する確率を算出することができる。
【0068】
図7において、符号700は、破線で示すそれぞれのブロックについて、車両411、412の存在確率を算出した様子を示している。
【0069】
(iii)IoU及びPr
IoU(Intersection over Union)は、推論部303がリファイン画像500において、車両411、412を正しく検出できたか否かを示す評価指標である。
図8は、リファイン画像に含まれるオブジェクトのIoUの算出方法の一例を示す図である。
図8に示すように、推論部303において推論された車両411の外接矩形601に対して、正解外接矩形801が与えられたとすると、車両411のIoUは、下式により算出することができる。
(式1)
車両411のIoU=AoO
1/AoU
1
ただし、AoO
1は、推論部303において推論された車両411の外接矩形601と、正解外接矩形801とが重なっている部分の面積を指す。また、AoU
1は、推論部303において推論された車両411の外接矩形601と、正解外接矩形801との和集合の面積を指す。
【0070】
同様に、推論部303において推論された車両412の外接矩形602に対して、正解外接矩形802が与えられたとすると、車両412のIoUは、下式により算出することができる。
(式2)
車両412のIoU=AoO2/AoU2
ただし、AoO2は、推論部303において推論された車両412の外接矩形602と、正解外接矩形802とが重なっている部分の面積を指す。また、AoU2は、推論部303において推論された車両412の外接矩形602と、正解外接矩形802との和集合の面積を指す。
【0071】
一方、Prは、推論部303において推論された車両411(または412)の外接矩形601(または602)に、車両411(または412)が含まれる確率を指す。なお、車両411、412のIoUと、Prとをかけ合わせることで、推論部303において推論された車両411(または412)の外接矩形601(または602)の信頼度を算出することができる。
【0072】
(1-3)誤差演算部の処理の具体例
図9は、誤差演算部の処理の具体例を示す図である。
図9に示すように、誤差演算部304には、リファイン画像が入力されることで推論部303がラベルを推論した際に算出した、スコア、オブジェクトに関する情報(位置及び大きさ、存在確率、IoU、Pr)が入力される。
【0073】
図9に示すように、誤差演算部304では、入力されるスコア、オブジェクトに関する情報を用いて、スコア誤差、オブジェクト誤差を算出する。具体的には、誤差演算部304では、
・生成したリファイン画像を用いて推論した際のスコアと、正解ラベルのスコアを最大にしたスコアとの誤差であるスコア誤差、
・生成したリファイン画像を用いてラベルを推論した際のオブジェクトに関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差として、
・位置及び大きさの誤差、
・存在確率の誤差(=(オブジェクトが存在する領域の存在確率と1.0との差分)+(オブジェクトが存在しない領域の存在確率と0.0との差分))、
・信頼度(=IoU×Pr)、
を算出する。
【0074】
なお、誤差演算部304は、推論部303から通知されるスコア、及び、オブジェクトに関する情報のうち、スコア誤差またはオブジェクト誤差の算出に用いる項目を予め設定することができるものとする。
図9の例の場合、誤差演算部304に、スコア、IoU、Prが入力されるよう設定されているため、誤差演算部304では、スコア誤差と信頼度とを、画像リファイナ部301に通知する。
【0075】
(2)注目度合いマップ生成部の処理の具体例
次に、注目度合いマップ生成部142の処理の具体例について説明する。
図10は、注目度合いマップ生成部の処理の具体例を示す図である。
図10(a)に示すように、推論部構造情報及び特徴マップ1001を取得すると、注目領域導出部311では、Grad-CAM法を用いることで、注目度合いマップ1010を生成する。
【0076】
上述したように、スコア最大化リファイン画像420には、2つのオブジェクト(車両411、412)が含まれるため、注目度合いマップ1010には、それぞれのオブジェクトに応じた位置に、注目度合いが同レベルとなる画素の領域が現れる。
【0077】
図4(a)において、領域1011_1、1012_1は、注目度合いがレベル1以上となる画素の領域を示している。同様に、領域1011_2、1012_2は、注目度合いがレベル2以上となる画素の領域を示している。同様に、領域1011_3、1012_3は、注目度合いがレベル3以上となる画素の領域を示している。
【0078】
図10(b)は、注目度合いマップ1010に含まれる各領域が、スコア最大化リファイン画像420上のどこの位置に対応するかを明示するために、スコア最大化リファイン画像420に、注目度合いマップ1010を重ね合わせたものである。
【0079】
図10(b)の例の場合、領域1011_1~1011_3は、車両411のフロントグリルから左側ヘッドライト下側にかけて、重ね合わされたことを示している。同様に、領域1012_1~1012_3は、右側ヘッドライトの一部から、車両412のフロントグリル及び左側ヘッドライトにかけて、重ね合わされたことを示している。
【0080】
(3)詳細原因解析部の処理の具体例
次に、詳細原因解析部143の処理の具体例について説明する。説明に際しては、まず、詳細原因解析部143の機能構成について説明する。
【0081】
(3-1)詳細原因解析部の機能構成
図11は、詳細原因解析部の機能構成の一例を示す第1の図である。
図11に示すように、詳細原因解析部143は、画像差分演算部1101、SSIM演算部1102、切り出し部1103、作用部1104を有する。
【0082】
画像差分演算部1101は、スコア最大化リファイン画像と誤推論画像との間の画素単位での差分を演算し、差分画像を出力する。
【0083】
SSIM演算部1102は、スコア最大化リファイン画像と誤推論画像410とを用いて、SSIM演算を行うことで、SSIM画像を出力する。
【0084】
切り出し部1103は、差分画像から注目度合いマップ1010の所定レベルの領域に対応する画像部分を切り出す。また、切り出し部1103は、SSIM画像から注目度合いマップ1010の所定レベルの領域に対応する画像部分を切り出す。更に、切り出し部1103は、注目度合いマップ1010の所定レベルの領域に対応する画像部分を切り出した、差分画像とSSIM画像とを乗算して、乗算画像を生成する。
【0085】
作用部1104は、誤推論画像と乗算画像とに基づいて、作用結果画像を生成する。
【0086】
(3-2)詳細原因解析部の処理の具体例
図12は、詳細原因解析部の処理の具体例を示す図である。
図12に示すように、はじめに、画像差分演算部1101において、スコア最大化リファイン画像(A)と誤推論画像(B)との差分(=(A)-(B))が演算され、差分画像が出力される。差分画像は、誤推論の原因となる画像箇所での画素修正情報である。
【0087】
続いて、SSIM演算部1102において、スコア最大化リファイン画像(A)と誤推論画像(B)とに基づいてSSIM演算が行われる(y=SSIM((A),(B))。更に、SSIM演算部1102において、SSIM演算の結果が反転されることで(y'=255-(y×255))、SSIM画像が出力される。SSIM画像は、誤推論の原因となる画像箇所を高精度に指定した画像であり、画素値が大きいと差分が大きく、画素値が小さいと差分が小さいことを表す。なお、SSIM演算の結果を反転する処理は、例えば、y'=1-yを算出することにより行ってもよい。
【0088】
続いて、切り出し部1103において、差分画像から、注目度合いマップの所定レベルの領域に対応する画像部分が切り出され、切り出し画像(C)が出力される。同様に、切り出し部1103において、SSIM画像から、注目度合いマップの所定レベルの領域に対応する画像部分が切り出され、切り出し画像(D)が出力される。
【0089】
ここで、注目度合いマップの所定レベルの領域は、誤推論の原因となる画像部分を領域にまで絞り込んだものであり、詳細原因解析部143では、当該絞り込んだ領域の中で、更に、画素粒度での原因解析を行うことを目的としている。
【0090】
このため、切り出し部1103では、切り出し画像(C)と切り出し画像(D)とを乗算し、乗算画像(G)を生成する。乗算画像(G)は、誤推論の原因となる画像箇所での画素修正情報を更に高精度に指定した、画素修正情報に他ならない。
【0091】
また、切り出し部1103では、乗算画像(G)に対して画素単位で強度調整処理を行い、強調乗算画像(H)を出力する。なお、切り出し部1103では、強調乗算画像(H)を下式に基づいて算出する。
(式3)
強調乗算画像(H)=255×(G)/(max(G)-min(G))
続いて作用部1104では、誤推論画像(B)から強調乗算画像(H)を減算することで重要部分を画素単位で可視化し、作用結果画像を生成する。
【0092】
なお、
図12に示した強度調整処理の方法は一例にすぎず、可視化した際に重要部分がより識別しやすくなる方法であれば、他の方法により強度調整処理を行ってもよい。
【0093】
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図13は、誤推論原因抽出処理の流れを示す第1のフローチャートである。
【0094】
ステップS1301において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、CNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。また、画像リファイナ部301は、スコア最大化リファイン画像を生成する際のモード(全てのオブジェクトを対象にスコアを最大化するモード、または、個別のオブジェクトを対象にスコアを最大化するモードのいずれか)を設定する。また、誤差演算部304は、オブジェクトに関する情報の中から、オブジェクト誤差の算出に用いる情報を設定する。
【0095】
ステップS1302において、画像リファイナ部301は、スコア最大化リファイン画像生成処理を実行する。なお、スコア最大化リファイン画像生成処理の詳細は、後述する。
【0096】
ステップS1303において、注目度合いマップ生成部142は、推論部構造情報及び特徴マップに基づいて、Grad-CAM法を用いて注目度合いマップを生成する。
【0097】
ステップS1304において、詳細原因解析部143は、詳細原因解析処理を実行する。なお、詳細原因解析処理の詳細は、後述する。
【0098】
<スコア最大化リファイン画像生成処理の詳細>
次に、誤推論原因抽出処理(
図13)のスコア最大化リファイン画像生成処理(ステップS1302)の詳細について説明する。
図14は、スコア最大化リファイン画像生成処理の流れを示すフローチャートである。
【0099】
ステップS1401において、画像リファイナ部301は、スコア最大化リファイン画像生成処理のモードを判定する。ステップS1401において、全てのオブジェクトを対象にスコアを最大化するモードが設定されていると判定した場合には、ステップS1411に進む。
【0100】
ステップS1411において、画像リファイナ部301は、誤推論画像からリファイン画像を生成し、リファイン画像格納部305に格納する。
【0101】
ステップS1412において、推論部303は、リファイン画像を入力してラベルを推論し、全てのオブジェクトの正解ラベルのスコアを算出する。
【0102】
ステップS1413において、画像リファイナ部301は、誤差演算部304が算出した全てのオブジェクトについてのスコア誤差及びオブジェクト誤差と、画像誤差演算部302が算出した画像差分値とを用いてCNNの学習を行う。
【0103】
ステップS1414において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1414において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1414においてNoの場合には)、ステップS1411に戻り、リファイン画像の生成を継続する。
【0104】
一方、ステップS1414において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1414においてYesの場合は)、
図13のステップS1303に戻る。なお、この時点で、リファイン画像格納部305には、1のスコア最大化リファイン画像が格納されている。
【0105】
一方、ステップS1401において、個別のオブジェクトごとにスコアを最大化するモードが設定されていると判定した場合には、ステップS1421に進む。
【0106】
ステップS1421において、画像リファイナ部301は、誤推論画像内の所定の1のオブジェクトについてリファイン画像を生成し、リファイン画像格納部305に格納する。
【0107】
ステップS1422において、推論部303は、リファイン画像を入力してラベルを推論し、所定の1のオブジェクトの正解ラベルのスコアを算出する。
【0108】
ステップS1423において、画像リファイナ部301は、誤差演算部304が算出した所定の1のオブジェクトについてのスコア誤差及びオブジェクト誤差と、画像誤差演算部302が算出した画像差分値とを用いてCNNの学習を行う。
【0109】
ステップS1424において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1424において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1424においてNoの場合には)、ステップS1421に戻り、リファイン画像の生成を継続する。
【0110】
一方、ステップS1424において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1424においてYesの場合は)、ステップS1425に進む。なお、この時点で、リファイン画像格納部305には、所定の1のオブジェクトについてのスコア最大化リファイン画像が格納されている。
【0111】
ステップS1425において、画像リファイナ部301は、誤推論画像に含まれる全てのオブジェクトについて、スコア最大化リファイン画像を生成したか否かを判定する。
【0112】
ステップS1425において、スコア最大化リファイン画像を生成していないオブジェクトがあると判定した場合には(ステップS1425においてNoの場合には)、ステップS1426に進む。
【0113】
ステップS1426において、画像リファイナ部301は、スコア最大化リファイン画像を生成すべき次のオブジェクトを、所定の1のオブジェクトとして選択し、ステップS1421に戻る。
【0114】
一方、ステップS1425において、全てのオブジェクトについて、スコア最大化リファイン画像を生成したと判定した場合には(ステップS1425においてYesの場合には)、
図13のステップS1303に戻る。なお、この時点で、リファイン画像格納部305には、オブジェクトの数に応じた数のスコア最大化リファイン画像が格納されている。
【0115】
<詳細原因解析処理の流れ>
次に、詳細原因解析部143による詳細原因解析処理の流れについて説明する。
図15は、詳細原因解析処理の流れを示す第1のフローチャートである。
【0116】
ステップS1501において、画像差分演算部1101は、スコア最大化リファイン画像と誤推論画像との差分画像を演算する。
【0117】
ステップS1502において、SSIM演算部1102は、スコア最大化リファイン画像と誤推論画像とに基づいて、SSIM画像を演算する。
【0118】
ステップS1503において、切り出し部1103は、注目度合いマップの所定レベルの領域に対応する差分画像を切り出す。
【0119】
ステップS1504において、切り出し部1103は、注目度合いマップの所定レベルの領域に対応するSSIM画像を切り出す。
【0120】
ステップS1505において、切り出し部1103は、切り出した差分画像と切り出したSSIM画像とを乗算し、乗算画像を生成する。
【0121】
ステップS1506において、切り出し部1103は、乗算画像に対して画素単位で強度調整処理を行う。また、作用部1104は、強度調整処理された乗算画像を、誤推論画像から減算し、作用結果画像を出力する。
【0122】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出部140による誤推論原因抽出処理の具体例について説明する。
図16は、誤推論原因抽出処理の具体例を示す第1の図である。
【0123】
図16に示すように、はじめに、リファイン画像生成部141によって、誤推論画像からスコア最大化リファイン画像が生成される。続いて、注目度合いマップ生成部142によって、注目度合いマップが生成される。
【0124】
なお、リファイン画像生成部141によって、1のスコア最大化リファイン画像が生成された場合、注目度合いマップ生成部142では、1の注目度合いマップを生成する。また、リファイン画像生成部141によって、オブジェクトの数に応じた数のスコア最大化リファイン画像が生成された場合、注目度合いマップ生成部142では、対応する数の注目度合いマップを生成し、それらを合体することで1の注目度合いマップを生成する。
【0125】
続いて、詳細原因解析部143では、スコア最大化リファイン画像と誤推論画像とを読み出し、生成された1の注目度合いマップのもとで、詳細原因解析処理を行い、作用結果画像を出力する。
【0126】
なお、詳細原因解析部143では、1の注目度合いマップのうち、例えば、
・レベル1以上となる画素の領域、
・レベル2以上となる画素の領域、
・レベル3以上となる画素の領域、
についてそれぞれ詳細原因解析処理を行い、それぞれの作用結果画像を出力する。
【0127】
以上の説明から明らかなように、第1の実施形態に係る解析装置100は、画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
【0128】
また、第1の実施形態に係る解析装置100は、スコア最大化リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成する。
【0129】
また、第1の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像とに基づいて演算される画像のうち、注目度合いマップの所定レベルの領域に対応する画像を切り出す。そして、第1の実施形態に係る解析装置100は、切り出した画像を画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する。
【0130】
このように、誤推論画像とスコア最大化リファイン画像とに基づいて演算される画像のうち、注目度合いマップの所定レベルの領域について、画素単位で強度調整処理することで、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0131】
[第2の実施形態]
上記第1の実施形態では、誤推論画像抽出部120により誤推論画像として抽出された入力画像について、誤推論原因抽出処理を行うものとして説明した。しかしながら、誤推論原因抽出処理を行う入力画像は、誤推論画像抽出部120により誤推論画像として抽出された入力画像に限定されない。
【0132】
例えば、誤推論画像抽出部120により、正解ラベルと一致すると判定された入力画像(正推論画像と称す)の一部を変形することで、正解ラベルと一致しなくなった誤推論画像について、誤推論原因抽出処理を行ってもよい。
【0133】
この場合、正推論画像をスコア最大化リファイン画像として誤推論原因抽出処理が行われることとなる。つまり、誤推論原因抽出部140では、リファイン画像生成部141による、スコア最大化リファイン画像を生成する処理を省略することができる。
【0134】
[第3の実施形態]
上記第1の実施形態では、誤推論画像に2つのオブジェクトが含まれる場合について説明したが、誤推論画像に含まれるオブジェクトの数は、2つに限定されず、1つであってもよいし、3つ以上であってもよい。
【0135】
また、上記第1の実施形態では、注目度合いマップの各レベルの領域について詳細原因解析処理を行うものとして説明した。しかしながら、詳細原因解析処理の方法はこれに限定されない。例えば、誤推論画像に含まれるオブジェクトごとに異なるレベルを設定し、設定したレベルの領域について、詳細原因解析処理を行ってもよい。
【0136】
[第4の実施形態]
上記第1乃至第3の実施形態では、Grad-CAM法を用いて生成した注目度合いマップに基づいて、詳細原因解析処理の際に切り出す領域を決定するものとして説明した。しかしながら、詳細原因解析処理の際に切り出す領域を決定する方法はこれに限定されず、他の解析技術を用いて生成したマップを用いて決定してもよい。
【0137】
また、上記第1乃至第3の実施形態では、注目度合いマップの所定レベルの領域に対応する画像部分を切り出す場合について説明した。しかしながら、切り出す領域は、注目度合いマップの所定レベルの領域に限定されず、例えば、誤推論画像をスーパーピクセルに分割し、スーパーピクセルごとに、切り出すようにしてもよい。
【0138】
以下、第4の実施形態について、上記第1乃至第3の実施形態との相違点を中心に説明する。
【0139】
<誤推論原因抽出部の機能構成>
はじめに、第4の実施形態に係る解析装置100の、誤推論原因抽出部140の機能構成について説明する。
図17は、誤推論原因抽出部の機能構成の一例を示す第2の図である。
図3を用いて説明した機能構成との相違点は、
図17に示す機能構成の場合、重要特徴指標マップ生成部1710と特定部1720とを有する点、及び、詳細原因解析部143とは異なる機能を有する詳細原因解析部1730を有する点である。
【0140】
以下、重要特徴指標マップ生成部1710、特定部1720、詳細原因解析部1730について詳細を説明する。
【0141】
(1)重要特徴指標マップ生成部の詳細
はじめに、重要特徴指標マップ生成部1710の詳細について説明する。
図17に示すように、重要特徴指標マップ生成部1710は、重要特徴マップ生成部1711、劣化尺度マップ生成部1712、重畳部1713を有する。
【0142】
重要特徴マップ生成部1711は、スコア最大化リファイン画像を入力してラベルを推論した際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部1711は、BP(Back Propagation)法、GBP(Guided Back Propagation)法または選択的BP法を用いることで、"グレイスケール化重要特徴マップ"を生成する。グレイスケール化重要特徴マップは、スコア最大化リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップを、グレイスケール化したものである。
【0143】
なお、BP法は、推論したラベルが正解する入力画像(ここでは、スコア最大化リファイン画像)の推論を行うことで得た各スコアから各ラベルの誤差を計算し、入力層まで逆伝播して得られる勾配情報の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の大小のうち正値のみを画像化することで、特徴部分を可視化する方法である。
【0144】
更に、選択的BP法は、正解ラベルの誤差のみを最大にしたうえで、BP法またはGBP法を用いて処理を行う方法である。選択的BP法の場合、正解ラベルのスコアに影響を与える特徴部分のみが可視化される。
【0145】
劣化尺度マップ生成部1712は、誤推論画像とスコア最大化リファイン画像とに基づいて、"劣化尺度マップ"を生成する。劣化尺度マップは、スコア最大化リファイン画像を生成する際に変更がなされた各画素の変更度合いを示している。
【0146】
重畳部1713は、重要特徴マップ生成部1711において生成されたグレイスケール化重要特徴マップと、劣化尺度マップ生成部1712において生成された劣化尺度マップとを重畳し、"重要特徴指標マップ"を生成する。重要特徴指標マップは、正解ラベルを推論するための各画素の重要度を示している。
【0147】
(2)特定部の詳細
次に、特定部1720の詳細について説明する。
図17に示すように、特定部1720は、スーパーピクセル分割部1721、重要スーパーピクセル決定部1722、絞り込み部1723を有する。
【0148】
スーパーピクセル分割部1721は、誤推論画像を、誤推論画像に含まれるオブジェクト(本実施形態では車両)の要素オブジェクト(本実施形態では、車両の部品)ごとの領域である"スーパーピクセル"に分割し、スーパーピクセル分割情報を出力する。なお、誤推論画像をスーパーピクセルに分割するにあたっては、既存の分割機能を利用するか、あるいは、車両の部品ごとに分割するように学習したCNN等を利用する。
【0149】
重要スーパーピクセル決定部1722は抽出部の一例であり、スーパーピクセル分割部1721により出力されたスーパーピクセル分割情報に基づいて、重畳部1713により生成された重要特徴指標マップの各画素の画素値を、スーパーピクセルごとに加算する。
【0150】
また、重要スーパーピクセル決定部1722は、各スーパーピクセルのうち、加算値が所定の条件を満たす(重要特徴指標閾値以上となる)スーパーピクセルを抽出し、抽出したスーパーピクセル(重要スーパーピクセル)を絞り込み部1723に通知する。
【0151】
絞り込み部1723は、注目度合いマップ格納部312より注目度合いマップを読み出し、重要スーパーピクセル決定部1722より通知された重要スーパーピクセルのうち、注目度合いマップの所定レベルの領域に含まれる重要スーパーピクセルを絞り込む。
【0152】
また、絞り込み部1723は、絞り込んだ重要スーパーピクセルを、絞り込み重要スーパーピクセルとして、詳細原因解析部1730に通知する。
【0153】
(3)詳細原因解析部の詳細
次に、詳細原因解析部1730の詳細について説明する。詳細原因解析部1730は、スコア最大化リファイン画像と、誤推論画像と、推論部構造情報と、を取得する。また、詳細原因解析部1730は、スコア最大化リファイン画像と、誤推論画像と、推論部構造情報に基づいて生成された重要特徴マップのうち、絞り込み重要スーパーピクセルに対応する領域を切り出して画素単位で強度調整処理する。これにより、詳細原因解析部1730では、誤推論の原因となる画像箇所を可視化した作用結果画像を出力する。
【0154】
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部(ここでは、重要特徴指標マップ生成部1710、特定部1720、詳細原因解析部1730)の処理の具体例について説明する。なお、以下では、誤推論画像内に、推論対象として、複数のオブジェクト(複数の車両)が含まれているものとして説明を行う。
【0155】
(1)重要特徴指標マップ生成部の処理の具体例
(1-1)重要特徴マップ生成部、劣化尺度マップ、重畳部の処理の具体例
はじめに、重要特徴指標マップ生成部1710に含まれる、重要特徴マップ生成部1711、劣化尺度マップ生成部1712、重畳部1713の処理の具体例について説明する。
図18は、重要特徴指標マップ生成部の処理の具体例を示す図である。
【0156】
図18に示すように、重要特徴指標マップ生成部1710において重要特徴マップ生成部1711は、推論部303がスコア最大化リファイン画像を入力して正解ラベルを推論した際の推論部構造情報1801を、推論部303から取得する。また、重要特徴マップ生成部1711は、取得した推論部構造情報1801に基づいて、例えば、選択的BP法を用いて重要特徴マップを生成する。
【0157】
なお、重要特徴マップ生成部1711では、スコア最大化リファイン画像に含まれるオブジェクトごとに、重要特徴マップを生成する。スコア最大化リファイン画像420の場合、車両411と車両412の2つのオブジェクトが含まれていることから、重要特徴マップ生成部1711では、選択的BP法を用いて、2つの重要特徴マップを生成する(詳細は後述)。
【0158】
また、重要特徴マップ生成部1711では、2つのオブジェクトについて生成した2つの重要特徴マップをそれぞれグレイスケール化し、オブジェクト単位グレイスケール化重要特徴マップ1811、1812を生成する。
【0159】
図18に示すオブジェクト単位グレイスケール化重要特徴マップ1811、1812は、それぞれ、0から255の画素値でグレイスケール化されている。このため、オブジェクト単位グレイスケール化重要特徴マップ1811、1812において、画素値が255に近い画素は、推論時に注目度合いが高い画素(注目画素)であり、画素値が0に近い画素は、推論時に注目度合いが低い画素(非注目画素)である。
【0160】
一方、劣化尺度マップ生成部1712は、リファイン画像格納部305よりスコア最大化リファイン画像420を読み出し、オブジェクトごとに、誤推論画像410との間でSSIM(Structural Similarity)演算を行う。
【0161】
スコア最大化リファイン画像420の場合、車両411と車両412の2つのオブジェクトが含まれることから、劣化尺度マップ生成部1712では、2つのオブジェクト単位劣化尺度マップ1821、1822を生成する。オブジェクト単位劣化尺度マップ1821、1822は0から1の値をとり、画素値が1に近いほど、変更度合いが小さいことを表し、画素値が0に近いほど、変更度合いが大きいことを表す。
【0162】
重畳部1713は、重要特徴マップ生成部1711により生成された、オブジェクト単位グレイスケール化重要特徴マップ1811、1812と、劣化尺度マップ生成部1712により生成された、オブジェクト単位劣化尺度マップ1821、1822とを取得する。そして、重畳部1713は、オブジェクト単位重要特徴指標マップ1831、1832を生成する。
【0163】
具体的には、重畳部1713は、下式に基づいて、オブジェクト単位重要特徴指標マップ1831、1832を生成する。
(式3)
オブジェクト単位重要特徴指標マップ=オブジェクト単位グレイスケール化重要特徴マップ×(1-オブジェクト単位劣化尺度マップ)
上式において、(1-オブジェクト単位劣化尺度マップ)の項は、0から1の値をとり、1に近いほど変更度合いが大きく、0に近いほど変更度合いが小さい。つまり、オブジェクト単位重要特徴指標マップ1831、1832は、推論時に注目した各画素の注目度合いを示すオブジェクト単位グレイスケール化重要特徴マップに、変更度合いの大小による強弱をつけることで生成される。
【0164】
具体的には、オブジェクト単位重要特徴指標マップ1831、1832は、
・オブジェクト単位劣化尺度マップ1821、1822において変更度合いが小さい部分について、オブジェクト単位グレイスケール化重要特徴マップの画素値を小さくし、
・オブジェクト単位劣化尺度マップ1821、1822において変更度合いが大きい部分について、オブジェクト単位グレイスケール化重要特徴マップの画素値を大きくする、
ことで生成される。
【0165】
なお、より見やすくするために、オブジェクト単位重要特徴指標マップは白黒を反転させてもよい。
図18に示すオブジェクト単位重要特徴指標マップは、下式に基づいて白黒を反転させたものを表示している。
(式4)
(反転した)オブジェクト単位重要特徴指標マップ=255-[オブジェクト単位グレイスケール化重要特徴マップ×(1-オブジェクト単位劣化尺度マップ)]
ここで、重畳部1713が、上式に基づいて、オブジェクト単位グレイスケール化重要特徴マップ1811、1812とオブジェクト単位劣化尺度マップ1821、1822とを重畳することによる利点について説明する。
【0166】
上述したように、重要特徴マップ生成部1711において生成される、オブジェクト単位グレイスケール化重要特徴マップ1811、1812は、正解ラベルのスコアが最大となった際に推論部303が注目した注目部分に他ならない。
【0167】
一方、劣化尺度マップ生成部1712において生成される、オブジェクト単位劣化尺度マップ1821、1822は、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分を表しており、誤推論の原因となる部分を表している。ただし、劣化尺度マップ生成部1712において生成されるオブジェクト単位劣化尺度マップ1821、1822は、正解ラベルを推論するための最小限の部分ではない。
【0168】
重畳部1713では、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分と、推論部303が注目した注目部分とを重畳することで、正解ラベルを推論するための最小限の部分を、正解ラベルを推論するための重要な部分として可視化する。
【0169】
なお、
図18の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、
図18に示すように、オブジェクトごとに劣化尺度マップが生成されるため、対応するオブジェクト単位グレイスケール化重要特徴マップに重畳することで、オブジェクト単位重要特徴指標マップが生成されることになる。
【0170】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、劣化尺度マップ生成部1712では、全てのオブジェクトを含む大きさの1の劣化尺度マップを生成する。この場合、重畳部1713では、当該1の劣化尺度マップを共通に用いて、各オブジェクトのオブジェクト単位グレイスケール化重要特徴マップを重畳する。これにより、オブジェクト単位重要特徴指標マップが生成されることになる。
【0171】
(1-2)選択的BP法を用いた重要特徴マップの生成方法の詳細
次に、重要特徴マップ生成部1711が、選択的BP法を用いて、オブジェクトごとに重要特徴マップを生成する生成方法の詳細について説明する。上述したように、重要特徴マップ生成部1711では、スコア最大化リファイン画像に含まれるオブジェクトごとに、重要特徴マップを生成する。
【0172】
図19は、選択的BP法を用いた重要特徴マップの生成方法の一例を示す図である。このうち、
図19(a)は、スコア最大化リファイン画像420に含まれる全てのオブジェクトについての重要特徴マップを生成する様子を示したものである。
【0173】
上述したように、スコア最大化リファイン画像420には、2つのオブジェクト(車両411、412)が含まれ、互いに異なる車種である。このため、2つのオブジェクトに対して同時に選択的BP法を用いると、2つのオブジェクトに対する注目領域の情報が互いに混在した重要特徴マップが生成されることになる。
【0174】
一方、
図19(b)は、スコア最大化リファイン画像420に含まれる、2つのオブジェクトについて、別々に重要特徴マップを生成する様子を示したものである。
図19(b)に示すように、2つのオブジェクトに対して別々に選択的BP法を用いることで、2つのオブジェクトに対する注目領域の情報が混在することなく、重要特徴マップを生成することができる。
【0175】
このようなことから、重要特徴マップ生成部1711では、スコア最大化リファイン画像に含まれるオブジェクトごとに、重要特徴マップを生成する。
【0176】
(2)特定部の処理の具体例
次に、特定部1720の各部(ここでは、スーパーピクセル分割部1721、重要スーパーピクセル決定部1722、絞り込み部1723)の処理の具体例について説明する。
【0177】
(2-1)スーパーピクセル分割部の処理の具体例
はじめに、特定部1720に含まれるスーパーピクセル分割部1721の処理の具体例について説明する。
図20は、スーパーピクセル分割部の処理の具体例を示す図である。
図20に示すように、スーパーピクセル分割部1721は、例えば、SLIC(Simple Linear Iterative Clustering)処理を行う分割部2010を有する。なお、分割されたピクセルの集合をスーパーピクセルと称す。
【0178】
分割部2010は、誤推論画像410をオブジェクトごとに取得し、オブジェクト単位誤推論画像2001、2002それぞれに含まれるオブジェクトについて、要素オブジェクトごとの領域であるスーパーピクセルに分割する。また、スーパーピクセル分割部1721は、分割部2010によりスーパーピクセルに分割されることで生成された、オブジェクト単位スーパーピクセル分割情報2011、2012を出力する。
【0179】
なお、
図20の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、オブジェクトの数に応じた数のオブジェクト単位重要特徴指標マップが生成されるため、スーパーピクセル分割部1721においても、オブジェクトの数に応じた数のオブジェクト単位スーパーピクセル分割情報が生成されることになる。
【0180】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、スーパーピクセル分割部1721では、全てのオブジェクトを含む大きさの1のスーパーピクセル分割情報を生成する。
【0181】
(2-2)重要スーパーピクセル決定部の処理の具体例
次に、特定部1720に含まれる重要スーパーピクセル決定部1722の処理の具体例について説明する。
図21は、重要スーパーピクセル決定部の処理の具体例を示す図である。
図21に示すように、重要スーパーピクセル決定部1722では、
・重畳部1713より出力された、オブジェクト単位重要特徴指標マップ1831、1832と、
・スーパーピクセル分割部1721より出力されたオブジェクト単位スーパーピクセル分割情報2011、2012と、
を重ね合わせる。これにより、重要スーパーピクセル決定部1722では、オブジェクト単位重要スーパーピクセル画像2101、2102を生成する。なお、
図21では、オブジェクト単位重要特徴指標マップ1831、1832として、(白黒を反転した)重要特徴指標マップを用いた場合を示している。
【0182】
また、重要スーパーピクセル決定部1722では、生成したオブジェクト単位重要スーパーピクセル画像2101内のスーパーピクセルごとに、オブジェクト単位重要特徴指標マップ1831の各画素の画素値を加算する。同様に、重要スーパーピクセル決定部1722では、生成したオブジェクト単位重要スーパーピクセル画像2102内のスーパーピクセルごとに、オブジェクト単位重要特徴指標マップ1832の各画素の画素値を加算する。なお、
図21において、オブジェクト単位重要スーパーピクセル画像2111、2112は、それぞれのオブジェクトについて、スーパーピクセルごとの加算値の一例を明示したものである。
【0183】
また、重要スーパーピクセル決定部1722では、各スーパーピクセルについて、加算値が、重要特徴指標閾値以上であるかを判定し、加算値が重要特徴指標閾値以上であると判定したスーパーピクセルを抽出する。
図21において、斜線で示した領域(車両411のフロントグリル、及び、フロントグリルと左側ヘッドライトとの間)は、抽出されたスーパーピクセルを示している。
【0184】
また、重要スーパーピクセル決定部1722は、抽出したスーパーピクセルを、オブジェクト単位重要スーパーピクセルとして、絞り込み部1723に通知する。
【0185】
なお、
図21の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、
図21に示すように、オブジェクトごとの大きさのオブジェクト単位スーパーピクセル分割情報及びオブジェクト単位特徴指標マップが生成される。このため、オブジェクトごとの大きさのオブジェクト単位重要スーパーピクセル画像が生成される。
【0186】
この結果、オブジェクト単位重要特徴指標マップの画素値も、オブジェクト単位重要スーパーピクセル画像を用いて、オブジェクトごとに加算する。また、重要スーパーピクセルも、オブジェクト単位重要スーパーピクセル画像を用いて、それぞれのオブジェクトについて抽出される。
【0187】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、全てのオブジェクトを含む大きさの1のスーパーピクセル分割情報が生成される。このため、重要スーパーピクセル決定部1722では、1のスーパーピクセル分割情報に対して、オブジェクトごとの大きさのオブジェクト単位重要特徴指標マップをそれぞれ重畳する。これにより、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像が、オブジェクトの数だけ生成される。
【0188】
この結果、オブジェクト単位重要特徴指標マップの画素値も、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて、オブジェクトごとに加算する。また、重要スーパーピクセルも、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて、それぞれのオブジェクトについて抽出される。
【0189】
(2-3)絞り込み部の処理の具体例
次に、特定部1720に含まれる絞り込み部1723の処理の具体例について説明する。
図22は、絞り込み部の処理の具体例を示す図である。
【0190】
図22に示すように、絞り込み部1723は、オブジェクト単位重要スーパーピクセル2201、2202に対して、注目度合いマップ1010の領域1011_1~1011_3、1012_1~1012_3を重畳する。
【0191】
図22において、符号2211は、オブジェクト単位重要スーパーピクセル1311に対して、注目度合いマップ1010の領域1011_1~1011_3を重畳した様子を示している。
【0192】
このように、オブジェクト単位重要スーパーピクセルと注目度合いマップとを用いることで、絞り込み部1723では、オブジェクト単位重要スーパーピクセルを、注目度合いマップの所定レベルの領域に絞り込むことができる。
【0193】
絞り込み部1723では、絞り込んだオブジェクト単位重要スーパーピクセルを、オブジェクト単位絞り込み重要スーパーピクセルとして、詳細原因解析部1730に通知する。
【0194】
なお、
図22の例では、重要スーパーピクセル決定部1722より、オブジェクトごとの大きさのオブジェクト単位重要スーパーピクセル画像を用いて抽出されたオブジェクト単位重要スーパーピクセルが通知される場合について示した。
図22の例の場合、絞り込み部1723では、オブジェクトごとの大きさのオブジェクト単位重要スーパーピクセルに、オブジェクトごとの大きさの注目度合いマップを重畳する。
【0195】
一方、重要スーパーピクセル決定部1722より、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて抽出されたオブジェクト単位重要スーパーピクセルが通知される場合、絞り込み部1723では、
・全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセルに、
・オブジェクトごとの大きさの注目度合いマップを、
重畳することで、オブジェクトごとのオブジェクト単位絞り込み重要スーパーピクセルを、詳細原因解析部1730に通知する。
【0196】
(3)詳細原因解析部の処理の具体例
次に、詳細原因解析部1730の処理の具体例について説明する。説明に際しては、まず、詳細原因解析部1730の機能構成について説明する。
【0197】
(3-1)詳細原因解析部の機能構成
図23は、詳細原因解析部の機能構成の一例を示す第2の図である。
図11に示した機能構成との相違点は、
図23の場合、BP演算部2301を有する点、及び、切り出し部2302の機能が、
図11の切り出し部1103の機能とは異なる点である。
【0198】
BP演算部2301は、スコア最大化リファイン画像を入力してラベルを推論した際の推論部構造情報を、推論部303より取得する。また、BP演算部2301は、例えば、選択的BP法を用いることで、推論部構造情報に基づいて、オブジェクト単位重要特徴マップを生成する。
【0199】
切り出し部2302は、切り出し部1103と同様に、差分画像及びSSIM画像から、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出す。加えて、切り出し部2302は、オブジェクト単位重要特徴マップから、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出す。更に、切り出し部2302は、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出した、差分画像とSSIM画像と各オブジェクト単位重要特徴マップとを乗算して、乗算画像を生成する。
【0200】
このように、差分画像とSSIM画像と各オブジェクト単位重要特徴マップとを乗算することで、作用結果画像において、誤推論の原因となる画像箇所を画素単位で可視化することができる。
【0201】
なお、乗算の際に差分画像を用いることで、作用結果画像は、正解ラベルのスコアが上がる画像に自動的に修正されることになる。したがって、差分画像を作用結果画像として出力してもよい。更に、このような利点を考慮しないのであれば、詳細原因解析部1730は、(差分画像を用いずに)SSIM画像と各オブジェクト単位重要特徴マップとを用いて乗算を行い、作用結果画像を出力してもよい。
【0202】
(3-2)詳細原因解析部の処理の具体例
次に、詳細原因解析部1730の処理の具体例について説明する。
図24は、詳細原因解析部の処理の具体例を示す第2の図である。なお、
図12に示した詳細原因解析部143の処理の具体例との相違点は、BP演算部2301において、推論部構造情報(I)に基づいて、選択的BP法を用いた処理が行われ、オブジェクト単位重要特徴マップが生成されている点である。また、切り出し部2302において、オブジェクト単位重要特徴マップから、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分が切り出され、切り出し画像(J)が出力されている点である。更に、切り出し部2302において、切り出し画像(C)と切り出し画像(D)と切り出し画像(J)とが乗算され、乗算画像(G)が生成されている点である。
【0203】
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図25は、誤推論原因抽出処理の流れを示す第2のフローチャートである。
図13に示したフローチャートとの相違点は、ステップS2501、S2502である。
【0204】
ステップS2501において、重要特徴指標マップ生成部1710及び特定部1720は、オブジェクト単位絞り込み重要スーパーピクセル抽出処理を実行する。なお、オブジェクト単位絞り込み重要スーパーピクセル抽出処理の詳細は後述する。
【0205】
ステップS2502において、詳細原因解析部1730は、詳細原因解析処理を実行する。なお、詳細原因解析処理の詳細は、後述する。
【0206】
<オブジェクト単位絞り込み重要スーパーピクセル抽出処理の流れ>
次に、
図25のステップS2501(オブジェクト単位絞り込み重要スーパーピクセル抽出処理)の流れについて説明する。
図26は、オブジェクト単位絞り込み重要スーパーピクセル抽出処理の流れを示すフローチャートである。
【0207】
ステップS2601において、重要特徴マップ生成部1711は、推論部303よりスコア最大化リファイン画像を入力してラベルが推論された際の推論部構造情報を取得する。また、重要特徴マップ生成部1711は、取得した推論部構造情報に基づいて、オブジェクト単位グレイスケール化重要特徴マップを生成する。
【0208】
ステップS2602において、劣化尺度マップ生成部1712は、オブジェクト単位誤推論画像と、オブジェクト単位スコア最大化リファイン画像とに基づいて、オブジェクト単位劣化尺度マップを生成する。
【0209】
ステップ2603において、重畳部1713は、オブジェクト単位グレイスケール化重要特徴マップと、オブジェクト単位劣化尺度マップとに基づいて、オブジェクト単位重要特徴指標マップを生成する。
【0210】
ステップS2604において、スーパーピクセル分割部1721は、誤推論画像を要素オブジェクトごとの領域であるスーパーピクセルに分割し、オブジェクト単位スーパーピクセル分割情報を生成する。
【0211】
ステップS2605において、重要スーパーピクセル決定部1722は、オブジェクト単位重要特徴指標マップの各画素の画素値を、スーパーピクセルごとに加算する。
【0212】
ステップS2606において、重要スーパーピクセル決定部1722は、加算値が重要特徴指標閾値以上となるスーパーピクセルを、オブジェクト単位重要スーパーピクセルとして抽出する。
【0213】
ステップS2607において、絞り込み部1723は、抽出されたオブジェクト単位重要スーパーピクセルを、注目度合いマップの所定レベルの領域に絞り込む。また、絞り込み部1723は、絞り込んだオブジェクト単位重要スーパーピクセルを、オブジェクト単位絞り込み重要スーパーピクセルとして、詳細原因解析部1730に通知する。
【0214】
<詳細原因解析処理の流れ>
次に、詳細原因解析部1730による詳細原因解析処理の流れについて説明する。
図27は、詳細原因解析処理の流れを示す第2のフローチャートである。
図15に示したフローチャートとの相違点は、ステップS2701~S2705である。
【0215】
ステップS2701において、BP演算部2301は、推論部構造情報に基づき、オブジェクト単位重要特徴マップを生成する。
【0216】
ステップS2702において、切り出し部2302は、差分画像から、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出す。
【0217】
ステップS2703において、切り出し部2302は、SSIM画像から、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出す。
【0218】
ステップS2704において、切り出し部2302は、オブジェクト単位重要特徴マップから、オブジェクト単位絞り込み重要スーパーピクセルに対応する画像部分を切り出す。
【0219】
ステップS2705において、切り出し部1103は、切り出した差分画像と、切り出したSSIM画像と、切り出したオブジェクト単位重要特徴マップとを乗算し、乗算画像を生成する。
【0220】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出部140による誤推論原因抽出処理の具体例について説明する。
図28は、誤推論原因抽出処理の具体例を示す第2の図である。
【0221】
図28に示すように、はじめに、リファイン画像生成部141によって、誤推論画像からスコア最大化リファイン画像が生成される。続いて、重要特徴指標マップ生成部1710によって、オブジェクト単位重要特徴指標マップが生成される。続いて、注目度合いマップ生成部142によって、注目度合いマップが生成される。
【0222】
続いて、誤推論画像がオブジェクト単位で読み出されると、スーパーピクセル分割部1721では、オブジェクト単位スーパーピクセル分割情報を生成する。
【0223】
続いて、重要スーパーピクセル決定部1722では、オブジェクト単位重要特徴指標マップの画素値を、オブジェクト単位スーパーピクセル分割情報に基づいて分割されたスーパーピクセルごとに加算し、オブジェクト単位重要スーパーピクセル画像を生成する。
【0224】
続いて、重要スーパーピクセル決定部1722では、オブジェクト単位重要スーパーピクセル画像より、重要特徴指標閾値以上となるスーパーピクセルを、オブジェクト単位重要スーパーピクセルとして抽出する。
【0225】
続いて、絞り込み部1723では、重要スーパーピクセル決定部1722により抽出された、オブジェクト単位重要スーパーピクセルのうち、注目度合いマップの各レベルの領域に対応する、オブジェクト単位絞り込み重要スーパーピクセルを抽出する。
【0226】
続いて、詳細原因解析部1730では、スコア最大化リファイン画像と、誤推論画像と、推論部構造情報とを用いて、オブジェクト単位絞り込み重要スーパーピクセルのもとで詳細原因解析処理を行い、作用結果画像を出力する。
【0227】
以上の説明から明らかなように、第4の実施形態に係る解析装置100は、画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
【0228】
また、第4の実施形態に係る解析装置100は、スコア最大化リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成する。
【0229】
また、第4の実施形態に係る解析装置100は、正解ラベルを推論するための各画素の重要度を示すオブジェクト単位重要特徴指標マップを生成する。
【0230】
また、第4の実施形態に係る解析装置100は、オブジェクト単位重要特徴指標マップの画素値を、スーパーピクセル単位(ピクセルの集合単位)で加算し、加算値が所定の条件を満たすオブジェクト単位重要スーパーピクセルを抽出する。そして、第4の実施形態に係る解析装置100は、抽出したオブジェクト単位重要スーパーピクセルを、注目度合いマップの所定レベルの領域に絞り込む。
【0231】
また、第4の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像とに基づいて演算される画像(差分画像、SSIM画像)と、重要特徴マップとから、絞り込んだオブジェクト単位重要スーパーピクセルに対応する領域を切り出す。そして、第4の実施形態に係る解析装置100は、切り出した画像を画素単位で強度調整処理する。
【0232】
このように、注目度合いマップの所定レベルの領域に絞り込まれたオブジェクト単位重要スーパーピクセルについて、画素単位で強度調整処理することで、第4の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0233】
[第5の実施形態]
上記第4の実施形態では、誤推論画像抽出部120により誤推論画像として抽出された入力画像について、誤推論原因抽出処理を行うものとして説明した。しかしながら、誤推論原因抽出処理を行う入力画像は、誤推論画像抽出部120により誤推論画像として抽出された入力画像に限定されない。
【0234】
例えば、誤推論画像抽出部120により、正解ラベルと一致すると判定された入力画像(正推論画像と称す)の一部を変形することで、正解ラベルと一致しなくなった誤推論画像について、誤推論原因抽出処理を行ってもよい。
【0235】
この場合、正推論画像をスコア最大化リファイン画像として誤推論原因抽出処理が行われることとなる。つまり、誤推論原因抽出部140では、リファイン画像生成部141によるスコア最大化リファイン画像を生成する処理を省略することができる。
【0236】
[第6の実施形態]
上記第4の実施形態では、誤推論画像に2つのオブジェクトが含まれる場合について説明したが、誤推論画像に含まれるオブジェクトの数は、2つに限定されず、1つであってもよいし、3つ以上であってもよい。
【0237】
また、上記第4の実施形態では、注目度合いマップの各レベルの領域について詳細原因解析処理を行うものとして説明した。しかしながら、詳細原因解析処理の方法はこれに限定されない。例えば、誤推論画像に含まれるオブジェクトごとに異なるレベルを設定し、設定したレベルの領域について、詳細原因解析処理を行ってもよい。
【0238】
[第7の実施形態]
上記第4の実施形態では、オブジェクト単位重要スーパーピクセルを、注目度合いマップの所定レベルの領域に絞り込むものとして説明した。しかしながら、絞り込み部1723による絞り込み方法はこれに限定されず、レベルに応じた絞り込み処理を行うようにしてもよい。
【0239】
図29は、絞り込み部の処理の詳細を示す第1の図である。なお、
図29では、説明を簡略化するために、スーパーピクセルの形状を正方形としている。また、
図29に示すように、注目度合いマップ1010のレベル1の領域1011_1~レベル3の領域1011_3が、オブジェクト単位重要スーパーピクセル2900上に位置しているものとする。
【0240】
この場合、絞り込み部1723では、各レベルに応じたオブジェクト単位絞り込み重要スーパーピクセルに絞り込む。
図29の右側上段は、オブジェクト単位重要スーパーピクセル2900に対して、レベル1の領域1011_1(ハッチングした領域)に絞り込んだ様子を示している。
【0241】
同様に、
図29の右側中段は、オブジェクト単位重要スーパーピクセル2900に対して、レベル2の領域1011_2(ハッチングした領域)に絞り込んだ様子を示している。
【0242】
同様に、
図29の右側下段は、オブジェクト単位重要スーパーピクセル2900に対して、レベル3の領域1011_3(ハッチングした領域)に絞り込んだ様子を示している。
【0243】
このように、絞り込み部1723では、オブジェクト単位重要スーパーピクセルを、注目度合いマップの各レベルに応じた領域に絞り込むことができる。
【0244】
また、上記第4の実施形態では、オブジェクト単位重要スーパーピクセルと、注目度合いマップの所定レベルの領域との形状の違いについて言及しなかったが、オブジェクト単位重要スーパーピクセルと、注目度合いマップの所定レベルの領域とは、形状が異なる。このため、注目度合いマップの所定レベルの領域と、オブジェクト単位重要スーパーピクセルとは、境界が一致しない。
【0245】
図30は、絞り込み部の処理の詳細を示す第2の図である。
図30に示すように、絞り込み部1723では、
図30(a)~(c)のいずれかのハッチング領域を、オブジェクト単位絞り込み重要スーパーピクセルとして出力することができる。
【0246】
このうち、
図30(a)は、オブジェクト単位重要スーパーピクセル2900を、注目度合いマップ1010のレベル1の領域1011_1に絞り込む際、
・領域1011_1内に位置するオブジェクト単位重要スーパーピクセルと、
・領域1011_1の境界線を含むオブジェクト単位重要スーパーピクセルと、
をオブジェクト単位絞り込み重要スーパーピクセルとして出力する場合を示している。
【0247】
一方、
図30(b)は、オブジェクト単位重要スーパーピクセル2900を、注目度合いマップ1010のレベル1の領域1011_1に絞り込む際、
・領域1011_1内に位置するオブジェクト単位重要スーパーピクセル、
をオブジェクト単位絞り込み重要スーパーピクセルとして出力する場合を示している。
【0248】
また、
図30(c)は、オブジェクト単位重要スーパーピクセル2900を、注目度合いマップ1010のレベル1の領域1011_1に絞り込む際、
・領域1011_1内に位置するオブジェクト単位重要スーパーピクセルと、
・領域1011_1の境界線に沿って分割されたオブジェクト単位重要スーパーピクセルと、
をオブジェクト単位絞り込み重要スーパーピクセルとして出力する場合を示している。
【0249】
このように、絞り込み部1723では、オブジェクト単位重要スーパーピクセルと、注目度合いマップの所定レベルの領域との形状が異なっていた場合でも、様々な方法で絞り込みを行うことができる。
【0250】
[第8の実施形態]
上記第1の実施形態では、誤推論画像に含まれる2つのオブジェクトが、いずれも車両である場合について説明した。しかしながら、誤推論画像に含まれる2つのオブジェクトは、車両に限定されず、車両以外のオブジェクトであってもよい。
【0251】
なお、開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成する注目度合いマップ生成部と、
前記誤推論画像と前記リファイン画像とに基づいて演算される画像のうち、前記注目度合いマップの所定レベルの領域に対応する画像を切り出して画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する可視化部と
を有する解析装置。
(付記2)
前記注目度合いマップ生成部は、Grad-CAM法を用いることで、前記注目度合いマップを生成する、付記1に記載の解析装置。
(付記3)
前記可視化部は、
前記誤推論画像と前記リファイン画像との差分に基づいて演算される差分画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、
前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を切り出した画像と、
を乗算することで得られる乗算画像を、画素単位で強度調整処理する、付記1または2に記載の解析装置。
(付記4)
前記可視化部は、
前記注目度合いマップの所定レベルの領域に対応する画像を、ピクセルの集合単位で切り出して画素単位で強度調整処理する、付記1または2に記載の解析装置。
(付記5)
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示すマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップとを、重畳することで、正解ラベルを推論するための各画素の重要度を示す重要特徴指標マップを生成する重要特徴指標マップ生成部と、
前記重要特徴指標マップの画素値をピクセルの集合単位で加算し、加算値が所定の条件を満たすピクセルの集合を抽出する抽出部と、
抽出されたピクセルの集合を、前記注目度合いマップの所定レベルの領域に絞り込む絞り込み部と、を有し、
前記可視化部は、前記注目度合いマップの所定レベルの領域に対応する画像を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出して画素単位で強度調整処理する、付記4に記載の解析装置。
(付記6)
前記可視化部は、
前記誤推論画像と前記リファイン画像との差分に基づいて算出される差分画像から、前記注目度合いの所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記注目度合いマップの所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップから、前記注目度合いマップの所定レベルの領域を、前記絞り込み部により絞り込まれたピクセルの集合単位で切り出した画像と、
を乗算することで得られる乗算画像を、画素単位で強度調整処理する、付記5に記載の解析装置。
(付記7)
前記強度調整処理は、画素値の強弱を調整する処理である、付記6に記載の解析装置。
(付記8)
前記画像生成部は、推論時に算出する、前記誤推論画像に含まれる推論対象に関する情報を用いて、前記誤推論画像から前記リファイン画像を生成する、付記1に記載の解析装置。
(付記9)
前記画像生成部は、推論時に、前記推論対象に関する情報として、前記誤推論画像における推論対象の位置及び大きさ、存在確率、推論対象を正しく検出できたか否かを示す評価指標、推論対象が外接矩形に含まれる確率、のいずれかを算出する、付記8に記載の解析装置。
(付記10)
前記画像生成部は、推論時に算出する前記推論対象に関する情報と、前記誤推論画像に含まれる推論対象に関する正解情報との誤差を用いて、前記誤推論画像から前記リファイン画像を生成する、付記8に記載の解析装置。
(付記11)
前記画像生成部は、前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論の正解ラベルのスコアを最大化させた1のリファイン画像を生成する、付記8乃至10のいずれかの付記に記載の解析装置。
(付記12)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成し、
前記誤推論画像と前記リファイン画像とに基づいて演算される画像のうち、前記注目度合いマップの所定レベルの領域に対応する画像を切り出して画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する、
処理をコンピュータに実行させるための解析プログラム。
(付記13)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記リファイン画像の複数の画素のうち推論時に注目した注目度合いが同レベルとなる画素の領域を示す注目度合いマップを生成し、
前記誤推論画像と前記リファイン画像とに基づいて演算される画像のうち、前記注目度合いマップの所定レベルの領域に対応する画像を切り出して画素単位で強度調整処理することで、誤推論の原因となる画像箇所を可視化する、
処理をコンピュータが実行する解析方法。
【0252】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0253】
100 :解析装置
140 :誤推論原因抽出部
141 :リファイン画像生成部
142 :注目度合いマップ生成部
143 :詳細原因解析部
301 :画像リファイナ部
302 :画像誤差演算部
303 :推論部
304 :誤差演算部
311 :注目領域導出部
1101 :画像差分演算部
1102 :SSIM演算部
1103 :切り出し部
1104 :作用部
1710 :重要特徴指標マップ生成部
1711 :重要特徴マップ生成部
1712 :劣化尺度マップ生成部
1713 :重畳部
1720 :特定部
1721 :スーパーピクセル分割部
1722 :重要スーパーピクセル決定部
1723 :絞り込み部
1730 :詳細原因解析部
2010 :分割部
2301 :BP演算部
2302 :切り出し部