(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-15
(45)【発行日】2023-05-23
(54)【発明の名称】解析プログラム、解析装置及び解析方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20230516BHJP
G06N 3/04 20230101ALI20230516BHJP
【FI】
G06T7/00 350C
G06N3/04
(21)【出願番号】P 2019103236
(22)【出願日】2019-05-31
【審査請求日】2022-02-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】久保田 智規
(72)【発明者】
【氏名】村田 康之
(72)【発明者】
【氏名】平▲柳▼ 幸彦
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】国際公開第2013/118218(WO,A1)
【文献】米国特許第09298883(US,B2)
【文献】米国特許第08494273(US,B2)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06N 3/04
(57)【特許請求の範囲】
【請求項1】
画像認識処理において、誤ったラベルが推論された際の入力画像である誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成し、
前記誤推論画像のうちの所定の領域が前記リファイン画像で置き換えられた画像が、推論部に入力されることで推論されたラベルのスコアに基づいて、前記所定の領域を絞り込み、誤推論の原因となる画像箇所を特定する、
処理をコンピュータに実行させるための解析プログラム。
【請求項2】
前記ラベルが推論された際の前記推論部の情報から、前記ラベルの推論に影響する度合いを示すマップを生成し、
生成された前記マップに応じた大きさに、前記所定の領域を絞り込む、請求項1に記載の解析プログラム。
【請求項3】
Grad-CAM法を用いることで、前記推論部の情報から推論の際に前記推論部が注目した前記誤推論画像の各画像部分の注目度合いを示すマップを生成し、
前記所定の領域を、所定のレベル以上の注目度合いを有する画像部分に絞り込む、請求項2に記載の解析プログラム。
【請求項4】
前記誤推論画像のうちの前記所定の領域を、推論の正解ラベルのスコアが最大となるように変更しながら、前記リファイン画像を生成する、請求項3に記載の解析プログラム。
【請求項5】
前記誤推論画像の全体を、推論の正解ラベルのスコアが最大となるように変更しながら、前記リファイン画像を生成する、請求項3に記載の解析プログラム。
【請求項6】
前記所定のレベルを上げて前記所定の領域を絞り込むことで、前記推論部が推論したラベルのスコアが許容値を下回った場合に、絞り込む前の領域を、前記誤推論の原因となる画像箇所として特定する、請求項4または5に記載の解析プログラム。
【請求項7】
前記リファイン画像を生成する際に前記誤推論画像から変更された変更部分と、前記推論部の情報から算出される前記誤推論画像の特徴部分とを重畳することで、前記誤推論画像の各画素の重要特徴を示すマップを生成し、
前記誤推論画像をスーパーピクセルに分割し、
前記スーパーピクセルごとに、前記各画素の重要特徴を示すマップの画素値を加算した場合の加算値が、所定の閾値以上となるスーパーピクセルに、前記所定の領域を絞り込む、請求項2に記載の解析プログラム。
【請求項8】
前記誤推論画像と前記リファイン画像との差分に基づいて、前記リファイン画像を生成する際に前記誤推論画像から変更された変更部分を算出し、
BP法またはGBP法を用いることで、前記推論部の情報から推論の際に前記推論部が用いた前記リファイン画像の特徴部分を算出する、請求項7に記載の解析プログラム。
【請求項9】
前記誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら前記リファイン画像を生成する場合において、前記リファイン画像を生成するごとに、前記誤推論画像の各画素の重要特徴を示すマップをそれぞれ生成し、
前記スーパーピクセルごとに、前記各画素の重要特徴を示すマップのそれぞれの画素値の平均値を加算することで、前記加算値を算出する、請求項7に記載の解析プログラム。
【請求項10】
前記所定の領域が絞り込まれた後に、前記誤推論画像を、推論の正解ラベルのスコアが最大となるように、再度、変更してリファイン画像を生成し、再度、所定の閾値以上となるスーパーピクセルに、前記所定の領域を絞り込む、請求項7に記載の解析プログラム。
【請求項11】
前記誤推論画像と前記リファイン画像との差分に基づいて算出される差分画像から、前記所定の領域を切り出した画像と、前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記所定の領域を切り出した画像と、を乗算することで得られる乗算画像を、前記誤推論画像にて可視化する、請求項1に記載の解析プログラム。
【請求項12】
前記誤推論画像と前記リファイン画像との差分に基づいて算出される差分画像から、前記所定の領域を切り出した画像と、
前記誤推論画像と前記リファイン画像とをSSIM演算することで得られるSSIM画像から、前記所定の領域を切り出した画像と、
BP法またはGBP法を用いることで、前記推論部の情報から推論の際に前記推論部が用いた前記リファイン画像の特徴部分のうち、前記所定の領域を切り出した画像と、
を乗算することで得られる乗算画像を、前記誤推論画像にて可視化する請求項1に記載の解析プログラム。
【請求項13】
画像認識処理において、誤ったラベルが推論された際の入力画像である誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成するリファイン画像生成部と、
前記誤推論画像のうちの所定の領域が前記リファイン画像で置き換えられた画像が、推論部に入力されることで推論されたラベルのスコアに基づいて、前記所定の領域を絞り込み、誤推論の原因となる画像箇所を特定する特定部と
を有する解析装置。
【請求項14】
画像認識処理において、誤ったラベルが推論された際の入力画像である誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成し、
前記誤推論画像のうちの所定の領域が前記リファイン画像で置き換えられた画像が、推論部に入力されることで推論されたラベルのスコアに基づいて、前記所定の領域を絞り込み、誤推論の原因となる画像箇所を特定する、
処理をコンピュータが実行する解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、解析プログラム、解析装置及び解析方法に関する。
【背景技術】
【0002】
従来より、CNN(Convolutional Neural Network)を用いた画像認識処理において、誤ったラベルが推論された場合の誤推論の原因を解析する解析技術が知られている。一例として、スコア最大化法(Activation Maximization)等が挙げられる。また、CNNを用いた画像認識処理において、推論の際に特徴として反応した特徴部分を解析する解析技術が知られている。一例として、Grad-CAM法、GBP(Guided Back Propagation)法等が挙げられる。
【0003】
このうち、スコア最大化法は、推論の正解ラベルが最大スコアとなるように入力画像を変更した際の変更部分を、誤推論の原因となる画像箇所として特定する方法である。また、Grad-CAM法は、推論したラベルから逆伝播した情報を用いて推論の際の注目部分を算出し、算出した注目部分を、推論の際に反応した特徴部分として特定する方法である。更に、GBP法は、推論したラベルから逆伝播し、入力画像までたどることで、推論の際に反応した特徴部分を可視化する方法である。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-097807号公報
【文献】特開2018-045350号公報
【非特許文献】
【0005】
【文献】Ramprasaath R.Selvariju,et al.:Grad-cam:Visual explanations from deep networks via gradient-based localization.The IEEE International Conference on Computer Vision(ICCV),pp.618-626,2017.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した解析技術の場合、誤推論の原因となる画像箇所を十分な精度で特定することができないという問題がある。
【0007】
一つの側面では、誤推論の原因となる画像箇所を特定する際の精度を向上させることを目的としている。
【課題を解決するための手段】
【0008】
一態様によれば、解析プログラムは、
画像認識処理において、誤ったラベルが推論された際の入力画像である誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成し、
前記誤推論画像のうちの所定の領域が前記リファイン画像で置き換えられた画像が、推論部に入力されることで推論されたラベルのスコアに基づいて、前記所定の領域を絞り込み、誤推論の原因となる画像箇所を特定する、
処理をコンピュータに実行させる。
【発明の効果】
【0009】
誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【図面の簡単な説明】
【0010】
【
図2】解析装置のハードウェア構成の一例を示す図である。
【
図3】誤推論原因抽出部の機能構成の一例を示す第1の図である。
【
図4】リファイン画像生成部の処理の具体例を示す図である。
【
図5】変更可能領域及び変更不可領域の変化例を示す図である。
【
図6】合成画像が生成されるまでの処理の具体例を示す第1の図である。
【
図8】誤推論原因抽出処理の流れを示す第1のフローチャートである。
【
図9】誤推論原因抽出処理の流れを示す第2のフローチャートである。
【
図10】誤推論原因抽出部の機能構成の一例を示す第2の図である。
【
図11】合成画像が生成されるまでの処理の具体例を示す第2の図である。
【
図12】誤推論原因抽出処理の流れを示す第3のフローチャートである。
【
図13】誤推論原因抽出部の機能構成の一例を示す第3の図である。
【
図14】マップ生成部の処理の具体例を示す図である。
【
図15】スーパーピクセル分割部の処理の具体例を示す図である。
【
図16】重要スーパーピクセル決定部の処理の具体例を示す図である。
【
図17】合成画像が生成されるまでの処理の具体例を示す第3の図である。
【
図18】誤推論原因抽出処理の流れを示す第4のフローチャートである。
【
図19】誤推論原因抽出処理の流れを示す第5のフローチャートである。
【
図20】誤推論原因抽出処理の具体例を示す第1の図である。
【
図21】誤推論原因抽出部の機能構成の一例を示す第4の図である。
【
図22】誤推論原因抽出処理の具体例を示す第2の図である。
【
図23】誤推論原因抽出部の機能構成の一例を示す第5の図である。
【
図24】誤推論原因抽出処理の具体例を示す第3の図である。
【
図25】誤推論原因抽出部の機能構成の一例を示す第6の図である。
【
図26】詳細原因解析部の機能構成の一例を示す第1の図である。
【
図27】詳細原因解析部の処理の具体例を示す第1の図である。
【
図28】詳細原因解析処理の流れを示す第1のフローチャートである。
【
図29】誤推論原因抽出部の機能構成の一例を示す第7の図である。
【
図30】詳細原因解析部の機能構成の一例を示す第2の図である。
【
図31】詳細原因解析部の処理の具体例を示す第2の図である。
【
図32】詳細原因解析処理の流れを示す第2のフローチャートである。
【発明を実施するための形態】
【0011】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0012】
[第1の実施形態]
<解析装置の機能構成>
はじめに、第1の実施形態に係る解析装置の機能構成について説明する。
図1は、解析装置の機能構成の一例を示す図である。解析装置100には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置100は、推論部110、誤推論画像抽出部120、誤推論原因抽出部140として機能する。
【0013】
推論部110は、学習済みのCNNを用いて画像認識処理を行う。具体的には、推論部110は、入力画像10が入力されることで、入力画像10に含まれるオブジェクトの種類(本実施形態では、車両の種類)を示すラベルを推論し、推論したラベルを出力する。
【0014】
誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの種類を示すラベル(既知)と、推論部110により推論されたラベルとが一致するか否かを判定する。また、誤推論画像抽出部120は、一致しないと判定した際の(誤ったラベルが推論された際の)入力画像を、“誤推論画像”として抽出し、誤推論画像格納部130に格納する。
【0015】
誤推論原因抽出部140は、誤推論画像について、誤推論の原因となる画像箇所を特定し、誤推論原因情報を出力する。具体的には、誤推論原因抽出部140は、リファイン画像生成部141と、マップ生成部142と、特定部143とを有する。
【0016】
リファイン画像生成部141は、誤推論画像格納部130に格納された誤推論画像を読み出す。また、リファイン画像生成部141は、読み出した誤推論画像を入力した際の正解ラベルのスコアが最大となるように誤推論画像を変更し、スコア最大化リファイン画像を生成する。
【0017】
マップ生成部142は、誤推論の原因を解析する従来の解析技術等を用いて、ラベルの推論に影響する領域を識別するマップを生成する。
【0018】
特定部143は、誤推論画像のうち、生成されたマップに含まれる、ラベルの推論に影響する領域について、生成されたリファイン画像で置き換える。また、特定部143は、当該領域をリファイン画像で置き換えた誤推論画像を入力としてラベルを推論し、推論したラベルのスコアから、置き換えの効果を判定する。
【0019】
また、特定部143は、ラベルの推論に影響する領域の大きさを変えながら(絞り込みながら)入力することでラベルを推論し、推論したラベルのスコアの変遷から、誤推論の原因となる画像箇所を特定する。更に、特定部143は、特定した誤推論の原因となる画像箇所を、誤推論原因情報として出力する。
【0020】
このように、ラベルの推論に影響する領域をリファイン画像で置き換える際、置き換えの効果を参照しながら領域を絞り込むことで、誤推論の原因となる画像箇所を精度よく特定することができる。
【0021】
<解析装置のハードウェア構成>
次に、解析装置100のハードウェア構成について説明する。
図2は、解析装置のハードウェア構成の一例を示す図である。
図2に示すように、解析装置100は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
【0022】
また、解析装置100は、補助記憶装置204、表示装置205、操作装置206、I/F(Interface)装置207、ドライブ装置208を有する。なお、解析装置100の各ハードウェアは、バス209を介して相互に接続されている。
【0023】
CPU201は、補助記憶装置204にインストールされている各種プログラム(例えば、解析プログラム等)を実行する演算デバイスである。なお、
図2には示していないが、演算デバイスとしてアクセラレータ(例えば、GPU(Graphics Processing Unit)など)を組み合わせてもよい。
【0024】
ROM202は、不揮発性メモリである。ROM202は、補助記憶装置204にインストールされている各種プログラムをCPU201が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM202はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
【0025】
RAM203は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM203は、補助記憶装置204にインストールされている各種プログラムがCPU201によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
【0026】
補助記憶装置204は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。例えば、誤推論画像格納部130は、補助記憶装置204において実現される。
【0027】
表示装置205は、誤推論原因情報等を含む各種表示画面を表示する表示デバイスである。操作装置206は、解析装置100のユーザが解析装置100に対して各種指示を入力するための入力デバイスである。
【0028】
I/F装置207は、例えば、不図示のネットワークと接続するための通信デバイスである。
【0029】
ドライブ装置208は記録媒体210をセットするためのデバイスである。ここでいう記録媒体210には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体210には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0030】
なお、補助記憶装置204にインストールされる各種プログラムは、例えば、配布された記録媒体210がドライブ装置208にセットされ、該記録媒体210に記録された各種プログラムがドライブ装置208により読み出されることでインストールされる。あるいは、補助記憶装置204にインストールされる各種プログラムは、不図示のネットワークよりダウンロードされることでインストールされてもよい。
【0031】
<誤推論原因抽出部の機能構成>
次に、第1の実施形態に係る解析装置100において実現される機能のうち、誤推論原因抽出部140の機能構成の詳細について説明する。
図3は、誤推論原因抽出部の機能構成の一例を示す第1の図である。以下、誤推論原因抽出部140の各部(リファイン画像生成部141、マップ生成部142、特定部143)の詳細について説明する。
【0032】
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部141の詳細について説明する。
図3に示すように、リファイン画像生成部141は、画像リファイナ部301、画像誤差演算部302、推論部303、スコア誤差演算部304を有する。
【0033】
画像リファイナ部301は、例えば、画像の生成モデルとしてCNNを用いて、マスク画像からリファイン画像を生成する。マスク画像とは、誤推論画像の一部がマスクされた画像である。画像リファイナ部301では、マスクされていない領域の誤推論画像を変更することで、リファイン画像を生成する。
【0034】
なお、画像リファイナ部301では、生成したリファイン画像を用いて推論した際に、正解ラベルのスコアが最大となるように、誤推論画像を変更する。また、画像リファイナ部301では、例えば、画像の生成モデルを用いてリファイン画像を生成する際には、誤推論画像からの変更量(リファイン画像と誤推論画像との差分)が小さくなるように、リファイン画像を生成する。これにより、画像リファイナ部301によれば、視覚的に変更前の画像(誤推論画像)に近い画像(リファイン画像)を得ることができる。
【0035】
具体的には、画像リファイナ部301では、画像の生成モデルとしてCNNを用いる場合、
・生成したリファイン画像を用いて推論した際のスコアと正解ラベルのスコアを最大にしたスコアとの誤差(スコア誤差)と、
・生成したリファイン画像と誤推論画像との差分である画像差分値と、
を最小化するようにCNNの学習を行う。
【0036】
画像誤差演算部302は、誤推論画像と、学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。画像誤差演算部302では、例えば、画素ごとの差分(L1差分)やSSIM(Structural Similarity)演算を行うことにより、画像差分値を算出する。
【0037】
推論部303は、合成画像を入力として推論し、推論したラベルのスコアを出力する、学習済みのCNNを有する。合成画像とは、マスクされていない領域の誤推論画像を変更することで得られたリファイン画像と、マスクされた領域の誤推論画像とを合成することで得られる画像である。つまり、合成画像とは、マスクされていない領域をリファイン画像で置き換えた誤推論画像に他ならない。
【0038】
なお、推論部303により出力されたスコアは、スコア誤差演算部304に通知される。
【0039】
スコア誤差演算部304は、推論部303により通知されたスコアと、正解ラベルのスコアを最大にしたスコアとの誤差を算出し、画像リファイナ部301にスコア誤差を通知する。スコア誤差演算部304により通知されたスコア誤差は、画像リファイナ部301においてCNNの学習に用いられる。
【0040】
なお、画像リファイナ部301が有するCNNの学習中に画像リファイナ部301から出力されるリファイン画像は、リファイン画像格納部305に格納される。画像リファイナ部301が有するCNNの学習は、
・予め定められた学習回数分(例えば、最大学習回数=N回分)、あるいは、
・正解ラベルのスコアが所定の閾値を超えるまで、あるいは、
・正解ラベルのスコアが所定の閾値を超え、かつ、画像差分値が所定の閾値より小さくなるまで、
行われ、推論部303より出力される正解ラベルのスコアが最大化した際のリファイン画像を、以下では、“スコア最大化リファイン画像”と称す。
【0041】
(2)マップ生成部の詳細
次に、マップ生成部142の詳細について説明する。
図3に示すように、マップ生成部142は、注目領域導出部311を有する。
【0042】
注目領域導出部311は、推論部303がスコア最大化リファイン画像を含む合成画像を用いてラベルを推論した際の、推論部構造情報(CNNのネットワークの構造、モデルパラメータ等)と特徴マップとを、推論部303より取得する。
【0043】
また、注目領域導出部311は、Grad-CAM法を用いることで、推論部構造情報及び特徴マップに基づいて、誤推論画像上の各画像部分の注目度合いを算出し、注目度合いマップを生成する。
【0044】
具体的には、注目領域導出部311は、推論部構造情報と特徴マップとに基づいて、以下の手順により、注目度合いマップを生成する。
・推論部303が推論したラベルから、そのラベルのみ誤差があるとして逆伝播し、畳み込み最終層で得られる勾配情報についてチャネルごとに平均値を求め、各チャネルの重要度を決定する。
・各チャネルの特徴マップに重要度を重みとして乗算し、全てのチャネルの同一座標の値を足し合わせた結果に、活性化関数(ReLU)を適用することで正値のみの画像を生成する。
・生成した画像において、画素値が大きい(勾配が大きい)注目部分をヒートマップにより可視化することで注目度合いマップを生成する。
【0045】
なお、注目領域導出部311は、生成した注目度合いマップを、注目度合いマップ格納部312に格納する。
【0046】
(3)特定部の詳細
次に、特定部143の詳細について説明する。
図3に示すように、特定部143は、変更領域制限情報生成部321、マスク画像生成部322、領域抽出部323、合成部324、判断部325を有する。
【0047】
変更領域制限情報生成部321は、注目度合いマップ格納部312より、注目度合いマップを読み出す。また、変更領域制限情報生成部321は、読み出した注目度合いマップにおいて、注目度合いが所定のレベル以上の領域(ラベルの推論に影響する領域)を変更可能領域と規定し、注目度合いが所定のレベル未満の領域を変更不可領域と規定する。また、変更領域制限情報生成部321は、規定した変更可能領域及び変更不可領域を、マスク画像生成部322及び領域抽出部323に通知する。
【0048】
なお、変更領域制限情報生成部321では、変更可能領域及び変更不可領域を規定する際に用いるレベルを徐々に上げることで、変更可能領域を狭くし、変更不可領域を広げていく(変更可能領域を絞り込む)。このように、変更領域制限情報生成部321では、変更可能領域及び変更不可領域の大きさを更新するごとに、更新後の変更可能領域及び変更不可領域を、マスク画像生成部322及び領域抽出部323に通知する。また、更新後の変更可能領域及び変更不可領域を通知したことに応じて、判断部325から所定の指示があった場合に、変更領域制限情報生成部321では、更新直前の変更可能領域を、誤推論の原因となる画像箇所として特定する。更に、変更領域制限情報生成部321は、特定した画像箇所を誤推論原因情報として出力する。
【0049】
マスク画像生成部322は、通知された変更可能領域及び変更不可領域に基づいて、誤推論画像を処理する。具体的には、マスク画像生成部322は、誤推論画像のうち、変更不可領域に対応する画像部分をマスクし、変更可能領域に対応する画像部分をマスクしないマスク画像を生成する。また、マスク画像生成部322は、生成したマスク画像を、画像リファイナ部301に入力する。
【0050】
領域抽出部323は、通知された変更可能領域及び変更不可領域に基づいて、リファイン画像(またはスコア最大化リファイン画像)と、誤推論画像とを処理する。具体的には、領域抽出部323は、誤推論画像から、変更不可領域に対応する画像部分を抽出し、合成部324に出力する。また、領域抽出部323は、リファイン画像(またはスコア最大化リファイン画像)から、変更可能領域に対応する画像部分を抽出し、合成部324に出力する。
【0051】
合成部324は、領域抽出部323より出力された、誤推論画像の変更不可領域に対応する画像部分と、リファイン画像(またはスコア最大化リファイン画像)の変更可能領域に対応する画像部分とを合成し、合成画像を生成する。また、合成部324は、生成した合成画像を推論部303に入力する。
【0052】
判断部325は、スコア最大化リファイン画像を含む合成画像が推論部303に入力されたことに応じて推論部303より出力される正解ラベルのスコアを取得する。また、判断部325は、取得した正解ラベルのスコアの変遷を監視し、所定のスコア許容値を下回った場合に、変更領域制限情報生成部321に所定の指示を通知する。
【0053】
なお、判断部325は、取得した正解ラベルのスコアの変遷が所定のスコア許容値以上を維持していると判断した場合、変更可能領域及び変更不可領域を規定する際に用いるレベルを上げるよう、変更領域制限情報生成部321に指示する。
【0054】
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部の処理の具体例について説明する。
【0055】
(1)リファイン画像生成部の処理の具体例
はじめに、リファイン画像生成部141の処理の具体例について説明する。
図4は、リファイン画像生成部の処理の具体例を示す図である。
図4の左側の例は、正解ラベル=“車種A”の車両が含まれる誤推論画像410を入力として推論した結果、ラベル=“車種B”と誤推論した様子を示している。
【0056】
また、
図4の左側の例は、誤推論画像410を入力として推論した際のスコアが、
・車種Aのスコア=0.0142、
・車種Bのスコア=0.4549、
・車種Cのスコア=0.0018、
・車種Dのスコア=0.0011、
であったことを示している。
【0057】
一方、
図4の右側の例は、リファイン画像生成部141が、誤推論画像410からリファイン画像を生成する処理を行い、スコア最大化リファイン画像420を生成した様子を示している。
図4の右側の例では、リファイン画像生成部141が、誤推論画像410に対して、ヘッドライト421の色や、道路標示422の色を変更することで、スコア最大化リファイン画像420を生成したことを示している。
【0058】
また、
図4の右側の例は、スコア最大化リファイン画像420を入力として推論した場合、正解ラベル=“車種A”と一致するラベルを推論できたことを示している。更に、
図4の右側の例は、スコア最大化リファイン画像420を入力として推論した際のスコアが、
・車種Aのスコア=0.9927、
・車種Bのスコア=0.0042、
・車種Cのスコア=0.0022、
・車種Dのスコア=0.0003、
であったことを示している。
【0059】
このように、リファイン画像生成部141によれば、誤推論画像410を変更することで、正解ラベルと一致するラベルを推論でき、かつ、正解ラベルのスコアが最大となるスコア最大化リファイン画像420を生成することができる。
【0060】
なお、
図4の右側の例で示すように、リファイン画像生成部141により生成されるスコア最大化リファイン画像420の場合、誤推論画像410に対して、車両と無関係な路面標示まで変更される可能性がある。正解ラベルのスコアを最大化する学習での誤差逆伝播は、正解ラベルのスコアに影響するCNNの経路(ユニット)に影響を及ぼすが、影響を及ぼされた経路(ユニット)が必ずしも誤推論の原因と関係しているとは限らないためである。
【0061】
つまり、従来のスコア最大化法のように、変更部分に基づいて誤推論の原因となる画像箇所を特定しようとした場合、十分な精度で特定することができないという問題がある(変更部分について、更なる絞り込みが必要である)。
【0062】
(2)特定部の処理の具体例
次に、特定部143の各部(変更領域制限情報生成部321、マスク画像生成部322、領域抽出部323、合成部324、判断部325)の処理の具体例について説明する。
【0063】
(2-1)変更領域制限情報生成部の処理の具体例
はじめに、特定部143に含まれる変更領域制限情報生成部321の処理の具体例について説明する。
図5は、変更可能領域及び変更不可領域の変化例を示す図である。
図5の場合、マップ生成部142において生成された注目度合いマップ510には、注目度合いのレベルが異なる5つの画像部分が含まれている。
【0064】
具体的には、注目度合いマップ510の画像部分511は、第1のレベルの注目度合いを有する画像部分である。同様に、画像部分512~515は、それぞれ、第2のレベルから第5のレベルの注目度合いを有する画像部分である。
【0065】
上述したとおり、変更領域制限情報生成部321では、変更可能領域及び変更不可領域を規定する際、判断部325からの指示に応じてレベルを徐々に上げ、変更可能領域を狭くし、変更不可領域を広げていく。
【0066】
図5において、画像521から画像524は、変更領域制限情報生成部321が規定する変更可能領域及び変更不可領域を模式的に示した図であり、白色部分は、変更可能領域を表し、黒色部分は、変更不可領域を表している。
【0067】
具体的には、画像521は、変更領域制限情報生成部321が、注目度合いマップ510において、注目度合いが第2のレベル以上の画像部分を変更可能領域と規定し、注目度合いが第2のレベル未満の画像部分を変更不可領域と規定したことを示している。
【0068】
同様に、画像522は、変更領域制限情報生成部321が、注目度合いマップ510において、注目度合いが第3のレベル以上の画像部分を変更可能領域と規定し、注目度合いが第3のレベル未満の画像部分を変更不可領域と規定したことを示している。
【0069】
以下、画像523及び画像524は、それぞれ、注目度合いが第4のレベル以上、第5のレベル以上の画像部分を変更可能領域と規定し、注目度合いが第4のレベル未満、第5のレベル未満の画像部分を変更不可領域と規定したことを示している。
【0070】
(2-2)マスク画像生成部、領域抽出部及び合成部の処理の具体例
次に、特定部143に含まれるマスク画像生成部322、領域抽出部323及び合成部324の処理(合成画像が生成されるまでの処理)の具体例について説明する。
図6は、合成画像が生成されるまでの処理の具体例を示す第1の図である。
図6の上段において、画像521は、変更領域制限情報生成部321が第2のレベルに基づいて規定した変更可能領域及び変更不可領域を、それぞれ、白色部分と黒色部分として表したものである。
【0071】
図6の上段に示すように、マスク画像生成部322は、誤推論画像410のうち、変更不可領域に対応する画像部分(黒色部分)をマスクし、変更可能領域に対応する画像部分(白色部分)をマスクしないマスク画像610を生成する。また、領域抽出部323は、画像リファイナ部301にてマスク画像610が変更されることで生成されたリファイン画像620を取得する。更に、領域抽出部323は、取得したリファイン画像620から、変更可能領域に対応する画像部分を抽出する。
【0072】
一方、
図6の下段において、画像521’は、変更領域制限情報生成部321が第2のレベルに基づいて規定した変更可能領域及び変更不可領域を、それぞれ、黒色部分と白色部分として表したものである。なお、画像521’は、画像521の白色部分と黒色部分とを反転した画像である(説明の便宜上、
図6の下段では、白色部分を変更不可領域、黒色部分を変更可能領域としている)。
【0073】
図6の下段に示すように、領域抽出部323は、誤推論画像410から、変更不可領域に対応する画像部分611を抽出する。
【0074】
図6に示す合成画像630は、リファイン画像620から抽出された変更可能領域に対応する画像部分と、誤推論画像410から抽出された変更不可領域に対応する画像部分611とを合成することで得られた合成画像である。
【0075】
なお、
図6の例は、第2のレベルに基づいて規定された変更可能領域及び変更不可領域を用いて合成画像630を生成するまでの処理を示したが、第3のレベル~第5のレベルについても同様の処理が行われ、順次、合成画像が生成される。
【0076】
(2-3)判断部の処理の具体例
次に、特定部143に含まれる判断部325の処理の具体例について説明する。
図7は、判断部の処理の具体例を示す図である。
図7において、横軸は、変更領域制限情報生成部321により規定される変更不可領域の大きさを表している(あるいは、注目度合いのレベルであってもよい)。また、
図7において、縦軸は、判断部325により取得されるスコアを表している。
【0077】
図7に示すように、変更不可領域の大きさが大きくなるにつれて(変更可能領域を絞り込むにつれて)、判断部325により取得される正解ラベルのスコアは低下していく。判断部325では、正解ラベルのスコアの変遷を監視し、予め定められたスコア許容値を下回った場合に、変更領域制限情報生成部321に通知する。
【0078】
これにより、変更領域制限情報生成部321では、スコア許容値を下回る直前の変更可能領域を、誤推論の原因となる画像箇所として特定することができる。
【0079】
図7の例の場合、画像523で表される変更不可領域が規定された際の正解ラベルのスコアから、画像524で表される変更不可領域が規定された際の正解ラベルのスコアに遷移する際に、スコア許容値を下回っている。このため、変更領域制限情報生成部321では、画像523の白色部分で示す変更可能領域を、誤推論の原因となる画像箇所として特定する。
【0080】
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図8及び
図9は、誤推論原因抽出処理の流れを示す第1及び第2のフローチャートである。
【0081】
ステップS801において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、リファイン画像を出力するCNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。更に、変更領域制限情報生成部321は、変更可能領域及び変更不可領域を規定する際に用いるレベルに初期値を設定する(変更可能領域を誤推論画像全体、変更不可領域をゼロに設定する)。
【0082】
ステップS802において、マスク画像生成部322は、変更領域制限情報生成部321より変更可能領域及び変更不可領域を取得する(ここでは、変更可能領域が誤推論画像全体であり、変更不可領域がゼロであるとする)。また、マスク画像生成部322は、取得した変更可能領域及び変更不可領域に基づいて、マスク画像を生成する。
【0083】
ステップS803において、画像リファイナ部301は、マスク画像を変更し、リファイン画像を生成する。
【0084】
ステップS804において、領域抽出部323は、リファイン画像から変更可能領域に対応する画像部分を抽出する。
【0085】
ステップS805において、領域抽出部323は、誤推論画像から変更不可領域に対応する画像部分を抽出する。
【0086】
ステップS806において、合成部324は、リファイン画像から抽出された変更可能領域に対応する画像部分と、誤推論画像から抽出された変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
【0087】
ステップS807において、推論部303は、合成画像を入力として推論し、正解ラベルのスコアを算出する。
【0088】
ステップS808において、注目領域導出部311は、ステップS807において推論した際の推論部構造情報及び特徴マップに基づいて、Grad-CAM法により、注目度合いマップを生成する。
【0089】
ステップS809において、変更領域制限情報生成部321は、注目度合いマップにおいて、所定のレベル以上の画像部分を変更可能領域と規定し、所定のレベル未満の画像部分を変更不可領域と規定する。
【0090】
続いて、
図9のステップS901において、画像リファイナ部301は、画像差分値とスコア誤差とを用いてCNNの学習を行う。
【0091】
ステップS902において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS902において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS902においてNoの場合には)、ステップS802に戻り、リファイン画像の生成を継続する。
【0092】
一方、ステップS902において、学習回数が最大学習回数を超えたと判定した場合には(ステップS902においてYesの場合には)、ステップS903に進む。なお、この時点で、リファイン画像格納部305には、スコア最大化リファイン画像が格納されている。
【0093】
ステップS903において、判断部325は、ステップS807において算出された正解ラベルのスコアが、スコア許容値より小さいか否かを判定する。ステップS903において、スコア許容値以上であると判定された場合には(ステップS903においてNoの場合には)、ステップS904に進む。
【0094】
ステップS904において、変更領域制限情報生成部321は、レベルを上げることにより変更可能領域及び変更不可領域を更新し、
図8のステップS802に戻る。
【0095】
一方、ステップS903において、スコア許容値より小さいと判定された場合には(ステップS903においてYesの場合には)、ステップS905に進む。
【0096】
ステップS905において、変更領域制限情報生成部321は、前回の変更可能領域を、誤推論の原因となる画像箇所として特定し、出力する。
【0097】
以上の説明から明らかなように、第1の実施形態に係る解析装置100は、誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成する。また、第1の実施形態に係る解析装置100は、リファイン画像を含む合成画像を入力として推論した際の推論部の構造情報から、Grad-CAM法を用いて注目度合いマップを生成する。また、第1の実施形態に係る解析装置100は、生成した注目度合いマップに基づいて規定した変更可能領域(正解ラベルの推論に影響する領域)が、リファイン画像で置き換えられた誤推論画像を推論部に入力することで推論する。更に、第1の実施形態に係る解析装置100は、推論した正解ラベルのスコアから、変更可能領域を絞り込むことで、誤推論の原因となる画像箇所を特定する。
【0098】
このように、正解ラベルの推論に影響する領域をリファイン画像で置き換え、置き換えの効果を参照しながら領域を絞り込むことで、誤推論の原因となる画像箇所を精度よく特定することができる。つまり、第1の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0099】
[第2の実施形態]
上記第1の実施形態では、マスク画像からスコア最大化リファイン画像を生成するものとして説明した。これに対して、第2の実施形態では、誤推論画像からスコア最大化リファイン画像を生成する。これにより、変更可能領域及び変更不可領域が更新されるごとに、スコア最大化リファイン画像を生成する必要がなくなり、誤推論原因抽出処理時の解析装置100の処理負荷を低減させることができる。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
【0100】
<誤推論原因抽出部の機能構成>
はじめに、第2の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。
図10は、誤推論原因抽出部の機能構成の一例を示す第2の図である。
図3に示した誤推論原因抽出部の機能構成との相違点は、リファイン画像生成部1010、特定部1020の機能が、
図3のリファイン画像生成部141、特定部143の機能と異なる点である。
【0101】
(1)リファイン画像生成部の詳細
図10に示すように、リファイン画像生成部1010において、画像リファイナ部301には、誤推論画像が入力される。また、画像リファイナ部301により出力されるリファイン画像は、推論部303に入力される。これにより、リファイン画像生成部1010では、誤推論画像からスコア最大化リファイン画像を生成する。
【0102】
(2)特定部の詳細
図10に示すように、特定部1020は、マスク画像生成部322を有しておらず、変更領域制限情報生成部321により規定された変更可能領域及び変更不可領域は、領域抽出部323にのみ通知される。
【0103】
なお、紙面の都合上、
図10の特定部1020には推論部303を含めて示しているが、当該推論部303は、リファイン画像生成部1010に含まれる推論部303と同じものである。
【0104】
<特定部の処理の具体例>
次に、特定部1020において合成画像が生成されるまでの処理の具体例について説明する。
図11は、合成画像が生成されるまでの処理の具体例を示す第2の図である。
図11の上段において、画像521は、変更領域制限情報生成部321が第2のレベルに基づいて規定した変更可能領域及び変更不可領域を、それぞれ、白色部分と黒色部分として表したものである。
【0105】
図11の上段に示すように、領域抽出部323は、画像リファイナ部301にて誤推論画像410が変更されることで生成されたスコア最大化リファイン画像420を取得する。また、領域抽出部323は、取得したスコア最大化リファイン画像420から、変更可能領域に対応する画像部分1110を抽出する。
【0106】
一方、
図11の下段において、画像521’は、変更領域制限情報生成部321が第2のレベルに基づいて規定した変更可能領域及び変更不可領域を、それぞれ、黒色部分と白色部分として表したものである。なお、画像521’は、画像521の白色部分と黒色部分とを反転した画像である(説明の便宜上、
図11の下段では、白色部分を変更不可領域、黒色部分を変更可能領域としている)。
【0107】
図11の下段に示すように、領域抽出部323は、誤推論画像410から、変更不可領域に対応する画像部分1111を抽出する。
【0108】
図11に示す合成画像1120は、スコア最大化リファイン画像420から抽出された変更可能領域に対応する画像部分と、誤推論画像410から抽出された変更不可領域に対応する画像部分1111とを合成することで得られた合成画像である。
【0109】
なお、
図11の例は、第2のレベルに基づいて規定された変更可能領域及び変更不可領域を用いて合成画像1120を生成するまでの処理を示したが、第3のレベル~第5のレベルについても同様の処理が行われ、順次、合成画像が生成される。
【0110】
<誤推論原因抽出処理の流れ>
次に、第2の実施形態に係る解析装置100における、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図12は、誤推論原因抽出処理の流れを示す第3のフローチャートである。
【0111】
ステップS1201において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、CNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。また、変更領域制限情報生成部321は、変更可能領域及び変更不可領域を規定する際に用いるレベルに初期値を設定する(例えば、第2のレベルに設定する)。
【0112】
ステップS1202において、画像リファイナ部301は、誤推論画像を変更し、リファイン画像を生成する。
【0113】
ステップS1203において、推論部303は、リファイン画像を入力として推論し、正解ラベルのスコアを算出する。
【0114】
ステップS1204において、画像リファイナ部301は、画像差分値とスコア誤差を用いてCNNの学習を行う。
【0115】
ステップS1205において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1205において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1205においてNoの場合には)、ステップS1202に戻り、リファイン画像の生成を継続する。
【0116】
一方、ステップS1205において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1205においてYesの場合は)、ステップS1206に進む。なお、この時点で、リファイン画像格納部305には、スコア最大化リファイン画像が格納されている。
【0117】
ステップS1206において、注目領域導出部311は、ステップS1003において推論した際の推論部構造情報及び特徴マップに基づいて、Grad-CAM法により、注目度合いマップを生成する。
【0118】
ステップS1207において、変更領域制限情報生成部321は、注目度合いマップにおいて、所定のレベル以上の領域を変更可能領域と規定し、所定のレベル未満の領域を変更不可領域と規定する。
【0119】
ステップS1208において、領域抽出部323は、スコア最大化リファイン画像から変更可能領域に対応する画像部分を抽出する。
【0120】
ステップS1209において、領域抽出部323は、誤推論画像から変更不可領域に対応する画像部分を抽出する。
【0121】
ステップS1210において、合成部324は、スコア最大化リファイン画像から抽出された変更可能領域に対応する画像部分と、誤推論画像から抽出された変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
【0122】
ステップS1211において、推論部303は、合成画像を入力として推論し、正解ラベルのスコアを算出する。
【0123】
ステップS1212において、判断部325は、ステップS1211において算出された正解ラベルのスコアが、スコア許容値より小さいか否かを判定する。ステップS1212において、スコア許容値以上であると判定された場合には(ステップS1212においてNoの場合には)、ステップS1213に進む。
【0124】
ステップS1213において、変更領域制限情報生成部321は、レベルを上げることにより変更可能領域及び変更不可領域を更新し、ステップS1208に戻る。
【0125】
一方、ステップS1212において、スコア許容値より小さいと判定された場合には(ステップS1212においてYesの場合には)、ステップS1214に進む。
【0126】
ステップS1214において、変更領域制限情報生成部321は、前回の変更可能領域を、誤推論の原因となる画像箇所として特定し、出力する。
【0127】
以上の説明から明らかなように、第2の実施形態に係る解析装置100は、誤推論画像全体に対してスコア最大化リファイン画像を生成する。また、第2の実施形態に係る解析装置100は、スコア最大化リファイン画像を入力として推論した際の、推論部の構造情報から、Grad-CAM法を用いて注目度合いマップを生成する。また、第2の実施形態に係る解析装置100は、生成した注目度合いマップに基づいて規定した変更可能領域(正解ラベルの推論に影響する領域)を、スコア最大化リファイン画像で置き換えた誤推論画像を、推論部に入力することで推論する。更に、第2の実施形態に係る解析装置100は、推論した正解ラベルのスコアから、変更可能領域を絞り込むことで、誤推論の原因となる画像箇所を特定する。
【0128】
このように、正解ラベルの推論に影響する領域をスコア最大化リファイン画像で置き換え、置き換えの効果を参照しながら領域を絞り込むことで、誤推論の原因となる画像箇所を精度よく特定することができる。つまり、第2の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0129】
また、第2の実施形態によれば、上記第1の実施形態と比較して、スコア最大化リファイン画像を生成する回数を減らすことが可能となり、マスク画像ごとにスコア最大化リファイン画像を生成する必要がなくなる。この結果、第2の実施形態によれば、誤推論原因抽出処理時の解析装置100の処理負荷を低減させることができる。
【0130】
[第3の実施形態]
上記第1及び第2の実施形態では、所定のスコア許容値を下回る直前の変更可能領域を、誤推論の原因となる画像箇所として特定し、出力した。しかしながら、誤推論の原因となる画像箇所の出力方法はこれに限定されず、例えば、所定のスコア許容値を下回る直前の変更可能領域に限定して、GBP法により可視化した特徴部分を出力してもよい。これにより、誤推論画像全体に対してGBP法により可視化する場合と比較して、限定した範囲の誤推論の原因を示すことができるからである。
【0131】
また、上記第1及び第2の実施形態では、変更領域制限情報生成部321が変更可能領域及び変更不可領域を更新するにあたり、最初に低いレベルを設定し、レベルを徐々に上げていくものとして説明した。しかしながら、変更領域制限情報生成部321は、最初に高いレベルを設定しておき、レベルを徐々に下げていってもよい。
【0132】
なお、この場合、判断部325では、推論部303により推論される正解ラベルのスコアが、予め定められたスコア許容値を上回った直後の変更可能領域を、誤推論の原因となる画像箇所として特定する。
【0133】
あるいは、レベルを徐々に上げていった場合に特定した、誤推論の原因となる画像箇所と、レベルを徐々に下げていった場合に特定した、誤推論の原因となる画像箇所と、を用いて、最終的な誤推論の原因となる画像箇所を特定するようにしてもよい。
【0134】
[第4の実施形態]
上記第1乃至第3の実施形態では、Grad-CAM法を用いて生成した注目度合いマップに基づいて、変更可能領域及び変更不可領域を規定した。しかしながら、変更可能領域及び変更不可領域を規定するためのマップは、注目度合いマップに限定されない。
【0135】
また、上記第1及び第2の実施形態では、注目度合いマップにおいて、注目度合いのレベルを上げることで、変更可能領域(正解ラベルの推論に影響する領域)を絞り込んだが、変更可能領域を絞り込む方法はこれに限定されない。
【0136】
以下、第4の実施形態について、上記第1乃至第3の実施形態との相違点を中心に説明する。
【0137】
<誤推論原因抽出部の機能構成>
はじめに、第4の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。
図13は、誤推論原因抽出部の機能構成の一例を示す第3の図である。
図10に示した誤推論原因抽出部の機能構成との相違点は、マップ生成部1310及び特定部1320である。以下、マップ生成部1310及び特定部1320の詳細について説明する。
【0138】
(1)マップ生成部の詳細
はじめに、マップ生成部1310の詳細について説明する。
図13に示すように、マップ生成部1310は、重要特徴マップ生成部1311、劣化尺度マップ生成部1312、重畳部1313を有する。
【0139】
重要特徴マップ生成部1311は、スコア最大化リファイン画像を入力として推論した際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部1311は、BP(Back Propagation)法またはGBP(Guided Back Propagation)法を用いることで、推論部構造情報に基づいて“重要特徴マップ”を生成する。重要特徴マップとは、推論の際に反応した特徴部分を可視化したマップである。
【0140】
なお、BP法は、推論したラベルが正解する入力データ(ここでは、スコア最大化リファイン画像)の推論を行うことで得た分類確率から各クラスの誤差を計算し、入力層まで逆伝播して得られる勾配の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の正値のみを特徴部分として画像化することで、特徴部分を可視化する方法である。
【0141】
ここで、重要特徴マップを生成するにあたっては、正解ラベルの誤差のみを最大にしたうえで、BP法あるいはGBP法を用いて処理を行ってもよい。その場合、可視化される特徴部分は、正解ラベルのスコアのみに影響を与える特徴部分となる。
【0142】
劣化尺度マップ生成部1312は、誤推論画像とスコア最大化リファイン画像とに基づいて“劣化尺度マップ”を生成する。劣化尺度マップとは、変更部分と各変更部分の変更度合いとを示したマップである。
【0143】
重畳部1313は、重要特徴マップ生成部1311において生成された重要特徴マップと、劣化尺度マップ生成部1312において生成された劣化尺度マップとを重畳して、重要特徴指標マップを生成する。
【0144】
(2)特定部の詳細
次に、特定部1320の詳細について説明する。
図13に示すように、特定部1320は、スーパーピクセル分割部1321、重要スーパーピクセル決定部1322、重要スーパーピクセル評価部1323を有する。
【0145】
スーパーピクセル分割部1321は、誤推論画像を、誤推論画像に含まれるオブジェクト(本実施形態では車両)の部品ごとの領域である“スーパーピクセル”に分割し、スーパーピクセル分割情報を出力する。なお、誤推論画像をスーパーピクセルに分割するにあたっては、既存の分割機能を利用するか、あるいは、車両の部品ごとに分割するように学習したCNN等を利用する。
【0146】
重要スーパーピクセル決定部1322は、スーパーピクセル分割部1321により出力されたスーパーピクセル分割情報に基づいて、重畳部1313により生成された重要特徴指標マップの各画素の値を、スーパーピクセルごとに加算する。
【0147】
また、重要スーパーピクセル決定部1322は、各スーパーピクセルのうち、加算した各画素の加算値が所定の閾値(重要特徴指標閾値)以上のスーパーピクセルを抽出する。また、重要スーパーピクセル決定部1322は、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせて変更可能領域と規定し、組み合わせたスーパーピクセル以外のスーパーピクセルを変更不可領域と規定する。
【0148】
更に、重要スーパーピクセル決定部1322は、誤推論画像から、変更不可領域に対応する画像部分を抽出し、リファイン画像から、変更可能領域に対応する画像部分を抽出し、両者を合成することで、合成画像を生成する。画像リファイナ部301からは、学習回数に応じた数のリファイン画像が出力されるため、重要スーパーピクセル決定部1322では、当該数のリファイン画像それぞれについて、合成画像を生成する。
【0149】
なお、重要スーパーピクセル決定部1322では、変更可能領域及び変更不可領域を規定する際に用いる重要特徴指標閾値を徐々に下げることで、抽出するスーパーピクセルの数を増やす(変更可能領域を広げ、変更不可領域を狭めていく)。また、重要スーパーピクセル決定部1322では、抽出したスーパーピクセルの中から選択するスーパーピクセルの組み合わせを変えながら、変更可能領域及び変更不可領域を更新する。
【0150】
重要スーパーピクセル評価部1323は、重要スーパーピクセル決定部1322において生成された合成画像が推論部303に入力されるごとに推論される正解ラベルのスコアを取得する。上述したように、重要スーパーピクセル決定部1322では、画像リファイナ部301により出力されたリファイン画像の数、重要特徴指標閾値を下げる回数、スーパーピクセルの組み合わせの数、に応じた数の合成画像を生成する。このため、重要スーパーピクセル評価部1323では、当該数に応じた正解ラベルのスコアを取得する。また、重要スーパーピクセル評価部1323は、取得したスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
【0151】
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部(ここでは、マップ生成部1310及び特定部1320)の処理の具体例について説明する。
【0152】
(1)マップ生成部の処理の具体例
はじめに、マップ生成部1310の処理の具体例について説明する。
図14は、マップ生成部の処理の具体例を示す図である。
【0153】
図14に示すように、マップ生成部1310において重要特徴マップ生成部1311は、推論部303がスコア最大化リファイン画像を入力として推論した際の推論部構造情報1401を、推論部303から取得する。また、重要特徴マップ生成部1311は、取得した推論部構造情報1401に基づいて、重要特徴マップ1421を生成する。重要特徴マップ生成部1311では、BP法またはGBP法を用いることで、重要特徴マップ1421を生成する。
【0154】
また、重要特徴マップ生成部1311は、生成した重要特徴マップ1421をグレイスケール化し、グレイスケール化重要特徴マップ1422を生成する。なお、グレイスケール化の処理において、重要特徴マップ生成部1311は、重要特徴マップ1421に対してスケーリング処理を行ってもよく、また、各画素の値として、絶対値を算出してもよい。
【0155】
図14に示すグレイスケール化重要特徴マップ1422は、重要特徴マップ1421を0から255の画素値に変換することでグレイスケール化されている。このため、グレイスケール化重要特徴マップ1422において、画素値が255に近い画素は、推論時に注目される画素であり、画素値が0に近い画素は、推論時に注目されない画素である。
【0156】
一方、劣化尺度マップ生成部1312は、リファイン画像格納部305よりスコア最大化リファイン画像1412を読み出し、誤推論画像1411との間でSSIM(Structural Similarity)演算を行う。これにより、劣化尺度マップ生成部1312は、劣化尺度マップ1431を生成する。劣化尺度マップは0から1の値をとり、画素値が1に近いほど、画像の差分が小さいことを表し、画素値が0に近いほど、画像の差分が大きいことを表す。
【0157】
また、重畳部1313は、重要特徴マップ生成部1311により生成されたグレイスケール化重要特徴マップ1422と、劣化尺度マップ生成部1312により生成された劣化尺度マップ1431とを用いて、重要特徴指標マップ1441を生成する。
【0158】
具体的には、重畳部1313は、下式に基づいて、重要特徴指標マップ1441を生成する。
【0159】
(式1)
重要特徴指標マップ=グレイスケール化重要特徴マップ×(1-劣化尺度マップ)
【0160】
上式において、(1-劣化尺度マップ)の項は、0から1の値をとり、1に近いほど画像の差分が大きく、0に近いほど画像の差分が小さい。したがって、重要特徴指標マップ1441は、推論時に注目される画素の注目度合いを示すグレイスケール化重要特徴マップに、画像の差分の大小による強弱をつけた画像となる。
【0161】
具体的には、重要特徴指標マップ1441は、
・劣化尺度マップ1431において画像の差分が小さい部分は、グレイスケール化重要特徴マップの画素値を小さくし、
・劣化尺度マップ1431において画像の差分が大きい部分は、グレイスケール化重要特徴マップの画素値を大きくする、
ことで生成される。
【0162】
なお、より識別しやすく可視化するために、重要特徴指標マップを反転させてもよい。
図14、
図16に示す重要特徴指標マップは、下式に基づいて反転させたものを表示している。
【0163】
(式2)
(反転した)重要特徴指標マップ=255-[グレイスケール化重要特徴マップ×(1-劣化尺度マップ)]
【0164】
ここで、重畳部1313が、上式に基づいて、グレイスケール化重要特徴マップ1422と劣化尺度マップ1431とを重畳することによる利点について説明する。
【0165】
重要特徴マップ生成部1311において生成されるグレイスケール化重要特徴マップ1422は、スコア最大化リファイン画像を入力として推論し、正解ラベルのスコアが最大となった際に、推論部303が算出した注目部分に他ならない。
【0166】
一方、劣化尺度マップ生成部1312において生成される劣化尺度マップ1431は、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分を表しており、誤推論の原因となる領域を表している。ただし、劣化尺度マップ生成部1312において生成される劣化尺度マップ1431は、正解ラベルのスコアを最大化するために必要な最小限の領域ではない。
【0167】
重畳部1313では、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分と、推論部303が算出した注目部分とを重畳することで、正解ラベルのスコアを最大化するために必要な領域を絞り込む。これにより、誤推論の原因となる領域を絞り込むことができる。
【0168】
(2)特定部に含まれるスーパーピクセル分割部の処理の具体例
次に、特定部1320に含まれるスーパーピクセル分割部1321の処理の具体例について説明する。
図15は、スーパーピクセル分割部の処理の具体例を示す図である。
図15に示すように、スーパーピクセル分割部1321は、例えば、SLIC(Simple Linear Iterative Clustering)処理を行うSLIC部1510を有する。SLIC部1510は、誤推論画像1411を、誤推論画像1411に含まれる車両の部品ごとの部分画像であるスーパーピクセルに分割する。また、スーパーピクセル分割部1321は、SLIC部1510によりスーパーピクセルに分割されることで生成されたスーパーピクセル分割情報1501を出力する。
【0169】
(3)特定部に含まれる重要スーパーピクセル決定部の処理の具体例
次に、特定部1320に含まれる重要スーパーピクセル決定部1322の処理の具体例について説明する。
図16は、重要スーパーピクセル決定部の処理の具体例を示す図である。
【0170】
図16に示すように、重要スーパーピクセル決定部1322は、領域抽出部1610、合成部1611を有する。
【0171】
重要スーパーピクセル決定部1322では、重畳部1313より出力された重要特徴指標マップ1441と、スーパーピクセル分割部1321より出力されたスーパーピクセル分割情報1501とを重ね合わせる。これにより、重要スーパーピクセル決定部1322では、重要スーパーピクセル画像1601を生成する。なお、
図16では、重要特徴指標マップ1441として、(反転した)重要特徴指標マップを表示している。
【0172】
また、重要スーパーピクセル決定部1322では、生成した重要スーパーピクセル画像1601内の各スーパーピクセルについて、重要特徴指標マップ1441の各画素の値を加算する。
【0173】
なお、マップ生成部1310において、重要特徴指標マップ1441生成時にスケーリング処理が行われていたとしても、重要スーパーピクセル決定部1322における加算操作は、当該スケーリング処理の影響を受けない。
【0174】
また、重要スーパーピクセル決定部1322では、スーパーピクセルごとの加算値が、重要特徴指標閾値以上であるかを判定し、加算値が重要特徴指標閾値以上であると判定したスーパーピクセルを抽出する。なお、
図16において、重要スーパーピクセル画像1602は、スーパーピクセルごとの加算値の一例を明示したものである
また、重要スーパーピクセル決定部1322では、抽出したスーパーピクセルの中から、選択したスーパーピクセルを組み合わせて変更可能領域と規定し、組み合わせたスーパーピクセル以外のスーパーピクセルを変更不可領域と規定する。更に、重要スーパーピクセル決定部1322は、規定した変更可能領域及び変更不可領域を領域抽出部1610に通知する。
【0175】
領域抽出部1610は、誤推論画像1411から、変更不可領域に対応する画像部分を抽出し、リファイン画像1621から、変更可能領域に対応する画像部分を抽出する。
【0176】
合成部1611は、リファイン画像1621から抽出した変更可能領域に対応する画像部分と、誤推論画像1411から抽出した変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
【0177】
図17は、領域抽出部及び合成部の処理の具体例を示す第2の図である。
図17において、上段は、領域抽出部1610が、リファイン画像1621から、変更可能領域に対応する画像部分(画像1701の白色部分)を抽出した様子を示している。
【0178】
一方、
図17において、下段は、領域抽出部1610が、誤推論画像1411から、変更不可領域に対応する画像部分(画像1701’の白色部分)を抽出した様子を示している。なお、画像1701’は、画像1701の白色部分と黒色部分とを反転した画像である(説明の便宜上、
図17の下段では、白色部分を、変更不可領域に対応する画像部分としている)。
【0179】
合成部1611は、
図17に示すように、領域抽出部1610より出力された、リファイン画像1621の変更可能領域に対応する画像部分と、誤推論画像1411の変更不可領域に対応する画像部分とを合成し、合成画像1720を生成する。
【0180】
このように、特定部1320によれば、合成画像1720を生成する際、重要特徴マップ1421及び劣化尺度マップ1431を用いることで、リファイン画像1621で置き換える領域を、スーパーピクセル単位で絞り込むことができる。
【0181】
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図18及び
図19は、誤推論原因抽出処理の流れを示す第4及び第5のフローチャートである。
【0182】
ステップS1801において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、CNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。また、判断部325は、重要特徴指標閾値及びその下限値を、ユーザが指示した値に設定する。
【0183】
ステップS1802において、画像リファイナ部301は、誤推論画像を変更し、リファイン画像を生成する。
【0184】
ステップS1803において、推論部303は、リファイン画像を入力として推論し、正解ラベルのスコアを算出する。
【0185】
ステップS1804において、画像リファイナ部301は、画像差分値とスコア誤差とを用いてCNNの学習を行う。
【0186】
ステップS1805において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1805において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1805においてNoの場合には)、ステップS1802に戻り、リファイン画像の生成を継続する。
【0187】
一方、ステップS1805において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1805においてYesの場合は)、ステップS1806に進む。なお、この時点で、リファイン画像格納部305には、学習ごとに生成されたリファイン画像(スコア最大化リファイン画像を含む)が格納されている。
【0188】
ステップS1806において、重要特徴マップ生成部1311は、推論部303よりスコア最大化リファイン画像を入力として推論された際の推論部構造情報を取得し、取得した推論部構造情報に基づいて重要特徴マップを生成する。
【0189】
ステップS1807において、劣化尺度マップ生成部1312は、誤推論画像とスコア最大化リファイン画像とに基づいて、劣化尺度マップを生成する。
【0190】
ステップ1808において、重畳部1313は、重要特徴マップと劣化尺度マップとに基づいて、重要特徴指標マップを生成する。
【0191】
ステップS1809において、スーパーピクセル分割部1321は、誤推論画像をスーパーピクセルに分割し、スーパーピクセル分割情報を生成する。
【0192】
ステップS1810において、重要スーパーピクセル決定部1322は、重要特徴指標マップの各画素の値を、スーパーピクセル単位で加算する。
【0193】
ステップS1811において、重要スーパーピクセル決定部1322は、加算値が重要特徴指標閾値以上のスーパーピクセルを抽出し、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせて変更可能領域を規定する。また、重要スーパーピクセル決定部1322は、組み合わせたスーパーピクセル以外のスーパーピクセルを変更不可領域と規定する。
【0194】
続いて、
図19のステップS1901において、重要スーパーピクセル決定部1322は、リファイン画像格納部305からリファイン画像を読み出す。
【0195】
ステップS1902において、重要スーパーピクセル決定部1322は、リファイン画像から、変更可能領域に対応する画像部分を抽出する。
【0196】
ステップS1903において、重要スーパーピクセル決定部1322は、誤推論画像から、変更不可領域に対応する画像部分を抽出する。
【0197】
ステップS1904において、重要スーパーピクセル決定部1322は、リファイン画像から抽出した変更可能領域に対応する画像部分と、誤推論画像から抽出した変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
【0198】
ステップS1905において、推論部303は、合成画像を入力として推論し、正解ラベルのスコアを算出する。また、重要スーパーピクセル評価部1323は、推論部303により算出された正解ラベルのスコアを取得する。
【0199】
ステップS1907において、画像リファイナ部301は、リファイン画像格納部305に格納された全てのリファイン画像を読み出したか否かを判定する。ステップS1907において、読み出していないリファイン画像があると判定した場合には(ステップS1907においてNoの場合には)、ステップS1901に戻る。
【0200】
一方、ステップS1907において、全てのリファイン画像を読み出したと判定した場合には(ステップS1907においてYesの場合には)、ステップS1908に進む。
【0201】
ステップS1908において、重要スーパーピクセル決定部1322は、重要特徴指標閾値が下限値に到達したか否かを判定する。ステップS1908において、下限値に到達していないと判定した場合には(ステップS1908においてNoの場合には)、ステップS1909に進む。
【0202】
ステップS1909において、重要スーパーピクセル決定部1322は、重要特徴指標閾値を下げた後、
図18のステップS1811に戻る。
【0203】
一方、ステップS1908において、下限値に到達したと判定した場合には(ステップS1908においてYesの場合には)、ステップS1910に進む。
【0204】
ステップS1910において、重要スーパーピクセル評価部1323は、取得した正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
【0205】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。
図20は、誤推論原因抽出処理の具体例を示す第1の図である。
【0206】
図20に示すように、はじめに、リファイン画像生成部1010により、誤推論画像からスコア最大化リファイン画像が生成されると、マップ生成部1310では、重要特徴指標マップを生成する。
【0207】
続いて、誤推論画像に基づいて、スーパーピクセル分割部1321によりスーパーピクセル分割情報が生成されると、重要スーパーピクセル決定部1322では、重要スーパーピクセル画像を生成する。
【0208】
続いて、重要スーパーピクセル決定部1322では、重要スーパーピクセル画像に基づいて変更可能領域及び変更不可領域を規定する。このとき、重要スーパーピクセル決定部1322では、重要特徴指標閾値を変えるとともに、重要特徴指標閾値を超えるスーパーピクセルの中から選択する組み合わせを変えることで、複数の変更可能領域と変更不可領域との組を生成する。また、重要スーパーピクセル決定部1322では、生成した複数の変更可能領域と変更不可領域との組を用いて、合成画像を生成する(
図20の例は、スコア最大化リファイン画像を利用して合成画像を生成する場合を示している)。
【0209】
続いて、重要スーパーピクセル評価部1323では、生成された合成画像を入力として推論部303が推論した正解ラベルのスコアを取得する。これにより、重要スーパーピクセル評価部1323では、取得した正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
【0210】
なお、リファイン画像生成部1010により生成された複数のリファイン画像を利用して合成画像を生成するにあたっては、
・最後の回のリファイン画像を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を利用して生成した合成画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像を利用して合成画像を生成する方法、
等の生成方法が考えられる。
【0211】
以上の説明から明らかなように、第4の実施形態に係る解析装置100は、誤推論画像について、推論の正解ラベルのスコアが最大となるように変更しながら、スコア最大化リファイン画像を生成する。また、第4の実施形態に係る解析装置100は、スコア最大化リファイン画像を生成した際の推論部構造情報に基づいて生成された重要特徴マップと劣化尺度マップとを取得し、両者を重畳することで、重要特徴指標マップを生成する。また、第4の実施形態に係る解析装置100は、誤推論画像を分割することでスーパーピクセルを生成し、重要特徴指標マップの各画素値を、スーパーピクセル単位で加算する。また、第4の実施形態に係る解析装置100は、加算値が重要特徴指標閾値以上のスーパーピクセルを抽出し、抽出したスーパーピクセルの中から選択したスーパーピクセルの組み合わせに基づいて、変更可能領域と変更不可領域とを規定する。また、第4の実施形態に係る解析装置100は、規定した変更可能領域(正解ラベルの推論に影響する領域)をリファイン画像で置き換えた誤推論画像を、推論部に入力することで推論する。更に第4の実施形態に係る解析装置100は、重要特徴指標閾値及び選択するスーパーピクセルの組み合わせを変えながら推論し、推論した正解ラベルの各スコアから、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定する。
【0212】
このように、正解ラベルの推論に影響するスーパーピクセルをリファイン画像で置き換え、置き換えの効果を参照しながら、スーパーピクセルを絞り込むことで、誤推論の原因となる画像箇所を精度よく特定することができる。つまり、第4の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0213】
[第5の実施形態]
上記第4の実施形態では、スコア最大化リファイン画像を生成した際の推論部構造情報に基づいて、重要特徴指標マップを生成した。これに対して、第5の実施形態では、スコア最大化リファイン画像を生成するまでの学習中に取得した、重要特徴指標マップに基づいて、平均重要特徴指標マップを生成する。また、重要スーパーピクセル決定部1322では、平均重要特徴指標マップに基づいて、重要特徴指標閾値以上のスーパーピクセルを抽出する。以下、第5の実施形態について、上記第4の実施形態との相違点を中心に説明する。
【0214】
<誤推論原因抽出部の機能構成>
はじめに、第5の実施形態に係る解析装置の、誤推論原因抽出部の機能構成について説明する。
図21は、誤推論原因抽出部の機能構成の一例を示す第4の図である。
図13に示す誤推論原因抽出部の機能構成との相違点は、マップ生成部2110である。以下、マップ生成部2110の詳細について説明する。
【0215】
図21に示すように、マップ生成部2110は、重要特徴マップ生成部1311、劣化尺度マップ生成部1312、重畳部1313に加えて、平均化部2111を有する。
【0216】
マップ生成部2110は、画像リファイナ部301の学習中に生成されたリファイン画像と、当該リファイン画像を入力として推論部303が推論した際の推論部構造情報とを、逐次、取得する。また、リファイン画像及び推論部構造情報を取得するごとに、マップ生成部2110では、重要特徴マップ生成部1311、劣化尺度マップ生成部1312、重畳部1313が動作し、重要特徴指標マップを生成する。
【0217】
平均化部2111は、重要特徴マップ生成部1311及び劣化尺度マップ生成部1312がリファイン画像及び推論部構造情報を取得するごとに重畳部1313が生成した複数回分の重要特徴指標マップの平均値を算出し、平均重要特徴指標マップを生成する。
【0218】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。
図22は、誤推論原因抽出処理の具体例を示す第2の図である。
【0219】
図22に示すように、リファイン画像生成部1010において、画像リファイナ部301が、1回目の学習結果に基づき、誤推論画像からリファイン画像を生成すると、マップ生成部1310では、重要特徴指標マップを生成する。
【0220】
また、リファイン画像生成部1010において、画像リファイナ部301が、2回目の学習結果に基づき、誤推論画像からリファイン画像を生成すると、マップ生成部1310では、重要特徴指標マップを生成する。以降、同様の処理を繰り返し、リファイン画像生成部1010がスコア最大化リファイン画像を生成すると、マップ生成部1310では、重要特徴指標マップを生成する。
【0221】
続いて、平均化部2111では、1回目のリファイン画像が生成されてからスコア最大化リファイン画像が生成されるまでの間に生成された、複数回分の重要特徴指標マップを取得する。また、平均化部2111では、取得した複数回分の重要特徴指標マップの平均値を算出し、平均重要特徴指標マップを生成する。
【0222】
続いて、スーパーピクセル分割部1321では、誤推論画像に基づいて、スーパーピクセル分割情報を生成し、重要スーパーピクセル決定部1322では、重要スーパーピクセル画像を生成する。
【0223】
続いて、重要スーパーピクセル決定部1322では、重要スーパーピクセル画像に基づいて変更可能領域及び変更不可領域を規定する。このとき、重要スーパーピクセル決定部1322では、重要特徴指標閾値を変えるととともに、重要特徴指標閾値を超えるスーパーピクセルの中から選択する組み合わせを変えることで、複数の変更可能領域と変更不可領域との組を生成する。また、重要スーパーピクセル決定部1322では、生成した複数の変更可能領域と変更不可領域との組を用いて、合成画像を生成する(
図22の例は、スコア最大化リファイン画像を利用して合成画像を生成する場合を示している)。
【0224】
続いて、重要スーパーピクセル評価部1323では、生成された合成画像を入力として推論部303が推論した正解ラベルのスコアを取得する。これにより、重要スーパーピクセル評価部1303では、取得した正解ラベルに基づいて誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
【0225】
なお、上記誤推論原因抽出処理において、リファイン画像を取得して重要特徴指標マップを生成する間隔は任意であり、1回の学習ごとに重要特徴指標マップを生成しても、複数回の学習ごとに重要特徴指標マップを生成してもよい。また、リファイン画像を取得して重要特徴指標マップを生成するにあたり、推論部303の正解ラベルのスコアを評価し、所定の閾値よりも大きい場合に、リファイン画像を取得して重要特徴指標マップを生成してもよい。
【0226】
また、リファイン画像生成部1010により生成された複数のリファイン画像を利用して合成画像を生成するにあたっては、
・最後の回のリファイン画像を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を利用して生成した合成画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像を利用して合成画像を生成する方法、
等の生成方法が考えられる。
【0227】
以上の説明から明らかなように、第5の実施形態に係る解析装置100は、スコア最大化リファイン画像を生成するまでの学習中に生成した、重要特徴指標マップに基づいて、平均重要特徴指標マップを生成する。また、第5の実施形態に係る解析装置100は、平均重要特徴指標マップに基づいて、重要特徴指標閾値以上のスーパーピクセルを抽出する。
【0228】
これにより、第5の実施形態によれば、上記第4の実施形態による効果に加えて、更に、リファイン画像のゆらぎによる、重要特徴指標マップへの影響を低減させることが可能となる。
【0229】
[第6の実施形態]
上記第4の実施形態では、スコア最大化リファイン画像が生成され、重要特徴指標マップが生成されると、特定部1320では、変更可能領域及び変更不可領域を規定し、誤推論の原因となる画像箇所を特定する処理を開始するものとして説明した。
【0230】
また、上記第5の実施形態では、スコア最大化リファイン画像が生成され、平均重要特徴指標マップが生成されると、特定部1320では、変更可能領域及び変更不可領域を規定し、誤推論の原因となる画像箇所を特定する処理を開始するものとして説明した。
【0231】
これに対して、第6の実施形態では、特定部1320が変更可能領域及び変更不可領域を規定した後に、リファイン画像生成部が、規定された変更可能領域を加味して、再度、スコア最大化リファイン画像を生成しなおす。
【0232】
このように、変更可能領域を加味してスコア最大化リファイン画像を再生成することで、第6の実施形態によれば、正解ラベルの推論に影響する特徴部分がより明確になった重要特徴指標マップ(あるいは平均重要特徴指標マップ)を生成することが可能となる。この結果、合成画像を入力としてラベルを推論した際のスコアを上げることが可能となる。
【0233】
以下、第6の実施形態について、上記第4または第5の実施形態との相違点を中心に説明する。
【0234】
<誤推論原因抽出部の機能構成>
はじめに、第6の実施形態に係る解析装置の、誤推論原因抽出部の機能構成について説明する。
図23は、誤推論原因抽出部の機能構成の一例を示す第5の図である。
図21に示す誤推論原因抽出部の機能構成との相違点は、リファイン画像生成部2310及び特定部2320である。以下、リファイン画像生成部2310及び特定部2320の詳細について説明する。
【0235】
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部2310の詳細について説明する。
図23に示すように、リファイン画像生成部2310は、リファイン画像生成部1010の画像誤差演算部302とは機能の異なる画像誤差演算部2311を有する。
【0236】
画像誤差演算部2311は、画像誤差演算部302と同様、学習中に画像リファイナ部301に入力される誤推論画像と、学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。ただし、画像誤差演算部2311の場合、画像リファイナ部301に画像差分値を入力する際、補正部2321より通知された変更可能領域に対応する画像部分について、画像差分値を補正する。
【0237】
具体的には、画像誤差演算部2311は、変更可能領域に対応する画像部分の画像差分値に1未満の係数をかけて補正する。これにより、画像リファイナ部301では、変更可能領域に対応する画像部分の画像差分値を、変更可能領域以外の領域に対応する画像部分の画像差分値よりも弱めて再学習したうえで、スコア最大化リファイン画像を再生成することができる。
【0238】
(2)特定部の詳細
次に、特定部2320の詳細について説明する。
図23に示すように、特定部2320は、スーパーピクセル分割部1321、重要スーパーピクセル決定部1322、重要スーパーピクセル評価部1323に加えて、補正部2321を有する。
【0239】
補正部2321は、重要スーパーピクセル決定部1322において規定された変更可能領域を取得し、画像誤差演算部2311に通知する。これにより、リファイン画像生成部2310では、変更可能領域を加味して再学習したうえで、スコア最大化リファイン画像を再生成することができる。
【0240】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。
図24は、誤推論原因抽出処理の具体例を示す第3の図である。
図22を用いて説明した、誤推論原因抽出処理の具体例との相違点は、重要スーパーピクセル画像に基づいて変更可能領域と変更不可領域との組が生成された際、補正部2321が、変更可能領域を画像誤差演算部2311に通知する点である。これにより、リファイン画像生成部2310では、変更可能領域を加味して再学習したうえで、スコア最大化リファイン画像を再生成し、マップ生成部2110では、平均重要特徴指標マップを再生成することができる。
【0241】
なお、上記誤推論原因抽出処理において、リファイン画像を取得して重要特徴指標マップを生成する間隔は任意であり、1回の学習ごとに重要特徴指標マップを生成しても、複数回の学習ごとに重要特徴指標マップを生成してもよい。また、リファイン画像を取得して重要特徴指標マップを生成するにあたり、推論部303の正解ラベルのスコアを評価し、所定の閾値よりも大きい場合に、リファイン画像を取得して重要特徴指標マップを生成してもよい。
【0242】
また、リファイン画像生成部2310により生成された複数のリファイン画像を利用して合成画像を生成するにあたっては、
・最後の回のリファイン画像を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)を利用して合成画像を生成する方法、あるいは、
・それぞれのリファイン画像を利用して生成した合成画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像を利用して合成画像を生成する方法、
等の生成方法が考えられる。
【0243】
以上の説明から明らかなように、第6の実施形態に係る解析装置100は、変更可能領域を加味して再学習したうえでスコア最大化リファイン画像を再生成し、平均重要特徴指標マップを再生成する。
【0244】
これにより、第6の実施形態によれば、正解ラベルの推論に影響する特徴部分がより明確になった重要特徴指標マップ(あるいは平均重要特徴指標マップ)を生成することが可能となり、合成画像を入力として推論した際のスコアを上げることが可能となる。
【0245】
[第7の実施形態]
上記第4乃至第6の実施形態では、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力するものとして説明した。しかしながら、誤推論原因情報の出力方法はこれに限定されず、例えば、変更可能領域内の重要部分を可視化して出力してもよい。以下、第7の実施形態について、上記第4乃至第6の実施形態との相違点を中心に説明する。
【0246】
<誤推論原因抽出部の機能構成>
はじめに、第7の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。
図25は、誤推論原因抽出部の機能構成の一例を示す第6の図である。
図13に示す誤推論原因抽出部の機能構成との相違点は、詳細原因解析部2510を有する点である。
【0247】
詳細原因解析部2510は、誤推論画像とスコア最大化リファイン画像とを用いて、変更可能領域内の重要部分を可視化し、作用結果画像として出力する。
【0248】
<詳細原因解析部の機能構成>
次に、詳細原因解析部2510の機能構成について説明する。
図26は、詳細原因解析部の機能構成の一例を示す第1の図である。
図26に示すように、詳細原因解析部2510は、画像差分演算部2601、SSIM演算部2602、切り出し部2603、作用部2604を有する。
【0249】
画像差分演算部2601は、誤推論画像とスコア最大化リファイン画像との画素単位での差分を演算し、差分画像を出力する。
【0250】
SSIM演算部2602は、誤推論画像とスコア最大化リファイン画像とを用いて、SSIM演算を行うことで、SSIM画像を出力する。
【0251】
切り出し部2603は、差分画像から変更可能領域に対応する画像部分を切り出す。また、切り出し部2603は、SSIM画像から変更可能領域に対応する画像部分を切り出す。更に、切り出し部2603は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像とを乗算して、乗算画像を生成する。
【0252】
作用部2604は、誤推論画像と乗算画像とに基づいて、作用結果画像を生成する。
【0253】
<詳細原因解析部の処理の具体例>
次に、詳細原因解析部2510の処理の具体例について説明する。
図27は、詳細原因解析部の処理の具体例を示す図である。
【0254】
図27に示すように、はじめに、画像差分演算部2601において、誤推論画像(A)とスコア最大化リファイン画像(B)との差分(=(A)-(B))が演算され、差分画像が出力される。差分画像は、誤推論の原因となる画像箇所での画素修正情報である。
【0255】
続いて、SSIM演算部2602において、誤推論画像(A)とスコア最大化リファイン画像(B)とに基づいてSSIM演算が行われる(y=SSIM((A),(B))。更に、SSIM演算部2602において、SSIM演算の結果が反転されることで(y’=255-(y×255))、SSIM画像が出力される。SSIM画像は、誤推論の原因となる画像箇所を高精度に指定した画像であり、画素値が大きいと差分が大きく、画素値が小さいと差分が小さいことを表す。なお、SSIM演算の結果を反転する処理は、例えば、y’=1-yを算出することにより行ってもよい。
【0256】
続いて、切り出し部2603において、差分画像から変更可能領域に対応する画像部分が切り出され、切り出し画像(C)が出力される。同様に、切り出し部2603において、SSIM画像から変更可能領域に対応する画像部分が切り出され、切り出し画像(D)が出力される。
【0257】
ここで、変更可能領域は、誤推論の原因となる画像部分を領域にまで絞り込んだものであり、詳細原因解析部2510では、絞り込んだ領域の中で、更に、画素粒度での原因解析を行うことを目的としている。
【0258】
このため、切り出し部2603では、切り出し画像(C)と切り出し画像(D)とを乗算し、乗算画像(G)を生成する。乗算画像(G)は、誤推論の原因となる画像箇所での画素修正情報を更に高精度に指定した、画素修正情報に他ならない。
【0259】
また、切り出し部2603では、乗算画像(G)に対して強調処理を行い、強調乗算画像(H)を出力する。なお、切り出し部2603では、強調乗算画像(H)を下式に基づいて算出する。
【0260】
(式3)
強調乗算画像(H)=255×(G)/(max(G)-min(G))
【0261】
続いて作用部2604では、誤推論画像(A)から強調乗算画像(H)を減算することで重要部分を可視化し、作用結果画像を生成する。
【0262】
なお、
図27に示した強調処理の方法は一例にすぎず、可視化した際に重要部分がより識別しやすくなる方法であれば、他の方法により強調処理を行ってもよい。
【0263】
<詳細原因解析処理の流れ>
次に、詳細原因解析部2510による詳細原因解析処理の流れについて説明する。
図28は、詳細原因解析処理の流れを示す第1のフローチャートである。
【0264】
ステップS2801において、画像差分演算部2601は、誤推論画像とスコア最大化リファイン画像との差分画像を算出する。
【0265】
ステップS2802において、SSIM演算部2602は、誤推論画像とスコア最大化リファイン画像とに基づいて、SSIM画像を演算する。
【0266】
ステップS2803において、切り出し部2603は、変更可能領域に対応する差分画像を切り出す。
【0267】
ステップS2804において、切り出し部2603は、変更可能領域に対応するSSIM画像を切り出す。
【0268】
ステップS2805において、切り出し部2603は、切り出した差分画像と切り出したSSIM画像とを乗算し、乗算画像を生成する。
【0269】
ステップS2806において、切り出し部2603は、乗算画像に対して強調処理を行う。また、作用部2604は、強調処理された乗算画像を、誤推論画像から減算し、作用結果画像を出力する。
【0270】
以上の説明から明らかなように、第7の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像とに基づいて、差分画像とSSIM画像とを生成し、変更可能領域を切り出して乗算する。これにより、第7の実施形態に係る解析装置100によれば、変更可能領域内において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
【0271】
[第8の実施形態]
上記第7の実施形態では、誤推論画像とスコア最大化リファイン画像とに基づいて生成した差分画像とSSIM画像とを用いて、誤推論の原因となる画像箇所を画素単位で可視化する場合について説明した。
【0272】
これに対して、第8の実施形態では、更に、重要特徴マップを用いて、誤推論の原因となる画像箇所を画素単位で可視化する。以下、第8の実施形態について、上記第7の実施形態との相違点を中心に説明する。
【0273】
<誤推論原因抽出部の機能構成>
はじめに、第8の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。
図29は、誤推論原因抽出部の機能構成の一例を示す第7の図である。
図25に示す誤推論原因抽出部の機能構成との相違点は、
図29の場合、詳細原因解析部2910の機能が、
図25に示す詳細原因解析部2510の機能とは異なる点、及び、詳細原因解析部2910が、推論部303より推論部構造情報を取得する点である。
【0274】
詳細原因解析部2910は、誤推論画像とスコア最大化リファイン画像と推論部構造情報とに基づいて生成した、差分画像とSSIM画像と重要特徴マップとを用いて、誤推論の原因となる画像箇所を画素単位で可視化する。
【0275】
なお、詳細原因解析部2910が誤推論の原因となる画像箇所を画素単位で可視化する際に用いる差分画像、SSIM画像、重要特徴マップは、以下のような属性を有する。
・差分画像:画素ごとの差分情報であり、指定したクラスの分類確率をよくするために画素をどのくらい修正すればよいかを示す、正負値を有する情報である。
・SSIM画像:画像全体及び局所領域の変化状況を考慮した差分情報であり、画素ごとの差分情報よりもアーティファクト(意図しないノイズ)が少ない情報である。つまり、より高い精度の差分情報である(ただし、正値のみの情報である)。
・重要特徴マップ:正解ラベルの推論に影響を与える特徴部分を可視化したマップである。
【0276】
<詳細原因解析部の機能構成>
次に、詳細原因解析部2910の機能構成について説明する。
図30は、詳細原因解析部の機能構成の一例を示す第2の図である。
図26に示す機能構成との相違点は、
図30の場合、BP演算部3001を有する点、及び、切り出し部3002の機能が、
図26の切り出し部2603の機能とは異なる点である。
【0277】
BP演算部3001は、スコア最大化リファイン画像を入力として推論した際の推論部構造情報を、推論部303より取得する。また、BP演算部3001は、BP法を用いることで、推論部構造情報に基づいて、重要特徴マップを生成する。
【0278】
切り出し部3002は、差分画像及びSSIM画像から、変更可能領域に対応する画像部分を切り出すことに加えて、重要特徴マップから、変更可能領域に対応する画像部分を切り出す。更に、切り出し部3002は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像と重要特徴マップとを乗算して、乗算画像を生成する。
【0279】
このように、差分画像とSSIM画像と重要特徴マップとを乗算することで、作用結果画像において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
【0280】
なお、乗算の際に差分画像を用いることで、作用結果画像は、正解ラベルのスコアが上がる画像に自動的に修正されることになる。したがって、このような利点を考慮しないのであれば、詳細原因解析部2910は、(差分画像を用いずに)SSIM画像と重要特徴マップとを用いて乗算を行い、作用結果画像を出力してもよい。
【0281】
<詳細原因解析部の処理の具体例>
次に、詳細原因解析部2910の処理の具体例について説明する。
図31は、詳細原因解析部の処理の具体例を示す第2の図である。なお、
図27に示した詳細原因解析部2510の処理の具体例との相違点は、BP演算部3001において、推論部構造情報(I)に基づいて、BP法を用いた処理が行われ、重要特徴マップが生成されている点である。また、切り出し部3002において、重要特徴マップから変更可能領域に対応する画像部分が切り出され、切り出し画像(J)が出力されている点である。更に、切り出し部3002において、切り出し画像(C)と切り出し画像(D)と切り出し画像(J)とが乗算され、乗算画像(G)が生成されている点である。
【0282】
<詳細原因解析処理の流れ>
次に、詳細原因解析部2910による詳細原因解析処理の流れについて説明する。
図32は、詳細原因解析処理の流れを示す第2のフローチャートである。
図28に示したフローチャートとの相違点は、ステップS3201、ステップS3202、ステップS3203である。
【0283】
ステップS3201において、BP演算部3001は、スコア最大化リファイン画像を入力として推論した際の推論部構造情報を、推論部303より取得し、BP法を用いることで、推論部構造情報に基づいて重要特徴マップを生成する。
【0284】
ステップS3202において、切り出し部3002は、重要特徴マップから、変更可能領域に対応する画像部分を切り出す。
【0285】
ステップS3203において、切り出し部3002は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像と重要特徴マップとを乗算して、乗算画像を生成する。
【0286】
以上の説明から明らかなように、第8の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像と推論部構造情報とに基づいて、差分画像とSSIM画像と重要特徴マップとを生成し、変更可能領域を切り出して乗算する。これにより、第8の実施形態に係る解析装置100によれば、変更可能領域内において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
【0287】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0288】
100 :解析装置
140 :誤推論原因抽出部
141 :リファイン画像生成部
142 :マップ生成部
143 :特定部
301 :画像リファイナ部
302 :画像誤差演算部
303 :推論部
304 :スコア誤差演算部
311 :注目領域導出部
321 :変更領域制限情報生成部
322 :マスク画像生成部
323 :領域抽出部
324 :合成部
325 :判断部
1010 :リファイン画像生成部
1020 :特定部
1310 :マップ生成部
1311 :重要特徴マップ生成部
1312 :劣化尺度マップ生成部
1313 :重畳部
1320 :特定部
1321 :スーパーピクセル分割部
1322 :重要スーパーピクセル決定部
1323 :重要スーパーピクセル評価部
1610 :領域抽出部
1611 :合成部
2110 :マップ生成部
2111 :平均化部
2310 :リファイン画像生成部
2311 :画像誤差演算部
2320 :特定部
2321 :補正部
2510 :詳細原因解析部
2601 :画像差分演算部
2602 :SSIM演算部
2603 :切り出し部
2604 :作用部
2910 :詳細原因解析部
3001 :BP演算部
3002 :切り出し部