(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-10
(45)【発行日】2023-10-18
(54)【発明の名称】解析装置、解析プログラム及び解析方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20231011BHJP
【FI】
G06T7/00 350C
(21)【出願番号】P 2019200864
(22)【出願日】2019-11-05
【審査請求日】2022-07-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】久保田 智規
(72)【発明者】
【氏名】中尾 鷹詔
(72)【発明者】
【氏名】村田 康之
【審査官】伊知地 和之
(56)【参考文献】
【文献】特表2018-534694(JP,A)
【文献】特開2018-097807(JP,A)
【文献】久保田智規他,CNNを用いた物体認識における誤認識の原因を可視化する一手法,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM) 2019-CVIM-218 [online] ,日本,情報処理学会,2019年08月28日
【文献】Ross Girshick et al.,Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation,2014 IEEE Conference on Computer Vision and Pattern Recognition,米国,IEEE,2014年06月,DOI: 10.1109/CVPR.2014.81
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
CSDB(日本国特許庁)
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成するマップ生成部と、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する特定部と、を有し、
前記画像生成部は、
前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成する、解析装置。
【請求項2】
前記画像生成部は、推論時に算出する、前記誤推論画像に含まれる推論対象に関する情報を用いて前記リファイン画像を生成し、前記推論対象に関する情報として、前記誤推論画像における推論対象の位置及び大きさ、存在確率、推論対象を正しく検出できたか否かを示す評価指標、推論対象が外接矩形に含まれる確率、のいずれかを算出する、請求項1に記載の解析装置。
【請求項3】
前記画像生成部は、推論時に算出する前記推論対象に関する情報と、前記誤推論画像に含まれる推論対象に関する正解情報との誤差を用いて、前記誤推論画像から前記リファイン画像を生成する、請求項
2に記載の解析装置。
【請求項4】
前記マップ生成部は、前記1のリファイン画像に含まれる複数の推論対象それぞれについて、前記第1のマップを生成することで、推論対象の数に応じた数の前記第3のマップを生成する、請求項
1に記載の解析装置。
【請求項5】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する、処理をコンピュータに実行させるための解析プログラムであって、
前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成する、解析プログラム。
【請求項6】
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する、処理をコンピュータが実行する解析方法であって、
前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成する、解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、解析装置、解析プログラム及び解析方法に関する。
【背景技術】
【0002】
近年、CNN(Convolutional Neural Network)を用いた画像認識処理において、誤ったラベルが推論された場合の誤推論の原因を解析する解析技術が提案されている。一例として、スコア最大化法(Activation Maximization)が挙げられる。また、画像認識処理において推論時に注目される画像箇所を解析する解析技術が提案されている。一例として、BP(Back Propagation)法、GBP(Guided Back Propagation)法等が挙げられる。
【0003】
スコア最大化法は、推論の正解ラベルが最大スコアとなるように入力画像を変更した際の変更部分を、誤推論の原因となる画像箇所として特定する方法である。また、BP法やGBP法は、推論したラベルから逆伝播し、入力画像までたどることで、推論の際に反応した特徴部分を可視化する方法である。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-097807号公報
【文献】特開2018-045350号公報
【文献】Ramprasaath R. Selvariju, et al.: Grad-cam: Visual explanations from deep networks via gradient-based localization. The IEEE International Conference on Computer Vision (ICCV), pp. 618-626, 2017.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した解析技術の場合、いずれも誤推論の原因となる画像箇所を十分な精度で特定することができないという問題がある。
【0006】
一つの側面では、誤推論の原因となる画像箇所を特定する際の精度を向上させることを目的としている。
【課題を解決するための手段】
【0007】
一態様によれば、解析装置は、
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成するマップ生成部と、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する特定部と、を有し、
前記画像生成部は、前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成する。
【発明の効果】
【0008】
誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図2】解析装置のハードウェア構成の一例を示す図である。
【
図3】誤推論原因抽出部の機能構成の一例を示す図である。
【
図4】画像リファイナ部の処理の具体例を示す図である。
【
図6】リファイン画像内のオブジェクトの位置及び大きさの算出方法の一例を示す図である。
【
図7】リファイン画像内のオブジェクトの存在確率の一例を示す図である。
【
図8】リファイン画像内のオブジェクトのIoUの算出方法の一例を示す図である。
【
図10】マップ生成部の処理の概要を示す図である。
【
図11】選択的BP法を用いた重要特徴マップの生成方法の一例を示す図である。
【
図12】スーパーピクセル分割部の処理の具体例を示す図である。
【
図13】重要スーパーピクセル決定部の処理の具体例を示す図である。
【
図14】領域抽出部及び合成部の処理の具体例を示す図である。
【
図15】誤推論原因抽出処理の流れを示す第1のフローチャートである。
【
図16】誤推論原因抽出処理の流れを示す第2のフローチャートである。
【
図17】スコア最大化リファイン画像生成処理の流れを示すフローチャートである。
【
図18】誤推論原因抽出処理の具体例を示す図である。
【発明を実施するための形態】
【0010】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
[第1の実施形態]
<解析装置の機能構成>
はじめに、第1の実施形態に係る解析装置の機能構成について説明する。
図1は、解析装置の機能構成の一例を示す図である。解析装置100には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置100は、推論部110、誤推論画像抽出部120、誤推論原因抽出部140として機能する。
【0012】
推論部110は、学習済みのCNNを用いて画像認識処理を行う。具体的には、推論部110は、入力画像10が入力されることで、入力画像10に含まれるオブジェクト(推論対象)の種類(本実施形態では、車両の種類)を示すラベルを推論し、推論したラベルを出力する。
【0013】
誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの種類を示すラベル(正解ラベル)と、推論部110により推論されたラベルとが一致するか否かを判定する。また、誤推論画像抽出部120は、一致しないと判定した(誤ったラベルが推論された)入力画像を、"誤推論画像"として抽出し、誤推論画像格納部130に格納する。
【0014】
あるいは、誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの正解位置と、推論部110により推論されたオブジェクトの位置とが一致するか否かを判定する。また、誤推論画像抽出部120は、オブジェクトの正解位置と、推論されたオブジェクトの位置とがずれていると判定された入力画像、または、オブジェクトの位置が推論されなかった入力画像を、"誤推論画像"として抽出し、誤推論画像格納部130に格納する。なお、オブジェクトの正解位置は、例えば、入力画像10に教師情報として付加されていてもよいし、正しく推論できる状態で推論することで取得してもよい。あるいは、他の手段を用いてオブジェクトの正解位置を特定してもよい。
【0015】
誤推論原因抽出部140は、誤推論画像について、誤推論の原因となる画像箇所を特定し、誤推論原因情報を出力する。具体的には、誤推論原因抽出部140は、リファイン画像生成部141と、マップ生成部142と、特定部143とを有する。
【0016】
リファイン画像生成部141は画像生成部の一例である。リファイン画像生成部141は、誤推論画像格納部130に格納された誤推論画像を読み出す。また、リファイン画像生成部141は、読み出した誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
【0017】
マップ生成部142は、誤推論の原因を解析する既知の解析技術等を用いて、正解ラベルを推論するための各画素の重要度を示すマップを生成する。
【0018】
特定部143は、誤推論画像を複数の領域に分割し、分割した複数の領域のうち、生成されたマップに基づいて規定した領域を、生成されたスコア最大化リファイン画像で置き換える。また、特定部143は、当該領域をスコア最大化リファイン画像で置き換えた誤推論画像を入力してラベルを推論し、推論したラベルのスコアから、置き換えの効果を判定する。
【0019】
また、特定部143は、領域を更新しながらラベルを推論し、推論したラベルのスコアから、誤推論の原因となる画像箇所を領域単位で特定する。更に、特定部143は、領域単位で特定した誤推論の原因となる画像箇所を、誤推論原因情報として出力する。
【0020】
このように、
・既知の解析技術を用いて、正解ラベルを推論するための各画素の重要度を示すマップを生成し、
・生成したマップに基づいて規定した領域を、スコア最大化リファイン画像で置き換え、
・置き換えの効果を参照しながら、誤推論の原因となる画像箇所を特定する、
ことで、誤推論原因抽出部140によれば、誤推論の原因となる画像箇所を精度よく特定することができる。
【0021】
<解析装置のハードウェア構成>
次に、解析装置100のハードウェア構成について説明する。
図2は、解析装置のハードウェア構成の一例を示す図である。
図2に示すように、解析装置100は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
【0022】
また、解析装置100は、補助記憶装置204、表示装置205、操作装置206、I/F(Interface)装置207、ドライブ装置208を有する。なお、解析装置100の各ハードウェアは、バス209を介して相互に接続されている。
【0023】
CPU201は、補助記憶装置204にインストールされている各種プログラム(例えば、解析プログラム等)を実行する演算デバイスである。なお、
図2には示していないが、演算デバイスとしてアクセラレータ(例えば、GPU(Graphics Processing Unit)など)を組み合わせてもよい。
【0024】
ROM202は、不揮発性メモリである。ROM202は、補助記憶装置204にインストールされている各種プログラムをCPU201が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM202はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
【0025】
RAM203は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM203は、補助記憶装置204にインストールされている各種プログラムがCPU201によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
【0026】
補助記憶装置204は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。例えば、誤推論画像格納部130は、補助記憶装置204において実現される。
【0027】
表示装置205は、誤推論原因情報等を含む各種表示画面を表示する表示デバイスである。操作装置206は、解析装置100のユーザが解析装置100に対して各種指示を入力するための入力デバイスである。
【0028】
I/F装置207は、例えば、不図示のネットワークと接続するための通信デバイスである。
【0029】
ドライブ装置208は記録媒体210をセットするためのデバイスである。ここでいう記録媒体210には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体210には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0030】
なお、補助記憶装置204にインストールされる各種プログラムは、例えば、配布された記録媒体210がドライブ装置208にセットされ、該記録媒体210に記録された各種プログラムがドライブ装置208により読み出されることでインストールされる。あるいは、補助記憶装置204にインストールされる各種プログラムは、不図示のネットワークよりダウンロードされることでインストールされてもよい。
【0031】
<誤推論原因抽出部の機能構成>
次に、第1の実施形態に係る解析装置100において実現される機能のうち、誤推論原因抽出部140の機能構成の詳細について説明する。
図3は、誤推論原因抽出部の機能構成の一例を示す図である。以下、誤推論原因抽出部140の各部(リファイン画像生成部141、マップ生成部142、特定部143)の詳細について説明する。
【0032】
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部141の詳細について説明する。
図3に示すように、リファイン画像生成部141は、画像リファイナ部301、画像誤差演算部302、推論部303、誤差演算部304を有する。
【0033】
画像リファイナ部301は、例えば、画像の生成モデルとしてCNNを用いて、誤推論画像からリファイン画像を生成する。
【0034】
なお、画像リファイナ部301では、生成したリファイン画像を用いて推論した際に、正解ラベルのスコアが最大となるように、誤推論画像を変更する。また、画像リファイナ部301では、画像の生成モデルを用いてリファイン画像を生成するにあたり、例えば、誤推論画像に含まれるオブジェクトに関する情報が、オブジェクト(推論対象)に関する正解情報に近づくように、リファイン画像を生成する。更に、画像リファイナ部301では、画像の生成モデルを用いてリファイン画像を生成するにあたり、例えば、誤推論画像からの変更量(リファイン画像と誤推論画像との差分)が小さくなるように、リファイン画像を生成する。
【0035】
より具体的には、画像リファイナ部301では、
・生成したリファイン画像を用いて推論した際のスコアと、正解ラベルのスコアを最大化したスコアとの誤差であるスコア誤差と、
・生成したリファイン画像を用いてラベルを推論した際のオブジェクト(推論対象)に関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差と、
・生成したリファイン画像と誤推論画像との差分である画像差分値(例えば、画像差分(L1差分)やSSIM(Structural Similarity)やそれらの組み合わせ)と、
が最小化するようにCNNの学習を行う。
【0036】
画像誤差演算部302は、誤推論画像と、CNNの学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。画像誤差演算部302では、例えば、画素ごとの差分(L1差分)演算やSSIM(Structural Similarity)演算を行うことにより、画像差分値を算出し、画像リファイナ部301に入力する。
【0037】
推論部303は、学習済みのCNNを用いて画像認識処理を行う。推論部303が有する学習済みのCNNは、画像リファイナ部301により生成されたリファイン画像(またはスコア最大化リファイン画像)、または重要スーパーピクセル決定部322で生成された合成画像を入力してラベルを推論し、スコアを算出する。なお、ここでいう合成画像とは、誤推論画像のうち、マップ生成部142で生成されたマップ(重要特徴指標マップ)に基づいて規定した領域を、スコア最大化リファイン画像で置き換えた誤推論画像を指すものとする。
【0038】
また、推論部303は、リファイン画像を入力してラベルを推論する際、リファイン画像内のオブジェクトに関する情報を算出し、スコアとともに、誤差演算部304に通知する。
【0039】
更に、推論部303は、合成画像を入力してラベルを推論する際、スコアを重要スーパーピクセル評価部323に通知する。
【0040】
誤差演算部304は、推論部303より通知されたスコアと、正解ラベルのスコアを最大化したスコアとの誤差であるスコア誤差を算出し、画像リファイナ部301に通知する。また、誤差演算部304は、推論部303より通知されたオブジェクトに関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差を算出し、画像リファイナ部301に通知する。
【0041】
誤差演算部304により通知されたスコア誤差及びオブジェクト誤差は、画像誤差演算部302により通知された画像差分値とともに、画像リファイナ部301において、CNNの学習に用いられる。
【0042】
このように、CNNの学習において、オブジェクト誤差を用いることで、画像リファイナ部301によれば、スコア最大化リファイン画像を適切に生成することができる。
【0043】
なお、画像リファイナ部301が有するCNNの学習中に画像リファイナ部301から出力されるリファイン画像は、リファイン画像格納部305に格納される。画像リファイナ部301が有するCNNの学習は、
・予め定められた学習回数分(例えば、最大学習回数=N回分)、あるいは、
・正解ラベルのスコアが所定の閾値を超えるまで、あるいは、
・正解ラベルのスコアが所定の閾値を超え、かつ、画像差分値が所定の閾値より小さくなるまで、あるいは、
・オブジェクト誤差が所定の閾値より小さくなるまで、
行われる。これにより、推論部303より出力される正解ラベルのスコアが最大化した際のリファイン画像であるスコア最大化リファイン画像が、リファイン画像格納部305に格納される。
【0044】
(2)マップ生成部の詳細
次に、マップ生成部142の詳細について説明する。
図3に示すように、マップ生成部142は、重要特徴マップ生成部311、劣化尺度マップ生成部312、重畳部313を有する。
【0045】
重要特徴マップ生成部311は、スコア最大化リファイン画像が入力され、ラベルが推論された際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部311は、BP(Back Propagation)法、GBP(Guided Back Propagation)法または選択的BP法を用いることで、推論部構造情報に基づいて"グレイスケール化重要特徴マップ"を生成する。グレイスケール化重要特徴マップは第2のマップの一例であり、スコア最大化リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップを、グレイスケール化したものである。
【0046】
なお、BP法は、推論したラベルが正解する入力画像(ここでは、スコア最大化リファイン画像)の推論を行うことで得た各スコアから各ラベルの誤差を計算し、入力層まで逆伝播して得られる勾配情報の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の大小のうち正値のみを画像化することで、特徴部分を可視化する方法である。
【0047】
更に、選択的BP法は、正解ラベルの誤差のみを最大にしたうえで、BP法またはGBP法を用いて処理を行う方法である。選択的BP法の場合、正解ラベルのスコアに影響を与える特徴部分のみが可視化される。
【0048】
劣化尺度マップ生成部312は、誤推論画像とスコア最大化リファイン画像とに基づいて、第1のマップの一例である"劣化尺度マップ"を生成する。劣化尺度マップは、スコア最大化リファイン画像を生成する際に変更がなされた各画素の変更度合いを示している。
【0049】
重畳部313は、重要特徴マップ生成部311において生成されたグレイスケール化重要特徴マップと、劣化尺度マップ生成部312において生成された劣化尺度マップとを重畳し、第3のマップの一例である"重要特徴指標マップ"を生成する。重要特徴指標マップは、正解ラベルを推論するための各画素の重要度を示している。
【0050】
(3)特定部の詳細
次に、特定部143の詳細について説明する。
図3に示すように、特定部143は、スーパーピクセル分割部321、重要スーパーピクセル決定部322、重要スーパーピクセル評価部323を有する。
【0051】
スーパーピクセル分割部321は、誤推論画像を、誤推論画像に含まれるオブジェクト(本実施形態では車両)の要素オブジェクト(本実施形態では、車両の部品)ごとの領域である"スーパーピクセル"に分割し、スーパーピクセル分割情報を出力する。なお、誤推論画像をスーパーピクセルに分割するにあたっては、既存の分割機能を利用するか、あるいは、車両の部品ごとに分割するように学習したCNN等を利用する。
【0052】
重要スーパーピクセル決定部322は、スーパーピクセル分割部321により出力されたスーパーピクセル分割情報に基づいて、重畳部313により生成された重要特徴指標マップの各画素の画素値を、スーパーピクセルごとに加算する。
【0053】
また、重要スーパーピクセル決定部322は、各スーパーピクセルのうち、加算値が所定の条件を満たす(重要特徴指標閾値以上)のスーパーピクセルを抽出する。また、重要スーパーピクセル決定部322は、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせたスーパーピクセル群を、変更可能領域(スコア最大化リファイン画像によって置き換えられる第1の領域)と規定する。また、重要スーパーピクセル決定部322は、組み合わせたスーパーピクセル群以外のスーパーピクセル群を、変更不可領域(スコア最大化リファイン画像によって置き換えられない第2の領域)と規定する。
【0054】
更に、重要スーパーピクセル決定部322は、誤推論画像から、変更不可領域に対応する画像部分を抽出するとともに、スコア最大化リファイン画像から、変更可能領域に対応する画像部分を抽出し、両者を合成することで、合成画像を生成する。
【0055】
なお、重要スーパーピクセル決定部322では、変更可能領域及び変更不可領域を規定する際に用いる重要特徴指標閾値を徐々に下げることで、抽出するスーパーピクセルの数を増やす(変更可能領域を広げ、変更不可領域を狭めていく)。また、重要スーパーピクセル決定部322では、抽出したスーパーピクセルの中から選択するスーパーピクセルの組み合わせを変えながら、規定する変更可能領域及び変更不可領域を更新する。
【0056】
重要スーパーピクセル評価部323は、重要スーパーピクセル決定部322において生成された合成画像が推論部303に入力されるごとに推論される正解ラベルのスコアを取得する。
【0057】
上述したように、重要スーパーピクセル決定部322では、重要特徴指標閾値を下げる回数、スーパーピクセルの組み合わせの数、に応じた数の合成画像を生成する。このため、重要スーパーピクセル評価部323では、当該数に応じた数の正解ラベルのスコアを取得する。
【0058】
また、重要スーパーピクセル評価部323は、取得したスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
【0059】
このとき、重要スーパーピクセル評価部323では、面積がなるべく小さくなるように、変更可能領域を特定する。例えば、重要スーパーピクセル評価部323では、推論部303より取得したスコアを評価する際、重要特徴指標閾値を下げる前のスーパーピクセルあるいはスーパーピクセルの組み合わせのうち、面積が小さいものから優先して評価する。また、重要スーパーピクセル評価部323では、重要特徴指標閾値が下がることで、正解ラベルが推論されるようになった時点での変更可能領域(正解ラベルを推論可能な限界の重要特徴指標閾値により抽出され、面積が最小の変更可能領域)を特定する。
【0060】
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部(リファイン画像生成部141、マップ生成部142、特定部143)の処理の具体例について説明する。なお、以下では、誤推論画像に、推論対象として、複数のオブジェクト(複数の車両)が含まれているものとして説明を行う。
【0061】
(1)リファイン画像生成部の処理の具体例
はじめに、リファイン画像生成部141の各部(ここでは、画像リファイナ部301、推論部303、誤差演算部304)の処理の具体例について説明する。
【0062】
(1-1)画像リファイナ部の処理の具体例
図4は、画像リファイナ部の処理の具体例を示す図である。
図4に示すように、画像リファイナ部301には、誤推論画像410が入力される。画像リファイナ部301では、入力された誤推論画像410に含まれる、それぞれのオブジェクト(車両411、412)についてスコア最大化リファイン画像を生成する。
【0063】
なお、
図4において、
・車両411は、正解ラベル="車種A"のところ、"車種B"と誤推論した車両、
・車両412は、正解ラベル="車種B"のところ、"車種C"と誤推論した車両、
であるとする。
【0064】
画像リファイナ部301は、車両411、車両412について、スコア最大化リファイン画像を生成する際、2通りの生成方法(第1及び第2の生成方法)のうちのいずれかの生成方法を選択的に実行する。
【0065】
画像リファイナ部301が実行する第1の生成方法は、誤推論画像に含まれる全てのオブジェクトの正解ラベルのスコアが最大となるように、スコア最大化リファイン画像を生成する方法である。
【0066】
図4(a)は、画像リファイナ部301が、誤推論画像410に対して、第1の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(a)の例の場合、
・車両411のヘッドライト421の色、道路標示422の色、車両411のフロントグリル423の色、フロントグリル423と左側ヘッドライト421との間の車体424の色、
・車両412のフロントグリル425の色、道路標示426の色、
を変更することで、車両411を"車種A"、車両412を"車種B"と正しく推論可能な、1のスコア最大化リファイン画像420が生成されたことを示している。
【0067】
一方、画像リファイナ部301が実行する第2の生成方法は、誤推論画像に含まれるオブジェクトごとに、スコアが最大化するように、スコア最大化リファイン画像を生成する方法である。第2の生成方法によれば、誤推論画像に含まれるオブジェクトの数に応じた数のスコア最大化リファイン画像が生成される。
【0068】
図4(b-1)は、画像リファイナ部301が、誤推論画像410に含まれる車両411に対して、第2の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(b-1)の例の場合、
・車両411のヘッドライト421の色、
・フロントグリル423の色、
・フロントグリル423と左側ヘッドライト421との間の車体424の色、
を変更することで、車両411を"車種A"と正しく推論することが可能なスコア最大化リファイン画像430が生成されたことを示している。
【0069】
また、
図4(b-2)は、画像リファイナ部301が、誤推論画像410に含まれる車両412に対して、第2の生成方法によりスコア最大化リファイン画像を生成した様子を示している。
図4(b-2)の例の場合、車両412のフロントグリル425の色を変更することで、車両412を"車種B"と正しく推論可能なスコア最大化リファイン画像440が生成されたことを示している。
【0070】
(1-2)推論部の処理の具体例
図5は、推論部の処理の具体例を示す図である。具体的には、
図5の例は、画像リファイナ部301において、第1の生成方法により生成されたリファイン画像500(スコア最大化リファイン画像を生成する途中過程で生成されるリファイン画像)を推論部303に入力した様子を示している。
【0071】
図5に示すように、推論部303では、車両411のラベル、スコアに加えて、車両411に関する情報として、"位置及び大きさ"、"存在確率"、"IoU"、"Pr"を算出する。同様に、推論部303では、車両412のラベル、スコアに加えて、車両412に関する情報として、"位置及び大きさ"、"存在確率"、"IoU"、"Pr"を算出する。
【0072】
以下、推論部303が算出する、オブジェクトに関する情報(車両411、412に関する情報)について、
図6~
図8を用いて詳説する。
【0073】
(i)位置及び大きさ
図6は、リファイン画像内のオブジェクトの位置及び大きさの算出方法の一例を示す図である。推論部303では、リファイン画像500に含まれるオブジェクト(車両411、412)の外接矩形601、602を特定することで、オブジェクトの位置及び大きさを算出する。
【0074】
なお、推論部303は、オブジェクトの位置及び大きさの算出方法として、3通りの算出方法(第1乃至第3の算出方法)を有しており、いずれかの算出方法により、オブジェクトの位置及び大きさを算出するものとする。
【0075】
推論部303が有する第1の算出方法は、外接矩形601、602それぞれの、左上頂点の座標、右下頂点の座標を算出する方法である。第1の算出方法によれば、符号611に示すように、
・車両412の位置及び大きさとして、(x11,y11)、(x12,y12)が、
・車両411の位置及び大きさとして、(x21,y21)、(x22,y22)が、
それぞれ算出される。
【0076】
一方、推論部303が有する第2の算出方法は、外接矩形601、602それぞれの、特定の位置からの左上頂点までの距離、右下頂点までの距離を算出する方法である。第2の算出方法によれば、符号612に示すように、
・車両412の位置及び大きさとして、dx11、dy11、dx12、dy12が、
・車両411の位置及び大きさとして、dx21、dy21、dx22、dy22が、
それぞれ算出される。
【0077】
一方、推論部303が有する第3の算出方法は、外接矩形601、602それぞれの、左上頂点の座標、高さ、幅を算出する方法である。第3の算出方法によれば、符号613に示すように、
・車両412の位置及び大きさとして、(x1,y1)、h1、w1が、
・車両411の位置及び大きさとして、(x2,y2)、h2、w2が、
それぞれ算出される。
【0078】
なお、
図6では、3通りの算出方法を例示したが、推論部303は、
図6に示した算出方法以外の算出方法により、リファイン画像内のオブジェクトの位置及び大きさを算出してもよい。
【0079】
例えば、第2の算出方法では、特定の位置を基準としたが、特定の位置として、基準となる矩形の左上頂点を用いてもよい(第4の算出方法)。
【0080】
また、第3の算出方法では、外接矩形の左上頂点の座標を算出したが、外接矩形の中心位置の座標を算出してもよい(第5の算出方法)。
【0081】
(ii)存在確率
図7は、リファイン画像内のオブジェクトの存在確率の一例を示す図である。推論部303では、リファイン画像500を複数のブロックに分割し、それぞれのブロックについてオブジェクトが存在する確率を算出する。
【0082】
図7において、符号700は、破線で示すそれぞれのブロックについて、車両411、412の存在確率を算出した様子を示している。
【0083】
(iii)IoU及びPr
IoU(Intersection over Union)は、推論部303がリファイン画像500において、車両411、412を正しく検出できたか否かを示す評価指標である。
図8は、リファイン画像内のオブジェクトのIoUの算出方法の一例を示す図である。
図8に示すように、推論部303において推論された車両411の外接矩形601に対して、正解外接矩形801が与えられたとすると、車両411のIoUは、下式により算出することができる。
(式1)
車両411のIoU=AoO
1/AoU
1
ただし、AoO
1は、推論部303において推論された車両411の外接矩形601と、正解外接矩形801とが重なっている部分の面積を指す。また、AoU
1は、推論部303において推論された車両411の外接矩形601と、正解外接矩形801との和集合の面積を指す。
【0084】
同様に、推論部303において推論された車両412の外接矩形602に対して、正解外接矩形802が与えられたとすると、車両412のIoUは、下式により算出することができる。
(式2)
車両412のIoU=AoO2/AoU2
ただし、AoO2は、推論部303において推論された車両412の外接矩形602と、正解外接矩形802とが重なっている部分の面積を指す。また、AoU2は、推論部303において推論された車両412の外接矩形602と、正解外接矩形802との和集合の面積を指す。
【0085】
一方、Prは、推論部303において推論された車両411(または412)の外接矩形601(または602)に、車両411(または412)が含まれる確率を指す。なお、車両411、412のIoUと、Prとをかけ合わせることで、推論部303において推論された車両411(または412)の外接矩形601(または602)の信頼度を算出することができる。
【0086】
(1-3)誤差演算部の処理の具体例
図9は、誤差演算部の処理の具体例を示す図である。
図9に示すように、誤差演算部304に対しては、リファイン画像が入力されることで推論部303がラベルを推論した際に算出した、スコア、オブジェクトに関する情報(位置及び大きさ、存在確率、IoU、Pr)を入力することができる。
【0087】
図9に示すように、誤差演算部304では、入力可能なスコア、オブジェクトに関する情報を用いて、スコア誤差、オブジェクト誤差を算出する。具体的には、誤差演算部304では、
・生成したリファイン画像を用いて推論した際のスコアと、正解ラベルのスコアを最大化したスコアとの誤差であるスコア誤差、
・生成したリファイン画像を用いてラベルを推論した際のオブジェクトに関する情報と、正解ラベルのオブジェクトに関する正解情報との誤差であるオブジェクト誤差として、
・位置及び大きさの誤差、
・存在確率の誤差(=(オブジェクトが存在する領域の存在確率と1.0との差分)+(オブジェクトが存在しない領域の存在確率と0.0との差分))、
・信頼度(=IoU×Pr)、
を算出する。
【0088】
なお、誤差演算部304は、推論部303から通知されるスコア、及び、オブジェクトに関する情報のうち、スコア誤差またはオブジェクト誤差の算出に用いる項目を予め設定することができるものとする。
図9の例は、誤差演算部304に、スコア、IoU、Prが入力されるように設定されているため、誤差演算部304では、スコア誤差と信頼度とが、画像リファイナ部301に通知されることを示している。
【0089】
(2)マップ生成部の処理の具体例
次に、マップ生成部142の処理の具体例について説明する。
【0090】
(2-1)マップ生成部の各部の処理の概要
はじめに、マップ生成部142の各部(重要特徴マップ生成部311、劣化尺度マップ生成部312、重畳部313の)の処理の概要について説明する。
図10は、マップ生成部の処理の概要を示す図である。
【0091】
図10に示すように、マップ生成部142において重要特徴マップ生成部311は、推論部303がスコア最大化リファイン画像を入力してラベルを推論した際の推論部構造情報1001を、推論部303から取得する。また、重要特徴マップ生成部311は、取得した推論部構造情報1001に基づいて、例えば、選択的BP法を用いて重要特徴マップを生成する。
【0092】
なお、重要特徴マップ生成部311では、スコア最大化リファイン画像に含まれるオブジェクトごとに、重要特徴マップを生成する。スコア最大化リファイン画像420の場合、車両411と車両412の2つのオブジェクトが含まれていることから、重要特徴マップ生成部311では、例えば、選択的BP法を用いて、2つの重要特徴マップを生成する(詳細は後述)。
【0093】
また、重要特徴マップ生成部311では、2つのオブジェクトについて生成した2つの重要特徴マップをそれぞれグレイスケール化し、オブジェクト単位グレイスケール化重要特徴マップ1011、1012を生成する。
【0094】
図10に示すオブジェクト単位グレイスケール化重要特徴マップ1011、1012は、それぞれ、0から255の画素値でグレイスケール化されている。このため、オブジェクト単位グレイスケール化重要特徴マップ1011、1012において、画素値が255に近い画素は、推論時に注目度合いが高い画素(注目画素)であり、画素値が0に近い画素は、推論時に注目度合いが低い画素(非注目画素)である。
【0095】
一方、劣化尺度マップ生成部312は、リファイン画像格納部305よりスコア最大化リファイン画像420を読み出し、オブジェクトごとに、誤推論画像410との間でSSIM(Structural Similarity)演算を行う。
【0096】
スコア最大化リファイン画像420の場合、車両411と車両412の2つのオブジェクトが含まれていることから、劣化尺度マップ生成部312では、2つのオブジェクト単位劣化尺度マップ1021、1022を生成する。オブジェクト単位劣化尺度マップ1021、1022は0から1の値をとり、画素値が1に近いほど、変更度合いが小さいことを表し、画素値が0に近いほど、変更度合いが大きいことを表す。
【0097】
重畳部313は、重要特徴マップ生成部311により生成された、オブジェクト単位グレイスケール化重要特徴マップ1011、1012と、劣化尺度マップ生成部312により生成された、オブジェクト単位劣化尺度マップ1021、1022とを取得する。また、重畳部313は、オブジェクト単位重要特徴指標マップ1031、1032を生成する。
【0098】
具体的には、重畳部313は、下式に基づいて、オブジェクト単位重要特徴指標マップ1031、1032を生成する。
(式3)
オブジェクト単位重要特徴指標マップ=オブジェクト単位グレイスケール化重要特徴マップ×(1-オブジェクト単位劣化尺度マップ)
上式において、(1-オブジェクト単位劣化尺度マップ)の項は、0から1の値をとり、1に近いほど変更度合いが大きく、0に近いほど変更度合いが小さい。つまり、オブジェクト単位重要特徴指標マップ1031、1032は、推論時に注目した各画素の注目度合いを示すオブジェクト単位グレイスケール化重要特徴マップに、変更度合いの大小による強弱をつけることで生成されたものである。
【0099】
具体的には、オブジェクト単位重要特徴指標マップ1031、1032は、
・オブジェクト単位劣化尺度マップ1021、1022において変更度合いが小さい部分について、オブジェクト単位グレイスケール化重要特徴マップの画素値を小さくし、
・オブジェクト単位劣化尺度マップ1021、1022において変更度合いが大きい部分について、オブジェクト単位グレイスケール化重要特徴マップの画素値を大きくする、
ことで生成される。
【0100】
なお、より見やすくするために、オブジェクト単位重要特徴指標マップは白黒を反転させてもよい。
図10に示すオブジェクト単位重要特徴指標マップは、下式に基づいて白黒を反転させたものを表示している。
(式4)
(反転した)オブジェクト単位重要特徴指標マップ=255-[オブジェクト単位グレイスケール化重要特徴マップ×(1-オブジェクト単位劣化尺度マップ)]
ここで、重畳部313が、上式に基づいて、オブジェクト単位グレイスケール化重要特徴マップ1011、1012とオブジェクト単位劣化尺度マップ1021、1022とを重畳することによる利点について説明する。
【0101】
上述したように、重要特徴マップ生成部311において生成される、オブジェクト単位グレイスケール化重要特徴マップ1011、1012は、正解ラベルのスコアが最大となった際に、推論部303が注目した注目部分に他ならない。
【0102】
一方、劣化尺度マップ生成部312において生成される、オブジェクト単位劣化尺度マップ1021、1022は、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分を表しており、誤推論の原因となる部分を表している。ただし、劣化尺度マップ生成部312において生成されるオブジェクト単位劣化尺度マップ1021、1022は、正解ラベルを推論するための最小限の部分ではない。
【0103】
重畳部313では、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分と、推論部303が注目した注目部分とを重畳することで、正解ラベルを推論するための最小限の部分を、正解ラベルを推論するための重要な部分として可視化する。
【0104】
なお、
図10の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、
図10に示すように、オブジェクトごとに劣化尺度マップが生成されるため、対応するオブジェクト単位グレイスケール化重要特徴マップに重畳することで、オブジェクト単位重要特徴指標マップが生成されることになる。
【0105】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、劣化尺度マップ生成部312では、全てのオブジェクトを含む大きさの1の劣化尺度マップを生成する。この場合、重畳部313では、当該1の劣化尺度マップを共通に用いて、各オブジェクトのオブジェクト単位グレイスケール化重要特徴マップを重畳する。これにより、オブジェクトごとのオブジェクト単位重要特徴指標マップが生成されることになる。
【0106】
(2-2)選択的BP法を用いた重要特徴マップの生成方法の詳細
次に、重要特徴マップ生成部311が、選択的BP法を用いて、オブジェクトごとに重要特徴マップを生成する生成方法の詳細について説明する。上述したように、重要特徴マップ生成部311では、スコア最大化リファイン画像に含まれるオブジェクトごとに、重要特徴マップを生成する。
【0107】
図11は、選択的BP法を用いた重要特徴マップの生成方法の一例を示す図である。このうち、
図11(a)は、スコア最大化リファイン画像420に含まれる全てのオブジェクトについての重要特徴マップを生成する様子を示したものである。
【0108】
上述したように、スコア最大化リファイン画像420には、2つのオブジェクト(車両411、412)が含まれ、互いに異なる車種である。このため、2つのオブジェクトに対して同時に選択的BP法を用いると、2つのオブジェクトに対する注目領域の情報が互いに混在した重要特徴マップが生成されることになる。
【0109】
一方、
図11(b)は、スコア最大化リファイン画像420に含まれる、2つのオブジェクトについて、別々に重要特徴マップを生成する様子を示したものである。
図11(b)に示すように、2つのオブジェクトに対して別々に選択的BP法を用いることで、2つのオブジェクトに対する注目領域の情報が混在することなく、重要特徴マップを生成することができる。
【0110】
このようなことから、重要特徴マップ生成部311では、スコア最大化リファイン画像に含まれるオブジェクトごとに、別々に重要特徴マップを生成する。この結果、重要特徴マップ生成部311によれば、スコア最大化リファイン画像に複数のオブジェクトが含まれていた場合であっても、適切な重要特徴マップを生成することができる。
【0111】
(3)特定部の処理の具体例
次に、特定部143の各部(ここでは、スーパーピクセル分割部321、重要スーパーピクセル決定部322)の処理の具体例について説明する。
【0112】
(3-1)スーパーピクセル分割部の処理の具体例
はじめに、特定部143に含まれるスーパーピクセル分割部321の処理の具体例について説明する。
図12は、スーパーピクセル分割部の処理の具体例を示す図である。
図12に示すように、スーパーピクセル分割部321は、例えば、SLIC(Simple Linear Iterative Clustering)処理を行う分割部1210を有する。
【0113】
分割部1210は、誤推論画像511をオブジェクトごとに取得し、オブジェクト単位誤推論画像1201、1202それぞれに含まれるオブジェクトについて、要素オブジェクトごとの領域であるスーパーピクセルに分割する。また、スーパーピクセル分割部321は、分割部1210によりスーパーピクセルに分割されることで生成された、オブジェクト単位スーパーピクセル分割情報1211、1212を出力する。
【0114】
なお、
図12の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、オブジェクトの数に応じた数のオブジェクト単位重要特徴指標マップが生成されるため、スーパーピクセル分割部321においても、オブジェクトの数に応じた数のオブジェクト単位スーパーピクセル分割情報が生成されることになる。
【0115】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、スーパーピクセル分割部321では、全てのオブジェクトを含む大きさの1のスーパーピクセル分割情報を生成する。
【0116】
(3-2)重要スーパーピクセル決定部の処理の具体例
次に、特定部143に含まれる重要スーパーピクセル決定部322の処理の具体例について説明する。
図13は、重要スーパーピクセル決定部の処理の具体例を示す図である。
【0117】
図13に示すように、重要スーパーピクセル決定部322は、領域抽出部1320、合成部1330を有する。
【0118】
重要スーパーピクセル決定部322では、重畳部313より出力された、オブジェクト単位重要特徴指標マップ1031、1032と、スーパーピクセル分割部321より出力されたオブジェクト単位スーパーピクセル分割情報1211、1212とを重ね合わせる。これにより、重要スーパーピクセル決定部322では、オブジェクト単位重要スーパーピクセル画像1301、1302を生成する。なお、
図13では、オブジェクト単位重要特徴指標マップ1031、1032として、(白黒を反転した)重要特徴指標マップを用いた場合を示している。
【0119】
また、重要スーパーピクセル決定部322では、生成したオブジェクト単位重要スーパーピクセル画像1301内のスーパーピクセルごとに、オブジェクト単位重要特徴指標マップ1031の各画素の画素値を加算する。同様に、重要スーパーピクセル決定部322では、生成したオブジェクト単位重要スーパーピクセル画像1302内のスーパーピクセルごとに、オブジェクト単位重要特徴指標マップ1032の各画素の画素値を加算する。なお、
図13において、オブジェクト単位重要スーパーピクセル画像1311、1312は、それぞれのオブジェクトについて、スーパーピクセルごとの加算値の一例を明示したものである。
【0120】
また、重要スーパーピクセル決定部322では、各スーパーピクセルについて、加算値が、重要特徴指標閾値以上であるかを判定し、加算値が重要特徴指標閾値以上であると判定したスーパーピクセルを抽出する。
【0121】
また、重要スーパーピクセル決定部322は、抽出したスーパーピクセルの中から、選択したスーパーピクセルを組み合わせたスーパーピクセル群を、オブジェクト単位変更可能領域と規定する。
図13のオブジェクト単位重要スーパーピクセル画像1311に含まれる斜線領域は、変更可能領域の一例を示している。また、重要スーパーピクセル決定部322は、組み合わせたスーパーピクセル群以外のスーパーピクセル群を、オブジェクト単位変更不可領域と規定する。
【0122】
更に、重要スーパーピクセル決定部322は、規定したオブジェクト単位変更可能領域及びオブジェクト単位変更不可領域を、オブジェクトごとに領域抽出部1320に通知する。
【0123】
領域抽出部1320は、オブジェクト単位誤推論画像1201、1202から、オブジェクト単位変更不可領域に対応する画像部分を抽出する。また、領域抽出部1320は、オブジェクト単位スコア最大化リファイン画像1321、1322から、オブジェクト単位変更可能領域に対応する画像部分を抽出する。
【0124】
合成部1330は、
・オブジェクト単位スコア最大化リファイン画像1321から抽出した、オブジェクト単位変更可能領域に対応する画像部分と、
・オブジェクト単位誤推論画像1201から抽出した、オブジェクト単位変更不可領域に対応する画像部分と、
を合成し、オブジェクト単位部分合成画像を生成する。
【0125】
同様に、合成部1330は、
・オブジェクト単位スコア最大化リファイン画像1322から抽出した、オブジェクト単位変更可能領域に対応する画像部分と、
・オブジェクト単位誤推論画像1202から抽出した、オブジェクト単位変更不可領域に対応する画像部分と、
を合成し、オブジェクト単位部分合成画像を生成する。
【0126】
また、合成部1330は、オブジェクトの数に応じた数のオブジェクト単位部分合成画像を合体することで、合成画像を生成する。
【0127】
図14は、領域抽出部及び合成部の処理の具体例を示す図である。
図14では、説明の簡略化のため、所定の1のオブジェクト(ここでは、車両411)に対する、領域抽出部及び合成部の処理の具体例を示している。
【0128】
図14において、上段は、領域抽出部1320が、オブジェクト単位スコア最大化リファイン画像1321から、オブジェクト単位変更可能領域1401(白色部分)の画像を抽出した様子を示している。
【0129】
一方、
図14において、下段は、領域抽出部1320が、オブジェクト単位誤推論画像1201から、オブジェクト単位変更不可領域1401'(白色部分)の画像を抽出した様子を示している。なお、
図14において、オブジェクト単位変更不可領域1401'は、オブジェクト単位変更可能領域1401の白色部分と黒色部分とを反転したものである(説明の便宜上、
図14の下段では、白色部分を、変更不可領域としている)。
【0130】
合成部1330は、
図14に示すように、
・オブジェクト単位スコア最大化リファイン画像1321のオブジェクト単位変更可能領域1401の画像部分と、
・オブジェクト単位誤推論画像1201のオブジェクト単位変更不可領域1401'の画像部分と、
を合成し、オブジェクト単位部分合成画像1421を生成する。
【0131】
このように、特定部143によれば、オブジェクト単位誤推論画像のうち、オブジェクト単位スコア最大化リファイン画像で置き換える領域を、スーパーピクセル単位で特定することができる。
【0132】
なお、
図13、
図14の例では、画像リファイナ部301が、第2の生成方法によりスコア最大化リファイン画像を生成する場合について示した。第2の生成方法の場合、
図13に示すように、オブジェクトごとの大きさのオブジェクト単位スーパーピクセル分割情報及びオブジェクト単位特徴指標マップが生成される。このため、オブジェクトごとの大きさのオブジェクト単位重要スーパーピクセル画像が生成される。
【0133】
この結果、オブジェクト単位重要特徴指標マップの画素値も、オブジェクト単位重要スーパーピクセル画像を用いて、オブジェクトごとに加算する。また、変更可能領域及び変更不可領域も、オブジェクト単位重要スーパーピクセル画像を用いて、それぞれのオブジェクトについて規定される。更に、オブジェクトごとの大きさのオブジェクト単位部分合成画像を合体することで、全てのオブジェクトを含む大きさの1の合成画像が生成される。
【0134】
一方、画像リファイナ部301が、第1の生成方法によりスコア最大化リファイン画像を生成する場合、全てのオブジェクトを含む大きさの1のスーパーピクセル分割情報が生成される。このため、重要スーパーピクセル決定部322では、1のスーパーピクセル分割情報に対して、オブジェクトごとの大きさのオブジェクト単位重要特徴指標マップをそれぞれ重畳する。これにより、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像が、オブジェクトの数だけ生成される。
【0135】
この結果、オブジェクト単位重要特徴指標マップの画素値も、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて、オブジェクトごとに加算する。また、変更可能領域及び変更不可領域も、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて、それぞれのオブジェクトについて規定される。
【0136】
なお、全てのオブジェクトを含む大きさのオブジェクト単位重要スーパーピクセル画像を用いて変更可能領域及び変更不可領域を規定した場合、合成部1330では、
・全てのオブジェクトを含む大きさのオブジェクト単位部分合成画像と、
・全てのオブジェクトを含む大きさのオブジェクト単位部分合成画像を合体した、1の合成画像と、
を生成することができる。
【0137】
このため、重要スーパーピクセル評価部323では、全てのオブジェクトを含む大きさのオブジェクト単位部分合成画像が推論部303に入力されることで推論される正解ラベルのスコアを取得し、オブジェクトごとに誤推論原因情報を出力してもよい。あるいは、1の合成画像を推論部303が入力されることで推論される正解ラベルのスコアを取得し、全てのオブジェクトについての誤推論原因情報を出力してもよい。
【0138】
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。
図15及び
図16は、誤推論原因抽出処理の流れを示す第1及び第2のフローチャートである。
【0139】
ステップS1501において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、CNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。また、画像リファイナ部301は、スコア最大化リファイン画像を生成する際のモード(全てのオブジェクトを対象にスコアを最大化するモード、または、個別のオブジェクトを対象にスコアを最大化するモードのいずれか)を設定する。また、誤差演算部304は、オブジェクトに関する情報のうち、オブジェクト誤差の算出に用いる情報を設定する。更に、重要スーパーピクセル決定部322は、重要特徴指標閾値及びその下限値を、ユーザが指示した値に設定する。
【0140】
ステップS1502において、画像リファイナ部301は、スコア最大化リファイン画像生成処理を実行する。なお、スコア最大化リファイン画像生成処理の詳細は、後述する。
【0141】
ステップS1503において、重要特徴マップ生成部311は、推論部303よりスコア最大化リファイン画像を入力してラベルが推論された際の推論部構造情報を、オブジェクトごとに取得する。また、重要特徴マップ生成部311は、取得した推論部構造情報に基づいて、オブジェクト単位グレイスケール化重要特徴マップを生成する。
【0142】
ステップS1504において、劣化尺度マップ生成部312は、オブジェクト単位誤推論画像と、オブジェクト単位スコア最大化リファイン画像とに基づいて、オブジェクト単位劣化尺度マップを生成する。
【0143】
ステップS1505において、重畳部313は、オブジェクト単位グレイスケール化重要特徴マップと、オブジェクト単位劣化尺度マップとに基づいて、オブジェクト単位重要特徴指標マップを生成する。
【0144】
ステップS1506において、スーパーピクセル分割部321は、誤推論画像をオブジェクトごとにスーパーピクセルに分割し、オブジェクト単位スーパーピクセル分割情報を生成する。
【0145】
ステップS1507において、重要スーパーピクセル決定部322は、オブジェクト単位重要特徴指標マップの各画素の画素値を、スーパーピクセルごとに加算する。
【0146】
ステップS1508において、重要スーパーピクセル決定部322は、加算値が重要特徴指標閾値以上となるスーパーピクセルを抽出し、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせ、オブジェクト単位変更可能領域を規定する。また、重要スーパーピクセル決定部322は、組み合わせたスーパーピクセル群以外のスーパーピクセルを、オブジェクト単位変更不可領域と規定する。
【0147】
続いて、
図16のステップS1601において、重要スーパーピクセル決定部322は、リファイン画像格納部305から、オブジェクト単位スコア最大化リファイン画像を読み出す。
【0148】
ステップS1602において、重要スーパーピクセル決定部322は、オブジェクト単位スコア最大化リファイン画像から、オブジェクト単位変更可能領域に対応する画像部分を抽出する。
【0149】
ステップS1603において、重要スーパーピクセル決定部322は、オブジェクト単位誤推論画像から、オブジェクト単位変更不可領域に対応する画像部分を抽出する。
【0150】
ステップS1604において、重要スーパーピクセル決定部322は、オブジェクト単位変更可能領域に対応する画像部分と、オブジェクト単位変更不可領域に対応する画像部分とを合成し、オブジェクト単位部分合成画像を生成する。また、重要スーパーピクセル決定部322は、オブジェクト単位部分合成画像を合体し、合成画像を生成する。
【0151】
ステップS1605において、推論部303は、合成画像を入力してラベルを推論し、各オブジェクトの正解ラベルのスコアを算出する。また、重要スーパーピクセル評価部323は、推論部303により算出された正解ラベルのスコアを取得する。
【0152】
ステップS1606において、重要スーパーピクセル決定部322は、重要特徴指標閾値が下限値に到達したか否かを判定する。ステップS1606において、下限値に到達していないと判定した場合には(ステップS1606においてNoの場合には)、ステップS1607に進む。
【0153】
ステップS1607において、重要スーパーピクセル決定部322は、重要特徴指標閾値を下げた後、
図15のステップS1508に戻る。
【0154】
一方、ステップS1606において、下限値に到達したと判定した場合には(ステップS1606においてYesの場合には)、ステップS1608に進む。
【0155】
ステップS1608において、重要スーパーピクセル評価部323は、取得した各オブジェクトの正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(オブジェクト単位変更可能領域)を特定し、誤推論原因情報として出力する。
【0156】
<スコア最大化リファイン画像生成処理の詳細>
次に、誤推論原因抽出処理(
図15)のスコア最大化リファイン画像生成処理(ステップS1502)の詳細について説明する。
図17は、スコア最大化リファイン画像生成処理の流れを示すフローチャートである。
【0157】
ステップS1701において、画像リファイナ部301は、スコア最大化リファイン画像生成処理のモードを判定する。ステップS1701において、全てのオブジェクトを対象にスコアを最大化するモードが設定されていると判定した場合には、ステップS1711に進む。
【0158】
ステップS1711において、画像リファイナ部301は、誤推論画像からリファイン画像を生成し、リファイン画像格納部305に格納する。
【0159】
ステップS1712において、推論部303は、リファイン画像を入力してラベルを推論し、全てのオブジェクトの正解ラベルのスコアを算出する。
【0160】
ステップS1713において、画像リファイナ部301は、誤差演算部304が算出した全てのオブジェクトについてのスコア誤差及びオブジェクト誤差と、画像誤差演算部302が算出した画像差分値とを用いてCNNの学習を行う。
【0161】
ステップS1714において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1714において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1714においてNoの場合には)、ステップS1711に戻り、リファイン画像の生成を継続する。
【0162】
一方、ステップS1714において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1714においてYesの場合は)、
図15のステップS1503に戻る。なお、この時点で、リファイン画像格納部305には、1のスコア最大化リファイン画像が格納されている。
【0163】
一方、ステップS1701において、個別のオブジェクトを対象にスコアを最大化するモードが設定されていると判定した場合には、ステップS1721に進む。
【0164】
ステップS1721において、画像リファイナ部301は、誤推論画像内の所定の1のオブジェクトについてリファイン画像を生成し、リファイン画像格納部305に格納する。
【0165】
ステップS1722において、推論部303は、リファイン画像を入力してラベルを推論し、所定のオブジェクトの正解ラベルのスコアを算出する。
【0166】
ステップS1723において、画像リファイナ部301は、誤差演算部304が算出した所定の1のオブジェクトについてのスコア誤差及びオブジェクト誤差と、画像誤差演算部302が算出した画像差分値とを用いてCNNの学習を行う。
【0167】
ステップS1724において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1724において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1724においてNoの場合には)、ステップS1721に戻り、リファイン画像の生成を継続する。
【0168】
一方、ステップS1724において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1724においてYesの場合は)、ステップS1725に進む。なお、この時点で、リファイン画像格納部305には、所定の1のオブジェクトについてのスコア最大化リファイン画像が格納されている。
【0169】
ステップS1725において、画像リファイナ部301は、誤推論画像に含まれる全てのオブジェクトについて、スコア最大化リファイン画像を生成したか否かを判定する。
【0170】
ステップS1725において、スコア最大化リファイン画像を生成していないオブジェクトがあると判定した場合には(ステップS1725においてNoの場合には)、ステップS1726に進む。
【0171】
ステップS1726において、画像リファイナ部301は、スコア最大化リファイン画像を生成すべき次のオブジェクトを、所定の1のオブジェクトとして選択し、ステップS1721に戻る。
【0172】
一方、ステップS1725において、全てのオブジェクトについて、スコア最大化リファイン画像を生成したと判定した場合には(ステップS1725においてYesの場合には)、
図15のステップS1503に戻る。なお、この時点で、リファイン画像格納部305には、オブジェクトの数に応じた数のスコア最大化リファイン画像が格納されている。
【0173】
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。
図18は、誤推論原因抽出処理の具体例を示す図である。
【0174】
図18に示すように、はじめに、リファイン画像生成部141により、誤推論画像からスコア最大化リファイン画像が生成されると、マップ生成部142では、オブジェクト単位重要特徴指標マップを生成する。
【0175】
続いて、誤推論画像がオブジェクト単位で読み出されると、スーパーピクセル分割部321では、オブジェクト単位スーパーピクセル分割情報を生成する。
【0176】
続いて、重要スーパーピクセル決定部322では、オブジェクト単位重要特徴指標マップの画素値を、オブジェクト単位スーパーピクセル分割情報に基づいて分割されたスーパーピクセルごとに加算し、オブジェクト単位重要スーパーピクセル画像を生成する。
【0177】
続いて、重要スーパーピクセル決定部322では、重要特徴指標閾値のもと、オブジェクト単位重要スーパーピクセル画像において、オブジェクト単位変更可能領域及びオブジェクト単位変更不可領域を規定する。なお、重要スーパーピクセル決定部322では、重要特徴指標閾値を変えるとともに、重要特徴指標閾値を超えるスーパーピクセルの中から選択するスーパーピクセルの組み合わせを変える。これにより、重要スーパーピクセル決定部322では、複数のオブジェクト単位変更可能領域とオブジェクト単位変更不可領域との組を生成する。また、重要スーパーピクセル決定部322では、生成した複数のオブジェクト単位変更可能領域とオブジェクト単位変更不可領域との組それぞれを用いて、オブジェクト単位スコア最大化リファイン画像とオブジェクト単位誤推論画像とを合成する。更に、重要スーパーピクセル決定部322では、オブジェクト単位部分合成画像を合体することで合成画像を生成する。
【0178】
続いて、重要スーパーピクセル評価部323では、生成された合成画像を入力して推論部303が推論した正解ラベルのスコアを取得する。これにより、重要スーパーピクセル評価部323では、取得した正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(オブジェクト単位変更可能領域)を特定し、誤推論原因情報として出力する。
【0179】
以上の説明から明らかなように、第1の実施形態に係る解析装置100は、画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
【0180】
また、第1の実施形態に係る解析装置100は、正解ラベルを推論するための各画素の重要度を示す重要特徴指標マップを生成する。
【0181】
また、第1の実施形態に係る解析装置100は、重要特徴指標マップの画素値に基づいて変更可能領域を規定し、規定した変更可能領域を、スコア最大化リファイン画像で置き換える。
【0182】
また、第1の実施形態に係る解析装置100は、置き換えの効果を参照しながら、誤推論の原因となる画像箇所を特定する。
【0183】
これにより、第1の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
【0184】
また、第1の実施形態に係る解析装置100は、誤推論画像に含まれるオブジェクトに関する情報(位置及び大きさ、存在確率、IoU、Pr)を用いて、誤推論画像からスコア最大化リファイン画像を生成する。これにより、第1の実施形態によれば、スコア最大化リファイン画像を適切に生成することができる。
【0185】
また、第1の実施形態に係る解析装置100は、スコア最大化リファイン画像に複数のオブジェクトが含まれる場合、オブジェクトごとに重要特徴指標マップを生成する。これにより、第1の実施形態によれば、スコア最大化リファイン画像に複数のオブジェクトが含まれていた場合でも、重要特徴指標マップを適切に生成することができる。
【0186】
[第2の実施形態]
上記第1の実施形態では、誤推論画像に2つのオブジェクトが含まれる場合について説明したが、誤推論画像に1つのオブジェクトが含まれる場合においても適用可能であることはいうまでもない。また、誤推論画像に3つ以上の複数のオブジェクトが含まれる場合においても適用可能であることはいうまでもない。
【0187】
また、上記第1の実施形態では、誤推論画像に含まれる2つのオブジェクトが、いずれも車両である場合について説明した。しかしながら、誤推論画像に含まれる2つのオブジェクトは、車両に限定されず、車両以外のオブジェクトであってもよい。
【0188】
また、上記第1の実施形態では、オブジェクト単位重要スーパーピクセル画像1311、1312に対して、重要特徴指標閾値を一律に設定するものとして説明した。しかしながら、オブジェクト単位重要スーパーピクセル画像1311と、オブジェクト単位重要スーパーピクセル画像1312とで、異なる重要特徴指標閾値を設定してもよい。また、上記第1の実施形態では、重要特徴指標閾値を下げる際、オブジェクト単位重要スーパーピクセル画像1311とオブジェクト単位重要スーパーピクセル画像1312とで、下げ幅を一律にするものとして説明した。しかしながら、オブジェクト単位重要スーパーピクセル画像1311とオブジェクト単位重要スーパーピクセル画像1312とで、重要特徴指標閾値の下げ幅を変えてもよい。
【0189】
なお、開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成する画像生成部と、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成するマップ生成部と、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する特定部と、を有し、
前記画像生成部は、推論時に算出する、前記誤推論画像に含まれる推論対象に関する情報を用いて、前記誤推論画像から前記リファイン画像を生成する解析装置。
(付記2)
前記画像生成部は、推論時に、前記推論対象に関する情報として、前記誤推論画像における推論対象の位置及び大きさ、存在確率、推論対象を正しく検出できたか否かを示す評価指標、推論対象が外接矩形に含まれる確率、のいずれかを算出する、付記1に記載の解析装置。
(付記3)
前記画像生成部は、推論時に算出する前記推論対象に関する情報と、前記誤推論画像に含まれる推論対象に関する正解情報との誤差を用いて、前記誤推論画像から前記リファイン画像を生成する、付記1に記載の解析装置。
(付記4)
前記画像生成部は、前記誤推論画像に複数の推論対象が含まれる場合、該複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成する、付記1乃至3のいずれかの付記に記載の解析装置。
(付記5)
前記マップ生成部は、前記1のリファイン画像に含まれる複数の推論対象それぞれについて、前記第1のマップを生成することで、推論対象の数に応じた数の前記第3のマップを生成する、付記4に記載の解析装置。
(付記6)
前記画像生成部は、前記誤推論画像に複数の推論対象が含まれる場合、1の推論対象の推論の正解ラベルのスコアを最大化させる処理を、推論対象の数に応じて繰り返すことで、推論対象の数に応じた数のリファイン画像を生成する、付記1乃至3のいずれかの付記に記載の解析装置。
(付記7)
前記マップ生成部は、複数の推論対象それぞれの前記リファイン画像について、前記第1のマップ及び前記第2のマップを生成することで、推論対象の数に応じた数の前記第3のマップを生成する、付記6に記載の解析装置。
(付記8)
前記特定部は、推論対象の数に応じた数の前記第3のマップの画素値に基づいて、前記複数の推論対象それぞれについて、前記リファイン画像に置き換えられる前記誤推論画像の第1の領域と、前記リファイン画像に置き換えられない前記誤推論画像の第2の領域とを規定し、規定した第1の領域を前記リファイン画像で置き換えることで、前記複数の推論対象それぞれについて部分合成画像を生成する、付記5または7に記載の解析装置。
(付記9)
前記特定部は、前記複数の推論対象それぞれについて生成した部分合成画像を合体することで合成画像を生成し、生成した合成画像について推論された正解ラベルのスコアに基づいて、前記リファイン画像に置き換えられる前記誤推論画像の第1の領域から所定の領域を特定することで、前記誤推論画像において誤推論の原因となる画像箇所を特定する、付記8に記載の解析装置。
(付記10)
複数の推論対象全ての推論時の正解ラベルのスコアを最大化させた1のリファイン画像を生成するモードと、1の推論対象の推論時の正解ラベルのスコアを最大化させる処理を、推論対象の数に応じて繰り返すことで、推論対象の数に応じた数のリファイン画像を生成するモードと、を有する付記8に記載の解析装置。
(付記11)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する、処理をコンピュータに実行させるための解析プログラムであって、
推論時に算出する、前記誤推論画像に含まれる推論対象に関する情報を用いて、前記誤推論画像から前記リファイン画像を生成する、解析プログラム。
(付記12)
画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
前記誤推論画像の複数の画素のうち前記リファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示す第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
前記第3のマップの画素値に基づいて、前記誤推論画像において誤推論の原因となる画像箇所を特定する、処理をコンピュータが実行する解析方法であって、
推論時に算出する、前記誤推論画像に含まれる推論対象に関する情報を用いて、前記誤推論画像から前記リファイン画像を生成する、解析方法。
【0190】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0191】
100 :解析装置
140 :誤推論原因抽出部
141 :リファイン画像生成部
142 :マップ生成部
143 :特定部
301 :画像リファイナ部
302 :画像誤差演算部
303 :推論部
304 :誤差演算部
311 :重要特徴マップ生成部
312 :劣化尺度マップ生成部
313 :重畳部
321 :スーパーピクセル分割部
322 :重要スーパーピクセル決定部
323 :重要スーパーピクセル評価部
1210 :分割部
1320 :領域抽出部
1330 :合成部