(58)【調査した分野】(Int.Cl.,DB名)
前記ターゲット画像に基づいて、前記複数の分類のうちから、当該ターゲット画像の分類である可能性が2番目に高い分類を第2分類として判別する第2分類判別手段、をさらに含み、
前記比率特定手段は、前記第1分類の物体が表れている確率が前記第1の確率より低く、前記第2分類の物体が表れている確率が前記第2の確率より高い、前記ターゲット画像内の領域の大きさの、前記ターゲット画像の大きさに対する比率を特定する、
ことを特徴とする請求項1に記載の誤判別可能性評価装置。
前記比率特定手段は、前記ターゲット画像内の着目領域を占める画像内における、前記第1分類の物体が表れている確率が前記第1の確率より低く前記複数の分類のうち前記第1分類とは異なる分類の物体が表れている確率が前記第2の確率より高い領域の大きさの、当該画像の大きさに対する比率を特定する、
ことを特徴とする請求項1又は2に記載の誤判別可能性評価装置。
前記比率特定手段は、前記ターゲット画像内の着目領域を占める画像内における、前記第1分類の物体が表れている確率が前記第1の確率より低く前記複数の分類のうち前記第1分類とは異なる分類の物体が表れている確率が前記第2の確率より高い領域の大きさの、当該画像の大きさに対する比率を第1比率として特定し、
前記比率特定手段は、前記ターゲット画像内の前記着目領域以外の領域を占める画像内における、前記第1分類の物体が表れている確率が前記第1の確率より低く前記複数の分類のうち前記第1分類とは異なる分類の物体が表れている確率が前記第2の確率より高い領域の大きさの、当該画像の大きさに対する比率を第2比率として特定し、
前記誤判別可能性評価手段は、所定の重みに基づく前記第1比率と前記第2比率との重み付き平均値に基づいて、前記第1分類判別手段の判別結果が誤判別である可能性を示す値を決定する、
ことを特徴とする請求項1又は2に記載の誤判別可能性評価装置。
【発明を実施するための形態】
【0018】
以下、本発明の一実施形態について図面に基づき詳細に説明する。
【0019】
図1は、本発明の一実施形態に係る画像分類判別装置10の構成図である。本実施形態に係る画像分類判別装置10は、パーソナルコンピュータなどのコンピュータである。
図1に示すように画像分類判別装置10は、例えば、プロセッサ12、記憶部14、表示部16、操作部18を含んでいる。
【0020】
プロセッサ12は、例えば画像分類判別装置10にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。
【0021】
記憶部14は、ROMやRAM等の記憶素子やハードディスクドライブなどである。記憶部14には、プロセッサ12によって実行されるプログラムなどが記憶される。
【0022】
表示部16は、液晶ディスプレイ等の表示デバイスであって、プロセッサ12の指示に従って各種の画像を表示する。
【0023】
操作部18は、キーボードやマウスなどといったユーザインタフェースであって、ユーザの操作入力を受け付けて、その内容を示す信号をプロセッサ12に出力する。
【0024】
なお、画像分類判別装置10は、ネットワークボードなどの通信インタフェース、DVD−ROMやBlu−ray(登録商標)ディスクなどの光ディスクを読み取る光ディスクドライブ、USB(Universal Serial Bus)ポートなどを含んでいてもよい。
【0025】
本実施形態に係る画像分類判別装置10では、分類の判別対象である画像について、所与の複数の分類のうちのいずれかを、当該画像の分類である可能性が最も高い第1分類として判別する処理が実行される。以下、画像の分類である可能性がn番目に高い分類として判別される分類を第n分類(n=1,2,3,・・・)と呼ぶこととする。また本実施形態に係る画像分類判別装置10では、当該判別の結果が誤判別である可能性を評価する処理が実行される。以下、これらの処理の対象である画像をターゲット画像と呼ぶこととする。
【0026】
図2は、ターゲット画像20の一例を示す図である。
図2に示すターゲット画像20は、森林等を撮影した航空機画像から縦横それぞれ10メートル間隔で切り出された複数のパッチ画像のうちの1つであってもよい。またターゲット画像20は、1ピクセルが縦横16センチメートルに相当する、縦横それぞれ224ピクセルの画像(縦横35.84メートルに相当)であってもよい。
【0027】
そして本実施形態では例えば、ターゲット画像20に表れている樹木種別の分類を判別する処理、及び、当該判別の結果が誤判別である可能性を評価する処理が実行される。ここで樹木種別の分類の例としては、スギ、ヒノキ、マツ、タケ、落葉広葉樹、常緑広葉樹、森林外などが挙げられる。なお樹木種別の分類の判別において、例えばターゲット画像20の中心付近に表れている樹木種別である可能性が最も高い分類が判別されるようにしてもよい。より具体的には例えば、ターゲット画像20と中心が同じである、ターゲット画像20の一部を占める領域に表れている樹木種別である可能性が最も高い分類が判別されるようにしてもよい。
【0028】
また本実施形態では、ターゲット画像20内の各画素について、当該画素に第1分類の物体が表れている確率が特定される。以下、当該確率を第1分類確率と呼ぶこととする。そして当該第1分類確率が所定の第1の確率より低い領域が表現された、
図3に例示する第1分類評価画像22が生成される。第1分類評価画像22では、第1分類確率が第1の確率よりも低い画素が占める領域がドットで示されている。以下、当該領域を第1領域24と呼ぶこととする。第1分類評価画像22の全体の大きさに対する第1領域24の大きさの比率は、ターゲット画像20内において第1分類確率が上述の第1の確率よりも低い画素が占める領域の大きさの、ターゲット画像20の全体の大きさに対する比率に相当する。
【0029】
また本実施形態では例えば、ターゲット画像20内の各画素について、第1分類とは異なる分類(以下、対比分類と呼ぶ。)の物体が表れている確率が特定される。以下、当該確率を対比分類確率と呼ぶこととする。そして当該対比分類確率が所定の第2の確率より高い領域が表現された、
図4に例示する対比分類評価画像26が生成される。ここで第2の確率は上述の第1の確率と同じであってもよいし異なっていてもよい。対比分類評価画像26では、対比分類確率が第2の確率よりも高い画素が占める領域がドットで示されている。以下、当該領域を対比領域28と呼ぶこととする。対比分類評価画像26の全体の大きさに対する対比領域28の大きさの比率は、ターゲット画像20内において対比分類確率が上述の第2の確率よりも高い画素が占める領域の大きさの、ターゲット画像20の全体の大きさに対する比率に相当する。ここで対比分類は、ターゲット画像20の分類である可能性が2番目に高い分類として判別される分類(第2分類)であっても構わない。
【0030】
本実施形態に係る第1分類評価画像22、及び、対比分類評価画像26は、ターゲット画像20と同形同サイズ同画素数である。そしてターゲット画像20内の画素は、第1分類評価画像22内の画素と1対1で対応付けられる。またターゲット画像20内の画素は、対比分類評価画像26内の画素と1対1で対応付けられる。
【0031】
そして本実施形態では、第1分類評価画像22と対比分類評価画像26とに基づいて、
図5に例示する誤判別評価画像30が生成される。本実施形態に係る誤判別評価画像30は、ターゲット画像20と同形同サイズ同画素数である。そしてターゲット画像20内の画素は、誤判別評価画像30内の画素とも1対1で対応付けられる。
【0032】
本実施形態では例えば、第1分類評価画像22におけるドット部分と対比分類評価画像26におけるドット部分との論理積が、誤判別評価画像30におけるドット部分として示されている。以下、誤判別評価画像30内においてドット部分が占める領域を誤判別領域32と呼ぶこととする。誤判別領域32内の画素に対応付けられるターゲット画像20内の画素は、第1分類確率が上述の第1の確率よりも低く、かつ、対比分類確率が上述の第2の確率よりも高い画素であることとなる。
【0033】
そして本実施形態では例えば、誤判別領域32の大きさの、誤判別評価画像30の全体の大きさに対する比率に基づいて、ターゲット画像20の分類である可能性が最も高い分類を上述の第1分類とする判別結果が誤判別である可能性を示す値が決定される。
【0034】
ここで例えば当該比率が所定の閾値よりも大きい場合に上述の判別結果が誤判別である可能性を示す値として1が決定されてもよい。逆に、当該比率が当該所定の閾値よりも小さい場合に上述の判別結果が誤判別である可能性を示す値として0が決定されてもよい。
【0035】
図5に示す誤判別評価画像30では、誤判別領域32の大きさの、誤判別評価画像30の全体の大きさに対する比率は46.8%である。ここで例えば閾値が30%である場合に、上述の判別結果が誤判別である可能性を示す値として1が決定されてもよい。
【0036】
図6は、ターゲット画像20とは別のターゲット画像40の一例を示す図である。
図7は、
図6に示すターゲット画像40に基づいて生成される第1分類評価画像42の一例を示す図である。
図7に示す第1分類評価画像42には、第1領域44が示されている。
図8は、
図6に示すターゲット画像40に基づいて生成される対比分類評価画像46の一例を示す図である。
図8に示す対比分類評価画像46には、対比領域48が示されている。
図9は、
図7に示す第1分類評価画像42及び
図8に示す対比分類評価画像46に基づいて生成される誤判別評価画像50の一例を示す図である。
図9に示す誤判別評価画像50には、誤判別領域52が示されている。
【0037】
図9に示す誤判別評価画像50では、誤判別領域52の大きさの、誤判別評価画像50の全体の大きさに対する比率は5.8%である。ここで例えば閾値が30%である場合に、上述の判別結果が誤判別である可能性を示す値として0が決定されてもよい。
【0038】
以上のようにして本実施形態に係る画像分類判別装置10によれば、画像の分類の誤判別の可能性を的確に評価できることとなる。そのため例えば誤判別である可能性を示す値として1が決定されるターゲット画像を重点的に確認作業の担当者に確認させることで、当該担当者によるターゲット画像の分類の判別結果の確認作業が効率化される。
【0039】
ここで例えば上述のように、航空機画像から縦横それぞれ10メートル間隔で切り出された複数のパッチ画像がターゲット画像として用いられることとする。この場合に、それぞれのターゲット画像について判別された第1分類に対応付けられる色の画素が縦横に配置されたマップが表示部16に表示されるようにしてもよい。そして当該マップにおいて、誤判別である可能性を示す値として1が決定されたターゲット画像に対応付けられる画素は黒枠で囲まれる等の強調表示がされるようにしてもよい。そして確認作業の担当者が表示されたマップを確認するようにしてもよい。
【0040】
また例えば、誤判別領域の大きさの、誤判別評価画像の全体の大きさに対する比率自体が、画像の分類の誤判別の可能性を示す値として決定されてもよい。この場合に、誤判別領域の大きさの、誤判別評価画像の全体の大きさに対する比率を示す値が、ターゲット画像とともに確認作業の担当者に提示されるようにしてもよい。この場合は、当該担当者は、画像の分類の誤判別の可能性を示す値を参照しながらターゲット画像の確認が行えるので、当該担当者によるターゲット画像の分類の判別結果の確認作業が効率化される。
【0041】
以下、
図2に示すターゲット画像20を題材として、画像分類の判別、及び、画像分類の誤判別の可能性の評価の一例についてさらに説明する。
【0042】
図10には、本実施形態に係る画像分類判別装置10において実装される画像分類判別モジュール60及び可視化マップ生成モジュール64の一例が示されている。ここで画像分類判別モジュール60は例えば、ターゲット画像20の分類を判別するモジュールである。また可視化マップ生成モジュール64は例えば、第1分類評価画像22や対比分類評価画像26の基礎となる可視化マップ62を生成するモジュールである。
【0043】
画像分類判別モジュール60は、本実施形態では例えば、学習済の畳み込みニューラルネットワーク(CNN)を含んで構成される。このCNNは、例えば、ターゲット画像20と同形同サイズ同画素数の画像を入力データとして含み当該画像の樹木種別に対応付けられるラベルを教師データとして含む学習データを学習した機械学習モデルである。ここで教師データとして、入力データである画像の中心に表れている樹木種別に対応付けられるラベルを含んでいてもよい。
【0044】
そして本実施形態では例えば、特徴抽出部66にターゲット画像20が入力68として入力される。特徴抽出部66は、例えばCNNの畳み込み層やプーリング層を含んで構成される。そして特徴抽出部66は、当該入力68に応じて、それぞれがチャネル(フィルタ)に対応付けられる複数の特徴マップ70を出力する。
【0045】
特徴抽出部66が出力する特徴マップ70は、画像分類判別モジュール60に含まれる1又は複数の全結合層72に入力される。ここで全結合層72の数は特に問わない。そして全結合層72からの出力が、画像分類判別モジュール60に含まれるソフトマックス層73に入力される。そして、ソフトマックス層73は、画像の分類に対応付けられる確率値を要素として含む確率ベクトルを出力74として出力する。ここで例えば、ターゲット画像20に表れている樹木種別の分類を判別する場面における分類として、スギ、ヒノキ、マツ、タケ、落葉広葉樹、常緑広葉樹、及び、森林外の7個を採用することとする。この場合は、当該7個の確率値を要素として含む確率ベクトルが出力されることとなる。
【0046】
そしてこのようにして出力される確率ベクトルにおいて最も大きな確率値が示されている要素に対応する分類が、入力68として入力されたターゲット画像20の分類である可能性が最も高い第1分類として判別される。またここで対比分類も判別される。例えば対比分類が第2分類である場合は、2番目に大きな確率値に対応付けられる分類が対比分類として判別される。また例えば対比分類が第3分類である場合は、3番目に大きな確率値に対応付けられる分類が対比分類として判別される。
【0047】
そして本実施形態では、可視化マップ生成モジュール64において、CNNの判断根拠を可視化するGrad−cam(Gradient-weighted Class Activation Mapping)の技術等を用いて可視化マップ62が生成される。
【0048】
可視化マップ生成モジュール64では、例えば、第1分類に対応する要素が1であり他の分類に対応する要素が0であるone−hotベクトル76と、出力74である確率ベクトルと、の要素積78が計算される。そして計算された要素積78を、出力74である確率ベクトル、ソフトマックス層73、及び、全結合層72に逆伝搬させることで、それぞれがチャネル(フィルタ)に対応付けられる複数の勾配マップ80が生成される。
【0049】
そして例えばGAP(Global Average Pooling)の技術を用いて、複数の勾配マップ80のそれぞれに対応付けられる代表値(例えば勾配マップ80に含まれる画素の画素値の平均値)を要素として含む代表値ベクトル82が算出される。ここで代表値ベクトル82の要素の数は、特徴マップ70のチャネルの数となる。
【0050】
そして各チャネルについて、当該チャネルの特徴マップ70に含まれる各画素の画素値に当該特徴マップ70に対応付けられる代表値ベクトル82の要素の値を乗ずることで、当該特徴マップ70に対応する個別マップ84が生成される。そして、すべてのチャネルの個別マップ84を合成した総合マップ86が生成される。ここでは例えば、総合マップ86に含まれる画素の画素値として、すべてのチャネルの個別マップ84についての当該画素に相当する画素の画素値の合計が設定されてもよい。
【0051】
そして総合マップ86を正規化線形関数(ReLU)等の活性化関数に入力した際の出力を、0以上1以下となるよう正規化することで、第1分類に対応付けられる可視化マップ62が生成される。このようにすることで当該可視化マップ62においては、負の勾配に対応付けられる画素については画素値が0となる。そのため、第1分類である確率を高めることに寄与する画素のみについて当該可視化マップ62においては正の画素値が設定されることとなる。
【0052】
そして本実施形態では同様にして、可視化マップ生成モジュール64において、対比分類に対応する要素が1であり他の分類に対応する要素が0であるone−hotベクトル76と、出力74である確率ベクトルと、の要素積78が計算される。そして計算された要素積78を、出力74である確率ベクトル、ソフトマックス層73、及び、全結合層72に逆伝搬させることで、それぞれがチャネル(フィルタ)に対応付けられる複数の勾配マップ80が生成される。そして複数の勾配マップ80のそれぞれに対応付けられる代表値を要素として含む代表値ベクトル82が算出される。
【0053】
そして各チャネルについて、当該チャネルの特徴マップ70に含まれる各画素の画素値に当該特徴マップ70に対応付けられる代表値ベクトル82の要素の値を乗ずることで、当該特徴マップ70に対応する個別マップ84が生成される。そして、すべてのチャネルの個別マップ84を合成した総合マップ86が生成される。
【0054】
そして総合マップ86を正規化線形関数等の活性化関数に入力した際の出力を、0以上1以下となるよう正規化することで、対比分類に対応付けられる可視化マップ62が生成される。当該可視化マップ62においても、負の勾配に対応付けられる画素については画素値が0となる。そのため、対比分類である確率を高めることに寄与する画素のみについて当該可視化マップ62においては正の画素値が設定されることとなる。
【0055】
そして本実施形態では例えば、双線形補間等の補間技術を用いて、第1分類に対応付けられる可視化マップ62をターゲット画像20と同じ大きさに拡大した第1拡大可視化画像が生成される。第1拡大可視化画像に含まれる画素は、ターゲット画像20に含まれる画素に1対1で対応付けられることとなる。そして、第1拡大可視化画像に含まれる画素の画素値は、当該画素に対応付けられるターゲット画像20内の画素の第1分類確率を示すこととなる。ここで例えば第1拡大可視化画像に含まれる画素の画素値が1に近いほど当該画素に対応付けられるターゲット画像20内の画素に、第1分類の樹木が表れている確率が高いこととなる。また例えば、第1拡大可視化画像に含まれる画素の画素値が0に近いほど当該画素に対応付けられるターゲット画像20内の画素に、第1分類の樹木が表れている確率が低いこととなる。
【0056】
そして本実施形態では例えば、第1拡大可視化画像に基づいて、画素値が示す確率が所定の第1の確率よりも低い画素が占める領域が表現された、
図3に例示する第1分類評価画像22が生成される。
【0057】
また本実施形態では、双線形補間等の補間技術を用いて、対比分類に対応付けられる可視化マップ62をターゲット画像20と同じ大きさに拡大した対比拡大可視化画像が生成される。対比拡大可視化画像に含まれる画素は、ターゲット画像20に含まれる画素に1対1で対応付けられることとなる。そして、対比拡大可視化画像に含まれる画素の画素値は、当該画素に対応付けられるターゲット画像20内の画素の対比分類確率を示すこととなる。ここで例えば対比拡大可視化画像に含まれる画素の画素値が1に近いほど当該画素に対応付けられるターゲット画像20内の画素に、対比分類の樹木が表れている確率が高いこととなる。また例えば、対比拡大可視化画像に含まれる画素の画素値が0に近いほど当該画素に対応付けられるターゲット画像20内の画素に、対比分類の樹木が表れている確率が低いこととなる。
【0058】
そして本実施形態では例えば、対比拡大可視化画像に基づいて、画素値が示す確率が所定の第2の確率よりも高い画素が占める領域が表現された、
図4に例示する対比分類評価画像26が生成される。
【0059】
そして上述のように、第1分類評価画像22と対比分類評価画像26とに基づいて生成される誤判別評価画像30に基づいて、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値が決定されることとなる。
【0060】
以下、本実施形態に係る画像分類判別装置10の機能並びに本実施形態に係る画像分類判別装置10で実行される処理についてさらに説明する。
【0061】
図11は、本実施形態に係る画像分類判別装置10で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る画像分類判別装置10で、
図11に示す機能のすべてが実装される必要はなく、また、
図11に示す機能以外の機能が実装されていても構わない。
【0062】
図11に示すように、本実施形態に係る画像分類判別装置10には、機能的には例えば、ターゲット画像取得部90、分類判別部92、可視化マップ生成部94、比率特定部96、誤判別可能性評価部98、が含まれる。分類判別部92は、
図10に示されている画像分類判別モジュール60に相当する。可視化マップ生成部94は、
図10に示されている可視化マップ生成モジュール64に相当する。ターゲット画像取得部90、分類判別部92、可視化マップ生成部94、比率特定部96、誤判別可能性評価部98は、プロセッサ12及び記憶部14を主として実装される。
【0063】
本実施形態に係る画像分類判別装置10は、ターゲット画像20の分類を判別する装置としての役割だけでなく、当該判別の結果が誤判別である可能性を評価する誤判別可能性評価装置としての役割も担っている。
【0064】
以上の機能は、コンピュータである画像分類判別装置10にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ12で実行することにより実装されてもよい。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して画像分類判別装置10に供給されてもよい。
【0065】
ターゲット画像取得部90は、本実施形態では例えば、分類の判別対象であるターゲット画像20を取得する。
【0066】
分類判別部92は、本実施形態では例えば、所与の複数の分類のうちのいずれかを、ターゲット画像20の分類である可能性が最も高い第1分類として判別する。ここでターゲット画像20に基づいて、当該ターゲット画像20の分類である可能性が最も高い分類が第1分類として判別されてもよい。
【0067】
ここで予め、第n分類が対比分類として定められていることとする。この場合、分類判別部92は、ターゲット画像20の分類である可能性がn番目に高い分類を対比分類として判別する処理も実行する。ここで第2分類が対比分類として判別されてもよいし、第3分類が対比分類として判別されてもよい。
【0068】
なお分類判別部92が、複数の分類を対比分類として判別してもよい。具体的には例えば、第2分類及び第3分類が、対比分類として判別されてもよい。
【0069】
また以上の説明では、分類判別部92が画像分類判別モジュール60によって実装されている例について説明したが、分類判別部92が画像分類判別モジュール60によって実装されている必要はない。
【0070】
例えば分類判別部92が、テンプレートマッチング等の他の画像処理技術を用いて、所与の複数の分類のうちのいずれかを、ターゲット画像20の分類である可能性が最も高い第1分類として判別してもよい。また分類判別部92が、テンプレートマッチング等の他の画像処理技術を用いて、ターゲット画像20の対比分類を判別してもよい。
【0071】
また例えば、操作部18を介して、ユーザが目視にて判別したターゲット画像20の第1分類を表すデータを分類判別部92が受け付けてもよい。そして分類判別部92が、当該データが表す分類を、ターゲット画像20の分類である可能性が最も高い第1分類として判別してもよい。また同様に、操作部18を介して、ユーザが目視にて判別したターゲット画像20の対比分類を表すデータを分類判別部92が受け付けてもよい。そして分類判別部92が、当該データが表す分類を、ターゲット画像20の対比分類として判別してもよい。
【0072】
可視化マップ生成部94は、本実施形態では例えば、第1分類に対応付けられる可視化マップ62、及び、対比分類に対応付けられる可視化マップ62を生成する。
【0073】
可視化マップ生成部94は、例えば上述のように第1分類について生成される総合マップ86をReLU等の活性化関数に入力した際の出力を、0以上1以下となるよう正規化することで、第1分類に対応付けられる可視化マップ62を生成する。
【0074】
また可視化マップ生成部94は、例えば上述のように対比分類について生成される総合マップ86をReLU等の活性化関数に入力した際の出力を、0以上1以下となるよう正規化することで、対比分類に対応付けられる可視化マップ62を生成する。
【0075】
比率特定部96は、本実施形態では例えば、第1分類確率が第1の確率より低く対比分類確率が第2の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率を特定する。
【0076】
ここで上述の第1拡大可視化画像や対比拡大可視化画像に基づいて第1分類確率が第1の確率より低く対比分類確率が第2の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率が特定される必要はない。
【0077】
例えば比率特定部96が、第1分類に対応付けられる可視化マップ62において、画素値が示す確率が第1の確率よりも低い画素が占める領域が表現された第1分類評価画像22を生成してもよい。また比率特定部96が、対比分類に対応付けられる可視化マップ62において、画素値が示す確率が第2の確率よりも高い画素が占める領域が表現された対比分類評価画像26を生成してもよい。当該第1分類評価画像22と当該対比分類評価画像26は、可視化マップ62と同形同サイズ同画素数となる。
【0078】
そして当該第1分類評価画像22と当該対比分類評価画像26とに基づいて、誤判別領域32が設定された誤判別評価画像30が生成されてもよい。当該誤判別評価画像30は、可視化マップ62と同形同サイズ同画素数となる。ここで当該誤判別領域32内の画素に対応する可視化マップ62内の画素は、第1分類確率が上述の第1の確率よりも低く、かつ、対比分類確率が上述の第2の確率よりも高い画素であることとなる。
【0079】
また上述のように複数の分類が対比分類として判別されるとする。この場合に、第1分類確率が第1の確率より低く、複数の対比分類について当該対比分類についての対比分類確率が当該対比分類に対応する所定の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率が特定されてもよい。例えば第1分類確率が第1の確率より低く第2分類の対比分類確率が第2の確率より高く第3分類の対比分類確率が第3の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率が特定されてもよい。ここで第3の確率は第1の確率や第2の確率と同じであってもよいし異なっていてもよい。
【0080】
また比率特定部96が例えば、テンプレートマッチング等の画像処理技術を用いて、ターゲット画像20内の各画素について、第1分類確率や対比分類確率を特定してもよい。そしてこのようにして特定される第1分類確率や対比分類確率に基づいて、第1分類確率が第1の確率より低く対比分類確率が第2の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率が特定されてもよい。
【0081】
誤判別可能性評価部98は、本実施形態では例えば、比率特定部96が特定する比率に基づいて、分類判別部92による、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値を決定する。例えば比率特定部96が特定する比率が所定の閾値よりも大きい場合にターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値として1が決定されてもよい。また例えば比率特定部96が特定する比率が所定の閾値よりも小さい場合にターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値として0が決定されてもよい。
【0082】
なお可視化マップ生成部94は、例えば第1分類について生成される総合マップ86に含まれるすべての画素について、画素値の正負を反転しても(−1を乗じても)よい。そして画素値の正負を反転させた総合マップ86をReLU等の活性化関数に入力した際の出力を、0以上1以下となるよう正規化することで、第1分類に対応付けられる可視化マップ62を生成してもよい。このようにすることで当該可視化マップ62においては、正の勾配に対応付けられる画素については画素値が0となる。そのため当該可視化マップ62においては、第1分類である確率を低めることに寄与する画素のみについて正の画素値が設定されることとなる。そしてこの場合に比率特定部96が、第1分類確率が第1の確率より高く対比分類確率が第2の確率より高いターゲット画像20内の領域の大きさの、ターゲット画像20の全体の大きさに対する比率を特定してもよい。
【0083】
また
図12に示すように、比率特定部96が、ターゲット画像20内の着目領域100を占める画像102内における、第1分類確率が第1の確率より低く対比分類確率が第2の確率より高い領域の大きさの、当該画像102の大きさに対する比率を特定してもよい。ここで着目領域100は、ターゲット画像20の中心を含む領域であってもよい。例えば着目領域100が、ターゲット画像20と中心が同じであり、ターゲット画像20を囲む領域の大きさを所定倍に縮小した領域であってもよい。
【0084】
また比率特定部96が、着目領域100を占める画像102内における、第1分類確率が第1の確率より低く対比分類確率が第2の確率より高い領域の大きさの、当該画像102の大きさに対する比率を第1比率として特定してもよい。また比率特定部96が、ターゲット画像20内の着目領域100以外の領域を占める画像104内における、第1分類確率が第1の確率より低く対比分類確率が第2の確率より高い領域の大きさの、当該画像104の大きさに対する比率を第2比率として特定してもよい。
【0085】
そして誤判別可能性評価部98が、所定の重みに基づく第1比率と第2比率との重み付き平均値に基づいて、分類判別部92による、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値を決定してもよい。ここで第1比率に対する重みが第2比率に対する重みよりも大きくてもよい。こうすればターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性の評価において第2比率よりも第1比率がより重視されることとなる。
【0086】
ここで例えば所定の重みに基づく第1比率と第2比率との重み付き平均値が所定の閾値より大きい場合に、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値として1が決定されてもよい。また例えば所定の重みに基づく第1比率と第2比率との重み付き平均値が所定の閾値より小さい場合に、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値として0が決定されてもよい。
【0087】
以下、本実施形態に係る画像分類判別装置10において行われる処理の流れの一例を、
図13に例示するフロー図を参照しながら説明する。なお
図13に示す処理例においては、第2分類が対比分類であることとする。
【0088】
まず、ターゲット画像取得部90が、ターゲット画像20を取得する(S101)。
【0089】
そして分類判別部92が、S101に示す処理で取得されたターゲット画像20の分類である可能性が最も高い分類を第1分類として判別する(S102)。
【0090】
そして分類判別部92が、S101に示す処理で取得されたターゲット画像20の分類である可能性が2番目に高い分類を対比分類として判別する(S103)。
【0091】
そして可視化マップ生成部94が、S102に示す処理で判別された第1分類に対応付けられる可視化マップ62を生成する(S104)。
【0092】
そして可視化マップ生成部94が、S103に示す処理で判別された対比分類に対応付けられる可視化マップ62を生成する(S105)。
【0093】
そして比率特定部96が、S104に示す処理で生成された可視化マップ62に基づいて、第1拡大可視化画像を生成する(S106)。
【0094】
そして比率特定部96が、S105に示す処理で生成された可視化マップ62に基づいて、対比拡大可視化画像を生成する(S107)。
【0095】
そして比率特定部96が、S106に示す処理で生成された第1拡大可視化画像に基づいて、第1分類評価画像22を生成する(S108)。
【0096】
そして比率特定部96が、S107に示す処理で生成された対比拡大可視化画像に基づいて、対比分類評価画像26を生成する(S109)。
【0097】
そして比率特定部96が、S108に示す処理で生成された第1分類評価画像22と、S109に示す処理で生成された対比分類評価画像26と、に基づいて、誤判別評価画像30を生成する(S110)。
【0098】
そして比率特定部96が、S110に示す処理で生成された誤判別評価画像30内における誤判別領域32の大きさの、誤判別評価画像30の全体の大きさに対する比率を特定する(S111)。
【0099】
そして誤判別可能性評価部98が、S111に示す処理で特定された比率に基づいて、S102に示す処理で判別された、ターゲット画像20の分類である可能性が最も高い分類を第1分類とする判別結果が誤判別である可能性を示す値を決定する(S112)。そして本処理例に示す処理は終了される。
【0100】
なおS101〜S112に示す処理の実行順序は上述のものに限定されず、上述に示す順序とは異なる実行順序でこれらの処理が実行されてもよい。具体的には例えば、S102、S104、S106、及び、S108に示す処理が実行された後で、S103、S105、S107、及び、S109に示す処理が実行されてもよい。
【0101】
なお、本発明は上述の実施形態に限定されるものではない。
【0102】
また、本実施形態の適用範囲は、ターゲット画像20に表れている樹木種別の分類を判別する場面に限定されない。例えば人工物、水域、草地、樹木、裸地などといった所与の複数の分類のうちから、ターゲット画像20に表れている土地被覆の分類を判別する場面に本発明が適用されてもよい。
【0103】
また、上述の具体的な文字列や数値、並びに、図面中の具体的な文字列は例示であり、これらの文字列や数値には限定されない。