(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023152655
(43)【公開日】2023-10-17
(54)【発明の名称】可視化プログラム、可視化方法および情報処理装置
(51)【国際特許分類】
G06V 10/776 20220101AFI20231005BHJP
G06V 10/82 20220101ALI20231005BHJP
G06T 7/00 20170101ALI20231005BHJP
【FI】
G06V10/776
G06V10/82
G06T7/00 350C
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022203222
(22)【出願日】2022-12-20
(31)【優先権主張番号】17/709,455
(32)【優先日】2022-03-31
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(71)【出願人】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】枌 尚弥
(72)【発明者】
【氏名】内山 友樹
(72)【発明者】
【氏名】福井 和広
(72)【発明者】
【氏名】新沼 厚一郎
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096CA01
5L096DA01
5L096GA10
5L096GA30
5L096GA51
5L096HA11
(57)【要約】 (修正有)
【課題】クラスの識別に重要となる画像領域の特定に要する時間を削減できる可視化プログラム、可視化方法および情報処理装置を提供する。
【解決手段】画像を取得し、取得した画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成する情報処理装置であって、画像を入力とし、画像に含まれる対象物のクラスを出力として訓練された第1モデルに、画像を入力することで、画像に含まれる対象物の第1尤度を算出し、画像が入力された場合に、画像に含まれる対象物の尤度の近似値を算出する第2モデルに、遮蔽画像を入力することで、遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、第1尤度と、第2尤度とを基にして、画像の領域のうち、クラスの識別に影響する領域を特定し、特定したクラスの識別に影響する領域を表示する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理をコンピュータに実行させることを特徴とする可視化プログラム。
【請求項2】
前記第2尤度を算出する処理は、前記画像の遮蔽する領域がそれぞれ異なる複数の遮蔽画像を、前記第2モデルに入力することで、複数の遮蔽モデルに対する第2尤度をそれぞれ算出し、前記特定する処理は、複数の第2尤度のうち、前記第1尤度との差分が閾値以上となる第2尤度に関する遮蔽画像の遮蔽された領域と同領域となる前記画像の領域を、前記クラスの識別に影響する領域として特定することを特徴とする請求項1に記載の可視化プログラム。
【請求項3】
前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の画素値を所定値に変更することで、前記遮蔽画像を生成することを特徴とする請求項1に記載の可視化プログラム。
【請求項4】
前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の周辺領域の画素値を基にして、前記遮蔽する一部の領域の画素値を特定し、前記遮蔽する一部の領域の画素値を、特定した画素値に変更することで、前記遮蔽画像を生成することを特徴とする請求項1に記載の可視化プログラム。
【請求項5】
画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理をコンピュータが実行することを特徴とする可視化方法。
【請求項6】
画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理を実行する制御部を有する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本発明は、可視化プログラムを記録した記録媒体、可視化方法および情報処理装置に関する。
【背景技術】
【0002】
画像に含まれる対象物を認識する際に、Deep Learningモデル(以下、DLモデル)が用いられている。DLモデルはブラックボックスとして扱われことが多いが、DLモデルの挙動の根拠を理解することで、DLモデルの性能を向上させたり、DLモデルを安心して利用できたりするため、DLモデルを可視化する技術が求められている。
【0003】
たとえば、DLモデルを可視化する従来技術として、OSM(Occlusion Sensitivity Map)等がある。従来技術(OSM等)では、DLモデルが画像データのクラスを識別する場合に、識別に重要となる画像領域を可視化する。
【0004】
図8は、従来技術を説明するための図である。従来技術では、元の画像IM10に対して、遮蔽領域の位置を変更しながら、複数の遮蔽画像を生成する。たとえば、画像IM10に、遮蔽領域11-1を設定することで、遮蔽画像IM10-1を生成する。従来技術では、他も同様にして、画像IM10に対して、遮蔽領域11-2~11-8を設定することで、遮蔽画像IM10-2~10-8を生成する。
【0005】
従来技術では、画像IM10をDLモデルに入力して、基準となるクラス類似度を算出する。基準となるクラス類似度を、基準クラス類似度と表記する。
【0006】
従来技術では、遮蔽画像IM10-1をDLモデルに入力し、遮蔽画像IM10-1のクラス類似度を算出する。従来技術では、他も同様にして、遮蔽画像IM10-2~10-8をDLモデルに入力し、遮蔽画像IM10-2~10-8のクラス類似度を算出する。
【0007】
従来技術では、遮蔽画像IM10-1~10-8の各クラス類似度と、基準クラス類似度とを比較して、クラス類似度の低下が大きい遮蔽画像を特定し、特定した遮蔽画像の遮蔽領域を、クラスの識別に重要な領域として強調表示する。
【0008】
図9は、従来技術の処理結果を示す図である。
図9において、画像IM15を、DLモデルの可視化に利用した元画像とする。従来技術の実行結果は、実行結果5に示すものとなり、クラスの識別に重要な領域として、領域5aが強調表示されている。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】Zeiler M.D., Fergus R.“Visualizing and Understanding Convolutional Networks” In: Fleet D., Pajdla T., Schiele B., Tuytelaars T. (eds) Computer Vision ECCV 2014. Lecture Notes in Computer Science, vol 8689. Springer, Cham
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、上述した従来技術では、遮蔽領域が異なる全ての遮蔽画像に対して、DLモデルによる計算を行うため、クラスの識別に重要となる画像領域を特定するまでに時間を要する。
【0011】
1つの側面では、本発明は、クラスの識別に重要となる画像領域の特定に要する時間を削減できる可視化プログラム、可視化方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0012】
第1の案では、コンピュータに次の処理を実行させる。コンピュータは、画像を取得し、取得した画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成する。コンピュータは、画像を入力とし、画像に含まれる対象物のクラスを出力として訓練された第1モデルに、画像を入力することで、画像に含まれる対象物の第1尤度を算出する。コンピュータは、画像が入力された場合に、画像に含まれる対象物の尤度の近似値を算出する第2モデルに、遮蔽画像を入力することで、遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出する。コンピュータは、第1尤度と、第2尤度とを基にして、画像の領域のうち、クラスの識別に影響する領域を特定し、特定したクラスの識別に影響する領域を表示する。
【発明の効果】
【0013】
クラスの識別に重要となる画像領域の特定に要する時間を削減できる。
【図面の簡単な説明】
【0014】
【
図1】
図1は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。
【
図2】
図2は、遮蔽画像テーブルのデータ構造の一例を示す図である。
【
図5】
図5は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。
【
図6】
図6は、画像生成部のその他の処理を説明するための図である。
【
図7】
図7は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【
図8】
図8は、従来技術を説明するための図である。
【
図9】
図9は、従来技術の処理結果を示す図である。
【発明を実施するための形態】
【0015】
以下に、本願の開示する可視化プログラム、可視化方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
【実施例0016】
本実施例に係る情報処理装置は、画像の一部の領域を遮蔽した遮蔽画像を用いて、クラスの識別に重要となる画像領域を特定する場合に、テイラー展開に基づく近似モデルを用いて、遮蔽画像に含まれる対象物の尤度を算出し、計算コストを削減する。
【0017】
図1は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。
図1に示すように、この情報処理装置100は、通信部110と、入力部120と、表示部130と、記憶部140と、制御部150とを有する。
【0018】
通信部110は、ネットワークを介して外部装置等とデータ通信を実行する。通信部110は、外部装置から、処理対象となる画像データ141を受信する。通信部110は、訓練済みのDLモデル143のデータを外部装置から受信してもよい。
【0019】
入力部120は、利用者からの操作を受付ける入力装置であり、たとえば、キーボードやマウス等により実現される。
【0020】
表示部130は、制御部150の処理結果を出力するための表示装置であり、たとえば、液晶モニタやプリンタ等により実現される。
【0021】
記憶部140は、画像データ141、遮蔽画像テーブル142、DLモデル143を有する。記憶部140は、各種の情報を記憶する記憶装置であり、たとえば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
【0022】
画像データ141は、処理対象となる画像データである。たとえば、画像データ141は、複数のピクセルが含まれ、各ピクセルには画素値が設定される。かかる画像データ141の一部の領域を遮蔽することで、後述する遮蔽画像データが生成される。
【0023】
遮蔽画像テーブル142は、画像データ141の一部の領域が遮蔽された複数の遮蔽画像を保持するテーブルである。
図2は、遮蔽画像テーブルのデータ構造の一例を示す図である。
図2に示すように、この遮蔽画像テーブル142は、項番と、遮蔽画像データと、遮蔽領域座標と、尤度(近似値)とを有する。
【0024】
項番は、遮蔽画像テーブル142のレコード(遮蔽画像データ)を識別する番号である。遮蔽画像データは、画像データ141の全領域のうち、一部の領域(小領域)が遮蔽された画像データである。以下の説明では、遮蔽された領域を「遮蔽領域」と表記する。遮蔽領域座標は、遮蔽領域の座標である。たとえば、遮蔽領域座標には、遮蔽領域の左上隅の座標と、遮蔽領域の右下隅の座標とが設定される。尤度は、遮蔽画像データに含まれる対象物の尤度の近似値が設定される。
【0025】
DLモデル143は、画像データを入力とし、画像データに含まれる対象物のクラスを出力として訓練されたモデルである。たとえば、DLモデル143は、CNN(Convolutional Neural Network)である。DLモデル143は、「第1モデル」の一例である。
【0026】
図3は、DLモデルの一例を示す図である。たとえば、DLモデル143を関数「f」で示し、DLモデル143に入力する画像データ141を「x」とする。DLモデル143に画像データxを入力すると、画像データxに含まれる対象物の尤度(確からしさ)「p」が出力され「f(x)=p」で示される。
【0027】
図1の説明に戻る。制御部150は、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置100内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部150は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0028】
制御部150は、取得部151、画像生成部152、尤度算出部153、近似値算出部154、表示処理部155を有する。
【0029】
取得部151は、外部装置等から画像データ141を取得する。取得部151は、取得した画像データ141を、記憶部140に登録する。取得部151は、入力部120を介して、画像データ141を取得してもよい。
【0030】
画像生成部152は、画像データ141の領域のうち、一部の領域を遮蔽することで、遮蔽画像データを生成する。画像生成部152は、遮蔽画像データと、遮蔽領域座標との関係を、遮蔽画像テーブル142に登録する。画像生成部152は、遮蔽領域の座標を変更しながら、上記処理を繰り返し実行することで、複数の遮蔽画像データを生成する。
【0031】
たとえば、画像生成部152が画像データ141から遮蔽画像データを生成する処理は「occ:occlusion」に対応し、式(1)のg(x)で表現される。式(1)において、「x」は、画像データ141に対応し、各ピクセルの画素値である。「m」はマスクである。「v」は、リプレイスバリュー(replace values)であり、固定値が設定される。式(1)の「x」と「m」との間の記号はアダマール積(Hadamard Product)を示す。
【0032】
【0033】
図4は、マスクを説明するための図である。
図4に示すように、マスクmは、行列で示され、行列の成分(i,j)は、0または1が設定される。たとえば、画像データxのピクセル(i,j)を遮蔽領域とする場合には、マスクmの行列の(i,j)が「0」に設定される。画像データxのピクセル(i,j)を遮蔽領域としない場合には、マスクmの行列の(i,j)が「1」に設定される。
【0034】
画像生成部152が、式(1)に対応する処理を実行することで、画像データxに含まれる各ピクセルのうち、マスクmの行列の成分が「0」となる成分に対応するピクセルの画素値が、vの値に置き換わる。
【0035】
図1の説明に戻る。尤度算出部153は、画像データ141を、訓練済みのDLモデル143に入力することで、画像データ141に含まれる対象物の尤度を算出する。以下の説明では、画像データ141に含まれる対象物の尤度を「第1尤度」と表記する。尤度算出部153は、第1尤度のデータを、近似値算出部154、表示処理部155に出力する。DLモデル143から複数クラスの尤度がそれぞれ出力される場合には、各尤度のうち、最大尤度を、第1尤度としてもよい。
【0036】
近似値算出部154は、近似式を基にして、遮蔽画像データに含まれる対象物の尤度の近似値を算出する。近似値算出部154が利用する近似式f(g(x))は、テイラー展開(Taylor expansion)によって、式(2)によって示される。式(2)に示す近似式は、「第2モデル」の一例である。
【0037】
【0038】
たとえば、近似値算出部154は、式(2)の右辺に含まれる第1項から第5項のうち、第1項と、第2項とを用いて、近似値を算出する。式(2)の第1項「f(x)」は、尤度算出部153によって算出される第1尤度である。画像データ141から生成された各遮蔽画像データの近似値を算出する場合に、同一の第1尤度を再利用できるため、計算コストが削減される。式(2)に含まれるx、g(x)に関する説明は、式(1)の説明と同様である。
【0039】
近似値算出部154は、遮蔽画像テーブル142から遮蔽画像データを取得し、式(2)の第1項と、第2項とを用いて、近似値を算出する。以下の説明では、遮蔽画像データに含まれる対象物の尤度の近似値を「第2尤度」と表記する。近似値算出部154は、遮蔽画像データと、第2尤度との関係を、遮蔽画像テーブル142に登録する。近似値算出部154は、遮蔽画像テーブル142の各遮蔽画像データについて、上記処理を繰り返し実行することで、各遮蔽画像データの第2尤度を算出し、第2尤度を遮蔽画像テーブル142に登録する。
【0040】
表示処理部155は、第1尤度と、遮蔽画像テーブル142に登録された各第2尤度とを比較し、クラス識別に重要となる領域が遮蔽された遮蔽画像データを特定する。たとえば、表示処理部155は、第1尤度と第2尤度との差分が閾値以上となる遮蔽画像データの遮蔽領域座標を特定する。表示処理部155が特定した遮蔽領域座標を、特定領域座標と表記する。
【0041】
表示処理部155は、画像データ141の領域のうち、特定領域座標に対応する領域を強調した画像データの表示画面を生成し、生成した表示画面を表示部130に出力して表示させる。表示処理部155は、どのように領域を強調してもよい。たとえば、表示処理部155は、画像データ141の領域のうち、特定領域座標に対応する領域を所定の色で塗りつぶしてもよいし、特定領域座標に対応する領域の輪郭を所定の色に設定してもよい。
【0042】
次に、本実施例に係る情報処理装置100の処理手順の一例について説明する。
図5は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。
図5に示すように、情報処理装置100の取得部151は、画像データ141を取得し、記憶部140に登録する(ステップS101)。
【0043】
情報処理装置100の画像生成部152は、画像データ141に対して、異なる遮蔽領域を持った複数の遮蔽画像データを生成し、遮蔽画像テーブル142に登録する(ステップS102)。
【0044】
情報処理装置100の尤度算出部153は、画像データ141をDLモデル143に入力し、第1尤度を算出する(ステップS103)。情報処理装置100の近似値算出部154は、近似式を基にして、各遮蔽画像データの第2尤度をそれぞれ算出し、遮蔽画像テーブル142に登録する(ステップS104)。
【0045】
情報処理装置100の表示処理部155は、第1尤度と、各第2尤度とを比較し、第1尤度との差分が閾値以上となる第2尤度に対する遮蔽画像データを特定する(ステップS105)。
【0046】
表示処理部155は、特定した遮蔽画像データの遮蔽領域に対応する画像データ141上の領域を強調表示する画像データの表示画面を生成する(ステップS106)。表示処理部155は、生成した表示画面を、表示部130に出力して表示させる(ステップS107)。
【0047】
次に、本実施例に係る情報処理装置100の効果について説明する。情報処理装置100は、画像データ141をDLモデル143に入力して、第1尤度を算出し、複数の遮蔽画像データに対応する尤度の近似値(第2尤度)を、近似式を基にして算出する。情報処理装置100は、第1尤度と、複数の第2尤度とを基にして、画像データのうち、クラスの識別に影響する領域を特定し、表示する。このように、遮蔽画像データの第2尤度を算出する場合に、近似式を用いることで、クラスの識別に重要となる画像領域の特定に要する時間を削減できる。
【0048】
たとえば、従来技術では、複数の遮蔽画像データの尤度を算出する場合に、遮蔽画像データをそれぞれDLモデルに入力して、各遮蔽画像データの尤度を算出していた。これに対して、本実施例に係る情報処理装置100は、式(2)に示すように、画像データ141をDLモデル143に入力して、第1尤度を1回算出すれば、かかる第1尤度を流用して、各遮蔽画像データの第2尤度を算出でき、計算コストを削減可能である。
【0049】
情報処理装置100は、複数の第2尤度のうち、第1尤度との差分が閾値以上となる第2尤度に関する遮蔽画像データの遮蔽された領域と同領域となる画像データ141の領域を、クラスの識別に影響する領域として特定する。これによって、クラスの識別に影響する領域を適切に特定することができる。
【0050】
情報処理装置100は、遮蔽画像データを生成する場合に、画像データ141の一部の領域の画素値を一定の画素値に変更することで、遮蔽画像データを生成する。たとえば、情報処理装置100の画像生成部152は、予め設定されたv(リプレイスバリュー)に応じた画素値によって、遮蔽画像データを生成する。これによって、容易に、遮蔽画像データを生成できる。
【0051】
なお、情報処理装置100の画像生成部152は、遮蔽画像データを生成する場合に、遮蔽する領域の周囲領域の画素値を基にして、遮蔽する領域の画素値を調整してもよい。また、画像生成部152は、遮蔽する領域の大きさを、遮蔽画像データ毎に変更してもよい。
【0052】
図6は、画像生成部のその他の処理を説明するための図である。たとえば、画像生成部152は、画像データ141に設定する遮蔽領域の大きさを最小で領域A1の大きさとし、最大で領域A2の大きさとする。領域A1,A2の大きさは、事前に設定される。
【0053】
画像生成部152によって、vの値が調整される場合、情報処理装置100の近似値算出部154は、式(3)に示す「Conditional sampling」を基にして、各遮蔽画像データの第2尤度を算出してもよい。
【0054】
【0055】
式(3)において、「vi」は、リプレイスバリューであり、たとえば、0~255の値を取る。「p(vi|x)」は、遮蔽領域の周囲領域の画素値がxである場合に、viとなる確率(prior probability)であり、ガウス分布に基づく。g(x;m,vi)は、式(1)に対応する。ただし、vの値は、固定値ではなく、0~255の値を取る。
【0056】
なお、式(3)は、式(4)の関係を用いると、式(5)のようにまとめることが可能である。式(5)において、「J」は、ヤコビ行列である。「μ」は、viの平均値である。
【0057】
【0058】
【0059】
情報処理装置100は、式(5)を利用することで、遮蔽する領域の周囲の画素値に応じて遮蔽領域の画素を設定した遮蔽画像データに対する近似値(第2尤度)を算出することができる。
【0060】
次に、上記実施例に示した情報処理装置100と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。
図7は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【0061】
図7に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置204と、インタフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201~207は、バス208に接続される。
【0062】
ハードディスク装置207は、取得プログラム207a、画像生成プログラム207b、尤度算出プログラム207c、近似値算出プログラム207d、表示処理プログラム207eを有する。また、CPU201は、各プログラム207a~207eを読み出してRAM206に展開する。
【0063】
取得プログラム207aは、取得プロセス206aとして機能する。画像生成プログラム207bは、画像生成プロセス206bとして機能する。尤度算出プログラム207cは、尤度算出プロセス206cとして機能する。近似値算出プログラム207dは、近似値算出プロセス206dとして機能する。表示処理プログラム207eは、表示処理プロセス206eとして機能する。
【0064】
取得プロセス206aの処理は、取得部151の処理に対応する。画像生成プロセス206bの処理は、画像生成部152の処理に対応する。尤度算出プロセス206cの処理は、尤度算出部153の処理に対応する。近似値算出プロセス206dの処理は、近似値算出部154の処理に対応する。表示処理プロセス206eの処理は、表示処理部155の処理に対応する。
【0065】
なお、各プログラム207a~207eについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が各プログラム207a~207eを読み出して実行するようにしてもよい。
【0066】
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
【0067】
(付記1)画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理をコンピュータに実行させることを特徴とする可視化プログラム。
【0068】
(付記2)前記第2尤度を算出する処理は、前記画像の遮蔽する領域がそれぞれ異なる複数の遮蔽画像を、前記第2モデルに入力することで、複数の遮蔽モデルに対する第2尤度をそれぞれ算出し、前記特定する処理は、複数の第2尤度のうち、前記第1尤度との差分が閾値以上となる第2尤度に関する遮蔽画像の遮蔽された領域と同領域となる前記画像の領域を、前記クラスの識別に影響する領域として特定することを特徴とする付記1に記載の可視化プログラム。
【0069】
(付記3)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の画素値を所定値に変更することで、前記遮蔽画像を生成することを特徴とする付記1に記載の可視化プログラム。
【0070】
(付記4)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の周辺領域の画素値を基にして、前記遮蔽する一部の領域の画素値を特定し、前記遮蔽する一部の領域の画素値を、特定した画素値に変更することで、前記遮蔽画像を生成することを特徴とする付記1に記載の可視化プログラム。
【0071】
(付記5)画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理をコンピュータが実行することを特徴とする可視化方法。
【0072】
(付記6)前記第2尤度を算出する処理は、前記画像の遮蔽する領域がそれぞれ異なる複数の遮蔽画像を、前記第2モデルに入力することで、複数の遮蔽モデルに対する第2尤度をそれぞれ算出し、前記特定する処理は、複数の第2尤度のうち、前記第1尤度との差分が閾値以上となる第2尤度に関する遮蔽画像の遮蔽された領域と同領域となる前記画像の領域を、前記クラスの識別に影響する領域として特定することを特徴とする付記5に記載の可視化方法。
【0073】
(付記7)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の画素値を所定値に変更することで、前記遮蔽画像を生成することを特徴とする付記5に記載の可視化方法。
【0074】
(付記8)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の周辺領域の画素値を基にして、前記遮蔽する一部の領域の画素値を特定し、前記遮蔽する一部の領域の画素値を、特定した画素値に変更することで、前記遮蔽画像を生成することを特徴とする付記5に記載の可視化方法。
【0075】
(付記9)画像を取得し、
取得した前記画像の領域のうち、一部の領域を遮蔽した遮蔽画像を生成し、
前記画像を入力とし、前記画像に含まれる対象物のクラスを出力として訓練された第1モデルに、前記画像を入力することで、前記画像に含まれる対象物の第1尤度を算出し、
前記画像が入力された場合に、前記画像に含まれる対象物の尤度の近似値を算出する第2モデルに、前記遮蔽画像を入力することで、前記遮蔽画像に含まれる対象物の尤度の近似値となる第2尤度を算出し、
前記第1尤度と、前記第2尤度とを基にして、前記画像の領域のうち、前記クラスの識別に影響する領域を特定し、
特定した前記クラスの識別に影響する領域を表示する
処理を実行する制御部を有する情報処理装置。
【0076】
(付記10)前記第2尤度を算出する処理は、前記画像の遮蔽する領域がそれぞれ異なる複数の遮蔽画像を、前記第2モデルに入力することで、複数の遮蔽モデルに対する第2尤度をそれぞれ算出し、前記特定する処理は、複数の第2尤度のうち、前記第1尤度との差分が閾値以上となる第2尤度に関する遮蔽画像の遮蔽された領域と同領域となる前記画像の領域を、前記クラスの識別に影響する領域として特定することを特徴とする付記9に記載の情報処理装置。
【0077】
(付記11)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の画素値を所定値に変更することで、前記遮蔽画像を生成することを特徴とする付記9に記載の情報処理装置。
【0078】
(付記12)前記遮蔽画像を生成する処理は、前記遮蔽する一部の領域の周辺領域の画素値を基にして、前記遮蔽する一部の領域の画素値を特定し、前記遮蔽する一部の領域の画素値を、特定した画素値に変更することで、前記遮蔽画像を生成することを特徴とする付記9に記載の情報処理装置。