(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-05-19
(45)【発行日】2025-05-27
(54)【発明の名称】情報処理装置、情報処理方法、及び記録媒体
(51)【国際特許分類】
G06F 21/31 20130101AFI20250520BHJP
G06F 21/45 20130101ALI20250520BHJP
【FI】
G06F21/31
G06F21/45
(21)【出願番号】P 2024507306
(86)(22)【出願日】2022-03-16
(86)【国際出願番号】 JP2022011958
(87)【国際公開番号】W WO2023175783
(87)【国際公開日】2023-09-21
【審査請求日】2024-08-19
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】橋本 博志
(72)【発明者】
【氏名】早坂 昭裕
【審査官】川原 光司
(56)【参考文献】
【文献】国際公開第2020/115154(WO,A1)
【文献】特開2020-042765(JP,A)
【文献】特開2021-128409(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/00
21/30-21/46
(57)【特許請求の範囲】
【請求項1】
認証処理の対象に関するクエリ特徴量を取得する特徴量取得手段と、
前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出する第1スコア算出手段と、
前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出する第2スコア算出手段と、
前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成するマップ生成手段と、
を備える情報処理装置。
【請求項2】
前記マップ生成手段は、CAM(Class Activation Map)を生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記マップ生成手段は、前記認証処理に含まれる前記クエリ特徴量の正規化処理による影響を除去して、前記サリエンシーマップを生成する、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記マップ生成手段は、前記正規化処理による影響を含まない第1データを第1パラメータに対応させ、前記正規化処理による影響を含む第2データを第2パラメータに対応させて、前記サリエンシーマップを生成する、
請求項3に記載の情報処理装置。
【請求項5】
前記マップ生成手段は、前記クエリ特徴量に基づく特徴量マップの各要素の前記認証処理に対する寄与を、ノルムと類似度との2つの要素に分解して、前記サリエンシーマップを生成する、
請求項1又は2に記載の情報処理装置。
【請求項6】
前記マップ生成手段は、前記ノルムを第1パラメータに対応させ、前記類似度を第2パラメータに対応させて、前記サリエンシーマップを生成する、
請求項5に記載の情報処理装置。
【請求項7】
少なくとも1つのコンピュータによって、
認証処理の対象に関するクエリ特徴量を取得し、
前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、
前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、
前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、
情報処理方法。
【請求項8】
少なくとも1つのコンピュータに、
認証処理の対象に関するクエリ特徴量を取得し、
前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、
前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、
前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、
情報処理方法を実行させる
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、情報処理装置、情報処理方法、及び記録媒体の技術分野に関する。
【背景技術】
【0002】
この種の装置として、推論結果における寄与度を視覚的に表示するものが知られている。例えば特許文献1では、畳み込みニューラルネットワークで生成された特徴マップから、Grad-CAM処理によってアクティベーションマップを生成すること開示されている。
【0003】
その他の関連する技術として、例えば特許文献2では、特徴マップにおける対象カテゴリへの影響の度合を表す重みを、畳み込み層のチャネルごと及び出力位置ごとに出力することが開示されている。特許文献3では、入力データのクラスを識別する際に、入力データから抽出した特徴ベクトルを重みベクトルとして処理することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2021-089512号公報
【文献】特開2019-211913号公報
【文献】特開2012-084117号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この開示は、先行技術文献に開示された技術を改善することを目的とする。
【課題を解決するための手段】
【0006】
この開示の情報処理装置の一の態様は、認証処理の対象に関するクエリ特徴量を取得する特徴量取得手段と、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出する第1スコア算出手段と、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出する第2スコア算出手段と、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成するマップ生成手段と、を備える。
【0007】
この開示の情報処理方法の一の態様は、少なくとも1つのコンピュータによって、認証処理の対象に関するクエリ特徴量を取得し、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する。
【0008】
この開示の記録媒体の一の態様は、少なくとも1つのコンピュータに、認証処理の対象に関するクエリ特徴量を取得し、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、情報処理方法を実行させるコンピュータプログラムが記録されている。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
【
図2】第1実施形態に係る情報処理装置の機能的構成を示すブロック図である。
【
図3】第1実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
【
図4】第2実施形態に係る情報処理装置の機能的構成を示すブロック図である。
【
図5】第2実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
【
図6】勾配計算における正規化処理の影響を示す模式図である。
【
図7】第3実施形態に係る情報処理装置におけるCAM生成部の機能的構成を示すブロック図である。
【
図8】第3実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
【
図9】第4実施形態に係る情報処理装置による可視化手法の一例を示す概念図である。
【
図10】第5実施形態に係る情報処理装置の機能的構成を示すブロック図である。
【
図11】第5実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
【
図12】第6実施形態に係る情報処理装置による可視化手法の一例を示す概念図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、情報処理装置、情報処理方法、及び記録媒体の実施形態について説明する。
【0011】
<第1実施形態>
第1実施形態に係る情報処理装置について、
図1から
図3を参照して説明する。
【0012】
(ハードウェア構成)
まず、
図1を参照しながら、第1実施形態に係る情報処理装置のハードウェア構成について説明する。
図1は、第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
【0013】
図1に示すように、第1実施形態に係る情報処理装置10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。情報処理装置10は更に、入力装置15と、出力装置16と、を備えていてもよい。上述したプロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
【0014】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、情報処理装置10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、サリエンシーマップを生成するための機能ブロックが実現される。このように、プロセッサ11は、情報処理装置10における各制御を実行するコントローラとして機能してよい。
【0015】
プロセッサ11は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)として構成されてよい。プロセッサ11は、これらのうち一つで構成されてもよいし、複数を並列で用いるように構成されてもよい。
【0016】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic Random Access Memory)や、SRAM(Static Random Access Memory)であってよい。また、RAM12に代えて、他の種類の揮発性メモリが用いられてもよい。
【0017】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable Read Only Memory)や、EPROM(Erasable Read Only Memory)であってよい。また、ROM13に代えて、他の種類の不揮発性 メモリが用いられてもよい。
【0018】
記憶装置14は、情報処理装置10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0019】
入力装置15は、情報処理装置10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。入力装置15は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。入力装置15は、例えばマイクを含む音声入力が可能な装置であってもよい。
【0020】
出力装置16は、情報処理装置10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、情報処理装置10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。また、出力装置16は、情報処理装置10に関する情報を音声出力可能なスピーカ等であってもよい。出力装置16は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。また、出力装置16は、画像以外の形式で情報を出力する装置であってもよい。例えば、出力装置16は、情報処理装置10に関する情報を音声で出力するスピーカであってもよい。
【0021】
なお、
図1では、複数の装置を含んで構成される情報処理装置10の例を挙げたが、これらの全部又は一部の機能を、1つの装置として実現してもよい。その場合、情報処理装置10は、例えば上述したプロセッサ11、RAM12、ROM13のみを備えて構成され、その他の構成要素(即ち、記憶装置14、入力装置15、出力装置16)については、情報処理装置10に接続される外部の装置が備えるようにしてもよい。また、情報処理装置10は、一部の演算機能を外部の装置(例えば、外部サーバやクラウド等)によって実現するものであってもよい。
【0022】
(機能的構成)
次に、
図2を参照しながら、第1実施形態に係る情報処理装置10の機能的構成について説明する。
図2は、第1実施形態に係る情報処理装置の機能的構成を示すブロック図である。
【0023】
第1実施形態に係る情報処理装置10は、認証処理に関するサリエンシーマップを生成するものとして構成されている。例えば、情報処理装置10は、認証処理に関する寄与度の高い部分を可視化するサリエンシーマップを生成可能に構成されている。なお、ここでの認証処理の種別は特に限定されないが、例えば顔画像や虹彩画像を用いた生体認証処理であってよい。情報処理装置10は、それ自身が認証処理を実行可能に構成されてもよいが、自身が認証処理を実行しないように構成されてもよい(例えば、認証処理は外部の装置が行うように構成されてよい)。
【0024】
図2に示すように、第1実施形態に係る情報処理装置10は、その機能を実現するための構成要素として、特徴量取得部110と、照合部120と、マップ生成部130と、を備えて構成されている。特徴量取得部110、照合部120、マップ生成部130の各々は、例えば上述したプロセッサ11(
図1参照)によって実現される処理ブロックであってよい。また、特徴量取得部110、照合部120、マップ生成部130の各々は、ニューラルネットワークとして構成されてよい。
【0025】
特徴量取得部110は、認証処理の対象に関するクエリ特徴量を取得可能に構成されている。例えば、特徴量取得部110は、対象の画像に対して各種処理を実行することによって、クエリ特徴量を抽出可能に構成されてよい。特徴量取得部110は、取得した特徴量を照合部120に出力可能に構成されている。また、特徴量取得部110は、マップ生成に用いる情報(例えば、勾配計算に用いる中間特徴量等)をマップ生成部130に出力可能に構成されてよい。
【0026】
照合部120は、特徴量取得部110で取得されたクエリ特徴量と、予め登録されたターゲット特徴量と、を用いて照合処理を実行可能に構成されている。具体的には、照合部120は、クエリ特徴量とターゲット特徴量とから照合スコアを算出する。この場合、照合部120は、算出した照合スコアと、そのスコアが本人である(即ち、登録された対象である)ことを判定するための判定閾値、及び他人である(即ち、登録された対象のいずれでもない)ことを判定するための判定閾値と、を比較して照合処理を行ってよい。照合スコアは、例えばクエリ特徴量とターゲット特徴量とのコサイン類似度として算出されてよい。
【0027】
照合部120は、上述した照合スコアを算出する構成要素として、第1スコア算出部121と、第2スコア算出部122とを備えている。第1スコア算出部121は、クエリ特徴量とターゲット特徴量とが一致する度合を示す第1スコア(所謂、本人スコア)を算出可能に構成されている。なお、登録されているターゲットが複数存在する場合、第1スコアは複数のターゲットの各々について算出されてよい。即ち、第1スコアは複数算出されてよい。第2スコア122は、クエリ特徴量とターゲット特徴量とが一致しない度合を示す第2スコア(所謂、他人スコア)を算出可能に構成されている。
【0028】
マップ生成部130は、照合部で算出された照合スコアを用いてサリエンシーマップを生成可能に構成されている。具体的には、マップ生成部130は、第1スコア算出部121で算出された第1スコアを第1のクラスに対応する第1クラススコアとして扱う。例えば、マップ生成部130は、下記式(1)のように表される第1スコアytを、第1クラススコアycとみなしてよい。
【0029】
【数1】
なお、f(ハット)はクエリ特徴量、f(ハット)
tはt番目のターゲット特徴量である。
【0030】
また、マップ生成部130は、第2スコア算出部122で算出された第2スコアを第2のクラス(即ち、第1のクラスとは異なるクラス)に対応する第2クラススコアとして扱う。例えば、下記式(2)のように表される他人確率pより、第2クラススコアxを下記式(3)のように定義してよい。
【0031】
【数2】
なお、λは本人、他人を判定するための判定閾値、sは正の数(超パラメタ)である。
【0032】
上記のように、第1スコア(本人スコア)を第1クラススコアとして扱い、第2スコア(他人スコア)を第2クラススコアとして扱うことで、予めクラスが定義されていない認証タスクを、クラス分類タスクとみなして処理することができる。なお、第2クラススコアを定数(例えば、単に閾値)にすると、勾配計算結果がすべてゼロとなり、所望の結果が得られないが、上記のように定義することで、このような課題を回避することが可能となる。
【0033】
(動作の流れ)
次に、
図3を参照しながら、第1実施形態に係る情報処理装置10の動作の流れ(具体的には、サリエンシーマップを出力するまでの流れ)について説明する。
図3は、第1実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
【0034】
図3に示すように、第1実施形態に係る情報処理装置10による動作が開始されると、まず特徴量取得部110が、認証処理の対象に関するクエリ特徴量を取得する(ステップS101)。特徴量取得部110で取得されたクエリ特徴量は、照合部120に出力される。また、特徴量取得部110で取得された中間特徴量等は、マップ生成部130に出力されてよい。
【0035】
続いて、照合部120における第1スコア算出部121が、クエリ特徴量とターゲット特徴量とが一致する度合を示す第1スコアを算出する(ステップS102)。また、照合部120における第2スコア算出部122が、クエリ特徴量とターゲット特徴量とが一致しない度合を示す第2スコアを算出する(ステップS103)。第1スコア算出部121で算出された第1スコア、及び第2スコア算出部122で算出された第2スコアは、それぞれマップ生成部130に出力される。
【0036】
続いて、マップ生成部130が、第1スコア算出部121で算出された第1スコアを第1クラススコアとして扱い、第2スコア算出部122で算出された第2スコアを第2クラススコアとして扱うことで、サリエンシーマップを生成する(ステップS104)。そして、マップ生成部130は、生成したサリエンシーマップを出力する(ステップS105)。サリエンシーマップは、例えば上述した出力装置16(
図1参照)等によって出力されてよい。例えば、サエリエンシーマップは、ディスプレイを用いて画像表示されてよい。なお、サリエンシーマップの具体的な可視化方法については、後述する他の実施形態で詳しく説明する。
【0037】
(技術的効果)
次に、第1実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0038】
図1から
図3で説明したように、第1実施形態に係る情報処理装置10では、認証処理における照合スコアをクラススコアとして扱うことにより、サリエンシーマップが生成される。このようにすれば予めクラスが定義されていない認証タスクを、クラス分類タスクとみなして処理することができるため、適切にサリエンシーマップを生成することが可能となる。
【0039】
<第2実施形態>
第2実施形態に係る情報処理装置10について、
図4及び
図5を参照して説明する。なお、第2実施形態は、上述した第1実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1実施形態と同一であってよい。このため、以下では、すでに説明した第1実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0040】
(機能的構成)
まず、
図4を参照しながら、第2実施形態に係る情報処理装置10の機能的構成について説明する。
図4は、第2実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、
図4では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0041】
図4に示すように、第2実施形態に係る情報処理装置10は、その機能を実現するための構成要素として、特徴量生成部110と、照合部120と、CAM生成部135と、を備えて構成されている。即ち、第2実施形態に係る情報処理装置10は、第1実施形態におけるマップ生成部130(
図2参照)に代えて、CAM生成部135を備えている。CAM生成部135は、例えば上述したプロセッサ11(
図1参照)によって実現される処理ブロックであってよい。
【0042】
CAM生成部135は、サリエンシーマップの一具体例であるCAM(Class Activation Map)を生成可能に構成されている。CAM生成部135は、上述した第1実施形態のマップ生成部130(
図2参照)と同様に、第1スコア算出部121で算出された第1スコアを第1クラススコアとして扱い、第2スコア算出部122で算出された第2スコアを第2クラススコアとして扱う。このようにして、CAM生成部135は、第1スコア及び第2スコアからCAMを生成する。
【0043】
なお、CAMの具体的な生成手法については、既存の技術を適宜採用することができるため、ここでの詳細な説明は省略する。なお、CAM生成部135は、CAMから派生した様々な手法を用いてよい。例えば、CAM生成部135は、Grad-CAM(Gradient-weighted Class Activation Map)の手法を用いてCAMを生成してよい。この場合、例えばt番目のターゲット特徴量をGrad-CAMの重みWcとみなすことで、照合スコアをクラススコアとして扱うことができる。
【0044】
(動作の流れ)
次に、
図5を参照しながら、第2実施形態に係る情報処理装置10の動作の流れについて説明する。
図5は、第2実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、
図5では、
図3で示した処理と同様の処理に同一の符号を付している。
【0045】
図5に示すように、第2実施形態に係る情報処理装置10による動作が開始されると、まず特徴量取得部110が、認証処理の対象に関するクエリ特徴量を取得する(ステップS101)。そして、照合部120における第1スコア算出部121が、クエリ特徴量とターゲット特徴量とが一致する度合を示す第1スコアを算出する(ステップS102)。また、照合部120における第2スコア算出部122が、クエリ特徴量とターゲット特徴量とが一致しない度合を示す第2スコアを算出する(ステップS103)。
【0046】
続いて、CAM生成部135が、第1スコア算出部121で算出された第1スコアを第1クラススコアとして扱い、第2スコア算出部122で算出された第2スコアを第2クラススコアとして扱うことで、CAMを生成する(ステップS201)。そして、CAM生成部135は、生成したCAMを出力する(ステップS202)。CAMは、例えば上述した出力装置16(
図1参照)等によって出力されてよい。例えば、CAMは、ディスプレイを用いて画像表示されてよい。なお、CAMの具体的な可視化方法については、後述する他の実施形態で詳しく説明する。
【0047】
(技術的効果)
次に、第2実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0048】
図4及び
図5で説明したように、第2実施形態に係る情報処理装置10では、認証処理における照合スコアをクラススコアとして扱うことにより、CAMが生成される。このようにすれば予めクラスが定義されていない認証タスクを、クラス分類タスクとみなして処理することができるため、適切にCAMを生成することが可能となる。
【0049】
<第3実施形態>
第3実施形態に係る情報処理装置10について、
図6から
図8を参照して説明する。なお、第3実施形態は、上述した第1及び第2実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0050】
(正規化処理の影響)
まず、
図6を参照しながら、第3実施形態に係る情報処理装置10で実行される正規化処理が与える影響について説明する。
図6は、勾配計算における正規化処理の影響を示す模式図である。
【0051】
認証処理は、正規化処理を含むことがある。例えば、正規化処理は、クエリ特徴量を及びターゲット特徴量正規化する処理を含むことがある。正規化処理の一具体例としては、下記式(4)及び(5)のように特徴量マッマップFij
k(ijはマップの要素を示す符号)を正規化する処理が挙げられる。ただし、本実施形態に係る正規化処理が下記例に限定されるものではない。
【0052】
【0053】
そして、上記の正規化処理に対する勾配計算は、下記式(6)のようになる。
【0054】
【0055】
上記式(6)の第1項は、
図6におけるfに対応しており、正規化処理の影響を含まないものである。一方、第2項を含めた場合は、
図6におけるwに対応し、正規化処理の影響を含むものとなる。このように、正規化処理の影響を含むものとそうでないものとでは、ベクトルの方向が全く異なるものとなる。
【0056】
なお、正規化処理の影響を含まない第1項については、人間が直感的に理解しやすいものである。一方で、正規化処理の影響を含む第2項を含めると、機械には理解しやすいものの、人間には直感的に理解しにくいものとなる。よって、正規化処理の影響を含んだものからサリエンシーマップを生成すると、人間の直感的理解にそぐわない結果が得られることになってしまう。本実施形態に係る情報処理装置10は、このような正規化処理の影響を排除することで(具体的には、上記式(6)の第2項の影響を排除するような処理を行うことで)、適切なサリエンシーマップを生成可能とされている。
【0057】
(機能的構成)
次に、
図7を参照しながら、第3実施形態に係る情報処理装置10の機能的構成(特に、CAM生成部135の構成)について説明する。
図7は、第3実施形態に係る情報処理装置におけるCAM生成部の機能的構成を示すブロック図である。
【0058】
図7に示すように、第2実施形態に係るCAM生成部135は、その機能を実現するための構成要素として、第1重要度重み算出部1351と、第2重要度重み算出部1352と、第1CAM算出部1353と、第2CAM算出部1354と、を備えて構成されている。
【0059】
第1重要度重み算出部1351は、正規化処理の影響を受けた重要度重みを算出可能に構成されている。一方、第2重要度重み算出部1352は、正規化処理の影響を取り除いた重要度重みを算出可能に構成されている。第1重要度重み算出部1351及び第2重要度重み算出部1352には、照合スコアや照合特徴量、その他の勾配計算に用いる情報等が入力される。そして、第1重要度重み算出部1351及び第2重要度重み算出部1352は、それらの入力される情報を用いて、それぞれ重要度重みを算出する。
【0060】
第1CAM算出部1353は、第1重要度重み算出部1351で算出された重要度重み(即ち、正規化処理の影響を受けた重要度重み)と中間特徴量等とを用いて、第1CAMを生成する。第1CAMは、正規化処理の影響を受けたCAMである。一方、第2CAM算出部1354は、第2重要度重み算出部1352で算出された重要度重み(即ち、正規化処理の影響を取り除いた重要度重み)と中間特徴量等とを用いて、第2CAMを生成する。第2CAMは、正規化処理の影響を取り除いたCAMである。
【0061】
(動作の流れ)
次に、
図8を参照しながら、第3実施形態に係る情報処理装置10の動作の流れについて説明する。
図8は、第3実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、
図8では、
図5で示した処理と同様の処理に同一の符号を付している。
【0062】
図8に示すように、第3実施形態に係る情報処理装置10による動作が開始されると、まず特徴量取得部110が、認証処理の対象に関するクエリ特徴量を取得する(ステップS101)。そして、照合部120における第1スコア算出部121が、クエリ特徴量とターゲット特徴量とが一致する度合を示す第1スコアを算出する(ステップS102)。また、照合部120における第2スコア算出部122が、クエリ特徴量とターゲット特徴量とが一致しない度合を示す第2スコアを算出する(ステップS103)。
【0063】
続いて、第1重要度重み算出部1351が、正規化処理の影響を受けた重要度重みを算出する(ステップS301)。そして、第1CAM算出部1353は、第1重要度重み算出部1351で算出された重要度重みと中間特徴量等とを用いて、正規化処理の影響を受けた第1CAMを生成する(ステップS302)。一方、第2重要度重み算出部1352は、正規化処理の影響を取り除いた重要度重みを算出する(ステップS303)。そして、第2CAM算出部1354は、第2重要度重み算出部1352で算出された重要度重みと中間特徴量等とを用いて、正規化処理の影響を取り除いた第2CAMを生成する(ステップS304)。
【0064】
続いて、CAM生成部135は、生成したCAMを出力する(ステップS202)。CAM生成部135は、正規化処理の影響を受けた第1CAM及び正規化処理の影響を受けない第2CAMの両方を出力してもよいし、第1CAM及び第2CAMのいずれか一方を出力してもよい。なお、第1CAM及び第2CAMの具体的な可視化方法については、後述する他の実施形態で詳しく説明する。
【0065】
(技術的効果)
次に、第3実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0066】
図6から
図8で説明したように、第3実施形態に係る情報処理装置10では、正規化処理の影響を取り除いたCAMが生成される。このようにすれば、人間の直感的理解に即したCAMを生成することができる。なお、本実施形態では、CAMを生成する例を挙げたが、正規化処理を取り除くことによる効果は、CAM以外のサリエンシーマップでも得られる。
【0067】
<第4実施形態>
第4実施形態に係る情報処理装置10について、
図9を参照して説明する。なお、第4実施形態は、上述した第3実施形態におけるマップの可視化手法を説明するものであり、装置構成や動作の流れ等については第3実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0068】
(可視化手法)
まず、
図9を参照しながら、第4実施形態に係る情報処理装置10によるサリエンシーマップの可視化手法について説明する。
図9は、第4実施形態に係る情報処理装置による可視化手法の一例を示す概念図である。
【0069】
図9に示すように、第4実施形態に係る情報処理装置10では、正規化処理の影響がないCAM(即ち、第2CAM算出部1354で算出された第2CAM)と、正規化処理の影響があるCAM(即ち、第1CAM算出部1353で算出された第1CAM)とが、表示に係る別々のパラメータに対応付けられることで可視化が行われる。例えば、正規化処理の影響がない第2CAMが色相に対応し、正規化処理の影響がある第1CAMが彩度に対応するように可視化が行われる。このようにすれば、例えば入力を明度に対応させることで、入力画像(白黒画像)に第1CAM及び第2CAMをオーバレイして表示することができる。
【0070】
なお、第1CAM及び第2CAMが対応付けられるパラメータは、上述した色相及び彩度に限定されるものではない。ただし、正規化処理の影響がない第1CAMについては、第2CAMと比較して、人間に対する視覚的効果の強いパラメータ(例えば、上記例の色相など)に対応付けられることが好ましい。
【0071】
(技術的効果)
次に、第4実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0072】
図9で説明したように、第4実施形態に係る情報処理装置10では、正規化処理の影響がないCAMと、正規化処理の影響があるCAMとが、別々のパラメータに対応するように可視化が行われる。このようにすれば、人間の直感的理解に即した可視化を実現することが可能となる。
【0073】
<第5実施形態>
第5実施形態に係る情報処理装置10について、
図10及び
図11を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0074】
(機能的構成)
まず、
図10を参照しながら、第5実施形態に係る情報処理装置10の機能的構成について説明する。
図10は、第5実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、
図10では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0075】
図10に示すように、第5実施形態に係る情報処理装置10は、その機能を実現するための構成要素として、特徴量取得部110と、照合部120と、マップ生成部130と、を備えて構成されている。そして特に、第5実施形態に係るマップ生成部130は、要素分解部131を備えている。
【0076】
要素分解部131は、クエリ特徴量に基づく特徴量マップの各要素の認証処理に対する寄与を、ノルムと類似度とに分解可能に構成されている。ただし、要素分解部131は、特徴量マップの生成後の処理がほとんど線形処理であることを前提としている。なお、ここで“ほとんど”としたのは、アフィン変換に含まれるバイアス処理等、定義拡張が自明な場合を想定しているためである。非線形処理の例としては、ReLU等の活性化関数処理が挙げられる。
【0077】
上述した線形処理の前提を課すと、正規化特徴量は下記式(7)のように表すことができる。
【0078】
【数5】
なお、G
ijは各要素ijで定義された特徴量である。
【0079】
正規化処理は非線形処理であるが、上記式(7)のように正規化係数を予め計算することにより、線形処理として定義することができる。そして、上記式(7)を念頭に照合スコアを見直すと、下記式(8)のように、各要素の寄与をノルムと角度(類似度)とに分解して定義することができる。
【0080】
【数6】
なお、|G
ij|はG
ijのノルムであり、y
t
ijはG
ijとf
tのコサイン類似度である。
【0081】
上記構成では、類似度の重み付き和が利用される。類似度は、例えば顔認証等においてよく用いられる指標であり、本実施形態では、このような認証処理の特性を考慮してサリエンシーマップの生成が行われることになる。
【0082】
(動作の流れ)
次に、
図11を参照しながら、第5実施形態に係る情報処理装置10の動作の流れについて説明する。
図11は、第5実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、
図11では、
図3で示した処理と同様の処理に同一の符号を付している。
【0083】
図11に示すように、第5実施形態に係る情報処理装置10による動作が開始されると、まず特徴量取得部110が、認証処理の対象に関するクエリ特徴量を取得する(ステップS101)。そして、照合部120における第1スコア算出部121が、クエリ特徴量とターゲット特徴量とが一致する度合を示す第1スコアを算出する(ステップS102)。また、照合部120における第2スコア算出部122が、クエリ特徴量とターゲット特徴量とが一致しない度合を示す第2スコアを算出する(ステップS103)。
【0084】
続いて、マップ生成部130が、特徴量マップの要素ごとの寄与を、ノルムと類似度とに分解してサリエンシーマップを生成する(ステップS501)。そして、マップ生成部130は、生成したサリエンシーマップを出力する(ステップS202)。なお、分解したノルムと類似度とを用いた具体的な可視化方法については、後述する他の実施形態で詳しく説明する。
【0085】
(技術的効果)
次に、第5実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0086】
図10及び
図11で説明したように、第5実施形態に係る情報処理装置10では、特徴量マップの要素ごとの寄与がノルムと類似度とに分解される。このようにすれば、正規化処理を前提とする認証処理の特性を考慮して、適切なサリエンシーマップを生成することが可能となる。
【0087】
<第6実施形態>
第6実施形態に係る情報処理装置10について、
図12を参照して説明する。なお、第6実施形態は、上述した第5実施形態におけるマップの可視化手法を説明するものであり、装置構成や動作の流れ等については第5実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0088】
(可視化手法)
まず、
図12を参照しながら、第6実施形態に係る情報処理装置10によるサリエンシーマップの可視化手法について説明する。
図12は、第6実施形態に係る情報処理装置による可視化手法の一例を示す概念図である。
【0089】
図12に示すように、第6実施形態に係る情報処理装置10では、要素分解部131によって分解されたノルムと類似度とが、表示に係る別々のパラメータに対応付けられることで可視化が行われる。例えば、ノルムが彩度に対応し、類似度が色相に対応するように可視化が行われる。このようにすれば、例えば入力を明度に対応させることで、入力画像(白黒画像)にノルム及び類似度に対応する要素をオーバレイして表示することができる。
【0090】
なお、ノルム及び類似度が対応付けられるパラメータは、上述した色相及び彩度に限定されるものではない。ただし、相対的に重要度が高いと考えられる類似度については、ノルムと比較して、人間に対する視覚的効果の強いパラメータ(例えば、上記例の色相など)に対応付けられることが好ましい。
【0091】
(技術的効果)
次に、第6実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
【0092】
図12で説明したように、第6実施形態に係る情報処理装置10では、分解されたノルムと類似度とが、別々のパラメータに対応するように可視化が行われる。このようにすれば、認証処理の特性を考慮した可視化を実現することが可能となる。
【0093】
上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
【0094】
記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。更に、プログラム自体がサーバに記憶され、ユーザ端末にサーバからプログラムの一部または全てをダウンロード可能なようにしてもよい。
【0095】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0096】
(付記1)
付記1に記載の情報処理装置は、認証処理の対象に関するクエリ特徴量を取得する特徴量取得手段と、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出する第1スコア算出手段と、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出する第2スコア算出手段と、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成するマップ生成手段と、を備える情報処理装置である。
【0097】
(付記2)
付記2に記載の情報処理装置は、前記マップ生成手段は、CAM(Class Activation Map)を生成する、付記1に記載の情報処理装置である。
【0098】
(付記3)
付記3に記載の情報処理装置は、前記マップ生成手段は、前記認証処理に含まれる前記クエリ特徴量の正規化処理による影響を除去して、前記サリエンシーマップを生成する、付記1又は2に記載の情報処理装置である。
【0099】
(付記4)
付記4に記載の情報処理装置は、前記マップ生成手段は、前記正規化処理による影響を含まない第1データを第1パラメータに対応させ、前記正規化処理による影響を含む第2データを第2パラメータに対応させて、前記サリエンシーマップを生成する、付記3に記載の情報処理装置である。
【0100】
(付記5)
付記5に記載の情報処理装置は、前記マップ生成手段は、前記クエリ特徴量に基づく特徴量マップの各要素の前記認証処理に対する寄与を、ノルムと類似度との2つの要素に分解して、前記サリエンシーマップを生成する、付記1又は2に記載の情報処理装置である。
【0101】
(付記6)
付記6に記載の情報処理装置は、前記マップ生成手段は、前記ノルムを第1パラメータに対応させ、前記類似度を第2パラメータに対応させて、前記サリエンシーマップを生成する、付記5に記載の情報処理装置である。
【0102】
(付記7)
付記7に記載の情報処理方法は、少なくとも1つのコンピュータによって、認証処理の対象に関するクエリ特徴量を取得し、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、情報処理方法である。
【0103】
(付記8)
付記12に記載の記録媒体は、少なくとも1つのコンピュータに、認証処理の対象に関するクエリ特徴量を取得し、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、情報処理方法を実行させるコンピュータプログラムが記録された記録媒体である。
【0104】
(付記9)
付記9に記載のコンピュータプログラムは、少なくとも1つのコンピュータに、認証処理の対象に関するクエリ特徴量を取得し、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出し、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出し、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成する、情報処理方法を実行させるコンピュータプログラムである。
【0105】
(付記10)
付記10に記載の情報処理システムは、認証処理の対象に関するクエリ特徴量を取得する特徴量取得手段と、前記クエリ特徴量と、予め登録されたターゲット特徴量と、が一致する度合を示す第1スコアを算出する第1スコア算出手段と、前記第1スコアに基づいて、前記クエリ特徴量と、前記ターゲット特徴量とが一致しない度合を示す第2スコアを算出する第2スコア算出手段と、前記第1スコアを第1のクラスに対応する第1クラススコアとして扱い、前記第2スコアを第2のクラスに対応する第2クラススコアとして扱うことで、前記認証処理に関するサリエンシーマップを生成するマップ生成手段と、を備える情報処理システムである。
【0106】
この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う情報処理装置、情報処理方法、及び記録媒体もまたこの開示の技術思想に含まれる。
【符号の説明】
【0107】
10 情報処理装置
11 プロセッサ
16 出力装置
110 特徴量取得部
120 照合部
121 第1スコア算出部
122 第2スコア算出部
130 マップ生成部
131 要素分解部
135 CAM生成部
1351 第1重要度重み算出部
1352 第2重要度重み算出部
1353 第1CAM算出部
1354 第2CAM算出部