IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧 ▶ 国立大学法人電気通信大学の特許一覧

特開2025-32332特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025032332
(43)【公開日】2025-03-11
(54)【発明の名称】特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法およびプログラム
(51)【国際特許分類】
   G06V 10/40 20220101AFI20250304BHJP
   G06V 10/70 20220101ALI20250304BHJP
   G06T 7/00 20170101ALN20250304BHJP
   G06V 40/18 20220101ALN20250304BHJP
【FI】
G06V10/40
G06V10/70
G06T7/00 510D
G06V40/18
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2024219493
(22)【出願日】2024-12-13
(62)【分割の表示】P 2023506640の分割
【原出願日】2021-03-18
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(71)【出願人】
【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100181135
【弁理士】
【氏名又は名称】橋本 隆史
(72)【発明者】
【氏名】市野 将嗣
(72)【発明者】
【氏名】上野山 大介
(72)【発明者】
【氏名】坊良 翼
(72)【発明者】
【氏名】戸泉 貴裕
(72)【発明者】
【氏名】塚田 正人
(72)【発明者】
【氏名】荻野 有加
(57)【要約】      (修正有)
【課題】特徴超解像をさらに高精度に行う特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法および記録媒体を提供する。
【解決手段】特徴量変換学習装置200は、第1画像を取得する画像パッチ取得部201と、第1画像を、第1画像よりも解像度が低い第2画像に縮小する画像縮小部202と、第2画像を第1画像と同じ解像度の第3画像に拡大する画像拡大部103と、第1画像の特徴量である第1特徴量および第3画像の特徴量である第2特徴量を抽出する特徴量抽出部104と、第2特徴量を第3特徴量に変換する特徴量変換部105と、第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる学習制御部208と、を備える。
【選択図】図3
【特許請求の範囲】
【請求項1】
第1画像を取得する画像取得手段と、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小する画像縮小手段と、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大する画像拡大手段と、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
【請求項2】
前記第1特徴量または前記第3特徴量の入力を受けて、入力された特徴量が、特徴量変換手段によって変換された特徴量か否かを判定する特徴判別手段をさらに備え、
前記学習制御手段は、前記特徴判別手段が、特徴量変換手段によって変換された特徴量とそれ以外の特徴量とを区別できない場合に損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
請求項1に記載の特徴量変換学習装置。
【請求項3】
前記学習制御手段は、前記第1特徴量と前記第3特徴量とが類似するほど損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
請求項1または請求項2に記載の特徴量変換学習装置。
【請求項4】
前記学習制御手段は、前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
請求項1から3の何れか一項に記載の特徴量変換学習装置。
【請求項5】
前記画像縮小手段は、前記第1画像を、乱数を用いて決定したサイズに縮小して前記第2画像を生成する
請求項1から4の何れか一項に記載の特徴量変換学習装置。
【請求項6】
前記特徴量抽出手段は、
特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段
を備える、請求項1から5の何れか一項に記載の特徴量変換学習装置。
【請求項7】
前記特徴量変換手段は、前記特徴量抽出手段が生成する中間特徴量に対して特徴量の変換を行う、
請求項1から6の何れか一項に記載の特徴量変換学習装置。
【請求項8】
認証対象画像を取得する認証対象画像取得手段と、
前記認証対象画像を拡大する画像拡大手段と、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
【請求項9】
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を含む特徴量変換学習方法。
【請求項10】
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を含む認証方法。
【請求項11】
コンピュータに、
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を実行させるためプログラムを記録する記録媒体。
【請求項12】
コンピュータに、
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を実行させるためプログラムを記録する記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法および記録媒体に関する。
【背景技術】
【0002】
画像を、元の画像よりも解像度の高い画像に変換する技術は、超解像(Super-Resolution)と呼ばれている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】日本国特開2013-31163号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
顔画像を用いて虹彩認証を行う場合など、認証対象の画像の解像度が不足する場合が考えられる。この場合、超解像によって認証対象の画像をより解像度の高い画像に変換して認証に用いることが考えられるが、解像度の高い画像を生成する必要があるため、超解像に計算コストがかかる可能性がある。
【0005】
この開示の目的の一例は、上述した課題を解決することのできる特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法および記録媒体を提供することである。
【課題を解決するための手段】
【0006】
この開示の第一の態様によれば、特徴量変換学習装置は、第1画像を取得する画像取得手段と、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小する画像縮小手段と、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大する画像拡大手段と、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、前記第2特徴量を第3特徴量に変換する特徴量変換手段と、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、を備える。
【0007】
この開示の第二の態様によれば、認証装置は、認証対象画像を取得する認証対象画像取得手段と、前記認証対象画像を拡大する画像拡大手段と、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換する特徴量変換手段と、前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、を備える。
【0008】
この開示の第三の態様によれば、特徴量変換学習方法は、第1画像を取得することと、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、前記第2特徴量を第3特徴量に変換することと、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、を含む。
【0009】
この開示の第四の態様によれば、認証方法は、認証対象画像を取得することと、前記認証対象画像を拡大することと、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、を含む。
【0010】
この開示の第五の態様によれば、記録媒体は、コンピュータに、第1画像を取得することと、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、前記第2特徴量を第3特徴量に変換することと、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、を実行させるためプログラムを記録する記録媒体である。
【0011】
この開示の第六の態様によれば、記録媒体は、認証対象画像を取得することと、前記認証対象画像を拡大することと、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、を実行させるためプログラムを記録する記録媒体である。
【図面の簡単な説明】
【0012】
図1】第1実施形態に係る認証装置の構成例を示す図である。
図2】第1実施形態に係る認証装置が虹彩認証を行う処理手順の例を示すフローチャートである。
図3】第2実施形態に係る特徴量変換学習装置の構成例を示す図である。
図4】第2実施形態に係る特徴量変換学習装置が特徴量変換部の学習を行う処理手順の例を示す図である。
図5】第2実施形態に係る特徴量変換学習装置が損失を計算する処理手順の例を示す図である。
図6】第3実施形態に係る特徴量抽出部の構成例を示す図である。
図7】第3実施形態に係るアテンション処理部の構成例を示す図である。
図8】第3実施形態に係るアテンション処理部の第1の変形例に係るアテンションブロック302の構成例を示す図である。
図9】第3実施形態に係るアテンション処理部の第2の変形例に係るアテンション処理部303の構成例を示す図である。
図10】第3実施形態に係るアテンション処理部の第2の変形例に係るアテンション処理部304の構成例を示す図である。
図11】第4実施形態における特徴量抽出部の変形例に係る特徴量抽出部の構成例を示す図である。
図12】第4実施形態に係る特徴量抽出部を構成するニューラルネットの階層構造の例を示す図である。
図13】第5実施形態に係る認証装置の構成例を示す図である。
図14】第6実施形態に係る特徴量変換学習装置の構成例を示す図である。
図15】第7実施形態に係る認証装置の構成例を示す図である。
図16】第8実施形態に係る特徴量変換学習装置の構成例を示す図である。
図17】第9実施形態に係る認証装置の構成例を示す図である。
図18】第10実施形態に係る特徴量変換学習装置の構成例を示す図である。
図19】第11実施形態に係る認証装置の構成例を示す図である。
図20】第12実施形態に係る特徴量変換学習装置の構成例を示す図である。
図21】第13実施形態に係る特徴量変換学習装置の構成例を示す図である。
図22】第14実施形態に係る認証装置の構成例を示す図である。
図23】第15実施形態に係る特徴量変換学習方法における処理の手順の例を示すフローチャートである。
図24】第16実施形態に係る認証方法における処理の手順の例を示すフローチャートである。
図25】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0013】
<第1実施形態>
図1は、第1実施形態に係る認証装置の構成例を示す図である。図1に示す構成で、認証装置100は、認証対象画像取得部101と、比較用画像取得部102と、画像拡大部103と、特徴量抽出部104と、特徴量変換部105と、特徴量比較部106とを備える。
【0014】
認証装置100は、画像の特徴量を抽出し、抽出した特徴量を用いて認証を行う。以下では、認証装置100が低解像度画像を用いて虹彩認証を行う場合を例に説明する。ただし、認証装置100が行う認証は虹彩認証に限定されない。
2つの画像の解像度の比較は、画像の大きさを揃えた状態で行うものとする。
【0015】
認証対象画像取得部101は、認証対象画像である認証対象者の目の撮影画像を取得する。認証対象画像取得部101は、認証対象画像取得手段の例に該当する。
比較用画像取得部102は、認証対象画像との比較対象となる比較用画像を取得する。比較用画像が予め認証装置100に登録されていてもよい。
【0016】
ここで、認証対象画像が比較用画像よりも低解像度であるものとする。
例えば、認証対象画像が、認証対象者の顔全体の画像のうちの目の部分の画像であってもよい。一方、比較用画像が、虹彩認証用に目の部分のみを撮影して得られた画像であってもよい。このように、顔全体の画像のうちの目の部分の画像を用いて虹彩認証を行うことができれば、顔認証と虹彩認証との両方を行って認証精度の向上を図るといった運用が可能になる。
【0017】
画像拡大部103は、低解像度画像である認証対象画像を拡大する。画像拡大部103は、画像拡大手段の例に該当する。拡大された認証対象画像を、認証対象画像の拡大画像、あるいは単に拡大画像とも称する。
特徴量抽出部104は、認証対象画像の特徴量を、比較用画像に対する特徴量抽出方法と同じ方法で抽出する。
【0018】
特徴量抽出部104は、拡大された認証対象画像の特徴量と、比較用画像の特徴量とを抽出する。特徴量抽出部104は、拡大された認証対象画像と、比較用画像とに、同じアルゴリズムを適用してそれぞれの特徴量を抽出する。認証装置100が、同じ特徴量抽出部104を2つ備えるようにしてもよい。あるいは、1つの特徴量抽出部104が、例えば時分割処理などにより、拡大された認証対象画像の特徴量と、比較用画像の特徴量とを抽出するようにしてもよい。また、特徴量抽出部104が比較用画像の特徴量を予め抽出しておくなど、比較用画像の特徴量が、予め認証装置100に登録されていてもよい。
特徴量抽出部104は、特徴量抽出手段の例に該当する。
【0019】
特徴量変換部105は、拡大された認証対象画像の特徴量を変換する。特徴量変換部105は、拡大された認証対象画像の特徴量と高解像度の特徴量との相違が小さくなるように、特徴量の変換を行う。特徴量変換部105は、特徴量変換手段の例に該当する。
【0020】
特徴量変換部105による特徴量の変換を、特徴超解像とも称する。特徴量変換部105による変換後の特徴量を超解像特徴量とも称する。
特徴量変換部105は、学習用画像の特徴量と、学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど小さくなる損失関数を用いた学習によって、特徴量の変換方法を学習する。
【0021】
特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較して、例えば、認証対象画像の人物と比較用画像の人物とが同一人物であるか否かの判定を行う。
特徴量比較部106は、特徴量比較手段の例に該当する。
【0022】
図2は、認証装置100が虹彩認証を行う処理手順の例を示すフローチャートである。
図2の処理で、認証対象画像取得部101は、認証対象画像を取得する(ステップS111)。
【0023】
次に、画像拡大部103は、低解像度画像である認証対象画像が、高解像度画像である比較用画像と同じ解像度になるように、認証対象画像の画素を補間して認証対象画像を拡大する(ステップS112)。画像拡大部103が画像を拡大するアルゴリズムは、特定のアルゴリズムに限定されない。例えば、画像拡大部103バイキュービック(Bicubic)法、または、バイリニア(Bilinear)法を用いて画像を拡大するようにしてもよいが、これらに限定されない。
画像拡大部103による拡大後の画像を拡大画像とも称する。
【0024】
次に、特徴量抽出部104は、拡大画像の特徴量を抽出する(ステップS113)。特徴量抽出部104は、高解像度画像による認証用に学習済みの特徴抽出器であってもよいが、これに限定されない。特徴量抽出部104が、VGGまたはResNet(Residual Network)などのディープニューラルネットワーク(Deep Neural Network;DNN)による学習済みモデルを用いて構成されていてもよい。特徴量抽出部104が、1次元ベクトルの形式で特徴量を出力するようにしてもよい。あるいは、特徴量抽出部104が、画像情報を維持した2次元または3次元のテンソルの形式で特徴量を出力するようにしてもよい。
【0025】
次に、特徴量変換部105は、拡大画像の特徴量を変換する(ステップS114)。特徴量変換部105は、拡大画像の特徴量を、高解像度画像の特徴量と比較できるように変換する。
【0026】
また、比較用画像取得部102は、比較用画像を取得する(ステップS121)。そして、特徴量抽出部104は、比較用画像の特徴量を抽出する(ステップS122)。上述したように、特徴量抽出部104は、拡大画像の特徴量を抽出する場合と同じアルゴリズムを用いて比較用画像の特徴量を抽出する。
ステップS111からS114までと、ステップS121からS122までとは並列実行されてもよい。あるいは、ステップS121からS122までの処理が予め行われ、認証装置100が、比較用画像の特徴量を記憶しておくようにしてもよい。
【0027】
ステップS114およびS122の後、特徴量比較部106は、拡大画像の特徴量と比較用画像の特徴量とを比較する(ステップS131)。例えば、特徴量比較部106は、拡大画像の特徴量と比較用画像の特徴量との類似度を算出し、類似度が所定の閾値以上である場合に、認証対象画像の人物と比較用画像の人物とが同一人物であると判定する。特徴量比較部106が用いる類似度の算出方法は、ベクトルまたはテンソルの類似度を算出できるいろいろな方法とすることができ、特定の方法に限定されない。例えば、特徴量比較部106が、拡大画像の特徴量と比較用画像の特徴量とのL2距離またはコサイン類似度を算出するようにしてもよい。
ステップS131の後、認証装置100は、図2の処理を終了する。
【0028】
以上のように、認証対象画像取得部101は、認証対象画像を取得する。画像拡大部103は、認証対象画像を拡大する。特徴量抽出部104は、認証対象画像の拡大画像の特徴量を、認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部105は、学習用画像の特徴量と、学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど小さくなる損失関数を用いた学習に基づいて、認証対象画像の拡大画像の特徴量を変換する。特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0029】
認証装置100によれば、低解像度画像を拡大して特徴量を抽出し、超解像特徴量を生成することで、低解像度画像である認証対象画像の特徴量として、高解像度画像である比較用画像の特徴量と比較可能な特徴量を得られる。認証装置100によれば、この点で、入力画像が低解像度画像であっても認証を行うことができる。
【0030】
また、特徴量変換部105が行う特徴量の変換によって、拡大された認証対象画像の特徴量から、認証対象画像がより高解像度に撮影された場合の特徴量に近付くことが期待される。認証装置100によれば、この点で、認証を高精度に行えると期待される。
また、認証装置100によれば、低解像度画像を用いて虹彩認証を行うことができる。これにより、認証装置100では、高解像度のカメラを必要とせずに、1つの顔画像を用いて、顔認証と虹彩認証とを併用することができ、認証精度の向上が期待される。
【0031】
<第2実施形態>
図3は、第2実施形態に係る特徴量変換学習装置の構成例を示す図である。図3に示す構成で、特徴量変換学習装置200は、画像バッチ取得部201と、画像縮小部202と、画像拡大部103と、特徴量抽出部104と、特徴量変換部105と、損失関数計算部203と、学習制御部208とを備える。損失関数計算部203は、再構成損失計算部204と、特徴判別部205と、敵対損失計算部206と、類似度損失計算部207とを備える。
図3の各部のうち、図1の各部に対応して同様の機能を有する部分には同一の符号(103、104、105)を付している。
【0032】
特徴量変換学習装置200は、特徴量変換部105の学習を行う。学習後の特徴量変換部105を、認証装置100に用いることができる。
学習による調整対象となるパラメータを有するモデルを機械学習モデルと称する。機械学習モデルのパラメータを機械学習モデルパラメータと称し、機械学習モデルのパラメータ値を機械学習モデルパラメータ値と称する。機械学習モデルパラメータ値の調整が、学習に該当する。
以下では、特徴量変換部105の機械学習モデルがニューラルネットワークを用いて構成されている場合を例に説明する。ただし、特徴量変換部105の機械学習モデルの構成は、特定のものに限定されない。
【0033】
また、以下では、特徴量変換学習装置200が、学習に損失関数を用いる場合を例に説明する。この場合、特徴量変換学習装置200は、損失関数値が小さくなるように学習を行う。
ただし、特徴量変換学習装置200が、評価が高いほど関数値が大きくなる評価関数を用いて学習を行うようにしてもよい。この場合、特徴量変換学習装置200は、評価関数値が大きくなるように学習を行う。
【0034】
画像バッチ取得部201は、特徴量変換部105の学習に用いられる訓練データセットを取得する。画像バッチ取得部201が、取得する訓練データには、人の目の撮影画像と、その画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる。訓練データセットを単に訓練データとも称する。訓練データセットに含まれる1つの画像と1つのクラスラベルとの組合せの各々を、ラベル付き画像とも称する。
第2実施形態では、画像バッチ取得部201が取得する画像を高解像度画像とも称する。
画像バッチ取得部201は、画像取得手段の例に該当する。画像バッチ取得部201が取得する高解像度画像は、第1画像の例に該当する。
【0035】
画像縮小部202は、高解像度画像を縮小する。画像縮小部202行う画像の縮小によって画素が間引かれ、高解像度画像よりも解像度が低くなる。
画像縮小部202による縮小後の画像を縮小画像と称する。画像縮小部202が、乱数を用いて縮小画像のサイズまたは縮小率をランダムに決定して画像の縮小を行うようにしてもよい。
画像縮小部202は、画像縮小手段の例に該当する。縮小画像は、第2画像の例に該当する。
【0036】
特徴量変換学習装置200では、画像拡大部103は、画像縮小部202が画像を縮小した縮小率の分だけ画像を拡大する。画像拡大部103は、低解像度画像である縮小画像の拡大後の画像が、高解像度画像と同じ解像度になるように、縮小画像の画素を補間して縮小画像を拡大する。画像拡大部103が縮小画像を拡大して得られる画像を劣化画像とも称する。
上述したように、画像拡大部103は、画像拡大手段の例に該当する。劣化画像は、第3画像の例に該当する。
【0037】
特徴量変換学習装置200では、特徴量抽出部104は、高解像度画像の特徴量と、劣化画像の特徴量とを、同じアルゴリズムを用いて抽出する。
上述したように、特徴量抽出部104は、特徴量抽出手段の例に該当する。
特徴量変換学習装置200では、特徴量変換部105は、劣化画像の特徴量を変換する。特徴量変換部105は、劣化画像の特徴量に対して、高解像度画像の特徴量に近付けるように変換を行う。第1実施形態の場合と同様、特徴量変換部105による変換後の特徴量を、超解像特徴量とも称する。
上述したように、特徴量変換部105は、特徴量変換手段の例に該当する。
【0038】
損失関数計算部203は、特徴量変換部105の学習のための損失関数を計算する。損失関数計算部203は、損失関数計算手段の例に該当する。
再構成損失計算部204は、再構成損失を計算する。再構成損失は、高解像度画像の特徴量と超解像特徴量との、ベクトルまたはテンソルとしての類似度が高いほど値が小さくなる損失である。再構成損失は、損失関数計算部203は、高解像度画像の特徴量と超解像特徴量との類似度の指標値の例に該当する。再構成損失を変数の1つとして用いるトータル損失関数は、高解像度画像の特徴量と超解像特徴量とが類似するほど損失が小さくなる損失関数の例に該当する。
【0039】
特徴判別部205は、高解像度画像の特徴量と、超解像特徴量とを判別する。具体的には、特徴判別部205は、特徴量の入力を受け、入力された特徴量が高解像度画像の特徴量か超解像特徴量かを判定する。特徴判別部205も学習可能に構成される。例えば、特徴判別部205の機械学習モデルがニューラルネットワークを用いて構成されていてもよい。
特徴判別部205は、特徴判別手段の例に該当する。
【0040】
敵対損失計算部206は、特徴判別部205の判別結果(判定結果)に基づいて、特徴量変換部105の学習のための損失と特徴判別部205の学習のための損失とを計算する。特徴量変換部105の学習のための損失を、特徴量変換部105の損失とも称する。特徴判別部205の学習のための損失を、特徴判別部205の損失とも称する。
特徴量変換部105の学習と特徴判別部205の学習とは、学習制御部208の制御に従って、1つのバッチによる学習において交互に行われる。
【0041】
特徴量変換部105の学習では、敵対損失計算部206は、敵対損失を計算する。ここでいう敵対損失は、特徴判別部205が、超解像特徴量を高解像度画像の特徴量であると誤判定する場合に値が小さくなる損失である。敵対損失を変数の1つとして用いるトータル損失関数は、特徴判別部205が、特徴量変換部105によって変換された特徴量とそれ以外の特徴量とを区別できない場合に損失が小さくなる損失関数の例に該当する。
一方、特徴判別部205の学習では、敵対損失計算部206は、特徴判別部205が、超解像特徴量と高解像度画像の特徴量とを正しく判別する場合に値が小さくなる損失を計算する。
【0042】
類似度損失計算部207は、類似度損失を計算する。類似度損失は、超解像特徴量を用いたクラス分類で、分類結果のクラスが正解クラスと一致している場合に値が小さくなる損失である。類似度損失を変数の1つとして用いるトータル損失関数は、超解像特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数の例に該当する。
【0043】
学習制御部208は、損失関数計算部203が計算する損失を用いて、特徴量変換部105、特徴判別部205それぞれの機械学習モデルパラメータ値を更新する。学習制御部208は、学習制御手段の例に該当する。学習制御部208は、損失関数計算部203が計算する損失を用いて特徴量変換部105による特徴量へ変換の機械学習モデルパラメータ値を調整する。この点で、学習制御部208は、損失関数に基づいて特徴量変換部105に特徴量変換方法の学習を行わせる。特徴量変換部105の機械学習モデルパラメータ値の更新は、特徴量変換部105の学習に該当する。特徴判別部205の機械学習モデルパラメータ値の更新は、特徴判別部205の学習に該当する。
【0044】
図4は、特徴量変換学習装置200が特徴量変換部105の学習を行う処理手順の例を示す図である。
図4の処理で、画像バッチ取得部201は、人の目の撮影画像である高解像度画像と、その高解像度画像の正解クラスを示すクラスラベルとの組合せを複数含む訓練データセットを取得する(ステップS211)。上述したように、訓練データセットに含まれる、1つの高解像度画像と1つのクラスラベルとの組合せのそれぞれをラベル付き画像とも称する。
次に、画像バッチ取得部201は、訓練データセットからバッチデータを取得する(ステップS212)。例えば、画像バッチ取得部201は、訓練データセットに含まれるラベル付き画像のうち、所定のバッチサイズの個数のラベル付き画像をランダムに選択する。画像バッチ取得部201が取得するバッチデータを、画像バッチデータとも称する。
画像バッチ取得部201が取得する画像バッチデータのバッチサイズは特定のサイズに限定されない。例えば、画像バッチ取得部201が、128個のラベル付き画像を含む訓練データセットを取得するようにしてもよいが、これに限定されない。
【0045】
次に、特徴量変換学習装置200は、画像バッチデータに含まれるラベル付き画像毎に処理を行うループL11を開始する(ステップS213)。特徴量変換学習装置200がループL11の処理を並列実行するようにしてもよいし、逐次実行するようにしてもよい。
【0046】
ループL11の処理で、画像縮小部202が、ラベル付き画像の高解像度画像を縮小する(ステップS221)。画像縮小部202が、縮小画像のサイズをランダムに決定し、画像の縮小を行うようにしてもよい。画像縮小部202は、画像の画素を間引いて画像を縮小する。したがって、画像縮小部202による画像の縮小により、画像の解像度が低下する。縮小画像は、低解像度画像に該当する。
【0047】
次に、画像拡大部103が、縮小画像を拡大する(ステップS222)。画像拡大部103が縮小画像を拡大して得られる画像を劣化画像とも称する。上述したように、画像拡大部103は、劣化画像が高解像度画像と同じ解像度になるように、縮小画像の画素を補間して縮小画像を拡大する。
【0048】
次に、特徴量抽出部104が、劣化画像の特徴量を抽出する(ステップS223)。
次に、特徴量変換部105は、劣化画像の特徴量を変換する(ステップS224)。上述したように、特徴量変換部105による変換後の特徴量を超解像特徴量とも称する。
【0049】
また、特徴量抽出部104は、ラベル付き画像の高解像度画像の特徴量を抽出する(ステップS231)。
ステップS221からS224までと、ステップS231とは並列実行されてもよい。
【0050】
ステップS224およびS231の後、特徴量変換学習装置200は、ループL11の終端処理を行う(ステップS241)。具体的には、特徴量変換学習装置200は、学習バッチに含まれる全てのラベル付き画像についてループL11の処理が完了することを待ち受ける。特徴量変換学習装置200は、学習バッチに含まれる全てのラベル付き画像についてループL11の処理が完了したことを検出すると、ループL11を終了する。
【0051】
ループL11の終了後、特徴量変換学習装置200は、特徴量変換部105の学習のための損失を計算する(ステップS242)。特徴量変換学習装置200は、画像バッチデータに含まれる全てのラベル付き画像に対するループL11の処理の結果に基づいて、1つのトータル損失関数値を算出する。
図5は、特徴量変換学習装置200が損失を計算する処理手順の例を示す図である。特徴量変換学習装置200は、図4のステップS242で図5の処理を行う。
【0052】
図5の処理で、特徴判別部205は、入力された特徴量が超解像特徴量か高解像度画像の特徴量かを判定(判別)するためのベクトルを出力する(ステップS251)。例えば、特徴判別部205が、入力された特徴量が高解像度画像の特徴量である確率を算出し、その確率を要素に含むベクトルを出力するようにしてもよい。この確率は0から1の実数値をとり、例えば1に近いほど高解像度画像の特徴量である可能性が高いことを示し、0に近いほど超解像特徴量である可能性が高いことを示すというように、入力画像の種類を判別することができる。
【0053】
次に、敵対損失計算部206は、特徴判別部205が出力するベクトルを用いて損失を計算する(ステップS252)。特徴量変換部105と特徴判別部205とは敵対的生成ネットワーク(Generative Adversarial Network;GAN)の構造を持ち、敵対損失計算部206は、特徴判別部205が出力するベクトルを用いて敵対損失を計算する。ここでいう敵対損失は、判別器が誤判定する場合に値が小さくなる損失である。
【0054】
特徴量変換部105の学習では、敵対損失計算部206は、特徴判別部205が超解像特徴量を高解像度画像の特徴量と誤判定する場合に敵対損失が小さくなる損失関数を用いて、敵対損失を計算する。学習制御部208は、敵対損失計算部206が算出する敵対損失が小さくなるように、特徴量変換部105の機械学習モデルパラメータ値を調整する。これにより、特徴量変換部105は、特徴判別部205を騙すように超解像特徴量を生成する。例えば、超解像特徴が入力されたときに敵対損失計算部206が1を出力するようにクロスエントロピー損失を用いて特徴量変換部105の学習を行うようにしてもよい。
【0055】
一方、特徴量変換部105の学習と交互に行われる特徴判別部205の学習では、敵対損失計算部206は、特徴判別部205が超解像特徴量と高解像度画像の特徴量とを正しく判別する場合に損失が小さくなる損失関数を用いて、損失を計算する。学習制御部208は、敵対損失計算部206が算出する損失が小さくなるように、特徴判別部205の機械学習モデルパラメータ値を調整する。したがって、特徴判別部205は、特徴判別部205が超解像特徴量と高解像度画像の特徴量とを正しく判別できるように調整される。
【0056】
例えば、特徴判別部205が、0から1までの値域を有する実数にて判別結果を出力するようにしてもよい。上記のように、特徴判別部205が、入力された特徴量が高解像度画像の特徴量である確率を出力するようにしてもよい。そして、敵対損失計算部206が、高解像度画像の特徴量が入力された場合に1を出力し、超解像特徴量が入力された場合に0を出力するように、敵対損失をバイナリクロスエントロピー(Binary Cross Entropy)にて算出するようにしてもよい。
【0057】
特徴判別部205の出力の「0」が超解像度特徴量を表し、「1」が高解像度特徴量を表す場合、学習制御部208は、特徴判別部205への入力が超解像度特徴量である場合に、特徴判別部205の出力が1に近付くように、特徴量変換部105の機械学習モデルパラメータ値を調整する。これにより、特徴量変換部105は、特徴判別部205を騙すように超解像特徴量を生成する。
【0058】
一方、学習制御部208は、特徴判別部205への入力が超解像度特徴量である場合に、特徴判別部205の出力が0に近付き、特徴判別部205への入力が高解像度画像の特徴量である場合に、特徴判別部205の出力が1に近付くように、特徴判別部205の機械学習モデルパラメータ値を調整する。すなわち、特徴判別部205は、超解像特徴量と高解像度画像の特徴量とを正しく判別できる可能性が高くなるように調整される。
【0059】
また、再構成損失計算部204は、超解像度特徴量と高解像度画像の特徴量とのベクトルまたはテンソルとしての類似度が高いほど小さくなる再構成損失を算出する(ステップS261)。学習制御部208は、再構成損失が小さくなるように特徴量変換部105の機械学習モデルパラメータ値を調整する。これにより、学習制御部208は、超解像度特徴量を高解像度画像の特徴量に近付けるように特徴量変換部105の機械学習モデルパラメータ値を調整する。
【0060】
再構成損失計算部204が算出する、超解像度特徴量と高解像度画像の特徴量とのベクトルまたはテンソルとしての類似度を示す指標値は、特定のものに限定されない。例えば、再構成損失計算部204が、超解像度特徴量と高解像度画像の特徴量とL2距離が小さいほど再構成損失が小さくなるように、再構成損失を計算するようにしてもよい。あるいは、再構成損失計算部204が、L2距離に代えてL1距離を用いて再構成損失を計算するようにしてもよい。
【0061】
また、類似度損失計算部207は、クラスラベルを用いた類似度損失を計算する。類似度損失計算部207が計算する類似度損失は、超解像度特徴量を用いたクラス分類結果が正解と一致する場合に値が小さくなるいろいろな損失とすることができ、特定のものに限定されない。
【0062】
例えば、特徴量変換部105の超解像度特徴量の出力層の後に、学習可能な1層の線形レイヤ(線形の層)を追加して、線形レイヤの出力をクラス数と同数のワンホットベクトル(One-hot Vector)としてもよい。学習制御部208は、線形レイヤが超解像度特徴量に基づいてクラス推定を行うように、線形レイヤに学習を行わせる。これにより、線形レイヤが出力するワンホットベクトルは、推定結果のクラスを示す。
【0063】
そして、類似度損失計算部207が、線形レイヤが出力するワンホットベクトルの要素をそれぞれソフトマックス関数(Softmax Function)に入力し、クラスラベルを用いてクロスエントロピーによる類似度損失を算出するようにしてもよい。
【0064】
だたし、類似度損失計算部207が用いる類似度損失は、特定のものに限定されない。例えば、類似度損失計算部207が、類似度損失としてL2ソフトマックス損失(L2 Softmax Loss)、コサイン損失(Cosine Loss)、ArcFace、CosFace、SphereFace、または、AdaCosなどを用いるようにしてもよい。
【0065】
また、上記の1層の線形レイヤの追加を行わず、類似度損失計算部207が、類似度損失としてトリプレット損失(Triplet Loss)、センターロス(Center Loss)、または、コントラスティブロス(Contrastive Loss)などを用いるようにしてもよい。
【0066】
ステップS251からS252までと、S261と、ステップS271とは並列実行されてもよい。
ステップS252、S261およびS271の後、損失関数計算部203は、敵対損失、再構成損失、および、類似度損失に基づくトータル損失関数値を計算する(ステップS261)。損失関数計算部203は、敵対損失の値が小さいほど損失関数値が小さくなり、再構成損失の値が小さいほど損失関数値が小さくなり、かつ、類似度損失の値が小さいほど損失関数値が小さくなる損失関数を用いて、損失関数値を算出する。例えば、損失関数計算部203は、トータル損失関数を計算するために各損失に係数をかけて和をとる。これらの係数の値は特に限定されない。
【0067】
ただし、損失関数計算部203が、敵対損失、再構成損失、および、類似度損失のうち何れか1つ、または2つのみを用いて損失関数値を計算するようにしてもよい。あるいは、損失関数計算部203が、敵対損失、再構成損失、および、類似度損失の何れも用いずに、他の方法で損失関数値を計算するようにしてもよい。
ステップS261の後、特徴量変換学習装置200は、図5の処理を終了する。
【0068】
図5の処理の終了後、学習制御部208は、誤差逆伝播法(Backpropagation)を用いて、特徴量変換部105のニューラルネットワークのパラメータの勾配を計算する(ステップS243)。
そして、学習制御部208は、計算した勾配を用いて、特徴量変換部105のパラメータの値を更新する(ステップS244)。ステップS244でのパラメータ値の更新は、特徴量変換部105の学習に該当する。
【0069】
例えば、学習制御部208は、損失関数値が最小になるように、パラメータ値の最適化を行う。学習制御部208が用いる最適化方法の例として、確率的勾配降下法(Stochastic Gradient Descent;SGD)、または、Adamを挙げることができるが、これらに限定されない。
【0070】
次に、特徴量変換学習装置200は、特徴判別部205の学習のための損失を計算する(ステップS245)。上述したように、特徴判別部205の学習では、敵対損失計算部206は、特徴判別部205が超解像特徴量と高解像度画像の特徴量とを正しく判別する場合に損失が小さくなる損失関数を用いて、損失を計算する。
【0071】
次に、学習制御部208は、誤差逆伝播法を用いて、特徴判別部205のニューラルネットワークのパラメータの勾配を計算する(ステップS246)。
そして、学習制御部208は、計算した勾配を用いて、特徴判別部205のパラメータの値を更新する(ステップS244)。ステップS244でのパラメータ値の更新は、特徴判別部205の学習に該当する。
【0072】
このように、学習制御部208は、特徴量変換部105と特徴判別部205とで交互にパラメータ値の最適化を行う。学習制御部208は、特徴量変換部105のパラメータ値の最適化を行う場合、特徴判別部205のパラメータ値を固定する。また、学習制御部208は、特徴判別部205のパラメータ値の最適化を行う場合、特徴量変換部105のパラメータ値を固定する。
【0073】
ステップS244の後、学習制御部208は、学習の終了条件が成立しているか否かを判定する(ステップS248)。ここでの学習の終了条件は、特定の条件に限定されない。例えば、学習制御部208が、ステップS212からS248までのループの繰り返し回数が所定の回数に達した場合に、終了条件が成立したと判定するようにしてもよい。
【0074】
あるいは、ステップS247でのパラメータ値の更新の後、特徴量変換学習装置200が、ループの途中で得られる評価データに基づいて、学習制御部208または損失関数計算部203が、超解像特徴量による照合精度を計算するようにしてもよい。そして、学習制御部208が、超解像特徴量による照合精度が所定の精度以上になった場合に、終了条件が成立したと判定するようにしてもよい。
【0075】
ステップS248で、終了条件が成立していないと学習制御部208が判定した場合(ステップS248:NO)、処理がステップS212へ戻る。この場合、特徴量変換学習装置200は、引き続き、特徴量変換部105および特徴判別部205の学習を行う。
一方、ステップS248で、終了条件が成立していると学習制御部208が判定した場合(ステップS248:YES)、特徴量変換学習装置200は、図4の処理を終了する。
【0076】
以上のように、画像バッチ取得部201は、高解像度画像を取得する。画像縮小部202は、高解像度画像を、高解像度画像よりも解像度が低い縮小画像に縮小する。画像拡大部103は、縮小画像を高解像度画像と同じ解像度の劣化画像に拡大する。特徴量抽出部104は、高解像度画像の特徴量、および、劣化画像の特徴量を抽出する。特徴量変換部105は、劣化画像の特徴量を変換して超解像特徴量を生成する。学習制御部208は、高解像度画像の特徴量と、超解像特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。ここでいう特徴量変換方法の学習は、特徴量の変換を行う機械学習モデルパラメータ値を調整することである。
【0077】
特徴量変換学習装置200では、特徴量変換部105の学習を行うことで、特徴量変換部105が、縮小画像を拡大した画像の特徴量を高解像度画像の特徴量に近づけることができる。学習済みの特徴量変換部105を用いる認証装置100が、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0078】
また、特徴判別部205は、高解像度画像の特徴量または超解像特徴量の入力を受けて、入力された特徴量が超解像特徴量か否かを判定する。損失関数計算部203は、特徴判別部205が、特徴量変換部105によって変換された特徴量とそれ以外の特徴量とを区別できない場合に損失が小さくなる損失関数に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0079】
特徴量変換学習装置200によれば、特徴量変換部105が、特徴判別部205が高解像度画像の特徴量と超解像特徴量との判別に失敗するように、高解像度画像の特徴量に近い超解像特徴量を出力することが期待される。これにより、学習済みの特徴量変換部105を用いる認証装置100が、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0080】
また、損失関数計算部203は、高解像度画像の特徴量と超解像特徴量との類似度の指標値を算出する。学習制御部208は、高解像度画像の特徴量と超解像特徴量とが類似するほど損失が小さくなる損失関数に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0081】
特徴量変換学習装置200によれば、特徴量変換部105が、高解像度画像の特徴量と類似する超解像特徴量を出力することが期待される。これにより、学習済みの特徴量変換部105を用いる認証装置100が、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0082】
また、学習制御部208は、超解像特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0083】
これにより、学習済みの特徴量変換部105を用いる認証装置100が、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0084】
また、画像縮小部202は、高解像度画像を、乱数を用いて決定したサイズに縮小して縮小画像を生成する。
特徴量変換学習装置200によれば、特徴量変換部105が、いろいろな解像度の画像から拡大された拡大画像に対して、高解像度画像の特徴量に近い超解像特徴量を出力できると期待される。これにより、学習済みの特徴量変換部105を用いる認証装置100が、いろいろな解像度の画像の入力に対して高精度に認証を行えることが期待される。
【0085】
<第3実施形態>
第3実施形態では、図1および図3の特徴量抽出部104の構成例について説明する。図1の認証装置100と、図3の特徴量変換学習装置200とが、同じ構成の特徴量抽出部104を備えることが好ましいが、認証装置100または特徴量変換学習装置200の何れか一方のみが第3実施形態に係る特徴量抽出部を備えるようにしてもよい。
【0086】
図6は、第3実施形態に係る特徴量抽出部104の構成例を示す図である。図6に示す構成で、特徴量抽出部104は、アテンション(Attention)処理部301を備える。図6に示す構成で、アテンション処理部301が直列に接続されている。先頭のアテンション処理部301が画像データの入力を受け、末尾のアテンション処理部301が、特徴量を出力する。特徴量抽出部104が備えるアテンション処理部301の個数は、1つ以上であればよい。
【0087】
ここでいうアテンションは、画像の部分またはそれに対応する特徴量を強調することである。強調された特徴量が認証結果に反映され易くなる。例えば、虹彩認証では、目の画像のうち特に虹彩の部分の特徴に基づいて認証を行うことが考えられる。そこで、アテンション処理部301が、特徴量抽出部104が目の画像から抽出する特徴量のうち、虹彩の部分に対応する特徴量を強調するようにしてもよい。このようにアテンション処理部301が画像の特徴的部分に対応する特徴量を強調することで、認証装置100の認証精度が向上すると期待される。アテンション処理部301は、アテンション処理手段の例に該当する。
上記のように、図6の特徴量抽出部104は、図1および図3の特徴量抽出部104の例に該当する。
【0088】
認証装置100または特徴量変換学習装置200において、特徴量抽出部104は、高解像度画像、および、拡大された低解像度画像のそれぞれから特徴量を抽出する。高解像度データを用いて事前に特徴量抽出部104の学習を行っておくことが好ましい。
【0089】
図6は、特徴量抽出部104がニューラルネットワークを用いて構成される場合の例を示しており、アテンション処理部301の各々がニューラルネットワークの層に該当する。ニューラルネットワークの各層でアテンションの処理を行うようにしてもよい。あるいは、ニューラルネットワークの一部の層のみでアテンションの処理を行うようにしてもよい。
あるいは、特徴量抽出の前処理または後処理として、アテンションの処理を行うようにしてもよい。
【0090】
図7は、アテンション処理部301の構成例を示す図である。図7に示す構成で、アテンション処理部301は、2次元畳み込み演算部311aおよび311bと、関数計算部312と、乗算部313とを備える。2次元畳み込み演算部311aと311bとを総称して、2次元畳み込み演算部311とも表記する。
【0091】
2次元畳み込み演算部311は、2次元行列の形式のデータに対して畳み込み演算を行う。2次元畳み込み演算部311aは、特徴量抽出のための畳み込み演算を行う。2次元畳み込み演算部311bは、2次元畳み込み演算部311aが抽出する特徴量に対するアテンションのためのフィルタリングとしての畳み込み演算を行う。
【0092】
関数計算部312は、2次元畳み込み演算部311bの出力に対して所定の関数を適用する。例えば、関数計算部312は、2次元畳み込み演算部311bの演算結果を示す2次元行列の形式のデータの各要素の値を、ソフトマックス(Softmax)関数を適用した値に置き換える。これにより、関数計算部312は、2次元畳み込み演算部311bが2次元畳み込み演算部311aの出力データから検出した部分を強調するための重み係数を算出する。また、関数計算部312による関数の適用は、ニューラルネットワークの活性化関数の計算にも該当する。
【0093】
乗算部313は、2次元畳み込み演算部311aの出力と、関数計算部312の出力とを、2次元行列の形式のデータの要素毎に乗算する。これにより、乗算部313は、2次元畳み込み演算部311aが抽出した特徴量に対して、関数計算部312が計算した重み係数による重み付けを行う。
アテンション処理部301が、アテンションの対象領域の検出方法を学習するようにしてもよい。具体的には、アテンション処理部301が、2次元畳み込み演算部311bのフィルタを、学習制御部208によって計算される損失を下げるように学習してもよい。
【0094】
図8は、アテンション処理部301の第1の変形例に係るアテンションブロック302の構成例を示す図である。図6に示す特徴量抽出部104が、アテンション処理部301に代えてアテンションブロック302を備えるようにしてもよい。図8に示す構成で、アテンションブロック302は、チャネル分離部321と、アテンション処理部301と、チャネル結合部322とを備える。
【0095】
図8に示す構成で、複数のアテンション処理部301が並列に配置されている。アテンション処理部301の各々は、チャネル分離部321からのデータの入力を受け、チャネル結合部322へデータを出力する。ただし、アテンションブロック302が備えるアテンション処理部301の個数は、1つ以上であればよい。
【0096】
チャネル分離部321は、アテンションブロック302への入力データをチャネル分離部321への入力データとして取得し、入力データまたはその一部のデータを、アテンション処理部301の各々に出力する。チャネル分離部321が行う処理は、ニューラルネットワークのチャネルを複数のブロックに分離する処理に該当する。
【0097】
チャネル分離部321が入力データからアテンション処理部301毎のデータを生成する方法は、特定の方法に限定されない。例えば、チャネル分離部321が、入力データをそのままアテンション処理部301の各々に出力するようにしてもよい。あるいは、チャネル分離部321が、入力データを元の画像の左、中央、右に対応するデータに分割するなど、画像における位置に基づいて分割し、それぞれのデータをアテンション処理部301に出力するようにしてもよい。また、チャネル分離部321が、入力データを元のチャネル数から複数のチャネルに分割するなど、チャネルにおける位置に基づいて分割し、それぞれのデータをアテンション処理部301に出力するようにしてもよい。
【0098】
アテンション処理部301の各々は、アテンション処理部301自らへの入力データから特徴量を抽出し、抽出した特徴量の一部を強調して出力する。アテンションブロック302のアテンション処理部301として、図7のアテンション処理部301を用いることができる。
【0099】
チャネル結合部322は、アテンション処理部301のそれぞれが出力するデータを1つのデータに纏める。チャネル結合部322がデータを纏める方法は、チャネル分離部321が1つのデータからアテンション処理部301毎のデータを生成する方法と対応するいろいろな方法とすることができる。
【0100】
例えば、チャネル分離部321が入力データをそのままアテンション処理部301のそれぞれに出力する場合、チャネル結合部322が、アテンション処理部301のそれぞれから出力される2次元行列の形式のデータを、要素毎に平均または合計することで1つのデータに纏めるようにしてもよい。
【0101】
また、チャネル分離部321が入力データを画像における位置に基づいて分割する場合、チャネル結合部322が、アテンション処理部301の各々からのデータを、画像における位置に応じて配置し結合することで1つのデータに纏めるようにしてもよい。
【0102】
ここで、虹彩認証に用いる画像では、特に虹彩部分および目周辺の部分に、個人を識別するための特徴が多く存在する。このように、個人を識別するための特徴が、認証対象の画像の複数の部分それぞれに存在することが考えられる。そこで、アテンションブロック302では、ニューラルネットワークのチャネルを複数ブロックに分離し、それぞれのブロックについてアテンションの処理を行い、ブロック毎の出力を結合する。これにより、アテンションブロック302では、虹彩、まぶた、および、まゆげなど、個人を識別するための特徴が多く存在する部分それぞれに注目して特徴量抽出を行うことができる。
【0103】
アテンションブロック302が、画像領域の代わりに、特徴ベクトルのチャネルに対して一部のチャネルを強調するようにしてもよい。
図9は、アテンション処理部301の第2の変形例に係るアテンション処理部303の構成例を示す図である。図8に示すアテンションブロック302が、アテンション処理部301に代えてアテンション処理部303を備えるようにしてもよい。
【0104】
図9に示す構成で、アテンション処理部303は、画像縮小部331と、線形演算部332と、関数計算部312と、乗算部313とを備える。
アテンション処理部303をアテンション処理部301と比較すると、アテンション処理部301の2次元畳み込み演算部311bが、アテンション処理部303では、画像縮小部331および線形演算部332に置き換わっている。すなわち、アテンション処理部303では、2次元畳み込み演算部311が、画像縮小部331と線形演算部332とに分かれて構成されている。それ以外の点では、アテンション処理部303は、アテンション処理部301と同様である。
【0105】
2つの画像縮小部331を区別する場合、2次元畳み込み演算部311aに対応する画像縮小部331を画像縮小部331aと表記し、2次元畳み込み演算部311bに対応する画像縮小部331を画像縮小部331bと表記する。2つの線形演算部332を区別する場合、2次元畳み込み演算部311aに対応する線形演算部332を線形演算部332aと表記し、2次元畳み込み演算部311bに対応する線形演算部332を線形演算部332bと表記する。
【0106】
画像縮小部331は、入力される画像を1x1のサイズに縮小する。つまり、画像縮小部331は、チャネルC、高さH、幅Wのサイズを持つテンソルを、チャネルC、高さ1、幅1のサイズのテンソルに縮小する。画像縮小部331が画像を縮小する方法は、特定の方法に限定されない。例えば、画像縮小部331が、平均化法を用いて画像を縮小するようにしてもよいが、これに限定されない。
【0107】
線形演算部332は、チャネルに対して線形演算を行う。線形演算部332の入力テンソルと出力テンソルは、それぞれが(C,1,1)のサイズを持つ。
線形演算部332bの出力に対して関数計算部312がソフトマックス関数を適用することで、チャネルを強調するための重みが計算される。
【0108】
図10は、アテンション処理部301の第3の変形例に係るアテンション処理部304の構成例を示す図である。図6に示す特徴量抽出部104が、アテンション処理部301に代えてアテンション処理部304を備えるようにしてもよい。
図10に示す構成で、アテンション処理部304は、2次元畳み込み演算部311aと、乗算部313と、アテンションマップ取得部341とを備える。2次元畳み込み演算部311aを、2次元畳み込み演算部311とも称する。
【0109】
2次元畳み込み演算部311aが行う処理は、アテンション処理部301の2次元畳み込み演算部311aの場合と同様である。乗算部313が行う処理は、アテンション処理部301の乗算部313の場合と同様である。
アテンションマップ取得部341は、アテンションマップを取得する。アテンションマップは、アテンション処理部304への入力データのうちアテンション処理部304が強調するべき部分を示すデータである。アテンション処理部304がアテンションマップを用いる場合、アテンションマップは、いわばアテンションの正解データであり、訓練データに含まれる。
【0110】
アテンション処理部304では、乗算部313は、2次元畳み込み演算部311aからの出力に対して、アテンションマップによる重み付けを行う。また、アテンション処理部304が、2次元畳み込み演算部311aにおける特徴量の抽出方法に加えて、その特徴量におけるアテンションによる強調方法も学習するようにしてもよい。例えば、アテンション処理部304が、訓練データから入力されたアテンションマップに温度係数Sを乗じてからソフトマックス関数に入力し、得られる関数値を乗算部313にて畳み込み演算部311の結果に乗算するようにしてもよい。この場合、温度係数Sは、学習によって調整されるパラメータであってもよい。
【0111】
以上のように、アテンション処理部301は、特徴量抽出対象の画像またはチャネルのうち特定の部分に対応する特徴量を強調する重み付けを行う。
これにより、認証装置100が、個人を識別するための特徴が多く存在する部分が強調された特徴量を用いて、認証を比較的高精度に行えると期待される。
【0112】
<第4実施形態>
図11は、特徴量抽出部104の変形例に係る特徴量抽出部114の構成例を示す図である。図1の認証装置100、および、図3の特徴量変換学習装置200の両方、または何れか一方が、特徴量抽出部104に代えて特徴量抽出部114を備えるようにしてもよい。
【0113】
図11に示す構成で、特徴量抽出部114は、第1特徴量抽出部114aと、第2特徴量抽出部114bとを備える。第1特徴量抽出部114aの出力が、特徴量変換部105に入力され、特徴量変換部105の出力が、第2特徴量抽出部114bに入力される。
第1特徴量抽出部114aと、第2特徴量抽出部114bとは、特徴量抽出部104を構成するニューラルネットワークを、層の間で2つに分けた部分ネットワークのそれぞれで構成される。
【0114】
図12は、特徴量抽出部104を構成するニューラルネットの階層構造の例を示す図である。
図12の例で、特徴量抽出部104は、複数の層を有するニューラルネットワークを用いて構成される。特徴量抽出部104を構成するニューラルネットワークの層が、前側から1つ以上の層のグループと、後ろ側から1つ以上の層のグループとにグループ分けされている。ここでいう前側は入力層の側である。後ろ側は出力層の側である。
【0115】
第1特徴量抽出部114aは、これら2つのグループのうち前側から1つ以上の層のグループに相当するニューラルネットワークを用いて構成される。第2特徴量抽出部114bは、これら2つのグループのうち後ろ側から1つ以上の層のグループに相当するニューラルネットワークを用いて構成される。
【0116】
第1特徴量抽出部114aの出力は、特徴量抽出部104における中間特徴量に相当する。第1特徴量抽出部114aに低解像度画像が画像データで入力される場合の第1特徴量抽出部114aの出力を、低解像度中間特徴量とも称する。
図11の構成で、特徴量変換部105は、低解像度中間特徴量の入力を受けて、入力された低解像度中間特徴量を変換する。この場合の特徴量変換部105の出力を超解像中間特徴量とも称する。
第2特徴量抽出部114bは、超解像中間特徴量の入力を受けてさらに特徴量抽出を行う。第2特徴量抽出部114bの出力は、図1の構成および図3の構成で特徴量変換部105が出力する超解像特徴量に相当する。
【0117】
このように、特徴量変換部105が、特徴量抽出部104を構成するニューラルネットワークが出力する特徴量に限らず、中間層での特徴量を用いて特徴超解像を行うようにしてもよい。例えば、VGG16は、13層の畳み込み層と3層の全結合層とからなる。これらの層のうち、畳み込み層の前側から2層目が出力する中間特徴量に対して特徴量変換部105が特徴超解像を行い、特徴量変換部105が出力する超解像中間特徴量が畳み込み層の前側から3層目に入力されるようにしてもよい。あるいは、畳み込み層の前側から4層目が出力する中間特徴量に対して特徴量変換部105が特徴超解像を行い、特徴量変換部105が出力する超解像中間特徴量が畳み込み層の前側から5層目に入力されるようにしてもよい。
【0118】
以上のように、特徴量変換部105は、特徴量抽出部が生成する中間特徴量に対して特徴量の変換を行う。
これにより、認証装置100は、特徴量抽出器への入力画像を超解像度化する画像超解像と、出力特徴を超解像度化する特徴超解像の間の効果を得ることができる。つまり、超解像する部分を特徴量変換部105への入力または出力に限定しないことにより、目的の拡大率に合わせてその拡大率での認証性能を最大化可能な中間特徴で特徴超解像することができる。この結果、特徴超解像をさらに高精度に行うことができる。
【0119】
<第5実施形態>
図13は、第5実施形態に係る認証装置の構成例を示す図である。図13に示す構成で、認証装置411は、認証対象画像取得部101と、比較用画像取得部102と、特徴量抽出部104と、特徴量変換部105と、特徴量比較部106とを備える。
【0120】
図13の各部のうち、図1の各部に対応して同様の機能を有する部分には、同一の符号(101、12、104、105、106)を付して、ここでは詳細な説明を省略する。
図1の認証装置100と図13の認証装置411とでは、認証に用いる画像が異なる。認証装置100が認証対象画像として低解像度画像を取得し、比較用画像として高解像度画像を取得する。これに対し、認証装置411は、認証対象画像として眼鏡着用時の虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の裸眼の虹彩の画像を取得する。なお、認証用画像と比較用画像の解像度は同程度の解像度であればよく、全く同じである必要はない。
【0121】
また、認証装置411は、認証装置100が備える画像拡大部103を備えていない。認証装置411では、認証対象画像取得部101は、取得する認証対象画像を特徴量抽出部104へ出力する。
それ以外の点では、認証装置411は認証装置100と同様である。
【0122】
第5実施形態の認証装置411では、特徴量抽出部104は、認証対象画像の特徴量を、裸眼の虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量抽出部104が、認証時に比較用画像の特徴量を抽出するようにしてもよい。あるいは、認証装置100が、比較用画像の特徴量を予め記憶しておくようにしてもよい。
第5実施形態の認証装置411では、特徴量変換部105は、眼鏡着用時の虹彩の画像の特徴量の入力を受けて、裸眼の虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。特徴量変換部105の機械学習パラメータ値は、眼鏡着用時の虹彩の画像の特徴量からの変換後の特徴量と、裸眼の虹彩の画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた学習によって調整される。この場合の、眼鏡着用時の虹彩の画像は第1学習用画像の例に該当し、裸眼の虹彩の画像は第2学習用画像の例に該当する。第6実施形態に係る特徴量変換学習装置412が、この学習を行う。
【0123】
以上のように、認証対象画像取得部101は、認証対象画像として眼鏡着用時の虹彩の画像を取得する。特徴量抽出部104は、認証対象画像の特徴量を、裸眼の虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部105は、眼鏡着用時の虹彩の画像である第1学習用画像の特徴量からの変換後の特徴量と、裸眼の虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の特徴量を変換する。特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0124】
第5実施形態に係る認証装置411によれば、眼鏡着用時の虹彩の画像の特徴量を、裸眼の虹彩の画像の特徴量に近付けることができると期待される。第5実施形態に係る認証装置411によれば、この点で、認証対象者が眼鏡を着用している場合でも、虹彩認証を比較的高精度に行えると期待される。
【0125】
<第6実施形態>
図14は、第6実施形態に係る特徴量変換学習装置の構成例を示す図である。第6実施形態の特徴量変換学習装置412は、第5実施形態の認証装置411の特徴量変換部105の学習を行う。
【0126】
図14に示す構成で、特徴量変換学習装置412は、画像バッチ取得部413と、特徴量抽出部104と、特徴量変換部105と、損失関数計算部203と、学習制御部208とを備える。損失関数計算部203は、再構成損失計算部204と、特徴判別部205と、敵対損失計算部206と、類似度損失計算部207とを備える。
図14の各部のうち、図3の各部に対応して同様の機能を有する部分には同一の符号(104、105、203-208)を付して、ここでは詳細な説明を省略する。
【0127】
図3の特徴量変換学習装置200と図14の特徴量変換学習装置412とでは、訓練データに含まれる画像が異なる。
特徴量変換学習装置200の画像バッチ取得部201は、高解像度画像と、その画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。
【0128】
これに対し、特徴量変換学習装置412の画像バッチ取得部413は、眼鏡着用時の虹彩の画像および裸眼の虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。眼鏡着用時の虹彩の画像および裸眼の虹彩の画像として、同一人物、かつ、同じ解像度の画像を用いる。
画像バッチ取得部413は、画像取得部の例に該当する。訓練データに含まれる裸眼の虹彩の画像は第1画像の例に該当し、眼鏡着用時の虹彩の画像は第2画像の例に該当する。
【0129】
また、特徴量変換学習装置412は、特徴量変換学習装置200が備える画像縮小部202と画像拡大部103とを備えていない。
画像バッチ取得部201は、眼鏡着用時の虹彩の画像と、裸眼の虹彩の画像とを、それぞれ特徴量抽出部104へ出力する。特徴量抽出部104は、眼鏡着用時の虹彩の画像の特徴量と、裸眼の虹彩の画像の特徴量とを抽出する。
裸眼の虹彩の画像の特徴量は、第1特徴量の例に該当する。眼鏡着用時の虹彩の画像の特徴量は、第2特徴量の例に該当する。
【0130】
特徴量変換部105は、眼鏡着用時の虹彩の画像の特徴量の入力を受けて、裸眼の虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。眼鏡着用時の虹彩の画像の特徴量からの変換後の特徴量は、第3特徴量の例に該当する。
損失関数計算部203は、特徴量変換部105による変換後の特徴量と、裸眼の虹彩の画像の特徴量とに基づく損失を計算する。
【0131】
学習制御部208は、損失関数計算部203が計算する損失に基づいて、特徴量変換部105、特徴判別部205それぞれの機械学習モデルパラメータ値を更新する。学習制御部208は、特徴量変換部105による変換後の特徴量と、裸眼の虹彩の画像の特徴量との相違が小さくなるように、上記の機械学習モデルパラメータ値を更新する。
【0132】
以上のように、画像バッチ取得部413は、裸眼の虹彩の画像である第1画像と、眼鏡着用時の虹彩の画像である第2画像とを取得する。特徴量抽出部104は、第1画像の特徴量である第1特徴量、および、第2画像の特徴量である第2特徴量を抽出する。特徴量変換部105は、第2特徴量を第3特徴量に変換する。学習制御部208は、第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0133】
第6実施形態に係る特徴量変換学習装置412によれば、特徴量変換部105に対して、眼鏡着用時の虹彩の画像の特徴量を、裸眼の虹彩の画像の特徴量に近付ける変換を行うように、学習を行わせることができる。認証装置411が、この特徴量変換部105を用いて認証を行うことで、認証対象者が眼鏡を着用している場合でも、虹彩認証を比較的高精度に行えると期待される。
【0134】
<第7実施形態>
図15は、第7実施形態に係る認証装置の構成例を示す図である。図15に示す構成で、認証装置411は、認証対象画像取得部101と、比較用画像取得部102と、特徴量抽出部104と、特徴量変換部105と、特徴量比較部106とを備える。
【0135】
第7実施形態に係る認証装置411の構成は、第5実施形態に係る認証装置411の構成と同様である。図15の各部のうち図13の各部に対応して同様の機能を有する部分には同一の符号(101、102、104、105、106、411)を付して、ここでは詳細な説明を省略する。
【0136】
第7実施形態では、認証装置411が認証に用いる画像が、第5実施形態の場合と異なる。第5実施形態の認証装置411は、認証対象画像として眼鏡着用時の虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の裸眼の虹彩の画像を取得する。これに対し、第7実施形態の認証装置411は、認証対象画像として斜めから撮影された虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の、正面から撮影された虹彩の画像を取得する。
【0137】
第7実施形態の認証装置411では、特徴量抽出部104は、認証対象画像の特徴量を、正面から撮影された虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量抽出部104が、認証時に比較用画像の特徴量を抽出するようにしてもよい。あるいは、認証装置100が、比較用画像の特徴量を予め記憶しておくようにしてもよい。
第7実施形態の認証装置411では、特徴量変換部105は、斜めから撮影された虹彩の画像の特徴量の入力を受けて、正面から撮影された虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。特徴量変換部105の機械学習パラメータ値は、斜めから撮影された虹彩の画像の特徴量からの変換後の特徴量と、正面から撮影された虹彩の画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた学習によって調整される。この場合の、斜めから撮影された虹彩の画像は第1学習用画像の例に該当し、正面から撮影された虹彩の画像は第2学習用画像の例に該当する。第8実施形態に係る特徴量変換学習装置412が、この学習を行う。
【0138】
以上のように、認証対象画像取得部101は、認証対象画像として斜めから撮影された虹彩の画像を取得する。特徴量抽出部104は、認証対象画像の特徴量を、正面から撮影された虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部105は、斜めから撮影された虹彩の画像である第1学習用画像の特徴量からの変換後の特徴量と、正面から撮影された虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の特徴量を変換する。特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0139】
第7実施形態に係る認証装置411によれば、斜めから撮影された虹彩の画像特徴量を、正面から撮影された虹彩の画像の特徴量に近付けることができると期待される。第7実施形態に係る認証装置411によれば、この点で、認証対象者の虹彩が斜めから撮影された画像を認証対象画像として用いる場合でも、虹彩認証を比較的高精度に行えると期待される。
【0140】
<第8実施形態>
図16は、第8実施形態に係る特徴量変換学習装置の構成例を示す図である。第8実施形態の特徴量変換学習装置412は、第7実施形態の認証装置411の特徴量変換部105の学習を行う。
【0141】
図16に示す構成で、特徴量変換学習装置412は、画像バッチ取得部413と、特徴量抽出部104と、特徴量変換部105と、損失関数計算部203と、学習制御部208とを備える。損失関数計算部203は、再構成損失計算部204と、特徴判別部205と、敵対損失計算部206と、類似度損失計算部207とを備える。
【0142】
第8実施形態に係る特徴量変換学習装置412の構成は、第6実施形態に係る特徴量変換学習装置412の構成と同様である。図16の各部のうち図14の各部に対応して同様の機能を有する部分には同一の符号(104、105、203-208、312、412、413)を付して、ここでは詳細な説明を省略する。
【0143】
第8実施形態では、特徴量変換学習装置412が取得する訓練データに含まれる画像が、第6実施形態の場合と異なる。
第6実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、眼鏡着用時の虹彩の画像および裸眼の虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。
【0144】
これに対し、第8実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、正面から撮影された虹彩の画像および斜めから撮影された虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。正面から撮影された虹彩の画像および斜めから撮影された虹彩の画像として、同一人物、かつ、同じ解像度の画像を用いる。
画像バッチ取得部413は、画像取得部の例に該当する。訓練データに含まれる正面から撮影された虹彩の画像は第1画像の例に該当し、斜めから撮影された虹彩の画像は第2画像の例に該当する。
【0145】
第8実施形態では、画像バッチ取得部201は、斜めから撮影された虹彩の画像と、正面から撮影された虹彩の画像とを、それぞれ特徴量抽出部104へ出力する。特徴量抽出部104は、斜めから撮影された虹彩の画像の特徴量と、正面から撮影された虹彩の画像の特徴量とを抽出する。
正面から撮影された虹彩の画像の特徴量は、第1特徴量の例に該当する。斜めから撮影された虹彩の画像の特徴量は、第2特徴量の例に該当する。
【0146】
特徴量変換部105は、斜めから撮影された虹彩の画像の特徴量の入力を受けて、正面から撮影された虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。斜めから撮影された虹彩の画像の特徴量からの変換後の特徴量は、第3特徴量の例に該当する。損失関数計算部203は、特徴量変換部105による変換後の特徴量と、正面から撮影された虹彩の画像の特徴量とに基づく損失を計算する。
【0147】
学習制御部208は、損失関数計算部203が計算する損失に基づいて、特徴量変換部105、特徴判別部205それぞれの機械学習モデルパラメータ値を更新する。学習制御部208は、特徴量変換部105による変換後の特徴量と、正面から撮影された虹彩の画像の特徴量との相違が小さくなるように、上記の機械学習モデルパラメータ値を更新する。
【0148】
以上のように、画像バッチ取得部413は、正面から撮影された虹彩の画像である第1画像と、斜めから撮影された虹彩の画像である第2画像とを取得する。特徴量抽出部104は、第1画像の特徴量である第1特徴量、および、第2画像の特徴量である第2特徴量を抽出する。特徴量変換部105は、第2特徴量を第3特徴量に変換する。学習制御部208は、第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0149】
第8実施形態に係る特徴量変換学習装置412によれば、特徴量変換部105に対して、斜めから撮影された虹彩の画像の特徴量を、正面から撮影された虹彩の画像の特徴量に近付ける変換を行うように、学習を行わせることができる。認証装置411が、この特徴量変換部105を用いて認証を行うことで、斜めから撮影された虹彩の画像を認証対象画像として用いる場合でも、虹彩認証を比較的高精度に行えると期待される。
【0150】
<第9実施形態>
図17は、第9実施形態に係る認証装置の構成例を示す図である。図17に示す構成で、認証装置411は、認証対象画像取得部101と、比較用画像取得部102と、特徴量抽出部104と、特徴量変換部105と、特徴量比較部106とを備える。
【0151】
第9実施形態に係る認証装置411の構成は、第5実施形態に係る認証装置411の構成と同様である。図17の各部のうち図13の各部に対応して同様の機能を有する部分には同一の符号(101、102、104、105、106、411)を付して、ここでは詳細な説明を省略する。
【0152】
第9実施形態では、認証装置411が認証に用いる画像が、第5実施形態の場合と異なる。第5実施形態の認証装置411は、認証対象画像として眼鏡着用時の虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の裸眼の虹彩の画像を取得する。これに対し、第9実施形態の認証装置411は、認証対象画像として可視光で撮影された虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の画像、かつ、近赤外線など可視光以外の光で撮影された虹彩の画像を取得する。なお、認証用の画像の波長は可視光に限定されず、紫外線や近赤外などの他の波長で撮影された画像であってもよい。また、入力画像の色を表すチャネル数も特に限定しない。
【0153】
第9実施形態の認証装置411では、特徴量抽出部104は、認証対象画像の特徴量を、可視光以外の光で撮影された虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量抽出部104が、認証時に比較用画像の特徴量を抽出するようにしてもよい。あるいは、認証装置100が、比較用画像の特徴量を予め記憶しておくようにしてもよい。
第9実施形態の認証装置411では、特徴量変換部105は、可視光で撮影された虹彩の画像の特徴量の入力を受けて、可視光以外の光で撮影された虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。特徴量変換部105の機械学習パラメータ値は、可視光で撮影された虹彩の画像の特徴量からの変換後の特徴量と、可視光以外の光で撮影された虹彩の画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた学習によって調整される。この場合の、可視光で撮影された虹彩の画像は第1学習用画像の例に該当し、可視光以外の光で撮影された虹彩の画像は第2学習用画像の例に該当する。第10実施形態に係る特徴量変換学習装置412が、この学習を行う。
【0154】
以上のように、認証対象画像取得部101は、認証対象画像として可視光で撮影された虹彩の画像を取得する。特徴量抽出部104は、認証対象画像の特徴量を、可視光以外の光で撮影された虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部105は、可視光で撮影された虹彩の画像である第1学習用画像の特徴量からの変換後の特徴量と、可視光以外の光で撮影された虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の特徴量を変換する。特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0155】
第9実施形態に係る認証装置411によれば、可視光で撮影された虹彩の画像特徴量を、可視光以外の光で撮影された虹彩の画像の特徴量に近付けることができると期待される。第7実施形態に係る認証装置411によれば、この点で、比較用画像が可視光以外の光で撮影されている場合でも、可視光で撮影された画像を用いて、虹彩認証を比較的高精度に行えると期待される。
【0156】
<第10実施形態>
図18は、第10実施形態に係る特徴量変換学習装置の構成例を示す図である。第10実施形態の特徴量変換学習装置412は、第9実施形態の認証装置411の特徴量変換部105の学習を行う。
第10実施形態でも、認証用の画像の波長は可視光に限定されず、紫外線や近赤外などの他の波長で撮影された画像であってもよい。また、入力画像の色を表すチャネル数も特に限定しない。
【0157】
図18に示す構成で、特徴量変換学習装置412は、画像バッチ取得部413と、特徴量抽出部104と、特徴量変換部105と、損失関数計算部203と、学習制御部208とを備える。損失関数計算部203は、再構成損失計算部204と、特徴判別部205と、敵対損失計算部206と、類似度損失計算部207とを備える。
【0158】
第10実施形態に係る特徴量変換学習装置412の構成は、第6実施形態に係る特徴量変換学習装置412の構成と同様である。図18の各部のうち図14の各部に対応して同様の機能を有する部分には同一の符号(104、105、203-208、312、412、413)を付して、ここでは詳細な説明を省略する。
【0159】
第10実施形態では、特徴量変換学習装置412が取得する訓練データに含まれる画像が、第6実施形態の場合と異なる。
第6実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、眼鏡着用時の虹彩の画像および裸眼の虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。
【0160】
これに対し、第10実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、可視光以外の光で撮影された虹彩の画像および可視光で撮影された虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。可視光以外の光で撮影された虹彩の画像および可視光で撮影された虹彩の画像として、同一人物、かつ、同じ解像度の画像を用いる。
画像バッチ取得部413は、画像取得部の例に該当する。訓練データに含まれる可視光以外の光で撮影された虹彩の画像は第1画像の例に該当し、可視光で撮影された虹彩の画像は第2画像の例に該当する。
【0161】
第10実施形態では、画像バッチ取得部201は、可視光で撮影された虹彩の画像と、可視光以外の光で撮影された虹彩の画像とを、それぞれ特徴量抽出部104へ出力する。特徴量抽出部104は、可視光で撮影された虹彩の画像の特徴量と、可視光以外の光で撮影された虹彩の画像の特徴量とを抽出する。
可視光以外の光で撮影された虹彩の画像の特徴量は、第1特徴量の例に該当する。可視光で撮影された虹彩の画像の特徴量は、第2特徴量の例に該当する。
【0162】
特徴量変換部105は、可視光で撮影された虹彩の画像の特徴量の入力を受けて、可視光以外の光で撮影された虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。可視光で撮影された虹彩の画像の特徴量からの変換後の特徴量は、第3特徴量の例に該当する。損失関数計算部203は、特徴量変換部105による変換後の特徴量と、可視光以外の光で撮影された虹彩の画像の特徴量とに基づく損失を計算する。
【0163】
学習制御部208は、損失関数計算部203が計算する損失に基づいて、特徴量変換部105、特徴判別部205それぞれの機械学習モデルパラメータ値を更新する。学習制御部208は、特徴量変換部105による変換後の特徴量と、可視光以外の光で撮影された虹彩の画像の特徴量との相違が小さくなるように、上記の機械学習モデルパラメータ値を更新する。
【0164】
以上のように、画像バッチ取得部413は、可視光以外の光で撮影された虹彩の画像である第1画像と、可視光で撮影された虹彩の画像である第2画像とを取得する。特徴量抽出部104は、第1画像の特徴量である第1特徴量、および、第2画像の特徴量である第2特徴量を抽出する。特徴量変換部105は、第2特徴量を第3特徴量に変換する。学習制御部208は、第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0165】
第10実施形態に係る特徴量変換学習装置412によれば、特徴量変換部105に対して、可視光で撮影された虹彩の画像の特徴量を、可視光以外の光で撮影された虹彩の画像の特徴量に近付ける変換を行うように、学習を行わせることができる。認証装置411が、この特徴量変換部105を用いて認証を行うことで、比較用画像が可視光以外の光で撮影されている場合でも、可視光で撮影された画像を用いて、虹彩認証を比較的高精度に行えると期待される。
【0166】
<第11実施形態>
図19は、第11実施形態に係る認証装置の構成例を示す図である。図19に示す構成で、認証装置411は、認証対象画像取得部101と、比較用画像取得部102と、特徴量抽出部104と、特徴量変換部105と、特徴量比較部106とを備える。
【0167】
第11実施形態に係る認証装置411の構成は、第5実施形態に係る認証装置411の構成と同様である。図19の各部のうち図13の各部に対応して同様の機能を有する部分には同一の符号(101、102、104、105、106、411)を付して、ここでは詳細な説明を省略する。
【0168】
第11実施形態では、認証装置411が認証に用いる画像が、第5実施形態の場合と異なる。第5実施形態の認証装置411は、認証対象画像として眼鏡着用時の虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の裸眼の虹彩の画像を取得する。これに対し、第11実施形態の認証装置411は、認証対象画像として画像のピントがぼけている虹彩の画像を取得し、比較用画像として認証対象画像と同じ解像度の、画像のピントが合っている虹彩の画像を取得する。
ピントが合っていることをピント位置とも称する。ピントがぼけていることをピント位置外とも称する。
【0169】
第11実施形態の認証装置411では、特徴量抽出部104は、認証対象画像の特徴量を、画像のピントが合っている虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量抽出部104が、認証時に比較用画像の特徴量を抽出するようにしてもよい。あるいは、認証装置100が、比較用画像の特徴量を予め記憶しておくようにしてもよい。
第9実施形態の認証装置411では、特徴量変換部105は、画像のピントがぼけている虹彩の画像の特徴量の入力を受けて、画像のピントが合っている虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。特徴量変換部105の機械学習パラメータ値は、画像のピントがぼけている虹彩の画像の特徴量からの変換後の特徴量と、画像のピントが合っている虹彩の画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた学習によって調整される。この場合の、画像のピントがぼけている虹彩の画像は第1学習用画像の例に該当し、画像のピントが合っている虹彩の画像は第2学習用画像の例に該当する。第12実施形態に係る特徴量変換学習装置412が、この学習を行う。
【0170】
以上のように、認証対象画像取得部101は、認証対象画像として画像のピントがぼけている虹彩の画像を取得する。特徴量抽出部104は、認証対象画像の特徴量を、画像のピントが合っている虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部105は、画像のピントがぼけている虹彩の画像である第1学習用画像の特徴量からの変換後の特徴量と、画像のピントが合っている虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の特徴量を変換する。特徴量比較部106は、特徴量変換部105による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0171】
第11実施形態に係る認証装置411によれば、画像のピントがぼけている虹彩の画像の特徴量を、画像のピントが合っている虹彩の画像の特徴量に近付けることができると期待される。第11実施形態に係る認証装置411によれば、この点で、画像のピントがぼけている虹彩の画像を認証対象画像として用いる場合でも、虹彩認証を比較的高精度に行えると期待される。
【0172】
<第12実施形態>
図20は、第12実施形態に係る特徴量変換学習装置の構成例を示す図である。第12実施形態の特徴量変換学習装置412は、第11実施形態の認証装置411の特徴量変換部105の学習を行う。
【0173】
図20に示す構成で、特徴量変換学習装置412は、画像バッチ取得部413と、特徴量抽出部104と、特徴量変換部105と、損失関数計算部203と、学習制御部208とを備える。損失関数計算部203は、再構成損失計算部204と、特徴判別部205と、敵対損失計算部206と、類似度損失計算部207とを備える。
【0174】
第12実施形態に係る特徴量変換学習装置412の構成は、第6実施形態に係る特徴量変換学習装置412の構成と同様である。図20の各部のうち図14の各部に対応して同様の機能を有する部分には同一の符号(104、105、203-208、312、412、413)を付して、ここでは詳細な説明を省略する。
【0175】
第12実施形態では、特徴量変換学習装置412が取得する訓練データに含まれる画像が、第6実施形態の場合と異なる。
第6実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、眼鏡着用時の虹彩の画像および裸眼の虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。
【0176】
これに対し、第12実施形態では、特徴量変換学習装置412の画像バッチ取得部413は、画像のピントがぼけている虹彩の画像および画像のピントが合っている虹彩の画像と、それらの画像のクラス分類における正解クラスを示すクラスラベルとの組合せが複数含まれる訓練データを取得する。画像のピントがぼけている虹彩の画像および画像のピントが合っている虹彩の画像として、同一人物、かつ、同じ解像度の画像を用いる。
画像バッチ取得部413は、画像取得部の例に該当する。訓練データに含まれる画像のピントが合っている虹彩の画像は第1画像の例に該当し、画像のピントがぼけている虹彩の画像は第2画像の例に該当する。
【0177】
第12実施形態では、画像バッチ取得部201は、画像のピントがぼけている虹彩の画像と、画像のピントが合っている虹彩の画像とを、それぞれ特徴量抽出部104へ出力する。特徴量抽出部104は、画像のピントがぼけている虹彩の画像の特徴量と、画像のピントが合っている虹彩の画像の特徴量とを抽出する。
画像のピントが合っている虹彩の画像の特徴量は、第1特徴量の例に該当する。画像のピントがぼけている虹彩の画像の特徴量は、第2特徴量の例に該当する。
【0178】
特徴量変換部105は、画像のピントがぼけている虹彩の画像の特徴量の入力を受けて、画像のピントが合っている虹彩の画像の特徴量との相違が小さくなるように、特徴量の変換を行う。画像のピントがぼけている虹彩の画像の特徴量からの変換後の特徴量は、第3特徴量の例に該当する。損失関数計算部203は、特徴量変換部105による変換後の特徴量と、画像のピントが合っている虹彩の画像の特徴量とに基づく損失を計算する。
【0179】
学習制御部208は、損失関数計算部203が計算する損失に基づいて、特徴量変換部105、特徴判別部205それぞれの機械学習モデルパラメータ値を更新する。学習制御部208は、特徴量変換部105による変換後の特徴量と、画像のピントが合っている虹彩の画像の特徴量との相違が小さくなるように、上記の機械学習モデルパラメータ値を更新する。
【0180】
以上のように、画像バッチ取得部413は、画像のピントが合っている虹彩の画像である第1画像と、画像のピントがぼけている虹彩の画像である第2画像とを取得する。特徴量抽出部104は、第1画像の特徴量である第1特徴量、および、第2画像の特徴量である第2特徴量を抽出する。特徴量変換部105は、第2特徴量を第3特徴量に変換する。学習制御部208は、第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部105に特徴量変換方法の学習を行わせる。
【0181】
第12実施形態に係る特徴量変換学習装置412によれば、特徴量変換部105に対して、画像のピントがぼけている虹彩の画像の特徴量を、画像のピントが合っている虹彩の画像の特徴量に近付ける変換を行うように、学習を行わせることができる。認証装置411が、この特徴量変換部105を用いて認証を行うことで、画像のピントがぼけている画像を認証対象画像として用いる場合でも、虹彩認証を比較的高精度に行えると期待される。
【0182】
<第13実施形態>
図21は、第13実施形態に係る特徴量変換学習装置の構成例を示す図である。図21に示す構成で、特徴量変換学習装置610は、画像取得部611と、画像縮小部612と、画像拡大部613と、特徴量抽出部614と、特徴量変換部615と、学習制御部616とを備える。
【0183】
かかる構成で、画像取得部611は、第1画像を取得する。画像縮小部612は、第1画像を、第1画像よりも解像度が低い第2画像に縮小する。画像拡大部613は、第2画像を第1画像と同じ解像度の第3画像に拡大する。特徴量抽出部614は、第1画像の特徴量である第1特徴量、および、第3画像の特徴量である第2特徴量を抽出する。特徴量変換部615は、第2特徴量を第3特徴量に変換する。学習制御部616は第1特徴量と第3特徴量との比較結果に基づいて、特徴量変換部615に特徴量変換方法の学習を行わせる。
【0184】
画像取得部611は、画像取得手段の例に該当する。画像縮小部612は、像縮小手段の例に該当する。画像拡大部613は、画像拡大手段の例に該当する。特徴量抽出部614は、特徴量抽出手段の例に該当する。特徴量変換部615は、特徴量変換手段の例に該当する。学習制御部616は学習制御手段の例に該当する。
【0185】
特徴量変換学習装置610では、特徴量変換部615の学習を行うことで、特徴量変換部615が、縮小画像を拡大した画像の特徴量を高解像度画像の特徴量に近づけることができる。学習済みの特徴量変換部615を用いる認証装置が、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0186】
<第14実施形態>
図22は、第14実施形態に係る認証装置の構成例を示す図である。図22に示す構成で、認証装置620は、認証対象画像取得部621と、画像拡大部622と、特徴量抽出部623と、特徴量変換部624と、特徴量比較部625とを備える。
【0187】
かかる構成で、認証対象画像取得部621は、認証対象画像を取得する。画像拡大部622は、認証対象画像を拡大する。特徴量抽出部623は、認証対象画像の拡大画像の特徴量を、認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量変換部624は、学習用画像の特徴量からの変換後の特徴量と、学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の拡大画像の特徴量を変換する。特徴量比較部625は、特徴量変換部624による変換後の特徴量と、比較用画像の特徴量とを比較する。
【0188】
認証対象画像取得部621は、認証対象画像取得手段の例に該当する。画像拡大部622は、画像拡大手段の例に該当する。特徴量抽出部623は、特徴量抽出手段の例に該当する。特徴量変換部624は、特徴量変換手段の例に該当する。特徴量比較部625は、特徴量比較手段の例に該当する。
【0189】
認証装置620によれば、低解像度画像を拡大して特徴量を抽出し、抽出した特徴量を変換することで、低解像度画像である認証対象画像の特徴量として、高解像度画像である比較用画像の特徴量と比較可能な特徴量を得られる。認証装置620によれば、この点で、入力画像が低解像度画像であっても認証を行うことができる。
【0190】
また、特徴量変換部624が行う特徴量の変換によって、拡大された認証対象画像の特徴量から、認証対象画像がより高解像度に撮影された場合の特徴量に近付くことが期待される。認証装置620によれば、この点で、認証を高精度に行えると期待される。
また、認証装置620によれば、低解像度画像を用いて虹彩認証を行うことができる。これにより、認証装置620では、高解像度のカメラを必要とせずに、1つの顔画像を用いて、顔認証と虹彩認証とを併用することができ、認証精度の向上が期待される。
【0191】
<第15実施形態>
図23は、第15実施形態に係る特徴量変換学習方法における処理の手順の例を示すフローチャートである。図23に示す特徴量変換学習方法は、画像を取得すること(ステップS611)と、画像を縮小すること(ステップS612)と、画像を拡大すること(ステップS613)と、特徴量を抽出すること(ステップS614)と、特徴量を変換すること(ステップS615)と、学習を制御すること(ステップS616)とを含む。
【0192】
画像を取得すること(ステップS611)では、第1画像を取得する。画像を縮小すること(ステップS612)では、第1画像を、第1画像よりも解像度が低い第2画像に縮小する。画像を拡大すること(ステップS613)では、第2画像を第1画像と同じ解像度の第3画像に拡大する。特徴量を抽出すること(ステップS614)では、第1画像の特徴量である第1特徴量、および、第3画像の特徴量である第2特徴量を抽出する。特徴量を変換すること(ステップS615)では、第2特徴量を第3特徴量に変換する。学習を制御すること(ステップS616)では、第1特徴量と第3特徴量との比較結果に基づいて、第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行う。
【0193】
図23に示す特徴量変換学習方法によれば、特徴量変換方法の学習を行うことで、特徴量変換によって、縮小画像を拡大した画像の特徴量を高解像度画像の特徴量に近づけることができる。学習済みの特徴量変換方法を用いる認証において、低解像度画像の入力を受けた場合でも比較的高精度に認証を行えることが期待される。
【0194】
<第16実施形態>
図24は、第16実施形態に係る認証方法における処理の手順の例を示すフローチャートである。図24に示す認証方法は、認証対象画像を取得すること(ステップS621)と、画像を拡大すること(ステップS622)と、特徴量を抽出すること(ステップS623)と、特徴量を変換すること(ステップS624)と、特徴量を比較すること(ステップS625)とを含む。
【0195】
認証対象画像を取得すること(ステップS621)では、認証対象画像を取得する。画像を拡大すること(ステップS622)では、認証対象画像を拡大する。特徴量を抽出すること(ステップS623)では、認証対象画像の拡大画像の特徴量を、認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する。特徴量を変換すること(ステップS624)では、学習用画像の特徴量からの変換後の特徴量と、学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、認証対象画像の拡大画像の特徴量を変換する。特徴量を比較すること(ステップS625)では、認証対象画像の拡大画像の特徴量からの変換後の特徴量と、比較用画像の特徴量とを比較する。
【0196】
図24に示す認証方法によれば、低解像度画像を拡大して特徴量を抽出し抽出した特徴量を変換することで、低解像度画像である認証対象画像の特徴量として、高解像度画像である比較用画像の特徴量と比較可能な特徴量を得られる。図24に示す認証方法によれば、この点で、入力画像が低解像度画像であっても認証を行うことができる。
【0197】
また、特徴量の変換によって、拡大された認証対象画像の特徴量から、認証対象画像がより高解像度に撮影された場合の特徴量に近付くことが期待される。図24に示す認証方法によれば、この点で、認証を高精度に行えると期待される。
また、図24に示す認証方法によれば、低解像度画像を用いて虹彩認証を行うことができる。これにより、認証装置100では、高解像度のカメラを必要とせずに、1つの顔画像を用いて、顔認証と虹彩認証とを併用することができ、認証精度の向上が期待される。
【0198】
<第17実施形態>
第17実施形態に係る認証装置620の構成は、第14実施形態に係る認証装置620の構成と同様である。
第17実施形態に係る認証装置620はさらに高解像度画像の特徴量または超解像特徴量の入力を受けて、入力された特徴量が超解像特徴量か否かを判定する特徴判別部を備える。かかる構成で、特徴判別部が、特徴量変換部615によって変換された特徴量とそれ以外の特徴量とを区別できない場合に損失が小さくなる損失関数に基づいて、特徴量変換部615に特徴量変換方法の学習を行わせる。
【0199】
<第18実施形態>
第18実施形態に係る認証装置620の構成は、第14実施形態または第17実施形態に係る認証装置620の構成と同様である。
第18実施形態に係る認証装置620では、学習制御部616は、高解像度画像の特徴量と超解像特徴量とが類似するほど損失が小さくなる損失関数に基づいて、特徴量変換部615に特徴量変換方法の学習を行わせる。
【0200】
<第19実施形態>
第19実施形態に係る認証装置620の構成は、第14実施形態、第17実施形態または第18実施形態に係る認証装置620の構成と同様である。
第19実施形態に係る認証装置620では、学習制御部616は、超解像特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数に基づいて、特徴量変換部615に特徴量変換方法の学習を行わせる。
【0201】
<第20実施形態>
第20実施形態に係る認証装置620の構成は、第14実施形態、第17実施形態、第18実施形態または第19実施形態に係る認証装置620の構成と同様である。
第20実施形態に係る認証装置620では、画像縮小部612は、高解像度画像を、乱数を用いて決定したサイズに縮小して縮小画像を生成する。
【0202】
図25は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図25に示す構成において、コンピュータ700は、CPU(Central Processing Unit、中央処理装置)710と、主記憶装置720と、補助記憶装置730と、インタフェース740とを備える。
【0203】
上記の認証装置100、特徴量変換学習装置200、認証装置411、特徴量変換学習装置412、特徴量変換学習装置610、および、認証装置620のうち何れか1つ以上またはその一部が、コンピュータ700に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。また、CPU710は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置720に確保する。各装置と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。
【0204】
認証装置100がコンピュータ700に実装される場合、認証対象画像取得部101、比較用画像取得部102、画像拡大部103、特徴量抽出部104、特徴量変換部105、および、特徴量比較部106の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0205】
また、CPU710は、プログラムに従って、認証装置100の処理のための記憶領域を主記憶装置720に確保する。認証装置100と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。認証装置100とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0206】
特徴量変換学習装置200がコンピュータ700に実装される場合、画像バッチ取得部201、画像縮小部202、画像拡大部103、特徴量抽出部104、特徴量変換部105、損失関数計算部203、学習制御部208、および、それらの各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0207】
また、CPU710は、プログラムに従って、特徴量変換学習装置200の処理のための記憶領域を主記憶装置720に確保する。特徴量変換学習装置200と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。特徴量変換学習装置200とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0208】
認証装置411がコンピュータ700に実装される場合、認証対象画像取得部101、比較用画像取得部102、特徴量抽出部104、特徴量変換部105、および、特徴量比較部106の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0209】
また、CPU710は、プログラムに従って、認証装置411の処理のための記憶領域を主記憶装置720に確保する。認証装置411と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。認証装置411とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0210】
特徴量変換学習装置412がコンピュータ700に実装される場合、画像バッチ取得部413、特徴量抽出部104、特徴量変換部105、損失関数計算部203、学習制御部208、および、それらの各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0211】
また、CPU710は、プログラムに従って、特徴量変換学習装置412の処理のための記憶領域を主記憶装置720に確保する。特徴量変換学習装置412と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。特徴量変換学習装置412とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0212】
特徴量変換学習装置610がコンピュータ700に実装される場合、画像取得部611、画像縮小部612、画像拡大部613、特徴量抽出部614、特徴量変換部615、および、学習制御部616の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0213】
また、CPU710は、プログラムに従って、特徴量変換学習装置610の処理のための記憶領域を主記憶装置720に確保する。特徴量変換学習装置610と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。特徴量変換学習装置610とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0214】
認証装置620がコンピュータ700に実装される場合、認証対象画像取得部621、画像拡大部622、特徴量抽出部623、特徴量変換部624、および、特徴量比較部625の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0215】
また、CPU710は、プログラムに従って、認証装置620の処理のための記憶領域を主記憶装置720に確保する。認証装置620と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。認証装置620とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0216】
なお、認証装置100、特徴量変換学習装置200、認証装置411、特徴量変換学習装置412、特徴量変換学習装置610、および、認証装置620が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0217】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0218】
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下には限定されない。
【0219】
(付記1)
第1画像を取得する画像取得手段と、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小する画像縮小手段と、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大する画像拡大手段と、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
(付記2)
前記第1特徴量または前記第3特徴量の入力を受けて、入力された特徴量が、特徴量変換手段によって変換された特徴量か否かを判定する特徴判別手段をさらに備え、
前記学習制御手段は、前記特徴判別手段が、特徴量変換手段によって変換された特徴量とそれ以外の特徴量とを区別できない場合に損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
付記1に記載の特徴量変換学習装置。
(付記3)
前記学習制御手段は、前記第1特徴量と前記第3特徴量とが類似するほど損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
付記1または付記2に記載の特徴量変換学習装置。
(付記4)
前記学習制御手段は、前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる、
付記1から3の何れか一つに記載の特徴量変換学習装置。
(付記5)
前記画像縮小手段は、前記第1画像を、乱数を用いて決定したサイズに縮小して前記第2画像を生成する
付記1から4の何れか一つに記載の特徴量変換学習装置。
(付記6)
前記特徴量抽出手段は、
特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段
を備える、付記1から5の何れか一つに記載の特徴量変換学習装置。
(付記7)
前記特徴量変換手段は、前記特徴量抽出手段が生成する中間特徴量に対して特徴量の変換を行う、
付記1から6の何れか一つに記載の特徴量変換学習装置。
(付記8)
認証対象画像を取得する認証対象画像取得手段と、
前記認証対象画像を拡大する画像拡大手段と、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
(付記9)
裸眼の虹彩の画像である第1画像と、眼鏡着用時の前記虹彩の画像である第2画像とを取得する画像取得手段と、
前記第1画像の特徴量である第1特徴量、および、前記第2画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
(付記10)
認証対象画像として眼鏡着用時の虹彩の画像を取得する認証対象画像取得手段と、
前記認証対象画像の特徴量を、裸眼の虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
眼鏡着用時の虹彩の画像である第1学習用画像の特徴量からの変換後の特徴量と、裸眼の虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
(付記11)
虹彩を正面から撮影した画像である第1画像と、前記虹彩を斜めから撮影した画像である第2画像とを取得する画像取得手段と、
前記第1画像の特徴量である第1特徴量、および、前記第2画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
(付記12)
認証対象画像として虹彩を斜めから撮影した画像を取得する認証対象画像取得手段と、
前記認証対象画像の特徴量を、虹彩を正面から撮影した画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
虹彩を斜めから撮影した画像である第1学習用画像の特徴量からの変換後の特徴量と、虹彩を正面から撮影した画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
(付記13)
可視光以外の光で虹彩を撮影した画像である第1画像と、可視光で前記虹彩を撮影した画像である第2画像とを取得する画像取得手段と、
前記第1画像の特徴量である第1特徴量、および、前記第2画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
(付記14)
認証対象画像として可視光で虹彩を撮影した画像を取得する認証対象画像取得手段と、
前記認証対象画像の特徴量を、可視光以外の光で虹彩を撮影した画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
可視光で虹彩を撮影した画像である第1学習用画像の特徴量からの変換後の特徴量と、可視光以外の光で虹彩を撮影した画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
(付記15)
ピントが合った状態で撮影された虹彩の画像である第1画像と、ピントがぼけた状態で撮影された虹彩の画像である第2画像とを取得する画像取得手段と、
前記第1画像の特徴量である第1特徴量、および、前記第2画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備える特徴量変換学習装置。
(付記16)
認証対象画像としてピントがぼけた状態で撮影された虹彩の画像を取得する認証対象画像取得手段と、
前記認証対象画像の特徴量を、ピントが合った状態で撮影された虹彩の画像である比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
ピントがぼけた状態で虹彩が撮影された画像である第1学習用画像の特徴量からの変換後の特徴量と、ピントが合った状態で撮影された虹彩の画像である第2学習用画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備える認証装置。
(付記17)
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を含む特徴量変換学習方法。
(付記18)
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を含む認証方法。
(付記19)
コンピュータに、
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を実行させるためプログラムを記録する記録媒体。
(付記20)
コンピュータに、
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を実行させるためプログラムを記録する記録媒体。
【産業上の利用可能性】
【0220】
この開示は、特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法および記録媒体に適用してもよい。
【符号の説明】
【0221】
100、411、620 認証装置
101 認証対象画像取得部
102 比較用画像取得部
103、613、622 画像拡大部
104、114、614、623 特徴量抽出部
105、615、624 特徴量変換部
106、625 特徴量比較部
114a 第1特徴量抽出部
114b 第2特徴量抽出部
200、412、610 特徴量変換学習装置
201、413 画像バッチ取得部
202、612 画像縮小部
203 損失関数計算部
204 再構成損失計算部
205 特徴判別部
206 敵対損失計算部
207 類似度損失計算部
208、616 学習制御部
301、303、304 アテンション処理部
302 アテンションブロック
311、311a、311b 2次元畳み込み演算部
312 関数計算部
313 乗算部
321 チャネル分離部
322 チャネル結合部
341 アテンションマップ取得部
611 画像取得部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
【手続補正書】
【提出日】2025-01-07
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
第1画像を取得する画像取得手段と、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小する画像縮小手段と、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大する画像拡大手段と、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、
前記第2特徴量を第3特徴量に変換する特徴量変換手段と、
前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、
を備え
前記特徴量抽出手段は、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段を備える、
特徴量変換学習装置。
【請求項2】
前記特徴量変換手段は、前記特徴量抽出手段が生成する中間特徴量に対して特徴量の変換を行う、
請求項1に記載の特徴量変換学習装置。
【請求項3】
認証対象画像を取得する認証対象画像取得手段と、
前記認証対象画像を拡大する画像拡大手段と、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換する特徴量変換手段と、
前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、
を備え
前記特徴量抽出手段は、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段を備える、
認証装置。
【請求項4】
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を含み、
前記第1特徴量、および、前記第3特徴量を抽出することは、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを含む、
特徴量変換学習方法。
【請求項5】
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を含み、
前記拡大画像の特徴量を抽出することは、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを含む、
認証方法。
【請求項6】
コンピュータに、
第1画像を取得することと、
前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、
前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、
前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、
前記第2特徴量を第3特徴量に変換することと、
前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、
を実行させ
前記第1特徴量、および、前記第3特徴量を抽出することにおいて、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを実行させる
ためプログラム。
【請求項7】
コンピュータに、
認証対象画像を取得することと、
前記認証対象画像を拡大することと、
前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、
学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、
前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、
を実行させ
前記拡大画像の特徴量を抽出することにおいて、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを実行させる
ためプログラム。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】変更
【補正の内容】
【0001】
この開示は、特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法およびプログラムに関する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正の内容】
【0005】
この開示の目的の一例は、上述した課題を解決することのできる特徴量変換学習装置、認証装置、特徴量変換学習方法、認証方法およびプログラムを提供することである。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正の内容】
【0006】
この開示の第一の態様によれば、特徴量変換学習装置は、第1画像を取得する画像取得手段と、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小する画像縮小手段と、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大する画像拡大手段と、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出する特徴量抽出手段と、前記第2特徴量を第3特徴量に変換する特徴量変換手段と、前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記特徴量変換手段に特徴量変換方法の学習を行わせる学習制御手段と、を備え、前記特徴量抽出手段は、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段を備える。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】
この開示の第二の態様によれば、認証装置は、認証対象画像を取得する認証対象画像取得手段と、前記認証対象画像を拡大する画像拡大手段と、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出する特徴量抽出手段と、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換する特徴量変換手段と、前記特徴量変換手段による変換後の特徴量と、前記比較用画像の特徴量とを比較する特徴量比較手段と、を備え、前記特徴量抽出手段は、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うアテンション処理手段を備える。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
この開示の第三の態様によれば、特徴量変換学習方法は、第1画像を取得することと、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、前記第2特徴量を第3特徴量に変換することと、前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、を含み、前記第1特徴量、および、前記第3特徴量を抽出することは、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを含む。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0009
【補正方法】変更
【補正の内容】
【0009】
この開示の第四の態様によれば、認証方法は、認証対象画像を取得することと、前記認証対象画像を拡大することと、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、を含み、前記拡大画像の特徴量を抽出することは、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを含む。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正の内容】
【0010】
この開示の第五の態様によれば、プログラムは、コンピュータに、第1画像を取得することと、前記第1画像を、前記第1画像よりも解像度が低い第2画像に縮小することと、前記第2画像を前記第1画像と同じ解像度の第3画像に拡大することと、前記第1画像の特徴量である第1特徴量、および、前記第3画像の特徴量である第2特徴量を抽出することと、前記第2特徴量を第3特徴量に変換することと、前記第3特徴量に基づくクラス分類によるクラスが正解のクラスと一致する場合に損失が小さくなる損失関数を用いて、前記第1特徴量と前記第3特徴量との比較結果に基づいて、前記第2特徴量を第3特徴量に変換する特徴量変換方法の学習を行うことと、を実行させ、前記第1特徴量、および、前記第3特徴量を抽出することにおいて、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを実行させるためプログラムである。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正の内容】
【0011】
この開示の第六の態様によれば、プログラムは、認証対象画像を取得することと、前記認証対象画像を拡大することと、前記認証対象画像の拡大画像の特徴量を、前記認証対象画像よりも解像度が高い比較用画像に対する特徴量抽出方法と同じ方法で抽出することと、学習用画像の特徴量からの変換後の特徴量と、前記学習用画像が縮小された後拡大された劣化画像の特徴量との相違が小さいほど値が小さくなる損失関数を用いた、特徴量変換方法の学習結果に基づいて、前記認証対象画像の拡大画像の特徴量を変換することと、前記認証対象画像の拡大画像の特徴量からの変換後の特徴量と、前記比較用画像の特徴量とを比較することと、を実行させ
前記拡大画像の特徴量を抽出することにおいて、特徴量抽出対象の画像のうち特定の部分に対応する特徴量を強調する重み付けを行うことを実行させるためプログラムである。