IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7435907画像マッチング装置、制御方法、及びプログラム
<>
  • 特許-画像マッチング装置、制御方法、及びプログラム 図1
  • 特許-画像マッチング装置、制御方法、及びプログラム 図2
  • 特許-画像マッチング装置、制御方法、及びプログラム 図3
  • 特許-画像マッチング装置、制御方法、及びプログラム 図4
  • 特許-画像マッチング装置、制御方法、及びプログラム 図5
  • 特許-画像マッチング装置、制御方法、及びプログラム 図6
  • 特許-画像マッチング装置、制御方法、及びプログラム 図7
  • 特許-画像マッチング装置、制御方法、及びプログラム 図8
  • 特許-画像マッチング装置、制御方法、及びプログラム 図9
  • 特許-画像マッチング装置、制御方法、及びプログラム 図10
  • 特許-画像マッチング装置、制御方法、及びプログラム 図11
  • 特許-画像マッチング装置、制御方法、及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-13
(45)【発行日】2024-02-21
(54)【発明の名称】画像マッチング装置、制御方法、及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240214BHJP
   G06F 16/587 20190101ALI20240214BHJP
【FI】
G06T7/00 350C
G06F16/587
G06T7/00 640
【請求項の数】 10
(21)【出願番号】P 2023511869
(86)(22)【出願日】2020-08-25
(65)【公表番号】
(43)【公表日】2023-09-06
(86)【国際出願番号】 JP2020031939
(87)【国際公開番号】W WO2022044104
(87)【国際公開日】2022-03-03
【審査請求日】2023-02-15
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】ロドリゲス ロイストン
(72)【発明者】
【氏名】谷 真宏
【審査官】岡本 俊威
(56)【参考文献】
【文献】特開2017-146907(JP,A)
【文献】特開2018-194950(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06F 16/587
(57)【特許請求の範囲】
【請求項1】
地上画像を取得し、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとが含まれる地上特徴マップを生成する地上特徴抽出部と、
空撮画像を取得し、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとが含まれる空撮特徴マップを生成する空撮特徴抽出部と、
前記地上特徴マップと前記空撮特徴マップとに基づいて前記地上画像と前記空撮画像との間の類似度を表す類似スコアを算出、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定する判定部とを有する画像マッチング装置。
【請求項2】
前記類似スコアの算出は、前記地上特徴マップに含まれる複数の特徴マップのコンカチネーションと前記空撮特徴マップに含まれる複数の特徴マップのコンカチネーションとの類似度を前記類似スコアとして算出することを含む、請求項1に記載の画像マッチング装置。
【請求項3】
前記類似スコアの算出は、
前記地上特徴マップに含まれる複数の特徴マップと前記空撮特徴マップに含まれる複数の特徴マップとを組み合わせて得られる複数のペアそれぞれについて類似度を算出することと、
前記算出された類似度の最大値を前記類似スコアとして利用することとを含む、請求項1に記載の画像マッチング装置。
【請求項4】
前記類似スコアの算出は、
前記地上特徴マップに含まれる複数の特徴マップと前記空撮特徴マップに含まれる複数の特徴マップとを組み合わせて得られる複数のペアそれぞれについて類似度を算出することと、
前記算出された類似度のうちのいくつか又は全ての統計値を前記類似スコアとして利用することとを含む、請求項1に記載の画像マッチング装置。
【請求項5】
2つのデータの前記類似度は、前記2つのデータの間の距離、前記2つのデータの間のコサイン類似度、又は、前記2つのデータを2つの入力データの類似度を出力するように訓練されたニューラルネットワークに対して入力することで得られる類似度である、請求項2から4いずれか一項に記載の画像マッチング装置。
【請求項6】
地上画像を取得し、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとが含まれる地上特徴マップを生成することと、
空撮画像を取得し、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとが含まれる空撮特徴マップを生成することと、
前記地上特徴マップと前記空撮特徴マップとに基づいて前記地上画像と前記空撮画像との間の類似度を表す類似スコアを算出、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定することを含む、コンピュータによって実行される制御方法。
【請求項7】
前記類似スコアの算出は、前記地上特徴マップに含まれる複数の特徴マップのコンカチネーションと前記空撮特徴マップに含まれる複数の特徴マップのコンカチネーションとの類似度を前記類似スコアとして算出することを含む、請求項6に記載の制御方法。
【請求項8】
前記類似スコアの算出は、
前記地上特徴マップに含まれる複数の特徴マップと前記空撮特徴マップに含まれる複数の特徴マップとを組み合わせて得られる複数のペアそれぞれについて類似度を算出することと、
前記算出された類似度の最大値を前記類似スコアとして利用することとを含む、請求項6に記載の制御方法。
【請求項9】
前記類似スコアの算出は、
前記地上特徴マップに含まれる複数の特徴マップと前記空撮特徴マップに含まれる複数の特徴マップとを組み合わせて得られる複数のペアそれぞれについて類似度を算出することと、
前記算出された類似度のうちのいくつか又は全ての統計値を前記類似スコアとして利用することとを含む、請求項6に記載の制御方法。
【請求項10】
地上画像を取得し、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとが含まれる地上特徴マップを生成することと、
空撮画像を取得し、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとが含まれる空撮特徴マップを生成することと、
前記地上特徴マップと前記空撮特徴マップとに基づいて前記地上画像と前記空撮画像との間の類似度を表す類似スコアを算出、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定すること、をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は全体として、画像マッチング、特に、地上画像と空撮画像とのマッチングに関する。
【背景技術】
【0002】
グラウンド・トゥー・エアリアル・クロスビューマッチング(地上画像と空撮画像のマッチング)を行うコンピュータシステムが開発されている。例えば、非特許文献1は、比較すべき地上画像と空撮画像から特徴量を抽出するための CNN(Convolutional Neural Network)のセットを開示している。具体的には、一つの CNN が、地上画像とそれに対応する方向情報を取得して、地上画像と方向情報が含まれる混合信号から結合特徴量を算出する。他方の CNN が、空撮画像とそれに対応する方向情報を取得して、空撮画像と方向情報が含まれる混合信号から結合特徴量を算出する。そして、算出された結合特徴量に基づいて、地上画像が空撮画像とマッチするか否かを判定する。
【先行技術文献】
【非特許文献】
【0003】
【文献】Liu Liu 及び Hongdong Li、「Lending Orientation to Neural Networks for Cross-view Geo-localization」、Computer Research Repository、arXiv:1903.12351、2019年3月29日
【文献】Ashish Shinha 及び Jose Dolz、「Multi-scale self-guided attention for medical image segmentation」、Computer Research Repository、arXiv:1906.02849、2019年6月7日
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の発明者は、グラウンド・トゥー・エアリアル・クロスビューマッチングの精度を向上させるために、アテンションマップの利用を検討した。非特許文献2は、アテンションマップを利用する CNN を開示するが、医療画像セグメンテーションの精度向上を目的としている。
【0005】
グラウンド・トゥー・エアリアル・クロスビューマッチングの精度を向上する技術を提供することである。
【課題を解決するための手段】
【0006】
本開示が提供する画像マッチング装置は、少なくとも一つのプロセッサと、命令が格納されている記憶要素とを有する。前記少なくとも一つのプロセッサは、前記命令を実行することにより、地上画像と空撮画像を取得し、前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定する。
【0007】
本開示の制御方法はコンピュータによって実行される。当該制御方法は、地上画像と空撮画像を取得し、前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定することを含む。
【0008】
本開示の非一時的なコンピュータ可読記憶媒体はプログラムを格納している。当該プログラムは、コンピュータに、地上画像と空撮画像を取得し、前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定すること、を実行させる。
【発明の効果】
【0009】
本開示によれば、グラウンド・トゥー・エアリアル・クロスビューマッチングの精度を向上する技術を提供することができる。
【図面の簡単な説明】
【0010】
図1図1は、実施形態1の画像マッチング装置2000の概要を示す。
図2図2は、画像マッチング装置の機能構成の例を示すブロック図である。
図3図3は、画像マッチング装置におけるデータの流れを示す。
図4図4は、地上特徴抽出部の全体的な機能を示す。
図5図5は、空撮特徴抽出部の全体的な機能を示す。
図6図6は、画像マッチング装置を実現するコンピュータのハードウエア構成の例を示すブロック図である。
図7図7は、画像マッチング装置によって実行される処理の流れの例を示すフローチャートである。
図8図8は、地上特徴抽出部の第1レイヤ抽出部によって実行される処理の流れを例示するフローチャートである。
図9図9は、地上特徴抽出部の第2レイヤ抽出部によって実行される処理の流れを例示するフローチャートである。
図10図10は、空撮特徴抽出部の第1レイヤ抽出部によって実行される処理の流れの例を示すフローチャートである。
図11図11は、空撮特徴抽出部の第2レイヤ抽出部によって実行される処理の流れの例を示すフローチャートである。
図12図12は、画像マッチング装置を有するジオローカライゼーションシステムを示す。
【発明を実施するための形態】
【0011】
以下、本開示に係る実施形態について、図面を参照しながら説明する。複数の図を通して同じ要素には同じ符号が付され、冗長な説明は必要に応じて省略される。
【0012】
実施形態1
<概要>
図1は、実施形態1の画像マッチング装置2000の概要を示す。画像マッチング装置2000は、地上画像と空撮画像との間のマッチング(いわゆるグラウンド・トゥー・エアリアル・クロスビューマッチング)を行う識別器として機能する。地上画像は、或る場所のグラウンドビューを含む画像である。例えば、地上画像は、歩行者や車から撮像される。地上画像は、パノラマ(360°の画角)であってもよいし、限られた画角(360°未満)であってもよい。空撮画像は、或る場所の平面視が含まれる画像である。例えば、空撮画像は、ドローン、飛行機、又は人工衛星などから撮像される。具体的には、画像マッチング装置2000は、地上画像と空撮画像を取得し、取得した地上画像と取得した空撮画像とがマッチするか否かを判定する。ここで、「地上画像と空撮画像とがマッチする」とは、地上画像の撮像が行われた場所が空撮画像に含まれていることを意味する。
【0013】
画像マッチング装置2000は、地上特徴抽出部2020、空撮特徴抽出部2040、及び判定部2060を有する。地上特徴抽出部2020は、地上画像20から特徴量を抽出し、非アテンション地上特徴マップ及びアテンション地上特徴マップを生成する。非アテンション地上特徴マップは、地上画像20に基づいて得られ、かつ、アテンションマップを利用せずに生成される特徴マップである。一方、アテンション地上特徴マップは、地上画像20に基づいて得られ、かつ、アテンションマップを利用して生成される特徴マップである。地上特徴抽出部2020は、複数のレイヤを有し、各レイヤは非アテンション地上特徴マップとアテンション地上特徴マップを生成する。以下、非アテンション地上特徴マップとアテンション地上特徴マップは総称して「地上特徴マップ」と記載される。
【0014】
空撮特徴抽出部2040は、空撮画像30から特徴量を抽出し、非アテンション空撮特徴マップ及びアテンション空撮特徴マップを生成する。非アテンション空撮特徴マップは、空撮画像30に基づいて得られ、かつ、アテンションマップを利用せずに生成される特徴マップである。一方、アテンション空撮特徴マップは、空撮画像30に基づいて得られ、かつ、アテンションマップを利用して生成される特徴マップである。空撮特徴抽出部2040は、複数のレイヤを有し、各レイヤは非アテンション空撮特徴マップとアテンション空撮特徴マップを生成する。以下、非アテンション空撮特徴マップとアテンション空撮特徴マップは総称して「空撮特徴マップ」と記載される。
【0015】
判定部2060は、地上特徴マップと空撮特徴マップとに基づいて、地上画像20と空撮画像30との間の類似度を表す類似スコアを算出する。そして、判定部2060は、類似スコアに基づいて、地上画像20と空撮画像30とがマッチするか否かを判定する。
【0016】
<作用効果の例>
実施形態1の画像マッチング装置2000によれば、非アテンション地上特徴マップと非アテンション空撮特徴マップ(すなわち、アテンション手法無しに生成される特徴マップ)だけでなく、アテンション地上特徴マップとアテンション空撮特徴マップ(すなわち、アテンション手法を用いて生成される特徴マップ)とが、グラウンド・トゥー・エアリアル・クロスビューマッチングに利用される。グラウンド・トゥー・エアリアル・クロスビューマッチングに対してアテンション手法を適用することにより、画像マッチング装置2000は、地上画像20と空撮画像30とがマッチするか否かを、アテンション手法が適用されない場合よりも正確に判定できる。
【0017】
以下、画像マッチング装置2000について、より詳細な説明が記載される。
【0018】
<機能構成の例>
画像マッチング装置2000の全体的な機能構成の例は、図1で表される。ここで、図2から図5を参照して、地上特徴抽出部2020と空撮特徴抽出部2040とが特徴マップを生成するために2つのレイヤのユニットを持つケースについて説明される。図2は、画像マッチング装置2000の機能構成の例を示すブロック図である。図3は、画像マッチング装置2000におけるデータの流れを表す。図4は、地上特徴抽出部2020の全体的な機能を示す。図5は、空撮特徴抽出部2040の全体的な機能を示す。
【0019】
地上特徴抽出部2020について、これは、第1レイヤ抽出部2022及び第2レイヤ抽出部2024を有する(図2参照)。図4に示されているように、第1レイヤ抽出部2022は地上画像20を取得し、第1非アテンション地上特徴マップ21及び第1アテンション地上特徴マップ23を出力する。第1非アテンション地上特徴マップ21は、非アテンション地上特徴マップの一つであり、地上画像20に基づいて得られる1つ以上の特徴マップを含む。第1非アテンション地上特徴マップ21は、地上画像20から特徴量を抽出することによって生成される。
【0020】
第1アテンション地上特徴マップ23は、アテンション地上特徴マップの一つであり、第1非アテンション地上特徴マップ21及び第1地上アテンションマップ22に基づいて生成される1つ以上の特徴マップを含む。第1地上アテンションマップ22は、地上画像20から生成されるアテンションマップであり、地上画像20において注目すべき度合いの空間的な分布を表す。第1レイヤ抽出部2022は、第1地上アテンションマップ22を第1非アテンション地上特徴マップ21に適用することで、第1アテンション地上特徴マップ23(第1地上アテンションマップ22によって重み付けされた、地上画像20から抽出された特徴量を表す)を生成する。
【0021】
また、図4に示されているように、第2レイヤ抽出部2024は、第1非アテンション地上特徴マップ21を取得し、第2非アテンション地上特徴マップ24及び第2アテンション地上特徴マップ26を出力する。第2非アテンション地上特徴マップ24は、非アテンション地上特徴マップの一つであり、第1非アテンション地上特徴マップ21に基づいて得られる1つ以上の特徴マップを含む。第2非アテンション地上特徴マップ24は、第1非アテンション地上特徴マップ21から特徴量を抽出することによって生成される。
【0022】
第2アテンション地上特徴マップ26は、アテンション地上特徴マップの1つであり、第2非アテンション地上特徴マップ24及び第2地上アテンションマップ25に基づいて生成される1つ以上の特徴マップを含む。第2地上アテンションマップ25は、第1非アテンション地上特徴マップ21から生成されるアテンションマップであり、第1非アテンション地上特徴マップ21において注目すべき度合いの空間的な分布を表す。第2レイヤ抽出部2024は、第2地上アテンションマップ25を第2非アテンション地上特徴マップ24に対して適用することで、第2アテンション地上特徴マップ26(第2地上アテンションマップ25によって重み付けされた、第2非アテンション地上特徴マップ24から抽出された特徴量を表す)を生成する。
【0023】
空撮特徴抽出部2040について、これは、第1レイヤ抽出部2042及び第2レイヤ抽出部2044を有する(図2参照)。図5に示されているように、第1レイヤ抽出部2042は、空撮画像30を取得し、第1非アテンション空撮特徴マップ31及び第1アテンション空撮特徴マップ33を出力する。第1非アテンション空撮特徴マップ31は、非アテンション空撮特徴マップの一つであり、空撮画像30に基づいて得られる1つ以上の特徴マップを含む。第1非アテンション空撮特徴マップ31は、空撮画像30から特徴量を抽出することによって生成される。
【0024】
第1アテンション空撮特徴マップ33は、アテンション空撮特徴マップの一つであり、第1非アテンション空撮特徴マップ31及び第1空撮アテンションマップ32に基づいて生成される1つ以上の特徴マップを含む。第1空撮アテンションマップ32は、空撮画像30から生成されるアテンションマップであり、空撮画像30において注目すべき度合いの空間的な分布を表す。第1レイヤ抽出部2042は、第1空撮アテンションマップ32を第1非アテンション空撮特徴マップ31に適用することで、第1アテンション空撮特徴マップ33(第1空撮アテンションマップ32によって重み付けされた、空撮画像30から抽出された特徴量を表す)を生成する。
【0025】
また、図5に示されているように、第2レイヤ抽出部2044は、第1非アテンション空撮特徴マップ31を取得し、第2非アテンション空撮特徴マップ34及び第2アテンション空撮特徴マップ36を出力する。第2非アテンション空撮特徴マップ34は、非アテンション空撮特徴マップの一つであり、第1非アテンション空撮特徴マップ31に基づいて得られる特徴マップを1つ以上含む。第2非アテンション空撮特徴マップ34は、第1非アテンション空撮特徴マップ31から特徴量を抽出することで生成される。
【0026】
第2アテンション空撮特徴マップ36は、アテンション空撮特徴マップの一つであり、第2非アテンション空撮特徴マップ34及び第2空撮アテンションマップ35に基づいて生成される特徴マップを一つ以上含む。第2空撮アテンションマップ35は、第1非アテンション空撮特徴マップ31から生成されるアテンションマップであり、第1非アテンション空撮特徴マップ31において注目すべき度合いの空間的な分布を表す。第2レイヤ抽出部2044は、第2空撮アテンションマップ35を第2非アテンション空撮特徴マップ34に対して適用することで、第2アテンション空撮特徴マップ36(第2空撮アテンションマップ35によって重み付けされた、第1非アテンション空撮特徴マップ31から抽出された特徴量)を表す。
【0027】
図3に示されているように、判定部2060は、非アテンション地上特徴マップ(第1非アテンション地上特徴マップ21及び第2非アテンション地上特徴マップ24)、アテンション地上特徴マップ(第1アテンション地上特徴マップ23及び第2アテンション地上特徴マップ26)、非アテンション空撮特徴マップ(第1非アテンション空撮特徴マップ31及び第2非アテンション空撮特徴マップ34)、及びアテンション空撮特徴マップ(第1アテンション空撮特徴マップ33及び第2アテンション空撮特徴マップ36)を取得する。判定部2060は、取得した特徴マップに基づいて、地上画像20と空撮画像30との間の類似スコアを算出し、類似スコアに基づいて、地上画像20と空撮画像30とがマッチするか否かを判定する。
【0028】
<ハードウエア構成の例>
画像マッチング装置2000は、1つ以上のコンピュータで実現されうる。それら1つ以上のコンピュータのそれぞれは、画像マッチング装置2000を実現するために作成された専用のコンピュータであってもよいし、パーソナルコンピュータ(PC: Personal Computer)、サーバマシン又はモバイルデバイスなどの汎用のコンピュータであってもよい。画像マッチング装置2000は、コンピュータにアプリケーションをインストールすることで実現されうる。そのアプリケーションは、コンピュータを画像マッチング装置2000として機能させるプログラムで実現される。言い換えれば、そのプログラムは、画像マッチング装置2000の機能構成部を実装したものである。
【0029】
図6は、画像マッチング装置2000を実現するコンピュータ1000のハードウエア構成の例を示すブロック図である。図5において、コンピュータ1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。
【0030】
バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が相互にデータの送信及び受信をするためのデータ通信路である。プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などといったプロセッサである。メモリ1060は、RAM(Random Access Memory)又は ROM(Read Only Memory)などの主記憶要素である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、又はメモリカードなどの補助記憶要素である。入出力インタフェース1100は、コンピュータ1000と周辺デバイス(キーボード、マウス、又はディスプレイデバイスなど)との間のインタフェースである。ネットワークインタフェース1120は、コンピュータ1000とネットワークとの間のインタフェースである。ネットワークは、LAN(Local Area Network)でもよいし、WAN(Wide Area Network)でもよい。
【0031】
ストレージデバイス1080は、前述したプログラムを格納しうる。プロセッサ1040は、画像マッチング装置2000の各機能構成部を実現するためにそのプログラムを実行する。さらに、ストレージデバイス1080はオリジナル訓練データセット40を格納しうる。
【0032】
コンピュータ1000のハードウエア構成は、図5に示される構成に限定されない。
例えば、前述したように、画像マッチング装置2000は複数のコンピュータで実現されうる。この場合、それらのコンピュータは、ネットワークを介して互いに接続されうる。
【0033】
<処理の流れ>
図7は、画像マッチング装置2000によって実行される処理の全体的な流れの例を示すフローチャートである。画像マッチング装置2000は、地上画像20及び空撮画像30を取得する(S102)。地上特徴抽出部2020は、非アテンション地上特徴マップ及びアテンション地上特徴マップを生成する。(S104)。空撮特徴抽出部2040は、非アテンション空撮特徴マップ及びアテンション空撮特徴マップを生成する(S106)。
【0034】
判定部2060は、地上画像20と空撮画像30について類似スコアを算出する(S108)。判定部2060は、類似スコアに基づいて、地上画像20と空撮画像30とがマッチするか否かを判定する(S110)。
【0035】
画像マッチング装置2000によって実行される処理の流れは、図7に示されているものに限定されない。例えばステップS106は、S104よりも前に又は並行して実行されてもよい。
【0036】
画像マッチング装置2000が特徴マップを生成する2つのレイヤのユニットを有する場合、図7のステップS104は、第1レイヤ抽出部2022及び第2レイヤ抽出部2024によって実行される。図8は、第1レイヤ抽出部2022によって実行される処理の流れの例を示すフローチャートである。第1レイヤ抽出部2022は地上画像20を取得する(S202)。第1レイヤ抽出部2022は、地上画像20に基づいて第1非アテンション地上特徴マップ21を生成する(S204)。第1レイヤ抽出部2022は、地上画像20に基づいて第1地上アテンションマップ22を生成する(S206)。第1レイヤ抽出部2022は、第1非アテンション地上特徴マップ21及び第1地上アテンションマップ22に基づいて、第1アテンション地上特徴マップ23を生成する(S208)。
【0037】
図9は、第2レイヤ抽出部2024によって実行される処理の流れの例を示すフローチャートである。第2レイヤ抽出部2024は第1非アテンション地上特徴マップ21を取得する(S302)。第2レイヤ抽出部2024は、第1非アテンション地上特徴マップ21に基づいて第2非アテンション地上特徴マップ24を生成する(S304)。第2レイヤ抽出部2024は、第1非アテンション地上特徴マップ21に基づいて第2地上アテンションマップ25を生成する(S306)。第2レイヤ抽出部2024は、第2非アテンション地上特徴マップ24及び第2地上アテンションマップ25に基づいて、第2アテンション地上特徴マップ26を生成する(S308)。
【0038】
同様に、画像マッチング装置2000が特徴マップを生成する2つのレイヤのユニットを有する場合、図7のステップS106は、第1レイヤ抽出部2042及び第2レイヤ抽出部2044によって実行される。図10は、第1レイヤ抽出部2042によって実行される処理の流れの例を示すフローチャートである。第1レイヤ抽出部2042は空撮画像30を取得する(S402)。第1レイヤ抽出部2042は、空撮画像30に基づいて第1非アテンション空撮特徴マップ31を生成する(S404)。第1レイヤ抽出部2042は、空撮画像30に基づいて第1空撮アテンションマップ32を生成する(S406)。第1レイヤ抽出部2042は、第1非アテンション空撮特徴マップ31及び第1空撮アテンションマップ32に基づいて、第1アテンション空撮特徴マップ33を生成する(S408)。
【0039】
図11は、第2レイヤ抽出部2044によって実行される処理の流れの例を示すフローチャートである。第2レイヤ抽出部2044は、第1非アテンション空撮特徴マップ31を取得する(502)第2レイヤ抽出部2044は、第1非アテンション空撮特徴マップ31に基づいて第2非アテンション空撮特徴マップ34を生成する(S504)。第2レイヤ抽出部2044は、第1非アテンション空撮特徴マップ31に基づいて第2空撮アテンションマップ35を生成する(S506)。第2レイヤ抽出部2044は、第2非アテンション空撮特徴マップ34及び第2空撮アテンションマップ35に基づいて、第2アテンション空撮特徴マップ36を生成する(S508)。
【0040】
<画像マッチング装置2000のアプリケーションの例>
画像マッチング装置2000のアプリケーションには様々なものがある。例えば画像マッチング装置2000は、画像ジオローカライゼーションを行うシステム(以下、ジオローカライゼーションシステム)の一部として利用することができる。画像ジオローカライゼーションは、入力された画像の撮像場所を特定する技術である。ここで、ジオローカライゼーションシステムはあくまで、画像マッチング装置2000のアプリケーションの一例であり、画像マッチング装置2000のアプリケーションは、ジオローカライゼーションシステムの中で利用されるものに限定されない。
【0041】
図12は、画像マッチング装置2000が含まれるジオローカライゼーションシステム200を示す。ジオローカライゼーションシステム200は、画像マッチング装置2000及び位置データベース300を含む。位置データベース300は、それぞれに位置情報が付加された複数の空撮画像を含む。位置情報の例は、対応する空撮画像の撮像場所の GPS(Global Positioning System)座標でありうる。
【0042】
ジオローカライゼーションシステム200は、クライアント(例えばユーザ端末)から地上画像を含むクエリを受信し、受信したクエリに含まれる地上画像とマッチする空撮画像を位置データベース300から探索し、これによって地上画像の撮像場所を特定する。具体的には、クエリに含まれる地上画像にマッチする空撮画像が検出されるまで、ジオローカライゼーションシステム200は、「位置データベース300から空撮画像を1つ取得し、地上画像と取得した空撮画像を画像マッチング装置2000に入力し、画像マッチング装置2000からの出力が、地上画像と空撮画像とがマッチすることを示しているか否かを判定する。」という処理を繰り返す。こうすることで、ジオローカライゼーションシステム200は、地上画像の撮像場所が含まれる空撮画像を見つけることができる。検出された空撮画像が GPS 座標などの位置情報に対応づけられているため、ジオローカライゼーションシステム200は、地上画像の撮像場所が、地上画像にマッチする空撮画像に対応づけられている位置情報によって示されている場所であると把握できる。
【0043】
なお、ジオローカライゼーションシステム200は、図6に示されているコンピュータなどのような任意の1つ以上のコンピュータで実現されうる。
【0044】
<画像の取得:S102>
画像マッチング装置2000は地上画像20及び空撮画像30を取得する(S102)。例えば画像マッチング装置2000は、他のコンピュータから送信された、地上画像20と空撮画像30のセットを受信しうる。その他にも例えば、画像マッチング装置2000は、それがアクセス可能な記憶装置から、地上画像20と空撮画像30のペアを取り出しうる。
【0045】
その他にも例えば、図12に示されているように、画像マッチング装置2000は、他のコンピュータから送信された地上画像20を受信し、その地上画像20にマッチする空撮画像を検索しうる。この場合、画像マッチング装置2000は、地上画像20とマッチする空撮画像30が見つかるまで、記憶装置から空撮画像30を繰り返し取得する。同様に、画像マッチング装置2000は、他のコンピュータから送信された空撮画像30を受信し、その空撮画像30にマッチする地上画像20を検索してもよい。
【0046】
<非アテンション特徴マップの生成:S204、S304、S404、S504>
画像マッチング装置2000は、非アテンション地上特徴マップ(例えば、第1非アテンション地上特徴マップ21(S204)及び第2非アテンション地上特徴マップ24(S304))及び非アテンション空撮特徴マップ(例えば、第1非アテンション空撮特徴マップ31(S404)及び第2非アテンション空撮特徴マップ34(S504))を生成する。ここで、以下、非アテンション地上特徴マップと非アテンション空撮特徴マップは、総称して、「非アテンション特徴マップ」と記載される。
【0047】
各非アテンション特徴マップは、ソースデータ(入力データ)に対して畳み込み処理を1回以上行うことによって生成されうる。例えば、第1レイヤ抽出部2022は、地上画像20に対して畳み込み処理を行って、第1非アテンション地上特徴マップ21を生成する。第2レイヤ抽出部2024は、第1非アテンション地上特徴マップ21に対して畳み込み処理を行って、第2非アテンション地上特徴マップ24を生成する。第1レイヤ抽出部2042は、空撮画像30に対して畳み込み処理を行って、第1非アテンション空撮特徴マップ31を生成する。第2レイヤ抽出部2044は、第1非アテンション空撮特徴マップ31に対して畳み込み処理を行って、第2非アテンション空撮特徴マップ34を生成する。
【0048】
前述した畳み込み処理は、1つ以上の畳み込みレイヤを有するニューラルネットワークによって実現されうる。この場合、第1レイヤ抽出部2022、第2レイヤ抽出部2024、第1レイヤ抽出部2042、及び第2レイヤ抽出部2044は、入力データから非アテンション特徴マップを生成する1つ以上の畳み込みレイヤが含まれるニューラルネットワークを有する。なお、非アテンション特徴マップを生成する各ニューラルネットワークは、畳み込みレイヤだけでなく、プーリングレイヤや活性化レイヤなどの他の種類のレイヤも含みうる。
【0049】
<アテンションマップの生成:S206、S306、S406、S506>
画像マッチング装置2000は、第1地上アテンションマップ22(S206)、第2地上アテンションマップ25(S306)、第1空撮アテンションマップ32(S406)、及び第2空撮アテンションマップ35(S506)などのアテンションマップを生成する。アテンションマップを生成するには、既存の技術を採用しうる。例えば、アテンションマップは、1つ以上の畳み込みレイヤを有するニューラルネットワークを用いて生成されうる。ここで、各ニューラルネットワークは、畳み込みレイヤだけでなく、プーリングレイヤや活性化レイヤなどの他の種類のレイヤも含みうる。
【0050】
なお、画像マッチング装置2000は、各非アテンション特徴マップについて、複数のアテンションマップを生成してもよい。例えば第1レイヤ抽出部2022は、地上画像20から複数の第1地上アテンションマップ22を生成しうる。一つのソース(画像や特徴マップ)から複数のアテンションマップを生成するためには、既存の技術を採用しうる。例えば、一つのソースから複数のアテンションマップを生成するために、互いに異なるように初期化された(例えば、ランダムに初期化された)複数のニューラルネットワークが用意される。これらのニューラルネットワークは互いに異なるように初期化されているため、互いに異なる複数のアテンションマップを生成するように訓練される。
【0051】
<アテンション特徴マップの生成:S208、S308、S408、S508>
画像マッチング装置2000は、アテンション地上特徴マップ(例えば、第1アテンション地上特徴マップ23(S208)及び第2アテンション地上特徴マップ26(S308))及びアテンション空撮特徴マップ(例えば、第1アテンション空撮特徴マップ33(S408)及び第2アテンション空撮特徴マップ36(S508))を生成する。ここで、以下、アテンション地上特徴マップとアテンション空撮特徴マップは、総称して、「アテンション特徴マップ」と記載される。
【0052】
特徴マップとアテンションマップからアテンション特徴マップを生成するためには、既存の技術を採用しうる。例えば、アテンション特徴マップは、特徴マップとアテンションマップとのドット積として算出されうる。この場合、第1レイヤ抽出部2022は、第1非アテンション地上特徴マップ21と第1地上アテンションマップ22のドット積を算出して、第1アテンション地上特徴マップ23を生成する。第2レイヤ抽出部2024は、第2非アテンション地上特徴マップ24と第2地上アテンションマップ25のドット積を算出して、第2アテンション地上特徴マップ26を生成する。第1レイヤ抽出部2042は、第1非アテンション空撮特徴マップ31と第1空撮アテンションマップ32のドット積を算出して、第1アテンション空撮特徴マップ33を生成する。第2レイヤ抽出部2044は、第2非アテンション空撮特徴マップ34と第2空撮アテンションマップ35のドット積を算出して、第2アテンション空撮特徴マップ36を生成する。
【0053】
なお、各非アテンション特徴マップについて複数のアテンションマップが生成される場合、各非アテンション特徴マップについて複数のアテンション特徴マップが生成される。例えば、第1レイヤ抽出部2022が複数の第1地上アテンションマップ22を生成する場合、それは、互いに異なる複数の第1地上アテンションマップに基づいて得られる、複数の第1アテンション地上特徴マップ23を生成する。
【0054】
<3つ以上のレイヤが存在するケースについて>
図2から5は特徴マップを生成する2つのレイヤのユニットが存在するケースの例を示しているが、画像マッチング装置2000は、それをする3つ以上のレイヤのユニットを有してもよい。この場合、画像マッチング装置2000は、同様の態様でさらに多くの特徴マップを生成する。具体的には、画像マッチング装置2000は、第(i-1)非アテンション地上特徴マップから特徴量を抽出することで、第 i 非アテンション地上特徴マップを生成する(i は3より大きい自然数)。画像マッチング装置2000は、第(i-1)非アテンション地上特徴マップから、第 i 地上アテンションマップを生成する。画像マッチング装置2000は、第 i 地上アテンションマップを第 i 非アテンション地上特徴マップに適用することで、第 i アテンション地上特徴マップを生成する。
【0055】
同様に、画像マッチング装置2000は、第(i-1)非アテンション空撮特徴マップから特徴量を抽出することで、第 i 非アテンション空撮特徴マップを生成する。画像マッチング装置2000は、第(i-1)非アテンション空撮特徴マップから、第 i 空撮アテンションマップを生成する。画像マッチング装置2000は、第 i 空撮アテンションマップを第 i 非アテンション空撮特徴マップに適用することで、第 i アテンション空撮特徴マップを生成する。
【0056】
<類似スコアの算出:S108>
判定部2060は、地上特徴マップと空撮特徴マップとに基づいて、地上画像20と空撮画像30について、類似スコアを算出する(S108)。類似スコアは、地上画像20と空撮画像30との間の類似度を表す。
【0057】
地上特徴マップと空撮特徴マップとに基づいて類似スコアを算出する方法は様々である。例えば、判定部2060は、地上特徴マップのコンカチネーション及び空撮特徴マップのコンカチネーションを生成し、これら2つのコンカチネーションの類似度を、類似スコアとして算出する。
【0058】
前述した2つのコンカチネーションの類似度を算出する方法は様々である。例えば、これらの間の類似度は、種々の距離(例えば、L2 距離)、コサイン類似度、又はニューラルネットワーク(NN: neural network)ベースの類似度で表すことができいる。NN ベースの類似度は、2つの入力データ(この場合、地上特徴マップのコンカチネーションと空撮特徴マップのコンカチネーション)の類似度を算出するように訓練されたニューラルネットワークによって算出される類似度である。
【0059】
その他にも例えば、判定部2060は、地上特徴マップと空撮特徴マップの可能なペアの全てそれぞれについて類似度を算出し、それらの類似度の一つ以上を利用して類似スコアを算出してもよい。図2から図5に示されているケースにおいて、判定部2060は、地上特徴マップと空撮特徴マップの可能な 4x4(=16) 個の各ペアについて類似度を算出する。ここで、地上特徴マップと空撮特徴マップの類似度の算出には、種々の距離、コサイン類似度、及び NN ベースの類似度といった、種々のメトリクスが利用できる。
【0060】
例えば判定部2060は、地上特徴マップと空撮特徴マップの可能なペアの全てそれぞれについて算出された類似度の最大値を、類似スコアとして利用する。その他にも例えば、判定部2060は、地上特徴マップと空撮特徴マップの可能なペアの全てそれぞれについて算出された類似度のうちのいくつか又は全てから算出される統計値(例えば、平均値や最頻値など)を、類似スコアとして算出する。類似度のうちのいくつかを利用する場合、例えば判定部2060は、1番目に大きい類似度から第 m 番目に大きい類似度を利用する(m は2より大きい所定の自然数)。
【0061】
ここで、地上特徴マップと空撮特徴マップの可能なペアそれぞれについて類似度を算出することは、互いに異なるレベルのレイヤから出力される特徴マップを比較するため、地上特徴マップと空撮特徴マップの間におけるクロススケールマッチングを可能とする。地上画像20に撮像されるシーンの範囲は、空撮画像30に撮像されるシーンの範囲とは異なりうるため、地上特徴マップは、その地上特徴マップを出力するレイヤのレベルとは異なるレベルのレイヤから出力される空撮特徴マップと高い類似度を持つ可能性がある。地上特徴マップと空撮特徴マップとの間のクロススケールマッチングは、そのような、互いに異なるレベルのレイヤから出力される特徴マップ間の高い類似性を検出することに有用である。
【0062】
判定部2060は、スケール内の比較とクロススケールの比較双方の結果を利用してもよい。ここで、スケール内の比較は、互いに同一のレベルのレイヤから出力される地上特徴マップと空撮特徴マップとの間の類似度を算出する処理である。
【0063】
例えば、判定部2060は、同一スケール内の地上特徴マップと空撮特徴マップとの類似度の最大値(すなわち、互いに同一のレイヤから生成される地上特徴マップと空撮特徴マップのペアについて算出される類似度のうち、最大の類似度)を特定する。さらに、判定部2060は、異なるスケールにおける地上特徴マップと空撮特徴マップとの類似度の最大値(すなわち、互いに異なるレイヤから生成される地上特徴マップと空撮特徴マップとの類似度のうち、最大の類似度)も特定する。そして、判定部2060は、特定された2種類の類似度の最大値に基づいて、類似スコアを算出する。例えば判定部2060は、特定された類似度の統計値(平均値など)を類似スコアとして用いる。
【0064】
<類似スコアに基づく画像マッチング:S110>
判定部2060は、地上画像20と空撮画像30とがマッチするか否かを類似スコアに基づいて判定する(S110)。コンセプトとしては、地上画像20と空撮画像30との類似度が高いほど、地上画像20と空撮画像30とがマッチする蓋然性が高い。そのため、例えば判定部2060は、類似スコアが所定の閾値以上である場合に、地上画像20と空撮画像30とがマッチすると判定する。一方で、判定部2060は、類似スコアが所定の閾値より小さい場合、地上画像20と空撮画像30とがマッチしないと判定する。なお、この場合、地上特徴マップと空撮特徴マップとの類似度が高いほど類似スコアが大きくなることが前提となっている。
【0065】
<画像マッチング装置2000の訓練>
画像マッチング装置2000は、ニューラルネットワークなどの1つ以上の訓練済みモデルによって実装されうる。例えば、前述したように、非アテンション特徴マップ、アテンション特徴マップ、及びアテンションマップは、ニューラルネット枠によって生成することができる。この場合、例えば地上特徴抽出部2020及び空撮特徴抽出部2040はそれぞれ、畳み込みニューラルネットワーク(CNN: convolutional neural network)で実装しうる。
【0066】
画像マッチング装置2000が訓練済みモデルで実装される場合、画像マッチング装置2000は、地上画像と空撮画像とのペアを含む訓練データセットを用いて訓練される必要がある。例えば画像マッチング装置2000は、シャムネットワークの訓練と同様に、訓練データセットから算出される地上特徴量と空撮特徴量との間の損失に基づいて訓練されうる。シャムネットワークは、例えば非特許文献1に開示されている。
【0067】
モデルの重みは、所定の損失関数を用いて算出された損失に基づいて更新される。類似スコアが地上特徴マップのコンカチネーションと空撮特徴マップのコンカチネーションとに基づいて算出される場合、それらのコンカチネーションを損失関数に入力することで、損失を算出することができる。一方、地上特徴マップと空撮特徴マップの各ペアについて算出される類似度に基づいて類似スコアが算出される場合、最大の類似度を持つ地上特徴マップと空撮特徴マップを損失関数に入力することで、損失を算出することができる。
【0068】
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに提供することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD-ROM、CD-R、CD-R/W、半導体メモリ(例えば、マスク ROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに提供されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0069】
実施形態を参照して本開示について説明されているが、本開示は上述した実施形態に限定されない。発明の範囲内で、当業者が理解できる種々の変形を本開示の構成や詳細に対して行うことができる。
【0070】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<付記>
(付記1)
少なくとも一つのプロセッサと、命令が格納されている記憶要素とを有し、
前記少なくとも一つのプロセッサは、前記命令を実行することにより、
地上画像と空撮画像を取得し、
前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、
前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、
前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、
前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定する、画像マッチング装置。
(付記2)
前記類似スコアの算出は、前記地上特徴マップのコンカチネーションと前記空撮特徴マップのコンカチネーションとの類似度を前記類似スコアとして算出することを含む、付記1に記載の画像マッチング装置。
(付記3)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度の最大値を前記類似スコアとして利用することとを含む、付記1に記載の画像マッチング装置。
(付記4)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度のうちのいくつか又は全ての統計値を前記類似スコアとして利用することとを含む、付記1に記載の画像マッチング装置。
(付記5)
2つのデータの前記類似度は、それらの間の距離、それらの間のコサイン類似度、又は、2つのデータの類似度を出力するように訓練されたニューラルネットワークによって算出されるニューラルネットワークベースの類似度である、付記2から4いずれか一項に記載の画像マッチング装置。
(付記6)
地上画像と空撮画像を取得し、
前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、
前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、
前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、
前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定することを含む、コンピュータによって実行される制御方法。
(付記7)
前記類似スコアの算出は、前記地上特徴マップのコンカチネーションと前記空撮特徴マップのコンカチネーションとの類似度を前記類似スコアとして算出することを含む、付記6に記載の制御方法。
(付記8)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度の最大値を前記類似スコアとして利用することとを含む、付記6に記載の制御方法。
(付記9)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度のうちのいくつか又は全ての統計値を前記類似スコアとして利用することとを含む、付記6に記載の制御方法。
(付記10)
2つのデータの前記類似度は、それらの間の距離、それらの間のコサイン類似度、又は、2つのデータの類似度を出力するように訓練されたニューラルネットワークによって算出されるニューラルネットワークベースの類似度である、付記6から9いずれか一項に記載の制御方法。
(付記11)
地上画像と空撮画像を取得し、
前記地上画像に基づいて得られる特徴マップである地上特徴マップを生成し、前記地上特徴マップは、前記地上画像から特徴量を抽出することで生成される第1非アテンション地上特徴マップと、前記第1非アテンション地上特徴マップにアテンションマップを適用することで生成される第1アテンション地上特徴マップと、前記第1非アテンション地上特徴マップから特徴量を抽出することで生成される第2非アテンション地上特徴マップと、前記第2非アテンション地上特徴マップにアテンションマップを適用することで生成される第2アテンション地上特徴マップとを含み、
前記空撮画像に基づいて得られる特徴マップである空撮特徴マップを生成し、前記空撮特徴マップは、前記空撮画像から特徴量を抽出することで生成される第1非アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップにアテンションマップを適用することで生成される第1アテンション空撮特徴マップと、前記第1非アテンション空撮特徴マップから特徴量を抽出することで生成される第2非アテンション空撮特徴マップと、前記第2非アテンション空撮特徴マップにアテンションマップを適用することで生成される第2アテンション空撮特徴マップとを含み、
前記地上特徴マップと前記空撮特徴マップとに基づいて類似スコアを算出し、前記類似スコアは前記地上画像と前記空撮画像との間の類似度を表し、
前記類似スコアに基づいて前記地上画像と前記空撮画像とがマッチするか否かを判定すること、をコンピュータに実行させるプログラムが格納されている、非一時的なコンピュータ可読記憶媒体。
(付記12)
前記類似スコアの算出は、前記地上特徴マップのコンカチネーションと前記空撮特徴マップのコンカチネーションとの類似度を前記類似スコアとして算出することを含む、付記11に記載の記憶媒体。
(付記13)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度の最大値を前記類似スコアとして利用することとを含む、付記11に記載の記憶媒体。
(付記14)
前記類似スコアの算出は、
前記地上特徴マップと前記空撮特徴マップの可能な各ペアについて類似度を算出することと、
前記算出された類似度のうちのいくつか又は全ての統計値を前記類似スコアとして利用することとを含む、付記11に記載の記憶媒体。
(付記15)
2つのデータの前記類似度は、それらの間の距離、それらの間のコサイン類似度、又は、2つのデータの類似度を出力するように訓練されたニューラルネットワークによって算出されるニューラルネットワークベースの類似度である、付記11から14いずれか一項に記載の記憶媒体。
【符号の説明】
【0071】
20 地上画像
21 第1非アテンション地上特徴マップ
22 第1地上アテンションマップ
23 第1アテンション地上特徴マップ
24 第2非アテンション地上特徴マップ
25 第2地上アテンションマップ
26 第2アテンション地上特徴マップ
30 空撮画像
31 第1非アテンション空撮特徴マップ
32 第1空撮アテンションマップ
33 第1アテンション空撮特徴マップ
34 第2非アテンション空撮特徴マップ
35 第2空撮アテンションマップ
36 第2アテンション空撮特徴マップ
200 ジオローカライゼーションシステム
300 位置データベース
1000 コンピュータ
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 画像マッチング装置
2020 地上特徴抽出部
2022 第1レイヤ抽出部
2024 第2レイヤ抽出部
2040 空撮特徴抽出部
2042 第1レイヤ抽出部
2044 第2レイヤ抽出部
2060 判定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12