特許7628380 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許7628380低解像度下での画像特徴量を利用した画像特徴量抽出モデル及び方法、並びに画像マッチング装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-01-31

(45)【発行日】2025-02-10

(54)【発明の名称】低解像度下での画像特徴量を利用した画像特徴量抽出モデル及び方法、並びに画像マッチング装置及びプログラム

(51)【国際特許分類】

G06T 7/33 20170101AFI20250203BHJP

【ＦＩ】

G06T7/33

【請求項の数】 11

(21)【出願番号】P 2021181724

(22)【出願日】2021-11-08

(65)【公開番号】P2023069672

(43)【公開日】2023-05-18

【審査請求日】2024-01-17

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100135068

【弁理士】

【氏名又は名称】早原茂樹

(74)【代理人】

【識別番号】100141313

【弁理士】

【氏名又は名称】辰巳富彦

(72)【発明者】

【氏名】スワンウィモンクンスウィーチャヤ

(72)【発明者】

【氏名】小森田賢史

【審査官】小池正彦

(56)【参考文献】

【文献】特開２０１３－１９０９４７（ＪＰ，Ａ）

【文献】特表２０１３－５３４３４２（ＪＰ，Ａ）

【文献】Axel Barroso-Laguna, et al.，Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters，2019 IEEE/CVF International Conference on Computer Vision (ICCV)，米国，IEEE，2019年，p.5835-5843，DOI: 10.1109/ICCV.2019.00593

【文献】Paul-Edouard Sarlin, et al.，SuperGlue: Learning Feature Matching with Graph Neural Networks，arxiv.org，2020年，https://arxiv.org/pdf/1911.11763

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／３３

(57)【特許請求の範囲】

【請求項1】

２つの元画像の各画像からキーポイント及び記述子（descriptor）を抽出するコンピュータを機能させる画像特徴量抽出モデルであって、
当該各画像について、抽出された画像全部の特徴量から、当該元画像の解像度である元解像度より低い少なくとも１つの低解像度段階の各々における低解像度キーポイント及び低解像度記述子を生成する低解像度特徴量生成手段と、
当該低解像度段階毎に、当該２つの元画像の間で当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成する低解像度キーポイントマッチング手段と、
当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対しアップサンプリング（upsampling）処理を実施し、当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応キーポイントを生成し、抽出結果として出力する元解像度対応キーポイント抽出手段と、
当該各画像について、抽出された画像全体の特徴量から生成された、各低解像度段階における低解像度画像全体特徴量を用いて、または当該低解像度画像全体特徴量に対しキーポイント検出処理を施すことによって生成された、各低解像度段階における低解像度対応画像特徴量を用いて、当該元画像に対応する元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成し、抽出結果として出力する元解像度対応記述子抽出手段と
してコンピュータを機能させることを特徴とする画像特徴量抽出モデル。

【請求項2】

前記低解像度キーポイントマッチング手段は、
当該各画像について、出力されて外部で更新された当該元解像度対応キーポイント及び当該元解像度対応記述子である更新された元解像度対応キーポイント及び更新された元解像度対応記述子を受け取り、
当該各画像について、当該低解像度段階毎に、当該低解像度段階へのリスケール（re-scale）処理の施された当該更新された元解像度対応キーポイントと、当該更新された元解像度対応記述子とに対しプーリング処理を実施して、当該低解像度段階に合わせた低解像度化キーポイント及び低解像度化記述子を生成し、
当該各画像について、当該低解像度段階毎に、当該低解像度段階における当該低解像度化記述子と、先に生成された当該画像全部の特徴量から当該低解像度化キーポイントに基づき生成された記述子とをマージして、更新された低解像度化記述子を生成し、
当該各画像について、当該低解像度段階毎に、当該低解像度化キーポイントと先に生成された当該低解像度キーポイントとを合わせて新たな低解像度キーポイントとし、更新された当該低解像度化記述子と先に生成された当該低解像度記述子とを合わせて新たな低解像度記述子として、当該２つの元画像の間で新たな当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成する
ことを特徴とする請求項１に記載の画像特徴量抽出モデル。

【請求項3】

前記画像特徴量抽出モデルは、
前記低解像度キーポイントマッチング手段における、当該更新された元解像度対応キーポイント及び当該更新された元解像度対応記述子を受け取ってマッチした当該低解像度キーポイントのペアを生成する処理、
前記元解像度対応キーポイント抽出手段における、当該元解像度対応キーポイントを生成し抽出結果として出力する処理、及び
前記元解像度対応記述子抽出手段における、当該元解像度対応記述子を生成し抽出結果として出力する処理
のセットを複数回実施し、最後に生成された当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出結果として出力するようにコンピュータを機能させることを特徴とする請求項２に記載の画像特徴量抽出モデル。

【請求項4】

前記低解像度特徴量生成手段は、当該各画像について、当該低解像度段階毎に、当該画像全部の特徴量から、当該低解像度段階における当該低解像度キーポイント及び低解像度画像全部特徴量を生成して、当該低解像度画像全部特徴量から当該低解像度キーポイントに基づき、当該低解像度記述子を生成することを特徴とする請求項１から３のいずれか１項に記載の画像特徴量抽出モデル。

【請求項5】

前記元解像度対応キーポイント抽出手段は、当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対し当該元解像度へのリスケール処理を施した上で逆プーリング（unpooling）処理を実施し、当該低解像度段階において当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応化キーポイントを生成し、各低解像度段階における当該元解像度対応化キーポイントを取りまとめ、当該元解像度対応キーポイントとして出力することを特徴とする請求項１から４のいずれか１項に記載の画像特徴量抽出モデル。

【請求項6】

前記元解像度対応記述子抽出手段は、当該各画像について、当該画像全体の特徴量に対しパイプーリング（pypooling）処理を施して各低解像度段階における低解像度画像全体特徴量を生成し、各低解像度段階における畳み込み処理の施された当該低解像度画像全体特徴量に対しアップサンプリング処理を実施し、さらに当該画像全体の特徴量と合わせることによって当該元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成することを特徴とする請求項１から５のいずれか１項に記載の画像特徴量抽出モデル。

【請求項7】

前記元解像度対応記述子抽出手段は、当該各画像について、当該低解像度対応画像特徴量に対しマージする処理であって、１つの当該低解像度段階における当該マージする処理の結果に対し逆畳み込み処理を施したものと当該低解像度対応画像特徴量とをマージする処理を、解像度の低い順をもって元解像度の段階に向けて順次進めることによって、当該元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成することを特徴とする請求項１から５のいずれか１項に記載の画像特徴量抽出モデル。

【請求項8】

当該２つの元画像の各画像から、請求項１から７のいずれか１項に記載された画像特徴量抽出モデルを用いて、当該元画像の画像特徴量である当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出する画像特徴量抽出手段と、
抽出された当該元解像度対応キーポイント及び当該元解像度対応記述子を用いて、当該２つの元画像のマッチングを実施する画像マッチング手段と
を有することを特徴とする画像マッチング装置。

【請求項9】

当該２つの元画像の各画像から、請求項１から７のいずれか１項に記載された画像特徴量抽出モデルを用いて、当該元画像の画像特徴量である当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出する画像特徴量抽出手段と、
抽出された当該元解像度対応キーポイント及び当該元解像度対応記述子を用いて、当該２つの元画像のマッチングを実施する画像マッチング手段と
としてコンピュータを機能させることを特徴とする画像マッチングプログラム。

【請求項10】

画像マッチング手段は、
当該各画像について、当該元解像度対応キーポイントを用いて当該元画像を表現するグラフを生成するグラフ生成手段と、
当該各画像について、当該元解像度対応記述子に対し当該グラフを用いたグラフアテンション（graph attention）処理を施して、更新された元解像度対応記述子を生成するグラフアテンション手段と、
更新された当該元解像度対応記述子を用いて当該元解像度対応キーポイントのマッチング処理を実施するキーポイントマッチング手段と
を有することを特徴とする請求項９に記載の画像マッチングプログラム。

【請求項11】

２つの元画像の各画像からキーポイント及び記述子を抽出するコンピュータによって実施される画像特徴量抽出方法であって、
当該各画像について、抽出された画像全部の特徴量から、当該元画像の解像度である元解像度より低い少なくとも１つの低解像度段階の各々における低解像度キーポイント及び低解像度記述子を生成するステップと、
当該低解像度段階毎に、当該２つの元画像の間で当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成するステップと、
当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対しアップサンプリング処理を実施し、当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応キーポイントを生成し、抽出結果として出力するステップと、
当該各画像について、抽出された画像全体の特徴量から生成された、各低解像度段階における低解像度画像全体特徴量を用いて、または当該低解像度画像全体特徴量に対しキーポイント検出処理を施すことによって生成された、各低解像度段階における低解像度対応画像特徴量を用いて、当該元画像に対応する元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成し、抽出結果として出力するステップと
を有することを特徴とする画像特徴量抽出方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像マッチング技術、及び当該技術の要となる画像特徴量抽出技術に関する。

【背景技術】

【0002】

画像特徴量抽出や画像マッチングは、画像検索、視覚的探索や、３次元（３Ｄ）画像構築といったような、画像から視覚にかかわる成果物を選択・生成するのに重要な技術となっている。ここで、従来多くの場合、最初にマッチング対象の画像から画像特徴量としてのキーポイント（keypoints）及び記述子（descriptors）を抽出し、次いで、抽出されたこれらの特徴量を用いてキーポイントマッチングを実施する方法が提案されてきた。

【0003】

このうち画像特徴量抽出について、例えば特許文献１には、ガウシアン画像ピラミッド（Gaussian Pyramid）をなす互いに異なる解像度の複数の画像（octaves）を用いて、キーポイントを抽出する技術が開示されている。また、特許文献２には、角領域からキーポイント候補を抽出した上でキーポイントと記述子とを決定する技術が開示されている。

【0004】

さらに、非特許文献１には、ニューラルネットワークのバックボーン（backbone）を用いて、ローレベルの特徴量である画像のラインに沿ったキーポイントを抽出してさらにライン検出を行い、次いでハイレベルの特徴量である、検出されたラインに対応する記述子を生成する技術が開示されている。またこの後、検出ライン及び生成された記述子を用いてラインマッチングが実施されるのである。

【0005】

また、非特許文献２には、人の知見に基づき設計されたハンドクラフテッド（handcrafted）特徴量用のＣＮＮ（Convolutional Neural Network）と、機械学習ベースの特徴量用のＣＮＮとを結合させたマルチスケールピラミッド（multi-scale pyramid）のフィルタを用いて、互いに異なる解像度下でのキーポイントを抽出し、その後、最終的なキーポイントを決定する技術が開示されている。

【0006】

以上説明したように、従来多くの研究では、画像特徴量抽出と画像マッチングとは互いに独立した処理となっている。一方で、画像特徴量抽出及び画像マッチングを１つのタスクとして取り扱う技術も、いくつか提案されている。

【0007】

例えば非特許文献３には、入力されたクエリキーポイント（query keypoint）から低解像度下での画像特徴量としての信頼度ヒートマップ（confidence heatmap）を生成し、このヒートマップを用いて、高解像度下での対応キーポイント（correspondence keypoint）を決定している。ここで対応キーポイントは、クエリキーポイントに対応する（マッチング相手である）他方の画像におけるマッチしたキーポイントとなっているのである。

【0008】

また、非特許文献４には、画像間における画素毎のマッチングを行うセミデンス（semi-dense）マッチングによって、キーポイント検出を行うことなく、マッチした画素のペアを決定して画像マッチングを行う技術が開示されている。具体的には、最初にニューラルネットワーク・バックボーンを用いて画像から局所特徴量を抽出し、次いで、低解像度対応トランスフォーマ（coarse-level transformer）を用いてマルチヘッドアテンション（multi-heads attention）によるデンスマッチングを実施し、これにより低解像度下でのマッチした画素ペアを決定し、さらにこのマッチした画素ペアから、高解像度対応トランスフォーマ（fine-level transformer）によって、高精度のマッチしたキーポイントを決定している。

【0009】

さらに、非特許文献５には、マルチモダリティ画像（画像範囲や解像度等の多様な画像）を取り扱うことの可能な、低解像度から高解像度までの各段階における機械学習ベースの画像位置合わせ（image registration）アルゴリズムが開示されている。このアルゴリズムでは、最初に学習済みのＢＥＬ検出器を用いて、複数の低解像度段階におけるキーポイントを抽出し、次いで、各低解像度段階に対応したブースティングノード（boosting node）が連続して設けられた学習済みの分類器を用いて、これらのキーポイントマッチングを行っている。次いで、高解像度段階でのキーポイントと所与のランドマークポイント（landmark point）との一致具合いを学習した上で、ＲＡＮＳＡＣ（RANdam SAmple Concensus）アルゴリズムを用いて学習パラメータの訓練が行われたアフィン変換器を用いて、高解像度下でのキーポイントマッチングを実施している。

【先行技術文献】

【特許文献】

【0010】

【文献】米国特許出願公開第２０１２／００２７２９０号明細書

【文献】米国特許出願公開第２０１６／０２９２８８７号明細書

【非特許文献】

【0011】

【文献】Remi Pautrat, Juan-Ting Lin, Viktor Larsson, Martin R. Oswald, and Marc Pollefeys, “SOLD2: Self-supervised Occlusion-aware Line Description and Detection”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://arxiv.org/pdf/2104.03362.pdf＞, ２０２１年

【文献】Axel Barroso-Laguna, Edgar Riba, Daniel Ponsa, Krystian Mikolajczyk, “Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters”, International Conference on Computer Vision, ＜https://arxiv.org/pdf/1904.00889.pdf＞, ２０１９年

【文献】Qianqian Wang, Xiaowei Zhou, Bharath Hariharan, Noah Snavely, “Learning Feature Descriptors using Camera Pose Supervision”, European Conference on Computer Vision, ＜https://arxiv.org/pdf/2004.13324.pdf＞, ２０２０年

【文献】Jiaming Sun, Zehong Shen, Yu'ang Wang, Hujun Bao, and Xiaowei Zhou, “LoFTR: Detector-Free Local Feature Matching with Transformers”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://arxiv.org/pdf/2104.00680.pdf＞, ２０２１年

【文献】Jiayan Jiang, Songfeng Zheng, Arthur W. Toga, and Zhuowen Tu, “Learning based coarse-to-fine image registration”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://doi.org/10.1109/CVPR.2008.4587396＞, ２００８年

【発明の概要】

【発明が解決しようとする課題】

【0012】

しかしながら、従来の画像特徴量抽出技術及び画像マッチング技術においては、例えば、マッチング対象画像のうちの一方がスマートフォン搭載カメラによる非常に高い解像度の画像であって、他方が、例えば国土交通省主導の３Ｄ（３次元）都市モデル・オープンデータ化プロジェクト（Plateau, ＜https://www.mlit.go.jp/plateau/＞）等に係る３Ｄモデルからレンダリング（描画）された、比較的低い解像度の画像であるような場合に、十分な精度をもって画像マッチングを実施することが困難となることも少なくない。

【0013】

具体的に、上述したような２つの画像は通常、テクスチャ領域における解像度が互いに大きく異なっており、また、特に３Ｄモデルのレンダリング画像は、解像度が画像内においても一定せずにばらついている。その結果、従来の画像特徴量抽出技術及び画像マッチング技術では、決定したマッチしたペアの多くが実際にはマッチしていないペアであるような精度の低い結果となってしまうことも少なくない。ちなみにこのような低精度の結果の従来例として、図５（Ａ）に、典型的な画像特徴量であるＳＩＦＴ（Scale-Invariant Feature Transform）を用いた画像マッチング結果（従来例１）を示している。

【0014】

また一般に、キーポイントの探索は、画像に含まれるオブジェクトのラインや形状に対応した低解像度下での画像特徴に基づき行うことによって、より精度の高い画像マッチング結果の得られることが知られている。これは、このような低解像度下での画像特徴は、幾何学的な一致の度合いを反映しやすいことによる。しかしながら、低解像度下での画像特徴に基づくキーポイントの探索では、例えば図５（Ｂ）に示した従来例２のように、画像マッチングに十分な数のキーポイントを取得することが困難となってしまう。

【0015】

さらに、例えば建造物の立ち並んだ市街の３Ｄモデルのレンダリング画像において、建造物の大まかな形状は通常、実際の形状と概ね一致するか、少なくとも類似したものとなる。しかしながら、建造物における細部の構造、例えば窓枠の形状は、実際のものと大きく相違することも少なくない。ちなみに、上述したような３Ｄ都市モデルにおいては、ある建造物にとって付帯的となる（例えば脇にある）建造物がデータ化されていない場合もあり得るのであり、このことも画像マッチング結果に大きな影響を及ぼしてしまう。

【0016】

ここで図５（Ｃ）に、マッチング対象の画像間において上述したような細部の構造や付帯物が相違する従来例３を示している。図５（Ｃ）によれば、両画像において対応するビルディングの細部の構造や、ビルディング群の足元の付帯的な建造物が大きく相違していることが分かる。ちなみにこれは、３Ｄレンダリング画像の元となる３Ｄモデルにそもそも、細部の構造や付帯的な建造物がキャプチャされていないことによるのである。

【0017】

以上説明したような従来技術の課題を鑑みると、画像間の解像度の乖離に対応したキーポイント抽出を行い、ラインや形状ベースのキーポイントとは別により多くのキーポイントを見出し、さらに、建造物の細部の構造や付帯的な建造物にも対応できるような画像特徴の抽出を行うことが非常に重要となることが理解される。

【0018】

しかしながら、上述したような従来の画像特徴量抽出技術及び画像マッチング技術、例えば特許文献１及び２、並びに非特許文献２、３及び４に開示された技術では、当初、低解像度下での画像特徴量を用いて処理を行うのみであり、上記のような課題を解決することは到底できない。

【0019】

ここで、このうち非特許文献４に開示された技術ではたしかに、低解像度下でのマッチした画素ペアを用いて高解像度下でのキーポイントを生成している。しかしながら、ここで使用されるデンスマッチングには膨大な計算コストがかかることもあって、あくまで１つの低解像度を扱うのみとなっており、さらに、このように低解像度下で生成した情報は何ら画像マッチングに用いられていない。

【0020】

一方、非特許文献１及び５に開示された技術ではたしかに、低解像度下でのラインベースの画像特徴量と、低解像度下で生成した情報とをともに用いて画像マッチングを行っている。ここで非特許文献１の技術では、キーポイントは結局、低解像度下でのライン及びエッジベースのものだけであり、その数は限定されてしまう。これに対し、非特許文献５の技術では、複数の低解像度段階においてキーポイントの検出及びマッチングを行っており、さらにこれらのキーポイントに対しアップサンプリング（upsampling）処理（補間により数を増やす処理）を施した上で、高解像度下でのキーポイントマッチングを実施している。

【0021】

しかしながら、非特許文献５に開示された技術においても、高解像度下での記述子を抽出することや、キーポイントを再度検出することは何ら行われていない。さらに、キーポイントマッチングも幾何学的な変換器を用いて実施されているだけであって、例えば視覚的な類似性を用いて高解像度下でのマッチング精度を高める、といったようなことは何ら行なわれていない。またその結果、例えば建造物の細部の構造や付帯的な（例えば脇にある）建造物にも対応できるような画像特徴を見出すことは到底できないのである。

【0022】

そこで、本発明は、画像間の解像度の乖離にも対応することができ、より多くのキーポイントを生成し、さらに画像内オブジェクトの細部や付帯的な情報もより多く考慮することの可能な画像マッチング処理を実施することができる画像マッチング装置及び画像マッチングプログラムを提供することを目的とする。また、そのような画像マッチング処理を実施可能にする画像特徴量を抽出することができる画像特徴量抽出モデル及び画像特徴量抽出方法を提供することを目的とする。

【課題を解決するための手段】

【0023】

本発明によれば、２つの元画像の各画像からキーポイント及び記述子（descriptor）を抽出するコンピュータを機能させる画像特徴量抽出モデルであって、
当該各画像について、抽出された画像全部の特徴量から、当該元画像の解像度である元解像度より低い少なくとも１つの低解像度段階の各々における低解像度キーポイント及び低解像度記述子を生成する低解像度特徴量生成手段と、
当該低解像度段階毎に、当該２つの元画像の間で当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成する低解像度キーポイントマッチング手段と、
当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対しアップサンプリング（upsampling）処理を実施し、当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応キーポイントを生成し、抽出結果として出力する元解像度対応キーポイント抽出手段と、
当該各画像について、抽出された画像全体の特徴量から生成された、各低解像度段階における低解像度画像全体特徴量を用いて、または当該低解像度画像全体特徴量に対しキーポイント検出処理を施すことによって生成された、各低解像度段階における低解像度対応画像特徴量を用いて、当該元画像に対応する元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成し、抽出結果として出力する元解像度対応記述子抽出手段と
してコンピュータを機能させる画像特徴量抽出モデルが提供される。

【0024】

この本発明による画像特徴量抽出モデルの一実施形態として、低解像度キーポイントマッチング手段は、
当該各画像について、出力されて外部で更新された当該元解像度対応キーポイント及び当該元解像度対応記述子である更新された元解像度対応キーポイント及び更新された元解像度対応記述子を受け取り、
当該各画像について、当該低解像度段階毎に、当該低解像度段階へのリスケール（re-scale）処理の施された当該更新された元解像度対応キーポイントと、当該更新された元解像度対応記述子とに対しプーリング処理を実施して、当該低解像度段階に合わせた低解像度化キーポイント及び低解像度化記述子を生成し、
当該各画像について、当該低解像度段階毎に、当該低解像度段階における当該低解像度化記述子と、先に生成された当該画像全部の特徴量から当該低解像度化キーポイントに基づき生成された記述子とをマージして、更新された低解像度化記述子を生成し、
当該各画像について、当該低解像度段階毎に、当該低解像度化キーポイントと先に生成された当該低解像度キーポイントとを合わせて新たな低解像度キーポイントとし、更新された当該低解像度化記述子と先に生成された当該低解像度記述子とを合わせて新たな低解像度記述子として、当該２つの元画像の間で新たな当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成する
ことも好ましい。

【0025】

また、本発明による画像特徴量抽出モデルは、
（ａ）低解像度キーポイントマッチング手段における、当該更新された元解像度対応キーポイント及び当該更新された元解像度対応記述子を受け取ってマッチした当該低解像度キーポイントのペアを生成する処理、
（ｂ）元解像度対応キーポイント抽出手段における、当該元解像度対応キーポイントを生成し抽出結果として出力する処理、及び
（ｃ）元解像度対応記述子抽出手段における、当該元解像度対応記述子を生成し抽出結果として出力する処理
のセットを複数回実施し、最後に生成された当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出結果として出力するようにコンピュータを機能させることも好ましい。

【0026】

さらに、本発明による画像特徴量抽出モデルにおける他の実施形態として、低解像度特徴量生成手段は、当該各画像について、当該低解像度段階毎に、当該画像全部の特徴量から、当該低解像度段階における当該低解像度キーポイント及び低解像度画像全部特徴量を生成して、当該低解像度画像全部特徴量から当該低解像度キーポイントに基づき、当該低解像度記述子を生成することも好ましい。

【0027】

さらにまた、本発明による画像特徴量抽出モデルにおける更なる他の実施形態として、元解像度対応キーポイント抽出手段は、当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対し当該元解像度へのリスケール処理を施した上で逆プーリング（unpooling）処理を実施し、当該低解像度段階において当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応化キーポイントを生成し、各低解像度段階における当該元解像度対応化キーポイントを取りまとめ、当該元解像度対応キーポイントとして出力することも好ましい。

【0028】

また、本発明に係る元解像度対応記述子抽出手段は、第１の実施形態として、当該各画像について、当該画像全体の特徴量に対しパイプーリング（pypooling）処理を施して各低解像度段階における低解像度画像全体特徴量を生成し、各低解像度段階における畳み込み処理の施された当該低解像度画像全体特徴量に対しアップサンプリング処理を実施し、さらに当該画像全体の特徴量と合わせることによって当該元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成することも好ましい。

【0029】

さらに、本発明に係る元解像度対応記述子抽出手段は、第２の実施形態として、当該各画像について、当該低解像度対応画像特徴量に対しマージする処理であって、１つの当該低解像度段階における当該マージする処理の結果に対し逆畳み込み処理を施したものと当該低解像度対応画像特徴量とをマージする処理を、解像度の低い順をもって元解像度の段階に向けて順次進めることによって、当該元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成することも好ましい。

【0030】

本発明によれば、また、当該２つの元画像の各画像から、以上に述べた画像特徴量抽出モデルを用いて、当該元画像の画像特徴量である当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出する画像特徴量抽出手段と、
抽出された当該元解像度対応キーポイント及び当該元解像度対応記述子を用いて、当該２つの元画像のマッチングを実施する画像マッチング手段と
を有する画像マッチング装置が提供される。

【0031】

本発明によれば、さらに、当該２つの元画像の各画像から、以上に述べた画像特徴量抽出モデルを用いて、当該元画像の画像特徴量である当該元解像度対応キーポイント及び当該元解像度対応記述子を抽出する画像特徴量抽出手段と、
抽出された当該元解像度対応キーポイント及び当該元解像度対応記述子を用いて、当該２つの元画像のマッチングを実施する画像マッチング手段と
としてコンピュータを機能させる画像マッチングプログラムが提供される。

【0032】

この本発明による画像マッチングプログラムの一実施形態として、画像マッチング手段は、
当該各画像について、当該元解像度対応キーポイントを用いて当該元画像を表現するグラフを生成するグラフ生成手段と、
当該各画像について、当該元解像度対応記述子に対し当該グラフを用いたグラフアテンション（graph attention）処理を施して、更新された元解像度対応記述子を生成するグラフアテンション手段と、
更新された当該元解像度対応記述子を用いて当該元解像度対応キーポイントのマッチング処理を実施するキーポイントマッチング手段と
を有することも好ましい。

【0033】

本発明によれば、また、２つの元画像の各画像からキーポイント及び記述子を抽出するコンピュータによって実施される画像特徴量抽出方法であって、
当該各画像について、抽出された画像全部の特徴量から、当該元画像の解像度である元解像度より低い少なくとも１つの低解像度段階の各々における低解像度キーポイント及び低解像度記述子を生成するステップと、
当該低解像度段階毎に、当該２つの元画像の間で当該低解像度キーポイントのマッチング処理を実施し、マッチした当該低解像度キーポイントのペアを生成するステップと、
当該各画像について、当該低解像度段階毎に、マッチした当該低解像度キーポイントに対しアップサンプリング処理を実施し、当該低解像度キーポイントよりも多い数の、当該元解像度に対応した元解像度対応キーポイントを生成し、抽出結果として出力するステップと、
当該各画像について、抽出された画像全体の特徴量から生成された、各低解像度段階における低解像度画像全体特徴量を用いて、または当該低解像度画像全体特徴量に対しキーポイント検出処理を施すことによって生成された、各低解像度段階における低解像度対応画像特徴量を用いて、当該元画像に対応する元画像対応画像特徴量を生成し、当該元画像対応画像特徴量から当該元解像度対応キーポイントに基づき、当該元解像度に対応した元解像度対応記述子を生成し、抽出結果として出力するステップと
を有する画像特徴量抽出方法が提供される。

【発明の効果】

【0034】

本発明の画像マッチング装置及び画像マッチングプログラムによれば、画像間の解像度の乖離にも対応することができ、より多くのキーポイントを生成し、さらに画像内オブジェクトの細部や付帯的な情報もより多く考慮することが可能な画像マッチング処理を実施することができる。また、本発明の画像特徴量抽出モデル及び画像特徴量抽出方法によれば、そのような画像マッチング処理を実施可能にする画像特徴量を抽出することができる。

【図面の簡単な説明】

【0035】

【図1】本発明による画像特徴量抽出モデルの一実施形態を示す模式図である。

【図2】スマートフォンカメラ画像と３Ｄレンダリング画像とに対し、本発明に係る種々の処理を施した実施例を示す模式図である。

【図3】本発明による画像特徴量抽出方法の一実施形態における概略を示すフローチャートである。

【図4】本発明による画像マッチング装置９の一実施形態を示す機能ブロック図である。

【図5】画像特徴量抽出技術及び画像マッチング技術の従来例を示す模式図である。

【発明を実施するための形態】

【0036】

以下、本発明の実施形態について、図面を用いて詳細に説明する。

【0037】

［画像特徴量抽出モデル］
図１は、本発明による画像特徴量抽出モデルの一実施形態を示す模式図である。

【0038】

図１に示した本実施形態の画像特徴量抽出モデル１は、
（ａ）画像マッチングの対象である元画像Ａ及び元画像Ｂのそれぞれの画像データを入力とし、
（ｂ）元画像Ａのキーポイント群及び記述子（descriptor）群であって、元画像Ａの解像度（元解像度）に対応したキーポイント群及び記述子群(K_Fin, F_Fin)^Aと、元画像Ｂのキーポイント群及び記述子群であって、元画像Ｂの解像度（元解像度）に対応したキーポイント群及び記述子群(K_Fin, F_Fin)^Bとを出力する
機械学習モデルとなっている。

【0039】

ここで、キーポイントは、設定された所定の観点から対象となる画像を見た場合に、画像中において特徴的と判断される部分（画像識別の際に重要となる部分）のことである。また、記述子は、キーポイントの周囲の画像領域から取り出された特徴量であって、具体的にはこのキーポイントの意味情報を記述する高次元ベクトルである。これらキーポイント及び記述子は、画像マッチングを行うための重要な画像特徴量となっている。

【0040】

以上述べたような画像特徴量処理を実現するべく、画像特徴量抽出モデル１は具体的に、
（Ａ）元画像Ａ及びＢの各画像について、抽出された「画像全部の特徴量」D₀から、当該元画像の解像度である元解像度より低い少なくとも１つ（L個）の低解像度段階の各々における「低解像度キーポイント」K¹ _C～K^L _C及び「低解像度記述子」F¹ _C～F^L _Cを生成する低解像度特徴量生成部１１と、
（Ｂ）上記の低解像度段階毎に、元画像Ａ及びＢの間で「低解像度キーポイント」のマッチング処理を実施し、マッチした「低解像度キーポイント」のペアM¹ _C～M^L _Cを生成する低解像度キーポイント（ＫＰ）マッチング部１２と、
（Ｃ）元画像Ａ及びＢの各画像について、上記の低解像度段階毎に、マッチした「低解像度キーポイント」に対しアップサンプリング（upsampling）処理を実施し、「低解像度キーポイント」よりも多い数の、元解像度に対応した「元解像度対応キーポイント」K_Finを生成し、抽出結果として出力する元解像度対応キーポイント（ＫＰ）抽出部１３と、
（Ｄ）元画像Ａ及びＢの各画像について、（ｄ１）抽出された「画像全体の特徴量」D₀''から生成された各低解像度段階における「低解像度画像全体特徴量」D_i''を用いて、または（ｄ２）抽出された「画像全体の特徴量」D₀''から生成された「低解像度対応画像特徴量」Dⁱ _C''を用いて、元画像（Ａ，Ｂ）に対応する「元画像対応画像特徴量」D_Finを生成し、「元画像対応画像特徴量」D_Finから「元解像度対応キーポイント」K_Finに基づき、元解像度に対応した「元解像度対応記述子」F_Finを生成し、抽出結果として出力する元解像度対応記述子（ＤＳ）抽出部１４と
してコンピュータを機能させる。

【0041】

このように画像特徴量抽出モデル１においては、上記（Ｂ）の低解像度ＫＰマッチング部１２が（一般に、より精度の高い画像マッチング結果が得られる）低解像度段階毎のキーポイントマッチングを行い、そのマッチング結果を用いて上記（Ｃ）の元解像度対応ＫＰ抽出部１３が「元解像度対応キーポイント」K_Finを生成している。その結果、例えば元画像Ａの解像度と元画像Ｂの解像度とが大きく異なっている場合においても、後に精度の高い画像マッチング処理を実施可能にするキーポイント群を生成することができるのである。

【0042】

なお、上記の解像度が乖離している場合として、例えば、元画像Ａがスマートフォン搭載カメラによる非常に高い解像度の画像であって、元画像Ｂが３Ｄモデルからレンダリング（描画）された、比較的低い解像度の画像である場合が挙げられる。実際、このような場合は、画像マッチング処理を実施する様々な分野において一般的にみられるものである。

【0043】

また、画像特徴量抽出モデル１においては、上記（Ｃ）の元解像度対応ＫＰ抽出部１３が、上記（Ｂ）の低解像度ＫＰマッチング部１２から取得した、マッチした「低解像度キーポイント」に対しアップサンプリング処理を実施し、「低解像度キーポイント」よりも多い数の「元解像度対応キーポイント」K_Finを生成している。その結果、より多い数のキーポイント群を用いてこの後、より精度の高い画像マッチングを行うことも可能となるのである。

【0044】

さらに、上記（Ｄ）の元解像度対応ＤＳ抽出部１４においては、「画像全体の特徴量」D₀''に基づき生成された「元画像対応画像特徴量」D_Finから、（より適切な且つより多い数の）「元解像度対応キーポイント」K_Finに基づき「元解像度対応記述子」F_Finを生成している。この「元解像度対応記述子」F_Finはそれ故、記述性（descriptiveness，画像の特徴を漏らすことなく的確に記述している程度）のより高い、例えば画像内オブジェクトの細部や付帯的な情報もより確実に記述可能な画像特徴量となっている。

【0045】

したがって、例えば元画像Ａが、スマートフォン搭載カメラによって建造物の立ち並んだ市街を撮影することにより生成された非常に高い解像度の画像であって、元画像Ｂが、同じ市街の３Ｄモデルからレンダリング（描画）された、比較的低い解像度の画像である場合に、両画像において、建造物における細部の構造（例えば窓枠の形状）や、建造物にとって付帯的となる（例えば脇にある）建造物の有無等が大きく異なっていたとしても、この記述性の高い「元解像度対応記述子」F_Finを用いることにより、より精度の高い画像マッチング処理を実施することも可能となるのである。

【0046】

以上、画像特徴量抽出モデル１によれば、画像間の解像度の乖離にも対応することができ、より多くのキーポイントを生成し、さらに画像内オブジェクトの細部や付帯的な情報もより多く考慮することができる画像マッチング処理を実施可能とする画像特徴量（K_Fin, F_Fin）を抽出することができるのである。

【0047】

なお、本明細書において使用されるキーポイントに係る添え字付きのK、及び記述子に係る添え字付きのFは、正確にはそれぞれ、キーポイントkの集合（K＝{k}）及び記述子dの集合（F＝{d}）を表している。しかしながら以下簡便な記載のため、いずれも単にキーポイントや記述子として述べる場合も少なくないことに留意すべきである。

【0048】

［モデル構成］
以下、本実施形態の画像特徴量抽出モデル１の構成について、より詳細に説明を行う。同じく図１によれば、画像特徴量抽出モデル１は本実施形態において、
（ア）ＣＮＮ部１１ａ、並びに、低ＫＰ生成部（１１－１ａ，・・，１１－Ｌａ）及び低ＤＳ生成部（１１－１ｂ，・・，１１－Ｌｂ）を有する低解像度特徴量生成部１１と、
（イ）ダウンサンプリング部１２ａ、マージ部１２ｂ、及びＫＰマッチング部１２ｃを有する低解像度ＫＰマッチング部１２と、
（ウ）アップサンプリング部１３ａ及び集合部１３ｂを有する元解像度対応ＫＰ抽出部１３と、
（エ）ＲｅｓＮｅｔ部１４ａ、低画像特徴生成部（１４－１，・・，１４－Ｌ）、及び元解像度対応ＤＳ生成部１４ｂを有する元解像度対応ＤＳ抽出部１４と
を、コンピュータに搭載されたプログラムによって具現される機能構成部として備えている。言い換えるとこれらの機能構成部としてコンピュータを機能させるモデルとなっているのである。以下、上述した各機能構成部について具体的に説明を行う。

【0049】

＜低解像度特徴量生成手段＞
同じく図１に示したように、本実施形態の低解像度特徴量生成部１１においては、
（ア１）ＣＮＮ部１１ａが、元画像Ａ及びＢの各画像データIから、画像全部特徴量D₀を抽出し、
（ア２）低ＫＰ生成部（１１－１ａ，・・，１１－Ｌａ）が、元画像Ａ及びＢの各々について、画像全部特徴量D₀から、元画像（Ａ, Ｂ）の解像度である元解像度より低いL個（本実施形態ではL≧2）の低解像度段階の各々における低解像度キーポイント（K¹ _C, ・・, K^L _C）及び低解像度画像全部特徴量（D¹ _C, ・・, D^L _C）を生成し、
（ア３）低ＤＳ生成部（１１－１ｂ，・・，１１－Ｌｂ）が、元画像Ａ及びＢの各々について、低解像度画像全部特徴量（D¹ _C, ・・, D^L _C）から、低解像度キーポイント（K¹ _C, ・・, K^L _C）に基づき各低解像度段階における低解像度記述子（F¹ _C, ・・, F^L _C）を生成する。

【0050】

以下、上記（ア１）～（ア３）の処理をより具体的に説明する。最初に上記（ア１）のＣＮＮ部１１ａは本実施形態において、元画像（Ａ, Ｂ）の画像データI（I^(A)又はI^(B)）から、次式
（１） D₀＝CNN^BB(I)
によって画像全部特徴量D₀を算出する。

【0051】

ここで、CNN^BB(・)は、公知のＣＮＮ（Convolutional Neural Network）バックボーン（Backbone）での処理を表す演算子であり、H(ピクセル)×W(ピクセル)の例えばＲＧＢ画像である画像データIの属する画像空間（Ｒ^H×W×3）から、H⁰ _C(＜H)×W⁰ _C(＜W)×N_F(記述子の次元数)の画像全部特徴量の属する特徴量空間（Ｒ^H0C×W0C×NF）への写像を行う写像演算子である。ここで（キーポイントのピクセル）解像度H⁰ _C×W⁰ _Cは、解像度H×Wよりも小さい値（空間次元数）となっている。

【0052】

次に、上記（ア２）におけるi（1≦i≦L）番目の低解像度段階の低ＫＰ生成部１１－(i)ａは、元画像Ａ及びＢの各々の画像全部特徴量D₀から、次式
（２） Kⁱ _C, Dⁱ _C＝Detⁱ(D₀)
を用いて、i番目の低解像度段階における低解像度キーポイントKⁱ _C（1≦i≦L）及び低解像度画像全部特徴量Dⁱ _C（1≦i≦L）を算出する。ここで、Detⁱ(・)は、（i番目の低解像度段階相当の解像度の）画像に対しキーポイント検出を行うキーポイント検出演算子である。このDetⁱ(・)として、例えば非特許文献１に開示されたラインベースの検出器を使用してもよく、その他、形状ベースの検出器等、種々様々な公知のキーポイント検出演算子が採用可能となっている。

【0053】

また、上式（２）によって算出される低解像度画像全部特徴量Dⁱ _Cは、Hⁱ _C×Wⁱ _C×Nⁱ _C(記述子の次元数)次元の低解像度画像空間（Ｒ^{HiC×WiC×NiC}）に属しており、いわゆるデンス記述子（dense descriptors）となっている。さらに、同じく算出される低解像度キーポイントKⁱ _Cは、画像座標系Ｒ²内の点の集合であり、すなわちKⁱ _C＝{(x, y)∈Ｒ²}となっているのである。

【0054】

次に、上記（ア３）におけるi（1≦i≦L）番目の低解像度段階の低ＤＳ生成部１１－(i)ｂは、元画像Ａ及びＢの各々の低解像度画像全部特徴量Dⁱ _Cから、低解像度キーポイントKⁱ _Cに基づき、次式
（３） Fⁱ _C＝Dⁱ _C(x,y,:)_(x,y)∈KiC
を用いて、i番目の低解像度段階における低解像度記述子Fⁱ _C（1≦i≦L）を算出する。この上式（３）は、低解像度記述子Fⁱ _Cが、低解像度画像全部特徴量Dⁱ _Cを構成する画像特徴量（記述子群）のうちの、低解像度キーポイントKⁱ _Cに属する座標点(x,y)に相当するものであることを示している。言い換えると、低解像度記述子Fⁱ _Cは、低解像度キーポイントKⁱ _Cで規定される空間位置に基づき、低解像度画像全部特徴量Dⁱ _C（を構成する記述子群）から選択された記述子（群）であり、低解像度キーポイントKⁱ _Cの画像内個数（濃度，cardinality）|Kⁱ _C|をkⁱとすると、kⁱ×Nⁱ _C次元の低解像度記述子空間（Ｒ^ki×NiC）に属する記述子（群）となっているのである。

【0055】

以上、低解像度特徴量生成部１１は、上記（ア１）～（ア３）における処理によって、元画像Ａ及びＢの各々における、各低解像度段階（1, 2, ・・, L）での低解像度キーポイント及び低解像度記述子のペア、すなわち
（４） {(K¹ _C, F¹ _C), (K² _C, F² _C), ・・, (K^L _C, F^L _C)}
(Kⁱ _C, Fⁱ _C)＝{(k, d)|k∈Kⁱ _C, d∈Fⁱ _C}
を生成するのである。このように低解像度特徴量生成部１１は、この後、低解像度ＫＰマッチング処理を低解像度段階毎に独立して実施することができるように、各低解像度段階（i）でのペア(Kⁱ _C, Fⁱ _C)をそのまま出力することを特徴としている。

【0056】

この点、従来技術、例えば非特許文献１及び２や、非特許文献：Zixin Luo, et al., “ASLFeat: Learning Local Features of Accurate Shape and Localization”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://arxiv.org/pdf/2003.10071.pdf＞, ２０２０年に開示された手法では、低解像度キーポイント及び低解像度記述子のペアを生成するが、この後、低解像度段階毎に低解像度キーポイントマッチング処理を実施することには何ら対応していないのである。

【0057】

ここで、上式（４）のペア(Kⁱ _C, Fⁱ _C)に係る解像度はHⁱ _C×Wⁱ _Cとなるが、この解像度は、上式（１）のCNN^BB(・)としてどのようなバックボーンを採用するかによって、i＝1の場合に最も高くなる（i＝Lの場合に最も低くなる）のか、又はその逆であるのかが決定される。例えば、CNN^BB(・)としてオートエンコーダ（autoencoder）を採用したならば、i＝1の場合に最も低くなり、i＝Lの場合に最も高くなる。

【0058】

以上、本実施形態の低解像度特徴量生成処理を説明したが、ここで図２（Ａ）に、スマートフォンカメラ画像と３Ｄレンダリング画像とに、本処理におけるキーポイント検出を行った実施例を示す。

【0059】

この実施例では、上式（２）のDetⁱ(・)として、非特許文献１に開示されたラインベースの検出器を使用している。このように高精度の期待されるラインベース検出を低解像度下で行うことによって、より高い精度でマッチしたキーポイントの得られることが確認されている。すなわち、スマートフォンカメラ画像と３Ｄレンダリング画像との間の解像度の大きな相違を補償するキーポイント検出が実現しているのである。

【0060】

＜低解像度ＫＰマッチング手段＞
同じく図１に示したように、本実施形態の低解像度ＫＰマッチング部１２は、元画像Ａ及びＢの各々について、
（＊）（後述する元解像度対応ＤＳ抽出部１４から出力されて）モデル外部で更新された元解像度対応キーポイント及び元解像度対応記述子である、更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Fin
を受け取り、以下に説明する（イ１）～（イ３）の処理を行って、マッチした低解像度キーポイントのペアM¹ _C～M^L _Cを生成する。

【0061】

ここで、上記（＊）の更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Finは、本実施形態において、後に詳述する画像マッチング部９３（図４）におけるキーポイントマッチング処理の結果得られた画像特徴量となっている。したがって、元解像度対応ＤＳ抽出部１４がまだ画像マッチング部９３へ抽出結果を出力していない段階、すなわち低解像度ＫＰマッチング処理の初回の段階では、以下の（イ１）及び（イ２）の処理は省略されて、低解像度ＫＰマッチング処理は（イ３）の処理から実施されることになる。

【0062】

なお他の実施形態として、そもそも更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Finを利用しない低解像度ＫＰマッチング処理を実施することも可能である。この場合、計算コストを低減することができるのである。

【0063】

同じく図１に示したように、本実施形態の低解像度ＫＰマッチング処理においては、具体的に、
（イ１）ダウンサンプリング部１２ａが、元画像Ａ及びＢの各々について、低解像度段階（1, 2, ・・, L）毎に、当該低解像度段階へのリスケール（re-scale）処理の施された更新された元解像度対応キーポイントK_Fin（以下ではKⁱ _{F→C_LOC}と表記）と、更新された元解像度対応記述子F_Finとに対しプーリング処理を実施して、当該低解像度段階に合わせた低解像度化キーポイントKⁱ _F→C及び低解像度化記述子Fⁱ _F→Cを生成し、
（イ２）マージ部１２ｂが、元画像Ａ及びＢの各々について、
（ａ）低解像度段階（1, 2, ・・, L）毎に、当該低解像度段階における低解像度化記述子Fⁱ _F→Cと、先に生成された画像全部特徴量D₀（によって生成された低解像度画像全部特徴量Dⁱ _C）から低解像度化キーポイントKⁱ _F→Cに基づき生成された記述子Fⁱ _{C_F→C}とをマージして、更新された低解像度化記述子Fⁱ _F→C_Mを生成し、さらにこの更新された低解像度化記述子Fⁱ _F→C_Mと先に生成された低解像度記述子Fⁱ _Cとを合わせて新たな低解像度記述子Fⁱ _C'とし、また、
（ｂ）低解像度段階（1, 2, ・・, L）毎に、当該低解像度段階における低解像度化キーポイントKⁱ _F→Cと先に生成された低解像度キーポイントKⁱ _Cとを合わせて新たな低解像度キーポイントKⁱ _C'とし、
（イ３）ＫＰマッチング部１２ｃが、低解像度段階毎（1, 2, ・・, L）に、元画像Ａ及びＢの間で、新たな低解像度記述子Fⁱ _C'を用いて新たな低解像度キーポイントKⁱ _C'のマッチング処理を実施し、マッチした低解像度キーポイントのペア{Mⁱ _C}を生成するのである。

【0064】

以下、上記（イ１）～（イ３）の処理をより具体的に説明する。最初に上記（イ１）のダウンサンプリング部１２ａは本実施形態において、元画像Ａ及びＢの各々について、低解像度段階（1, 2, ・・, L）毎に、受け取った更新された元解像度対応キーポイントK_Finと、更新された元解像度対応記述子F_Finとから、次式
（５） Kⁱ _F→C, Fⁱ _F→C＝Pool_i(Kⁱ _{F→C_LOC}, F_Fin) ここで、Kⁱ _{F→C_LOC}＝Re_i ^Down(K_Fin)
を用いて、低解像度化キーポイントKⁱ _F→C、及び低解像度化記述子Fⁱ _F→Cを生成する。

【0065】

ここで上式（５）において、Re_i ^Down(・)は、元解像度に対応したキーポイントの位置を低解像度段階（i）に対応した位置にリスケールする演算子である。また、Pool_i(・,・)は、演算対象のキーポイントを（多数のキーポイントが概ね同一位置とみなされる場合に）スーパーノード（super node）へプーリングするプーリング演算子となっている。

【0066】

なお、以上説明したようにダウンサンプリングによって生成された低解像度化キーポイントKⁱ _F→Cにおいて、その数（濃度，cardinality）|Kⁱ _F→C|は、リスケール処理で生成されたKⁱ _{F→C_LOC}の数（濃度，cardinality）|Kⁱ _{F→C_LOC}|以下となっている（|Kⁱ _F→C|≦|Kⁱ _{F→C_LOC}|）。一方、同じく生成された低解像度化記述子Fⁱ _F→C（∈Ｒ^Ki×NiF→C）において、その次元数Nⁱ _F→Cは、低解像度記述子Fⁱ _Cの次元数Nⁱ _Cと同一値に設定してもよく、または、次のマージ処理で使用される演算子に応じ、次元数Nⁱ _Cとは異なった値にすることも可能である。

【0067】

いずれにしても、このようなダウンサンプリングによって生成された低解像度化キーポイントKⁱ _F→Cや低解像度化記述子Fⁱ _F→Cは、この後、より適切なキーポイントを見出し、元解像度でのキーポイントの数を増加させる（アップサンプリングする）ために使用可能なものとなっているのである。

【0068】

次に、上記（イ２）のマージ部１２ｂは本実施形態において、元画像Ａ及びＢの各々について、低解像度段階（1, 2, ・・, L）毎に、先に生成された画像全部特徴量D₀によって生成された低解像度画像全部特徴量Dⁱ _Cから、低解像度化キーポイントKⁱ _F→Cに基づき、次式
（６） Fⁱ _{C_F→C}＝Dⁱ _C(x,y,:)_{(x,y)∈KiF→C}
を用いて、i番目の低解像度段階に係る記述子Fⁱ _{C_F→C}（1≦i≦L）を算出する。この上式（６）は、この記述子Fⁱ _{C_F→C}が、低解像度画像全部特徴量Dⁱ _Cを構成する画像特徴量（記述子群）のうちの、低解像度化キーポイントKⁱ _F→Cに属する座標点(x,y)に相当するものであることを示している。言い換えると、この記述子Fⁱ _{C_F→C}は、低解像度化キーポイントKⁱ _F→Cで規定される空間位置に基づき、低解像度画像全部特徴量Dⁱ _C（を構成する記述子群）から選択された記述子（群）となっているのである。

【0069】

次いで、マージ部１２ｂは、上式（６）の記述子Fⁱ _{C_F→C}と低解像度化記述子Fⁱ _F→Cとを、次式
（７） Fⁱ _F→C_M＝Merge(Fⁱ _F→C, Fⁱ _{C_F→C})
によってマージして、更新された低解像度化記述子Fⁱ _F→C_Mを生成する。ここで、Merge(・,・)は、２つの記述子を結合させる（１つに合わせる）演算子であればよく、例えば（ベクトル）加算、ショートカット（短絡化, shortcut）、又は連結（concatenate）を行う演算子とすることができる。最後にマージ部１２ｂは、低解像度段階（1, 2, ・・, L）毎に、次式
（８） (Kⁱ _C', Fⁱ _C')＝{(k,d)|k:=(x,y)∈Kⁱ _C∪Kⁱ _F→C, d∈Fⁱ _C∪Fⁱ _F→C_M}
で表される新たな低解像度キーポイントKⁱ _C'と新たな低解像度記述子Fⁱ _C'とのペア(Kⁱ _C', Fⁱ _C')を生成するのである。

【0070】

以上説明したように、マージ部１２ｂは、ダウンサンプリング部１２ａにおいて更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Finから生成された低解像度化キーポイントKⁱ _F→C及び低解像度化記述子Fⁱ _F→Cを用い、各低解像度段階において、新たに生成されたキーポイント（Kⁱ _C'）に合わせ、より記述性の高い記述子（Fⁱ _C'）を生成するのである。

【0071】

ここで、低解像度ＫＰマッチング部１２が、更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Finを受け取らない場合（例えば低解像度ＫＰマッチング処理が初回の場合）、上式（８）の(Kⁱ _C', Fⁱ _C')として、低解像度特徴量生成部１１から受け取った(Kⁱ _C, Fⁱ _C)が、以下に説明するＫＰマッチング処理で用いられることになる。

【0072】

次に、上記（イ３）のＫＰマッチング部１２ｃは本実施形態において、低解像度段階毎（1, 2, ・・, L）に、元画像Ａ及びＢの間で、新たな低解像度記述子Fⁱ _C'を用いて新たな低解像度キーポイントKⁱ _C'のマッチング処理を実施する。具体的には、次式
（９） Mⁱ _C＝Machingⁱ _C{(Kⁱ _C', Fⁱ _C')^A, (Kⁱ _C', Fⁱ _C')^B}
をもって、マッチした低解像度キーポイントのペアMⁱ _Cを生成し、ＫＰマッチング処理結果として{M¹ _C,M² _C,・・,M^L _C}を出力する。

【0073】

ここで上式（９）のMachingⁱ _C(・,・)として、各低解像度段階（i）において互いに異なる公知のマッチング手法を適用し、互いに異なるタイプの低解像度に係るマッチングペアの情報を生成することも好ましい。各低解像度段階（i）において適切にマッチング手法の調整を行うことによって、最終的に、より精度の高い画像マッチング処理を実現可能な画像特徴量（K_Fin, F_Fin）を導出することも可能となるのである。または、いずれの解像度段階においても、軽量であって高速度のマッチング手法、例えば最近傍マッチング（nearest neighbor matching）法を用いて、計算コストをより低減させることも可能である。

【0074】

いずれにしても、上式（９）をもって生成されるペアMⁱ _Cは、次式
（１０） Mⁱ _C:＝{(x,y)^A－(x,y)^B} ここで、(x,y)^A∈Kⁱ _C'^(A)，(x,y)^B∈Kⁱ _C'^(B)
で規定されるものとなる。ここで“－”はマッチしたペアを表す記号であり、また上添え字A及び(A)（上添え字B及び(B)）は、添え字対象量が、元画像Ａ（元画像Ｂ）に係る量であることを示している。

【0075】

また本実施形態において、ＫＰマッチング部１２ｃは、更新された元解像度対応キーポイントK_Fin及び更新された元解像度対応記述子F_Finと同様、モデル外部（例えば、後述する画像マッチング部９３（図４））から、次式
（１１） M_Fin＝{(x,y)^A－(x,y)^B} ここで、(x,y)^A∈K_Fin ^(A)，(x,y)^B∈K_Fin ^(B)
で規定される、画像マッチング結果としてのマッチングペアM_Finを受け取った場合、これも合わせた結果、すなわち、
{M¹ _C,M² _C,・・,M^L _C}∪M_Fin
を、元解像度対応ＫＰ抽出部１３へ出力する。

【0076】

＜元解像度対応ＫＰ抽出手段＞
同じく図１に示したように、本実施形態の元解像度対応ＫＰ抽出部１３は、元画像Ａ及びＢの各々について、
（ウ１）最初にアップサンプリング部１３ａとして、低解像度段階（1, 2, ・・, L）毎に、ＫＰマッチング部１２ｃから受け取ったマッチした低解像度キーポイントKⁱ _{C_M}（Kⁱ _{C_M} ^(A), Kⁱ _{C_M} ^(B)）に対し、元解像度へのリスケール処理を施した上で逆プーリング（unpooling）処理を実施して（言い換えるとアップサンプリング処理を施して）、各低解像度段階において（アップサンプリング処理前の）低解像度キーポイントよりも多い数の、元解像度に対応した元解像度対応化キーポイントKⁱ _Fを生成し、
（ウ２）次いで集合部１３ｂとして、各低解像度段階における元解像度対応化キーポイントKⁱ _Fを取りまとめ、元解像度対応キーポイントK_Finとして出力する。

【0077】

より具体的に、上記（ウ１）のアップサンプリング部１３ａは本実施形態において、元画像Ａ及びＢの各々について、低解像度段階（1, 2, ・・, L）毎に、ＫＰマッチング部１２ｃより受け取ったマッチした低解像度キーポイントKⁱ _{C_M}から、次式
（１２） Kⁱ _F＝Unpool_i(Kⁱ _{C_M→F}) ここで、Kⁱ _{C_M→F}＝Re_i ^Up(Kⁱ _{C_M})
を用いて、当該低解像度段階（i）における元解像度対応化キーポイントKⁱ _Fを生成する。

【0078】

ここで、上式（１２）のRe_i ^Up(・)は、当該低解像度段階（i）に対応したキーポイントの位置を元解像度に対応した位置にリスケールする演算子であり、位置のリスケールに関し、上式（５）のRe_i ^Down(・)とは逆の演算子となっている。また、Unpool_i(・)は、当該低解像度段階（i）に対応したキーポイントに対し、プーリング処理とは逆の処理（アンプーリング処理）を施して、元解像度に対応したキーポイントに変換する演算子である。

【0079】

このUnpool_i(・)と上式（５）のPool_i(・)とは、上記の位置にかかわるRe_i ^Up(・)及びRe_i ^Down(・)ほどには逆演算子性を要求されるものではないが、互いに演算処理において一貫性を有しかみ合った形となっていることが好ましい。具体的には、Unpool_i(・)及びPool_i(・)として、公知のグリッドサンプリング（grid-sampling）処理の演算子や、非特許文献：Jiahui Zhang et al., “Learning Two-View Correspondences and Geometry Using Order-Aware Network”, Published in 2019 IEEE/CVF International Conference on Computer Vision (ICCV), ＜https://doi.org/10.1109/ICCV.2019.00594＞, ２０１９年、及び非特許文献:Jiatao Ying et al, “Hierarchical Graph Representation Learning with Differentiable Pooling”, Neural Information Processing Systems 31, ＜https://arxiv.org/pdf/1806.08804.pdf＞, ２０１８年に開示されたDIFFPOOL演算子及びDIFFUNPOOL演算子を採用することができる。

【0080】

次に、上記（ウ２）の集合部１３ｂは本実施形態において、低解像度段階（1, 2, ・・, L）毎に生成された元解像度対応化キーポイントKⁱ _Fを、次式
（１３） K_Fin＝∪_{i∈[1,2,・・,L]}{(x,y)∈Kⁱ _F}
で表すように取りまとめて元解像度対応キーポイントK_Finを生成し、抽出結果として出力する。ここで、∪_{i∈[1,2,・・,L]}は、iが1, 2, ・・, Lの各々である場合における後ろの集合の和集合を生成するユニオン演算子である。上式（１３）によれば（次の式（１４）でも同様であるが）、元解像度対応化キーポイント（Kⁱ _F）の数は、L（設定された低解像度段階の数）をより大きく設定することによって、より増大させることが可能となる。

【0081】

また集合部１３ｂは、ＫＰマッチング部１２ｃからＫＰマッチング処理結果として{M¹ _C,M² _C,・・,M^L _C}∪M_Finを受け取っている場合、K^L+1 _F＝K_Finとして、次式
（１４） K_Fin＝∪_{i∈[1,2,・・,L+1]}{(x,y)∈Kⁱ _F}
によって元解像度対応キーポイントK_Finを生成することも好ましい。いずれにしても、元解像度対応ＫＰ抽出部１３によれば、低解像度ＫＰマッチング部１２から受け取った低解像度ＫＰマッチング処理結果を用いて、マッチしたキーポイントの位置を元解像度に投影した且つ数の増大した、それ故、最終的に高精度の画像マッチングをもたらし得る元解像度対応キーポイントK_Fin（K_Fin ^(A), K_Fin ^(B)）を取得することができるのである。

【0082】

ここで、図２（Ｂ）及び（Ｃ）にそれぞれ、本発明に係るＫＰマッチング処理、及び元解像度対応ＫＰ抽出処理の実施例を示す。

【0083】

最初に図２（Ｂ）によれば、ＫＰマッチング部１２ｃにおけるＫＰマッチング処理により生成された（ある低解像度段階における）低解像度キーポイントのペアは、スマートフォンカメラ画像と３Ｄレンダリング画像との間で、良好にマッチしたキーポイントのペアとなっていることが分かる。しかしながら、その数は十分に多いとは言えないものとなっている。

【0084】

次いで図２（Ｃ）によれば、図２（Ｂ）に示されたマッチしたペアの各キーポイントに対し、元解像度対応ＫＰ抽出部１３において元解像度対応ＫＰ抽出処理（アップサンプリング処理）を実施した結果、（このマッチしたペアの各キーポイントの周囲に）より数の多い元解像度対応化キーポイント（Kⁱ _F）が生成されていることが分かる。このように生成された、各低解像度段階に係る多数の元解像度対応化キーポイント（Kⁱ _F）が取りまとめられて、元解像度対応キーポイントK_Fin（K_Fin ^(A), K_Fin ^(B)）が生成され、抽出結果として出力されるのである。

【0085】

以下、元解像度対応ＤＳ抽出部１４の説明を行うが、ここで実施される元解像度対応ＤＳ抽出処理には、大きく分けて２つの実施形態（第１実施形態，第２実施形態）が存在する。

【0086】

＜元解像度対応ＤＳ抽出手段：第１実施形態＞
図１に戻って、第１実施形態の元解像度対応ＤＳ抽出部１４においては、元画像Ａ及びＢの各々について、
（エ１）ＲｅｓＮｅｔ部１４ａが、元画像Ａ及びＢの各画像データIから、画像全体特徴量D₀''を抽出し、
（エ２）低画像特徴生成部（１４－１，・・，１４－Ｌ）が、元画像Ａ及びＢの各々について、画像全体特徴量D₀''に対しパイプーリング（pypooling）処理を施して各低解像度段階（1, 2, ・・, L）における低解像度画像全体特徴量D_i''を生成し、
（エ３）元解像度対応ＤＳ生成部１４ｂが、生成された各低解像度段階（1, 2, ・・, L）における低解像度画像全体特徴量D_i''に対しアップサンプリング処理を実施し、さらに画像全体特徴量D₀''と合わせることによって、元画像（Ａ，Ｂ）に対応する元画像対応画像特徴量D_Finを生成し、生成した元画像対応画像特徴量D_Finから（元解像度対応ＫＰ抽出部１３より受け取った）元解像度対応キーポイントK_Finに基づき、元解像度に対応した元解像度対応記述子F_Finを生成し、抽出結果として出力する。

【0087】

以下、上記（エ１）～（エ３）の処理をより具体的に説明する。最初に上記（エ１）のＲｅｓＮｅｔ部１４ａはこの第１実施形態において、元画像（Ａ, Ｂ）の画像データI（I^(A)又はI^(B)）から、次式
（１５） D₀''＝ResNet^BB(I)
によって画像全体特徴量D₀''を算出する。ここで、ResNet^BB(・)は、画像内の全画素に（ラベルやカテゴリを紐づけて）意味付けを行うセマンティックセグメンテーション（Semantic Segmentation）を用いたバックボーンであるＰＳＰＮｅｔ（Pyramid Scene Parsing Network）の特徴マップ層（feature map layer）での処理を表す演算子である。

【0088】

またその結果、上式（１５）で算出される画像全体特徴量D₀''は、（例えば画像内オブジェクトの細部や付帯物の情報等も含み得る）画像内の意味情報も反映したハイレベルの特徴量となっているのである。ちなみに、このＰＳＰＮｅｔの特徴マップ層は、ＲｅｓＮｅｔにおける１つのバリエーションとなっている。

【0089】

ちなみに、ＰＳＰＮｅｔについては、非特許文献：Hengshuang Zhao et al., “Pyramid Scene Parsing Network”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://arxiv.org/pdf/1612.01105.pdf＞, ２０１７年において詳細に説明されている。また、ＲｅｓＮｅｔについては、非特許文献：Kaiming He et al., “Deep Residual Learning for Image Recognition”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Volume 1, pp.770-778, ＜https://doi.org/10.1109/CVPR.2016.90＞, ２０１６年にその詳細が開示されている。

【0090】

また、ＲｅｓＮｅｔ部１４ａは、セマンティックセグメンテーションベースのバックボーンであるならば、ＰＳＰＮｅｔの特徴マップ層以外の他のバックボーンを用いて、画像全体特徴量D₀''を生成してもよい。さらに、このＲｅｓＮｅｔ部１４ａと、（低解像度特徴量生成部１１の）ＣＮＮ部１１ａとを共通化し（１つの機能構成部にまとめ）、例えば、上式（１）（D₀＝CNN^BB(I)）のCNN^BB(・)としてResNet^BB(・)を採用することも可能である。この場合、画像全部特徴量D₀と画像全体特徴量D₀''とは同一の特徴量となる。またこの場合、低解像度特徴量生成部１１と、元解像度対応ＤＳ抽出部１４とは、同じバックボーンを共有する２つのＣＮＮブランチとなるのである。

【0091】

次に、上記（エ２）の低画像特徴生成部（１４－１，・・，１４－Ｌ）はこの第１実施形態において、元画像Ａ及びＢの各々につき、画像全体特徴量D₀''を用いて、次式
（１６） D_i''＝PyPoolingⁱ(D₀'')
により、各低解像度段階（1, 2, ・・, L）における低解像度画像全体特徴量D_i''を生成する。ここで、PyPoolingⁱ(・)は、上述したＰＳＰＮｅｔにおいて使用されているパイプーリング（pypooling）演算子である。

【0092】

次に、上記（エ３）の元解像度対応ＤＳ生成部１４ｂはこの第１実施形態において、元画像Ａ及びＢの各々につき、生成された低解像度画像全体特徴量D_i''を用いて、次式
（１７） D_Fin＝CONCAT(D₀'', {UPSAMPLE(CONVⁱ(D_i''))}_{i∈[1,2,・・, L]})
により、元画像対応画像特徴量D_Finを生成する。

【0093】

ここで、CONVⁱ(・)は、当該低解像度段階（i）の対象量に対し畳み込み処理を実施する畳み込み演算子である。またUPSAMPLE(・)は、対象量に対しアップサンプリング処理を施すアップサンプリング演算子となっている。さらにCONCAT(D₀'', {UPSAMPLE(CONVⁱ(D_i''))}_{i∈[1,2,・・, L]})は、D₀''と、UPSAMPLE(CONV¹(D₁'')と、UPSAMPLE(CONV²(D₂'')と、・・、UPSAMPLE(CONV^L(D_L'')との連結結果である。

【0094】

なお、上式（１７）の形の処理は、上述したＰＳＰＮｅｔにおいて通常、実施される処理であって、分類器の前段の層から取り出したCONVⁱ(D_i'')に基づき直接、デンス特徴量（元画像対応画像特徴量）D_Finを抽出するものであるので、計算コストがより抑えられた処理となっている。

【0095】

次いで元解像度対応ＤＳ生成部１４ｂは、生成した元画像対応画像特徴量D_Finから（元解像度対応ＫＰ抽出部１３より受け取った）元解像度対応キーポイントK_Finに基づき、次式
（１８） F_Fin＝D_Fin(x,y,:)_(x,y)∈KFin
を用いて、元解像度対応記述子F_Finを生成し、抽出結果として出力するのである。ここで、上式（１８）は、元解像度対応記述子F_Finが、元画像対応画像特徴量D_Finを構成する画像特徴量（記述子群）のうちの、元解像度対応キーポイントK_Finに属する座標点(x,y)に相当するものであることを示している。言い換えると、元解像度対応記述子F_Finは、元解像度対応キーポイントK_Finで規定される空間位置に基づき、元画像対応画像特徴量D_Fin（を構成する記述子群）から選択された記述子（群）となっているのである。

【0096】

＜元解像度対応ＤＳ抽出手段：第２実施形態＞
同じく図１に示したように、第２実施形態の元解像度対応ＤＳ抽出部１４においては、元画像Ａ及びＢの各々について、
（エ１）ＲｅｓＮｅｔ部１４ａが、元画像Ａ及びＢの各画像データIから、画像全体特徴量D₀''を抽出し、
（エ２’）低画像特徴生成部（１４－１，・・，１４－Ｌ）が、元画像Ａ及びＢの各々について、低解像度段階（1, 2, ・・, L）毎に、画像全体特徴量D₀''から当該低解像度段階（i）における低解像度対応画像特徴量Dⁱ _C''を生成し、
（エ３’）元解像度対応ＤＳ生成部１４ｂが、当該低解像度段階（i）における低解像度対応画像特徴量Dⁱ _C''に対しマージする処理であって、１つ前のマージする処理の結果に対し逆畳み込み処理を施したものと低解像度対応画像特徴量Dⁱ _C''とをマージする処理を、解像度の低い順で始めて元解像度の段階に向けて順次進めることによって、元画像対応画像特徴量D_Finを生成し、この元画像対応画像特徴量D_Finから（元解像度対応ＫＰ抽出部１３より受け取った）元解像度対応キーポイントK_Finに基づき、元解像度に対応した元解像度対応記述子F_Finを生成し、抽出結果として出力する。

【0097】

ここで、上記（エ１）のＲｅｓＮｅｔ部１４ａは、上述した第１実施形態と同様の処理を実施する。以下、上記（エ２’）及び（エ３’）の説明をより具体的に行う。

【0098】

最初に上記（エ２’）におけるi（1≦i≦L）番目の低解像度段階の低画像特徴生成部１４－(i)）は、この第２実施形態において、画像全体特徴量D₀''から次式
（１９） Kⁱ _C'', Dⁱ _C''＝Detⁱ(PyPoolingⁱ(D₀''))
を用いて、i番目の低解像度段階に対応した低解像度対応キーポイントKⁱ _C''（1≦i≦L）及び低解像度対応画像特徴量Dⁱ _C''（1≦i≦L）を算出する。ここで、Detⁱ(・)は、上式（２）のDetⁱ(・)と同様、（i番目の低解像度段階相当の解像度の）画像に対しキーポイント検出を行うキーポイント検出演算子である。また、PyPoolingⁱ(・)は、上述したＰＳＰＮｅｔにおいて使用されているパイプーリング（pypooling）演算子となっている。

【0099】

次に、上記（エ３’）における元解像度対応ＤＳ生成部１４ｂはこの第２実施形態において、各低解像度段階（1, 2, ・・, L）の低解像度対応画像特徴量Dⁱ _C''を、i＝1からi＝Lまで順次用いて、次式
（２０） Dⁱ⁺¹ _F＝Merge(DECONV_i ^H(Dⁱ _F), Dⁱ _C'')
により、元画像対応画像特徴量D_Fin（＝D^L+1 _F）を算出する。ここで、D¹ _FはD₀''である（D¹ _F＝D₀''）。さらに、DECONV_i ^H(・)は、元解像度レベルへの逆畳み込み演算子であって、Merge(・,・)は、対象量をマージする演算子となっている。すなわち上式（２０）は簡潔に言えば、画像全体特徴量D₀''を、各低解像度段階の低解像度対応画像特徴量Dⁱ _C''を用いて元解像度にまでアップスケールするデコーダを表しているのである。

【0100】

次いで元解像度対応ＤＳ生成部１４ｂは、生成した元画像対応画像特徴量D_Finから（元解像度対応ＫＰ抽出部１３より受け取った）元解像度対応キーポイントK_Finに基づき、次式
（２１） F_Fin＝D_Fin(x,y,:)_(x,y)∈KFin （上式（１８）と同じ形の式）
を用いて、元解像度対応記述子F_Finを生成し、抽出結果として出力するのである。

【0101】

以上、元解像度対応ＤＳ抽出部１４について、２つの実施形態（第１実施形態，第２実施形態）の説明を行ったが、いずれにしても元解像度対応ＤＳ抽出部１４は、元画像Ａ及びＢの各々について、（元解像度対応ＫＰ抽出部１３より受け取った）元解像度対応キーポイントK_Finと、それに対応する（自ら生成した）元解像度対応記述子F_Finとのペア、すなわち、
(K_Fin, F_Fin)^A, (K_Fin, F_Fin)^B
を生成し、本画像特徴量抽出モデルの抽出結果（成果）として出力するのである。

【0102】

このうち、元解像度対応キーポイントK_Finは、上述したように（後の高精度の画像マッチングを行うのに適した）より多くの数の、元解像度下でのキーポイント（群）となっている。また元解像度対応記述子F_Finは、セマンティックセグメンテーションに基づく画像全体特徴量D₀''から生成されており、（例えば画像内オブジェクトの細部や付帯物の情報等も含み得る）画像内の意味情報も反映したハイレベルの記述子となっているのである。

【0103】

［画像特徴量抽出方法］
図３は、本発明による画像特徴量抽出方法の一実施形態における概略を示すフローチャートである。以下、本方法のステップＳ１０１～Ｓ１０９における処理の流れを説明する。

【0104】

（Ｓ１０１）元画像Ａ及びＢの画像データを、外部から取得する。
（Ｓ１０２）取得されたこれらの画像データを用い、各画像について「低解像度キーポイント」及び「低解像度記述子」を生成する。

【0105】

次いで以下、ステップＳ１０３～Ｓ１０８を所定回数（N回）繰り返す元解像度対応ＫＰ・ＤＳ生成処理を実施する。ちなみに、この所定回数を、例えば4～8回（4≦N≦8）とすることによって、良好な結果の得られることが確認されている。
（Ｓ１０３）外部で生成された「更新された元解像度対応キーポイント」及び「更新された元解像度対応記述子」が存在するか否かを判定する。
このステップＳ１０３での判定は、本実施形態においては上述したように、今回の元解像度対応ＫＰ・ＤＳ生成処理が初回ではないか否かの判定と同じものとなっている。ここで、偽の（存在しないとの又は初回との）判定がなされた場合、ステップＳ１０６へ移行する。

【0106】

（Ｓ１０４）一方、ステップＳ１０３で真の（存在するとの）判定がなされた場合、「更新された元解像度対応キーポイント」及び「更新された元解像度対応記述子」に対しダウンサンプリング処理を実施する。
（Ｓ１０５）ステップＳ１０４におけるダウンサンプリング処理の結果と、ステップＳ１０２で生成された「低解像度キーポイント」及び「低解像度記述子」とを用いて、新たな「低解像度キーポイント」及び新たな「低解像度記述子」を生成する。

【0107】

（Ｓ１０６）（新たな）「低解像度キーポイント」及び（新たな）「低解像度記述子」を用いて、低解像度ＫＰマッチング処理を実施する。
（Ｓ１０７）ステップＳ１０６の処理結果に対し、元解像度対応ＫＰ抽出処理を実施し、「元解像度対応キーポイント」を生成する。
（Ｓ１０８）取得された画像データから生成された画像全体特徴量に対し、「元解像度対応キーポイント」を用いた元解像度対応ＤＳ抽出処理を実施し、「元解像度対応記述子」を生成する。

【0108】

（Ｓ１０９）所定回数（N回）終了後のステップＳ１０７及びステップＳ１０８において生成された、元画像Ａ及びＢの各々における「元解像度対応キーポイント」及び「元解像度対応記述子」を、抽出結果として出力する。

【0109】

［画像マッチング装置・プログラム］
図４は、本発明による画像マッチング装置９の一実施形態を示す機能ブロック図である。

【0110】

図４によれば、本実施形態の画像マッチング装置９は、
（ａ）画像マッチング対象である元画像Ａ及びＢの各々の画像データを取り入れる入力部９１と、
（ｂ）以上に詳述した画像特徴量抽出モデル１を用いて、取り入れられた画像データから、元画像Ａの画像特徴量(K_Fin, F_Fin)^A及び元画像Ｂの(K_Fin, F_Fin)^Bを生成する画像特徴量抽出部９２と、
（ｃ）生成された画像特徴量(K_Fin, F_Fin)^A及び(K_Fin, F_Fin)^Bを用いて、元画像Ａ及びＢの画像マッチング処理を実施する画像マッチング部９３と、
（ｅ）上記（ｃ）の画像マッチング処理の結果である（マッチするキーポイントのペアである）マッチングペアM_Finを外部に提供する出力部９４と
を有している。

【0111】

ここで、画像特徴量抽出部９２及び画像マッチング部９３は、本発明による（画像特徴量抽出方法も含む）画像マッチング方法の一実施形態を実施する主要機能構成部であり、さらに、本発明による（画像特徴量抽出プログラムも含む）画像マッチングプログラムの一実施形態を保存したプロセッサ・メモリの機能となっている。またこのことから、画像マッチング装置９は、画像マッチング処理の専用装置であってもよいが、本発明による画像マッチングプログラムを搭載した、例えばクラウドサーバ、非クラウドのサーバ装置、パーソナル・コンピュータ（ＰＣ）、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることも可能である。

【0112】

同じく図４において、入力部９１は、例えば通信機能を備えていて外部の情報処理装置、例えば画像管理サーバ等から元画像Ａ及び元画像Ｂを受信するものであってもよく、または、ユーザが直接元画像Ａ及び元画像Ｂを入力可能なＵＳＢ（Universal Serial Bus）等のインタフェースとすることもできる。さらに、出力部９４も、例えば通信機能を備えていて外部の情報処理装置、例えば画像提供元の画像管理サーバ等へ画像マッチング結果を送信するものとすることができ、または、画像マッチング結果を表示可能なディスプレイであってもよい。

【0113】

また、画像マッチング部９３は、種々様々な公知の画像マッチング手法、例えば最近傍マッチング法、を用いて画像マッチング処理を実施するものであってもよいが、本実施形態においては、よりマッチング精度を高めることの可能なグラフアテンション（ＧＡＴ, Graph ATtntion）処理を用いた画像マッチングを行う。

【0114】

具体的には、画像マッチング部９３における
（ａ）グラフ生成部９３１が、元画像Ａ及びＢの各々について、元解像度対応キーポイントK_Finを用いて当該元画像を表現するグラフを生成し、
（ｂ）グラフアテンション部９３２が、元画像Ａ及びＢの各々について、元解像度対応記述子F_Finに対し、生成されたグラフを用いたＧＡＴ処理を施して、更新された元解像度対応記述子F_Finを生成し、
（ｃ）ＫＰマッチング部９３３が、更新された元解像度対応記述子F_Finを用いて元解像度対応キーポイントK_Finのマッチング処理を実施し、マッチングペアM_Finを生成するのである。

【0115】

ここで画像マッチング部９３は本実施形態において、元画像Ａ及びＢの各々についての元解像度対応キーポイントK_Finと元解像度対応記述子F_Finとの更新されたペア（K_Fin, F_Fin）、及び上記（ｃ）のマッチングペアM_Finを、（画像特徴量抽出部９２の）画像特徴量抽出モデル１に取り込ませ画像特徴量抽出に使用させて、そこから画像特徴量抽出結果を受け取る処理を、所定回数（N回）繰り返す。次いでその後、最終的に生成したマッチングペアM_Finを出力部９４へ出力するのである。

【0116】

これにより、画像マッチング部９３は、元画像Ａ及びＢ間の解像度の乖離により良く対応することができ、更により多くのキーポイントを生成し、また、画像内オブジェクトの細部や付帯的な情報も更により多く考慮することの可能な画像マッチング処理を実施することができるのである。

【0117】

ちなみに、上記（ｃ）のＫＰマッチング部９３３における画像マッチング手法としては、非特許文献：Paul-Edouard Sarlin et al., “SuperGlue: Learning Feature Matching with Graph Neural Networks”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, ＜https://arxiv.org/pdf/1911.11763.pdf＞, ２０２０年に開示された手法を適用することができる。

【0118】

この非特許文献（Sarlin et al.）の画像マッチング手法では、異なる入力画像部分の影響を重み付けして考慮するアテンション機構を用いた深層学習モデルであるトランスフォーマ（Transformer）を採用している。このトランスフォ－マは、記述子とキーポイントの位置との両方に基づき画像マッチングを実施するように訓練されており、（ａ）キーポイントの位置を把握するキーポイントエンコーダと、（ｂ）キーポイントと記述子における各画像内の若しくは画像間の特徴とに係るセルフ／クロスアテンション層（9層構成）と、（ｃ）２つの埋め込み表現特徴量のマッチングをとるためのシンクホーン（Sinkhorn）アルゴリズムを含むマッチング層とを備えている。このようなトランスフォーマを利用することによって、非常に精度の高い画像マッチングを行うことができるのである。

【0119】

以上詳細に説明したように、本発明によれば、画像間の解像度の乖離にも対応することができ、より多くのキーポイントを生成し、さらに画像内オブジェクトの細部や付帯的な情報もより多く考慮することができる画像マッチング処理を実施することが可能となる。また、このような画像マッチング処理を実施することのできる画像特徴量を抽出することが可能となる。

【0120】

また、本発明による高精度の画像マッチング処理を、都市内に設置された多数の防犯カメラによる膨大な量のカメラ画像の解析に活かし、トラブル・犯罪発生の予測・検出や、さらには犯人の検挙等を促進することもできる。すなわち本発明によれば、国連が主導する持続可能な開発目標（ＳＤＧｓ）の目標１１「都市を包摂的、安全、レジリエントかつ持続可能にする」に貢献することも可能となるのである。

【0121】

さらに、本発明による高精度の画像マッチング処理を、対象地域、特に農作地帯、森林地帯や、乾燥地帯の衛星写真や航空写真、さらには対象海域の衛星写真や航空写真の解析に活かし、そのような地域・海域における各種状態、例えば作物の生育状況、生態系の現状や、気候変動の影響の調査を行うこともできる。すなわち本発明によれば、国連が主導する持続可能な開発目標（ＳＤＧｓ）における目標１３「気候変動とその影響に立ち向かうため、緊急対策を取る」、目標１４「海洋と海洋資源を保全し、持続可能な形で利用する」、及び目標１５「森林の持続可能な管理、砂漠化への対処、土地劣化の阻止および逆転、ならびに生物多様性損失の阻止を図る」に貢献することも可能となるのである。

【0122】

上述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。

【符号の説明】

【0123】

１画像特徴量抽出モデル
１１低解像度特徴量生成部
１１ａＣＮＮ部
１１－１ａ，１１－２ａ，１１－Ｌａ低キーポイント（ＫＰ）生成部
１１－１ｂ，１１－２ｂ，１１－Ｌｂ低記述子（ＤＳ）生成部
１２低解像度ＫＰマッチング部
１２ａダウンサンプリング部
１２ｂマージ部
１２ｃＫＰマッチング部
１３元解像度対応ＫＰ抽出部
１３ａアップサンプリング部
１３ｂ集合部
１４元解像度対応ＤＳ抽出部
１４ａＲｅｓＮｅｔ部
１４－１，１４－２，１４－Ｌ低画像特徴生成部
１４ｂ元解像度対応ＤＳ生成部
９画像マッチング装置
９１入力部
９２画像特徴量抽出部
９３画像マッチング部
９３１グラフ生成部
９３２グラフアテンション部
９３３ＫＰマッチング部
９４出力部

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版