IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 北京達佳互▲れん▼信息技術有限公司の特許一覧

特表2023-519755画像レジストレーション方法及び装置
<>
  • 特表-画像レジストレーション方法及び装置 図1
  • 特表-画像レジストレーション方法及び装置 図2
  • 特表-画像レジストレーション方法及び装置 図3
  • 特表-画像レジストレーション方法及び装置 図4
  • 特表-画像レジストレーション方法及び装置 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-12
(54)【発明の名称】画像レジストレーション方法及び装置
(51)【国際特許分類】
   G06T 7/33 20170101AFI20230502BHJP
   G06T 7/00 20170101ALI20230502BHJP
【FI】
G06T7/33
G06T7/00 350C
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022560172
(86)(22)【出願日】2020-12-24
(85)【翻訳文提出日】2022-09-30
(86)【国際出願番号】 CN2020138909
(87)【国際公開番号】W WO2021238188
(87)【国際公開日】2021-12-02
(31)【優先権主張番号】202010453236.6
(32)【優先日】2020-05-25
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】520230293
【氏名又は名称】北京達佳互▲れん▼信息技術有限公司
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際弁理士法人
(72)【発明者】
【氏名】王再▲ゼン▼
(72)【発明者】
【氏名】郭小燕
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096DA02
5L096EA35
5L096FA02
5L096FA12
5L096FA18
5L096FA67
5L096FA69
5L096HA01
5L096HA11
5L096JA11
5L096KA04
(57)【要約】
本開示は、画像レジストレーション方法及び装置に関し、前記方法は、ターゲットオブジェクトを含むターゲット画像を取得するステップと、前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力するステップと、前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップと、前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するステップと、を含む。本開示は、ネットワークモデルを使用してターゲット画像内のターゲットオブジェクトの位置情報と回転角度情報を決定し、この情報を使用して、画像データベースからスケールおよび視点が近い参照画像をクエリすることで、ターゲット画像と参照画像から十分な特徴記述子を抽出して、画像レジストレーションの精度を向上させることができる。
【選択図】 図1
【特許請求の範囲】
【請求項1】
ターゲットオブジェクトを含むターゲット画像を取得するステップと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力するステップと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するステップと、を含む、
ことを特徴とする画像レジストレーション方法。
【請求項2】
前記画像データベースには、1つまたは複数のサンプルオブジェクトのサンプル画像が記憶され、前記サンプル画像には、スケール及び/又は視点が異なる前記サンプルオブジェクトが含まれる、
ことを特徴とする請求項1に記載の画像レジストレーション方法。
【請求項3】
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップは、
前記画像データベースには1つの前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、前記サンプルオブジェクトと前記ターゲットオブジェクトが同じオブジェクトタイプに属している場合、前記画像データベースから、予め設定されたスケール条件と予め設定された視点条件を満たす前記参照画像をクエリして取得するステップ、又は
前記画像データベースには複数の前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、複数の前記サンプルオブジェクトのうち、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトがある場合、前記画像データベースから、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得し、前記同じタイプのサンプル画像から、前記スケール条件と前記視点条件を満たす前記参照画像をクエリして取得するステップを含み、
前記スケール条件は、前記ターゲットオブジェクトの位置情報に対応するスケールと前記サンプルオブジェクトのスケールとの差が、予め設定されたスケール範囲内であることを示し、前記視点条件は、前記ターゲットオブジェクトの回転角度情報に対応する視点と前記サンプルオブジェクトの視点との差が、予め設定された視点範囲内であることを示す、
ことを特徴とする請求項2に記載の画像レジストレーション方法。
【請求項4】
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行うステップは、
前記位置情報に基づいて前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形を位置決めするステップと、
前記最小外包矩形内の前記ターゲット画像をオブジェクト画像とするステップと、
前記オブジェクト画像と前記参照画像に対して画像レジストレーションを行うステップと、を含む、
ことを特徴とする請求項1に記載の画像レジストレーション方法。
【請求項5】
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行うステップは、
前記オブジェクト画像と前記参照画像から、それぞれ前記ターゲットオブジェクトの第1の特徴記述子と第2の特徴記述子を抽出して取得するステップと、
前記第1の特徴記述子と前記第2の特徴記述子の間の距離を算出するステップと、
前記距離が予め設定された距離条件を満たす前記第1の特徴記述子と前記第2の特徴記述子を特徴点ペアとするステップと、
前記特徴点ペアとPNPアルゴリズムとに基づいて前記オブジェクト画像と前記参照画像の間の変換行列を算出するステップと、
前記オブジェクト画像および前記参照画像の空間内の同じ位置にある点が対応付けられるように、前記変換行列に基づいて前記オブジェクト画像を前記参照画像にマッピングするステップと、を含む、
ことを特徴とする請求項4に記載の画像レジストレーション方法。
【請求項6】
前記位置情報には、前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形の座標点情報が含まれ、前記座標点情報には、前記最小外包矩形の対角線上の2つの頂点の座標点情報が少なくとも含まれ、前記回転角度情報には、前記ターゲットオブジェクトの方位角情報、ピッチ角情報およびロール角情報が含まれる、
ことを特徴とする請求項1~5のいずれかに記載の画像レジストレーション方法。
【請求項7】
ターゲットオブジェクトを含むターゲット画像を取得する取得モジュールと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力する予測モジュールと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するクエリモジュールと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するレジストレーションモジュールと、を含む、
ことを特徴とする画像レジストレーション装置。
【請求項8】
前記画像データベースには、1つまたは複数のサンプルオブジェクトのサンプル画像が記憶され、前記サンプル画像には、スケール及び/又は視点が異なる前記サンプルオブジェクトが含まれる、
ことを特徴とする請求項7に記載の画像レジストレーション装置。
【請求項9】
前記クエリモジュールは、前記画像データベースには1つの前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、前記サンプルオブジェクトと前記ターゲットオブジェクトが同じオブジェクトタイプに属している場合、前記画像データベースから、予め設定されたスケール条件と予め設定された視点条件を満たす前記参照画像をクエリして取得し、または、前記画像データベースには複数の前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、複数の前記サンプルオブジェクトのうち、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトがある場合、前記画像データベースから、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得し、前記同じタイプのサンプル画像から、前記スケール条件と前記視点条件を満たす前記参照画像クエリして取得するように構成され、
ここで、前記スケール条件は、前記ターゲットオブジェクトの位置情報に対応するスケールと前記サンプルオブジェクトのスケールとの差が、予め設定されたスケール範囲内であることを示し、前記視点条件は、前記ターゲットオブジェクトの回転角度情報に対応する視点と前記サンプルオブジェクトの視点との差が、予め設定された視点範囲内であることを示す、
ことを特徴とする請求項8に記載の画像レジストレーション装置。
【請求項10】
前記レジストレーションモジュールは、
前記位置情報に基づいて前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形を位置決めして、前記最小外包矩形内の前記ターゲット画像をオブジェクト画像とする画像決定ユニットと、
前記オブジェクト画像と前記参照画像に対して画像レジストレーションを行う画像レジストレーションユニットと、を含む、
ことを特徴とする請求項7に記載の画像レジストレーション装置。
【請求項11】
前記画像レジストレーションユニットは、
前記オブジェクト画像と前記参照画像から、それぞれ前記ターゲットオブジェクトの第1の特徴記述子と第2の特徴記述子を抽出して取得する抽出サブモジュールと、
前記第1の特徴記述子と前記第2の特徴記述子の間の距離を算出する算出サブモジュールと、
前記距離が予め設定された距離条件を満たす前記第1の特徴記述子と前記第2の特徴記述子を特徴点ペアとするフィルタリングサブモジュールと、
前記特徴点ペアとPNPアルゴリズムとに基づいて前記オブジェクト画像と前記参照画像の間の変換行列を算出する前記算出サブモジュールと、
前記オブジェクト画像および前記参照画像の空間内の同じ位置にある点が対応付けられるように、前記変換行列に基づいて前記オブジェクト画像を前記参照画像にマッピングするマッピングサブモジュールとを含む、
ことを特徴とする請求項10に記載の画像レジストレーション装置。
【請求項12】
前記位置情報には、前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形の座標点情報が含まれ、前記座標点情報には、前記最小外包矩形の対角線上の2つの頂点の座標点情報が少なくとも含まれ、前記回転角度情報には、前記ターゲットオブジェクトの方位角情報、ピッチ角情報およびロール角情報が含まれる、
ことを特徴とする請求項7~11のいずれかに記載の画像レジストレーション装置。
【請求項13】
電子機器であって、
プロセッサと、
プロセッサによって実行される命令が記憶されるメモリとを含み、
プロセッサは、請求項1~6のいずれかに記載の画像レジストレーション方法を実現するために命令を実行するように構成される、
ことを特徴とする電子機器。
【請求項14】
記憶媒体であって、
前記記憶媒体の命令が電子機器のプロセッサによって実行されると、前記電子機器は、請求項1~6のいずれかに記載の画像レジストレーション方法を実行する、
ことを特徴とする記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本出願は、2020年5月25日に中国で提出した、中国特許出願番号が「202010453236.6」であるものの優先権を主張し、その内容全体が参照により本明細書に組み込まれる。
【0002】
本開示は画像処理技術の分野に関し、特に画像レジストレーション方法及び装置に関する。
【背景技術】
【0003】
画像レジストレーションは、画像処理研究の分野における典型的な問題であり、技術的な困難であり、同じオブジェクトに対して異なる条件で取得された画像を比較または融合することを目的とする。異なる条件は、異なる収集デバイス、異なる時間、異なる撮影角度および距離などを指す。具体的には、画像レジストレーションとは、一組の画像セット内の2つの画像に対して、空間変換関係に基づいて一つの画像を別の画像にマッピングすることで、空間内の同じ位置に対応する2つの画像内のポイントが1対1で対応して、情報融合の目的を達成することを指す。画像レジストレーションは、コンピュータービジョン、拡張現実などの分野で広く応用されている。
【0004】
従来の画像レジストレーション方式では、まず、2つの画像の特徴点を抽出し、類似度測定を実行して一致する特徴点ペアを見つけ、次に、一致した特徴点ペアに基づいて画像空間座標変換パラメータを取得し、最後に、画像空間座標変換パラメーターを使用して画像レジストレーションを行う。
【発明の概要】
【0005】
本開示は、画像レジストレーション方法及び装置を提供する。本開示の技術案は以下のとおりである。
【0006】
本開示の実施例による第1の態様は、画像レジストレーション方法を提供し、
ターゲットオブジェクトを含むターゲット画像を取得するステップと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力するステップと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するステップと、を含む。
【0007】
本開示の実施例による第2の態様は、画像レジストレーション装置を提供し、
ターゲットオブジェクトを含むターゲット画像を取得する取得モジュールと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力する予測モジュールと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するクエリモジュールと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するレジストレーションモジュールとを含む。
【0008】
本開示の実施例による第3の態様は、電子機器を提供し、プロセッサと、プロセッサによって実行される命令が記憶されるメモリとを含み、プロセッサは、第1の態様に記載の画像レジストレーション方法を実現するために命令を実行するように構成される。
【0009】
本開示の実施例による第4の態様は、記憶媒体を提供し、前記記憶媒体の命令が電子機器のプロセッサによって実行されると、前記電子機器は、第1の態様に記載の画像レジストレーション方法を実行する。
【0010】
本開示の実施例による第5の態様は、コンピュータープログラム製品を提供し、読み取り可能なプログラムコードを含み、前記読み取り可能なプログラムコードは、第1の態様に記載の画像レジストレーション方法を実現するために、電子デバイスのプロセッサによって実行される。
【0011】
なお、前述の一般的な説明および以下の詳細な説明は、例示および説明のためだけのものであり、本開示を限定するものではない。
【図面の簡単な説明】
【0012】
本明細書に組み込まれ、その一部を構成する添付の図面は、本開示と一致する実施例を示し、説明とともに本開示の原理を説明するために使用され、本開示の不適切な限定を構成するものではない。
図1】一例示的な実施例による画像レジストレーション方法のフローチャートである。
図2】一例示的な実施例によるスケールおよび視点の変化に耐える画像レジストレーション方法の概略フローチャートである。
図3】一例示的な実施例による画像レジストレーション装置のブロック図である。
図4】一例示的な実施例による画像レジストレーション電子機器のブロック図である。
図5】一例示的な実施例による画像レジストレーションのための電子機器のブロック図である。
【発明を実施するための形態】
【0013】
当業者が本開示の技術案をよりよく理解できるようにするために、以下、本開示の実施例における技術案を、添付の図面を参照して明確かつ完全に説明する。
【0014】
なお、本開示の明細書、特許請求の範囲および上記の図面における「第1」、「第2」などの用語は、類似の対象を区別するために使用され、特定の順序または順序を説明するために必ずしも使用されない。そのように使用されるデータは、本明細書に記載された本開示の実施例が本明細書に図示または記載されたもの以外の順序で実施され得るように、適切な状況で交換され得ることが理解されるべきである。以下の例示的な実施例で説明される実施形態は、本開示と一致するすべての実施形態を表すことを意図するものではない。むしろ、それらは、添付の特許請求の範囲に記載されている本開示のいくつかの態様と一致する装置および方法の単なる例である。
【0015】
図1は、一例示的な実施例による画像レジストレーション方法のフローチャートであり、図1に示すように、この画像レジストレーション方法は以下のステップS11~S14を含む。
【0016】
ステップS11では、ターゲットオブジェクトを含むターゲット画像を取得する。
【0017】
本開示の実施例では、ターゲット画像は、1つまたは複数のターゲットオブジェクトを含むことができ、ターゲットオブジェクトは、人、動物、植物、乗り物、建物、自然の風景などであり得る。ターゲット画像は、任意のフォーマットの写真またはビデオストリーム内のフレームであり、本開示の実施例は、ターゲットオブジェクトのカテゴリ、ターゲット画像のフォーマット、サイズ、および解像度などを特に限定しない。
【0018】
本開示の選択的な実施例では、ターゲットオブジェクトを含むターゲット画像を取得した後、ターゲット画像に対して前処理操作を実行することができ、例えば、ターゲット画像に対してノイズ低減処理などを実行することができる。
【0019】
ステップS12では、ターゲット画像を予め設定されたネットワークモデルに入力して、ターゲットオブジェクトの位置情報と回転角度情報を出力する。
【0020】
本開示の実施例では、事前にネットワークモデルを確立してトレーニングすることができ、このネットワークモデルは、入力される画像の画像内のオブジェクトの位置情報と回転角度情報を出力するために使用される。例えば、初期のディープ畳み込みネットワークモデルを事前に確立し、トレーニングサンプルデータをディープ畳み込みネットワークモデルに入力し、調整されたディープ畳み込みネットワークモデルの出力結果が設定要件を満たすまで、出力結果に基づいてディープ畳み込みネットワークモデルの各層のパラメーターを繰り返し調整する。ここで、トレーニングサンプルデータは、多数のトレーニング画像を含むことができ、トレーニング画像は、トレーニングオブジェクトを含むか、トレーニングオブジェクトを含まない可能性があり、トレーニング画像にトレーニングオブジェクトが含まれる場合、トレーニング画像には1つまたは複数のトレーニングオブジェクトが含まれる可能性がある。さらに、トレーニング画像には、異なるスケールおよび異なる視点のトレーニングオブジェクトが含まれ得る。また、トレーニングサンプルデータは、各トレーニング画像に対応するトレーニング位置情報およびトレーニング回転角度情報を含み得る。このトレーニング位置情報は、トレーニング画像内のトレーニングオブジェクトの位置情報を表すために使用され、位置情報に基づいてそのスケールを取得することができ、スケールはトレーニングオブジェクトのサイズとして理解することができる。簡単に言えば、トレーニングオブジェクトを撮影した場合、トレーニングオブジェクトに近づいて撮影すると、イメージされるトレーニングオブジェクトのスケールは大きくなり、トレーニングオブジェクトから離れて撮影すると、イメージされるトレーニングオブジェクトのスケールは小さくなる。トレーニングオブジェクトの検出にはスケール不変性があり、つまり、トレーニングオブジェクトのスケールに関わらず、トレーニングイメージ内のトレーニングオブジェクトの位置情報を検出することができる。このトレーニング回転角度情報は、トレーニング画像内のトレーニングオブジェクトの視点を表すために使用される。視点は、トレーニング画像が配置されている3次元空間でのトレーニングオブジェクトの角度として理解することができる。
【0021】
本開示の選択的な実施例では、位置情報は、ターゲット画像内のターゲットオブジェクトの最小外包矩形(MBR-Minimum Bounding Rectangle)の座標点情報を含んでもよい。具体的には、座標点情報には、最小外包矩形の対角線上の2つの頂点の座標点情報が少なくとも含まれる。実際の応用では、位置情報は、locgt=(x,y,x,y)で表すことができ、ここで、locgtは位置情報を表し、xは最小外包矩形の左上隅の座標点の横座標を表し、yは最小外包矩形の左上隅の座標点の縦座標を表し、xは最小外包矩形の右下隅の座標点の横座標を表し、yは最小外包矩形の右下隅の座標点の縦座標を表す。
【0022】
本開示の選択的な実施例では、回転角度情報は、ターゲットオブジェクトの方位角情報、ピッチ角情報およびロール角情報を含み得る。実際の応用では、回転角度情報は、Rgt=(θ,φ,ψ)で表すことができ、ここで、Rgtは回転角度情報を表し、θは方位角情報を表し、φはピッチ角情報を表し、ψはロール角情報を表す。
【0023】
本開示の選択的な実施例では、上記のネットワークモデルは、入力される画像の画像内のオブジェクトのタイプ情報を出力するためにも使用される。それに応じて、上記のネットワークモデルのトレーニングプロセスにおいて、トレーニングサンプルデータは、各トレーニング画像に対応するトレーニングタイプ情報をさらに含むことができる。このトレーニングタイプ情報は、トレーニングオブジェクトが属するオブジェクトタイプを示すために使用される。実際の適用では、オブジェクトタイプは、水カップ、テレビ、携帯電話、自動車などであってもよく、本開示の実施例は、オブジェクトタイプの分類などを特に限定しない。
【0024】
ステップS13では、位置情報と回転角度情報とに基づいて、予め設定された画像データベースから、ターゲットオブジェクトを含む参照画像をクエリして取得する。
【0025】
本開示の実施例では、予め設定された画像データベースは1つまたは複数のサンプルオブジェクトのサンプル画像を記憶することができ、ここで、各サンプル画像は、スケール及び/又は視点が異なるサンプルオブジェクトを含み得る。
【0026】
ステップS13でクエリによって得られる参照画像は、ターゲット画像に類似した画像として理解することができる。具体的には、画像データベースから、以下の3つの態様の条件を満たす参照画像をクエリして取得する。一態様では、参照画像内の参照オブジェクトとターゲット画像内のターゲットオブジェクトが同じオブジェクトタイプに属し、もう一つの態様では、参照画像内の参照オブジェクトのスケールは、ターゲット画像内のターゲットオブジェクトのスケールと類似し、さらにもう一つの態様では、参照画像内の参照オブジェクトの視点は、ターゲット画像内のターゲットオブジェクトの視点と類似している。
【0027】
本開示の選択的な実施例では、画像データベースにはサンプルオブジェクトのサンプル画像が記憶されており、かつ、サンプルオブジェクトとターゲットオブジェクトが同じオブジェクトタイプに属している場合、画像データベースから、予め設定されたスケール条件と予め設定された視点条件を満たす参照画像をクエリして取得することができる。
【0028】
上記のスケール条件は、ターゲットオブジェクトの位置情報に対応するスケールとサンプルオブジェクトのスケールとの差が予め設定されたスケール範囲内であることを示し得る。例えば、ターゲットオブジェクトのスケールは100平方ピクセル点であり、サンプルオブジェクトのスケールは95平方ピクセル点であり、ターゲットオブジェクトのスケールとサンプルオブジェクトのスケールとの差は、-5~5平方ピクセル点のスケール範囲である。
【0029】
上記の視点条件は、ターゲットオブジェクトの回転角度情報に対応する視点とサンプルオブジェクトの視点との差が、予め設定された視点範囲内であることを示し得る。例えば、ターゲットオブジェクトの視点は50°であり、サンプルオブジェクトの視点は45°であり、ターゲットオブジェクトの視点とサンプルオブジェクトの視点との差は、-5°~5°の視点範囲である。
【0030】
本開示の選択的な実施例では、画像データベースには複数のサンプルオブジェクトのサンプル画像が記憶され、かつ、複数のサンプルオブジェクトのうち、ターゲットオブジェクトと同じオブジェクトタイプに属するサンプルオブジェクトがある場合、画像データベースから、ターゲットオブジェクトと同じオブジェクトタイプに属するサンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得することができ、例えば、ターゲットオブジェクトのオブジェクトタイプがカップである場合、画像データベースから、カップを含む同じタイプのサンプル画像をクエリして取得する。そして、同じタイプのサンプル画像から、スケール条件と視点条件を満たす参照画像をクエリして取得する。
【0031】
上記の画像データベースから、ターゲットオブジェクトと同じオブジェクトタイプに属するサンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得するプロセスにおいて、ターゲットオブジェクトのオブジェクトタイプを取得して、オブジェクトタイプ画像に基づいて、データベースから、同じタイプのサンプル画像をクエリして取得することができる。ここで、ターゲットオブジェクトのオブジェクトタイプを取得する場合、ターゲット画像をネットワークモデルに入力して、ターゲットオブジェクトのオブジェクトタイプを出力することができる。
【0032】
ステップS14では、ターゲット画像と参照画像に対して画像レジストレーションを行って、ターゲット画像におけるターゲットオブジェクトの参照画像内の対応する位置を取得する。
【0033】
本開示の実施例では、ターゲット画像と参照画像に対して画像レジストレーションを行う場合、ターゲットオブジェクトの位置情報に基づいて、ターゲット画像からオブジェクト画像を決定し、オブジェクト画像と参照画像に対して画像レジストレーションを行うことができる。上記のオブジェクト画像は、ターゲットオブジェクトの位置情報に基づいて位置決めされ、ターゲットオブジェクトを含む最小外包矩形内のターゲット画像であってもよく、即ち、最小外包矩形内のターゲット画像をオブジェクト画像とする。
【0034】
画像レジストレーション方法は、相対画像レジストレーションと絶対画像レジストレーションにまとめることができる。ここで、相対画像レジストレーションとは、複数の画像から画像を参照画像として選択し、ターゲット画像と参照画像に対してレジストレーションを行うことを指す。座標システムは任意である。絶対画像レジストレーションとは、最初にコントロールグリッドを定義して、このグリッドに基づいてすべての画像をレジストレーションすることを指す。本開示の実施例における画像レジストレーションは、主に相対画像レジストレーションである。画像内の情報を使用して相対画像レジストレーションを実行する場合、主にグレー情報法、変換ドメイン法および特徴法の3つの方法に分けることができる。本開示の選択的な実施例では、オブジェクト画像と参照画像に対して画像レジストレーションを行う場合、特徴法を使用して、オブジェクト画像と参照画像に対して画像レジストレーションを行うことができる。実際の応用では、オブジェクト画像と参照画像から、それぞれターゲットオブジェクトの第1の特徴記述子と第2の特徴記述子を抽出することができる。特徴記述子は、画像内の有用な情報を表すことができ、不要な情報を含まない。具体的には、スケール不変特徴変換(Scale-invariant feature transform、SIFT)アルゴリズムを使用して、第1の特徴記述子および第2の特徴記述子を抽出することができる。第1の特徴記述子と第2の特徴記述子の間の距離を算出する。この距離は、ユークリッド距離やハミング距離などであってもよい。距離が予め設定された距離条件を満たす第1の特徴記述子と第2の特徴記述子を特徴点ペアとする。特徴点ペアとPNP(Perspective NPoint)アルゴリズムとに基づいて、オブジェクト画像と参照画像の間の変換行列、つまり、2つの画像の間のカメラ姿勢変化行列を算出する。そして、オブジェクト画像および参照画像の空間内の同じ位置にある点が一対一に対応付けられるように、変換行列に基づいてオブジェクト画像を参照画像にマッピングする。
【0035】
変換行列に基づいて、オブジェクト画像に含まれるターゲットオブジェクトを参照画像にマッピングする場合、次の式に基づいてマッピングを行うことができる。
=M*I
【0036】
ここで、Iはオブジェクト画像であり、Iは参照画像であり、Mは変換行列である。
【0037】
画像レジストレーション方法に関する上記の説明に基づいて、スケールおよび視野角の変化に耐える画像レジストレーション方法を以下に紹介する。図2に示すように、スケールおよび視点の変化に耐える画像レジストレーション方法の概略フローチャートを示す。この方法は、まず、ディープニューラルネットワークモデルを使用してターゲット画像内のターゲットオブジェクトの位置情報を検出し、ターゲットオブジェクトの三次元での回転角情報を予測する。ターゲット画像内のターゲットオブジェクトの位置情報からターゲットオブジェクトのスケールを取得し、ターゲットオブジェクトの三次元での回転角度情報からターゲットオブジェクトの視点を取得することができる。そして、選択画像データベースからターゲット画像の視点に近い参照画像を選択し、2つの画像(ターゲット画像と参照画像)に対して画像レジストレーションを行うことで、異なるスケールおよび異なる視点が変化した場合、特徴記述子を十分に抽出できないために、画像レジストレーションの精度が低いという問題を解決することができる。
【0038】
本開示の実施例は、ターゲットオブジェクトを含むターゲット画像を予め設定されたネットワークモデルに入力し、ターゲットオブジェクトの位置情報と回転角度情報を出力する。位置情報と回転角度情報とに基づいて、予め設定された画像データベースから、ターゲットオブジェクトを含む参照画像をクエリして取得する。参照画像内のターゲットオブジェクトのスケールは、ターゲット画像内のターゲットオブジェクトのスケールと類似し、参照画像内のターゲットオブジェクトの視点は、ターゲット画像内のターゲットオブジェクトの視点と類似する。ターゲット画像と参照画像に対して画像レジストレーションを行って、ターゲット画像におけるターゲットオブジェクトの参照画像内の対応する位置を取得する。
【0039】
本開示の実施例は、ネットワークモデルを使用してターゲット画像内のターゲットオブジェクトの位置情報と回転角度情報を決定し、これにより、位置情報と回転角度情報を使用して、画像データベースからスケールおよび視点が近い参照画像をクエリする。即ち、参照画像のターゲットオブジェクトのスケールと視点、およびターゲット画像のターゲットオブジェクトのスケールと視点があまり変化しないため、ターゲット画像と参照画像から十分な特徴記述子を抽出して、画像レジストレーションの精度を向上させることができる。
【0040】
本開示の実施例では、画像データベースは、特定のタイプのサンプルオブジェクトのサンプル画像を含んでもよく、複数のタイプのサンプルオブジェクトのサンプル画像を含んでもよい。ディープ畳み込みネットワークモデルを使用してターゲットオブジェクトのオブジェクトタイプを予測した後、ターゲットオブジェクトのオブジェクトタイプに対応する画像データベースを選択し、または、画像データベースから、ターゲットオブジェクトのオブジェクトタイプに対応するサンプル画像をクエリすることができる。特定のオブジェクトタイプのサンプルオブジェクトが広く使用されている場合、このオブジェクトタイプのサンプル画像の画像データベースを事前に確立することができる。特定のオブジェクトタイプのサンプルオブジェクトが広く使用されていない場合、このオブジェクトタイプのサンプル画像を複数のオブジェクトタイプを含むサンプル画像の画像データベースに記憶することができる。
【0041】
本開示の実施例は、ターゲット画像からオブジェクト画像を決定して、オブジェクト画像と参照画像に対して画像レジストレーションを行う。オブジェクト画像のサイズはターゲット画像のサイズよりも小さいため、サイズの小さいオブジェクト画像を使用して参照画像に対して画像レジストレーションを行うことにより、計算されるデータ量が減り、画像レジストレーションの速度が向上される。
【0042】
図3は、一例示的な実施例による画像レジストレーション装置のブロック図である。図3を参照し、具体的に、この装置は、以下のようなユニットおよびモジュールを含み得る。
【0043】
取得モジュール30は、ターゲットオブジェクトを含むターゲット画像を取得するように構成される。
【0044】
予測モジュール31は、前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力するように構成される。
【0045】
クエリモジュール32は、前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するように構成される。
【0046】
レジストレーションモジュール33は、前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するように構成される。
【0047】
本開示の選択的な実施例では、前記画像データベースには、1つまたは複数のサンプルオブジェクトのサンプル画像が記憶され、前記サンプル画像には、スケール及び/又は視点が異なる前記サンプルオブジェクトが含まれる。
【0048】
本開示の選択的な実施例では、前記クエリモジュール32は、前記画像データベースには1つの前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、前記サンプルオブジェクトと前記ターゲットオブジェクトが同じオブジェクトタイプに属している場合、前記画像データベースから、予め設定されたスケール条件と予め設定された視点条件を満たす前記参照画像をクエリして取得するように構成される。
【0049】
ここで、前記スケール条件は、前記ターゲットオブジェクトの位置情報に対応するスケールと前記サンプルオブジェクトのスケールとの差が、予め設定されたスケール範囲内であることを示し、前記視点条件は、前記ターゲットオブジェクトの回転角度情報に対応する視点と前記サンプルオブジェクトの視点との差が、予め設定された視点範囲内であることを示す。
【0050】
本開示の選択的な実施例では、前記クエリモジュール32は、前記画像データベースには複数の前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、複数の前記サンプルオブジェクトのうち、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトがある場合、前記画像データベースから、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得し、前記同じタイプのサンプル画像から、前記スケール条件と前記視点条件を満たす前記参照画像をクエリして取得するように構成される。
【0051】
本開示の選択的な実施例では、前記クエリモジュール32は、前記ターゲットオブジェクトのオブジェクトタイプを取得し、前記オブジェクトタイプに基づいて、前記画像データベースから、前記同じタイプのサンプル画像クエリして取得するように構成される。
【0052】
本開示の選択的な実施例では、前記クエリモジュール32は、前記ターゲット画像を前記ネットワークモデルに入力して、前記ターゲットオブジェクトの前記オブジェクトタイプを出力するように構成される。
【0053】
本開示の選択的な実施例では、前記レジストレーションモジュール33は、
前記位置情報に基づいて、前記ターゲット画像から、前記ターゲットオブジェクトが含まれるオブジェクト画像を決定する画像決定ユニット330と、
前記オブジェクト画像と前記参照画像に対して画像レジストレーションを行う画像レジストレーションユニット331と、を含む。
【0054】
本開示の選択的な実施例では、前記画像決定ユニット330は、前記位置情報に基づいて前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形を位置決めして、前記最小外包矩形内の前記ターゲット画像を前記オブジェクト画像とするように構成される。
【0055】
本開示の選択的な実施例では、前記画像レジストレーションユニット331は、
前記オブジェクト画像と前記参照画像から、それぞれ前記ターゲットオブジェクトの第1の特徴記述子と第2の特徴記述子を抽出して取得する抽出サブモジュールと、
前記第1の特徴記述子と前記第2の特徴記述子の間の距離を算出する算出サブモジュールと、
前記距離が予め設定された距離条件を満たす前記第1の特徴記述子と前記第2の特徴記述子を特徴点ペアとするフィルタリングサブモジュールと、
前記特徴点ペアとPNPアルゴリズムとに基づいて前記オブジェクト画像と前記参照画像の間の変換行列を算出する前記算出サブモジュールと、
前記オブジェクト画像および前記参照画像の空間内の同じ位置にある点が対応付けられるように、前記変換行列に基づいて前記オブジェクト画像を前記参照画像にマッピングするマッピングサブモジュールと、を含む。
【0056】
本開示の選択的な実施例では、前記位置情報には、前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形の座標点情報が含まれ、前記座標点情報には、前記最小外包矩形の対角線上の2つの頂点の座標点情報が少なくとも含まれ、前記回転角度情報には、前記ターゲットオブジェクトの方位角情報、ピッチ角情報およびロール角情報が含まれる。
【0057】
上記の実施例の装置について、各ユニットおよび各モジュールが動作を実行する具体的な方法は、関連する方法の実施例で詳細に説明されており、ここでは詳細に説明されない。
【0058】
図4は、一例示的な実施例による画像レジストレーション電子機器400のブロック図である。例えば、電子機器400は、携帯電話、コンピュータ、デジタルブロードキャスト端末、メッセージ送受信機、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、携帯情報端末等のものであってもよい。
【0059】
図4を参照すると、電子機器400は、処理コンポーネント402、メモリ404、電源コンポーネント406、マルチメディアコンポーネント408、オーディオコンポーネント410、入力/出力(I/O)インタフェース412、センサーコンポーネント414、及び通信コンポーネント416のうちの1つまたは複数のコンポーネントを含むことができる。
【0060】
処理コンポーネント402は、一般的には、電子機器400の全体の操作、例えば、表示、電話呼び出し、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理コンポーネント402は、上述方法におけるステップの一部又は全部を実現できるように、命令を実行する1つ又は複数のプロセッサー420を備えてもよい。なお、処理コンポーネント402は、他のコンポーネントとのインタラクションを容易にするように、1つ又は複数のモジュールを備えてもよい。例えば、処理コンポーネント402は、マルチメディアコンポーネント408とのインタラクションを容易にするように、マルチメディアモジュールを備えてもよい。
【0061】
メモリ404は、電子機器400での操作をサポートするように、各種のデータを記憶するように配置される。これらのデータは、例えば、電子機器400で何れのアプリケーション又は方法を操作するための命令、連絡先データ、電話帳データ、メッセージ、画像、ビデオ等を含む。メモリ404は、何れの種類の揮発性又は不揮発性メモリ、例えば、スタティックランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、消去可能なプログラム可能な読み取り専用メモリ(EPROM)、プログラム可能な読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク、或いは光ディスクにより、或いはそれらの組み合わせにより実現することができる。
【0062】
電源ユニット406は、電子機器400の各種ユニットに電力を供給するためのものであり、電源管理システム、1つ又は複数の電源、及び電子機器400のために電力を生成、管理及び分配することに関連する他のコンポーネントを備えてもよい。
【0063】
マルチメディアユニット408は、電子機器400とユーザとの間に出力インタフェースを提供するスクリーンを備えてもよい。スクリーンは、例えば、液晶ディスプレイ(LCD)やタッチパネル(TP)を備えてもよい。スクリーンは、タッチパネルを備える場合、ユーザからの入力信号を受信するように、タッチスクリーンになることができる。タッチパネルは、タッチや、スライドや、タッチパネル上の手振りを知覚するように、1つ又は複数のタッチセンサーを有する。タッチセンサーは、タッチやスライド動作の境界を知覚できるだけではなく、タッチやスライド操作と関連する持続時間や圧力も知覚できる。一実施例では、マルチメディアユニット408は、フロントカメラ及び/又はバックカメラを有してもよい。電子機器400が、例えば、撮影モードやビデオモードのような操作モードにある時、フロントカメラ及び/又はバックカメラが外部のマルチメディアデータを受信できる。フロントカメラ及びバックカメラのそれぞれは、固定の光学レンズ系であってもよいし、焦点距離及び光学ズーム能力を有するものであってもよい。
【0064】
オーディオユニット410は、オーディオ信号を出力及び/又は入力するように配置される。例えば、オーディオユニット410は、マイクロフォン(MiC)を有してもよい。電子機器400が、例えば、呼び出しモード、記録モード、又は音声認識モードのような操作モードにあるとき、マイクロフォンは、外部のオーディオ信号を受信するように配置される。受信したオーディオ信号は、メモリ404にさらに記憶されてもよいし、通信ユニット416を介して送信されてもよい。一実施例では、オーディオユニット410は、オーディオ信号を出力するためのスピーカをさらに備えてもよい。
【0065】
I/Oインタフェース412は、処理ユニット402と外部のインタフェースモジュールとの間にインタフェースを提供するためのものである。上記外部のインタフェースモジュールは、キーボードや、クリックホイールや、ボタン等であってもよい。これらのボタンは、ホームボタンや、音量ボタンや、スタートボタンや、ロックボタンであってもよいが、それらに限らない。
【0066】
センサーコンポーネント414は、電子機器400のために各方面の状態を評価する少なくとも1つのセンサーを備えてもよい。例えば、センサーコンポーネント414は、電子機器400のオン/オフ状態や、コンポーネントの相対的な位置を検出することができる。例えば、前記コンポーネントは、電子機器400のディスプレイ及びキーパッドである。センサーコンポーネント414は、電子機器400又は電子機器400の1つのコンポーネントの位置の変化、ユーザによる電子機器400への接触の有無、電子機器400の方向又は加速/減速、電子機器400の温度変化などを検出することができる。センサーコンポーネント414は、何れの物理的な接触もない場合に付近の物体を検出するように配置される近接センサーを有してもよい。センサーコンポーネント414は、イメージングアプリケーションに用いるための光センサー、例えば、CMOS又はCCD画像センサーを有してもよい。一実施例では、当該センサーコンポーネント414は、加速度センサー、ジャイロスコープセンサー、磁気センサー、圧力センサー又は温度センサーをさらに備えてもよい。
【0067】
通信コンポーネント416は、電子機器400と他の設備の間との無線又は有線通信を容易にするように配置される。電子機器400は、通信標準に基づく無線ネットワーク、例えば、WiFi、2G又は3G、又はそれらの組み合わせにアクセスできる。1つの例示的な実施例では、通信コンポーネント416は、ブロードキャストチャンネルを介して外部のブロードキャスト管理システムからのブロードキャスト信号又はブロードキャストに関する情報を受信する。1つの例示的な実施例では、前記通信コンポーネント816は、近距離通信を促進するために近距離無線通信(NFC)モジュールをさらに備えてもよい。例えば、NFCモジュールは、無線周波数認識装置(RFID:Radio Frequency IDentification)技術、赤外線データ協会(IrDA:Infrared Data Association)技術、超広帯域無線(UWB:Ultra Wide Band)技術、ブルートゥース(登録商標)(BT:Bluetooth)技術及び他の技術によって実現されてもよい。
【0068】
例示的な実施例では、電子機器400は、上述方法を実行するために、1つ又は複数の特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)、デジタル信号プロセッサー(DSP:Digital Signal Processor)、デジタル信号処理デバイス(DSPD:Digital Signal Processing Device)、プログラマブルロジックデバイス(PLD:Programmable Logic Device)、書替え可能ゲートアレイ(FPGA:Field-Programmable Gate Array)、コントローラ、マイクロコントローラ、マイクロプロセッサー、又は他の電子機器によって実現されてもよい。
【0069】
例示的な実施例では、命令を有する非一時的コンピュータ読み取り可能な記録媒体、例えば、命令を有するメモリ404をさらに提供し、前記命令は、電子機器400のプロセッサー420により実行されて上述方法を実現する。選択的に、記憶媒体は、非一時的コンピュータ読み取り可能な記憶媒体であってもよく、例えば、前記非一時的コンピュータ読み取り可能な記録媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスク及び光データメモリ等であってもよい。
【0070】
例示的な実施例では、コンピュータープログラム製品をさらに提供し、該コンピュータープログラム製品は、読み取り可能なプログラムコードを含み、前記読み取り可能なプログラムコードは、前記方法を実現するために、電子デバイス400のプロセッサによって実行される。選択的に、このプログラムコードは電子機器400の記憶媒体に記憶されてもよく、記憶媒体は非一時的コンピュータ読み取り可能な記憶媒体であってもよく、例えば、前記非一時的コンピュータ読み取り可能な記録媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスク及び光データメモリ等であってもよい。
【0071】
図5は、一例示的な実施例に係る画像レジストレーションのためのを示すブロック図である。例えば、電子機器500はサーバーとして提供されてもよい。図5を参照すると、電子機器500は、1つ以上のプロセッサーがさらに含まれた処理コンポーネント522と、処理コンポーネント522により実行可能な命令、例えばプログラムを記憶するメモリ532を代表とするメモリリソースとを含む。メモリ532に記憶されたアプリケーションプログラムは、1つ以上のそれぞれが一組の命令に対応するモジュールを含んでもよい。なお、上述した画像レジストレーション方法を実行するために、処理コンポーネント522は命令を実行するように配置される。
【0072】
電子機器500は、電子機器500の電源管理を実行するように配置された電源コンポーネント526と、装置500をインターネットに接続させるように配置された有線又は無線インターネットインタフェース550と、入力/出力(I/O)インタフェース558とを備えてもよい。装置500はメモリ532に記憶された操作システム、例えばWindows ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTMなどに基づいて操作できる。
【0073】
当業者は、明細書に対する理解、及び明細書に記載された発明に対する実施を介して、本発明の他の実施形態を容易に取得することができる。本発明は、本発明に対する任意の変形、用途、又は適応的な変化を含み、このような変形、用途、又は適応的な変化は、本発明の一般的な原理に従い、本発明では開示していない本技術分野の公知知識、又は通常の技術手段を含む。明細書及び実施例は、単に例示的なものであって、本発明の本当の範囲と主旨は、以下の特許請求の範囲によって示される。
【0074】
なお、本開示は、上記で記述され、図面で図示した特定の構成に限定されず、その範囲を離脱しない状況で、様々な修正や変更を実施してもよい。本開示の範囲は、添付される特許請求の範囲のみにより限定される。
図1
図2
図3
図4
図5
【手続補正書】
【提出日】2022-09-30
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正の内容】
【0010】
本開示の実施例による第5の態様は、コンピュータープログラムを提供し、読み取り可能なプログラムコードを含み、前記読み取り可能なプログラムコードは、第1の態様に記載の画像レジストレーション方法を実現するために、電子デバイスのプロセッサによって実行される。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0070
【補正方法】変更
【補正の内容】
【0070】
例示的な実施例では、コンピュータープログラムをさらに提供し、該コンピュータープログラムは、読み取り可能なプログラムコードを含み、前記読み取り可能なプログラムコードは、前記方法を実現するために、電子デバイス400のプロセッサによって実行される。選択的に、このプログラムコードは電子機器400の記憶媒体に記憶されてもよく、記憶媒体は非一時的コンピュータ読み取り可能な記憶媒体であってもよく、例えば、前記非一時的コンピュータ読み取り可能な記録媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスク及び光データメモリ等であってもよい。
【手続補正3】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ターゲットオブジェクトを含むターゲット画像を取得するステップと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力するステップと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するステップと、を含む、
ことを特徴とする画像レジストレーション方法。
【請求項2】
前記画像データベースには、1つまたは複数のサンプルオブジェクトのサンプル画像が記憶され、前記サンプル画像には、スケール及び/又は視点が異なる前記サンプルオブジェクトが含まれる、
ことを特徴とする請求項1に記載の画像レジストレーション方法。
【請求項3】
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するステップは、
前記画像データベースには1つの前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、前記サンプルオブジェクトと前記ターゲットオブジェクトが同じオブジェクトタイプに属している場合、前記画像データベースから、予め設定されたスケール条件と予め設定された視点条件を満たす前記参照画像をクエリして取得するステップ、又は
前記画像データベースには複数の前記サンプルオブジェクトの前記サンプル画像が記憶されており、かつ、複数の前記サンプルオブジェクトのうち、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトがある場合、前記画像データベースから、前記ターゲットオブジェクトと同じオブジェクトタイプに属する前記サンプルオブジェクトを含む同じタイプのサンプル画像をクエリして取得し、前記同じタイプのサンプル画像から、前記スケール条件と前記視点条件を満たす前記参照画像をクエリして取得するステップを含み、
前記スケール条件は、前記ターゲットオブジェクトの位置情報に対応するスケールと前記サンプルオブジェクトのスケールとの差が、予め設定されたスケール範囲内であることを示し、前記視点条件は、前記ターゲットオブジェクトの回転角度情報に対応する視点と前記サンプルオブジェクトの視点との差が、予め設定された視点範囲内であることを示す、
ことを特徴とする請求項2に記載の画像レジストレーション方法。
【請求項4】
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行うステップは、
前記位置情報に基づいて前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形を位置決めするステップと、
前記最小外包矩形内の前記ターゲット画像をオブジェクト画像とするステップと、
前記オブジェクト画像と前記参照画像に対して画像レジストレーションを行うステップと、を含む、
ことを特徴とする請求項1に記載の画像レジストレーション方法。
【請求項5】
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行うステップは、
前記オブジェクト画像と前記参照画像から、それぞれ前記ターゲットオブジェクトの第1の特徴記述子と第2の特徴記述子を抽出して取得するステップと、
前記第1の特徴記述子と前記第2の特徴記述子の間の距離を算出するステップと、
前記距離が予め設定された距離条件を満たす前記第1の特徴記述子と前記第2の特徴記述子を特徴点ペアとするステップと、
前記特徴点ペアとPNPアルゴリズムとに基づいて前記オブジェクト画像と前記参照画像の間の変換行列を算出するステップと、
前記オブジェクト画像および前記参照画像の空間内の同じ位置にある点が対応付けられるように、前記変換行列に基づいて前記オブジェクト画像を前記参照画像にマッピングするステップと、を含む、
ことを特徴とする請求項4に記載の画像レジストレーション方法。
【請求項6】
前記位置情報には、前記ターゲット画像内の前記ターゲットオブジェクトの最小外包矩形の座標点情報が含まれ、前記座標点情報には、前記最小外包矩形の対角線上の2つの頂点の座標点情報が少なくとも含まれ、前記回転角度情報には、前記ターゲットオブジェクトの方位角情報、ピッチ角情報およびロール角情報が含まれる、
ことを特徴とする請求項1~5のいずれかに記載の画像レジストレーション方法。
【請求項7】
ターゲットオブジェクトを含むターゲット画像を取得する取得モジュールと、
前記ターゲット画像を予め設定されたネットワークモデルに入力して、前記ターゲットオブジェクトの位置情報と回転角度情報を出力する予測モジュールと、
前記位置情報と前記回転角度情報とに基づいて、予め設定された画像データベースから、前記ターゲットオブジェクトを含む参照画像をクエリして取得するクエリモジュールと、
前記ターゲット画像と前記参照画像に対して画像レジストレーションを行って、前記ターゲット画像における前記ターゲットオブジェクトの前記参照画像内の対応する位置を取得するレジストレーションモジュールと、を含む、
ことを特徴とする画像レジストレーション装置。
【請求項8】
電子機器であって、
プロセッサと、
プロセッサによって実行される命令が記憶されるメモリとを含み、
プロセッサは、請求項1~6のいずれかに記載の画像レジストレーション方法を実現するために命令を実行するように構成される、
ことを特徴とする電子機器。
【請求項9】
記憶媒体であって、
前記記憶媒体の命令が電子機器のプロセッサによって実行されると、前記電子機器は、請求項1~6のいずれかに記載の画像レジストレーション方法を実行する、
ことを特徴とする記憶媒体。
【請求項10】
コンピュータプログラムであって、
前記コンピュータプログラムのおける命令が実行された場合、請求項1~6のいずれかに記載の画像レジストレーション方法が実行される、
ことを特徴とするコンピュータプログラム。
【国際調査報告】