IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7150074エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器
<>
  • 特許-エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器 図1
  • 特許-エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器 図2
  • 特許-エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器 図3
  • 特許-エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器 図4
  • 特許-エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-29
(45)【発行日】2022-10-07
(54)【発明の名称】エッジベースの拡張現実3次元追跡登録方法、装置及び電子機器
(51)【国際特許分類】
   G06T 7/70 20170101AFI20220930BHJP
   G06V 20/20 20220101ALI20220930BHJP
【FI】
G06T7/70 B
G06V20/20
【請求項の数】 13
(21)【出願番号】P 2021022634
(22)【出願日】2021-02-16
(65)【公開番号】P2021136028
(43)【公開日】2021-09-13
【審査請求日】2021-02-16
(31)【優先権主張番号】202010118216.3
(32)【優先日】2020-02-25
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】チェン,シリ
(72)【発明者】
【氏名】リュウ,ヂャオリャン
【審査官】岡本 俊威
(56)【参考文献】
【文献】特開2010-079452(JP,A)
【文献】特開2012-002761(JP,A)
【文献】A. Kasinski; T. Piascik,Managing processes of perceptual organization for emerging geometrical objects,Smc 2000 conference proceedings. 2000 ieee international conference on systems, man and cybernetics,IEEE,2000年10月08日,p1604-1609,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=886251
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00- 7/90
G06V 20/20
(57)【特許請求の範囲】
【請求項1】
エッジベースの拡張現実3次元追跡登録方法であって、
3次元物体の画像内での初期化姿勢を取得するステップと、
前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するステップと、
抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するステップと、
全てのグループが見つけ出したマッチングポイントに基づいて、前記3次元物体の姿勢を計算するステップと、を含み、
各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するステップは、
各々のグループを基本単位とし、前記各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するステップを含む、
ことを特徴とするエッジベースの拡張現実3次元追跡登録方法。
【請求項2】
前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するステップは、
前記初期化姿勢によって、前記3次元物体のモデルを投影して、モデル投影画像を計算するステップと、
前記モデル投影画像内のオブジェクトの可視エッジを認識し、可視エッジに沿って規則的な間隔をおく方法でサンプリングポイントを割り当てるステップと、
前記サンプリングポイントと、前記サンプリングポイントのモデル線分における法線方向とを前記3次元物体の輪郭のEdgelet特徴とするステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
抽出されたEdgelet特徴をグループ分けするステップは、
前記3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴をグループ分けするステップを含み、ここで、各々のグループ内の各Edgelet特徴は、法線方向が一致するか、又は法線方向間の夾角が第1所定範囲内にあり、前記各々のグループはいずれも自分の平均法線ベクトルを有する、
ことを特徴とする請求項1に記載の方法。
【請求項4】
各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するステップは、
前記現在グループの平均法線ベクトル方向に沿って第2所定範囲内で前記画像内を双方向に検索するステップと、
前記現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングするステップと、
前記それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して前記現在グループの最適マッチング位置とし、前記最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとするステップと、を含む、
ことを特徴とする請求項に記載の方法。
【請求項5】
現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイ
ントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングするステップは、
前記現在グループ内の各Edgelet特徴の検索位置で、前記現在グループの平均法線ベクトル方向に沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとするステップと、
前記候補ポイントから、勾配方向と前記現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して前記各Edgelet特徴の前記検索位置でのマッチングポイントとするステップと、を含む、
ことを特徴とする請求項に記載の方法。
【請求項6】
エッジベースの拡張現実3次元追跡登録装置であって、
3次元物体の画像内での初期化姿勢を取得するための初期化姿勢取得モジュールと、
前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するための特徴抽出モジュールと、
抽出されたEdgelet特徴をグループ分けするためのグループ分けモジュールと、
各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するためのマッチングポイント検索モジュールと、
全てのグループが見つけ出したマッチングポイントに基づいて、前記3次元物体の姿勢を計算するための姿勢計算モジュールと、を含み、
前記マッチングポイント検索モジュールは、具体的には、
各々のグループを基本単位とし、前記各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するために用いられる
ことを特徴とするエッジベースの拡張現実3次元追跡登録装置。
【請求項7】
前記特徴抽出モジュールは、具体的には、
前記初期化姿勢によって、前記3次元物体のモデルを投影して、モデル投影画像を計算し、
前記モデル投影画像内のオブジェクトの可視エッジを認識し、可視エッジに沿って規則的な間隔をおく方法でサンプリングポイントを割り当て、
前記サンプリングポイントと、前記サンプリングポイントのモデル線分における法線方向とを前記3次元物体の輪郭のEdgelet特徴とするために用いられる、
ことを特徴とする請求項に記載の装置。
【請求項8】
前記グループ分けモジュールは、具体的には、
前記3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴をグループ分けするために用いられ、ここで、各々のグループ内の各Edgelet特徴は、法線方向が一致するか、又は法線方向間の夾角が第1所定範囲内にあり、前記各々のグループはいずれも自分の平均法線ベクトルを有する、
ことを特徴とする請求項に記載の装置。
【請求項9】
前記マッチングポイント検索モジュールは、具体的には、
前記現在グループの平均法線ベクトル方向に沿って第2所定範囲内で前記画像内を双方向に検索し、
前記現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングし、
前記それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して前記現在グループの最適マッチング位置とし、前記最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとするために用いられる、
ことを特徴とする請求項に記載の装置。
【請求項10】
前記マッチングポイント検索モジュールは、具体的には、
前記現在グループ内の各Edgelet特徴の検索位置で、前記現在グループの平均法線ベクトル方向に沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとし、
前記候補ポイントから、勾配方向と前記現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して前記各Edgelet特徴の前記検索位置でのマッチングポイントとするために用いられる、
ことを特徴とする請求項に記載の装置。
【請求項11】
電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、ここで、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1~のいずれかに記載のエッジベースの拡張現実3次元追跡登録方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。
【請求項12】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに請求項1~のいずれかに記載のエッジベースの拡張現実3次元追跡登録方法を実行させるために用いられる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項13】
コンピュータ上で動作しているときに、請求項1~のいずれかに記載のエッジベースの拡張現実3次元追跡登録方法を前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、コンピュータビジョン処理の分野に関し、特に、エッジベースの拡張現実3次元追跡登録方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体に関する。
【背景技術】
【0002】
3次元物体登録追跡アルゴリズムは、拡張現実(Augmented Reality、英語略称AR)技術製品における重要なアルゴリズムである。現実中の3次元物体を追跡するには、まず携帯電話、カメラなどの画像収集装置に対する当該3次元物体の初期相対姿勢を決定してもよい。この初期相対姿勢を取得するプロセスを登録と呼ぶ。
【0003】
関連技術において、通常の登録方法は、2段階で行われる。第1段階は、テンプレートマッチングの方法を用いて、全体図内でターゲット物体を検索して、大まかな姿勢を取得する。第2段階は、第1段階の結果に基づいて姿勢キャリブレーションを行って、正確な姿勢を取得する。ここで、第2ステップによく使われる方法としては、一般的に2つのタイプがあり、第1のタイプは、正確な姿勢を計算するためのエッジベースのマッチングであり、第2のタイプは、正確な姿勢を計算するための深層学習に基づく方法である。
【0004】
しかし、現在、次のような問題が存在する。上記第1のタイプの方法は、通常、速度が速いが、一部の複雑な環境(例えば、背景の乱れ、遮蔽など)ではロバスト性がなく、見つけたEdgelet特徴のうち正確にマッチングするものが少ないため、マッチングポイントが無効になりやすく、第2のタイプの方法はロバストであるが、正確な姿勢を計算する速度が比較的遅い。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本出願は、少なくとも関連技術における技術的課題の1つをある程度解決することを目的とする。
【課題を解決するための手段】
【0006】
このため、本出願の1つ目の目的は、エッジベースの拡張現実3次元追跡登録方法を提供することであり、当該方法は、3次元物体の正確な姿勢を迅速でロバストに計算することを実現でき、且つ、アルゴリズムは計算の複雑さが低く、コンピューティングデバイスのハードウェアに対する要件が低いため、様々な機器でAR3次元物体追跡と表示を行うことができる。
【0007】
本出願の2つ目の目的は、エッジベースの拡張現実3次元追跡登録装置を提供することである。
【0008】
本出願の3つ目の目的は、電子機器を提供することである。
【0009】
本出願の4つ目の目的は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供することである。
【0010】
本出願の5つ目の目的は、コンピュータプログラムを提供することである。
【0011】
上記目的を達成するために、本出願の第1態様の実施例にて提供されるエッジベースの拡張現実3次元追跡登録方法は、3次元物体の画像内での初期化姿勢を取得するステップと、初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出するステップと、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するステップと、全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の姿勢を計算するステップと、を含む。
【0012】
本出願の一実施例によれば、前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するステップは、前記初期化姿勢によって、前記3次元物体のモデルを投影して、モデル投影画像を計算するステップと、前記モデル投影画像内のオブジェクトの可視エッジを認識し、可視エッジに沿って規則的な間隔をおく方法でサンプリングポイントを割り当てるステップと、前記サンプリングポイントと、前記サンプリングポイントのモデル線分における法線方向とを前記3次元物体の輪郭のEdgelet特徴とするステップと、を含む。
【0013】
本出願の一実施例によれば、抽出されたEdgelet特徴をグループ分けするステップは、前記3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴をグループ分けするステップを含み、ここで、各々のグループ内の各Edgelet特徴は、法線方向が一致するか、又は法線方向間の夾角が第1所定範囲内にあり、前記各々のグループはいずれも自分の平均法線ベクトルを有する。
【0014】
本出願の一実施例によれば、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するステップは、各々のグループを基本単位とし、前記各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するステップを含む。
【0015】
本出願の一実施例によれば、前記各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するステップは、前記現在グループの平均法線ベクトル方向に沿って、第2所定範囲内で前記画像内を双方向に検索するステップと、前記現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングするステップと、前記それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して前記現在グループの最適マッチング位置とし、前記最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとするステップと、を含む。
【0016】
本出願の一実施例によれば、前記現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングするステップは、前記現在グループ内の各Edgelet特徴の検索位置で、前記現在グループの平均法線ベクトル方向に沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとするステップと、前記候補ポイントから、勾配方向と前記現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して前記各Edgelet特徴の前記検索位置でのマッチングポイントとするステップと、を含む。
【0017】
上記目的を達成するために、本出願の第2態様の実施例にて提供されるエッジベースの拡張現実3次元追跡登録装置は、3次元物体の画像内での初期化姿勢を取得するための初期化姿勢取得モジュールと、前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するための特徴抽出モジュールと、抽出されたEdgelet特徴をグループ分けするためのグループ分けモジュールと、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するためのマッチングポイント検索モジュールと、全てのグループが見つけ出したマッチングポイントに基づいて、前記3次元物体の姿勢を計算するための姿勢計算モジュールと、を含む。
【0018】
上記目的を達成するために、本出願の第3態様の実施例にて提供される電子機器は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、ここで、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが本出願の第1態様に記載のエッジベースの拡張現実3次元追跡登録方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
【0019】
上記目的を達成するために、本出願の第4態様の実施例はコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の第1態様に記載のエッジベースの拡張現実3次元追跡登録方法を実行させるために用いられる。
【0020】
上記目的を達成するために、本出願の第5態様の実施例はコンピュータプログラムを提供し、前記コンピュータプログラムは、前記コンピュータに本出願の第1態様に記載のエッジベースの拡張現実3次元追跡登録方法を実行させるために用いられる。
【発明の効果】
【0021】
上記出願の一実施例は、次のような利点又は有益な効果がある。3次元物体の画像内での初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出し、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索し、全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の正確な姿勢を計算する。追跡登録プロセス全体において、3次元物体の輪郭のEdgelet特徴をグループ分けすることにより、各々のグループを基本ユニットとして画像内で検索マッチングを行い、画像内で見つかったEdgelet特徴の正確なマッチング数を確保し、見つけたマッチングポイントの有効性を保証し、それにより、本出願の追跡登録方法が一部の複雑な環境(例えば、背景の乱れ、遮蔽など)にもロバスト性を有するとともに、計算速度も保証できることにより、3次元物体の正確な姿勢を迅速でロバストに計算することが実現され、アルゴリズム計算の複雑度が低く、コンピューティングデバイスのハードウェアに対する要件が低いため、様々な機器でAR3次元物体追跡表示を行うことができる。従来技術における3次元物体追跡登録アルゴリズムの計算速度とロバスト性が両立できないという問題を解決した。
【0022】
上記選択可能な方法が有する他の効果を、以下で具体的な実施例を参照しながら説明する。
【図面の簡単な説明】
【0023】
図面は、本技術案をよりよく理解するために使用され、本出願を限定するものではない。
図1】本出願の一実施例によるエッジベースの拡張現実3次元追跡登録方法のフローチャートである。
図2】本出願の一実施例による各々のグループの平均法線ベクトル方向に沿って画像内を検索して各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すフローチャートである。
図3】本出願の一実施例による現在グループ内の各Edgelet特徴の、それぞれの検索位置でのマッチングポイントを見つけ出す構造模式図である。
図4】本出願の一実施例によるエッジベースの拡張現実3次元追跡登録装置の構造模式図である。
図5】本出願の実施例によるエッジベースの拡張現実3次元追跡登録方法の電子機器のブロック図である。
【発明を実施するための形態】
【0024】
以下、図面を組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができる。同様に、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
【0025】
本出願は、エッジベースの拡張現実3次元追跡登録方法、装置、電子機器、及びコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、本出願は、既存技術における3次元物体追跡登録アルゴリズムの計算速度とロバスト性が両立できないという問題を解決した。具体的には、以下、図面を参照しながら本出願の実施例のエッジベースの拡張現実3次元追跡登録方法、装置、電子機器、及びコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体について説明する。
【0026】
図1は、本出願の一実施例によるエッジベースの拡張現実3次元追跡登録方法のフローチャートである。なお、本出願の実施例のエッジベースの拡張現実3次元追跡登録方法は、本出願の実施例のエッジベースの拡張現実3次元追跡登録装置に適用でき、当該装置は、電子機器に配置できる。ここで、当該電子機器は、ディスプレイを備えた様々な電子機器、例えばスマートフォン、タブレットコンピュータなどの移動端末、或いはAR機器であってもよい。なお、当該電子機器は画像収集装置を有する。
【0027】
図1に示すように、当該エッジベースの拡張現実3次元追跡登録方法は、S110~S140を含んでもよい。
【0028】
S110、3次元物体の画像内での初期化姿勢を取得する。
【0029】
本出願の実施例では、3次元物体が認識されると、当該3次元物体を追跡することができる。当該3次元物体を追跡することが決定されると、先に3次元物体の画像内での初期化姿勢を取得することができる。ここで、初期化姿勢は、3次元物体の画像における大まかな位置及び姿勢として理解できる。
【0030】
ここで、LineMod(線形関数)アルゴリズムによって3次元物体の画像内での初期化姿勢を取得することができる。
【0031】
例を挙げると、LineModアルゴリズムに基づいて、画像の勾配情報に3次元物体表面の法線特徴を組み合わせて、テンプレートマッチングの根拠とすることができ、3次元物体の画像内での初期化姿勢を取得することができる。
【0032】
S120、初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出する。
【0033】
本出願の実施例では、3次元物体の画像内での初期化姿勢を取得した後、当該初期化姿勢を介して当該3次元物体のモデルを投影し、モデル投影画像を計算し、続いて、モデル投影画像内のオブジェクトの可視エッジを認識し、可視エッジに沿って規則的な間隔をおく方法でサンプリングポイントを割り当てた後、サンプリングポイントと、サンプリングポイントのモデル線分における法線方向とを、3次元物体の輪郭のEdgelet特徴(moving edge特徴とも呼ばれる)とする。
【0034】
ここで、投影方法で3次元物体のモデルを投影して、モデル投影画像を計算することができ、ここで、投影方法は、透視投影方法、正射投影方法等を含むが、これらに限定されない。
【0035】
S130、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索する。
【0036】
つまり、3次元物体の輪郭のEdgelet特徴を抽出した後、当該3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴をグループ分けし、さらに、グループ分けに基づいて画像内で検索マッチングを行うことができる。本出願の実施例では、3次元物体の輪郭全体の幾何学的構造に基づき、抽出されたEdgelet特徴を異なるグループに分けることができ、ここで、各々のグループ内の各Edgelet特徴は、法線方向が一致するか、又は法線方向間の夾角が第1所定範囲内にあり、各々のグループはいずれも独自の平均法線ベクトルを有する。
【0037】
抽出されたEdgelet特徴をグループ分けした後、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために、各々のグループの平均法線ベクトル方向に沿って画像内を検索する。
【0038】
ここで、3次元物体の輪郭全体の幾何学的構造は、隣接する短辺間の法線ベクトルの夾角、凹凸具合などを含むが、これらに限定されない。
【0039】
つまり、例えば、隣接する短辺間の法線ベクトルの夾角或いは凹凸具合のような3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴を異なるグループに分けすることができ、各々のグループ内のEdgelet特徴の法線方向が一致するか、又は法線方向間の夾角が第1所定範囲(ここで、当該第1所定範囲は、各々のグループ内のEdgelet特徴の法線方向を基本的に一致させることができる範囲として理解してもよい)内にあり、各々のグループは自分の平均法線ベクトルを有し、各々のグループを基本単位として、各々のグループの平均法線ベクトル方向に沿って画像内を検索して各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出す。
【0040】
ここで、本出願の実施例では、当該マッチング方法は以下のとおりであってもよい。平均方向に沿って、一定の範囲内で双方向検索を行い、それぞれの検索位置ではグループ内のEdgelet特徴を近傍でマッチングして、マッチングポイントがいくつあるかを確認し、最後に、マッチングポイントが最も多い1つの位置をこのグループの最適マッチング位置として選択し、且つ,この位置での各Edgelet特徴のマッチングポイントをそれぞれのマッチングポイントとして決定する。
【0041】
本出願の一実施例では、図2に示すように、各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために、各々のグループの平均法線ベクトル方向に沿って画像内を検索する前記ことの具体的な実現プロセスは、S210~S230を含む。
【0042】
S210、現在グループの平均法線ベクトル方向に沿って第2所定範囲内で画像内を双方向に検索する。
【0043】
つまり、抽出されたEdgelet特徴を異なるグループに分け、各々のグループは、現在グループの平均法線ベクトル方向に沿って、一定の範囲内で双方向検索を行い、ここで、検索範囲は単位ピクセルである。
【0044】
S220、現在グループ内の各Edgelet特徴の、それぞれの検索位置でのマッチングポイントを見つけ出すために、現在グループ内の各Edgelet特徴に対してそれぞれの検索位置でマッチングを行う。
【0045】
本出願の実施例では、現在グループ内の各Edgelet特徴の検索位置で、現在グループの平均法線ベクトル方向に沿う(現在グループの平均法線に沿ったベクトル方向での)勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとし、続いて、候補ポイントから、勾配方向と現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して各Edgelet特徴の検索位置でのマッチングポイントとする。
【0046】
ここで、勾配の一般式または勾配の差分式によって、現在グループの平均法線ベクトル方向に沿う勾配値を計算することができる。
【0047】
つまり、勾配の一般式または勾配の差分式によって、現在グループの平均法線ベクトル方向に沿う勾配値を計算した後、現在グループ内の各Edgelet特徴の検索位置で、勾配図内で法線平均法線ベクトルに沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ、例えば、あるピクセルポイントの勾配値が十分大きく、且つ法線ベクトル方向の両辺のピクセルの勾配値より大きいと、候補ポイントとし、続いて、候補ポイントから、勾配方向と現在グループの平均法線ベクトルとの夾角(例えば0~90度)が最も小さい候補ポイントを選択して各Edgelet特徴の検索位置でのマッチングポイントとする。
【0048】
S230、それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して現在グループの最適マッチング位置とし、最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとする。
【0049】
つまり、現在グループ内の各Edgelet特徴の、それぞれの検索位置でのマッチングポイントを見つけた後、それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して現在グループの最適マッチング位置とし、最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとする。
【0050】
例を挙げると、図3に示すように、S1は画像内の正確なエッジ位置であり、L1、L2、L3、L4、L5は、それぞれ現在グループ内の各Edgelet特徴の検索位置であり、矢印は現在グループの平均法線ベクトル方向であり、各「+」は各検索位置に対応するグループ内の各短辺の中心位置である。L1、L2、L3、L4、L5から、現在グループの平均法線ベクトル方向に沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとし、続いて、候補ポイントから、勾配方向と現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して各Edgelet特徴の検索位置でのマッチングポイントとし、例えば、S1が正確なエッジ位置であるため、当該現在グループはその平均法線ベクトル方向に沿って、L1、L2、L3、L4、L5の検索位置で検索してマッチングする場合、検索位置L3上でEdgelet特徴にマッチングできるポイントが最も多いことを発見し、この場合、当該検索位置L3をこのグループの最適マッチング位置とし、且つ、当該検索位置L3での各Edgelet特徴のマッチングポイントをこれらのEdgelet特徴のマッチングポイントとすることができる。
【0051】
S140、全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の姿勢を計算する。
【0052】
本出願の実施例では、全てのグループが見つけ出したマッチングポイントに基づいて、RANSACアルゴリズムとIRLSアルゴリズムとを結合した方法で3次元物体の正確な姿勢を計算することができる。
【0053】
本出願の実施例によるエッジベースの拡張現実3次元追跡登録方法は、3次元物体の画像内での初期化姿勢を取得でき、初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出した後、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索し、続いて全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の姿勢を計算する。当該方法は、追跡登録プロセス全体において、3次元物体の輪郭のEdgelet特徴をグループ分けすることにより、各々のグループを基本ユニットとして画像内で検索マッチングを行い、画像内で見つかったEdgelet特徴の正確なマッチング数を確保し、見つけたマッチングポイントの有効性を保証し、それにより、本出願の追跡登録方法が一部の複雑な環境(例えば、背景の乱れ、遮蔽など)にもロバスト性を有するとともに、計算速度も保証でき、3次元物体の正確な姿勢を迅速でロバストに計算することが実現され、アルゴリズム計算の複雑度が低く、コンピューティングデバイスのハードウェアに対する要件が低いため、様々な機器でAR3次元物体追跡表示を行うことができる。
【0054】
上記いくつかの実施例にて提供されるエッジベースの拡張現実3次元追跡登録方法に対応して、本出願の一実施例は、エッジベースの拡張現実3次元追跡登録装置をさらに提供し、本出願の実施例にて提供されるエッジベースの拡張現実3次元追跡登録装置は、上記いくつかの実施例にて提供されるエッジベースの拡張現実3次元追跡登録方法に対応するため、エッジベースの拡張現実3次元追跡登録方法の実施形態は本実施例にて提供されるエッジベースの拡張現実3次元追跡登録装置にも適用でき、本実施例では、詳細な説明を省略する。図4は、本出願の一実施例によるエッジベースの拡張現実3次元追跡登録装置の構造模式図である。
【0055】
図4に示すように、当該エッジベースの拡張現実3次元追跡登録装置400は、初期化姿勢取得モジュール410、特徴抽出モジュール420、グループ分けモジュール430、マッチングポイント検索モジュール440、及び姿勢計算モジュール450を含む。
【0056】
初期化姿勢取得モジュール410は、3次元物体の画像内での初期化姿勢を取得するために用いられる。
【0057】
特徴抽出モジュール420は、前記初期化姿勢によって、前記3次元物体の輪郭のEdgelet特徴を抽出するために用いられる。一例示として、前記特徴抽出モジュール420は、具体的には,前記初期化姿勢によって、前記3次元物体のモデルを投影して、モデル投影画像を計算し、前記モデル投影画像内のオブジェクトの可視エッジを認識し、可視エッジに沿って規則的な間隔をおく方法でサンプリングポイントを割り当て、前記サンプリングポイントと、前記サンプリングポイントのモデル線分における法線方向とを前記3次元物体の輪郭のEdgelet特徴とするために用いられる。
【0058】
グループ分けモジュール430は、抽出されたEdgelet特徴をグループ分けするために用いられる。一例示として、前記グループ分けモジュール430は、具体的には、前記3次元物体の輪郭全体の幾何学的構造に基づいて、抽出されたEdgelet特徴をグループ分けするために用いられ、ここで、各々のグループ内の各Edgelet特徴は、法線方向が一致するか、又は法線方向間の夾角が第1所定範囲内にあり、前記各々のグループはいずれも自分の平均法線ベクトルを有する。
【0059】
マッチングポイント検索モジュール440は、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索するために用いられる。一例示として、前記マッチングポイント検索モジュールは、具体的には、各々のグループを基本単位とし、前記各々のグループの平均法線ベクトル方向に沿って、前記各々のグループ内の各Edgelet特徴のマッチングポイントを見つけ出すために画像内を検索するために用いられる。
【0060】
本出願の実施例では、前記マッチングポイント検索モジュール440は、具体的には、前記現在グループの平均法線ベクトル方向に沿って第2所定範囲内で前記画像内を双方向に検索し、前記現在グループ内の各Edgelet特徴の前記それぞれの検索位置でのマッチングポイントを見つけ出すために、前記現在グループ内の各Edgelet特徴をそれぞれの検索位置でマッチングし、前記それぞれの検索位置から、マッチングポイントが最も多い検索位置を選択して前記現在グループの最適マッチング位置とし、前記最適マッチング位置でのマッチングポイントをEdgelet特徴に対応するマッチングポイントとするために用いられる。
【0061】
本出願の実施例では、前記マッチングポイント検索モジュール440は、具体的には、前記現在グループ内の各Edgelet特徴の検索位置で、前記現在グループの平均法線ベクトル方向に沿う勾配値が予め設定された閾値より大きい勾配極値ポイントを見つけ出して候補ポイントとし、前記候補ポイントから、勾配方向と前記現在グループの平均法線ベクトル方向との夾角が最も小さい候補ポイントを選択して前記各Edgelet特徴の前記検索位置でのマッチングポイントとするために用いられる。
【0062】
姿勢計算モジュール450は、全てのグループが見つけ出したマッチングポイントに基づいて、前記3次元物体の姿勢を計算するために用いられる。
【0063】
本出願の実施例によるエッジベースの拡張現実3次元追跡登録装置は、3次元物体の画像内での初期化姿勢を取得でき、初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出した後、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索し、続いて、全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の姿勢を計算する。これから、追跡登録プロセス全体において、3次元物体の輪郭のEdgelet特徴をグループ分けすることにより、各々のグループを基本ユニットとして画像内で検索マッチングを行い、画像内で見つかったEdgelet特徴の正確なマッチング数を確保し、見つけたマッチングポイントの有効性を保証し、それにより、本出願の追跡登録方法が一部の複雑な環境(例えば、背景の乱れ、遮蔽など)にもロバスト性を有するとともに、計算速度も保証でき、3次元物体の正確な姿勢を迅速でロバストに計算することが実現され、アルゴリズム計算の複雑度が低く、コンピューティングデバイスのハードウェアに対する要件が低いため、様々な機器でAR3次元物体追跡表示を行うことができる。
【0064】
本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体を更に提供する。
【0065】
図5に示すように、本出願の実施例によるエッジベースの拡張現実3次元追跡登録の方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
【0066】
図5に示すように、当該電子機器は、1つ又は複数のプロセッサ501と、メモリ502と、高速インターフェース及び低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、電子機器内で実行される命令を処理することができ、当該命令は、外部入力/出力装置(例えば、インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリ内又はメモリに記憶されている命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び/又は複数のバスを、複数のメモリと一緒に使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、一部の必要な操作(例えば、サーバアレイ、1グループのブレードサーバ、又はマルチプロセッサシステムとする)を提供することができる。図5では、1つのプロセッサ501を例とする。
【0067】
メモリ502は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリには、前記少なくとも1つのプロセッサが本出願により提供されるエッジベースの拡張現実3次元追跡登録の方法を実行するように、少なくとも1つのプロセッサによって実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願により提供されるエッジベースの拡張現実3次元追跡登録の方法を実行させるためのコンピュータ命令が記憶されている。
【0068】
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例におけるエッジベースの拡張現実3次元追跡登録の方法に対応するプログラム命令/モジュール(例えば、図4に示す初期化姿勢取得モジュール410、特徴抽出モジュール420、グループ分けモジュール430、マッチングポイント検索モジュール440及び姿勢計算モジュール450)のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶する。プロセッサ501は、メモリ502に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記方法の実施例におけるエッジベースの拡張現実3次元追跡登録の方法を実現する。
【0069】
メモリ502は、プログラムストレージエリアとデータストレージエリアとを含むことができ、ここで、プログラムストレージエリアは、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データストレージエリアは、エッジベースの拡張現実3次元追跡登録の電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ502は、高速ランダムアクセスメモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ502は、プロセッサ501に対して遠隔に設定されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介してエッジベースの拡張現実3次元追跡登録の電子機器に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定されない。
【0070】
エッジベースの拡張現実3次元追跡登録方法の電子機器は、入力装置503と出力装置504とをさらに含んでもよい。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方式を介して接続することができ、図5では、バスを介して接続することを例とする。
【0071】
入力装置503は、入力された数字又は文字情報を受信し、エッジベースの拡張現実3次元追跡登録の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置404は、ディスプレイデバイス、補助照明装置(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態で、ディスプレイデバイスは、タッチスクリーンであってもよい。
【0072】
本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈することができ、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
【0073】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含むことができ、高レベルのプロセス及び/又は対象指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することができる。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0074】
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形態(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0075】
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
【0076】
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント-サーバの関係を有するコンピュータプログラムによって、クライアントとサーバとの関係が生成される。
【0077】
本出願の実施例の技術的解決手段によれば、3次元物体の画像内での初期化姿勢を取得でき、初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出した後、抽出されたEdgelet特徴をグループ分けし、各々のグループを基本単位として、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索し、続いて、全てのグループが見つけ出したマッチングポイントに基づいて、3次元物体の姿勢を計算する。当該方法は、3次元物体の初期化姿勢によって、3次元物体の輪郭のEdgelet特徴を抽出し、抽出されたEdgelet特徴をグループ分けし、各々のグループ内の各Edgelet特徴に対応するマッチングポイントを見つけ出すために画像内を検索することができ、3次元物体の正確な姿勢を迅速でロバストに計算することが実現され、アルゴリズム計算の複雑度が低く、コンピューティングデバイスのハードウェアに対する要件が低いため、様々な機器でAR3次元物体追跡表示を行うことができる。
【0078】
上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができる。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案の所望の結果を実現することができれば、本明細書では限定しない。
【0079】
上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本出願の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5