(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-29
(45)【発行日】2022-07-07
(54)【発明の名称】平面物体の姿勢認識方法およびそのための装置
(51)【国際特許分類】
G06T 7/70 20170101AFI20220630BHJP
【FI】
G06T7/70 B
(21)【出願番号】P 2018231071
(22)【出願日】2018-12-10
【審査請求日】2021-03-03
(31)【優先権主張番号】10-2017-0169512
(32)【優先日】2017-12-11
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】596180076
【氏名又は名称】韓國電子通信研究院
【氏名又は名称原語表記】Electronics and Telecommunications Research Institute
【住所又は居所原語表記】218,Gajeong-ro Yuseong-gu Daejeon 34129,Republic of Korea
(74)【代理人】
【識別番号】100091982
【氏名又は名称】永井 浩之
(74)【代理人】
【識別番号】100091487
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100082991
【氏名又は名称】佐藤 泰和
(74)【代理人】
【識別番号】100105153
【氏名又は名称】朝倉 悟
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100152205
【氏名又は名称】吉田 昌司
(72)【発明者】
【氏名】イ、ジュ-ヘン
(72)【発明者】
【氏名】キム、ジェ-ホン
(72)【発明者】
【氏名】ユン、ウ-ハン
(72)【発明者】
【氏名】イ、ジェ-ヨン
(72)【発明者】
【氏名】ジャン、ジン-ヒョク
【審査官】佐田 宏史
(56)【参考文献】
【文献】特開2005-107965(JP,A)
【文献】特開2008-051664(JP,A)
【文献】特表2015-503778(JP,A)
【文献】米国特許出願公開第2016/0188938(US,A1)
【文献】糠信 祐昌、外2名,“拡張ハウスドルフ距離法を用いたエッジ情報に基づく画像のマッチング”,映像メディア処理シンポジウム 第4回シンポジウム資料,日本,電子情報通信学会画像工学研究専門委員会,1999年09月29日,pp.71-72
【文献】Xilin Yi et al.,"Line feature-based recognition using Hausdorff distance",Proceedings of International Symposium on Computer Vision - ISCV,米国,IEEE,1995年11月21日,pp.79-84
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00,7/00-7/90
G01B 11/00-11/30
(57)【特許請求の範囲】
【請求項1】
プロセッサが、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出するステップと、
前記プロセッサが、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出するステップと、
前記プロセッサが、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断するステップと、
前記プロセッサが、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するステップとを含み、
前記回転角度を検出するステップは、
前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出するステップと、
前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定するステップとを含み、
前記ひっくり返りの有無を判断するステップは、
前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することを特徴とする平面物体の姿勢認識方法。
【請求項2】
前記姿勢を認識するステップは、
前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することを特徴とする請求項
1に記載の平面物体の姿勢認識方法。
【請求項3】
前記平行移動値を算出するステップは、
測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出するステップと、
前記複数の第2頂点に対応する前記参照図形を抽出するステップと、
前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算するステップとを含むことを特徴とする請求項
1に記載の平面物体の姿勢認識方法。
【請求項4】
前記姿勢認識方法は、
前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成するステップと、
ディスプレイを介して前記ガイド情報を前記ユーザに出力するステップとをさらに含むことを特徴とする請求項1に記載の平面物体の姿勢認識方法。
【請求項5】
前記測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であることを特徴とする請求項
4に記載の平面物体の姿勢認識方法。
【請求項6】
測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出し、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出し、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断し、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するプロセッサと、
前記参照図形に関する情報および前記閾値の少なくとも1つを格納するメモリとを含
み、
前記プロセッサは、
前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出し、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定し、
前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することを特徴とする平面物体の姿勢認識装置。
【請求項7】
前記プロセッサは、
前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することを特徴とする請求項
6に記載の平面物体の姿勢認識装置。
【請求項8】
前記プロセッサは、
測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出し、前記複数の第2頂点に対応する前記参照図形を抽出し、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算することを特徴とする請求項
6に記載の平面物体の姿勢認識装置。
【請求項9】
前記プロセッサは、
前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介して前記ガイド情報を前記ユーザに出力することを特徴とする請求項
6に記載の平面物体の姿勢認識装置。
【請求項10】
前記測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であることを特徴とする請求項
9に記載の平面物体の姿勢認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、平面物体の姿勢を認識する技術に関し、特に、短時間で物体の回転を正確に計算することができ、その結果を増強現実および人間とロボットの相互作用に活用できる平面物体の姿勢認識方法およびそのための装置に関する。
【背景技術】
【0002】
最近、実世界と仮想世界とをつなぐ技術の発展で物体の認識に関する技術需要が非常に高い。特に、増強現実およびロボット分野では、物体の認識、区別、姿勢認識が非常に重要な要素技術の一つである。多様な物体の中でも、学習教具などに大きな需要がある平面物体の姿勢を正確に計算することは非常に基本的な要素技術であるが、意外と正確ながらも効率的な計算が可能な方法が知られていない。また、姿勢の計算結果を増強現実およびロボット応用で適当に活用できる装置も必要である。周知の既存の方法を活用すると、計算が極めて遅く、また、単純な平面図形で発生する対称性を解決しにくい。
【先行技術文献】
【特許文献】
【0003】
【文献】韓国公開特許第10-2011-0050759号、2011年5月17日公開(名称:ポリゴンモデルに対するハウスドルフ距離算出方法)
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることである。
【0005】
また、本発明の目的は、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することである。
【0006】
さらに、本発明の目的は、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用する方法を提供することである。
【0007】
なお、本発明の目的は、実世界の平面図形に仮想世界の情報およびコンテンツを増強することにより、物体自体の使用性を高める方法を提供することである。
【課題を解決するための手段】
【0008】
上記の目的を達成するための、本発明に係る平面物体の姿勢認識方法は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出するステップと、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出するステップと、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断するステップと、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するステップとを含む。
【0009】
この時、回転角度を検出するステップは、前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出するステップと、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定するステップとを含むことができる。
【0010】
この時、ひっくり返りの有無を判断するステップは、前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することができる。
【0011】
この時、姿勢を認識するステップは、前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することができる。
【0012】
この時、平行移動値を算出するステップは、測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出するステップと、前記複数の第2頂点に対応する前記参照図形を抽出するステップと、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算するステップとを含むことができる。
【0013】
この時、姿勢認識方法は、前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成するステップと、ディスプレイを介して前記ガイド情報を前記ユーザに出力するステップとをさらに含んでもよい。
【0014】
この時、測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であってもよい。
【0015】
また、本発明の一実施形態に係る平面物体の姿勢認識装置は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出し、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出し、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断し、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するプロセッサと、前記参照図形に関する情報および前記閾値の少なくとも1つを格納するメモリとを含む。
【0016】
この時、プロセッサは、前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出し、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定することができる。
【0017】
この時、プロセッサは、前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することができる。
【0018】
この時、プロセッサは、前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することができる。
【0019】
この時、プロセッサは、測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出し、前記複数の第2頂点に対応する前記参照図形を抽出し、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算することができる。
【0020】
この時、プロセッサは、前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介して前記ガイド情報を前記ユーザに出力することができる。
【0021】
この時、測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であってもよい。
【発明の効果】
【0022】
本発明によれば、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
【0023】
また、本発明は、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができる。
【0024】
さらに、本発明は、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用する方法を提供することができる。
【0025】
なお、本発明は、実世界の平面図形に仮想世界の情報およびコンテンツを増強することにより、物体自体の使用性を高める方法を提供することができる。
【図面の簡単な説明】
【0026】
【
図1】本発明の一実施形態に係る平面物体の姿勢認識方法を示す動作フローチャートである。
【
図2】物体の移動や回転によるハウスドルフ距離の一例を示す図である。
【
図3】物体の移動や回転によるハウスドルフ距離の一例を示す図である。
【
図4】物体の移動や回転によるハウスドルフ距離の一例を示す図である。
【
図5】物体の移動や回転によるハウスドルフ距離の一例を示す図である。
【
図6】物体の移動や回転によるハウスドルフ距離の一例を示す図である。
【
図7】本発明に係る参照図形の1つの頂点と測定図形の各頂点との間の距離を測定図形の回転角度ごとに表示したグラフの一例を示す図である。
【
図8】
図7に示されたグラフの距離のうち最小距離を表示したグラフの一例を示す図である。
【
図9】本発明に係る参照図形の頂点に対して、
図7に示されるような最小距離を表示したグラフの一例を示す図である。
【
図10】
図9に示された最小距離を、本発明に係るMMM演算およびMSM演算で演算した値を表示したグラフの一例を示す図である。
【
図11】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図12】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図13】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図14】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図15】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図16】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図17】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図18】本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【
図19】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図20】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図21】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図22】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図23】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図24】本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【
図25】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図26】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図27】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図28】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図29】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図30】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図31】本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【
図32】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図33】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図34】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図35】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図36】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図37】本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【
図38】本発明により測定図形のひっくり返りを考慮した場合と、そうでない場合との整合誤差に関するMMM演算結果の一例を示す図である。
【
図39】本発明に係る姿勢認識方法とこれをユーザの相互作用シナリオおよび増強現実装置と結合する構造の一例を示す図である。
【
図40】本発明の一実施形態に係る姿勢認識方法を詳細に示す図である。
【
図41】本発明の一実施形態に係る姿勢認識装置を示すブロック図である。
【発明を実施するための形態】
【0027】
以下、本発明を添付した図面を参照して詳細に説明する。ここで、繰り返される説明、本発明の要旨を不必要にあいまいにしうる公知の機能および構成に関する詳細な説明は省略する。本発明の実施形態は、当業界における平均的な知識を有する者に本発明をより完全に説明するために提供されるものである。したがって、図面における要素の形状および大きさなどはより明確な説明のために誇張されることがある。
【0028】
以下、本発明に係る好ましい実施形態を添付した図面を参照して詳細に説明する。
【0029】
図1は、本発明の一実施形態に係る平面物体の姿勢認識方法を示す動作フローチャートである。
【0030】
実世界の事物を撮影した映像からある平面図形の姿勢を認識するにあたり、平面図形が基準からどれくらい位置移動をしたか、またはどれくらい回転をしているかを検出することは非常に重要である。例えば、タングラムのような平面教具を仮想コンテンツと結合する場合、ユーザの現在の解を幾何学的に正確に測定することは、応用において決定的な情報となりうる。また、これに基づいて増強現実や人間とロボットとの間の相互作用の応用において適当な出力を与えると、インタラクティブなシナリオを作成することも可能になる。
【0031】
平面図形の姿勢を計算することは幾何学的に単純に見えるにもかかわらず、一般的に最適化計算で解を求めることができる。しかし、このような方法は計算時間を多く要するので、インタラクティブな応用に適用するには好適でない。したがって、本発明では、平面図形の姿勢を効果的に計算する方法を提供しようとする。
【0032】
まず、既存の最適化方法で平面図形の姿勢認識を実現する方式は、映像から図形を抽出し、基準図形と抽出された図形の姿勢を比較して位置と回転を計算した後、応用に活用するものであってもよい。すなわち、映像装置から平面図形の幾何学的表現を先に取得することができる。この時、平面図形の幾何学的表現とは、平面図形の輪郭線多角形(boundary polygon)に対する頂点と表現されるものを意味することができる。
【0033】
このように取得された幾何学的情報を姿勢計算における基準となる参照図形の頂点と比較して平面図形の姿勢を計算するが、問題は、この過程で取得された平面図形の頂点と参照図形の頂点との対応関係が与えられていないという点である。例えば、参照図形Pの各頂点Piが平面図形Qのどの頂点に対応するかを知らないため、平面図形に対する回転計算が難しくなりうる。これを解決するための簡単な方法はすべての点との対応を考慮することであるが、これは、計算が極めて非効率的であるので、インタラクティブなシナリオを作成するのに好適でない。
【0034】
一般的に対応関係が与えられていない時、2つの図形の幾何学的関係を表現するためにハウスドルフ距離(Hausdorff Distance、HD)を用いることができる。例えば、2つの図形PとQのハウスドルフ距離HD(P,Q)は、MAX(hd(P,Q),hd(Q,P))で定義される。すなわち、2つのhd値の最大値でHDが決定されるが、hdは、方向性が存在するハウスドルフ距離に相当する。つまり、hd(P,Q)は、図形Pの各点から図形Qまでの最小距離を求める時、その最小距離の最大値に相当できる。また、hd(Q,P)は逆に、図形Qの各点から図形Pまでの最小距離を求める時、その最小距離の最大値に相当できる。したがって、図形Pと図形Qの姿勢が完全に一致する場合、2つの図形間のハウスドルフ距離は0になる。
【0035】
図2は、ハウスドルフ距離の一例を示すもので、
図2に示された実線210、220のようにそれぞれの方向によるhdが計算され、このうち最大値がHDになる。
【0036】
また、
図3~
図4のように、参照図形301と測定図形302の中心が一致した状況であれば、回転によってハウスドルフ距離が変化可能である。例えば、
図3に示された場合のハウスドルフ距離310より、
図4に示されるように多く回転した場合のハウスドルフ距離410の方がより大きく算出される。
【0037】
したがって、ハウスドルフ距離が最小になる回転角度を探せるならば、参照図形301を基準とする測定図形302の相対的回転角度を獲得することができる。
【0038】
また、上記で説明したように、ハウスドルフ距離は、2つの図形の各点間の最小距離の最大値で決定されるが、
図5に示されるように、参照図形501と測定図形502が対称的な形態で平行移動のみある場合には、対称によって対応する頂点間の距離のうちいずれか1つだけを計算してハウスドルフ距離510、520を獲得することもできる。
【0039】
しかし、
図6に示されるように、測定図形502が平行移動と回転を同時に行った場合には、
図3~
図4に示されるような方式で測定図形502の回転角度を計算する過程を行う必要がある。
【0040】
このようなハウスドルフ距離の計算は、ボロノイ図を用いて比較的効率的に計算することができるが、これを最適化過程に適用して回転角度を探すには効率的でない。まず、ハウスドルフ距離は、ユークリッド距離を計算する過程以外には最大値と最小値の比較で構成されているので、計算方式が手順的といえる。この時、最適化計算には微分可能な連続的な数式が役に立つのに対し、平面図形の姿勢に相応する回転角度を計算するためには、回転角度を引き続き変更しながらハウスドルフ距離を求める中間過程が必要であるので、計算過程が負担になりうる。例えば、Mathematica11.1でこれをテストすると、2つの三角形間のハウスドルフ距離を計算することは0.00013秒程度かかるが、これを回転しながら最適化計算を行う場合には1.36秒程度かかる。すなわち、インタラクティブ応用への適用が困難であることが分かる。
【0041】
本発明では、次の過程により上記の問題を解決するための方法を提示しようとする。
【0042】
まず、本発明の一実施形態に係る平面物体の姿勢認識方法は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出する(S110)。
【0043】
例えば、基準となる参照図形の重心から測定図形の重心が移動した値を2つの図形間の平行移動値として算出することができる。
【0044】
この時、測定図形と参照図形は、同じ形態の平面図形であってもよい。すなわち、参照図形は、測定図形の姿勢を認識するために基準として用いられる図形に相当できる。
【0045】
この時、測定対象が含まれた入力映像を2進化して、測定図形に相応する複数の第2頂点を検出し、複数の第2頂点に対応する参照図形を抽出することができる。
【0046】
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を抽出することができる。
【0047】
この時、複数の第1頂点や複数の第2頂点は、単純に測定図形と参照図形とを区分するために用いられたもので、その意味が限定されて適用されない。
【0048】
この時、複数の第2頂点に基づいて測定図形の重心を計算し、参照図形に相応する複数の第1頂点に基づいて参照図形の重心を計算することができる。
【0049】
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、平行移動値に基づいて2つの図形が重なるようにし、測定図形の回転角度ごとに算出される2つの図形の頂点間の距離に基づいて測定図形の回転角度を検出する(S120)。
【0050】
この時、参照図形に相応する複数の第1頂点それぞれに対して、測定図形に相応する複数の第2頂点までの距離を算出することができる。
【0051】
まず、参照図形の姿勢を基準として測定図形をθだけ回転する演算を行うことができる。例えば、測定図形に相応する1つの第2頂点の座標が(tx,ty)と仮定する場合に、これをθだけ回転すると、数式1のように表すことができる。
【0052】
[数式1]
{tx cos(θ)-ty sin(θ),tx sin(θ)+ty cos(θ)}
この後、参照図形に相応する1つの第1頂点である(rx,ry)から(tx,ty)までの距離の二乗であるd(r,t,θ)を計算すると、数式2のように表すことができる。
【0053】
[数式2]
d(r,t,θ)=d((rx,ry),(tx,ty),θ)=
rx2+ry2+tx2+ty2+2sin(θ)(rx ty-ry tx)-2cos(θ)(rx tx+ry ty)
このような近似した距離の計算方法は、最適化過程で大きな計算効率を有することができる。
【0054】
このような方式により、参照図形に相応する複数の第1頂点であるri=(rxi,ryi)に対して、測定図形に相応する複数の第2頂点であるti=(txi,tyi)との距離を計算して、数式3のようにこれらの最小値を表すことができる。
【数1】
【0055】
この時、minは、関数d()の最小値を、jを変更させると探せるものを意味することができる。
【0056】
この時、距離のうち最小距離を回転角度ごとに算出し、回転角度ごとに算出された複数の最小距離の長さを合算する結果値のうち最小値に対応する角度を回転角度に決定することができる。
【0057】
もし、ハウスドルフ距離と類似の接近をすれば、参照図形の観点から、数式3の値を最大とするいずれか1つの第1頂点を探してその距離を測定する。例えば、下記数式4のようにiを変更させ、関数の最大値を抽出することができる。
【数2】
【0058】
しかし、本発明では、この過程でmax演算を行う代わりに、sum演算を用いる数式5の方式を利用することができる。すなわち、回転角度ごとに算出された最小距離をすべて加算することができる。
【数3】
【0059】
したがって、最終的に、本発明に係る姿勢認識方法を利用した最適化過程は、数式6のように表すことができる。すなわち、数式6によれば、()を最小化するθを測定図形の回転角度として検出することができる。
【数4】
【0060】
この時、数式6における距離の測定は、Min-Sum-Minの過程を経るので、このような測定方式をMSM距離といえる。
【0061】
また、数式7のように数式4の方法に基づいて計算する場合には、Min-Max-Minの過程を経るので、このような測定方式をMMM距離といえる。
【数5】
【0062】
この時、MSM距離とMMM距離の計算時間は類似する方であるが、MMM距離は、maxに依存するので、MSM距離に比べてノイズにロバストでないことがある。反面、MSM距離は、最小距離をすべて加算した結果を提供するため、MMM距離に比べて値が大きいものの、全体的な傾向性の把握に有利でありうる。もし、特異な特徴の1つが回転角度を決定する場合であれば、MMM距離を用いることがさらに有利なこともある。
【0063】
例えば、数式1~数式7をグラフで示すと、
図7~
図10のように示すことができる。この時、
図7~
図10は、測定図形が直角二等辺三角形の場合の値を示すものであってもよい。
【0064】
まず、
図7は、数式1~数式2に基づいて測定図形をθだけ回転させ、参照図形のいずれか1つの頂点であるr
1から測定図形の各頂点であるt
jまでの距離d(r
1,t
j,θ)を示すグラフであってもよい。すなわち、測定図形が直角二等辺三角形であるので、3つの頂点に対して回転角度ごとの距離を測定してグラフで示すことができる。
【0065】
また、
図8は、θを変化させる時、数式3に基づいてr
1からt
jまでの距離のうち最小距離だけを示すグラフに相応できる。すなわち、
図7に示されたグラフの値のうち回転角度ごとに最小値だけを示すものであってもよい。
【0066】
このような最小値を参照図形のすべての頂点ごとに検出して示すグラフが、
図9に相応できる。すなわち、参照図形も、測定図形と同じく直角二等辺三角形であるので、3つのグラフ値として表現される。
【0067】
また、
図9に示されたMSM演算結果1010は、
図8に示されたグラフ値を数式5に基づいて演算した結果を示すものであり、
図9に示されたMMM演算結果1020は、
図8に示されたグラフ値を数式4に基づいて演算した結果を示すものに相当できる。
【0068】
この時、MSM演算結果1010やMMM演算結果1020による最小値1030に相応する回転角度が約1.6ラジアン(radian)であるので、測定図形の回転角度が1.6ラジアンであることが分かる。
【0069】
この時、検出された測定図形の回転角度は、測定図形を検出された回転角度だけ逆に回転して参照図形と整合した場合に、その有効性を確認することができる。
【0070】
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、2つの図形の頂点間の距離と測定図形のひっくり返りの有無を判断するための閾値とを比較して、測定図形のひっくり返りの有無を判断する(S130)。
【0071】
この時、図形のひっくり返り(flip)は、測定図形に対する正確な回転角度を計算するために考慮される。例えば、平行四辺形の場合には、図形がひっくり返っている場合のMSM演算結果と、図形がひっくり返っていない場合のMSM演算結果とが異なりうる。したがって、このように図形のひっくり返りを考慮しなければならない図形に対しては、これを判断するための閾値を事前に設定し、MSM演算結果と閾値とを比較してひっくり返りの有無を判断することができる。
【0072】
この時、最小値が閾値を超える場合に、測定図形がひっくり返ったと判断することができる。
【0073】
この時、測定図形のひっくり返りを判断する過程は、
図32~
図37により詳細に説明する。
【0074】
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、平行移動値、回転角度およびひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と参照図形とを比較した結果を考慮して、測定図形の姿勢を認識する(S140)。
【0075】
この時、姿勢を補正した測定図形と参照図形とを比較した結果が一致する場合、検出された平行移動値、回転角度およびひっくり返りの有無に相応するように測定図形の姿勢を認識することができる。
【0076】
この時、測定図形がひっくり返ったと判断される場合、姿勢をひっくり返した参照図形を基準として測定図形の最小値を再測定して回転角度を算出することができる。
【0077】
また、測定図形がひっくり返ったと判断される場合、姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、測定図形の姿勢を認識することができる。
【0078】
このように、本発明に係る単純な計算過程により効率的に平面図形の姿勢を計算しながら対称性とひっくり返りまでを考慮する手法は皆無といえる。本発明に係る姿勢認識方法の有効性は、幾何学的または解析学的証明により裏付けられる。
【0079】
また、本発明に係る姿勢認識方法は非常に実用的である。例えば、我々の日常環境には教具、作業物体、インテリア、文書などといった非常に多い平面図形が存在するが、このような実世界の平面図形に仮想世界の情報やコンテンツを増強することにより、物体自体の使用性を高めることができる。すなわち、増強現実や人間とロボットとの間の相互作用のための応用装置に活用することもできる。
【0080】
さらに、
図1には示していないが、本発明の一実施形態に係る平面物体の姿勢認識方法は、測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介してガイド情報をユーザに出力することができる。
【0081】
例えば、タングラムのような平面教具を用いた仮想コンテンツの場合、教具材を用いて作れる多様な形状に関するガイド情報を提供することができる。
【0082】
この時、測定図形の姿勢は、実世界でユーザによって制御される測定対象の姿勢であってもよい。すなわち、ユーザが実世界で測定対象を動かした時の該当する姿勢をそのまま測定図形の姿勢として認識することができる。
【0083】
また、
図1には示していないが、本発明の一実施形態に係る平面物体の姿勢認識方法は、上述のように平面物体の姿勢認識過程で発生する多様な情報を格納する。
【0084】
このような平面物体の姿勢認識方法により、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
【0085】
また、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができ、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用することができる。
【0086】
図11~
図18は、本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
【0087】
まず、
図11~
図12は、星状の参照図形1101と実世界で測定された測定図形1102との間の回転を測定した結果と過程を示す。
【0088】
この時、
図11に示されるように、回転している測定図形1102の回転を、本発明の一実施形態に係るMSM演算またはMMM演算で計算して回転角度を算出し、算出した回転角度を測定図形1102に逆に適用すると、
図12に示されるように整合された映像を獲得することができ、この結果を応用に活用することができる。
【0089】
この時、
図13は、
図11に示された参照図形1101を基準として測定図形1102の回転を計算する場合のMSM演算結果とMMM演算結果を示す。
【0090】
この時、星状は、5つの対称的な形状が繰り返されるため、
図13に示されるように、MSM演算またはMMM演算における最小値領域が周期的に繰り返されることが分かる。このように繰り返される条件を知っている状況では、最適化区間を1/5に縮小して計算を加速することもできる。
【0091】
また、本発明に係る姿勢認識方法は、
図12に示されるように、参照図形1101と測定図形1102の大きさが正確に一致しなくてもエラーなく計算することができる。
【0092】
例えば、
図14~
図15に示されるように、参照図形1401と測定図形1402の大きさだけでなく、形状に差があるとしても、
図16に示されるように、測定図形の回転角度を探すのには問題がない。
【0093】
他の例として、
図17のように、対称的な形状が繰り返される図形でない上に、参照図形と測定図形の大きさに差がある場合にも、本発明に係る姿勢認識方法により測定図形の回転角度を検出することができる。
【0094】
さらに他の例として、
図18のように、対称的な形状が繰り返される図形でない上に、参照図形と測定図形の形状が類似する場合にも、本発明に係る姿勢認識方法により測定図形の回転角度を検出することができる。
【0095】
すなわち、本発明に係る平面図形の姿勢認識方法は、入力映像から測定図形を抽出する過程で発生しうるエラーによって測定図形が正確に抽出されなくても、これを勘案して測定図形の回転角度を検出することができる。
【0096】
また、本発明は、PCA(Principal Component Analysis)のような方式で少なくとも2つの軸が確実で長めの長方形に対してのみ姿勢認識が可能であった従来の問題点を解決して、複雑な形状に対しても姿勢認識が可能な姿勢認識方法を提供することができる。
【0097】
図19~
図24は、本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
【0098】
まず、
図19~
図20を参照すれば、本発明に係る姿勢認識方法により直角二等辺三角形や正方形のように対称性がある平面図形に対する姿勢を認識する過程でlocal minimumに落ちるエラーを防止できることが分かる。
【0099】
例えば、
図19に示された直角二等辺三角形状の測定図形1902に対して、これに対する参照図形1901を基準としてMSM演算とMMM演算を行った結果は、
図20の通りである。この時、
図20を参照すれば、MMM演算結果の最小値が1.6ラジアン付近で発生するが、直角二等辺三角形の対称性によって3.8ラジアンと5.8ラジアン付近でも局所最小値が検出されることを確認することができる。このような結果は、測定図形の回転角度を算出するのにエラーを発生させることがある。
【0100】
反面、
図20に示されたMSM演算結果では、最小値がMMM演算結果と同様に1.6ラジアン付近で発生するが、3.8ラジアンと5.8ラジアン付近の値をMMM演算結果のような局所最小値と見なすことが困難である。すなわち、本発明によりMSM演算によって最小値を検出する場合、対称性がある測定図形から発生しうるlocal minimumのエラーを防止することができる。
【0101】
また、
図21~
図24を参照すれば、本発明に係る姿勢認識方法は、対称性が存在する平面図形の姿勢を認識する時、計算効率を高めるために、回転角度の探索範囲を制限したり、splitして平行で計算することができる。
【0102】
例えば、
図21に示された正方形状の測定図形2102に対して、これに対する参照図形2101を基準としてMSM演算とMMM演算を行った結果は、
図22の通りである。この時、
図22を参照すれば、π/2ラジアンの周期で回転角度を検出できる最小値が繰り返されることが分かる。この場合、回転角度の探索範囲を2πラジアンより小さく設定することにより、測定図形の回転角度を検出するための計算の効率を向上させることができる。
【0103】
他の例として、
図23に示された平行四辺形状の測定図形2302に対して、これに対する参照図形2301を基準としてMSM演算とMMM演算を行った結果は、
図24の通りである。この時、
図24を参照すれば、πラジアンの周期で回転角度を検出できる最小値が繰り返されることが分かる。この場合にも、回転角度の探索範囲を2πラジアンより小さく設定することにより、計算の効率を向上させることができる。
【0104】
図25~
図31は、本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
【0105】
図25~
図31を参照すれば、本発明に係る姿勢認識方法は、実物を活用する増強現実の応用に活用するのに好適である。
【0106】
この時、幾何および空間知覚能力の向上に役立つタングラム(tangram)は非常に簡単な実物教具材で、本発明に係る姿勢認識方法により増強現実の応用で実現することができる。
【0107】
例えば、
図25に示されるように、タングラムのための7つの実片2510、2520、2530、2540、2550、2560、2570に対する正確な姿勢を認識し、増強された映像として認識された片2511、2521、2531、2541、2551、2561、2571を出力することができる。
【0108】
このような増強現実の応用を実現するためには、まず、
図26に示されるように、実片2510、2520、2530、2540、2550、2560、2570が含まれた入力映像を分割してそれぞれの実片を分離することができる。
【0109】
この後、
図27に示されるように、分割された映像に基づいて2進化を行って実片2510、2520、2530、2540、2550、2560、2570に対する頂点を検出することができる。
【0110】
この後、
図25~
図31に示していないが、実片2510、2520、2530、2540、2550、2560、2570の頂点に対応する参照図形を獲得し、重心方法で7つの実片2510、2520、2530、2540、2550、2560、2570それぞれに対する平行移動値を検出することができる。
【0111】
この後、
図28に示されるように、7つの実片2510、2520、2530、2540、2550、2560、2570それぞれに対してMSM演算とMMM演算を行って、7つの実片(2510、2520、2530、2540、2550、2560、2570それぞれに対する回転角度を検出することができる。
【0112】
この後、検出された回転角度に基づいて7つの実片2510、2520、2530、2540、2550、2560、2570の姿勢を認識して、増強された映像として認識された片2511、2521、2531、2541、2551、2561、2571を出力することができる。
【0113】
この過程により、最終的には、
図29~
図31のように、ユーザが移動させた実片2510、2520、2530、2540、2550、2560、2570の姿勢を評価し、これに関するガイドを出力するのに活用することができる。
【0114】
図32~
図37は、本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
【0115】
図32~
図37を参照すれば、本発明に係る姿勢認識方法では、測定図形のひっくり返り(flip)を考慮して、測定図形の正確な回転角度を検出することができる。
【0116】
例えば、
図32に示されるように測定図形3202と参照図形3201がひっくり返りの関係にある場合には、
図33のように、本発明に係るMSM演算やMMM演算を行って測定図形3202の回転角度を検出することができる。しかし、このように検出された回転角度を測定図形3202に逆に適用して回転すると、
図34に示されるように、参照図形3201と測定図形3402との間に整合誤差が大きく発生しうる。
【0117】
また、
図32のように2つの図形がひっくり返りの関係にある場合、
図33に示されるように、MSM演算結果の最小値が一般的な場合より大きく現れることが分かる。
【0118】
したがって、本発明に係る姿勢認識方法では、平行四辺形のようにflippingが発生しうる図形に対しては、最小値に対する閾値を事前に設定し、MSM演算により検出された最小値が閾値より大きく検出される場合には、測定図形がflippingされたと判断することができる。
【0119】
この時、測定図形がひっくり返ったと判断される場合、
図35に示されるように、ひっくり返った姿勢の参照図形3501を基準としてひっくり返った測定図形3502に対する回転角度を検出することができる。また、参照図形3501をひっくり返した姿勢で測定図形3502に対するMSM演算を行う場合、
図36に示されるように、MSM演算の最小値が0に近い値で検出されることを確認することができる。
【0120】
このように検出された回転角度を測定図形3502に逆に適用して回転すると、
図37に示されるように、ひっくり返った姿勢の参照図形3501と、ひっくり返った測定図形3502との整合誤差が少なく発生するので、結論的には、測定図形3502の姿勢がひっくり返ったと確定することができる。
【0121】
あるいは、本発明に係る姿勢認識方法では、ひっくり返りを考慮しなければならない測定図形に対する姿勢を認識する場合、入力映像から検出された測定図形の姿勢とひっくり返った姿勢に対していずれもMSM演算を行って、最小値が小さい方の姿勢の回転角度を測定図形の回転角度および姿勢として取ることもできる。
【0122】
図38は、本発明により測定図形のひっくり返りを考慮した場合と、そうでない場合との整合誤差に関するMMM演算結果の一例を示す図である。
【0123】
図38を参照すれば、本発明により測定図形のひっくり返りを考慮した場合(normal)の整合誤差をMMM演算した結果の最小値が、ひっくり返りを考慮しない場合(flipped)の整合誤差をMMM演算した結果の最小値より少なく検出されることを確認することができる。
【0124】
すなわち、本発明のように、測定図形のひっくり返りを考慮して平面図形の姿勢を認識することにより、平面図形の姿勢をより正確に認識できることが分かる。
【0125】
図39は、本発明に係る姿勢認識方法とこれをユーザの相互作用シナリオおよび増強現実装置と結合する構造の一例を示す図である。
【0126】
図39を参照すれば、本発明の一実施形態に係る姿勢認識方法は、実世界に存在する事物に基づくユーザとの相互作用シナリオによって動作可能であり、この過程で増強現実装置と結合され、関連するコンテンツをユーザに提供することができる。
【0127】
例えば、
図39に示されるように、ユーザが実世界に存在する事物の位置と姿勢を変化させた後、当該事物を含む作業空間を撮影して入力映像を提供することができる。
【0128】
この時、本発明の一実施形態に係る姿勢認識装置は、入力映像から姿勢を測定する対象の測定図形を抽出することができる。
【0129】
この後、姿勢認識装置は、測定図形の頂点に基づいて参照図形を抽出することができ、参照図形に基づいて測定図形の平行移動値、回転角度およびひっくり返りの有無などを計算して測定図形の姿勢を獲得することができる。
【0130】
このように獲得した測定図形の姿勢に関連する情報は増強現実装置に提供される。
【0131】
この時、増強現実装置は、測定図形の姿勢を評価してユーザに提供されるガイド情報を生成することができ、別のディスプレイモジュールベースでユーザにガイド情報を出力することにより、ユーザとの相互作用を行うことができる。
【0132】
このように、実世界での平面図形の姿勢を迅速で正確に認識することは、実世界と仮想世界とをつなぐ増強現実の応用および人間とロボットとの間の相互作用の応用において非常に重要な要素となりうる。したがって、本発明に係る平面図形の姿勢認識方法は、多様な物理的教具材を増強現実の応用に拡張する場合や、実際の事物に対する作業をめぐって人間とロボットが協業する状況で作業する物体の状態を把握して対応する問題に非常に有用に活用できる。
【0133】
図40は、本発明の一実施形態に係る姿勢認識方法を詳細に示す図である。
【0134】
図40を参照すれば、本発明の一実施形態に係る姿勢認識方法は、まず、測定対象を含む入力映像を獲得する(S4010)。
【0135】
この後、入力映像に対して2進化を行って測定図形を検出する(S4020)。
【0136】
この後、測定図形の頂点を算出して参照図形を検出する(S4030)。
【0137】
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより測定図形に対する複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を検出することができる。
【0138】
この後、2つの図形の重心に基づいて測定図形の平行移動値を算出する(S4040)。
【0139】
例えば、2つの図形の重心を結ぶベクトル値に相応するように平行移動値を算出することができる。
【0140】
この後、平行移動値に基づいて2つの図形を重なるようにし、測定図形の回転角度ごとに算出される重なった2つの図形の頂点間の最小距離に基づいてMMM演算またはMSM演算を行って最小値を算出する(S4050)。
【0141】
この後、測定図形のひっくり返りの有無を判断するために、ステップS4050で算出された最小値が予め設定された閾値を超えるか否かを判断し(S4055)、最小値が閾値を超える場合、測定図形がひっくり返ったと判断する(S4056)。
【0142】
この時、測定図形がひっくり返ったと判断されると、参照図形の姿勢をひっくり返した状態でステップS4050を再び行って最小値を再算出することができる。
【0143】
また、ステップS4055の判断結果、最小値が閾値を超えていなければ、最小値に相応する角度に相応するように測定図形の回転角度を算出する(S4060)。
【0144】
この後、算出された平行移動値、回転角度およびひっくり返りの有無を考慮して、測定図形の姿勢を補正した後、補正された測定図形と参照図形とを比較して、測定図形の姿勢を認識する(S4070)。
【0145】
この時、認識された測定図形の姿勢を評価してガイド情報が必要か否かを判断し(S4075)、ガイド情報が必要であれば、ガイド情報を生成してユーザに出力する(S4080)。
【0146】
また、ステップS4075の判断結果、ガイド情報が必要でなければ、別途のガイド情報は出力せず増強された映像だけを生成して提供することもできる。
【0147】
図41は、本発明の一実施形態に係る姿勢認識装置を示すブロック図である。
【0148】
図41を参照すれば、本発明の一実施形態に係る姿勢認識装置は、通信部4110と、プロセッサ4120と、メモリ4130とを含む。
【0149】
通信部4110は、平面図形の姿勢認識のために必要な情報を送受信する役割を果たすことができる。特に、本発明の一実施形態に係る通信部4110は、測定対象が含まれた入力映像を受信したり、ディスプレイを介してユーザにガイド情報を提供することもできる。
【0150】
プロセッサ4120は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出する。
【0151】
例えば、基準となる参照図形の重心から測定図形の重心が移動した値を2つの図形間の平行移動値として算出することができる。
【0152】
この時、測定図形と参照図形は、同じ形態の平面図形であってもよい。すなわち、参照図形は、測定図形の姿勢を認識するために基準として用いられる図形に相当できる。
【0153】
この時、測定対象が含まれた入力映像を2進化して、測定図形に相応する複数の第2頂点を検出し、複数の第2頂点に対応する参照図形を抽出することができる。
【0154】
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を抽出することができる。
【0155】
この時、複数の第1頂点や複数の第2頂点は、単純に測定図形と参照図形とを区分するために用いられたもので、その意味が限定されて適用されない。
【0156】
この時、複数の第2頂点に基づいて測定図形の重心を計算し、参照図形に相応する複数の第1頂点に基づいて参照図形の重心を計算することができる。
【0157】
また、プロセッサ4120は、平行移動値に基づいて2つの図形が重なるようにし、測定図形の回転角度ごとに算出される2つの図形の頂点間の距離に基づいて測定図形の回転角度を検出する。
【0158】
この時、参照図形に相応する複数の第1頂点それぞれに対して、測定図形に相応する複数の第2頂点までの距離を算出することができる。
【0159】
まず、参照図形の姿勢を基準として測定図形をθだけ回転する演算を行うことができる。例えば、測定図形に相応する1つの第2頂点の座標が(tx,ty)と仮定する場合に、これをθだけ回転すると、数式1のように表すことができる。
【0160】
[数式1]
{tx cos(θ)-ty sin(θ),tx sin(θ)+ty cos(θ)}
この後、参照図形に相応する1つの第1頂点である(rx,ry)から(tx,ty)までの距離の二乗であるd(r,t,θ)を計算すると、数式2のように表すことができる。
【0161】
[数式2]
d(r,t,θ)=d((rx,ry),(tx,ty),θ)=
rx2+ry2+tx2+ty2+2sin(θ)(rx ty-ry tx)-2cos(θ)(rx tx+ry ty)
このような近似した距離の計算方法は、最適化過程で大きな計算効率を有することができる。
【0162】
このような方式により、参照図形に相応する複数の第1頂点であるri=(rxi,ryi)に対して、測定図形に相応する複数の第2頂点であるti=(txi,tyi)との距離を計算して、数式3のようにこれらの最小値を表すことができる。
【数6】
【0163】
この時、minは、関数d()の最小値を、jを変更させると探せるものを意味することができる。
【0164】
この時、距離のうち最小距離を回転角度ごとに算出し、回転角度ごとに算出された複数の最小距離の長さを合算する結果値のうち最小値に対応する角度を回転角度に決定することができる。
【0165】
もし、ハウスドルフ距離と類似の接近をすれば、参照図形の観点から、数式3の値を最大とするいずれか1つの第1頂点を探してその距離を測定する。例えば、下記数式4のようにiを変更させ、関数の最大値を抽出することができる。
【数7】
【0166】
しかし、本発明では、この過程でmax演算を行う代わりに、sum演算を用いる数式5の方式を利用することができる。すなわち、回転角度ごとに算出された最小距離をすべて加算することができる。
【数8】
【0167】
したがって、最終的に、本発明に係る姿勢認識方法を利用した最適化過程は、数式6のように表すことができる。すなわち、数式6によれば、()を最小化するθを測定図形の回転角度として検出することができる。
【数9】
【0168】
この時、数式6における距離の測定は、Min-Sum-Minの過程を経るので、このような測定方式をMSM距離といえる。
【0169】
また、数式7のように、数式4の方法に基づいて計算する場合には、Min-Max-Minの過程を経るので、このような測定方式をMMM距離といえる。
【数10】
【0170】
この時、MSM距離とMMM距離の計算時間は類似する方であるが、MMM距離は、maxに依存するので、MSM距離に比べてノイズにロバストでないことがある。反面、MSM距離は、最小距離をすべて加算した結果を提供するため、MMM距離に比べて値が大きいものの、全体的な傾向性の把握に有利でありうる。もし、特異な特徴の1つが回転角度を決定する場合であれば、MMM距離を用いることがさらに有利なこともある。
【0171】
また、プロセッサ4120は、2つの図形の頂点間の距離と測定図形のひっくり返りの有無を判断するための閾値とを比較して、測定図形のひっくり返りの有無を判断する。
【0172】
この時、図形のひっくり返り(flip)は、測定図形に対する正確な回転角度を計算するために考慮される。例えば、平行四辺形の場合には、図形がひっくり返っている場合のMSM演算結果と、図形がひっくり返っていない場合のMSM演算結果とが異なりうる。したがって、このように、図形のひっくり返りを考慮しなければならない図形に対しては、これを判断するための閾値を事前に設定し、MSM演算結果と閾値とを比較して、ひっくり返りの有無を判断することができる。
【0173】
この時、最小値が閾値を超える場合に、測定図形がひっくり返ったと判断することができる。
【0174】
この時、測定図形のひっくり返りを判断する過程は、
図32~
図37により詳細に説明したので、省略する。
【0175】
また、プロセッサ4120は、平行移動値、回転角度およびひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と参照図形とを比較した結果を考慮して、測定図形の姿勢を認識する。
【0176】
この時、姿勢を補正した測定図形と参照図形とを比較した結果が一致する場合、検出された平行移動値、回転角度およびひっくり返りの有無に相応するように測定図形の姿勢を認識することができる。
【0177】
この時、測定図形がひっくり返ったと判断される場合、姿勢をひっくり返した参照図形を基準として測定図形の最小値を再測定して回転角度を算出することができる。
【0178】
また、測定図形がひっくり返ったと判断される場合、姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、測定図形の姿勢を認識することができる。
【0179】
メモリ4130は、参照図形に関する情報および閾値の少なくとも1つを格納する。
【0180】
この時、閾値は、ひっくり返りが発生しうる図形によって設定されて格納される。
【0181】
また、メモリ4130は、上述のように、本発明の一実施形態に係る姿勢認識装置で発生する多様な情報を格納する。
【0182】
実施形態により、メモリ4130は、姿勢認識装置と独立して構成され、平面図形の姿勢認識のための機能を支援することができる。この時、メモリ4130は、別途の大容量ストレージとして動作可能であり、動作実行のための制御機能を含むこともできる。
【0183】
一方、姿勢認識装置は、メモリが搭載され、その装置内で情報を格納することができる。一実施形態の場合、メモリは、コンピュータで読取可能な媒体である。一実施形態において、メモリは、揮発性メモリユニットであってもよいし、他の実施形態の場合、メモリは、不揮発性メモリユニットであってもよい。一実施形態の場合、格納装置は、コンピュータで読取可能な媒体である。多様な互いに異なる実施形態において、格納装置は、例えば、ハードディスク装置、光学ディスク装置、あるいはある他の大容量格納装置を含むこともできる。
【0184】
このような姿勢認識装置を用いることにより、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
【0185】
また、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができ、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用することができる。
【0186】
以上、本発明に係る平面物体の姿勢認識方法およびそのための装置は、上記のように説明された実施形態の構成と方法が限定されて適用できるものではなく、上記の実施形態は多様な変形がなされるように各実施形態の全部または一部が選択的に組み合わされて構成されてもよい。
【符号の説明】
【0187】
210、220:実線
310、410、510、520、610、620:ハウスドルフ距離
301、501、1101、1401、1901、2101、2301、3201、3401、3501、3701:参照図形
302、502、1102、1402、1902、2102、2302、3202、3402、3502、3702:測定図形
1010:MSM演算結果
1020:MMM演算結果
1030:最小値
2510、2520、2530、2540、2550、2560、2570:実片
2511、2521、2531、2541、2551、2561、2571:認識された片
4110:通信部
4120:プロセッサ
4130:メモリ