特許第6121302号(P6121302)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許6121302姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム
<>
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000004
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000005
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000006
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000007
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000008
  • 特許6121302-姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6121302
(24)【登録日】2017年4月7日
(45)【発行日】2017年4月26日
(54)【発明の名称】姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム
(51)【国際特許分類】
   G06T 7/60 20170101AFI20170417BHJP
   G06T 7/20 20170101ALI20170417BHJP
【FI】
   G06T7/60 150P
   G06T7/20 B
【請求項の数】14
【全頁数】24
(21)【出願番号】特願2013-203084(P2013-203084)
(22)【出願日】2013年9月30日
(65)【公開番号】特開2015-69410(P2015-69410A)
(43)【公開日】2015年4月13日
【審査請求日】2016年2月2日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100122426
【弁理士】
【氏名又は名称】加藤 清志
(72)【発明者】
【氏名】小林 達也
(72)【発明者】
【氏名】加藤 晴久
(72)【発明者】
【氏名】柳原 広昌
【審査官】 佐田 宏史
(56)【参考文献】
【文献】 特開2012−068772(JP,A)
【文献】 牧田 孝嗣、外2名,“TrakMarkのための仮想化現実モデルからのビジュアルトラッキング用データセット生成ツールの試作”,ヒューマンインタフェース学会 研究報告集,日本,ヒューマンインターフェース学会,2011年12月31日,Vol.13, No.7,pp.87-90
【文献】 豊原 由規、外4名,“ビジョンベースMRトラッキングのためのエピポーラ拘束を利用した特徴点優先順位決定方法”,第17回日本バーチャルリアリティ学会大会 論文集,日本,日本バーチャルリアリティ学会,2012年 9月12日,pp.93-96
【文献】 Daniel Wagner et al.,"Real-Time Detection and Tracking for Augmented Reality on Mobile Phones",IEEE Transactions on Visualization and Computer Graphics,米国,IEEE,2010年 8月28日,Vol.16, No.3,pp.355-368
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00−7/90
(57)【特許請求の範囲】
【請求項1】
入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置であって、
予め定められた2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する特徴点選択手段と、
前記特徴点選択手段により選択された追跡用特徴点を追跡する特徴点追跡手段と、
前記特徴点追跡手段による追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める姿勢パラメータ更新手段と、を備え、
前記特徴点選択手段は、前記2種類以上の特徴点群のうち第1の特徴点群の中から前記追跡用特徴点として選択した特徴点の中に、前記入力画像に存在していない特徴点が存在すれば、当該追跡用特徴点から当該特徴点を除外するとともに、除外した特徴点の数だけ、前記2種類以上の特徴点群のうち前記第1の特徴点群を除くものの中から特徴点を選択して当該追跡用特徴点に追加する際に、当該追跡用特徴点として選択されている他の特徴点までの距離が大きいものから順に選択することを特徴とする姿勢パラメータ推定装置。
【請求項2】
前記特徴点選択手段は、前記第1の特徴点群として、配置の偏りを取り除かれた複数の特徴点を用いることを特徴とする請求項1に記載の姿勢パラメータ推定装置。
【請求項3】
前記姿勢パラメータ更新手段により求められた前フレームにおける姿勢パラメータ、または、前記入力画像から求められる初期姿勢パラメータを用いて、前記認識対象物の姿勢パラメータの予測値を求める姿勢パラメータ予測手段を備え、
前記特徴点選択手段は、前記姿勢パラメータ予測手段により求められた姿勢パラメータの予測値を用いて、前記追跡用特徴点として選択した各特徴点の前記入力画像における位置を推定し、
前記特徴点追跡手段は、前記特徴点選択手段により推定された位置を、特徴点追跡の初期位置として、前記追跡用特徴点の追跡を行うことを特徴とする請求項1または2に記載の姿勢パラメータ推定装置。
【請求項4】
前記特徴点選択手段は、予め定められた数の特徴点を、フレームごとに前記追跡用特徴点として選択することを特徴とする請求項1から3のいずれかに記載の姿勢パラメータ推定装置。
【請求項5】
入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置であって、
予め定められた2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する特徴点選択手段と、
前記特徴点選択手段により選択された追跡用特徴点を追跡する特徴点追跡手段と、
前記特徴点追跡手段による追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める姿勢パラメータ更新手段と、を備え、
前記特徴点選択手段は、前記2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を前記追跡用特徴点として選択し、予め定められた数以上のフレームで連続して追跡に失敗した特徴点については、以降のフレームにおいて予め定められた数のフレームだけ、前記追跡用特徴点として選択しないことを特徴とする姿勢パラメータ推定装置。
【請求項6】
前記入力画像と、当該入力画像と同一の画像であって当該入力画像より解像度の低い1つ以上の画像と、を求める複数解像度画像取得手段を備え、
前記複数解像度画像取得手段により求められた画像のうち解像度の低いものから高いものに向かって順番に、前記特徴点選択手段による特徴点の選択と、前記特徴点追跡手段による特徴点の追跡と、前記姿勢パラメータ更新手段による姿勢パラメータの取得と、を繰り返し、
前記特徴点選択手段は、現在の処理対象である画像の解像度よりも1つ解像度の低い画像を用いて前記姿勢パラメータ更新手段により求められた姿勢パラメータを用いて、特徴点の選択を行うことを特徴とする請求項1から5のいずれかに記載の姿勢パラメータ推定装置。
【請求項7】
前記認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを2種類以上の特徴点群のいずれかに登録する特徴点登録手段を備えることを特徴とする請求項1から6のいずれかに記載の姿勢パラメータ推定装置。
【請求項8】
前記特徴点登録手段は、前記認識対象物の特徴点をクラスタリングして、配置に偏りなく特徴点を選択することを特徴とする請求項7に記載の姿勢パラメータ推定装置。
【請求項9】
前記特徴点登録手段は、前記第1の特徴点群として登録する特徴点の数に、前記認識対象物の特徴点をクラスタリングし、各クラスから1点ずつ特徴点を選択することを特徴とする請求項8に記載の姿勢パラメータ推定装置。
【請求項10】
前記特徴点登録手段は、前記認識対象物の特徴点をクラスタリングする際に、k-means型の手法を用いることを特徴とする請求項8または9に記載の姿勢パラメータ推定装置。
【請求項11】
前記特徴点登録手段は、
前記第1の特徴点群として特徴点を登録した後に、第2の特徴点群として特徴点を登録し、
前記第2の特徴点群には、前記認識対象物の特徴点のうち前記第1の特徴点群として登録された特徴点と前記第2の特徴点群として登録された特徴点とを除くものの中から、当該第1の特徴点群または当該第2の特徴点群として登録された特徴点からの距離が大きいものから順に登録することを特徴とする請求項7から10のいずれかに記載の姿勢パラメータ推定装置。
【請求項12】
入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定システムであって、
姿勢パラメータ推定装置と、
前記姿勢パラメータ推定装置と通信可能に設けられたサーバと、を備え、
前記サーバは、
前記認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを2種類以上の特徴点群のいずれかに登録する特徴点登録手段を備え、
前記特徴点登録手段は、前記認識対象物の特徴点をクラスタリングして、配置に偏りなく特徴点を選択し、前記認識対象物の特徴点をクラスタリングする際に、k-means型の手法を用い、
前記姿勢パラメータ推定装置は、
前記2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する特徴点選択手段と、
前記特徴点選択手段により選択された追跡用特徴点を追跡する特徴点追跡手段と、
前記特徴点追跡手段による追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める姿勢パラメータ更新手段と、を備え、
前記特徴点選択手段により、前記2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を前記追跡用特徴点として選択することを特徴とする姿勢パラメータ推定システム。
【請求項13】
特徴点選択手段、特徴点追跡手段、および姿勢パラメータ更新手段を備え、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置における姿勢パラメータ推定方法であって、
前記特徴点選択手段が、予め定められた2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する第1のステップと、
前記特徴点追跡手段が、前記第1のステップにより選択された追跡用特徴点を追跡する第2のステップと、
前記姿勢パラメータ更新手段が、前記第2のステップによる追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める第3のステップと、を備え、
前記第1のステップにおいて、前記特徴点選択手段は、前記2種類以上の特徴点群のうち第1の特徴点群の中から前記追跡用特徴点として選択した特徴点の中に、前記入力画像に存在していない特徴点が存在すれば、当該追跡用特徴点から当該特徴点を除外するとともに、除外した特徴点の数だけ、前記2種類以上の特徴点群のうち前記第1の特徴点群を除くものの中から特徴点を選択して当該追跡用特徴点に追加する際に、当該追跡用特徴点として選択されている他の特徴点までの距離が大きいものから順に選択することを特徴とする姿勢パラメータ推定方法。
【請求項14】
特徴点選択手段、特徴点追跡手段、および姿勢パラメータ更新手段を備え、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置における姿勢パラメータ推定方法を、コンピュータに実行させるためのプログラムであって、
前記特徴点選択手段が、予め定められた2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する第1のステップと、
前記特徴点追跡手段が、前記第1のステップにより選択された追跡用特徴点を追跡する第2のステップと、
前記姿勢パラメータ更新手段が、前記第2のステップによる追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める第3のステップと、をコンピュータに実行させ、
前記第1のステップにおいて、前記特徴点選択手段は、前記2種類以上の特徴点群のうち第1の特徴点群の中から前記追跡用特徴点として選択した特徴点の中に、前記入力画像に存在していない特徴点が存在すれば、当該追跡用特徴点から当該特徴点を除外するとともに、除外した特徴点の数だけ、前記2種類以上の特徴点群のうち前記第1の特徴点群を除くものの中から特徴点を選択して当該追跡用特徴点に追加する際に、当該追跡用特徴点として選択されている他の特徴点までの距離が大きいものから順に選択するためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラムに関する。
【背景技術】
【0002】
従来、現実空間の映像に対してコンピュータにより情報を付加するAR(拡張現実感)技術が提案されており、近年では、このAR技術は、WEBカメラの接続されたPC(Personal Computer)や、カメラ付き携帯電話端末などで実現されるようになっている。
【0003】
AR技術においては、カメラといった撮像手段で撮影された入力画像内の認識対象物を識別し、認識対象物の姿勢パラメータをリアルタイムに推定する必要がある。そこで、姿勢パラメータを推定する技術が提案されている(例えば、特許文献1から3および非特許文献1参照)。
【0004】
特許文献1には、認識対象物として予め定められたマーカを想定し、このマーカの姿勢パラメータを画像認識処理により推定する技術が示されている。
【0005】
一方、特許文献2や非特許文献1には、連続的に入力される複数の画像内で特徴点を追跡する技術が示されている。特に非特許文献1には、入力画像をサブサンプリングして画像ピラミッドを生成し、画像ピラミッドの最上段の画像から最下段の画像まで1段ずつ順番に、特徴点を追跡する処理と、姿勢パラメータを推定する処理と、を繰り返す技術が示されている。この技術によれば、認識対象物や撮像手段の動きに対して頑健に姿勢パラメータを推定することができる。
【0006】
また、特許文献3には、入力画像を複数のブロックに分割し、これらブロックごとに、予め定められた数ずつ特徴点を設定する技術が示されている。この技術によれば、特徴点が、入力画像中のある領域に偏って設定されてしまうのを防止できる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2012−212460号公報
【特許文献2】特表2013−508844号公報
【特許文献3】特開2007−334625号公報
【非特許文献】
【0008】
【非特許文献1】D.Wagner, G. Reitmayr, A. Mulloni, T. Drummond and D. Schmalstieg, “Real-time detection and tracking for augmented reality on mobile phones.” IEEE Trans. Visualization and Computer Graphics, vol.16, no.3, pp.355-368, 2010.
【発明の概要】
【発明が解決しようとする課題】
【0009】
特許文献1で認識対象物として想定されている上述のマーカは、予め定められた形状および模様の平面画像である。このため、特許文献1に示されている技術では、認識対象物として、任意の平面画像や立体物といった任意の物体を扱うことができなかった。
【0010】
これに対して、特許文献2、3や非特許文献1に示されている技術では、認識対象物として任意の物体を扱うことができる。しかし、特許文献2、3や非特許文献1に示されている技術では、オクルージョンの発生や光源の変化などによって追跡可能な特徴点の数が減少してしまうと、姿勢パラメータの推定精度が低下してしまうという課題があった。
【0011】
そこで、特許文献2、3や非特許文献1に示されている技術において、追跡可能な特徴点の数が減少してしまう可能性があることを見越して、追跡する特徴点の数を予め増やしておくことが考えられる。これによれば、追跡可能な特徴点の数が減少してしまっても、追跡可能な特徴点を十分に確保することができ、姿勢パラメータの推定精度が低下してしまうのを抑制できる。しかし、この場合、追跡する特徴点の数を増やすことによって、処理負荷が増加してしまうという課題があった。
【0012】
そこで、本発明は、上述の課題に鑑みてなされたものであり、追跡可能な特徴点の数が減少してしまっても、処理負荷を増加させることなく、姿勢パラメータの推定精度の低下を抑制することを目的とする。
【課題を解決するための手段】
【0013】
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1) 本発明は、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置であって、予め定められた2種類以上の特徴点群(例えば、後述のNb点の基本特徴点と、後述のNs点の補助特徴点と、に相当)の中から特徴点を追跡用特徴点として選択する特徴点選択手段(例えば、図5の特徴点選択部133に相当)と、前記特徴点選択手段により選択された追跡用特徴点を追跡する特徴点追跡手段(例えば、図5の特徴点追跡部134に相当)と、前記特徴点追跡手段による追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める姿勢パラメータ更新手段(例えば、図5の姿勢パラメータ更新部135に相当)と、を備え、前記特徴点選択手段は、前記2種類以上の特徴点群のうち第1の特徴点群(例えば、後述のNb点の基本特徴点に相当)の中から優先的に特徴点を前記追跡用特徴点として選択することを特徴とする姿勢パラメータ推定装置を提案している。
【0014】
この発明によれば、2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を追跡用特徴点として選択することとした。このため、追跡に適した特徴点で第1の特徴点群を構成しておくことで、姿勢パラメータの推定精度を向上させることができる。
【0015】
この発明によれば、2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を追跡用特徴点として選択することとした。このため、第1の特徴点群の中から追跡用特徴点として選択した特徴点の中に、認識対象物が見切れていることによって入力画像内に存在しておらず(その画像の外側に存在しており)追跡できないものや、オクルージョンの発生や光源の変化により追跡できないものが存在する場合には、他の特徴点群の中から特徴点を追跡用特徴点として選択することができる。したがって、追跡する特徴点の数を予め増やすことなく、追跡可能な特徴点の数が減少してしまうのを防止できる。よって、処理負荷を増加させることなく、姿勢パラメータの推定精度の低下を抑制することができる。
【0016】
(2) 本発明は、(1)の姿勢パラメータ推定装置について、前記特徴点選択手段は、前記第1の特徴点群として、配置の偏りを取り除かれた複数の特徴点を用いることを特徴とする姿勢パラメータ推定装置を提案している。
【0017】
この発明によれば、(1)の姿勢パラメータ推定装置において、第1の特徴点群として、配置の偏りを取り除かれた複数の特徴点を用いることとした。このため、追跡用特徴点として、偏りなく配置された特徴点を選択することができるので、姿勢パラメータの推定精度を向上させることができる。
【0018】
(3) 本発明は、(1)または(2)の姿勢パラメータ推定装置について、前記姿勢パラメータ更新手段により求められた前フレームにおける姿勢パラメータ、または、前記入力画像から求められる初期姿勢パラメータを用いて、前記認識対象物の姿勢パラメータの予測値を求める姿勢パラメータ予測手段(例えば、図5の姿勢パラメータ予測部131に相当)を備え、前記特徴点選択手段は、前記姿勢パラメータ予測手段により求められた姿勢パラメータの予測値を用いて、前記追跡用特徴点として選択した各特徴点の前記入力画像における位置を推定し、前記特徴点追跡手段は、前記特徴点選択手段により推定された位置を、特徴点追跡の初期位置として、前記追跡用特徴点の追跡を行うことを特徴とする姿勢パラメータ推定装置を提案している。
【0019】
この発明によれば、(1)または(2)の姿勢パラメータ推定装置において、前フレームにおける姿勢パラメータまたは入力画像から求められる初期姿勢パラメータを用いて、姿勢パラメータの予測値を求め、求めた姿勢パラメータの予測値を用いて、特徴点を追跡する際の初期位置を求めることとした。このため、入力画像の中から特徴点を追跡する領域を限定することができるので、処理負荷を軽減させることができる。
【0020】
(4) 本発明は、(1)から(3)のいずれかの姿勢パラメータ推定装置について、前記特徴点選択手段は、前記第1の特徴点群の中から前記追跡用特徴点として選択した特徴点の中に、前記入力画像に存在していない特徴点が存在すれば、当該追跡用特徴点から当該特徴点を除外するとともに、除外した特徴点の数だけ、前記2種類以上の特徴点群のうち当該第1の特徴点群を除くものの中から特徴点を選択して当該追跡用特徴点に追加することを特徴とする姿勢パラメータ推定装置を提案している。
【0021】
この発明によれば、(1)から(3)のいずれかの姿勢パラメータ推定装置において、第1の特徴点群の中から追跡用特徴点として選択した特徴点の中に、入力画像に存在していない特徴点が存在していれば、この特徴点の代わりに他の特徴点群の中の特徴点を同じ数だけ、追跡用特徴点とすることとした。このため、追跡する特徴点の数を一定に保つことができるので、姿勢パラメータの推定精度の低下を抑制することができる。
【0022】
(5) 本発明は、(4)の姿勢パラメータ推定装置について、前記特徴点選択手段は、前記2種類以上の特徴点群のうち前記第1の特徴点群を除くものの中から特徴点を前記追跡用特徴点として選択する際に、当該追跡用特徴点として選択されている他の特徴点までの距離が大きいものから順に選択することを特徴とする姿勢パラメータ推定装置を提案している。
【0023】
この発明によれば、(4)の姿勢パラメータ推定装置において、2種類以上の特徴点群のうち第1の特徴点群を除くものの中から特徴点を追跡用特徴点として選択する際に、追跡用特徴点として選択されている他の特徴点までの距離が大きいものから順に選択することとした。このため、追跡する特徴点が偏ってしまうのを抑制できるので、姿勢パラメータの推定精度を向上させることができる。
【0024】
(6) 本発明は、(1)から(5)のいずれかの姿勢パラメータ推定装置について、前記特徴点選択手段は、予め定められた数の特徴点を、フレームごとに前記追跡用特徴点として選択することを特徴とする姿勢パラメータ推定装置を提案している。
【0025】
この発明によれば、(1)から(5)のいずれかの姿勢パラメータ推定装置において、予め定められた数の特徴点を、フレームごとに追跡用特徴点として選択することとした。このため、追跡する特徴点の数は、フレームが切り替わっても一定になるので、処理負荷や姿勢パラメータの推定精度がフレームごとに変動してしまうのを抑制できる。
【0026】
(7) 本発明は、(1)から(6)のいずれかの姿勢パラメータ推定装置について、前記特徴点選択手段は、予め定められた数以上のフレームで連続して追跡に失敗した特徴点については、以降のフレームにおいて予め定められた数のフレームだけ、前記追跡用特徴点として選択しないことを特徴とする姿勢パラメータ推定装置を提案している。
【0027】
ここで、オクルージョンの発生や光源の変化による画像への影響は、連続するフレーム間で相関性を有することが期待される。このため、あるフレームにおいてオクルージョンの発生や光源の変化により追跡できなかった特徴点は、次のフレームでも追跡に失敗する可能性が高くなる。
【0028】
そこで、この発明によれば、(1)から(6)のいずれかの姿勢パラメータ推定装置において、予め定められた数以上のフレームで連続して追跡に失敗した特徴点については、以降のフレームにおいて予め定められた数のフレームだけ、追跡用特徴点として選択しないこととした。このため、オクルージョンの発生や光源の変化によって追跡可能な特徴点の数が減少してしまうのを抑制できる。
【0029】
(8) 本発明は、(1)から(7)のいずれかの姿勢パラメータ推定装置について、前記入力画像と、当該入力画像と同一の画像であって当該入力画像より解像度の低い1つ以上の画像と、を求める複数解像度画像取得手段(例えば、図5の画像ピラミッド生成部132に相当)を備え、前記複数解像度画像取得手段により求められた画像のうち解像度の低いものから高いものに向かって順番に、前記特徴点選択手段による特徴点の選択と、前記特徴点追跡手段による特徴点の追跡と、前記姿勢パラメータ更新手段による姿勢パラメータの取得と、を繰り返し、前記特徴点選択手段は、現在の処理対象である画像の解像度よりも1つ解像度の低い画像を用いて前記姿勢パラメータ更新手段により求められた姿勢パラメータを用いて、特徴点の選択を行うことを特徴とする姿勢パラメータ推定装置を提案している。
【0030】
この発明によれば、(1)から(7)のいずれかの姿勢パラメータ推定装置において、解像度の低い画像から高い画像に向かって順番に、特徴点の選択と、特徴点の追跡と、姿勢パラメータの取得と、を繰り返すこととした。また、特徴点の選択の際には、現在の処理対象である画像の解像度よりも1つ解像度の低い画像を用いて求めた姿勢パラメータを、用いることとした。このため、認識対象物や撮像手段の動きに対して頑健な姿勢パラメータを推定することができる。
【0031】
(9) 本発明は、(1)から(8)のいずれかの姿勢パラメータ推定装置について、前記認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを2種類以上の特徴点群のいずれかに登録する特徴点登録手段(例えば、図2の特徴点登録部22に相当)を備えることを特徴とする姿勢パラメータ推定装置を提案している。
【0032】
この発明によれば、(1)から(8)のいずれかの姿勢パラメータ推定装置において、認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを2種類以上の特徴点群のいずれかに登録することとした。このため、偏りなく配置された特徴点を用いて姿勢パラメータを推定することができるので、姿勢パラメータの推定精度を向上させることができる。
【0033】
(10) 本発明は、(9)の姿勢パラメータ推定装置について、前記特徴点登録手段は、前記認識対象物の特徴点をクラスタリングして、配置に偏りなく特徴点を選択することを特徴とする姿勢パラメータ推定装置を提案している。
【0034】
この発明によれば、(9)の姿勢パラメータ推定装置において、認識対象物の特徴点をクラスタリングして、配置に偏りなく特徴点を選択することとした。このため、偏りなく配置された特徴点を用いて姿勢パラメータを推定することができるので、姿勢パラメータの推定精度を向上させることができる。
【0035】
(11) 本発明は、(10)の姿勢パラメータ推定装置について、前記特徴点登録手段は、前記第1の特徴点群として登録する特徴点の数(例えば、後述のNb個に相当)に、前記認識対象物の特徴点をクラスタリングし、各クラスから1点ずつ特徴点を選択することを特徴とする姿勢パラメータ推定装置を提案している。
【0036】
この発明によれば、(10)の姿勢パラメータ推定装置において、第1の特徴点群として登録する特徴点の数に、認識対象物の特徴点をクラスタリングし、各クラスから1点ずつ特徴点を選択することとした。このため、第1の特徴点群として登録する特徴点の数を設定することで、姿勢パラメータの推定に必要な数の特徴点を、第1の特徴群として登録することができる。
【0037】
(12) 本発明は、(10)または(11)の姿勢パラメータ推定装置について、前記特徴点登録手段は、前記認識対象物の特徴点をクラスタリングする際に、k-means型の手法を用いることを特徴とする姿勢パラメータ推定装置を提案している。
【0038】
この発明によれば、(10)または(11)の姿勢パラメータ推定装置において、認識対象物の特徴点をクラスタリングする際に、k-means型の手法を用いることとした。このため、第1の特徴点群として、偏りなく配置された特徴点を登録することができる。
【0039】
(13) 本発明は、(9)から(12)のいずれかの姿勢パラメータ推定装置について、前記特徴点登録手段は、前記第1の特徴点群として特徴点を登録した後に、第2の特徴点群として特徴点を登録し、前記第2の特徴点群には、前記認識対象物の特徴点のうち前記第1の特徴点群として登録された特徴点と前記第2の特徴点群として登録された特徴点とを除くものの中から、当該第1の特徴点群または当該第2の特徴点群として登録された特徴点からの距離が大きいものから順に登録することを特徴とする姿勢パラメータ推定装置を提案している。
【0040】
この発明によれば、(9)から(12)のいずれかの姿勢パラメータ推定装置において、認識対象物の特徴点のうち、第1の特徴点群として登録された特徴点と、第2の特徴点群として登録された特徴点と、を除くものの中から、第1の特徴点群または第2の特徴点群として登録された特徴点からの距離が大きいものから順に、第2の特徴点群として登録することとした。このため、第2の特徴点群として登録されている特徴点は、第2の特徴点群として登録されている他の特徴点や、第1の特徴点群として登録されている特徴点からできる限り離れていることになる。したがって、偏りなく配置された特徴点を用いて姿勢パラメータを推定することができるので、姿勢パラメータの推定精度を向上させることができる。
【0041】
(14) 本発明は、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定システム(例えば、図1の姿勢パラメータ推定システムAAに相当)であって、姿勢パラメータ推定装置(例えば、図1の姿勢パラメータ推定装置1に相当)と、前記姿勢パラメータ推定装置と通信可能に設けられたサーバ(例えば、図1のサーバ2に相当)と、を備え、前記サーバは、前記認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを2種類以上の特徴点群(例えば、後述のNb点の基本特徴点と、後述のNs点の補助特徴点と、に相当)のいずれかに登録する特徴点登録手段(例えば、図2の特徴点登録部22に相当)を備え、前記姿勢パラメータ推定装置は、前記2種類以上の特徴点群の中から特徴点を追跡用特徴点として選択する特徴点選択手段(例えば、図5の特徴点選択部133に相当)と、前記特徴点選択手段により選択された追跡用特徴点を追跡する特徴点追跡手段(例えば、図5の特徴点追跡部134に相当)と、前記特徴点追跡手段による追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める姿勢パラメータ更新手段(例えば、図5の姿勢パラメータ更新部135に相当)と、を備え、前記特徴点選択手段により、前記2種類以上の特徴点群のうち第1の特徴点群(例えば、後述のNb点の基本特徴点に相当)の中から優先的に特徴点を前記追跡用特徴点として選択することを特徴とする姿勢パラメータ推定システムを提案している。
【0042】
この発明によれば、認識対象物の特徴点の中から、配置に偏りなく特徴点を選択して、選択した特徴点のそれぞれを2種類以上の特徴点群のいずれかに登録し、これら2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を追跡用特徴点として選択することとした。このため、上述した効果と同様の効果を奏することができる。
【0043】
(15) 本発明は、特徴点選択手段(例えば、図5の特徴点選択部133に相当)、特徴点追跡手段(例えば、図5の特徴点追跡部134に相当)、および姿勢パラメータ更新手段(例えば、図5の姿勢パラメータ更新部135に相当)を備え、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置における姿勢パラメータ推定方法であって、前記特徴点選択手段が、予め定められた2種類以上の特徴点群(例えば、後述のNb点の基本特徴点と、後述のNs点の補助特徴点と、に相当)の中から特徴点を追跡用特徴点として選択する第1のステップと、前記特徴点追跡手段が、前記第1のステップにより選択された追跡用特徴点を追跡する第2のステップと、前記姿勢パラメータ更新手段が、前記第2のステップによる追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める第3のステップと、を備え、前記第1のステップでは、前記特徴点選択手段が、前記2種類以上の特徴点群のうち第1の特徴点群(例えば、後述のNb点の基本特徴点に相当)の中から優先的に特徴点を前記追跡用特徴点として選択することを特徴とする姿勢パラメータ推定方法を提案している。
【0044】
この発明によれば、2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を追跡用特徴点として選択することとした。このため、上述した効果と同様の効果を奏することができる。
【0045】
(16) 本発明は、特徴点選択手段(例えば、図5の特徴点選択部133に相当)、特徴点追跡手段(例えば、図5の特徴点追跡部134に相当)、および姿勢パラメータ更新手段(例えば、図5の姿勢パラメータ更新部135に相当)を備え、入力画像内の認識対象物の姿勢パラメータを推定する姿勢パラメータ推定装置における姿勢パラメータ推定方法を、コンピュータに実行させるためのプログラムであって、前記特徴点選択手段が、予め定められた2種類以上の特徴点群(例えば、後述のNb点の基本特徴点と、後述のNs点の補助特徴点と、に相当)の中から特徴点を追跡用特徴点として選択する第1のステップと、前記特徴点追跡手段が、前記第1のステップにより選択された追跡用特徴点を追跡する第2のステップと、前記姿勢パラメータ更新手段が、前記第2のステップによる追跡結果に基づいて、前記認識対象物の姿勢パラメータを求める第3のステップと、をコンピュータに実行させ、前記第1のステップでは、前記特徴点選択手段が、前記2種類以上の特徴点群のうち第1の特徴点群(例えば、後述のNb点の基本特徴点に相当)の中から優先的に特徴点を前記追跡用特徴点として選択するためのプログラムを提案している。
【0046】
この発明によれば、コンピュータを用いてプログラムを実行することで、2種類以上の特徴点群のうち第1の特徴点群の中から優先的に特徴点を追跡用特徴点として選択することとした。このため、上述した効果と同様の効果を奏することができる。
【発明の効果】
【0047】
本発明によれば、処理負荷を増加させることなく、姿勢パラメータの推定精度の低下を抑制することができる。
【図面の簡単な説明】
【0048】
図1】本発明の一実施形態に係る姿勢パラメータ推定システムを備えるARシステムのブロック図である。
図2】前記実施形態に係る姿勢パラメータ推定システムが備えるサーバのブロック図である。
図3】前記実施形態に係る姿勢パラメータ推定システムが備えるサーバが行う処理のフローチャートである。
図4】前記実施形態に係る姿勢パラメータ推定システムが備える姿勢パラメータ推定装置のブロック図である。
図5】前記実施形態に係る姿勢パラメータ推定システムが備える姿勢パラメータ推定装置に設けられた姿勢パラメータ追跡部のブロック図である。
図6】前記実施形態に係る姿勢パラメータ推定システムが備える姿勢パラメータ推定装置が行う処理のフローチャートである。
【発明を実施するための形態】
【0049】
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素などとの置き換えが可能であり、また、他の既存の構成要素との組み合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0050】
[ARシステム100の構成および動作]
図1は、本発明の一実施形態に係る姿勢パラメータ推定システムAAを備えるARシステム100のブロック図である。ARシステム100は、姿勢パラメータ推定システムAA、撮像装置3、表示装置4、および付加情報記憶部5を備える。姿勢パラメータ推定システムAAは、姿勢パラメータ推定装置1およびサーバ2を備える。
【0051】
撮像装置3は、認識対象物の画像を連続的に取得し、これら画像を入力画像として姿勢パラメータ推定装置1および表示装置4に送信する。この撮像装置3は、WEBカメラといった画像を連続的に取得できるもので構成され、例えば携帯端末に搭載されているカメラモジュールであってもよい。なお、認識対象物は、形状や模様の既知である任意の3次元物体または2次元物体(画像)であるものとする。
【0052】
付加情報記憶部5は、認識対象物に紐付けられた付加情報を記憶している。付加情報は、例えば、CG(Computer Graphics)や2次元画像の情報で構成される。この付加情報記憶部5は、PCや携帯端末に設けられたHDD(Hard Disk Drive)やメモリモジュールなどの記憶装置で構成される。
【0053】
姿勢パラメータ推定システムAAは、撮像装置3から送信された入力画像に基づいて、認識対象物の姿勢パラメータを推定し、表示装置4に送信する。また、ARシステム100が複数の物体を認識対象物とする場合には、推定した姿勢パラメータに加えて、これら複数の認識対象物のうちどれの姿勢パラメータなのかを示す情報も、表示装置4に送信する。姿勢パラメータ推定システムAAの詳細については、後述する。
【0054】
なお、認識対象物の姿勢パラメータは、撮像装置3の外部パラメータとも呼ばれ、認識対象物と撮像装置3との相対的な位置および姿勢の関係を表し、一般に6自由度の行列で表現される。この認識対象物の姿勢パラメータ(撮像装置3の外部パラメータ)と、撮像装置3固有の焦点距離および主軸の位置の情報が含まれる行列(撮像装置3の内部パラメータ)と、その他光学的歪みのパラメータと、によって、表示装置4の表示画面内での物体の見え方が決まる。本実施形態では、内部パラメータや歪みパラメータは、予め、撮像装置3のカメラキャリブレーションなどによって取得され、歪みが取り除かれているものとする。
【0055】
表示装置4は、認識対象物に紐付けられた付加情報を付加情報記憶部5から読み出し、姿勢パラメータ推定システムAAで推定された姿勢パラメータに応じて表示位置や向きを補正して、表示する。この表示装置4は、例えば、携帯端末のディスプレイや、ヘッドマウントディスプレイ(HMD)を含んで構成される。
【0056】
表示装置4が、携帯端末のディスプレイや、ビデオシースルー型のHMDである場合には、撮像装置3から送信された入力画像を表示するとともに、この入力画像に付加情報を重畳させて表示する。具体的には、認識対象物に紐付けられた付加情報を付加情報記憶部5から読み出し、姿勢パラメータ推定システムAAで推定された姿勢パラメータに応じて表示位置や向きを決定する。そして、入力画像に対して、読み出した付加情報を決定した表示位置および向きで重畳させ、表示画面に表示する。
【0057】
また、表示装置4が、透過型のディスプレイや、光学シースルー型のHMDである場合には、付加情報のみを表示する。具体的には、認識対象物に紐付けられた付加情報を付加情報記憶部5から読み出し、姿勢パラメータ推定システムAAで推定された姿勢パラメータに応じて表示位置や向きを決定する。そして、表示画面の決定した表示位置に、決定した向きで付加情報を表示して、表示画面を透過してユーザが見ている視界に付加情報を重畳させる。
【0058】
以上の構成を備えるARシステム100には、例えば認識対象物が地球儀である場合、高度を視覚表示するように地表を重畳表示したり、過去の大陸形状を重畳表示したり、国境や国名に変更があった場合に新しい情報を重畳表示したり、ジェスチャー認識と組み合わせてユーザが指差した国名を重畳表示したり、といった利用例が想定される。
【0059】
[姿勢パラメータ推定システムAAの構成および動作]
姿勢パラメータ推定システムAAは、上述のように、姿勢パラメータ推定装置1およびサーバ2を備える。この姿勢パラメータ推定システムAAは、サーバ2により、認識対象物の特徴点として、Nb点(Nbは、Nb≧1を満たす整数)の基本特徴点と、Ns点(Nsは、Ns≧Nbを満たす整数)の補助特徴点と、の2種類の特徴点を予め決定しておく。そして、この認識対象物の画像が撮像装置3で取得されると、姿勢パラメータ推定装置1により、これらNb点の基本特徴点およびNs点の補助特徴点をサーバ2から読み出し、これらの中から追跡可能な特徴点をNb点選択し、選択したNb点の特徴点を用いて認識対象物の姿勢パラメータを推定する。
【0060】
[サーバ2の構成および動作]
図2は、サーバ2のブロック図である。サーバ2は、姿勢パラメータ推定装置1と通信可能に接続されており、画像ピラミッド生成部21、特徴点登録部22、および特徴点記憶部23を備える。
【0061】
(画像ピラミッド生成部21の動作)
画像ピラミッド生成部21は、姿勢パラメータ推定システムAAが想定している全ての認識対象物のそれぞれについて、認識対象物を含む画像を用いて画像ピラミッド生成して出力する。ここで、画像ピラミッドとは、同一画像で解像度の異なる2つ以上の画像の集合のことであり、画像に対して画像縮小処理を1回以上行うことによって生成される。
【0062】
ここで、画像縮小処理により画像を縮小する比率(スケールファクタとも呼ばれる)には、例えば1/2といった任意の値を設定することができる。画像縮小処理を行う回数をn回(nは、任意の正の整数)とすると、画像ピラミッドのレベル数は(n+1)になり、画像ピラミッドの最も低いレベル(plevel=0)である1段目に解像度の最も高い画像(元の画像)が設定され、レベルが高くなるに従って、解像度の低い画像が設定されることになる。
【0063】
(特徴点登録部22の動作)
特徴点登録部22は、姿勢パラメータ推定システムAAが想定している全ての認識対象物のそれぞれについて、画像ピラミッドのレベルごとに、Nb点の基本特徴点と、Ns点の補助特徴点と、の2種類の特徴点を取得し、特徴点記憶部23に記憶させる。これら2種類の特徴点は、追跡に適した認識対象物の表面上の点(3次元座標)であり、キーフレーム上の特徴点の3次元座標とピクセル座標との組、または、認識対象物の3次元モデルの頂点の座標で指定される。キーフレームには、認識対象物の3次元モデルを予め平面に投影した画像や、認識対象物を予め撮影した画像を適用することができ、認識対象物が平面画像である場合には、その平面画像を適用してもよい。
【0064】
特徴点登録部22による基本特徴点および補助特徴点の取得について、姿勢パラメータ推定システムAAが想定している全ての認識対象物のうち認識対象物Xについて行う場合を例に、以下に詳述する。
【0065】
まず、特徴点登録部22は、認識対象物Xのキーフレームから、特徴点検出アルゴリズムを用いて認識対象物Xの特徴点を検出する。特徴点検出アルゴリズムには、例えばGoodFeaturesToTrackや、Harris、Hessian、FASTなどを用いることができる。
【0066】
次に、特徴点登録部22は、画像ピラミッドのレベルごとに、検出した特徴点を、ピクセル座標に基づいてNb個のクラスに分類する。特徴点の分類には、例えばk-means++を用いることができる。なお、画像ピラミッドのレベルが低くなるに従って、「Nb」の値を大きくする。このため、画像ピラミッドのレベルが低くなるに従って、クラスの数が多くなり、後述の基本特徴点の数と、追跡する特徴点の数と、も多くなる。ただし、フレームが切り替わっても画像ピラミッドの同じレベル同士では、「Nb」の値を等しくする。
【0067】
次に、特徴点登録部22は、画像ピラミッドのレベルごとに、Nb個のクラスのそれぞれにおいて、1点ずつ特徴点を選択する。これによれば、画像ピラミッドのレベルごとに、Nb点の特徴点が選択されることになる。そこで、画像ピラミッドのレベルごとに、これらNb点の特徴点を基本特徴点とする。特徴点の選択には、例えば特徴点のスコアを用いることができる。具体的には、各特徴点のスコア(例えば、FASTやHarrisの応答値)を求め、スコアの最も高い特徴点を1つずつクラスごとに選択する。
【0068】
次に、特徴点登録部22は、画像ピラミッドのレベルごとに、検出した特徴点のうちNb点の基本特徴点を除くものの中から、Ns点を選択し、補助特徴点とする。具体的には、まず、第1の処理において、検出した特徴点のうちNb点の基本特徴点を除くもののそれぞれについて、最も近くに位置する基本特徴点までの距離を求める。次に、第2の処理において、最も近くに位置する基本特徴点までの距離が最も大きいものを1点、補助特徴点として選択する。次に、第3の処理において、検出した特徴点のうち、Nb点の基本特徴点と、補助特徴点と、を除くもののそれぞれについて、最も近くに位置する基本特徴点または補助特徴点までの距離を求める。次に、第4の処理において、最も近くに位置する基本特徴点または補助特徴点までの距離が最も大きいものを1点、補助特徴点として選択する。以降、補助特徴点としてNs点の特徴点を選択するまで、第3の処理と第4の処理とを繰り返す。これによれば、Ns点の補助特徴点のそれぞれを、他の補助特徴点やNb点の基本特徴点からできるだけ離して配置することができ、Ns点の補助特徴点を偏りなく配置することができる。
【0069】
次に、特徴点登録部22は、画像ピラミッドのレベルごとに、認識対象物Xの特徴点として、選択したNb点の基本特徴点と、選択したNs点の補助特徴点と、を特徴点記憶部23に記憶させる。
【0070】
(特徴点記憶部23の動作)
特徴点記憶部23は、特徴点登録部22により選択されたNb点の基本特徴点およびNs点の補助特徴点を、姿勢パラメータ推定システムAAが想定している全ての認識対象物のそれぞれについて、画像ピラミッドのレベルごとに記憶する。また、特徴点記憶部23は、姿勢パラメータ推定装置1から特徴点を要求されると、要求された認識対象物について記憶しているNb点の基本特徴点およびNs点の補助特徴点を、画像ピラミッドのレベルごとに、姿勢パラメータ推定装置1に送信する。
【0071】
図3は、認識対象物Xについての基本特徴点および補助特徴点を決定する場合にサーバ2が行う処理のフローチャートである。
【0072】
ステップS1において、サーバ2は、画像ピラミッド生成部21により、認識対象物Xのキーフレームを用いて画像ピラミッドを生成し、ステップS2に処理を移す。
【0073】
ステップS2において、サーバ2は、特徴点登録部22により、ステップS1で生成した画像ピラミッドを用いて、画像ピラミッドのレベルごとに認識対象物の特徴点を検出し、ステップS3に処理を移す。
【0074】
ステップS3において、サーバ2は、特徴点登録部22により、画像ピラミッドのレベルごとに、ステップS2で検出した特徴点をNb個にクラスタリングし、ステップS4に処理を移す。
【0075】
ステップS4において、サーバ2は、特徴点登録部22により、画像ピラミッドのレベルごとに、ステップS3におけるクラスタリングの結果を用いて、ステップS2で検出した特徴点の中から基本特徴点をNb点選択し、ステップS5に処理を移す。
【0076】
ステップS5において、サーバ2は、特徴点登録部22により、画像ピラミッドのレベルごとに、ステップS2で検出した特徴点のうち、ステップS4で選択したNb点の基本特徴点と、他の補助特徴点と、を除くもののそれぞれについて、最も近くに位置する基本特徴点または補助特徴点までの距離を求め、ステップS6に処理を移す。
【0077】
ステップS6において、サーバ2は、画像ピラミッドのレベルごとに、特徴点登録部22により、ステップS5で求めた距離の最も大きい特徴点を補助特徴点として1つ選択し、ステップS7に処理を移す。
【0078】
ステップS7において、サーバ2は、特徴点登録部22により、画像ピラミッドのレベルごとに、補助特徴点をNs点ずつ選択したか否かを判別する。選択したと判別した場合には、図3の処理を終了し、選択していないと判別した場合には、ステップS5に処理を戻す。
【0079】
[姿勢パラメータ推定装置1の構成および動作]
図4は、姿勢パラメータ推定装置1のブロック図である。姿勢パラメータ推定装置1は、対象物識別部11、初期姿勢パラメータ推定部12、および姿勢パラメータ追跡部13を備える。
【0080】
(対象物識別部11の動作)
対象物識別部11は、撮像装置3から送信された入力画像に基づいて、入力画像内の認識対象物の識別処理を行い、その結果を識別結果として出力する。識別処理では、認識対象物から特徴量が予め検出されていることを前提として、まず、入力画像から局所特徴量を検出する。次に、検出した局所特徴量と、予め検出されている特徴量と、の照合を行って、認識対象物を識別する。
【0081】
なお、認識対象物が多数存在する場合には、上述の識別処理の処理負荷が高くなる。そこで、認識対象物が多数存在する場合には、姿勢パラメータ推定装置1は、外部に設けられた外部サーバに入力画像を送信し、外部サーバで上述の識別処理を行わせ、その結果を識別結果として受信するものとしてもよい。また、認識対象物の存在する数が少ない場合には、対象物識別部11による処理を省くものとしてもよい。
【0082】
(初期姿勢パラメータ推定部12の動作)
初期姿勢パラメータ推定部12は、撮像装置3から送信された入力画像と、対象物識別部11から出力された識別結果と、に基づいて初期姿勢パラメータ推定処理を行い、その結果を初期姿勢パラメータとして出力する。初期姿勢パラメータ推定処理では、例えば特許文献2や非特許文献1に示されているアルゴリズムにより、入力画像に含まれる認識対象物の姿勢パラメータを推定する。
【0083】
なお、後述の姿勢パラメータ追跡部13は、上述の初期姿勢パラメータを、姿勢パラメータの初期値として認識対象物の追跡を開始する場合に用いる。このため、初期姿勢パラメータ推定部12は、上述の初期姿勢パラメータ推定処理を、姿勢パラメータ追跡部13が特徴点の追跡を開始する場合に行う。ただし、姿勢パラメータ追跡部13は、特徴点の追跡に失敗する場合もある。そこで、姿勢パラメータ追跡部13による追跡が失敗した場合にも、初期姿勢パラメータ推定部12は、上述の初期姿勢パラメータ推定処理を行う。
【0084】
(姿勢パラメータ追跡部13の構成および動作)
姿勢パラメータ追跡部13は、撮像装置3から送信された入力画像と、この入力画像に含まれる認識対象物に対してサーバ2の特徴点記憶部23に記憶されている基本特徴点および補助特徴点と、後述の追跡処理の初期値と、に基づいて追跡処理を行って、認識対象物の姿勢パラメータを求めて出力する。追跡処理の初期値には、追跡処理の状況に応じたものを用いる。具体的には、認識対象物の追跡を開始する場合と、認識対象物の追跡に失敗した場合と、には、追跡処理の初期値として、初期姿勢パラメータ推定部12から出力される初期姿勢パラメータを用いる。一方、認識対象物の追跡に成功している場合、すなわち前フレームから継続して認識対象物を追跡している場合には、追跡処理の初期値として、前フレームにおいて追跡処理により求めた姿勢パラメータを用いる。
【0085】
図5は、姿勢パラメータ追跡部13のブロック図である。姿勢パラメータ追跡部13は、姿勢パラメータ予測部131、画像ピラミッド生成部132、特徴点選択部133、特徴点追跡部134、および姿勢パラメータ更新部135を備える。
【0086】
(姿勢パラメータ予測部131の動作)
姿勢パラメータ予測部131は、上述の追跡処理の初期値、すなわち、初期姿勢パラメータ推定部12から出力される初期姿勢パラメータと、前フレームにおいて求めた姿勢パラメータと、のいずれかに基づいて姿勢パラメータ予測処理を行い、その結果を姿勢パラメータ予測値として出力する。姿勢パラメータ予測処理では、上述の初期姿勢パラメータまたは前フレームにおける姿勢パラメータに基づいて、現在のフレームにおける姿勢パラメータ予測値を求める。
【0087】
なお、認識対象物の追跡に成功している場合には、姿勢パラメータ予測処理で予測アルゴリズムを用いる。予測アルゴリズムには、様々なものを適用することが可能である。例えば、認識対象物と撮像装置3との線形な運動モデルを仮定し、2フレーム前の姿勢パラメータと前フレームの姿勢パラメータとの差分(移動量)を前フレームの姿勢パラメータに適用して、現在のフレームにおける姿勢パラメータ予測値とするという予測アルゴリズムを、適用してもよい。
【0088】
また、姿勢パラメータ予測処理は、必ずしも行う必要はなく、前フレームにおいて追跡処理により求めた姿勢パラメータをそのまま出力するものとしてもよい。しかし、姿勢パラメータ予測処理を行うことによって、認識対象物や撮像装置3の動きに対する頑健性を向上させることができる場合がある。
【0089】
(画像ピラミッド生成部132の動作)
画像ピラミッド生成部132は、画像ピラミッド生成部21と同様の画像縮小処理を、画像ピラミッド生成部21が行った回数と同じ回数だけ行って、撮像装置3から送信された入力画像を用いて画像ピラミッド生成して出力する。
【0090】
画像縮小処理を行う回数をn回とすると、画像ピラミッドのレベル数は(n+1)になり、画像ピラミッドの最も低いレベル(plevel=0)である1段目に撮像装置3から送信された入力画像が設定され、レベルが高くなるに従って、解像度の低い画像が設定されることになる。
【0091】
(特徴点選択部133の動作)
特徴点選択部133は、画像ピラミッド生成部132から出力される画像ピラミッドに加えて、姿勢パラメータ予測部131から出力される姿勢パラメータ予測値と、姿勢パラメータ更新部135から出力される姿勢パラメータと、のいずれかを用いて、画像ピラミッドのレベルごとに、追跡する特徴点を選択するとともに、選択した特徴点を追跡する際の初期位置を決定して出力する。
【0092】
具体的には、特徴点選択部133は、まず、特徴点を追跡する認識対象物についてのNb点の基本特徴点およびNs点の補助特徴点を、サーバ2の特徴点記憶部23から読み出す。そして、読み出したNb点の基本特徴点を、追跡する特徴点として選択する。
【0093】
次に、特徴点を追跡する際の初期位置の決定を、画像ピラミッドの最も高いレベルの画像において行う場合には、特徴点選択部133は、姿勢パラメータ予測部131から出力される姿勢パラメータ予測値に基づいて、Nb点の基本特徴点のそれぞれを予測位置に投影する。具体的には、Nb点の基本特徴点のそれぞれの3次元座標を、撮像装置3の内部パラメータと、上述の姿勢パラメータ予測値と、を用いて画像ピラミッドの最も高いレベルの画像上に投影し、画像ピラミッドの最も高いレベルの画像における特徴点追跡の初期位置とする。なお、認識対象物が平面画像である場合には、特徴点追跡の初期位置は、ホモグラフィ変換によって決定される。
【0094】
また、特徴点を追跡する際の初期位置の決定を、画像ピラミッドの最も高いレベル以外のレベルの画像において行う場合には、特徴点選択部133は、姿勢パラメータ更新部135から出力される姿勢パラメータ、すなわち画像ピラミッドの1つ上のレベルの画像における姿勢パラメータに基づいて、Nb点の基本特徴点のそれぞれを予測位置に投影する。具体的には、画像ピラミッドのp段目(pは、1≦p≦nを満たす整数)の画像において追跡する特徴点の初期位置を決定する場合には、Nb点の基本特徴点のそれぞれの3次元座標を、撮像装置3の内部パラメータと、画像ピラミッドの(p+1)段目における姿勢パラメータと、を用いて画像ピラミッドのp段目の画像上に投影し、画像ピラミッドのp段目における特徴点追跡の初期位置とする。なお、認識対象物が平面画像である場合には、特徴点追跡の初期位置は、ホモグラフィ変換によって決定される。
【0095】
次に、特徴点選択部133は、画像ピラミッドのレベルごとに、Nb点の基本特徴点の中に、認識対象物が見切れていることによってその画像に存在しておらず(その画像の外側に存在しており)追跡できないものや、オクルージョンの発生や光源の変化により追跡できないものが存在していないかを判断する。そして、追跡できないものがあると判断した場合には、追跡する特徴点から、追跡できない基本特徴点を除外するとともに、追跡する特徴点に、除外した基本特徴点の数だけ補助特徴点を追加する。これによれば、Nb点の基本特徴点の中に追跡できないものが存在してしまっても、追跡できる特徴点の数をNb点に保つことができる。
【0096】
Ns点の補助特徴点のうちどれを追加するかについては、サーバ2の特徴点登録部22で補助特徴点を選択する際に求めた、最も近くに位置する基本特徴点または他の補助特徴点までの距離を用いる。具体的には、まず、Ns点の補助特徴点のそれぞれに対して、最も近くに位置する基本特徴点または他の補助特徴点までの距離が大きいものほど序列を高く設定する。次に、Ns点の補助特徴点の中から、序列の高いものから順に、追跡できない基本特徴点の数だけ補助特徴点を選択する。次に、選択した補助特徴点のそれぞれを、上述の基本特徴点と同様に画像に投影して特徴点追跡の初期位置を求める。そして、特徴点追跡の初期位置を求めた補助特徴点の中に、上述のように追跡できないものが存在していれば、追跡できる補助特徴点が見つかるまで、序列の高いものから順に、上述の選択および特徴点追跡の初期位置の取得を繰り返す。
【0097】
なお、上述のオクルージョンの発生や光源の変化による画像への影響は、連続するフレーム間で相関性を有することが期待される。このため、あるフレームにおいてオクルージョンの発生や光源の変化により追跡できなかった特徴点は、次のフレームでも追跡に失敗する可能性が高くなる。そこで、予め定められた数以上のフレーム(例えば5フレーム)で連続して追跡に失敗した特徴点については、以降のフレームにおいて予め定められた数のフレーム(例えば2フレーム)だけ、追跡する特徴点として選択しないようにする。
【0098】
(特徴点追跡部134の動作)
特徴点追跡部134は、画像ピラミッドのレベルごとに、特徴点選択部133から出力されるNb点の特徴点のそれぞれを、特徴点追跡手法により追跡して出力する。
【0099】
特徴点追跡手法については、例えば非特許文献1にPatch Trackerという名称で示されている。このマッチングは、まず、画像ピラミッドの最も高いレベルの画像に対して行われる。このため、探索範囲が狭くても、入力画像では広い範囲を探索したことに相当し、認識対象物や撮像手段の動きに対して頑健な特徴点追跡が可能になる。また、このマッチングは、画像ピラミッドの最も高いレベルの画像に対して行うことで得られた、比較的広い探索範囲(例えば5×5)で荒く推定した姿勢パラメータを初期値として、画像ピラミッドの低いレベルの画像に対して狭い探索範囲(例えば2×2)で行われる。このため、高精度な特徴点追跡を行うことができ、特徴点の追跡精度の低下を抑えることができる。
【0100】
具体的には、特徴点追跡部134は、まず、特徴点選択部133から出力されるNb点の特徴点のそれぞれについて、周囲の8×8の矩形領域の画素情報(輝度値)を、特徴点選択部133でその特徴点を投影する際に用いられたパラメータを用いてキーフレームから取得して、切り出し画像とする。
【0101】
次に、特徴点追跡部134は、Nb個の切り出し画像のそれぞれを、画像ピラミッドの最も高いレベルの画像と比較して、Nb個の切り出し画像のそれぞれについて、一致する領域を画像ピラミッドの最も高いレベルの画像の中から推定する。これら画像の比較では、NCC(Normalized Cross Correlation)や、ZNCC(Zero-mean Normalized Cross Correlation)を用いたマッチングを行う。マッチングによって高い相関を有する領域を求めることができると、この領域を切り出し画像と一致する領域であると推定する。これによれば、この領域の中心のピクセル座標が、Nb個の特徴点のそれぞれの追跡位置になる。
【0102】
なお、姿勢パラメータ予測部131による姿勢パラメータ予測処理が理想的に行われた場合には、切り出し画像と一致する領域の中心は、画像ピラミッドの最も高いレベルの画像のうち特徴点追跡の初期位置と一致する。そこで、上述のマッチングについては、Nb個の切り出し画像のそれぞれについて、画像ピラミッドの最も高いレベルの画像のうち、特徴点選択部133により決定されたこの画像における特徴点追跡の初期位置を中心として予め定められた領域(例えば、5×5の矩形領域)に限定して行う。
【0103】
次に、特徴点追跡部134は、Nb個の切り出し画像のそれぞれを、画像ピラミッドの2番目に高いレベルの画像と比較して、Nb個の切り出し画像のそれぞれについて、一致する領域を画像ピラミッドの2番目に高いレベルの画像の中から推定する。なお、推定の際には、Nb個の切り出し画像のそれぞれについて、画像ピラミッドの2番目に高いレベルの画像のうち、特徴点選択部133により決定されたこの画像における特徴点追跡の初期位置、すなわち画像ピラミッドの最も高いレベルの画像において求めた追跡位置を中心として、予め定められた領域に限定して、上述のマッチングを行う。
【0104】
以降、特徴点追跡部134は、上述のマッチングによる推定を、画像ピラミッドの(n−a)段目(aは、0≦a<n−1を満たす任意の整数)の画像に対して、画像ピラミッドの(n−a+1)段目の画像において求めた追跡位置を中心として予め定められた領域に限定して行うことを、画像ピラミッドの1段目の画像に対して行うまで、繰り返す。そして、画像ピラミッドの1段目の画像において求めたNb点の追跡位置を、Nb点の特徴点の追跡結果として出力する。
【0105】
(姿勢パラメータ更新部135の動作)
姿勢パラメータ更新部135は、画像ピラミッドのレベルごとに、姿勢パラメータ予測部131から出力される姿勢パラメータ予測値と、特徴点追跡部134による特徴点の追跡結果と、に基づいて、認識対象物の姿勢パラメータを推定する。これら追跡結果は、特徴点の3次元座標と、その特徴点の入力画像上のピクセル座標(追跡位置)と、の組で構成される。これら3次元座標とピクセル座標との関係は、以下の式(1)で表される。
【0106】
【数1】
【0107】
式(1)において、[X、Y、Z]は、特徴点の3次元座標を示し、[u、v]は、特徴点の入力画像上におけるピクセル座標を示し、[・]は、転置行列を示す。また、Aは、撮像装置3の内部パラメータを示し、Wは、撮像装置3の外部パラメータ(姿勢パラメータ)を示す。姿勢パラメータの推定値W^は、姿勢パラメータ予測部131から出力される姿勢パラメータ予測値を初期値として、非線形の最適化手法を用いて以下の式(2)で求めることができる。
【0108】
【数2】
【0109】
式(2)において、m’は、入力画像上の追跡位置を示し、ρ(・)は、ロバスト推定の重み係数を示す。
【0110】
図6は、姿勢パラメータ追跡部13が行う処理のフローチャートである。
【0111】
ステップS11において、姿勢パラメータ追跡部13は、姿勢パラメータ予測部131により、上述の姿勢パラメータ予測処理を行って、姿勢パラメータ予測値を生成し、ステップS12に処理を移す。
【0112】
ステップS12において、姿勢パラメータ追跡部13は、画像ピラミッド生成部132により、入力画像を用いて画像ピラミッドを生成し、ステップS13に処理を移す。
【0113】
ステップS13において、姿勢パラメータ追跡部13は、特徴点選択部133により、画像ピラミッドの処理対象レベルの画像において追跡するNb点の特徴点を、サーバ2に記憶されているNb点の基本特徴点およびNs点の補助特徴点の中から選択し、ステップS14に処理を移す。
【0114】
ステップS14において、姿勢パラメータ追跡部13は、特徴点追跡部134により、画像ピラミッドの処理対象レベルの画像において、ステップS13で選択した特徴点を追跡し、ステップS15に処理を移す。
【0115】
ステップS15において、姿勢パラメータ追跡部13は、姿勢パラメータ更新部135により、ステップS14における状態推定用特徴点の追跡結果に基づいて、画像ピラミッドの処理対象レベルにおける認識対象物の姿勢パラメータを推定し、ステップS16に処理を移す。
【0116】
ステップS16において、姿勢パラメータ追跡部13は、特徴点追跡部134により、処理対象レベルが最も低いレベルであるか否かを判別する。そして、処理対象レベルが最も低いレベルであると判別した場合には、図6に示す処理を終了し、処理対象レベルが最も低いレベルではないと判別した場合には、ステップS13に処理を戻す。なお、本実施形態では、フレームが切り替わるたびに、姿勢パラメータ追跡部13が最も高いレベルに処理対象レベルを設定する。
【0117】
ステップS17において、姿勢パラメータ追跡部13は、特徴点追跡部134により、画像ピラミッドの処理対象レベルを1つ下の段に遷移させ、ステップS13に処理を戻す。
【0118】
以上の姿勢パラメータ推定システムAAによれば、以下の効果を奏することができる。
【0119】
姿勢パラメータ推定システムAAは、Nb点の基本特徴点の中から優先的に、追跡する特徴点を選択する。このため、Nb点の基本特徴点の中に、認識対象物が見切れていることによって入力画像内に存在しておらず(その画像の外側に存在しており)追跡できないものや、オクルージョンの発生や光源の変化により追跡できないものが存在する場合には、Ns点の補助特徴点の中から、追跡する特徴点を追加することができる。したがって、追跡する特徴点の数を予め増やすことなく、追跡可能な特徴点の数が減少してしまうのを防止できる。よって、処理負荷を増加させることなく、姿勢パラメータの推定精度の低下を抑制することができる。
【0120】
また、姿勢パラメータ推定システムAAは、前フレームにおける姿勢パラメータまたは入力画像から求められる初期姿勢パラメータを用いて、姿勢パラメータ予測値を求め、求めた姿勢パラメータ予測値を用いて、特徴点を追跡する際の初期位置を求める。このため、入力画像の中から特徴点を追跡する領域を限定することができるので、処理負荷を軽減させることができる。
【0121】
また、姿勢パラメータ推定システムAAは、Nb点の基本特徴点の中に、入力画像に存在していない特徴点が存在していれば、この特徴点の代わりにNs点の補助特徴点の中から同じ数だけ、追跡する特徴点に追加する。このため、追跡する特徴点の数を一定に保つことができるので、姿勢パラメータの推定精度の低下を抑制することができる。
【0122】
また、姿勢パラメータ推定システムAAは、Ns点の補助特徴点の中から追跡する特徴点を選択する際に、既に選択されている他の特徴点までの距離が大きいものから順に選択する。このため、追跡する特徴点が偏ってしまうのを抑制できるので、姿勢パラメータの推定精度を向上させることができる。
【0123】
また、解像度の低い画像においては、細かい模様が見えにくくなるので、追跡する特徴点の数が多くしても、特徴点の追跡処理の処理負荷が増加するにもかかわらず、特徴点の追跡精度はあまり向上しない。一方、解像度の高い画像においては、細かい画像も見えやすくなるので、追跡する特徴点の数を多くすると、特徴点の追跡精度が向上する。そこで、姿勢パラメータ推定システムAAは、画像ピラミッドのレベルが低くなるに従って、「Nb」の値を大きくする。このため、解像度の高い画像では、解像度の低い画像と比べて、多くの特徴点を追跡することができ、姿勢パラメータの推定精度を向上させることができる。
【0124】
また、姿勢パラメータ推定システムAAは、Nb点の特徴点を、追跡する特徴点としてフレームごとに選択する。すなわち、姿勢パラメータ推定システムAAは、追跡する特徴点の数を、画像ピラミッドのレベルに応じて上述のように変化させるが、フレームが切り替わっても画像ピラミッドの同じレベル同士では等しくする。このため、追跡する特徴点の数は、上述のように画像ピラミッドのレベルに応じて変化するが、追跡する特徴点の総数は、フレームが切り替わっても一定になるので、処理負荷や姿勢パラメータの推定精度がフレームごとに変動してしまうのを抑制できる。
【0125】
また、姿勢パラメータ推定システムAAは、予め定められた数以上のフレームで連続して追跡に失敗した特徴点については、以降のフレームにおいて予め定められた数のフレームだけ、追跡する特徴点として選択しない。このため、オクルージョンの発生や光源の変化によって追跡可能な特徴点の数が減少してしまうのを抑制できる。
【0126】
また、姿勢パラメータ推定システムAAは、画像ピラミッドのレベルの高い画像からレベルの低い画像に向かって順番に、特徴点の選択と、特徴点の追跡と、姿勢パラメータの取得と、を繰り返す。また、特徴点の選択の際には、現在の処理対象レベルよりも1つレベルの高い画像を用いて求めた姿勢パラメータを、用いる。このため、認識対象物や撮像装置3の動きに対して頑健な姿勢パラメータを推定することができる。
【0127】
また、姿勢パラメータ推定システムAAは、検出した認識対象物の特徴点の中から、配置に偏りなく特徴点を選択し、選択した特徴点のそれぞれを基本特徴点または補助特徴点として登録する。このため、偏りなく配置された特徴点を用いて姿勢パラメータを推定することができるので、姿勢パラメータの推定精度を向上させることができる。
【0128】
また、姿勢パラメータ推定システムAAは、認識対象物の特徴点のうち基本特徴点および補助特徴点を除くものの中から、基本特徴点または他の補助特徴点からの距離が大きいものから順に、補助特徴点として登録する。このため、補助特徴点のそれぞれは、他の補助特徴点や基本特徴点からできる限り離れていることになる。したがって、偏りなく配置された特徴点を用いて姿勢パラメータを推定することができるので、姿勢パラメータの推定精度を向上させることができる。
【0129】
なお、本発明の姿勢パラメータ推定システムAAの処理を、コンピュータ読み取り可能な非一時的な記録媒体に記録し、この記録媒体に記録されたプログラムを姿勢パラメータ推定システムAAに読み込ませ、実行することによって、本発明を実現できる。
【0130】
ここで、上述の記録媒体には、例えば、EPROMやフラッシュメモリといった不揮発性のメモリ、ハードディスクといった磁気ディスク、CD−ROMなどを適用できる。また、この記録媒体に記録されたプログラムの読み込みおよび実行は、姿勢パラメータ推定システムAAに設けられたプロセッサによって行われる。
【0131】
また、上述のプログラムは、このプログラムを記憶装置などに格納した姿勢パラメータ推定システムAAから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0132】
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を姿勢パラメータ推定システムAAにすでに記録されているプログラムとの組み合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0133】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
【0134】
例えば、上述の実施形態では、認識対象物の姿勢パラメータの推定を、姿勢パラメータ推定装置1およびサーバ2を備える姿勢パラメータ推定システムAAが行うものとしたが、これに限らず、例えば、姿勢パラメータ推定装置1が行うものとしてもよい。この場合には、姿勢パラメータ推定装置1は、図2の画像ピラミッド生成部21、特徴点登録部22、および特徴点記憶部23も備えることになり、サーバ2は不要になる。
【0135】
また、上述の実施形態では、画像ピラミッド生成部21、132は、画像縮小処理を行うものとしたが、これに限らず、例えば画像縮小処理に加えて平滑化処理も行うものとしてもよい。
【0136】
また、上述の実施形態において、画像ピラミッド生成部132は、入力画像と、この入力画像に対して画像縮小処理を行ったものと、で画像ピラミッドを構成するものとしたが、これに限らない。例えば、撮像装置3と、撮像装置3より有効画素数の少ない1つ以上の撮像装置と、で同じ画像を取得すると、同一の画像であって解像度の異なる画像を取得することができる。そこで、これら撮像装置3および撮像装置3により同一の画像で解像度の異なる画像を取得し、これら画像で画像ピラミッドを構成するものとしてもよい。
【0137】
また、上述の実施形態では、画像ピラミッドを生成するものとしたが、これに限らず、画像ピラミッドを生成しないものとしてもよい。
【0138】
また、上述の実施形態では、「Nb」の値を、画像ピラミッドのレベルが低くなるに従って大きくするものとしたが、これに限らず、画像ピラミッドのレベルによらず一定にしてもよい。また、「Ns」の値も、画像ピラミッドのレベルが低くなるに従って大きくするものとしてもよい。
【符号の説明】
【0139】
1・・・姿勢パラメータ推定装置
2・・・サーバ
21・・・画像ピラミッド生成部
22・・・特徴点登録部
23・・・特徴点記憶部
3・・・撮像装置
4・・・表示装置
5・・・付加情報記憶部
11・・・対象物識別部
12・・・初期姿勢パラメータ推定部
13・・・姿勢パラメータ追跡部
131・・・姿勢パラメータ予測部
132・・・画像ピラミッド生成部
133・・・特徴点選択部
134・・・特徴点追跡部
135・・・姿勢パラメータ更新部
100・・・ARシステム
AA・・・姿勢パラメータ推定システム
図1
図2
図3
図4
図5
図6