IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許-三次元形状推定装置及びプログラム 図1
  • 特許-三次元形状推定装置及びプログラム 図2
  • 特許-三次元形状推定装置及びプログラム 図3
  • 特許-三次元形状推定装置及びプログラム 図4
  • 特許-三次元形状推定装置及びプログラム 図5
  • 特許-三次元形状推定装置及びプログラム 図6
  • 特許-三次元形状推定装置及びプログラム 図7
  • 特許-三次元形状推定装置及びプログラム 図8
  • 特許-三次元形状推定装置及びプログラム 図9
  • 特許-三次元形状推定装置及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-09
(45)【発行日】2024-07-18
(54)【発明の名称】三次元形状推定装置及びプログラム
(51)【国際特許分類】
   G06T 7/564 20170101AFI20240710BHJP
【FI】
G06T7/564
【請求項の数】 5
(21)【出願番号】P 2020143049
(22)【出願日】2020-08-26
(65)【公開番号】P2022038503
(43)【公開日】2022-03-10
【審査請求日】2023-07-03
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100121119
【弁理士】
【氏名又は名称】花村 泰伸
(72)【発明者】
【氏名】三須 俊枝
(72)【発明者】
【氏名】三ツ峰 秀樹
(72)【発明者】
【氏名】洗井 淳
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開2010-152535(JP,A)
【文献】特開2015-053006(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01B 11/00-11/30
G06T 7/00- 7/90
G06V 10/00-20/90
(57)【特許請求の範囲】
【請求項1】
計測対象の三次元形状を点群モデルにて推定する三次元形状推定装置において、
前記計測対象の三次元の位置情報を含む複数の仮説を生成し、前記複数の仮説を再標本化することで、前記三次元形状を推定する推定部と、
カメラにより撮影された前記計測対象の画像をそれぞれ入力し、前記画像に基づいて、前記複数の仮説に対応する複数の尤度をそれぞれ演算する複数の観測部と、を備え、
前記推定部は、
前記複数の観測部により生成された前記観測部毎の前記複数の尤度に基づき、前記複数の仮説のそれぞれを複製、削除または保持することで、前記複数の仮説を再標本化し、再標本化された前記複数の仮説に基づいて、点群の前記三次元形状を推定して出力する再標本化部を備え、
前記複数の観測部のそれぞれは、
前記再標本化部により再標本化された前記複数の仮説を、当該観測部に対応する前記画像の座標に投影し、投影像を生成する投影部と、
当該観測部に対応する前記画像から前記計測対象のシルエットを抽出し、シルエット画像を生成するシルエット抽出部と、
前記投影部により生成された前記投影像と、前記シルエット抽出部により生成された前記シルエット画像とに基づいて、前記複数の仮説に対応する前記複数の尤度を演算する尤度演算部と、を備えたことを特徴とする三次元形状推定装置。
【請求項2】
請求項1に記載の三次元形状推定装置において、
前記推定部は、
さらに、前記再標本化部により再標本化された前記複数の仮説に対し、所定の運動モデルに従って所定の時間変化分の予測を行うことで、前記複数の仮説を更新する予測部を備え、
前記複数の観測部のそれぞれに備えた前記投影部は、
前記再標本化部により再標本化された前記複数の仮説、または前記予測部により更新された前記複数の仮説を、当該観測部に対応する前記画像の前記座標に投影し、前記投影像を生成する、ことを特徴とする三次元形状推定装置。
【請求項3】
請求項2に記載の三次元形状推定装置において、
前記推定部は、
さらに、所定の確率密度関数からの標本抽出により、前記複数の仮説を生成する初期化部を備え、
前記複数の観測部のそれぞれに備えた前記投影部は、
前記初期化部により生成された前記複数の仮説、前記再標本化部により再標本化された前記複数の仮説、または前記予測部により更新された前記複数の仮説を、当該観測部に対応する前記画像の前記座標に投影し、前記投影像を生成する、ことを特徴とする三次元形状推定装置。
【請求項4】
請求項1から3までのいずれか一項に記載の三次元形状推定装置において、
前記複数の観測部のそれぞれに備えた前記尤度演算部は、
前記投影像が前記シルエット画像の内部及び外部のいずれに存在するか、及び、前記投影像から前記シルエット画像における前記シルエットの有無の境界線までの間の距離に応じて、前記複数の仮説に対応する前記複数の尤度を演算する、ことを特徴とする三次元形状推定装置。
【請求項5】
コンピュータを、請求項1から4までのいずれか一項に記載の三次元形状推定装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、計測対象の三次元形状を推定する装置及びプログラム技術に関し、特に、三次元形状を点群モデルにて推定する技術に関する。
【背景技術】
【0002】
従来、計測対象の三次元形状を推定する技術として、メタボール表現による三次元形状を、視体積交差法及び逐次モンテカルロ法を用いて推定する三次元形状推定装置が知られている(例えば、特許文献1を参照)。
【0003】
この三次元形状推定装置は、複数の入力画像から計測対象のシルエットをそれぞれ抽出し、探索領域に所定数のパーティクルを生成し、複数のシルエットに基づいてパーティクルの重み係数を変更する。そして、三次元形状推定装置は、パーティクルの重み係数に基づいてパーティクルを再サンプリングし、再サンプリングされたパーティクルの状態ベクトルを遷移させ、所定数のパーティクルからメタボール表現の三次元形状を生成する。
【0004】
また、計測対象の三次元形状を推定する技術として、点群表現による三次元形状を、ステレオ法を用いて推定する手法も知られており、センサにより計測対象との間の距離を測定することで、三次元形状を推定する手法もある。
【先行技術文献】
【特許文献】
【0005】
【文献】特許第4690971号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、前述の特許文献1の三次元形状推定装置では、メタボール表現により三次元形状を推定するため、細かな表面形状の記述が難しいという問題があった。
【0007】
この問題を解決するために、点群表現により三次元形状を推定する手法を用いることが想定される。しかし、前述のステレオ法を用いて点群表現により三次元形状を推定する手法では、演算コストが高くなり、処理速度が遅くなってしまう。また、前述の距離を測定するセンサを用いる手法では、センサが必要であるため、部品コストが高くなってしまう。
【0008】
従来、点群表現により三次元形状を推定する際に、これらの問題を解決するための新たな手法が所望されていた。
【0009】
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、点群表現による三次元形状の推定を低負荷にて実現可能な三次元形状推定装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0010】
前記課題を解決するために、請求項1の三次元形状推定装置は、計測対象の三次元形状を点群モデルにて推定する三次元形状推定装置において、前記計測対象の三次元の位置情報を含む複数の仮説を生成し、前記複数の仮説を再標本化することで、前記三次元形状を推定する推定部と、カメラにより撮影された前記計測対象の画像をそれぞれ入力し、前記画像に基づいて、前記複数の仮説に対応する複数の尤度をそれぞれ演算する複数の観測部と、を備え、前記推定部が、前記複数の観測部により生成された前記観測部毎の前記複数の尤度に基づき、前記複数の仮説のそれぞれを複製、削除または保持することで、前記複数の仮説を再標本化し、再標本化された前記複数の仮説に基づいて、点群の前記三次元形状を推定して出力する再標本化部を備え、前記複数の観測部のそれぞれが、前記再標本化部により再標本化された前記複数の仮説を、当該観測部に対応する前記画像の座標に投影し、投影像を生成する投影部と、当該観測部に対応する前記画像から前記計測対象のシルエットを抽出し、シルエット画像を生成するシルエット抽出部と、前記投影部により生成された前記投影像と、前記シルエット抽出部により生成された前記シルエット画像とに基づいて、前記複数の仮説に対応する前記複数の尤度を演算する尤度演算部と、を備えたことを特徴とする。
【0011】
請求項1の発明によれば、推定部及び観測部の連係動作により、計測対象の三次元形状をなす点群を得ることができる。
【0012】
また、請求項2の三次元形状推定装置は、請求項1に記載の三次元形状推定装置において、前記推定部が、さらに、前記再標本化部により再標本化された前記複数の仮説に対し、所定の運動モデルに従って所定の時間変化分の予測を行うことで、前記複数の仮説を更新する予測部を備え、前記複数の観測部のそれぞれに備えた前記投影部が、前記再標本化部により再標本化された前記複数の仮説、または前記予測部により更新された前記複数の仮説を、当該観測部に対応する前記画像の前記座標に投影し、前記投影像を生成する、ことを特徴とする。
【0013】
請求項2の発明によれば、時々刻々と移動または変形する計測対象に追随して、計測対象の三次元形状をなす点群を得ることができる。
【0014】
また、請求項3の三次元形状推定装置は、請求項2に記載の三次元形状推定装置において、前記推定部が、さらに、所定の確率密度関数からの標本抽出により、前記複数の仮説を生成する初期化部を備え、前記複数の観測部のそれぞれに備えた前記投影部が、前記初期化部により生成された前記複数の仮説、前記再標本化部により再標本化された前記複数の仮説、または前記予測部により更新された前記複数の仮説を、当該観測部に対応する前記画像の前記座標に投影し、前記投影像を生成する、ことを特徴とする。
【0015】
請求項3の発明によれば、計測対象が存在する位置を適切に反映した確率密度関数を用いることで、効率的に精度の高い三次元形状をなす点群を得ることができる。
【0016】
また、請求項4の三次元形状推定装置は、請求項1から3までのいずれか一項に記載の三次元形状推定装置において、前記複数の観測部のそれぞれに備えた前記尤度演算部が、前記投影像が前記シルエット画像の内部及び外部のいずれに存在するか、及び、前記投影像から前記シルエット画像における前記シルエットの有無の境界線までの間の距離に応じて、前記複数の仮説に対応する前記複数の尤度を演算する、ことを特徴とする。
【0017】
請求項4の発明によれば、計測対象の点群を、当該計測対象の表面及びその内側に局在させた分布とすることができる。これにより、少ない点群数にて精度の高い三次元形状を推定することができる。
【0018】
さらに、請求項5のプログラムは、コンピュータを、請求項1から4までのいずれか一項に記載の三次元形状推定装置として機能させることを特徴とする。
【発明の効果】
【0019】
以上のように、本発明によれば、点群表現による三次元形状の推定を低負荷にて実現することができる。
【図面の簡単な説明】
【0020】
図1】本発明の実施形態による三次元形状推定装置の構成例を示すブロック図である。
図2】推定部の構成例を示すブロック図である。
図3】推定部の処理例を示すフローチャートである。
図4】観測部の構成例を示すブロック図である。
図5】観測部の処理例を示すフローチャートである。
図6】尤度演算部33の処理例を説明する図である。
図7】第一例の動作(ブロードキャストによる動作例)を説明する図である。
図8】第二例の動作(ユニキャストによる動作例)を説明する図である。
図9】第三例の動作(マルチキャストによる動作例)を説明する図である。
図10】三次元形状推定装置から出力される点群の分布を説明する図である。
【発明を実施するための形態】
【0021】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔三次元形状推定装置〕
図1は、本発明の実施形態による三次元形状推定装置の構成例を示すブロック図である。この三次元形状推定装置1は、推定部10、複数の観測部11-1,11-2,・・・及びネットワーク12を備えている。
【0022】
複数の観測部11-1,11-2,・・・のそれぞれにおける構成及び処理は同一である。以下、複数の観測部11-1,11-2,・・・のそれぞれを総称して、観測部11という。三次元形状推定装置1が3つ以上の観測部11を備える場合は、観測部11-1と同様の観測部11-3等を追加すればよい。
【0023】
三次元形状推定装置1は、複数の仮説を用いて、計測対象の三次元形状を点群モデルにて推定する。この仮説には三次元の位置情報を含むものとし、複数の仮説に含まれる位置情報により、点群が構成されるものとする。点群は、計測対象の三次元形状を空間上の点の集合で表現したものである。
【0024】
推定部10は、点群の位置及び速度を示す仮説Xを生成し、仮説Xを、ネットワーク12を介して複数の観測部11-1,11-2,・・・のそれぞれに送信し、複数の観測部11-1,11-2,・・・のそれぞれに対し、当該仮説Xの尤度情報Mを生成させる。
【0025】
推定部10は、複数の観測部11-1,11-2,・・・からネットワーク12を介して、観測部11毎の尤度情報Mを受信し、観測部11毎の尤度情報Mに基づいて、統合した尤度情報M’を生成する。そして、推定部10は、尤度情報M’に基づいて、仮説Xを再標本化する。
【0026】
推定部10は、再標本化した仮説Xに対し、観測部11の観測時刻に応じた予測処理を行うことで、仮説Xを更新する。そして、推定部10は、更新後の仮説Xを、ネットワーク12を介して複数の観測部11-1,11-2,・・・のそれぞれに送信し、複数の観測部11-1,11-2,・・・のそれぞれに対し、当該更新後の仮説Xの尤度情報Mを生成させる。
【0027】
推定部10は、このような処理を繰り返すことで、仮説Xの精度を向上させることができ、更新後の仮説Xを点群(点群モデルの三次元形状)として外部へ出力する。推定部10の詳細については後述する。
【0028】
観測部11は、推定部10から仮説Xを受信し、仮説Xが示す点群の位置及び速度を、カメラにより撮影される画像の座標(画像座標)に投影し、投影像yk^を生成する。そして、観測部11は、投影像yk^、及びカメラにより撮影された画像から得られた計測対象のシルエット画像Sに基づき、仮説Xの投影像yk^の点群がシルエット画像S内に存在するか否かまたはその程度を示す尤度情報Mを生成する。仮説Xの投影像yk^の点群がシルエット画像S内に存在する場合、尤度は高く、仮説Xの投影像yk^の点群がシルエット画像S内に存在しない場合、尤度は低いものとする。
【0029】
観測部11は、尤度情報Mを、ネットワーク12を介して推定部10に送信する。観測部11の詳細については後述する。
【0030】
推定部10と複数の観測部11-1,11-2,・・・のそれぞれとは、ネットワーク12を介して接続される。ネットワーク12は、これに接続された構成部間においてデータの交換を行うものであり、その形態は問わない。ネットワークトポロジーも、例えば、バス型構成、星型構成、リング型構成、それらの複合形態等の任意の構成によることができる。また、ネットワーク12を介する接続は、有線であっても無線であっても構わない。例えば、ネットワーク12としてイーサーネット(登録商標)を用いることができる。
【0031】
〔推定部10〕
次に、図1に示した推定部10について詳細に説明する。図2は、推定部10の構成例を示すブロック図であり、図3は、推定部10の処理例を示すフローチャートである。
【0032】
この推定部10は、初期化部20、切換部21、仮説送信部22、仮説記憶部23、尤度受信部24、乗算部25、再標本化部26及び予測部27を備えている。
【0033】
初期化部20は、点群の位置及び速度を示す初期のK個の仮説を生成し(ステップS301)、これを仮説Xとして切換部21に出力する。Kは2以上の整数である。個々の仮説をxk としてベクトル表記する。kは、k∈{1,2,・・・,K}なる整数とする。また、全ての仮説xk のベクトル列を、X=(x1 ,x2 ,・・・,xK )とする。仮説xk の成分は、例えば以下のとおりである。
【数1】
k は、3次元位置を表す位置ベクトルであり、vk は、位置zk の1階時間微分のベクトル、すなわち速度ベクトルである。位置zk 及び速度vk の各成分を規定する座標系を、世界座標系という。
【0034】
具体的には、初期化部20は、以下の式のとおり、所定の確率密度関数(事前確率密度関数という。)p(x)からの標本抽出により、仮説xk の値を定める。
【数2】
【0035】
事前確率密度関数p(x)は、計測対象の物体の存在しそうな位置及び速度ほど、高い確率密度を有することが好ましい。例えば、計測対象が床面に立った人物であり、その身長が1.7メートルである場合を想定する。この場合、人物の位置が、床面から0乃至2.5メートル程度(挙手している状況を想定)の高さの範囲かつ水平方向には直径2メートル程度の円となるような円柱状の領域内にあり、かつ、人物の速度が、各方向について時速20キロメートル毎時以下である球体内にあるような、合計で6次元の超立体内の領域において正の確率密度値を設定し、それ以外の領域において0の確率密度値を設定した事前確率密度関数p(x)を用いることができる。
【0036】
このように、計測対象である人物が存在する位置を適切に反映した事前確率密度関数p(x)を用いることで、結果として、効率的かつ短時間に精度の高い三次元形状をなす点群を得ることができる。
【0037】
また、事前確率密度関数p(x)は、以下の式のとおり、単なる多次元正規分布であってもよい。
【数3】
【0038】
μ及びΣは、それぞれ6次元のベクトル及び6行6列の共分散行列である。例えば、μは、計測対象の置かれる領域の中心座標、Σは、計測対象の置かれる領域の広がり(大きさ)の二乗に比例して設定される。各辺2メートル程度の物体をステージ上に載せて計測する場合であって、当該ステージの中心を世界座標系の原点とする場合には、以下の式で表される。
【数4】
【0039】
また、事前確率密度関数p(x)は、多次元の切断正規分布であってもよいし、多次元の一様分布であってもよい。
【0040】
切換部21は、初期化部20から仮説Xを、後述する予測部27から仮説Xを、後述する再標本化部26から仮説Xをそれぞれ入力する。そして、切換部21は、後述する図7図9に示す第一例、第二例及び第三例の動作に応じて、これらのうちのいずれかの仮説Xを選択する。
【0041】
切換部21は、選択した仮説Xを仮説送信部22及び仮説記憶部23に出力する。仮説記憶部23は、切換部21から仮説Xを入力し、仮説Xを記憶する。
【0042】
具体的には、切換部21は、当該三次元形状推定装置1の動作の最初の時点において、初期化部20から入力した仮説Xを選択して出力する。また、切換部21は、後述する観測部11-1,11-2,・・・による処理のタイミングの時刻(後述する図7図9を参照)が変化する都度、予測部27から入力した仮説Xを選択して出力する。また、切換部21は、後述する観測部11-1,11-2,・・・による処理のタイミングの時刻が変化しない間、再標本化部26から入力した仮説Xを選択して出力する。
【0043】
尚、切換部21は、後述する観測部11-1,11-2,・・・による処理のタイミングの時刻が変化しない場合においても、予測部27から入力した仮説Xを選択して出力するようにしてもよい。いずれにしても、例えば後述する図7図9に示す第一例、第二例及び第三例の動作において、切換部21は、処理の進捗を把握しており、動作のタイミングに応じて選択処理を行う。
【0044】
仮説送信部22は、切換部21から仮説Xを入力し、仮説Xを、ネットワーク12を介して所定の観測部11に送信する(ステップS302)。例えば、後述する図7に示す第一例の場合、仮説送信部22は、仮説Xを、ブロードキャストにて全ての観測部11に送信する。また、後述する図8に示す第二例の場合、仮説送信部22は、仮説Xを、ユニキャストにて全ての観測部11に順次送信する。また、後述する図9に示す第三例の場合、仮説送信部22は、仮説Xを、マルチキャストにて観測部11に送信する。
【0045】
尤度受信部24は、観測部11からネットワーク12を介して、観測部11毎の尤度情報Mを受信し(ステップS303)、尤度情報Mを乗算部25に出力する。
【0046】
尤度情報Mは、以下の式のとおり、観測部11により生成される、仮説Xを構成する各仮説xk に対する尤度Lkの数列である。尤度Lkは0以上の実数であって、仮説xk が自らの観測情報(入力した画像)に整合する場合には高い値をとり、整合しない場合には低い値をとる。
【数5】
【0047】
乗算部25は、後述する図7に示す第一例または図9に示す第三例の場合、尤度受信部24から観測部11毎の尤度情報Mを入力する。そして、乗算部25は、観測部11毎の尤度情報M(を構成する尤度Lk)を乗算することで、これらの尤度情報Mを統合し、尤度情報M’を求める(ステップS304)。そして、乗算部25は、尤度情報M’を再標本化部26に出力する。
【0048】
また、乗算部25は、後述する図8に示す第二例の場合、乗算処理を行うことなく、入力した尤度情報Mを尤度情報M’としてそのまま再標本化部26に出力する
【0049】
再標本化部26は、乗算部25から尤度情報M’を入力すると共に、仮説記憶部23から仮説Xを読み出す。そして、再標本化部26は、尤度情報M’を構成する各尤度Lkの値に比例する標本数となるように、仮説Xを構成する各仮説xk を複製、削除または維持する(再選択する)ことで、仮説Xを再標本化し、再標本化後の新たな仮説Xを求める(ステップS305)。再標本化部26は、新たな仮説Xを切換部21及び予測部27に出力する。
【0050】
また、再標本化部26は、適宜のタイミングにおいて、新たな仮説Xまたは仮説記憶部23から読み出した仮説Xから、仮説Xを構成する各仮説xk の位置成分である位置zk を抽出し、抽出した位置成分の情報を点群として外部へ出力する(ステップS306)。これにより、計測対象の三次元形状をなす点群を得ることができる。
【0051】
例えば、仮説Xを構成する各仮説xk が、x1 =a,x2 =b,x3 =c,x4 =d,x5 =e,・・・であり、当該仮説Xの尤度情報Mを構成する各尤度Lkにおいて、尤度L2が最も高く、尤度L3が最も低いものとする。a,b,c,d,eは、それぞれ所定の位置成分及び速度成分からなるものとする。
【0052】
ここで、再標本化部26により、仮説Xを構成する全ての仮説xk の数Kにおいて、尤度LKの値に比例する標本数となるように、仮説Xを構成する各仮説xk が再標本化される。再標本化後の新たな仮説Xとしては、例えば、x1 =a,x2 =b,x3 =b,x4 =b,x5 =d,・・・が生成される。この例では、尤度L2の値が高いため、尤度L2に対応する仮説x2 =bが複製され、その標本数が多くなり、尤度L3の値が低いため、尤度L3に対応する仮説x3 =cが削除され、その標本数が少なくなる。
【0053】
尚、仮説Xを構成する各仮説xk の数Kは、再標本化によって変化しないようにしてもよいし、変化させるようにしてもよい。
【0054】
以下、具体例を用いて説明する。再標本化部26は、まず、尤度情報Mを構成する各尤度LKを用いて、以下の式により、累積尤度akを求める。
【数6】
【0055】
再標本化部26は、0以上aK未満の一様乱数(rk~U[0,aK))をK回発生し、k回目の値をrkとする。
【0056】
再標本化部26は、以下の式により、k番目の新たな仮説xk →(new)を求める。
【数7】
【0057】
前記式(7)は、s.t.以降に示す条件を満たすqを求め、q番目の仮説xqを、k番目の新たな仮説xk →(new)とすることを示している。
【0058】
再標本化部26は、以下の式のとおり、新たな仮説xk →(new)を仮説xk とする。
【数8】
【0059】
このようにして、再標本化後の各仮説xk により構成される仮説Xが得られる。
【0060】
予測部27は、再標本化部26から仮説Xを入力し、観測部11の観測時刻に応じて、当該観測時刻の時間変化分Δt≧0の予測処理を行うことで、仮説Xを更新し(ステップS307)、更新後の仮説Xを切換部21に出力する。つまり、予測部27は、仮説Xの位置成分及び速度成分の値を動かし(変化させ)、そして、これらの値を分散させる。
【0061】
切換部21は、予測部27から仮説Xを入力し、当該仮説Xを選択して仮説送信部22に出力し、仮説送信部22は、切換部21から仮説Xを入力し、仮説Xを、ネットワーク12を介して所定の観測部11に送信する(ステップS308)。
【0062】
予測部27は、例えば以下の式のとおり、予測処理を行うことで仮説Xを更新する。
【数9】
この予測処理により、等速直線運動モデルによる位置及び速度の予測が行われる。前記式(9)において、右辺の第一項が仮説Xの位置成分及び速度成分の値を動かす項であり、第二項がこれらの値を分散させる項である。
【0063】
ここで、nは、平均0及び共分散行列Σdのノイズである。共分散行列Σdは、例えば以下の対角行列で表される。
【数10】
σ1~σ6は、0以上の実数である。
【0064】
また、予測部27は、例えば以下の式のとおり、予測処理を行うことで仮説Xを更新する。
【数11】
【0065】
λは、予め設定されるパラメータであり、0≦λ≦1の実数である。この予測処理により、λ=1の場合、等速直線運動モデルによる位置及び速度の予測が行われる。また、λ=0の場合、ランダムウォークモデルと等価のモデルによる位置及び速度の予測が行われる。また、0<λ<1の場合、速度が時々刻々減衰するモデル(速度に対するSinger(シンガー)モデルと等価のモデル)による位置及び速度の予測が行われる。
【0066】
予測部27により更新された仮説Xを用いることにより、観測部11において当該仮説Xの尤度情報Mを演算することができ、結果として、再標本化部26において、時々刻々と移動または変形する計測対象に追随した三次元形状の点群を得ることができる。
【0067】
このように、推定部10は、仮説Xを観測部11に送信し、観測部11から仮説Xの尤度情報Mを受信し、尤度情報Mに基づいて仮説Xを再標本化し、予測処理により仮説Xを更新する一連の処理を繰り返す。これにより、仮説Xの精度を向上させることができ、点群モデルの三次元形状を精度高く推定することができる。
【0068】
〔観測部11〕
次に、図1に示した観測部11について詳細に説明する。図4は、観測部11の構成例を示すブロック図であり、図5は、観測部11の処理例を示すフローチャートである。
【0069】
この観測部11は、仮説受信部30、投影部31、シルエット抽出部32、尤度演算部33及び尤度送信部34を備えている。
【0070】
仮説受信部30は、推定部10からネットワーク12を介して、仮説Xを受信し(ステップS501)、仮説Xを投影部31に出力する。
【0071】
投影部31は、仮説受信部30から仮説Xを入力すると共に、シルエット抽出部32に入力される画像が撮像されたカメラの位置、画角、姿勢情報からなるカメラパラメータを入力する。
【0072】
投影部31は、以下の式のとおり、世界座標系の仮説Xを構成する各仮説xk の位置zk に基づいて、これらの位置情報をカメラパラメータに従ってカメラ座標系の画像座標に投影し、投影像yk^を生成する(ステップS502)。投影部31は、仮説Xを構成する各仮説xk に対応する各投影像yk^からなる投影像y^を、尤度演算部33に出力する。
【数12】
【0073】
R,c,fはカメラパラメータである。Rは、世界座標系における任意のベクトルをカメラ座標系に変換する回転行列であり、cは、世界座標系におけるカメラの光学主点の位置であり、fは、カメラのレンズの焦点距離である。尚、カメラ座標系の第3成分の軸方向は、カメラのレンズ光軸と平行であり、計測対象へ向かう方向を正とする。
【0074】
シルエット抽出部32は、カメラにより撮影された画像を入力し、画像から計測対象のシルエットを抽出し、計測対象領域及びそれ以外を区分した画像(典型的には2値画像)であるシルエット画像Sを生成する(ステップS503)。そして、シルエット抽出部32は、シルエット画像Sを尤度演算部33に出力する。
【0075】
画像位置yにおけるシルエット画像Sの画素値をS(y)とする。例えば、シルエット画像Sは、計測対象領域内の画像位置yに対してS(y)=1が設定され、それ以外の画像位置yに対してS(y)=0が設定される。
【0076】
シルエット抽出部32は、例えば、クロマキーによってシルエット画像Sを生成する。この場合、シルエット抽出部32は、計測対象の背景に特定の色(青、緑等)を用い、背景色であるか否かに応じてシルエット画像Sを求める。
【0077】
また、シルエット抽出部32は、背景差分法による被写体抽出法、人工知能による被写体抽出法を用いるようにしてもよい。
【0078】
尤度演算部33は、投影部31から投影像y^を入力すると共に、シルエット抽出部32からシルエット画像Sを入力する。そして、尤度演算部33は、投影像y^を構成する各投影像yk^の点群がシルエット画像S内に存在するか否か、またはその程度を示す尤度情報Mを演算し(ステップS504)、尤度情報Mを尤度送信部34に出力する。
【0079】
尤度演算部33は、例えば以下の式により、投影像y^を構成する各投影像yk^がシルエット画像Sの内部に存在するか、または外部に存在するかのシルエットの内外判定を行い、内外判定結果を反映した各尤度Lkから構成される尤度情報Mを生成する。
【数13】
【0080】
また、尤度演算部33は、例えば以下の式により、投影像y^がシルエット画像Sの内部及び外部のいずれに存在するか、及び、投影像y^からシルエット画像Sにおけるシルエットの有無の境界線までの間の距離dに応じて、尤度情報Mを生成する。
【数14】
関数gは、値域が0以上の広義単調減少関数とする。
【0081】
具体的には、尤度演算部33は、投影像y^を構成する各投影像yk^がシルエット画像Sの内部及び外部のいずれに存在するかを判定し、投影像yk^がシルエット画像Sの外部に存在する場合、尤度Lk=0とする。一方、尤度演算部33は、投影像yk^がシルエット画像Sの内部に存在する場合、当該投影像yk^と再近傍のシルエット境界(S(y)=1から0に変化する箇所)との間の距離dを算出し、距離dに応じた尤度Lk=g(d)を求める。この場合、尤度演算部33は、距離dが長ければ長いほど低い尤度となり、距離dが短ければ短いほど高い尤度となるように、尤度Lkを求める。
【0082】
これにより、推定部10の再標本化部26において、計測対象の点群を、当該計測対象の表面及びその内側に局在させた分布とすることができ、少ない点群数にて精度の高い三次元形状を推定することができる。
【0083】
図6は、尤度演算部33の処理例を説明する図であり、前記式(14)により距離dが算出される例を示している。仮説Xに含まれる仮説xk の点について、投影部31により画像座標に投影され、投影像yk^の点が生成される。そして、投影像yk^の点と、再近傍のシルエット境界(S(y)=1から0に変化する箇所)の点との間の距離dが算出される。尚、投影像yk^の点から右斜め下へ延びた矢印の先に、カメラの視点があるものとする。
【0084】
このように、前記式(14)を用いることにより、投影像yk^がシルエット画像Sの内部に存在し、かつシルエット境界に近いほど、高い尤度Lkが算出される。そして、推定部10の再標本化部26において、尤度Lkが高いほど、当該尤度Lkに対応する仮説xk が複製され易くなるため、シルエット画像Sの内部かつシルエット境界付近に存在する投影像yk^の数が増加する。つまり、カメラの視点とシルエット境界とを結ぶ錐状の領域に仮説xk が集中するようになる。
【0085】
図4及び図5に戻って、尤度送信部34は、尤度演算部33から尤度情報Mを入力し、尤度情報Mを、ネットワーク12を介して推定部10に送信する(ステップS505)。
【0086】
尚、好ましくは、観測部11は、他の観測部11とは異なる設置位置のカメラによる画像及びカメラパラメータを用いる。これにより、推定部10及び複数の観測部11の処理を繰り返すことにより、仮説Xの精度を向上させることができ、点群モデルの三次元形状を精度高く推定することができる。
【0087】
〔第一例の動作〕
次に、図1に示した三次元形状推定装置1の第一例の動作について説明する。第一例は、推定部10が仮説Xをブロードキャストにて全ての観測部11に送信する例である。
【0088】
図7は、第一例の動作(ブロードキャストによる動作例)を説明する図である。この第一例における三次元形状推定装置1は、推定部10及び2つの観測部11-1,11-2を備えている。
【0089】
推定部10は、初期化した仮説X1を、ブロードキャストにて観測部11-1,11-2に送信する(ステップS701)。観測部11-1は、推定部10から仮説X1を受信し、画像及び仮説X1に基づいて尤度情報M1-1を求め、尤度情報M1-1を推定部10に送信する(ステップS702)。観測部11-2は、推定部10から仮説X1を受信し、画像及び仮説X1に基づいて尤度情報M1-2を求め、尤度情報M1-2を推定部10に送信する(ステップS703)。
【0090】
推定部10は、観測部11-1から尤度情報M1-1を受信し、観測部11-2から尤度情報M1-2を受信すると、尤度情報M1-1,M1-2を乗算することで統合し、尤度情報M1’を求める(ステップS704)。そして、推定部10は、尤度情報M1’に基づいて仮説X1を再標本化し、新たな仮説X1’を求め、仮説X1’から位置情報を抽出して点群を外部に出力する(ステップS705)。
【0091】
推定部10は、時刻0(観測時刻)の時間変化分Δtの予測処理を行うことで仮説X1’を更新し、新たな仮説X2を求め、仮説X2を、ブロードキャストにて観測部11-1,11-2に送信する(ステップS706)。
【0092】
以降、観測部11-1,11-2は、ステップS702,S703と同様の処理を行い、尤度情報M2-1,M2-2を推定部10に送信する(ステップS707,S708)。そして、推定部10は、ステップS704~S706と同様に、乗算による統合処理を行い(ステップS709)、再標標本化を行い(ステップS710)、予測処理を行い、仮説X3を、ブロードキャストにて観測部11-1,11-2に送信する(ステップS711)。観測時刻は、ステップS701~S705において時刻0であり、ステップS706~S710において時刻1であり、ステップS711等において時刻2である。
【0093】
このように、仮説Xは、ブロードキャストにて全ての観測部11-1,11-2に送信され、全ての観測部11-1,11-2により生成された尤度情報Mは、統合され再標本化に用いられ、新たな仮説Xが求められる。そして、新たな仮説Xの予測処理が行われ、予測処理後の仮説Xは、ブロードキャストにて全ての観測部11-1,11-2に送信される。
【0094】
これにより、観測部11毎の送信処理が不要になるから、処理の高速化及び効率化を実現することができると共に、仮説Xの精度を向上させることができる。
【0095】
〔第二例の動作〕
次に、図1に示した三次元形状推定装置1の第二例の動作について説明する。第二例は、推定部10が仮説Xをユニキャストにて全ての観測部11に順次送信する例である。
【0096】
図8は、第二例の動作(ユニキャストによる動作例)を説明する図である。この第二例における三次元形状推定装置1は、推定部10及び2つの観測部11-1,11-2を備えている。
【0097】
推定部10は、初期化した仮説X1を、ユニキャストにて観測部11-1に送信する(ステップS801)。観測部11-1は、推定部10から仮説X1を受信し、画像及び仮説X1に基づいて尤度情報M1を求め、尤度情報M1を推定部10に送信する(ステップS802)。
【0098】
推定部10は、観測部11-1から尤度情報M1を受信し、尤度情報M1に基づいて仮説X1を再標本化し、新たな仮説X2を、ユニキャストにて観測部11-2に送信する(ステップS803)。観測部11-2は、推定部10から仮説X2を受信し、画像及び仮説X2に基づいて尤度情報M2を求め、尤度情報M2を推定部10に送信する(ステップS804)。
【0099】
推定部10は、観測部11-2から尤度情報M2を受信し、尤度情報M2に基づいて仮説X2を再標本化し、新たな仮説X2’を求め、仮説X2’から位置情報を抽出して点群を外部に出力する(ステップS805)。
【0100】
推定部10は、時刻0(観測時刻)の時間変化分Δtの予測処理を行うことで仮説X2’を更新し、新たな仮説X3を求め、仮説X3を、ユニキャストにて観測部11-1に送信する(ステップS806)。
【0101】
以降、観測部11-1,11-2は、ステップS802,S804と同様の処理を行い尤度情報M3,M4を推定部10に送信する(ステップS807,S809)。また、推定部10は、ステップS803,S805,S806と同様に、再標本化を行い、仮説X4を、ユニキャストにて観測部11-2に送信し(ステップS808)、再標本化を行い(ステップS810)、予測処理を行う(ステップS811)。観測時刻は、ステップS801~S805において時刻0であり、ステップS806~S810において時刻1であり、ステップS811等において時刻2である。
【0102】
このように、仮説Xは、ユニキャストにて観測部11-1に送信され、観測部11-1により生成された尤度情報Mは、再標本化に用いられ新たな仮説Xが求められる。そして、新たな仮説Xは、ユニキャストにて観測部11-2に送信され、観測部11-2により生成された尤度情報Mは、再標本化に用いられ新たな仮説Xが求められる。この観測部11-1,11-2との間の一連の処理が完了した後、予測処理により新たな仮説Xが更新される。そして、前述の一連の処理が繰り返し行われる。
【0103】
これにより、推定部10及び観測部11-1、並びに推定部10及び観測部11-2において、1対1の送受信が順番に行われる。このため、ネットワーク12の輻輳の発生を抑えることができると共に、仮説Xの精度を向上させることができる。
【0104】
〔第三例の動作〕
次に、図1に示した三次元形状推定装置1の第三例の動作について説明する。第三例は、推定部10が仮説Xをマルチキャストにて観測部11に送信する例である。
【0105】
図9は、第三例の動作(マルチキャストによる動作例)を説明する図である。この第三例における三次元形状推定装置1は、推定部10及び4つの観測部11-1,11-2,11-3,11-4を備えている。
【0106】
推定部10は、初期化した仮説X1を、マルチキャストにて観測部11-1,11-2に送信する(ステップS901)。観測部11-1,11-2は、推定部10から仮説X1を受信し、画像及び仮説X1に基づいて尤度情報M1-1,M1-2をそれぞれ求め、尤度情報M1-1,M1-2を推定部10にそれぞれ送信する(ステップS902,S903)。
【0107】
推定部10は、観測部11-1から尤度情報M1-1を受信し、観測部11-2から尤度情報M1-2を受信すると、尤度情報M1-1,M1-2を乗算することで統合し、尤度情報M1’を求める(ステップS904)。
【0108】
推定部10は、尤度情報M1’に基づいて仮説X1を再標本化し、新たな仮説X2を求め、仮説X2を、マルチキャストにて観測部11-3,11-4に送信する(ステップS905)。観測部11-3,11-4は、推定部10から仮説X2を受信し、画像及び仮説X2に基づいて尤度情報M2-1,M2-2をそれぞれ求め、尤度情報M2-1,M2-2を推定部10にそれぞれ送信する(ステップS906,S907)。
【0109】
推定部10は、観測部11-3から尤度情報M2-1を受信し、観測部11-4から尤度情報M2-2を受信すると、尤度情報M2-1,M2-2を乗算することで統合し、尤度情報M2’を求める(ステップS908)。そして、推定部10は、尤度情報M2’に基づいて仮説X2を再標本化し、新たな仮説X2’を求め、仮説X2’から位置情報を抽出して点群を外部に出力する(ステップS909)。
【0110】
推定部10は、時刻0(観測時刻)の時間変化分Δtの予測処理を行うことで仮説X2’を更新し、新たな仮説X3を求め、仮説X3を、マルチキャストにて観測部11-1,11-2に送信する(ステップS910)。
【0111】
以降、観測部11-1,11-2,11-3,11-4は、ステップS902,S903,S906,S907と同様の処理を行い、尤度情報M3-1,M3-2,M4-1,M4-2を推定部10に送信する(ステップS911,S912,S915,S916)。また、推定部10は、ステップS904,S905,S908~S910と同様に、乗算による統合処理を行い(ステップS913)、再標本化を行い、仮説X4を、マルチキャストにて観測部11-3,11-4に送信し(ステップS914)、乗算による統合処理を行い(ステップS917)、再標本化を行い(ステップS918)、予測処理を行う(ステップS919)。観測時刻は、ステップS901~S909において時刻0であり、ステップS910~S918において時刻1であり、ステップS919等において時刻2である。
【0112】
このように、仮説Xは、マルチキャストにて観測部11-1,11-2に送信され、観測部11-1,11-2により生成された尤度情報Mは、統合され再標本化に用いられ新たな仮説Xが求められる。そして、新たな仮説Xは、マルチキャストにて観測部11-3,11-4に送信され、観測部11-3,11-4により生成された尤度情報Mは、統合され再標本化に用いられ新たな仮説Xが求められる。この観測部11-1,11-2,11-3,11-4との間の一連の処理が完了した後、予測処理により新たな仮説Xが更新される。そして、前述の一連の処理が繰り返し行われる。
【0113】
これにより、推定部10と観測部11-1,11-2との間の送受信処理、及び推定部10と観測部11-3,11-4との間の送受信処理が順番に行われ、観測部11毎の送信処理が不要になる。このため、処理の高速化及び効率化を実現し、ネットワーク12における輻輳の発生を抑えることができ、バランスのとれた動作を実現すると共に、仮説Xの精度を向上させることができる。
【0114】
図10は、三次元形状推定装置1から出力される点群の分布を説明する図である。図10の左側に示した4枚の画像は、観測部11-1,11-2,11-3,11-4によりそれぞれ生成された、計測対象が人物である場合のシルエット画像S1,S2,S3,S4である。
【0115】
図10(a)は、推定部10の初期化処理により生成された仮説Xにおいて、位置情報の点群を示す。点群は、世界座標系における所定領域の全体に点在した分布となっている。
【0116】
図10(b)は、時刻1において、観測部11-1,11-2,11-3,11-4にて観測処理が行われ、推定部10の再標本化処理により生成された仮説Xの点群を示す。
【0117】
同様に、図10(c)(d)(e)は、それぞれ時刻2,5,10において、推定部10にて予測処理が行われ、観測部11-1,11-2,11-3,11-4にて観測処理が行われ、推定部10の再標本化処理により生成された仮説Xの点群を示す。
【0118】
図10(b)~(e)から、前述の処理が繰り返されることで、仮説Xの精度が向上し、人物の三次元形状が点群モデルにて精度高く推定できることがわかる。
【0119】
以上のように、本発明の実施形態による三次元形状推定装置1によれば、推定部10は、仮説Xを生成し、仮説Xを観測部11-1,11-2,・・・に送信し、観測部11-1,11-2,・・・に対し、仮説Xの尤度情報Mを生成させる。
【0120】
推定部10は、観測部11-1,11-2,・・・から観測部11毎の尤度情報Mを受信し、観測部11毎の尤度情報Mを乗算して尤度情報M’を生成する。そして、推定部10は、尤度情報M’の値に比例する標本数となるように、仮説Xを再標本化する。
【0121】
推定部10は、再標本化した仮説Xに対し、観測部11の観測時刻に応じた予測処理を行い、仮説Xを更新する。そして、推定部10は、更新後の仮説Xを観測部11-1,11-2,・・・に送信する。
【0122】
観測部11は、推定部10から仮説Xを受信し、仮説Xを画像座標に投影し、投影像yk^を生成する。そして、観測部11は、投影像yk^及び計測対象のシルエット画像Sに基づき、尤度情報Mを生成する。観測部11は、尤度情報Mを推定部10に送信する。
【0123】
このような処理を繰り返すことで、仮説Xの精度を向上させることができ、更新後の仮説Xの位置情報を抽出することで、点群モデルにて計測対象の三次元形状を精度高く推定することができる。
【0124】
仮説Xを再標本化するために用いる尤度情報Mは、投影像yk^の点群がシルエット画像S内に存在するか否かまたはその程度に従って生成されるため、一種の視体積交差法であるといえる。つまり、本発明の実施形態では、点群表現により計測対象の三次元形状を推定する際に、視体積交差法を用いるようにした。このため、ステレオ法に比べて演算コストを下げることができ、処理負荷を低減することができる。
【0125】
したがって、点群表現による三次元形状の推定を低負荷にて実現することができる。また、三次元形状を推定する際に、センサ等の特別な部材を必要としないから、部品コストを下げることができる。
【0126】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。
【0127】
例えば、前記実施形態において、図2に示した推定部10は、予測部27を備えているが、予測部27を備えていなくてもよい。この場合、三次元形状推定装置1は、動きのない計測対象の三次元形状をなす点群を得ることができる。
【0128】
また、前記実施形態において、図4に示した観測部11は、シルエット抽出部32を備えているが、シルエット抽出部32を備えていなくてもよい。この場合、観測部11の尤度演算部33は、カメラにより撮影された計測対象のシルエット画像Sを直接入力する。
【0129】
また、前記実施形態において、図7に示した第一例及び図8に示した第二例は、三次元形状推定装置1が2つの観測部11を備えた例であり、図9に示した第三例は、4つの観測部11を備えた例であるが、本発明は、観測部11の数を限定するものではない。
【0130】
尚、本発明の実施形態による三次元形状推定装置1のハードウェア構成としては、通常のコンピュータを使用することができる。三次元形状推定装置1は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
【0131】
三次元形状推定装置1に備えた推定部10及び観測部11-1,11-2,・・・の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0132】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
【符号の説明】
【0133】
1 三次元形状推定装置
10 推定部
11 観測部
12 ネットワーク
20 初期化部
21 切換部
22 仮説送信部
23 仮説記憶部
24 尤度受信部
25 乗算部
26 再標本化部
27 予測部
30 仮説受信部
31 投影部
32 シルエット抽出部
33 尤度演算部
34 尤度送信部
X,xk 仮説
M 尤度情報
y^,yk^ 投影像
S シルエット画像
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10