(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0016】
以下、本発明の各実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の手段及び処理には同一の符号を付し、説明を省略した。
【0017】
(第1実施形態)
[立体画像表示システムの概略]
図1を参照し、本発明の第1実施形態に係る立体画像表示システム1の概略について、説明する。
図1に示すように、立体画像表示システム1は、IP方式で立体画像(要素画像群)を表示するものであり、被写体画像取得装置10と、要素画像群生成装置20と、IP立体画像表示装置30と、を備える。
【0018】
被写体画像取得装置10は、被写体を撮影した被写体画像を取得するものであり、撮影手段11と、画像記憶手段13とを備える。
撮影手段11は、被写体を撮影する一般的なカメラである。本実施形態では、撮影手段11は、1台のカメラで構成されている。
画像記憶手段13は、撮影手段11が撮影した被写体画像を記憶するものであり、例えば、SSD(Solid State Drive)、HDD(Hard Disk Drive)、メモリ等の記憶媒体である。
【0019】
要素画像群生成装置20は、IP立体画像表示装置30で表示する立体画像を生成するものである。本実施形態では、要素画像群生成装置20は、処理時間を短縮するため、テクスチャのない3次元モデル、及び、3次元モデルから生成した第1要素画像群を予め記憶しておく。そして、要素画像群生成装置20は、被写体画像取得装置10の被写体画像から、被写体に最も類似する3次元モデルを選択する。さらに、要素画像群生成装置20は、被写体画像取得装置10の被写体画像を用いて、選択した3次元モデルを表した第1要素画像群に被写体のテクスチャを貼り付ける。
なお、要素画像群生成装置20の構成は、後記する。
【0020】
IP立体画像表示装置30は、要素画像群生成装置20が生成した立体画像を表示するものである。IP立体画像表示装置30は、一般的なIP方式の表示装置であり、例えば、図示を省略したレンズアレイと、表示素子とを備える。
【0021】
[要素画像群生成装置の構成]
以下、要素画像群生成装置20の構成について説明する。
要素画像群生成装置20は、被写体画像入力手段21と、データベース22と、特徴量算出手段23と、3次元モデル選択手段24と、第1要素画像群選択手段25と、テクスチャ座標変換テーブル選択手段(画素位置情報選択手段)26と、第2要素画像群生成手段27と、を備える。
【0022】
被写体画像入力手段21は、被写体画像取得装置10(画像記憶手段13)が記憶する被写体画像を入力するものである。そして、被写体画像入力手段21は、入力した被写体画像を特徴量算出手段23及び第2要素画像群生成手段27に出力する。
本実施形態では、被写体は、
図2に示すように、人物の顔Fであることとする。従って、被写体画像は、被写体として、人物の顔Fを撮影した画像である。
【0023】
データベース22は、要素画像群の生成に必要な各種情報を記憶したデータベースであり、3次元モデルデータベース(3次元モデル記憶手段)221と、第1要素画像群データベース(第1要素画像群記憶手段)223と、テクスチャ座標変換テーブルデータベース(画素位置情報記憶手段)225とを備える。
【0024】
3次元モデルデータベース221は、複数の3次元モデルを予め記憶したデータベースである。本実施形態では、3次元モデルデータベース221は、
図3に示すように、人物の顔の3次元モデルMを記憶する。3次元モデルMは、人物の顔の3次元形状を表している。
【0025】
ここで、3次元モデルデータベース221は、様々な被写体に類似した3次元モデルMを選択できるように、多数の3次元モデルMを記憶することが好ましい。例えば、3次元モデルデータベース221は、人種、性別、体格、年齢が異なる人物について、その顔の3次元モデルMを記憶する。
【0026】
例えば、ポリゴンの3次元モデルは、三角形、四角形等の多角形(ポリゴン)を組み合わせることで、3次元形状を表現したモデルである。そして、ポリゴンの3次元モデルにテクスチャを貼り付けることで(テクスチャマッピング)、その質感を向上させることができる。つまり、本実施形態の3次元モデルMは、
図3に示すように、顔の形状のみを表しており、顔のテクスチャ(色情報)が付加されていない。
【0027】
第1要素画像群データベース223は、第1要素画像群を予め記憶したデータベースである。ここで、第1要素画像群データベース223は、3次元モデルM毎に、その3次元モデルMの位置、方向及び顔の表情に応じた数の第1要素画像群90を記憶する。本実施形態では、第1要素画像群90は、
図4に示すように、色情報(テクスチャ)のない3次元モデルMの要素画像91で構成されている。
【0028】
テクスチャ座標変換テーブルデータベース225は、テクスチャ座標変換テーブル(画素位置情報)を予め記憶するデータベースである。本実施形態では、テクスチャ座標変換テーブルデータベース225は、第1要素画像群90毎にテクスチャ座標変換テーブルを記憶する。テクスチャ座標変換テーブルは、3次元モデルMと、被写体画像と、第1要素画像群90の要素画像91との全画素について、その画素位置を対応付けた情報である。
【0029】
<3次元モデル、第1要素画像群、テクスチャ座標変換テーブルの生成方法>
以下、データベース22に記憶する3次元モデル、第1要素画像群90及びテクスチャ座標変換テーブルの生成方法について、具体的に説明する。
【0030】
3次元モデルMは、任意の手法で生成可能であり、例えば、フォトグラメトリで生成できる。フォトグラメトリは、3次元モデルMの元となる人物の顔を異なる視点から撮影し、各撮影画像(仮のテクスチャ画像)の視差から奥行き情報を求め、求めた奥行き情報に基づいて3次元モデルMを生成する手法である。
【0031】
第1要素画像群90は、従来と同様、光線追跡法により生成できる。具体的には、光線追跡法では、3次元モデルMを配置した仮想3次元空間に、撮像素子とレンズアレイと奥行き制御レンズとを備える仮想カメラを配置する。そして、光線追跡法では、仮想カメラが備える撮像素子の画素毎にレンズアレイ及び奥行き制御レンズを通過し、3次元モデルMに達する光線の情報を算出する。なお、第1要素画像群90は、従来技術と同様、斜投影で生成してもよい。
【0032】
ここで、3次元モデルMの画素位置と、3次元モデルMの元となる撮影画像の画素位置との対応関係は、3次元モデルMを生成する際に求められる。また、被写体画像を撮影画像と同一サイズに正規化すれば、3次元モデルMの画素位置と、被写体画像の画素位置との対応関係も定まる。
また、光線追跡法又は斜投影により、3次元モデルMの画素位置と、第1要素画像群90を構成する各要素画像91の画素位置との対応関係も求められる。
このように、テクスチャ座標変換テーブルは、3次元モデルM及び第1要素画像群90を生成するときに求めることができる。
【0033】
テクスチャ座標変換テーブルは、入力(x1,y1,R1,G1,B1)と、出力(x2,y2,R2,G2,B2)との対応関係を表す(
図9の符号93)。x1,y1は、被写体画像の画素位置(座標)を表す。R1,G1,B1は、座標(x1,y1)のRGB値を表す。また、x2,y2は、第1要素画像群90を構成する要素画像91の画素位置(座標)を表す。R2,G2,B2は、座標(x2,y2)のRGB値を表す。ここで、1つの被写体画像に対して要素画像91が複数なので、テクスチャ座標変換テーブルは、1つの入力(x1,y1,R1,G1,B1)に対して、最大で要素画像91の数までの出力(x2,y2,R2,G2,B2)を有する。
【0034】
図5(a)に示すように被写体画像92内で中央に顔Fが位置する場合、
図5(b)に示すように右側に顔Fが位置する場合、
図5(c)に示すように上側に顔Fが位置する場合など、顔Fの水平位置及び垂直位置に応じた第2要素画像群を生成する必要がある。
また、
図6(a)に示すように手前側に顔Fが位置する場合、
図6(b)に示すように奥側に顔Fが位置する場合など、顔Fの大きさが異なることから、顔Fの奥行き位置に応じた第2要素画像群を生成する必要がある。
【0035】
また、
図7に示すように、顔Fが水平軸(X軸)、垂直軸(Y軸)、奥行き軸(Z軸)の方向で回転している場合、顔Fの見え方が異なることから、顔Fの回転方向に応じた第2要素画像群を生成する必要がある。
また、
図8(a)に示すように眼を開いている場合、
図8(b)に示すように眼を閉じている場合など、顔Fの表情に応じた第2要素画像群を生成する必要がある。
なお、表情は、例えば、眼を閉じている、眼を開いている、口を閉じている、口を開いているなど、予め設定されている。
【0036】
以上より、データベース22は、
図9に示すように、3次元モデルM毎に、顔Fの位置(水平位置、垂直位置及び奥行き位置)、方向及び表情に応じて、第1要素画像群90及びテクスチャ座標変換テーブル93を予め記憶する。つまり、第1要素画像群90及びテクスチャ座標変換テーブル93は、1つの3次元モデルMに対して、顔Fの位置、方向及び表情の種類を組み合わせた数だけ存在する。
【0037】
なお、データベース22は、各3次元モデルMに、その3次元モデルMを一意に識別できる識別情報(ID)を付与することとする。つまり、識別情報を参照すれば、データベース22が記憶する3次元モデルMを特定できる。
【0038】
図1に戻り、要素画像群生成装置20の構成について、説明を続ける。
特徴量算出手段23は、被写体画像入力手段21より入力した被写体画像92から、被写体の形状特徴量及び状況特徴量を算出するものである。
【0039】
本実施形態では、特徴量算出手段23は、形状特徴量として、顔Fを表した顔特徴量を算出する。具体的には、特徴量算出手段23は、被写体画像92から、眼、鼻、口等の顔特徴点を抽出する。そして、特徴量算出手段23は、抽出した顔特徴点から、両眼間距離(両眼の瞳孔間距離)、眼と鼻と口との距離、口の大きさ(口の左右両端距離)等の顔特徴量を算出する。
【0040】
なお、特徴量算出手段23は、特許第4954945号公報に記載の手法を用いて、顔特徴量を算出してもよい。この従来技術は、被写体画像92に含まれる特徴点データを示す行列の因数行列を推定することにより、被写体画像取得装置10に対する顔Fの向きと、顔Fの特徴点の三次元位置とを交互に推定するものである。
【0041】
また、特徴量算出手段23は、状況特徴量として、顔Fの位置及び方向と、表情特徴量とを算出する。
顔Fの位置は、被写体画像92に含まれる顔Fの水平位置、垂直位置及び奥行き位置を表す。例えば、顔Fの水平位置及び垂直位置は、被写体画像92に含まれる顔領域の重心位置である。また、例えば、顔Fの奥行き位置は、TOF(Time Of Flight)や視差で求められる。
【0042】
顔Fの方向とは、予め設定した方向(例えば、正面)を基準としたとき、被写体画像92に含まれる顔Fの回転方向(回転角度)である。顔Fの方向は、被写体から見た回転方向であり、被写体画像92内では左右反転する。
ここで、顔Fの左右の回転方向は、
図10に示すように、顔Fの右側L
Rの面積及び左側L
Lの面積を求め、この左右の面積比から求められる。例えば、左右の面積比が同じであれば正面方向、右側L
Rの面積が左側L
Lの面積より広ければ左方向となる。また、顔Fの上下の回転方向は、顔Fの上側の面積及び下側の面積を求め、この上下の面積比から求められる(不図示)。さらに、水平面に対する顔Fの回転方向(つまり、顔Fの傾斜)は、頭頂及び顎先を結ぶ線分と垂直軸とのなす角から求められる(不図示)。
【0043】
表情特徴量は、2つの顔特徴点の距離や3つ以上の顔特徴点で囲まれる領域面積に基づいて、顔Fの表情を表した特徴量である。例えば、表情特徴量は、眼を閉じている、眼を開いている、口を閉じている、口を開いている等を表している。
【0044】
なお、表情特徴量として、下記の参考文献に記載の特徴量を利用できる。この参考文献に記載の手法は、顔特徴点の相互関係に基づいて、直線特徴、三角形特徴、輝度平均による三角形特徴、輝度ヒストグラムによる三角形特徴を求めるものである。
参考文献:野宮他、「顔特徴点を用いた特徴選択と特徴抽出による表情認識に基づく映像中の表情表出シーン検出」、DEIM Forum 2011
【0045】
特徴量算出手段23は、算出した形状特徴量及び状況特徴量を3次元モデル選択手段24に出力する。
【0046】
3次元モデル選択手段24は、特徴量算出手段23が算出した形状特徴量に基づいて、被写体画像92の顔Fに最も類似する3次元モデルMを3次元モデルデータベース221から選択するものである。例えば、3次元モデル選択手段24は、3次元モデルデータベース221の各3次元モデルMのうち、顔特徴量の両眼間距離、口の大きさ、及びに、眼と鼻と口との距離が最も近くなる3次元モデルMを選択する。そして、3次元モデル選択手段24は、選択した3次元モデルMの識別情報と、特徴量算出手段23から入力した状況特徴量とを第1要素画像群選択手段25に出力する。
【0047】
第1要素画像群選択手段25は、3次元モデル選択手段24が選択した3次元モデルMについて、特徴量算出手段23が算出した状況特徴量に応じた第1要素画像群90を第1要素画像群データベース223から選択するものである。つまり、第1要素画像群選択手段25は、顔Fの位置、方向及び表情に一致する第1要素画像群90を第1要素画像群データベース223から選択する。そして、第1要素画像群選択手段25は、選択した第1要素画像群90と、3次元モデル選択手段24から入力した3次元モデルMの識別情報及び状況特徴量とをテクスチャ座標変換テーブル選択手段26に出力する。
【0048】
テクスチャ座標変換テーブル選択手段26は、3次元モデル選択手段24が選択した3次元モデルMについて、特徴量算出手段23が算出した状況特徴量に応じたテクスチャ座標変換テーブル93をテクスチャ座標変換テーブルデータベース225から選択するものである。つまり、テクスチャ座標変換テーブル選択手段26は、第1要素画像群選択手段25が選択した第1要素画像群90に対応するテクスチャ座標変換テーブル93をテクスチャ座標変換テーブルデータベース225から選択する。そして、テクスチャ座標変換テーブル選択手段26は、選択したテクスチャ座標変換テーブル93、及び、第1要素画像群選択手段25から入力した第1要素画像群90を第2要素画像群生成手段27に出力する。
【0049】
第2要素画像群生成手段27は、テクスチャ座標変換テーブル選択手段26が選択したテクスチャ座標変換テーブル93の画素位置に基づいて、第1要素画像群選択手段25が選択した第1要素画像群90に被写体画像92をテクスチャマッピングするものである。
【0050】
具体的には、第2要素画像群生成手段27は、被写体画像入力手段21より入力した被写体画像92から、
図11に示すように、顔Fのテクスチャを抽出する。そして、第2要素画像群生成手段27は、テクスチャ座標変換テーブル93が表す第1要素画像群90と被写体画像92との画素位置の対応関係に従って、被写体画像92から抽出したテクスチャを、第1要素画像群90に貼り付ける。このようにして、第2要素画像群生成手段27は、第2要素画像群を生成する。
図12に示すように、第2要素画像群94は、顔Fのテクスチャが貼り付けられた要素画像95で構成されている。
【0051】
[要素画像群生成装置の動作]
図13を参照し、要素画像群生成装置20の動作について説明する(適宜
図1参照)。
データベース22は、3次元モデルM、第1要素画像群90及びテクスチャ座標変換テーブル93を予め記憶していることとする。
【0052】
図13に示すように、被写体画像入力手段21は、被写体画像取得装置10から被写体画像92を入力する(ステップS1)。
特徴量算出手段23は、ステップS1で入力した被写体画像92から、顔特徴量を算出する(ステップS2)。
特徴量算出手段23は、ステップS1で入力した被写体画像92から、状況特徴量として、顔Fの位置及び方向と、表情特徴量とを算出する(ステップS3)。
【0053】
3次元モデル選択手段24は、ステップS3で算出した顔特徴量に基づいて、被写体画像92の顔Fに最も類似する3次元モデルMを3次元モデルデータベース221から選択する(ステップS4)。
第1要素画像群選択手段25は、ステップS4で選択した3次元モデルMについて、ステップS3で算出した状況特徴量に応じた第1要素画像群90を第1要素画像群データベース223から選択する(ステップS5)。
【0054】
テクスチャ座標変換テーブル選択手段26は、ステップS4で選択した3次元モデルMについて、ステップS3で算出した状況特徴量に応じたテクスチャ座標変換テーブル93をテクスチャ座標変換テーブルデータベース225から選択する(ステップS6)。
第2要素画像群生成手段27は、ステップS6で選択したテクスチャ座標変換テーブル93の画素位置に基づいて、ステップS5で選択した第1要素画像群90に被写体画像92をテクスチャマッピングする(ステップS7)。
【0055】
[作用・効果]
以上のように、本発明の第1実施形態に係る要素画像群生成装置20は、予め記憶した第1要素画像群90に対してテクスチャマッピングを施すので、演算量が多い光線追跡法や正射影を都度行う必要がない。すなわち、要素画像群生成装置20は、従来技術のように、光線追跡法や正射影を都度行う場合に比べて、テクスチャマッピングを施すだけなので演算量を抑えられる。これにより、要素画像群生成装置20は、第1要素画像群90の生成時間を短縮し、リアルタイムで第2要素画像群94を生成することができる。
【0056】
(第2実施形態)
図14を参照し、本発明の第2実施形態に係る立体画像表示システム1Bについて、第1実施形態と異なる点を説明する。
【0057】
第1実施形態では、テクスチャ座標変換テーブルデータベース225は、テクスチャ座標変換テーブル93を、水平位置、垂直位置、奥行き位置、回転方向及び表情に応じた数だけ記憶している。従って、テクスチャ座標変換テーブル93は、水平位置、垂直位置、奥行き位置、回転方向及び表情を組み合わせた膨大な数となる。
そこで、第2実施形態では、要素画像群生成装置20Bは、記憶するテクスチャ座標変換テーブル93の数を低減し、不足するテクスチャ座標変換テーブル93を補完する点が、第1実施形態と異なる。
【0058】
[要素画像群生成装置の構成]
図14に示すように、要素画像群生成装置20Bは、被写体画像入力手段21と、データベース22Bと、特徴量算出手段23と、3次元モデル選択手段24と、第1要素画像群選択手段25と、テクスチャ座標変換テーブル選択手段26Bと、第2要素画像群生成手段27Bと、テクスチャ座標変換テーブル補完手段(画素位置情報補間手段)28と、を備える。
【0059】
データベース22Bは、3次元モデルデータベース221と、第1要素画像群データベース223と、テクスチャ座標変換テーブルデータベース(画素位置情報記憶手段)225Bと、を備える。
【0060】
テクスチャ座標変換テーブルデータベース225Bは、テクスチャ座標変換テーブル93を予め記憶するデータベースである。
本実施形態では、テクスチャ座標変換テーブルデータベース225Bは、顔Fの位置変化に対応すべく、予め設定した基準位置(例えば、中心位置)に顔Fが位置するときのテクスチャ座標変換テーブル93を予め記憶する。
【0061】
また、本実施形態では、テクスチャ座標変換テーブルデータベース225Bは、顔Fの方向変化に対応すべく、垂直軸(Y軸)、奥行き軸(Z軸)のそれぞれについて、予め定めた基準方向のみのテクスチャ座標変換テーブル93を予め記憶する。例えば、奥行き軸(Z軸)であれば、予め定めた基準方向を左回り(反時計回り)として、左回りのテクスチャ座標変換テーブル93を予め記憶する(Y軸も同様)。この場合、テクスチャ座標変換テーブルデータベース225Bは、奥行き軸(Z軸)について、右回り(時計回り)のテクスチャ座標変換テーブル93を記憶しない。
【0062】
なお、テクスチャ座標変換テーブルデータベース225Bは、顔Fが上下対称ではないため、水平軸(X軸)に関しては、全ての角度でのテクスチャ座標変換テーブル93を予め記憶する。
また、本実施形態では、テクスチャ座標変換テーブルデータベース225Bは、第1実施形態と同様、表情毎にテクスチャ座標変換テーブル93を予め記憶する。
【0063】
テクスチャ座標変換テーブル選択手段26Bは、第1実施形態と同様、テクスチャ座標変換テーブル93を選択するものである。また、テクスチャ座標変換テーブル選択手段26Bは、選択すべきテクスチャ座標変換テーブル93をテクスチャ座標変換テーブルデータベース225Bが記憶していない場合、テクスチャ座標変換テーブル補完手段28に補完要求を出力する。このとき、テクスチャ座標変換テーブル選択手段26Bは、補完対象のテクスチャ座標変換テーブル93を特定するため、第1要素画像群選択手段25から入力した状況特徴量を補完要求に付加する。
【0064】
テクスチャ座標変換テーブル選択手段26Bは、テクスチャ座標変換テーブル補完手段28が補完したテクスチャ座標変換テーブル93、及び、第1要素画像群選択手段25から入力した第1要素画像群90を第2要素画像群生成手段27Bに出力する。
【0065】
第2要素画像群生成手段27Bは、テクスチャ座標変換テーブル補完手段28がY軸に対する回転方向でテクスチャ座標変換テーブル93を補完する場合、テクスチャマッピング後に第2要素画像群94を左右反転させる。これにより、第2要素画像群生成手段27Bは、予め定めた基準方向と反対方向(例えば、右回り)に向いた第2要素画像群94を生成することができる。
【0066】
なお、第2要素画像群生成手段27Bは、テクスチャ座標変換テーブル93の出力に含まれる水平座標x2を左右反転させ、このテクスチャ座標変換テーブル93に基づいてテクスチャマッピングを行ってもよい。これによっても、第2要素画像群生成手段27Bは、基準方向と反対方向に向いた第2要素画像群94を生成できる。
他の点、第2要素画像群生成手段27Bは、第1実施形態と同様のため、説明を省略する。
【0067】
テクスチャ座標変換テーブル補完手段28は、テクスチャ座標変換テーブル選択手段26Bから入力した補完要求の状況特徴量(位置及び方向)に従って、テクスチャ座標変換テーブル93を補完するものである。
【0068】
<テクスチャ座標変換テーブルの補完:水平位置及び垂直位置の対応>
以下、テクスチャ座標変換テーブル93を補完する手法について、具体的に説明する。
まず、水平位置及び垂直位置に対応して補完する手法を説明する。
【0069】
テクスチャ座標変換テーブル補完手段28は、テクスチャ座標変換テーブルデータベース225Bから、顔Fが基準位置(C
X,C
Y)にあるテクスチャ座標変換テーブル93を読み出す。次に、テクスチャ座標変換テーブル補完手段28は、状況特徴量に含まれる顔Fの水平位置G
X及び垂直位置G
Yを抽出する。次に、テクスチャ座標変換テーブル補完手段28は、
図15に示すように、顔Fの水平位置G
Xと、水平方向の基準位置C
Xとの位置ずれ量ΔXを算出する。次に、テクスチャ座標変換テーブル補完手段28は、顔Fの垂直位置G
Yと、垂直方向の基準位置C
Yとの位置ずれ量ΔYを算出する。そして、テクスチャ座標変換テーブル補完手段28は、水平方向の位置ずれ量ΔX及び垂直方向の位置ずれ量ΔYに応じて、顔Fが正面に位置するときのテクスチャ座標変換テーブル93が示す画素位置を移動させる。なお、ΔX,ΔYは、整数要素画像間隔とし、小数点以下を四捨五入する。
【0070】
<テクスチャ座標変換テーブルの補完:奥行き位置の対応>
テクスチャ座標変換テーブル補完手段28は、状況特徴量に含まれる顔Fの奥行き位置を抽出する。次に、テクスチャ座標変換テーブル補完手段28は、奥行き方向(Z軸方向)の手前側及び奥側からそれぞれ、抽出した顔Fの奥行き位置に最も近いテクスチャ座標変換テーブル93を1つ選択する。そして、テクスチャ座標変換テーブル補完手段28は、選択した2つのテクスチャ座標変換テーブル93から、顔Fの奥行き位置に対応するテクスチャ座標変換テーブル93を補完(例えば、内挿)する。
【0071】
ここで、テクスチャ座標変換テーブル補完手段28は、予め設定したIP立体画像表示装置30の表示可能な奥行き範囲内で、2つのテクスチャ座標変換テーブル93を選択することが好ましい。このように、要素画像群生成装置20Bは、IP立体画像表示装置30の解像度特性を考慮することで、奥行き方向のテクスチャ座標変換テーブル93の数を抑制すると共に、立体画像の解像度を一定以上に保つことができる。
【0072】
<テクスチャ座標変換テーブルの補完:回転方向の対応>
テクスチャ座標変換テーブル補完手段28は、状況特徴量に含まれる顔Fの回転方向を抽出する。次に、テクスチャ座標変換テーブル補完手段28は、抽出した顔Fの回転方向に一致し、回転方向が反対方向のテクスチャ座標変換テーブル93を読み出す。
【0073】
次に、テクスチャ座標変換テーブル補完手段28は、読み出したテクスチャ座標変換テーブル93を逆方向に変換する。例えば、顔Fの回転方向が右回りであり、テクスチャ座標変換テーブルデータベース225Bが左回りのテクスチャ座標変換テーブル93のみを記憶し、右回りのテクスチャ座標変換テーブル93を記憶していないこととする。この場合、テクスチャ座標変換テーブル補完手段28は、顔Fの回転方向に負の係数(つまり、‘−1’)を乗算した値を算出する。これによって、要素画像群生成装置20Bは、該当する左回りのテクスチャ座標変換テーブル93を選択し、選択したテクスチャ座標変換テーブル93を右回りに変換できる。このように、要素画像群生成装置20Bは、顔Fの回転方向に対応したテクスチャ座標変換テーブル93を補完する。
【0074】
なお、水平位置及び垂直位置、奥行き位置、回転方向の補完を個別に説明したが、テクスチャ座標変換テーブル補完手段28は、これらを2以上組み合わせてテクスチャ座標変換テーブル93を補完してもよい。
【0075】
[要素画像群生成装置の動作]
図16を参照し、要素画像群生成装置20Bの動作について説明する(適宜
図14参照)。
データベース22Bは、3次元モデルM、第1要素画像群90及びテクスチャ座標変換テーブル93を予め記憶していることとする。
ステップS1〜S5の処理は、第1実施形態と同様のため、説明を省略する。
【0076】
図16に示すように、テクスチャ座標変換テーブル選択手段26Bは、状況特徴量に応じたテクスチャ座標変換テーブル93をテクスチャ座標変換テーブルデータベース225Bが記憶しているか否かを判定する(ステップS10)。
【0077】
テクスチャ座標変換テーブル93を記憶している場合(ステップS10でYes)、要素画像群生成装置20Bは、ステップS6の処理を行う。
ステップS6の処理は、第1実施形態と同様のため、説明を省略する。
【0078】
テクスチャ座標変換テーブル93を記憶していない場合(ステップS10でNo)、テクスチャ座標変換テーブル選択手段26Bは、状況特徴量を付加した補完要求をテクスチャ座標変換テーブル補完手段28に出力する(ステップS11)。
【0079】
テクスチャ座標変換テーブル補完手段28は、ステップS11の補完要求に従って、テクスチャ座標変換テーブル93を補完する。ここで、テクスチャ座標変換テーブル補完手段28は、水平位置、垂直位置、奥行き位置、回転方向に対応させて、テクスチャ座標変換テーブル93を補完する(ステップS12)。
【0080】
第2要素画像群生成手段27は、ステップS6で選択したテクスチャ座標変換テーブル93、又は、ステップS12で補完したテクスチャ座標変換テーブル93に基づいて、ステップS5で選択した第1要素画像群90に被写体画像92をテクスチャマッピングする(ステップS13)。
【0081】
[作用・効果]
以上のように、本発明の第2実施形態に係る要素画像群生成装置20Bは、顔Fの位置及び回転方向に対応したテクスチャ座標変換テーブル93を補完できるので、顔Fの位置及び回転方向毎にテクスチャ座標変換テーブル93を記憶する必要がなく、データベース22Bの容量を削減できる。
【0082】
(第3実施形態)
図1を参照し、本発明の第3実施形態に係る立体画像表示システム1Cについて、第1実施形態と異なる点を説明する。
【0083】
第1実施形態では、テクスチャ座標変換テーブル93は、3次元モデルM、被写体画像92及び第1要素画像群90の要素画像91について、全画素の画素位置を対応付けることとして説明した。
第3実施形態では、テクスチャ座標変換テーブル93は、3次元モデルMの頂点画素についてのみ画素位置を対応付ける点が、第1実施形態と異なる。
【0084】
[要素画像群生成装置の構成]
図1に示すように、要素画像群生成装置20Cは、被写体画像入力手段21と、データベース22Cと、特徴量算出手段23と、3次元モデル選択手段24と、第1要素画像群選択手段25と、テクスチャ座標変換テーブル選択手段26と、第2要素画像群生成手段27Cと、を備える。
【0085】
データベース22Cは、3次元モデルデータベース221と、第1要素画像群データベース223と、テクスチャ座標変換テーブルデータベース(画素位置情報記憶手段)225Cと、を備える。
【0086】
テクスチャ座標変換テーブルデータベース225Cは、テクスチャ座標変換テーブル93を予め記憶するデータベースである。
本実施形態では、テクスチャ座標変換テーブルデータベース225Cは、3次元モデルMの頂点画素におけるテクスチャ座標変換テーブル93を予め記憶する。ここで、テクスチャ座標変換テーブル93は、3次元モデルMと、被写体画像92と、第1要素画像群90の要素画像91との頂点画素の画素位置(頂点画素位置)を対応付けた情報である。つまり、テクスチャ座標変換テーブル93は、3次元モデルMの頂点画素以外の画素について、画素位置の対応関係を有していない。
なお、頂点画素とは、3次元モデルMを構成する多角形(ポリゴン)の頂点に対応した画素のことである。
【0087】
第2要素画像群生成手段27Cは、3次元モデルMの頂点画素で被写体画像92を第1要素画像群90にテクスチャマッピングし、その頂点画素以外の画素で第1要素画像群90を補完するものである。具体的には、第2要素画像群生成手段27Cは、テクスチャ座標変換テーブル93を参照し、3次元モデルMの頂点画素について、被写体画像92から抽出したテクスチャを、第1要素画像群90に貼り付ける。また、第2要素画像群生成手段27Cは、3次元モデルMの頂点画素以外の画素について、第1要素画像群90を補完(例えば、内挿)する。
【0088】
[要素画像群生成装置の動作]
図13を参照し、要素画像群生成装置20Cの動作について説明する(適宜
図1参照)。
データベース22Cは、3次元モデルM、第1要素画像群90及びテクスチャ座標変換テーブル93を予め記憶していることとする。
ステップS1〜S6の処理は、第1実施形態と同様のため、説明を省略する。
【0089】
第2要素画像群生成手段27Cは、ステップS6で選択したテクスチャ座標変換テーブル93に基づいて、ステップS5で選択した第1要素画像群90に被写体画像92をテクスチャマッピングする。ここで、第2要素画像群生成手段27Cは、3次元モデルMの頂点画素で被写体画像92をテクスチャマッピングし、その頂点画素以外の画素で第1要素画像群90を補完する(ステップS7C)。
【0090】
[作用・効果]
以上のように、本発明の第3実施形態に係る要素画像群生成装置20Cは、3次元モデルMの頂点画素以外の画素についてテクスチャ座標変換テーブル93を記憶する必要がないので、データベース22Cの容量を削減できる。
【0091】
なお、第3実施形態に係る要素画像群生成装置20Cは、第1実施形態だけでなく、第2実施形態に適用することもできる。この場合、要素画像群生成装置20Cは、3次元モデルMの頂点画素以外の画素について、テクスチャ座標変換テーブル93を補完(例えば、内挿)し、この補完したテクスチャ座標変換テーブル93に従って第1要素画像群90を補完する。
【0092】
(第4実施形態)
図17を参照し、本発明の第4実施形態に係る立体画像表示システム1Dについて、第3実施形態と異なる点を説明する。
【0093】
第3実施形態では、3次元モデルMの頂点画素についてのテクスチャ座標変換テーブル93を予め記憶することとして説明した。要素画像91の画素数が少ない場合(例えば、縦10画素、横10画素)、頂点画素が要素画像91に十分に含まれない場合がある。一方、多視点画像は、異なる視点から被写体を撮影した画像なので、ある視点で隠れていた頂点が別の視点では見えている場合がある。つまり、多視点画像は、要素画像91よりも多くの頂点画素を含む場合がある。
第4実施形態では、要素画像91から多視点画像を予め生成し、この多視点画像に含まれる頂点画素に対応する画素の情報を利用する点が、第3実施形態と異なる。
【0094】
[要素画像群生成装置の構成]
図17に示すように、要素画像群生成装置20Dは、被写体画像入力手段21と、データベース22Dと、特徴量算出手段23と、3次元モデル選択手段24と、第1要素画像群選択手段25と、テクスチャ座標変換テーブル選択手段26と、第2要素画像群生成手段27Dと、多視点画像選択手段29と、を備える。
【0095】
データベース22Dは、3次元モデルデータベース221と、第1要素画像群データベース223と、テクスチャ座標変換テーブルデータベース(画素位置情報記憶手段)225Dと、多視点画像データベース(多視点画像記憶手段)227と、を備える。
【0096】
テクスチャ座標変換テーブルデータベース225Dは、テクスチャ座標変換テーブル93を予め記憶するデータベースである。
本実施形態では、テクスチャ座標変換テーブル93は、3次元モデルMと、多視点画像と、被写体画像92と、第1要素画像群90の要素画像91との頂点画素位置を対応付けた情報である。
【0097】
多視点画像データベース227は、後記する多視点画像を予め記憶するデータベースである。本実施形態では、多視点画像データベース227は、第1要素画像群90毎に、多視点画像を予め記憶する。
【0098】
<多視点画像>
図18を参照し、多視点画像の生成方法及び頂点画素について説明する。
図18(a)に示すように、第1要素画像群90は、テクスチャのない3次元モデルMを異なる視点で撮影した要素画像91で構成されている。例えば、
図18(a)の要素画像91は、
図4の第1要素画像群90で左上部分の3つの要素画像91に対応する。
【0099】
多視点画像は、各要素画像91で同じ位置から抽出した画素で構成されている。
図18(a)に示すように、1つ目の多視点画像95
1は、各要素画像91の左上の画素から抽出した画素で構成されている。また、
図18(b)に示すように、2つ目の多視点画像95
2は、各要素画像91の左上から2番目の画素から抽出した画素で構成されている。
【0100】
例えば、第1要素画像群90が横1920画素、縦1080画素であり、要素画像91が縦横10画素であることとする。この場合、1枚の第1要素画像群90から、100視点分(100枚)の多視点画像95を生成する。また、各多視点画像95は、横192画素、縦108画素の大きさになる。
【0101】
このとき、被写体画像取得装置10は、実空間において、視点位置に対応した位置で被写体画像92を取得することが好ましい。これにより、多視点画像95と被写体画像92との視点が一致するので、高品質なテクスチャマッピングが可能となる。
【0102】
図17に戻り、要素画像群生成装置20Dの構成について説明を続ける。
多視点画像選択手段29は、第1要素画像群選択手段25が選択した第1要素画像群90に対応する多視点画像95を、多視点画像データベース227から選択するものである。そして、多視点画像選択手段29は、選択した多視点画像95、及び、第1要素画像群選択手段25から入力した第1要素画像群90をテクスチャ座標変換テーブル選択手段26に出力する。
【0103】
第2要素画像群生成手段27Dは、3次元モデルMの頂点画素で被写体画像92を第1要素画像群90にテクスチャマッピングし、その頂点画素以外の画素で第1要素画像群90を補完するものである。
【0104】
まず、第2要素画像群生成手段27Dは、テクスチャ座標変換テーブル93において、多視点画像95上でテクスチャマッピングの対象となる頂点画素位置を求め、この多視点画像95の頂点画素位置に対応する3次元モデルM及び第1要素画像群90の頂点画素位置を求める。
【0105】
次に、第2要素画像群生成手段27Dは、多視点画像95を介して、テクスチャマッピングを行う。
具体的には、第2要素画像群生成手段27Dは、求めた頂点画素位置の対応関係に従って、多視点画像95に被写体画像92をテクスチャマッピングする。そして、第2要素画像群生成手段27Dは、
図18と逆の手順で、被写体のテクスチャが貼り付けられた多視点画像95から第1要素画像群90を生成する。つまり、第2要素画像群生成手段27Dは、各多視点画像95から同一位置(例えば、左上)の画素を抽出して、抽出した画素位置に対応する要素画像91(例えば、第1要素画像群90で左上の要素画像91)を生成する。
その後、第2要素画像群生成手段27Dは、頂点画素以外の画素で第1要素画像群90を補完する。
これにより、第2要素画像群生成手段27Dは、被写体画像92を読み出すためのメモリアクセス回数を低減し、より素早く第2要素画像群を生成できる。
【0106】
なお、第2要素画像群生成手段27Dは、テクスチャ座標変換テーブル93から第1要素画像群90の画素位置を求められるので、直接、第1要素画像群90にテクスチャマッピングしてもよい。
【0107】
[要素画像群生成装置の動作]
図19を参照し、要素画像群生成装置20Dの動作について説明する(適宜
図1参照)。
データベース22Dは、3次元モデルM、第1要素画像群90、多視点画像95及びテクスチャ座標変換テーブル93を予め記憶していることとする。
ステップS1〜S5の処理は、第3実施形態と同様のため、説明を省略する。
【0108】
多視点画像選択手段29は、ステップS5で選択した第1要素画像群90に対応する多視点画像95を、多視点画像データベース227から選択する(ステップS14)。
ステップS6,S10〜S12の処理は、第3実施形態と同様のため、説明を省略する。
【0109】
第2要素画像群生成手段27Dは、3次元モデルMの頂点画素で被写体画像92を第1要素画像群90にテクスチャマッピングし、その頂点画素以外の画素で第1要素画像群90を補完する。ここで、第2要素画像群生成手段27Dは、テクスチャ座標変換テーブル93を参照し、多視点画像95の頂点画素位置に対応する3次元モデルM及び第1要素画像群90の頂点画素位置を求め、求めた頂点画素位置に従って、テクスチャマッピングを行う(ステップS15)。
【0110】
[作用・効果]
以上のように、本発明の第4実施形態に係る要素画像群生成装置20Dは、頂点画素に対応する画素数が十分でない場合でも、多視点画像95に含まれる頂点画素に対応する画素の情報を利用できるので、より高品質なテクスチャマッピングを行うことができる。
なお、第4実施形態に係る要素画像群生成装置20Dは、第1実施形態だけでなく、第2実施形態,第3実施形態に適用することもできる。
【0111】
以上、本発明の各実施形態を詳述してきたが、本発明は前記した各実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0112】
(変形例1)
前記した各実施形態では、被写体画像の1画素(x1,y1)を要素画像の1画素(x2,y2)に対応させているが、本発明は、これに限定されない。
つまり、第2要素画像群生成手段は、被写体画像の複数画素を、要素画像の1画素に対応させてもよい。例えば、第2要素画像群生成手段は、下記の変換式(1)により、被写体画像の画素P1,P2,P3,P4から、要素画像の画素EI1を補完(例えば、線形補完)する。
【0113】
EI1=αP1+βP2+γP3+ζP4 …式(1)
なお、変換式(1)では、α,β,γ,ζは、α+β+γ+ζ=1を満たす整数である。
【0114】
(変形例2)
前記した各実施形態では、表情毎にテクスチャ座標変換テーブルを記憶することとして説明したが、本発明は、これに限定されない。
【0115】
ここで、眼や眉の形に応じて顔の表情が変化する。また、顔の表情が変化しても眼や眉の奥行き位置が一定である。このため、異なる表情の被写体画像に切り替えることで、顔の表情変化を表現できる。
【0116】
具体的には、表情に関係なくテクスチャ座標変換テーブルを共通とし、顔の位置、方向に応じてテクスチャ座標変換テーブルを記憶してもよい。これにより、要素画像群生成装置は、顔の表情毎にテクスチャ座標変換テーブルを記憶する必要がなく、データベースの容量をより削減できる。
【0117】
この場合、特徴量算出手段は、表情が変化しても画素位置が変化しない特徴点を抽出することが好ましい。例えば、特徴量算出手段は、目尻、目頭、鼻、耳、顔の輪郭を、特徴点として抽出する。
【0118】
(変形例3)
前記した各実施形態では、被写体が人物の顔であることとして説明したが、被写体は、特に限定されない。
【0119】
例えば、被写体は、人物の上半身である。この場合、データベースは、顔を含めた上半身の3次元モデルと、これら3次元モデルに対応した第1要素画像群及びテクスチャ座標変換テーブルとを予め記憶する。
【0120】
また、被写体は、任意の物体であってもよい。この場合、データベースは、様々な物体の3次元モデルと、これら3次元モデルに対応した第1要素画像群及びテクスチャ座標変換テーブルとを予め記憶する。
【0121】
また、被写体は、複数であってもよい。この場合、要素画像群生成装置は、被写体画像から各物体を抽出し、物体毎に特徴量を算出する。そして、要素画像群生成装置は、各物体の特徴量に基づいて、各物体に対応した3次元モデルと、第1要素画像群と、テクスチャ座標変換テーブルとを選択する。
例えば、被写体画像にりんご、みかん、バナナのように複数の物体が含まれる場合を考える。この場合、要素画像群生成装置は、被写体画像から、りんご、みかん、バナナを抽出し、りんご、みかん及びバナナのそれぞれに対応した3次元モデルと、第1要素画像群と、テクスチャ座標変換テーブルとを選択する。
【0122】
(変形例4)
前記した各実施形態では、1台の被写体画像取得装置から被写体画像を入力することとして説明したが、本発明は、これに限定されない。
【0123】
つまり、要素画像群生成装置は、複数の被写体画像取得装置から被写体画像を入力してもよい。
図20に示すように、水平方向に並んだ2台の被写体画像取得装置10
R,10
Lから被写体画像92
R,92
Lを入力する場合を考える。この場合、右側の被写体画像取得装置10
Rは、被写体から見て、顔Fの左方向から撮影する。従って、被写体画像取得装置10
Rが取得した被写体画像(右被写体画像92
R)は、顔Fの左側が右側より大きく映っている。一方、左側の被写体画像取得装置10
Lは、被写体から見て、顔Fの右方向から撮影する。従って、被写体画像取得装置10
Lが取得した被写体画像(左被写体画像92
L)は、顔Fの右側が左側より大きく映っている。このように、右被写体画像は顔左側の情報を多く含んでおり、左撮影画像は顔右側の情報を多く含んでいる。
【0124】
そこで、要素画像群生成装置は、要素画像群における光線再生方向を考慮し、異なる方向で撮影した被写体画像によりテクスチャマッピングを行う。具体的には、要素画像群生成装置は、左方向に再生する要素画像の画素を、右被写体画像を用いてテクスチャマッピングする。また、要素画像群生成装置は、右方向に再生する要素画像の画素を、左被写体画像を用いてテクスチャマッピングする。これにより、要素画像群生成装置は、光の反射特性をより正確に再現することができる
なお、左右方向と同様、上下方向も複数の被写体画像を用いてテクスチャマッピングできる。
【0125】
(変形例5)
前記した各実施形態では、被写体画像が1枚であることとして説明したが、本発明は、これに限定されない。
【0126】
ここで、被写体画像取得装置は、撮影手段が撮影した被写体画像を画像記憶手段に記憶している。また、画像記憶手段は、撮影した被写体画像を複数枚記憶することが可能である。このため、要素画像群生成装置は、時間の経過に伴って画像記憶手段が記憶する被写体画像が増加するので、テクスチャマッピングに利用する被写体画像を増加させることができる。つまり、最初に生成する第2要素画像群は、1枚の被写体画像からテクスチャマッピングする。しかし、時間の経過に伴って被写体画像が増加するため、後に生成する第2要素画像群は、複数の被写体画像からテクスチャマッピングできる。
【0127】
以下、複数枚の被写体画像からテクスチャマッピングする手法を説明する。
特徴量算出手段は、1枚目の被写体画像から特徴量を算出する。次に、3次元モデル選択手段は、3次元モデルの各頂点画素と、1枚目の被写体画像の特徴点とのマッチングを行う。次に、要素画像群生成装置は、1枚目の被写体画像について、3次元モデルに対応するテクスチャ座標変換テーブルを生成する。ここで、要素画像群生成装置は、これらの処理を被写体画像毎に繰り返し行う。
【0128】
そして、要素画像群生成装置は、3次元モデルの各頂点画素において、最も確からしい被写体画像を判定し、最終的なテクスチャ座標変換テーブルを生成する。さらに、要素画像群生成装置は、最終的なテクスチャ座標変換テーブルによりテクスチャマッピングを行うことで、立体画像の質感を向上させることができる。
【0129】
(その他変形例)
前記した各実施形態では、要素画像群生成装置を独立したハードウェアとして説明したが、本発明は、これに限定されない。例えば、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、要素画像群生成装置として協調動作させる要素画像群生成プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリ等の記憶媒体に書き込んで配布してもよい。