(58)【調査した分野】(Int.Cl.,DB名)
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記2次元画像及び前記視差画像から抽出した輪郭線に基づいて前記視差画像生成部で生成した前記視差画像の視差値を補正、若しくは、前記2次元画像及び前記デプス画像から抽出した輪郭線に基づいて前記視差画像生成部で前記視差画像を生成するための前記デプス画像の奥行き情報を補正する視差画像補正部と、補正後の視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素を補間して前記仮想視点画像を生成する未設定画素補間部と、を備え、
前記視差画像補正部は、前記視差画像の輪郭線の所定の行(又は列)の画素を基準画素とし、当該所定の行(又は列)の近傍の行(又は列)を含む範囲内で、行(又は列)のプラス方向及びマイナス方向に最も離れている2つの画素を特定し、前記2つの画素に挟まれる行(又は列)方向の領域をエラー領域として推測し、得られたエラー領域内の視差値を補正することを特徴とする画像生成装置。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去部と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素補間部と、を備え、
前記未設定画素領域ノイズ除去部は、二つの未設定画素領域に挟まる画素領域の長さと予め定めたノイズ判定閾値とを比較することによって、前記画素領域がノイズであるか否かを判断するノイズ判定部と、前記画素領域がノイズであると判断された場合に、前記ノイズを除去するノイズ除去部と、を備えることを特徴とする画像生成装置。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去部と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素補間部と、を備え、
前記未設定画素領域ノイズ除去部は、二つの未設定画素領域の長さと前記二つの未設定画素領域に挟まる画素領域の長さの比例値と予め定めたノイズ判定閾値とを比較することによって、前記画素領域がノイズであるか否かを判断するノイズ判定部と、前記画素領域がノイズであると判断された場合に、前記ノイズを除去するノイズ除去部と、を備えることを特徴とする画像生成装置。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成方法であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成処理と、前記2次元画像及び前記視差画像から抽出した輪郭線に基づいて前記視差画像生成処理で生成した前記視差画像の視差値を補正、若しくは、前記2次元画像及び前記デプス画像から抽出した輪郭線に基づいて前記視差画像生成処理で前記視差画像を生成するための前記デプス画像の奥行き情報を補正する視差画像補正処理と、補正後の視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素を補間して前記仮想視点画像を生成する未設定画素補間処理と、を実行し、
前記視差画像補正処理では、前記視差画像の輪郭線の所定の行(又は列)の画素を基準画素とし、当該所定の行(又は列)の近傍の行(又は列)を含む範囲内で、行(又は列)のプラス方向及びマイナス方向に最も離れている2つの画素を特定し、前記2つの画素に挟まれる行(又は列)方向の領域をエラー領域として推測し、得られたエラー領域内の視差値を補正することを特徴とする画像生成方法。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成方法であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成処理と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去処理と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素補間処理と、を実行し、
前記未設定画素領域ノイズ除去処理では、二つの未設定画素領域に挟まる画素領域の長さと予め定めたノイズ判定閾値とを比較することによって、前記画素領域がノイズであるか否かを判断し、前記画素領域がノイズであると判断した場合に、前記ノイズを除去することを特徴とする画像生成方法。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成方法であって、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成処理と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去処理と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素補間処理と、を実行し、
前記未設定画素領域ノイズ除去処理では、二つの未設定画素領域の長さと前記二つの未設定画素領域に挟まる画素領域の長さの比例値と予め定めたノイズ判定閾値とを比較することによって、前記画素領域がノイズであるか否かを判断し、前記画素領域がノイズであると判断された場合に、前記ノイズを除去することを特徴とする画像生成方法。
2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する装置で動作する画像生成プログラムであって、
前記装置を、
前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素のずらし量を表す視差値を表す視差画像を生成する視差画像生成部、前記2次元画像及び前記視差画像から抽出した輪郭線に基づいて前記視差画像生成部で生成した前記視差画像の視差値を補正、若しくは、前記2次元画像及び前記デプス画像から抽出した輪郭線に基づいて前記視差画像生成部で前記視差画像を生成するための前記デプス画像の奥行き情報を補正する視差画像補正部、補正後の視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素を補間して前記仮想視点画像を生成する未設定画素補間部、として機能させ、
前記視差画像補正部は、前記視差画像の輪郭線の所定の行(又は列)の画素を基準画素とし、当該所定の行(又は列)の近傍の行(又は列)を含む範囲内で、行(又は列)のプラス方向及びマイナス方向に最も離れている2つの画素を特定し、前記2つの画素に挟まれる行(又は列)方向の領域をエラー領域として推測し、得られたエラー領域内の視差値を補正することを特徴とする画像生成プログラム。
【背景技術】
【0002】
最近、3D画像表示装置の進展とともに、3D表示コンテンツの作成技術に対する注目も高まっている。3D画像表示装置が伝送回路を介して画像信号を受信して3D表現を行う場合、それぞれの視点に相当する画像信号を伝送する必要がある。特に、多視点ディスプレイに対応する多視点立体画像の場合、画像表示端末に必要なデータ量は、通常の2次元画像信号の数倍にも及んでいる。そこで、3D表示コンテンツの作成分野においては、伝送する画像データ量の低減が一つの課題となっている。
【0003】
そうした背景にあたって、3D表示する一方の2次元画像信号と、この2次元画像信号の各画素に対応する3Dオブジェクトの奥行き情報を表すデプス画像信号から、3D表示するもう一方の画像を生成する技術が研究されている。ここで、3D表示するもう一方の画像は、仮想カメラのパラメータを用いた画像処理技術により生成されたものであることから、以下、仮想視点画像と呼ぶ。このように、画像表示端末に、一枚の2次元画像信号とそれに対応するデプス画像信号から画像変換処理を通して仮想視点画像を生成する方法を適用することによって、少ない画像データ伝送量で3D表示を行うことが可能となった。
【0004】
しかし、2次元画像信号の各画素の奥行き情報を正確に反映する高精度なデプス画像を入手するのは容易ではない。実際のステレオカメラを用いてデプス画像を撮影する場合は、デプス画像の解像度はステレオカメラの固有特性により制限され、2次元画像信号よりも小さい。例えば、mesa社が開発したTOF(Time of flight)カメラ(MESA Swiss Ranger SR3100)により撮られたデプス画像の解像度は、176×144ピクセルとなり、2次元画像信号に大きく及ばない。また、3DCGツールの場合は、レンダリングスピードを優先するためにデプス画像の解像度を犠牲することがよくある。また、複数枚の異なる視点に対応する2次元画像信号からデプス画像を推測する場合は、対応画素の誤検出などの影響によって、得られたデプス画像信号の精度はさらに低くなる。そして、デプス画像信号の精度低下によって、生成された仮想視点画像においてはノイズが目立ち、画質が劣化するという問題が生じる。
【0005】
このような画質劣化の問題に対して、例えば、下記特許文献1には、複数枚の画像情報から距離情報を検出する距離情報検出部と、検出した距離情報を、距離情報から得られる曲面に定義された重みづけ関数を最小化するような重みづけで平滑化を行う平滑化部と、検出した距離情報の値の確からしさを示す指標を用いて平滑化処理での重みづけを行うために必要な重みづけ情報を検出する重みづけ情報検出部、および平滑化処理された距離情報に基づいて、入力視点画像の各画素を移動し、任意視点での画像を内挿する画像再生・内挿部を備える装置が開示されている。
【0006】
また、下記特許文献2には、3次元画像データの平面画像情報と2次元画像データの平明画像情報から対応する特徴点をそれぞれ抽出し、抽出した特徴点の対応関係に基づいて、3次元画像データの被写体の位置ずれを、複数の特徴点で閉じられる閉図形を変形することで補正し、補正した3次元の画像データの奥行き情報(デプス情報)と、2次元画像データの平面情報から仮想視点画像データを生成する方法が開示されている。
【0007】
また、下記非特許文献3には、高精度の仮想視点画像を得るために、デプス画像信号の輪郭情報を用いて低解像度のデプス画像信号から高解像度画像信号に変換する方法が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0010】
上述したように、3D表示する一方の2次元画像信号と、この2次元画像信号の各画素に対応するオブジェクトの奥行き情報を表すデプス画像信号とを用いて、仮想視点画像を生成する場合、デプス画像信号の精度が悪いと、生成された仮想視点画像はノイズが目立ち、画質が劣化する。
【0011】
この問題に対して、特許文献1では、複数枚の2次元画像信号から生成されたデプス画像信号に関して、重み付け処理や平滑化処理などを用いて、デプス画像信号内の誤差を緩和し、内挿視点画像の画質劣化を改善する方法を提案しているが、この方法では、デプス画像信号内の誤差を完全に直すことができない。特に、平滑化処理によって補正されたデプス画像信号において、各オブジェクト輪郭線の周辺領域は、ぼかし状態になっており、オブジェクト間の奥行き差分が明確に表示されていないため、これに基づいて生成された仮想視点画像信号では、オブジェクトの輪郭領域に対応する画素がばらばらに散らされ、オブジェクトの輪郭部分のノイズが目立つ。
【0012】
また、特許文献2では、3次元画像データの平面画像情報と2次元画像データの平明画像情報のそれぞれから特徴点を抽出する方法を提案しているが、この方法では、3次元画像データではなく奥行き情報(デプス画像信号)と2次元画像データが入力の場合は、デプス情報からの特徴点抽出は、色情報やテキスチャ情報がないために精度が悪く、特徴点の対応関係を精度よくとることができない。
【0013】
また、非特許文献3では、仮想視点画像を得るために、デプス画像信号の輪郭情報のみを用いる方法を提案しているが、この方法では、デプス画像の精度が悪い場合には、その輪郭情報にも元々誤差が入っているために、補正後のデプス画像の精度も更に悪くなる可能性がある。
【0014】
本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、2次元画像信号と、この2次元画像信号に対応するデプス画像信号とから仮想視点画像信号を生成する際に、ノイズの少ない、且つ高い画質を有する仮想視点画像を生成することが可能な画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラムを提供することにある。
【課題を解決するための手段】
【0015】
本発明の第1の態様に係る画像生成装置は、2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素の
ずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記2次元画像及び前記視差画像から抽出した輪郭線に基づいて前記視差画像生成部で生成した前記視差画像の視差値を補正、若しくは、前記2次元画像及び前記デプス画像から抽出した輪郭線に基づいて前記視差画像生成部で前記視差画像を生成するための前記デプス画像の奥行き情報を補正する視差画像補正部と、補正後の視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素を補間して前記仮想視点画像を生成する未設定画素領域補間部と、を備えるものである。
【0016】
本発明の第2の態様に係る画像生成装置は、2次元画像と、前記2次元画像の奥行き情報を表すデプス画像と、3次元空間に仮想的に配置した仮想カメラのパラメータと、を用いて、前記仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、前記デプス画像と前記仮想カメラのパラメータとを用いて、前記2次元画像の各画素の
ずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去部と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素領域補間部と、を備えるものである。
【0017】
本発明の第3の態様に係る画像生成装置は、複数枚の2次元画像を用いて、3次元空間に仮想的に配置した仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、複数枚の2次元画像を使用して、前記2次元画像の各画素の
ずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記2次元画像及び前記視差画像の輪郭線を抽出し、抽出された輪郭線
に基づいて前記視差画像からエラー領域を推測し、得られたエラー領域内の視差値を補正する視差画像補正部と、補正後の視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素を補間して前記仮想視点画像を生成する未設定画素領域補間部と、を備えるものである。
【0018】
本発明の第3の態様に係るもう一つの画像生成装置は、複数枚の2次元画像を用いて、3次元空間に仮想的に配置した仮想カメラ位置から撮影して得られる仮想視点画像を生成する画像生成装置であって、複数枚の2次元画像を使用して、前記2次元画像の各画素の
ずらし量を表す視差値を表す視差画像を生成する視差画像生成部と、前記視差画像に従って前記2次元画像の各画素をシフトさせて中間画像を生成する画素移動処理部と、前記中間画像の内、シフトされた画素が割り当てられていない未設定画素領域にあるノイズを除去する未設定画素領域ノイズ除去部と、ノイズを除去した中間画像の前記未設定画素を補間して前記仮想視点画像を生成する未設定画素領域補間部と、を備えるものである。
【発明の効果】
【0019】
本発明の画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラムによれば、ノイズの少ない、且つ高画質を有する仮想視点画像を生成することができる。
【0020】
その理由は、デプス画像と仮想カメラのパラメータを用いて視差画像を生成若しくは複数枚の2次元画像を使用して視差画像を生成し、2次元画像と視差画像から抽出した輪郭線に基づいて生成した視差画像の視差値を補正、若しくは、2次元画像とデプス画像から抽出した輪郭線に基づいて視差画像を生成するためのデプス画像の奥行き情報を補正し、補正後の視差画像に従って2次元画像の各画素をシフトさせて中間画像を生成し、中間画像の未設定画素を補間して仮想視点画像を生成する処理を行うからである。
【0021】
また、デプス画像と仮想カメラのパラメータを用いて視差画像を生成若しくは複数枚の2次元画像を使用して視差画像を生成し、視差画像に従って2次元画像の各画素をシフトさせて中間画像を生成し、中間画像の未設定画素領域に生じるノイズを削除し、中間画像の未設定画素を補間して仮想視点画像を生成する処理を行うからである。
【図面の簡単な説明】
【0022】
【
図1】本発明の実施の形態1に係る画像生成装置の構成を示すブロック図である。
【
図2】本発明の実施の形態1に係る画像生成装置における視差画像補正部の構成の一例を示すブロック図である。
【
図3】本発明の実施の形態1に係る画像生成装置における視差画像補正法の一例を示すシーケンス図である。
【
図4(a)】視差画像補正処理における画像出力結果(2次元画像信号)の一例を示す図である。
【
図4(b)】視差画像補正処理における画像出力結果(視差画像信号)の一例を示す図である。
【
図4(c)】視差画像補正処理における画像出力結果(2次元画像の輪郭情報)の一例を示す図である。
【
図4(d)】視差画像補正処理における画像出力結果(視差画像の輪郭情報)の一例を示す図である。
【
図4(e)】視差画像補正処理における画像出力結果((j−α)行目から(j+α)行目までの範囲ω内の2次元画像及び視差画像の輪郭情報)の一例を示す図である。
【
図4(f)】視差画像補正処理における画像出力結果の一例を示す図(
図4(e)の拡大図)である。
【
図4(g)】視差画像補正処理における画像出力結果の一例を示す図(
図4(f)の拡大図)である。
【
図4(h)】視差画像補正処理における画像出力結果(補正後の視差画像信号)の一例を示す図である。
【
図5】本発明の実施の形態1に係る画像生成装置における未設定画像補間法の一例を示すシーケンス図である。
【
図6】本発明の実施の形態2に係る画像生成装置の構成を示すブロック図である。
【
図7】未設定画素領域の生成原因を説明する図である。
【
図8】未設定画像領域内のノイズの生成原因を説明する図である。
【
図9】本発明の実施の形態2に係る画像生成装置における未設定画素領域ノイズ除去部の構成の一例を示すブロック図である。
【
図10】本発明の実施の形態2に係る画像生成装置における未設定画像領域ノイズ除去処理を説明する図である。
【
図11】本発明の実施の形態3に係る画像生成装置の構成を示すブロック図である。
【
図12】本発明の実施の形態3に係る画像生成装置の他の構成を示すブロック図である。
【
図13(a)】本実施形態の効果を説明するための画像出力結果(2次元画像信号)の具体例を示す図である。
【
図13(b)】本実施形態の効果を説明するための画像出力結果(デプス画像信号)の具体例を示す図である。
【
図13(c)】本実施形態の効果を説明するための画像出力結果(従来の手法で生成された中間画像信号)の具体例を示す図である。
【
図13(d)】本実施形態の効果を説明するための画像出力結果(実施の形態1の手法で生成された中間画像信号)の具体例を示す図である。
【
図13(e)】本実施形態の効果を説明するための画像出力結果(実施の形態2の手法で生成された中間画像信号)の具体例を示す図である。
【
図13(f)】本実施形態の効果を説明するための画像出力結果(従来の手法で生成された仮想視点画像信号)の具体例を示す図である。
【
図13(g)】本実施形態の効果を説明するための画像出力結果(実施の形態1の手法で生成された仮想視点画像信号)の具体例を示す図である。
【
図13(h)】本実施形態の効果を説明するための画像出力結果(実施の形態2の手法で生成された仮想視点画像信号)の具体例を示す図である。
【
図14】本実施形態に係る画像生成装置を含む画像表示装置の構成を示すブロック図である。
【発明を実施するための形態】
【0023】
[実施の形態1]
本発明の実施の形態1に係る仮想視点画像を生成する画像生成装置の構成について、
図1を参照して説明する。
図1は、本実施の形態に係る仮想視点画像生成装置100の構成を示すブロック図である。
【0024】
図1(a)に示すように、画像生成装置100は、視差画像生成部101と、視差画像補正部102と、画素移動処理部103と、未設定画素領域補間部104と、を備えており、仮想カメラのパラメータ7000と、デプス画像信号2000と、2次元画像信号1000から、仮想視点画像信号4002を生成して出力する。ここで、2次元画像信号1000は、3D空間である視点位置から撮影された画像信号である。仮想カメラのパラメータ7000は、前記2次元画像信号1000に対応する視点位置と同じ3D空間で、実際に設置されていない仮想カメラを定義するパラメータであり、仮想カメラの焦点距離や視角、3D空間上の座標情報などを含む。デプス画像信号2000は、前記3D空間で2次元画像信号1000の各画素に対応するオブジェクトと前記視点位置の距離を表すものである。仮想視点画像信号4002は、仮想のカメラ位置から撮影された画像信号である。
【0025】
以下に、画像生成装置100に含まれる各処理部の機能を説明する。
【0026】
まず、仮想カメラのパラメータ7000とデプス画像信号2000が視差画像生成部101に入力される。入力されたデプス画像信号2000は、2次元画像信号1000と同じ解像度を持っているが、低解像度のオリジナルデータから補間処理などを通して生成された場合、2次元画像信号1000内の各画素の奥行き情報を正確に反映していないところがある。例えば、実写により生成されたデプス画像の場合は、解像度がステレオカメラの固有特性に制限され、2次元画像信号に大きく及ばない。また、3DCGツール(Lightwaveや3DMaxなど)により生成されたデプス画像でも、レンダリングスピードを優先するために解像度を犠牲することがよくある。また、複数枚の異なる視点に対応する2次元画像信号からデプス画像を推測する場合、推測誤差などの影響で、得られたデプス画像信号の精度がさらに低くなる。そこで、視差画像生成部101は、上述のような低精度のデプス画像信号2000と仮想カメラのパラメータ7000を受け取った後、デプス画像信号2000の各画素を、仮想視点画像信号4002を生成するために、2次元画像信号の各画素のずらし量(視差値)を表す視差画像信号3000に変換する。2次元画像信号1000における画素(u,v)の視差量Δu(u,v)は、例えば、以下の式1で与えられる。
【0028】
ここで、z(u,v)は、デプス画像信号2000の画素(u,v)の値であり、2次元画像信号1000内の画素(u,v)に対応する3D空間上でオブジェクトと視点の距離を表す。IODは、入力の2次元画像信号1000に対応する視点位置と出力の仮想視点画像信号に対応する視点位置の間隔である。Fovは、カメラの視角である。生成された視差画像信号3000は、視差画像生成部101から出力される。
【0029】
そして、視差画像信号3000と2次元画像信号1000は視差画像補正部102に入力され、視差画像補正部102は、入力された2次元画像信号1000と視差画像信号3000の輪郭線を抽出し、また、視差画像信号3000における輪郭部分の視差値を修正し、補正後の視差画像信号3001を出力する。視差画像補正部102の具体的な構成と処理法については、後に詳述する。
【0030】
次に、補正後の視差画像信号3001と2次元画像信号1000は画素移動処理部103に入力され、画素移動処理部103は、補正後の視差画像信号3001に従って2次元画像信号1000の各画素を適切な位置に移動させ、中間画像信号4000を生成する。一般的には、2次元画素信号における画素(u,v)の色情報を中間画像信号4000の座標(u+Δu(u,v),v)に移動させる。ここで、Δu(u,v)は、補正後の視差画像信号3001の画素(u,v)の値である。3Dコンテンツの飛出し及び奥行き量を調整する場合は、2次元画素信号における画素(u,v)の色情報を中間画像信号4000の座標(u+k・Δu(u,v),v)に入れてもよい。kは、立体感調整係数である。kは、定数に設定してもいいし、または、座標(u,v)の関数k=f(u,v)に従って計算してもよい。ここで、中間画像信号4000は、補正後の視差画像信号3001に従って2次元画像信号を画素ごとに移動させた画像信号であるが、中間画像信号4000には、座標計算の段階で2次元画像信号のどの画素の移動後の座標にもならず、色が一度も置かれない画素(すなわち、シフトされた画素が割り当てられていない画素)が出てくる。これらの画素を未設定画素と定義する。
【0031】
最後に、中間画像信号4000は未設定画素領域補間部104に入力され、未設定画素領域補間部104は、線形補間や、平均値補間、また重み付け平滑化などの方法を用いて、中間画像信号4000における未設定画素領域を補完する。補間後の画像は、仮想視点画像信号4002として出力される。
【0032】
図5を用いて未設定画素領域を補間する一例を紹介する。
図5(a)は、未設定画素を含む中間画像信号を示している。
図5(b)は、未設定画素の補間方法を示している。まず、未設定画素領域を二等分して、白い破線で示した中間線より左側の未設定画素領域は、左隣接の画素aを用いて埋め、中間線により右側の未設定画素領域は、右隣接の画素bを用いて埋める。
図5(c)は、補正後の仮想視点画像信号を示している。
【0033】
次に、画像生成装置100における視差画像補正部102の詳細な構成について説明する。
図2は、視差画像補正部102の構成例を示すブロック図である。
図2に示すように、視差画像補正部102は、輪郭線抽出部102aと、エラー領域算出部102bと、エラー領域視差値修正部102cと、を備えている。
【0034】
輪郭線抽出部102aに、低精度の視差画像信号3000と2次元画像信号1000が入力されている。輪郭線抽出部102aは、二次微分や、ゾーベルフィルタ、プレヴィットフィルタなどの方法を用いて、2次元画像信号1000と視差画像信号3000に対して輪郭線抽出を行う。それぞれの画像から抽出された輪郭線の座標情報を2次元画像の輪郭情報5000と視差画像の輪郭情報5001と定義する。これらの輪郭情報5000と5001はエラー領域算出部102bに入力され、エラー領域算出部102bは、視差画像のエラー領域情報6000を推測する。エラー領域情報6000は、視差画像信号3000において、視差値が間違っている可能性が高い領域の位置情報を表すものである。求められたエラー領域情報6000と視差画像信号3000は、エラー領域視差値修正部102cに入力され、エラー領域視差値修正部102cは、エラー領域情報6000を参照し、エラー領域内の画素の視差値を補正する。
【0035】
図3は、視差画像補正部102で行われる処理を示すフローチャート図である。本実施の形態では、視差画像信号3000におけるエラー領域内の視差量を補正するために、「輪郭線抽出処理」、「エラー領域算出処理」、「エラー領域視差量修正処理」という三つのステップを行う。以下、
図4を参照して各ステップの具体的な処理を説明する。
【0036】
ステップS1:輪郭線抽出処理は、2次元画像信号1000と低精度の視差画像信号3000に対して、二次微分や、ゾーベルフィルタ、プレヴィットフィルタなどの方法を用いて、2次元画像信号1000と視差画像信号3000の輪郭線を抽出し、2次元画像の輪郭情報5000と視差画像の輪郭情報5001を出力する。
図4に示す例では、(a)が入力の2次元画像信号1000であり、(b)が低精度の視差画像信号3000である。(a)に対して輪郭抽出後の画像は(c)となり、(b)に対して輪郭抽出後の画像は(d)となる。
【0037】
ステップS2:エラー領域算出処理は、2次元画像の輪郭情報5000と視差画像の輪郭情報5001を用いて、視差画像信号3000におけるエラー領域情報6000を算出する。エラー領域情報6000は、視差画像信号3000において、視差値が間違っている可能性が高い領域の位置情報を表すものである。
【0038】
具体的には、視差画像信号3000内のj行目のエラー領域情報6000を求める際に、まず、(j−α)行目から(j+α)行目までの範囲ω内で2次元画像の輪郭情報5000と視差画像の輪郭情報5001を確保する(
図4(e))。
【0039】
図4(f)は、
図4(e)における輪郭部分の拡大図である。2次元画像の輪郭情報5000に示されるj行目の輪郭画素cを基準画素として、その近傍の範囲ω内で基準画素cより+x方向で最も離れている画素bと−x方向で最も離れている画素aに挟まっている領域をエラー領域と判断し、このエラー領域の位置を表すものは、エラー領域情報6000として出力される。
【0040】
ここで、近傍の範囲として、同一行の最も離れている画素のみでなく、その行の前後の行である近傍範囲ωまでエラー領域の探索範囲を広げたのは、行毎に行うと、行毎に依存するノイズが発生するからである。このように探索範囲を広げることで、行毎に依存するノイズが発生を防ぐことができる。
【0041】
ステップS3:エラー領域視差量修正処理は、エラー領域内の視差値を修正する。
図4(g)は、
図4(f)で白の矩形線で囲まれる部分の拡大図であり、視差修正方法の一例を示している。
【0042】
j行目において、基準画素cから画素bと同じ横座標を持つ画素b’までの視差値は、画素b’の隣接画素fの値を用いて補正する。基準画素cから画素aと同じ横座標を持つ画素a’までの視差値は、画像a’の隣接画素eの値を用いて補正する。このように、1行目から最後まで順次に視差補正を行い、補正後の視差画像信号3001(
図4(h))を出力する。
【0043】
以上、一行目から最終行までエラー領域の抽出とエラー領域の視差量補正を行う場合について記述したが、本実施の形態は上記方法に限定されるものではなく、例えば、処理方向を変えて、一列目から最終列までの順で処理を行ってもよい。
【0044】
上記では、2次元画像信号1000と視差画像信号3000の輪郭情報を比較して、視差画像信号3000の補正処理を実施する例を示したが、2次元画像信号1000とデプス画像信号2000の輪郭情報を比較して、視差画像信号3000の補正処理を実施しても良い。この際、
図1(b)に示すように、視差画像補正部102はデプス画像補正部として機能し、視差画像生成部101及びデプス画像補正部の処理では、初めにデプス画像信号2000の補正処理を実施する。補正処理は、2次元画像信号1000と視差画像信号3000の輪郭情報を比較する補正方法と同様に、2次元画像信号1000とデプス画像信号2000の輪郭情報を比較して、デプス画像信号2000のエラー領域内のデプス値(奥行き情報)を補正し、補正後のデプス画像信号2001を生成する。次に、補正後のデプス画像信号2001と仮想カメラパラメータ7000から補正後の視差画像信号3001を出力することで視差画像信号3000の補正処理を実施する。
【0045】
また、本実施の形態では、2次元画像信号1000とデプス画像信号2000が入力される場合について説明したが、本実施の形態はそれに限定されるものではなく、例えば、一枚の2次元画像信号のみが入力される場合にも適用可能である。この場合、入力される2次元画像信号の色情報、輝度情報を基づいて各画素に対応する視差画像信号やデプス画像信号を推測すればよい。または、複数枚の2次元画像信号が入力される場合には、SAD(Sum of the Absolute Differences)やSSD(Sum of Squared Difference)などブロックマッチング方式、或は、SIFT(Scale−Invariant Feature Transform)特徴点の対応付け方法を用いて、複数枚の2次元画像信号の何れかに対応する視差画像信号やデプス画像信号を推測すればよい。
【0046】
このように、本実施の形態によれば、3D表示する一方の2次元画像から高画質の仮想視点画像を生成することが可能となる。そして、
図14のように、入力の2次元画像信号と、本画像生成装置から出力された仮想視点画像信号が3D表示パネル10000に表示され、右目と左目に別々に入るように調整することで人工的に3D表現を実現することができる。
【0047】
[実施の形態2]
本発明の実施の形態2に係る画像生成装置200の構成について、
図6を参照して説明する。
図6は、本実施の形態に係る画像生成装置200の構成を示すブロック図である。
【0048】
図6に示すように、画像生成装置200は、視差画像生成部101と、画素移動処理部103、未設定画素領域補間部104と、未設定画素領域ノイズ除去部105と、を備えている。
【0049】
画像生成装置200は、実施の形態1と同様に、2次元画像信号1000と低精度のデプス画像信号2000から仮想視点画像信号4002を生成するが、実施の形態1に記載の視差画像補正処理の代わりに、中間画像信号4001内の未設定画素領域ノイズを除去することによって、仮想視点画像信号4002の画質劣化を防止する。
【0050】
以下に、
図6を用いて具体的な処理フローを説明する。
図1と同様の構成要素には同一の符号を付し、説明を適宜省略する。
【0051】
視差画像生成部101は、入力のデプス画像信号2000と仮想カメラのパラメータ7000から視差画像信号3000を生成する。
【0052】
画素移動処理部103は、視差画像信号3000に従って2次元画像信号の各画素を適切な位置に移動し、中間画像信号4001を生成する。また、中間画像信号4001における未設定画素の位置を記録するために、画像移動処理部103に初期値が0のフラッグバッファが設けられ、画素ごとの移動処理とともに、フラッグバッファにおいても移動先と同じ座標の値を0から1に変更させる。このようにして、フラッグバッファで画素値が0のままの画素は、中間画像信号4001内の未設定画素に対応することになる。
【0053】
高精度の視差画像信号が入力される場合は、視差画像信号と2次元画像信号が完全に対応しており、また、オブジェクト領域の視差量と背景領域の視差量が明確に分かれている。オブジェクトに対応する画素と背景に対応する画素をそれぞれの視差量に従って移動させると、生成された中間画像においてオブジェクト領域と背景領域の間に未設定画素領域が存在する。
図7は、その一例を示している。
図7の(a)と(b)は、それぞれ、入力された2次元画像信号と視差画像信号であり、(c)は出力された中間画像信号4001である。(a)において、画素Aは、オブジェクト領域の輪郭画素を表しており、画素Bは、背景領域の輪郭画素を表している。オブジェクト領域の視差量をΔu1、背景領域の視差量をΔu2と仮定すると、生成された中間画像信号(c)において、オブジェクト領域の輪郭画素A’が、2次元画像信号内の画素Aを横方向でΔu1ずらしたものとなり、背景領域の輪郭画素B’が、画素Bを横方向でΔu2ずらしたものである。(c)に示すように、背景領域とオブジェクト領域の境に未設定画素領域がある。
【0054】
しかし、前述したように、入力された視差画像信号3000の精度が低いため、視差画像信号3000において、オブジェクト領域と背景領域の境界に一部エラー領域が実際に存在しており、視差画像信号3000に従って得られた中間画像信号4001において、エラー領域に対応する2次元画像の画素は、未設定画素領域にノイズとして散らされている。そのため、これらのノイズ画素の影響で生成された仮想視点画像信号では、オブジェクトが崩れているように見える。
【0055】
図8は、この一例を示している。
図8の(a)は、2次元画像信号であり、(b)は、低精度の視差画像信号であり、(c)は、生成された中間画像信号である。(a)において、オブジェクト領域の輪郭画素をAと表記し、背景領域の輪郭画素をBと表記し、同じ背景領域である画素Bの隣接画素をCと表記する。(b)に示すように、画素Aの視差量がΔu1である。画素Bは視差画像のエラー領域に含まれており、視差量がΔueとなっている。また、画素Cの視差量がΔu2である。
【0056】
図8の(b)に従って、画素A、B、Cを含む全ての画素を移動させ、(c)に示すような中間画像信号4001を生成する。この中間画像信号4001において、オブジェクトの輪郭画素AがA’の位置に、背景領域の画素CがC’の位置にずらされたが、画素Bの視差量がオブジェクト領域と背景領域の視差量の中間値であるため、未設定画素領域にノイズ画素として散らされている。これらのノイズが仮想視点画像の画質劣化の原因と思われる。
【0057】
そこで、これらのノイズを除去する目的で、本実施の形態2では、未設定画素領域ノイズ除去部105を用いている。中間画像信号4001が未設定画素領域ノイズ除去部105に入力されると、未設定画素領域ノイズ除去部105は、未設定画素領域内ノイズと看做される画素を除去し、ノイズ除去後の中間画像信号4000を出力する。
【0058】
最後に、ノイズ除去後の中間画像信号4000は、未設定画素領域補間部104に入力され、未設定画素領域補間部104は、実施の形態1と同様に、中間画像信号4000内の未設定画素領域に対して、隣接の画素を用いて補間処理を行い、仮想視点画像信号4002を出力する。
【0059】
以下に、本実施の形態の主要部分である、未設定画素領域ノイズ除去部105の構成について、
図9を参照して説明する。
図9は、未設定画素領域ノイズ除去部105の構成を示すブロック図である。
【0060】
図9に示すように、未設定画素領域ノイズ除去部105は、ノイズ判定部105aと、ノイズ除去部105bによる構成される。ノイズ判定部105aは、中間画像信号4001と中間画像信号内の未設定画素領域の位置を記録するフラッグ画像信号4003を入力し、未設定画素領域内のノイズ画素を判定し、ノイズ画素情報7001を出力する。ここで、ノイズ画素情報7001は、ノイズと判断された画素の位置を表すものである。ノイズ除去部105bは、ノイズ画素情報7001と、中間画像信号4001を入力し、ノイズ画素情報7001に従って中間画像信号4001内のノイズ画素を削除し、ノイズ抜きの中間画像信号4000を出力する。
【0061】
図10は、ノイズ判定アルゴリズムの一例を説明する図である。
図10の(a)は、フラッグ画像信号4003である。黒い破線で囲まれた領域は、中間画像信号4001で設定済みの画素領域を表している。黒い部分は、中間画像信号内の未設定画素領域となっている。
図10の(b)は、(a)の破線で囲まれた部分の拡大図である。(b)に示すように、長さがzの未設定画素領域eと、長さがyの未設定画素領域fの間に、長さがxの画素領域cが存在している。画素領域cがノイズかどうかを判断するため、ノイズ判断閾値βを導入し、式2に従ってβと領域cの長さxを比較する。
【0063】
画素領域cの長さxが閾値βより小さい場合は、画素領域cをノイズと判断する。それ以外の場合は、画素領域cを普通の画素領域と判断する。また、画素領域cの長さと、未設定画素領域eとfの長さの総和の比率から、画素領域cがノイズ領域かどうか判断することもできる。判断式は、式3になる。
【0065】
式3に示すように、もし、左右の未設定画素領域長さの総和と画素領域cの長さの比率が、閾値βより大きい場合は、画素領域cをノイズと判断し、それ以外の場合は、画素領域cを普通の画素領域と判断する。
【0066】
以上、
図9と
図10を用いて未設定画素領域のノイズ除去アルゴリズムについて説明したが、ノイズ除去の方法はこれに限定されるものではなく、未設定画素領域に2次元平滑フィルタなどをかけることによって、ノイズを除去することも本発明の適用範囲に含まれる。
【0067】
このように、本実施の形態によれば、入力された低精度のデプス画像信号や視差画像信号に対して予め補正しなくても、ノイズの少ない、高画質を有する仮想視点画像信号を生成することが可能となる。そして、
図14のように、入力の2次元画像信号と、本画像生成装置から出力された仮想視点画像信号が3D表示パネル10000に表示され、右目と左目に別々に入るように調整することで人工的に3D表現を実現することができる。
【0068】
[実施の形態3]
次に、本発明の実施の形態3に係る画像生成装置300の構成について、
図11を参照して説明する。
図11は、本実施の形態に係る画像生成装置300の構成を示すブロック図である。
図11において、
図1と同様の構成要素には同一の符号を付し、説明を適宜省略する。
【0069】
図11に示すように、画像生成装置300は、実施の形態1と同様に、視差画像生成部101’と、視差画像補正部102と、画素移動処理部103と、未設定画素領域補間部104と、を備えている。但し、実施の形態1の入力が2次元画像信号1000と、それに対応するデプス画像信号2000、仮想カメラのパラメータ7000となっているが、本実施の形態では、入力が複数枚の2次元画像信号1000となっている。
【0070】
図11に示すように、複数枚の2次元画像信号(フレーム番号:1…m…n)が視差画像生成部101’に入力される。視差画像生成部101’は、SAD(Sum of the Absolute Differences)やSSD(Sum of Squared Difference)などのブロックマッチング方式、或は、SIFT(Scale−Invariant Feature Transform)特徴点の対応付け方法を用いて、複数枚の2次元画像信号の何れかに対応する視差画像信号3000を推測する。そして、推測された視差画像信号3000とそれに対応する2次元画像信号1000を実施の形態1、2と同様な処理フローに通して仮想視点画像信号4002を生成する。
【0071】
また、視差画像生成部101’を実施の形態2に係る画像生成装置200と組み合わせ、画像生成装置300’を構成することもできる。
図12は、この場合の画像生成装置300’を示している。複数枚の2次元画像信号は視差画像生成部101’に入力され、視差画像生成部101’は、上述したような対応付け方式による複数枚の2次元画像信号の何れに対応する視差画像信号3000を推測する。そして、推測された視差画像信号3000とそれに対応する2次元画像信号1000を実施の形態2と同様な処理フローに通して仮想視点画像信号4002を生成する。
【0072】
本実施の形態によれば、奥行き情報を表すデスプ画像信号が入力されなくても、仮想視点画像信号4002を生成することが可能となり、入力信号のバリエーションによる本発明の適用性を更に拡大することができる。そして、
図14のように、入力の2次元画像信号と、本画像生成装置から出力された仮想視点画像信号が3D表示パネル10000に表示され、右目と左目に別々に入るように調整することで人工的に3D表現を実現することができる。
【0073】
上述の全ての実施の形態では、本発明をハードウェアの構成として説明したが、本発明は、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットやその他の通信媒体を介して伝送することにより提供することも可能である。
【0074】
本発明の画像生成処理を、CPUなどにコンピュータプログラムを実行させることにより実現する場合、ハードウェア上での侵害確認は難しい。そこで、以下では、侵害確認の方法について説明する。
【0075】
本発明の画像生成処理と、視差画像の平滑化処理や、重み付け処理とを区別するために、例えば、
図13の(a)と(b)のような輪郭線がジグザグのオブジェクトを含む特定の侵害確認画像を用いることができる。
図13(a)は、星形状のオブジェクトを含む侵害確認用の2次元画像信号である。
図13(b)は、(a)に対応する視差画像信号であるが、低精度の影響でオブジェクトの輪郭部分に一部エラー領域が存在する。
【0076】
本発明の実施の形態1は、視差画像内のオブジェクトの輪郭線を2次元画像内のオブジェクトの輪郭線に強制的に一致させることで、生成された中間画像信号4000では、オブジェクトと背景がはっきり分かれて、その境にある未設定画素領域にはノイズが存在しない。
【0077】
また、本発明の実施の形態2は、低精度の視差画像は、そのまま画素移動処理部103に入力し、未設定画素領域にノイズが入る中間画像信号4001を生成する。そして、中間画像信号4001を未設定画素領域ノイズ除去部105に入力し、未設定画素領域内のノイズを削除した後の中間画像信号4000を生成する。この場合にも、生成された中間画像信号4000は、ノイズが見られない。
【0078】
このように、未設定画素補間処理を行う前の中間画像信号4000内の未設定画素領域にノイズがないことが本発明の特徴である。そして、このような中間画像信号4000に基づいて生成された仮想視点画像信号4002でも、線形ノイズが目立たない。また、輪郭線補正を行うため、輪郭線がはっきりとしている。
【0079】
一方、
図13のような輪郭がジグザグのオブジェクトを含む視差画像に対して、平滑化処理などの従来の処理を行っても、処理後の視差画像信号と2次元画像信号を完全に対応させるのは難しいため、生成された中間画像信号内で未設定画素領域のノイズを無くすことができず、最終的に出力された仮想視点画像にノイズが残っている。また、従来の方法では、奥行きデータの輪郭線補正を行っていないため、仮想視点画像の輪郭線がぼけているだけでなく、ずれていることが確認できる。
【0080】
図13の(c)は、汎用の平滑化処理を行った視差画像を用いて生成された中間画像信号を示している。(d)は、本発明の実施の形態1により生成された中間画像信号である。また、(e)は、本発明の実施の形態2により生成された中間画像信号である。この三者を比較すると、(e)と(d)に示す中間画像信号内の未設定画素領域にはノイズがほとんど見られないが、(c)に示す中間画像信号内の未設定画素領域にはノイズが顕著に存在していることが確認できる。
【0081】
中間画像信号4000が入手できない場合、最終的に出力された仮想視点画像から侵害の確認もできる。本発明の中間画像信号を基づいて生成された仮想視点画像信号4002では、各オブジェクトの輪郭部分にノイズが殆どないことが本発明の特徴である。
図13の(f)は、汎用の平滑化処理を行った視差画像から生成された仮想視点画像信号である。(g)は、本発明の実施の形態1により生成された仮想視点画像信号である。(h)は、本発明の実施の形態2により生成された仮想視点画像信号である。この三者を比較すると、(g)と(h)に示す仮想視点画像信号におけるオブジェクトの輪郭部分にはノイズが見られないが、(f)に示す仮想視点画像信号におけるオブジェクトの輪郭部分にはノイズが顕著に存在していることが確認できる。
【0082】
上述のように、輪郭線がジグザグのオブジェクトを含む画像をシステムに入力した場合、中間画像信号のノイズの程度を比較することによって、本発明の手法を用いたかどうかを判断することができ、中間画像信号が入手できない場合でも、もし、出力された仮想視点画像に線形ノイズがない場合、本発明の手法を用いた可能性が高いと判断することができる。
【0083】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。