(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-05
(45)【発行日】2024-01-16
(54)【発明の名称】3次元モデルデータ変換装置及びプログラム
(51)【国際特許分類】
H04N 21/238 20110101AFI20240109BHJP
【FI】
H04N21/238
(21)【出願番号】P 2019208244
(22)【出願日】2019-11-18
【審査請求日】2022-10-03
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100121119
【氏名又は名称】花村 泰伸
(72)【発明者】
【氏名】河村 侑輝
(72)【発明者】
【氏名】今村 浩一郎
(72)【発明者】
【氏名】永田 裕靖
(72)【発明者】
【氏名】山上 悠喜
(72)【発明者】
【氏名】楠 知也
【審査官】醍醐 一貴
(56)【参考文献】
【文献】特開2004-054572(JP,A)
【文献】国際公開第2019/146194(WO,A1)
【文献】特開2011-039869(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
G06T 11/00-11/40
G06T 15/00-17/00
G06T 17/10-17/30
(57)【特許請求の範囲】
【請求項1】
3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、
前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをUV座標により矩形画像へマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、
前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、
前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、
前記高解像度テクスチャにおける全体の縮小率に対して、前記注目領域検出部により変換された前記3次元注目領域に対応する前記高解像度テクスチャのテクスチャ注目領域の部分テクスチャの縮小率が抑制されるように、前記高解像度テクスチャにおける前記テクスチャ注目領域の部分テクスチャの解像度を削減すると共に、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く領域の部分テクスチャの解像度を削減し、前記高解像度テクスチャを、前記低解像度のモデルデータを構成する低解像度テクスチャに変換し、前記ジオメトリ変換部により変換された前記低解像度ジオメトリに含まれる前記頂点の前記UV座標を変更し、新たな前記低解像度ジオメトリを生成するテクスチャ変換部と、
を備えたことを特徴とする3次元モデルデータ変換装置。
【請求項2】
3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、
前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをUV座標により矩形画像へマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、
前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、
前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、
前記ジオメトリ変換部により変換された前記低解像度ジオメトリからその各面に対応する前記部分テクスチャを抽出し
、前記部分テクスチャを前記矩形画像に再マッピングし、前記高解像度テクスチャ
と同じ解像度のテクスチャを、前記低解像度のモデルデータを構成する低解像度テクスチャ
として生成するテクスチャ変換部と、
を備えたことを特徴とする3次元モデルデータ変換装置。
【請求項3】
請求項
1に記載の3次元モデルデータ変換装置において、
前記低解像度のモデルデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量を実効伝送容量Rとし、前記低解像度ジオメトリの単位時間あたりのデータ量をデータ量G
oとし、前記低解像度テクスチャの単位時間あたりのデータ量をデータ量T
oとし、前記高解像度テクスチャの単位時間あたりのデータ量をデータ量T
iとし、前記3次元注目領域の前記頂点を削減する比率を削減比率αとし、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減する比率を削減比率βとし、前記テクスチャ注目領域の前記部分テクスチャの前記解像度を削減する比率を削減比率γとし、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く前記領域の前記部分テクスチャの前記解像度を削減する比率を削減比率δとして、
さらに、前記低解像度ジオメトリの前記データ量G
oに前記低解像度テクスチャの前記データ量T
oを加算した結果(G
o+T
o)が前記実効伝送容量R以下となり、かつ前記削減比率αが前記削減比率βよりも小さくなるように、前記削減比率α及び前記削減比率βを決定し、
前記高解像度テクスチャの前記データ量T
i及び前記低解像度テクスチャの前記データ量T
oにおける比率T
o/T
iを算出し、1から前記比率T
o/T
iを減算し、前記削減比率δを決定し、前記削減比率γが前記削減比率δよりも小さくなるように、予め設定された係数a(0≦a<1)を前記削減比率δに乗算し、前記削減比率γを決定する削減比率決定部を備え、
前記ジオメトリ変換部は、
前記削減比率決定部により決定された前記削減比率αを用いて、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記削減比率決定部により決定された前記削減比率βを用いて、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減し、前記高解像度ジオメトリを前記低解像度ジオメトリに変換し、
前記テクスチャ変換部は、
前記削減比率決定部により決定された前記削減比率γを用いて、前記高解像度テクスチャにおける前記テクスチャ注目領域の前記部分テクスチャの前記解像度を削減すると共に、前記削減比率決定部により決定された前記削減比率δを用いて、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く前記領域の前記部分テクスチャの前記解像度を削減し、前記高解像度テクスチャを前記低解像度テクスチャに変換する、ことを特徴とする3次元モデルデータ変換装置。
【請求項4】
3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、
前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、
前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、
前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、
を備えたことを特徴とする3次元モデルデータ変換装置。
【請求項5】
請求項4に記載の3次元モデルデータ変換装置において、
前記低解像度のモデルデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量を実効伝送容量Rとし、前記低解像度ジオメトリの単位時間あたりのデータ量をデータ量G
oとし
、前記3次元注目領域の前記頂点を削減する比率を削減比率αとし、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減する比率を削減比率βとして、
さらに、前記低解像度ジオメトリの前記データ量
G
o
が前記実効伝送容量R以下となり、かつ前記削減比率αが前記削減比率βよりも小さくなるように、前記削減比率α及び前記削減比率βを決定する削減比率決定部を備え、
前記ジオメトリ変換部は、
前記削減比率決定部により決定された前記削減比率αを用いて、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記削減比率決定部により決定された前記削減比率βを用いて、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減し、前記高解像度ジオメトリを前記低解像度ジオメトリに変換する、ことを特徴とする3次元モデルデータ変換装置。
【請求項6】
請求項
3に記載の3次元モデルデータ変換装置において、
前記削減比率決定部は、
前記削減比率α及び前記削減比率βを決定する際に、前記高解像度ジオメトリの単位時間あたりのデータ量をデータ量G
iとし、前記高解像度ジオメトリの全体の頂点群に占める前記3次元注目領域に属する頂点群の比率を頂点群比率rとして、
式:β≧1-(R-T
o-G
ir(1-α))/G
i(1-r)
を満たすように、かつ前記削減比率βが前記削減比率αよりも大きくなるように、前記削減比率α、または前記低解像度テクスチャの前記データ量T
o、または前記削減比率α及び前記低解像度テクスチャの前記データ量T
oを変化させて、前記削減比率βを求めることで、前記削減比率α及び前記削減比率βを決定する、ことを特徴とする3次元モデルデータ変換装置。
【請求項7】
請求項1から6までのいずれか一項に記載の3次元モデルデータ変換装置において、
前記注目領域検出部は、
前記複数の2次元画像のそれぞれについて、予め設定された特徴学習モデルを用いて、前記2次元注目領域、及び当該2次元注目領域における前記所定の特徴を有する度合いを示すスコアを求め、所定の閾値以上の前記スコアを有する前記2次元注目領域を、複数角度の視点との空間的位置関係から前記3次元注目領域に変換する、ことを特徴とする3次元モデルデータ変換装置。
【請求項8】
3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、
前記高解像度のモデルデータを構成するジオメトリを高解像度ジオメトリとして、各頂点の情報にカラー情報を含む前記高解像度ジオメトリを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、
前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、
前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、
を備えたことを特徴とする3次元モデルデータ変換装置。
【請求項9】
コンピュータを、請求項1から8までのいずれか一項に記載の3次元モデルデータ変換装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、AR(Augmented Reality:拡張現実)、VR(Virtual Reality:仮想現実)等に用いる3次元コンテンツのモデルデータを変換することで、データ量を削減する3次元モデルデータ変換装置及びプログラムに関する。
【背景技術】
【0002】
近年、AR、VR等の3次元コンテンツ技術の普及が進んでいる。AR及びVRでは、コンテンツデータとして、3次元モデルデータを取り扱う。
【0003】
3次元モデルデータは、一般に、3次元オブジェクトの形状を近似表現する3角形または4角形からなる多面体の頂点及び面の集合であるジオメトリによって記述される。尚、4角形は必ず2つの3角形に分解できることから、3角形によるジオメトリの定義がより一般的である。ジオメトリは主に、3次元モデルデータの各頂点について、3次元座標(XYZ座標)、法線ベクトル、及び、テクスチャのマッピングに使用する2次元座標(UV座標)が記述される。ジオメトリでは、これらに加えて、各面について面を構成する頂点の番号のセットが記述され、多面体のメッシュ構造が定義される。ジオメトリの記録フォーマットの例としては、OBJ形式(例えば非特許文献1を参照)、Alembic形式(例えば非特許文献2を参照)、glTF2.0形式(例えば非特許文献3を参照)がある。
【0004】
テクスチャは、ジオメトリの多面体の各面に対応する部分テクスチャを2次元の矩形領域内にマッピングした、ジオメトリの各面の柄を定める矩形画像であり、静止画符号化技術または映像符号化技術により符号化される。3次元モデルデータをレンダリングする際には、ジオメトリの各面について、その面を構成する各頂点が保持するUV座標に従ってテクスチャから部分テクスチャを切り出し、面の柄として貼り付ける。
【0005】
時系列の静止画フレームのシーケンスを連続再生することにより、動画として再生される。これと同様に、時系列の3次元モデルデータのシーケンスを連続再生し、例えば被写体の3次元の動きをARまたはVRにて空間的に提示することにより、視聴者は、被写体を自由な視点から見ることができる。このような3次元モデルデータの時系列シーケンスを、3次元ビデオまたはボリューメトリックビデオと呼ぶことがある。
【0006】
一般に、3次元ビデオを構成する各フレームの3次元モデルデータは、プロダクションの段階では高解像度・大容量のデータ(高解像度ジオメトリ及び高解像度テクスチャ)である。一方、コンテンツの視聴者向けに伝送及び配信(伝送・配信)する段階では、コンテンツを視聴する端末で受信可能なファイルサイズ及び伝送路の伝送容量の制限により、データ量を削減したデータ(低解像度ジオメトリ及び低解像度テクスチャ)への変換が必要となる。また、サービス環境において、受信端末の性能やコンテンツの伝送路品質が均一ではない場合には、さまざまな処理性能や伝送路品質に適したデータサイズに変換した複数パターンのコンテンツデータを用意する必要も想定される。
【0007】
高解像度ジオメトリ及び高解像度テクスチャから低解像度ジオメトリ及び低解像度テクスチャへの変換においては、映像・音声等の符号化処理と同様に、主観的な視覚品質を保ちつつデータ量を削減することが課題となる。3次元モデルデータのデータ量を削減するために、ジオメトリに関しては頂点の間引き、及びテクスチャに関しては解像度の縮小が行われる。ジオメトリにおいては、頂点数の削減により、結果として面の数も削減される。
【0008】
ジオメトリの頂点の間引きによりデータ量を削減する一般的な手法としては、オブジェクト形状の特徴を用いることなく、全領域において一様の比率で頂点数の削減を行うものがある。例えば、単位体積あたりの頂点数を制限して頂点の間引きを行う。他の手法としては、高解像度ジオメトリにおける周波数的な特徴を利用して、エッジ部分等の高周波成分の多い領域について頂点削減の比率を低めに設定することで、低解像度ジオメトリのディテールを残すように制御を行うものもある。
【0009】
ジオメトリの各面に対応する部分テクスチャのテクスチャへの配置(マッピング)の状態は、ジオメトリの各頂点に関連付けられるUV座標によって定義されることから、UVマップとも呼ばれる。ジオメトリとUVマップの関係は多面体と展開図の関係に近いが、あくまで頂点と頂点の対応であり、多面体の展開図とは異なり各面の形状(3角形の各頂点の内角の角度及び各辺の長さ)はマッピングによって変形され得る。一般に、複雑なジオメトリのUVマップを作成する場合、全ての面を単一の集合(面と面が辺を共有して連結した集合)に展開することは難しく、それぞれ独立した複数の集合としてマッピングされる。これらの面の集合は、テクスチャの中に浮かぶ島の様に見えることから、UVアイランドと呼ばれることがある。一般に、テクスチャ上には1または複数のUVアイランドが配置される。
【0010】
テクスチャの解像度の縮小を行う手法としては、単純な画像縮小処理により、テクスチャの全領域の解像度を一様に削減することが簡単である。しかし、この場合には、ジオメトリの頂点削減において、UVアイランドの境界線上の頂点を維持する制約が必要である。一方、ジオメトリの頂点削減において、UVアイランドの境界線上の頂点を維持する制約を設けない場合には、テクスチャの解像度を変更しない場合であってもUVマップの再構成(再マッピング)が必要である。テクスチャの解像度の縮小を行う場合、UVマップの再構成をするかしないかによらず、ジオメトリの各面に対応する部分テクスチャの解像度の削減比率は一様であることが一般的である。尚、一般にUV座標の値は、例えばテクスチャの左下を(0,0)、テクスチャの右上を(1,1)のように正規化された値で記述されるため、UVマップの変更を伴わない単純な画像縮小においては、ジオメトリの頂点に関連付けられるUV座標の変更は不要である。
【0011】
また、3次元モデルデータのデータ量を削減する手法ではないが、2次元データのデータ量を削減する手法において、その画像の品質を損ねることなく、適切な処理サイズに削減する手法が提案されている(例えば特許文献1を参照)。
【0012】
この手法は、2次元データの動画像に対して画像解析を行い、視聴者が注視する可能性の少ない非注視領域を設定し、非注視領域に対して画素の列または行の間引き等を行い、所定サイズに縮小するものである。
【先行技術文献】
【特許文献】
【0013】
【非特許文献】
【0014】
【文献】“Object Files (.obj)”、[online]、the University of Utah、[令和1年7月19日検索]、インターネット<URL:http://www.cs.utah.edu/~boulos/cs3505/obj_spec.pdf>
【文献】“Alembic”、[online]、[令和1年7月19日検索]、インターネット<URL:http://www.alembic.io/>
【文献】“glTF2.0”、[online]、[令和1年9月25日検索]、インターネット<URL:https://github.com/KhronosGroup/glTF/tree/master/specification/2.0/>
【発明の概要】
【発明が解決しようとする課題】
【0015】
前述のとおり、3次元モデルデータは、プロダクションの段階から伝送・配信の段階へ移行するにあたり、ジオメトリの頂点の間引き、及びテクスチャの解像度の縮小が行われる。
【0016】
しかしながら、3次元モデルデータのデータ量を削減することにより、コンテンツの視覚品質が低下してしまう。
【0017】
また、前述のとおり、高解像度ジオメトリにおいて、エッジ部分等の高周波成分の多い領域について頂点削減の比率を低く設定することで、低解像度ジオメトリのディテールを残すように制御を行う手法がある。つまり、空間周波数が低い滑らかな形状ほど高い比率で頂点を削減し、空間周波数が高い凹凸のある形状ほど低い比率で頂点を削減する。人物の顔を例にすると、頬、額等の滑らかな曲面の部位は比較的高い比率で頂点を削減してもディテールが失われ難いが、目、鼻、耳等の凹凸のある部位の頂点を同じように高い比率で削減してしまうと細部の形状が潰れてディテールが失われてしまう。
【0018】
しかしながら、これと同種の手法では、コンテンツの主観品質の保持の観点で、必要のない領域の頂点について間引きを抑制する可能性があり、視覚品質に対して必ずしも効果的なデータ削減とならない場合がある。例えば、視点の異なる複数カメラから実写画像を撮影し、この実写画像を元に3次元モデルデータを生成するフォトグラメトリによって制作された3次元モデルデータでは、ノイズの発生が避けられない。一般に、フォトグラメトリによるノイズに起因するジオメトリには高周波成分が多く含まれており、高周波成分を維持するデータ削減手法ではノイズ成分が保持されてしまい、視覚品質に対して不利な結果となり得る。
【0019】
このように、3次元モデルデータのデータ量を削減するための従来の手法では、主観的な視覚品質が低下してしまうという問題があった。また、前述の特許文献1の手法は、画像の品質の低下を抑えるものであるが、2次元データを対象としており、3次元モデルデータにそのまま適用することができない。
【0020】
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、主観的な視覚品質が低下しないように、3次元モデルデータのデータ量を削減可能な3次元モデルデータ変換装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0021】
前記課題を解決するために、請求項1の3次元モデルデータ変換装置は、3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをUV座標により矩形画像へマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、前記高解像度テクスチャにおける全体の縮小率に対して、前記注目領域検出部により変換された前記3次元注目領域に対応する前記高解像度テクスチャのテクスチャ注目領域の部分テクスチャの縮小率が抑制されるように、前記高解像度テクスチャにおける前記テクスチャ注目領域の部分テクスチャの解像度を削減すると共に、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く領域の部分テクスチャの解像度を削減し、前記高解像度テクスチャを、前記低解像度のモデルデータを構成する低解像度テクスチャに変換し、前記ジオメトリ変換部により変換された前記低解像度ジオメトリに含まれる前記頂点の前記UV座標を変更し、新たな前記低解像度ジオメトリを生成するテクスチャ変換部と、を備えたことを特徴とする。
【0022】
また、請求項2の3次元モデルデータ変換装置は、3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをUV座標により矩形画像へマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、前記ジオメトリ変換部により変換された前記低解像度ジオメトリからその各面に対応する前記部分テクスチャを抽出し、前記部分テクスチャを前記矩形画像に再マッピングし、前記高解像度テクスチャと同じ解像度のテクスチャを、前記低解像度のモデルデータを構成する低解像度テクスチャとして生成するテクスチャ変換部と、を備えたことを特徴とする。
【0023】
また、請求項3の3次元モデルデータ変換装置は、請求項1に記載の3次元モデルデータ変換装置において、前記低解像度のモデルデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量を実効伝送容量Rとし、前記低解像度ジオメトリの単位時間あたりのデータ量をデータ量Goとし、前記低解像度テクスチャの単位時間あたりのデータ量をデータ量Toとし、前記高解像度テクスチャの単位時間あたりのデータ量をデータ量Tiとし、前記3次元注目領域の前記頂点を削減する比率を削減比率αとし、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減する比率を削減比率βとし、前記テクスチャ注目領域の前記部分テクスチャの前記解像度を削減する比率を削減比率γとし、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く前記領域の前記部分テクスチャの前記解像度を削減する比率を削減比率δとして、さらに、前記低解像度ジオメトリの前記データ量Goに前記低解像度テクスチャの前記データ量Toを加算した結果(Go+To)が前記実効伝送容量R以下となり、かつ前記削減比率αが前記削減比率βよりも小さくなるように、前記削減比率α及び前記削減比率βを決定し、前記高解像度テクスチャの前記データ量Ti及び前記低解像度テクスチャの前記データ量Toにおける比率To/Tiを算出し、1から前記比率To/Tiを減算し、前記削減比率δを決定し、前記削減比率γが前記削減比率δよりも小さくなるように、予め設定された係数a(0≦a<1)を前記削減比率δに乗算し、前記削減比率γを決定する削減比率決定部を備え、前記ジオメトリ変換部が、前記削減比率決定部により決定された前記削減比率αを用いて、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記削減比率決定部により決定された前記削減比率βを用いて、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減し、前記高解像度ジオメトリを前記低解像度ジオメトリに変換し、前記テクスチャ変換部が、前記削減比率決定部により決定された前記削減比率γを用いて、前記高解像度テクスチャにおける前記テクスチャ注目領域の前記部分テクスチャの前記解像度を削減すると共に、前記削減比率決定部により決定された前記削減比率δを用いて、前記高解像度テクスチャにおける前記テクスチャ注目領域を除く前記領域の前記部分テクスチャの前記解像度を削減し、前記高解像度テクスチャを前記低解像度テクスチャに変換する、ことを特徴とする。
【0024】
また、請求項4の3次元モデルデータ変換装置は、3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、前記高解像度のモデルデータを構成するジオメトリ及びテクスチャを、それぞれ高解像度ジオメトリ及び高解像度テクスチャとして、各頂点の情報からなる前記高解像度ジオメトリ、及び当該高解像度ジオメトリの前記頂点から構成される各面に対応する部分テクスチャをマッピングした前記高解像度テクスチャを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、を備えたことを特徴とする。
【0025】
また、請求項5の3次元モデルデータ変換装置は、請求項4に記載の3次元モデルデータ変換装置において、前記低解像度のモデルデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量を実効伝送容量Rとし、前記低解像度ジオメトリの単位時間あたりのデータ量をデータ量Goとし、前記3次元注目領域の前記頂点を削減する比率を削減比率αとし、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減する比率を削減比率βとして、さらに、前記低解像度ジオメトリの前記データ量G
o
が前記実効伝送容量R以下となり、かつ前記削減比率αが前記削減比率βよりも小さくなるように、前記削減比率α及び前記削減比率βを決定する削減比率決定部を備え、前記ジオメトリ変換部が、前記削減比率決定部により決定された前記削減比率αを用いて、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記削減比率決定部により決定された前記削減比率βを用いて、前記高解像度ジオメトリにおける前記3次元注目領域を除く前記領域の前記頂点を削減し、前記高解像度ジオメトリを前記低解像度ジオメトリに変換する、ことを特徴とする。
【0026】
また、請求項6の3次元モデルデータ変換装置は、請求項3に記載の3次元モデルデータ変換装置において、前記削減比率決定部が、前記削減比率α及び前記削減比率βを決定する際に、前記高解像度ジオメトリの単位時間あたりのデータ量をデータ量Giとし、前記高解像度ジオメトリの全体の頂点群に占める前記3次元注目領域に属する頂点群の比率を頂点群比率rとして、式:β≧1-(R-To-Gir(1-α))/Gi(1-r)を満たすように、かつ前記削減比率βが前記削減比率αよりも大きくなるように、前記削減比率α、または前記低解像度テクスチャの前記データ量To、または前記削減比率α及び前記低解像度テクスチャの前記データ量Toを変化させて、前記削減比率βを求めることで、前記削減比率α及び前記削減比率βを決定する、ことを特徴とする。
【0027】
また、請求項7の3次元モデルデータ変換装置は、請求項1から6までのいずれか一項に記載の3次元モデルデータ変換装置において、前記注目領域検出部が、前記複数の2次元画像のそれぞれについて、予め設定された特徴学習モデルを用いて、前記2次元注目領域、及び当該2次元注目領域における前記所定の特徴を有する度合いを示すスコアを求め、所定の閾値以上の前記スコアを有する前記2次元注目領域を、複数角度の視点との空間的位置関係から前記3次元注目領域に変換する、ことを特徴とする。
【0028】
また、請求項8の3次元モデルデータ変換装置は、3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換する3次元モデルデータ変換装置において、前記高解像度のモデルデータを構成するジオメトリを高解像度ジオメトリとして、各頂点の情報にカラー情報を含む前記高解像度ジオメトリを、複数角度の視点からレンダリングし、複数の2次元画像を生成するレンダラと、前記レンダラにより生成された前記複数の2次元画像のそれぞれについて、所定の特徴を有する2次元注目領域を検出し、前記複数の2次元画像の前記2次元注目領域を、前記高解像度ジオメトリの3次元注目領域に変換する注目領域検出部と、前記高解像度ジオメトリにおける全体の前記頂点の削減比率に対して、前記注目領域検出部により変換された前記3次元注目領域の前記頂点の削減比率が抑制されるように、前記高解像度ジオメトリにおける前記3次元注目領域の前記頂点を削減すると共に、前記高解像度ジオメトリにおける前記3次元注目領域を除く領域の前記頂点を削減し、前記高解像度ジオメトリを、前記低解像度のモデルデータを構成する低解像度ジオメトリに変換するジオメトリ変換部と、を備えたことを特徴とする。
【0029】
さらに、請求項9のプログラムは、コンピュータを、請求項1から8までのいずれか一項に記載の3次元モデルデータ変換装置として機能させることを特徴とする。
【発明の効果】
【0030】
以上のように、本発明によれば、主観的な視覚品質が低下しないように、3次元モデルデータのデータ量を削減することができる。
【図面の簡単な説明】
【0031】
【
図1】3次元映像伝送システムの全体構成例を示す概略図である。
【
図2】本発明の実施形態による3次元モデルデータ変換部の構成例を示すブロック図である。
【
図3】人物の3次元モデルデータにおいて、レンダラにより生成された2次元画像群の例、及び注目領域検出部により検出された2次元注目領域の例を説明する図である。
【
図4】注目領域検出部の処理例を示すフローチャートである。
【
図5】(1)は、高解像度ジオメトリの例を示す図であり、(2)は、従来技術による低解像度ジオメトリの例を示す図であり、(3)は、本発明の実施形態による低解像度ジオメトリの例を示す図である。
【
図6】(1)は、高解像度テクスチャの例を示す図であり、(2)は、従来技術による低解像度テクスチャの例を示す図であり、(3)は、本発明の実施形態による低解像度テクスチャの例を示す図である。
【
図7】削減比率決定部による削減比率α,βの決定処理例を示すフローチャートである。
【
図8】削減比率決定部による削減比率γ,δの決定処理例を示すフローチャートである。
【
図9】本発明の他の第1実施形態による3次元モデルデータ変換部の構成例を示すブロック図である。
【
図10】本発明の他の第2実施形態による3次元モデルデータ変換部の構成例を示すブロック図である。
【発明を実施するための形態】
【0032】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔3次元映像伝送システム〕
まず、3次元映像伝送システムについて説明する。
図1は、3次元映像伝送システムの全体構成例を示す概略図である。この3次元映像伝送システム1は、人物等の被写体から3次元モデルデータを制作し、制作された3次元コンテンツの高解像度のモデルデータを低解像度のモデルデータに変換して視聴者の端末へ伝送するシステムであり、制作処理装置9、送信処理装置3及び受信端末7を備えて構成される。
【0033】
制作処理装置9は、複数のカメラ2及び3次元モデルデータ生成部4を備えている。送信処理装置3は、3次元モデルデータ変換部(3次元モデルデータ変換装置)5及び配信装置6を備えている。伝送路8が配信装置6から受信端末7への片方向の通路である場合、受信端末7は、配信装置6から送信されたデータを、伝送路8を介して受信する。また、伝送路8が配信装置6と受信端末7との間における両方向の通路である場合、受信端末7は、配信装置6から送信されたデータを、伝送路8を介して受信し、配信装置6は、受信端末7から送信されたデータを、伝送路8を介して受信する。
【0034】
図1に示す3次元映像伝送システム1は、人物の3次元モデルデータの制作から受信までの全体の処理ブロック図を示している。
【0035】
3次元モデルデータ生成部4は、複数のカメラ2のそれぞれにより撮影された人物の2次元の画像データを入力する。そして、3次元モデルデータ生成部4は、複数の2次元の画像データに基づいて、高解像度のモデルデータを構成する高解像度ジオメトリ及び高解像度テクスチャからなるコンテンツデータを生成する。このように実写画像から3次元モデルデータを生成する処理は、一般にフォトグラメトリと呼ばれる。
【0036】
具体的には、3次元モデルデータ生成部4は、複数の2次元の画像データに基づいて、3次元モデルデータの各頂点についての3次元座標(XYZ座標)及び法線ベクトル等からなる、UV座標を含まないジオメトリを生成する。そして、3次元モデルデータ生成部4は、UV座標を含まないジオメトリから3角形の各面に対応する部分テクスチャを抽出し、部分テクスチャをUV座標により矩形画像へマッピングする。3次元モデルデータ生成部4は、UV座標を含むジオメトリである高解像度ジオメトリ、及び高解像度テクスチャからなるコンテンツデータを生成する。
【0037】
3次元モデルデータ生成部4は、高解像度ジオメトリ及び高解像度テクスチャからなるコンテンツデータを、プロダクション過程(制作過程)の出力データとして3次元モデルデータ変換部5に出力する。3次元モデルデータ生成部4と3次元モデルデータ変換部5との間の3次元モデルデータの受け渡しは、図示しない記録装置または伝送装置を介して行われるようにしてもよい。
【0038】
一般に、プロダクション過程の出力データであるコンテンツデータは、主観的及び定量的にできる限り高い品質を保持したデータとして生成される。3次元モデルデータ生成部4は、前述のとおり、コンテンツデータを生成するプロダクション過程の装置である。後段の配信装置6及び受信端末7は、コンテンツデータを配信装置6から伝送路8を介して受信端末7へ届けるデリバリー過程(伝送・配信過程)の装置である。
【0039】
ここで、伝送路8には、使用されている伝送方式及びパラメータによる理論的な上限帯域があり、さらに、当該伝送路8の品質または輻輳状態により実用可能な帯域に制約が生じる。実用可能な伝送帯域に応じて、コンテンツデータのデータサイズを調整するためには、高解像度ジオメトリ及び高解像度テクスチャを、伝送に適したデータ量の低解像度ジオメトリ及び低解像度テクスチャに変換する必要がある。本発明の実施形態では、このような変換を行うことで、主観的な視覚品質をできるだけ保ちながら、定量的なデータ量を削減する。
【0040】
3次元モデルデータ変換部5は、3次元モデルデータ生成部4から高解像度ジオメトリ及び高解像度テクスチャを入力すると共に、配信装置6から実効伝送帯域情報を入力し、さらに、図示しない学習装置からニューラルネットワーク等の特徴学習モデルのデータを入力する。実効伝送帯域情報は、伝送路8においてデータを伝送可能な帯域を示す情報である。特徴学習モデルは、図示しない学習装置により生成され、予め設定されたデータとして入力される。例えば、人物の顔領域を検出するための特徴学習モデルは、事前に教師データとして様々な人物の顔写真と、顔写真ではない写真を、正解ラベルを付けてニューラルネットワーク等に読み込ませることによって訓練された学習モデルである。
【0041】
3次元モデルデータ変換部5は、特徴学習モデルを用いて、高解像度ジオメトリ及び高解像度テクスチャにおける3次元モデルデータの注目領域を特定する。そして、3次元モデルデータ変換部5は、高解像度ジオメトリのデータ量及び高解像度テクスチャのデータ量が実効伝送帯域情報の示す帯域の容量以下に減少するように、注目領域及び注目領域外(高解像度ジオメトリの全領域のうち注目領域を除く領域)のそれぞれについて、高解像度のモデルデータを構成する高解像度ジオメトリ及び高解像度テクスチャを、低解像度のモデルデータを構成する低解像度ジオメトリ及び低解像度テクスチャに変換する。
【0042】
3次元モデルデータ変換部5は、低解像度ジオメトリ及び低解像度テクスチャを配信装置6に出力する。3次元モデルデータ変換部5の詳細については後述する。
【0043】
配信装置6は、3次元モデルデータ変換部5から低解像度ジオメトリ及び低解像度テクスチャを入力し、これらのデータを伝送用のパケット等に格納して、伝送路8を介して受信端末7へ送信する。例えば、配信装置6は、低解像度ジオメトリ及び低解像度テクスチャをIP(Internet Protocol)パケットに格納し、IPパケットを、インターネット回線を介して送信する。
【0044】
また、配信装置6は、例えば図示しない伝送路監視装置から実効伝送帯域情報を入力し、これを3次元モデルデータ変換部5に出力する。図示しない伝送路監視装置は、テストデータを送受信する等して、伝送路8の帯域を監視し、配信装置6から受信端末7へデータが伝送される際の伝送可能な帯域を測定する。伝送路監視装置は、例えば、配信装置6から受信端末7へデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量を実効伝送容量Rとして測定し、これを含む実効伝送帯域情報を生成し、実効伝送帯域情報を配信装置6へ出力する。
【0045】
尚、伝送路8が配信装置6と受信端末7との間における一対一の両方向の通路である場合、配信装置6は、受信端末7から受信状況に関する情報(例えば、パケットの正受信率、ジッタの程度を表すデータ)を受信するようにしてもよい。この場合、配信装置6は、受信状況に関する情報に基づいて、単位時間あたりの実効伝送容量Rを算出し、これを含む実効伝送帯域情報を生成する。
【0046】
また、配信装置6が常に一定のビットレートで伝送路8に対してデータを送信する装置である場合には、配信装置6に実効伝送容量Rが予め設定されている場合もあり得る。この場合、配信装置6は、予め設定された一定値の実効伝送容量Rを含む実効伝送帯域情報を3次元モデルデータ変換部5に出力する。例えば、放送用の送信装置がこのような場合に該当する。
【0047】
また、配信装置6は、当該配信装置6に備えた出力バッファの残量を反映させた動的な実効伝送容量Rを求め、これを含む実効伝送帯域情報を出力するようにしてもよい。つまり、配信装置6は、出力バッファに余裕がある場合には実効伝送容量Rを大きな値に設定し、出力バッファに余裕がない場合には実効伝送容量Rを小さな値に設定し、実効伝送帯域情報を出力する。このような制御により、配信装置6に備えた出力バッファのオーバーフローを防ぐと共に、伝送帯域の空きを削減し伝送効率を向上することができる。
【0048】
受信端末7は、配信装置6から伝送路8を介して低解像度ジオメトリ及び低解像度テクスチャを受信する。そして、受信端末7は、時系列の低解像度ジオメトリ及び低解像度テクスチャを連続再生し、被写体である人物等の3次元の動きをARまたはVRにて空間的に提示する。これにより、視聴者は、被写体である人物等を自由な視点から見ることができる。
【0049】
尚、3次元モデルデータ変換部5と配信装置6の間には、図示しないデータ圧縮装置が存在してもよい。データ圧縮装置は、例えばジオメトリの量子化処理、テクスチャの不可逆圧縮処理等の既知の手法によるデータサイズの削減を行う。ジオメトリの量子化の例として、32ビット浮動小数点データから16ビット浮動小数点への量子化等、ジオメトリの不可逆圧縮の例として、JPEG形式での圧縮符号化等が挙げられる。このような場合には、伝送路8の実際の実効伝送容量に対してデータ圧縮装置による削減率を加味した値を実効伝送容量Rとし、配信装置6が3次元モデルデータ変換部5に出力してもよい。例えば、伝送路8の実際の実効伝送容量が100Mbpsである場合、データ圧縮装置による圧縮率が1/2であれば、実効伝送容量R=200Mbpsとなる。
【0050】
〔3次元モデルデータ変換部5〕
次に、
図1に示した3次元モデルデータ変換部5について詳細に説明する。
図2は、本発明の実施形態による3次元モデルデータ変換部5の構成例を示すブロック図である。この3次元モデルデータ変換部5は、レンダラ10、注目領域検出部11、ジオメトリ変換部12、テクスチャ変換部13、データ量計測部14及び削減比率決定部15を備えている。
【0051】
(レンダラ10)
レンダラ10は、3次元モデルデータ生成部4から高解像度ジオメトリ及び高解像度テクスチャを入力する。そして、レンダラ10は、高解像度ジオメトリ及び高解像度テクスチャを用いて、全周囲の複数角度の視点からレンダリングし、複数の2次元画像を生成する。高解像度ジオメトリ及び高解像度テクスチャを用いてレンダリングし、2次元画像を生成する処理は既知であるため、ここでは説明を省略する。レンダラ10は、生成した複数の2次元画像である2次元画像群を注目領域検出部11に出力する。
【0052】
高解像度ジオメトリは、前述のとおり、3次元モデルデータの各頂点について、3次元座標(XYZ座標)、法線ベクトル、テクスチャのマッピングに使用する2次元座標(UV座標)等が記述されている。後述する低解像度ジオメトリも同様である。
【0053】
高解像度テクスチャは、前述のとおり、高解像度ジオメトリの多面体の各面に対応する部分テクスチャを2次元の矩形領域内にマッピングした、高解像度ジオメトリの各面の柄を定める矩形画像である。後述する低解像度テクスチャも同様に、低解像度ジオメトリの多面体の各面に対応する部分テクスチャを2次元の矩形領域内にマッピングした、低解像度ジオメトリの各面の柄を定める矩形画像である。
【0054】
図3は、人物の3次元モデルデータにおいて、レンダラ10により生成された2次元画像群の例、及び注目領域検出部11により検出された2次元注目領域の例を説明する図である。
図3に示す人物の2次元画像は、所定の高解像度ジオメトリ及び高解像度テクスチャに対し、被写体の重心の周りを取り囲む30度毎の視点位置s1,s2,・・・,s12からレンダリングすることにより得られた12個の画像群である。レンダリング手法としては、例えば、視点位置から被写体の重心方向を向く並行投影が使用される。
【0055】
例えば視点位置s1の2次元画像は、人物を後ろの所定位置からレンダリングすることにより得られた画像であり、視点位置s7の2次元画像は、人物を正前の所定位置からレンダリングすることにより得られた画像である。このように、レンダラ10により、
図3に示す2次元画像群が生成される。尚、被写体の人物は動くため、注目領域が検出される視点は、時間方向の各フレームによって変化し得る。
【0056】
(注目領域検出部11)
図2に戻って、注目領域検出部11は、事前に、図示しない学習装置から特徴学習モデルのデータを入力する。
【0057】
図示しない学習装置は、2次元画像を入力データとし、所定の特徴との適合度合いを示すスコアを出力データとする学習モデルに対し、所定の特徴を有する複数の2次元画像と所定の特徴を有しない複数の2次元画像、及び各2次元画像が所定の特徴を有するかどうかを示す正解ラベルを教師データとして与えることで、学習モデルを訓練する装置である。学習装置は、訓練した学習モデルを特徴学習モデルのデータとして出力する。学習モデルとしては、例えばニューラルネットワークが用いられる。ニューラルネットワークによる特徴学習モデルのデータは、例えば、学習モデルのネットワーク構造を定義するデータと、各ネットワークノードの重み係数等を記述したデータからなる。
【0058】
注目領域検出部11は、特徴学習モデルを用いることにより、レンダリングされた2次元画像から、所定の特徴を有する2次元注目領域及びスコアを得る。スコアは、2次元注目領域の特徴度合いを示すデータであり、スコアが高いほど、当該2次元注目領域は所定の特徴を有している度合いが高いことを示し、スコアが低いほど、当該2次元注目領域は所定の特徴を有している度合いが低いことを示している。尚、特徴学習モデルが特定の解像度(例えば、教師データと同じ解像度)の2次元画像のみを入力とする場合には、注目領域検出部11は、注目領域検出処理において、レンダリング画像の一部を特定の解像度に切り出してスコアを求める処理を繰り返すことで、2次元注目領域を探索してもよい。
【0059】
特徴学習モデルは、コンテンツ(番組)及びシーン(カット)に合わせて事前に制作され、コンテンツに紐づいたメタデータ等によって関連付けられてもよい。この場合、学習モデル及びメタデータは、コンテンツの完成データの一部として扱ってもよい。また、代表的な特徴学習モデルは、注目領域検出部11において汎用的なモデルとして事前に用意されていてもよい。この場合、特徴学習モデルはコンテンツの完成データの一部には含まれず、コンテンツのメタデータにより、汎用的な特徴学習モデルが指定される。
【0060】
注目領域検出部11は、与えられた特徴学習モデルを用いて、2次元画像群のそれぞれに対し注目領域検出処理を行い、最も注目部位らしい領域を、2次元画像の注目領域として検出する。そして、注目領域検出部11は、2次元画像の注目領域である2次元注目領域を、高解像度ジオメトリの注目領域である3次元注目領域に変換し、3次元注目領域に関する情報を3次元注目領域情報としてジオメトリ変換部12及び削減比率決定部15に出力する。
【0061】
図4は、注目領域検出部11の処理例を示すフローチャートである。注目領域検出部11は、制作者が意図する注目領域が変更されるコンテンツ先頭またはシーン先頭のタイミングで、図示しない学習装置から特徴学習モデルを入力する。この処理は、後述するステップS401~S405の事前処理として行われる。注目領域検出部11は、レンダラ10から、フレーム毎に2次元画像群を入力する(ステップS401)。
【0062】
注目領域検出部11は、特徴学習モデルを用いて、複数視点の2次元画像毎に、2次元注目領域及びスコアを求める(ステップS402)。具体的には、注目領域検出部11は、特徴学習モデルを用いて、2次元画像を入力データとして演算を行い、2次元画像から特徴部分が抽出された2次元注目領域、及び当該2次元注目領域のスコアを求める。
【0063】
注目領域検出部11は、所定の閾値以上のスコアを有する2次元注目領域を検出する(ステップS403)。所定の閾値として、例えば予め設定された値が用いられる。
【0064】
図3に示した例において、2次元注目領域を、人物の顔の特徴を有する領域とする。視点位置s1の2次元画像における2次元注目領域(図示せず)及びそのスコアをSc=0とし、視点位置s2の2次元画像における2次元注目領域(図示せず)及びそのスコアをSc=5とし、・・・、視点位置s6の2次元画像における2次元注目領域(点線の四角の枠内)及びそのスコアをSc=50とし、視点位置s7の2次元画像における2次元注目領域(点線の四角の枠内)及びそのスコアをSc=99とし、視点位置s8の2次元画像における2次元注目領域(点線の四角の枠内)及びそのスコアをSc=50とし、・・・、視点位置s12の2次元画像における2次元注目領域(図示せず)及びそのスコアをSc=5とする。
【0065】
注目領域検出部11により、視点位置s1~s12の2次元画像のそれぞれについて、
図3に示したスコアSc及び2次元注目領域が求められる。尚、
図3には、視点位置s6~s8の2次元画像における2次元注目領域が点線の四角の枠で示しており、視点位置s1~s5,s9~s12の2次元画像における2次元注目領域は省略してある。
【0066】
そして、注目領域検出部11により、スコアScが所定の閾値=50以上の2次元注目領域が検出される。
図3の例では、点線の四角の枠で示した、視点位置s6~s8の2次元画像におけるそれぞれの2次元注目領域が検出される。
【0067】
図4に戻って、注目領域検出部11は、検出した2次元注目領域(
図3の例では、視点位置s6~s8の2次元画像におけるそれぞれの2次元注目領域)を、3次元注目領域に変換する(ステップS404)。3次元注目領域は、高解像度ジオメトリにおいて、2次元注目領域が検出された複数の2次元画像とそれをレンダリングしたときの視点位置との間の空間的位置関係を用いて求められ、2次元注目領域に対応する頂点群を含む領域を示す。
【0068】
具体的には、レンダラ10において並行投影によるレンダリングが行われ、複数の2次元画像が生成された場合に、注目領域検出部11は、2次元画像群の中で2次元注目領域が検出された各画像について、2次元注目領域の中心を通り、視点位置と被写体の重心とを結ぶ直線に平行な直線を、3次元空間内に配置する。並行投影によるレンダリングでは、2次元から3次元への変換において、このような直線は1つに特定することができる。
【0069】
注目領域検出部11は、この処理を、2次元注目領域が検出された視点位置s6~s8の2次元画像について繰り返すことで、これらの直線が3次元空間内のある点において交わる場合、その交点を求めるか、または完全に交わらない場合であっても、その近い位置で交点を求める。注目領域検出部11は、この交点を、3次元注目領域の中心点に設定し、中心点からの半径を、2次元注目領域の大きさに基づいて決定する。
【0070】
注目領域検出部11は、ステップS404にて変換した3次元注目領域を示す情報を3次元注目領域情報(例えば、中心点の座標(中心座標)及び半径)としてジオメトリ変換部12に出力する(ステップS405)。
【0071】
尚、
図3の例では、注目領域検出部11は、人物の周りを30度毎の視点位置s1,s2,・・・,s12からレンダリングして得られた12個の2次元画像群を用いて、2次元注目領域を特定し、これを3次元注目領域に変換するようにした。
【0072】
これに対し、注目領域検出部11は、例えば1回目の試行で、スコアScが所定値を超える最も顔らしい領域を1つの2次元画像のみから検出した場合、その視点を中心に、周辺角度で徐々に角度分解能を上げて同様の試行を行い、注目部位検出の精度を上げるようにしてもよい。また、注目領域検出部11は、スコアScが所定値を超える領域を全ての2次元画像から検出できなかった場合、最もスコアScの高い領域を検出した2次元画像の視点を中心に、周辺角度で徐々に角度分解能を上げて同様の試行を行い、注目部位検出の精度を上げるようにしてもよい。
【0073】
具体的には、レンダラ10は、所定の視点位置におけるレンダリングにより、2次元画像を生成する。注目領域検出部11は、レンダラ10から2次元画像を入力し、当該2次元画像について、1つの視点の2次元画像のみから、2次元注目領域の要件である所定値(例えば50)以上のスコアScを得ることができたものとする。しかし、2次元注目領域を3次元注目領域に変換するためには、最低2つの視点の2次元画像における2次元注目領域を検出する必要がある。
【0074】
この場合、注目領域検出部11は、当該スコアScの2次元注目領域を最も顔らしい領域として視点位置の角度を特定し、当該角度を中心角度としてレンダラ10に出力する。レンダラ10は、注目領域検出部11から中心角度を入力し、中心角度を基準とした所定の周辺角度について角度分解能を上げて、レンダリングにより2次元画像群を生成する。そして、注目領域検出部11は、レンダラ10から2次元画像群を入力し、前述の処理を行い、複数の視点から2次元注目領域を特定し、これを3次元注目領域に変換する。
【0075】
尚、所定回数だけ上記の試行を繰り返しても、2次元注目領域が2以上の視点の2次元画像から検出されなかった場合には、予め設定された2次元注目領域の要件である所定値に対応する3次元注目領域が存在しないと判断してよい。
【0076】
(ジオメトリ変換部12)
図2に戻って、ジオメトリ変換部12は、3次元モデルデータ生成部4から高解像度ジオメトリを入力すると共に、注目領域検出部11から3次元注目領域情報を入力する。また、ジオメトリ変換部12は、削減比率決定部15から注目領域(ここでは3次元注目領域)の削減比率α及び注目領域外(高解像度ジオメトリの全領域のうち注目領域を除く領域)の削減比率βを入力する。
【0077】
ジオメトリ変換部12は、高解像度ジオメトリの全体の頂点数削減の比率に対して、高解像度ジオメトリの全領域のうちの3次元注目領域情報の示す3次元注目領域の頂点数削減の比率が抑制されるように(3次元注目領域の頂点数削減の比率が全体よりも低くなるように)、3次元注目領域の頂点を削減比率αにて削減すると共に、3次元注目領域以外の領域の頂点を削減比率βにて削減し、高解像度ジオメトリを低解像度ジオメトリに変換する。
【0078】
ここで、頂点数削減の比率は、頂点数を削減する度合いを示し、頂点数削減の比率を抑制するとは、頂点数を削減する度合いを低くする(さほど削減しない)ことを意味する。頂点数削減の比率は、後述する削減比率α,βに相当する。
【0079】
ジオメトリ変換部12は、低解像度ジオメトリをテクスチャ変換部13に出力すると共に、配信装置6に出力する。また、ジオメトリ変換部12は、注目領域検出部11から入力した3次元注目領域情報をテクスチャ変換部13に出力する。
【0080】
低解像度ジオメトリは、高解像度ジオメトリと同様に、各頂点について、3次元座標(XYZ座標)、法線ベクトル、テクスチャのマッピングに使用する2次元座標(UV座標)、及び、各面について面を構成する頂点の番号のセットが記述された情報である。ここで、ジオメトリ変換部12は、高解像度ジオメトリを低解像度ジオメトリに変換する際に、高解像度ジオメトリから所定の頂点が削減された低解像度ジオメトリの各面について、残存する面を構成する頂点の番号のセットを再構成する。例えば、隣接する4つの三角形の面が1つの頂点を共有しており、頂点数削減によりその共有した頂点が削除された場合、隣接する4つの三角形の面の数は2つに削減され、残存する2つの三角形の面についても、面を構成する頂点の番号のセットが変更される。
【0081】
尚、ジオメトリ変換部12は、高解像度ジオメトリの3次元注目領域の頂点を、削減比率αにて削減する際に、3次元注目領域内の全ての頂点を対象として、一様に(均一に)削減するようにしてもよい。また、ジオメトリ変換部12は、3次元注目領域において、エッジ部分等の高周波成分の多い領域については削減比率をαよりも低くし、高周波成分の多い領域以外については削減比率をαよりも高くすることで、高解像度ジオメトリの3次元注目領域の頂点を、全体として削減比率αにて削減するようにしてもよい。これにより、さらに低解像度ジオメトリのディテールを残すことができる。ジオメトリ変換部12が、高解像度ジオメトリの3次元注目領域以外の領域について、その頂点を削減比率βにて削減する場合も同様である。
【0082】
図5(1)は、高解像度ジオメトリの例を示す図である。
図5(2)は、従来技術による低解像度ジオメトリの例を示す図であり、高解像度ジオメトリに対して一様に頂点を削減した場合の例である。
図5(3)は、本発明の実施形態による低解像度ジオメトリの例を示す図であり、高解像度ジオメトリに対して3次元注目領域の頂点数の削減比率を抑制した場合の例である。
図5(1)は頂点のみを示しているが、
図5(2)(3)は、頂点に加え、面を表すための頂点間の線も示している。
【0083】
従来技術では、高解像度ジオメトリに対して一様に頂点が削減されることから、
図5(2)のとおり、低解像度ジオメトリの頂点は、全体として一様に分布している。
【0084】
これに対し、本発明の実施形態では、ジオメトリ変換部12により、高解像度ジオメトリの全体の頂点数削減の比率に対して、3次元注目領域の頂点数削減の比率が抑制されるように、高解像度ジオメトリが低解像度ジオメトリに変換される。このため、
図5(3)のとおり、低解像度ジオメトリにおける顔領域である3次元注目領域の頂点は、3次元注目領域外よりも高い密度で分布している。
【0085】
(テクスチャ変換部13)
図2に戻って、テクスチャ変換部13は、3次元モデルデータ生成部4から高解像度ジオメトリ及び高解像度テクスチャを入力すると共に、ジオメトリ変換部12から低解像度ジオメトリを入力し、さらに、ジオメトリ変換部12から3次元注目領域情報を入力する。また、テクスチャ変換部13は、削減比率決定部15から注目領域(ここではテクスチャ注目領域)の削減比率γ及び注目領域外(高解像度テクスチャの全領域のうちテクスチャ注目領域を除く領域)の削減比率δを入力する。
【0086】
テクスチャ変換部13は、高解像度ジオメトリ(及び低解像度ジオメトリ)の注目領域である3次元注目領域を、高解像度テクスチャの注目領域であるテクスチャ注目領域に変換する。高解像度テクスチャの全領域のうちテクスチャ注目領域以外の領域(テクスチャ注目領域を除く領域)を、テクスチャ注目領域外とする。
【0087】
具体的には、テクスチャ変換部13は、高解像度ジオメトリの全領域のうち、3次元注目領域情報の示す3次元注目領域の頂点群を注目頂点群とし、それ以外の領域の頂点群を注目外頂点群とする。そして、テクスチャ変換部13は、高解像度ジオメトリの注目頂点群についてそれぞれ関連付けられているUVの2次元座標の領域を、テクスチャ注目領域に設定する。すなわち、テクスチャ注目領域とは、注目頂点群に属する頂点により構成される面の各柄を決めている部分テクスチャの集合領域である。また、テクスチャ変換部13は、注目外頂点群についてそれぞれ記述されているUVの2次元座標の領域を、テクスチャ注目領域外に設定する。
【0088】
テクスチャ変換部13は、高解像度テクスチャの全体の縮小率(解像度の削減度合い)に対して、高解像度テクスチャの全領域のうちのテクスチャ注目領域の部分テクスチャの縮小率が抑制されるように、テクスチャ注目領域の部分テクスチャを低解像テクスチャへマッピングする際の解像度を削減比率γにて削減すると共に、テクスチャ注目領域外の部分テクスチャの解像度を削減比率δにて削減する。これにより、テクスチャ注目領域及びテクスチャ注目領域外のそれぞれについて、縮小された部分テクスチャの集合が得られる。
【0089】
ここで、縮小率が抑制されるとは、縮小する度合いを低くする(さほど縮小しない)ことを意味する。縮小率である解像度の削減度合いは、後述する削減比率γ,δに相当する。
【0090】
そして、テクスチャ変換部13は、解像度が削減されたテクスチャ注目領域の(縮小された)部分テクスチャ及びテクスチャ注目領域外の(縮小された)部分テクスチャについて、低解像度の矩形画像への再マッピングを行い、低解像度テクスチャを生成することで、高解像度テクスチャを低解像度テクスチャに変換する。この場合、テクスチャ変換部13は、この再マッピングに伴い、ジオメトリ変換部12から入力した低解像度ジオメトリに含まれる各頂点のUV座標を、低解像度テクスチャに対応するように変更し、再マッピング後の低解像度ジオメトリを生成する。
【0091】
テクスチャ変換部13は、低解像度ジオメトリ(再マッピング後の低解像度ジオメトリ)及び低解像度テクスチャを配信装置6に出力する。
【0092】
尚、テクスチャ変換部13は、低解像度テクスチャへの再マッピングの際に、当該低解像度テクスチャの規定のサイズ(解像度)の矩形画像の中に、全ての部分テクスチャを収めることができない場合があり得る。この場合、テクスチャ変換部13は、高解像度テクスチャよりも小さく、かつ低解像度テクスチャよりも大きいサイズの中間解像度の矩形画像に再マッピングし、当該中間解像度の矩形画像の全体を低解像度テクスチャの規定のサイズに縮小する。中間解像度の矩形画像から低解像度テクスチャへ変換する際の縮小率は、テクスチャ注目領域及びテクスチャ注目領域外を問わず一定とする(UVマップは変更されない)。
【0093】
図6(1)は、高解像度テクスチャの例を示す図である。
図6(2)は、従来技術による低解像度テクスチャの例を示す図であり、高解像度テクスチャに対して一様に解像度を削減した場合の例である。
図6(3)は、本発明の実施形態による低解像度テクスチャの例を示す図であり、高解像度テクスチャに対してテクスチャ注目領域の縮小率を抑制した場合の例である。
【0094】
図6(1)~(3)のテクスチャの座標は、UV座標系で表される。このUV座標は、高解像度ジオメトリ及び低解像度ジオメトリを構成する各面の部分テクスチャが矩形画像であるテクスチャにマッピングされた状態を示す2次元座標であり、ジオメトリの各頂点がUV座標を保持する。
【0095】
従来技術では、高解像度テクスチャに対して一様に解像度が削減されることから、
図6(2)のとおり、低解像度テクスチャの解像度は、全体として同じである。
【0096】
これに対し、本発明の実施形態では、テクスチャ変換部13により、高解像度テクスチャの全体領域の縮小率に対して、テクスチャ注目領域の部分テクスチャの縮小率が抑制されるように、高解像度テクスチャが低解像度テクスチャに変換される。このため、
図6(3)のとおり、低解像度テクスチャにおける顔領域であるテクスチャ注目領域の解像度は、テクスチャ注目領域外よりも高い。つまり、テクスチャ注目領域の縮小率は全体に対して抑制される。
【0097】
(データ量計測部14)
図2に戻って、データ量計測部14は、3次元モデルデータ生成部4から高解像度ジオメトリ及び高解像度テクスチャを入力する。高解像度ジオメトリ及び高解像度テクスチャがファイルシステム上で管理されている場合等、ファイルサイズを参照できる場合には、データ量計測部14は、データ本体ではなく、ファイルサイズのみの情報をファイルシステムから入力してよい。
【0098】
ここで、3次元モデルデータ変換部5が3次元モデルデータ生成部4から入力する高解像度ジオメトリ及び高解像度テクスチャについて、単位時間あたりの最大データ量をLとする。また、高解像度ジオメトリの単位時間あたりのデータ量をGiとし、高解像度テクスチャの単位時間あたりのデータ量をTiとする。つまり、L=Gi+Tiである。
【0099】
データ量計測部14は、入力した高解像度ジオメトリの単位時間あたりのデータ量Giを計測すると共に、入力した高解像度テクスチャの単位時間あたりのデータ量Tiを計測する。そして、データ量計測部14は、データ量Gi,Tiを削減比率決定部15に出力する。
【0100】
(削減比率決定部15)
削減比率決定部15は、データ量計測部14から高解像度ジオメトリの単位時間あたりのデータ量Gi(以下、高解像度ジオメトリのデータ量Giという。)、及び高解像度テクスチャの単位時間あたりのデータ量Ti(以下、高解像度テクスチャのデータ量Tiという。)を入力すると共に、配信装置6から実効伝送容量Rを含む実効伝送帯域情報を入力する。また、削減比率決定部15は、3次元モデルデータ生成部4から高解像度ジオメトリを入力すると共に、注目領域検出部11から3次元注目領域情報(例えば、中心座標及び半径)を入力する。
【0101】
実効伝送容量Rは、前述のとおり、配信装置6から受信端末7へデータが伝送される際の実際に伝送可能な単位時間あたりの最大のデータ量である。
【0102】
この場合、配信装置6がデータの損失なくコンテンツを伝送するためには、3次元モデルデータ変換部5において、平均でR/Lの比率にてデータ量の変換が必要である。言い換えると、平均で(1-R/L)の比率にてデータ量の削減が必要である。前述のとおり、L=Gi+Tiである。
【0103】
高解像度テクスチャに関しては、UVマップが再構成されるか否かに関わらず、低解像度テクスチャの出力解像度と圧縮率により平均的なデータ量(ビットレート)が決まり、低解像度テクスチャは、実効伝送容量Rのうち必ず一定割合を占める。このため、最初に、低解像度テクスチャのデータ量を決めることとする。このデータ量をToとする。すなわち、低解像度ジオメトリの伝送に使用可能なデータ量は、R-Toとなる。
【0104】
(削減比率α,β)
まず、高解像度ジオメトリに対する注目領域の削減比率α及び注目領域外の削減比率βの決定手法について説明する。高解像度ジオメトリにおける3次元注目領域情報の示す3次元注目領域により、高解像度ジオメトリの全体の頂点群に占める3次元注目領域に属する頂点群の比率が算出され、これを頂点群比率rとする。そうすると、高解像度ジオメトリの3次元注目領域のデータ量及び3次元注目領域外のデータ量は、以下のとおりである。
[数1]
(高解像度ジオメトリの3次元注目領域のデータ量)=Gir ・・・(1)
[数2]
(高解像度ジオメトリの3次元注目領域外のデータ量)=Gi(1-r)
・・・(2)
【0105】
低解像度ジオメトリのデータ量Goは、注目領域の削減比率α(0≦α<1)及び注目領域外の削減比率β(0≦α<β<1)を用いると、以下のとおりである。
[数3]
低解像度ジオメトリのデータ量Go=Gir(1-α)+Gi(1-r)(1-β)
=R-To ・・・(3)
前記式(3)の右辺の第一項は、低解像度ジオメトリの3次元注目領域のデータ量であり、第二項は、低解像度ジオメトリの3次元注目領域外のデータ量である。Toは、低解像度テクスチャのデータ量である。
【0106】
ここで、一例として3次元注目領域の頂点を全く削減しないで、3次元注目領域外の頂点のみを削減するものとする。この場合、注目領域の削減比率α=0が設定される。そうすると、前記式(3)は、以下の式で表される。
[数4]
低解像度ジオメトリのデータ量Go=Gir+Gi(1-r)(1-β)=R-To
・・・(4)
【0107】
前記式(4)から以下の式が導出される。
[数5]
実効伝送容量R=Gi-Gi(1-r)β+To ・・・(5)
【0108】
そして、配信装置6から受信端末7への伝送において、実効伝送容量R以下の伝送を実現するためには、以下の式を満たす必要がある。
[数6]
実効伝送容量R≧Gi-Gi(1-r)β+To ・・・(6)
【0109】
前記式(6)から以下の式が導出される。
[数7]
注目領域外の削減比率β≧1-(R-To-Gir)/Gi(1-r) ・・・(7)
【0110】
このように、削減比率決定部15は、注目領域の削減比率α=0を決定すると共に、前記式(7)の条件を満たす注目領域外の削減比率βを決定する。そして、削減比率決定部15は、決定した注目領域の削減比率α=0及び注目領域外の削減比率βをジオメトリ変換部12に出力する。
【0111】
これにより、低解像度ジオメトリ及び低解像度テクスチャは、実効伝送容量R以下にて、配信装置6から受信端末7へ伝送することができる。
【0112】
図7は、削減比率決定部15による削減比率α,βの決定処理例を示すフローチャートである。削減比率決定部15は、高解像度ジオメトリ及び3次元注目領域情報に基づいて、頂点群比率rを算出する(ステップS701)。
【0113】
具体的には、削減比率決定部15は、高解像度ジオメトリの全体の頂点群の数を求め、高解像度ジオメトリの全体の頂点群の数のうち、3次元注目領域情報の示す3次元注目領域に含まれる頂点群の数を求める。そして、削減比率決定部15は、これらの頂点群の数の比率を、高解像度ジオメトリの頂点群に占める3次元注目領域に属する頂点群の比率(頂点群比率r)として算出する。
【0114】
削減比率決定部15は、注目領域の削減比率αを初期設定する(ステップS702)。削減比率αは0であってもよいし、後述するステップS705において削減比率αが増加することを考慮して、0を超える実数であってもよい。削減比率αは初期値が予め設定される。
【0115】
削減比率決定部15は、以下の式を満たすように、注目領域外の削減比率βを算出する(ステップS703)。
[数8]
注目領域外の削減比率β≧1-(R-To-Gir(1-α))/Gi(1-r)
・・・(8)
この式は、前記式(3)を、α≠0として前記式(4)から前記式(7)へと同じ手順で展開して得られたものである。ここで、実効伝送容量Rは配信装置6から入力され、低解像度テクスチャのデータ量Toは予め設定される。また、高解像度ジオメトリのデータ量Giはデータ量計測部14から入力され、頂点群比率rはステップS701の処理にて算出される。さらに、注目領域の削減比率αは、ステップS702(または後述するステップS705)にて設定される。
【0116】
尚、注目領域検出部11において、2次元注目領域が検出されなかった場合には、頂点群比率r=0となることから、削減比率βはβ=1-(R-To)/Giにより定まり、ジオメトリの全領域の頂点が一様に削減される。
【0117】
削減比率決定部15は、ステップS703にて算出した注目領域外の削減比率βが予め設定された閾値以上であるか否かを判定する(ステップS704)。そして、削減比率決定部15は、ステップS704において、注目領域外の削減比率βが閾値以上であると判定した場合(ステップS704:Y)、注目領域の削減比率αに予め設定された増分Δ1を加算し、α<βとなる範囲にて新たな削減比率αを設定する(ステップS705、α←α+Δ1)。削減比率決定部15は、ステップS703へ移行し、新たな削減比率αを用いて、前記式(8)を満たすように、注目領域外の削減比率βを算出する。
【0118】
削減比率決定部15は、ステップS705において、α<βとなる範囲にて新たな削減比率αを設定することができない場合、すなわち、新たな削減比率αが削減比率β以上となる場合、異常が発生したとして処理を中止する。
【0119】
一方、削減比率決定部15は、ステップS704において、注目領域外の削減比率βが閾値以上でないと判定した場合(ステップS704:N)、ステップS702またはステップS705にて設定した注目領域の削減比率α及びステップS703にて算出した注目領域外の削減比率βを、ジオメトリ変換部12にて用いる削減比率α,βとして決定し、これらをジオメトリ変換部12に出力する(ステップS706)。
【0120】
尚、削減比率決定部15は、ステップS705において、注目領域の削減比率αの代わりに、低解像度テクスチャのデータ量Toを変化させるようにしてもよい。具体的には、削減比率決定部15は、ステップS705において、低解像度テクスチャのデータ量Toから予め設定された減分Δ2を減算し、新たな低解像度テクスチャのデータ量Toを設定する。そして、削減比率決定部15は、ステップS703へ移行し、新たな低解像度テクスチャのデータ量Toを用いて、前記式(8)を満たすように、注目領域外の削減比率βを算出する。この場合の注目領域の削減比率αは、予め設定された初期値から変化しない。
【0121】
また、削減比率決定部15は、ステップS705において、注目領域の削減比率αに加えて、低解像度テクスチャのデータ量Toを変化させるようにしてもよい。具体的には、削減比率決定部15は、ステップS705において、注目領域の削減比率αに予め設定された増分Δ1を加算し、α<βとなる範囲にて新たな削減比率αを設定すると共に、低解像度テクスチャのデータ量Toから予め設定された減分Δ2を減算し、新たな低解像度テクスチャのデータ量Toを設定する。そして、削減比率決定部15は、ステップS703へ移行し、新たな削減比率α及び新たな低解像度テクスチャのデータ量Toを用いて、前記式(8)を満たすように、注目領域外の削減比率βを算出する。
【0122】
このように、削減比率決定部15は、注目領域の削減比率αを設定し、前記式(8)の条件を満たす注目領域外の削減比率βを設定し、削減比率βが閾値以上である場合、注目領域の削減比率αを変化させることで、新たな削減比率βを設定し、削減比率βが閾値未満である場合、設定した削減比率α,βをジオメトリ変換部12にて用いる削減比率α,βに決定する。
【0123】
これにより、低解像度ジオメトリ及び低解像度テクスチャは、実効伝送容量R以下にて、配信装置6から受信端末7へ伝送することができる。
【0124】
また、削減比率決定部15は、前記式(3)から導出した以下の式を満たすように、注目領域の削減比率α、注目領域外の削減比率β及び低解像度テクスチャのデータ量Toの3つのパラメータを変化させ、これらのパラメータを決定するようにしてもよい。
[数9]
R≧Gir(1-α)+Gi(1-r)(1-β)+To ・・・(9)
【0125】
前記式(9)は、低解像度ジオメトリの3次元注目領域のデータ量(Gir(1-α))、低解像度ジオメトリの3次元注目領域外のデータ量(Gi(1-r)(1-β))及び低解像度テクスチャのデータ量Toの加算結果が、実効伝送容量R以下であることを示す式である。
【0126】
前記式(9)と、式:実効伝送容量R≧Go+Toとは、数学的に等価である。削減比率決定部15は、実効伝送容量Rと、低解像度ジオメトリのデータ量Goに低解像度テクスチャのデータ量Toを加算して得られた結果である3次元モデルデータ変換後のデータ量(Go+To)との間の関係が、前記式を満たすように((Go+To)がR以下となるように)、すなわち、前記式(8)を満たすように、かつ注目領域の削減比率α及び注目領域外の削減比率βの関係がα<βとなるように、注目領域の削減比率α、または低解像度テクスチャのデータ量To、または注目領域の削減比率α及び低解像度テクスチャのデータ量Toを変化させて、注目領域外の削減比率βを求めることで、注目領域の削減比率α及び注目領域外の削減比率βを決定する。
【0127】
これにより、注目領域の削減比率α、注目領域外の削減比率β及び低解像度テクスチャのデータ量Toの3つのパラメータが調整されることで、低解像度ジオメトリ及び低解像度テクスチャが、実効伝送容量R以下にて、配信装置6から受信端末7へ伝送されることとなる。
【0128】
(削減比率γ,δ)
次に、高解像度テクスチャに対する注目領域の削減比率γ及び注目領域外の削減比率δの決定手法について説明する。
図8は、削減比率決定部15による削減比率γ,δの決定処理例を示すフローチャートである。
【0129】
削減比率決定部15は、データ量計測部14から入力した高解像度テクスチャのデータ量Ti、及び例えば予め設定された低解像度テクスチャのデータ量Toから、その比率To/Tiを算出する(ステップS801)。具体的には、削減比率決定部15は、低解像度テクスチャのデータ量Toを高解像度テクスチャのデータ量Tiで除算することで、比率To/Tiを求める。
【0130】
削減比率決定部15は、以下の式により、1から比率To/Tiを減算して注目領域外の削減比率δを求め、これを、テクスチャ変換部13にて用いる削減比率δとして決定する(ステップS802)。
[数10]
δ=1-To/Ti ・・・(10)
【0131】
削減比率決定部15は、以下の式により、削減比率γが削減比率δよりも小さくなるように、所定の係数aを削減比率δに乗算して注目領域の削減比率γを求め、これを、テクスチャ変換部13にて用いる削減比率γとして決定する(ステップS803)。係数aは、0≦a<1までの範囲で予め設定される。すなわち、γ<δである。
[数11]
γ=aδ ・・・(11)
【0132】
削減比率決定部15は、注目領域の削減比率γ及び注目領域外の削減比率δをテクスチャ変換部13に出力する(ステップS804)。
【0133】
このように、削減比率決定部15により決定された削減比率α,βはジオメトリ変換部12に出力され、削減比率γ,δはテクスチャ変換部13へ出力される。そして、ジオメトリ変換部12により、削減比率α,βを用いて高解像度ジオメトリが低解像度ジオメトリに変換され、テクスチャ変換部13により、削減比率γ,δを用いて高解像度テクスチャが低解像度テクスチャに変換される。
【0134】
以上のように、本発明の実施形態の3次元モデルデータ変換部5によれば、レンダラ10は、高解像度ジオメトリ及び高解像度テクスチャを用いて、全周囲の複数角度の視点からレンダリングし、2次元画像群を生成する。
【0135】
注目領域検出部11は、特徴学習モデルを用いて、2次元画像毎に、2次元注目領域及びスコアを求め、所定の閾値以上のスコアを有する2次元注目領域を検出し、検出した2次元注目領域を3次元注目領域に変換する。
【0136】
削減比率決定部15は、実効伝送容量Rと、低解像度ジオメトリのデータ量Goに低解像度テクスチャのデータ量Toを加算して得られた結果である3次元モデルデータ変換後のデータ量(Go+To)との間の関係が、R≧Go+Toを満たすように、すなわち、前記式(8)を満たすように、かつ注目領域の削減比率α及び注目領域外の削減比率βの関係がα<βとなるように、注目領域の削減比率α、または低解像度テクスチャのデータ量To、または注目領域の削減比率α及び低解像度テクスチャのデータ量Toを変化させて、注目領域外の削減比率βを求めることで、注目領域の削減比率α及び注目領域外の削減比率βを決定する。
【0137】
これにより、ジオメトリ変換部12において、高解像度ジオメトリの全体の頂点数削減の比率に対して、3次元注目領域の頂点数削減の比率を抑制するように(3次元注目領域の頂点数削減の比率が、高解像度ジオメトリの全体の頂点数削減の比率よりも低くなるように)、注目領域の削減比率α及び注目領域外の削減比率βが決定される。
【0138】
また、削減比率決定部15は、高解像度テクスチャのデータ量Ti及び低解像度テクスチャのデータ量Toから比率To/Tiを算出し、1から比率To/Tiを減算して注目領域外の削減比率δを決定する。そして、削減比率決定部15は、削減比率δが削減比率γよりも大きくなるように、予め設定された係数a(0≦a<1)を削減比率δに乗算して注目領域の削減比率γを決定する。
【0139】
これにより、テクスチャ変換部13において、高解像度テクスチャの全体の縮小率(解像度削減の比率)に対して、テクスチャ注目領域の縮小率を抑制するように(テクスチャ注目領域の縮小率が、高解像度テクスチャの全体の縮小率よりも低くなるように)、注目領域の削減比率γ及び注目領域外の削減比率δが決定される。
【0140】
ジオメトリ変換部12は、高解像度ジオメトリの3次元注目領域の頂点を削減比率αにて削減すると共に、3次元注目領域以外の領域の頂点を削減比率βにて削減し、高解像度ジオメトリを低解像度ジオメトリに変換する。
【0141】
これにより、高解像度ジオメトリの全体の頂点数削減の比率に対して、3次元注目領域の頂点数削減の比率が抑制されるように、低解像度ジオメトリが生成されることとなる。
【0142】
テクスチャ変換部13は、高解像度テクスチャにおけるテクスチャ注目領域の部分テクスチャの解像度を削減比率γにて削減すると共に、テクスチャ注目領域外の部分テクスチャの解像度を削減比率δにて削減し、解像度が削減されたテクスチャ注目領域の部分テクスチャ及びテクスチャ注目領域外の部分テクスチャについて、低解像度の矩形画像への再マッピングを行い、低解像度テクスチャを生成することで、高解像度テクスチャを低解像度テクスチャに変換する。また、テクスチャ変換部13は、再マッピングに伴い、低解像度ジオメトリに含まれる各頂点のUV座標を変更し、再マッピング後の低解像度ジオメトリを生成する。
【0143】
これにより、高解像度テクスチャの全体の縮小率に対して、テクスチャ注目領域の部分テクスチャの縮小率が抑制されるように、低解像度テクスチャが生成されることとなる。
【0144】
一般に、視聴者は、人物3次元モデルデータを含む3次元コンテンツを視聴する際に、人物の顔の表情、手指の動き等、無意識に目に入りやすい領域に注目する。本発明の実施形態では、これらの注目領域の品質劣化を抑制することができ、3次元コンテンツ全体としての主観的な視覚品質の低下を抑えることができる。
【0145】
また、3次元モデルデータ上での周波数特徴ではなく、コンテンツ制作者の意図により品質を保持したい注目領域に対応した特徴学習モデルを与え、2次元にレンダリングした画像特徴を用いて注目領域を抽出し、的確に主観品質に影響を与える領域を限定するようにした。これにより、主観的な視覚品質が低下しないように、3次元モデルデータのデータ量を削減することができる。
【0146】
〔他の例1〕
次に、本発明の他の第1実施形態について説明する。
図9は、本発明の他の第1実施形態による3次元モデルデータ変換部の構成例を示すブロック図である。3次元オブジェクトの表現方法としては、
図2に示した3次元のジオメトリと2次元のテクスチャとを組み合わせた3次元モデルデータによる方式の他に、3次元のジオメトリの各頂点にカラー情報(RGB、YCbCr等)を持たせる3次元点群データによる方式がある。
図9では、このカラー情報を持たせる3次元点群データによる方式を実現する。
【0147】
この3次元モデルデータ変換部5’は、レンダラ10’、注目領域検出部11、ジオメトリ変換部12、データ量計測部14’及び削減比率決定部15’を備えている。
【0148】
レンダラ10’は、3次元モデルデータ生成部4からカラー情報を含む高解像度ジオメトリを入力し、高解像度ジオメトリを、全周囲の複数角度の視点からレンダリングし、複数の2次元画像を生成する。そして、レンダラ10’は、生成した複数の2次元画像である2次元画像群を注目領域検出部11に出力する。
【0149】
レンダラ10’が入力する高解像度ジオメトリは、各頂点について、3次元座標(XYZ座標)、法線ベクトル等に加え、カラー情報が記述されている。ジオメトリ変換部12が出力する低解像度ジオメトリも同様である。
【0150】
注目領域検出部11は、レンダラ10’から2次元画像群を入力し、
図2に示した注目領域検出部11と同様の処理を行い、3次元注目領域情報をジオメトリ変換部12及び削減比率決定部15’に出力する。
【0151】
ジオメトリ変換部12は、3次元モデルデータ生成部4から、カラー情報を含む高解像度ジオメトリを入力すると共に、注目領域検出部11から3次元注目領域情報を入力する。また、ジオメトリ変換部12は、削減比率決定部15’から注目領域の削減比率α及び注目領域外の削減比率βを入力する。
【0152】
ジオメトリ変換部12は、
図2に示したジオメトリ変換部12と同様の処理を行い、カラー情報を含む高解像度ジオメトリを低解像度ジオメトリに変換し、カラー情報を含む低解像度ジオメトリを配信装置6に出力する。
【0153】
データ量計測部14’は、3次元モデルデータ生成部4からカラー情報を含む高解像度ジオメトリを入力し、入力した高解像度ジオメトリのデータ量Giを計測する。そして、データ量計測部14’は、高解像度ジオメトリのデータ量Giを削減比率決定部15’に出力する。
【0154】
削減比率決定部15’は、データ量計測部14’から高解像度ジオメトリのデータ量Giを入力すると共に、配信装置6から実効伝送容量Rを含む実効伝送帯域情報を入力する。また、削減比率決定部15’は、3次元モデルデータ生成部4からカラー情報を含む高解像度ジオメトリを入力すると共に、注目領域検出部11から3次元注目領域情報(例えば、中心座標及び半径)を入力する。
【0155】
削減比率決定部15’は、
図2に示した削減比率決定部15と同様の処理を行う。すなわち、削減比率決定部15’は、実効伝送容量Rと、低解像度ジオメトリのデータ量G
oとの間の関係が、以下の式を満たすように(G
oがR以下となるように)(式(12)は前記式:実効伝送容量R≧G
o+T
oに対応する。)、
[数12]
実効伝送容量R≧G
o ・・・(12)
すなわち、以下の式を満たすように、
[数13]
注目領域外の削減比率β≧1-(R-G
ir(1-α))/G
i(1-r)
・・・(13)
注目領域の削減比率α及び注目領域外の削減比率βの関係がα<βの範囲内で、注目領域の削減比率αを変化させて、注目領域外の削減比率βを求めることで、注目領域の削減比率α及び注目領域外の削減比率βを決定する。
【0156】
これにより、ジオメトリ変換部12において、高解像度ジオメトリの全体の頂点数削減の比率に対して、3次元注目領域の頂点数削減の比率を抑制するように(3次元注目領域の頂点数削減の比率が、高解像度ジオメトリの全体の頂点数削減の比率よりも低くなるように)、注目領域の削減比率α及び注目領域外の削減比率βが決定される。
【0157】
以上のように、本発明の他の第1実施形態の3次元モデルデータ変換部5’によれば、ジオメトリ変換部12は、高解像度ジオメトリの頂点の削減と同時に、カラー情報も削減する。
【0158】
これにより、
図2に示したテクスチャ変換部13による高解像度テクスチャを低解像度テクスチャに変換する処理及びテクスチャ再マッピング処理、低解像度ジオメトリの頂点が保持するUV座標を変更する処理が不要となる。このように、主観的な視覚品質が低下しないように、3次元モデルデータのデータ量を削減することができ、さらに、
図2に比べて処理負荷を低減することができる。
【0159】
〔他の例2〕
次に、本発明の他の第2実施形態について説明する。
図10は、本発明の他の第2実施形態による3次元モデルデータ変換部の構成例を示すブロック図である。
図2に示した本発明の実施形態による3次元モデルデータ変換部5は、高解像度ジオメトリを低解像度ジオメトリに変換すると共に、高解像度テクスチャを低解像度テクスチャに変換する。これに対し、本発明の他の第2実施形態による3次元モデルデータ変換部は、高解像度ジオメトリを低解像度ジオメトリに変換するが、高解像度テクスチャの解像度を変換しないで、高解像度テクスチャと同じ解像度の矩形画像を低解像度テクスチャとして出力する。
【0160】
この3次元モデルデータ変換部5”は、レンダラ10、注目領域検出部11、ジオメトリ変換部12、データ量計測部14’及び削減比率決定部15’を備えており、
図2に示したテクスチャ変換部13を備えていない。3次元モデルデータ変換部5”は、ジオメトリの頂点削減において、UVマップを保持するため、UVアイランドの境界線上の頂点は削減しない。
【0161】
レンダラ10、注目領域検出部11及びジオメトリ変換部12は、
図2に示した構成部と同じであるため、ここでは説明を省略する。データ量計測部14’及び削減比率決定部15’は、
図9に示した構成部と同じであるため、ここでは説明を省略する。ここで、ジオメトリ変換部12は、高解像度テクスチャにおけるUVアイランドの境界線のUV座標に対応する高解像度ジオメトリの頂点を削減しないように(頂点を維持する制約の下で)、高解像度ジオメトリを低解像度ジオメトリに変換する。
【0162】
以上のように、本発明の他の第2実施形態の3次元モデルデータ変換部5”によれば、
図2に示したテクスチャ変換部13による高解像度テクスチャを低解像度テクスチャに変換する処理及びテクスチャ再マッピング処理、低解像度ジオメトリの頂点が保持するUV座標を変更する処理が不要となる。このように、主観的な視覚品質が低下しないように、3次元モデルデータのデータ量を削減することができ、さらに、
図2に比べて処理負荷を低減することができる。
【0163】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。
【0164】
例えば
図2に示した3次元モデルデータ変換部5において、テクスチャ変換部13は、高解像度テクスチャにおけるテクスチャ注目領域の部分テクスチャの解像度を削減比率γにて削減すると共に、テクスチャ注目領域外の部分テクスチャの解像度を削減比率δにて削減し、解像度が削減されたテクスチャ注目領域の部分テクスチャ及びテクスチャ注目領域外の部分テクスチャについて、低解像度の矩形画像への再マッピングを行い、低解像度テクスチャを生成することで、高解像度テクスチャを低解像度テクスチャに変換するようにした。
【0165】
これに対し、ジオメトリ変換部12により、高解像度テクスチャにおけるUVアイランドの境界線のUV座標に対応する高解像度ジオメトリの頂点が削減され、UVマップを保持することができない場合には、テクスチャ変換部13は、高解像度テクスチャの解像度を変更することなく、低解像度ジオメトリを構成する各面の部分テクスチャを矩形画像に再マッピングし、高解像度テクスチャと同じ解像度の矩形画像を低解像度テクスチャとして生成するようにしてもよい。すなわち、テクスチャ変換部13は、低解像度ジオメトリから部分テクスチャを抽出し、部分テクスチャの解像度を縮小することなく矩形画像に再マッピングし、低解像度テクスチャを生成する。
【0166】
つまり、高解像度テクスチャと低解像度テクスチャとが同じ解像度であってもよい。この場合、低解像度テクスチャの単位時間あたりのデータ量To及び高解像度テクスチャの単位時間あたりのデータ量Tiは、To=Tiの関係となり、注目領域の削減比率γ=0、及び注目領域外の削減比率δ=0である。
【0167】
また、例えば3次元モデルデータ変換部5の注目領域検出部11は、顔の特徴を有する注目領域に着目し、特徴学習モデルを用いて、2次元画像群のそれぞれに対し注目領域検出処理を行い、顔の特徴を有する2次元注目領域を検出するようにした。
【0168】
これに対し、注目領域検出部11は、顔以外の手指の特徴を有する注目領域に着目するようにしてもよい。この場合、図示しない学習装置は、人物等の2次元画像を入力データとし、手指の特徴を有する2次元注目領域及び当該2次元注目領域のスコアを出力データとする学習モデルを訓練し、特徴学習モデルとして出力する。注目領域検出部11は、この特徴学習モデルを用いて、2次元画像群のそれぞれに対し注目領域検出処理を行い、手指の特徴を有する2次元注目領域を検出する。
【0169】
また、コンテンツの特性に応じて、顔に加えて手指など複数の特徴量を検出可能な特徴学習モデルを用い、高解像度ジオメトリの各領域に対して品質維持の優先順位を設定するようにしてもよい。例えば、楽器演奏家の3次元モデルデータを演奏指導用のコンテンツとして配信する場合には、演奏家の細かい手指の動きが見えるように、ユーザは、手指領域の品質保持を第一優先とするように設定し、顔領域の品質保持は第二優先とするように設定する。
【0170】
この場合、図示しない学習装置は、人物の2次元画像を入力データとし、手指の特徴を有する第1の2次元注目領域及び顔の特徴を有する第2の2次元注目領域、並びに当該第1の2次元注目領域のスコア及び当該第2の2次元注目領域のスコアを出力データとする学習モデルを訓練し、特徴学習モデルとして出力する。注目領域検出部11は、この特徴学習モデルを用いて、2次元画像群のそれぞれに対し、注目領域検出処理を行い、手指の特徴を有する第1の2次元注目領域及び顔の特徴を有する第2の2次元注目領域を検出する。削減比率決定部15は、前述と同様の処理にて、手指の特徴を有する第1の注目領域の削減比率α1,γ1、顔の特徴を有する第2の注目領域の削減比率α2,γ2及び注目領域外の削減比率β,δを決定する。
【0171】
また、配信装置6は、低解像度ジオメトリ及び低解像度テクスチャを含むIPパケット等を直ちに後段のネットワーク等に送出せず、低解像度ジオメトリ及び低解像度テクスチャのデータをHDDやSSD等の記録媒体に保存する記録装置と、記録媒体に記録された低解像度ジオメトリ及び低解像度テクスチャを読み出して再生する再生装置とに分離しても良い。この場合、3次元モデルデータ変換部5は、コンテンツの時間尺による再生時の出力データ量に従ったデータ変換処理を行う必要があるが、データ変換処理は必ずしも再生時と同じ速度でリアルタイムに実行する必要はない。
【0172】
尚、本発明の実施形態による3次元モデルデータ変換部5のハードウェア構成としては、通常のコンピュータを使用することができる。3次元モデルデータ変換部5は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
【0173】
3次元モデルデータ変換部5に備えたレンダラ10、注目領域検出部11、ジオメトリ変換部12、テクスチャ変換部13、データ量計測部14及び削減比率決定部15の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0174】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
【産業上の利用可能性】
【0175】
本発明の実施形態による3次元モデルデータ変換部5は、3次元CG編集ソフトウェアにおけるデータ量削減機能として実装することができ、ジオメトリ及びテクスチャの符号化装置の前処理装置として実装することもできる。また、ARまたはVRコンテンツのプロダクション及び配信サービスに用いることができる。
【符号の説明】
【0176】
1 3次元映像伝送システム
2 カメラ
3 送信処理装置
4 3次元モデルデータ生成部
5,5’,5” 3次元モデルデータ変換部
6 配信装置
7 受信端末
8 伝送路
9 制作処理装置
10,10’ レンダラ
11 注目領域検出部
12 ジオメトリ変換部
13 テクスチャ変換部
14,14’ データ量計測部
15,15’ 削減比率決定部
α,α1,α2,γ,γ1,γ2 注目領域の削減比率
β,δ 注目領域外の削減比率
Gi 高解像度ジオメトリの単位時間あたりのデータ量
Go 低解像度ジオメトリの単位時間あたりのデータ量
Ti 高解像度テクスチャの単位時間あたりのデータ量
To 低解像度テクスチャの単位時間あたりのデータ量
R 実効伝送容量
s1,s2,・・・,s12 視点位置
Sc スコア
r 頂点群比率
Δ1 増分
Δ2 減分
a 係数