(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-17
(45)【発行日】2024-07-25
(54)【発明の名称】送信装置、受信装置、ネットワークノード、及びプログラム
(51)【国際特許分類】
H04N 21/84 20110101AFI20240718BHJP
H04N 21/438 20110101ALI20240718BHJP
H04N 21/647 20110101ALI20240718BHJP
【FI】
H04N21/84
H04N21/438
H04N21/647
(21)【出願番号】P 2020137076
(22)【出願日】2020-08-14
【審査請求日】2023-07-14
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】河村 侑輝
(72)【発明者】
【氏名】楠 知也
(72)【発明者】
【氏名】永田 裕靖
(72)【発明者】
【氏名】山上 悠喜
(72)【発明者】
【氏名】今村 浩一郎
【審査官】醍醐 一貴
(56)【参考文献】
【文献】特開2009-049976(JP,A)
【文献】特表2019-513275(JP,A)
【文献】特開2003-009102(JP,A)
【文献】特開2019-195157(JP,A)
【文献】特開2019-221001(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
放送型3次元空間コンテンツの構成要素であるオブジェクトをそれぞれ複数の解像度パターンのデータで送信する送信装置であって、
前記オブジェクトを識別するオブジェクトID、及び前記オブジェクトの解像度パターンごとのパケットを識別するパケットIDと、前記解像度パターンの推奨提示解像度と、を対応付ける情報を含むメタデータを生成するメタデータ生成部と、
前記解像度パターンのデータごとに伝送フレームを構成する伝送フレーム構成部と、
前記オブジェクトID及び前記パケットIDをヘッダ情報として有する前記伝送フレームのパケットと、前記メタデータのパケットと、を生成するパケット構成部と、
を備える送信装置。
【請求項2】
前記メタデータ生成部は、3次元空間内での各オブジェクトの提示位置を示すオブジェクト提示位置情報を更に含むメタデータを生成する、請求項1に記載の送信装置。
【請求項3】
前記オブジェクト提示位置情報は、バウンディングボックス情報である、請求項2に記載の送信装置。
【請求項4】
請求項1に記載の送信装置からパケットを受信する受信装置であって、
前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、
前記メタデータを取得し、当該受信装置の処理負荷に応じて表示部に表示させるオブジェクトの解像度パターンを選択する解像度パターン選択部と、
前記解像度パターン選択部により選択された解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、
前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、
前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる、受信装置。
【請求項5】
請求項2に記載の送信装置からパケットを受信する受信装置であって、
カメラと、
前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、
前記メタデータに含まれる前記オブジェクト提示位置情報と、当該受信装置の自己位置及び前記カメラの向いている方向を示す位置・視線方向とから、表示部に表示させるオブジェクトを選択するビューポート推定部と、
前記ビューポート推定部により選択されたオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、
前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、
前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる、受信装置。
【請求項6】
請求項3に記載の送信装置からパケットを受信する受信装置であって、
カメラと、
前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、
前記メタデータに含まれる前記バウンディングボックス情報と、当該受信装置の自己位置及び前記カメラの向いている方向を示す位置・視線方向と、表示部の解像度とから、前記表示部に表示させるオブジェクト及び解像度パターンを選択するビューポート推定部と、
前記ビューポート推定部により選択されたオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、
前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、
前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる、受信装置。
【請求項7】
前記ビューポート推定部は、ユーザの注視点の推定結果とオブジェクトの提示位置とのずれに基づいて解像度パターンを選択する、請求項6に記載の受信装置。
【請求項8】
請求項1に記載の送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、
前記ネットワークノードは、当該受信装置の処理負荷を示す処理負荷情報及び/又はネットワークの負荷を示すネットワーク負荷情報に基づいてオブジェクトの解像度パターンを選択し、選択した解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、
前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、
前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、
前記処理負荷情報及び/又は前記ネットワーク負荷情報を前記ネットワークノードに送信する端末情報送信部と、
を備える受信装置。
【請求項9】
請求項2に記載の送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、
前記ネットワークノードは、前記メタデータに含まれる前記オブジェクト提示位置情報と、当該受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向情報とから、オブジェクトを選択し、選択したオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、
前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、
前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、
前記位置・視線方向情報を前記ネットワークノードに送信する端末情報送信部と、
を備える受信装置。
【請求項10】
請求項3に記載の送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、
前記ネットワークノードは、前記メタデータに含まれる前記バウンディングボックス情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向情報と、前記受信装置の表示部の解像度を示す解像度情報とから、オブジェクト及び解像度パターンを選択し、選択したオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、
前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、
前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、
前記位置・視線方向情報及び前記解像度情報を前記ネットワークノードに送信する端末情報送信部と、
を備える受信装置。
【請求項11】
請求項1に記載の送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、
前記メタデータを取得し、前記受信装置の処理負荷を示す処理負荷情報及び/又はネットワークの負荷を示すネットワーク負荷情報に基づいてオブジェクトの解像度パターンを選択する解像度パターン選択部と、
前記解像度パターン選択部により選択された解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、
前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、
を備えるネットワークノード。
【請求項12】
請求項2に記載の送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、
前記メタデータを取得し、前記メタデータに含まれる前記オブジェクト提示位置情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向とから、前記受信装置の表示部に表示させるオブジェクトを選択するビューポート推定部と、
前記ビューポート推定部により選択されたオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、
前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、
を備えるネットワークノード。
【請求項13】
請求項3に記載の送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、
前記メタデータを取得し、前記メタデータに含まれる前記バウンディングボックス情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向と、前記受信装置の表示部の解像度とから、前記表示部に表示させるオブジェクト及び解像度パターンを選択するビューポート推定部と、
前記ビューポート推定部により選択されたオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、
前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、
を備えるネットワークノード。
【請求項14】
コンピュータを、請求項1から3のいずれか一項に記載の送信装置として機能させるためのプログラム。
【請求項15】
コンピュータを、請求項4から10のいずれか一項に記載の受信装置として機能させるためのプログラム。
【請求項16】
コンピュータを、請求項11から13のいずれか一項に記載のネットワークノードとして機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、送信装置、受信装置、ネットワークノード、及びプログラムに関する。
【背景技術】
【0002】
近年、AR(Augmented Reality)/VR(Virtual Reality)技術の進歩により、AR/VR対応端末や、AR/VRコンテンツが普及し始めている。AR/VR対応端末とは、スマートフォン、タブレット型端末、VRゴーグル、ARグラスなどである。
【0003】
AR/VRコンテンツの再生において、視覚情報は端末に搭載されるGPU(Graphic Processing Unit)を用いた実時間レンダリング処理により、ユーザの動作に応じたインタラクティブなグラフィック表示が実現されている。AR/VR対応端末には、ジャイロセンサや加速度センサなど複数のセンサが搭載されており、これらのセンサから取得した情報を使用して端末の自己位置推定及び姿勢推定が行われる。端末のカメラで撮影された実空間の映像に対してCGデータ等で与えられたオブジェクトを合成表示するARコンテンツの場合には、カメラで撮影された実空間の映像も、自己位置・姿勢推定処理の入力情報として使用できる。この自己位置・姿勢推定処理の結果として得られた視点位置、視線方向を反映したビューポートに応じて、GPUを用いてグラフィックの実時間レンダリング処理が行われる。なお、スマートフォンやタブレット型端末の自己位置・姿勢推定処理などAR/VRコンテンツの再生に必要な基本技術については、iOS端末のARKitやAndroid端末のARCoreなど、OS(Operating System)レベルでの標準機能としての実装が進んでおり、一般の開発者によるAR/VR対応のアプリ開発や配布が容易となっている。
【0004】
AR/VRコンテンツの視聴におけるユーザの視点位置、視線方向の自由度は、DoF(Degrees of Freedom)と呼ばれる単位で表現される。例えば、360度VR映像コンテンツにおいて、視点位置が固定され、視線方向のみにインタラクティブ性がある場合は、ユーザの視線方向の自由度が3自由度(Roll,Pitch,Yaw)の回転であるため3DoFと呼ばれる。一方、視線方向に加えて視点位置も自由に移動できるAR/VRコンテンツの場合には、視線方向の3自由度に加えて、視点位置の移動の自由度も3自由度(X,Y,Z)となるため合計6自由度であることから、6DoFと呼ばれる。また、3DoFを基本としながら、固定された椅子に座った状態での頭部の動きなど、限られた範囲での視点位置移動により、視覚情報に僅かながら自由度を追加するシステムを3DoF+と呼ぶ場合がある。
【0005】
AR/VRは、コンテンツデータとして、3次元モデルデータを取り扱う。3次元モデルデータは、一般に、3次元オブジェクトの形状を近似表現する3角形又は4角形からなる多面体の頂点及び面の集合であるジオメトリによって記述される。4角形は必ず2つの3角形に分解できることから、3角形によるジオメトリの定義がより一般的である。ジオメトリは主に、3次元モデルデータの各頂点について、3次元座標(XYZ座標)、法線ベクトル、及び、テクスチャのマッピングに使用する2次元座標(UV座標)が記述される。法線ベクトルは、使用されない場合もある。ジオメトリでは、これらに加えて、各面について面を構成する頂点の番号のセットが記述され、多面体のメッシュ構造が定義される。テクスチャは、ジオメトリの多面体の各面に対応する部分テクスチャを2次元の矩形領域内にマッピングした、ジオメトリの各面の柄を定める矩形画像であり、静止画符号化技術又は映像符号化技術により符号化される。3次元モデルデータをレンダリングする際には、ジオメトリの各面について、その面を構成する各頂点が保持するUV座標に従ってテクスチャから部分テクスチャを切り出し、面の柄として貼り付ける。2次元映像では時系列の静止画フレームのシーケンスを連続再生することにより、動画として再生される。これと同様に、時系列の3次元モデルデータのシーケンスを連続再生し、例えば被写体の3次元の動きをAR/VRにて空間的に提示することにより、視聴者は、被写体を自由な視点から見ることができる。このような3次元モデルデータの時系列シーケンスを、3次元ビデオ又はボリューメトリックビデオと呼ぶことがある。
【0006】
AR/VRコンテンツを構成するオブジェクトの別の表現方法として、3次元ポイントクラウドがある。ポイントクラウドは、点(XYZ座標)の集合情報であり、各点に色(例えばRGB)を持たせることができる。点は体積を持たず、3次元モデルデータと異なり点の結合による面の情報を持たないことから、レンダリング処理では、全ての点をそれぞれ立方体などの体積をもつボクセルに拡張して描画することが一般的である。
【0007】
6DoFのAR/VRコンテンツ視聴では、コンテンツの3次元空間の座標と、ユーザが居る部屋など現実空間の座標とが対応付けられる。AR/VRで提示されるコンテンツの3次元空間は、実寸大の場合だけでなく、拡大・縮小して表示される場合があり得る。すなわち、AR/VRで提示される3次元空間が拡大されれば、相対的に現実空間が小さくなり、ユーザは例えば小さな昆虫になったような感覚で、拡大されたAR/VRコンテンツの3次元空間に没入する体験することができる。反対に、AR/VRで提示されるコンテンツの3次元空間が縮小されれば、相対的に現実空間が大きくなり、ユーザは例えば巨人になったような感覚で、ミニチュア化されたAR/VRコンテンツの3次元空間を俯瞰する体験することができる。ARで提示される空間のスケールはこのように様々な場合があるが、いずれにしても、ARで提示される3次元空間内の3次元オブジェクトの大きさは、そのオブジェクトの位置とユーザの視聴位置の座標の相対関係に応じて、提示されるサイズが変わる。つまり、ユーザの視聴位置とオブジェクトとの距離が遠ければ小さく見え、距離が近ければ大きく見えることは現実空間で現実のオブジェクトを見る場合と変わらない。
【0008】
一つのコンテンツの構成要素として伝送されるオブジェクト数が増えた場合には、オブジェクト数に従って伝送容量や視聴端末の処理負荷が増大し、視聴端末に過大な負荷が生じ得る。このように視聴端末に過度な負担が生じた場合、コンテンツ表示の遅延やフレームドロップなどが発生する可能性がある。視聴端末処理のリアルタイム性を確保し、視聴品質を保持するためには、処理対象とするオブジェクトが増えた場合にも、処理負荷を抑制する必要がある。そこで、視聴端末のビューポートに応じてオブジェクトの描画品質を変更する目安とする指標を求める手法が提案されている。
【0009】
特許文献1においては、複数人のユーザが仮想の3次元空間を共有する遠隔コミュニケーションツールにおいて、3次元空間内のコミュニケーション相手との視距離や相手との視線の一致度を指標として、視距離が近く、視線の一致度が高い相手ほど高品位なデータを選択する手法が開示されている。映像サーバを中心としたスター構造をとり、各視聴端末で算出された他ユーザとの視距離や視線一致度を映像サーバに送信し、映像サーバが各視聴端末の状態を管理して、最適な表現形態のデータを視聴端末に送信する。
【0010】
特許文献2においては、ユーザの顔画像を伝送する遠隔コミュニケーションツールにおいて、コミュニケーション相手との対人距離を仮想空間上に設定し、相手がどの程度の対人距離に分類されるかによって、すなわち視距離に応じて、適切な情報量の表示形態を選択する手順が開示されている。ただし、視距離に応じて選択された適切な表示形態のデータについて、視聴端末に伝送するためのサーバ等との通信手段は示されていない。
【0011】
特許文献3においては、複数の視聴端末がユーザの分身であるアバタにより3次元空間を共有するシステムにおいて、アバタの顔、体、腕、脚などの各部品について詳細度のレベルを粗い度合いから精密な度合いまでツリー状に段階的に管理し、視聴端末(他のサーバを含む)からの伝送要求に際して、視聴端末の視野範囲内に存在する他ユーザのアバタの部品データについて、合計の伝送・処理量が、所定の処理・伝送量に適合するように詳細度を調整してデータを送信するシステムが開示されている。
【0012】
特許文献1及び特許文献3で示される視聴端末とサーバ間の通信手段は、各視聴端末とサーバ間でそれぞれセッションを確立し、サーバが全ての各視聴端末の状態を管理して、適切な表示形態のデータを各視聴端末に送信することを特徴としている。このような構成は、視聴端末の通信環境や処理性能が一様である場合や、サーバに同時に接続可能な視聴端末数が限定される場合には、実現しやすい。例えば、バーチャル会議システムのようなアプリケーションが想定される。
【0013】
一方、放送型3次元空間コンテンツの配信においては、サービスを受信する視聴端末の数に制限がないため、サーバは全ての視聴端末と個別にセッションを確立し、個別の視聴端末の状態を管理することは現実的ではない。また、視聴端末ごとに送信するデータを変えることもできない。放送型サービスでは視聴端末についても、スマートフォン、タブレット、VRゴーグル、ARグラスなど多様な性能(CPU周波数、表示解像度)を想定すべきであり、ネットワーク環境も多様な回線が用いられ、品質も変動することが想定される。つまり、放送型サービスでは、各視聴端末がそれぞれに、自身の処理や通信の負荷状況を管理することが求められる。
【0014】
特許文献4においては、3次元空間コンテンツの視聴において、視聴端末の処理負荷の軽減を図る目的で、3次元空間におけるユーザの注視点を検出し、注視点と対象オブジェクトの視線方向における位置の相対関係に基づいて、対象オブジェクトの描画レベルを決定する手法が示されている。ただし、特許文献4では、決定された描画レベルに適したデータをサーバなどから取得する手段は示されていない。このため、視聴端末は常に最高品位のデータを受信又は蓄積する必要があり、視聴端末の処理負荷の削減効果は、一連の受信処理の中でも最終段である描画処理の一部に限定される。また、リアルタイムにコンテンツデータを受信する場合に、通信トラフィックの削減はできない。
【先行技術文献】
【特許文献】
【0015】
【文献】特開平7-288791号公報
【文献】特開平10-40423号公報
【文献】特開2000-306120号公報
【文献】特開2017-33465号公報
【発明の概要】
【発明が解決しようとする課題】
【0016】
上述したように、特許文献1から4には、視聴端末のビューポートに応じてオブジェクトの描画品質を変更する目安とする指標を求める手段が開示されている。しかしながら、コンテンツの配信サーバと全ての視聴端末の状態を管理するサーバが同一で、サーバが各視聴端末の状態に応じて個別に送信するデータを変更できる前提であるか、又は、適応的なデータの取得手段そのものが示されていない。つまり、放送型の3次元空間コンテンツの配信において、各視聴端末が自律的に最適なコンテンツデータを選択的に受信し、実際に通信や処理の負荷を軽減し得る、適応的なデータの取得手段は示されていない。
【0017】
放送波やインターネット回線を用いたIPマルチキャストなど、放送型による3次元空間コンテンツの配信において、コンテンツの構成要素として伝送されるオブジェクト数が増えた場合に、オブジェクト数に従って通信トラフィック及び視聴端末の処理負荷が増大して過大な負荷が生じ得る。通信トラフィックについては、視聴環境外のグローバルなインターネットだけではなく、視聴環境(家庭など)内のローカルネットワークも含む。過度な負担が生じた場合、視聴端末においてコンテンツ表示の遅延やフレームドロップなどが発生し、コンテンツ視聴の品質が低下するという課題があった。また、各視聴端末が配信サーバとのセッションを確立し、サーバが全ての視聴端末の状態を管理して、各視聴端末に送信するデータをそれぞれに最適な表示形態のデータに変更する従来の手法は、放送型のサービスにはそのまま適用できないという課題があった。また、ユーザ又はその注視点とオブジェクトの位置関係などにより描画処理を簡略化しても、視聴端末の処理負荷の削減効果は、一連の受信処理の最終段である描画処理の一部に限定されたものであった。
【0018】
かかる事情に鑑みてなされた本発明の目的は、放送型3次元空間コンテンツの配信において、コンテンツの構成要素として伝送されるオブジェクト数が増えた場合に、処理負荷を削減してコンテンツ視聴の品質低下を抑制することが可能な送信装置、受信装置、ネットワークノード、及びプログラムを提供することにある。
【課題を解決するための手段】
【0019】
一実施形態に係る送信装置は、放送型3次元空間コンテンツの構成要素であるオブジェクトをそれぞれ複数の解像度パターンのデータで送信する送信装置であって、前記オブジェクトを識別するオブジェクトID、及び前記オブジェクトの解像度パターンごとのパケットを識別するパケットIDと、前記解像度パターンの推奨提示解像度と、を対応付ける情報を含むメタデータを生成するメタデータ生成部と、前記解像度パターンのデータごとに伝送フレームを構成する伝送フレーム構成部と、前記オブジェクトID及び前記パケットIDをヘッダ情報として有する前記伝送フレームのパケットと、前記メタデータのパケットと、を生成するパケット構成部と、を備える。
【0020】
さらに、一実施形態において、前記メタデータ生成部は、3次元空間内での各オブジェクトの提示位置を示すオブジェクト提示位置情報を更に含むメタデータを生成してもよい。
【0021】
さらに、一実施形態において、前記オブジェクト提示位置情報は、バウンディングボックス情報であってもよい。
【0022】
また、一実施形態に係る受信装置は、上記送信装置からパケットを受信する受信装置であって、前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、前記メタデータを取得し、当該受信装置の処理負荷に応じて表示部に表示させるオブジェクトの解像度パターンを選択する解像度パターン選択部と、前記解像度パターン選択部により選択された解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる。
【0023】
また、一実施形態に係る受信装置は、上記送信装置からパケットを受信する受信装置であって、カメラと、前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、前記メタデータに含まれる前記オブジェクト提示位置情報と、当該受信装置の自己位置及び前記カメラの向いている方向を示す位置・視線方向とから、表示部に表示させるオブジェクトを選択するビューポート推定部と、前記ビューポート推定部により選択されたオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる。
【0024】
また、一実施形態に係る受信装置は、上記送信装置からパケットを受信する受信装置であって、カメラと、前記メタデータを再構成する伝送フレーム・メタデータ再構成部と、前記メタデータに含まれる前記バウンディングボックス情報と、当該受信装置の自己位置及び前記カメラの向いている方向を示す位置・視線方向と、表示部の解像度とから、前記表示部に表示させるオブジェクト及び解像度パターンを選択するビューポート推定部と、前記ビューポート推定部により選択されたオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、を備え、前記伝送フレーム・メタデータ再構成部は、前記パケットフィルタ処理後のパケットから伝送フレームを再構成し、前記表示部は、前記伝送フレーム・メタデータ再構成部により再構成された伝送フレームに係るオブジェクトを表示させる。
【0025】
さらに、一実施形態において、前記ビューポート推定部は、ユーザの注視点の推定結果とオブジェクトの提示位置とのずれに基づいて解像度パターンを選択してもよい。
【0026】
また、一実施形態に係る受信装置は、上記送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、前記ネットワークノードは、当該受信装置の処理負荷を示す処理負荷情報及び/又はネットワークの負荷を示すネットワーク負荷情報に基づいてオブジェクトの解像度パターンを選択し、選択した解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、前記処理負荷情報及び/又は前記ネットワーク負荷情報を前記ネットワークノードに送信する端末情報送信部と、を備える。
【0027】
また、一実施形態に係る受信装置は、上記送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、前記ネットワークノードは、前記メタデータに含まれる前記オブジェクト提示位置情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向情報とから、オブジェクトを選択し、選択したオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、前記位置・視線方向情報を前記ネットワークノードに送信する端末情報送信部と、を備える。
【0028】
また、一実施形態に係る受信装置は、上記送信装置から、ネットワークノードを経由してパケットを受信する受信装置であって、前記ネットワークノードは、前記メタデータに含まれる前記バウンディングボックス情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向情報と、前記受信装置の表示部の解像度を示す解像度情報とから、オブジェクト及び解像度パターンを選択し、選択したオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行い、前記パケットフィルタ処理後のパケットから伝送フレームを再構成する伝送フレーム再構成部と、前記伝送フレーム再構成部により再構成された伝送フレームに係るオブジェクトを表示させる表示部と、前記位置・視線方向情報及び前記解像度情報を前記ネットワークノードに送信する端末情報送信部と、を備える。
【0029】
また、一実施形態に係るネットワークノードは、上記送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、前記メタデータを取得し、前記受信装置の処理負荷を示す処理負荷情報及び/又はネットワークの負荷を示すネットワーク負荷情報に基づいてオブジェクトの解像度パターンを選択する解像度パターン選択部と、前記解像度パターン選択部により選択された解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、を備える。
【0030】
また、一実施形態に係るネットワークノードは、上記送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、前記メタデータを取得し、前記メタデータに含まれる前記オブジェクト提示位置情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向とから、前記受信装置の表示部に表示させるオブジェクトを選択するビューポート推定部と、前記ビューポート推定部により選択されたオブジェクトのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、を備える。
【0031】
また、一実施形態に係るネットワークノードは、上記送信装置から受信したパケットをフィルタ処理して受信装置に送信するネットワークノードであって、前記メタデータを取得し、前記メタデータに含まれる前記バウンディングボックス情報と、前記受信装置の自己位置及びカメラの向いている方向を示す位置・視線方向と、前記受信装置の表示部の解像度とから、前記表示部に表示させるオブジェクト及び解像度パターンを選択するビューポート推定部と、前記ビューポート推定部により選択されたオブジェクト及び解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行うパケットフィルタ部と、前記パケットフィルタ処理後のパケットを前記受信装置に送信するパケット送信部と、を備える。
【0032】
また、一実施形態に係るプログラムは、コンピュータを、上記送信装置として機能させる。
【0033】
また、一実施形態に係るプログラムは、コンピュータを、上記受信装置として機能させる。
【0034】
また、一実施形態に係るプログラムは、コンピュータを、上記ネットワークノードとして機能させる。
【発明の効果】
【0035】
本発明によれば、受信装置又はネットワークノードは、不必要なデータを伝送するパケットをパケットレベルで破棄することができる。これにより、受信装置における通信トラフィック及び処理負荷の増加を抑えてコンテンツ再生のリアルタイム性を確保し、視聴品質を向上させることができる。また、一連の受信処理において最初の処理であるパケット入力段階でパケットを取捨選択できるため、処理負荷の削減効果が大きい。また、過度な処理負荷ではない場合においても、通信・演算コストを削減することで通信トラフィックの輻輳防止や、電力消費の抑制によるバッテリーの持続時間が向上することで、受信装置の視聴可能時間を延ばすことができる。
【図面の簡単な説明】
【0036】
【
図1】一実施形態に係る3次元空間コンテンツ伝送システムの構成例を示す図である。
【
図2】第1の実施形態に係る送信装置の構成例を示すブロック図である。
【
図3】第2の実施形態に係る受信装置の構成例を示すブロック図である。
【
図4】第3の実施形態に係る送信装置の構成例を示すブロック図である。
【
図5】第4の実施形態に係る受信装置の構成例を示すブロック図である。
【
図6】オブジェクトとバウンディングボックスの関係を示す図である。
【
図7】第4の実施形態に係る受信装置のビューポート推定部における解像度推定を説明する図である
【
図8】第5の実施形態に係るネットワークノード及び受信装置の構成例を示すブロック図である。
【
図9】第5の実施形態に係るネットワークノード及び受信装置の構成例を示すブロック図である。
【
図10】第5の実施形態に係るネットワークノードにおけるパケットフィルタ部の処理を説明するための図である。
【
図11】第5の実施形態に係るネットワークノードにおけるパケットフィルタ部の処理を説明するための図である。
【
図12】第5の実施形態に係るネットワークノードにおけるパケットフィルタ部の処理を説明するための図である。
【発明を実施するための形態】
【0037】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0038】
図1は、本発明の実施形態に係る放送型3次元空間コンテンツ伝送システム1の構成例を示す図である。
図1に示す放送型3次元空間コンテンツ伝送システム1は、撮影・制作システム50と、完成データ記憶部60と、データ変換装置70と、送出データ記憶部80と、送信装置10と、伝送路90と、ネットワークノード20と、受信装置(視聴端末)30と、を備える。本実施形態では、データ変換装置70と送信装置10とを別個の装置としているが、データ変換装置70及び送信装置10は一つの装置として一体化されていてもよい。
【0039】
撮影・制作システム50は、3次元空間コンテンツを制作し、完成データとして完成データ記憶部60に出力する。完成データとは、例えば、非圧縮・可逆圧縮、又は劣化の少ない軽量圧縮で符号化された、一つ以上のオブジェクトデータを含むコンテンツデータである。
【0040】
データ変換装置70は、完成データ記憶部60から入力した完成データを送出データに変換し、送出データ記憶部80に出力する。データ変換装置70の処理は、非リアルタイムもしくはリアルタイムのオフライン処理でもよいし、リアルタイムのオンライン処理でもよい。送出データは、オブジェクトデータが、ユーザがコンテンツを視聴する際の品質劣化が許容できるレベルで、非可逆を含む圧縮方式により圧縮され、伝送路90上での配信に適したデータに変換される。このとき、一つのオブジェクトに対して複数の解像度パターンで圧縮されたオブジェクトデータが生成され得る。また、完成データ及び送出データともに、コンテンツデータには、そのコンテンツに含まれるオブジェクトの構成、コンテンツタイトルや各オブジェクトの名称などの情報が補助情報として含まれる。
【0041】
また、データ変換装置70は、完成データの補助情報を参照するとともに、オブジェクトデータを複数の解像度パターンのデータに変換した場合には各オブジェクトデータについて解像度パターンの構成情報を追加し、コンテンツ構成メタデータを生成する。そして、データ変換装置70は、生成したコンテンツ構成メタデータを送出データに含め、送出データ記憶部80に出力する。コンテンツ構成メタデータには、3次元空間コンテンツに含まれるオブジェクト・解像度パターンの一覧などのデータ構成情報や、コンテンツタイトル、各オブジェクトの名称などの情報が含まれ得る。コンテンツ構成メタデータは、シーン記述などと呼ばれる場合もある。
【0042】
送信装置10は、伝送路90を介して、放送型3次元空間コンテンツの構成要素であるオブジェクトをそれぞれ複数の解像度パターンのデータで、複数のネットワークノード20又は受信装置30に送信する。
【0043】
伝送路90は、グローバルなインターネットや回線事業者が運営するクローズドネットワークなどの通信伝送路や、地上放送・衛星放送などの放送伝送路を含む。
【0044】
ネットワークノード20は、回線事業者やコンテンツ提供事業者が設備として設置するエッジサーバや、ユーザが宅内に設置するホームゲートウェイである。ネットワークノード20と受信装置30との間は一般に双方向通信が可能であり、一つのネットワークノード20に複数の受信装置30が紐づく場合もある。伝送路90を介してコンテンツを受信する受信装置30は無数に存在し得るため、コンテンツの配信者(送信装置10)は必ずしも全てのユーザ(受信装置30)の存在を把握していない。
【0045】
(第1の実施形態)
図2は、第1の実施形態に係る送信装置10の構成例を示す図である。送出データ記憶部80は、3次元コンテンツの各種補助情報を記述するコンテンツ構成メタデータを記憶する。また、送出データ記憶部80は、1つ以上のオブジェクトデータを記憶する。
図2に示す例では、送出データ記憶部80は、オブジェクトA,Bのデータを記憶する。オブジェクトA,Bのデータには、それぞれ2つの解像度パターンのデータが含まれている。
【0046】
図2に示す送信装置10は、ID決定部11と、伝送フレーム構成部12と、メタデータ生成部13と、パケット構成部14と、パケット送信部15と、を備える。
【0047】
ID決定部11は、送出データ記憶部80から入力したコンテンツ構成メタデータを参照して、放送型3次元空間コンテンツの構成要素であるオブジェクトについて、該オブジェクトを識別するオブジェクトID、及び該オブジェクトの解像度パターンごとのパケットを識別するパケットIDを決定する。そして、ID決定部11は、オブジェクトID及びパケットIDを示すID情報をメタデータ生成部13及びパケット構成部14に出力する。オブジェクトID及びパケットIDは、例えば、16ビットの符号なし整数である。例えば、あるオブジェクトについて、解像度パターン1と解像度パターン2の2つのデータで送信する場合、解像度パターン1のデータを伝送するパケットと解像度パターン2のデータを伝送するパケットは同一のオブジェクトIDを持つが、異なるパケットIDで伝送される。
【0048】
コンテンツ構成メタデータにおいてオブジェクトを管理するオブジェクトIDが予め付与されている場合も考えられる。ID決定部11は、コンテンツ構成メタデータに記載のオブジェクトIDが、パケットのヘッダに付与する際の形式に適合する場合には、そのオブジェクトIDをそのまま用いてもよいし、予め定めた変換ルールを用いてパケットのヘッダに付与する際の形式に変換してもよい。パケットIDについても、コンテンツ構成メタデータに相当するID(解像度パターンIDなど)があれば、同様にそれを使用できる。また、ID決定部11は、オブジェクトID及びパケットIDを、コンテンツ構成メタデータによらずに自動的に発番してもよいし、別途与えられる設定等に従って割り当ててもよい。
【0049】
伝送フレーム構成部12は、各オブジェクトの解像度パターンのデータごとに、伝送フレームを構成する。伝送フレームは、各オブジェクトと各解像度パターンの組み合わせごとに独立したデータ構造とする。そして、伝送フレーム構成部12は、構成した伝送フレームをパケット構成部14に出力する。一つの伝送フレームには、例えば、オブジェクトのジオメトリデータとテクスチャデータを含む。なお、伝送時のオブジェクトの単位は、必ずしも一つのオブジェクトとして視認される単位と一致しなくてもよい。例えば、3次元空間コンテンツにおいて、コンテンツの主要なオブジェクトはそれぞれ独立したオブジェクトとして伝送フレーム化して伝送するが、その他の背景オブジェクトについては、まとめて単一オブジェクトとして扱って伝送フレームを構成して伝送してもよい。逆に、一つのオブジェクトとして視認されるものが、伝送時は複数のオブジェクトとして分割して伝送しても良い。例えば、人物等のオブジェクトを、特に注目されやすい顔を含む頭部とその他の部分に分割して伝送フレームを構成して伝送してもよい。
【0050】
メタデータ生成部13は、送出データ記憶部80から入力したコンテンツ構成メタデータを、必要に応じて伝送用のメタデータの形式に適合するように変換する。また、メタデータ生成部13は、必要に応じて、ID決定部11から入力したID情報(オブジェクトID及びパケットID)と、各解像度パターンの推奨提示解像度とを対応付ける情報を含むメタデータを生成する。そして、メタデータ生成部13は、生成したメタデータをパケット構成部14に出力する。メタデータは一定周期で送信され、受信装置30又はネットワークノード20が、受信中の3次元空間コンテンツのオブジェクトの構成、解像度パターンの選択肢、及びそれらのデータを伝送するオブジェクトID及びパケットIDを知るための補助情報として用いられる。
【0051】
パケット構成部14は、伝送フレーム構成部12から入力した伝送フレーム、及びメタデータ生成部13から入力したメタデータを、伝送に用いるパケットに分割し、ID決定部11から入力したID情報に従い、パケットにオブジェクトID及びパケットIDを付与する。そして、パケット構成部14は、生成したパケットをパケット送信部15に出力する。すなわち、パケット構成部14は、オブジェクトID及びパケットIDをヘッダ情報として有する伝送フレームのパケットと、メタデータのパケットと、を生成する。なお、パケットIDは全てのパケットに付与される。一方、オブジェクトIDは、全てのパケットのヘッダに付与するようにしても良いし、伝送フレームが複数のパケットに分割された際には、分割された伝送フレームの先頭部分を含むパケットのヘッダのみに付与するようにしても良い。
【0052】
パケット送信部15は、パケット構成部14から入力した各パケットに宛先アドレス、宛先ポート番号などを付与して、伝送路90に送信する。
【0053】
(第2の実施形態)
次に、第2の実施形態に係る受信装置30について、
図3を参照して説明する。
図3は、第2の実施形態に係る受信装置30の構成例を示す図である。受信装置30は、第1の実施形態に係る送信装置10から3次元空間コンテンツのパケットを受信し、ARで視聴する視聴端末である。
【0054】
図3に示す受信装置30は、パケットフィルタ部31と、伝送フレーム・メタデータ再構成部32と、メタデータ解析部33と、解像度パターン選択部34と、センサ35と、カメラ36と、自己位置・視線方向推定部37と、オブジェクトレンダリング部38と、AR合成部39と、表示部40と、を備える。
【0055】
パケットフィルタ部31は、メタデータ解析部33から入力したID情報が示すオブジェクトID及びパケットIDにより、各オブジェクトの各解像度パターンのデータ及びメタデータを、パケットレベルで各種別に分離できる。パケットフィルタ部31は、後述する解像度パターン選択部34により選択された解像度パターンのパケットを受信し、その他のパケットを破棄するパケットフィルタ処理を行う。そして、パケットフィルタ部31は、パケットフィルタ処理後のパケットを伝送フレーム・メタデータ再構成部32に出力する。
【0056】
伝送フレーム・メタデータ再構成部32は、パケットフィルタ部31から入力したパケットから、オブジェクトの伝送フレーム及びメタデータを再構成する。そして、伝送フレーム・メタデータ再構成部32は、伝送フレームをオブジェクトレンダリング部38に出力し、メタデータをメタデータ解析部33に出力する。
【0057】
メタデータ解析部33は、伝送フレーム・メタデータ再構成部32から入力したメタデータから、各オブジェクトの各解像度パターンに割り当てられたオブジェクトID及びパケットIDを特定する。そして、メタデータ解析部33は、特定したIDを示すID情報をパケットフィルタ部31及び解像度パターン選択部34に出力する。なお、コンテンツを受信して最初に取得する必要のあるメタデータは、パケットID=0など固定のパケットIDで伝送する運用として、パケットフィルタ部31に予め設定される。
【0058】
また、メタデータ解析部33は、伝送フレーム・メタデータ再構成部32から入力したメタデータから、オブジェクトID及びパケットIDに対応付けられた解像度パターンを特定する。そして、メタデータ解析部33は、特定した解像度パターンを示す解像度パターン情報を解像度パターン選択部34に出力する。
【0059】
解像度パターン選択部34は、オブジェクトレンダリング部38から受信装置30の処理負荷を示す処理負荷情報を取得し、処理負荷情報が示す処理負荷に応じて、オブジェクトの解像度パターンを選択する。具体手的には、処理負荷が小さいほど解像度が大きい解像度パターンを選択する。そして、解像度パターン選択部34は、選択した解像度パターンを特定するパケットIDを示す受信対象指示情報をパケットフィルタ部31に出力する。
【0060】
センサ35は、受信装置30に搭載された加速度センサ、ジャイロセンサなどの各種センサを含み、検出したセンサ情報を自己位置・視線方向推定部37に出力する。
【0061】
カメラ36は、撮影したカメラ画像を、自己位置・視線方向推定部37及びAR合成部39に出力する。
【0062】
自己位置・視線方向推定部37は、センサ35から入力したセンサ情報及びカメラ36から入力したカメラ画像を用いて、受信装置30の自己位置及びカメラ36の向いている方向を推定し、受信装置30の自己位置及びカメラ36の向いている方向を示す位置・視線方向情報を生成する。そして、自己位置・視線方向推定部37は、生成した位置・視線方向情報をオブジェクトレンダリング部38に出力する。
【0063】
オブジェクトレンダリング部38は、伝送フレーム・メタデータ再構成部32から入力した伝送フレームに対して、自己位置・視線方向推定部37から入力した位置・視線方向情報が示す自己位置及び視線方向に応じたレンダリングを行ってオブジェクトのレンダリング画像を生成する。そして、オブジェクトレンダリング部38は、生成したレンダリング画像をAR合成部39に出力する。また、オブジェクトレンダリング部38は、解像度パターン選択部34に処理負荷情報を出力する。処理負荷情報は、例えば、レンダリング処理の所要時間やCPU利用率を指標とすることができる。なお、処理負荷情報は、可能であればオブジェクトごとの処理負荷であっても良く、オブジェクトごとのレンダリング処理負荷が得られる場合は、オブジェクトごとに解像度の選択ができ、より細かい負荷制御が可能である。
【0064】
AR合成部39は、オブジェクトレンダリング部38から入力したオブジェクトのレンダリング画像と、カメラ36から入力したカメラ画像とを合成して、合成画像を生成する。そして、AR合成部39は、生成した合成画像を表示部40に出力する。
【0065】
表示部40は、液晶ディスプレイ、有機ELディスプレイなどのディスプレイであり、AR合成部39から入力した合成画像を表示する。なお、背景を透過させるシースルー型のARグラスなど、表示部40として例えば網膜投影型ディスプレイや透明ディスプレイが用いられる受信端末では、AR合成部39でレンダリング画像とカメラ画像との合成を行わずに、表示部40はレンダリング画像だけを表示する場合もある。
【0066】
第1の実施形態及び第2の実施形態によれば、送信装置10は3次元空間コンテンツの構成要素であるオブジェクトを複数の解像度パターンで送信し、受信装置30は処理負荷に応じて特定の解像度パターンのパケットのみを受信する。そのため、受信装置30における処理負荷の増加を抑えてコンテンツ再生のリアルタイム性を確保し、視聴品質を向上させることができる。また、一連の受信処理において最初の処理であるパケットフィルタ部31でパケットを取捨選択できるため、処理負荷の削減効果が大きい。
【0067】
(第3の実施形態)
次に、第3の実施形態に係る送信装置10aについて、
図4を参照して説明する。
図4は、第3の実施形態に係る送信装置10aの構成例を示す図である。
図4に示す送信装置10aは、ID決定部11と、伝送フレーム構成部12と、メタデータ生成部13と、パケット構成部14と、パケット送信部15と、オブジェクト提示位置情報生成部16と、を備える。送信装置10aは、送信装置10と比較して、更にオブジェクト提示位置情報生成部16を備える点が相違する。以下、第1の実施形態に係る送信装置10と同一の構成については適宜説明を省略し、相違する部分について説明する。
【0068】
オブジェクト提示位置情報生成部16は、送出データ記憶部80から入力したオブジェクトデータの主にジオメトリを解析し、3次元空間のワールド座標において各オブジェクトの代表的な提示位置を示すオブジェクト提示位置情報を生成する。オブジェクト提示位置情報は、一般的に、コンテンツのフレームレートと同一又はフレームレート以下の周期で更新される、シーケンシャルなデータとなる。そして、オブジェクト提示位置情報生成部16は、生成したオブジェクト提示位置情報をメタデータ生成部13に出力する。
【0069】
オブジェクト提示位置情報は、例えば、オブジェクトの全ての頂点座標の平均座標や、頂点座標の最大値や、頂点座標の最大値を用いて得られるバウンディングボックスの情報である。オブジェクト提示位置情報は、オブジェクトが3次元空間内を動く場合には動的な情報となる。オブジェクト提示位置情報は、予めコンテンツ構成メタデータに含まれる場合も想定される。その場合には、オブジェクト提示位置情報生成部16は、オブジェクトデータを解析することなく、コンテンツ構成メタデータに含まれるオブジェクト提示位置情報を使用してもよい。
図4では、コンテンツ構成メタデータからオブジェクト提示位置情報を取得する例を示している。
【0070】
メタデータ生成部13は、送出データ記憶部80から入力したコンテンツ構成メタデータを、必要に応じて伝送用のメタデータの形式に適合するように変換する。また、メタデータ生成部13は、必要に応じて、ID決定部11から入力したID情報(オブジェクトID及びパケットID)と、オブジェクト提示位置情報生成部16から入力したオブジェクト提示位置情報と、各解像度パターンの推奨提示解像度とを対応付ける情報を含むメタデータを生成する。そして、メタデータ生成部13は、生成したメタデータをパケット構成部14に出力する。
【0071】
第1の実施形態に係る送信装置10と同様に、パケット構成部14は、オブジェクトID及びパケットIDをヘッダ情報として有する、伝送フレームのパケットを生成し、パケット送信部15は、パケット構成部14から入力した各パケットに宛先アドレス、宛先ポート番号などを付与して、伝送路90に送信する。
【0072】
(第4の実施形態)
次に、第4の実施形態に係る受信装置30aについて、
図5を参照して説明する。
図5は、第4の実施形態に係る受信装置30aの構成例を示す図である。受信装置30aは、第3の実施形態に係る送信装置10aから3次元空間コンテンツのパケットを受信し、ARで視聴する視聴端末である。
【0073】
受信装置30aは、パケットフィルタ部31と、伝送フレーム・メタデータ再構成部32と、メタデータ解析部33と、ビューポート推定部41と、センサ35と、カメラ36と、自己位置・視線方向推定部37と、オブジェクトレンダリング部38と、AR合成部39と、表示部40と、を備える。受信装置30aは、第2の実施形態に係る受信装置30と比較して、解像度パターン選択部34に代えてビューポート推定部41を備える点が相違する。以下、第2の実施形態に係る受信装置30と同一の構成については適宜説明を省略し、相違する部分について説明する。
【0074】
メタデータ解析部33は、伝送フレーム・メタデータ再構成部32から入力したメタデータから、オブジェクト提示位置情報と、各オブジェクトの各解像度パターンに割り当てられたオブジェクトID及びパケットIDとを特定する。そして、メタデータ解析部33は、特定したIDを示すID情報を、パケットフィルタ部31及びビューポート推定部41に出力し、オブジェクト提示位置情報をビューポート推定部41に出力する。
【0075】
また、メタデータ解析部33は、伝送フレーム・メタデータ再構成部32から入力したメタデータから、オブジェクトID及びパケットIDに対応付けられた解像度パターンを特定する。そして、メタデータ解析部33は、特定した解像度パターンを示す解像度パターン情報をビューポート推定部41に出力する。
【0076】
自己位置・視線方向推定部37は、受信装置30aの自己位置及びカメラ36の向いている方向を示す位置・視線方向情報を生成する。この位置・視線方向情報には、カメラ36の画角情報を含んでもよい。そして、自己位置・視線方向推定部37は、生成した位置・視線方向情報をオブジェクトレンダリング部38及びビューポート推定部41に出力する。なお、カメラ36の画角が固定であれば、位置・視線方向情報は画角情報を含まず、画角情報はビューポート推定部41にあらかじめ設定されているものとしても良い。
【0077】
ビューポート推定部41は、実際にオブジェクトをレンダリングすることなく、自己位置・視線方向推定部37から入力した自己位置・視線方向情報と、メタデータ解析部33から入力したオブジェクト提示位置情報とを用いて、レンダリング結果のビューポート(表示領域)を簡易的に推測する。すなわち、ビューポート推定部41は、コンテンツを構成する各オブジェクトについて、ビューポートの視野内であるか視野外であるかを判定し、視野内のオブジェクトを表示部40に表示させるオブジェクトとして選択する。そして、ビューポート推定部41は、選択したオブジェクトのパケット(視野内のオブジェクトのパケット)を受信し、その他のパケット(視野外のオブジェクトのパケット)を破棄するように指示する受信指示情報をパケットフィルタ部31に出力する。この場合、受信指示情報には、必要なオブジェクト又は不要なオブジェクトを特定するためのオブジェクトIDのリストを含む。
【0078】
さらに、ビューポート推定部41は、メタデータに含まれるオブジェクト提示位置情報が代表座標情報ではなくバウンディングボックス情報である場合には、そのオブジェクトが視野外か視野内かをより正確に推定できるだけでなく、表示部40の解像度と視野範囲の相対関係から各オブジェクトが受信装置30の表示部40上で描画されるときの推定解像度を求めることができる。ビューポート推定部41は、表示部40から、又はOS等が保持しているシステム構成情報を参照することにより、表示部40の解像度を示す解像度情報を取得する。解像度推定の具体例については後述する。これにより、ビューポート推定部41は、表示部40に表示させるオブジェクトの最適な解像度パターンを選択することができる。そして、ビューポート推定部41は、選択したオブジェクト及び解像度パターンのパケット受信し、その他のパケットを破棄するように指示する受信指示情報をパケットフィルタ部31へ出力する。受信指示情報は、オブジェクトIDに加えて、最適な解像度パターンを特定するパケットIDのリストを含む。
【0079】
さらに、ビューポート推定部41は、公知の技術を用いてユーザの注視点を推定してもよく、その場合には、ユーザの注視点の推定結果とオブジェクトの提示位置とのずれに基づいて解像度パターンを選択してもよい。例えば、ビューポート推定部41は、ユーザの注視点の推定結果とオブジェクトの提示位置の角度、距離などのずれ量が閾値以下である場合には描画レベルを「高」とし、ずれ量が閾値を超える場合には描画レベルを「低」と決定する。そして、描画レベルが「高」の場合には前述の推定解像度の値をそのまま使用して解像度パターンを選択し、描画レベルが「低」の場合には前述の推定解像度を小さくするように重みを付けて推定解像度を補正し、より低解像度の解像度パターンを選択する。これにより、ユーザの注視点から外れるオブジェクトの解像度パターンを優先的に下げることで、視聴品質をできるだけ維持したまま、さらに受信装置30の処理負荷を下げることが期待できる。
【0080】
図6(a)(b)は、オブジェクトとバウンディングボックスの関係を示す図である。
図6(a)(b)に示すように、バウンディングボックスBBは、3次元空間内に配置されたオブジェクトOを囲む立体状の外枠である。
【0081】
図7は、ビューポート推定部41における解像度推定を説明する図である。
図7に示す例では、受信装置30aはタブレット型端末であり、表示部40の解像度は横1920画素×縦1080画素であり、全画面でのAR視聴を行うことを想定する。すなわち、ビューポートVの解像度は、横1920画素×縦1080画素である。また、オブジェクト提示位置情報はバウンディングボックス情報であることを想定しており、
図7はオブジェクトAのバウンディングボックスBB
A、オブジェクトBのバウンディングボックスBB
B、及びオブジェクトCのバウンディングボックスBB
Cを示している。
【0082】
推定ビューポートVの縦方向の解像度(1080画素)に対する、各オブジェクトのバウンディングボックスによる提示領域の相対的なサイズの関係から、各オブジェクトを表示部40に表示させる際の最適な解像度を判断することができる。
図7に示す例では、オブジェクトAはビューポートVの7割程度の高さを占めることから、推奨解像度が700画素程度以上の解像度パターンを選択することが望ましい。また、オブジェクトBはビューポートVの4割程度の高さを占めることから、推奨解像度が400画素程度以上の解像度パターンを選択することが望ましい。また、オブジェクトCに関しては、ビューポート推定部41により視野外と判定されるため、オブジェクトCに対応する全ての解像度パターンは、パケットフィルタ部31で破棄される。
【0083】
なお、オブジェクト提示位置情報がオブジェクトの代表座標(例えば、オブジェクトの平均座標)で提供される場合には、オブジェクトがビューポートに提示される際の大きさの情報が得られないため、3次元的な距離に応じて解像度パターンを選択することが考えられる。また、オブジェクトがビューポートの視野範囲の境界に存在し、オブジェクトの代表座標がビューポートの視野内から外れるものの、実際には、オブジェクトの一部が視野内に入る場合が想定される。代表座標しかない場合に、こうした状態を完全になくすことは難しいが、ビューポートの視野内として扱う範囲を実際の視野範囲よりも広げてオブジェクトの視野内判定を行うことで、ビューポートの視野範囲の境界に存在するオブジェクトを表示されやすくすることが考えられる。
【0084】
以上に示したように、メタデータに含まれるオブジェクト提示位置情報がオブジェクトのバウンディングボックス情報で提供される場合には、代表座標で提供される場合と比較して、ビューポート上での描画サイズの推定ができることで、より的確に最適な解像度パターンを選択することができる。また、オブジェクトがビューポートの視野範囲の境界に存在し、オブジェクトの一部が視野範囲に入る場合にも、精度の高い判定が可能である。なお、ユーザの注視点と対象オブジェクトのずれ量によって描画品質を調整する場合には、バウンディングボックスによる推定提示解像度に対して、さらにユーザの注視点と対象オブジェクトのずれ量による許容劣化率を掛け合わせてもよい。例えば、
図7に示す例で、オブジェクトAは推奨解像度が700画素程度以上の解像度パターンを選択することが望ましいと判定されたが、オブジェクトAがユーザの注視点とずれていることが判定され、解像度にして50%の品質劣化が許容されるとすると、オブジェクトAは推奨解像度が350画素程度以上の解像度パターンを選択してもよい。
【0085】
また、第4の実施形態に係る受信装置30aは、ビューポート推定部41と、第2の実施形態で説明した解像度パターン選択部34とを併用してもよい。その場合には、まずビューポート推定部41にて、受信オブジェクトと最適解像度パターンを決定する。その上で、解像度パターン選択部34にて、処理負荷が高い場合に、解像度パターンをより低解像度なものに下げるという処理を行う。
【0086】
第3の実施形態及び第4の実施形態によれば、送信装置10aはオブジェクト提示位置情報を含むメタデータを送信し、受信装置30aはオブジェクト提示位置情報と位置・視線方向情報とからオブジェクトを選択する。そのため、受信装置30における処理負荷の増加を抑えてコンテンツ再生のリアルタイム性を確保し、視聴品質を向上させることができる。また、一連の受信処理において最初の処理であるパケットフィルタ部31でパケットを取捨選択できるため、処理負荷の削減効果が大きい。また、オブジェクト提示位置情報がバウンディングボックス情報である場合には、選択したオブジェクトについて更に最適な解像度パターンを選択することができるため、更に処理負荷の削減効果が大きくなる。
【0087】
(第5の実施形態)
次に、第5の実施形態に係るネットワークノード20及び受信装置30bについて、
図8を参照して説明する。
図8は、第5の実施形態に係るネットワークノード20及び受信装置30bの構成例を示す図である。ネットワークノード20は、第1の実施形態に係る送信装置10から3次元空間コンテンツのパケットを受信し、フィルタ処理して受信装置30bに送信する。
【0088】
図8に示すネットワークノード20は、パケットフィルタ部21と、メタデータ再構成部22と、メタデータ解析部23と、パケット構成部24と、パケット送信部25と、解像度パターン選択部26と、を備える。
【0089】
パケットフィルタ部21は、解像度パターン選択部26から入力した受信対象指示情報に基づいて不要なパケットを破棄し、必要なパケットだけを通過させるパケットフィルタ処理を行う。そして、パケットフィルタ部21は、オブジェクトデータのパケットをパケット送信部25に出力し、メタデータのパケットをメタデータ再構成部22に出力する。
【0090】
メタデータ再構成部22は、パケットフィルタ部21から入力したパケットからメタデータを再構成する。そして、メタデータ再構成部22は、メタデータをメタデータ解析部23及びパケット構成部24に出力する。具体的には、メタデータ再構成部22は、パケットフィルタ部21が通過させたオブジェクト・解像度パターンのID情報のみに記載内容を削減する。これにより、受信装置30bが受信するメタデータの情報量が削減されて必要最低限の情報となることで、受信装置30bのメタデータ解析部33の処理負荷を軽減させることができる。
【0091】
メタデータ解析部23は、メタデータ再構成部22から入力したメタデータから、各オブジェクトの各解像度パターンに割り当てられたオブジェクトID及びパケットIDを特定する。そして、メタデータ解析部23は、特定したIDを示すID情報をパケットフィルタ部21及び解像度パターン選択部26に出力する。
【0092】
パケット構成部24は、メタデータ再構成部22から入力したメタデータを、伝送に用いるパケットに分割する。そして、パケット構成部24は、メタデータのパケットをパケット送信部25に出力する。
【0093】
パケット送信部25は、パケットフィルタ部21から入力したオブジェクトデータのパケット、及びパケット構成部24から入力したメタデータのパケットを受信装置30bに出力する。
【0094】
解像度パターン選択部26は、受信装置30bから受信した処理負荷情報及び/又はネットワークの負荷を示すネットワーク負荷情報と、メタデータ解析部23から入力したID情報及び解像度パターン情報とを用いて、第2の実施形態に係る解像度パターン選択部34と同様に、表示部40に表示させるオブジェクトの最適な解像度パターンを選択する。また、解像度パターン選択部26は、ネットワーク負荷情報により、ネットワークノード20と受信装置30bとの間の通信トラフィックの負荷が大きいと判定した場合に、通信トラフィックの負荷を下げるために、さらに低解像度の解像度パターンを選択するようにしても良い。
【0095】
図8に示す受信装置30bは、パケットフィルタ部31と、伝送フレーム・メタデータ再構成部32と、メタデータ解析部33と、センサ35と、カメラ36と、自己位置・視線方向推定部37と、オブジェクトレンダリング部38と、AR合成部39と、表示部40と、端末情報送信部42と、を備える。受信装置30bは、第2の実施形態に係る受信装置30と比較して、解像度パターン選択部34を備えないで端末情報送信部42を備える点が相違する。
【0096】
受信装置30bは、受信装置30及び受信装置30aと同じく、3次元空間コンテンツをARで視聴する視聴端末であるが、ネットワークノード20を経由してコンテンツデータを受信する。
【0097】
パケットフィルタ部31は、既に必要なパケットだけがフィルタされた状態のパケットを受信する。このため、受信装置30bは、解像度パターン選択の処理負荷が削られるだけでなく、パケットフィルタ部31でパケットを破棄する処理負荷も削減される。パケットフィルタ部31は、入力のパケットフローから複数オブジェクトの分離及びメタデータの分離を行う。
【0098】
端末情報送信部42は、受信装置30bの処理負荷情報及び/又はネットワーク負荷情報をネットワークノード20に送信する。その他の構成は、第2の実施形態に係る受信装置30と同様であるため、説明を省略する。処理負荷情報は、第2の実施形態において、オブジェクトレンダリング部38から出力される処理負荷と同様である。ネットワーク負荷情報は、例えば、伝送フレーム・メタデータ再構成部32における伝送フレームの正受信率、伝送遅延ジッタを指標とすることができる。一般にネットワーク負荷が増加すると、正受信率が低下、伝送遅延ジッタが増加する。
【0099】
(第6の実施形態)
次に、第6の実施形態に係るネットワークノード20a及び受信装置30cについて、
図9を参照して説明する。
図9は、第6の実施形態に係るネットワークノード20a及び受信装置30cの構成例を示す図である。ネットワークノード20aは、第3の実施形態に係る送信装置10aから3次元空間コンテンツのパケットを受信し、フィルタ処理して受信装置30cに送信する。
【0100】
図9に示すネットワークノード20aは、パケットフィルタ部21と、メタデータ再構成部22と、メタデータ解析部23と、パケット構成部24と、パケット送信部25と、ビューポート推定部27と、を備える。ネットワークノード20aは、第5の実施形態に係るネットワークノード20と比較して、解像度パターン選択部26に代えてビューポート推定部27を備える点が相違する。
【0101】
ビューポート推定部27は、受信装置30cから受信した位置・視線方向情報及び解像度情報と、メタデータ解析部23から入力したID情報、解像度パターン情報、及びオブジェクト提示位置情報とを用いて、第4の実施形態に係るビューポート推定部41と同様に、表示部40に表示させるオブジェクトの最適な解像度パターンを選択する。
【0102】
パケットフィルタ部21は、ビューポート推定部27から入力した受信対象指示情報に基づいて不要なパケットを破棄し、必要なパケットだけを通過させるパケットフィルタ処理を行う。
【0103】
メタデータ再構成部22は、パケットフィルタ部21から入力したパケットからメタデータを再構成する。具体的には、メタデータ再構成部22は、パケットフィルタ部21が通過させたオブジェクト・解像度パターンのID情報のみに記載内容を削減したり、受信装置30bでは使用されないオブジェクト提示位置情報を削減したりする。これにより、受信装置30cが受信するメタデータの情報量が削減されて必要最低限の情報となることで、受信装置30cのメタデータ解析部33の処理負荷を軽減させることができる。その他の構成は、第5の実施形態に係るネットワークノード20と同様であるため、説明を省略する。
【0104】
図10は、パケットフィルタ部21の処理を説明するための図である。M1は、ネットワークノード20aが入力するメタデータの一例を示している。ビューポート推定部27により、オブジェクトAの「飛行機」は受信装置30cの視野外、オブジェクトBの「自動車」は受信装置30cの視野内だが遠方なので低解像度でよいと判断されたとする。
【0105】
この場合、パケットフィルタ部21は、オブジェクトAのデータを破棄し、メタデータについてはデータロケーションの情報を破棄する。オブジェクトBについては高解像度データを破棄し、メタデータについては高解像度版のパケットIDの情報を破棄する。M2は、受信装置30bが入力するメタデータの一例を示している。オブジェクトAはデータとしては破棄されるが、コンテンツの要素として「飛行機」が含まれることは、メタデータM2に記載される。また、受信装置30cのユーザインタフェースで、視野外であっても今飛行機がどのあたりにいるかというような情報を使うことも想定する場合には、位置情報もメタデータM2には記載したままにする。
【0106】
図9に示す受信装置30cは、パケットフィルタ部31と、伝送フレーム・メタデータ再構成部32と、メタデータ解析部33と、センサ35と、カメラ36と、自己位置・視線方向推定部37と、オブジェクトレンダリング部38と、AR合成部39と、表示部40と、端末情報送信部42aと、を備える。受信装置30cは、第4の実施形態に係る受信装置30aと比較して、ビューポート推定部を備えないで端末情報送信部42aを備える点が相違する。
【0107】
パケットフィルタ部31は、既に必要なパケットだけがフィルタされた状態のパケットを受信する。このため、受信装置30cは、ビューポート推定の処理負荷が削られるだけでなく、パケットフィルタ部31でパケットを破棄する処理負荷も削減される。パケットフィルタ部31は、入力のパケットフローから複数オブジェクトの分離及びメタデータの分離を行う。
【0108】
端末情報送信部42aは、受信装置30cの位置・視線方向情報をネットワークノード20aに送信する。また端末情報送信部42aは、ネットワークノード20aのビューポート推定部27にてオブジェクトの提示解像度の推定を行う場合など、必要に応じて、表示部40の解像度情報をネットワークノード20aに送信する。その他の構成は、第4の実施形態に係る受信装置30aと同様であるため、説明を省略する。
【0109】
第5の実施形態及び第6の実施形態では、宅内のローカルネットワーク構成において、ネットワークノード20,20aまでは有線回線で外部のネットワークに接続し、ネットワークノード20,20aから受信装置30b,30cまでは無線で接続される場合が多い。このような場合に、全てのオブジェクト・解像度パターンを含む大容量のコンテンツデータをネットワークノード20,20aで一度受信し、必要最低限のコンテンツデータのみに絞って受信装置30b,30cに届けることができる。つまり、第5の実施形態及び第6の実施形態によれば、他のサービスと共用されている宅内の無線ネットワークの通信トラフィックを削減し、輻輳を抑えることも可能となる。ネットワークノード20,20aが宅外のエッジサーバなどの場合であっても、エッジサーバと受信装置30b,30cとの間の通信トラフィックを削減して、他のサービスと共用する回線区間の輻輳を抑えることが可能となる。
【0110】
これまでの説明では、複数の解像度パターンを伝送する場合に、それぞれの解像度パターンには依存関係がなく独立したデータであるものとしていた。この場合、オブジェクトを高解像度にレンダリングするときには、高解像度データのみを用い、低解像度データは不要のため完全に破棄していた。一方、複数の解像度パターンを伝送する場合に、低解像度データと、この低解像度データからの差分を高解像度化データとして伝送することも可能である。この場合、オブジェクトを高解像度にレンダリングするときには、低解像度データも破棄せず、低解像度データに高解像度化データを足し合わせる。逆に、低解像度にレンダリングする場合には、高解像度化データを破棄できる。このように複数の解像度パターンの間に依存関係がある場合も、データの依存関係をメタデータに記述して伝送し、その依存関係を考慮した受信対象指示情報をパケットフィルタ部21,31に与えればよく、本発明により実現が可能である。低解像度データと高解像度化データとの間に依存関係がある例として、3次元オブジェクトが3次元ポイントクラウドで与えられるとき、低解像度データと高解像度化データとで頂点が重複しないように符号化すれば、両方の頂点を足し合わせたときに最も高い解像度が得られる。
【0111】
図11は、解像度パターンに依存関係がある場合のパケットフィルタ部21の処理を説明するための図である。M3はネットワークノード20aが入力するメタデータの一例を示しており、M4は受信装置30bが入力するメタデータの一例を示している。ビューポート推定部27により、オブジェクトAの「飛行機」は受信装置30cの視野内であるが遠方なので低解像度でよく、オブジェクトBの「自動車」は受信装置30cの視野内であり近接しているため高解像度なレンダリングが必要と判断されたとする。この場合、パケットフィルタ部21は、オブジェクトAの高解像度化データを破棄し、メタデータについては高解像度版の情報を破棄する。オブジェクトBについては、高解像度化データは低解像度データに依存するのでデータを破棄せず、メタデータも破棄しない。
【0112】
また、メタデータにオブジェクトの優先度情報を記述して伝送し、解像度パターンの選択に使用しても良い。例えば、人物等のオブジェクトが頭部のオブジェクトとその他の部分のオブジェクトに分割して伝送される場合に、ユーザから注目されやすい頭部のオブジェクトの優先度を頭部以外のオブジェクトの優先度よりも高く設定する。これにより、頭部以外の部分の解像度よりも、頭部の解像度を優先するように制御することで、さらにコンテンツの品質を保つことができる。このように複数のオブジェクトの間に優先度がある場合も、オブジェクトの優先度をメタデータに記述して伝送し、その優先度を考慮した受信対象指示情報をパケットフィルタ部21,31に与えればよく、本発明により実現が可能である。
【0113】
図12は、オブジェクトに優先度がある場合のパケットフィルタ部21の処理を説明するための図である。M5はネットワークノード20aが入力するメタデータの一例を示しており、M6は受信装置30bが入力するメタデータの一例を示している。オブジェクトAとBは、コンテンツの主人公の全身を、それぞれ、頭部と、頭部以外の全身に分離した2つのオブジェクトとして伝送している。ビューポート推定部27により、視聴者の視点位置から頭部を含む全身が視野内だが、両方とも高解像度版にすると、受信装置30cの処理負荷が過大になると判定されたとする。この場合、少なくともどちらか一方を低解像度版にする必要があるが、メタデータの優先度情報を参照して、より優先度の高い頭部のオブジェクトは高解像版、より優先度の低い頭部以外のオブジェクトは低解像度として決定する。パケットフィルタ部21は、オブジェクトAの低解像度データを破棄し、メタデータについては低解像度版の情報を破棄する。また、オブジェクトBの高解像度データを破棄し、メタデータについては高解像度版の情報を破棄する。また、パケットフィルタ部21は、メタデータから優先度情報を削除してもよい。
【0114】
<プログラム>
上記の送信装置10,10a、受信装置30,30a,30b,30c、又はネットワークノード20,20aとして機能させるために、それぞれプログラム命令を実行可能なコンピュータを用いることも可能である。コンピュータは、送信装置10,10a、受信装置30,30a,30b,30c、又はネットワークノード20,20aの機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのプロセッサによってこのプログラムを読み出して実行させることで実現することができ、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。ここで、プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。プロセッサは、CPU,GPU,DSP,ASIC(Application Specific Integrated Circuit)などであってもよい。
【0115】
また、このプログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROMなどの記録媒体であってもよい。また、このプログラムは、ネットワークを介したダウンロードによって提供することもできる。
【0116】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の構成ブロックについて、複数を1つに組み合わせたり、1つを複数に分割したりすることが可能である。
【符号の説明】
【0117】
1 放送型3次元空間コンテンツ伝送システム
10,10a 送信装置
11 ID決定部
12 伝送フレーム構成部
13 メタデータ生成部
14 パケット構成部
15 パケット送信部
16 オブジェクト提示位置情報生成部
20,20a ネットワークノード
21 パケットフィルタ部
22 メタデータ再構成部
23 メタデータ解析部
24 パケット構成部
25 パケット送信部
26 解像度パターン選択部
27 ビューポート推定部
30,30a,30b,30c 受信装置
31 パケットフィルタ部
32 伝送フレーム・メタデータ再構成部
33 メタデータ解析部
34 解像度パターン選択部
35 センサ
36 カメラ
37 自己位置・視線方向推定部
38 オブジェクトレンダリング部
39 AR合成部
40 表示部
41 ビューポート推定部
42,42a 端末情報送信部
50 撮影・制作システム
60 完成データ記憶部
70 データ変換装置
80 送出データ記憶部
90 伝送路