特許第5735181号(P5735181)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

特許5735181デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信
<>
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000002
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000003
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000004
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000005
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000006
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000007
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000008
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000009
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000010
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000011
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000012
  • 特許5735181-デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5735181
(24)【登録日】2015年4月24日
(45)【発行日】2015年6月17日
(54)【発明の名称】デュアルレイヤフレームコンパチブルフル解像度立体3Dビデオ配信
(51)【国際特許分類】
   H04N 13/00 20060101AFI20150528BHJP
   H04N 21/238 20110101ALI20150528BHJP
   H04N 21/438 20110101ALI20150528BHJP
   H04N 19/30 20140101ALI20150528BHJP
   H04N 19/597 20140101ALI20150528BHJP
【FI】
   H04N13/00 480
   H04N13/00 370
   H04N21/238
   H04N21/438
   H04N19/30
   H04N19/597
【請求項の数】24
【全頁数】38
(21)【出願番号】特願2014-533678(P2014-533678)
(86)(22)【出願日】2012年9月26日
(65)【公表番号】特表2014-532356(P2014-532356A)
(43)【公表日】2014年12月4日
(86)【国際出願番号】US2012057302
(87)【国際公開番号】WO2013049179
(87)【国際公開日】20130404
【審査請求日】2014年5月27日
(31)【優先権主張番号】61/541,005
(32)【優先日】2011年9月29日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】チェン,タオ
(72)【発明者】
【氏名】ヒュルヤルカール,サミール エヌ
(72)【発明者】
【氏名】ラクシュミナラヤナン,ゴーピ
【審査官】 益戸 宏
(56)【参考文献】
【文献】 国際公開第2010/123862(WO,A1)
【文献】 国際公開第2010/123855(WO,A1)
【文献】 特開2006−295913(JP,A)
【文献】 Anthony Vetro et al,3D-TV Content Storage and Transmission,IEEE TRANSACTIONS ON BROADCASTING,米国,2011年 6月 1日,Vol.57, No.2,P.384-394
【文献】 Heiko Schwarz et al,Overview of the Scalable Video Coding Extension of the H.264/AVC Standard,IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,米国,2007年 9月,Vol.17, No.9,P.1103-1120
(58)【調査した分野】(Int.Cl.,DB名)
H04N 13/00−15/00
H04N 19/30
H04N 19/597
H04N 21/238
H04N 21/438
(57)【特許請求の範囲】
【請求項1】
入力3D画像シーケンスの第1入力3D画像を受信するステップであって、前記第1入力3D画像は、第1視点の第1入力画像フレームと異なる第2視点の第2入力画像フレームとを有する、受信するステップと、
1以上の判定ファクタに基づき、複数の異なるタイプのデータ構成からエンハンスメントレイヤにより第1エンハンスメントレイヤ(EL)画像データを送信するのに使用する第1の特定タイプのデータ構成を選択するステップと、
前記第1入力画像フレームと前記第2入力画像フレームとの一方又は双方を利用して、採用されたカラー空間の複数のカラーチャネルの画像データを導出するステップと、
前記第1の特定タイプのデータ構成の前記第1EL画像データとして前記複数のカラーチャネルに前記画像データを符号化及び出力するステップと、
1以上の判定ファクタに基づき、前記複数の異なるタイプのデータ構成から前記エンハンスメントレイヤにおいて第2EL画像データを送信するのに使用される第2の特定タイプのデータ構成を選択するステップであって、前記第2の特定タイプのデータ構成は前記第1の特定タイプのデータ構成と異なり、前記第2の特定タイプのデータ構成の第2EL画像データとして画像データを符号化及び出力することは、前記入力3D画像シーケンスからの複数の入力3D画像にわたって前記第1の特定タイプのデータ構成における第1EL画像データとして画像データを符号化及び出力することから徐々に遷移し、前記判定ファクタは、オーディオ及びビデオ信号特性、異なるタイプのデータ構成の各自の帯域幅要求、アップストリーム装置と受信側装置との間の現在のネットワーク接続に関する帯域幅制約、現在のネットワーク接続によりサポートされる最大、平均又は最小ビットレート、及び現在のネットワーク接続のQoS(Quality of Service)指標の何れかを含む、選択するステップと、
を有する方法。
【請求項2】
前記第1入力画像フレームと前記第2入力画像フレームとに基づき、前記第1視点と前記第2視点との低解像度画像データを生成するステップと、
前記低解像度画像データをベースレイヤに符号化及び出力するステップと、
を更に有する、請求項1記載の方法。
【請求項3】
前記複数のカラーチャネルの画像データは、前記第1及び第2入力画像フレームの1以上から導出される非フィルタリング高空間周波数コンテンツを有し、
前記低解像度画像データは、前記第1及び第2入力画像フレームから導出されたフィルタリング画像データを有する、請求項2記載の方法。
【請求項4】
前記低解像度画像データとリファレンスパラメータセットとに少なくとも部分的に基づき、複数の予測リファレンス値を生成するステップと、
前記第1及び第2入力画像フレームの少なくとも1つの前記複数のカラーチャネルの複数のピクセル値と前記複数の予測リファレンス値との間の複数の残差値として、前記複数のカラーチャネルの前記画像データを計算するステップと、
前記複数のカラーチャネルに前記画像データと共に前記リファレンスパラメータセットを符号化及び出力するステップと、
を更に有する、請求項2記載の方法。
【請求項5】
前記入力3D画像シーケンスは、前記第1視点の第3入力画像フレームと前記第2視点の第4入力画像フレームとを有する第2の異なる入力3D画像を有し、
前記第2の特定タイプのデータ構成の第2EL画像データとして画像データを符号化及び出力することは、
前記第3入力画像フレームと前記第4入力画像フレームとの一方又は双方から複数の第2カラーチャネルの第2画像データを導出するステップと、
前記第2の特定タイプのデータ構成の第2EL画像データとして前記複数の第2カラーチャネルに前記第2画像データを符号化及び出力するステップと、
を有する、請求項1記載の方法。
【請求項6】
前記第1EL画像データの第1の特定タイプのデータ構成を示す第1EL画像データ記述子は、前記第1EL画像データと共に前記エンハンスメントレイヤに出力され、
前記第2EL画像データの第2の特定タイプのデータ構成を示す第2の異なるEL画像データ記述子は、前記第2画像データと共に前記エンハンスメントレイヤに出力される、請求項5記載の方法。
【請求項7】
EL画像データ記述子シーケンスは、前記入力3D画像シーケンスから導出される画像データと共に前記エンハンスメントレイヤに出力され、
前記第1EL画像データ記述子は、前記EL画像データ記述子シーケンスにおいて前記第2EL画像データ記述子の直前にあり、
前記第1EL画像データ記述子は、フレームレベル、シーンレベル又は固定期間レベルの1つにおいて前記EL画像データ記述子シーケンスにおいて前記第2EL画像データ記述子に遷移する、請求項6記載の方法。
【請求項8】
前記複数のカラーチャネルは、RGBカラー空間、YCbCrカラー空間又は他のカラー空間の1つにおける少なくとも1つのカラーチャネルを有する、請求項1記載の方法。
【請求項9】
画像コンテナは、前記複数のカラーチャネルにおける画像データを保持するのに利用され、
前記画像コンテナは、サンプリング方式下でサンプリングされた2以上のデータ部分を有し、
前記画像コンテナは、複数のサンプリング方式に関する複数の画像コンテナから選択され、
前記複数のサンプリング方式は、4−4−4サンプリング方式、4−2−2サンプリング方式、4−2−0サンプリング方式又は他のサンプリング方式を少なくとも有する、請求項1記載の方法。
【請求項10】
前記複数の異なるタイプのデータ構成は、(a)ベースレイヤを介し送信されたフィルタリング低解像度画像データを補完する補完的フィルタリング低解像度画像データ、(b)前記第1及び第2視点の1つの非フィルタリングフル解像度画像データ、(c)前記第1視点の完全な非フィルタリングフル解像度ルミナンス画像データ及び前記第2視点の1/2解像度ルミナンス画像データ、(d)前記第1及び第2入力画像フレームの選択された部分から導出された非フィルタリングフル解像度ルミナンス画像データ、(e)前記第1視点の完全な非フィルタリングフル解像度ルミナンスデータ及び前記第2視点のパーシャル非フィルタリングフル解像度ルミナンス画像データ、並びに(f)画像データの少なくとも一部をpel値と置換することによって、1以上のフォールバックタイプのデータ構成の1以上を有する、請求項1記載の方法。
【請求項11】
1以上の入力ビデオ信号により表現、受信、送信又は格納される1以上の入力3D画像を、1以上の出力ビデオ信号により表現、受信、送信又は格納される1以上の出力3D画像に変換するステップを更に有する、請求項1記載の方法。
【請求項12】
前記第1入力3D画像と前記第1EL画像データとの少なくとも1つは、HDR(High Dynamic Range)画像フォーマット、AMPAS(Academy of Motion Picture Arts and Sciences)のACES(Academy Color Encoding Specification)規格に関するRGBカラー空間、Digital Cinema InitiativeのP3カラー空間規格、RIMM/ROMM(Reference Input Medium Metric/Reference Output Medium Metric)規格、sRGBカラー空間又はITU(International Telecommunications Union)のBT.709 Recommendation規格に関するRGBカラー空間の1つにより符号化される画像データを有する、請求項1記載の方法。
【請求項13】
ベースレイヤにおいて3D画像の第1視点及び第2の異なる視点の入力低解像度画像データを受信し、エンハンスメントレイヤにおいて前記3D画像の入力エンハンスメントレイヤ(EL)画像データ及び入力EL画像データ記述子を受信するステップであって、前記入力EL画像データ記述子は、前記エンハンスメントレイヤにおいて前記入力EL画像データの第1の特定タイプのデータ構成を示し、前記3D画像は、前記ベースレイヤと前記エンハンスメントレイヤとの双方から画像データが受信される3D画像シーケンスにある、受信するステップと、
前記入力EL画像データ記述子により示される前記第1の特定タイプのデータ構成に少なくとも部分的に基づき、前記入力EL画像データから採用されたカラー空間の複数のカラーチャネルにおける前記3D画像の画像データを導出するステップと、
前記入力低解像度画像データと共に前記複数のカラーチャネルの画像データに基づき、前記第1視点の第1出力画像フレームと前記第2視点の第2出力画像フレームとを生成するステップと、
前記第1視点の第1出力画像フレームをレンダリングし、前記第2視点の第2出力画像フレームをレンダリングすることによって、前記3D画像をレンダリングするステップと、
前記エンハンスメントレイヤにおいて第2入力EL画像データ記述子を受信するステップであって、前記第2入力EL画像データ記述子は、前記3D画像シーケンスの第2の3D画像の前記エンハンスメントレイヤにおける第2EL画像データの第2の特定タイプのデータ構成を示し、前記第2の特定タイプのデータ構成は前記第1の特定タイプのデータ構成と異なり、前記第2の特定タイプのデータ構成に少なくとも部分的に基づき前記複数のカラーチャネルの画像データを導出することは、前記3D画像シーケンスからの複数の3D画像にわたって前記第1の特定タイプのデータ構成に少なくとも部分的に基づき、前記複数のカラーチャネルの画像データを導出することから徐々に遷移する、受信するステップと、
を有する方法。
【請求項14】
前記複数のカラーチャネルの画像データは、非フィルタリングフル解像度ソース画像データから導出される前記複数のカラーチャネルにおける非フィルタリング高空間周波数コンテンツを有し、
前記入力低解像度画像データは、前記非フィルタリングフル解像度ソース画像データから導出されるフィルタリング画像データを有する、請求項13記載の方法。
【請求項15】
前記エンハンスメントレイヤにおいて入力リファレンスパラメータセットを受信するステップと、
前記入力低解像度画像データと前記入力リファレンスパラメータセットとに少なくとも部分的に基づき、複数の予測リファレンス値を生成するステップと、
前記複数のカラーチャネルの画像データにおける残差値と前記複数の予測リファレンス値とを、前記第1及び第2出力画像フレームの少なくとも1つの前記複数のカラーチャネルにおける複数のピクセル値に合成するステップと、
を更に有する、請求項13記載の方法。
【請求項16】
当該方法は更に、
前記ベースレイヤにおいて前記第2の3D画像の前記第1視点及び第2視点の第2入力低解像度画像データを受信し、前記第2の3D画像の第2入力EL画像データを受信するステップと、
前記第2入力EL画像データ記述子により示される前記第2の特定タイプのデータ構成に少なくとも部分的に基づき、前記第2EL画像データから複数の第2カラーチャネルにおける前記第2の3D画像の第2画像データを導出するステップと、
前記第2入力低解像度画像データと共に前記複数の第2カラーチャネルの第2画像データに基づき、前記第1視点の第3出力画像フレームと前記第2視点の第4出力画像フレームとを生成するステップと、
前記第1視点の第3出力画像フレームをレンダリングし、前記第2視点の第4出力画像フレームをレンダリングすることによって、前記第2の3D画像をレンダリングするステップと、
を有する、請求項13記載の方法。
【請求項17】
入力EL画像データ記述子シーケンスは、前記3D画像シーケンスの画像データと共に前記エンハンスメントレイヤにおいて入力され、
記入力EL画像データ記述子は、前記入力EL画像データ記述子シーケンスの第2入力EL画像データ記述子の直前にあり、
記入力EL画像データ記述子は、フレームレベル、シーンレベル又は固定期間レベルの1つにおいて前記入力EL画像データ記述子シーケンスにおいて前記第2入力EL画像データ記述子に遷移する、請求項16記載の方法。
【請求項18】
前記複数のカラーチャネルは、RGBカラー空間、YCbCrカラー空間又は他のカラー空間の1つにおける少なくとも1つのカラーチャネルを有する、請求項13記載の方法。
【請求項19】
画像コンテナは、前記複数のカラーチャネルにおける画像データを保持するのに利用され、
前記画像コンテナは、サンプリング方式下でサンプリングされた2以上のデータ部分を有し、
前記画像コンテナは、複数のサンプリング方式に関する複数の画像コンテナから選択され、
前記複数のサンプリング方式は、4−4−4サンプリング方式、4−2−2サンプリング方式、4−2−0サンプリング方式又は他のサンプリング方式を少なくとも有する、請求項13記載の方法。
【請求項20】
前記複数の異なるタイプのデータ構成は、(a)ベースレイヤを介し送信されたフィルタリング低解像度画像データを補完する補完的フィルタリング低解像度画像データ、(b)前記第1及び第2視点の1つの非フィルタリングフル解像度画像データ、(c)前記第1視点の完全な非フィルタリングフル解像度ルミナンス画像データ及び前記第2視点の1/2解像度ルミナンス画像データ、(d)前記第1及び第2入力画像フレームの選択された部分から導出された非フィルタリングフル解像度ルミナンス画像データ、(e)前記第1視点の完全な非フィルタリングフル解像度ルミナンスデータ及び前記第2視点のパーシャル非フィルタリングフル解像度ルミナンス画像データ、並びに(f)画像データの少なくとも一部をpel値と置換することによって、1以上のフォールバックタイプのデータ構成の1以上を有する、請求項13記載の方法。
【請求項21】
1以上の入力ビデオ信号により表現、受信、送信又は格納される1以上の3D画像を処理するステップを更に有する、請求項13記載の方法。
【請求項22】
前記入力低解像度画像データ又は前記入力EL画像データの少なくとも一部は、HDR(High Dynamic Range)画像フォーマット、AMPAS(Academy of Motion Picture Arts and Sciences)のACES(Academy Color Encoding Specification)規格に関するRGBカラー空間、Digital Cinema InitiativeのP3カラー空間規格、RIMM/ROMM(Reference Input Medium Metric/Reference Output Medium Metric)規格、sRGBカラー空間又はITU(International Telecommunications Union)のBT.709 Recommendation規格に関するRGBカラー空間の1つにより符号化される画像データを有する、請求項13記載の方法。
【請求項23】
請求項1乃至12何れか一項記載の方法を実行するエンコーダ。
【請求項24】
請求項13乃至22何れか一項記載の方法を実行するデコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、参照することによりその全体がここに援用される、2011年9月29日に出願された米国仮特許出願第61/541,005号に対する優先権を主張する。
【0002】
本発明は、一般に画像データに関する。より詳細には、本発明の実施例は、立体3D画像のための画像データに関する。
【背景技術】
【0003】
3Dコンテンツ配信のためのフレームコンパチブルハーフ解像度(FCHR)手段は、ハーフ解像度3Dコンテンツがフル解像度3D画像フレームからサブサンプリングされたハーフ解像度画像フレームを含むのみであるため、劣化した空間解像度となる。
【0004】
フレームコンパチブルフル解像度(FCHR)手段は、ベースレイヤを介しハーフ解像度3D画像フレームを送信し、エンハンスメントレイヤを介し補完的なハーフ解像度3D画像フレームを送信することによって、フル解像度3D画像を生成するのに利用されてもよい。ハーフ解像度3D画像フレームと補完的なハーフ解像度3D画像フレームとは、受信装置によってフル解像度による3D画像フレームに合成されてもよい。
【0005】
しかしながら、デュアルレイヤFCHR手段は、ハーフ解像度画像フレームにおけるエイリアシングを低減/削除するためローパスフィルタリングを実装する。画像フレームの高周波数コンテンツがローパスフィルタリングにより削除されるとき、ダウンストリーム装置は高い空間周波数コンテンツにあった細かい詳細及びテクスチャの全てを復元することは不可能である。フル解像度3D画像フレームは依然として構成されてもよいが、3D画像フレームのピクセルは、ローパスフィルタリングによって不可逆的に変更され、3D画像フレームに生じるオリジナル3Dコンテンツにおけるオリジナルの解像度及びシャープネスを再生するのに利用できない。
【0006】
本セクションにおいて説明されるアプローチは、追求可能なアプローチであるが、必ずしも以前に想到又は追求されたアプローチである必要はない。従って、特段の断りがない場合、本セクションにおいて説明されるアプローチの何れかは単に本セクションに含まれることによって従来技術としてみなされることが仮定されるべきでない。同様に、1以上のアプローチに関して特定された問題は、特段の断りがない場合、本セクションに基づき従来技術において認識されたと仮定されるべきでない。
【図面の簡単な説明】
【0007】
本発明が、同様の参照番号が同様の要素を参照する添付した図面において限定することなく例示的に説明される。
図1A図1Aは、一例となるマルチレイヤ3Dビデオエンコーダを示す。
図1B図1Bは、一例となるベースレイヤ3Dビデオデコーダを示す。
図1C図1Cは、一例となるマルチレイヤ3Dビデオデコーダを示す。
図2図2は、カラー空間に関するサンプリング方式における一例となる画像コンテナを示す。
図3A図3Aは、エンハンスメントレイヤ画像データに関する一例となるタイプの画像データ構成を示す。
図3B図3Bは、エンハンスメントレイヤ画像データに関する一例となるタイプの画像データ構成を示す。
図3C図3Cは、エンハンスメントレイヤ画像データに関する一例となるタイプの画像データ構成を示す。
図3D図3Dは、エンハンスメントレイヤ画像データに関する一例となるタイプの画像データ構成を示す。
図3E図3Eは、エンハンスメントレイヤ画像データに関する一例となるタイプの画像データ構成を示す。
図4図4は、エンハンスメントレイヤ画像データに関する一例となるフォールバックデータ構成を示す。
図5図5A及び5Bは、本発明の実施例による一例となる処理フローを示す。
図6図6は、本発明の実施例によるここに説明されるコンピュータ又は計算装置が実現可能な一例となるハードウェアプラットフォームを示す。
【発明を実施するための形態】
【0008】
異なる表示能力に対する知覚ルミナンス非線形ベース画像データ交換に関する実施例が説明される。以下の説明では、説明のために、本発明の完全な理解を提供するため多数の具体的詳細が提供される。しかしながら、本発明がこれらの具体的詳細なしに実現可能であることは明らかであろう。他の例では、周知の構成及び装置が、本発明を不要に閉塞、不明瞭又は混乱させることを回避するため、網羅的な詳細には説明されない。
【0009】
実施例は、以下の概要に従って説明される。
1.全体的な概略
2.マルチレイヤビデオ配信
3.画像コンテナ及び画像データ構成
4.一例となる画像データ構成
4.1.補完的画像データ
4.2.2つの視点の1つに対する非フィルタリングフル解像度画像データ
4.3.解像度非対称非フィルタリングルミナンス画像データ
4.4.非フィルタリングフル解像度画像データの選択部分
4.5.視点の1つに対する非フィルタリングフル解像度ルミナンス画像データの選択部分
4.6.フォールバック又は他の画像データ構成
5.一例となる処理フロー
6.実現機構−ハードウェア概略
7.均等、拡張、代替及びその他
1.全体的な概略
本概略は、本発明の実施例のいくつかの態様の基本的説明を提示する。本概略は実施例の態様の広範な又は網羅的なサマリでないことに留意すべきである。さらに、本概略は実施例の特に重要な態様又は要素を特定するものとして、又は特定の実施例や発明全体の範囲を確定するものとして理解されることを意図していないことに留意すべきである。本概略は、要約及び簡単化されたフォーマットにより実施例に関するコンセプトを単に提供するものであり、以下の実施例のより詳細な説明に対する概念的な準備として理解されるべきである。
【0010】
ビデオデータがインターネットベースコンテンツプロバイダからネットワーク接続を介し配信されるとき、計算装置上の3Dディスプレイアプリケーションなどの受信側ディスプレイアプリケーションに割り当てられるビットレートは限定され、特に夕方の時間などのピークのネットワークアクセス時間中、経時的に有意に変動してもよい。
【0011】
最も広い可能な各種の3D画像レンダリング装置をサポートするため、3D画像コンテンツは、低減された解像度によりフレームコンパチブルな3D画像フレーム(又はピクチャ)として配信されてもよい。説明されるように、3D画像フレームは、フル解像度3D画像フレームから低減された解像度の3D画像フレームにサブサンプリングされてもよく、フル解像度3D画像フレームの高い空間周波数コンテンツは、サブサンプリングされた画像フレームにおけるエイリアシングを防ぐため、ローパスフィルタにより取り除かれてもよい。
【0012】
本発明の実施例は、立体3Dビューイングのケースにおける肉眼における知覚的な冗長性及び眼球間マスキング効果を利用する。3D画像の異なる2つの視点の3D画像フレームが視聴されるとき(同時に又はフレーム順に)、肉眼は、3D画像の2つの画像フレームから、他方の画像フレームより多くの画像詳細を有する画像フレームの解像度により3D画像を知覚する傾向がある。肉眼はまた、クロマ値でなくルミナンスレベルにおける相違を検出するよう調整される。
【0013】
実施例は、マルチレイヤ3D画像データを符号化し、これをダウンストリーム装置に提供することを含む。いくつかの実施例では、3D画像のフレームコンパチブルな低減された解像度の左目(LE)及び右目(RE)画像フレームがベースレイヤにより受信側装置にに提供され、3D画像の3D画像データは、特定の視点及び/又は1以上の特定のカラーチャネルのため、ベースレイヤと別の1以上のエンハンスメントレイヤにより受信側の装置に提供される。追加的な3D画像データは、出力される3D画像のクオリティを改善するため、受信側の装置により利用されてもよい。
【0014】
異なるカラー空間及び/又は異なるサンプリングレートに関する複数の異なるタイプの画像コンテナが、エンハンスメントレイヤ画像データを搬送するのに利用されてもよい。複数の異なるタイプの画像コンテナのそれぞれについて、複数の異なるタイプのデータ構成が、エンハンスメントレイヤ(EL)画像データを搬送するのに利用されてもよい。実施例では、ダウンストリーム装置に、3D画像のシーケンスの3D画像のため、ある視点(左目視点又は右目視点であってもよい)及び/又はカラーチャネルのフル解像度非フィルタリング画像データの少なくとも一部を有するEL画像データが提供される。
【0015】
異なる量の非フィルタリング画像データが、採用されるカラー空間(RGB、YCbCrなど)の異なるカラーチャネル及び/又は異なる視点について提供されてもよい。非フィルタリング画像データは、1以上のベースレイヤビデオ信号から復号化された画像フレームの解像度を改善するため、マルチレイヤに対応するダウンストリーム装置により利用されてもよい。例えば、出力される3D画像フレーム(左目画像フレームなど)のカラーチャネル(ルミナンスなど)が、非フィルタリング画像データ(ルミナンス画像データなど)により投入されてもよい。結果としての出力用の3D画像フレームは、解像度対称的であってもよいし、又はそうでなくてもよい。
【0016】
ここで用いられる“カラーチャネル”という用語は、カラー空間におけるコンポーネントを表す。RGBカラー空間では、カラーチャネルは、赤色、緑色及び青色のカラーチャネルを有してもよい。YCbCrカラー空間では、カラーチャネルは、ルミナンス及びクロマチャネルを有してもよい。従って、ここで説明されるようなカラーチャネルは、ルミナンスチャネルなどのグレイスケールチャネルを表すものであってもよい。ここで用いられる“フル解像度非フィルタリング画像データの一部”は、あるカラーチャネルにおける非フィルタリングフル解像度画像データを表す。
【0017】
異なるタイプのデータ構成の適応的なスイッチは、ダウンストリーム装置に最良の可能なクオリティのEL画像データを配信するため、アップストリーム装置により利用されてもよい。ここで用いられる“クオリティ”という用語は、出力3D画像において再生可能な知覚可能な画像詳細により測定されてもよい。
【0018】
実施例では、コンテンツプロバイダサーバなどのアップストリーム装置は、1以上の判定ファクタに基づき、受信側装置にフル解像度非フィルタリング3D画像データの少なくとも一部を搬送するため、特定タイプのデータ構成を決定するよう構成される。当該判定の一部として、アップストリーム装置は、エンハンスメント例他において最良のクオリティの画像データを送信するため、特定タイプのデータ構成を選択してもよい。EL画像データは、特定の視点、双方の視点及び/又は1以上の特定のカラーチャネルのためのものであってもよい。ここに説明される判定ファクタの具体例は、限定することなく、異なるタイプのデータ構成の各自の帯域幅要求、アップストリーム装置と受信側装置との間の現在のネットワーク接続に関する帯域幅制約、現在のネットワーク接続によりサポートされる最大、平均又は最小ビットレート及び/又は現在のネットワーク接続のQoS(Quality of Service)(パケットロス、ビットエラーなど)を含むものであってもよい。
【0019】
EL画像データ記述子は、エンハンスメントレイヤにおいて特定の視点及び/又は特定のカラーチャネルにおけるEL画像データの有無を通知するため、EL画像データと共に提供されてもよい。EL画像データ記述子は、EL画像データの異なるデータ部分に関する視点を示すパリティ情報と、EL画像データの異なるデータ部分に関するチャネルを示すチャネル情報とを有してもよい。EL画像データ記述子は、補完的エンハンスメント情報(SEI)の一部として又はビデオビットストリームにおいて利用可能な他の同様のメタデータキャリッジとして送信されてもよい。
【0020】
実施例では、画像レンダリング装置などのダウンストリーム装置は、ここで説明されるようなマルチレイヤ画像データを含むビデオ信号を受信し、受信したEL画像データ記述子に基づき、EL画像データが特定の視点及び/又は1以上の特定のカラーチャネルについて利用可能であるか判断するよう構成される。このケースである場合、ダウンストリーム装置は、特定の視点及び/又は1以上の特定のカラーチャネルについて1以上の入力ビデオ信号からEL画像データを復号化し、復号化されたEL画像データを利用して、ベースレイヤから構成されたフィルタリングされた低減された解像度の画像フレームにおける対応する部分を改善/置換する。
【0021】
3D画像のクオリティ及びシャープネスの知覚は、より多くの検出可能な画像詳細を見ている目に対して強く重み付けされるため、ここで説明されるようなビデオ信号に符号化されるLE及びRE画像フレームのための絶対的及び相対的解像度は、特定の視点及び/又は特定のカラーチャネルについて別々に調整されてもよい。解像度の調整は、上述された判定ファクタに基づくものであってもよく、動的に、手動に、プログラム毎などに行われてもよい。
【0022】
ここで説明されるコーデック実現技術は、ベースレイヤ(BL)画像データとオリジナルの非フィルタリングフル解像度入力画像データとの間の統計的冗長性をフルに利用するためのレイヤ間予測機能を有するよう構成されてもよい。EL画像データは、異なるレイヤの画像データにおける統計的冗長性を利用することなく、大量のフル解像度非フィルタリング画像データを搬送する代わりに、残差(又は差分)画像データを(おそらくそれのみを)搬送する。エンハンスメントレイヤにおいて提供される残差画像データは、ダウンストリーム装置がフル解像度非フィルタリング画像データの少なくとも一部により画像フレームを効率的に構成することを可能にする。例えば、予測リファレンスフレーム又は予測リファレンス値を生成するための予測パラメータが、残差画像データと共に受信側装置に提供されてもよい。非フィルタリングフル解像度画像データは、受信した予測パラメータ及びBL画像データに少なくとも部分的に基づき再構成された予測リファレンスフレーム又は予測リファレンス値の上に残差画像データを加えることによって、受信側装置において再構成されてもよい。
【0023】
いくつかの実施例では、コーデックは、ITU−T Recommendation H.264及びISO/IEC 14496−10に説明されるような利用されるビュー間予測機能を有するよう構成されてもよい。いくつかの実施例では、RPU(Reference Processing Unit)が、エンハンスメントレイヤの圧縮のためレイヤ間予測において効率性を向上させるのに利用されてもよい。
【0024】
いくつかの実施例では、他のアプリケーションに必要とされるデータはまた、フル解像度非フィルタリング画像データと共にエンハンスメントレイヤに含まれてもよい。いくつかの実施例では、カリフォルニア州サンフランシスコのDolby Laboratoriesから商業的に利用可能なFCFR技術により提供されるような機能は、ここで説明されるベースレイヤとエンハンスメントレイヤとによりサポートされてもよい。
【0025】
本発明の実施例は、帯域幅又はビットレートの利用を最小化し、各種テレビ、ディスプレイ及び他の画像レンダリング装置をサポート可能な低減された解像度によるフレームコンパチブル3D画像データを保持してもよい。さらに、利用可能なシステムコンポーネントの改良機能と再利用及び適応化機能とは、ここで説明されるような技術を利用しない他のアプローチと比較して、相対的に低コストの実現を可能にする。
【0026】
ここで説明されるような技術は、可変的なネットワーク状態下において最良の3D画像クオリティを実現し、より少ないデータ量しか必要としないが、他の技術の下では左目と右目との双方のフル解像度非フィルタリング画像データを有する解像度対称的3D画像データを提供するため更に多くのデータを利用するものと同様の主観的なピクチャクオリティを提供するため、EL画像データの異なるタイプのデータ構成の間で交互に行われる。
【0027】
いくつかの実施例では、ここに説明されるような機構は、限定することなく、携帯装置、ゲーム機、テレビ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、携帯電話、電子書籍リーダ、POS(Point Of Sale)端末、デスクトップコンピュータ、コンピュータワークステーション、コンピュータキオスク又は他の各種端末及びメディア処理ユニットを含むメディア処理システムの一部を形成する。
【0028】
ここで説明される好適な実施例並びに汎用的な原理及び機能に対する各種改良は、当業者に容易に明らかになるであろう。従って、本開示は、図示される実施例に限定されることを意図するものでなく、ここに説明される原理及び特徴に整合する最も広い範囲が与えられるべきである。
【0029】
2.マルチレイヤビデオ配信
図1Aは、実施例によるマルチレイヤ3Dビデオエンコーダ(100)を示す。実施例では、マルチレイヤビデオエンコーダ(100)は、3D入力画像シーケンスから構成される入力3Dビデオシーケンスを符号化するよう構成される。実施例では、3D画像シーケンスの3D入力画像は、フル解像度非フィルタリング3D画像データ(限定することなく、高い空間周波数コンテンツを含む)を有し、少なくともその一部は、マルチレイヤ3Dビデオエンコーダ(100)により生成される1以上の出力ビデオ信号により搬送されてもよい。ここで用いられる“フル解像度”という用語は、画像フレームにおける独立に設定可能なピクセルの総数により最大限サポートされる空間解像度を表すものであってもよい。実施例では、3D画像シーケンスの3D入力画像を構成する画像データは、3D入力画像の入力左目(LE)画像フレーム(102−L)と入力右目(RE)画像フレーム(102−R)とに復号化されてもよい。
【0030】
実施例では、マルチレイヤ3Dビデオエンコーダ(100)の1以上のフィルタリング機構(104−L及び104−Rなど)が、入力LE及びRE画像フレーム(102−L及び102−R)に基づきフィルタリングされたLE及びRE画像データ(106−L及び106−R)を生成する。フィルタリングされたLE及びRE画像データ(106−L及び106−R)は、入力LE及びRE画像フレーム(102−L及び102−R)から高い空間周波数コンテンツの全て又は有意な部分を削除することによって生成されてもよい。フィルタリングは、フィルタリング機構(104−L及び104−Rなど)における1以上のローパスフィルタ(LPF)により実行されてもよい。実施例では、ここで説明されるようなフィルタリングは、入力LE及びRE画像フレーム(102−L及び102−R)によりサポートされるフル解像度の一部(1/2、1/3など)に対応する閾値周波数を超える入力画像の空間周波数コンテンツを削除するか、又は有意に抑える。
【0031】
ここで用いられる“高い空間周波数コンテンツ”という用語は、入力3Dビデオシーケンスに存在するが、例えば、アンチエイリアシングのためローパスフィルタなどによってフィルタリングされた画像データから削除される高い空間周波数画像詳細を表すものであってもよい。高い空間周波数コンテンツの削除が行われた場合、ダウンストリーム装置はフィルタリングされた画像データにより高解像度画像詳細を再生することができなくなるという点で不可逆的である。
【0032】
実施例では、フィルタリング機構(104−L及び104−R)の一部として又はこれらに加えて実装されてもよい1以上のサンプラ(下方への矢印による図1Aの104−L及び104−Rに示されるようなダウンサンプラなど)は、フィルタリングされたLE及びRE画像データ(106−L及び106−R)の一部としてサンプリング(ダウンサンプリング)を実行する。実施例では、サンプラは、フィルタリングされたLE画像データを2つの1/2したものに分離し、これらの一方はサブサンプリングされたLE画像データ部分を有し(例えば、奇数番目のカラム、奇数番目のロー又は他のカラム及び/又はローのインタリーブ分解など)、他方は補完的なサブサンプリングされたLE画像データ部分を有する(偶数番目のカラム、偶数番目のロー又は他のカラム及び/又はローのインタリーブ分解など)。同様に、サンプラは、フィルタリングされたRE画像データを2つの1/2したものに分離し、これらの一方はサブサンプリングされたRE画像データ部分を有し(例えば、奇数番目のカラム、奇数番目のロー又は他のカラム及び/又はローのインタリーブ分解など)、他方は補完的なサブサンプリングされたRE画像データ部分を有する(偶数番目のカラム、偶数番目のロー又は他のカラム及び/又はローのインタリーブ分解など)。
【0033】
実施例では、マルチプレクサ(Mux108−1など)は、フィルタリングされたLE及びRE画像データ(106−L及び106−R)を多重化された3D画像フレーム(112−1)に多重化する。多重化された3D画像フレーム(112−1)は、左目用の(例えば、ダウンサンプリングされた)画像データ部分と、右目用の(例えば、ダウンサンプリングされた)画像データ部分との双方を有する。多重化された3D画像フレームは、ダウンストリーム装置によってフル解像度の100%未満の低減された解像度(1/2の解像度など)のLE画像フレームとRE画像フレームとに復号化されてもよい。このような低減された解像度の復号化されたLE及びRE画像フレームは、アップサンプリング処理によって取得されないフル解像度画像より明確でない様相によるフル解像度画像フレームと同数のピクセルを有するようアップサンプリングされてもよい。
【0034】
実施例では、多重化された3D画像フレーム(112−1)は、左目用のフル解像度画像フレームにおけるピクセルの総数の1/2(例えば、1つおきのカラムやローなど)の画像データと、右目用の他方の1/2の画像データとを有する。低減された解像度のLE及びRE画像データ部分は、サイド・バイ・サイド(side−by−side)フォーマット、オーバ・アンダー(over−under)フォーマット、quincunxフォーマット、チェッカーボードフォーマット、インタリーブフォーマット、上記フォーマットの組み合わせ又は他の多重化フォーマットにより多重化された3D画像フレーム(112−1など)内に多重化されてもよい。
【0035】
1以上のエンハンスメントレイヤは、LE及びRE視点の一方又は双方のフィルタリングされていない高い空間周波数コンテンツの少なくとも一部を有する出力ビデオ信号、及び/又はLE及びRE視点の一方又は双方のカラーチャネルの1以上の出力ビデオ信号を搬送するのに利用されてもよい。実施例では、BLエンコーダ(110)は、多重化された3D画像フレーム(112−1)に少なくとも部分的に基づき、ベースレイヤフレームコンパチブルビデオストリーム(BL FCビデオストリーム118−1)により搬送されるベースレイヤビデオ信号を生成し、ELエンコーダ(116)は、(非フィルタリング)入力LE画像フレーム(102−L)及び(非フィルタリング)入力RE画像フレーム(102−R)の一方に少なくとも部分的に基づき、フレームコンパチブルであってもよいし、そうでないくてもよいエンハンスメントレイヤビデオストリーム(ELビデオストリーム118−1)により搬送される特定の視点及び/又は特定のチャネルのフィルタリングされていない高い空間周波数コンテンツによるエンハンスメントレイヤビデオ信号を生成する。BLエンコーダ(110)及びELエンコーダ(116)の一方又は双方は、H.264/AVC,VP8,VC−1などの複数のコーデックの1以上を用いて実現されてもよい。
【0036】
ここに説明されるエンハンスメントレイヤビデオ信号は、ハイブリッドビデオ符号化方法を用いて生成されてもよい(例えば、VC−1,H.264/AVCなどのビデオコーデックなどにより実現される)。非フィルタリングフル解像度画像データの少なくとも一部によるLE又はRE画像フレームの画像データは、同一レイヤに属し、予測リファレンス画像フレームバッファ内に動き補償予測リファレンスとしてバッファリングされる以前の復号化された画像フレーム(インタ予測)からのサンプルから、又は(イントラ予測を用いて)同一画像フレームの近傍サンプルから予測されてもよい。レイヤ間予測はまた、他のレイヤ(ベースレイヤなど)からの復号化された情報に少なくとも部分的に基づくものであってもよい。
【0037】
更に及び/又は任意的に、マルチレイヤ3Dビデオエンコーダ(100)は、予測に関する1以上の処理を実行するリファレンス処理ユニット(RPU114)を有してもよい。リファレンス処理ユニットにより実現される予測は、マルチレイヤ3Dビデオデコーダ(図1Cの150など)における非フィルタリングフル解像度画像データの少なくとも一部による画像フレームを構成する際のオーバヘッドを低減する。RPU(114)は、BLエンコーダ10からBL画像データを受信し、イントラ又はインタ予測(又は推定、他の方法)を介し予測リファレンス画像フレームを生成してもよい。
【0038】
実施例では、判定メーカ(120)が、(非フィルタリング)入力LE画像フレーム(102−L)及び(非フィルタリング)入力RE画像フレーム(102−R)からEL画像データを抽出し、EL画像データをエンハンスメントレイヤ画像フレーム(112−2)に格納する。EL画像フレーム(112−2)は、(非フィルタリング)入力LE画像フレーム(102−L)と(非フィルタリング)入力RE画像フレーム(102−R)との1つのみからの画像データを有してもよい。あるいは及び/又は任意的には、EL画像フレーム(112−2)は、(非フィルタリング)入力LE画像フレーム(102−L)と(非フィルタリング)入力RE画像フレーム(102−R)との一方又は双方における異なるカラーチャネルからの画像データを有してもよい。
【0039】
EL画像フレーム(112−2)は、一部が非フィルタリングフル解像度画像データである画像データの異なる部分にダウンストリーム装置によって復号化されてもよい。ダウンストリーム装置は、ベースレイヤ(112−1)のフィルタリング画像データから完全に構成された画像フレームより高い解像度の1以上の出力画像フレームを生成するため、ベースレイヤ(112−1)のフィルタリング画像データとエンハンスメントレイヤ(112−2)の画像データとを合成してもよい。
【0040】
実施例では、判定メーカ(120)は、ELビデオストリーム(118−3)のEL画像データ(112−2)を記述するEL画像データ記述子を生成するよう構成される。EL画像データ記述子の1以上のフィールドの値は、ELビデオストリーム(118−3)のEL画像データ(112−2)の特定の視点及び/又はカラーチャネルなどのデータ構成を示す限り、数値、文字ベースの値、上記の組み合わせ又は他のタイプの表現値であってもよい。判定メーカ(120)は、ベースレイヤ画像データ、(非フィルタリング)入力LE画像フレーム(102−L)及び(非フィルタリング)入力RE画像フレーム(102−R)の1以上に基づき、EL画像データ記述子の値を決定するよう構成される。実施例では、判定メーカ(120)は、EL画像データ記述子をRPU(114)に提供する。EL画像データ記述子と、当該EL画像データ記述子に関する画像フレームの識別情報とは、EL RPUストリーム(118−2)を用いてダウンストリーム装置に通知される(SEIの一部などとして)。実施例では、判定メーカ(120)は、ELエンコーダ(116)に提供されるEL画像データ(112−2)のデータフローパスを設定するよう構成される。EL画像データ(112−2)は、その後、ELエンコーダ(116)によって1以上のELビデオ信号に符号化される。
【0041】
このような予測を利用する実施例では、ELエンコーダ(116)は、(a)非フィルタリング入力LE画像フレーム(102−L)と非フィルタリング入力RE画像フレーム(102−R)との一方又は双方と、(b)予測リファレンス画像フレームとに少なくとも部分的に基づき、非フィルタリング画像残差(予測リファレンス画像フレームと、非フィルタリング入力画像フレーム(102−L)の非フィルタリングフル解像度画像データの少なくとも一部と非フィルタリング入力LE画像フレーム(102−L)との間の差分)をEL画像データ(112−2)として生成し、ELビデオストリーム(118−3)により搬送するエンハンスメントレイヤビデオ信号にEL画像データ(112−2)を符号化する。
【0042】
マルチレイヤ3Dビデオエンコーダ(100)又は判定メーカ(120)により行われる判定は、1以上のエンハンスメントレイヤビットストリームの生成をガイドする。従って、当該判定は、EL画像データにより出力3D画像フレームを正しく構成するため、ダウンストリーム装置により利用されるように、ダウンストリーム装置に1以上のビデオ信号と共に送信される。このような信号は、EL RPUストリーム(118−2)により搬送されるか、又は他の同様の方法により送信されてもよい。更に及び/又は任意的に、ダウンストリーム装置により必要土佐えっるフィルタリングを示すためのインデックスは、ビデオデコーダ側においてLE又はRE出力画像フレームを構成するため、ダウンストリーム装置に提供されてもよい。
【0043】
いくつかの実施例では、異なる視点は、異なる時間に非フィルタリングフル解像度画像データの異なる部分(ゼロの量を含む)を搬送してもよく、同じ視点の異なるカラーチャネルはまた、異なる時間に非フィルタリングフル解像度画像データの異なる部分(ゼロの量を含む)を搬送してもよい。ユーザは、異なる視点及び/又はカラーチャネルにより非フィルタリングフル解像度画像データの変更に関する“フリッカ”に気付く可能性がある。いくつかの実施例では、これは、例えば、MEMC(Motion−Estimation−Motion−Compensation)又は3D補間技術などの方法を利用して、欠落したピクセルを補間することによって、1以上の先進的な後処理技術を介し受信機/デコーダにおいて改良されてもよい。
【0044】
いくつかの実施例では、エンハンスメントレイヤにおいて異なるタイプのデータ構成の切り替えは、1秒の一部、1秒、複数秒、フレーム、複数フレーム、シーン、複数シーン、プログラム、複数プログラム、又は他の時間インターバルなどの短い遷移期間により実現されてもよい。例えば、非フィルタリングLE画像データを含む第1データ構成がEL画像データ(112−2)において非フィルタリングRE画像データを含む第2データ構成と置換されるとき、ここに説明されるマルチレイヤ3Dビデオエンコーダ(100など)は、ベースレイヤにおけるフィルタリングRE画像フレームの解像度に相当する遷移解像度(5又は他の少ないパーセンタイルの範囲内と同じ解像度範囲内に等しい)に非フィルタリングLE画像データのフル解像度を徐々にスケールダウンしてもよい(1つのフレームにおける急激なスイッチを回避するため、連続するフレームにおいて)。遷移解像度がEL画像データ(112−2)のスケールダウンされたLE画像データまで到達すると、遷移解像度に相当するスタート解像度にスケールダウンされた非フィルタリングRE画像データは、EL画像データ(112−2)(いくつかの実施例ではElリファレンスレイヤを含む)に符号化される。マルチレイヤ3Dビデオエンコーダ(100)は、スタート解像度から非フィルタリングRE画像データのフル解像度まで、EL画像データ(112−2)においてRE画像データを徐々にスケールアップ(連続するフレームにおいて)してもよい。
【0045】
いくつかの実施例では、エンハンスメントレイヤにおいて異なるタイプのデータ構成を切り替える際に解像度を徐々に遷移することは、ダウンストリーム装置により実行されてもよい。例えば、マルチレイヤ3Dビデオエンコーダ(100など)は、所定のフィルタセットからフィルタを選択してもよい。適用されるとき、フィルタは、エンハンスメントレイヤにおいて搬送される画像データにおいて、一方の目のため解像度を徐々に低減し、他方の目のための解像度を徐々に増加してもよい。実施例では、マルチレイヤ3Dビデオエンコーダ(100)は、EL RPUストリームにおいて搬送されるRPUデータにフィルタインデックスを含めてもよい。フィルタインデックスは、所定の利用可能なフィルタセットを検索し、当該所定の利用可能なフィルタセットの何れが異なるタイプのデータ構成の間の画像フレームの解像度を徐々に遷移するため適用されるべきか判断するため、ダウンストリーム装置により利用されてもよい。
【0046】
図1Bは、実施例による高い空間周波数コンテンツがオリジナルビデオシーケンス(図1Aに関して説明された入力ビデオシーケンスであってもよい)から削除された1以上の入力ビデオ信号を処理するベースレイヤビデオデコーダ(150−1)を示す。実施例では、ベースレイヤビデオデコーダ(150−1)は、ベースレイヤ(図1BのBL FCビデオストリーム118−1)から受信されるBL入力ビデオ信号を出力3D画像シーケンスに復号化するよう構成され、他のレイヤのビデオ信号は、デコーダにより受信された物理信号にあってもよいし、又はなくてもよい。実施例では、ベースレイヤビデオデコーダ(150−1)は、BL FCビデオストリーム(118−1)以外の他のストリームにおけるビデオ信号の存在を無視するように、予め構成されるか、あるいは動的に若しくは手動により構成される。
【0047】
ベースレイヤビデオデコーダ(150−1)により生成される出力3D画像シーケンスの出力3D画像は、フル解像度非フィルタリング3D画像データを有さない。これは、入力ビデオ信号に生じるオリジナルビデオシーケンスの高空間周波数コンテンツが、ベースレイヤビデオデコーダ(150−1)により処理される入力ビデオ信号からフィルタリング/排除されており、ベースレイヤビデオデコーダ(150−1)により入力ビデオ信号から復元できないためである。
【0048】
実施例では、BLデコーダ(図1Bの152)は、BL FCビデオストリーム(図1Bの118−1)のBL入力ビデオ信号に少なくとも部分的に基づき、多重化された3D画像フレーム(図1Bの158−1)を生成する。BLデコーダ(図1Bの152)は、H.264/AVC,VP8,VC−1などの何れか利用可能な又は将来的なビデオコーデックを用いて実現されてもよい。
【0049】
実施例では、アップサンプリングユニット(174)は、多重化された3D画像フレーム(158−1)を2つの画像データ部分に逆多重化及び/又は分離する。多重化された3D画像フレーム(158−1)は、双方の視点の多重化されたフィルタリング画像データを有するが、画像データ部分は、フィルタリングLE画像データ部分とフィルタリングRE画像データ部分とを有し、それぞれはフル解像度以下の低減された解像度である。実施例では、アップサンプリングユニット(174)は、フル解像度以下のアップサンプリングされたLEフィルタリング出力画像フレーム(172−L)を形成するため、フィルタリングLE画像データ部分をアップサンプリングする。同様に、アップサンプリングユニット(174)は、フル解像度以下のアップサンプリングされたREフィルタリング出力画像フレーム(172−R)を形成するため、フィルタリングRE画像データ部分をアップサンプリングする。アップサンプリングされたLE及びREフィルタリング画像フレーム(172−L及び172−R)のそれぞれがフル解像度画像フレームと同数のピクセルを有したとしても、アップサンプリングされたLE及びREフィルタリング画像フレーム(172−L及び172−R)によるレンダリングされる3D画像は、アップサンプリング処理により取得されないフル解像度LE及びRE画像フレームから構成された3D画像より明確でない様相を有する。更に、アップサンプリングされたLE及びREフィルタリング画像フレーム(172−L及び172−R)は、ベースレイヤにおける入力ビデオ信号の符号化処理において取り除かれる高空間周波数画像詳細を有しない。
【0050】
フル解像度以下のアップサンプリングされたLE及びREフィルタリング画像フレーム(172−L及び172−R)は、出力3D画像を提供するため、ディスプレイ装置(例えば、ベースレイヤビデオデコーダ150−1などを有してもよい)によりレンダリングされてもよい。アップサンプリングされたLE及びREフィルタリング画像フレーム(172−L及び172−R)のレンダリングは、限定することなく、フレームシーケンシャルな方法によるものであってもよい。
【0051】
図1Cは、実施例による非フィルタリング高空間周波数コンテンツを有する入力ビデオ信号を処理するマルチレイヤ3Dビデオデコーダ(150)を示す。実施例では、入力ビデオ信号が、ベースレイヤと1以上のエンハンスメントレイヤとを有する複数のレイヤ(又は複数のビットストリーム)により受信されてもよい。ここで用いられる“マルチレイヤ”又は“複数レイヤ”という用語は、(ビデオ信号)の相互の間の1以上の論理的な依存関係を有するビデオ信号を搬送する2以上のビットストリームを表すものであってもよい。
【0052】
実施例では、マルチレイヤ3Dビデオデコーダ(150)は、BL FCビデオストリーム(図1Cの118−1)、EL RPUストリーム(図1Cの118−2)及びELビデオストリーム(図1Cの118−3)の1以上の入力ビデオ信号を出力3D画像シーケンスに復号化するよう構成される。実施例では、出力3D画像シーケンスの出力3D画像の画像フレームは、非フィルタリングフル解像度画像データの少なくとも一部を有する。
【0053】
マルチレイヤ3Dビデオデコーダ(150)は、出力画像フレームを生成するため、ベースレイヤにより受信した画像データ(BL FCビデオストリーム118−1など)と、1以上のエンハンスメントレイヤにより受信した画像データ(EL RPUストリーム118−2及びEL FCビデオストリーム118−3など)とを合成してもよい。
【0054】
実施例では、BLデコーダ(152)は、BL FCビデオストリーム(118−1)のBLビデオ信号に少なくとも部分的に基づき、多重化された3D画像フレーム(158−1)を生成する。多重化された3D画像フレーム(158−1)は、双方の視点について多重化されたフィルタリング画像データを有する。多重化されたフィルタリング画像データは、第1視点(左目ビューなど)用の第1フィルタリング画像データ部分と、第2視点(右目ビューなど)用の第2フィルタリング画像データ部分とを有する。
【0055】
実施例では、ELデコーダ(156)は、ELビデオストリーム(図1Cの118−3)のELビデオ信号に少なくとも部分的に基づき、オリジナル入力ビデオシーケンス(図1Aの入力ビデオシーケンスなど)に存在する非フィルタリングフル解像度画像データの少なくとも一部を含むものであってもよいEL画像データを有するEL画像フレーム(158−2)を生成する。
【0056】
BLデコーダ(152)とELデコーダ(156)との一方又は双方は、H.264/AVC,VP8,VC−1などの何れか利用可能な又は将来的なビデオコーデックを用いて実現されてもよい。
【0057】
実施例では、実施例では、マルチレイヤデマルチプレクサ(178)は、BLエンコーダ(152)、RPU(154)及びELデコーダ(156)から中間的な画像データを受信するよう構成される。当該中間的な画像データは、(a)多重化された3D画像フレーム(158−1)、(b)EL画像データを有するEL画像フレーム(158−2)、(c)予測リファレンス画像フレーム又は予測リファレンス値を生成するための予測パラメータ、及び/又は(d)EL画像データ記述子を有してもよい。
【0058】
実施例では、マルチレイヤデマルチプレクサ(178)は、フル解像度以下の第1視点の第1アップサンプリングされたフィルタリング出力画像フレームと第2視点の第2アップサンプリングされたフィルタリング出力画像フレームとを形成するため、多重化された3D画像フレーム(158−1)における第1及び第2フィルタリング画像データ部分を分離及びアップサンプリングするよう構成される。ここで説明されるアップサンプリングされたフィルタリング画像フレームはフル解像度画像フレームと同数のピクセルを有してもよいが、アップサンプリングされたフィルタリング画像フレームは、アップサンプリング処理により取得されないフル解像度画像フレームより明確でない様相を有する。更に、アップサンプリングされたフィルタリング画像フレームは、マルチレイヤデコーダ(150)に対する入力ビデオ信号の符号化処理において取り除かれる高空間周波数画像詳細を有しない。
【0059】
EL画像フレーム(158−2)は、第1視点(左目ビューなど)の第3画像データ部分と、第2視点(右目ビューなど)の第4画像データ部分とを有してもよい。いくつかの実施例では、第3画像データ部分と第4画像データ部分とは、非フィルタリングフル解像度画像データの少なくとも一部を有する。
【0060】
実施例では、マルチレイヤデマルチプレクサ(178)は、相互からのEL画像フレーム(158−2)の第3及び第4画像データ部分を分離するよう構成される。マルチレイヤデマルチプレクサ(178)は、RFU(154)から受信されるEL画像データ記述子に基づき、第3及び第4画像データ部分を分離してもよい。
【0061】
このような予測を利用する実施例では、マルチレイヤデマルチプレクサ(178)は、マルチレイヤデマルチプレクサ(178)は、第1及び第3画像データ部分及び予測パラメータに少なくとも部分的に基づき、第1視点(176−Lなど)の第1出力画像フレームを生成し、第2及び第4画像データ部分及び予測パラメータに基づき、第2視点(176−Rなど)の第2出力画像フレームを生成してもよい。各種実施例では、第1及び第2出力画像フレームのゼロ、1つ又は双方が、非フィルタリング高空間周波数コンテンツを有する。
【0062】
第1出力画像フレーム(176−L)及び第2出力画像フレーム(176−R)は、出力3D画像を提供するため、ディスプレイ装置(例えば、マルチレイヤ3Dビデオデコーダ150などを有してもよい)によりレンダリングされてもよい。RE及びLE画像フレームのレンダリングは、限定することなく、フレームシーケンシャルなものであってもよい。
【0063】
3.画像制約及び画像データ構成
いくつかの実施例では、ダウンストリーム装置(図1Cのマルチレイヤ3Dビデオデコーダ150を搭載したディスプレイ装置であってもよい)は、BL及びELビデオストリームの双方がRPUストリームと共に入力ビデオ信号において利用可能であるとき、フル解像度(FR)画像フレームを生成する。図1Cに示されるようなマルチレイヤデコーダ(150)は、1以上のエンハンスメントレイヤにより送信されるEL画像データ(図1Aの112−2又は図1Cの158−2)に少なくとも部分的に基づき、フル解像度画像フレームを再構成するのに利用されてもよい。
【0064】
各種実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100など)は、複数の異なるタイプのEL画像データ(112−2など)をダウンストリーム装置に提供する。複数の異なるタイプのEL画像データ(112−2)のそれぞれは、EL画像データの異なるデータ構成を有してもよい。EL画像データの異なるデータ構成は、EL画像データにおける非フィルタリングフル解像度画像データの部分の異なる組み合わせに対応する。
【0065】
アップストリーム装置(図1Aのマルチレイヤ3Dビデオエンコーダ100を有してもよい)は、経時的にEL画像データの異なるデータ構成を切り替えることによって、出力ビデオ信号の画像データコンテンツを適応的にスイッチ/遷移してもよい。非フィルタリングフル解像度画像データの複数部分が、時間領域多重化方法においてEL画像データ内で多重化されてもよい。適応的なコンテンツのスイッチ/遷移は、1秒の一部、1秒、複数秒、1フレーム、複数フレーム、1シーン、複数シーン、1プログラム、複数プログラム又は他の時間インターバルにおいて行われてもよい。信号特性、画像コンテンツ、ビットレート要求、帯域幅制約、ネットワーク状態などに関するものを含む1以上の判定ファクタが、非フィルタリングフル解像度画像データの部分の異なる組み合わせがELレイヤにおいて時間領域多重化方法により搬送されるべきか、又はどの時点で搬送されるべきか判断するための基礎として利用されてもよい。
【0066】
ここで説明されるような技術の下、各種の異なるタイプの画像コンテナがEL画像データを搬送するのに利用されてもよい。ここで用いられる“画像コンテナ”という用語は、ピクセル値及び/又は関連するメタデータを保持するための画像データ構造を表すものであってもよく、画像コンテナは、標準ベース、専用又は標準若しくは専用の仕様からの拡張により定義されてもよい。画像コンテナは、1以上の画像フレームを保持するよう規定されてもよい。実施例では、1つの画像フレームについて規定される画像コンテナは、画像データの多重化されたデータ部分(異なる視点から及び/又は異なるカラーチャネルからなど)を搬送するのに利用されてもよい。ここで用いられる“画像コンテナに画像データを保持する”とは、画像データが画像コンテナの特定の画像データ構造に論理的にマッピングされてもよいことを意味する。
【0067】
一例となる第1タイプの画像コンテナは、RGBカラー空間(sRGB、adobeRGB又は他のRGBカラー空間)における赤色、緑色及び青色カラーチャネル値を保持するよう規定されるものであってもよい。一例となる第2タイプの画像コンテナは、YCbCrカラー空間におけるルミナンス値及びクロマ値を保持するよう規定されるものであってもよい。他のタイプの画像コンテナは、ここで説明されるような技術の下で等価的に利用されてもよい。
【0068】
ここで説明される技術の下、各種の異なるサンプリング方式が、EL画像データを保持するため画像コンテナと共に利用されてもよい。一例となる第1サンプリング方式は、画像コンテナのカラーチャネル(又はコンポーネント)に対してサブサンプリングが実行されない4−4−4であってもよい。一例となる第2サンプリング方式は、画像コンテナの3つのカラーチャネルからの2つに対してサブサンプリングが実行される4−2−2であってもよい。一例となる第3サンプリング方式は、4−2−2サンプリング方式において実行されるサブサンプリングに加えて追加的なサブサンプリングが実行される4−2−0であってもよい。補完的サンプリング及び共通サンプリングなどの他のサンプリング方式がまた、ここで説明されるような技術の下で利用されてもよい。
【0069】
説明のみのため、YCbCrカラー空間における4−2−0サンプリング方式が、ここで説明されるような技術を説明するのに利用されてもよい。他のサンプリング方式及び/又は他のカラー空間がここで説明されるような技術の下で利用されてもよいことに留意すべきである。
【0070】
図2は、実施例による4−2−0サンプリング方式の下でYCbCrカラー空間におけるルミナンス(Y)及びクロマ(Cb/Cr)カラーチャネル(又はコンポーネント)の画像データ部分(200−1〜200−3)を示す。一例では、ここで説明されるような技術下のマルチレイヤ3Dビデオコーデックは、ビデオ圧縮のため、各種ディスプレイアプリケーションによりサポートされる8ビットYCbCr4:2:0データフォーマットをサポートする。図2に示されるように、この画像コンテナフォーマットでは、クロマチャネルのデータ部分(200−2と200−3の何れか)は、ルミナンスチャネルのデータ部分(200−1)のサイズの1/4である。いくつかの実施例では、ビデオ圧縮のため、BL画像データ又はEL画像データは、マルチレイヤ3Dビデオエンコーダ(図1の100など)によって図2のデータ部分(200−1〜200−3)を有する画像コンテナフォーマットに変換される。
【0071】
4.一例となる画像データ構成
4.1.補完的画像データ
実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、非フィルタリングフル解像度LE画像フレーム(図1Aの102−L)からフィルタリングLE画像データを生成し、フィルタリングLE画像データを、サブサンプリングされたフィルタリングLE画像データの第1の1/2したもの(奇数番目のカラム又はローなど)と、補完的なサブサンプリングされたフィルタリングLE画像データの第2の1/2したもの(偶数番目のカラム又はローなど)とを有する2つの1/2したものにサブサンプリングする。同様に、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、非フィルタリングフル解像度RE画像フレーム(図1Aの102−R)からフィルタリングRE画像データを生成し、フィルタリングRE画像データを、サブサンプリングされたフィルタリングRE画像データの第1の1/2したもの(奇数番目のカラム又はローなど)と、補完的なサブサンプリングされたフィルタリングRE画像データの第2の1/2したもの(偶数番目のカラム又はローなど)とを有する2つの1/2したものにサブサンプリングする。フィルタリングLE及びRE画像データのサブサンプリングは、1以上の異なるサブサンプリング方式の1つに基づくものであってもよい。
【0072】
実施例では、ベースレイヤの画像データ(図1Aの112−1又は図1B及び1Cの158−1)は、サブサンプリングされたフィルタリングLE及びRE画像データの第1の1/2したものを有してもよい。
【0073】
実施例では、エンハンスメントレイヤのEL画像データ(図1Aの112−2又は図1Cの158−2)は、ベースレイヤに搬送された画像データ(図1Aの112−1又は図1B及び1Cの158−1)に補完的な1/2の解像度の画像データを搬送してもよい。EL画像データ(図1Aの112−2又は図1Cの158−2)における1/2の解像度の画像データは、サブサンプリングされたフィルタリングLE及びRE画像データの第2の1/2したものを有してもよい。
【0074】
図3Aは、図2に示される一例となる画像コンテナフォーマットに基づくEL画像データの一例となる画像データ構成を示す。実施例では、サブサンプリングされたフィルタリングLE及びRE画像データの第2の1/2のルミナンスcなえるの画像データは、YCbCrカラー空間のルミナンスチャネルのために指定されたデータ部分(200−1)に保持され、サブサンプリングされたフィルタリングLE及びRE画像データの第2の1/2のCbクロマチャネルの画像データは、YCbCrカラー空間のCbクロマチャネルのために指定されたデータ部分(200−2)に保持され、サブサンプリングされたフィルタリングLE及びRE画像データの第2の1/2のCrクロマチャネルの画像データは、YCbCrカラー空間の画像フレームのCbクロマチャネルのために指定されたデータ部分(200−3)に保持される。
【0075】
簡単化のため、ルミナンスチャネルの画像データは“ルミナンス画像データ”又は“ルミナンス値”として参照されてもよく、クロマチャネルの画像データは、“クロマ画像データ”又は“クロマ値”として参照されてもよい。同様に、Cbチャネルの画像データは“Cb画像データ”又は“Cb値”として参照され、Crチャネルの画像データは“Cr画像データ”又は“Cr値”として参照されてもよい。
【0076】
異なるカラーチャネルの画像データ部分のサイズは、必要に応じて調整(ダウンサンプリング、アップサンプリング又は他の画像データ圧縮若しくは伸張方法)による採用されたサンプリング方式に指定されたものに限定されてもよい。一例では、4−4−4サンプリング方式では、ルミナンス画像データ部分は、クロマ画像データ部分のものと同じサイズであってもよい。他の例では、図2に示されるような4−2−0サンプリング方式では、ルミナンス画像データ部分(200−1)は、クロマ画像データ部分(200−2及び200−3の何れか)のものにタイして4倍(4×)のサイズであってもよい。
【0077】
エンハンスメントレイヤのサブサンプリングされたフィルタリングLE及びRE画像データの配置は、図3に示されるものと異なって設定されてもよい。例えば、図3Aに示されるLE及びREサブ部分を配置する代わりに、ルミナンス画像データ部分(200−1)のLE及びREサブ部分は交換され、REサブ部分がデータ部分(200−1)の左半分に配置され、LEサブ部分がデータ部分(200−1)の右半分に配置される。同様の議論がまた、他のデータ部分(200−2及び200−3)に適用される。
【0078】
マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、フル解像度フィルタリングLE及びRE画像フレームを形成するため、ベースレイヤの1/2の解像度の画像データ部分とエンハンスメントレイヤの補完的な1/2の解像度の画像データ(データ部分200−1〜200−3などにおける)とを組み合わせてもよい。高空間周波数コンテンツがアップストリーム符号化装置(図1Aの100など)によりフィルタリングされたため、合成されたフル解像度フィルタリングLE及びRE画像フレームは、高空間周波数コンテンツに対応する画像詳細を有しない。
【0079】
4.2.2つの視点の一方のための非フィルタリングフル解像度画像データ
実施例では、エンハンスメントレイヤ(図1Aの112−2又は図1Cの158−2)のEL画像データ(データ部分200−1〜200−3などにおける)は、何れか所与の時点におけるLE及びRE視点の一方の非フィルタリングフル解像度画像データを搬送してもよい。具体的には、非フィルタリングフル解像度画像データは、非フィルタリングフル解像度LE及びRE画像フレーム(図1Aの102−L又は102−R)」の一方の画像データを有してもよい。実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、採用されたサンプリング方式に従って非フィルタリングフル解像度画像データをサブサンプリングする。
【0080】
図3Bは、図2に示される一例となる画像コンテナフォーマットに基づき、LE及びRE視点の一方の非フィルタリングフル解像度画像データを有するEL画像データの一例となる画像データ構成を示す。説明のため、図3Bの画像データ構成の非フィルタリングフル解像度画像データは、LE視点のものである。実施例では、必要に応じて採用されたサンプリング方式の下でサブサンプリングされた非フィルタリングフル解像度LE画像フレーム(102−L)のルミナンス画像データは、YCbCrカラー空間のルミナンスチャネルのために指定されたデータ部分(200−1など)に保持され、必要に応じて採用されたサンプリング方式の下でサブサンプリングされた非フィルタリングフル解像度LE画像フレーム(102−L)のCb画像データは、YCbCrカラー空間のCbクロマチャネルのために指定されたデータ部分(200−2など)に保持され、必要に応じて採用されたサンプリング方式の下でサブサンプリングされた非フィルタリングフル解像度LE画像フレーム(102−L)のCr画像データは、YCbCrカラー空間のCbクロマチャネルのために指定されたデータ部分(200−3)に保持される。
【0081】
異なるカラーチャネルの非フィルタリング画像データ部分のサイズは、必要に応じて調整による採用されたサンプリング方式に指定されたものに限定されてもよい。
【0082】
実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、LE視点とRE視点との間でエンハンスメントレイヤにおける非フィルタリングフル解像度画像データを適応的にスイッチする。エンハンスメントレイヤの非フィルタリングフル解像度画像データのキャリッジは、3D画像間、シーン間、固定期間の間においてLE視点とRE視点との間で交互とされてもよい。実施例では、固定的な期間は、1つのフレーム又は複数のフレームの再生時間であってもよい。実施例では、当該期間の長さは、プログラム毎に可変であってもよい。LE視点とRE視点との間で非フィルタリングフル解像度画像データを交代で搬送する他の方法が利用されてもよい。他の実施例では、入力3D画像(又はそれらのLE及びREの構成要素となる画像フレーム)1以上の信号特性(フィンガープリント、統計的ルミナンス値、動き、クロマ特徴、シャープネス、明るさ、カラーなど)が、視点間エンハンスメントレイヤにおけるスイッチ又は遷移が実行されるか、また何れの時点で実行されるか判断するため、ここに説明されるマルチレイヤ3Dビデオエンコーダにより利用されてもよい。
【0083】
マルチレイヤ画像データ間の統計的冗長性をフルに利用するためのレイヤ内予測及び/又はレイヤ間予測機能は、エンハンスメントレイヤにおける非フィルタリングフル解像度画像データの搬送のためのビットレート要求を低減するのに利用されてもよい。RPU(図1Aの114など)は、ベースレイヤにおける非フィルタリングフル解像度画像フレーム(102−Lなど)から導出される1/2の解像度の画像データ部分をアップサンプリングし、非フィルタリングフル解像度画像フレーム(102−L)の予測リファレンスフレームを生成してもよい。予測リファレンスフレームと非フィルタリングフル解像度画像フレーム(102−L)との間の残差(又は差分)は、予測リファレンスフレームを生成する際に利用されるリファレンスパラメータセットと共に、エンハンスメントレイヤにおいて搬送されてもよい。
【0084】
マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、マルチレイヤ3Dビデオエンコーダ(図1Aの100)から受信したリファレンスパラメータセットを用いてベースレイヤの同一の1/2の解像度の画像データ部分をアップサンプリングし、予測リファレンスフレームを生成し、予測リファレンスフレームの画像データとエンハンスメントレイヤから受信した残差との和によって、第1視点(本例では左目視点など)の非フィルタリングフル解像度画像データにより画像フレームを生成する。更に、マルチレイヤ3Dビデオデコーダ(図1Cの150)は、ベースレイヤの他方の非フィルタリングフル解像度画像フレーム(102−R)から導出された他方の1/2の解像度の画像データ部分に基づき、第2の異なる視点(本例では右目視点など)のフィルタリングされた画像データのみを有するアップサンプリングされた画像フレームを生成してもよい。
【0085】
4.3.解像度−非対称非フィルタリングルミナンス画像データ
実施例では、何れか所与の時点において、エンハンスメントレイヤのEL画像データ(図1Aの112−2又は図1Cの158−2)は、第1視点(左目視点など)の非フィルタリングフル解像度ルミナンスデータと、異なる第2視点の非フィルタリング1/2解像度ルミナンス画像データとを搬送してもよい。非フィルタリングフル解像度画像データは、第1視点の非フィルタリングフル解像度画像フレーム(図1Aの102−Lなど)のルミナンス画像データを有し、非フィルタリング1/2解像度ルミナンス画像データは、第2視点の他方の非フィルタリングフル解像度画像フレーム(本例では図1Aの102−R)の1/2解像度ルミナンス画像データを有してもよい。実施例では、第2視点の非フィルタリング1/2解像度ルミナンス画像データと、第2視点のBLルミナンス画像データ部分とは、他方の非フィルタリングフル解像度画像フレーム(本例では図1Aの102−R)の同じピクセル部分のルミナンス画像データを搬送する。実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、採用されたサンプリング方式の下でEL画像データをサブサンプリングする。
【0086】
図3Cは、(4−2−0などの)サンプリング方式下のYCbCrカラー空間における第1視点の非フィルタリングフル解像度ルミナンス画像データと、異なる第2視点のフィルタリング1/2解像度ルミナンス画像データとを有するEL画像データの一例となる画像データ構成を示す。説明のため、画像データ構成の非フィルタリングフル解像度ルミナンス画像データはLE視点のものであり、画像データ構成の非フィルタリング1/2解像度ルミナンス画像データはRE視点のものである。
【0087】
実施例では、必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリングフル解像度LE画像フレーム(102−L)のルミナンス画像データは、YCbCrカラー空間におけるルミナンスチャネルのために指定されたデータ部分(200−1)に保持される。必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリング1/2解像度ルミナンス画像データ(により表されるピクセルの上半分など)の第1部分は、YCbCrカラー空間におけるCbクロマチャネルのために指定されるデータ部分(200−2)に保持される。必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリング1/2解像度ルミナンス画像データ(により表されるピクセルの下半分など)の第2部分は、YCbCrカラー空間のCbクロマチャネルのために指定されたデータ部分(200−3)に保持される。
【0088】
異なる視点の非フィルタリング画像データ部分のサイズは、必要に応じて何れかの調整による採用されたサンプリング方式に指定されたものと整合するよう限定されてもよい。
【0089】
実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、LE視点とRE視点との間においてエンハンスメントレイヤにおける非フィルタリングフル解像度ルミナンス画像データと対応する非フィルタリング1/2解像度ルミナンス画像データとを適応的にスイッチする。エンハンスメントレイヤによる非フィルタリングフル解像度画像データの搬送波、3D画像間、シーン間、プログラム間、固定期間の間にLE視点とRE視点との間で交代されてもよい。LE視点とRE視点との間で非フィルタリングフル解像度ルミナンス画像データを交互に搬送する他の方法がまた利用されてもよい。
【0090】
エンハンスメントレイヤを介し非フィルタリングフル解像度ルミナンス画像データを送信するため、RPU(図1Aの114など)は、データ部分200−1の非フィルタリングフル解像度ルミナンス画像データの予測リファレンス値を生成するため、第1視点(前述した例では左目視点など)のBL1/2解像度ルミナンス画像データ部分をアップサンプリングしてもよい。RPU(114)は、データ部分200−2及び200−3における非フィルタリング1/2解像度ルミナンス画像データの更なる予測リファレンス値を生成するため、異なる第2視点(右目視点)のBL1/2解像度ルミナンス画像データ部分をアップサンプリングしてもよい。1以上の処理が、これらの予測リファレンス値のレイヤ間予測クオリティを向上させるため適用されてもよい。
【0091】
第1視点(102−L)の非フィルタリング画像フレームにおける予測リファレンス値とフル解像度ルミナンス画像データとの間のルミナンス残差(又は差分)が計算されてもよい。ルミナンス残差はデータ部分200−1に格納される。第2視点(102−R)のための他方の非フィルタリング画像フレームにおける更なる予測リファレンス値と1/2解像度ルミナンス画像データとの更なるルミナンス残差(又は差分)がまた計算されてもよい。更なるルミナンス残差は、データ部分200−2及び200−3に格納される。
【0092】
全てのデータ部分200−1〜200−3におけるルミナンス残差は、その後、予測リファレンス値と更なる予測リファレンス値とを生成するのに利用されるリファレンスパラメータセットと共に、エンハンスメントレイヤにおいて搬送される。
【0093】
マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、リファレンスパラメータセットを用いて第1視点のためのベースレイヤにおける1/2解像度ルミナンス画像データ部分を受信及びアップサンプリングし、予測リファレンス値を生成し、予測リファレンス値とエンハンスメントレイヤから受信したルミナンス残差(データ部分200−1における)との和によって、第1視点の出力画像フレームにおける非フィルタリングフル解像度ルミナンス画像データを更に生成してもよい。
【0094】
マルチレイヤ3Dビデオデコーダ(図1Cの150)は、リファレンスパラメータセットを用いて第2視点のためのベースレイヤにおける1/2解像度ルミナンス画像データ部分を受信及びアップサンプリングし、更なる予測リファレンス値を生成し、更なる予測リファレンス値とエンハンスメントレイヤから受信した更なるルミナンス残差(データ部分200−2及び200−3における)との和によって、第2視点の他の出力画像フレームにおける1/2解像度ルミナンス画像データを生成する。
【0095】
実施例では、1以上のエンハンスメントレイヤは、ルミナンス画像データのみを搬送し、クロマ画像データを搬送しない。非フィルタリングフル解像度(ルミナンスなど)画像データの少なくとも一部により3D画像を生成するため、ベースレイヤのクロマ画像データは、3D画像のための出力LE及びRE画像フレームを形成するため、ダウンストリーム装置(図1Cのマルチレイヤビデオデコーダ150など)によって、必要に応じてアップサンプリングされ、ルミナンス画像データにより補間されてもよい。
【0096】
4.4.非フィルタリングフル解像度画像データの選択された部分
いくつかの実施例では、1以上のエンハンスメントレイヤは、非フィルタリングフル解像度LE及びRE画像フレームの双方(図1Aの102−L及び102−Rなど)における非フィルタリングフル解像度画像データの選択された部分を有してもよい。ここで用いられる“選択された部分”とは、画像フレームにおけるピクセルの総数の100%未満の何れかの部分を表すものであってもよい。ここで説明されるような選択される部分は、画像フレームのピクセルの総数の0〜100%、10〜90%、20〜80%、30〜70%、40〜60%、50%又は他のパーセンタイル範囲の1つからなるものであってもよい。
【0097】
実施例では、同じサンプリング方式が、(a)非フィルタリングフル解像度LE及びRE画像フレーム(図1Aの102−L及び102−Rなど)と、(b)非フィルタリングフル解像度LE及びRE画像フレームの選択された部分を有するEL画像データとの双方に適用される。ローパスフィルタリングとサブサンプリングとの何れも、エンハンスメントレイヤにおける非フィルタリングフル解像度LE及びRE画像フレーム(図1Aの102−L及び102−R)の選択された部分を保持するのに必要であってもよい。
【0098】
頻繁に、3D画像の顕著な部分のみが3D画像のローパスフィルタリングバージョン(図1Bの172−L及び172−Rなど)と3D画像の非フィルタリングフル解像度バージョン(図1Aの102−L及び102Rなど)との間の有意に目立つ差分を示すであろう。この観察は、広範な3Dコンテンツにより行われてもよい。いくつかの実施例では、フルサイズの非フィルタリングフル解像度LE及びREデータの双方の搬送が利用可能でないか、又はサポート可能でないとき、視覚的に顕著なエリア(3D画像の中央の矩形部分、3D画像の中央の楕円部分又は3D画像の他の視覚的に顕著な部分など)のみを送信することが賢明である。
【0099】
図3Dは、非フィルタリングフル解像度LE及びRE画像フレーム(図1Aの102−L及び102−Rなど)における非フィルタリングフル解像度画像データの選択された部分を格納するEL画像データにおける一例となる画像データ構成を示す。
【0100】
実施例では、必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリングフル解像度LE及びRE画像フレームの選択された部分のルミナンス画像データは、YCbCrカラー空間における画像フレームのルミナンスチャネルについて指定されたデータ部分(200−1)に保持される。必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリングフル解像度LE及びRE画像フレーム(102−L又は102−R)の選択された部分のCb画像データは、YCbCrカラー空間における画像フレームのCbカラーチャネルについて指定されたデータ部分(200−2)に保持される。必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリングフル解像度LE及びRE画像フレーム(102−L又は102−R)の選択された部分のCr画像データは、YCbCrカラー空間における画像フレームのCrカラーチャネルについて指定されたデータ部分(200−3)に保持される。
【0101】
異なる視点における非フィルタリング及びフィルタリング画像データ部分のサイズは、必要に応じて採用されたサンプリング方式に指定されたものと整合するよう調整されてもよい。
【0102】
限定することなく、選択された部分のポジションを示す情報を含むジオメトリック情報が、例えば、RPUストリーム(図1A又は1Cの118−2)における1以上のビデオ信号を介し送信されてもよい。
【0103】
エンハンスメントレイヤを介し非フィルタリングフル解像度LE及びRE画像フレーム(102−L及び102−R)の選択された部分の非フィルタリングフル解像度画像データを送信するため、RPU(図1Aの114など)は、非フィルタリングフル解像度LE及びRE画像フレーム(102−L及び102−R)の選択された部分について予測リファレンス値を生成するため、BL1/2解像度画像データ部分の選択された部分をアップサンプリングしてもよい。1以上の処理が、これらの予測リファレンス値のレイヤ間予測クオリティを向上させるのに適用されてもよい。
【0104】
非フィルタリングフル解像度LE及びRE画像フレーム(102−L及び102−R)の選択された部分におけるリファレンス値とフル解像度ルミナンス画像データとの間の残差(又は差分)が計算されてもよい。当該残差は、その後にデータ部分200−1〜200−3に配置される。
【0105】
データ部分200−1〜200−3における残差は、予測リファレンス値を生成するのに利用されるリファレンスパラメータセットと共に、エンハンスメントレイヤにより受信側装置に送信される。
【0106】
実施例では、マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、アップサンプリングされたLE及びRE画像フレームを形成するため、ベースレイヤにおける画像データ部分を受信及びアップサンプリングする。マルチレイヤ3Dビデオデコーダ(図1Cの150)は、リファレンスパラメータセットを用いてアップサンプリングされたLE及びRE画像フレームの選択された部分を利用して、リファレンスパラメータセットを計算し、エンハンスメントレイヤから受信した残差(データ部分200−1〜200−3における)と予測リファレンス値との和によって、出力LE及びRE画像フレーム(図1Cの176−L及び176−Rなど)の選択された部分を更に生成/置換する。
【0107】
4.5.視点の1つにタイする非フィルタリングフル解像度ルミナンス画像データの選択された部分
実施例では、何れか所与の時点において、エンハンスメントレイヤのEL画像データ(図1Aの112−2又は図1Cの158−2)が、第1視点(左目視点など)の非フィルタリングフル解像度ルミナンス画像データと、異なる第2視点の非フィルタリングフル解像度ルミナンス画像データの選択された部分とを提供してもよい。第1視点の非フィルタリングフル解像度ルミナンス画像データは、第1視点の非フィルタリングフル解像度画像フレーム(図1Aの102−Lなど)のルミナンス画像データを有し、第2視点の非フィルタリングフル解像度画像データの選択された部分は、第2視点の他方の非フィルタリングフル解像度画像フレーム(本例では図1Aの102−R)の選択された部分のルミナンス画像データを有してもよい。
【0108】
図3Eは、第1視点(左目視点など)の非フィルタリングフル解像度ルミナンス画像データと、異なる第2視点(右目視点など)の非フィルタリングフル解像度ルミナンス画像データの選択された部分とを有するEL画像データの一例となる画像データ構成を示す。
【0109】
実施例では、必要に応じて採用されたサンプリング方式下でサブサンプリングされた非フィルタリングフル解像度LE画像フレーム(102−L)のルミナンス画像データは、YCbCrカラー空間における画像フレームのルミナンスチャネルについて指定されるデータ部分(200−1)に保持される。いくつかのサンプリング方式下では、残りのデータ部分はデータ部分(200−1)より小さい。例えば、4−2−0サンプリング方式では、残りのデータ部分は合計するとデータ部分(200−1)の1/2に達するものであってもよい。従って、残りのデータ部分は、第2視点のルミナンス画像データを搬送するのに十分なデータキャパシティを有しなくてもよい。代わりに、必要に応じて採用されたサンプリング方式下でサブサンプリングされた第2視点の非フィルタリングフル解像度ルミナンス画像データの選択された部分(50%など)(により表されるピクセルの上半分など)の第1部分は、YCbCrカラー空間における画像フレームのCbクロマチャネルについて指定されたデータ部分(200−2)に保持される。必要に応じて採用されたサンプリング方式下でサブサンプリングされた第2視点の非フィルタリングフル解像度ルミナンス画像データの選択された部分(により表されるピクセルの下半分など)の第2部分は、YCbCrカラー空間における画像フレームのCbクロマチャネルについて指定されるデータ部分(200−3)に保持される。
【0110】
異なる視点における非フィルタリング画像データ部分のサイズは、必要に応じて何れかの調整による採用されたサンプリング方式に指定されたものに整合するよう限定されてもよい。
【0111】
実施例では、マルチレイヤ3Dビデオエンコーダ(図1Aの100)は、LE視点とRE視点との間においてエンハンスメントレイヤにおける非フィルタリングフル解像度ルミナンス画像データと対応する非フィルタリングフル解像度ルミナンス画像データの選択された部分とをスイッチする。エンハンスメントレイヤにおける非フィルタリングフル解像度画像データの搬送波、3D画像間、シーン間、固定期間の間にLE視点とRE視点との間で切り替えられてもよい。LE視点とRE視点との間で非フィルタリングフル解像度画像データを交互に搬送する他の方法がまた利用されてもよい。
【0112】
エンハンスメントレイヤを介し非フィルタリングフル解像度ルミナンス画像データを送信するため、RPU(図1Aの114など)は、データ部分200−1における非フィルタリングフル解像度画像データの予測リファレンス値を生成するため、第1視点(前述の例では左目視点など)のBL1/2解像度ルミナンス画像データをアップサンプリングしてもよい。RPU(114)は、データ部分200−2及び200−3における非フィルタリングフル解像度画像データの更なる予測リファレンス値を生成するため、異なる第2視点(右目視点)のBL1/2解像度ルミナンス画像データの選択された部分をアップサンプリングしてもよい。1以上の処理が、これらの予測リファレンス値のレイヤ間予測クオリティを向上させるため適用されてもよい。
【0113】
第1視点の非フィルタリング画像フレーム(102−L)におけるフル解像度ルミナンス画像データと予測リファレンス値との間のルミナンス残差(又は差分)が計算されてもよい。ルミナンス残差がデータ部分200−1に格納される。第2視点(102−R)の非フィルタリングフル解像度ルミナンス画像データの選択された部分と更なる予測リファレンス値との間の更なるルミナンス残差(又は差分)がまた計算されてもよい。更なるルミナンス残差はデータ部分200−2及び200−3に格納される。
【0114】
データ部分200−1〜200−3におけるルミナンス残差は、予測リファレンス値と更なる予測リファレンス値とを生成する際に利用されるリファレンスパラメータセットと共に、エンハンスメントレイヤにおいて出力される。限定することなく、選択された部分のポジションを示す情報を含むジオメトリック情報が、RPUストリーム(図1A又は1Cの118−2)により1以上のビデオ信号を介し送信されてもよい。
【0115】
マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、リファレンスパラメータセットを用いて第1視点のベースレイヤにおける1/2解像度ルミナンス画像データ部分を受信してアップサンプリングし、予測リファレンス値を生成し、エンハンスメントレイヤから受信したルミナンス残差(データ部分200−1における)と予測リファレンス値との和によって、第1視点の出力画像フレームにおいて非フィルタリングフル解像度ルミナンス画像データを更に生成する。
【0116】
実施例では、マルチレイヤ3Dビデオデコーダ(図1Cの150)は、第2視点のアップサンプリングされた画像フレームを形成するため、ベースレイヤにおいて1/2解像度ルミナンス画像データ部分を受信してアップサンプリングする。マルチレイヤ3Dビデオデコーダ(図1Cの150)は、リファレンスパラメータセットを用いてアップサンプリングされた画像フレームの選択された部分を用いて予測リファレンス値を計算し、エンハンスメントレイヤから受信した残差(データ部分200−1〜200−3における)と予測リファレンス値との和によって、出力画像フレーム(図1Cの176−Rなど)の選択された部分を更に生成/置換する。
【0117】
実施例では、ベースレイヤにおけるクロマ画像データは、3D画像の出力LE及びRE画像フレームを形成する一部として、ダウンストリーム装置(図1Cのマルチレイヤビデオデコーダ150など)によってアップサンプリングされ、ルミナンス画像データにより補間されてもよい。
【0118】
4.6.フォールバック又は代替的な画像データ構成
説明のため、一例となるELデータ構成は、ルミナンス画像データと非ルミナンス画像データとの双方を含むか、又は一方の視点のルミナンス画像データと他方の視点のパーシャルルミナンス画像データとの双方を含むことが説明された。フォールバックとして、これらの例示的なELデータ構成は、例えば、現在のネットワーク状態に動的に基づき、より少ない画像データを搬送するよう構成されてもよい。いくつかの実施例では、ルミナンス画像データのみが、一方又は双方の視点について受信側装置に送信される。例えば、図2のデータ部分200−2及び200−3は、スタブ値(stub value)によるフラット画像のみを搬送してもよく、当該スタブ値は、8ビット画像データのケースにおいてそれぞれが128に設定されるpel値(pel value)(又はフォールバック)であってもよい。
【0119】
図4は、一例となるフォールバックデータ構成を示す。図4(a)に示されるような例では、データ部分200−1は、図3Aに示されるものと同様に、LE視点とRE視点との双方のフィルタリング1/2解像度ルミナンス画像データを伝送するのに利用されてもよい。しかしながら、図4のデータ部分200−2及び200−3は、Cb/Cr画像データの代わりに、pel値(128など)のみを含む。図4(b)に示されるような他の例では、データ部分200−1は、図3B、3C及び3Eに示されるものと同様に、第1視点の非フィルタリングフル解像度ルミナンス画像データを搬送してもよい。しかしながら、図4のデータ部分200−2及び200−3は、Cb/Cr画像データ又は他のルミナンス画像データの代わりに、pel値(128など)のみを含む。図4(c)に示されるような更なる例では、データ部分200−1は、図3Dに示されるものと同様に、LE視点とRE視点との双方について非フィルタリングフル解像度ルミナンス画像データの選択された部分を伝送するのに利用されてもよい。しかしながら、図4のデータ部分200−2及び200−3は、Cb/Cr画像データの代わりに、pel値(128など)のみを含む。
【0120】
これらの例のELデータ構成においてpel値を利用することは、ビデオ圧縮において無視しうるビット数しか使用しない。
【0121】
説明のため、EL画像データの複数のフォールバック及び非フォールバックデータ構成が示された。他のタイプのデータ構成が、本発明の範囲内において利用されてもよい。更に、上述したデータ構成の組み合わせは、1以上のエンハンスメントレイヤにおいて画像データを搬送するのに利用されてもよい。実施例では、データ部分200−1は、図3Dに示されるようなELルミナンスデータを搬送するのに利用されてもよく、データ部分200−2及び200−3は、非フィルタリングフル解像度LE及びREルミナンス画像データの残りのピクセルの一部を搬送するのに利用されてもよい。
【0122】
実施例では、画像フレーム(図1Aの112−2又は図1Cの158−2)のルミナンスチャネルは、1以上のエンハンスメントレイヤを介しオリジナルの非フィルタリングフル解像度入力LE及びRE画像フレーム(図1Aの102−L及び102−Rなど)における非フィルタリングルミナンス画像データのサブセットを伝送するのに利用され、画像フレーム(図1Aの112−2又は図1Cの158−2)のクロマチャネルは、(a)オリジナルの非フィルタリングフル解像度入力LE及びRE画像フレーム(図1Aの102−L及び102−R)の残りのルミナンスデータのサブセット、(b)オリジナルの非フィルタリングフル解像度入力LE及びRE画像フレーム(図1Aの102−L及び102−R)から導出される補完的なフィルタリング画像データ(図1Aの112−1又は図1Cの158−1)のサブセット、又は(c)オリジナルの非フィルタリングフル解像度入力LE及びRE画像フレーム(図1Aの102−L及び102−R)における非フィルタリングクロマデータのサブセットを搬送するのに利用される。
【0123】
実施例では、マルチレイヤ3Dビデオデコーダ(図1Cの150など)が、1以上のデータ部分におけるpel値によりEL画像データを処理するよう構成されてもよい。例えば、データ部分(200−1〜2003−の1つなど)は、基礎となるネットワーク状態により3D画像データの配信を徴するため、pel値によって可変的、部分的又は全体的に占有されてもよい。マルチレイヤ3Dビデオデコーダ(図1Cの150)は、出力LE及びRE画像フレームを生成する一部としてpel値により置換された欠落した画像データをアップサンプリング及び/又は補間してもよい。
【0124】
これらの例示的なデータ構成は、エンハンスメントレイヤが限定的な帯域幅に割り当てられるとき、又は割り当てられた場合に利用されてもよい。ここに説明されるように技術の下、特に利用可能な帯域幅が低く、クオリティ3D画像を生成するためのビットレート要求が高いとき、出力3D画像のクオリティがクロマ画像データよりルミナンス画像データに大きく依存するため、ルミナンス画像データは、エンハンスメントレイヤの他の画像データにタイして最大程度まで優先化される。
【0125】
いくつかの実施例では、アップストリーム装置(図1Aの100などのマルチレイヤ3Dビデオエンコーダを有してもよい)は、複数の異なるタイプのデータ構成をサポートし、複数の異なるタイプのデータ構成の何れによりEL画像データを送信してもよい。異なるタイプのデータ構成は、限定することなく、図3及び4に示されるようなデータ構成の具体例を含むものであってもよい。実施例では、アップストリーム装置は、1つのフレーム、複数のフレーム、1つのシーン、複数のシーン、1秒、複数秒、1つのプログラム、複数のプログラムなどの1以上のデータ構成を利用するため、予め設定されるか、ランタイム中に動的に設定されるか、又はユーザにより手動により設定されてもよい。更に及び/又は任意的に、異なるタイプのデータ構成の間のEL画像データの搬送を切り替える他の方法が利用されてもよい。例えば、入力3D画像(又はそれらのLE及びRE構成要素の画像フレーム)の1以上の信号特性(フィンガープリント、統計的ルミナンス値、動き、クロマ特徴、シャープネス、明るさ、カラーなど)が、特定タイプのデータ構成がEL画像データを送信するのに利用されるべきか、また何れの時点で利用されるべきか判断するため、ここに説明されるマルチレイヤ3Dビデオエンコーダにより利用されてもよい。
【0126】
いくつかの実施例では、ダウンストリーム装置(図1Cの150などのマルチレイヤ3Dビデオデコーダを有してもよい)は、1以上の異なるタイプのデータ構成をサポートし、1以上の異なるタイプのデータ構成の何れによりEL画像データを受信してもよい。実施例では、ダウンストリーム装置は、1以上の異なるタイプのデータ構成によりビデオ信号を選択的に受信するため、予め設定されるか、ランタイム中に動的に設定されるか、又はユーザにより手動により設定されてもよい。
【0127】
いくつかの実施例では、アップストリーム装置は、現在のネットワーク状態及び/又は受信側装置の特性に基づき、1以上の特定タイプのデータ構成によりEL画像データを送信してもよい。いくつかの実施例では、ダウンストリーム装置は、現在のネットワーク状態及び/又は同一のメディアコンテンツの異なるタイプのデータ構成の可用性に基づき、1以上の特定タイプのデータ構成のEL画像データにより1以上のビデオ信号を選択してもよい。いくつかの実施例では、ここで説明されるような画像処理装置は、可能な最良のステレオ3D視聴体感を提供する1以上の異なるタイプのデータ構成により動作するよう構成される。
【0128】
更に及び/又は任意的には、変換、量子化、エントロピー符号化、画像バッファリング、サンプルフィルタリング、ダウンサンプリング、アップサンプリング、補間、多重化、逆多重化、インタリーブ、アップスケーリング、ダウンスケーリング、動き補償、ディスパリティ推定、ディスパリティ補償、デプス推定、デプス補償、符号化、復号化などの1以上が、ここに説明されるようなビデオエンコーダ又はデコーダにより実行されてもよい。
【0129】
ここに説明されるような技術は、知覚された立体3Dにおいてより良好な空間解像度を生成する。いくつかの実施例では、BL 3D画像を復号化可能なデコーダとの後方互換性と、補完的なフィルタリングEL 3D画像データを復号化可能なデコーダとの後方互換性との1以上が維持される。従って、いくつかの実施例では、ここで説明されるビデオ信号は、3Dコンテンツ配信のための既存のフレームコンパチブルシステムと後方互換的であり、現在のFCFRフレームワークと共に利用されてもよい。更に、ここに説明される技術は、3D視覚的クオリティの最良の再生を生成するため、エンハンスメントレイヤにおいて異なるタイプの画像データ構成間の切り替えのフレキシビリティを提供する。
【0130】
5.一例となる処理フロー
図5Aは、本発明の実施例による一例となる処理フローを示す。いくつかの実施例では、1以上の計算装置又はコンポーネントが、当該処理フローを実行してもよい。ブロック502において、マルチレイヤ3Dビデオエンコーダ(図1Aの100など)は、入力3D画像シーケンスにおける第1入力3D画像を受信する。第1入力3D画像は、第1視点の第1入力画像フレームと異なる第2視点の第2入力画像フレームとを有する。
【0131】
ブロック504において、マルチレイヤ3Dビデオエンコーダ(100)は、1以上の判定ファクタに基づき、複数の異なるタイプのデータ構成から1以上のエンハンスメントレイヤにおいてエンハンスメントレイヤ(EL)画像データを送信するのに利用される特定タイプのデータ構成を選択する。
【0132】
ブロック506において、マルチレイヤ3Dビデオエンコーダ(100)は、第1及び第2入力画像フレームの1以上を用いて1以上のカラーチャネルにおける画像データを導出する。
【0133】
ブロック508において、マルチレイヤ3Dビデオエンコーダ(100)は、特定タイプのデータ構成においてEL画像データとして1以上のカラーチャネルにおいて画像データを符号化及び出力する。
【0134】
実施例では、マルチレイヤ3Dビデオエンコーダ(100)は、第1及び第2入力画像フレームに基づき、第1及び第2視点の低減された解像度の画像データを生成し、ベースレイヤに低減された解像度の画像データを符号化及び出力する。実施例では、1以上のカラーチャネルにおける画像データは、第1及び第2入力画像フレームの1以上から導出される非フィルタリング高空間周波数コンテンツを有し、低減された解像度の画像データは、第1及び第2入力画像フレームから導出されるフィルタリング画像データを有する。
【0135】
実施例では、マルチレイヤ3Dビデオエンコーダ(100)は、低減された解像度の画像データとリファレンスパラメータセットとに少なくとも部分的に基づき複数の予測リファレンス値を生成し、第1及び第2入力画像フレームの少なくとも1つの1以上のカラーチャネルにおける複数のピクセル値と複数の予測リファレンス値との間の複数の残差値として、1以上のカラーチャネルの画像データを計算し、1以上のカラーチャネルにおける画像データと共にリファレンスパラメータセットを符号化及び出力する。
【0136】
実施例では、入力3D画像シーケンスは、第1視点の第3入力画像フレームと第2視点の第4入力画像フレームとを有する第2の異なる入力3D画像を有する。マルチレイヤ3Dビデオエンコーダ(100)は、1以上の判定ファクタに基づき、複数の異なるタイプのデータ構成から1以上のエンハンスメントレイヤにより第2EL画像データを送信するのに利用される第2の特定タイプのデータ構成を選択し、第3及び第4入力画像フレームの1以上から、1以上の第2カラーチャネルの第2画像データを導出し、第2の特定タイプのデータ構成における第2EL画像データとして1以上の第2カラーチャネルの第2画像データを符号化及び出力する。実施例では、EL画像データの特定タイプのデータ構成を示す第1EL画像データ記述子は、EL画像データと共にエンハンスメントレイヤにより出力され、第2EL画像データの第2の特定タイプのデータ構成を示す異なる第2EL画像データ記述子は、第2画像データと共にエンハンスメントレイヤにおいて出力される。実施例では、EL画像データ記述子シーケンスは、入力3D画像シーケンスから導出された画像データと共にエンハンスメントレイヤにおいて出力される。第1EL画像データ記述子は、EL画像データ記述子シーケンスにおいて第2EL画像データ記述子の直前にあり、第1EL画像データ記述子は、フレームレベル、シーンレベル又は固定期間レベルにおいてEL画像データ記述子シーケンスの第2EL画像データ記述子に遷移する。
【0137】
実施例では、1以上のカラーチャネルは、RGBカラー空間、YCbCrカラー空間又は他のカラー空間の1つによる少なくとも1つのカラーチャネルを有する。
【0138】
実施例では、画像コンテナは、1以上のカラーチャネルにより画像データを保持するのに利用され、画像コンテナは、サンプリング方式下でサンプリングされた2以上のデータ部分を有し、画像コンテナは、複数のサンプリング方式に関する複数の画像コンテナから選択される。いくつかの実施例では、複数のサンプリング方式は、4−4−4サンプリング方式、4−2−2サンプリング方式、4−2−0サンプリング方式又は他のサンプリング方式を少なくとも有する。
【0139】
いくつかの実施例では、複数の異なるタイプのデータ構成は、(a)ベースレイヤを介し送信されるフィルタリングされた低減された解像度の画像データを補完する補完的フィルタリング低解像度画像データ、(b)第1及び第2視点の一方の非フィルタリングフル解像度画像データ、(c)第1視点の非フィルタリングフル解像度ルミナンス画像データ及び第2視点の1/2解像度ルミナンス画像データ、(d)第1及び第2入力画像フレームの選択された部分から導出される非フィルタリングフル解像度ルミナンス画像データ、(e)第1視点の非フィルタリングフル解像度ルミナンス画像データと第2視点のパーシャル非フィルタリングフル解像度ルミナンス画像データ、及び(d)画像データの一部をpel値と少なくとも置換することによる1以上のフォールバックタイプのデータ構成の1以上を有する。
【0140】
実施例では、1以上の判定ファクタは、オーディオ及びビデオ信号特性、複数の異なるタイプのデータ構成の各自の帯域幅要求、アップストリーム装置と受信側装置との間の現在のネットワーク接続に関する帯域幅制約、現在のネットワーク接続によりサポートされる最大、平均又は最小ビットレート、及び/又は現在のネットワーク接続の1以上のQoS指標の1以上を有する。
【0141】
実施例では、マルチレイヤ3Dビデオエンコーダ(100)は、1以上の入力ビデオ信号により表現、受信、送信又は格納される1以上の入力3D画像を、1以上の出力ビデオ信号により表現、受信、送信又は格納された1以上の出力3D画像に変換する。
【0142】
いくつかの実施例では、第1入力3D画像とEL画像データとの少なくとも1つは、HDR(High Dynamic Range)画像フォーマット、AMPAS(Academy of Motion Picture Arts and Sciences)のACES(Academy Color Encoding Specification)規格に関するRGBカラー空間、Digital Cinema InitiativeのP3カラー空間規格、RIMM/ROMM(Reference Input Medium Metric/Reference Output Medium Metric)規格、sRGBカラー空間又はITU(International Telecommunications Union)のBT.709 Recommendation規格に関するRGBカラー空間の1つにより符号化される画像データを有する。
【0143】
図5Bは、本発明の実施例による一例となる処理フローを示す。実施例では、1以上の計算装置又はコンポーネントが当該処理フローを実行してもよい。ブロック552において、マルチレイヤ3Dビデオデコーダ(図1Cの150など)は、3D画像のベースレイヤ及び入力エンハンスメントレイヤ(EL)画像データにおける3D画像の第1視点と異なる第2視点との入力された低減された解像度の画像データを受信し、1以上のエンハンスメントレイヤにおいて入力EL画像データ記述子を受信する。入力EL画像データ記述子は、1以上のエンハンスメントレイヤにおいて入力EL画像データの特定タイプのデータ構成を示す。
【0144】
ブロック554において、マルチレイヤ3Dビデオデコーダ(150)は、入力EL画像データから当該入力EL画像データ記述子により示される特定タイプのデータ構成に少なくとも部分的に基づき、1以上のカラーチャネルにおける3D画像の画像データを導出する。
【0145】
ブロック556において、マルチレイヤ3Dビデオデコーダ(150)は、入力低解像度画像データにによる1以上のカラーチャネルの画像データに基づき、第1視点の第1出力画像フレームと第2視点の第2出力画像フレームとを生成する。
【0146】
ブロック558において、マルチレイヤ3Dビデオデコーダ(150)は、第1視点の第1出力画像フレームをレンダリングし、第2視点の第2出力画像フレームをレンダリングすることによって、3D画像をレンダリングする。
【0147】
実施例では、1以上のカラーチャネルの画像データは、非フィルタリングフル解像度ソース画像データから導出された1以上のカラーチャネルにおける非フィルタリング高空間周波数コンテンツを有し、入力低解像度画像データは、非フィルタリングフル解像度ソース画像データから導出されたフィルタリング画像データを有する。
【0148】
実施例では、マルチレイヤ3Dビデオデコーダ(150)は、1以上のエンハンスメントレイヤにおける入力リファレンスパラメータセットを受信し、入力低解像度画像データと入力リファレンスパラメータセットとに少なくとも部分的に基づき、複数の予測リファレンス値を生成し、1以上のカラーチャネルの画像データの残差値及び複数の予測リファレンス値とを、第1及び第2出力画像フレームの少なくとも1つの1以上のカラーチャネルの複数の画素値に合成する。
【0149】
実施例では、3D画像は、画像データがベースレイヤと1以上のエンハンスメントレイヤとの双方から受信される3D画像シーケンス内にある。3D画像シーケンスは異なる第2の3D画像を有し、マルチレイヤ3Dビデオデコーダ(150)は更に、ベースレイヤにおいて第2の3D画像の第1視点及び第2視点の第2の入力低解像度画像データと、1以上のエンハンスメントレイヤにおいて第2の3D画像の第2入力EL画像データ及び第2入力EL画像データ記述子とを受信し、第2EL画像データ記述子は、1以上のエンハンスメントレイヤにおける第2EL画像データの第2の特定タイプのデータ構成を示し、第2EL画像データから第2EL画像データ記述子に示されるような第2の特定タイプのデータ構成に少なくとも部分的に基づき、1以上の第2カラーチャネルにおいて第2の3D画像の第2画像データを導出し、第2入力低解像度画像データによる1以上の第2カラーチャネルの第2画像データに基づき、第1視点の第3出力画像フレームと第2視点の第4出力画像フレームとを生成し、第1視点の第3出力画像フレームをレンダリングし、第2視点の第4出力画像フレームをレンダリングすることによって、第2の3D画像をレンダリングするよう構成される。
【0150】
実施例では、入力EL画像データ記述子シーケンスは、3D画像シーケンスの画像データと共にエンハンスメントレイヤにおいて入力され、第1入力EL画像データ記述子は、入力EL画像データ記述子シーケンスの第2入力EL画像データ記述子の直前にあり、第1入力EL画像データ記述子は、フレームレベル、シーンレベル又は固定期間レベルの1つにおいてEL画像データ記述子シーケンスの入力第2EL画像データ記述子に遷移する。
【0151】
実施例では、1以上のカラーチャネルは、RGBカラー空間、YCbCrカラー空間又は他のカラー空間の1つにおいて少なくとも1つのカラーチャネルを有する。
実施例では、画像コンテナは、1以上のカラーチャネルの画像データを保持するのに利用され、画像コンテナは、サンプリング方式の下でサンプリングされた2以上のデータ部分を有し、画像コンテナは、複数のサンプリング方式に関する複数の画像コンテナからのものであり、複数のサンプリング方式は、4−4−4サンプリング方式、4−2−2サンプリング方式、4−2−0サンプリング方式又は他のサンプリング方式を少なくとも有する。
【0152】
実施例では、複数の異なるタイプのデータ構成は、(a)ベースレイヤを介し送信されたフィルタリング低解像度画像データを補完する補完的フィルタリング低解像度画像データ、(b)第1及び第2視点の1つの非フィルタリングフル解像度画像データ、(c)第1視点の完全な非フィルタリングフル解像度ルミナンス画像データ及び第2視点の1/2解像度ルミナンス画像データ、(d)第1及び第2入力画像フレームの選択された部分から導出される非フィルタリングフル解像度ルミナンス画像データ、(e)第1視点の完全な非フィルタリングフル解像度ルミナンス画像データ及び第2視点のパーシャル非フィルタリングフル解像度ルミナンス画像データ、及び(d)画像データの少なくとも一部をpel値により置換することによって、1以上のフォールバックタイプのデータ構成の1以上を有する。
【0153】
実施例では、マルチレイヤ3Dビデオデコーダ(150)は、1以上の入力ビデオ信号により表現、受信、送信又は格納された1以上の3D画像を処理する。
【0154】
実施例では、入力低解像度画像データ又は入力EL画像データの少なくとも一部は、HDR(High Dynamic Range)画像フォーマット、AMPAS(Academy of Motion Picture Arts and Sciences)のACES(Academy Color Encoding Specification)規格に関するRGBカラー空間、Digital Cinema InitiativeのP3カラー空間規格、RIMM/ROMM(Reference Input Medium Metric/Reference Output Medium Metric)規格、sRGBカラー空間又はITU(International Telecommunications Union)のBT.709 Recommendation規格に関するRGBカラー空間の1つにより符号化される画像データを有する。
【0155】
各種実施例では、エンコーダ、デコーダ、システム、装置又は1以上の他の計算装置は、上述された方法の何れか又は一部を実行する。
【0156】
6.実現機構−ハードウェア概略
一実施例によると、ここに説明された技術は、1以上の特定用途計算装置により実現される。特定用途計算装置は、当該技術を実行するよう配線化されてもよく、又は当該技術を実行するよう永続的にプログラムされた1以上のASIC(Application−Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)などのデジタル電子装置を含むものであってもよく、あるいは、ファームウェア、メモリ、他のストリーム又は組み合わせにおける命令をプログラムするのに準拠した技術を実行するようプログラムされた1以上の汎用ハードウェアプロセッサを有してもよい。このような特定用途計算装置はまた、当該技術を実現するためのカスタムプログラミングとカスタム配線ロジック、ASIC又はFPGAとを組み合わせてもよい。特定用途計算装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、携帯装置、ネットワーキング装置又は当該技術を実現するための配線化及び/又はプログラムロジックを搭載した他の何れかの装置であってもよい。
【0157】
例えば、図6は、本発明の実施例が実現されるコンピュータシステム600を示すブロック図である。コンピュータシステム600は、情報を通信するためのバス602又は他の通信機構と、情報を処理するためバス602に接続されたハードウェアプロセッサ604とを有する。ハードウェアプロセッサ704は、例えば、汎用マイクロプロセッサであってもよい。
【0158】
コンピュータシステム600はまた、プロセッサ604により実行される命令及び情報を格納するため、バス602に接続されるRAM(Random Access Memory)又は他のダイナミックストレージ装置などのメインメモリ606を有する。メインメモリ606はまた、プロセッサ604により実行される命令の実行中に一時的な変数又は他の中間情報を格納するのに利用されてもよい。当該命令は、プロセッサ604にアクセス可能な非一時的記憶媒体に格納されると、当該命令に指定された処理を実行するようカスタマイズされた特定用途マシーンにコンピュータシステム600をする。
【0159】
コンピュータシステム600は更に、プロセッサ604の静的情報及び命令を格納するため、バス602に接続されたROM(Read Only Memory)608又は他のスタティックストレージ装置を含む。磁気ディスクや光ディスクなどのストレージ装置610が備えられ、情報及び命令を格納するためバス602に接続される。
【0160】
コンピュータシステム600は、コンピュータユーザに情報を表示するため、液晶ディスプレイなどのディスプレイ612にバス602を介し接続されてもよい。英数字又は他のキーを含む入力装置614は、プロセッサ604に情報及び命令の選択を通信するため、バス602に接続される。他のタイプのユーザ入力装置は、プロセッサ604に方向情報及び命令の選択を通信し、ディスプレイ612上のカーソルの動きを制御するため、マウス、トラックボール又はカーソル方向キーなどのカーソルコントロール616である。当該入力装置は、典型的には、当該装置が平面上の位置を指定することを可能にする第1軸(xなど)及び第2軸(yなど)の2つの軸の2つの自由度を有する。
【0161】
コンピュータシステム600は、コンピュータシステムと一緒になって、コンピュータシステム600を特定用途マシーンにする又はプログラムするカスタマイズされたカスタマイズされた配線ロジック、1以上のASIC若しくはFPGA、ファームウェア及び/又はプログラムロジックを用いて、ここに説明された技術を実現してもよい。一実施例によると、ここでの技術は、プロセッサ604がメインメモリ606に含まれる1以上の命令シーケンスを実行することに応答して、コンピュータシステム600により実行される。当該命令は、ストレージ装置610などの他の記憶媒体からメインメモリ606に読み込まれてもよい。メインメモリ606に含まれる命令シーケンスの実行は、プロセッサ604にここに説明される処理ステップを実行させる。他の実施例では、配線化回路が、ソフトウェア命令の代わりに又は一緒に利用されてもよい。
【0162】
ここで用いられる“記憶媒体”という用語は、マシーンに具体的な方法により動作させる命令及び/又はデータを格納する何れかの非一時的媒体を表す。当該記憶媒体は、不揮発性媒体及び/又は揮発性媒体を有してもよい。不揮発性媒体は、例えば、ストレージ装置610などの光又は磁気ディスクを含む。揮発性媒体は、メインメモリ606などのダイナミックメモリを含む。記憶媒体のための一般的な形態は、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ若しくは他の何れかの磁気データ記憶媒体、CD−ROM、他の何れかの光データ記憶媒体、ホールパターンによる何れかの物理媒体、RAM、PROM、EPROM、FASH−EPROM、NVRAM、他の何れかのメモリチップ又はカートリッジなどを含む。
【0163】
記憶媒体は、伝送媒体と別であるが、これと共に利用されてもよい。伝送媒体は、記憶媒体間で情報を伝送することに関与する。例えば、伝送媒体は、バス602を有する配線を含む同軸ケーブル、導線及び光ファイバを含む。伝送媒体はまた、無線波及び赤外線データ通信中に生成されるものなど、音響又は光波の形態をとることが可能である。
【0164】
各種形態の媒体が、実行のためプロセッサ604に1以上の命令シーケンスを搬送することに関与してもよい。例えば、命令は、初期的にはリモートコンピュータの磁気ディスク又はソリッドステートドライブに搬送されてもよい。リモートコンピュータは、それのダイナミックメモリに命令をロードし、モデムを用いて電話線を介し命令を送信可能である。コンピュータシステム600にローカルなモデムは、電話線上でデータを受信し、赤外線送信機を用いて当該データを赤外線信号に変換可能である。赤外線検出装置は、赤外線信号に搬送されたデータを受信し、適切な回路がバス602上にデータを配置可能である。バス602は、データをメインメモリ606に搬送し、当該メモリからプロセッサ604は命令を抽出及び実行する。メインメモリ606により受信された命令は、任意的にはプロセッサ604による実行前又は実行後にストレージ装置610に格納されてもよい。
【0165】
コンピュータシステム600はまた、バス602に接続される通信インタフェース618を有する。通信インタフェース618は、ローカルネットワーク622に接続されるネットワークリンク620に双方向データ通信接続を提供する。例えば、通信インタフェース618は、対応するタイプの電話線とのデータ通信接続を提供するためのISDN(Integrated Service Digital Network)カード、ケーブルモデム、衛星モデム又はモデムであってもよい。他の例として、通信インタフェース618は、互換的なLANとのデータ通信接続を提供するため、ローカルエリアネットワーク(LAN)カードであってもよい。当該実現形態では、通信インタフェース618は、各種タイプの情報を表すデジタルデータストリームを搬送する電気、電磁気又は光信号を送受信する。
【0166】
ネットワークリンク620は、典型的には、1以上のネットワークを介し他のデータ装置とのデータ通信を提供する。例えば、ネットワークリンク620は、インターネットサービスプロバイダ(ISP)626により運営されるホストコンピュータ624又はデータ装置とのローカルネットワーク622を介した接続を提供してもよい。ISP626は更に、現在一般に“インターネット”と呼ばれるワールドワイドパケットデータ通信ネットワークを介しデータ通信サービスを提供する。ローカルネットワーク622及びインターネット628は共に、デジタルデータストリームを搬送する電気、電磁気又は光信号を利用する。各種ネットワークを介した信号と、ネットワークリンク620及び通信インタフェース618を介した信号とは、コンピュータシステム600との間でデジタルデータを搬送し、伝送媒体の具体的な形態である。
【0167】
コンピュータシステム600は、プログラムコードを含むデータ及びメッセージをネットワーク、ネットワークリンク620及び通信インタフェース618を介し送受信可能である。インターネットの具体例では、サーバ630は、インターネット628、ISP626、ローカルネットワーク622及び通信インタフェース618を介しアプリケーションプログラムのための要求されたコードを送信してもよい。
【0168】
受信したコードは、受信されると、及び/又は以降の実行のためストレージ装置610又は他の不揮発性ストレージに格納されると、プロセッサ604により実行されてもよい。
【0169】
7.均等、拡張、代替及びその他
上記明細書では、本発明の実施例が、実現形態毎に変化しうる多数の具体的な詳細を参照して説明された。従って、本発明が何であって、出願人により発明であると意図される唯一の排他的な指標は、何れか以降の訂正を含む請求項が発行する特定の形態において本出願から発行した請求項群である。当該請求項に含まれる用語についてここに明示的に提供される何れかの定義は、当該請求項に用いられるような用語の意味を支配する。従って、請求項に明示的に記載されない限定、要素、性質、特徴、効果又は属性は、当該請求項の範囲を何れかの方法に限定すべきでない。従って、明細書及び図面は、限定的でなく例示的であるとみなされるべきである。
図1A
図1B
図1C
図2
図3A
図3B
図3C
図3D
図3E
図4
図5
図6