【文献】
Yuwen Wu, Yongying Gao, and Ying Chen,Bit Depth Scalable Coding,2007 IEEE International Conference on Multimedia and Expo,2007年 7月 2日,p.1139-1142
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0025】
一般に、この開示は、ビット深度ベースのスケーラブルビデオコーディング(SVC)方式において実行されるビデオエンコード及びビデオデコード手法を記述する。「コーディング(coding)」という用語は、一般的には、エンコードまたはデコードのいずれかを参照するために使用される。この開示に従って、ベースレイヤビデオデータ及びエンハンスメントレイヤビデオデータは、異なるビット深度で定められる。ベースレイヤビデオデータはMビットのビット深度を持ち得るし、エンハンスメントレイヤビデオデータはNビット(NはMより大きい)までのエンハンスメントを提供し得る。
【0026】
この開示の手法はエンハンスメントレイヤがベースレイヤよりも大きいビット深度に対応する限りは任意のビット深度に適用され得るが、例として、ベースレイヤビット深度は8ビットであり得るし、エンハンスメントレイヤは10ビットのためのエンハンスメントを提供し得る。この例において、ピクセル値(例えば、ピクセルドメインにおけるクロマ及びルーマ値)は、エンハンスメントレイヤにおいて10ビットで表され、ベースレイヤにおいて8ビットで表される。8ビットは256個の異なるピクセル値を許容し得る一方、10ビットは1024個の異なるピクセル値を許容し得る。また一方では、N及びMに関する10及び8のビット深度値は、単なる例に過ぎない。一般的には、N及びMは正の整数を表し、NはMより大きい。
【0027】
この開示の手法は、エンハンスメントレイヤビデオブロックのコーディングに関する。特に、この開示の手法は、特に、一度エンコーダがエンハンスメントレイヤビデオブロックはインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定すると、または一度デコーダがエンハンスメントレイヤビデオブロックはインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定すると、適用される。これらの場合において、2つまたは3以上の異なるインターレイヤ予測コーディングモードがインターベースレイヤブロックの予測について利用され得るし、これら予測コーディングモードの1つもまたイントラベースレイヤブロックの予測について利用され得る。デコーダがデコードにおいてインターレイヤ予測コーディングモードを使用できるように、シンタクス情報がエンコーダにおいて生成され、ビットストリームを用いて伝達され得る。特に、第1のシンタクス情報はエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされているかどうかを伝達するために使用され得るし、第2のシンタクス情報はこの場合に使用されるインター予測コーディングモードを指定するために使用され得る。
【0028】
「イントラ」エンハンスメントレイヤビデオブロック(例えば、対応するベースレイヤブロックが空間的コーディング手法に基づいてイントラコーディングされるエンハンスメントレイヤビデオブロック)のために、この開示は、残差ビデオブロックがNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として生成される第1のインターレイヤ予測コーディング手法を使用する。このタイプの予測は、イントラベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックに関して非常に効果的となり得る。
【0029】
他方では、インターベースレイヤブロックに対応するエンハンスメントレイヤビデオブロック(例えば、対応するベースレイヤブロックが動き推定及び動き補償などの時間的コーディング手法に基づいてインターコーディングされるエンハンスメントレイヤブロック)のために、この開示は2つの異なるインターレイヤ予測コーディング手法のどちらかを選択する。この場合には、第1のインターレイヤ予測コーディング手法はイントラブロックのために使用されるものと同じであり、即ち、残差ビデオブロックがNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として生成される。第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての残差ビデオブロックの生成を含む。インターベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックのためにこれら2つの異なる予測コーディング手法のどちらかを選択する能力は、望ましい圧縮及びビデオ品質を達成するときに非常に効果的となり得る。
【0030】
エンコーダにおいて、この手法は種々のビデオブロックタイプ(イントラまたはインター)に適用され得るし、インターベースレイヤブロックのための2つの異なる予測コーディング手法のどちらかの選択は最高レベルのデータ圧縮及び/または最高のビデオ品質を提供する予測コーディング手法に基づいて起こり得る。レート及び歪は、しばしば、この選択をなすときにバランスを保たれる。シンタクス情報は、デコーダがエンコーダにおいて適用された予測エンコード手法を適切に通知されるように、ビットストリームにおいてコーディングされる。それから、デコーダにおいて、ビデオブロックタイプ(イントラまたはインター)及びシンタクス情報は、デコーダが正しい予測エンコード手法を適用することになるように、使用され得る。特に、デコーダにおいて、インターベースレイヤブロックのための2つの異なるインターレイヤ予測コーディング手法のどちらかの選択は、ビットストリームにおいて送信されたシンタクス情報に基づいて起こり得る。デコーダにおいて、種々の予測コーディング手法が、Nビットエンハンスメントレイヤ予測ビデオブロックと、エンコーダデバイスからデコーダデバイスに伝送されたNビットエンハンスメントレイヤ残差ビデオブロックとを加算することによりNビットエンハンスメントレイヤビデオブロックを復元するために使用される。
【0031】
以下に大いに詳しく概説されるように、この開示に従って使用されるシンタクス情報は第1のシンタクス情報及び第2のシンタクス情報を備える。第1のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされているかどうかを伝達するために使用され、ビデオブロック毎に1ビットを備える。この第1のシンタクス情報は、エンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるときにのみ本願において記述される種々のコーディングモードをコーディングすることが適用され得る限りにおいて、本願において記述される手法に基本的な不可欠なものとなり得る。
【0032】
第2のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤビデオブロックに基づいてコーディングされていることを第1のシンタクス情報が識別するとき、及び対応するベースレイヤビデオブロックがインターブロックであるときに、エンハンスメントレイヤビデオブロックが第1または第2のインターレイヤ予測コーディング手法を用いて予測コーディングされたかどうかを定めるために送信される1ビットを備え得る。代替的には、第2のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤビデオブロックに基づいてコーディングされていることを第1のシンタクス情報が識別するときに、インターベースレイヤブロックまたはイントラベースレイヤブロックに基づいてコーディングされた各ビデオブロックと共に送信される1ビットのシンタクスを備え得る。後者の場合は、イントラコーディングされたベースレイヤブロックについて追加のビットを付加するが、これは伸張を達成するためには不必要であろう。しかしながら、(インターベースレイヤブロックに基づいてコーディングされたブロックだけでなく)イントラベースレイヤブロックに基づいてコーディングされたブロックに関してこの追加のビットを送信することにより、ビデオデコーダはベース及びエンハンスメントレイヤの並列的なエントロピーコーディングを行うことが可能となり得るし、これはデコード処理を加速するために多くの場合に望ましい。
【0033】
図1は、ビデオエンコード及びデコードシステム10を説明するブロック図である。
図1に示されるように、システム10は、通信チャネル15を介してデスティネーション(destination)デバイス16へエンコードされたビデオデータを送信するソースデバイス12を含む。ソースデバイス12はビデオエンコード処理の一部としてこの開示の手法を実行し得る一方、デスティネーションデバイス16はビデオデコード処理の一部としてこの開示の手法を実行し得る。
【0034】
ソースデバイス12は、ビデオソース20、ビデオエンコーダ22及び変調器/送信器24を含み得る。デスティネーションデバイス16は受信器/復調器26、ビデオデコーダ28及び表示デバイス30を含み得る。システム10は、ビット深度ベースのスケーラブルビデオコーディング(SVC)方式を適用するように構成され得る。
【0035】
SVCは、ベースレイヤ及び1つまたは複数のスケーラブルエンハンスメントレイヤが使用されるビデオコーディングを参照する。SVCに関して、ベースレイヤは、典型的には、ベースレベル品質のビデオデータを搬送する。1つまたは複数のエンハンスメントレイヤは、より高度な空間、時間及び/または信号対雑音SNRレベルをサポートするための追加的なビデオデータを搬送する。SVCの一例は、ビット深度ベースのSVCである。ビット深度ベースのSVCにおいて、ベースレイヤは第1のビット深度に従うベースレベル品質でピクセル値を定め得るし、エンハンスメントレイヤはベース及びエンハンスメントレイヤが一緒に例えば第1のビット深度よりも大きい第2のビット深度に従うより高度な品質レベルでピクセル値を定めるような追加的なデータを付加し得る。ビット深度スケーラビリティは、特により高い解像度の表示ケイパビリティ(これは、大抵の従来のディスプレイよりも高度なビット深度に基づいたピクセル再生をサポートする)の出現によって、ますます望ましくなりつつある。
【0036】
この開示に従って、デバイス12及び16は、ベースレイヤイントラブロックに対応するエンハンスメントレイヤビデオブロックが第1のインターレイヤ予測コーディングに従う特定の方法でコーディングされる、エンハンスメントレイヤビデオブロックに関してのインターレイヤ予測コーディング手法を行う。また、ベースレイヤインターブロックに対応するエンハンスメントレイヤビデオブロックは、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法のどちらかに基づいてコーディングされる。本願において記述されるイントラベースレイヤブロック及びインターブロックに対応するエンハンスメントレイヤブロックのためのビデオコーディング手法の独特な(unique)組合せは、ビデオ圧縮及び/またはビデオ品質における改善を提供し得る。また、この独特な組合せは、特に、一度エンハンスメントレイヤブロックがベースレイヤブロックに基づいてコーディングされていると判定されると、適用される。
【0037】
図1の例において、通信チャネル15は、RF(radio frequency)スペクトルまたは1つまたは複数の物理伝送線などの任意の無線または有線通信媒体、または無線及び有線媒体の任意の組み合わせを備え得る。通信チャネル15は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどの、パケットベースネットワークの一部を形成し得る。通信チャネル15は、一般的には、ソースデバイス12からデスティネーションデバイス16へとビデオデータを伝送するための、任意の適した通信媒体、または異なる通信媒体の集積を表す。この開示の手法は、デバイス12及び16間のいずれのタイプの通信にも限定されないし、無線または有線ベースのセッティングに適用され得る。しかしながら、スケーラブル手法は、しばしば無線通信に関連する。
【0038】
ソースデバイス12は、デスティネーションデバイス16への送信のためにコーディングされたビデオデータを生成する。しかしながら、一部の場合において、デバイス12、16は、実質的に対称の方法で動作し得る。例えば、デバイス12、16の各々はビデオエンコード及びデコードコンポーネントを含み得る。従って、システム10は、例えば、ビデオストリーミング、ビデオ放送またはビデオ電話通信など、ビデオデバイス12、16間の一方向または双方向のビデオ伝送をサポートし得る。
【0039】
ソースデバイス12のビデオソース20は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含むビデオアーカイブ、またはビデオコンテンツプロバイダからのビデオフィードを含み得る。更なる選択肢として、ビデオソース20は、ソースビデオとしてコンピュータグラフィックベースデータ、またはライブビデオ及びコンピュータ生成されたビデオの組み合わせを生成し得る。一部の場合において、ビデオソース20がビデオカメラであるならば、ソースデバイス12及びデスティネーションデバイス16はいわゆるカメラフォンまたはビデオフォンを形成し得る。どちらの場合でも、キャプチャされ、プリキャプチャされ、またはコンピュータ生成されたビデオは、変調器/送信器22、通信チャネル15及び受信器/復調器26を介してのビデオソースデバイス12からデスティネーションデバイス16のビデオデコーダ28への伝送のためにビデオエンコーダ22によってエンコードされ得る。表示デバイス30は、ユーザにデコードされたビデオデータを表示し、ブラウン管、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプの表示デバイスなどの任意の種々の表示デバイスを備え得る。
【0040】
ビデオエンコーダ22及びビデオデコーダ28は、ビット深度ベーススケーラビリティのためのSVCをサポートするように構成され得る。特に、エンコーダ22及びデコーダ28は、ベースレイヤ及び1つまたは複数のスケーラブルエンハンスメントレイヤのエンコード、伝送及びデコードをサポートすることによって様々な程度のスケーラビリティをサポートし得る。更に、ビット深度ベースSVCに関して、ベースレイヤは第1のビット深度Mに従うベースレベル品質を備えるビデオデータを搬送する。1つまたは複数のエンハンスメントレイヤは、第2のビット深度N(NはMより大きい)に従うより高いレベルの品質をサポートするための追加的なデータを搬送する。一部の場合において、ベースレイヤはエンハンスメントレイヤの伝送よりも信頼度の高い方法で伝送され得る。例えば、変調信号のうち最も信頼度の高い部分がベースレイヤを伝送するために使用され得る一方、変調信号のうち信頼度の劣る部分がエンハンスメントレイヤを伝送するために使用され得る。他の場合において、ベース及びエンハンスメントレイヤ情報は任意の方法で伝送され得るし、受信デバイスはベースレイヤのみをデコードすること、または復元ピクセル値のビット深度増大による品質改善のためにベースレイヤ及びエンハンスメントレイヤをデコードすることを選択し得る。
【0041】
SVCをサポートするために、ビデオエンコーダ22は、ベースレイヤ及び1つまたは複数のエンハンスメントレイヤの夫々のエンコードを行うように設計されたスケーラブルビット深度ビデオコーダを備え得る。同様に、ビデオデコーダ28は、ベース及びエンハンスメントレイヤの両方に関してビデオブロックをデコードするスケーラブルビット深度デコーダを備え得る。ビデオデコーダ28は、ベース及びエンハンスメントレイヤの両方に関してビデオブロックをデコードし、ビデオシーケンスのフレームを復元するためにデコードされたビデオを結合させる。表示デバイス30は、デコードされたビデオシーケンスを受信し、ユーザにビデオシーケンスを提示する。
【0042】
ビデオエンコーダ22及びビデオデコーダ28は、MPEG−2、MPEG−4、ITU−T H.263、またはITU−T H.264/MPEG−4,Part 10,AVC(Advanced Video Coding)などのビデオ圧縮標準に従って動作し得る。
図1に示されていないが、一部の態様において、ビデオエンコーダ22及びビデオデコーダ28はオーディオエンコーダ及びデコーダと夫々統合され得るし、共通のデータストリームまたは別個のデータストリーム内のオーディオ及びビデオ両方のエンコードを扱うために、適切なMUX−DEMUXユニット、または他のハードウェア及びソフトウェアを含み得る。適用可能であるならば、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに従い得る。
【0043】
H.264/MPEG−4 Part 10 AVC標準は、JVT(Joint Video Team)として知られる集合的パートナシップの成果として、ISO/IEC MPEG(Moving Picture Experts Group)と一緒にITU−T VCEG(Video Coding Experts Group)によって公式化された。一部の態様において、この開示において記述される手法は、通常はH.264標準、またはその拡張に従うデバイスに適用され得る。H.264標準は、2005年3月付けの、ITU−T研究グループ(Study Group)による、“ITU-T Recommendation H.264, Advanced Video Coding for generic audiovisual services”に記述されており、これはH.264標準またはH.264仕様書、またはH.264/AVC標準または仕様書として本願において参照され得る。
【0044】
JVT(Joint Video Team)は、H.264/MPEG−4 AVCに対するSVC拡張の取り組みを継続している。発展中の(evolving)SVC拡張の仕様書は、しばしばJD(Joint Draft)の形式でリリースされる。JVTによって創造されたJSVM(Joint Scalable Video Model)はスケーラブルビデオで用いるツールを実装しており、これはこの開示において記述される種々のコーディングタスクのためにシステム10内で使用され得る。
【0045】
一部の態様において、ビデオ放送のために、この開示において記述される手法は、技術標準TIA−1099(“FLO仕様書”)として公表されている、フォワードリンクオンリー(FLO)エアインタフェース仕様書、“Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast”を用いて地上波(terrestrial)モバイルマルチメディアマルチキャスト(TM3)システムにおいてリアルタイムビデオサービスを配信するためにエンハンストH.264ビデオコーディングに適用され得る。即ち、通信チャネル15はFLO仕様書または同種のものに従って無線ビデオ情報を放送するために使用される無線情報チャネルを備え得る。FLO仕様書は、ビットストリームシンタクス及びセマンティクス及びFLOエアインタフェースに適したデコード処理を定める例を含む。代替的に、ビデオは、DVB−H(digital video broadcast-handheld)、ISDB−T(integrated services digital broadcast - terrestrial)、またはDMB(digital media broadcast)などの他の標準に従って放送され得る。従って、ソースデバイス12はモバイル無線端末、ビデオストリーミングサーバ、またはビデオ放送サーバであり得る。しかしながら、前述のように、この開示において記述される手法は、いずれの特定のタイプの放送、マルチキャストまたは2点間システムにも限定されない。放送の場合には、ソースデバイス12は多数のデスティネーションデバイスへいくつかのビデオデータのチャネルを放送し得るが、これらの各々は
図1のデスティネーションデバイス16と同様であり得る。
【0046】
ビデオエンコーダ22及びビデオデコーダ28は、夫々、1つまたは複数のマイクロプロセッサ、DSP(digital signal processor)、ASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組み合わせとして実装され得る。ビデオエンコーダ22及びビデオデコーダ28の各々は1つまたは複数のエンコーダまたはデコーダに含まれ得るが、これらのどちらかが個別のモバイルデバイス、加入者デバイス、放送デバイス、サーバまたは同種のものにおける結合されたエンコーダ/デコーダ(CODEC)の一部として統合され得る。また、ソースデバイス12及びデスティネーションデバイス16は、夫々、無線通信をサポートするのに十分なRF(radio frequency)ワイヤレスコンポーネント及びアンテナを含む、エンコードされたビデオの送信及び受信のための適切な変調、復調、周波数変換、フィルタリング及び増幅コンポーネントを、適用可能なように、含み得る。しかしながら、説明の容易性のために、係るコンポーネントは、
図1におけるソースデバイス12の変調器/送信器及びデスティネーションデバイス16の受信器/復調器であるとして要約されている。
【0047】
ビデオシーケンスは一連のビデオフレームを含み、これはスライスまたは他のコーディング単位に更に分割され得る。ビデオエンコーダ22は、ビデオデータをエンコードするために、個別のビデオフレーム内のビデオブロック(またはスライスまたは他のコーディング単位内のビデオブロック)の処理をする。ビデオブロックはルーマ及びクロマブロックを備え得るし、例えば任意のコーディング標準に従って定められるような固定または可変サイズを持ち得る。更に、一部の場合において、各ビデオフレームは、一連のスライスを含み得る。更に、各スライスは一連のマクロブロックを含み得るし、これはサブブロックに整理(arrange)され得る。例として、ITU−T H.264標準は、ルーマコンポーネントについて16×16、8×8、または4×4ブロックサイズなどの種々のブロックサイズでのイントラ予測と、クロマコンポーネントについて8×8ブロックサイズでのイントラ予測と、同様に、ルーマコンポーネントについて16×16、16×8、8×16、8×8、8×4、4×8、及び4×4ブロックサイズ及びクロマコンポーネントについて対応するブロックサイズなどの種々のブロックサイズでのインター予測とをサポートする。ビデオシーケンスがYUV4:2:0フォーマットであるならば、クロマコンポーネントについての対応するインター予測ブロックサイズは、水平及び垂直方向の各々で2という因数によってダウンサンプルされた対応するルーマブロックサイズである。ビデオブロックは、ピクセルデータのブロック、または例えば離散コサイン変換(DCT)などの変換処理の後の変換係数のブロックを備え得る。
【0048】
より小さなビデオブロックはより優れた解像度を提供可能であり、より高レベルな細部を含むビデオフレームの位置について使用され得る。一般的には、マクロブロック(MB)及び種々のサブブロックが、ビデオブロックであるとみなされ得る。また、スライスは、一連の、MB及び/またはサブブロックなどのビデオブロックであるとみなされ得る。各スライスは、ビデオフレームに属する独立してデコード可能な単位であり得る。予測の後に、変換が8×8残差ブロックまたは4×4残差ブロックに実行され得るが、イントラ16×16予測モードが使用されるならば追加的な変換がクロマコンポーネントまたはルーマコンポーネントについて4×4ブロックのDC係数に適用され得る。更に、変換の後に、データは、ビデオブロック、即ち、変換係数のブロックとして依然参照され得る。イントラまたはインターベース予測コーディング及び変換手法(H.264/AVCにおいて使用される4×4または8×8DCTのような整数変換、またはDCTの別の形式)及び量子化手法(スカラー量子化など)の後に、ランレングスコーディングが行われ得る。
【0049】
この開示の手法によれば、エンハンスメントレイヤビデオブロックは、イントラベースレイヤブロックに対応するビデオブロックに第1のインターレイヤ予測コーディング手法を適用し、インターベースレイヤブロックに対応するビデオブロックについて第1のインターレイヤコーディング手法と第2のインターレイヤ予測コーディング手法との間でどちらかを選択する方法論に従って予測コーディングされる。これらの異なる予測パスは、特に、一度エンハンスメントレイヤビデオブロックがベースレイヤブロックに基づいてコーディングされていると判定されると、適用される。特に、エンコーダにおいて、第1のインターレイヤ予測コーディング手法は、対応する復元Mビットベースレイヤブロックに基づくNビット予測ブロックの生成を含む。第2のインターレイヤ予測コーディング手法は、本質的には、ベースレイヤブロックの動き情報を取り入れ、Mビットドメインに対応するベースレイヤブロックの動き情報を用いてNビットドメインのビデオブロックに基づいて予測エンハンスメントレイヤブロックを生成する。Nビットはエンハンスメントレイヤデータのビット深度でありMビットはベースレイヤデータのビット深度であるよう、Nの値はMよりも大きい。デコーダにおいて、同様の予測コーディング手法がエンコーダからデコーダに伝達されるNビット残差エンハンスメントレイヤビデオブロックに基づいて原(original)ビデオブロックを復元するために使用され、シンタクス情報はデコーダがどの予測コーディング手法を種々のビデオブロックについて使用するかを識別するのに役立ち得る。
【0050】
図2は、この開示に調和した例示的なスケーラブルビデオエンコーダ200の別の描写を説明するブロック図である。スケーラブルビデオエンコーダ200は、
図1のスケーラブルビット深度ビデオエンコーダ22に対応し得る。スケーラブルビデオエンコーダ200は、ベースレイヤエンコーダ180及びエンハンスメントレイヤエンコーダ150を備える。別々に説明されているが、一部の実装において、ベースレイヤエンコーダ180及びエンハンスメントレイヤエンコーダ150の種々のユニットは共有または結合され得る。ベースレイヤエンコーダ180はベースレイヤビデオブロックをエンコードする一方、エンハンスメントレイヤエンコーダ150はエンハンスメントレイヤビデオブロックをエンコードする。エンコード側では、この開示の手法は、通常、エンハンスメントレイヤエンコーダ150によるエンハンスメントレイヤビデオブロックのエンコードに関する。
【0051】
エンハンスメントレイヤエンコーダ150は、残差ビデオブロックを生成するために入力(incoming)Nビットエンハンスメントレイヤビデオブロックから予測ビデオブロックを減算する加算器114を備え得る。スイッチ118は、以下に大いに詳細に概説されるように、エンコーダ150内の予測パスを定める。エンハンスメントレイヤエンコーダ150は、残差ビデオブロックを変換及び量子化するための変換ユニット102及び量子化ユニットを含む。また、エンハンスメントレイヤエンコーダ150はユニット108を含み得るが、これは逆量子化ユニット及び逆変換ユニットの両方を表す。エントロピーコーディングユニット106は、動きベクトル、イントラ予測シンタクス、または使用される予測手法を識別するための本願において定められる情報などの任意のシンタクス情報と一緒に残差ブロックをエントロピーコーディングする。加算器116は、ユニット108からの残差ブロック及び係る残差ブロックをコーディングするために使用された予測ブロックに基づいてビデオブロックを復元する。デブロックフィルタユニット112は復元データをフィルタリングすることができ、それからこれは本願において記述されるようなイントラまたはインター予測における予測ユニット110による使用のためのフレームバッファ111に転送される。
【0052】
ベースレイヤエンコーダ180は、ベースレイヤビデオブロックのイントラまたはインター予測における使用のための予測ユニット120を含む、種々のユニットを備え得る。加算器126は、残差ビデオブロックを生成するために、入力(incoming)Mビットベースレイヤビデオブロックから予測ビデオブロックを減算する。変換ユニット128はDCTなどの変換を行い、量子化ユニット130は量子化を行う。ユニット134は、逆量子化ユニット及び逆変換ユニットの両方を表す。エントロピーコーディングユニット132は、ベースレイヤビデオブロックについての動きベクトルまたはイントラ予測シンタクスなどの任意のシンタクス情報と一緒に残差ブロックをエントロピーコーディングする。加算器124は、ユニット134からの復元残差ブロック及び係る残差ブロックをコーディングするために使用された予測ブロックに基づいてビデオブロックを復元する。デブロックフィルタユニット122は復元データをフィルタリングすることができ、それからこれはベースレイヤデータの後続のイントラまたはインター予測における予測ユニット120による使用のためのフレームバッファ121に転送される。
【0053】
スケーラブルビデオエンコーダ200は、エンハンスメントレイヤエンコーダ150からのNビットサンプルをベースレイヤエンコーダ180のためのMビットサンプルにダウンサンプルするトーンマッピングユニット114も備える。また、スケーラブルビデオエンコーダ200は、ベースレイヤエンコーダ180からのMビットサンプルをエンハンスメントレイヤエンコーダ150のためのNビットサンプルにアップサンプルする逆トーンマッピングユニットを備える。多重化ユニット118は、コーディングされたデジタルビデオのスケーリングされた出力ストリームを生成するために、エンハンスメントレイヤエンコーダ150からのNビット出力サンプルの復元のための情報を搬送するエンハンスメントレイヤビットストリームをベースレイヤエンコーダ180からのMビット出力サンプルの復元のための情報を搬送するベースレイヤビットストリームと結合する。
【0054】
エンハンスメントレイヤエンコーダ150は、エンハンスメントレイヤビデオブロックをコーディングするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数の予測手法を行い得る。この開示によれば、ビット深度スケーラブルビデオエンコードは、エンハンスメントレイヤエンコーダ150及びベースレイヤエンコーダ180によって適用される。ベースレイヤエンコーダ180はベースレイヤを生成する一方、エンハンスメントレイヤエンコーダ150はエンハンスメントレイヤを生成する。ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットのビット深度までのビットデータのエンハンスメントを定める。
【0055】
この開示の技術は、特に、一度予測ユニット110がエンハンスメントレイヤビデオブロックはベースレイヤデータに基づいてコーディングされるべきであると判定すると、エンハンスメントレイヤエンコーダ150によって行われるエンハンスメントレイヤエンコードに関して適用される。しかしながら、より一般的には、予測ユニット110は、以前に復元されたエンハンスメントレイヤデータに基づくエンハンスメントレイヤ予測を含む、多種多様の他のタイプの予測手法もサポートし得る。予測ユニット110は、例えば、全くのエンハンスメントレイヤ内でのイントラベースの空間的予測及びインターベースの時間的予測をサポートし得る。この開示の手法は、より具体的には、ベースレイヤデータがエンハンスメントレイヤデータの予測において使用されるインターレイヤ予測を予測ユニット110がサポートするときに適用される。
【0056】
一度予測ユニット110が一部のタイプのインターレイヤ予測が使用されるであろうことを判定すると、この開示の手法が使用され得る。特に、スイッチ118を制御することにより、エンコーダ150は、イントラコーディングされたベースレイヤブロックに対応する任意のエンハンスメントレイヤビデオブロックに第1のインターレイヤ予測コーディング手法を適用する。第1のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット116によって加算器114に供給され得る。
【0057】
インターコーディングされたベースレイヤブロックに対応する任意のエンハンスメントレイヤビデオブロックに関して、スイッチ118は2つの異なる予測パスの間でどちらかを選択する。スイッチ118は、予測パス(例えば、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されるかどうか)を制御する制御ロジック(またはソフトウェアルーチン)を備え得る。Nビットエンハンスメントレイヤビデオブロックがインターブロックに対応するならば、スイッチ118は加算器に2つの異なる予測パスの間でどちらかを選択させる。第1のパスは第1のインターレイヤ予測コーディング手法に対応し、第2のパスは第2のインターレイヤ予測コーディング手法に対応する。上述のように、第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として、残差ビデオブロックを生成することを含む。
【0058】
エンハンスメントレイヤエンコーダ150は、それから、デコーダがエンコードされたデータをどのようにデコードするかを判定できるように、デコーダによって使用される情報をエンコードし得る。特に、エンハンスメントレイヤエンコーダ150は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される、エンコードされたエンハンスメントレイヤビットストリーム内の情報をエンコードする。
【0059】
係るシンタクスはインターレイヤ予測が使用されているかどうかを示す第1のシンタクス情報を含み得るが、これはビデオブロック毎に1ビットを備え得る。また、シンタクスはデコーダによって使用される第2のシンタクス情報を含むことができ、これはインターレイヤ予測が使用されるビデオブロックに毎に別の情報ビットを備え得るが、これは第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
【0060】
代替的には、前述のように、イントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ、デコーダはイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックが第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので(インターレイヤ予測が第1のシンタクス情報によって示される通りにサポートされることを仮定する)、デコーダによって使用される第2のシンタクス情報はインターベースレイヤブロックに対応するビデオブロック毎に1つの情報ビットを備え得る。この場合に、第2のシンタクス情報の1ビットと、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤビデオブロックまたはインターベースレイヤビデオブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。即ち、第2のシンタクス情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされたビデオブロック毎に1ビットを備え得る。
【0061】
また一方では、この第2のシンタクス情報のためにビデオブロック毎に1ビットを含めること、または代替的に、インターレイヤ予測が使用され、かつ、インターコーディングされたベースレイヤビデオブロックに対応するビデオブロック毎にのみ1ビットを含めることの実装決定は、デコードがエンハンスメントレイヤ及びベースレイヤビットストリームの別々のエントロピーデコード及び構文解析(parsing)をサポートするかどうかに依存し得る。例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤビットストリームの別々のエントロピーデコード及び構文解析が望まれているならば、対応するインターベースレイヤブロックに基づいてコーディングされるブロックについてのみビデオブロック毎に単に1ビットが第2のシンタクスのために使用されるよりも、ビデオブロック(例えば、対応するイントラベースレイヤブロックまたは対応するインターベースレイヤブロックに基づいてコーディングされる)毎に1ビットが第2のシンタクスのために使用されるべきである。さもなければ、デコーダは、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、デコードされたベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
【0062】
ビデオブロックのために使用される予測コーディング手法を識別するためにデコーダによって使用される任意の予測シンタクス及び任意の追加ビットと同様に、エンコードされたエンハンスメントレイヤビデオブロックは、ユニット106によってエントロピーコーディングされる。多重化ユニット118は、出力ビットストリームを作るために、ベースレイヤビットストリームをエンハンスメントレイヤビットストリームと結合する。出力ビットストリームは、保存され、及び/または、変調されて別のデバイスに送信され得る。
【0063】
一部の態様において、この開示の手法は、この手法が予測パスの独特かつ有用な組合せを提供する限りにおいて従来の手法とは異なる。エンハンスメントレイヤ予測は、対応するベースレイヤデータに関連する予測データ(例えば、動きベクトル)に基づいて可能となる。他方では、エンハンスメントレイヤ予測は対応するベースレイヤデータのアップサンプルされたバージョンに基づいても可能となり、このタイプの予測はインターコーディングされたベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックまたはイントラコーディングされたベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックのどちらにも許容される。更に、これらの手法は、一部のタイプのベースレイヤデータがエンハンスメントレイヤデータの予測に使用されることになる場合に一部の形式のインターレイヤ予測が選択されるという条件で適用される。
【0064】
図3は、
図1のスケーラブルビット深度ビデオエンコーダ22に対応し得る例示的なスケーラブルビデオエンコーダ35を説明するブロック図である。スケーラブルビデオエンコーダ35は、ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40を備える。別個に説明されているが、一部の実装において、ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40の種々の要素が共有または結合され得る。ベースレイヤエンコーダ60はベースレイヤブロックをエンコードする一方、エンハンスメントレイヤエンコーダ40はエンハンスメントレイヤビデオブロックをエンコードする。エンコード側では、この開示の技術は、一般的には、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるべきであると判定するときのエンハンスメントレイヤエンコーダ40によるエンハンスメントレイヤビデオブロックのエンコードに関する。
【0065】
エンハンスメントレイヤエンコーダ40は、制御ユニット42によって制御される種々のエンコードユニット44を備え得る。同様に、ベースレイヤエンコーダ60は、制御ユニット62によって制御される種々のエンコードユニット64を備え得る。スケーラブルビデオエンコーダ35は、エンハンスメントレイヤエンコーダ40からのNビットサンプルをベースレイヤエンコーダ60のためのMビットサンプルにダウンサンプルするトーンマッピングユニット54も備える。また、スケーラブルビデオエンコーダ35は、ベースレイヤエンコーダ60からのMビットサンプルをエンハンスメントレイヤエンコーダ40のためのNビットサンプルにアップサンプルする逆トーンマッピングユニット55を備える。多重化ユニット58は、コーディングされたデジタルビデオデータのスケーリングされた出力ストリームを生成するために、エンハンスメントレイヤエンコーダ40からのNビット出力サンプルの復元のための情報を搬送するエンハンスメントレイヤビットストリームを、ベースレイヤエンコーダ60からのMビット出力サンプルの復元のための情報を搬送するベースレイヤビットストリームと結合する。多重化ユニット58は、MPEG−2ファイルフォーマットに従って係るデータを結合し得る。
【0066】
ベースレイヤエンコードに関して、ベースレイヤエンコーダ60はイントラユニット66、インターユニット68及びエントロピーコーディングユニット69を含む。量子化ユニット及びDCTユニットなどの種々の他のユニットが予測ビデオコーディングにおいて一般に使用されるが、説明の単純性及び容易性のために
図3において説明されていない。イントラユニット66はイントラビデオブロックのイントラベースエンコードを行う一方、インターユニット68はインタービデオブロックのインターベースエンコードを行う。エントロピーコーディングユニット69は、エントロピーコーディング方法論に従ってエンコードされたデータ及びシンタクス情報を更に圧縮する。
【0067】
ベースレイヤブロックのイントラベースエンコードに関して、イントラユニット66は、コーディングされているビデオブロックと同じコーディング単位(例えば、同じフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測データは残差を生成するためにコーディングされているビデオブロックから減算され、それからこれは変換されて量子化され得る。残差データ及び予測シンタクス(例えば、適用されたイントラ予測のモードまたは方法を識別する)は、エントロピーコーディングのためにエントロピーコーディングユニット69に供給され得る。
【0068】
ベースレイヤビデオブロックのイントラベースエンコードに関して、インターユニット68は異なるコーディング単位(例えば、ビデオシーケンスの先行のまたは後続のフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測データは残差を生成するためにコーディングされているビデオブロックから減算され、それからこれは変換されて量子化され得る。残差データ及び予測シンタクス(例えば、先行のまたは後続するコーディング単位から予測ブロックを識別する1つまたは複数の動きベクトル)は、エントロピーコーディングのためにエントロピーコーディングユニット69に供給され得る。
【0069】
エンハンスメントレイヤエンコーダ40は、ベースレイヤエンコーダ60とはわずかに異なる方法で予測ベースエンコードを行い得る。具体的には、エンハンスメントレイヤエンコーダ40は、エンハンスメントレイヤビデオブロックをコーディングするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数のインターレイヤ予測手法を行い得る。更に、エンハンスメントレイヤエンコーダ40は他のタイプの予測(例えば、エンハンスメントレイヤデータのみに基づく1つまたは複数の他の手法)もサポートし得るが、この開示の手法はベースレイヤデータに依存する予測手法に適用される。
【0070】
この開示によれば、ビット深度スケーラブルビデオエンコードは、エンハンスメントレイヤエンコーダ40及びベースレイヤエンコーダ60によって適用される。ベースレイヤエンコーダ60はベースレイヤビットストリームを生成する一方、エンハンスメントレイヤエンコーダ40はエンハンスメントレイヤビットストリームを生成する。ベースレイヤビットストリームはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤビットストリームはMより大きいNビットのビット深度のためにビデオデータのエンハンスメントを定める。
【0071】
この開示の手法は、特に、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるべきであるとエンハンスメントレイヤエンコーダ40が判定するときにエンハンスメントレイヤエンコーダ40によって行われるエンハンスメントレイヤエンコードに関して適用される。エンハンスメントレイヤエンコーダ40は、第1の予測ユニット46、第2の予測ユニット48、及びエントロピーコーディングユニット52を含む、種々のエンコードユニット44を含む。これら種々のエンコードユニット44は、本願において記述される異なるタイプのコーディングを実行するために、統合され、及び/または、共有のロジックまたはルーチンを持ち得る。更に、ベースレイヤエンコーダ60と同様に、エンハンスメントレイヤエンコーダ40は、例えば残差ビデオブロックをDCT係数に変換するため及びDCT係数を量子化するための、量子化ユニット及び変換ユニット(図示されない)を更に含み得る。更に、これらコンポーネントは、説明の単純性及び容易性のために
図3において示されていないが、第1及び第2の予測ユニット46及び48の一部であるとみなすこともできる。エンハンスメントレイヤエンコーダ60がNビットドメインにおけるイントラ及びインター予測もサポートし得ることも注意されるべきである。エンハンスメントレイヤエンコーダ60のこれらイントラ及びインターユニットは、説明の単純性及び容易性のために示されていない。
【0072】
第1の予測ユニット46は、イントラコーディングされたベースレイヤビデオブロックに対応するエンハンスメントレイヤビデオブロックのエンコードのために使用され得る。第1の予測ユニット46は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法を適用する。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット56によって第1の予測ユニット46に供給され得る。
【0073】
第2の予測ユニット48は第2のタイプの予測コーディング手法を適用し、これはNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。この場合には、対応するベースレイヤビデオブロックのアップサンプルされたバージョンを使用するよりも、第2の予測ユニット48 50はエンハンスメントレイヤデータに関して動き補償を行うために対応するベースレイヤビデオブロックの予測シンタクス(例えば、動きベクトルを)を単に使用する。第2の予測ユニット48は、以前に復元されたエンハンスメントレイヤデータ(例えば、以前にエンコードされたフレームまたはスライスのデコードされたバージョン)を保存するメモリを備え得る。対応するベースレイヤビデオブロックに関連する動きベクトル(例えば、「ベースレイヤの動き情報」)を用いて、第2の予測ユニット48は、Nビットドメインでの予測ブロックを生成するために、この保存されたエンハンスメントレイヤデータに関して動き補償を行うことができる。
【0074】
斯くして、この開示によれば、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビットエンハンスレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、制御ユニット42の指示で、第1の予測ユニット46は第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをコーディングし、ここで第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、制御ユニット42は第1のインターレイヤ予測コーディング手法(これは第1の予測ユニット46によって適用され得る)と第2のインターレイヤ予測コーディング手法(これは第2の予測ユニット48によって適用され得る)との間でどちらかを選択する。前述のように、第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。
【0075】
制御ユニット42は、それから、デコーダがエンコードされたデータをどのようにデコードするかを判定できるよう、デコーダによって使用される情報をエンコードする。特に、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックをエンコードするために第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを判定するためにデコーダによって使用される、エンコードされたビットストリーム内の情報をエンコードする。一例において、このデコーダによって使用される「第2の」シンタクス情報はインターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備え得るが、ここでこの1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
【0076】
代替的には、イントラベースレイヤブロックに基づいてコーディングされたエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ、デコーダはイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックが第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので、デコーダによって使用される「第2の」シンタクス情報はインターベースレイヤビデオブロックに基づいてコーディングされたビデオブロック毎に1ビットの情報を備え得る。この場合には、1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。更に、「第2の」シンタクス情報は、ビデオブロック毎に1ビットある「第1の」シンタクス情報が任意の形式のインターレイヤ予測が選択されたかどうかを識別する場合に限ってコーディングされる。
【0077】
この「第2の」シンタクス情報に関して、ビデオブロック毎に1ビットを含めること、または代替的に、インターベースレイヤビデオブロックに対応するビデオブロック毎にのみ1ビットを含めることの決定は、デコーダがエンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析をサポートするかどうかに依存し得る。例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析が望まれているのならば、インターブロック毎に単に1ビットが使用されるよりもビデオブロック毎に1ビットが使用されるべきである。さもなければ、デコーダは、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、対応するベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
【0078】
ビデオブロックのために使用された予測コーディング手法を識別するためにデコーダによって使用される任意の予測シンタクス及び任意の追加ビットと同様に、エンコードされたエンハンスメントレイヤビデオブロックは、ユニット52によってエントロピーコーディングされ得る。多重化ユニット58は、それから、出力ビットストリームを作り出すために、ベースレイヤをエンハンスメントレイヤと結合し得る。出力ビットストリームは、ベースレイヤ、エンハンスメントレイヤ、及び関連するシンタクスを含む。出力ビットストリームは保存され、及び/または、変調されて別のデバイスに送信され得る。
【0079】
図4は、
図1のスケーラブルビット深度ビデオデコーダ28に対応し得る例示的なスケーラブルビデオデコーダ100を説明するブロック図である。スケーラブルビデオデコーダ100は、ベースレイヤデコーダ90及びエンハンスメントレイヤデコーダ70を備える。別個に説明されているが、一部の実装において、ベースレイヤデコーダ90及びエンハンスメントレイヤデコーダ90の種々のユニットが共有または結合され得る。更に、スケーラブルビデオデコーダ100は、結合されたコーデック(エンコーダ−デコーダ)を形成するために、スケーラブルビデオエンコーダ35(
図2)と一体化され得る。この場合において、スケーラブルビデオデコーダ100の種々のコンポーネントは、スケーラブルビデオエンコーダ35のそれらと重複し得る。
【0080】
基本的に、スケーラブルビデオデコーダ100のデコード機能性は、スケーラブルビデオエンコーダ35に関して前述のエンコード機能性の相補的(reciprocal)な動作とみなされ得る。ベースレイヤデコーダ90はベースレイヤビデオブロックをデコードする一方、エンハンスメントレイヤデコーダ70はエンハンスメントレイヤビデオブロックをデコードする。逆多重化ユニット86は、SVCビットストリームを受信し、エンハンスメントレイヤデータからベースレイヤデータを分離する。受信ベースレイヤデータはベースレイヤデコーダ90に送られ、エンハンスメントレイヤデータはエンハンスメントレイヤデコーダ70に送られる。デコード側では、この開示の手法は、一般的には、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされたと判定するときのエンハンスメントレイヤデコーダ70によるエンハンスメントレイヤビデオブロックのデコードに関する。ビデオブロック毎に1ビットを備える、ビットストリームにおける第1のシンタクス情報は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされたかどうかを示し得る(例えば、そのビデオブロックについてインターレイヤ予測が有効(enable)であるかどうかを示すことによって)。
【0081】
説明されたように、エンハンスメントレイヤデコーダ70は、制御ユニット72によって制御される種々のデコードユニット74を備え得る。同様に、ベースレイヤデコーダ90は、制御ユニット92によって制御される種々のデコードユニット94を備え得る。スケーラブルビデオデコーダ100は、ベースレイヤデコーダ90からのMビットサンプルをエンハンスメントレイヤデコーダ70のためのNビットサンプルにアップサンプルする逆トーンマッピングユニット84も備える。逆多重化ユニット58は、受信ビットストリームをベースレイヤ及びエンハンスメントレイヤに分離し得る。別個のエントロピーコーディングユニット82及び99がエンハンスメントレイヤデコーダ70及びベースレイヤデコーダ90に夫々含まれ得るが、結合されたエントロピーデコードユニットが一部の実施形態のために代替的に使用され得る。
【0082】
ベース及びエンハンスメントレイヤのための別々のエントロピーコーディングユニット82及び99の実装は、デコード処理を加速し得る。この場合には、コーディングされたビットストリームは、対応するベースレイヤビデオブロックがイントラまたはインターコーディングされているかどうかに関わらず、第1または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別するためのビデオブロック毎の1ビットを含むことが望ましい。もし1ビットがインターベースレイヤブロックに対応するブロックのためにだけ送信されるならば、エンハンスメントレイヤデコーダ70のエントロピーコーディングユニット32は、エンハンスメントレイヤデコーダ70がベースレイヤブロックタイプを識別できるよう、ベースレイヤデコーダ90のエントロピーコーディングユニット99がベースレイヤビットストリームを構文解析するのを待つ必要があるだろう。遅延を回避するために、この場合には、常に第1のインターレイヤ予測コーディング手法に従ってコーディングされ得る、ベースレイヤイントラブロックに対応するエンハンスメントレイヤブロックについてさえも、第1または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別するためにビデオブロック毎に1ビットを含めることが望ましいだろう。更に、この1ビットのシンタクス情報は、インターレイヤ予測が有効(enable)であったことを(既にデコードされた)第1の1ビットシンタクス情報が識別する場合に限りデコードされる。
【0083】
ベースレイヤデコードのために、ベースレイヤデコーダ90は、イントラユニット96、インターユニット98及びエントロピーコーディングユニット99を含む。逆量子化ユニット及び逆変換ユニットなどの種々の他のユニットも、予測ビデオデコードにおいて一般的に使用されるが、説明の単純性及び容易性のために
図4において説明されていない。イントラユニット96はイントラビデオブロックのイントラベースデコードを行う一方、インタービデオブロックのインターベースデコードを行う。エントロピーデコードユニット99は、エントロピーデコード方法論に従って、コーディングされたデータ及びシンタクス情報を伸張するために、受信ベースレイヤビットストリームを構文解析する。
【0084】
ベースレイヤビデオブロックのイントラベースデコードのために、イントラユニット96は、例えば説明の単純性及び容易性のために
図4に示されていない逆量子化及び逆変換の後に、残差ビデオブロックを受信し得る。イントラユニット96は、デコードされている残差ビデオブロックと同じコーディング単位(例えば、同じフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測シンタクス(予測データを生成するために使用されたイントラモードなど)は受信ビットストリームの一部を形成し得るが、この予測シンタクスが予測データを生成するために使用され得る。この予測データは残差ビデオブロックに加算され、これが復元ビデオブロックを形成する。
【0085】
ベースレイヤビデオブロックのインターベースデコードのために、インターユニット98は、例えば逆量子化及び逆変換の後に、残差ビデオブロックを受信し得る。この場合には、インターユニット98は異なるコーディング単位(例えば、先行または後続のビデオシーケンスのフレームまたはスライス)内のデータに基づいて予測データを生成する。予測シンタクス(この場合には、例えば、予測データを生成するために使用された1つまたは複数の動きベクトル)は受信ビットストリームの一部を形成し得るが、この予測シンタクスが予測データを生成するために使用され得る。予測データは残差ビデオブロックに加算され、これが復元ビデオブロックを形成する。
【0086】
エンハンスメントレイヤデコーダ70は、ベースレイヤデコーダ90とわずかに異なる方法で予測ベースデコードを行い得る。特に、エンハンスメントレイヤデコーダ70は、エンハンスメントレイヤビデオブロックをデコードするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数のインターレイヤ予測手法を行い得る。
【0087】
この開示の手法は、特に、一度エンハンスメントレイヤデコーダ70が所与のエンハンスメントレイヤビデオブロックが一部のタイプのインターレイヤ予測を用いてベースレイヤデータに基づいてコーディングされたことを判定するとエンハンスメントレイヤデコーダ70によって行われるエンハンスメントレイヤデコードに関して適用される。エンハンスメントレイヤデコーダ70は、この最初の判定をなすために、シンタクス情報の第1のビットを検査し得る。
【0088】
エンハンスメントレイヤデコーダ70は、第1の予測ユニット76、第2の予測ユニット78、及びエントロピーコーディングユニット82を含む、種々のデコードユニット74を含む。エンコーダと同様に、これらの種々のエンハンスメントレイヤデコーダ70のデコードユニット74は統合され、及び/または、本願において記述される異なるタイプのコーディングを実行するために共有のロジックまたはルーチンを持ち得る。更に、ベースレイヤデコーダ90と同様に、エンハンスメントレイヤデコーダ70は、例えば変換係数を逆量子化するために、及び逆量子化された係数をピクセルドメインでの残差ビデオブロックに変換するために、逆量子化ユニット及び逆変換ユニット(図示されない)を更に含み得る。
図3と同様に、これらのコンポーネントは、説明の単純性及び容易性のために
図4に示されていないが、第1及び第2の予測コーディングユニット76及び78の一部であるとみなされ得る。更に、エンハンスメントレイヤデコーダ70がNビットドメインでのイントラ及びインター予測もサポートし得ることに注意されたい。エンハンスメントレイヤデコーダ70のこれらのイントラ及びインターユニットは、説明の単純性及び容易性のために示されていない。
【0089】
第1の予測ユニット76は、イントラコーディングされたベースレイヤビデオブロックに対応するエンハンスメントレイヤビデオブロックのデコードのために使用され得る。第1の予測ユニット76は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法を適用する。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット84によって第1の予測ユニット76に供給され得る。
【0090】
第2の予測ユニット78は第2のタイプの予測コーディング手法を適用し、これはNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。この場合には、対応するベースレイヤビデオブロックのアップサンプルされたバージョンを使用するよりもむしろ、第2の予測ユニット78はエンハンスメントレイヤデータに関して動き補償を行うために対応するベースレイヤビデオブロックの動き情報(例えば、
図4に示される「ベースレイヤの動き情報」)などの予測シンタクスを単純に使用し、これはエンハンスメントレイヤデコーダ70に関連するメモリ(図示されない)に保存された復元エンハンスメントレイヤビデオフレームまたはスライスであり得る。
【0091】
この開示によれば、制御ユニット72は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかを判定する。Nビット残差エンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックに対応するならば、制御ユニット72の指示で、第1の予測ユニット76は第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードし、ここで第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。
【0092】
Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、制御ユニット72は第1のインターレイヤ予測コーディング手法(これは第1の予測ユニット76によって適用され得る)と第2のインターレイヤ予測コーディング手法(これは第2の予測ユニット78によって適用され得る)との間でどちらかを選択する。前述のように、第2のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
【0093】
制御ユニット72は、デコーダがエンコードされたデータをどのようにデコードするかを判定するのに役立ち得る情報もデコードする。特に、制御ユニット72は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するために、エンコードされたビットストリーム内の情報をデコードする。一例において、エンハンスメントレイヤデコーダ70によって使用されるこの情報は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを示すために、インターレイヤコーディングされたビデオブロック毎に1ビットの「第2の」シンタクス情報を備える。「第1の」シンタクス情報は、対照的に、エンハンスメントレイヤビデオブロックの予測がベースレイヤの情報を使用したかどうかを指定する。そのようなものとして、「第2の」シンタクス情報は、エンハンスメントレイヤビデオブロックの予測がベースレイヤの情報を使用したことを第1のシンタクス情報が識別するときに限って受信される。
【0094】
或いは、イントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ得るし、エンハンスメントレイヤデコーダ70はイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので、エンハンスメントレイヤデコーダ70によって使用される情報はインターベースレイヤブロックに対応するビデオブロック毎に1ビットの「第2の」シンタクス情報を備え得る。この場合には、1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
【0095】
「第2の」シンタクス情報についてインターレイヤコーディングされたビデオブロック毎に1ビットを含めるか、または代替的に、特にインターベースレイヤブロックに対応するビデオブロック毎にのみ1ビットを含めるかどうかの実装決定は、スケーラブルビット深度エンコーダ100がエンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析をサポートするかどうかに依存し得る。もし、
図4に説明されるように、例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析が実装されているならば、インターベースレイヤビデオブロックに対応するビデオブロック毎に単純に1ビットが使用されるよりもむしろビデオブロック毎に1ビットが使用されるべきである。さもなければ、エンハンスメントレイヤデコーダ70は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、デコードされたベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
【0096】
図5は、この開示に調和した例示的なエンコード手法を説明するフロー図である。
図5は、
図3のスケーラブルビデオエンコーダ35の観点から記述されることになる。
図5に示されるように、スケーラブルビデオエンコーダ35はベースレイヤ及びエンハンスメントレイヤ及びエンハンスメントレイヤビデオブロックを生成し、スケーラブルビデオエンコーダ35はエンハンスメントレイヤビデオブロックがベースレイヤデータに基づいてコーディングされるべきであると判定する(501)。例えば、スケーラブルビデオエンコーダ35はNビットサンプルを受信し、エンハンスメントレイヤを定めるためにエンハンスメントレイヤエンコーダ40にNビットサンプルを供給し、ベースレイヤを定めるためにNビットサンプルをMビットサンプルにダウンサンプルし得る。ベースレイヤ及びエンハンスメントレイヤは、夫々ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40によって別々にコーディングされ得る。エンハンスメントレイヤエンコーダ40がエンハンスメントレイヤビデオブロックはベースレイヤデータに基づいてコーディングされるべきであると判定すると、
図5の手法が適用され得る。
【0097】
この場合に、エンハンスメントレイヤエンコードに関して、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する(502)。エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば(「イントラ」 502)、第1の予測ユニット46は第1のインターレイヤ予測手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードする(503)。第1のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。他方では、エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば(「インター」 502)、制御ユニット42は第1のインターレイヤ予測コーディング手法と第2のインターレイヤ予測コーディング手法との間でどちらかを選択する(504)。1つまたは複数のユニット44は、選択された予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードする(505)。特に、選択次第で、第1の予測ユニット46が第1のインターレイヤ予測コーディング手法を行い、または、第2の予測ユニット48が第2のインターレイヤ予測コーディング手法を行い得る。
【0098】
制御ユニット42は、レート−歪アルゴリズムを適用することにより、第1及び第2のインターレイヤ予測コーディング手法のどちらかの選択を行い得る(504)。特に、制御ユニット42は、第1のインターレイヤ予測コーディング手法に従ってコーディングされたビデオブロックと、第2のインターレイヤ予測コーディング手法に従ってコーディングされたビデオブロックとの間のビデオ品質差を考慮し得る。また、制御ユニット42は、ビデオブロックが第1のインターレイヤ予測コーディング手法を用いて、または、第2のインターレイヤ予測コーディング手法を用いてコーディングされた場合に達成される圧縮レベルを考慮し得る。一部の場合において、エンハンスメントレイヤエンコーダ40は両方のインターレイヤ予測コーディング手法を用いてビデオブロックを実際にエンコードし、それから品質及び圧縮レベルに基づいて選択をなし得る(504)。シナリオ次第で、できる限りの最高の品質(即ち、最小の歪)を達成することがより望まれ得るし、または、例えばデータ通信の最高のレートを容易にするために最高の圧縮を達成することがより望まれ得る。一部の場合において、これらの要素は、選択をなすために、レート−歪アルゴリズムに従ってバランスを保たれる。
【0099】
制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックのために使用された予測コーディング手法をデコーダに通知するためのシンタクス情報も生成する(506)。上に大いに詳しく述べられているように、このシンタクス情報は、ベースレイヤデータがエンハンスメントレイヤビデオブロックをエンコードするために使用された(インターレイヤ予測が使用された)ことを示す第1のシンタクス情報と、使用されたインターレイヤ予測手法のタイプをデコーダに通知するために使用される第2のシンタクス情報とを含み得る。第1のシンタクス情報は、ビデオブロック毎に1ビットを備え得る。第2のシンタクス情報は、インターレイヤコーディングされたビデオブロック毎に1ビット、または特にインターベースレイヤブロックに対応する、インターレイヤコーディングされたビデオブロック毎に1ビットを備え得る。前述のように、インターベースレイヤブロックに対応するビデオブロック毎の1ビットはより高い圧縮レベルという利点を持つ一方、インターレイヤコーディングされた全てのブロック毎の1ビットはデコーダにおけるベース及びエンハンスメントレイヤの別々のエントロピーコーディング及び構文解析を容易にするという利点を持ち、これはデコード処理を加速する。どの場合でも、エントロピーコーディングユニット52は、コーディングされたビットストリームを生成するために、データ(コーディングされたビデオブロック及びシンタクス情報を含む)をエントロピーエンコードし得る(507)。スケーラブルビデオエンコーダ35は、それから、
図1の変調器/送信器24を介するなど、信号変調及び別のデバイスへのコーディングされたビットストリームの送信のための1つまたは複数の変調器及び送信器に、コーディングされたビットストリームを転送し得る(508)。
【0100】
図6は、この開示に調和した例示的なデコード手法を説明するフロー図である。
図6は、
図3のスケーラブルビデオエンコーダ100の観点から記述されることになる。
図6に示されるように、スケーラブルビデオデコーダ100はベースレイヤ及びエンハンスメントレイヤビデオデータ及びシンタクス情報を備えるビットストリームを受信する(601)。逆多重化ユニット86はベースレイヤ及びエンハンスメントレイヤデータを分離し(602)、エンハンスメントレイヤデコーダ70及びベースレイヤデコーダ90に夫々データを転送する。シンタクス情報は、エンハンスメントレイヤビデオブロックをエンコードするためにベースレイヤデータが使用されたかどうか(即ち、インターレイヤ予測が使用されているかどうか)を示す第1のシンタクス情報と、使用されたインターレイヤ予測手法のタイプをデコーダに通知するために使用される第2のシンタクス情報とを含み得る。ベースレイヤデータがエンハンスメントレイヤビデオブロックをエンコードするために使用されたことを第1のシンタクス情報が示さないならば、この開示の手法は適用されなくてよい。一方、この開示の手法は、特に、ベースレイヤデータがインターレイヤ予測を用いてエンハンスメントレイヤビデオブロックをエンコードするために使用されたことを第1のシンタクス情報が示すときに適用される。
【0101】
エンハンスメントレイヤデコーダ70において、制御ユニット72は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかを判定する(603)。エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば(「イントラ」 503)、第1の予測ユニット76は、第1のインターレイヤ予測手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードする(604)。特に、デコードに関して、第1のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。
【0102】
他方では、エンハンスメントレイヤビデオブロックがインターベースレイヤビデオブロックに対応するならば(「インター」 603)、制御ユニット72は、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択し(605)、選択された予測手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードする。特に、選択次第で、第1の予測ユニット76が第1のインター予測コーディング手法を行い、または、第2の予測ユニット78が第2のインター予測コーディング手法を行い得る。また、第1のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。対照的に、第2のインターレイヤ予測コーディング手法は、デコードに関して、Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。選択(「605」)はビットストリームにおける「第2の」シンタクス情報に少なくとも一部において基づき得るが、これは、上に概説されているように、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビット残差エンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するためにエンコーダにおいて定められ得る。
【0103】
本願において記述された手法は、ハードウェア、ソフトウェア、ファームウェアまたはそれらの任意の組み合わせにおいて実装され得る。モジュールまたはコンポーネントとして記述された任意の特徴(feature)は、集積ロジックデバイスにおいて一緒に、または、ディスクリートであるが相互運用可能なロジックデバイスとして別々に、実装され得る。ソフトウェアで実装されるならば、手法は、実行時に1つまたは複数の前述の方法を実行する命令を備えるコンピュータ可読媒体によって少なくとも一部において実現され得る。コンピュータ可読なデータストレージ媒体は、パッケージング材料を含み得るコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、SDRAM(synchronous dynamic random access memory)などのRAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、EEPROM(electrically erasable programmable read-only memory)、FLASHメモリ、磁気または光学データストレージ媒体、及び同種のものを備え得る。手法は、追加的に、または代替的に、コンピュータによってアクセス、読み込み、及び/または実行可能な命令またはデータ構造の形式のコードを搬送または伝達するコンピュータ可読通信媒体によって少なくとも一部において実現され得る
コードは、1つまたは複数のDSP(digital signal processor)、ASIC(application specific integrated circuit)、FPGA(field programmable logic array)、または他の同等の集積またはディスクリートロジック回路などの1つまたは複数のプロセッサによって実行され得る。従って、「プロセッサ」という用語は、本願において使用されるように、任意の前述の構造または本願において記述された手法の実装に適した任意の他の構造を参照し得る。また、一部の態様において、本願において記述された機能性は、エンコード及びデコードのために構成された専用のソフトウェアモジュールまたはハードウェアモジュール内で提供され得るし、結合されたビデオエンコーダ−デコーダ(CODEC)に組み込まれ得る。
【0104】
ハードウェアで実装されるならば、この開示は、集積回路などの回路、チップセットASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ロジック、または本願に記載された1つまたは複数の手法を行うように構成されたそれらの種々の組み合わせに向けられ得る。
【0105】
本発明の種々の実施形態が記載されてきた。これらの及び他の実施形態は、次のクレームの範囲内である。
以下に、本願の出願当初の特許請求の範囲に記載された発明が付記される。
[1]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成することと、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードすることとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをエンコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定することを含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをコーディングすることと、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択することとを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする方法。
[2]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードすることと、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードすることとを更に具備する、[1]の方法。
[3]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[2]の方法。
[4]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[2]の方法。
[5]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信することと、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードすることとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをデコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定することを含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードすることと、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法のどちらかを選択することとを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする方法。
[6]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信することと、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信することとを更に具備する、[5]の方法。
[7]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[6]の方法。
[8]前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードすることを更に具備する、[7]の方法。
[9]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[6]の方法。
[10]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成し、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードするビット深度ベーススケーラブルビデオエンコーダを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオエンコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがイントラブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードし、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする装置。
[11]前記ビット深度ベーススケーラブルビデオエンコーダは、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードし、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードする、[10]の装置。
[12]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[11]の装置。
[13]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[11]の装置。
[14]集積回路及びマイクロプロセッサのうち一方を具備する、[10]の装置。
[15]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信し、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードするビット深度ベーススケーラブルビデオデコーダを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオデコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードし、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする装置。
[16]前記デコーダは、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信し、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信する、[15]の装置。
[17]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インター予測が使用されるビデオブロック毎に1ビットの情報を備える、[16]の装置。
[18]前記デコーダは、前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードする2つの別個のエントロピーデコードユニットを備える、[17]の装置。
[19]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[16]の装置。
[20]集積回路及びマイクロプロセッサのうちの一方を備える、[15]の装置。
[21]実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードさせる命令を具備し、前記命令は、前記デバイスに、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成させ、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードさせ、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードさせ、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させる、コンピュータ可読媒体。
[22]前記命令は、前記デバイスに更に、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードさせ、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードさせる、[21]のコンピュータ可読媒体。
[23]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[22]のコンピュータ可読媒体。
[24]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[22]のコンピュータ可読媒体。
[25]実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードさせる命令を具備し、前記命令は、前記デバイスに、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するときに、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードさせ、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードさせ、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させる、コンピュータ可読媒体。
[26]前記命令は、前記デバイスに更に、エンコーダによって定められる受信情報に少なくとも一部において基づいて、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定させる、[25]のコンピュータ可読媒体。
[27]エンコーダによって定められる前記受信情報は、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用され、ビデオブロック毎に1ビットの情報を備える第1の情報と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用され、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える第2の情報とを備える、[26]のコンピュータ可読媒体。
[28]前記命令は、前記デバイスに、前記ベースレイヤ及び前記エンハンスメントレイヤを別々にデコードさせる、[27]のコンピュータ可読媒体。
[29]エンコーダによって定められる前記受信情報は、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用され、ビデオブロック毎に1ビットの情報を備える第1の情報と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備える第2の情報とを備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[26]のコンピュータ可読媒体。
[30]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するための手段と、前記ベースレイヤをエンコードするための手段と、前記エンハンスメントレイヤをエンコードするための手段とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをエンコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定するための手段を含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードするための手段と、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段とを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードするデバイス。
[31]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するためにデコーダによって使用される第1の情報をエンコードするための手段と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードするための手段とを更に具備する、[30]のデバイス。
[32]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[31]のデバイス。
[33]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[31]のデバイス。
[34]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するための手段と、前記ベースレイヤをデコードするための手段と、前記エンハンスメントレイヤをデコードするための手段とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをデコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するための手段を含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードするための手段と、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段とを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードするデバイス。
[35]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信するための手段と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信するための手段とを更に具備する、[34]のデバイス。
[36]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[35]のデバイス。
[37]前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードするための手段を更に具備する、[36]のデバイス。
[38]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[36]のデバイス。
[39]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成し、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードするビット深度ベーススケーラブルビデオエンコーダと、前記ベースレイヤ及び前記エンハンスメントレイヤを別のデバイスに送信する無線送信器とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオエンコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきかであるかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードし、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードするデバイス。
[40]無線通信ハンドセットを備える、[39]のデバイス。
[41]ビデオデータを受信する無線受信器と、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信し、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードするビット深度ベーススケーラブルビデオデコーダとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオデコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードし、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードするデバイス。
[42]無線通信ハンドセットを備える、[39]のデバイス。