【文献】
Wiegand T.,et al,Joint Draft 9 of SVC Amendment with proposed changes,Joint Video Team (JVT) of ISO/IEC MPEG & ITU−T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU−T SG16 Q.6) JVT−V202 AnnexG,2007年 1月13日,p.334−349
【文献】
Zhu L.,et al,SVC Hypothetical Reference Decoder,Joint Video Team (JVT) of ISO/IEC MPEG & ITU−T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU−T SG16 Q.6) JVT−V068,2007年 1月13日,p1−10
(58)【調査した分野】(Int.Cl.,DB名)
ビデオ信号データをビットストリームからデコードし、前記ビットストリームにおける相互接続点の組について、デコードされたビデオ信号データからビットストリーム制限情報を決定するデコーダを有し、
前記ビットストリーム制限情報は、
(1)モーションがピクチャ境界をまたいでいるかどうか、
(2)ピクチャごとの最大バイト、
(3)マクロブロックごとの最大ビット、
(4)最大モーションベクトル長さ、
(5)フレームを並べ替える数、及び
(6)最大のデコードフレームバッファサイズ
のうちの少なくとも1つを特定する、
スケーラブルビデオ復号化装置。
【発明を実施するための形態】
【0011】
本原理は、図面に表される実施例に従ってより良く理解され得る。
【0012】
本原理は、スケーラブル・ビデオ符号化(SVC)のためのビデオ・ユーザビリティ情報(VUI)用の方法及び装置を対象とする。
【0013】
本明細書は本原理を明らかにするものである。よって、当然に、当業者は、たとえここで明示的に記載又は図示されていないとしても、本原理を具現し且つその精神及び適用範囲の中に包含される様々な配置に想到することができる。
【0014】
ここに挙げられている全ての例及び条件付きの用語は、本発明者が当該技術の発達に寄与する概念及び本原理を読む者が理解する助けとなるよう教育上の目的のためのものであり、このような具体的に挙げられている例及び条件に限定されないと解されるべきである。
【0015】
更に、本明細書中で本原理の原理、側面、及び実施形態並びにそれらの具体例を挙げている全ての記載は、それらの構造上及び機能上等価なものを包含するよう意図されている。加えて、斯かる等価なものは、現在知られているもの及び将来的に開発されるもの(すなわち、構造とは無関係に同じ機能を実行するよう開発されたあらゆる要素)の両方を含むよう意図されている。
【0016】
従って、例えば、当業者には当然のことながら、ここに表されているブロック図は、本原理を具現する実例となる回路の概念図を表している。同様に、当然に、あらゆるフローチャート、フロー図、状態遷移図、擬似コード、及びその他は、実質上コンピュータ読み取り可能な媒体で表され且つコンピュータ又はプロセッサによって(このようなコンピュータ又はプロセッサが明示されているか否かによらず)そのように実行されうる様々な処理を表す。
【0017】
図中に示されている様々な要素の機能は、適切なソフトウェアに関連して専用のハードウェア及びソフトウェアを実行可能なハードウェアの使用を通して提供されてよい。プロセッサによって提供される場合に、機能は、単一の共有プロセッサによって、又は複数の個々のプロセッサ(それらの一部は共有されてよい。)によって、提供されてよい。更に、用語「プロセッサ」又は「コントローラ」の明示的な使用は、専らソフトウェアを実行可能なハードウェアを参照していると解されるべきではなく、限定なくデジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを記憶する読出専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、及び不揮発性記憶装置を暗に含みうる。
【0018】
従来及び/又はカスタムの他のハードウェアも含まれてよい。同様に、図中に示されているあらゆるスイッチは概念にすぎない。それらの機能は、プログラムロジックの動作を通して、専用のロジックを通して、プログラム制御及び専用のロジックの相互作用を通して、又は手動で実行されてよく、また、特定の技術は、より具体的に文脈から理解されるように、実施する者によって選択可能である。
【0019】
特許請求の範囲で、特定の機能を実行する手段として表現されている如何なる要素も、例えば、a)その機能を実行する回路要素の組み合わせ又はb)あらゆる形態のソフトウェアを含み、従って、機能を実行するようそのソフトウェアを実行するための適切な回路と結合されたファームウェア、マイクロコード、又はその他を含む、その機能を実行するあらゆる方法を包含するよう意図される。斯かる特許請求の範囲によって定義される本原理は、挙げられている様々な手段によって提供される機能が、特許請求の範囲が求めている方法で結合されてまとめられるという事実にある。このようにして、斯かる機能性を提供することができる如何なる手段もここで示される手段と等価であると考えられる。
【0020】
本原理の「一実施例」又は「実施例」という明細書中の参照は、その実施例に関連して記載される特定の機能、特徴、構造及びその他が、本原理の少なくとも1つの実施例に含まれることを意味する。よって、本明細書中の様々な箇所で現れるフレーズ「一実施例で」又は「実施例で」は、必ずしも全てが同じ実施例を参照しているわけではない。
【0021】
当然に、用語「及び/又は」の使用(例えば、「A及び/又はB」の場合)は、最初に挙げられている選択肢(A)の選択、2番目に挙げられている選択肢(B)の選択、又は両方の選択肢(A及びB)の選択を包含するよう意図される。更なる例として、「A、B及び/又はC」の場合に、斯かる言い回しは、最初に挙げられている選択肢(A)の選択、2番目に挙げられている選択肢(B)の選択、3番目に挙げられている選択肢(C)の選択、最初及び2番目に挙げられている選択肢(A及びB)の選択、最初及び3番目に挙げられている選択肢(A及びC)の選択、2番目及び3番目に挙げられている選択肢(B及びC)の選択、又は3つ全ての選択肢(A及びB及びC)の選択を包含するよう意図される。これは、挙げられている多くの物に関して、当業者には容易に理解されるように、拡張されてよい。
【0022】
更に、当然に、本原理の1又はそれ以上の実施例はMPEG−4AVC標準に関連してここでは記載されるが、本原理はこの標準に限定されず、従って、本原理の精神を保ちながら、MPEG−4AVC標準の拡張を含む他のビデオ符号化標準、勧告、及びそれらの拡張に対して利用されてよい。
【0023】
ここで用いられるように、「高レベル構文」は、階層的にマクロブロックレイヤの上にあるビットストリームに存在する構文をいう。例えば、高レベル構文は、ここで用いられるように、スライス・ヘッダレベル、サプリメンタル・エンハンスメント情報(SEI)レベル、ピクチャ・パラメータ・セット(PPS)レベル、シーケンス・パラメータ・セット(SPS)レベル及びネットワーク・アブストラクション・レイヤ(NAL)ユニット・ヘッダレベルでの構文をいうが、これらに限定されない。
【0024】
スケーラブル・ビデオ符号化(SVC)は、MPEG−4AVC標準への拡張(アネックスG)である。SVCで、ビデオ信号は、ピラミッド形で構成されたベース・レイヤ及び1又はそれ以上のエンハンスメント・レイヤにエンコードされ得る。エンハンスメント・レイヤは、他のレイヤ又はその一部によって表されるビデオコンテンツの時間分解能(すなわち、フレームレート)、空間分解能、又は単に品質を高める。各レイヤは、全てのその依存レイヤとともに、或る空間分解能、時間分解能、及び品質レベルにおけるビデオ信号の1つの表現である。各レイヤは、或る空間分解能、時間分解能及び品質レベルでのビデオ信号をデコードすることを必要とする全てのその依存するレイヤとともに、動作点とも呼ばれる相互接続点(IOP(interoperability point))によって表される。SVCビットストリームは、ビットストリームが拡大縮小可能であるという事実に少なくとも部分的に起因して、通常、複数のIOPを有する。斯かるビットストリームは、例えば、空間的に、時間的に、及び信号対雑音比(SNR)において、拡大縮小可能であってよい。拡大縮小可能なアスペクトに対応するサブビットストリームは、ビットストリームから取り出されてよい。
【0025】
図1を参照すると、本発明が適用されうる例となるスケーラブル・ビデオエンコーダが、概して参照符号100で示されている。
【0026】
時間分割モジュール142の第1出力部は、イントラブロック用イントラ予測モジュール146の第1入力部と信号通信するよう接続されている。時間分割モジュール142の第2出力部は、モーション符号化モジュール144の第1入力部と信号通信するよう接続されている。イントラブロック用イントラ予測モジュール146の出力部は、変換/エントロピー符号器(信号対雑音比(SNR)スケーラブル)149の入力部と信号通信するよう接続されている。変換/エントロピー符号器149の第1出力部は、マルチプレクサ170の第1入力部と信号通信するよう接続されている。
【0027】
時間分割モジュール132の第1出力部は、イントラブロック用イントラ予測モジュール136の第1入力部と信号通信するよう接続されている。時間分割モジュール132の第2出力部は、モーション符号化モジュール134の第1入力部と信号通信するよう接続されている。イントラブロック用イントラ予測モジュール136の出力部は、変換/エントロピー符号器(信号対雑音比(SNR)スケーラブル)139の入力部と信号通信するよう接続されている。変換/エントロピー符号器129の第1出力部は、マルチプレクサ170の第1入力部と信号通信するよう接続されている。
【0028】
変換/エントロピー符号器149の第2出力部は、2次元空間補間モジュール138の入力部と信号通信するよう接続されている。モーション符号化モジュール144の第2出力部は、モーション符号化モジュール134の入力部と信号通信するよう接続されている。
【0029】
時間分割モジュール122の第1出力部は、イントラ予測器126の第1入力部と信号通信するよう接続されている。時間分割モジュール132の第2出力部は、モーション符号化モジュール124の第1入力部と信号通信するよう接続されている。イントラ予測器126の出力部は、変換/エントロピー符号器(信号対雑音比(SNR)スケーラブル)129の入力部と信号通信するよう接続されている。変換/エントロピー符号器129の第1出力部は、マルチプレクサ170の第1入力部と信号通信するよう接続されている。
【0030】
変換/エントロピー符号器139の第2出力部は、2次元空間補間モジュール128の入力部と信号通信するよう接続されている。モーション符号化モジュール134の第2出力部は、モーション符号化モジュール134の入力部と信号通信するよう接続されている。
【0031】
モーション符号化モジュール124の第1出力部、モーション符号化モジュール134の第1出力部、及びモーション符号化モジュール144の第1出力部は夫々、マルチプレクサ170の第2入力部と信号通信するよう接続されている。
【0032】
2次元空間デシメーションモジュール104の第1出力部は、時間分割モジュール132の入力部と信号通信するよう接続されている。2次元空間デシメーションモジュール104の第2出力部は、時間分割モジュール142の入力部と信号通信するよう接続されている。
【0033】
時間分割モジュール122の入力部及び2次元空間デシメーションモジュール104の入力部は、入力ビデオ102を受信するエンコーダ100の入力部として利用可能である。
【0034】
マルチプレクサ170の出力部は、ビットストリーム180を供給するエンコーダ100の出力部として利用可能である。
【0035】
時間分割モジュール122、時間分割モジュール132、時間分割モジュール142、モーション符号化モジュール124、モーション符号化モジュール134、モーション符号化モジュール144、イントラ予測器126、イントラ予測器136、イントラ予測器146、変換/エントロピー符号器129、変換/エントロピー符号器139、変換/エントロピー符号器149、2次元空間補間モジュール128、及び2次元空間補間モジュール138は、エンコーダ100のコアエンコーダ部分187に含まれている。
【0036】
図2を参照すると、本発明が適用されうる例となるスケーラブル・ビデオデコーダが、概して参照符号200によって示されている。デマルチプレクサ202の入力部は、スケーラブル・ビットストリームを受信するスケーラブル・ビデオデコーダ200への入力部として利用可能である。デマルチプレクサ202の第1出力部は、空間逆変換SNRスケーラブル・エントロピー復号器204の入力部と信号通信するよう接続されている。空間逆変換SNRスケーラブル・エントロピー復号器204の第1出力部は、予測モジュール206の第1入力部と信号通信するよう接続されている。予測モジュール206の出力部は、結合器230の第1入力部と信号通信するよう接続されている。
【0037】
空間逆変換SNRスケーラブル・エントロピー復号器204の第2出力部は、モーションベクトル(MV)復号器210の第1入力部と信号通信するよう接続されている。MV復号器210の出力部は、モーション補償器232の入力部と信号通信するよう接続されている。モーション補償器232の出力部は、結合器230の第2入力部と信号通信するよう接続されている。
【0038】
デマルチプレクサ202の第2出力部は、空間逆変換SNRスケーラブル・エントロピー復号器212の入力部と信号通信するよう接続されている。空間逆変換SNRスケーラブル・エントロピー復号器212の第1出力部は、予測モジュール214の第1入力部と信号通信するよう接続されている。予測モジュール214の第1出力部は、補間モジュール216の入力部と信号通信するよう接続されている。補間モジュール216の出力部は、予測モジュール206の第2入力部と信号通信するよう接続されている。予測モジュール214の第2出力部は、結合器240の第1入力部と信号通信するよう接続されている。
【0039】
空間逆変換SNRスケーラブル・エントロピー復号器212の第2出力部は、MV復号器220の第1入力部と信号通信するよう接続されている。MV復号器220の第1出力部は、MV復号器210の第2入力部と信号通信するよう接続されている。MV復号器220の第2出力部は、モーション補償器242の入力部と信号通信するよう接続されている。モーション補償器242の出力部は、結合器240の第2入力部と信号通信するよう接続されている。
【0040】
デマルチプレクサ202の第3出力部は、空間逆変換SNRスケーラブル・エントロピー復号器222の入力部と信号通信するよう接続されている。空間逆変換SNRスケーラブル・エントロピー復号器222の第1出力部は、予測モジュール224の入力部と信号通信するよう接続されている。予測モジュール224の第1出力部は、補間モジュール226の入力部と信号通信するよう接続されている。補間モジュール226の出力部は、予測モジュール214の第2入力部と信号通信するよう接続されている。
【0041】
予測モジュール224の第2出力部は、結合器250の第1入力部と信号通信するよう接続されている。空間逆変換SNRスケーラブル・エントロピー復号器222の第2出力部は、MV復号器230の入力部と信号通信するよう接続されている。MV復号器230の第1出力部は、MV復号器220の第2入力部と信号通信するよう接続されている。MV復号器230の第2出力部は、モーション補償器252の入力部と信号通信するよう接続されている。モーション補償器252の出力部は、結合器250の第2入力部と信号通信するよう接続されている。
【0042】
結合器250の出力部は、レイヤ0信号を出力するデコーダ200の出力部として利用可能である。結合器240の出力部は、レイヤ1信号を出力するデコーダ200の出力部として利用可能である。結合器230の出力部は、レイヤ2信号を出力するデコーダ200の出力部として利用可能である。
【0043】
ここで、スケーラブル・ビデオ符号化(SVC)用の仮想リファレンスデコーダ(HRD)のためにネットワーク・アブストラクション・レイヤ(NAL)仮想リファレンスデコーダ(HRD)パラメータ及びバーチャル符号化レイヤ(VCL)HRDパラメータを変更することを提案する。なお、VUIに含まれる他の情報、具体的に、ビットストリーム制限情報は考慮されない。従って、本原理に従って、SVCでの付加的なVUI情報のための改良が提案される。
【0044】
このようにして、本原理に従って、スケーラブル・ビデオ符号化(SVC)のためのMPEG−4AVC標準ビデオ・ユーザビリティ情報(VUI)を変更することを提案する。実施例で、VUIは、SVCの各相互接続点(IOP)について定義される。具体的に、VUIに含まれるビットストリーム制限情報と、SVCのためにどのようにビットストリーム制限情報を変更すべきかとが考慮される。また、MPEG−4AVC標準に準拠する場合についてVUI情報を伝達するためにどのようにサプリメンタル・エンハンスメント情報(SEI)メッセージを用いるべきかが考慮される。
【0045】
目下、ビデオVUIに含まれる仮想リファレンスデコーダパラメータはスケーラブル・ビデオ符号化のために各IOPについて設定されるが、他のVUI情報は、ビットストリームについてひと組のVUIパラメータしか使用しない。デコーダは(IOPに対応する)ビデオ信号のサブセットしかデコードしないと考えられるので、送信され及びデコードされる必要がある各IOPに対応するデータのサイズは、IOPごとに様々である。従って、仮想リファレンスデコーダパラメータに加えて、他の何らかのVUI情報が何らかの情報について各IOPへ又はIOPの組へ送信されるべきである、と考えられる。具体的に、VUIに含まれるビットストリーム制限情報が考えられている。
【0046】
実施例では、一例として、ビットストリーム制限情報が用いられる。なお、当然のことながら、他のVUI情報も本原理に従って使用されてよい。すなわち、本明細書で与えられる本原理の教示を前提として、当業者は、本原理の精神を保ちながら、本原理が適用されうるこれらの及び他の様々なタイプのVUI情報を企図しうる。
【0047】
一実施例で、同じビットストリーム制限情報を共有するIOPの組が提案される。例えば、同じdependency_idを有するレイヤは全て、同じビットストリーム制限情報を共有する。
【0048】
他の実施例で、各IOPについてビットストリーム制限情報は定義される。IOPは、dependency_id、temporal_id及びquality_idの組み合わせによって一意に識別され得る。iがIOPのインデックスであるとすると、ビットストリーム制限情報は下記の構文を含む。
【0049】
bitstream_restriction_flag[i]−現在のスケーラブル・レイヤに係るビットストリーム制限情報がSEIメッセージに存在することを示す。0に等しいbitstream_restriction_flag[i]は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤに係るビットストリーム制限情報がSEIメッセージに存在しないことを示す。
【0050】
motion_vectors_over_pic_boundaries_flag[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmotion_vectors_over_pic_boundaries_flagの値を示す。motion_vectors_over_pic_boundaries_flag[i]構文要素が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmotion_vectors_over_pic_boundaries_flagの値は、1に等しいと推測されるものとする。
【0051】
max_bytes_per_pic_denom[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_bytes_per_pic_denomの値を示す。max_bytes_per_pic_denom[i]構文要素が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_bytes_per_pic_denomの値は、2に等しいと推測されるものとする。
【0052】
max_bits_per_mb_denom[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_bits_per_mb_denomの値を示す。max_bits_per_mb_denom[i]が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_bits_per_mb_denomの値は、1に等しいと推測されるものとする。
【0053】
log2_max_mv_length_horizontal[i]及びlog2_max_mv_length_vertical[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのlog2_max_mv_length_horizontal及びlog2_max_mv_length_verticalの値を示す。log2_max_mv_length_horizontal[i]が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのlog2_max_mv_length_horizontal及びlog2_max_mv_length_verticalの値は、16に等しいと推測されるものとする。
【0054】
num_reorder_frames[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのnum_reorder_framesの値を示す。num_reorder_frames[i]の値は、0からmax_dec_frame_bufferingまでの範囲において包括的であるものとする。num_reorder_frames[i]構文要素が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのnum_reorder_framesの値は、max_dec_frame_bufferingに等しいと推測されるものとする。
【0055】
max_dec_frame_buffering[i]−dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_dec_frame_bufferingの値を示す。max_dec_frame_buffering[i]の値は、(MPEG−4AVC標準における従属節A.3.1又はA.3.2で特定される)num_ref_frames[i]からMaxDpbSizeまでの範囲において包括的であるものとする。max_dec_frame_buffering[i]構文要素が存在しない場合は、dependency_id[i]に等しいdependency_idと、temporal_id[i]に等しいtemporal_idと、quality_id[i]に等しいquality_idとを有するスケーラブル・レイヤのmax_dec_frame_bufferingの値は、MaxDpbSizeに等しいと推測されるものとする。
【0056】
更に、表2は、各IOPについてビットストリーム制限情報を定義することに関連して本実施例について提案されるVUI構文を含む。
【0057】
【表2】
図3を参照すると、
ビデオ・ユーザビリティ情報(VUI)をエンコードする例となる方法が、概して参照符号300によって示されている。
【0058】
方法300は、制御を決定ブロック310に渡す開始ブロック305を有する。決定ブロック310は、profile_idcがSVCに等しいか否かを決定する。profile_idcがSVCに等しい場合は、制御は機能ブロック315に渡される。そうでない場合は、制御は機能ブロック350に渡される。
【0059】
機能ブロック315は変数Mをレイヤの数−1に等しく設定し、制御を機能ブロック320に渡す。機能ブロック320は変数Mをビットストリームに書き込み、制御を機能ブロック325に渡す。機能ブロック325は変数iを零に等しく設定し、制御を機能ブロック330に渡す。機能ブロック330はレイヤiのtemporal_level、dependency_id、及びquality_levelをビットストリームに書き込み、制御を機能ブロック335に渡す。機能ブロック335は、レイヤiのタイミング情報及びHRDパラメータをビットストリームに書き込み、制御を機能ブロック340に渡す。機能ブロック340はレイヤiのビットストリーム制限情報をビットストリームに書き込み、制御を決定ブロック345に渡す。決定ブロック345は、変数iが変数Mに等しいか否かを決定する。変数iが変数Mに等しい場合は、制御は終了ブロック399に渡される。そうでない場合は、制御は機能ブロック360に渡される。
【0060】
機能ブロック350はタイミング情報及びHRDパラメータをビットストリームに書き込み、制御を機能ブロック355に渡す。機能ブロック355はビットストリーム制限情報をビットストリームに書き込み、制御を終了ブロック399に渡す。
【0061】
機能ブロック360は変数iを1だけ増分し、制御を機能ブロック330に戻す。
【0062】
図4を参照すると、
ビデオ・ユーザビリティ情報(VUI)をデコードする例となる方法が、概して参照符号400によって示されている。
【0063】
方法400は、制御を決定ブロック410に渡す開始ブロック405を有する。決定ブロック410は、profile_idcがSVCに等しいか否かを決定する。profile_idcがSVCに等しい場合は、制御は機能ブロック415に渡される。そうでない場合は、制御は機能ブロック450に渡される。
【0064】
機能ブロック415は変数Mをビットストリームから読み出し、制御を機能ブロック420に渡す。機能ブロック420はレイヤの数をM+1に等しく設定し、制御を機能ブロック425に渡す。機能ブロック425は変数iを零に等しく設定し、制御を機能ブロック430に渡す。機能ブロック430はレイヤiのtemporal_level、dependency_id、及びquality_levelをビットストリームから読み出し、制御を機能ブロック435に渡す。機能ブロック435は、レイヤiのタイミング情報及びHRDパラメータをビットストリームから読み出し、制御を機能ブロック440に渡す。機能ブロック440はレイヤiのビットストリーム制限情報をビットストリームから読み出し、制御を決定ブロック445に渡す。決定ブロック445は、変数iが変数Mに等しいか否かを決定する。変数iが変数Mに等しい場合は、制御は終了ブロック499に渡される。そうでない場合は、制御は機能ブロック460に渡される。
【0065】
機能ブロック450はタイミング情報及びHRDパラメータをビットストリームから読み出し、制御を機能ブロック455に渡す。機能ブロック455はビットストリーム制限情報をビットストリームから読み出し、制御を終了ブロック499に渡す。
【0066】
機能ブロック460は変数iを1だけ増分し、制御を機能ブロック430に戻す。
【0067】
SVCは、ベース・レイヤがMPEG−4AVC標準と互換性を有することを必要とした。しかし、MPEG−4AVC標準に準拠するビットストリームは複数の時間レイヤを有することがある。本原理の実施例に従って、MPEG−4AVC標準に準拠するレイヤにおいて異なる時間レイヤについてビットストリーム制限情報を伝達するために高レベル構文を用いることが提案される。一実施例で、サプリメンタル・エンハンスメント情報(SEI)メッセージが使用される。当然、本原理は、高レベル構文に関してSEIメッセージの使用にのみ限定されず、従って、他の高レベル構文も、本原理の精神を保ちながら、本原理に従って使用されてよい。表3は、本原理の実施例に従って、提案されるAVC時間
ビデオ・ユーザビリティ情報(VUI)サプリメンタル・エンハンスメント情報(SEI)メッセージを表す。以下の構文定義は、表3に挙げられている構文に適用する。
【0068】
【表3】
図5を参照すると、MPEG−4AVC標準時間サプリメンタル・エンハンスメント情報(SEI)メッセージをエンコードする例となる方法が、概して参照符号500によって示されている。
【0069】
方法500は、制御を機能ブロック510に渡す開始ブロック505を有する。機能ブロック510は、変数Mを、ベース・レイヤにおける時間サブセットの数−1に等しく設定し、制御を機能ブロック515に渡す。機能ブロック515は変数Mをビットストリームに書き込み、制御を機能ブロック520に渡す。機能ブロック520は変数iを零に等しく設定し、制御を機能ブロック525に渡す。機能ブロック525はレイヤiのtemporal_levelをビットストリームに書き込み、制御を機能ブロック530に渡す。機能ブロック530はレイヤiのビットストリーム制限情報をビットストリームに書き込み、制御を決定ブロック535に渡す。決定ブロック535は、変数iが変数Mに等しいか否かを決定する。変数iが変数Mに等しい場合は、制御は終了ブロック599に渡される。そうでない場合は、制御は機能ブロック540に渡される。機能ブロック540は変数iを1だけ増分し、制御を機能ブロック525に渡す。
【0070】
図6を参照すると、MPEG−4AVC標準時間サプリメンタル・エンハンスメント情報(SEI)メッセージをデコードする例となる方法が、概して参照符号600によって示されている。
【0071】
方法600は、制御を機能ブロック610に渡す開始ブロック605を有する。機能ブロック610は、変数Mをビットストリームから読み出し、制御を機能ブロック615に渡す。機能ブロック615はベース・レイヤにおける時間サブセットの数を変数M+1に等しく設定し、制御を機能ブロック620に渡す。機能ブロック620は変数iを零に等しく設定し、制御を機能ブロック625に渡す。機能ブロック625はレイヤiのtemporal_levelをビットストリームから読み出し、制御を機能ブロック630に渡す。機能ブロック630はレイヤiのビットストリーム制限情報をビットストリームから読み出し、制御を決定ブロック635に渡す。決定ブロック635は、変数iが変数Mに等しいか否かを決定する。変数iが変数Mに等しい場合は、制御は終了ブロック699に渡される。そうでない場合は、制御は機能ブロック640に渡される。
【0072】
機能ブロック640は変数iを1だけ増分し、制御を機能ブロック625に渡す。
【0073】
表4は、スケーラビリティ情報SEIメッセージに含まれるビットストリーム制限情報の他の実施を示す。
【0074】
【表4】
ここで、本発明の多数の付随する利点/特徴の幾つかに関する記載が与えられる。これらのうちの幾つかは上述されている。例えば、1つの利点/特徴は、ビデオ信号データをビットストリームにエンコードするエンコーダを有する装置である。このエンコーダは、
少なくとも1つの高レベル構文要素を用いて前記ビットストリームで仮想リファレンスデコーダパラメータを除く
ビデオ・ユーザビリティ情報を特定する。また、
ビデオ・ユーザビリティ情報は、スケーラブル・ビデオ符号化に関連する前記ビットストリームでの相互接続点の組に対応する。
【0075】
他の利点/特徴は、上述されるエンコーダを有する装置であり、前記エンコーダは
、前記相互接続点の組を含め、スケーラブル・ビデオ符号化に関連する前記ビットストリームでの前記相互接続点の夫々について前記
ビデオ・ユーザビリティ情報を特定する。
【0076】
更なる他の利点/特徴は、上述されるエンコーダを有する装置であり、前記エンコーダは
、ISO/IEC MPEG−4 Part10 AVC標準/ITU−TS H.264勧告と互換性があるレイヤでスケーラブル・ビデオ符号化に関連する前記相互接続点の夫々について前記
ビデオ・ユーザビリティ情報を特定する。
【0077】
更なる他の利点/特徴は、上述されるエンコーダを有する装置であり、前記
ビデオ・ユーザビリティ情報はビットストリーム制限情報を有する。
【0078】
更に、他の利点/特徴は、前記
ビデオ・ユーザビリティ情報がビットストリーム制限情報を有するところの前記エンコーダを有する装置であり、前記ビットストリーム制限情報は、motion_vectors_over_pic_boundaries_flag構文要素、max_bytes_per_pic_denom構文要素、max_bits_per_mb_denom構文要素、log2_max_mv_length_horizontal構文要素、log2_max_mv_length_vertical構文要素、num_reorder_frames構文要素、及びmax_dec_frame_buffering構文要素のうち少なくとも1つを有する。
【0079】
更に、他の利点/特徴は、上述されるエンコーダを有する装置であり、前記高レベル構文要素は、スライス・ヘッダレベル、シーケンス・パラメータ・セットレベル、ピクチャ・パラメータ・セットレベル、ネットワーク・アブストラクション・レイヤ・ユニット・ヘッダレベル、及びサプリメンタル・エンハンスメント情報メッセージに対応するレベルのうち少なくとも1つに対応する。
【0080】
また、他の利点/特徴は、上述されるエンコーダを有する装置であり、profile_idc構文要素は、スケーラブル・ビデオ符号化のために、又はISO/IEC MPEG−4 Part10 AVC標準/ITU−TS H.264勧告との整合性のために前記ビットストリームを区別するために用いられる。
【0081】
加えて、他の利点/特徴は、上述されるエンコーダを有する装置であり、前記エンコーダは、dependency_id構文要素、temporal_level構文要素、及びquality_level構文要素を、前記組に含まれる前記相互接続点の少なくとも夫々について、前記ビットストリームに書き込む。
【0082】
更に、他の利点/特徴は、上述されるエンコーダを有する装置であり、前記エンコーダは、temporal_level構文要素及びquality_level構文要素を、前記組に含まれる前記相互接続点の少なくとも夫々について、前記ビットストリームに書き込む。
【0083】
更に、他の利点/特徴は、上述されるエンコーダを有する装置であり、前記エンコーダは、temporal_level構文要素を、前記組に含まれる前記相互接続点の少なくとも夫々について、前記ビットストリームに書き込む。
【0084】
本原理のこれらの及び他の特徴及び利点は、本明細書中の教示に基づいて当業者によって容易に確かめられ得る。当然に、本原理の教示は、ハードウェア、ソフトウェア、特別目的のプロセッサ、又はそれらの組み合わせの様々な形で実施されてよい。
【0085】
最も望ましくは、本原理の教示は、ハードウェア及びソフトウェアの組み合わせとして実施される。更に、ソフトウェアは、プログラム記憶ユニットに実体的に現されるアプリケーションプログラムとして実施されてよい。アプリケーションプログラムは、何らかの適切なアーキテクチャを有するマシンにアップロードされ、そのマシンによって実行されてよい。望ましくは、マシンは、例えば、1又はそれ以上の中央演算処理ユニット(CPU)、ランダムアクセスメモリ(RAM)、及び入出力(I/O)インターフェース等のハードウェアを有するコンピュータプラットフォームで実施される。コンピュータプラットフォームは、また、オペレーティングシステム及びマイクロインストラクションコードを有してよい。ここに記載される様々な処理及び機能は、マイクロインストラクションコードの一部若しくはアプリケーションプログラムのいずれか又はそれらの何らかの組み合わせであってよく、CPUによって実行されてよい。更に、様々な他の周辺ユニットが、例えば、補助データ記憶ユニット及び印刷ユニット等、コンピュータプラットフォームに接続されてよい。
【0086】
更に、当然に、添付の図面に表されている構成システム要素及び方法の幾つかは、望ましくはソフトウェアで実施されるので、システム要素又は処理機能ブロックの間の実際の接続は、本原理がプログラミングされる方法に依存して様々であってよい。本明細書中の教示を前提として、当業者は本原理のこれらの及び類似する実施又は構成に想到しうる。
【0087】
実例となる実施形態が添付の図面を参照して本明細書中で記載されてきたが、当然に、本原理はこれらの厳密な実施形態に限られず、様々な変更及び改良が、本原理の適用範囲及び精神から逸脱することなく当業者によって斯かる実施例に対して行われうる。全てのこのような変更及び改良は、添付の特許請求の範囲に挙げられている本原理の適用範囲内に包含されるよう意図される。
【0088】
[関連出願の相互参照]
本願は、2007年4月12日に出願した米国仮特許出願番号第60/911,490号に基づく優先権を主張するものである。