(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-01
(45)【発行日】2023-11-10
(54)【発明の名称】アクセスユニットデリミタおよび適応パラメータセットの使用
(51)【国際特許分類】
H04N 19/70 20140101AFI20231102BHJP
H04N 19/117 20140101ALI20231102BHJP
H04N 19/176 20140101ALI20231102BHJP
【FI】
H04N19/70
H04N19/117
H04N19/176
(21)【出願番号】P 2022511041
(86)(22)【出願日】2020-08-18
(86)【国際出願番号】 EP2020073117
(87)【国際公開番号】W WO2021032747
(87)【国際公開日】2021-02-25
【審査請求日】2022-04-15
(32)【優先日】2019-08-19
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】サンチェス デ ラ フエンテ ヤゴ
(72)【発明者】
【氏名】ズーリング カルステン
(72)【発明者】
【氏名】ヘルゲ コーネリアス
(72)【発明者】
【氏名】ツェル トーマス
(72)【発明者】
【氏名】スクピン ロベルト
(72)【発明者】
【氏名】ウィーガンド トーマス
【審査官】田中 純一
(56)【参考文献】
【文献】特表2017-535167(JP,A)
【文献】特表2014-525197(JP,A)
【文献】米国特許出願公開第2013/0022104(US,A1)
【文献】特表2010-516102(JP,A)
【文献】米国特許出願公開第2009/0296826(US,A1)
【文献】特開2018-121352(JP,A)
【文献】米国特許出願公開第2016/0021379(US,A1)
【文献】Ming Li, Ping Wu,AHG17 & AHG9: Comments on carriage of coding tool parameters in Adaptation Parameter Set [online], JVET-N JVET-N0065,ITU-T インターネット<URL:http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/14_Geneva/wg11/JVET-N0065-v1.zip>,2019年03月11日,pp.1-3
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
プロセッサと、メモリとを備えるビデオ復号装置であって、前記メモリと共に動作する前記プロセッサは、
ビデオデータストリーム内のアクセスユニット
(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを読み出し、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成し、
サフィックス適応パラメータセット(APS)NALユニットタイプである適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を読み出し、ここで、
前記ALF APS
が、
1つまたは複数の適応ループフィルタ係数を含み、および
、
前記ALF APSが
、前記AU内の前記1つまたは複数のVCL NALユニットに続
き、
前記ALF APSに含まれる前記1つまたは複数の
適応ループフィルタ係数に応じて、復号されたピクチャの再構成されたバージョンに対して適応ループフィルタリングを実行する、ように構成される、ビデオ復号装置。
【請求項2】
前記メモリと共に動作する前記プロセッサは、前記ALF APSを読み出す前に、前記1つまたは複数のVCL NALユニットを読み出すように構成される、請求項1に記載のビデオ復号装置。
【請求項3】
前記1つまたは複数のVCL NALユニットは、1つまたは複数のスライスを表す、請求項1に記載のビデオ復号装置。
【請求項4】
前記メモリと共に動作する前記プロセッサは、前記1つまたは複数のスライスのデータを読み出した後に前記ALF APSを読み出すように構成される、請求項3に記載のビデオ復号装置。
【請求項5】
前記メモリと共に動作する前記プロセッサは、前記ALF APSを読み出す前に、前記1つまたは複数のスライスを解析するように構成される、請求項3に記載のビデオ復号装置。
【請求項6】
前記ALF APSは、ALF制御情報を含む、請求項1に記載のビデオ復号装置。
【請求項7】
前記ALF制御情報は、コーディングツリーユニット、CTUがフィルタリングされるか否かに関する情報を含む、請求項6に記載のビデオ復号装置。
【請求項8】
前記ALF制御情報は、コーディングツリーユニット、CTUがどのようにフィルタリングされるかに関する情報を含む、請求項6に記載のビデオ復号装置。
【請求項9】
前記ビデオ復号装置は、コンピュータまたはモバイルデバイスのうちの1つである、請求項1に記載のビデオ復号装置。
【請求項10】
ビデオデータストリームを復号するための方法であって、
ビデオデータストリーム内のアクセスユニット
(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを読み出すことと、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成することと、
サフィックス適応パラメータセット(APS)NALユニットタイプである適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を読み出すことであって、
前記ALF APS
が、
1つまたは複数の適応ループフィルタ係数を含み、および
、
前記ALF APSが
、前記AU内の前記1つまたは複数のVCL NALユニットに続
く、ALF APSを読み出すことと
、
前記ALF APSに含まれる前記1つまたは複数の
適応ループフィルタ係数に応じて、復号されたピクチャの再構成されたバージョンに対して適応ループフィルタリングを実行することと、を含む、ビデオデータストリームを復号するための方法。
【請求項11】
前記ALF APSは、ALF制御情報を含む、請求項10に記載の方法。
【請求項12】
プロセッサと、メモリとを備えるビデオ符号化装置であって、前記メモリと共に動作する前記プロセッサは、
ビデオデータストリーム内のアクセスユニッ
ト(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを符号化し、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成し、
前記復号されたピクチャの前記再構成されたバージョンに基づいて、1つまたは複数の適応ループフィルタ係数を導出し、
前記1つまたは複数の符号化されたVCL NALユニットに続くデータストリームにおいて、
前記1つまたは複数の適応ループフィルタ係数を含む適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を、
前記ALF APS
が、サフィックス適応パラメータセット
(APS)NALユニットタイプであり、および
、
前記ALF APSが
、前記AU内の
前記1つまたは複数のVCL NALユニットに続
く、
ように符号化する、ように構成される、ビデオ符号化装置。
【請求項13】
前記メモリと共に動作する前記プロセッサは、前記ALF APSの符号化の前に、前記1つまたは複数のVCL NALユニットを符号化するように構成される、請求項12に記載のビデオ符号化装置。
【請求項14】
前記1つまたは複数のVCL NALユニットは、1つまたは複数のスライスを表す、請求項12に記載のビデオ符号化装置。
【請求項15】
前記メモリと共に動作する前記プロセッサは、前記1つまたは複数のスライスのデータの符号化の後に前記ALF APSを符号化するように構成される、請求項14に記載のビデオ符号化装置。
【請求項16】
前記メモリと共に動作する前記プロセッサは、ピクチャ全体を符号化する前に、前記1つまたは複数のスライスを送信するように構成される、請求項14に記載のビデオ符号化装置。
【請求項17】
前記メモリと共に動作する前記プロセッサは、ALFパラメータを収集しながら前記1つまたは複数のスライスを送信するように構成される、請求項14に記載のビデオ符号化装置。
【請求項18】
前記ALF APSは、ALF制御情報を含む、請求項12に記載のビデオ符号化装置。
【請求項19】
前記ALF制御情報は、コーディングツリーユニット、CTUがフィルタリングされるか否かに関する情報を含む、請求項18に記載のビデオ符号化装置。
【請求項20】
前記ALF制御情報は、コーディングツリーユニット、CTUがどのようにフィルタリングされるかに関する情報を含む、請求項18に記載のビデオ符号化装置。
【請求項21】
前記ビデオ符号化装置は、コンピュータまたはモバイルデバイスのうちの1つを備える、請求項12に記載のビデオ符号化装置。
【請求項22】
ビデオデータストリームをビデオ符号化するための方法であって、
ビデオデータストリーム内のアクセスユニッ
ト(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを符号化することと、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成することと、
前記復号されたピクチャの前記再構成されたバージョンに基づいて、1つまたは複数の適応ループフィルタ係数を導出することと、
前記1つまたは複数の符号化されたVCL NALユニットに続くデータストリームにおいて、
前記1つまたは複数の適応ループフィルタ係数を含む適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を、
前記ALF APS
が、サフィックス適応パラメータセット
(APS)NALユニットタイ
プであり、および
、
前記ALF APSが
、前記AU内の
前記1つまたは複数のVCL NALユニットに続
く、
ように符号化することと、を含む、ビデオデータストリームをビデオ符号化するための方法。
【請求項23】
前記ALF APSは、ALF制御情報を含む、請求項22に記載の方法。
【請求項24】
実行されると、コンピュータに方法を実行させる命令を記憶する非一時的コンピュータ可読媒体であって、前記方法は、
ビデオデータストリーム内のアクセスユニッ
ト(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを読み出すことと、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成することと、
サフィックス適応パラメータセット(APS)NALユニットタイプである適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を読み出すことであって、
前記ALF APS
が、
1つまたは複数の適応ループフィルタ係数を含み、および
、
前記ALF APSが
、前記AU内の
前記1つまたは複数のVCL NALユニットに続
く、ALF APSを読み出すことと
、
前記ALF APSに含まれる前記1つまたは複数の
適応ループフィルタ係数に応じて、復号されたピクチャの再構成されたバージョンに対して適応ループフィルタリングを実行することと、を含む、非一時的コンピュータ可読媒体。
【請求項25】
実行されると、コンピュータに方法を実行させる命令を記憶する非一時的コンピュータ可読媒体であって、前記方法は、
ビデオデータストリーム内のアクセスユニッ
ト(AU
)内の1つまたは複数のビデオコーディングレイヤ
(VCL)ネットワーク抽象化レイヤ
(NAL)ユニッ
トを符号化することと、
前記1つまたは複数のVCL NALユニットから復号されたピクチャの再構成されたバージョンを生成することと、
前記復号されたピクチャの前記再構成されたバージョンに基づいて、1つまたは複数の適応ループフィルタ係数を導出することと、
前記1つまたは複数の符号化されたVCL NALユニットに続くデータストリームにおいて、
前記1つまたは複数の適応ループフィルタ係数を含む適応ループフィルタ
(ALF)適応パラメータセッ
ト(APS
)を、
前記ALF APS
が、サフィックス適応パラメータセット
(APS)NALユニットタイプであり、および
、
前記ALF APSが
、前記AU内の前記1つまたは複数のVCL NALユニットに続
く、
ように符号化することと、を含む、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、シグナリング符号化パラメータのためのアクセスデリミタおよび適応パラメータセットの使用に関する。
【背景技術】
【0002】
現代のビデオ符号化規格は、適応ループフィルタ(ALF)、サンプル適応オフセット(SAO)およびデブロッキングフィルタのようなループ内フィルタを利用する。
【0003】
ループ内フィルタはエンコーダの復号ループ内に配置される。すべてのビデオ符号化ステージの間、および特に量子化ステージで実行されるロッシー圧縮において、ビデオシーケンスの主観的品質は、ブロッキング、リンギングまたはぼやけたアーチファクトの出現の結果として低減されることがある。これらのアーチファクトを除去し、再構成されたシーケンスの主観的および客観的な品質を向上させるために、ループ内フィルタのセットが使用される。エンコーダ内のループ内フィルタは、フレームの客観的な品質を最も向上させる最適なフィルタパラメータを推定する。次に、これらのパラメータはデコーダに送信され、デコーダのループ内フィルタは、これらのパラメータを使用して、再構成されたフレームを最適にフィルタリングし、エンコーダ内の再構成されたフレームについて達成されるのと同じ品質改善を達成することができる。
【0004】
デブロッキングフィルタは、エンコーダのすべてのステージの処理でブロック構造を使用する結果として、CU(符号化ユニット)、具体的にはPU(予測ユニット)およびTU(変換ユニット)のエッジに現れるブロッキングアーチファクトを除去することを目的とする。
【0005】
SAOフィルタは、リンギングのような望ましくない可視アーチファクトを低減することを目的とする。SAOの鍵となるアイデアはまず、再構成されたサンプルを異なるカテゴリに分類し、各カテゴリについてオフセットを取得し、次に、カテゴリの各サンプルにオフセットを加えることによって、サンプル歪みを低減することである。
【0006】
ALFの鍵となるアイデアは、Wienerベースの適応フィルタ係数を用いて、オリジナル画素と復号画素間の平均二乗誤差を最小化することである。ALFは、各ピクチャの最後の処理ステージに配置され、前のステージからのアーチファクトを捕捉し、修正しようとするツールと見なすことができる。適当なフィルタ係数は、エンコーダにより決定され、デコーダに明示的にシグナリングされる。すなわち、ALFは、デコーダに送られるべきパラメータのセット、すなわち適切なフィルタ係数を必要とする。これらのパラメータは、高レベルシンタックス構造、例えば、適応パラメータセット(APS)で送信される。APSは、ビデオ符号化レイヤ(VCL)NAL(ネットワーク抽象化レイヤ)ユニット、すなわちピクチャのスライスの前にビットストリームで送信されるパラメータセットである。ALFは、再構成後の完全なピクチャに適用される。また、エンコーダでは、ALF推定は、符号化プロセスの最後のステップの1つである。
【0007】
低遅延環境では、特にピクチャの符号化プロセスを終了する前に、エンコーダはできるだけ早くピクチャの処理された部分の送信を開始したいので、これは問題を引き起こす。ALFは、符号化ピクチャについて推定されたフィルタパラメータを有するAPSがピクチャの第1のスライスの前に送信されなければならないので、これらの環境では最適に使用することができない。
【0008】
さらに、指定された形式のNALユニットのセットはアクセスユニット、AUと呼ばれ、各AUの復号は1つの復号ピクチャをもたらす。各AUは、一次符号化ピクチャを共に構成するVCL NALユニットのセットを含む。また、AUの開始位置を特定するのを助けるためのアクセスユニットデリミタ(AUD)を先頭に付加することもできる。
【0009】
AUDは、ビットストリーム内のAUを分離するために使用される。許可されたスライスタイプ(I、P、B)のように、後続のピクチャに関する情報を任意に含むことができる。
【0010】
VVC(Versatile Video Coding)では、いくつかの異なるパラメータセットをピクチャで参照でき、すなわち、ビデオパラメータセット(VPS)、デコーダパラメータセット(DPS)、シーケンスパラメータセット(SPS)、複数のピクチャパラメータセット(PPS)、異なるタイプの適応パラメータセット(APS)、また1つ以上である。デコーダでピクチャをデコードできるようにするには、すべてのパラメータセットを有する必要がある。
【0011】
ピクチャの異なるスライスは、異なるPPSおよびAPSを参照することができる。したがって、必要なすべてのパラメータセットが利用可能であるかどうかをデコーダが判断することは難しいことがあり、なぜなら、それは、どのパラメータが参照されるか、ピクチャとデコードのすべてのスライスヘッダを解析する必要があるからである。
【発明の概要】
【発明が解決しようとする課題】
【0012】
本願の主題の目的は、アクセスユニットから必要なパラメータを導出するデコーダを提供することである。
【課題を解決するための手段】
【0013】
この目的は、本願の特許請求の範囲の主題によって達成される。
【0014】
本願の実施形態によれば、ビデオデコーダは、復号ピクチャの再構成バージョン(46a)を取得するために、ビデオデータストリームのアクセスユニットAU内の1つまたは複数のビデオ符号化ユニット(100)、例えばVCL NALユニットから動き補償予測および変換ベースの残差復号を使用して復号ピクチャ、例えば現在復号されているピクチャまたは後続のデコードされたピクチャを再構成するように構成された復号コア(94)と、復号ピクチャの再構成バージョン(46b)をフィルタリングして、ビデオデコーダの復号ピクチャバッファDPB(92)に挿入される復号ピクチャのバージョン(46b)を取得するように構成された、例えばALFを含むループ内フィルタ(90)と、パラメータ化器であって、データストリーム順序に沿って1つまたは複数のビデオ符号化ユニット(100)に後続する、例えばVCL NALUと共に個別に、またはそれらすべてに後続する、復号ピクチャのアクセスユニットAU内に位置する1つまたは複数のパラメータセット(102、104)、例えばCTU APSごとのALF APSおよびALF、および/または、データストリーム順序に沿ってブロックベースの予測パラメータデータおよび予測残差データを搬送する1つまたは複数のビデオ符号化ユニット(100)に含まれるデータ(108)に後続する1つまたは複数のビデオ符号化ユニット(100)の部分(106)、例えば、CTUデータごとのALFからループ内フィルタをパラメータ化するためのループ内フィルタ制御情報、例えばALF係数(またはパラメータ)およびCTU(符号化ツリーユニット)フラグごとのALFを読み取ること、および、ループ内フィルタ制御情報に応じた方法で復号ピクチャの再構成バージョンをフィルタリングするようにループ内フィルタをパラメータ化すること、によって、ループ内フィルタをパラメータ化するように構成されたパラメータ化器と、を備える。すなわち、ループ内フィルタ制御情報は、1つまたは複数のビデオ符号化ユニットについて導出され、したがって、ピクチャのすべてのビデオ符号化ユニットを受信する前に復号を開始することが可能である。したがって、復号遅延は、低遅延環境において低減される。
【0015】
本願の実施形態によれば、ループ内フィルタ制御情報は、伝達関数に関してループ内フィルタをパラメータ化するための1つまたは複数のフィルタ係数を含む。すなわち、ALFは、例えば、FIR(有限インパルス応答)またはIIR(無限インパルス応答)フィルタと、フィルタの伝達関数を制御するフィルタ係数FIRまたはIIR係数である。
【0016】
本願の実施形態によれば、ループ内フィルタ制御情報は、ループ内フィルタによって、復号ピクチャ、例えば、現在復号されているピクチャまたは後続の復号ピクチャの再構成されたバージョンのフィルタリングを空間的に変化させるための空間的に選択的なループ内フィルタ制御情報を含む。
【0017】
本願の実施形態によれば、各ビデオ符号化ユニット(100)は、データをわたって部分(106)の最後まで、すなわちALFまで、データストリーム順序に沿って連続的に算術符号化される。1つまたは複数のパラメータセットの所定のパラメータセット(102)は1つまたは複数のビデオ符号化ユニット(100)のそれぞれにデータストリーム順序で続き、伝達関数に関してループ内フィルタをパラメータ化するための1つまたは複数のフィルタ係数を備える。
【0018】
本願の実施形態によれば、1つまたは複数のパラメータセット(104)は、1つまたは複数のビデオ符号化ユニット(100)のそれぞれについて、それぞれのビデオ符号化ユニット(100)にデータストリーム順序で続くさらなる所定のパラメータセットを含み、それぞれのビデオ符号化ユニット(100)に符号化されるピクチャの部分内のループ内フィルタによって、復号ピクチャ、たとえば、現在復号されているピクチャまたは後続の復号ピクチャの再構成されたバージョンのフィルタリングを空間的に変化させるための空間選択的なループ内フィルタ制御情報を含む。
【0019】
本願の実施形態によれば、1つまたは複数のビデオ符号化ユニット(100)のそれぞれは、それぞれのビデオ符号化ユニット(100)のデータセクション(108)にデータストリーム順序で続くフィルタ情報セクション(106)を含み、フィルタ情報セクションは、ブロックベースの予測パラメータデータおよび予測残差データがそれぞれのビデオ符号化ユニット(100)のデータセクションに符号化されるピクチャの部分内のループ内フィルタによって、復号ピクチャ、たとえば、現在復号されているピクチャまたは後続の復号ピクチャの再構成されたバージョンのフィルタリングを空間的に変化させるための空間選択的なループ内フィルタ制御情報を含む。
【0020】
本願の実施形態によれば、パラメータ化器は、第1の状態を仮定する前記ビデオデータストリーム内の所定の指示の場合には、データストリーム順序に沿って前記1つまたは複数のビデオ符号化ユニット(100)に続く、例えばVCL NALUと共に個別に、またはそれらすべてに続く位置に、第2の状態を仮定する前記ビデオデータストリーム内の前記所定の指示の場合には、前記1つまたは複数のビデオ符号化ユニット(100)のすべてに先行する前記アクセスユニット内の異なる位置に、前記復号ピクチャ、例えば、現在復号ピクチャまたは後続の復号ピクチャの前記1つまたは複数のパラメータセット(102、104)、例えば、ALF APSおよびCTU APSごとのALFを前記アクセスユニット(AU)内で配置するように構成されてもよい。
【0021】
本願の実施形態によれば、1つまたは複数のビデオ符号化ユニット(100)の部分(106)、例えばCTUデータごとのALFは、第1の状態を仮定するビデオデータストリーム内の所定の指示の場合には、ブロックベースの予測パラメータデータおよび予測残差データを運搬する、データストリーム順序に沿って、1つまたは複数のビデオ符号化ユニット(100)によって構成されたデータ(108)に続く位置にあり、第2の状態を仮定するビデオデータストリーム内の所定の指示の場合には、ブロックベースの予測パラメータデータおよび予測残差データが散在する1つまたは複数のビデオ符号化ユニット内の異なる位置にある。
【0022】
本願の実施形態によれば、ビデオデコーダは、1つまたは複数のビデオ符号化ユニット(100)から所定の指示を読み取るように構成される。所定の指示は、第1の状態を仮定する場合に、1つまたは複数のパラメータセットを1つまたは複数の識別子によって示し、第2の状態を仮定する場合、異なる1つまたは複数のループ内フィルタ制御情報パラメータ設定を示す。ビデオデコーダは、所定の指示が異なるアクセスユニットに対して異なる場合に、ビデオデータストリームの異なるアクセスユニットに対して異なる位置特定を実行するように、アクセスユニットごとに所定の指示に応答するように構成される。パラメータ化器は、前にシグナリングされたアクセスユニットAUに含まれるループ内フィルタ制御情報を使用して、復号ピクチャを再構成するように構成される。
【0023】
本願の実施形態によれば、ビデオデコーダは、アクセスユニットAUの境界を検出する際に、ループ内フィルタ制御情報、例えば、ALFフィルタデータを搬送するビデオ符号化ユニットを、1つまたは複数のパラメータセット(102、104)、例えば、サフィックスAPSの形態で、アクセスユニットを開始しないものとして解釈し、そこから、例えば、AU境界検出においてそれらを無視し、それによって、AU境界がないことを検出し、そのようなビデオ符号化ユニットからアクセスユニットを開始するものとして、1つまたは複数のパラメータセット(102、104)、例えば、サフィックスAPSの形態でないループ内フィルタ制御情報を搬送するビデオ符号化ユニットを解釈し、例えば、そのようなビデオ符号化ユニットからAU境界を検出するように構成される。
【0024】
本願の実施形態によれば、ビデオデコーダは、ビデオデータストリームのアクセスユニットAU内の1つまたは複数のビデオ符号化ユニット(100)から、1つまたは複数の所定の符号化パラメータを使用してパラメータ化された方法で、復号ピクチャ、例えば、現在復号されているピクチャまたは後続の復号ピクチャを復号することによって、ビデオデータストリームからビデオを復号し、ビデオデータストリームに散在する複数のパラメータセット(120)から所定の符号化パラメータ(122)を導出し、アクセスユニットAUの所定のユニット(124)から、所定の符号化パラメータを含む複数のパラメータセットから所定のパラメータセットを識別する識別子(200)を読み出すように構成される。すなわち、符号化パラメータの有無は識別子によって示され、したがって、どのパラメータセットが受信されたビデオ符号化ユニットから派生可能であるかが効率的に認識される。また、識別子は、AUの所定のユニットに含まれるため、異なるビデオ符号化ユニットに対して異なるパラメータセットを含めることが容易である。
【0025】
本願の実施形態によれば、AUの所定のユニットは、識別子(200)が所定のユニット内に存在するか否かを示すフラグ(204)を含む。すなわち、AUの所定のユニットにどの識別子が含まれているかをフラグで示すことができ、例えば、アクセスユニットのデリミタを示すことができる。
【0026】
本願の実施形態によれば、複数のパラメータセット(120)は異なる階層レベルのものであり、1つまたは複数のビデオ符号化ユニットは、例えば、スライスヘッダにおいて、1つまたは複数の第1の所定の階層レベル内の第1の所定のパラメータセット(126)を参照する識別子を含み、1つまたは複数の第1の所定の階層レベル内の第1の所定のパラメータセット(126)は1つまたは複数の第2の所定の階層レベル内の第2の所定のパラメータセット(128)を参照する識別子を含み、第1および第2の所定のパラメータセットは、所定のパラメータセット(122)によって含まれる。アクセスユニットAUの所定のユニット(124)から読み出された識別子は、アクセスユニットの1つまたは複数のビデオ符号化ユニットによって直接的または間接的に参照されるすべての所定のパラメータセットを識別し、それにより、識別子によって識別されるすべての所定のパラメータセットが利用可能である場合、アクセスユニットは復号可能である。
【0027】
本願の実施形態によれば、AUの所定のユニットは、特定の所定のパラメータセット(126b)、例えば特定のAPSを参照する識別子(200)の所定の識別子が所定のユニット(124)内に存在するかどうか、または特定の所定のパラメータセット(126b)を参照する所定の識別子が1つまたは複数のビデオ符号化ユニット(100)内に存在するかどうかを示す(205)フラグ(204)を含む。
【0028】
本願の実施形態によれば、第1の所定のパラメータセット(126)は、1つまたは複数のビデオ符号化ユニット(100)内の識別子によって参照される第3の所定のパラメータセット(126a)と、所定のユニット(124)内に存在する識別子(200)によって参照されるが、1つまたは複数のビデオ符号化ユニット(100)内の識別子のいずれによっても、または所定のパラメータセットのいずれによっても参照されない第4の所定のパラメータセット(126b)と、を含む。
【0029】
本願の実施形態によれば、AUの所定のユニットは、1つまたは複数の適応パラメータセットの1つまたは複数の識別子、APS、1つまたは複数のピクチャパラメータセットの1つまたは複数の識別子、PPS、ビデオパラメータセットの識別子、VPS、デコーダパラメータセットの識別子、DPS、および、1つまたは複数のシーケンスパラメータセットの1つまたは複数の識別子、SPSのうちの1つまたは複数を備える。複数のパラメータセットは、ビデオパラメータセット、VPS、デコーダパラメータセット、DPS、シーケンスパラメータセット、SPS、1つまたは複数のピクチャパラメータセット、PPS、および1つまたは複数の適応パラメータセット、APSを含む。
【0030】
本願の実施形態によれば、ビデオデコーダは、ビデオデータストリームのアクセスユニット(AU)の1つまたは複数のビデオ符号化ユニット(100)からピクチャを復号することによってビデオデータストリームからビデオを復号し、アクセスユニットAUの開始を形成するようにビデオデータストリーム内に配置されたアクセスユニットデリミタAUDから1つまたは複数のパラメータを読み取る、ように構成され、1つまたは複数のパラメータは、別個のアクセスユニットが、ビデオデータストリームの1つの瞬時に関連するが異なる層に関するピクチャについてビデオデータストリーム内で定義されるかどうか、または、ビデオデータストリームの1つの瞬時に関連するが異なる層に関連するピクチャが、前記アクセスユニットのうちの1つに符号化されるかどうか、を制御し(300)、および/または、ビデオ符号化タイプの指示が1つのアクセスユニット内に互いに異なるビデオ符号化ユニットを含む場合に、ビデオ符号化ユニットの符号化タイプは、1つのアクセスユニット内のビデオ符号化ユニット内に割り当てられるアクセスユニット内に含まれることを示し(302)、および/または、アクセスユニットが他のピクチャによって参照されない、ピクチャを示し(304)、および/または、出力されないピクチャを示す(306)。すなわち、ピクチャを復号するために必要なパラメータがAUDによって示されるので、完全なピクチャを復号するためのすべてのパラメータセットを取得する前に、AUに含まれるピクチャのスライスの復号を開始することができる。すなわち、スライスごとに必要なパラメータセットを効率的にAUDで示すことができるので、復号速度を向上させることができる。
【0031】
本願の実施形態によれば、1つまたは複数のパラメータは、前のAUDによって定義されたパラメータに対する偏差を形成する。AUDは、前のAUDによって定義されたパラメータが採用されるべきかどうかの指示を含む。AUDは、1つまたは複数のパラメータがビデオデータストリームのすべての層に適用されるか、またはその単一層のみに適用されるかの指示を含む。ビデオ符号化ユニットのビデオ符号化タイプは、複数のピクチャのランダムアクセス特性を記述することによって示される。
【0032】
本願の実施形態によれば、ビデオデコーダは、ビデオデータストリームのアクセスユニット(AU)の1つまたは複数のビデオ符号化ユニット(100)からピクチャを復号することによってビデオデータストリームからビデオを復号し、アクセスユニット(AU)の開始を形成するようにデータストリーム内に配置されたアクセスユニットデリミタ(AUD)から1つまたは複数のパラメータ(308)を読み取るように構成され、1つまたは複数のパラメータはアクセスユニットの特性を示し、特性がビデオデータストリームのすべての層に適用されるか、またはその単一層のみに適用されるかを示す。
【0033】
本願の実施形態によれば、復号ピクチャの再構成バージョンを取得するために、ビデオデータストリームのアクセスユニットAU内の1つまたは複数のビデオ符号化ユニット(100)、例えばVCL NALユニットからの動き補償予測および変換ベースの残差復号を使用して、復号ピクチャを再構成することと、ループ内フィルタを使用して、復号ピクチャの再構成バージョンをフィルタリングして、ビデオデコーダの復号ピクチャバッファDPBに挿入される復号ピクチャのバージョンを取得することと、ループ内フィルタにより、復号ピクチャの再構成バージョンをフィルタリングして、ビデオデコーダの復号ピクチャバッファDPBに挿入される復号ピクチャのバージョンを取得することと、ループ内フィルタをパラメータ化することと、を含み、ループ内フィルタをパラメータ化するは、データストリーム順序に沿って1つまたは複数のビデオ符号化ユニット(100)に後続する復号ピクチャの前記アクセスユニットAU内に位置する1つまたは複数のパラメータセット(102、104)例えばALF APSおよびCTU APSごとのALF、および/または、データストリーム順序に沿ってブロックベースの予測パラメータデータおよび予測残差データを搬送する1つまたは複数のビデオ符号化ユニット(100)に含まれるデータ(108)に後続する1つまたは複数のビデオ符号化ユニット(100)の部分(106)、例えばCTUデータごとのALF、からループ内フィルタをパラメータ化するためのループ内フィルタ制御情報を読み取り、ループ内フィルタ制御情報に応じた方法で復号ピクチャの前記再構成バージョンをフィルタリングする、ことにより行われる、方法が提供される。
【0034】
本願の実施形態によれば、ビデオデータストリームのアクセスユニットAU内の1つまたは複数のビデオ符号化ユニット(100)から、1つまたは複数の所定の符号化パラメータを用いてパラメータ化された方法で、復号ピクチャ、例えば現在復号されているピクチャまたは後続の復号ピクチャを復号することによって、ビデオデータストリームからビデオを復号することと、ビデオデータストリームに散在する複数のパラメータセットから所定の符号化パラメータを導出することと、所定の符号化パラメータを含む複数のパラメータセットから所定のパラメータセットを識別するアクセスユニットAUの所定のユニットから識別子(200)を読み取ることと、を含む方法が提供される。
【0035】
本願の実施形態によれば、ビデオデータストリームのアクセスユニットAUの1つまたは複数のビデオ符号化ユニット(100)からピクチャを復号することによって、ビデオデータストリームからビデオを復することと、アクセスユニットAUの開始を形成するように前記ビデオデータストリーム内に配置されたアクセスユニットデリミタAUDから1つまたは複数のパラメータを読み取ることと、を含み、1つまたは複数のパラメータは、別個のアクセスユニットが、ビデオデータストリームの1つの瞬時に関連するが異なる層に関するピクチャについてビデオデータストリーム内で定義されるかどうか、または、ビデオデータストリームの1つの瞬時に関連するが異なる層に関連するピクチャが、アクセスユニットのうちの1つに符号化されるかどうか、を制御し(300)、ビデオ符号化タイプの指示が1つのアクセスユニット内に互いに異なるビデオ符号化ユニットを含む場合に、ビデオ符号化ユニットの符号化タイプは、1つのアクセスユニット内のビデオ符号化ユニット内に割り当てられるアクセスユニット内に含まれることを示し(302)、および/または、アクセスユニットが他のピクチャによって参照されない、ピクチャを示し(304)、および/または、出力されないピクチャを示す(306)、方法が提供される。
【0036】
本願の実施形態によれば、ビデオデータストリームのアクセスユニット(AU)の1つまたは複数のビデオ符号化ユニット(100)からピクチャを復号することによってビデオデータストリームからビデオを復号することと、アクセスユニット(AU)の開始を形成するようにデータストリーム内に配置されたアクセスユニットデリミタ(AUD)から1つまたは複数のパラメータ(308)を読み取ることと、1つまたは複数のパラメータはアクセスユニット(AU)の特性を示し、特性はビデオデータストリームのすべての層に適用されるか、またはその単一層のみに適用されるかを示す、方法が提供される。
【図面の簡単な説明】
【0037】
本願の好ましい実施形態を、図面を参照して以下に説明する。
【
図1】本願の実施形態による階層化ビデオデータストリームを符号化することができるビデオエンコーダの一例として、ビデオを予測符号化するための装置のブロック図を示す。
【
図2】本願の実施形態による階層化ビデオデータストリームを復号することができるビデオデコーダの一例として、
図1の装置に適合する、ビデオを予測復号するための装置のブロック図を示す。
【
図3】それぞれ、予測信号の定義、予測残差信号の扱い等のためのサブディビジョンの設定の可能性を示すために、予測残差信号、予測信号、および再構成信号との関係の一例を示す概略図である。
【
図4】従来技術による符号化プロセスの一例の概略図を示す。
【
図5】本願の実施形態による、デコーダにピクチャをシグナリングするための符号化プロセスの一例の概略図を示す。
【
図6a】本願の実施形態による、アクセスユニットAUの一例の概略図を示す。
【
図6b】本願の実施形態による、アクセスユニットAUの一例の概略図を示す。
【
図7】本願の実施形態による、別のAUの一例の概略図を示す。
【
図8】本願の実施形態による、アクセスユニットデリミタAUDに含まれるパラメータセット識別子IDに関する情報の一例を示す図である。
【
図9】本願の実施形態による、AUDに含まれる所定のパラメータセットに関する情報の一例を示す図である。
【
図10】本願の実施形態による、AUDに含まれる所定のパラメータセットに関する情報の一例を示す図である。
【
図11a】本願の実施形態による、所定の符号化パラメータセット間の関係を示す一例の概略図を示す。
【
図11b】本願の実施形態による、AUのどの部分がどのパラメータセットのどの識別子を示すかを示す一例の概略図を示す。
【
図11c】本願の実施形態による、AUのどの部分がどのパラメータセットのどの識別子を示すかを示す別の一例の概略図を示す。
【
図12a】本願の実施形態による、AUDに含まれるパラメータの一例を示す図である。
【
図12b】本願の実施形態による、AUDに含まれるパラメータの一例を示す図である。
【
図13】本願の実施形態による、AUDに含まれるパラメータの別の一例を示す図である。
【発明を実施するための形態】
【0038】
以下の説明では、同じまたは同等の要素、または同じまたは同等の機能を有する要素は、同じまたは同等の参照符号によって示される。
【0039】
以下の説明では、本願の実施形態のより完全な説明を提供するために、複数の詳細が記載される。しかしながら、本願の実施形態は、これらの特定の詳細なしに実施されてもよいことは当業者には明らかであろう。他の例では本願の実施形態を曖昧にすることを避けるために、周知の構造および装置は詳細にではなく、ブロック図形式で示される。また、特に記述がない限り、以下に説明する異なる実施形態の特徴を組み合わせてもよい。
【0040】
序論
以下では、本明細書で説明される個々の態様が個別に、または組み合わせて使用され得ることに留意されたい。したがって、詳細は、前記態様の他の一つに詳細を追加することなく、前記個々の態様の各々に追加することができる。
【0041】
また、本開示は、ビデオデコーダ(符号化されたリプレゼンテーションに基づいてビデオ信号の復号されたリプレゼンテーションを提供するための装置)において使用可能な特徴を、明示的または暗黙的に説明することに留意されたい。したがって、本明細書で説明する特徴のいずれも、ビデオデコーダのコンテクストで使用することができる。
【0042】
さらに、方法に関連して本明細書で開示される特徴および機能性は、(そのような機能性を実行するように構成された)装置で使用することもできる。さらに、装置に関して本明細書で開示される任意の特徴および機能は、対応する方法で使用することもできる。言い換えれば、本明細書で開示される方法は、装置に関して説明される特徴および機能性のいずれかによって補足され得る。
【0043】
図の以下の説明は、階層化ビデオデータストリームコーデックのための実施形態を組み込むことができる符号化フレームワークの例を形成するために、ビデオのピクチャを符号化するためのブロックベースの予測コーデックのビデオエンコーダおよびビデオデコーダの説明から始まる。ビデオエンコーダおよびビデオデコーダについて、
図1~
図3に関連して説明する。以下、本願の階層化ビデオデータストリームコーデックの概念の実施形態の説明を、そのような概念を
図1および
図2のビデオエンコーダおよびデコーダにそれぞれどのように組み込むことができるかについての説明と共に提示するが、以下に説明する実施形態は
図1および
図2のビデオエンコーダおよびビデオデコーダの基礎をなす符号化フレームワークにしたがって動作しないビデオエンコーダおよびビデオデコーダを形成するために使用することもできる。
【0044】
図1は、本願の実施形態による、インター予測ブロックの動き補償予測を実施することができるビデオデコーダの一例として、ビデオを予測符号化するための装置のブロック図を示す。すなわち、
図1は、一連のピクチャ12からなるビデオ11をデータストリーム14に予測符号化する装置を示す。この目的のために、ブロック単位の予測符号化が使用される。さらに、変換ベースの残差符号化が例示的に使用される。装置、すなわちエンコーダは、参照符号10を用いて示される。
【0045】
図2は、本願の実施形態による、インター予測ブロックの動き補償予測を実施することができるビデオデコーダの一例として、ビデオを予測復号するための装置のブロック図を示す。すなわち、
図2は、対応するデコーダ20、すなわち、データストリーム14からのピクチャブロック内のピクチャ12’から構成されるビデオ11’を、ここでも例示的に変換ベースの残差復号を使用して予測復号するように構成された装置20を示し、アポストロフィは、デコーダ20によって再構成されたピクチャ12’およびビデオ11’がそれぞれ、予測残差信号の量子化によって導入された符号化損失に関して装置10によって元々符号化ピクチャ12から逸脱することを示すために使用されている。
図1および
図2は例示的に、変換ベースの予測残差符号化を使用するが、本願の実施形態はこの種の予測残差符号化に限定されない。これは、以下に概説されるように、
図1および
図2に関して説明される他の詳細についても当てはまる。
【0046】
エンコーダ10は、予測残差信号を空間スペクトル変換(spatial-to-spectral transformation)にかけ、このようにして得られた予測残差信号をデータストリーム14に符号化するように構成される。同様に、デコーダ20は、データストリーム14からの予測残差信号を復号し、このようにして得られた予測残差信号をスペクトル空間変換(spectral-to-spatial transformation)に供するように構成される。
【0047】
内部的には、エンコーダ10は、オリジナル信号、すなわちビデオ11または現在のピクチャ12からの予測信号26の偏差を測定するように予測残差24を生成する予測残差信号フォーマ22を備えることができる。予測残差信号形成器22は例えば、元の信号、すなわち現在のピクチャ12から予測信号を減算する減算器とすることができる。次いで、エンコーダ10は、予測残差信号24を空間スペクトル変換にかけ、次にエンコーダ10によって構成される量子化器32によって量子化されるスペクトル領域予測(spectral-domain prediction)残差信号24’を得るトランスフォーマ28をさらに備える。このように量子化された予測残差信号24’’は、データストリーム14に符号化される。この目的のために、エンコーダ10は任意にエントロピーコーダ34を含み、エントロピーコーダは予測残差信号を変換されてデータストリーム14に量子化されるようにエントロピー符号化する。データストリーム14におよびデータストリーム14から復号される予測残差信号24’’に基づいて、エンコーダ10の予測ステージ36によって予測残差26が生成される。この目的のために、予測ステージ36は、量子化損失を除く信号24’に対応するスペクトル領域予測残差信号24’’’を獲得するように予測残差信号24’’を逆量子化する逆量子化器38を内部に備えてもよく、その後、後者の予測残差信号24’’を逆変換、すなわちスペクトル空間変換にかける逆変換器40を備えて、量子化損失を除く元の予測残差信号24に対応する予測残差信号24’’’’を獲得してもよい。予測ステージ36の合成器42は次いで、再構成信号46a、すなわち元の信号12の再構成(再構成バージョン)を獲得するように、予測信号26と予測残差信号24’’’’とを加算するなどして再結合する。再構成された信号46aは、信号12’に対応してもよい。
【0048】
ループ内フィルタ90は再構成された信号46aをフィルタリングして、復号ピクチャのバージョン、例えば、現在復号されているピクチャまたは後続の復号ピクチャの復号された信号46bを取得し、復号されたピクチャバッファDPB92に挿入する。
【0049】
次いで、予測ステージ36の予測モジュール44は例えば、空間予測、すなわちイントラ予測、および/または時間予測、すなわちインター予測を使用することによって、信号46bに基づいて予測信号26を生成する。この点に関する詳細は、以下に記載される。
【0050】
デコーダ20は、エントロピーデコーダ50と、逆量子化器52と、逆トランスフォーマ54と、コンバイナ56と、予測モジュール58と、ループ内フィルタ90と、DPB 94と、を含む復号コア94を含む。
【0051】
同様に、デコーダ20は予測ステージ36に対応し、それに対応する方法で相互接続された構成要素から内部的に構成されてもよい。特に、デコーダ20のエントロピーデコーダ50は、データストリームから量子化されたスペクトル領域予測残差信号24’’をエントロピー復号することができ、そこで、逆量子化器52、逆トランス54、コンバイナ56および予測モジュール58は予測ステージ36のモジュールに関して上述した方法で相互接続され、協働することにより、予測残差信号24’’に基づいて再構成された信号を回復し、それにより、
図3に示すように、コンバイナ56の出力は、再構成された信号、すなわちビデオ11’またはその現在のピクチャ12’をもたらす。
【0052】
具体的に上述したわけではないが、エンコーダ10は、例えば、ある種のレートおよび歪み関連基準、すなわち符号化コストを最適化する方法、および/または何らかのレート制御を使用する方法等の何らかの最適化スキームにしたがって、例えば予測モード、運動パラメータ等を含むいくつかの符号化パラメータを設定することができることは容易に明らかである。以下でより詳細に説明するように、エンコーダ10およびデコーダ20ならびに対応するモジュール44、58は、それぞれ、ピクチャブロックの予測が以下でより詳細に説明する方法で構成される一種のプリミティブ予測モードのセットまたはプールを形成するイントラ符号化モードおよびインター符号化モードなどの異なる予測モードをサポートする。エンコーダとデコーダがこれらの予測合成の間で切り替わる粒度は、ピクチャ12と12’のそれぞれのブロックへの細分化に対応する。これらのブロックのうちのいくつかは単にイントラ符号化されているブロックであってもよく、いくつかのブロックは単にインター符号化されているブロックであってもよく、任意選択で、さらなるブロックはイントラ符号化およびインター符号化の両方を使用して取得されてもよいが、詳細は以下で説明されることに留意されたい。イントラ符号化モードにしたがって、ブロックに対する予測信号を、それぞれのブロックの空間的、既に符号化/復号された近傍に基づいて取得する。幾つかのイントラ符号化サブモードが存在してもよく、その中で、ある種のイントラ予測パラメータを表す。それぞれのブロックに対する予測信号が、それぞれの方向性イントラ符号化サブモードに対して特定されるある方向に沿って近傍のサンプル値をそれぞれのブロックに外挿することによって埋められる、方向または角度イントラ符号化サブモードが存在してもよい。イントラ符号化サブモードは例えば、それぞれのブロックの予測信号がそれぞれのブロック内のすべてのサンプルにDC値を割り当てるDC符号化モード、および/または、それぞれのブロックの予測信号がそれぞれのブロックのサンプル位置にわたる2次元線形関数によって記述されるサンプル値の空間分布であると近似または決定され、隣接するサンプルに基づいて2次元線形関数によって定義される平面の傾斜およびオフセットを導出するプラナーイントラ符号化モードなど、1つまたは複数のさらなるサブモードを備えることもできる。これと比較すると、インター予測モードによれば、例えば、ブロック内部を時間的に予測することによって、ブロックに対する予測信号を得ることができる。インター予測モードのパラメータ化のために、動きベクトルは、データストリーム内でシグナリングされてもよく、動きベクトルはそれぞれのブロックのための予測信号を得るために、以前に符号化/復号ピクチャがサンプリングされるビデオ11の以前に符号化ピクチャの部分の空間変位を示す。これは、量子化されたスペクトル領域予測残差信号24’’を表すエントロピー符号化変換係数レベルのような、データストリーム14によって構成される残差信号符号化に加えて、データストリーム14が、ブロック予測モードに割り当てるための予測関連パラメータ、インター予測モードのための動きパラメータのような割り当てられた予測モードのための予測パラメータ、および、任意選択的に、さらに詳細に後述するように、割り当てられた予測モードおよび予測パラメータを使用してブロックに対する最終予測信号の構成を制御するさらなるパラメータに符号化されてもよい、ということを意味する。追加的に、データストリームは、ピクチャ12および12’の細分化をそれぞれブロックに制御し、シグナリングするパラメータを含むことができる。デコーダ20はこれらのパラメータを使用して、エンコーダが行ったのと同様の方法でピクチャを細分化し、同じ予測モードおよびパラメータをブロックに割り当て、同じ予測信号を得られるように同じ予測を行う。
【0053】
図3は、予測残差信号と、予測信号と、再構成信号との関係の一例を示す模式図であって、それぞれ、予測信号を規定する細区分の設定、予測残差信号の扱い等の可能性を示すものを示す。すなわち、
図3は、再構成された信号、すなわち再構成されたピクチャ12’と、一方ではデータストリームにシグナル化されたような予測残差信号24’’’’との関係、他方では予測信号26との間の関係を示す。既に上述したように、組み合わせは、追加であってもよい。予測信号26は、単に一例に過ぎないが、ピクチャ領域を様々なサイズのブロック80に細分化したものである。細分化は、ピクチャ領域をブロックの行および列に規則的に細分化するような任意の細分化であってもよいし、ピクチャ12を様々なサイズのリーフブロック、例えばクワッドツリー細分化等に細分化するマルチツリー細分化であってもよく、ピクチャ領域が最初にツリールートブロックの行および列に細分化され、次いで再帰的マルチツリー細分化にしたがってさらに細分化されてブロック80になるそれらの混合であってもよい。
【0054】
以下、本発明の各側面について説明する。
【0055】
サフィックス(Suffix)-APS
本願の本発明の一態様によれば、エンコーダは、依然としてスライスを使用しながら、ピクチャ全体の符号化処理を終了する前に、ピクチャの一部(例えばスライス)の送信を開始することを可能にする。これは、アダプテーションパラメータセット(APS)が実際のスライスデータの背後にあるCTU(Coding Tree Unit)ALFパラメータごとに移動するピクチャの符号化されたスライスの後に送信されることを可能にすることによって達成される。
【0056】
図4に最先端のエンコーダの図を示す。まずピクチャ全体を符号化し(イントラ予測、動き推定、残差符号化など)、次にALF推定処理を開始する。ALFフィルタ係数はAPSに書き込まれ、次いで、スライスデータは(他のパラメータが点在する)CTUパラメータごとのALFを含んで書き込まれることができる。ピクチャは、ALF符号化が終了した後にのみ送信することができる。
【0057】
図5は、本発明によって想定される低遅延エンコーダの一例を示す。ピクチャ符号化処理が終了する前に、スライスを送出することができる。特に、係数を運ぶAPSは、スライスデータ(VCL NAL単位)の後ろに移動される。
【0058】
このプロセスでは、エンコーダは推定されたALFパラメータ(フィルタ係数、フィルタ制御情報)を収集し、次いで、符号化ピクチャの後にALFパラメータを含むAPSを収集しながら、ピクチャの符号化されたスライスを最初に送出することができる。デコーダは、ピクチャのスライスが到着するとすぐに、ピクチャのスライスのシンタックス解析および復号を開始することができる。ALFは最後の復号ステップの1つであるため、ALFパラメータは、他の復号ステップの後に適用される符号化ピクチャの後に到着することができる。
【0059】
本発明は、以下の態様を含む。
-APSが前のピクチャに属することを示すAPSタイプ。
-APSタイプは、シンタックス要素で符号化される。実施形態は以下の通りである。
〇NALユニットヘッダに符号化された新しいNALユニットタイプ(例えば、サフィックスAPS)。
〇APSで符号化された新しいAPSタイプ(例えば、サフィックスALF APS)。
〇APSが前のピクチャに適用されるか、後続のピクチャに適用されるかを示すフラグ。
-サフィックスAPSではなく、シグナリングされたプレフィックスAPSによって、新しいアクセスユニットAUの開始を仮定するだけである、復号プロセスの変更。
-代替的に、APSタイプ(プレフィックスまたはサフィックス)は、周囲のアクセスユニットデリミタ(AUD)およびピクチャの符号化スライスに対するビットストリーム内の相対位置によって決定され得る。
〇APSがピクチャの最後のVCL NALユニットとAUDとの間に位置する場合、それは前のピクチャに適用される。
〇APSがAUDとピクチャの最初のVCL NALユニットとの間に位置する場合、それは次のピクチャに適用される。
-この場合、デコーダは、AUDの位置によって新しいアクセスユニットの開始を決定するだけでよい。
-一実施形態では、スライスヘッダはプレフィックスAPSの代わりにサフィックスAPSが使用されることを示し、その結果、依存性はピクチャの復号プロセスの最後に、例えば、次式によって解決される。
〇そのプレフィックスまたはサフィックス特性に応じて、スライスヘッダ内の位置でAPS識別子をシグナリングする。
〇参照されるAPSがビットストリーム順序でコード化されたスライスに従うことを示すフラグをシグナリングする。
【0060】
典型的には、ALFパラメータ(フィルタ係数)の導出が(再構成されたサンプル値に基づいて)符号化プロセスの最後に向かって実行されるだけでなく、さらなるALF制御情報(符号化ツリーユニットCTUがフィルタリングされるかどうか、およびどのようにフィルタリングされるかに関する情報)も、このステージで導出される。ALF制御情報はスライスペイロード内のcoding_tree_unitごとにいくつかのシンタックス要素で搬送され、ブロック分割(例えば、
図6bに示すような)、変換係数などが散在する。例えば、以下のシンタックス要素が存在することがある。
〇alf_ctb_flag:アダプティブループフィルタを符号化ツリーブロックCTBに適用するかどうかを指定する。
〇alf_ctb_use_first_APS_flag:adaptive_parameter_set_idがslice_alf_APS_id_luma[0]に等しいAPSのフィルタ情報を使用するかどうかを指定する。
〇alf_use_APS_flag:APSからのフィルタセットをルマCTBに適用するかどうかを指定する。
〇その他。
【0061】
すべてのこのALF制御情報は、ピクチャの符号化プロセスの最後に向かうALFのフィルタパラメータの導出に依存する。
【0062】
一実施形態では、ALF制御情報は、ALFが実行される前に、エンコーダがスライスペイロードの最初の部分(変換係数、ブロック構造など)を最終決定できるように、それぞれのスライスペイロードの最後にあるスライスのCTUにわたって、別個のループでシグナリングされる。この実施形態を
図6aおよび
図6bに示す。
【0063】
図6aに示すように、ビデオ符号化ユニット(VCL NALユニット)100は、スライスヘッダ、スライスデータ108、および部分(CUT APSごとのALF)106を含み、1つまたは複数のパラメータセット(ALF係数)102は別々に、すなわち、(非VCL-NALユニット内の)サフィックスAPSとしてシグナリングされる。すなわち、各ビデオ符号化ユニット100は、データストリーム順序に沿って、データを横切って部分の最後まで連続的に算術符号化される。
【0064】
図6bは、部分106にスライスデータ108が点在していることを示している。すなわち、CUT APSごとのALFはブロックに点在し、1つまたは複数のパラメータセット102は、サフィックスAPSとして別々にシグナリングされる。
【0065】
別の実施形態では、スライスヘッダは、ALF制御情報が符号化スライスペイロード内のシンタックス要素、すなわち上述のCTUループ内に示されないが、ALF制御情報がサフィックスAPS内に、すなわち、例えばサフィックスAPSタイプであるAPSを参照して、それぞれのサフィックスAPS内のすべてのCTUにわたる別個のループ内に含まれることを示すことになる。
【0066】
別の実施形態では、スライスヘッダは、ALF制御情報が符号化スライスペイロード内のシンタックス要素、すなわち上述のCTUループ内に示されないが、ALF制御情報がALF係数を搬送するサフィックスAPSとは異なる新しいタイプのサフィックスAPSに、すなわち、例えばサフィックスAPSタイプであるAPSを参照して、それぞれの参照APS内のすべてのCTUにわたって別個のループに含まれることを示すことになる。CTUごとのデータは、任意選択でCABAC符号化することができる。この実施形態を
図7に示す。
【0067】
図7に示すように、データユニットは、データストリーム順序で、スライスヘッダおよびスライスデータ108を含むビデオ符号化ユニット(VCL NALユニット)100、パラメータセット104(Suffix ALF CTU-data APS:非VCL NALユニット)、さらなるビデオ符号化ユニット100、さらなるパラメータセット104、およびパラメータセット(フィルタ制御情報)102(Suffix ALF係数APS:非VCL NALユニット)でシグナリングされる。すなわち、
図6aおよび6bに示すデータストリームとは逆であり、フィルタ係数は、すべてのビデオ符号化ユニットに続いてシグナリングされる必要はない。言い換えれば、フィルタ係数は、ビットストリーム順に2つ以上のビデオ符号化ユニット100のために集合的に送信されてもよく、またはビットストリーム順にフィルタ係数に続くさらなるビデオ符号化ユニットによってさらに使用されてもよい。
【0068】
別の実施形態では、サフィックスAPSおよびすべてのCTUを参照するスライスヘッダは、サフィックスAPSでシグナリングされるフィルタパラメータおよびALF制御情報のデフォルト値を適用される適応ループフィルタを有すると推測される。
【0069】
AUDにおけるパラメータセットIDの参照のシグナリング
以下、本発明の他の態様、すなわち、ピクチャ内で参照されるすべてのパラメータセットのリストへのアクセスを容易にする方法について説明する。
【0070】
本願の本発明のこの態様によれば、デコーダは、デコードを開始する前に、すべての必要なパラメータセットが利用可能であるかどうかを容易に決定することができる。
-使用されるすべてのパラメータセットのリストは、高レベルシンタックス構造に含まれる。
-リストは以下より構成される。
〇1つのVPS(ビデオパラメータセット)
〇1つのDPS(デコーダパラメータセット)
〇一つ以上のSPS(シーケンスパラメータセット)
〇一つ以上のPPS(ピクチャパラメータセット)
〇1つ以上のAPS(アダプテーションパラメータセット)(APSタイプによって順序付けられる)
-任意選択で、各リストの前に1つまたは複数のシンタックス要素が存在し、どのパラメータセットタイプがリスト(送信を無効にするオプションを含む)であるかを示す。
-情報を保持するシンタックス構造は、アクセスユニットデリミタ(AUD)に含まれる。
【0071】
シンタックスの一例が
図8に示されており、すなわち、所定のユニット、すなわち、AUDには、複数の識別子200が含まれている。たとえば、VPSの識別子「aud_vps_id」、DPSの識別子「aud_dps_id」、SPSの識別子「aud_sps_id」、PPSの識別子「aud_pps_id」などである。
【0072】
AUD内のみのAPS IDのシグナリング
APSは、ピクチャの各スライスによって参照される。ビットストリームを組み合わせる場合、異なるAPSの書き換えおよび/または組み合わせが必要になることがある。
【0073】
スライスヘッダの書き換えを回避するために、APS IDはスライスヘッダではなくアクセスユニットデリミタでシグナリングされる。したがって、変更の場合、スライスヘッダを書き換える必要はない。アクセスユニットデリミタを書き換えることは、はるかに容易な操作である。
【0074】
【0075】
別の実施形態では、APS IDは、別のシンタックス要素を条件とするAUDにおいてのみ送信される。シンタックス要素で、APS IDがAUDに存在しないことが示されている場合、APS IDはスライスヘッダに存在する。シンタックスの例を
図10に示す。すなわち、
図10に示すように、AUDは、フラグ204、例えばシンタックス「aps_ids_in_aud_enabled_flag」を含む。
【0076】
図11a~
図11cは、
図8~
図10に示した上記実施形態に係る所定の符号化パラメータとAUとの関係を示す例の概略図である。
【0077】
図11aに示すように、複数のパラメータセット120は、例えばAPAおよびPPSを含む1つまたは複数の第1の所定のパラメータセット126と、例えばSPS、DPSおよびVPSを含む1つまたは複数の第2の所定のパラメータセット128とを含む。第2の所定のパラメータセット128は、第1の所定のパラメータセット126よりも高い階層レベルに属する。
図11aに示すように、AUは、複数のスライスデータ、例えば、VCL0~VCLnを含み、第1および第2の所定のパラメータセットは、所定のパラメータセット122、例えば、VCL0用のパラメータセットに含まれる。
【0078】
複数のパラメータセット120は、AUのAUDに格納され、デコーダにシグナリングされる。
【0079】
図11bに示すように、フラグ204がAUDに含まれる場合、フラグ204は、特定の所定のパラメータセット126bを参照する識別子200の所定の識別子が所定のユニット124に存在するか、または特定の所定のパラメータセット126bを参照する所定の識別子が1つまたは複数のビデオ符号化ユニット100に存在するかどうかを示す(205)。すなわち、フラグ204は、APS126bがAUDにあるかVLCにあるかを(
図11bに矢印で示されるように)示す。
【0080】
図11cに示すように、第1の所定のパラメータセット126は、1つまたは複数のビデオ符号化ユニット100(たとえばAU)内の識別子によって参照される第3の所定のパラメータセット126a、たとえばPPSと、所定のユニット124(たとえばAUD)内に存在する(
図8および
図9に示す)識別子200によって参照されるが、1つまたは複数のビデオ符号化ユニット100(AU)内の識別子のいずれによっても参照されず、所定のパラメータセットのいずれによっても参照されない第4の所定のパラメータセット126b、たとえばAPSと、を含む。
【0081】
AUDへのアクセスユニット特性のシグナリング
現在、AUDは、以下のスライスがタイプI、B、またはPであるかどうかを示している。ほとんどのシステムでは、この機能が、Iピクチャが必ずしもランダムアクセスポイントがあることを意味しないため、あまり有用ではない。ドロップする必要がある場合のAUの優先順位付けは、通常、テンポラルIDの解析、(他から参照されていない)破棄可能なピクチャであるかどうかの解析など、他の方法で行うことができる。
【0082】
ピクチャタイプを示す代わりに、NALユニットタイプ、並びにそれらが廃棄可能なピクチャであるかどうか等を示すことができる。さらに、多層の場合には、特性を記述することがより困難になる可能性がある。
〇NALユニットヘッダ内で指定するもの代わりに、アクセスユニット内のすべてのVCL NALユニットに対して使用される全体的なNALユニットタイプ(例えば、IDR、CRAなど)によって指定される、ピクチャのランダムアクセス特性。
〇層内のピクチャはある層では破棄できるが、別の層ではコロケーションされたピクチャではない。
〇層内のピクチャは、ある層では出力なし(pic_output_flag)としてマークされ、別の層ではコロケーションされたピクチャではない。
【0083】
したがって、
図12aに示す実施形態では、AUDは、情報が単一層に適用されるか、またはすべての層に適用されるかを示す。つまり、AUDフラグでは、例えば以下に示すように、AU特性に関する情報を参照する。
【0084】
「layer_specific_aud_flag」300:ビデオデータストリームの瞬時ではあるが異なる層に関連するピクチャのために、別々のアクセスユニットがビデオデータストリームで定義されているか、またはビデオデータストリームの瞬時ではあるが異なる層に関連するピクチャがアクセスユニットの一方に符号化されているか、を制御する、および/または、
「nal_unit_type_present_flag」302:ビデオ符号化タイプ指示の場合、1つのアクセスユニット内のビデオ符号化ユニットに割り当てられる、アクセスユニット内のビデオ符号化ユニットのビデオ符号化タイプを示し、1つのアクセスユニット内に含まれるビデオ符号化ユニットは互いに異なり、すなわち、NALユニットタイプのシンタックス要素の存在を示すことによって、NALユニットタイプを示す、および/または
「discardable_flag」304:アクセスユニットがいかなる他のピクチャによって参照されていないピクチャを示す、および/または、
「pic_output_flag」306:出力しないピクチャを示す。別の実施形態では、AUDは、AUDが従属AUDであることを示すことができる。これは、下記を意味する。
〇従属層の前のAUDからパラメータを継承するが、ある層特有の情報を追加する、および/または、
〇新しいAUは始まっていない。
【0085】
図12bはAUDにおける指示を示し、すなわち、ビデオ符号化ユニットのビデオ符号化タイプは、複数のピクチャのランダムアクセス特性を記述することによって示される。すなわち、シンタックス「random_access_info_present_flag」は、NALユニットヘッダ内で指定される代わりに、アクセスユニット内のすべてのVCL NALユニットに使用される全体的なNALユニットタイプ(例えばIDR、CRAなど)によって指定される、
図12bにおいて「all_pics_in_au_random_access_flag」で示すように、ピクチャのランダムアクセス特性を示す。
【0086】
本発明の一実施形態によるシンタックスの例を
図13に示す。
【0087】
この例では、パラメータセット308、すなわち、AUD内の情報がすべての層に適用されるかどうかを示す実装「layer_specific_aud_flag」、AUDが新しいグローバルアクセスユニットを開始するかどうかを示す「dependent_aud_flag」、または「layer-accessユニット」のみであるかどうかを示す。従属AUDでは、基本層AUDからの継承は「aud_inheritance_flag」によって示される。
【0088】
いくつかの態様を装置の文脈で説明したが、これらの態様は、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応する、対応する方法の説明も表すことは明らかである。同様に、方法ステップの文脈で説明される態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部または全部は、例えば、マイクロプロセッサ、プログラマブルコンピュータ、または電子回路などのハードウェア装置によって(またはそれを使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの1つまたは複数を、そのような装置によって実行することができる。
【0089】
本発明のデータストリームは、デジタル記憶媒体に記憶することができ、または無線伝送媒体のような伝送媒体やインターネットのような有線伝送媒体に伝送することができる。
【0090】
特定の実施要件に応じて、本願の実施形態は、ハードウェアまたはソフトウェアで実施することができる。この実装は、デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ(登録商標)、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行することができ、これらは、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または協働することができる)電子的に読み取り可能な制御信号が記憶されている。したがって、デジタル記憶媒体は、コンピュータ読み取り可能であってもよい。
【0091】
本発明によるいくつかの実施形態は、本明細書で説明される方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる、電子的に読み取り可能な制御信号を有するデータキャリアを備える。
【0092】
一般に、本願の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法のうちの1つを実行するように動作可能である。プログラムコードは例えば、機械読み取り可能キャリア上に記憶されてもよい。
【0093】
他の実施形態は、機械読み取り可能キャリアに格納された、本明細書に記載された方法のうちの1つを実行するためのコンピュータプログラムを備える。
【0094】
換言すれば、本発明の方法の一実施形態はしたがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書で説明される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0095】
したがって、本発明の方法のさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムをその上に記録して備える、データキャリア(またはデジタル記憶媒体、またはコンピュータ読み取り可能媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、典型的には有形および/または非一時的である。
【0096】
したがって、本発明の方法のさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは例えば、データ通信接続を介して、例えばインターネットを介して転送されるように構成されてもよい。
【0097】
さらなる実施形態は、本明細書で説明される方法のうちの1つを実行するように構成された、または適合された、処理手段、例えば、コンピュータ、またはプログラマブル論理装置を備える。
【0098】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0099】
本発明によるさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムを受信器に(例えば、電子的または光学的に)転送するように構成された装置またはシステムを備える。受信器は例えば、コンピュータ、モバイル装置、メモリ装置等であってもよい。装置またはシステムは例えば、コンピュータプログラムを受信器に転送するためのファイルサーバを含むことができる。
【0100】
いくつかの実施形態では、プログラマブル論理装置(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書で説明される方法の機能のいくつかまたはすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイが、本明細書で説明される方法のうちの1つを実行するために、マイクロプロセッサと協働することができる。一般に、方法は、好ましくは任意のハードウェア装置によって実行される。
【0101】
本明細書で説明される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組合せを使用して実装され得る。
【0102】
本明細書で説明される装置、または本明細書で説明される装置の任意の構成要素は、ハードウェアおよび/またはソフトウェアで少なくとも部分的に実装され得る。