(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-02
(45)【発行日】2024-12-10
(54)【発明の名称】ビデオ・コーディングにおける低周波ノン・セパラブル変換シグナリング
(51)【国際特許分類】
H04N 19/70 20140101AFI20241203BHJP
【FI】
H04N19/70
【外国語出願】
(21)【出願番号】P 2023189325
(22)【出願日】2023-11-06
(62)【分割の表示】P 2022552756の分割
【原出願日】2021-03-03
【審査請求日】2023-11-07
(32)【優先日】2020-03-03
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ワン,イェ-クイ
(72)【発明者】
【氏名】ザン,リー
(72)【発明者】
【氏名】ザン,カイ
【審査官】岩井 健二
(56)【参考文献】
【文献】Adarsh K. Ramasubramonian, et al.,AHG15: Scaling matrices for LFNST-coded blocks,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0365-v2,16th Meeting: Geneva, CH,2019年10月,pp.1-4
【文献】Jonatan Samuelsson, Sachin Deshpande, and Andrew Segall,AHG9: On Slice Header,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-Q0346,17th Meeting: Brussels, BE,2019年12月,pp.1-2
【文献】Ye-Kui Wang, Li Zhang, and Kai Zhang,AHG9: Signalling of scaling list control,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-R0064-v1,18th Meeting: by teleconference,2020年04月,pp.1-4
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
ビデオのビデオ・ブロックと前記ビデオのビットストリームとの間の変換を実行するステップを含むビデオ処理方法であって、
前記ビデオ・ブロックは前記変換に低周波ノン・セパラブル変換を使用しており、
前記ビットストリームは、第1のシンタックス要素は前記ビットストリームに関するシンタックス・レベルで含まれることを規定しているフォーマット・ルールに従っており、
前記第1のシンタックス要素は、明示的なスケーリング・マトリクスが、前記低周波ノン・セパラブル変換でコーディングされたブロックに関してイネーブルにされているかどうかを示しており、
前記フォーマット・ルールは、変換係数又は非-変換係数に適用されるスケーリング・プロセスを制御するために、第3のシンタックス要素が前記ビットストリームのスライス・ヘッダに含まれることを更に規定しており、
前記第1のシンタックス要素がシーケンス・パラメータ・セット(SPS)に含まれるかどうかは、前記SPSに含まれる第2のシンタックス要素の値に依存しており、前記第1のシンタックス要素はsps_scaling_matrix_for_lfnst_disabled_flagであり、前記第2のシンタックス要素はsps_lfnst_enabled_flagである、方法。
【請求項2】
請求項1に記載の方法において、前記第1のシンタックス要素は、前記低周波ノン・セパラブル変換がイネーブルにされているかどうかに基づいて、前記SPSに含まれる、方法。
【請求項3】
請求項1又は2に記載の方法において、前記SPSに含まれる前記第2のシンタックス要素の値が1に等しい場合、前記第1のシンタックス要素は前記SPSに含まれ、前記第2のシンタックス要素の値が1に等しいことは、前記低周波ノン・セパラブル変換がイネーブルにされていることを示す、方法。
【請求項4】
請求項1-3のうち何れか一項に記載の方法において、更に:
前記低周波ノン・セパラブル変換が前記ビデオ・ブロックに関してイネーブルにされているかどうか、及び前記第1のシンタックス要素の値に基づいて、前記ビデオ・ブロックに、デフォルト・スケーリング・マトリクス又は前記明示的なスケーリング・マトリクスのうちの或る明示的なスケーリング・マトリクスを適用するかどうかを決定するステップを更に含む方法。
【請求項5】
請求項4に記載の方法において、前記第1のシンタックス要素の値が1に等しい場合であって、前記低周波ノン・セパラブル変換でコーディングされたブロックに対する前記明示的なスケーリング・マトリクスの使用がディセーブルにされ、且つ前記低周波ノン・セパラブル変換が前記ビデオ・ブロックに対してイネーブルにされることを示している場合、前記デフォルト・スケーリング・マトリクスが前記ビデオ・ブロックに適用される、方法。
【請求項6】
請求項5に記載の方法において、前記デフォルト・スケーリング・マトリクスのスケーリング因子は16に等しい、方法。
【請求項7】
請求項1-6のうちの何れか1項に記載の方法において、前記変換を実行するステップは前記ビデオを前記ビットストリームにエンコードするステップを含む、方法。
【請求項8】
請求項1-6のうちの何れか1項に記載の方法において、前記変換を実行するステップは前記ビデオを前記ビットストリームからデコードするステップを含む、方法。
【請求項9】
プロセッサと、命令を伴う非一時的なメモリとを含むビデオ・データを処理する装置であって、前記命令は、前記プロセッサにより実行されると、前記プロセッサに:
ビデオのビデオ・ブロックと前記ビデオのビットストリームとの間の変換を実行させ、
前記ビデオ・ブロックは前記変換に低周波ノン・セパラブル変換を使用しており、
前記ビットストリームは、第1のシンタックス要素は前記ビットストリームに関するシンタックス・レベルで含まれることを規定しているフォーマット・ルールに従っており、
前記第1のシンタックス要素は、明示的なスケーリング・マトリクスが、前記低周波ノン・セパラブル変換でコーディングされたブロックに関してイネーブルにされているかどうかを示しており、
前記フォーマット・ルールは、変換係数又は非-変換係数に適用されるスケーリング・プロセスを制御するために、第3のシンタックス要素が前記ビットストリームのスライス・ヘッダに含まれることを更に規定しており、
前記第1のシンタックス要素がシーケンス・パラメータ・セット(SPS)に含まれるかどうかは、前記SPSに含まれる第2のシンタックス要素の値に依存しており、前記第1のシンタックス要素はsps_scaling_matrix_for_lfnst_disabled_flagであり、前記第2のシンタックス要素はsps_lfnst_enabled_flagである、装置。
【請求項10】
命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体であって、前記命令は、プロセッサに:
ビデオのビデオ・ブロックと前記ビデオのビットストリームとの間の変換を実行させ、
前記ビデオ・ブロックは前記変換に低周波ノン・セパラブル変換を使用しており、
前記ビットストリームは、第1のシンタックス要素は前記ビットストリームに関するシンタックス・レベルで含まれることを規定しているフォーマット・ルールに従っており、
前記第1のシンタックス要素は、明示的なスケーリング・マトリクスが、前記低周波ノン・セパラブル変換でコーディングされたブロックに関してイネーブルにされているかどうかを示しており、
前記フォーマット・ルールは、変換係数又は非-変換係数に適用されるスケーリング・プロセスを制御するために、第3のシンタックス要素が前記ビットストリームのスライス・ヘッダに含まれることを更に規定しており、
前記第1のシンタックス要素がシーケンス・パラメータ・セット(SPS)に含まれるかどうかは、前記SPSに含まれる第2のシンタックス要素の値に依存しており、前記第1のシンタックス要素はsps_scaling_matrix_for_lfnst_disabled_flagであり、前記第2のシンタックス要素はsps_lfnst_enabled_flagである、記憶媒体。
【請求項11】
ビデオのビットストリームを記憶する
方法であっ
て:
前記ビデオのビットストリームを前記ビデオのビデオ・ブロックから生成するステップ
;及び
前記ビットストリームを、非一時的なコンピュータ読み取り可能な記憶媒体に記憶するステップ;
を含み、前記ビデオ・ブロックは前記ビットストリームを生成するために低周波ノン・セパラブル変換を使用しており、
前記ビットストリームは、第1のシンタックス要素は前記ビットストリームに関するシンタックス・レベルで含まれることを規定しているフォーマット・ルールに従っており、
前記第1のシンタックス要素は、明示的なスケーリング・マトリクスが、前記低周波ノン・セパラブル変換でコーディングされたブロックに関してイネーブルにされているかどうかを示しており、
前記フォーマット・ルールは、変換係数又は非-変換係数に適用されるスケーリング・プロセスを制御するために、第3のシンタックス要素が前記ビットストリームのスライス・ヘッダに含まれることを更に規定しており、
前記第1のシンタックス要素がシーケンス・パラメータ・セット(SPS)に含まれるかどうかは、前記SPSに含まれる第2のシンタックス要素の値に依存しており、前記第1のシンタックス要素はsps_scaling_matrix_for_lfnst_disabled_flagであり、前記第2のシンタックス要素はsps_lfnst_enabled_flagである、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
[0001] 関連出願の相互参照
パリ条約の下で適用可能な特許法及び/又は規則に基づいて、本件は2020年3月3日付で出願された米国仮特許出願第62/984,658号に対する優先権及び利益を適時に主張するように行われている。法に基づく全ての目的に関し、前述の出願の開示全体は、本件の開示の一部として参照により援用される。
【0002】
[0002] 技術分野
本件特許出願は画像及びビデオのコーディング及びデコーディングに関連する。
【背景技術】
【0003】
[0003] デジタル・ビデオは、インターネット及びその他のデジタル通信ネットワークにおいて利用する最大の帯域幅を占める。映像を受信及び表示することが可能な接続ユーザー・デバイスの台数が増加するにつれて、デジタル・ビデオの利用のための帯域幅需要は増加し続けるであろうということが予想される。
【発明の概要】
【0004】
[0004] 本明細書は、コーディングされた表現のデコーディングに有用な制御情報を使用して、ビデオのコーディングされた表現を処理するためのビデオ・エンコーダ及び・デコーダによって使用されることが可能な技術を開示する。
【0005】
[0005] 例示的な一態様では、ビデオ処理方法が開示される。本方法は、ビデオのビデオ・ブロックとビデオのビットストリームとの間の変換を実行することを含み、ビットストリームはフォーマット・ルールに準拠し、フォーマット・ルールは、ビデオ・ブロックの変換係数又は非変換係数にスケーリング・プロセスが適用されるか否かを示すビデオ領域レベルで、第1のシンタックス要素がビットストリームに含まれることを規定しており、ビデオ領域はビデオのビデオ・ピクチャよりも小さい。
【0006】
[0006] 例示的な別の態様では、ビデオ処理方法が開示される。本方法は、ビデオのビデオ領域のビデオ・ユニットとビデオのビットストリームとの間の変換を実行することを含み、ビットストリームはフォーマット・ルールに準拠し、フォーマット・ルールは、ビットストリーム内のビデオ領域の第1のレベルにおける第1の制御情報は、第2の制御情報がビットストリーム内のビデオ・ユニットの第2のレベルで含まれるかどうかを示す、ということを規定しており、第1の制御情報及び/又は第2の制御情報は、変換係数に又は変換に関する非変換係数に、スケーリング・リストが使用されるか否かに関する情報を含む。
【0007】
[0007] 例示的な別の態様では、ビデオ処理方法が開示される。本方法は、ビデオのビデオ・ブロックとビデオのビットストリームとの間の変換を実行することを含み、ビデオ・ブロックは、変換に関する低周波ノン・セパラブル変換(a low frequency non-separable transform)を使用しており、ビットストリームは、シンタックス要素がビットストリームのシンタックス・レベルで含まれることを規定するフォーマット・ルールに準拠しており、シンタックス要素は、参照スケーリング・リストから導出されるスケーリング・マトリックス(scaling matrix)の使用がビデオ・ブロックについてイネーブルにされているかどうかを示し、シンタックス・レベルは、シーケンス・レベル、ピクチャ・レベル、又はスライス・レベルである。
【0008】
[0008] 例示的な別の態様では、ビデオ処理方法が開示される。本方法は、ビデオのビデオ・ユニットとビデオのビットストリームとの間の変換に関し、境界の外側にパディングされたサンプルを使用して、ビデオ・ユニットの境界に沿うビデオ・ユニットのサンプルに対してデブロッキング・フィルタリングを実行することを決定するステップと;決定に従って変換を実行するステップとを含む。
【0009】
[0009] 例示的な別の態様では、ビデオ処理方法が開示される。本方法は、1つ以上のビデオ・ピクチャを含むビデオであって各ビデオ・ピクチャは1つ以上のタイルを含むものと、ビデオのコーディングされた表現との間の変換を実行することを含み、コーディングされた表現はフォーマット・ルールに適合しており;フォーマット・ルールは、コーディングされた表現でシグナリングされる第1の情報と、コーディングされた表現から導出される第2の情報とを規定しており、少なくとも第1の情報又は第2の情報は、1つ以上のタイルの行インデックス又は列インデックスに関連する。
【0010】
[0010] 例示的な別の態様では、ビデオ処理方法が開示される。本方法は、ビデオのビデオ領域のビデオ・ユニットとビデオのコーディングされた表現との間の変換を実行することを含み、コーディングされた表現はフォーマット・ルールに適合しており;フォーマット・ルールは、ビデオ領域における第1の制御情報は、第2の制御情報がビデオ・ユニット・レベルで含まれるかどうかを制御する、ということを規定しており;第1の制御情報及び/又は第2の制御情報は、変換に使用されるルマ・マッピング及びクロマ・スケーリング(LMCS)又はクロマ残差スケーリング(CRS)又はリシェイピング・プロセス(RP)に関する情報を含む。
【0011】
[0011] 更に別の例では、別のビデオ処理方法が開示される。本方法は、1つ以上のビデオ・ユニットを含む1つ以上のビデオ領域を含むビデオと、ビデオのコーディングされた表現との間の変換を実行することを含み;コーディングされた表現はフォーマット・ルールに適合しており;フォーマット・ルールは、コーディングされた表現が、少なくとも幾つかのビデオ・ユニットの変換に使用可能なスケーリング・リストの2レベル・シグナリングを含むことを規定しており、ビデオ領域レベルでの2レベル・シグナリングのうちの高レベル・シグナリングは、ビデオ・ユニット・レベルでの2レベル・シグナリングのうちの低レベル・シグナリングが、コーディングされた表現に含まれるか否か及びその場所を制御するものであり;スケーリング・リストは、少なくとも一部のビデオ・ユニットの変換に使用されるスケーリングに関する情報を含む。
【0012】
[0012] 更に別の例では、別のビデオ処理方法が開示される。本方法は、ビデオのビデオ・ユニットとビデオのコーディングされた表現との間の変換に使用される低周波ノン・セパラブル変換のためのスケーリング・リストを決定するステップと;決定に基づいて変換を実行するステップとを含み、コーディングされた表現におけるシンタックス構造は、スケーリング・リストがビデオ・ユニットに対してイネーブルにされているかどうかを示す。
【0013】
[0013] 更に別の例では、ビデオ・エンコーダ装置が開示される。ビデオ・エンコーダは、上述の方法を実施するように構成されたプロセッサを備える。
【0014】
[0014] 更に別の例示的な態様では、ビデオ・デコーダ装置が開示される。ビデオ・デコーダは、上述の方法を実施するように構成されたプロセッサを備える。
【0015】
[0015] 更に別の例示的な態様では、コードを格納したコンピュータ読み取り可能な媒体が開示される。コードは、本件で説明される方法の1つを、プロセッサ実行可能コードの形式で具現化する。
【0016】
[0016] これら及びその他の特徴は本明細書を通じて説明される。
【図面の簡単な説明】
【0017】
【
図1】[0017]
図1は、ピクチャのラスター走査スライス・パーティション化の例を示し、ピクチャは12個のタイルと3個のラスター走査スライスに分割される。
【
図2】[0018]
図2は、ピクチャの四角形スライス・パーティション化の例を示し、ピクチャは24個のタイル(6個のタイル列及び4個のタイル行)並びに9個の四角形スライスに分割される。
【
図3】[0019]
図3は、タイルと四角形スライスに分割されたピクチャの例を示し、ピクチャは4個のタイル(2個のタイル列及び2個のタイル行)と4個の四角形スライスに分割される。
【
図4】[0020]
図4は、15個のタイル、24個のスライス、及び24個のサブピクチャにパーティション化されたピクチャを示す。
【
図5】[0021]
図5は、例示的なビデオ処理システムのブロック図である。
【
図6】[0022]
図6は、ビデオ処理装置のブロック図である。
【
図7】[0023]
図7は、ビデオ処理の例示的な方法に関するフローチャートである。
【
図8】[0024]
図8は、本開示の幾つかの実施形態によるビデオ・コーディング・システムを示すブロック図である。
【
図9】[0025]
図9は、本開示の幾つかの実施形態によるエンコーダを示すブロック図である。
【
図10】[0026]
図10は、本開示の幾つかの実施形態によるデコーダを示すブロック図である。
【
図11】[0027]
図11は、デブロッキング・フィルタリングに関するパディング・プロセスの例を示す。
【
図12】[0028]
図12は、ビデオ処理の方法例に関するフローチャートである。
【
図13】[0028]
図13は、ビデオ処理の方法例に関するフローチャートである。
【
図14】[0028]
図14は、ビデオ処理の方法例に関するフローチャートである。
【
図15】[0028]
図15は、ビデオ処理の方法例に関するフローチャートである。
【発明を実施するための形態】
【0018】
[0029] セクション見出しは、本明細書において理解を容易にするために使用されており、各セクションで開示されている技術及び実施形態の適用性を、そのセクションだけに限定してはいない。更に、H.266の用語は、一部の説明において理解を容易にするためにのみ使用されているに過ぎず、開示された技術の範囲を限定するためではない。従って本件で説明される技術は他のビデオ・コーデック・プロトコルや設計にも適用可能である。本明細書において、VVC仕様の現在のドラフトに対して、編集変更は、キャンセルされたテキストを示すイタリック体のテキスト(便宜上、<<< >>>内のテキストとして示される)と、追加されたテキストを示す太字のイタリック体のテキストとして示される(便宜上、下線テキストとして示される)。
【0019】
[0030] 1. 概要
本件はビデオ・コーディング技術に関連する。具体的には、サブピクチャ、LMCS、AMVR、及びスケーリング・リストのサポートに関するものである。サブピクチャに関する態様は、1つのサブピクチャに含まれるタイルの行及び列の数の導出、並びに各サブピクチャが1つのスライスのみを含む場合にスライスに含まれるCTUのラスター走査CTUアドレスのリストの導出を含む。LMCSに関する態様は、異なるレベルでのLMCSの使用可能性のシグナリングに関するものである。AMVRの態様は、sps_affine_amvr_enabled_flagのセマンティクスに関するものである。スケーリング・リストの態様は、様々なレベルで明示的なスケーリング・リストの利用を可能にすることに関するものである。アイデアは、個別に又は様々な組み合わせにおいて、任意のビデオ・コーディング規格又は規格外ビデオ・コーデックであって、単層及び/又は多層ビデオ・コーディングをサポートするもの、例えば開発中の多用途ビデオ・コーディング(Versatile Video Coding, VVC)に適用される可能性がある。
【0020】
2. 略語
ALF 適応ループ・フィルタ
AMVR 適応動きベクトル差分解能
APS 適応パラメータ・セット
AU アクセス・ユニット
AUD アクセス・ユニット・デリミタ
AVC アドバンスト・ビデオ・コーディング
CLVS コーディングされたレイヤ・ビデオ・シーケンス
CPB コーディングされたピクチャ・バッファ
CRA クリーン・ランダム・アクセス
CTU コーディング・ツリー・ユニット
CVS コーディングされたビデオ・シーケンス
DPB デコード済みピクチャ・バッファ
DPS デコーディング・パラメータ・セット
EOB エンド・オブ・ビットストリーム
EOS エンド・オブ・シーケンス
GDR 漸進的デコーディング・リフレッシュ
HEVC 高効率ビデオ・コーディング
HRD 仮説参照デコーダ
IDR 瞬時デコーディング・リフレッシュ
JEM 共同探査モデル
LFNST 低周波ノン・セパラブル変換
LMCS クロマ・スケーリングを伴うルマ・マッピング
MCTS 動き制約タイル・セット
NAL ネットワーク抽象化レイヤ
OLS 出力レイヤ・セット
PH ピクチャ・ヘッダ
PPS ピクチャ・パラメータ・セット
PTL プロファイル,ティア&レベル
PU ピクチャ・ユニット
RBSP ロー(Raw)バイト・シーケンス・ペイロード
SEI 補足補強情報
SPS シーケンス・パラメータ・セット
SVC スケーラブル・ビデオ・コーディング
VCL ビデオ・コーディング・レイヤ
VPS ビデオ・パラメータ・セット
VTM VVCテスト・モデル
VUI ビデオ利用情報
VVC 多用途ビデオ・コーディング
[0031] 3. 導入説明
ビデオ・コーディング規格は、主に周知のITU-T及びISO/IEC規格の開発を通じて発展してきた。ITU-TはH.261とH.263を作成し、ISO/IECはMPEG-1とMPEG-4 Visualを作成し、2つの組織は共同してH.262/MPEG-2 VideoとH.264/MPEG-4 Advanced Video Coding(AVC)とH.265/HEVC規格とを作成した。H.262以来、ビデオ・コーディング規格はハイブリッド・ビデオ・コーディング構造に基づいており、そこでは時間的予測と変換コーディングが使用される。HEVCを越える将来のビデオ・コーディング技術を探求するため、2015年に共同ビデオ探査チーム(Joint Video Exploration Team,JVET)がVCEGとMPEGにより共同で設立された。それ以来、多くの新しい方法がJVETによって採用されており、共同探索モデル(Joint Exploration Model,JEM)と名付けられる参照ソフトウェアに入れられている。JVETミーティングは四半期に1回同時に開催されており、新たなコーディング規格はHEVCと比較して50%のビットレート低減を目指している。新しいビデオ・コーディング規格は、2018年4月のJVET会合において多用途ビデオ・コーディング(Versatile Video Coding, VVC)として正式に命名され、VVCテスト・モデル(VVC test model,VTM)の最初のバージョンがその時点でリリースされた。VVC標準化に寄与する継続的な努力が行われているので、JVET会議毎に新しいコーディング技術がVVC規格に採用されている。VVCワーキング草案及びテスト・モデルVTMは、毎回会議後に更新される。VVCプロジェクトは、現在、2020年7月の会合での技術的完成(FDIS)を目指している。
【0021】
[0032] 3.1. HEVCにおけるピクチャ・パーティショニング方式
HEVCは4つの異なるピクチャ・パーティショニング方式、即ち、レギュラー・スライス、従属スライス、タイル、及びウェーブフロント並列処理(Wavefront Parallel Processing, WPP)を含み、これは最大転送ユニット(MTU)サイズ・マッチング、並列処理、及びエンド・ツー・エンド遅延低減に適用されることが可能である。
【0022】
[0033] レギュラー・スライスは、H.264/AVCにおけるものと同様である。各々のレギュラー・スライスはそれ自身のNALユニットにカプセル化され、ピクチャ内予測(イントラ・サンプル予測、動き情報予測、コーディング・モード予測)や、スライス境界を横断するエントロピー・コーディング依存性はディセーブルにされる。従って、レギュラー・スライスは、同じピクチャ内の他のレギュラー・スライスから独立して再構成されることが可能である(但し、ループ・フィルタリング処理に起因する相互依存性が依然として存在する可能せいがある)。
【0023】
[0034] レギュラー・スライスは、H.264/AVCにおいて事実上同一の形式でも利用可能な並列化(parallelization)に使用できる唯一のツールである。レギュラー・スライスに基づく並列化は、多くのプロセッサ間又はコア間の通信を必要としない(但し、予測コーディングされたピクチャをデコードする際の動き補償のためのプロセッサ間又はコア間のデータ共有を除くが、これは典型的にはピクチャ内予測に起因してプロセッサ間又はコア間のデータ共有よりも非常に重いものである)。しかしながら、同じ理由により、レギュラー・スライスの使用は、スライス・ヘッダのビット・コストに起因して、及びスライス境界を横切る予測の欠如に起因して、かなりのコーディング・オーバーヘッドを被る可能性がある。更に、レギュラー・スライスは(以下で言及される他のツールとは対照的に)、レギュラー・スライスのイン・ピクチャ非依存性(in-picture independence)と、各レギュラー・スライスはそれ自身のNALユニットにカプセル化されていることとに起因して、MTUサイズ要件を満たすために、ビットストリーム・パーティショニングの主要な仕組みとしても役立つ。多くの場合、並列化のゴールとMTUサイズ・マッチングのゴールは、ピクチャにおけるスライス・レイアウトに対する相反する要請を置いてしまう。このような状況の認識は、以下に述べる並列化ツールの開発をもたらした。
【0024】
[0035] 従属スライスは、短いスライス・ヘッダを有するものであり、如何なるイン・ピクチャ予測も損なうことなく、ツリーブロック境界でビットストリームのパーティショニングを可能にする。基本的には、レギュラー・スライス全体のエンコーディングが終了する前に、レギュラー・スライスの一部が送信されることを可能にすることにより、従属スライスは、レギュラー・スライスの複数のNALユニットへのフラグメント化をもたらし、削減されたエンド・ツー・エンド遅延をもたらす。
【0025】
[0036] WPPでは、ピクチャはコーディング・ツリー・ブロック(CTB)の単一行にパーティション化される。エントロピー・デコーディング及び予測は、他のパーティションのCTBからのデータを使用することを許容される。並列処理は、複数のCTB行の並列復号化によって可能となり、ここで、対象CTBが復号化される前に、対象CTBの上と右に関連するデータが利用可能であることを保証するために、1つのCTB行の復号化の開始は、2つのCTBの分だけ遅延させられる。このスタガード・スタート(図式的に表現すると波面又はウェーブフロント(wavefront)のように見える)を使用すると、ピクチャが含むCTB行と同数に及ぶプロセッサ/コアとともに並列化は可能になる。ピクチャ内の隣接するツリーブロック行の間のイン・ピクチャ予測が許容されるので、イン・ピクチャ予測を可能にするために必要なプロセッサ間/コア間の通信は、相当なものになる可能性がある。WPPパーティション化は、それが適用されない場合と比較して、追加的なNALユニットの生成となる結果をもたらさないので、WPPはMTUサイズ・マッチングのためのツールではない。しかしながら、MTUサイズ・マッチングが必要とされる場合、レギュラー・スライスは、WPPとともに、特定のコーディング・オーバーヘッドとともに、使用されることが可能である。
【0026】
[0037] タイルは、ピクチャをタイルの列と行にパーティション化する水平と垂直の境界を定める。タイル列はピクチャのトップからピクチャのボトムへ進む。同様に、タイル行はピクチャの左からピクチャの右へ進む。ピクチャ内のタイルの数は、タイル列の数に、行の数を掛けることによってシンプルに導出することができる。
【0027】
[0038] CTBのスキャン順序は、ピクチャのタイル・ラスター・スキャンの順序で次のタイルの左上CTBをデコードする前に、(タイルのCTBラスター・スキャンの順序で)タイル内でローカルであるように変更される。レギュラー・スライスと同様に、タイルは、エントロピー・デコーディング依存性だけでなく、イン・ピクチャ予測依存性も損なう。しかしながら、それらは個々のNALユニットに包含されることを必要とせず(この点ではWPPと同様である);従って、タイルは、MTUサイズ・マッチングに使用することはできない。各タイルは、1つのプロセッサ/コアによって処理することが可能であり、隣接するタイルを復号化する処理ユニットの間でイン・ピクチャ予測に必要とされるプロセッサ間/コア間の通信は、スライスが1つより多いタイルに及んでいる場合に共有スライス・ヘッダを伝達することや、再構成されたサンプル及びメタデータのループ・フィルタリング関連の共有に限定される。1つより多いタイル又はWPPセグメントが1つのスライスに含まれる場合、スライス内の最初のタイル又はWPPセグメント以外の各タイル又はWPPセグメントに対するエントリ・ポイント・バイト・オフセットは、スライス・ヘッダ内でシグナリングされる。
【0028】
[0039] 簡易化のために、HEVCでは、4つの異なるピクチャ・パーティション化方式の適用に関する制限が規定されている。所与のコーディングされたビデオ・シーケンスは、HEVCで指定されるほとんどのプロファイルに関し、タイルとウェーブフロントの両方を含むことはできない。各スライス及びタイルに関し、以下の条件のうちの双方又は一方が充足されなければならない:1)スライス内の全てのコーディングされたツリーブロックは同じタイルに属する;2)タイル内の全てのコーディングされたツリーブロックは同じスライスに属する。最後に、ウェーブフロント・セグメントは、正確に1つのCTB行を含むものであり、WPPが使用される場合、スライスが或るCTB行の中で始まるならば、それは同じCTB行で終わらなければならない。
【0029】
[0040] HEVCに関する最近の改訂は以下のJCT-VCアウトプット文書において規定されている:JCTVC-AC1005, J. Boyce, A. Ramasubramonian, R. Skupin, G. J. Sullivan, A. Tourapis, Y.-K. Wang (editors), "HEVC Additional Supplemental Enhancement Information (Draft 4)," Oct. 24, 2017, これは次のサイトから公に利用可能である:
http://phenix.int-evry.fr/jct/doc_end_user/documents/29_Macau/wg11/JCTVC-AC1005-v2.zip
この改訂を含めて、HEVCは、3つのMCTS関連のSEIメッセージ、即ち、時間的MCTSs SEIメッセージ、MCTSs抽出情報セットSEIメッセージ、及びMCTSs抽出情報ネスティングSEIメッセージを規定する。
【0030】
[0041] 時間的MCTSs SEIメッセージは、ビットストリーム中のMCTSsの存在を示し、MCTSsをシグナリングする。各MCTSについて、動きベクトルは、MCTS内のフル・サンプル位置(full-sample location)、及び、補間のためにMCTS内のフル・サンプル位置のみを必要とする分数サンプル位置(fractional-sample locations)、を指すように限定され、MCTS外部のブロックから導出される時間的動きベクトル予測に対する動きベクトル候補の使用は、許容されない。このようにして、各MCTSは、MCTSに含まれないタイルの存在によらず、独立して復号化されることが可能である。
【0031】
[0042] MCTS抽出情報セットSEIメッセージは、MCTSサブ・ビットストリーム抽出(SEIメッセージのセマンティクスの一部として指定される)で使用することが可能な補足情報を提供し、MCTSセットの適合ビットストリーム(conforming bitstream)を生成する。情報は、多数の抽出情報セットから構成され、各セットは、多数のMCTSセットを定義し、MCTSサブ・ビットストリーム抽出プロセス中に使用される代替VPS、SPS及びPPSのRBSPバイトを含む。MCTSサブ・ビットストリーム抽出プロセスに従ってサブ・ビットストリームを抽出する場合、パラメータ・セット(VPSs、SPSs、及びPPSs)は書き換えられたり又は置換されたりすることを必要とし、スライス・ヘッダは僅かに更新されることを必要とし、なぜならスライス・アドレス関連のシンタックス要素のうちの全部又は何れか(irst_slice_segment_in_pic_flag及びslice_segment_addressを含む)は、典型的には、異なる値を有する必要があるからである。
【0032】
[0043] 3.2. VVCにおけるピクチャのパーティショニング
VVCでは、ピクチャは、1つ以上のタイル行と1つ以上のタイル列に分割される。タイルは、ピクチャの矩形領域をカバーする一連のCTUである。タイル内のCTUは、そのタイル内のラスター・スキャン順序でスキャンされる。
【0033】
[0041] スライスは、整数個の完全なタイル、又はピクチャのタイル内の整数個の連続した完全なCTU行、から構成される。
【0034】
[0045] スライスの2つのモード、即ち、ラスター走査スライス・モードと矩形スライス・モードがサポートされている。ラスター走査スライス・モードでは、スライスは、ピクチャのタイル・ラスター走査における一連の完全なタイルを含む。矩形スライス・モードでは、スライスは、多数の完全なタイルであってピクチャの矩形領域を集合的に形成するもの、又は1つのタイルのうちの多数の連続した完全なCTU行であってピクチャの矩形領域を集合的に形成するもの、のうちの何れかを含む。矩形スライス内のタイルは、そのスライスに対応する矩形領域の中でタイル・ラスター・スキャン順序でスキャンされる。
【0035】
[0046] サブピクチャは、ピクチャの矩形領域をまとめてカバーする1つ以上のスライスを含む。
【0036】
[0047]
図1は、ピクチャのラスター走査スライス・パーティション化の例を示し、ピクチャは12個のタイルと3個のラスター走査スライスに分割される。
【0037】
[0048]
図2は、ピクチャの矩形スライス・パーティション化の例を示し、ピクチャは24個のタイル(6つのタイルカラム及び4つのタイル列)と9個の矩形スライスに分割される。
【0038】
[0049]
図3は、複数のタイルと矩形スライスにパーティション化されたピクチャの例を示し、ピクチャは4つのタイル(2つのタイル列と2つのタイル列)と、4つの矩形スライスに分割される。
【0039】
[0050]
図4は、ピクチャのサブピクチャ・パーティショニングの例を示し、ピクチャは18個のタイルにパーティション化され、左側の12個はそれぞれ4×4CTUの1スライスをカバーし、右側の6個はそれぞれ2×2CTUが2つ縦に積み重ねられたスライスをカバーし、変動する寸法の24個のスライスと24個のサブピクチャを全体として生じている(各スライスはサブピクチャである)。
3.3 VVC(as JVET-Q2001-vC)におけるSPS/PPS/ピクチャ・ヘッダ/スライス・ヘッダのシグナリング
7.3.2.3 シーケンス・パラメータ・セットRBSPシンタックス
【0040】
【数1】
7.3.2.4 ピクチャ・パラメータ・セットRBSPシンタックス
【0041】
【数2】
7.3.2.7 ピクチャ・ヘッダ構造シンタックス
【0042】
【数3】
7.3.7.1 ゼネラル・スライス・ヘッダ・シンタックス
【0043】
【数4】
3.4 タイル、スライス、及びサブピクチャに関するJVET-Q2001-vCにおける仕様
3 定義
picture-level slice index:rect_slice_flagが1に等しい場合にPPSでシグナリングされる順番におけるピクチャ内のスライスのリストに対するスライスのインデックス。
subpicture-level slice index:rect_slice_flagが1に等しい場合にPPSでシグナリングされる順番におけるサブピクチャ内のスライスのリストに対するスライスのインデックス。
6.5.1 CTBラスター走査、タイル走査、及びサブピクチャ走査プロセス
タイル列の数を示す変数NumTileColumnsと、両端を含む0ないしNumTileColumn-1の範囲に及ぶiに関し、CTBの単位でi番目のタイル列の幅を指定するリストcolWidth[ i ]とは、次のようにして導出される:
【0044】
【数5】
タイル行の数を示す変数NumTileRowsと、両端を含む0ないしNumTileColumn-1の範囲に及ぶjに関し、CTBの単位でj番目のタイル行の高さを指定するリストRowHeight[ j ]とは、次のようにして導出される:
【0045】
【数6】
変数NumTilesInPicは、NumTileColumns * NumTileRowsに等しく設定される。
両端を含む0ないしNumTileColumnsの範囲に及ぶiに関し、CTBの単位でi番目のタイル列の境界の位置を指定するリストtileColBd[ i ]は、次のようにして導出される:
【0046】
【数7】
NOTE 1 - 配列tileColBd[]のサイズは、CtbToTileColBd[ ]の導出における実際のタイル列の数より1つ大きい。
両端を含む0ないしNumTileRowsの範囲に及ぶjに関し、CTBの単位でj番目のタイル行の境界の位置を指定するリストtileRowBd[ j ]は、次のようにして導出される:
【0047】
【数8】
NOTE 2 - 上記の導出における配列tileRowBd[ j ]のサイズは、CtbToTileRowBd[ ]の導出における実際の行数より1つ大きい。
両端を含む0ないしPicWidthInCtbsYの範囲に及ぶctbAddrXに関し、CTBの単位で水平CTBアドレスから左タイル列境界への変換を指定するリストCtbToTileColBd[ ctbAddrX ]は、次のようにして導出される:
【0048】
【数9】
NOTE 3 - 上記の導出における配列CtbToTileColBd[ ]のサイズは、導出slice_data()シグナリングにおけるCTBのピクチャ幅の実際の数より1大きい。
両端を含む0ないしPicHeightInCtbsYの範囲に及ぶctbAddrYに関し、CTBの単位で垂直CTBアドレスから上タイル列境界への変換を指定するリストCtbToTileRowBd[ ctbAddrY ]は、次のようにして導出される:
【0049】
【数10】
NOTE 4 - 上記の導出における配列CtbToTileRowBd[ ]のサイズは、slice_data()シグナリングにおけるCTBのピクチャ高さの実際の数より1大きい。
矩形スライスに関し、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiに関し、i番目のスライスにおけるCTUの数を指定するリストNumCtusInSlice[ i ]、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiに関し、スライスの左端タイルのインデックスを指定するリストSliceTopLeftTileIdx[ i ]、及び両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiと、両端を含む0ないしNumCtusInSlice[ i ] - 1の範囲に及ぶjに関し、i番目のスライス内のj番目のCTBのピクチャ・ラスター走査アドレスを指定するマトリクスCtbAddrInSlice[ i ][ j ]は、次のようにして導出される:
【0050】
【数11】
ここで、関数AddCtbsToSlice( sliceIdx, startX, stopX, startY, stopY)は、次のように規定される:[Ed.(YK):本明細書で定義される他の関数と一貫したスタイルでこの関数を定義していることを考慮されたい]
【0051】
【数12】
両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiに関し、NumCtusInSlice[ i ]の値は0より大きいものとする、ということはビットストリーム適合性の要件(bitstream conformance)である。更に、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiと、両端を含む0ないしNumCtusInSlice[ i ] - 1の範囲に及ぶjに関し、マトリクスCtbAddrInSlice[ i ][ j ]は、0ないしPicSizeInCtbsY - 1において一度且つ一度に限り、全てのCTBアドレスを含むものとする、ということはビットストリーム適合性の要件である。
両端を含む0ないしPicSizeInCtbsY - 1の範囲に及ぶctbAddrRsに関し、ピクチャ・ラスター走査におけるCTBアドレスからサブピクチャ・インデックスへの変換を指定するリストCtbToSubpicIdx[ ctbAddrRs ]は、次のようにして導出される:[Ed.(YK):この条項でのみ使用されるローカル変数として、CtbToSubpicIdx[ ]を定義していることを考慮されたい。]
【0052】
【数13】
i番目のサブピクチャにおける矩形スライスの数を指定するリストlist NumSlicesInSubpic[ i ]は、次のようにして導出される:
【0053】
【数14】
・・・
7.3.4.3 ピクチャ・パラメータ・セットRBSPセマンティクス
・・・
1に等しいsubpic_id_mapping_in_pps_flagは、サブピクチャIDマッピングがPPSでシグナリングされることを示す。0に等しいsubpic_id_mapping_in_pps_flagは、サブピクチャIDマッピングがPPSでシグナリングされないことを示す。subpic_id_mapping_explicitly_signalled_flagが0に等しいか、又はsubpic_id_mapping_in_sps_flagが1に等しい場合、subpic_id_mapping_in_pps_flagの値は0に等しいものとする。それ以外の場合(subpic_id_mapping_explicitly_signalled_flagが1に等しく、且つsubpic_id_mapping_in_sps_flagが0に等しい場合)、subpic_id_mapping_in_pps_flagの値は1に等しいものとする。
pps_num_subpics_minus1はsps_num_subpics_minus1に等しいものとする。pps_subpic_id_len_minus1はsps_subpic_id_len_minus1に等しいものとする。pps_subpic_id[ i ]はi番目のサブピクチャのサブピクチャIDを示す。pps_subpic_id[ i ]シンタックス要素の長さはpps_subpic_id_len_minus1 + 1ビットである。
両端を含む0ないしsps_num_subpics_minus1の範囲に及ぶiの各々の値に関し、変数SubpicIdVal[ i ]は、次のようにして導出される:
【0054】
【数15】
以下の条件の双方が適用されることは、ビットストリーム適合性の要件である:
- 両端を含む0ないし0 to sps_num_subpics_minus1の範囲に及ぶi及びjの任意の2つの異なる値に関し、SubpicIdVal[ i ]はSubpicIdVal[ j ]に等しくないものとする。
- 現在のピクチャがCLVSの最初のピクチャでない場合、両端を含む0ないしsps_num_subpics_minus1の範囲に及ぶiの各々の値に関し、SubpicIdVal[ i ]の値が同じレイヤにおける復号化順序で先行するピクチャのSubpicIdVal[ i ]の値に等しくないならば、サブピクチャ・インデックスiを有する現在のピクチャ内のサブピクチャの全てのコーディングされたスライスNALユニットに関するnal_unit_typeは、両端を含むIDR_W_RADLないしCRA_NUTの範囲内の特定の値に等しいものとする。
1に等しいno_pic_partition_flagは、ピクチャ・パーティショニングはPPSを参照する各々のピクチャに対して適用されないことを示す。
0に等しいno_pic_partition_flagは、PPSを参照する各々のピクチャが、1つより多いタイル又はスライスにパーティション化されてもよいことを示す。
no_pic_partition_flagの値は、CLVS内のコーディングされたピクチャによって参照される全てのPPSに対して同一であるものとする、ということはビットストリーム適合性の要件である。
no_pic_partition_flagの値は、sps_num_subpics_minus1 + 1の値が1より大きい場合には1に等しくないものとする、ということはビットストリーム適合性の要件である。
pps_log2_ctu_size_minus5プラス5は、各CTUのルマ・コーディング・ツリー・ブロック・サイズを示す。pps_log2_ctu_size_minus5は、sps_log2_ctu_size_minus5に等しいものとする。
num_exp_tile_columns_minus1プラス1は、明示的に与えられるタイル列の幅の数を示す。num_exp_tile_columns_minus1の値は、両端を含む0ないしPicWidthInCtbsY - 1の範囲内にあるものとする。no_pic_partition_flagが1に等しい場合、num_exp_tile_columns_minus1の値は0に等しいと推定される。
num_exp_tile_rows_minus1プラス1は、明示的に与えられるタイル行の高さの数を示す。num_exp_tile_rows_minus1の値は、両端を含む0ないしPicHeightInCtbsY - 1の範囲内にあるものとする。no_pic_partition_flagが1に等しい場合、num_tile_rows_minus1の値は0に等しいと推定される。
tile_column_width_minus1[ i ]プラス1は、両端を含む0ないしnum_exp_tile_columns_minus1 - 1の範囲内のiに関し、CTB単位でi番目のタイル列の幅を示す。tile_column_width_minus1[ num_exp_tile_columns_minus1 ]は、条項6.5.1で規定されるようなnum_exp_tile_columns_minus1以上のインデックスを有するタイル列の幅を導出するために使用される。tile_column_width_minus1[ i ]の値は、両端を含む0ないしPicWidthInCtbsY - 1の範囲内にあるものとする。存在しない場合、tile_column_width_minus1[ 0 ]の値は、PicWidthInCtbsY - 1に等しいと推定される。
tile_row_height_minus1[ i ]プラス1は、両端を含む0ないしnum_exp_tile_rows_minus1 - 1の範囲内のiに関し、CTB単位でi番目のタイル行の高さを示す。tile_row_height_minus1[ num_exp_tile_rows_minus1 ]は、条項6.5.1で規定されるようなnum_exp_tile_rows_minus1以上のインデックスを有するタイル行の高さを導出するために使用される。tile_row_height_minus1[ i ]の値は、両端を含む0ないしPicHeightInCtbsY - 1の範囲内にあるものとする。存在しない場合、tile_row_height_minus1[ 0 ]の値は、PicHeightInCtbsY - 1に等しいと推定される。
0に等しいrect_slice_flagは、各スライス内のタイルがラスター走査順序におけるものであり、スライス情報がPPSではシグナリングされないことを指定する。1に等しいrect_slice_flagは、各スライス内のタイルがピクチャの矩形領域をカバーしており、スライス情報がPPSでシグナリングされることを指定する。存在しない場合、rect_slice_flagは1に等しいと推定される。subpic_info_present_flagが1に等しい場合、rect_slice_flagの値は1に等しいものとする。
1に等しいsingle_slice_per_subpic_flagは、各々のサブピクチャが1つの及び唯1つの矩形スライスから構成されることを示す。0に等しいsingle_slice_per_subpic_flagは、各々のサブピクチャが1つ以上の矩形スライスから構成されてもよいことを示す。single_slice_per_subpic_flagが1に等しい場合、num_slices_in_pic_minus1はsps_num_subpics_minus1に等しいと推定される。存在しない場合、single_slice_per_subpic_flagの値は、0に等しいと推定される。[ED.(GJS):各々のピクチャ内に1つより多いサブピクチャが存在する場合、このフラグのみが関連している解釈を避けるために、このフラグを名称変更するか又は別の方法で明確化することを考慮されたい。]
num_slices_in_pic_minus1プラス1は、PPSを参照する各ピクチャにおける矩形スライスの数を示す。num_slices_in_pic_minus1の値は、両端を含む0ないしMaxSlicesPerPicture - 1の範囲内にあるものとし、ここで、MaxSlicesPerPictureはAnnex Aで規定されている。no_pic_partition_flagが1に等しい場合、num_slices_in_pic_minus1の値は0に等しいと推定される。
0に等しいtile_idx_delta_present_flagは、tile_idx_deltaの値がPPSに存在しないことを示し、PPSを参照するピクチャ内の全ての矩形スライスは、条項6.5.1で規定されるプロセスに従うラスター順序で指定される。[Ed.(RS):数式参照追加]
1に等しいtile_idx_delta_present_flagは、tile_idx_deltaの値がPPSに存在する可能性があることを示し、PPSを参照するピクチャ内の全ての矩形スライスは、tile_idx_deltaの値で示される順序で指定される。存在しない場合、tile_idx_delta_present_flagの値は0であると推定される。
slice_width_in_tiles_minus1[ i ]プラス1は、タイル列の単位でi番目の矩形スライスの幅を示す。slice_width_in_tiles_minus1[ i ]の値は、両端を含む0ないしNumTileColumns-1の範囲内にあるものとする。slice_width_in_tiles_minus1[ i ]が存在しない場合、以下が適用される:
- NumTileColumnsが1に等しい場合、slice_width_in_tiles_minus1[ i ]の値は0に等しいと推定される。
- それ以外の場合、slice_width_in_tiles_minus1[ i ]の値は、条項6.5.1で規定されるように推定される。[Ed.(RS):数式参照追加]
slice_height_in_tiles_minus1[ i ]プラス1は、行単位でi番目の矩形スライスの高さを示す。slice_height_in_tiles_minus1[ i ]の値は、両端を含む0ないしNumTileRows-1の範囲内にあるものとする。slice_height_in_tiles_minus1[ i ]が存在しない場合、以下が適用される:
- NumTileRowsが1に等しいか、又はtile_idx_delta_present_flagが0に等しく、且つtileIdx % NumTileColumnsが0より大きい場合、slice_height_in_tiles_minus1[ i ]の値は0に等しいと推定される。
- それ以外の場合(NumTileRowsが1に等しくなく、且つtile_idx_delta_present_flagが1に等しいか、又はtileIdx % NumTileColumnsが0に等しい場合)、tile_idx_delta_present_flagが1に等しいか、又はtileIdx % NumTileColumnsが0に等しいならば、slice_height_in_tiles_minus1[ i ]の値はslice_height_in_tiles_minus1[ i - 1 ]に等しいと推定される。
num_exp_slices_in_tile[ i ]は、1つより多い矩形スライスを含む現在のタイルで、明示的に与えられたスライスの高さの数を指定する。num_exp_slices_in_tile[ i ]は、両端を含む0ないしRowHeight[ tileY ] - 1の範囲内にあるものとし、ここで、tileYは、i番目のスライスを含むタイル行インデックスである。存在しない場合、num_exp_slices_in_tile[ i ]の値は0に等しいと推定される。num_exp_slices_in_tile[ i ]が0に等しい場合、変数NumSlicesInTile[ i ]の値は1に等しいと導出される。
exp_slice_height_in_ctus_minus1[ j ]プラス1は、CTU行の単位で現在のタイルにおけるj番目の矩形スライスの高さを示す。exp_slice_height_in_ctus_minus1[ j ] の値は、両端を含む0ないしRowHeight[ tileY ] - 1の範囲内にあるものとし、tileYは、現在のタイルの行インデックスである。
num_exp_slices_in_tile[ i ]が0より大きい場合、0ないしNumSlicesInTile[ i ] - 1の範囲内のkに関し、変数NumSlicesInTile[ i ]及びSliceHeightInCtusMinus1[ i + k ]は、次のようにして導出される:
【0055】
【数16】
tile_idx_delta[ i ]は、i番目の矩形スライスの最初のタイルのタイル・インデックスと(i + 1)番目の矩形スライスの最初のタイルのタイル・インデックスとの間の差を示す。tile_idx_delta[ i ]は、両端を含む- NumTilesInPic + 1ないし NumTilesInPic - 1の範囲内にあるものとする。存在しない場合、tile_idx_delta[ i ]の値は0に等しいと推定される。存在する場合、tile_idx_delta[ i ]の値は0に等しくないものとする。
・・・
7.4.2.4.5 VCL NALユニットの順序とコーディング・ピクチャに対するそれらの関係
コーディングされたピクチャ内のVCL NALユニットの順序は、以下のように制約される:
- コーディングされたピクチャの任意の2つのコーディングされたスライスNALユニットAとBに関し、subpicIdxAとsubpicIdxBをそれらのサブピクチャ・レベル・インデックス値とし、sliceAddrAとsliceddrBをそれらのslice_address値とする。
- 以下の何れかの条件が真である場合、コーディングされたスライスNALユニットAは、コーディングされたスライスNALユニットBに先行するものとする:
- subpicIdxAはsubpicIdxBより小さい。
【0056】
- subpicIdxAはsubpicIdxBに等しく、且つsliceAddrAはsliceAddrBより小さい。
7.4.8.1 一般的なスライス・ヘッダの意味
変数CuQpDeltaValは、cu_qp_delta_absを含むコーディング・ユニットのルマ量子化パラメータとその予測との間の差分を示し、これは0に等しく設定される。変数CuQpOffsetCb, CuQpOffsetCr, 及びCuQpOffsetCbCrは、cu_chroma_qp_offset_flagを含むコーディング・ユニットに対するQp’ Cb, Qp’Cr,及びQp’CbCr量子化パラメータの個々の値を決定する際に使用されるものであり、これらは全て0に等しく設定される。
1に等しいpicture_header_in_slice_header_flagは、PHシンタックス構造がスライス・ヘッダに存在することを示す。0に等しいpicture_header_in_slice_header_flagは、PHシンタックス構造がスライス・ヘッダに存在しないことを示す。picture_header_in_slice_header_flagの値は、CLVS内の全てのコーディングされたスライスの中で同一であるものとする、ということはビットストリーム適合性の要件である。picture_header_in_slice_header_flagが、コーディングされたスライスに対して1に等しい場合、PH_NUTに等しいnal_unit_typeを有するVCL NALユニットは、CLVS内に存在しないものとする、ということはビットストリーム適合性の要件である。picture_header_in_slice_header_flagが、0に等しい場合、現在のピクチャ内の全てのコーディングされたスライスは、0に等しいpicture_header_in_slice_header_flagを有するものとし、現在のPUはPH NALユニットを有するものとする。
slice_subpic_idは、スライスを含むサブピクチャのサブピクチャIDを示す。slice_subpic_idが存在する場合、変数CurrSubpicIdxの値は、SubpicIdVal[ CurrSubpicIdx ]がslice_subpic_id.に等しくなるように、導出される。それ以外の場合(slice_subpic_idが存在しない場合)、CurrSubpicIdxは0に等しく導出される。slice_subpic_idの長さは、sps_subpic_id_len_minus1 + 1ビットである。
slice_addressは、スライスのスライス・アドレスを示す。存在しない場合、slice_addressの値は0に等しいと推定される。rect_slice_flagが1に等しく、NumSlicesInSubpic[ CurrSubpicIdx ]が1に等しい場合、slice_addressの値は0に等しいと推定される。
rect_slice_flagが0に等しい場合、以下が適用される:
- スライス・アドレスは、ラスター走査タイル・インデックスである。
- slice_addressの長さは、Ceil( Log2 ( NumTilesInPic ) )ビットである。
- slice_addressの値は、両端を含む0ないしNumTilesInPic - 1の範囲内にあるものとする。
それ以外の場合(rect_slice_flagが1に等しい場合)、以下が適用される:
- スライス・アドレスは、スライスのサブピクチャ・レベルのスライス・インデックスである。
- slice_addressの長さは、Ceil( Log2( NumSlicesInSubpic[ CurrSubpicIdx ] ) )ビットである。
- slice_addressの値は、両端を含む0ないしNumSlicesInSubpic[ CurrSubpicIdx ] - 1の範囲内にあるものとする。
以下の制約を適用することは、ビットストリーム適合性の要件である:
- rect_slice_flagが0に等しいか、又はsubpic_info_present_flagが0に等しい場合、slice_addressの値は、同じコーディングされたピクチャのうちの任意の他のコーディングされたスライスNALユニットのslice_addressの値に等しくないものとする。
- それ以外の場合、slice_subpic_id及びslice_addressの値のペアは、同じコーディングされたピクチャのうちの任意の他のコーディングされたスライスNALユニットのslice_subpic_id及びslice_address値のペアに等しくないものとする。
- ピクチャのスライスの形状は、各CTUが、復号化される場合に、ピクチャ境界から構成されるか、又は以前に復号化されたCTUの境界から構成される、左・境界全体及び上・境界全体を有するようなものである。
sh_extra_bit[ i ]は1又は0に等しい可能性がある。この仕様のこのバージョンに準拠するデコーダは、sh_extra_bit[ i ]の値を無視するものとする。その値は、このバージョンの仕様で規定されているプロファイルに対するデコーダの適合性には影響しない。
num_tiles_in_slice_minus1プラス1は、存在する場合、スライス内のタイルの数を示す。num_tiles_in_slice_minus1の値は、両端を含む0ないしNumTilesInPic - 1の範囲内にあるものとする。現在のスライスにおけるCTUの数を指定する変数NumCtusInCurrSliceと、両端を含む0ないしNumCtusInCurrSlice - 1の範囲に及ぶiに関し、スライス内のi番目のCTBのピクチャ・ラスター走査アドレスを指定するリストCtbAddrInCurrSlice[ i ]とは、次のようにして導出される:
【0057】
【数17】
変数SubpicLeftBoundaryPos, SubpicTopBoundaryPos, SubpicRightBoundaryPos, and SubpicBotBoundaryPosは、次のようにして導出される:
【0058】
【数18】
・・・
3.5. クロマ・スケーリングを伴うルマ・マッピング(LMCS)
[0051] LMCSは2つの側面:ルマ・マッピング(リシェイピング・プロセス。RPと記される。)及びルマ依存クロマ残差スケーリング(chroma residual scaling,CRS)を含む。ルマ信号に関し、LMCSモードは、包含されている2つのドメインに基づいて動作し、2つのドメインは、オリジナル・ドメインである第1のドメインと、リシェイピング・モデルに従ってルマ・サンプルを特定の値にマッピングするリシェイピングされたドメインである第2のドメインとを含む。更に、クロマ信号に関し、残差スケーリングが適用されてもよく、ここで、スケーリング係数はルマ・サンプルから導出される。
【0059】
[0052] SPS、ピクチャ・ヘッダ(PH)、スライス・ヘッダ(SH)における関連するシンタックス要素と意味は次のように記述される:
シンタックス・テーブル
7.3.2.3 シーケンス・パラメータ・セットRBSPシンタックス
【0060】
【数19】
7.3.2.7 ピクチャ・ヘッダ構造シンタックス
【0061】
【数20】
セマンティクス
1に等しいsps_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングがCLVSで使用されることを示す。0に等しいsps_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングがCLVSで使用されないことを示す。
1に等しいph_lmcs_enabled_flag は、クロマ・スケーリングを伴うルマ・マッピングがPHに関連する全てのスライスに対してイネーブルにされることを示す。0に等しいph_lmcs_enabled_flag は、クロマ・スケーリングを伴うルマ・マッピングがPHに関連する1個、複数個、又は全てのスライスに対してディセーブルにされてもよいことを示す。存在しない場合、ph_lmcs_enabled_flagの値は0に等しいと推定される。
ph_lmcs_aps_idは、PHに関連付けられたスライスが参照するLMCS APSのadaptation_parameter_set_idを指定する。LMCS_APSに等しいaps_params_typeを有するAPS NALユニットのTemporalId、及びph_lmcs_aps_idに等しいadaptation_parameter_set_idは、PHに関連付けられたスライスのTemporalId以下であるものとする。
1に等しいph_chroma_residual_scale_flagは、クロマ残差スケーリングが、PHに関連する全てのスライスに対してイネーブルにされることを示す。0に等しいph_chroma_residual_scale_flagは、PHに関連する1個、複数個、又は全てのスライスに対してディセーブルにされてもよいことを示す。ph_chroma_residual_scale_flagが存在しない場合、それは0に等しいと推定される。
1に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが現在のスライスに対してイネーブルにされることを示す。0に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが現在のスライスに対してイネーブルにされないことを示す。slice_lmcs_enabled_flagが存在しない場合、それは0に等しいと推定される。
【0062】
[0053] 3.6. アフファイン・コーディングされたブロックの適応動きベクトル差分解能(AMVR)
アフィンAMVRは、アフィン・インター・コーディングされたブロックが、様々な分解能で、例えば、1/4ルマ・サンプル(デフォルトでは、amvr_flagは0に設定されている)、1/61ルマ・サンプル、1ルマ・サンプルの精度で、MV差分を送信することを可能にするコーディング・ツールである。
【0063】
[0054] SPSの関連するシンタックス要素と意味は次のように記述される:
シンタックス・テーブル
7.3.2.3 シーケンス・パラメータ・セットRBSPシンタックス
【0064】
【数21】
セマンティクス
1に等しいsps_affine_amvr_enabled_flagは、適応動きベクトル差分解能が、アフィン・インター・モードの動きベクトル・コーディングで使用されることを示す。0に等しいsps_affine_amvr_enabled_flagは、適応動きベクトル差分解能が、アフィン・インター・モードの動きベクトル・コーディングで使用されないことを示す。存在しない場合、sps_affine_amvr_enabled_flagの値は0に等しいと推定される。
3.7 サブピクチャ・レベル情報SEIメッセージ
D.7.1 サブピクチャ・レベル情報SEIメッセージ・シンタックス
【0065】
【数22】
D.7.2 サブピクチャ・レベル情報SEIメッセージ・セマンティクス
サブピクチャ・レベル情報SEIメッセージは、付属書Aに従って、サブピクチャ・シーケンスを含む抽出されたビットストリームの適合性をテストする場合に、ビットストリーム中のサブピクチャ・シーケンスが適合しているレベルに関する情報を含む。
サブピクチャ・レベル情報SEIメッセージがCLVSの任意のピクチャに対して存在する場合、サブピクチャ・レベル情報SEIメッセージは、CLVSの最初のピクチャに対して存在するものとする。
サブピクチャ・レベル情報SEIメッセージは、現在のレイヤの間、復号化順序で現在のピクチャからCLVSの終わりまで継続する。同じCLVSに適用する全てのサブピクチャ・レベル情報SEIメッセージは、同じ内容を有するものとする。サブピクチャ・シーケンスは、サブピクチャ・インデックスの同じ値を有するCLVS内の全てのサブピクチャから構成される。
サブピクチャ・レベル情報SEIメッセージがCLVSに関して存在する場合、両端を含む0ないしsps_num_subpics_minus1の範囲内のiの各値について、subpic_treated_as_pic_flag[ i ]の値は1に等しいものとする、ということはビットストリーム適合性の要件である。
num_ref_levels_minus1プラス1は、sps_num_subpics_minus1 + 1個のサブピクチャの各々に対してシグナリングされる参照レベルの数を示す。
0に等しいsli_cbr_constraint_flagは、抽出されたサブ・ビットストリーム中の任意のCPB仕様を使用してHRDを使用することによって、条項C.7に従ってビットストリームの任意のサブピクチャの抽出から生じるサブ・ビットストリームを復号化するために、仮説ストリーム・スケジューラ(hypothetical stream scheduler,HSS)は、間欠ビット・レート・モードで動作することを指定する。1に等しいsli_cbr_constraint_flagは、HSSが低ビット・レート(constant bit rate,CBR)モードで動作することを示す。
1に等しいexplicit_fraction_present_flagは、シンタックス要素ref_level_fraction_minus1[ i ]が存在することを示す。0に等しいexplicit_fraction_present_flagは、シンタックス要素ref_level_fraction_minus1[ i ]が存在しないことを示す。
sli_num_subpics_minus1プラス1は、CLVSのピクチャにおけるサブピクチャの数を
示す。存在する場合、sli_num_subpics_minus1の値は、CLVSにおけるピクチャにより参照されるSPSにおけるsps_num_subpics_minus1の値に等しいものとする。
sli_alignment_zero_bitは0に等しいものとする。
ref_level_idc[ i ]は、付属書Aで規定されているように各ピクチャが準拠するレベルを示す。ビットストリームは、附属書 A で指定されるもの以外のref_level_idc の値を含まないものとする。ref_level_idc[ i ] の他の値は、ITU-T | ISO/IECによる将来的な使用のために予約される。
ref_level_idc[i]の値が、iより大きな任意のkの値に対して、ref_level_idc[k]以下であることは、ビットストリーム適合性の要件である。
ref_level_fraction_minus1[ i ][ j ]プラス1は、条項A.4.1で規定されるように、j番目のサブピクチャが準拠するref_level_idc[ i ]に関連するレベル制限の割合を示す。
変数SubpicSizeY[ j ]は、( subpic_width_minus1[ j ] + 1 ) * CtbSizeY * ( subpic_height_minus1[ j ] + 1 ) * CtbSizeYに等しく設定される。
存在しない場合、ref_level_fraction_minus1[ i ][ j ]の値は、
Ceil( 256 * SubpicSizeY[ j ] ÷ PicSizeInSamplesY * MaxLumaPs( general_level_idc ) ÷ MaxLumaPs( ref_level_idc[ i ] ) - 1 に等しいと推定される。[Ed.(HD):ここでのPicSizeInSamplesYは、条項4.2?で規定されるようなPicSizeMaxInSamplesYであるべきではない。]
変数RefLevelFraction[ i ][ j ]は、ref_level_fraction_minus1[ i ][ j ] + 1に等しく設定される。変数SubpicNumTileCols[ j ]とSubpicNumTileRows[ j ]は、次のようにして導出される:
【0066】
【数23】
変数variables SubpicCpbSizeVcl[ i ][ j ]とSubpicCpbSizeNal[ i ][ j ]は、次のようにして導出される:
【0067】
【数24】
MaxCPBは、条項A.4.2で規定されているようなref_level_idc[ i ]から導出される。
変数SubpicBitRateVcl[ i ][ j ]とSubpicBitRateNal[ i ][ j ]は、次のようにして導出される:
【0068】
【数25】
MaxBRは、条項A.4.2で規定されているようなref_level_idc[ i ]から導出される。
NOTE1 - サブピクチャが抽出される場合、結果として生じるビットストリームはCpbSize(SPSで指定されるか又は推定されるもの)であって、SubpicCpbSizeVcl[ i ][ j ]及びSubpicCpbSizeNal[ i ][ j ]以上であるものと、BitRate(SPSで指定されるか又は推定されるもの)であって、SubpicBitRateVcl[ i ][ j ]及びSubpicBitRateNal[ i ][ j ]以上であるものとを有する。
両端を含む0ないしsps_num_subpics_minus1の範囲内のjに関するj番目のサブピクチャを抽出することから生じるビットストリームであって、0に等しいgeneral_tier_flagと 両端を含む0ないしnum_ref_level_minus1の範囲内のiに関するref_level_idc[ i ]に等しいレベルとを有するプロファイルに準拠するビットストリームは、付属書Cに規定されているような各々のビットストリーム適合性テストに関する以下の制約に従うものとする:
- Ceil( 256 * SubpicSizeY[ j ] ÷ RefLevelFraction[ i ][ j ] )は、MaxLumaPs以下であるものとし、ここで、MaxLumaPsはレベルref_level_idc[ i ]に関してテーブルA.1で規定されているものである。
- Ceil( 256 * ( subpic_width_minus1[ j ] + 1 ) * CtbSizeY ÷ RefLevelFraction[ i ][ j ] )の値は、Sqrt( MaxLumaPs * 8 )以下であるものとする。
- Ceil( 256 * ( subpic_height_minus1[ j ] + 1 ) * CtbSizeY ÷ RefLevelFraction[ i ][ j ] )の値は、Sqrt( MaxLumaPs * 8 )以下であるものとする。
- SubpicNumTileCols[ j ]の値はMaxTileCols以下であるものとし、SubpicNumTileRows[ j ]の値はMaxTileRows以下であるものとし、ここで、MaxTileColsとMaxTileRowsはレベルref_level_idc[ i ]に関してテーブルA.1で規定されているものである。
- SubpicNumTileCols[ j ] * SubpicNumTileRows[ j ]の値はMaxTileCols * MaxTileRows * RefLevelFraction[ i ][ j ]以下であるものとし、ここで、MaxTileColsとMaxTileRowsはレベルref_level_idc[ i ]に関してテーブルA.1で規定されているものである。
- j番目のサブピクチャに対応するAU 0に関するNumBytesInNalUnit変数の合計は、AU 0のSubpicSizeInSamplesYの値に関し、FormatCapabilityFactor * ( Max(SubpicSizeY[ j ], fR * MaxLumaSr * RefLevelFraction[ i ][ j ] ÷ 256 ) + MaxLumaSr * ( AuCpbRemovalTime[ 0 ] - AuNominalRemovalTime[ 0 ] ) * RefLevelFraction[ i ][ j ] ) ÷ ( 256 * MinCr )以下であり、ここで、MaxLumaSrとFormatCapabilityFactorはそれぞれ、レベルref_level_idc[ i ]でAU 0に適用するテーブルA.2とテーブルA.3で規定される値であり、MinCrはA.4.2で示されるようにして導出される[Ed.(RS):fRはA.4.2で規定されるプロファイル固有の変数である]。
- j番目のサブピクチャに対応するAU n(は0より大きい)に関するNumBytesInNalUnit変数の合計は、FormatCapabilityFactor * MaxLumaSr * ( AuCpbRemovalTime[ n ] - AuCpbRemovalTime[ n - 1 ] ) * RefLevelFraction[ i ][ j ] ÷ ( 256 * MinCr )以下であるものとし、MaxLumaSrとFormatCapabilityFactorはそれぞれ、レベルref_level_idc[ i ]でAU nに適用するテーブルA.2とテーブルA.3で規定される値であり、MinCrはA.4.2で示されるようにして導出される。
1つ以上のサブピクチャを含み且つサブピクチャ・インデックスSubpicSetIndicesのリストから構成される何らかのサブピクチャ・セットと、サブピクチャ・セットNumSubpicsInSetにおける多数のサブピクチャとに関し、サブピクチャ・セットのレベル情報が導出される。
参照レベルref_level_idc[ i ]に関するトータル・レベル割合に対する変数SubpicSetAccLevelFraction[ i ]と、サブピクチャ・セットの変数SubpicSetCpbSizeVcl[ i ], SubpicSetCpbSizeNal[ i ], SubpicSetBitRateVcl[ i ],及びSubpicSetBitRateNal[ i ]は、次のようにして導出される:
【0069】
【数26】
サブピクチャ・セット・シーケンス・レベル・インジケータSubpicSetLevelIdcの値は、次のようにして導出される:
【0070】
【数27】
ここで、MaxTileColsとMaxTileRowsはref_level_idc[ i ]に関してテーブルA.1で規定されるものである。
0に等しいgeneral_tier_flagとSubpicSetLevelIdcに等しいレベルを有するプロファイルに準拠するサブピクチャ・セット・ビットストリームは、付属書Cに規定されているような各々のビットストリーム適合性テストに関する以下の制約に従うものとする:
- VCL HRDパラメータの場合、SubpicSetCpbSizeVcl[ i ]はCpbVclFactor * MaxCPB以下であるものとし、ここで、CpbVclFactorはテーブルA.3で規定されているものであり、MaxCPBは、CpbVclFactorビットの単位でテーブルA.1で規定されている。
- NAL HRDパラメータの場合、SubpicSetCpbSizeNal[ i ]はCpbNalFactor * MaxCPB以下であるものとし、ここで、CpbNalFactorはテーブルA.3で規定されているものであり、MaxCPBは、CpbNalFactorビットの単位でテーブルA.1で規定されている。
- VCL HRDパラメータの場合、SubpicSetBitRateVcl[ i ]はCpbVclFactor * MaxBR以下であるものとし、ここで、CpbVclFactorはテーブルA.3で規定されているものであり、MaxBRは、CpbVclFactorビットの単位でテーブルA.1で規定されている。
- NAL HRDパラメータの場合、SubpicSetBitRateNal[ i ]はCpbNalFactor * MaxCR以下であるものとし、CpbNalFactorはテーブルA.3で規定されているものであり、MaxBRは、CpbNalFactorビットの単位でテーブルA.1で規定されている。
NOTE2 - サブピクチャが抽出される場合、結果として生じるビットストリームはCpbSize(SPSで指定されるか又は推定されるもの)であって、SubpicSetCpbSizeVcl[ i ][ j ]及びSubpicSetCpbSizeNal[ i ][ j ]以上であるものと、 BitRate(SPSで指定されるか又は推定されるもの)であって、SubpicSetBitRateVcl[ i ][ j ]及びSubpicSetBitRateNal[ i ][ j ]以上であるものとを有する。
3.8. スケーリング・リスト
現在のVVCドラフト・テキストにおけるスケーリング・リストに関連する最も重要なテキストは、以下のとおりである:
シーケンス・パラメータ・セットRBSPシンタックス及びセマンティクス
【0071】
【数28】
・・・
1に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されることを示す。0に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されないことを示す。
・・・
ピクチャ・ヘッダ構造シンタックス及びセマンティクス
【0072】
【数29】
・・・
1に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、16に等しく設定されることを示す。存在しない場合、ph_scaling_list_present_flagの値は、0に等しいと推定される。
ph_scaling_list_aps_idは、スケーリング・リストAPSのadaptation_parameter_set_idを示す。SCALING_APSに等しいaps_params_typeとph_scaling_list_aps_idに等しいadaptation_parameter_set_idとを有するAPS NALユニットのTemporalIdは、PHに関連するピクチャのTemporalId以下であるものとする。
・・・
ゼネラル・スライス・ヘッダ・シンタックス及びセマンティクス
【0073】
【数30】
・・・
1に等しいslice_scaling_list_present_flagは、現在のスライスに使用されるスケーリング・リスト・データが、SCALING_APSに等しいaps_params_typeとph_scaling_list_aps_idに等しいadaptation_parameter_set_idとを有する参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいslice_scaling_list_present_flagは、現在のピクチャに使用されるスケーリング・リスト・データが、条項7.4.3.2.1で規定されているように導出されるデフォルト・スケーリング・データであることを示す。存在しない場合、slice_scaling_list_present_flagの値は0に等しいと推定される。
・・・
変換係数のスケーリング・プロセス
・・・
x = 0..nTbW - 1, y = 0..nTbH - 1に関し、スケーリングされた変換係数d[ x ][ y ]の導出には、以下が適用される:
- 中間スケーリング因子m[ x ][ y ]は、次のようにして導出される:
- 以下の条件のうちの1つ以上が真である場合、m[ x ][ y ]は16に等しく設定される:
- sps_scaling_list_enabled_flagは、0に等しい。
【0074】
- ph_scaling_list_present_flagは、0に等しい。
【0075】
- transform_skip_flag[ xTbY ][ yTbY ][ cIdx ]は、1に等しい。
【0076】
- scaling_matrix_for_lfnst_disabled_flagは1に等しく、且つApplyLfnstFlagは1に等しい。
【0077】
- ・・・
・・・
7.3.2.5 適応パラメータ・セットRBSPシンタックス
【0078】
【数31】
7.3.2.2.1 スケーリング・リスト・データ・シンタックス
【0079】
【数32】
1に等しいscaling_matrix_for_lfnst_disabled_flagは、スケーリング・マトリクスが、LFNSTでコーディングされたブロックに適用されないことを示す。0に等しいscaling_matrix_for_lfnst_disabled_flagは、スケーリング・マトリクスが、LFNSTでコーディングされたブロックに適用されてもよいことを示す。
4. 開示される技術的解決策により対処される技術的問題
[0055] VVCにおけるサブピクチャ及びLMCSの既存の設計には、以下の問題がある:
1)(サブピクチャに含まれるタイル行の数を指定する)リストSubpicNumTileRows[]の導出は、式D.5であるが、正しいものではなく、なぜなら式中のCtbToTileRowBd[idx]のインデックス値idxが、最大許容値よりも大きくなり得るからである。更に、SubpicNumTileRows[]及びSubpicNumTileCols[](サブピクチャに含まれるタイル列の数を指定するもの)双方の導出は、CTUベースの演算を使用しており、これは不必要に複雑である。
【0080】
2)single_slice_per_subpic_flagが1に等しい場合に式29でアレイCtbAddrInSliceを導出することは正しいものではなく、なぜなら、各スライスのアレイ中のラスター走査CTBアドレスの値は、CTUのラスター走査順序ではなく、CTUの復号化順序におけるものであることを必要とするからである。
【0081】
3)LMCSシグナリングは非効率的である。ph_lmcs_enabled_flagが1に等しい場合、ほとんどのケースにおいて、LMCSはピクチャの全てのスライスに対してイネーブルにされる。しかしながら、現在のVVC設計では、LMCSがピクチャの全てのスライスに対してイネーブルにされているケースの場合、ph_lmcs_enabled_flagは1に等しいだけでなく、値が1のslice_lmcs_enabled_flagもまた、各スライスに対してシグナリングされることを必要とする。
【0082】
a. ph_lmcs_enabled_flagの意味(セマンティクス)は、ph_lmcs_enabled_flagが真である場合に、スライス・レベルLMCSフラグをシグナリングしようとする動向と競合する。現在のVVCでは、ph_lmcs_enabled_flagが真である場合、全てのスライスがLMCSをイネーブルにするものとすることを意味する。従って、スライス・ヘッダにおいてフラグをイネーブルにするLMCSを更にシグナリングする必要はない。
【0083】
b. 更に、ピクチャ・ヘッダがLMCSはイネーブルにされていることを伝える場合、典型的には、全てのスライスについて、LMCSは全てイネーブルにされる。スライス・ヘッダにおけるLCMSの制御は、主に、コーナー・ケースを取り扱うためのものである。従って、PH LMCSフラグが真であり且つSH LMCSフラグが常にシグナリングされる場合、それは、一般のユース・ケースに対してシグナリングされる不必要なビットの結果となる可能性がある。
【0084】
4)SPSアフィンAMVRフラグのセマンティクスは正しいものではなく、なぜなら、各々のアフィン・インター・コーディングされたCUに対して、アフィンAMVRはイネーブルに又はディセーブルにされる可能性があるからである。
【0085】
5)スライス・ヘッダ内のスケーリング・リスト・フラグ、即ち、slice_scaling_list_present_flagは、変換係数のスケーリング・プロセスを制御するためには使用されず、実際には無用である。
【0086】
6)slice_scaling_list_present_flagが変換係数のスケーリング・プロセスを制御するために使用される場合でさえ、スケーリング・リスト・シグナリングは非効率的である。ph_scaling_list_present_flagが1に等しい場合、ほとんどのケースにおいて、明示的なスケーリング・リストが、ピクチャの全てのスライスに使用される。しかしながら、現在のVVC設計では、明示的なスケーリング・リストがピクチャの全てのスライスについてイネーブルにされる場合、ph_scaling_list_present_flagが1に等しいことを必要とするだけでなく、値が1であるスライス・フラグslice_scaling_list_present_flagが、各スライスについてシグナリングされることを必要とする。
【0087】
7)LFNSTコーディングされたブロックに対して、残差分布は、プライマリ変換のみが適用される場合と相違する可能性がある。明示的にシグナリングされたスケーリング・リストが、それらのLFNSTコーディングされたブロックに適用されない、より高い可能性が存在する。しかしながら、明示的にシグナリングされるスケーリング・リストを適用することが許容されるかどうかは、APSでシグナリングされ、これは不要なビットを浪費する可能性がある
[0056] 1. 例示的な実施例及び実施形態
上記の問題点、及び言及されていない他の幾つかの問題点を解決するために、以下に要約される方法が開示される。アイテムは、一般的な概念を説明するための例示として考慮されるべきであり、狭義に解釈されるべきではない。更に、これらのアイテムは、個別的に又は任意の方法で組み合わせて適用されることが可能である。
【0088】
第1及び第2の問題を解決するためのサブピクチャに関連するもの
1. 以下の1つ以上のアプローチが開示される:
a. ピクチャの各CTU列のタイル列インデックスが導出される。
【0089】
b. サブピクチャに含まれるタイル列の数の導出は、サブピクチャに含まれる左端及び/又は右端のCTUのタイル列インデックスに基づいている。
【0090】
c. ピクチャの各CTU行のタイル行インデックスが導出される。
【0091】
d. サブピクチャに含まれるタイル行の数の導出は、サブピクチャに含まれる上及び/又は下CTUのタイル行インデックスに基づいている。
【0092】
e. ピクチャ・レベルのスライス・インデックスという用語は、以下のように定義される:インデックスは、rect_slice_flagが1に等しい場合に定められるスライスについてのものであり、single_slice_per_subpic_flagが0に等しい場合にスライスがPPSでシグナリングされる場合の順序、又はsingle_slice_per_subpic_flagが1に等しい場合のスライスに対応するサブピクチャの増加するサブピクチャ・インデックスの順序、におけるピクチャのスライスのリストを指すものである。
【0093】
f. 一例において、サブピクチャが、タイルからパーティション化されたスライスを含む場合、サブピクチャの高さはタイルの観点からカウントすることはできない。
【0094】
g. 一例において、サブピクチャの高さは、タイルではなく、CTUの観点からカウントすることができる。
【0095】
h. サブピクチャの高さは1つのタイル行よりも低いかどうかが導出される。
【0096】
i. 一例において、サブピクチャの高さが1つのタイル行より低いかどうかは、サブピクチャが1つのタイル行からのCTUのみを含む場合であって、サブピクチャのトップCTUがタイル行のトップCTUではないか、又はサブピクチャのボトムCTUがタイル行のボトムCTUではない場合に、真であると導出される。
【0097】
ii. 各サブピクチャが1つのスライスのみを含み、サブピクチャの高さが1つのタイル行よりも低いことが示されている場合、ピクチャのピクチャ・レベル・スライス・インデックスiを有する各スライスに関し、両端を含む0ないしスライス中のCTUの数マイナス1の範囲内のjに関し、CtbAddrInSlice[ i ][ j ]の値は、サブピクチャのCTUラスター走査におけるj番目のCTUのピクチャ・ラスター走査CTUアドレスであるように導出される。
【0098】
iii. 一例において、サブピクチャの高さが1つのタイル行よりも低いかどうかは、サブピクチャの上CTUとサブピクチャの下CTUとの間の距離が、CTUに関してタイルの高さよりも低い場合に、真であると導出される。
【0099】
iv. 各サブピクチャが1つのスライスのみを含み、サブピクチャの高さが1つのタイル行以上であることが示されている場合、ピクチャのピクチャ・レベル・スライス・インデックスiを有する各スライスに関し、両端を含む0ないしスライス中のCTUの数マイナス1の範囲内のjに関し、CtbAddrInSlice[ i ][ j ]の値は、以下のCTUの順序でj番目のCTUのピクチャ・ラスター走査CTUアドレスであるように導出される:
1) サブピクチャ内の様々なタイルのCTUは、タイル・インデックスの値が小さい第1のタイル内の第1のCTUが、タイル・インデックスの値が大きい第2のタイル内の第2のCTUに先行するように順序付けられる。
【0100】
2) サブピクチャの1つのタイル内のCTUは、タイルのCTUラスター・スキャンで順序付けられる。
第3の問題(副次的な問題を含む)を解決するためのLMCSに関連するもの
2. LMCSの2レベル制御が導入され(ルマ・マッピング(RPで示されるリシェイピング・プロセス)とルマ依存クロマ残差スケーリング(chroma residual scaling,CRS)の2つの側面を含む)、高レベル(例えば、ピクチャ・レベル)と低レベル(例えば、スライス・レベル)の制御が使用され、低レベル制御情報が存在するかどうかは、高レベル制御情報に依存する。また、以下が適用される:
a. 第1の例では、以下の副次的な項目のうちの1つ以上が適用される:
i. 第1のインジケータ(e.g., ph_lmcs_enabled_type)は、より高いレベル(例えば、ピクチャ・ヘッダ(PH)において)シグナリングされ、非バイナリ値であるより低いレベルでLMCSがどのようにイネーブルにされるかを指定することができる。
【0101】
1) 一例において、第1のインジケータがXに等しい場合(e.g., X = 2)、それは、LMCSがPHに関連する全てのスライスに対してイネーブルにされることを指定する;第1のインジケータがYに等しい場合(Y! = X)(e.g., Y = 1)、それはLMCSがPHに関連する1個又は複数個のスライスに対してはイネーブルにされるが、全てについてはそうではないことを指定する;第1のインジケータがZに等しい場合(Z! = X且つZ!= Y)(e.g., Z = 0)、それは、LMCSがPHに関連する全てのスライスに対してディセーブルにされることを指定する。
【0102】
a) 代替的に、更に、第1のインジケータが存在しない場合、インジケータの値は、Zのようなデフォルト値に等しいと推定される。
【0103】
2) 一例において、第1のインジケータがXに等しい場合(e.g., X = 2)、それは、LMCSがPHに関連する全てのスライスに対してディセーブルにされることを指定する;第1のインジケータがYに等しい場合(Y! = X)(e.g., Y = 1)、それはLMCSがPHに関連する1個又は複数個のスライスに対してはディセーブルにされるが、全てについてはそうではないことを指定する;第1のインジケータがZに等しい場合(Z! = X且つZ!= Y)(e.g., Z = 0)、それは、LMCSがPHに関連する全てのスライスに対してイネーブルにされることを指定する。
【0104】
a) 代替的に、更に、第1のインジケータが存在しない場合、インジケータの値は、Xのようなデフォルト値に等しいと推定される。
【0105】
3) 代替的に、更に、第1のインジケータは、シーケンス・レベルにおけるLMCSイネーブリング・フラグの値に従って条件付きでシグナリングされてもよい(e.g., sps_lmcs_enabled_flag)。
【0106】
4) 代替的に、更に、第1のインジケータは、u(v)又はu(2)又はue(v)とともにコーディングされる可能性がある。
【0107】
5) 代替的に、更に、第1のインジケータは、打ち切られたユーナリー・コード(truncated unary code)とともにコーディングされる可能性がある。
【0108】
6) 代替的に、更に、スライス及び/又はCSイネーブリング・フラグ(e.g., ph_chroma_residual_scale_flag)により使用されるLMCS APS情報(e.g., ph_lmcs_aps_id)は、第1のインジケータの値の条件検査の下でシグナリングされる可能性がある。
【0109】
ii. 下位レベルのLMCSをイネーブル/ディセーブルにする第2のインジケータ(e.g., slice_lmcs_enabled_flag)は、下位レベルで(e.g., スライス・ヘッダで)シグナリングされることが可能であり、且つそれは第1のインジケータの値をチェックすることによって条件付きでシグナリングされることが可能である。
【0110】
1) 一例において、第2のインジケータは、「第1のインジケータがYに等しい」ということの条件チェックの下でシグナリングされてもよい。
【0111】
a) 代替的に、第2のインジケータは、「第1のインジケータの値 >> 1」又は「第1のインジケータの値/2」又は「第1インジケータの値 & 0x01」の条件チェックの下でシグナリングされてもよい。
【0112】
b) 代替的に、更に、第1のインジケータがXに等しい場合に、それはイネーブルにされていると推定されてもよく;又は、第1のインジケータがZに等しい場合に、それはディセーブルにされていると推定されてもよい。
【0113】
b. 第2の例では、以下の副次的な項目のうちの1つ以上が適用される:
i. 1つより多いインジケータがシグナリングされてもよく、また、LMCSが下位レベルでどのようにイネーブルにされるかを指定するために上位レベルで(e.g., ピクチャ・ヘッダ(PH)で)シグナリングされてもよい。
【0114】
1)一例において、2つのインジケータ(e.g., 2つの1ビット・フラグ)が、PHでシグナリングされてもよい。
【0115】
a) 一例において、第1のインジケータは、LMCSをイネーブルにするPHに関連するスライスが少なくとも1つあるかどうかを指定する。また、第2のインジケータは、PHに関連する全てのスライスがLMCSをイネーブルにするかどうかを指定する。
【0116】
i. 代替的に、更に、第2のインジケータは、第1のインジケータの値に従って条件付きで、例えば、第1のインジケータがLMCSをイネーブルにするスライスが少なくとも1つの存在することを指定する場合に、シグナリングされてもよい。
【0117】
i. 代替的に、更に、第2のインジケータが存在しない場合、全てのスライスがLMCSをイネーブルにすることが推定される。
【0118】
ii. 代替的に、更に、第3のインジケータは、第2のインジケータの値に従ってSHにおいて条件付きで、例えば、スライスの全てがLMCSをイネーブルにするわけではないことを第2のインジケータが指定している場合に、シグナリングされてもよい。
【0119】
i. 代替的に、更に、第3のインジケータが存在しない場合、第1及び/又は第2のインジケータの値に従って推定されてもよい(例えば、第1のインジケータの値に等しいと推定される)。
【0120】
b) 代替的に、第1のインジケータは、LMCSをディセーブルにするPHに関連するスライスが少なくとも1つあるかどうかを指定する。第2のインジケータは、PHに関連する全てのスライスがLMCSをディセーブルにするかどうかを指定する。
【0121】
i. 代替的に、更に、第2のインジケータは、第1のインジケータの値に従って条件付きで、例えば、第1のインジケータがLMCSをディセーブルにするスライスが少なくとも1つの存在することを指定する場合に、シグナリングされてもよい。
【0122】
i. 代替的に、更に、第2のインジケータが存在しない場合、PHに関連する全てのスライスがLMCSをイネーブルにすることが推定される。
【0123】
ii. 代替的に、更に、第3のインジケータは、第2のインジケータの値に従ってSHにおいて条件付きで、例えば、スライスの全てがLMCSをイネーブルにするわけではないことを第2のインジケータが指定している場合に、シグナリングされてもよい。
【0124】
i. 代替的に、更に、第3のインジケータが存在しない場合、第1及び/又は第2のインジケータの値に従って推定されてもよい(例えば、第1のインジケータの値に等しく推定される)。
【0125】
2) 代替的に、更に、第1のインジケータは、シーケンス・レベルにおけるLMCSイネーブリング・フラグの値に従って条件付きでシグナリングされてもよい(e.g., sps_lmcs_enabled_flag)。
【0126】
ii. 下位レベルのLMCSをイネーブル/ディセーブルにする第3のインジケータ(e.g., slice_lmcs_enabled_flag)は、下位レベルで(e.g., スライス・ヘッダで)シグナリングされることが可能であり、且つそれは第1のインジケータ及び/又は第2のインジケータの値をチェックすることによって条件付きでシグナリングされることが可能である。
【0127】
1) 一例において、第3のインジケータは、「全てのスライスがLMCSをイネーブルにするわけではないこと」又は「全てのスライスがLMCSをディセーブルにするわけではないこと」の条件チェックの下でシグナリングされてもよい。
【0128】
c. 更に別の例では、第1/第2の例で言及された第1及び/又は第2及び/又は第3のインジケータが、LMCSの代わりに、RP又はCRSの使用を制御するために使用されてもよい。
【0129】
3. SPS/PH/SHの3つのLMCSフラグのセマンティクスは、次のように更新される:
1に等しいsps_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが、CLVSで<<<使用される>>>使用されてもよいことを指定する。0に等しいsps_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが、CLVSで使用されないことを指定する。
【0130】
1に等しいph_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングがPHに関連する全てのスライスに対して<<<イネーブルにされる>>>イネーブルにされてもよいことを示す。0に等しいph_lmcs_enabled_flag は、クロマ・スケーリングを伴うルマ・マッピングがPHに関連する<<<1個、複数個、又は全てのスライスに対してディセーブルにされてもよい>>>全てのスライスに対してディセーブルにされることを示す。存在しない場合、ph_lmcs_enabled_flagの値は0に等しいと推定される。
【0131】
1に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが現在のスライスに対して<<<イネーブルに>>>使用されることを示す。0に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが現在のスライスに対して<<<イネーブルに>>>使用されないことを示す。slice_lmcs_enabled_flagが存在しない場合、それは0に等しいと推定される。
【0132】
a. PH及び/又はSH LMCSシグナリングは、LMCSがピクチャの全てのスライスに使用される場合に、LMCSシグナリングがSHに存在しないように変更される。
【0133】
i. 代替的に、更に、LMCSがどのように推定されるかは、PH LMCSシグナリングに依存する。
【0134】
1) 一例において、LMCSがピクチャの全てのスライスに使用される場合に、それはイネーブルにされていると推定され;LMCSがピクチャの全てのスライスに使用されない場合に、それはディセーブルにされていると推定される。
アフィンAMVRに関連するもの
4. SPSのアフィンAMVRフラグのセマンティクスは、次のようにアップデートされる:
1に等しいsps_affine_amvr_enabled_flagは、適応動きベクトル差分解能が、アフィン・インター・モードの動きベクトル・コーディングで使用され<<<る>>>てもよいことを示す。0に等しいsps_affine_amvr_enabled_flagは、適応動きベクトル差分解能が、アフィン・インター・モードの動きベクトル・コーディングで使用されないことを示す。存在しない場合、sps_affine_amvr_enabled_flagの値は0に等しいと推定される。
第5及び6の問題を解決のためのスケーリング・リストに関連するもの
5. ブロックの場合、変換係数及び/又は非-変換係数のスケーリング・プロセスは、ピクチャより小さいビデオ領域、例えばスライス、に関連するシンタックス要素に従って制御される。
【0135】
a. 一例において、変換係数のスケーリング・プロセスを制御するためにSPSフラグsps_scaling_list_enabled_flag及びPHフラグph_scaling_list_present_flagを使用する代わりに、スライス・ヘッダにおけるスケーリング・リスト・フラグ、例えばslice_scaling_list_present_flagが、例えば実施形態3でのように使用される。
【0136】
6. 明示的なスケーリング・リストの2レベル制御が導入され、高レベル(例えば、ピクチャ・レベル)制御と低レベル(例えば、スライス・レベル)制御が使用され、低レベル制御情報が存在するかどうかは、高レベル制御情報に依存する。明示的なスケーリング・リストは、変換係数及び/又は非-変換係数のスケーリング・プロセスで使用されることが可能である。更に、以下が適用される:
a. 第1の例では、以下の副次的な項目のうちの1つ以上が適用される:
i. 第1の非二進値インジケータ(e.g., ph_explicit_scaling_list_enabled_type)は、より高いレベル(例えば、ピクチャ・ヘッダ(PH)において)シグナリングされ、明示的なスケーリング・リストが低レベルでどのようにイネーブルにされるかを指定することができる。
【0137】
1) 一例において、第1のインジケータがXに等しい場合(e.g., X = 2)、それは、明示的なスケーリング・リストがPHに関連する全てのスライスに対してイネーブルにされることを指定する;第1のインジケータがYに等しい場合(Y! = X)(e.g., Y = 1)、それは明示的なスケーリング・リストがPHに関連する1個又は複数個のスライスに対してはイネーブルにされるが、全てについてはそうではないことを指定する;第1のインジケータがZに等しい場合(Z! = X且つZ!= Y)(e.g., Z = 0)、それは、明示的なスケーリング・リストがPHに関連する全てのスライスに対してディセーブルにされることを指定する。
【0138】
a) 代替的に、更に、第1のインジケータが存在しない場合、インジケータの値は、Zのようなデフォルト値に等しいと推定される。
【0139】
b) 代替的に、更に、第1のインジケータがYに等しい場合(Y!=X)(e.g., Y=1)、それは、スライスをデコードする場合に変換係数及び/又は非-変換係数のスケーリング・プロセスにおける明示的なスケーリング・リストの使用が、ピクチャに対してイネーブルにされることを指定する。
【0140】
c) 代替的に、第1のインジケータがYに等しい場合(Y!=X)(e.g., Y=1)、それは、スライスをデコードする場合に変換係数及び/又は非-変換係数のスケーリング・プロセスにおける明示的なスケーリング・リストの使用が、ピクチャに対してイネーブルにされてもよいことを指定する。
【0141】
2) 一例において、第1のインジケータがXに等しい場合(e.g., X = 2)、それは、明示的なスケーリング・リストがPHに関連する全てのスライスに対してディセーブルにされることを指定する;第1のインジケータがYに等しい場合(Y! = X)(e.g., Y = 1)、それは明示的なスケーリング・リストがPHに関連する1個又は複数個のスライスに対してはイネーブルにされるが、全てについてはそうではないことを指定する;第1のインジケータがZに等しい場合(Z! = X且つZ!= Y)(e.g., Z = 0)、それは、明示的なスケーリング・リストがPHに関連する全てのスライスに対してイネーブルにされることを指定する。
【0142】
a) 代替的に、更に、第1のインジケータが存在しない場合、インジケータの値は、Xのようなデフォルト値に等しいと推定される。
【0143】
b) 代替的に、第1のインジケータがYに等しい場合(Y!=X)(e.g., Y=1)、それは、スライスをデコードする場合に変換係数及び/又は非-変換係数のスケーリング・プロセスにおける明示的なスケーリング・リストの使用が、ピクチャに対してディセーブルにされてもよいことを指定する。
【0144】
c) 代替的に、第1のインジケータがYに等しい場合(Y!=X)(e.g., Y=1)、それは、スライスをデコードする場合に変換係数及び/又は非-変換係数のスケーリング・プロセスにおける明示的なスケーリング・リストの使用が、ピクチャに対してディセーブルにされることを指定する。
【0145】
3) 代替的に、更に、第1のインジケータは、シーケンス・レベルにおける明示的なスケーリング・リスト・イネーブリング・フラグの値に従って条件付きでシグナリングされてもよい(e.g., sps_explicit_scaling_list_enabled_flag)。
【0146】
4) 代替的に、更に、第1のインジケータは、u(v)又はu(2)又はue(v)とともにコーディングされる可能性がある。
【0147】
5) 代替的に、更に、第1のインジケータは、打ち切られたユーナリー・コードとともにコーディングされる可能性がある。
【0148】
6) 代替的に、更に、スライスにより使用されるスケーリング・リストAPS(e.g., ph_explicit_scaling_list_aps_id)は、第1のインジケータの値の条件検査の下でシグナリングされる可能性がある。
【0149】
ii. 下位レベルの明示的なスケーリング・リストをイネーブル/ディセーブルにする第2のインジケータ(e.g., slice_scaling_list_present_flag)は、下位レベルで(e.g., スライス・ヘッダで)シグナリングされることが可能であり、且つそれは第1のインジケータの値をチェックすることによって条件付きでシグナリングされることが可能である。
【0150】
1) 一例において、第2のインジケータは、「第1のインジケータがYに等しい」ということの条件チェックの下でシグナリングされてもよい。
【0151】
a) 代替的に、第2のインジケータは、「第1のインジケータの値 >> 1」又は「第1のインジケータの値/2」又は「第1インジケータの値 & 0x01」の条件チェックの下でシグナリングされてもよい。
【0152】
b) 代替的に、更に、第2のインジケータは無くてもよく、第1のインジケータがXに等しい場合に、それはイネーブルにされていると推定されてもよく;又は、第1のインジケータがZに等しい場合に、それはディセーブルにされていると推定されてもよい。
【0153】
b. 第2の例では、以下の副次的な項目のうちの1つ以上が適用される:
i. 明示的なスケーリング・リストが下位レベルでどのようにイネーブルにされるかを指定するために、1つより多いインジケータが上位レベルで(e.g., ピクチャ・ヘッダ(PH)で)シグナリングされてもよい。
【0154】
1)一例において、2つのインジケータ(e.g., 2つの1ビット・フラグ)が、PHでシグナリングされてもよい。
【0155】
a) 一例において、第1のインジケータは、明示的なスケーリング・リストをイネーブルにするPHに関連するスライスが少なくとも1つあるかどうかを指定する。また、第2のインジケータは、PHに関連する全てのスライスが、スケーリング・リストをイネーブルにするかどうかを指定する。
【0156】
i. 代替的に、更に、第2のインジケータは、第1のインジケータの値に従って条件付きで、例えば、第1のインジケータが、明示的なスケーリング・リストをイネーブルにするスライスが少なくとも1つの存在することを指定する場合に、シグナリングされてもよい。
【0157】
i. 代替的に、更に、第2のインジケータが存在しない場合、全てのスライスが、明示的なシグナリング・リストをイネーブルにすることが推定される。
【0158】
ii. 代替的に、第1 のインジケータが適合性ビットストリームにおいて偽(false)である場合、第2のインジケータは偽でなければならないことが、要求される。
【0159】
ii. 代替的に、更に、第3のインジケータは、第1のインジケータの値及び第2のインジケータの値のうちの少なくとも1つに従って条件付きで、例えば、第1のインジケータが、少なくとも1つのスライスは明示的なスケーリング・リストをイネーブルにしていることを指定しており、且つ第2のインジケータが、全てではないスライスが明示的なスケーリング・リストをイネーブルにしていることを指定している場合に、シグナリングされてもよい。
【0160】
i. 代替的に、更に、第3のインジケータが存在しない場合、それは、第1及び/又は第2のインジケータの値に従って推定されてもよい(例えば、第1のインジケータの値に等しく推定される)。
【0161】
b) 代替的に、第1のインジケータは、明示的なスケーリング・リストをディセーブルにするPHに関連するスライスが少なくとも1つあるかどうかを指定する。第2のインジケータは、PHに関連する全てのスライスが明示的なスケーリング・リストをディセーブルにするかどうかを指定する。
【0162】
i. 代替的に、更に、第2のインジケータは、第1のインジケータの値に従って条件付きで、例えば、第1のインジケータが、明示的なスケーリング・リストをディセーブルにするスライスが少なくとも1つの存在することを指定する場合に、シグナリングされてもよい。
【0163】
i. 代替的に、更に、第2のインジケータが存在しない場合、PHに関連する全てのスライスが、明示的なスケーリング・リストをディセーブルにすることが推定される。
【0164】
ii. 代替的に、更に、第3のインジケータは、第1のインジケータの値、及び第2のインジケータの値のうちの少なくとも1つに従ってSHにおいて条件付きで、例えば、第1のインジケータが、少なくとも1つのスライスは明示的なスケーリング・リストをイネーブルにしていることを指定しており、且つ第2のインジケータが、全てではないスライスが明示的なスケーリング・リストをディセーブルにしていることを指定している場合に、シグナリングされてもよい。
【0165】
i. 代替的に、更に、第3のインジケータが存在しない場合、それは、第1及び/又は第2のインジケータの値に従って推定されてもよい(例えば、第1のインジケータの値に等しく推定される)。
【0166】
2)代替的に、更に、第1のインジケータは、シーケンス・レベルにおける明示的なスケーリング・リスト・イネーブリング・フラグの値に従って条件付きでシグナリングされてもよい(e.g., sps_explicit_scaling_list_enabled_flag)。
【0167】
iv. 下位レベルの明示的なスケーリング・リストをイネーブル/ディセーブルにする第3のインジケータ(e.g., slice_explicit_scaling_list_enabled_flag)は、下位レベルで(e.g., スライス・ヘッダで)シグナリングされることが可能であり、且つそれは第1のインジケータ及び/又は第2のインジケータの値をチェックすることによって条件付きでシグナリングされることが可能である。
【0168】
1) 一例において、第3のインジケータは、「全てのスライスが明示的なスケーリング・リストをイネーブルにするわけではないこと」又は「全てのスライスが明示的なシグナリング・リストをディセーブルにするわけではないこと」の条件チェックの下でシグナリングされてもよい。
【0169】
c. 第3の例では、2つの1ビット・フラグが上位レベルで(例えば、ピクチャ・ヘッダ(PH)で)シグナリングされて、明示的なスケーリング・リストが下位レベルで(例えば、スライス・ヘッダ(SH)で)どのようにイネーブルにされるかを指定する。
【0170】
i. 1に等しい第1のPHフラグ(例えば、ph_all_slices_use_explicit_scaling_list_flagと名付けられるもの)は、ピクチャの全てのスライスが、明示的なスケーリング・リストを使用することを指定する。0に等しい第1のPHフラグは、ピクチャの各スライスが、明示的なスケーリング・リストを使用しても使用しなくてもよいことを指定する。
【0171】
ii. 1に等しい第2のPHフラグ(例えば、ph_no_slice_uses_explicit_scaling_list_flagと名付けられるもの)は、ピクチャのどのスライスも、明示的なスケーリング・リストを使用しないことを指定する。0に等しい第2のPHフラグは、ピクチャの各スライスが、明示的なスケーリング・リストを使用しても使用しなくてもよいことを指定する。
【0172】
iii. 第2のPHフラグは、第1のPHフラグが0に等しい場合に限ってシグナリングされる。
【0173】
iv. 第1のPHフラグが1に等しい場合(又は第1のPHフラグが0に等しく、第2のPHフラグが0に等しい場合)、スケーリング・リストAPS IDは、PHでシグナリングされる。
【0174】
v. 第1のPHフラグが0に等しく、第2のフラグが0に等しい場合、SHフラグ(例えば、slice_use_explicit_scaling_list_flagと名付けられるもの)は、SHフラグでシグナリングされる。
【0175】
vi. 第1のPHフラグが1に等しい場合、SHフラグの値は0に等しいと推定される。
【0176】
vii. 第1のPHフラグが0に等しく、第2のPHフラグが0に等しい場合、SHフラグの値は0に等しいと推定される。
【0177】
viii. SHフラグの値が1に等しい場合、スライスをデコードするために、明示的なスケーリング・リストが使用される。それ以外の場合、明示的なスケーリング・リストは、スライスをデコードするために使用される。
【0178】
d. 第4の例では、スケーリング・リスト関連態様(例えば、イネーブル化/ディセーブル化、APS ID)のうちの1つ以上又は各々がPH又はSHに存在するかどうかの1つ以上のインジケータが、シグナリングされる可能性がある。
【0179】
i. 代替的に、1つのインジケータが使用され、更に、インジケータは、1ビット・フラグである。
【0180】
1) 一例において、インジケータが、関連する態様がPHに存在することを指定している場合、全てのスライスは、PHに存在する値を推定し、それらの関連する態様のシグナリングは、SHにおいてスキップされる。
【0181】
2) 一例において、インジケータが、関連する態様がSHに存在することを指定している場合、それらの関連する態様のシグナリングは、PHにおいてスキップされる。
【0182】
ii. 一例において、1つ以上のインジケータは、PHでシグナリングされる。
【0183】
iii. 別の例において、1つ以上のインジケータは、PPSでシグナリングされる。
【0184】
iv. 別の例において、1つ以上のインジケータは、SPSでシグナリングされる。
7. LFNSTコーディングされたブロックのために明示的なスケーリング・リストをイネーブルにするかどうかは、APSで指定する代わりに、シーケンス/ピクチャ/スライス・レベルで指定することができる。
【0185】
a. 一例において、シンタックス要素(例えば、フラグ)は、SPS/PPS/PH/SHでシグナリングされてもよい。
【0186】
i. 代替的に、更に、シンタックス要素は、LFNSTがイネーブルにされるかどうかの条件チェックの下で(例えば、sps_lfnst_enabled_flagは1に等しい)、シグナリングされてもよい。
【0187】
ii. 代替的に、更に、ビデオ・ブロックに関し、明示的なスケーリング・リストを適用するか又はデフォルトのスケーリング・リストを適用するかどうかは、シンタックス要素の値と、LFNSTがこのビデオ・ブロックに対してイネーブルにされているか否かとに依存する可能性がある。
8. ビデオ・ユニットの境界に沿ったビデオ・ユニットのサンプルに関するデブロッキング・フィルタリング・プロセスは、パディングされたサンプルに基づいて実行されてもよい。
図11は、サンプルp0,p1,及びp2がビデオ・ユニットの境界に沿ったビデオ・ユニットのサンプルであり、サンプルq0,q1,及びq2がフィルタリング・プロセスで使用されることになるパディングされたサンプルである例を示す。
【0188】
a. 一例において、ビデオ・ユニットはピクチャであってもよい。
【0189】
b. 一例において、ビデオ・ユニットはサブピクチャであってもよい。
【0190】
c. 一例において、ビデオ・ユニットはスライスであってもよい。
【0191】
d. 一例において、ビデオ・ユニットはタイルであってもよい。
【0192】
e. 一例において、ビデオ・ユニットは、漸進的復号化リフレッシュ(GDR)におけるリフレッシュ領域であってもよく、境界は、ピクチャ内のリフレッシュ領域と未リフレッシュ領域との間の境界であってもよく、更に、そのような境界は仮想境界としてシグナリングされてもよい。
【0193】
f. 一例において、パディングは複製方式で実行されてもよい。例えば、q0,q1,及びq2の値は全てp0の値に等しく設定されてもよい。一例において、パディングは、対称的な方式で実行されてもよい。例えば、q0,q1,及びq2の値は、それぞれp0,p1,及びp2の値に等しく設定されてもよい。
6. 実施形態
実施形態では、特定のテキストは太字のイタリック体で示されており(翻訳の便宜上、下線テキストとして示される)、仕様の現行バージョンに対する変更を強調している。イタリック体のテキストは、対応する実施形態の現行VVC仕様の記述から削除される(翻訳の便宜上、<<< >>>内のテキストとして示される)。
6.1 実施形態1:サブピクチャのサポート
この実施形態は、アイテム1及びそのサブ・アイテムに関連する。
3. 定義
picture-level slice index: rect_slice_flagが1に等しい場合に定義されるスライスのインデックスであって、single_slice_per_subpic_flagが1に等しい場合にPPS内でスライスがシグナリングされる場合の順序、又はsingle_slice_per_subpic_flagが1に等しい場合にスライスに対応するサブピクチャの増加するサブピクチャ・インデックスの順序で、ピクチャ内のスライスのリストに対するもの。
<<< picture-level slice index:rect_slice_flagが1に等しい場合にPPSでシグナリングされる順番におけるピクチャ内のスライスのリストに対するスライスのインデックス>>>
6.5.1 CTBラスター走査、タイル走査、及びサブピクチャ走査プロセス
・・・
両端を含む0ないしPicWidthInCtbsYの範囲に及ぶctbAddrXに対するリストCtbToTileColBd[ ctbAddrX ]及びctbToTileColIdx[ ctbAddrX ]は、水平CTBアドレスをCTBの単位で左タイル列境界に及びタイル列インデックスにそれぞれ変換するものであり、次のようにして導出される:
【0194】
【数33】
NOTE 3 - 上記の導出における
アレイCtbToTileColBd[ ]
及びctbToTileColIdx[ ]のサイズは、CTBの実際のピクチャ幅より1つ大きい。
両端を含む0ないしPicHeightInCtbsYの範囲に及ぶctbAddrYに対する
リストCtbToTileRowBd[ ctbAddrY ]及び
ctbToTileRowIdx[ ctbAddrY ]は、垂直CTBアドレスをCTBの単位で上タイル列境界に及び
タイル行インデックスにそれぞれ変換するものであり、次のようにして導出される:
【0195】
【数34】
NOTE 4 - 上記の導出における
アレイCtbToTileRowBd[ ]及び
ctbToTileRowIdx[ ]のサイズは、CTBの実際のピクチャ高さより1つ大きい。
両端を含む0ないしsps_num_subpics_minus1の範囲に及ぶiに対するリストSubpicWidthInTiles[ i ]及びSubpicHeightInTiles[ i ]は、それぞれ列及び行のi番目のサブピクチャの幅及び高さを示すものであり、両端を含む0ないしsps_num_subpics_minus1に及ぶiに対するリストsubpicHeightLessThanOneTileFlag[ i ]は、i番目のサブピクチャの高さがタイル行1つより低いか否かを指定するものであり、これらは次のようにして導出される:
【0196】
【数35】
NOTE 5 - タイルが複数の矩形スライスにパーティション化され、タイルの矩形スライスのサブセットのみがi番目のサブピクチャに含まれる場合、タイルは、SubpicHeightInTiles[ i ]の値における1つのタイルとしてカウントされる。
rect_slice_flagが 1に等しい場合、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiに対するリストNumCtusInSlice[ i ]はi番目のスライスにおけるCTUの数を示すものであり、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiに対するリストSliceTopLeftTileIdx[ i ]はスライスにおいて第1のCTUを含むタイルのインデックスを示すものであり、両端を含む0ないしnum_slices_in_pic_minus1の範囲に及ぶiと、両端を含む0ないしNumCtusInSlice[ i ] - 1の範囲に及ぶjとに対する行列CtbAddrInSlice[ i ][ j ]は、i番目のスライスを含むタイルにおけるスライスの数を示すものであり、これらは次のようにして導出される:
【0197】
【数36】
・・・
D.7.2 サブピクチャ・レベル情報SEIメッセージ・セマンティクス
・・・
ref_level_fraction_minus1[ i ][ j ]プラス1は、j 番目のサブピクチャが条項A.4.1で指定されているとおりに準拠するref_level_idc[ i ]に関連するレベル制限の割合を指定する。
変数SubpicSizeY[ j ]は、( subpic_width_minus1[ j ] + 1 ) * CtbSizeY * ( subpic_height_minus1[ j ] + 1 ) * CtbSizeY に等しく設定される。
存在しない場合、ref_level_fraction_minus1[ i ][ j ]の値は、Ceil( 256 * SubpicSizeY[ j ] ÷ PicSizeInSamplesY * MaxLumaPs( general_level_idc ) ÷ MaxLumaPs( ref_level_idc[ i ] ) - 1 に等しいと推定される。
変数RefLevelFraction[ i ][ j ]は、ref_level_fraction_minus1[ i ][ j ] + 1に等しく設定される。
<<<変数SubpicNumTileCols[ j ]及びSubpicNumTileRows[ j ]は、次のようにして導出される:>>>
【0198】
【数37】
・・・
- SubpicWidthInTiles[ j ]の値はMaxTileCols以下であるものとし、SubpicHeightInTiles[ j ]の値はMaxTileRows以下であるものとし、ここで、MaxTileColsとMaxTileRowsは、レベルref_level_idc[ i ]に対してテーブルA.1で指定されるものである。
- SubpicWidthInTiles[ j ] * SubpicHeightInTiles[ j ]の値はMaxTileCols * MaxTileRows * RefLevelFraction[ i ][ j ]以下であるものとし、ここで、MaxTileColsとMaxTileRowsは、レベルref_level_idc[ i ]に対してテーブルA.1で指定されるものである。
・・・
参照レベルref_level_idc[i]に関するトータル・レベル割合の変数SubpicSetAccLevelFraction[ i ]、並びにサブピクチャ・セットの変数SubpicSetCpbSizeVcl[ i ], SubpicSetCpbSizeNal[ i ], SubpicSetBitRateVcl[ i ],及びSubpicSetBitRateNal[ i ]は、次のようにして導出される:
【0199】
【数38】
・・・
1.1. 6.2 実施形態2:LMCSのサポート
この実施形態では、ピクチャ・ヘッダ内のLMCS関連シンタックス要素のシンタックスとセマンティクスが修正され、その結果、LMCSがピクチャの全てのスライスに対して使用される場合、LMCSシグナリングはSH内に存在しない。
7.3.2.7 ピクチャ・ヘッダ構造シンタックス
【0200】
【数39】
7.3.7.1 ゼネラル・スライス・ヘッダ・シンタックス
【0201】
【数40】
M (e.g., M = 1)に等しい
ph_lmcs_enabled_type<<<flag>>>は、クロマ・スケーリングを伴うルマ・マッピングが、PHに関連する全てのスライスに対してイネーブルにされることを示す。
N (e.g., N=2)に等しいph_lmcs_enabled_typeは、クロマ・スケーリングを伴うルマ・マッピングが、少なくとも1つのスライスに対してイネーブルにされ、且つPHに関連する少なくとも1つのスライスに対してディセーブルにされることを示す。
0に等しいph_lmcs_enabled_
type<<<flag>>>は、クロマ・スケーリングを伴うルマ・マッピングが、PHに関連する<<<1つ又は複数の又は>>>全てのスライスに対して<<<ディセーブルにされてもよい>>>
ディセーブルにされる。
ph_lmcs_enabled_typeの値は0, M, Nに等しいものとする。存在しない場合、ph_lmcs_enabled_
type<<<flag>>>の値は0に等しいと推定される。
1に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが、現在のスライスに対してイネーブルにされることを示す。0に等しいslice_lmcs_enabled_flagは、クロマ・スケーリングを伴うルマ・マッピングが、現在のスライスに対してイネーブルにされないことを示す。slice_lmcs_enabled_flagが存在しない場合、それは、<<<0>>>
(ph_lmcs_enabled_type ? 1 : 0)に等しいと推定される。代替的に、slice_lmcs_enabled_flagが存在しない場合、それは、<<<0>>>
( ph_lmcs_enabled_type = =M) ? 1 : 0に等しいと推定される。
上記の例において、M及びNの値はそれぞれ1及び2に設定されてもよい。あるいは、M及びNの値はそれぞれ2及び1に設定されてもよい。
6.3. 実施形態3:スケーリング・リストのサポートに関するアプローチ#1
この実施形態では、スケーリング・リストに関連するテキストは、変換係数のスケーリング・プロセスを制御するために、スケーリング・リスト用のSPSフラグとスケーリング・リスト用のPHフラグとを使用する代わりに、スライス・ヘッダ内のスケーリング・リスト・フラグが使用されるように修正される。
シーケンス・パラメータ・セットRBSPシンタックス及びセマンティクス
【0202】
【数41】
・・・
<<<1に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されることを示す。0に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されないことを示す。>>>
1に等しいsps_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、スケーリング・リストAPSでシグナリングされる明示的なスケーリング・リストの使用が、CLVSに対してイネーブルにされることを示す。0に等しいsps_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、明示的なスケーリング・リストの使用が、CLVSに対してディセーブルにされることを示す。
・・・
ピクチャ・ヘッダ構造シンタックス及びセマンティクス
【0203】
【数42】
・・・
<<<1に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、16に等しく設定されることを示す。存在しない場合、ph_scaling_list_present_flagの値は、0に等しいと推定される。>>>
1に等しいph_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、参照されるスケーリング・リストAPS(即ち、SCALING_APSに等しいaps_params_type equalとph_explicit_scaling_list_aps_idに等しいadaptation_parameter_set_idとを伴うAPS)でシグナリングされる明示的なシグナリング・リストの使用が、ピクチャに関してイネーブルにされることを示す。0に等しいph_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、明示的なシグナリング・リストの使用が、ピクチャに関してディセーブルにされることを示す。存在しない場合、ph_explicit_scaling_list_enabled_flagの値は、0に等しいと推定される。
ph_explicit_scaling_list_aps_idは、スケーリング・リストAPSのadaptation_parameter_set_idを示す。
SCALING_APSに等しいaps_params_typeを有するAPS NALユニットのTemporalIdと、ph_
explicit_scaling_list_aps_idに等しいadaptation_parameter_set_idとは、PHに関連するピクチャのTemporalId以下であるものとする。
・・・
ゼネラル・スライス・ヘッダ・シンタックス及びセマンティクス
【0204】
【数43】
・・・
<<<1に等しいslice_scaling_list_present_flagは、現在のスライスに使用されるスケーリング・リスト・データが、SCALING_APSに等しいaps_params_typeとph_scaling_list_aps_idに等しいadaptation_parameter_set_idとを有する参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいslice_scaling_list_present_flagは、現在のピクチャに使用されるスケーリング・リスト・データが、条項7.4.3.2.1で規定されているように導出されるデフォルト・スケーリング・データであることを示す。存在しない場合、slice_scaling_list_present_flagの値は0に等しいと推定される。>>>
1に等しいslice_explicit_scaling_list_enabled_flagは、参照されるスケーリング・リストAPSでシグナリングされる明示的なスケーリング・リストが、現在のスライスのデコードの際に、変換係数のスケーリング・プロセスにおいて使用されることを示す。0に等しいslice_explicit_scaling_list_enabled_flagは、明示的なシグナリング・リストが、現在のスライスのデコードの際に、変換係数のスケーリング・プロセスにおいて使用されないことを示す。存在しない場合、slice_explicit_scaling_list_enabled_flagの値は、0に等しいと推定される。
・・・
変換係数のシグナリング・プロセス
・・・
x = 0..nTbW - 1, y = 0..nTbH - 1に関し、スケーリングされた変換係数d[ x ][ y ]の導出については、以下が適用される:
- 中間スケーリング因子m[ x ][ y ]は、次のようにして導出される:
- 以下の条件のうちの1つ以上が真である場合、m[ x ][ y ]は16に等しく設定される:
<<<
- sps_scaling_list_enabled_flagは、0に等しい。
【0205】
- ph_scaling_list_present_flagは、0に等しい。
>>>
- slice_explicit_scaling_list_enabled_flagは、0に等しい。
【0206】
- transform_skip_flag[ xTbY ][ yTbY ][ cIdx ]は、1に等しい。
【0207】
- scaling_matrix_for_lfnst_disabled_flagは1に等しく、且つApplyLfnstFlagは1に等しい。
【0208】
- ・・・
・・・
6.4. 実施形態4:スケーリング・リストのサポートに関するアプローチ#2
この実施形態では、スケーリング・リストに関連するテキストは、以下が適用されるように修正される:
1)変換係数のスケーリング・プロセスを制御するために、スケーリング・リスト用のSPSフラグとスケーリング・リスト用のPHフラグとを使用する代わりに、スライス・ヘッダのスケーリング・リスト・フラグが使用される。
2)明示的なスケーリング・リストが、ピクチャの全てのスライスに使用される場合、スケーリング・リスト・シグナリングはSHには存在しない。
以下において、M及びNの値はそれぞれ1及び2に設定されてもよい。
あるいは、M及びNの値はそれぞれ2及び1に設定されてもよい。
代替的に、以下が適用される:
1)シンタックス要素ph_explicit_scaling_list_enabled_typeは、ph_explicit_scaling_list_modeに名称変更される。
2)M,N,0に等しいph_explicit_scaling_list_enabled_typeの値は、それぞれA,B,C(e.g., 0,1,2)に等しいph_explicit_scaling_list_modeで置換される。
3)ph_explicit_scaling_list_aps_idに関するシンタックス条件“if( ph_explicit_scaling_list_enabled_type > 0 )”は、“if( ph_explicit_scaling_list_mode != C )”で置換される。
シーケンス・パラメータ・セットRBSPシンタックス及びシンタックス
【0209】
【数44】
・・・
<<<1に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されることを示す。0に等しいsps_scaling_list_enabled_flagは、変換係数に対するスケーリング・プロセスにスケーリング・リストが使用されないことを示す。>>>
1に等しいsps_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、スケーリング・リストAPSでシグナリングされる明示的なスケーリング・リストの使用が、CLVSに対してイネーブルにされることを示す。0に等しいsps_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、明示的なスケーリング・リストの使用が、CLVSに対してディセーブルにされることを示す。
・・・
ピクチャ・ヘッダ構造シンタックス及びセマンティクス
【0210】
【数45】
・・・
<<<1に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいph_scaling_list_present_flagは、PHに関連するスライスに使用されるスケーリング・リスト・データが、16に等しく設定されることを示す。存在しない場合、ph_scaling_list_present_flagの値は、0に等しいと推定される。>>>
M (e.g., M = 1)に等しいph_explicit_scaling_list_enabled_typeは、参照されるスケーリング・リストAPS(SCALING_APSに等しいaps_params_typeとph_explicit_scaling_list_aps_idに等しいadaptation_parameter_set_idとを伴うAPS)でシグナリングされる明示的なスケーリング・リストが、ピクチャにおける全てのスライスをデコードする場合に、変換係数のスケーリング・プロセスで使用されることを示す。N (e.g., N = 2)に等しいph_explicit_scaling_list_enabled_typeは、スライスをデコードする場合に変換係数のスケーリング・プロセスにおける明示的なスケーリング・リストの使用が、ピクチャに関してイネーブルにされていることを示す。
0に等しいph_explicit_scaling_list_enabled_flagは、スライスをデコードする場合に、変換係数のスケーリング・プロセスにおいて、明示的なシグナリング・リストの使用が、ピクチャに関してディセーブルにされることを示す。ph_explicit_scaling_list_enabled_typeの値は、0,M,又はNに等しいものとする。存在しない場合、ph_explicit_scaling_list_enabled_flagの値は0に等しいと推定される。
ph_explicit_scaling_list_aps_idは、スケーリング・リストAPSのadaptation_parameter_set_idを示す。SCALING_APSに等しいaps_params_typeを有するAPS NALユニットのTemporalIdと、ph_
explicit_scaling_list_aps_idに等しいadaptation_parameter_set_idとは、PHに関連するピクチャのTemporalId以下であるものとする。
・・・
ゼネラル・スライス・ヘッダ・シンタックス及びセマンティクス
【0211】
【数46】
・・・
<<<1に等しいslice_scaling_list_present_flagは、現在のスライスに使用されるスケーリング・リスト・データが、SCALING_APSに等しいaps_params_typeとph_scaling_list_aps_idに等しいadaptation_parameter_set_idとを有する参照されるスケーリング・リストAPSに含まれるスケーリング・リスト・データに基づいて導出されることを示す。0に等しいslice_scaling_list_present_flagは、現在のピクチャに使用されるスケーリング・リスト・データが、条項7.4.3.2.1で規定されているように導出されるデフォルト・スケーリング・データであることを示す。存在しない場合、slice_scaling_list_present_flagの値は0に等しいと推定される。>>>
1に等しいslice_explicit_scaling_list_enabled_flagは、参照されるスケーリング・リストAPSでシグナリングされる明示的なシグナリング・リストが、現在のスライスのデコードの際に、変換係数のスケーリング・プロセスに使用されることを示す。0に等しいslice_explicit_scaling_list_enabled_flagは、現在のスライスのデコードの際に、変換係数のシグナリング・プロセスにおいて、明示的なシグナリング・リストは使用されないことを示す。存在しない場合、slice_explicit_scaling_list_enabled_flagの値は、( ph_explicit_scaling_list_enabled_type = = M ) ? 1 : 0に等しいと推定される。
・・・
変換係数のシグナリング・プロセス
・・・
x = 0..nTbW - 1, y = 0..nTbH - 1に関し、スケーリングされた変換係数d[ x ][ y ]の導出については、以下が適用される:
- 中間スケーリング因子m[ x ][ y ]は、次のようにして導出される:
- 以下の条件のうちの1つ以上が真である場合、m[ x ][ y ]は16に等しく設定される:
<<<
- sps_scaling_list_enabled_flagは、0に等しい。
【0212】
- ph_scaling_list_present_flagは、0に等しい。
>>>
- slice_explicit_scaling_list_enabled_flagは、0に等しい。
【0213】
- transform_skip_flag[ xTbY ][ yTbY ][ cIdx ]は、1に等しい。
【0214】
- scaling_matrix_for_lfnst_disabled_flagは1に等しく、且つApplyLfnstFlagは1に等しい。
【0215】
- ・・・
・・・
[0057]
図5は、本件開示される種々の技術が実装され得る例示的なビデオ処理システム1900を示すブロック図である。種々の実装は、システム1900の構成要素の一部又は全部を含んでもよい。システム1900は、ビデオ・コンテンツを受信するための入力1902を含んでもよい。ビデオ・コンテンツは、生の又は非圧縮のフォーマット、例えば、8又は10ビットの多重成分ピクセル値で受信されてもよいし、又は圧縮された又は符号化されたフォーマットで受信されてもよい。入力1902は、ネットワーク・インターフェース、周辺バス・インターフェース、又は記憶インターフェースを表現している可能性がある。ネットワーク・インターフェースの例は、イーサーネット、光受動ネットワーク(PON)などのような有線インターフェースや、Wi-Fi又はセルラー・インターフェースのような無線インターフェースを含む。
【0216】
[0058] システム1900は、本件明細書で説明される種々のコーディング又は符号化方法を実装することが可能なコーディング構成要素1904を含んでもよい。コーディング構成要素1904は、入力1902からコーディング構成要素1904の出力までのビデオの平均ビットレートを低減して、ビデオのコーディングされた表現を生成することができる。従って、コーディング技術は、しばしばビデオ圧縮又はビデオ・トランスコーディング技術と呼ばれることがある。コーディング構成要素1904の出力は、記憶されてもよいし、あるいは構成要素1906によって表現されているように、接続された通信を介して伝送されてもよい。入力1902で受信されたビデオの記憶又は通信されるビットストリーム(又はコーディングされた)表現は、ディスプレイ・インターフェース1910に送信されるピクセル値又は表示可能なビデオを生成するために、構成要素1908によって使用されてもよい。ビットストリーム表現から、ユーザーが視聴可能なビデオを生成するプロセスは、しばしばビデオ解凍と呼ばれることがある。更に、特定のビデオ処理操作は、“コーディングする”操作又はツールと称されるが、コーディング・ツール又は操作はエンコーダで使用され、コーディングの結果を逆向きに処理する対応する復号化ツール又は操作はデコーダで実行されるであろう、ということは理解されるであろう。
【0217】
[0059] 周辺バス・インターフェース又はディスプレイ・インターフェースの例は、ユニバーサル・シリアル・バス(USB)又は高解像度マルチメディア・インターフェース(HDMI(登録商標))、ディスプレイポート(Displayport)などを含む可能性がある。ストレージ・インターフェースの例は、シリアル・アドバンスト・テクノロジ・アタッチメント(serial advanced technology attachment,SATA)、PCI、IDEインターフェースなどを含む。本件明細書で説明される技術は、携帯電話、ラップトップ、スマートフォン、又はその他のデバイスであってデジタル・データ処理及び/又はビデオ表示を実行することが可能なデバイス、のような種々の電子デバイスで具体化されることが可能である。
【0218】
[0060]
図6は、ビデオ処理装置3600のブロック図である。装置3600は、本願で説明される1つ以上の方法を実装するために使用されてもよい。装置3600は、スマートフォン、タブレット、コンピュータ、モノのインターネット(Internet of Things,IoT)受信機などで具体化されてもよい。装置3600は、1つ以上のプロセッサ3602、1つ以上のメモリ3604、及びビデオ処理ハードウェア3606を含んでもよい。プロセッサ3602は、本件明細書で説明される1つ以上の方法を実装するように構成されてもよい。メモリ(memories)3604は、本願で説明される方法及び技術を実装するために使用されるデータ及びコードを記憶するために使用されてもよい。ビデオ処理ハードウェア3606は、ハードウェア回路において、本件明細書で説明される幾つかの技術を実装するために使用されてもよい。
【0219】
[0061]
図8は、本開示の技術を利用することが可能な例示的なビデオ・コーディング・システム100を示すブロック図である。
【0220】
[0062]
図8に示すように、ビデオ・コーディング・システム100は、送信元(又はソース)デバイス110及び送信先(又は宛先)デバイス120を含む可能性がある。送信元デバイス110は、符号化されたビデオ・データを生成するものであり、ビデオ符号化デバイスと言及されてもよい。送信先デバイス120は、送信元デバイス110によって生成された符号化されたビデオ・データを復号化することが可能であり、ビデオ復号化デバイスと言及されてもよい。
【0221】
[0063] 送信元デバイス110は、ビデオ・ソース112、ビデオ・エンコーダ114、及び入力/出力(I/O)インターフェース116を含むことが可能である。
【0222】
[0064] ビデオ・ソース112は、ビデオ・キャプチャ・デバイスのようなソース、ビデオ・コンテンツ・プロバイダーからビデオ・データを受信するためのインターフェース、及び/又はビデオ・データを生成するためのコンピュータ・グラフィックス・システム、又はそのようなソースの組み合わせを含んでもよい。ビデオ・データは、1つ以上のピクチャを含む可能性がある。ビデオ・エンコーダ114は、ビデオ・ソース112からのビデオ・データを符号化してビットストリームを生成する。ビットストリームは、ビデオ・データのコーディングされた表現を形成するビットのシーケンスを含む可能性がある。ビットストリームは、コーディングされたピクチャ及び関連するデータを含んでもよい。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連するデータは、シーケンス・パラメータ・セット、ピクチャ・パラメータ・セット、及びその他のシンタックス構造を含んでもよい。I/Oインターフェース116は、変調器/復調器(モデム)及び/又は送信機を含んでもよい。符号化されたビデオ・データは、ネットワーク130aを通じてI/Oインターフェース116を介して送信先デバイス120へ直接的に送信されてもよい。符号化されたビデオ・データはまた、送信先デバイス120によるアクセスのために記憶媒体/サーバー130b上に格納されてもよい。
【0223】
[0065] 送信先デバイス120は、I/Oインターフェース126、ビデオ・デコーダ124、及びディスプレイ・デバイス122を含んでもよい。
【0224】
[0066] I/Oインターフェース126は、受信機及び/又はモデムを含んでもよい。I/Oインターフェース126は、送信元デバイス110又は記憶媒体/サーバー130bから、符号化されたビデオ・データを取得することができる。ビデオ・デコーダ124は、符号化されたビデオ・データを復号化することができる。ディスプレイ・デバイス122は、復号化されたビデオ・データをユーザーに表示することができる。ディスプレイ・デバイス122は、送信先デバイス120と一体化されてもよいし、又は送信先デバイス120の外部にあってもよく、その場合の送信先デバイスは外部ディスプレイ・デバイスとのインターフェースとなるように構成される。
【0225】
[0067] ビデオ・エンコーダ114及びビデオ・デコーダ124は、高効率ビデオ・コーディング(High Efficiency Video Coding,HEVC)規格、汎用ビデオ・コーディング(Versatile Video Coding,VVC)規格、及びその他の現行及び/又は将来の規格、のようなビデオ圧縮規格に従って動作することができる。
【0226】
[0068]
図9はビデオ・エンコーダ200の一例を示すブロック図であり、これは
図8に示すシステム100内のビデオ・エンコーダ114であってもよい。
【0227】
[0069] ビデオ・エンコーダ200は、本開示の技術の何れか又は全てを実行するように構成することができる。
図9の例では、ビデオ・エンコーダ200は、複数の機能的な構成要素を含む。本開示で説明される技術は、ビデオ・エンコーダ200の種々の構成要素の間で共有されてもよい。幾つかの例において、プロセッサは、本開示で説明される技術の何れか又は全てを実行するように構成されることが可能である。
【0228】
[0070] ビデオ・エンコーダ200の機能的な構成要素は、パーティション・ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205、及びイントラ予測ユニット206を含むことが可能な予測ユニット202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214とを含むことが可能である。
【0229】
[0071] 他の例では、ビデオ・エンコーダ200は、より多い、より少ない、又は異なる機能的な構成要素を含む可能性がある。一例では、予測ユニット202は、イントラ・ブロック・コピー(IBC)ユニットを含む可能性がある。IBCユニットはIBCモードで予測を実行することが可能であり、そのモードでは、少なくとも1つの参照ピクチャは現在のビデオ・ブロックが配置されているピクチャである。
【0230】
[0072] 更に、動き推定ユニット204や動き補償ユニット205のような幾つかの構成要素は、高度に統合されていてもよいが、説明のために
図9の例では別々に表現されている。
【0231】
[0073] パーティション・ユニット201は、ピクチャを1つ以上のビデオ・ブロックにパーティション化することができる。ビデオ・エンコーダ200及びビデオ・デコーダ300は、様々なビデオ・ブロック・サイズをサポートすることができる。
【0232】
[0074] モード選択ユニット203は、コーディング・モードのうちの一方、インター又はイントラを、例えば誤り結果に基づいて選択し、その結果のイントラ・コーディング又はインター・コーディングされたブロックを、残差ブロック・データ生成のために残差生成ユニット207へ、及び参照ピクチャとして使用する符号化済みブロックの再構成のために再構成ユニット212へ提供する。幾つかの例では、モード選択ユニット203は、予測がインター予測信号及びイントラ予測信号に基づいているイントラ&インター予測コンビネーション(CIIP)モードを選択することができる。モード選択ユニット203はまた、インター予測の場合に、ブロックに対する動きベクトルの解像度(例えば、サブ・ピクセル又は整数ピクセル精度)を選択することも可能である。
【0233】
[0075] 現在のビデオ・ブロックに関してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ以上の参照フレームを現在のビデオ・ブロックと比較することによって、現在のビデオ・ブロックの動き情報を生成することができる。動き補償ユニット205は、現在のビデオ・ブロックに関連するピクチャ以外のバッファ213からのピクチャの動き情報及び復号化されたサンプルに基づいて、現在のビデオ・ブロックについて予測されるビデオ・ブロックを決定することができる。
【0234】
[0076] 動き推定ユニット204と動き補償ユニット205は、例えば、現在のビデオ・ブロックがIスライスであるか、Pスライスであるか、又はBスライスであるかどうかに依存して、現在のビデオ・ブロックに対して様々な処理を実行することができる。
【0235】
[0077] 幾つかの例では、動き推定ユニット204は、現在のビデオ・ブロックに対して片-方向予測を実行することができ、動き推定ユニット204は、現在のビデオ・ブロックに対する参照ピクチャ・ブロックについて、リスト0又はリスト1の参照ピクチャを検索することができる。次いで、動き推定ユニット204は、参照ビデオ・ブロックを含むリスト0又はリスト1内の参照ピクチャを示す参照インデックスと、現在のビデオ・ブロック及び参照ビデオ・ブロックの間の空間的変位を示す動きベクトルとを生成することができる。動き推定ユニット204は、参照インデックス、予測方向インジケータ、及び動きベクトルを、現在のビデオ・ブロックの動き情報として出力することができる。動き補償ユニット205は、現在のビデオ・ブロックの動き情報によって示される参照ビデオ・ブロックに基づいて、現在のブロックの予測されたビデオ・ブロックを生成することができる。
【0236】
[0078] 他の例では、動き推定ユニット204は、現在のビデオ・ブロックに対して双-方向予測を実行することができ、動き推定ユニット204は、現在のビデオ・ブロックに対する参照ビデオ・ブロックについて、リスト0内の参照ピクチャを検索することができ、また、現在のビデオ・ブロックに対する別の参照ビデオ・ブロックについて、リスト1内の参照ピクチャを検索することもできる。次いで、動き推定ユニット204は、参照ビデオ・ブロックを含むリスト0及びリスト1内の参照ピクチャを示す参照インデックスと、参照ビデオ・ブロック及び現在のビデオ・ブロックの間の空間的変位を示す動きベクトルとを生成することができる。動き推定ユニット204は、現在のビデオ・ブロックの動き情報として、現在のビデオ・ブロックの参照インデックスと動きベクトルを出力することができる。動き補償ユニット205は、現在のビデオ・ブロックの動き情報によって示される参照ビデオ・ブロックに基づいて、現在のビデオ・ブロックの予測されたビデオ・ブロックを生成することができる。
【0237】
[0079] 幾つかの例では、動き推定ユニット204は、デコーダの復号化処理のための動き情報の完全なセットを出力することができる。
【0238】
[0080] 幾つかの例では、動き推定ユニット204は、現在のビデオに対する動き情報の完全なセットを出力しない可能性がある。むしろ、動き推定ユニット204は、他のビデオ・ブロックの動き情報を参照して、現在のビデオ・ブロックの動き情報をシグナリングすることができる。例えば、動き推定ユニット204は、現在のビデオ・ブロックの動き情報が、隣接するビデオ・ブロックの動き情報と十分に類似していることを判断することができる。
【0239】
[0081] 一例では、動き推定ユニット204は、現在のビデオ・ブロックに関連するシンタックス構造において、現在のビデオ・ブロックが別のビデオ・ブロックと同じ動き情報を有することをビデオ・デコーダ300に指示する値を、指定することができる。
【0240】
[0082] 別の例では、動き推定ユニット204は、現在のビデオ・ブロックに関連するシンタックス構造において、別のビデオ・ブロック及び動きベクトル差分(MVD)を識別することができる。動きベクトル差分は、現在のビデオ・ブロックの動きベクトルと指定されたビデオ・ブロックの動きベクトルとの間の差分を示す。ビデオ・デコーダ300は、指定されたビデオ・ブロックの動きベクトルと動きベクトル差分とを使用して、現在のビデオ・ブロックの動きベクトルを決定することができる。
【0241】
[0083] 上述したように、ビデオ・エンコーダ200は、動きベクトルを予測的にシグナリングすることができる。ビデオ・エンコーダ200によって実現され得る予測シグナリング技術の2つの例は、アドバンスト動きベクトル予測(advanced motion vector predication,AMVP)及びマージ・モード・シグナリングを含む。
【0242】
[0084] イントラ予測ユニット206は、現在のビデオ・ブロックに対してイントラ予測を実行することができる。イントラ予測ユニット206が現在のビデオ・ブロックに対してイントラ予測を実行する場合、イントラ予測ユニット206は、同じピクチャ内の他のビデオ・ブロックの復号化されたサンプルに基づいて、現在のビデオ・ブロックに対する予測データを生成することができる。現在のビデオ・ブロックに対する予測データは、予測されるビデオ・ブロックと種々のシンタックス要素を含んでもよい。
【0243】
[0085] 残差生成ユニット207は、現在のビデオ・ブロックの予測されたビデオ・ブロックを、現在のビデオ・ブロックから減算することによって(例えば、マイナス符号で示される)、現在のビデオ・ブロックに対する残差データを生成することができる。現在のビデオ・ブロックの残差データは、現在のビデオ・ブロック内のサンプルの異なるサンプル成分に対応する残差ビデオ・ブロックを含んでもよい。
【0244】
[0086] 他の例では、例えばスキップ・モードでは、現在のビデオ・ブロックに関し、現在のビデオ・ブロックに対する残差データが存在しない場合があり、残差生成ユニット207は減算処理を実行しない可能性がある。
【0245】
[0087] 変換処理ユニット208は、現在のビデオ・ブロックに関連する残差ビデオ・ブロックに、1つ以上の変換を適用することによって、現在のビデオ・ブロックに対する1つ以上の変換係数ビデオ・ブロックを生成することができる。
【0246】
[0088] 変換処理ユニット208が現在のビデオ・ブロックに関連する変換係数ビデオ・ブロックを生成した後、量子化ユニット209は、現在のビデオ・ブロックに関連する1つ以上の量子化パラメータ(QP)値に基づいて、現在のビデオ・ブロックに関連する変換係数ビデオ・ブロックを量子化することができる。
【0247】
[0089] 逆量子化ユニット210と逆変換ユニット211はそれぞれ逆量子化と逆変換を変換係数ビデオ・ブロックに適用し、変換係数ビデオ・ブロックから残差ビデオ・ブロックを再構成することができる。再構成ユニット212は、再構成された残差ビデオ・ブロックを、予測ユニット202によって生成された1つ以上の予測されたビデオ・ブロックからの対応するサンプルに追加し、現在のブロックに関連する再構成されたビデオ・ブロックを生成して、バッファ213に記憶することができる。
【0248】
[0090] 再構成ユニット212がビデオ・ブロックを再構成した後、ループ・フィルタリング動作を実行し、ビデオ・ブロック内のビデオ・ブロッキング・アーチファクトを低減することができる。
【0249】
[0091] エントロピー符号化ユニット214は、ビデオ・エンコーダ200の他の機能的な構成要素からデータを受信することができる。エントロピー符号化ユニット214がデータを受信すると、エントロピー符号化ユニット214は、1つ以上のエントロピー符号化動作を実行して、エントロピー符号化されたデータを生成し、エントロピー符号化されたデータを含むビットストリームを出力することができる。
【0250】
[0092] 開示される技術の幾つかの実施形態は、ビデオ処理ツール又はモードをイネーブルにする判定又は判断を行うことを含む。一例では、ビデオ処理ツール又はモードがイネーブルにされている場合、エンコーダは、ビデオのブロックの処理においてツール又はモードを使用又は実装するであろうが、ツール又はモードの使用に基づいて、結果として生じるビットストリームを必ずしも修正しない可能性がある。即ち、ビデオのブロックからビデオのビットストリーム(又はビットストリーム表現)への変換は、その判定又は判断に基づいてイネーブルにされている場合に、ビデオ処理ツール又はモードを使用する。別の例では、ビデオ処理ツール又はモードがイネーブルである場合に、デコーダは、ビットストリームがビデオ処理ツール又はモードに基づいて修正されているという知識とともに、ビットストリームを処理するであろう。即ち、ビデオのビットストリームからビデオのブロックへの変換は、判定又は判断に基づいてイネーブルにされたビデオ処理ツール又はモードを使用して実行されるであろう。
【0251】
[0093]
図10は、ビデオ・デコーダ300の一例を示すブロック図であり、これは
図8に示すシステム100内のビデオ・デコーダ114であってもよい。
【0252】
[0094] ビデオ・デコーダ300は、本開示の技術の何れか又は全てを実行するように構成することができる。
図10の例では、ビデオ・デコーダ300は、複数の機能構成要素を含む。本開示で説明される技術は、ビデオ・デコーダ300の種々の構成要素の間で共有されてもよい。幾つかの例において、プロセッサは、本開示で説明される技術の何れか又は全てを実行するように構成することができる。
【0253】
[0095]
図10の例では、ビデオ・デコーダ300は、エントロピー復号化ユニット301と、動き補償ユニット302と、イントラ予測ユニット303と、逆量子化ユニット304と、逆変換ユニット305と、再構成ユニット306と、バッファ307とを含む。ビデオ・デコーダ300は、幾つかの例において、ビデオ・エンコーダ200(
図9)に関して説明した符号化経路と概ね逆の復号化経路を実行することができる。
【0254】
[0096] エントロピー復号化ユニット301は、符号化されたビットストリームを取り出すことができる。符号化されたビットストリームは、エントロピー・コーディングされたビデオ・データ(例えば、ビデオ・データの符号化されたブロック)を含むことができる。エントロピー復号化ユニット301は、エントロピー・コーディングされたビデオ・データを復号化することができ、エントロピー復号化されたビデオ・データから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照ピクチャ・リスト・インデックス、及びその他の動き情報を含む動き情報を決定することができる。動き補償ユニット302は、例えば、AMVP及びマージ・モードを実行することによって、そのような情報を決定することができる。
【0255】
[0097] 動き補償ユニット302は、おそらくは補間フィルタに基づいて補間を実行することによって、動き補償されたブロックを生成することができる。サブ・ピクセル精度で使用される補間フィルタのための識別子が、シンタックス要素に含まれてもよい。
【0256】
[0098] 動き補償ユニット302は、ビデオ・ブロックの符号化中にビデオ・エンコーダ200によって使用されるような補間フィルタを使用して、参照ブロックの分数ピクセルに対する補間された値を計算してもよい。動き補償ユニット302は、受信したシンタックス情報に従ってビデオ・エンコーダ200によって使用される補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成することができる。
【0257】
[0099] 動き補償ユニット302は、シンタックス情報の一部を使用して、符号化されたビデオ・シーケンスのフレーム及び/又はスライスを符号化するために使用されるブロックのサイズ、符号化されたビデオ・シーケンスのピクチャの各マクロブロックがどのようにパーティション化されるかを記述するパーティション情報、各パーティションがどのように符号化されるかを示すモード、インター符号化されたブロック各々に対する1つ以上の参照フレーム(及び参照フレーム・リスト)、及び符号化されたビデオ・シーケンスを復号化するための他の情報を決定することができる。
【0258】
[0100] イントラ予測ユニット303は、例えば、ビットストリームで受信したイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成することができる。逆量子化ユニット303は、ビットストリーム内で提供される量子化されたビデオ・ブロック係数であってエントロピー復号化ユニット301によって復号化されたものを、逆量子化する、即ち、量子化解除する。逆変換ユニット303は、逆変換を適用する。
【0259】
[0101] 再構成ユニット306は、残差ブロックを、動き補償ユニット202又はイントラ予測ユニット303によって生成された対応する予測ブロックと合算して、復号化されたブロックを形成することができる。所望であれば、復号化されたブロックをフィルタリングしてブロック性アーチファクトを除去するために、デブロッキング・フィルタが適用されてもよい。次いで、復号化されたビデオ・ブロックはバッファ307に格納され、バッファ307は、後続の動き補償/イントラ予測のための参照ブロックを提供し、表示デバイスにおける提示のために、復号化されたビデオも生成する。
【0260】
[0102] 次に、何らかの実施形態における好ましい解決策のリストを示す。
【0261】
[0103] 以下の解決策は、前述のセクション(例えば、アイテム1)で議論した技術の例示的な実施形態を示す。
【0262】
[0104] 1. ビデオ処理方法(例えば、
図7に示される方法900)。本方法は:1つ以上のビデオ・ピクチャを含むビデオ(各々のビデオ・ピクチャは1つ以上のタイルを含む)と、ビデオのコーディングされた表現との間の変換を実行するステップを含み、コーディングされた表現はフォーマット・ルールに従っており;フォーマット・ルールは、コーディングされた表現でシグナリングされる第1情報と、コーディングされた表現から導出される第2情報とを規定しており、少なくとも第1情報又は第2情報は、1つ以上jのタイルの行インデックス又は列インデックスに関連している。
【0263】
[0105] 2. 解決策1の方法において、フォーマット・ルールは、各ビデオ・ピクチャの各コーディング・ツリー・ユニットのタイル列インデックスは導出されるものであることを規定している。
【0264】
[0106] 3. 解決策1の方法において、フォーマット・ルールは、各ビデオ・ピクチャの各コーディング・ツリー・ユニットのタイル行インデックスは導出されるものであることを規定している。
【0265】
[0107] 以下の解決法は、前述のセクション(例えば、アイテム2)で議論された技術の例示的な実施形態を示す。これらの解決策において、ビデオ領域はビデオ・ピクチャであってもよく、ビデオ・ユニットはビデオ・ブロック又はコーディング・ツリー・ユニット又はビデオ・スライスであってもよい。
【0266】
[0108] 4. ビデオ処理方法。本方法は:ビデオのビデオ領域のビデオ・ユニットとビデオのコーディングされた表現との間の変換を実行するステップを含み、コーディングされた表現はフォーマット・ルールに従っており;フォーマット・ルールは、第2の制御情報がビデオ・ユニット・レベルで含まれるか否かを、ビデオ領域における第1の制御情報が制御することを規定しており;第1の制御情報及び/又は第2の制御情報は、変換に使用されるルマ・マッピング及びクロマ・スケーリング(LMCS)又はクロマ残差スケーリング(CRS)又はリシェイピング・プロセス(RP)に関する情報を含む。
【0267】
[0109] 5. 解決策4の方法において、第1の制御情報は、第2の制御情報がコーディングされた表現に含まれるか否かを示すインジケータを含む。
【0268】
[0110] 6. 解決策4-5の方法において、第1の制御情報の特定の値は、LMCSがビデオ領域内の全てのビデオ・ユニットに対してディセーブルにされていることを示す。
【0269】
[0111] 7. 解決策4-6の何れかの方法において、第2の制御情報は、LMCSのイネーブル化を、ビデオ・ユニットで制御している。
【0270】
[0112] 8. 解決策4の方法において、第1の制御情報は複数のインジケータを含む。
【0271】
[0113] 以下の解決策は、前述のセクション(例えば、アイテム5-8)で議論した技術の例示的な実施形態を示す。
【0272】
[0114] 9. ビデオ処理方法。本方法は:1つ以上のビデオ・ユニットを含む1つ以上のビデオ領域を含むビデオとビデオのコーディングされた表現との間の変換を実行するステップを含み、コーディングされた表現はフォーマット・ルールに適合しており;フォーマット・ルールは、コーディングされた表現が、少なくとも幾つかのビデオ・ユニットの変換に使用可能なスケーリング・リストの2レベル・シグナリングを含むことを規定しており、ビデオ領域レベルでの2レベル・シグナリングのうちの高レベル・シグナリングは、ビデオ・ユニット・レベルでの2レベル・シグナリングのうちの低レベル・シグナリングが、コーディングされた表現に含まれるか否か及びその場所を制御するものであり;スケーリング・リストは、少なくとも一部のビデオ・ユニットの変換に使用されるスケーリングに関する情報を含む。
【0273】
[0115] 10. 解決策9の方法において、高レベル・シグナリングにおけるバイナリ値フィールドは、低レベル・シグナリングの発生を制御する。
【0274】
[0116] 11. 解決策9-10の何れかの方法において、低レベル・シグナリングにおけるバイナリ値フィールドは、低レベル・シグナリングに含まれるスケーリング・リストのディセーブル化を制御する。
【0275】
[0117] 12. 解決策9-11の何れかの方法において、1つ以上のビデオ領域は、ビデオ・ピクチャに対応している。
【0276】
[0118] 13. 解決策9-12の何れかの方法において、1つ以上のビデオ・ユニットは、ビデオ・スライス又はビデオ・コーディング・ユニットを含む。
【0277】
[0119] 以下の解決策は、前述のセクション(例えば、アイテム5-8)で議論した技術の例示的な実施形態を示す。
【0278】
[0120] 14. ビデオ処理方法。本方法は:ビデオのビデオ・ユニットとビデオのコーディングされた表現との間の変換に使用される低周波ノン・セパラブル変換のためのスケーリング・リストを決定するステップと;決定に基づいて変換を実行するステップとを含み、コーディングされた表現におけるシンタックス構造は、スケーリング・リストがビデオ・ユニットに対してイネーブルにされているかどうかを示す。
【0279】
[0121] 15. 解決策14の方法において、シンタックス構造は、シーケンス・ヘッダ又はピクチャ・ヘッダ又はスライス・ヘッダに含まれる。
【0280】
[0122] 16. 解決策14-15の何れかの方法において、ビデオ・ユニットは、ビデオ・ブロックを含む。
【0281】
[0123] 17. 解決策1-16の何れかの方法において、変換は、ビデオをコーディングされた表現に符号化することを含む。
【0282】
[0124] 18. 解決策1-16の何れかの方法において、変換は、コーディングされた表現を復号化して、ビデオのピクセル値を生成することを含む。
【0283】
[0125] 19. 解決策1-18の1つ以上に記載されている方法を実行するように構成されたプロセッサを含むビデオ復号化装置。
【0284】
[0126] 20. 解決策1-18の1つ以上に記載されている方法を実行するように構成されたプロセッサを含むビデオ符号化装置。
【0285】
[0127] 21. コンピュータ・コードを記憶したコンピュータ・プログラム製品において、そのコードは、プロセッサにより実行されると、解決策1-18の何れかに記載されている方法をプロセッサに実行させる。
【0286】
[0128] 22. 本件明細書に記載されている方法、装置、又はシステム。
【0287】
[0129] 本件で説明される解決法において、エンコーダは、コーディングされた表現をフォーマット・ルールに従って生成することによって、フォーマット・ルールに適合させることができる。本件で説明される解決策において、デコーダは、フォーマット・ルールを使用して、コーディングされた表現におけるシンタックス要素を、シンタックス要素の存在及び不存在の知識とともに、フォーマット・ルールに従って解析し、デコードされたビデオを生成することができる。
【0288】
[0130]
図12は、例示的なビデオ処理方法1200のフローチャートである。オペレーション1202は、ビデオのビデオ・ブロックとビデオのビットストリームとの間の変換を実行することを含み、ビットストリームはフォーマット・ルールに準拠し、フォーマット・ルールは、ビデオ・ブロックの変換係数又は非変換係数にスケーリング・プロセスが適用されるか否かを示すビデオ領域レベルで、第1のシンタックス要素がビットストリームに含まれることを規定しており、ビデオ領域はビデオのビデオ・ピクチャよりも小さい。
【0289】
[0131] 方法1200の幾つかの実施形態において、フォーマット・ルールは、第1のシンタックス要素がスライスのスライス・ヘッダにあることを規定しており、フォーマット・ルールは、スケーリング・リストがビットストリームのシーケンス・パラメータ・セットにおいてイネーブルにされているかどうかを示す第2のシンタックス要素によって、スケーリング・プロセスは制御されないことを規定している。方法1200の幾つかの実施形態において、第2のシンタックス要素は、スケーリング・リストがイネーブルにされるか否かを規定しており、そのスケーリング・リストは、スライスの変換の際の変換係数に対するスケーリング・プロセスにおけるスケーリング・リスト適応パラメータ・セットに含まれる。方法1200の幾つかの実施形態において、フォーマット・ルールは、第1のシンタックス要素がスライスのスライス・ヘッダ内にあることを規定しており、フォーマット・ルールは、スケーリング・リストがビットストリーム内のピクチャ・ヘッダ内に存在するかどうかを示す第3の構文要素によって、スケーリング・プロセスは制御されないことを規定している。方法1200の幾つかの実施形態において、第1のシンタックス要素は、スケーリング・リストがイネーブルにされているか否かを規定しており、そのスケーリング・リストは、スライスの変換の際の変換係数に対するスケーリング・プロセスにおけるスケーリング・リスト適応パラメータ・セットに含まれる。
【0290】
[0132]
図13は、例示的なビデオ処理方法1300のフローチャートである。オペレーション1302は、ビデオのビデオ領域のビデオ・ユニットとビデオのビットストリームとの間の変換を実行することを含み、ビットストリームはフォーマット・ルールに準拠し、フォーマット・ルールは、ビットストリーム内のビデオ領域の第1のレベルにおける第1の制御情報は、第2の制御情報がビットストリーム内のビデオ・ユニットの第2のレベルで含まれるかどうかを示す、ということを規定しており、第1の制御情報及び/又は第2の制御情報は、変換係数に又は変換に関する非-変換係数に、スケーリング・リストが使用されるか否かに関する情報を含む。
【0291】
[0133] 方法1300の幾つかの実施形態において、第1の制御情報は、第1のインジケータを選択的に含み、第1のインジケータは、スケーリング・リストがビデオ領域の第1のレベルで1つ以上のスライスに対してイネーブルされて、スケーリング・リストがビデオ・ユニットの第2のレベルでイネーブルにされているかどうかを示すものであり、第1のインジケータは非バイナリ値である。方法1300の幾つかの実施形態において、ビデオ領域の第1レベルは、ピクチャ・ヘッダを含む。方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ピクチャ・ヘッダのうちの全てより少ないスライスに対してディセーブルにされ、スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルにされ、第1の値、第2の値、及び第3の値は互いに異なる。方法1300の幾つかの実施形態において、第1の制御情報が第1のインジケータを除外する場合、第1のインジケータの値は、デフォルト値であると推定される。
【0292】
[0134] 方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ビデオ・ピクチャを含むビデオ領域のスライスをデコードするときにイネーブルにされ、スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルであり、第1の値、第2の値、及び第3の値は互いに異なる。方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ビデオ・ピクチャを含むビデオ領域のスライスをデコードするときに、選択的にイネーブルにされる。スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルにされ、第1の値、第2の値、及び第3の値は互いに異なる。
【0293】
[0135] 方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ピクチャ・ヘッダのうちの全てより少ないスライスに対してディセーブルにされ、スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、第1の値、第2の値、及び第3の値は互いに異なる。方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ビデオ・ピクチャを含むビデオ領域のスライスをデコードするときに、選択的にディセーブルにされる。スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルにされ、第1の値、第2の値、及び第3の値は互いに異なる。方法1300の幾つかの実施形態において、ビデオ領域の第1のレベルはピクチャ・ヘッダを含み、第1の制御情報は第1のインジケータを含み、スケーリング・リストは、第1のインジケータが第1の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してイネーブルにされ、スケーリング・リストは、第1のインジケータが第2の値に等しい場合に、ビデオ・ピクチャを含むビデオ領域のスライスをデコードする場合にディセーブルにされ、スケーリング・リストは、第1のインジケータが第3の値に等しい場合に、ピクチャ・ヘッダの全てのスライスに対してディセーブルにされ、第1の値、第2の値、及び第3の値は互いに異なる。
【0294】
[0136] 方法1300の幾つかの実施形態において、スケーリング・リストがシーケンス・レベルでイネーブルにされるかどうかを示すビットストリーム内のシンタックス要素の値に基づいて、第1のインジケータは第1の制御情報に選択的に含まれる。方法1300の幾つかの実施形態において、第1のインジケータは、u(v)又はu(2)又はue(v)とともにコーディングされる。方法1300の幾つかの実施形態において、第1のインジケータは打ち切られたユーナリー・コードでコーディングされる。方法1300の幾つかの実施形態において、1つ以上のスライスによって使用されるスケーリング・リストの適応パラメータ・セット(APS)情報は、ビデオ領域の第1のレベルで1つ以上のスライスに対してスケーリング・リストがイネーブルにされるかどうかを示す第1のインジケータの値に基づいて、ビットストリームに含まれる。方法1300の幾つかの実施形態において、第2の制御情報は第2のインジケータを選択的に含み、第2のインジケータは、ビデオ・ユニットの第2のレベルで1つ以上のスライスに対してスケーリング・リストがイネーブル又はディセーブルにされるかどうかを示し、第2のインジケータは、第1の制御情報に含まれる第1のインジケータの値に基づいてビットストリームに含まれ、第1のインジケータは、ビデオ・ユニットの第2のレベルで1つ以上のスライスに対してスケーリング・リストがイネーブル又はディセーブルにされるかどうかを示す。方法1300の幾つかの実施形態において、第2の制御情報はスライス・ヘッダを含む。方法1300の幾つかの実施形態において、第1のインジケータが第1の値に等しいことに応答して、第2のインジケータは第2の制御情報に含められる。方法1300の幾つかの実施形態において、第1のインジケータ>>1、又は第1のインジケータ/2、又は第1のインジケータ&0x01 の状態チェックの実行に応じて、第2のインジケータは第2の制御情報に含まれ、ここで、>>は、右シフト演算を示し、&はビット単位の論理及び演算を示す。
【0295】
[0137] 方法1300の幾つかの実施形態において、第2のインジケータが第2の制御情報に存在しないことに応じて:第2のインジケータの値は、第1のインジケータが第1の値に等しいことに応じてイネーブルにされていると推定されるか、又は第2のインジケータの値は、第1のインジケータが第3の値に等しいことに応じてディセーブルにされていると推定され、第1の値、第1のインジケータの第2の値、及び第3の値は互いに異なる。方法1300の幾つかの実施形態において、第1の制御情報は複数のインジケータを含み、複数のインジケータは、スケーリング・リストがビデオ・ユニットの第2のレベルでイネーブルにされるかどうかを指定するために、スケーリング・リストがビデオ領域の第1のレベルで1つ以上のスライスに対してイネーブルにされているかどうかを示し、複数のインジケータは非バイナリ値を有する。方法1300の幾つかの実施形態では、複数のインジケータは、ピクチャ・ヘッダに含まれる少なくとも2つのインジケータを含む。方法1300の幾つかの実施形態において、少なくとも2つのインジケータは第1のインジケータを含み、第1のインジケータは、スケーリング・リストが、ピクチャ・ヘッダに関連する少なくとも1つのスライスに対してイネーブルにされるかどうかを示し、少なくとも2つのインジケータは選択的に第2のインジケータを含み、第2のインジケータは、スケーリング・リストが、ピクチャ・ヘッダに関連する全てのスライスに対してイネーブルにされるかどうかを示す。方法1300の幾つかの実施形態において、第2のインジケータは、第1のインジケータの値に基づいて、複数のインジケータにおいて選択的にシグナリングされる。
【0296】
[0138] 方法1300の幾つかの実施形態において、第1のインジケータの値は、スケーリング・リストが少なくとも1つのスライスに対してイネーブルにされていることを示す。方法1300の幾つかの実施形態において、スケーリング・リストは、第2のインジケータがビットストリームに存在しないことに応じて、ピクチャ・ヘッダに関連する全てのスライスに対してイネーブルされていると推定される。方法1300の幾つかの実施形態において、第1のインジケータが適合性ビットストリームにおいて偽(false)であることに応じて、第2のインジケータは偽である。方法1300の幾つかの実施形態において、少なくとも2つのインジケータは第3のインジケータを含み、第3のインジケータは、第1のインジケータの第1の値又は第2のインジケータの第2の値に基づいて、スライス・ヘッダで選択的にシグナリングされる。方法1300の幾つかの実施形態において、第1のインジケータの第1の値は、少なくとも1つのスライスに対してスケーリング・リストがイネーブルにされていることを指定し、第2のインジケータの第2の値は、全てのスライスに対してスケーリング・リストがディセーブルにされていることを指定する。方法1300の幾つかの実施形態において、第3のインジケータの値は、第3のインジケータがビットストリームに存在しないことに応じて、第1のインジケータの第1の値及び/又は第2のインジケータの第2の値に基づいて推定される。方法1300の幾つかの実施形態において、少なくとも2つのインジケータは、ピクチャ・ヘッダに関連する少なくとも1つのスライスに対してスケーリング・リストがディセーブルにされているかどうかを示す第1のインジケータを含み、少なくとも2つのインジケータは、ピクチャ・ヘッダに関連する全てのスライスに対してスケーリング・リストがディセーブルにされているかどうかを指定する第2のインジケータを選択的に含む。
【0297】
[0139] 方法1300の幾つかの実施形態において、第2のインジケータは、第1のインジケータの第1の値に基づいて、複数のインジケータでシグナリングされる。方法1300の幾つかの実施形態において、第1のインジケータの第1の値は、スケーリング・リストが少なくとも1つのスライスに対してディセーブルにされていることを示す。方法1300の幾つかの実施形態において、スケーリング・リストは、第2のインジケータがビットストリームに存在しないことに応じて、ピクチャ・ヘッダに関連する全てのスライスに対してディセーブルにされていると推定される。方法1300の幾つかの実施形態において、少なくとも2つのインジケータは、第2のインジケータの第2の値に基づいて、スライス・ヘッダ内に第3のインジケータを選択的に含む。方法1300の幾つかの実施形態において、第1のインジケータの第1の値は、スケーリング・リストが少なくとも1つのスライスに対してイネーブルにされていることを示し、第2のインジケータの第2の値は、スケーリング・リストが全てのスライスに対してイネーブルにされていることを示す。方法1300の幾つかの実施形態において、第3のインジケータの値は、第3のインジケータがビットストリームに存在しないことに応じて、第1のインジケータの第1の値及び/又は第2のインジケータの第2の値に基づいて推定される。方法1300の幾つかの実施形態において、複数のインジケータは、スケーリング・リストがシーケンス・レベルでイネーブルにされるかどうかを示すシンタックス要素の値に基づいて、第1のインジケータを選択的に含む。
【0298】
[0140] 方法1300の幾つかの実施形態において、複数のインジケータは、スケーリング・リストがビデオ・ユニットの第2のレベルでイネーブル又はディセーブルされるかどうかを示す第3のインジケータを選択的に含み、第3のインジケータは、第1のインジケータの第1の値及び/又は第2のインジケータの第2の値に基づいて選択的にシグナリングされる。方法1300の幾つかの実施形態において、第3のインジケータは、スケーリング・リストが全てのスライスに対してイネーブルにされていないこと、又はスケーリング・リストが全てのスライスに対してディセーブルにされていないこと、を示す第2のインジケータに基づいて選択的にシグナリングされる。方法1300の幾つかの実施形態において、2つの1ビット・シンタックス要素が、ビデオ領域の第1レベルで第1制御情報において選択的にシグナリングされ、スケーリング・リストがビデオ・ユニットの第2レベルでイネーブルにされるかどうかを指定し、ビデオ領域はビデオ・ピクチャを含み、ビデオ・ユニットは1つ以上のスライスを含む。方法1300の幾つかの実施形態において、第1の制御情報は、ビデオ・ピクチャのピクチャ・ヘッダを含み、第2の制御情報は、1つ以上のスライスからのスライスのスライス・ヘッダを含む。
【0299】
[0141] 方法1300の幾つかの実施形態において、2つの1ビット・シンタックス要素は、第1のピクチャ・ヘッダ・シンタックス要素を含み、ビデオ・ピクチャの全てのスライスは、第1のピクチャ・ヘッダ・シンタックス要素が1に等しいことに応じて、スケーリング・リストを使用し、ビデオ・ピクチャの各スライスは、第1のピクチャ・ヘッダ・シンタックス要素が0に等しいことに応じて、スケーリング・リストを選択的に使用する。方法1300の幾つかの実施形態において、2つの1ビット・シンタックス要素は、第2のピクチャ・ヘッダ・シンタックス要素を含み、ビデオ・ピクチャのスライスは、第2のピクチャ・ヘッダ・シンタックス要素が1に等しいことに応じてスケーリング・リストを使用せず、ビデオ・ピクチャの各スライスは、第2のピクチャ・ヘッダ・シンタックス要素が0に等しいことに応じて、スケーリング・リストを選択的に使用する。方法1300の幾つかの実施形態において、第2のピクチャ・ヘッダ・シンタックス要素は、第1のピクチャ・ヘッダ・シンタックス要素が0に等しい場合に、ビットストリームにおいてシグナリングされる。方法1300の幾つかの実施形態において、スケーリング・リストのための適応パラメータ・セット(APS)識別子は:第1のピクチャ・ヘッダ・シンタックス要素が1に等しいこと、又は、第1のピクチャ・ヘッダ・シンタックス要素が0に等しいこと、及び、第2のピクチャ・ヘッダ・シンタックス要素が0に等しいこと、に応じてピクチャ・ヘッダ内でシグナリングされる。方法1300の幾つかの実施形態において、第1のピクチャ・ヘッダ・シンタックス要素は0に等しく、且つ第2のピクチャ・ヘッダ・シンタックス要素は0に等しいことに応じて、スライス・ヘッダ・シンタックス要素はスライス・ヘッダ内でシグナリングされる。
【0300】
[0142] 方法1300の幾つかの実施形態において、スライス・ヘッダ内のスライス・ヘッダ・シンタックス要素の値は、第1のピクチャ・ヘッダ・シンタックス要素が1に等しいことに応じて、0であると推定される。方法1300の幾つかの実施形態において、スライス・ヘッダ内のスライス・ヘッダ・シンタックス要素の値は、第1のピクチャ・ヘッダ・シンタックス要素が0に等しく、且つ第2のピクチャ・ヘッダ・シンタックス要素が0に等しいことに応答して、0であると推定される。方法1300の幾つかの実施形態において、スライス・ヘッダ内のスライス・ヘッダ・シンタックス要素の値が1に等しいことに応じて、スケーリング・リストはスライスをデコードするために使用される。方法1300の幾つかの実施形態において、ビットストリームは、スケーリング・リストに関連する情報がピクチャ・ヘッダ又はスライス・ヘッダで示されているかどうかを示す1つ以上のインジケータを選択的に含む。方法1300の幾つかの実施形態において、1つ以上のインジケータは1ビット・インジケータを含む。
【0301】
[0143] 方法1300の幾つかの実施形態において、ビデオ・ユニットの全てのスライスは、第1の制御情報内のピクチャ・ヘッダがスケーリング・リストに関連する情報を含むことを1ビットインジケータが示していることに応じて、ピクチャ・ヘッダから値を推定し、スケーリング・リストに関連する情報のシグナリングは、スライス・ヘッダから除外される。方法1300の幾つかの実施形態において、スケーリング・リストに関連する情報がスライス・ヘッダ内で示されることを1ビット・インジケータが示していることに応じて、スケーリング・リストに関連する情報は、ピクチャ・ヘッダから除外される。方法1300の幾つかの実施形態において、1つ以上のインジケータは、ピクチャ・ヘッダにおいてシグナリングされる。方法1300の幾つかの実施形態において、1つ以上のインジケータは、ピクチャ・パラメータ・セット(PPS)においてシグナリングされる。方法1300の幾つかの実施形態において、1つ以上のインジケータは、シーケンス・パラメータ・セット(SPS)においてシグナリングされる。
【0302】
[0144]
図14は、例示的なビデオ処理方法1400のフローチャートである。オペレーション1402は、ビデオのビデオ・ブロックとビデオのビットストリームとの間の変換を実行することを含み、ビデオ・ブロックは、変換に関する低周波ノン・セパラブル変換を使用しており、ビットストリームは、シンタックス要素がビットストリームのシンタックス・レベルで含まれることを規定するフォーマット・ルールに準拠しており、シンタックス要素は、参照スケーリング・リストから導出されるスケーリング・マトリックスの使用がビデオ・ブロックについてイネーブルにされているかどうかを示し、シンタックス・レベルは、シーケンス・レベル、ピクチャ・レベル、又はスライス・レベルである。
【0303】
[0145] 方法1400の幾つかの実施形態において、シンタックス要素は、シーケンス・パラメータ・セット(SPS)、ピクチャ・パラメータ・セット(PPS)、ピクチャ・ヘッダ、又はスライス・ヘッダに含まれる。方法1400の幾つかの実施形態において、低周波ノン・セパラブル変換がビデオ・ブロックに対してイネーブルにされているかどうかに基づいて、シンタックス要素は、SPS、PPS、ピクチャ・ヘッダ、又はスライス・ヘッダに含まれる。方法1400の幾つかの実施形態において、sps_lfnst_enabled_flagの値が1に等しいかどうかに基づいて、シンタックス要素はSPSに含まれる。方法1400の幾つかの実施形態において、本方法は、明示的なスケーリング・リスト又はデフォルト・スケーリング・リストから導出されるスケーリング行列を、ビデオ・ブロックに適用するかどうかを、シンタックス要素に基づいて、及び低周波ノン・セパラブル変換がビデオ・ブロックに対してイネーブルにされるかどうかを、決定するステップを更に含む。
【0304】
[0146]
図15は、例示的なビデオ処理方法1500のフローチャートである。オペレーション1502は、ビデオのビデオ・ユニットとビデオのビットストリームとの間の変換に関し、境界の外側にパディングされたサンプルを使用して、ビデオ・ユニットの境界に沿うビデオ・ユニットのサンプルに対してデブロッキング・フィルタリングを実行することを決定するステップを含む。オペレーション1504は、決定に従って変換を実行するステップを含む。
【0305】
[0147] 方法1500の幾つかの実施形態において、ビデオ・ユニットはビデオ・ピクチャを含む。方法1500の幾つかの実施形態において、ビデオ・ユニットはビデオ・ピクチャのサブピクチャを含む。方法1500の幾つかの実施形態において、ビデオ・ユニットはスライスを含む。方法1500の幾つかの実施形態において、ビデオ・ユニットはタイルを含む。方法1500の幾つかの実施形態において、ビデオ・ユニットは、漸進的復号化リフレッシュ(GDR)から得られたリフレッシュ領域であり、境界は、ビデオ・ピクチャのリフレッシュ領域と未リフレッシュ領域との間に位置する。方法1500の幾つかの実施形態において、境界は、ビットストリームにおいて仮想境界(virtual boundary)として示される。方法1500の幾つかの実施形態において、パディング・プロセスは、2つ以上のパディングされたサンプルの値が、ビデオ・ユニットの境界に沿うサンプルからのサンプルの値に等しくなるような複製方法で実行される。方法1500の幾つかの実施形態において、パディング・プロセスは、パディングされたサンプルからの少なくとも第1のパディングされたサンプルと第2のパディングされたサンプルの値が、ビデオ・ユニットの境界に沿うサンプルからの第1のサンプルと第2のサンプルの値にそれぞれ等しくなるような対称的な方法で実行される。
【0306】
[0148] 幾つかの実施形態において、変換を実行することは、ビデオをビットストリームに符号化することを含む。幾つかの実施形態において、変換を実行することは、ビットストリームをビデオから生成することを含み、本方法は、ビットストリームを、非一時的なコンピュータ読み取り可能な記憶媒体に記憶することを含む。幾つかの実施形態において、変換を実行することは、ビデオをビットストリームからデコードすることを含む。幾つかの実施形態において、ビデオ復号化装置は、本件特許明細書で説明されている1つ以上の動作を実施するように構成されたプロセッサを備える。幾つかの実施形態において、ビデオ符号化装置は、本件特許明細書で説明されている1つ以上の動作を実施するように構成されたプロセッサを備える。幾つかの実施形態において、コンピュータ・プログラム製品は、そこに記憶されたコンピュータ命令を有し、その命令は、プロセッサによって実行されると、本件特許明細書で説明されている1つ以上の動作をプロセッサに実行させる。幾つかの実施形態において、非一時的なコンピュータ読み取り可能な記憶媒体は、本件特許明細書で説明されている1つ以上の動作に従って生成されたビットストリームを記憶する。幾つかの実施形態において、非一時的なコンピュータ読み取り可能な記憶媒体は、本件特許明細書で説明されている1つ以上の動作をプロセッサに実行させる命令を記憶する。幾つかの実施形態において、ビットストリーム生成方法は:本件特許明細書で説明されている1つ以上の動作に従って、ビデオのビットストリームを生成するステップと、そのビットストリームをコンピュータ読み取り可能なプログラム媒体上に記憶するステップとを含む。幾つかの実施態様は、方法、装置、開示された方法に従って生成されたビットストリーム、又は本件明細書で説明されているシステムに関する。
【0307】
[0149] 本件明細書において、「ビデオ処理」という用語は、ビデオ符号化、ビデオ復号化、ビデオ圧縮又はビデオ解凍を指す可能性がある。例えば、ビデオ圧縮アルゴリズムは、ビデオの画素表現から、対応するビットストリーム表現へ、又はその逆への変換の際に適用される可能性がある。現在のビデオ・ブロックのビットストリーム表現は、例えば、シンタックスによって定義されるように、ビットストリーム内の異なる場所に分散されるか又は同等位置に配置される(コロケーテッド)ビットに対応する可能性がある。例えば、マクロブロックは、変換され且つコーディングされたエラー残差値の観点から、また、ビットストリーム内のヘッダ及びその他のフィールド内のビットを使用して符号化されてもよい。更に、変換中に、デコーダは、上述の解決策で説明されているような決定に基づいて、何らかのフィールドが存在するか又は存在しない可能性があるという知識とともに、ビットストリームを解析することが可能である。同様に、エンコーダは、特定のシンタックス・フィールドが含まれる予定であるか又は含まれない予定であるかを判定し、それに応じて、シンタックス・フィールドをコーディングされた表現に含めるか又はそこから除外することによって、コーディングされた表現を生成することができる。
【0308】
[0150] 本件明細書で説明される開示された及びその他の解決策、実施例、実施形態、モジュール、及び機能動作は、デジタル電子回路において、又はコンピュータ・ソフトウェア、ファームウェア、又はハードウェアであって本件明細書で開示された構造及びそれらの構造的均等物を含むもの、又はそれらの1つ以上の組み合わせで実現することが可能である。開示された及びその他の実施形態は、1つ以上のコンピュータ・プログラム製品、即ち、データ処理装置による実行のため、又はデータ処理装置の動作を制御するために、コンピュータ読み取り可能な媒体にエンコードされたコンピュータ・プログラム命令の1つ以上のモジュールとして実装することが可能である。コンピュータ読み取り可能な媒体は、機械読み取り可能な記憶デバイス、機械読み取り可能な記憶基板、メモリ・デバイス、機械読み取り可能な伝送される信号に影響を与える物質の構成、又はそれらの1つ以上の組み合わせであるとすることが可能である。用語「データ処理装置」は、例えば、プログラマブル・プロセッサ、コンピュータ、又は複数のプロセッサ又はコンピュータを含む、データを処理するための全ての装置、デバイス、及び機械を包含する。装置は、ハードウェアに加えて、問題としているコンピュータ・プログラムの実行環境を生成するコード、例えば、プロセッサ・ファームウェア、プロトコル・スタック、データベース管理システム、オペレーティング・システム、又はそれらの1つ以上の組み合わせを構成するコードを含むことができる。伝送される信号は、人工的に生成された信号、例えば、適切な受信装置への送信のために情報を符号化するために生成される、マシンにより生成された電気信号、光学信号、又は電磁信号である。
【0309】
[0151] コンピュータ・プログラム(プログラム、ソフトウェア、ソフトウェア・アプリケーション、スクリプト、コードとしても知られているもの)は、コンパイル又は解釈された言語を含む、任意の形式のプログラミング言語で書くことが可能であり、それは、スタンド・アロン・プログラムとして、又はモジュール、コンポーネント、サブルーチン、又はコンピューティング環境での使用に適したその他のユニットとして、任意の形式で配備することが可能である。コンピュータ・プログラムは、必ずしもファイル・システム内のファイルに対応するとは限らない。プログラムは、他のプログラム又はデータを保持するファイルの一部分(例えば、マークアップ言語文書に記憶される1つ以上のスクリプト)内に、問題としているプログラム専用の単一ファイル内に、又は複数の調整されたファイル(例えば、1つ以上のモジュール、サブ・プログラム、又はコードの一部分を記憶するファイル)内に、保存されることが可能である。コンピュータ・プログラムは、1つのコンピュータ上で又は複数のコンピュータ上で実行されるように配備することが可能であり、複数のコンピュータは、1つのサイトに配置されるか、又は複数のサイトにわたって分散されて通信ネットワークによって相互接続されている。
【0310】
[0152] 本件明細書で説明されるプロセス及びロジックの流れは、1つ以上のコンピュータ・プログラムを実行する1つ以上のプログラマブル・プロセッサによって実行され、入力データに作用して出力を生成することによって機能を実行することができる。プロセス及びロジックの流れはまた、例えばFPGA(フィールド・プログラマブル・ゲート・アレイ)又はASIC(特定用途向け集積回路)のような特殊目的論理回路によって実行されることが可能であり、また、それらとして装置を実装することも可能である。
【0311】
[0153] コンピュータ・プログラムの実行に適したプロセッサは、例えば、汎用及び専用双方のマイクロプロセッサ、及び任意の種類のデジタル・コンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、リード・オンリ・メモリ又はランダム・アクセス・メモリ又は双方から命令及びデータを受信するであろう。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令及びデータを記憶するための1つ以上のメモリ・デバイスである。一般に、コンピュータはまた、データを記憶するための1つ以上の大容量ストレージ・デバイス、例えば磁気的なもの、磁気光ディスク、又は光ディスクを含み、あるいはそれらからデータを受信したり、それらへデータを転送したり、若しくは双方のために動作可能に結合される。しかしながら、コンピュータがそのようなデバイスを有することは必須ではない。コンピュータ・プログラム命令及びデータを記憶するのに適したコンピュータ読み取り可能な媒体は、例えば、EPROM、EEPROM、及びフラッシュ・メモリ・デバイスのような半導体メモリ・デバイス;磁気ディスク、例えば内部ハード・ディスク又はリムーバブル・ディスク;光磁気ディスク;並びにCD ROM及びDVD-ROMディスク;を含む、あらゆる形態の不揮発性メモリ、媒体及びメモリ・デバイスを含む。プロセッサ及びメモリは、特殊目的論理回路によって補足されるか、又はそこに内蔵されることが可能である。
【0312】
[0154] 本件明細書は多くの詳細を含んでいるが、これらは、何れかの対象事項やクレームされ得るものの範囲に関する限定として解釈されるべきではなく、むしろ特定の技術の特定の実施形態に特有である可能性がある特徴の説明として解釈されるべきである。別々の実施形態の文脈で本件明細書で説明される特定の特徴は、組み合わせて単一の実施形態で実施することも可能である。逆に、単一の実施形態の文脈で説明されている種々の特徴は、複数の実施形態において別々に、又は任意の適切なサブコンビネーションで実施することも可能である。更に、特徴が、特定の組み合わせにおいて作用するものとして上記で説明されていたり、当初にそのようにクレームされていたりさえするかもしれないが、クレームされた組み合わせのうちの1つ以上の特徴は、場合によっては、組み合わせから切り出されることが可能であり、クレームされた組み合わせは、サブコンビネーション又はサブコンビネーションの変形例に仕向けられる可能性がある。
【0313】
[0155] 同様に、図中、動作は特定の順序で描かれているが、これは、所望の結果を達成するために、このような動作が図示の特定の順序で又は順番通りに実行されること、又は、例示された全ての動作が実行されること、を要求するものとして理解されるべきではない。更に、本件特許明細書で説明される実施形態における種々のシステム構成要素の分け方は、全ての実施形態でこのような分け方を要求とするものとして理解されるべきではない。
【0314】
[0156] 僅かな実装例及び実施例のみが記載されているに過ぎず、本件特許明細書で説明され図示されているものに基づいて他の実装、拡張及び変更を行うことが可能である。
【0315】
(付記1)
ビデオのビデオ・ブロックと前記ビデオのビットストリームとの間の変換を実行するステップを含むビデオ処理方法であって、
前記ビデオ・ブロックは前記変換に低周波ノン・セパラブル変換を使用しており、
前記ビットストリームは、シンタックス要素は前記ビットストリームに関するシンタックス・レベルで含まれることを規定しているフォーマット・ルールに従っており、
前記シンタックス要素は、参照スケーリング・リストから導出されるスケーリング・マトリクスの利用が、前記ビデオ・ブロックに関してイネーブルにされているかどうかを示し、及び
前記シンタックス・レベルは、シーケンス・レベル、ピクチャ・レベル、又はスライス・レベルである、方法。
(付記2)
付記1に記載の方法において、前記シンタックス要素は、シーケンス・パラメータ・セット(SPS)、ピクチャ・パラメータ・セット(PPS)、ピクチャ・ヘッダ、又はスライス・ヘッダに含まれている、方法。
(付記3)
付記2に記載の方法において、前記低周波ノン・セパラブル変換が前記ビデオ・ブロックに関してイネーブルにされているかどうかに基づいて、前記シンタックス要素は、前記SPS、前記PPS、前記ピクチャ・ヘッダ、又は前記スライス・ヘッダに含まれている、方法。
(付記4)
付記3に記載の方法において、sps_lfnst_enabled_flagの値が1に等しいかどうかに基づいて、前記シンタックス要素は前記SPSに含まれている、方法。
(付記5)
付記2に記載の方法において、前記シンタックス要素に基づいて、明示的なスケーリング・リスト又はデフォルト・スケーリング・リストから導出される前記スケーリング・マトリクスを前記ブロックに適用するかどうか、及び前記低周波ノン・セパラブル変換が前記ビデオ・ブロックに関してイネーブルにされているかどうかを決定するステップを更に含む方法。
(付記6)
ビデオ処理方法であって、
ビデオのビデオ・ユニットと前記ビデオのビットストリームとの間の変換に関し、前記ビデオ・ユニットの境界に沿う前記ビデオ・ユニットのサンプルに関して、前記境界の外側にパディングされたサンプルを用いてデブロッキング・フィルタリングを実行する決定を行うステップ;及び
前記決定に従って前記変換を実行するステップ;
を含む方法。
(付記7)
付記6に記載の方法において、前記ビデオ・ユニットはビデオ・ピクチャを含む、方法。
(付記8)
付記6に記載の方法において、前記ビデオ・ユニットはビデオ・ピクチャのサブピクチャを含んでいる、方法。
(付記9)
付記6に記載の方法において、前記ビデオ・ユニットはスライスを含んでいる、方法。
(付記10)
付記6に記載の方法において、前記ビデオ・ユニットはタイルを含んでいる、方法。
(付記11)
付記6に記載の方法において、前記ビデオ・ユニットは漸進的復号化リフレッシュ(GDR)から得られたリフレッシュされた領域であり、前記境界はビデオ・ピクチャのリフレッシュされていない領域と前記リフレッシュされた領域との間に位置している、方法。
(付記12)
付記11に記載の方法において、前記境界は前記ビットストリームにおいて仮想境界として示される、方法。
(付記13)
付記6に記載の方法において、パディング・プロセスは、2つ以上のパディングされたサンプルの値が、前記ビデオ・ユニットの前記境界に沿うサンプルからのサンプルの値に等しくなるような複製方法で実行される、方法。
(付記14)
付記6に記載の方法において、パディング・プロセスは、パディングされたサンプルからの少なくとも第1のパディングされたサンプルと第2のパディングされたサンプルの値が、前記ビデオ・ユニットの前記境界に沿う前記サンプルからの第1のサンプルと第2のサンプルの値にそれぞれ等しくなるような対称的な方法で実行される、方法。
(付記15)
付記1ないし14のうちの何れか1項に記載の方法において、前記変換を実行するステップは、前記ビデオを前記ビットストリームにエンコードするステップを含む、方法。
(付記16)
付記1ないし14のうちの何れか1項に記載の方法において、前記変換を実行するステップは、前記ビットストリームを前記ビデオから生成するステップを含み、前記方法は、前記ビットストリームを、非一時的なコンピュータ読み取り可能な記憶媒体に記憶するステップを更に含む、方法。
(付記17)
付記1ないし14のうちの何れか1項に記載の方法において、前記変換を実行するステップは、前記ビデオを前記ビットストリームからデコードするステップを含む、方法。
(付記18)
付記1ないし17のうちの1つ以上に記載された方法を実行するように構成されたプロセッサを含むビデオ・デコーディング装置。
(付記19)
付記1ないし17のうちの1つ以上に記載された方法を実行するように構成されたプロセッサを含むビデオ・エンコーディング装置。
(付記20)
コンピュータ命令を記憶したコンピュータ・プログラム製品であって、その命令は、プロセッサによって実行されると、付記1ないし17のうちの何れか1項に記載の方法を前記プロセッサに実行させる、コンピュータ・プログラム製品。
(付記21)
付記1ないし17のうちの何れか1項に記載の方法により生成されたビットストリームを記憶した非一時的なコンピュータ読み取り可能な記憶媒体。
(付記22)
付記1ないし17のうちの何れか1項に記載の方法をプロセッサに実行させる命令を記憶した非一時的なコンピュータ読み取り可能な記憶媒体。
(付記23)
付記1ないし17のうちの何れか1項に記載の方法によるビデオのビットストリームを生成するステップ;及び
前記ビットストリームをコンピュータ読み取り可能なプログラム媒体に記憶するステップ;
を含むビットストリーム生成方法。
(付記24)
本件で説明された方法、装置、開示された方法又はシステムにより生成されたビットストリーム。