(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-25
(45)【発行日】2024-04-02
(54)【発明の名称】スライスおよびタイルを含むピクチャのコーディング
(51)【国際特許分類】
H04N 19/70 20140101AFI20240326BHJP
H04N 19/436 20140101ALI20240326BHJP
【FI】
H04N19/70
H04N19/436
(21)【出願番号】P 2022549961
(86)(22)【出願日】2021-02-22
(86)【国際出願番号】 CN2021077220
(87)【国際公開番号】W WO2021164785
(87)【国際公開日】2021-08-26
【審査請求日】2022-08-31
(31)【優先権主張番号】PCT/CN2020/076158
(32)【優先日】2020-02-21
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】PCT/CN2020/082283
(32)【優先日】2020-03-31
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520476341
【氏名又は名称】北京字節跳動網絡技術有限公司
【氏名又は名称原語表記】Beijing Bytedance Network Technology Co., Ltd.
【住所又は居所原語表記】Room B-0035, 2/F, No.3 Building, No.30, Shixing Road, Shijingshan District Beijing 100041 China
(73)【特許権者】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】ジャン カイ
(72)【発明者】
【氏名】ジャン リー
(72)【発明者】
【氏名】ワン イェクイ
(72)【発明者】
【氏名】ドン ジピン
(72)【発明者】
【氏名】ファン クイ
(72)【発明者】
【氏名】シュー ジジョン
(72)【発明者】
【氏名】リウ ホンビン
【審査官】岩井 健二
(56)【参考文献】
【文献】Bae-Keun Lee, and Dongsan Jun,AHG12: Singalling of rectangular slices,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-Q0228,17th Meeting: Brussels, BE,2020年01月,pp.1-5
【文献】Seethal Paluri, Hendry, and Seung Hwan Kim,[AHG12]: Misc improvements to tile and rectangular slice signalling,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-Q0244-v2,17th Meeting: Brussels, BE,2020年01月,pp.1-7
【文献】Benjamin Bross, Jianle Chen, Shan Liu, and Ye-Kui Wang,Versatile Video Coding (Draft 8),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-Q2001 (version 13),17th Meeting: Brussels, BE,2020年02月09日,pp.21-23,28-31,43-45,110-117
【文献】Kai Zhang, et al.,AHG12: A direct signalling method of rectangular slice partitioning,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-R0241,18th Meeting: by teleconference,2020年04月,pp.1-6
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
ビデオ画像を含むビデオと前記ビデオのビットストリームとの変換のために、走査プロセスを前記ビデオ画像に適用することを決定することであって、前記ビデオ画像を1つ以上のタイル、1つ以上のスライス、および複数のコーディングツリーユニットに分割する、決定することと、
前記走査プロセスにおいて、矩形スライスモードが前記ビデオ画像に対して使用されている場合、ピクチャレベルスライスインデックスを有するスライス内の第1のコーディングツリーユニットを含むタイルのタイルインデックスを示す変数は、前記ピクチャレベルスライスインデックスが第1の構文要素の値より小さいとき更新され、前記ピクチャレベルスライスインデックスが前記第1の構文要素の値以上であるとき更新されないことを決定することと、
前記決定することに基づいて前記変換を行うことと、を含むビデオデータを処理する方法であって、
前記第1の構文要素は、前記ビデオ画像内の1つ以上のスライスに関する情報を導出するために前記ビットストリーム内の前記ビデオ画像によって参照されるピクチャパラメータセットに含まれ、前記ビデオ画像内のスライス数が前記第1の構文要素の値より大きい、
ビデオデータを処理する方法。
【請求項2】
前記第1の構文要素の前記値より小さいピクチャレベルスライスインデックスを有する第1のスライスについて、タイル列の単位の前記第1のスライスの幅を前記ピクチャパラメータセット内の前記第1のスライスに対応する第2の構文要素から導出し、タイル行の単位の前記第1のスライスの高さを、前記第1のスライスが複数のスライスに分割されていない場合に前記ピクチャパラメータセット内の前記第1のスライスに対応する第3の構文要素から導出し、
前記第1の構文要素の前記値以上のピクチャレベルスライスインデックスを有する第2のスライスについて、タイル列の単位の前記第2のスライスの幅をタイル列の数とtileXとの差から導出し、タイル行の単位の前記第2のスライスの高さを、タイル行の数とtileYから導出し、
tileXおよびtileYを前記タイル列の数に基づいて決定する、
請求項1に記載の方法。
【請求項3】
前記スライスはiのピクチャレベルスライスインデックスを有し、iは整数であり、
前記変数を更新することが、(i+1)のインデックスを有するスライス内の前記第1のコーディングツリーユニットを含む第1のタイルの第1のタイルインデックスと、前記iのインデックスを有する前記スライス内の前記第1のコーディングツリーユニットを含む前記タイルの前記タイルインデックスとの差を加えることを含む、
請求項1または2に記載の方法。
【請求項4】
前記差は、前記スライスのための前記ピクチャパラメータセット内に含まれる第2の構文要素によって特定され、
前記第2の構文要素は、前記iのインデックスが前記第1の構文要素の前記値以上である場合、前記iのインデックスを有する前記スライスのための前記ピクチャパラメータセット内に存在せず、
前記変数を更新することは、前記ピクチャパラメータセット内に存在する前記第2の構文要素に呼応して前記差を加えることを含む、
請求項3に記載の方法。
【請求項5】
前記第2の構文要素が前記ピクチャパラメータセット内に存在しない場合、前記変数を更新することは、前記iのインデックスを有する前記スライスの幅を加えることを含み、前記幅はタイル列の単位で表される、
請求項4に記載の方法。
【請求項6】
tileIdx % Bが0に等しい場合、前記変数を更新することは、(A-1)*Bを加えることを含み、
tileIdxは前記変数を表し、
Aは、タイル行の単位で前記iのインデックスを有する前記スライスの高さであり、
Bは、前記ビデオ画像内のタイル列の数であり、
%は、
モジュロ演算子を表す、
請求項5に記載の方法。
【請求項7】
前記第1の構文要素の前記値が0より大きい場合、前記ビットストリーム内に含まれる1つ以上の構文要素によって前記スライスの幅および高さを特定する、
請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記スライスの前記幅は、タイル列の単位で表され、第2のスライスの前記高さは、タイル行の単位で表される、
請求項7に記載の方法。
【請求項9】
前記第1の構文要素の前記値に1を加えたものが、前記ビデオ画像内の矩形スライスの数を規定する、
請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記変換は、映像を前記ビットストリームに符号化することを含む、
請求項1~9のいずれか1項に記載の方法。
【請求項11】
前記変換は、映像を前記ビットストリームから復号化することを含む、
請求項1~9のいずれか1項に記載の方法。
【請求項12】
処理装置と命令を有する非一時的なメモリとを備えたビデオデータを処理するための装置であって、前記処理装置による実行時に、前記命令は前記処理装置に対して、
ビデオ画像を含むビデオと前記ビデオのビットストリームとの変換のために、走査プロセスを前記ビデオ画像に適用することを決定することであって、前記ビデオ画像を1つ以上のタイル、1つ以上のスライス、および複数のコーディングツリーユニットに分割する、決定することと、
前記走査プロセスにおいて、矩形スライスモードが前記ビデオ画像に対して使用されている場合、ピクチャレベルスライスインデックスを有するスライス内の第1のコード化ツリーユニットを含むタイルのタイルインデックスを示す変数は、前記ピクチャレベルスライスインデックスが第1の構文要素の値より小さいとき更新され、前記ピクチャレベルスライスインデックスが前記第1の構文要素の値以上であるとき更新されないことを決定することと、
前記決定することに基づいて前記変換を行うことと、を行わせ、
前記第1の構文要素は、前記ビデオ画像内の1つ以上のスライスに関する情報を導出するために前記ビットストリーム内の前記ビデオ画像によって参照されるピクチャパラメータセットに含まれ、前記ビデオ画像内のスライス数が前記第1の構文要素の前記値より大きい、
ビデオデータを処理するための装置。
【請求項13】
命令を記憶する非一時的なコンピュータ可読記憶媒体であって、前記命令は、処理装置に対して、
ビデオ画像を含むビデオと前記ビデオのビットストリームとの変換のために、走査プロセスを前記ビデオ画像に適用することを決定することであって、前記ビデオ画像を1つ以上のタイル、1つ以上のスライス、および複数のコーディングツリーユニットに分割する、決定することと、
前記走査プロセスにおいて、矩形スライスモードが前記ビデオ画像に対して使用されている場合、ピクチャレベルスライスインデックスを有するスライス内の第1のコーディングツリーユニットを含むタイルのタイルインデックスを示す変数は、前記ピクチャレベルスライスインデックスが第1の構文要素の値より小さいとき更新され、前記ピクチャレベルスライスインデックスが前記第1の構文要素の値以上であるとき更新されないことを決定することと、
前記決定することに基づいて前記変換を行うことと、を行わせ、
前記第1の構文要素は、前記ビデオ画像内の1つ以上のスライスに関する情報を導出するために前記ビットストリーム内の前記ビデオ画像によって参照されるピクチャパラメータセットに含まれ、前記ビデオ画像内のスライス数が前記第1の構文要素の前記値より大きい、
非一時的なコンピュータ可読記憶媒体。
【請求項14】
ビデ
オのビットストリームを記憶するための方法であって、前記方法は、
ビデオ画像を含むビデオのために、走査プロセスを前記ビデオ画像に適用することを決定することであって、前記ビデオ画像を1つ以上のタイル、1つ以上のスライス、および複数のコーディングツリーユニットに分割する、決定することと、
前記走査プロセスにおいて、矩形スライスモードが前記ビデオ画像に対して使用されている場合、ピクチャレベルスライスインデックスを有するスライス内の第1のコーディングツリーユニットを含むタイルのタイルインデックスを示す変数は、前記ピクチャレベルスライスインデックスが第1の構文要素の値より小さいとき更新され、前記ピクチャレベルスライスインデックスが前記第1の構文要素の値以上であるとき更新されないことを決定することと、
前記決定することに基づいて前記ビットストリームを生成することと、
前記ビットストリームを非一時的なコンピュータ可読記録媒体に記憶することと、
を含み、
前記第1の構文要素は、前記ビデオ画像内の1つ以上のスライスに関する情報を導出するために前記ビットストリーム内の前記ビデオ画像によって参照されるピクチャパラメータセットに含まれ、前記ビデオ画像内のスライス数が前記第1の構文要素の前記値より大きい、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2020年2月21日出願の国際特許出願第PCT/CN2020/076158号および2020年3月31日出願の国際特許出願第PCT/CN2020/082283号の優先権と利益を主張する、2021年2月22日出願の国際特許出願第PCT/CN2021/077220号に基づく。前述の特許出願はすべて、参照によりその全体が本明細書に組み込まれる。
【0002】
この特許明細書は、画像および映像の符号化および復号に関する。
【背景技術】
【0003】
デジタル映像は、インターネット及び他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信及び表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予測される。
【発明の概要】
【0004】
本願は、コーディングされた表現の復号に有用な制御情報を用いて、映像のコーディングされた表現を処理するために、映像エンコーダおよびデコーダが用いることができる技術を開示する。
【0005】
1つの例示的な態様において、映像復号方法が開示される。この方法は、規則に従って、1つ以上のタイルおよび1つ以上の矩形スライスを備える映像ピクチャと映像のビットストリームとの変換を行うことを含む。この規則は、1つ以上の矩形スライスに関する情報を繰り返し判定するために、映像ピクチャにおけるスライスの数から1を減算した値よりも小さいインデックスを有するスライスのみについて、タイルインデックスを示す変数を更新することを規定する。
【0006】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のサブピクチャを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、最大ピクチャ幅および最大ピクチャ高さがコーディングツリーブロックの寸法以下である場合、映像ピクチャにおける複数のサブピクチャを示すシーケンスパラメータ集合における構文要素を省略することを規定する規則に従う。
【0007】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、映像ピクチャの幅がコーディングツリーブロックの寸法以下である場合、複数の明確に提供されるタイルの列幅を示す構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0008】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、映像ピクチャの高さがコーディングツリーブロックの寸法以下である場合、明確に提供されるタイルの行の高さの数を示す構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0009】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、複数の明確に提供されるタイルの列幅がコーディングツリーブロック単位のピクチャ幅に等しい場合、1つ以上のタイルの列幅を示す1つ以上の構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0010】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、複数の明確に提供されるタイルの行の高さがコーディングツリーブロック単位のピクチャの高さに等しい場合、1つ以上のタイルの行の高さを示す1つ以上の構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0011】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上のスライスを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、ビットストリームにスライス分割情報が含まれていることを規定する規則に準拠する。
【0012】
別の例示的な態様において、映像復号方法が開示される。この方法は、規則に基づいて、1つ以上の矩形スライスを含む映像タイルと映像のビットストリームとの変換を行うことを含む。この規則は、コーディングツリーユニットの行単位で映像タイルにおける矩形スライスの高さを規定する第1の構文要素と、映像タイルにおける明確に提供されるスライスの高さの数を規定する第2の構文要素とに基づいて、均一なスライス高さを判定することを規定する。
【0013】
別の例示的な態様において、映像復号方法が開示される。この方法は、規則に従って、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この規則は、構文要素が一様なタイルの列または行の寸法に等しいか、またはそれより大きいことを規定する。構文要素は、明確に提供されるタイルの列の幅または行の高さの数の合計寸法を除いた、コーディングツリーブロック単位の寸法を示す。
【0014】
別の例示的な態様において、映像復号方法が開示される。この方法は、規則に従って、1つ以上のスライスを含む映像タイルと映像のビットストリームとの変換を行うことを含む。この規則は、構文要素が均一なスライスの高さ以上であることを規定する。構文要素は、複数の明確に提供されるスライスの高さの合計の高さを除いた、コーディングツリーブロックの単位の高さを示す。
【0015】
別の例示的な態様において、映像復号方法が開示される。この方法は、規則に従って映像とこの映像のビットストリームとの変換を行うことを含む。この規則は、サブブロックベースのマージ候補リストにおいて許可されるアフィンマージ候補の最大数を示すように、構文要素を変換に使用することを規定する。
【0016】
別の例示的な態様において、映像復号方法が開示される。この方法は、1つ以上の映像ピクチャを含む映像と映像のコーディングされた表現との変換を行うことを含み、
各映像ピクチャは1つ以上のスライスを含む1つ以上のサブピクチャを含み、そのコーディングされた表現はフォーマット規則に準拠し、そのフォーマット規則は映像ピクチャに対して矩形スライスモードが有効化されている場合、映像ピクチャの各サブピクチャにおける各スライスのピクチャレベルスライスインデックスがコーディングされた表現において明確な信号通知なしに導出されることを規定し、かつ、そのフォーマット規則が、各スライスにおける複数のコーディングツリーユニットがピクチャレベルスライスインデックスから導出可能であることを規定する。
【0017】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、1つ以上の映像ピクチャを含む映像と映像のコーディングされた表現との変換を行うことを含み、各映像ピクチャは1つ以上のスライスを含む1つ以上のサブピクチャを含み、そのコーディングされた表現はフォーマット規則に準拠し、そのフォーマット規則は、コーディングされた表現においてサブピクチャレベルスライスインデックスを信号通知することなしに、コーディングされた表現中の情報に基づいてサブピクチャレベルスライスインデックスを導出可能であることを規定する。
【0018】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、1つ以上の映像ピクチャを含む映像と映像のコーディングされた表現との変換を行うことを含み、各映像ピクチャは1つ以上のスライスを含む1つ以上のサブピクチャおよび/または1つ以上のタイルを含み、そのコーディングされた表現はフォーマット規則に準拠し、かつ、その変換は制約規則に準拠する。
【0019】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、1つ以上の映像ピクチャを含む映像との間で変換を行うことを含み、各映像ピクチャは、1つ以上のタイルおよび/または1つ以上のスライスを含み、そのコーディングされた表現は、フォーマット規則に準拠し、フォーマット規則は、映像ピクチャレベルのフィールドが、映像ピクチャにおけるスライスおよび/またはタイルの分割に関する情報を搬送することを規定する。
【0020】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、1つ以上のピクチャを含む映像と映像のコーディングされた表現との変換を行うことを含み、この変換は、映像ピクチャを分割する最小スライス数を、この映像ピクチャを分割するために矩形分割を使用するかどうかの関数とする分割規則に準拠する。
【0021】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、映像の映像領域の映像スライスと映像のコーディングされた表現との変換を行うことを含み、そのコーディングされた表現はフォーマット規則に準拠し、フォーマット規則は、コーディングされた表現が映像スライスの左上位置に基づいて映像スライスを信号通知することを規定し、フォーマット規則は、コーディングされた表現が映像ユニットレベルで信号通知される分割情報における映像スライスの高さおよび/または幅を信号通知することを規定する。
【0022】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、映像ピクチャを含む映像とこの映像のコーディングされた表現との変換を行うことを含み、そのコーディングされた表現は、フォーマット規則に準拠し、このフォーマット規則は、矩形スライスにおける第1タイルのタイルインデックスと、次の矩形スライスにおける第1タイルのタイルインデックスとの間の差の信号通知を省略することを規定する。
【0023】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、映像とこの映像のコーディングされた表現との変換を行うことを含み、そのコーディングされた表現は、フォーマット規則に準拠し、このフォーマット規則は、映像ピクチャの幅とコーディングツリーユニットのサイズとの関係によって、この映像ピクチャにおけるタイルの列または行の数を導出するために使用される情報の信号通知を制御することを規定する。
【0024】
別の例示的な態様において、別の映像処理方法が開示される。この方法は、1つ以上の映像ピクチャを含む映像とこの映像のコーディングされた表現との変換を行うことを含み、そのコーディングされた表現は、フォーマット規則に準拠し、このフォーマット規則は、均一な間隔のタイルおよび不均一な間隔のタイルを含む映像ピクチャのためのコーディングされた表現にタイルレイアウト情報が含まれることを規定する。
【0025】
さらに別の例示的な態様において、映像エンコーダ装置が開示される。この映像エンコーダは、上述した方法を実装するように構成されたプロセッサを備える。
【0026】
さらに別の例示的な態様において、映像デコーダ装置が開示される。この映像デコーダは、上述した方法を実装するように構成されたプロセッサを備える。
【0027】
さらに別の例示的な態様では、コードが記憶されたコンピュータ可読媒体が開示される。このコードは、本明細書に記載の方法の1つをプロセッサが実行可能なコードの形式で実施する。
【0028】
これらの及び他の特徴は、本文書全体にわたって説明される。
【図面の簡単な説明】
【0029】
【
図1】ピクチャのラスタスキャンスライス区分の例を示し、ピクチャは、12個のタイルと3個のラスタスキャンスライスとに分割される。
【
図2】ピクチャを矩形スライス区分の例を示し、ピクチャは、24個のタイル(6個のタイル列および4個のタイル行)と9個の矩形スライスとに分割される。
【
図3】タイルおよび矩形のスライスに分割されたピクチャの例を示し、このピクチャは、4つのタイル(2つのタイルの列および2つのタイルの行)と4つの矩形スライスとに分割される。
【
図4】15個のタイル、24個のスライス、及び24個のサブピクチャに分割されたピクチャを示す。
【
図5】ピクチャにおける4:2:2の輝度およびクロマサンプルの名目上の垂直および水平の位置を示す。
【
図6】ピクチャ分割の例を示す。青い線はタイルの境界を表し、緑い線はスライスの境界を表し、赤い破線はサブピクチャの境界を表す。図には、4つのスライスのピクチャレベルインデックス、復号順序インデックス、サブピクチャレベルインデックス、およびサブピクチャおよびタイルのインデックスが示されている。
【
図7】映像処理システム例を示すブロック図である。
【
図9】映像処理方法の一例を示すフローチャートである。
【
図10】本開示のいくつかの実施形態による映像コーディングシステムを示すブロック図である。
【
図11】本開示のいくつかの実施形態によるエンコーダを示すブロック図である。
【
図12】本開示のいくつかの実施形態によるデコーダを示すブロック図である。
【
図13】本技術にしたがった映像処理方法を示すフローチャートである。
【
図14】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図15】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図16】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図17】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図18】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図19】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図20】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図21】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図22】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図23】本技術にしたがったさらに別の映像処理方法を示すフローチャートである。
【発明を実施するための形態】
【0030】
本明細書では、理解を容易にするために章の見出しを使用しており、その技術および各章に記載された実施形態の適用可能性をその章のみに限定するものではない。さらに、H.266という用語は、ある説明において、理解を容易にするためだけに用いられ、開示される技術の範囲を限定するために用いられたものではない。このように、本明細書で説明される技術は、他の映像コーデックプロトコル及び設計にも適用可能である。
【0031】
1. 概要
本明細書は、映像コーディング技術に関する。具体的には、サブピクチャ、タイル、およびスライスの信号通知に関する。この考えは、個々にまたは様々な組み合わせで、マルチレイヤ映像コーディング、例えば、現在開発されているVersatile Video Coding(VVC)をサポートする任意の映像コーディング標準または非標準映像コーデックに適用されてもよい。
2. 略語
APS<Adaptation Parameter Set>
適応パラメータセット
AU<Access Unit>
アクセスユニット
AUD<Access Unit Delimiter>
アクセスユニット区切り文字
AVC<Advanced Video Coding>
高度映像コーディング
CLVS<Coded Layer Video Sequence>
コーディングされた層映像シーケンス
CPB<Coded Picture Buffer>
コーディングされたピクチャバッファ
CRA<Clean Random Access>
クリーンなランダムアクセス
CTU<Coding Tree Unit>
コーディングツリーユニット
CVS<Coded Video Sequence>
コーディングされた映像シーケンス
DPB<Decoded Picture Buffer>
復号ピクチャバッファ
DPS<Decoding Parameter Set>
復号するパラメータセット
EOB<End Of Bitstream>
ビットストリームの終端
EOS<End Of Sequence>
シーケンスの終端
GDR<Gradual Decoding Refresh>
漸次的復号更新
HEVC<High Efficiency Video Coding>
高効率映像コーディング
HRD<Hypothetical Reference Decoder>
仮想参照デコーダ
IDR<Instantaneous Decoding Refresh>
瞬時復号更新
JEM<Joint Exploration Model>
共同探索モデル
MCTS<Motion-Constrained Tile Sets>
動き拘束タイルセット
NAL<Network Abstraction Layer>
ネットワーク抽象化層
OLS<Output Layer Set>
出力層セット
PH<Picture Header>
ピクチャヘッダ
PPS<Picture Parameter Set>
ピクチャパラメータセット
PTL<Profile,Tier and Level>
プロファイル、層およびレベル
PU<Picture Unit>
ピクチャユニット
RBSP<Raw Byte Sequence Payload>
生バイトシーケンスペイロード
SEI<Supplemental Enhancement Information>
補足強化情報
SPS<Sequence Parameter Set>
シーケンスパラメータセット
SVC<Scalable Video Coding>
スケーラブル映像コーディング
VCL<Video Coding Layer>
映像コーディング層
VPS<Video Parameter Set>
映像パラメータセット
VTM<VVC Test Model>
VVC試験モデル
VUI<Video Usability Information>
映像可用性情報
VVC<Versatile Video Coding>
汎用映像コーディング
【0032】
3. 映像コーディングの導入
映像コーディング規格は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 VideoとH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC規格を共同で作った。H.262以来、映像コーディング規格は、時間予測と変換コーディングが利用されるハイブリッド映像コーディング構造に基づく。HEVCを超えた将来の映像コーディング技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Model)と呼ばれる参照ソフトウェアに組み込まれてきた。JVETは四半期に1回開催され、新しいコーディング規格はHEVCに比べて50%のビットレート低減を目指している。2018年4月のJVET会議において、新しい映像コーディング規格を「汎用映像コーディング(Versatile Video Coding:VVC)」と正式に命名し、その時、第1版のVVCテストモデル(VTM)をリリースした。VVCの標準化に寄与する努力が続けられているので、すべてのJVET会議において、VVC標準に新しいコーディング技術が採用されている。毎回の会議の後、VVC作業草案およびテストモデルVTMを更新する。VVCプロジェクトは、現在、2020年7月の会合における技術完成(FDIS)を目指している。
【0033】
3.1. HEVCにおけるピクチャ分割スキーム
HEVCには、正規のスライス、依存性のあるスライス、タイル、WPP(Wavefront Parallel Processing)という4つの異なる画像分割スキームがあり、これらを適用することで、最大転送ユニット(MTU)サイズのマッチング、並列処理、エンドツーエンドの遅延の低減が可能になる。
【0034】
正規のスライスは、H.264/AVCと同様である。各正規のスライスは、それ自体のNALユニットにカプセル化され、スライス境界にわたるインピクチャ予測(イントラサンプル予測、動き情報予測、コーディングモード予測)およびエントロピーコーディング依存性は無効化される。このように、1つの正規のスライスは、同じピクチャ内の他の正規のスライスとは独立して再構成することができる(しかし、ループフィルタリング動作のために依然として相互依存性が残っている場合がある)。
【0035】
正規のスライスは、並列化に使用できる唯一のツールであり、H.264/AVCでもほぼ同じ形式で使用できる。正規のスライスに基づく並列化は、プロセッサ間通信またはコア間通信をあまり必要としない(予測コーディングされたピクチャを復号するとき、動き補償のためにプロセッサ間またはコア間データ共有を除いて、通常、ピクチャ内予測のためにプロセッサ間またはコア間データ共有よりもはるかに重い)。しかしながら、同じ理由で、正規のスライスを使用すると、スライスヘッダのビットコストおよびスライス境界にわたる予測が欠如していることに起因して、かなりのコーディングのオーバーヘッドが発生する可能性がある。さらに、レギュラースライスは(後述の他のツールとは対照的に)、レギュラースライスのピクチャ内独立性および各レギュラースライスがそれ自体のNALユニットにカプセル化されることに起因して、MTUサイズ要件に適応するようにビットストリームを分割するための鍵となるメカニズムとしても機能する。多くの場合、並列化の目標およびMTUサイズマッチングの目標は、画像におけるスライスレイアウトに矛盾する要求を課す。このような状況を実現したことにより、以下のような並列化ツールが開発された。
【0036】
従属スライスは、ショートスライスヘッダを有し、ピクチャ内予測を一切中断することなく、ツリーブロック境界でビットストリームを区分することを可能にする。基本的に、従属スライスは、正規のスライスを複数のNALユニットに断片化し、正規のスライス全体の符号化が完了する前に正規のスライスの一部を送出することを可能にすることによって、エンドツーエンド遅延を低減する。
【0037】
WPPにおいて、ピクチャは、単一行のコーディングツリーブロック(CTB)に分割される。エントロピー復号および予測は、他の分割におけるCTBからのデータを使用することを許可される。CTB行の並列復号によって並列処理が可能であり、1つのCTB行の復号の開始が2つのCTBだけ遅延され、それによって、対象のCTBが復号される前に、対象のCTBの右上のCTBに関するデータが確実に利用可能になる。この互い違いのスタート(グラフで表される場合、波面のように見える)を使用することで、ピクチャがCTB行を含む数までの処理装置/コアを用いて並列化することが可能である。1つのピクチャ内の近傍のツリーブロック行間のピクチャ内予測が許可されるので、ピクチャ内予測を可能にするために必要な処理装置間/コア間通信は十分となり得る。WPP分割は、適用されない場合と比較して、追加のNALユニットの生成をもたらさず、従って、WPPは、MTUサイズマッチングのためのツールではない。しかし、MTUサイズのマッチングが必要な場合、一定のコーディングオーバーヘッドを伴って、WPPで正規のスライスを使用することができる。
【0038】
タイルは、ピクチャをタイルの列および行に分割する水平および垂直境界を規定する。タイルの列は、絵の上から下へと延びている。同様に、タイル行は、ピクチャの左から右に延びる。ピクチャにおけるタイルの数は、単にタイル列の数にタイル行の数を乗算することで得ることができる。
【0039】
CTBのスキャン順序は、1つのタイル内でローカルになるように(1つのタイルのCTBラスタスキャンの順に)変更され、その後、1つのピクチャのタイルラスタスキャンの順に従って、次のタイルの左上のCTBを復号する。正規のスライスと同様に、タイルは、ピクチャ内予測依存性およびエントロピー復号依存性を損なう。しかしながら、これらは、個々のNALユニット(この点でWPPと同じ)に含まれる必要がなく、従って、タイルは、MTUサイズマッチングに使用できない。各タイルは、1つのプロセッサ/コアによって処理されてもよく、処理ユニット間のピクチャ内予測に必要なプロセッサ/コア間通信では、近傍タイルの復号は、1つのスライスが2つ以上のタイルにまたがっている場合、共有スライスヘッダの伝達と、再構築されたサンプルおよびメタデータのループフィルタリングに関連する共有とに限定される。1つのスライスに2つ以上のタイルまたはWPPセグメントが含まれる場合、該スライスにおける最初の1つ以外の各タイルまたはWPPセグメントのエントリポイントバイトオフセットが、スライスヘッダにおいて信号通知される。
【0040】
説明を簡単にするために、HEVCにおいては、4つの異なるピクチャ分割方式の適用に関する制限が規定されている。所与のコーディングされた映像シーケンスは、HEVCに指定されたプロファイルのほとんどについて、タイルおよび波面の両方を含むことができない。各スライスおよびタイルについて、以下の条件のいずれかまたは両方を満たさなければならない。1)1つのスライスにおけるすべてのコーディングされたツリーブロックは、同じタイルに属し、2)1つのタイルにおけるすべてのコーディングされたツリーブロックは、同じスライスに属する。最後に、1つの波面セグメントはちょうど1つのCTB行を含み、WPPが使用されている時に、1つのスライスが1つのCTB行内で始まる場合、同じCTB行で終わらなければならない。
【0041】
最近のHEVCの修正は、JCT-VCの出力文書であるJCTVC-AC1005、J.ボイス、A.ラマスブラモニアン、R.スクピン、G.J.スリ版、A.トゥラピス、Y.-K.ワング(editors),“HEVC追加の捕捉強化情報(Draft4),”Oct.24,2017,下記で入手可能:http://phenix.int-evry.fr/jct/doc_end_user/documents/29_Macau/wg11/JCTVC-AC1005-v2.zipこの補正を含め、HEVCは、3つのMCTS関連SEI(補足強化情報)メッセージ、即ち、時間MCTS SEIメッセージ、MCTS抽出情報セットSEIメッセージ、およびMCTS抽出情報ネストSEIメッセージを特定する。
【0042】
時間MCTS SEIメッセージは、ビットストリーム中にMCTSが存在することを示し、MCTSに信号を送信する。各MCTSにおいて、動きベクトルは、MCTS内部のフルサンプル位置と、補間のためにMCTS内部のフルサンプル位置のみを必要とするフラクショナルサンプル位置とを指すように制限され、且つ、MCTS外部のブロックから導出された時間動きベクトル予測のための動きベクトル候補の使用は許可されない。このように、各MCTSは、MCTSに含まれていないタイルが存在せず、独立して復号されてもよい。
【0043】
MCTS抽出情報セットSEIメッセージは、MCTSサブビットストリーム抽出(SEIメッセージの意味の一部として指定される)において使用され得る補足情報を提供し、MCTSセットのための適合ビットストリームを生成する。この情報は、抽出情報セットの数で構成され、各抽出情報セットは、MCTSセットの数を定義し、MCTSサブビットストリーム抽出処理において使用される代替VPS、SPS、およびPPSのRBSPバイトを含む。MCTSサブビットストリーム抽出プロセスによってサブビットストリームを抽出する場合、パラメータセット(VPS,SPS,PPS)を書き換えるかまたは置き換える必要があるが、その理由は、スライスアドレスに関連する構文要素の1つまたは全て(first_slice_segment_in_pic_flagおよびslice_segment_addressを含む)が異なる値となる必要があるためである。
【0044】
3.2. VVCにおけるピクチャの分割
VVCにおいて、1つのピクチャは、1つ以上のタイル行および1つ以上のタイル列に分割される。1つのタイルは、1つの画像の1つの矩形領域を覆う1つのCTUのシーケンスである。1つのタイルにおけるCTUは、そのタイル内でラスタスキャン順にスキャンされる。
【0045】
1つのスライスは、1つのピクチャのタイル内において、整数個の完全なタイルまたは整数個の連続した完全なCTU行を含む。
【0046】
2つのモードのスライス、即ちラスタスキャンスライスモードおよび矩形スライスモードに対応している。ラスタスキャンスライスモードにおいて、1つのスライスは、1つのピクチャのタイルラスタスキャンにおける1つの完全なタイルのシーケンスを含む。矩形スライスモードにおいて、1つのスライスは、ピクチャの矩形領域を集合的に形成する完全なタイルの数、またはピクチャの矩形領域を集合的に形成する1つのタイルの連続した完全なCTU行の数のいずれかを含む。矩形スライス内のタイルを、そのスライスに対応する矩形領域内で、タイルラスタスキャンの順にスキャンする。
【0047】
1つのサブピクチャは、1つのピクチャの矩形領域を集合的に覆う1つ以上のスライスを含む。
【0048】
図1は、ピクチャのラスタスキャンスライス区分の例を示し、ピクチャは、12個のタイルと3個のラスタスキャンスライスとに分割される。
【0049】
図2は、ピクチャを矩形スライス区分の例を示し、ピクチャは、24個のタイル(6個のタイル列および4個のタイル行)と9個の矩形スライスとに分割される。
【0050】
図3は、タイルおよび矩形のスライスに分割されたピクチャの例を示し、このピクチャは、4つのタイル(2つのタイルの列および2つのタイルの行)と4つの矩形スライスとに分割される。
【0051】
図4は、1つのピクチャをサブピクチャで分割する例を示し、1つのピクチャは、18個のタイルに分割され、左側の12個が、4×4のCTUの1つのスライスをそれぞれ含み、右側の6個のタイルが、2×2のCTUの垂直方向に積み重ねられたスライスをそれぞれ含み、全体で24個のスライス及び24個の異なる寸法のサブピクチャとなる(各スライスは、1つのサブピクチャ)。
3.3 VVCにおけるSPS/PPS/Picture header/Slice headerの信号通知
7.3.2.3 シーケンスパラメータセットRBSP構文
【表1】
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
7.3.2.4 ピクチャパラメータセットRBSP構文
【表9】
【表10】
【表11】
【表12】
【表13】
7.3.2.7 ピクチャヘッダ構造構文
【表14】
【表15】
【表16】
【表17】
【表18】
【表19】
7.3.7.1 一般スライスセグメントヘッダ構文
【表20】
【表21】
【表22】
【表23】
3.4 タイル、スライス、サブピクチャの仕様例
3 定義
ピクチャレベルスライスインデックス:rect_slice_flagが1に等しい場合、PPSで信号通知される順番で、ピクチャにおけるスライスのリストに対するスライスのインデックスを示す。
サブピクチャレベルスライスインデックス:rect_slice_flagが1に等しい場合、PPSで信号通知される順番にサブピクチャにおけるスライスのリストへのスライスのインデックスを示す。
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
タイル列の数を規定する変数NumTileColumns、およびCTB単位でi番目のタイル列の幅を規定するiのための0からNumTileColumn-1の範囲(両端含む)のリストcolWidth[i]は、以下のように導出される。
remainingWidthInCtbsY=PicWidthInCtbsY
for(i=0;i<num_exp_tile_columns_minus1;i++){
colWidth[i]=tile_column_width_minus1[i]+1
remainingWidthInCtbsY-=colWidth[i]
}
uniformTileColWidth=tile_column_width_minus1[num_exp_tile_columns_minus1]+1 (23)
while(remainingWidthInCtbsY>=uniformTileColWidth){
colWidth[i++]=uniformTileColWidth
remainingWidthInCtbsY-=uniformTileColWidth
}
if(remainingWidthInCtbsY>0)
colWidth[i++]=remainingWidthInCtbsY
NumTileColumns=i
タイル行の数を規定する変数NumTileRowsと、0からNumTileRows-1の範囲(両端含む)のjについて、j番目のタイル行の高さをCTB単位で規定するリストRowHeight[j]は、次のように導出される。
remainingHeightInCtbsY=PicHeightInCtbsY
for(j=0;j<num_exp_tile_rows_minus1;j++){
RowHeight[j]=tile_row_height_minus1[j]+1
remainingHeightInCtbsY-=RowHeight[j]
}
uniformTileRowHeight=tile_row_height_minus1[num_exp_tile_rows_minus1]+1 (24)
while(remainingHeightInCtbsY>=uniformTileRowHeight){
RowHeight[j++]=uniformTileRowHeight
remainingHeightInCtbsY-=uniformTileRowHeight
}
if(remainingHeightInCtbsY>0)
RowHeight[j++]=remainingHeightInCtbsY
NumTileRows=j
変数NumTileInPicは、NumTileColumns*NumTileRowsに等しく設定される。
iが0からNumTileColumnsの範囲(両端含む)にあり、CTBの単位でi番目のタイル列境界の位置を規定する場合、list tileColBd[i]は、以下のように導出される。
for(tileColBd[0]=0,i=0;i<NumTileColumns;i++)
tileColBd[i+1]=tileColBd[i]+colWidth[i] (25)
注1- 配列tileColBd[]のサイズは、CtbToleBd[]の導出における実際のタイル列の数よりも1大きい。
j番目のタイル行境界の位置をCTB単位で特定する、jが0からNumTileRowsの範囲(両端含む)にあるリストtileRowBd[j]は、以下のように導出される。
for(tileRowBd[0]=0,j=0;j<NumTileRows;j++)
tileRowBd[j+1]=tileRowBd[j]+RowHeight[j] (26)
注2- 上記導出における配列tileRowBd[]のサイズは、CtbToleRowBd[]の導出における実際のタイル行の数よりも1大きい。
ctbAddrXが0からPicWidthInCtbsYの範囲(両端含む)のリストCtbToTileColBd[ctbAddrX](これらを含む)は、水平CTBアドレスから左側タイル列境界への変換をCTB単位で規定すると、以下のように導出される。
tileX=0
for(ctbAddrX=0;ctbAddrX<=PicWidthInCtbsY;ctbAddrX++){
if(ctbAddrX==tileColBd[tileX+1]) (27)
tileX++
CtbToTileColBd[ctbAddrX]=tileColBd[tileX]
}
注3- 上記導出における配列CtbToTileColBd[]のサイズは、derivation slice_data()信号通知におけるCTBにおける実際のピクチャ幅の数よりも1大きい。
ctbAddrYが0からPicHeightInCtbsYの範囲(両端含む)のリストCtbToTileRowBd[ctbAddrYは、垂直CTBアドレスからCTB単位の上部タイル列境界への変換を規定し、以下のように導出される。
tileY=0
for(ctbAddrY=0;ctbAddrY<=PicHeightInCtbsY;ctbAddrY++){
if(ctbAddrY==tileRowBd[tileY+1]) (28)
tileY++
CtbToTileRowBd[ctbAddrY]=tileRowBd[tileY]
}
注4- 上記導出における配列CtbToleRowBd[]のサイズは、slice_data()信号通知におけるCTBにおける実際のピクチャの高さの数よりも1大きい。
矩形スライスの場合、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストNumCtusInSlice[i]は、i番目のスライスにおけるCTUの数を規定し、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストSliceTopLeftTileIdx[i]は、スライスの左上のタイルのインデックスを規定し、jは0からNumCtusInSlice[i]-1の範囲(両端含む)で、i番目のスライス内のj番目のCTBのピクチャラスタスキャンアドレスを規定し、以下のように導出される。
if(single_slice_per_subpic_flag){
for(i=0;i<=sps_num_subpics_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<PicSizeInCtbsY;i++){
sliceIdx=subpic_info_present_flag?CtbToSubpicIdx[i]:0
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=i
NumCtusInSlice[sliceIdx]++
}
}else{
tileIdx=0
for(i=0;i<=num_slices_in_pic_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
SliceTopLeftTileIdx[i]=tileIdx
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
if(i==num_slices_in_pic_minus1){
slice_width_in_tiles_minus1[i]=NumTileColumns-1-tileX
slice_height_in_tiles_minus1[i]=NumTileRows-1-tileY
NumSlicesInTile[i]=1
}
if(slice_width_in_tiles_minus1[i]==0&&slice_height_in_tiles_minus1[i]==0){ (29)
ctbY=tileRowBd[tileY]
for(j=0;j<NumSlicesInTile[i]-1;j++){
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],
ctbY,ctbY+SliceHeightInCtusMinus1[i]+1)
ctbY+=SliceHeightInCtusMinus1[i]+1
i++
}
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],ctbY,tileRowBd[tileY+1])
} else
for(j=0;j<=slice_height_in_tiles_minus1[i];j++)
for(k=0;k<=slice_width_in_tiles_minus1[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],
tileRowBd[tileY+j],tileRowBd[tileY+j+1])
if(tile_idx_delta_present_flag)
tileIdx+=tile_idx_delta[i]
else{
tileIdx+=slice_width_in_tiles_minus1[i]+1
if(tileIdx%NumTileColumns==0)
tileIdx+=slice_height_in_tiles_minus1[i]*NumTileColumns
}
}
}
関数AddCtbsToSlice(sliceIdx,startX,stopX,startY,stopY)を以下のように規定する。
for(ctbY=startY;ctbY<stopY;ctbY++)
for(ctbX=startX;ctbX<stopX;ctbX++){
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=ctbY*PicWidthInCtbsY+ctbX (30)
NumCtusInSlice[sliceIdx]++
}
iが0からnum_slices_in_pic_minus1の範囲(両端含む)にある場合、NumCtusInSlice[i]の値は、0よりも大きいことが、ビットストリーム準拠の要件である。また、iが0からnum_slices_in_pic_minus1の範囲(両端含む)であり、jが0からNumCtusInSlice[i]-1の範囲(両端含む)である行列CtbAddrInSlice[i][j]は、0からPicSizeInCtbsY-1の範囲のすべてのCTBアドレスを一度に限り含むべきであることが、ビットストリーム準拠の要件である。
ピクチャラスタスキャンにおけるCTBアドレスからサブピクチャインデックスへの変換を規定する、0からPicSizeInCtbsY-1の範囲(両端含む)のctbAddrRのリストCtbTobSubpicIdx[ctbAddrRs]は、以下のように導出される。
for(ctbAddrRs=0;ctbAddrRs<PicSizeInCtbsY;ctbAddrRs++){
posX=ctbAddrRs%PicWidthInCtbsY
posY=ctbAddrRs/PicWidthInCtbsY
CtbToSubpicIdx[ctbAddrRs]=-1
for(i=0;CtbToSubpicIdx[ctbAddrRs]<0&&i<=sps_num_subpics_minus1;i++){ (31)
if((posX>=subpic_ctu_top_left_x[i])&&
(posX<subpic_ctu_top_left_x[i]+subpic_width_minus1[i]+1)&&
(posY>=subpic_ctu_top_left_y[i])&&
(posY<subpic_ctu_top_left_y[i]+subpic_height_minus1[i]+1))
CtbToSubpicIdx[ctbAddrRs]=i
}
}
i番目のサブピクチャの矩形スライスの数を規定するリストNumSlicesInSubpic[i]は以下のように導出される。
for(j=0;j<=sps_num_subpics_minus1;j++)
NumSlicesInSubpic[j]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
posX=CtbAddrInSlice[i][0]%PicWidthInCtbsY
posY=CtbAddrInSlice[i][0]/PicWidthInCtbsY
for(j=0;j<=sps_num_subpics_minus1;j++){
if((posX>=subpic_ctu_top_left_x[j])&& (32)
(posX<subpic_ctu_top_left_x[j]+subpic_width_minus1[j]+1)&&
(posY>=subpic_ctu_top_left_y[j])&&
(posY<subpic_ctu_top_left_y[j]+subpic_height_minus1[j]+1)){
NumSlicesInSubpic[j]++
}
}
}
7.3.4.3 ピクチャパラメータセットRBSP意味論
subpic_id_mapping_in_pps_flagが1に等しい場合、サブピクチャIDマッピングがPPSで信号通知されることを規定する。subpic_id_mapping_in_pps_flagが0に等しい場合は、PPSにおいてサブピクチャーIDのマッピングは信号通知されないことを規定する。subpic_id_mapping_explicitly_signalled_flagが0、またはsubpic_id_mapping_in_sps_flagが1の場合、subpic_id_mapping_in_pps_flagの値は0とする。それ以外の場合(subpic_id_mapping_explicitly_signalled_flagが1に等しく、subpic_id_mapping_in_sps_flagが0に等しい)、subpic_id_mapping_in_pps_flagの値は1に等しいものとする。
pps_num_subpics_minus1はsps_num_subpics_minus1と等しいものとする。
pps_subpic_id_len_minus1はsps_subpic_id_len_minus1に等しいものとする。
pps_subpic_id[i]は、i番目のサブピクチャのサブピクチャIDを規定する。pps_subpic_id[i]構文要素の長さは、pps_subpic_id_len_minus1+1ビットである。
変数SubpicIdVal[i]は、0からsps_num_subpics_minus1の範囲(両端含む)のiの各値について、以下のように導出される。
for(i=0;i<=sps_num_subpics_minus1;i++)
if(subpic_id_mapping_explicitly_signalled_flag)
SubpicIdVal[i]=subpic_id_mapping_in_pps_flag?pps_subpic_id[i]:sps_subpic_id[i] (80)
else
SubpicIdVal[i]=i
ビットストリーム適合性の要件は、以下の制約の双方が適用されることである。
- 0からsps_num_subpics_minus1の範囲(両端含む)のiおよびjの任意の2つの異なる値の場合、SubpicIdVal[i]はSubpicIdVal[j]に等しくならないものとする。
- 現在のピクチャがCLVSの第1ピクチャでない場合、0からsps_num_subpics_minus1の範囲(両端含む)のiの各値について、SubpicIdVal[i]の値が、同じレイヤにおける復号順に前のピクチャのSubpicIdVal[i]の値に等しくない場合、サブピクチャインデックスiを有する現在のピクチャにおけるサブピクチャのすべてのコーディングされたスライスNALユニットのnal_unit_typeは、IDR_W_RADLからCRA_NUTの範囲(両端含む)の特定の値に等しくなければならない。
no_pic_partition_flagが1に等しい場合、PPSを参照する各ピクチャに対してピクチャ分割が適用されないことを規定する。no_pic_partition_flagが0に等しい場合、PPSを参照する各ピクチャを複数のタイルまたはスライスに分割することができることを規定する。
CLVS内のコーディングされたピクチャによって参照されるすべてのPPSについて、no_pic_partition_flagの値が同じであることが、ビットストリーム適合性の要件である。
sps_num_subpics_minus1+1の値が1よりも大きい場合、no_pic_partition_flagの値が1に等しくないことが、ビットストリーム準拠の要件である。
pps_log2_ctu_size_minus5+5は、各CTUの輝度コーディングツリーのブロックサイズを規定する。
pps_log2_ctu_size_minus5はsps_log2_ctu_size_minus5と等しいものとする。
num_exp_tile_columns_minus1+1は、明確に提供されるタイル列の幅の数を規定する。num_exp_tile_columns_minus1の値は、0からPicWidthInCtbsY-1の範囲(両端含む)とする。no_pic_partition_flagが1に等しい場合、num_exp_tile_columns_minus1の値は0に等しいと推測される。
num_exp_tile_rows_minus1+1は、明確に提供されるタイル行の高さの数を規定する。num_exp_tile_rows_minus1の値は、0からPicHeightInCtbsY-1の範囲(両端含む)にあるものとする。no_pic_partition_flagが1に等しい場合、num_tile_rows_minus1の値は0に等しいと推測される。
tile_column_width_minus1[i]plus 1は、0からnum_exp_tile_columns_minus1-1の範囲(両端含む)のiについて、i番目のタイル列の幅をCTB単位で規定する。tile_column_width_minus1[num_exp_tile_columns_minus1]は、6.5.1節に規定されるnum_exp_tile_columns_minus1以上のインデックスを持つタイル列の幅を導出するために使用される。tile_column_width_minus1[i]の値は、0からPicWidthInCtbsY-1の範囲(両端含む)とする。存在しない場合、tile_column_width_minus1[0]の値は、PicWidthInCtbsY-1に等しいと推測される。
tile_row_height_minus1[i]plus1は、i番目のタイル行の高さをCTB単位で0からnum_exp_tile_rows_minus1-1の範囲に(両端含む)あるiについて規定する。tile_row_height_minus1[num_exp_tile_rows_minus1]は6.5.1 節に規定されるnum_exp_tile_rows_minus1以上のインデックスを持つタイル行の高さを導出するために使用される。tile_row_height_minus1[i]の値は、0からPicHeightInCtbsY-1の範囲(両端含む)にあるものとする。存在しない場合、tile_row_height_minus1[0]の値はPicHeightInCtbsY-1に等しいと推測される。
rect_slice_flag=0は、各スライス内のタイルがラスタスキャン順に配列されており、且つスライス情報がPPSで信号通知されないことを規定する。rect_slice_flag=1は、各スライス内のタイルがピクチャの矩形領域を覆い、且つスライス情報がPPSで信号通知されることを規定する。存在しない場合、rect_slice_flagは1に等しいと推測される。subpic_info_present_flagが1であるとき、rect_slice_flagの値は1である。
single_slice_per_subpic_flagが1の場合、各サブピクチャは1つの矩形スライスのみで構成される。single_slice_per_subpic_flagが0の場合、各サブピクチャは1つまたは複数の矩形スライスで構成されてもよいことを規定する。single_slice_per_subpic_flagが1に等しい場合、num_slices_in_pic_minus1はsps_num_subpics_minus1に等しいと推測される。存在しない場合、single_slice_per_subpic_flagの値は0に等しいと推測される。
num_slices_in_pic_minus1+1は、PPSを参照する各ピクチャの矩形スライスの数を規定する。num_slices_in_pic_minus1の値は、0からMaxSlicesPerPicture-1の範囲(両端含む)とし、MaxSlicesPerPictureは附属書Aで規定されるものとする。no_pic_partition_flagが1の場合、num_slices_in_pic_minus1の値は0に等しいと推定される。
tile_idx_delta_present_flagが0の場合は、PPSにtile_idx_delta値が存在せず、PPSを参照するピクチャの全ての矩形スライスを6.5.1項の処理に従ってラスタオーダで規定することを規定する。1に等しいtile_idx_delta_present_flagは、PPSにtile_idx_delta値が存在し、PPSを参照するピクチャのすべての矩形スライスがtile_idx_delta値で示される順序で規定されることが規定される。存在しない場合、tile_idx_delta_present_flagの値は0と推測される。
slice_width_in_tiles_minus1[i]plus1は、i番目の矩形スライスの幅をタイルの列の単位で規定する。slice_width_in_tiles_minus1[i]の値は0からNumTileColumns-1の範囲(両端含む)とする。
slice_width_in_tiles_minus1[i]が存在しない場合、以下が適用される。
- NumTileColumnsが1に等しい場合、slice_width_in_tiles_minus1[i]の値は0に等しいと推論される。
- そうでない場合、6.5.1項に規定されるように、slice_width_in_tiles_minus1[i]の値を推論する。
slice_height_in_tiles_minus1[i]plus1は、i番目の矩形スライスの高さをタイル行単位で規定する。slice_height_in_tiles_minus1[i]の値は、0からNumTileRows-1の範囲(両端含む)とする。
slice_height_in_tiles_minus1[i]が存在しない場合、以下が適用される。
- NumTileRowsが1に等しい、またはtile_idx_delta_present_flagが0に等しく、且つtileIdx%NumTileColumnsが0より大きい場合、slice_height_in_tiles_minus1[i]の値は0に等しい。
- そうでない場合(NumTileRowsが1に等しくなく、tile_idx_delta_present_flagが1に等しいか、またはtileIdx%NumTileColumnsが0に等しい)、tile_idx_delta_present_flagが1に等しいか、またはtileIdx%NumTileColumnsが0に等しい場合slice_height_in_tiles_minus1[i]iの値は、slice_height_in_tiles_minus1[i-1]と等しいと推論される。
num_exp_slices_in_tile[i]は、2つ以上の矩形スライスを含む、現在のタイルにおける明確に提供されるスライスの高さの数を規定する。num_exp_slices_in_tile[i]の値は、0からRowHeight[tileY]-1の範囲(両端含む)とする。ここで、tileYは、i番目のスライスを含むタイル行インデックスである。存在しない場合、num_exp_slices_in_tile[i]の値は0に等しいと推測される。num_exp_slices_in_tile[i]が0に等しい場合、変数NumSlicesInTile[i]の値は1に等しいと導出される。
exp_slice_height_in_ctus_minus1[j]+1現在のタイルにおけるj番目の矩形スライスの高さをCTU行単位で規定する。exp_slice_height_in_ctus_minus1[j]の値は、0からRowHeight[tileY]-1の範囲(両端含む)とする。ここで、tileYは、現在のタイルのタイル行インデックスである。
num_exp_slices_in_tile[i]が0より大きい場合、0からNumSlicesInTile[i]-1の範囲のkに対する変数NumSlicesInTile[i]とSliceHeightInCtusMinus1[i+k]は、以下のように導出される。
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
numExpSliceInTile=num_exp_slices_in_tile[i]
for(j=0;j<numExpSliceInTile-1;j++){
SliceHeightInCtusMinus1[i++]=exp_slice_height_in_ctu_minus1[j]
remainingHeightInCtbsY-=SliceHeightInCtusMinus1[j]
}
uniformSliceHeightMinus1=SliceHeightInCtusMinus1[i-1] (81)
while(remainingHeightInCtbsY>=(uniformSliceHeightMinus1+1)){
SliceHeightInCtusMinus1[i++]=uniformSliceHeightMinus1
remainingHeightInCtbsY-=(uniformSliceHeightMinus1+1)
j++
}
if(remainingHeightInCtbsY>0){
SliceHeightInCtusMinus1[i++]=remainingHeightInCtbsY
j++
}
NumSlicesInTile[i]=j
tile_idx_delta[i]は、i番目の矩形スライスの第1タイルのタイルインデックスと、(i+1)番目の矩形スライスの第1タイルのタイルインデックスの差を規定する。tile_idx_delta[i]の値は、-NumTilesInPic+1からNumTilesInPic-1の範囲(両端含む)とする。存在しない場合、tile_idx_delta[i]の値は0に等しいと推測される。存在する場合、tile_idx_delta[i]の値は0に等しいと推測される。
…
7.4.2.4.5 VCL NALユニットの順序およびそのコーディングされたピクチャへの関連付け
コーディングされたピクチャにおけるVCL NALユニットの順序は、以下のように制約される。
- 1つのコーディングされたピクチャの任意の2つのコーディングされたスライスNALユニットA及びBについて、subpicIdxA及びsubpicIdxBをそれらのサブピクチャレベルインデックス値とし、sliceAddrA及びsliceddrBをそれらのslice_address値とする。
- 以下の条件のいずれかが真である場合、コーディングされたスライスNALユニットAは、コーディングされたスライスNALユニットBに先行するものとする。
- subpicIdxAは、subpicIdxB未満である。
- subpicIdxAはsubpicIdxBに等しく、sliceAddrAはsliceAddrB 未満である。
7.4.8.1 一般スライスヘッダ意味論
Cu_qp_delta_absを含むコーディングユニットの輝度量子化パラメータとその予測値の差を規定する変数CuQpDeltaValは、0に等しく設定される。cu_chroma_qp_offset_flagを含むコーディングユニットの量子化パラメータQp’
Cb,Qp’
CrおよびQp’
CbCrのそれぞれの値を判定する際に用いる値を規定する変数CuQpOffset
Cb,CuQpOffset
CrおよびCuQpOffset
CbCrは、すべて0に等しく設定される。
picture_header_in_slice_header_flagが1の場合、スライスヘッダにPH構文構造が存在する。picture_header_in_slice_header_flagが0の場合、スライスヘッダにPH構文構造が存在しない。
CLVS内のすべてのコーディングされたスライスにおいてpicture_header_in_slice_header_flagの値が同じであることは、ビットストリームコンフォーマンスの要件である。
コーディングされたスライスでpicture_header_in_slice_header_flagが1のときは、CLVS内にnal_unit_typeがPH_NUTであるVCL NALユニットが存在しないことがビットストリーム適合性の要件となる。
picture_header_in_slice_header_flagが0のとき、現在のピクチャのすべてのコーディングされたスライスはpicture_header_in_slice_header_flagが0に等しく、現在のPUはPH NALユニットを持つものとする。
slice_subpic_idは、スライスを含むサブピクチャのサブピクチャIDを規定する。slice_subpic_idが存在する場合、変数CurrSubpicIdxの値は、SubpicIdVal[CurrSubpicIdx]がslice_subpic_idに等しくなるように導出される。そうでない場合(slice_subpic_idが存在しない)、CurrSubpicIdxは0に等しくなるように導出される。slice_subpic_idの長さは、sps_subpic_id_len_minus1+1ビットである。
slice_addressは、スライスのスライスアドレスを規定する。存在しない場合、slice_addressの値は0に等しいと推測される。rect_slice_flagが1でNumSlicesInSubpic[CurrSubpicIdx]が1のとき、slice_addressの値は0と推測される.
rect_slice_flagが0に等しい場合、以下が適用される。
- スライスアドレスは、ラスタスキャンタイルインデックスである。
- slice_addressの長さは、Ceil(Log2(NumTilesInPic))ビットである。
- slice_addressの値は、0からNumTilesInPic-1までの範囲内にあるべきである。
そうでない場合(rect_slice_flagが1に等しい場合)、以下が適用される。
- スライスアドレスは、スライスのサブピクチャレベルスライスインデックスである。
- slice_addressの長さは、Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))ビットである。
- slice_addressの値は、0~NumSlicesInSubpic[CurrSubpicIdx]-1までの範囲内とする。
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- rect_slice_flagが0に等しい、又はsubpic_info_present_flagが0に等しい場合、slice_addressの値は、同じコーディングされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのslice_addressの値に等しくてはならない。
- そうでない場合、slice_subpic_id及びslice_address値の組は、同じコーディングされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのslice_subpic_id及びslice_address値の組に等しくてはならない。
- ピクチャのスライスの形状は、各CTUが復号された場合、その左側境界全体及び最上の境界全体が1つのピクチャの境界、又は、以前に復号されたCTUの境界を含むものでなければならない。
sh_extra_bit[i]は1又は0に等しくてもよい。本明細書バージョンに準拠するデコーダは、sh_extra_bit[i]の値を無視しなければならない。その値は、本明細書のバージョンで特定された特徴に対するのデコーダの適合性に影響を与えない。
num_tiles_in_slice_minus1 plus1は、存在する場合、スライス内のタイル数を規定する。num_tiles_in_slice_minus1の値は、0からNumTilesInPic-1までの範囲内にあるべきである。
現在のスライス内のCTUの数を規定する変数NumCtusInCurrSliceと、0からNumCtusInCurrSlice-1の範囲(両端含む)のiについて、スライス内のi番目のCTBのピクチャラスタスキャンアドレスを規定するリストCtbAddrInCurrSlice[i]は、次のように導出される。
if(rect_slice_flag){
picLevelSliceIdx=slice_address
for(j=0;j<CurrSubpicIdx;j++)
picLevelSliceIdx+=NumSlicesInSubpic[j]
NumCtusInCurrSlice=NumCtusInSlice[picLevelSliceIdx]
for(i=0;i<NumCtusInCurrSlice;i++)
CtbAddrInCurrSlice[i]=CtbAddrInSlice[picLevelSliceIdx][i] (117)
} else{
NumCtusInCurrSlice=0
for(tileIdx=slice_address;tileIdx<=slice_address+num_tiles_in_slice_minus1;tileIdx++){
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
for(ctbY=tileRowBd[tileY];ctbY<tileRowBd[tileY+1];ctbY++){
for(ctbX=tileColBd[tileX];ctbX<tileColBd[tileX+1];ctbX++){
CtbAddrInCurrSlice[NumCtusInCurrSlice]=ctbY*PicWidthInCtb+ctbX
NumCtusInCurrSlice++
}
}
}
}
変数SubpicLeftBoundaryPos、SubpicTopBoundaryPos、SubpicRightBoundaryPos、SubpicBotBoundaryPosは以下のように導出される。
if(subpic_treated_as_pic_flag[CurrSubpicIdx]){
SubpicLeftBoundaryPos=subpic_ctu_top_left_x[CurrSubpicIdx]*CtbSizeY
SubpicRightBoundaryPos=Min(pic_width_max_in_luma_samples-1,
(subpic_ctu_top_left_x[CurrSubpicIdx]+
subpic_width_minus1[CurrSubpicIdx]+1)*CtbSizeY-1)
SubpicTopBoundaryPos=subpic_ctu_top_left_y[CurrSubpicIdx]*CtbSizeY (118)
SubpicBotBoundaryPos=Min(pic_height_max_in_luma_samples-1,
(subpic_ctu_top_left_y[CurrSubpicIdx]+
subpic_height_minus1[CurrSubpicIdx]+1)*CtbSizeY-1)
}
【0052】
3.5 色空間および彩度サブサンプリング
色空間は、カラーモデル(又はカラーシステム)としても知られ、色の範囲を数字のタプル(tuple)として簡単に記述する抽象的な数学モデルであり、典型的には3又は4つの値又は色成分(例えばRGB)である。基本的には、色空間は座標系とサブ空間とを精緻化したものである。
【0053】
映像圧縮の場合、最も頻繁に使用される色空間は、YCbCr及びRGBである。
【0054】
YCbCr,Y’CbCr,or YPb/Cb Pr/Crは、YCBCRorY’CBCRとも記述され、カラー画像のパイプライン映像およびデジタル写真システムの一部として使用される色空間のファミリである。Y’は輝度成分であり、CBとCRは青色差および赤色差の彩度成分である。Y’(プライム付き)は、輝度であるYと区別され、ガンマ補正されたRGBプライマリーに基づいて光強度が非線形に符号化されることを意味する。
【0055】
彩度サブサンプリングは、人間の視覚システムが、輝度よりも色差の方が知覚が低いことを利用して、輝度情報よりも彩度情報の方が解像度が低くなるように実装してピクチャを符号化する方法である。
【0056】
3.5.1. 4:4:4
3つのY’CbCr成分のそれぞれは、同じサンプルレートを有し、従って、彩度サブサンプリングはない。この方式は、ハイエンドフィルムスキャナ及びシネマティックポストプロダクションに用いられることがある。
【0057】
3.5.2. 4:2:2
2つの彩度成分は、輝度のサンプルレートの半分でサンプリングされ、水平彩度解像度は半分にされ、垂直彩度解像度は変化しない。これにより、視覚的にほとんどまたは全く差がなく、非圧縮の映像信号の帯域幅を1/3に低減することができる。4:2:2カラーフォーマットの名目上の垂直および水平の位置の例が、例えば、VVC作業草案の
図5に示されている。
【0058】
3.5.3. 4:2:0
4:2:0では、水平サンプリングは4:1:1に比べて2倍になるが、この方式ではCbとCrチャンネルを各交互のラインでのみサンプリングするため、垂直解像度が半分になる。従って、データレートは同じである。Cb及びCrはそれぞれ水平及び垂直方向の両方に2倍ずつサブサンプリングされる。異なる水平及び垂直位置を有する4:2:0スキームの3つの変形がある。
● MPEG-2において、CbおよびCrは水平方向に共座している。CbおよびCrは垂直方向の画素間に位置する(格子間に位置する)。
● JPEG/JFIFにおいて、H.261、およびMPEG-1、Cb、およびCrは、交互の輝度サンプルの中間の格子間に位置する。
● 4:2:0DVにおいて、CbおよびCrは、水平方向に共座している。垂直方向には、それらは交互に共座している。
表3-1.chroma_format_idcおよびseparate_colour_plane_flagから導出したSubWidthCおよびSubHeightCの値
【表24】
【0059】
4. 開示される実施形態が解決しようとする技術的課題の例
VVCにおけるSPS/PPS/ピクチャヘッダ/スライスヘッダの信号化に関する既存の設計には、以下のような問題がある。
1)rect_slice_flagが1のとき、現在のVVCのテキストによれば、以下のようになる。
a.slice_addressは、スライスのサブピクチャレベルのスライスインデックスを表す。
b. サブピクチャレベルのスライスインデックスとは、サブピクチャのスライスをPPSで信号化した順番に並べたリストに対するスライスのインデックスと定義される。
c. ピクチャレベルのスライスインデックスとは、ピクチャ内のスライスをPPSで信号化された順に並べたリストに対するスライスのインデックスと定義される。
d. 異なる2つのサブピクチャに属する2つのスライスについては、サブピクチャインデックスの小さい方が復号順は早くなり、同じサブピクチャに属する2つのスライスについては、サブピクチャレベルのスライスインデックスが小さい方が復号順は早くなる。
e. そして、現在のスライスのCTU数を規定する変数NumCtusInCurrSliceの今回のVVCテキストの式117による導出は、ピクチャレベルのスライスインデックス値の増加順序がスライスの復号順序と同じであることを仮定している。
しかし、1枚のタイルを分割した結果、いくつかのスライスが生じた場合、上記のような点に抵触する可能性がある。
図6に示す例では、ピクチャが垂直方向のタイル境界によって2つのタイルに分割され、2つのタイルのそれぞれがピクチャ全体にわたって同じ水平方向の境界によって2つのスライスに分割される場合、上側の2つのスライスが第1サブピクチャに含まれ、下側の2つのスライスが第2サブピクチャに含まれる。この場合、現在のVVCテキストによれば、スライスラスタースキャン順の4つのスライスのピクチャレベルのスライスインデックス値は0、2、1、3となり、スライスラスタースキャン順の4つのスライスのデコード順インデックス値は0、1、2、3ということになる。その結果、NumCtusInCurrSliceの導出が正しくなくなり、スライスデータの解析に問題が生じ、デコードされたサンプル値が正しくなくなり、デコーダがクラッシュする可能性が高くなる。
2)スライス信号方式には2種類ある。矩形モードでは、すべてのスライス分割情報がPPSで信号化される。非矩形モードでは、スライスヘッダでスライス分割情報の一部が通知されるため、このモードではピクチャのすべてのスライスを解析する前にピクチャの完全なスライス分割を知ることができない。
3)矩形モードではtile_idx_deltaを設定することにより,スライスを任意に信号化することができる。悪意のあるビットストリームは、このメカニズムでデコーダをクラッシュさせる場合がある。
4)ある実施形態では、iがnum_slices_in_pic_minus1に等しい場合、初期化されていないtile_idx_delta[i]
5)Merge Estimation Region (MER)のサイズは最小4×4までとすることができる。ただし、信号通知されるMERサイズが最小CUサイズより小さい場合は、意味がない。
6)構文テーブルから、「num_exp_tile_columns_minus1」番目のタイルカラムの幅がtile_column_width_minus1[num_exp_tile_columns_minus1]として提示されていることが分かる。ただし、意味論では、tile_column_width_minus1[num_exp_tile_columns_minus1]を用いて、6.5.1項で規定するnum_exp_tile_columns_minus1以上のインデックスのタイル列の幅を導出する。つまり、‘num_exp_tile_columns_minus1’番目のタイルカラムの幅をリセットすることができる。num_exp_tile_columns_minus1’-th tile rowの高さについても同様である。
【0060】
図6は、ピクチャ分割の例を示す。実線602はタイルの境界を、破線604はスライスの境界を、破線606はサブピクチャの境界を表す。図には、4つのスライスのピクチャレベルインデックス、復号順序インデックス、サブピクチャレベルインデックス、およびサブピクチャおよびタイルのインデックスが示されている。
【0061】
5. 例示的な実施形態及び技術
上述した課題等を解決するために、以下に示す方法が開示されている。本発明は、一般的な概念を説明するための例と見なされるべきであり、狭い意味で解釈されるべきではない。さらに、本発明は、個々に適用されてもよいし、任意に組み合わせて適用されてもよい。
1. 矩形スライスモードのスライス(rect_slice_flagが1に等しい場合)については、各サブピクチャの各スライスに対するピクチャレベルのスライスインデックスを導出し、その導出した値を用いて各スライスにおけるCTU数を導出する。
2. サブピクチャレベルのスライスインデックスは、以下の方法で定義/導出することができる。
a. 一例では、サブピクチャレベルのスライスインデックスは、“rect_slice_flagが1に等しいときのそのデコード順でサブピクチャ内のスライスのリストへのスライスのインデックス”と定義される。
b. あるいは、サブピクチャレベルのスライスインデックスは、“rect_slice_flagが1に等しいときのサブピクチャのスライスリストに対するスライスのインデックスで、式32(実施の形態1と同様)で導かれる変数SubpicLevelSliceIdx[i]で規定され、iはそのスライスのピクチャレベルスライスインデックス”として定義される。
c. 一例として、ピクチャレベルのスライスインデックスが特定の値である各スライスのサブピクチャインデックスを導出する。
d. 一例として、ピクチャレベルのスライスインデックスが特定の値である各スライスのサブピクチャレベルのスライスインデックスを導出する。
e. 一例では、rect_slice_flagが1に等しいとき、スライスアドレスの意味論は、“スライスアドレスは、式32で導出される変数SubpicLevelSliceIdx[i]で規定されるスライスのサブピクチャレベルスライスインデックスであり(例えば、実施形態1のように)、iはそのスライスのピクチャレベルスライスインデックス”と規定される。
3. スライスのサブピクチャレベルのスライスインデックスは、そのスライスを含む最初のサブピクチャ内のスライスに割り当てられる。各スライスのサブピクチャレベルのスライスインデックスは、ピクチャレベルのスライスインデックスをインデックスとする配列(例えば、実施の形態1におけるSubpicLevelSliceIdx[i])に格納されてもよい。
a. 一例として、サブピクチャレベルのスライスインデックスは、非負の整数である。
b. 一例として、スライスのサブピクチャレベルのスライスインデックスの値は、0以上である。
c. ある例では、スライスのサブピクチャレベルのスライスインデックスの値はNより小さく、Nはサブピクチャのスライス数である。
d. 一例として、第1スライス(スライスA)の第1サブピクチャレベルのスライスインデックス(subIdxAと表記)は、第1スライスと第2スライス(スライスB)が同じサブピクチャ内にありながら異なる場合、第2スライス(スライスB)の第2サブピクチャレベルのスライスインデックス(subIdxBと表記)と異なる必要がある。
e. 一例では、第1サブピクチャにおける第1スライス(スライスA)の第1サブピクチャレベルのスライスインデックス(subIdxAと表記)が、同じ第1サブピクチャにおける第2スライス(スライスB)の第2サブピクチャレベルのスライスインデックス(subIdxBと表記)より小さい場合、IdxAはIdxBより小さく、idxAとidxBとは、それぞれスライスAとスライスBとのピクチャ全体のスライスインデックス(別名、ピクチャレベルのスライスインデックス、例えば、sliceIdx)を表す。
f. 一例として、第1サブピクチャ内の第1スライス(スライスA)の第1サブピクチャレベルのスライスインデックス(subIdxAと表記)が、同じ第1サブピクチャ内の第2スライス(スライスB)の第2サブピクチャレベルのスライスインデックス(subIdxBと表記)より小さい場合、復号順ではスライスAがスライスBより先行する。
g. 一例として、サブピクチャにおけるサブピクチャレベルのスライスインデックスは、ピクチャレベルのスライスインデックス(例えば、sliceIdx)に基づいて導出される。
4. サブピクチャ内のサブピクチャレベルのスライスインデックスとピクチャレベルのスライスインデックスとの間のマッピング関数/テーブルを導出することを提案する。
a. 一例として、2寸法配列PicLevelSliceIdx[subPicIdx][SubPicLevelSliceIdxが、サブピクチャ内のサブピクチャレベルスライスインデックスをピクチャレベルスライスインデックスにマッピングするように導出される。ここで、PicLevelSliceIdxはスライスのピクチャレベルスライスインデックス、subPicIdxはサブピクチャのインデックス、SubPicLevelSliceIdxはサブピクチャのスライスのサブピクチャレベルスライスインデックスを示す。
i. 一例では、配列NumSlicesInSubpic[subPicIdx]がPicLevelSliceIdxの導出に用いられ、NumSlicesInSubpic[subPicIdx]は、subPicIdxに等しいインデックスのサブピクチャにおけるスライス数であることを示す。
1) 一例として、NumSlicesInSubpic[subPicIdx]とPicLevelSliceIdx[subPicIdx][SubPicLevelSliceIdx]は、ピクチャレベルスライスのインデックス順にすべてのスライスをスキャンして一度の処理で導出される。
a. NumSlicesInSubpic[subPicIdx]は、処理前のすべての有効なsubPicIdxに対して0に等しく設定される。
b. ピクチャレベルインデックスがSであるスライスをチェックするとき、それがサブピクチャインデックスがPであるサブピクチャ内にあれば、PicLevelSliceIdx[P][NumSlicesInSubpic[P]]をSとし、次にNumSlicesInSubpic[P]をNumSlicesInSubpic[P]+1とする。
ii. 一例では、SliceIdxInPic[subPicIdx][SubPicLevelSliceIdx]を使用して、ピクチャレベルのスライスインデックス(たとえばpicLevelSliceIdx)を導出し、これを使用して、スライスヘッダの解析時にスライス内のCTBの数および/またはアドレスを導出する。
5. コンフォーマンスビットストリームでは、1つのタイルが2つ以上のサブピクチャに含まれないことが要求される。
6. スライスAはタイルAの中にあるがタイルAより小さく、スライスBはタイルBの中にあるがタイルBより小さく、タイルAとタイルBが異なる場合、一つのサブピクチャはスライスAとスライスBで示される二つのスライスを含むことができないことがコンフォーマンスビットストリームで要求される。
7. ピクチャのタイルおよび/またはスライス分割情報を、関連するピクチャヘッダにおいて信号通知することを提案する。
a. 一例では、ピクチャのタイルおよび/またはスライス分割情報がPPSで信号通知されるか、関連するピクチャヘッダで信号通知されるかは、関連するPPSで信号通知される。
b. 一例では、ピクチャのタイルおよび/またはスライス分割情報が、関連するピクチャヘッダにあるかどうかが信号通知される。
i. 一例として、ピクチャのタイルおよび/またはスライス分割情報が、関連するPPSと関連するピクチャヘッダの両方で信号化されている場合、ピクチャヘッダで信号化されたピクチャのタイルおよび/またはスライス分割情報が使用されることになる。
ii. 一例として、ピクチャのタイルおよび/またはスライス分割情報が、関連するPPSと関連するピクチャヘッダの両方で信号通知される場合、PPSで信号通知されたピクチャのタイルおよび/またはスライス分割情報が使用される。
c. 一例として、ピクチャよりも高いレベル(SPSなど)のビデオユニットにおいて、ピクチャのタイルおよび/またはスライス分割情報が、関連するPPSにおいて信号通知されているか、または関連するピクチャヘッダにおいて信号通知されているかを示すために信号通知される。
8. 非矩形モードで関連ピクチャをスライス分割する場合、スライスレベルより上位のビデオユニット(例えば、PPSおよび/またはピクチャヘッダ内)でスライス分割情報を信号通知することを提案する。
a. 一例として、関連するピクチャが非矩形モードでスライス分割されている場合、スライス数を示す情報(例えばnum_slices_in_pic_minus1)が上位の映像ユニットで信号化されてもよい。
b. 一例として、関連するピクチャが非矩形モードを有するスライスで分割されるとき、上位ビデオユニットにおけるスライスの最初のブロック-ユニットのインデックス(またはアドレス、または位置、または座標)を示すための情報である。例えば、ブロック単位は、CTUやタイルであってもよい。
c. 一例として、関連するピクチャが非矩形モードでスライス分割されている場合に、上位のビデオユニットにおけるスライスのブロックユニットの数を示すための情報を提供する。例えば、ブロック単位は、CTUやタイルであってもよい。
d. 一例では、関連するピクチャが非矩形モードを有するスライスで分割されるとき、スライス分割情報(例えば、num_tiles_in_slice_minus1)は、スライスヘッダで信号化されない。
e. 一例として、関連するピクチャが非矩形モードでスライスに分割されている場合、スライスインデックスはスライスヘッダで信号通知される。
i. 一例として、slice_addressは、関連するピクチャが非矩形モードでスライスに分割される場合、ピクチャレベルのスライスインデックスとして解釈される。
f. 一例では、関連するピクチャが非矩形モードを有するスライスで分割されるとき、ピクチャ内の各スライスの分割情報(第1ブロック-ユニットのインデックスおよび/またはブロック-ユニットの数など)は、上位のビデオユニットで順番に信号化されてもよい。
i. 一例として、関連するピクチャが非矩形モードでスライスに分割されている場合、上位ビデオユニットの各スライスに対してスライスのインデックスが信号化されてもよい。
ii. 一例として、各スライスの分割情報は、スライスインデックスの昇順で信号通知される。
1) 一例として、各スライスの分割情報は、スライス0、スライス1、...、スライスK-1、スライスK、スライスK+1、...スライスS-2、スライスS-1の順で信号化し、Kはスライスインデックス、Sはピクチャのスライス枚数を表す。
iii. 一例として、各スライスの分割情報は、スライスインデックスの降順で信号通知される。
1) 一例として、各スライスの分割情報は、スライスS-2、スライスS-1、...、スライスK+1、スライスK、スライスK-1、...、スライス1、スライス0の順で信号化し、Kはスライスインデックス、Sはピクチャのスライス数を表す。
iv. 一例として、関連するピクチャが非矩形モードでスライスに分割されている場合、スライスに対する第1ブロック-ユニットのインデックスは、上位のビデオユニットで信号化されないことがある。
1) 例えば、スライス0(スライスインデックスが0であるスライス)の最初のブロックユニットのインデックスは0であると推論される。
2) 例えば、スライスK(スライスインデックスがKに等しいスライス、K>0)の最初のブロックユニットのインデックスは、
【数1】
と推論され、はスライスiのブロックユニットの数を表す。
v. 一例として、関連するピクチャが非矩形モードでスライスに分割されている場合、スライスに対する第1ブロック-ユニットのインデックスは、上位のビデオユニットで信号化されないことがある。
1) 例えば、スライス0(スライスインデックスが0であるスライス)の最初のブロックユニットのインデックスは0であると推論される。
2) 例えば、スライスK(スライスインデックスがKに等しいスライス、K>0)の最初のブロックユニットのインデックスは、
【数2】
と推論され、はスライスiのブロックユニットの数を表す。
vi. 一例として、非矩形モードで関連するピクチャをスライスで分割した場合、スライスのブロックユニットの数は上位のビデオユニットで信号化されない場合がある。
1) ピクチャ中にスライスが1つしかなく、ブロック単位がM個あるとき、スライス0のブロック単位の数はM個である。
2) 例えば、スライスK(スライスインデックスが0に等しいスライス)のブロックユニットの数は
【数3】
と推論され、はK<S-1(Sはピクチャのスライス数でS>1)のときのスライスKの最初のブロックユニットのインデックスを表す。
3) 例えば、スライスS-1のブロック単位の数はM-1と推論され、このとき、Sはピクチャのスライス数でS>1であり、Mはピクチャのブロック単位の数である。
vii. 一例として、関連するピクチャが非矩形モードのスライスで分割されている場合、1つ以上のスライスの分割情報は、上位のビデオユニットで信号化されない場合がある。
1) 一例として、上位映像装置で信号化しない1つ以上のスライスの分割情報を、他の信号化するスライスの分割情報から推論することができる。
2) 一例として、最後のCスライスの分割情報は信号化されないことがある。例えば、Cが1に等しい。
3) 例えば、スライスS-1のブロック単位数は信号化しない。ここで、Sはピクチャのスライス数で、S>1である。
a. 例えば、スライスS-1のブロックユニットの数は、ピクチャ中にM個のブロックユニットがあることから、
【数4】
と推論される。
9. 矩形分割を行うか、非矩形分割を行うかによって、ピクチャの最小スライス数が異なる可能性があることを提案する。
a. 一例として、非矩形分割モードが適用された場合、ピクチャは少なくとも2つのスライスに分割され、矩形分割モードが適用された場合、ピクチャは少なくとも1つのスライスに分割される。
i. 例えば、num_slices_in_pic_minus2+2は、非矩形分割モードを適用した場合に、ピクチャのスライス数を規定する信号となる場合がある。
b. 一例として、非矩形分割モードが適用された場合、ピクチャは少なくとも1つのスライスに分割され、矩形分割モードが適用された場合、ピクチャは少なくとも1つのスライスに分割される。
i. 例えば、矩形分割モードを適用した場合、ピクチャのスライス数を規定するnum_slices_in_pic_minus2+2が信号通知されることがある。
c. 一例として、矩形分割を適用するか、ピクチャがサブピクチャに分割されていないか、または、1つのサブピクチャにのみ分割されている場合に、非矩形分割を適用するかによって、ピクチャ内の最小スライス数は異なる場合がある。
10. PPSやピクチャヘッダなどの映像単位で分割情報を信号化する場合、左上の位置とスライスの幅・高さでスライスを表現することを提案する。
a. 一例として、スライスの左上のブロック単位(CTUやタイルなど)のインデックス/位置/座標、および/またはビデオ単位(CTUやタイルなど)で測定した幅、および/またはビデオ単位(CTUやタイルなど)で測定した高さが信号通知される。
b. 一例として、左上の位置と各スライスの幅・高さの情報を順番に信号化する。
i. 例えば、左上の位置や各スライスの幅/高さの情報は、0、1、2、...、S-1(Sはピクチャのスライス数)のようにスライスインデックスの昇順で信号通知される。
c. 一例として、スライスの幅からXを引いた値を信号化してもよい。例えば、Xは1に等しい。一例として、slice_width_minus1[i]に1を加えたものがi番目のスライスの幅を示し、slice_width_minus1[i]が信号通知される。なお、本開示において、“スライスの幅を信号化する”とは、“スライスの幅からXを引いた幅を信号化する”ことを意味する場合がある。
d. 一例として、スライスの高さからXを引いた値を信号化してもよい。例えば、Xは1に等しい。一例として、slice_height_minus1[i]に1を加えたものがi番目のスライスの高さを示し、slice_height_minus1[i]が信号通知される。なお、本開示において、“スライスの高さが信号通知される”とは、“スライスの高さからXを引いた値が信号通知される”ことを意味する場合がある。
e. 一例として、左上の位置とスライスの幅/高さによりスライスが信号通知されるかどうかは、スライスの信号通知の方法によって条件付けできる。
i. 一例として、ピクチャが矩形のスライスに分割されている場合のみ、スライスの左上位置と幅/高さでスライスを通知する。
f. 一例として、スライスの左上位置とスライスの幅/高さによりスライスが信号通知されるかどうかは、スライス分割とサブピクチャ分割間の関係によって条件付けできる。
i. 一例として、“each subpicture has only one slice”というステートメントが真でない場合のみ、スライスは左上の位置とスライスの幅/高さによって信号通知される。(例:single_slice_per_subpic_flagは0に等しい。)
g. 一例として、左上の位置とスライスの幅/高さによってスライスを知らせるかどうかは、ピクチャ内のスライスの数によって条件付けできる。
i. 一例として、ピクチャ内のスライス数が1より大きい場合(例えば、num_slices_in_pic_minus1>0)だけ、左上の位置とスライスの幅/高さによってスライスが通知される。
h. 一例として、i番目のスライスの左上位置および幅/高さがCTUサイズまたはタイル幅/高さの単位で表されるかどうかを示すために、一つの構文要素(例えば、slice_represented_in_ctb_flag[i]等のフラグ)が信号通知されてもよい。
i. あるいは、1つの構文要素(例えば、slice_represented_in_ctb_flagなどのフラグ)が、左上位置および全スライスの幅/高さがCTUサイズまたはタイル幅/高さの単位で表されるかを示すように信号通知されてもよい。
ii. または、左上位置と全スライスの幅/高さをCTUサイズ単位で表現する。
i. 左上位置のx座標/y座標(slice_top_left_x[i]、slice_top_left_y[i]と表記)とi番目のスライスの幅/高さ(slice_width_minus1[i]、slice_height_minus1[i]と表記)を信号通知するかどうかが条件付けられる。
i. 一例では、iの値、および/またはCTBサイズ(CtbSizeYと表記)、および/または現在のピクチャの幅/高さ(pic_width_in_luma_samplesおよびpic_height_in_luma_samplesと表記)、および/またはピクチャ内のスライス数(num_slices_in_pic_minus1と表記)に条件付けされてもよい。
ii. 条件付き信号通知の例を以下の構文表に示す。
【表25】
【表26】
j. 左上位置のx座標/y座標(slice_top_left_x[i]、slice_top_left_y[i]と表記)、i番目のスライスの幅/高さ(slice_width_minus1[i]、slice_height_minus1[i])の少なくとも一方が信号通知されていない場合、デフォルト値と推論してよい。
i. 一例として、デフォルト値はゼロであってもよい。
ii. 一例として、デフォルト値は、slice_represented_in_ctb_flag[i]に依存してもよい。
iii. 例えば、存在しない場合、slice_top_left_x[i]の値は0に等しいと推測される。
iv. 例えば、存在しない場合、slice_top_left_y[i]の値は0に等しいと推測される。
v. 例えば、存在しない場合、slice_width_minus1[i]の値は(slice_represented_in_ctb_flag[i]?((pic_width_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY):NumTileColumns)-slice_top_left_x[i]-1に等しいと推測される。
vi. 例えば、存在しない場合、slice_height_minus1[i]の値はslice_represented_in_ctb_flag[i]?((pic_height_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY):NumTileRows) -slice_top_left_y[i]-1に等しいと推測される。
11. サブピクチャ内のスライスの分割情報(位置/幅/高さなど)をSPS/PPS/ピクチャヘッダなどのビデオユニットで信号通知することを提案する。
a. 一例として、各サブピクチャのスライス分割情報を順番に信号通知する。
i. 例えば、各サブピクチャのスライス分割情報は、サブピクチャのインデックスの昇順で信号通知される。
b. 一例として、サブピクチャ内の各スライスの分割情報(位置/幅/高さなど)が順番に信号通知される。
i. 一例として、サブピクチャ内の各スライスの分割情報(位置/幅/高さなど)は、サブピクチャレベルのスライスインデックスで昇順に信号通知される。
12. i番目の矩形スライスの第1タイルのタイルインデックスと(i+1)番目の矩形スライスの第1タイルのタイルインデックスとの差(tile_idx_delta[i]とする)を信号通知せず、導出することを提案する。
a. 一例として、0番目の矩形スライスからi番目の矩形スライスまでの矩形スライスに基づいて、(i+1)番目の矩形スライスにおける最初のタイルのタイルインデックスを導出する。
b. 一例として、(i+1)番目の矩形スライスにおける最初のタイルのタイルインデックスは、0番目の矩形スライスからi番目の矩形スライスまで、矩形スライス内にないタイルの最小インデックスであると導出される。
13. タイルの列数/行数(例えばNumTileColumnsまたはNumTileRows)を導出するための情報の信号通知は、ピクチャの幅とCTUのサイズとの関係に基づき条件付けることを提案する。
a. 例えば、ピクチャの幅がCTUのサイズまたは幅より小さいか等しい場合、num_exp_tile_columns_minus1および/またはtile_column_width_minus1が信号通知されない場合がある。
b. 例えば、ピクチャの高さがCTUのサイズまたは高さより小さいかまたは等しい場合、num_exp_tile_rows_minus1および/またはtile_row_height_minus1が信号通知されないことがある。
14. slice_subpic_idが存在する場合、SubpicIdVal[CurrSubpicIdx]がslice_subpic_idと等しいことを満たすCurrSubpicIdxは1つだけでなければならない。
15. rect_slice_flagが0、またはsubpic_info_present_flagが0の場合、slice_address+iの値は、iが0からnum_tiles_in_slice_minus1の範囲(両端含む)において、slice_address+jの値に一致しないものとし、ここで、jは、同じコーディングされたピクチャの他のコーディングされたスライスNAL単位の0からnum_tiles_in_slice_minus1の範囲(両端含む)で、iはその範囲にある。
16. ピクチャ内に均一間隔のタイルと非均一間隔のタイルが存在する場合、PPS(またはSPS)において、タイルレイアウトのタイプを規定する構文要素を信号通知することができる。
a. 一例として、PPSで信号化される構文フラグがあり、タイルレイアウトが非均一間隔の後に均一間隔が続くか、均一間隔の後に非均一間隔が続くかを指定することができる。
b. 例えば、不均一な間隔のタイルがあるときはいつでも、明確に提供されるタイル列/行の数(例えば、num_exp_tile_columns_minus1、num_exp_tile_rows_minus1)は不均一タイルの総数と同程度であり得る。
c. 例えば、均一な間隔のタイルがあるときはいつでも、明確に提供されるタイル列/行の数(例えば、num_exp_tile_columns_minus1、num_exp_tile_rows_minus1)は均一タイルの総数よりも少ないか、等しくなり得る。
d. タイルのレイアウトが、均一な間隔の後に不均一な間隔が続くような場合(つまり、均一な間隔のタイルで始まり、複数の不均一な間隔のタイルで終わるようなピクチャの場合)。
i. 一例では、ピクチャの後者に位置する非均一間隔タイルのタイル列の幅は、まず逆順に割り当てられ(すなわち、タイルインデックスの順序がNumTileColumns、NumTileColumns-1、NumTileColumns-2、...に等しい)、次にピクチャの前者に位置する均一間隔タイルのタイル列の幅は逆順に暗に導き出されてもよい(すなわち、タイルインデックスの順序がNumTileColumns-T,NumTileColumns-T-1,...,2,1,0に等しく、ここでTは不均一なタイル列の数を示す)。
ii. タイル列の高さは、前述したタイル列の幅と同様にして求めることができる。
17. 二つの矩形スライス(一方がi番目のスライス)の代表的なタイルインデックスの差を規定する構文要素(例えばtile_idx_delta[i])は、条件が真である場合にのみ使用することが可能である。
a. 一例として、条件は(i<num_slices_in_pic_minus1)であり、num_slices_in_pic_minus1+1がピクチャのスライス枚数を表す。
b. 一例として、条件は(i!=num_slices_in_pic_minus1)であり、num_slices_in_pic_minus1+1がピクチャ中のスライス数を表している。
18. マージ推定領域(MER)サイズ(例えばlog2_parallel_merge_level_minus2で信号通知される)を信号通知するか、および/または解釈するか、または制限するかは、最小許容コーディングブロックサイズ(例えばlog2_min_luma_coding_block_size_minus2および/またはMinCbSizeYとして信号通知/表示される)によっても決まりうる。
a. 一例として、MERのサイズは、最小許容コーディングブロックサイズより小さくできないことが要求される。
i. 例えば、log2_parallel_merge_level_minus2はlog2_min_luma_coding_block_size_minus2と同等かそれ以上であることが必要である。
ii. 例えば、log2_parallel_merge_level_minus2はlog2_min_luma_coding_block_size_minus2からCtbLog2SizeY-2の範囲であることが必要である。
b. 一例として、Log2(MERsize)とLog2(MinCbSizeY)の差を信号通知とし、これをlog2_parallel_merge_level_minus_log2_mincbと表現する。
i. 例えば、log2_parallel_merge_level_minus_log2_mincbは単項のコード(ue)でコーディングされる。
ii. 例えば、log2_parallel_merge_level_minus_log2_mincbは、0からCtbLog2SizeY-log2_min_luma_coding_block_size_minus2-2の範囲であることが必要である。
iii. 例えば、Log2ParMrgLevel=log2_parallel_merge_level_minus_log2_mincb+log2_min_luma_coding_block_size_minus2+2、ここでLog2ParMrgLevelはMERサイズの制御に使用される。
19. num_exp_slices_in_tile[i]が0に等しい場合、i番目のスライスのCTU列単位でのスライス高、例えば、sliceHeightInCtus[i]と表記することが提案される。
a. 一例では、sliceHeightInCtus[i]は、num_exp_slices_in_tile[i]が0に等しいとき、RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]に等しいように導出される。
20. ピクチャのi番目のスライスを含むタイルの(num_exp_slices_in_tile[i]-1)番目のスライスは常に存在し、高さは常にexp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]+1 CTU rowsとすることが提案される。
a. あるいは、ピクチャのi番目のスライスを含むタイルの(num_exp_slices_in_tile[i]-1)番目のスライスは存在してもしなくてもよく、高さはexp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]+1 CTU rows以下である。
21. 矩形スライスの情報導出の際、num_slices_in_pic_minus1より小さいピクチャレベルのスライスインデックスを持つスライスに対してのみ変数tileIdxを更新する、すなわちPPSを参照する各ピクチャの最後のスライスに対しては更新しないことが提案される。
22. PPSを参照するピクチャでは、num_exp_tile_columns_minus1番目のタイル列が常に存在し、幅は常にtile_column_width_minus1[num_exp_tile_columns_minus1]+1CTBsであることが提案される。
23. PPSを参照するピクチャでは、num_exp_tile_rows_minus1番目のタイル行が常に存在し、高さは常にtile_column_height_minus1[num_exp_tile_rows_minus1]+1CTBsであること提案される。
24. 最大ピクチャ幅と最大ピクチャ高さがともにCtbSizeYよりも大きくない場合、sps_num_subpics_minus1の構文要素の信号通知をスキップすることが提案される。
a. あるいは、追加的に、上記条件が成立する場合、sps_num_subpics_minus1の値は0に等しいと推論される。
25. ピクチャ幅がCtbSizeYよりも大きくない場合、構文要素num_exp_tile_columns_minus1の信号通知が省略されても良いことが提案される。
b. あるいは、追加的に、num_exp_tile_columns_minus1の値は、上記条件が真のとき、0に等しいと推論される。
26. ピクチャの高さがCtbSizeYよりも大きくない場合、構文要素num_exp_tile_rows_minus1の信号通知が省略されても良いことが提案される。
c. あるいは、追加的に、num_exp_tile_row_minus1の値は、上記条件が真のとき、0に等しいと推論される。
27. num_exp_tile_columns_minus1がPicWidthInCtbsY-1に等しい場合、0からnum_exp_tile_columns_minus1の範囲(両端含む)のiに対する構文要素tile_column_width_minus1[i]の信号通知は省略されても良いことが提案される。
d. あるいは、追加的に、tile_column_width_minus1[i]の値は0に等しいと推論される。
28. num_exp_tile_rows_minus1がPicHeightInCtbsY-1に等しい場合、0からnum_exp_tile_rows_minus1の範囲(両端含む)のiに対する構文要素tile_row_height_minus1[i]の信号通知は省略してもよいことが提案される。
e. あるいは、追加的に、tile_row_height_minus1[i]の値は0に等しいと推論される。
29. タイルを分割する一様なスライスの高さは、そのタイルのスライスの高さを示すexp_slice_height_in_ctus_minus1[]の最後のエントリで示されることが提案される。不均一なスライスとは、明確に信号通知されるスライスより下のスライスを指す。例:uniformSliceHeight=exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1].+1
30. ‘num_exp_tile_columns_minus1’番目のタイル列の幅のリセットを禁止すること、すなわち、ビットストリームから解析された値(例えば、tile_column_width_minus1[num_exp_tile_columns_minus1]で示される)を他の情報を参照せずに直接使用して幅を導出してもよいことが提案される。
a. 一例として、‘num_exp_tile_columns_minus1’-番目のタイルカラムの幅は、tile_column_width_minus1[num_exp_tile_columns_minus1]に1を加えたものに直接設定される。あるいは、さらに、tile_column_width_minus1[num_exp_tile_columns_minus1]を使用して、num_exp_tile_columns_minus1より大きいインデックスのタイル列の幅を、例えば、6.5.1項で規定されるように導出する。
b. 同様に、「num_exp_tile_columns_minus1」番目のタイル行の高さについては、リセットが禁止されている、つまり、ビットストリームからの解析値(例えば、tile_row_height_minus1[num_exp_tile_columns_minus1]で示される)が他の情報を参照せずに直接高さを導くために使用されてもよい。
i. 一例として、‘num_exp_tile_columns_minus1’番目のタイル行の高さは、直接tile_row_height_minus1[num_exp_tile_columns_minus1]に1を加えたものに設定される。あるいは、さらに、tile_row_height_minus1[num_exp_tile_columns_minus1]を用いて、num_exp_tile_columns_minus1より大きいインデックスを持つタイル行の高さを導き出す、例えば、6.5.1項で規定されるようにタイル行の高さを導出する。
31. タイル内の(num_exp_slices_in_tile[i]-1)番目のスライスの高さのリセットを禁止し、すなわち、ビットストリームからの解析値(例えば、exp_slice_height_inctus_minus1[i][num_exp_slices_in_tile[i]-1]で示される)を直接用いて他の情報を参照せずに高さを導出してもよいと提案される。
a. 一例では、タイル内の(num_exp_slices_in_tile[i]-1)番目のスライスの高さは、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]+1に直接設定される。あるいは、さらに、num_exp_slices_in_tile[i]-1より大きいインデックスを有するスライスの高さを導出するために、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]が使用されてもよい。
32. (num_exp_slices_in_tile[i]-1)番目のスライスの高さを規定するのではなく、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]を用いて均一なスライス高を導き出すことが提案される。
a. あるいは、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]は、均一スライス高さを導き出すために用いられ、(num_exp_slices_in_tile[i]-1)番目のスライス高さも規定する。
b. あるいは、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]を使用して、均一なスライス高さを導出する。場合によっては、このモジュールは、(num_exp_slices_in_tile[i]-1)番目のスライスの高さを規定することができるが、場合によっては、(num_exp_slices_in_tile[i]-1)番目のスライスの高さを規定しなくてもよい。
33. firstRemainingWidthInCtbsYがuffirstTileColWidth以上であることが提案され、ここで、変数firstRemainingWidthInCtbsYおよびuffirstileColWidthは、以下のように計算される。
remainingWidthInCtbsY=PicWidthInCtbsY
for(i=0;i<num_exp_tile_columns_minus1;i++){
colWidth[i]=tile_column_width_minus1[i]+1
remainingWidthInCtbsY-=colWidth[i]
}
firstRemainingWidthInCtbsY=remainingWidthInCtbsY
uniformTileColWidth=tile_column_width_minus1[num_exp_tile_columns_minus1]+1
34. firstRemainingHeightInCtbsYがuffirstTileRowHeight以上であることを提案し、ここで、変数firstRemainingHeightInCtbsYおよびuffirstTileRowHeightは、以下のように計算される。
remainingHeightInCtbsY=PicHeightInCtbsY
for(j=0;j<num_exp_tile_rows_minus1;j++){
RowHeight[j]=tile_row_height_minus1[j]+1
remainingHeightInCtbsY-=RowHeight[j]
}
firstRemainingHeightInCtbsY=remainingHeightInCtbsY
uniformTileRowHeight=tile_row_height_minus1[num_exp_tile_rows_minus1]+1
35. firstRemainingHeightInCtbsYがuffirstSliceHeight以上であることが提案され、ここで、変数firstRemainingHeightInCtbsYおよびuffirstSliceHeightは、以下のように計算される。
if(slicWidthInTiles[i]==1&&sliceHeightInTiles[i]==1){
if(num_exp_slices_in_tile[i]==0){
NumSlicesInTile[i]=1
sliceHeightInCtus[i]=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
} else{
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
for(j=0;j<num_exp_slices_in_tile[i]-1;j++){
sliceHeightInCtus[i+j]=exp_slice_height_in_ctus_minus1[i][j]+1
remainingHeightInCtbsY-=sliceHeightInCtus[i+j]
}
firstRemainingHeightInCtbsY=remainingHeightInCtbsY
uniformSliceHeight=exp_slice_height_in_ctus_minus1[i][j]+1
36. サブブロックベースのマージ候補リストにおけるアフィンマージ候補の最大数を示す構文要素(例えば、SE_xと表記される)が提案される。
a. 1つの例において、SE_xの信号通知は、アフィン予測が有効化されているかどうかに基づき条件付けられている。例えば、SE_xは、アフィン予測が有効化されている場合にのみ信号通知される。
b. 一例において、SE_xが存在しない場合、SE_xはデフォルト値に等しく設定される。例えば、SE_xは、サブブロックベースのマージ候補リストに含まれるアフィンマージ候補の最大数が0となるように、デフォルト値と等しく設定される。
c. 一例では、サブブロックベースのマージ候補リストに含まれることが許されるアフィンマージ候補の最大数は、X-SE_xに等しく設定され、ここでXは5などの整数である。
d. 一例として、SE_xはXよりも大きいことは許されず、Xは5などの整数とする。
e. 一例において、SE_xは、0からX等の範囲(両端含む)にあるべきであり、ここで、Xは、5などの整数である。
f. 1つの例において、SE_xに基づいて、サブブロックベースのマージ候補リスト(MaxNumSubblockMergeCandと表される)における許容されるマージ候補の最大数を導出することができる。
i. 一例として、MaxNumSubblockMergeCandは、SE_xと、許可されたsbTMVPマージ候補の最大数に基づいて導出されてもよい。
ii. 一例として、MaxNumSubblockMergeCandは、0~Xのような範囲(両端含む)に含まれることが好ましく、Xは5などの整数である。
1) 一例として、MaxNumSubblockMergeCandは範囲にクリップされる。
iii. 一例として、MaxNumSubblockMergeCandは、Xより大きいことは許されず、ここでXは5などの整数である。
1) 一例として、MaxNumSubblockMergeCandはXより大きくならないようにクリッピングされている。
iv. 一例として、MaxNumSubblockMergeCandは、MaxNumSubblockMergeCand=Min(5,(sps_sbtmvp_enabled_flag&&ph_temporal_mvp_enable_flag)+5-five_minus_max_num_affine_merge_cand)として導出され、ここで5_minus_max_num_affine_merge_candは構文要素SE_xである。
【0062】
6. 実施形態
以下の実施形態において、追加された部分には太字、下線、イタリック体の文字を付している。削除された部分は[[]]内にマークされる。
6.1. 実施形態1:サブピクチャレベルのスライスインデックスの変更例
3 定義
ピクチャレベルスライスインデックス:rect_slice_flagが1に等しい場合、PPSで信号通知される順番で、ピクチャにおけるスライスのリストに対するスライスのインデックスを示す。
[[サブピクチャレベルスライスインデックス:rect_slice_flagが1に等しい場合、PPSで信号通知される順番にサブピクチャにおけるスライスのリストへのスライスのインデックスを示す。]]
【化1】
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
…
【化2】
for(j=0;j<=sps_num_subpics_minus1;j++)
NumSlicesInSubpic[j]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
posX=CtbAddrInSlice[i][0]%PicWidthInCtbsY
posY=CtbAddrInSlice[i][0]/PicWidthInCtbsY
for(j=0;j<=sps_num_subpics_minus1;j++){
if((posX>=subpic_ctu_top_left_x[j])&& (32)
(posX<subpic_ctu_top_left_x[j]+subpic_width_minus1[j]+1)&&
(posY>=subpic_ctu_top_left_y[j])&&
(posY<subpic_ctu_top_left_y[j]+subpic_height_minus1[j]+1)){
【化3】
NumSlicesInSubpic[j]++
}
}
}
…
7.4.8.1 一般スライスヘッダ意味論
...
slice_addressは、スライスのスライスアドレスを規定する。存在しない場合、slice_addressの値は0に等しいと推測される。rect_slice_flagが1でNumSlicesInSubpic[CurrSubpicIdx]が1のとき、slice_addressの値は0と推測される.
rect_slice_flagが0に等しい場合、以下が適用される。
- スライスアドレスは、ラスタスキャンタイルインデックスである。
- slice_addressの長さは、Ceil(Log2(NumTilesInPic))ビットである。
- slice_addressの値は、0からNumTilesInPic-1までの範囲内にあるべきである。
そうでない場合(rect_slice_flagが1に等しい場合)、以下が適用される。
【化4】
- slice_addressの長さは、Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))ビットである。
- slice_addressの値は、0~NumSlicesInSubpic[CurrSubpicIdx]-1までの範囲内とする。
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- rect_slice_flagが0に等しい、又はsubpic_info_present_flagが0に等しい場合、slice_addressの値は、同じコーディングされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのslice_addressの値に等しくてはならない。
- そうでない場合、slice_subpic_id及びslice_address値の組は、同じコーディングされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのslice_subpic_id及びslice_address値の組に等しくてはならない。
- ピクチャのスライスの形状は、各CTUが復号された場合、その左側境界全体及び最上の境界全体が1つのピクチャの境界、又は、以前に復号されたCTUの境界を含むものでなければならない。
...
num_tiles_in_slice_minus1 plus1は、存在する場合、スライス内のタイル数を規定する。num_tiles_in_slice_minus1の値は、0からNumTilesInPic-1までの範囲内にあるべきである。
現在のスライス内のCTUの数を規定する変数NumCtusInCurrSliceと、0からNumCtusInCurrSlice-1の範囲(両端含む)のiについて、スライス内のi番目のCTBのピクチャラスタスキャンアドレスを規定するリストCtbAddrInCurrSlice[i]は、次のように導出される。
if(rect_slice_flag){
【化5】
[[for(j=0;j<CurrSubpicIdx;j++)
picLevelSliceIdx+=NumSlicesInSubpic[j]}]
NumCtusInCurrSlice=NumCtusInSlice[picLevelSliceIdx]
for(i=0;i<NumCtusInCurrSlice;i++)
CtbAddrInCurrSlice[i]=CtbAddrInSlice[picLevelSliceIdx][i] (117)
} else{
NumCtusInCurrSlice=0
for(tileIdx=slice_address;tileIdx<=slice_address+num_tiles_in_slice_minus1;tileIdx++){
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
for(ctbY=tileRowBd[tileY];ctbY<tileRowBd[tileY+1];ctbY++){
for(ctbX=tileColBd[tileX];ctbX<tileColBd[tileX+1];ctbX++){
CtbAddrInCurrSlice[NumCtusInCurrSlice]=ctbY*PicWidthInCtb+ctbX
NumCtusInCurrSlice++
}
}
}
}
…
6.2. 実施形態2:非矩形モードのためのPPSにおける信号通知スライス
7.3.2.4 ピクチャパラメータセットRBSP構文
【表27】
【表28】
【表29】
7.3.7.1 一般スライスセグメントヘッダ構文
【表30】
7.4.3.4 ピクチャパラメータセットRBSP意味論
num_slices_in_pic_minus1+1は、PPSを参照する各ピクチャの[[[矩形]]]スライスの数を規定する。num_slices_in_pic_minus1の値は、0からMaxSlicesPerPicture-1の範囲(両端含む)とし、MaxSlicesPerPictureは附属書Aで規定されるものとする。no_pic_partition_flagが1の場合、num_slices_in_pic_minus1の値は0に等し
【化6】
…
7.4.8.1 一般スライスヘッダ意味論
…
slice_addressは、スライスのスライスアドレスを規定する。存在しない場合、slice_addressの値は0に等しいと推測される。rect_slice_flagが1でNumSlicesInSubpic[CurrSubpicIdx]が1のとき、slice_addressの値は0と推測される.rect_slice_flagが0であり、NumSlicesInPicが1である場合、slice_addressの値は0であると推測される
rect_slice_flagが0に等しい場合、以下が適用される。
【化7】
そうでない場合(rect_slice_flagが1に等しい場合)、以下が適用される。
- スライスアドレスは、スライスのサブピクチャレベルスライスインデックスである。
- slice_addressの長さは、Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))ビットである。
- slice_addressの値は、0~NumSlicesInSubpic[CurrSubpicIdx]-1までの範囲内とする。
ビットストリーム適合性の要件は、以下の制約が適用されることである。
-[[rect_slice_flagが0に等しい、又はsubpic_info_present_flagが0に等しい場合、slice_addressの値は、同じコーディングされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのslice_addressの値に等しくてはならない。
【化8】
- ピクチャのスライスの形状は、各CTUが復号された場合、その左側境界全体及び最上の境界全体が1つのピクチャの境界、又は、以前に復号されたCTUの境界を含むものでなければならない。
…
現在のスライス内のCTUの数を規定する変数NumCtusInCurrSliceと、0からNumCtusInCurrSlice-1の範囲(両端含む)のiについて、スライス内のi番目のCTBのピクチャラスタスキャンアドレスを規定するリストCtbAddrInCurrSlice[i]は、次のように導出される。
if(rect_slice_flag){
picLevelSliceIdx=slice_address
for(j=0;j<CurrSubpicIdx;j++)
picLevelSliceIdx+=NumSlicesInSubpic[j]
NumCtusInCurrSlice=NumCtusInSlice[picLevelSliceIdx]
for(i=0;i<NumCtusInCurrSlice;i++)
CtbAddrInCurrSlice[i]=CtbAddrInSlice[picLevelSliceIdx][i] (117)
}else{
NumCtusInCurrSlice=0
【化9】
slice_minus1]];tileIdx++){
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
for(ctbY=tileRowBd[tileY];ctbY<tileRowBd[tileY+1];ctbY++){
for(ctbX=tileColBd[tileX];ctbX<tileColBd[tileX+1];ctbX++){
CtbAddrInCurrSlice[NumCtusInCurrSlice]=ctbY*PicWidthInCtb+ctbX
NumCtusInCurrSlice++
}
}
}
}
6.3. 実施形態3:ピクチャ寸法に調整された信号タイル
7.3.2.4 ピクチャパラメータセットRBSP構文
【表31】
【表32】
6.4. 実施形態4:tile_column_width_minus1およびtile_row_height_minus1における意味論の例1
7.4.3.4 ピクチャパラメータセットRBSP意味論
…
【化10】
columns_minus1-1の範囲(両端含む)のiについて、i番目のタイル列幅をCTB単位で規定する。tile_column_width_minus1[num_exp_tile_columns_minus1]は、6.5.1項で規定されるように、num_exp_tile_columns_minus1以上のインデックスを持つタイル列の幅を導き出すために使用される。tile_column_width_minus1[i]の値は、0からPicWidthInCtbsY-1の範囲(両端含む)とする。存在しない場合、tile_column_width_minus1[0]の値は、PicWidthInCtbsY-1に等しいと推測される。
【化11】
囲(両端含む)にあるものとする。存在しない場合、tile_row_height_minus1[0]の値はPicHeightInCtbsY-1に等しいと推測される。
…
6.5. 実施形態5:tile_column_width_minus1およびtile_row_height_minus1における意味論の例2
7.4.3.4 ピクチャパラメータセットRBSP意味論
…
【化12】
tile_column_width_minus1[num_exp_tile_columns_minus1]は6.5.1項に規定されるように、num_exp_tile_columns_minus1以上のインデックスを持つタイル列の幅を導くために使用される。
tile_column_width_minus1[i]の値は、0からPicWidthInCtbsY-1の範囲(両端含む)とする。存在しない場合、tile_column_width_minus1[0]の値は、PicWidthInCtbsY-1に等しいと推測される。
【化13】
tile_row_height_minus1[num_exp_tile_rows_minus1]は6.5.1項に規定されるように、num_exp_tile_rows_minus1以上のインデックスを持つタイル行の高さを導出するために使用される。tile_row_height_minus1[i]の値は、0からPicHeightInCtbsY-1の範囲(両端含む)にあるものとする。存在しない場合、tile_row_height_minus1[0]の値はPicHeightInCtbsY-1に等しいと推測される。
…
6.6. 実施形態6:スライスにおけるCTUの導出例
6.5 スキャン処理
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
…
矩形スライスの場合、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストNumCtusInSlice[i]は、i番目のスライスにおけるCTUの数を規定し、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストSliceTopLeftTileIdx[i]は、スライスの左上のタイルのインデックスを規定し、jは0からNumCtusInSlice[i]-1の範囲(両端含む)で、i番目のスライス内のj番目のCTBのピクチャラスタスキャンアドレスを規定し、以下のように導出される。
if(single_slice_per_subpic_flag){
for(i=0;i<=sps_num_subpics_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<PicSizeInCtbsY;i++){
sliceIdx=subpic_info_present_flag?CtbToSubpicIdx[i]:0
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=i
NumCtusInSlice[sliceIdx]++
}
} else{
tileIdx=0
for(i=0;i<=num_slices_in_pic_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
SliceTopLeftTileIdx[i]=tileIdx
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
if(i==num_slices_in_pic_minus1){
slice_width_in_tiles_minus1[i]=NumTileColumns-1-tileX
slice_height_in_tiles_minus1[i]=NumTileRows-1-tileY
}
if(slice_width_in_tiles_minus1[i]==0&&slice_height_in_tiles_minus1[i]==0){ (29)
ctbY=tileRowBd[tileY]
for(j=0;j<NumSlicesInTile[i]-1;j++){
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],
ctbY,ctbY+SliceHeightInCtusMinus1[i]+1)
ctbY+=SliceHeightInCtusMinus1[i]+1
i++
}
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],ctbY,tileRowBd[tileY+1])
} else
for(j=0;j<=slice_height_in_tiles_minus1[i];j++)
for(k=0;k<=slice_width_in_tiles_minus1[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],
tileRowBd[tileY+j],tileRowBd[tileY+j+1])
【化14】
}
}
6.7. 実施形態7:MERサイズの信号通知について
7.3.2.3 シーケンスパラメータセットRBSP構文
【表33】
7.4.3.3 シーケンスパラメータセットRBSP意味論
log2_parallel_merge_level_minu_log2_mincb_coding_block_size_minus2+2は、変数Log2ParMrgLevelの値を規定し、これは8.5.2.3に規定される空間マージ候補の派生処理と、8.5.5.2に規定されるサブブロックマージモードにおける動きベクトルおよび参照インデックスの派生処理とにおいて、8.5.2.1項の履歴に基づく動きベクトル予測子リストの更新処理の呼び出しを制御するために使用する。log2_parallel_merge_level_minus_log2_mincbの値は、0からCtbLog2SizeY-log2_min_luma_coding_block_size_minus2-2の範囲(両端含む)とする。変数Log2ParMrgLevelは、以下のように導出される。
Log2ParMrgLevel=log2_parallel_merge_level_minus2+log2_min_luma_coding_block_size_minus2+2 (68)
6.8. 実施形態8:矩形スライスの信号通知について
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
...
ピクチャラスタスキャンにおけるCTBアドレスからサブピクチャインデックスへの変換を規定する、0からPicSizeInCtbsY-1の範囲(両端含む)のctbAddrRのためのリストctbTobSubpicIdx[ctbAddrRs]は、以下のように導出される。
for(ctbAddrRs=0;ctbAddrRs<PicSizeInCtbsY;ctbAddrRs++){
posX=ctbAddrRs%PicWidthInCtbsY
posY=ctbAddrRs/PicWidthInCtbsY
ctbToSubpicIdx[ctbAddrRs]=-1
for(i=0;ctbToSubpicIdx[ctbAddrRs]<0&&i<=sps_num_subpics_minus1;i++){ (29)
if((posX>=subpic_ctu_top_left_x[i])&&
(posX<subpic_ctu_top_left_x[i]+subpic_width_minus1[i]+1)&&
(posY>=subpic_ctu_top_left_y[i])&&
(posY<subpic_ctu_top_left_y[i]+subpic_height_minus1[i]+1))
ctbToSubpicIdx[ctbAddrRs]=i
}
}
rect_slice_flagが1に等しい場合、i番目のスライスにおけるCTUの数を示すリストNumCtusInSlice[i](iは0からnum_slices_in_pic_minus1の範囲、両端含む)、スライスにおける最初のCTUを含むタイルのタイルインデックスを指定する、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストSliceTopLeftTileIdx[i]、i番目のスライス内のj番目のCTBのピクチャラスタスキャンアドレスを規定する、iは0からnum_slices_in_pic_minus1の範囲(両端含む)、jは0からNumCtusInSlice[i]-1の範囲
【化15】
if(single_slice_per_subpic_flag){
for(i=0;i<=sps_num_subpics_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<PicSizeInCtbsY;i++){
sliceIdx=ctbToSubpicIdx[i]
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=i
NumCtusInSlice[sliceIdx]++
}
}else{
tileIdx=0
for(i=0;i<=num_slices_in_pic_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
SliceTopLeftTileIdx[i]=tileIdx
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
【化16】
}
else{
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
【化17】
j++
}
NumSlicesInTile[i]=j
}
ctbY=tileRowBd[tileY]
for(j=0;j<NumSlicesInTile[i]-1;j++){
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],
ctbY,ctbY+sliceHeightInCtus[i])
ctbY+=sliceHeightInCtus[i]
i++
}
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],ctbY,tileRowBd[tileY+1])
} else
for(j=0;j<sliceHeightInTiles[i];j++)
for(k=0;k<sliceWidthInTiles[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],
tileRowBd[tileY+j],tileRowBd[tileY+j+1])
【化18】
}
}
iが0からnum_slices_in_pic_minus1の範囲(両端含む)にある場合、NumCtusInSlice[i]の値は、0よりも大きいことが、ビットストリーム準拠の要件である。また、iが0からnum_slices_in_pic_minus1の範囲(両端含む)であり、jが0からNumCtusInSlice[i]-1の範囲(両端含む)である行列CtbAddrInSlice[i][j]は、0からPicSizeInCtbsY-1の範囲(両端含む)のすべてのCTBアドレスをそれぞれ一度のみ含まれることが、ビットストリーム準拠の要件である。
...
7.3.2.4 ピクチャパラメータセットRBSP構文
【表34】
7.4.3.4 ピクチャパラメータセット意味論
...
tile_idx_delta_present_flag=0は、tile_idx_delta[i]構文要素がPPSに含まれていないことを規定し、PPSを参照するすべてのピクチャは、スライスラスタ順に矩形スライス行と矩形スライス列に分割される。tile_idx_delta_present_flag equal to 1は、PPSにtile_idx_delta[i]構文要素が存在してもよく、PPSを参照するピクチャのすべての矩形スライスは、iの値の増加によりtile_idx_delta[i]が示す順序で規定されることを規定する。存在しない場合、tile_idx_delta_present_flagの値は0と推測される。
slice_width_in_tiles_minus1[i]plus1は、i番目の矩形スライスの幅をタイルの列の単位で規定する。slice_width_in_tiles_minus1[i]の値は0からNumTileColumns-1の範囲(両端含む)とする。
iがnum_slices_in_pic_minus1未満であり、且つNumTileColumnsが1に等しい場合、slice_width_in_tiles_minus1[i]の値は0に等しいと推測される。
slice_height_in_tiles_minus1[i]plus1は、num_exp_slices_in_tile[i]が0に等しい場合、i番目の矩形スライスの高さをタイル行単位で規定する。slice_height_in_tiles_minus1[i]の値は、0からNumTileRows-1の範囲(両端含む)とする。
iがnum_slices_in_pic_minus1未満であり、かつslice_height_in_tiles_minus1[i]が存在しない場合、NumTileRows==1?0:slice_height_in_tiles_minus1[i-1]と等しいと推測される。
num_exp_slices_in_tile[i]は、i番目のスライスを含むタイルにおけるスライスのために明確に提供されるスライスの高さの数を規定する(すなわち、タイルインデックスがSliceTopLeftTileIdx[i]に等しいタイル)。num_exp_slices_in_tile[i]の値は、0からRowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]-1の範囲(両端含む)とする。存在しない場合、num_exp_slices_in_tile[i]の値は0に等しいと推測される。
【化19】
合、tile_idx_delta[i]の値は0に等しいと推測される。存在する場合、tile_idx_delta[i]の値は0に等しいと推測される。
...
6.9. 実施形態9:矩形スライスの信号通知について
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
...
rect_slice_flagが1に等しい場合、i番目のスライス中のCTUの数を規定する、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリストNumCtusInSlice[i]、スライス中の最初のCTUを含むタイルのインデックスを規定する、iが0からnum_slices_in_pic_minus1の範囲(両端含む)のリスト、SliceTopLeftTileIdx[i]、およびi番目のスライス内のj番目のCTBのピクチャラスタスキャンアドレスを規定する、iが0からnum_slices_in_pic_minus1の範囲(両端含む)、jが0からNumCtusInSlice[i]-1の範囲(両端含む)行列CtbAddrInSlice[i][j]、i番目のスライスを含むタイル(すなわち、タイルインデックスがSliceTopLeftTileIdx[i]に等しいインデックスを有するタイル)中のスライス数を規定する変数NumSlicesInTile[i]は、次のように導出される。
if(single_slice_per_subpic_flag){
for(i=0;i<=sps_num_subpics_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<PicSizeInCtbsY;i++){
sliceIdx=ctbToSubpicIdx[i]
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=i
NumCtusInSlice[sliceIdx]++
}
} else{
tileIdx=0
for(i=0;i<=num_slices_in_pic_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
SliceTopLeftTileIdx[i]=tileIdx
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
if(i<num_slices_in_pic_minus1){
sliceWidthInTiles[i]=slice_width_in_tiles_minus1[i]+1
sliceHeightInTiles[i]=slice_height_in_tiles_minus1[i]+1
}else{
sliceWidthInTiles[i]=NumTileColumns-tileX
sliceHeightInTiles[i]=NumTileRows-tileY
NumSlicesInTile[i]=1
}
if(sliceWidthInTiles[i]==1&&sliceHeightInTiles[i]==1){ (30)
if(num_exp_slices_in_tile[i]==0){
NumSlicesInTile[i]=1
sliceHeightInCtus[i]=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
}
else{
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
[[for(j=0;j<num_exp_slices_in_tile[i];j++){}]
【化20】
while(remainingHeightInCtbsY>=uniformSliceHeight){
sliceHeightInCtus[i+j]=uniformSliceHeight
remainingHeightInCtbsY-=uniformSliceHeight
j++
}
if(remainingHeightInCtbsY>0){
sliceHeightInCtus[i+j]=remainingHeightInCtbsY
j++
}
NumSlicesInTile[i]=j
}
ctbY=tileRowBd[tileY]
for(j=0;j<NumSlicesInTile[i]-1;j++){
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],
ctbY,ctbY+sliceHeightInCtus[i])
ctbY+=sliceHeightInCtus[i]
i++
}
AddCtbsToSlice(i,tileColBd[tileX],tileColBd[tileX+1],ctbY,tileRowBd[tileY+1])
} else
for(j=0;j<sliceHeightInTiles[i];j++)
for(k=0;k<sliceWidthInTiles[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],
tileRowBd[tileY+j],tileRowBd[tileY+j+1])
if(i<num_slices_in_pic_minus1){
if(tile_idx_delta_present_flag)
tileIdx+=tile_idx_delta[i]
else{
tileIdx+=sliceWdithInTiles[i]
if(tileIdx%NumTileColumns==0)
tileIdx+=(sliceHeightInTiles[i]-1)*NumTileColumns
}
}
}
}
...
あるいは、上記の中で、以下の行:
【化21】
6.10. 実施形態10:サブピクチャおよびタイルの信号通知について
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
タイル列の数を規定する変数NumTileColumns、およびCTB単位でi番目のタイル列の幅を規定するiのための0からNumTileColumns-1の範囲(両端含む)のリストcolWidth[i]は、以下のように導出される。
remainingWidthInCtbsY=PicWidthInCtbsY
【化22】
uniformTileColWidth=tile_column_width_minus1[num_exp_tile_columns_minus1]+1 (23)
while(remainingWidthInCtbsY>=uniformTileColWidth){
colWidth[i++]=uniformTileColWidth
remainingWidthInCtbsY-=uniformTileColWidth
}
if(remainingWidthInCtbsY>0)
colWidth[i++]=remainingWidthInCtbsY
NumTileColumns=i
タイル行の数を規定する変数NumTileRowsと、0からNumTileRows-1の範囲(両端含む)のjについて、j番目のタイル行の高さをCTB単位で規定するリストRowHeight[j]は、次のように導出される。
remainingHeightInCtbsY=PicHeightInCtbsY
【化23】
RowHeight[j]=tile_row_height_minus1[j]+1
remainingHeightInCtbsY-=RowHeight[j]
}
uniformTileRowHeight=tile_row_height_minus1[num_exp_tile_rows_minus1]+1 (24)
while(remainingHeightInCtbsY>=uniformTileRowHeight){
RowHeight[j++]=uniformTileRowHeight
remainingHeightInCtbsY-=uniformTileRowHeight
}
if(remainingHeightInCtbsY>0)
RowHeight[j++]=remainingHeightInCtbsY
NumTileRows=j
7.3.2.3 シーケンスパラメータセットRBSP構文
【表35】
7.3.2.4 ピクチャパラメータセットRBSP構文
【表36】
【表37】
7.4.3.4 ピクチャパラメータセット意味論
...
num_exp_tile_columns_minus1+1は、明確に提供されるタイル列の幅の数を規定する。num_exp_tile_columns_minus1の値は、0から
【化24】
num_exp_tile_rows_minus1+1は、明確に提供されるタイル行の高さ
【化25】
【化26】
6.11. 実施形態11:意味論の変更例
【化27】
6.12. 実施形態12:適合性要件例
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
タイル列の数を規定する変数NumTileColumns、およびCTB単位でi番目のタイル列の幅を規定するiのための0からNumTileColumns-1の範囲(両端含む)のリストcolWidth[i]は、以下のように導出される。
remainingWidthInCtbsY=PicWidthInCtbsY
for(i=0;i<num_exp_tile_columns_minus1;i++){
colWidth[i]=tile_column_width_minus1[i]+1
remainingWidthInCtbsY-=colWidth[i]
}
【化28】
uniformTileColWidth=tile_column_width_minus1[num_exp_tile_columns_minus1]+1 (23)
while(remainingWidthInCtbsY>=uniformTileColWidth){
colWidth[i++]=uniformTileColWidth
remainingWidthInCtbsY-=uniformTileColWidth
}
if(remainingWidthInCtbsY>0)
colWidth[i++]=remainingWidthInCtbsY
NumTileColumns=i
【化29】
タイル行の数を規定する変数NumTileRowsと、0からNumTileRows-1の範囲(両端含む)のjについて、j番目のタイル行の高さをCTB単位で規定するリストRowHeight[j]は、次のように導出される。
remainingHeightInCtbsY=PicHeightInCtbsY
for(j=0;j<num_exp_tile_rows_minus1;j++){
RowHeight[j]=tile_row_height_minus1[j]+1
remainingHeightInCtbsY-=RowHeight[j]
}
【化30】
uniformTileRowHeight=tile_row_height_minus1[num_exp_tile_rows_minus1]+1 (24)
while(remainingHeightInCtbsY>=uniformTileRowHeight){
RowHeight[j++]=uniformTileRowHeight
remainingHeightInCtbsY-=uniformTileRowHeight
}
if(remainingHeightInCtbsY>0)
RowHeight[j++]=remainingHeightInCtbsY
NumTileRows=j
【化31】
if(slicWidthInTiles[i]==1&&sliceHeightInTiles[i]==1){ (30)
if(num_exp_slices_in_tile[i]==0){
NumSlicesInTile[i]=1
sliceHeightInCtus[i]=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
}else{
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
for(j=0;j<num_exp_slices_in_tile[i]-1;j++){
sliceHeightInCtus[i+j]=exp_slice_height_in_ctus_minus1[i][j]+1
remainingHeightInCtbsY-=sliceHeightInCtus[i+j]
}
【化32】
uniformSliceHeight=exp_slice_height_in_ctus_minus1[i][j]+1
while(remainingHeightInCtbsY>=uniformSliceHeight){
sliceHeightInCtus[i+j]=uniformSliceHeight
remainingHeightInCtbsY-=uniformSliceHeight
j++
}
if(remainingHeightInCtbsY>0){
sliceHeightInCtus[i+j]=remainingHeightInCtbsY
j++
}
NumSlicesInTile[i]=j
}
…
【化33】
6.13. 実施形態12:スライス分割信号通知の例
6.5.1 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
…
rect_slice_flagが1に等しい場合、i番目のスライス内のCTUの数を規定するiを0からnum_slices_in_pic_minus1の範囲(両端含む)とするリストNumCtusInSlice[i]、スライス中の最初のCTUを含むタイルのインデックスを規定するiを0からnum_slices_in_pic_minus1の範囲(両端含む)とするリストSliceTopLeftTileIdx[i]、およびi番目のスライス内のj番目のCTBのピクチャラスタスキャンアドレスを規定する、iを0からnum_slices_in_pic_minus1の範囲(両端含む)とし、jを0からNumCtusInSlice[i]-1の範囲(両端含む)とする行列CtbAddrInSlice[i][j]、およびi番目のスライスを含むタイル中のスライスの数を規定する、変数NumSlicesInTile[i]は、次のように導出される。
if(single_slice_per_subpic_flag){
for(i=0;i<=sps_num_subpics_minus1;i++){
NumCtusInSlice[i]=0
if(subpicHeightLessThanOneTileFlag[i])/*The slice consists of a number of CTU rows in a tile.*/
AddCtbsToSlice(i,subpic_ctu_top_left_x[i],
subpic_ctu_top_left_x[i]+subpic_width_minus1[i]+1,subpic_ctu_top_left_y[i],
subpic_ctu_top_left_y[i]+subpic_height_minus1[i]+1)
else{/*The slice consists of a number of complete tiles covering a rectangular region.*/
tileX=CtbToTileColBd[subpic_ctu_top_left_x[i]]
tileY=CtbToTileRowBd[subpic_ctu_top_left_y[i]]
for(j=0;j<SubpicHeightInTiles[i];j++)
for(k=0;k<SubpicWidthInTiles[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],tileRowBd[tileY+j],
tileRowBd[tileY+j+1])
}
}
} else{
【化34】
[[tileIdx=0
for(i=0;i<=num_slices_in_pic_minus1;i++)
NumCtusInSlice[i]=0
for(i=0;i<=num_slices_in_pic_minus1;i++){
SliceTopLeftTileIdx[i]=tileIdx
tileX=tileIdx%NumTileColumns
tileY=tileIdx/NumTileColumns
if(i<num_slices_in_pic_minus1){
sliceWidthInTiles[i]=slice_width_in_tiles_minus1[i]+1
sliceHeightInTiles[i]=slice_height_in_tiles_minus1[i]+1
} else{
sliceWidthInTiles[i]=NumTileColumns-tileX
sliceHeightInTiles[i]=NumTileRows-tileY
NumSlicesInTile[i]=1
}
if(slicWidthInTiles[i]==1&&sliceHeightInTiles[i]==1){ (30)
if(num_exp_slices_in_tile[i]==0){
NumSlicesInTile[i]=1
sliceHeightInCtus[i]=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
} else{
remainingHeightInCtbsY=RowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]
for(j=0;j<num_exp_slices_in_tile[i]-1;j++){
sliceHeightInCtus[i+j]=exp_slice_height_in_ctus_minus1[i][j]+1
remainingHeightInCtbsY-=sliceHeightInCtus[i+j]
}
uniformSliceHeight=exp_slice_height_in_ctus_minus1[i][j]+1
while(remainingHeightInCtbsY>=uniformSliceHeight){
sliceHeightInCtus[i+j]=uniformSliceHeight
remainingHeightInCtbsY-=uniformSliceHeight
j++
}
if(remainingHeightInCtbsY>0){
sliceHeightInCtus[i+j]=remainingHeightInCtbsY
j++
}
NumSlicesInTile[i]=j
}
ctbY=tileRowBd[tileY]
for(j=0;j<NumSlicesInTile[i];j++){
AddCtbsToSlice(i+j,tileColBd[tileX],tileColBd[tileX+1],
ctbY,ctbY+sliceHeightInCtus[i+j])
ctbY+=sliceHeightInCtus[i+j]
}
i+=NumSlicesInTile[i]-1
} else
for(j=0;j<sliceHeightInTiles[i];j++)
for(k=0;k<sliceWidthInTiles[i];k++)
AddCtbsToSlice(i,tileColBd[tileX+k],tileColBd[tileX+k+1],
tileRowBd[tileY+j],tileRowBd[tileY+j+1])
if(i<num_slices_in_pic_minus1){
if(tile_idx_delta_present_flag)
tileIdx+=tile_idx_delta[i]
else{
tileIdx+=sliceWidthInTiles[i]
if(tileIdx%NumTileColumns==0)
tileIdx+=(sliceHeightInTiles[i]-1)*NumTileColumns
}
}
}]]
}
関数AddCtbsToSlice(sliceIdx,startX,stopX,startY,stopY)を以下のように規定する。
for(ctbY=startY;ctbY<stopY;ctbY++)
for(ctbX=startX;ctbX<stopX;ctbX++){
CtbAddrInSlice[sliceIdx][NumCtusInSlice[sliceIdx]]=ctbY*PicWidthInCtbsY+ctbX (31)
NumCtusInSlice[sliceIdx]++
}
7.3.2.4 ピクチャパラメータセットRBSP構文
【表38】
【表39】
[[num_slices_in_pic_minus1+1はPPSを参照し、各ピクチャの矩形スライスの数を規定する。num_slices_in_pic_minus1の値は、0からMaxSlicesPerPicture-1の範囲(両端含む)とし、MaxSlicesPerPictureは附属書Aで規定されるものとする。no_pic_partition_flagが1の場合、num_slices_in_pic_minus1の値は0に等しいと推定される。single_slice_per_subpic_flagが1に等しい場合、num_slices_in_pic_minus1の値はsps_num_subpics_minus1に等しいと推論される。
tile_idx_delta_present_flag=0は、tile_idx_delta[i]構文要素がPPSに含まれていないことを規定し、PPSを参照するすべてのピクチャは、スライスラスタ順に矩形スライス行と矩形スライス列に分割される。tile_idx_delta_present_flag equal to 1は、PPSにtile_idx_delta[i] 構文要素が存在してもよく、PPSを参照するピクチャのすべての矩形スライスは、iの値の増加により tile_idx_delta[i]が示す順序で規定されることを規定する。存在しない場合、tile_idx_delta_present_flagの値は0と推測される。
slice_width_in_tiles_minus1[i]plus1は、i番目の矩形スライスの幅をタイルの列の単位で規定する。slice_width_in_tiles_minus1[i]の値は0からNumTileColumns-1の範囲(両端含む)とする。
iがnum_slices_in_pic_minus1未満であり、且つNumTileColumnsが1に等しい場合、slice_width_in_tiles_minus1[i]の値は0に等しいと推測される。
slice_height_in_tiles_minus1[i]plus1は、num_exp_slices_in_tile[i]が0に等しい場合、i番目の矩形スライスの高さをタイル行単位で規定する。slice_height_in_tiles_minus1[i]の値は、0からNumTileRows-1の範囲(両端含む)とする。
iがnum_slices_in_pic_minus1未満であり、かつslice_height_in_tiles_minus1[i]が存在しない場合、NumTileRows==1?0:slice_height_in_tiles_minus1[i-1]と等しいと推測される。
num_exp_slices_in_tile[i]は、i番目のスライスを含むタイルにおけるスライスのために明確に提供されるスライスの高さの数を規定する(すなわち、SliceTopLeftTileIdx[i]に等しいタイルインデックスを有するタイル)。num_exp_slices_in_tile[i]の値は、0からRowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]-1の範囲(両端含む)とする。存在しない場合、num_exp_slices_in_tile[i]の値は0に等しいと推測される。
注3- num_exp_slices_in_tile[i]が0に等しい場合、i番目のスライスを含むタイルは複数のスライスに分割されない。そうでない場合(num_exp_slices_in_tile[i]が0より大きい)、i番目のスライスを含むタイルは、複数のスライスに分割されてもされなくてもよい。
exp_slice_height_in_ctus_minus1[i][j]+1-i番目のスライスを含むタイルにおけるj番目の矩形スライスの高さをCTU行単位で規定する。exp_slice_height_in_ctus_minus1[i][j]の値は、0からRowHeight[SliceTopLeftTileIdx[i]/NumTileColumns]-1の範囲(両端含む)とする。
tile_idx_delta[i]は、(i+1)番目の矩形スライスにおける第1CTUを含むタイルのタイルインデックスと、i番目の矩形スライスにおける第1CTUを含むタイルのタイルインデックスとの差を特定する。tile_idx_delta[i]の値は、-NumTilesInPic+1からNumTilesInPic-1の範囲(両端含む)とする。存在しない場合、tile_idx_delta[i]の値は0に等しいと推測される。存在する場合、tile_idx_delta[i]の値は0に等しいと推測される。]]
【化35】
6.14. 実施形態12:サブブロックベースのマージ候補リストサイズ信号通知の例
7.3.2.3 シーケンスパラメータセットRBSP構文
【表40】
7.4.3.3 シーケンスパラメータセットRBSP意味論
[[five_minus_max_num_subblock_merge_candは、SPSでサポートされるサブブロックベースマージ動きベクトル予測候補の最大数を5から減算することを指定する。five_minus_max_num_subblock_merge_candの値は、0~5の範囲内である。]]
【化36】
7.4.3.7 ピクチャヘッダ構造意味論
ph_temporal_mvp_enabled_flag、PHに関連するスライスのインター予測に時間動きベクトル予測モジュールを使用できるかを規定する。ph_temporal_mvp_enabled_flagが0に等しい場合、PHに関連付けられたスライスの構文要素は、時間動きベクトル予測モジュールがスライスの復号に使用されないように制約されるべきである。そうでない場合(ph_temporal_mvp_enabled_flagが1に等しい)、PHに関連付けられたスライスの復号に時間動きベクトル予測モジュールを使用してもよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は0に等しいと推測される。DPBにおける参照ピクチャの空間解像度が現在のピクチャと同じでない場合、ph_temporal_mvp_enabled_flagの値は0とする。
サブブロックベースのマージMVP候補の最大数、MaxNumSubblockMergeCandは以下のように導出される。:
[[if(sps_affine_enabled_flag)
MaxNumSubblockMergeCand=5-five_minus_max_num_subblock_merge_cand (87)
else
MaxNumSubblockMergeCand=sps_sbtmvp_enabled_flag&&ph_temporal_mvp_enabled_flag
MaxNumSubblockMergeCandの値は、0~5の範囲内である。]]
【化37】
【0063】
図7は、本明細書で開示される様々な技術が実装され得る例示的な映像処理システム1900を示すブロック図である。様々な実装形態は、システム1900のコンポーネントの一部又は全部を含んでもよい。システム1900は、映像コンテンツを受信するための入力ユニット1902を含んでもよい。映像コンテンツは、未加工又は非圧縮フォーマット、例えば、8又は10ビットのマルチコンポーネント画素値で受信されてもよく、又は圧縮又は符号化フォーマットで受信されてもよい。入力ユニット1902は、ネットワークインターフェース、周辺バスインターフェース、又は記憶インターフェースを表してもよい。ネットワークインターフェースの例は、イーサネット(登録商標)、PON(登録商標;Passive Optical Network)等の有線インターフェース、およびWi-Fi(登録商標)またはセルラーインターフェース等の無線インターフェースを含む。
【0064】
システム1900は、本明細書に記載される様々なコーディング又は符号化方法を実装することができるコーディングコンポーネント1904を含んでもよい。コーディングコンポーネント1904は、入力ユニット1902からの映像の平均ビットレートをコーディングコンポーネント1904の出力に低減し、映像のコーディングされた表現を生成してもよい。従って、このコーディング技術は、映像圧縮または映像トランスコーディング技術と呼ばれることがある。コーディングコンポーネント1904の出力は、コンポーネント1906によって表されるように、記憶されてもよいし、接続された通信を介して送信されてもよい。入力ユニット1902において受信された、記憶された又は通信された映像のビットストリーム(又はコーディングされた)表現は、コンポーネント1908によって使用されて、表示インターフェース1910に送信される画素値又は表示可能な映像を生成してもよい。ビットストリーム表現からユーザが見ることができる映像を生成する処理は、映像伸張(映像展開)と呼ばれることがある。さらに、特定の映像処理操作を「コーディング」操作又はツールと呼ぶが、コーディングツール又は操作は、エンコーダ及びそれに対応する、コーディングの結果を逆にする復号ツール又は操作が、デコーダによって行われることが理解されよう。
【0065】
周辺バスインターフェースまたは表示インターフェースの例は、USB(登録商標;Universal Serial Bus)またはHDMI(登録商標;High Definiyion Multimedia Interface)またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、SATA(Serial Advanced Technology Attachment)、PCI、IDEインターフェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフォン、又はデジタルデータ処理及び/又は映像表示を実施可能な他のデバイス等の様々な電子デバイスに実施されてもよい。
【0066】
図8は、映像処理装置3600のブロック図である。装置3600は、本明細書に記載の方法の1つ以上を実装するために使用してもよい。装置3600は、スマートフォン、タブレット、コンピュータ、モノのインターネット(IoT)受信機等に実施されてもよい。装置3600は、1つ以上の処理装置3602と、1つ以上のメモリ3604と、映像処理ハードウェア3606と、を含んでもよい。1つまたは複数の処理装置3602は、本明細書に記載される1つ以上の方法を実装するように構成されてもよい。メモリ(複数可)3604は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア3606は、本明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。
【0067】
図10は、本開示の技法を利用し得る例示的な映像コーディングシステム100を示すブロック図である。
【0068】
図10に示すように、映像コーディングシステム100は、送信元デバイス110と、宛先装置120と、を備えてもよい。送信元デバイス110は、符号化された映像データを生成するものであり、映像符号化機器とも呼ばれ得る。宛先装置120は、送信元デバイス110によって生成された符号化映像データを復号してよく、映像復号デバイスと呼ばれ得る。
【0069】
送信元デバイス110は、映像ソース112と、映像エンコーダ114と、入出力(I/O)インターフェース116と、を含んでよい。
【0070】
映像ソース112は、映像キャプチャデバイスなどのソース、映像コンテンツプロバイダからの映像データを受信するためのインターフェース、および/または映像データを生成するためのコンピュータグラフィックスシステム、またはこれらのソースの組み合わせを含んでもよい。映像データは、1または複数のピクチャを含んでもよい。映像エンコーダ114は、映像ソース112からの映像データを符号化し、ビットストリームを生成する。ビットストリームは、映像データのコーディングされた表現を形成するビットのシーケンスを含んでもよい。ビットストリームは、コーディングされたピクチャおよび関連付けられたデータを含んでもよい。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連付けられたデータは、シーケンスパラメータセット、ピクチャパラメータセット、および他の構文構造を含んでもよい。I/Oインターフェース116は、変復調器(モデム)および/または送信機を含んでもよい。符号化された映像データは、ネットワーク130aを介して、I/Oインターフェース116を介して宛先装置120に直接送信されてよい。符号化された映像データは、宛先装置120がアクセスするために、記憶媒体/サーバ130bに記憶してもよい。
【0071】
宛先装置120は、I/Oインターフェース126、映像デコーダ124、および表示デバイス122を含んでもよい。
【0072】
I/Oインターフェース126は、受信機および/またはモデムを含んでもよい。I/Oインターフェース126は、送信元デバイス110または記憶媒体/サーバ130bから符号化された映像データを取得してもよい。映像デコーダ124は、符号化された映像データを復号してもよい。表示デバイス122は、復号された映像データをユーザに表示してもよい。表示デバイス122は、宛先装置120と一体化されてもよく、または外部表示装置とインターフェースで接続するように構成される宛先装置120の外部にあってもよい。
【0073】
映像エンコーダ114および映像デコーダ124は、HEVC(High Efficiency Video Coding)規格、VVM(Versatile Video Coding)規格、および他の現在のおよび/またはさらなる規格等の映像圧縮規格に従って動作してもよい。
【0074】
図11は、映像エンコーダ200の一例を示すブロック図であり、この映像エンコーダ200は、
図10に示されるシステム100における映像エンコーダ114であってもよい。
【0075】
映像エンコーダ200は、本開示の技術のいずれか又は全部を実行するように構成されてもよい。
図11の例において、映像エンコーダ200は、複数の機能コンポーネントを備える。本開示で説明される技法は、映像エンコーダ200の様々なコンポーネント間で共有されてもよい。いくつかの例では、プロセッサは、本開示で説明される技術のいずれかまたはすべてを行うように構成してもよい。
【0076】
映像エンコーダ200の機能コンポーネントは、分割ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205及びイントラ予測ユニット206を含んでもよい予測ユニット202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214と、を含んでもよい。
【0077】
他の例において、映像エンコーダ200は、より多くの、より少ない、又は異なる機能コンポーネントを含んでもよい。一例において、予測ユニット202は、イントラブロックコピー(IBC)ユニットを含んでもよい。IBCユニットは、少なくとも1つの参照ピクチャが現在の映像ブロックが位置するピクチャであるIBCモードにおいて予測を行うことができる。
【0078】
さらに、動き推定ユニット204及び動き補償ユニット205などのいくつかのコンポーネントは、高度に統合されてもよいが、説明のために、
図11の例においては別々に表されている。
【0079】
分割ユニット201は、1つのピクチャを1または複数の映像ブロックに分割してよい。映像エンコーダ200及び映像デコーダ300は、様々な映像ブロックサイズをサポートしてもよい。
【0080】
モード選択ユニット203は、例えば、エラー結果に基づいて、イントラ又はインターのいずれかのコーディングモードの1つを選択し、得られたイントラ又はインターコーディングブロックを、残差生成ユニット207に供給して残差ブロックデータを生成し、また再構成ユニット212に供給して参照ピクチャとして使用するために符号化ブロックを再構成してもよい。いくつかの例において、モード選択ユニット203は、インター予測信号およびイントラ予測信号に基づいて予測を行うCIIP(Combination of Intra and Inter Prediction)モードを選択してもよい。モード選択ユニット203は、インター予測の場合、ブロックのために動きベクトルの解像度(例えば、サブピクセル又は整数ピクセル精度)を選択してもよい。
【0081】
現在の映像ブロックに対してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1または複数の参照フレームと現在の映像ブロックとを比較することにより、現在の映像ブロックのために動き情報を生成してもよい。動き補償ユニット205は、現在の映像ブロックに関連付けられたピクチャ以外のバッファ213からのピクチャの動き情報及び復号サンプルに基づいて、現在の映像ブロックのために予測映像ブロックを判定してもよい。
【0082】
動き推定ユニット204及び動き補償ユニット205は、例えば、現在の映像ブロックがIスライスであるか、Pスライスであるか、又はBスライスであるかに基づいて、現在の映像ブロックに対して異なる演算を実行してもよい。
【0083】
いくつかの例において、動き推定ユニット204は、現在の映像ブロックに対して単方向予測を実行し、動き推定ユニット204は、現在の映像ブロックに対する参照映像ブロックのために、リスト0又はリスト1の参照ピクチャを検索してもよい。そして、動き推定ユニット204は、参照映像ブロックと、現在の映像ブロックと参照映像ブロックとの間の空間的変位を示す動きベクトルとを含む、リスト0またはリスト1における参照ピクチャを示す参照インデックスを生成してもよい。動き推定ユニット204は、参照インデックス、予測方向インジケータ、および動きベクトルを、現在の映像ブロックの動き情報として出力してもよい。動き補償ユニット205は、現在の映像ブロックの動き情報が示す参照映像ブロックに基づいて、現在のブロックの予測映像ブロックを生成してもよい。
【0084】
他の例において、動き推定ユニット204は、現在の映像ブロックを双方向予測してもよく、動き推定ユニット204は、リスト0における参照ピクチャの中から現在の映像ブロックために参照映像ブロックを検索してもよく、また、リスト1における参照ピクチャの中から現在の映像ブロックのために別の参照映像ブロックを検索してもよい。そして、動き推定ユニット204は、参照映像ブロックを含むリスト0およびリスト1における参照ピクチャを示す参照インデックスと、参照映像ブロックと現在の映像ブロックとの間の空間的変位を示す動きベクトルとを生成してもよい。動き推定ユニット204は、現在の映像ブロックの参照インデックスおよび動きベクトルを、現在の映像ブロックの動き情報として出力してもよい。動き補償ユニット205は、現在の映像ブロックの動き情報が示す参照映像ブロックに基づいて、現在の映像ブロックの予測映像ブロックを生成してもよい。
【0085】
いくつかの例において、動き推定ユニット204は、デコーダの復号処理のために、動き情報のフルセットを出力してもよい。
【0086】
いくつかの例では、動き推定ユニット204は、現在の映像のために動き情報のフルセットを出力しなくてもよい。むしろ、動き推定ユニット204は、別の映像ブロックの動き情報を参照して、現在の映像ブロックの動き情報を信号通知してもよい。例えば、動き推定ユニット204は、現在の映像ブロックの動き情報が近傍の映像ブロックの動き情報に十分に類似していると判定してもよい。
【0087】
一例において、動き推定ユニット204は、現在の映像ブロックに関連付けられた構文構造において、現在の映像ブロックが別の映像ブロックと同じ動き情報を有することを映像デコーダ300に示す値を示してもよい。
【0088】
別の例において、動き推定ユニット204は、現在の映像ブロックに関連付けられた構文構造において、別の映像ブロックと、MVD(Motion Vector Difference)と、を識別してもよい。動きベクトル差分は、現在の映像ブロックの動きベクトルと、示された映像ブロックの動きベクトルとの差分を示す。映像デコーダ300は、指示された映像ブロックの動きベクトルと、動きベクトル差分と、を用いて、現在の映像ブロックの動きベクトルを判定してもよい。
【0089】
上述したように、映像エンコーダ200は、動きベクトルを予測的に信号通知してもよい。映像エンコーダ200によって実装され得る予測信号通知技法の2つの例は、AMVP(Advanced Motion Vector Prediction)およびマージモード信号通知を含む。
【0090】
イントラ予測ユニット206は、現在の映像ブロックに対してイントラ予測を行ってもよい。イントラ予測ユニット206が現在の映像ブロックをイントラ予測する場合、イントラ予測ユニット206は、同じピクチャにおける他の映像ブロックの復号されたサンプルに基づいて、現在の映像ブロックのための予測データを生成してもよい。現在の映像ブロックのための予測データは、予測された映像ブロック及び様々な構文要素を含んでもよい。
【0091】
残差生成ユニット207は、現在の映像ブロックから現在の映像ブロックの予測された映像ブロックを減算することによって(例えば、マイナス符号によって示されている)、現在の映像ブロックのために残差データを生成してもよい。現在の映像ブロックの残差データは、現在の映像ブロックにおけるサンプルの異なるサンプル成分に対応する残差映像ブロックを含んでもよい。
【0092】
他の例において、例えば、スキップモードにおいて、現在の映像ブロックのための残差データがなくてもよく、残差生成ユニット207は、減算演算を実行しなくてもよい。
【0093】
変換処理ユニット208は、現在の映像ブロックに関連付けられた残差映像ブロックに1または複数の変換を適用することによって、現在の映像ブロックのために1または複数の変換係数映像ブロックを生成してもよい。
【0094】
変換処理ユニット208が現在の映像ブロックに関連付けられた変換係数映像ブロックを生成した後、量子化ユニット209は、現在の映像ブロックに関連付けられた1または複数の量子化パラメータ(QP)の値に基づいて、現在の映像ブロックに関連付けられた変換係数映像ブロックを量子化してもよい。
【0095】
逆量子化ユニット210および逆変換ユニット211は、変換係数映像ブロックに逆量子化および逆変換をそれぞれ適用し、変換係数映像ブロックから残差映像ブロックを再構成してもよい。再構成ユニット212は、予測ユニット202が生成した1または複数の予測映像ブロックから対応するサンプルに再構成された残差映像ブロックを加え、バッファ213での記憶のために現在のブロックに関連付けられた再構成された映像ブロックを生成してよい。
【0096】
再構成ユニット212が映像ブロックを再構成した後、映像ブロックにおける映像ブロッキングアーチファクトを縮小するために、ループフィルタリング演算を行ってもよい。
【0097】
エントロピー符号化ユニット214は、映像エンコーダ200の他の機能コンポーネントからデータを受信してもよい。エントロピー符号化ユニット214は、データを受信すると、1または複数のエントロピー符号化演算を行い、エントロピー符号化されたデータを生成し、エントロピー符号化されたデータを含むビットストリームを出力してもよい。
【0098】
図12は、映像デコーダ300の一例を示すブロック図であり、この映像デコーダ300は、
図10に示されるシステム100における映像デコーダ114であってもよい。
【0099】
映像デコーダ300は、本開示の技術のいずれか又は全部を実行するように構成されてもよい。
図12の実施例において、映像デコーダ300は、複数の機能コンポーネントを含む。本開示で説明される技法は、映像デコーダ300の様々なコンポーネント間で共有されてもよい。いくつかの例では、プロセッサは、本開示で説明される技術のいずれかまたはすべてを行うように構成してもよい。
【0100】
図12の例において、映像デコーダ300は、エントロピー復号ユニット301、動き補償ユニット302、イントラ予測ユニット303、逆量子化ユニット304、逆変換ユニット305、及び再構成ユニット306、並びにバッファ307を備える。映像デコーダ300は、いくつかの例では、映像エンコーダ200(
図11)に関して説明した符号化パスとほぼ逆の復号パスを行ってもよい。
【0101】
エントロピー復号ユニット301は、符号化されたビットストリームを取り出す。符号化されたビットストリームは、エントロピーコーディングされた映像データ(例えば、映像データの符号化されたブロック)を含んでもよい。エントロピー復号ユニット301は、エントロピーコーディングされた映像データを復号し、エントロピー復号された映像データから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、および他の動き情報を含む動き情報を決定してもよい。動き補償ユニット302は、例えば、AMVP及びマージモードを実行することにより、このような情報を判定してもよい。
【0102】
動き補償ユニット302は、動き補償されたブロックを生成してもよく、場合によっては、補間フィルタに基づいて補間を実行する。サブピクセルの精度で使用される補間フィルタのための識別子が、構文要素に含まれてもよい。
【0103】
動き補償ユニット302は、映像ブロックの符号化中に映像エンコーダ200によって使用されるような補間フィルタを使用して、参照ブロックのサブ整数画素のための補間値を計算してもよい。動き補償ユニット302は、受信した構文情報に基づいて、映像エンコーダ200が使用する補間フィルタを判定し、この補間フィルタを使用して予測ブロックを生成してもよい。
【0104】
動き補償ユニット302は、符号化された映像シーケンスのフレームおよび/またはスライスを符号化するために使用されるブロックのサイズを判定するための構文情報、符号化された映像シーケンスのピクチャの各マクロブロックがどのように分割されるかを記述する分割情報、各分割がどのように符号化されるかを示すモード、各インター符号化されたブロックに対する1または複数の参照フレーム(および参照フレームリスト)、および符号化された映像シーケンスを復号するための他の情報のいくつかを用いられ得る。
【0105】
イントラ予測ユニット303は、例えば、ビットストリームにおいて受信したイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成してもよい。逆量子化ユニット303は、ビットストリームに提供され、エントロピー復号ユニット301によって復号された量子化された映像ブロック係数を逆量子化(すなわち、逆量子化)する。逆変換ユニット303は、逆変換を適用する。
【0106】
再構成ユニット306は、残差ブロックと、動き補償ユニット202又はイントラ予測ユニット303によって生成された対応する予測ブロックとを合計し、復号されたブロックを形成してもよい。所望であれば、ブロックアーチファクトを除去するために、復号されたブロックをフィルタリングするためにデブロッキングフィルタを適用してもよい。復号された映像ブロックは、バッファ307に記憶され、バッファ307は、後続の動き補償/イントラ予測のために参照ブロックを提供し、また表示装置に表示するために復号された映像を生成する。
【0107】
次に、いくつかの実施形態において好適な解決策を列挙する。
【0108】
以下の解決策は、前章(例えば、項目1)で論じた技術の例示的な実施形態を示す。
【0109】
1.本発明の映像加工方法(例えば、方法900は、
図9に記載される)は、1つ以上の映像ピクチャを含む映像であって、各映像ピクチャが1つ以上のスライスを含むサブピクチャを含む映像と、コーディングされた表現がフォーマット規則に準拠する映像のコーディングされた表現との変換を行う工程(902)を含み、そのフォーマット規則は、映像ピクチャに対して矩形スライスモードが有効化されている場合、映像ピクチャにおける各サブピクチャの各スライスに対するピクチャレベルスライスインデックスを、コーディングされた表現における明確な信号伝達なしに導出することを規定し、且つ各スライスにおけるコーディングツリーユニットの数がピクチャレベルスライスインデックスから導出可能であることを規定する。
【0110】
以下の解決策は、前章(例えば、項目2)で論じた技術の例示的な実施形態を示す。
【0111】
2.1つ以上のピクチャを含む映像であって、各映像ピクチャが1つ以上のスライスを有する1つ以上のサブピクチャを含む映像と、映像のコーディングされた表現との変換を行うことを含み、コーディングされた表現はフォーマット規則に従い、そのフォーマット規則はサブピクチャレベルスライスインデックスが、コーディングされた表現中のサブピクチャレベルスライスインデックスを信号通知することなく、コーディングされた表現中の情報に基づいて導出される、映像処理方法
【0112】
3.前記フォーマット規則は、矩形のスライス構造を使用することによって、サブピクチャレベルのスライスインデックスが、サブピクチャにおけるスライスのリストにおける当該スライスへのインデックスに対応することを規定する、解決策2に記載の方法。
【0113】
4.前記フォーマット規則は、前記サブピクチャレベルスライスインデックスがピクチャレベルスライスインデックスの特定の値から導出されることを規定する、解決策2に記載の方法。
【0114】
以下の解決策は、前章(例えば、項目5,6)で論じた技術の例示的な実施形態を示す。
【0115】
5.1つ以上の映像ピクチャを含む映像であって、各映像ピクチャが1つ以上のサブピクチャおよび/または1つ以上のタイルを含む映像と、映像のコーディングされた表現との変換を行うことを含み、コーディングされた表現はフォーマット規則に従い、変換は制約規則に従う、映像処理方法。
【0116】
6.前記制約規則は、タイルが2つ以上のサブピクチャに含まれていてはならないことを規定する、解決策5に記載の方法。
【0117】
7.前記制約規則は、サブピクチャが前記2つのスライスが属する対応するタイルよりも小さい2つのスライスを含むことができないことを規定する、解決策5に記載の方法。
【0118】
以下の解決策は、前章(例えば、項目7、8)で論じた技術の例示的な実施形態を示す。
【0119】
8.1つ以上の映像ピクチャを含む映像との間で変換を行うことを含み、各映像ピクチャは1つ以上のタイルおよび/または1つ以上のスライスを含み、コーディングされた表現はフォーマット規則に準拠し、フォーマット規則は、映像ピクチャレベルのフィールドが映像ピクチャにおけるスライスおよび/またはタイルの分割に関する情報を搬送することを規定する、映像処理方法。
【0120】
9.前記フィールドは、映像ピクチャヘッダを含む、解決策8に記載の方法。
【0121】
10.前記フィールドはピクチャパラメータ集合を含む、解決策8に記載の方法。
【0122】
11.前記フォーマット規則は、前記フィールドの前記スライス分割情報を前記映像ピクチャレベルに含めることによって、スライスレベルのスライス分割情報を省略することを規定する、解決策8から10のいずれか1項に記載の方法。
【0123】
以下の解決策は、前章(例えば、項目9)で論じた技術の例示的な実施形態を示す。
【0124】
12.1つ以上のピクチャを含む映像と映像のコーディングされた表現との変換を行うことを含み、この変換は、映像ピクチャを分割する最小スライス数を、この映像ピクチャを分割するために矩形分割を使用するかどうかの関数とする分割規則に準拠する、映像処理方法。
【0125】
13.前記分割規則は、非矩形分割のために少なくとも2つのスライスを使用し、矩形分割のために少なくとも1つのスライスを使用することを規定する、解決策12に記載の方法。
【0126】
14.前記分割規則は、前記映像ピクチャを分割するために使用されるサブピクチャの数および/または数の関数でもある、解決策12に記載の方法。
【0127】
以下の解決策は、前章(例えば、項目10、11)で論じた技術の例示的な実施形態を示す。
【0128】
15.映像の映像領域の映像スライスと前記映像のコーディングされた表現との変換を行うことを含み、前記コーディングされた表現はフォーマット規則に準拠し、前記フォーマット規則は、前記コーディングされた表現が前記映像スライスの左上位置に基づいて前記映像スライスを信号通知することを規定し、前記フォーマット規則は、前記コーディングされた表現が映像ユニットレベルで信号通知される分割情報における前記映像スライスの高さおよび/または幅を信号通知することを規定することを含む、映像処理方法。
【0129】
16.前記フォーマット規則は、前記映像スライスが、前記フォーマット規則によって規定されるスライスの順に信号通知されることを規定する、解決策15に記載の方法。
【0130】
17.前記映像領域はサブピクチャに対応し、前記映像ユニットレベルは映像ピクチャに対応する、解決策15に記載の方法。
【0131】
以下の解決策は、前章(例えば、項目12)で論じた技術の例示的な実施形態を示す。
【0132】
18.映像ピクチャを含む映像とこの映像のコーディングされた表現との変換を行うことを含み、前記コーディングされた表現はフォーマット規則に準拠し、前記フォーマット規則は、矩形スライスにおける第1タイルのタイルインデックスと次の矩形スライスにおける第1タイルのタイルインデックスとの間の差の信号通知を省略することを規定する、映像処理方法。
【0133】
19.前記差は、前記映像ピクチャにおける0番目のスライスと前記矩形スライスとから導出可能である、解決策18に記載の方法。
【0134】
以下の解決策は、前章(例えば、項目13)で論じた技術の例示的な実施形態を示す。
【0135】
20.映像とこの映像のコーディングされた表現との変換を行うことを含み、前記コーディングされた表現はフォーマット規則に準拠し、前記フォーマット規則は、映像ピクチャの幅とコーディングツリーユニットのサイズとの関係が、映像ピクチャにおけるタイルの列または行の数を導出するために使用される情報の信号通知を制御することを規定する、映像処理方法。
【0136】
21.前記フォーマット規則は、前記映像ピクチャの幅が前記コーディングツリーユニットの幅以下である場合、複数のタイル行または複数のタイル列を信号通知することを排除することを規定する、解決策20に記載の方法。
【0137】
以下の解決策は、前章(例えば、項目16)で論じた技術の例示的な実施形態を示す。
【0138】
22.1つ以上の映像ピクチャを含む映像と前記映像のコーディングされた表現との変換を行うことを含み、前記コーディングされた表現は、フォーマット規則に準拠し、前記フォーマット規則は、均一な間隔のタイルおよび不均一な間隔のタイルを含む映像ピクチャのために、前記コーディングされた表現にタイルレイアウト情報が含まれることを規定する、映像処理方法。
【0139】
23.前記タイルレイアウト情報は、ピクチャパラメータ集合に含まれる構文フラグに含まれる、解決策22に記載の方法。
【0140】
24.明確に信号通知されるタイルの行または列の数が、不均一な間隔のタイルの数と同程度である、解決策22から23のいずれか1つに記載の方法。
【0141】
25.明確に信号通知されるタイルの行または列の数が、均一な間隔のタイルの数と同程度である、解決策22から23のいずれか1つに記載の方法。
【0142】
26.前記映像領域は、映像コーディングユニットを含む、上記解決策のいずれか1つに記載の方法。
【0143】
27.前記映像領域は映像ピクチャを含む、上記解決策のいずれか1つに記載の方法。
【0144】
28.前記変換は、前記映像を前記コーディングされた表現に符号化することを含む、解決策1~27のいずれかに記載の方法。
【0145】
29.前記変換は、前記映像の画素値を生成すべく前記コーディングされた表現を復号することを含む、解決策1~27のいずれかに記載の方法。
【0146】
30.解決策1~29の1つ以上に記載の方法を実装するように構成された処理装置を備える、映像復号装置。
【0147】
31.解決策1~29の1つ以上に記載の方法を実装するように構成された処理装置を備える、映像符号化装置。
【0148】
32.コンピュータコードが記憶されたコンピュータプログラム製品であって、前記コードは、処理装置により実行されると、前記処理装置に、解決策1~29のいずれかに記載の方法を実装させるコンピュータプログラム製品。
【0149】
33.本明細書に記載の方法、装置またはシステム。
【0150】
図13は、本技術にしたがった映像処理方法1300を示すフローチャートである。方法1300は、工程1310において、1つ以上のタイルを含む映像と1つ以上の矩形スライスとを含む映像と、規則に従って映像のビットストリームとの変換を行うことを含む。この規則は、1つ以上の矩形スライスに関する情報を繰り返し判定するために、映像ピクチャにおける矩形スライスの数から1を減算した値よりも小さいインデックスを有するスライスのみについて、タイルインデックスを示す変数を更新することを規定する。
【0151】
本発明の実施形態において、前記変数は前記映像ピクチャにおける最後の矩形スライスの情報を確定するために更新されない。本発明の実施形態において、前記情報を確定する工程は、前記映像ピクチャが参照するピクチャパラメータ集合を用いて実行される。本発明の実施形態において、1つ以上の矩形スライスの1つのスライスは、スライスインデックスがiであり、前記情報は、スライスにおける第1コーディングツリーユニットを含むタイルのタイルインデックス、前記スライスの幅、または前記スライスの高さのうち少なくとも1つを含む。本発明の実施形態において、前記情報は、1つ以上の矩形スライスにおけるコーディングツリーユニットの数量のリスト、1つ以上の矩形スライスの左上のタイルインデックス、またはスライス内のコーディングツリーブロックのピクチャラスタスキャンアドレスのうちの少なくとも1つを含む。本発明の実施形態において、前記変数を更新することは、(1)スライスインデックスが(i+1)である第1スライスにおける第1コーディングツリーユニットを含む第1タイルの第1タイルインデックスと、(2)スライスインデックスがiである第2スライスにおける第1コーディングするツリーユニットを含む第2タイルの第2タイルインデックスとの差を加算することを含む。本発明の実施形態において、前記変数を更新することは、前記スライスの幅をタイル列(tilecolumn)単位で増加させることを含むことができる。本発明の実施形態において、(A-1)*Bを加えて変数を更新し、Aはスライスの高さをタイルの行単位で表し、Bは映像タイルの列数を表す。本発明の実施形態において、1つ以上のタイルの第1タイルは、少なくとも1つの矩形スライスを含み、この少なくとも1つの矩形スライスの情報は、少なくとも1つの矩形スライスの各々の高さを含む。
【0152】
図14は、本技術に従った映像処理の方法1400を示すフローチャートである。方法1400は、工程1410において、1つ以上のサブピクチャを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、最大ピクチャ幅および最大ピクチャ高さがコーディングツリーブロックの寸法以下である場合、映像ピクチャにおける複数のサブピクチャを示すシーケンスパラメータ集合における構文要素を省略することを規定する規則に従う。
【0153】
図15は、本技術にしたがった映像処理方法1500を示すフローチャートである。方法1500は、工程1510において、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、映像ピクチャの幅がコーディングツリーブロックの寸法以下である場合、複数の明確に提供されるタイルの列幅を示す構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0154】
図16は、本技術にしたがった映像処理方法1600を示すフローチャートである。方法1600は、工程1610において、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、映像ピクチャの高さがコーディングツリーブロックの寸法以下である場合、明確に提供されるタイルの行の高さの数を示す構文要素をビットストリームにおいて省略することを規定する規則に準拠する。
【0155】
本発明の実施形態において、コーディングツリーブロックの寸法はパラメータCtbSizeYで表される。本発明の実施形態において、映像ピクチャにおけるサブピクチャの数は0であると推論される。
【0156】
図17は、本技術にしたがった映像処理方法1700を示すフローチャートである。方法1700は、工程1710において、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、複数の明確に提供されるタイルの列幅がコーディングツリーブロック単位のピクチャ幅に等しい場合、1つ以上のタイルの列幅を示す1つ以上の構文要素をビットストリームにおいて省略することを規定する規則に準拠する。本発明の実施形態において、1つ以上のカラム幅は0であると推論される。
【0157】
図18は、本技術にしたがった映像処理方法1800を示すフローチャートである。方法1800は、工程1810において、1つ以上のタイルを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、複数の明確に提供されるタイルの行の高さがコーディングツリーブロック単位のピクチャの高さに等しい場合、1つ以上のタイルの行の高さを示す1つ以上の構文要素をビットストリームにおいて省略することを規定する規則に準拠する。本発明の実施形態において、1つ以上のタイルの行の高さは0であると推論される。
【0158】
図19は、本技術にしたがった映像処理方法1900を示すフローチャートである。方法1900は、工程1910において、1つ以上のスライスを含む映像ピクチャと映像のビットストリームとの変換を行うことを含む。この変換は、ビットストリームにスライス分割情報が含まれていることを規定する規則に準拠する。
【0159】
本発明の実施形態において、前記スライス分割情報は前記スライスの幅を含む。本発明の実施形態において、スライスの幅は、スライスの幅からXを引いたものを用いて示され、ここで、Xは非負の値である。本発明の実施形態において、Xは1に等しく、スライスの幅はvariable slice_width_minus1[i]を用いて示される。iはスライスのスライスインデックスを表す。本発明の実施形態において、前記スライス分割情報は前記スライスの高さを含む。本発明の実施形態において、スライスの高さは、スライスの高さからXを引いたものを用いて示され、ここで、Xは負でない値である。本発明の実施形態において、Xは1に等しく、スライスの高さは変数slice_height_minus1[i]を用いて示され、ここで、iはスライスのスライスインデックスを表す。
【0160】
本発明の実施形態において、前記スライス分割情報がスライスの左上の位置またはスライスの寸法を含むかは、前記スライスの特徴に基づき条件付けられる。本発明の実施形態において、前記スライス分割情報は、映像ピクチャが1つ以上の矩形スライスを含む場合、スライスの左上の位置または寸法を含む。本発明の実施形態において、前記スライスの前記特徴は、前記スライスのインデックス、前記スライスに関連するコーディングツリーブロックの寸法、前記スライスを含む前記映像ピクチャの寸法、または前記映像ピクチャにおけるスライスの数を含む。
【0161】
本発明の実施形態において、前記映像ピクチャは1つ以上のサブピクチャを含む、前記スライス分割情報はスライスの左上の位置またはスライスの寸法を含むかは、前記1つ以上のスライスの分割と前記1つ以上のサブピクチャの分割との間の関係に基づき条件付けられる。本発明の実施形態において、前記スライス分割情報は、前記1つ以上のサブピクチャの少なくとも1つが2つ以上のスライスを含む場合、スライスの前記左上の位置または前記寸法を含む。
【0162】
本発明の実施形態において、前記スライス分割情報がスライスの左上の位置または寸法を含むかは、前記ビデオピクチャ中のスライスの数に基づき条件付けられる。本発明の実施形態において、前記スライス分割情報は、映像ピクチャのスライス数が1より大きい場合、前記スライスを表現すべくスライスの左上の位置または寸法を含む。本発明の実施形態において、少なくとも1つのスライスの左上の位置または寸法が、コーディングツリーユニットの単位寸法またはタイルの単位寸法で表される。本発明の実施形態において、構文要素が、少なくとも1つのスライスの左上の位置または寸法がコーディングツリーの単位寸法またはタイルの単位寸法で表されるかを示すべく変換のために用いられる。本発明の実施形態において、構文要素は、各スライスの左上の位置または寸法がコーディングツリーユニットの単位寸法またはタイルの単位寸法で表されるかを示す。本発明の実施形態において、前記構文要素はslice_representated_in_ctb_flag[i]であり、iはスライスのインデックスを表す。
【0163】
本発明の実施形態において、スライス区分情報において、スライスの左上の位置または寸法のうち少なくとも1つを省略することができ、スライスの左上の位置または寸法をデフォルト値に推論する。本発明の実施形態において、前記スライスの前記左上の位置の前記デフォルト値は、(0,0)を含むことができる。本発明の実施形態において、前記スライスの前記寸法の前記デフォルト値は、構文要素slice_representated_in_ctb_flag[i]に基づき、iは前記スライスのインデックスを表す。本発明の実施形態において、前記スライスの幅の前記デフォルト値は、(slice_represented_in_ctb_flag[i]?((pic_width_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY):NumTileColumns)-slice_top_left_x[i]-1に等しい。本発明の実施形態において、前記スライスの高さの前記デフォルト値は、(slice_represented_in_ctb_flag[i]?((pic_height_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY):NumTileRows)-slice_top_left_y[i]-1に等しい。
【0164】
図20は、本技術にしたがった映像処理方法2000を示すフローチャートである。方法2000は、工程2010において、規則に従って1つ以上の矩形スライスを備える映像タイルと映像のビットストリームとの変換を行うことを含む。この規則は、コーディングツリーユニットの行単位で映像タイルにおける矩形スライスの高さを規定する第1の構文要素と、映像タイルにおける明確に提供されるスライスの高さの数を規定する第2の構文要素とに基づいて、均一なスライス高さを判定することを規定する。
【0165】
本発明の実施形態において、第1構文要素はexp_slice_height_in_ctus_minus1[i]、第2構文要素はnum_exp_slices_in_tile[i]であり、iは矩形スライスのインデックスであり、均一スライスの高さはexp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]に基づいている。本発明の実施形態において、(num_exp_slices_in_tile[i]-1)番目の不均一スライスの高さは、exp_slice_height_in_ctus_minus1[i][num_exp_slices_in_tile[i]-1]に基づいている。
【0166】
図21は、本技術に従った映像処理の方法2100を示すフローチャートである。方法2100は、工程2110において、1つ以上のタイルを有する映像ピクチャと映像のビットストリームとの変換を規則に従って行うことを含む。この規則は、構文要素が均一なタイルの列または行の寸法に等しいかまたはそれより大きいことを規定し、この構文要素は、複数の明確に提供されるタイルの列の幅または行の高さの合計寸法を除いた、コーディングツリーブロック単位寸法を示す。
【0167】
本発明の実施形態において、前記構文要素はfirstRemainingWidthInCtbsYである。本発明の実施形態において、前記構文要素はfirstRemainingHeightInCtbsYである。
【0168】
図22は、本技術にしたがった映像処理方法2200を示すフローチャートである。方法2200は、工程2210において、1つ以上のタイルを有する映像ピクチャと映像のビットストリームとの変換を規則に従って行うことを含む。この規則は、構文要素が均一なスライスの高さ以上であることを規定し、この構文要素は、複数の明確に提供されるスライス高さの合計高さを除いた、コーディングツリーユニットブロック単位の高さを示す。
【0169】
図23は、本技術にしたがった映像処理方法2300を示すフローチャートである。方法2300は、工程2310において、規則に従って映像と映像のビットストリームとの変換を行うことを含む。この規則は、サブブロックベースのマージ候補リストにおいて許可されるアフィンマージ候補の最大数を示すように、構文要素を変換に使用することを規定する。
【0170】
本発明の実施形態において、構文要素が変換のために信号通知されるかどうかは、アフィン予測ツールが有効化されるかどうかに基づく。本発明の実施形態において、ビットストリームにおいて構文要素が省略された場合、サブブロックベースのマージ候補リストにおいて許容されるアフィン結合候補の数の最大値が0であると仮定する。本発明の実施形態において、サブブロックベースのマージ候補リストにおいて許容されるアフィンマージ候補の最大数は、5と構文要素との差に等しい。本発明の実施形態において、構文要素は、[0,X]を含む範囲にあり、ここで、Xは整数である。本発明の実施形態において、Xは5である。
【0171】
本発明の実施形態において、ビットストリームにおいて構文要素が省略される場合、構文要素は5であると推論される。本発明の実施形態において、構文要素とサブブロックベースの時間動きベクトル予測(TMVP)マージ候補の最大数とにより、サブブロックベースのマージ候補リストにおいて許容されるアフィンマージ候補の最大数を判定する。本発明の実施形態において、サブブロックベースのマージ候補リストにおいて許容されるアフィンマージ候補の最大数は、Min(5,(sps_sbtmvp_enabled_flag&&ph_temporal_mvp_enable_flag)+5-five_minus_max_num_affine_merge_cand)に等しく、ここでfive_minus_max_num_affine_merge_candは構文要素である。
【0172】
いくつかの実施形態において、前記変換は、前記映像を前記ビットストリームに符号化することを含む。いくつかの実施形態において、前記変換は、前記映像を前記ビットストリームから復号することを含む。
【0173】
本明細書に記載の解決策において、エンコーダは、フォーマット規則に従ってコーディングされた表現を生成することで、フォーマット規則に準拠することができる。本明細書に記載の解決策において、デコーダは、フォーマット規則に従って、構文要素の有無を知りつつ、コーディングされた表現における構文要素を構文解析することで、復号された映像を生成するために、このフォーマット規則を使用してもよい。
【0174】
本明細書では、“映像処理”という用語は、映像符号化、映像復号、映像圧縮、または映像展開を指すことができる。例えば、映像圧縮アルゴリズムは、映像の画素表現から対応するビットストリーム表現への変換、またはその逆の変換中に適用されてもよい。現在の映像ブロックのビットストリーム表現は、例えば、構文によって規定されるように、ビットストリーム内の同じ場所または異なる場所に拡散されるビットに対応していてもよい。例えば、1つのマクロブロックは、変換およびコーディングされた誤り残差値の観点から、且つビットストリームにおけるヘッダおよび他のフィールドにおけるビットを使用して符号化されてもよい。さらに、変換中、デコーダは、上記解決策で説明されているように、判定に基づいて、いくつかのフィールドが存在しても存在しなくてもよいという知識を持って、ビットストリームを構文解析してもよい。同様に、エンコーダは、特定の構文フィールドが含まれるべきであるか、または含まれないべきであるかを判定し、構文フィールドをコーディングされた表現に含めるか、またはコーディングされた表現から除外することによって、それに応じてコーディングされた表現を生成してもよい。
【0175】
本明細書に記載された開示された、およびその他の解決策、実施例、実施形態、モジュール、および機能動作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの1つ以上の組み合わせで実施してもよい。開示された、およびその他の実施形態は、1または複数のコンピュータプログラム製品、すなわち、データ処理装置によって実装されるため、またはデータ処理装置の動作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令の1または複数のモジュールとして実施することができる。このコンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす物質の組成物、またはこれらの1または複数の組み合わせであってもよい。“データ処理装置”という用語は、例えば、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサ、若しくはコンピュータを含む、データを処理するためのすべての装置、デバイス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの1または複数の組み合わせを構成するコードを含むことができる。伝播信号は、人工的に生成した信号、例えば、機械で生成した電気、光、または電磁信号であり、適切な受信装置に送信するための情報を符号化するために生成される。
【0176】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語文書に格納された1または複数のスクリプト)に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル(例えば、1または複数のモジュール、サブプログラム、またはコードの一部を格納するファイル)に記憶されていてもよい。コンピュータプログラムを、1つのサイトに位置する1つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開することも可能である。
【0177】
本明細書に記載された処理およびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって行うことができる。処理およびロジックフローはまた、特定用途のロジック回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって行うことができ、装置はまた、特別目的のロジック回路として実装することができる。
【0178】
コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の1または複数のプロセッサを含む。一般的に、プロセッサは、リードオンリーメモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための1または複数のメモリデバイスとである。一般的に、コンピュータは、データを記憶するための1または複数の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み、例えば、EPROM、EEPROM、フラッシュ記憶装置、磁気ディスク、例えば内部ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびCD-ROMおよびDVD-ROMディスク等の半導体記憶装置を含む。プロセッサおよびメモリは、特定用途のロジック回路によって補完されてもよく、または特定用途のロジック回路に組み込まれてもよい。
【0179】
本特許明細書は多くの詳細を含むが、これらは、任意の主題の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の技術の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本特許文献において別個の実施形態のコンテキストで説明されている特定の特徴は、1つの例において組み合わせて実装してもよい。逆に、1つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの1または複数の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられてもよい。
【0180】
同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で行われること、または示された全ての動作が行われることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。
【0181】
いくつかの実装形態および例のみが記載されており、この特許文献に記載され図示されているコンテンツに基づいて、他の実施形態、拡張および変形が可能である。