(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-01
(54)【発明の名称】復号プロセスのエネルギー消費を表す情報をシグナリングするためのメタデータ
(51)【国際特許分類】
H04N 19/70 20140101AFI20240125BHJP
H04N 19/156 20140101ALI20240125BHJP
【FI】
H04N19/70
H04N19/156
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023543146
(86)(22)【出願日】2022-01-18
(85)【翻訳文提出日】2023-08-02
(86)【国際出願番号】 EP2022050947
(87)【国際公開番号】W WO2022167210
(87)【国際公開日】2022-08-11
(32)【優先日】2021-02-03
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-08-13
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(74)【代理人】
【識別番号】110002848
【氏名又は名称】弁理士法人NIP&SBPJ国際特許事務所
(72)【発明者】
【氏名】フランソワ、エドゥワール
(72)【発明者】
【氏名】ラドサヴリエヴィッチ、ミロス
(72)【発明者】
【氏名】ラインハルト、エリック
(72)【発明者】
【氏名】シャマレ、クリステル
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME01
5C159RC12
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングする(102)ことと、ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、データ構造をビデオストリームに関連付ける(103)ことであって、少なくとも1つの符号化ツール又は特徴は、ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、又は、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、又は、正方形ブロック及び矩形ブロック当たりのサンプル数に依存してエネルギー消費を表す情報に関連付けられる、ことと、を含む方法。
【選択図】
図1B
【特許請求の範囲】
【請求項1】
方法であって、
ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングする(102)ことと、
前記ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、前記データ構造を前記ビデオストリームに関連付ける(103)ことであって、少なくとも1つの符号化ツール又は特徴は、
・前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、若しくは、
・ピクチャ内の所与のサイズのブロックの総数、若しくは、
・正方形ブロック及び矩形ブロック当たりのサンプル数に依存してエネルギー消費を表す情報に関連付けられる、ことと、を含む方法。
【請求項2】
前記データ構造はSEIメッセージである、請求項1に記載の方法。
【請求項3】
エネルギー消費を表す前記情報は、複数のピクチャを含む前記ピクチャのサブセットに応答する前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズに依存する、請求項1又は2に記載の方法。
【請求項4】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項1又は2に記載の方法。
【請求項5】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項1又は2に記載の方法。
【請求項6】
第1の方法は、エネルギー消費を表す前記情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用され、
第2の方法は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用される、請求項5に記載の方法。
【請求項7】
ピクチャ内の所与のサイズのブロックの前記総数は、ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされる、請求項1又は2に記載の方法。
【請求項8】
方法であって、
ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについて前記ビデオストリームに関連付けられ、前記ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得する(102)ことであって、少なくとも1つの符号化ツール又は特徴は、
・前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、若しくは、
・ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、若しくは、
・正方形ブロック及び矩形ブロック当たりのサンプル数に依存してエネルギー消費を表す情報に関連付けられる、こと、を含む方法。
【請求項9】
前記データ構造はSEIメッセージである、請求項8に記載の方法。
【請求項10】
エネルギー消費を表す前記情報は、複数のピクチャを含む前記ピクチャのサブセットに応答する前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズに依存する、請求項8又は9に記載の方法。
【請求項11】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項8又は9に記載の方法。
【請求項12】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項8又は9に記載の方法。
【請求項13】
第1の方法は、エネルギー消費を表す前記情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用され、
第2の方法は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用される、請求項12に記載の方法。
【請求項14】
ピクチャ内の所与のサイズのブロックの前記総数は、ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされる、請求項8又は9に記載の方法。
【請求項15】
デバイスであって、
ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングする(102)ための手段と、
前記ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、前記データ構造を前記ビデオストリームに関連付けるための手段であって、少なくとも1つの符号化ツール又は特徴は、
・前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、若しくは、
・ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、若しくは、
・正方形ブロック及び矩形ブロック当たりのサンプル数に依存してエネルギー消費を表す情報に関連付けられる、手段と、を備えるデバイス。
【請求項16】
前記データ構造はSEIメッセージである、請求項15に記載のデバイス。
【請求項17】
エネルギー消費を表す前記情報は、複数のピクチャを含む前記ピクチャのサブセットに応答する前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズに依存する、請求項15又は16に記載のデバイス。
【請求項18】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項15又は16に記載のデバイス。
【請求項19】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項15又は16に記載のデバイス。
【請求項20】
第1の手段は、エネルギー消費を表す前記情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために使用され、
第2の手段は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために使用される、請求項19に記載のデバイス。
【請求項21】
ピクチャ内の所与のサイズのブロックの前記総数は、ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされる、請求項15又は16に記載のデバイス。
【請求項22】
デバイスであって、
ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについて前記ビデオストリームに関連付けられ、前記ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得する(102)ための手段であって、少なくとも1つの符号化ツール又は特徴は、
・前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、若しくは、
・ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、若しくは、
・正方形ブロック及び矩形ブロック当たりのサンプル数に依存してエネルギー消費を表す情報に関連付けられる、手段、を備えるデバイス。
【請求項23】
前記データ構造はSEIメッセージである、請求項22に記載のデバイス。
【請求項24】
エネルギー消費を表す前記情報は、複数のピクチャを含む前記ピクチャのサブセットに応答する前記ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズに依存する、請求項21又は22に記載のデバイス。
【請求項25】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項21又は22に記載のデバイス。
【請求項26】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項22又は23に記載のデバイス。
【請求項27】
第1の手段は、エネルギー消費を表す前記情報が、スライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用され、
第2の手段は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用される、請求項26に記載のデバイス。
【請求項28】
ピクチャ内の所与のサイズのブロックの前記総数は、ピクチャの前記少なくとも1つのサブセットに対して前記メタデータにおいてシグナリングされる、請求項22又は23に記載のデバイス。
【請求項29】
請求項15~28のいずれか一項に記載のデバイスを備える装置。
【請求項30】
請求項1~7のいずれか一項に記載の方法によって、又は請求項15~21のいずれか一項に記載のデバイスによって、又は請求項29が請求項15~21のうちの一項に従属する場合に請求項29に記載の装置によって生成される信号。
【請求項31】
請求項1~14のいずれか一項に記載の方法を実施するためのプログラムコード命令を含むコンピュータプログラム。
【請求項32】
請求項1~14のいずれか一項に記載の方法を実施するためのプログラムコード命令を記憶する非一時的情報記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態の少なくとも1つは、概して、復号プロセスのエネルギー消費を表す情報をシグナリングし、取得するための方法及び装置に関する。
【背景技術】
【0002】
エネルギー消費は、エンドデバイスにとって、特に限られたエネルギー電力リソースを有するモバイルセットにとって重要な問題である。TVセットについてであっても、そのエネルギー消費を制限することは、関連する意図である。ビデオの復号がかかるデバイスのエネルギー消費の主要部分ではないとしても(通常、携帯電話では約15%であるが、ディスプレイは50%に近い)、そのエネルギーの影響を低減可能であることは有益であり、ビデオのレンダリングに関与する任意のプロセスにとっても有益である。
【0003】
以下でグリーンMPEGと呼ばれるグリーンMPEG規格(ISO-IEC-23001-11)は、標準AVC(ISO/CEI 14496-10/ITU-T H.264)又は標準HEVC(ISO/IEC 23008-2-MPEG-H Part 2、High Efficiency Video Coding/ITU-T H.265))に準拠するデコーダに、デコーダがそのエネルギー使用を最適化することを可能にする、ビットストリームに関連する複雑度情報又はメトリック(CM)を示すメタデータを定義する。メタデータは、AVC設計及びHEVC設計に正確に適合している。
【0004】
VVC(Versatile Video Coding)と呼ばれる新しいビデオ符号化規格、Joint Video Experts Team(JVET)として知られるITU-T及びISO/IEC専門家の共同チームによって最近開発された。VVCは、AVC及びHEVCに当初指定されたCMメタデータの直接使用を防止する多くの新しいツール及び特徴を含む。VVCの新しいツール及び特徴は、AVC又はHEVC復号プロセスと比較して、VVC復号プロセスの複雑度を著しく増加させた。この増加した複雑度は、エネルギー消費の制御を可能にするツールの必要性を更に重要にする。
【0005】
上記問題を克服することを可能にする解決策を提案することが望ましい。とりわけ、VVCの新しいツール及び特徴を含む規格により良好に適合するCMメタデータを提案することが望ましい。
【発明の概要】
【0006】
第1の態様では、本実施形態のうちの1つ以上は、ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングすることと、ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、データ構造をビデオストリームに関連付けることであって、少なくとも1つの符号化ツール又は特徴は、ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、又は、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、又は、正方形ブロック及び矩形ブロック当たりのサンプル数に依存するエネルギー消費を表す情報に関連付けられる、ことと、を含む方法を提供する。
【0007】
一実施形態では、データ構造はSEIメッセージである。
【0008】
一実施形態では、エネルギー消費を表す情報は、複数のピクチャを含むピクチャのサブセットに応答するピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0009】
一実施形態では、メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、エントロピー復号、逆変換、イントラ予測及びイントラブロック復号、インター予測及びインターブロック復号、時間的予測の補間、ループ内フィルタリング、サブピクチャの使用のうちの少なくとも1つに関連する。
【0010】
一実施形態では、エネルギー消費を表す情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である。
【0011】
一実施形態では、第1の方法は、エネルギー消費を表す情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用され、
第2の方法は、エネルギー消費を表す情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用される。
【0012】
一実施形態では、ピクチャ内の所与のサイズのブロックの総数が、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされる。
【0013】
第2の態様では、本実施形態のうちの1つ以上は、ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについてビデオストリームに関連付けられ、ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得することであって、少なくとも1つの符号化ツール又は特徴は、ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、又は、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、又は、正方形ブロック及び矩形ブロック当たりのサンプル数に依存するエネルギー消費を表す情報に関連付けられる、こと、を含む方法を提供する。
【0014】
一実施形態では、データ構造はSEIメッセージである。
【0015】
一実施形態では、エネルギー消費を表す情報は、複数のピクチャを含むピクチャのサブセットに応答するピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0016】
一実施形態では、メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、エントロピー復号、逆変換、イントラ予測及びイントラブロック復号、インター予測及びインターブロック復号、時間的予測の補間、ループ内フィルタリング、サブピクチャの使用のうちの少なくとも1つに関連する。
【0017】
一実施形態では、エネルギー消費を表す情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である。
【0018】
一実施形態では、
第1の方法は、エネルギー消費を表す情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用され、
第2の方法は、エネルギー消費を表す情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用される。
【0019】
一実施形態では、ピクチャ内の所与のサイズのブロックの総数が、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされる。
【0020】
第3の態様では、本実施形態のうちの1つ以上は、ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングするための手段と、ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、データ構造をビデオストリームに関連付けるための手段であって、少なくとも1つの符号化ツール又は特徴は、ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、又は、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、又は、正方形ブロック及び矩形ブロック当たりのサンプル数に依存するエネルギー消費を表す情報に関連付けられる、手段と、を備えるデバイスを提供する。
【0021】
一実施形態では、データ構造はSEIメッセージである。
【0022】
一実施形態では、エネルギー消費を表す情報は、複数のピクチャを含むピクチャのサブセットに応答するピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0023】
一実施形態では、メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、エントロピー復号、逆変換、イントラ予測及びイントラブロック復号、インター予測及びインターブロック復号、時間的予測の補間、ループ内フィルタリング、サブピクチャの使用のうちの少なくとも1つに関連する。
【0024】
一実施形態では、エネルギー消費を表す情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である。
【0025】
一実施形態では、
第1の手段は、エネルギー消費を表す情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために使用され、
第2の手段は、エネルギー消費を表す情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために使用される。
【0026】
一実施形態では、ピクチャ内の所与のサイズのブロックの総数が、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされる。
【0027】
第4の態様では、本実施形態のうちの1つ以上は、ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについてビデオストリームに関連付けられ、ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得するための手段であって、少なくとも1つの符号化ツール又は特徴は、ピクチャのシーケンスに対して定義された単一の参照ピクチャサイズ、又は、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数、又は、正方形ブロック及び矩形ブロック当たりのサンプル数に依存するエネルギー消費を表す情報に関連付けられる、手段、を備えるデバイスを提供する。
【0028】
一実施形態では、データ構造はSEIメッセージである。
【0029】
一実施形態では、エネルギー消費を表す情報は、複数のピクチャを含むピクチャのサブセットに応答するピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0030】
一実施形態では、メタデータにおいてシグナリングされるピクチャ内の所与のサイズのブロックの総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、エントロピー復号、逆変換、イントラ予測及びイントラブロック復号、インター予測及びインターブロック復号、時間的予測の補間、ループ内フィルタリング、サブピクチャの使用のうちの少なくとも1つに関連する。
【0031】
一実施形態では、エネルギー消費を表す情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である。
【0032】
一実施形態では、
第1の手段は、エネルギー消費を表す情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用され、
第2の手段は、エネルギー消費を表す情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの総数を導出するために適用される。
【0033】
一実施形態では、ピクチャ内の所与のサイズのブロックの総数が、ピクチャの少なくとも1つのサブセットに対してメタデータにおいてシグナリングされる。
【0034】
第5の態様では、本実施形態のうちの1つ以上は、第3の態様又は第4の態様によるデバイスを備える装置を提供する。
【0035】
第6の態様では、本実施形態のうちの1つ以上は、第1の態様の方法によって、又は第3の態様のデバイスによって生成される信号を提供する。
【0036】
第7の態様では、本実施形態のうちの1つ以上は、第1の態様又は第2の態様による方法を実施するためのプログラムコード命令を含むコンピュータプログラムを提供する。
【0037】
第8の態様では、本実施形態のうちの1つ以上は、第1の態様又は第2の態様による方法を実施するためのプログラムコード命令を記憶する、非一時的情報記憶媒体を提供する。
【図面の簡単な説明】
【0038】
【
図1A】いくつかの実施形態が実施され得るコンテキストの一例を説明する。
【
図1B】様々な実施形態が実施され得るプロセスの一例を示す。
【
図2】元のビデオのピクセルのピクチャが受ける分割の一例を概略的に示す。
【
図3】ビデオストリームを符号化するための方法を概略的に示す。
【
図4】符号化ビデオストリームを復号するための方法を概略的に示す。
【
図5A】様々な態様及び実施形態が実施される、符号化モジュール又は復号モジュールを実装することができる処理モジュールのハードウェアアーキテクチャの一例を概略的に示す。
【
図5B】様々な態様及び実施形態が実施される第1のシステムの一例のブロック図を示す。
【
図5C】様々な態様及び実施形態が実施される第2のシステムの一例のブロック図を示す。
【
図7】様々な態様及び実施形態が実施される復号プロセスのブロック図を示す。
【
図8A】一実施形態のシグナリングプロセスの一例を示す。
【発明を実施するための形態】
【0039】
実施形態の以下の例は、VVCと同様のビデオフォーマットのコンテキストにおいて説明される。しかしながら、これらの実施形態は、VVCに対応するビデオコーディング/復号方法に限定されない。これらの実施形態は、とりわけ、AVC、HEVC、及びVVCで使用されるツール又は特徴のうちの少なくとも1つを使用する任意のビデオフォーマットに適合している。かかるフォーマットは、例えば、標準EVC(Essential Video Coding/MPEG-5)、AV1、及びVP9を含む。
【0040】
【0041】
図2は、元のビデオ20のピクセル21のピクチャが受ける分割の一例を示す。ここでは、ピクセルは、3つの成分、すなわち輝度成分と2つのクロミナンス成分からなると考えられる。しかしながら、他のタイプのピクセルは、輝度成分のみ又は追加の深度成分など、より少ない又はより多い成分を含むことが可能である。
【0042】
ピクチャは、複数のコーディングエンティティに分割される。まず、
図2の参照番号23で示すように、ピクチャがコーディングツリーユニット(coding tree unit、CTU)と呼ばれるブロックのグリッドに等分される。CTUは、輝度サンプルのN×Nブロックと、クロミナンスサンプルの2つの対応するブロックとで構成される。Nは、一般に、例えば、「128」の最大値を有する2のべき乗である。第二に、ピクチャは、CTUの1つ以上のグループに分割される。例えば、ピクチャは1つ以上のタイル行及びタイル列に分割することができ、タイルはピクチャの矩形領域をカバーするCTUのシーケンスである。場合によっては、タイルを1つ以上のブリックに分割することができ、その各々はタイル内の少なくとも1つのCTU行からなる。特定タイプのタイルは、他のタイルのサンプルからの空間的予測及び時間的予測を妨げる。これらのタイルはサブピクチャと呼ばれる。タイル及びブリックの概念の上には、ピクチャの少なくとも1つのタイル又はタイルの少なくとも1つのブリックを含むことができるスライスと呼ばれる別の符号化エンティティが存在する。
【0043】
図2の例では、参照番号22で示すように、ピクチャ21は、各々が複数のタイル(図示せず)を含むラスタスキャンスライスモードの3つのスライスS1、S2、及びS3に分割され、各タイルは、1つのブリックのみを含む。
【0044】
図1の参照番号24で示すように、CTUは、コーディングユニット(CU)と呼ばれる1つ以上のサブブロックの階層ツリーの形態に分割され得る。CTUは、階層ツリーのルート(すなわち、親ノード)であり、複数のCU(すなわち、子ノード)に分割され得る。各CUは、より小さいCUに更に分割されていない場合は階層ツリーのリーフになり、更に分割されている場合はより小さいCU(すなわち、子ノード)の親ノードになる。
【0045】
図1の例では、CTU14は、四分木タイプの分割を使用して、最初に「4」つの方形CUに分割される。左上のCUは、更に分割されていないため、階層ツリーのリーフであり、すなわち、他のCUの親ノードではない。右上のCUは、やはり四分木タイプの分割を使用して、「4」つのより小さい正方形CUに更に分割される。右下のCUは、二分木タイプの分割を使用して「2」つの矩形CUに垂直に分割される。左下のCUは、三分木タイプの分割を使用して「3」つの矩形CUに垂直に分割される。矩形CUは、AVC及びHEVCでは利用不能であったVVCの新しい特徴であることに留意されたい。
【0046】
ピクチャのコーディング中、分割は適合的であり、各CTUは、CTU基準の圧縮効率を最適化するように分割される。
【0047】
HEVCでは、予測ユニット(prediction unit、PU)及び変換ユニット(transform unit、TU)の概念が登場した。実際、HEVCでは、予測(すなわち、PU)及び変換(すなわち、TU)に使用される符号化エンティティは、CUの部分であり得る。例えば、
図1に示すように、サイズ2N×2NのCUは、サイズN×2N又はサイズ2N×NのPU 2411に分割することができる。更に、当該CUは、サイズN×Nの「4」個のTU 2412又はサイズ
【0048】
【数1】
の「16」個のTUに分割することができる。
【0049】
VVCでは、いくつかの特定の場合を除いて、TU及びPUのフロンティアがCUのフロンティアに位置合わせされることに留意されたい。したがって、CUは、一般に、1つのTU及び1つのPUを含む。
【0050】
本出願では、「ブロック」又は「ピクチャブロック」という用語は、CTU、CU、PU、及びTUのうちのいずれか1つを指すために使用することができる。更に、「ブロック」又は「ピクチャブロック」という用語は、H.264/AVC又は他のビデオ符号化規格で指定されているようなマクロブロック、パーティション、及びサブブロックを指すために使用することができ、より一般的には、多数のサイズのサンプルのアレイを指すために使用することができる。
【0051】
本出願では、「再構成された」及び「復号された」という用語は互換的に使用することができ、「ピクセル」及び「サンプル」という用語は互換的に使用することができ、「画像」、「ピクチャ」、「サブピクチャ」、「スライス」、及び「フレーム」という用語は互換的に使用することができる。通常、必ずしもそうではないが、「再構成された」という用語は、エンコーダ側で使用され、一方、「復号化された」という用語は、デコーダ側で使用される。
【0052】
図3は、符号化モジュールによって実行されるビデオストリームを符号化するための方法を概略的に示す。符号化のためのこの方法の変形例が企図されるが、以下では、明確さを目的として、予想される全ての変形例について説明することなく、
図3の符号化のための方法について説明する。
【0053】
符号化される前に、元のビデオシーケンスの現在の元の画像は、前処理を経てもよい。例えば、ステップ301において、色変換が現在の元のピクチャ(例えば、RGB4:4:4からYCbCr4:2:0への変換)に適用されるか、又は再マッピングが現在の元のピクチャ成分に適用されて、(例えば、色成分のうちの1つのヒストグラム均等化を使用して)圧縮に対してより弾力的な信号分布が得られる。加えて、前処理301は、再サンプリング(ダウンサンプリング又はアップサンプリング)を含み得る。再サンプリングは、生成されたビットストリームが元の解像度のピクチャと別の解像度のピクチャとを(又は、少なくとも2つの異なる解像度の少なくともピクチャを)含み得るように、いくつかのピクチャに適用され得る。再サンプリングは、一般的にダウンサンプリングからなり、生成されたビットストリームのビットレートを低減するために使用される。それにもかかわらず、アップサンプリングも可能である。前処理によって取得されたピクチャは、以下では前処理済みピクチャと呼ばれる。
【0054】
前処理されたピクチャを符号化することは、
図1に関連して記載したように、ステップ302中に前処理されたピクチャの分割から始まる。したがって、前処理されたピクチャは、CTU、CU、PU、TUなどに分割される。各ブロックについて、符号化モジュールは、イントラ予測とインター予測との間のコーディングモードを判定する。
【0055】
イントラ予測は、イントラ予測方法に従って、ステップ303中に、コーディングされる現在のブロックの因果的近傍に位置する再構成ブロックのピクセルから導出された予測ブロックから現在のブロックのピクセルを予測することからなる。イントラ予測の結果は、近傍のブロックのどのピクセルを使用するかを示す予測方向と、現在のブロックと予測ブロックとの差の計算から生じる残差ブロックである。最近、新しいイントラ予測モードが提案され、VVCに導入された。これらの新しいイントラ予測モードは、以下を含む。
・予測するブロックの左上の再構成された隣接境界サンプルからイントラ予測子を生成するために行列を使用することからなるMIP(行列ベースのイントラ予測、Matrix weighted Intra Prediction)。
・輝度イントラ予測ブロックを、ブロックサイズに応じて垂直又は水平に2個又は4個のサブパーティションに分割するISP(イントラサブパーティション、Intra Sub-Partition)。
・CUの彩度サンプルが、線形モデルを使用することによって同一CUの再構成された彩度サンプルに基づいて予測される、CCLM(クロスコンポーネントリニアモデル、Cross-component linear model)予測。
・同一ピクチャの別のブロックからピクチャ内のブロックを予測することからなるIBC(イントラブロックコピー、Intra Block Copy)。
・イントラ予測に使用された参照サンプルをフィルタリングすることからなる、イントラエリアにおける参照サンプルフィルタリング。
【0056】
インター予測は、現在のピクチャの前又は後のピクチャ(このピクチャは参照ピクチャと呼ばれる)のピクセルのブロック(参照ブロックと呼ばれる)から現在のブロックのピクセルを予測することからなる。インター予測方法による現在のブロックのコーディング中に、類似性基準に従って現在のブロックに最も近い参照ピクチャのブロックが、動き推定ステップ304によって判定される。ステップ304中に、参照ピクチャ内の参照ブロックの位置を示す動きベクトルが決定される。動き推定は、概して、サブピクセル精度で実行され、すなわち、現在のピクチャ及び参照ピクチャが補間される。最新のビデオ規格では、補間は、時間予測に使用される補間の位相(サブピクセル位置)に依存する。例えば、VVCの場合、補間は、位相0(サンプルがそれらの位置から直接補間される(整数ピクセル補間に対応する))に対して、又は0より大きい位相(サブピクセル補間に対応する)に対して定義される。サブピクセル補間が適用されるとき、輝度は、「15」のサブピクセル位相及び8タップ多相フィルタを使用し、彩度は、「31」のサブピクセル位相及び4タップ多相フィルタを使用する。したがって、3つのケース、すなわち、整数補間、水平又は垂直方向のサブピクセル補間、水平及び垂直方向のサブピクセル補間が考慮される。動き推定によって決定された動きベクトルは、動き補償ステップ305中に使用され、その間に残差ブロックは、現在のブロックと参照ブロックとの間の差の形態で計算される。第1のビデオ圧縮規格では、上述した一方向インター予測モードが利用可能な唯一のインターモードであった。ビデオ圧縮規格が進化するにつれて、インターモードのファミリーは著しく成長しており、現在は多くの異なるインターモードを含む。これらのインター予測モードは、例えば、以下を含む。
・双予測において、精密化された動きベクトルが各初期動きベクトルの周りで探索される、DMVR(デコーダ側の動き精密化、decoder side motion vector refinement)。精密化は、エンコーダ及びデコーダによって対称的に実行される。
・オプティカルフローの概念に基づいており、物体の動きが滑らかであることを前提とする、BDOF(双方向オプティカルフロー、bi-directional optical flow)。BDOFは、4×4サブブロックレベルでCUの双方向予測信号を精密化するために使用される。BDOFは輝度成分にのみ適用される。
・PROF(オプティカルフローを用いた予測精密化、prediction refinement with optical flow):サブブロックベースのアフィン動き補償は、予測精度ペナルティを犠牲にして、ピクセルベースの動き補償と比較して、メモリアクセス帯域幅を節約し、計算の複雑度を低減することができる。動き補償のより細かい粒度を達成するために、オプティカルフローを用いた予測精密化(PROF)が使用されて、動き補償のためにメモリアクセス帯域幅を増加させることなく、サブブロックベースのアフィン動き補償予測を精密化する。
・インター予測信号をイントラ予測信号と組み合わせる、CIIP(組み合わされたイントラ及びインター予測、Combined inter and intra prediction)。
・幾何学的に位置する直線によってCUを2つの部分に分割するGPM(幾何学的分割モード、geometric partitioning mode)。CU内の幾何学的区画の各部分は、それ自体の動きを使用してインター予測され、各区画に対して、単一予測のみが許可される。
【0057】
選択ステップ306中に、レート/歪み最適化基準(すなわち、RDO基準)に従って、試験された予測モード(例えば、イントラ予測モード、インター予測モード)の中から圧縮性能を最適化する予測モードが符号化モジュールによって選択される。
【0058】
予測モードが選択されると、残差ブロックはステップ307中に変換され、ステップ309中に量子化される。逆変換も進化しており、新しいツールが最近提案された。これらの新しいツールは以下のものを含む。
・彩度残差が一緒にコーディングされる、JCCR(彩度残差のジョイントコーディング、Joint coding of chroma residuals)。
・水平変換及び垂直変換のためにDCT-2、DST-7及びDCT-8の間で選択が行われる、MTS(複数変換選択、multiple transform selection)。
・LFNST(低周波数非分離型変換、Low-frequency non-separable transform):LFNSTは、順方向一次変換と量子化との間(エンコーダにおける)、及び逆量子化と逆方向一次変換との間(デコーダ側における)に適用される。4×4非分離型変換又は8×8非分離型変換は、ブロックサイズに従って適用される。
・BDPCM(ロック差動パルスコード化変調、Block differential pulse coded modulation)。BDPCMは、通常イントラモードの競合相手と見なされ得る。BDPCMが使用されるとき、BDPCM予測方向フラグは、予測が水平であるか垂直であるかを示すために送信される。次いで、ブロックは、フィルタリングされていない参照サンプルを用いて、通常の水平イントラ予測プロセス又は垂直イントラ予測プロセスを使用して予測される。残差は量子化され、量子化された各残差とその予測子、すなわち(BDPCM予測方向に応じて)水平又は垂直の隣接位置の前にコーディングされた残差との間の差がコーディングされる。
・残差ブロックのサブ部分のみがCUのためにコーディングされる、SBT(サブブロック変換、Subblock transform)。
【0059】
符号化モジュールは、変換をスキップして、変換されていない残差信号に量子化を直接適用することができることに留意されたい。現在のブロックがイントラ予測モードに従ってコーディングされると、予測方向と、変換され量子化された残差ブロックとは、ステップ310中にエントロピーエンコーダによって符号化される。現在のブロックがインター予測に従って符号化されると、適切な場合には、ブロックの動きベクトルは、符号化されるブロックの近くに位置する再構成されたブロックに対応する動きベクトルのセットから選択された予測ベクトルから予測される。次に、動き情報は、ステップ310中にエントロピーエンコーダによって、動き残差と予測ベクトルを識別するためのインデックスとの形態で符号化される。変換され量子化された残差ブロックは、ステップ310中にエントロピーエンコーダによって符号化される。符号化モジュールは、変換及び量子化の両方をバイパスすることができ、すなわちエントロピー符号化は、変換処理又は量子化処理を適用することなく残差に適用されることに留意されたい。エントロピー符号化の結果は、符号化ビデオストリーム311に挿入される。
【0060】
量子化ステップ309の後、現在のブロックは、当該ブロックに対応するピクセルが将来の予測に使用され得るように再構成される。この再構成段階は、予測ループとも呼ばれる。したがって、逆量子化は、ステップ312中に変換され、量子化された残差ブロックに適用され、ステップ313中に逆変換が適用される。ステップ314中に取得されたブロックに使用される予測モードによって、ブロックの予測ブロックが再構成される。現在のブロックがインター予測モードに従って符号化される場合、符号化モジュールは、適切な場合には、ステップ316中に、現在のブロックの参照ブロックを識別するために、現在のブロックの動きベクトルを使用する動き補償を適用する。現在のブロックがイントラ予測モードに従って符号化される場合、ステップ315中に、現在のブロックに対応する予測方向が、現在のブロックの参照ブロックを再構成するために使用される。再構成された現在のブロックを取得するために、参照ブロック及び再構成された残差ブロックが追加される。
【0061】
再構成後、ステップ317中に、符号化アーチファクトを低減することを意図したループ内ポストフィルタリングが、再構成ブロックに適用される。このフィルタリングは、エンコーダにおいてデコーダと同じ参照画像を取得し、したがって符号化プロセスと復号プロセスとの間のドリフトを回避するために予測ループで行われるので、ループ内ポストフィルタリングと呼ばれる。前述したように、ループ内フィルタリングツールは、デブロッキングフィルタリング、SAO(サンプル適応オフセット、Sample Adaptive Offset)、ALF(適応ループフィルタ、Adaptive Loop Filter)、及びCC-ALF(クロスコンポーネントALF、Cross Component ALF)を含む。CC-ALFは、輝度サンプル値を使用して、適応線形フィルタを輝度チャネルに適用し、次いで、このフィルタリング動作の出力を使用して彩度を精密化することによって、各彩度成分を精密化する。LMCS(クロマスケーリングを伴う彩度マッピング、Luma Mapping with Chroma Scaling)と呼ばれる新しいツールも、ループ内フィルタリングとみなされ得る。他のループフィルタの前の新たな処理ブロックとして、LMCSが追加される。LMCSは、2つの主要成分、すなわち、適応区分線形モデルに基づく輝度成分のループ内マッピングと、彩度成分に対して適用される、輝度依存彩度残差スケーリングと、を有する。
【0062】
ブロックは、再構成されると、ステップ318中に、一般に復号ピクチャバッファ(Decoded Picture Buffer、DPB)と呼ばれる、再構成画像のメモリ319に記憶された再構成されたピクチャに挿入される。そのように記憶された再構成画像は、コーディングされる他の画像の参照画像として機能することができる。
【0063】
参照ピクチャ再サンプリング(Reference Picture Resampling、RPR)と呼ばれるVVCの新しいツールは、コーディングされたピクチャの解像度をオンザフライで変更することを可能にする。ピクチャは、DPBに、ビットストリームの高レベルシンタックス(high-level syntax、HLS)でシグナリングされるビデオ空間解像度よりも低い可能性がある実際の符号化/復号解像度で記憶される。所与の解像度でコーディングされているピクチャが、時間的予測について、同じ解像度ではない参照ピクチャを使用するとき、テクスチャの参照ピクチャ再サンプリングが、予測ピクチャと参照ピクチャとが同じ解像度を有するように適用される(
図3のステップ320によって表される)。実装形態に応じて、再サンプリングプロセスは、必ずしも参照ピクチャ全体に適用されるわけではなく(参照ピクチャ全体再サンプリング)、現在ピクチャの復号及び再構成を実行するときに参照ブロックとして識別されたブロックのみに適用され得る(ブロックベース参照ピクチャ再サンプリング)ことに留意されたい。この場合、現在のピクチャ中の現在のブロックが現在のピクチャとは異なる解像度を有する参照ピクチャを使用するとき、現在のブロックの時間的予測について使用される参照ピクチャ中のサンプルは、現在のピクチャ解像度と参照ピクチャ解像度との間の比として計算された再サンプリング比に従って再サンプリングされる。
【0064】
符号化されたビデオストリーム311には、SEI(補足拡張情報、Supplemental Enhancement Information)メッセージなどのメタデータを付加することができる。例えば、AVC、HEVC、又はVVCなどの規格において定義されるSEI(補足拡張情報、Supplemental Enhancement Information)メッセージは、ビデオストリームに関連付けられ、ビデオストリームに対する情報を提供するメタデータを含むデータコンテナ又はデータ構造である。
【0065】
図4は、復号モジュールによって実行される、
図3に関連して説明された方法に従って符号化された符号化ビデオストリーム311を復号するための方法を概略的に示す。復号するためのこの方法の変形例が企図されるが、明確さを目的として、以下では予想される全ての変形例を記載することなく、
図4の復号するための方法について記載する。
【0066】
復号はブロックごとに行われる。現在のブロックの場合、復号はステップ410中に現在のブロックをエントロピー復号することから始まる。エントロピー復号は、ブロックの予測モードを取得することを可能にする。
【0067】
ブロックがインター予測モードに従って符号化されている場合、エントロピー復号は、適切な場合には、予測ベクトルインデックス、動き残差、及び残差ブロックを取得することを可能にする。ステップ408中に、予測ベクトルインデックス及び動き残差を使用して、現在のブロックに対して動きベクトルが再構成される。
【0068】
ブロックがイントラ予測モードに従って符号化されている場合、エントロピー復号は、予測方向及び残差ブロックを取得することを可能にする。復号モジュールによって実装されるステップ412、413、414、415、416及び417は、全て、符号化モジュールによって実装されるステップ412、413、414、415、416、及び417とそれぞれ同一である。ステップ418において、復号されたブロックは、復号されたピクチャに保存され、復号されたピクチャは、DPB419に記憶される。復号モジュールが所与のピクチャを復号するとき、DPB419に記憶されたピクチャは、所与のピクチャの符号化中に符号化モジュールによってDPB319に記憶されたピクチャと同一である。復号された画像はまた、例えば表示のために復号モジュールによって出力され得る。RPRが起動されると、参照ピクチャとして使用されるピクチャ(の少なくとも一部)のサンプルは、ステップ420において、予測ピクチャの解像度に再サンプリングされる。再サンプリングステップ(420)及び動き補償ステップ(416)は、いくつかの実装形態では、1つの単一サンプル補間ステップに組み合わせられ得る。
【0069】
復号された画像は更に、ステップ421において後処理を受けることができる。後処理は、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)、ステップ301の前処理において実行された再マッピングプロセスの逆を実行する逆マッピング、例えば、SEIメッセージにおいて提供されるフィルタパラメータに基づいて再構成されたピクチャを改善するためのポストフィルタリング、及び/又は、例えば、出力画像をディスプレイ制約に調整するための再サンプリングを含むことができる。
【0070】
既に上述したように、規格ISO/IEC 23001-11 Energy-Efficient Media Consumption(グリーンメタデータ)は、ビデオ配信チェーンの異なるプロセス(符号化、適応ストリーミング、復号、表示)のための複雑度情報又はメトリック(CM)をシグナリングすることを目的とするメタデータを指定する。したがって、CMは、異なる当該プロセスによって生じるエネルギー消費を表す。デコーダ側に関して、複雑度情報は、異なる復号モジュール(DM)、すなわち、エントロピー復号、逆量子化及び逆変換、イントラ予測、動き補償、デブロッキング、並びにサイド情報準備に対して与えられる。この情報は、デコーダによって使用されて、そのCPU周波数を、フレームレートデッドライン内での復号の完了を保証し、したがって潜在的に電力低減をもたらす最低周波数に設定することができる。
【0071】
既存のグリーンMPEGでは、CMは期間ごとにシグナリングされる。(シンタックス要素period_typeによって示される)期間タイプは、単一のピクチャ、ピクチャ群(group of pictures、GOP)、又は時間間隔のいずれかである。CMは以下の情報で構成される。
・それぞれ非ゼロ領域にある、8×8、16×16、及び32×32サイズのブロックの割合。この情報は、エントロピー復号、逆量子化、及び逆変換プロセスに影響を与える。
・イントラブロックの割合、及びそれらのイントラブロックについて、特定のイントラモード(平面、DC、角度水平/垂直)に従ってコーディングされているブロックの割合。この情報は、イントラブロック復号プロセスに影響を与える。
・インターブロックの場合、異なるサブサンプル位置に対して動き補償を使用するブロックの割合。この情報は、動き補償プロセスに影響を与える。
・デブロッキングフィルタリングを用いたブロックの割合。
【0072】
以下は、CMをトランスポートするためにHEVC(表TAB1)に定義されたSEIメッセージである。「portion」という語は、コーディングツール/構成の使用に関する比率がSEIメッセージでシグナリングされることを示す。これらの「使用率」は、エンコーダによって計算され、デコーダによって利用されて、そのエネルギー消費をより良好に制御する。
【0073】
【0074】
【0075】
【0076】
使用率のシグナリングは、シンタックス要素period_typeによって定義される、異なるタイプのピクチャセットに従って行われ得る。HEVCの場合、period_typeは、以下のように定義される(表TAB2)。
【0077】
【0078】
表TAB1のSEIメッセージは、AVC及びHEVCのために元来設計された。上述したように、VVCに導入される多くの新しいツール及び特徴は考慮されない。以下の様々な実施形態は、VVCにおいて採用される新しいツール及び特徴を考慮することを可能にする、表TAB1のSEIメッセージの適応を説明する。
【0079】
図1Aは、以下の実施形態が実施され得るコンテキストの例を説明する。
【0080】
図1Aでは、カメラ、記憶デバイス、コンピュータ、サーバ、又はビデオストリームを送達することができる任意のデバイスであり得る装置10は、通信チャネル11を使用して、ビデオストリームをシステム12に送信する。ビデオストリームは、装置10によって符号化され、送信されるか、又は装置10によって受信及び/又は記憶され、次いで送信される。通信チャネル11は、有線(例えば、インターネット若しくはイーサネット)又は無線(例えば、WiFi、3G、4G若しくは5G)ネットワークリンクである。
【0081】
装置10は、
図3に関連して記載された符号化方法に準拠する符号化モジュール100を備える。システム12は、例えば、復号モジュール120及びディスプレイデバイス121を備える。復号モジュール120は、
図4に関連して説明した方法に準拠している。
【0082】
図1Bは、様々な実施形態が実施され得るプロセスの例を示す。
【0083】
ステップ101において、装置10は、符号化するピクチャのシーケンスを取得する。
【0084】
ステップ102において、装置10の符号化モジュール100は、
図3の方法を適用してピクチャのシーケンスをビットストリームの形態で符号化する。符号化と並行して、符号化モジュール100は、
図3の方法によって実施される符号化ツール及び特徴に対応するCMを計算し、少なくとも1つのSEIメッセージにおいてこれらのCMをシグナリングする。
【0085】
ステップ103において、装置10は、少なくとも1つのSEIメッセージをビットストリームに関連付け、ビットストリーム及び関連付けたSEIメッセージをシステム12に送信する。SEIメッセージは、例えば、VVC NAL(ネットワーク抽象化レイヤ、Network Abstraction Layer)ユニットでトランスポートされる。
【0086】
ステップ104において、システム12はビットストリームを受信する。
【0087】
ステップ105において、復号モジュール120は、SEIメッセージをトランスポートするVVC NALユニットを認識し、SEIメッセージを復号し、CMを取得する。
【0088】
ステップ106において、復号モジュール120は、復号したCMに応じてその復号パラメータを調整する。例えば、そのCPU周波数を、リアルタイムでのピクチャの復号を可能にする最小値に調整する。
【0089】
ステップ107において、復号モジュール120は、その調整したパラメータを用いて、ピクチャを復号する。
【0090】
図5Aは、異なる態様及び実施形態、又は装置10に関連した、若しくはシステム12に関連した
図1Bのプロセスの部分に従って修正された
図3の符号化方法及び
図4の復号方法をそれぞれ実施することができる符号化モジュール100又は復号モジュール120を実装することができる処理モジュール500のハードウェアアーキテクチャの一例を概略的に示す。処理モジュール500は、非限定的な例として、通信バス5005によって接続された、1つ以上のマイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサを包含するプロセッサ又はCPU(中央処理ユニット)5000と、ランダムアクセスメモリ(random access memory、RAM)5001と、リードオンリーメモリ(read only memory、ROM)5002と、電気的消去可能プログラマブルリードオンリーメモリ(Electrically Erasable Programmable Read-Only Memory、EEPROM)、リードオンリーメモリ(ROM)、プログラマブルリードオンリーメモリ(Programmable Read-Only Memory、PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(Dynamic Random Access Memory、DRAM)、スタティックランダムアクセスメモリ(Static Random Access Memory、SRAM)、フラッシュ、磁気ディスクドライブ、並びに/又は光ディスクドライブ、又は、SD(セキュアデジタル、secure digital)カードリーダ及び/若しくはハードディスクドライブ(hard disc drive、HDD)などの記憶媒体リーダ及び/若しくはネットワークアクセス可能な記憶デバイスを含むがこれらに限定されない不揮発性メモリ及び/若しくは揮発性メモリを含むことができる記憶ユニット5003と、データを他のモジュール、デバイス、又は機器と交換するための少なくとも1つの通信インターフェース5004と、を備える。通信インターフェース5004は、通信チャネルを介してデータを送信及び受信するように構成された送受信機を含むことができるが、それに限定されない。通信インターフェース5004は、モデム又はネットワークカードを含むことができるが、これらに限定されない。
【0091】
処理モジュール500が復号モジュールを実装する場合、通信インターフェース5004は、例えば、処理モジュール500が、符号化されたビデオストリーム及び/又はSEIメッセージを受信し、SEIメッセージに基づいて復号されたピクチャのシーケンスを提供することを可能にする。処理モジュール500が符号化モジュールを実装する場合、通信インターフェース5004は、例えば、処理モジュール500が元のピクチャデータのシーケンスを受信して符号化し、符号化したビデオストリーム及び関連するSEIメッセージを提供することを可能にする。
【0092】
プロセッサ5000は、ROM5002、外部メモリ(図示せず)、記憶媒体、又は通信ネットワークからRAM5001にロードされた命令を実行することができる。処理モジュール500の電源が投入されると、プロセッサ5000は、RAM5001から命令を読み出し、それらを実行することができる。これらの命令は、例えば、
図4に関連して説明した復号方法、又は
図3に関連して説明した符号化方法のプロセッサ5000、又は
図1Bに関連して説明したプロセスの一部によって実施させるコンピュータプログラムを形成し、復号方法及び符号化方法は、本明細書において後述する様々な態様及び実施形態を含む。
【0093】
符号化又は復号方法のアルゴリズム及びステップの全て又は一部は、DSP(デジタル信号プロセッサ、digital signal processor)又はマイクロコントローラなどのプログラマブルマシンによる命令セットの実行によってソフトウェア形式で実装されてもよく、又はFPGA(フィールドプログラマブルゲートアレイ、field-programmable gate array)又はASIC(特定用途向け集積回路、application-specific integrated circuit)などのマシン又は専用コンポーネントによってハードウェア形式で実装されてもよい。
【0094】
図5Cは、様々な態様及び実施形態が実装されているシステム12の一例のブロック図を図示する。システム12は、後述する様々な構成要素を含むデバイスとして具現化することができ、本明細書に記載の態様及び実施形態のうちの1つ以上を実行するように構成されている。このようなデバイスの例としては、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続型家電、及びヘッドマウントディスプレイなどの様々な電子デバイスが挙げられるが、これらに限定されない。システム12の要素は、単独で又は組み合わせて、1つの集積回路(integrated circuit、IC)、複数のIC、及び/又は別個の構成要素に具現化することができる。例えば、少なくとも1つの実施形態では、システム12は、復号モジュールを実装する1つの処理モジュール500を備える。様々な実施形態では、システム12は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通して、1つ以上の他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム12は、本明細書に記載される態様のうちの1つ以上を実装するように構成されている。
【0095】
処理モジュール500への入力は、ブロック531に示すように様々な入力モジュールを介して提供することができる。そのような入力モジュールとしては、限定するものではないが、(i)例えば、放送局から無線で送信されるRF信号を受信する無線周波数(RF)モジュール、(ii)構成要素(COMP)入力モジュール(又はCOMP入力モジュールのセット)、(iii)ユニバーサルシリアルバス(USB)入力モジュール、及び/又は(iv)高精細度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力モジュールが挙げられる。他の実施例には、
図5Cには示されていないが、コンポジットビデオが含まれる。
【0096】
様々な実施形態では、ブロック531の入力モジュールは、当技術分野で既知のように、関連するそれぞれの入力処理要素を有する。例えば、RFモジュールは、(i)所望の周波数を選択する(信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバート及び帯域制限された信号を復調する、(v)誤り訂正を実施する、及び(vi)データパケットの所望のストリームを選択するために多重分離する、ために適切な要素と関連付けられ得る。様々な実施形態のRFモジュールは、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、例えば、受信信号をより低い周波数(例えば、中間周波数又はベースバンドに近い周波数)又はベースバンドにダウンコンバートすることを含む、これらの機能のうちの様々な機能を実行するチューナを含むことができる。セットトップボックスの一実施形態では、RFモジュール及びその関連する入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されるRF信号を受信し、所望の周波数帯域にフィルタリング、ダウンコンバート、及び再フィルタリングすることによって周波数選択を実行する。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、例えば、増幅器及びアナログ-デジタル変換器を挿入するなど、既存の要素間に要素を挿入することを含み得る。様々な実施形態において、RFモジュールは、アンテナを含む。
【0097】
追加的に、USBモジュール及び/又はHDMIモジュールは、システム12をUSB接続及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理、例えばリードソロモン誤り訂正の様々な態様は、例えば、別個の入力処理IC内又は必要に応じて処理モジュール500内で実施することができることを理解すべきである。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて別個のインターフェースIC内又は処理モジュール500内で実施され得る。復調され、誤り訂正され、逆多重化されたストリームは、処理モジュール500に提供される。
【0098】
システム12の様々な要素は、一体型ハウジング内に設けることができる。一体型ハウジング内で、様々な要素は、適切な接続配置、例えば、IC間(I2C)バス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して、相互接続され、それらの間でデータを送信し得る。例えば、システム12において、処理モジュール500は、バス5005によって当該システム12の他の要素に相互接続される。
【0099】
処理モジュール500の通信インターフェース5004は、システム12が通信チャネル11上で通信することを可能にする。上記で既に説明したように、通信チャネル11は、例えば、有線及び/又は無線媒体内に実装することができる。
【0100】
データは、様々な実施形態では、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などの無線ネットワークを使用して、システム12にストリーミングされるか、又は別様に提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合している通信チャネル11及び通信インターフェース5004上で受信される。これらの実施形態の通信チャネル11は、典型的に、ストリーミングアプリケーション及び他のオーバザトップ通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック531のRF接続を使用して、システム12にストリーミングデータを提供する。上で示されるように、様々な実施形態は、データを非ストリーミングの様式で提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用する。
【0101】
システム12は、ディスプレイシステム55、スピーカ56、及び他の周辺デバイス57を含む様々な出力デバイスに出力信号を提供することができる。様々な実施形態のディスプレイシステム55は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(organic light-emitting diode、OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み可能なディスプレイのうちの1つ以上を含む。ディスプレイ55は、テレビジョン、タブレット、ラップトップ、携帯電話(移動電話)、ヘッドマウントディスプレイ、又は他のデバイス用とすることができる。ディスプレイシステム55はまた、
図1Aでのように他の構成要素と統合され得るか(例えば、スマートフォンのように)、又は別個に(例えば、ラップトップ用外部モニタ)され得る。他の周辺デバイス57としては、実施形態の様々な実施例において、スタンドアロンデジタルビデオディスク(又はデジタル多用途ディスク)(両方の用語について、digital versatile disc、DVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システム、のうちの1つ以上が挙げられる。様々な実施形態は、システム12の出力に基づいて機能を提供する1つ以上の周辺デバイス57を使用する。例えば、ディスクプレーヤは、システム12の出力を再生する機能を実行する。
【0102】
様々な実施形態では、制御信号が、システム12と、ディスプレイシステム55、スピーカ56、又は他の周辺デバイス57との間で、AV.Link、家庭用電子制御(Consumer Electronics Control、CEC)、又はユーザ介入の有無にかかわらずデバイス間の制御を可能にする他の通信プロトコルなどのシグナリングを使用して通信される。出力デバイスは、それぞれのインターフェース532、533、及び534を通した専用接続を介してシステム12に通信可能に結合することができる。代替的に、出力デバイスは、通信インターフェース5004を介して通信チャネル11を使用して、又は通信インターフェース5004を介して専用通信チャネルを使用して、システム12に接続することができる。ディスプレイシステム55及びスピーカ56は、例えば、テレビなどの電子デバイスにおいてシステム12の他の構成要素と1つのユニットに一体化され得る。様々な実施形態において、ディスプレイインターフェース532は、例えば、タイミングコントローラ(timing controller、T Con)チップなどのディスプレイドライバを含む。
【0103】
ディスプレイシステム55及びスピーカ56は、代替的に、他の構成要素のうちの1つ以上から分離することができる。ディスプレイシステム55及びスピーカ56が外部構成要素である様々な実施形態では、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して出力信号を提供することができる。
【0104】
図5Bは、様々な態様及び実施形態が実装されているシステム10の一例のブロック図を示す。装置10は、システム12と非常に類似している。装置10は、後述する様々な構成要素を含むデバイスとして具現化することができ、本明細書に記載の態様及び実施形態のうちの1つ以上を実行するように構成されている。そのようなデバイスの例としては、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、カメラ及びサーバなどの様々な電子デバイスが挙げられるが、これらに限定されない。装置10の要素は、単独で又は組み合わせて、1つの集積回路(IC)、複数のIC、及び/又は別個の構成要素に具現化することができる。例えば、少なくとも1つの実施形態では、装置10は、符号化モジュールを実装する1つの処理モジュール500を備える。様々な実施形態では、システム10は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通して、1つ以上の他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施形態では、装置10は、本明細書に記載の態様のうちの1つ以上を実施するように構成されている。
【0105】
処理モジュール500への入力は、既に
図5Cに関して説明したブロック531に示すように様々な入力モジュールを介して提供することができる。
【0106】
装置10の様々な要素は、一体型ハウジング内に設けることができる。一体型ハウジング内で、様々な要素は、適切な接続配置、例えば、IC間(I2C)バス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して、相互接続され、それらの間でデータを送信し得る。例えば、装置10において、処理モジュール500は、バス5005によって当該装置10の他の要素に相互接続される。
【0107】
処理モジュール500の通信インターフェース5004は、システム500が通信チャネル11上で通信することを可能にする。
【0108】
データは、様々な実施形態では、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などの無線ネットワークを使用して、装置10にストリーミングされるか、又は別様に提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合している通信チャネル11及び通信インターフェース5004上で受信される。これらの実施形態の通信チャネル11は、典型的に、ストリーミングアプリケーション及び他のオーバザトップ通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態は、入力ブロック531のRF接続を使用して、装置10にストリーミングデータを提供する。
【0109】
上で示されるように、様々な実施形態は、データを非ストリーミングの様式で提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用する。
【0110】
提供されるデータは、装置10に接続された又は装置10に含まれるピクチャ及び/又は音声取得モジュールによって提供される生データである。
【0111】
装置10は、システム12などの出力信号を記憶及び/又は復号することができる様々な出力デバイスに出力信号を提供することができる。
【0112】
様々な実装形態は、復号化することを含む。本出願で使用される場合、「復号」は、例えば、ディスプレイに適した最終出力を生成するために、受信された符号化されたビデオストリームに対して実行されるプロセスの全て又は一部を包含し得る。様々な実施形態において、このような処理は、例えば、エントロピー復号、逆量子化、逆変換、及び予測など、デコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態では、かかるプロセスにはまた、若しくは代替的に、例えば、復号を実行するためのCPU周波数を決定するために、本出願に記載の様々な実装形態のデコーダによって実施されるプロセスも含まれる。
【0113】
「符号化プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0114】
様々な実装形態は、符号化を伴う。「復号」に関する上記の考察と同様に、本出願で使用される場合、「符号化」は、例えば、符号化されたビデオストリームを生成するために入力ビデオシーケンスで実行されるプロセスの全部又は一部を包含し得る。様々な実施形態において、このような処理は、例えば、分割、予測、変換、量子化、及びエントロピー符号化など、エンコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態において、このような処理は、これらに加えて、又は代替的に、例えば、CMを含むSEIメッセージを生成するために、本願に記載の様々な実装形態のエンコーダによって実行されるプロセスを含む。
【0115】
「符号化プロセス」という句が、具体的に作業部分集合を指すこと目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0116】
本明細書で使用されるシンタックス要素名は、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
【0117】
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
【0118】
本明細書に記載の実装形態及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて装置を実装することができる。方法は、例えば、プロセッサにおいて実装することができ、プロセッサは、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイスを含む一般的な処理デバイスを指す。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル/携帯情報端末(「Personal Digital Assistant、PDA」)などのデバイスなどの通信デバイスも含まれる。
【0119】
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、またそれらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、また他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
【0120】
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、メモリから情報を取得すること、又は、例えば、別のデバイス、モジュール若しくはユーザから情報を取得することのうちの1つ以上を含むことができる。
【0121】
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
【0122】
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信すること」は、一般には、例えば、情報を記憶する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
【0123】
「/」、「及び/又は」、「のうちの少なくとも1つ」、「1つ以上」のいずれかの使用、例えば、「A/B」、「A及び/又はB」、「A及びBのうちの少なくとも1つ」、「A及びBの1つ以上」の場合、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することを意図しているものと理解されたい。更なる例として、「A、B、及び/又はC」及び「A、B、及びCのうちの少なくとも1つ」、「A、B及びCのうちの1つ以上」の場合、このような句は、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は3番目にリストされた選択肢(C)のみの選択、又は、最初及び2番目にリストされた選択肢(A及びB)のみの選択、又は、最初及び3番目にリストされた選択肢(A及びC)のみの選択、又は、2番目及び3番目にリストされた選択肢(B及びC)のみの選択、又は3つの選択肢(A及びB及びC)全ての選択を包含するように意図されている。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
【0124】
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、いくつかのコーディングツールの使用をシグナリングする。このようにして、実施形態では、エンコーダ側とデコーダ側の両方で、同じパラメータを使用することができる。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。これに対し、デコーダがすでにその特定のパラメータと共に他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
【0125】
当業者には明白であるように、実装形態は、例えば、格納され得る、又は送信され得る情報を搬送するようにフォーマットされた様々な信号をもたらすことができる。情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、説明されている実施形態の符号化されたビデオストリーム及びSEIメッセージを伝えるように信号をフォーマットすることができる。例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、又はベースバンド信号として、このような信号をフォーマットすることができる。フォーマットすることは、例えば、符号化されたビデオストリームを符号化すること、及び符号化ビデオストリームで搬送波を変調することを含むことができる。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報とすることができる。既知であるように、様々な異なる有線リンク又は無線リンク上で信号を送信することができる。信号は、プロセッサ可読媒体に格納することができる。
【0126】
第1の実施形態は、グリーンMPEGメタデータにおいてRPRに適合するCMを提供することに焦点を合わせる。
【0127】
既存のグリーンMPEGでは、AVC及びHEVCに対して定義された多くのシンタックス要素は、ピクチャヘッダ(ピクチャパラメータセット(picture parameter set、PPS))内でシグナリングされるサイズを参照するシーケンスにわたって一定であるピクチャサイズに基づいている。異なるコーディングモードの使用率は、このピクチャサイズに対して示される。これは、例えば、グリーンMPEG規格においてパラメータTotalNum4x4BlocksInPeriodによって定義される、ある期間に処理される4×4ブロックの総数を決定するために使用される。
【0128】
加えて、いくつかのモードm1~mNをサポートするいくつかのデコーダの特徴では、使用率は、概して、モードm1からmN-1について報告され、モードmNの使用率は、他の使用率からratio_mN=255-ratio_m1-...-ratio_mN-1として推定される(使用率は、100%の使用率に対応する255の振幅を使用して固定小数点で表される)。
【0129】
RPRで許容されるピクチャサイズの変動に起因して、既存のグリーンMPEGの様々なモードの使用率を報告する方法は、もはやVVCに適合しない。
【0130】
第1の実施形態の第1の変形例では、復号ピクチャサイズを使用する代わりに、パラメータsps_pic_width_max_in_luma_samples及びsps_pic_height_max_in_luma_samplesを用いて、例えば、シーケンスヘッダ(シーケンスパラメータセット、Sequence Parameter Set(SPS))においてシグナリングされるビットストリームの最大ピクチャサイズを参照ピクチャサイズとして考慮することによって、様々な使用率が定義される。様々な使用率(すなわち、CM=エネルギー消費を表す情報)は、シーケンスヘッダ(すなわち、SPS)内のピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0131】
参照ピクチャサイズは、以下のように定義されるパラメータmaxPicSizeInCtbsYによって定義される。
maxPicSizeInCtbsY=maxPicWidthInCtbsY*maxPicHeightInCtbsY
maxPicWidthInCtbsY及びmaxPicheightInCtbsYは以下のように定義される。
【0132】
maxPicWidthInCtbsY=(sps_pic_width_max_in_luma_samples+CtbSizeY-1)/CtbSizeY
maxPicHeightInCtbsY=(sps_pic_height_max_in_luma_samples+CtbSizeY-1)/CtbSizeY
式中、CtbSizeYは、輝度コーディングツリーブロックのサイズ(最大ブロックサイズ)として定義される。
【0133】
結果として、例えば、いくつかのピクチャのうちの1つが、SPSにおいてシグナリングされる最大ピクチャ解像度でコーディングされない場合、特徴の異なるモードの使用率の合計は、255(100%)よりも低くなり得る。結果の1つは、特徴の全モードの使用率が明示的に報告されることである。実際、そのような場合、あるモードの使用率を他のモードから推定することはできない。上述の例では、使用率は、AVC及びHEVCについて既存のグリーンMPEG規格で行われたように、モードm1~mN-1についてではなく、全モードm1~mNについて指定される。
【0134】
既存のグリーンMPEG規格で定義されたパラメータTotalNum4x4BlocksPicの例を参照すると、第1の実施形態の第1の変形例では、パラメータTotalNum4x4BlocksPicは、以下のように導出される。
TotalNum4x4BlocksPic=maxPicSizeInCtbsY*(1<<(CtbLog2SizeY-2))2
式中、CtbLog2SizeYは、CTBサイズのlog2を定義する(例えば、CTBサイズ16×16では2に等しく、CTBサイズ32×32では3に等しく、CTBサイズ64×64では4に等しく、CTBサイズ128×128では5に等しい)。代替的に、変数は、16個のサンプルを含むブロックを参照して改名されたTotalNum16BlocksPicであり得る。
【0135】
図6に示される第1の実施形態の第2の変形例は、処理モジュール500が復号モジュール120を実装するときに、処理モジュール500によって実施される。
【0136】
ステップ600において、処理モジュール500は、シンタックス要素period_typeが、単一のピクチャに対して使用の(すなわち、CMの)報告が行われることを示すか否かを判定する。
【0137】
使用の報告が単一のピクチャに対して行われることを示すシンタックス要素period_typeが使用される場合、ステップ602において、処理モジュール500は、PPSでシグナリングされた復号ピクチャサイズの使用を指定する(例えば、パラメータTotalNum4x4BlocksPicを計算するために)。
【0138】
使用の報告がいくつかのピクチャに対して行われることを示すシンタックス要素period_typeが使用される場合、ステップ601において、処理モジュールは、SPSでシグナリングされた最大ピクチャサイズの使用を指定する(例えば、パラメータTotalNum4x4BlocksPicを計算するために)。この第2の変形例は、使用率の報告に最大精度を維持することを可能にする。
【0139】
この第2の変形例では、様々な使用率(すなわち、CMS=エネルギー消費を表す情報)は、様々な使用率がいくつかのピクチャに対してシグナリングされる場合に、シーケンスヘッダ(すなわち、SPS)内のピクチャのシーケンスに対して定義された、単一の参照ピクチャサイズに依存する。
【0140】
第1の実施形態の第3の変形例では、4×4ブロックの総数TotalNum4x4BlocksInPeriodは、シンタックス要素total_number_4x4_blocks_in_periodによってSEIメッセージで明示的にシグナリングされる。したがって、検討期間内の異なるピクチャのピクチャサイズをチェックする必要はなく、期間は、ビデオストリームの連続ピクチャのサブセットとして定義される。
【0141】
4×4ブロックの総数TotalNum4x4BlocksInPeriodがそのままコーディングされる場合、「26」ビットは、8Kピクチャについて、及び「128」ピクチャの1セグメントについて(典型的には「120」fpsビデオについて)その値を示すのに十分な大きさであると考えられる。したがって、バイトアライメントを更に容易にするためには、シンタックス要素total_number_4x4_blocks_in_periodに対して「32」ビットが推奨される。
【0142】
より少ないビットを使用することが好ましい場合には、「16」ビットに減らすことができる。このような場合、4×4ブロックの総数の値TotalNum4x4BlocksInPeriodを、例えば係数「1024」(210)によって量子化することが可能であり、4×4ブロックの実際の総数は、以下のとおりである。
TotalNum4x4BlocksInPeriod=1024*total_number_4x4_blocks_in_period。
【0143】
別の変形例では、「32」ビットを超える4×4ブロックの総数TotalNum4x4BlocksInPeriodの値が大きすぎることを回避するために、シンタックス要素total_number_4x4_blocks_in_periodは、以下の値に設定される。
・period_typeが2であるときにCMが適用可能である秒数を示すSEIメッセージのシンタックス要素num_secondsが所与の閾値numSecondsMax(典型的にはnumSecondsMax=1)よりも大きい場合は、閾値numSecondsMaxに依存する値、又は、
・period_typeが3であるときに複雑度メトリックが適用可能である、復号順序でカウントされたピクチャの数を指定するSEIメッセージのシンタックス要素num_picturesが、所与の閾値numPicturesMax(通常、コーディングされるビデオコンテンツの1秒当たりのフレーム数に設定)よりも大きい場合は、閾値numPicturesMaxに依存する値。
【0144】
これにより、シンタックス要素total_number_4x4_blocks_in_periodのセマンティック(以下では太字)は以下のようになる。
total_number_4x4_blocks_in_periodは、指定期間にコーディングされる4×4ブロック(又は16個のサンプルを含むブロック)の総数を指定する。パラメータTotalNum4x4BlocksInPeriodは、以下のように導出される。
●TotalNum4x4BlocksInPeriodは、total_number_4x4_blocks_in_periodに等しく設定される。
●以下の条件が真である場合、TotalNum4x4BlocksInPeriodは、(num_secondsxTotalNum4x4BlocksInPeriod+numSecondsMax/2)/numSecondsMaxに等しく設定される。
○period_typeは、「2」に等しい。
○num_secondsは、numSecondsMaxよりも大きい。
●以下の条件が真である場合、TotalNum4x4BlocksInPeriodは、(num_picturesxTotalNum4x4BlocksInPeriod+numPicturesMax/2)/numPicturesMaxに等しく設定される。
○period_typeは、「3」に等しい。
○num_picturesは、numPicturesMaxよりも大きい。
【0145】
一変形例は、4×4又は16個のサンプルよりも小さいサイズのブロックが、参照サイズと見なされる。例えば、参照サイズは2×2であり、これは彩度ブロックの最小サイズである。次いで、対応するシンタックス要素は、TotalNum2x2BlocksInPeriodとして定義される。しかしながら、4個のサンプルのブロックは全体として割合が小さく、全体的なデコーダの複雑度には著しい影響を与えないと一般に考えられている。加えて、それらはカウントされ、ブロック4×4の数に加算され得、それらのそれぞれは、この番号付けに1/4=0.25として寄与する。同一の概念が、4×4又は16個のサンプルよりも小さい他のブロックサイズに適用され得る。
【0146】
第2の実施形態は、グリーンMPEGメタデータの矩形ブロックに適合するCMを提供することに焦点を合わせる。
【0147】
所与のシンタックス要素によって報告される所与のモードの使用率(すなわち、CMS=エネルギー消費を表す情報)は、場合によっては、モードを使用する全ての様々なブロックサイズの使用率の連鎖に基づいている。VVCブロックは矩形であり得るので、既存のグリーンMPEG規格で行われるように正方形ブロックの幅/高さを考慮するのではなく、正方形ブロック及び矩形ブロック当たりのサンプル数を考慮することが好ましい。例えば、4×4~64×64のブロックサイズでは、AVC及びHEVCに対するグリーンMPEG規格で現在行われているようにブロック4×4、8×8、16×16、32×32、64×64の使用を追加するのではなく、これらのサイズが関連する場合、合計は、サンプル数が16、32、64、128、256、512、1024、2048、4096であるブロックについて追加されるべきである。
【0148】
VVCでは、タイプ「0」(DCT-IIに対応する)、タイプ「1」(DST-VIIに対応する)、タイプ「2」(DCT-VIIIに対応する)の「3」つの変換タイプがサポートされている。所与のブロックについて、タイプ「0」が水平次元及び垂直次元の両方での変換に使用されるか、又はタイプ「1」及び「2」が水平次元及び垂直次元の両方での変換に一緒に使用され得る。タイプ「0」変換は、バタフライ実装など高速実装を使用して実装され得る。一方、タイプ「1」及び「2」は、かかるソリューションを使用して実装することができず、変換のサイズの行列乗算を伴う。この第2の実施形態を示すテキスト仕様の一例が、変換タイプ「0」の使用に関して(太字で)以下に提供される。変換タイプ「1」及び「2」に対して同等のテキスト仕様を使用することができる。
portion_trtype0_blocks_areaは、4×4粒度を使用して、指定期間のピクチャにおいてタイプ「0」の変換を使用するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0149】
【数2】
NumTrType0Blocksは、4×4粒度を使用して、指定期間にタイプ0の変換を使用するブロックの数である。エンコーダ側では、以下のように計算される。
【0150】
【数3】
式中、NumTrType0_XBlocksは、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、変換タイプ「0」を使用するブロックの数である。式中の係数2、4、...、256は、サイズ16のブロックに対するブロックサイズ比に対応する。例えば、サイズ32のブロック(NumTrType0_32 Blocks)の場合、係数は32/16=2である。サイズ4096のブロック(NumTrType0_4096Blocks)の場合、係数は4096/16=256である。
【0151】
例えば、エンコーダがNumTrType0_8Blocks及びNumTrType0_4Blocksを「8」サンプル及び「4」サンプルを含むブロック数として導出する場合、NumTrType0Blocksは、NumTrType0_8Blocks/2又は(NumTrType0_8Blocks+1)/2によって、及びNumTrType0_4Blocks/4又は(NumTrType0_4Blocks+2)/4によってインクリメントされ得る。
【0152】
第3の実施形態は、グリーンMPEGメタデータにおけるエントロピー復号の複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0153】
この第3の実施形態では、異なる正方形ブロックサイズについて、非ゼロブロックの量に関連するAVC及びHEVCに指定されたシンタックス要素が、異なるサンプル数の正方形ブロック及び矩形ブロックについてシグナリングされる。新しいシンタックス要素portion_X_blocks_in_non_zero_areaが追加され、Xは、ブロック中のサンプルの数である(式中、X=16、32、64、128、256、512、1024、2048、及び4096)。X=4096である最後の値は、VVCにおいて定義される64×64の最大変換単位サイズに等しいサイズを有するブロックを考慮するために導入されることに留意されたい。
【0154】
残差ブロックのサブ部分のみが符号化され、残りのサブ部分がゼロに設定されるSBTモードはまた、エントロピー復号化に直接的な影響を有する。したがって、SBTモードに関連する新しいシンタックス要素portion_sbt_blocks_in_non_zero_areaが追加される。シンタックス要素portion_sbt_blocks_in_non_zero_areaは、サブブロック変換(SBT)モードの相対的使用を示す。
【0155】
第4の実施形態は、グリーンMPEGメタデータにおける逆変換の複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0156】
VVCでは、いくつかの新しいツール、すなわちJCCR、MTS、LFNST、及びBDPCMが逆変換の複雑度に影響を与える。第4の実施形態では、これらの新しいツールに対処するために新しいシンタックス要素が定義される。
・portion_jccr_blocks_area:この新しいシンタックス要素は、JCCRモードの相対的使用を示すために追加される。
・portion_trtype0_blocks_area:この新しい要素は、MTSツールにおける変換タイプ0(DCT2)の相対的使用を示すために追加される;。
・portion_trtype1_2_blocks_area:このシンタックスの新しい要素は、MTSツールにおける変換タイプ「1」又は「2」(それぞれDST7又はDCT8)の相対的使用を示すために追加される。
・portion_lfnst_blocks_area:この新しいシンタックス要素は、LFNSTツールの相対的使用を示すために追加される。サイズ16×16及び48×16のLFNSTを使用してピクチャ内の面積をカウントする。
・portion_bdpcm_blocks_area:この新しいシンタックス要素は、BDPCMモードの相対的使用を示すために追加される。
【0157】
第5の実施形態は、グリーンMPEGメタデータにおけるイントラ予測及びイントラブロック復号の複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0158】
イントラエリアにおけるMIP、ISP、CCLM、IBC及び参照サンプルフィルタリングなど新しいイントラ予測ツールは、復号の複雑度に影響を与える。第5の実施形態では、これらの新しいツールに対処するために新しいシンタックス要素が定義される。
・portion_mip_blocks_in_intra_area:この新しいシンタックス要素は、MIPモードの相対的使用を示すために追加される。
・portion_isp_blocks_in_intra_area:この新しいシンタックス要素は、ISPモードの相対的使用を示すために追加される。
・portion_cclm_blocks_in_intra_area:この新しいシンタックス要素は、CCLMモードの相対的使用を示すために追加される。
・portion_ibc_blocks_in_intra_area:この新しいシンタックス要素は、IBCモードの相対的使用を示すために追加される。
・ref_samples_filtering_in_intra_area:この新しいシンタックス要素は、イントラ予測における参照サンプルフィルタリングモードの相対的使用を示すために追加される。
【0159】
一変形例では、MIPはブロックサイズに応じて異なるサイズの行列を使用するので、異なるブロックサイズに対してシンタックス要素portion_mip_blocks_in_intra_areaを報告することができる。例えば、以下のシンタックス要素を導入することができる。
・16x4ブロックに対してportion_mip16x4_blocks_in_intra_area、
・16x8ブロックに対してportion_mip16x8_blocks_in_intra_area、
・64x8ブロックに対してportion_mip64x8_blocks_in_intra_area。
【0160】
代替的に、シンタックス要素portion_mip_blocks_in_intra_areaの値は、以下のように、異なるブロックサイズのパラメータNumMipCodedBlocksから計算され得る。
【0161】
【0162】
係数「4」及び「8」は、サイズ「16」のブロックに対するブロックサイズ比に対応する。例えば、サイズ16×4のブロック(NumMipCoded_16x4Blocks)の場合、係数は16×4/16=4である。サイズ16×4のブロック(NumMipCoded_16x8Blocks)の場合、係数は16×8/16=8である。エンコーダは、NumMipCodedBlocksの値を計算し、portion_mip_blocks_in_intra_areaをNumMipCodedBlocksに等しく設定し、ストリーム内でportion_mip_blocks_in_intra_areaをシグナリングする。
【0163】
第6の実施形態は、グリーンMPEGメタデータにおけるインター予測及びインターブロック復号の複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0164】
インター予測の複雑度に影響を与える1つの特徴は、ブロックが単方向予測又は双方向予測を使用して予測されるという事実である。この情報はデコーダの複雑度に重要な影響を及ぼすが、既存のグリーンMPEG規格では(すなわち、AVC及びHEVCに対して)報告されていない。
【0165】
第6の実施形態では、この特徴に対処するために新しいシンタックス要素が定義される。
・portion_uni_predicted_blocks_area:この新しいシンタックス要素は、インター予測における単方向予測の相対的使用を示すために追加される。
・portion_bi_predicted_blocks_area:この新しいシンタックス要素は、インター予測における双方向予測の相対的使用を示すために追加される。
【0166】
加えて、新しいインター予測モードはまた、復号の複雑度に影響を与える。第7の実施形態では、これらの新しいモードに対処するために新しいシンタックス要素が定義される。
・portion_dmvr_blocks:この新しいシンタックス要素は、DMVRモードの相対的使用を示すために追加される。
・portion_bdof_blocks:この新しいシンタックス要素は、BDOFモードの相対的使用を示すために追加される。
・portion_prof_blocks:この新しいシンタックス要素は、PROFモードの相対的使用を示すために追加される。
・portion_ciip_blocks_area:この新しいシンタックス要素は、CIIPモードの相対的使用を示すために追加される。
・portion_gpm_blocks_area:この新しいシンタックス要素は、GPMモードの相対的使用を示すために追加される。
【0167】
第7の実施形態は、グリーンMPEGメタデータにおける時間的予測の補間の複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0168】
上述したように、動き推定は概して、ピクチャの補間を必要とするサブピクセル精度で実行される。第7の実施形態では、3つの可能な補間ケース、すなわち、整数補間、水平方向又は垂直方向のサブピクセル補間、水平方向及び垂直方向のサブピクセル補間を考慮するために、3つのシンタックス要素が定義される。
・portion_integer_interpolation_blocks:この新しいシンタックス要素は、動き補償のための整数ピクセル補間の相対的使用を示すために追加される。
・portion_hor_or_ver_interpolation_blocks:この新しいシンタックス要素は、動き補償のための水平方向又は垂直方向のうちの1つでのサブピクセル補間の相対的使用を示すために追加される。
・portion_hor_and_ver_interpolation_blocks:この新しいシンタックス要素は、動き補償のための水平方向及び垂直方向でのサブピクセル補間の相対的使用を示すために追加される。
【0169】
第8の実施形態は、グリーンMPEGメタデータにおけるループ内フィルタリングの複雑度に影響を与える新しい特徴に適合するCMを提供することに焦点を合わせる。
【0170】
VVCでは、3つの新しいループ内フィルタリングツール、すなわちALF、CCALF、及びLMCSが導入された。第8の実施形態では、これらの3つのツールを考慮するために3つのシンタックス要素が定義される。
・portion_alf_instances:この新しいシンタックス要素は、ALFモードの相対的使用を示すために追加される。
・portion_ccalf_instances:この新しいシンタックス要素は、CCALFモードの相対的使用を示すために追加される。
・portion_lmcs_instances:この新しい要素は、LMCSモードの相対的使用を示すために追加される。
【0171】
以下の表TAB3は、VVCに関連する上記8つの実施形態によって生じるグリーンMPEG SEIシンタックスの変更を示し、既存のグリーンMPEG SEIシンタックスと比較した変更が太字で示されている。
【0172】
【0173】
【0174】
period_typeが、スライス/タイル/サブピクチャ粒度を有するピクチャごとのシグナリングに対応する、「4」に等しいの場合、このシンタックス部分で同じシンタックス変更が行われることになり、追加されるシンタックス要素ごとにインデックス[t]が追加され、tは、表TAB3bisに表されているようにスライス/タイルインデックスを示す。
【0175】
【0176】
【0177】
【0178】
第9の実施形態は、グリーンMPEGメタデータにおけるサブピクチャの使用に適合するCMを提供することに焦点を合わせる。
【0179】
サブピクチャがVVCビットストリームで使用されるとき、SEIにおいてシグナリングされるパラメータは、サブピクチャごとにシグナリングされる。サブピクチャは、VVC SPS内のシンタックス要素sps_num_subpics_minus1が「0」よりも大きいときに使用され、sps_num_subpics_minus1は、ピクチャ内のサブピクチャの数を表す。
【0180】
表TAB4は、表TAB2の修正版を表し、サブピクチャが有効化された場合(値5)に対して新しいエントリが追加される。
【0181】
【0182】
加えて、表TAB3のシンタックス要素は、シンタックス要素period_typeの値が5に等しいかのチェック(if(period_type==5)を追加することによって、サブピクチャの場合のために複製される。使用率を報告するシンタックス要素は、サブピクチャインデックスを示すインデックス[z]によってインデックス付けされる。表TAB3の第9の実施形態によって生じるいくつかの修正の説明を表TAB5に示す。
【0183】
【0184】
第9の実施形態の変形例では、サブピクチャ粒度の場合、使用率パラメータはまた、ピクチャの期間にわたってシグナリングされ得る。例えば、period_typeの以下の新たな値(6,7,8)によってシグナリングされる。
【0185】
【0186】
第9の実施形態の変形例では、新しいperiod_type値(period_type=5)は表TAB2に追加されないが、サブピクチャの場合のシグナリングは、period_type値「4」(スライス/タイル粒度を有する単一のピクチャ)に依存する。サブピクチャの場合、サブピクチャに含まれるスライスを識別する必要がある。サブピクチャを復号するとき、サブピクチャに含まれるスライスを識別し、これらのスライスからメタデータを取得することが可能である。これは、スライスが属するサブピクチャの識別を可能にするシンタックス要素sh_subpic_idにより行うことができる。
【0187】
第10の実施形態では、
図1Bのステップ103及び104で述べたように、TAB3(又はTAB3bis)のグリーンMPEG SEIメッセージは、VVC NALユニットでトランスポートされ、NAL(ネットワーク抽象化レイヤ)ユニットはデータコンテナである。NALユニットは、NALユニットによってトランスポートされたデータタイプをデコーダが認識することを可能にするNALユニットタイプによって識別される。グリーンMPEG SEIメッセージの場合、NALユニットタイプはPREFIX_SEI_NUTに設定される。表TAB6は、表TAB3に記載のグリーンMPEG SEIメッセージをトランスポートするように適合されたペイロードのシンタックスを記載している。
【0188】
【0189】
【0190】
【0191】
シンタックス要素green_metadata_typeのセマンティックの例は、以下のとおりである。
【0192】
green_metadata_type:SEIメッセージ内に存在するメタデータのタイプを指定する。green_metadata_typeが「0」である場合、複雑度メトリックが存在する。そうではなく、green_metadata_typeが「1」である場合、低電力符号化後の品質回復を可能にするメタデータが存在する。green_metadata_typeの他の値は、ISO/IECが将来使用するために予約されている。
【0193】
以下に、上述した様々なシンタックス要素のセマンティックの例を提供する。
・period_typeは、複雑度メトリックが適用可能である次回の期間のタイプを指定し、以下の表で定義される。
【0194】
【表9】
●num_secondsは、period_typeが「2」である場合に複雑度メトリックが適用可能である秒数を示す。
●num_picturesは、period_typeが「3」である場合に複雑度メトリックが適用可能である、復号順でカウントされるピクチャの数を指定する。
NumPicsInPeriodは、指定期間内のピクチャ数である。period_typeが「0」の場合、NumPicsInPeriodは「1」である。period_typeが「1」の場合、NumPicsInPeriodは、次のIスライスを含むピクチャまで(ただし、当該ピクチャを含まない)のピクチャを復号順でカウントすることによって決定される。period_typeが「2」の場合、フレームレートからNumPicsInPeriodを決定する。period_typeが「3」の場合、NumPicsInPeriodはnum_picturesに等しい。
●total_number_4x4_blocks_in_periodは、指定期間にコーディングされる4x4ブロックの総数を指定する。パラメータTotalNum4x4BlocksInPeriodは、以下のように導出される。
TotalNum 4×4 BlocksInPeriodは、指定期間にコーディングされる4×4ブロックの総数である。TotalNum4x4BlocksInPeriodは、以下のように導出される。
○TotalNum4x4BlocksInPeriodは、total_number_4x4_blocks_in_periodに等しく設定される。
○以下の条件が真である場合、TotalNum4x4BlocksInPeriodは、(num_seconds x TotalNum4x4BlocksInPeriod)に等しく設定され、
period_typeは2に等しく、
num_secondsは1よりも大きい。
○以下の条件が真であるとき、TotalNum4x4BlocksInPeriodは、(num_picturesxTotalNum4x4BlocksInPeriod +64)/128に等しく設定され、
period_typeは3に等しく、
num_picturesは128よりも大きい。
●portion_non_zero_blocks_areaは、4×4ブロック粒度を使用して、指定期間のピクチャ内の非ゼロ変換係数値を有するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0195】
【数5】
式中、NumNonZeroBlocksは、4×4粒度を使用する指定期間において非ゼロ変換係数値を有するブロックの数である。エンコーダ側では、NumNonZeroBlocksは以下のように計算される。
【0196】
【数6】
式中、NumNonZeroXBlocksは、指定期間における、それぞれX=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、非ゼロ変換係数値を有するブロックの数である。
【0197】
NumNonZeroBlocksは、デコーダのportion_non_0_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_64_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「64」サンプルブロックエリアの部分を示し、以下のように定義される。
【0198】
【0199】
存在しない場合は、「0」に等しい。
NumNonZero64Blocksは、指定期間において非ゼロ変換係数値を有する「64」サンプルブロックの数である。これは、デコーダのportion_64_blocks_in_non_0_area及びNumNonZeroBlocksから導出される。
・portion_128_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「128」サンプルブロックエリアの部分を示し、以下のように定義される。
【0200】
【0201】
存在しない場合は、「0」に等しい。
NumNonZero128Blocksは、指定期間において非ゼロ変換係数値を有する「128」サンプルブロックの数である。これは、デコーダのportion_128_blocks_in_non_0_area及びNumNonZeroBlocksから導出される。
・portion_256_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「256」サンプルブロックエリアの部分を示し、以下のように定義される。
【0202】
【0203】
存在しない場合は、「0」に等しい。
NumNonZero256Blocksは、指定期間において非ゼロ変換係数値を有する「256」サンプルブロックの数である。これは、デコーダのportion_256_blocks_in_non_zero_area及びNumNonZeroBlocksから導出される。
・portion_512_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「512」サンプルブロックエリアの部分を示し、以下のように定義される。
【0204】
【0205】
存在しない場合は、「0」に等しい。
NumNonZero512Blocksは、指定期間において非ゼロ変換係数値を有する「512」サンプルブロックの数である。これは、デコーダのportion_512_blocks_in_non_zero_area及びNumNonZeroBlocksから導出される。
・portion_1024_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「1024」サンプルブロックエリアの部分を示し、以下のように定義される。
【0206】
【0207】
存在しない場合は、「0」に等しい。
NumNonZero1024Blocksは、指定期間において非ゼロ変換係数値を有する「1024」サンプルブロックの数である。これは、デコーダのportion_1024_blocks_in_non_zero_area及びNumNonZeroBlocksから導出される。
・portion_2048_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「2048」サンプルブロックエリアの部分を示し、以下のように定義される。
【0208】
【0209】
存在しない場合は、「0」に等しい。
NumNonZero2048Blocksは、指定期間において非ゼロ変換係数値を有する「2048」サンプルブロックの数である。これは、デコーダのportion_2048_blocks_in_non_zero_area及びNumNonZeroBlocksから導出される。
・portion_4096_blocks_in_non_zero_areaは、指定期間における非ゼロエリア内の「4096」サンプルブロックエリアの部分を示し、以下のように定義される。
【0210】
【0211】
存在しない場合は、「0」に等しい。
NumNonZero4096Blocksは、指定期間において非ゼロ変換係数値を有する「4096」サンプルブロックの数である。これは、デコーダのportion_4096_blocks_in_non_zero_area及びNumNonZeroBlocksから導出される。
NumNonZero16Blocksは、指定期間において非ゼロ変換係数値を有する「16」サンプルブロックの数である。NumNonZero4x4Blocksは、デコーダのNumNonZeroBlocks、NumNonZero64Blocks、NumNonZero128Blocks、NumNonZero256Blocks、NumNonZero512Blocks、NumNonZero1024Blocks、NumNonZero2048Blocks、及びNumNonZero4096Blocksから以下のように導出される。
【0212】
【数14】
・portion_jccr_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のJCCRでコーディングされたブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0213】
【数15】
NumJccrCodedBlocksは、4×4粒度を使用して、指定期間にJCCRとしてコーディングされたブロックの数である。エンコーダ側では、以下のように計算される。
【0214】
【0215】
式中、NumJccrCoded_XBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096のサンプル数に対する、JCCRとしてコードされたブロックの数である。
NumJccrCodedBlocksは、デコーダのportion_jccr_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_trtype0_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のタイプ「0」の変換を使用するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0216】
【数17】
NumTrType0Blocksは、4×4粒度を使用して、指定期間にタイプ「0」の変換を使用するブロックの数である。エンコーダ側では、以下のように計算される。
【0217】
【0218】
式中、NumTrType0_XBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、変換タイプ「0」を使用するブロックの数である。
【0219】
NumTrType0Blocksは、デコーダのportion_trtype0_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_trtype1_2_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のタイプ1又は2の変換を使用するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0220】
【数19】
NumTrType1_2Blocksは、4×4粒度を使用して、指定期間にタイプ「0」の変換を使用するブロックの数である。エンコーダ側では、以下のように計算される。
【0221】
【0222】
式中、NumTrType1_2_XBlocksは、指定期間における、X=16、32、64、128、256、512、1024からのサンプルの数に対する、変換タイプ1又は2を使用するブロックの数である。
NumTrType1_2Blocksは、デコーダのportion_trtype1_2_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_lfnst_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のLFNST変換を使用するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0223】
【数21】
NumLfnstBlocksは、4×4粒度を使用して、指定期間にLFNST変換を使用するブロックによってカバーされるエリアである。エンコーダ側では、以下のように計算される。
【0224】
【0225】
式中、NumLfnst16x16Blocks及びNumLfnst48x16Blocksは、指定期間に、それぞれサイズ16×16及び48×16のLFNST変換を使用するブロックの数である。
NumLfnstBlocksは、デコーダのportion_lfnst_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_intra_predicted_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のイントラ予測ブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0226】
【数23】
NumIntraPredictedBlocksは、4×4粒度を使用して、指定期間にイントラ予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0227】
【0228】
式中、NumIntraPredictedBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラ予測を使用するブロックの数である。
NumIntraPredictedBlocksは、デコーダのportion_intra_predicted_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_uni_predicted_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のインター片予測ブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0229】
【数25】
NumUniPredictedBlocksは、4×4粒度を使用して、指定期間にインター片予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0230】
【0231】
式中、NumUniPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、インター片予測された予測を使用するブロックの数である。
NumUniPredictedBlocksは、デコーダのportion_uni_predicted_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_bi_predicted_blocks_areaは、4×4粒度を使用して、指定期間のピクチャ内のインター双予測ブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0232】
【数27】
NumBiPredictedBlocksは、4×4粒度を使用して、指定期間にインター双予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0233】
【0234】
式中、NumBiPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、インター双予測された予測を使用するブロックの数である。
NumBiPredictedBlocksは、デコーダのportion_bi_predicted_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_planar_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内の平面ブロックエリアの部分を示し、以下のように定義される。
【0235】
【0236】
存在しない場合は、「0」に等しい。
NumPlanarPredictedBlocksは、4×4粒度を使用して、指定期間にイントラ平面予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0237】
【0238】
式中、NumPlanarPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラ平面予測を使用するブロックの数である。
NumPlanarPredictedBlocksは、デコーダのportion_planar_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_dc_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内のDCブロックエリアの部分を示し、以下のように定義される。
【0239】
【0240】
存在しない場合は、「0」に等しい。
NumDcPredictedBlocksは、4×4粒度を使用する指定された期間におけるイントラdc予測ブロックの数である。エンコーダ側では、以下のように計算される。
【0241】
【0242】
式中、NumDcPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラDC予測を使用するブロックの数である。
NumDcPredictedBlocksは、デコーダのportion_dc_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_angular_hv_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内の水平ブロックエリア又は垂直ブロックエリアの部分を示し、以下のように定義される。
【0243】
【0244】
存在しない場合は、「0」に等しい。
NumAngularHVPredictedBlocksは、4×4粒度を使用する指定期間におけるイントラ角度水平予測ブロック又はイントラ角度垂直予測ブロックの数である。エンコーダ側では、以下のように計算される。
【0245】
【0246】
式中、NumAngularHVPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラ角度水平予測又はイントラ角度垂直予測を使用するブロックの数である。
NumAngularHVPredictedBlocksは、デコーダのportion_angular_hv_blocks_in_intra_area及びNumIntraPredictedBlocksから導出される。
・portion_mip_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内のMIP予測ブロックエリアの部分を示し、以下のように定義される。
【0247】
【0248】
存在しない場合は、「0」に等しい。
NumMipPredictedBlocksは、4×4粒度を使用する指定期間におけるイントラMIP予測ブロックの数である。エンコーダ側では、以下のように計算される。
【0249】
【0250】
式中、NumMipPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラMIP予測を使用するブロックの数である。
NumMipPredictedBlocksは、デコーダのportion_mip_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_cclm_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内でCCLMモードを使用するブロックエリアの部分を示し、以下のように定義される。
【0251】
【0252】
存在しない場合は、「0」に等しい。
NumCclmPredictedBlocksは、4×4粒度を使用する指定期間におけるイントラCCLM彩度予測ブロックの数である。エンコーダ側では、以下のように計算される。
【0253】
【0254】
式中、NumCclmPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048からのサンプルの数に対する、イントラCCLM予測を使用するブロックの数である。
NumCclmPredictedBlocksは、デコーダのportion_cclm_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_ibc_blocks_in_intra_areaは、指定期間におけるイントラ予測エリア内でIBCモードを使用するブロックエリアの部分を示し、以下のように定義される。
【0255】
【0256】
存在しない場合は、「0」に等しい。
NumIbcPredictedBlocksは、4×4粒度を使用する指定期間におけるイントラIBC予測ブロックの数である。エンコーダ側では、以下のように計算される。
【0257】
【0258】
式中、NumIbcPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、イントラIBC予測を使用するブロックの数である。
NumIbcPredictedBlocksは、デコーダのportion_ibc_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_integer_interpolation_blocksは、指定期間における、輝度サンプル位置が水平整数サンプル位置及び垂直整数サンプル位置に位置する予測ブロックの部分を示し、以下のように定義される。
【0259】
【0260】
存在しない場合は、「0」に等しい。
NumBlocksIntegerInterpolationは、指定期間における、輝度サンプル位置が水平整数サンプル位置及び垂直整数サンプル位置に位置する予測ブロックの数である。これは、デコーダのportion_integer_interpolation_blocks及びTotalNum4x4BlocksInPeriodから導出される。
portion_hor_or_ver_interpolation_blocksは、指定期間において、輝度サンプル位置が水平方向又は垂直方向のうちの一方の整数サンプル位置及び他の方向のサブサンプル位置に位置する予測ブロックの部分を示し、以下のように定義される。
【0261】
【0262】
存在しない場合は、「0」に等しい。
NumBlocksHorOrVerInterpolationは、指定期間において、輝度サンプル位置が水平方向又は垂直方向のうちの一方の整数サンプル位置に位置する予測ブロックの数である。これは、デコーダのportion_hor_or_ver_interpolation_blocks及びTotalNum4x4BlocksInPeriodから導出される。
・portion_hor_and_ver_interpolation_blocksは、指定期間における、輝度サンプル位置が水平方向及び垂直方向の両方でサブサンプル位置に位置する予測ブロックの部分を示し、以下のように定義される。
【0263】
【0264】
存在しない場合は、「0」に等しい。
NumBlocksHorAndVerInterpolationは、指定期間において、輝度サンプル位置が水平方向及び垂直方向の両方でサブサンプル位置に位置する予測ブロックの数である。これは、デコーダのportion_hor_and_ver_interpolation_blocks及びTotalNum4x4BlocksInPeriodから導出される。
・portion_dmvr_blocksは、4×4粒度を使用して、指定期間のピクチャ内のDMVRを適用するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0265】
【数44】
NumBiPredictedBlocksは、4×4粒度を使用して、指定期間にインター双予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0266】
【0267】
式中、NumBiPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、インター双予測された予測を使用するブロックの数である。
NumBiPredictedBlocksは、デコーダのportion_bi_predicted_blocks_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_bdof_blocksは、指定期間におけるインター予測エリア内でBDOFフィルタリングを使用するブロックエリアの部分を示し、以下のように定義される。
【0268】
【0269】
存在しない場合は、「0」に等しい。
NumBdofPredictedBlocksは、4×4粒度を使用して、指定期間にBDOFフィルタリングを使用してインター予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0270】
【0271】
式中、NumBdofPredictedXBlocksは、指定期間における、X=64、128、256、512、1024、2048、4096からのサンプルの数に対する、BDOFフィルタリングを使用してインターコーディングされたブロックの数である。
NumBdofPredictedBlocksは、デコーダのportion_bdof_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_prof_blocksは、指定期間におけるインター予測エリア内でPROFフィルタリングを使用するブロックエリアの部分を示し、以下のように定義される。
【0272】
【0273】
存在しない場合は、「0」に等しい。
NumProfPredictedBlocksは、4×4粒度を使用して、指定期間にPROFフィルタリングを使用してインター予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0274】
【0275】
式中、NumProfPredictedXBlocksは、指定期間における、X=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、PROFフィルタリングを使用してインターコーディングされたブロックの数である。
NumProfPredictedBlocksは、デコーダのportion_prof_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_gpm_blocks_areaは、指定期間におけるGPMインター予測エリアを使用するブロックエリアの部分を示し、以下のように定義される。
【0276】
【0277】
存在しない場合は、「0」に等しい。
NumGpmPredictedBlocksは、4×4粒度を使用して、指定期間にGPMを使用してインター予測されたブロックの数である。エンコーダ側では、以下のように計算される。
【0278】
【0279】
式中、NumGpmPredictedXBlocksは、指定期間における、X=64、128、256、512、1024、2048、4096からのサンプルの数に対する、GPMを使用してインターコーディングされたブロックの数である。
NumGpmPredictedBlocksは、デコーダのportion_gpm_blocks_in_intra_area及びTotalNum4x4BlocksInPeriodから導出される。
・portion_deblocking_instancesは、指定期間における、本明細書の用語及び定義において定義されるデブロッキングフィルタリングインスタンスの部分を示し、以下のように定義される。
【0280】
【数52】
ChromaFormatMultiplierは、以下の表TAB8に示されるように、VVC変数sps_chroma_format_idcに依存する。
【0281】
【表10】
NumDeblockingInstancesは、指定期間におけるデブロッキングフィルタリングインスタンスの数である。これは、デコーダのportion_deblocking_instances、TotalNum4x4BlocksInPeriod、及びChromaFormatMultiplierから導出される。
・portion_alf_instancesは、指定期間における、本明細書の用語及び定義において定義されるALFフィルタリングインスタンスの部分を示し、以下のように定義される。
【0282】
【数53】
NumAlfInstancesは、指定期間におけるALFフィルタリングインスタンスの数である。これは、デコーダのportion_alf_instances、TotalNum4x4BlocksInPeriodから導出される。
・portion_ccalf_instancesは、指定期間における、本明細書の用語及び定義において定義されるCCALFフィルタリングインスタンスの部分を示し、以下のように定義される。
【0283】
【数54】
NumCcalfInstancesは、指定期間におけるCCALFフィルタリングインスタンスの数である。これは、デコーダのportion_ccalf_instances、TotalNum4x4BlocksInPeriodから導出される。
・max_num_slices_tiles_subpicture_minus1は、関連ピクチャにおけるスライスの数とタイルの数との間の最大数を指定する。
・first_ctb_in_slice_or_tile_or_subpict[t]は、ラスタスキャン順でスライス[t]又はタイル[t]内の第1のコーディングツリーブロック(Coding Tree Block、CTB)番号を指定する。
【0284】
period_typeが「4」に等しい(スライス又はタイルごとのシグナリングに対応する)場合、パラメータTotalNum4x4BlocksInSliceOrTileOrSubpic[t]は、以下のように定義される。
TotalNum4x4BlocksInSliceOrTileOrSubpic[t]は、スライス[t]又はタイル[t]内の4×4ブロックの総数であり、ISO/IEC 23090-3の「CTB raster scanning,tile scanning,and subpicture scanning processes」節で指定された、パラメータctbToTileColIdx、ctbToTileRowIdx、ColWidthVal、及びRowHeightValを使用して、以下の計算によって決定される。
○ctbAddrX=first_ctb_in_slice_or_tile_or_subpict[t]
○tileColIdx=ctbToTileColIdx[ctbAddrX]
○tileRowIdx=ctbToTileRowIdx[ctbAddrX]
○tileWidth=ColWidthVal[tileColIdx]
○tileHeight=RowHeightVal[tileRowIdx]
○TotalNum4x4BlocksInSliceOrTileOrSubpic[t]=tileWidth *tileHeight*(1<<(CtbLog2SizeY-2))2
【0285】
period_typeが「5」に等しい(サブピクチャごとのシグナリングに対応する)場合、パラメータTotalNum4x4BlocksInSliceOrTileOrSubpic[t]は、以下のように定義される。
TotalNum4x4BlocksInSliceOrTileOrSubpic[t]は、サブスクリプト[t]内の4×4ブロックの総数であり、ISO/IEC 23090-3の「Sequence parameter set RBSP semantics」節で指定されたシンタックス要素sps_subpic_ctu_top_left_x及びsps_subpic_ctu_top_left_yを使用して、以下の計算によって決定される。
○subpicWidth=1+sps_subpic_width_minus1[t]
○subpicHeight=1+sps_subpic_height_minus1[t]
○TotalNum4x4BlocksInSliceOrTileOrSubpic[t]=subpicWidth*subpicHeight*(1<<(CtbLog2SizeY-2))2
【0286】
次に、上記の全てのシンタックス要素を複製し、インデックス[t]を追加し、TotalNum4x4BlocksInPeriodをTotalNum4x4BlocksInSliceOrTileOrSubpic[t]で置換する。
【0287】
例えば、以下のシンタックス要素が追加される。
・portion_non_zero_blocks_area[t]は、4×4ブロック粒度を使用して、スライス[t]又はタイル[t]又はサブピクチャ[t]内の非ゼロ変換係数値を有するブロックによってカバーされるエリアの部分を示し、以下のように定義される。
【0288】
【数55】
式中、NumNonZeroBlocks[t]は、4×4粒度を使用するスライス[t]又はタイル[t]内の非ゼロ変換係数値を有するブロックの数である。エンコーダ側では、NumNonZeroBlocks[t]は以下のように計算される。
【0289】
【数56】
式中、NumNonZeroXBlocks[t]は、スライス[t]又はタイル[t]内の、それぞれX=16、32、64、128、256、512、1024、2048、4096からのサンプルの数に対する、非ゼロ変換係数値を有するブロックの数である。
NumNonZeroBlocks[t]は、デコーダのportion_non_zero_blocks_area[t]及びTotalNum4x4BlocksInSliceOrTileOrSubpic[t]から導出される。
【0290】
より明確には、デコーダにおいて、パラメータTotalNum4×4BlocksInSliceOrTileOrSubpicture[t]及びportion_non_zero_blocks_area[t]は、非ゼロ変換係数を含む4×4(又は16サンプル)ブロックの数NumNonZeroBlocks[t]を導出するために使用される。この数は、以下のように導出される。
【0291】
【0292】
表Tab6においてシグナリングされ、シンタックス要素portion_64_blocks_in_non_zero_area[t]又はportion_alf_instances[t]などコーディングモードの使用率に関連する全ての他のシンタックス要素についても同様であり、これらは、エンコーダにおいて、パラメータNumNonZero64Blocks[t]又はNumAlfInstances[t]から計算され、次いでSEIにおいてシグナリングされ、また、デコーダにおいてSEIから復号され、パラメータNumNonZero64Blocks[t]又はNumAlfInstances[t]をそれぞれ導出するために使用される。
【0293】
NumNonZeroBlocks[t]、NumNonZero64Blocks[t]、又はNumAlfInstances[t]などのパラメータは、例えばISO/IEC 23001-11(グリーンメタデータ)規格のAnnex B.1に記載されているようにデコーダによって利用されて、動作周波数を変化させ、したがってデコーダの電力消費を低減させる。
【0294】
一実施形態では、復号複雑度メトリックに関連するシンタックス要素は、メタデータのよりコンパクトな表現を得るためにグループ化されるか、又は削除される。表TAB9に一例が示される。表TAB9では、メトリックを示すための粒度は、4×4ブロックではなく、いくつかの実装形態でサポートされる最小変換ブロックに対応する「4」サンプルのブロックである。例えば、非ゼロ領域に関連するシンタックス要素は、異なるブロックサイズに対してグループ化され、「4」シンタックス要素portion_non_zero_4_8_16_blocks_area(サイズ「4」、「8」、及び「16」サンプルの変換ブロックを含む)、portion_non_zero_32_64_128_blocks_area(サイズ「32」、「64」、及び「128」サンプルの変換ブロックを含む)、portion_non_zero_256_512_1024_blocks_area(サイズ「256」、「512」、及び「1024」サンプルの変換ブロックを含む)、及びportion_non_zero_2048_4096_blocks_area(サイズ「2048」及び「4096」サンプルの変換ブロックを含む)をもたらす。変換に関連するいくつかのシンタックス要素が削除されている(portion_jccr_blocks_area、portion_trtype0_blocks_area、portion_trtype1_2_blocks_area、portion_lfnst_blocks_area、portion_bdpcm_blocks_area)。イントラ関連シンタックス要素及びインター関連シンタックス要素も簡略化されている。portion_non_zero_transform_coefficients_areaは、非ゼロブロック内の非ゼロ係数の部分を示す。
【0295】
イントラ部分については、「4」個のシンタックス要素、すなわち、portion_planar_blocks_in_intra_area(平面予測を使用するブロック予測の部分)、portion_dc_blocks_in_intra_area(DC予測を使用するブロック予測の部分)、portion_angular_hv_blocks_in_intra_area(水平方向予測又は垂直方向予測を使用するブロック予測の部分)、portion_mip_blocks_in_intra_area(MIP予測を使用するブロック予測の部分)のみが考慮される。
【0296】
インター部分については、portion_bi_and_gpm_predicted_blocks_areaのみが定義され、片予測部分は、それから、及び期間内のブロックの総数から推定され得る。
【0297】
ループフィルタリングについては、ループフィルタごとにシンタックス要素、すなわちportion_deblocking_instances、portion_sao_filtered_blocks、portion_alf_filtered_blocksが定義される。
【0298】
【0299】
【0300】
period_typeは、表TAB10において以下のように定義される。
【0301】
【0302】
表TAB9の例では、「3」以下のperiod_typeの最大ペイロードサイズは「14」バイトである。
【0303】
この例では、「3」よりも大きいperiod_typeの最大ペイロードサイズは、(3+11*セグメント数)バイトであり、セグメントは、ピクチャ内のタイル、スライス、又はサブピクチャのいずれかとして定義される。
【0304】
復号複雑度メトリックメタデータのコンパクト性を改善する別の実施形態、すなわち、コンパクト性を改善する第1の実施形態と呼ばれる実施形態では、非ゼロブロックに関連する詳細なシンタックス要素portion_non_zero_4_8_16_blocks_area、portion_non_zero_32_64_128_blocks_area、portion_non_zero_256_512_1024_blocks_area、portion_non_zero_2048_4096_blocks_areaが更にグループ化される。例えば、それらは、「2」個のシンタックス要素portion_non_zero_small_blocks_area及びportion_non_zero_large_blocks_areaにグループ化され、小ブロックは、Mサンプル以下のサンプル数の変換ブロックであり、大ブロックは、Mサンプルよりも多いサンプル数の変換ブロックである。一実施形態では、Mは「512」に等しい(32×32よりも小さい変換に対応する)。別の実施形態では、Mは「1024」に等しい(最大32×32の変換に対応する)。コンパクト性を改善する第1の実施形態の変形例では、非ゼロブロックに関連する詳細なシンタックス要素が削除され、portion_non_zero_blocks_area及びportion_non_zero_transform_coefficients_areaのみが、変換複雑度を認定するシンタックス要素として保持される。
【0305】
復号複雑度メトリックメタデータのコンパクト性を改善する別の実施形態、すなわち、コンパクト性を改善する第2の実施形態と呼ばれる実施形態では、イントラコーディングに関連するシンタックス要素がグループ化され、1つのシンタックス要素portion_intra_predicted_blocks_areaがイントラ予測を使用する部分領域を示し、それに加えて、1つのシンタックス要素portion_mip_blocks_in_intra_areaがイントラ予測を使用する領域の中でのMIP予測の使用を示す。
【0306】
コンパクト性を改善する第2の実施形態の変形例では、シンタックス要素portion_mip_blocks_in_intra_areaが削除され、シンタックス要素portion_intra_predicted_blocks_areaに加えて、シンタックス要素portion_planar_blocks_in_intra_area、portion_dc_blocks_in_intra_area、及びportion_angular_hv_blocks_in_intra_areaが保持される。
【0307】
コンパクト性を改善する第2の実施形態の別の変形例では、グローバルカウントシンタックス要素portion_intra_predicted_blocks_areaを除いて、イントラコーディングに関連するシンタックス要素が削除される。
【0308】
復号複雑度メトリックメタデータのコンパクト性を改善する別の実施形態、すなわち、コンパクト性を改善する第3の実施形態と呼ばれる実施形態では、ループフィルタリングに関連するシンタックス要素がグループ化される。例えば、portion_sao_filtered_blocks及びportion_alf_filtered_blocksが、portion_sao_alf_filtered_blocksにグループ化される。
【0309】
表TAB11は、ペイロードサイズの低減を目的とする、上記のコンパクト性を改善する第1、第2、及び第3の実施形態に基づく復号複雑度メタデータの最もコンパクトなバージョンを示す。このバージョンに基づいて、「3」以下のperiod_typeの最大ペイロードサイズは、「9」バイトである(つまり、拡張バージョンと比較して「5」バイトが節約される)。シンタックス要素は、「3」よりも大きいperiod_typeのタイル/スライス/サブピクチャごとに複製される。
【0310】
【0311】
一実施形態では、メタデータペイロードのコンパクトバージョン又は完全バージョンが使用されるかどうかを示すために、シンタックス要素が追加される。例えば、これは、シンタックス要素extended_representation_flagを使用して示される。
【0312】
バイトアラインされたペイロードを維持するために、フラグが追加されるときには、period_typeのコーディング用のビット長は、場合によっては「1」ビットだけ低減される。このビット長の低減は、代替的に、ペイロードに含まれる他のシンタックス要素のいずれかに適用することができる。代替的に、これは、period_typeの特定の値によって示される。代替的に、「8」ビットがextended_representation_flagのコーディングに使用され、「8」ビットがperiod_typeのコーディングに使用される。
【0313】
以下の表TAB12は、復号複雑度メトリックのコンパクトかつより詳細な(拡張された)表現を可能にする、結果として生じるペイロードを示す。この例は、period_type≦3に対してのみ示されているが、period_type>3(タイル/スライス/サブピクチャバージョン)の場合についても容易に一般化することができる。
【0314】
コンパクトバージョン及び拡張バージョンの両方に対して定義されるコアシンタックス要素は、以下のように存在する。
・portion_non_zero_blocks_area、
・portion_non_zero_transform_coefficients_area、
・portion_intra_predicted_blocks_area、
・portion_bi_and_gpm_predicted_blocks_area、
・portion_deblocking_instances,portion_sao_alf_filtered_blocks。
【0315】
加えて、拡張バージョンが使用される場合、以下の拡張シンタックス要素がシグナリングされる。
・portion_non_zero_4_8_16_blocks_area、
・portion_non_zero_32_64_128_blocks_area、
・portion_non_zero_256_512_1024_blocks_area、
・portion_non_zero_2048_4096_blocks_area、
・portion_planar_blocks_in_intra_area、
・portion_dc_blocks_in_intra_area,
・portion_angular_hv_blocks_in_intra_area,
・portion_mip_blocks_in_intra_area。
【0316】
【0317】
一実施形態では、フラグextended_representation_flagは、タイル/スライス/サブピクチャの場合、すなわち、本明細書で使用されるperiod_type定義を参照するときにperiod_typeが「3」よりも大きい場合にのみシグナリングされる。
【0318】
シグナリング/復号プロセスの一例が、2つの異なる実装形態で
図8A及び
図8Bに示されている。
【0319】
図8Aにおいて、extended_representation_flagの値がステップ800においてチェックされる。extended_representation_flagが偽である場合、ステップ801において、コアシンタックス要素のみが復号される。extended_representation_flagが真である場合、ステップ802において、コアシンタックス要素及び拡張シンタックス要素が復号される。
【0320】
図8Bでは、コアシンタックス要素のみがステップ803において復号される。次いで、ステップ804において、extended_representation_flagの値がチェックされる。extended_representation_flagが真である場合、ステップ805において、拡張シンタックス要素が復号される。
【0321】
別の実施形態では、タイル/スライスの場合とサブピクチャの場合との間にperiod_type値の差異はない。代わりに、period_type値は、以下の表TAB13に太字フォントで示されるように、タイル/スライス/サブピクチャ粒度が使用されるか否かを示すことができる。
【0322】
【0323】
タイル/スライス/サブピクチャ粒度が使用されるとき、タイル、スライス又はサブピクチャの中で使用されるセグメントのタイプを示すために、追加のシンタックス要素が追加される。以下の表では、このシンタックス要素はtype_segmentsと名付けられる。type_segments=0のとき、セグメントはタイルに対応し、type_segments=1のとき、セグメントはスライスに対応し、type_segments=2のとき、セグメントはサブピクチャに対応する。代替的に、type_segments=0のとき、セグメントはタイル又はスライスに対応し、type_segments=1のとき、セグメントはサブピクチャに対応する。他の値は、将来定義され得る他のタイプのセグメントのために、又は特定の用途のために予約されている。
【0324】
下の表TAB14は、period_type≧4に対応する、タイル/スライス/サブピクチャ粒度の場合のこの新しいシンタックス要素type_segmentsを含む。
【0325】
【0326】
セグメント内の4サンプルブロックの数を定義するパラメータTotalNum4BlocksInSegment[t]は、type_segmentsが「0」に等しい場合はセグメントがスライス又はタイルであり、type_segmentsが「1」に等しい場合はサブピクチャであり、以下のように定義される。
TotalNum4BlocksInSegment[t]は、スライス[t]又はタイル[t]又はサブピクチャ[t]内の4サンプルブロックの総数であり、MaxNumDbfInstancesInSegment[t]は、スライス[t]又はタイル[t]又はサブピクチャ[t]内のデブロッキングインスタンスの最大数である。TotalNum4BlocksInSegment[t]及びMaxNumDbfInstancesInSegment[t]は、以下の計算によって決定される。
-type_segmentsが0に等しい場合、TotalNum4BlocksInSegment[t]は、ISO/IEC 23090-3の「Sequence parameter set RBSP semantics」節で指定されたシンタックス要素sps_subpic_ctu_top_left_x及びsps_subpic_ctu_top_left_yから以下のように導出される。
-ctbAddrXは、first_ctb_in_segment[t]に等しく設定される。
-tileColIdxは、ctbToTileColIdx[ctbAddrX]に等しく設定される。
-tileRowIdxは、ctbToTileRowIdx[ctbAddrX]に等しく設定される。
-tileWidthは、ColWidthVal[tileColIdx]<<(CtbLog2SizeY-1)に等しく設定される。
-tileHeightは、RowHeightVal[tileRowIdx]<<(CtbLog2SizeY-1)に等しく設定される。
-TotalNum4BlocksInSegment[t]は、(tileWidth*tileHeight)に等しく設定される。
-MaxNumDbfInstancesInSegment[t]は、ChromaFormatMultiplier*(tileWidth*tileHeight-2*(tileWidth+tileHeight))に等しく設定される。
- そうではなくtype_segmentsが1に等しい場合、TotalNum4BlocksInSegment[t]は、ISO/IEC 23090-3の「CTB raster scanning,tile scanning,and subpicture scanning processes」節で指定されたパラメータctbToTileColIdx、ctbToTileRowIdx、ColWidthVal、及びRowHeightValから以下のように導出される。
-subpicWidthは、(1+sps_subpic_width_minus1[t])<<(CtbLog2SizeY-1)に等しく設定される。
-subpicHeightは、(1+sps_subpic_height_minus1[t])<<(CtbLog2SizeY-1)に等しく設定される。
-TotalNum4BlocksInSegment[t]は、(subpicWidth*subpicHeigh)に等しく設定される。
-MaxNumDbfInstancesInSegment[t]は、ChromaFormatMultiplier*(subpicWidth*subpicHeight-2*(subpicWidth+subpicHeight))に等しく設定される。
【0327】
図7には、いくつかの実施形態による復号プロセスのブロック図を示す。
【0328】
ステップ700において、処理モジュール500は、パラメータperiod_typeをチェックする。
【0329】
period_typeがスライス粒度、タイル粒度、又はサブピクチャ粒度を有する単一のピクチャに対応しない場合、処理モジュール500は、ステップ701においてパラメータTotalNum4x4BlocksInPeriodを導出する。
【0330】
次いで、ステップ703において、処理モジュール500は、TotalNum4x4BlocksInPeriodの値を考慮して期間中のコーディングモードの使用率を導出することによって、期間のピクチャを復号し、したがって、デコーダの電力消費を低減する。
【0331】
ステップ700において、period_typeがスライス粒度、タイル粒度、又はサブピクチャ粒度を有する単一のピクチャに対応する場合、処理モジュール500は、ステップ702においてパラメータperiod_typeを再チェックする。
【0332】
ステップ702において、period_typeがサブピクチャ粒度に対応する場合、t1からtKまでのインデックスtによってインデックス付けされた、復号されるK個のサブピクチャについて(ステップ704)、処理モジュール500は、ステップ705において、値period_type=5について上述したプロセスに従ってパラメータTotalNum4x4BlocksInSliceOrTileOrSubpic[t]を導出する。
【0333】
次いで、処理モジュール500は、ステップ706において、TotalNum4x4BlocksInSliceOrTileOrSubpic[t]の値を考慮することによってインデックスtのサブピクチャを復号して、サブピクチャにおけるコーディングモードの使用率を導出し、したがって、デコーダの電力消費を低減する。
【0334】
ステップ702において、period_typeがサブピクチャ粒度に対応しない場合、t1からnbTilesまでのインデックスtによってインデックス付けされた、復号されるタイルごとに(ステップ707)、処理モジュール500は、ステップ708において、値period_type=4について上述したプロセスに従ってパラメータTotalNum4x4BlocksInSliceOrTileOrSubpic[t]を導出する。
【0335】
次いで、ステップ709において、処理モジュール500は、TotalNum4x4BlocksInSliceOrTileOrSubpic[t]の値を考慮してタイルにおけるコーディングモードの使用率を導出することによって、インデックスtのタイルを復号し、したがって、デコーダの電力消費を低減する。
【0336】
一実施形態では、サブピクチャ粒度に対応するperiod_typeの場合、デコーダは、関連するサブピクチャをエンコーダに示す逆方向チャネルを使用することができ、したがって、それらのサブピクチャに対応する使用率値のみが計算され、SEIにおいてシグナリングされる。
【0337】
以上、いくつかの実施形態について説明した。これらの実施形態の特徴は、単独で、又は任意の組み合わせで提供することができる。更に、実施形態は、様々な特許請求の範疇及びタイプにわたって、以下の特徴、デバイス、又は態様のうちの1つ以上を、単独で、又は任意の組み合わせにおいて、含むことができる。
・記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号。
・記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号を作り出しかつ/又は送信しかつ/又受信しかつ/又は復号する。
・記載された実施形態のうちの少なくとも1つを実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載された実施形態のうちの少なくとも1つを実行し、得られた画像を(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化ビデオストリームを含む信号を受信するために(例えば、チューナを使用して)チャネルをチューニングし、説明した実施形態のうちの少なくとも1つを実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子機器。
・符号化ビデオストリームを含む信号を(例えば、アンテナを使用して)無線で受信し、説明した実施形態のうちの少なくとも1つを実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
【手続補正書】
【提出日】2023-09-21
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
方法であって、
ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングする(102)ことと、
前記ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、前記データ構造を前記ビデオストリームに関連付ける(103)ことであって、少なくとも1つの符号化ツール又は特徴は、
・複数の値のうちの少なくとも1つの値に等しいサンプルの数を含む矩形ブロックの数に依存する、ことと、を含む方法。
【請求項2】
前記データ構造はSEIメッセージである、請求項1に記載の方法。
【請求項3】
前記メタデータにおいてシグナリングされる複数の値のうちの少なくとも1つの値に等しいサンプルの数を含む矩形ブロックの前記数に依存するエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項1に記載の方法。
【請求項4】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項1に記載の方法。
【請求項5】
第1の方法は、エネルギー消費を表す前記情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用され、
第2の方法は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用される、請求項4に記載の方法。
【請求項6】
方法であって、
ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについて前記ビデオストリームに関連付けられ、前記ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得する(102)ことであって、少なくとも1つの符号化ツール又は特徴は、
・複数の値のうちの少なくとも1つの値に等しいサンプルの数を含む矩形ブロック当たりのサンプルの数に依存してエネルギー消費を表す情報に関連付けられる、こと、を含む方法。
【請求項7】
前記データ構造はSEIメッセージである、請求項6に記載の方法。
【請求項8】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項6に記載の方法。
【請求項9】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項6に記載の方法。
【請求項10】
第1の方法は、エネルギー消費を表す前記情報がスライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用され、
第2の方法は、エネルギー消費を表す前記情報がサブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出するために適用される、請求項9に記載の方法。
【請求項11】
電子回路を備えるデバイスであって、前記電子回路は、
ピクチャのシーケンスを表すビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータをデータ構造においてシグナリングする(102)こと、並びに
前記ビデオストリームの期間を表すピクチャの少なくとも1つのサブセットについて、前記データ構造を前記ビデオストリームに関連付けることであって、少なくとも1つの符号化ツール又は特徴は、
・複数の値のうちの少なくとも1つの値に等しいサンプルの数を含む矩形ブロックの数に依存する、ことを行うために構成されている、デバイス。
【請求項12】
前記データ構造はSEIメッセージである、請求項11に記載のデバイス。
【請求項13】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、前記少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項11に記載のデバイス。
【請求項14】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項11に記載のデバイス。
【請求項15】
前記電子回路は、
エネルギー消費を表す前記情報が、スライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出すること、及び
エネルギー消費を表す前記情報が、サブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出することを行うために構成されている、請求項14に記載のデバイス。
【請求項16】
電子回路を備えるデバイスであって、前記電子回路は、
ビデオストリームによって表されるピクチャのシーケンスの期間を表すピクチャの少なくとも1つのサブセットについて前記ビデオストリームに関連付けられ、前記ビデオストリームを取得するために実装された符号化ツール及び/又は特徴によって生じるエネルギー消費を表すメタデータを含むデータ構造を取得する(102)ことであって、少なくとも1つの符号化ツール又は特徴は、
・複数の値のうちの少なくとも1つの値に等しいサンプルの数を含む矩形ブロックの数に依存する、ことを行うために構成されている、デバイス。
【請求項17】
前記データ構造はSEIメッセージである、請求項16に記載のデバイス。
【請求項18】
前記メタデータにおいてシグナリングされるピクチャ内の前記所与のサイズのブロックの前記総数に依存してエネルギー消費を表す情報に関連付けられた、少なくとも1つの符号化ツール又は特徴は、
・エントロピー復号、
・逆変換、
・イントラ予測及びイントラブロック復号、
・インター予測及びインターブロック復号、
・時間予測の補間、
・ループ内フィルタリング、
・サブピクチャの使用のうちの少なくとも1つに関連する、請求項16に記載のデバイス。
【請求項19】
エネルギー消費を表す前記情報は、単一のピクチャに、又はイントラスライスを含む次のピクチャまで復号順で全てのピクチャに、又は指定時間間隔にわたって、又は復号順でカウントされた指定数のピクチャにわたって、又はスライス粒度若しくはタイル粒度を有する単一のピクチャに、又はサブピクチャ粒度を有する単一のピクチャに適用可能である、請求項16に記載のデバイス。
【請求項20】
前記電子回路は、
エネルギー消費を表す前記情報が、スライス粒度又はタイル粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出すること、及び
エネルギー消費を表す前記情報が、サブピクチャ粒度を有する単一のピクチャに適用可能であることに応答して、ピクチャ内の所与のサイズのブロックの前記総数を導出することを行うために構成されている、請求項19に記載のデバイス。
【国際調査報告】