(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-10
(54)【発明の名称】ビットストリームの一般制約情報における予測重みのシグナリング
(51)【国際特許分類】
H04N 19/70 20140101AFI20230403BHJP
H04N 19/503 20140101ALI20230403BHJP
【FI】
H04N19/70
H04N19/503
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022549583
(86)(22)【出願日】2021-01-26
(85)【翻訳文提出日】2022-08-25
(86)【国際出願番号】 US2021015017
(87)【国際公開番号】W WO2021167758
(87)【国際公開日】2021-08-26
(32)【優先日】2020-02-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ワン,イェ-クイ
(72)【発明者】
【氏名】ヂャン,リ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA05
5C159MA12
5C159NN21
5C159PP16
5C159RB09
5C159RC11
5C159UA02
5C159UA05
(57)【要約】
ビデオブロックの重み付き予測を含むビデオ処理のためのシステム、方法、及び装置について記載する。一例示的な方法は、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ビットストリームはフォーマットルールに適合し、フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する。
【特許請求の範囲】
【請求項1】
ビデオ処理の方法であって、
ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、方法。
【請求項2】
前記1つ以上の制約フラグは前記ビットストリームに含まれる、請求項1に記載の方法。
【請求項3】
前記1つ以上の制約フラグは、前記現在のスライスに関連づけられたパラメータセットに含まれる、請求項1に記載の方法。
【請求項4】
前記1つ以上の制約フラグは、デコーダ能力情報ネットワーク抽象化レイヤ(NAL)ユニットに含まれる、請求項1に記載の方法。
【請求項5】
前記1つ以上の制約フラグは、前記明示的重み付き予測が前記ピクチャのセットの一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の一方又は双方に適用されるかどうかを示す第1の制約フラグを含み、前記第1の制約フラグの値は、前記現在のスライスに関連づけられたシーケンスパラメータセット(SPS)に含まれる第2のフラグの値と適合する、請求項1に記載の方法。
【請求項6】
前記第1の制約フラグはgci_no_explicit_weighted_prediction_constraint_flagである、請求項5に記載の方法。
【請求項7】
前記第2のフラグが1に等しいことに起因して、前記第1の制約フラグはゼロに等しい、請求項5に記載の方法。
【請求項8】
前記第2のフラグはsps_weighted_pred_flag又はsps_weighted_bipred_flagである、請求項7に記載の方法。
【請求項9】
ビデオ処理の方法であって、
ルールに従って、ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、
前記ルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグが、前記現在のスライスに関連づけられたパラメータセット又はヘッダに含まれることを指定する、方法。
【請求項10】
前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたシーケンスパラメータセット(SPS)に含まれるかどうかを示す第1のフラグを含む、請求項9に記載の方法。
【請求項11】
前記第1のフラグはsps_weighted_pred_flag又はsps_weighted_bipred_flagである、請求項10に記載の方法。
【請求項12】
前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたピクチャパラメータセット(PPS)に含まれるかどうかを示す第1のフラグを含む、請求項9に記載の方法。
【請求項13】
前記第1のフラグは、pps_weighted_pred_flag又はpps_weighted_bipred_flagである、請求項12に記載の方法。
【請求項14】
前記1つ以上の制約フラグは、前記明示的重み付き予測が一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の一方又は双方に適用されるかどうかを示す第1の制約フラグを含み、前記第1の制約フラグの値は、前記現在のスライスに関連づけられたピクチャパラメータセット(PPS)に含まれる第2の制約フラグの値と適合する、請求項9に記載の方法。
【請求項15】
前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたピクチャヘッダ又はスライスヘッダに含まれるかどうかを示す第1のフラグを含む、請求項9に記載の方法。
【請求項16】
前記指標は、参照ピクチャリストに関連する情報がピクチャヘッダシンタックス構造又はスライスヘッダシンタックス構造に含まれることに起因して、前記ピクチャヘッダ又は前記スライスヘッダにそれぞれ含まれる、請求項15に記載の方法。
【請求項17】
前記指標を含むことは、現在のビデオブロックに関連づけられたスライスのスライスタイプに基づく、請求項15に記載の方法。
【請求項18】
前記指標を含むことは、現在のピクチャがインタースライス、Pスライス、又はBスライスを含むことに基づく、請求項15に記載の方法。
【請求項19】
ビデオ処理の方法であって、
現在のピクチャを含むビデオと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、前記現在のピクチャが双方向スライス(Bスライス)を除外するかどうかの指標が、前記現在のピクチャに関連づけられたピクチャヘッダシンタックス構造に含まれることを指定する、方法。
【請求項20】
前記指標が1に等しいことは、前記現在のピクチャが1つ以上のBスライスを含むことを指定する、請求項19に記載の方法。
【請求項21】
前記指標がゼロに等しいことは、前記現在のピクチャがBスライスを除外することを指定する、請求項19に記載の方法。
【請求項22】
前記指標はph_b_slices_allowed_flagである、請求項20又は21に記載の方法。
【請求項23】
前記指標がゼロに等しいことは、参照ピクチャリスト1に関連するシンタックス構造におけるシンタックス要素が前記ビットストリームから除外されることを指定する、請求項19に記載の方法。
【請求項24】
前記指標はph_b_slices_allowed_flagであり、前記シンタックス構造はref_pic_lists()又はref_pic_list_struct()である、請求項23に記載の方法。
【請求項25】
前記指標がゼロに等しいことは、動きベクトル差分コーディングツールのためのシンタックス構造をパースすることに関連するシンタックス要素が前記ピクチャヘッダシンタックス構造から除外されることを指定する、請求項19に記載の方法。
【請求項26】
前記指標がゼロに等しいことは、動きベクトル差分コーディングツールのためのシンタックス構造をパースすることに関連するシンタックス要素の値が1に等しいように推論されることを指定する、請求項19に記載の方法。
【請求項27】
前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はmvd_l1_zero_flagである、請求項25又は26に記載の方法。
【請求項28】
前記指標がゼロに等しいことは、前記現在のピクチャにおける現在のビデオブロックの重み付き予測に関連するシンタックス要素が前記ビットストリームから除外されることを指定する、請求項19に記載の方法。
【請求項29】
前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はnum_l1_weightsである、請求項28に記載の方法。
【請求項30】
前記指標がゼロに等しいことは、前記現在のピクチャに関連づけられた参照ピクチャリストの最大参照インデックスに関連するシンタックス要素がスライスヘッダシンタックス構造から除外されることを指定する、請求項19に記載の方法。
【請求項31】
前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はnum_ref_idx_active_minus1である、請求項30に記載の方法。
【請求項32】
前記指標がゼロに等しいことは、前記現在のピクチャにおける現在のビデオブロックの時間的動きベクトル予測に使用されるコロケートスライスに関連するシンタックス要素が前記現在のピクチャに関連づけられた参照ピクチャリスト0から導出され、スライスヘッダシンタックス構造から除外されることを指定する、請求項19に記載の方法。
【請求項33】
前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はslice_collocated_from_l0_flagである、請求項32に記載の方法。
【請求項34】
前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、請求項1乃至33のうちいずれか1項に記載の方法。
【請求項35】
前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、請求項1乃至33のうちいずれか1項に記載の方法。
【請求項36】
コンピュータ読取可能記録媒体にビデオを表すビットストリームを記憶する方法であって、
請求項1乃至33のうちいずれか1項以上に記載の方法に従って前記ビデオから前記ビットストリームを生成するステップと、
前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、
を含む方法。
【請求項37】
請求項1乃至36のいずれか1項以上に記載の方法を実施するように構成されたプロセッサを含むビデオ処理装置。
【請求項38】
命令を記憶させたコンピュータ読取可能媒体であって、前記命令は実行されると、プロセッサに請求項1乃至36のうち1項以上に記載の方法を実施させる、コンピュータ読取可能媒体。
【請求項39】
請求項1乃至36のうちいずれか1項以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
【請求項40】
ビットストリームを記憶するビデオ処理装置であって、請求項1乃至36のうちいずれか1項以上に記載の方法を実施するように構成される、ビデオ処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
パリ条約による適用可能な特許法及び/又は規則に基づき、本出願は、2020年2月19日に出願された米国仮特許出願第US62/978,740号の優先権及び利益を適時に主張するように行われる。法に基づく全ての目的のために、前述の出願の開示全体が、本出願の開示の一部として参照により組み込まれる。
【0002】
[技術分野]
本特許文献は、画像及びビデオのコーディング及び復号に関する。
【背景技術】
【0003】
デジタルビデオは、インターネット及び他のデジタル通信ネットワークにおける最大の帯域幅使用を占めている。ビデオを受信及び表示することができる接続ユーザデバイスの数が増加すると、デジタルビデオ使用に対する帯域幅需要は増大し続けることが予想される。
【発明の概要】
【0004】
本文献は、ビデオ符号化及び復号を実行するためにビデオのビットストリームを処理するビデオエンコーダ及びデコーダにより使用することができる、重み付き予測を含む手法について開示する。
【0005】
一例示的な態様において、ビデオ処理方法が開示される。この方法は、ルールに従って、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ルールは、ピクチャパラメータセット(PPS)の第1のシンタックス要素の値及びPPSの第2のシンタックス要素の値が、第3のシンタックス要素がビットストリームに含まれるかどうかを制御することを指定し、第1のシンタックス要素は、PPSを参照するビットストリームにおけるコーディングピクチャの双方向スライス(Bスライス)に対して重み付き予測が有効にされるかどうかを示し、第2のシンタックス要素は、重み付き予測に関連する情報がPPSを参照するコーディングピクチャのピクチャヘッダ又はスライスヘッダに存在するかどうかを示し、第3のシンタックス要素は、現在のスライスの参照ピクチャリスト1に関連づけられた重みの数を示す。
【0006】
別の例示的な態様において、別のビデオ処理方法が開示される。この方法は、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ビットストリームはフォーマットルールに適合し、フォーマットルールは、予測重みが現在のスライスのスライスヘッダに含まれるかどうかを示す複数のシンタックス要素の値が、現在のスライスのスライスタイプと、現在のピクチャにより参照されるピクチャパラメータセット(PPS)に含まれる第1のフラグの値とに基づいて推論されることを指定する。
【0007】
さらに別の例示的な態様において、別のビデオ処理方法が開示される。この方法は、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ビットストリームはフォーマットルールに適合し、フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する。
【0008】
さらに別の例示的な態様において、別のビデオ処理方法が開示される。この方法は、ルールに従って、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグが、現在のスライスに関連づけられたパラメータセット又はヘッダに含まれることを指定する。
【0009】
さらに別の例示的な態様において、別のビデオ処理方法が開示される。この方法は、現在のピクチャを含むビデオとビデオのビットストリームとの間のコンバージョンを実行するステップを含み、ビットストリームはフォーマットルールに適合し、フォーマットルールは、現在のピクチャが双方向スライス(Bスライス)を除外するかどうかの指標が、現在のピクチャに関連づけられたピクチャヘッダシンタックス構造に含まれることを指定する。
【0010】
さらに別の例示的な態様において、ビデオエンコーダ装置が開示される。ビデオエンコーダは、上述の方法を実施するように構成されたプロセッサを含む。
【0011】
さらに別の例示的な態様において、ビデオデコーダ装置が開示される。ビデオデコーダは、上述の方法を実施するように構成されたプロセッサを含む。
【0012】
さらに別の例示的な態様において、コードを記憶させたコンピュータ読取可能媒体が開示される。コードは、プロセッサ実行可能コードの形式で本明細書に記載される方法の1つを具現化する。
【0013】
これら及び他の特徴が本文献を通して説明される。
【図面の簡単な説明】
【0014】
【
図1】本明細書に開示される様々な手法が実装され得る一例示的なビデオ処理システムを示すブロック図である。
【
図2】ビデオ処理に使用される一例示的なハードウェアプラットフォームのブロック図である。
【
図3】本開示のいくつかの実施形態を実施できる一例示的なビデオコーディングシステムを示すブロック図である。
【
図4】本開示のいくつかの実施形態を実施できるエンコーダの一例を示すブロック図である。
【
図5】本開示のいくつかの実施形態を実施できるデコーダの一例を示すブロック図である。
【
図6】ビデオ処理の例示的な方法のフローチャートを示す。
【
図7】ビデオ処理の例示的な方法のフローチャートを示す。
【
図8】ビデオ処理の例示的な方法のフローチャートを示す。
【
図9】ビデオ処理の例示的な方法のフローチャートを示す。
【
図10】ビデオ処理の例示的な方法のフローチャートを示す。
【発明を実施するための形態】
【0015】
セクション見出しは、本文献において理解を容易にするために用いられており、各セクションで開示される手法及び実施形態の適用可能性をそのセクションのみに限定するわけではない。さらに、H.266用語は、いくつかの説明において理解を容易にするためにのみ用いられており、開示される手法の範囲を限定するためのものではない。したがって、本明細書に記載される手法は、他のビデオコーデックプロトコル及び設計にも適用可能である。
【0016】
1. 要約
本文献は、ビデオコーディング技術に関する。具体的には、本文献は、ビデオコーディングにおけるPH及びSHシンタックスの設計に関する。このアイデアは、個々に又は様々な組み合わせで、マルチレイヤビデオコーディングをサポートする任意のビデオコーディング標準又は非標準ビデオコーデック、例えば、開発中の汎用ビデオコーディング(VVC)に適用することができる
2.略語
APS 適応パラメータセット(Adaptation Parameter Set)
AU アクセスユニット(Access Unit)
AUD アクセスユニットデリミタ(Access Unit Delimiter)
AVC 高度ビデオコーディング(Advanced Video Coding)
CLVS コーディングレイヤビデオシーケンス(Coded Layer Video Sequence)
CPB コーディングピクチャバッファ(Coded Picture Buffer)
CRA クリーンランダムアクセス(Clean Random Access)
CTU コーディングツリーユニット(Coding Tree Unit)
CVS コーディングビデオシーケンス(Coded Video Sequence)
DPB 復号ピクチャバッファ(Decoded Picture Buffer)
DPS 復号パラメータセット(Decoding Parameter Set)
EOB ビットストリーム終了(End Of Bitstream)
EOS シーケンス終了(End Of Sequence)
GDR 漸次復号リフレッシュ(Gradual Decoding Refresh)
HEVC 高効率ビデオコーディング(High Efficiency Video Coding)
HRD 仮想参照デコーダ(Hypothetical Reference Decoder)
IDR 即時復号リフレッシュ(Instantaneous Decoding Refresh)
JEM 合同探求モデル(Joint Exploration Model)
MCTS 動き制約付きタイルセット(Motion-Constrained Tile Sets)
NAL ネットワーク抽象化レイヤ(Network Abstraction Layer)
OLS 出力レイヤセット(Output Layer Set)
PH ピクチャヘッダ(Picture Header)
PPS ピクチャパラメータセット(Picture Parameter Set)
PTL プロファイル、ティア、及びレベル(Profile, Tier and Level)
PU ピクチャユニット(Picture Unit)
RBSP 未加工バイトシーケンスペイロード(Raw Byte Sequence Payload)
SEI 補足エンハンスメント情報(Supplemental Enhancement Information)
SH スライスヘッダ(Slice Header)
SPS シーケンスパラメータセット(Sequence Parameter Set)
SVC スケーラブルビデオコーディング(Scalable Video Coding)
VCL ビデオコーディングレイヤ(Video Coding Layer)
VPS ビデオパラメータセット(Video Parameter Set)
VTM VVCテストモデル(VVC Test Model)
VUI ビデオユーザビリティ情報(Video Usability Information)
VVC 汎用ビデオコーディング(Versatile Video Coding)
【0017】
3. 最初の議論
ビデオコーディング標準は、主に、周知のITU-T及びISO/IEC標準の開発を通じて発展してきた。ITU-Tは、H.261とH.263を作成し、ISO/IECは、MPEG-1とMPEG-4 Visualを作成し、この2つの組織は、H.262/MPEG-2 Video及びH.264/MPEG-4 Advanced Video Coding(AVC)及びH.265/HEVC標準を合同で作成した。H.262から、ビデオコーディング標準は、時間的予測に変換コーディングを加えたものが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越える将来のビデオコーディング技術を探求するため、2015年にVCEGとMPEGにより合同で合同ビデオ探求チーム(Joint Video Exploration Team、JVET)が設立された。それ以来、多くの新しい方法がJVETにより採用され、合同探求モデル(JEM)と命名された参照ソフトウェアに入れられている。JVET会議は、四半期に1回、同時開催されており、新しいコーディング標準は、HEVCと比較して50%のビットレート低減を目指している。新しいビデオコーディング標準は、2018年4月のJVET会議で汎用ビデオコーディング(VVC)として正式に命名され、その当時にVVCテストモデル(VTM)の最初のバージョンがリリースされた。VVC標準化に寄与する継続的な努力があるため、JVET会議毎に新しいコーディング手法がVVC標準に採用されている。VVC作業原案及びテストモデルVTMは、その後、毎会議後に更新される。VVCプロジェクトは現在、2020年7月の会議での技術的完成(FDIS)を狙っている。
3.1. PHシンタックス及びセマンティクス
最新のVVC原案文書では、PHシンタックス及びセマンティクスは以下のとおりである。
【表1】
PH RBSPは、PHシンタックス構造、すなわちpicture_header_structure()を含む。
【表2】
PHシンタックス構造は、PHシンタックス構造に関連づけられたコーディングピクチャの全てのスライスに共通する情報を含む。
【表3】
【0018】
3.2. SHシンタックス及びセマンティクス
最新のVVC原案文書では、SHシンタックス及びセマンティクスは以下のとおりである。
【表4】
【表5】
【0019】
3.3. 重み付き予測シンタックス及びセマンティクス
最新のVVC原案文書では、重み付き予測(weighted prediction)シンタックス及びセマンティクスは以下のとおりである。
【表6】
【表7】
【0020】
4.開示される技術的解決策により解決される技術的問題の例
PPS、PH、及びSHシンタックスの既存の設計は、以下の問題を有する。
1) 最新のVVC原案文書におけるpred_weight_table()シンタックスにおいて、シンタックス要素num_l1_weightsは、wp_info_in_ph_flagが1に等しいとき、pps_weighted_pred_flagが1に等しいがpps_weighted_bipred_flagが0に等しいときでさえ、シグナリングされる。結果的に、同じ条件下で、シンタックス要素uma_weight_l1_flag[i]のリストがさらにシグナリングされ、シンタックス要素luma_weight_l1_flag[i]、chroma_weight_l1_flag[i]、delta_luma_weight_l1[i]、luma_offset_l1[i]、delta_chroma_weight_l1[i][j]、及びdelta_chroma_offset_l1[i][j]のリストがさらにシグナリングされ得る。しかしながら、pps_weighted_bipred_flagが0に等しいとき、重み付き予測はBスライスに適用されず、したがって、全てのこれらのシグナリングされたシンタックス要素は役に立たない。
2) wp_info_in_ph_flagが1に等しいとき(この場合、pps_weighted_pred_flag及びpps_weighted_bipred_flagのうちの少なくとも1つが1に等しい)、pred_weight_table()シンタックス構造は、PPSを参照するピクチャのPHシンタックス構造に存在する。この場合、pps_weighted_pred_flagが0に等しいとき(この場合、pps_weighted_bipred_flagが1に等しい)、luma_weight_l0_flag[i]シンタックス要素のリストがPHシンタックス構造においてシグナリングされるが、Pスライスでは重み付き予測が適用されず、したがって、Pスライスのためのluma_weight_l0_flag[i]シンタックス要素のリストの値は0に等しいように推論されるべきである。同様に、pps_weighted_bipred_flagが0に等しいとき(この場合、pps_weighted_pred_flagは1に等しい)、重み付き予測がBスライスに適用されないため、Bスライスのためのluma_weight_l0_flag[i]シンタックス要素のリスト及びluma_weight_l1_flag[i]シンタックス要素のリストの双方が、0に等しいように推論されるべきである。
3) wp_info_in_ph_flagが1に等しいとき(この場合、pps_weighted_pred_flag及びpps_weighted_bipred_flagのうちの少なくとも1つが1に等しい)、pred_weight_table()シンタックス構造は、PPSを参照するピクチャのPHシンタックス構造に存在する。この場合、ピクチャがBスライスを有さず、同時にpps_weighted_bipred_flagが1に等しい場合、参照ピクチャリスト1のためのpred_weight_table()シンタックス構造におけるの全てのシンタックス要素は役に立たないことになる。
【0021】
5.手法及び実施形態の例
上記問題を解決するために、以下に要約した方法を開示する。発明は、一般的概念を説明するための例示として考慮されるべきであり、狭義に解釈されるべきではない。さらに、これらの発明は、個々に適用し、あるいは任意の方法で組み合わせることができる。以下の手法及び実施形態において、追加又は修正された最も関連する部分は、下線、太字、及びイタリック体のテキストで示され、最も関連する除去された部分は、太字の二重括弧で囲まれて強調されている。例えば、[[a]]は、「a」が除去されたことを示す。
1. 重み付き予測関連シンタックス要素のシグナリングについて:
1) 第1の問題を解決するために、参照ピクチャリスト1におけるエントリのための重みの数及び/又は参照ピクチャリスト1におけるエントリのためのルマ/クロマ重みをシグナリングするかどうかが、Bスライスに対する明示的重み付き予測の有効化に依存し得る。
a. 一例において、pred_weight_table()シンタックスにおいて、以下のシンタックス:
【表8】
が、以下のとおりに変更される。
【表9】
そして、以下のセマンティクス:
【表10】
が、以下のとおりに変更される。
【表11】
2) 第2の問題を解決するために、スライスヘッダセマンティクスにおいて、luma_weight_l0_flag[i]、chroma_weight_l0_flag[i]、luma_weight_l1_flag[i]、及びchroma_weight_l1_flag[i]に対して以下の推論を追加する。
a. pps_weighted_pred_flagが0に等しく、slice_typeがPに等しいとき、始めと終わりを含む0~NumRefIdxActive[0]-1の範囲におけるiの各値について、luma_weight_l0_flag[i]の値は0に等しいように推論され、chroma_weight_l0_flag[i]の値は0に等しいように推論される。
b. pps_weighted_bipred_flagが0に等しく、slice_typeがBに等しいとき、始めと終わりを含む0~NumRefIdxActive[0]-1の範囲におけるiの各値について、luma_weight_l0_flag[i]の値は0に等しいように推論され、chroma_weight_l0_flag[i]の値は0に等しいように推論される。
c. 代替的に、さらに、pps_weighted_bipred_flagが0に等しく、slice_typeがBに等しいとき、始めと終わりを含む0~NumRefIdxActive[1]-1の範囲におけるiの各値について、luma_weight_l1_flag[i]の値は0に等しいように推論され、chroma_weight_10_flag[i]の値は0に等しいように推論される。
3) 第3の問題を解決するために、以下の代替的なアプローチが適用され得る。
a. 上記の黒丸の項目2.1が適用され、Bスライスを有さないピクチャについて、エンコーダは、それらに、0に等しいpps_weighted_bipred_flagを有するPPSを参照するように強制する。後半部分は、以下の制約を追加することにより実現することができる:Bスライスを含まないピクチャは、0に等しいpps_weighted_bipred_flagを有するPPSのみを参照するものとする。
b. Bスライスを有さないピクチャについて、エンコーダは、それらに、0に等しいwp_info_in_ph_flagを有するPPSを参照するように強制する。これは、以下の制約を追加することにより実現することができる:Bスライスを含まないピクチャは、0に等しいwp_info_in_ph_flagを有するPPSのみを参照するものとする。
c. Bスライスを有さないピクチャについて、エンコーダは、pred_weight_table()シンタックス構造におけるシンタックス要素num_l1_weightsの値を、0に等しいように強制する。これは、num_l1_weightsのセマンティクスの一部として以下の制約を追加することにより実現することができる:wp_info_in_ph_flagが1に等しく、現在のピクチャがBスライスを含まないとき、num_l1_weightsの値は0に等しいものとする。
4) 明示的重み付き予測が有効にされることの指標が、1つのフラグを使用してSPSにおいてシグナリングされ得る。
a. 代替的に、さらに、この1フラグのSPS指標を使用して、SPSにおけるP及びBスライスに対する明示的重み付き予測の指標(すなわち、sps_weighted_pred_flag及びsps_weighted_bipred_flag)のシグナリングを調整してもよい。
b. 代替的に、1つ又は複数の制約フラグを一般制約情報シンタックスに追加して、明示的重み付き予測に対する制約を示してもよい。
i. 一例において、例えばno_explicit_weighted_prediction_constraint_flagと命名された、1つの制約フラグが追加され、この制約フラグが、Pスライス及びBスライスの双方に対する(又は、Pスライスだけに対する、又は、Bスライスだけに対する)明示的重み付き予測が適用されないことを示すとき、対応するSPSフラグは0に等しいものとする。
5) 明示的重み付き予測が有効にされることの指標が、1つのフラグを使用してPPSにおいてシグナリングされ得る。
a. 代替的に、さらに、この1フラグのPPS指標を使用して、PPSにおけるP及びBスライスに対する明示的重み付き予測の指標(すなわち、pps_weighted_pred_flag及びpps_weighted_bipred_flag)のシグナリングを調整してもよい。
b. 代替的に、1つ又は複数の制約フラグを一般制約情報シンタックスに追加して、明示的重み付き予測に対する制約を示してもよい。
i. 一例において、例えばno_explicit_weighted_prediction_constraint_flagと命名された、1つの制約フラグが追加され、この制約フラグが、Pスライス及びBスライスの双方に対する(又は、Pスライスだけに対する、又は、Bスライスだけに対する)明示的重み付き予測が適用されないことを示すとき、対応するPPSフラグは0に等しいものとする。
6) 明示的重み付き予測がP又はBスライスに適用されることの指標が、SPS及びPPSでシグナリングされる代わりに、ピクチャヘッダ又はスライスヘッダにおいてシグナリングされ得る。
a. 一例において、そのような指標をピクチャヘッダ又はスライスヘッダにおいてシグナリングするどうかは、RPLがどこに存在するかに従ってもよく、すなわち、(例えば、rpl_info_in_ph_flagの値に従って)RPL情報がPHシンタックス構造内に存在するか又はSHシンタックス構造内に存在するかに依存してもよい。
b. 代替的に、さらに、そのような指標をシグナリングするかどうかは、スライスのタイプに依存してもよい。
c. 代替的に、さらに、そのような指標をシグナリングするかどうかは、現在のピクチャがインタースライス(inter slices)を含み得るか、又はPスライスを含み得るか、又はBスライスを含み得るかに依存してもよい。
【0022】
2. ピクチャがBスライスを含まないかどうかの指標、及び、いくつかのシンタックス要素のシグナリングをスキップするためのこの指標の使用について:
1) 現在のピクチャがBスライスを含まないかどうかの指標が、PHシンタックス構造に追加され得る。
a. 一例において、この指標は、例えばph_b_slices_allowed_flagと命名されたフラグであり、1に等しいph_b_slices_allowed_flagは、ピクチャが1つ以上のBスライスを含み得ることを指定し、0に等しいph_b_slices_allowed_flagは、ピクチャがBスライスを含まないことを指定する。
i. 代替的に、さらに、ph_b_slices_allowed_flagは、ph_inter_slice_allowed_flagが1に等しいときにのみ、PHシンタックス構造においてシグナリングされてもよい。
ii. 代替的に、さらに、ph_inter_slice_allowed_flagが0に等しいとき、ph_b_slices_allowed_flagの値は0に等しいように推論されてもよい。
b. 一例において、ph_b_slices_allowed_flagが0に等しいとき、ref_pic_lists()シンタックス及びref_pic_list_struct()シンタックスにおける参照ピクチャリスト1のためのシンタックス要素はスキップされてもよい。
c. 一例において、ph_b_slices_allowed_flagが0に等しいとき、PHシンタックス構造におけるシンタックス要素mvd_l1_zero_flagはスキップされてもよい。
i. 代替的に、さらに、ph_b_slices_allowed_flagが0に等しいとき、mvd_l1_zero_flagの値は1に等しいように推論されてもよい。
d. 一例において、ph_b_slices_allowed_flagが0に等しいとき、参照ピクチャリスト1のためのpred_weight_table()シンタックスにおけるnum_l1_weights及び他のパラメータはスキップされてもよい。
i. 代替的に、さらに、ph_b_slices_allowed_flagが0に等しいとき、num_l1_weightの値は0に等しいように推論されてもよい。
e. 一例において、ph_b_slices_allowed_flagが0に等しいとき、SHシンタックスにおけるシンタックス要素num_ref_idx_active_minus1[1]はスキップされてもよい。
i. 代替的に、さらに、ph_b_slices_allowed_flagが0に等しいとき、NumRefIdxActive[1]の値は0に等しいように推論されてもよい。
f. 一例において、ph_b_slices_allowed_flagが0に等しいとき、SHシンタックスにおけるシンタックス要素slice_collocated_from_l0_flagはスキップされてもよい。
i. 代替的に、さらに、ph_b_slices_allowed_flagが0に等しいとき、slice_collocated_from_l0_flagの値は1に等しいように推論されてもよい。
【0023】
6. 実施形態
以下は、VVC仕様に適用することができる、上記でセクション5において要約された発明態様の一部についてのいくつかの例示的な実施形態である。変更されるテキストは、JVET-Q2001-vCにおける最新のVVCテキストに基づく。追加又は修正された最も関連する部分は、下線、太字、及びイタリック体のテキストで示され、最も関連する除去された部分は、太字の二重括弧で囲まれて強調されている。例えば、[[a]]は、「a」が除去されたことを示す。本質的に編集上のものであり、したがって強調されない、いくつかの他の変更がある。
6.1. 第1の実施形態
これは、上記でセクション5において要約された項目1.1、1.1.a、1.2.a、及び1.2.bの実施形態である。
【表12】
【表13】
【表14】
【0024】
図1は、本明細書に開示される様々な手法が実装され得る一例示的なビデオ処理システム1000を示すブロック図である。様々な実装が、システム1000のコンポーネントの一部又は全部を含んでもよい。システム1000は、ビデオコンテンツを受信する入力1002を含み得る。ビデオコンテンツは、未加工(raw)又は非圧縮のフォーマット、例えば、8又は10ビットのマルチ成分画素値で受け取ることができ、あるいは圧縮又は符号化されたフォーマットでもよい。入力1002は、ネットワークインターフェース、周辺バスインターフェース、又はストレージインターフェースを表すことができる。ネットワークインターフェースの例には、イーサネット、受動光ネットワーク(passive optical network、PON)などの有線インターフェース、及びWi-Fi又はセルラーインターフェースなどの無線インターフェースが含まれる。
【0025】
システム1000は、本文献に記載される様々なコーディング又は符号化方法を実施することができるコーディングコンポーネント(coding component)1004を含み得る。コーディングコンポーネント1004は、入力1002からコーディングコンポーネント1004の出力へのビデオの平均ビットレートを低減して、ビデオのコーディングされた表現を生成することができる。したがって、このコーディング手法は、ビデオ圧縮又はビデオトランスコーディング手法と時に呼ばれる。コーディングコンポーネント1004の出力は、コンポーネント1006により表されるように、記憶されるか、又は接続された通信を介して送信されてもよい。入力1002で受信したビデオの、記憶され又は通信されたビットストリーム(又は、コーディングされた)表現は、画素値、又はディスプレイインターフェース1010に送られる表示可能なビデオを生成するために、コンポーネント1008により使用することができる。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ解凍と時に呼ばれる。さらに、特定のビデオ処理動作は「コーディング」動作又はツールと呼ばれるが、コーディングツール又は動作はエンコーダで使用され、コーディングの結果を逆にする対応する復号ツール又は動作はデコーダにより実行されることが理解されるであろう。
【0026】
周辺バスインターフェース又はディスプレイインターフェースの例には、ユニバーサルシリアルバス(USB)又は高精細マルチメディアインターフェース(high definition multimedia interface、HDMI(登録商標))又はDisplayportなどを含んでもよい。ストレージインターフェースの例には、SATA(シリアルアドバンストテクノロジーアタッチメント(serial advanced technology attachment))、PCI、IDEインターフェースなどが含まれる。本文献に記載される手法は、携帯電話、ラップトップ、スマートフォン、又はデジタルデータ処理及び/又はビデオ表示を実行することができる他のデバイスなどの様々な電子デバイスにおいて具現化することができる。
できる。
【0027】
図2は、ビデオ処理装置2000のブロック図である。装置2000は、本明細書に記載される方法の1つ以上を実施するために使用することができる。装置2000は、スマートフォン、タブレット、コンピュータ、モノのインターネット(Internet of Things、IoT)の受信機などにおいて具現化されてもよい。装置2000は、1つ以上のプロセッサ2002、1つ以上のメモリ2004、及びビデオ処理ハードウェア2006を含むことができる。プロセッサ2002は、本文献に(例えば、
図6~
図10に)記載される1つ以上の方法を実施するように構成され得る。メモリ(複数のメモリ)2004は、本明細書に記載される方法及び手法を実施するために使用されるデータ及びコードを記憶するために使用され得る。ビデオ処理ハードウェア2006は、本文献に記載されるいくつかの手法をハードウェア回路に実装するために使用され得る。いくつかの実施形態において、ハードウェア2006は、プロセッサ2002内に部分的又は完全に存在してもよく、例えばグラフィックスプロセッサでもよい。
【0028】
図3は、本開示の手法を利用し得る一例示的なビデオコーディングシステム100を示すブロック図である。
図3に示すように、ビデオコーディングシステム100は、ソースデバイス110及び宛先デバイス120を含み得る。ソースデバイス110は、符号化されたビデオデータを生成し、これは、ビデオ符号化デバイスとして参照され得る。宛先デバイス120は、ソースデバイス110により生成された符号化ビデオデータを復号することができ、これは、ビデオ復号デバイスとして参照され得る。ソースデバイス110は、ビデオソース112、ビデオエンコーダ114、及び入力/出力(I/O)インターフェース116を含むことができる。
【0029】
ビデオソース112は、ビデオ捕捉デバイス、ビデオコンテンツプロバイダからビデオデータを受信するインターフェース、及び/又はビデオデータを生成するためのコンピュータグラフィックスシステムなどのソース、又はそのようなソースの組み合わせを含んでもよい。ビデオデータは、1つ以上のピクチャを含んでもよい。ビデオエンコーダ114は、ビデオソース112からのビデオデータを符号化してビットストリームを生成する。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットシーケンスを含んでもよい。ビットストリームは、コーディングピクチャ及び関連データを含んでもよい。コーディングピクチャは、ピクチャのコーディングされた表現である。関連データは、シーケンスパラメータセット、ピクチャパラメータセット、及び他のシンタックス構造を含んでもよい。I/Oインターフェース116は、変調器/復調器(モデム)及び/又は送信器を含んでもよい。符号化されたビデオデータは、I/Oインターフェース116を介してネットワーク130aを通じて宛先デバイス120に直接送信され得る。符号化されたビデオデータは、さらに、宛先デバイス120によるアクセスのために記憶媒体/サーバ130b上に記憶されてもよい。
【0030】
宛先デバイス120は、I/Oインターフェース126、ビデオデコーダ124、及びディスプレイデバイス122を含んでもよい。
【0031】
I/Oインターフェース126は、受信器及び/又はモデムを含んでもよい。I/Oインターフェース126は、ソースデバイス110又は記憶媒体/サーバ130bから符号化ビデオデータを取得することができる。ビデオデコーダ124は、符号化ビデオデータを復号することができる。ディスプレイデバイス122は、復号されたビデオデータをユーザに表示することができる。ディスプレイデバイス122は、宛先デバイス120と統合されてもよく、あるいは外部ディスプレイデバイスとインターフェースするように構成された宛先デバイス120の外部にあってもよい。
【0032】
ビデオエンコーダ114及びビデオデコーダ124は、高効率ビデオコーディング(HEVC)標準、汎用ビデオコーディング(VVM)標準、及び他の現在及び/又はさらなる標準などのビデオ圧縮標準に従って動作することができる。
【0033】
図4は、ビデオエンコーダ200の一例を示すブロック図であり、これは、
図3に示すシステム100内のビデオエンコーダ114でもよい。
【0034】
ビデオエンコーダ200は、本開示の手法のいずれか又は全てを実行するように構成され得る。
図4の例において、ビデオエンコーダ200は、複数の機能コンポーネントを含む。本開示に記載される手法は、ビデオエンコーダ200の様々なコンポーネント間で分担されてもよい。いくつかの例において、プロセッサは、本開示に記載される手法のいずれか又は全てを実行するように構成されてもよい。
【0035】
ビデオエンコーダ200の機能コンポーネントは、パーティション化ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205、及びイントラ予測ユニット206を含み得るプレディケーションユニット(predication unit)202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214とを含んでもよい。
【0036】
他の例において、ビデオエンコーダ200は、より多くの、より少ない、又は異なる機能コンポーネントを含んでもよい。一例において、プレディケーションユニット202は、イントラブロックコピー(IBC)ユニットを含んでもよい。IBCユニットは、プレディケーションをIBCモードで実行することができ、これにおいて、少なくとも1つの参照ピクチャは、現在の(current)ビデオブロックが位置するピクチャである。
【0037】
さらに、動き推定ユニット204及び動き補償ユニット205などのいくつかのコンポーネントが高度に統合されてもよいが、
図4の例では説明の目的で別個に示されている。
【0038】
パーティション化ユニット201は、ピクチャを1つ以上のビデオブロックにパーティション化することができる。ビデオエンコーダ200及びビデオデコーダ300は、様々なビデオブロックサイズをサポートすることができる。
【0039】
モード選択ユニット203は、例えば誤差結果に基づいて、コーディングモードのうちの1つ、イントラ又はインターを選択し、結果として生じるイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成する残差生成ユニット207に、及び、参照ピクチャとしての使用のための符号化ブロックを再構成する再構成ユニット212に提供することができる。いくつかの例において、モード選択ユニット203は、イントラ及びインタープレディケーションの組み合わせ(combination of intra and inter predication、CIIP)モードを選択することができ、これにおいて、プレディケーションは、インタープレディケーション信号及びイントラプレディケーション信号に基づく。モード選択ユニット203は、さらに、インタープレディケーションの場合に、ブロックのための動きベクトルの解像度(例えば、サブピクセル又は整数ピクセル精度)を選択してもよい。
【0040】
現在のビデオブロックに対してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ以上の参照フレームを現在のビデオブロックと比較することにより、現在のビデオブロックの動き情報を生成することができる。動き補償ユニット205は、動き情報と、バッファ213からの、現在のビデオブロックに関連づけられたピクチャ以外のピクチャの復号されたサンプルとに基づいて、現在のビデオブロックの予測ビデオブロックを決定することができる。
【0041】
動き推定ユニット204と動き補償ユニット205は、例えば、現在のビデオブロックがIスライス内にあるか、Pスライス内にあるか、又はBスライス内にあるかに依存して、現在のビデオブロックに対して異なる動作を実行することができる。
【0042】
いくつかの例において、動き推定ユニット204は、現在のビデオブロックに対して一方向の予測を実行することができ、動き推定ユニット204は、現在のビデオブロックのための参照ビデオブロックについて、リスト0又はリスト1の参照ピクチャを検索することができる。次いで、動き推定ユニット204は、参照ビデオブロックを含むリスト0又はリスト1内の参照ピクチャを示す参照インデックスと、現在のビデオブロックと参照ビデオブロックとの間の空間的変位を示す動きベクトルとを生成することができる。動き推定ユニット204は、現在のビデオブロックの動き情報として、参照インデックス、予測方向インジケータ、及び動きベクトルを出力することができる。動き補償ユニット205は、現在のビデオブロックの動き情報により示される参照ビデオブロックに基づいて、現在のブロックの予測ビデオブロックを生成することができる。
【0043】
他の例において、動き推定ユニット204は、現在のビデオブロックに対して双方向の予測を実行することができ、動き推定ユニット204は、現在のビデオブロックのための参照ビデオブロックについて、リスト0内の参照ピクチャを検索することができ、現在のビデオブロックのための別の参照ビデオブロックについて、リスト1内の参照ピクチャを検索することもできる。次いで、動き推定ユニット204は、参照ビデオブロックを含むリスト0及びリスト1内の参照ピクチャを示す参照インデックスと、参照ビデオブロックと現在のビデオブロックとの間の空間的変位を示すと動きベクトルとを生成することができる。動き推定ユニット204は、現在のビデオブロックの動き情報として、現在のビデオブロックの参照インデックス及び動きベクトルを出力することができる。動き補償ユニット205は、現在のビデオブロックの動き情報により示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成することができる。
【0044】
いくつかの例において、動き推定ユニット204は、デコーダの復号処理のための動き情報のフルセットを出力することができる。
【0045】
いくつかの例において、動き推定ユニット204は、現在のビデオのための動き情報のフルセットを出力しなくてもよい。むしろ、動き推定ユニット204は、別のビデオブロックの動き情報を参照して、現在のビデオブロックの動き情報をシグナリングしてもよい。例えば、動き推定ユニット204は、現在のビデオブロックの動き情報が近隣のビデオブロックの動き情報と十分に類似していると決定することができる。
【0046】
一例において、動き推定ユニット204は、現在のビデオブロックに関連づけられたシンタックス構造において、現在のビデオブロックが別のビデオブロックと同じ動き情報を有することをビデオデコーダ300に示す値を示すことができる。
【0047】
別の例において、動き推定ユニット204は、現在のビデオブロックに関連づけられたシンタックス構造において、別のビデオブロック及び動きベクトル差分(motion vector difference、MVD)を識別することができる。動きベクトル差分は、現在のビデオブロックの動きベクトルと、示されたビデオブロックの動きベクトルとの間の差を示す。ビデオデコーダ300は、示されたビデオブロックの動きベクトルと動きベクトル差分とを使用して、現在のビデオブロックの動きベクトルを決定することができる。
【0048】
上記で論じたように、ビデオエンコーダ200は、動きベクトルを予測的にシグナリングすることができる。ビデオエンコーダ200により実施され得る予測シグナリング手法の2つの例には、高度動きベクトルプレディケーション(advanced motion vector predication、AMVP)及びマージモードのシグナリングが含まれる。
【0049】
イントラ予測ユニット206は、現在のビデオブロックに対してイントラ予測を実行することができる。イントラ予測ユニット206が現在のビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット206は、同じピクチャ内の他のビデオブロックの復号されたサンプルに基づいて、現在のビデオブロックのための予測データを生成することができる。現在のビデオブロックのための予測データは、予測されたビデオブロックと様々なシンタックス要素を含むことができる。
【0050】
残差生成ユニット207は、現在のビデオブロックから現在のビデオブロックの予測ビデオブロックを減算することにより(例えば、マイナス記号により示される)、現在のビデオブロックのための残差データを生成することができる。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプル成分に対応する残差ビデオブロックを含むことができる。
【0051】
他の例において、例えばスキップモードでは、現在のビデオブロックについて、現在のビデオブロックのための残差データが存在しない場合があり、残差生成ユニット207は、減算動作を実行しない場合がある。
【0052】
変換処理ユニット208は、現在のビデオブロックに関連づけられた残差ビデオブロックに1つ以上の変換を適用することにより、現在のビデオブロックのための1つ以上の変換係数ビデオブロックを生成することができる。
【0053】
変換処理ユニット208が、現在のビデオブロックに関連づけられた変換係数ビデオブロックを生成した後、量子化ユニット209は、現在のビデオブロックに関連づけられた1つ以上の量子化パラメータ(QP)値に基づいて、現在のビデオブロックに関連づけられた変換係数ビデオブロックを量子化することができる。
【0054】
逆量子化ユニット210及び逆変換ユニット211は、変換係数ビデオブロックから残差ビデオブロックを再構成するために、変換係数ビデオブロックに逆量子化及び逆変換をそれぞれ適用することができる。再構成ユニット212は、再構成された残差ビデオブロックを、プレディケーションユニット202により生成された1つ以上の予測ビデオブロックからの対応するサンプルに加算して、バッファ213における記憶のために、現在のブロックに関連づけられた再構成ビデオブロックを作成することができる。
【0055】
再構成ユニット212がビデオブロックを再構成した後、ループフィルタリング動作を実行して、ビデオブロック内のビデオブロッキングアーチファクトを低減してもよい。
【0056】
エントロピー符号化ユニット214は、ビデオエンコーダ200の他の機能コンポーネントからデータを受信することができる。エントロピー符号化ユニット214がデータを受け取ると、エントロピー符号化ユニット214は、1つ以上のエントロピー符号化動作を実行してエントロピー符号化データを生成し、エントロピー符号化データを含むビットストリームを出力することができる。
【0057】
図5は、ビデオデコーダ300の一例を示すブロック図であり、これは、
図3に示すシステム100内のビデオデコーダ114でもよい。
【0058】
ビデオデコーダ300は、本開示の手法のいずれか又は全てを実行するように構成され得る。
図5の例において、ビデオデコーダ300は、複数の機能コンポーネントを含む。本開示に記載される手法は、ビデオデコーダ300の様々なコンポーネント間で分担されてもよい。いくつかの例において、プロセッサは、本開示に記載される手法のいずれか又は全てを実行するように構成されてもよい。
【0059】
図5の例において、ビデオデコーダ300は、エントロピー復号ユニット301、動き補償ユニット302、イントラ予測ユニット303、逆量子化ユニット304、逆変換ユニット305、再構成ユニット306、及びバッファ307を含む。ビデオデコーダ300は、いくつかの例において、ビデオエンコーダ200(
図4)に関して説明した符号化パスと一般に逆の復号パスを実行することができる。
【0060】
エントロピー復号ユニット301は、符号化されたビットストリームを取り出すことができる。この符号化ビットストリームは、エントロピーコーディングビデオデータ(例えば、ビデオデータの符号化されたブロック)を含むことができる。エントロピー復号ユニット301は、エントロピーコーディングビデオデータを復号することができ、エントロピー復号ビデオデータから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、及び他の動き情報を含む動き情報を決定することができる。動き補償ユニット302は、例えば、AMVP及びマージモードを実行することにより、そのような情報を決定することができる。
【0061】
動き補償ユニット302は、可能性として補間フィルタに基づいて補間を実行し、動き補償ブロックを作成することができる。サブピクセル精度で使用されるべき補間フィルタの識別子が、シンタックス要素に含まれてもよい。
【0062】
動き補償ユニット302は、ビデオブロックの符号化の間にビデオエンコーダ20により使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセル(sub-integer pixels)のための補間値を計算することができる。動き補償ユニット302は、受け取ったシンタックス情報に従ってビデオエンコーダ200により使用される補間フィルタを決定し、補間フィルタを使用して予測ブロックを作成することができる。
【0063】
動き補償ユニット302は、シンタックス情報の一部を使用して、符号化されたビデオシーケンスのフレーム及び/又はスライスを符号化するために使用されたブロックのサイズ、符号化されたビデオシーケンスのピクチャの各マクロブロックがどのようにパーティション化されるかを記述するパーティション情報、各パーティションがどのように符号化されているかを示すモード、各インター符号化ブロックのための1つ以上の参照フレーム(及び、参照フレームリスト)、及び符号化されたビデオシーケンスを復号するための他の情報を決定することができる。
【0064】
イントラ予測ユニット303は、例えばビットストリームにおいて受け取ったイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成することができる。逆量子化ユニット303は、ビットストリームにおいて提供され、エントロピー復号ユニット301により復号された量子化ビデオブロック係数を逆量子化し、すなわち量子化解除する(de-quantizes)。逆変換ユニット303は、逆変換を適用する。
【0065】
再構成ユニット306は、残差ブロックを、動き補償ユニット202又はイントラ予測ユニット303により生成された対応する予測ブロックと合計して、復号されたブロックを形成することができる。所望であれば、デブロッキングフィルタをさらに適用して復号ブロックをフィルタリングして、ブロック性アーチファクト(blockiness artifact)を除去してもよい。次いで、復号されたビデオブロックはバッファ307に記憶され、バッファ307は、後続の動き補償/イントラプレディケーションのための参照ブロックを提供し、さらに、ディスプレイデバイスにおける提示のための復号されたビデオを生ずる。
【0066】
図6~
図10は、例えば、
図1~
図5に示す実施形態において上述した技術的解決策を実施することができる例示的な方法を示す。
【0067】
図6は、ビデオ処理の一例示的な方法600のフローチャートを示す。方法600は、動作610において、ルールに従って、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行することを含み、ルールは、ピクチャパラメータセット(PPS)の第1のシンタックス要素の値及びPPSの第2のシンタックス要素の値が、第3のシンタックス要素がビットストリームに含まれるかどうかを制御することを指定し、第1のシンタックス要素は、PPSを参照するビットストリームにおけるコーディングピクチャの双方向スライス(Bスライス)に対して重み付き予測が有効にされるかどうかを示し、第2のシンタックス要素は、重み付き予測に関連する情報がPPSを参照するコーディングピクチャのピクチャヘッダ又はスライスヘッダに存在するかどうかを示し、第3のシンタックス要素は、現在のスライスの参照ピクチャリスト1に関連づけられた重みの数を示す。
【0068】
図7は、ビデオ処理の一例示的な方法700のフローチャートを示す。方法700は、動作710において、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行することを含み、ビットストリームは、予測重みが現在のスライスのスライスヘッダに含まれるかどうかを示す複数のシンタックス要素の値が、現在のスライスのスライスタイプと現在のピクチャにより参照されるPPSに含まれる第1のフラグの値とに基づいて推論されることを指定するフォーマットルールに適合する。
【0069】
図8は、ビデオ処理の一例示的な方法800のフローチャートを示す。方法800は、動作810において、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行することを含み、ビットストリームは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグを含む一般制約情報シンタックス構造が存在することを指定するフォーマットルールに適合する。
【0070】
図9は、ビデオ処理の一例示的な方法900のフローチャートを示す。方法900は、動作910において、ルールに従って、ビデオの現在のピクチャの現在のスライスとビデオのビットストリームとの間のコンバージョンを実行することを含み、ルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効化されることを示す1つ以上の制約フラグが、現在のスライスに関連づけられたパラメータセット又はヘッダに含まれることを指定する。
【0071】
図10は、ビデオ処理の一例示的な方法1000のフローチャートを示す。方法1000は、動作1010において、現在のピクチャを含むビデオとビデオのビットストリームとの間のコンバージョンを実行することを含み、ビットストリームは、現在のピクチャが双方向スライス(Bスライス)を除外するかどうかの指標が、現在のピクチャに関連づけられたピクチャヘッダシンタックス構造に含まれることを指定するフォーマットルールに適合する。
【0072】
次に、いくつかの実施形態で好適な解決策のリストを提供する。
【0073】
A1.ビデオ処理の方法であって、ルールに従って、ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、前記ルールは、ピクチャパラメータセット(PPS)の第1のシンタックス要素の値及び前記PPSの第2のシンタックス要素の値が、第3のシンタックス要素が前記ビットストリームに含まれるかどうかを制御することを指定し、前記第1のシンタックス要素は、前記PPSを参照する前記ビットストリームにおけるコーディングピクチャの双方向スライス(Bスライス)に対して重み付き予測が有効にされるかどうかを示し、前記第2のシンタックス要素は、前記重み付き予測に関連する情報が前記PPSを参照するコーディングピクチャのピクチャヘッダ又はスライスヘッダに存在するかどうかを示し、前記第3のシンタックス要素は、前記現在のスライスの参照ピクチャリスト1に関連づけられた重みの数を示す、方法。
【0074】
A2.前記第1のシンタックス要素はpps_weighted_bipred_flagであり、前記第2のシンタックス要素はwp_info_in_ph_flagであり、前記第3のシンタックス要素はnum_l1_weightsである、解決策A1に記載の方法。
【0075】
A3.前記第1のシンタックス要素がゼロに等しいことは、前記PPSを参照する前記コーディングピクチャのBスライスに対して前記重み付き予測が無効にされることを示す、解決策A1又はA2に記載の方法。
【0076】
A4.前記第1のシンタックス要素が1に等しいことは、前記PPSを参照する前記コーディングピクチャのBスライスに対して前記重み付き予測が有効にされることを示す、解決策A1又はA2に記載の方法。
【0077】
A5.シーケンスパラメータセット(SPS)に含まれる第4のシンタックス要素がゼロに等しいとき、前記第1のシンタックス要素はゼロに等しい、解決策A1又はA2に記載の方法。
【0078】
A6.前記第4のシンタックス要素はsps_weighted_bipred_flagである、解決策A5に記載の方法。
【0079】
A7.前記第1のシンタックス要素がゼロに等しいことは、前記参照ピクチャリスト1に関連づけられた前記重みの数が前記現在のスライスの前記スライスヘッダに含まれないことを示す、解決策A1又はA2に記載の方法。
【0080】
A8.前記第1のシンタックス要素が1に等しく、前記第2のシンタックス要素が1に等しいことは、前記参照ピクチャリスト1に関連づけられた前記重みの数が前記現在のスライスの前記スライスヘッダに含まれることを示す、解決策A1又はA2に記載の方法。
【0081】
A9.前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、解決策A1乃至A8のうちいずれか1項に記載の方法。
【0082】
A10.前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、解決策A1乃至A8のうちいずれか1項に記載の方法。
【0083】
A11.コンピュータ読取可能記録媒体にビデオを表すビットストリームを記憶する方法であって、解決策A1乃至A8のうちいずれか1項以上に記載の方法に従って前記ビデオから前記ビットストリームを生成するステップと、前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、を含む方法。
【0084】
A12.解決策A1乃至A11のいずれか1項以上に記載の方法を実施するように構成されたプロセッサを含むビデオ処理装置。
【0085】
A13.命令を記憶させたコンピュータ読取可能媒体であって、前記命令は実行されると、プロセッサに解決策A1乃至A11のうち1項以上に記載の方法を実施させる、コンピュータ読取可能媒体。
【0086】
A14.解決策A1乃至A11のうちいずれか1項以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
【0087】
A15.ビットストリームを記憶するビデオ処理装置であって、解決策A1乃至A11のうちいずれか1項以上に記載の方法を実施するように構成される、ビデオ処理装置。
【0088】
次に、いくつかの実施形態で好適な解決策の別のリストを提供する。
【0089】
B1.ビデオ処理の方法であって、ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、前記ビットストリームはフォーマットルールに適合し、前記フォーマットルールは、予測重みが前記現在のスライスのスライスヘッダに含まれるかどうかを示す複数のシンタックス要素の値が、前記現在のスライスのスライスタイプと、前記現在のピクチャにより参照されるピクチャパラメータセット(PPS)に含まれる第1のフラグの値とに基づいて推論されることを指定する、方法。
【0090】
B2.前記複数のシンタックス要素は、前記現在のスライスの参照ピクチャリスト0に関連づけられたルマ重みの数を示す第1のシンタックス要素と、前記現在のスライスの参照ピクチャリスト0に関連づけられたクロマ重みの数を示す第2のシンタックス要素と、前記現在のスライスの参照ピクチャリスト1に関連づけられたルマ重みの数を示す第3のシンタックス要素と、前記現在のスライスの参照ピクチャリスト1に関連づけられたルマ重みの数を示す第4のシンタックス要素とを含む、解決策B1に記載の方法。
【0091】
B3.前記第1のシンタックス要素はluma_weight_l0_flag[i]であり、前記第2のシンタックス要素はchroma_weight_l0_flag[i]であり、前記第3のシンタックス要素はluma_weight_l1_flag[i]であり、前記第4のシンタックス要素はchroma_weight_l0_flag[i]であり、iは非負の整数である、解決策B2に記載の方法。
【0092】
B4.前記第1のフラグは、前記PPSを参照するピクチャに対して重み付き予測が有効にされるかどうかを示し、前記第1のシンタックス要素及び前記第2のシンタックス要素は、前記第1のフラグがゼロに等しく、かつ前記スライスタイプが一方向予測スライス(Pスライス)であることに起因して、ゼロであるように推論される、解決策B2又はB3に記載の方法。
【0093】
B5.前記第1のフラグはpps_weighted_pred_flagである、解決策B4に記載の方法。
【0094】
B6.前記第1のフラグは、前記PPSを参照するピクチャに対して重み付き双予測(weighted bi-prediction)が有効にされるかどうかを示し、前記第1のシンタックス要素及び前記第2のシンタックス要素は、前記第1のフラグがゼロに等しく、かつ前記スライスタイプが双方向スライス(Bスライス)であることに起因して、ゼロであるように推論される、解決策B2又はB3に記載の方法。
【0095】
B7.前記第1のフラグは、前記PPSを参照するピクチャに対して重み付き双予測が有効にされるかどうかを示し、前記第3のシンタックス要素及び前記第2のシンタックス要素は、前記第1のフラグがゼロに等しく、かつ前記スライスタイプが双方向スライス(Bスライス)であることに起因して、ゼロであるように推論される、解決策B2又はB3に記載の方法。
【0096】
B8.前記第1のフラグはpps_weighted_bipred_flagである、解決策B6又はB7に記載の方法。
【0097】
B9.前記現在のピクチャは、前記現在のピクチャがBスライスを除外することに起因して、前記第1のフラグがゼロに等しいPPSを参照する、解決策B6乃至B8のうちいずれか1項に記載の方法。
【0098】
B10.前記現在のピクチャは、前記現在のピクチャがBスライスを除外することに起因して、第2のフラグがゼロに等しいPPSを参照する、解決策B6乃至B8のうちいずれか1項に記載の方法。
【0099】
B11.前記現在のスライスの参照ピクチャリスト1に関連づけられた重みの数を示すシンタックス要素の値は、第2のフラグがゼロに等しく、かつ前記現在のピクチャがBスライスを除外することに起因して、ゼロである、解決策B6乃至B8のうちいずれか1項に記載の方法。
【0100】
B12.前記第2のフラグは、重み付き予測に関連する情報が、前記PPSを参照するピクチャのピクチャヘッダ又はスライスヘッダに存在するかどうかを示す、解決策B10又はB11に記載の方法。
【0101】
B13.前記第2のフラグはwp_info_in_ph_flagである、解決策B10乃至B12のうちいずれか1項に記載の方法。
【0102】
B14.前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、解決策B1乃至B13のうちいずれか1項に記載の方法。
【0103】
B15.前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、解決策B1乃至B13のうちいずれか1項に記載の方法。
【0104】
B16.コンピュータ読取可能記録媒体にビデオを表すビットストリームを記憶する方法であって、解決策B1乃至B13のうちいずれか1項以上に記載の方法に従って前記ビデオから前記ビットストリームを生成するステップと、前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、を含む方法。
【0105】
B17.解決策B1乃至B16のいずれか1項以上に記載の方法を実施するように構成されたプロセッサを含むビデオ処理装置。
【0106】
B18.命令を記憶させたコンピュータ読取可能媒体であって、前記命令は実行されると、プロセッサに解決策B1乃至B16のうち1項以上に記載の方法を実施させる、コンピュータ読取可能媒体。
【0107】
B19.解決策B1乃至B16のうちいずれか1項以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
【0108】
B20.ビットストリームを記憶するビデオ処理装置であって、解決策B1乃至B16のうちいずれか1項以上に記載の方法を実施するように構成される、ビデオ処理装置。
【0109】
次に、いくつかの実施形態で好適な解決策のさらに別のリストを提供する。
【0110】
C1.ビデオ処理の方法であって、ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、前記ビットストリームはフォーマットルールに適合し、前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、方法。
【0111】
C2.前記1つ以上の制約フラグは前記ビットストリームに含まれる、解決策C1に記載の方法。
【0112】
C3.前記1つ以上の制約フラグは、前記現在のスライスに関連づけられたパラメータセットに含まれる、解決策C1に記載の方法。
【0113】
C4.前記1つ以上の制約フラグは、デコーダ能力情報ネットワーク抽象化レイヤ(NAL)ユニットに含まれる、解決策C1に記載の方法。
【0114】
C5.前記1つ以上の制約フラグは、前記明示的重み付き予測が前記ピクチャのセットの一方向予測スライス(Pスライス)及び双予測スライス(bi-predictive slices)(Bスライス)の一方又は双方に適用されるかどうかを示す第1の制約フラグを含み、前記第1の制約フラグの値は、前記現在のスライスに関連づけられたシーケンスパラメータセット(SPS)に含まれる第2のフラグの値と適合する、解決策C1に記載の方法。
【0115】
C6.前記第1の制約フラグはgci_no_explicit_weighted_prediction_constraint_flagである、解決策C5に記載の方法。
【0116】
C7.前記第2のフラグが1に等しいことに起因して、前記第1の制約フラグはゼロに等しい、解決策C5に記載の方法。
【0117】
C8.前記第2のフラグはsps_weighted_pred_flag又はsps_weighted_bipred_flagである、解決策C7に記載の方法。
【0118】
C9.ビデオ処理の方法であって、ルールに従って、ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、前記ルールは、明示的重み付き予測に対する制約がピクチャのセットのスライスに対して有効にされることを示す1つ以上の制約フラグが、前記現在のスライスに関連づけられたパラメータセット又はヘッダに含まれることを指定する、方法。
【0119】
C10.前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたシーケンスパラメータセット(SPS)に含まれるかどうかを示す第1のフラグを含む、解決策C9に記載の方法。
【0120】
C11.前記第1のフラグはsps_weighted_pred_flag又はsps_weighted_bipred_flagである、解決策C10に記載の方法。
【0121】
C12.前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたピクチャパラメータセット(PPS)に含まれるかどうかを示す第1のフラグを含む、解決策C9に記載の方法。
【0122】
C13.前記第1のフラグは、pps_weighted_pred_flag又はpps_weighted_bipred_flagである、解決策C12に記載の方法。
【0123】
C14.前記1つ以上の制約フラグは、前記明示的重み付き予測が一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の一方又は双方に適用されるかどうかを示す第1の制約フラグを含み、前記第1の制約フラグの値は、前記現在のスライスに関連づけられたピクチャパラメータセット(PPS)に含まれる第2の制約フラグの値と適合する、解決策C9に記載の方法。
【0124】
C15.前記1つ以上の制約フラグは、一方向予測スライス(Pスライス)又は双予測スライス(Bスライス)のための明示的重み付き予測の指標が前記現在のスライスに関連づけられたピクチャヘッダ又はスライスヘッダに含まれるかどうかを示す第1のフラグを含む、解決策C9に記載の方法。
【0125】
C16.前記指標は、参照ピクチャリストに関連する情報がピクチャヘッダシンタックス構造又はスライスヘッダシンタックス構造に含まれることに起因して、前記ピクチャヘッダ又は前記スライスヘッダにそれぞれ含まれる、解決策C15に記載の方法。
【0126】
C17.前記指標を含むことは、現在のビデオブロックに関連づけられたスライスのスライスタイプに基づく、解決策C15に記載の方法。
【0127】
C18.前記指標を含むことは、現在のピクチャがインタースライス、Pスライス、又はBスライスを含むことに基づく、解決策C15に記載の方法。
【0128】
C19.ビデオ処理の方法であって、現在のピクチャを含むビデオと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、前記ビットストリームはフォーマットルールに適合し、前記フォーマットルールは、前記現在のピクチャが双方向スライス(Bスライス)を除外するかどうかの指標が、前記現在のピクチャに関連づけられたピクチャヘッダシンタックス構造に含まれることを指定する、方法。
【0129】
C20.前記指標が1に等しいことは、前記現在のピクチャが1つ以上のBスライスを含むことを指定する、解決策C19に記載の方法。
【0130】
C21.前記指標がゼロに等しいことは、前記現在のピクチャがBスライスを除外することを指定する、解決策C19に記載の方法。
【0131】
C22.前記指標はph_b_slices_allowed_flagである、解決策C20又はC21に記載の方法。
【0132】
C23.前記指標がゼロに等しいことは、参照ピクチャリスト1に関連するシンタックス構造におけるシンタックス要素が前記ビットストリームから除外されることを指定する、解決策C19に記載の方法。
【0133】
C24.前記指標はph_b_slices_allowed_flagであり、前記シンタックス構造はref_pic_lists()又はref_pic_list_struct()である、解決策C23に記載の方法。
【0134】
C25.前記指標がゼロに等しいことは、動きベクトル差分コーディングツールのためのシンタックス構造をパースすることに関連するシンタックス要素が前記ピクチャヘッダシンタックス構造から除外されることを指定する、解決策C19に記載の方法。
【0135】
C26.前記指標がゼロに等しいことは、動きベクトル差分コーディングツールのためのシンタックス構造をパースすることに関連するシンタックス要素の値が1に等しいように推論されることを指定する、解決策C19に記載の方法。
【0136】
C27.前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はmvd_l1_zero_flagである、解決策C25又はC26に記載の方法。
【0137】
C28.前記指標がゼロに等しいことは、前記現在のピクチャにおける現在のビデオブロックの重み付き予測に関連するシンタックス要素が前記ビットストリームから除外されることを指定する、解決策C19に記載の方法。
【0138】
C29.前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はnum_l1_weightsである、解決策C28に記載の方法。
【0139】
C30.前記指標がゼロに等しいことは、前記現在のピクチャに関連づけられた参照ピクチャリストの最大参照インデックスに関連するシンタックス要素がスライスヘッダシンタックス構造から除外されることを指定する、解決策C19に記載の方法。
【0140】
C31.前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はnum_ref_idx_active_minus1である、解決策C30に記載の方法。
【0141】
C32.前記指標がゼロに等しいことは、前記現在のピクチャにおける現在のビデオブロックの時間的動きベクトル予測に使用されるコロケートスライス(collocated slice)に関連するシンタックス要素が前記現在のピクチャに関連づけられた参照ピクチャリスト0から導出され、スライスヘッダシンタックス構造から除外されることを指定する、解決策C19に記載の方法。
【0142】
C33.前記指標はph_b_slices_allowed_flagであり、前記シンタックス要素はslice_collocated_from_l0_flagである、解決策C32に記載の方法。
【0143】
C34.前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、解決策C1乃至C33のうちいずれか1項に記載の方法。
【0144】
C35.前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、解決策C1乃至C33のうちいずれか1項に記載の方法。
【0145】
C36.コンピュータ読取可能記録媒体にビデオを表すビットストリームを記憶する方法であって、解決策C1乃至C33のうちいずれか1項以上に記載の方法に従って前記ビデオから前記ビットストリームを生成するステップと、前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、を含む方法。
【0146】
C37.解決策C1乃至C36のいずれか1項以上に記載の方法を実施するように構成されたプロセッサを含むビデオ処理装置。
【0147】
C38.命令を記憶させたコンピュータ読取可能媒体であって、前記命令は実行されると、プロセッサに解決策C1乃至C36のうち1項以上に記載の方法を実施させる、コンピュータ読取可能媒体。
【0148】
C39.解決策C1乃至C36のうちいずれか1項以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
【0149】
C40.ビットストリームを記憶するビデオ処理装置であって、解決策C1乃至C36のうちいずれか1項以上に記載の方法を実施するように構成される、ビデオ処理装置。
【0150】
次に、いくつかの実施形態で好適な解決策のさらに別のリストを提供する。
【0151】
P1.ビデオ処理方法であって、ビデオのビデオ領域と前記ビデオのコーディングされた表現(coded representation)との間のコンバージョンを実行するステップ、を含み、前記コーディングされた表現はフォーマットルールに適合し、前記フォーマットルールは、前記ビデオ領域に対する重み付き予測の有効化を示す第1のフィールドの値が、前記ビデオ領域の前記コンバージョンに関連づけられた参照ピクチャリストに関連づけられた重みの数を第2のフィールドが示すかどうかを制御することを指定する、方法。
【0152】
P2.前記フォーマットルールは、前記重み付き予測が無効にされることを前記第1のフィールドが示す場合に、前記第2のフィールドが前記コーディングされた表現から除外されることを指定する、解決策P1に記載の方法。
【0153】
P3.前記参照ピクチャリストに関連づけられた前記重みの数を示す前記第2のフィールドは、ルマ重みを示す、解決策P1又はP2に記載の方法。
【0154】
P4.前記参照ピクチャリストに関連づけられた前記重みの数を示す前記第2のフィールドは、クロマ重みを示す、解決策P1乃至P3のうちいずれか1項に記載の方法。
【0155】
P5.前記参照ピクチャリストは参照ピクチャリスト1に対応する、解決策P1乃至P4のうちいずれか1項に記載の方法。
【0156】
P6.前記ビデオ領域は双方向スライス(Bスライス)に対応する、解決策P1乃至P5のうちいずれか1項に記載の方法。
【0157】
P7.前記ビデオ領域は一方向予測スライス(Pスライス)に対応する、解決策P1乃至P5のうちいずれか1項に記載の方法。
【0158】
P8.ビデオ処理方法であって、1つ以上のビデオピクチャを含むビデオと前記ビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、前記コーディングされた表現はフォーマットルールに適合し、前記フォーマットルールは、ビデオピクチャのピクチャヘッダにおけるシンタックス要素が、前記ビデオピクチャが双方向的に予測されるスライス又は双予測(Bスライス)であるスライスを含むかどうかを示すことを指定する、方法。
【0159】
P9.前記シンタックス要素は単一ビットフラグである、解決策P8に記載の方法。
【0160】
P10.前記フォーマットルールはさらに、前記ビデオピクチャがゼロ個のBスライスを含むことを前記第1のフィールドが示す場合に、第2の参照ピクチャリスト(参照ピクチャリスト1)に関連するシンタックス要素を除外する、解決策P8又はP9に記載の方法。
【0161】
P11.前記第2の参照ピクチャリストに関連する前記シンタックス要素は、前記ピクチャヘッダからのものである、解決策P10に記載の方法。
【0162】
P12.前記シンタックス要素は、前記第2の参照ピクチャリストを使用するための重みパラメータに関連するシンタックス要素を含む、解決策P10に記載の方法。
【0163】
P13.前記ビデオ領域はビデオコーディングユニットを含む、上記請求項のうちいずれか1項に記載の方法。
【0164】
P14.前記ビデオ領域はビデオピクチャを含む、上記請求項のうちいずれか1項に記載の方法。
【0165】
P15.前記コンバージョンは、前記ビデオを前記コーディングされた表現に符号化することを含む、解決策P1乃至P14のうちいずれか1項に記載の方法。
【0166】
P16.前記コンバージョンは、前記コーディングされた表現を復号して前記ビデオの画素値を生成することを含む、解決策P1乃至P14のうちいずれか1項に記載の方法。
【0167】
P17.解決策P1乃至P16のうち1項以上に記載の方法を実施するように構成されたプロセッサを含むビデオ復号装置。
【0168】
P18.解決策P1乃至P16のうち1項以上に記載の方法を実装するように構成されたプロセッサを含むビデオ符号化装置。
【0169】
P19.コンピュータコードを記憶させたコンピュータプログラム製品であって、前記コードは、プロセッサにより実行されると、前記プロセッサに解決策P1乃至P16のうちいずれか1項に記載の方法を実施させる、コンピュータプログラム製品。
【0170】
P20.本文献に記載の方法、装置、又はシステム。
【0171】
本文献において、用語「ビデオ処理」は、ビデオ符号化、ビデオ復号、ビデオ圧縮、又はビデオ解凍を指すことがある。例えば、ビデオ圧縮アルゴリズムは、ビデオの画素表現から対応するビットストリーム表現へのコンバージョンの間に適用されることがあり、あるいは逆もまた同様である。現在のビデオブロックのビットストリーム表現(又は、単にビットストリーム)は、例えば、シンタックスにより定義されるように、ビットストリーム内の異なる場所にコロケートされ(co-located)又は拡散されたビットに対応し得る。例えば、マクロブロックは、変換及びコーディングされた誤差残差値の観点から、及び、ビットストリーム内のヘッダ及び他のフィールド内のビットをさらに使用して、符号化されてもよい。
【0172】
本文献に記載される開示された及び他の解決策、例、実施形態、モジュール、及び機能動作は、デジタル電子回路で、あるいは本文献に開示された構造及びそれらの構造的同等物を含むコンピュータソフトウェア、ファームウェア、又はハードウェアで、あるいはそれらのうち1つ以上の組み合わせで実施することができる。開示された及び他の実施形態は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のため、又はデータ処理装置の動作を制御するための、コンピュータ読取可能媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実施することができる。コンピュータ読取可能媒体は、マシン読取可能記憶装置、マシン読取可能記憶基板、メモリ装置、マシン読取可能伝搬信号に影響を与える物質の組成、又は1つ以上のこれらの組み合わせとすることができる。用語「データ処理装置」は、例としてプログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するための全ての装置、デバイス、及びマシンを包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらの1つ以上の組み合わせを構成するコードを含むことができる。伝搬信号は、適切な受信機装置への送信のために情報を符号化するように生成される人工的に生成された信号、例えば、マシンにより生成された電気的、光学的、又は電磁的な信号である。
【0173】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる)は、コンパイル型又は解釈型言語を含む任意の形式のプログラミング言語で書くことができ、それは、スタンドアロンプログラムとして、又はコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、又は他のユニットとしてを含む、任意の形態でデプロイすることができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するものではない。プログラムは、他のプログラム又はデータを保持するファイルの一部分(例えば、マークアップ言語文書に記憶された1つ以上のスクリプト)に、問題のプログラム専用の単一ファイルに、又は複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ上で、又は、1つのサイトに配置され若しくは複数のサイトにわたり分散されて通信ネットワークにより相互接続される複数のコンピュータ上で、実行されるようにデプロイすることができる。
【0174】
本文献に記載されるプロセス及び論理フローは、入力データに対して動作し出力を生成することにより機能を実行するために1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサにより実行することができる。プロセス及び論理フローは、専用論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)により実行することもでき、装置もまた、これらとして実施することができる。
【0175】
コンピュータプログラムの実行に適したプロセッサには、例として、汎用及び専用双方のマイクロプロセッサ、及び任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサが含まれる。一般に、プロセッサは、読取専用メモリ又はランダムアクセスメモリ又は双方から命令及びデータを受け取る。コンピュータの必須要素は、命令を実行するプロセッサと、命令及びデータを記憶する1つ以上のメモリデバイスである。一般に、コンピュータはまた、データを記憶する1つ以上の大容量記憶デバイス、例えば、磁気、磁気光ディスク、又は光ディスクを含み、あるいはこれらからデータを受け取り、又はこれらにデータを転送し、又は双方を行うために動作上結合される。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ読取可能媒体には、例として、半導体メモリデバイス、例えば、EPROM、EEPROM、及びフラッシュメモリデバイス;磁気ディスク、例えば、内部ハードディスク又はリムーバブルディスク;磁気光ディスク;並びにCD ROM及びDVD-ROMディスクを含む、全ての形態の不揮発性メモリ、媒体、及びメモリデバイスが含まれる。プロセッサ及びメモリは、専用論理回路により補足し、又は専用論理回路に組み込むことができる。
【0176】
本特許文献は多くの詳細を含むが、これらは、いずれかの対象事項又は請求され得るものの範囲に対する限定とみなされるべきではなく、むしろ、特定の手法の特定の実施形態に特有であり得る特徴の説明とみなされるべきである。別個の実施形態の文脈において本特許文献に記載されている特定の特徴は、単一の実施形態で組み合わせて実施することもできる。逆に、単一の実施形態の文脈において記載されている様々な特徴は、複数の実施形態において別個に、又は任意の適切なサブコンビネーションで実施することもできる。さらに、特徴は、特定の組み合わせにおいて作用するものとして上述され、そのようなものとして最初に請求されることさえあるが、請求された組み合わせからの1つ以上の特徴を、いくつかの場合、組み合わせから切り出すことができ、請求される組み合わせは、サブコンビネーション、又はサブコンビネーションのバリエーションに向けられ得る。
【0177】
同様に、動作は図面において特定の順序で示されているが、これは、所望の結果を達成するために、そのような動作が図示される特定の順序で又は順番に実行されること、又は全ての例示された動作が実行されることを要求するものとして理解されるべきではない。さらに、本特許文献に記載されている実施形態における様々なシステムコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきではない。
【0178】
少数の実装及び例のみが記載されており、本特許文献に記載及び例示されているものに基づいて他の実装、拡張、及びバリエーションがなされ得る。
【手続補正書】
【提出日】2022-08-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ処理の方法であって、
ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットの
一方向予測スライス
(Pスライス)及び双予測スライス(Bスライス)の双方に対して有効にされることを示す
第1の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、方法。
【請求項2】
前記
第1の制約フラグは前記ビットストリームに含まれる、請求項1に記載の方法。
【請求項3】
前記
第1の制約フラグは、前記現在のスライスに関連づけられたパラメータセットに含まれる、請求項1に記載の方法。
【請求項4】
前記
第1の制約フラグは、デコーダ能力情報ネットワーク抽象化レイヤ(NAL)ユニットに含まれる、請求項1に記載の方法。
【請求項5】
前記第1の制約フラグの値が、前記明示的重み付き予測が前記Pスライス及び前記Bスライスの双方に適用されないことを示すとき、シーケンスパラメータセット(SPS)に含まれる第2のフラグの値は、前記明示的重み付き予測が前記SPSを参照する前記Pスライスに適用されないことを示し、前記SPSに含まれる第3のフラグの値は、前記明示的重み付き予測が前記SPSを参照する前記Bスライスに適用されないことを示す、請求項1乃至4のうちいずれか1項に記載の方法。
【請求項6】
前記第1の制約フラグはgci_no_explicit_weighted_prediction_constraint_flagである、請求項
1乃至5
のうちいずれか1項に記載の方法。
【請求項7】
前記第2のフラグはsps_weighted_pred_flag
であり、前記第3のフラグはsps_weighted_bipred_flagである、請求項
5又は6に記載の方法。
【請求項8】
前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、請求項1乃至
7のうちいずれか1項に記載の方法。
【請求項9】
前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、請求項1乃至
7のうちいずれか1項に記載の方法。
【請求項10】
プロセッサと、命令を有する非一時的メモリとを含む、ビデオデータを処理する装置であって、前記命令は前記プロセッサにより実行されると、前記プロセッサに、
ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行させ、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットの一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の双方に対して有効にされることを示す第1の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、装置。
【請求項11】
命令を記憶する非一時的コンピュータ読取可能記憶媒体であって、前記命令はプロセッサに、
ビデオの現在のピクチャの現在のスライスと前記ビデオのビットストリームとの間のコンバージョンを実行させ、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットの一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の双方に対して有効にされることを示す第1の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、非一時的コンピュータ読取可能記憶媒体。
【請求項12】
ビデオ処理装置により実行される方法により生成されるビデオのビットストリームを記憶する非一時的コンピュータ読取可能記録媒体であって、前記方法は、
現在のスライスを含む現在のピクチャを含む前記ビデオの前記ビットストリームを生成するステップを含み、
前記ビットストリームはフォーマットルールに適合し、
前記フォーマットルールは、明示的重み付き予測に対する制約がピクチャのセットの一方向予測スライス(Pスライス)及び双予測スライス(Bスライス)の双方に対して有効にされることを示す第1の制約フラグを含む一般制約情報シンタックス構造が存在することを指定する、非一時的コンピュータ読取可能記録媒体。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】変更
【補正の内容】
【0001】
[関連出願の相互参照]
本出願は、2020年2月19日に出願された米国仮特許出願第US62/978,740号の優先権及び利益を主張する、2021年1月26日に出願された国際特許出願第PCT/US2021/015017号に基づく。全ての前述の特許出願がその全体を参照により本明細書に組み込まれる。
【国際調査報告】