(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-14
(45)【発行日】2024-06-24
(54)【発明の名称】ビデオコーディングにおける組み合わされた残差コーディング
(51)【国際特許分類】
H04N 19/186 20140101AFI20240617BHJP
H04N 19/12 20140101ALI20240617BHJP
H04N 19/60 20140101ALI20240617BHJP
H04N 19/85 20140101ALI20240617BHJP
【FI】
H04N19/186
H04N19/12
H04N19/60
H04N19/85
(21)【出願番号】P 2021551966
(86)(22)【出願日】2020-03-06
(86)【国際出願番号】 US2020021544
(87)【国際公開番号】W WO2020185619
(87)【国際公開日】2020-09-17
【審査請求日】2023-02-15
(32)【優先日】2019-03-08
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-06-25
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-03-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100158805
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100112807
【氏名又は名称】岡田 貴志
(72)【発明者】
【氏名】ファン・デル・オーウェラ、ゲールト
(72)【発明者】
【氏名】レイ、バッパディティア
(72)【発明者】
【氏名】ラマスブラモニアン、アダルシュ・クリシュナン
(72)【発明者】
【氏名】コバン、ムハンメド・ゼイド
(72)【発明者】
【氏名】ファン・バン、ルオン
(72)【発明者】
【氏名】カルチェビチ、マルタ
【審査官】久保 光宏
(56)【参考文献】
【文献】Jianle Chen, et al.,"Algorithm description for Versatile Video Coding and Test Model 4 (VTM 4)",Document: JVET-M1002-v1, [online],JVET-M1002 (version 1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年02月16日,Pages 1-4, 54-58,[令和5年11月27日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=5756> and <URL: https://jvet-experts.org/doc_end_user/documents/13_Marrakech/wg11/JVET-M1002-v1.zip>.,(See document file "JVET-M1002-v1.docx" in the zip file "JVET-M1002-v1.zip".)
【文献】Jani Lainema,"CE7-related: Joint coding of chrominance residuals",Document: JVET-M0305, [online],JVET-M0305 (version 3),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年01月16日,Pages 1-5,[令和6年5月9日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=5112> and <URL: https://jvet-experts.org/doc_end_user/documents/13_Marrakech/wg11/JVET-M0305-v3.zip>.,(See document file "JVET-M0305-v2.docx" in the zip file "JVET-M0305-v3.zip".)
【文献】Christian Helmrich, et al.,"CE7: Joint chroma residual coding with multiple modes (tests CE7-2.1, CE7-2.2)",Document: JVET-O0105-v2, [online],JVET-O0105 (version 2),2019年06月21日,Pages 1-9,[令和6年5月9日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=6709> and <URL: https://jvet-experts.org/doc_end_user/documents/15_Gothenburg/wg11/JVET-O0105-v2.zip>.,(See document file "JVET-O0105-v2.docx" in the zip file "JVET-O0105-v2.zip".)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00-19/98
CSDB(日本国特許庁)
学術文献等データベース(日本国特許庁)
IEEEXplore(IEEE)
(57)【特許請求の範囲】
【請求項1】
ビデオデータを復号する方法であって、
変換領域からサンプル領域に前記ビデオデータのブロックの変換係数の
第1のセットを変換するために逆変換を適用することによって
第1の復号され修正されたクロマ残差データを生成することと、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、
前記ビデオデータを含むビデオビットストリームからフラグを復号することと、
前記
第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記
第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、
前記第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記
第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成することと
を備え、前記第1および第2の逆残差修正関数は、前記フラグによって決定されることを特徴とする、方法。
【請求項2】
前記ブロックを再構成することは、
前記ブロックの第1の再構成されたクロマデータを取得するために第1の予測されたクロマデータに前記第1の逆修正されたクロマ残差データを加算することと、
前記ブロックの第2の再構成されたクロマデータを取得するために第2の予測されたクロマデータに前記第2の逆修正されたクロマ残差データを加算することと
を備える、請求項1に記載の方法。
【請求項3】
前記方法が、
前記第1の逆修正されたクロマ残差データを生成するために前記復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数を適用すべきかを決定することと、
前記第2の逆修正されたクロマ残差データを生成するために前記復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数を適用すべきかを決定することと
をさらに備える、請求項1に記載の方法。
【請求項4】
前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することは、前記第1の逆修正されたクロマ残差データを生成するために、ビットストリーム中でシグナリングされるデータに基づいて、前記復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することを備え、
前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することは、前記第2の逆修正されたクロマ残差データを生成するために、前記ビットストリーム中でシグナリングされる前記データに基づいて、前記復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することを備える、請求項3に記載の方法。
【請求項5】
前記第1の逆残差修正関数は、invF1(x,y)=(resCr(x,y)’+B10)/M10+(resCb(x,y)’+B11)/M11であり、
前記第2の逆残差修正関数は、invF2(x,y)=(resCr(x,y)’+B20)/M20-(resCb(x,y)’+B21)/M21であり、
ここで、resCb(x,y)’は、前記第1の復号され修正されたクロマ残差データであり、resCr(x,y)’は、前記第2の復号され修正されたクロマ残差データであり、B10、B11、B20、およびB21は、丸め項であり、M10、M11、M20および
M21は、正規化係数である、請求項1に記載の方法。
【請求項6】
ビデオデータを符号化する方法であって、
修正されたクロマ残差データを生成するために前記ビデオデータのブロックの第1のクロマ残差データおよび前記ブロックの第2のクロマ残差データに残差修正関数を適用することと、ここにおいて、前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられる、
前記修正されたクロマ残差データを符号化することと、ここにおいて、前記修正されたクロマ残差データを符号化することは、前記第1のクロマ残差データおよび前記第2のクロマ残差データに前記残差修正関数を適用した後に、サンプル領域から変換領域に前記修正されたクロマ残差データを変換するために前記修正されたクロマ残差データに順変換を適用することを備える、
前記ビデオデータを含
むビデオビットストリーム中のフラグを符号化することと
を備え、前記フラグは、前記符号化され
た前記修正されたクロマ残差データ
にデコーダにより適用される第1および第2の逆残差修正関数を示すことを特徴とする、方法。
【請求項7】
前記方法が、
複数の残差修正関数か
ら第1の残差修正関数を決定することと、
第2の複数の残差修正関数か
ら第2の残差修正関数を決定することと、
ここにおいて、前記フラグは、前記決定された第1および第2の残差修正関数を示す、
をさらに備える、請求項6に記載の方法。
【請求項8】
ビデオデータを復号するためのデバイスであって、
変換領域からサンプル領域に前記ビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって
第1の復号され修正されたクロマ残差データを生成するための手段と、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成するための手段と、
前記ビデオデータを含むビデオビットストリームからフラグを復号するための手段と、
前記
第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記
第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用するための手段と、
前記
第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記
第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用するための手段と、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成するための手段と
を備え、第1の逆残差修正関数を適用するための前記手段は、前記復号されたフラグに基づいて前記第1の逆残差修正関数を決定し、第2の逆残差修正関数を適用するための前記手段は、前記復号されたフラグに基づいて前記第2の逆残差修正関数を決定することを特徴とする、デバイス。
【請求項9】
請求項2乃至5のいずれか一項に記載の方法を実行するための手段をさらに備える、請求項8に記載のデバイス。
【請求項10】
ビデオデータを符号化するためのデバイスであって、
修正されたクロマ残差データを生成するために前記ビデオデータのブロックの第1のクロマ残差データおよび前記ブロックの第2のクロマ残差データに残差修正関数を適用するための手段と、ここにおいて、前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられる、
前記修正されたクロマ残差データを符号化するための手段と、ここにおいて、前記修正されたクロマ残差データを符号化することは、前記第1のクロマ残差データおよび前記第2のクロマ残差データに前記残差修正関数を適用した後に、サンプル領域から変換領域に前記修正されたクロマ残差データを変換するために前記修正されたクロマ残差データに順変換を適用するための手段を備える、
前記ビデオデータを含
むビデオビットストリーム中のフラグを符号化するための手段と
を備え、前記フラグは、前記符号化され
た前記修正されたクロマ残差データ
にデコーダにより適用される第1および第2の逆残差修正関数を示すことを特徴とする、デバイス。
【請求項11】
請求項7に記載の方法を実行するための手段をさらに備える、請求項10に記載のデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
[0001] 本出願は、各々の内容全体が参照により組み込まれる2020年3月5日に出願された米国特許出願第16/810,680号、2019年3月8日に出願された米国仮特許出願第62/815,936号、および2019年6月25日に出願された米国仮特許出願第62/866,450号の利益を主張する。
【0002】
[0002] 本開示は、ビデオ符号化(video encoding)およびビデオ復号(video decoding)に関する。
【背景技術】
【0003】
[0003] デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタルレコーディングデバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、ビデオゲーム機、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、幅広いデバイスの中に組み込まれ得る。デジタルビデオデバイスは、MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4,Part10,アドバンストビデオコーディング(AVC)、ITU-T H.265/高効率ビデオコーディング(HEVC)によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
【0004】
[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間(ピクチャ内)予測および/または時間(ピクチャ間)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオピクチャまたはビデオピクチャの一部分)が、コーディングツリーユニット(CTU)、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャ中の参照サンプルに対する時間予測を使用し得る。ピクチャは、フレームと呼ばれることがあり、参照ピクチャは、参照フレームと呼ばれることがある。
【発明の概要】
【0005】
[0005] 概して、本開示では、ビデオコーディング(video coding)における組み合わされた残差コーディング(combined residual coding)のための技法について説明する。本明細書で説明されるように、ビデオエンコーダ(video encoder)とビデオデコーダ(video decoder)とは、ビデオデータ(video data)のブロック(block)を符号化(encode)および復号する(decode)ために組み合わされた残差コーディングを実行し得る。組み合わされた残差コーディングを実行するために、ビデオエンコーダは、ブロックのCb残差データに第1の残差修正関数(first residual modification function)を適用し、ブロックのCr残差データに第2の残差修正関数(second residual modification function)を適用し得る。第1の残差修正関数は、ブロックの元のCb残差データとブロックのCr残差データとの両方に基づいてブロックのCb残差データを修正する。同様に、第2の残差修正関数は、ブロックの元のCr残差データとブロックのCb残差データとの両方に基づいてブロックのCr残差データを修正する。ビデオデコーダは、ブロックの復号されたCb残差データとCr残差データとに逆残差修正関数(inverse residual modification function)を適用する(apply)。残差修正関数(residual modification function)を適用することによって、ビデオエンコーダは、より小さい値を使用してCbクロマ残差データとCrクロマ残差データとを表すことが可能であり得る。より小さい値は、より少数のビットを使用して符号化され得る。したがって、残差修正関数の適用は、より大きいコーディング効率(coding efficiency)(たとえば、より大きい圧縮)を生じ得る。
【0006】
[0006] 一例では、本開示は、ビデオデータを復号する方法であって、変換領域(transform domain)からサンプル領域(sample domain)にビデオデータのブロックの変換係数の第1のセット(first set of transform coefficients of a block)を変換する(convert)ために逆変換(inverse transform)を適用することによって第1の復号され修正されたクロマ残差データ(first decoded modified chroma residual data)を生成する(generate)ことと、変換領域からサンプル領域にブロックの変換係数の第2のセット(a second set of transform coefficients)を変換するために逆変換を適用することによって第2の復号され修正されたクロマ残差データ(second decoded modified chroma residual data)を生成することと、第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データ(first inverse modified chroma residual data)を生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数(first inverse residual modification function)を適用することと、第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データ(second inverse modified chroma residual data)を生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数(second inverse residual modification function)を適用することと、ここにおいて、第1の復号され修正されたクロマ残差データは、第1のクロマ成分(first chroma component)に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分(second chroma component)に関連付けられる、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成する(reconstruct)こととを備える方法について説明する。
【0007】
[0007] 別の例では、本開示は、ビデオデータを符号化する(encode)方法であって、第1の修正されたクロマ残差データ(first modified chroma residual data)を生成するためにビデオデータのブロックの第1のクロマ残差データ(first chroma residual data)に第1の残差修正関数を適用することと、第1の修正されたクロマ残差データを符号化することと、ここにおいて、第1の修正されたクロマ残差データを符号化することは、第1のクロマ残差データに第1の残差修正関数を適用した後に、サンプル領域から変換領域に第1の修正されたクロマ残差データを変換するために第1の修正されたクロマ残差データに順変換(forward transform)を適用することを備える、第2の修正されたクロマ残差データ(second modified chroma residual data)を生成するためにブロックの第2のクロマ残差データ(second chroma residual data)に第2の残差修正関数を適用することと、第2の修正されたクロマ残差データを符号化することとを備え、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられ、第2の修正されたクロマ残差データを符号化することは、第2のクロマ残差データに第2の残差修正関数を適用した後に、サンプル領域から変換領域に第2の修正されたクロマ残差データを変換するために第2の修正されたクロマ残差データに順変換を適用することを備える、方法について説明する。
【0008】
[0008] 別の例では、本開示は、ビデオデータを復号するためのデバイス(device)であって、ビデオデータを記憶する(store)ためのメモリ(memory)と、回路(circuitry)中に実装された1つまたは複数のプロセッサ(processor)とを備え、1つまたは複数のプロセッサは、変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成することと、変換領域からサンプル領域にブロックの変換係数の第2のセットを変換するために逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成することとを行うように構成された、デバイスについて説明する。
【0009】
[0009] 別の例では、本開示は、ビデオデータを符号化するためのデバイスであって、ビデオデータを記憶するためのメモリと、回路中で実装された1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサは、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用することと、第1の修正されたクロマ残差データを符号化することと、ここにおいて、1つまたは複数のプロセッサは、第1の修正されたクロマ残差データを符号化することの一部として、1つまたは複数のプロセッサは、第1のクロマ残差データに第1の残差修正関数を適用した後に、サンプル領域から変換領域に第1の修正されたクロマ残差データを変換するために第1の修正されたクロマ残差データに順変換を適用することを行うように構成される、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用することと、第2の修正されたクロマ残差データを符号化することとを行うように構成され、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられ、1つまたは複数のプロセッサは、第2の修正されたクロマ残差データを符号化することの一部として、1つまたは複数のプロセッサは、第2のクロマ残差データに第2の残差修正関数を適用した後に、サンプル領域から変換領域に第2の修正されたクロマ残差データを変換するために第2の修正されたクロマ残差データに順変換を適用することを行うように構成される、デバイスについて説明する。
【0010】
[0010] 別の例では、本開示は、ビデオデータを復号するためのデバイスであって、変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成するための手段と、変換領域からサンプル領域にブロックの変換係数の第2のセットを変換するために逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成するための手段と、第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用するための手段と、第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用するための手段と、ここにおいて、第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成するための手段とを備えるデバイスについて説明する。
【0011】
[0011] 別の例では、本開示は、ビデオデータを符号化するためのデバイスであって、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用するための手段と、第1の修正されたクロマ残差データを符号化するための手段と、ここにおいて、第1の修正されたクロマ残差データを符号化することは、第1のクロマ残差データに第1の残差修正関数を適用した後に、サンプル領域から変換領域に第1の修正されたクロマ残差データを変換するために第1の修正されたクロマ残差データに順変換を適用するための手段を備える、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用するための手段と、第2の修正されたクロマ残差データを符号化するための手段とを備え、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられ、第2の修正されたクロマ残差データを符号化するための手段は、第2のクロマ残差データに第2の残差修正関数を適用した後に、サンプル領域から変換領域に第2の修正されたクロマ残差データを変換するために第2の修正されたクロマ残差データに順変換を適用するための手段を備える、デバイスについて説明する。
【0012】
[0012] 別の例では、本開示は、命令(instruction)を記憶したコンピュータ可読記憶媒体(computer-readable storage medium)であって、命令は、実行されたとき、1つまたは複数のプロセッサに、変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成することと、変換領域からサンプル領域にブロックの変換係数の第2のセットを変換するために逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成することとを行わせる、コンピュータ可読記憶媒体について説明する。
【0013】
[0013] 別の例では、本開示は、命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されたとき、1つまたは複数のプロセッサに、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用することと、第1の修正されたクロマ残差データを符号化することと、ここにおいて、1つまたは複数のプロセッサに、第1の修正されたクロマ残差データを符号化させることの一部として、命令の実行は、1つまたは複数のプロセッサに、第1のクロマ残差データに第1の残差修正関数を適用した後に、サンプル領域から変換領域に第1の修正されたクロマ残差データを変換するために第1の修正されたクロマ残差データに順変換を適用することを行わせる、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用することと、第2の修正されたクロマ残差データを符号化することとを行わせ、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられ、1つまたは複数のプロセッサに、第2の修正されたクロマ残差データを符号化させることの一部として、命令の実行は、1つまたは複数のプロセッサに、第2のクロマ残差データに第2の残差修正関数を適用した後に、サンプル領域から変換領域に第2の修正されたクロマ残差データを変換するために第2の修正されたクロマ残差データに順変換を適用することを行わせる、コンピュータ可読記憶媒体について説明する。
【0014】
[0014] 1つまたは複数の例の詳細が添付の図面および以下の説明に記載される。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。
【図面の簡単な説明】
【0015】
【
図1】[0015] 本開示の技法を実行し得る例示的なビデオ符号化および復号システムを示すブロック図。
【
図2】[0016] インループルーマ再形成器(in-loop luma reshaper)を用いたイントラスライス再構成(intra slice reconstruction)の一例を示すブロック図。
【
図3】[0017] インループルーマ再形成器を用いたインタースライス再構成(inter slice reconstruction)の一例を示すブロック図。
【
図4】[0018] クロマ残差スケーリング(chroma residual scaling)を用いたイントラモード再構成(intra mode reconstruction)とインターモード再構成(inter mode reconstruction)との一例を示すブロック図。
【
図5A】[0019] 例示的な4分木2分木(QTBT)構造を示す概念図。
【
図5B】対応するコーディングツリーユニット(CTU)を示す概念図。
【
図6】[0020] 本開示の技法を実行し得る例示的なビデオエンコーダ(video encoder)を示すブロック図。
【
図7】[0021] 本開示の技法を実行し得る例示的なビデオデコーダ(video decoder)を示すブロック図。
【
図8】[0022] 現在のブロックを符号化するための例示的な方法を示すフローチャート。
【
図9】[0023] ビデオデータの現在のブロックを復号するための例示的な方法を示すフローチャート。
【
図10】[0024] 本開示の1つまたは複数の技法による、ビデオエンコーダの例示的な動作を示すフローチャート。
【
図11】[0025] 本開示の1つまたは複数の技法による、ビデオデコーダの例示的な動作を示すフローチャート。
【発明を実施するための形態】
【0016】
[0026] ビデオデータは、しばしば、YCbCr色空間で表される。すなわち、ピクチャの各ピクセルは、ルーマ、Y、成分と2つのクロマ成分CbおよびCrとによって表され得る。YCbCr色空間中にビデオデータを表すことは、赤緑青(RGB)色空間に固有の冗長性を低減し得る。しかしながら、有意な相関は、Cb値とCr値との間に残り得る。この相関を低減することにより、より良いコーディング効率が可能になり得る。
【0017】
[0027] 本開示は、コーディング効率を改善し得る成分間の相関を低減し得る技法について説明する。本明細書で説明されるように、ビデオエンコーダは、残差クロマデータ(residual chroma data)に残差修正関数(RMF:residual modification function)を適用し得る。ビデオデコーダは、復号された残差クロマデータに逆RMFを適用し得る。逆RMFは、ビデオエンコーダによって適用されるRMFの効果を少なくとも部分的に逆転し得る。本明細書で説明されるように、クロマ成分のための残差クロマデータに適用されるRMFは、クロマ成分と他のクロマ成分とのための残差クロマデータを使用し得る。したがって、修正されたクロマ残差データの2つのセットは、単一のブロックの異なるクロマ成分について依然として符号化されるが、ビデオエンコーダは、互いを考慮してクロマ成分のためのクロマ残差データを修正する。そのようなRMFを適用することは、コーディング効率を改善し得る。たとえば、そのようなRMFの適用が、クロマ残差データ(chroma residual data)の値を低減し得るので、そのようなRMFを適用することは、ビデオデータを符号化するのに必要とされるビット数(number of bits)を低減し得る。
【0018】
[0028] 一例では、ビデオエンコーダは、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用し得る。ビデオエンコーダはまた、第1の修正されたクロマ残差データを符号化し得る。第1の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダは、第1のクロマ残差データに第1の残差修正関数を適用した後に、サンプル領域から変換領域に第1の修正されたクロマ残差データを変換するために第1の修正されたクロマ残差データに順変換を適用し得る。さらに、ビデオエンコーダは、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用し得る。ビデオエンコーダはまた、第2の修正されたクロマ残差データを符号化し得る。第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられる。第2の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダは、第2のクロマ残差データに第2の残差修正関数を適用した後に、サンプル領域から変換領域に第2の修正されたクロマ残差データを変換するために第2の修正されたクロマ残差データに順変換を適用し得る。
【0019】
[0029] 同様に、ビデオデコーダは、変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成し得る。さらに、ビデオデコーダは、変換領域からサンプル領域にブロックの変換係数の第2のセットを変換するために逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成し得る。第1の復号され修正されたクロマ残差データを生成した後に、ビデオデコーダは、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用し得る。第2の復号され修正されたクロマ残差データを生成した後に、ビデオデコーダは、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用し得る。第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる。ビデオデコーダは、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成し得る。
【0020】
[0030]
図1は、本開示の技法を実行し得る例示的なビデオ符号化および復号システム100を示すブロック図である。本開示の技法は、概して、ビデオデータをコーディング(符号化および/または復号)することを対象とする。概して、ビデオデータは、ビデオを処理するための何らかのデータを含む。したがって、ビデオデータは、生の符号化されていないビデオ、符号化されたビデオ、復号された(たとえば、再構築された)ビデオ、およびシグナリングデータ(signaling data)などのビデオメタデータ(video metadata)を含み得る。
【0021】
[0031]
図1に示されているように、システム100は、この例では、宛先デバイス116によって復号および表示されるべき符号化ビデオデータを提供するソースデバイス102を含む。詳細には、ソースデバイス102は、コンピュータ可読媒体110を介してビデオデータを宛先デバイス116に提供する。ソースデバイス102および宛先デバイス116は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス(set-top box)、電話ハンドセットこのようなスマートフォン、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを含み得る。いくつかの場合には、ソースデバイス102と宛先デバイス116とは、ワイヤレス通信のために装備され得、したがって、ワイヤレス通信デバイスと呼ばれることがある。
【0022】
[0032]
図1の例では、ソースデバイス102は、ビデオソース104と、メモリ106と、ビデオエンコーダ200と、出力インターフェース108とを含む。宛先デバイス116は、入力インターフェース122と、ビデオデコーダ300と、メモリ120と、ディスプレイデバイス118とを含む。本開示によれば、ソースデバイス102のビデオエンコーダ200と、宛先デバイス116のビデオデコーダ300とは、組み合わされた残差コーディング(CRC:combined residual coding)のための本開示の技法を適用するように構成され得る。したがって、ソースデバイス102は、ビデオ符号化デバイスの一例を表し、一方、宛先デバイス116は、ビデオ復号デバイスの一例を表す。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス102は、外部カメラなどの外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイス116は、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。
【0023】
[0033]
図1に示されているシステム100は一例にすぎない。概して、いかなるデジタルビデオ符号化および/または復号デバイスも、組み合わされた残差コーディングのための本開示の技法を実行し得る。ソースデバイス102と宛先デバイス116とは、ソースデバイス102が宛先デバイス116への送信のためにコード化ビデオデータを生成するようなコーディングデバイスの例にすぎない。本開示では、「コーディング」デバイスをデータのコーディング(符号化および/または復号)を実行するデバイスと称する。したがって、ビデオエンコーダ200とビデオデコーダ300とは、コーディングデバイス、特に、それぞれビデオエンコーダとビデオデコーダとの例を表す。いくつかの例では、ソースデバイス102と宛先デバイス116とは、ソースデバイス102と宛先デバイス116との各々がビデオ符号化および復号構成要素を含むように、実質的に対称的に動作し得る。したがって、システム100は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、またはビデオ電話のために、ソースデバイス102と宛先デバイス116との間で1方向または2方向のビデオ送信をサポートし得る。
【0024】
[0034] 概して、ビデオソース104は、ビデオデータ(すなわち、生の符号化されていないビデオデータ)のソースを表し、ビデオデータの連続的な一連のピクチャ(「フレーム」とも呼ばれる)をビデオエンコーダ200に提供し、ビデオエンコーダ200は、ピクチャのためにデータを符号化する。ソースデバイス102のビデオソース104は、ビデオカメラ、以前にキャプチャされた生のビデオを含んでいるビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースなど、ビデオキャプチャデバイスを含み得る。さらなる代替として、ビデオソース104は、ソースビデオとして、コンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。各場合において、ビデオエンコーダ200は、キャプチャされたビデオデータ、プリキャプチャされたビデオデータ、またはコンピュータ生成されたビデオデータを符号化する。ビデオエンコーダ200は、ピクチャを、(「表示順序」と呼ばれることがある)受信順序から、コーディングのためのコーディング順序に並べ替え得る。ビデオエンコーダ200は、符号化ビデオデータを含むビットストリーム(bitstream)を生成し得る。ソースデバイス102は、次いで、たとえば、宛先デバイス116の入力インターフェース122による受信および/または取出しのために、出力インターフェース108を介して符号化ビデオデータをコンピュータ可読媒体110上に出力し得る。
【0025】
[0035] ソースデバイス102のメモリ106と、宛先デバイス116のメモリ120とは、汎用メモリを表す。いくつかの例では、メモリ106、120は、未加工のビデオデータ、たとえば、ビデオソース104からの未加工のビデオ、およびビデオデコーダ300からの未加工の、復号されたビデオデータを記憶し得る。追加または代替として、メモリ106、120は、たとえば、それぞれ、ビデオエンコーダ200およびビデオデコーダ300によって実行可能なソフトウェア命令を記憶し得る。メモリ106とメモリ120とは、この例ではビデオエンコーダ200とビデオデコーダ300とは別個に示されているが、ビデオエンコーダ200とビデオデコーダ300とは、機能的に同様または等価な目的で内部メモリをも含み得ることを理解されたい。さらに、メモリ106、120は、符号化ビデオデータ、たとえば、ビデオエンコーダ200からの出力、およびビデオデコーダ300への入力を記憶し得る。いくつかの例では、メモリ106、120の部分は、たとえば、生の復号および/または符号化ビデオデータを記憶するために、1つまたは複数のビデオバッファとして割り振られ得る。
【0026】
[0036] コンピュータ可読媒体110は、ソースデバイス102から宛先デバイス116に符号化ビデオデータを移送することが可能な任意のタイプの媒体またはデバイスを表し得る。一例では、コンピュータ可読媒体110は、ソースデバイス102が、たとえば、無線周波数ネットワークまたはコンピュータベースのネットワークを介して、符号化ビデオデータを宛先デバイス116にリアルタイムで直接送信することを可能にするための通信媒体を表す。出力インターフェース108は、符号化ビデオデータを含む送信信号を変調し得、入力インターフェース122は、ワイヤレス通信プロトコルなどの通信規格に従って、受信された送信信号を復調し得る。通信媒体は、高周波(RF)スペクトルまたは1つまたは複数の物理伝送線路などの、任意のワイヤレスまたは有線通信媒体を含み得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワークなどのパケットベースのネットワーク、またはインターネットなどのグローバルネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス102から宛先デバイス116への通信を容易にするために有用であり得る任意の他の機器を含み得る。
【0027】
[0037] いくつかの例では、コンピュータ可読媒体110はストレージデバイス112を含み得る。ソースデバイス102は、出力インターフェース108からストレージデバイス112に符号化されたデータを出力し得る。同様に、宛先デバイス116は、入力インターフェース122を介してストレージデバイス112から符号化されたデータにアクセスし得る。記憶デバイス112は、ハードドライブ、Blu-ray(登録商標)ディスク、DVD、CD-ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。
【0028】
[0038] いくつかの例では、コンピュータ可読媒体110は、ソースデバイス102によって生成された符号化されたビデオデータを記憶し得るファイルサーバ114または別の中間ストレージデバイスを含み得る。ソースデバイス102は、ソースデバイス102によって生成された符号化されたビデオを記憶し得るファイルサーバ114または別の中間ストレージデバイスに符号化されたビデオデータを出力し得る。宛先デバイス116は、ストリーミングまたはダウンロードを介してファイルサーバ114から記憶されたビデオデータにアクセスし得る。ファイルサーバ114は、符号化されたビデオデータを記憶し、符号化されたビデオデータを宛先デバイス116に送信することができる任意のタイプのサーバデバイスであり得る。ファイルサーバ114は、(たとえば、ウェブサイトのための)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、コンテンツ配信ネットワークデバイス、またはネットワーク接続ストレージ(NAS)デバイスを表し得る。宛先デバイス116は、インターネット接続を含む任意の標準的なデータ接続を通してファイルサーバ114から符号化されたビデオデータにアクセスし得る。これは、ファイルサーバ114に記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi-Fi(登録商標)接続)、ワイヤード接続(たとえば、デジタル加入者線(DSL)、ケーブルモデムなど)、またはその両方の組合せを含み得る。ファイルサーバ114と入力インターフェース122とは、ストリーミング送信プロトコル、ダウンロード送信プロトコル、またはそれらの組合せに従って動作するように構成され得る。
【0029】
[0039] 出力インターフェース108と入力インターフェース122とは、ワイヤレス送信機/受信機、モデム、ワイヤードネットワーキング構成要素(たとえば、イーサネット(登録商標)カード)、様々なIEEE802.11規格のいずれかに従って動作するワイヤレス通信構成要素、または他の物理的構成要素を表し得る。出力インターフェース108と入力インターフェース122とがワイヤレス構成要素を含む例では、出力インターフェース108と入力インターフェース122とは、4G、4G-LTE(登録商標)(ロングタームエボリューション)、LTEアドバンスト、5Gなどのセルラー通信規格に従って符号化されたビデオデータなどのデータを転送するように構成され得る。出力インターフェース108がワイヤレス送信機を含むいくつかの例では、出力インターフェース108と入力インターフェース122とは、IEEE802.11仕様、IEEE802.15仕様(たとえば、ZigBee(登録商標))、Bluetooth(登録商標)規格などの他のワイヤレス規格に従って符号化されたビデオデータなどのデータを転送するように構成され得る。いくつかの例では、ソースデバイス102および/または宛先デバイス116は、それぞれのシステムオンチップ(SoC)デバイスを含み得る。たとえば、ソースデバイス102は、ビデオエンコーダ200および/または出力インターフェース108に帰属する機能を実行するためのSoCデバイスを含み得、宛先デバイス116は、ビデオデコーダ300および/または入力インターフェース122に帰属する機能を実行するためのSoCデバイスを含み得る。
【0030】
[0040] 本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。
【0031】
[0041] 宛先デバイス116の入力インターフェース122は、コンピュータ可読媒体110(たとえば、通信媒体、記憶デバイス112、ファイルサーバ114など)から符号化ビデオビットストリームを受信する。符号化ビデオビットストリームは、ビデオブロックまたは他のコード化ユニット(たとえば、スライス、ピクチャ、ピクチャのグループ、シーケンスなど)の特性(characteristics)および/または処理を記述する値を有するシンタックス要素(syntax element)など、ビデオデコーダ300によっても使用される、ビデオエンコーダ200によって定義されるシグナリング情報を含み得る。ディスプレイデバイス118は、復号ビデオデータの復号ピクチャをユーザに表示する。ディスプレイデバイス118は、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを表し得る。
【0032】
[0042]
図1には示されていないが、いくつかの例では、ビデオエンコーダ200とビデオデコーダ300とは各々、オーディオエンコーダおよび/またはオーディオデコーダと統合され得、共通のデータストリーム中にオーディオとビデオの両方を含む多重化ストリームを処理するために、適切なMUX-DEMUXユニット、あるいは他のハードウェアおよび/またはソフトウェアを含み得る。適用可能な場合、MUX-DEMUXユニットはITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
【0033】
[0043] ビデオエンコーダ200およびビデオデコーダ300はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路および/またはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を実行するために1つまたは複数のプロセッサを使用してその命令をハードウェアで実行し得る。ビデオエンコーダ200とビデオデコーダ300との各々は、1つまたは複数のエンコーダまたはデコーダに含まれ得、それらのいずれかが、それぞれのデバイス中の複合エンコーダ/デコーダ(CODEC)の一部として組み込まれ得る。ビデオエンコーダ200および/またはビデオデコーダ300を含むデバイスは、集積回路、マイクロプロセッサ、および/またはセルラー電話機などのワイヤレス通信デバイスを含み得る。
【0034】
[0044] ビデオエンコーダ200とビデオデコーダ300とは、高効率ビデオコーディング(HEVC)とも呼ばれるITU-T H.265などのビデオコーディング規格あるいはマルチビューおよび/またはスケーラブルビデオコーディング拡張などのそれの拡張に従って動作し得る。代替的に、ビデオエンコーダ200とビデオデコーダ300とは、共同探査テストモデル(JEM:Joint Exploration Test Model)、または汎用ビデオコーディング(VVC:Versatile Video Coding)とも呼ばれるITU-T H.266など、他のプロプライエタリまたは業界規格に従って動作し得る。VVC標準の最近のドラフトは、Brossら「Versatile Video Coding(Draft 4)」、ITU-T SG16 WP3とISO/IEC JTC1/SC29/WG11とのJoint Video Experts Team(JVET)、第13回会合:Marrakech、MA、2019年1月9~18日、JVET-M1001-v5(以下、「VVC Draft 4」)に記載されている。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。
【0035】
[0045] 概して、ビデオエンコーダ200とビデオデコーダ300とは、ピクチャのブロックベースのコーディングを実行し得る。「ブロック」という用語は、処理されるべき(たとえば、符号化されるべき、復号されるべき、あるいは符号化および/または復号プロセスにおいて他の方法で使用されるべき)データを含む構造を一般に意味する。たとえば、ブロックは、ルミナンスおよび/またはクロミナンスデータのサンプルの2次元行列を含み得る。概して、ビデオエンコーダ200とビデオデコーダ300とは、YUV(たとえば、Y、Cb、Cr)フォーマットで表されるビデオデータをコーディングし得る。すなわち、ピクチャのサンプルのために赤色、緑色、および青色(RGB)データをコーディングするのではなく、ビデオエンコーダ200とビデオデコーダ300とは、ルミナンス成分とクロミナンス成分とをコーディングし得、ここで、クロミナンス成分は、赤色相と青色相の両方のクロミナンス成分を含み得る。いくつかの例では、ビデオエンコーダ200は、符号化より前に、受信されたRGBフォーマット付きデータをYUV表現に変換し、ビデオデコーダ300は、YUV表現をRGBフォーマットに変換する。代替的に、前処理および後処理ユニット(図示されず)が、これらのコンバージョンを実行し得る。
【0036】
[0046] 本開示では、概して、ピクチャのコーディング(たとえば、符号化および復号)を、ピクチャのデータを符号化または復号するプロセスを含むように参照し得る。同様に、本開示では、ピクチャのブロックのコーディングを、ブロックのデータを符号化または復号するプロセス、たとえば、予測および/または残差コーディングを含むように参照し得る。符号化ビデオビットストリームは、概して、コーディング決定(たとえば、コーディングモード)とブロックへのピクチャの区分とを表すシンタックス要素の一連の値を含む。したがって、ピクチャまたはブロックをコーディングすることへの言及は、概して、ピクチャまたはブロックを形成しているシンタックス要素の値をコーディングすることとして理解されたい。
【0037】
[0047] HEVCは、コーディングユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)を含む、様々なブロックを定義する。HEVCに従って、(ビデオエンコーダ200などの)ビデオコーダは、4分木構造に従ってコーディングツリーユニット(CTU)をCUに区分する。すなわち、ビデオコーダは、CTUとCUとを4つの等しい、重複しない正方形に区分し、4分木の各ノードは、0個または4つのいずれかの子ノードを有する。子ノードなしのノードは「リーフノード」と呼ばれることがあり、そのようなリーフノードのCUは、1つまたは複数のPUならびに/あるいは1つまたは複数のTUを含み得る。ビデオコーダは、PUとTUとをさらに区分し得る。たとえば、HEVCでは、残差4分木(RQT)は、TUの区分を表す。HEVCでは、PUはインター予測データを表すが、TUは残差データを表す。イントラ予測されるCUは、イントラモード指示などのイントラ予測情報を含む。
【0038】
[0048] 別の例として、ビデオエンコーダ200とビデオデコーダ300とは、JEMまたはVVCに従って動作するように構成され得る。JEMまたはVVCに従って、(ビデオエンコーダ200などの)ビデオコーダは、ピクチャを複数のコーディングツリーユニット(CTU)に区分する。ビデオエンコーダ200は、4分木2分木(QTBT)構造またはマルチタイプツリー(MTT)構造などの木構造に従ってCTUを区分し得る。QTBT構造は、HEVCのCUとPUとTUとの間の分離など、複数の区分タイプの概念を除去する。QTBT構造は、2つのレベル、すなわち、4分木区分に従って区分される第1のレベルと、2分木区分に従って区分される第2のレベルとを含む。QTBT構造のルートノードはCTUに対応する。2分木のリーフノードは、コーディングユニット(CU)に対応する。
【0039】
[0049] MTT区分構造では、ブロックは、4分木(QT)区分と、2分木(BT)区分と、1つまたは複数のタイプの3分木(TT)区分とを使用して区分され得る。3分木区分は、ブロックが3つのサブブロックに分割される区分である。いくつかの例では、3分木区分は、中心を通って元のブロックを分割することなく、ブロックを3つのサブブロックに分割する。MTTにおける区分タイプ(たとえば、QT、BT、およびTT)は、対称的または非対称的であり得る。
【0040】
[0050] いくつかの例では、ビデオエンコーダ200とビデオデコーダ300とは、ルミナンス成分とクロミナンス成分との各々を表すために単一のQTBTまたはMTT構造を使用し得、他の例では、ビデオエンコーダ200とビデオデコーダ300とは、ルミナンス成分のための1つのQTBT/MTT構造、および両方のクロミナンス成分のための別のQTBT/MTT構造(またはそれぞれのクロミナンス成分のための2つのQTBT/MTT構造)など、2つ以上のQTBTまたはMTT構造を使用し得る。
【0041】
[0051] ビデオエンコーダ200とビデオデコーダ300とは、HEVCに従う4分木区分、QTBT区分、MTT区分、または他の区分構造を使用するように構成され得る。説明の目的で、本開示の技法の説明はQTBT区分に関して提示される。ただし、本開示の技法が、4分木区分、または同様に他のタイプの区分を使用するように構成されたビデオコーダにも適用され得ることを理解されたい。
【0042】
[0052] 本開示は、垂直および水平次元、たとえば、16×16のサンプルまたは16バイ16のサンプルに関して(CUまたは他のビデオブロックなどの)ブロックのサンプル次元に言及するために「N×N」および「NバイN」を互換的に使用し得る。一般に、16×16のCUは、垂直方向に16個のサンプル(y=16)を有し、水平方向に16個のサンプル(x=16)を有する。同様に、N×NのCUは、概して、垂直方向にN個のサンプルを有し、水平方向にN個のサンプルを有し、ここで、Nは非負整数値を表す。CU中のサンプルは行と列とに配列され得る。さらに、CUは、必ずしも、水平方向において垂直方向と同じ数のサンプルを有する必要があるとは限らない。たとえば、CUはN×Mのサンプルを備え得、ここで、Mは必ずしもNに等しいとは限らない。
【0043】
[0053] ビデオエンコーダ200は、予測および/または残差情報ならびに他の情報を表すCUのためのビデオデータを符号化する。予測情報は、CUがCUのための予測ブロックを形成するためにどのように予測されるべきであるのかを示す。残差情報は、概して、符号化の前のCUのサンプルと予測ブロックとの間のサンプルごとの差を表す。
【0044】
[0054] CUを予測するために、ビデオエンコーダ200は、概して、インター予測またはイントラ予測を通してCUのための予測ブロックを形成し得る。インター予測は、概して、前にコーディングされたピクチャのデータからCUを予測することを指すが、イントラ予測は、概して、同じピクチャの前にコーディングされたデータからCUを予測することを指す。インター予測を実行するために、ビデオエンコーダ200は、1つまたは複数の動きベクトルを使用して予測ブロックを生成し得る。ビデオエンコーダ200は、概して、たとえば、CUと参照ブロックとの間の差に関して、CUに厳密に一致する参照ブロックを識別するために動き探索を実行し得る。ビデオエンコーダ200は、参照ブロックが現在のCUに厳密に一致するのかどうかを決定するために絶対値差分和(SAD)、2乗差分和(SSD)、平均絶対差(MAD)、平均2乗差(MSD)、または他のそのような差計算を使用して差分メトリックを計算し得る。いくつかの例では、ビデオエンコーダ200は、単方向予測または双方向予測を使用して現在のCUを予測し得る。
【0045】
[0055] JEMとVVCとのいくつかの例はまた、インター予測モードと考えられ得る、アフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ200は、ズームインまたはアウト、回転、パースペクティブの動き、あるいは他の変則の動きタイプなど、非並進の動きを表す2つ以上の動きベクトルを決定し得る。
【0046】
[0056] イントラ予測を実行するために、ビデオエンコーダ200は、予測ブロックを生成するようにイントラ予測モードを選択し得る。JEMとVVCとのいくつかの例は、様々な方向性モード、ならびに平面モードおよびDCモードを含む、67個のイントラ予測モードを提供する。概して、ビデオエンコーダ200は、現在のブロック(たとえば、CUのブロック)のサンプルをそれから予測すべき、現在のブロックに対する隣接サンプルを記述するイントラ予測モードを選択する。そのようなサンプルは、ビデオエンコーダ200がラスタ走査順序で(左から右に、上から下に)CTUとCUとをコーディングすると仮定すると、概して、現在のブロックと同じピクチャ中の現在のブロックの上方、上方および左側、または左側にあり得る。
【0047】
[0057] ビデオエンコーダ200は、現在のブロックについて予測モードを表すデータを符号化する。たとえば、インター予測モードでは、ビデオエンコーダ200は、様々な利用可能なインター予測モードのうちのどれが使用されるか、ならびに対応するモードの動き情報を表すデータを符号化し得る。たとえば、単方向または双方向インター予測では、ビデオエンコーダ200は、高度動きベクトル予測(AMVP:advanced motion vector prediction)またはマージモードを使用して動きベクトルを符号化し得る。ビデオエンコーダ200は、アフィン動き補償モードの動きベクトルを符号化するために同様のモードを使用し得る。
【0048】
[0058] ブロックのイントラ予測またはインター予測などの予測に続いて、ビデオエンコーダ200は、ブロックについて残差データを計算し得る。残差ブロックなどの残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックについての予測ブロックとの間の、サンプルごとの差分を表す。ビデオエンコーダ200は、サンプル領域ではなく変換領域中に変換データを生成するために、残差ブロックに1つまたは複数の変換を適用し得る。たとえば、ビデオエンコーダ200は、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。さらに、ビデオエンコーダ200は、モード依存非分離可能2次変換(MDNSST)、信号依存変換、カルーネンレーベ変換(KLT)など、第1の変換に続いて2次変換を適用し得る。ビデオエンコーダ200は、1つまたは複数の変換の適用に続いて変換係数を生成する。
【0049】
[0059] 上述のように、変換係数(transform coefficients)を生成するための任意の変換に続いて、ビデオエンコーダ200は、変換係数の量子化を実行し得る。量子化は、一般に、変換係数を表すために使用されるデータの量をできるだけ低減させるために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスを実行することによって、ビデオエンコーダ200は、変換係数の一部または全部に関連するビット深度を低減し得る。たとえば、ビデオエンコーダ200は、量子化中にnビット値をmビット値まで丸め得、ここで、nは、mよりも大きい。いくつかの例では、量子化を実行するために、ビデオエンコーダ200は、量子化されるべき値のビット単位の右シフトを実行し得る。
【0050】
[0060] 量子化に続いて、ビデオエンコーダ200は、変換係数を走査して、量子化された変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、より高いエネルギー(したがって、より低い頻度)の変換係数をベクトルの前方に配置し、より低いエネルギー(したがって、より高い頻度)の変換係数をベクトルの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ200は、あらかじめ定義された走査順序を利用して、量子化された変換係数を走査してシリアル化ベクトルを生成し、次いで、ベクトルの量子化された変換係数をエントロピー符号化し得る。他の例では、ビデオエンコーダ200は適応型走査を実行し得る。量子化された変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ200は、たとえば、コンテキスト適応型バイナリ算術コーディング(CABAC)に従って、1次元ベクトル中の変換係数を表すシンタックス要素をエントロピー符号化し得る。ビデオエンコーダ200はまた、ビデオデータを復号する際のビデオデコーダ300による使用のために、符号化ビデオデータに関連付けられたメタデータを記述するシンタックス要素の値をエントロピー符号化し得る。
【0051】
[0061] CABACを実行するために、ビデオエンコーダ200は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接値が0値であるかどうかに関係し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。
【0052】
[0062] ビデオエンコーダ200は、さらに、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、およびシーケンスベースのシンタックスデータなどのシンタックスデータを、たとえば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、あるいはシーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、またはビデオパラメータセット(VPS)などの他のシンタックスデータ中で、ビデオデコーダ300に対して生成し得る。ビデオデコーダ300は、対応するビデオデータをどのように復号すべきかを決定するために、そのようなシンタックスデータを同様に復号し得る。
【0053】
[0063] このようにして、ビデオエンコーダ200は、符号化ビデオデータ、たとえば、ブロック(たとえば、CU)へのピクチャの区分ならびにブロックの予測および/または残差情報を記述するシンタックス要素を含むビットストリームを生成し得る。最終的に、ビデオデコーダ300は、ビットストリームを受信し、符号化ビデオデータを復号し得る。
【0054】
[0064] 概して、ビデオデコーダ300は、ビットストリームの符号化ビデオデータを復号するために、ビデオエンコーダ200によって実行されたものの逆プロセスを実行する。たとえば、ビデオデコーダ300は、ビデオエンコーダ200のCABAC符号化プロセスと逆ではあるが、それと実質的に同様の様式でCABACを使用してビットストリームのシンタックス要素の値を復号し得る。シンタックス要素は、CTUのCUを定義するために、CTUへピクチャを区分するための区分情報と、QTBT構造などの対応する区分構造に従う、各CTUの区分とを定義し得る。シンタックス要素は、ビデオデータのブロック(たとえば、CU)についての予測および残差情報をさらに定義し得る。
【0055】
[0065] ビデオデコーダ300は、ブロックの残差ブロックを再生するために、ブロックの量子化された変換係数を逆量子化し、逆変換し得る。ビデオデコーダ300は、ブロックの予測ブロックを形成するために、シグナリングされた予測モード(イントラまたはインター予測)と、関係する予測情報(たとえば、インター予測のための動き情報)とを使用する。ビデオデコーダ300は、次いで、(サンプルごとに)予測ブロックと残差ブロックとを組み合わせて、元のブロックを再生し得る。ビデオデコーダ300は、ブロックの境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを実行することなど、追加の処理を実行し得る。
【0056】
[0066] 上述のように、ビデオエンコーダ200とビデオデコーダ300とは、シンタックス要素の値にCABAC符号化および復号を適用し得る。シンタックス要素にCABAC符号化を適用するために、ビデオエンコーダ200は、「ビン(bin)」と呼ばれる一連の1つまたは複数のビットを形成するためにシンタックス要素の値を2値化し得る。さらに、ビデオエンコーダ200は、コーディングコンテキストを識別し得る。コーディングコンテキストは、特定の値を有するビンの確率を識別し得る。たとえば、コーディングコンテキストは、0の値のビンをコーディングする0.7の確率と、1の値のビンをコーディングする0.3の確率とを示し得る。コーディングコンテキストを識別した後、ビデオエンコーダ200は、間隔(interval)を下位サブ間隔と上位サブ間隔とに分割し得る。サブ間隔(sub-interval)のうちの一方は、値0に関連付けられ得、他方のサブ間隔は、値1に関連付けられ得る。サブ間隔の幅は、識別されたコーディングコンテキストによって、関連付けられた値について示される確率に比例し得る。シンタックス要素のビンが、下位サブ間隔に関連付けられた値を有する場合、符号化された値は、下位サブ間隔の下位境界に等しくなり得る。シンタックス要素の同じビンが、上位サブ間隔に関連付けられた値を有する場合、符号化された値は、上位サブ間隔の下位境界に等しくなり得る。シンタックス要素の次のビンを符号化するために、ビデオエンコーダ200は、符号化ビットの値に関連付けられたサブ間隔である間隔で、これらのステップを繰り返し得る。ビデオエンコーダ200が次のビンについてこれらのステップを繰り返すとき、ビデオエンコーダ200は、識別されたコーディングコンテキストおよび符号化されたビンの実際の値によって示される確率に基づく、修正された確率を使用し得る。
【0057】
[0067] ビデオデコーダ300が、シンタックス要素の値に対してCABAC復号を実行するとき、ビデオデコーダ300は、コーディングコンテキストを識別し得る。ビデオデコーダ300は次いで、間隔を下位サブ間隔と上位サブ間隔とに分割し得る。サブ間隔のうちの一方は、値0に関連付けられ得、他方のサブ間隔は、値1に関連付けられ得る。サブ間隔の幅は、識別されたコーディングコンテキストによって、関連付けられた値について示される確率に比例し得る。符号化された値が下位サブ間隔内にある場合、ビデオデコーダ300は、下位サブ間隔に関連付けられた値を有するビンを復号し得る。符号化された値が上位サブ間隔内にある場合、ビデオデコーダ300は、上位サブ間隔に関連付けられた値を有するビンを復号し得る。シンタックス要素の次のビンを復号するために、ビデオデコーダ300は、符号化された値を含んでいるサブ間隔である間隔で、これらのステップを繰り返し得る。ビデオデコーダ300が次のビンについてこれらのステップを繰り返すとき、ビデオデコーダ300は、識別されたコーディングコンテキストおよび復号されたビンによって示される確率に基づく、修正された確率を使用し得る。ビデオデコーダ300は次いで、シンタックス要素の値を復元するために、ビンを逆2値化し得る。
【0058】
[0068] いくつかの事例では、ビデオエンコーダ200は、バイパスCABACコーディングを使用してビンを符号化し得る。ビンに対してバイパスCABACコーディングを実行することは、ビンに対して通常のCABACコーディングを実行することよりも、計算コストが高くないことがある。さらに、バイパスCABACコーディングを実行することは、より高度の並列化およびスループットを可能にし得る。バイパスCABACコーディングを使用して符号化されたビンは、「バイパスビン(bypass bin)」と呼ばれることがある。一緒にバイパスビンをグループ化することは、ビデオエンコーダ200およびビデオデコーダ300のスループットを増加させ得る。バイパスCABACコーディングエンジンは、単一のサイクルにおいていくつかのビンをコーディングすることが可能であり得るが、通常のCABACコーディングエンジンは、サイクルにおいて単一のビンのみをコーディングすることが可能であり得る。バイパスCABACコーディングエンジンがコンテキストを選択せず、両方のシンボル(0および1)について1/2の確率を仮定し得るので、バイパスCABACコーディングエンジンは、より単純であり得る。したがって、バイパスCABACコーディングでは、間隔は、直接半分に分割される。
【0059】
[0069] さらに、上述のように、ビットストリームは、ビデオデータおよび関連データの符号化ピクチャの表現を含み得る。関連データはパラメータセットを含み得る。ネットワークアブストラクションレイヤ(NAL)ユニットは、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)のための未加工バイトシーケンスペイロード(RBSP)をカプセル化し得る。VPSは、0個以上のコード化ビデオシーケンス(CVS)全体に適用するシンタックス要素を含むシンタックス構造である。SPSも、0個以上のCVS全体に適用するシンタックス要素を含むシンタックス構造である。SPSは、SPSがアクティブであるときにアクティブであるVPSを特定するシンタックス要素を含み得る。したがって、VPSのシンタックス要素は、SPSのシンタックス要素よりも一般的に適用可能であり得る。PPSは、0個またはそれ以上のコード化ピクチャに適用するシンタックス要素を含むシンタックス構造である。PPSは、PPSがアクティブであるときにアクティブであるSPSを識別するシンタックス要素を含み得る。スライスのスライスヘッダは、スライスがコーディングされるときにアクティブであるPPSを示すシンタックス要素を含み得る。
【0060】
[0070] カラービデオは、効率的に色を表すために様々な色空間が使用されるマルチメディアシステムにおいて必須の役割を果たす。色空間は、複数の構成要素を使用して数値を用いて色を指定する。普及している色空間は、色が赤、緑、および青の3つの原色成分値の組合せとして表されるRGB色空間である。
【0061】
[0071] カラービデオ圧縮では、YCbCr色空間が広く使用されている。A.FordおよびA.Roberts、「Colour space conversions」、University of Westminster、London、技術レポート、1998年8月を参照されたい。YCbCrは、線形変換を介してRGB色空間から変換され得、異なる成分間の冗長性、すなわち、成分間の冗長性は、YCbCr色空間では著しく低減される。YCbCrの1つの利点は、Y信号がルミナンス(ルーマ)情報を搬送することによる白黒TVとの後方互換性である。さらに、クロミナンス(クロマ)帯域幅は、RGBにおけるサブサンプリングよりも著しく少ない主観的影響で4:2:0のクロマサンプリングフォーマット中のCb成分とCr成分とをサブサンプリングすることによって低減され得る。これらの利点のために、YCbCrがビデオ圧縮における主要な色空間となってきた。また、ビデオ圧縮において使用されるYCoCgなどの他の色空間がある。本明細書では、使用される実際の色空間にかかわらず、Y、Cb、Crが、ビデオ圧縮方式における3つの色成分を表すために使用される。成分間の冗長性がYCbCr色空間では著しく低減されるが、3つの色成分間での相関は、依然として存在する。特に4:4:4のクロマフォーマットビデオのコーディングについて相関をさらに低減することによってビデオコーディングパフォーマンスを改善するために様々な方法が研究されてきた。B.C.Song、Y.G.Lee、およびN.H.Kim、「Block adaptive inter-color compensation algorithm for RGB 4:4:4 video coding」、IEEE Trans.Circuits Syst.Video Technol.第18巻、第10号、ページ1447~1451、2008年10月に記載されているように、ブロックごとに再構成されたルーマ信号からクロマ信号を予測するためにスケールファクタおよびオフセットが使用される。
【0062】
[0072] W.Pu、W.-S.Kim、J.Chen、J.Sole、M.Karczewicz、「RCE1:Descriptions and Results for Experiments 1,2,3,and 4」、ITU-T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT-VC)、JCTVC-O0202、Geneva、2013年11月では、成分間予測(CCP)が残差領域において実行される。クロマ残差信号は、次のようにしてエンコーダ側において再構成されたルーマ残差信号を使用して予測される。
【0063】
【0064】
クロマ残差信号は、次のようにしてデコーダ側において補償される。
【0065】
【0066】
ここで、rC(x,y)およびr’C(x,y)は、位置(x,y)における元のクロマ残差サンプルと再構成されたクロマ残差サンプルとを示す。ΔrC(x,y)およびΔr’C(x,y)は、成分間予測後の最終的なクロマ残差サンプルを示す。r’L(x,y)は、再構成されたルーマ残差サンプル値である。重み付け係数αは、HEVCではクロマ変換ユニットごとにビットストリーム中で明示的にシグナリングされる。この成分間の残差予測方法は、イントラ予測された残差とインター予測された残差との両方のために実行される、4:4:4のクロマサンプリングフォーマットビデオコーディングのためのHEVC標準のフォーマットおよび範囲拡張で採用された。この成分間残差予測方法は、4:2:0のビデオフォーマットコーディングのためにも提案されたが、限定されたコーディング利益のためにこの成分間残差予測方法は採用されていない。クロマ成分を予測するためにルーマを使用することに加えて、予測が2つのクロマ成分間に適用され得ることも提案され、すなわち、Cr残差を予測するために再構成された初期にコーディングされたCb残差が使用される。A.Khairat、T.Nguyen、M.Siekmann、D.Marpe、「Non-RCE1:Extended Adaptive Inter-Component Prediction」、ITU-T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT-VC)、JCTVC-O0150、Geneva、2013年11月を参照されたい。2016年7月28日に公開された米国特許出願公開第2016/0219283号、2016年9月22日に公開された米国特許出願公開第2016/0277762号、2018年3月15日に公開された米国特許出願公開第2018/0077426号、2018年6月21日に公開された米国特許出願公開第2018/0176594号、および2019年1月3日に公開された米国特許出願公開第2019/0007688号も成分間予測の態様について記述している。
【0067】
[0073] 4:2:0のクロマビデオコーディングでは、線形モデル(LM)予測モードという名前の方法が、HEVC標準の開発中に良く研究されてきた。J.Chen、V.Seregin、W.-J.Han、J.-S.Kim、B.-M.Joen、「CE6.a.4:Chroma intra prediction by reconstructed luma samples」、ITU-T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT-VC)、JCTVC-E266、Geneva、2011年3月16~23日を参照されたい。LM予測モードでは、クロマサンプルは、次のように線形モデルを使用することによって同じブロックの再構成されたルーマサンプルに基づいて予測される。
【0068】
【0069】
ここで、predc(i,j)は、ブロック中のクロマサンプルの予測を表し、recL(i,j)は、同じブロックのダウンサンプリングされた再構成されたルーマサンプルを表す。パラメータαおよびβは、現在のブロックの周りの隣接する再構成されたルーマサンプルとクロマサンプルとの間の回帰誤差を最小化することによって導出される。
【0070】
【0071】
パラメータαおよびβは、次のように解かれる。
【0072】
【0073】
ここで、xiは、ダウンサンプリングされた再構成されたルーマ参照サンプルであり、yiは、再構成されたクロマ参照サンプルであり、Nは、使用される参照サンプルの数である。
【0074】
[0074] インループ再形成器(in-loop reshaper)は、第13回JVET会議において採用された。J.Lainema、「CE7-related:Joint coding of chrominance residuals」、第13回JVET会議、Marrakech、MA、2019年1月、JVET-M0305(以下、JVET-M0305)およびX.Xiu、P.T.Lu、P.Hanhart、R.Vanam、Y.He、Y.Ye、T.Lu、F.Pu、P.Yin、W.Husak、T.Chen、「Description of SDR,HDR,and 360°video coding technology proposal by InterDigital Communications and Dolby Laboratories」、JVET-J0015、San Diego、USA、2018年4月を参照されたい。インループルーマ再形成器は、ルックアップテーブル(LUT)のペアとして実装されるが、他方がシグナリングされたLUTから計算され得るので、2つのLUTのうちの1つしか(区分的線形モデリングによって)シグナリングされる必要がない。各LUTは、10ビットビデオのための1次元の、10ビットの、1024個のエントリのマッピングテーブル(1D-LUT)である。1つのLUTは、入力されたルーマコード値Yi(元の領域)を改変された値Yr:Yr=FwdLUT[Yi](再形成された領域)、にマッピングする順LUT、FwdLUTである。他のLUTは、改変されたコード値Yr(再形成された領域)を
【0075】
【0076】
(元の領域):
【0077】
【0078】
(
【0079】
【0080】
はYiの再構成値を表す)にマッピングする逆LUT、InvLUTである。
【0081】
[0075]
図2は、インループルーマ再形成器を用いたイントラスライス再構成の一例を示すブロック図である。イントラスライスの場合、デコーダにおいてInvLUTしか適用されない(
図2)。
図2では、灰色の影つきのブロックは、再形成された領域中の信号、ルーマの残余、予測されたイントラルーマ、および再構成されたイントラルーマを示す。より詳細には、
図2の例に示されているように、ビデオデコーダ300は、(CABAC
-1として示される)CABAC復号、(Q
-1として示される)逆量子化、および(T
-1として示される)逆変換を実行し得る(150)。さらに、ビデオデコーダ300は、ルーマ残差サンプル(Y
res)をイントラ予測されたサンプル(Y’
pred)に加算することによってイントラ予測(152)および再構成(154)を実行し得る。さらに、ビデオデコーダ300は、逆再形成演算(156)を実行し得る。ビデオデコーダ300は、1つまたは複数のループフィルタ(LF)を逆再形成演算の出力に適用し得る(158)。結果は、復号ピクチャバッファ(DPB)(160)中に記憶され得る。
【0082】
[0076]
図3は、インループルーマ再形成器を用いたインタースライス再構成の一例を示すブロック図である。インタースライスの場合(
図3)、FwdLUTとInvLUTとの両方が適用される。LUTは、イントラスライスとインタースライスとの両方のためのループフィルタ処理の前に適用される。
図3では、灰色の影つきのブロックは、再形成された領域中の信号、ルーマの残余、予測されたイントラルーマ、および再構成されたイントラルーマを示す。NALユニット中でシグナリングされるコーディングツリーユニットの集まりを示すために「スライス(slice)」という用語が本明細書では使用されるが、説明は、(VVCにおいて使用される)タイルグループなどのピクチャの他の空間区分にも適用することを理解されなければならない。
【0083】
[0077] インタースライス(またはタイルグループ)の場合、FwdLUTは、元の領域中の動き補償値を再形成された領域(FwdLUT[Ypred])にマッピングする。InvLUTは次いで、再形成された領域中のインター再構成値を元の領域中のインター再構成値にマッピングする
【0084】
【0085】
。
図3の例では、イントラ予測は、スライスタイプにかかわらず再形成された領域中で常に実行される。そのような構成では、イントラ予測は、前のTUの再構成の直後に開始することができる。
【0086】
[0078]
図3の例では、ビデオデコーダ300は、(CABAC
-1として示される)CABAC復号、(Q
-1として示される)逆量子化、および(T
-1として示される)逆変換を実行し得る(170)。さらに、ビデオデコーダ300は、イントラ予測(172)または動き補償(184)およびブロックのための順再形成プロセス(174)を実行し得る。ビデオデコーダ300は、ルーマ残差サンプル(Y
res)を予測されたサンプル(Y’
pred)に加算することによって再構成(176)を実行し得る。
図3の例では、ブロックがイントラ予測を使用して予測される場合、予測されたサンプル(Y’
pred)はイントラ予測(172)を使用して予測される。ビデオデコーダ300は、再形成された領域中でイントラ予測を実行する。ただし、ビデオデコーダ300は、再形成されていない領域中でインター予測を実行する。したがって、ブロックがインター予測を使用して予測される場合、ビデオデコーダ300は、動き補償(184)によって生成された予測されたサンプルを再形成された領域に変換するために動き補償(184)および順再形成演算(174)を実行する。
【0087】
[0079] さらに、再構成(176)の後、ビデオデコーダ300は、逆再形成演算(178)を実行し得る。ビデオデコーダ300は、1つまたは複数のループフィルタ(LF)を逆再形成演算の出力に適用し得る(180)。結果は、復号ピクチャバッファ(DPB)(182)中に記憶され得る。DPBからのデータは、動き補償(184)のために使用され得、これは、後続のブロックでの順再形成(174)のためにその後使用され得る。
【0088】
[0080] 再形成器モデルシンタックスは、16個の区分をもつ区分的線形(PWL:piece-wise linear)モデルをシグナリングし得る。1024個のエントリのマッピングテーブルが、16個の区分のPWLモデルを使用した線形補間によって構築される。概念的に、PWLモデルは、以下のようにして実装され得る。1つの区分について、x1およびx2を2つの入力ピボットポイントとし、y1およびy2をそれらの対応する出力ピボットポイントとする。x1とx2との間の任意の入力値xのための出力値yは、以下の式によって補間される。
【0089】
【0090】
固定小数点実装では、上記の式は、次のように書き換えられ得る。
【0091】
【0092】
ここで、mは、スカラーであり、cは、オフセットであり、FP_PRECは、精度を指定する一定値である。
【0093】
[0081]
図4は、クロマ残差スケーリング(CRS:chroma residual scaling)を用いたイントラモード再構成とインターモード再構成との一例を示すブロック図である。クロマ残余スケーリング(Chroma residue scaling)またはCRS(
図4)は、クロマ信号とのルーマ信号の相互作用(luma signal interaction)を補償する。クロマ残余スケーリング(Chroma residue scaling)は、TUレベルで適用される。
【0094】
【0095】
C
Resは元のクロマ残差信号であり、C
ResScaleは、スケーリングされたクロマ残差信号である。C
Scaleは、FwdLUTを使用して計算されるスケーリングファクタであり、デコーダ側で除算の代わりに乗算を実行するためにそれの逆数のC
ScaleInvに変換され、それによって実装複雑性を低減する。
図4では、灰色の影つきのブロックは、再形成された領域中の信号、ルーマの残余、予測されたイントラルーマ、および再構成されたイントラルーマを示す。PWLモデルの下では、各ルーマPWL範囲中の任意の入力ルーマ値のために、同じクロマスケール値が使用される。したがって、ルーマ依存のクロマスケールは、各ルーマコード値の代わりに各ルーマPWL範囲について計算されるように簡略化され、LUT cScaleInv[pieceIdx]中に記憶される(16個の区分の粒度)。エンコーダ側とデコーダ側との両方でのスケーリング演算は、以下の式をもつ固定小数点整数演算を用いて実装される。
【0096】
【0097】
ここで、cは、クロマ残余(chroma residue)であり、sは、cScaleInv[pieceIdx]からのクロマ残余スケーリングファクタ(chroma residue scaling factor)であり、pieceIdxは、TUの対応する平均ルーマ値によって決定され、CSCALE_FP_PRECは、精度を指定する一定値である。
CScaleInvの値は、以下のステップで計算される。
1.イントラモードが使用される場合、イントラ予測されたルーマ値の平均を計算し、インターモードが使用される場合、順方向に再形成され、インター予測されたルーマ値の平均を計算する。すなわち、平均ルーマ値avgY’TUが再形成された領域で計算される。
2.avgY’TUが属する逆マッピングPWL中のルーマ範囲のインデックスidxを発見する。
3.
【0098】
【0099】
[0082]
図4の例では、ビデオデコーダ300は、CABAC復号(CABAC
-1)、逆量子化(Q
-1)、および逆変換(T
-1)を実行し得る(240)。ブロック240の出力は、ビデオデータの現在のブロックのためのルーマ残差データ(Y
res)とスケーリングされたクロマデータ(C
resScale)とを含み得る。ブロックがイントラモードを使用して符号化される場合、ビデオデコーダ300は、現在のブロックのためにイントラ予測プロセスを実行して(242)、ルーマ予測データ(Y’
pred)を生成し得る。代替的に、ブロックがインターモードを使用して符号化される場合、ビデオデコーダ300は、現在のブロックのために動き補償(252)と順再形成プロセス(244)とを実行して、ルーマ予測データ(Y’
pred)を生成し得る。ビデオデコーダ300は、ルーマ残差データ(Y
res)と予測データ(Y’
pred)とに基づいてルーマサンプルを再構成するルーマ再構成プロセス(246)を実行し得る。ビデオデコーダ300は、後続のブロックのイントラ予測のために再構成されたルーマデータを使用し得る。
【0100】
[0083] さらに、
図4の例では、ビデオデコーダ300は、現在のブロックのための再構成されたルーマデータに対して逆再形成プロセス(247)を実行し得る。ビデオデコーダ300は、1つまたは複数のループフィルタ(LF)を逆再形成演算の出力に適用し得る(248)。ビデオデコーダ300は、復号ピクチャバッファ(250)中に結果を記憶し得る。復号ピクチャバッファ中のデータは、ビデオデータの後続のブロックのための動き補償(252)のために使用され得る。
図4の例では、ビデオデコーダ300はまた、現在の変換ユニットとクロマ残余スケーリングファクタ(C
scaleInv)のための平均ルーマ値(avgY’
TU)を決定し得る(254)。ビデオデコーダ300は、上記で説明されたようにクロマ残余スケーリングファクタを決定し得る。
【0101】
[0084]
図4の例では、ビデオデコーダ300は、現在のブロックのためのスケーリングされたクロマ残差データをスケーリングするクロマ残余スケーリングプロセス(256)を実行して、現在のブロックのためのクロマ残差データ(C
res)を生成し得る。ビデオデコーダ300は、スケーリングされたクロマ残差データのサンプルにクロマ残余スケーリングファクタを乗算することによってクロマ残余スケーリングプロセスを実行し得る。さらに、
図4の例では、ビデオデコーダ300は、イントラ予測プロセス(257)または動き補償プロセス(258)を実行して、現在のブロックのためのクロマ予測データ(C
pred)を生成し得る。ビデオデコーダ300は、現在のブロックのためのクロマ残差データ(C
res)とクロマ予測データとに基づいて現在のブロックのクロマデータを再構成する再構成プロセスを実行し得る(259)。ビデオデコーダ300は、1つまたは複数のループフィルタ(LF)を逆再形成演算の出力に適用し得る(260)。ビデオデコーダ300は、復号ピクチャバッファ(262)中に得られたデータを記憶し得る。
【0102】
[0085] Cb-Crクロマ残差の共同コーディングのための方法は、JVET-M0305に記載されている。本方法では、同じ変換ユニット中のCbブロックとCrブロックとの両方の残差を記述するために単一の共同残差ブロックが使用される。エンコーダ側では、アルゴリズムは、変換および量子化プロセスへの入力として正のCb残差と負のCr残差との平均を使用する。モードがアクティブ化される場合、単一の残差ブロックが復号される。Crブロックの残差は、復号された共同残差を否定することによって生成される。デコーダ側では、共同残差モードがアクティブであるとき、示された共同残差がCb予測ブロックに加算され、Cr予測ブロックから差し引かれる。2つのブロックの残差を表すために単一の残差が使用されるので、共同クロミナンス残差モードがアクティブであるとき、クロマ量子化パラメータ(QP)オフセットパラメータが2だけ減らされる。
【0103】
[0086] CbとCrとの両方のためのコード化ブロックフラグ(cbf)が真である場合、共同残差モードは、ビットストリーム中のフラグを用いて示される。共同残差のためのビットストリームシンタックスおよび復号プロセスは、VTM-3のCb残差のプロセスに従う。J.Chen、Y.Ye、S.Kim、「Algorithm description for Versatile Video Coding and Test Model 3(VTM3)」、第12回JVET会議、Macau SAR、CN、2018年10月、JVET-L1002を参照されたい
[0087] コア実験テストCE7.1(H.Schwarz、M.Coban、C.Auyeung、「Description of Core Experiment 7(CE7):Quantization and coefficient coding」、第13回JVET会議、Marrakech、MA、2019年1月、JVET-M1027)において、本方法は、次のようにインループクロマ残余スケーラ(CRS)と統合される。
・エンコーダ側:
・
【0104】
【0105】
・Cr残差: 0
・デコーダ側:
・
【0106】
【0107】
・
【0108】
【0109】
ここで、CRSは、順クロマ残余スケーラであり、invCRSは、逆クロマ残余スケーラであり、Tは、順変換であり、Qは、順量子化であり、invTは、逆変換であり、invQは、逆量子化である。
【0110】
[0088] モデルベースの成分間残差予測は、ビデオデコーダ300における増加した実装コストを暗示するデコーダ側におけるモデルパラメータ推定を必要とするか、またはコーディング効率に悪影響を及ぼし、ビットストリームからパラメータを復号することを必要とするモデルパラメータがシグナリングされることを必要とする。
【0111】
[0089] ビットストリームにコーディングされた単一の残差に両方のクロマ残差を組み合わせる共同Cb-Crコーディング方法は、両方のクロマチャネルの非対称処理によりクロマアーティファクトに悩まされることがある。たとえば、JVET-M0305では、Cr残差は共同残差の逆であると仮定され、これは粗い近似である。さらに、本方法は、変換後に共同残差に適用される量子化パラメータの調整を必要とし、共同残差を適切にコーディングし、コーディング利得を達成するためにレートひずみ最適化のためにエンコーダ側においてラムダパラメータの調整を必要とする。量子化パラメータオフセットがシグナリングされ得る。しかしながら、正確な値を決定することは、ビデオエンコーダ200に対する追加の負担となり得る。
【0112】
[0090] 本開示は、上記で説明された問題のうちの1つまたは複数に対処し得る技法について説明する。本開示の技法は、モデルベースの成分間残差予測のモデルパラメータのシグナリングおよび復号を回避し得、上記で説明された共同Cb-CRコーディング方法における量子化パラメータの調整を回避し得る。とはいえ、本開示の技法は、CbサンプルとCrサンプルとの間の相関を低減し得、それによって、コーディング効率の利得を与え得る。以下でおよび本開示の他の場所で与えられる例は、独立して適用され得るか、または、例のうちの1つまたは複数は、一緒に適用可能であり得る。
【0113】
[0091] 本開示の以下のセクションは、組み合わされた残差コーディング(CRC)のための技法について説明する。組み合わされた残差コーディングのための技法によれば、寸法(幅および高さ)と、resCb(x,y)と、resCr(x,y)とをもつCb残差ブロックとCr残差ブロックとは、以下の表1に示されているように、残差修正関数(RMF)F1(x,y)およびF2(x,y)で処理されて、その後、ビデオエンコーダ200において順変換され(T)、量子化(Q)され、エントロピーコーディングされる(E)修正された残差を取得する。
【0114】
【0115】
[0092] 表1のビデオデコーダ300では、エントロピー復号(invE)、逆量子化(invQ)、逆変換(invT)の後に、逆RMF invF1(x,y)およびinvF2(x,y)は、復号された残差resCb(x,y)’およびresCr(x,y)’に適用されて残差resCb(x,y)’’およびresCr(x,y)’’を取得し、これらは予測predCb(x,y)およびpredCr(x,y)に加算されて、再構成recCb(x,y)およびrecCr(x,y)を取得する。
【0116】
[0093] 一例では、関数F1およびF2は、それぞれ、減算および加算であり、逆関数invF1およびinvF2は、それぞれ、加算および減算である。正規化係数(normalizing factor)1/N1、1/N2、1/M1、1/M2および丸め項(rounding term)A1、A2、B1、B2は、これらの関数の一部であり得る。
【0117】
【0118】
一例では、N1=N2=2であり、A1=A2=1(または0)であり、M1=M2=1、B1=B2=0である。別の例では、ファクタ
【0119】
【0120】
をもつ
【0121】
【0122】
は、近似的に(181/256)に等しくなり、この場合、A1=A2=B1=B2=128(または0)である。いくつかの例では、残差ブロックresCb(x,y)、resCr(x,y)、resCb(x,y)’またはresCr(x,y)’のすべての値は0であり得、または1つもしくは複数の残差ブロックは、上記の式から省略され得る。
【0123】
[0094] 別の例では、関数F1およびF2は、それぞれ、加算および減算であり、逆関数invF1およびinvF2はまた、それぞれ、加算および減算である。正規化係数1/N1、1/N2、1/M1、1/M2および丸め項A1、A2、B1、B2は、これらの関数の一部であり得る。
【0124】
【0125】
一例では、N1=N2=2であり、A1=A2=1(または0)であり、M1=M2=1、B1=B2=0である。別の例では、ファクタ
【0126】
【0127】
をもつ
【0128】
【0129】
は、近似的に(181/256)に等しくなり、この場合、A1=A2=B1=B2=128(または0)である。いくつかの例では、残差ブロックresCb(x,y)、resCr(x,y)、resCb(x,y)’またはresCr(x,y)’のすべての値は0であり得、または1つもしくは複数の残差ブロックは、上記の式から省略され得る。
【0130】
[0095] いくつかの例では、関数F1およびF2は、それぞれ、等しくない正規化ファクタをもつ減算および加算であり、逆関数invF1およびinvF2は、それぞれ、等しくない正規化ファクタをもつ加算および減算である。正規化ファクタ1/N10、1/N11、1/N20、1/N21、1/M10、1/M11、1/M20、1/M21および丸め項A10、A11、A20、A21、B10、B11、B20、B21は、これらの関数の一部であり得る。
【0131】
【0132】
[0096] 一例では、N10=N11=1およびA10=A11=0であり、N20=N21=2およびA20=A21=0であり、M10=1およびB10=0であり、M11=2およびB11=1であり、M20=1およびB20=0であり、式1.c.i、1.c.ii、1.c.iii、および1.c.iv中のM21=2およびB21=0である。したがって、この例では、式1.c.i、1.c.ii、1.c.iii、および1.c.ivは、次のように書き換えられ得る。
【0133】
【0134】
残差ブロックresCb(x,y)、resCr(x,y)、resCb(x,y)’またはresCr(x,y)’のすべての値は0であり得、または1つもしくは複数の残差ブロックは、上記の式から省略され得る。
【0135】
[0097] 本開示のいくつかの例では、CRSプロセスは、RMFとともに適用され得る。たとえば、CRSプロセスがRMFとともに適用される一例では、RMF F1(x,y)およびF2(x,y)は、CRSが残差resCb(x,y)およびresCr(x,y)をスケーリングした後に(たとえば、ビデオエンコーダ200によって)適用され得る。反対に、この例では、逆RMF invF1(x,y)およびinvF2(x,y)は、invCRSスケーリングプロセスの前に(たとえば、ビデオデコーダ300によって)適用される。
【0136】
[0098] 別の例では、CRSプロセスがRMFとともに適用される一例では、RMF F1(x,y)およびF2(x,y)は、CRSが残差resCb(x,y)およびresCr(x,y)をスケーリングすることを完了する前にビデオエンコーダ200によって適用され得る。反対に、この例では、逆RMF invF1(x,y)およびinvF2(x,y)は、invCRSスケーリングプロセスの後にビデオデコーダ300によって適用される。
【0137】
[0099] いくつかの例では、上記で定義したように正規化ファクタ1/N、1/Mおよび丸め項A、Bは、順変換プロセスTの部分である変換係数スケーリングプロセスに統合され得、反対に、逆変換プロセスinvTの部分である逆変換係数スケーリングと統合され得る。言い換えれば、正規化ファクタとスケーリング項とは、組み合わされ得る。いくつかのそのような例では、CRSスケーリングプロセスは、(たとえば、ビデオエンコーダ200またはビデオデコーダ300)によって適用されない。正規化ファクタと丸め項とが順変換プロセスTの部分である変換係数スケーリングプロセスと統合されるいくつかの例では、CRSスケーリングプロセスは、RMF F1(x,y)およびF2(x,y)の前に適用され、反対に、逆RMF invF1(x,y)およびinvF2(x,y)は、invCRSスケーリングプロセスの前に適用される。
【0138】
[0100] 正規化ファクタと丸め項とが順変換プロセスTの部分である変換係数スケーリングプロセスと統合されるいくつかの例では、RMF F1(x,y)およびF2(x,y)は、CRSが残差resCb(x,y)およびresCr(x,y)をスケーリングすることを完了する前に適用され得、反対に、逆RMF invF1(x,y)およびinvF2(x,y)は、invCRSスケーリングプロセスの後に適用され得る。この場合、CRSスケーリングは、順変換プロセスTの部分である変換係数スケーリングプロセスに統合され得、反対に、逆変換プロセスinvTの部分である逆変換係数スケーリングと統合され得る。
【0139】
[0101] 代替的に、正規化ファクタと丸め項とが順変換プロセスTの部分である変換係数スケーリングプロセスと統合される例では、上記で定義したように正規化ファクタ1/N、1/Mおよび丸め項A、Bは、修正された量子化パラメータ値(表1のoffsetQp)によって完全にまたは部分的に置き換えられ得る。
【0140】
[0102] さらに、本開示のいくつかの例では、RMF F1(x,y)、F2(x,y)は、順変換プロセスTの後および量子化Qの前に(たとえば、ビデオエンコーダ200によって)適用され得る。反対に、逆RMF invF1(x,y)、invF2(x,y)は、逆量子化invQの後におよび逆変換プロセスinvTの前に(たとえば、ビデオデコーダ300によって)適用され得る。
【0141】
[0103] この例では、変換スキップモードが、組み合わされた残差コーディングとともに適用され得る。したがって、いくつかの例では、ビデオエンコーダ200は、順変換(たとえば、DCT、DSTなど)を適用しないが、RMFを適用する。同様に、いくつかの例では、ビデオデコーダ300は、逆変換(たとえば、逆DCT、逆DSTなど)を適用しないが、逆RMFを適用する。
【0142】
[0104] 上記で説明したのと同様の方法で、クロマ残差ブロックresCb(x,y)およびresCr(x,y)と対応するルーマ残差ブロックresY(x,y)は互いに組み合わされ得る。たとえば、1つのそのような例では、RMF F3(x,y)は、resCb(x,y)とともにresY(x,y)に(たとえば、ビデオエンコーダ200によって)適用される。さらに、RMF F4(x,y)は、resCr(x,y)とともにresY(x,y)に(たとえば、ビデオエンコーダ200によって)適用される。さらに、この例では、反対に、F3のための逆RMF(すなわち、invF3(x,y))とF4のための逆RMF(すなわち、invF4(x,y))とが(たとえば、ビデオデコーダ300によって)適用される。一例では、F3、F4、invF3、およびinvF4は、次のように表され得る。
【0143】
【0144】
[0105] クロマ残差ブロックに対応するルーマ残差ブロックが一緒に組み合わされる別の例では、RMF F5(x,y)は、resCb(x,y)およびresCr(x,y)とともにresY(x,y)に(たとえば、ビデオエンコーダ200によって)適用される。反対に、invF5(x,y)は、(たとえば、ビデオデコーダ300によって)適用される。一例では、F5およびinvF5は、次のように表され得る。
【0145】
【0146】
[0106] たとえば、4:2:0のクロマビデオフォーマットの場合、RMF F3、F4、F5は、resY(x,y)残差ブロックの(フィルタ処理を用いるまたは用いない)ダウンサンプリングまたはresCb(x,y)およびresCr(x,y)ブロックの(補間を用いるまたは用いない)アップサンプリングを含み得る。本開示のCRC技法はまた、4:4:4のビデオフォーマットなどに適用され得、その場合、ダウンサンプリングまたはアップサンプリングは必要とされないことがある。
【0147】
[0107] 本開示のCRCツールは、SPS、PPS、スライスまたはタイルグループヘッダなどの中でバイナリフラグをシグナリングすることによって使用可能になり得る。さらに、CRCフラグ(crc_flag)は、変換ユニットのためのCRCツールを使用可能にするために変換ユニットシンタックスまたは残差コーディングシンタックスでシグナリングされ得る。したがって、ビデオエンコーダ200は、ビットストリーム中でCRCフラグをシグナリングし得、ビデオデコーダ300は、ビットストリームからCRCフラグを取得し得る。
【0148】
[0108] いくつかの例では、CRCフラグのシグナリングは、特定の基準の発生に依存する。たとえば、一例では、Cb残差ブロック(cbf_cb)のコード化ブロックフラグ(cbf)が真である場合、crc_flagは、(たとえば、ビデオエンコーダ200によって)シグナリングされ得る。残差ブロックのcbfは、残差ブロックの変換係数の値のすべてが0であるのかどうかを示す。変換スキップモードが適用される事例では、残差ブロックの変換係数はサンプル領域中にあり得る。第2の例では、Cr残差ブロック(cbf_cr)のコード化ブロックフラグ(cbf)が真である場合、crc_flagは、(たとえば、ビデオエンコーダ200によって)シグナリングされ得る。第3の例では、cbf_cbが真であるまたはcbf_crが真である場合、crc_flagが(たとえば、ビデオエンコーダ200によって)シグナリングされ得る。さらに別の例では、cbf_cbとcbf_crとが真である場合、crc_flagが(たとえば、ビデオエンコーダ200によって)シグナリングされ得る。
【0149】
[0109] crc_flagがシグナリングされる例では、cbf_cbが真であり、cbf_crも真である場合、両方の残差(式1.a.i)および1.a.ii)において定義されているF1(x,y)およびF2(x,y))がシグナリングされるのか、または、すなわち、F1(x,y)もしくはF2(x,y)のいずれかを0に強制することによって2つの残差のうちのただ1つがシグナリングされるのかを示す変換ユニットごとに第2のフラグが(たとえば、ビデオエンコーダ200によって)シグナリングされ得る。強制は、固定され得る(たとえば、F2(x,y)のみが0に強制され、F1(x,y)は強制されない)かまたは可変であり得る(F1(x,y)またはF2(x,y)のいずれかが0に強制され得る)。後者の場合、どの残差が0に強制されるのかを示すために別のフラグがシグナリングされ得る。そうするための1つの動機づけは、1つの残差を0に強制することは速度の点で安価であり得るが、より多くのひずみの原因となり得る。したがってビデオエンコーダ200は、レートひずみのトレードオフに関してそれ自体をチューニングする柔軟性を有し得る。別の例では、これらのフラグ(シグナリングされる残差の数およびどの残差が0に強制されるのか)は、変換ユニットレベルでではなくSPS、PPS、スライスまたはタイルグループヘッダでシグナリングされ得る。
【0150】
[0110] いくつかの例では、crc_flagは、(たとえば、ビデオエンコーダ200およびビデオデコーダ300によって)コンテキストコーディングまたはバイパスコーディングされ得る。複数のコンテキストは、cbf_cbまたはcbf_cr値、隣接するまたは現在のブロックモード(イントラ、インター、現ピクチャ参照(current picture referencing)など)、変換スキップフラグ、ブロック寸法特性(幅、高さ、比)、デュアルコーディングツリー(dual coding tree)が使用されるのか共有コーディングツリー(shared coding tree)が使用されるのなどに応じてコンテキストとともに使用され得る。さらに、crcフラグがcbf_crの後にパースされるとき、cbf_crが真であるのかどうかに応じてcrcフラグのための異なるコンテキストが適用され得る。crcフラグがcbf_crの前にパースされる場合、crcフラグの値に応じてcbf_crのための異なるコンテキストが適用され得る。crcフラグ値に応じて新しいコンテキストが定義され得るか、またはcrcフラグ値に応じてcbf_cr成分のための既存のコンテキストが修正され得る。
【0151】
[0111] いくつかの例では、1つまたは複数のCRC方法がサンプルをコーディングするために利用可能であり得る(たとえば、1つの方法が、RMF F1A(x,y)およびF2A(x,y)を伴い得、別の方法は、RMF F1B(x,y)およびF2B(x,y)を伴い得る)。コーダによって使用されるべきCRC方法の決定は、以下の例のうちの1つまたは複数によって(たとえば、ビデオエンコーダ200およびビデオデコーダ300によって)行われ得る。一例では、利用可能な(または可能な)CRC方法のリストは、元のCb成分とCr成分との高域フィルタ処理されたバージョンの間の相関を分析することによって決定され得る。この分析は、オフラインで行われ得、どのCRC方法が圧縮効率利得を与えるのかを決定するために多種多様な内容に基づき得る。いくつかの例では、利用可能な(または可能な)CRC方法のリストは、ピクチャテクスチャまたはブロックテクスチャを分析し、リストに特徴をマッピングすることによって決定され得る。異なるCRC方法は、異なるRMFを使用し得る。使用されるべきCRC方法は、使用されるべきCRC方法を指定するビットストリーム中の指示(たとえば、CRC方法のリストへのフラグまたはインデックス)によって決定され得る。代替的に、ビデオエンコーダ200およびビデオデコーダ300は、ブロックの1つまたは複数の特性(characteristics)に基づいてCRC方法を決定し得る。そのような特性は、限定はしないが、スライスまたはタイルグループタイプがイントラタイプ(intra type)であるのかもしくはインタータイプ(inter type)であるのか、CPR(current picture referencing:現ピクチャ参照)、デュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、残差ブロックの寸法もしくはアスペクト比(aspect ratio)、またはブロックの他の特性を含み得る。ビデオエンコーダ200およびビデオデコーダ300は、決定に基づいて、決定されたCRC方法を使用してビデオの1つまたは複数の成分をコーディングし得る。
【0152】
[0112] さらに、本開示のいくつかの例では、順および逆量子化プロセスQおよびinvQによって使用される量子化パラメータ値Qpは、表1に示されるoffsetQp1およびoffsetQp2値によって修正され得る。これらのoffsetQp値は、デフォルト値であり得るか、またはそれらは、ビットストリーム(SPS、PPS、適応パラメータセット(APS)、スライスもしくはタイルグループヘッダ、ユニットヘッダなど)中でシグナリングされ得る。デフォルト値またはシグナリングされた値は、スライスまたはタイルグループタイプがイントラタイプであるのかもしくはインタータイプであるのか、CPR(現ピクチャ参照)、デュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、残差ブロックの寸法もしくはアスペクト比などに依存し得る。シグナリングは、組み合わされた残差コーディングツールが使用可能であるのかまたは使用不可であるのかをフラグが示すのかどうかに依存し得る。
【0153】
[0113] いくつかの例では、いくつかの特性をもつブロックについてCRC方法は拒否され得る。たとえば、サンプルのしきい値数(たとえば、16個)よりも少数を有するブロックについて、CRC方法は拒否され得る。他の例では、CRC方法が拒否され得るブロックを指定するために、限定はしないが、幅、高さ、アスペクト比、隣接ブロックの特性、cbf_flagsのシグナリングされた値、または他のシンタックス要素などを含むブロックの他の特性が使用され得る。
【0154】
[0114] 本開示では、概して、シンタックス要素など、ある情報を「シグナリング(signaling)」することに言及することがある。「シグナリング」という用語は、概して、符号化ビデオデータを復号するために使用されるシンタックス要素および/または他のデータの値の通信を指し得る。すなわち、ビデオエンコーダ200は、ビットストリーム中でシンタックス要素の値をシグナリングし得る。概して、シグナリングは、ビットストリーム中に値を生成することを指す。上述されたように、ソースデバイス102は、実質的にリアルタイムでビットストリームを宛先デバイス116に移送するか、または、宛先デバイス116による後の取出しのためにシンタックス要素を記憶デバイス112に記憶するときに起こり得るようになど、非リアルタイムでビットストリームを宛先デバイス116に移送し得る。
【0155】
[0115]
図5Aと
図5Bとは、例示的な4分木2分木(QTBT:quadtree binary tree)構造290と、対応するコーディングツリーユニット(CTU:coding tree unit)292とを示す概念図である。実線は4分木分割を表し、点線は2分木分割を表す。2分木の分割された各(すなわち、非リーフ)ノードにおいて、どの分割タイプ(すなわち、水平または垂直)が使用されるのかを示すために1つのフラグがシグナリングされ、ここで、この例では、0は水平分割を示し、1は垂直分割を示す。4分木分割の場合、4分木ノードは、サイズが等しい4つのサブブロックに、水平および垂直にブロックを分割するので、分割タイプを示す必要がない。したがって、QTBT構造290の領域ツリーレベル(すなわち、第1のレベル)(すなわち、実線)についての(分割情報などの)シンタックス要素と、QTBT構造290の予測ツリーレベル(すなわち、第2のレベル)(すなわち、破線)についての(分割情報などの)シンタックス要素とを、ビデオエンコーダ200は符号化し得、ビデオデコーダ300は復号し得る。QTBT構造290の端末リーフノードによって表されるCUについての、予測および変換データなどのビデオデータを、ビデオエンコーダ200は符号化し得、ビデオデコーダ300は復号し得る。
【0156】
[0116] 概して、
図5BのCTU292は、第1および第2のレベルにおいてQTBT構造290のノードに対応するブロックのサイズを定義するパラメータに関連付けられ得る。これらのパラメータは、(サンプル単位でCTU292のサイズを表す)CTUサイズと、最小4分木サイズ(最小許容4分木リーフノードサイズを表す、MinQTSize)と、最大2分木サイズ(最大許容2分木ルートノードサイズを表す、MaxBTSize)と、最大2分木深度(最大許容2分木深度を表す、MaxBTDepth)と、最小2分木サイズ(最小許容2分木リーフノードサイズを表す、MinBTSize)とを含み得る。
【0157】
[0117] CTUに対応するQTBT構造のルートノードは、QTBT構造の第1のレベルにおいて4つの子ノードを有してよく、その各々は、4分木区分に従って区分され得る。すなわち、第1のレベルのノードは、(子ノードを有しない)リーフノードであるか、あるいは4つの子ノードを有する。QTBT構造290の例は、ブランチのために実線を有する親ノードと子ノードとを含むようなノードを表す。第1のレベルのノードは、最大許容2分木ルートノードサイズ(MaxBTSize)よりも大きくない場合、それぞれの2分木によってさらに区分され得る。1つのノードの2分木分割は、分割から得られるノードが最小許容2分木リーフノードサイズ(MinBTSize)または最大許容2分木深度(MaxBTDepth)に到達するまで反復され得る。QTBT構造290の例は、ブランチのために破線を有するようなノードを表す。2分木リーフノードは、コーディングユニット(CU:coding unit)と呼ばれ、コーディングユニット(CU)は、それ以上区分することなく、予測(たとえば、イントラピクチャ予測またはインターピクチャ予測)および変換のために使用される。上記で論じられたように、CUは「ビデオブロック(video block)」または「ブロック」と呼ばれることもある。
【0158】
[0118] QTBT区分構造の一例では、CTUサイズは、128×128(ルーマサンプルおよび2つの対応する64×64クロマサンプル)として設定され、MinQTSizeは16×16として設定され、MaxBTSizeは64×64として設定され、(幅と高さの両方について)MinBTSizeは4として設定され、MaxBTDepthは4として設定される。4分木リーフノードを生成するために、最初に4分木区分がCTUに適用される。4分木リーフノードは、16×16(すなわち、MinQTSize)から128×128(すなわち、CTUサイズ)までのサイズを有し得る。4分木リーフノードは、128×128である場合、サイズがMaxBTSize(すなわち、この例では64×64)を上回るので、2分木によってそれ以上分割されない。そうでない場合、4分木リーフノードは、2分木によってさらに区分される。したがって、4分木リーフノードはまた、2分木のためのルートノードであり、0としての2分木深度を有する。2分木深度がMaxBTDepth(この例では4)に達したとき、さらなる分割は許可されない。2分木ノードがMinBTSize(この例では4)に等しい幅を有するとき、それは、さらなる垂直分割が許可されないことを暗示する。同様に、MinBTSizeに等しい高さを有する2分木ノードは、その2分木ノードに対してそれ以上の垂直分割が許されないことを暗示する。上述されたように、2分木のリーフノードは、CUと呼ばれ、さらなる区分なしに予測および変換に従ってさらに処理される。
【0159】
[0119]
図6は、本開示の技法を実行し得る例示的なビデオエンコーダ200を示すブロック図である。
図6は、説明のために提供されるものであり、本開示で広く例示され説明される技法を限定するものと見なされるべきではない。説明の目的で、本開示では、HEVCビデオコーディング規格および開発中のH.266ビデオコーディング規格などのビデオコーディング規格のコンテキストにおいて、ビデオエンコーダ200について説明する。しかしながら、本開示の技法は、これらのビデオコーディング規格に限定されず、一般的にビデオ符号化および復号に適用可能である。
【0160】
[0120]
図6の例では、ビデオエンコーダ200は、ビデオデータメモリ230と、モード選択ユニット202と、残差生成ユニット204と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、再構築ユニット(reconstruction unit)214と、フィルタユニット216と、復号ピクチャバッファ(DPB)218と、エントロピー符号化ユニット220とを含む。さらに、
図6の例では、ビデオエンコーダ200は、残差修正ユニット(residual modification unit)205と逆残差修正ユニット(inverse residual modification unit)213とを含み得る。ビデオデータメモリ230と、モード選択ユニット202と、残差生成ユニット204と、残差修正ユニット205と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、逆残差修正ユニット213と、再構築ユニット214と、フィルタユニット216と、DPB218と、エントロピー符号化ユニット220とのいずれかまたはすべては、1つまたは複数のプロセッサ中にあるいは処理回路中に実装され得る。その上、ビデオエンコーダ200は、これらおよび他の機能を実行するための追加または代替のプロセッサまたは処理回路を含み得る。
【0161】
[0121] ビデオデータメモリ230は、ビデオエンコーダ200の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオエンコーダ200は、たとえば、ビデオソース104(
図1)から、ビデオデータメモリ230に記憶されたビデオデータを受信し得る。DPB218は、ビデオエンコーダ200による後続のビデオデータの予測において使用する参照ビデオデータを記憶する参照ピクチャメモリとして働き得る。ビデオデータメモリ230とDPB218とは、同期DRAM(SDRAM)を含むダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗性RAM(RRAM(登録商標))、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ230とDPB218とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ230は、図示のように、ビデオエンコーダ200の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
【0162】
[0122] 本開示では、ビデオデータメモリ230への言及は、特にそのように説明されない限り、ビデオエンコーダ200の内部のメモリに限定されるものとして解釈されるべきではなく、または特にそのように説明されない限り、ビデオエンコーダ200の外部のメモリに限定されるものとして解釈されるべきではない。そうではなく、ビデオデータメモリ230への言及は、ビデオエンコーダ200が符号化のために受信するビデオデータ(たとえば、符号化されるべきである現在のブロックのビデオデータ)を記憶する参照メモリとして理解されたい。
図1のメモリ106はまた、ビデオエンコーダ200の様々なユニットからの出力の一時的記憶を提供し得る。
【0163】
[0123]
図6の様々なユニットは、ビデオエンコーダ200によって実行される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。固定機能回路は、特定の機能を与える回路を指し、実行され得る動作に関してあらかじめ設定される。プログラマブル回路は、様々なタスクを実行するように、および実行され得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義された方式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、(たとえば、パラメータを受信するかまたはパラメータを出力するために)ソフトウェア命令を実行し得るが、固定機能回路が実行する動作のタイプは概してイミュータブル(immutable)である。いくつかの例では、ユニットのうちの1つまたは複数は、別個の回路ブロック(固定機能またはプログラマブル)であり得、いくつかの例では、1つまたは複数のユニットは集積回路であり得る。
【0164】
[0124] ビデオエンコーダ200は、プログラマブル回路から形成される論理演算装置(ALU)、初等関数ユニット(EFU)、デジタル回路、アナログ回路、および/またはプログラマブルコアを含み得る。ビデオエンコーダ200の動作が、プログラマブル回路によって実行されるソフトウェアを使用して実行される例では、メモリ106(
図1)は、ビデオエンコーダ200が受信し実行するソフトウェアのオブジェクトコードを記憶し得るか、またはビデオエンコーダ200内の別のメモリ(図示されず)が、そのような命令を記憶し得る。
【0165】
[0125] ビデオデータメモリ230は、受信されたビデオデータを記憶するように構成される。ビデオエンコーダ200は、ビデオデータメモリ230からビデオデータのピクチャを取り出し、残差生成ユニット204とモード選択ユニット202とにビデオデータを提供し得る。ビデオデータメモリ230中のビデオデータは、符号化されるべき未加工のビデオデータであり得る。
【0166】
[0126] モード選択ユニット202は、動き推定ユニット222と、動き補償ユニット224と、イントラ予測ユニット226とを含む。モード選択ユニット202は、他の予測モードに従ってビデオ予測を実行するために追加の機能ユニットを含み得る。例として、モード選択ユニット202は、パレットユニット、(動き推定ユニット222および/または動き補償ユニット224の一部であり得る)イントラブロックコピーユニット、アフィンユニット、線形モデル(LM)ユニットなどを含み得る。
【0167】
[0127] モード選択ユニット202は、概して、符号化パラメータの組合せをテストするために複数の符号化パスを協調させ、そのような組合せのためのレートひずみ値を生じる。符号化パラメータは、CUへのCTUの区分、CUのための予測モード、CUの残差データのための変換タイプ、CUの残差データのための量子化パラメータなどを含み得る。モード選択ユニット202は、他のテストされた組合せよりも良好であるレートひずみ値を有する符号化パラメータの組合せを最終的に選択し得る。
【0168】
[0128] ビデオエンコーダ200は、一連のCTUにビデオデータメモリ230から取り出されたピクチャを区分し、スライス内の1つまたは複数のCTUをカプセル化し得る。モード選択ユニット202は、上記で説明されたHEVCのQTBT構造または4分木構造などのツリー構造に従ってピクチャのCTUを区分し得る。上記で説明されたように、ビデオエンコーダ200は、ツリー構造に従ってCTUを区分することから1つまたは複数のCUを形成し得る。そのようなCUはまた、一般に「ビデオブロック」または「ブロック」と呼ばれることもある。
【0169】
[0129] 概して、モード選択ユニット202はまた、現在のブロック(たとえば、現在のCU、またはHEVCでは、PUとTUとの重複する部分)についての予測ブロックを生成するように、それの構成要素(たとえば、動き推定ユニット222、動き補償ユニット224、およびイントラ予測ユニット226)を制御する。現在のブロックのインター予測のために、動き推定ユニット222は、1つまたは複数の参照ピクチャ(たとえば、DPB218に記憶されている1つまたは複数の以前のコード化ピクチャ)中で1つまたは複数のぴったり一致する参照ブロックを識別するために動き探索を実行し得る。特に、動き推定ユニット222は、たとえば、絶対差分和(SAD)、2乗差分和(SSD)、平均絶対差(MAD)、平均2乗差(MSD)などに従って、現在のブロックに対して潜在的参照ブロックがどのくらい類似しているかを表す値を計算し得る。動き推定ユニット222は、概して、現在のブロックと考慮されている参照ブロックとの間のサンプルごとの差分を使用してこれらの計算を実行し得る。動き推定ユニット222は、現在のブロックに最もぴったり一致する参照ブロックを示す、これらの計算から得られた最も低い値を有する参照ブロックを識別し得る。
【0170】
[0130] 動き推定ユニット222は、現在のピクチャ中の現在のブロックの位置に対して参照ピクチャ中の参照ブロックの位置を定義する1つまたは複数の動きベクトル(MV)を形成し得る。動き推定ユニット222は、次いで、動きベクトルを動き補償ユニット224に提供し得る。たとえば、単方向インター予測では、動き推定ユニット222は、単一の動きベクトルを提供し得るが、双方向インター予測では、動き推定ユニット222は、2つの動きベクトルを提供し得る。動き補償ユニット224は、次いで、動きベクトルを使用して予測ブロックを生成し得る。たとえば、動き補償ユニット224は、動きベクトルを使用して参照ブロックのデータを取り出し得る。別の例として、動きベクトルが部分サンプル精度を有する場合、動き補償ユニット224は、1つまたは複数の補間フィルタに従って予測ブロックのための値を補間し得る。さらに、双方向インター予測の場合、動き補償ユニット224は、それぞれの動きベクトルによって識別される2つの参照ブロックのためのデータを取り出し、たとえば、サンプルごとの平均化または重み付け平均化を通して取り出されたデータを組み合わせ得る。
【0171】
[0131] 別の例として、イントラ予測、またはイントラ予測コーディングのために、イントラ予測ユニット226は、現在のブロックに隣接しているサンプルから予測ブロックを生成し得る。たとえば、方向性モードでは、イントラ予測ユニット226は、隣接サンプルの値を概して数学的に組み合わせ、現在のブロックにわたって規定の方向にこれらの計算された値をポピュレートして、予測ブロックを生成し得る。別の例として、DCモードでは、イントラ予測ユニット226は、現在のブロックに対する隣接サンプルの平均を計算し、予測ブロックのサンプルごとにこの得られた平均を含むように予測ブロックを生成し得る。
【0172】
[0132] モード選択ユニット202は、予測ブロックを残差生成ユニット204に提供する。残差生成ユニット204は、ビデオデータメモリ230から現在のブロックの未加工の、コーディングされていないバージョンを受信し、モード選択ユニット202から予測ブロックを受信する。残差生成ユニット204は、現在のブロックと予測ブロックとの間のサンプルごとの差を計算する。得られたサンプルごとの差は、現在のブロックのための残差ブロックを定義する。いくつかの例では、残差生成ユニット204はまた、残差差分パルスコード変調(RDPCM:residual differential pulse code modulation)を使用して残差ブロックを生成するために残差ブロック中のサンプル値の間の差を決定し得る。いくつかの例では、残差生成ユニット204は、バイナリ減算を実行する1つまたは複数の減算器回路を使用して形成され得る。
【0173】
[0133] モード選択ユニット202がCUをPUに区分する例では、各PUは、ルーマ予測ユニットと対応するクロマ予測ユニットとに関連付けられ得る。ビデオエンコーダ200とビデオデコーダ300とは、様々なサイズを有するPUをサポートし得る。上記のように、CUのサイズは、CUのルーマコーディングブロックのサイズを指すことがあり、PUのサイズは、PUのルーマ予測ユニットのサイズを指すことがある。特定のCUのサイズが2N×2Nであると仮定すると、ビデオエンコーダ200は、イントラ予測のための2N×2NまたはN×NのPUサイズと、インター予測のための2N×2N、2N×N、N×2N、N×N、または同様のものの対称的PUサイズとをサポートし得る。ビデオエンコーダ200とビデオデコーダ300とはまた、インター予測のための2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズの非対称的区分をサポートし得る。
【0174】
[0134] モード選択ユニットがCUをPUにさらに区分しない例では、各CUは、ルーマコーディングブロックと、対応するクロマコーディングブロックとに関連付けられ得る。上記のように、CUのサイズは、CUのルーマコーディングブロックのサイズを指し得る。ビデオエンコーダ200とビデオデコーダ300とは、2N×2N、2N×N、またはN×2NのCUサイズをサポートし得る。
【0175】
[0135] いくつかの例として、イントラブロックコピーモードコーディング、アフィンモードコーディング、および線形モデル(LM)モードコーディングなどの他のビデオコーディング技法の場合、モード選択ユニット202は、コーディング技法に関連するそれぞれのユニットを介して、符号化されている現在のブロックのための予測ブロックを生成する。パレットモードコーディングなどのいくつかの例では、モード選択ユニット202は、予測ブロックを生成しなくてよく、代わりに、選択されたパレットに基づいてブロックを再構成するための方式を示すシンタックス要素を生成し得る。そのようなモードでは、モード選択ユニット202は、符号化されるべきこれらのシンタックス要素をエントロピー符号化ユニット220に提供し得る。
【0176】
[0136] 上記で説明したように、残差生成ユニット204は、現在のブロックに対するビデオデータと、対応する予測ブロックとを受信する。残差生成ユニット204は、次いで、現在のブロックに対する残差ブロックを生成する。残差ブロックを生成するために、残差生成ユニット204は、予測ブロックと現在のブロックとの間のサンプルごとの差分を計算する。
【0177】
[0137] 本開示の1つまたは複数の技法によれば、残差修正ユニット205は、残差生成ユニット204によって生成された残差クロマデータにRMFを適用し得る。たとえば、残差修正ユニット205は、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用し得る。残差修正ユニット205は、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用し得る。この例では、第1のクロマ残差データは、第1のクロマ成分(たとえば、Cb)に関連付けられ、第2のクロマ残差データは、第2のクロマ成分(たとえば、Cr)に関連付けられる。残差修正ユニット205は、残差ルーマデータ(residual luma data)にRMFを適用しない。
【0178】
[0138] 変換処理ユニット206は、変換係数のブロック(本明細書では「変換係数ブロック」と呼ばれる)を生成するために、残差ブロック(たとえば、RMFを適用することによって生成される修正された残差データのブロック)に1つまたは複数の変換を適用する。変換処理ユニット206は、変換係数ブロックを形成するために残差ブロックに様々な変換を適用し得る。たとえば、変換処理ユニット206は、離散コサイン変換(DCT)、方向変換、カルーネンレーベ変換(KLT)、または概念的に同様の変換を残差ブロックに適用し得る。いくつかの例では、変換処理ユニット206は、残差ブロックに複数の変換、たとえば、回転変換など1次変換および2次変換を実行し得る。いくつかの例では、変換処理ユニット206は、残差ブロックに変換を適用しない。
【0179】
[0139] 量子化ユニット208は、量子化変換係数ブロックを生成するために変換係数ブロック中の変換係数を量子化し得る。量子化ユニット208は、現在のブロックに関連する量子化パラメータ(QP)値に従って変換係数ブロックの変換係数を量子化し得る。ビデオエンコーダ200は、(たとえば、モード選択ユニット202を介して)CUに関連するQP値を調整することによって現在のブロックに関連する変換係数ブロックに適用される量子化の程度を調整し得る。量子化は情報の損失をもたらし得、したがって、量子化変換係数は、変換処理ユニット206によって生成された元の変換係数よりも低い精度を有し得る。
【0180】
[0140] 逆量子化ユニット210および逆変換処理ユニット212は、変換係数ブロックから残差ブロックを再構築するために、それぞれ、量子化変換係数ブロックに逆量子化および逆変換を適用し得る。本開示の1つまたは複数の例によれば、逆残差修正ユニット213は、逆変換処理ユニット212によって生成される復号され修正されたクロマ残差データに逆RMFを適用し得る。逆残差修正ユニット213によって適用される逆RMFは、残差修正ユニット205によって適用されるRMFの逆であり得る。したがって、逆残差修正ユニット213は、残差ブロックを生成し得る。逆残差修正ユニット213は、残差ルーマデータに逆RMFを適用しない。
【0181】
[0141] 再構築ユニット214は、再構築された残差ブロックと、モード選択ユニット202によって生成された予測ブロックとに基づいて、(ある程度のひずみを潜在的にもっているものの)現在のブロックに対応する再構築されたブロックを生成し得る。たとえば、再構築ユニット214は、再構築されたブロックを生成するために、モード選択ユニット202によって生成された予測ブロックからの対応するサンプルに、再構築された残差ブロックのサンプルを加算し得る。
【0182】
[0142] フィルタユニット216は、再構築されたブロックに対して1つまたは複数のフィルタ演算を実行し得る。たとえば、フィルタユニット216は、CUのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実行し得る。フィルタユニット216の動作は、いくつかの例では、スキップされ得る。
【0183】
[0143] ビデオエンコーダ200は、DPB218中に再構築されたブロックを記憶する。たとえば、フィルタユニット216の動作が必要とされない例において、再構築ユニット214は、再構築されたブロックをDPB218に記憶し得る。フィルタユニット216の動作が必要とされる例では、フィルタユニット216は、フィルタ処理された再構築されたブロックをDPB218に記憶し得る。動き推定ユニット222と動き補償ユニット224とは、後で符号化されるピクチャのブロックをインター予測するために、再構築(および潜在的にフィルタ処理)されたブロックから形成された参照ピクチャをDPB218から取り出し得る。加えて、イントラ予測ユニット226は、現在のピクチャ中の他のブロックをイントラ予測するために、現在のピクチャのDPB218中の再構築されたブロックを使用し得る。
【0184】
[0144] 概して、エントロピー符号化ユニット220は、ビデオエンコーダ200の他の機能構成要素から受信されたシンタックス要素をエントロピー符号化し得る。たとえば、エントロピー符号化ユニット220は、量子化ユニット208からの量子化された変換係数ブロックをエントロピー符号化し得る。別の例として、エントロピー符号化ユニット220は、モード選択ユニット202からの予測シンタックス要素(たとえば、インター予測のための動き情報またはイントラ予測のためのイントラモード情報)をエントロピー符号化し得る。エントロピー符号化ユニット220は、エントロピー符号化されたデータを生成するためにビデオデータの別の例であるシンタックス要素に対して1つまたは複数のエントロピー符号化動作を実行し得る。たとえば、エントロピー符号化ユニット220は、コンテキスト適応型可変長コーディング(CAVLC)動作、CABAC動作、可変-可変(V2V:variable-to-variable)長コーディング動作、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)動作、確率間隔区分エントロピー(PIPE)コーディング動作、指数ゴロム符号化動作、または別のタイプのエントロピー符号化動作をデータに対して実行し得る。いくつかの例では、エントロピー符号化ユニット220は、シンタックス要素がエントロピー符号化されないバイパスモードで動作し得る。
【0185】
[0145] ビデオエンコーダ200は、スライスまたはピクチャのブロックを再構築するために必要なエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。特に、エントロピー符号化ユニット220は、ビットストリームを出力し得る。
【0186】
[0146] 上記で説明された動作について、ブロックに関して説明する。そのような説明は、ルーマコーディングブロックおよび/またはクロマコーディングブロックのための動作であるものとして理解されるべきである。上記で説明されたように、いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、CUのルーマおよびクロマ成分である。いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、PUのルーマおよびクロマ成分である。
【0187】
[0147] いくつかの例では、ルーマコーディングブロックに関して実行される動作は、クロマコーディングブロックのために繰り返される必要はない。一例として、ルーマコーディングブロックのための動きベクトル(MV)と参照ピクチャとを識別するための動作は、クロマブロックのためのMVと参照ピクチャとを識別するために繰り返される必要はない。むしろ、ルーマコーディングブロックのためのMVは、クロマブロックのためのMVを決定するためにスケーリングされ得、参照ピクチャは同じであり得る。別の例として、イントラ予測プロセスは、ルーマコーディングブロックとクロマコーディングブロックとに対して同じであり得る。
【0188】
[0148] ビデオエンコーダ200は、ビデオデータを符号化するように構成されたデバイスの一例を表し、デバイスは、ビデオデータを記憶するように構成されたメモリと、回路中に実装される1つまたは複数の処理ユニットを含み、1つまたは複数の処理ユニットは、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の残差修正関数を適用することと、第1の修正されたクロマ残差データを符号化することと、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数を適用することと、第2の修正されたクロマ残差データを符号化することと、ここにおいて、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられる、を行うように構成される。
【0189】
[0149]
図7は、本開示の技法を実行し得る例示的なビデオデコーダ300を示すブロック図である。
図7は、説明を目的に提供されるものであり、本開示において広く例示され説明される技法を限定するものではない。説明の目的で、本開示では、JEMと、VVCと、HEVCとの技法に従ってビデオデコーダ300について説明する。しかしながら、本開示の技法は、他のビデオコーディング規格に構成されたビデオコーディングデバイスによって実行され得る。
【0190】
[0150]
図7の例では、ビデオデコーダ300は、コード化ピクチャバッファ(CPB)メモリ320と、エントロピー復号ユニット302と、予測処理ユニット304と、逆量子化ユニット306と、逆変換処理ユニット308と、再構築ユニット310と、フィルタユニット312と、復号ピクチャバッファ(DPB)314とを含む。本開示の1つまたは複数の技法によれば、ビデオデコーダ300はまた、逆残差修正ユニット309を含む。CPBメモリ320と、エントロピー復号ユニット302と、予測処理ユニット304と、逆量子化ユニット306と、逆変換処理ユニット308と、逆残差修正ユニット309と、再構築ユニット310と、フィルタユニット312と、DPB314とのいずれかまたはすべては、1つまたは複数のプロセッサ中にあるいは処理回路中に実装され得る。その上、ビデオデコーダ300は、これらおよび他の機能を実行するための追加または代替のプロセッサまたは処理回路を含み得る。
【0191】
[0151] 予測処理ユニット304は、動き補償ユニット316と、イントラ予測ユニット318とを含む。予測処理ユニット304は、他の予測モードに従って予測を実行するための追加のユニットを含み得る。例として、予測処理ユニット304は、パレットユニット、(動き補償ユニット316の一部を形成し得る)イントラブロックコピーユニット、アフィンユニット、線形モデル(LM)ユニットなどを含み得る。他の例では、ビデオデコーダ300は、より多数の、より少数の、または異なる機能構成要素を含み得る。
【0192】
[0152] CPBメモリ320は、ビデオデコーダ300の構成要素によって復号されるべき、符号化ビデオビットストリームなどのビデオデータを記憶し得る。CPBメモリ320に記憶されたビデオデータは、たとえば、コンピュータ可読媒体110(
図1)から取得され得る。CPBメモリ320は、符号化ビデオビットストリームからの符号化ビデオデータ(たとえば、シンタックス要素)を記憶するCPBを含み得る。また、CPBメモリ320は、ビデオデコーダ300の様々なユニットからの出力を表す一時データなど、コード化ピクチャのシンタックス要素以外のビデオデータを記憶し得る。DPB314は、概して、ビデオデコーダ300が符号化ビデオビットストリームの後続のデータまたはピクチャを復号するときに出力しおよび/または参照ビデオデータとして使用し得る復号ピクチャを記憶する。CPBメモリ320とDPB314とは、同期DRAM(SDRAM)を含むダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗性RAM(RRAM)、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。CPBメモリ320とDPB314とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、CPBメモリ320は、ビデオデコーダ300の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
【0193】
[0153] 追加または代替として、いくつかの例では、ビデオデコーダ300は、メモリ120(
図1)からコード化ビデオデータを取り出し得る。すなわち、メモリ120は、CPBメモリ320を用いて上記で論じられたデータを記憶し得る。同様に、メモリ120は、ビデオデコーダ300の機能の一部または全部が、ビデオデコーダ300の処理回路によって実行されるべきソフトウェアにおいて実装されたとき、ビデオデコーダ300によって実行されるべき命令を記憶し得る。
【0194】
[0154]
図7に示されている様々なユニットは、ビデオデコーダ300によって実行される動作を理解するのを支援するために図示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。
図6と同様に、固定機能回路は、特定の機能を与える回路を指し、実行され得る動作にあらかじめ設定される。プログラマブル回路は、様々なタスクを実行するように、および実行され得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義された方式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、(たとえば、パラメータを受信するかまたはパラメータを出力するために)ソフトウェア命令を実行し得るが、固定機能回路が実行する動作のタイプは概してイミュータブルである。いくつかの例では、ユニットのうちの1つまたは複数は、別個の回路ブロック(固定機能またはプログラマブル)であり得、いくつかの例では、1つまたは複数のユニットは集積回路であり得る。
【0195】
[0155] ビデオデコーダ300は、プログラマブル回路から形成されるALU、EFU、デジタル回路、アナログ回路、および/またはプログラマブルコアを含み得る。ビデオデコーダ300の動作がプログラマブル回路上で実行するソフトウェアによって実行される例では、オンチップまたはオフチップメモリは、ビデオデコーダ300が受信し、実行するソフトウェアの命令(たとえば、オブジェクトコード)を記憶し得る。
【0196】
[0156] エントロピー復号ユニット302は、CPBメモリ320から符号化ビデオデータを受信し、ビデオデータをエントロピー復号してシンタックス要素を再生し得る。予測処理ユニット304と、逆量子化ユニット306と、逆変換処理ユニット308と、逆残差修正ユニット309と、再構築ユニット310と、フィルタユニット312とは、ビットストリームから抽出されたシンタックス要素に基づいて復号ビデオデータを生成し得る。
【0197】
[0157] 概して、ビデオデコーダ300は、ブロックごとにピクチャを再構築する。ビデオデコーダ300は、各ブロックに対して再構築を個々に実行し得る(ここで、現在再構築されている、すなわち、復号されているブロックは、「現在のブロック(current block)」と呼ばれることがある)。
【0198】
[0158] エントロピー復号ユニット302は、量子化変換係数ブロックの量子化変換係数を定義するシンタックス要素ならびに量子化パラメータ(QP)および/または変換モード指示などの変換情報をエントロピー復号し得る。逆量子化ユニット306は、量子化の程度を決定するために、また同様に、逆量子化ユニット306が適用すべき逆量子化の程度を決定するために量子化変換係数ブロックに関連するQPを使用し得る。逆量子化ユニット306は、たとえば、量子化変換係数を逆量子化するためにビット単位左シフト動作を実行し得る。逆量子化ユニット306は、それによって、変換係数を含む変換係数ブロックを形成し得る。
【0199】
[0159] 逆量子化ユニット306が変換係数ブロックを形成した後に、逆変換処理ユニット308は、現在のブロックに関連する残差ブロックを生成するために変換係数ブロックに1つまたは複数の逆変換を適用し得る。本開示の1つまたは複数の例によれば、逆変換処理ユニット308は、復号され修正されたクロマ残差データを生成するために変換係数ブロックに1つまたは複数の逆変換を適用し得る。一例では、逆変換処理ユニット308は、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT)、逆回転変換、逆方向変換、または別の逆変換を変換係数ブロックに適用し得る。現在のブロックがルーマ成分と2つのクロマ成分とを含み得るので、逆変換処理ユニット308は、現在のブロックのための復号されたルーマ残差データと、第1の復号され修正されたクロマ残差データと、第2の復号され修正されたクロマ残差データとを生成し得る。
【0200】
[0160] 本開示の1つまたは複数の技法によれば、逆残差修正ユニット309は、復号され修正されたクロマ残差データに逆RMFを適用し得る。したがって、逆残差修正ユニット309は、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データ(たとえば、Cb残差データ)に第1の逆残差修正関数を適用し得る。さらに、逆残差修正ユニット309は、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データ(たとえば、Cr残差データ)に第2の逆残差修正関数を適用し得る。
【0201】
[0161] さらに、予測処理ユニット304は、エントロピー復号ユニット302によってエントロピー復号された予測情報シンタックス要素に従って予測ブロックを生成する。たとえば、現在のブロックがインター予測されることを予測情報シンタックス要素が示す場合、動き補償ユニット316は予測ブロックを生成し得る。この場合、予測情報シンタックス要素は、参照ブロックを取り出すDPB314中の参照ピクチャ、ならびに現在のピクチャ中の現在のブロックのロケーションに対する参照ピクチャ中の参照ブロックのロケーションを識別する動きベクトルを示し得る。動き補償ユニット316は、概して、動き補償ユニット224(
図6)に関して説明された方式と実質的に同様である方式でインター予測プロセスを実行し得る。
【0202】
[0162] 別の例として、予測情報シンタックス要素が、現在のブロックがイントラ予測されることを示す場合、イントラ予測ユニット318は、予測情報シンタックス要素によって示されるイントラ予測モードに従って予測ブロックを生成し得る。この場合も、イントラ予測ユニット318は、概して、イントラ予測ユニット226(
図6)に関して説明されたのと実質的に同様である様式でイントラ予測プロセスを実行し得る。イントラ予測ユニット318は、DPB314から、現在のブロックに対する隣接サンプルのデータを取り出し得る。
【0203】
[0163] 再構成ユニット310は、予測ブロックと残差ブロック(たとえば、逆残差修正ユニット309によって生成された残差クロマデータのブロック)とを使用して現在のブロックを再構成し得る。たとえば、再構築ユニット310は、現在のブロックを再構築するために予測ブロックの対応するサンプルに残差ブロックのサンプルを加算し得る。本開示の技法によれば、残差ブロックは、逆残差修正ユニット309によって生成された逆修正されたクロマ残差データであり得る。
【0204】
[0164] フィルタユニット312は、再構築されたブロックに対して1つまたは複数のフィルタ演算を実行し得る。たとえば、フィルタユニット312は、再構築されたブロックのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実行し得る。フィルタユニット312の動作は、すべての例において必ずしも実行されるとは限らない。
【0205】
[0165] ビデオデコーダ300は、DPB314中に再構築されたブロックを記憶し得る。たとえば、フィルタユニット312の動作が実行されない例において、再構築ユニット310は、再構築されたブロックをDPB314に記憶し得る。フィルタユニット312の動作が実行される例では、フィルタユニット312は、フィルタ処理された再構築されたブロックをDPB314に記憶し得る。上記で論じられたように、DPB314は、イントラ予測のための現在のピクチャのサンプルおよび後続の動き補償のための以前に復号されたピクチャなど、参照情報を予測処理ユニット304に提供し得る。その上、ビデオデコーダ300は、DPBからの復号ピクチャを、後続のプレゼンテーションのために、
図1のディスプレイデバイス118などのディスプレイデバイス上に出力し得る。
【0206】
[0166] このようにして、ビデオデコーダ300は、ビデオ復号デバイスの一例を表し、デバイスは、ビデオデータを記憶するように構成されたメモリと、回路中に実装された1つまたは複数の処理ユニットとを含む、1つまたは複数の処理ユニットは、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成することとを行うように構成される。
【0207】
[0167]
図8は、現在のブロックを符号化するための例示的な方法を示すフローチャートである。現在のブロックは現在のCUを含み得る。ビデオエンコーダ200(
図1および
図6)に関して説明されるが、他のデバイスが
図8の方法と同様の方法を実施するように構成され得ることを理解されたい。
【0208】
[0168] この例では、ビデオエンコーダ200は、最初に、現在のブロックを予測する(350)。たとえば、ビデオエンコーダ200は、現在のブロックのための予測ブロックを形成し得る。ビデオエンコーダ200は、次いで、現在のブロックのための残差ブロックを計算し得る(352)。言い換えれば、ビデオエンコーダ200は、現在のブロックのためのルーマ残差データとクロマ残差データとを計算し得る。残差ブロックを計算するために、ビデオエンコーダ200は、元の符号化されていないブロックのサンプルと現在のブロックのための予測ブロックの対応するサンプルとの間の差分を計算し得る。たとえば、Cb残差ブロックを計算するために、ビデオエンコーダ200は、元の符号化されていないブロックのCbサンプルと現在のブロックのための予測ブロックの対応するCbサンプルとの間の差分を計算し得る。
【0209】
[0169] 本開示の1つまたは複数の技法によれば、ビデオエンコーダ200は、修正されたクロマ残差データを生成するために現在のブロックのクロマ残差データに残差修正関数を適用し得る(353)。ビデオエンコーダ200は、次いで、変換係数を生成するために残差ブロックを変換し、残差ブロックの変換係数を量子化する(354)。すなわち、ビデオエンコーダ200は、次いで、周波数領域などの変換領域に修正されたクロマ残差データを変換する順変換を適用し、それによって、変換係数を生成し得る。ビデオエンコーダ200は、次いで、変換係数を量子化し得る。他の例では、ビデオエンコーダ200は、順変換を適用した後で残差修正関数を適用し得る。
【0210】
[0170] 次に、ビデオエンコーダ200は、残差ブロックの量子化された変換係数を走査し得る(356)。走査中に、または走査に続いて、ビデオエンコーダ200は、変換係数をエントロピー符号化し得る(358)。たとえば、ビデオエンコーダ200は、CAVLCまたはCABACを使用して変換係数を符号化し得る。ビデオエンコーダ200は、次いで、ブロックのエントロピー符号化されたデータを出力し得る(360)。
【0211】
[0171]
図9は、ビデオデータの現在のブロックを復号するための例示的な方法を示すフローチャートである。現在のブロックは現在のCUを含み得る。ビデオデコーダ300(
図1および
図7)に関して説明されるが、他のデバイスが
図9の方法と同様の方法を実施するように構成され得ることを理解されたい。
【0212】
[0172] ビデオデコーダ300は、エントロピーコード化予測情報、および現在のブロックに対応する残差ブロックの変換係数のためのエントロピーコード化データなどの、現在のブロックのためのエントロピーコード化データを受信し得る(370)。ビデオデコーダ300は、現在のブロックのための予測情報を決定し、残差ブロックの変換係数を再生するために、エントロピー符号化されたデータをエントロピー復号し得る(372)。ビデオデコーダ300は、現在のブロックのための予測ブロックを計算するために、たとえば、現在のブロックのための予測情報によって示されるイントラ予測またはインター予測モードを使用して、現在のブロックを予測し得る(374)。ビデオデコーダ300は、次いで、量子化変換係数のブロックを作成するために、再生された変換係数を逆走査し得る(376)。ビデオデコーダ300は、次いで、残差ブロックを生成するために変換係数を逆量子化し、逆変換し得る(378)。ビデオデコーダ300は、現在のブロックの色構成要素ごとに行為372~378を実行し得る。したがって、ビデオデコーダ300は、現在のブロックのためのY残差ブロックと、Cb残差ブロックと、Cr残差ブロックとを生成し得る。Cb残差ブロックは、第1の復号された残差クロマデータであり得、Cr残差ブロックは、第2の復号された残差クロマデータであり得る。他の例では、Cr残差ブロックは、第1の復号された残差クロマデータと見なされ得、Cb残差ブロックは、第2の復号された残差クロマデータと見なされ得る。本開示の1つまたは複数の技法によれば、ビデオデコーダ300は、復号された残差クロマデータに逆残差修正関数を適用し得る(379)。ビデオデコーダ300は、本開示の他の場所で与えられる例のいずれかに従って、復号された残差クロマデータに逆残差修正関数を適用し得る。他の例では、ビデオデコーダ300は、逆変換を適用する前に逆残差修正関数を適用し得る。
【0213】
[0173] ビデオデコーダ300は、予測ブロックと残差ブロックとを組み合わせることによって、最終的に現在のブロックを復号し得る(380)。たとえば、ビデオデコーダ300は、色成分の各々について、色成分のための残差ブロックの対応するサンプルに予測ブロックの色成分のサンプルを加算し得る。
【0214】
[0174]
図10は、本開示の1つまたは複数の技法による、ビデオエンコーダ200の例示的な動作を示すフローチャートである。
図10の例では、ビデオエンコーダ200は、第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用し得る(400)。たとえば、ビデオエンコーダ200は、式1.a.i、1.b.i、1.c.i、1.c.vのいずれかで説明した残差修正関数または別の残差修正関数を適用し得る。
【0215】
[0175] さらに、
図10の例では、ビデオエンコーダ200は、第1の修正されたクロマ残差データを符号化し得る(402)。第1の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダ200は、周波数領域などの変換領域にサンプル領域からの第1の修正されたクロマ残差データを変換する順変換(たとえば、離散コサイン変換、離散サイン変換、または別のタイプの変換)を適用し得る(404)。サンプル領域中のデータは、サンプルの値(たとえば、ルーマ値、Cb値、Cr値)を示す。第1の修正されたクロマ残差データに順変換を適用することによって、ビデオエンコーダ200は、変換係数の第1のブロックを生成し得る。さらに、第1の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダ200は、変換係数の第1のブロック中の変換係数を量子化し得る。さらに、ビデオエンコーダ200は、変換係数の量子化された第1のブロックを表すシンタックス要素にエントロピー符号化を適用し得る。いくつかの例では、ビデオエンコーダ200は、順変換の適用をスキップし得る。言い換えれば、ビデオエンコーダ200は、現在のブロックとともに変換スキップモードを使用し得る。説明を簡単にするために、本開示は、変換スキップモードが現在のブロックとともに使用される場合に残差データに適用するために「変換係数(transform coefficient)」という用語を使用し得る。
【0216】
[0176] さらに、ビデオエンコーダ200は、第2の修正されたクロマ残差データを生成するためにブロックの第2のクロマ残差データに第2の残差修正関数を適用し得る(406)。たとえば、ビデオエンコーダ200は、式1.a.ii、1.b.ii、1.c.ii、1.c.viのいずれかで説明した残差修正関数または別の残差修正関数を適用し得る。
【0217】
[0177] ビデオエンコーダ200は、第2の修正されたクロマ残差データを符号化し得る(408)。第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられる。第2の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダ200は、周波数領域などの変換領域にサンプル領域からの第2の修正されたクロマ残差データを変換する順変換(たとえば、離散コサイン変換、離散サイン変換、または別のタイプの変換)を適用し得る(410)。第2の修正されたクロマ残差データに順変換を適用することによって、ビデオエンコーダ200は、変換係数の第2のブロックを生成し得る。さらに、第2の修正されたクロマ残差データを符号化することの一部として、ビデオエンコーダ200は、変換係数の第2のブロック中の変換係数を量子化し得る。さらに、ビデオエンコーダ200は、変換係数の量子化された第2のブロックを表すシンタックス要素にエントロピー符号化を適用し得る。いくつかの例では、ビデオエンコーダ200は、順変換の適用をスキップし得る。
【0218】
[0178] いくつかの例では、第1の残差修正関数を適用する前に、ビデオエンコーダ200は、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の残差修正関数を適用すべきかまたは第3の残差修正関数(third residual modification function)を適用すべきかを決定し得る。同様に、第2の残差修正関数を適用する前に、ビデオエンコーダ200は、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数を適用すべきかまたは第4の残差修正関数(fourth residual modification function)を適用すべきかを決定し得る。したがって、ビデオエンコーダ200は、第1の残差クロマデータと第2の残差クロマデータとにどの残差修正関数を適用すべきかを決定し得る。
【0219】
[0179] ビデオエンコーダ200は、様々な方法のうちの1つでどの残差修正関数を適用すべきかを決定し得る。たとえば、いくつかの例では、ビデオエンコーダ200は、第1の修正されたクロマ残差データを生成するために、ブロックの1つまたは複数の特性に基づいて、第1のクロマ残差データに第1の残差修正関数を適用すべきかまたは第3の残差修正関数を適用すべきかを決定し得る。さらに、ビデオエンコーダ200は、第2の修正されたクロマ残差データを生成するために、ブロックの1つまたは複数の特性に基づいて、第2のクロマ残差データに第2の残差修正関数を適用すべきかまたは第4の残差修正関数を適用すべきかを決定し得る。ブロックのそのような特性は、ブロックを含んでいるスライスもしくはタイル(tile)がイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照がブロックとともに使用されるのかどうか、ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、ブロックの次元(dimension)、ブロックのアスペクト比、またはブロックの他の特性のうちの1つもしくは複数を含み得る。たとえば、ビデオエンコーダ200は、ブロックがIスライス中にある場合に第1の残差修正関数を使用し、またはブロックがPもしくはBスライス中にある場合に第3の残差修正を使用すると決定し得る。Iスライスは、イントラ予測が許容されるが、インター予測は許容されないスライスである。Pスライスは、イントラ予測と単方向インター予測とが許容されるが、双方向インター予測は許容されないスライスである。Bスライスは、イントラ予測、単方向インター予測、および双方向インター予測が許容されるスライスである。
【0220】
[0180] いくつかの例では、ビデオエンコーダ200は、ビットストリーム中で、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の残差修正関数が適用されたのかまたは第3の残差修正関数が適用されたのかを示すデータをシグナリングし得る。同様に、ビデオエンコーダ200は、ビットストリーム中で、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数が適用されたのかまたは第4の残差修正関数が適用されたのかを示すデータをシグナリングし得る。たとえば、ビットストリーム中でシグナリングされる1つまたは複数のシンタックス要素は、どの残差修正関数が適用されたのかを指定し得る。
【0221】
[0181] いくつかの例では、ビデオエンコーダ200は、残差修正関数を適用することとともにCRS処理を適用し得る。たとえば、いくつかの例では、ビデオエンコーダ200は、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の逆残差修正関数を適用した後に第1の逆修正されたクロマ残差データにCRSプロセスを適用し得る。さらに、この例では、ビデオエンコーダ200は、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数を適用した後に第2の修正されたクロマ残差データにCRSプロセスを適用し得る。たとえば、CRSプロセスを適用するために、ビデオエンコーダ200は、本開示の他の場所で説明するように式7を適用し得る。
【0222】
[0182] 他の例では、ビデオエンコーダ200は、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の残差修正関数を適用することの一部として第1のクロマ残差データにCRSプロセスを適用し得る。さらに、この例では、ビデオエンコーダ200は、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数を適用することの一部として第2のクロマ残差データにCRSプロセスを適用し得る。ビデオエンコーダ200は、本開示の他の場所で与えられる例のいずれかに従って、第1の残差修正関数と第2の残差修正関数とを適用することの一部としてCRSプロセスを適用し得る。
【0223】
[0183]
図11は、本開示の1つまたは複数の技法による、ビデオデコーダ300の例示的な動作を示すフローチャートである。
図11の例では、ビデオデコーダ300は、変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって、第1の復号され修正されたクロマ残差データを生成し得る(450)。たとえば、ビデオデコーダ300は、周波数領域からサンプル領域に変換係数の第1のセットを変換する逆DCT変換を適用し得る。さらに、ビデオデコーダ300は、変換領域からサンプル領域にブロックの変換係数の第2のセットを変換するために逆変換を適用することによって、第2の復号され修正されたクロマ残差データを生成し得る(452)。第1の復号され修正されたクロマ残差データは、第1のクロマ成分(たとえば、Cb)に関連付けられ、第2の復号され修正されたクロマ残差データは、第2のクロマ成分(たとえば、Cr)に関連付けられる。
【0224】
[0184] さらに、
図11の例では、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために、第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用し得る(454)。たとえば、ビデオデコーダ300は、式1.a.iii、1.b.iii、1.c.iii、1.c.viiのいずれかで説明した逆残差修正関数または別の逆残差修正関数を適用し得る。
【0225】
[0185] ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために、第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用し得る(456)。たとえば、ビデオデコーダ300は、式1.a.iv、1.b.iv、1.c.iv、1.c.viiiのいずれかで説明した逆残差修正関数または別の逆残差修正関数を適用し得る。
【0226】
[0186] さらに、ビデオデコーダ300は、第1の逆修正されたクロマ残差データと第2の逆修正されたクロマ残差データとに基づいてビデオデータのブロックを再構成し得る(458)。たとえば、ビデオデコーダ300は、第1のクロマ成分のための予測ブロックの対応するサンプルに第1の逆修正されたクロマ残差データのサンプルを加算し得る。さらに、この例では、ビデオデコーダ300は、第2のクロマ成分のための予測ブロックの対応するサンプルに第2の逆修正されたクロマ残差データのサンプルを加算し得る。言い換えれば、ビデオデコーダ300は、ブロックの第1の再構成されたクロマデータ(first reconstructed chroma data)を取得するために第1の予測されたクロマデータ(first predicted chroma data)に第1の逆修正されたクロマ残差データを加算し、ブロックの第2の再構成されたクロマデータ(second reconstructed chroma data)を取得するために第2の予測されたクロマデータ(second predicted chroma data)に第2の逆修正されたクロマ残差データを加算し得る。
【0227】
[0187] いくつかの例では、第1の逆残差修正関数を適用する前に、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数(third inverse residual modification function)を適用すべきかを決定し得る。同様に、第2の逆残差修正関数を適用する前に、ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数(fourth inverse residual modification function)を適用すべきかを決定し得る。したがって、ビデオデコーダ300は、第1の復号された残差クロマデータと第2の復号された残差クロマデータとにどの残差修正関数を適用すべきかを決定し得る。
【0228】
[0188] ビデオデコーダ300は、様々な方法のうちの1つでどの逆残差修正関数を適用すべきかを決定し得る。たとえば、いくつかの例では、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために、ブロックの1つまたは複数の特性に基づいて、第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数を適用すべきかを決定し得る。さらに、ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために、ブロックの1つまたは複数の特性に基づいて、第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数を適用すべきかを決定し得る。ブロックのそのような特性は、ブロックを含んでいるスライスもしくはタイルがイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照がブロックとともに使用されるのかどうか、ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、ブロックの次元、ブロックのアスペクト比、またはブロックの他の特性のうちの1つもしくは複数を含み得る。たとえば、ビデオデコーダ300は、ブロックがIスライス中にある場合に第1の逆残差修正関数を使用し、またはブロックがPもしくはBスライス中にある場合に第3の逆残差修正を使用すると決定し得る。
【0229】
[0189] いくつかの例では、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために、ビットストリーム中でシグナリングされるデータに基づいて、第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数を適用すべきかを決定し得る。同様に、ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために、ビットストリーム中でシグナリングされるデータに基づいて、第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数を適用すべきかを決定し得る。たとえば、ビットストリーム中でシグナリングされる1つまたは複数のシンタックス要素は、どの逆残差修正関数を使用すべきかを指定し得る。
【0230】
[0190] いくつかの例では、ビデオデコーダ300は、逆残差修正関数を適用することとともに逆CRS処理を適用し得る。たとえば、いくつかの例では、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用する前に第1の復号され修正されたクロマ残差データに逆CRSプロセス(inverse CRS process)を適用し得る。さらに、この例では、ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用する前に第2の復号され修正されたクロマ残差データに逆CRSプロセスを適用し得る。たとえば、逆CRSプロセスを適用するために、ビデオデコーダ300は、本開示の他の場所で説明するように式8を適用し得る。
【0231】
[0191] 他の例では、ビデオデコーダ300は、第1の逆修正されたクロマ残差データを生成するために第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することの一部として第1の復号され修正されたクロマ残差データに逆CRSプロセスを適用し得る。さらに、この例では、ビデオデコーダ300は、第2の逆修正されたクロマ残差データを生成するために第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することの一部として第2の復号され修正されたクロマ残差データに逆CRSプロセスを適用し得る。
【0232】
[0192] 以下の列挙された段落は、本開示の技法の例の非限定のリストを与える。
【0233】
[0193] 例1A.ビデオデータを復号する方法であって、第1の修正され復号されたクロマ残差データ(すなわち、ビデオ復号のコンテキストにおける第1の逆修正され復号されたクロマ残差データ)を生成するために第1の復号されたクロマ残差データ(すなわち、ビデオ復号のコンテキストにおける第1の復号され修正されたクロマ残差データ)に第1の逆残差修正関数を適用することと、第2の修正され復号されたクロマ残差データ(すなわち、ビデオ復号のコンテキストにおける第2の逆修正され復号されたクロマ残差データ)を生成するために第2の復号されたクロマ残差データ(すなわち、ビデオ復号のコンテキストにおける第1の復号され修正されたクロマ残差データ)に第2の逆残差修正関数を適用することと、ここにおいて、第1の復号されたクロマ残差データは、第1のクロマ成分に関連付けられ、第2の復号されたクロマ残差データは、第2のクロマ成分に関連付けられる、第1の修正され復号されたクロマ残差データと第2の修正され復号されたクロマ残差データとに基づいてビデオデータのブロックを再構成することとを備える方法。
【0234】
[0194] 例2A.ブロックを再構成することは、ブロックの第1の再構成されたクロマデータを取得するために第1の予測されたクロマデータに第1の修正され復号されたクロマ残差データを加算することと、ブロックの第2の再構成されたクロマデータを取得するために第2の予測されたクロマデータに第2の修正され復号されたクロマ残差データを加算することとを備える、例1Aに記載の方法。
【0235】
[0195] 例3A.第1の逆残差修正関数は、invF1(x,y)=(resCr(x,y)’+resCb(x,y)’+B1)/M1であり、第2の逆残差修正関数は、invF2(x,y)=(resCr(x,y)’-resCb(x,y)’+B2)/M2であり、ここで、resCb(x,y)’は、第1の復号されたクロマ残差データであり、resCr(x,y)’は、第2の復号されたクロマ残差データであり、B1およびB2は、丸め項であり、1/M1および1/M2は、正規化係数である、例1A~2Aのいずれかに記載の方法。
【0236】
[0196] 例4A.第1の逆残差修正関数は、invF1(x,y)=(resCb(x,y)’+resCr(x,y)’+B1)/M1であり、第2の逆残差修正関数は、invF2(x,y)=(resCb(x,y)’-resCr(x,y)’+B2)/M2であり、ここで、resCb(x,y)’は、第1の復号されたクロマ残差データであり、resCr(x,y)’は、第2の復号されたクロマ残差データであり、B1およびB2は、丸め項であり、1/M1および1/M2は、正規化係数である、例1A~2Aのいずれかに記載の方法。
【0237】
[0197] 例5A.第1の逆残差修正関数は、invF1(x,y)=(resCr(x,y)’+B10)/M10+(resCb(x,y)’+B11)/M11であり、第2の逆残差修正関数は、invF2(x,y)=(resCr(x,y)’+B20)/M20-resCb(x,y)’+B21)/M21であり、ここで、resCb(x,y)’は、第1の復号されたクロマ残差データであり、resCr(x,y)’は、第2の復号されたクロマ残差データであり、B10、B11、B20およびB21は、丸め項であり、1/M10、1/M11、1/M20および1/M21は、正規化係数である、例1A~2Aのいずれかに記載の方法。
【0238】
[0198] 例6A.本方法は、第1の修正され復号されたクロマ残差データに第1の逆クロマ残差スケーリング(CRS)プロセスを適用することと、第2の修正され復号されたクロマ残差データに第2の逆CRSプロセスを適用することとをさらに備える、例1A~5Aのいずれかに記載の方法。
【0239】
[0199] 例7A.第1の逆残差修正関数を適用することは、第1の復号されたクロマ残差データを逆量子化した後に、および逆変換プロセスを適用する前に第1の逆残差修正関数を適用することを備え、第2の逆残差修正関数を適用することは、第2の復号されたクロマ残差データを逆量子化した後に、および逆変換プロセスを適用する前に第2の逆残差修正関数を適用することを備える、例1A~6Aのいずれかに記載の方法。
【0240】
[0200] 例8A.resCr(x,y)’またはresCb(x,y)’は、resY(x,y)’と置換され、ここで、resY(x,y)’は、復号されたルーマ残差データである、例3A~5Aのいずれかに記載の方法。
【0241】
[0201] 例9A.ビデオデータの符号化表現を含むビットストリームから、第1の逆残差修正関数を適用すべきか第2の逆残差修正関数を適用すべきかを示すフラグを取得することをさらに備える、例1A~8Aのいずれかに記載の方法。
【0242】
[0202] 例10A.フラグは、第1のクロマ成分のためのコード化ブロックフラグ(CBF:coded block flag)が真であり、第2のクロマ成分のためのCBFが真である場合にシグナリングされる、例9Aに記載の方法。
【0243】
[0203] 例11A.フラグは、第1のフラグであり、本方法は、ビットストリームから、第2のフラグを取得することをさらに備え、第2のフラグは、変換ユニットのためのものであり、第2のフラグは、(i)第1の復号されたクロマ残差データと第2の復号されたクロマ残差データとの両方がシグナリングされること、および(ii)第1の復号されたクロマ残差データと第2の復号されたクロマ残差データとのうちのただ1つがシグナリングされることのうちのどちらを適用するのかを示す、例10Aに記載の方法。
【0244】
[0204] 例12A.本方法は、ビットストリームから、第1の復号されたクロマ残差データと第2の復号されたクロマ残差データとのうちのどちらが0に強制されるのかを示す第3のフラグを取得することをさらに備える、例11Aに記載の方法。
【0245】
[0205] 例13A.第1の逆残差修正関数を適用すべきか第2の逆残差修正関数を適用すべきかを示すフラグは第1のフラグであり、本方法は、ビットストリームから、第1のクロマ成分のためのCBFを取得することと、第1のクロマ成分のためのCBFに基づいて、第1のフラグのためのコンテキストを選択することと、選択されたコンテキストを使用して第1のフラグをエントロピー復号することとをさらに備える、例9A~12Aのいずれかに記載の方法。
【0246】
[0206] 例14A.第1の逆残差修正関数を適用すべきか第2の逆残差修正関数を適用すべきかを示すフラグは第1のフラグであり、本方法は、第1のフラグに基づいて、第1のクロマ成分のためのCBFのためのコンテキストを選択することと、選択されたコンテキストを使用して第1のクロマ成分のためのCBFをエントロピー復号することとをさらに備える、例9A~12Aのいずれかに記載の方法。
【0247】
[0207] 例15A.複数の利用可能な第1の逆残差修正関数の中から第1の逆残差修正関数を決定することと、複数の利用可能な第2の逆残差修正関数の中から第2の逆残差修正関数を決定することとをさらに備える、例1A~14Aのいずれかに記載の方法。
【0248】
[0208] 例16A.第1の復号されたクロマ残差データに第1の逆残差修正関数を適用する前に、量子化パラメータと第1の量子化パラメータオフセットとに基づいて第1の量子化されたクロマ変換データを逆量子化することと、第1の復号されたクロマ残差データを生成するために逆量子化された第1の量子化されたクロマ変換データに逆変換を適用することとを行うことと、第2の復号されたクロマ残差データに第2の逆残差修正関数を適用する前に、量子化パラメータと第2の量子化パラメータオフセットとに基づいて第2の量子化されたクロマ変換データを逆量子化することと、第2の復号されたクロマ残差データを生成するために第2の逆量子化された第2の量子化されたクロマ変換データに逆変換を適用することとを行うこととをさらに備える、例1A~15Aのいずれかに記載の方法。
【0249】
[0209] 例17A.ビデオデータの符号化表現を備えるビットストリームから第1の量子化パラメータオフセットまたは第2の量子化パラメータオフセットのうちの少なくとも1つを取得することをさらに備える、例16Aに記載の方法。
【0250】
[0210] 例18A.ブロックの1つまたは複数の特性に基づいて、第1の逆残差修正関数の適用が拒否されるのかどうかを決定することと、ブロックの1つまたは複数の特性に基づいて、第2の逆残差修正関数の適用が拒否されるのかどうかを決定することとをさらに備える、例1A~17Aのいずれかに記載の方法。
【0251】
[0211] 例1B.ビデオデータを符号化する方法であって、第1の修正されたクロマ残差データを生成するために第1のクロマ残差データに第1の残差修正関数を適用することと、第1の修正されたクロマ残差データを符号化することと、第2の修正されたクロマ残差データを生成するために第2のクロマ残差データに第2の残差修正関数を適用することと、第2の修正されたクロマ残差データを符号化することと、ここにおいて、第1のクロマ残差データは、第1のクロマ成分に関連付けられ、第2のクロマ残差データは、第2のクロマ成分に関連付けられる、を備える方法。
【0252】
[0212] 例2B.修正されたクロマ残差データを符号化することは、変換データを生成するために修正されたクロマ残差データに順変換を適用することと、量子化された変換データを生成するために変換データを量子化することとを備える、例1Bに記載の方法。
【0253】
[0213] 例3B.第1の残差修正関数は、F1(x,y)=(resCb(x,y)-resCr(x,y)+A1)/N1であり、第2の残差修正関数は、F2(x,y)=(resCb(x,y)+resCr(x,y)+A2)/N2であり、ここで、resCb(x,y)は、第1のクロマ残差データであり、resCr(x,y)は、第2のクロマ残差データであり、A1およびA2は、丸め項であり、1/N1および1/N2は、正規化係数である、例1B~2Bのいずれかに記載の方法。
【0254】
[0214] 例4B.第1の残差修正関数は、F1(x,y)=(resCb(x,y)+resCr(x,y)+A1)/N1であり、第2の残差修正関数は、F2(x,y)=(resCb(x,y)-resCr(x,y)+A2)/N2であり、ここで、resCb(x,y)’は、第1のクロマ残差データであり、resCr(x,y)は、第2のクロマ残差データであり、A1およびA2は、丸め項であり、1/N1および1/N2は、正規化係数である、例1B~2Bのいずれかに記載の方法。
【0255】
[0215] 例5B.第1の残差修正関数は、F1(x,y)=(resCb(x,y)+A10)/N10-(resCr(x,y)+ A11)/N11であり、第2の残差修正関数は、F2(x,y)=(resCb(x,y)+A20)/N20+(resCr(x,y)+A21)/N21であり、ここで、resCb(x,y)’は、第1のクロマ残差データであり、resCr(x,y)は、第2のクロマ残差データであり、A10、A11、A20、およびA21は、丸め項であり、1/N10、1/N11、1/N20、および1/N21は、正規化係数である、例1B~2Bのいずれかに記載の方法。
【0256】
[0216] 例6B.本方法は、第1のクロマ残差データにクロマ残差スケーリング(CRS)を適用することと、第2のクロマ残差データにCRSを適用することとをさらに備え、第1の残差修正関数を適用することは、第1のクロマ残差データにCRSを適用した後で第1のクロマ残差データに第1の残差修正関数を適用することを備え、第2の残差修正関数を適用することは、第2のクロマ残差データにCRSを適用した後で第2のクロマ残差データに第2の残差修正関数を適用することを備える、例1B~5Bのいずれかに記載の方法。
【0257】
[0217] 例7B.第1の残差修正関数を適用することは、第1のクロマ残差データを量子化する前に第1のクロマ残差データに順変換プロセスを適用することを備え、第2の残差修正関数を適用することは、第2のクロマ残差データを量子化する前に第2のクロマ残差データに順変換プロセスを適用することを備える、例1B~6Bのいずれかに記載の方法。
【0258】
[0218] 例8B.resCr(x,y)またはresCb(x,y)は、resY(x,y)’と置換され、ここで、resY(x,y)’は、ルーマ残差データである、例3B~5Bのいずれかに記載の方法。
【0259】
[0219] 例9B.ビデオデータの符号化表現を含むビットストリーム中で、第1の残差修正関数を適用すべきか第2の残差修正関数を適用すべきかを示すフラグをシグナリングすることをさらに備える、例1B~8Bのいずれかに記載の方法。
【0260】
[0220] 例10B.フラグは、第1のクロマ成分のためのコード化ブロックフラグ(CBF)が真であり、第2のクロマ成分のためのCBFが真である場合にシグナリングされる、例9Bに記載の方法。
【0261】
[0221] 例11B.フラグは、第1のフラグであり、本方法は、ビットストリーム中に、第2のフラグを含めることをさらに備え、第2のフラグは、変換ユニットのためのものであり、第2のフラグは、(i)第1のクロマ残差データと第2のクロマ残差データとの両方がシグナリングされること、および(ii)第1のクロマ残差データと第2のクロマ残差データとのうちのただ1つがシグナリングされることのうちのどちらを適用するのかを示す、例10Bに記載の方法。
【0262】
[0222] 例12B.本方法は、ビットストリーム中に、第1のクロマ残差データと第2のクロマ残差データとのうちのどちらが0に強制されるのかを示す第3のフラグを含めることをさらに備える、例11Bに記載の方法。
【0263】
[0223] 例13B.第1の残差修正関数を適用すべきか第2の残差修正関数を適用すべきかを示すフラグは第1のフラグであり、本方法は、ビットストリーム中に、第1のクロマ成分のためのCBFを含めることと、第1のクロマ成分のためのCBFに基づいて、第1のフラグのためのコンテキストを選択することと、選択されたコンテキストを使用して第1のフラグをエントロピー符号化することとをさらに備える、例9B~12Bのいずれかに記載の方法。
【0264】
[0224] 例14B.第1の残差修正関数を適用すべきか第2の残差修正関数を適用すべきかを示すフラグは第1のフラグであり、本方法は、第1のフラグに基づいて、第1のクロマ成分のためのCBFのためのコンテキストを選択することと、選択されたコンテキストを使用して第1のクロマ成分のためのCBFをエントロピー符号化することとをさらに備える、例9B~12Bのいずれかに記載の方法。
【0265】
[0225] 例15B.複数の利用可能な第1の残差修正関数の中から第1の残差修正関数を決定することと、複数の利用可能な第2の残差修正関数の中から第2の残差修正関数を決定することとをさらに備える、例1B~14Bのいずれかに記載の方法。
【0266】
[0226] 例16B.第1のクロマ残差データに第1の残差修正関数を適用した後に、第1のクロマ変換データを生成するために第1のクロマ残差データに変換を適用することと、量子化パラメータと第1の量子化パラメータオフセットとに基づいて第1のクロマ変換データを量子化することとを行うことと、第2のクロマ残差データに第2の残差修正関数を適用した後に、第2のクロマ変換データを生成するために第2のクロマ残差データに変換を適用することと、量子化パラメータと第2の量子化パラメータオフセットとに基づいて第1のクロマ変換データを量子化することとを行うこととをさらに備える、例1B~15Bのいずれかに記載の方法。
【0267】
[0227] 例17B.ビデオデータの符号化表現を備えるビットストリーム中で、第1の量子化パラメータオフセットまたは第2の量子化パラメータオフセットのうちの少なくとも1つをシグナリングすることをさらに備える、例16Bに記載の方法。
【0268】
[0228] 例18B.ブロックの1つまたは複数の特性に基づいて、第1の残差修正関数の適用が拒否されるのかどうかを決定することと、ブロックの1つまたは複数の特性に基づいて、第2の残差修正関数の適用が拒否されるのかどうかを決定することとをさらに備える、例1B~17Bのいずれかに記載の方法。
【0269】
[0229] 例1C.ビデオデータをコーディングするためのデバイスであって、例1A~18Aまたは例1B~18Bのいずれかに記載の方法を実行するための1つまたは複数の手段を備える、デバイス。
【0270】
[0230] 例2C.1つまたは複数の手段は、回路中に実装される1つまたは複数のプロセッサを備える、例1Cに記載のデバイス。
【0271】
[0231] 例3C.ビデオデータを記憶するためのメモリをさらに備える、例1C~2Cのいずれかに記載のデバイス。
【0272】
[0232] 例4C.復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、例1C~3Cのいずれかに記載のデバイス。
【0273】
[0233] 例5C.デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス(broadcast receiver device)、またはセットトップボックスのうちの1つまたは複数を備える、例1C~4Cのいずれかに記載のデバイス。
【0274】
[0234] 例6C.デバイスがビデオデコーダを備える、例1C~5Cのいずれかに記載のデバイス。
【0275】
[0235] 例7C.デバイスがビデオエンコーダを備える、例1C~6Cのいずれかに記載のデバイス。
【0276】
[0236] 例8C.実行されたとき、例1A~18Aまたは例1B~18Bのいずれかに記載の方法を1つまたは複数のプロセッサに実行させる命令を記憶したコンピュータ可読記憶媒体。
【0277】
[0237] 上記例に応じて、本明細書で説明された技法のいずれかのいくつかの行為またはイベントは、異なるシーケンスで実施され得、追加、マージ、または完全に除外され得る(たとえば、すべての説明された行為またはイベントが本技法の実践のために必要であるとは限らない)ことを認識されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に実行され得る。
【0278】
[0238] 1つまたは複数の例において、前述の機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的な有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示において説明された技法の実装のための命令、コードおよび/またはデータ構造を取り出すために、1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
【0279】
[0239] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD-ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を含むことができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体が、接続、搬送波、信号、または他の一時的媒体を含むのではなく、非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書において使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu-rayディスク(disc)を含み、ここで、ディスク(disk)は通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲に含めるべきである。
【0280】
[0240] 命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他の均等な集積論理回路構成もしくは個別論理回路構成などの、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書において使用される「プロセッサ」および「処理回路」という用語は、前述の構造、または本明細書において説明された技法の実装に好適な任意の他の構造のいずれかを指し得る。加えて、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび/またはソフトウェアモジュール内に提供されるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素において十分に実装され得る。
【0281】
[0241] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置に実装され得る。本開示では、開示される技法を実施するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明されたが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明されたように、様々なユニットは、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明された1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされるか、または相互動作ハードウェアユニットの集合によって提供され得る。
【0282】
[0242] 様々な例について説明した。これらおよび他の例は添付の特許請求の範囲内に入る。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを復号する方法であって、
変換領域からサンプル領域に前記ビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成することと、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、
前記第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、
前記第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成することと
を備える方法。
[C2]
前記ブロックを再構成することは、
前記ブロックの第1の再構成されたクロマデータを取得するために第1の予測されたクロマデータに前記第1の逆修正されたクロマ残差データを加算することと、
前記ブロックの第2の再構成されたクロマデータを取得するために第2の予測されたクロマデータに前記第2の逆修正されたクロマ残差データを加算することと
を備える、C1に記載の方法。
[C3]
前記方法が、
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数を適用すべきかを決定することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数を適用すべきかを決定することと
をさらに備える、C1に記載の方法。
[C4]
前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することは、前記第1の逆修正されたクロマ残差データを生成するために、前記ブロックの1つまたは複数の特性に基づいて、前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することを備え、
前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することは、前記第2の逆修正されたクロマ残差データを生成するために、前記ブロックの前記1つまたは複数の特性に基づいて、前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することを備える、C3に記載の方法。
[C5]
前記ブロックの前記特性が、前記ブロックを含んでいるスライスもしくはタイルがイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照が前記ブロックとともに使用されるのかどうか、前記ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、前記ブロックの次元、または前記ブロックのアスペクト比のうちの1つもしくは複数を含む、C4に記載の方法。
[C6]
前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することは、前記第1の逆修正されたクロマ残差データを生成するために、ビットストリーム中でシグナリングされるデータに基づいて、前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することを備え、
前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することは、前記第2の逆修正されたクロマ残差データを生成するために、前記ビットストリーム中でシグナリングされる前記データに基づいて、前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することを備える、C3に記載の方法。
[C7]
前記第1の逆残差修正関数は、invF1(x,y)=(resCr(x,y)’+B10)/M10+(resCb(x,y)’+B11)/M11であり、
前記第2の逆残差修正関数は、invF2(x,y)=(resCr(x,y)’+B20)/M20-(resCb(x,y)’+B21)/M21であり、
ここで、resCb(x,y)’は、前記第1の復号され修正されたクロマ残差データであり、resCr(x,y)’は、前記第2の復号され修正されたクロマ残差データであり、B10、B11、B20、およびB21は、丸め項であり、M10、M11、M20およびN21は、正規化係数である、C1に記載の方法。
[C8]
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用する前に前記第1の復号され修正されたクロマ残差データに逆CRSプロセスを適用することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用する前に前記第2の復号され修正されたクロマ残差データに前記逆CRSプロセスを適用することと
をさらに備える、C1に記載の方法。
[C9]
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用することの一部として前記第1の復号され修正されたクロマ残差データに逆CRSプロセスを適用することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用することの一部として前記第2の復号され修正されたクロマ残差データに前記逆CRSプロセスを適用することと
をさらに備える、C1に記載の方法。
[C10]
ビデオデータを符号化する方法であって、
第1の修正されたクロマ残差データを生成するために前記ビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用することと、
前記第1の修正されたクロマ残差データを符号化することと、ここにおいて、前記第1の修正されたクロマ残差データを符号化することは、前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に、サンプル領域から変換領域に前記第1の修正されたクロマ残差データを変換するために前記第1の修正されたクロマ残差データに順変換を適用することを備える、
第2の修正されたクロマ残差データを生成するために前記ブロックの第2のクロマ残差データに第2の残差修正関数を適用することと、
前記第2の修正されたクロマ残差データを符号化することと
を備え、
前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられ、
前記第2の修正されたクロマ残差データを符号化することは、前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に、前記サンプル領域から前記変換領域に前記第2の修正されたクロマ残差データを変換するために前記第2の修正されたクロマ残差データに前記順変換を適用することを備える、方法。
[C11]
前記方法が、
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用すべきかまたは第3の残差修正関数を適用すべきかを決定することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用すべきかまたは第4の残差修正関数を適用すべきかを決定することと
をさらに備える、C10に記載の方法。
[C12]
前記第1の残差修正関数を適用すべきかまたは前記第3の残差修正関数を適用すべきかを決定することは、前記第1の修正されたクロマ残差データを生成するために、前記ブロックの1つまたは複数の特性に基づいて、前記第1のクロマ残差データに前記第1の残差修正関数を適用すべきかまたは前記第3の残差修正関数を適用すべきかを決定することを備え、
前記第2の残差修正関数を適用すべきかまたは前記第4の残差修正関数を適用すべきかを決定することは、前記第2の修正されたクロマ残差データを生成するために、前記ブロックの前記1つまたは複数の特性に基づいて、前記第2のクロマ残差データに前記第2の残差修正関数を適用すべきかまたは前記第4の残差修正関数を適用すべきかを決定することを備える、C11に記載の方法。
[C13]
前記ブロックの前記特性が、前記ブロックを含んでいるスライスもしくはタイルがイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照が前記ブロックとともに使用されるのかどうか、前記ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、前記ブロックの次元、または前記ブロックのアスペクト比のうちの1つもしくは複数を含む、C12に記載の方法。
[C14]
前記方法が、
ビットストリーム中で、前記第1の修正されたクロマ残差データを生成するために前記第1の残差修正関数が適用されたのかまたは前記第3の残差修正関数が適用されたのかを示すデータをシグナリングすることと、
前記ビットストリーム中で、前記第2の修正されたクロマ残差データを生成するために前記第2の逆残差修正関数が適用されたのかまたは前記第4の逆残差修正関数が適用されたのかを示すデータをシグナリングすることと
をさらに備える、C11に記載の方法。
[C15]
前記第1の残差修正関数は、F1(x,y)=(resCb(x,y)+A10)/N10-(resCr(x,y)+A11)/N11であり、
前記第2の残差修正関数は、F2(x,y)=(resCb(x,y)+A20)/N20+(resCr(x,y)+A21)/N21であり、
ここで、resCb(x,y)は、前記第1のクロマ残差データであり、resCr(x,y)は、前記第2のクロマ残差データであり、A10、A11、A20、およびA21は、丸め項であり、N10、N11、N20およびN21は、正規化係数である、C10に記載の方法。
[C16]
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に前記第1の修正されたクロマ残差データにCRSプロセスを適用することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に前記第2の修正されたクロマ残差データに前記CRSプロセスを適用することと
をさらに備える、C10に記載の方法。
[C17]
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用することの一部として前記第1のクロマ残差データにCRSプロセスを適用することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用することの一部として前記第2のクロマ残差データに前記CRSプロセスを適用することと
をさらに備える、C10に記載の方法。
[C18]
ビデオデータを復号するためのデバイスであって、
前記ビデオデータを記憶するためのメモリと、
回路中に実装された1つまたは複数のプロセッサと
を備え、前記1つまたは複数のプロセッサは、
変換領域からサンプル領域に前記ビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成することと、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、
前記第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、
前記第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成することと
を行うように構成された、デバイス。
[C19]
前記1つまたは複数のプロセッサは、前記ブロックを再構成することの一部として、前記1つまたは複数のプロセッサが、
前記ブロックの第1の再構成されたクロマデータを取得するために第1の予測されたクロマデータに前記第1の逆修正されたクロマ残差データを加算することと、
前記ブロックの第2の再構成されたクロマデータを取得するために第2の予測されたクロマデータに前記第2の逆修正されたクロマ残差データを加算することと
を行うように構成された、C18に記載のデバイス。
[C20]
前記1つまたは複数のプロセッサは、
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは第3の逆残差修正関数を適用すべきかを決定することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは第4の逆残差修正関数を適用すべきかを決定することと
を行うようにさらに構成された、C18に記載のデバイス。
[C21]
前記1つまたは複数のプロセッサは、前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することの一部として前記1つまたは複数のプロセッサが、前記第1の逆修正されたクロマ残差データを生成するために、前記ブロックの1つまたは複数の特性に基づいて、前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することを行うように構成され、
前記1つまたは複数のプロセッサは、前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することの一部として前記1つまたは複数のプロセッサが、前記第2の逆修正されたクロマ残差データを生成するために、前記ブロックの前記1つまたは複数の特性に基づいて、前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することを行うように構成された、C20に記載のデバイス。
[C22]
前記ブロックの前記特性が、前記ブロックを含んでいるスライスもしくはタイルがイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照が前記ブロックとともに使用されるのかどうか、前記ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、前記ブロックの次元(dimension)、または前記ブロックのアスペクト比のうちの1つもしくは複数を含む、C21に記載のデバイス。
[C23]
前記1つまたは複数のプロセッサは、前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することの一部として前記1つまたは複数のプロセッサが、前記第1の逆修正されたクロマ残差データを生成するために、ビットストリーム中でシグナリングされるデータに基づいて、前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用すべきかまたは前記第3の逆残差修正関数を適用すべきかを決定することを行うように構成され、前記1つまたは複数のプロセッサは、前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することの一部として前記1つまたは複数のプロセッサが、前記第2の逆修正されたクロマ残差データを生成するために、前記ビットストリーム中でシグナリングされる前記データに基づいて、前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用すべきかまたは前記第4の逆残差修正関数を適用すべきかを決定することを行うように構成された、C20に記載のデバイス。
[C24]
前記第1の逆残差修正関数は、invF1(x,y)=(resCr(x,y)’+B10)/M10+(resCb(x,y)’+B11)/M11であり、
前記第2の逆残差修正関数は、invF2(x,y)=(resCr(x,y)’+B20)/M20-(resCb(x,y)’+B21)/M21であり、
ここで、resCb(x,y)’は、前記第1の復号され修正されたクロマ残差データであり、resCr(x,y)’は、前記第2の復号され修正されたクロマ残差データであり、B10、B11、B20、およびB21は、丸め項であり、M10、M11、M20およびN21は、正規化係数である、C18に記載のデバイス。
[C25]
前記1つまたは複数のプロセッサは、
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用する前に前記第1の復号され修正されたクロマ残差データに逆CRSプロセスを適用することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用する前に前記第2の復号され修正されたクロマ残差データに前記逆CRSプロセスを適用することと
を行うようにさらに構成された、C18に記載のデバイス。
[C26]
前記1つまたは複数のプロセッサは、
前記第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに前記第1の逆残差修正関数を適用することの一部として前記第1の復号され修正されたクロマ残差データに逆CRSプロセスを適用することと、
前記第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに前記第2の逆残差修正関数を適用することの一部として前記第2の復号され修正されたクロマ残差データに前記逆CRSプロセスを適用することと
を行うように構成された、C18に記載のデバイス。
[C27]
復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、C18に記載のデバイス。
[C28]
前記デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの1つまたは複数を備える、C18に記載のデバイス。
[C29]
ビデオデータを符号化するためのデバイスであって、
前記ビデオデータを記憶するためのメモリと、
回路中に実装された1つまたは複数のプロセッサと
を備え、前記1つまたは複数のプロセッサは、
第1の修正されたクロマ残差データを生成するために前記ビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用することと、
前記第1の修正されたクロマ残差データを符号化することと、ここにおいて、前記1つまたは複数のプロセッサは、前記第1の修正されたクロマ残差データを符号化することの一部として前記1つまたは複数のプロセッサが、前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に、サンプル領域から変換領域に前記第1の修正されたクロマ残差データを変換するために前記第1の修正されたクロマ残差データに順変換を適用することを行うように構成される、
第2の修正されたクロマ残差データを生成するために前記ブロックの第2のクロマ残差データに第2の残差修正関数を適用することと、
前記第2の修正されたクロマ残差データを符号化することと
を行うように構成され、
前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられ、
前記1つまたは複数のプロセッサは、前記第2の修正されたクロマ残差データを符号化することの一部として、前記1つまたは複数のプロセッサは、前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に、前記サンプル領域から前記変換領域に前記第2の修正されたクロマ残差データを変換するために前記第2の修正されたクロマ残差データに前記順変換を適用することを行うように構成された、デバイス。
[C30]
前記1つまたは複数のプロセッサは、
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用すべきかまたは第3の残差修正関数を適用すべきかを決定することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用すべきかまたは第4の残差修正関数を適用すべきかを決定することと
を行うようにさらに構成された、C29に記載のデバイス。
[C31]
前記1つまたは複数のプロセッサは、前記第1の残差修正関数を適用すべきかまたは前記第3の残差修正関数を適用すべきかを決定することの一部として、前記1つまたは複数のプロセッサは、前記第1の修正されたクロマ残差データを生成するために、前記ブロックの1つまたは複数の特性に基づいて、前記第1のクロマ残差データに前記第1の残差修正関数を適用すべきかまたは前記第3の残差修正関数を適用すべきかを決定することを行うように構成され、
前記1つまたは複数のプロセッサは、前記第2の残差修正関数を適用すべきかまたは前記第4の残差修正関数を適用すべきかを決定することの一部として、前記1つまたは複数のプロセッサは、前記第2の修正されたクロマ残差データを生成するために、前記ブロックの前記1つまたは複数の特性に基づいて、前記第2のクロマ残差データに前記第2の残差修正関数を適用すべきかまたは前記第4の残差修正関数を適用すべきかを決定することを行うように構成された、C30に記載のデバイス。
[C32]
前記ブロックの前記特性が、前記ブロックを含んでいるスライスもしくはタイルがイントラタイプであるのかもしくはインタータイプであるのか、現ピクチャ参照が前記ブロックとともに使用されるのかどうか、前記ブロックとともにデュアルコーディングツリーが使用されるのかもしくは共有コーディングツリーが使用されるのか、前記ブロックの次元、または前記ブロックのアスペクト比のうちの1つもしくは複数を含む、C31に記載のデバイス。
[C33]
前記1つまたは複数のプロセッサは、
ビットストリーム中で、前記第1の修正されたクロマ残差データを生成するために前記第1の残差修正関数が適用されたのかまたは前記第3の残差修正関数が適用されたのかを示すデータをシグナリングすることと、
前記ビットストリーム中で、前記第2の修正されたクロマ残差データを生成するために前記第2の逆残差修正関数が適用されたのかまたは前記第4の逆残差修正関数が適用されたのかを示すデータをシグナリングすることと
を行うようにさらに構成された、C30に記載のデバイス。
[C34]
前記第1の残差修正関数は、F1(x,y)=(resCb(x,y)+A10)/N10-(resCr(x,y)+A11)/N11であり、
前記第2の残差修正関数は、F2(x,y)=(resCb(x,y)+A20)/N20+(resCr(x,y)+A21)/N21であり、
ここで、resCb(x,y)は、前記第1のクロマ残差データであり、resCr(x,y)は、前記第2のクロマ残差データであり、A10、A11、A20、およびA21は、丸め項であり、N10、N11、N20およびN21は、正規化係数である、C29に記載のデバイス。
[C35]
前記1つまたは複数のプロセッサは、
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に前記第1の修正されたクロマ残差データにCRSプロセスを適用することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に前記第2の修正されたクロマ残差データに前記CRSプロセスを適用することと
を行うようにさらに構成された、C29に記載のデバイス。
[C36]
前記1つまたは複数のプロセッサは、
前記第1の修正されたクロマ残差データを生成するために前記第1のクロマ残差データに前記第1の残差修正関数を適用することの一部として前記第1のクロマ残差データにCRSプロセスを適用することと、
前記第2の修正されたクロマ残差データを生成するために前記第2のクロマ残差データに前記第2の残差修正関数を適用することの一部として前記第2のクロマ残差データに前記CRSプロセスを適用することと
を行うようにさらに構成された、C29に記載のデバイス。
[C37]
前記デバイスが、カメラ、コンピュータ、またはモバイルデバイスのうちの1つまたは複数を備える、C29に記載のデバイス。
[C38]
ビデオデータを復号するためのデバイスであって、
変換領域からサンプル領域に前記ビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成するための手段と、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成するための手段と、
前記第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用するための手段と、
前記第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用するための手段と、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成するための手段と
を備えるデバイス。
[C39]
ビデオデータを符号化するためのデバイスであって、
第1の修正されたクロマ残差データを生成するために前記ビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用するための手段と、
前記第1の修正されたクロマ残差データを符号化するための手段と、ここにおいて、前記第1の修正されたクロマ残差データを符号化することは、前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に、サンプル領域から変換領域に前記第1の修正されたクロマ残差データを変換するために前記第1の修正されたクロマ残差データに順変換を適用するための手段を備える、
第2の修正されたクロマ残差データを生成するために前記ブロックの第2のクロマ残差データに第2の残差修正関数を適用するための手段と、
前記第2の修正されたクロマ残差データを符号化するための手段と
を備え、
前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられ、
前記第2の修正されたクロマ残差データを符号化するための前記手段は、前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に、前記サンプル領域から前記変換領域に前記第2の修正されたクロマ残差データを変換するために前記第2の修正されたクロマ残差データに前記順変換を適用するための手段を備える、デバイス。
[C40]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、1つまたは複数のプロセッサに、
変換領域からサンプル領域にビデオデータのブロックの変換係数の第1のセットを変換するために逆変換を適用することによって第1の復号され修正されたクロマ残差データを生成することと、
前記変換領域から前記サンプル領域に前記ブロックの変換係数の第2のセットを変換するために前記逆変換を適用することによって第2の復号され修正されたクロマ残差データを生成することと、
前記第1の復号され修正されたクロマ残差データを生成した後に、第1の逆修正されたクロマ残差データを生成するために前記第1の復号され修正されたクロマ残差データに第1の逆残差修正関数を適用することと、
前記第2の復号され修正されたクロマ残差データを生成した後に、第2の逆修正されたクロマ残差データを生成するために前記第2の復号され修正されたクロマ残差データに第2の逆残差修正関数を適用することと、ここにおいて、前記第1の復号され修正されたクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2の復号され修正されたクロマ残差データは、第2のクロマ成分に関連付けられる、
前記第1の逆修正されたクロマ残差データと前記第2の逆修正されたクロマ残差データとに基づいて前記ビデオデータの前記ブロックを再構成することと
を行わせる、コンピュータ可読記憶媒体。
[C41]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、1つまたは複数のプロセッサに、
第1の修正されたクロマ残差データを生成するためにビデオデータのブロックの第1のクロマ残差データに第1の残差修正関数を適用することと、
前記第1の修正されたクロマ残差データを符号化することと、ここにおいて、前記1つまたは複数のプロセッサに、前記第1の修正されたクロマ残差データを符号化させることの一部として、前記命令の実行は、前記1つまたは複数のプロセッサに、前記第1のクロマ残差データに前記第1の残差修正関数を適用した後に、サンプル領域から変換領域に前記第1の修正されたクロマ残差データを変換するために前記第1の修正されたクロマ残差データに順変換を適用することを行わせる、
第2の修正されたクロマ残差データを生成するために前記ブロックの第2のクロマ残差データに第2の残差修正関数を適用することと、
前記第2の修正されたクロマ残差データを符号化することと
を行わせ、
前記第1のクロマ残差データは、第1のクロマ成分に関連付けられ、前記第2のクロマ残差データは、第2のクロマ成分に関連付けられ、
前記1つまたは複数のプロセッサに、前記第2の修正されたクロマ残差データを符号化させることの一部として、前記命令の実行は、前記1つまたは複数のプロセッサに、前記第2のクロマ残差データに前記第2の残差修正関数を適用した後に、前記サンプル領域から前記変換領域に前記第2の修正されたクロマ残差データを変換するために前記第2の修正されたクロマ残差データに前記順変換を適用することを行わせる、コンピュータ可読記憶媒体。