(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024161497
(43)【公開日】2024-11-19
(54)【発明の名称】4:4:4色差フォーマットにおけるビデオコーディングの方法及び装置
(51)【国際特許分類】
H04N 19/44 20140101AFI20241112BHJP
H04N 19/70 20140101ALI20241112BHJP
【FI】
H04N19/44
H04N19/70
【審査請求】有
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024135648
(22)【出願日】2024-08-15
(62)【分割の表示】P 2024099827の分割
【原出願日】2021-01-05
(31)【優先権主張番号】62/965,859
(32)【優先日】2020-01-25
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/957,273
(32)【優先日】2020-01-05
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521024075
【氏名又は名称】ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー,リミテッド
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100138759
【弁理士】
【氏名又は名称】大房 直樹
(74)【代理人】
【識別番号】100201743
【弁理士】
【氏名又は名称】井上 和真
(72)【発明者】
【氏名】シウ,シヤオユー
(72)【発明者】
【氏名】チェン,イー-ウエン
(72)【発明者】
【氏名】マー,ツン-チュアン
(72)【発明者】
【氏名】ジュ,ホーン-ジェン
(72)【発明者】
【氏名】ワーン,シアーンリン
(72)【発明者】
【氏名】ユ,ビーン
(57)【要約】 (修正有)
【課題】適応型色空間変換(ACT)の前にクリッピング操作を実行するビデオデータ復号方法及びシステムを提供する。
【解決手段】方法は、ビットストリームから符号化ユニットに対応するビデオデータを受け取るステップと、ビデオデータから、符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示す第1のシンタックス要素を受け取るステップと、符号化ユニットがACTを使用して符号化されているとの、第1のシンタックス要素に基づく判定に応じて、符号化ユニットの残差のダイナミックレンジを所定の範囲内に制限するクリッピング操作を実行し、クリッピング操作の後に、符号化ユニットの残差に対して逆ACTを適用し、逆ACTを適用した後の残差に基づいて符号化ユニットを再構成するステップと、を備える。
【選択図】
図12
【特許請求の範囲】
【請求項1】
ビデオデータを復号する方法であって、
ビットストリームから、イントラ予測モード又はインター予測モードによって符号化されている符号化ユニットに対応するビデオデータを受け取るステップと、
前記ビデオデータから、前記符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示す第1のシンタックス要素を受け取るステップと、
前記ビデオデータを処理して前記符号化ユニットの残差を生成するステップと、
前記符号化ユニットが前記ACTを使用して符号化されているとの、前記第1のシンタックス要素に基づく判定に応じて、
前記符号化ユニットの前記残差に対してクリッピング操作を実行し、
前記クリッピング操作の後に、前記符号化ユニットの前記残差に対して逆ACTを適用するステップと
を備える方法。
【請求項2】
請求項1に記載の方法であって、前記クリッピング操作が、前記符号化ユニットの前記残差のダイナミックレンジを、前記逆ACTによる処理のための所定の範囲内に制限する、方法。
【請求項3】
請求項1に記載の方法であって、前記クリッピング操作が、
Clipinput=Clip(-2Bitdepth+1,2Bitdepth+1-1,M)
と定義され、Mは、前記クリッピング操作への入力であり、Bitdepthは、内部符号化ビット深度であり、Clipinputは、-2Bitdepth+1~(2Bitdepth+1-1)の範囲内における前記クリッピング操作の出力である、方法。
【請求項4】
請求項1に記載の方法であって、前記クリッピング操作を実行する前に、前記符号化ユニットの前記残差に対して逆変換を適用するステップをさらに備える方法。
【請求項5】
請求項1に記載の方法であって、前記符号化ユニットの前記残差に対して前記逆ACTを適用した後に、前記符号化ユニットの前記残差に対して第2のクリッピング操作を適用するステップをさらに備える方法。
【請求項6】
請求項1に記載の方法であって、前記クリッピング操作が、前記符号化ユニットの前記残差のダイナミックレンジを、前記逆ACTによって実装される固定された内部符号化ビット深度の範囲内に調整する、方法。
【請求項7】
請求項6に記載の方法であって、前記固定された内部符号化ビット深度が15である、方法。
【請求項8】
請求項1に記載の方法であって、前記ビデオデータから第1のシンタックス要素を受け取った後に、前記ビデオデータから第2のシンタックス要素を受け取るステップであって、前記第2のシンタックス要素が前記クリッピング操作で使用される可変の内部符号化ビット深度を示すものである、ステップをさらに備える方法。
【請求項9】
請求項1に記載の方法であって、前記ビデオデータから第1のシンタックス要素を受け取った後に、前記ビデオデータから第2のシンタックス要素を受け取るステップであって、前記第2のシンタックス要素が第1の内部符号化ビット深度を示し、前記クリッピング操作で使用される第2の内部符号化ビット深度が前記第1の内部符号化ビット深度に1を加えたものである、ステップ、をさらに備える方法。
【請求項10】
請求項1に記載の方法であって、前記クリッピング操作が、前記符号化ユニットの前記残差の輝度成分に適用される第1のクリッピング操作と、前記符号化ユニットの前記残差の色差成分に適用される第2のクリッピング操作とをさらに備える、方法。
【請求項11】
請求項10に記載の方法であって、
前記第1のクリッピング操作が、前記符号化ユニットの前記残差の前記輝度成分のダイナミックレンジを、第1の内部符号化ビット深度に1を加えたものの範囲内に制限し、
前記第2のクリッピング操作が、前記符号化ユニットの前記残差の前記色差成分のダイナミックレンジを、第2の内部符号化ビット深度に1を加えたものの範囲内に制限し、
前記第2の内部符号化ビット深度は前記第1の内部符号化ビット深度に1を加えたものである、方法。
【請求項12】
1つ以上の処理部と、
前記1つ以上の処理部に接続されたメモリと、
前記メモリに記憶された複数のプログラムとを備え、
前記複数のプログラムは、前記1つ以上の処理部によって実行されると、前記電子装置に、請求項1から11のいずれか一項に記載の方法を実施させる、電子装置。
【請求項13】
1つ以上の処理部を有する電子装置による実行のための複数のプログラムを記憶している非一時型コンピュータ読み取り可能な記憶媒体であって、前記複数のプログラムが、前記1つ以上の処理部によって実行されたとき、前記電子装置に、請求項1から11のいずれか一項に記載の方法を実施させる、非一時型コンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願)
本出願は、2020年1月5日付け出願の「METHODS AND APPARATUS ON 4:4:4 VIDEO CODING(4:4:4ビデオコーディングにおける方法及び装置)」という名称の米国仮出願第62/957,273号、及び2020年1月25日付け出願の「METHODS AND APPARATUS ON 4:4:4 V
IDEO CODING(4:4:4ビデオコーディングにおける方法及び装置)」とい
う名称の米国仮出願第62/965,859号の優先権の主張を伴うものであり、どちらも全体が参照によって組み込まれる。
【0002】
(技術分野)
本出願は、一般にビデオデータの符号化及び圧縮に関し、詳細には、適応型色空間変換(ACT:adaptive color-space transform)の前にクリッピング操作を実行する方法及びシステムに関する。
【背景技術】
【0003】
デジタルビデオは、デジタルテレビジョン、ラップトップ型又はデスクトップ型のコンピュータ、タブレット型コンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤー、ビデオゲームコンソール、スマートフォン、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどの種々の電子デバイスによってサポートされる。そのような電子デバイスは、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4 Part 10 AVC(Advanced Video Codi
ng)、HEVC(高能率映像符号化:High Efficiency Video C
oding)、VVC(Versatile Video Coding)規格などで定められたビデオ圧縮伸張規格を実装することにより、デジタルビデオデータの送信、受信、符号化、復号、及び/又は格納を行う。一般にビデオ圧縮は、空間(イントラフレーム)予測及び/又は時間(インターフレーム)予測を実行してビデオデータに固有の冗長を低減するか又は除去することを含む。ブロックベースのビデオコーディングについては、ビデオフレームが1つ以上のスライスへと分割され、各スライスが符号化ツリーユニット(CTU:coding tree unit)とも称され得る複数のビデオブロックを有する。各CTUが1つの符号化ユニット(CU:coding unit)を含有し得、又
は所定の最小のCUサイズに達するまで、より小さいCUへと再帰的に分割され得る。各CU(リーフCUとも命名されている)が1つ以上の変換ユニット(TU:transform unit)を含有しており、1つ以上の予測ユニット(PU:predicti
on unit)も含む。各CUは、イントラモード、インターモード又はイントラブロ
ックコピー(IBC)モードのいずれかで符号化され得る。ビデオフレームにおけるイントラ符号化(I)スライス内のビデオブロックは、同じビデオフレームの内部の近隣のブロックにおける参照サンプルに対して空間予測を使用して符号化される。ビデオフレームにおけるインター符号化(P(順方向予測画像)又はB(双方向予測画像))スライス内のビデオブロックは、同じビデオフレーム内の近隣のブロックにおける参照サンプルに対する空間予測を使用したものでよく、或いは以前の他の参照ビデオフレーム及び/又は未来の他の参照ビデオフレームにおける参照サンプルに対する時間予測を使用したものでもよい。
【0004】
たとえば近隣のブロックといった以前に符号化された参照ブロックに基づく空間予測又は時間予測は、符号化される現在のビデオブロックに関する予測ブロックをもたらす。参照ブロックを見いだすプロセスは、ブロックマッチングアルゴリズムによって達成され得
る。符号化される現在のブロックと予測ブロックとの間の画素差分を表す残差データは、残差ブロック又は予測誤差と称される。インター符号化ブロックは、予測ブロックを形成する参照フレームにおける参照ブロックを指し示す動きベクトル及び残差ブロックに従って符号化される。動きベクトルを決定するプロセスは一般的には動き予測と称される。イントラ符号化ブロックは、イントラ予測モード及び残差ブロックに従って符号化される。さらなる圧縮のために、残差ブロックは、画素領域から、たとえば周波数領域といった変換領域に変換されて残差変換係数をもたらし、次いで量子化され得る。最初に2次元配列に配置される量子化変換係数は、変換係数の1次元ベクトルを生成するために走査されてよく、次いで、さらにいっそうの圧縮を達成するためにビデオビットストリームへとエントロピー符号化される。
【0005】
次いで、符号化ビデオビットストリームは、デジタルビデオ機能を伴う別の電子デバイスによってアクセスされるコンピュータ読み取り可能な記録媒体(たとえばフラッシュメモリ)に保存されるか、又は有線もしくは無線で電子デバイスに直接伝送される。次いで、電子デバイスは、たとえば符号化ビデオビットストリームを解析してビットストリームからシンタックス要素を取得し、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいて、符号化ビデオビットストリームからのデジタルビデオデータを元のフォーマットに再構成することによってビデオ伸張(前述のビデオ圧縮とは逆の処理)を実行し、再構成されたデジタルビデオデータを電子デバイスのディスプレイに描画する。
【0006】
デジタルビデオの品質がハイビジョン(High Definition)から4K×
2K又は8K×4Kに移行するにつれて、符号化/復号対象のビデオデータ量が指数関数的に増大する。これは、復号されるビデオデータの画質を維持しながらビデオデータをいかにより効率的に符号化/復号できるかという点での絶え間ない努力がある。
【0007】
たとえばスクリーンコンテンツビデオといった、ある特定のビデオコンテンツは、すべての3つの成分(輝度成分と2つの色差成分)が同一の解像度を有する4:4:4色差フォーマットで符号化される。4:4:4色差フォーマットは、(優れた圧縮効率の実現にとって不利な)4:2:0色差フォーマットや4:2:2色差フォーマットと比較して、より多くの冗長性を含んでいるが、4:4:4色差フォーマットは、なお、復号ビデオにおける鮮明なエッジなどの色情報を維持するために高い忠実度が必要とされる多くの用途にとって好ましい符号化フォーマットである。4:4:4色差ビデオフォーマットに存在する冗長性を所与として、4:4:4ビデオの3つの色成分(たとえばYCbCr領域におけるY、Cb及びCr、又はRGB領域におけるG、B及びR)の間の相関を利用することにより、大幅な符号化改善が実現され得ることの証拠がある。これらの相関のために、HEVCスクリーンコンテンツ符号化(SCC:screen content coding)拡張版の開発中に、3つの色成分の間の相関を活用するために適応型色空間変換(ACT)ツールが採用される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本出願は、ビデオデータの符号化及び復号に関する実装形態を記述し、より詳細には、適応型色空間変換(ACT)の前にクリッピング操作を実行する方法及びシステムを記述する。
【課題を解決するための手段】
【0009】
元は4:4:4色フォーマットで取り込まれたビデオ信号について、復号ビデオ信号に対して高い忠実度が望まれる場合には元の空間においてビデオを符号化するのが好ましく、たとえばRGBビデオといった元の色空間では情報の冗長性が豊富である。たとえばク
ロス成分の線形モデル予測(CCLM:cross-component linear model prediction)といった現行のVVC規格におけるいくつかのイン
ター成分符号化ツールは、4:4:4ビデオ符号化の効率を改善することはできても、3つの成分間の冗長性が十分に解消されない。これは、Cb/B成分及びCr/R成分を予測するのに、Y/G成分のみが利用され、Cb/B成分とCr/R成分との間の相関は考慮に入れられないためである。これに対して、3つの色成分のさらなる相関の除去は、4:4:4ビデオ符号化の符号化性能を改善し得る。
【0010】
現行のVVC規格では、既存のインターツール及びイントラツールの設計は、主に4:2:0色差フォーマットで取り込まれたビデオに的を絞っている。したがって、より優れた複雑さ/性能のトレードオフを実現するためには、それらの符号化ツール(たとえば、位置依存型イントラ予測組合せ(PDPC:position-dependent i
ntra prediction combination)、マルチ参照ライン(MRL:multi-reference line)、及びサブ分割予測(ISP))の多く
は輝度成分にのみ適用可能であって色差成分には無効であり、或いは輝度成分及び色差成分には別の操作(たとえば動き補償予測に適用される補間フィルタ)を使用する。しかしながら、4:4:4色差フォーマットのビデオ信号は、4:2:0ビデオと比較して大変異なる特性を表す。たとえば、4:4:4のYCbCrビデオ及びRGBビデオのCb/B成分及びCr/R成分は、4:2:0ビデオの色差成分よりも、より豊富な色情報を表し、より高い周波数の情報(たとえばエッジ及びテクスチャ)を有する。そのような考察により、VVCでは、4:2:0ビデオと4:4:4ビデオとの両方に対して、いくつかの既存の符号化ツールの同じ設計を使用するのが常に最適であり得る。
【0011】
本出願の第1の態様によれば、ビデオデータを復号する方法は、ビットストリームから、イントラ予測モード又はインター予測モードによって符号化されている符号化ユニットに対応するビデオデータを受け取るステップと、ビデオデータから、第1の符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示す第1のシンタックス要素を受け取るステップと、ビデオデータを処理して符号化ユニットの残差を生成するステップと、符号化ユニットがACTを使用して符号化されているとの、第1のシンタックス要素に基づく判定に応じて、符号化ユニットの残差に対してクリッピング操作を実行するステップと、クリッピング操作の後に、符号化ユニットの残差に対して逆ACTを適用するステップとを含む。
【0012】
いくつかの実施形態において、クリッピング操作は、符号化ユニットの残差のダイナミックレンジを、逆ACTによる処理のための所定の範囲内に制限する。
【0013】
本出願の第2の態様によれば、電子装置は、1つ以上の処理部、メモリ、及びメモリに記憶された複数のプログラムを含む。このプログラムは、1つ以上の処理部によって実行されると、電子機器に、上記で記述されたようにビデオデータを復号する方法を実施させる。
【0014】
本出願の第3の態様によれば、非一時型コンピュータ読み取り可能な記録媒体は、1つ以上の処理部を有する電子装置によって実行される複数のプログラムを記憶している。このプログラムは、1つ以上の処理部によって実行されると、電子機器に、上記で記述されたようにビデオデータを復号する方法を実施させる。
【0015】
実施形態のさらなる理解を提供するために含まれる添付図面は、本明細書に組み込まれて本明細書の一部を構成し、記述された実施形態を図示して、記述とともに基本原理を説明するのに役立つものである。類似の参照数字は相当する部分を指す。
【図面の簡単な説明】
【0016】
【
図1】本開示のいくつかの実施形態による例示的ビデオ符号化及び復号システムを示すブロック図である。
【
図2】本開示のいくつかの実施形態による例示的なビデオ符号化器を示すブロック図である。
【
図3】本開示のいくつかの実施形態による例示的ビデオ復号器を示すブロック図である。
【
図4A】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を説明するブロック図である。
【
図4B】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を説明するブロック図である。
【
図4C】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を説明するブロック図である。
【
図4D】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を説明するブロック図である。
【
図4E】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を説明するブロック図である。
【
図5A】本開示のいくつかの実装形態に従って、RGB色空間とYCgCo色空間との間の残差を変換するための適応型色空間変換(ACT)の技術を適用する例を示すブロック図である。
【
図5B】本開示のいくつかの実装形態に従って、RGB色空間とYCgCo色空間との間の残差を変換するための適応型色空間変換(ACT)の技術を適用する例を示すブロック図である。
【
図6】本開示のいくつかの実装形態に従って、例示的なビデオデータ復号プロセスにおいて色差スケーリング付き輝度マッピング(LMCS:luma mapping with chroma scaling)の技術を適用するブロック図である。
【
図7】本開示のいくつかの実装形態に従って、ビデオ復号器が逆方向の適応型色空間変換(ACT)の技術を実施する例示的なビデオ復号プロセスを示すブロック図である。
【
図8A】本開示のいくつかの実装形態に従って、ビデオ復号器が逆方向の適応型色空間変換(ACT)及び色差スケーリング付き輝度マッピング(LMCS)の技術を実施する例示的なビデオ復号プロセスを示すブロック図である。
【
図8B】本開示のいくつかの実装形態に従って、ビデオ復号器が逆方向の適応型色空間変換(ACT)及び色差スケーリング付き輝度マッピング(LMCS)の技術を実施する例示的なビデオ復号プロセスを示すブロック図である。
【
図9】本開示のいくつかの実装形態に従って、適応型色空間変換(ACT)の実行とブロック差分パルス符号化変調(BDPCM:block differential pulse coded modulation)の実行との間の例示的な復号ロジックを示すブロック図である。
【
図10】本開示のいくつかの実装形態に従って、輝度の内部ビット深度と色差の内部ビット深度とが異なるとき、別々の成分に対して別々の量子化パラメータ(QP)のオフセットを適用する復号の流れ図である。
【
図11A】本開示のいくつかの実装形態に従って、ビデオ復号器が、符号化ユニットの残差のダイナミックレンジを逆ACTによって処理するための所定の範囲内に制限するためにクリッピングの技術を実施する、例示的なビデオ復号プロセスを示すブロック図である。
【
図11B】本開示のいくつかの実装形態に従って、ビデオ復号器が、符号化ユニットの残差のダイナミックレンジを逆ACTによって処理するための所定の範囲内に制限するためにクリッピングの技術を実施する、例示的なビデオ復号プロセスを示すブロック図である。
【
図12】本開示のいくつかの実装形態に従って、ビデオ復号器が、符号化ユニットの残差のダイナミックレンジを逆ACTによって処理するための所定の範囲内に制限するためにクリッピング操作を実行することによってビデオデータを復号する、例示的なプロセスを示す流れ図である。
【発明を実施するための形態】
【0017】
次に具体的な実施形態が詳細に参照され、それらの実施例が添付図面に示されている。以下の詳細な説明では、本明細書で提示される主題の理解を支援するために多くの非限定的かつ具体的な詳細が明らかにされる。しかし、特許請求の範囲から逸脱することなく様々な代替形態が使用され得、これらの具体的な詳細なしで主題が実施され得ることが、当業者には明らかであろう。たとえば、本明細書で提示された主題が、デジタルビデオ機能を伴う多くのタイプの電子デバイスにおいて実施され得ることは、当業者には明らかであろう。
【0018】
いくつかの実施形態では、4:4:4ビデオに関するVVC規格の符号化効率を改善するための方法が提供される。一般に、本開示における技術の主な特徴が以下に要約される。
【0019】
いくつかの実施形態では、これらの方法は、残差領域における適応型色空間変換を有効にする既存のACT設計を改善するために実施される。特に、ACTと、VVCにおけるいくつかの既存の符号化ツールとの相互作用を扱うために特別な配慮がなされる。
【0020】
いくつかの実施形態では、これらの方法は、4:4:4ビデオに関するVVC規格におけるいくつかの既存のインター符号化ツール及びイントラ符号化ツールの効率を改善するために実施されるものであり、1)色差成分用の8タップ補間フィルタを有効にするステップと、2)色差成分のイントラ予測用のPDPCを有効にするステップと、3)色差成分のイントラ予測用のMRLを有効にするステップと、4)色差成分用のISP分割を有効にするステップとを含む。
【0021】
図1は、本開示のいくつかの実施形態に従って、ビデオブロックの符号化と復号を並行して行うための例示的システム10を示すブロック図である。
図1に示されるように、システム10は、後に送信先(デスティネーション)装置14によって復号されるビデオデータを生成して符号化する情報源(ソース)装置12を含む。情報源装置12及び送信先装置14は、デスクトップコンピュータ又はラップトップコンピュータ、タブレット型コンピュータ、スマートフォン、セットトップボックス、デジタルテレビジョン、カメラ、表示装置、デジタルメディアプレーヤー、ビデオゲームコンソール、ビデオストリーミングデバイス等を含む種々の電子デバイスのうち任意のものを備え得る。いくつかの実施形態では、情報源装置12及び送信先装置14は無線通信機能を装備している。
【0022】
いくつかの実施形態では、送信先装置14は、リンク16を通じて、復号される符号化ビデオデータを受け取ってよい。リンク16は、情報源装置12から送信先装置14に、符号化ビデオデータを転送することができる任意のタイプの通信媒体又は通信デバイスを備え得る。一例では、リンク16は、情報源装置12が送信先装置14に、符号化ビデオデータをリアルタイムで直接伝送することを可能にするための通信媒体を備え得る。符号化ビデオデータは、無線通信プロトコルなどの通信規格に従って変調されて送信先装置14に伝送され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つ以上の物理的伝送路などの任意の無線又は有線の通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、広域ネットワーク、又はインターネットなどのグローバネットワークなどのパケットベースのネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、又は情報源装置12から送信先装置14への通信を容易にするのに役立つその他
の機器を含み得る。
【0023】
いくつかの他の実施形態では、符号化ビデオデータは、出力インタフェース22から記録装置32に伝送され得る。続いて、記録装置32における符号化ビデオデータは、送信先装置14によって入力インタフェース28を介してアクセスされ得る。記録装置32は、ハードディスク(hard drive)、ブルーレイディスク、DVD、CD-RO
M、フラッシュメモリ、揮発性もしくは不揮発性のメモリ、又は符号化ビデオデータを記憶するのに適する他のデジタル記録媒体など、種々の、分散された又は局所的にアクセスされるデータ記録媒体のうち任意のものを含み得る。さらなる例では、記録装置32は、情報源装置12によって生成された、符号化ビデオデータを保持し得る、ファイルサーバ又は別の中間記録装置に相当してよい。送信先装置14は、記録装置32からストリーミング又はダウンロードすることによって、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶したり、符号化ビデオデータを送信先装置14に伝送したりすることができる任意のタイプのコンピュータでよい。例示的ファイルサーバは、(たとえばウェブサイト用の)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS:network attached storage)装置、又はローカルディスクドライブを含む。送信先装置14は、ファイルサーバに記憶されている符号化ビデオデータにアクセスするのに適する無線チャンネル(たとえばWi-Fi接続)、有線接続(たとえば、DSLやケーブルモデムなど)、又は両方の組合せを含む任意の標準的なデータ接続を通じて、符号化ビデオデータにアクセスし得る。記録装置32からの符号化ビデオデータの伝送は、ストリーミング伝送、ダウンロード伝送、又は両方の組合せでよい。
【0024】
図1に示されるように、情報源装置12は、ビデオ源18、ビデオ符号化器20及び出力インタフェース22を含む。ビデオ源18は、たとえばビデオカメラ、以前に取り込まれたビデオを含むビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受け取るためのビデオ供給インタフェース、及び/又はソースビデオとしてのコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステム、あるいはそのようなソースの組合せといった、ビデオキャプチャーデバイスなどのソースを含み得る。一例として、ビデオ源18がセキュリティ監視システムのビデオカメラである場合には、情報源装置12及び送信先装置14がカメラフォン又はビデオフォンを形成し得る。しかしながら、本出願に記述された実施形態は、一般にビデオコーディングに適用可能であり得、無線及び/又は有線の用途に適用され得る。
【0025】
取り込まれた、前もって取り込まれた、又はコンピュータで生成されたビデオは、ビデオ符号化器20によって符号化され得る。符号化ビデオデータは、情報源装置12の出力インタフェース22を通って送信先装置14に直接伝送され得る。符号化ビデオデータは、復号及び/又は再生のために、送信先装置14又は他のデバイスによる後のアクセス用に、記録装置32にも(又は代わりに)記憶されてよい。出力インタフェース22はモデム及び/又は送信器をさらに含み得る。
【0026】
送信先装置14は、入力インタフェース28、ビデオ復号器30、及び表示装置34を含む。入力インタフェース28は受信器及び/又はモデムを含み得、リンク16を通じて、符号化ビデオデータを受け取る。リンク16を通じて通信されるか又は記録装置32で供給される符号化ビデオデータは、ビデオ復号器30によってビデオデータを復号する際に使用される、ビデオ符号化器20によって生成された種々のシンタックス要素を含み得る。そのようなシンタックス要素が含まれ得る符号化ビデオデータは、通信媒体で伝送され、記録媒体又はファイルサーバに記憶される。
【0027】
いくつかの実施形態では、送信先装置14が含み得る表示装置34は、統合表示装置と
、送信先装置14と通信するように構成された外部表示装置とであり得る。表示装置34は、復号ビデオデータをユーザーに表示し、液晶ディスプレイ(LCD:liquid
crystal display)、プラズマディスプレイ、有機発光ダイオード(OL
ED)ディスプレイ、又は別タイプの表示装置などの種々の表示装置のうち任意のものを備え得る。
【0028】
ビデオ符号化器20及びビデオ復号器30は、VVC,HEVC,MPEG-4 Pa
rt 10 AVC(Advanced Video Coding),又はこれらの規格の拡張版などの、知的所有物又は業界規格に基づいて動作し得る。本出願は特定のビデオ符号化/復号の規格に限定されず、他のビデオ符号化/復号の規格に適用可能であり得ることを理解されたい。一般に、情報源装置12のビデオ符号化器20は、これらの現在の規格又は将来の規格のいずれかに従ってビデオデータを符号化するように構成され得ることが企図されている。同様に、送信先装置14のビデオ復号器30は、これらの現在の規格又は将来の規格のいずれかに従ってビデオデータを復号するように構成され得ることも一般に企図されている。
【0029】
ビデオ符号化器20及びビデオ復号器30は、それぞれ、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP:digital signal processor)、特定用途向け集積回路(ASIC:application specific integrated circuit)、フィールドプログラマブルゲートアレイ(FP
GA:field programmable gate array)、ディスクリート
ロジック(個別論理回路:discrete logic)、ソフトウェア、ハードウェ
ア、ファームウェア又はこれらの任意の組合せなどの種々の適切な符号化回路構成のうち任意のものとして実施され得る。電子デバイスは、部分的にソフトウェアで実施されるときには、ソフトウェアに関する命令を適切な非一時型コンピュータ読み取り可能な媒体に記憶し、1つ以上のプロセッサを使用してハードウェアで命令を実行して、本開示で開示されたビデオ符号化/復号の処理を実行し得る。ビデオ符号化器20及びビデオ復号器30の各々が1つ以上の符号化器又は復号器に含まれ得、そのいずれかが、それぞれのデバイスにおいて組み合わされた符号化器/復号器(CODEC)の一部として一体化され得る。
【0030】
図2は、本出願に記述されたいくつかの実施形態による例示的ビデオ符号化器20を示すブロック図である。ビデオ符号化器20は、ビデオフレームの内部のビデオブロックのイントラ予測符号化及びインター予測符号化を実行し得る。イントラ予測符号化は、所与のビデオフレーム又はピクチャの内部のビデオデータにおける空間冗長性を低減するか又は除去するために空間予測に頼る。インター予測符号化は、ビデオシーケンスの隣接したビデオフレーム又はピクチャの内部のビデオデータにおける時間冗長性を低減するか又は除去するために時間予測に頼る。
【0031】
図2に示されるように、ビデオ符号化器20は、ビデオデータメモリ40、予測処理部41、復号ピクチャバッファ(DPB:decoded picture buffer)64、加算器50、変換処理部52、量子化部54、及びエントロピー符号化部56を含む。予測処理部41は、動き推定部42、動き補償部44、分割部45、イントラ予測処理部46、及びイントラブロックコピー(BC)部48をさらに含む。いくつかの実施形態では、ビデオ符号化器20は、ビデオブロックを再構成するための逆量子化部58、逆変換処理部60、及び加算器62も含む。再構成されたビデオから、ブロック境界をフィルタリングしてブロック歪を除去するために、加算器62とDPB64との間にデブロッキングフィルタ(図示せず)が配置されてよい。デブロッキングフィルタに加えて、加算器62の出力をフィルタリングするためにループ内フィルタ(図示せず)も使用され得る。ビデオ符号化器20は、変更不能な又はプログラマブルなハードウェアユニットという
形態を取ってよく、あるいは、1つ以上の変更不能な又はプログラマブルなハードウェアユニットのうちに分割されてもよい。
【0032】
ビデオデータメモリ40は、ビデオ符号化器20の構成要素によって符号化されるビデオデータを記憶し得る。ビデオデータメモリ40のビデオデータは、たとえばビデオ源18から取得され得る。DPB64は、ビデオ符号化器20によって(たとえばイントラ予測符号化モード又はインター予測符号化モードで)ビデオデータを符号化するのに用いる参照ビデオデータを記録するバッファである。ビデオデータメモリ40及びDPB64は、様々な記録装置のうち任意のものによっても形成され得る。様々な例において、ビデオデータメモリ40は、ビデオ符号化器20の他の構成要素とともにオンチップでよく、又はそれらの構成要素に対してオフチップでもよい。
【0033】
図2に示されるように、予測処理部41の内部の分割部45は、受け取ったビデオデータをビデオブロックへと分割する。この分割は、ビデオデータに関連づけられた四分木構造などの所定の分割構造に従って、ビデオフレームを、スライス、タイル、又は他のより大きい符号化ユニット(CU)へと分割することを含み得る。ビデオフレームは複数のビデオブロック(又は、タイルと称されるビデオブロックのセット)に分割され得る。予測処理部41は、誤り結果(たとえば符号化レートや歪みのレベル)に基づいて現在のビデオブロック用に、複数のイントラ予測符号化モードのうちの1つ、又は複数のインター予測符号化モードのうちの1つなど、複数の可能な予測符号化モードのうちの1つを選択してよい。予測処理部41は、結果として生じるイントラ予測符号化ブロック又はインター予測符号化ブロックを、加算器50に供給して残差ブロックを生成してよく、また、この符号化ブロックを加算器62に供給して、後に参照フレームの一部として使用するために再構成してよい。予測処理部41は、また、エントロピー符号化部56に、動きベクトル、イントラモードインジケータ、分割情報、及び他のそのようなシンタックス情報などのシンタックス要素を供給する。
【0034】
現在のビデオブロック用に適切なイントラ予測符号化モードを選択するために、予測処理部41の内部のイントラ予測処理部46は、符号化される現在のブロックと同じフレームにおける1つ以上の近隣のブロックに関する現在のビデオブロックのイントラ予測符号化を実行して、空間予測をもたらし得る。予測処理部41の内部の動き推定部42及び動き補償部44は、1つ以上の参照フレームにおける1つ以上の予測ブロックに関連して現在のビデオブロックのインター予測符号化を実行して時間予測をもたらす。ビデオ符号化器20は、たとえばビデオデータの各ブロック用に適切な符号化モードを選択するために、複数の符号化パスを実行してよい。
【0035】
いくつかの実施形態では、動き推定部42は、一連のビデオフレームの内部の所定のパターンに従って、参照ビデオフレームの内部の予測ブロックに対する現在のビデオフレームの内部のビデオブロックの予測ユニット(PU)の変位を示す動きベクトルを生成することにより、現在のビデオフレームに関するインター予測モードを決定する。動き推定部42によって実行される動き予測は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム内(又は他の符号化ユニット内)の符号化される現在のブロックに関連して、参照フレーム内(又は他の符号化ユニット)内の予測ブロックに対する現在のビデオフレーム又はピクチャの内部のビデオブロックのPUの変位を示し得る。所定のパターンは、ビデオフレームを、シーケンスにおけるPフレーム又はBフレームとして指定し得る。イントラBC部48は、インター予測用の動き推定部42による動きベクトルの決定と同様のやり方で、イントラBC符号化用の、たとえばブロックベクトルといったベクトルを決定してよく、又は動き推定部42を利用してブロックベクトルを決定してもよい。
【0036】
予測ブロックは、画素差分の観点から、符号化対象となるビデオブロックのPUと密接に対応するものとみなされる参照フレームのブロックであり、差分絶対値和(SAD:sum of absolute difference)、差分二乗和(SSD:sum of square difference)、又は他の差分基準量によって決定され得る。いくつかの実施形態では、ビデオ符号化器20は、DPB64に記憶された参照フレームのサブ整数型画素位置の値を計算してよい。たとえば、ビデオ符号化器20は、参照フレームの1/4画素位置、1/8画素位置、又は他の分数画素位置の値を補間してよい。したがって、動き推定部42は、全体の画素位置及び分数画素位置に関する動き探索を実行して、分数画素精度を有する動きベクトルを出力し得る。
【0037】
動き推定部42は、インター予測符号化フレームのビデオブロックのPUに関して、第1の参照フレームリスト(リスト0)又は第2の参照フレームリスト(リスト1)から選択された参照フレームの予測ブロックの位置と当該PUの位置とを比較することにより動きベクトルを計算する。ここで、第1の参照フレームリスト又は第2の参照フレームリストはそれぞれDPB64に格納されている1つ以上の参照フレームを特定するものである。動き推定部42は、計算された動きベクトルを動き補償部44に送り、次いでエントロピー符号化部56に送る。
【0038】
動き補償部44によって実行される動き補償は、動き推定部42によって決定された動きベクトルに基づいて予測ブロックを取り込むこと又は生成することを包含し得る。動き補償部44は、現在のビデオブロックのPUに関する動きベクトルを受け取ると、動きベクトルが参照フレームリストのうちの1つにおいて指し示す予測ブロックを捜し出し、DPB64から予測ブロックを取り出して、予測ブロックを加算器50に転送する。次いで、加算器50は、符号化される現在のビデオブロックの画素値から動き補償部44によってもたらされた予測ブロックの画素値を差し引くことにより、画素差分値の残差ビデオブロックを形成する。残差ビデオブロックを形成する画素差分値は、輝度(luma)差分成分もしくは色差(chroma)差分成分、又はこれらの両方を含み得る。動き補償部44は、ビデオ復号器30によって、ビデオフレームのビデオブロックを復号する際に使用されるビデオフレームのビデオブロックに関連したシンタックス要素も生成し得る。シンタックス要素は、たとえば、予測ブロックを記述するために使用される動きベクトルを定義するシンタックス要素、予測モードを示す任意のフラグ、又は本明細書に記述されたその他のシンタックス情報を含み得る。なお、動き推定部42と動き補償部44はほとんど一体化され得るが、概念的な目的のために個別に示されている。
【0039】
いくつかの実施形態では、イントラBC部48は、動き推定部42及び動き補償部44に関して上記に記述されたのと同様のやり方でベクトルを生成して予測ブロックを取り込み得るが、予測ブロックは符号化される現在のブロックと同じフレームにあり、ベクトルは動きベクトルと対照的にブロックベクトルと称される。詳細には、イントラBC部48は、現在のブロックを符号化するためにイントラ予測モードを使用するように決定してよい。いくつかの例において、イントラBC部48は、たとえば個別の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し、レート-歪み解析によってそれらイントラ予測モードの性能を分析してよい。次に、イントラBC部48は、試験された様々なイントラ予測モードの中で、イントラモードインジケータを生成するのに使用する適切なイントラ予測モードを選択してよい。たとえば、イントラBC部48は、レート-歪み解析を使用して、試験された様々なイントラ予測モードに関するレート-歪み値を計算し、試験されたモードの中で最善のレート-歪み特性を有するイントラ予測モードを、使用するのに適切なイントラ予測モードとして選択してよい。レート-歪み解析は、一般に、符号化ブロックと、当該符号化ブロックを生成するために符号化される符号化前の元のブロックとの間の歪み(又は誤差)量とともに、これら符号化ブロックを生成するために使用されたビットレート(すなわち、多数のビット)を決定する。イントラBC
部48は、様々な符号化ブロックについて歪みとレートとの比率を計算して、そのブロックに関する最善のレート-歪み値を示すイントラ予測モードを決定してよい。
【0040】
他の例では、イントラBC部48は、本明細書に記述された実施形態に従ってイントラBC予測のためのそのような機能を実行するために、動き推定部42及び動き補償部44を全体的又は部分的に使用してよい。どちらの場合にも、イントラブロックコピーについては、予測ブロックは、画素差分の観点から、符号化対象となるブロックと密接に対応するものとみなされるブロックでよく、差分絶対値和(SAD)、差分二乗和(SSD)、又は他の差分基準量によって決定され得る。予測ブロックの特定には、サブ整数型画素位置の値の計算が含まれ得る。
【0041】
予測ブロックがイントラ予測による同じフレームからのものであろうとインター予測による異なるフレームからのものであろうと、ビデオ符号化器20は、符号化される現在のビデオブロックの画素値から予測ブロックの画素値を差し引くことによって残差ビデオブロックを形成してよく、画素差分値を形成する。残差ビデオブロックを形成する画素差分値は、輝度差分成分と色差差分成分の両方を含み得る。
【0042】
イントラ予測処理部46は、前述のように、動き推定部42及び動き補償部44によって実行されるインター予測、又はイントラBC部48によって実行されるイントラブロックコピー予測の代替として、現在のビデオブロックをイントラ予測してよい。詳細には、イントラ予測処理部46は、現在のブロックを符号化するためにイントラ予測モードを使用するように決定してよい。そうするために、イントラ予測処理部46は、たとえば個別の符号化パス中に様々なイントラ予測モードを使用して現在のブロックを符号化してよく、イントラ予測処理部46(又はいくつかの例ではモード選択部)は、試験されたイントラ予測モードから、使用するべき適切なイントラ予測モードを選択してよい。イントラ予測処理部46は、そのブロック向けに選択されたイントラ予測モードを表す情報をエントロピー符号化部56に供給してよい。エントロピー符号化部56は、ビットストリームにおける選択されたイントラ予測モードを示す情報を符号化してよい。
【0043】
予測処理部41がインター予測又はイントラ予測のいずれかによって現在のビデオブロック用の予測ブロックを決定した後に、加算器50が、現在のビデオブロックから予測ブロックを差し引くことによって残差ビデオブロックを生成する。残差ブロックにおける残差ビデオデータは1つ以上の変換ユニット(TU)に含まれ得、変換処理部52に供給される。変換処理部52は、離散コサイン変換(DCT:discrete cosine
transform)又は概念的に同様の変換などの変換を使用して残差ビデオデータを残差変換係数に変換する。
【0044】
変換処理部52は、結果として生じる変換係数を量子化部54に送ってよい。量子化部54は、変換係数を量子化してビットレートをさらに低下させる。量子化プロセスは、係数のうちのいくつか又はすべてに関連したビット深さも縮小し得る。量子化の程度は、量子化パラメータを調節することによって変更され得る。いくつかの例において、量子化部54は、次いで、量子化変換係数を含むマトリクスの走査を実行し得る。あるいはエントロピー符号化部56が走査を実行してもよい。
【0045】
量子化に続いて、エントロピー符号化部56は、たとえば、コンテキスト適応型可変長符号化(CAVLC:context adaptive variable lengt
h coding)、コンテキスト適応型2値算術符号化(CABAC:context adaptive binary arithmetic coding)、シンタックス
ベースコンテキスト適応型2値算術符号化(SBAC:syntax-based co
ntext-adaptive binary arithmetic coding)、
確率区間区分エントロピー符号化(PIPE:probability interva
l partitioning entropy coding)、又は別のエントロピー
符号化の技法もしくは技術を使用して、量子化変換係数をビデオビットストリームへとエントロピー符号化する。次いで、符号化ビットストリームは、ビデオ復号器30に伝送されるか、又は後にビデオ復号器30へ伝送するため、もしくはビデオ復号器30によって後に取り戻すために記録装置32に記録され得る。エントロピー符号化部56は、符号化される現在のビデオフレームに関する動きベクトル及び他のシンタックス要素もエントロピー符号化してよい。
【0046】
他のビデオブロックを予測するための参照ブロックを生成するために、画素領域における残差ビデオブロックを再構成するのに、逆量子化部58が逆量子化を適用し、逆変換処理部60が逆変換を適用する。前述のように、動き補償部44は、DPB64に記憶されたフレームの1つ以上の参照ブロックから、動き補償予測ブロックを生成し得る。動き補償部44はまた、予測ブロックに1つ以上の補間フィルタを適用して、動き予測に用いるサブ整数画素値を計算してよい。
【0047】
加算器62は、再構成された残差ブロックを、動き補償部44によって生成された動き補償予測ブロックに加えて、DPB64に記憶するための参照ブロックを生成する。次いで、参照ブロックは、イントラBC部48、動き推定部42及び動き補償部44によって、後続のビデオフレームにおける別のビデオブロックをインター予測するための予測ブロックとして使用され得る。
【0048】
図3は、本出願のいくつかの実施形態による例示的なビデオ復号器30を示すブロック図である。ビデオ復号器30は、ビデオデータメモリ79、エントロピー復号部80、予測処理部81、逆量子化部86、逆変換処理部88、加算器90、及びDPB92を含む。予測処理部81は、動き補償部82、イントラ予測処理部84、及びイントラBC部85をさらに含む。ビデオ復号器30は、
図2に関連してビデオ符号化器20に関して記述された符号化プロセスとは全体的に逆の復号プロセスを実行し得る。たとえば、動き補償部82は、エントロピー復号部80から受け取られた動きベクトルに基づいて予測データを生成し得、一方、イントラ予測処理部84は、エントロピー復号部80から受け取られたイントラ予測モードインジケータに基づいて予測データを生成し得る。
【0049】
いくつかの例において、ビデオ復号器30のユニットには、本出願の実施形態を実行するようにタスクが課されることがある。また、いくつかの例では、本開示の実施形態は、ビデオ復号器30の1つ以上のユニットの間で分割されてもよい。たとえば、イントラBC部85は、本出願の実施形態を、単独で、又はビデオ復号器30の動き補償部82、イントラ予測処理部84、及びエントロピー復号部80などの他のユニットと組み合わせて実行し得る。いくつかの例では、ビデオ復号器30はイントラBC部85を含まなくてよく、イントラBC部85の機能性は、動き補償部82など、予測処理部81の他の構成要素によって実行され得る。
【0050】
ビデオデータメモリ79は、ビデオ復号器30の他の構成要素によって復号される符号化ビデオビットストリームなどのビデオデータを記憶し得る。ビデオデータメモリ79に記憶されたビデオデータは、記録装置32から、たとえばカメラなどのローカルなビデオ源から、ビデオデータの有線もしくは無線のネットワーク通信によって、又はたとえばフラッシュドライブもしくはハードディスクといった物理的データ記録媒体にアクセスすることによって取得され得る。ビデオデータメモリ79は、符号化ビデオビットストリームからの符号化ビデオデータを記憶する、符号化ピクチャバッファ(CPB:coded
picture buffer)を含み得る。ビデオ復号器30の、復号ピクチャバッフ
ァ(DPB)92は、ビデオ復号器30によって(たとえばイントラ予測符号化モード又
はインター予測符号化モードで)ビデオデータを符号化するのに用いる参照ビデオデータを記憶する。ビデオデータメモリ79及びDPB92は、シンクロナスDRAM(SDRAM:Synchronous Dynamic Random Access Memory)、磁気抵抗型RAM(MRAM:Magneto-resistive RAM)、
抵抗変化型RAM(RRAM)、又は他のタイプのメモリデバイスを含む動的ランダムアクセスメモリ(DRAM:Resistive RAM)などの種々のメモリデバイスの
うち任意のものによって形成され得る。例示のために、ビデオデータメモリ79及びDPB92は、
図3におけるビデオ復号器30の2つの別個の構成要素として表されている。しかし、ビデオデータメモリ79及びDPB92は、同一のメモリデバイス又は個別のメモリデバイスによってもたらされ得ることが当業者には明らかであろう。いくつかの例では、ビデオデータメモリ79は、ビデオ復号器30の他の構成要素とともにオンチップでよく、又はそれらの構成要素に対してオフチップでもよい。
【0051】
復号プロセス中に、ビデオ復号器30は、符号化ビデオフレーム及び関連するシンタックス要素のビデオブロックを表す符号化ビデオビットストリームを受け取る。ビデオ復号器30はビデオフレームレベル及び/又はビデオブロックレベルのシンタックス要素を受け取ってよい。ビデオ復号器30のエントロピー復号部80は、ビットストリームをエントロピー復号して、量子化係数、動きベクトル又はイントラ予測モードインジケータ、及び他のシンタックス要素を生成する。次いで、エントロピー復号部80は、動きベクトル及び他のシンタックス要素を予測処理部81に転送する。
【0052】
ビデオフレームが、イントラ予測符号化(I)フレームとして、又は他のタイプのフレームにおけるイントラ符号化予測ブロック向けに符号化されるとき、予測処理部81のイントラ予測処理部84は、信号伝達されたイントラ予測モード及び現在のフレームの以前に復号されたブロックからの参照データに基づいて、現在のビデオフレームのビデオブロックに関する予測データを生成し得る。
【0053】
ビデオフレームがインター予測符号化(すなわちB又はP)フレームとして符号化されるとき、予測処理部81の動き補償部82は、エントロピー復号部80から受け取られた動きベクトル及び他のシンタックス要素に基づいて現在のビデオフレームのビデオブロックに関する1つ以上の予測ブロックを生成する。予測ブロックの各々が、参照フレームリストのうちの1つの内部の参照フレームから生成され得る。ビデオ復号器30は、DPB92に記憶された参照フレームに基づくデフォルトの構成技術を使用して、参照フレームリスト、リスト0及びリスト1を構成し得る。
【0054】
いくつかの例では、本明細書に記述されたイントラBCモードに従ってビデオブロックが符号化されるとき、予測処理部81のイントラBC部85は、エントロピー復号部80から受け取られたブロックベクトル及び他のシンタックス要素に基づいて現在のビデオブロックに関する予測ブロックを生成する。予測ブロックは、ビデオ符号化器20によって定義された現在のビデオブロックと同一のピクチャの再構成された領域の内部にあり得る。
【0055】
動き補償部82及び/又はイントラBC部85は、動きベクトル及び他のシンタックス要素を解析することによって現在のビデオフレームのビデオブロックに関する予測情報を決定し、次いで、予測情報を使用して、復号される現在のビデオブロックに関する予測ブロックを生成する。たとえば、動き補償部82は、受け取られたシンタックス要素のうちのいくつかを使用して、ビデオフレームのビデオブロックを符号化するのに使用される予測モード(たとえばイントラ予測又はインター予測)、インター予測フレームタイプ(たとえばB又はP)、フレームに関する参照フレームリストのうちの1つ以上の構成情報、フレームにおける各インター予測符号化ビデオブロックの動きベクトル、フレームの各イ
ンター予測符号化ビデオブロックのインター予測状態、及び現在のビデオフレームにおけるビデオブロックを復号するための他の情報を決定する。
【0056】
同様に、イントラBC部85は、たとえばフラグといった受け取られたシンタックス要素のうちのいくつかを使用して、現在のビデオブロックはイントラBCモードを使用して予測されたものであること、再構成された領域の内部にあってDPB92に記憶されるべきフレームのビデオブロックの構成情報、フレームの各イントラBC予測ビデオブロックのブロックベクトル、フレームの各イントラBC予測ビデオブロックのイントラBC予測状態、及び現在のビデオフレームにおけるビデオブロックを復号するための他の情報を決定し得る。
【0057】
動き補償部82はまた、ビデオ符号化器20によってビデオブロックの符号化中に参照ブロックのサブ整数画素の補間値を計算するために使用されたような補間フィルタを使用して、補間を実行し得る。この場合、動き補償部82は、受け取られたシンタックス要素から、ビデオ符号化器20によって使用された補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成し得る。
【0058】
逆量子化部86は、ビットストリームの中に与えられてエントロピー復号部80によってエントロピー復号された量子化変換係数を、ビデオ符号化器20によってビデオフレームにおける各ビデオブロックについて量子化の程度を決定するために計算されたものと同一の量子化パラメータを使用して逆量子化する。逆変換処理部88は、画素領域における残差ブロックを再構成するために、変換係数に対して、たとえば逆DCT、逆整数変換、又は概念的に類似の逆変換プロセスといった逆変換を適用する。
【0059】
動き補償部82又はイントラBC部85がベクトル及び他のシンタックス要素に基づいて現在のビデオブロックに関する予測ブロックを生成した後に、加算器90は、逆変換処理部88からの残差ブロックと、動き補償部82及びイントラBC部85によって生成された対応する予測ブロックとを合計することによって、現在のビデオブロックに関する復号ビデオブロックを再構成する。復号ビデオブロックをさらに処理するために、加算器90とDPB92との間にループ内フィルタ(図示せず)が配置されてよい。次いで、所与のフレームにおける復号ビデオブロックは、次のビデオブロックの後続の動き補償に使用される参照フレームを記憶するDPB92に記憶される。DPB92又はDPB92とは別個のメモリデバイスも、復号されたビデオを、後に
図1の表示装置34などの表示装置に提示するために記憶し得る。
【0060】
一般的なビデオ符号化プロセスでは、ビデオシーケンスは、一般的にはフレーム又はピクチャの順序づけられたセットを含む。各フレームが、SL、SCb、及びSCrと表される3つのサンプル配列を含み得る。SLは、輝度(luma)サンプルからなる2次元配列である。SCbは、Cb色差サンプルからなる2次元配列である。SCrは、Cr色差サンプルからなる2次元配列である。他の事例では、フレームは白黒でよく、したがって輝度サンプルの2次元配列を1つだけ含む。
【0061】
図4Aに示されるように、ビデオ符号化器20(より具体的には分割部45)は、最初にフレームを符号化ツリーユニット(CTU)の集合に分割することによってフレームの符号化表現を生成する。ビデオフレームは、左から右及び上から下へのラスタスキャン順で連続的に順序づけられた整数個のCTUを含み得る。各CTETは最大の論理符号化ユニットであり、CTUの幅及び高さは、シーケンスパラメータセットにおいて、ビデオ符号化器20によって、ビデオシーケンスにおけるすべてのCTUが128×128、64×64、32×32、及び16×16のうちの1つである同一のサイズを有するように信号伝達される。しかし、本出願は必ずしも特定のサイズに制限されるものではないことに
留意されたい。
図4Bに示されるように、各CTUは、輝度(luma)サンプルからなる1つの符号化ツリーブロック(CTB)と、対応する2つの色差サンプルからなる符号化ツリーブロックと、符号化ツリーブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。シンタックス要素は、画素の符号化ブロックの種々のタイプのユニットの特性と、インター予測又はイントラ予測、イントラ予測モード、動きベクトル、及び他のパラメータを含め、ビデオ復号器30にてビデオシーケンスを再構成し得る方法とを記述するものである。白黒ピクチャ又は3つの個別のカラープレーンを有するピクチャでは、CTUは、単一の符号化ツリーブロックと、符号化ツリーブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。符号化ツリーブロックは、サンプルのN×Nのブロックでよい。
【0062】
より優れた性能を達成するために、ビデオ符号化器20は、CTUの符号化ツリーブロックに対して、二分木(binary-tree)分割、三分木(ternary-tree)分割、四分木(quad-tree)分割、又はこれらの組合せなどの木分割を再帰的に実行して、CTUをより小さい符号化ユニット(CU)に分割し得る。
図4Cに表されるように、64×64のCTU400が、最初に、それぞれが32×32のブロックサイズを有する4つのより小さいCUに分割される。4つのより小さいCUの中で、CU410及びCU420が、それぞれ16×16のブロックサイズで4つのCUに分割される。2つの16×16のCUである430及び440が、それぞれ8×8のブロックサイズで4つのCUにさらに分割される。
図4Dは、
図4Cに表されたようなCTU400の分割プロセスの最終結果を示す四分木データ構造を表すものであり、四分木の各リーフノードが32×32~8×8の範囲のそれぞれのサイズの1つのCUに対応する。各CUは、
図4Bに表されたCTUに類似して、輝度サンプルの符号化ブロック(CB)と、同じサイズのフレームの色差サンプルの2つの対応する符号化ブロックと、符号化ブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。白黒ピクチャ又は3つの個別のカラープレーンを有するピクチャでは、CUは、単一の符号化ブロックと、符号化ブロックのサンプルを符号化するのに使用されるシンタックス構造とを含み得る。
図4C及び
図4Dに表された四分木分割は単なる説明のためのものであり、1つのCTUが、様々な局所的特性に適合するように、四分木分割/三分木分割/二分木分割に基づいてCUに分割され得ることに留意されたい。複合の木構造では、1つのCTUが四分木構造によって分割され、各四分木の葉CUが二分木構造及び三分木構造によってさらに分割され得る。
図4Eに示されるように、4分割、水平2分割、垂直2分割、水平3分割、垂直3分割といった5つの分割タイプがある。
【0063】
いくつかの実施形態では、ビデオ符号化器20は、CUの符号化ブロックを1つ以上のM×Nの予測ブロック(PB)へとさらに分割し得る。予測ブロックは、同一の(インター又はイントラ)予測が適用されるサンプルの矩形状(正方形又は非正方形)のブロックである。CUの予測ユニット(PU)は、輝度サンプルの予測ブロックと、色差サンプルの2つの対応する予測ブロックと、予測ブロックを予測するのに使用されるシンタックス要素とを含み得る。白黒ピクチャ又は3つの個別のカラープレーンを有するピクチャでは、PUは、単一の予測ブロックと、予測ブロックを予測するのに使用されるシンタックス構造とを含み得る。ビデオ符号化器20は、CUの各PUにおける、予測輝度、輝度に関するCb及びCrブロック、並びに、Cb及びCr予測ブロックを生成し得る。
【0064】
ビデオ符号化器20は、PUに関する予測ブロックを生成するためにイントラ予測又はインター予測を使用してよい。ビデオ符号化器20がイントラ予測を使用してPUの予測ブロックを生成する場合には、ビデオ符号化器20はPUに関連したフレームの復号サンプルに基づいてPUの予測ブロックを生成し得る。ビデオ符号化器20がインター予測を使用してPUの予測ブロックを生成する場合には、ビデオ符号化器20はPUに関連したフレーム以外の1つ以上のフレームの復号サンプルに基づいてPUの予測ブロックを生成
し得る。
【0065】
ビデオ符号化器20は、CUにおける1つ以上のPUに関する予測輝度ブロック、予測Cbブロック及び予測Crブロックを生成した後に、CUの輝度残差ブロックにおける各サンプルがCUの予測輝度ブロックのうちの1つにおける輝度サンプルとCUの元の輝度符号化ブロックにおける対応するサンプルとの間の差分を示すように、CUの元の輝度符号化ブロックからCUの予測輝度ブロックを差し引くことによって、CUに関する輝度残差ブロックを生成し得る。同様に、ビデオ符号化器20は、CUのCb残差ブロックにおける各サンプルが、CUの予測Cbブロックのうちの1つにおけるCbサンプルとCUの元のCb符号化ブロックにおける対応するサンプルとの間の差分を示すように、CUのCb残差ブロック及びCr残差ブロックをそれぞれ生成してよく、CUのCr残差ブロックにおける各サンプルが、CUの予測Crブロックのうちの1つにおけるCrサンプルとCUの元のCr符号化ブロックにおける対応するサンプルとの間の差分を示し得る。
【0066】
その上、
図4Cに示されるように、ビデオ符号化器20は、四分木分割を使用して、CUの輝度、Cb及びCrの残差ブロックを、1つ以上の輝度、Cb及びCrの変換ブロックへと分解する。変換ブロックは、同一の変換が適用されるサンプルの矩形(正方形又は非正方形)のブロックである。CUの変換ユニット(TU)は、輝度サンプルの変換ブロックと、色差サンプルの2つの対応する変換ブロックと、変換ブロックサンプルを予測するのに使用されるシンタックス要素とを含み得る。したがって、CUの各TUは、輝度変換ブロック、Cb変換ブロック、及びCr変換ブロックに関連づけられ得る。いくつかの例では、TUに関連した輝度変換ブロックはCUの輝度残差ブロックのサブブロックであり得る。Cb変換ブロックは、CUのCb残差ブロックのサブブロックであり得る。Cr変換ブロックは、CUのCr残差ブロックのサブブロックであり得る。白黒ピクチャ又は3つの個別のカラープレーンを有するピクチャでは、TUは、単一の変換ブロックと、変換ブロックのサンプルを変換するのに使用されるシンタックス構造とを含み得る。
【0067】
ビデオ符号化器20は、TUの輝度変換ブロックに1つ以上の変換を適用してTU用の輝度係数ブロックを生成し得る。係数ブロックは変換係数の2次元配列であり得る。変換係数はスカラー量であり得る。ビデオ符号化器20は、TUのCb変換ブロックに1つ以上の変換を適用してTU用のCb係数ブロックを生成し得る。ビデオ符号化器20は、TUのCr変換ブロックに1つ以上の変換を適用してTU用のCr係数ブロックを生成し得る。
【0068】
ビデオ符号化器20は、係数ブロック(たとえば輝度係数ブロック、Cb係数ブロック又はCr係数ブロック)を生成した後に係数ブロックを量子化し得る。量子化は、一般に、変換係数を表すために使用されるデータ量をどうにかして低減するために変換係数が量子化されるプロセスを指すものであり、さらなる圧縮をもたらす。ビデオ符号化器20は、係数ブロックを量子化した後に、量子化変換係数を示すシンタックス要素をエントロピー符号化し得る。たとえば、ビデオ符号化器20は量子化変換係数を示すシンタックス要素に対してコンテキスト適応型2値算術符号化(CABAC)を実行し得る。最終的に、ビデオ符号化器20は、符号化フレーム及び関連するデータの表現を形成する一連のビットを含むビットストリームを出力し得、これは記録装置32に保存されるか又は送信先装置14に伝送される。
【0069】
ビデオ復号器30は、ビデオ符号化器20によって生成されたビットストリームを受け取った後に、ビットストリームを解析して、ビットストリームからシンタックス要素を取得し得る。ビデオ復号器30は、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいてビデオデータのフレームを再構成し得る。ビデオデータを再構成するプロセスは、一般にビデオ符号化器20によって実行された符号化プロセスの逆の
である。たとえば、ビデオ復号器30は、現在のCUのTUに関連した係数ブロックに対する逆変換を実行して、現在のCUのTUに関連した残差ブロックを再構成し得る。ビデオ復号器30はまた、現在のCUのPUに関する予測ブロックのサンプルを、対応する現在のCUのTUの変換ブロックのサンプルに加算することによって現在のCUの符号化ブロックを再構成する。ビデオ復号器30は、フレームの各CUに関する符号化ブロックを再構成した後にフレームを再構成し得る。
【0070】
前述のように、ビデオ符号化は、主としてイントラフレーム予測(すなわちイントラ予測)及びインターフレーム予測(すなわちインター予測)の2つのモードを使用してビデオ圧縮を達成するものである。パレットベースの符号化は、多くのビデオコーディング規格によって採用されている別の符号化方式である。パレットベースの符号化は、スクリーンに生成されたコンテンツを符号化するのに特に適し、この方式では、ビデオコーダ(たとえばビデオ符号化器20又はビデオ復号器30)が、所与のブロックのビデオデータを表現する色のパレットテーブルを形成する。パレットテーブルは、所与のブロックの中で最も優勢な(たとえば頻繁に使用される)画素値を含む。所与のブロックのビデオデータにおいて頻繁に表現されない画素値は、パレットテーブルに含まれないか、又は回避色としてパレットテーブルに含まれる。
【0071】
パレットテーブルの各エントリは、パレットテーブルの中の対応する画素値に関するインデックスを含む。ブロックの中のサンプルに関するパレットインデックスは、サンプルを予測するか又は再構成するために使用されるパレットテーブルのエントリを示すように符号化され得る。このパレットモードは、ピクチャ、スライス、タイル、又はビデオブロックのそのようなグループ化の最初のブロックに関するパレット予測子を生成するプロセスから始まる。以下で説明されるように、後続のビデオブロックに関するパレット予測子は、一般的には、以前に使用されたパレット予測子を更新することによって生成される。例示のために、パレット予測子はピクチャレベルで定義されると想定されている。言い換えれば、ピクチャは、それぞれが固有のパレットテーブルを有する複数の符号化ブロックを含み得るが、全体のピクチャに関する1つのパレット予測子がある。
【0072】
ビデオビットストリームにおけるパレットエントリの信号伝達に必要なビット数を低減するために、ビデオ復号器は、ビデオブロックを再構成するために使用されるパレットテーブルの新しいパレットエントリを決定するためにパレット予測子を利用し得る。たとえば、パレット予測子は、以前に使用されたパレットテーブルからのパレットエントリを含んでよく、あるいは、つい最近使用されたパレットテーブルのすべてのエントリを含むことにより、つい最近使用されたパレットテーブルを用いて初期化されてもよい。いくつかの実施形態では、パレット予測子は、つい最近使用されたパレットテーブルからのすべてのエントリよりも少ないエントリを含み、次いで、以前に使用された他のパレットテーブルからのいくつかのエントリを組み込んでもよい。パレット予測子のサイズは、異なるブロックを符号化するために使用されるパレットテーブルのサイズと比較して、同一でも、より大きくても、より小さくてもよい。一例では、パレット予測子は、64のパレットエントリを含む先入れ先出し(FIFO)テーブルとして実現される。
【0073】
パレット予測子からのビデオデータのブロックに関するパレットテーブルを生成するために、ビデオ復号器は、符号化ビデオビットストリームから、パレット予測子の各入力について1ビットのフラグを受け取り得る。1ビットのフラグは、パレット予測子の関連する入力がパレットテーブルの中に含まれることを示す第1の値(たとえば2進数の1)又はパレット予測子の関連する入力がパレットテーブルの中に含まれないことを示す第2の値(たとえば2進数の0)を有し得る。パレット予測子のサイズがビデオデータのブロック用に使用されるパレットテーブルよりも大きい場合には、ビデオ復号器は、一旦パレットテーブルの最大サイズに達したら、さらにフラグを受け取ることを停止してよい。
【0074】
いくつかの実施形態では、パレットテーブルのいくつかのエントリは、パレット予測子を使用して決定されるのではなく、符号化ビデオビットストリームにおいて直接信号伝達され得る。そのようなエントリについて、ビデオ復号器は、符号化ビデオビットストリームから、エントリに関連した輝度成分及び2つの色差成分に関する画素値を示す3つの個別のmビットの値を受け取り得、mはビデオデータのビット深度を表現する。直接信号伝達されるパレットエントリのために複数のmビットの値が必要とされるのに対して、パレット予測子から導出されるパレットエントリが必要とするのは1ビットのフラグのみである。したがって、パレット予測子を使用してパレット入力のいくつか又はすべてを信号伝達すれば、新規のパレットテーブルの入力を信号伝達するために必要なビット数をかなり低減することができ、それによって、パレットモード符号化の全体的な符号化効率を改善する。
【0075】
多くの事例において、1つのブロックに関するパレット予測子は、以前に符号化された1つ以上のブロックを符号化するために使用されたパレットテーブルに基づいて決定される。しかし、ピクチャ、スライス又はタイルにおける最初の符号化ツリーユニットを符号化するときには、以前に符号化されたブロックのパレットテーブルを利用できない可能性がある。したがって、以前に使用されたパレットテーブルのエントリを使用してパレット予測子を生成することはできない。そのような場合には、以前に使用されたパレットテーブルが利用できないときにパレット予測子を生成するために使用された値である、一連のパレット予測子の初期化指定子が、シーケンスパラメータセット(SPS)及び/又はピクチャパラメータセット(PPS)において信号伝達されてよい。SPSは、一般に、各スライスセグメントヘッダに見られるシンタックス要素によって参照されるPPSに見られるシンタックス要素のコンテンツによって決定されたものとして、符号化ビデオシーケンス(CVS)と呼ばれる一連の連続した符号化ビデオピクチャに適合するシンタックス要素のシンタックス構造を指す。PPSは、一般に、各スライスセグメントヘッダに見られるシンタックス要素によって決定されたものとして、CVSの内部の1つ以上の個々のピクチャに適合するシンタックス要素のシンタックス構造を指す。したがって、SPSは、一般にPPSよりも上位のレベルのシンタックス構造とみなされ、SPSに含まれるシンタックス要素は、一般にそれほど頻繁に変化せず、PPSに含まれるシンタックス要素と比較して、ビデオデータのより大きい部分に適合することを意味する。
【0076】
図5A~
図5Bは、本開示のいくつかの実装形態に従って、RGB色空間とYCgCo色空間との間の残差を変換するための適応型色空間変換(ACT)の技術を適用する例を示すブロック図である。
【0077】
HEVCスクリーンコンテンツ符号化拡張では、残差を1つの色空間(たとえばRGB)から別の色空間(たとえばYCgCo)へと適応的に変換するために、3つの色成分(たとえばR、G、及びB)の間の相関(たとえば冗長性)がYCgCo色空間では大幅に低減されるように、ACTが適用される。さらに、既存のACT設計では、異なる色空間の適合は、各TUにつき1つのフラグtu_act_enabled_flagを信号伝達することによって変換ユニット(TU)レベルで実行される。フラグtu_act_enabled_flagが1であると、現在のTUの残差がYCgCo空間において符号化されることを示し、そうでなければ(すなわちフラグが0であれば)、現在のTUの残差が元の色空間において(すなわち色空間変換なしで)符号化されることを示す。加えて、現在のTUが無損失モードで符号化されるのかそれとも損失モードで符号化されるのかということに依拠して、別々の色空間変換式が適用される。具体的には、RGB色空間とYCgCo色空間との間の、損失モード用の順方向及び逆方向の色空間変換式が、
図5Aに定義されている。
【0078】
無損失モード用には、RGB-YCgCo変換(YCgCo-LSとしても知られている)の可逆バージョンが使用される。RGB-YCgCo変換の可逆バージョンは、
図5B及び関連する記述で表現されたリフティング操作に基づいて実施される。
【0079】
図5Aに示されるように、損失モードで使用される順方向及び逆方向の色変換マトリクスは正規化されない。したがって、色変換が適用された後のYCgCo信号は元の信号よりも小さい。順方向色変換による大きさの縮小を補償するために、YCgCo領域における残差に対して、調節された量子化パラメータが適用される。具体的には、色空間変換が適用されるとき、YCgCo領域の残差を量子化するために使用されるQP
Y、QP
Cg及びQP
CoといったQP値が、それぞれQP-5、QP-5及びQP-3に設定され、QPは元の色空間で使用された量子化パラメータである。
【0080】
図6は、本開示のいくつかの実装形態に従って、例示的なビデオデータ復号プロセスにおいて色差スケーリング付き輝度マッピング(LMCS)の技術を適用するブロック図である。
【0081】
VVCでは、ループ内フィルタ(たとえばデブロッキングフィルタ、SAO及びALF)以前に適用される新規の符号化ツールとしてLMCSが使用される。一般に、LMCSは、1)適応型区分線形モデルに基づく、輝度成分のループ内マッピングと、2)輝度依存の色差残差スケーリングとの、2つの主要なモジュールを有する。
図6は、LMCSが適用される、変更された復号プロセスを示す。
図6において、マッピングされた領域において処理される復号モジュールは、エントロピー復号モジュール、逆量子化モジュール、逆変換モジュール、輝度イントラ予測モジュール、及び輝度サンプル再構成モジュール(すなわち輝度予測サンプルと輝度残差サンプルとの加算)を含む。元の(すなわちマッピングされていない)領域において処理される復号モジュールは、動き補償予測モジュール、色差イントラ予測モジュール、色差サンプル再構成モジュール(すなわち色差予測サンプルと色差残差サンプルとの加算)、並びにデブロッキングモジュール、SAOモジュール、及びALFモジュールなどのすべてのループ内フィルタモジュールを含む。LMCSによって導入された新規の使用可能なモジュールは、輝度サンプルの順方向マッピングモジュール610、輝度サンプルの逆方向マッピングモジュール620、及び色差残差スケーリングモジュール630を含む。
【0082】
LMCSのループ内マッピングは、入力信号のダイナミックレンジを調整して符号化効率を改善することができる。既存のLMCS設計における輝度サンプルのループ内マッピングは、1つの順方向マッピング機能FwdMapと1つの対応する逆方向マッピング機能InvMapとの2つのマッピング機能の上に構築される。順方向マッピング機能は、16の等しいサイズの部分を有する1つの区分線形モデルを使用して、符号化器から復号器まで信号伝達される。逆方向マッピング機能は、順方向マッピング機能から直接導出され得、したがって信号伝達される必要はない。
【0083】
輝度マッピングモデルのパラメータは、スライスレベルにおいて信号伝達される。現在のスライスについて輝度マッピングモデルが信号伝達されるべきかどうかを示すために、存在フラグが最初に信号伝達される。現在のスライスに輝度マッピングモデルが存在する場合には、対応する区分線形モデルパラメータがさらに信号伝達される。加えて、スライスに関するLMCSを有効/無効にするために、スライスレベルにおいて別のLMCS制御フラグが信号伝達される。
【0084】
色差残差スケーリングモジュール630は、輝度信号にループ内マッピングが適用されるとき、輝度信号と、その対応する色差信号との間の量子化精度の相互作用を補償するように設計されている。現在のスライスについて色差残差スケーリングが有効か無効かとい
うことも、スライスヘッダにおいて信号伝達される。輝度マッピングが有効であれば、輝度依存の色差残差スケーリングが適用されるか否かを示す追加フラグが信号伝達される。輝度マッピングが使用されないとき、輝度依存の色差残差スケーリングは常に無効にされ、追加フラグは不要である。加えて、色差残差スケーリングは、含有している色差サンプルが4つ以下のCUについては常に無効にされる。
【0085】
図7は、本開示のいくつかの実装形態に従って、ビデオ復号器が逆方向の適応型色空間変換(ACT)の技術を実施する例示的なビデオ復号プロセスを示すブロック図である。
【0086】
VVCにおけるACTは、HEVC SCCにおけるACT設計と同様に、元の色空間
(たとえばRGB色空間)からの4:4:4色差フォーマットの1つのCUのイントラ/インター予測残差を、YCgCo色空間に変換する。結果として、3つの色成分の間の冗長性が、より優れた符号化効率に向けて低減され得る。
図7は、VVC構成に逆ACTモジュール710を追加することによって逆ACTが適用される様子を示す、復号の流れ図を表すものである。ACTを有効にして符号化されたCUを処理するとき、CUに対して、最初に、エントロピー復号、逆方向量子化、及び逆方向DCT/DSTベースの変換を適用する。その後、
図7に表されるように、逆ACTが呼び出されて、復号残差を、YCgCo色空間から元の色空間(たとえばRGBやYCbCr)に変換する。加えて、損失モードではACTは正規化されないので、変換された残差の大きさの変化を補償するために、Y、Cg及びCo成分に対して(-5、-5、-3)のQP調整が適用される。
【0087】
いくつかの実施形態では、ACT方法は、異なる色空間の間の色変換を行うためにHEVCの同一のACTコア変換を再利用する。具体的には、現在のCUの符号化における損失の有無に依拠して、色変換の2つの異なるバージョンが適用される。損失がある場合の順方向や逆方向の色変換は、
図5Aに表されるような不可逆YCgCo変換マトリクスを使用する。無損失の場合には、
図5Bに示されるように可逆色変換YCgCo-LSが適用される。その上に、既存のACT設計と異なり、ACT方式に対して、VVC規格における、ACT方式の、他の符号化ツールとの相互作用を扱うための以下の変更が導入される。
【0088】
たとえば、HEVCにおける1つのCUの残差が複数のTUへと分割される可能性があるので、色空間変換を適用する必要性の有無を示すために、各TUについて、別個に、ACT制御フラグが信号伝達される。しかしながら、
図4Eに関連して上記で説明されたように、VVCにおいて、複数の分割タイプの概念を置換するために、2分割構造及び3分割構造をネストされた1つの四分木が適用され、それにより、HEVCにおける個別のCU分割、PU分割及びTU分割を除去する。これは、ほとんどの場合、サポートされる最大の変換サイズがCUの1つの成分の幅又は高さよりも小さくなければ、さらなる分割なしの予測及び変換処理のユニットとして1つのCUリーフノードも使用されることを意味する。そのような分割構造を基に、ACTは、CUレベルで適応的に有効/無効にされ得る。具体的には、CUの残差を符号化するために、各CUについて、元の色空間とYCgCo色空間との間を選択するように、1つのフラグcu_act_enabled_flagが信号伝達される。このフラグが1であれば、CUの内部のTUの残差のすべてがYCgCo色空間において符号化されることを示す。そうでなければ、フラグcu_act_enabled_flagが0であれば、CUのすべての残差が元の色空間において符号化される。
【0089】
いくつかの実施形態では、ACTを無効にする種々のシナリオがある。ACTは、1つのCUに対して有効にされると、色空間変換を行うために、すべての3つの成分の残差にアクセスする必要がある。しかしながら、VVC設計は、各CUが3つの成分の情報を常に含有していることを保証できるわけではない。本開示の実施形態によれば、CUがすべ
ての3つの成分の情報を含有しているわけではない場合、ACTは強制的に無効にされる。
【0090】
いくつかの実施形態において、第1に、個別のツリーの分割構造が適用されるとき、1つのCTUの内部の輝度サンプル及び色差サンプルは、個別の分割構造を基にCUへと分割される。結果として、輝度分割ツリーにおけるCUは輝度成分の符号化情報のみを含有し、色差分割ツリーにおけるCUは2つの色差成分の符号化情報のみを含有する。現行のVVCによれば、1つのツリーの分割構造と個別のツリーの分割構造との間の切換えはスライスレベルにおいて実行される。したがって、本開示の実施形態によれば、1つのスライスに個別のツリーが適用されることが認められたとき、ACTは、このスライスの内部のすべてCU(輝度CUと色差CUとの両方)に対してACTフラグの信号伝達なしで常に無効にされ、ACTフラグは、その代わりにゼロであると推論される。
【0091】
いくつかの実施形態において、第2に、ISPモード(以下でさらに説明される)が有効にされるとき、TU分割は輝度サンプルにのみ適用され、色差サンプルは、複数のTUへのさらなる分割はなしで符号化される。1つのイントラCUに関するISPサブパーティション(すなわちTU)の数をNと想定すると、現行のISP設計によれば、輝度成分と色差成分との両方を含有しているのは最後のTUのみであり、最初のN-1個のISPTUは輝度成分のみから成る。本開示の一実施形態によれば、ISPモードではACTは無効にされる。ISPモードについて、ACTを無効にするやり方は2つある。第1の方法では、ISPモードのシンタックスを信号伝達する前にACTの有効/無効フラグ(すなわちcu_act_enabled_flag)が信号伝達される。そのような場合、フラグcu_act_enabled_flagが1のとき、ISPモードはビットストリームで信号伝達されることなく、常に、ゼロ(すなわちオフ)であると推測される。第2の方法では、ISPモードの信号伝達が、ACTフラグの信号伝達を回避するように使用される。具体的には、この方法では、ISPモードは、フラグcu_act_enabled_flagに先立って信号伝達される。ISPモードが選択されるとき、フラグcu_act_enabled_flagは信号伝達されず、ゼロであると推論される。そうでなければ(ISPモードが選択されなければ)、フラグcu_act_enabled_flagは、CUの残差コーディングのために色空間を適応的に選択するように、依然として信号伝達される。
【0092】
いくつかの実施形態では、輝度と色差との分割構造が誤って調整されているとき、CUに対するACTを強制的に無効にすることに加えて、ACTが適用されるCUに対するLMCSが無効にされる。一実施形態では、1つのCUがその残差を符号化するYCgCo色空間を選択するとき、輝度マッピングと色差残差スケーリングとの両方が無効にされる(すなわちACTは1つである)。別の実施形態では、ACTが1つのCUについて有効にされるとき、無効にされるのは色差残差スケーリングのみであり、輝度マッピングは、出力輝度サンプルのダイナミックレンジを調整するために引き続き適用され得る。最後の実施形態では、その残差の符号化のためにACTを適用するCUに対して、輝度マッピングと色差残差スケーリングとの両方が有効にされる。ACTを適用するCUに対して色差残差スケーリングを有効にするための複数のやり方があり得る。方法の1つでは、色差残差スケーリングは、復号において逆ACT以前に適用される。この方法は、ACTが適用されるとき、YCgCo領域における色差残差(すなわちCg残差及びCo残差)に色差残差スケーリングが適用されることを意味する。別の方法では、色差残差スケーリングは、逆ACTの後に適用される。具体的には、第2の方法では、色差スケーリングは元の色空間における残差に対して適用される。入力ビデオがRGBフォーマットで取り込まれていると想定することは、B成分及びR成分の残差に対して色差残差スケーリングが適用されることを意味する。
【0093】
いくつかの実施形態では、シーケンスレベルにおいてACTが有効にされるか否かを示すために、シンタックス要素に対して、たとえばsps_act_enabled_flagといったシーケンスパラメータセット(SPS)が付加される。加えて、輝度成分と色差成分とが同一の解像度(たとえば4:4:4色差フォーマット)を有するビデオコンテンツに対して色空間変換が適用されるとき、ACTは4:4:4色差フォーマットに対してのみ有効にされ得るように、1つのビットストリームの適合要件が付加される必要がある。テーブル1は、上記のシンタックスが付加された修正SPSシンタックステーブルを示す。
【0094】
【0095】
具体的には、sps_act_enabled_flagが1であればACTが有効にされたことを示し、sps_act_enabled_flagが0であれば、SPSを参照するCUに対してフラグcu_act_enabled_flagが信号伝達されず、0であると推論されるように、ACTが無効にされたことを示す。ChromaArrayTypeが3でないとき、sps_act_enabled_flagの値が0であることがビットストリーム適合の要件である。
【0096】
別の実施形態では、sps_act_enabled_flagを常に信号伝達する代わりに、フラグの信号伝達は色差タイプの入力信号を条件とする。具体的には、ACTが適用され得るのは、輝度成分と色差成分とが同一の解像度であるときのみであるなら、フラグsps_act_enabled_flagが信号伝達されるのは、入力ビデオが4:4:4色差フォーマットで取り込まれるときのみである。そのような変更による修正SPSシンタックステーブルは次のようになる。
【0097】
【0098】
いくつかの実施形態では、ACTを使用してビデオデータを復号するためのシンタック
ス設計仕様は、以下のテーブルに示される。
【0099】
【表3-1】
【表3-2】
【表3-3】
【表3-4】
【表3-5】
【表3-6】
【表3-7】
【表3-8】
【表3-9】
【0100】
フラグcu_act_enabled_flagが1であれば、符号化ユニットの残差がYCgCo色空間において符号化されることを示し、フラグcu_act_enabled_flagが0であれば、符号化ユニットの残差が元の色空間(たとえばRGB又はYCbCr)において符号化されることを示す。フラグcu_act_enabled_flagは、存在しないときには0であると推論される。
【0101】
現行のVVC作業草案では、入力ビデオが4:4:4色差フォーマットで取り込まれるとき、輝度成分と色差成分との両方に対して変換スキップモードが適用され得る。いくつかの実施形態では、そのような設計を基に、以下では、ACTと変換スキップとの間の相互作用を扱うために3つの方法が使用される。
【0102】
方法の1つでは、1つのACT・CUに対して変換スキップモードが有効にされるとき、変換スキップモードは輝度成分にのみ適用され、色差成分には適用されない。いくつかの実施形態では、そのような方法に関するシンタックス設計仕様は、次のテーブルに示される。
【0103】
【0104】
別の方法では、輝度成分と色差成分との両方に対して変換スキップモードが適用される。いくつかの実施形態では、そのような方法に関するシンタックス設計仕様は、次のテーブルに示される。
【0105】
【0106】
もう一つの方法では、ACTが1つのCUに対して有効にされるとき、変換スキップモードは常に無効にされる。いくつかの実施形態では、そのような方法に関するシンタックス設計仕様は、次のテーブルに示される。
【0107】
【0108】
図8A及び
図8Bは、本開示のいくつかの実装形態に従って、ビデオ復号器が逆方向の適応型色空間変換(ACT)及び色差スケーリング付き輝度マッピングの技術を実施する例示的なビデオ復号プロセスを示すブロック図である。いくつかの実施形態では、ビデオビットストリームは、ACT(たとえば
図7における逆ACT710)と色差残差スケーリング(たとえば
図6における色差残差スケーリング630)との両方を使用して符号化される。いくつかの他の実施形態では、ビデオビットストリームは、ACTは使用せず色差残差スケーリングのみ使用して符号化され、それによって逆ACT710は不要になる。
【0109】
より具体的には、
図8Aは、ビデオ符号化器が逆ACT710の前に色差残差スケーリング630を実行する一実施形態を表す。結果として、ビデオ符号化器は、色空間変換された領域において、色差残差スケーリング630を用いて輝度マッピングを実行する。たとえば、入力ビデオがRGBフォーマットで取り込まれ、YCgCo色空間に変換されると想定して、ビデオ符号化器は、YCgCo色空間における輝度残差Yに応じて、色差残差Cg及びCoに対する色差残差スケーリング630を実行する。
【0110】
図8Bは、ビデオ符号化器が、逆ACT710の後に色差残差スケーリング630を実行する代替実施形態を表す。結果として、ビデオ符号化器は、元の色空間領域において、色差残差スケーリング630を用いて輝度マッピングを実行する。たとえば、入力ビデオがRGBフォーマットで取り込まれていると想定して、ビデオ符号化器は、B成分及びR成分に対して色差残差スケーリングを適用する。
【0111】
図9は、本開示のいくつかの実装形態に従って、適応型色空間変換(ACT)の実行とブロック差分パルス符号化変調(BDPCM)の実行との間の例示的な復号ロジックを示すブロック図である。
【0112】
BDPCMはスクリーンコンテンツ符号化用の符号化ツールである。いくつかの実施形態では、BDPCM有効化フラグは、シーケンスレベルにおいてSPSで信号伝達される。BDPCM有効化フラグが信号伝達されるのは、SPSにおいて変換スキップモードが有効にされた場合のみである。
【0113】
BDPCMが有効にされるとき、輝度サンプルに関してCUサイズがMaxTsSize×MaxTsSize以下であって、CUがイントラ符号化される場合には、フラグはCUレベルで送られ、MaxTsSizeは変換スキップモードが可能にされる最大のブロックサイズである。このフラグは、通常のイントラ符号化又はBDPCMが使用されるかどうかを示す。BDPCMが使用される場合、予測が水平方向かそれとも垂直方向かを示すための別のBDPCM予測方向フラグがさらに伝送される。次いで、ブロックは、フィルタリングされていない参照サンプルを用いる通常の水平方向又は垂直方向のイントラ予測プロセスを使用して予測される。残差が量子化され、それぞれの量子化残差とその予測子との間の差、すなわち(BDPCM予測方向に依拠して)水平方向又は垂直方向の近隣の位置の以前に符号化された残差が、符号化される。
【0114】
サイズがM(高さ)×N(幅)のブロックに関して、0≦i≦M-1、0≦j≦N-1であるr
i,jを予測残差とする。0≦i≦M-1、0≦j≦N-1であるQ(r
i,j)は、残差r
i,jの量子化バージョンを表すものとする。量子化残差値に対してBDPCMが適用されて、修正されたM×Nの配列
【数1】
が得られ、この配列の要素は
【数2】
である。
ここで、
【数3】
は、その近隣の量子化残差値から予測される。垂直方向のBDPCM予測モードに関して、0≦j≦(N-1)について、
【数4】
を導出するために次式が使用される。
【数5】
【0115】
水平方向のBDPCM予測モードに関して、0<i<(M-1)について、
【数6】
を導出するために次式が使用される。
【数7】
【0116】
復号器側で、Q(r
i,j)、0≦i≦M-1、0≦j≦N-1を計算するために、上記のプロセスは、次のとおりに逆になされる。
【数8】
【0117】
再構成されたサンプル値を生成するために、イントラブロック予測値に対して逆量子化残差Q-1(Q(ri,j))が加算される。
【0118】
予測された量子化残差値
【数9】
は、変換スキップモードの残差符号化で使用されたものと同一の残差符号化プロセスを使用して、復号器に送られる。将来のイントラモード符号化用のMPMモードの点では、BDPCM予測方向が水平方向又は垂直方向の場合、それぞれ水平方向又は垂直方向の予測モードがBDPCM符号化CU用に記憶される。デブロッキングについては、両側のブロック境界のブロックがBDPCMを使用して符号化されている場合には、その特定のブロック境界はデブロッキングされない。最新のVVC作業草案によれば、入力ビデオが4:4:4色差フォーマットであるとき、輝度チャネル用のフラグintra_bdpcm_luma_flag及び色差チャネル用のintra_bdpcm_chroma_flagをCUレベルで信号伝達することにより、輝度成分と色差成分との両方にBDPCMが適用され得る。
【0119】
いくつかの実施形態では、ビデオ符号化器は、ACTとBDPCMとの間の相互作用を扱うための種々のロジックを実行する。たとえば、ACTが1つのイントラCUに適用されるとき、BDPCMは輝度成分に対して有効にされるが、色差成分には無効にされる(910)。いくつかの実施形態では、ACTが1つのイントラCUに適用されるとき、BDPCMは輝度成分に対して有効にされるが、色差成分用のBDPCMの信号伝達には無効にされる。色差BDPCMの信号伝達が回避されるとき、一実施形態では、intra_bdpcm_chroma_flag及びintra_bdpcm_chroma_dirの値は、輝度成分のもの、すなわちintra_bdpcm_flag及びintra_bdpcm_dir_flagと等しい(すなわち、色差BDPCM用に輝度のBDPCM方向と同一のものを使用する)。別の実施形態では、intra_bdpcm_chroma_flag及びintrra_bdpcm_chroma_dir_flagの値は、ACTモード用に信号伝達されるときにはゼロに設定される(すなわち、色差成分については色差BDPCMモードを無効にする)。符号化ユニットの対応する修正シン
タックステーブルは次のように示される。
【0120】
【0121】
いくつかの実施形態では、ACTが1つのイントラCUに適用されるとき、BDPCMは輝度成分と色差成分との両方に対して有効にされる(920)。符号化ユニットの対応する修正シンタックステーブルは次のように示される。
【0122】
【0123】
いくつかの実施形態では、ACTが1つのイントラCUに適用されるとき、BDPCMは輝度成分と色差成分との両方に対して無効にされる(930)。そのような場合、BDPCMに関連するシンタックス要素を信号伝達する必要はない。符号化ユニットの対応する修正シンタックステーブルは次のように示される。
【0124】
【0125】
いくつかの実施形態では、ACTモード用に、1つの抑制された色差BDPCM信号伝達方法が使用される。具体的には、ACTが適用されるとき、色差BDPCMの有効/無効フラグすなわちintra_bdpcm_chroma_flagの信号伝達は、輝度BDPCMの存在、すなわちintra_bdpcm_flagを条件として調整される。フラグintra_bdpcm_chroma_flagが信号伝達されるのは、フラグintra_bdpcm_flagが1のとき(すなわち輝度BDPCMモードが有効なとき)のみである。そうでなければ、フラグintra_bdpcm_chroma_flagはゼロと推論される(すなわち色差BDPCMは無効にされる)。フラグintra_bdpcm_chroma_flagが1のとき(すなわち色差BDPCMが有効にされるとき)、色差成分に対して適用されるBDPCMの方向は、常に輝度BDPCMの方向と等しく設定され、すなわち、フラグintra_bdpcm_chroma_dir_flagの値は、常にintra_bdpcm_dir_flagの値と等しく設
定される。符号化ユニットの対応する修正シンタックステーブルは、次のように示される。
【0126】
【0127】
いくつかの実施形態では、ACTが適用されるとき、色差BDPCMモードの信号伝達は、intra_bdpcm_flagの値に基づいてフラグintra_bdpcm_chroma_flagの存在を調整するのではなく、輝度成分のイントラ予測モードが水平方向又は垂直方向のとき条件付きで有効にされる。具体的には、この方法によれば、フラグintra_bdpcm_chroma_flagが信号伝達されるのは、輝度イントラ予測方向が純粋に水平又は垂直のときのみである。そうでなければ、フラグintra_bdpcm_chroma_flagはゼロと推論される(色差BDPCMが無効にされることを意味する)。フラグintra_bdpcm_chroma_flagが1のとき(すなわち色差BDPCMが有効にされるとき)、色差成分に対して適用されるBDPCMの方向は、常に輝度イントラ予測の方向と等しく設定される。以下のテーブル
では、数字18及び50は、現行のVVC草案における水平方向及び垂直方向のイントラ予測の、現在のイントラ予測インデックスを表す。符号化ユニットの対応する修正シンタックステーブルは次のように示される。
【0128】
【0129】
いくつかの実施形態では、輝度/色差BDPCMモードに関するコンテキストモデリングが実施される。VVCにおける現行のBDPCM設計では、輝度成分及び色差成分に対するBDPCMの信号伝達は、同一のコンテキストモデリングを再利用する。詳細には、輝度BDPCM有効/無効フラグ(すなわちintra_bdpcm_flag)及び色差BDPCM有効/無効フラグ(すなわちintra_bdpcm_chroma_flag)によって1つの単一コンテキストが共有され、輝度BDPCM方向フラグ(すなわちintra_bdpcm_dir_flag)及び色差BDPCM方向フラグ(すなわちintra_bdpcm_chroma_dir_flag)によって別の単一コンテキストが共有される。
【0130】
いくつかの実施形態において、符号化効率を改善するために、方法の1つでは、輝度成分及び色差成分のBDPCM有効/無効を信号伝達するために個別のコンテキストが使用される。別の実施形態では、輝度成分及び色差成分について、BDPCM方向フラグを信号伝達するために個別のコンテキストが使用される。もう一つの実施形態では、色差BDPCMの有効/無効フラグを符号化するために、輝度BDPCMモードが有効にされるときintra_bdpcm_chroma_flagを信号伝達するために使用される第1のコンテキストと、輝度BDPCMモードが無効にされるときintra_bdpcm_chroma_flagを信号伝達するために使用される第2のコンテキストとの、2つ追加のコンテキストが使用される。
【0131】
いくつかの実施形態では、ACTは無損失符号化を用いて扱われる。HEVC規格では、1つのCUの無損失モードは、1に設定された1つのCUレベルフラグcu_transquant_bypass_flagを信号伝達することによって示される。しかしながら、進行中のVVC規格化プロセスでは、1つの異なる無損失有効化方法が適用される。具体的には、無損失モードにおいて1つのCUが符号化されるとき、必要なのは、変換をスキップして、1への量子化ステップサイズを使用することのみである。これは、CUレベルのQP値を1に信号伝達し、TUレベルのtransform_skip_flagを1に信号伝達することによって実現され得る。したがって、本開示の一実施形態では、1つのCU/TUに対して、損失ACTと無損失ACTとが、transform_skip_flagの値及びQP値に応じて切り換えられる。以下で示すように、フラグtransform_skip_flagが1であってQP値が4であれば無損失ACTが適用され、そうでなければ損失バージョンのACTが適用される。
【0132】
transform_skip_flagが1であってQPが4であれば、残差サンプルrY、rCb及びrCrの(nTbW)×(nTbH)の配列(x=0..nTbW-1、y=0..nTbH-1)は、
tmp=rY[x][y]-(rCb[x][y]>>1)
rY[x][y]=tmp+rCb[x][y]
rCb[x][y]=tmp-(rCr[x][y]>>1)
rCr[x][y]=rCb[x][y]+rCr[x][y]
と変更される。
【0133】
そうでなければ、残差サンプルrY、rCb及びrCrの(nTbW)×(nTbH)の配列(x=0..nTbW-1、y=0..nTbH-1)は、
tmp=rY[x][y]-rCb[x][y]
rY[x][y]=rY[x][y]+rCb[x][y]
rCb[x][y]=tmp-rCr[x][y]
rCr[x][y]=tmp+rCr[x][y]
と変更される。
【0134】
上記の記述では、損失符号化用と無損失符号化用とに別々のACTマトリクスが使用されている。もう1つの統合設計を実現するために、損失符号化と無損失符号化との両方に対して無損失ACTマトリクスが使用される。加えて、無損失ACTによってCg成分及びCo成分のダイナミックレンジが1ビット増加する場合には、順方向ACTの後に、Cg成分とCo成分とに対して追加の1ビット右シフトが適用され、逆ACTの前に、Cg成分とCo成分とに対して1ビット左シフトが適用される。以下に記述されるように、
【0135】
transform_skip_flagが0であるか、又はQPが4でない場合には、残差サンプルrCb及びrCrの(nTbW)×(nTbH)の配列(x=0..nT
bW-1、y=0..nTbH-1)は、
rCb[x][y]=rCb[x][y]<<1
rCr[x][y]=rCr[x][y]<<1
と変更される。
【0136】
残差サンプルrY、rCb及びrCrの(nTbW)×(nTbH)の配列(x=0..nTbW-1、y=0..nTbH-1)は、
tmp=rY[x][y]-(rCb[x][y]>>1)
rY[x][y]=tmp+rCb[x][y]
rCb[x][y]=tmp-(rCr[x][y]>>1)
rCr[x][y]=rCb[x][y]+rCr[x][y]
と変更される。
【0137】
加えて、上記から理解され得るように、ACTが適用されるとき、Y成分、Cg成分及びCo成分に対してQPオフセット(-5、-5、-3)が適用される。したがって、小さい入力QP値(たとえば<5)については、ACT係数の量子化/逆量子化用に、未定義の負のQPが使用されることになる。そのような問題を解決するために、適用されるQP値が常にゼロ以上であるように、ACTのQP調整の後に1つのクリッピング操作すなわちQP’=max(QPorg-QPoffset,0)が追加され、ここで、QPは元のQPであり、QPoffsetはACT・QPオフセットであって、QP’は調整されたQP値である。
【0138】
前述のような方法では、損失符号化と無損失符号化とに対して同一のACTマトリクス(すなわち無損失ACTマトリクス)が使用されるが、以下の2つの問題は依然として識別され得る。
【0139】
現在のCUが損失CUかそれとも無損失CUかということに依拠して、種々の逆ACT操作が引き続き適用される。具体的には、無損失CUには逆ACTが適用され、損失CUには、逆ACTの前に追加の右シフトが適用されなければならない。加えて、復号器は、現行のCUが損失モードと無損失モードとのどちらで符号化されているのか知る必要がある。これは現行のVVCの無損失設計と不整合である。詳細には、1つのCUの無損失モードは1つのcu_transquant_bypass_flagを信号伝達することで表されるHEVCの無損失設計と異なって、VVCにおける無損失符号化は1つの純粋な規範外のやり方で行われ、すなわち、(輝度成分及び色差成分に関する変換スキップモードを有効にして)予測残差の変換をスキップし、適切なQP値(すなわち4)を選択し、無損失符号化を妨げるループ内フィルタなどの符号化ツールを明示的に無効にする。
【0140】
ここで、ACTを正規化するために使用されるQPオフセットが固定される。しかしながら、符号化効率の点で最適なQPオフセットの選択は、コンテンツ自体に依拠する可能性がある。したがって、ACTツールが有効にされるとき、その符号化利得を最大化するために、融通性のあるQPオフセット信号伝達を有効にするのがより有益であろう。
【0141】
上記の考察に基づいて、1つの統合ACT設計が以下のように実施される。第1に、損失モードと無損失モードとの両方で符号化されたCUに対して、無損失ACT及び無損失逆ACTが適用される。第2に、固定されたQPオフセットを使用するのではなく、ビットストリームにおけるACT・CUに適用されるQPオフセット(すなわちY成分、Cg成分及びCo成分に適用される3つのQPオフセット)が、明示的に信号伝達される。第3に、ACT・CUに適用されるQPの可能性のあるオーバーフロー問題を防止するために、各ACT・CUの結果として生じるQPに対して、有効なQP範囲へのクリッピング操作が適用される。見られるように、上記の方法に基づいて、損失符号化と無損失符号化
との間の選択が、純粋に符号化器を変化させる(すなわち、別々の符号化器設定を使用する)だけで実現され得る。復号処理は、ACT・CUの損失符号化と無損失符号化とに対して同一である。具体的には、無損失符号化を有効にするために符号化器が必要とするのは、符号化器側の既存の無損失構成に加えて、3つのQPオフセットの値をゼロとして信号伝達することのみである。他方では、損失符号化を有効にするために、符号化器は非ゼロのQPオフセットを信号伝達し得る。たとえば、一実施形態では、損失符号化における無損失ACTによってもたらされるダイナミックレンジの変化を補償するために、ACTが適用されるとき、Y成分、Cg成分及びCo成分に対してQPオフセット(-5、1、3)が信号伝達され得る。他方では、ACT・QPオフセットは、たとえばシーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、ピクチャヘッダ、符号化ブロックグループのレベルなどといった種々の符号化レベルで信号伝達され得て、種々の細分性において種々のQP適合をもたらし得る。次のテーブルは、QPオフセット信号伝達がSPSで実行される一例を示す。
【0142】
【0143】
別の実施形態では、SPSまたはPPS(たとえばpicture_header_act_qp_offset_present_flag)において、1つの高レベルの制御フラグが加算される。このフラグがゼロであれば、SPS又はPPSで信号伝達されるQPオフセットが、ACTモードで符号化されたすべてのCUに適用されることを意味する。そうでなければ、フラグが1のとき、1つの特定のピクチャにおいてACT・CUに適用されるQP値を別個に制御するために、追加のQPオフセットシンタックス(たとえばpicture_header_y_qp_offset_plus5、picture_header_cg_qp_offset_minus1及びpicture_header_co_qp_offset_minus3)が、ピクチャヘッダでさらに信号伝達され得る。
【0144】
他方では、信号伝達されたQPオフセットは、最終的なACT・QP値を有効なダイナミックレンジへとクリップするためにも適用されるべきである。加えて、変換を用いて符号化されたCU及び変換なしで符号化されたCUに対して、種々のクリッピング範囲が適用され得る。たとえば、変換が適用されないとき、最終的なQPは4よりも小さくなるべきではない。ACT・QPオフセットがSPSレベルで信号伝達されると想定すると、ACT・CUのための対応するQP値の導出プロセスは、以下のように記述され得る。
【0145】
【0146】
別の実施形態では、符号化器が、符号化効率を改善するためにACT・CUに適用されるQPオフセットをより柔軟に調整することができるように、PPSレベルでACT・QPオフセットを信号伝達しているときに、ACT有効/無効フラグがSPSレベルで信号伝達される。具体的には、記述された変化を伴うSPS及びPPSのシンタックステーブルが次に示される。
【0147】
【0148】
pps_act_qp_offset_present_flagが1であることは、ビットストリームの中にpps_act_y_qp_offset_plus5、pps_act_cg_qp_offset_minus1及びpps_act_co_qp_offset_minus3が存在することを明示する。pps_act_qp_offset_present_flagが0のとき、ビットストリームには、シンタックス要素pps_act_y_qp_offset_plus5、pps_act_cg_qp_offset_minus1及びpps_act_co_qp_offset_minus3は存在しない。sps_act_enabled_flagが0のときpps_act_qp_offset_present_flagの値が0であることは、ビットストリーム準拠である。
【0149】
pps_act_y_qp_offset_plus5、pps_act_cg_qp_offset_minus1及びpps_act_co_qp_offset_minus3は、cu_act_enabled_flagが1である符号化ブロックの輝度成分及び色差成分に対して使用される量子化パラメータの値に適用されるオフセットを決定するために使用される。pps_act_y_qp_offset_plus5、pps_act_cg_qp_offset_minus1及びpps_act_cr_qp_offset_minus3は、存在しないとき、値が0であると推論される。
【0150】
上記のPPS信号伝達では、色差残差モードのジョイント符号化(JCCR)が適用されるか又は適用されないとき、各ACT・CUに同一のQPオフセット値が適用される。そのような設計は、1つの信号の色差成分の残差のみがJCCRモードで符号化される場合には、最適ではない可能性がある。したがって、より優れた1つの符号化利得を実現するために、1つのACT・CUにJCCRモードが適用されるとき、色差成分の残差を符号化するのに、別の1つのQPオフセットが適用されてよい。そのような考察に基づいて、JCCRモード用のPPSでは、以下に規定されるように、1つの個別のQPオフセット信号伝達が追加される。
【0151】
【0152】
ジョイント色差残差符号化が適用される符号化ブロックの色差残差用に使用される量子
化パラメータの値に適用されるオフセットを決定するために、pps_joint_cbcr_qp_offsetが使用される。pps_joint_cbcr_qp_offsetは、存在しないとき、値がゼロであると推論される。
【0153】
図10は、いくつかの実施形態において、輝度と色差とで内部のビット深度が異なるときにACTを扱う方法を示す。具体的には、
図10は、本開示のいくつかの実装形態に従って、輝度の内部ビット深度と色差の内部ビット深度とが異なるとき、別々の成分に対して別々のQPオフセットを適用する復号の流れ図である。
【0154】
既存のVVC仕様によれば、符号化のために、輝度成分と色差成分とに別々の内部ビット深度(BitDepthY及びBitDepthCと表される)を使用することが許容される。しかしながら、既存のACT設計は、輝度の内部ビット深度と色差の内部ビット深度とが常に同一であると想定する。以下の段落では、BitDepthYがBitDepthCと異なるときACT設計を改善するための方法が実現される。
【0155】
第1の方法では、輝度成分の内部のビット深度が色差成分のものと異なるとき、ACTツールは常に無効にされる。
【0156】
第2の方法では、第2の解決策において、輝度成分及び色差成分のうちビット深度が小さい方を左シフトして、ビット深度を他方の成分のビット成分と一致させることによって実施され、次いで、スケーリングされた成分は、色変換の後に、右へビットシフトすることによって元のビット深度へと再調整される。
【0157】
HEVCに似て、量子化ステップサイズは、QPの各増分で約2
1/6倍に増加し、6つの増分ごとに正確に2倍になる。そのような設計に基づき、第2の方法では、輝度と色差との間の内部ビット深度を補償するために、内部ビット深度が小さい方の成分に対して使用されるQP値が6Δだけ増加され、Δは、輝度の内部ビット深度と色差の内部ビット深度との間の差である。次いで、成分の残差は、Δビットの右シフトを適用することによって元のダイナミックレンジへとシフトされる。
図10は、上記の方法が適用されるときの対応する復号プロセスを示す。たとえば、入力QP値がqpであると想定すると、Y成分、Cg成分及びCo成分に対して適用されるデフォルトのQP値はqp-5、qp-5及びqp-3となる。さらに、輝度の内部ビット深度が色差のビット深度よりも大きく、Δ=BitDepthY-BitDepthCであると想定される。そこで、輝度成分及び色差成分に対して適用される最終的なQP値は、qp-5、qp-5+6Δ及びqp-3+6Δとなる。
【0158】
いくつかの実施形態では、符号化器の高速化ロジックが実施される。1つのCUの残差符号化用の色空間を選択するための最も簡単な手法は、符号化器が、各符号化モード(たとえばイントラ符号化モード、インター符号化モード及びIBCモード)を、ACTを有効にした状態と無効にした状態とで2回検査するものである。これによって、符号化の複雑さがほぼ2倍になってしまう。ACTの符号化の複雑さをさらに軽減するために、本開示では、以下の符号化器高速化ロジックが実施される。
【0159】
第1にYCgCo空間はRGB空間よりもコンパクトであるので、入力ビデオがRGBフォーマットにあるときには、最初にACTツールを有効にするレートディストーション(R-D)コストを検査し、次いで、ACTツールを無効にするR-Dコストを検査する。加えて、ACTが有効にされるとき、色空間変換を無効にするR-Dコストが計算されるのは、少なくとも1つの非ゼロ係数がある場合のみである。或いは、入力ビデオがYCbCrフォーマットであるとき、ACTを無効にするR-Dコストが検査され、ACTを有効にするR-D検査が続く。2番目の(ACTを有効にする)R-D検査が実行される
のは、ACTが無効であって少なくとも1つの非ゼロ係数があるときのみである。
【0160】
第2に、符号化モードの試験の数を減少させるために、2つの色空間に対して同一の符号化モードが使用される。より具体的には、イントラモードについては、全R-Dコスト比較のために選択されたイントラ予測モードが2つの色空間の間で共有され、インターモードについては、選択された動きベクトル、参照ピクチャ、動きベクトル予測子及びマージインデックス(インターマージモード用に使用される)が、2つの色空間の間で共有され、IBCモードについては、選択されたブロックベクトル及びブロックベクトル予測子並びにマージインデックス(IBCマージモード用に使用される)が、2つの色空間の間で共有される。
【0161】
第3に、VVCで使用される四分岐樹/二分岐樹/三分岐樹の分割構造のために、種々の分割の組合せによって1つの同じブロック分割が取得され得る。色空間選択を高速化するために、種々の分割経路によって1つの同じブロックが実現されるとき、ACT有効/無効の決定が使用される。具体的には、CUが最初に符号化されるとき、1つの特定のCUの残差を符号化するために選択された色空間が記憶される。次いで、別の分割経路によって同一のCUが取得されるとき、2つの空間のどちらかを選択する代わりに、記憶された色空間の決定が直接再利用される。
【0162】
第4に、1つのCUとその空間的近隣との間に強い相関がある場合、現在のCUの残差符号化のために色空間をいくつ検討する必要があるか決定するために、その空間的近隣のブロックの色空間選択情報が使用される。たとえば、十分な数の空間的近隣のブロックがそれらの残差を符号化するためにYCgCo空間を選択する場合には、現在のCUが同じ色空間を選択する可能性が高いと推論するのが適切である。対応して、元の色空間における現在のCUの残差符号化のR-D検査はスキップすることができる。十分な数の空間的近隣が元の色空間を選択していれば、YCgCo領域における残差符号化のR-D検査が回避され得る。そうでなければ、2つの色空間は両方とも試験される必要がある。
【0163】
第5に、同一領域内のCUの間に強い相関がある場合には、1つのCUは、その残差を符号化するために、親CUと同じ色空間を選択することができる。或いは、子CUは、選択された色空間及び各色空間のR-Dコストなどの親CUの情報から、色空間を導出することができる。したがって、符号化の複雑さを簡単にするために、1つのCUについて、親CUの残差がYCgCo領域において符号化される場合には、RGB領域における残差符号化のR-Dコストの検査はスキップされる。加えて、親CUの残差がRGB領域において符号化される場合には、YCgCo領域における残差符号化のR-Dコストの検査はスキップされる。別の伝統的なやり方は、親CUの符号化において2つ色空間が試験される場合には、2つ色空間における親CUのR-Dコストを使用する。親CUがYCgCo色空間を選択し、しかもYCgCoのR-DコストがRGBよりもはるかに小さければ、RGB色空間がスキップされ、逆の場合も同じである。
【0164】
いくつかの実施形態では、色差成分用の輝度のみの符号化ツールを有効にすることによって4:4:4ビデオ符号化の効率が改善される。VVC設計は、主として、4:2:0色差フォーマットで取り込まれるビデオに的を絞っているので、ほとんどの既存のインター/イントラ符号化ツールは、輝度成分にのみ有効であって色差成分には無効である。しかし、以前に論じられたように、4:4:4色差フォーマットのビデオ信号は、4:2:0ビデオ信号と比較して、かなり異なった特性を示す。たとえば、4:4:4YCbCr/RGBビデオのCb/B成分及びCr/R成分は、輝度成分に似て、多くの場合、有用な高周波のテクスチャ情報及びエッジ情報を含有している。これは、通常非常に滑らかで、含有している情報が輝度成分よりもはるかに少ない、4:2:0ビデオにおける色差成分とは異なる。そのような分析に基づき、入力ビデオが4:4:4色差フォーマットであ
るとき、現行のVVCにおける輝度専用のいくつかの符号化ツールを色差成分に拡張するために、以下の方法が実施される。
【0165】
第1に、色差成分に対して輝度補間フィルタが有効にされる。VVC規格は、HEVCと同様に、時間的近隣のピクチャ間の冗長性を活用するために、動き補償予測技術を利用するものであり、Y成分に関する1/16の画素の精度、並びにCb成分及びCr成分に関する1/32の画素の精度の動きベクトルをサポートする。分離可能な8タップのフィルタのセットを使用して分数サンプルが内挿される。Cb成分及びCr成分の分数内挿は、4:2:0ビデオフォーマットに対して分離可能な4タップのフィルタが使用される以外は、基本的にY成分のものと同一である。これは、4:2:0ビデオについては、Cb成分及びCr成分が含有している情報が、Y成分のものよりも非常に少なく、4タップの補間フィルタは、8タップの補間フィルタと比較したとき、Cb成分及びCr成分に関する動き補償予測の効率を乱切りすることなく、分数内挿のフィルタリングの複雑さを軽減することができるからである。
【0166】
以前に指摘されたように、既存の4タップの色差補間フィルタは、4:4:4ビデオにおける色差成分の動き補償予測のために分数サンプルを内挿するのに効率的でない可能性がある。したがって、本開示の一実施形態では、4:4:4ビデオにおける、輝度成分と色差成分との両方の分数サンプル補間に、(4:2:0ビデオの輝度成分用に使用される)8タップの補間フィルタの同一のセットを使用する。別の実施形態では、符号化効率と複雑さとの間のより優れたトレードオフのために、4:4:4ビデオの色差サンプル用の適応型補間フィルタ選択が有効にされる。たとえば、種々の符号化レベルにおいて、色差成分用に、8タップの補間フィルタ(又は他の補間フィルタ)とデフォルトの4タップの補間フィルタのどちらが使用されるのかを示すために、1つの補間フィルタ選択フラグが、SPSレベル、PPSレベル及び/又はスライスレベルで信号伝達され得る。
【0167】
第2に、色差成分に対してPDPC及びMRLが有効にされる。
【0168】
VVCにおける位置依存型イントラ予測組合せ(PDPC)ツールは、フィルタリングされていない参照サンプルを用いるイントラ予測サンプルの重み付けされた組合せを採用することによって、上記の概念を拡張するものである。現行のVVC作業草案では、PDPCは、平面、DC、水平方向(すなわちモード18)、垂直方向(すなわちモード50)、左下の対角線方向に近い角度方向(すなわちモード2、3、4、...、10)、及び右上の対角線方向に近い角度方向(すなわちモード58、59、60、...、66)といった、信号伝達なしのイントラモードに対して有効にされる。座標(x,y)がpred(x,y)として位置付けられる予測サンプルを想定すると、PDPCの後の対応する値は、
pred(x,y)=(wL×R-1,y+wT×Rx,-1-wTL×R-1,-1+(64-wL-wT+wTL)×pred(x,y)+32)>>6
として計算され、Rx,-1、R-1,yは、現在のサンプル(x,y)のうち、それぞれ最上部及び左側にある参照サンプルを表し、R-1,-1は、現在のブロックの左上隅にある参照サンプルを表す。上記の式における重みwL、wT及びwTLは、予測モード及びサンプル位置に依拠して適応的に選択され、現在の符号化ブロックのサイズがW×Hであると想定すると以下のように記述される。
【0169】
DCモードについては、次のとおりである。
wT=32>>((y<<1)>>shift)、wL=32>>((x<<1)>>shift)、wTL=(wL>>4)+(wT>>4)
【0170】
平面モードについては、次のとおりである。
wT=32>>((y<<1)<<shift)、wL=32>>((x<<1)>>shift)、wTL=0
【0171】
水平モードについては、次のとおりである。
wT=32>>((y<<1)>>shift)、wL=32>>((x<<1)>>shift)、wTL=wT
【0172】
垂直モードについては、次のとおりである。
wT=32>>((y<<1)>>shift)、wL=32>>((x<<1)>>shift)、wTL=wL
【0173】
左下の対角線方向については、次のとおりである。
wT=16>>((y<<1)>>shift)、wL=16>>((x<<1)>>shift)、wTL=0
【0174】
右上の対角線方向については、次のとおりである。
wT=16>>((y<<1)>>shift)、wL=16>>((x<<1)>>shift)、wTL=0
ここで、shift=(log2(W)-2+log2(H)-2+2)>>2、となる。
【0175】
参照として再構成されたサンプルのうち最も近い行/列のみのHEVCとは異なって、VVCでは、イントラ予測用に2つの追加の行/列が使用されるマルチ参照ライン(MRL)が導入される。選択された参照の行/列のインデックスは、符号化器から復号器に信号伝達される。最近傍ではない行/列が選択されているとき、現在のブロックを予測するために使用され得るイントラモードのセットから、平面モード及びDCモードが除外される。
【0176】
現行のVVC設計では、イントラ予測サンプルと、再構成された近隣のサンプルから導出されたその参照サンプルとの間の不連続を低減する/解消するために輝度成分によって採用されるのは、PDPCツールのみである。しかしながら、以前に言及されたように、4:4:4色差フォーマットのビデオ信号には、色差ブロックの中に豊富なテクスチャ情報があり得る。したがって、予測品質を改善するためにフィルタリングされていない参照サンプル及びイントラ予測サンプルの加重平均を使用するPDPCのようなツールも、4:4:4ビデオの色差符号化効率の改善に有益なはずである。そのような考察に基づき、本開示の一実施形態では、4:4:4ビデオにおける色差成分のイントラ予測のためにPDPCプロセスが有効にされる。
【0177】
同じ考察がMRLツールにも拡張され得る。現行のVVCでは、MRLは色差成分には適用され得ない。本開示の一実施形態に基づき、1つのイントラCUの色差成分に関する1つのMRLインデックスを信号伝達することにより、4:4:4ビデオの色差成分に関するMRLが有効にされる。この実施形態を基に、種々の方法が使用され得る。方法の1つでは、1つの追加のMRLインデックスが信号伝達され、Cb/B成分とCr/R成分との両方によって共有され得る。別の方法では、それぞれの色差成分用に1つで、2つのMRLインデックスが信号伝達される。第3の方法では、色差成分に関するMRLを有効にするための追加のMRL信号伝達が不要になるように、色差成分のイントラ予測のための輝度MRLインデックスが再利用される。
【0178】
第3に、色差成分に対してISPが有効にされる。
【0179】
いくつかの実施形態では、イントラ符号化効率をさらに改善するために、VVCに、サブ分割予測(ISP)と呼ばれる1つの符号化ツールが導入される。従来のイントラモードがブロックのイントラ予測サンプルを生成するために利用するのは、1つのCUに隣接する再構成されたサンプルのみである。そのような設計に基づき、予測されたサンプルと参照サンプルとの間の空間的相関は、それらの間の距離にほぼ比例する。したがって、内側部におけるサンプル(特にブロックの右下隅にあるサンプル)の予測品質は、通常、ブロック境界に近いサンプルのものよりも劣る。ISPは、ブロックサイズに依拠して、現在のCUを水平方向又は垂直方向のいずれかにおいて2つ又は4つのサブブロックに分割し、各サブブロックは少なくとも16のサンプルを含有している。1つのサブブロックの中の再構成されたサンプルは、次のサブブロックの中のサンプルを予測するための参照として使用され得る。上記のプロセスは、現在のCUの内部のサブブロックがすべて符号化されるまで繰り返される。加えて、信号伝達のオーバヘッドを低減するために、1つのISPCUの内部のサブブロックのすべてが同一のイントラモードを共有する。加えて、既存のISP設計によれば、サブブロック分割は輝度成分に対してのみ適用可能である。具体的には、1つのISPCUの輝度サンプルのみが複数のサブブロック(又はTU)へとさらに分割され得、各輝度のサブブロックは別個に符号化される。しかしながら、ISPCUの色差サンプルは分割されない。言い換えれば、色差成分については、CUは、さらなる分割のないイントラ予測、変換、量子化及びエントロピー符号化のための処理部として使用される。
【0180】
現行のVVCでは、ISPモードが有効にされるとき、TU分割は輝度サンプルにのみ適用され、色差サンプルは、複数のTUへのさらなる分割はなしで符号化される。本開示の一実施形態によれば、色差面には豊富なテクスチャ情報があるので、4:4:4ビデオにおける色差符号化のためにISPモードも有効にされる。この実施形態を基に、種々の方法が使用され得る。方法の1つでは、1つの追加のISPインデックスが信号伝達され、2つの色差成分によって共有される。別の方法では、Cb/B用に1つ、Cr/R用に1つで、2つの追加のISPインデックスが別個に信号伝達される。第3の方法では、2つの色差成分のISP予測のために、輝度成分用に使用されたISPインデックスが再利用される。
【0181】
第4に、新規のイントラ予測技術として、色差成分に対してマトリクスベースのイントラ予測(MIP)が有効にされる。
【0182】
幅がWで高さがHの矩形ブロックのサンプルを予測するために、MIPは、ブロックの左に隣接する境界サンプルの再構成されたHの1ラインと、ブロックの上に隣接する境界サンプルの再構成されたWの1ラインとを、入力として採用する。再構成されたサンプルは、利用不可能な場合には、従来のイントラ予測で行われているように生成される。
【0183】
いくつかの実施形態では、輝度成分に対して有効にされるのはMIPモードのみである。一実施形態では、色差成分に対してISPモードを有効にするのと同じ理由から、4:4:4ビデオの色差成分に対してMIPが有効にされる。2つの信号伝達方法が適用され得る。第1の方法では、輝度成分用に使用されるMIPモードと、2つの色差成分用に使用されるMIPモードとの、2つのMIPモードが別個に信号伝達される。第2の方法では、輝度成分と色差成分とで共有される1つの単一のMIPモードのみが信号伝達される。
【0184】
第5に、色差成分に対して複数の変換選択(MTS)が有効にされる。
【0185】
HEVCで採用されているDCT-IIに加えて、インター符号化ブロックとイントラ符号化ブロックとの両方の残差符号化用にMTS方式が使用される。MTS方式は、DC
T8/DST7から選択された複数の変換を使用する。新たに導入された変換マトリクスは、DST-VII及びDCT-VIIIである。
【0186】
現行のVVCでは、MTSツールが有効にされるのは輝度成分に対してのみである。本開示の一実施形態では、4:4:4ビデオの色差成分用にMIPが有効にされる。2つの信号伝達方法が適用され得る。第1の方法では、1つのCUに対してMTSが有効にされるとき、輝度成分用に使用されるMIPモードと、2つの色差成分用に使用されるMIPモードとの、2つの変換インデックスが別個に信号伝達される。第2の方法では、MTSが有効にされるとき、輝度成分と色差成分とによって共有される1つの変換インデックスが信号伝達される。
【0187】
いくつかの実施形態では、使用される量子化パラメータ(QP)を、輝度QPに基づいて色差成分から導出するのに、固定されたルックアップテーブルが使用されるHEVC規格と異なり、VVC規格では、輝度から色差へのマッピングテーブルが符号化器から復号器に送られ、これは区分線形関数のいくつかのピボット点によって定義される。具体的には、輝度から色差へのマッピングテーブルのシンタックス要素及び再構成プロセスは、以下のように記述される。
【0188】
【0189】
same_qp_table_for_chromaが1であると、1つの色差QPマッピングテーブルだけが信号伝達されることを明示し、このテーブルは、Cb残差及びCr残差に適用され、sps_joint_cbcr_enabled_flagが1であ
るときにはジョイントCb-Cr残差にも適用される。same_qp_table_for_chromaが0であると、色差QPマッピングテーブルは、Cb用及びCr用の2つと、sps_joint_cbcr_enabled_flagが1のときのジョイントCb-Cr用の追加の1つとがSPSで信号伝達されることを明示する。ビットストリームの中に同一のqp_table_for_chromaが存在しないとき、same_qp_table_for_chromaの値は1と推論される。
【0190】
qp_table_start_minus26[i]に26を加えたものが、i番目の色差QPマッピングテーブルを記述するために使用される開始の輝度及び色差のQPを明示する。qp_table_start_minus26[i]の値は、-26-QpBdOffset~36の範囲内にある(両端を含む)ものとする。ビットストリームの中にqp_table_start_minus26[i]が存在しないとき、qp_table_start_minus26[i]の値は0と推論される。
【0191】
num_points_in_qp_table_minus1[i]に1を加えたものが、i番目の色差QPマッピングテーブルを記述するために使用されるポイントの数を規定する。num_points_in_qp_table_minus1[i]の値は、0~63+QpBdOffsetの範囲内にある(両端を含む)ものとする。ビットストリームの中にnum_points_in_qp_table_minus1[0]が存在しないとき、num_points_in_qp_table_minus1[0]の値は0と推論される。
【0192】
delta_qp_in_val_minus1[i][j]は、i番目の色差QPマッピングテーブルのj番目のピボット点の入力座標を導出するために使用される増分値を規定する。ビットストリームの中にdelta_qp_in_val_minus1[0][j]が存在しないとき、delta_qp_in_val_minus1[0][j]の値は0と推論される。
【0193】
delta_qp_diff_val[i][j]は、i番目の色差QPマッピングテーブルのj番目のピボット点の出力座標を導出するために使用される増分値を規定する。
【0194】
i番目の色差QPマッピングテーブルChromaQpTable[i] for i=0..numQpTables-1は以下のように導出される。
【数11】
【0195】
いくつかの実施形態では、RGBビデオ用に改善された、輝度から色差へのマッピング機能が、本明細書で開示される。
【0196】
いくつかの実施形態では、入力ビデオがRGBフォーマットであるとき、輝度QPを色差QPにマッピングするために、2部分からなる1つの線形関数が、符号化器から復号器へと送られる。これは、シンタックス要素を、same_qp_table_for_chroma=1、qp_table_start_minus26[0]=0、num_points_in_qp_table_minus1[0]=0、delta_qp_in_val_minus1[0][0]=0、delta_qp_diff_val[0][0]=0と設定することによって行われる。具体的には、対応する輝度から色差へのQPマッピング機能は、次のように定義される。
【数12】
【0197】
テーブル16は、内部符号化ビット深度が10ビットであると想定して、RGB符号化に適用される輝度から色差へのQPマッピング機能を示す。
【表16】
【0198】
式(5)に示されるように、輝度QPが26よりも大きいとき、輝度成分と色差成分とを符号化するために不同のQP値が使用される。いくつかの実施形態では、不同のQP値の影響は、量子化/量子化解除プロセスばかりではなく、次式で規定されるようなモード決定に関するレートディストーション(R-D)コストを計算するとき、重み付けされた色差歪みが使用される場合には、R-Dの最適化中に下される判定にも及ぶ。
【0199】
Jmode=(SSEluma+Wchroma・SSEchroma)+λmode・Rmode (6)
【0200】
式(6)で、SSE
luma及びSSE
chromaは、それぞれ輝度及び色差成分の歪みであり、R
modeはビット数であり、λ
modeはラグランジュ乗数であり、W
chromaは色差歪みに対する重み付けパラメータであって、次式で計算される。
【数13】
【0201】
しかしながら、YCbCr/YUVのビデオと比較して、RGBビデオの3つのチャネル間の相関はより強い。したがって、ビデオコンテンツがRGBフォーマットで取り込まれたとき、通常、3つの成分のすべてに、強いテクスチャ及び高周波の情報があり、すなわちR、G及びBの情報は同等に重要である。したがって、本開示の一実施形態では、RGB符号化のために、3つのチャネルのすべてに対して等しいQP値が適用される。これは、対応する輝度から色差へのQPマッピング・シンタックス要素を、same_qp_table_for_chroma=1、qp_table_start_minus26[0]=0、num_points_in_qp_table_minus1[0]=0、delta_qp_in_val_minus1[0][0]=0、delta_qp_diff_val[0][0]=1と設定することによって行われ得る。対応して、RGBの輝度から色差へのマッピング機能は、本明細書で開示された方法を用いて、式(
8)及びテーブル17によって示される。
【0202】
QPC=QPL (8)
【0203】
【0204】
図11A及び
図11Bは、本開示のいくつかの実装形態に従って、ビデオ復号器が、符号化ユニットの残差のダイナミックレンジを逆ACTによって処理するための所定の範囲内に制限するためにクリッピングの技術を実施する、例示的なビデオ復号プロセスを示すブロック図である。
【0205】
より具体的には、
図11Aは、逆ACT1104の入力に対してクリッピング操作1102が適用される例を示す。
図11Bは、逆ACT1104の入力に対してクリッピング操作1102が適用され、出力に対してクリッピング操作1106が適用される例を示す。いくつかの実施形態では、クリッピング操作1102と1106とは同一である。いくつかの実施形態では、クリッピング操作1102と1106とは異なる。
【0206】
いくつかの実施形態では、ビット深度制御方法はACTを用いて実施される。既存のACT設計によれば、復号器における逆ACTプロセスの入力は、他の残差復号プロセス(たとえば逆変換、逆BDPCM、逆JCCR)からの出力残差である。現在の実装形態では、それらの残差サンプルは、16ビットの符号付き整数の最大値に届いてしまう可能性がある。そのような設計では、逆ACTは16ビットの実装形態によって実施され得ず、このことはハードウェア実装形態にとって非常に高くつく。そのような問題を解決するために、逆ACTプロセスの入力残差に対してクリッピング操作が1回適用される。一実施形態では、逆ACTプロセスの入力残差に対して次式のクリッピング操作が適用される。
Clipinput=Clip(-(2Bitdepth-1),2Bitdepth-1,M)
Bitdepthは内部符号化ビット深度である。
【0207】
別の実施形態では、逆ACTプロセスの入力残差に対して次式のような別のクリッピング操作が適用される。
Clipinput=Clip(-(215-1),215-1,M)
【0208】
加えて、別の実施形態では、クリッピング操作は逆ACTの出力残差に対して適用される。一実施形態では、逆ACTの出力に対して次式のクリッピング操作が適用される。
Clipoutput=Clip(-(2Bitdepth-1),2Bitdepth-1,M)
【0209】
別の実施形態では、逆ACTの出力に対して次式のクリッピング操作が適用される。
Clipoutput=Clip(-(215-1),215-1,M)
【0210】
図5Bに表されたリフティング操作に示されるように、可逆YCgCo変換が適用されるとき、リフティング操作によって、Cg成分及びCo成分のダイナミックレンジが1ビット増加されることになる。したがって、一実施形態では、可逆YCgCo変換から出力された残差サンプルの精度を保つために、逆ACTの入力残差は、次式に基づいてクリップされる。
Clip
input=Clip(-2
Bitdepth+1,2
Bitdepth+1-1,M)
【0211】
別の実施形態では、逆ACTへの入力Y、Cg及びCoの残差に対して別のクリッピング操作が適用される。具体的には、可逆ACTの前後でY成分のビット深度が不変であるため、逆ACTに対する入力輝度残差は次式の操作によってクリップされる。
Clipinput=Clip(-2Bitdepth,2Bitdepth-1,M)
【0212】
Cg成分及びCo成分については、ビット深度が増加するので、逆ACTに対する対応する入力残差は、次式の操作によってクリップされる。
Clipinput=Clip(-2Bitdepth+1,2Bitdepth+1-1,M)
【0213】
別の実施形態では、逆ACTへの入力残差は次式の操作によってクリップされる。
Clipinput=Clip(-2C,2C-1,M)
Cは1つの定数である。
【0214】
図12は、本開示のいくつかの実装形態に従って、ビデオ復号器(たとえばビデオ復号器30)が、符号化ユニットの残差のダイナミックレンジを逆ACTによって処理するための所定の範囲内に制限するためにクリッピング操作を実行することによってビデオデータを復号する、例示的なプロセスを示す流れ
図1200である。
【0215】
ビデオ復号器30は、ビットストリームから、イントラ予測モード又はインター予測モードによって符号化されている符号化ユニットに対応するビデオデータを受け取る(1210)。
【0216】
次いで、ビデオ復号器30は、ビデオデータから第1のシンタックス要素を受け取る。第1のシンタックス要素は、符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示すものである(1220)。
【0217】
次いで、ビデオ復号器30は、ビデオデータを処理して符号化ユニットの残差を生成する(1230)。符号化ユニットがACTを使用して符号化されているとの、第1のシンタックス要素に基づく判定に応じて、ビデオ復号器30は、符号化ユニットの残差に対してクリッピング操作を実行する(1240)。ビデオ復号器30は、符号化ユニットの残差に対して、クリッピング操作の後に逆ACTを適用する(1250)。
【0218】
いくつかの実施形態において、クリッピング操作は、符号化ユニットの残差のダイナミックレンジを、逆ACTによる処理のための所定の範囲内に制限する。
【0219】
いくつかの実施形態では、クリッピング操作は、
Clipinput=Clip(-2Bitdepth+1,2Bitdepth+1-1,M)
と定義され、Mは、クリッピング操作への入力であり、Bitdepthは、内部符号化ビット深度であり、Clipinputは、-2Bitdepth+1~(2Bitde
pth+1-1)の範囲内におけるクリッピング操作の出力である。いくつかの実施形態では、入力Mが-2Bitdepth+1未満であると、クリッピング操作の出力は-2Bitdepth+1に設定される。いくつかの実施形態では、入力Mが(2Bitdepth+1-1)よりも大きければ、クリッピング操作の出力は(2Bitdepth+1-1)に設定される。
【0220】
いくつかの実施形態では、クリッピング操作は、
Clipinput=Clip(-2Bitdepth,2Bitdepth-1,M)
と定義され、Mは、クリッピング操作への入力であり、Bitdepthは、内部符号化ビット深度であり、Clipinputは、-2Bitdepth~(2Bitdepth-1)の範囲内におけるクリッピング操作の出力である。いくつかの実施形態では、入力Mが-2Bitdepth未満であると、クリッピング操作の出力は、-2Bitdepthに設定される。いくつかの実施形態では、入力Mが(2Bitdepth-1)よりも大きければ、クリッピング操作の出力は、(2Bitdepth-1)に設定される。
【0221】
いくつかの実施形態では、ビデオ復号器30は、クリッピング操作を実行する前に、符号化ユニットの残差に対して逆変換を適用する。
【0222】
いくつかの実施形態では、ビデオ復号器30は、符号化ユニットの残差に対して逆ACTを適用した後に、符号化ユニットの残差に対して第2のクリッピング操作を適用する。
【0223】
いくつかの実施形態において、クリッピング操作は、符号化ユニットの残差のダイナミックレンジを、逆ACTによって実装される固定された内部符号化ビット深度の範囲内に調整する。
【0224】
いくつかの実施形態では、固定された内部符号化ビット深度は15である。
【0225】
いくつかの実施形態では、ビデオ復号器30は、ビデオデータから第1のシンタックス要素を受け取った後に、ビデオデータから第2のシンタックス要素を受け取り、第2のシンタックス要素は、クリッピング操作で使用される可変の内部符号化ビット深度を示すものである。
【0226】
いくつかの実施形態では、ビデオ復号器30は、ビデオデータから第1のシンタックス要素を受け取った後に、ビデオデータから第2のシンタックス要素を受け取り、第2のシンタックス要素は第1の内部符号化ビット深度を示し、クリッピング操作で使用される第2の内部符号化ビット深度は、第1の内部符号化ビット深度に1を加えたものである。
【0227】
いくつかの実施形態では、クリッピング操作は、符号化ユニットの残差の輝度成分に適用される第1のクリッピング操作と、符号化ユニットの残差の色差成分に適用される第2のクリッピング操作とをさらに備える。
【0228】
いくつかの実施形態では、第1のクリッピング操作は、符号化ユニットの残差の輝度成分のダイナミックレンジを、第1の内部符号化ビット深度に1を加えたものの範囲内に制限し、第2のクリッピング操作は、符号化ユニットの残差の色差成分のダイナミックレンジを、第2の内部符号化ビット深度に1を加えたものの範囲内に制限し、第2の内部符号化ビット深度は、第1の内部符号化ビット深度に1を加えたものである。
【0229】
1つ又は複数の例では、記述された機能は、ハードウェア、ソフトウェア、ファームウ
ェア、又はこれらの任意の組合せで実現され得る。この機能は、ソフトウェアで実現される場合には、1つ以上の命令又は符号(コード)としてコンピュータ読み取り可能な媒体に記憶されるか又は伝送されてよく、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記録媒体などの有体物の媒体に対応するコンピュータ読み取り可能な記録媒体、又は、たとえば通信プロトコルによる、ある位置から別の位置へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信メディアを含み得る。このように、コンピュータ読み取り可能な媒体は、一般に、(1)有体物である非一時型のコンピュータ読み取り可能な記録媒体、又は(2)信号もしくは搬送波などの通信媒体に相当し得るものである。データ記録媒体は、1つ以上のコンピュータ又は1つ以上のプロセッサによって、本出願に記述された実施形態を実現するための命令、符号及び/又はデータ構造を取り出すためにアクセスされ得る、任意の利用可能な媒体でよい。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
【0230】
本明細書の実施形態の記述において使用される専門用語は、特定の実施形態のみを記述するためのものであり、特許請求の範囲を制限するようには意図されていない。実施形態及び添付の特許請求の範囲の記述で用いられるように、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は、文脈がはっきりと別様に示さなければ、複数形も含むように意図されている。本明細書で使用されるような「及び/又は」という用語は、関連する列挙された項目のうちの1つ又は複数の、ありとあらゆる可能な組合せを指し、かつ包含することも理解されよう。「備える」及び/又は「備えている」という用語は、本明細書で使用されたとき、明示された特徴、要素、及び/又は構成要素の存在を指定するが、1つ以上の他の特徴、要素、構成要素、及び/又はこれらのグループの存在もしくは追加を排除するものではないがさらに理解されよう。
【0231】
様々な要素を説明するために、本明細書では第1、第2などの用語が用いられることがあるが、これらの要素は、これらの用語によって限定されるべきでないことも理解されよう。これらの用語は、単に1つの要素を別のものと区別するのに用いられる。たとえば、実施形態の範囲から逸脱することなく、第1の電極が第2の電極と称され得て、同様に、第2の電極が第1の電極と称され得る。第1の電極と第2の電極は、どちらも電極であるが同一の電極ではない。
【0232】
本出願の記述は解説及び説明のために提示されており、網羅的であること又は開示された形態の発明に限定されることは意図されていない。多くの修正形態、変形形態、及び代替の実施形態が、先の記述及び関連する図面において提示された教示内容の利益を有する当業者には明らかなはずである。実施形態は、本発明の原理や実際の用途について最も良く説明するため、他の当業者が様々な実施形態に関して本発明を理解することを可能にするため、また、基本原理と、企図された特定の使用法に適するものとしての様々な修正形態を伴う様々な実施形態とを最も良く利用するために、選択して記述されたものである。したがって、特許請求の範囲は、開示された実施形態の特定の実施例及びその修正形態に限定されず、添付の特許請求の範囲の範囲内に含まれるように他の実施形態が意図されていることを理解されたい。
【手続補正書】
【提出日】2024-08-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデータを復号する方法であって、
符号化ユニットに対応するビデオデータを受け取るステップと、
前記ビデオデータから、前記符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示す第1のシンタックス要素を受け取るステップと、
前記符号化ユニットが前記ACTを使用して符号化されているとの、前記第1のシンタックス要素に基づく判定に応じて、
前記符号化ユニットの残差に対してクリッピング操作を実行し、
前記クリッピング操作の後に、前記符号化ユニットの前記残差に対して逆ACTを適用し、
前記逆ACTを適用した後の前記残差に基づいて前記符号化ユニットを再構成するステップと
を備え、
前記クリッピング操作が、前記符号化ユニットの前記残差の輝度成分に適用される第1のクリッピング操作と、前記符号化ユニットの前記残差の色差成分に適用される、前記第1のクリッピング操作とは別の第2のクリッピング操作とをさらに備える、方法。
【請求項2】
請求項1に記載の方法であって、前記クリッピング操作が、前記符号化ユニットの前記残差のダイナミックレンジを、前記逆ACTによる処理のための所定の範囲内に制限する、方法。
【請求項3】
請求項1に記載の方法であって、前記第2のクリッピング操作が、
Clipinput=Clip(-2Bitdepth+1,2Bitdepth+1-1,M)
と定義され、Mは、前記第2のクリッピング操作への入力であり、Bitdepthは、内部符号化ビット深度であり、Clipinputは、-2Bitdepth+1~(2Bitdepth+1-1)の範囲内における前記第2のクリッピング操作の出力である、方法。
【請求項4】
請求項1に記載の方法であって、前記クリッピング操作を実行する前に、前記符号化ユニットの前記残差を生成するために逆変換を適用するステップをさらに備える方法。
【請求項5】
請求項1に記載の方法であって、前記符号化ユニットの前記残差に対して前記逆ACTを適用した後に、前記符号化ユニットの前記残差に対して第3のクリッピング操作を適用するステップをさらに備える方法。
【請求項6】
請求項1に記載の方法であって、前記クリッピング操作が、前記符号化ユニットの前記残差のダイナミックレンジを、固定された内部符号化ビット深度の範囲内に調整するものであり、前記固定された内部符号化ビット深度の当該範囲は、前記逆ACTによる処理のための固定された内部符号化ビット深度に基づいて決定される、方法。
【請求項7】
請求項6に記載の方法であって、前記固定された内部符号化ビット深度が15である、方法。
【請求項8】
請求項1に記載の方法であって、前記ビデオデータから第1のシンタックス要素を受け取った後に、前記ビデオデータから第2のシンタックス要素を受け取るステップであって、前記第2のシンタックス要素が前記クリッピング操作で使用される可変の内部符号化ビット深度を示すものである、ステップをさらに備える方法。
【請求項9】
請求項1に記載の方法であって、前記ビデオデータから第1のシンタックス要素を受け取った後に、前記ビデオデータから第2のシンタックス要素を受け取るステップであって、前記第2のシンタックス要素が第1の内部符号化ビット深度を示し、前記クリッピング操作で使用される第2の内部符号化ビット深度が前記第1の内部符号化ビット深度に1を加えたものである、ステップ、をさらに備える方法。
【請求項10】
請求項1に記載の方法であって、
前記第1のクリッピング操作が、前記符号化ユニットの前記残差の前記輝度成分のダイナミックレンジを、第1の内部符号化ビット深度に1を加えたものの範囲内に制限し、
前記第2のクリッピング操作が、前記符号化ユニットの前記残差の前記色差成分のダイナミックレンジを、第2の内部符号化ビット深度に1を加えたものの範囲内に制限し、
前記第2の内部符号化ビット深度は前記第1の内部符号化ビット深度に1を加えたものである、方法。
【請求項11】
電子装置であって、
1つ以上の処理部と、
前記1つ以上の処理部に接続されたメモリと、
前記メモリに記憶された複数のプログラム及びビットストリームとを備え、
前記複数のプログラムは、前記1つ以上の処理部によって実行されると、前記電子装置に、前記ビットストリームに対して請求項1から10のいずれか一項に記載の方法を実施させる、電子装置。
【請求項12】
復号されるべきビットストリームと、1つ以上の処理部を有する電子装置による実行のための複数のプログラムとを記憶している非一時型コンピュータ読み取り可能な記憶媒体であって、前記複数のプログラムが、前記1つ以上の処理部によって実行されたとき、前記電子装置に、前記ビットストリームに対して請求項1から10のいずれか一項に記載の方法を実施させる、非一時型コンピュータ読み取り可能な記憶媒体。
【請求項13】
1つ以上のプロセッサを備えたコンピュータ装置による実行のための命令を含むコンピュータプログラムであって、前記命令は、前記1つ以上のプロセッサによって実行されると、前記コンピュータ装置に、請求項1から10のいずれか一項に記載の方法を実施させるためにビットストリームを受信させる、コンピュータプログラム。
【請求項14】
ビデオ復号方法により復号されるべきビットストリームを記憶するための方法であって、
当該ビデオ復号方法が、
ビットストリームから、符号化ユニットに対応するビデオデータを受け取るステップと、
前記ビデオデータから、前記符号化ユニットが適応型色空間変換(ACT)を使用して符号化されているかどうかを示す第1のシンタックス要素を受け取るステップと、
前記符号化ユニットが前記ACTを使用して符号化されているとの、前記第1のシンタックス要素に基づく判定に応じて、
前記符号化ユニットの残差に対してクリッピング操作を実行し、
前記クリッピング操作の後に、前記符号化ユニットの前記残差に対して逆ACTを適用し、
前記逆ACTを適用した後の前記残差に基づいて前記符号化ユニットを再構成するステップと
を備え、
前記クリッピング操作が、前記符号化ユニットの前記残差の輝度成分に適用される第1のクリッピング操作と、前記符号化ユニットの前記残差の色差成分に適用される、前記第1のクリッピング操作とは別の第2のクリッピング操作とをさらに備える、方法。
【外国語明細書】