IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特開2024-125352部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置
<>
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図1
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図2
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図3
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図4
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図5
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図6
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図7
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図8
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図9
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図10
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図11
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図12
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図13
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図14
  • 特開-部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024125352
(43)【公開日】2024-09-18
(54)【発明の名称】部分的に共有されている輝度および彩度のコード化木を用いたビデオ符号化および復号化の方法および装置
(51)【国際特許分類】
   H04N 19/119 20140101AFI20240910BHJP
   H04N 19/136 20140101ALI20240910BHJP
   H04N 19/159 20140101ALI20240910BHJP
   H04N 19/176 20140101ALI20240910BHJP
   H04N 19/186 20140101ALI20240910BHJP
   H04N 19/463 20140101ALI20240910BHJP
【FI】
H04N19/119
H04N19/136
H04N19/159
H04N19/176
H04N19/186
H04N19/463
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024100306
(22)【出願日】2024-06-21
(62)【分割の表示】P 2020561859の分割
【原出願日】2019-05-21
(31)【優先権主張番号】18305653.0
(32)【優先日】2018-05-29
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ルリアネック,ファブリス
(72)【発明者】
【氏名】ギャルピン,フランク
(72)【発明者】
【氏名】ポワリエ,タンギ
(72)【発明者】
【氏名】ラス,ガガン
(57)【要約】      (修正有)
【課題】分割木構造が輝度ブロックと彩度ブロックとの間で部分的に共有されていることに基づくビデオ符号化および復号化する方法を提供する。
【解決手段】ビデオ復号方法は、ビデオの画像を複数のコード化木単位に分割することと、Iスライスについて、各コード化木単位は、暗黙的な4分木分割を用いて、64×64輝度サンプルを有するコード化単位に分割されるということと、前記コード化単位が、輝度及び彩度について、二つの別々のコード化木構文構造のルートであるいうことを示すインディケーションを復号化することと、前記インディケーションに基づいて前記複数のコード化木単位を復号化することと、を備える。
【選択図】図9
【特許請求の範囲】
【請求項1】
ビデオを復号化するための方法であって、
前記ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定する(920)ことと、
少なくとも前記分割木構造に基づいて、前記ブロックを復号化する(930)ことと、を含み、
前記分割木構造が、輝度ブロックと彩度ブロックとの間で部分的に共有されている、方法。
【請求項2】
ビデオを符号化するための方法であって、
前記ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定する(720)ことと、
少なくとも前記分割木構造に基づいて、前記ブロックをコード化する(730)ことと、を含み、
前記分割木構造が、輝度ブロックと彩度ブロックとの間で部分的に共有されている、方法。
【請求項3】
1つ以上のプロセッサを備えるビデオ復号化装置であって、前記1つ以上のプロセッサが、
前記ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定することと、
少なくとも前記分割木構造に基づいて、前記ブロックを復号化することと、を行うように構成されており、
前記分割木構造が、輝度ブロックと彩度ブロックとの間で部分的に共有されている、ビデオ復号化装置。
【請求項4】
1つ以上のプロセッサを備えるビデオ符号化装置であって、前記1つ以上のプロセッサが、
前記ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定することと、
少なくとも前記分割木構造に基づいて、前記ブロックをコード化することと、を行うように構成されており、
前記分割木構造が、輝度ブロックと彩度ブロックとの間で部分的に共有されている、ビデオ符号化装置。
【請求項5】
単一分割木構造が、前記分割木のルートノードから切り替えノードに至るまで、輝度ブロックと彩度ブロックとの間で共有されており、二重分割木構造が、前記切り替えノードから前記分割木のリーフノードに至るまで、輝度ブロックおよび彩度ブロックについて決定される、請求項1もしくは2に記載の方法、または請求項3もしくは4に記載の装置。
【請求項6】
前記部分的に共有されている分割木構造が、イントラでコード化された前記ビデオ画像の一部に属するブロックをコード化または復号化するために使用される、請求項1、2、もしくは5のいずれか一項に記載の方法、または請求項3、4、もしくは5のいずれか一項に記載の装置。
【請求項7】
前記部分的に共有されている分割木構造が、インターでコード化された前記ビデオ画像の一部に属するブロックをコード化または復号化するために使用される、請求項1、2、もしくは5のいずれか一項に記載の方法、または請求項3、4、もしくは5のいずれか一項に記載の装置。
【請求項8】
前記切り替えノードが、暗黙的に決定される、請求項1、2、もしくは5~7のいずれか一項に記載の方法、または請求項3、4~7のいずれか一項に記載の装置。
【請求項9】
前記切り替えブロックノードが、分割ブロックサイズに基づいて決定される、請求項1、2、5~8のいずれか一項に記載の方法、または請求項3、4~8のいずれか一項に記載の装置。
【請求項10】
前記分割ブロックサイズが、64×64に設定される、請求項9に記載の方法、または請求項9に記載の装置。
【請求項11】
前記切り替えノードが、分割深度レベルに基づいて決定される、請求項1、2、もしくは5~8のいずれか一項に記載の方法、または請求項3、4~8のいずれか一項に記載の装置。
【請求項12】
前記分割深度レベルが、前記分割木の4分木分裂の1つの深さに設定される、請求項11に記載の方法、または請求項11に記載の装置。
【請求項13】
前記切り替えノードが信号通知される、請求項1、2、もしくは5~7のいずれか一項に記載の方法、または請求項3、4~7のいずれか一項に記載の装置。
【請求項14】
請求項2、および請求項5~13のいずれか一項に記載の符号化方法、または請求項4、および請求項5~13のいずれか一項に記載の装置に従って生成されたデータを含む信号。
【請求項15】
前記データが、分割ブロックサイズに基づいてインターリーブされる、請求項14に記載の信号。
【請求項16】
コンピュータプログラムであって、前記コンピュータプログラムがプロセッサによって実行されたときに、請求項1、2、もしくは5~13のいずれか一項に記載の方法を行うためのソフトウェアコード命令を含む、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態の少なくとも1つは、概して、例えば、ビデオ符号化または復号化のための方法または装置、より詳細には、分割木構造が輝度ブロックと彩度ブロックとの間で部分的に共有されている方法または装置に関する。
【背景技術】
【0002】
1つ以上の実装形態の技術分野は、一般にビデオ圧縮に関連している。少なくともいくつかの実施形態は、HEVC(HEVCは、「ITU-T H.265 Telecommunication standardization sector of ITU(10/2014)のシリーズH:視聴覚およびマルチメディアシステム、視聴覚サービスのインフラストラクチャ-動画のコード化、高効率ビデオコード化、勧告ITU-T H.265」に記載されているH.265およびMPEG-Hパート2としても既知である、高効率ビデオコード化を指す)のような既存のビデオ圧縮システムと比較して、あるいはVVC(Versatile Video Coding、JVET、Joint Video Experts Teamによって開発されている新規格)のような開発中の動画圧縮システムと比較して、圧縮効率を改善することに関する。
【0003】
高い圧縮効率を達成するために、画像およびビデオコード化方式は、通常、画像の分割、動きベクトル予測を含む予測、ビデオコンテンツの空間的および時間的冗長性を利用するための変換を採用する。一般に、イントラまたはインター予測は、イントラフレームまたはインターフレームの相関を活用するために使用され、次いで、予測誤差または予測残差と呼ばれることが多い、元の画像と予測された画像との間の差は、変換され、量子化され、エントロピーコード化される。ビデオを再構築するために、圧縮データは、エントロピー復号化、逆量子化、逆変換、および予測に対応する逆プロセスによって復号化される。
【0004】
新しいビデオコード化方式の出現に伴い、分割方式はより複雑になり、高圧縮を実現するために、輝度および彩度の二重木分割/コード化が可能になった。しかしながら、二重木コード化方式では、復号化段階におけるハードウェア実装に問題があるように思われる。
【0005】
したがって、いくつかのハードウェア復号化パイプラインの制約を考慮しながら、共同で高いコード化効率を保証する、ビデオをコード化および復号化するための新しい方法が必要である。
【発明の概要】
【0006】
本発明の目的は、先行技術の不利な点の少なくとも1つを克服することである。この目的のために、少なくとも1つの実施形態の一般的な態様によれば、ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定することであって、分割木構造は、輝度ブロックと彩度ブロックとの間で部分的に共有されている、決定することと、少なくとも分割木構造に基づいて、ブロックを符号化することと、を含む、ビデオ符号化のための方法が提示される。
【0007】
少なくとも1つの実施形態の別の一般的な態様によれば、ビデオの画像のブロックの分割プロセスに対応する分割木構造を決定することであって、分割木構造は、輝度ブロックと彩度ブロックとの間で部分的に共有されている、決定することと、少なくとも当該分割木構造に基づいて、ブロックを復号化することと、を含む、ビデオ復号化のための方法が提示される。
【0008】
少なくとも1つの実施形態の別の一般的な態様によれば、符号化方法の実施形態のいずれか1つを実施するための手段を含む、ビデオ符号化のための装置が提示される。
【0009】
少なくとも1つの実施形態の別の一般的な態様によれば、復号化方法の実施形態のいずれか1つを実施するための手段を含む、ビデオ復号化のための装置が提示される。
【0010】
少なくとも1つの実施形態の別の一般的な態様によれば、1つ以上のプロセッサ、および少なくとも1つのメモリを含む、ビデオ符号化のための装置が提供される。1つ以上のプロセッサは、符号化方法の実施形態のいずれか1つに実装するように構成されている。
【0011】
少なくとも1つの実施形態の別の一般的な態様によれば、1つ以上のプロセッサ、および少なくとも1つのメモリを含む、ビデオ復号化のための装置が提供される。1つ以上のプロセッサは、復号化方法の実施形態のいずれか1つに実装するように構成されている。
【0012】
少なくとも1つの実施形態の別の一般的な態様によれば、単一分割木構造は、分割木のルートノードから切り替えノードに至るまで、輝度ブロックと彩度ブロックとの間で共有されており、二重分割木構造は、切り替えノードから分割木のリーフノードに至るまで、輝度ブロックおよび彩度ブロックについて決定される。有利なことに、本実施形態は、復号化パイプラインの複雑性を制限しながら、より小さいブロックに対して分離木を可能にすることによって、コード化効率を最適化する。
【0013】
少なくとも1つの実施形態の別の一般的な態様によれば、部分的に共有されている分割木構造は、イントラでコード化されたビデオ画像の一部、例えば、タイルまたはタイル群に属するブロックをコード化または復号化するために使用される。
【0014】
少なくとも1つの実施形態の別の一般的な態様によれば、部分的に共有されている分割木構造は、インターでコード化されたビデオ画像の一部、例えば、タイルまたはタイル群に属するブロックをコード化または復号化するために使用される。
【0015】
少なくとも1つの実施形態の別の一般的な態様によれば、切り替えノードは、暗黙的に決定される。本実施形態の変形例によれば、切り替えブロックノードは、分割ブロックサイズに基づいて決定される。有利なことに、分割ブロックサイズは、復号化パイプライン単位のサイズに対応しており、例えば、64×64に設定される。本実施形態の別の変形例によれば、切り替えノードは、分割深度レベルに基づいて決定される。有利なことに、分割深度レベルは、分割木の4分木分裂の1つの深度に設定され、128×128のCTUのサイズ64×64の4つのサブCUへの4分木分裂に対応しており、したがって、復号化パイプライン単位のサイズと互換性がある。
【0016】
復号化パイプライン単位は、仮想復号化パイプライン単位(Virtual Decoding Pipeline Unit、VPDU)と呼ばれる場合もある。
【0017】
少なくとも1つの実施形態の別の一般的な態様によれば、切り替えノードは、信号通知される。有利なことに、本実施形態は、例えば、RDコストに基づいて、各CTUに切り替えノードを適合させることができる。
【0018】
少なくとも1つの実施形態の別の一般的な態様によれば、前述の説明のいずれかの方法または装置に従って生成されたデータコンテンツを含む、非一時的なコンピュータ可読媒体が提示される。
【0019】
少なくとも1つの実施形態の別の一般的な態様によれば、前述の説明のいずれかの方法または装置に従って生成されたビデオデータを含む、信号が提供される。少なくとも1つの実施形態の別の一般的な態様によれば、信号データは、分割ブロックサイズに基づいてインターリーブされる。したがって、信号データは、復号化パイプライン単位のために有利に配置される。
【0020】
また、本実施形態のうちの1つ以上は、上で説明される方法のいずれかに従ってビデオデータを符号化または復号化するための命令が保存されたコンピュータ可読記憶媒体を提供する。また、本実施形態は、上で説明される方法に従って生成されたビットストリームが保存されたコンピュータ可読記憶媒体を提供する。また、本実施形態は、上で説明される方法に従って生成されたビットストリームを送信するための方法および装置を提供する。また、本実施形態は、説明された方法のいずれかを実行するための命令を含むコンピュータプログラム製品を提供する。
【図面の簡単な説明】
【0021】
図1】圧縮されたHEVCピクチャを表すためのコード化木単位(Coding Tree Unit、CTU)およびコード化木(Coding Tree、CT)の概念の例を示す。
図2】4分木に2分木を加える(Quad-Tree plus Binary-Tree、QTBT)方式における、コード化単位、および関連するコード化木の分割例を示す。
図3-4】いくつかのCUの2分木または3分木分割の例を示す。
図5-6】少なくとも1つの実施形態の一般的な態様による、それぞれ、輝度および彩度成分における、CTUの非限定的な実施形態の例示的な分割を示す。
図7-8】少なくとも1つの実施形態の一般的な態様による、符号化方法の様々な例を示す。
図9-12】少なくとも1つの実施形態の一般的な態様による、復号化方法の様々な例を示す。
図13】実施形態の様々な態様が実施され得る、ビデオエンコーダの実施形態のブロック図を示す。
図14】実施形態の様々な態様が実施され得る、ビデオデコーダの実施形態のブロック図を示す。
図15】実施形態の様々な態様が実施され得る、例示的な装置のブロック図を示す。
【発明を実施するための形態】
【0022】
図および説明は、明確にするために、典型的な符号化デバイスおよび/または復号化デバイスに見出される他の多くの要素を排除しながら、本発明の原理を明確に理解するために、関連する要素を説明するために簡略化されていることを理解されたい。本明細書では、第1、第2などの用語を使用して様々な要素を説明する場合があるが、これらの要素は、これらの用語によって限定されるべきではないことが理解されよう。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。
【0023】
画像の符号化/復号化に関して、様々な実施形態が説明される。これらの実施形態は、スライス画像またはタイル画像、タイル群画像、または画像のシーケンス全体など、画像の一部を符号化/復号化するために適用されてもよい。
【0024】
様々な方法が上で説明されており、各方法は、説明された方法を達成するための1つ以上のステップまたは動作を含む。本方法の正しい運用のために特定のステップまたは動作の順序が必要でない限り、特定のステップおよび/または動作の順序および/または使用を、修正するかまたは組み合わせてもよい。
【0025】
少なくともいくつかの実施形態は、木コード化/分割構造が輝度ブロックと彩度ブロックとの間で部分的に共有されている、ビデオを符号化または復号化するための方法に関する。
【0026】
HEVCビデオ圧縮規格では、画像は、いわゆるコード化木単位(CTU)に分割され、このサイズは、通常は64x64、128x128、または256x256ピクセルである。各CTUは、圧縮ドメインのコード化木によって表現される。このコード化木は、CTUの4分木分割であり、各リーフがコード化単位(Coding Unit、CU)と呼ばれる。次に、各CUには、イントラまたはインター予測パラメータ(予測情報)がいくつか与えられる。そのためには、CUは、1つ以上の予測単位(Prediction Units、PU)に空間的に分割され、各PUには、いくつかの予測情報が割り当てられる。図1に示すように、イントラまたはインターコード化モードは、CUレベルで割り当てられる。
【0027】
新しく出現したビデオ圧縮ツールには、HEVC規格のCU/PU/TU配置と比較して圧縮効率が向上している、圧縮ドメインのより柔軟なコード化木単位表現を含む。まず、コード化木単位表現には、コード化単位を4分木方式と2分木方式の両方で分裂させることができるコード化構造である、4分木に2分木を加える(QTBT)ことを含む。コード化木単位の例示的なコード化木表現を図2に示す。コード化単位の分裂は、エンコーダ側で、最低レート歪みコストでCTUのQTBT表現を決定することからなる、レート歪み最適化手順を経て決定される。QTBTテクノロジでは、CUの形状は正方形または長方形である。コード化単位のサイズは、常に2の累乗であり、通常は、4~128である。
【0028】
コード化単位のこの多種多様な長方形に加えて、この新しいCTU表現には、HEVCと比較して次のような異なる特性を有する。第1に、CTUのQTBT分解は、初めにCTUが4分木方式で分裂し、次に、各4分木リーフが2分方式でさらに分割され得る、2つの段階で構成されている。これは図2の右側に示されており、実線は、4分木分解フェーズを表し、破線は、4分木リーフに空間的に埋め込まれた2分分解を表す。
【0029】
第2に、イントラスライスでは、輝度ブロックおよび彩度ブロックの分割構造が分離され、独立して決定される。
【0030】
第3に、予測単位または変換単位へのCUの分割はこれ以上採用されない。言い換えると、各符号化単位は体系的に、単一の予測単位(2N×2N予測単位分割タイプ)と単一の変換単位(変換木への分割なし)で構成されている。
【0031】
最後に、図3または図4に示すように、他のいくつかのCU2分木分割または3分木分割はまた、CTUのコード化木の表現に採用することもできる。図3は、それぞれの長方形サイズ
【数1】
および
【数2】
を有する2つのサブコード化単位が得られる、サイズ(w、h)(幅および高さ)を有する正方形または長方形のコード化単位が非対称2分分裂モードのうちの1つ、例えば、HOR_UP(水平アップ)を介して分裂する、非対称2分木におけるCU分割を示す。加えて、いわゆるCUの3分木分割を図4に示す。3分木は、考慮されている配向で、CUを親CUに対してサイズ(1/4、1/2、1/4)の木サブCUに分裂することからなる。
【0032】
上述の新しいトポロジを使用すると、コード化効率が大幅に改善される。特に、彩度において大幅な利得が得られる。彩度成分のこの大きな利得は、イントラスライス内の輝度および彩度のコード化木の分離に大きく起因する。しかしながら、CTUレベルに対する輝度および彩度のコード化木のこの分離には、ハードウェアの実装に関していくつかの問題がある。少なくとも1つの実施形態では、CTUは、通常は、サイズ128x128、または256x256である。さらに、輝度および彩度成分のコード化木を完全に分離することは、これらの輝度および彩度も圧縮ドメインで完全に分離され、したがって、コード化されたビットストリームで分離された方法で表示されることも意味する。これは、少なくとも1つのデコーダの実装において、CTUサイズよりも小さい可能性のある最大復号化単位のサイズで復号化パイプラインを確実に達成したいという、いくつかの問題を引き起こす。
【0033】
通常は少なくとも1つのデコーダの実装には、64×64ベースのデコーダパイプラインが所望される。そのためには、64×64に等しい最大変換ブロックサイズが選択されている。加えて、輝度および彩度のコード化木の分離は、CTUのすべての輝度ブロックが同じCTUの彩度ブロックの前に表示される、コード化されたビットストリームを意味するため、削除される。このような場合、復号化プロセスは解析につながり、したがって、CTU全体、すなわち、128×128または256×256のピクチャ領域を空間的にカバーする、復号化された量子化ブロックデータが得られる。輝度/彩度のコード化の分離を削除した結果、これらの木が独立して選択され、コード化され、復号化される場合と比較して、コード化効率が低下する。
【0034】
したがって、コード化効率を最適化する方法で、復号化パイプライン、例えば、64×64のブロックベースの復号化パイプラインが実現可能であることを保証しながら、輝度および彩度のコード化木表現を有することが望ましい。
【0035】
そのために、少なくとも1つの実施形態は、以下を備える。
-パイプライン復号化単位に従って決定される、最大許容ブロックサイズ(CTUサイズ)から、事前定義されたブロックサイズ、または事前定義されたCUの深度レベルに至るまで、共同輝度/彩度のコード化木を有する。次に、ブロックサイズがパイプライン復号化単位以下のとき、輝度および彩度のコード化木を別個に選択、符号化、および復号化する。これは、CTUコード化木全体の一部が輝度および彩度成分によって共有され、次に、CTUコード化木の特定の深度レベルを超えると、輝度および彩度木が独立し、したがって、異なる可能性があることを意味する。本明細書以下では、この態様に言及するために、部分的に共有された輝度/彩度のコード化木という用語が使用される。
-処理されたコード化木ノードに関連付けられたブロックサイズに従って、または符号化/復号化されているコード化木ノードの深度レベルに従って、インターリーブされた輝度/彩度のコード化プロセスから、分離された輝度/彩度のコード化プロセスに切り替える。
【0036】
実際には、64×64の復号化パイプライン単位を想定して、輝度および彩度のコード化木をコード化するとき、コード化木は、共同で決定され、64×64よりも大きいブロックサイズにコード化される。次に、64×64未満のブロックサイズの場合、輝度/彩度のコード化木は、互いに分岐する可能性がある。
【0037】
有利なことに、このプロセスはまた、ビットストリーム構成において、考慮されている復号化パイプライン単位(64x64)に等しい各ピクチャ領域について、輝度および彩度圧縮信号が次から次へと現れることを確実にする。したがって、ビットストリームを解析するとき、次のパイプライン復号化単位のプロセスを開始する前に、パイプライン復号化単位64×64に等しいピクチャ領域に関連付けられたブロック残差信号が輝度成分および彩度成分の両方について完全に復号化されることが保証される。
【0038】
その上、輝度/彩度のコード化木を完全に分離する場合と比較して、コード化効率が改善される。
【0039】
セクション1では、部分的に共有されている輝度/彩度のコード化木および関連するビットストリーム構成のいくつかの実施形態が開示される。
【0040】
セクション2では、符号化方法のいくつかの実施形態が開示される。
【0041】
セクション3および4では、復号化方法のいくつかの実施形態が開示される。
【0042】
セクション5では、追加情報および一般的な実施形態が開示される。
【0043】
1部分的に共有されている輝度/彩度のコード化木、および関連するビットストリーム構成の実施形態
図5および図6は、少なくとも1つの実施形態の一般的な態様による、それぞれ、輝度および彩度成分における、CTUの非限定的な実施形態の例示的な分割を示す。どちらの例でも、考慮されているCTUサイズは、128×128であり、考慮されている復号化パイプライン単位は、64×64である。
【0044】
図5は、CTUが最初に4分木方式で分裂する最初の例を示す。これにより、図の左側に示すように、輝度成分内に64×64のコード化単位が得られ、図の右側に示すように、彩度成分内の対応する32×32のCUと位置合わせされる。図に示すように、分裂するCUのサイズが復号化単位のサイズ64×64よりも大きいとき、2つの輝度および彩度の分裂タイプは同一である。次に、64×64以下の輝度のCUの場合、分裂モードは、輝度と彩度で異なる場合がある。これは、右上の64×64のCU(3および4)を除く、図5の場合である。
【0045】
図5の底部には、図5の輝度および彩度のコード化木の場合に、本明細書で提案されているビットストリーム構成を示している。図に示すように、ビットストリーム配置の実施形態によれば、ビットストリームは、一連のコード化された輝度ブロックおよび一連のコード化された彩度ブロックをそれぞれ含む、連続した部分で構成されている。ビットストリームは、一連のコード化された輝度ブロックまたは彩度ブロックが、64×64(輝度ドメイン内)以下の空間領域、すなわち、復号化パイプライン単位に課せられた輝度サイズに対応するように構成されている。
【0046】
特定の実施形態では、所与の一連のコード化された輝度または彩度ブロックを含むビットストリーム部分は、考慮されているピクチャの空間領域のコード化されたデータを正確に含み、そのサイズは、考慮されている復号化パイプライン単位のサイズに等しい。通常はこのサイズは64×64である。
【0047】
図6は、部分的に共有された輝度/彩度のコード化木の別の実施形態を示す。128×128は、最初に垂直2分分裂を受け、2つの64×128のコード化単位が得られる。64×64よりも大きいCUサイズの場合、輝度および彩度が同期されるため、CTUは、彩度成分で同じように分裂し、2つの64×32のCUが得られる。右側のCUは、もう分裂しない。左側の128×64は、輝度および彩度成分(少なくとも1つの実施形態による、コード化木配置の共有/同期部分)で同期的に、2分水平分裂モードで分割される。
【0048】
さらに、この第2の2分分裂段階から生じるCUに関しては、サイズ64×64の輝度を有するため、輝度成分と彩度成分との間で分離された方法でさらに分裂することができる。最後に、結果として得られるビットストリーム配置および順序付けを図6の底部に示す。ここで注意すべき特定の態様は、最大復号化単位のサイズが64×64であるため、最大変換サイズも64×64になるということである。したがって、図6の64×128のCUの場合、CUは、輝度成分で2つの変換単位64×64に分裂する。同期的に、2つの彩度成分で2つの32×32のCUに分裂する。次に、ビットストリームの順序付けに関して、この空間分割から生じる64×64の輝度変換ブロックおよび32×32の彩度変換ブロックは、サイズ64×64の空間領域に対応するすべての輝度および彩度のコード化データがコード化されたビットストリームにまとめて確実に詰め込まれるように、ビットストリームにインターリーブされる。これは、図6のコード化されたデータブロック5、6、7、および8に対応している。
【0049】
2 符号化の少なくとも1つの実施形態
図7は、少なくとも1つの実施形態の一般的な態様による、符号化方法700の一例を示す。
【0050】
予備ステップ710ではて、符号化のためにブロックにアクセスする。ブロック、典型的には、CUは、ビデオの画像の空間的な分割、通常は前のセクションのCTUに属する。符号化方法700は、符号化されるブロックについて、サブブロックへの分割または分裂を再帰的に決定する。典型的には、本方法は、前のセクションのCTUであるブロックを用いて開始される。例えば、ブロックは、図2図3、または図4で説明されている分裂モードのいずれかに従ってサブブロックに分裂される。コード化木または分割情報とも呼ばれる分割木構造は、画像がどのように分割されるかを示す。したがって、ステップ720では、ブロックの分割プロセスに対応する分割木構造が決定される。有利なことに、分割木構造は、輝度ブロックと彩度ブロックとの間で部分的に共有されている。輝度ブロックと彩度ブロックとの間で部分的に共有されている分割木構造は、分割木のいくつかのブロックについて、単一分割木構造が輝度ブロックおよび彩度ブロックの両方に使用され、一方分割木の他のブロックについては、分離された分割木構造が輝度ブロックに、また彩度ブロックに使用されることを意味する。例えば、図5のCTUの輝度成分に対応する輝度ブロックは、分割木構造の第1の4分木分裂を、CTUの彩度成分のいずれかに対応する彩度ブロックと共有する。次に、図5のCU1の輝度成分に対応する輝度ブロック1、およびCU2の彩度成分のいずれかに対応する彩度ブロック2が異なる方法で分裂され、したがって、二重分割木構造が輝度ブロック1について、また共同配置された彩度ブロック2について決定される。以下では、分離木および二重木という用語は、2つの木を定義するために無差別に使用され、一方共通木、共有木、共同木、および単一木という用語は、輝度成分および彩度成分の両方について共通木を定義するために無差別に使用される。ステップ730では、ブロックは、少なくとも決定された分割木構造に基づいて、コード化される。
【0051】
実施形態によれば、単一分割木構造は、分割木のルートノードから切り替えノードに至るまで、輝度ブロックと彩度ブロックとの間で共有されており、二重分割木構造は、切り替えノードから分割木のリーフノードに至るまで、輝度ブロックおよび彩度ブロックについて決定される。したがって、共有コード化木は、より大きなブロックに使用され、一方分離木は、より小さいブロックに使用され、共有コード化木と二重コード化木との間の切り替えは、切り替えポイントまたは切り替えレベルによって定義される。例えば、ルートノードは、CTUに対応しており、一方リーフノードは、リーフCUに対応している。有利なことに、本実施形態は、復号化パイプラインの複雑性を制限しながら、いくつかのブロックに対して分離木を可能にすることによって、コード化効率を最適化する。
【0052】
実施形態によれば、部分的に共有されている分割木構造は、イントラでコード化されたビデオ画像の一部に属するブロックをコード化するために使用される。例えば、ビデオ画像の一部は、タイルまたはタイル群であり、部分的に共有されている輝度および彩度のコード化木は、イントラタイルまたはイントラタイル群にのみに使用される。
【0053】
別の実施形態によれば、部分的に共有されている分割木構造は、インターでコード化されたビデオ画像の一部に属するブロックをコード化するために使用される。
【0054】
実施形態によれば、切り替えノードは、暗黙的に決定される。有利なことに、本実施形態は、エンコーダからデコーダへの切り替えノードに信号を送らないようにする。第1の変形例では、切り替えブロックノードは、分割ブロックサイズに基づいて決定される。したがって、分割ブロックサイズは、エンコーダおよびデコーダで事前定義されたパラメータである。例えば、共有輝度/彩度のコード化木から2つの分離された輝度および彩度サブ木への切り替えは、考慮されている復号化単位のサイズに対して、コード化単位のサイズに基づいて決定される。好ましい変形例によれば、分割ブロックサイズは、64x64に設定され、したがって、64x64のブロックベースで復号化パイプラインを可能にする。図5に示すように、CTU128×128は、彩度および輝度成分両方についてコード化木を共有するが、64×64以下のサイズのCUの場合、サブ木は、彩度および輝度成分について分離される。
【0055】
第2の変形例では、切り替えブロックノードは、分割深度レベルに基づいて決定される。したがって、分割ブロックサイズは、エンコーダおよびデコーダで事前定義されたパラメータである。好ましい例によれば、分割深度レベルは、分割木の4分木分裂の1つの深度に設定される。図5に示すように、CTUの共有木は、第1の4分木分裂を含み、サブ木の下は、CUについて分離される。例えば、共有輝度/彩度のコード化木から2つの分離された輝度および彩度サブ木への切り替えは、CUの深度しきい値に対して、コード化単位の深度レベルに基づいて決定される。特定の変形例では、第1の4分木分裂が推測される。この変形例は、128x128のCTUサイズによく適合しており、第1のQT分裂によりサイズ64×64の4つのCUが生成され、その後、二重木が輝度および彩度成分用に処理される。言い換えると、共有輝度/彩度のコード化木から2つの分離された輝度および彩度サブ木への切り替えは、CUの4分木深度しきい値に対して、4分木の深度レベルのみに基づいて決定される。実際、QTBTのコード化構造では、CTUは、いわゆる2分/三分木分裂プロセスに入る前に、最初に4分木分裂プロセスを受ける。したがって、4分木関連の深度レベル、および2分/三分木の深度レベルという、2つのタイプのCUの深度レベルを考慮することができる4分木分裂を受けるCUの2分/三分木レベルは、0に等しく、4分木分裂は、4つのサブCUにつながり、4分木関連の深度レベルは、親CUと比較して1だけ増加する。
【0056】
第3の変形例では、切り替えブロックノードもまた、複合4分木/2分木/三分木の深度レベルが各CUに関連付けられている、分割深度レベルに基づいて決定される。この複合深度は、以下のように例示的に計算される。CUが4分木分裂の場合、複合深度は、親CUと子CUとの間で3だけ増加する。CUが2分木分裂の場合、複合深度は、親CUと子CUとの間で2だけ増加する。CUが三分木分裂の場合、複合深度は、親CUと中間子CUとの間で1だけ増加し、親CUと他の2つの(中間ではない)子CUとの間で3だけ増加する。本実施形態の範囲では、二重輝度/彩度のコード化木と分離木との間の切り替えは、複合深度しきい値に対する現在のCUの複合深度レベルに従って決定される。
【0057】
実施形態によれば、切り替えノードは、信号通知される。有利なことに、本実施形態は、例えば、RDコストに基づいて、各CTUに切り替えノードを適合させることができる。
【0058】
図8は、少なくとも1つの実施形態による、符号化方法の別の例を示す。図8は、エンコーダにおける所与のCTUの部分的に共有されている輝度および彩度のコード化木の決定ステップ720の実施形態を示す。図8の実施形態は、切り替えノードが分割ブロックサイズに基づいて決定される実施形態に対応している。この決定プロセスには、CTUレベルでレート歪みコスト全体を共同で最小化する、2つの輝度および彩度のコード化木を検索するための再帰的なレート歪み最適化手順が含まれる。そのためには、再帰的なプロセスの各深度レベルにおいて、(プロセスの開始時のCTU全体に対応する)考慮されているコード化単位の候補分裂モードのセット(またはその一部)が想定される。図面の左側(はいの分岐)および右側(いいえの分岐)にそれぞれ、2つの主要なケースを図8に示す。
【0059】
左側は、現在のCUのサイズが復号化パイプライン単位のサイズよりも厳密に大きい場合に対応する。その場合、少なくとも1つの実施形態によれば、輝度成分および彩度成分で一般的に使用される単一分裂モードを選択しなければならない。そのためには、現在のCUについて許容される候補分裂モードのセット内の各分裂モードsまたはCurrentSplitModeが評価され、これにより、現在の深度レベルで分裂モデルsを選択したときに行うことができる、考慮されているCUの最良のコード化に関連付けられたレート歪みコストRDcost_YCbCr(CurrentSplitMode)をもたらす。したがって、分裂モードsの評価は、分裂モードsに従って現在のCUを分割し、次いで、結果として得られる各サブコード化単位(サブCU)に対してループを行うことを含む。各サブCUについて、考慮されているサブCUの分裂モードが決定されるように、現在のRDOプロセスが再帰的に呼び出される。次に、候補分裂モードに対するこのループは、現在のCUに関連付けられた共同輝度/彩度のレート歪みコストを最小化する分裂モードの決定につながる。
【0060】
128×128のCTUの場合、4分木分裂動作は、128×128のCTUを4つの64×64のコード化単位に分割する。この分裂は、一般的な彩度/輝度のコード化木の一部として信号通知されるか、または推測されてビットを節約する。4分木分裂モードが復号化パイプライン単位のサイズ64×64よりも大きいCUについて推測される場合では、図8のプロセスの左側は、単に入力CUを4つのサブCUに分裂させ、結果として得られる各サブCUに図8のプロセスを順次再帰的に適用することからなることに留意されたい。
【0061】
図8のアルゴリズムの右側に関しては、RD検索プロセス全体がコード化木の深度レベルに達した場合に対応しており、これは、考慮されている復号化パイプライン単位のサイズ以下のコード化単位のサイズ、すなわち、切り替えノードに対応している。その場合、少なくとも1つの実施形態は、最適化されているコード化木表現全体において、考慮されている深度レベルから、共同輝度/彩度のコード化木から分離された輝度および彩度のサブコード化木に切り替えることを提案する。したがって、現在のCUに関連付けられている輝度および彩度のコード化木の決定は、2つの別個の連続する最適化手順の形態を採り、現在のCUについて最良の輝度のコード化木および最良の彩度のコード化木をそれぞれ見出す。
【0062】
これは、図8に続く2つのRDOステップに対応している。最適化ステップは、当業者から既知である。次のステップは、得られた、分離された輝度および彩度のサブコード化木から生じる、全体的な共同輝度/彩度のレート歪みコストRDcost_YCbCr(s_luma、s_chroma)を計算することを含む。s_lumaおよびs_chromaは、輝度(Y)成分および彩度(Cb+Cr)成分で、現在のCUについて見出された最良の分裂モードをそれぞれ表す。この共同RDコストは、輝度成分および彩度成分のレートを合計し(全体的なレートRを付与する)、2つの別個のコード化木検索から生じる輝度および彩度の歪みの合計として全体的な歪みDを計算することによって簡単に計算することができる。次に、全体的なRDコストは、古典的な式に従って得られ、λは、既知のラグランジュパラメーターである。
Rdcost=D+λR
【0063】
4分木分裂モードが復号化パイプライン単位のサイズ64×64よりも大きいCUについて推測される場合では、レート歪み最適分裂モードs_輝度およびs_彩度は、輝度チャネルおよび彩度チャネル内の現在のCU、currCUにそれぞれ割り当てられることに留意されたい。実際、復号化パイプライン単位のサイズよりも大きいCUでは、分裂モード間のレート歪みの競合は起こらない。
【0064】
図8の最初のモジュール/動作(輝度/彩度のコード化木の共有の可能性があるかどうか)は、例えば、図13(後で示す)のモジュール102(画像分割)に位置することができる。
【0065】
3 復号化の実施形態
図9は、少なくとも1つの実施形態の一般的な態様による、復号化方法900の一例を示す。
【0066】
予備ステップ910では、コード化されたブロックのビットストリームまたは信号は、復号化のためにアクセスされる。コード化されたブロックは、通常はCUまたはCTUである。復号化方法900は、復号化されるブロックについて、サブブロックへの分割または分裂を再帰的に決定する。例えば、コード化されたブロックは、図2図3、または図4で説明されている分裂モードのいずれかに従ってサブブロックに分裂される。したがって、ステップ920では、ブロックの分割プロセスに対応する分割木構造が決定される。有利なことに、分割木構造は、輝度ブロックと彩度ブロックとの間で部分的に共有されている。例えば、分割木構造は、復号化プロセスおよびコード化されたブロックに関連付けられた構文要素から得られる。これは、図10図13の変形実施形態例で後から説明される。ステップ930では、ブロックは、少なくとも決定された分割木構造に基づいて、復号化される。
【0067】
当業者であれば、符号化方法について説明された変形実施形態例を、本明細書では繰り返されない復号化方法900に容易に適合させるであろう。
【0068】
図10は、少なくとも1つの実施形態の一般的な態様による、復号化方法の別の例を示す。図10は、デコーダにおける所与のCTUの部分的に共有されている輝度および彩度のコード化木の決定ステップ920の実施形態を示す。図10の実施形態は、切り替えノードが分割ブロックサイズに基づいて決定される実施形態に対応している。符号化に関しても、このプロセスは、図10の図面の左側および右側にそれぞれ示している2つの部分で構成されている。図10の左側は、幅または高さが、考慮されている復号化パイプライン単位よりも大きいサイズのCUの処理を示す。図10の右側は、考慮されている復号化パイプライン単位のサイズ以下のコード化単位の復号化を示す。したがって、左側は、分裂モードの再帰的な解析を意味し、ステップ921でCUのサイズが復号化単位のサイズよりも大きい場合には、CUの復号化が可能である。このような、より大きなCUの復号化921を図11に示す。変形例によれば、4分木分裂動作は、CUをDPUサイズに等しいサブブロックに分割する(例えば、128×128のCTUの場合、4分木分裂動作は、128×128のCTUを4つの64×64のコード化単位に分割する)。
【0069】
別の変形例によれば、4分木分裂モードは、エンコーダ側に関しては、DPUサイズよりも大きいCUについて推測される場合がある。
【0070】
図10の右側に関しては、輝度成分について、次に彩度成分について、連続的かつ独立して、考慮されているピクチャ領域に含まれるコード化単位の解析、復号化、および再構築を含む。
【0071】
図10および図11のモジュール/動作は、例えば、図14(後述)のモジュール230(構文要素の解析を含むエントロピー復号化)および235(分割)との間に位置することができる。
【0072】
4 復号化の代替的な実施形態
このセクションは、セクション3の復号化プロセスの代替的な実施形態を示す。ここでの違いは、ブロック復号化プロセスが、復号化プロセスで考慮されている制約に明示的に準拠するために、復号化パイプラインベースで行われることである。実際、本原理の実施形態と互換性のあるデコーダは、次の復号化単位のプロセスを開始する前に、輝度成分および彩度成分について復号化単位のすべての復号化プロセスを有利に行うことができる。
【0073】
図12は、本発明の実施形態による、輝度ブロックおよび彩度ブロックを復号化および再構築するために使用される復号化単位ベースのプロセスを示す。このプロセスでは、最初にCTUを、復号化パイプライン単位に等しいサイズの復号化単位、通常は64×64に空間的に分割する。
【0074】
例えば、この分割は、128×128のCTUを4つの64×64のコード化単位に分割する、4分木分裂動作によって行われる。
【0075】
このプロセスには、考慮されているCTUに含まれる、(典型的なサイズ64×64の)すべての復号化単位に対するループを含む。各復号化単位について、復号化単位に含まれる輝度ブロックが最初に復号化され、次に、復号化単位に含まれる彩度ブロックが復号化され、再構築される。
【0076】
5 追加の実施形態および情報
このセクションでは、ツール、特徴、実施形態、モデル、アプローチなどを含む多種多様な態様について説明する。これらの態様の多くは、特異的に説明されており、少なくとも個々の特性を示すために、限定的に聞こえ得るように説明されることが多い。ただし、これは説明を明確にするためのものであり、これらの態様の適用または範囲を限定するものではない。実際、様々な態様のすべてを組み合わせて交換し、さらなる態様を提供することができる。さらに、これらの態様は、以前の出願で説明された態様と組み合わせて交換することもできる。
【0077】
本文書で説明および企図される態様は、多くの異なる形態で実装することができる。以下の図13図14、および図15は、いくつかの実施形態を提供するが、他の実施形態が企図されており、図13図14、および図15の考察は、実装形態の幅を限定するものではない。これらの態様のうちの少なくとも1つは、概して、ビデオコード化および復号化に関連し、少なくとも1つの他の態様は、概して、生成またはコード化されたビットストリームを送信することに関連する。これらおよび他の態様は、方法、装置、説明された方法のいずれかに従ってビデオデータをコード化または復号化するための命令を記憶したコンピュータ可読記憶媒体、および/または説明された方法のいずれかに従って生成されるビットストリームを記憶したコンピュータ可読記憶媒体として実装できる。
【0078】
本出願では、「再構築された」および「復号化された」という用語は互換的に使用され得、「ピクセル」および「サンプル」という用語は互換的に使用され得、「画像」、「ピクチャ」および「フレーム」という用語は互換的に使用され得る。必ずしもではないが、通常は、「再構築された」という用語は、エンコーダ側で使用され、一方で「復号化された」は、デコーダ側で使用される。
【0079】
様々な方法が上で説明されており、各方法は、説明された方法を達成するための1つ以上のステップまたは動作を含む。本方法の正しい運用のために特定のステップまたは動作の順序が必要でない限り、特定のステップおよび/または動作の順序および/または使用を、修正するかまたは組み合わせてもよい。
【0080】
本文書に記載されている様々な方法および他の態様を使用して、図13および図14に示すように、例えば、JVETまたはHEVCエンコーダ100およびデコーダ200の分割モジュール(102、235)およびエントロピー復号化モジュール(230)などのモジュールを修正することができる。さらに、本態様はJVETまたはHEVCに限定されず、例えば、既存または将来開発されたものであるかどうかにかかわらず、他の標準および推奨事項、ならびにそのような標準および推奨事項(JVETおよびHEVCを含む)の拡張に適用することができる。特に明記されていない限り、または技術的に除外されていない限り、本文書で説明されている態様は、個別に、または組み合わせて使用できる。
【0081】
本書では、例えば、64×64の復号化単位のパイプラインまたはブロック分割(CU、TU)サイズなど、様々な数値が使用されている。特定の値は例示を目的とし、説明される態様はこれらの特定の値に限定されない。
【0082】
図13は、例示的なエンコーダ100を示す。このエンコーダ100の変形が企図されるが、エンコーダ100は、すべての予想される変形を説明することなく、明確にするために以下に説明される。
【0083】
コード化される前に、ビデオシーケンスは、事前コード化処理(101)、例えば、入力色ピクチャに色変換(例えば、RGB 4:4:4からYCbCr 4:2:0への変換)を適用すること、または、(例えば、色成分の1つのヒストグラム等化を使用して)圧縮に対してより復元力のある信号分布を得るために、入力ピクチャ成分の再マッピングを実行することを経る場合がある。メタデータは事前処理に関連付けられ得、ビットストリームに添付され得る。
【0084】
例示的なエンコーダ100において、ピクチャは、以下に説明するように、エンコーダ要素によってコード化される。コード化されるピクチャは、分割され(102)、例えば、CUの単位で処理される。各単位は、例えば、イントラモードまたはインターモードのいずれかを使用してコード化される。単位がイントラモードでコード化されるとき、イントラ予測を実行する(160)。インターモードにおいて、動き推定(175)および動き補償(170)が行われる。エンコーダは、イントラモードまたはインターモードのどちらをその単位のコード化に使用するかを判断し(105)、例えば、予測モードフラグによって、イントラ/インター判断を示す。予測残差は、例えば、元の画像ブロックから予測されたブロックを減算すること(110)によって、計算される。
【0085】
次いで、予測残差が変換され(125)、量子化される(130)。量子化された変換係数に加えて、動きベクトルおよび他の構文要素は、ビットストリームを出力するためにエントロピー符号化される(145)。エンコーダは、変換をスキップし、非変換残差信号に直接量子化を適用し得る。エンコーダは、変換および量子化の両方をバイパスすることもでき、すなわち、残差は、変換または量子化プロセスを適用せずに直接符号化される。
【0086】
エンコーダは、コード化されたブロックを復号化して、さらに予測するための参照を提供する。量子化された変換係数は非量子化され(140)、逆変換され(150)、予測残差を復号化する。復号化された予測残差と予測されたブロックとを組み合わせて(155)、画像ブロックが再構築される。ループ内フィルタ(165)は、再構築されたピクチャに適用され、例えば、デブロッキング/SAO(サンプル適応オフセット)フィルタリングを行い、コード化アーティファクトを低減する。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
【0087】
図14は、例示的なビデオデコーダ200のブロック図を示す。例示的なデコーダ200において、ビットストリームは、以下に説明するように、デコーダ要素によって復号化される。ビデオデコーダ200は、一般に、図13で説明するような符号化パスの逆の復号化パスを行う。エンコーダ100はまた、一般に、ビデオデータをコード化することの一部としてビデオ復号化を実行する。
【0088】
特に、デコーダの入力は、ビデオエンコーダ100によって生成され得るビデオビットストリームを含む。まず、ビットストリームがエントロピー復号化され(230)、変換係数、動きベクトル、および他の符号化された情報を取得する。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。したがって、デコーダは、復号化されたピクチャ分割情報に従ってピクチャを分割することができる(235)。変換係数は非量子化され(240)、逆変換され(250)、予測残差を復号化する。復号化された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構築される。予測されたブロックは、イントラ予測(260)または動き補償予測(即ち、インター予測)(275)から取得され得る(270)。ループ内フィルタ(265)は、再構築された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
【0089】
復号化されたピクチャは、復号化後処理(285)、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)または事前コード化処理(101)で行われる再マッピングプロセスの逆を実行する逆再マッピングをさらに経ることができる。復号化後処理では、事前コード化処理で導出され、ビットストリームで信号通知されるメタデータを使用することができる。
【0090】
図15は、様々な態様および例示的な実施形態が実装されている、例示的なシステムのブロック図を示す。システム1000は、以下で説明される様々な構成要素を含むデバイスとして具現化することができ、本文書で説明される態様のうちの1つ以上を行うように構成されている。このようなデバイスの例は、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続された家電製品、およびサーバを含むが、これらに限定されない。システム1000は、図15に示され、かつ、当業者には既知であるような通信チャネルを介して、他の同様のシステムに、またディスプレイに通信可能に結合され、本文書に説明された様々な態様を実装することができる。
【0091】
システム1000は、本文書に説明された様々な態様を実装するために、内部にロードされた命令を実行するように構成された少なくとも1つのプロセッサ1010を含むことができる。プロセッサ1010は、当技術分野で既知であるように、埋め込みメモリ、入出力インターフェース、および他の様々な回路を含むことができる。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス、不揮発性メモリデバイス)を含むことができる。システム1000は、記憶デバイス1040を含むことができ、この記憶デバイスには、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブを含むが、これらに限定されない不揮発性メモリが含まれ得る。記憶デバイス1040は、非限定的な例として、内部記憶デバイス、付属の記憶デバイス、および/またはネットワークアクセス可能な記憶デバイスを含むことができる。システム1000は、データを処理して、符号化されたビデオまたは復号化されたビデオを提供するように構成されたエンコーダ/デコーダモジュール1030を含むことができ、エンコーダ/デコーダモジュール1030は、それ自体のプロセッサおよびメモリを含むことができる。
【0092】
エンコーダ/デコーダモジュール1030は、符号化および/または復号化機能を行うためにデバイスに含まれ得るモジュール(複数可)を表す。周知であるように、デバイスは、コード化および復号化モジュールの一方または両方を含み得る。さらに、エンコーダ/デコーダモジュール1030は、システム1000の別個の要素として実装することができ、または当業者には既知であるようなハードウェアとソフトウェアの組み合わせとしてプロセッサ1010内に組み込むことができる。
【0093】
本文書に説明された様々な態様を行うためにプロセッサ1010上にロードされるプログラムコードは、記憶デバイス1040内に記憶され、その後、プロセッサ1010による実行のためにメモリ1020上にロードすることができる。例示的な実施形態によれば、プロセッサ(複数可)1010、メモリ1020、記憶デバイス1040、およびエンコーダ/デコーダモジュール1030のうちの1つ以上は、本文書内で説明されたプロセスの実行中に、入力ビデオ、復号化ビデオ、ビットストリーム、方程式、数式、行列、変数、演算、および演算ロジックを含むが、これらに限定されない様々な項目のうちの1つ以上を記憶することができる。
【0094】
システム1000は、通信チャネル1060を介して他のデバイスとの通信を可能にする通信インターフェース1050を含むことができる。通信インターフェース1050は、通信チャネル1060からデータを送受信するように構成された送受信機を含むことができるが、これに限定されない。通信インターフェース1050は、モデムまたはネットワークカードを含むことができるが、これらに限定されず、通信チャネルは、有線および/または無線媒体内に実装することができる。システム1000の様々な構成要素は、内部バス、ワイヤ、およびプリント回路基板を含むが、これらに限定されない様々な好適な接続部を使用して互いに接続または通信可能に結合することができる。
【0095】
例示的な実施形態は、プロセッサ1010によって実装されるコンピュータソフトウェアによって、もしくはハードウェアによって、またはハードウェアとソフトウェアの組み合わせによって、実施することができる。非限定的な例として、例示的な実施形態は、1つ以上の集積回路によって実装され得る。メモリ1020は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、光学メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、および取り外し可能メモリなどの任意の適切なデータ記憶技術を使用して実装することができる。プロセッサ1010は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を含むことができる。
【0096】
本明細書で説明された実装形態および態様は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号で実装され得る。単一形態の実装形態の文脈でのみ考察される(例えば、方法としてのみ考察される)場合であっても、考察された特徴の実装形態はまた、他の形態(例えば、装置またはプログラム)で実装されてもよい。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理デバイスを含む処理デバイスを一般的に指す、例えば、プロセッサのような装置で実装することができる。プロセッサは、通信デバイスも含み、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタンス(「PDA」)、およびエンドユーザ間の情報の伝達を容易にする他のデバイスなども含む。
【0097】
「一実施形態(one embodiment)」もしくは「実施形態(an embodiment)」または「一実装形態(one implementation)」もしくは「実装形態(an implementation)」、ならびにそれらの他の変形への言及は、当該実施形態に関連して説明された特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本文書の全体にわたって様々な箇所において見られる、「一実施形態において」もしくは「実施形態において」または「一実装形態において」もしくは「実装形態において」という句、ならびに任意の他の変形の出現は、必ずしもすべてが同じ実施形態に言及しているわけではない。
【0098】
さらに、本文書は、情報の様々な部分を「決定すること」に言及し得る。情報の決定には、例えば、情報の推定、情報の計算、情報の予測、またはメモリからの情報の取り出しのうちの1つ以上が挙げられ得る。
【0099】
さらに、本文書は、情報の様々な部分に「アクセスすること」に言及する場合がある。情報へのアクセスには、例えば、情報の受信、(例えば、メモリからの)情報の取り出し、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の消去、情報の計算、情報の決定、情報の予測、または情報の推定のうちの1つ以上が挙げられ得る。
【0100】
さらに、本文書は、情報の様々な部分を「受信すること」に言及し得る。受信には、「アクセスすること」と同様に、広義の用語であることが意図されている。情報の受信には、例えば、情報へのアクセス、または(例えば、メモリからの)情報の取り出しのうちの1つ以上が挙げられ得る。さらに、「受信すること」は、典型的には、何らかの方法で、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の消去、情報の計算、情報の決定、情報の予測、または情報の推定などの動作中に含まれる。
【0101】
さらに、本文書は、最適化に言及し得、様々な実施形態は、完全に最適化される必要はなく、いくつかの実施形態は、通常の意味で最適化されていないモードを単に選択するだけである。
【0102】
当業者には明らかであるように、実装形態は、例えば、記憶または送信され得る情報を搬送するようにフォーマットされる多種多様な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明される実装形態のうちの1つにより生成されたデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされてもよい。このような信号は、(例えば、スペクトルの無線周波数部分を使用して)例えば、電磁波として、またはベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームをコード化することと、キャリアをコード化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログまたはデジタル情報とすることができる。信号は、既知のように、種々の異なる有線または無線リンクを介して送信することができる。信号は、プロセッサ可読媒体上に記憶することができる。
【0103】
いくつかの実施形態を説明してきた。これらの実施形態は、少なくとも、以下の一般化された発明および請求項を、様々な異なる請求項のカテゴリおよびタイプにわたって、すべての組み合わせを含めて提供する。
・デコーダおよび/またはエンコーダに適用された輝度および彩度のコード化木を修正すること。
・デコーダおよび/またはエンコーダに適用された、インターリーブされた輝度/彩度のコード化と分離された輝度/彩度のコード化とを組み合わせること。
・インターリーブされた輝度/彩度のコード化と分離された輝度/彩度のコード化とを組み合わせ、分離された輝度/彩度のコード化は、デコーダおよび/またはエンコーダに適用された復号化単位パイプラインの制約に関する情報によって制御されること。
・最大許容ブロックサイズ(CTUサイズ)から所与のブロックサイズ、または所与のCUの深度レベルに至るまで、輝度および彩度のコード化木を共同で決定、符号化、および信号通知し、サイズが所与のブロックサイズよりも小さいブロック、または所与のCUの深度レベルを超えるブロックについて、輝度および彩度のコード化木を独立して決定、符号化、および信号通知すること。
・処理されたコード化木ノードに関連付けられたブロックサイズに従って、または符号化/復号化されているコード化木ノードの深度レベルに従って、インターリーブされた輝度/彩度のコード化から、分離された輝度/彩度のコード化に切り替えること。
・デコーダおよび/またはエンコーダにおいて、いくつかの部分的に共有されている輝度および彩度のコード化木方法を可能にすること。
・いくつかの構文要素に基づいて、デコーダで適用する輝度および彩度のコード化木を選択すること。
・記載された符号化された輝度成分/彩度成分、またはそれらの変形例の1つ以上を含むビットストリームもしくは信号を作成および/または送信および/または受信および/または復号化すること。
・記載された実施形態のいずれかによる、部分的に共有されている輝度および彩度のコード化木方法を可能にする符号化/復号化を行うテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・記載された実施形態のいずれかによる、部分的に共有されている輝度および彩度のコード化木方法を可能にする符号化/復号化を行い、結果として得られる画像を(例えば、モニタ、画面、または他のタイプの表示装置を使用して)表示するテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・符号化画像を含む信号を受信するように(例えば、チューナを使用して)チャネルを選局し、記載された実施形態のいずれかによる、部分的に共有されている輝度および彩度のコード化木方法を可能にする復号化を行うテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・符号化画像を含む信号を(例えば、アンテナを使用して)地上波で受信し、記載された実施形態のいずれかによる、部分的に共有されている輝度および彩度のコード化木方法を可能にする復号化を行うテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
【0104】
様々な他の一般化された、ならびに特定化された発明および請求項もまた、本開示全体を通して支持および企図される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【手続補正書】
【提出日】2024-07-03
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオの画像を複数のコード化木単位に分割することと、
Iスライスについて、各コード化木単位は、暗黙的な4分木分割を用いて、64×64輝度サンプルを有するコード化単位に分割されるということ、及び前記コード化単位は、輝度及び彩度について、二つの別々のコード化木構文構造のルートであるいうことを示すインディケーションを復号化することと、
前記インディケーションに基づいて前記複数のコード化木単位を復号化することと、
を含む方法。
【請求項2】
現在のコード化単位が64×64を超える輝度サンプルを有しているという条件に基づいて、前記現在のコード化単位を4つの等しいサイズの正方形コード化単位に分割することを更に含む、請求項1に記載の方法。
【請求項3】
現在のコード化単位が64×64以下の輝度サンプルを有しているという条件に基づいて、輝度コード化木構造を用いて前記現在のコード化単位の輝度成分を分割し、彩度コード化木構造を用いて前記現在のコード化単位の彩度成分を分割することを更に含む、請求項1に記載の方法。
【請求項4】
彩度コード化木構造を用いて前記現在のコード化単位の彩度成分を分割することは、前記現在のコード化単位の彩度成分が更に分割されるというインディケーションを少なくとも復号化することを更に含む、請求項3に記載の方法。
【請求項5】
前記インディケーションは、構文要素から復号化される、請求項1に記載の方法。
【請求項6】
装置であって、
メモリと、
一つ以上のプロセッサと、を備え、
前記一つ以上のプロセッサは、
ビデオの画像を複数のコード化木単位に分割することと、
Iスライスについて、各コード化木単位は、暗黙的な4分木分割を用いて、64×64輝度サンプルを有するコード化単位に分割されるということ、及び前記コード化単位は、輝度及び彩度について、二つの別々のコード化木構文構造のルートであるいうことを示すインディケーションを復号化することと、
前記インディケーションに基づいて前記複数のコード化木単位を復号化することと、
を行うように構成されている、装置。
【請求項7】
前記一つ以上のプロセッサは、現在のコード化単位が64×64を超える輝度サンプルを有しているという条件に基づいて、前記現在のコード化単位を4つの等しいサイズの正方形コード化単位に分割するように更に構成されている、請求項6に記載の装置。
【請求項8】
前記一つ以上のプロセッサは、現在のコード化単位が64×64以下の輝度サンプルを有しているという条件に基づいて、輝度コード化木構造を用いて前記現在のコード化単位の輝度成分を分割し、彩度コード化木構造を用いて前記現在のコード化単位の彩度成分を分割するように更に構成されている、請求項6に記載の装置。
【請求項9】
彩度コード化木構造を用いて前記現在のコード化単位の彩度成分を分割するために、前記一つ以上のプロセッサは、前記現在のコード化単位の彩度成分が更に分割されるというインディケーションを少なくとも復号化するように更に構成されている、請求項8に記載の装置。
【請求項10】
前記インディケーションは、構文要素から復号化される、請求項6に記載の装置。
【請求項11】
ビデオの画像のコード化木単位から複数のコード化単位への分割に対応する分割木構造を決定することと、
Iスライスについて、各コード化木単位は、暗黙的な4分木分割を用いて、64×64輝度サンプルを有するコード化単位に分割されるということ、及び前記コード化単位は、輝度及び彩度について、二つの別々のコード化木構文構造のルートであるいうことを示すインディケーションを符号化することと、
前記インディケーションに基づいて前記コード化木単位を符号化することと、
を含む方法。
【請求項12】
現在のコード化単位が64×64を超える輝度サンプルを有しているという条件に基づいて、前記現在のコード化単位が4つの等しいサイズの正方形コード化単位に分割されることを決定することを更に含む、請求項11に記載の方法。
【請求項13】
現在のコード化単位が64×64以下の輝度サンプルを有しているという条件に基づいて、輝度コード化木構造を用いて前記現在のコード化単位の輝度成分が分割されることを決定し、彩度コード化木構造を用いて前記現在のコード化単位の彩度成分が分割されることを決定することを更に含む、請求項11に記載の方法。
【請求項14】
前記現在のコード化単位の彩度成分が更に分割されるというインディケーションを少なくとも符号化することを更に含む、請求項13に記載の方法。
【請求項15】
前記インディケーションは、構文要素として符号化される、請求項11に記載の方法。
【請求項16】
装置であって、
メモリと、
一つ以上のプロセッサと、を備え、
前記一つ以上のプロセッサは、
ビデオの画像のコード化木単位から複数のコード化単位への分割に対応する分割木構造を決定することと、
Iスライスについて、各コード化木単位は、暗黙的な4分木分割を用いて、64×64輝度サンプルを有するコード化単位に分割されるということ、及び前記コード化単位は、輝度及び彩度について、二つの別々のコード化木構文構造のルートであるいうことを示すインディケーションを符号化することと、
前記インディケーションに基づいて前記コード化木単位を符号化することと、
を行うように構成されている、装置。
【請求項17】
前記一つ以上のプロセッサは、現在のコード化単位が64×64を超える輝度サンプルを有しているという条件に基づいて、前記現在のコード化単位が4つの等しいサイズの正方形コード化単位に分割されることを決定するように更に構成されている、請求項16に記載の装置。
【請求項18】
前記一つ以上のプロセッサは、現在のコード化単位が64×64以下の輝度サンプルを有しているという条件に基づいて、輝度コード化木構造を用いて前記現在のコード化単位の輝度成分が分割されることを決定し、彩度コード化木構造を用いて前記現在のコード化単位の彩度成分が分割されることを決定するように更に構成されている、請求項16に記載の装置。
【請求項19】
前記一つ以上のプロセッサは、前記現在のコード化単位の彩度成分が更に分割されるというインディケーションを少なくとも符号化するように更に構成されている、請求項18に記載の装置。
【請求項20】
前記インディケーションは、構文要素として符号化される、請求項16に記載の装置。
【外国語明細書】