特許7617013 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデイジタル　ヴィーシー　ホールディングス　インコーポレイテッドの特許一覧

特許7617013ビデオエンコードおよびデコードのためのエントロピー符号化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-01-08

(45)【発行日】2025-01-17

(54)【発明の名称】ビデオエンコードおよびデコードのためのエントロピー符号化

(51)【国際特許分類】

H04N 19/70 20140101AFI20250109BHJP

H04N 19/13 20140101ALI20250109BHJP

【ＦＩ】

H04N19/70

H04N19/13

【請求項の数】 32

(21)【出願番号】P 2021555248

(86)(22)【出願日】2020-03-05

(65)【公表番号】

(43)【公表日】2022-05-18

(86)【国際出願番号】 US2020021150

(87)【国際公開番号】W WO2020185500

(87)【国際公開日】2020-09-17

【審査請求日】2023-03-06

(31)【優先権主張番号】19305279.2

(32)【優先日】2019-03-11

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】318017914

【氏名又は名称】インターデイジタルヴィーシーホールディングスインコーポレイテッド

(74)【代理人】

【識別番号】110001243

【氏名又は名称】弁理士法人谷・阿部特許事務所

(72)【発明者】

【氏名】ヤーチェン

(72)【発明者】

【氏名】ファブリスルルアンネック

(72)【発明者】

【氏名】タンギポワリエ

【審査官】松元伸次

(56)【参考文献】

【文献】Hongbin Liu, et al.，CE2: Adaptive Motion Vector Resolution for Affine Inter Mode (Test 2.1.2)，Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9-18 Jan. 2019，JVET-M0246_r1，2019年01月09日，pp.1,9

【文献】Hisao Sasai, et al.，Modified Context Derivation for Complexity reduction，Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011，JCTVC-F429，庁内DB（送付可），2011年07月21日，pp.1-2

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／００－１９／９８

(57)【特許請求の範囲】

【請求項1】

ビデオ情報に関連付けられたシンタックス情報をエンコードする方法であって、
前記ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを選択することであって、前記符号化コンテキストは、２つの符号化コンテキストから選択され、前記選択することは、隣接ブロックのシンタックス要素を用いずに起こる、ことと、
前記符号化コンテキストに基づいて前記カレント符号化単位の前記シンタックス要素をエンコードすることであって、前記カレント符号化単位の前記シンタックス要素は、ビデオエンコードモードの使用を示し、アダプティブ動きベクトルレゾリューションモードフラグを含む、ことと
を備えることを特徴とする方法。

【請求項2】

ビデオ情報に関連付けられたシンタックス情報をデコードする方法であって、
前記ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを選択することであって、前記符号化コンテキストは、２つの符号化コンテキストから選択され、前記選択することは、隣接ブロックのシンタックス要素を用いずに起こる、ことと、
前記符号化コンテキストに基づいて前記カレント符号化単位の前記シンタックス要素をデコードすることであって、前記カレント符号化単位の前記シンタックス要素は、ビデオデコードモードの使用を示し、アダプティブ動きベクトルレゾリューションモードフラグを含む、ことと
を備えることを特徴とする方法。

【請求項3】

ビデオ情報に関連付けられたシンタックス情報をエンコードする装置であって、
隣接ブロックのシンタックス要素を用いずにカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを選択し、前記符号化コンテキストは、２つの符号化コンテキストから選択され、
前記符号化コンテキストに基づいて前記カレント符号化単位の前記シンタックス要素をエンコードし、前記カレント符号化単位の前記シンタックス要素は、ビデオエンコードモードの使用を示し、アダプティブ動きベクトルレゾリューションモードフラグを含む
ように構成された１つまたは複数のプロセッサー
を備えたことを特徴とする装置。

【請求項4】

ビデオ情報に関連付けられたシンタックス情報をデコードする装置であって、
隣接ブロックのシンタックス要素を用いずにカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを選択し、前記符号化コンテキストは、２つの符号化コンテキストから選択され、
前記符号化コンテキストに基づいて前記カレント符号化単位の前記シンタックス要素をデコードし、前記カレント符号化単位の前記シンタックス要素は、ビデオデコードモードの使用を示し、アダプティブ動きベクトルレゾリューションモードフラグを含む
ように構成された１つまたは複数のプロセッサー
を備えたことを特徴とする装置。

【請求項5】

前記カレント符号化単位の前記シンタックス要素は、スキップモードフラグ、または三角形予測モード、またはカレントピクチャ参照モード、または適応ループフィルタモード、または分割モード、またはアフィンモードのうちの１つまたは複数をさらに含むことを特徴とする請求項１の方法。

【請求項6】

前記カレント符号化単位の前記シンタックス要素は、スキップモードフラグ、または三角形予測モード、またはカレントピクチャ参照モード、または適応ループフィルタモード、または分割モード、またはアフィンモードのうちの１つまたは複数をさらに含むことを特徴とする請求項２の方法。

【請求項7】

前記カレント符号化単位の前記シンタックス要素は、スキップモードフラグ、または三角形予測モード、またはカレントピクチャ参照モード、または適応ループフィルタモード、または分割モード、またはアフィンモードのうちの１つまたは複数をさらに含むことを特徴とする請求項３の装置。

【請求項8】

前記カレント符号化単位の前記シンタックス要素は、スキップモードフラグ、または三角形予測モード、またはカレントピクチャ参照モード、または適応ループフィルタモード、または分割モード、またはアフィンモードのうちの１つまたは複数をさらに含むことを特徴とする請求項４の装置。

【請求項9】

前記エンコードすることは、エントロピーエンコードすることを含むことを特徴とする請求項１または５に記載の方法。

【請求項10】

前記デコードすることは、エントロピーデコードすることを含むことを特徴とする請求項２または６に記載の方法。

【請求項11】

前記エンコードすることは、エントロピーエンコードすることを含むことを特徴とする請求項３または７に記載の装置。

【請求項12】

前記デコードすることは、エントロピーデコードすることを含むことを特徴とする請求項４または８に記載の装置。

【請求項13】

前記エントロピーエンコードすることは、ＣＡＢＡＣを含むことを特徴とする請求項９に記載の方法。

【請求項14】

前記エントロピーデコードすることは、ＣＡＢＡＣを含むことを特徴とする請求項１０に記載の方法。

【請求項15】

前記エントロピーエンコードすることは、ＣＡＢＡＣを含むことを特徴とする請求項１１に記載の装置。

【請求項16】

前記エントロピーデコードすることは、ＣＡＢＡＣを含むことを特徴とする請求項１２に記載の装置。

【請求項17】

前記隣接ブロックは、前記カレント符号化単位の左の隣接ブロックまたは前記カレント符号化単位の上の隣接ブロックの少なくとも１つを含むことを特徴とする請求項１、５、９、または１３のいずれか一項に記載の方法。

【請求項18】

前記隣接ブロックは、前記カレント符号化単位の左の隣接ブロックまたは前記カレント符号化単位の上の隣接ブロックの少なくとも１つを含むことを特徴とする請求項２、６、１０、または１４のいずれか一項に記載の方法。

【請求項19】

前記隣接ブロックは、前記カレント符号化単位の左の隣接ブロックまたは前記カレント符号化単位の上の隣接ブロックの少なくとも１つを含むことを特徴とする請求項３、７、１１、または１５のいずれか一項に記載の装置。

【請求項20】

前記隣接ブロックは、前記カレント符号化単位の左の隣接ブロックまたは前記カレント符号化単位の上の隣接ブロックの少なくとも１つを含むことを特徴とする請求項４、８、１２、または１６のいずれか一項に記載の装置。

【請求項21】

前記２つの符号化コンテキストから前記カレント符号化単位の前記シンタックス要素に関連付けられた前記符号化コンテキストを選択することは、前記カレント符号化単位のアフィンモードを決定することに基づくことを特徴とする請求項１、５、９、１３、または１７のいずれか一項に記載の方法。

【請求項22】

前記２つの符号化コンテキストから前記カレント符号化単位の前記シンタックス要素に関連付けられた前記符号化コンテキストを選択することは、前記カレント符号化単位のアフィンモードを決定することに基づくことを特徴とする請求項２、６、１０、１４、または１８のいずれか一項に記載の方法。

【請求項23】

前記１つまたは複数のプロセッサーは、前記カレント符号化単位のアフィンモードを決定することに基づいて前記２つの符号化コンテキストから前記カレント符号化単位の前記シンタックス要素に関連付けられた前記符号化コンテキストを選択するように構成されていることを特徴とする請求項３、７、１１、１５、または１９のいずれか一項に記載の装置。

【請求項24】

前記１つまたは複数のプロセッサーは、前記カレント符号化単位のアフィンモードを決定することに基づいて前記２つの符号化コンテキストから前記カレント符号化単位の前記シンタックス要素に関連付けられた前記符号化コンテキストを選択するように構成されていることを特徴とする請求項４、８、１２、１６、または２０のいずれか一項に記載の装置。

【請求項25】

前記カレント符号化単位の前記アフィンモードを決定することは、インターアフィンフラグに基づくことを特徴とする請求項２１に記載の方法。

【請求項26】

前記カレント符号化単位の前記アフィンモードを決定することは、インターアフィンフラグに基づくことを特徴とする請求項２３に記載の装置。

【請求項27】

コンピューターによって実行されると、請求項１、５、９、１３、１７、２１、または２５のいずれか一項に係る前記方法を前記コンピューターに実行させる命令を含むコンピュータプログラム。

【請求項28】

コンピューターによって実行されると、請求項２、６、１０、１４、１８、または２２のいずれか一項に係る前記方法を前記コンピューターに実行させる命令を含むコンピュータプログラム。

【請求項29】

実行可能なプログラムの命令を実行するコンピューターに、請求項１、５、９、１３、１７、２１、または２５のいずれか一項に係る方法を行わせる前記命令を格納する非一時的なコンピューター読取り可能媒体。

【請求項30】

実行可能なプログラムの命令を実行するコンピューターに、請求項２、６、１０、１４、１８、または２２のいずれか一項に係る方法を行わせる前記命令を格納する非一時的なコンピューター読取り可能媒体。

【請求項31】

請求項４、８、１２、１６、２０、または２４のいずれか一項に係る装置と、
（ｉ）信号を受信するように構成されたアンテナであって、前記信号は、画像情報を表すデータを含む、アンテナ、（ｉｉ）前記画像情報を表す前記データを含む周波数の帯域に、前記受信されている信号を制限するように構成されたバンドリミッター、および（ｉｉｉ）前記画像情報から画像を表示するように構成されたディスプレイのうちの少なくとも１つと
を備えたことを特徴とするデバイス。

【請求項32】

前記デバイスは、テレビ、テレビ信号レシーバー、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、携帯電話、タブレット、または他の電子デバイスのうちの１つを含むことを特徴とする請求項３１に記載のデバイス。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、ビデオエンコードすることおよびデコードすることを含む。

【背景技術】

【0002】

高い圧縮効率を達成するために、通常、画像およびビデオの符号化スキームは、予測および変換を使って、ビデオコンテンツにおける空間および時間の冗長をレバレッジする。一般に、イントラ予測またはインター予測は、フレーム内またはフレーム間の相関関係を利用するのに使用され、次に、多くの場合、予測誤差または予測残差として示される、元のピクチャブロックと予測されたピクチャブロックとの間の差分は、変換され、量子化され、およびエントロピー符号化される。ビデオを再構成するために、圧縮されたデータは、予測、変換、量子化、およびエントロピー符号化（entropy coding）に対応する逆処理によってデコードされる。

【発明の概要】

【0003】

一般に、本開示の様相は、種々のアプローチまたは修正をエントロピー符号化に提供することを含む。

【0004】

少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らすエンコーダーおよび／またはデコーダーに含む、態様の少なくとも１つの例が提供される。

【0005】

ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いずに行われ、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする方法を含む態様の少なくとも１つの他の例が提供される。

【0006】

ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いずに行われ、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする方法を含む態様の少なくとも１つの他の例が提供される。

【0007】

隣接ブロックのシンタックス要素を用いずに、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする装置を含む態様の少なくとも１つの他の例が提供される。

【0008】

隣接ブロックのシンタックス要素を用いずに、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする装置を含む態様の少なくとも１つの他の例が提供される。

【0009】

態様の少なくとも１つの他の例は、アダプティブ動きベクトルレゾリューション（Adaptive Motion Vector Resolution；ＡＭＶＲ）フラグを含むシンタックス要素、またはコンテキスト適応バイナリ算術符号化（Context Adaptive Binary Arithmetic Coding；ＣＡＢＡＣ）を含むエントロピー符号化のフォーム、または左および上の隣接するシンタックス要素を用いて１つまたは複数のシンタックス要素のコンテキスト数を減らすこと、または同一のブロックサイズについての複数の異なるビンインデックス（bin index）に対してコンテキストを共有することに基づいて１つまたは複数のシンタックス要素のコンテキスト数を減らすこと、または例えば、最後の有意係数の座標をシグナリングする場合、異なるブロックサイズに対してコンテキストインデックスセットを共有することのうちの１つまたは複数を含むことが可能である。

【0010】

以下に説明されるように、増加している圧縮効率または符号化効率、および減少している複雑さのうちの１つまたは両方を含むが限定されないビデオエンコードおよび／またはデコードシステムに改良を提供することが可能である、種々の修正および態様が想像される。

【0011】

上述は、本開示のいくつかの様相の基本的な理解を提供するために、主題の簡略化された要約を与える。本要約は、主題の広範な概要ではない。態様の重要な／重大な要素を識別することも主題の範囲の境界を明示することも意図されない。唯一の目的は、以下に提供されるより詳細な説明の前置きとして簡略化されたかたちにおいて主題のいくつかの概念を与えることである。

【0012】

本開示は、添付の図面と連係して以下の詳細な説明を検討することによって、よりよく理解されることがある。

【図面の簡単な説明】

【0013】

【図1】ビデオエンコーダーの態様の例を描くブロック図を提供する。

【図2】ビデオデコーダーの態様の例を描くブロック図を提供する。

【図3】圧縮されたピクチャを表すのに使用されることが可能であるＣＴＵ（Coding Tree Unit）およびコーディングツリー（Coding Tree）の概念を例示する。

【図4】ＣＴＵ（Coding Tree Unit）と、ＣＵ（Coding Unit）、ＰＵ（Prediction Unit）、およびＴＵ（Transform Unit）へのＣＴＵの区分とを例示する。

【図5】ＱＴＢＴ（Quad-Tree plus Binary-Tree）表現の例を例示する。

【図6】水平スプリッティングモード（図６の左側）および垂直スプリッティングモード（図６の右側）を含むＣＵ（Coding Unit）に対するトリプルツリー（Triple-Tree）スプリッティングモード（splitting mode）の例を例示する。

【図7】種々のＣＵスプリッティングモードの例を例示する。

【図8】シンタックス要素から２値化された値まで、ビン（bin）のいくつかのコンテキストベース算術符号化まで、およびビン（bin）のいくつか他のバイパス符号化までのＣＡＢＡＣ符号化処理の例を例示するフロー図を提供する。

【図9】コンテキストモデル導出の少なくとも１つの態様において、例えば、inter_affine_flagに対して使用される隣接ブロックの例を例示する。

【図10】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【図11】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【図12】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【図13】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【図14】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【図15】本明細書に説明される種々の様相および態様に係る装置の態様の例を例示するブロック図を提供する。

【図16】本開示の１つまたは複数の様相に係る態様の種々の例を例示するフロー図を提供する。

【発明を実施するための形態】

【0014】

図面は、種々の様相および態様の例を例示する目的のためであり、必ずしも唯一の可能性のある構成ではないことが理解されるべきである。種々の図面を通じて、同様の参照符号は、同一のまたは類似の機能を引用する。

【0015】

さて図面に目を向けると、図１は、例えば、ＨＥＶＣエンコーダーなどのビデオエンコーダー１００の例を例示する。ＨＥＶＣは、ＪＣＴ－ＶＣ（Joint Collaborative Team on Video Coding）によって展開されている圧縮規格である（例えば、「ITU-T H.265 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU (10/2014), SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Infrastructure of audiovisual services - Coding of moving video, High efficiency video coding, Recommendation ITU-T H.265」を参照）。さらに、図１は、改良がＨＥＶＣ規格に対してされたエンコーダー、または例えば、ＶＶＣ（Versatile Video Coding）と呼ばれる開発成果に関連付けられた、例えば、ＪＶＥＴ（Joint Video Experts Team）による開発のもとのＪＥＭ（Joint Exploration Model）に基づくもしくはＪＥＭよりよいものにされたエンコーダーなどのＨＥＶＣに類似した技術を使ったエンコーダーを例示することもある。

【0016】

本出願にて、用語「再構成される」および「デコードされる」は、交換可能に使用されることがあり、用語「ピクセル」および「サンプル」は、交換可能に使用されることがあり、用語「ピクチャ」および「フレーム」は、交換可能に使用されることがある。必ずしもではないが、通常、用語「再構成される」は、エンコーダー側にて使用される一方、「デコードされる」は、デコーダー側にて使用される。

【0017】

ＨＥＶＣの指定は、「ブロック（block）」と「ユニット（unit）」とを区別し、「ブロック」は、サンプルアレイにおける特定の領域（例えば、輝度、Ｙ）に向けられ、「ユニット」は、すべてのエンコードされた色成分（Ｙ、Ｃｂ、Ｃｒ、またはモノクロ）の同一位置に置かれたブロック、シンタックス要素、およびブロックに関連付けられた予測データ（例えば、動きベクトル）を含む。

【0018】

符号化に対して、ピクチャは、構成可能なサイズを有するマスの形状の符号化ツリーブロック（coding tree block；ＣＴＢ）に分割され、符号化ツリーブロックの連続したセットは、スライスに分類される。ＣＴＵ（Coding Tree Unit）は、エンコードされた色成分のＣＴＢを含む。ＣＴＢは、符号化ブロック（Coding Block；ＣＢ）に分割されている四分木の根であり、符号化ブロックは、１つまたは複数の予測ブロック（Prediction Block；ＰＢ）に分割され、変換ブロック（Transform Block；ＴＢ）に分割されている四分木の根を形成することがある。符号化ブロック、予測ブロック、および変換ブロックに対応して、ＣＵ（Coding Unit）は、ＰＵ（Prediction Unit）と、ＴＵ（Transform Unit）のツリー構造のセットとを含み、ＰＵは、すべての色成分に対する予測情報を含み、ＴＵは、各色成分に対する残差符号化シンタックス構造を含む。輝度成分のＣＢ、ＰＢ、およびＴＢのサイズは、対応するＣＵ、ＰＵ、およびＴＵに適用される。本出願にて、用語「ブロック」は、ＣＴＵ、ＣＵ、ＰＵ、ＴＵ、ＣＢ、ＰＢ、およびＴＢのいずれかを引用するのに使用されることが可能である。そのうえ、さらに「ブロック」は、Ｈ．２６４／ＡＶＣまたは他のビデオ符号化規格において指定されているマクロブロックおよび分割を引用するのに、より一般に、種々のサイズのデータについての配列を引用するのに使用されることも可能である。

【0019】

図１のエンコーダー１００にて、ピクチャは、以下に説明されているエンコーダーエレメントによってエンコードされる。エンコードされるピクチャは、ＣＵの単位にて処理される。各ＣＵは、イントラモードかインターモードかのいずれかを用いてエンコードされる。ＣＵがイントラモードにてエンコードされる場合、イントラ予測を行う（１６０）。インターモードにて、動き推定（１７５）および補償（１７０）が行われる。エンコーダーは、ＣＵをエンコードするために使用するイントラモードまたはインターモードのうちのいずれか１つに決め（１０５）、イントラ／インターの決定を予測モードフラグによって示す。予測残差は、予測されたブロックを元の画像ブロックから減じる（１１０）ことによって算出される。

【0020】

次に、予測残差は、変換され（１２５）、量子化される（１３０）。量子化された変換係数は、動きベクトルおよび他のシンタックス要素も同様に、エントロピー符号化されて（１４５）、ビットストリームを出力する。さらに、エンコーダーは、変換をスキップし、変換されない残差信号に４×４ＴＵベースにて量子化を直に適用することもある。さらに、エンコーダーは、変換および量子化の両方をバイパスすることもあり、すなわち、残差が、変換または量子化の処理の適用なしに直に符号化される。ダイレクトＰＣＭ符号化にて、適用される予測がなく、符号化単位のサンプルは、ビットストリームに直に符号化される。

【0021】

エンコーダーは、エンコードされたブロックをデコードして、さらなる予測のために参照を提供する。量子化された変換係数が非量子化され（１４０）逆変換されて（１５０）、予測残差をデコードする。デコードされた予測残差および予測されたブロックを組み合わせて（１５５）、画像ブロックが再構成される。インループフィルタ（１６５）が、再構成されたピクチャに適用され、例えば、デブロッキング／ＳＡＯ（Sample Adaptive Offset）フィルタリングを行って、エンコードするアーチファクトを減らす。フィルタリングされた画像は、参照ピクチャバッファ（１８０）に格納される。

【0022】

図２は、例えば、ＨＥＶＣデコーダーなどのビデオデコーダー２００の例についてのブロック図を例示する。例示的なデコーダー２００にて、信号またはビットストリームが、以下に説明されているデコーダーエレメントによってデコードされる。一般に、ビデオデコーダー２００は、図１に説明されているエンコーディングパスと逆のデコーディングパスを行い、ビデオデータをエンコードする一部としてビデオデコードを行う。さらに、図２は、改良がＨＥＶＣ規格に対してされたデコーダー、または例えば、ＪＥＭに基づくもしくはＪＥＭよりよいものにされたデコーダーなどのＨＥＶＣに類似した技術を使ったデコーダーを例示することもある。

【0023】

特に、デコーダーの入力は、例えば、図１のビデオエンコーダー１００などのビデオエンコーダーによって生成されることが可能であるビデオ信号またはビットストリームを含む。第１に、信号またはビットストリームがエントロピーデコード（２３０）されて、変換係数、動きベクトル、および他の符号化情報を取得する。変換係数が非量子化され（２４０）逆変換されて（２５０）、予測残差をデコードする。デコードされた予測残差および予測されたブロックを組み合わせて（２５５）、画像ブロックが再構成される。予測されたブロックは、イントラ予測（２６０）または動き補償された予測（すなわち、インター予測）（２７５）から取得される（２７０）ことが可能である。ＡＭＶＰ（Advanced Motion Vector Prediction）およびマージモード技術は、動き補償のために、動きベクトルを導出するのに使用されることがあり、補間フィルタを使用して、参照ブロックのサブインテジャーサンプル（sub-integer sample）に対して補間値を算出することがある。インループフィルタ（２６５）が、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ（２８０）に格納される。

【0024】

ＨＥＶＣビデオ圧縮規格にて、動き補償された時間予測は、動画の連続するピクチャ間に存在する冗長を利用するのに使われる。そうするために、動きベクトルは、各予測単位（prediction unit）（ＰＵ）に対して関連させられる。各ＣＴＵ（Coding Tree Unit）は、圧縮領域においてコーディングツリー（Coding Tree；ＣＴ）によって表される。今述べたことは、図３に例示されるように、各葉がＣＵ（Coding Unit）と呼ばれる、ＣＴＵの四分木の区分である。

【0025】

次に、各ＣＵは、いくつかのイントラ予測もしくはインター予測のパラメーターまたは予測情報（Prediction Info）を与えられる。そうするために、１つまたは複数のＰＵ（Prediction Unit）に空間的に分割され、各ＰＵが、いくつかの予測情報を割り当てられる。イントラ符号化モードまたはインター符号化モードは、コーディングユニット（Coding Unit）、プレディクションユニット（Prediction Unit）、およびトランスフォームユニット（Transform Unit）へのコーディングツリーユニット（Coding Tree Unit）の区分の例を示す図４に例示されるように、ＣＵレベルにて割り当てられる。ＣＵを符号化するために、予測ブロックまたは予測単位（prediction unit）（ＰＵ）は、隣接する再構成されたサンプルから構築される（イントラ予測）、またはＤＰＢ（Decoded Pictures Buffer）に格納された以前に再構成されたピクチャから構築される（インター予測）。次に、元のサンプルとＰＵサンプルとの間の差分として算出された残差サンプルが、変換され量子化される。

【0026】

ＨＥＶＣ以外のコーデックおよびビデオ圧縮ツール、例えば、ＪＥＭ（Joint Exploration Model）、およびＶＴＭ（VVC（Versatile Video Coding） Test Model）として知られているＶＶＣ参照ソフトウェアにおいてＪＶＥＴ（Joint Video Exploration Team）グループによって展開されているＪＥＭは、圧縮領域において、より柔軟なやり方にてピクチャデータを表す圧縮領域におけるＣＴＵ表現を考慮に入れておくことがある。符号化ツリーのより柔軟な表現は、例えば、ＨＥＶＣ規格のＣＵ／ＰＵ／ＴＵ配列などのアプローチと比較して、増加している圧縮効率を与えることが可能である。より柔軟な表現の１つの例は、ＱＴＢＴ（Quad-Tree plus Binary-Tree）符号化ツールである。例えば、ＱＴＢＴなどの表現の例は、四分木にておよび二分木の流儀にて両方にスプリッティングされることが可能である符号化単位を有する符号化ツリーを示す図５において例示される。符号化単位のスプリッティング（splitting）は、最小レート歪コストを有するＣＴＵのＱＴＢＴ表現を決定する、最適化手順、例えばレート歪最適化手順に基づいてエンコーダー側にて決められることが可能である。

【0027】

ＱＴＢＴ技術にて、ＣＵは、正方形か長方形かのいずれかの形状を有することが可能である。符号化単位の大きさは、２の累乗であり、例えば、４から１２８までの範囲を有することがある。符号化単位に対する今述べたいろいろな長方形の形状に加えて、例えば、ＱＴＢＴなどのＣＴＵの表現は、例えば、ＨＥＶＣなどのアプローチとは異なる次の特徴を有することが可能である。
●ＣＴＵのＱＴＢＴ分解は、２つのステージから作られる。最初に、ＣＴＵが四分木の流儀にてスプリッティングされ、次に、各々の四分木の葉がバイナリの流儀にてさらに区分されることが可能である。今述べたことは、図５の右側に例示され、実線が、四分木分解フェーズを表し、ダッシュ記号の線が、四分木の葉に空間的に埋め込まれたバイナリ分解を表す。
●イントラスライスにて、ＬｕｍａブロックおよびＣｈｒｏｍａブロックの分割構造は、分離され、独立に決められる。
●予測単位（prediction unit）または変換単位（transform unit）へのＣＵ分割は、使われず、すなわち、各ＣＵは、単一の予測単位（２Ｎ×２Ｎ予測単位分割タイプ）および単一の変換単位（変換ツリーへの区分なし）から体系的に作られる。

【0028】

あるシステムは、１つまたは複数の種々の他のＣＵスプリットモード（split mode）を使用することがある。例えば、ＶＶＣ（Versatile Video Coding）ビデオ圧縮規格は、図６に示されている水平または垂直トリプルツリースプリッティングモードに対して提供する。図６に示されるように、トリプルツリースプリッティングは、考慮される空間的な区分の方向に親ＣＵのサイズの１／４、１／２、および１／４に等しいそれぞれのサイズにより、３つのサブコーディングユニット（sub-coding-unit）（サブＣＵ）にＣＵを区分することを含むことが可能である。種々の他のスプリッティングモードは、図７に例示される。

【0029】

スプリッティングの後に、イントラ予測またはインター予測は、フレーム内またはフレーム間の相関関係を利用するのに使用され、次に、多くの場合、予測誤差または予測残差として示される、元のブロックと予測されたブロックとの間の差分は、変換され、量子化され、およびエントロピー符号化される。ビデオを再構成するために、圧縮されたデータは、エントロピー符号化、量子化、変換、および予測に対応する逆処理によってデコードされる。

【0030】

一般に、本開示の様相は、変換係数、インター予測フラグ、および分割フラグのエントロピー符号化のうちの１つまたは複数を含むことが可能である。少なくとも１つの態様にて、エントロピー符号化に関連付けられた少なくともいくつかのシンタックス要素のシグナリングおよび構文解析の複雑さを減らすことが可能である。例えば、少なくとも１つの態様にて、複雑さを減らすことは、デコーダー処理における演算の数、および／または例えば、コンテキストベース適応バイナリ算術符号化（context-based adaptive binary arithmetic coding；ＣＡＢＡＣ）などのエントロピー符号化のフォームに対して使用されるコンテキストの数を減らすことを含むことが可能である。

【0031】

ＣＡＢＡＣは、シンタックス要素をビットストリームにエンコードするのに使用されることが可能である。ＣＡＢＡＣによりエンコードするために、非バイナリのシンタックス要素の値は、ビンストリング（bin string）と呼ばれるバイナリシーケンスにマッピングされる。ビン（bin）に対して、コンテキストモデルが選択される。コンテキストモデルは、各ビン（bin）が「１」または「０」である確率が格納され、適応的または静的であることが可能である。静的モデルは、ビン「０」および「１」に対して等しい確率により符号化エンジンをトリガする。アダプティブ符号化エンジン（adaptive coding engine）にて、コンテキストモデルは、ビンの実際に符号化されている値に基づいて更新される。適応的モデルおよび静的モデルに対応する動作モードは、図８に示されるように、それぞれ、通常モードおよびバイパスモードと呼ばれる。

【0032】

通常モードに対して、コンテキストは、カレントビンのデコードのために取得される。コンテキストは、図８に示されているコンテキストモデラー（context modeler）によって与えられる。コンテキストの目的は、いくつかのコンテキストの先の情報Ｘが与えられる、カレントビンが値「０」を有する条件付き確率を取得することである。先のＸは、カレントビンがデコードされているときに、エンコーダー側およびデコーダー側の両方にて同期的に利用可能な、すでにデコードされたシンタックス要素の値であることが可能である。

【0033】

典型的に、ビンのデコードのために使用される先のＸは、規格にて指定され、デコードするカレントビンと統計的な相関があるので選択される。今述べたコンテキスト情報を用いることの重要性は、ビンを符号化する際のレートコストを減らすことである。今述べたことは、ビンおよびＸに相関があるので、Ｘが与えられたビンの条件付きエントロピーが、より低いという事実に基づく。次の関係は、情報理論ではよく知られている。
Ｈ（ｂｉｎ｜Ｘ）＜Ｈ（ｂｉｎ）
ビンの知っているＸの条件付きエントロピーは、ビンおよびＸに統計的な相関があるならば、ビンのエントロピーより低いことを意味する。ゆえに、コンテキスト情報Ｘは、ビンが「０」または「１」である確率を取得するのに使用される。今述べた条件付き確率が与えられると、図８の通常のデコードエンジンは、２値のビンの算術デコードを行う。次に、ビンの値は、現在のコンテキスト情報Ｘを知っている、カレントビンに関連した条件付き確率の値を更新するのに使用される。今述べたことは、図８にてコンテキストモデル更新ステップと呼ばれる。ビンがデコードされている（または符号化されている）限り各ビンに対してコンテキストモデルを更新することは、各バイナリ要素に対してコンテキストモデリングを次第にリファインすることを可能にする。ゆえに、ＣＡＢＡＣデコーダーは、各々通常エンコードされたビンの統計的な挙動を次第に学習する。

【0034】

コンテキストモデラーおよびコンテキストモデル更新ステップが、エンコーダー側にておよびデコーダー側にてまったく同じ動作であることに注意する。今述べたことは、エンコーダーによってなされた２値化ステップの逆を提供する。ゆえに、ここで行われる逆変換は、これらのシンタックス要素の値を、それぞれのデコードされた２値化されたバージョンに基づいて取得することを含む。

【0035】

複数のコンテキストは、１つのシンタックス要素をシグナリングするために使用されることが可能である。例えば、ＶＶＣに提案されているようなシステム（例えば、ＶＴＭ－４）にて、１つのシンタックスごとに約３２のコンテキストを意味する、１２のシンタックス要素に対して使用される３８７のコンテキストがある。述べたように、ＣＡＢＡＣデコーダーは、各々通常エンコードされたビンの統計的な挙動を次第に学習するために、それに関して統計的なデータの総量を蓄積する必要がある。１つの符号化ビンに対して多くのコンテキストがある場合、各コンテキストの統計は、コンテキストモデルの収束および安定に十分でないことがあり、ＣＡＢＡＣデコーダーの効率に影響を与えることがある。

【0036】

一般に、少なくとも１つの態様は、通常の（またはコンテキストベースの）符号化ビンに対してＣＡＢＡＣコンテキスト（変換係数、イントラおよびインター予測フラグ、適応ループフィルタフラグおよびパーティショニングフラグなど）の数を減らすことを含むことが可能である。結果として、デコード処理の複雑さを減らすことが可能である。例えば、少なくとも１つの態様にて、最後のｘおよび最後のｙ座標（シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefix）の両方に関連付けられた４８のコンテキスト、イントラ予測フラグ（シンタックス要素pred_mode_ibc_flag）のうちの１つに対して３のコンテキスト、インター予測フラグ（シンタックス要素cu_skip_flag、inter_affine_flag、AMVR_flag、およびmerge_triangle_flag）のうちのいくつかに対して１８のコンテキスト、適応ループフィルタフラグ（シンタックス要素alf_ctb_flag）対して９のコンテキスト、ならびにいくつかの分割フラグ（シンタックス要素split_cu_flagおよびqt_split_cu_flag）に対して１５のコンテキストに関して、複雑さを減らすことが可能である。一般に、態様の少なくとも１つの例は、左および上の隣接するシンタックス要素を用いていくつかのシンタックス要素に対してコンテキスト数を減らすことに基づいて、エントロピー符号化、例えばＣＡＢＡＣに対して、コンテキスト導出処理の複雑さを減らすことを含むことが可能である。一般に、態様の少なくとも１つの例は、同一のブロックサイズのより多くの異なるビンインデックスに対して同一のコンテキスト、例えばＣＡＢＡＣコンテキストを共有すること、または最後の有意係数の座標をシグナリングする場合に異なるブロックサイズに対して同一のコンテキストインデックスセットを共有することを含むことが可能である。

【0037】

より詳細に、例えば、ＣＡＢＡＣなどの例に基づいて、種々のシンタックス要素に対して隣接するシンタックス要素を使用することを含むことが可能である、エントロピー符号化に対するコンテキスト導出処理へのアプローチが説明されるだろう。次に、今述べたシンタックス要素に対してコンテキスト導出の複雑さを減らすための態様の種々の例が説明されるだろう。次に、例えば、ＣＡＢＡＣなどのエントロピー符号化の例に対して、例示的な態様における最後の有意係数に対するコンテキスト選択へのアプローチが説明されるだろう。次に、最後の有意係数座標シグナリングについてのコンテキストの複雑さを減らすための態様の例が説明されるだろう。

【0038】

システムの１つまたは複数の例にて、いくつかの予測ツールまたはモードが使用されるかどうかを示すために、１つのフラグが、デコーダーへのビットストリームにシグナリングされることが可能である。例えば、ＣＡＢＡＣなどのエントロピー符号化の例に対して、いくつかのフラグは、隣接するシンタックス要素を用いて導出される複数のコンテキストにより符号化される。例えば、１つのフラグ、すなわちinter_affine_flagは、アフィンモデルに基づく動き補償が使用されるかどうかを示すのにシグナリングされて、カレントＣＵの予測サンプルを生成するまたはしないことが可能である。ＣＡＢＡＣに基づくエントロピー符号化へのアプローチの例に対して、inter_affine_flagは、３つのコンテキストモデルによりＣＡＢＡＣ符号化され、コンテキストモデルは、図９に描かれるような左のブロックＬおよび上のブロックＡのinter_affine_flagの和により導出される。そして、ＣＡＢＡＣコンテキストctxIncの導出処理は、次のように定式化されることが可能である。
ctxInc = (Ｌが利用可能 && Ｌがアフィン) + (Ａが利用可能 && Ａがアフィンである)
inter_affine_flagにコンテキストモデルctxIncの導出を提供する態様の例は、図１０に示されるフロー図によって例示される。さらに、同様の処理は、スキップモード（cu_skip_flag）、ＡＭＶＲモード（AMVR_flag）、三角形予測モード（merge_triangle_flag）、カレントピクチャ参照モード（pred_mode_ibc_flag）、適応ループフィルタ（alf_ctb_flag）、分割（split_cu_flagおよびqt_split_cu_flag）に対するシンタックス要素に対してＣＡＢＡＣコンテキストを導出することに適用されることも可能である。

【0039】

態様の少なくとも１つの例にて、説明されるＣＡＢＡＣ導出処理への入力は、カレントピクチャの左上のサンプルに関係のあるカレント輝度ブロックの左上の輝度サンプルを指定する輝度ロケーション（ｘ０，ｙ０）であることが可能であり、さらに、色成分cIdx、現在の符号化の四分木深度cqDepth、ならびに輝度サンプルにおけるカレント符号化ブロックの幅cbWidthおよび高さcbHeightであってもよい。説明される処理の出力は、ctxIncである。

【0040】

他のパラメーターまたは変数は、次を含むことが可能である。
●（ｘ０－１，ｙ０）に等しく設定されることが可能である、左のブロックのロケーション（xNbL，yNbL）、
●カレントブロックの左に直に位置されているブロックの有用性を指定するavailableL、
●（ｘ０，ｙ０－１）に等しく設定されることが可能である、上のブロックのロケーション（xNbA，yNbA）、および
●カレントブロックの上に直に位置されている符号化ブロックの有用性を指定するavailableA。

【0041】

ＣＡＢＡＣの例に対して、ctxIncの割り当ては、以下の表１に指定されるようなcondLおよびcondAにより次のように決定されることが可能である。
ctxInc = (condL && availableL) + (condA && availableA) + ctxSetldx*3

【0042】

【表1】

【0043】

態様の少なくとも１つの例にて、左および上のシンタックス要素に基づいて２つのコンテキストモデルのみを導出することによって、上に述べたシンタックス要素に対して説明されたコンテキスト導出処理の複雑さを減らすことが可能である。上に説明したように、ＣＡＢＡＣの例に対するinter_affine_flagは、３つのコンテキストモデルにより符号化されることが可能であり、コンテキストモデルは、左のブロックＬおよび上のブロックＡのinter_affine_flagの和により導出される。
しかしながら、隣接ブロックの情報を使用して３つのコンテキストモデルを生成する代わりに、２つのコンテキストモデルのみが導出されて、冗長なコンテキストを減らすことがすることが可能である。態様の第１の例にて、コンテキストモデルは、左のブロックＬの条件（condL）か上のブロックＡの条件（condA）かのいずれかが真であるならば、シンタックス要素に対するコンテキストが１に設定されることを示す左のブロックＬおよび上のブロックＡのinter_affine_flagのＯＲ値を用いて、導出されることが可能である。対応するctxIncの割り当て形成は、以下のように指定される。
ctxInc = (condL && availableL) || (condA && availableA) + ctxSetldx*2
態様の第２の例にて、コンテキストモデルは、両方の条件condLおよびcondAが真である場合にのみ、シンタックス要素に対するコンテキストが１に設定されることを示す左のブロックＬおよび上のブロックＡのinter_affine_flagのＡＮＤ値を用いて、導出されることが可能である。対応するctxIncの割り当て形成は、以下のように指定される。
ctxInc = (condL && availableL) && (condA && availableA) + ctxSetldx*2
例として、説明されている第１の例示的な態様に基づくinter_affine_flagに対するコンテキストモデルctxIncの導出処理は、図１１に示されるフロー図によって例示される。説明されているアプローチをこれらのシンタックス要素に適用することは、表２に示されるようにctxIncの数を減らす、すなわち、１４の可能性のあるコンテキスト削減を生じさせることが可能である。

【0044】

【表2】

【0045】

少なくとも１つの他の態様は、これらのシンタックス要素を符号化するために１つのコンテキストモデルのみを使用して、隣接ブロックを用いることを避けることを考慮に入れておくことが可能である。本態様の例が、図１６に例示される。図１６にて、１６１０において、カレント符号化単位のシンタックス要素、例えば、AMVR_flagに関連付けられた符号化コンテキストは、隣接ブロックのシンタックス要素を使用することなく、例えば、隣接ブロックのAMVR_flagを使用することなく識別されるまたは決定される。次に、１６２０にて、シンタックス要素は、符号化コンテキストに基づいてエンコードされる。コンテキスト導出の本態様は、左および上のシンタックス要素がコンテキスト導出処理にて使用されないので、ラインバッファサイズを、構文解析の複雑さも同様に、減らすことが可能である。説明されている態様をこれらのシンタックス要素にて適用することは、表３に示されるようにctxIncの数を減らす、すなわち、２８の可能性のあるコンテキスト削減を生じさせることが可能である。

【0046】

【表3】

【0047】

ＣＡＢＡＣに基づく態様の少なくとも１つの例は、シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに対して、ＣＡＢＡＣコンテキストの導出を提供することが可能である。システムの一例は、（Ｘ，Ｙ）座標を明示的にシグナリングすることによって符号化されているブロックにおいて、最後の有意係数の位置を含むことが可能である。座標Ｘが列数を、および座標Ｙが行数を示す。座標は、２つの部分、プレフィックスおよびサフィックスにおいて２値化される。第１の部分は、インターバルへのインデックス（シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefix）を表す。今述べたプレフィックスは、トランケーテッドユーナリー表現（truncated unary representation）を有し、ビンは、通常モードにてコード化される。第２の部分またはサフィックスは、固定長表現を有し、バイパスモードにて符号化され、インターバル内のオフセットを表す。１つの座標に対するトランケーテッドユーナリーコード（truncated unary code）の最大長（さらに、通常に符号化されたビンの数でもある）は、４、８、１６、３２、および６４のブロックサイズに対して、それぞれ３、５、７、９、および１１である。例として、表４は、６４に等しいブロック幅（高さ）に対する２値化を示す。第１に、最後の有意係数座標ｘ（ｙ）は、１１のビンにマッピングされ、対応するビンは、通常モードにより符号化される。

【0048】

【表4】

【0049】

同様の統計を有するトランケーテッドユーナリーパート（truncated unary part）内の異なるビンは、コンテキストの総数を減らすために、コンテキストを共有する。１つの座標のプレフィックスに対するコンテキスト数が２４（輝度に対して２１、および色差に対して３）なので、最後の位置の符号化対するコンテキストの総数は、４８である。表５は、すべてのブロックサイズＴ、輝度成分、および色差成分にわたって与えられた座標に対して、異なるビンに対するコンテキスト割り当てを示す。

【0050】

【表5】

【0051】

少なくとも１つの態様にて、今述べた処理への入力は、変数binIdx、色成分インデックスcIdx、変換ブロック幅log2TbWidthおよび変換ブロック高log2TbHeightの二進対数を含むことが可能である。今述べた処理の出力は、変数ctxIncである。変数log2TbSizeは、次のように導出される。
－構文解析されるシンタックス要素がlast_sig_coeff_x_prefixであるならば、log2TbSizeは、log2TbWidthに等しく設定される。
－そうでなければ（構文解析されるシンタックス要素がlast_sig_coeff_y_prefixである）、log2TbSizeは、log2TbHeightに等しく設定される。

【0052】

変数ctxOffsetおよびctxShiftは、次のように導出される。
－ cIdxが０に等しいならば、ctxOffsetは、(log2TbSize - 2)*3 + ((log2TbSize - 1)>>2)に等しく設定され、ctxShiftは、(log2TbSize + 1)>>2に等しく設定される。
－そうでなければ（cIdxが０より大きい）、ctxOffsetは、２１に等しく設定され、ctxShiftは、Clip3(0, 2, 2log2TbSize>>3)に等しく設定される。

【0053】

変数ctxIncは、次のように導出される。
ctxInc = (binIdx >> ctxShift) + ctxOffset
コンテキストモデルctxInc導出をlast_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに提供する態様の例は、図１２におけるフロー図によって例示される。

【0054】

一般に、態様の少なくとも１つの例は、Ｌｕｍａコンポーネントのシンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに対してＣＡＢＡＣコンテキストを導出することを考慮に入れておくことが可能である。上に説明されている例に関して述べたように、同様の統計を有するトランケーテッドユーナリーパート（truncated unary part）内の異なるビンは、コンテキストの総数を減らすために、コンテキストを共有する。１つまたは複数の態様は、輝度成分に関して、シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに対してコンテキスト数をさらに減らすことが可能である。

【0055】

少なくとも１つの態様にて、同一のブロックサイズに対してより多くの異なるビンインデックスが、同一のコンテキストを共有することが可能である。変数ctxShiftは、同一のコンテキストを共有するビンインデックスがいくつかを決めるまたは示すのに提供されることが可能であり、ctxShiftの値は、ブロックサイズlog2TbSizeに関係させられる。例えば、各ビンインデックスは、ブロックの幅（高さ）が４に等しい場合に１つのコンテキストを使用するだろう、および、各々２つのビンインデックスは、ブロックの幅（高さ）が４より大きい場合に１つのコンテキストを共有するだろう。より大きいブロックサイズ（すなわち、ブロックサイズが６４に等しい場合）に対して、各々２つのビンインデックスが１つのコンテキストを共有することの代わりに、各々３つまたは４つのビンインデックスが、１つのコンテキストを共有することが可能だろう。表６は、各々４つのビンインデックスが同一のコンテキストを共有している、ブロックサイズ６４、輝度成分に対して修正されたコンテキスト割り当てを示す。説明されている態様によって、シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixの両方に対して6つのコンテキストを減らすことが可能である。

【0056】

【表6】

【0057】

そして、説明されている態様に対して変数ctxShiftの対応する修正は、次のように導出されることが可能である。

【0058】

【数1】

【0059】

ブロックサイズ６４のより多くのビンインデックスに対して同一のコンテキストを共有している、last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixにコンテキストモデルctxIncの導出を提供する、例えば、上に説明されている態様の例は、図１３に示されるフロー図によって例示される。

【0060】

例えば、上に説明されており、図１３に例示されている態様の少なくとも１つの変形において、さらに、各々４つのビンインデックスの間にて同一のコンテキストを共有することは、他のブロックサイズに適用されることも可能である。少なくとも１つの他の変形において、さらに、各々ｘ（ｘ＞２）個のビンインデックス間にて同一のコンテキストを共有することは、他のブロックサイズに適用されることも可能である。少なくとも１つの他の変形において、さらに、各々ｘ（ｘ＞２）個のビンインデックス間にて同一のコンテキストを共有することは、色差成分の他のブロックサイズに適用されることも可能である。

【0061】

態様の少なくとも１つの例にて、異なるブロックサイズは、同一のコンテキストセットを共有することが可能である。例えば、少なくとも１つのシステムにて、輝度成分に対して、３、３、４、５、および６のコンテキストは、それぞれ４、８、１６、３２、および６４のブロックサイズに対して使用されることが可能である。そして、変数ctxOffsetは、ブロックサイズlog2TbSize（ctxOffset = [0, 3, 6, 10, 15, 21]）に関係させられることが可能であり、各ブロックサイズに対するコンテキストセットを示す。本態様の例にて、同一のコンテキストは、異なるブロックサイズに異なるコンテキストセットを割り当てる代わりに、異なるブロックサイズにクロスする同一のコンテキストセットに対して共有されることが可能だろう。表７は、同一の変数ctxOffset値を用いている、ブロックサイズ４および８、輝度成分に対して修正されたコンテキストセット割り当てを示す。そして、対応する修正された変数ctxOffset値セットは、今述べた例に対してctxOffset = [0, 0, 3, 7, 12, 18]である。態様の説明されている例に基づいて、シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixの両方に対して6つのコンテキストを減らすことが可能である。

【0062】

【表7】

【0063】

ブロックサイズ４および８に対して同一のコンテキストを共有している、last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixにコンテキストモデルctxIncの導出を提供する、例えば、説明されている態様の例は、図１４に示されるフロー図によって例示される。
例えば、上に説明されており、図１４に例示されている態様の少なくとも１つの変形は、すべてのブロックサイズの間にてコンテキストインデックスを共有することを含むことが可能である。少なくとも１つの他の変形は、異なるブロックサイズの種々の組み合わせのいずれかの間にてコンテキストインデックスを共有することを含むことが可能である。少なくとも１つの他の変形は、輝度成分および色差成分の間にてコンテキストインデックスを共有することを含むことが可能である。

【0064】

ビデオ符号化および／またはデコードを含む本明細書に説明されている１つまたは複数の態様にしたがうシステムは、種々の配列において個々のまたは組み合わされた特徴についての次の非限定の例のうちの１つまたは複数を提供することが可能である。
●左のシンタックス要素と上のシンタックス要素との和によって導出される種々のシンタックス要素に対するコンテキストインデックスは、これらの２つの隣接する要素のＯＲ値によって導出されることが可能である、
●左のシンタックス要素と上のシンタックス要素との和によって導出される種々のシンタックス要素に対するコンテキストインデックスは、これらの２つの隣接する要素のＡＮＤ値によって導出されることが可能である、
●左のシンタックス要素と上のシンタックス要素との和によって導出される種々のシンタックス要素に対するコンテキストインデックスは、隣接する要素を用いないことによって導出されることが可能である、
●最後の有意係数の座標をシグナリングするためのコンテキストインデックスは、同一のブロックサイズのより多くの異なるビンインデックスに対して同一のコンテキストを共有することが可能である、および
●最後の有意係数の座標をシグナリングするためのコンテキストインデックスは、異なるブロックサイズに対して同一のコンテキストを共有することが可能である。

【0065】

本文書は、態様、特徴、モデル、アプローチなどの種々の例を説明する。多くの上記の例は、特殊性を有して説明され、少なくとも個々の特性を示すために、多くの場合、限定するように見え得るやり方において説明される。しかしながら、今述べたことは、説明における明確さの目的のためであり、出願または範囲を限定しない。実際、本明細書に説明されている態様、特徴などの種々の例は、種々のやり方により組み合わされ交換されて、態様のさらなる例を与えることが可能である。

【0066】

一般に、本文書において説明され想定される態様の例は、多くの異なったかたちにおいて実装されることが可能である。上に説明されている図１および２ならびに下に説明されている図１０は、いくつかの態様を与えることがあるが、他の態様が想定され、図１、２、および１５の解説は、実装の広さを限定しない。一般に、少なくとも１つの態様は、ビデオエンコードすることおよび／またはデコードすることに関係のある例を与え、一般に、少なくとも１つの他の態様は、生成されたまたはエンコードされたビットストリームまたは信号を送信することに関する。今述べた態様および他の態様は、説明された方法のいずれかに従ってビデオデータをエンコードまたはデコードするために、方法、装置、命令を格納したコンピューター読み取り可能な記録媒体、および／または説明された方法のいずれかに従って生成されたビットストリームまたは信号を格納したコンピューター読み取り可能な記録媒体として実装されることが可能である。

【0067】

本出願にて、用語「再構成されている」および「デコードされている」は、交換可能に使用されることがあり、用語「ピクセル」および「サンプル」は、交換可能に使用されることがあり、用語「画像」、「ピクチャ」、および「フレーム」は、交換可能に使用されることがある。必ずしもではないが、通常、用語「再構成される」は、エンコーダー側にて使用される一方、「デコードされる」は、デコーダー側にて使用される。

【0068】

用語ＨＤＲ（ハイダイナミックレンジ）およびＳＤＲ（スタンダードダイナミックレンジ）は、本開示にて使用される。多くの場合、これらの用語は、当業者にダイナミックレンジの特定の値を伝達する。しかしながら、さらに、ＨＤＲへの言及が「より高いダイナミックレンジ」を意味すると理解され、ＳＤＲへの言及が「より低いダイナミックレンジ」を意味すると理解される、追加の態様も意図される。上記の追加の態様は、多くの場合、用語「ハイダイナミックレンジ」および「スタンダードダイナミックレンジ」に関連付けられることがあるだろうダイナミックレンジのどんな特定の値によっても制約されない。

【0069】

種々の方法が本明細書にて説明され、方法の各々は、説明されている方法を達成するために１つまたは複数のステップまたは動作を含む。ステップまたは動作の特定の順が方法の固有の操作に対して必要とされない限り、特定のステップおよび／または動作の順および／または使用は、修正される、または組み合わされることがある。

【0070】

本文書に説明されている種々の方法および他の様相は、例えば、図１に示されるエンコーダー１００のモジュール１４５、および図２に示されるデコーダー２００のモジュール２３０などのビデオエンコーダーおよび／またはデコーダーのモジュールを修正するのに使用されることが可能である。さらにその上、本様相は、ＶＶＣまたはＨＥＶＣに限定されず、例えば、以前から存在しようが将来開発されようが、他の規格および勧告に、ならびにどれかの上記の規格および勧告（ＶＶＣおよびＨＥＶＣを含む）の拡張に適用されることが可能である。特に示されない限り、または特に技術的に妨げられない限り、本文書にて説明された様相は、個々にまたは組み合わせにおいて使用されることが可能である。

【0071】

例えば、種々の数値が、本文書に使用されている。特定の値は、例示的な目的のためであり、説明された様相は、今述べた特定の値に限定されない。

【0072】

図１５は、種々の様相および態様が実装されることが可能であるシステムの例についてのブロック図を例示する。システム１０００は、以下に説明される種々のコンポーネントを含むデバイスとして具体化されることが可能であり、本文書にて説明される１つまたは複数の様相を行うように構成される。上記のデバイスの例は、限定されないが、例えば、パーソナルコンピューター、ラップトップコンピューター、スマートフォン、タブレットコンピューター、デジタルマルチメディアセットトップボックス、デジタルテレビ放送受信機、パーソナルビデオレコーディングシステム、連結される家庭用電気機器、およびサーバーなどの種々の電子デバイスを含む。システム１０００のエレメントは、単独にまたは組み合わせにて、単一の集積回路、複数のＩＣ、および／または個別のコンポーネントに具体化されることが可能である。例えば、少なくとも１つの態様にて、システム１０００の処理およびエンコーダー／デコーダーエレメントは、複数のＩＣおよび／または個別のコンポーネントにわたって分散される。種々の態様にて、システム１０００は、例えば、通信バスを介して、または専用の入力および／もしくは出力ポートを介して、他の同様のシステムに、または他の電子デバイスに通信接続される。種々の態様にて、システム１０００は、本文書に説明される１つまたは複数の様相を実装するように構成される。

【0073】

システム１０００は、例えば、本文書に説明される種々の様相を実装するためにロードされる命令を実行するように構成された少なくとも１つのプロセッサー１０１０を含む。プロセッサー１０１０は、埋め込まれたメモリー、入出力インターフェース、および当技術分野にて知られている種々の他の回路を含むことが可能である。システム１０００は、少なくとも１つのメモリー１０２０（たとえば、揮発性メモリーデバイス、および／または不揮発性メモリーデバイス）を含む。システム１０００は、限定ではないが、ＥＥＰＲＯＭ、ＲＯＭ、ＰＲＯＭ、ＲＡＭ、ＤＲＡＭ、ＳＲＡＭ、フラッシュ、磁気ディスクドライブ、および／または光ディスクドライブを含む不揮発性メモリーおよび／または揮発性メモリーを含むことが可能であるストレージデバイス１０４０を含む。ストレージデバイス１０４０は、非限定の例として、内部ストレージデバイス、付属のストレージデバイス、および／またはネットワークアクセス可能なストレージデバイスを含むことが可能である。

【0074】

システム１０００は、例えば、エンコードされたビデオまたはデコードされたビデオを提供するデータを処理するように構成されたエンコーダー／デコーダーモジュール１０３０を含み、エンコーダー／デコーダーモジュール１０３０は、独自のプロセッサーおよびメモリーを含むことが可能である。エンコーダー／デコーダーモジュール１０３０は、エンコード機能および／またはデコード機能を行うデバイスに含まれることが可能であるモジュール（複数可）を表す。既知であるように、デバイスは、エンコードモジュールおよびデコードモジュールのうちの１つまたは両方を含むことが可能である。さらに加えて、エンコーダー／デコーダーモジュール１０３０は、システム１０００の別個のエレメントとして実装されることが可能である、または当業者に知られているようにハードウェアおよびソフトウェアの組み合わせとしてプロセッサー１０１０内に組み入れられることが可能である。

【0075】

本文書に説明される種々の様相を行うプロセッサー１０１０またはエンコーダー／デコーダー１０３０上にロードされるプログラムコードは、ストレージデバイス１０４０に格納され、続いてプロセッサー１０１０による実行のためにメモリー１０２０上にロードされることが可能である。種々の態様にしたがって、１つまたは複数のプロセッサー１０１０、メモリー１０２０、ストレージデバイス１０４０、およびエンコーダー／デコーダーモジュール１０３０は、本文書に説明される処理の実行中に１つまたは複数の種々のアイテムを格納することが可能である。上記の格納されるアイテムは、限定しないが、入力ビデオ、デコードされたビデオ、またはデコードされたビデオの一部、ビットストリームまたは信号、行列、変数、ならびに等式、公式、演算、および操作ロジックの処理からの中間または最終の結果を含むことが可能である。

【0076】

いくつかの態様にて、プロセッサー１０１０および／またはエンコーダー／デコーダーモジュール１０３０の内部のメモリーは、命令を記憶し、エンコードするまたはデコードする間に必要とされる処理にワーキングメモリーを提供するのに使用される。しかしながら、他の態様にて、処理デバイス（例えば、処理デバイスは、プロセッサー１０１０またはエンコーダー／デコーダーモジュール１０３０のいずれかであることが可能である）の外部のメモリーは、１つまたは複数の今述べた機能ために使用される。外部メモリーは、メモリー１０２０および／またはストレージデバイス１０４０、例えば、ダイナミック型揮発性メモリーおよび／または不揮発性フラッシュメモリーであることが可能である。いくつかの態様にて、外部不揮発性フラッシュメモリーを使用して、テレビのオペレーティングシステムを格納する。少なくとも１つの態様にて、例えば、ＲＡＭなどの高速外部動的揮発性メモリーは、例えば、ＭＰＥＧ－２、ＨＥＶＣ、またはＶＶＣ（Versatile Video Coding）などのビデオ符号化およびデコードの動作のためのワーキングメモリーとして使用される。

【0077】

システム１０００のエレメントへの入力は、ブロック１１３０に示されるように、種々の入力デバイスを介して提供されることが可能である。上記の入力デバイスは、限定されないが、（ｉ）例えば、放送局によって電波を介して送信されるＲＦ信号を受信するＲＦ部、（ｉｉ）コンポジット入力端子、（ｉｉｉ）ＵＳＢ入力端子、および／または（ｉｖ）ＨＤＭＩ入力端子を含む。

【0078】

種々の態様にて、ブロック１１３０の入力デバイスは、当技術分野にて、知られているそれぞれの入力処理エレメントを関連付けている。例えば、ＲＦ部分は、（ｉ）望まれる周波数を選択すること（信号を選択すること、または信号を周波数の帯域に帯域制限することとも言われる）と、（ｉｉ）選択された信号をダウンコンバートすることと、（ｉｉｉ）（例えば、）ある態様にてチャネルと言われることが可能である単一の周波数帯域を選択する周波数のより狭い帯域に再び帯域制限することと、（ｉｖ）ダウンコンバートされ帯域制限された信号を復調することと、（ｖ）誤り訂正を行うことと、（ｖｉ）逆多重してデータパケットについて望まれるストリームを選択することとのためにエレメントに関連付けられることが可能である。種々の態様のＲＦ部分は、今述べた機能を行う１つまたは複数のエレメント、例えば、周波数セレクター、信号セレクター、バンドリミッター、チャネルセレクター、フィルタ、ダウンコンバーター、デモジュレーター、エラーコレクター、およびデマルチプレクサーを含む。ＲＦ部分は、例えば、受信信号を、より低い周波数（例えば、中間周波数もしくはベースバンドに近い周波数）に、またはベースバンドにダウンコンバートすることを含む、種々の機能を行うチューナーを含むことが可能である。１つのセットトップボックスの態様にて、ＲＦ部分および関連する入力処理エレメントは、ワイヤード媒体（例えば、ケーブル）を介して送信されるＲＦ信号を受信し、フィルタリングし、ダウンコンバートし、および望まれる周波数帯域に再びフィルタリングすることによって周波数選択を行う。種々の態様は、上述した（および他の）要素の順序を再配置し、今述べた要素のいくつかを取り除き、および／または同様のまたは異なる機能を行う他の要素を加える。要素を加えることは、既存の要素の間に要素を挿入すること、例えば、増幅器、およびアナログデジタル変換器を挿入することを含むことが可能である。種々の態様にて、ＲＦ部分は、アンテナを含む。

【0079】

さらに加えて、ＵＳＢおよび／またはＨＤＭＩ端末は、システム１０００を他の電子デバイスにＵＳＢおよび／またはＨＤＭＩをわたって連結するために、それぞれのインターフェイスプロセッサーを含むことが可能である。入力処理の種々の様相、例えば、リードソロモン誤り訂正が、例えば、別個の入力処理ＩＣ内に、またはプロセッサー１０１０内に実装されることが可能であることは、理解されることである。同様に、ＵＳＢまたはＨＤＭＩインターフェース処理の様相は、別個の入力処理ＩＣ内に、またはプロセッサー１０１０内に実装されることが可能である。復調された、誤り訂正された、および逆多重されたストリームは、例えば、プロセッサー１０１０と、メモリーおよびストレージエレメントと協働して動作して出力デバイスにおける提出のためにデータストリームを処理するエンコーダー／デコーダー１０３０とを含む種々の処理エレメントに提供される。

【0080】

システム１０００の種々のエレメントは、統合エンドされているハウジング内に提供されることが可能であり、統合されているハウジング内において、種々のエレメントは、相互接続され、適切な連結配列１１４０、例えば、Ｉ２Ｃバス、配線、およびプリント回路基板を含む当技術分野にて知られている内部バスを用いて、そこの間においてデータを送信することが可能である。

【0081】

システム１０００は、通信チャネル１０６０を介して他のデバイスとの通信を可能にする通信インターフェース１０５０を含む。通信インターフェース１０５０は、限定ではないが、通信チャネル１０６０を介してデータを送信するようにおよび受信するように構成されたトランシーバーを含むことが可能である。通信インターフェース１０５０は、限定ではないが、モデムまたはネットワークカードを含むことが可能であり、通信チャネル１０６０は、例えば、ワイヤードおよび／またはワイヤレス媒体内に実装されることが可能である。

【0082】

データは、種々の態様にて、例えば、ＩＥＥＥ８０２．１１などのＷｉ－Ｆｉネットワークを用いてシステム１０００にストリーミングされる。今述べた態様のＷｉ－Ｆｉ信号は、Ｗｉ－Ｆｉ通信に合わせて変えられる通信チャネル１０６０および通信インターフェース１０５０を介して受信される。典型的に、今述べた態様の通信チャネル１０６０は、ストリーミングアプリケーションおよび他のオーバーザトップ通信を可能にするために、インターネットを含む外側のネットワークへのアクセスを提供するアクセスポイントまたはルーターに連結される。他の態様は、ストリーミングされたデータをシステム１０００に、入力ブロック１１３０のＨＤＭＩ接続を介してデータを配信するセットトップボックスを用いて提供する。依然として、他の態様は、ストリーミングされたデータをシステム１０００に、入力ブロック１１３０のＲＦ接続を用いて提供する。

【0083】

システム１０００は、出力信号を、ディスプレイ１１００、スピーカー１１１０、および他の周辺デバイス１１２０を含む種々の出力デバイスに提供することが可能である。他の周辺機器デバイス１１２０は、態様の種々の例にて、スタンドアロンのＤＶＲ、ディスクプレーヤー、ステレオシステム、照明システム、およびシステム１０００の出力に基づいて機能を提供する他のデバイスのうちの１つまたは複数を含む。種々の態様にて、制御信号は、システム１０００と、ディスプレイ１１００、スピーカー１１１０、または他の周辺デバイス１１２０との間において、例えば、ＡＶ．Ｌｉｎｋ、ＣＥＣ、またはユーザーの介入の有無にかかわらずデバイスツーデバイス制御を可能にする他の通信プロトコルのようなシグナリングを用いて通信される。出力デバイスは、それぞれのインターフェース１０７０、１０８０、および１０９０を通じて専用のコネクションを介してシステム１０００に通信接続されることが可能である。代替として、出力デバイスは、システム１０００に、通信チャネル１０６０を用いて通信インターフェース１０５０を介して連結されることが可能である。ディスプレイ１１００およびスピーカー１１１０は、電子デバイス、例えば、テレビにおいて、システム１０００のその他のコンポーネントと単一のユニットに統合されることが可能である。種々の態様にて、ディスプレイインターフェイス１０７０は、ディスプレイドライバー、例えば、タイミングコントローラ（ＴＣｏｎ）チップを含む。

【0084】

代替として、ディスプレイ１１００およびスピーカー１１１０は、例えば、入力１１３０のＲＦ部分が別個のセットトップボックスの一部であるならば、１つまたは複数のその他のコンポーネントから分離されることが可能である。ディスプレイ１１００およびスピーカー１１１０が外部コンポーネントである種々の態様にて、出力信号は、例えば、ＨＤＭＩポート、ＵＳＢポート、またはＣＯＭＰ出力を含む専用の出力コネクションを介して提出されることが可能である。

【0085】

態様は、プロセッサー１０１０によって実装されるコンピュータソフトウェアによって、またはハードウェアによって、またはハードウェアおよびソフトウェアの組み合わせによって実行されることが可能である。非限定の例として、態様は、１つまたは複数の集積回路によって実装されることが可能である。メモリー１０２０は、技術的環境に適したどんなタイプのでもあることが可能であり、例えば、非限定の例として、光メモリーデバイス、磁気メモリーデバイス、半導体ベースのメモリーデバイス、固定メモリー、および取り外し可能なメモリーなどのどんな適したデータストレージ技術でも用いて実装されることが可能である。プロセッサー１０１０は、技術環境に適したどんなタイプのでもあることが可能であり、非限定の例として、マイクロプロセッサー、汎用コンピューター、専用コンピューター、およびマルチコアアーキテクチャに基づくプロセッサーのうちの１つまたは複数を含み込むことが可能である。

【0086】

本開示を通じて、種々の実装は、デコードすることを含む。本出願にて使用されている「デコードすること」は、例えば、ディスプレイに適している最終的な出力を生成するために、受信しているエンコードしているシーケンスに行われる処理のすべてまたは一部を含み込むことが可能である。種々の態様にて、上記の処理は、デコーダーによって典型的に行われる処理、例えば、エントロピーデコーディング、逆量子化、逆変換、および差分デコーディングのうちの１つまたは複数を含む。種々の態様にて、さらに、または代替えとして、上記の処理は、本出願にて説明される種々の実装のデコーダーによって行われる処理、例えば、タイル状の（パックされた）ピクチャからピクチャを抽出すること、使用するアップサンプリングフィルターを決定し次にピクチャをアップサンプリングすること、および意図されている向きに戻ってピクチャをフリッピングすることも含む。

【0087】

さらなる例として、一態様にて「デコードすること」は、「エントロピーデコーディング」のみを引用し、別の態様にて「デコードすること」は、差分デコーディングのみを引用し、別の態様にて「デコードすること」は、エントロピーデコーディングおよび差分デコーディングの組み合わせを引用する。語句「デコード処理」が具体的に演算のサブセットを引用することが意図されようと一般的により広く引用することが意図されようと、デコード処理は、特定の説明の文脈に基づいて明らかになるだろう、および当業者によって十分に理解されると信じられる。

【0088】

さらに、種々の実装は、エンコードすることも含む。「デコードすること」についての上の解説に類似したやり方において、本出願にて、使用されている「エンコードすること」は、例えば、エンコードされているビットストリームまたは信号を生成するために、入力ビデオシーケンスに行われる処理のすべてまたは一部を含み込むことが可能である。種々の態様にて、上記の処理は、エンコーダーによって典型的に行われる処理、例えば、分割、差分エンコーディング（differential encoding）、変換、量子化、およびエントロピーエンコーディング（entropy encoding）のうちの１つまたは複数を含む。種々の態様にて、さらに、または代替えとして、上記の処理は、本出願にて説明される種々の実装のエンコーダーによって行われる処理も含む。

【0089】

さらなる例として、一態様にて「エンコードすること」は、「エントロピーエンコーディング」のみを引用し、別の態様にて「エンコードすること」は、差分デエンコーディングのみを引用し、別の態様にて「エンコードすること」は、差分エンコーディングおよびエントロピーエンコーディングの組み合わせを引用する。語句「エンコード処理」が具体的に演算のサブセットを引用することが意図されようと一般により広く引用することが意図されようと、エンコード処理は、特定の説明の文脈に基づいて明らかになるだろう、および当業者によって十分に理解されると信じられる。

【0090】

本明細書にて使用されているシンタックス要素は、記述的な用語であることに注意する。上記のように、それらは他のシンタックス要素名の使用を妨げない。

【0091】

図がフロー図として与えられる場合、さらにそれは対応する装置のブロック図も提供することが理解されるべきである。同様に、図がブロック図として与えられる場合、さらにそれは対応する方法／処理のフロー図も提供することが理解されるべきである。

【0092】

種々の態様は、レート歪み最適化を引用する。特に、エンコード処理の間、レートと歪みとの間のバランスまたはトレードオフが、通例、考慮され、多くの場合、計算に関する複雑さの制約が与えられる。通例、レート歪み最適化は、レート歪み関数を最小化することとして定式化され、レートのおよび歪みの重みつき和である。レート歪み最適化問題を解くための異なったアプローチがある。例えば、アプローチは、符号化およびデコードの後に再構成されている信号の符号化コストおよび関係している歪みについての完全な評価とともに、すべての考慮されるモードまたは符号化パラメーター値を含むすべてのエンコードオプションの広範囲なテストに基づくことが可能である。さらに、より高速なアプローチは、エンコードの複雑さを除くために、特に、再構成されている１つではなく予測または予測残差信号に基づいた近似されている歪みの計算とともに使用されることも可能である。今述べた２つのアプローチの混合は、例えば、可能性のあるエンコードオプションのいくつかだけに対して近似されている歪み、および他のエンコードオプションに対して完全な歪みを使用することによってなど、使用されることも可能である。他のアプローチは、可能性のあるエンコードオプションのサブセットを評価するだけである。より一般に、多くのアプローチは、最適化を行ういろいろな技法のいずれかを使うが、最適化は、必ずしも符号化コストと関係している歪みとの両方の完全な評価であるとは限らない。

【0093】

本明細書に説明されている実装および様相は、例えば、方法もしくは処理、装置、ソフトウェアプログラム、データストリーム、または信号において実装されることが可能である。実装の単一のフォームの文脈においてのみ述べられる（例えば、方法としてのみ述べられる）場合でさえ、さらに、述べられた特徴の実装は、他のフォーム（例えば、装置またはプログラム）において実装されることも可能である。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアにおいて実装されることが可能である。方法は、例えば、コンピューター、マイクロプロセッサー、集積回路、またはプログラマブルロジックデバイスを含む、一般に処理デバイスを引用する、例えば、プロセッサーにおいて実装されることが可能である。さらに、プロセッサーは、例えば、コンピューター、携帯電話、ポータブル／パーソナルデジタルアシスタント（「ＰＤＡ」）、およびエンドユーザー間において情報の通信を容易にする他のデバイスなど、通信デバイスも含む。

【0094】

「一態様」または「態様」または「一実装」または「実装」への言及は、他の変形も同様に、態様に関連して説明された特定の特徴、構造、特性などが、少なくとも１つの態様に含まれることを意味する。ゆえに、本文書の至る所に種々の場所に現れている語句「一態様にて」または「態様にて」または「一実装にて」または「実装にて」の出現は、どんな他の変形でも同様に、必ずしも同一の態様をすべて引用しているとは限らない。

【0095】

さらに加えて、本文書は、情報の種々の部分を「取得すること」を引用することがある。情報を取得することは、例えば、情報を決定すること、情報を推定すること、情報を算出すること、情報を予測すること、または情報をメモリーから検索することのうちの１つまたは複数を含むことが可能である。

【0096】

さらに、本文書は、情報の種々の部分に「アクセスすること」を引用することがある。情報にアクセスすることは、例えば、情報を受信すること、情報を（例えば、メモリーから）検索すること、情報を格納すること、情報を移動すること、情報をコピーすること、情報を算出すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの１つまたは複数を含むことが可能である。

【0097】

さらに加えて、本文書は、情報の種々の部分を「受信すること」を引用することがある。受信することは、「アクセスすること」に関してのように、広い用語であることが意図される。情報を受信することは、例えば、情報にアクセスすること、または情報を（例えば、メモリーから）検索することのうちの１つまたは複数を含むことが可能である。さらに、典型的に、「受信すること」は、何らかの仕方または別の仕方において、例えば、情報を格納すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を算出すること、情報を決定すること、情報を予測すること、または情報を推定することなどの動作の間に含まれる。

【0098】

次の「／」、「および／または」、および「のうちの少なくとも１つ」のいずれかの使用は、例えば、「Ａ／Ｂ」、「Ａおよび／またはＢ」、および「ＡおよびＢの少なくとも１つ」の場合、第１の列挙されている選択肢（Ａ）のみの選択、または第２の列挙されている選択肢（Ｂ）のみの選択、または両方の選択肢（ＡおよびＢ）の選択を含み込むことが意図されることは、理解されるべきである。さらなる例として、「Ａ、Ｂ、および／またはＣ」および「Ａ、Ｂ、およびＣの少なくとも１つ」の場合、上記語句は、第１の列挙されている選択肢（Ａ）のみの選択、または第２の列挙されている選択肢（Ｂ）のみの選択、または第３の列挙されている選択肢（Ｃ）のみの選択、または第１および第２の列挙されている選択肢（ＡおよびＢ）のみの選択、または第１のおよび第３の列挙されている選択肢（ＡおよびＣ）のみの選択、または第２および第３の列挙されている選択肢（ＢおよびＣ）、またはすべての３つの選択肢（ＡおよびＢおよびＣ）の選択を含み込むことが意図される。今述べたことは、当業者および関連業者に明らかであるように、列挙されているだけの事項に対して拡張され得る。

【0099】

さらに、本明細書にて使用されている、単語「シグナリング」は、とりわけ、対応するデコーダーへ何かを示すことを引用する。例えば、ある態様にて、エンコーダーは、リファインメントのために複数のパラメーターのうち特定の１つをシグナリングする。このようにして、態様にて、同一のパラメーターは、エンコーダー側およびデコーダー側の両方に使用される。ゆえに、例えば、エンコーダーは、特定のパラメーターをデコーダーに送信（明示的なシグナリング）することが可能であって、デコーダーは、同一の特定のパラメーターを使用することが可能である。反対に、デコーダーが特定のパラメーターを他も同様にすでに有しているならば、シグナリングは、デコーダーに特定のパラメーターを知り選択することを単に可能にするのに、送信することなく使用されること（暗黙的なシグナリング）が可能である。いずれかの現実の機能の送信を避けることによって、ビットの節約が種々の態様にて実現される。シグナリングがいろいろなやり方において遂行されることが可能であることは、理解されることである。例えば、１つまたは複数のシンタックス要素、フラグなどは、種々の態様にて、対応するデコーダーに情報をシグナリングするのに使用される。これまでのことは、単語「シグナリング」の動詞形に関するが、さらに、単語「シグナリング」は、本明細書にて名詞として使用されることも可能である。

【0100】

当業者には明らかであろうように、実装は、例えば、格納されるまたは送信されることが可能である情報を運ぶようにフォーマットされたいろいろな信号を生成することが可能である。例えば、情報は、方法を行うための命令、または説明されている実装のうちの１つによって生成されるデータを含むことが可能である。例えば、信号は、説明されている態様のビットストリームまたは信号を運ぶようにフォーマットされることが可能である。例えば、上記の信号は、電磁波として（例えば、スペクトルの無線周波部分を用いて）またはベースバンド信号としてフォーマットされることが可能である。例えば、フォーマッティングは、データストリームをエンコードすることと、エンコードされたデータストリームにより搬送波を変調することとを含むことが可能である。例えば、信号が運ぶ情報は、アナログまたはデジタル情報であることが可能である。信号は、知られているように、いろいろな別々のワイヤードまたはワイヤレスリンクを介して送信されることが可能である。信号は、プロセッサー読取り可能媒体において格納されることが可能である。

【0101】

さらに、種々の一般化された態様も、特殊化された態様も同様に、本開示を通じてサポートされ想定される。本開示にしたがう態様の例は、次を含むが限定されない。

【0102】

一般に、態様の少なくとも１つの例は、ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いずに行われ、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする方法を含むことが可能である。

【0103】

一般に、態様の少なくとも１つの例は、ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いずに行われ、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする方法を含むことが可能である。

【0104】

一般に、態様の少なくとも１つの例は、隣接ブロックのシンタックス要素を用いずに、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする装置を含むことが可能である。

【0105】

一般に、態様の少なくとも１つの例は、隣接ブロックのシンタックス要素を用いずに、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする装置を含むことが可能である。

【0106】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位のシンタックス要素は、ビデオエンコードモードまたはビデオデコードモードの使用を示し、スキップモードフラグ、またはアダプティブ動きベクトルレゾリューションモードフラグ、または三角形予測モード、またはカレントピクチャ参照モード、または適応ループフィルタモード、または分割モード、またはアフィンモードのうちの１つまたは複数を含む。

【0107】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位のシンタックス要素は、カレント符号化単位をエンコードするまたはデコードするためのアダプティブ動きベクトルレゾリューションモードの使用を示し、隣接ブロックのシンタックス要素は、隣接ブロックをエンコードするまたはデコードするためのアダプティブ動きベクトルレゾリューションモードを示す。

【0108】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、エンコードすることおよび／またはデコードすることは、エントロピーエンコードすることおよび／またはエントロピーデコードすることを含む。

【0109】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、エントロピーエンコードすることおよび／またはエントロピーデコードすることは、ＣＡＢＡＣ含む。

【0110】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位の隣接ブロックは、カレント符号化単位の左の隣接ブロックまたはカレント符号化単位の上の隣接ブロックの少なくとも１つを含む。

【0111】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位のシンタックス要素は、アダプティブ動きベクトルレゾリューション（ＡＭＶＲ）シンタックス要素を含み、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別すること、または識別するように構成された１つまたは複数のプロセッサーは、カレント符号化単位のアフィンモードを決定することに基づく。

【0112】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位のアフィンモードを決定することは、インターアフィン（inter-affine）フラグに基づく。

【0113】

一般に、態様の少なくとも１つの例は、ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いることを避け、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする方法を含むことが可能である。

【0114】

一般に、態様の少なくとも１つの例は、ビデオ情報のカレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別することと、識別することは、隣接ブロックのシンタックス要素を用いることを避け、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする方法を含むことが可能である。

【0115】

一般に、態様の少なくとも１つの例は、隣接ブロックのシンタックス要素の使用を避けることに基づいて、カレント符号化のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をエンコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする装置を含むことが可能である。

【0116】

一般に、態様の少なくとも１つの例は、隣接ブロックのシンタックス要素の使用を避けることに基づいて、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のシンタックス要素をデコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする装置を含むことが可能である。

【0117】

【0118】

【0119】

【0120】

【0121】

【0122】

【0123】

【0124】

一般に、態様の少なくとも１つの例は、隣接ブロックのアダプティブ動きベクトルレゾリューション（ＡＭＶＲ）シンタックス要素を使用せずに、ビデオ情報のカレント符号化単位のＡＭＶＲシンタックス要素に関連付けられた符号化コンテキストを識別することと、符号化コンテキストに基づいてカレント符号化単位のＡＭＶＲシンタックス要素をエンコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする方法を含むことが可能である。

【0125】

一般に、態様の少なくとも１つの例は、隣接ブロックのＡＭＶＲシンタックス要素を使用せずに、ビデオ情報のカレント符号化単位のＡＭＶＲシンタックス要素に関連付けられた符号化コンテキストを識別することと、符号化コンテキストに基づいてカレント符号化単位のＡＭＶＲシンタックス要素をデコードすることとを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする方法を含むことが可能である。

【0126】

一般に、態様の少なくとも１つの例は、隣接ブロックのＡＭＶＲシンタックス要素を用いずに、カレント符号化単位のＡＭＶＲシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のＡＭＶＲシンタックス要素をエンコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をエンコードする装置を含むことが可能である。

【0127】

一般に、態様の少なくとも１つの例は、隣接ブロックのＡＭＶＲシンタックス要素を用いずに、カレント符号化単位のシンタックス要素に関連付けられた符号化コンテキストを識別し、符号化コンテキストに基づいてカレント符号化単位のＡＭＶＲシンタックス要素をデコードするように構成された１つまたは複数のプロセッサーを含む、ビデオ情報に関連付けられたシンタックス情報をデコードする装置を含むことが可能である。

【0128】

【0129】

【0130】

【0131】

一般に、態様の少なくとも１つの例は、本明細書に説明されている方法または装置を含むことが可能であり、カレント符号化単位のＡＭＶＲシンタックス要素に関連付けられた符号化コンテキストを識別すること、または識別するように構成された１つまたは複数のプロセッサーは、カレント符号化単位のアフィンモードを決定することに基づく。

【0132】

【0133】

一般に、態様の少なくとも１つの例は、コンピューターによって実行されると、コンピューターに、本明細書に説明されている態様の１つまたは複数の例にしたがう方法を行わせる命令を含むコンピュータープログラム製品を含むことが可能である。

【0134】

一般に、態様の少なくとも１つの例は、コンピューターが、本明細書に説明されている態様の１つまたは複数の例にしたがう方法を行う命令を実行することを生じる実行可能なプログラム命令を格納する非一時的なコンピューター読取り可能媒体を含むことが可能である。

【0135】

一般に、態様の少なくとも１つの例は、本明細書に説明されている態様のいずれか１つまたは複数の例に従って生成されたデータを含む信号を含むことが可能である。

【0136】

一般に、態様の少なくとも１つの例は、本明細書に説明されている態様の例のいずれか１つまたは複数にしたがって生成された、シンタックス要素およびエンコードされている画像情報を含むようにフォーマットされたビットストリームを含むことが可能である。

【0137】

一般に、態様の少なくとも１つの例は、本明細書に説明されている態様の例のいずれか１つまたは複数にしたがう装置と、（ｉ）信号を受信するように構成されたアンテナ、信号が、画像情報を表すデータを含む（ｉｉ）受信した信号を、画像情報を表すデータを含む周波数の帯域に制限するように構成されたバンドリミッター（band limiter）、および（ｉｉｉ）画像情報から画像を表示するように構成されたディスプレイのうちの少なくとも１つとを含むデバイスを含むことが可能である。

【0138】

一般に、態様の少なくとも１つの例は、本明細書に説明されているデバイスを含むことが可能であり、デバイスは、テレビ、テレビ信号レシーバー、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、携帯電話、タブレット、または他の電子デバイスのうちの１つを含む。

【0139】

態様の種々の例が説明された。本開示にしたがう今までに述べた態様および他の態様は、種々の異なるクレームカテゴリーおよびタイプにわたって、次の特徴または実体のいずれかを、単独でまたはどんな組み合わせにおいても含むことがある。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らすエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが左および上のシンタックス要素を用いることに基づくエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが左および上の隣接するシンタックス要素を用いることに基づくエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが同一のブロックサイズの異なるビンインデックス（bin index）に対して同一のコンテキストを共有することに基づくエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが最後の有意係数の座標をシグナリングする場合に異なるブロックサイズに対して同一のコンテキストインデックスセットを共有することに基づくエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが左および上のシンタックス要素の和に基づき、左および上のシンタックス要素の和が、左および上の隣接する要素のＯＲ値に基づいてまたは左および上の隣接する要素のＡＮＤ値に基づいて導出されることが可能であるエンコーダーおよび／またはデコーダーに提供されること。
●少なくとも１つのシンタックス要素によって提供される情報に基づいてエントロピー符号化のフォームを適用し、少なくとも１つのシンタックス要素に対してコンテキスト数を導出し、導出することがコンテキスト数を減らし、減らすことが左および上のシンタックス要素の和に基づき、左および上のシンタックス要素の和が、隣接する要素を用いないことに基づいて導出されることが可能であるエンコーダーおよび／またはデコーダーに提供されること。
●本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいてもしたがうエントロピー符号化のフォームを適用し、エントロピーエンコードのフォームがＣＡＢＡＣを含むエンコーダーおよび／またはデコーダーに提供されること。
●減っている複雑さおよび／または向上している圧縮効率を提供することに基づく本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいてもしたがうエントロピー符号化のフォームを適用するエンコーダーおよび／またはデコーダーに提供されること。
●エンコーダーおよび／またはデコーダーに、本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいてもしたがってエンコードすることおよび／またはデコードすることを提供することを可能にするシンタックス要素をシグナリングすることに挿入すること。
●今述べたシンタックス要素に基づいて、デコーダーに適用するために、本明細書に説明されている特徴または実体を単独でまたはどんな組み合わせにおいても選択すること。
●説明されたシンタックス要素の１つまたは複数、またはそのバリエーションを含むビットストリームまたは信号。
●デコーダーに、エンコーダーによって使用されるエンコードのやり方に対応するやり方においてデコードを提供することを可能にするシンタックス要素をシグナリングすることに挿入すること。
●説明されたシンタックス要素の１つまたは複数、またはそのバリエーションを含むビットストリームまたは信号を生成することおよび／または送信することおよび／または受信することおよび／またはデコードすること。
●本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいても従ってエンコードすることおよび／またはデコードすることを適用するために提供するテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
●本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいても従ってエンコードすることおよび／またはデコードすることを行い、結果として生じる画像を（例えば、モニタ、スクリーン、または他のタイプのディスプレイを用いて）表示するテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
●チャネルを（例えば、チューナーを用いて）合わせて、エンコードされている画像を含む信号を受信し、本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいても従ってエンコードすることおよび／またはデコードすることを行うテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
●エンコードされている画像を含む電波を介して信号を（例えば、アンテナを用いて）受信し、本明細書に説明されている態様、特徴、または実体のいずれかに単独でまたはどんな組み合わせにおいても従ってエンコードすることおよび／またはデコードすることを行うテレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
●本明細書に説明されている態様、特徴または実体のいずれかに単独またはどんな組み合わせにおいてもしたがって、エンコードするおよび／またはデコードするコンピューターによって実行される場合のプログラムコードを格納するコンピュータープログラム製品。
●本明細書に説明されている態様、特徴または実体のいずれかに単独またはどんな組み合わせにおいてもしたがって、エンコードすることおよび／またはデコードすることを実装する命令を実行するコンピューターのもとになる実行可能なプログラム命令を含む非一時的なコンピューター読取り可能媒体。

【0140】

さらに、種々の他の一般化された態様も、特殊化された態様も同様に、本開示を通じてサポートされ想定される。

【図1】