特表2025-505072 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ テンセント・アメリカ・エルエルシーの特許一覧

特表2025-505072コーディングされたピクチャからのＣＡＢＡＣ（Ａｄａｐｔｉｖｅｃｏｎｔｅｘｔ－ｂａｓｅｄａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）初期状態選択

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3
4
5
6
7
8
9
10
11
12A
12B
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2025-02-21

(54)【発明の名称】コーディングされたピクチャからのＣＡＢＡＣ（Ａｄａｐｔｉｖｅｃｏｎｔｅｘｔ－ｂａｓｅｄａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）初期状態選択

(51)【国際特許分類】

H04N 19/13 20140101AFI20250214BHJP

H04N 19/174 20140101ALI20250214BHJP

H04N 19/167 20140101ALI20250214BHJP

【ＦＩ】

H04N19/13

H04N19/174

H04N19/167

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023560292

(86)(22)【出願日】2022-11-14

(85)【翻訳文提出日】2023-09-29

(86)【国際出願番号】 US2022079802

(87)【国際公開番号】W WO2023149973

(87)【国際公開日】2023-08-10

(31)【優先権主張番号】63/307,522

(32)【優先日】2022-02-07

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/985,809

(32)【優先日】2022-11-11

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】520353802

【氏名又は名称】テンセント・アメリカ・エルエルシー

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】シュー，シャオジョン

(72)【発明者】

【氏名】リウ，シャン

【テーマコード（参考）】

5C159

【Ｆターム（参考）】

5C159TA59

5C159TB06

5C159TC28

5C159TC32

(57)【要約】

本開示の態様は、先行するピクチャ内の複数の領域の各エントロピーコーディングされた領域に関連付けられた先行する確率情報を判定する処理回路機構を含む方法及び装置を提供する。処理回路機構は、（ｉ）カレントピクチャ内の独立にデコーディング可能なコーディングセグメントの場所若しくは量子化パラメータ、又は（ｉｉ）前記独立にデコーディング可能なコーディングセグメントの構文情報に基づいて、複数の領域の中から領域を選択する。独立にデコーディング可能なコーディングセグメント内のブロックの１つ以上のカレント構文要素に対する初期確率情報は、選択された領域に関連付けられた先行する確率情報に基づいて判定される。１つ以上のカレント構文要素は、最初に、独立にデコーディング可能なコーディングセグメントにおいてエントロピーデコーディングされる。処理回路機構は、初期確率情報に基づいて、１つ以上のカレント構文要素に関連付けられたコーディングされたビットをビンストリングにエントロピーデコーディングする。

【特許請求の範囲】

【請求項1】

デコーダにおいてデコーディングする方法であって
カレントピクチャ及び先行するピクチャを含むビットストリームを受信するステップであって、前記先行するピクチャは複数の領域を含み、前記複数の領域の各領域はエントロピーコーディングされている、ステップと、
前記複数の領域の各エントロピーコーディングされた領域に関連付けられた先行する確率情報を判定するステップと
（ｉ）カレントピクチャ内の独立にデコーディング可能なコーディングセグメントの場所若しくは量子化パラメータ、又は（ｉｉ）前記独立にデコーディング可能なコーディングセグメントの構文情報に基づいて、前記先行するピクチャ内の前記複数の領域の中から領域を選択するステップであって、前記デコーディング可能なコーディングセグメントは、（ｉ）前記カレントピクチャ又は（ｉｉ）前記カレントピクチャ内部の領域である、ステップと、
前記選択されたエントロピーコーディングされた領域に関連付けられた前記判定された先行する確率情報に基づいて、前記独立にデコーディング可能なコーディングセグメント内のブロックの１つ以上のカレント構文要素をエントロピーデコーディングするための初期確率情報を判定するステップであって、前記１つ以上のカレント構文要素は、前記独立にデコーディング可能なコーディングセグメントにおける構文要素の中で最初にエントロピーデコーディングされる、ステップと、
１つ以上のカレント構文要素に関連付けられたコーディングされたビットを、前記初期確率情報及び前記コーディングされたビットの確率推定モデルに基づいて、１つ以上のカレント構文要素に関連付けられたビンストリングにエントロピーデコーディングするステップと、を含む、方法。

【請求項2】

前記先行するピクチャ内の前記複数の領域は、前記先行するピクチャの４つのコーナーと中央にそれぞれ位置するコーディングツリーユニット（ＣＴＵ）を含み、
前記カレントピクチャは、４つのコーナー領域と１つの中央領域と、を含み、
前記領域を選択するステップは、
前記ブロックが前記カレントピクチャの前記４つのコーナー領域のうちの１つに位置することに基づいて、前記先行するピクチャの前記４つのコーナーのうちの１つに位置するＣＴＵを選択するステップであって、前記４つのコーナーのうちの１つに位置する前記ＣＴＵは、前記選択された領域内にある、ステップと、
前記ブロックが前記カレントピクチャの前記中央領域に位置することに基づいて、前記先行するピクチャの前記中央に位置するＣＴＵを選択するステップであって、前記中央に位置するＣＴＵは、前記選択された領域内にある、ステップと、を含む、請求項１に記載の方法。

【請求項3】

前記独立にデコーディング可能なコーディングセグメントは、前記カレントピクチャ内のイントラスライス（Ｉスライス）、双予測スライス（Ｂスライス）、及び予測スライス（Ｐスライス）のうちの１つである、請求項１に記載の方法。

【請求項4】

前記独立にデコーディング可能なコーディングセグメントは、前記カレントピクチャであり、
前記選択するステップは、前記複数の領域のうちどの領域が選択されるかを示す前記構文情報に基づいて、前記領域を選択するステップを含む、請求項１に記載の方法。

【請求項5】

前記構文情報は、前記複数の領域のうちどの領域が選択されるかを示すインデックスを含み
前記選択するステップは、前記インデックスに基づいて前記領域を選択するステップを含む、請求項１に記載の方法。

【請求項6】

前記選択された領域をエントロピーデコーディングするための確率推定モデルに基づいて、前記確率推定モデルにおける１つ以上のパラメータを取得するステップを含む、請求項１に記載の方法。

【請求項7】

１つ以上のパラメータは、前記ビンストリングの複数の確率推定値に関連付けられた適応レート及び適応重みを含み、それぞれの確率推定値に関連付けられた前記適応レートの各々は、前記ビンストリングに対する２つの近接する確率間の量子化ステップサイズを示す、請求項６に記載の方法。

【請求項8】

前記先行するピクチャに関連付けられた階層的時間構造における第１のレベルが、前記カレントピクチャに関連付けられた階層的時間構造における第２のレベルよりも低くなるように、前記ビットストリーム内の複数のピクチャから前記先行するピクチャを選択するステップであって、前記第１のレベルにおける各ピクチャは、前記第２のレベルにおける１つ以上のピクチャの各々をデコーディングする前にデコーディングされている、請求項１に記載の方法。

【請求項9】

前記判定された先行する確率情報を、前記先行するピクチャの各領域をエントロピーデコーディングするために使用される前記判定された先行する確率情報の第２の量子化精度よりも低い第１の量子化精度で記憶するステップをさらに含み、
前記初期確率情報を判定するステップは、前記第１の量子化精度で前記記憶され判定された先行する確率情報に基づいて前記初期確率情報を判定するステップを含む、請求項１に記載の方法。

【請求項10】

前記ビットストリーム内のフラグは、前記初期確率情報が、前記先行するピクチャから前記判定された先行する確率情報に基づいて判定されることを示す、請求項１に記載の方法。

【請求項11】

前記確率推定モデルは、コンテキスト適応モデルであり、
前記エントロピーデコーディングは、前記コーディングされたビットを、コンテキスト適応二値算術コーディング（ＣＡＢＡＣ）でエントロピーデコーディングすることを含む、請求項１に記載の方法。

【請求項12】

デコーディングするための装置であって、
請求項１～１１のいずれか一項に記載の方法を行うように構成されている処理回路機構を含む、装置。

【請求項13】

少なくとも１つのプロセッサによって実行されるときに、前記少なくとも１つのプロセッサに、請求項１～１１のいずれか一項に記載の方法を行わせる、プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本出願は、２０２２年２月７日に出願された米国仮出願第６３／３０７，５２２号「ＡＤＡＰＴＩＶＥＣＡＢＡＣＩＮＩＴＩＡＬＳＴＡＴＥＳＥＬＥＣＴＩＯＮＦＲＯＭＣＯＤＥＤＰＩＣＴＵＲＥＳ」に対する優先権の利益を主張する、２０２２年１１月１１日に出願された米国仮出願第１７／９８５，８０９号「ＡＤＡＰＴＩＶＥＣＯＮＴＥＸＴ－ＢＡＳＥＤＡＤＡＰＴＩＶＥＢＩＮＡＲＹＡＲＩＴＨＭＥＴＩＣＣＯＤＩＮＧ（ＣＡＢＡＣ）ＩＮＩＴＩＡＬＳＴＡＴＥＳＥＬＥＣＴＩＯＮＦＲＯＭＣＯＤＥＤＰＩＣＴＵＲＥＳ」に対する優先権の利益を主張する。先の出願の開示全体は、それら全体が参照により本明細書に援用される。

【0002】

本開示は、ビデオコーディングに一般的に関連する実施形態を記載する。

【背景技術】

【0003】

本明細書で提供される背景技術は、本開示の文脈を一般的に提示することを目的とする。本件の発明者の仕事は、その仕事がこの背景技術のセクションに記載されている範囲において、また、出願時に他の点では先行技術として適格でないかもしれない説明の態様は、本開示に対する先行技術として明示的にも暗示的にも認められていない。

【0004】

非圧縮デジタル画像及び／又はビデオは、一連のピクチャを含むことができ、各ピクチャは、例えば、１９２０×１０８０の輝度サンプル及び関連する色差サンプルの空間寸法を有する。一連のピクチャは、例えば、例えば、１秒当たり６０ピクチャ／秒又は６０Ｈｚの固定又は可変のピクチャレートを有することができる。非圧縮画像及び／又はビデオは、特定のビットレート要件を有する。例えば、サンプル当たり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚのフレームレートでの１９２０ｘ１０８０の輝度サンプル解像度）は、１．５Ｇｂｉｔ／ｓに近い帯域幅を必要とする。このようなビデオの１時間は、６００Ｇバイトを超える記憶空間を必要とする。

【0005】

画像及び／又はビデオコーディング及びデコーディングの１つの目的は、圧縮による入力ビデオ信号の冗長性の低減である。圧縮は、場合によっては、前述の帯域幅及び／又は記憶空間の必要性を２桁以上低減する助けとなり得る。本明細書における説明では、例示的な例としてビデオエンコーディング／デコーディングを使用しているが、本開示の精神から逸脱することなく、同様の方式で同じ技法を画像エンコーディング／デコーディングに適用することができる。可逆圧縮及び不可逆圧縮の両方、並びにそれらの組み合わせが用いられ得る。可逆圧縮とは、元の信号の正確なコピーを圧縮された元の信号から再構成することができる技法を指す。不可逆圧縮を使用するときに、再構成された信号は、元の信号と同一ではないことがあるが、元の信号と再構成された信号との間の歪みは、再構成された信号を意図されたアプリケーションに有用にするのには十分小さい。ビデオの場合、不可逆圧縮が広く用いられる。認容される歪みの量は、用途に依存し、例えば、特定の消費者ストリーミングアプリケーションのユーザは、テレビ配信アプリケーションのユーザよりも高い歪みを認容することがある。達成可能な圧縮比は、より高い許容可能／認容可能な歪みは、より高い圧縮比をもたらすことができることを反映できる。

【0006】

ビデオエンコーダ及びデコーダは、例えば、動き補償、変換処理、量子化、及びエントロピーコーディングを含むいくつかの広範なカテゴリからの技法を利用することができる。

【0007】

ビデオコーデック技術は、イントラコーディングとして知られる技法を含むことができる。イントラコーディングでは、サンプル値は、先行して再構成された参照ピクチャからのサンプル又は他のデータを参照することなく表現される。いくつかのビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分化される。サンプルの全てのブロックがイントラモードでコーディングされるときに、そのピクチャはイントラピクチャとすることができる。イントラピクチャと、独立デコーダリフレッシュピクチャのようなそれらの派生物は、デコーダ状態をリセットするために使用することができ、したがって、コーディングされたビデオビットストリーム及びビデオセッションにおける最初のピクチャとして、又は静止画像として使用され得る。イントラブロックのサンプルを変換に曝すことができ、変換係数がエントロピーコーディングの前に量子化され得る。イントラ予測は、変換前ドメインにおいてサンプル値を最小化する技法であり得る。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、エントロピーコーディング後のブロックを表すために所与の量子化ステップサイズで必要とされるビット数が少なくなる。

【0008】

例えば、ＭＰＥＧ－２世代コーディング技術で使用される伝統的なイントラコーディングは、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、データのブロックのエンコーディング及び／又はデコーディング中に取得される周囲のサンプルデータ及び／又はメタデータに基づいて予測を行うように試みる技法を含む。このような技法は、以後「イントラ予測」技法と呼ばれる。少なくともいくつかのケースでは、イントラ予測は、再構成中のカレントピクチャからの参照データのみを使用し、参照ピクチャからの参照データは使用しないことに留意する。

【0009】

様々な形態のイントラ予測があり得る。所与のビデオコーディング技術において、そのような技法のうちの１つ以上が使用され得るときに、使用される特定の技法は、特定の技法を使用する特定のイントラ予測モードとしてコーディングされ得る。特定の場合では、イントラ予測モードは、サブモード及び／又はパラメータを有することができ、サブモード及び／又はパラメータは、個別にコーディングされ得るか、又は使用されている予測モードを定義するモードコードワードに含まれ得る。所与のモード、サブモード、及び／又はパラメータ結合に対してどのコードワードをするかは、イントラ予測を通じてコーディング効率ゲインに影響を及ぼし、また、コードワードをビットストリームに変換するために使用されるエントロピーコーディング技術にも影響を及ぼす可能性がある。

【0010】

イントラ予測の特定のモードがＨ．２６４で導入され、Ｈ．２６５で改良され、ジョイント探索モデル（ＪＥＭ）、汎用ビデオコーディング（ＶＶＣ）、及びベンチマークセット（ＢＭＳ）のようなより新しいコーディング技術でさらに改良された。予測子ブロックは、既に利用可能なサンプルの隣接するサンプル値を使用して形成され得る。隣接するサンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用される方向への参照は、ビットストリームにおいてコーディングされ得、又はそれ自体が予測されてもよい。

【0011】

図１Ａを参照すると、右下に描写されているのは、Ｈ．２６５で定義された３３個の可能な予測子方向から知られる９個の予測子方向のサブセットである（３５個のイントラモードの３３個の角度モードに対応する）。矢印が収束する点（１０１）は、予測されるサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、水平から４５度の角度で、サンプル又は複数のサンプルから右上に向かって予測されることを示す。例えば、矢印（１０３）は、サンプル（１０１）が、水平から２２．５度の角度で、サンプル又は複数のサンプルから左下に向かって予測されることを示す。

【0012】

引き続き図１Ａを参照すると、左上には、４×４サンプルの正方形ブロック（１０４）が描写されている（破線の太線で示されている）。正方形ブロック（１０４）は、１６個のサンプルを含み、各サンプルは、「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、及びＸ次元におけるその位置（例えば、列インデックス）がラベル付けされている。例えば、サンプルＳ２１は、Ｙ次元における（上から）２番目のサンプルで、Ｘ次元における（左から）１番目のサンプルである。同様に、サンプルＳ４４は、Ｙ及びＸ次元の両方においてブロック（１０４）における第４のサンプルである。ブロックのサイズが４×４サンプルであるので、Ｓ４４は右下にある。さらに、同様の番号付けスキームに従った参照サンプルを示す。参照サンプルは、ブロック（１０４）に対して、Ｒ、そのＹ位置（例えば、行インデックス）、及びＸ位置（列インデックス）でラベル付けされている。Ｈ．２６４とＨ．２６５の両方では、予測サンプルは再構成中のブロックに隣接しているため、負の値を使用する必要はない。

【0013】

イントラピクチャ予測は、シグナリングされた予測方向によって示される隣接するサンプルから参照サンプル値をコピーすることによって動くことができる。例えば、コーディングされたビデオビットストリームは、このブロックについて、矢印（１０２）と一致する予測方向を示すシグナリングを含むと仮定する。すなわち、サンプルは、水平方向から４５度の角度における右上のサンプルから予測される。その場合、サンプルＳ４１、Ｓ３２、Ｓ２３、及びＳ１４は、同じ参照サンプルＲ０５から予測される。次いで、サンプルＳ４４は、参照サンプルＲ０８から予測される。

【0014】

特定の場合には、特に方向が４５度で均一に割り切れないときに、参照サンプルを計算するために、複数の参照サンプルの値が、例えば補間を通して組み合わせられてもよい。

【0015】

ビデオコーディング技術の発達に伴い、可能な方向の数が増加している。Ｈ．２６４（２００３年）では、９個の異なる方向を表すことができた。これは、Ｈ．２６５（２０１３年）において、３３個に増加した。現在、ＪＥＭ／ＶＶＣ／ＢＭＳは、最大６５個の方向をサポートすることができる。最も可能性の高い方向を識別するために実験が行われ、エントロピーコーディングにおける特定の技法が、より可能性の低い方向に対する特定のペナルティを許容して、少数のビットでそれらの可能性のある方向を表すために使用される。さらに、方向それ自体は、時として、隣接する、すでにデコードされたブロックで使用される隣接方向から予測され得る。

【0016】

図１Ｂは、経時的に増加する予測方向の数を示すために、ＪＥＭによる６５のイントラ予測方向を描写する概略（１１０）を示す。

【0017】

コーディングされたビデオビットストリームにおける方向を表すイントラ予測方向ビットのマッピングは、ビデオコーディング技術ごとに異なる可能性がある。そのようなマッピングは、例えば、単純な直接マッピングからコードワードへ、最も可能性の高いモードを伴う複雑な適応スキーム、及び同様の技法に及ぶ可能性がある。しかしながら、ほとんどの場合、ビデオコンテンツにおいて、特定の他の方向よりも統計的に発生しにくい特定の方向があり得る。ビデオ圧縮の目標は冗長性の低減であるため、良好に動くビデオコーディング技術では、より可能性の高い方向よりもより多くのビット数によって、より可能性の低い方向が表される。

【0018】

画像及び／又はビデオコーディングとデコーディングは、動き補正によるインターピクチャ予測を使用して行われ得る。動き補償は、非可逆圧縮技法であり得、先行して再構成されたピクチャ又はその一部（参照ピクチャ）からのサンプルデータのブロックが、動きベクトル（以降、ＭＶ）によって示される方向に空間的にシフトされた後に、新しい再構成ピクチャ又はピクチャパーティションの予測のために使用される技法に関連することができる。場合によっては、参照ピクチャが、現在再構成中のピクチャと同じである可能性がある。ＭＶは、Ｘ及びＹの２次元、又は３次元を有し、第３の次元は、使用中の参照ピクチャの指標である（後者は、間接的に、時間次元であり得る）。

【0019】

いくつかのビデオ圧縮技法では、サンプルデータの所定のエリアに適用可能なＭＶは、他のＭＶ、例えば、再構成中のエリアに空間的に近接し、デコーディング順でそのＭＶに先行するサンプルデータの別のエリアに関連するＭＶから予測され得る。そのようにすることによって、ＭＶをコーディングするために必要なデータ量を大幅に低減することができ、それによって冗長性を除去し、圧縮を増加させる。ＭＶ予測は、例えば、カメラから導出された入力ビデオ信号（ナチュラルビデオとして知られる）をコーディングするときに、単一のＭＶが適用可能なエリアよりも大きなエリアが同様の方向に移動する統計的見込みがあり、場合によっては、隣接するエリアのＭＶから導出される同様の動きベクトルを用いて予測され得るため、効果的に動くことができる。これは、所与のエリアに対して、周囲のＭＶから予測されるＭＶと類似するか、又は同じであることが見出されるＭＶをもたらし、それは、エントロピーコーディングの後に、ＭＶを直接コーディングする場合に使用されるであろうものよりも、より少ない数のビットで表され得る。場合によっては、ＭＶ予測は、元の信号（すなわち、サンプルストリーム）から導出された信号の可逆圧縮の一例（すなわち、ＭＶ）であり得る。他の場合には、ＭＶ予測それ自体は、例えば、いくつかの周囲のＭＶから予測子を計算するときの丸め誤差のために、不可逆的であり得る。

【0020】

様々なＭＶ予測メカニズムが、Ｈ．２６５／ＨＥＶＣ
（ＩＴＵ－ＴＲｅｃ．Ｈ．２６５，「ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ」，２０１６年１２月）において記載されている。Ｈ．２６５が提供する多くのＭＶ予測メカニズムのうち、図２を参照して記載されているのは、以降、「空間マージ」と呼ばれる技法である。

【0021】

図２を参照すると、カレントブロック（２０１）は、空間的にシフトされた同じサイズの先行するブロックから予測可能であることが動き探索処理中にエンコーダによって見つけられたサンプルを含む。ＭＶを直接コーディングする代わりに、ＭＶは、１つ以上の参照ピクチャに関連付けられたメタデータから、例えば、Ａ０、Ａ１、及びＢ０、Ｂ１、Ｂ２（それぞれ２０２から２０６）と示される５つの周囲のサンプルのうちのいずれかに関連付けられたＭＶを使用して、（デコーディング順で）最新の参照ピクチャから導出され得る。Ｈ．２６５では、ＭＶ予測は、隣接するブロックが使用しているのと同じ参照ピクチャからの予測子を使用することができる。

【発明の概要】

【0022】

本開示の態様は、ビデオ及び／又は画像エンコーディング／デコーディングのための方法及び装置を提供する。いくつかの例では、ビデオ／画像デコーディングための装置は、処理回路機構を含む。処理回路機構は、カレントピクチャ及び先行するピクチャを含むビットストリームを受信する。先行するピクチャは複数の領域を含み、複数の領域の各領域は、エントロピーコーディングされる。処理回路機構は、複数の領域の各エントロピーコーディングされた領域に関連付けられた先行する確率情報を判定する。処理回路機構は、（ｉ）カレントピクチャ内の独立にデコーディング可能なコーディングセグメントの場所若しくは量子化パラメータ、又は（ｉｉ）独立にデコーディング可能なコーディングセグメントの構文情報に基づいて、先行するピクチャ内の複数の領域の中から領域を選択し、デコーディング可能なコーディングセグメントは、（ｉ）カレントピクチャ又は（ｉｉ）カレントピクチャ内部の領域である。処理回路機構は、独立にデコーディング可能なコーディングセグメント内のブロックの１つ以上のカレント構文要素をエントロピーデコーディングするための初期確率情報を、選択された領域をエントロピーデコーディングすることに関連付けられ判定された先行する確率情報に基づいて判定する。一例では、１つ以上のカレント構文要素は、最初に、独立にデコーディング可能なコーディングセグメント内の構文要素の中からエントロピーデコーディングされる。処理回路機構は、１つ以上のカレント構文要素に関連付けられたコーディングされたビットを、初期確率情報及びコーディングされたビットの確率推定モデルに基づいて、１つ以上のカレント構文要素に関連付けられたビンストリングにエントロピーデコーディングする。

【0023】

一実施形態では、先行するピクチャ内の複数の領域は、先行するピクチャの４つのコーナーと中央にそれぞれ位置するコーディングツリーユニット（ＣＴＵ）を含む。カレントピクチャは、４つのコーナー領域と１つの中央領域と、を含む。処理回路機構は、ブロックがカレントピクチャの４つのコーナー領域のうちの１つに位置することに基づいて、先行するピクチャの４つのコーナーのうちの１つに位置するＣＴＵを選択する。４つのコーナーのうちの１つに位置するＣＴＵは、選択した領域内にあり得る。処理回路機構は、ブロックがカレントピクチャの中央領域に位置することに基づいて、先行するピクチャの中央に位置するＣＴＵを選択する。中央に位置するＣＴＵは、選択した領域内にあり得る。

【0024】

一例では、独立にデコーディング可能なコーディングセグメントは、カレントピクチャ内のイントラスライス（Ｉスライス）、双予測スライス（Ｂスライス）、及び予測スライス（Ｐスライス）のうちの１つである。

【0025】

一例では、独立にデコーディング可能なコーディングセグメントは、カレントピクチャである。処理回路機構は、複数の領域のうちどの領域が選択されるかを示す構文情報に基づいて、領域を選択する。

【0026】

一例では、構文情報は、複数の領域のうちどの領域が選択されるかを示すインデックスを含む。処理回路機構は、インデックスに基づいて領域を選択する。

【0027】

一例では、処理回路機構は、選択された領域をエントロピーデコーディングするための確率推定モデルに基づいて、確率推定モデルにおける１つ以上のパラメータを取得する。

【0028】

一例では、１つ以上のパラメータは、ビンストリングの複数の確率推定値に関連付けられた適応レート及び適応重みを含む。各確率推定値に関連付けられた適応レートの各々は、ビンストリングに対する２つの近接する確率間の量子化ステップサイズを示す。

【0029】

一例では、処理回路機構は、先行するピクチャに関連付けられた階層的時間構造における第１のレベルが、カレントピクチャに関連付けられた階層的時間構造における第２のレベルよりも低くなるように、ビットストリーム内の複数のピクチャから先行するピクチャを選択する。第１のレベルの各ピクチャは、第２のレベルにおける１つ以上のピクチャの各々をデコーディングする前にデコーディングされている。

【0030】

一例では、処理回路機構は、判定された先行する確率情報を、先行するピクチャの各領域をエントロピーデコーディングするために使用される判定された先行する確率情報の第２の量子化精度よりも低い第１の量子化精度で記憶する。処理回路機構は、第１の量子化精度で記憶され判定された先行する確率情報に基づいて初期確率情報を判定する。

【0031】

一例では、ビットストリーム内のフラグは、初期確率情報が、先行するピクチャから判定された先行する確率情報に基づいて判定されることを示す。

【0032】

一例では、確率推定モデルは、コンテキスト適応モデルである。処理回路機構は、コーディングされたビットを、ＣＡＢＡＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ、コンテキスト適応二値算術コーディング）でエントロピーデコーディングする。

【0033】

本開示の態様はまた、命令を記憶する非一時的なコンピュータ可読媒体を提供し、命令は、ビデオ／画像デコーディングのためにコンピュータによって実行されるときに、コンピュータにビデオ／画像デコーディングのための方法を行わせる。

【図面の簡単な説明】

【0034】

開示された主題のさらなる特徴、性質、及び様々な利点は、以下の詳細な説明及び添付の図面からより明らかになるであろう。

【0035】

【図1A】イントラ予測モードの例示的なサブセットの概略図である。

【0036】

【図1B】例示的なイントラ予測方向の図である。

【0037】

【図2】カレントブロック（２０１）と周辺サンプルの一例を示す。

【0038】

【図3】通信システム（３００）の例示的なブロック図の概略図である。

【0039】

【図4】通信システム（４００）の例示的なブロック図の概略図である。

【0040】

【図5】デコーダの例示的なブロック図の概略図である。

【0041】

【図6】エンコーダの例示的なブロック図の概略図である。

【0042】

【図7】例示的なエンコーダのブロック図を示す。

【0043】

【図8】例示的なデコーダのブロック図を示す。

【0044】

【図9】サブブロックスキャン順序の一例を示す。

【0045】

【図10】サブブロックスキャン処理の一例を示す。

【0046】

【図11】カレント位置に対応するカレントビンのコンテキスト選択に使用されるローカルテンプレートの一例を示す。

【0047】

【図12A】一実施形態による、例示的なコンテキストベース適応二値算術コーディング（ＣＡＢＡＣ）ベースのエントロピーエンコーダを示す。

【0048】

【図12B】一実施形態による、例示的なＣＡＢＡＣベースのエントロピーデコーダを示す。

【0049】

【図13】エンコーダで使用されるＣＡＢＡＣの一例を示す。

【0050】

【図14】参照ピクチャからのコンテキスト状態を使用するカレントピクチャのＣＡＢＡＣ初期化の一例を示す。

【0051】

【図15】カレントピクチャと参照ピクチャとの間の領域ベースのＣＡＢＡＣコンテキスト状態初期化マッピングの一例を示す。

【0052】

【図16】階層的時間構造の一例を示す。

【0053】

【図17】本開示のいくつかの実施形態による、エンコーディング処理を概説するフローチャートを示す。

【0054】

【図18】本開示のいくつかの実施形態による、デコーディング処理を概説するフローチャートを示す。

【0055】

【図19】一実施形態によるコンピュータシステムの概略図である。

【発明を実施するための形態】

【0056】

図３は、通信システム（３００）の例示的なブロック図を例示する。通信システム（３００）は、例えばネットワーク（３５０）を介して互いに通信することができる複数の端末デバイスを含む。例えば、通信システム（３００）は、ネットワーク（３５０）を介して相互接続された第１の対の端末デバイス（３１０）及び（３２０）を含む。図３の例では、第１の対の端末デバイス（３１０）及び（３２０）は、データの一方向伝送を行う。例えば、端末デバイス（３１０）は、ネットワーク（３５０）を介した他の端末デバイス（３２０）への伝送のために、ビデオデータ（例えば、端末デバイス（３１０）によってキャプチャされるビデオピクチャのストリーム）をコーディングしてもよい。エンコーディングされたビデオデータは、１つ以上のコーディングされたビデオビットストリームの形態で送信され得る。端末デバイス（３２０）は、ネットワーク（３５０）からコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングして、ビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示してもよい。一方向性データ伝送は、メディアサービスアプリケーションなどにおいて一般的である。

【0057】

別の例では、通信システム（３００）は、例えば、ビデオ会議中のコーディングされたビデオデータの双方向伝送を行う第２の対の端末デバイス（３３０）及び（３４０）を含む。データの双方向伝送のために、一例では、端末デバイス（３３０）及び（３４０）の各端末デバイスは、ネットワーク（３５０）を介した端末デバイス（３３０）及び（３４０）の他方の端末デバイスへの伝送のために、ビデオデータ（例えば、端末デバイスによってキャプチャされるビデオピクチャのストリーム）をコーディングしてもよい。端末デバイス（３３０）及び（３４０）の各端末デバイスはまた、端末デバイス（３３０）及び（３４０）の他方の端末デバイスによって送信されたコーディングされたビデオデータを受信してもよく、コーディングされたビデオデータをデコーディングして、ビデオピクチャを復元し、復元されたビデオデータに従って、アクセス可能なディスプレイデバイスにビデオピクチャを表示してもよい。

【0058】

図３の例において、端末デバイス（３１０）、（３２０）、（３３０）及び（３４０）は、それぞれ、サーバ、パーソナルコンピュータ及びスマートフォンとして示されてもよいが、本開示の原理は、それらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤ、及び／又は専用のビデオ会議機器を用いてアプリケーションを見出す。ネットワーク（３５０）は、例えば、有線及び／又は無線通信ネットワークを含む、端末デバイス（３１０）、（３２０）、（３３０）及び（３４０）間でコーディングされたビデオデータを搬送する任意の数のネットワークを表す。通信ネットワーク（３５０）は、回線交換及び／又はパケット交換チャネルにおいてデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び／又はインターネットを含む。本説明の目的のために、ネットワーク（３５０）のアーキテクチャ及びトポロジーは、以下に説明しない限り、本開示の動作には重要ではない。

【0059】

図４は、開示された主題のアプリケーションの一例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダを例示する。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、ストリーミングサービス、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮されたビデオの記憶などを含む、他のビデオ可能化アプリケーションに等しく適用可能とすることができる。

【0060】

ストリーミングシステムは、例えば圧縮されていないビデオピクチャのストリーム（４０２）を作成するビデオソース（４０１）、例えばデジタルカメラを含むことができるキャプチャサブシステム（４１３）を含んでもよい。一例では、ビデオピクチャのストリーム（４０２）は、デジタルカメラによって撮影されるサンプルを含む。エンコーディングされたビデオデータ（４０４）（又はコーディングされたビデオビットストリーム）と比較されたときに、高データ量を強調する太い線として描写されたビデオピクチャのストリーム（４０２）は、ビデオソース（４０１）に結合されたビデオエンコーダ（４０３）を含む電子デバイス（４２０）によって処理され得る。ビデオエンコーダ（４０３）は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができ、以下により詳細に記載されるように、開示された主題の態様を可能にするか、又は実装する。エンコーディングされたビデオデータ（４０４）（又はエンコーディングされたビットストリーム）は、ビデオピクチャ（４０２）のストリームと比較されるときに、より低いデータボリュームを強調するために細いラインとして描写されており、将来の使用のためにストリーミングサーバ（４０５）に記憶され得る。図４のクライアントサブシステム（４０６）及び（４０８）などの１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（４０５）にアクセスして、エンコーディングされたビデオデータ（４０４）の複製（４０７、４０９）を取得することができる。クライアントサブシステム（４０６）は、例えば電子デバイス（４３０）内にビデオデコーダ（４１０）を含むことができる。ビデオデコーダ（４１０）は、エンコーディングされたビデオデータの入って来るコピー（４０７）をデコードし、ディスプレイ（４１２）（例えば、ディスプレイスクリーン）又は他のレンダリングデバイス（描写せず）上にレンダリングされ得るビデオピクチャの出て行くストリーム（４１１）を作成する。いくつかのストリーミングシステムでは、エンコーディングされたビデオデータ（４０４）、（４０７）、及び（４０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮標準に従ってエンコーディングされ得る。これらの標準の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、開発中のビデオコーディング標準は、ＶＶＣ（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）と非公式に知られている。開示された主題事項は、ＶＶＣの文脈で使用され得る。

【0061】

電子デバイス（４２０）及び（４３０）は、他のコンポーネント（図示せず）を含むことができることに留意する。例えば、電子デバイス（４２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（４３０）は、ビデオエンコーダ（図示せず）も含むことができる。

【0062】

図５は、ビデオデコーダ（５１０）の例示的なブロック図を示す。ビデオデコーダ（５１０）は、電子デバイス（５３０）に含まれ得る。電子デバイス（５３０）は、受信機（５３１）（例えば、受信回路機構）を含むことができる。ビデオデコーダ（５１０）は、図４の例におけるビデオデコーダ（４１０）の代わりに使用され得る。

【0063】

受信機は、ビデオデコーダ（５１０）によるデコーディング対象の１つ以上のコーディングされたビデオシーケンスを受信してもよい。一実施形態では、一度に１つのコーディングされたビデオシーケンスが受信され、各コーディングされたビデオシーケンスのデコーディングは、他のコーディングされたビデオシーケンスのデコーディングから独立している。コーディングされたビデオシーケンスは、チャネル（５０１）から受信してもよく、このチャネルは、エンコーディングされたビデオデータを記憶する記憶デバイスへのハードウェア／ソフトウェアリンクであってもよい。受信機（５３１）は、エンコーディングされたビデオデータを、他のデータ、例えば、コーディングされたオーディオデータ及び／又は補助的なデータストリームと共に受信してもよく、これらのデータは、それぞれのエンティティ（描写せず）を使用して転送されてもよい。受信機（５３１）は、コーディングされたビデオシーケンスを他のデータから分離してもよい。ネットワークジッタと闘うために、バッファメモリ（５１５）は、受信機（５３１）とエントロピーデコーダ／解析器（５２０）（以後「解析器（５２０）」）との間で結合されてもよい。特定の用途では、バッファメモリ（５１５）は、ビデオデコーダ（５１０）の一部である。他の場合には、ビデオデコーダ（５１０）の外にあり得る（描写せず）。さらに別の場合では、例えばネットワークジッタに対抗するために、ビデオデコーダ（５１０）の外にバッファメモリ（描写せず）があり得、追加的に、例えば再生タイミングを処理するために、ビデオデコーダ（５１０）の内に別のバッファメモリ（５１５）があり得る。受信機（５３１）が、十分な帯域幅及び制御可能性を有する記憶／転送装置から、又はアイソクロナスネットワークからデータを受信しているときに、バッファ（５１５）は、不要であってもよく、又は小さくすることができる。インターネットのようなベストエフォート型パケットネットワークでの使用の場合、バッファメモリ（５１５）は、必要とされてもよく、比較的大きくすることができ、有利には適応サイズであり得、ビデオデコーダ（５１０）の外のオペレーティングシステム又は類似の要素（描写せず）に少なくとも部分的に実装されてもよい。

【0064】

ビデオデコーダ（５１０）は、コーディングされたビデオシーケンスからシンボル（５２１）を再構成するための解析器（５２０）を含んでもよい。それらのシンボルのカテゴリは、ビデオデコーダ（５１０）の動作を管理するために使用される情報、及びレンダリングデバイス（５１２）（例えば、ディスプレイスクリーン）のような、電子デバイス（５３０）の不可欠な部分ではないが、図５に示されているように、電子デバイス（５３０）に結合され得るレンダリングデバイスを制御するための潜在的な情報を含む。レンダリングデバイスの制御情報は、ＳＥＩ（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ、補足強化情報）メッセージ又はＶＵＩ（ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ、ビデオユーザビリティ情報）パラメータセットフラグメント（描写せず）の形態であってもよい。解析器（５２０）は、受信したコーディングされたビデオシーケンスを解析／エントロピーデコーディングしてもよい。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術又は標準に従うことができ、可変長コーディング、ハフマンコーディング、コンテキストセンシティビティを伴う又は伴わない算術コーディングなどを含む様々な原理に従うことができる。解析器（５２０）は、グループに対応する少なくとも１つのパラメータに基づいて、コーディングされたビデオシーケンスから、ビデオデコーダにおける画素のサブグループのうちの少なくとも１つのサブグループパラメータのセットを抽出してもよい。サブグループは、ピクチャグループ（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。解析器（５２０）はまた、コーディングされたビデオシーケンスから、変換係数、量子化パラメータ値、動きベクトルなどの情報を抽出してもよい。

【0065】

解析器（５２０）は、シンボル（５２１）を作成するために、バッファメモリ（５１５）から受信したビデオシーケンスに対してエントロピーデコーディング／解析動作を行ってもよい。

【0066】

シンボル（５２１）の再構成は、コーディングされたビデオピクチャ又はその部分（例えば、インターピクチャ及びイントラピクチャ、インターブロック及びイントラブロック）のタイプ及び他の要因に応じて、複数の異なるユニットに関与することができる。どのユニットが関与し、どのように関与するかは、解析器（５２０）によって、コーディングされたビデオシーケンスから解析されたサブグループ制御情報によって制御され得る。解析器（５２０）と以下の複数ユニットとの間のこのようなサブグループ制御情報のフローは、明確にするために描写されない。

【0067】

すでに述べた機能ブロックの他に、デコーダ（５１０）は、概念的には、後述するように、いくつかの機能ユニットに細分化され得る。商業的制約の下で動作する実用的な実装では、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに統合することができる。しかしながら、開示された主題を説明するためには、以下の機能ユニットに概念的に細分化することが適切である。

【0068】

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、解析器（５２０）からのシンボル（５２１）として、使用するべき変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報とともに、量子化された変換係数を受信する。スケーラ／逆変換ユニット（５５１）は、アグリゲータ（５５５）に入力することができるサンプル値を含むブロックを出力することができる。

【0069】

場合によっては、スケーラ／逆変換ユニット（５５１）の出力サンプルは、イントラコーディングブロックに関係することができる。イントラコーディングブロックは、先行して再構成されたピクチャからの予測情報を使用していないが、カレントピクチャの先行して再構成された部分からの予測情報を使用することができるブロックである。このような予測情報は、イントラピクチャ予測ユニット（５５２）によって提供され得る。場合によっては、イントラピクチャ予測ユニット（５５２）は、カレントピクチャバッファ（５５８）からフェッチされ既に再構成された周囲の情報を使用して、再構成中のブロックの同じサイズ及び形状のブロックを生成する。カレントピクチャバッファ（５５８）は、例えば、部分的に再構成されたカレントピクチャ及び／又は完全に再構成されたカレントピクチャをバッファする。アグリゲータ（５５５）は、場合によっては、サンプルごとベースで、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供される出力サンプル情報に追加する。

【0070】

他の場合には、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコーディングされ、潜在的に動き補償ブロックに関係することができる。このような場合には、動き補償予測ユニット（５５３）は、参照ピクチャメモリ（５５７）にアクセスして、予測のために使用されるサンプルをフェッチすることができる。ブロックに関係するシンボル（５２１）に従って、フェッチされたサンプルの動き補償後、これらのサンプルは、アグリゲータ（５５５）によって、出力サンプル情報を生成するために、スカラー／逆変換ユニット（５５１）の出力（この場合、残差サンプル又は残差信号と呼ばれる）に追加され得る。動き補償ユニット（５５３）が予測サンプルをフェッチする参照ピクチャメモリ（５５７）内のアドレスは、例えばＸ、Ｙ、及び参照ピクチャコンポーネントを有することができるシンボル（５２１）の形態で動き補償ユニットに利用可能な動きベクトルによって制御され得る。動き補償はまた、サブサンプルの正確な動きベクトルが使用されるときの参照ピクチャメモリ（５５７）からフェッチされるサンプル値の補間、動きベクトル予測メカニズムなどを含むことができる。

【0071】

アグリゲータ（５５５）の出力サンプルは、ループフィルタユニット（５５６）内の様々なループフィルタリング技法を受けることができる。ビデオ圧縮技術は、コーディングされたビデオシーケンス（コーディングされたビデオビットストリームとも呼ばれる）に含まれるパラメータによって制御され、かつ解析器（５２０）からシンボル（５２１）としてループフィルタユニット（５５６）に利用可能にされるインループ内フィルタ技術を含むことができる。ビデオ圧縮はまた、コーディングされたピクチャ又はコーディングされたビデオシーケンスの（デコーディング順序で）先行する部分のデコーディング中に取得されたメタ情報に応答し、かつ先行して再構成されループフィルタ処理されたサンプル値に応答することもできる。

【0072】

ループフィルタユニット（５５６）の出力は、レンダリングデバイス（５１２）に出力し、また将来のインターピクチャ予測に使用するために参照ピクチャメモリ（５５７）に記憶することができるサンプルストリームとすることができる。

【0073】

特定のコーディングされたピクチャが完全に再構成されると、将来の予測のための参考ピクチャとして使用され得る。例えば、カレントピクチャに対応するコーディングされたピクチャが完全に再構成され、かつコーディングされたピクチャが参照ピクチャとして識別されると（例えば、解析器（５２０）によって）、カレントピクチャバッファ（５５８）は、参照ピクチャメモリ（５５７）の一部となることができ、新鮮なカレントピクチャバッファが、後でコーディングされるピクチャの再構成を開始する前に再割り当てされ得る。

【0074】

ビデオデコーダ（５１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの所定のビデオ圧縮技術又は標準に従ってデコーディング動作を行ってもよい。
コーディングされたビデオシーケンスは、コーディングされたビデオシーケンスが、ビデオ圧縮技術又は標準の構文及びビデオ圧縮技術又は標準に文書化されているプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術又は標準によって指定された構文に適応してもよい。具体的には、プロファイルは、特定のツールを、そのプロファイルの下での使用に利用可能な唯一のツールとして、ビデオ圧縮技術又は標準で利用可能な全てのツールから選択することができる。また、コンプライアンスのために必要なことは、コーディングされたビデオシーケンスの複雑さが、ビデオ圧縮技術又は標準のレベルによって定義される範囲内にあることとし得る。場合によっては、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えば、毎秒メガサンプルで測定される）、最大参照ピクチャサイズなどを制限する。レベルによって設定された制限は、場合によっては、ＨＲＤ（ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ、仮想参照デコーダ）仕様及びコーディングされたビデオシーケンスでシグナリングされるＨＲＤバッファ管理のためのメタデータを介してさらに制限され得る。

【0075】

一実施形態では、受信機（５３１）は、エンコーディングされたビデオと共に追加の（冗長な）データを受信してもよい。追加のデータは、コーディングされたビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコーディングするため、及び／又は元のビデオデータをより正確に再構成するために、ビデオデコーダ（５１０）によって使用されてもよい。追加のデータは、例えば、時間的、空間的、又は信号雑音比（ＳＮＲ）強化層、冗長スライス、冗長ピクチャ、前方エラー補正コードなどの形態のものであり得る。

【0076】

図６は、ビデオエンコーダ（６０３）の例示的なブロック図を示す。ビデオエンコーダ（６０３）は、電子デバイス（６２０）に含まれる。電子デバイス（６２０）は、送信機（６４０）（例えば、送信回路機構）を含む。ビデオエンコーダ（６０３）は、図４の例におけるビデオエンコーダ（４０３）の代わりに使用され得る。

【0077】

ビデオエンコーダ（６０３）は、ビデオエンコーダ（６０３）によるコーディング対象のビデオ画像をキャプチャし得るビデオソース（６０１）（図６の例では電子デバイス（６２０）の一部ではない）からビデオサンプルを受信してもよい。別の例では、ビデオソース（６０１）は、電子デバイス（６２０）の一部である。

【0078】

ビデオソース（６０１）は、任意の好適なビット深さ（例えば、８ビット、１０ビット、１２ビット、．．．）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、．．．）、及び任意の好適なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）のうちのものとすることができるデジタルビデオサンプルストリームの形態で、ビデオエンコーダ（６０３）によるコーディング対象のソースビデオシーケンスを提供してもよい。メディアサービスシステムにおいて、ビデオソース（６０１）は、先行して準備されたビデオを記憶する記憶デバイスであってもよい。ビデオ会議システムでは、ビデオソース（６０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであってもよい。ビデオデータは、シーケンスで見たときに動きを与える複数の個々のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて、１つ以上のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明は、サンプルに焦点を当てる。

【0079】

一実施形態によれば、ビデオエンコーダ（６０３）は、ソースビデオシーケンスのピクチャを、リアルタイムで、又は必要に応じて任意の他の時間制約下で、コーディングされたビデオシーケンス（６４３）にコーディング及び圧縮してもよい。適切なコーディング速度を実施することは、コントローラ（６５０）の１つの機能である。いくつかの実施形態において、コントローラ（６５０）は、以下に記載のように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確にするために描写されていない。コントローラ（６５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化子、レート歪み最適化技法のラムダ値、…）、ピクチャサイズ、ピクチャグループ（ＧＯＰ）レイアウト、最大動きベクトル探索範囲などを含むことができる。コントローラ（６５０）は、特定のシステム設計のために最適化された、ビデオエンコーダ（６０３）に関係する他の好適な機能を有するように構成され得る。

【0080】

いくつかの実施形態では、ビデオエンコーダ（６０３）は、コーディングループで動作するように構成されている。かなり単純化した説明として、一例では、コーディングループは、ソースコーダ（６３０）（例えば、コーディング対象の入力ピクチャ及び参照ピクチャに基づいて、シンボルストリームなどのシンボルを生成することを担当する）と、ビデオエンコーダ（６０３）に埋め込まれた（ローカル）デコーダ（６３３）と、を含むことができる。デコーダ６３３は、（リモート）デコーダが作成するのと同様の方式でサンプルデータを作成するためにシンボルを再構成する。再構成サンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（６３４）に入力される。シンボルストリームのデコーディングは、デコーダの場所（ローカル又はリモート）に依存しないビット単位で正確な結果をもたらすので、参照ピクチャメモリ（６３４）における内容も、ローカルエンコーダとリモートエンコーダとの間では、ビット単位で正確である。言い換えると、エンコーダの予測部分は、デコーダがデコーディング中に予測を使用するときに「見る」のとまったく同じサンプル値を参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理（例えば、チャンネルエラーにより同期性を維持することができない場合、ドリフトが結果として生じる）が、同様にいくつかの関連技術で使用される。

【0081】

「ローカル」デコーダ（６３３）の動作は、ビデオデコーダ（５１０）のような「リモート」デコーダのものと同じにすることができ、これは、図５と併せて既に詳細に上述されている。また図５を簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（６４５）及び解析器（５２０）によって、コーディングされたビデオシーケンスへのシンボルのエンコーディング／デコーディングが可逆とすることができるので、バッファメモリ（５１５）及び解析器（５２０）を含むビデオデコーダ（５１０）のエントロピーデコーディング部分は、ローカルデコーダ（６３３）に完全には実装されなくてもよい。

【0082】

一実施形態では、デコーダに存在する解析／エントロピーデコーディングを除くデコーダ技術は、対応するエンコーダに同一又は実質的に同一の機能形態で存在する。したがって、開示された主題はデコーダ動作に焦点を当てる。エンコーダ技術の説明は、包括的に記載されるデコーダ技術の逆であるため、省略することができる。特定のエリアでは、より詳細な説明が以下に提供される。

【0083】

動作中、いくつかの例では、ソースコーダ（６３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の先行してコーディングされたピクチャを参照して、入力ピクチャを予測的にコーディングする動き補償予測コーディングを行ってもよい。このようにして、コーディングエンジン（６３２）は、入力ピクチャの画素ブロックと、入力ピクチャに対する予測参照として選択され得る参照ピクチャの画素ブロックとの間の差をコーディングする。

【0084】

ローカルビデオデコーダ（６３３）は、ソースコーダ（６３０）によって作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコーディングされたビデオデータをデコーディングしてもよい。コーディングエンジン（６３２）の動作は、有利には、不可逆処理であってもよい。コーディングされたビデオデータがビデオデコーダでデコーディングされ得るときに（図６に図示せず）、再構成されたビデオシーケンスは、典型的には、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ６３３は、ビデオデコーダによって参照ピクチャ対して行われてもよいデコーディング処理をレプリカし、再構成された参照ピクチャが参照ピクチャメモリ（６３４）に記憶されるようにしてもよい。このようにして、ビデオエンコーダ（６０３）は、遠端ビデオデコーダによって取得されるであろう（伝送誤差が存在しない）再構成された参照ピクチャと共通のコンテンツを有する再構成された参照ピクチャのコピーを、ローカルに記憶してもよい。

【0085】

予測器（６３５）は、コーディングエンジン（６３２）について予測探索を行ってもよい。すなわち、コーディング対象の新しいピクチャの場合、予測器（６３５）は、（候補参照画素ブロックとして）サンプルデータ、又は新しいピクチャに対する適切な予測参照として機能する参照ピクチャ動きベクトル、ブロック形状などの特定のメタデータについて参照ピクチャメモリ（６３４）を探索してもよい。予測器（６３５）は、適切な予測参照を見つけるために、サンプルブロック対画素ブロックベースで動作してもよい。場合によっては、予測器（６３５）によって取得された探索結果によって判定されるように、入力ピクチャは、参照ピクチャメモリ（６３４）に記憶された複数の参照ピクチャから引き出された予測参照を有してもよい。

【0086】

コントローラ（６５０）は、例えば、ビデオデータをエンコーディングするために使用されるパラメータ及びサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング動作を管理してもよい。

【0087】

前述の全ての機能ユニットの出力は、エントロピーコーダ（６４５）におけるエントロピーコーディングに供されてもよい。エントロピーコーダ（６４５）は、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従って、可逆圧縮をシンボルに適用することによって、様々な機能ユニットによって生成されたシンボルを、コーディングされたビデオシーケンスに変換する。

【0088】

送信機（６４０）は、エントロピーコーダ（６４５）によって作成されるコーディングされたビデオシーケンスをバッファし、通信チャネル（６６０）を介した伝送のために準備してもよく、通信チャネル（４６０）は、エンコーディングされたビデオデータを記憶するであろう記憶デバイスへのハードウェア／ソフトウェアリンクであってもよい。送信機（６４０）は、ビデオエンコーダ（６０３）からのコーディングされたビデオデータを、例えばコーディングされたオーディオデータ及び／又は補助的なデータストリーム（ソースは図示せず）など、送信される他のデータとマージしてもよい。

【0089】

コントローラ（６５０）は、ビデオエンコーダ（６０３）の動作を管理してもよい。コーディングの間、コントローラ（６５０）は、各コーディングされたピクチャに特定のコーディングされたピクチャタイプを割り当ててもよく、これは、それぞれのピクチャに適用され得るコーディング技法に影響を及ぼしてもよい。例えば、ピクチャは、以下のピクチャタイプの１つとして割り当てられることが多い。

【0090】

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の任意の他のピクチャを使用せずに、コーディング及びデコーディングされ得るものであってもよい。いくつかのビデオコーデックは、例えば、ＩＤＲ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ、独立デコーダリフレッシュ）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャのこれらの変形例、並びにそれらのそれぞれのアプリケーション及び特徴を理解している。

【0091】

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために、多くても１つの動きベクトル及び参照インデックスを使用して、イントラ予測又はインター予測を使用してコーディング及びデコーディングされ得るものであってもよい。

【0092】

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために、多くても２つの動きベクトル及び参照インデックスを使用して、イントラ予測又はインター予測を使用してコーディング及びデコーディングされ得るものであってもよい。同様に、多予測ピクチャは、１つのブロックの再構成のために、２つより多い参照ピクチャ及び関連付けられたメタデータを使用することができる。

【0093】

ソースピクチャは、一般的に、複数のサンプルブロック（例えば、それぞれ４×４、８×８、４×８、又は１６×１６個のサンプルのブロック）に空間的に細分化され、ブロック対ブロックベースでコーディングされてもよい。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てによって判定されるように、他の（既にコーディングされた）ブロックを参照して予測的にコーディングされてもよい。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてもよいし、それらは、同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてもよい（空間予測又はイントラ予測）。Ｐピクチャの画素ブロックは、１つの先行してコーディングされた参照ピクチャを参照して、空間的予測を介してか、又は時間的予測を介して予測的にコーディングされてもよい。Ｂピクチャのブロックは、１つ又は２つの先行してコーディングされた参照ピクチャを参照して、空間的予測を介してか、又は時間的予測を介してコーディングされてもよい。

【0094】

ビデオエンコーダ（６０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５．などの所定のビデオコーディング技術又は標準に従ってコーディング動作を行ってもよい。
その動作において、ビデオエンコーダ（６０３）は、入力ビデオシーケンスにおける時間的及び空間的冗長性を利用する予測的コーディング動作を含む様々な圧縮動作を行ってもよい。したがって、コーディングされたビデオデータは、使用されているビデオコーディング技術又は標準によって指定される構文に準拠してもよい。

【0095】

一実施形態では、送信機（６４０）は、エンコーディングされたビデオと共に追加のデータを送信してもよい。ソースコーダ（６３０）は、コーディングされたビデオシーケンスの一部としてそのようなデータを含んでもよい。追加のデータは、時間的／空間的／ＳＮＲ強化層、冗長ピクチャ及びスライスなどの他の形態の冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含んでもよい。

【0096】

ビデオは、時間シーケンスにおいて複数のソースピクチャ（ビデオピクチャ）としてキャプチャされてもよい。イントラピクチャ予測（イントラ予測と略されることが多い）は、所与のピクチャ内の空間的相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的又は他の）相関を利用する。一例では、カレントピクチャと呼ばれるエンコーディング／デコーディング下の特定のピクチャは、ブロックにパーティショニングされる。カレントピクチャ内のブロックが、ビデオにおいて先行してコーディングされ、かつ、依然としてバッファされている参照ピクチャ内の参照ブロックに類似するときに、カレントピクチャ内のブロックは、動きベクトルと呼ばれるベクトルによってコーディングされ得る。動きベクトルは、参照ピクチャ内の参照ブロックを指し、複数の参照ピクチャが使用中である場合に、参照ピクチャを識別する第３の次元を有することができる。

【0097】

いくつかの実施形態では、双予測技法は、インターピクチャ予測に使用され得る。双予測技法によれば、ビデオ内のカレントピクチャのデコーディング順序において両方とも前の（ただし、表示順序では、それぞれ過去及び将来であってもよい）第１の参照ピクチャ及び第２の参照ピクチャなどの２つの参照ピクチャが使用される。カレントピクチャ内のブロックは、第１の参照ピクチャ内の第１の参照ブロックを指す第１の動きベクトルと、第２の参照ピクチャ内の第２の参照ブロックを指す第２の動きベクトルとによってコーディングされ得る。ブロックは、第１の参照ブロックと第２の参照ブロックの組み合わせによって予測され得る。

【0098】

さらに、コーディング効率を改善するために、インターピクチャ予測にマージモード技法が使用され得る。

【0099】

本開示のいくつかの実施形態によれば、インターピクチャ予測、イントラピクチャ予測などの予測は、ブロックの単位で行われる。例えば、ＨＥＶＣ標準によれば、ビデオピクチャのシーケンスにおけるピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ）にパーティショニングされ、ピクチャ内部のＣＴＵは、６４×６４画素、３２×３２画素、又は１６×１６画素のように、同じサイズを有する。一般に、ＣＴＵは、１つの輝度ＣＴＢと２つの色差ＣＴＢである３つのコーディングツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つ以上のコーディングユニット（ＣＵ）に再帰的にクワッドツリーにスプリットされ得る。例えば、６４×６４画素のＣＴＵは、６４×６４画素の１つのＣＵ、３２×３２画素の４つのＣＵ、又は１６×１６画素の１６個のＣＵにスプリットされ得る。一例では、各ＣＵは、相互予測タイプ又はイントラ予測タイプのような、ＣＵに対する予測タイプを判定するために分析される。ＣＵは時間的及び／又は空間的予測可能性に依存して１つ以上の予測単位（ＰＵ）にスプリットされる。一般に、各ＰＵは輝度予測ブロック（ＰＢ）と２つの色差ＰＢを含む。一実施形態では、コーディング（エンコーディング／デコーディング）における予測動作は、予測ブロックの単位で行われる。予測ブロックの一例として輝度予測ブロックを使用すると、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素など、画素に対する値（例えば、輝度値）の行列を含む。

【0100】

図７は、ビデオエンコーダ（７０３）の例示的なブロック図を示す。ビデオエンコーダ（７０３）は、ビデオピクチャのシーケンス内のカレントビデオピクチャ内のサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックをコーディングされたビデオシーケンスの一部であるコーディングされたピクチャにエンコーディングするように構成されている。一例では、ビデオエンコーダ（７０３）は、図４の例におけるビデオエンコーダ（４０３）の代わりに使用される。

【0101】

ＨＥＶＣの例では、ビデオエンコーダ（７０３）は、８×８サンプルの予測ブロックなどの処理ブロックに対するサンプル値のマトリックスを受信する。ビデオエンコーダ（７０３）は、処理ブロックが、例えば、レート歪み最適化を使用して、イントラモード、インターモード、又は双予測モードを使用して、最良にコーディングされるかどうかを判定する。処理ブロックがイントラモードでコーディング対象であるときに、ビデオエンコーダ７０３は、処理ブロックをコーディングされたピクチャにエンコーディングするためにイントラ予測技法を使用してもよく、処理ブロックがインターモード又は双予測モードでコーディング対象であるときに、ビデオエンコーダ７０３は、処理ブロックをコーディングされたピクチャにエンコーディングするために、それぞれ、インター予測技法又は双予測技法を使用してもよい。特定のビデオコーディング技術では、マージモードは、予測子の外側のコーディングされた動きベクトルコンポーネントの利益なしに、動きベクトルが１つ以上の動きベクトル予測子から導出されるインターピクチャ予測サブモードとすることができる。特定の他のビデオコーディング技術では、対象ブロックに適用可能な動きベクトルコンポーネントが存在してもよい。一実施形態では、ビデオエンコーダ（７０３）は、処理ブロックのモードを判定するためのモード決定モジュール（図示せず）などの他のコンポーネントを含む。

【0102】

図７の例では、ビデオエンコーダ（７０３）は、図７に示すようにまとめて結合された、インターエンコーダ（７３０）、イントラエンコーダ（７２２）、残差計算器（７２３）、スイッチ（７２６）、残差エンコーダ（７２４）、汎用コントローラ（７２１）、及びエントロピーエンコーダ（７２５）を含む。

【0103】

インターエンコーダ（７３０）は、カレントブロック（例えば、処理ブロック）のサンプルを受信し、ブロックを参照ピクチャ内の１つ以上の参照ブロックと比較し（例えば、先行するピクチャ及び後のピクチャ内のブロック）、インター予測情報（例えば、インターエンコーディング技法による冗長情報の説明、動きベクトル、マージモード情報）を生成し、任意の好適な技法を使用して、インター予測情報に基づいてインター予測結果（例えば、予測ブロック）を計算するように構成されている。いくつかの例では、参照ピクチャは、エンコーディングされたビデオ情報に基づいてデコーディングされた、デコーディングされた参照ピクチャである。

【0104】

イントラエンコーダ（７２２）は、カレントブロック（例えば、処理ブロック）のサンプルを受信し、場合によっては、ブロックを、同じピクチャ内の既にコーディングされたブロックと比較し、変換後に量子化された係数を生成し、また、場合によっては、イントラ予測情報（例えば、１つ以上のイントラエンコーディング技法に従ったイントラ予測方向情報）も生成する。一例では、イントラエンコーダ（７２２）は、また、同じピクチャ内のイントラ予測情報及び参照ブロックに基づいてイントラ予測結果（例えば、予測ブロック）を計算する。

【0105】

汎用コントローラ（７２１）は、汎用制御データを判定し、汎用制御データに基づいてビデオエンコーダ（７０３）の他のコンポーネントを制御するように構成されている。一例では、汎用コントローラ（７２１）は、ブロックのモードを判定し、モードに基づいてスイッチ（７２６）に制御信号を提供する。例えば、モードがイントラモードであるときに、汎用コントローラ７２１は、残差計算器７２３が使用するイントラモードの結果を選択するようにスイッチ７２６を制御し、イントラ予測情報を選択し、ビットストリームにイントラ予測情報を含めるようにエントロピーエンコーダ７２５を制御し、モードがインターモードであるときに、汎用コントローラ７２１は、残差計算器７２３が使用するインター予測結果を選択するようにスイッチ７２６を制御し、インター予測情報を選択し、ビットストリームにインター予測情報を含めるようにエントロピーエンコーダ７２５を制御する。

【0106】

残差計算器（７２３）は、受信されたブロックと、イントラエンコーダ（７２２）又はインターエンコーダ（７３０）から選択された予測結果との間の差（残差データ）を計算するように構成されている。残差エンコーダ（７２４）は、残差データに基づいて動作し、残差データをエンコードして変換係数を生成するように構成されている。一例では、残差エンコーダ（７２４）は、残差データを空間ドメインから周波数ドメインにコンバートし、変換係数を生成するように構成されている。次いで、変換係数は、量子化された変換係数を取得するために量子化処理を受ける。様々な実施形態では、ビデオエンコーダ（７０３）はまた、残差デコーダ（７２８）を含む。残差デコーダ（７２８）は、逆変換を行い、デコードされた残差データを生成するように構成されている。デコードされた残差データは、イントラエンコーダ（７２２）及びインターエンコーダ（７３０）によって好適に使用され得る。例えば、インターエンコーダ（７３０）は、デコードされた残差データ及びインター予測情報に基づいて、デコードされたブロックを生成することができ、イントラエンコーダ（７２２）は、デコードされた残差データ及びイントラ予測情報に基づいて、デコードされたブロックを生成することができる。デコードされたブロックは、デコードされたピクチャを生成するために好適に処理され、デコードされたピクチャは、メモリ回路（図示せず）内でバッファされ、いくつかの例では参照ピクチャとして使用され得る。

【0107】

エントロピーエンコーダ（７２５）は、エンコードされたブロックを含むようにビットストリームをフォーマットするように構成されている。エントロピーエンコーダ（７２５）は、ＨＥＶＣ標準などの好適な標準に従った様々な情報をビットストリームに含むように構成されている。一例では、エントロピーエンコーダ（７２５）は、汎用制御データ、選択された予測情報（例えば、イントラ予測情報又はインター予測情報）、残差情報、及びビットストリーム内の他の好適な情報を含むように構成されている。開示された主題によれば、インターモード又は双予測モードのいずれかのマージサブモードでブロックをコーディングするときに、残基情報は存在しないことに留意する。

【0108】

図８は、ビデオデコーダ（８１０）の例示的な図を示す。ビデオデコーダ（８１０）は、コーディングされたビデオシーケンスの一部であるコーディングされたピクチャを受信し、コーディングされたピクチャをデコーディングして再構成されたピクチャを生成するように構成されている。一例では、ビデオデコーダ（８１０）は、図４の例におけるビデオデコーダ（４１０）の代わりに使用される。

【0109】

図８の例では、ビデオデコーダ（８１０）は、図８に示すようにまとめて結合された、エントロピーデコーダ（８７１）、インターデコーダ（８８０）、残差デコーダ（８７３）、再構成モジュール（８７４）、及びイントラデコーダ（８７２）を含む。

【0110】

エントロピーデコーダ（８７１）は、コーディングされたピクチャから、コーディングされたピクチャが作り出される構文要素を表す特定のシンボルを再構成するように構成され得る。このようなシンボルは、例えば、ブロックがコーディングされるモード（例えば、イントラモード、インターモード、双予測モード、マージサブモード又は別のサブモードにおける後者の２つ）、及びイントラデコーダ（８７２）又はインターデコーダ（８８０）によってそれぞれ予測のために使用される特定のサンプル又はメタデータを識別することができる予測情報（例えば、イントラ予測情報又はインター予測情報）を含むことができる。シンボルは、例えば、量子化された変換係数などの形態で残差情報を含むこともできる。一例として、予測モードがインター予測モード又は双予測モードであるときに、インター予測情報がインターデコーダ（８８０）に提供され、予測タイプがイントラ予測タイプであるときに、イントラ予測情報がイントラデコーダ（８７２）に提供される。残差情報は、逆量子化を受けることができ、残差デコーダ（８７３）に提供される。

【0111】

インターデコーダ（８８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成されている。

【0112】

イントラデコーダ（８７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成されている。

【0113】

残差デコーダ（８７３）は、逆量子化変換係数を抽出するために逆量子化を行い、逆量子化変換係数を処理して残差情報を周波数領域から空間領域にコンバートするように構成されている。残差デコーダ（８７３）はまた、特定の制御情報（ＱＰ（ＱｕａｎｔｉｚｅｒＰａｒａｍｅｔｅｒ）を含む必要とすることがあり、その情報は、エントロピーデコーダ（８７１）によって提供されてもよい（これは、低いボリュームの制御情報のみであり得るので、データパスは描写されていない）。

【0114】

再構成モジュール（８７４）は、空間領域において、残差デコーダ（８７３）による出力としての残差情報と、（場合によっては、インター又はイントラ予測モジュールによる出力としての）予測結果とを組み合わせて、再構成ブロックを形成するように構成されており、この再構成ブロックは、再構成ピクチャの一部であってもよく、再構成ピクチャは、再構成ビデオの一部であってもよい。デブロッキング動作などの他の好適な動作が、視覚品質を改善するために行われ得ることに留意されたい。

【0115】

なお、ビデオエンコーダ（４０３）、（６０３）及び（７０３）、並びにビデオデコーダ（４１０）、（５１０）及び（８１０）は、任意の好適な技法を使用して実装され得る。一実施形態では、ビデオエンコーダ（４０３）、（６０３）、及び（７０３）、並びにビデオデコーダ（４１０）、（５１０）、及び（８１０）は、１つ以上の集積回路を使用して実装され得る。別の実施形態では、ビデオエンコーダ（４０３）、（６０３）、及び（６０３）、並びにビデオデコーダ（４１０）、（５１０）、及び（８１０）は、ソフトウェア命令を実行する１つ以上のプロセッサを使用して実装され得る。

【0116】

図６の例のエントロピーコーダ（６４５）、図７の例のエントロピーエンコーダ（７２５）などのエントロピーコーダは、様々な情報をエンコーディングするためのエントロピーコーディング（例えば、エントロピーエンコーディング）を行うことができる。図７に戻って参照すると、エントロピーエンコーダ（７２５）は、ビデオ／ピクチャコーディングに関連する制御情報（例えば、予測情報）、残差信号（例えば、変換係数）などをエンコーディングすることができる。予測情報は、イントラ予測情報（例えば、イントラ予測モード情報）、インター予測情報（例えば、動き情報、インター予測モード情報）、他の予測モードに対する予測情報などを含むことができる。例えば、動き情報は、動きベクトル差（ＭＶＤ）を含む。

【0117】

エントロピーコーディングは、ビデオ／画像信号が構文要素に変換された後に行われ得る。エントロピーコーディングは、統計プロパティを使用してデータを圧縮する可逆圧縮スキームであり得る。例えば、構文要素のセットに対してエントロピーコーディングを行うことにより、構文要素を表すビット（ビンと呼ばれる）がビットストリームにおいてより少ないビット（コーディングされたビットと呼ばれる）にコンバートされ得る。

【0118】

上述の制御情報及び残差信号を構文要素にコンバートするために、様々な方法が使用され得る。一実施形態では、変換ブロックの残差信号が空間領域から周波数領域（例えば、空間周波数領域）に変換されて、変換係数のブロックを生成する。量子化は、変換係数のブロックを変換係数レベル（例えば整数）のブロックに量子化するために行われ得る。残差信号を変換係数レベルに変換するために様々な技法が使用され得る。変換係数レベルのブロックが処理されて、構文要素を生成してもよい。構文要素は、エントロピーエンコーダに入力され得、ビットストリーム内のビットにエンコーディングされ得る。

【0119】

一実施形態では、構文要素は、下記のように変換係数レベルから生成される。変換係数レベルのブロックは、１つ以上のサブブロックを含むことができる。サブブロックは、事前定義されたスキャン順序に従って処理され得る。図９は、矢印で示す逆対角スキャン順序など、サブブロックスキャン順序の一例を示す。ブロック（９１０）は、１６個のサブブロックにパーティションニングされる。右下コーナーにおけるサブブロック（９０１）が最初に処理され、左上コーナーにおけるサブブロック（９０２）が最後に処理される。変換係数レベルが全て０であるサブブロックに対して、そのサブブロックは処理されることなくスキップされ得る。

【0120】

少なくとも１つの非ゼロ変換係数レベルを有するサブブロックに対して、複数（例えば、４）のスキャンパスが行われ得る。サブブロック（９０５）の変換係数レベルの一例を示す。サブブロック（９０５）は、４つの非ゼロ変換係数レベル（例えば、－９、－１、６、及び３）を含む。各パスの間、サブブロック（９０５）内の（空間周波数領域における）１６個の位置は、例えば逆対角スキャン順序で走査され得る。

【0121】

変換係数レベルは、任意の好適な方法を使用して二値化され得る。図１０は、例えばサブブロックにおける変換係数レベルのグループの二値化の一例を示す。

【0122】

図１０は、サブブロックスキャン処理（１０００）の一例を示す。サブブロック（例えば、図９のサブブロック）内の１６個の変換係数レベルに対応する１６個の位置（例えば、係数位置）（１０１０）が、図１０の最下部に一次元で示されている。位置（１０１０）は、それぞれのスキャン順序（０～１５）を反映して０～１５に番号付けされている。第１のパスの間、位置（１０１０）は０～１５まで走査され、３つのビンストリング（１００１）～（１００３）が生成され得る。

【0123】

ビンストリング（１００１）は、それぞれの位置（１０１０）に有意フラグ（例えば、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ）を含むことができる。ビンストリング（１００１）内の各ビン（例えば、有意フラグ）は、それぞれの変換係数の絶対変換係数レベル（例えば、ａｂｓＬｅｖｅｌ）が０（例えば、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇが０）であるか、又は０よりも大きい（例えば、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇが１）かを示すことができる。

【0124】

ビンストリング（１００２）は、それぞれの位置（１０１０）にパリティフラグ（例えば、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ）を含むことができる。ビンストリング（１００２）内の各ビン（例えば、パリティフラグ）は、それぞれの変換係数のａｂｓＬｅｖｅｌのパリティを示すことができる。

【0125】

ビンストリング（１００３）は、それぞれの位置（１０１０）に、より大きい１フラグ（例えばｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇ）を含むことができる。ビンストリング（１００３）内の各ビン（例えば、より大きい１フラグ）は、（ａｂｓＬｅｖｅｌ－１）＞＞１が０よりも大きいかどうかを示すことができる。より大きい１フラグは、それぞれの変換係数のａｂｓＬｅｖｅｌが非ゼロであるときにのみ生成される。

【0126】

一例では、ビンストリング（１００４）は、第２のパスの間に生成される。ビンストリング（１００４）は、より大きい２フラグ（例えば、ｒｅｍ＿ａｂｓ＿ｇｔ２＿ｆｌａｇ）を含むことができる。ビンストリング（１００４）内の各ビン（例えば、より大きい２フラグ）は、それぞれの変換係数のａｂｓＬｅｖｅｌが４よりも大きいかどうかを示すことができる。より大きい２フラグは、それぞれの変換係数について（ａｂｓＬｅｖｅｌ－１）＞＞１が０より大きいときにのみ生成される。

【0127】

一例では、ビンストリング（１００５）は、第３のパスの間に生成される。ビンストリング（１００５）は、剰余値（例えば、ａｂｓ＿ｒｅｍａｉｎｄｅｒ）を含むことができる。ビンストリング（１００５）内の各ビン（例えば、剰余値）は、４よりも大きいそれぞれの変換係数のａｂｓＬｅｖｅｌの剰余値を示すことができる。剰余値は、それぞれの変換係数のａｂｓＬｅｖｅｌが４よりも大きいときにのみ生成される。

【0128】

一例では、ビンストリング（１００６）は、第４のパスの間に生成される。ビンストリング（１００６）は、それぞれの非ゼロ係数レベルの符号を示すことができる。ビンストリング（１００６）内の各ビン（例えば、符号）は、それぞれの変換係数レベルの符号を示すことができる。

【0129】

ビンストリング（１００１）は、１６個の位置（１０１０）に対応する１６個のビンを含む。他のビンストリング（１００２）～（１００６）は、１６個以下のビンを含むことができる。１６個の位置（１０１０）のいずれにも対応する情報が存在しない場合、それぞれのビンストリングは、生成されない。例えば、１６個の位置（１０１０）に剰余値が存在しない場合、ビンストリング（１００５）は、生成されない。

【0130】

図１０を参照すると、各変換係数レベル（例えば、位置３における変換係数レベル）は、同じ位置（例えば、位置３）における対応するビンのセット（例えば、ビン（１０２０））に基づいて判定され得る。ビンのセット（例えば、（１０２０））は、ビンストリング（１００１）～（１００６）の各々からのそれぞれのビン（例えば、ビンが利用可能である場合）を含むことができる。

【0131】

ビンストリング（１００１）～（１００６）は、例えば、図６～図７に記載されているように、エントロピーエンコーダによってエンコーディングされ得る。一例では、エントロピーエンコーダは、エントロピーエンコーディングの一形態であるコンテキストベース適応二値算術コーディング（ＣＡＢＡＣ）を実装する。例えば、ＣＡＢＡＣは、Ｈ．２６４／ＭＰＥＧ－４ＡＶＣ、ＨＥＶＣ標準などの様々なビデオコーディング標準で使用される。ＣＡＢＡＣは、可逆圧縮技法であり得る。ＣＡＢＡＣは、算術コーディングに基づく。二値シンボルがエンコーディングされ得、複雑さを低くすることができ、任意のシンボルのより頻繁に使用されるビットに対する確率モデリングが許容される。

【0132】

ＣＡＢＡＣでは、ビンストリング（例えば、（１００１）～（１００６）のうちの１つ）内のビンに対する確率推定値を提供するコンテキストモデル（確率モデルとも呼ばれる）が、そのビンについて判定され得る。いくつかの例では、確率モデルは、コンテキストモデリングなしの固定的選択によって判定される。

【0133】

いくつかの例では、ビンストリング内のビンがローカル的によく相関されている場合、確率モデルは、コンテキストモデリングを用いて、例えば、ビン内でコーディング対象ビンに関連付けられたローカルコンテキストに基づいて判定される。したがって、どのコンテキストモデルがコーディング対象ビンをコーディングするために使用されるかは、特定のビンのローカルコンテキストに基づき得る。ローカルコンテキストに基づいてコンテキストモデルを適応的に選択することで、より良い確率モデリングを提供することができる。例えば、図１０を参照すると、位置３に関連付けられたビン（１００１（３））に対するローカルコンテキストは、位置１～２に関連付けられた変換係数レベル情報、位置３の位置情報などを含むことができる。

【0134】

図１１は、カレント位置（又はカレント係数）（１１２０）に対応するカレントビンのコンテキスト選択に使用されるローカルテンプレート（又はコンテキストテンプレート）（１１３０）の一例を示す。ローカルテンプレート（１１３０）は、係数ブロック（１１１０）内のカレント位置（１１２０）の隣接位置（例えば、Ａ～Ｅ）又は隣接変換係数のセットをカバーすることができる。図１１の例では、係数ブロック（１１１０）は、８×８の位置を有し、６４個の位置に変換係数レベルを含む。ローカルテンプレート（１１３０）は、カレント係数（１１２０）の右下における５つの位置テンプレートとして定義され得る。ローカルテンプレートは、より少ない位置又はより多くの位置を含むことができる。一例では、ローカルテンプレートは、カレント係数（１１２０）に隣接する２つの位置（例えば、Ａ～Ｂ）を含み、Ｃ～Ｅを含まない。逆対角スキャン順序が係数ブロック内の位置に対する複数のパスに使用されるとき（１１１０）に、ローカルテンプレート内の位置（１１３０）は、カレント係数（１１２０）の前に処理される。

【0135】

コンテキストモデリングの間、カレント係数（１１２０）に対応するカレントビンに対するコンテキストモデルは、ローカルテンプレート（１１３０）内の変換係数レベルの情報などのローカルテンプレート（１１３０）の情報に基づいて判定され得る。テンプレートの大きさは、ローカルテンプレート（１１３０）内の変換係数又は変換係数レベルの大きさを示すように定義され得る。一例では、コンテキストモデルは、テンプレートの大きさに基づいて選択される。

【0136】

一例では、テンプレートの大きさは、ローカルテンプレート（１１３０）内の部分的に再構成された絶対変換係数レベルの和（例えば、ｓｕｍＡｂｓ１）として定義される。部分的に再構成された絶対変換係数レベルは、ビンストリング（例えば、ビンストリング（１００１）～（１００３））に従って判定され得る。一実施形態では、位置（ｘ，ｙ）における部分的に再構成された絶対変換係数レベルは、以下に従って判定され得る。

【数1】

式中、ｘ及びｙは、係数ブロック（１１１０）の左上コーナーに対する座標である。

【0137】

いくつかの実施形態では、カレントビンは、カレント係数（１１２０）に対応するビンストリング（１００１）内のビンであり、コンテキストモデルは、ｓｕｍＡｂｓ１に基づいて選択される。一例では、カレントビンに対するコンテキストモデルは、ｓｕｍＡｂｓ１及びカレントビンの対角位置ｄに基づいて選択される。ｄは、ｘ０＋ｙ０であり、ｘ０及びｙ０は係数ブロック（１１１０）の左上コーナーに対するカレント位置（１１２０）の座標である。走査パス内の対角位置ｄは、カレント係数（１１２０）の空間周波数を示すことができ、対角位置ｄに基づく適応コンテキストモデリングは、空間周波数依存性コンテキストモデリングとして解釈される。

【0138】

図１１に記載のように、ビンストリング（１００１）～（１００３）内のビンなどのビンが統計的に相関されるときに、カレント位置（１１２０）におけるカレントビンに対してどのコンテキストモデルが選択されるかは、コンテキストに依存する可能性がある。コンテキストは、例えば、ローカルテンプレート（１１３０）における隣接位置の情報を含むことができる。コンテキストは、空間周波数依存性コンテキストモデリングを示すカレントビンの位置情報（例えば、ｄ）を含むことができる。

【0139】

異なるタイプのビンストリングは、別個の統計的特性を有することができ、したがって、異なるセットのコンテキストモデルでエンコーディングされ得る。例えば、第１のセットのコンテキストモデルがビンストリング（１００１）に対して設定され、第２のセットのコンテキストモデルがビンストリング（１００２）に対して設定される。他のセットのコンテキストモデルは、ＭＶＤに関連付けられたビンストリングのような他のタイプのビンストリングをコーディングするように設定され得る。

【0140】

例えば、対角位置ｄ及び／又はｓｕｍＡｂｓ１に基づいて、同じビンストリング（例えば、（１００１））内のビンに対して異なるコンテキストモデルが選択され得る。

【0141】

一例では、非二値構文要素は単一のビンストリングによって表され、単一のビンストリング内のビンは統計的に相関される。

【0142】

特定のタイプのビンストリングはコンテキストモデルでコーディングされない。例えば、ビンストリング（１００６）は、図１３に記載のバイパスコーディングモードを使用してエンコーディングされる。

【0143】

図１２Ａは、一実施形態による、例示的なＣＡＢＡＣベースのエントロピーエンコーダ（１２００Ａ）を示す。例えば、エントロピーエンコーダ（１２００Ａ）は、図６の例のエントロピーコーダ（６４５）、又は図７の例のエントロピーエンコーダ（７２５）で実装され得る。エントロピーエンコーダ（１２００Ａ）は、コンテキストモデラ（１２１０）及び二値算術エンコーダ（１２２０）を含むことができる。一例では、様々なビンストリングが、エントロピーエンコーダ（１２００Ａ）に入力される。ビンストリングは、二値の構文要素及び／又は非二値の構文要素からコンバートされたビンストリングを含むことができる。

【0144】

一例では、コンテキストモデラ（１２１０）は、コンテキストモデリング処理を行って、受信したビンストリング内のビンに対するコンテキストモデルを選択する。コンテキストモデルは、例えば、ビンのタイプ（例えば、（１００１）又は（１００３））、変換コンポーネントの色コンポーネントタイプ、受信したビンに関連付けられた変換係数の位置（例えば、対角位置ｄ）、及びビンに関連付けられた先行して処理された隣接変換係数（例えば、ローカルテンプレート（１１３０））などに基づいて、受信したビンについて判定され得る。コンテキストモデルは、例えば、受信されたビンの値（例えば、「０」又は「１」）及びビンの確率推定値に基づいて、ビンストリング内の次のビンの確率推定値を提供することができる。

【0145】

様々な確率モデルを使用して、受信したビンストリング内のビンに対する確率推定値を判定（例えば、更新）することができる。図１０を参照すると、一実施形態では、ビンｂ［ｋ＋１］（例えば１００１（２））に対する確率推定値ｐ［ｋ＋１］は、ビンｂ［ｋ］（例えば１００１（１））に対する確率推定値ｐ［ｋ］及びビンｂ［ｋ］の値に依存することができる。確率モデルｆ_ａは、式（２）に示すように、パラメータａを変化させることにより修正され得る。

【数2】

【0146】

ｐ［ｋ＋１］は、ビンｂ［ｋ＋１］が「１」又は「０」である確率を示すことができる。一例では、ｐ［ｋ＋１］は、ビンｂ［ｋ＋１］が「１」である確率を示す。ビンｂ［ｋ＋１］が「０」である確率は、ｐ［ｋ＋１］に基づいて判定され得る。代替的には、ｐ［ｋ＋１］が、ビンｂ［ｋ＋１］が「０」である確率を示す場合、ｐ［ｋ＋１］に基づいて、ビンｂ［ｋ＋１］が「１」である確率が判定され得る。

【0147】

ｐ［ｋ］は、７ビット整数ｋ_ｎ（例えば、０～１２７）などのマルチビット整数ｋ_ｎによって表され得、確率は、確率状態（例えば、１２８状態）によって離散化される。確率の更新は、例えば、ｂ［ｋ］の値に応じて、１つの状態（例えば、ｐ［ｋ］を示す第１の数）から別の状態（例えば、ｐ［ｋ＋１］を示す第２の数）にマッピングする例えば、ルックアップテーブル（例えば、状態遷移テーブル）を使用して実装され得る。パラメータ「ａ」は、適応レート、例えば、２つの近接する確率状態間の差Δｐを示すことができる。例えば、ｐ［ｋ＋１］は、ビンｂ［ｋ＋１］が「１」である確率を示す。ｂ［ｋ］が１である場合、ｐ［ｋ＋１］はｐ［ｋ］よりも大きく（例えばΔｐ＞０）、ビンｂ［ｋ＋１］はｂ［ｋ］よりも「１」である可能性が高いと推定される。それ以外の場合、ｂ［ｋ］が０である場合、ｐ［ｋ＋１］はｐ［ｋ］よりも小さく（例えばΔｐ＜０）、ビンｂ［ｋ＋１］はｂ［ｋ］よりも「１」である可能性が低いと推定される。

【0148】

一例では、算術コーディングエンジンは、確率状態を直接使用することができる。ＣＡＢＡＣでは，量子化された確率範囲と確率状態を使用することによって乗算のない範囲分割が用いられ得る。

【0149】

別の実施形態では、複数仮説確率推定が適用される。確率は、式（３）～式（５）に示すように、適応レートの異なる複数の推定値（例えば、２つの推定値ｑ１［ｋ］とｑ２［ｋ］）を平均化することによって推定され得る。

【数3】

【0150】

パラメータａ１及びａ２は、それぞれ２つの推定値ｑ１［ｋ］及びｑ２［ｋ］の適応レートを示す。ａ１はａ２と異なる可能性がある。式（２）の説明は、式（３）～式（４）に好適に適応され得る。Ｗ１がＷ２と異なるときに、式（５）は、複数の推定値ｑ１［ｋ＋１］とｑ２［ｋ＋１］の加重平均ｐ［ｋ＋１］を示す。

【0151】

コンテキストモデルリスト（１２０２）は、コンテキストモデルを含むことができる。コンテキストモデルリスト（１２０２）は、メモリ（１２０１）に記憶され得る。コンテキストモデルリスト（１２０２）内の各エントリは、コンテキストモデルを表すことができる。各コンテキストモデルには、コンテキストモデルインデックス又はコンテキストインデックスと呼ばれるインデックスを割り当てることができる。一例では、メモリ（１２０１）は、確率推定値ｐ［ｋ］、又は確率推定値を示す確率状態を記憶する。コンテキストモデリングの間、コンテキストモデラ（１２１０）は、コンテキストモデルリスト（１２０２）からコンテキストモデルを選択し、選択されたコンテキストモデルをビンに割り当てることができる。

【0152】

コンテキストモデルの確率推定値は、例えば、ビンストリングにおいてエンコーディング対象の最初のビンに対して初期化され得る。コンテキストモデルリスト（１２０２）上のコンテキストモデルがビンをエンコーディングするように割り当てられた後、コンテキストモデルは、更新された確率推定値を有するビンの値に従って、例えば、式２又は式３～式５を使用して、続いて更新され得る。

【0153】

一実施形態では、二値算術エンコーダ（１２２０）は、ビン及び関連付けられたコンテキストモデル（例えば、確率推定値）を受信し、確率推定値に基づいて二値算術コーディング処理を行い、したがって、ビンのシーケンスが、コーディングされたビットにコンバートされる。ビンは、ビン値と共に渡される関連付けられた適応確率モデルの実際の状態に基づいてエンコーディングされ得る。コーディングされたビットが生成され、ビットストリームで送信され得る。コンテキストモデルは適応であり得、例えば、受信したストリング内の次のビンに対するコンテキスト選択は、図１１に記載のように、先行してエンコーディング／デコーディングされたビンの値に依存することができる。

【0154】

図１２Ｂは、一実施形態による、例示的なＣＡＢＡＣベースのエントロピーデコーダを示す。例えば、エントロピーデコーダ（１２００Ｂ）は、図５の例の解析器（５２０）、又は図８の例のエントロピーデコーダ（８７１）で実装され得る。エントロピーデコーダ（１２００Ｂ）は、二値算術デコーダ（１２３０）と、コンテキストモデラ（１２４０）と、を含むことができる。二値算術デコーダ（１２３０）は、コーディングされたビットをビットストリームから受信し、二値算術デコーディング処理を行って、コーディングされたビットからビンを復元する。コンテキストモデラ（１２４０）は、コンテキストモデラ（１２１０）と同様に動作することができる。例えば、コンテキストモデラ（１２４０）は、メモリ（１２０３）に記憶されたコンテキストモデルリスト（１２０４）からコンテキストモデルを選択し、選択したコンテキストモデルを二値算術デコーダ（１２３０）に提供することができる。メモリ（１２０３）及びコンテキストモデルリスト（１２０４）は、図１２Ａに記載のメモリ（１２０１）及びコンテキストモデルリスト（１２０２）と同様又は同一であり得る。

【0155】

一例では、コンテキストモデラ（１２４０）は、二値算術デコーダ（１２３０）から復元されたビンに基づいてコンテキストモデルを判定する。

【0156】

異なるビンストリングをエンコーディングするために、異なるエントロピーエンコーディングスキームが用いられ得る。例えば、有意フラグ、パリティフラグ、より大きい１フラグ、及びより大きい２フラグが、図１２Ａの例に記載のもののようにＣＡＢＡＣベースのエントロピーエンコーダでエンコーディングされ得る。第３のパス及び第４のパスの間に生成された構文要素は、ＣＡＢＡＣバイパスされたエントロピーエンコーダ（例えば、入力ビンに対して固定された確率推定値を有する二値算術エンコーダ）を用いてエンコーディングされ得る。

【0157】

図１３は、エンコーダで使用されるようなＣＡＢＡＣの一例を示す（例えば、（６４５）、（７２５））。ＣＡＢＡＣは，異なるコンテキストに対して複数の確率モードを有することができる。ＣＡＢＡＣでは、データシンボルをコーディングすることは、二値化、コンテキストモデリング、二値算術コーディングなどの１つ以上の段階を含むことができる。１つ以上のステージが省略又は修正されてもよい。追加の段階が追加されてもよい。

【0158】

いくつかの実施形態では、非二値構文要素のような非二値シンボル（例えば、全ての非二値シンボル）は、二値化器（１３０１）による二値化によって、ビンストリングのような二値にコンバートされ得る。一例では、ビンストリングは、非二値構文要素に基づいて生成される。ビンストリング内のビット（又はビン）に対して、コーダは、どの確率モデルを使用するか（コンテキストモデリング）を選択することができ、近くの要素からの情報を使用して確率推定値を最適化することができる。算術コーディングは、例えば二値算術コーダ（１３０５）を用いてデータを圧縮するために適用され得る。いくつかの二値シンボルについては、「１」又は「０」である確率が、確率をよりよく推定するための良好なコンテキストなしに等しい場合、二値シンボルは、コンテキストモデルを使用することなくコーディングされ得、したがってバイパスコーディングが使用される。図１３に示す実施例又は変形例は、Ｈ．２６４／ＡＶＣ又は他のビデオコーディング標準で使用され得る。コンテキストモデリングは、コーディングシンボルの条件付き確率の推定値を提供することができる。好適なコンテキストモデルを利用して、所与のシンボル間冗長性は、エンコーディング対象のカレントシンボルの近傍において既にコーディングされたシンボルに従って、異なる確率モデル間で切り替えることによって利用され得る。

【0159】

一実施形態では、ＣＡＢＡＣは二値算術コーディングを使用し、したがって二値決定（１又は０）のみがエンコーディングされる。二値化では、算術コーディングの前に、二値化器（１３０１）により、非二値のシンボル（例えば、変換係数又は動きベクトル）が二値化又は二値にコンバートされ得る。二値化処理は、伝送の前に二値コードがさらにエンコーディングされる（例えば、算術コーダによって）ことを除いて、データシンボルを可変長コードにコンバートする処理に類似することができる。シンボル又は構文要素が二値構文要素である場合、二値化がスキップされ得る。二値化器（１３０１）からのビンは、二値算術コーディングエンジンに入力され得る。

【0160】

ビンストリングは、二値化器（１３０１）からの二値化されたシンボル又は二値構文要素であり得る。一例では、ビンストリング内のビンは連続的に処理される。ＣＡＢＡＣにおける１つ以上の段階は、ビンストリングの各ビット（又は「ビン」）に対して繰り返され得る。

【0161】

通常コーディングモードとバイパスコーディングモードとの間のコーディングモード決定は、例えば、それぞれのビンとビンストリング内の他のビンとの間の統計的相関に基づいて、ビン毎に行われ得る。例えば、バイパスコーディングモードは、符号情報に関連するビン（例えば、（１００６）のビン）に対して選択されるか、又は均等に分散され得る下位有効ビン（例えば、（１００５）のビン）に対して選ばれる。バイパスコーディングモードが選択される場合、通常の二値算術エンコーディング処理が、ビンに対してバイパスされ得る。バイパスコーディングモードでは、ビンはバイパスコーディングエンジン（１３０４）でコーディングされる。例えば、Ｇｏｌｏｍｂ－Ｒｉｃｅを使用するような、固定された確率モデルに基づく算術コーディングが使用されてもよい。

【0162】

通常コーディングモードでは、コンテキストモデラ（１３０２）は、ビンに対して確率モデルなどのコンテキストモデルを選択することができる。コンテキストモデルは、二値化シンボルの１つ以上のビンに対する確率モデルである。図１２Ａに記載のように、コンテキストモデルは、例えば、最近コーディングされたデータシンボルの統計に応じて、（例えば、（１２０２）の）利用可能なコンテキストモデルの選択から選ばれてもよい。コンテキストモデルは、各ビンが「１」又は「０」である確率を記憶することができる。

【0163】

一例では、コンテキストモデラ（１３０２）は、例えば、図１１に記載のように、ローカルテンプレート、対角位置などに基づいてコンテキストモデルを選択することができる。コンテキストモデルが適応的に選択されるときに、ビンストリング内の異なるビン（例えば、（１００１）のビン）は、異なるコンテキストモデルインデックスに関連付けられた異なるコンテキストモデルを有することができる。

【0164】

コンテキストモデラ（１２１０）の説明は、コンテキストモデラ（１３０２）に適用され得る。一例では、コンテキストモデラ（１３０２）は、コンテキストモデラ（１２１０）と類似又は同一である。

【0165】

コンテキストモデルは、様々な構文要素に対して設計され得る。上述したように、コンテキストモデルは、様々なタイプの構文要素に対して設計され得る。構文要素の例示的なクラスは、残差情報（例えば、変換係数）、制御情報（例えば、ＭＶＤ、スキップモードフラグ、予測モード情報、ブロック情報など）を含む。１つのタイプの構文要素（例えば、ＭＶＤ）は、複数のコンテキストモデルに関連付けられ得る。

【0166】

（「１」又は「０」である）構文要素の先行するコーディング結果を使用して、各二値化シンボルのコンテキスト状態又は確率状態（例えば、各ビンが「１」又は「０」である確率）を更新し、コンテキストモデルを構文要素のローカル特性に対してより適応的にすることができる。更新されたコンテキスト状態から正確な予測を有することによって、コーディング効率を改善することができる。一般に、ある適応の後、シンボルが（例えば、履歴結果から）「１」である可能性がより高い場合、コンテキスト状態は、「０」の代わりに「１」に傾くように更新され得る。

【0167】

コンテキストモデラ（１３０２）は、ビン及びコンテキストモデル（例えば、確率状態）を出力することができる。選択されたコンテキストモデルは、実際のコーディングされた値に基づいて更新され得る（例えば、ビン値が「１」である場合、「１」の頻度カウントが増加される）。

【0168】

算術コーダ（１３０５）は、選択された確率モデルに従って各ビンをエンコーディングすることができる。一例では、２つのサブ範囲（「０」及び「１」に対応）が各ビンに対して使用される。バイパスコーディングモードが選択されるときに、バイパスコーディングエンジン（１３０４）が、ビンをコーディングするために使用される。通常コーディングモードが選択されるときに、通常コーディングエンジン（１３０３）が、ビンをコーディングするために選択される。一例では、通所コーディングモードは、ビンの値の確率が所与の先行してコーディングされたビンの値が与えられれば予測可能であるビンをコーディングするために適用される。バイパスコーディングエンジン（１３０４）は、大幅に複雑さが低減されたこーディングエンジンの高速ブランチとすることができ、一方、通常コーディングエンジン（１３０３）は、所与のビン値をエンコーディングするが、ビン値と共に渡される関連付けられた適応確率モデルの実際の状態に依存する。

【0169】

通常コーディングモードが選択されるときに、選択されたコンテキストモデルは、実際のコーディングされた値に基づいて更新され得る（例えば、ビン値が「１」であった場合、「１」の頻度カウントが増加される）。

【0170】

いくつかの実施形態では、ランダムアクセス、並列処理の目的などの場合、画像及びビデオ信号は、デコーディング順序において直前にデコーディングされたデータに依存することなくコーディング（例えば、独立にコーディング）され得るより小さなコーディングセグメントにスプリットされる。各二値化シンボルに対して、コンテキストモデルは、先行するコーディング結果の既存のコンテキスト状態を継承する代わりに、コーディングセグメントの開始時に初期状態を有することができる。コーディングセグメントは、ピクチャ、スライス、タイル、ＣＴＵ行、ＣＴＵなどを含むことができる。良好な初期化なしでは、ＣＡＢＡＣエンジンは、いくつかの入力シンボルをコーディングした後にモデルのコンテキスト状態を調整するために一連の適応化を必要とすることがある。したがって、コンテキストモデルの初期状態とコーディングされたシンボルの実確率が一致しない場合、圧縮性能はコーディングセグメントの初期段階で影響を受ける可能性がある。

【0171】

図１４は、参照ピクチャからのコンテキスト状態を使用するカレントピクチャのＣＡＢＡＣ初期化の一例を示す。いくつかの例では、ピクチャ又はスライスの固定の場所におけるＣＡＢＡＣコンテキスト状態（又はＣＡＢＡＣ確率状態）は、次のピクチャ又は次のスライスのデコーディング／エンコーディングの開始時におけるＣＡＢＡＣコンテキスト状態に対する推定初期状態として記憶され得る。コーディング順序におけるピクチャＡ～Ｃを図１４に示す。一例では、ピクチャＡは、ピクチャＢ～Ｃをコーディングする前にコーディングされる。ピクチャＢの開始（例えば、コーディング対象の最初のビンストリング又は最初の構文要素）をコーディングするために使用されるＣＡＢＡＣコンテキスト状態に対する初期確率状態は、ピクチャＢの先行してコーディングされたピクチャであるピクチャＡ内のＣＴＵ（１４０１）におけるＣＡＢＡＣコンテキスト状態に基づいて判定（例えば、推定）され得る。

【0172】

一例では、ピクチャＣの開始（例えば、コーディング対象の最初のビンストリング又は最初の構文要素）をコーディングするために使用されるＣＡＢＡＣコンテキスト状態に対する初期確率状態は、ピクチャＣの先行してコーディングされたピクチャであるピクチャＢ内のＣＴＵ（１４０２）におけるＣＡＢＡＣコンテキスト状態に基づいて判定（例えば、推定）され得る。

【0173】

信号（例えば、残差情報、制御情報）のローカル特性は、同じピクチャ又は同じスライスの内部のある領域から別の領域へと変化し得る。コンテキスト状態初期化を実行するために図１４に記載の実施形態を使用することは、予測精度の観点から最適でないことがある。本開示の一実施形態によれば、コーディングされたピクチャからの適応ＣＡＢＡＣ初期状態選択を行って、新たなコーディングセグメントの開始時におけるコンテキストモデルの確率状態を推定することができる。

【0174】

異なる統計に適応するために、初期状態テーブルは、イントラ（Ｉ）スライスタイプ、双予測（Ｂ）スライスタイプ及び予測（Ｐ）スライスタイプに対して別々に事前定義又は予測され得る。Ｉスライス（イントラスライス）は、イントラ予測のみを使用してコーディング（例えば、デコーディング）され得る。Ｂスライスは、イントラ予測を使用して、又はインター予測を使用して、例えば、各ブロックのサンプル値を予測するために多くても２つの動きベクトル及び参照インデックスを用いてコーディング（例えば、デコーディング）され得、Ｐスライスは、イントラ予測を使用して、又はインター予測を使用して、例えば、各ブロックのサンプル値を予測するために多くても１つの動きベクトル及び参照参考指標を用いてコーディング（例えば、デコーディング）され得る。一例では、Ｉスライスタイプの初期状態テーブルはイントラスライスに対してのみ使用される。Ｂスライスタイプ及びＰスライスタイプの初期状態テーブルは、インタースライスのために選択されてもよい。Ｉスライスタイプ、Ｂスライスタイプ、及びＰスライスタイプに対する上記の説明は、Ｉピクチャタイプ、Ｂピクチャタイプ、Ｐピクチャタイプなどのピクチャタイプに拡張され得る。以下、コーディングセグメントの一例としてスライスが使用される。各ピクチャは、複数のスライスを含んでもよい。

【0175】

上述したように、ビンストリングは、１つ以上の構文要素に基づいて判定され得る。ビンストリングの初期確率は、１つ以上の構文要素における構文要素の初期確率であり得る。

【0176】

一例では、構文要素は、ビンストリングにコンバートされる。したがって、ビンストリングの初期確率（又は、構文要素をエントロピーコーディングするための初期確率）は、構文要素においてコーティング対象の最初のビンの確率（例えば、０又は１である確率）であり得る。最初のビンは、ビンストリング内の他のビンをコーディングする前にコーディング対象となる。式２又は式３～式５を使用して、初期確率で構文要素（又はビンストリング）をコーディングすることができる。

【0177】

一実施形態では、ブロック又はサブブロック内の構文要素のグループ（例えば、図１０の１６の変換係数レベル）は、複数のビンストリング（例えば、ビンストリング（１００１）～（１００６））にコンバートされる。各ビンストリング（例えば（１００１））は、構文要素のグループに関連付けられ得る。ビンストリングの初期確率は、ビンストリングにおけるコーディング対象の最初のビンの確率である。最初のビンは、単一の構文要素（例えば、スキャンパスにおける最初の構文要素）に関連付けられる。例えば、ビンストリング（１００１）の初期確率は、ビン（１００１（０））が１又は０である確率であり、位置０における変換係数レベルに関連付けられる。図１０に示す例では、単一の構文要素（例えば、位置０における変換係数レベル）が、例えば（１００１）～（１００３）にそれぞれ対応する複数の初期確率に関連付けられ得る。一実施形態では、独立にコーディング可能なカレントコーディングセグメントの構文要素は、構文要素における残りの構文要素をコーディングする前にエントロピーコーディングされる少なくとも１つの構文要素を含む。少なくとも１つの構文要素は、確率モデル又はコンテキストモデルでエントロピーコーディングされ得る。例えば、少なくとも１つの構文要素は、ビンストリングにコンバートされ、ビンストリングはエントロピーコーディングされる。

【0178】

コンテキストモデルの初期化処理は、エントロピーコーディングで行われ得る。一例では、少なくとも１つの構文要素の統計的性質に関するいかなる事前の知識がなくても、確率モデルの各々は、一様分布に対応する確率状態で初期化することができ、例えば、それぞれの確率モデルの初期確率状態は、等確率の確率を示す。

【0179】

一例では、少なくとも１つの構文要素の初期確率は、等確率の確率からスキューされる。カレントコーディングセグメントと統計的に相関する可能性の高い別の領域（例えば、先行してコーディングされたピクチャ内の領域）は、例えば、（ｉ）カレントコーディングセグメントの場所、及び（ｉｉ）カレントコーディングセグメントの量子化パラメータ（ＱＰ）に基づいて判定され得る。先行してコーディングされたピクチャ内の領域の先行する確率情報は、少なくとも１つの構文要素の初期確率をよりよく反映することができる。これにより、領域の先行する確率情報に基づいて、少なくとも１つの構文要素の初期確率を示す初期確率情報が判定され得、初期化をより効率的に行う。

【0180】

コーディングセグメントが、コーディング順序においてコーディングセグメントの直前にある先行してコーディングされたデータから独立してコーディングされ得る場合、コーディングセグメントは独立にコーディング可能である。独立にコーディング可能なコーディングセグメントは、コーディング順序において独立にコーディング可能なコーディングセグメントの直前にある先行してコーディングされたデータに依存することなくコーディングされ得る。カレントコーディングセグメントは、カレントピクチャ、カレントピクチャ内のカレント領域などであり得る。領域のエリアは、カレントピクチャのエリアよりも小さい。領域は、スライス、ＣＴＵなどとすることができる。独立にコーディング可能なコーディングセグメントの例は、ピクチャ、スライス、タイル、タイルグループ、ＣＴＵ行、ＣＴＵなどを含む。一例では、独立にコーディング可能なコーディングセグメントは、Ｉスライス、Ｂスライス、又はＰスライスなどのスライスである。

【0181】

カレントコーディングセグメントにおける少なくとも１つの構文要素は、カレントコーディングセグメントの動き情報、カレントコーディングセグメントの残差データ、及び／又はカレントコーディングセグメントをコーディングする制御情報（例えば、予測モード情報）を示すことができる。

【0182】

一例では、少なくとも１つの構文要素は、カレントコーディングセグメントにおける最初のブロックの構文要素を含む。最初のブロックは、カレントコーディングセグメント内の他のブロックをコーディングする前にコーディングされ得る。

【0183】

一実施形態では、カレントコーディングセグメントにおける最初のブロックは、複数のサブブロックを含む。少なくとも１つの構文要素は、最初のブロック内の最初のサブブロックの構文要素を含む。最初のサブブロックは、カレントコーディングセグメント内の任意の他のブロック又はサブブロックをコーディングする前にコーディングされ得る。

【0184】

一例では、少なくとも１つの構文要素は、図１０に示すように、サブブロックのうちの１つにおける変換係数レベルを含む。一例では、少なくとも１つの構文要素は、サブブロック又はブロックのＭＶＤを含む。独立にコーディング可能なコーディングセグメント（カレントスライス、カレントピクチャなどのカレントコーディングセグメントと呼ばれる）においてコーディング対象の（ｉ）最初のブロック又は（ｉｉ）最初のブロック内にある最初のサブブロックをコーディングするために、最初のブロック又は最初のサブブロック内の１つ以上の構文要素に関連付けられたビンストリングの初期確率を示す初期確率情報が、複数の先行するコーディングセグメントの１つにおける先行する確率情報に基づいて判定され得る複数の先行するコーディングセグメントの各々は、先行してコーディングされ得る。先行する確率情報は、先行してデコーディングされたピクチャ又はスライスなどの先行するコーディングセグメントにおける先行するブロック又は先行するサブブロック内の１つ以上の先行する構文要素に関連付けられた先行するビンストリングの先行する確率を含むことができる。ビンストリングと先行するビンストリングは同じタイプのものであり、例えば、ビンストリングは最初のサブブロックの有意フラグを含むビンストリング（１００１）であり、先行するビンストリングは先行するサブブロックの有意フラグを含む。

【0185】

初期確率情報は、初期確率を示す初期確率状態（又は初期コンテキスト状態）を含むことができる。初期確率情報（例えば、初期コンテキスト状態）は、先行してコーディングされたコーディングセグメント（例えば、先行してコーディングされたスライス又は先行してコーディングされたピクチャ）から継承することができる。カレントコーディングセグメント（例えば、カレントスライス又はカレントピクチャ）の統計的分布をより効率的にキャプチャするために、カレントコーディングセグメントの開始時に構文要素の各コンテキストは、記憶されたコンテキスト状態を先行してコーディングされたコーディングセグメント（例えば、先行してコーディングされたピクチャ）から継承することができる。

【0186】

初期確率情報に加えて、エントロピーコーディングのための他のパラメータは、カレントコーディングセグメントのコンテキスト状態が先行してコーディングされたコーディングセグメントの１つから初期化されるときに継承することができる。パラメータは、（例えば、式（３）～式（５）に記載のように適応重みを有する多重仮説確率推定が使用されるときに、）確率モデル（又はコンテキストモデル）を特定するために使用される適応レート及び／又は適応重みを含むことができる。

【0187】

図１４に記載のように固定のＣＴＵの場所における確率情報（例えば、コンテキスト状態）を使用する代わりに、先行するピクチャからの領域は、カレントスライスの開始がカレントピクチャ内のどこに位置しているかに基づくことができ、先行するピクチャからの領域におけるコンテキスト状態を使用して初期確率情報を判定することができる。図１５は、カレントピクチャ（１５０２）と参照ピクチャ（又は先行するピクチャ）（１５０１）との間の領域ベースのＣＡＢＡＣコンテキスト状態初期化マッピングの一例を示す。選択された先行してコーディングされたコーディングセグメント（例えば、先行してコーディングされたピクチャ）からのコンテキスト状態は、コーディング対象の最初のブロック又は最初のサブブロックがカレントピクチャ内のどこに位置するかに基づいて判定（例えば、選択）され得る。選択された先行するピクチャ（１５０１）は、複数の領域を含むことができる。各領域は、選択された場所における１つ以上の構文要素の確率情報（例えば、コンテキスト状態）が記憶され、予測のために使用され得る選択された場所を有することができる。図１５の例では、各領域について、選択されたＣＴＵが決定され得る。例えば、先行するピクチャ（１５０１）は、ＣＴＵ１を含む左上領域、ＣＴＵ２を含む右上領域、ＣＴＵ３を含む左下領域、ＣＴＵ４を含む右下領域、ＣＴＵ５を含む中央領域などの５つの領域を含む。一例では、５つの領域は、重なっていない。一例では、５つの領域は、先行するピクチャ（１５０１）全体をカバーすることができる。一例では、５つの領域のエリアは、先行するピクチャ（１５０１）全体のエリアよりも小さい。

【0188】

一例では、ＣＴＵ１～５の各々の１つ以上のコーディングされた構文要素（例えば、１つ以上のエントロピーコーディングされた構文要素）のコンテキスト状態（又は確率状態）などの確率情報が、それぞれのＣＴＵ（又はそれぞれの領域）記憶され得る。選択されたＣＴＵに関連付けられた１つ以上の構文要素のコンテキスト状態は、例えば、選択されたＣＴＵがコーディングされた後に記憶され得る。カレントコーディングセグメント（例えば、カレントスライス）に対して、カレントピクチャ（１５０２）におけるカレントコーディングセグメントの最初のコーディングユニット（例えば、最初のブロック）の左上位置のようなカレントコーディングセグメントの位置に従って、カレントコーディングセグメントが先行するピクチャ（１５０１）における複数の領域の領域にマッピングされ得、カレントコーディングセグメントの初期コンテキスト状態が、複数の領域のうちの領域からの関連付けられたコンテキスト状態に基づいて判定され得る。

【0189】

図１５を参照すると、カレントピクチャ（１５０２）は、スライスなどの複数の独立にコーディング可能なコーディングセグメントを含む。カレントピクチャ（１５０２）は、左上領域（１５１１）、右上領域（１５１２）、左下領域（１５１３）、右下領域（１５１４）、中央領域（１５１５）などの複数の領域（例えば、５つの領域）を含むことができる。一例では、５つの領域（１５１１）～（１５１５）は、重なっていない。一例では、５つの領域（１５１１）～（１５１５）は、ピクチャ（１５０２）全体をカバーする。カレントピクチャ（１５０２）内のスライスのような独立にコーディング可能なコーディングセグメントがコーディング対象である。カレントピクチャ（１５０２）内の独立にコーディング可能なコーディングセグメントに対するコンテキスト状態を初期化するために、先行するピクチャ（１５０１）における対応する領域又は場所は、カレントピクチャ（１５０２）内の独立にコーディング可能なコーディングセグメントの場所に基づいて判定され得る。一例では、独立にコーディング可能なコーディングセグメントの場所は、カレントコーディングセグメントの最初のコーディングユニット（例えば、最初のブロック）の左上位置によって示される。例えば、独立にコーディング可能なコーディングセグメントがカレントピクチャ（１５０２）内の領域（１５１１）にある場合、先行するピクチャ（１５０１）内の対応する領域は先行するピクチャ（１５０１）内の左上領域であり、先行するピクチャ（１５０１）内の左上の領域内にある対応するＣＴＵ１が選択され得る。したがって、ＣＴＵ１に関連付けられ記憶された確率情報（例えば、記憶されたコンテキスト状態）は、領域（１５１１）内の独立にコーディング可能なコーディングセグメントの初期確率情報を判定するために使用され得る。独立してコーディング可能なコーディングセグメントが別の領域（例えば、（１５１２）～（１５１５）のうちの１つ）に位置する場合、上記の説明を適用することができる。

【0190】

この例では、５つの位置（例えば、左上ＣＴＵ１、右上ＣＴＵ２、左下ＣＴＵ３、右下ＣＴＵ４、及び中央ＣＴＵ５）における構文要素のコンテキスト状態が記録又は記憶される。位置（例えば、ＣＴＵ５）は、選択されたＣＴＵ（例えば、ＣＴＵ５）がコーディングされたときに参照され得る。例えば、ＣＴＵ５における構文要素のコンテキスト状態は、カレントピクチャ（１５０２）内のカレントコーディングセグメントを初期化するために使用され得る。カレントピクチャ内の各スライスの開始時のカレントコーディングブロックの位置に従って、位置のうちの１つがＣＡＢＡＣコンテキスト状態初期化のために選択される。

【0191】

代替的には、コンテキスト状態が初期化処理で使用される先行するピクチャ（１５０１）内の場所の選択が、カレントピクチャ（１５０２）内の独立にコーディング可能なコーディングセグメント（例えば、カレントスライス）に対してシグナリングされ得る。例えば、複数の候補位置（例えば、ＣＴＵ１～ＣＴＵ５）のうちの１つを指し示すインデックスがシグナリングされる。

【0192】

図１４～図１５の初期化処理を比較すると、図１５の初期確率情報は、独立にコーディング可能なカレントコーディングセグメントの特定の情報に適応可能である。カレントコーディングセグメントの特定の情報は、カレントコーディングセグメントのＱＰ、カレントコーディングセグメントの場所などを含むことができる。したがって、初期確率情報は、カレントコーディングセグメントの特定の情報（例えば、ＱＰ、場所など）と一致する領域の先行する確率情報から判定される。これに対して、初期確率情報は、固定の場所の先行する確率情報から取得される図１４であり、カレントコーディングセグメントの特定の情報には可能ではない。様々な実施形態では、図１５の適応初期化処理は、エントロピーコーディング処理をより効率的に行うことができる。各独立にコーディング可能なコーディングセグメント（例えば、各スライス）に対して、例えば、カレントピクチャ（１５０２）において、それぞれの独立にコーディング可能なコーディングセグメント（例えば、それぞれのスライス）に使用されるコンテキスト初期化スキームを選択するために制御フラグがシグナリングされ得る。一例では、フラグがゼロであるときに、独立にコーディング可能なコーディングセグメントのコンテキスト状態は、スライスタイプに対して事前定義されたテーブル（例えば、Ｉスライスタイプ、Ｂスライスタイプ、及びＰスライスタイプに対して事前定義された初期状態テーブルのうちの１つ）のような既存のコンテキスト初期化テーブルを使用して初期化され得る。それ以外の場合（例えば、フラグが１であるときに）、独立にコーディング可能なコーディングセグメントのコンテキスト状態は、先行してコーディングされたスライスからの記憶されたコンテキスト状態をコピーすることなどにより、先行してコーディングされたコーディングセグメント（例えば、先行してコーディングされたスライス）からの記憶されたコンテキスト状態に基づいて初期化され得る。

【0193】

図１６は、インターコーディングのための階層的時間構造又は階層的時間コーディング構造の一例を示す。ピクチャ０～１５（略して、Ｐ０～Ｐ１５）が、図１６に示されている。表示順序は、Ｐ０からＰ１５までである。ピクチャに関連付けられた番号は、表示順序におけるものである。

【0194】

より低いレベル（例えば、レベル０）のピクチャは、より高いレベル（例えば、レベル１～４のうちの１つ）のピクチャの前にコーディングされる。あるレベルのピクチャは、同じレベル又はより高いレベルのピクチャを予測するための参照ピクチャとして使用されてもよい。

【0195】

カレントピクチャ（例えば、（１５０２））に対して、１つ以上の先行してコーディングされたピクチャが参照ピクチャとして利用可能であり得る。ＣＡＢＡＣコンテキスト初期化のための参照ピクチャの選択は、階層的時間コーディング構造におけるカレントピクチャの位置（例えば、レベル）に基づき得る。図１６の例では、Ｐ０とＰ１６がレベル０ピクチャとして最初にコーディングされる。一例では、Ｐ０がイントラコーディングされ、Ｐ１６が（例えば、Ｐ０に基づいて）インターコーディングされる。Ｐ８は、Ｐ０及び／又はＰ１６を参照ピクチャとしてレベル１ピクチャとしてコーディングされる。レベル２のピクチャの場合、例えば、コーディング対象のピクチャとそれぞれの参照ピクチャとの間の依存関係及び距離を考慮して、Ｐ４は、Ｐ０及びＰ８を参照ピクチャとして選択し、Ｐ１２は、Ｐ８及びＰ１６を参照ピクチャとして選択することができる。同様の方策が、レベル３及びレベル４のピクチャに適用され得る。一例では、参照ピクチャは、コーディング対象のカレントピクチャのレベルよりも低いレベルのコーディングされたピクチャから選択される。したがって、同じレベルのピクチャは並列にコーディングされ得、参照ピクチャと同じレベルの他のピクチャに依存することなく（必要であれば）破棄することができる。

【0196】

一実施形態では、コンテキスト初期化のための参照ピクチャを選択するときに、階層的時間コーディング構造の同じレベルにあるピクチャは、互いに参照ピクチャとして使用することができない。上記の制約を適用することにより、同じレベルのピクチャを互いに依存することなく並列に（例えば同時に）エンコーディング／デコーディングすることができる。例えば、Ｐ１及びＰ３は同じレベル（例えば、レベル４）にあるため、Ｐ３は、初期化のためにＰ１からのコンテキスト状態を使用することができない。

【0197】

図１５～図１６に記載の実施形態は、組み合わせることができる。例えば、カレントピクチャ（１５０２）が第１のレベル（例えば、レベル３）である場合、先行するピクチャ（１５０１）は、第１のレベルよりも低い第２のレベル（例えば、レベル０～２のうちの１つ）に制限され得る。

【0198】

一実施形態では、図１５～図１６に記載の実施形態の代わりに、又はこれに加えて、先行してコーディングされたコーディングセグメントの量子化情報（例えば、量子化パラメータＱＰ）をコンテキスト初期化に使用することができる。例えば、カレントコーディングセグメントのＱＰを先行してコーディングされたコーディングセグメントのＱＰと比較することができ、先行してコーディングされたコーディングセグメントのうちの１つがその比較に基づいて選択される。一例では、先行してコーディングされたコーディングセグメントのうちの１つは、最小ＱＰ差に関連付けられる。先行してコーディングされたコーディングセグメントのうちの１つのコンテキスト状態が、カレントコーディングセグメントの初期確率情報を判定するために使用される。

【0199】

一例では、カレントコーディングセグメントはカレントピクチャ（１５０２）である。どのピクチャが先行してコーディングされたピクチャから選択されるかは、カレントピクチャ内のコーディング対象の最初のブロックの場所又はコーディング対象の最初のサブブロックの場所に基づいて判定され得る（１５０２）。代替的には、カレントピクチャ（１５０２）のＱＰと、先行してコーディングされたピクチャのＱＰとに基づいて、先行してコーディングされたピクチャからどのピクチャが選択されるかが判定されてもよい。一実施形態では、先行してコーディングされたピクチャからどのピクチャが選択されるかは、図１６に記載のように、階層的時間構造におけるカレントピクチャのレベルと先行してコーディングされたピクチャのレベルに基づいて判定され得る。上記の実施形態が、組み合わされ得る。例えば、（レベル４の）Ｐ１は、（レベル３の）Ｐ２を参照ピクチャとして用いることができるが、これは、レベル３がレベル４よりも低く、Ｐ１とＰ２との間の絶対ＱＰ差｜ＱＰｄｉｆｆｅｒｅｎｃｅ｜が、Ｐ１とＰ６、Ｐ１０とＰ１４の絶対ＱＰ差のうち最小であるためである。

【0200】

各コンテキスト状態について、確率を説明するために有限精度を定義することができる。例えば、８ビット整数（又は８ビット状態）を使用して、０～２５５の範囲の確率状態を示すことができる。量子化は、ビット深度低減のように、コーディングされたピクチャ内の選択されたコンテキスト状態に適用され得る。したがって、記憶されたコンテキスト状態は、予測の目的のためにメモリ内のより少ない記憶空間を使用することができる。一例では、記憶されたコンテキスト状態は、より少ないビット（例えば、８ビットの代わりに４ビット）を使用してより低い精度で記憶することができ、したがって各コンテキストに対して元の８ビット情報の上位４ビットのみを保持する。予測に使用されるときに、下位４ビットはゼロで埋められ得る。図１５を参照すると、ＣＴＵ１の構文要素は８ビット精度でエントロピーコーディングされ得、８ビット精度を有するコンテキスト状態はＣＴＵ１のエントロピーコーディングに基づいて取得され得る。その後、８ビット精度を有するコンテキスト状態が４ビット精度で記憶され得る。４ビット精度のコンテキスト状態を使用して、カレントコーディングセグメント（例えば、カレントピクチャ（１５０２）におけるスライス）の初期確率を判定することができる。

【0201】

図１７は、本開示の一実施形態による、処理（例えば、エンコーディング処理）（１７００）を概説するフローチャートを示す。処理（１７００）は、処理回路機構を含むことができるビデオ／画像コーディングのための装置によって実行され得る。端末デバイス（３１０）、（３２０）、（３３０）及び（３４０）内の処理回路機構、ビデオエンコーダ（例えば（４０３）、（６０３）、（７０３））の機能を行う処理回路機構などの装置内の処理回路機構が、処理（１７００）を行うように構成され得る。いくつかの実施形態では、処理（１７００）はソフトウェア命令で実装され、したがって、処理回路機構がソフトウェア命令を行うときに、処理回路機構は、処理（１７００）を行う。処理は、（Ｓ１７０１）から開始し、（Ｓ１７１０）に進む。

【0202】

（Ｓ１７１０）において、先行するピクチャがエントロピーエンコーディングされ得る。先行するピクチャ内の複数の領域の各領域が、エントロピーエンコーディングされ得る。先行するピクチャ内の各領域をエントロピーエンコーディングすることに関連付けられた先行する確率情報が、判定され得る。

【0203】

（Ｓ１７２０）において、（ｉ）カレントピクチャ内の独立にエンコーディング可能なコーディングセグメントの場所若しくは量子化パラメータ、又は（ｉｉ）独立にエンコーディング可能なコーディングセグメントの構文情報に基づいて、先行するピクチャ内の複数の領域の中から領域が選択され得る。独立にエンコーディング可能なコーディングセグメントは、カレントピクチャ又はカレントピクチャ内の領域（例えば、スライス）であり得る。

【0204】

（Ｓ１７３０）において、独立にエンコーディング可能なコーディングセグメント内のブロックの１つ以上のカレント構文要素をエントロピーエンコーディングするための初期確率情報が、選択された領域をエントロピーエンコーディングすることに関連付けられ判定された先行する確率情報に基づいて判定され得る。１つ以上のカレント構文要素は、最初に、独立にエンコーディング可能なコーディングセグメント内の構文要素の中からエントロピーエンコーディングされる。

【0205】

ブロックは、独立にエンコーディング可能なコーディングセグメント内のブロックの中からエントロピーエンコーディングされる最初のブロックであり得る。

【0206】

（Ｓ１７４０）において、１つ以上のカレント構文要素に関連付けられたビンストリングは、初期確率情報及びビンストリングに対する確率推定モデルに基づいて、コーディングされたビットにエントロピーエンコーディングされ得る。

【0207】

複数の領域のうちどの領域が選択されるかを示す構文情報がエンコーディングされ、ビットストリームに含められ得る。

【0208】

一例では、構文情報は、複数の領域のうちどの領域が選択されるかを示すインデックスを含む。

【0209】

次いで、処理（１７００）は、（Ｓ１７９９）に進み、終了する。

【0210】

処理（１７００）は、様々なシナリオに好適に適応され得、処理（１７００）のステップは、それに応じて調整され得る。処理（１７００）のステップのうちの１つ以上が、適応され、省略され、繰り返され、及び／又は組み合わされ得る。任意の好適な順序を使用して、処理（１７００）を実装することができる。追加のステップが追加され得る。

【0211】

独立にエンコーディング可能なコーディングセグメントは、カレントピクチャ内のスライスであり得る。

【0212】

一実施形態では、独立にエンコーディング可能なコーディングセグメントは、カレントピクチャである。

【0213】

一例では、先行するピクチャ内の複数の領域は、先行するピクチャの４つのコーナーと中央にそれぞれ位置するコーディングツリーユニット（ＣＴＵ）を含む。カレントピクチャは、４つのコーナー領域と１つの中央領域と、を含む。ブロックがカレントピクチャの４つのコーナー領域のうちの１つに位置することに基づいて、先行するピクチャの４つのコーナーのうちの１つに位置するＣＴＵが選択され得る。ブロックがカレントピクチャの中央領域に位置することに基づいて、先行するピクチャの中央に位置するＣＴＵが選択され得る。領域は、先行するピクチャの４つのコーナーのうちの１つに位置するＣＴＵ、又は先行するピクチャの中央に位置するＣＴＵを含む。

【0214】

一例では、選択された領域をエントロピーエンコーディングするための確率推定モデルに基づいて、確率推定モデルにおける１つ以上のパラメータが取得され得る。確率推定モデルの例は、式（２）～式（５）に記載されている。

【0215】

一例では、１つ以上のパラメータは、式（２）～式（５）に記載のような、ビンストリングの複数の確率推定値に関連付けられた適応レート及び適応重みを含む。各確率推定値に関連付けられた適応レートの各々は、ビンストリングに対する２つの近接する確率間の量子化ステップサイズ（例えば、２つの近接する確率状態間の差Δｐ）を示す。

【0216】

一例では、先行するピクチャに関連付けられた階層的時間構造における第１のレベルが、カレントピクチャに関連付けられた階層的時間構造における第２のレベルよりも低くなるように、ビットストリーム内の複数のピクチャから先行するピクチャを選択する。第１のレベルの各ピクチャは、第２のレベルにおける１つ以上のピクチャの各々をデコーディングする前にデコーディングされている。

【0217】

一例では、判定された先行する確率情報を、先行するピクチャの各領域をエントロピーデコーディングするために使用される判定された先行する確率情報の第２の量子化精度（例えば、８ビット精度）よりも低い第１の量子化精度（例えば、４ビット精度）で記憶する。第１の量子化精度で記憶され判定された先行する確率情報に基づいて初期確率情報を判定することができる。

【0218】

【0219】

一例では、確率推定モデルは、コンテキスト適応モデルである。コーディングされたビットは、コンテキスト適応二値算術コーディング（ＣＡＢＡＣ）でエントロピーエンコーディングされ得る。

【0220】

図１８は、本開示の一実施形態による、処理（例えば、デコーディング処理）（１８００）を概説するフローチャートを示す。処理（１８００）は、ビデオ／画像デコーダで使用され得る。処理（１８００）は、受信回路機構及び処理回路機構を含むことができるビデオ／画像コーディングのための装置によって実行され得る。端末デバイス（３１０）、（３２０）、（３３０）及び（３４０）における処理回路機構、ビデオデコーダ（４１０）の機能を行う処理回路機構、ビデオデコーダ（５１０）の機能を処理回路機構などの装置における処理回路機構は、処理（１８００）を行うように構成され得る。いくつかの例では、処理（１８００）は、ビデオエンコーダ（例えば、ビデオエンコーダ（４０３）、ビデオエンコーダ（６０３））で使用される。一例では、処理（１８００）は、ビデオエンコーダ（例えば、ビデオエンコーダ（４０３）、ビデオエンコーダ（６０３））の機能を行う処理回路機構によって実行される。いくつかの実施形態では、処理（１８００）はソフトウェア命令で実装され、したがって、処理回路機構がソフトウェア命令を実行するときに、処理回路機構は処理（１８００）を行う。処理は、（Ｓ１８０１）から開始し、（Ｓ１８１０）に進む。

【0221】

（Ｓ１８１０）において、カレントピクチャと先行するピクチャとを含むビットストリームを受信する。先行するピクチャは、複数の領域を含むことができる。複数の領域の各領域は、エントロピーコーディングされ得る。

【0222】

（Ｓ１８２０）において、先行するピクチャ内の複数の領域の各エントロピーコーディングされた領域に関連付けられた先行する確率情報が判定される。

【0223】

（Ｓ１８３０）において、（ｉ）カレントピクチャ内の独立にデコーディング可能なコーディングセグメントの場所若しくは量子化パラメータ、又は（ｉｉ）独立にデコーディング可能なコーディングセグメントの構文情報に基づいて、先行するピクチャ内の複数の領域の中から領域が選択され得る。独立にデコーディング可能なコーディングセグメントは、カレントピクチャ又はカレントピクチャ内の領域（例えば、スライス）であり得る。

【0224】

独立にデコーディング可能なコーディングセグメントは、カレントピクチャ内のスライスであり得る。一例では、独立にデコーディング可能なコーディングセグメントは、カレントピクチャ内のイントラスライス（Ｉスライス）、双予測スライス（Ｂスライス）、及び予測スライス（Ｐスライス）のうちの１つである。

【0225】

一例では、独立にデコーディング可能なコーディングセグメントは、カレントピクチャである。複数の領域のうちどの領域が選択されるかを示す構文情報に基づいて、その領域が選択され得る。

【0226】

一例では、構文情報は、複数の領域のうちどの領域が選択されるかを示すインデックスを含む。

【0227】

【0228】

（Ｓ１８４０）において、独立にデコーディング可能なコーディングセグメント内のブロックの１つ以上のカレント構文要素をエントロピーデコーディングするための初期確率情報が、選択された領域をエントロピーデコーディングすることに関連付けられ判定された先行する確率情報に基づいて判定され得る。１つ以上のカレント構文要素は、最初に、独立にデコーディング可能なコーディングセグメント内の構文要素の中からエントロピーデコーディングされる。

【0229】

ブロックは、独立にデコーディング可能なコーディングセグメント内のブロックの中からエントロピーデコーディングされる最初のブロックであり得る。

【0230】

（Ｓ１８５０）において、１つ以上のカレント構文要素に関連付けられたコーディングされたビットが、初期確率情報及びコーディングされたビットの確率推定モデルに基づいて、１つ以上のカレント構文要素に関連付けられたビンストリングにエントロピーデコーディングされ得る。

【0231】

次いで、処理（１８００）は、（Ｓ１８９９）に進み、終了する。

【0232】

処理（１８００）は、様々なシナリオに好適に適応され得、処理（１８００）のステップは、それに応じて調整され得る。処理（１８００）のステップのうちの１つ以上が、適応され、省略され、繰り返され、及び／又は組み合わされ得る。任意の好適な順序を使用して、処理（１８００）を実装することができる。追加のステップが追加され得る。

【0233】

一例では、選択された領域をエントロピーデコーディングするための確率推定モデルに基づいて、確率推定モデルにおける１つ以上のパラメータが取得され得る。確率推定モデルの例は、式（２）～式（５）に記載されている。

【0234】

【0235】

【0236】

【0237】

【0238】

一例では、確率推定モデルは、コンテキスト適応モデルである。コーディングされたビットは、コンテキスト適応二値算術コーディング（ＣＡＢＡＣ）でエントロピーデコーディングされ得る。

【0239】

本開示の実施形態は、別々に、又は任意の順序で組み合わせて使用されてもよい。さらに、方法（又は実施形態）、エンコーダ、及びデコーダの各々は、処理回路機構（例えば、１つ以上のプロセッサ、又は１つ以上の集積回路）によって実装されてもよい。一例において、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に記憶されたプログラムを実行する。

【0240】

上述の技法は、コンピュータ可読命令を使用し、１つ以上のコンピュータ可読媒体に物理的に記憶されたコンピュータソフトウェアとして実装され得る。例えば、図１９は、開示された主題の特定の実施形態を実装するのに好適なコンピュータシステム（１９００）を示す。

【0241】

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、又は類似のメカニズムの対象となり得る任意の好適な機械コード又はコンピュータ言語を使用してコード化され得、１つ以上のコンピュータ中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）などによって、直接的に、又は解釈、マイクロコード実行などを通して実行され得る命令を含むコードを作成する。

【0242】

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットのデバイスなどを含む様々なタイプのコンピュータ又はそのコンポーネント上で実行され得る。

【0243】

コンピュータシステム（１９００）のための図１９に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に関していかなる制限も示唆することを意図していない。コンポーネントの構成は、コンピュータシステム（１９００）の例示的な実施形態に示されているコンポーネントの任意の１つ又は組み合わせに関連するいかなる従属性又は要件も有していると解釈されてはならない。

【0244】

コンピュータシステム（１９００）は、特定のヒューマンインターフェース入力デバイスを含んでもよい。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（例えば、キーストローク、スワイプ、データグローブの動き）、オーディオ入力（例えば、音声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（描写せず）を通して、１人以上の人間ユーザによる入力に応答してもよい。また、ヒューマンインターフェースデバイスは、オーディオ（例えば、発話、音楽、周囲音）、画像（例えば、スキャン画像、静止画像カメラから取得される写真画像）、ビデオ（例えば、２次元ビデオ、立体画像を含む３次元ビデオ）などの人間による意識的入力に必ずしも直接関連しない特定の媒体をキャプチャするために使用され得る。

【0245】

入力ヒューマンインターフェースデバイスは、キーボード（１９０１）、マウス（１９０２）、トラックパッド（１９０３）、タッチスクリーン（１９１０）、データグローブ（図示せず）、ジョイスティック（１９０５）、マイクロホン（１９０６）、スキャナ（１９０７）、カメラ（１９０８）のうちの１つ以上（各々１つのみが描写されている）を含んでもよい。

【0246】

コンピュータシステム（１９００）はまた、特定のヒューマンインターフェース出力デバイスを含んでもよい。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、及び嗅覚／味覚を通して、１人以上の人間ユーザの感覚を刺激していてもよい。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１９１０）、データグローブ（図示せず）、又はジョイスティック（１９０５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスであり得る）、オーディオ出力デバイス（例えば、スピーカー（１９０９）、ヘッドフォン（描写せず））、視覚出力デバイス（例えば、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むタッチスクリーン（１９１０）であって、各々、触覚スクリーン入力能力を有するか、又は有さず、これらのうちのいくつかは、二次元の視覚出力又は立体出力のような手段を通してそれ以上の三次元の出力を出力することが可能であり得るもの、仮想現実グラス（描写せず）、ホログラフィックディスプレイ、スモークタンク（描写せず））、及びプリンタ（描写せず）を含んでもよい。

【0247】

コンピュータシステム（１９００）はまた、ＣＤ／ＤＶＤ又は同様の媒体（１９２１）を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（１９２０）を含む光媒体、サムドライブ（１９２２）、取り外し可能なハードドライブ又はソリッドステートドライブ（１９２３）、テープ及びフロッピーディスク（描写せず）などのレガシー磁気媒体、セキュリティドングル（描写せず）のような特殊なＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイスなど、人間がアクセス可能な記憶デバイス、及びそれらの関連媒体を含むことができる。

【0248】

当業者はまた、本開示の主題に関連して使用される用語「コンピュータ可読媒体」は、伝送媒体、搬送波、又は他の一時的な信号を包含しないと理解すべきである。

【0249】

コンピュータシステム（１９００）はまた、１つ以上の通信ネットワーク（１９５５）へのインターフェース（１９５４）を含むことができる。ネットワークは、例えば、無線、有線、光のものとすることができる。ネットワークは、さらに、ローカル、広域、大都市、車両及び産業、リアルタイム、遅延耐性などのものとすることができる。ネットワークの例は、Ｅｔｈｅｒｎｅｔ（登録商標）、無線ＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラネットワーク、ケーブルＴＶ、衛星ＴＶ、及び地上放送ＴＶを含むＴＶ有線及び無線広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両及び産業などを含む。特定のネットワークは、通常、特定の汎用データポート又は周辺バス（１９４９）（例えば、コンピュータシステム（１９００）のＵＳＢポート）に取り付けられる外部のネットワークインターフェースアダプタを必要とし、他のものは、通常、後述するシステムバス（例えば、ＰＣコンピュータシステムへのＥｔｈｅｒｎｅｔインターフェース又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）への取り付けによって、コンピュータシステム（１９００）のコアに組み込まれる。これらのネットワークのいずれかを使用して、コンピュータシステム（１９００）は、他のエンティティと通信することができる。このような通信は、一方向性の受信のみ（例えば、放送テレビ）、一方向性の送信のみのもの（例えば、ＣＡＮｂｕｓから特定のＣＡＮｂｕｓまで）、又は、例えば、ローカル又は広域デジタルネットワークを使用する他のコンピュータシステムへの双方向性のものとすることができる。特定のプロトコル及びプロトコルスタックは、上述したように、それらのネットワーク及びネットワークインターフェースの各々で使用され得る。

【0250】

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、及びネットワークインターフェースは、コンピュータシステム（１９００）のコア（１９４０）に取り付けられ得る。

【0251】

コア（１９４０）は、１つ以上のＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）（１９４１）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）（１９４２）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｅａ）（１９４３）の形態の特殊化されたプログラム可能な処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１９４４）、グラフィックアダプタ（１９５０）などを含むことができる。これらのデバイスは、ＲＯＭ（Ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）（１９４５）、ランダムアクセスメモリ（１９４６）、ユーザがアクセス不可能な内部ハードドライブなどの内部マスストレージ（１９４７）、ＳＳＤなどと一緒に、システムバス（１９４８）を通して接続されてもよい。いくつかのコンピュータシステムでは、システムバス（１９４８）は、追加的なＣＰＵ、ＧＰＵなどによる拡張を可能にするために、１つ以上の物理プラグの形態でアクセス可能とすることができる。周辺デバイスは、コアのシステムバス（１９４８）に直接取り付けられるか、周辺バス（１９４９）通して取り付けられるかのいずれかとすることができる。一例では、タッチスクリーン（１９１０）は、グラフィックアダプタ（１９５０）に接続され得る。周辺バスのためのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

【0252】

ＣＰＵ（１９４１）、ＧＰＵ（１９４２）、ＦＰＧＡ（１９４３）、及びアクセラレータ（１９４４）は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。コンピュータコードは、ＲＯＭ（１９４５）又はＲＡＭ（１９４６）に記憶され得る。一時的なデータはまた、ＲＡＭ（１９４６）に記憶され得るが、永続性データは、例えば、内部マスストレージ（１９４７）に記憶され得る。１つ以上のＣＰＵ（１９４１）、ＧＰＵ（１９４２）、マスストレージ（１９４７）、ＲＯＭ（１９４５）、ＲＡＭ（１９４６）などと密接に関連付けられ得るキャッシュメモリの使用を通して、メモリデバイスのいずれかへの高速ストレージ及び取り出しが、可能にされ得る。

【0253】

コンピュータ可読媒体は、様々なコンピュータ実装された動作を行うためのコンピュータコードをその上に有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構築することができるか、又はそれらは、コンピュータソフトウェア分野の当業者に周知かつ入手可能な種類のものとすることができる。

【0254】

一例として、限定するものではなく、アーキテクチャ、具体的にはコア（１９４０）を有するコンピュータシステム（１９００）は、１つ以上の有形のコンピュータ可読媒体に具現化されたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果として機能を提供することができる。このようなコンピュータ可読媒体は、コア内部マスストレージ（１９４７）、ＲＯＭ（１９４５）などの非一時的な性質のコア（１９４０）の特定のストレージと同様に、上記に紹介したユーザがアクセス可能なマスストレージに関連付けられた媒体とすることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア（１９４０）によって実行され得る。コンピュータ可読媒体は、特定のニーズに応じて、１つ以上のメモリデバイス又はチップを含むことができる。ソフトウェアは、コア（１９４０）、具体的には内部のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（１９４６）に記憶されたデータ構造を定義することと、ソフトウェアによって定義された処理に従ってこのようなデータ構造を修正することとを含む、本明細書に記載の特定の処理又は特定の処理の特定の部分を実行させることができる。追加的又は代替的には、コンピュータシステムは、回路（例えば、アクセラレータ（１９４４））内に配線されたか、又は他の方法で具現化された論理の結果として、機能を提供することができ、この回路は、本明細書に記載の特定の処理又は特定の処理の特定の部分を実行するために、ソフトウェアの代わりに、又はソフトウェアと共に動作することができる。ソフトウェアへの言及は、論理を包含することができ、適切な場合には、その逆もできる。コンピュータ可読媒体への言及は、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のための論理を具体化する回路、又は適切な場合にはその両方を包含することができる。本開示は、ハードウェア及びソフトウェアの任意の好適な組み合わせを包含する。
付録Ａ：頭字語
ＪＥＭ：ジョイント探索モデル（ｊｏｉｎｔｅｘｐｌｏｒａｔｉｏｎｍｏｄｅｌ）
ＶＶＣ：汎用ビデオコーディング（ｖｅｒｓａｔｉｌｅｖｉｄｅｏｃｏｄｉｎｇ）
ＢＭＳ：ベンチマークセット（ｂｅｎｃｈｍａｒｋｓｅｔ）
ＭＶ：動きベクトル（ＭｏｔｉｏｎＶｅｃｔｏｒ）
ＨＥＶＣ：高効率ビデオコーディング（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）
ＳＥＩ：補助強化情報（ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）
ＶＵＩ：ビデオユーザビリティ情報（ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ）
ＧＯＰ：ピクチャグループ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅｓ）
ＴＵ：変換ユニット（ＴｒａｎｓｆｏｒｍＵｎｉｔ）
ＰＵ：予測ユニット（ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）
ＣＴＵ：コーディングツリーユニット（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）
ＣＴＢ：コーディングツリーブロック（ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ）
ＰＢ：予測ブロック（ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ）
ＨＲＤ：仮想参照デコーダ（ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ）
ＳＮＲ信号雑音比（ＳｉｇｎａｌＮｏｉｓｅＲａｔｉｏ）
ＣＰＵ：中央処理ユニット（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）
ＧＰＵ：グラフィック処理ユニット（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）
ＣＲＴ：陰極線管（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）
ＬＣＤ：液晶ディスプレイ（Ｌｉｑｕｉｄ－ＣｒｙｓｔａｌＤｉｓｐｌａｙ）
ＯＬＥＤ：有機発光ダイオード（ＯｒｇａｎｉｃＬｉｇｈｔ－ＥｍｉｔｔｉｎｇＤｉｏｄｅ）
ＣＤ：コンパクトディスク（ＣｏｍｐａｃｔＤｉｓｃ）
ＤＶＤ：デジタルビデオディスク（ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ）
ＲＯＭ：読み出し専用メモリ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）
ＲＡＭ：ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）
ＡＳＩＣ：特定用途向け集積回路（Ａｐｐｌｉｃａｔｉｏｎ－ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）
ＰＬＤ：プログラマブル論理デバイス（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）
ＬＡＮ：ローカルエリアネットワーク（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）
ＧＳＭ：グローバルシステムフォーモバイルコミュニケーションズ（ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ）
ＬＴＥ：ロングタームエボリューション（Ｌｏｎｇ－ＴｅｒｍＥｖｏｌｕｔｉｏｎ）
ＣＡＮＢｕｓ：コントローラエリアネットワークバス（ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋＢｕｓ）
ＵＳＢ：ユニバーサルシリアルバス（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）
ＰＣＩ：ペリフェラルコンポーネントインターコネクト（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ）
ＦＰＧＡ：フィールドプログラマブルゲートエリア（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｅａｓ）
ＳＳＤ：ソリッドステートドライブ（ｓｏｌｉｄ－ｓｔａｔｅｄｒｉｖｅ）
ＩＣ：集積回路（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）
ＣＵ：コーディングユニット（ＣｏｄｉｎｇＵｎｉｔ）
ＣＣＬＭ：結合クロスコンポーネント線形モデル（ｃｏｍｂｉｎｅｃｒｏｓｓ－ｃｏｍｐｏｎｅｎｔｌｉｎｅａｒｍｏｄｅｌ）

【0255】

本開示は、いくつかの例示的な実施形態を記載してきたが、本開示の範囲内にある変更、置換、及び様々な代替等価物がある。したがって、当業者は、本明細書に明示的に示されていないか、又は記載されていないが、本開示の原理を具体化し、本開示の精神及び範囲内にある多くのシステム及び方法を考案することができると理解されるであろう。

【図1A】