特表2022-524056 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ クゥアルコム・インコーポレイテッドの特許一覧

特表2022-524056ビデオコーディングのための確率初期化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4A
4B
5
6
7
8
9
10A
10B
11A
11B
12
13A
13B
14A
14B
14C
15A
15B
15C
15D
16A
16B
16C
17A
17B
18A
18B
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-04-27

(54)【発明の名称】ビデオコーディングのための確率初期化

(51)【国際特許分類】

H04N 19/91 20140101AFI20220420BHJP

H04N 19/70 20140101ALI20220420BHJP

【ＦＩ】

H04N19/91

H04N19/70

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021552918

(86)(22)【出願日】2020-03-12

(85)【翻訳文提出日】2021-09-30

(86)【国際出願番号】 US2020022355

(87)【国際公開番号】W WO2020186038

(87)【国際公開日】2020-09-17

(31)【優先権主張番号】62/817,475

(32)【優先日】2019-03-12

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/834,297

(32)【優先日】2019-04-15

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/871,519

(32)【優先日】2019-07-08

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】16/816,016

(32)【優先日】2020-03-11

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】595020643

【氏名又は名称】クゥアルコム・インコーポレイテッド

【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭＩＮＣＯＲＰＯＲＡＴＥＤ

(74)【代理人】

【識別番号】100108855

【弁理士】

【氏名又は名称】蔵田昌俊

(74)【代理人】

【識別番号】100158805

【弁理士】

【氏名又は名称】井関守三

(74)【代理人】

【識別番号】100112807

【弁理士】

【氏名又は名称】岡田貴志

(72)【発明者】

【氏名】ドン、ジエ

(72)【発明者】

【氏名】サイド、アミール

(72)【発明者】

【氏名】セレジン、バディム

(72)【発明者】

【氏名】カルチェビチ、マルタ

【テーマコード（参考）】

5C159

【Ｆターム（参考）】

5C159MC11

5C159ME11

5C159RC11

5C159UA02

5C159UA05

(57)【要約】

ビデオデータのエントロピー復号のための例示的な方法は、ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちの１つのコンテキストのためのあらかじめ定義された初期化値を取り出すことと、あらかじめ定義された初期化値に基づいて、線形領域中で、コンテキストの初期確率状態を決定することと、ビットストリームから、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピー復号することとを含む。

【特許請求の範囲】

【請求項1】

ビデオデータのエントロピー復号のための方法であって、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を、メモリから取り出すことと、
前記あらかじめ定義された初期化値に基づいて、線形領域中で、前記コンテキストの初期確率状態を決定することと、
ビデオビットストリームから、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー復号することと
を備える方法。

【請求項2】

前記線形領域中での前記コンテキストの前記初期確率状態を決定することが、前記対数領域中での前記コンテキストの前記初期確率状態を中間で決定することなしに前記線形領域中での前記コンテキストの前記初期確率状態を決定することを備える、請求項１に記載の方法。

【請求項3】

前記初期確率状態を決定することは、
前記独立してコード化可能なユニットに関連する量子化パラメータの初期値を取得することと、
０でない量子化パラメータアンカーポイントの値を取得することと、
前記独立してコード化可能なユニットに関連する前記量子化パラメータの前記初期値と前記量子化パラメータアンカーポイントの前記値との間の差に基づいて前記初期確率状態を決定することと
を備える、請求項１に記載の方法。

【請求項4】

前記量子化パラメータの前記初期値がＳｌｉｃｅＱＰ_Yである、請求項３に記載の方法。

【請求項5】

前記量子化パラメータアンカーポイントの前記値が１６である、請求項３に記載の方法。

【請求項6】

前記初期確率状態を決定することが、
前記あらかじめ定義された初期化値に基づいて、スロープインデックス値とオフセットインデックス値とを決定することと、
前記スロープインデックス値に基づいて、ｍの値を決定することと、
前記オフセットインデックス値に基づいて、式ｎ＝（ＯｆｆｓｅｔＩｄｘ＊１８）＋１に従ってｎの値を決定することと、ここで、ＯｆｆｓｅｔＩｄｘは、前記オフセットインデックス値である、
を備え、
前記初期確率状態を決定することは、ｍの前記値とｎの前記値とに基づいて前記初期確率状態を決定することを備える、請求項３に記載の方法。

【請求項7】

前記初期確率状態を決定することは、以下の式に従って前記初期確率状態を決定することを備える、

【数1】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、前記初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、前記量子化パラメータの前記初期値であり、ＱＰ_anchorは、前記量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値である、請求項６に記載の方法。

【請求項8】

エントロピー復号することは、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）を使用してエントロピー復号することを備える、請求項１に記載の方法。

【請求項9】

ビデオ復号デバイスであって、
ビデオデータを記憶するメモリと、
回路中に実装された１つまたは複数のプロセッサと
を備え、前記１つまたは複数のプロセッサは、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を、前記メモリから取り出すことと、
前記あらかじめ定義された初期化値に基づいて、線形領域中で、前記コンテキストの初期確率状態を決定することと、
ビデオビットストリームから、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー復号することと
を行うように構成された、ビデオ復号デバイス。

【請求項10】

前記線形領域中での前記コンテキストの前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、前記対数領域中での前記コンテキストの前記初期確率状態を中間で決定することなしに前記線形領域中での前記コンテキストの前記初期確率状態を決定するように構成された、請求項９に記載のデバイス。

【請求項11】

前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、
前記独立してコード化可能なユニットに関連する量子化パラメータの初期値を取得することと、
０でない量子化パラメータアンカーポイントの値を取得することと、
前記独立してコード化可能なユニットに関連する前記量子化パラメータの前記初期値と前記量子化パラメータアンカーポイントの前記値との間の差に基づいて前記初期確率状態を決定することと
を行うように構成された、請求項９に記載のデバイス。

【請求項12】

前記量子化パラメータの前記初期値がＳｌｉｃｅＱＰ_Yである、請求項１１に記載のデバイス。

【請求項13】

前記量子化パラメータアンカーポイントの前記値が１６である、請求項１１に記載のデバイス。

【請求項14】

前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、
前記あらかじめ定義された初期化値に基づいて、スロープインデックス値とオフセットインデックス値とを決定することと、
前記スロープインデックス値に基づいて、ｍの値を決定することと、
前記オフセットインデックス値に基づいて、式ｎ＝（ＯｆｆｓｅｔＩｄｘ＊１８）＋１に従ってｎの値を決定することと、ここで、ＯｆｆｓｅｔＩｄｘは、前記オフセットインデックス値である、
ｍの前記値とｎの前記値とに基づいて前記初期確率状態を決定することと
を行うように構成された、請求項１１に記載のデバイス。

【請求項15】

前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、以下の式に従って前記初期確率状態を決定するように構成され、

【数2】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、前記初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、前記量子化パラメータの前記初期値であり、ＱＰ_anchorは、前記量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値である、請求項１４に記載のデバイス。

【請求項16】

前記ビンをエントロピー復号するために、前記１つまたは複数のプロセッサは、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）を使用して前記ビンを復号するように構成された、請求項９に記載のデバイス。

【請求項17】

ビデオデータのエントロピー符号化のための方法であって、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を、メモリから取り出すことと、
前記あらかじめ定義された初期化値に基づいて、線形領域中で、前記コンテキストの初期確率状態を決定することと、
ビデオビットストリーム中で、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー符号化することと
を備える方法。

【請求項18】

前記線形領域中での前記コンテキストの前記初期確率状態を決定することが、前記対数領域中での前記コンテキストの前記初期確率状態を中間で決定することなしに前記線形領域中での前記コンテキストの前記初期確率状態を決定することを備える、請求項１７に記載の方法。

【請求項19】

前記初期確率状態を決定することは、
前記独立してコード化可能なユニットに関連する量子化パラメータの初期値を取得することと、
０でない量子化パラメータアンカーポイントの値を取得することと、
前記独立してコード化可能なユニットに関連する前記量子化パラメータの前記初期値と、前記量子化パラメータアンカーポイントの前記値との間の差に基づいて前記初期確率状態を決定することと
を備える、請求項１７に記載の方法。

【請求項20】

前記量子化パラメータの前記初期値がＳｌｉｃｅＱＰ_Yである、請求項１９に記載の方法。

【請求項21】

前記量子化パラメータアンカーポイントの前記値が１６である、請求項１９に記載の方法。

【請求項22】

前記初期確率状態を決定することは、
前記あらかじめ定義された初期化値に基づいて、スロープインデックス値とオフセットインデックス値とを決定することと、
前記スロープインデックス値に基づいて、ｍの値を決定することと、
前記オフセットインデックス値に基づいて、式ｎ＝（ＯｆｆｓｅｔＩｄｘ＊１８）＋１に従ってｎの値を決定することと、ここで、ＯｆｆｓｅｔＩｄｘは、前記オフセットインデックス値である、
を備え、
前記初期確率状態を決定することは、ｍの前記値とｎの前記値とに基づいて前記初期確率状態を決定することを備える、請求項１９に記載の方法。

【請求項23】

前記初期確率状態を決定することは、以下の式に従って前記初期確率状態を決定することを備える、

【数3】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、前記初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、前記量子化パラメータの前記初期値であり、ＱＰ_anchorは、前記量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値である、請求項２２に記載の方法。

【請求項24】

ビデオ符号化デバイスであって、
ビデオデータを記憶するメモリと、
回路中に実装された１つまたは複数のプロセッサと
を備え、前記１つまたは複数のプロセッサは、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を、前記メモリから取り出すことと、
前記あらかじめ定義された初期化値に基づいて、線形領域中で、前記コンテキストの初期確率状態を決定することと、
ビデオビットストリーム中で、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー符号化することと
を行うように構成された、ビデオ符号化デバイス。

【請求項25】

前記線形領域中での前記コンテキストの前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、前記対数領域中での前記コンテキストの前記初期確率状態を中間で決定することなしに前記線形領域中での前記コンテキストの前記初期確率状態を決定するように構成された、請求項２４に記載のデバイス。

【請求項26】

前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、
前記独立してコード化可能なユニットに関連する量子化パラメータの初期値を取得することと、
０でない量子化パラメータアンカーポイントの値を取得することと、
前記独立してコード化可能なユニットに関連する前記量子化パラメータの前記初期値と、前記量子化パラメータアンカーポイントの前記値との間の差に基づいて前記初期確率状態を決定することと
を行うように構成された、請求項２４に記載のデバイス。

【請求項27】

前記量子化パラメータの前記初期値がＳｌｉｃｅＱＰ_Yである、請求項２６に記載のデバイス。

【請求項28】

前記量子化パラメータアンカーポイントの前記値が１６である、請求項２６に記載のデバイス。

【請求項29】

【請求項30】

前記初期確率状態を決定するために、前記１つまたは複数のプロセッサは、以下の式に従って前記初期確率状態を決定するように構成され、

【数4】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、前記初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、前記量子化パラメータの前記初期値であり、ＱＰ_anchorは、前記量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値である、請求項２９に記載のデバイス。

【請求項31】

デバイスであって、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得するための手段と、
前記あらかじめ定義された初期化値に基づいて線形領域中で、前記コンテキストの初期確率状態を決定するための手段と、
ビットストリームから、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー復号するための手段と
を備える、デバイス。

【請求項32】

実行されたとき、ビデオコーダの１つまたは複数のプロセッサに、
ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得することと、
前記あらかじめ定義された初期化値に基づいて、線形領域中で、前記コンテキストの初期確率状態を決定することと、
ビットストリーム中で、前記コンテキストの前記初期確率状態に基づいて、前記シンタックス要素のための前記値のビンをエントロピー符号化することと
を行わせる命令を記憶したコンピュータ可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

[0001] 本出願は、その各々の内容全体が参照により本明細書に組み込まれる、２０１９年３月１２日に出願された米国仮出願番号第６２／８１７，４７５号、２０１９年４月１５日に出願された米国仮出願番号第６２／８３４，２９７号、および２０１９年７月８日に出願された米国仮出願番号第６２／８７１，５１９号の利益を主張する２０２０年３月１１日に出願された米国特許出願番号第１６／８１６，０１６号の優先権を主張する。

【0002】

[0002] 本開示は、ビデオ符号化（video encoding）およびビデオ復号（video decoding）に関する。

【背景技術】

【0003】

[0003] デジタルビデオ能力は、デジタルテレビ、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタルレコーディングデバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、ビデオゲーム機、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、幅広いデバイスの中に組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ－２、ＭＰＥＧ－４、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）、ＩＴＵ－ＴＨ．２６５／高効率ビデオコーディング（ＨＥＶＣ）によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

【0004】

[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間（イントラピクチャ）予測および／または時間（インターピクチャ）予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス（たとえば、ビデオピクチャまたはビデオピクチャの一部分）が、コーディングツリーユニット（ＣＴＵ：coding tree unit）、コーディングユニット（ＣＵ：coding unit）および/またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャ中の参照サンプルに対する時間予測を使用し得る。ピクチャは、フレームと呼ばれることがあり、参照ピクチャは、参照フレームと呼ばれることがある。

【発明の概要】

【0005】

[0005] 概して、本開示では、ビデオ圧縮（video compression）のための算術コーディングのための確率初期化（probability initialization）のための技法について説明する。たとえば、ビデオコーダ（video coder）は、バイナリ算術コーダ（binary arithmetic coder）において使用される各コンテキストモデルの初期確率状態（initial probability state）を設定し得る。プロセスは、スライスまたはタイルなどの独立して復号可能なユニットをエントロピー符号化または復号する始めに呼び出され得る。

【0006】

[0006] 一例として、ビデオデータ（video data）のエントロピーコーディング（entropy coding）のための方法は、ビデオデータの独立してコード化可能なユニット（independently codable unit）のためのシンタックス要素（syntax element）のための値（value）をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセス（context-adaptive entropy coding process）において使用される複数のコンテキスト（context）のうちのコンテキストのためのあらかじめ定義された初期化値（pre-defined initialization value）を取得することと、あらかじめ定義された初期化値に基づいて線形領域（linear domain）中で、コンテキストの初期確率状態を決定する（determine）ことと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビン（bin）をエントロピーコーディングする（entropy code）こととを含む。

【0007】

[0007] 別の例として、デバイス（device）は、ビデオデータを記憶するメモリ（memory）と回路（circuitry）中に実装された１つまたは複数のプロセッサ（processor）とを含み、１つまたは複数のプロセッサは、ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得することと、あらかじめ定義された初期化値に基づいて線形領域中で、コンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングすることとを行うように構成される。

【0008】

[0008] 別の例として、デバイスは、ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得するための手段と、あらかじめ定義された初期化値に基づいて線形領域中で、コンテキストの初期確率状態を決定するための手段と、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングするための手段とを含む。

【0009】

[0009] 別の例として、コンピュータ可読記憶媒体（computer-readable storage medium）は、実行されたとき、ビデオコーダの１つまたは複数のプロセッサに、ビデオデータの独立してコード化可能なユニットのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得することと、あらかじめ定義された初期化値に基づいて線形領域中で、コンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングすることとを行わせる命令（instruction）を記憶する。

【0010】

[0010] 本開示の１つまたは複数の態様の詳細について、添付の図面および以下の説明に記載する。本開示で説明される技法の他の特徴、目的、および利点は、これらの説明および図面から、ならびに特許請求の範囲から明らかになろう。

【図面の簡単な説明】

【0011】

【図1】[0011] 本開示の技法を実行し得る例示的なビデオ符号化および復号システムを示すブロック図。

【図2A】[0012] バイナリ算術コーディング（binary arithmetic coding）における範囲更新プロセス（range update process）を示す概念図。

【図2B】バイナリ算術コーディングにおける範囲更新プロセスを示す概念図。

【図3】[0013] バイナリ算術コーディングにおける出力プロセスを示す概念図。

【図4A】[0014] 例示的な４分木２分木（ＱＴＢＴ）構造を示す概念図。

【図4B】対応するコーディングツリーユニット（ＣＴＵ）を示す概念図。

【図5】[0015] 本開示の技法を実行し得る例示的なビデオエンコーダ（video encoder）を示すブロック図。

【図6】[0016] ビデオエンコーダ中のコンテキスト適応型バイナリ算術コーダ（context adaptive binary arithmetic coder）を示すブロック図。

【図7】[0017] 本開示の技法を実行し得る例示的なビデオデコーダ（video decoder）を示すブロック図。

【図8】[0018] ビデオデコーダ中のコンテキスト適応型バイナリ算術コーダを示すブロック図。

【図9】[0019] ＨＥＶＣなどで１である確率を表すための確率状態（probability state）を示すグラフ。

【図10A】[0020] １０２４の確率状態（１０ビットの精度）を有する、ＶＶＣの場合のように１である確率を表すための確率状態を示すグラフ。

【図10B】１６３８４の確率状態（１４ビットの精度）を有する、ＶＶＣの場合のように１である確率を表すための確率状態を示すグラフ。

【図11A】[0021] １０２４の確率状態（１０ビットの精度）を有する、ＩｎｉｔＰｒｏｂＳｔａｔｅから汎用ビデオコーディング（ＶＶＣ：Versatile Video Coding）の算術コーディングエンジンにおいて使用され得る確率状態へのマッピングを示すグラフ。

【図11B】１６３８４の確率状態（１４ビットの精度）を有する、ＩｎｉｔＰｒｏｂＳｔａｔｅから汎用ビデオコーディング（ＶＶＣ）の算術コーディングエンジンにおいて使用され得る確率状態へのマッピングを示すグラフ。

【図12】[0022] Ｉスライスにおいて使用されるシンタックス要素ＳａｏＭｅｒｇｅＦｌａｇ（１ビン）の確率分布の事前知識（prior knowledge）を示すグラフ。

【図13A】[0023] 対数領域（logarithmic domain）中での確率状態によって表される図１２におおける確率分布の事前知識を示すグラフ。

【図13B】線形関数を用いてモデル確率状態とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図14A】[0024] 線形領域中での確率状態によって表される図１２における確率分布の事前知識を示すグラフ。

【図14B】ＨＥＶＣおよび現在のＶＶＣにおいて定義されている勾配（slope）とオフセット（offset）との範囲を増加させることなしに線形関数を用いてモデル確率状態とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図14C】勾配とオフセットとの増加した範囲をもつ線形関数を用いてモデル確率状態とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図15A】[0025] Ｂスライスにおいて使用されるシンタックス要素ＳｐｌｉｔＦｌａｇの確率分布の事前知識を示すグラフ。

【図15B】線形関数を用いてモデル対数確率状態（model logarithmic probability state）とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図15C】ＨＥＶＣおよび現在のＶＶＣにおいて定義されている勾配とオフセットとを使用する線形関数を用いてモデル線形確率状態（model linear probability state）とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図15D】３２に等しいＳｌｉｃｅＱＰ_Yにおいて定義されている交点（intersection）をもつ線形関数を用いてモデル線形確率状態とＳｌｉｃｅＱＰ_Yとを示すグラフ。

【図16A】[0026] 確率分布を適合させるために複数の交点によって決定される区分的線形関数（piecewise linear function）の使用を示すグラフ。

【図16B】確率分布を適合させるために複数の交点によって決定される区分的線形関数の使用を示すグラフ。

【図16C】確率分布を適合させるために複数の交点によって決定される区分的線形関数の使用を示すグラフ。

【図17A】[0027] １０２４の確率状態（１０ビットの精度）を有する、ＶＶＣの算術コーディングエンジンにおいて使用され得る確率状態に２次領域（quadratic domain）ＩｎｉｔＰｒｏｂＳｔａｔｅをマッピングする例を示すグラフ。

【図17B】１６３８４の確率状態（１４ビットの精度）を有する、ＶＶＣの算術コーディングエンジンにおいて使用され得る確率状態に２次領域ＩｎｉｔＰｒｏｂＳｔａｔｅをマッピングする例を示すグラフ。

【図18A】[0028] 極値確率分布（extreme probability distribution）の例を示すグラフ。

【図18B】極値確率分布の例を示すグラフ。

【図19】[0029] 現在のブロックを符号化するための例示的な方法を示すフローチャート。

【図20】[0030] 本開示の１つまたは複数の技法による、コンテキストベースのエントロピー符号化（entropy encoding）を実行するための例示的なプロセスを示すフローチャート。

【図21】[0031] 現在のブロックを復号するための例示的な方法を示すフローチャート。

【図22】[0032] 本開示の１つまたは複数の技法による、コンテキストベースのエントロピー復号（entropy decoding）を実行するための例示的なプロセスを示すフローチャート。

【発明を実施するための形態】

【0012】

[0033] 概して、本開示は、ビデオ圧縮のための算術コーディングのための確率初期化のための技法について説明する。たとえば、ビデオコーダは、バイナリ算術コーダにおいて使用される各コンテキストモデルの初期確率状態を設定し得る。プロセスは、スライスなどの独立して復号可能なユニットをエントロピー符号化または復号する始めに呼び出され得る。

【0013】

[0034] 初期化を実行するために、ビデオコーダは、ビデオデータのスライスのためのシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちの１つのコンテキストのためのあらかじめ定義された初期化値（たとえば、ｉｎｉｔＶａｌｕｅ）を取得し得る。ビデオコーダは、あらかじめ定義された初期化値に基づいて対数領域中で、コンテキストの初期確率状態（たとえば、ｐＳｔａｔｅＩｄｘ）を決定し得る。ビデオコーダは、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングし得る。

【0014】

[0035] いくつかのビデオ規格に従ってビデオデータをコーディングするとき、ビデオコーダは、線形領域中での確率状態を維持し得る。たとえば、以下でさらに詳細に説明するように、汎用ビデオコーディング（ＶＶＣ）において採用されるコンテキスト適応型バイナリ算術コーダ（ＣＡＢＡＣ：Context Adaptive Binary Arithmetic Coder）は、線形領域中でのコンテキストの確率状態を維持し得る。初期確率状態が対数領域中で決定される場合、ビデオコーダは、線形領域中での決定された初期確率状態を変換するために様々な動作を実行し得る。たとえば、ビデオコーダは、対数領域から線形領域に初期確率状態を変換するためにルックアップテーブル（ＬＵＴ：look-up table）を使用し得る。

【0015】

[0036] 本開示の１つまたは複数の技法によれば、ビデオコーダは、線形領域中での初期確率状態を直接決定し得る。たとえば、ビデオは、あらかじめ定義された初期化値に基づいて、対数領域から線形領域に初期確率状態を変換するためにＬＵＴを使用せずに線形領域中でのコンテキストの初期確率状態（たとえば、ｐＳｔａｔｅＩｄｘ）を決定し得る。このようにして、ビデオコーダは、線形領域中での初期確率状態と対数領域中での初期確率状態との間で変換するＬＵＴを記憶することおよび／またはそれにアクセスすることを行う必要を回避し得る。

【0016】

[0037] 図１は、本開示の技法を実行し得る例示的なビデオ符号化および復号システム１００を示すブロック図である。本開示の技法は、概して、ビデオデータをコーディング（符号化および／または復号）することを対象とする。概して、ビデオデータは、ビデオを処理するための何らかのデータを含む。したがって、ビデオデータは、シグナリングデータなどの未加工の、コーディングされていないビデオと、符号化されたビデオと、復号された（たとえば、再構築された）ビデオと、ビデオメタデータとを含み得る。

【0017】

[0038] 図１に示されているように、システム１００は、この例では、宛先デバイス１１６によって復号および表示されるべき符号化ビデオデータを与えるソースデバイス１０２を含む。具体的には、ソースデバイス１０２は、コンピュータ可読媒体１１０を介してビデオデータを宛先デバイス１１６に提供する。ソースデバイス１０２と宛先デバイス１１６とは、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲のデバイスのいずれかを備え得る。いくつかの場合には、ソースデバイス１０２と宛先デバイス１１６とは、ワイヤレス通信のために装備され得、したがって、ワイヤレス通信デバイスと呼ばれることがある。

【0018】

[0039] 図１の例では、ソースデバイス１０２は、ビデオソース１０４と、メモリ１０６と、ビデオエンコーダ２００と、出力インターフェース１０８とを含む。宛先デバイス１１６は、入力インターフェース１２２と、ビデオデコーダ３００と、メモリ１２０と、ディスプレイデバイス１１８とを含む。本開示によれば、ソースデバイス１０２のビデオエンコーダ２００と、宛先デバイス１１６のビデオデコーダ３００とは、ビデオ圧縮のための算術コーディングのための確率初期化のための技法を適用するように構成され得る。したがって、ソースデバイス１０２はビデオ符号化デバイス（video encoding device）の例を表し、宛先デバイス１１６はビデオ復号デバイス（video decoding device）の例を表す。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス１０２は、外部カメラなどの外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイス１１６は、統合されたディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

【0019】

[0040] 図１に示されているシステム１００は一例にすぎない。概して、どんなデジタルビデオ符号化および／または復号デバイスも、ビデオ圧縮のための算術コーディングのための確率初期化のための技法を実行し得る。ソースデバイス１０２および宛先デバイス１１６は、ソースデバイス１０２が宛先デバイス１１６への送信のためにコーディングされたビデオデータを生成するようなコーディングデバイスの例にすぎない。本開示は、データのコーディング（符号化および/または復号）を実行するデバイスとして「コーディング（coding）」デバイスに言及する。したがって、ビデオエンコーダ２００およびビデオデコーダ３００は、コーディングデバイス、特に、それぞれビデオエンコーダおよびビデオデコーダの例を表す。いくつかの例では、デバイス１０２、１１６は、デバイス１０２、１１６の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、システム１００は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、またはビデオ電話のための、ビデオデバイス１０２とビデオデバイス１１６との間の一方向または双方向のビデオ送信をサポートし得る。

【0020】

[0041] 概して、ビデオソース１０４は、ビデオデータのソース（すなわち、未加工の、コーディングされていないビデオデータ）を表し、ピクチャのためのデータを符号化するビデオエンコーダ２００にビデオデータの連続した一連のピクチャ（「フレーム」とも呼ばれる）を与える。ソースデバイス１０２のビデオソース１０４は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされた未加工のビデオを包含するビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース１０４は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブされたビデオとコンピュータで生成されたビデオとの組合せを生成し得る。各々の場合において、ビデオエンコーダ２００は、キャプチャされたビデオデータ、プリキャプチャされたビデオデータ、またはコンピュータで生成されたビデオデータを符号化する。ビデオエンコーダ２００は、ピクチャを、（「表示順序」と呼ばれることがある）受信順序から、コーディングのためのコーディング順序に並べ替え得る。ビデオエンコーダ２００は、符号化されたビデオデータを含むビットストリーム（bitstream）を生成し得る。ソースデバイス１０２は、次いで、たとえば、宛先デバイス１１６の入力インターフェース１２２による受信および/または取出しのために、出力インターフェース１０８を介して符号化されたビデオデータをコンピュータ可読媒体１１０に出力し得る。

【0021】

[0042] ソースデバイス１０２のメモリ１０６と、宛先デバイス１１６のメモリ１２０とは、汎用メモリを表す。いくつかの例では、メモリ１０６、１２０は、未加工のビデオデータ、たとえば、ビデオソース１０４からの未加工のビデオ、およびビデオデコーダ３００からの未加工の、復号されたビデオデータを記憶し得る。追加または代替として、メモリ１０６、１２０は、たとえば、それぞれ、ビデオエンコーダ２００およびビデオデコーダ３００によって実行可能なソフトウェア命令を記憶し得る。この例ではビデオエンコーダ２００およびビデオデコーダ３００とは別々に示されているが、ビデオエンコーダ２００およびビデオデコーダ３００は、機能的に同等のまたは等価な目的のために内部メモリも含み得ることを理解されたい。さらに、メモリ１０６、１２０は、符号化されたビデオデータ、たとえば、ビデオエンコーダ２００からの出力、およびビデオデコーダ３００への入力を記憶し得る。いくつかの例では、メモリ１０６、１２０の部分は、たとえば、未加工の復号および/または符号化されたビデオデータを記憶するために、１つまたは複数のビデオバッファとして割り振られ得る。

【0022】

[0043] コンピュータ可読媒体１１０は、ソースデバイス１０２から宛先デバイス１１６に符号化ビデオデータを移送することが可能な任意のタイプの媒体またはデバイスを表し得る。一例では、コンピュータ可読媒体１１０は、ソースデバイス１０２が、たとえば、無線周波数ネットワークまたはコンピュータベースのネットワークを介して、符号化されたビデオデータを宛先デバイス１１６にリアルタイムで直接送信することを可能にするための通信媒体を表す。出力インターフェース１０８は、符号化ビデオデータを含む送信信号を変調し得、入力インターフェース１２２は、ワイヤレス通信プロトコルなどの通信規格に従って、受信された送信信号を復調し得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどの、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１０２から宛先デバイス１１６への通信を可能にするために有用であり得る任意の他の機器を含み得る。

【0023】

[0044] いくつかの例では、コンピュータ可読媒体１１０はストレージデバイス１１２を含み得る。ソースデバイス１０２は、出力インターフェース１０８からストレージデバイス１１２に符号化されたデータを出力し得る。同様に、宛先デバイス１１６は、入力インターフェース１２２を介してストレージデバイス１１２から符号化されたデータにアクセスし得る。記憶デバイス１１２は、ハードドライブ、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。

【0024】

[0045] いくつかの例では、コンピュータ可読媒体１１０は、ソースデバイス１０２によって生成された符号化されたビデオデータを記憶し得るファイルサーバ１１４または別の中間ストレージデバイスを含み得る。ソースデバイス１０２は、ソースデバイス１０２によって生成された符号化されたビデオデータを記憶し得るファイルサーバ１１４または別の中間ストレージデバイスに符号化されたビデオデータを出力し得る。宛先デバイス１１６は、ストリーミングまたはダウンロードを介してファイルサーバ１１４から記憶されたビデオデータにアクセスし得る。ファイルサーバ１１４は、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス１１６に送信することが可能な任意のタイプのサーバデバイスであり得る。ファイルサーバ１１４は、（たとえば、ウェブサイトのための）ウェブサーバ、ファイル転送プロトコル（ＦＴＰ）サーバ、コンテンツ配信ネットワークデバイス、またはネットワーク接続ストレージ（ＮＡＳ）デバイスを表し得る。宛先デバイス１１６は、インターネット接続を含む任意の標準的なデータ接続を通してファイルサーバ１１４から符号化されたビデオデータにアクセスし得る。これは、ワイヤレスチャネル（たとえば、Ｗｉ－Ｆｉ（登録商標）接続）、有線接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または、ファイルサーバ１１４に記憶された符号化されたビデオデータにアクセスするのに適した、両方の組合せを含み得る。ファイルサーバ１１４および入力インターフェース１２２は、ストリーミング伝送プロトコル、ダウンロード伝送プロトコル、またはそれらの組合せに従って動作するように構成され得る。

【0025】

[0046] 出力インターフェース１０８と入力インターフェース１２２とは、ワイヤレス送信機／受信機、モデム、ワイヤードネットワーキング構成要素（たとえば、イーサネット（登録商標）カード）、様々なＩＥＥＥ８０２．１１規格のいずれかに従って動作するワイヤレス通信構成要素、または他の物理的構成要素を表し得る。出力インターフェース１０８および入力インターフェース１２２がワイヤレス構成要素を備える例では、出力インターフェース１０８および入力インターフェース１２２は、４Ｇ、４Ｇ－ＬＴＥ（登録商標）（ロングタームエボリューション）、ＬＴＥアドバンスト、５Ｇなどのセルラー通信規格に従って、符号化されたビデオデータなどのデータを転送するように構成され得る。出力インターフェース１０８がワイヤレス送信機を備えるいくつかの例では、出力インターフェース１０８と入力インターフェース１２２とは、ＩＥＥＥ８０２．１１仕様、ＩＥＥＥ８０２．１５仕様（たとえば、ＺｉｇＢｅｅ（登録商標））、Ｂｌｕｅｔｏｏｔｈ（登録商標）規格などの、他のワイヤレス規格に従って、符号化されたビデオデータなどのデータを転送するように構成され得る。いくつかの例では、ソースデバイス１０２および/または宛先デバイス１１６は、それぞれのシステムオンチップ（ＳｏＣ）デバイスを含み得る。たとえば、ソースデバイス１０２は、ビデオエンコーダ２００および／または出力インターフェース１０８に帰属する機能を実行するためのＳｏＣデバイスを含み得、宛先デバイス１１６は、ビデオデコーダ３００および／または入力インターフェース１２２に帰属する機能を実行するためのＳｏＣデバイスを含み得る。

【0026】

[0047] 本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディング（video coding）に適用され得る。

【0027】

[0048] 宛先デバイス１１６の入力インターフェース１２２は、コンピュータ可読媒体１１０（たとえば、記憶デバイス１１２、ファイルサーバ１１４など）から符号化ビデオビットストリーム（encoded video bitstream）を受信する。符号化されたビデオビットストリームは、ビデオブロックまたは他のコーディングされたユニット（たとえば、スライス、ピクチャ、ピクチャグループ、シーケンスなど）の特性および／または処理を記述する値を有するシンタックス要素など、ビデオデコーダ３００によっても使用されるビデオエンコーダ２００によって定義された情報をシグナリングすることを含み得る。ディスプレイデバイス１１８は、ユーザに復号されたビデオデータの復号されたピクチャを表示する。ディスプレイデバイス１１８は、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを表し得る。

【0028】

[0049] 図１には示されていないが、いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは各々、オーディオエンコーダおよび／またはオーディオデコーダと統合され得、共通のデータストリーム中にオーディオとビデオの両方を含む多重化ストリームを処理するために、適切なＭＵＸ－ＤＥＭＵＸユニット、あるいは他のハードウェアおよび／またはソフトウェアを含み得る。適用可能な場合、ＭＵＸ－ＤＥＭＵＸユニットはＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

【0029】

[0050] ビデオエンコーダ２００およびビデオデコーダ３００はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路および／またはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を実行するために１つまたは複数のプロセッサを使用してその命令をハードウェアで実行し得る。ビデオエンコーダ２００とビデオデコーダ３００との各々は、１つまたは複数のエンコーダまたはデコーダに含まれ得、両者のいずれかがそれぞれのデバイス中に複合エンコーダ／デコーダ（ＣＯＤＥＣ）の一部として組み込まれ得る。ビデオエンコーダ２００および／またはビデオデコーダ３００を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話などのワイヤレス通信デバイスを備え得る。

【0030】

[0051] ビデオエンコーダ２００およびビデオデコーダ３００は、高効率ビデオコーディング（ＨＥＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６５、またはマルチビューおよび／もしくはスケーラブルビデオコーディング拡張などのそれらの拡張などの、ビデオコーディング規格に従って動作し得る。代替として、ビデオエンコーダ２００およびビデオデコーダ３００は、共同探求テストモデル（ＪＥＭ）または汎用ビデオコーディング（ＶＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６６などの、他のプロプライエタリ規格または業界規格に従って動作し得る。ＶＶＣ規格の最近のドラフトは、Ｂｒｏｓｓら「ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ４）」、ＩＴＵ－ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とのＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔｓＴｅａｍ（ＪＶＥＴ）、第１３回会合：Ｍａｒｒａｋｅｃｈ、ＭＡ、２０１９年１月９～１８日、ＪＶＥＴ－Ｍ１００１－ｖ６（以下、「ＶＶＣＤｒａｆｔ４」）に記載されている。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。

【0031】

[0052] 概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ピクチャのブロックベースのコーディングを実行し得る。「ブロック（block）」という用語は、処理されるべき（たとえば、符号化されるべき、復号されるべき、あるいは符号化および／または復号プロセスにおいて他の方法で使用されるべき）データを含む構造を一般に意味する。たとえば、ブロックは、ルミナンスおよび／またはクロミナンスデータのサンプルの２次元行列を含み得る。概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ＹＵＶ（たとえば、Ｙ、Ｃｂ、Ｃｒ）フォーマットで表されるビデオデータをコーディングし得る。すなわち、ピクチャのサンプルのために赤色、緑色、および青色（ＲＧＢ）データをコーディングするのではなく、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分とをコーディングし得、ここで、クロミナンス成分は、赤色相と青色相の両方のクロミナンス成分を含み得る。いくつかの例では、ビデオエンコーダ２００は、符号化より前に、受信されたＲＧＢフォーマットのデータをＹＵＶ表現に変換し、ビデオデコーダ３００は、ＹＵＶ表現をＲＧＢフォーマットに変換する。代替的に、前処理および後処理ユニット（図示せず）が、これらの変換を実行し得る。

【0032】

[0053] 本開示では、概して、ピクチャのデータを符号化または復号するプロセスを含むように、ピクチャのコーディング（たとえば、符号化および復号）に言及することがある。同様に、本開示は、ブロックのデータを符号化または復号するプロセス、たとえば、予測および/または残差コーディングを含むように、ピクチャのブロックのコーディングに言及することがある。符号化ビデオビットストリームは、概して、コーディング決定（たとえば、コーディングモード）とブロックへのピクチャの区分とを表すシンタックス要素の一連の値を含む。したがって、ピクチャまたはブロックをコーディングすることへの言及は、概して、ピクチャまたはブロックを形成しているシンタックス要素の値をコーディングすることとして理解されたい。

【0033】

[0054] ＨＥＶＣは、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ：prediction unit）、および変換ユニット（ＴＵ：transform unit）を含む、様々なブロックを定義する。ＨＥＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、４分木構造に従ってコーディングツリーユニット（ＣＴＵ）をＣＵに区分する。すなわち、ビデオコーダは、ＣＴＵとＣＵとを４つの等しい、重複しない正方形に区分し、４分木の各ノードは、０個または４つのいずれかの子ノードを有する。子ノードなしのノードは「リーフノード」と呼ばれることがあり、そのようなリーフノードのＣＵは、１つまたは複数のＰＵならびに／あるいは１つまたは複数のＴＵを含み得る。ビデオコーダは、ＰＵとＴＵとをさらに区分し得る。たとえば、ＨＥＶＣでは、残差４分木（ＲＱＴ）は、ＴＵの区分を表す。ＨＥＶＣでは、ＰＵはインター予測データを表すが、ＴＵは残差データを表す。イントラ予測されるＣＵは、イントラモード指示などのイントラ予測情報を含む。

【0034】

[0055] 別の例として、ビデオエンコーダ２００とビデオデコーダ３００とは、ＪＥＭまたはＶＶＣに従って動作するように構成され得る。ＪＥＭまたはＶＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、ピクチャを複数のコーディングツリーユニット（ＣＴＵ）に区分する。ビデオエンコーダ２００は、４分木２分木（ＱＴＢＴ）構造またはマルチタイプツリー（ＭＴＴ）構造などの、木構造に従ってＣＴＵを区分し得る。ＱＴＢＴ構造は、ＨＥＶＣのＣＵとＰＵとＴＵの区別などの、複数の区分タイプの概念を除去する。ＱＴＢＴ構造は、４分木区分に従って区分される第１のレベル、および２分木区分に従って区分される第２のレベルという、２つのレベルを含む。ＱＴＢＴ構造のルートノードはＣＴＵに対応する。２分木のリーフノードは、コーディングユニット（ＣＵ）に対応する。

【0035】

[0056] ＭＴＴ区分構造では、ブロックは、４分木（ＱＴ）区分と、２分木（ＢＴ）区分と、１つまたは複数のタイプの３分木（ＴＴ）区分とを使用して区分され得る。３分木区分は、ブロックが３つのサブブロックに分割される区分である。いくつかの例では、３分木区分は、中心を通って元のブロックを分割することなく、ブロックを３つのサブブロックに分割する。ＭＴＴにおける区分タイプ（たとえば、ＱＴ、ＢＴ、およびＴＴ）は、対称的または非対称的であり得る。

【0036】

[0057] いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分との各々を表すために単一のＱＴＢＴまたはＭＴＴ構造を使用し得、他の例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分のための１つのＱＴＢＴ／ＭＴＴ構造、および両方のクロミナンス成分のための別のＱＴＢＴ／ＭＴＴ構造（またはそれぞれのクロミナンス成分のための２つのＱＴＢＴ／ＭＴＴ構造）など、２つ以上のＱＴＢＴまたはＭＴＴ構造を使用し得る。

【0037】

[0058] ビデオエンコーダ２００およびビデオデコーダ３００は、ＨＥＶＣによる４分木区分、ＱＴＢＴ区分、ＭＴＴ区分、または他の区分構造を使用するように構成され得る。説明の目的で、本開示の技法の説明はＱＴＢＴ区分に関して提示される。ただし、本開示の技法が、４分木区分、または同様に他のタイプの区分を使用するように構成されたビデオコーダにも適用され得ることを理解されたい。

【0038】

[0059] 本開示は、垂直および水平次元、たとえば、１６×１６のサンプルまたは１６バイ（by）１６のサンプルに関して（ＣＵまたは他のビデオブロックなどの）ブロックのサンプル次元を互換的に言及するために「Ｎ×Ｎ」および「ＮバイＮ」を使用し得る。一般に、１６×１６のＣＵは、垂直方向に１６個のサンプル（ｙ＝１６）を有し、水平方向に１６個のサンプル（ｘ＝１６）を有する。同様に、Ｎ×ＮのＣＵは、概して、垂直方向にＮ個のサンプルを有し、水平方向にＮ個のサンプルを有し、ここで、Ｎは非負整数値を表す。ＣＵ中のサンプルは行と列とに配列され得る。さらに、ＣＵは、必ずしも、水平方向において垂直方向と同じ数のサンプルを有する必要があるとは限らない。たとえば、ＣＵはＮ×Ｍサンプルを備え得、ここで、Ｍは必ずしもＮに等しいとは限らない。

【0039】

[0060] ビデオエンコーダ２００は、予測および／または残差情報、ならびに他の情報を表すＣＵのためにビデオデータを符号化する。予測情報（prediction information）は、ＣＵについて予測ブロック（prediction block）を形成するためにＣＵがどのように予測されるべきかを示す。残差情報（residual information）は、概して、符号化より前のＣＵのサンプルと予測ブロックとの間のサンプルごとの差分（sample-by-sample differences）を表す。

【0040】

[0061] ＣＵを予測するために、ビデオエンコーダ２００は、概して、インター予測またはイントラ予測を通してＣＵについて予測ブロックを形成し得る。インター予測は、概して、以前にコーディングされたピクチャのデータからＣＵを予測することを指し、一方、イントラ予測は、概して、同じピクチャの以前にコーディングされたデータからＣＵを予測することを指す。インター予測を実施するために、ビデオエンコーダ２００は、１つまたは複数の動きベクトルを使用して予測ブロックを生成し得る。ビデオエンコーダ２００は、概して、たとえば、ＣＵと参照ブロックとの間の差分に関して、ＣＵにぴったり一致する参照ブロックを識別するために動き探索を実行し得る。ビデオエンコーダ２００は、参照ブロックが現在ＣＵにぴったり一致するかどうかを決定するために、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）、または他のそのような差分計算を使用して差分メトリックを計算し得る。いくつかの例では、ビデオエンコーダ２００は、単方向予測または双方向予測を使用して現在ＣＵを予測し得る。

【0041】

[0062] ＪＥＭおよびＶＶＣのいくつかの例はまた、インター予測モードと見なされ得るアフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ２００は、ズームインまたはアウト、回転、パースペクティブの動き、あるいは他の変則の動きタイプなど、非並進の動きを表す２つ以上の動きベクトルを決定し得る。

【0042】

[0063] イントラ予測を実行するために、ビデオエンコーダ２００は、予測ブロックを生成するようにイントラ予測モードを選択し得る。ＪＥＭとＶＶＣとのいくつかの例は、様々な方向性モード、ならびに平面モードおよびＤＣモードを含む、６７個のイントラ予測モードを提供する。概して、ビデオエンコーダ２００は、現在のブロック（たとえば、ＣＵのブロック）のサンプルをそれから予測すべき、現在のブロックに対する隣接サンプルを記述するイントラ予測モードを選択する。そのようなサンプルは、ビデオエンコーダ２００がラスタ走査順序で（左から右に、上から下に）ＣＴＵとＣＵとをコーディングすると仮定すると、概して、現在のブロックと同じピクチャ中の現在のブロックの上方、上方および左側、または左側にあり得る。

【0043】

[0064] ビデオエンコーダ２００は、現在のブロックについて予測モードを表すデータを符号化する。たとえば、インター予測モードでは、ビデオエンコーダ２００は、様々な利用可能なインター予測モードのうちのどれが使用されるか、ならびに対応するモードの動き情報を表すデータを符号化し得る。たとえば、単方向または双方向インター予測では、ビデオエンコーダ２００は、高度動きベクトル予測（ＡＭＶＰ）またはマージモードを使用して動きベクトルを符号化し得る。ビデオエンコーダ２００は、アフィン動き補償モードの動きベクトルを符号化するために同様のモードを使用し得る。

【0044】

[0065] ブロックのイントラ予測またはインター予測などの予測に続いて、ビデオエンコーダ２００は、ブロックについて残差データを計算し得る。残差ブロック（residual block）などの残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックについての予測ブロックとの間の、サンプルごとの差分を表す。ビデオエンコーダ２００は、サンプル領域ではなく変換領域中に変換データを生成するために、残差ブロックに１つまたは複数の変換を適用し得る。たとえば、ビデオエンコーダ２００は、離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。さらに、ビデオエンコーダ２００は、モード依存非分離可能２次変換（ＭＤＮＳＳＴ）、信号依存変換、カルーネンレーベ変換（ＫＬＴ）など、第１の変換に続いて２次変換を適用し得る。ビデオエンコーダ２００は、１つまたは複数の変換の適用に続いて変換係数（transform coefficient）を生成する。

【0045】

[0066] 上述のように、変換係数を生成するための任意の変換に続いて、ビデオエンコーダ２００は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできる限り低減してさらなる圧縮をもたらすように、変換係数が量子化されるプロセスを指す。量子化プロセスを実行することによって、ビデオエンコーダ２００は、係数の一部またはすべてと関連付けられるビット深度を低減し得る。たとえば、ビデオエンコーダ２００は、量子化の間にｎビット値をｍビット値に丸めてもよく、ｎはｍより大きい。いくつかの例では、量子化を実行するために、ビデオエンコーダ２００は、量子化されるべき値のビットごとの右シフトを実行してもよい。

【0046】

[0067] 量子化に続いて、ビデオエンコーダ２００は、変換係数を走査して、量子化された変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（したがって、より低い頻度）の係数をベクトルの前方に配置し、より低いエネルギー（したがって、より高い頻度）の変換係数をベクトルの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２００は、量子化された変換係数を走査してシリアル化されたベクトルを生成するためにあらかじめ定義された走査順序を利用し、次いで、ベクトルの量子化された変換係数をエントロピー符号化し得る。他の例では、ビデオエンコーダ２００は適応型走査を実行し得る。量子化された変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２００は、たとえば、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context adaptive binary arithmetic coding）に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２００はまた、ビデオデータを復号する際にビデオデコーダ３００によって使用するための、符号化されたビデオデータと関連付けられるメタデータを記述するシンタックス要素のための値をエントロピー符号化し得る。

【0047】

[0068] ＣＡＢＡＣを実行するために、ビデオエンコーダ２００は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接値が０値であるか否かに関係し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。

【0048】

[0069] ビデオエンコーダ２００は、さらに、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、およびシーケンスベースのシンタックスデータなどのシンタックスデータを、たとえば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、あるいはシーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、またはビデオパラメータセット（ＶＰＳ）などの他のシンタックスデータ中で、ビデオデコーダ３００に対して生成し得る。ビデオデコーダ３００は、対応するビデオデータをどのように復号すべきかを決定するために、そのようなシンタックスデータを同様に復号し得る。

【0049】

[0070] このようにして、ビデオエンコーダ２００は、符号化されたビデオデータ、たとえば、ブロック（たとえば、ＣＵ）へのピクチャの区分ならびにブロックの予測および/または残差情報を記述するシンタックス要素を含むビットストリームを生成し得る。最終的に、ビデオデコーダ３００は、ビットストリームを受信し、符号化ビデオデータを復号し得る。

【0050】

[0071] 以下のセクションは、バイナリ算術コーディング（ＢＡＣ：binary arithmetic coding）およびＣＡＢＡＣ技法についてより詳細に説明する。ＢＡＣは、概して、再帰的間隔再分割プロシージャである。ＢＡＣは、Ｈ．２６４／ＡＶＣおよびＨ．２６５／ＨＥＶＣビデオコーディング規格におけるＣＡＢＡＣプロセスにおいてビンを符号化するために使用される。ＢＡＣコーダの出力は、最終コード化確率間隔（final coded probability interval）内の確率に対する値またはポインタを表すバイナリストリームである。確率間隔は、範囲（「範囲」）および下端値（「低」）によって指定される。範囲（Range）は確率間隔の拡張である。低（Low）はコーディング／確率間隔の下限である。

【0051】

[0072] ビデオコーディングへの算術コーディングの適用は、Ｄ．Ｍａｒｐｅ、Ｈ．Ｓｃｈｗａｒｚ、およびＴ．Ｗｉｅｇａｎｄ「Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard」、ＩＥＥＥＴｒａｎｓ．ＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ、ｖｏｌ．１３、ｎｏ．７、２００３年７月に記載されている。ＣＡＢＡＣは、３つの主要な機能、すなわち、２値化（binarization）、コンテキストモデリング、および算術コーディングを伴う。２値化は、シンタックス要素をバイナリシンボル（binary symbol）（あるいは「ビン」）にマッピングする機能を指す。バイナリシンボルは「ビンストリング（bin string）」と呼ばれることもある。コンテキストモデリング（Context modeling）は、様々なビンの確率を推定する機能を指す。算術コーディング（Arithmetic coding）は、推定された確率に基づいて、ビンをビットに圧縮する後続の機能を指す。バイナリ算術コーダなど、様々なデバイスおよび／またはそれらのモジュールは算術コーディングの機能を実行し得る。

【0052】

[0073] ＨＥＶＣでは、単項（Ｕ：unary）、短縮単項（ＴＵ：truncated unary）、ｋ次指数ゴロム（ＥＧｋ：kth-order Exp-Golomb）、および固定長（ＦＬ：fixed length）を含む、いくつかの異なる２値化プロセスが使用される。様々な２値化プロセスの詳細は、Ｖ．ＳｚｅおよびＭ．Ｂｕｄａｇａｖｉ、「High throughput CABAC entropy coding in HEVC」、ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ（ＴＣＳＶＴ）、ｖｏｌ．２２、ｎｏ．１２、１７７８～１７９１ページ、２０１２年１２月に記載されている。

【0053】

[0074] ＣＡＢＡＣにおける各コンテキスト（すなわち、確率モデル）は状態（state）によって表される。各状態（σ）は、特定のシンボル（たとえば、ビン）が劣勢シンボル（ＬＰＳ：Least Probable Symbol）である確率（ｐ_σ）を暗黙的に（implicitly）表す。シンボルはＬＰＳまたは優勢シンボル（ＭＰＳ：Most Probable Symbol）であり得る。シンボルはバイナリであり、したがって、ＭＰＳおよびＬＰＳは０または１であり得る。確率（probability）は、対応するコンテキストについて推定され、算術コーダを使用してシンボルをエントロピーコーディングするために（暗黙的に）使用される。

【0054】

[0075] ＢＡＣのプロセスは、コーディングすべきコンテキストとコーディングされているビンの値とに応じて、それの内部値「範囲（range）」および「低（low）」を変更する状態機械によって扱われる。コンテキストの状態（すなわち、それの確率）に応じて、範囲は、範囲ＭＰＳ_σ（状態_σにおける優勢シンボルの範囲）と範囲ＬＰＳ_σ（状態_σにおける劣勢シンボルの範囲）とに分割される。理論上、確率状態_σの範囲ＬＰＳ_σ値は以下の乗算によって導出される。

【0055】

【数1】

【0056】

ここで、ｐ_σは、ＬＰＳを選択する確率である。もちろん、ＭＰＳの確率は１－ｐ_σである。等価的に、ｒａｎｇｅＭＰＳ_σは、範囲－ｒａｎｇｅＬＰＳ_σに等しい。ＢＡＣは、コーディングすべきコンテキストビンの状態と、現在の範囲と、コーディングされているビンの値（すなわち、ビンがＬＰＳに等しいのかＭＰＳに等しいのか）とに応じて、範囲を反復的に更新する。

【0057】

[0076] 図２Ａおよび図２Ｂは、ビンｎにおけるこのプロセスの例を示す。図２Ａの例２０１では、あるコンテキスト状態（σ）を仮定すれば、ビンｎにおける範囲は、ＬＰＳ（ｐ_σ）の確率によって与えられるＲａｎｇｅＭＰＳとＲａｎｇｅＬＰＳとを含む。例２０１は、ビンｎの値がＭＰＳに等しいときのビンｎ＋１における範囲の更新を示す。この例では、低は同じままであるが、ビンｎ＋１における範囲の値は、ビンｎにおけるＲａｎｇｅＭＰＳの値に低減される。図２Ｂの例２０３は、ビンｎの値がＭＰＳに等しくない（すなわち、ＬＰＳに等しい）ときのビンｎ＋１における範囲の更新を示す。この例では、低は、ビンｎにおけるＲａｎｇｅＬＰＳのより低い範囲値に移動される。さらに、ビンｎ＋１における範囲の値は、ビンｎにおけるＲａｎｇｅＬＰＳの値に低減される。

【0058】

[0077] ＨＥＶＣでは、範囲は９ビットで表され、低は１０ビットで表される。範囲値および低値を十分な精度で維持するための再正規化プロセスがある。範囲が２５６よりも小さいときはいつでも、再正規化が行われる。したがって、範囲は、再正規化の後、常に２５６以上である。範囲（range）の値と低（low）の値とに応じて、ＢＡＣは、ビットストリームに「０」または「１」を出力するか、または将来の出力のために保持するために（ＢＯ：未解決ビット（bits-outstanding）と呼ばれる）内部変数を更新する。図３は、範囲に応じたＢＡＣ出力の例を示す。たとえば、範囲と低とが、あるしきい値（たとえば、５１２）を上回るとき、ビットストリームに「１」が出力される。範囲と低とが、あるしきい値（たとえば、５１２）を下回るとき、ビットストリームに「０」が出力される。範囲と下側（lower）とが、あるしきい値間にあるとき、ビットストリームに何も出力されない。代わりに、ＢＯ値が増分され、次のビンが符号化される。

【0059】

[0078] 本開示で説明される技法は、たとえば、ビデオエンコーダ、ビデオデコーダ、または組み合わせられたビデオエンコーダデコーダ（ＣＯＤＥＣ）内で実行され得る。特に、そのような技法は、ビデオエンコーダのエントロピー符号化ユニットおよび／またはビデオデコーダのエントロピー復号ユニットにおいて実行され得る。技法は、たとえば、ＣＡＢＡＣプロセス内で実行され得、これは、ＨＥＶＣ規格の態様によるビデオコーディングなどのビデオコーディングをサポートするように構成され得る。エントロピー符号化および復号ユニットは、たとえば、残差ビデオデータに関連する量子化された変換係数、動きベクトル情報、シンタックス要素、ならびにビデオ符号化および／またはビデオ復号プロセスにおいて有用であり得る他のタイプの情報など、様々なビデオデータのうちのいずれかを符号化または復号するために、相反するまたは逆の様式でコーディングプロセスを適用し得る。

【0060】

[0079] 概して、ビデオデコーダ３００は、ビットストリームの符号化ビデオデータを復号するために、ビデオエンコーダ２００によって実行されたものの逆プロセスを実行する。たとえば、ビデオデコーダ３００は、ビデオエンコーダ２００のＣＡＢＡＣ符号化プロセスと逆ではあるが、それと実質的に同様の様式でＣＡＢＡＣを使用してビットストリームのシンタックス要素の値を復号し得る。シンタックス要素は、ＣＴＵのＣＵを定義するために、ＣＴＵへのピクチャの区分情報と、ＱＴＢＴ構造などの対応する区分構造に従う、各ＣＴＵの区分とを定義し得る。シンタックス要素は、ビデオデータのブロック（たとえば、ＣＵ）のための予測および残差情報をさらに定義し得る。

【0061】

[0080] 残差情報は、たとえば、量子化された変換係数によって表され得る。ビデオデコーダ３００は、ブロックの残差ブロックを再生するために、ブロックの量子化された変換係数を逆量子化し、逆変換し得る。ビデオデコーダ３００は、ブロックの予測ブロックを形成するために、シグナリングされた予測モード（イントラまたはインター予測）と、関連する予測情報（たとえば、インター予測のための動き情報）とを使用する。ビデオデコーダ３００は、元のブロックを再生するために（サンプルごとに）予測ブロックと残差ブロックとを組み合わせ得る。ビデオデコーダ３００は、ブロックの境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを実行することなどの、追加の処理を実行し得る。

【0062】

[0081] 本開示の技法によれば、ビデオエンコーダ２００および／またはビデオデコーダ３００は、ビデオデータのスライス中のシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義されたスロープインデックス（たとえば、ＳｌｏｐｅＩｄｘ）とあらかじめ定義されたオフセットインデックス（たとえば、ＯｆｆｓｅｔＩｄｘ）とを取得することと、あらかじめ定義されたスロープインデックス（slope index）とあらかじめ定義されたオフセットインデックス（offset index）とに基づいて、線形領域中でのビデオデータのスライスのためのコンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングすることとを行い得る。

【0063】

[0082] 本開示では、概して、シンタックス要素などのある情報を「シグナリング（signaling）」することに言及することがある。「シグナリング」という用語は、概して、符号化ビデオデータを復号するために使用される値シンタックス要素および／または他のデータの通信を指すことがある。すなわち、ビデオエンコーダ２００は、ビットストリームにおいてシンタックス要素の値をシグナリングし得る。一般に、シグナリングは、ビットストリームの中に値を生成することを指す。上述されたように、ソースデバイス１０２は、実質的にリアルタイムでビットストリームを宛先デバイス１１６に移送するか、または、宛先デバイス１１６による後の取出しのためにシンタックス要素を記憶デバイス１１２に記憶するときに起こり得るように、非リアルタイムでビットストリームを宛先デバイス１１６に移送し得る。

【0064】

[0083] 本開示の技法は、汎用ビデオコーディング（ＶＶＣ）において採用されるコンテキスト適応型バイナリ算術コーダ（ＣＡＢＡＣ：Context Adaptive Binary Arithmetic Coder）などの線形領域中での現実の確率を確率状態が表すバイナリ演算コーダ（binary arithmetic coder）に好適である。

【0065】

[0084] バイナリ算術コーディングでは、ビデオシーケンスは、最初に、空間時間冗長性が除去された状態でデータ要素（またはシンタックス要素）に変換され、シンタックス要素は、次いで、エントロピーコーディングによって２進表現（またはビットストリーム）にロスレス変換される。最近のビデオコーディング規格（たとえば、ＨＥＶＣおよびＶＶＣ）は、エントロピーコーディングを実行するためにバイナリ算術コーディングを利用し得る。

【0066】

[0085] バイナリ算術コーディングプロセスは、３つの主要なステージ、すなわち、２値化と、適応型確率推定（adaptive probability estimation）と、算術コーディングとを有する。２値化ステージでは、コーディングされるべき各非２値シンタックス要素は、バイナリデータシンボル（またはビン）の文字列に変換される。

【0067】

[0086] 適応型確率推定ステージでは、各ビンは、それがバイナリシンタックス要素であるのかまたは非２値シンタックス要素から変換されたバイナリ文字列の１つの要素であるのかにかかわらず、それの確率分布（probability distribution）（すなわち、０または１である確率）の推定値を有する。確率分布は、（１）定常で均一な分布（すなわち、常にｐ＝０．５である）と、（２）時間的に変化するまたは非一様の分布との２つのカテゴリに分類され得る。カテゴリ（２）の分布をもつビンには、それの前のビンの値と他のコンテキスト統計値とに基づいてそのビンのリアルタイムの分布を追跡する確率モデル（またはコンテキストモデル）が割り当てられ得る。

【0068】

[0087] 算術コーディングステージでは、カテゴリ（１）の分布をもつビンは、バイパスモード、低い複雑度の高度に並列処理可能なモードでコーディングされ得、カテゴリ（２）の分布をもつビンは、通常モードでコーディングされ、ここで、ビン値と関連するコンテキストモデルによって推定されたそれの確率とが使用される。

【0069】

[0088] ビデオコーディングのためにバイナリ算術コーダにおいて使用されるときに、理論的には実数値の、０～１にわたる確率がデジタル化されて、したがって、一般に、確率状態と呼ばれる。たとえば、ＨＥＶＣでは、確率は、７ビットの精度を有し、１２８の確率状態に対応する。図９は、確率と確率状態との間のマッピングを示す。わかるように、ＨＥＶＣにおける確率状態は、対数領域中での現実の確率を表す。別の例では、ＶＶＣでは、あるビンの確率推定値は、ビンの関連するコンテキストモデルで追跡され、それぞれ、速い速度と遅い速度とで更新される２つの確率の平均である。速い速度で更新される１つは、１０ビットの精度を有し、１０２４の確率状態に対応し、遅い速度で更新される他方は、１４ビットの精度を有し、１６３８４の確率状態に対応する。ＨＥＶＣとは異なり、ＶＶＣは、確率状態と確率との間に線形マッピングを採用した（図１０Ａおよび図１０Ｂを参照されたい）。

【0070】

[0089] ＨＥＶＣおよびＶＶＣでは、ビデオビットストリームは、複数の独立して復号可能なユニット（たとえば、スライス）を備えるかまたはそれらからなり、そのようなユニットの始めに、すべてのコンテキストモデルの確率状態は、いくつかのあらかじめ定義された値にリセットされなければならないことを暗示する。一般に、ソースの統計的性質のいかなる事前知識もない場合、各コンテキストモデルは、均一な分布（ｐ＝０．５）を仮定しなければならない。しかしながら、適応型確率推定の学習フェーズを橋渡しし、異なるコーディング条件での前適応を可能にするために、確率モデルごとに等確率状態よりもある程度適切な初期確率状態（初期化プロセス）を与えることが有益であることが分かっている。

【0071】

[0090] ＨＥＶＣにおけるＣＡＢＡＣは、各スライスの始めに呼び出される量子化パラメータ（ＱＰ：quantization parameter）に依存する初期化プロセスを有する。スライスのためのルーマＱＰ、ＳｌｉｃｅＱＰ_Yの初期値（initial value）が与えられれば、ＩｎｉｔＰｒｏｂＳｔａｔｅとして示されるあるコンテキストモデルの初期確率状態は、式（１）～（３）によって生成される。

【0072】

【数2】

【0073】

ここで、ＳｌｏｐｅＩｄｘおよびＯｆｆｓｅｔＩｄｘ（いずれも両端値を含む０～１５にわたる整数）は、コンテキストモデルごとにあらかじめ定義され記憶された初期化パラメータである。式（３）は、ＩｎｉｔＰｒｏｂＳｔａｔｅが、約ｍ＞＞４の勾配とＳｌｉｃｅＱＰＹ＝０における交点ｎとをもつＳｌｉｃｅＱＰ_Yの線形関数によってモデル化されることを意味する。ＳｌｏｐｅＩｄｘから勾配（slope）へのマッピングとＯｆｆｓｅｔＩｄｘから交点（intersection）へのマッピングとは、それぞれ表１および表２に発見され得る。

【0074】

【表1】

【0075】

【表2】

【0076】

言い換えれば、コンテキストモデルは、初期確率状態を直接記憶しないことがあり、代わりに、各スライスの始めに、確率状態を導出するための引数としてＳｌｉｃｅＱＰ_Yを使用する線形関数を一緒に決定する２つの初期化パラメータを記憶する。

【0077】

[0091] いずれも４ビットの精度を有するＳｌｏｐｅＩｄｘとＯｆｆｓｅｔＩｄｘとは、単一の８ビットの初期化値にパックされ、その中で、上位ニブル（nibble）および下位ニブルが、それぞれ、ＳｌｏｐｅＩｄｘおよびＯｆｆｓｅｔＩｄｘである。

【0078】

[0092] 現在のＶＶＣのＣＡＢＡＣは、基本的に、式（３）において、クリッピングが０～１２７までであることを除いてＩｎｉｔＰｒｏｂＳｔａｔｅを導出するためにＨＥＶＣの場合と同じ方法を使用する。しかしながら、対数領域中での確率を表すＩｎｉｔＰｒｏｂＳｔａｔｅ（図９を参照されたい）を導出した後に、ＶＶＣ中での初期化プロセスは、ＶＶＣの算術コーディングエンジンにおいて使用されるためにＩｎｉｔＰｒｏｂＳｔａｔｅを線形領域中での確率を表す確率状態（図１０Ａおよび図１０Ｂを参照されたい）に変換するためにもう１つのステップを必要とする。図１１Ａおよび図１１Ｂに示されている変換（またはマッピング）は、以下のようにルックアップテーブル（ＬＵＴ）（表３を参照されたい）を使用することによって実装される。
１．ＬＵＴ中の対応するｐｒｏｂａｂｉｌｉｔｙ＿ｓｔａｔｅ値を発見するために探索インデックスとしてＩｎｉｔＰｒｏｂＳｔａｔｅを使用する。
２．－ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬとして示されるより低い精度（１０ビット）での確率状態が式（４）において導出される。

【0079】

【数3】

【0080】

－ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＨとして示されるより高い精度（１４ビット）での確率状態が式（５）において導出される。

【0081】

【数4】

【0082】

【表3】

【0083】

[0093] 上記で説明されたように、現在のＶＶＣのＣＡＢＡＣは、線形領域中での確率を表す確率状態（図１０Ａおよび図１０Ｂを参照されたい）を採用するが、依然として、ＨＥＶＣにおけるレガシー初期化プロセスを使用し、その中で、導出される初期確率状態は、対数領域中での確率を表す。初期化プロセスの出力と算術コーディングエンジンの入力とを橋渡しするために、１２８個のエントリのＬＵＴがマッピングのために使用される。

【0084】

[0094] 本開示の１つまたは複数の技法によれば、初期化プロセスは、ＶＶＣのために修正され得る（たとえば、これらの技法は、ＶＶＣにおける初期化プロセスを適切に修正することによってこの表のルックアッププロセスを改善し得る）。修正のための２つの方法が提案される。１つの方法では、出力確率状態ＩｎｉｔＰｒｏｂＳｔａｔｅは、線形領域中での確率を表す。これを行うことによって、マッピングプロセスは、精度調整目的だけのためにシフト動作に低減される。他の方法では、出力確率状態ＩｎｉｔＰｒｏｂＳｔａｔｅは、２次領域中での確率を表し、マッピングは、ＬＵＴではなく式を使用することによって実現される。

【0085】

[0095] 勾配および交点の範囲を増加させる。所与のコンテキストモデルのための適切な初期化パラメータを発見するために、ソースの統計分析などいくつかの手段によってそのコンテキストモデルを使用するビンの確率分布の事前知識を収集する必要がある。図１２は、Ｉスライスにおいて使用されるシンタックス要素ＳａｏＭｅｒｇｅＦｌａｇのビンのための一例を示す。

【0086】

[0096] ＨＥＶＣおよび現在のＶＶＣでは、確率の事前知識は、対数領域中での確率状態に変換され（図１３Ａは図１２から変換され）、決定された線形関数が確率状態とＳｌｉｃｅＱＰ_Yとの間の相関を最も良く適合させる最適な初期化パラメータは、力ずくの探索またはいくつかの他のよりスマートな方法によって発見される。同じ例について、ＳｌｏｐｅＩｄｘおよびＯｆｆｓｅｔＩｄｘは、それぞれ、１３および６であり（勾配が近似的に１．２５であり、交点が３２であり）、対応する最良適合線形関数を図１３Ｂにプロットする。

【0087】

[0097] 本開示の技法によれば、初期確率状態は、算術コーディングエンジンと調和するために線形領域中にある。同じ例について、線形領域中での確率状態によって表される事前知識が図１４Ａに示されており、これは、単に、図１２のスケーリングされたバージョンである。明確化の簡単のために、７ビットの精度が対数状態と線形確率状態との両方のために使用されることに注意されたい。しかしながら、他の例では、他のビット精度が使用され得る。

【0088】

[0098] 図１３Ａと図１４Ａとの比較は、確率状態が、線形領域中で変化するより対数領域中でＳｌｉｃｅＱＰ_Yとともにはるかに穏やかに変化することを示し、これは、対数領域中での確率状態をうまく適合させる平坦な線が、線形領域中ではかなり急になり得ることを意味する。図１４Ａに示されている確率状態に関して、ＨＥＶＣおよび現在のＶＶＣにおいて定義されている初期化プロセスを変更することなしに（式（１）～（３）を参照されたい）、力ずくの探索によって発見することができる最良の初期化パラメータは、図１４Ｂに示されているように、１５に等しいＳｌｏｐｅＩｄｘおよび４に等しいＯｆｆｓｅｔＩｄｘであり、それで、最大の有効な勾配１．８８が達成される。しかしながら、線は、良好な適合を達成するのにはまだ十分に急でないことがある。勾配と交点との増加した探索範囲を用いて、図１４Ｃに示されているように、より良い適合が発見され得、ここで、勾配は、３．２５であり、交点は－２３であり、いずれも、ＨＥＶＣと現在のＶＶＣとが許容する限界を上回る。

【0089】

[0099] 例（図１２～図１４Ｃ）は例外ではなく典型的であることに注意されたい。ビンの良好な数は、そのような種類の確率分布を有する。したがって、勾配およびオフセットの範囲は、ＳｌｉｃｅＱＰ_Yと現在線形領域中にある確率状態との相関を適合させるために線形モデルを使用するために増加されなければならない。

【0090】

[0100] 一例では、可能な勾配および交点の値の数は変化しない（すなわち、ＳｌｏｐｅＩｄｘおよびＯｆｆｓｅｔＩｄｘは依然として０～１５にわたる）が、それらの間のステップサイズが増加し、これは、それぞれ、式（６）における定数ａが式（１）における５よりも大きく、式（７）におけるｂが式（２）における３よりも大きいことを意味する。

【0091】

【数5】

【0092】

[0101] 別の例では、可能な勾配および交点値の数が増加する。たとえば、ＳｌｏｐｅＩｄｘは０～３１の範囲にあることができ、３２の可能な勾配値をもたらす。上記の２つの例は、一緒に使用され得るか、または独立して使用され得る。

【0093】

[0102] ＳｌｉｃｅＱＰ_Yにおける交点を０に等しくないものとして定義する。勾配およびオフセットの増加した範囲を用いて線形確率状態の要求に応えることのほかに、ＳｌｉｃｅＱＰ_Yにおける交点を０に等しくないものとして定義することが代替のまたは追加の方法である。たとえば、図１５Ａは、Ｂスライスにおいて使用されるＳｐｌｉｔＦｌａｇの確率分布を示す。対数領域では、図１５Ｂに示されているように、ＳｌｉｃｅＱＰ_Yに関する確率状態は、－０．６３に等しい勾配および８８に等しい交点（すなわち、ＨＥＶＣおよび現在のＶＶＣにおいて定義されているＳｌｏｐｅＩｄｘ７およびＯｆｆｓｅｔＩｄｘ１３）を用いる線形関数によってうまくモデル化され得る。しかしながら、線形領域中では、確率状態は、ＨＥＶＣおよび現在のＶＶＣにおいて定義されている有効な勾配／交点の組合せによってうまくモデル化されないことがある。図１５Ｃは、力ずくの探索によって発見される最も近接した適合を示し、ここで、勾配は、－０．９４に等しく、交点は、１０４に等しい（すなわち、ＳｌｏｐｅＩｄｘ６およびＯｆｆｓｅｔＩｄｘ１５である）。図１５Ｄに示されているように、別の有効な勾配－１．８８（ＳｌｏｐｅＩｄｘ３）は、より良い適合を達成するが、ｙ軸への投影（すなわち、０に等しいＳｌｉｃｅＱＰ_Yにおける交点）は１０４の上限をはるかに越えた１３０である。

【0094】

[0103] 式（３）に上記で示されているように、いくつかの例では、初期確率状態は、変数ｍにＳｌｉｃｅＱＰ_Yを乗算することによって部分的に決定され得る。式（３）の例では、確率状態の線形モデルは、ＳｌｉｃｅＱＰ_Yが０である点において定義される。

【0095】

[0104] 本開示の１つまたは複数の技法によれば、ビデオコーダは、確率状態の線形モデルが０以外のＳｌｉｃｅＱＰ_Yの値において定義されるようにオフセットを利用し得る。確率状態が定義される線形モデル上の点は、量子化パラメータアンカーポイント（ＱＰ_anchor）と呼ばれることがある。たとえば、ビデオコーダは、ＳｌｉｃｅＱＰ_Yからオフセットを減算し、結果に変数ｍを乗算し得る。一例では、これは、以下に示されるように式（３）を式（８）に修正することによって達成され得る。

【0096】

【数6】

【0097】

ここで、ＱＰ_anchorは、交点が定義されるＱＰ値である。このようにして、交点は、確率状態の有効範囲（この例では１～１２７）を超えないことがあり、特に勾配が急であるとき、ｙ軸における大きい投影の考慮事項が除去される。図１５Ｄでは、ＳｌｏｐｅＩｄｘは３に等しく、ＱＰ_anchorは３２であり、ＱＰ_anchorにおける交点は７２である。ＱＰ_anchorの他の値は、限定はしないが、８、１６、６４、１２８などを含む。

【0098】

[0105] 線形関数のために代替表現を使用する。上記で説明された例では、ＳｌｉｃｅＱＰ_Yを用いて確率状態をモデル化するために使用される線形関数は、ＨＥＶＣおよび現在のＶＶＣと同じである勾配と交点とのペアによって決定される。このセクションは、線形関数のための代替表現を提案し、ここで、線関数は、２つの異なるＱＰにおける２つの交点によって決定される。勾配／交点表現と比較して、この二重交点表現により、算術シーケンスの形態にないはるかに多い勾配値が可能になるので、適合により多くの柔軟性を与える。

【0099】

[0106] ２つの交点と２つの対応するＱＰとを、それぞれ、ｉｎｔ１、ｉｎｔ２、ＱＰ１およびＱＰ２として示す。ＱＰ１およびＱＰ２は、それらが現在のＶＶＣにおいて定義されている有効範囲（０～６３）内にある限り任意である。しかしながら、ＩｎｉｔＰｒｏｂＳｔａｔｅが、下記のように式（９）または式（１０）によって計算されるので（明確化の簡単のために中間クリッピングおよびシフト動作はここでは考慮されないことに留意されたい。）、

【0100】

【数7】

【0101】

ＱＰ１とＱＰ２との差（difference）は、整数２の累乗であるほうがよく、したがって、式（９）および式（１０）における除算は、右シフトによって置き換えられ得る。

【0102】

[0107] 二重交点表現は、区分的線形関数を決定する複数の交点表現にさらに拡張され得る。１つのそのような一例は、ルーマＳｉｇＦｌａｇからのビンであり、図１６Ａ～図１６Ｃを参照されたく、ここで、転換点は、３０または３１のあたりのＱＰにおいて発生し、勾配／交点のペアまたは二重交点によって決定される直線は、適合のために十分に良好ではない（図１６Ａを参照されたい）。この場合、三重交点表現が提案され、これは、それぞれ、３１に等しいＱＰにおける交点と３１よりも小さいおよびそれよりも大きいＱＰにおける２つの他の交点と（図１６Ｂを参照されたい）の３つの初期化パラメータを使用する。さらにより正確に確率分布を適合させるために、四重交点表現が使用され得、ここで、３７に等しいＱＰにおける交点を表す追加の初期化パラメータが別の小さい転換点を捕捉するために使用される（図１６Ｃを参照されたい）。

【0103】

[0108] より高い中間精度を保つ。上記の例は、式（１）～（３）に修正を導入し、線形領域中でのＩｎｉｔＰｒｏｂＳｔａｔｅを導出する。ＩｎｉｔＰｒｏｂＳｔａｔｅは、ＨＥＶＣレガシーにより依然として７ビットの精度（０～１２７）を有し、式（１１）および（１２）の場合のように現在のＶＶＣにおいて定義されているＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬおよびＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＨの精度と整合させるために３ビットおよび７ビット左シフトされる必要がある。

【0104】

【数8】

【0105】

[0109] 式（４）および（５）の直前の表ルックアップステップがこの技法では節約されることに注意されたい。

【0106】

[0110] ＩｎｉｔＰｒｏｂＳｔａｔｅ（式（３）を参照されたい）を導出するために右シフトを適用し、その後左シフト（式（１１）および（１２）を参照されたい）を適用することは、最後のステップに右シフトのすべて（または部分）を移動することよりも多くの情報を確実に紛失することになり、これは、後者がより高い中間精度を維持するためである。以下の２つの例は、最後のステップに右シフトのすべてを移動する。
一例では、

【0107】

【数9】

【0108】

別の例では、

【0109】

【数10】

【0110】

[0111] ＣＥ１関連：初期化値ごとに４または６ビットを使用するＪＶＥＴ－Ｏ０１９１の簡略化、ＪＶＥＴ－Ｏ０９４６、Ｇｏｔｈｅｎｂｕｒｇ、Ｓｗｅｄｅｎ、２０１９年７月３～１２日（以下、「ＪＶＥＴ－Ｏ０９４６」）は、初期化のための以下の技法を提案する。

【0111】

【数11】

【0112】

[0112] しかしながら、ＪＶＥＴ－Ｏ０９４６で提案される技法は、１つまたは複数の欠点を提示し得る。たとえば、ＪＶＥＴ－Ｏ０９４６で提案される技法は、ある程度の中間精度を失い得る。

【0113】

[0113] 本開示の１つまたは複数の技法によれば、ビデオコーダは、次のように初期化を実行し得る。

【0114】

【数12】

【0115】

[0114] 上記でわかるように、最終ステップ（すなわち、ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬを計算する）まで右シフトを移動することによって、上記の技法は、高い中間精度を可能にする。

【0116】

[0115] ２次領域中での初期化。上記の例は、初期化プロセスの出力が線形領域中での確率状態を表すシナリオのためのものであり得る。しかしながら、いくつかの入力ソースのために、線形領域中でのエントロピーを表すことに対応する、対数領域中での確率を確率状態に表させることが望ましいことがある。対数領域中での表現を達成するために、本開示は、２次領域中での確率状態を使用することを提案する。図１７Ａおよび図１７Ｂは、２次領域ＩｎｉｔＰｒｏｂＳｔａｔｅからＶＶＣの算術コーディングエンジンにおいて使用される線形確率へのマッピングの一例を示し、これは、対数のＩｎｉｔＰｒｏｂＳｔａｔｅのためのマッピングのように見える（図１１Ａ～図１１Ｂを参照されたい）が、乗算によって実装され得る（ある実装によって選好される場合、すべての可能な乗算結果を記憶するＬＵＴが使用のために前もって生成され得ることに留意されたい）。下記は、一例である、

【0117】

【数13】

【0118】

ここで、ｉｎｉｔＩｄは、それぞれ、勾配およびオフセットを表す上位および下位ニブルをもつ初期化値であり、ｉｄｘは、８ビットの精度をもち、０を中心とする確率状態を意味する。

【0119】

[0116] このセクション中で提案される方法が、上記で紹介されたより高い中間精度を使用することと組み合わされ得ることに留意されたい。

【0120】

[0117] 極値確率分布のための初期化。多数のビンは、極値確率分布を有し得、これらのビンがＳｌｉｃｅＱＰ_Yにかかわらず１または０である極めて高い確率を有することを意味する。図１８Ａおよび図１８Ｂは、極値確率分布の例を示すグラフである。

【0121】

[0118] そのような極値確率分布をモデル化するために、勾配は、０である必要があり得、初期確率状態は、ｎのみに依存し得る（式（２）および（７）を参照されたい）。したがって、初期確率状態は、量子化パラメータ（ＱＰ）とともに変化しないことがある。ｎを導出する式は、式（２）または式（７）の場合のように、０および１に接近する確率がいずれも効率的に表されるように設計され得る。以下の例は、確率状態の７ビット表現（０～１２７）に基づき、他の精度に拡張され得る。

【0122】

[0119] 式（２）を一例として取る。０～１５にわたるＯｆｆｓｅｔＩｄｘでは、到達され得るｎの最大値は、１０４であり、確率０．８１８９（すなわち、１０４／１２８）を表し、これは、１．０から離れている。

【0123】

[0120] 「Ｓｉｍｐｌｉｆｉｃａｔｉｏｎｏｆｔｈｅｉｎｉｔｉａｌｉｚａｔｉｏｎｐｒｏｃｅｓｓｆｏｒｃｏｎｔｅｘｔｖａｒｉａｂｌｅｓ」、ＪＶＥＴ－Ｎ０３０１、Ｇｅｎｅｖａ、ＣＨ、２０１９年３月１９～２７日では、ｎは、式（１９）の場合のように、０～７にわたるＯｆｆｓｅｔＩｄｘをもつ１０ビットの精度で導出される。

【0124】

【数14】

【0125】

[0121] ｎのそれの等価な７ビット表現が式（２０）に示される。

【0126】

【数15】

【0127】

ここで、それが達することができる０に最も近い確率は、０．０３１３（０に等しいＯｆｆｓｅｔＩｄｘおよび４に等しいｎ、４／１２８＝０．０３１３）であり、それが達することができる１．０に最も近い確率は、０．９６８８（６に等しいＯｆｆｓｅｔＩｄｘおよび１２４に等しいｎ、１２４／１２８＝０．９６８８）である。しかしながら、そのような近似は、極値確率分布を表すのに十分正確でないことがある。

【0128】

[0122] 本開示の１つまたは複数の技法によれば、ビデオコーダは、初期化パラメータ（たとえば、ｎ）を導出するために以下の式のうちの１つまたは複数を利用し得る。
１．ＯｆｆｓｅｔＩｄｘが３ビット（０～７）である場合、ｎは式（２１）に示されるように導出され得る。

【0129】

【数16】

【0130】

２．ＯｆｆｓｅｔＩｄｘが４ビット（０～１５）である場合、ｎは式（２２）に示されるように導出され得る。

【0131】

【数17】

【0132】

[0123] わかるように、いずれの場合も、ｎは、１および１２７に達することができ、０．００７８（すなわち、１／１２８）および０．９９２２（すなわち、１２７／１２８）の確率が到達され得ることを意味する。そのような確率は、それぞれ、０および１に十分に近似し得る。このようにして、本開示の技法は、ビデオコーダが極値確率分布をより正確に初期化することを可能にし、これは、コーディングされたビデオデータのビットレート（bitrate）を低減し得る。

【0133】

[0124] いくつかの例では、ｍ、ｎ、および／またはｉｎｉｔＳｔａｔｅは、以下の式のうちの１つに従って決定され得る。

【0134】

【数18】

【0135】

[0125] 図４Ａと図４Ｂとは、例示的な４分木２分木（ＱＴＢＴ：quadtree binary tree）構造１３０と、対応するコーディングツリーユニット（ＣＴＵ：coding tree unit）１３２とを示す概念図である。実線は４分木分割を表し、点線は２分木分割を示す。２分木の分割された各（すなわち、非リーフ）ノードにおいて、どの分割タイプ（すなわち、水平または垂直）が使用されるのかを示すために１つのフラグがシグナリングされ、ここで、この例では、０は水平分割を示し、１は垂直分割を示す。４分木分割の場合、４分木ノードは、サイズが等しい４つのサブブロックに、水平および垂直にブロックを分割するので、分割タイプを示す必要がない。したがって、ＱＴＢＴ構造１３０の領域ツリーレベル（すなわち、第１のレベル）（すなわち、実線）についての（分割情報などの）シンタックス要素と、ＱＴＢＴ構造１３０の予測ツリーレベル（すなわち、第２のレベル）（すなわち、破線）についての（分割情報などの）シンタックス要素とを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。ＱＴＢＴ構造１３０の端末リーフノードによって表されるＣＵについての、予測および変換データなどのビデオデータを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。

【0136】

[0126] 概して、図４ＢのＣＴＵ１３２は、第１および第２のレベルにおいてＱＴＢＴ構造１３０のノードに対応するブロックのサイズを定義するパラメータに関連付けられ得る。これらのパラメータは、（サンプル単位でＣＴＵ１３２のサイズを表す）ＣＴＵサイズと、最小４分木サイズ（最小許容４分木リーフノードサイズを表す、ＭｉｎＱＴＳｉｚｅ）と、最大２分木サイズ（最大許容２分木ルートノードサイズを表す、ＭａｘＢＴＳｉｚｅ）と、最大２分木深度（最大許容２分木深度を表す、ＭａｘＢＴＤｅｐｔｈ）と、最小２分木サイズ（最小許容２分木リーフノードサイズを表す、ＭｉｎＢＴＳｉｚｅ）とを含み得る。

【0137】

[0127] ＣＴＵに対応するＱＴＢＴ構造のルートノードは、ＱＴＢＴ構造の第１のレベルにおいて４つの子ノードを有し得、それらの各々は、４分木区分に従って区分され得る。すなわち、第１のレベルのノードは、（子ノードを有しない）リーフノードであるか、あるいは４つの子ノードを有する。ＱＴＢＴ構造１３０の例は、ブランチのために実線を有する親ノードと子ノードとを含むようなノードを表す。第１のレベルのノードは、最大許容２分木ルートノードサイズ（ＭａｘＢＴＳｉｚｅ）よりも大きくない場合、それぞれの２分木によってさらに区分され得る。１つのノードの２分木分割は、分割から得られるノードが最小許容２分木リーフノードサイズ（ＭｉｎＢＴＳｉｚｅ）または最大許容２分木深度（ＭａｘＢＴＤｅｐｔｈ）に到達するまで反復され得る。ＱＴＢＴ構造１３０の例は、ブランチのために破線を有するようなノードを表す。２分木リーフノードは、コーディングユニット（ＣＵ）と呼ばれ、コーディングユニット（ＣＵ）は、それ以上区分することなく、予測（たとえば、イントラピクチャ予測またはインターピクチャ予測）および変換のために使用される。上記で論じられたように、ＣＵは「ビデオブロック」または「ブロック」と呼ばれることもある。

【0138】

[0128] ＱＴＢＴ区分構造の一例では、ＣＴＵサイズは、１２８×１２８（ルーマサンプルおよび２つの対応する６４×６４クロマサンプル）として設定され、ＭｉｎＱＴＳｉｚｅは１６×１６として設定され、ＭａｘＢＴＳｉｚｅは６４×６４として設定され、（幅と高さの両方について）ＭｉｎＢＴＳｉｚｅは４として設定され、ＭａｘＢＴＤｅｐｔｈは４として設定される。４分木リーフノードを生成するために、最初に４分木区分がＣＴＵに適用される。４分木リーフノードは、１６×１６（すなわち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（すなわち、ＣＴＵサイズ）までのサイズを有し得る。４分木リーフノードは、１２８×１２８である場合、サイズがＭａｘＢＴＳｉｚｅ（すなわち、この例では６４×６４）を上回るので、２分木によってそれ以上分割されない。そうでない場合、４分木リーフノードは、２分木によってさらに区分される。したがって、４分木リーフノードはまた、２分木のためのルートノードであり、０としての２分木深度を有する。２分木深度がＭａｘＢＴＤｅｐｔｈ（この例では４）に達したとき、さらなる分割は許可されない。２分木ノードがＭｉｎＢＴＳｉｚｅ（この例では４）に等しい幅を有するとき、それは、さらなる水平分割が許可されないことを暗示する。同様に、ＭｉｎＢＴＳｉｚｅに等しい高さを有する２分木ノードは、その２分木ノードに対してさらなる垂直分割が許されないことを暗示する。上述のように、２分木のリーフノードはＣＵと呼ばれ、それ以上区分することなく予測および変換に従ってさらに処理される。

【0139】

[0129] 図５は、本開示の技法を実行し得る例示的なビデオエンコーダ２００を示すブロック図である。図５は、説明のために提供されるものであり、本開示で広く例示され説明される技法を限定するものと見なされるべきではない。説明の目的で、本開示では、ＨＥＶＣビデオコーディング規格および開発中のＨ．２６６ビデオコーディング規格などのビデオコーディング規格のコンテキストにおいて、ビデオエンコーダ２００について説明する。しかしながら、本開示の技法は、これらのビデオコーディング規格に限定されず、一般的にビデオ符号化および復号に適用可能である。

【0140】

[0130] 図５の例では、ビデオエンコーダ２００は、ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、復号ピクチャバッファ（ＤＰＢ：decoded picture buffer）２１８と、エントロピー符号化ユニット２２０とを含む。ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、ＤＰＢ２１８と、エントロピー符号化ユニット２２０とのいずれかまたはすべては、１つまたは複数のプロセッサまたは処理回路において実装され得る。その上、ビデオエンコーダ２００は、これらおよび他の機能を実行するための追加または代替のプロセッサまたは処理回路を含み得る。

【0141】

[0131] ビデオデータメモリ２３０は、ビデオエンコーダ２００の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオエンコーダ２００は、たとえば、ビデオソース１０４（図１）から、ビデオデータメモリ２３０に記憶されたビデオデータを受信し得る。ＤＰＢ２１８は、ビデオエンコーダ２００による後続のビデオデータの予測において使用するための参照ビデオデータを記憶する参照ピクチャメモリとして働き得る。ビデオデータメモリ２３０およびＤＰＢ２１８は、同期ＤＲＡＭ（ＳＤＲＡＭ）を含むダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスなどの、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ２３０は、図示のように、ビデオエンコーダ２００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

【0142】

[0132] 本開示では、ビデオデータメモリ２３０への言及は、特にそのように説明されない限り、ビデオエンコーダ２００の内部のメモリに限定されるものとして解釈されるべきではなく、または特にそのように説明されない限り、ビデオエンコーダ２００の外部のメモリに限定されるものとして解釈されるべきではない。そうではなく、ビデオデータメモリ２３０への言及は、ビデオエンコーダ２００が符号化のために受信するビデオデータ（たとえば、符号化されるべきである現在のブロックのビデオデータ）を記憶する参照メモリとして理解されたい。図１のメモリ１０６はまた、ビデオエンコーダ２００の様々なユニットからの出力の一時的記憶を提供し得る。

【0143】

[0133] 図５の様々なユニットは、ビデオエンコーダ２００によって実行される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。固定機能回路は、特定の機能を与える回路を指し、実行され得る動作に関してあらかじめ設定される。プログラマブル回路は、様々なタスクを実行するようにプログラムされ得る回路を指し、実行され得る動作中にフレキシブルな機能を与える。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義された方式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が実行する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、１つまたは複数のユニットは集積回路であり得る。

【0144】

[0134] ビデオエンコーダ２００は、プログラマブル回路から形成される論理演算装置（ＡＬＵ）、初等関数ユニット（ＥＦＵ）、デジタル回路、アナログ回路、および／またはプログラマブルコアを含み得る。ビデオエンコーダ２００の動作が、プログラマブル回路によって実行されるソフトウェアを使用して実行される例では、メモリ１０６（図１）は、ビデオエンコーダ２００が受信し実行するソフトウェアのオブジェクトコードを記憶し得るか、またはビデオエンコーダ２００内の別のメモリ（図示されず）が、そのような命令を記憶し得る。

【0145】

[0135] ビデオデータメモリ２３０は、受信されたビデオデータを記憶するように構成される。ビデオエンコーダ２００は、ビデオデータメモリ２３０からビデオデータのピクチャを取り出し、残差生成ユニット２０４とモード選択ユニット２０２とにビデオデータを提供し得る。ビデオデータメモリ２３０中のビデオデータは、符号化されるべきである生のビデオデータであり得る。

【0146】

[0136] モード選択ユニット２０２は、動き推定ユニット２２２と、動き補償ユニット２２４と、イントラ予測ユニット２２６とを含む。モード選択ユニット２０２は、他の予測モードに従ってビデオ予測を実行するための追加の機能ユニットを含み得る。例として、モード選択ユニット２０２は、パレットユニット、（動き推定ユニット２２２および/または動き補償ユニット２２４の一部であり得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。

【0147】

[0137] モード選択ユニット２０２は、概して、符号化パラメータの組合せをテストするために複数の符号化パスを協調させ、そのような組合せのためのレートひずみ値を生じる。符号化パラメータは、ＣＵへのＣＴＵの区分、ＣＵのための予測モード、ＣＵの残差データのための変換タイプ、ＣＵの残差データのための量子化パラメータなどを含み得る。モード選択ユニット２０２は、他のテストされた組合せよりも良好であるレートひずみ値を有する符号化パラメータの組合せを最終的に選択し得る。

【0148】

[0138] ビデオエンコーダ２００は、一連のＣＴＵにビデオデータメモリ２３０から取り出されたピクチャを区分し、スライス内の１つまたは複数のＣＴＵをカプセル化し得る。モード選択ユニット２０２は、上で説明されたＨＥＶＣのＱＴＢＴ構造または４分木構造などの木構造に従ってピクチャのＣＴＵを区分し得る。上で説明されたように、ビデオエンコーダ２００は、木構造に従ってＣＴＵを区分することから１つまたは複数のＣＵを形成し得る。そのようなＣＵは、一般に「ビデオブロック」または「ブロック」と呼ばれることもある。

【0149】

[0139] 概して、モード選択ユニット２０２はまた、現在のブロック（たとえば、現在のＣＵまたはＨＥＶＣでは、ＰＵおよびＴＵの重複部分）のための予測ブロックを生成するためにそれの構成要素（たとえば、動き推定ユニット２２２、動き補償ユニット２２４、およびイントラ予測ユニット２２６）を制御する。現在のブロックのインター予測のために、動き推定ユニット２２２は、１つまたは複数の参照ピクチャ（たとえば、ＤＰＢ２１８に記憶されている１つまたは複数の以前のコーディングされたピクチャ）の中で１つまたは複数の厳密に一致する参照ブロックを特定するために動き探索を実行し得る。特に、動き推定ユニット２２２は、たとえば、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）などに従って、現在のブロックに対して潜在的な参照ブロックがどのくらい類似しているかを表す値を計算し得る。動き推定ユニット２２２は、一般に、現在のブロックと考慮されている参照ブロックとの間のサンプルごとの差分を使用してこれらの計算を実行し得る。動き推定ユニット２２２は、現在のブロックに最も厳密に一致する参照ブロックを示す、これらの計算から得られた最も低い値を有する参照ブロックを識別し得る。

【0150】

[0140] 動き推定ユニット２２２は、現在のピクチャ中の現在のブロックの位置に対して参照ピクチャ中の参照ブロックの位置を定義する１つまたは複数の動きベクトル（ＭＶ：motion vector）を形成し得る。動き推定ユニット２２２は、次いで、動きベクトルを動き補償ユニット２２４に提供し得る。たとえば、単方向インター予測では、動き推定ユニット２２２は、単一の動きベクトルを提供し得るが、双方向インター予測では、動き推定ユニット２２２は、２つの動きベクトルを提供し得る。動き補償ユニット２２４は、次いで、動きベクトルを使用して予測ブロックを生成し得る。たとえば、動き補償ユニット２２４は、動きベクトルを使用して参照ブロックのデータを取り出し得る。別の例として、動きベクトルが部分サンプル精度を有する場合、動き補償ユニット２２４は、１つまたは複数の補間フィルタに従って予測ブロックの値を補間し得る。その上、双方向インター予測の場合、動き補償ユニット２２４は、それぞれの動きベクトルによって特定される２つの参照ブロックのためのデータを取り出し、たとえば、サンプルごとの平均化または重み付け平均化を通じて、取り出されたデータを組み合わせ得る。

【0151】

[0141] 別の例として、イントラ予測、またはイントラ予測コーディングのために、イントラ予測ユニット２２６は、現在のブロックに隣接しているサンプルから予測ブロックを生成し得る。たとえば、方向性モードでは、イントラ予測ユニット２２６は、隣接サンプルの値を概して数学的に組み合わせ、現在のブロックにわたって規定の方向にこれらの計算された値をポピュレートして、予測ブロックを生成し得る。別の例として、ＤＣモードでは、イントラ予測ユニット２２６は、現在のブロックに対する隣接サンプルの平均を計算し、予測ブロックのサンプルごとにこの得られた平均を含むように予測ブロックを生成し得る。

【0152】

[0142] モード選択ユニット２０２は、予測ブロックを残差生成ユニット２０４に提供する。残差生成ユニット２０４は、ビデオデータメモリ２３０から現在のブロックの未加工の、コーディングされていないバージョンを受信し、モード選択ユニット２０２から予測ブロックを受信する。残差生成ユニット２０４は、現在のブロックと予測ブロックとの間のサンプルごとの差を計算する。得られたサンプルごとの差分は、現在のブロックのための残差ブロックを定義する。いくつかの例では、残差生成ユニット２０４はまた、残差差分パルスコード変調（ＲＤＰＣＭ：residual differential pulse code modulation）を使用して残差ブロックを生成するために残差ブロック中のサンプル値の間の差を決定し得る。いくつかの例では、残差生成ユニット２０４は、バイナリ減算を実行する１つまたは複数の減算器回路を使用して形成され得る。

【0153】

[0143] モード選択ユニット２０２がＣＵをＰＵに区分する例では、各ＰＵは、ルーマ予測ユニットと対応するクロマ予測ユニットとに関連付けられ得る。ビデオエンコーダ２００とビデオデコーダ３００とは、様々なサイズを有するＰＵをサポートし得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指すことがあり、ＰＵのサイズは、ＰＵのルーマ予測ユニットのサイズを指すことがある。特定のＣＵのサイズが２Ｎ×２Ｎであると想定すると、ビデオエンコーダ２００は、イントラ予測について２Ｎ×２ＮまたはＮ×ＮというＰＵサイズと、インター予測について２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、または類似の対称的なＰＵサイズとをサポートし得る。ビデオエンコーダ２００とビデオデコーダ３００とはまた、インター予測のための２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズの非対称的区分をサポートし得る。

【0154】

[0144] モード選択ユニットがＣＵをＰＵにさらに区分しない例では、各ＣＵは、ルーマコーディングブロックと、対応するクロマコーディングブロックとに関連付けられ得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し得る。ビデオエンコーダ２００とビデオデコーダ３００とは、２Ｎ×２Ｎ、２Ｎ×Ｎ、またはＮ×２ＮのＣＵサイズをサポートし得る。

【0155】

[0145] いくつかの例として、イントラブロックコピーモードコーディング、アフィンモードコーディング、および線形モデル（ＬＭ）モードコーディングなどの他のビデオコーディング技法の場合、モード選択ユニット２０２は、コーディング技法に関連するそれぞれのユニットを介して、符号化されている現在のブロックのための予測ブロックを生成する。パレットモードコーディングなどのいくつかの例では、モード選択ユニット２０２は、予測ブロックを生成しなくてよく、代わりに、選択されたパレットに基づいてブロックを再構成するための方式を示すシンタックス要素を生成し得る。そのようなモードでは、モード選択ユニット２０２は、符号化されるべきこれらのシンタックス要素をエントロピー符号化ユニット２２０に提供し得る。

【0156】

[0146] 上記で説明したように、残差生成ユニット２０４は、現在のブロックに対するビデオデータと、対応する予測ブロックとを受信する。残差生成ユニット２０４は、次いで、現在のブロックに対する残差ブロックを生成する。残差ブロックを生成するために、残差生成ユニット２０４は、予測ブロックと現在のブロックとの間のサンプルごとの差分を計算する。

【0157】

[0147] 変換処理ユニット２０６は、（本明細書では「変換係数ブロック（transform coefficient block）」と呼ぶ）変換係数のブロックを生成するために残差ブロックに１つまたは複数の変換を適用する。変換処理ユニット２０６は、変換係数ブロックを形成するために、残差ブロックに様々な変換を適用し得る。たとえば、変換処理ユニット２０６は、離散コサイン変換（ＤＣＴ）、方向変換、カルーネンレーベ変換（ＫＬＴ）、または概念的に同様の変換を残差ブロックに適用し得る。いくつかの例では、変換処理ユニット２０６は、残差ブロックに複数の変換、たとえば、回転変換など１次変換および２次変換を実行し得る。いくつかの例では、変換処理ユニット２０６は、残差ブロックに変換を適用しない。

【0158】

[0148] 量子化ユニット２０８は、量子化変換係数ブロックを生成するために変換係数ブロック中の変換係数を量子化し得る。量子化ユニット２０８は、現在のブロックと関連付けられる量子化パラメータ（ＱＰ）値に従って変換係数ブロックの変換係数を量子化し得る。ビデオエンコーダ２００は、（たとえば、モード選択ユニット２０２を介して）ＣＵに関連するＱＰ値を調整することによって現在のブロックに関連する変換係数ブロックに適用される量子化の程度を調整し得る。量子化は情報の損失をもたらし得、したがって、量子化変換係数は、変換処理ユニット２０６によって生成された元の変換係数よりも低い精度を有し得る。

【0159】

[0149] 逆量子化ユニット２１０および逆変換処理ユニット２１２は、変換係数ブロックから残差ブロックを再構築するために、それぞれ、量子化変換係数ブロックに逆量子化および逆変換を適用し得る。再構築ユニット２１４は、再構築された残差ブロックとモード選択ユニット２０２によって生成された予測ブロックとに基づいて（潜在的にある程度のひずみを伴うが）現在のブロックに対応する再構築されたブロックを生成し得る。たとえば、再構築ユニット２１４は、再構築されたブロックを生成するために、モード選択ユニット２０２によって生成された予測ブロックからの対応するサンプルに、再構築された残差ブロックのサンプルを加算し得る。

【0160】

[0150] フィルタユニット２１６は、再構築されたブロックに対して１つまたは複数のフィルタ演算を実行し得る。たとえば、フィルタユニット２１６は、ＣＵのエッジに沿ってブロッキネスアーティファクト（blockiness artifact）を低減するためのデブロッキング動作を実行し得る。フィルタユニット２１６の動作は、いくつかの例では、スキップされ得る。

【0161】

[0151] ビデオエンコーダ２００は、ＤＰＢ２１８中に再構築されたブロックを記憶する。たとえば、フィルタユニット２１６の動作が必要とされない例において、再構築ユニット２１４は、再構築されたブロックをＤＰＢ２１８に記憶し得る。フィルタユニット２１６の動作が必要とされる例では、フィルタユニット２１６は、フィルタリングされた再構築されたブロックをＤＰＢ２１８に記憶し得る。動き推定ユニット２２２および動き補償ユニット２２４は、後で符号化されるピクチャのブロックをインター予測するために、再構築（および潜在的にフィルタリング）されたブロックから形成された参照ピクチャをＤＰＢ２１８から取り出し得る。加えて、イントラ予測ユニット２２６は、現在のピクチャの中の他のブロックをイントラ予測するために、現在のピクチャのＤＰＢ２１８の中の再構築されたブロックを使用し得る。

【0162】

[0152] 概して、エントロピー符号化ユニット２２０は、ビデオエンコーダ２００の他の機能構成要素から受信されたシンタックス要素をエントロピー符号化し得る。たとえば、エントロピー符号化ユニット２２０は、量子化ユニット２０８からの量子化された変換係数ブロックをエントロピー符号化し得る。別の例として、エントロピー符号化ユニット２２０は、モード選択ユニット２０２からの予測シンタックス要素（たとえば、インター予測のための動き情報またはイントラ予測のためのイントラモード情報）をエントロピー符号化し得る。エントロピー符号化ユニット２２０は、エントロピー符号化されたデータを生成するためにビデオデータの別の例であるシンタックス要素に対して１つまたは複数のエントロピー符号化動作を実行し得る。たとえば、エントロピー符号化ユニット２２０は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）動作、ＣＡＢＡＣ動作、可変対可変（Ｖ２Ｖ：variable-to-variable）長コーディング動作、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）動作、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング動作、指数ゴロム符号化動作（Exponential-Golomb encoding operation）、または別のタイプのエントロピー符号化動作をデータに対して実行し得る。いくつかの例では、エントロピー符号化ユニット２２０は、シンタックス要素がエントロピー符号化されないバイパスモードで動作し得る。

【0163】

[0153] 図６は、本開示の技法による、ＣＡＢＡＣを実行するように構成され得る例示的なエントロピー符号化ユニット２２０のブロック図である。シンタックス要素１１８０がエントロピー符号化ユニット２２０に入力される。シンタックス要素がすでにバイナリ値シンタックス要素（たとえば、フラグ、または０および１の値のみを有する他のシンタックス要素）である場合、２値化のステップはスキップされ得る。シンタックス要素が非バイナリ値シンタックス要素（たとえば、１または０以外の値を有し得るシンタックス要素）である場合、非バイナリ値シンタックス要素はバイナライザ（binarizer）１２００によって２値化される。バイナライザ１２００は、バイナリ決定のシーケンスへの非バイナリ値シンタックス要素のマッピングを実行する。これらのバイナリ決定は、しばしば「ビン」と呼ばれる。たとえば、変換係数レベルでは、レベルの値は連続するビンに分けられ得、各ビンは、係数レベルの絶対値がある値よりも大きいか否かを示す。たとえば、（有意性フラグと呼ばれることがある）ビン０は、変換係数レベルの絶対値が０よりも大きいか否かを示す。ビン１は、変換係数レベルの絶対値が１よりも大きいか否かを示す、などである。各非バイナリ値シンタックス要素について、一意のマッピングが作成され得る。

【0164】

[0154] バイナライザ１２００によって生成された各ビンは、エントロピー符号化ユニット２２０のバイナリ算術コーディング側に供給される。すなわち、非バイナリ値シンタックス要素の所定のセットについて、各ビンタイプ（たとえば、ビン０）が次のビンタイプ（たとえば、ビン１）の前にコーディングされる。コーディングは、通常モード（regular mode）またはバイパスモード（bypass mode）のいずれかで実行され得る。バイパスモードでは、バイパス符号化エンジン１２６０が、固定確率モデルを使用して、たとえば、ゴロム－ライスまたは指数ゴロムコーディングを使用して、算術コーディングを実行する。バイパスモードは、概して、より予測可能なシンタックス要素のために使用される。

【0165】

[0155] 通常モードでのコーディングは、ＣＡＢＡＣを実行することを伴う。正規モードＣＡＢＡＣは、ビンの値の確率が、前にコーディングされたビンの値を与えられれば予測可能である場合に、ビン値をコーディングするためのものである。ビンがＬＰＳである確率がコンテキストモデラ（context modeler）１２２０によって決定される。コンテキストモデラ１２２０は、ビン値とコンテキストのための確率状態（たとえば、ＬＰＳの値と、ＬＰＳが発生する確率とを含む確率状態σ）とを出力する。コンテキストは、一連のビンのための初期コンテキストであり得るか、または前にコーディングされたビンのコード化値に基づいて決定され得る。上記で説明されたように、コンテキストモデラ１２２０は、受信されたビンがＭＰＳであったのかＬＰＳであったのか否かに基づいて状態を更新し得る。コンテキストおよび確率状態σがコンテキストモデラ１２２０によって決定された後、通常符号化エンジン１２４０はビン値に対してＢＡＣを実行する。

【0166】

[0156] 図５に戻ると、ビデオエンコーダ２００は、スライスまたはピクチャのブロックを再構築するために必要なエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。特に、エントロピー符号化ユニット２２０がビットストリームを出力し得る。

【0167】

[0157] 上記で説明された動作について、ブロックに関して説明する。そのような説明は、ルーマコーディングブロックおよび/またはクロマコーディングブロックのための動作であるものとして理解されるべきである。上で説明されたように、いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、ＣＵのルーマ成分およびクロマ成分である。いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、ＰＵのルーマおよびクロマ成分である。

【0168】

[0158] いくつかの例では、ルーマコーディングブロックに関して実行される動作は、クロマコーディングブロックのために繰り返される必要はない。一例として、ルーマコーディングブロックのための動きベクトル（ＭＶ）と参照ピクチャとを識別するための動作は、クロマブロックのためのＭＶと参照ピクチャとを識別するために繰り返される必要はない。むしろ、ルーマコーディングブロックのためのＭＶは、クロマブロックのためのＭＶを決定するためにスケーリングされ得、参照ピクチャは同じであり得る。別の例として、イントラ予測プロセスは、ルーマコーディングブロックとクロマコーディングブロックとに対して同じであり得る。

【0169】

[0159] ビデオエンコーダ２００は、ビデオデータを記憶するように構成されたメモリと、回路中に実装された１つまたは複数の処理ユニットとを含むビデオデータを符号化するように構成されたデバイスの一例を表し、１つまたは複数の処理ユニットは、ビデオデータのスライス中のシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義されたスロープインデックス（たとえば、ＳｌｏｐｅＩｄｘ）とあらかじめ定義されたオフセットインデックス（たとえば、ＯｆｆｓｅｔＩｄｘ）とを取得することと、あらかじめ定義されたスロープインデックスとあらかじめ定義されたオフセットインデックスとに基づいて、ビデオデータのスライスのためのコンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピー符号化することとを行うように構成される。

【0170】

[0160] 図７は、本開示の技法を実行し得る例示的なビデオデコーダ３００を示すブロック図である。図７は、説明を目的に提供されるものであり、本開示において広く例示され説明される技法を限定するものではない。説明の目的で、本開示では、ＪＥＭと、ＶＶＣと、ＨＥＶＣとの技法に従ってビデオデコーダ３００について説明する。しかしながら、本開示の技法は、他のビデオコーディング規格に構成されたビデオコーディングデバイスによって実行され得る。

【0171】

[0161] 図７の例では、ビデオデコーダ３００は、コード化ピクチャバッファ（ＣＰＢ：coded picture buffer）メモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、復号ピクチャバッファ（ＤＰＢ）３１４とを含む。ＣＰＢメモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、ＤＰＢ３１４とのいずれかまたはすべては、１つまたは複数のプロセッサまたは処理回路において実装され得る。その上、ビデオデコーダ３００は、これらおよび他の機能を実行するために、追加または代替のプロセッサもしくは処理回路を含み得る。

【0172】

[0162] 予測処理ユニット３０４は、動き補償ユニット３１６と、イントラ予測ユニット３１８とを含む。予測処理ユニット３０４は、他の予測モードに従って予測を実行するための追加のユニットを含み得る。例として、予測処理ユニット３０４は、パレットユニット、（動き補償ユニット３１６の一部を形成し得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。他の例では、ビデオデコーダ３００は、より多数の、より少数の、または異なる機能構成要素を含み得る。

【0173】

[0163] ＣＰＢメモリ３２０は、ビデオデコーダ３００の構成要素によって復号されるべき、符号化ビデオビットストリームなどのビデオデータを記憶し得る。ＣＰＢメモリ３２０に記憶されるビデオデータは、たとえば、コンピュータ可読媒体１１０（図１）から取得され得る。ＣＰＢメモリ３２０は、符号化されたビデオビットストリームからの符号化されたビデオデータ（たとえば、シンタックス要素）を記憶するＣＰＢを含み得る。また、ＣＰＢメモリ３２０は、ビデオデコーダ３００の様々なユニットからの出力を表す一時データなど、コーディングされたピクチャのシンタックス要素以外のビデオデータを記憶し得る。ＤＰＢ３１４は、一般に、ビデオデコーダ３００が符号化されたビデオビットストリームの後続のデータまたはピクチャを復号するときに出力しおよび/または参照ビデオデータとして使用し得る復号されたピクチャを記憶する。ＣＰＢメモリ３２０およびＤＰＢ３１４は、同期ＤＲＡＭ（ＳＤＲＡＭ）を含むダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ）、または他のタイプのメモリデバイスなどの、様々なメモリデバイスのいずれかによって形成され得る。ＣＰＢメモリ３２０およびＤＰＢ３１４は、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ＣＰＢメモリ３２０は、ビデオデコーダ３００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

【0174】

[0164] 追加または代替として、いくつかの例では、ビデオデコーダ３００は、メモリ１２０（図１）からコード化ビデオデータを取り出し得る。すなわち、メモリ１２０は、ＣＰＢメモリ３２０を用いて上記で論じられたデータを記憶し得る。同様に、メモリ１２０は、ビデオデコーダ３００の機能の一部または全部が、ビデオデコーダ３００の処理回路によって実行されるべきソフトウェアにおいて実装されたとき、ビデオデコーダ３００によって実行されるべき命令を記憶し得る。

【0175】

[0165] 図７に示されている様々なユニットは、ビデオデコーダ３００によって実行される動作を理解するのを支援するために図示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。図５と同様に、固定機能回路は、特定の機能を与える回路を指し、実行され得る動作にあらかじめ設定される。プログラマブル回路は、様々なタスクを実施するように、および実施され得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義される様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が実行する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、１つまたは複数のユニットは集積回路であり得る。

【0176】

[0166] ビデオデコーダ３００は、プログラマブル回路から形成されるＡＬＵ、ＥＦＵ、デジタル回路、アナログ回路、および／またはプログラマブルコアを含み得る。ビデオデコーダ３００の動作がプログラマブル回路上で実行されるソフトウェアによって実行される例では、オンチップまたはオフチップメモリは、ビデオデコーダ３００が受信し、実行するソフトウェアの命令（たとえば、オブジェクトコード）を記憶し得る。

【0177】

[0167] エントロピー復号ユニット３０２は、ＣＰＢから符号化されたビデオデータを受信し、シンタックス要素を再生するためにビデオデータをエントロピー復号し得る。予測処理ユニット３０４、逆量子化ユニット３０６、逆変換処理ユニット３０８、再構成ユニット３１０、およびフィルタユニット３１２は、ビットストリームから抽出されるシンタックス要素に基づいて復号されたビデオデータを生成し得る。

【0178】

[0168] 図８は、本開示の技法による、ＣＡＢＡＣを実行するように構成され得る例示的なエントロピー復号ユニット３０２のブロック図である。図８のエントロピー復号ユニット３０２は、図６で説明されたエントロピー符号化ユニット２２０の様式とは逆の様式でＣＡＢＡＣを実行する。ビットストリーム２１８０からのコード化ビットがエントロピー復号ユニット３０２に入力される。コード化ビットは、それらが通常モードを使用してエントロピーコーディングされたのかまたはバイパスモードを使用してエントロピーコーディングされたのかに基づいてコンテキストモデラ２２００またはバイパス復号エンジン２２２０のいずれかに供給される。コード化ビットがバイパスモードでコーディングされた場合、バイパス復号エンジンは、たとえば、バイナリ値シンタックス要素または非バイナリシンタックス要素のビンを取り出す（retrieve）ために、ゴロム－ライスまたは指数ゴロム復号を使用することになる。

【0179】

[0169] コード化ビットが通常モードでコーディングされた場合、コンテキストモデラ２２００はコード化ビットのための確率モデルを決定し得、通常復号エンジン２２４０は、非バイナリ値シンタックス要素のビン（または、バイナリ値の場合、シンタックス要素自体）を生成するためにコード化ビットを復号し得る。コンテキストおよび確率状態σがコンテキストモデラ２２００によって決定された後、通常復号エンジン２２４０は、ビン値を復号するためにＢＡＣを実行する。言い換えれば、通常復号エンジン２２４０は、コンテキストの確率状態を決定し、前にコーディングされたビンと現在の範囲とに基づいてビン値を復号し得る。ビンを復号した後、コンテキストモデラ２２００は、ウィンドウサイズと復号されたビンの値とに基づいてコンテキストの確率状態を更新し得る。

【0180】

[0170] 図７に戻ると、概して、ビデオデコーダ３００は、ブロックごとにピクチャを再構築する。ビデオデコーダ３００は、各ブロックに対して個々に再構築演算を実行し得る（ここで、現在再構築されているブロック、すなわち、現在復号されているブロックは、「現在のブロック（current block）」と呼ばれることがある）。

【0181】

[0171] エントロピー復号ユニット３０２は、量子化変換係数ブロックの量子化変換係数を定義するシンタックス要素ならびに量子化パラメータ（ＱＰ）および／または変換モード指示などの変換情報をエントロピー復号し得る。逆量子化ユニット３０６は、量子化の程度を決定するために、また同様に、逆量子化ユニット３０６が適用すべき逆量子化の程度を決定するために、量子化された変換係数ブロックと関連付けられるＱＰを使用し得る。逆量子化ユニット３０６は、たとえば、量子化された変換係数を逆量子化するためにビット単位の左シフト演算を実行し得る。逆量子化ユニット３０６は、それによって、変換係数を含む変換係数ブロックを形成し得る。

【0182】

[0172] 逆量子化ユニット３０６が変換係数ブロックを形成した後に、逆変換処理ユニット３０８は、現在のブロックに関連する残差ブロックを生成するために変換係数ブロックに１つまたは複数の逆変換を適用し得る。たとえば、逆変換処理ユニット３０８は、逆ＤＣＴ、逆整数変換、逆カルーネンレーベ変換（ＫＬＴ）、逆回転変換、逆方向変換、または別の逆変換を変換係数ブロックに適用し得る。

【0183】

[0173] さらに、予測処理ユニット３０４は、エントロピー復号ユニット３０２によってエントロピー復号された予測情報シンタックス要素に従って予測ブロックを生成する。たとえば、現在のブロックがインター予測されることを予測情報シンタックス要素が示す場合、動き補償ユニット３１６は予測ブロックを生成し得る。この場合、予測情報シンタックス要素は、参照ブロックを取り出すＤＰＢ３１４中の参照ピクチャ、ならびに現在のピクチャ中の現在のブロックのロケーションに対する参照ピクチャ中の参照ブロックのロケーションを識別する動きベクトルを示し得る。動き補償ユニット３１６は、概して、動き補償ユニット２２４（図５）に関して説明された方式と実質的に同様である方式でインター予測プロセスを実行し得る。

【0184】

[0174] 別の例として、予測情報シンタックス要素が、現在のブロックがイントラ予測されることを示す場合、イントラ予測ユニット３１８は、予測情報シンタックス要素によって示されるイントラ予測モードに従って予測ブロックを生成し得る。この場合も、イントラ予測ユニット３１８は、概して、イントラ予測ユニット２２６（図５）に関して説明されたのと実質的に同様である様式でイントラ予測プロセスを実行し得る。イントラ予測ユニット３１８は、ＤＰＢ３１４から、現在のブロックに対する隣接サンプルのデータを取り出し得る。

【0185】

[0175] 再構築ユニット３１０は、予測ブロックと残差ブロックとを使用して現在のブロックを再構築し得る。たとえば、再構築ユニット３１０は、現在のブロックを再構築するために、予測ブロックの対応するサンプルに残差ブロックのサンプルを加算し得る。

【0186】

[0176] フィルタユニット３１２は、再構築されたブロックに対して１つまたは複数のフィルタ動作を実行し得る。たとえば、フィルタユニット３１２は、再構築されたブロックの端部に沿ってブロッキネスアーティファクトを低減するためにデブロッキング動作を実行し得る。フィルタユニット３１２の動作は、必ずしもすべての例で実行されるとは限らない。

【0187】

[0177] ビデオデコーダ３００は、ＤＰＢ３１４中に再構築されたブロックを記憶し得る。たとえば、フィルタユニット３１２の動作が実行されない例において、再構築ユニット３１０は、再構築されたブロックをＤＰＢ３１４に記憶し得る。フィルタユニット３１２の動作が実行される例では、フィルタユニット３１２は、フィルタ処理された再構築されたブロックをＤＰＢ３１４に記憶し得る。上記で論じられたように、ＤＰＢ３１４は、イントラ予測のための現在のピクチャのサンプルおよび後続の動き補償のための以前に復号されたピクチャなど、参照情報を予測処理ユニット３０４に提供し得る。その上、ビデオデコーダ３００は、ＤＰＢからの復号ピクチャを、後続のプレゼンテーションのために、図１のディスプレイデバイス１１８などのディスプレイデバイス上に出力し得る。

【0188】

[0178] このようにして、ビデオデコーダ３００は、ビデオデータを記憶するように構成されたメモリと、回路中に実装された１つまたは複数の処理ユニットとを含むビデオ復号デバイスの一例を表し、１つまたは複数の処理ユニットは、ビデオデータのスライス中のシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義されたスロープインデックス（たとえば、ＳｌｏｐｅＩｄｘ）とあらかじめ定義されたオフセットインデックス（たとえば、ＯｆｆｓｅｔＩｄｘ）とを取得することと、あらかじめ定義されたスロープインデックスとあらかじめ定義されたオフセットインデックスとに基づいて、ビデオデータのスライスのためのコンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピー復号することとを行うように構成される。

【0189】

[0179] 図１９は、現在のブロックを符号化するための例示的な方法を示すフローチャートである。現在のブロックは現在のＣＵを備え得る。ビデオエンコーダ２００（図１および図５）に関して説明されるが、他のデバイスが図１９の方法と同様の方法を実行するように構成され得ることを理解されたい。

【0190】

[0180] この例では、ビデオエンコーダ２００は、最初に、現在のブロックを予測する（３５０）。たとえば、ビデオエンコーダ２００は、現在のブロックのための予測ブロックを形成し得る。ビデオエンコーダ２００は、次いで、現在のブロックのための残差ブロックを計算し得る（３５２）。残差ブロックを計算するために、ビデオエンコーダ２００は、元のコーディングされていないブロックと、現在のブロックのための予測ブロックとの間の差分（difference）を計算し得る。ビデオエンコーダ２００は、次いで、残差ブロックの係数を変換および量子化し得る（３５４）。次に、ビデオエンコーダ２００は、残差ブロックの量子化された変換係数を走査する（３５６）。走査の間、または走査に続いて、ビデオエンコーダ２００は、係数をエントロピー符号化し得る（３５８）。たとえば、ビデオエンコーダ２００は、図２０を参照しながら上記で説明された確率初期化のための技法を使用してＣＡＶＬＣまたはＣＡＢＡＣを使用して係数および／または他のシンタックス要素を符号化し得る。次いで、ビデオエンコーダ２００は、ブロックのエントロピーコーディングされたデータを出力し得る（３６０）。

【0191】

[0181] 図２０は、本開示の１つまたは複数の技法による、コンテキストベースのエントロピー符号化を実行するための例示的なプロセスを示すフローチャートである。図２０の技法は、図１、図５、および図６に示されたビデオエンコーダ２００などのビデオエンコーダによって実行され得る。説明の目的で、図２０の技法は、図１、図５、および図６のビデオエンコーダ２００のコンテキスト内で説明されるが、ビデオエンコーダ２００の構成とは異なる構成を有するビデオエンコーダが図２０の技法を実行し得る。

【0192】

[0182] ビデオエンコーダ２００は、コンテキストベースのエントロピーコーディング（たとえば、ＣＡＢＡＣ）を使用して符号化されるべきビンストリング（たとえば、１次元バイナリベクトル（one-dimensional binary vector））を取得し得る（２００２）。たとえば、ビデオエンコーダ２００のエントロピー符号化ユニット２２０は、ビデオエンコーダ２００のモード選択ユニット２０２から受信されたシンタックス要素を２値化することによってビンストリングを取得し得る。

【0193】

[0183] ビデオエンコーダ２００は、複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得し得る（２００４）。たとえば、ビデオエンコーダ２００のエントロピー符号化ユニット２２０は、６ビットの変数であり得るｉｎｉｔＶａｌｕｅの値を取得し得る。

【0194】

[0184] ビデオエンコーダ２００は、あらかじめ定義された初期化値に基づいて、線形領域中でのビデオデータの独立してコード化可能なユニット（たとえば、スライス、タイルなど）のためのコンテキストの初期確率状態を決定し得る（２００６）。たとえば、エントロピー符号化ユニット２２０は、対数領域中でのコンテキストの初期確率状態を中間で決定することなしに線形領域中でのコンテキストの初期確率状態を決定し得る。いくつかの例では、エントロピー符号化ユニット２２０は、対数領域から線形領域に初期確率状態を変換するためにＬＵＴを使用せずに初期確率状態を決定し得る。

【0195】

[0185] 初期確率状態を決定するために、エントロピー符号化ユニット２２０は、独立してコード化可能なユニットに関連する量子化パラメータの初期値（たとえば、ＳｌｉｃｅＱＰ_Y）を取得し、０でない量子化パラメータアンカーポイント（quantization parameter anchor point）の値（たとえば、ＱＰ_anchor）を取得し得る。エントロピー符号化ユニット２２０は、スライスのための量子化パラメータの初期値と量子化パラメータアンカーポイントの値との間の差に基づいて初期確率状態を決定し得る。たとえば、エントロピー符号化ユニット２２０は、以下の式に従って初期確率状態を決定し得る

【0196】

【数19】

【0197】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、量子化パラメータの初期値であり、ＱＰ_anchorは、量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値（right shift value）である。

【0198】

[0186] 上記で説明されたように、いくつかの例では、エントロピー符号化ユニット２２０は、極値確率分布のための増加した精度で初期化を実行するように構成され得る。たとえば、エントロピー符号化ユニット２２０は、あらかじめ定義された初期化値に基づいて、スロープインデックス値（slope index value）とオフセットインデックス値（offset index value）とを決定し得る。エントロピー符号化ユニット２２０は、スロープインデックス値に基づいて、ｍの値を決定し、オフセットインデックス値に基づいて、ｎの値を決定し得る。いくつかの例では、エントロピー符号化ユニット２２０は、式ｎ＝（ＯｆｆｓｅｔＩｄｘ＊１８）＋１に従ってｎの値を決定し得、ここで、ＯｆｆｓｅｔＩｄｘは、オフセットインデックス値である。上記のように、いくつかの例では、エントロピー符号化ユニット２２０は、ｍの値とｎの値とに基づいて初期確率状態を決定し得る。

【0199】

[0187] ビデオエンコーダ２００は、ビデオビットストリーム中で、コンテキストの初期確率状態に基づいて、ビンストリングのビンを符号化し得る（２００８）。たとえば、エントロピー符号化ユニット２２０は、コンテキストの最終コード化確率間隔内の確率に対する値またはポインタを表すバイナリストリームを出力し得る。

【0200】

[0188] 図２１は、ビデオデータの現在のブロックを復号するための例示的な方法を示すフローチャートである。現在のブロックは現在ＣＵを備え得る。ビデオデコーダ３００（図１および図７）に関して説明されるが、他のデバイスが図２１の方法と同様の方法を実行するように構成され得ることを理解されたい。

【0201】

[0189] ビデオデコーダ３００は、エントロピーコーディングされた予測情報、および現在のブロックに対応する残差ブロックの係数に対するエントロピーコーディングされたデータなどの、現在のブロックに対するエントロピーコーディングされたデータを受信し得る（３７０）。ビデオデコーダ３００は、現在のブロックに対する予測情報を決定し残差ブロックの係数を再生するために、エントロピーコーディングされたデータをエントロピー復号し得る（３７２）。たとえば、ビデオデコーダ３００は、図２２を参照しながら上記で説明された確率初期化のための技法を使用してＣＡＶＬＣまたはＣＡＢＡＣを使用して係数および／または他のシンタックス要素を復号し得る。ビデオデコーダ３００は、現在のブロックのための予測ブロックを計算するために、たとえば、現在のブロックのための予測情報によって示されるイントラ予測またはインター予測モードを使用して、現在のブロックを予測し得る（３７４）。ビデオデコーダ３００は、次いで、量子化された変換係数のブロックを作成するために、再生された係数を逆走査し得る（３７６）。ビデオデコーダ３００は、次いで、残差ブロックを生成するために係数を逆量子化し、逆変換し得る（３７８）。ビデオデコーダ３００は、予測ブロックと残差ブロックとを組み合わせることによって、最終的に現在のブロックを復号し得る（３８０）。

【0202】

[0190] 図２２は、本開示の１つまたは複数の技法による、コンテキストベースのエントロピー復号を実行するための例示的なプロセスを示すフローチャートである。図２２の技法は、図１、図７、および図８に示されたビデオデコーダ３００などのビデオデコーダによって実行され得る。説明の目的で、図２２の技法は、図１、図７、および図８のビデオデコーダ３００のコンテキスト内で説明されるが、ビデオデコーダ３００の構成とは異なる構成を有するビデオデコーダが図２２の技法を実行し得る。

【0203】

[0191] ビデオデコーダ３００は、ビデオビットストリームから、コンテキストベースのエントロピーコーディングを使用して復号されるべきビンストリング（たとえば、１次元バイナリベクトル）を取得し得る（２２０２）。たとえば、ビデオデコーダ３００のエントロピー復号ユニット３０２は、ＣＰＢメモリ３２０からビンストリングを取得し得る。いくつかの例では、ビンストリングは、コンテキストの最終コード化確率間隔内の確率に対する値またはポインタを表し得る。いくつかの例では、コンテキストベースのエントロピーコーディングはコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）を備え得る。

【0204】

[0192] ビデオデコーダ３００は、複数のコンテキストのうちのコンテキストのためのあらかじめ定義された初期化値を取得し得る（２２０４）。たとえば、ビデオデコーダ３００のエントロピー復号ユニット３０２は、６ビットの変数であり得るｉｎｉｔＶａｌｕｅの値を取得し得る。

【0205】

[0193] ビデオデコーダ３００は、あらかじめ定義された初期化値に基づいて、線形領域中でのビデオデータの独立してコード化可能なユニット（たとえば、スライス、タイルなど）のためのコンテキストの初期確率状態を決定し得る（２２０６）。たとえば、エントロピー復号ユニット３０２は、対数領域中でのコンテキストの初期確率状態を中間で決定することなしに線形領域中でのコンテキストの初期確率状態を決定し得る。いくつかの例では、エントロピー復号ユニット３０２は、対数領域から線形領域に初期確率状態を変換するためにＬＵＴを使用せずに初期確率状態を決定し得る。

【0206】

[0194] 初期確率状態を決定するために、エントロピー復号ユニット３０２は、独立してコード化可能なユニットのための量子化パラメータの初期値（たとえば、ＳｌｉｃｅＱＰ_{Y）を取得し、０でない量子化パラメータアンカーポイントの値(たとえば、QPanchor)を取得し得る。}エントロピー復号ユニット３０２は、独立してコード化可能なユニットのための量子化パラメータの初期値と量子化パラメータアンカーポイントの値との間の差に基づいて初期確率状態を決定し得る。たとえば、エントロピー復号ユニット３０２は、以下の式に従って初期確率状態を決定し得る

【0207】

【数20】

【0208】

ここで、ＩｎｉｔＰｒｏｂＳｔａｔｅは、初期確率状態であり、ＳｌｉｃｅＱＰ_Yは、量子化パラメータの初期値であり、ＱＰ_anchorは、量子化パラメータアンカーポイントであり、ｒｓｈｉｆｔは、右シフト値である。

【0209】

[0195] 上記で説明されたように、いくつかの例では、エントロピー復号ユニット３０２は、極値確率分布のための増加した精度で初期化を実行するように構成され得る。たとえば、エントロピー復号ユニット３０２は、あらかじめ定義された初期化値に基づいて、スロープインデックス値とオフセットインデックス値とを決定し得る。エントロピー復号ユニット３０２は、スロープインデックス値に基づいて、ｍの値を決定し、オフセットインデックス値に基づいて、ｎの値を決定し得る。いくつかの例では、エントロピー復号ユニット３０２は、式ｎ＝（ＯｆｆｓｅｔＩｄｘ＊１８）＋１に従ってｎの値を決定し得、ここで、ＯｆｆｓｅｔＩｄｘは、オフセットインデックス値である。上記のように、いくつかの例では、エントロピー復号ユニット３０２は、ｍの値とｎの値とに基づいて初期確率状態を決定し得る。

【0210】

[0196] ビデオデコーダ３００は、コンテキストの初期確率状態に基づいて、ビンストリングのビンを復号し得る（２２０８）。ビデオデコーダ３００は、復号されたビンとコンテキストの初期確率状態とに基づいて、コンテキストの更新された確率状態を決定し得る。ビデオデコーダ３００は、コンテキストの更新された確率状態に基づいて、別のビンを復号し得る（２２０６）。

【0211】

[0197] 以下の番号付けされた例は、本開示の１つまたは複数の態様を示し得る。

【0212】

[0198] 例１Ａ．ビデオデータのエントロピーコーディングのための方法であって、ビデオデータのスライス中のシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちのコンテキストのためのあらかじめ定義されたスロープインデックスとあらかじめ定義されたオフセットインデックスとを取得することと、あらかじめ定義されたスロープインデックスとあらかじめ定義されたオフセットインデックスとに基づいて、ビデオデータのスライスのためのコンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングすることとを備える方法。

【0213】

[0199] 例２Ａ．初期確率状態が、線形領域中での初期確率（initial probability）を表す、例１Ａに記載の方法。

【0214】

[0200] 例３Ａ．初期確率状態が、２次領域中での初期確率を表す、例１Ａに記載の方法。

【0215】

[0201] 例４Ａ．初期確率状態を決定することが、あらかじめ定義されたスロープインデックスと、あらかじめ定義されたオフセットインデックスと、初期確率状態との間をマッピングするためにルックアップテーブル（ＬＵＴ）を使用せずに実行される、例３Ａに記載の方法。

【0216】

[0202] 例５Ａ．初期確率状態が、ＩｎｉｔＰｒｏｂＳｔａｔｅによって表され、スロープインデックスが、ＳｌｏｐｅＩｄｘによって表され、オフセットインデックスが、ＯｆｆｓｅｔＩｄｘによって表される、例１Ａ～４Ａの任意の組合せに記載の方法。

【0217】

[0203] 例６Ａ．コンテキスト適応型エントロピーコーディングプロセスが、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）プロセス、またはコンテキスト適応型可変長コーディング（ＣＡＶＬＣ）プロセスを備える、例１Ａ～５Ａのいずれかに記載の方法。

【0218】

[0204] 例７Ａ．コーディングすることが復号することを備える、例１Ａ～６Ａのいずれかに記載の方法。

【0219】

[0205] 例８Ａ．コーディングすることが符号化することを備える、例１Ａ～７Ａのいずれかに記載の方法。

【0220】

[0206] 例９Ａ．ビデオデータをコーディングするためのデバイスであって、例１Ａ～８Ａのいずれかに記載の方法を実行するための１つまたは複数の手段を備える、デバイス。

【0221】

[0207] 例１０Ａ．１つまたは複数の手段は、回路中に実装される１つまたは複数のプロセッサを備える、例９Ａに記載のデバイス。

【0222】

[0208] 例１１Ａ．ビデオデータを記憶するためのメモリをさらに備える、例９Ａおよび１０Ａのいずれかに記載のデバイス。

【0223】

[0209] 例１２Ａ．復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、例９Ａ～１１Ａのいずれかに記載のデバイス。

【0224】

[0210] 例１３Ａ．デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、例９Ａ～１２Ａのいずれかに記載のデバイス。

【0225】

[0211] 例１４Ａ．デバイスがビデオデコーダを備える、例９Ａ～１３Ａのいずれかに記載のデバイス。

【0226】

[0212] 例１５Ａ．デバイスがビデオエンコーダを備える、例９Ａ～１４Ａのいずれかに記載のデバイス。

【0227】

[0213] 例１６Ａ．実行されたとき、例１Ａ～８Ａのいずれかに記載の方法を１つまたは複数のプロセッサに実行させる命令を記憶したコンピュータ可読記憶媒体。

【0228】

[0214] 例１Ｂ．ビデオデータのエントロピーコーディングのための方法であって、ビデオデータのスライス中のシンタックス要素のための値をエントロピーコーディングするためにコンテキスト適応型エントロピーコーディングプロセスにおいて使用される複数のコンテキストのうちの１つのコンテキストのためのあらかじめ定義されたオフセットインデックスを取得することと、あらかじめ定義されたオフセットインデックスに基づいて、ビデオデータのスライスのためのコンテキストの初期確率状態を決定することと、コンテキストの初期確率状態に基づいて、シンタックス要素のための値のビンをエントロピーコーディングすることとを備える方法。

【0229】

[0215] 例２Ｂ．初期確率状態が、線形領域中での初期確率を表す、例１Ｂに記載の方法。

【0230】

[0216] 例３Ｂ．初期確率状態が、２次領域中での初期確率を表す、例１Ｂに記載の方法。

【0231】

[0217] 例４Ｂ．初期確率状態を決定することが、あらかじめ定義されたオフセットインデックスと初期確率状態との間をマッピングするためにルックアップテーブル（ＬＵＴ）を使用せずに実行される、例３Ｂに記載の方法。

【0232】

[0218] 例５Ｂ．初期確率状態が、ＩｎｉｔＰｒｏｂＳｔａｔｅによって表され、オフセットインデックスが、ＯｆｆｓｅｔＩｄｘによって表される、例１Ｂ～４Ｂの任意の組合せに記載の方法。

【0233】

[0219] 例６Ｂ．コンテキスト適応型エントロピーコーディングプロセスが、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）プロセス、またはコンテキスト適応型可変長コーディング（ＣＡＶＬＣ）プロセスを備える、例１Ｂ～５Ｂのいずれかに記載の方法。

【0234】

[0220] 例７Ｂ．コーディングすることが復号することを備える、例１Ｂ～６Ｂのいずれかに記載の方法。

【0235】

[0221] 例８Ｂ．コーディングすることが符号化することを備える、例１Ｂ～７Ｂのいずれかに記載の方法。

【0236】

[0222] 例９Ｂ．ビデオデータをコーディングするためのデバイスであって、例１Ｂ～８Ｂのいずれかに記載の方法を実行するための１つまたは複数の手段を備える、デバイス。

【0237】

[0223] 例１０Ｂ．１つまたは複数の手段は、回路中に実装される１つまたは複数のプロセッサを備える、例９Ｂに記載のデバイス。

【0238】

[0224] 例１１Ｂ．ビデオデータを記憶するためのメモリをさらに備える、例９Ｂおよび１０Ｂのいずれかに記載のデバイス。

【0239】

[0225] 例１２Ｂ．復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、例９Ｂ～１１Ｂのいずれかに記載のデバイス。

【0240】

[0226] 例１３Ｂ．デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、例９Ｂ～１２Ｂのいずれかに記載のデバイス。

【0241】

[0227] 例１４Ｂ．デバイスがビデオデコーダを備える、例９Ｂ～１３Ｂのいずれかに記載のデバイス。

【0242】

[0228] 例１５Ｂ．デバイスがビデオエンコーダを備える、例９Ｂ～１４Ｂのいずれかに記載のデバイス。

【0243】

[0229] 例１６Ｂ．実行されたとき、例１Ｂ～８Ｂのいずれかに記載の方法を１つまたは複数のプロセッサに実行させる命令を記憶したコンピュータ可読記憶媒体。

【0244】

[0230] 例１Ｃ．ビデオデータのエントロピーコーディングのための方法であって、変数の値に基づいて、第１の中間値を決定することと、第１の中間値に基づいて、コンテキストモデルの低精度の確率状態の値を決定することと、ここにおいて、低精度の確率状態の値を決定することは、第１の中間値を右シフトすることを備える、コンテキストモデルの低精度の確率状態の値に基づいて、シンタックス要素の少なくとも１ビットの値をコーディングすることとを備える方法。

【0245】

[0231] 例２Ｃ．第１の中間値を決定することが、式ｑ＝Ｃｌｉｐ３（１８，４６，ＳｌｉｃｅＱＰ_Y）－１６に従って第１の中間値を決定することを備える、ここで、ｑは、第１の中間値であり、ＳｌｉｃｅＱＰ_Yは、変数の値である、例１Ｃに記載の方法。

【0246】

[0232] 例３Ｃ．コンテキストモデルの低精度の確率状態の値を決定することが、式ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬ＝１６＊ａ＋（（ｂ－ａ）＊ｑ＞＞１）＋８に従ってコンテキストモデルの低精度の確率状態の値を決定することを備える、ここで、ｑは、第１の中間値であり、ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬは、コンテキストモデルの低精度の確率状態の値であり、ａは、第２の中間値であり、ｂは、第３の中間値である、例１Ｃまたは例２Ｃに記載の方法。

【0247】

[0233] 例４Ｃ．式ａ＝（ｉｎｉｔＶａｌｕｅ＞＞３）＊９ｂ＝（ｉｎｉｔＶａｌｕｅ＆７）＊９に従ってａとｂとのための値を決定することをさらに備える、ここで、ｉｎｉｔＶａｌｕｅは、初期化値である、例３Ｃに記載の方法。

【0248】

[0234] 例５Ｃ．コンテキストモデルの低精度の確率状態の値に基づいて、コンテキストモデルの高精度の確率状態の値を決定することをさらに備える、例１Ｃ～４Ｃのいずれかに記載の方法。

【0249】

[0235] 例６Ｃ．コンテキストモデルの高精度の確率状態の値を決定することが、式ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＨ＝ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬ＜＜４に従ってコンテキストモデルの高精度の確率状態の値を決定することを備える、ここで、ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＨは、コンテキストモデルの高精度の確率状態の値であり、ＰｒｏｂａｂｉｌｉｔｙＳｔａｔｅＬは、コンテキストモデルの低精度の確率状態の値である、例５Ｃに記載の方法。

【0250】

[0236] 例７Ｃ．コンテキスト適応型エントロピーコーディングプロセスが、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）プロセス、またはコンテキスト適応型可変長コーディング（ＣＡＶＬＣ）プロセスを備える、例１Ｃ～６Ｃのいずれかに記載の方法。

【0251】

[0237] 例８Ｃ．コーディングすることが復号することを備える、例１Ｃ～７Ｃのいずれかに記載の方法。

【0252】

[0238] 例９Ｃ．コーディングすることが符号化することを備える、例１Ｃ～８Ｃのいずれかに記載の方法。

【0253】

[0239] 例１０Ｃ．ビデオデータをコーディングするためのデバイスであって、例１Ｃ～９Ｃのいずれかに記載の方法を実行するための１つまたは複数の手段を備える、デバイス。

【0254】

[0240] 例１１Ｃ．１つまたは複数の手段は、回路中に実装される１つまたは複数のプロセッサを備える、例１０Ｃに記載のデバイス。

【0255】

[0241] 例１２Ｃ．ビデオデータを記憶するためのメモリをさらに備える、例１０Ｃおよび１１Ｃのいずれかに記載のデバイス。

【0256】

[0242] 例１３Ｃ．復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、例１０Ｃ～１２Ｃのいずれかに記載のデバイス。

【0257】

[0243] 例１４Ｃ．デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、例１０Ｃ～１３Ｃのいずれかに記載のデバイス。

【0258】

[0244] 例１５Ｃ．デバイスがビデオデコーダを備える、例１０Ｃ～１４Ｃのいずれかに記載のデバイス。

【0259】

[0245] 例１６Ｃ．デバイスがビデオエンコーダを備える、例１０Ｃ～１５Ｃのいずれかに記載のデバイス。

【0260】

[0246] 例１７Ｃ．実行されたとき、例１Ｃ～９Ｃのいずれかに記載の方法を１つまたは複数のプロセッサに実行させる命令を記憶したコンピュータ可読記憶媒体。

【0261】

[0247] 上記例に応じて、本明細書で説明された技法のいずれかのいくつかの行為またはイベントは、異なるシーケンスで実行され得、追加、マージ、または完全に除外され得る（たとえば、すべての説明された行為またはイベントが本技法の実践のために必要であるとは限らない）ことを認識されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に実行され得る。

【0262】

[0248] １つまたは複数の例において、前述の機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令もしくはコードとして、コンピュータ可読媒体上に記憶され得るか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的な有形コンピュータ可読記憶媒体、または（２）信号もしくは搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示において説明された技法の実装のための命令、コードおよび/またはデータ構造を取り出すために、１つまたは複数のコンピュータまたは１つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

【0263】

[0249] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ－ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体が、接続、搬送波、信号、または他の一時的媒体を含むのではなく、非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書において使用されるディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイ（登録商標）ディスク（disc）を含み、ここで、ディスク（disk）は通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲に含まれるべきである。

【0264】

[0250] 命令は、１つまたは複数のデジタルシグナルプロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、または他の同等の集積された論理回路もしくは個別の論理回路などの、１つまたは複数のプロセッサによって実行され得る。したがって、本明細書において使用される「プロセッサ」および「処理回路」という用語は、前述の構造、または本明細書において説明された技法の実装に好適な任意の他の構造のいずれかを指し得る。加えて、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび/もしくはソフトウェアモジュール内で提供され、または複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素において十分に実装され得る。

【0265】

[0251] 本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置に実装され得る。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明されたが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。そうではなく、上記で説明されたように、様々なユニットは、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明された１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされるか、または相互動作可能なハードウェアユニットの集合によって提供され得る。

【0266】

[0252] 様々な例を説明した。これらおよび他の例は、以下の特許請求の範囲内に入る。

【図1】