特許7546747 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー，リミテッドの特許一覧

特許7546747残差及び係数のコーディングの方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
4C
4D
4E
5A
5B
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-08-29

(45)【発行日】2024-09-06

(54)【発明の名称】残差及び係数のコーディングの方法及び装置

(51)【国際特許分類】

H04N 19/13 20140101AFI20240830BHJP

H04N 19/136 20140101ALI20240830BHJP

H04N 19/176 20140101ALI20240830BHJP

【ＦＩ】

H04N19/13

H04N19/136

H04N19/176

【請求項の数】 16

【外国語出願】

(21)【出願番号】P 2023194291

(22)【出願日】2023-11-15

(62)【分割の表示】P 2022520402の分割

【原出願日】2020-09-29

(65)【公開番号】P2024012602

(43)【公開日】2024-01-30

【審査請求日】2023-11-15

(31)【優先権主張番号】62/911,930

(32)【優先日】2019-10-07

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/909,079

(32)【優先日】2019-10-01

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/911,260

(32)【優先日】2019-10-05

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】521024075

【氏名又は名称】ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー，リミテッド

(74)【代理人】

【識別番号】100118902

【弁理士】

【氏名又は名称】山本修

(74)【代理人】

【識別番号】100106208

【弁理士】

【氏名又は名称】宮前徹

(74)【代理人】

【識別番号】100196508

【弁理士】

【氏名又は名称】松尾淳一

(74)【代理人】

【識別番号】100138759

【弁理士】

【氏名又は名称】大房直樹

(74)【代理人】

【識別番号】100201743

【弁理士】

【氏名又は名称】井上和真

(72)【発明者】

【氏名】チェン，イー－ウエン

(72)【発明者】

【氏名】シウ，シヤオユー

(72)【発明者】

【氏名】マー，ツン－チュアン

(72)【発明者】

【氏名】ジュ，ホーン－ジェン

(72)【発明者】

【氏名】ワーン，シアーンリン

(72)【発明者】

【氏名】ユ，ビーン

【審査官】田中崇大

(56)【参考文献】

【文献】米国特許出願公開第２０１７／００６４３３６（ＵＳ，Ａ１）

【文献】BROSS, Benjamin et al.，Versatile Video Coding (Draft 6)，JVET-O2001 (version 14)，ITU，2019年07月31日，pp.73-81, 151-153, 377-378, 382，JVET-O2001-vE.docx

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／１３

Ｈ０４Ｎ１９／１３６

Ｈ０４Ｎ１９／１７６

(57)【特許請求の範囲】

【請求項1】

ビデオ符号化の方法であって、
符号化ユニットに対応する１つ以上のシンタックス要素を決定するステップと、
前記１つ以上のシンタックス要素に応じてライスパラメータを決定するステップと、
当該決定されたライスパラメータを使用して生成された所定のマッピング関係に従って、前記符号化ユニット内のサンプルのパラメータに基づいて第１の符号語を決定するステップと、
前記サンプルの当該パラメータに関する記号値に基づいて第２の符号語を決定するステップと、
前記第１の符号語、前記第２の符号語及び前記１つ以上のシンタックス要素をビットストリーム内に符号化するステップと
を備え、
前記１つ以上のシンタックス要素に応じてライスパラメータを決定する当該ステップは、前記符号化ユニットの残差が変換スキップモードにあるかどうかに基づいて前記ライスパラメータを決定するステップを含み、
前記符号化ユニットの残差が前記変換スキップモードにあるかどうかに基づいて前記ライスパラメータを決定する当該ステップは、前記符号化ユニットの残差が前記変換スキップモードにあるとの決定に基づいて、前記ライスパラメータを変換ユニットに関する一定の値に設定するステップを含む、方法。

【請求項2】

請求項１に記載の方法であって、
前記１つ以上のシンタックス要素に基づいてパラメータ値が決定され、
前記１つ以上のシンタックス要素に応じて前記ライスパラメータを決定するステップが、
前記パラメータ値を閾値の集合と比較するステップであって、前記閾値の集合における各閾値が候補ライスパラメータを有するステップと、
前記閾値の集合から、前記パラメータ値を対象として含む一対の閾値を決定するステップと、
前記ライスパラメータを、前記一対の閾値に対応する２つの候補ライスパラメータのうちの１つとして決定するステップと
を含む、方法。

【請求項3】

請求項２に記載の方法であって、前記閾値の集合及び当該閾値に関連する候補ライスパラメータが定数値である、方法。

【請求項4】

請求項１に記載の方法であって、前記１つ以上のシンタックス要素が、前記符号化ユニットの第１の成分に関連したシンタックス要素の第１の部分集合、及び前記符号化ユニットの第２の成分に関連したシンタックス要素の第２の部分集合を含む、方法。

【請求項5】

請求項４に記載の方法であって、シンタックス要素の前記第１の部分集合と、シンタックス要素の前記第２の部分集合との間に、少なくとも１つの差異がある、方法。

【請求項6】

請求項１に記載の方法であって、前記１つ以上のシンタックス要素が、シーケンス、ピクチャ、スライス、タイル、符号化ツリーユニット（ＣＴＵ）、符号化ユニット（ＣＵ）、変換ユニット（ＴＵ）、及び変換ブロック（ＴＢ）からなるグループから選択された１つのレベルで信号伝達される、方法。

【請求項7】

請求項１に記載の方法であって、前記第１の符号語が、前記符号化ユニットにおける前記サンプルの変換係数の符号化に関連したものである、方法。

【請求項8】

請求項１に記載の方法であって、前記第１の符号語が、前記符号化ユニットにおける前記サンプルの変換スキップ残差の符号化に関連したものである、方法。

【請求項9】

請求項１に記載の方法であって、前記１つ以上のシンタックス要素に応じて前記ライスパラメータを決定するステップは、ルックアップテーブル内の当該ライスパラメータを探すステップを含む、方法。

【請求項10】

請求項１に記載の方法であって、前記所定のマッピング関係を、
当該決定されたライスパラメータを使用して２値化処理パラメータを計算するステップと、
前記２値化処理パラメータを使用して、候補残り値の集合のうちの１つのための、符号語のプレフィックス値及び対応する符号語の任意選択のサフィックス値を決定するステップと、
前記候補残り値の集合の最後の１つが決定されるまで、前記候補残り値の集合の別の１つに対して、前記符号語の前記決定するステップを繰り返すステップと
によって生成するステップをさらに備える、方法。

【請求項11】

請求項１０に記載の方法であって、前記符号語の前記プレフィックス値が、短縮化ライス２値化処理プロセスを使用して決定される、方法。

【請求項12】

請求項１０に記載の方法であって、前記プレフィックス値が、すべてのビットが１に等しくなる長さ６のビットストリングに等しいとき、前記符号語の前記サフィックス値が決定される、方法。

【請求項13】

請求項１に記載の方法であって、
前記符号化ユニットが変換スキップモード符号化ユニットであり、
当該方法が、
前記変換スキップモード符号化ユニット内の前記サンプルに関する符号語の第１のグループを前記ビットストリーム内に符号化するステップ
をさらに備える、方法。

【請求項14】

電子装置であって、
１つ以上の処理部と、
前記１つ以上の処理部に接続されたメモリと、
前記メモリに記憶された複数のプログラムであって、前記１つ以上の処理部によって実行されたとき、前記電子装置に、請求項１から１３のうちのいずれか一項に記載の方法を実施させる複数のプログラムと
を備える電子装置。

【請求項15】

１つ以上の処理部を有する電子装置によって実行するための複数のプログラムを記憶している非一時的なコンピュータ読み取り可能な記録媒体であって、前記複数のプログラムは、前記１つ以上の処理部によって実行されると、前記電子装置に、請求項１から１３のうちのいずれか一項に記載の方法を実施させる、非一時的なコンピュータ読み取り可能な記録媒体。

【請求項16】

コンピュータによって実行されると、請求項１から１３のうちのいずれか一項に記載の方法を実施させる命令を含むコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願）
本出願は、２０１９年１０月１日付け出願の「ＲｅｓｉｄｕａｌａｎｄＣｏｅｆｆｉｃｉｅｎｔｓＣｏｄｉｎｇｆｏｒＶｉｄｅｏＣｏｄｉｎｇ（ビデオコーディングのための残差及び係数のコーディング）」という名称の米国特許仮出願第６２／９０９，０７９号、２０１９年１０月５日付け出願の「ＲｅｓｉｄｕａｌａｎｄＣｏｅｆｆｉｃｉｅｎｔｓＣｏｄｉｎｇｆｏｒＶｉｄｅｏＣｏｄｉｎｇ（ビデオコーディングのための残差及び係数のコーディング）」という名称の米国特許仮出願第６２／９１１，２６０号、及び２０１９年１０月７日付け出願の「ＲｅｓｉｄｕａｌａｎｄＣｏｅｆｆｉｃｉｅｎｔｓＣｏｄｉｎｇｆｏｒＶｉｄｅｏＣｏｄｉｎｇ（ビデオコーディングのための残差及び係数のコーディング）」という名称の米国特許仮出願第６２／９１１，９３０号の優先権を主張するものであり、これらはすべて全体が参照によって組み込まれる。

【0002】

（技術分野）
本出願は、一般にビデオデータの符号化及び圧縮に関するものであり、詳細には、ビデオコーディングのための残差及び係数のコーディングを改善する方法及びシステムに関する。

【背景技術】

【0003】

デジタルビデオは、デジタルテレビジョン、ラップトップ型又はデスクトップ型のコンピュータ、タブレット型コンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤー、ビデオゲームコンソール、スマートフォン、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどの種々の電子デバイスによってサポートされる。そのような電子デバイスは、ＭＰＥＧ－４、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４Ｐａｒｔ１０ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ）、ＨＥＶＣ（高能率映像符号化：ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）、ＶＶＣ（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）規格などで定められたビデオ圧縮伸張規格を実装することにより、デジタルビデオデータの送信、受信、符号化、復号、及び／又は格納を行う。一般にビデオ圧縮は、空間（イントラフレーム）予測及び／又は時間（インターフレーム）予測を実行してビデオデータに固有の冗長を低減するか又は除去することを含む。ブロックベースのビデオコーディングについては、ビデオフレームが１つ以上のスライスへと分割され、各スライスが符号化ツリーユニット（ＣＴＵ：ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ）とも称され得る複数のビデオブロックを有する。各ＣＴＵが１つの符号化ユニット（ＣＵ：ｃｏｄｉｎｇｕｎｉｔ）を含有し得、又は所定の最小のＣＵサイズに達するまで、より小さいＣＵへと再帰的に分割され得る。各ＣＵ（リーフＣＵとも命名されている）が１つ以上の変換ユニット（ＴＵ：ｔｒａｎｓｆｏｒｍｕｎｉｔ）を含有しており、１つ以上の予測ユニット（ＰＵ：ｐｒｅｄｉｃｔｉｏｎｕｎｉｔ）も含む。各ＣＵは、イントラモード、インターモード又はＩＢＣモードのいずれかで符号化され得る。ビデオフレームにおけるイントラ符号化（Ｉ）スライス内のビデオブロックは、同じビデオフレームの内部の近隣のブロックにおける参照サンプルに対して空間予測を使用して符号化される。ビデオフレームにおけるインター符号化（Ｐ又はＢ）スライス内のビデオブロックは、同じビデオフレーム内の近隣のブロックにおける参照サンプルに対する空間予測を使用したものでもよいし、あるいは以前の他の参照ビデオフレーム及び／又は未来の他の参照ビデオフレームにおける参照サンプルに対する時間予測を使用したものでもよい。

【0004】

たとえば近隣のブロックといった以前に符号化された参照ブロックに基づく空間予測又は時間予測は、符号化される現在のビデオブロックに関する予測ブロックをもたらす。参照ブロックを見いだすプロセスは、ブロックマッチングアルゴリズムによって達成され得る。符号化される現在のブロックと予測ブロックとの間の画素差分を表す残差データは、残差ブロック又は予測誤差と称される。インター符号化ブロックは、予測ブロックを形成する参照フレームにおける参照ブロックを指し示す動きベクトル及び残差ブロックに従って符号化される。動きベクトルを決定するプロセスは一般的には動き予測と称される。イントラ符号化ブロックは、イントラ予測モード及び残差ブロックに従って符号化される。さらなる圧縮のために、残差ブロックは、画素領域から、たとえば周波数領域といった変換領域に変換されて残差変換係数をもたらし、次いで量子化され得る。最初に２次元配列に配置される量子化された変換係数は、変換係数の１次元ベクトルを生成するために走査されてよく、次いで、さらにいっそうの圧縮を達成するためにビデオビットストリームへとエントロピー符号化される。

【0005】

次いで、符号化ビデオビットストリームは、デジタルビデオ機能を伴う別の電子デバイスによってアクセスされるコンピュータ読み取り可能な記録媒体（たとえばフラッシュメモリ）に保存されるか、又は有線もしくは無線で電子デバイスに直接伝送される。次いで、電子デバイスは、たとえば符号化ビデオビットストリームを解析してビットストリームからシンタックス要素を取得し、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいて、符号化ビデオビットストリームからのデジタルビデオデータを元のフォーマットに再構成することによってビデオ伸張（前述のビデオ圧縮とは逆の処理）を実行し、再構成されたデジタルビデオデータを電子デバイスのディスプレイに描画する。

【0006】

デジタルビデオの品質がハイビジョン（ＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）から４Ｋ×２Ｋ又は８Ｋ×４Ｋに移行するにつれて、符号化／復号対象のビデオデータ量が指数関数的に増大する。これは、復号されるビデオデータの画質を維持しながらビデオデータをいかにより効率的に符号化／復号できるかという点での絶え間ない努力がある。

【発明の概要】

【発明が解決しようとする課題】

【0007】

本出願は、ビデオデータの符号化及び復号に関連した実装形態を記述するものであり、より詳細には、ビデオコーディングのための残差及び係数のコーディングを改善する方法及びシステムに関連した実装形態を記述する。

【課題を解決するための手段】

【0008】

本出願の第１の態様によれば、ビデオデータを復号する方法は、ビットストリームから、符号化ユニットに対応する１つ以上のシンタックス要素及びビデオデータを受け取るステップと、１つ以上のシンタックス要素に応じてライス（ｒｉｃｅ）パラメータを決定するステップと、ビデオデータから、符号化ユニット内の画素に関する第１の符号語（コードワード）及び第２の符号語（コードワード）を復号するステップと、決定されたライスパラメータを使用して生成された所定のマッピング関係に従って、第１のコードワードを画素のパラメータに変換するステップと、第２の符号語をパラメータの記号値（ｓｉｇｎｖａｌｕｅ）に変換するステップと、パラメータ及び記号値に基づいて、画素の定量化された画素値を決定するステップとを含む。

【0009】

本出願の第２の態様によれば、電子装置は、１つ以上の処理部、メモリ、及びメモリに記憶された複数のプログラムを含む。このプログラムは、１つ以上の処理部によって実行されると、電子機器に、上記で記述されたようにビデオデータを復号する方法を実施させる。

【0010】

本出願の第３の態様によれば、非一時的なコンピュータ読み取り可能な記録媒体は、１つ以上の処理部を有する電子装置によって実行される複数のプログラムを記憶している。このプログラムは、１つ以上の処理部によって実行されると、電子機器に、上記で記述されたようにビデオデータを復号する方法を実施させる。

【0011】

実施形態のさらなる理解を提供するために含まれる添付図面は、本明細書に組み込まれて本明細書の一部を構成し、記述された実施形態を図示して、記述とともに基本原理を説明するのに役立つものである。類似の参照数字は相当する部分を指す。

【図面の簡単な説明】

【0012】

【図1】本開示のいくつかの実施形態による例示的ビデオ符号化及び復号システムを示すブロック図である。

【図2】本開示のいくつかの実施形態による例示的なビデオ符号化器を示すブロック図である。

【図3】本開示のいくつかの実施形態による例示的ビデオ復号器を示すブロック図である。

【図4A】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を示すブロック図である。

【図4B】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を示すブロック図である。

【図4C】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を示すブロック図である。

【図4D】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を示すブロック図である。

【図4E】本開示のいくつかの実施形態によって、フレームが、サイズ及び形状の異なる複数のビデオブロックへと再帰的に分割される様子を示すブロック図である。

【図5A】本開示のいくつかの実装形態による、コンテキストコーディング及びバイパスコーディングを使用する効率的な符号化の変換の例を示すブロック図である。

【図5B】本開示のいくつかの実装形態による、コンテキストコーディング及びバイパスコーディングを使用する効率的な符号化の変換の例を示すブロック図である。

【図6】本開示のいくつかの実装形態による従属スカラー量子化の例示的プロセスを示すブロック図である。

【図7】本開示のいくつかの実装形態による、２つの異なるスカラー量子化器の間を切り換えるための例示的ステートマシンを示すブロック図である。

【図8】本開示のいくつかの実装形態による、ビデオ復号器が符号化ブロックに対する残差及び係数のコーディングを実行する例示的プロセスを示す流れ図である。

【図9】本開示のいくつかの実装形態による、コンテキスト適応型２進算術符号化（ＣＡＢＡＣ）エンジンの例を示すブロック図である。

【発明を実施するための形態】

【0013】

次に具体的な実施形態が詳細に参照され、それらの実施例が添付図面に示されている。以下の詳細な説明では、本明細書で提示される主題の理解を支援するために多くの非限定的かつ具体的な詳細が明らかにされる。しかし、特許請求の範囲から逸脱することなく様々な代替形態が使用され得、これらの具体的な詳細なしで主題が実施され得ることが、当業者には明らかであろう。たとえば、本明細書で提示された主題が、デジタルビデオ機能を伴う多くのタイプの電子デバイスにおいて実施され得ることは、当業者には明らかであろう。

【0014】

図１は、本開示のいくつかの実施形態による、ビデオブロックの符号化と復号を並行して行うための例示的システム１０を示すブロック図である。図１に示されるように、システム１０は、後に送信先（デスティネーション）装置１４によって復号されるビデオデータを生成して符号化する情報源（ソース）装置１２を含む。情報源装置１２及び送信先装置１４は、デスクトップコンピュータ又はラップトップコンピュータ、タブレット型コンピュータ、スマートフォン、セットトップボックス、デジタルテレビジョン、カメラ、表示装置、デジタルメディアプレーヤー、ビデオゲームコンソール、ビデオストリーミングデバイス等を含む種々の電子デバイスのうち任意のものを備え得る。いくつかの実施形態では、情報源装置１２及び送信先装置１４は無線通信機能を装備している。

【0015】

いくつかの実施形態では、送信先装置１４は、リンク１６を通じて、復号される符号化ビデオデータを受け取ってよい。リンク１６は、情報源装置１２から送信先装置１４に、符号化ビデオデータを転送することができる任意のタイプの通信媒体又は通信デバイスを備え得る。一例では、リンク１６は、情報源装置１２が送信先装置１４に、符号化ビデオデータをリアルタイムで直接伝送することを可能にするための通信媒体を備え得る。符号化ビデオデータは、無線通信プロトコルなどの通信規格に従って変調されて送信先装置１４に伝送され得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つ以上の物理的伝送路などの任意の無線又は有線の通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、広域ネットワーク、又はインターネットなどのグローバネットワークなどのパケットベースのネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、又は情報源装置１２から送信先装置１４への通信を容易にするのに役立つその他の機器を含み得る。

【0016】

いくつかの他の実施形態では、符号化ビデオデータは、出力インタフェース２２から記録装置３２に伝送され得る。続いて、記録装置３２における符号化ビデオデータは、送信先装置１４によって入力インタフェース２８を介してアクセスされ得る。記録装置３２は、ハードディスク（ｈａｒｄｄｒｉｖｅ）、ブルーレイディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性のメモリ、又は符号化ビデオデータを記憶するのに適する他のデジタル記録媒体など、種々の、分散された又は局所的にアクセスされるデータ記録媒体のうち任意のものを含み得る。さらなる例では、記録装置３２は、情報源装置１２によって生成された、符号化ビデオデータを保持し得る、ファイルサーバ又は別の中間記録装置に相当してよい。送信先装置１４は、記録装置３２からストリーミング又はダウンロードすることによって、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶したり、符号化ビデオデータを送信先装置１４に伝送したりすることができる任意のタイプのコンピュータでよい。例示的ファイルサーバは、（たとえばウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ：ｎｅｔｗｏｒｋａｔｔａｃｈｅｄｓｔｏｒａｇｅ）装置、又はローカルディスクドライブを含む。送信先装置１４は、ファイルサーバに記憶されている符号化ビデオデータにアクセスするのに適する無線チャンネル（たとえばＷｉ－Ｆｉ接続）、有線接続（たとえば、ＤＳＬやケーブルモデムなど）、又は両方の組合せを含む任意の標準的なデータ接続を通じて、符号化ビデオデータにアクセスし得る。記録装置３２からの符号化ビデオデータの伝送は、ストリーミング伝送、ダウンロード伝送、又は両方の組合せでよい。

【0017】

図１に示されるように、情報源装置１２は、ビデオ源１８、ビデオ符号化器２０及び出力インタフェース２２を含む。ビデオ源１８は、たとえばビデオカメラ、以前に取り込まれたビデオを含むビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受け取るためのビデオ供給インタフェース、及び／又はソースビデオとしてのコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステム、あるいはそのようなソースの組合せといった、ビデオキャプチャーデバイスなどのソースを含み得る。一例として、ビデオ源１８がセキュリティ監視システムのビデオカメラである場合には、情報源装置１２及び送信先装置１４がカメラフォン又はビデオフォンを形成し得る。しかしながら、本出願に記述された実施形態は、一般にビデオコーディングに適用可能であり得、無線及び／又は有線の用途に適用され得る。

【0018】

取り込まれた、前もって取り込まれた、又はコンピュータで生成されたビデオは、ビデオ符号化器２０によって符号化され得る。符号化ビデオデータは、情報源装置１２の出力インタフェース２２を通って送信先装置１４に直接伝送され得る。符号化ビデオデータは、復号及び／又は再生のために、送信先装置１４又は他のデバイスによる後のアクセス用に、記録装置３２にも（又は代わりに）記憶されてよい。出力インタフェース２２はモデム及び／又は送信器をさらに含み得る。

【0019】

送信先装置１４は、入力インタフェース２８、ビデオ復号器３０、及び表示装置３４を含む。入力インタフェース２８は受信器及び／又はモデムを含み得、リンク１６を通じて、符号化ビデオデータを受け取る。リンク１６を通じて通信されるか又は記録装置３２で供給される符号化ビデオデータは、ビデオ復号器３０によってビデオデータを復号する際に使用される、ビデオ符号化器２０によって生成された種々のシンタックス要素を含み得る。そのようなシンタックス要素が含まれ得る符号化ビデオデータは、通信媒体で伝送され、記録媒体又はファイルサーバに記憶される。

【0020】

いくつかの実施形態では、送信先装置１４が含み得る表示装置３４は、統合表示装置と、送信先装置１４と通信するように構成された外部表示装置とであり得る。表示装置３４は、復号ビデオデータをユーザーに表示し、液晶ディスプレイ（ＬＣＤ：ｌｉｑｕｉｄｃｒｙｓｔａｌｄｉｓｐｌａｙ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、又は別タイプの表示装置などの種々の表示装置のうち任意のものを備え得る。

【0021】

ビデオ符号化器２０及びビデオ復号器３０は、ＶＶＣ，ＨＥＶＣ，ＭＰＥＧ－４Ｐａｒｔ１０ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ），又はこれらの規格の拡張版などの、知的所有物又は業界規格に基づいて動作し得る。本出願は特定のビデオ符号化／復号の規格に限定されず、他のビデオ符号化／復号の規格に適用可能であり得ることを理解されたい。一般に、情報源装置１２のビデオ符号化器２０は、これらの現在の規格又は将来の規格のいずれかに従ってビデオデータを符号化するように構成され得ることが企図されている。同様に、送信先装置１４のビデオ復号器３０は、これらの現在の規格又は将来の規格のいずれかに従ってビデオデータを復号するように構成され得ることも一般に企図されている。

【0022】

ビデオ符号化器２０及びビデオ復号器３０は、それぞれ、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、特定用途向け集積回路（ＡＳＩＣ：ａｐｐｌｉｃａｔｉｏｎｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ：ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ディスクリートロジック（個別論理回路：ｄｉｓｃｒｅｔｅｌｏｇｉｃ）、ソフトウェア、ハードウェア、ファームウェア又はこれらの任意の組合せなどの種々の適切な符号化回路構成のうち任意のものとして実施され得る。電子デバイスは、部分的にソフトウェアで実施されるときには、ソフトウェアに関する命令を適切な非一時的コンピュータ可読媒体に記憶し、１つ以上のプロセッサを使用してハードウェアで命令を実行して、本開示で開示されたビデオ符号化／復号の処理を実行し得る。ビデオ符号化器２０及びビデオ復号器３０の各々が１つ以上の符号化器又は復号器に含まれ得、そのいずれかが、それぞれのデバイスにおいて組み合わされた符号化器／復号器（ＣＯＤＥＣ）の一部として一体化され得る。

【0023】

図２は、本出願に記述されたいくつかの実施形態による例示的ビデオ符号化器２０を示すブロック図である。ビデオ符号化器２０は、ビデオフレームの内部のビデオブロックのイントラ予測符号化及びインター予測符号化を実行し得る。イントラ予測符号化は、所与のビデオフレーム又はピクチャの内部のビデオデータにおける空間冗長性を低減するか又は除去するために空間予測に頼る。インター予測符号化は、ビデオシーケンスの隣接したビデオフレーム又はピクチャの内部のビデオデータにおける時間冗長性を低減するか又は除去するために時間予測に頼る。

【0024】

図２に示されるように、ビデオ符号化器２０は、ビデオデータメモリ４０、予測処理部４１、復号ピクチャバッファ（ＤＰＢ：ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）６４、加算器５０、変換処理部５２、量子化部５４、及びエントロピー符号化部５６を含む。予測処理部４１は、動き推定部４２、動き補償部４４、分割部４５、イントラ予測処理部４６、及びイントラブロックコピー（ＢＣ）部４８をさらに含む。いくつかの実施形態では、ビデオ符号化器２０は、ビデオブロックを再構成するための逆量子化部５８、逆変換処理部６０、及び加算器６２も含む。再構成されたビデオから、ブロック境界をフィルタリングしてブロック歪を除去するために、加算器６２とＤＰＢ６４との間にデブロッキングフィルタ（図示せず）が配置されてよい。デブロッキングフィルタに加えて、加算器６２の出力をフィルタリングするためにループ内フィルタ（図示せず）も使用され得る。ビデオ符号化器２０は、変更不能な又はプログラマブルなハードウェアユニットという形態を取ってよく、あるいは、１つ以上の変更不能な又はプログラマブルなハードウェアユニットのうちに分割されてもよい。

【0025】

ビデオデータメモリ４０は、ビデオ符号化器２０の構成要素によって符号化されるビデオデータを記憶し得る。ビデオデータメモリ４０のビデオデータは、たとえばビデオ源１８から取得され得る。ＤＰＢ６４は、ビデオ符号化器２０によって（たとえばイントラ予測符号化モード又はインター予測符号化モードで）ビデオデータを符号化するのに用いる参照ビデオデータを記録するバッファである。ビデオデータメモリ４０及びＤＰＢ６４は、様々な記録装置のうち任意のものによっても形成され得る。様々な例において、ビデオデータメモリ４０は、ビデオ符号化器２０の他の構成要素とともにオンチップでよく、又はそれらの構成要素に対してオフチップでもよい。

【0026】

図２に示されるように、予測処理部４１の内部の分割部４５は、受け取ったビデオデータをビデオブロックへと分割する。この分割は、ビデオデータに関連づけられた四分木構造などの所定の分割構造に従って、ビデオフレームを、スライス、タイル、又は他のより大きい符号化ユニット（ＣＵ）へと分割することを含み得る。ビデオフレームは複数のビデオブロック（又は、タイルと称されるビデオブロックのセット）に分割され得る。予測処理部４１は、誤り結果（たとえば符号化レートや歪みのレベル）に基づいて現在のビデオブロック用に、複数のイントラ予測符号化モードのうちの１つ、又は複数のインター予測符号化モードのうちの１つなど、複数の可能な予測符号化モードのうちの１つを選択してよい。予測処理部４１は、結果として生じるイントラ予測符号化ブロック又はインター予測符号化ブロックを、加算器５０に供給して残差ブロックを生成してよく、また、この符号化ブロックを加算器６２に供給して、後に参照フレームの一部として使用するために再構成してよい。予測処理部４１は、また、エントロピー符号化部５６に、動きベクトル、イントラモードインジケータ、分割情報、及び他のそのようなシンタックス情報などのシンタックス要素を供給する。

【0027】

現在のビデオブロック用に適切なイントラ予測符号化モードを選択するために、予測処理部４１の内部のイントラ予測処理部４６は、符号化される現在のブロックと同じフレームにおける１つ以上の近隣のブロックに関する現在のビデオブロックのイントラ予測符号化を実行して、空間予測をもたらし得る。予測処理部４１の内部の動き推定部４２及び動き補償部４４は、１つ以上の参照フレームにおける１つ以上の予測ブロックに関連して現在のビデオブロックのインター予測符号化を実行して時間予測をもたらす。ビデオ符号化器２０は、たとえばビデオデータの各ブロック用に適切な符号化モードを選択するために、複数の符号化パスを実行してよい。

【0028】

いくつかの実施形態では、動き推定部４２は、一連のビデオフレームの内部の所定のパターンに従って、参照ビデオフレームの内部の予測ブロックに対する現在のビデオフレームの内部のビデオブロックの予測ユニット（ＰＵ）の変位を示す動きベクトルを生成することにより、現在のビデオフレームに関するインター予測モードを決定する。動き推定部４２によって実行される動き予測は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム内（又は他の符号化ユニット内）の符号化される現在のブロックに関連して、参照フレーム内（又は他の符号化ユニット）内の予測ブロックに対する現在のビデオフレーム又はピクチャの内部のビデオブロックのＰＵの変位を示し得る。所定のパターンは、ビデオフレームを、シーケンスにおけるＰフレーム又はＢフレームとして指定し得る。イントラＢＣ部４８は、インター予測用の動き推定部４２による動きベクトルの決定と同様のやり方で、イントラＢＣ符号化用の、たとえばブロックベクトルといったベクトルを決定してよく、又は動き推定部４２を利用してブロックベクトルを決定してもよい。

【0029】

予測ブロックは、画素差分の観点から、符号化対象となるビデオブロックのＰＵと密接に対応するものとみなされる参照フレームのブロックであり、差分絶対値和（ＳＡＤ：ｓｕｍｏｆａｂｓｏｌｕｔｅｄｉｆｆｅｒｅｎｃｅ）、差分二乗和（ＳＳＤ：ｓｕｍｏｆｓｑｕａｒｅｄｉｆｆｅｒｅｎｃｅ）、又は他の差分基準量によって決定され得る。いくつかの実施形態では、ビデオ符号化器２０は、ＤＰＢ６４に記憶された参照フレームのサブ整数型画素位置の値を計算してよい。たとえば、ビデオ符号化器２０は、参照フレームの１／４画素位置、１／８画素位置、又は他の分数画素位置の値を補間してよい。したがって、動き推定部４２は、全体の画素位置及び分数画素位置に関する動き探索を実行して、分数画素精度を有する動きベクトルを出力し得る。

【0030】

動き推定部４２は、インター予測符号化フレームのビデオブロックのＰＵに関して、第１の参照フレームリスト（リスト０）又は第２の参照フレームリスト（リスト１）から選択された参照フレームの予測ブロックの位置と当該ＰＵの位置とを比較することにより動きベクトルを計算する。ここで、第１の参照フレームリスト又は第２の参照フレームリストはそれぞれＤＰＢ６４に格納されている１つ以上の参照フレームを特定するものである。動き推定部４２は、計算された動きベクトルを動き補償部４４に送り、次いでエントロピー符号化部５６に送る。

【0031】

動き補償部４４によって実行される動き補償は、動き推定部４２によって決定された動きベクトルに基づいて予測ブロックを取り込むこと又は生成することを包含し得る。動き補償部４４は、現在のビデオブロックのＰＵに関する動きベクトルを受け取ると、動きベクトルが参照フレームリストのうちの１つにおいて指し示す予測ブロックを捜し出し、ＤＰＢ６４から予測ブロックを取り出して、予測ブロックを加算器５０に転送する。次いで、加算器５０は、符号化される現在のビデオブロックの画素値から動き補償部４４によってもたらされた予測ブロックの画素値を差し引くことにより、画素差分値の残差ビデオブロックを形成する。残差ビデオブロックを形成する画素差分値は、輝度（ｌｕｍａ）差分成分もしくは色差（ｃｈｒｏｍａ）差分成分、又はこれらの両方を含み得る。動き補償部４４は、ビデオ復号器３０によって、ビデオフレームのビデオブロックを復号する際に使用されるビデオフレームのビデオブロックに関連したシンタックス要素も生成し得る。シンタックス要素は、たとえば、予測ブロックを特定するために使用される動きベクトルを定義するシンタックス要素、予測モードを指示する任意のフラグ、又は本明細書に記述されたその他のシンタックス情報を含み得る。なお、動き推定部４２と動き補償部４４はほとんど一体化され得るが、概念的な目的のために個別に示されている。

【0032】

いくつかの実施形態では、イントラＢＣ部４８は、動き推定部４２及び動き補償部４４に関して上記に記述されたのと同様のやり方でベクトルを生成して予測ブロックを取り込み得るが、予測ブロックは符号化される現在のブロックと同じフレームにあり、ベクトルは動きベクトルと対照的にブロックベクトルと称される。詳細には、イントラＢＣ部４８は、現在のブロックを符号化するためにイントラ予測モードを使用するように決定してよい。いくつかの例において、イントラＢＣ部４８は、たとえば個別の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し、レート－歪み解析によってそれらイントラ予測モードの性能を分析してよい。次に、イントラＢＣ部４８は、試験された様々なイントラ予測モードの中で、イントラモードインジケータを生成するのに使用する適切なイントラ予測モードを選択してよい。たとえば、イントラＢＣ部４８は、レート－歪み解析を使用して、試験された様々なイントラ予測モードに関するレート－歪み値を計算し、試験されたモードの中で最善のレート－歪み特性を有するイントラ予測モードを、使用するのに適切なイントラ予測モードとして選択してよい。レート－歪み解析は、一般に、符号化ブロックと、当該符号化ブロックを生成するために符号化される符号化前の元のブロックとの間の歪み（又は誤差）量とともに、これら符号化ブロックを生成するために使用されたビットレート（すなわち、多数のビット）を決定する。イントラＢＣ部４８は、様々な符号化ブロックについて歪みとレートとの比率を計算して、そのブロックに関する最善のレート－歪み値を示すイントラ予測モードを決定してよい。

【0033】

他の例では、イントラＢＣ部４８は、本明細書に記述された実施形態に従ってイントラＢＣ予測のためのそのような機能を実行するために、動き推定部４２及び動き補償部４４を全体的又は部分的に使用してよい。どちらの場合にも、イントラブロックコピーについては、予測ブロックは、画素差分の観点から、符号化対象となるブロックと密接に対応するものとみなされるブロックでよく、差分絶対値和（ＳＡＤ）、差分二乗和（ＳＳＤ）、又は他の差分基準量によって決定され得る。予測ブロックの特定には、サブ整数型画素位置の値の計算が含まれ得る。

【0034】

予測ブロックがイントラ予測による同じフレームからのものであろうとインター予測による異なるフレームからのものであろうと、ビデオ符号化器２０は、符号化される現在のビデオブロックの画素値から予測ブロックの画素値を差し引くことによって残差ビデオブロックを形成してよく、画素差分値を形成する。残差ビデオブロックを形成する画素差分値は、輝度差分成分と色差差分成分の両方を含み得る。

【0035】

イントラ予測処理部４６は、前述のように、動き推定部４２及び動き補償部４４によって実行されるインター予測、又はイントラＢＣ部４８によって実行されるイントラブロックコピー予測の代替として、現在のビデオブロックをイントラ予測してよい。詳細には、イントラ予測処理部４６は、現在のブロックを符号化するためにイントラ予測モードを使用するように決定してよい。そうするために、イントラ予測処理部４６は、たとえば個別の符号化パス中に様々なイントラ予測モードを使用して現在のブロックを符号化してよく、イントラ予測処理部４６（又はいくつかの例ではモード選択部）は、試験されたイントラ予測モードから、使用するべき適切なイントラ予測モードを選択してよい。イントラ予測処理部４６は、そのブロック向けに選択されたイントラ予測モードを表す情報をエントロピー符号化部５６に供給してよい。エントロピー符号化部５６は、ビットストリームにおける選択されたイントラ予測モードを指示する情報を符号化してよい。

【0036】

予測処理部４１がインター予測又はイントラ予測のいずれかによって現在のビデオブロック用の予測ブロックを決定した後に、加算器５０が、現在のビデオブロックから予測ブロックを差し引くことによって残差ビデオブロックを生成する。残差ブロックにおける残差ビデオデータは１つ以上の変換ユニット（ＴＵ）に含まれ得、変換処理部５２に供給される。変換処理部５２は、離散コサイン変換（ＤＣＴ：ｄｉｓｃｒｅｔｅｃｏｓｉｎｅｔｒａｎｓｆｏｒｍ）又は概念的に同様の変換などの変換を使用して残差ビデオデータを残差変換係数に変換する。

【0037】

変換処理部５２は、結果として生じる変換係数を量子化部５４に送ってよい。量子化部５４は、変換係数を量子化してビットレートをさらに低下させる。量子化プロセスは、係数のうちのいくつか又はすべてに関連したビット深さも縮小し得る。量子化の程度は、量子化パラメータを調節することによって変更され得る。いくつかの例において、量子化部５４は、次いで、量子化された変換係数を含むマトリクスの走査を実行し得る。あるいはエントロピー符号化部５６が走査を実行してもよい。

【0038】

量子化に続いて、エントロピー符号化部５６は、たとえば、コンテキスト適応型可変長符号化（ＣＡＶＬＣ：ｃｏｎｔｅｘｔａｄａｐｔｉｖｅｖａｒｉａｂｌｅｌｅｎｇｔｈｃｏｄｉｎｇ）、コンテキスト適応型２値算術符号化（ＣＡＢＡＣ：ｃｏｎｔｅｘｔａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）、シンタックスベースコンテキスト適応型２値算術符号化（ＳＢＡＣ：ｓｙｎｔａｘ－ｂａｓｅｄｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）、確率区間区分エントロピー符号化（ＰＩＰＥ：ｐｒｏｂａｂｉｌｉｔｙｉｎｔｅｒｖａｌｐａｒｔｉｔｉｏｎｉｎｇｅｎｔｒｏｐｙｃｏｄｉｎｇ）、又は別のエントロピー符号化の技法もしくは技術を使用して、量子化された変換係数をビデオビットストリームへとエントロピー符号化する。次いで、符号化ビットストリームは、ビデオ復号器３０に伝送されるか、又は後にビデオ復号器３０へ伝送するため、もしくはビデオ復号器３０によって後に取り戻すために記録装置３２に記録され得る。エントロピー符号化部５６は、符号化される現在のビデオフレームに関する動きベクトル及び他のシンタックス要素もエントロピー符号化してよい。

【0039】

他のビデオブロックを予測するための参照ブロックを生成するために、画素領域における残差ビデオブロックを再構成するのに、逆量子化部５８が逆量子化を適用し、逆変換処理部６０が逆変換を適用する。前述のように、動き補償部４４は、ＤＰＢ６４に記憶されたフレームの１つ以上の参照ブロックから、動き補償された予測ブロックを生成し得る。動き補償部４４はまた、予測ブロックに１つ以上の補間フィルタを適用して、動き予測に用いるサブ整数画素値を計算してよい。

【0040】

加算器６２は、再構成された残差ブロックを、動き補償部４４によって生成された動き補償された予測ブロックに加えて、ＤＰＢ６４に記憶するための参照ブロックを生成する。次いで、参照ブロックは、イントラＢＣ部４８、動き推定部４２及び動き補償部４４によって、後続のビデオフレームにおける別のビデオブロックをインター予測するための予測ブロックとして使用され得る。

【0041】

図３は、本出願のいくつかの実施形態による例示的なビデオ復号器３０を示すブロック図である。ビデオ復号器３０は、ビデオデータメモリ７９、エントロピー復号部８０、予測処理部８１、逆量子化部８６、逆変換処理部８８、加算器９０、及びＤＰＢ９２を含む。予測処理部８１は、動き補償部８２、イントラ予測処理部８４、及びイントラＢＣ部８５をさらに含む。ビデオ復号器３０は、図２に関連してビデオ符号化器２０に関して記述された符号化プロセスとは全体的に逆の復号プロセスを実行し得る。たとえば、動き補償部８２は、エントロピー復号部８０から受け取られた動きベクトルに基づいて予測データを生成し得、一方、イントラ予測処理部８４は、エントロピー復号部８０から受け取られたイントラ予測モードインジケータに基づいて予測データを生成し得る。

【0042】

いくつかの例において、ビデオ復号器３０のユニットには、本出願の実施形態を実行するようにタスクが課されることがある。また、いくつかの例では、本開示の実施形態は、ビデオ復号器３０の１つ以上のユニットの間で分割されてもよい。たとえば、イントラＢＣ部８５は、本出願の実施形態を、単独で、又はビデオ復号器３０の動き補償部８２、イントラ予測処理部８４、及びエントロピー復号部８０などの他のユニットと組み合わせて実行し得る。いくつかの例では、ビデオ復号器３０はイントラＢＣ部８５を含まなくてよく、イントラＢＣ部８５の機能性は、動き補償部８２など、予測処理部８１の他の構成要素によって実行され得る。

【0043】

ビデオデータメモリ７９は、ビデオ復号器３０の他の構成要素によって復号される符号化ビデオビットストリームなどのビデオデータを記憶し得る。ビデオデータメモリ７９に記憶されたビデオデータは、記録装置３２から、たとえばカメラなどのローカルなビデオ源から、ビデオデータの有線もしくは無線のネットワーク通信によって、又はたとえばフラッシュドライブもしくはハードディスクといった物理的データ記録媒体にアクセスすることによって取得され得る。ビデオデータメモリ７９は、符号化ビデオビットストリームからの符号化ビデオデータを記憶する、符号化ピクチャバッファ（ＣＰＢ：ｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を含み得る。ビデオ復号器３０の、復号ピクチャバッファ（ＤＰＢ）９２は、ビデオ復号器３０によって（たとえばイントラ予測符号化モード又はインター予測符号化モードで）ビデオデータを符号化するのに用いる参照ビデオデータを記憶する。ビデオデータメモリ７９及びＤＰＢ９２は、シンクロナスＤＲＡＭ（ＳＤＲＡＭ：ＳｙｎｃｈｒｏｎｏｕｓＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、磁気抵抗型ＲＡＭ（ＭＲＡＭ：Ｍａｇｎｅｔｏ－ｒｅｓｉｓｔｉｖｅＲＡＭ）、抵抗変化型ＲＡＭ（ＲＲＡＭ）、又は他のタイプのメモリデバイスを含む動的ランダムアクセスメモリ（ＤＲＡＭ：ＲｅｓｉｓｔｉｖｅＲＡＭ）などの種々のメモリデバイスのうち任意のものによって形成され得る。例示のために、ビデオデータメモリ７９及びＤＰＢ９２は、図３におけるビデオ復号器３０の２つの別個の構成要素として表されている。しかし、ビデオデータメモリ７９及びＤＰＢ９２は、同一のメモリデバイス又は個別のメモリデバイスによってもたらされ得ることが当業者には明らかであろう。いくつかの例では、ビデオデータメモリ７９は、ビデオ復号器３０の他の構成要素とともにオンチップでよく、又はそれらの構成要素に対してオフチップでもよい。

【0044】

復号プロセス中に、ビデオ復号器３０は、符号化ビデオフレーム及び関連するシンタックス要素のビデオブロックを表す符号化ビデオビットストリームを受け取る。ビデオ復号器３０はビデオフレームレベル及び／又はビデオブロックレベルのシンタックス要素を受け取ってよい。ビデオ復号器３０のエントロピー復号部８０は、ビットストリームをエントロピー復号して、量子化係数、動きベクトル又はイントラ予測モードインジケータ、及び他のシンタックス要素を生成する。次いで、エントロピー復号部８０は、動きベクトル及び他のシンタックス要素を予測処理部８１に転送する。

【0045】

ビデオフレームが、イントラ予測符号化（Ｉ）フレームとして、又は他のタイプのフレームにおけるイントラ符号化予測ブロック向けに符号化されるとき、予測処理部８１のイントラ予測処理部８４は、信号伝達されたイントラ予測モード及び現在のフレームの以前に復号されたブロックからの参照データに基づいて、現在のビデオフレームのビデオブロックに関する予測データを生成し得る。

【0046】

ビデオフレームがインター予測符号化（すなわちＢ又はＰ）フレームとして符号化されるとき、予測処理部８１の動き補償部８２は、エントロピー復号部８０から受け取られた動きベクトル及び他のシンタックス要素に基づいて現在のビデオフレームのビデオブロックに関する１つ以上の予測ブロックを生成する。予測ブロックの各々が、参照フレームリストのうちの１つの内部の参照フレームから生成され得る。ビデオ復号器３０は、ＤＰＢ９２に記憶された参照フレームに基づくデフォルトの構成技術を使用して、参照フレームリスト、リスト０及びリスト１を構成し得る。

【0047】

いくつかの例では、本明細書に記述されたイントラＢＣモードに従ってビデオブロックが符号化されるとき、予測処理部８１のイントラＢＣ部８５は、エントロピー復号部８０から受け取られたブロックベクトル及び他のシンタックス要素に基づいて現在のビデオブロックに関する予測ブロックを生成する。予測ブロックは、ビデオ符号化器２０によって定義された現在のビデオブロックと同一のピクチャの再構成された領域の内部にあり得る。

【0048】

動き補償部８２及び／又はイントラＢＣ部８５は、動きベクトル及び他のシンタックス要素を解析することによって現在のビデオフレームのビデオブロックに関する予測情報を決定し、次いで、予測情報を使用して、復号される現在のビデオブロックに関する予測ブロックを生成する。たとえば、動き補償部８２は、受け取られたシンタックス要素のうちのいくつかを使用して、ビデオフレームのビデオブロックを符号化するのに使用される予測モード（たとえばイントラ予測又はインター予測）、インター予測フレームタイプ（たとえばＢ又はＰ）、フレームに関する参照フレームリストのうちの１つ以上の構成情報、フレームにおける各インター予測符号化ビデオブロックの動きベクトル、フレームの各インター予測符号化ビデオブロックのインター予測状態、及び現在のビデオフレームにおけるビデオブロックを復号するための他の情報を決定する。

【0049】

同様に、イントラＢＣ部８５は、たとえばフラグといった受け取られたシンタックス要素のうちのいくつかを使用して、現在のビデオブロックはイントラＢＣモードを使用して予測されたものであること、再構成された領域の内部にあってＤＰＢ９２に記憶されるべきフレームのビデオブロックの構成情報、フレームの各イントラＢＣ予測ビデオブロックのブロックベクトル、フレームの各イントラＢＣ予測ビデオブロックのイントラＢＣ予測状態、及び現在のビデオフレームにおけるビデオブロックを復号するための他の情報を決定し得る。

【0050】

動き補償部８２はまた、ビデオ符号化器２０によってビデオブロックの符号化中に参照ブロックのサブ整数画素の補間値を計算するために使用されたような補間フィルタを使用して、補間を実行し得る。この場合、動き補償部８２は、受け取られたシンタックス要素から、ビデオ符号化器２０によって使用された補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成し得る。

【0051】

逆量子化部８６は、ビットストリームの中に与えられてエントロピー復号部８０によってエントロピー復号された量子化変換係数を、ビデオ符号化器２０によってビデオフレームにおける各ビデオブロックについて量子化の程度を決定するために計算されたものと同一の量子化パラメータを使用して逆量子化する。逆変換処理部８８は、画素領域における残差ブロックを再構成するために、変換係数に対して、たとえば逆ＤＣＴ、逆整数変換、又は概念的に類似の逆変換プロセスといった逆変換を適用する。

【0052】

動き補償部８２又はイントラＢＣ部８５がベクトル及び他のシンタックス要素に基づいて現在のビデオブロックに関する予測ブロックを生成した後に、加算器９０は、逆変換処理部８８からの残差ブロックと、動き補償部８２及びイントラＢＣ部８５によって生成された対応する予測ブロックとを合計することによって、現在のビデオブロックに関する復号ビデオブロックを再構成する。復号ビデオブロックをさらに処理するために、加算器９０とＤＰＢ９２との間にループ内フィルタ（図示せず）が配置されてよい。次いで、所与のフレームにおける復号ビデオブロックは、次のビデオブロックの後続の動き補償に使用される参照フレームを記憶するＤＰＢ９２に記憶される。ＤＰＢ９２又はＤＰＢ９２とは別個のメモリデバイスも、復号されたビデオを、後に図１の表示装置３４などの表示装置に提示するために記憶し得る。

【0053】

一般的なビデオ符号化プロセスでは、ビデオシーケンスは、一般的にはフレーム又はピクチャの順序づけられたセットを含む。各フレームが、ＳＬ、ＳＣｂ、及びＳＣｒと表される３つのサンプル配列を含み得る。ＳＬは、輝度（ｌｕｍａ）サンプルからなる２次元配列である。ＳＣｂは、Ｃｂ色差サンプルからなる２次元配列である。ＳＣｒは、Ｃｒ色差サンプルからなる２次元配列である。他の事例では、フレームは白黒でよく、したがって輝度サンプルの２次元配列を１つだけ含む。

【0054】

図４Ａに示されるように、ビデオ符号化器２０（より具体的には分割部４５）は、最初にフレームを符号化ツリーユニット（ＣＴＵ）の集合に分割することによってフレームの符号化表現を生成する。ビデオフレームは、左から右及び上から下へのラスタスキャン順で連続的に順序づけられた整数個のＣＴＵを含み得る。各ＣＴＥＴは最大の論理符号化ユニットであり、ＣＴＵの幅及び高さは、シーケンスパラメータセットにおいて、ビデオ符号化器２０によって、ビデオシーケンスにおけるすべてのＣＴＵが１２８×１２８、６４×６４、３２×３２、及び１６×１６のうちの１つである同一のサイズを有するように信号伝達される。しかし、本出願は必ずしも特定のサイズに制限されるものではないことに留意されたい。図４Ｂに示されるように、各ＣＴＵは、輝度（ｌｕｍａ）サンプルからなる１つの符号化ツリーブロック（ＣＴＢ）と、対応する２つの色差サンプルからなる符号化ツリーブロックと、符号化ツリーブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。シンタックス要素は、画素の符号化ブロックの種々のタイプのユニットの特性と、インター予測又はイントラ予測、イントラ予測モード、動きベクトル、及び他のパラメータを含め、ビデオ復号器３０にてビデオシーケンスを再構成し得る方法とを記述するものである。白黒ピクチャ又は３つの個別のカラープレーンを有するピクチャでは、ＣＴＵは、単一の符号化ツリーブロックと、符号化ツリーブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。符号化ツリーブロックは、サンプルのＮ×Ｎのブロックでよい。

【0055】

より優れた性能を達成するために、ビデオ符号化器２０は、ＣＴＵの符号化ツリーブロックに対して、二分木（ｂｉｎａｒｙ－ｔｒｅｅ）分割、三分木（ｔｅｒｎａｒｙ－ｔｒｅｅ）分割、四分木（ｑｕａｄ－ｔｒｅｅ）分割、又はこれらの組合せなどの木分割を再帰的に実行して、ＣＴＵをより小さい符号化ユニット（ＣＵ）に分割し得る。図４Ｃに表されるように、６４×６４のＣＴＵ４００が、最初に、それぞれが３２×３２のブロックサイズを有する４つのより小さいＣＵに分割される。４つのより小さいＣＵの中で、ＣＵ４１０及びＣＵ４２０が、それぞれ１６×１６のブロックサイズで４つのＣＵに分割される。２つの１６×１６のＣＵである４３０及び４４０が、それぞれ８×８のブロックサイズで４つのＣＵにさらに分割される。図４Ｄは、図４Ｃに表されたようなＣＴＵ４００の分割プロセスの最終結果を示す四分木データ構造を表すものであり、四分木の各リーフノードが３２×３２～８×８の範囲のそれぞれのサイズの１つのＣＵに対応する。各ＣＵは、図４Ｂに表されたＣＴＵに類似して、輝度サンプルの符号化ブロック（ＣＢ）と、同じサイズのフレームの色差サンプルの２つの対応する符号化ブロックと、符号化ブロックのサンプルを符号化するのに使用されるシンタックス要素とを含み得る。白黒ピクチャ又は３つの個別のカラープレーンを有するピクチャでは、ＣＵは、単一の符号化ブロックと、符号化ブロックのサンプルを符号化するのに使用されるシンタックス構造とを含み得る。図４Ｃ及び図４Ｄに表された四分木分割は単なる説明のためのものであり、１つのＣＴＵが、様々な局所的特性に適合するように、四分木分割／三分木分割／二分木分割に基づいてＣＵに分割され得ることに留意されたい。複合の木構造では、１つのＣＴＵが四分木構造によって分割され、各四分木の葉ＣＵが二分木構造及び三分木構造によってさらに分割され得る。図４Ｅに示されるように、４分割、水平２分割、垂直２分割、水平３分割、垂直３分割といった５つの分割タイプがある。

【0056】

いくつかの実施形態では、ビデオ符号化器２０は、ＣＵの符号化ブロックを１つ以上のＭ×Ｎの予測ブロック（ＰＢ）へとさらに分割し得る。予測ブロックは、同一の（インター又はイントラ）予測が適用されるサンプルの矩形状（正方形又は非正方形）のブロックである。ＣＵの予測ユニット（ＰＵ）は、輝度サンプルの予測ブロックと、色差サンプルの２つの対応する予測ブロックと、予測ブロックを予測するのに使用されるシンタックス要素とを含み得る。白黒ピクチャ又は３つの個別のカラープレーンを有するピクチャでは、ＰＵは、単一の予測ブロックと、予測ブロックを予測するのに使用されるシンタックス構造とを含み得る。ビデオ符号化器２０は、ＣＵの各ＰＵにおける、予測輝度、輝度に関するＣｂ及びＣｒブロック、並びに、Ｃｂ及びＣｒ予測ブロックを生成し得る。

【0057】

ビデオ符号化器２０は、ＰＵに関する予測ブロックを生成するためにイントラ予測又はインター予測を使用してよい。ビデオ符号化器２０がイントラ予測を使用してＰＵの予測ブロックを生成する場合には、ビデオ符号化器２０はＰＵに関連したフレームの復号サンプルに基づいてＰＵの予測ブロックを生成し得る。ビデオ符号化器２０がインター予測を使用してＰＵの予測ブロックを生成する場合には、ビデオ符号化器２０はＰＵに関連したフレーム以外の１つ以上のフレームの復号サンプルに基づいてＰＵの予測ブロックを生成し得る。

【0058】

ビデオ符号化器２０は、ＣＵにおける１つ以上のＰＵに関する予測輝度ブロック、予測Ｃｂブロック及び予測Ｃｒブロックを生成した後に、ＣＵの輝度残差ブロックにおける各サンプルがＣＵの予測輝度ブロックのうちの１つにおける輝度サンプルとＣＵの元の輝度符号化ブロックにおける対応するサンプルとの間の差分を示すように、ＣＵの元の輝度符号化ブロックからＣＵの予測輝度ブロックを差し引くことによって、ＣＵに関する輝度残差ブロックを生成し得る。同様に、ビデオ符号化器２０は、ＣＵのＣｂ残差ブロックにおける各サンプルが、ＣＵの予測Ｃｂブロックのうちの１つにおけるＣｂサンプルとＣＵの元のＣｂ符号化ブロックにおける対応するサンプルとの間の差分を示すように、ＣＵのＣｂ残差ブロック及びＣｒ残差ブロックをそれぞれ生成してよく、ＣＵのＣｒ残差ブロックにおける各サンプルが、ＣＵの予測Ｃｒブロックのうちの１つにおけるＣｒサンプルとＣＵの元のＣｒ符号化ブロックにおける対応するサンプルとの間の差分を示し得る。

【0059】

その上、図４Ｃに示されるように、ビデオ符号化器２０は、四分木分割を使用して、ＣＵの輝度、Ｃｂ及びＣｒの残差ブロックを、１つ以上の輝度、Ｃｂ及びＣｒの変換ブロックへと分解する。変換ブロックは、同一の変換が適用されるサンプルの矩形（正方形又は非正方形）のブロックである。ＣＵの変換ユニット（ＴＵ）は、輝度サンプルの変換ブロックと、色差サンプルの２つの対応する変換ブロックと、変換ブロックサンプルを予測するのに使用されるシンタックス要素とを含み得る。したがって、ＣＵの各ＴＵは、輝度変換ブロック、Ｃｂ変換ブロック、及びＣｒ変換ブロックに関連づけられ得る。いくつかの例では、ＴＵに関連した輝度変換ブロックはＣＵの輝度残差ブロックのサブブロックであり得る。Ｃｂ変換ブロックは、ＣＵのＣｂ残差ブロックのサブブロックであり得る。Ｃｒ変換ブロックは、ＣＵのＣｒ残差ブロックのサブブロックであり得る。白黒ピクチャ又は３つの個別のカラープレーンを有するピクチャでは、ＴＵは、単一の変換ブロックと、変換ブロックのサンプルを変換するのに使用されるシンタックス構造とを含み得る。

【0060】

ビデオ符号化器２０は、ＴＵの輝度変換ブロックに１つ以上の変換を適用してＴＵ用の輝度係数ブロックを生成し得る。係数ブロックは変換係数の２次元配列であり得る。変換係数はスカラー量であり得る。ビデオ符号化器２０は、ＴＵのＣｂ変換ブロックに１つ以上の変換を適用してＴＵ用のＣｂ係数ブロックを生成し得る。ビデオ符号化器２０は、ＴＵのＣｒ変換ブロックに１つ以上の変換を適用してＴＵ用のＣｒ係数ブロックを生成し得る。

【0061】

ビデオ符号化器２０は、係数ブロック（たとえば輝度係数ブロック、Ｃｂ係数ブロック又はＣｒ係数ブロック）を生成した後に係数ブロックを量子化し得る。量子化は、一般に、変換係数を表すために使用されるデータ量をどうにかして低減するために変換係数が量子化されるプロセスを指すものであり、さらなる圧縮をもたらす。ビデオ符号化器２０は、係数ブロックを量子化した後に、量子化された変換係数を示すシンタックス要素をエントロピー符号化し得る。たとえば、ビデオ符号化器２０は量子化された変換係数を示すシンタックス要素に対してコンテキスト適応型２値算術符号化（ＣＡＢＡＣ）を実行し得る。最終的に、ビデオ符号化器２０は、符号化フレーム及び関連するデータの表現を形成する一連のビットを含むビットストリームを出力し得、これは記録装置３２に保存されるか又は送信先装置１４に伝送される。

【0062】

ビデオ復号器３０は、ビデオ符号化器２０によって生成されたビットストリームを受け取った後に、ビットストリームを解析して、ビットストリームからシンタックス要素を取得し得る。ビデオ復号器３０は、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいてビデオデータのフレームを再構成し得る。ビデオデータを再構成するプロセスは、一般にビデオ符号化器２０によって実行された符号化プロセスの逆のである。たとえば、ビデオ復号器３０は、現在のＣＵのＴＵに関連した係数ブロックに対する逆変換を実行して、現在のＣＵのＴＵに関連した残差ブロックを再構成し得る。ビデオ復号器３０はまた、現在のＣＵのＰＵに関する予測ブロックのサンプルを、対応する現在のＣＵのＴＵの変換ブロックのサンプルに加算することによって現在のＣＵの符号化ブロックを再構成する。ビデオ復号器３０は、フレームの各ＣＵに関する符号化ブロックを再構成した後にフレームを再構成し得る。

【0063】

前述のように、ビデオ符号化は、主としてイントラフレーム予測（すなわちイントラ予測）及びインターフレーム予測（すなわちインター予測）の２つのモードを使用してビデオ圧縮を達成するものである。パレットベースの符号化は、多くのビデオコーディング規格によって採用されている別の符号化方式である。パレットベースの符号化は、スクリーンに生成されたコンテンツを符号化するのに特に適し、この方式では、ビデオコーダ（たとえばビデオ符号化器２０又はビデオ復号器３０）が、所与のブロックのビデオデータを表現する色のパレットテーブルを形成する。パレットテーブルは、所与のブロックの中で最も優勢な（たとえば頻繁に使用される）画素値を含む。所与のブロックのビデオデータにおいて頻繁に表現されない画素値は、パレットテーブルに含まれないか、又は回避色としてパレットテーブルに含まれる。

【0064】

パレットテーブルの各エントリは、パレットテーブルの中の対応する画素値に関するインデックスを含む。ブロックの中のサンプルに関するパレットインデックスは、サンプルを予測するか又は再構成するために使用されるパレットテーブルのエントリを指示するように符号化され得る。このパレットモードは、ピクチャ、スライス、タイル、又はビデオブロックのそのようなグループ化の最初のブロックに関するパレット予測子を生成するプロセスから始まる。以下で説明されるように、後続のビデオブロックに関するパレット予測子は、一般的には、以前に使用されたパレット予測子を更新することによって生成される。例示のために、パレット予測子はピクチャレベルで定義されると想定されている。言い換えれば、ピクチャは、それぞれが固有のパレットテーブルを有する複数の符号化ブロックを含み得るが、全体のピクチャに関する１つのパレット予測子がある。

【0065】

ビデオビットストリームにおけるパレットエントリの信号伝達に必要なビット数を低減するために、ビデオ復号器は、ビデオブロックを再構成するために使用されるパレットテーブルの新しいパレットエントリを決定するためにパレット予測子を利用し得る。たとえば、パレット予測子は、以前に使用されたパレットテーブルからのパレットエントリを含んでよく、あるいは、つい最近使用されたパレットテーブルのすべてのエントリを含むことにより、つい最近使用されたパレットテーブルを用いて初期化されてもよい。いくつかの実施形態では、パレット予測子は、つい最近使用されたパレットテーブルからのすべてのエントリよりも少ないエントリを含み、次いで、以前に使用された他のパレットテーブルからのいくつかのエントリを組み込んでもよい。パレット予測子のサイズは、異なるブロックを符号化するために使用されるパレットテーブルのサイズと比較して、同一でも、より大きくても、より小さくてもよい。一例では、パレット予測子は、６４のパレットエントリを含む先入れ先出し（ＦＩＦＯ）テーブルとして実現される。

【0066】

パレット予測子からのビデオデータのブロックに関するパレットテーブルを生成するために、ビデオ復号器は、符号化ビデオビットストリームから、パレット予測子の各入力について１ビットのフラグを受け取り得る。１ビットのフラグは、パレット予測子の関連する入力がパレットテーブルの中に含まれることを指示する第１の値（たとえば２進数の１）又はパレット予測子の関連する入力がパレットテーブルの中に含まれないことを指示する第２の値（たとえば２進数の０）を有し得る。パレット予測子のサイズがビデオデータのブロック用に使用されるパレットテーブルよりも大きい場合には、ビデオ復号器は、一旦パレットテーブルの最大サイズに達したら、さらにフラグを受け取ることを停止してよい。

【0067】

いくつかの実施形態では、パレットテーブルのいくつかのエントリは、パレット予測子を使用して決定されるのではなく、符号化ビデオビットストリームにおいて直接信号伝達され得る。そのようなエントリについて、ビデオ復号器は、符号化ビデオビットストリームから、エントリに関連した輝度成分及び２つの色差成分に関する画素値を指示する３つの個別のｍビットの値を受け取り得、ｍはビデオデータのビット深度を表現する。直接信号伝達されるパレットエントリのために複数のｍビットの値が必要とされるのに対して、パレット予測子から導出されるパレットエントリが必要とするのは１ビットのフラグのみである。したがって、パレット予測子を使用してパレット入力のいくつか又はすべてを信号伝達すれば、新規のパレットテーブルの入力を信号伝達するために必要なビット数をかなり低減することができ、それによって、パレットモード符号化の全体的な符号化効率を改善する。

【0068】

多くの事例において、１つのブロックに関するパレット予測子は、以前に符号化された１つ以上のブロックを符号化するために使用されたパレットテーブルに基づいて決定される。しかし、ピクチャ、スライス又はタイルにおける最初の符号化ツリーユニットを符号化するときには、以前に符号化されたブロックのパレットテーブルを利用できない可能性がある。したがって、以前に使用されたパレットテーブルのエントリを使用してパレット予測子を生成することはできない。そのような場合には、以前に使用されたパレットテーブルが利用できないときにパレット予測子を生成するために使用された値である、一連のパレット予測子の初期化指定子が、シーケンスパラメータセット（ＳＰＳ）及び／又はピクチャパラメータセット（ＰＰＳ）において信号伝達されてよい。ＳＰＳは、一般に、各スライスセグメントヘッダに見られるシンタックス要素によって参照されるＰＰＳに見られるシンタックス要素のコンテンツによって決定されたものとして、符号化ビデオシーケンス（ＣＶＳ）と呼ばれる一連の連続した符号化ビデオピクチャに適合するシンタックス要素のシンタックス構造を指す。ＰＰＳは、一般に、各スライスセグメントヘッダに見られるシンタックス要素によって決定されたものとして、ＣＶＳの内部の１つ以上の個々のピクチャに適合するシンタックス要素のシンタックス構造を指す。したがって、ＳＰＳは、一般にＰＰＳよりも上位のレベルのシンタックス構造とみなされ、ＳＰＳに含まれるシンタックス要素は、一般にそれほど頻繁に変化せず、ＰＰＳに含まれるシンタックス要素と比較して、ビデオデータのより大きい部分に適合することを意味する。

【0069】

図５Ａ～図５Ｂは、本開示のいくつかの実装形態による、コンテキストコーディング及びバイパスコーディングを使用する効率的な符号化の変換の例を示すブロック図である。

【0070】

ＶＶＣにおける変換係数コーディングとＨＥＶＣにおける変換係数コーディングとは、どちらもオーバラップしない係数グループ（ＣＧ又はサブブロックとも呼ばれる）を使用するので類似である。しかしながら、２つの方式の間にはいくつかの差異もある。ＨＥＶＣでは、係数の各ＣＧは４×４の固定サイズを有する。ＶＶＣの草案６では、ＣＧサイズはＴＢサイズに依拠するようになる。結果として、ＶＶＣでは様々なＣＧサイズ（１×１６、２×８、８×２、２×４、４×２及び１６×１）が使用可能である。符号化ブロックの内部のＣＧ及びＣＧの内部の変換係数は、既定の走査順序に従って符号化される。

【0071】

１つの画素ごとのコンテキスト符号化ビン（ＣＣＢ）の最大数を制限するために、ＴＢの領域及びビデオコンポーネントのタイプ（すなわち輝度コンポーネント対色差コンポーネント）が、ＴＢのコンテキスト符号化ビン（ＣＣＢ）の最大数を導出するように使用される。いくつかの実施形態では、コンテキスト符号化ビンの最大数はＴＢ＿ｚｏｓｉｚｅ＊１．７５と等しい。ここで、ＴＢ＿ｚｏｓｉｚｅは、係数のゼロ設定後のＴＢの内部のサンプル数を表す。ｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇは、ＣＧが非ゼロ係数を含有するか否かを指示するフラグであり、ＣＣＢカウントについては考慮に入れられないことに留意されたい。

【0072】

係数のゼロ設定は、ゼロに設定される変換ブロックの、ある領域に配置された変換ブロックの強制係数に対して実行される演算である。たとえば、現行のＶＶＣでは、６４×６４のＴＢは関連するゼロ設定演算を有する。その結果、６４×６４のＴＢの左上の３２×３２領域の外部に配置された変換係数は、すべてが強制的にゼロに設定される。実際には、現行のＶＶＣでは、ある次元に沿って３２を超えたサイズを有するあらゆる変換ブロックに対する係数のゼロ設定演算は、左上の３２×３２の領域を超えて配置された係数を、その次元に沿って強制的にゼロにするように実行される。

【0073】

ＶＶＣのコーディング変換係数において、変数ｒｅｍＢｉｎｓＰａｓｓ１が、最初に、コンテキスト符号化ビン（ＭＣＣＢ）の許容された最大数に設定される。符号化プロセス中に、コンテキスト符号化ビンが信号伝達されるごとに、変数は１つ減少される。ｒｅｍＢｉｎｓＰａｓｓ１が４以上である間は、係数は、第１のパスにおいて、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ及びａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇを含むシンタックス要素とともに、すべてがコンテキスト符号化ビンを使用して信号伝達される。係数のレベル情報の残りの部分は、第２のパスにおいて、ゴロム・ライス（Ｇｏｌｏｍｂ－Ｒｉｃｅ）符号及びバイパス符号化ビンを使用して、ａｂｓ＿ｒｅｍａｉｎｄｅｒのシンタックス要素とともに符号化される。ｒｅｍＢｉｎｓＰａｓｓ１が第１のパスの符号化の間に４未満になったときには、現在の係数は第１のパスにおいて符号化されず、第２のパスにおいて、ゴロム・ライス符号及びバイパス符号化ビンを使用して、ｄｅｃ＿ａｂｓ＿ｌｅｖｅｌのシンタックス要素とともに直接符号化される。すべての前述のレベル符号化の後に、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇが１に等しいすべての走査位置の記号（ｓｉｇｎ＿Ｆｌａｇ）が、最後にバイパスビンとして符号化される。そのようなプロセスは図５Ａに表されている。ｒｅｍＢｉｎｓＰａｓｓ１はすべてのＴＢに対するリセットである。ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ、及びａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇに対するコンテキスト符号化ビンの使用から、残りの係数に対するバイパス符号化ビンの使用への移行が生じるのは、１つのＴＢ当たり多くて１回である。係数サブブロックについては、ｒｅｍＢｉｎｓＰａｓｓ１が、そのまさに第１の係数を符号化する前に４未満であれば、係数サブブロックの全体がバイパス符号化ビンを使用して符号化される。

【0074】

変換係数と変換スキップ係数との両方の符号化に対して１つの残差符号化方式が設計されているＨＥＶＣとは異なり、ＶＶＣでは、変換係数と変換スキップ係数（すなわち残差）とに対してそれぞれ２つの個別の残差符号化方式が採用される。

【0075】

たとえば、変換スキップモードにおける残差の統計的特性は、変換係数のものとは異なることが観測されており、また低周波成分のまわりにエネルギー圧縮はない。残差コーディングは、（空間の）変換スキップ残差の種々の信号特性を明らかにするように修正され、以下の事項を含む。

【0076】

（１）最後のｘ／ｙ位置の信号伝達がないこと；

【0077】

（２）すべての前のフラグが０に等しいときのＤＣサブブロックを除いて、すべてのサブブロックについて符号化された符号化サブブロックフラグ；

【0078】

（３）２つの近隣の係数を伴うｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇコンテキストモデリング；

【0079】

（４）コンテキストモデルを１つだけ使用するｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ；

【0080】

（５）５つ、７つ、９つよりも多くの追加のフラグ；

【0081】

（６）残りの２値化処理のための修正されたライス（ｒｉｃｅ）パラメータの導出；及び

【0082】

（７）当該符号フラグに関するコンテキストモデリングは左の近隣の係数値及び上の近隣の係数値に基づいて決定され、すべてのコンテキスト符号化ビンを一緒に維持するためにｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇの後に符号フラグが解析されること。

【0083】

図５Ｂに示されるように、シンタックス要素ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ｃｏｅｆｆ＿ｓｉｇｎ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇは、第１のパスで、１つの残差サンプルから別の残差サンプルへとインタリーブ方式で符号化され、続いて、第２のパスで、ビット面によってａｂｓ＿ｌｅｖｅｌ＿ｇｔＸ＿ｆｌａｇが符号化され、第３のパスでａｂｓ＿ｒｅｍａｉｎｄｅｒが符号化される。

【0084】

パス１：ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ｃｏｅｆｆ＿ｓｉｇｎ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ

【0085】

パス２：ａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ５＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ７＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ９＿ｆｌａｇ

【0086】

パス３：ａｂｓ＿ｒｅｍａｉｎｄｅｒ

【0087】

図６は、本開示のいくつかの実装形態による従属スカラー量子化の例示的プロセスを示すブロック図である。

【0088】

現行のＶＶＣでは、最大のＱＰ値は５１～６３に拡張されており、それに応じて初期のＱＰの信号伝達が変更される。ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａの非ゼロ値が符号化されるとき、ＳｌｉｃｅＱｐＹの初期値はスライスセグメント層において修正され得る。変換スキップブロックについて、ＱＰが１に等しいとき量子化ステップサイズは１になるので、許容されるＱＰの最小値は４と定義される。

【0089】

加えて、ＨＥＶＣで使用されるスカラー量子化は、「従属スカラー量子化（Ｄｅｐｅｎｄｅｎｔｓｃａｌａｒｑｕａｎｔｉｚａｔｉｏｎ）」と呼ばれる新規の概念に適合される。従属スカラー量子化は、変換係数の１組の容認される再構成値が、再構成の順序において、現行の変換係数レベルに先行する変換係数レベルの値に依拠する手法を指す。容認される再構成ベクトルは、ＨＥＶＣで使用される従来の独立したスカラー量子化と比較して、Ｎ次元のベクトル空間に、より高密度に圧縮される（Ｎは変換ブロックにおける変換係数の数を表す）。すなわち、Ｎ次元の単位ボリュームごとに容認される再構成ベクトルの所与の平均数については、入力ベクトルと最も近い再構成ベクトルの間の平均歪みが縮小される。従属スカラー量子化の手法は、（ａ）異なる再構成レベルを用いて２つのスカラー量子化器を定義し、（ｂ）２つのスカラー量子化器の間を切り換えるためのプロセスを定義することによって実現される。

【0090】

使用される２つのスカラー量子化器はＱ０及びＱ１によって表され、図６に示されている。使用可能な再構成レベルの位置は、量子化ステップサイズΔによって一意的に規定される。使用されるスカラー量子化器（Ｑ０又はＱ１）は、ビットストリームにおいて明示的に信号伝達されるわけではない。代わりに、現行の変換係数用に使用される量子化器は、符号化又は再構成の順序において現行の変換係数に先行する変換係数のレベルのパリティによって決定される。

【0091】

図７は、本開示のいくつかの実装形態による、２つの異なるスカラー量子化器の間を切り換えるための例示的ステートマシンを示すブロック図である。

【0092】

図７に示されるように、２つのスカラー量子化器（Ｑ０とＱ１）の間の切換えは、４つの量子化器状態（ＱＳｔａｔｅ）を有するステートマシンによって実現される。ＱＳｔａｔｅは４つの異なる値０、１、２、３を採用することができる。ＱＳｔａｔｅ値は、符号化／再構成の順序において現行の変換係数に先行する変換係数レベルのパリティによって一意的に決定される。変換ブロックの逆量子化の開始において、ＱＳｔａｔｅは０に設定される。変換係数は、走査順（すなわちエントロピー復号と同一の順序）に再構成される。現行の変換係数が再構成された後に、図７に示されるように状態が更新され、ｋは変換係数レベルの値を表す。

【0093】

デフォルトのスケーリングマトリクス及びユーザー定義のスケーリングマトリクスを信号伝達することもサポートされている。デフォルトモードのスケーリングマトリクスはすべてフラットであり、要素は、すべてのＴＢサイズについて１６に等しい。ＩＢＣ及びイントラ符号化モードは、現在同一のスケーリングマトリクスを共有する。したがって、ＵＳＥＲ＿ＤＥＦＩＮＥＤマトリクスの場合には、ＭａｔｒｉｘＴｙｐｅ及びＭａｔｒｉｘＴｙｐｅ＿ＤＣの数は以下のように更新される。

【0094】

ＭａｔｒｉｘＴｙｐｅ：３０＝２（イントラ＆ＩＢＣ／インター用）×３（Ｙ／Ｃｂ／Ｃｒ成分）×５（正方形ＴＢのサイズ：色差は２×２～３２×３２、輝度は４×４～６４×６４）

【0095】

ＭａｔｒｉｘＴｙｐｅ＿ＤＣ：１４＝２（イントラ＆ＩＢＣ／インター用の２×Ｙ成分用の１）×３（ＴＢサイズ：１６×１６、３２×３２、６４×６４）＋４（イントラ＆ＩＢＣ／インター用の２×Ｃｂ／Ｃｒ成分用の２）×２（ＴＢサイズ：１６×１６、３２×３２）

【0096】

ＤＣ値は、１６×１６、３２×３２、及び６４×６４といったスケーリングマトリクスに対して別個に符号化される。８×８よりも小さいサイズのＴＢについては、すべての要素が１つのスケーリングマトリクスで信号伝達される。ＴＢのサイズが８×８以上であれば、１つの８×８スケーリングマトリクスにおける６４の要素のみがベーススケーリングマトリクスとして信号伝達される。８×８よりも大きいサイズの正方マトリクスを得るためには、８×８ベースのスケーリングマトリクスは、（要素をコピーすることによって）対応する正方形サイズ（すなわち１６×１６、３２×３２、６４×６４）へとアップサンプリングされる。６４点の変換に対して高周波係数のゼロ設定が適用されるとき、スケーリングマトリクスの対応する高周波もゼロ設定される。すなわち、ＴＢの幅又は高さが３２以上であると、係数の左半分又は上半分のみが維持され、残りの係数はゼロに割り当てられる。その上に、６４×６４のスケーリングマトリクスに関して信号伝達される要素の数も、８×８から、右下の４×４の要素は使用されないので、３つの４×４のサブベクトル－マトリクスへと減少される。

【0097】

変換係数レベルの絶対値に関するシンタックス要素の確率モデルの選択は、ローカル近隣における絶対レベル又は部分的に再構成された絶対レベルの値に依拠する。

【0098】

選択される確率モデルは、ローカル近隣における絶対レベル（又は部分的に再構成された絶対レベル）の合計、及びローカル近隣における０よりも大きい絶対レベルの数（１に等しいｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇｓの数によって与えられる）に依拠する。コンテキストモデリング及び２値化処理は、ローカル近隣に関する以下の測定値に依拠する。
・ｎｕｍＳｉｇ：ローカル近隣における非ゼロレベルの数、
・ｓｕｍＡｂｓ１：ローカル近隣における第１のパスの後に部分的に再構成された絶対レベル（ａｂｓＬｅｖｅｌ１）の合計、
・ｓｕｍＡｂｓ：ローカル近隣における再構成された絶対レベルの合計、
・対角位置（ｄ）：変換ブロック内の現在の走査位置の水平座標と垂直座標との合計。

【0099】

ｎｕｍＳｉｇ、ｓｕｍＡｂｓ１、及びｄの値に基づいて、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ、及びａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇを符号化するための確率モデルが選択される。ａｂｓ＿ｒｅｍａｉｎｄｅｒ及びｄｅｃ＿ａｂｓ＿ｌｅｖｅｌを２値化処理するためのライスパラメータは、ｓｕｍＡｂｓ及びｎｕｍＳｉｇの値に基づいて選択される。

【0100】

現行のＶＶＣでは、縮小された３２点のＭＴＳ（ＲＭＴＳ３２とも呼ばれる）は高周波係数をスキップすることに基づくものであり、３２点のＤＳＴ－７／ＤＣＴ－８の計算の複雑さを軽減するように使用される。また、３２点のＭＴＳは、すべてのタイプのゼロ設定（すなわち、ＤＣＴ２における高周波成分に対するＲＭＴＳ３２及び既存のゼロ設定）を含む係数の符号化の変更を伴う。具体的には、最後の非ゼロ係数位置の符号化の２値化処理は、縮小されたＴＵサイズに基づいて符号化され、また、最後の非ゼロ係数位置を符号化するためのコンテキストモデルの選択は元のＴＵサイズによって決定される。加えて、変換係数のｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇを符号化するために６０のコンテキストモデルが使用される。コンテキストモデルのインデックスは、以下のように、ｌｏｃＳｕｍＡｂｓＰａｓｓ１と呼ばれる、５つの、以前に部分的に再構成された絶対レベルの最大値の合計と、従属量子化の状態ＱＳｔａｔｅとに基づいて選択される。

【0101】

ｃＩｄｘが０に等しければ、ｃｔｘＩｎｃは以下のように導出される。

【0102】

ｃｔｘＩｎｃ＝１２＊Ｍａｘ（０，ＱＳｔａｔｅ－１）＋Ｍｉｎ（（ｌｏｃＳｕｍＡｂｓＰａｓｓ１＋１）＞＞１，３）＋（ｄ＜２？８：（ｄ＜５？４：０））

【0103】

そうでなければ（ｃＩｄｘが０よりも大きければ）、ｃｔｘＩｎｃは以下のように導出される。

【0104】

ｃｔｘＩｎｃ＝３６＋８＊Ｍａｘ（０，ＱＳｔａｔｅ－１）＋Ｍｉｎ（（ｌｏｃＳｕｍＡｂｓＰａｓｓ１＋１）＞＞１，３）＋（ｄ＜２？４：０）

【0105】

図８は、本開示のいくつかの実装形態による、ビデオ復号器が符号化ブロックに対する残差及び係数のコーディングを実行する例示的プロセスを示す流れ図８００である。

【0106】

ＶＶＣでは、（たとえば変換スキップモードの符号化ブロックに関して）係数を符号化するとき、又は（たとえば変換モードの符号化ブロックに関して）残差を符号化するとき、ａｂｓ＿ｒｅｍａｉｎｄｅｒ及びｄｅｃ＿ａｂｓ＿ｌｅｖｅｌのシンタックスを信号伝達するために統合ライスパラメータ（ＲｉｃｅＰａｒａ）導出が使用される。唯一の相違点は、ベースレベルｂａｓｅＬｅｂｅｌが、ａｂｓ＿ｒｅｍａｉｎｄｅｒ及びｄｅｃ＿ａｂｓ＿ｌｅｖｅｌを符号化するためにそれぞれ４及び０に設定されることである。ライスパラメータは、以下のように、ローカルテンプレートにおける近隣の５つの変換係数の絶対レベルの合計ばかりでなく、対応するベースレベルにも基づいて決定される。

【0107】

ＲｉｃｅＰａｒａ＝ＲｉｃｅＰａｒＴａｂｌｅ［ｍａｘ（ｍｉｎ（３１，ｓｕｍＡｂｓ－５＊ｂａｓｅＬｅｖｅｌ），０）］

【0108】

言い換えれば、シンタックス要素ａｂｓ＿ｒｅｍａｉｎｄｅｒ及びｄｅｃ＿ａｂｓ＿ｌｅｖｅｌに関する２進符号語（２進コードワード）は、近隣の係数のレベル情報に応じて適応的に決定される。この符号語の決定は、各サンプルに対して実行されるので、係数又は残差の符号化向けにこの符号語の適応を扱うための追加論理を必要とする。

【0109】

同様に、変換スキップモードで残差ブロックを符号化するとき、シンタックス要素ａｂｓ＿ｒｅｍａｉｎｄｅｒに関する２進符号語は、近隣の残差サンプルのレベル情報に応じて適応的に決定される。

【0110】

その上に、残差符号化又は変換係数符号化に関連するシンタックス要素を符号化するとき、確率モデルの選択は近隣のレベルのレベル情報に依拠し、追加論理及び追加のコンテキストモデルを必要とする。

【0111】

本開示では、前述の問題に対処して符号化効率を改善するために、複数の残差及び係数の復号プロセスが提示される。

【0112】

いくつかの実施形態では、ビデオコーダは、残差又は変換係数の符号化において、たとえばａｂｓ＿ｒｅｍａｉｎｄｅｒといったあるシンタックス要素を符号化するために、２進符号語の変数集合を使用する。ビデオコーダは、たとえば変換ブロック／符号化ブロック、スライス、シーケンス、ＣＴＵ、ＣＵなどの量子化パラメータ（ＱＰ）、ＣＵの予測モード（たとえばＩＢＣモード又はイントラもしくはインター）、又はスライスタイプ（たとえばＩスライス、Ｐスライス又はＢスライス）といった、現在のブロックのある他の符号化された情報に応じて、２進符号語の特定のセットを選択する。ビデオコーダは、以下に列記される例示的方法のうちの１つを使用して２進符号語の変数集合を導出し得る。
１．ａｂｓ＿ｒｅｍａｉｎｄｅｒ用の符号語を決定するために現行のＶＶＣで使用されているものと同一のプロシージャが、異なるライスパラメータを用いて使用される。
２．ｋ次Ｅｘｐ－Ｇｏｌｏｍｂの２値化処理プロセス（ＥＧｋ）
３．制限されたｋ次Ｅｘｐ－Ｇｏｌｏｍｂの２値化処理

【0113】

上記で言及されたこれらの例示的方法では、ビデオコーダは、残差又は変換係数の符号化のための２進符号語の異なるセットを導出するために、ライスパラメータの異なる値を使用してよい。いくつかの実施形態では、残差サンプルの所与のブロックについて、ライスパラメータ値は、近隣のレベル情報の代わりに、ＱＰｃｕと表されるＣＵＱＰに応じて決定される。テーブル１に示されるように、特定の１つの例が以下で示され、ＴＨ１～ＴＨ４は、（ＴＨ１＜ＴＨ２＜ＴＨ３＜ＴＨ４）を満たす所定の閾値であり、Ｋ０～Ｋ４は所定のライスパラメータ値である。同一の論理が、実際には違った風に実装され得ることは注目に値する。たとえば、テーブル１に示されるように、現在のＣＵのＱＰ値から同一のライスパラメータを導出するために、ある式又はルックアップテーブルが使用され得る。言い換えれば、ここのＱＰ値は、量子化レベルを定義することと、ライスパラメータを決定することとの２つの目的に役立つ。

【0114】

【表1】

【0115】

なお、ライスパラメータ及び対応する閾値の集合は、シンタックス要素に関する符号語の決定に関連したライスパラメータ及び対応する閾値のすべての全集合又は部分集合であり得る。ライスパラメータ及び対応する閾値の集合は、ビデオビットストリームにおける異なるレベルで信号伝達され得る。たとえば、この集合は、シーケンスレベル（たとえばシーケンスパラメータの集合）、ピクチャレベル（たとえばピクチャパラメータの集合）、スライスレベル（たとえばスライスヘッダ）、符号化ツリーユニット（ＣＴＵ）レベル又は符号化ユニット（ＣＵ）レベルで信号伝達され得る。

【0116】

一例では、変換スキップ残差符号化においてａｂｓ＿ｒｅｍａｉｎｄｅｒシンタックス要素を符号化するための符号語を決定するために使用されるライスパラメータは自体が、スライスヘッダ、ＰＰＳヘッダ、及び／又はＳＰＳヘッダにおいて信号伝達される。信号伝達されたライスパラメータは、ＣＵがスキップモード変換として符号化されて前述のスライスヘッダ／ＰＰＳ／ＳＰＳに関連づけられるとき、シンタックスａｂｓ＿ｒｅｍａｉｎｄｅｒを符号化するための符号語を決定するように使用される。いくつかの実施形態では、ライスパラメータ値がより大きければ、符号語の長さがより均一に分配されることになる。

【0117】

いくつかの実施形態では、ビデオコーダは、変換係数符号化及び／又は変換スキップ残差符号化のシンタックス要素に関する符号語の決定に関連したパラメータ及び対応する閾値の集合を使用する。また、ビデオコーダは、現在のブロックが輝度の残差／係数又は色差の残差／係数を含有しているかどうかに応じて別々の集合を使用することができる。決定された符号語は、たとえば算術符号化といったエントロピー符号化器によってシンタックス要素を符号化するとき、２値化処理符号語（２値化処理コードワード）として使用される。

【0118】

たとえば、現行のＶＶＣにおいて使用されている、変換残差コーディングに関連したａｂｓ＿ｒｅｍａｉｎｄｅｒに関する符号語が、輝度ブロックと色差ブロックとの両方に使用される。ビデオコーダは、符号化プロセスを改善するために、輝度ブロック及び色差ブロックに対して、それぞれ異なる一定のライスパラメータを使用する（Ｋ１及びＫ２を整数として、たとえば輝度ブロックに対してＫ１を使用し、色差ブロックに対してＫ２を使用する）ことができる。

【0119】

いくつかの実施形態では、変換係数符号化及び／又は変換スキップ残差符号化のシンタックス要素用の符号語決定に関連したパラメータ値（たとえばＫ１～Ｋ４）及び／又は閾値（たとえばＴＨ１～ＴＨ４）の集合はビットストリームへと信号伝達され、パラメータ値（たとえばＫ１～Ｋ４）及び／又は閾値（たとえばＴＨ１～ＴＨ４）の別の集合は輝度ブロック及び色差ブロック向けに信号伝達され得る。決定された符号語は、たとえば算術符号化といったエントロピー符号化器によってシンタックス要素を符号化するとき、２値化処理符号語として使用される。

【0120】

残差／係数復号のための前述の改善されたプロセスを実施するために、ビデオ復号器３０は、最初に、ビットストリームから、符号化ユニットに対応する１つ以上のシンタックス要素及びビデオデータを受け取る（８１０）。次に、ビデオコーダ３０は、１つ以上のシンタックス要素に応じてライスパラメータ値を決定する（８２０）。

【0121】

いくつかの実施形態では、ビデオ復号器３０は、符号化ブロックに含まれる情報（たとえば１つ以上のシンタックス要素）に基づいてライスパラメータ値を決定する。たとえば、１つ以上のシンタックス要素は量子化パラメータ（ＱＰ）を含み、ビデオコーダはＱＰ（たとえばＱＰ_ＣＵ）を閾値（たとえばＴＨ１～ＴＨ４）の集合と比較し、各閾値は候補ライスパラメータ値（たとえばＫ０～Ｋ４）を有する。ビデオコーダは、量子化パラメータを対象として含む一対の閾値（たとえばＱＰ_ＣＵはＴＨ１とＴＨ２との間にある）を決定し、次いで、上記で説明されたように、対の閾値に対応する２つの候補ライスパラメータのうちの１つとしてライスパラメータ値を決定する。いくつかの実施形態では、正の無限大及び負の無限大も暗黙の閾値として考慮に入れられる。

【0122】

いくつかの実施形態では、閾値と、関連する候補ライスパラメータ値との集合は、ビデオ復号器３０のメモリに記憶された一定の（たとえば所定の）値である。言い換えれば、ビデオ復号器３０は、これらの値を、ビットストリームから受け取るのではなく、符号化／復号の仕様に基づいて決定する。次いで、ビデオ復号器３０はテーブル１に記述された論理に基づいてライスパラメータ値を決定する。

【0123】

いくつかの実施形態では、閾値及び関連する候補ライスパラメータ値の集合は、ビットストリームの１つ以上のシンタックス要素で伝えられる変数である。次いで、ビデオ復号器３０は、ビットストリームの中の情報からこれらの値を決定する。たとえば、ビデオ復号器３０は、ビットストリームからＫ１～Ｋ４の値及びＴＨ１～ＴＨ４の値から受け取る。次いで、ビデオ復号器３０はテーブル１に記述された論理に基づいてライスパラメータ値を決定する。

【0124】

いくつかの実施形態では、１つ以上のシンタックス要素がライスパラメータ値自体を含む。その結果、ビデオ復号器３０は、ビットストリームからライスパラメータの値を直接受け取る。ライスパラメータ値は、１、２、３、又はビデオエンコーダ２０によって、たとえばレート－歪み解析に基づいて選択された他の定数値でよい。その結果、ビデオ復号器３０は、ライスパラメータの値がビットストリームで直接信号伝達されるので、テーブル１に記述されたプロセスを見合わせる。

【0125】

次いで、ビデオ復号器３０は、ビデオデータから、符号化ユニット内の画素に関する第１の符号語（コードワード）及び第２の符号語（コードワード）を復号する（８３０）。たとえば、ビデオ復号器３０は、以前に決定されたライスパラメータ値を使用して生成された所定のマッピング関係に応じて、第１の符号語を画素のパラメータ（たとえばａｂｓ＿ｒｅｍａｉｎｄｅｒ）に変換する（８４０）。ビデオ復号器３０は、第２の符号語をパラメータの記号値（ｓｉｇｎｖａｌｕｅ）に変換する（８５０）。ビデオ復号器３０は、パラメータ及び記号値に基づいて、画素の定量化された画素値を決定する（８６０）。

【0126】

いくつかの実施形態では、ビデオ復号器３０は、符号化ユニットの輝度成分及び色差成分を復号するために別々のシンタックス要素（たとえば各ライスパラメータ）を使用する。たとえば、１つ以上のシンタックス要素は、符号化ユニットの第１の成分（たとえば輝度）に関連したシンタックス要素の第１の部分集合、及び符号化ユニットの第２の成分（たとえば色差）に関連したシンタックス要素の第２の部分集合をさらに含む。その結果、ビデオ符号化器は、輝度成分及び色差成分に対して別々のライスパラメータ値及び別々の閾値（たとえば、輝度成分に対してＫ１～Ｋ４及びＴＨ１～ＴＨ４の集合、第１の色差成分に対してＫ１～Ｋ４及びＴＨ１～ＴＨ４の別の集合、また第２の色差成分に対してＫ１～Ｋ４及びＴＨ１～ＴＨ４の別の集合）を使用する。これら別々のライスパラメータ値及び閾値は、前述の処理に基づいて決定され得る（たとえば事前に決定され得、又はビットストリームで直接信号伝達され得、もしくはＱＰ値によって間接的に決定され得る）。

【0127】

いくつかの実施形態では、符号化ユニットの第１の成分（たとえば輝度）に関連したシンタックス要素の第１の部分集合と、符号化ユニットの第２の成分（たとえば色差）に関連した第２の部分集合との間には、少なくとも１つの差異がある。

【0128】

いくつかの実施形態では、１つ以上のシンタックス要素が、シーケンス、ピクチャ、スライス、タイル、ＣＴＵ、ＣＵ、変換ユニット（ＴＵ）、及び変換ブロック（ＴＢ）からなるグループから選択された１つのレベルで信号伝達される。たとえば、ビデオ復号器３０が、ライスパラメータ値及び／又は閾値を特定のレベルにおいて一旦決定すると、そのレベル以下の符号化ユニットはすべて、復号に向けて決定された同一のライスパラメータ値及び／又は閾値を共有する。

【0129】

いくつかの実施形態では、第１の符号語は、（たとえば符号化ユニットが変換モードを使用して符号化されるとき）符号化ユニットにおける画素の変換係数の符号化に関連づけられる。

【0130】

いくつかの実施形態では、符号化ユニットが変換スキップモードの符号化ユニットであるときには、ビデオ復号器３０は、ビデオデータから、変換スキップモードの符号化ユニットの中の画素用の符号語の第１のグループを復号する。次に、ビデオ復号器３０は、符号語の第１のグループから初期のレベル値を導出して、パラメータ、記号値及び初期のレベル値から、画素の定量化された残差を導出する。

【0131】

いくつかの代替実施形態では、第１の符号語は、（たとえば符号化ユニットが変換スキップモードを使用して符号化されるとき）符号化ユニットにおける画素の残差の符号化に関連づけられる。

【0132】

いくつかの実施形態では、所定のマッピング関係は、（たとえばテーブル１に示されたような）ルックアップテーブルの形態である。

【0133】

いくつかの実施形態では、ビデオ復号器３０は、決定されたライスパラメータを使用して２値化処理パラメータを計算するステップと、２値化処理パラメータを使用して、候補残り値の集合のうちの１つのための、符号語のプレフィックス（接頭部）値及び対応する符号語の任意選択のサフィックス（接尾部）値を決定するステップと、候補残り値の集合の最後の１つが決定されるまで、候補残り値の集合の別の１つに対して、符号語の、前記決定するステップを繰り返すステップとを実行することによって、所定のマッピング関係を生成する。

【0134】

いくつかの実施形態では、符号語のプレフィックス値は、短縮化ライス（ＴｒｕｎｃａｔｅｄＲｉｃｅ）２値化処理プロセスを使用して決定される。

【0135】

いくつかの実施形態では、プレフィックス値が、すべてのビットが１に等しくなる長さ６のビットストリングであるとき、符号語のサフィックス値が決定される。

【0136】

図９は、本開示のいくつかの実装形態による、コンテキスト適応型２進算術符号化（ＣＡＢＡＣ）エンジンの例を示すブロック図である。

【0137】

コンテキスト適応型２進算術符号化（ＣＡＢＡＣ）は、たとえばＨ．２６４／ＭＰＥＧ－４ＡＶＣ、高能率映像符号化（ＨＥＶＣ）及びＶＶＣといった多くのビデオコーディング規格において使用されるエントロピー符号化の形態である。ＣＡＢＡＣは算術符号化に基づくものであり、少数の変更でビデオコーディング規格の要求に適合する。たとえば、ＣＡＢＡＣは２進シンボルを符号化し、低複雑性を保ち、あらゆるシンボルのより頻繁に使用されるビットに関する確率モデリングを可能にするものである。確率モデルは、ローカルコンテキストに基づいて適応的に選択され、符号化モードが通常は局所的にうまく相関するので、確率のより優れたモデリングを可能にする。最後に、ＣＡＢＡＣは、量子化された確率範囲及び確率状態を使用することにより、乗算なしの範囲分割を使用する。

【0138】

ＣＡＢＡＣは、種々のコンテキストに対して複数の確率モデルを有する。ＣＡＢＡＣは、最初に、すべての非２進シンボルを２進に変換する。次いで、符号化器は、各ビン（「ビット」とも称される）について、使用するべき確率モデルを選択し、次いで近くの要素からの情報を使用して確率推定を最適化する。データを圧縮するために、最後に算術符号化が適用される。

【0139】

コンテキストモデリングは、符号化シンボルの条件付き確率の推定をもたらす。適切なコンテキストモデルを利用すると、符号化のために現在のシンボルの近隣の既に符号化されているシンボルに応じて別々の確率モデルの間を切り換えることにより、所与のシンボル間冗長性が利用され得る。データシンボルを符号化するステップは以下のステージを包含している。

【0140】

２値化処理：ＣＡＢＡＣは２進算術符号化を使用するものであり、符号化されるのは２値判定（１又は０）のみであることを意味する。非２値シンボル（たとえば変換係数又は動きベクトル）は、算術符号化に先立って「２値化され」、すなわち２進符号に変換される。このプロセスは、データシンボルを可変長符号に変換する処理に類似であるが、送信する前に２進符号が（算術符号化器によって）さらに符号化される。ステージは、２値化されたシンボルの各ビン（すなわち「ビット」）に対して繰り返される。

【0141】

コンテキストモデルの選択：「コンテキストモデル」は、２値化されたシンボルの１つ以上のビンに関する確率モデルである。このモデルは、最近符号化されたデータシンボルの統計に依拠して、使用可能なモデルから選択されてよい。コンテキストモデルは、各ビンが「１」である確率又は「０」である確率を記憶する。

【0142】

算術符号化：算術符号化器は選択された確率モデルに応じて各ビンを符号化する。各ビンにつき、（「０」及び「１」に対応する）まさに２つのサブ範囲があることに留意されたい。

【0143】

確率の更新：選択されたコンテキストモデルは、実際の符号化された値に基づいて更新される（たとえばビン値が「１」であれば、「１」の度数カウントが増加される）。

【0144】

それぞれの非２進シンタックス要素の値を一連のビンへと分解することにより、ＣＡＢＡＣにおける各ビン値のさらなる処理は、関連する符号化モード決定に依拠して、通常モード又はバイパスモードに選択され得る。バイパスモードを選択されるビンは、均一な分布を仮定されるものであり、結果的に、すべての通常の２進算術符号化（及び復号）プロセスは単にバイパスされる。通常の符号化モードでは、各ビン値は、通常の２進算術符号化エンジンを使用することによって符号化され、関連する確率モデルは、シンタックス要素のタイプ及びシンタックス要素の２値化表現のビン位置すなわちビンインデックス（ｂｉｎＩｄｘ）に基づく一定の選択によって決定されるか、又は関連するサイド情報（たとえばＣＵ／ＰＵ／ＴＵの空間的近隣、成分、深度もしくはサイズ、又はＴＵの内部の位置）に依拠して、２つ以上の確率モデルから適応的に選択される。確率モデルの選択はコンテキストモデリングと称される。重要な設計決定として、後者は、一般的には、最も頻繁に観察されたビンにのみ適用され、通常はそれほど頻繁に観測されないその他のビンは、接合を使用して、一般的にはゼロ次確率モデルを使用して処理される。このようにして、ＣＡＢＡＣは、サブシンボルレベルでの選択的な適応確率モデリングを可能にし、よって、かなり低減された全体的なモデリングコスト又は学習コストでシンボル間冗長性を利用するための効率的な手段をもたらす。一定の選択と適応的な選択との両方について、原理的に、任意の２つの連続した通常の符号化されたビンの間で、ある確率モデルから別の確率モデルへの切換えが起こり得ることに留意されたい。一般に、ＣＡＢＡＣでは、コンテキストモデルの設計は、不必要なモデリングコストのオーバヘッドを防止することと、かなりの程度まで統計依存性を利用することとの、矛盾する目標の間で、優れた妥協点を見いだすという目標を反映する。

【0145】

ＣＡＢＡＣにおける確率モデルのパラメータは適応性があり、これは、ビンのソースの統計的変動に対するモデル確率の適応が、符号化器と復号器との両方で、ビンごとに、後方適応式に同期して実行されることを意味し、このプロセスは確率推定と呼ばれる。そのために、ＣＡＢＡＣにおける各確率モデルは１２６の別々の状態のうちの１つを採用することができ、関連するモデル確率値ｐは［０：０１８７５；０：９８１２５］の範囲に及ぶ。各確率モデルの２つのパラメータは、コンテキストメモリの中に７ビットのエントリとして記憶され、６ビットが、最低確率のシンボル（ＬＰＳ）のモデル確率ｐＬＰＳを表す６３の確率状態の各々用であり、１ビットが、最高確率のシンボル（ＭＰＳ）の値ｎＭＰＳ用である。

【0146】

１つ又は複数の例では、記述された機能は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組合せで実現され得る。この機能は、ソフトウェアで実現される場合には、１つ以上の命令又は符号（コード）としてコンピュータ読み取り可能な媒体に記憶されるか又は伝送されてよく、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記録媒体などの有形の媒体に対応するコンピュータ読み取り可能な記録媒体、又は、たとえば通信プロトコルによる、ある位置から別の位置へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信メディアを含み得る。このように、コンピュータ読み取り可能な媒体は、一般に（１）非一時的な有形のコンピュータ読み取り可能な記録媒体、又は（２）信号もしくは搬送波などの通信媒体に相当し得るものである。データ記録媒体は、１つ以上のコンピュータ又は１つ以上のプロセッサによって、本出願に記述された実施形態を実現するための命令、符号及び／又はデータ構造を取り出すためにアクセスされ得る、任意の利用可能な媒体でよい。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

【0147】

本明細書の実施形態の記述において使用される専門用語は、特定の実施形態のみを記述するためのものであり、特許請求の範囲を制限するようには意図されていない。実施形態及び添付の特許請求の範囲の記述で用いられるように、単数形「１つの（ａ）」、「１つの（ａｎ）」、及び「その（ｔｈｅ）」は、文脈がはっきりと別様に示さなければ、複数形も含むように意図されている。本明細書で使用されるような「及び／又は」という用語は、関連する列挙された項目のうちの１つ又は複数の、ありとあらゆる可能な組合せを指し、かつ包含することも理解されよう。「備える」及び／又は「備えている」という用語は、本明細書で使用されたとき、明示された特徴、要素、及び／又は構成要素の存在を指定するが、１つ以上の他の特徴、要素、構成要素、及び／又はこれらのグループの存在もしくは追加を排除するものではないがさらに理解されよう。

【0148】

様々な要素を説明するために、本明細書では第１、第２などの用語が用いられることがあるが、これらの要素は、これらの用語によって限定されるべきでないことも理解されよう。これらの用語は、単に１つの要素を別のものと区別するのに用いられる。たとえば、実施形態の範囲から逸脱することなく、第１の電極が第２の電極と称され得て、同様に、第２の電極が第１の電極と称され得る。第１の電極と第２の電極は、どちらも電極であるが同一の電極ではない。

【0149】

本出願の記述は解説及び説明のために提示されており、網羅的であること又は開示された形態の発明に限定されることは意図されていない。多くの修正形態、変形形態、及び代替の実施形態が、先の記述及び関連する図面において提示された教示内容の利益を有する当業者には明らかなはずである。実施形態は、本発明の原理や実際の用途について最も良く説明するため、他の当業者が様々な実施形態に関して本発明を理解することを可能にするため、また、基本原理と、企図された特定の使用法に適するものとしての様々な修正形態を伴う様々な実施形態とを最も良く利用するために、選択して記述されたものである。したがって、特許請求の範囲は、開示された実施形態の特定の実施例及びその修正形態に限定されず、添付の特許請求の範囲の範囲内に含まれるように他の実施形態が意図されていることを理解されたい。

【図1】