特許7686738 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7686738幾何学的パーティション・モードのためのコーディング・プロセス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3
4
5
6a
6b
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-05-23

(45)【発行日】2025-06-02

(54)【発明の名称】幾何学的パーティション・モードのためのコーディング・プロセス

(51)【国際特許分類】

H04N 19/119 20140101AFI20250526BHJP

H04N 19/14 20140101ALI20250526BHJP

H04N 19/176 20140101ALI20250526BHJP

H04N 19/70 20140101ALI20250526BHJP

【ＦＩ】

H04N19/119

H04N19/14

H04N19/176

H04N19/70

【請求項の数】 16

【外国語出願】

(21)【出願番号】P 2023222162

(22)【出願日】2023-12-28

(62)【分割の表示】P 2022520497の分割

【原出願日】2020-09-28

(65)【公開番号】P2024041817

(43)【公開日】2024-03-27

【審査請求日】2024-01-26

(31)【優先権主張番号】PCT/EP2019/076805

(32)【優先日】2019-10-03

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】503433420

【氏名又は名称】華為技術有限公司

【氏名又は名称原語表記】ＨＵＡＷＥＩＴＥＣＨＮＯＬＯＧＩＥＳＣＯ．，ＬＴＤ．

【住所又は居所原語表記】ＨｕａｗｅｉＡｄｍｉｎｉｓｔｒａｔｉｏｎＢｕｉｌｄｉｎｇ，Ｂａｎｔｉａｎ，ＬｏｎｇｇａｎｇＤｉｓｔｒｉｃｔ，Ｓｈｅｎｚｈｅｎ，Ｇｕａｎｇｄｏｎｇ５１８１２９，Ｐ．Ｒ．Ｃｈｉｎａ

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】ガオ，ハン

(72)【発明者】

【氏名】エセンリク，セミ

(72)【発明者】

【氏名】アルシナ，エレナアレクサンドロブナ

(72)【発明者】

【氏名】コトラ，アナンドメハー

(72)【発明者】

【氏名】ワーン，ビヤオ

【審査官】白川瑞樹

(56)【参考文献】

【文献】特表２０１２－５３１８０８（ＪＰ，Ａ）

【文献】Benjamin Bross et al.，Versatile Video Coding (Draft 6) [online]，JVET-O2001-vE，インターネット＜URL: https://jvet-experts.org/doc_end_user /documents/16_Geneva/wg11/JVET-P0068-v1.zip＞，2019年09月17日，pp.3-5.19,35,71-72,146-148,200-203,227-228,269-273,1-3, JVET-P0068_GEO_CE4-1.1_WD (on_top_of_JVET-O2001-vE).docx

【文献】Han Gao et al.，CE4-Related: Geometric Merge Mode (GEO) Simplifications [online]，JVET-P0107-v2，インターネット＜URL: https:/ /jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0107-v2.zi p＞，2019年10月02日

【文献】Benjamin Bross et al.，Versatile Video Coding (Draft 6) [online]，JVET-O2001-vE（JVET-P0885），インターネット＜URL: https://j vet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0885-v1.zip ＞，2019年10月03日，pp.269-276，JVET_P0885_JontP0107_0246_0304(onTopOf_CE4-1.14).docx

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／００－１９／９８

(57)【特許請求の範囲】

【請求項1】

復号デバイスによって実装されるコーディングの方法であって、
符号化されたビットストリームを受信することと、
前記符号化されたビットストリームを解析することによって、現在のコーディング・ブロックに対する分裂モード・インデックスの値を取得することと、
前記分裂モード・インデックスの前記値及び事前定義されたテーブルに従って、前記現在のコーディング・ブロックに対する角度インデックスの値を取得することと、
前記角度インデックスの前記値に従って、インデックスの値をセットすることと、
前記インデックスの前記値に従って、前記現在のコーディング・ブロックのためのモーション情報を記憶することと、を含み、
前記角度インデックスの前記値が第１の閾値以上であり、かつ前記角度インデックスの前記値が第２の閾値以下である場合、前記インデックスの前記値は１に等しく、そうでなければ、前記インデックスの前記値は０に等しく、前記第１の閾値及び前記第２の閾値は整数値であり、前記第１の閾値は前記第２の閾値より小さい、方法。

【請求項2】

前記第１の閾値が１３であり、前記第２の閾値が２７である、請求項１に記載の方法。

【請求項3】

前記分裂モード・インデックスの前記値は、どの幾何学的パーティション・モードが前記現在のコーディング・ブロックに使用されるかを示すために使用される、請求項１に記載の方法。

【請求項4】

前記角度インデックスの前記値は、前記現在のコーディング・ブロックの幾何学的パーティションに使用される、請求項１に記載の方法。

【請求項5】

符号化されたビットストリームを受信することと、
前記符号化されたビットストリームを解析することによって、現在のコーディング・ブロックに対する分裂モード・インデックスの値を取得することと、を行うように構成されている解析ユニットと、
前記分裂モード・インデックスの前記値及び事前定義されたテーブルに従って、前記現在のコーディング・ブロックに対する角度インデックスの値を取得するように構成されている角度インデックス値取得ユニットと、
前記角度インデックスの前記値に従って、インデックスの値をセットするように構成されているセッティング・ユニットと、
前記インデックスの前記値に従って、前記現在のコーディング・ブロックのためのモーション情報を記憶するように構成されている処理ユニットと、を含み、
前記角度インデックスの前記値が第１の閾値以上であり、かつ前記角度インデックスの前記値が第２の閾値以下である場合、前記インデックスの前記値は１に等しく、そうでなければ、前記インデックスの前記値は０に等しく、前記第１の閾値及び前記第２の閾値は整数値であり、前記第１の閾値は前記第２の閾値より小さい、ビデオ復号器。

【請求項6】

前記第１の閾値が１３であり、前記第２の閾値が２７である、請求項５に記載のビデオ復号器。

【請求項7】

前記分裂モード・インデックスの前記値は、どの幾何学的パーティション・モードが前記現在のコーディング・ブロックに使用されるかを示すために使用される、請求項５に記載のビデオ復号器。

【請求項8】

前記角度インデックスの前記値は、前記現在のコーディング・ブロックの幾何学的パーティションに使用される、請求項５に記載のビデオ復号器。

【請求項9】

命令が記憶された非一時的なコンピュータ可読記憶媒体であって、前記命令は、１つ以上のプロセッサによって実行されるときに、前記１つ以上のプロセッサに、
符号化されたビットストリームを受信することと、
前記符号化されたビットストリームを解析することによって、現在のコーディング・ブロックに対する分裂モード・インデックスの値を取得することと、
前記分裂モード・インデックスの前記値及び事前定義されたテーブルに従って、前記現在のコーディング・ブロックに対する角度インデックスの値を取得することと、
前記角度インデックスの前記値に従って、インデックスの値をセットすることと、
前記インデックスの前記値に従って、前記現在のコーディング・ブロックのためのモーション情報を記憶することと、を含む動作を実行させ、
前記角度インデックスの前記値が第１の閾値以上であり、かつ前記角度インデックスの前記値が第２の閾値以下である場合、前記インデックスの前記値は１に等しく、そうでなければ、前記インデックスの前記値は０に等しく、前記第１の閾値及び前記第２の閾値は整数値であり、前記第１の閾値は前記第２の閾値より小さい、非一時的なコンピュータ可読記憶媒体。

【請求項10】

前記第１の閾値が１３であり、前記第２の閾値が２７である、請求項９に記載の非一時的なコンピュータ可読記憶媒体。

【請求項11】

前記分裂モード・インデックスの前記値は、どの幾何学的パーティション・モードが前記現在のコーディング・ブロックに使用されるかを示すために使用される、請求項９に記載の非一時的なコンピュータ可読記憶媒体。

【請求項12】

前記角度インデックスの前記値は、前記現在のコーディング・ブロックの幾何学的パーティションに使用される、請求項９に記載の非一時的なコンピュータ可読記憶媒体。

【請求項13】

復号器であって、
１つ以上のプロセッサと、
前記１つ以上のプロセッサに結合され、命令を記憶する非一時的なコンピュータ可読記憶媒体と、を含み、前記命令は、前記１つ以上のプロセッサによって実行されるときに、前記復号器に、
符号化されたビットストリームを受信することと、
前記符号化されたビットストリームを解析することによって、現在のコーディング・ブロックに対する分裂モード・インデックスの値を取得することと、
前記分裂モード・インデックスの前記値及び事前定義されたテーブルに従って、前記現在のコーディング・ブロックに対する角度インデックスの値を取得することと、
前記角度インデックスの前記値に従って、インデックスの値をセットすることと、
前記インデックスの前記値に従って、前記現在のコーディング・ブロックのためのモーション情報を記憶することと、を行わせ、
前記角度インデックスの前記値が第１の閾値以上であり、かつ前記角度インデックスの前記値が第２の閾値以下である場合、前記インデックスの前記値は１に等しく、そうでなければ、前記インデックスの前記値は０に等しく、前記第１の閾値及び前記第２の閾値は整数値であり、前記第１の閾値は前記第２の閾値より小さい、復号器。

【請求項14】

前記第１の閾値が１３であり、前記第２の閾値が２７である、請求項１３に記載の復号器。

【請求項15】

前記分裂モード・インデックスの前記値は、どの幾何学的パーティション・モードが前記現在のコーディング・ブロックに使用されるかを示すために使用される、請求項１３に記載の復号器。

【請求項16】

前記角度インデックスの前記値は、前記現在のコーディング・ブロックの幾何学的パーティションに使用される、請求項１３に記載の復号器。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本特許出願は、２０１９年１０月３日に出願された国際特許出願第ＰＣＴ／ＥＰ２０１９／０７６８０５号に対する優先権を主張する。前述の特許出願の開示は、その全体が参照により本明細書に組み込まれる。

【0002】

本出願（開示）の実施形態は、一般に、ピクチャ処理の分野に関係し、より詳細には、幾何学的パーティションに関係する。

【背景技術】

【0003】

ビデオ・コーディング（ビデオ符号化及び復号）は、広範囲のデジタル・ビデオ・アプリケーション、例えば、放送デジタルＴＶ、インターネット及びモバイル・ネットワークを介したビデオ伝送、ビデオチャット、ビデオ会議などのリアルタイムの会話アプリケーション、ＤＶＤ及びブルーレイ・ディスク、ビデオ・コンテンツの収集及び編集システム、並びにセキュリティ・アプリケーションのカムコーダに使用される。

【0004】

比較的短いビデオでさえ描写するために必要とされるビデオ・データの量は、相当なものであり、これは、データがストリーム化されるか、又は他の方法で限定された帯域幅容量を有する通信ネットワークを介して通信されるときに、困難になることがある。したがって、ビデオ・データは、一般に、現代の電気通信ネットワークを介して通信される前に圧縮される。また、メモリ・リソースが制限されることがあるため、ビデオが記憶デバイスに記憶される場合に、ビデオのサイズも問題となる可能性がある。ビデオ圧縮デバイスは、しばしば、伝送又は記憶の前にビデオ・データをコーディングするためにソースにおいてソフトウェア及び／又はハードウェアを使用し、それによってデジタル・ビデオ画像を表すのに必要なデータ量を減少させる。次いで、圧縮されたデータは、ビデオ・データを復号するビデオ解凍デバイスによって宛先で受信される。ネットワークリソースが限られており、より高いビデオ品質の要求が絶えず増加しているため、ピクチャ品質にほとんど犠牲を払わずに圧縮比を改善する改善された圧縮及び解凍技術が望ましい。

【発明の概要】

【0005】

本出願の実施形態は、独立請求項にしたがって符号化及び復号するための装置及び方法を提供する。

【0006】

前述の目的及び他の目的は、独立請求項の主題事項によって達成される。さらなる実装は、従属請求項、明細書及び図面から明らかである。

【0007】

本発明の第１の態様は、復号デバイスによって実装されるコーディングの方法であって、現在のコーディング・ブロックに対する分裂モード・インデックス値を取得することと、分裂モード・インデックス値、及び分裂モード・インデックス値に基づいて角度インデックス値ａｎｇｌｅＩｄｘを指定するテーブルに従って、現在のコーディング・ブロックに対する角度インデックス値ａｎｇｌｅＩｄｘを取得することと、角度インデックス値ａｎｇｌｅＩｄｘに従って、インデックス値ｐａｒｔＩｄｘをセットすることと、インデックス値ｐａｒｔＩｄｘに従って、現在のコーディング・ブロックを復号することと、を含む、方法を提供する。

【0008】

本発明の実施形態によれば、コーディング・ブロックは、インデックス値に従って復号される。復号プロセスは、サンプル重み導出プロセス、モーション情報記憶プロセス、モーション・ベクトル導出プロセスなどであってもよい。したがって、バッファ利用と復号効率が改善されている。

【0009】

一実装形式では、分裂モード・インデックス値は、現在のコーディング・ブロックにどの幾何学的パーティション・モードが使用されるかを示すために使用される。例えば、ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ又はｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘである。

【0010】

一例では、ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘ０］［ｙ０］又はｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘは、幾何学的パーティショニング・マージ・モードのパーティショニング形状を指定する。配列インデックスｘ０、ｙ０は、ピクチャの左上のルマ・サンプルに対する、考慮されるコーディング・ブロックの左上のルマ・サンプルの位置（ｘ０，ｙ０）を指定する。

【0011】

ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘ０］［ｙ０］又はｇｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘ０］［ｙ０］が存在しないときに、それは、０に等しいと推論される。

【0012】

一例では、分裂モード・インデックス値は、ビデオ・ビットストリームにおいてコーディングされたインデックス値を解析することによって取得されてもよいし、分裂モード・インデックス値は、ビデオ・ビットストリームから解析される構文値に従って判定されてもよい。

【0013】

ビットストリームは、無線ネットワーク又は有線ネットワークに従って取得されてもよい。ビットストリームは、同軸ケーブル、光ファイバケーブル、ツイスト・ペア、デジタル加入者線、又は赤外線、ラジオ、マイクロ波、ＷＩＦＩ、Ｂｌｕｅｔｏｏｔｈ、ＬＴＥ若しくは５Ｇの無線技術を使用して、ウェブサイト、サーバ、又は他のリモート・ソースから送信されてもよい。

【0014】

一実施形態では、ビットストリームは、例えば、１つ以上のコーディングされたビデオ・シーケンス（ＣＶＳ）を形成するアクセス・ユニット（ＡＵ）のシーケンスの表現を形成するネットワーク抽象化レイヤ（ＮＡＬ）ユニット・ストリーム又はバイト・ストリームの形態のビットのシーケンスである。

【0015】

いくつかの実施形態では、復号プロセスの場合、復号器側がビットストリームを読み、ビットストリームから復号されたピクチャを導出し、符号化プロセスの場合、符号化器側がビットストリームを生成する。

【0016】

通常、ビットストリームは、構文構造によって形成される構文要素を含むだろう。
構文要素：ビットストリームで表現されるデータの要素
構文構造：指定された順序でビットストリーム内に一緒に存在する０個以上の構文要素

【0017】

特定の例では、ビットストリームフォーマットは、ネットワーク抽象化レイヤ（ＮＡＬ）ユニット・ストリームとバイト・ストリームとの間の関係を指定し、これらはいずれもビットストリームと呼ばれる。

【0018】

ビットストリームは、例えば、ＮＡＬユニット・ストリーム・フォーマット又はバイト・トリーム・フォーマットの２つのフォーマットのいずれかであり得る。ＮＡＬユニット・ストリーム・フォーマットは概念的には、より「基本的な」タイプである。ＮＡＬユニット・ストリーム・フォーマットは、ＮＡＬユニットと呼ばれる構文構造のシーケンスを含む。このシーケンスは、復号順序で順序付けされる。ＮＡＬユニット・ストリームにおけるＮＡＬユニットの復号順序（及び）に課される制約がある。

【0019】

バイト・ストリーム・フォーマットは、ＮＡＬユニットを復号順に順序付け、各ＮＡＬユニットに開始コードプレフィックスとゼロ以上のゼロ値バイトをプレフィックスしてバイトのストリームを形成することによって、ＮＡＬユニット・ストリーム・フォーマットから構成されてもよい。ＮＡＬユニット・ストリーム・フォーマットは、このバイトのストリームにおけるユニークな開始コード・プレフィックス・パターンの位置をサーチすることによって、バイト・ストリーム・フォーマットから抽出され得る。

【0020】

この項は、ビットストリームを介して与えられる、ソースと復号されたピクチャとの間の関係の一実施形態を指定する。

【0021】

ビットストリームによって表されるビデオ・ソースは、復号順序のピクチャのシーケンスである。

【0022】

通常、ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘ０］［ｙ０］の値は、ビットストリームから復号される。一例では、ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［］［］の値の範囲は、０と６３を含む０～６３である。一例では、ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［］［］の復号プロセスは、「バイパス」である。

【0023】

ｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘ０］［ｙ０］が存在しないときに、それは０に等しいと推論される。

【0024】

一実装形式では、角度インデックス値ａｎｇｌｅＩｄｘは、現在のコーディング・ブロックの幾何学的パーティションに使用される。

【0025】

一例では、角度インデックス値ａｎｇｌｅＩｄｘは、幾何学的パーティションの角度インデックスを指定する。以下、角度インデックス値ａｎｇｌｅＩｄｘは、パーティション角度変数ａｎｇｌｅＩｄｘとも呼ばれる。

【0026】

現在のブロックに対する角度パラメータの値は、分裂モードのインデックス値と予め定義されたルックアップ・テーブルの値に従って取得される。

【0027】

一実施形態では、幾何学的パーティショニング・モードのパーティション角度変数ａｎｇｌｅＩｄｘ（角度パラメータ）及び距離変数ｄｉｓｔａｎｃｅＩｄｘは、以下の表に指定されるｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ［ｘＣｂ］［ｙＣｂ］（インジケータ）の値に従ってセットされる。実装形式では、この関係は、表１に従って、又は機能に従って実装され得る。

【表1】

【0028】

一実装形式では、インデックス値ｐａｒｔＩｄｘは、以下を満たす。

【数1】

【0029】

ここで、ｔｈｒｅｓｈｏｌｄ１及びｔｈｒｅｓｈｏｌｄ２は整数値であり、ｔｈｒｅｓｈｏｌｄ１はｔｈｒｅｓｈｏｌｄ２より小さい。

【0030】

したがって、角度インデックス値ａｎｇｌｅＩｄｘがｔｈｏｒｅｓｈｏｌｄ１とｔｈｒｅｓｈｏｌｄ２との間の区間にあるとき、又は角度インデックス値ａｎｇｌｅＩｄｘがｔｈｒｅｓｈｏｌｄ１又はｔｈｒｅｓｈｏｌｄ２に等しいときに、インデックス値ｐａｒｔＩｄｘが１にセットされ、そうではなく、角度インデックス値ａｎｇｌｅＩｄｘがこの区間の外にあるときに、インデックス値ｐａｒｔＩｄｘが０にセットされる。インデックス値ｐａｒｔＩｄｘに従って、現在のコーディング・ブロックが復号される。例えば、インデックス値ｐａｒｔＩｄｘは、２つのサブブロックのうちのどちらが第１のサブブロック（ｐａｒｔＩｄｘ＝０）で、どちらが復号される第２のサブブロック（ｐａｒｔＩｄｘ＝１）であるかを定義する。

【0031】

一例では、ｔｈｒｅｓｈｏｌｄ１が１３であり、ｔｈｒｅｓｈｏｌｄ２が２７である。

【0032】

一例では、インデックス値はｉｓＦｌｉｐとして表される分裂インデックスであってもよく、インデックス値ｉｓＦｌｉｐは、以下も満たす。

【数2】

【0033】

復号プロセスは、サンプル重み導出プロセス、運動情報記憶プロセス、モーション・ベクトル導出プロセスなどであってもよい。したがって、バッファ利用と復号効率が改善されている。

【0034】

一実装形式では、コーディング・ブロックを復号することは、インデックス値ｐａｒｔＩｄｘに従って、現在のブロックのためのモーション情報を記憶することを含む。

【0035】

本発明の第２の態様は、ビデオ復号器であって、現在のコーディング・ブロックに対する分裂モード・インデックス値を取得するように構成されている解析ユニットと、分裂モード・インデックス値、及び分裂モード・インデックス値に基づいて角度インデックス値ａｎｇｌｅＩｄｘを指定するテーブルに従って、現在のコーディング・ブロックに対する角度インデックス値ａｎｇｌｅＩｄｘを取得するように構成されている角度インデックス値取得ユニットと、角度インデックス値ａｎｇｌｅＩｄｘに従って、インデックス値ｐａｒｔＩｄｘをセットするように構成されているセッティング・ユニットと、インデックス値ｐａｒｔＩｄｘに従って、現在のコーディング・ブロックを復号するように構成されている処理ユニットと、含む、ビデオ復号器を提供する。

【0036】

一実装形式では、インデックス値ｐａｒｔＩｄｘは、以下を満たす。

【数3】

ここで、ｔｈｒｅｓｈｏｌｄ１及びｔｈｒｅｓｈｏｌｄ２は整数値であり、ｔｈｒｅｓｈｏｌｄ１はｔｈｒｅｓｈｏｌｄ２より小さい。

【0037】

一実装形式では、ｔｈｒｅｓｈｏｌｄ１が１３であり、ｔｈｒｅｓｈｏｌｄ２が２７である。

【0038】

一実装形式では、処理ユニットは、インデックス値ｐａｒｔＩｄｘに従って、現在のブロックのためのモーション情報を記憶するように構成されている。

【0039】

一実装形式では、分裂モード・インデックス値は、現在のコーディング・ブロックにどの幾何学的パーティション・モードが使用されるかを示すために使用される。

【0040】

一実装形式では、ａｎｇｌｅＩｄｘは、現在のコーディング・ブロックの幾何学的パーティションに使用される。

【0041】

本発明の第１の態様による方法は、本発明の第２の態様によるデバイスによって実行され得る。上記方法のさらなる特徴及び実装形式は、本発明の第２の態様による装置の特徴及び実装形式に対応する。一実施形態では、上記の実施形態及び実装のいずれかに１つよる方法を実施するための処理回路を含む復号器が開示される。

【0042】

一実施形態では、上記の実施形態及び実装のいずれかに１つよる方法を実行するためのプログラム・コードを含むコンピュータ・プログラム製品が開示される。

【0043】

一実施形態では、
１つ以上のプロセッサと、
プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ可読記憶媒体であって、プログラミングは、プロセッサによって実行される場合に、上記の実施形態及び実装のいずれか１つによる方法を実施するように復号器又は符号化器を設定する、非一時的なコンピュータ可読記憶媒体と、を含む、復号器又は符号化器が提供される。

【0044】

一実施形態では、画像復号デバイスによって復号される符号化されたビットストリームを含む非一時的な記憶媒体であって、ビットストリームは、ビデオ信号又は画像信号のフレームを複数のブロックに分割することによって生成され、複数の構文要素を含み、複数の構文要素は、上記の実施形態及び実装のいずれか１つによるインジケータ（構文）を含む、非一時的な記憶媒体が提供される。

【0045】

１つ以上の実施形態の詳細は、添付の図面及び以下の説明に記載されている。他の特徴、目的、及び利点は、明細書、図面、及び特許請求の範囲から明らかであろう。

【図面の簡単な説明】

【0046】

以下、本発明の実施形態が、添付の図及び図面を参照して、より詳細に説明されている。

【0047】

【図1A】本発明の実施形態を実装するように構成されているビデオ・コーディング・システムの一例を示すブロック図である。

【図1B】本発明の実施形態を実装するように構成されているビデオ・コーディング・システムの一例を示すブロック図である。

【図2】本発明の実施形態を実装するように構成されているビデオ符号化器の一例を示すブロック図である。

【図3】本発明の実施形態を実装するように構成されているビデオ復号器の例示的な構造を示すブロック図である。

【図4】符号化装置又は復号装置の一例を示すブロック図である。

【図5】符号化装置又は復号装置の別例を示すブロック図である。

【図6a】共位置にあるブロックの一例を示した。

【図6b】空間的隣接ブロックの一例を示した。

【図7】三角形予測モードのいくつかの例を示した。

【図8】サブブロック予測モードのいくつかの例を示した。

【図9】ブロックのパーティションに関するいくつかの例を示す。

【図10】ブロックのパーティションに関するいくつかの例を示す。

【図11】ブロックのパーティションに関するいくつかの例を示す。

【図12】ブロックのパーティションに関するいくつかの例を示す。

【図13】ｓｔｅｐＤのための予め定義されたルックアップ・テーブルの例示的な実装形式を示した。

【図14】ｆ（）のための予め定義されたルックアップ・テーブルの例示的な実装形式を示した。

【図15】ｓｔｅｐＤのための予め定義されたルックアップ・テーブルに関係する量子化アスペクトの例を示した。

【図16】与えられたコーディング・ブロックに対して最大ρ_ｍａｘが定義される量子化スキームの一例を示した。

【図17】与えられたコーディング・ブロックに対して代替的な最大ρ_ｍａｘが定義される量子化スキームの一例を示した。

【図18】コンテンツ供給システムの一例の構造を示すブロック図である。

【図19】端末デバイスの一例の構造を示すブロック図である。

【図20】本発明の別の実施形態を示した。

【図21】本発明の別の実施形態を示した。

【図22】本発明による方法を示すフローチャートである。

【図23】本発明による装置を示すブロック図である。

【図24】本発明による復号器の一実施形態を示すブロック図である。

【0048】

以下、同一の参照符号は、他に明示的に指定されていない場合は、同一の又は少なくとも機能的に同等の特徴を指す。

【発明を実施するための形態】

【0049】

以下の説明では、本開示の一部を形成し、本発明の実施形態の特定の態様又は本発明の実施形態が使用され得る特定の態様を例示するために、添付の図面を参照する。本発明の実施形態は、他の態様で使用することができ、図に示されていない構造的又は論理的変化を含むことが理解される。したがって、以下の詳細な説明は、限定的な意味で解釈されるべきではなく、本発明の範囲は、添付の特許請求の範囲によって定義される。

【0050】

例えば、説明された方法に関連する開示は、当該方法を実行するように構成された対応するデバイス又はシステムについても真であり、その逆もまた真であり得ることが理解される。例えば、１つ又は複数の特定の方法ステップが説明される場合、対応するデバイスは、説明された１つ又は複数の方法ステップを実行する（例えば、１つのユニットが１つ又は複数のステップを実行するか、又は複数のユニットの各々が複数のステップのうちの１つ以上を実行する）ために、１つ又は複数のユニット、例えば、機能ユニットを、たとえそのような１つ以上のユニットが明示的に説明されるか、図に示されていなくても、含んでもよい。一方、例えば、１つ又は複数のユニット、例えば、機能ユニットに基づいて特定の装置が説明される場合、対応する方法は、１つ又は複数のユニットの機能性を実行する（例えば、１つのステップが１つ又は複数のユニットの機能性を実行するか、又は複数のユニットのうちの各々が複数のユニットのうちの１つ以上の機能性を実行する複数のステップ）ために、１つのステップを、たとえそのような１つ又は複数のステップが明示的に説明されるか、図に示されていなくても、含んでもよい。さらに、本明細書で説明された種々の例示的な実施形態及び／又は態様の特徴は、特に断らない限り、互いに組み合わせてもよいことが理解される。

【0051】

ビデオ・コーディングは、典型的には、ビデオ又はビデオ・シーケンスを形成する一連のピクチャの処理を指す。用語「ピクチャ」の代わりに、用語「フレーム」又は「画像」は、ビデオ・コーディングの分野では同義語として使用されてもよい。ビデオ・コーディング（又は一般的な符号化）は、２つの部分のビデオ符号化及びビデオ復号を含む。ビデオ・コーディングは、ソース側で実行され、典型的には、元のビデオ・ピクチャを（より効率的な記憶及び／又は伝送のために）表するのに必要なデータ量を低減するために、元のビデオ・ピクチャの（例えば、圧縮による）処理を含む。ビデオ復号は、宛先側で実行され、典型的には、ビデオ・ピクチャを再構成するために符号化器と比較して、逆方向の処理を含む。ビデオ・ピクチャ（又は、一般には、ピクチャ）の「コーディング」を参照する実施形態は、ビデオ・ピクチャ又はそれぞれのビデオ・シーケンスの「符号化」又は「復号」に関係するものと理解されたい。符号化ユニットと復号ユニットの組み合わせは、ＣＯＤＥＣ（ＣｏｄｉｎｇａｎｄＤｅｃｏｄｉｎｇ）とも呼ばれる。

【0052】

可逆ビデオ・コーディングの場合、元のビデオ・ピクチャを再構成することができ、再構成されたビデオ・ピクチャは、元のビデオ・ピクチャと同じ品質を有する（記憶又は伝送の間に伝送損失又は他のデータ損失がないと仮定する）。非可逆ビデオ・コーディングの場合、ビデオ・ピクチャを表すデータの量を低減するために、例えば量子化によるさらなる圧縮が実行されるが、復号器で完全には再構成することができず、再構成されたビデオ・ピクチャの品質は、元のビデオ・ピクチャの品質より低いか又は悪い。

【0053】

いくつかのビデオ・コーディング標準は、「非可逆ハイブリッド・ビデオ・コーデック」のグループに属する（例えば、サンプル・ドメインにおける空間的及び時間的予測と、変換ドメインにおける量子化を適用するための２Ｄ変換コーディングを組み合わせる）。ビデオ・シーケンスの各ピクチャは、典型的には、重複しないブロックのセットにパーティショニングされ、コーディングは、典型的には、ブロックレベルで実行される。言い換えれば、符号化器では、ビデオは、典型的には、ブロック（ビデオ・ブロック）レベルで、例えば、空間的（ピクチャ内）予測及び／又は時間的（ピクチャ間）予測を使用して予測ブロックを生成し、現在のブロック（現在処理されている／処理されるブロック）から予測ブロックを減算して残差ブロックを得て、残差ブロックを変換し、変換ドメイン内の残差ブロックを量子化して、送信されるデータ量を低減（圧縮）することによって、処理される、例えば符号化される一方、復号器では、符号化器と比較した逆処理が符号化されたか、又は圧縮されたブロックに適用されて、提示のための現在のブロックを再構成する。さらに、符号化器は復号器処理ループを複製し、両者が同一の予測（例えば、イントラ予測及びインター予測）を生成し、及び／又は処理、例えば、後続のブロックをコーディングするための再構成を生成するようにする。ビデオ・コーディング・システム１０の以下の実施形態では、図１～図３に基づいて、ビデオ符号化器２０及びビデオ復号器３０が説明される。

【0054】

図１Ａは、例示的なコーディング・システム１０、例えば、本出願の技術を利用することができるビデオ・コーディング・システム１０（又は省略してコーディング・システム１０）を示す概略ブロック図である。ビデオ・コーディング・システム１０のビデオ符号化器２０（又は省略して符号化器２０）及びビデオ復号器３０（又は省略して復号器３０）は、本出願で説明される種々の例にしたがって技術を実行するように構成され得るデバイスの例を表す。図１Ａに示すように、コーディング・システム１０は、例えば、符号化されたピクチャ・データ１３を復号するための宛先デバイス１４に、符号化されたピクチャ・データ２１を提供するように構成されているソース・デバイス１２を含む。

【0055】

ソース・デバイス１２は、符号化器２０を含み、追加的に、例えば任意選択で、ピクチャ・ソース１６、プリプロセッサ（又は前処理ユニット）１８、例えばピクチャ・プリプロセッサ１８、及び通信インターフェース又は通信ユニット２２を含んでもよい。

【0056】

ピクチャ・ソース１６は、任意の種類のピクチャ捕捉デバイス、例えば、実世界ピクチャを捕捉するためのカメラ、及び／又は任意の種類のピクチャ生成デバイス、例えば、コンピュータ・アニメーション・ピクチャを生成するためのコンピュータ・グラフィック・プロセッサ、又は、実世界ピクチャ、コンピュータ生成ピクチャ（例えば、スクリーン・コンテンツ、バーチャル・リアリティ（ＶＲ）ピクチャ）、及び／又はそれらの任意の組み合わせ（例えば、拡張現実（ＡＲ）ピクチャ）を得る、及び／又は提供するための任意の種類の他のデバイスを含んでもよい。

【0057】

ピクチャ・ソースは、上述のピクチャのいずれかを記憶する任意の種類のメモリ又はストレージであってもよい。

【0058】

プリプロセッサ１８と、前処理ユニット１８によって実行される処理とを区別して、ピクチャ又はピクチャ・データ１７もまた、生のピクチャ又は生のピクチャ・データ１７と呼ばれてもよい。プリプロセッサ１８は、（生の）ピクチャ・データ１７を受信し、ピクチャ・データ１７に前処理を実行して、前処理されたピクチャ・データ１９又は前処理されたピクチャ・データ１９を得るように構成されている。プリプロセッサ１８によって実行される前処理は、例えば、トリミング、色フォーマット変換（例えば、ＲＧＢからＹＣｂＣｒへ）、色補正、又はノイズ除去を含んでもよい。前処理ユニット１８は、任意のコンポーネントであってもよいと理解され得る。ビデオ符号化器２０は、前処理されたピクチャ・データ１９を受信し、符号化されたピクチャ・データ２１を提供するように構成されている（例えば、図２に基づいて、さらなる詳細を以下に説明する）。ソース・デバイス１２の通信インターフェース２２は、符号化されたピクチャ・データ２１を受信し、記憶又は直接再構成のために、通信チャネル１３を介して、符号化されたピクチャ・データ２１（又はその任意のさらなる処理されたバージョン）を他のデバイス、例えば宛先デバイス１４又は任意の他のデバイスに送信するように構成されてもよい。

【0059】

宛先デバイス１４は、復号器３０（例えば、ビデオ復号器３０）を含み、追加的、例えば任意選択で、通信インターフェース又は通信ユニット２８、ポストプロセッサ３２（又は後処理ユニット３２）、及び表示デバイス３４を含んでもよい。

【0060】

宛先デバイス１４の通信インターフェース２８は、符号化されたピクチャ・データ２１（又はそのさらなる処理されたバージョン）を、例えばソース・デバイス１２から直接、又は任意の他のソース、例えば記憶デバイス、例えば符号化されたピクチャ・データ記憶デバイスから受信し、符号化されたピクチャ・データ２１を復号器３０に提供するように構成されている。

【0061】

通信インターフェース２２及び通信インターフェース２８は、ソース・デバイス１２と宛先デバイス１４との間の直接通信リンク、例えば直接有線若しくは無線接続、又は任意の種類のネットワーク、例えば有線若しくは無線ネットワーク若しくはそれらの任意の組み合わせ、若しくは任意の種類のプライベート及びパブリック・ネットワーク、又はそれらの任意の種類の組み合わせを介して、符号化されたピクチャ・データ２１又は符号化されたデータ１３を送信又は受信するように構成されてもよい。

【0062】

通信インターフェース２２は、例えば、符号化されたピクチャ・データ２１を適切なフォーマット、例えば、パケットにパッケージングし、及び／又は通信リンク又は通信ネットワークを介した伝送のための任意の種類の伝送符号化又は処理を使用して符号化されたピクチャ・データを処理するように構成されてもよい。

【0063】

通信インターフェース２２のカウンタパートを形成する通信インターフェース２８は、例えば、送信されたデータを受信し、任意の種類の対応する伝送復号又は処理及び／又はパッケージング解除を使用して伝送データを処理して、符号化されたピクチャ・データ２１を得るように構成されてもよい。

【0064】

通信インターフェース２２及び通信インターフェース２８は両方とも、ソース・デバイス１２から宛先デバイス１４へ指し示す図１Ａの通信チャネル１３の矢印によって示されるように、一方向通信インターフェース、又は双方向通信インターフェースとして構成されてもよく、例えば、通信リンク及び／又はデータ伝送例えば、符号化されたピクチャ・データ伝送に関係する任意の他の情報を確認応答及び交換するために、メッセージを送信及び受信する、例えばコネクションをセット・アップするように構成されてもよい。

【0065】

復号器３０は、符号化されたピクチャ・データ２１を受信し、復号されたピクチャ・データ３１又は復号されたピクチャ３１を提供するように構成されている（例えば、図３又は図５に基づいて、さらなる詳細を以下に説明する）。

【0066】

宛先デバイス１４のポストプロセッサ３２は、復号されたピクチャ・データ３１、例えば復号されたピクチャ３１を後処理して、後処理されたピクチャ・データ３３、例えば後処理されたピクチャ３３を得るように構成されている。後処理ユニット３２によって実行される後処理は、例えば、色フォーマット変換（例えば、ＹＣｂＣｒからＲＧＢへ）、色補正、トリミング、又は再サンプリング、又は、例えば、表示デバイス３４による表示のために、復号されたピクチャ・データ３１を準備するための任意の他の処理を含むことができる。宛先デバイス１４の表示デバイス３４は、例えばユーザ又はビューアに、ピクチャを表示するために後処理されたピクチャ・データ３３を受信するように構成されている。表示デバイス３４は、再構成されたピクチャを表すための任意の種類のディスプレイ、例えば、統合されたディスプレイ又は外部ディスプレイ若しくはモニタであってもよく、又はそれらを含んでもよい。ディスプレイは、例えば、液晶ディスプレイＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、プラズマ・ディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、液晶オン・シリコン（ＬＣｏＳ）、デジタル光プロセッサ（ＤＬＰ）、又は任意の種類の他のディスプレイを含むことができる。

【0067】

図１Ａは、ソース・デバイス１２及び宛先デバイス１４を別個のデバイスとして描いているであるが、デバイスの実施形態は、両方又は両方の機能、ソース・デバイス１２又は対応する機能性、及び宛先デバイス１４又は対応する機能性を含んでもよい。そのような実施形態では、ソース・デバイス１２又は対応する機能性と宛先デバイス１４又は対応する機能は、同じハードウェア及び／又はソフトウェア、別個のハードウェア及び／又はソフトウェア又はそれらの任意の組み合わせによって実装されてもよい。

【0068】

説明に基づいて当業者には明らかなように、図１Ａに示すように、ソース・デバイス１２及び／又は宛先デバイス１４内の異なるユニット又は機能性の存在及び機能性の（正確な）分裂は、実際のデバイス及び用途に依存して変動し得る。

【0069】

符号化器２０（例えば、ビデオ符号化器２０）、復号器３０（例えば、ビデオ復号器３０）、又は符号化器２０と復号器３０の両方は、図１Ｂに示すような処理回路、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ）、ディスクリート論理、ハードウェア、専用のビデオ・コーディング、又はそれらの任意の組み合わせによって実装されてもよい。符号化器２０は、図２の符号化器２０及び／又は本明細書で説明される任意の他の符号化器システム又はサブシステムに関して説明したように、種々のモジュールを具体化するために、処理回路４６を介して実装されてもよい。復号器３０は、図３の復号器３０及び／又は本明細書で説明される任意の他の復号器システム又はサブシステムに関して説明されるように、種々のモジュールを具体化するために、処理回路４６を介して実装されてもよい。処理回路は、後述するように、種々の演算を実行するように構成されてもよい。図５に示すように、技術が部分的にソフトウェアで実装される場合、デバイスは、好適な非一時的なコンピュータ可読記憶媒体にソフトウェアのための命令を記憶し、本開示の技術を実行するために１つ以上のプロセッサを使用してハードウェアで命令を実行することができる。
ビデオ符号化器２０とビデオ復号器３０のいずれかは、例えば図１Ｂに示すように、単一のデバイス内の組み合わされた符号化器／復号器（ＣＯＤＥＤ）の一部として一体化されてもよい。

【0070】

ソース・デバイス１２及び宛先デバイス１４は、ノートブック又はラップトップ・コンピュータ、携帯電話、スマートフォン、タブレット又はタブレット・コンピュータ、カメラ、デスクトップ・コンピュータ、セット・トップ・ボックス、テレビ、表示デバイス、デジタル・メディア・プレーヤ、ビデオゲーム機、ビデオ・ストリーミング装置（コンテンツ・サービス・サーバ又はコンテンツ配信サーバなど）、放送受信機デバイス、放送送信機装置など、任意の種類のハンドヘルド・デバイス又は固定デバイスを含む広範囲のデバイスのいずれも含んでもよく、オペレーティング・システムを全く使用しないか、又は任意の種類のものを使用してもよい。

【0071】

場合によっては、ソース・デバイス１２及び宛先デバイス１４は、無線通信用に装備されてもよい。したがって、ソース・デバイス１２及び宛先デバイス１４は、無線通信デバイスであってもよい。場合によっては、図１Ａに示されたビデオ・コーディング・システム１０は、単なる一例に過ぎず、本出願の技術は、必ずしも符号化デバイスと復号デバイスとの間の任意のデータ通信を含まないビデオ・コーディング・セッティング（例えば、ビデオ符号化又はビデオ復号）に適用されてもよい。他の例では、データはローカルメモリから検索され、ネットワークを介してストリーミングされるなどである。ビデオ符号化デバイスは、データを符号化し、メモリに記憶してもよく、及び／又はビデオ復号デバイスは、メモリからデータを検索し、復号してもよい。いくつかの例では、符号化及び復号は、互いに通信せず、単にデータをメモリに符号化し、及び／又はメモリからデータを検索及び復号するデバイスによって実行される。

【0072】

説明の便宜上、本発明の実施形態は、例えば、高効率ビデオ・コーディング（ＨＥＶＣ）又は汎用ビデオ・コーディング（ＶＶＣ）の参照ソフトウェア、ＩＴＵ－Ｔビデオ・コーディング・エキスパーツ・グループ（ＶＣＥＧ）及びＩＳＯ／ＩＥＣモーション・ピクチャ・コーディング・エキスパーツ・グループ（ＭＰＥＧ）のジョイント・コラボレーション・チーム・オン・ビデオ・コーディング（ＪＣＴ－ＶＣ）によって開発された次世代ビデオ符号化規格を参照して、本明細書に説明される。当業者は、本発明の実施形態がＨＥＶＣ又はＶＶＣに限定されないことを理解するであろう。

【0073】

符号化器及び符号化方法

【0074】

図２は、本出願の技術を実装するように構成されている例示的なビデオ符号化器２０の概略ブロック図を示す。図２の例では、ビデオ符号化器２０は、入力２０１（又は入力インターフェース２０１）、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループ・フィルタ・ユニット２２０、復号されたピクチャ・バッファ（ＤＰＢ）２３０、モード選択ユニット２６０、エントロピー符号化ユニット２７０、出力２７２（又は出力インターフェース２７２）を含む。モード選択ユニット２６０は、インター予測ユニット２４４と、イントラ予測ユニット２５４と、パーティショニング・ユニット２６２とを含んでもよい。インター予測ユニット２４４は、モーション推定ユニットと、モーション補償ユニット（図示せず）とを含んでもよい。図２に示すビデオ符号化器２０は、ハイブリッド・ビデオ符号化器又はハイブリッド・ビデオ・コーデックにしたがったビデオ符号化器とも呼ばれることがある。

【0075】

残差演算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、モード選択ユニット２６０は符号化器２０の順方向信号経路を形成するものとして呼ばれることがあるが、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループ・フィルタ２２０、復号されたピクチャ・バッファ（ＤＰＢ）２３０、インター予測ユニット２４４、及びイントラ予測ユニット２５４は、ビデオ符号化器２０の逆方向信号経路を形成するものして呼ばれることがあり、ビデオ符号化器２０の逆方向信号経路は復号器の信号経路に対応する（図３のビデオ復号器３０を参照）。また、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループ・フィルタ２２０、復号されたピクチャ・バッファ（ＤＲＢ）２３０、インター予測ユニット２４４、及びイントラ予測ユニット２５４も、ビデオ符号化器２０の「内蔵復号器」を形成すると呼ばれる。

【0076】

ピクチャ＆ピクチャのパーティショニング（ピクチャ＆ブロック）

【0077】

符号化器２０は、例えば入力２０１を介してピクチャ１７（又はピクチャ・データ１７）、例えばビデオ又はビデオ・シーケンスを形成するピクチャのシーケンスのピクチャを受信するように構成されてもよい。受信されたピクチャ又はピクチャ・データは、前処理されたピクチャ１９（又は前処理されたピクチャ・データ１９）でもよい。簡単のために、以下の説明は、ピクチャ１７を指す。また、ピクチャ１７は、現在のピクチャ又は（特に、現在のピクチャを他のピクチャ、例えば同じビデオ・シーケンス、例えば現在のピクチャも含むビデオ・シーケンスの前に符号化及び／又は復号されたピクチャから区別するためのビデオ・コーディングにおいて）符号化されるピクチャ呼ばれることがある。

【0078】

（デジタル）ピクチャは、強度値を有するサンプルの二次元配列又はマトリックスであるか、又はこれとみなされることができる。アレイ中のサンプルは、画素（ピクチャ要素の省略した形式）又はペルとも呼ばれることがある。アレイ又はピクチャの水平方向及び垂直方向（又は軸）のサンプル数は、ピクチャのサイズ及び／又は解像度を定義する。色の表現には、典型的には、３つの色コンポーネントが使用され、例えばピクチャは、３つのサンプル・アレイを表現するか、又は含んでもよい。ＲＢＧフォーマット又は色空間において、ピクチャは、対応する赤、緑及び青のサンプル・アレイを含む。しかしながら、ビデオ・コーディングにおいては、各画素は、典型的には、輝度及び色度フォーマット又は色空間、例えば、Ｙで示される輝度コンポーネント、及びＣｂ及びＣｒで示される２つの色度コンポーネントを含むＹＣｂＣｒで表わされる。輝度（又は省略してルマ）コンポーネントＹは、輝度又はグレーレベル強度（例えば、グレースケール・ピクチャなど）を表し、２つの色度（又は省略してクロマ）成分Ｃｂ及びＣｒは、色度又は色情報コンポーネントを表す。したがって、ＹＣｂＣｒフォーマットのピクチャは、輝度サンプル値（Ｙ）の輝度サンプル・アレイと、色度値（Ｃｂ及びＣｒ）の２つの色度サンプル・アレイとを含む。ＲＧＢ形式のピクチャはＹＣｂＣｒ形式に転換又は変換されてもよく、その逆も可能であり、プロセスは色変換又は転換としても知られている。ピクチャがモノクロである場合、ピクチャは、輝度サンプル・アレイのみを含んでもよい。したがって、ピクチャは、例えば、モノクロフォーマットのルマ・サンプルのアレイ、又はルマ・サンプルのアレイ、及び４：２：０、４：２：２、及び４：４：４色フォーマットのクロマ・サンプルの２つの対応するアレイであり得る。

【0079】

ビデオ符号化器２０の実施形態は、ピクチャ１７を複数の（典型的には重複しない）ピクチャ・ブロック２０３にパーティショニングするように構成されているピクチャ・パーティショニング・ユニット（図２には示さず）を含んでもよい。これらのブロックは、ルート・ブロック、マクロ・ブロック（Ｈ．２６４／ＡＶＣ）又はコーディング・ツリー・ブロック（ＣＴＢ）若しくはコーディング・ツリー・ユニット（ＣＴＵ）（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）とも呼ばれることがある。ピクチャ・パーティショニング・ユニットは、ビデオ・シーケンスのすべてのピクチャに対して同じブロックサイズと、ブロックサイズを定義する対応するグリッドを使用するか、又はピクチャ間、ピクチャのサブセット又はグループ間でブロックサイズを変更し、各ピクチャを対応するブロックに分割するように構成されてもよい。

【0080】

さらなる実施形態では、ビデオ符号化器は、ピクチャ１７のブロック２０３、例えば、ピクチャ１７を形成する１つ、複数の、又はすべてのブロックを直接受信するように構成されてもよい。ピクチャ・ブロック２０３は、現在のピクチャ・ブロック又は符号化されるピクチャ・ブロックとも呼ばれることがある。

【0081】

ピクチャ１７と同様に、ピクチャ・ブロック２０３は、再度ピクチャ１７より小さい寸法ではあるが、強度値（サンプル値）を有するサンプルの２次元アレイ又はマトリックスであるか、又はそのように見なされる。言い換えれば、ブロック２０３は、例えば、１つのサンプル・アレイ（例えば、モノクロ・ピクチャ１７の場合はルマ・アレイ、色ピクチャの場合はルマ又はクロマ・アレイ）又は３つのサンプル・アレイ（例えば、色ピクチャ１７の場合はルマ及び２つのクロマ・アレイ）又は適用される色フォーマットに依存した任意の他の数及び／又は種類のアレイを含んでもよい。ブロック２０３の方向及び垂直方向（又は軸）のサンプル数は、ブロック２０３のサイズを定義する。したがって、ブロックは、例えば、サンプルのＭｘＮ（Ｍ列×Ｎ行）アレイ、又は変換係数のＭｘＮアレイであってもよい。

【0082】

図２に示すビデオ符号化器２０の実施形態は、ブロック毎にピクチャ１７を符号化するように構成されてもよく、例えば、符号化及び予測はブロック２０３毎に実行される。

【0083】

残差計算

【0084】

残差計算ユニット２０４は、サンプル毎（画素毎）に、例えば、ピクチャ・ブロック２０３のサンプル値から予測ブロック２６５のサンプル値を減算することにより、ピクチャ・ブロック２０３及び予測ブロック２６５（予測ブロック２６５についてのさらなる詳細は後述する）に基づいて残差ブロック２０５（残差２０５とも呼ばれる）を計算して、サンプル・ドメインにおける残差ブロック２０５を得るように構成されてもよい。

【0085】

変換

【0086】

変換処理ユニット２０６は、残差ブロック２０５のサンプル値に変換、例えば離散コサイン変換（ＤＣＴ）又は離散サイン変換（ＤＳＴ）を適用して、変換ドメインにおける変換係数２０７を得るように構成されてもよい。変換係数２０７は、変換残差係数とも呼ばれ、変換ドメインにおける残差ブロック２０５を表してもよい。

【0087】

変換処理ユニット２０６は、Ｈ．２６５／ＨＥＶＣに対して指定された変換など、ＤＣＴ／ＤＳＴの整数近似を適用するように構成されてもよい。直交ＤＣＴ変換と比較して、そのような整数近似は、典型的には、特定のファクタによってスケーリングされる。順変換と逆変換によって処理される残差ブロックのノルムを保存するために、変換プロセスの一部として付加的なスケーリング・ファクタが適用される。スケーリング・ファクタは、典型的には、シフト演算のための２のべき乗であるスケーリング・ファクタ、変換係数のビット深度、精度と実装コストの間のトレードオフなどのような特定の制約に基づいて選択される。特定のスケーリング・ファクタは、例えば、逆変換処理ユニット２１２（及び、例えばビデオ復号器３０における逆変換処理ユニット３１２による対応する逆変換）によって、逆変換に対して指定され、符号化器２０において、例えば、変換処理ユニット２０６によって、順変換に対する対応するスケーリング係数が、それに従って指定されてもよい。

【0088】

ビデオ符号化器２０（それぞれ、変換処理ユニット２０６）の実施形態は、例えば、エントロピー符号化ユニット２７０を介して直接又は符号化もしくは圧縮された変換パラメータ、例えば、変換パラメータを出力するように構成されてもよく、これにより、例えば、ビデオ復号器３０は、復号のために変換パラメータを受信及び使用してもよい。

【0089】

量子化

【0090】

量子化ユニット２０８は、例えばス色量子化又はベクトル量子化を適用することによって、変換係数２０７を量子化して量子化係数２０９を得るように構成されてもよい。量子化係数２０９は、量子化変換係数２０９又は量子化残差係数２０９とも呼ばれることがある。

【0091】

量子化プロセスは、変換係数２０７の一部又は全部に関連するビット深度を低減してもよい。例えば、ｎビット変換係数は、量子化の間、ｍビット変換係数に丸められてもよく、ｎは、ｍより大きい。量子化の程度は、量子化パラメータ（ＱＰ）を調整することによって修正されてもよい。例えば、スカラ量子化では、異なるスケーリングを適用して、より微細又はより粗大な量子化を達成してもよい。より小さい量子化ステップ・サイズはより微細な量子化に対応し、より大きい量子化ステップ・サイズはより粗大な量子化に対応する。適用可能な量子化ステップ・サイズは、量子化パラメータ（ＱＰ）によって示されてもよい。量子化パラメータは、例えば、適用可能な量子化ステップ・サイズの事前定義されたセットに対するインデックスであってもよい。例えば、小さな量子化パラメータは、微細な量子化（小さな量子化ステップ・サイズ）に対応してもよく、大きな量子化パラメータは、粗大な量子化（大きな量子化ステップ・サイズ）に対応してもよく、又はその逆に対応してもよい。量子化は、量子化ステップ・サイズによる除算を含んでもよく、例えば、逆量子化ユニット２１０による、対応する及び／又は逆の量子化解除は、量子化ステップ・サイズによる乗算を含んでもよい。いくつかの規格、例えばＨＥＶＣによる実施形態は、量子化ステップ・サイズを判定するために量子化パラメータを使用するように構成されてもよい。一般に、量子化ステップ・サイズは、除算を含む式の固定点近似を使用して量子化パラメータに基づいて計算されてもよい。量子化ステップ・サイズ及び量子化パラメータの方程式の固定点近似に使用されるスケーリングのために修正され得る残差ブロックのノルムを復元するために、量子化及び量子化解除のために追加のスケーリング・ファクタを導入してもよい。一実施例では、逆変換及び脱量子化のスケーリングが組み合わせられてもよい。代替的には、カスタマイズされた量子化テーブルが使用され、符号化器から復号器へ、例えばビットストリームでシグナリングされてもよい。量子化は、損失が量子化ステップ・サイズの増加に伴って増加する不可逆演算である。ビデオ符号化器２０（それぞれ、量子化ユニット２０８）の実施形態は、例えば、直接又はエントロピー符号化ユニット２７０を介して符号化された量子化パラメータを出力するように構成されてもよく、これにより、例えば、ビデオ復号器３０は、復号のために量子化パラメータを受信及び適用してもよい。

【0092】

逆量子化

【0093】

逆量子化ユニット２１０は、例えば、量子化ユニット２０８と同じ量子化ステップ・サイズに基づいて、又は同じ量子化ステップ・サイズを使用して、量子化ユニット２０８によって適用される量子化方式の逆を適用することによって、量子化ユニット２０８の逆量子化を量子化係数に適用して、量子化解除係数２１１を得るように構成される。また、量子化解除係数２１１は、量子化解除残差係数２１１と呼ばれ、典型的には、量子化による損失のために変換係数と同一ではないが、変換係数２０７に対応する。

【0094】

逆変換

【0095】

逆変換処理ユニット２１２は、変換処理ユニット２０６によって適用された変換の逆変換、例えば逆離散余弦変換（ＤＣＴ）、逆離散正弦変換、又は他の逆変換を適用して、サンプル・ドメイン内の再構成された残差ブロック２１３（又は対応する量子化解除係数２１３）を得るように構成されている。再構成された残差ブロック２１３は、変換ブロック２１３とも呼ばれる。

【0096】

再構成

【0097】

再構成ユニット２１４（例えば、加算器又は合計器２１４）は、変換ブロック２１３（再構成された残差ブロック２１３）を予測ブロック３６５に加算し、例えば、再構成された残差ブロック２１３のサンプル値及び予測ブロック２６５のサンプル値をサンプル毎に加算することによって、サンプル・ドメイン内の再構成されたブロック２１５を得るように構成されている。

【0098】

フィルタリング

【0099】

ループ・フィルタ・ユニット２２０（又は略して「ループ・フィルタ」２２０）は、再構成されたブロック２１５をフィルタリングしてフィルタリングされたブロック２２１を得るか、又は一般に、再構成されたサンプルをフィルタリングしてフィルタリングされたサンプルを得るように構成されている。ループ・フィルタ・ユニットは、例えば、画素遷移を平滑化するように、又は、そうでなければ、ビデオ品質を改善するように構成されている。ループ・フィルタ・ユニット２２０は、ブロッキング解除フィルタ、サンプル・アダプティブ・オフセット（ＳＡＯ）フィルタ、若しくは１つ以上の他のフィルタ、例えばバイラテラル・フィルタ、アダプティブ・ループ・フィルタ（ＡＬＦ）、鮮鋭化フィルタ、平滑化フィルタ、若しくは共同フィルタ、又はそれらの任意の組み合わせなどの１つ以上のループ・フィルタを含んでもよい。ループ・フィルタ・ユニット２２０は、図２ではループ内フィルタとして示されているが、他の構成では、ループ・フィルタ・ユニット２２０は、ポスト・ループ・フィルタとして実装されてもよい。フィルタリングされたブロック２２１はまた、フィルタリングされた再構成されたブロック２２１と呼ばれることがある。ビデオ符号化器２０（それぞれ、ループ・フィルタ・ユニット２２０）の実施形態は、例えば、直接又はエントロピー符号化ユニット２７０を介して符号化されたループ・フィルタ・パラメータを出力するように構成されてもよく、これにより、例えば、復号器３０は、復号のために同じループ・フィルタ・パラメータ又はそれぞれのループ・フィルタを受信及び適用してもよい。

【0100】

復号されたピクチャ・バッファ

【0101】

復号されたピクチャ・バッファ（ＤＲＢ）２３０は、ビデオ符号化器２０によってビデオ・データを符号化するために、参照ピクチャ又は一般に、参照ピクチャ・データを記憶するメモリであってもよい。ＤＰＢ２３０は、同期ＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ）、又は他のタイプのメモリ・デバイスを含む、ダイナミック・ランダム・アクセス・メモリなどの種々のメモリ・デバイスのいずれかによって形成されてもよい。復号されたピクチャ・バッファ２３０は、１つ以上のフィルタリングされたブロック２２１を記憶するように構成されてもよい。復号されたピクチャ・バッファ２３０は、同じ現在のピクチャ又は異なるピクチャ、例えば以前に再構成されたピクチャの、他の以前にフィルタリングされたブロック、例えば以前に再構成され、フィルタリングされたブロック２２１を記憶するようにさらに構成されてもよく、例えば、インター予測のために、完全に以前に再構成された、例えば復号されたピクチャ（並びに対応する参照ブロック及びサンプル））及び／又は部分的に再構成された現在のピクチャ（並びに対応する参照ブロック及びサンプル）を提供してもよい。復号されたピクチャ・バッファ（ＤＲＢ）２３０はまた、例えば、再構成されたブロック２１５がループ・フィルタ・ユニット２２０によってフィルタリングされたものではないか、又は再構成されたブロック又はサンプルの任意の他のさらなる処理バージョンではない場合、１つ以上のフィルタリングされていない構成されたブロック２１５、又は一般に、フィルタリングされていない再構成されたサンプルを記憶するように構成されてもよい。

【0102】

モード選択（パーティショニング＆予測）

【0103】

モード選択ユニット２６０は、パーティショニング・ユニット２６２と、インター予測ユニット２４４と、イントラ予測ユニット２５４を含み、元のピクチャ・データ、例えば元のブロック２０３（現在のピクチャ１７の現在のブロック２０３）と、再構成されたピクチャ・データ、例えば、フィルタリングされた、又はフィルタリングされていない、同じ（現在の）ピクチャ、及び／又は、１つ又は複数の以前に復号されたピクチャ、例えば、復号されたピクチャ・バッファ２３０又は他のバッファ（例えば、ラインバッファ、図示せず）からの再構成されたサンプル又はブロックと、を受信し得るように構成されている。再構成されたピクチャ・データは、予測、例えば、インター予測又はイントラ予測のための参照ピクチャ・データとして使用されて、予測ブロック２６５又は予測子２６５を得る。

【0104】

モード選択ユニット２６０は、現在のブロック予測モード（パーティショニングなしを含む）及び予測モード（例えば、イントラ又はインター予測モード）に対するパーティショニングを判定又は選択し、残差ブロック２０５の計算及び再構成されるブロック２１５の再構成のために使用される対応する予測ブロック２６５を生成するように構成されてもよい。

【0105】

モード選択ユニット２６０の実施形態は、（例えば、モード選択ユニット２６０によってサポートされる、又は利用可能なものから）パーティショニング及び予測モードを選択するように構成されてもよく、これは、最良の一致、言い換えれば、最小の残差（最小の残差は、伝送又は記憶のためのより良い圧縮を意味する）、又は最小のシグナリング・オーバヘッド（最小のシグナリングは、伝送又は記憶のためのより良いの圧縮を意味する）、又は両方を考慮若しくはバランスをとったものを提供する。モード選択ユニット２６０は、レート歪み最適化（ＲＤＯ）に基づいて、パーティショニング及び予測モードを判定する、例えば最小レート歪みを提供する予測モードを選択するように構成されてもよい。この文脈における「最良」、「最低」、「最適」などの用語は、必ずしも全体的な「最良」、「最低」、「最適」などを指すのではなく、終了基準若しくは例えば、閾値を超えるか、又は下回る値のような選択基準、又は「準最適の選択」につながる可能性があるが複雑性及び処理時間を短縮する他の制約条件の達成を指してもよい。

【0106】

言い換えれば、パーティショニング・ユニット２６２は、ブロック２０３を、例えば、クワッド・ツリー・パーティショニング（ＱＴ）、バイナリ・パーティショニング（ＢＴ）、トリプル・ツリー・パーティショニング（ＴＴ）又はそれらの任意の組み合わせを反復的に使用して、より小さなブロック・パーティション又はサブブロック（再度ブロックを形成する）にパーティショニングし、例えば、ブロック・パーティション又はサブブロックごとに予測を実行するように構成されてもよく、モード選択は、パーティショニングされたブロック２０３のツリー構造の選択を含み、予測モードは、ブロック・パーティションン又はサブブロックの各々に適用される。

【0107】

以下、例示的なビデオ符号化器２０によって実行されるパーティショニング（例えば、パーティショニング・ユニット２６０による）及び予測処理（インター予測ユニット２４４及びイントラ予測ユニット２５４による）をより詳細に説明する。

【0108】

パーティショニング

【0109】

パーティショニング・ユニット２６２は、現在のブロック２０３を、例えば正方形又は長方形のサイズのより小さいブロックのような、より小さなパーティションにパーティショニング（又は分裂）することができる。これらのより小さなブロック（サブブロックとも呼ばれる）は、さらに小さなパーティションにパーティショニングされてもよい。これは、ツリー・パーティショニング又は階層ツリー・パーティショニングとも呼ばれ、ルート・ブロック、例えば、ルート・ツリー・レベル０（階層レベル０、深度０）では、再帰的にパーティショニングされてもよく、例えば、ツリー・レベル１（階層レベル１、深度１）でのノードのような次の下位ツリー・レベルの２つ以上のブロックにパーティショニングされてもよく、これらのブロックは、例えば、最大ツリー深度又は最小ブロックサイズに達するなど、例えば、終了基準が満たされるために、パーティショニングが終了するまで、例えば、ツリー・レベル２（階層レベル２、深度２）のような次の下位レベルの２つ以上のブロックに再度パーティショニングされてもよい。それ以上パーティショニングされないブロックは、ツリーのリーフ・ブロック又はリーフ・ノードとも呼ばれる。２つのパーティションへのパーティショニングを使用するツリーはバイナリ・ツリー（ＢＴ）、３つのパーティションへのパーティショニングを使用するツリーはターナリー・ツリー（ＴＴ）、４つのパーティションへのパーティショニングを使用するツリーはクワッド・ツリー（ＱＴ）と呼ばれる。前述のように、本明細書で使用される場合、用語「ブロック」は、ピクチャの一部分、特に正方形又は長方形の部分であってもよい。例えば、ＨＥＶＣ及びＶＶＣを参照すると、ブロックは、コーディング・ツリー・ユニット（ＣＴＵ）、コーディング・ユニット（ＣＵ）、予測ユニット（ＰＵ）、及び変換ユニットに対応してもよく、及び／又は対応するブロック、例えば、コーディング・ツリー・ブロック（ＣＴＢ）、コーディング・ブロック（ＣＢ）、変換ブロック（ＴＢ）、又は予測ブロック（ＰＢ）に対応してもよい。

【0110】

例えば、コーディング・ツリー・ユニット（ＣＴＵ）は、ルマ・サンプルのＣＴＢ、３つのサンプル・アレイを有するピクチャのクロマ・サンプルの２つの対応するＣＴＢ、又はモノクロ・ピクチャ若しくはサンプルをコーディングするために使用される３つの別々の色プレーン及び構文構造を使用してコーディングされるピクチャのサンプルのＣＴＢであってもよく、又は、これらを含んでもよい。これに対応して、コーディング・ツリー・ブロック（ＣＴＢ）は、あるコンポーネントのＣＴＢへの分割がパーティショニングであるように、ある値のＮのサンプルのＮｘＮブロックであってもよい。コーディング・ユニット（ＣＵ）は、ルマ・サンプルのＣＴＢ、３つのサンプル・アレイを有するピクチャのクロマ・サンプルの２つの対応するコーディング・ブロック、又はモノクロ・ピクチャ若しくはサンプルをコーディングするために使用される３つの別々の色プレーン及び構文構造を使用してコーディングされるピクチャのサンプルのコーディング・ブロックであってもよく、又は、これらを含んでもよい。これに対応して、コーディング・ブロック（ＣＢ）は、あるＣＴＢのコーディング・ブロックへの分割がパーティショニングであるように、ある値のＭ及びＮのサンプル値のサンプルのＮｘＮブロックであってもよい。

【0111】

実施形態において、例えば、ＨＥＶＣにしたがって、コーディング・ツリー・ユニット（ＣＴＵ）は、コーディング・ツリーとして示されるクワッド・ツリー構造を使用することによって、ＣＵに分裂されてもよい。ピクチャ間（時間的）又はピクチャ内（空間的）予測を使用してピクチャ・エリアをコーディングするかどうかの判定は、ＣＵレベルで行われる。各ＣＵはさらに、ＰＵ分裂タイプに従って、１つ、２つ、又は４つのＰＵに分裂させることができる。１つのＰＵ内では、同じ予測プロセスが適用され、関連情報がＰＵベースで復号器に送信される。ＰＵ分裂タイプに基づく予測プロセスを適用することによって残差ブロックを得た後、ＣＵを、ＣＵのコーディング・ツリーに類似した別のクワッド・ツリー構造に従って変換ユニット（ＴＵ）にパーティショニングすることができる。実施形態では、例えば、現在開発中の最新のビデオ・コーディング規格、汎用ビデオ・コーディング（ＶＶＣ）と呼ばれるものにしたがって、クワッド・ツリー及びバイナリ・ツリー（ＱＴＢＴ）パーティショニングが、例えば、コーディング・ブロックをパーティショニングするために使用される。ＱＴＢＴブロック構造では、ＣＵは正方形又は長方形のいずれかの形状を有することができる。例えば、コーディング・ツリー・ユニット（ＣＴＵ）は、最初にクワッド・ツリー構造によってパーティショニングされる。クワッド・ツリー・リーフ・ノードは、バイナリ・ツリー又はターナリー（若しくはトリプル）ツリー構造によってさらにパーティショニングされる。パーティショニング・ツリー・リーフ・ノードは、コーディング・ユニット（ＣＵ）と呼ばれ、セグメントは、それ以上のパーティショニングなしで予測及び変換処理のために使用される。これは、ＣＵ、ＰＵ、ＴＵがＱＴＢＴコーディング・ブロック構造において同じブロックサイズを有することを意味する。並列に、複数のパーティション、例えば、トリプル・ツリー・パーティションが、ＱＴＢＴブロック構造と共に使用されることも提案されている。

【0112】

一例では、ビデオ符号化器２０のモード選択ユニット２６０は、本明細書で説明されるパーティショニング技術の任意の組み合わせを実行するように構成されてもよい。

【0113】

上述のように、ビデオ符号化器２０は、（予め判定された）予測モードのセットから最良又は最適な予測モードを判定又は選択するように構成されている。
予測モードのセットは、例えば、イントラ予測モード及び／又はインター予測モードを含んでもよい。

【0114】

イントラ予測

【0115】

イントラ予測モードのセットは、３５の異なるイントラ予測モード、例えば、ＤＣ（又は平均）モード及び平面モードのような非方向モード、又は、例えば、ＨＥＶＣで定義されているような方向モードを含むことができ、又は、６７の異なるイントラ予測モード、例えば、ＤＣ（又は平均）モード及び平面モードのような非方向モード、又は、例えば、ＶＶＣに対して定義されているような方向モードを含むことができる。

【0116】

イントラ予測ユニット２５４は、イントラ予測モードのセットのイントラ予測モードに従って、同じの現在のピクチャの隣接ブロックの再構成されたサンプルを使用して、イントラ予測ブロック２６５を生成するように構成されている。

【0117】

イントラ予測ユニット２５４（又は、一般に、モード選択ユニット２６０）は、符号化されたピクチャ・データ２１に含めるための構文要素２６６の形式で、エントロピー符号化ユニット２７０にイントラ予測パラメータ（又は、一般に、ブロックに対して選択されたイントラ予測モードを示す情報）を出力するようにさらに構成されており、これにより、例えば、ビデオ復号器３０は、復号のために予測パラメータを受信し、使用することができる。

【0118】

インター予測

【0119】

インター予測のセット（又は可能なインター予測モード）は、利用可能な参照ピクチャ（例えば、ＤＢＰ２３０に記憶された、例えば少なくとも部分的に復号されたピクチャ）及び他のインター予測パラメータ、例えば、参照ピクチャの全体又は参照ピクチャの一部のみ、例えば、現在のブロックのエリアの周囲のサーチ・ウィンドウ・エリアが、最良一致の参照ブロックをサーチするために使用されるかどうか、及び／又は、例えば、画素補間、例えば、半分／セミペル及び／又はクォータ・ペル補間が適用されるかどうかに依存する。
上記の予測モードに加えて、スキップ・モード及び／又は直接モードが適用されてもよい。インター予測ユニット２４４は、モーション推定（ＭＥ）ユニットと、モーション補償（ＭＣ）ユニット（両方とも図２には示さず）とを含んでもよい。モーション推定ユニットは、モーション推定のために、ピクチャ・ブロック２０３（現在のピクチャ１７の現在のピクチャ・ブロック２０３）及び復号されたピクチャ２３１、又は少なくとも１つ若しくは複数の以前に再構成されたブロック、例えば、１つ又は複数の他の／異なる以前に復号されたピクチャ２３１の再構成されたブロックを受信又は取得するように構成されてもよい。例えば、ビデオ・シーケンスは、現在のピクチャと以前に復号されたピクチャ２３１とを含んでもよく、言い換えれば、現在のピクチャと以前に復号されたピクチャ２３１は、ビデオ・シーケンスを形成するピクチャの一部であってもよく、又は、ピクチャのシーケンスを形成してもよい。

【0120】

符号化器２０は、例えば、複数の他のピクチャの同じ又は異なるピクチャの複数の参照ブロックから参照ブロックを選択し、参照ブロックの位置（ｘ、ｙ座標）と現在のブロックの位置との間の参照ピクチャ（又は参照ピクチャ・インデックス）及び／又はオフセット（空間オフセット）を、モーション推定ユニットへのインター予測パラメータとして提供するように構成されてもよい。このオフセットはモーション・ベクトル（ＭＶ）とも呼ばれる。

【0121】

モーション補償ユニットは、インター予測パラメータを取得、例えば、受信し、インター予測パラメータに基づいて、又はこれを使用して、インター予測を実行して、インター予測ブロック２６５を取得するように構成されている。モーション補償ユニットによって実行されるモーション補償は、モーション推定によって判定されたモーション／ブロック・ベクトルに基づいて予測ブロックをフェッチ又は生成することを伴ってもよく、おそらくサブピクセル精度までの補間を実行する。補間フィルタリングは、既知の画素サンプルから追加の画素サンプルを生成することができ、したがって、ピクチャ・ブロックをコーディングするために使用され得る候補予測ブロックの数を潜在的に増加させる。現在のピクチャ・ブロックのＰＵに対するモーション・ベクトルを受信すると、モーション補償ユニットは、参照ピクチャ・リストのうちの１つにおいてモーション・ベクトルがポイントする予測ブロックを位置付けてもよい。

【0122】

モーション補償ユニットはまた、ビデオ・スライスのピクチャ・ブロックを復号する際にビデオ復号器３０によって使用するために、ブロック及びビデオ・スライスに関連する構文要素を生成してもよい。

【0123】

エントロピー・コーディング

【0124】

エントロピー符号化ユニット２７０は、例えば、エントロピー符号化アルゴリズム又は方式（例えば、可変長符号化（ＶＬＣ）方式、コンテキスト適応ＶＬＣ方式（ＣＡＶＬＣ）、算術コーディング方式、バイナリ化、コンテキスト適応バイナリ算術コーディング（ＣＡＢＡＣ）、構文ベースのコンテキスト適応バイナリ算術コーディング（ＳＢＡＣ）、確率間隔パーティショニング・エントロピー（ＰＩＰＥ）コーディング、若しくは別のエントロピー・コーディング方法論又は技法）又はバイパス（非圧縮）を、量子化係数２０９、インター予測パラメータ、イントラ予測パラメータ、ループ・フィルタ・パラメータ及び／又は他の構文要素に適用して、例えば、符号化ビットストリーム２１の形式で出力２７２を介して出力され得る符号化されたピクチャ・データ２１を取得して、これにより、例えば、ビデオ復号器３０は、復号のためのパラメータを受信及び使用することができる。符号化されたビットストリーム２１は、ビデオ復号器３０に送信されてもよいし、後の伝送又はビデオ復号器３０による検索のためにメモリに記憶されてもよい。ビデオ符号化器２０の他の構造的変形が、ビデオ・ストリームを符号化するために使用することができる。例えば、非変換ベースの符号化器２０は、特定のブロック又はフレームに対して変換処理ユニット２０６なしで残差信号を直接量子化することができる。別の実装では、符号化器２０は、単一ユニットに組み合わされた量子化ユニット２０８及び逆量子化ユニット２１０を有することができる。

【0125】

復号器及び復号方法

【0126】

図３は、本出願の技術を実装するように構成されたビデオ復号器３０の例を示す。ビデオ復号器３０は、例えば、符号化器２０によって符号化されたピクチャ・データ２１（例えば、符号化されたビットストリーム２１）を受信して、復号されたピクチャ３３１を取得するように構成されている。符号化されたピクチャ・データ又はビットストリームは、符号化されたピクチャ・データを復号するための情報、例えば、符号化されたビデオ・スライスのピクチャ・ブロック及び関連する構文要素を表すデータを含む。

【0127】

図３の例では、復号器３０は、エントロピー復号ユニット３０４と、逆量子化ユニット３１０と、逆変換処理ユニット３１２と、再構成ユニット３１４（例えば、合計器３１４）と、ループ・フィルタ３２０と、復号されたピクチャ・バッファ（ＤＢＰ）３３０と、インター予測ユニット３４４と、イントラ予測ユニット３５４とを含む。インター予測ユニット３４４は、モーション補償ユニットであってもよいし、又はこれを含んでもよい。ビデオ復号器３０は、いくつかの例において、図２からのビデオ符号化器１００に関して説明された符号化パスと概ね逆の復号パスを実行してもよい。

【0128】

符号化器２０に関して説明したように、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループ・フィルタ２２０、復号されたピクチャ・バッファ（ＤＲＢ）２３０、インター予測ユニット３４４、及びイントラ予測ユニット３５４も、ビデオ符号化器２０の「内蔵復号器」を形成すると呼ばれる。したがって、逆量子化ユニット３１０は、逆量子化ユニット１１０と機能的に同一であってもよく、逆変換処理ユニット３１２は、逆変換処理ユニット２１２と機能的に同一であってもよく、再構成ユニット３１４は、再構成ユニット２１４と機能的に同一であってもよく、ループ・フィルタ３２０は、ループ・フィルタ２２０と機能的に同一であってもよく、復号されたピクチャ・バッファ３３０は、復号されたピクチャ・バッファ２３０と機能的に同一であってもよい。したがって、ビデオ復号器３０のそれぞれのユニット及び機能には、ビデオ２０符号化器のそれぞれのユニット及び機能に対して提供された説明が適用される。

【0129】

エントロピー復号

【0130】

エントロピー復号ユニット３０４は、ビットストリーム２１（又は一般に、符号化されたピクチャ・データ２１）を解析し、例えば、符号化されたピクチャ・データ２１へのエントロピー復号を実行して、例えば、量子化係数３０９及び／又は復号されたコーディング・パラメータ（図３には示さず）、例えば、インター予測パラメータ（例えば、参照ピクチャ・インデックス及びモーション・ベクトル）、イントラ予測パラメータ（例えば、イントラ予測モード又はインデックス）、変換パラメータ、量子化パラメータ、ループ・フィルタ・パラメータ、及び／又は他の構文要素のいずれか又はすべてを取得するように構成されている。エントロピー復号ユニット３０４は、符号化器２０のエントロピー符号化ユニット２７０に関して説明したように、符号化方式に対応する復号アルゴリズム又は方式を適用するように構成されてもよい。エントロピー復号ユニット３０４は、インター予測パラメータ、イントラ予測パラメータ及び／又は他の構文要素をモード選択ユニット３６０に提供し、他のパラメータを復号器３０の他のユニットに提供するようにさらに構成されてもよい。ビデオ復号器３０は、ビデオ・スライス・レベル及び／又はビデオ・ブロックレベルで構文要素を受信してもよい。

【0131】

逆量子化

【0132】

逆量子化ユニット３１０は、（例えば、エントロピー復号ユニット３０４による、例えば、解析及び／又は復号による）符号化されたピクチャ・データ２１からの量子化パラメータ（ＱＰ）（又は、一般には、逆量子化に関係する情報）及び量子化係数を受信し、量子化パラメータに基づいて逆量子化を復号された量子化係数３０９に適用して、変換係数３１１とも呼ばれることがある量子化解除係数３１１を取得するように構成されてもよい。逆量子化プロセスは、量子化の程度、及び同様に適用されるべき逆量子化の程度を判定するために、ビデオ・スライスにおけるビデオ・ブロックごとにビデオ符号化器２０によって判定された量子化パラメータを使用することを含んでもよい。

【0133】

逆変換

【0134】

逆変換処理ユニット３１２は、変換係数３１１とも呼ばれる量子化解除係数３１１を受信し、サンプル・ドメインにおいて再構成された残差ブロック２１３を取得するために、量子化解除係数３１１に変換を適用するように構成されてもよい。再構成された残差ブロック２１３は、変換ブロック２１３とも呼ばれることがある。変換は、逆変換、例えば、逆ＤＣＴ、逆ＤＳＴ、逆整数変換、又は概念的に類似した逆変換プロセスであってもよい。逆変換処理ユニット３１２は、変換パラメータ又は対応する情報を符号化されたピクチャ・データ２１から受信して（例えば、エントロピー復号ユニット３０４による、例えば、解析及び／又は復号によって）、量子化解除係数３１１に適用される変換を判定するようにさらに構成されてもよい。

【0135】

再構成

【0136】

再構成ユニット３１４（例えば、加算器又は合計器３１４）は、再構成された残差ブロック３１３を予測ブロック３６５に加算し、例えば、再構成された残差ブロック３１３のサンプル値及び予測ブロック３６５のサンプル値を追加することによって、サンプル・ドメインにおける再構成されたブロック３１５を取得するように構成されてもよい。

【0137】

フィルタリング

【0138】

ループ・フィルタ・ユニット３２０（コーディング・ループ内又はコーディング・ループ後のいずれか）は、再構成されたブロック３１５をフィルタリングして、フィルタリングされたブロック３２１を取得して、例えば、画素遷移を平滑化するか、又は、そうでなければ、ビデオ品質を改善するように構成されている。ループ・フィルタ・ユニット３２０は、ブロッキング解除フィルタ、サンプル・アダプティブ・オフセット（ＳＡＯ）フィルタ、若しくは１つ以上の他のフィルタ、例えばバイラテラル・フィルタ、アダプティブ・ループ・フィルタ（ＡＬＦ）、鮮鋭化フィルタ、平滑化フィルタ、若しくは共同フィルタ、又はそれらの任意の組み合わせなどの１つ以上のループ・フィルタを含んでもよい。ループ・フィルタ・ユニット３２０は、図３ではループ内フィルタとして示されているが、他の構成では、ループ・フィルタ・ユニット３２０は、ポスト・ループ・フィルタとして実装されてもよい。

【0139】

復号されたピクチャ・バッファ

【0140】

次いで、ピクチャの復号されたビデオ・ブロック３２１は、復号されたピクチャ・バッファ３３０に記憶され、復号されたピクチャ・バッファ３３０は、他のピクチャ及び／又はそれぞれ出力表示するためのその後のモーション補償のための参照ピクチャとして記憶される。復号器３０は、ユーザへの提示又は視認のために、例えば出力３１２を介して復号されたピクチャ３１１を出力するように構成されている。

【0141】

予測

【0142】

インター予測ユニット３４４は、インター予測ユニット２４４（特に、モーション補償ユニット）と同一であってもよく、イントラ予測ユニット３５４は、機能において、インター予測ユニット２５４と同一であってもよく、（例えば、エントロピー復号ユニット３０４による、例えば、解析及び／又は復号による）復号されたピクチャ・データ２１から受信されたパーティショニング及び／又は予測パラメータ又はそれぞれの情報に基づいて、分裂又はパーティショニング決定及び予測を実行する。モード選択ユニット３６０は、再構成されたピクチャ、ブロック又はそれぞれのサンプル（フィルタリングされた又はフィルタリングされていない）に基づいてブロックごとに予測（イントラ予測又はインター予測）を実行して、予測ブロック３６５を取得するように構成されてもよい。

【0143】

ビデオ・スライスがイントラ・コーディング（Ｉ）されたスライスとしてコーディングされるときに、モード選択ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モードと、現在のピクチャの以前に復号されたブロックからのデータとに基づいて、現在のビデオ・スライスのピクチャ・ブロックのための予測ブロック３６５を生成するように構成されている。ビデオ・ピクチャがインターコーディング（例えば、Ｂ、又はＰ）されたスライスとしてコーディングされるときに、モード選択ユニット３６０のインター予測ユニット３４４（例えば、モーション補償ユニット）は、エントロピー復号ユニット３０４から受信されたモーション・ベクトル及び他の構文要素に基づいて、現在のビデオ・スライスのビデオ・ブロックのための予測ブロック３６５を生成するように構成されている。インター予測のために、予測ブロックは、参照ピクチャ・リストのうちの１つ内の参照ピクチャのうちの１つから生成されてもよい。ビデオ復号器３０は、ＤＰＢ３３０に記憶された参照ピクチャに基づくデフォルトの構成技術を使用して、参照フレームリスト、リスト０及びリスト１を構成してもよい。

【0144】

モード選択ユニット３６０は、モーション・ベクトル及び他の構文要素を解析することによって、現在のビデオ・スライスのビデオ・ブロックのための予測情報を判定するように構成されており、予測情報を使用して、復号される現在のビデオ・ブロックの予測ブロックを生成する。例えば、モード選択ユニット３６０は、受信された構文要素のいくつかを使用して、ビデオ・スライスのビデオ・ブロックをコーディングするために使用される予測モード（例えば、イントラ又はインター予測）、インター予測スライス・タイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスのための参照ピクチャ・リストのうちの１つ以上の構成情報、スライスの各インター符号化されたビデオ・ブロックのためのモーション・ベクトル、スライスの各インターコーディングされたビデオ・ブロックのためのインター予測ステータス、及び現在のビデオ・スライスにおけるビデオ・ブロックを復号するための他の情報を判定する。

【0145】

ビデオ復号器３０の他の変形を使用して、符号化されたピクチャ・データ２１を復号することができる。例えば、復号器３０は、ループ・フィルタリング・ユニット３２０なしで出力ビデオ・ストリームを生成することができる。例えば、非変換ベースの復号器３０は、特定のブロック又はフレームに対して、逆変換処理ユニット３１２なしで残差信号を直接逆量子化することができる。別の実装では、ビデオ復号器３０は、単一のユニットに組み合わせられた逆量子化ユニット３１０及び逆変換処理ユニット３１２を有することができる。

【0146】

符号化器２０及び復号器３０では、現在のステップの処理結果をさらに処理し、次のステップに出力してもよいと理解されたい。例えば、補間フィルタリング、モーション・ベクトル導出、又はループ・フィルタリングの後に、クリップ又はシフトなどのさらなる演算を、補間フィルタリング、モーション・ベクトル導出、又はループ・フィルタリングの処理結果に対して実行してもよい。

【0147】

さらなる演算は、現在のブロックの導出されたモーション・ベクトル（アフィン・モードの制御点モーション・ベクトル、アフィン、平面、ＡＴＭＶＰモードのサブブロック・モーション・ベクトル、時間的モーション・ベクトルなどを含むが、これらに限定されない）に適用され得ると留意されたい。例えば、モーション・ベクトルの値は、その表現ビットにしたがって予め定義された範囲に制約される。モーション・ベクトルの表現ビットがｂｉｔＤｅｐｔｈである場合、範囲は、－２＾（ｂｉｔＤｅｐｔｈ－１）～２＾（ｂｉｔＤｅｐｔｈ－１）－１であり、ここで、「＾」はべき乗を意味する。例えば、ｂｉｔＤｅｐｔｈが１６にセットされる場合、範囲は－３２７６８～３２７６７であり、ｂｉｔＤｅｐｔｈが１８にセットされる場合、－１３１０７２～１３１０７１である。ここでは、モーション・ベクトルを制約するための２つの方法を提供する。

【0148】

方法１：フロー演算によりオーバフローＭＳＢ（最上位ビット）を除去する。

【数4】

たとえば、ｍｖｘの値が－３２７６９である場合、式（１）及び（２）を適用した後、結果の値は３２７６７である。コンピュータ・システムでは、１０進数は２の補数として記憶される。－３２７６９の２の補数は１，０１１１，１１１１，１１１１（１７ビット）であり、ＭＳＢが破棄されるため、結果として得られる２つの補数は０１１１，１１１１，１１１１，１１１１（１０進数は３２７６７）となり、これは、式（１）と（２）を適用した出力と同じである。

【数5】

演算は、式（５）～（８）に示すように、ｍｖｐとｍｖｄの和の間に適用されてもよい。

【0149】

方法２：値をクリッピングすることによりオーバフローＭＳＢを除去する。

【数6】

ここで、機能Ｃｌｉｐ３の定義は以下のようである。

【数7】

【0150】

図４は、本開示の一実施形態によるビデオ・コーディング・デバイス４００の概略図である。ビデオ・コーディング・デバイス４００は、本明細書で説明される開示される実施形態を実装するのに好適である。一実施形態では、ビデオ・コーディング・デバイス４００は、図１Ａのビデオ復号器３０のような復号器、又は図１Ａのビデオ符号化器２０のような符号器であってもよい。

【0151】

ビデオ・コーディング・デバイス４００は、データを受信するための入口ポート４１０（又は入力ポート４１０）及び受信機ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、論理ユニット、又は中央処理ユニット（ＣＰＵ）４３０と、データを送信するための送信機ユニット（Ｔｘ）４４０及び出口ポート４５０（又は出力ポート４５０）と、データを記憶するためのメモリ４６０を含む。ビデオ・コーディング・デバイス４００はまた、光信号又は電気信号の出入りのために、入口ポート４１０、受信機ユニット４２０、送信機ユニット４４０、及び出口ポート４５０に結合された光から電気（ＯＥ）コンポーネント及び電気から光（ＥＯ）コンポーネントを含んでもよい。

【0152】

プロセッサ４３０は、ハードウェア及びソフトウェアによって実装される。プロセッサ４３０は、１つ以上のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、ＦＰＧＡ、ＡＳＩＣ、及びＤＳＰとして実装されてもよい。プロセッサ４３０は、入口ポート４１０、受信機ユニット４２０、送信機ユニット４４０、出口ポート４５０、及びメモリ４６０と通信している。プロセッサ４３０は、コーディング・モジュール４７０を含む。コーディング・モジュール４７０は、上述の開示された実施形態を実装する。例えば、コーディング・モジュール４７０は、種々のコーディング演算を実装、処理、準備、又は提供する。したがって、符号化モジュール４７０を含めることは、ビデオ・コーディング・デバイス４００の機能性への実質的な改善を提供し、ビデオ・コーディング・デバイス４００の異なる状態への変換をもたらす。代替的には、コーディング・モジュール４７０は、メモリ４６０に記憶され、プロセッサ４３０によって実行される命令として実装される。

【0153】

メモリ４６０は、１つ又は複数のディスク、テープ・ドライブ、及びソリッドステート・ドライブを含んでもよく、オーバ・フロー・データ記憶デバイスとして使用され、そのようなプログラムが実行のために選択されたときにプログラムを記憶し、プログラム実行中に読み出された命令及びデータを記憶してもよい。メモリ４６０は、例えば、揮発性及び／又は不揮発性であってもよく、リード・オンリー・メモリ（ＲＯＭ）、ランダム・アクセス・メモリ（ＲＡＭ）、ターナリー・コンテンツ・アドレス指定可能メモリ（ＴＣＡＭ）、及び／又はスタティック・ランダム・アクセス・メモリ（ＲＳＡＭ）であってもよい。

【0154】

図５は、例示的な実施形態による図１からのソース・デバイス１２及び宛先デバイス１４のいずれか又は両方として使用されてもよい装置５００の簡略ブロック図である。

【0155】

装置５００内のプロセッサ５０２は、中央処理ユニットとすることができる。代替的には、プロセッサ５０２は、現在存在する、又は今後開発される情報を操作又は処理することが可能な、任意の他のタイプのデバイス又は複数のデバイスとすることができる。開示された実装は、示すように単一のプロセッサ、例えば、プロセッサ５０２を用いて実施することができるが、複数のプロセッサを使用して、速度及び効率における利点を達成することができる。装置５００内のメモリ５０４は、実装におけるリード・オンリー・メモリ（ＲＯＭ）デバイス又はランダム・アクセス・メモリ（ＲＡＭ）デバイスとすることができる。メモリ５０４として、任意の他の好適なタイプの記憶デバイスを使用することができる。メモリ５０４は、バス５１２を使用して、プロセッサ５０２によってアクセスされるコード及びデータ５０６を含むことができる。メモリ５０４は、オペレーティング・システム５０８及びアプリケーション・プログラム５１０をさらに含むことができ、アプリケーション・プログラム５１０は、プロセッサ５０２が本明細書で説明される方法を実行することを許可する少なくとも１つのプログラムを含む。例えば、アプリケーション・プログラム５１０は、アプリケーション１～Ｎを含むことができ、これは、本明細書で説明される方法を実行するビデオ・コーディング・アプリケーションをさらに含む。装置５００はまた、ディスプレイ５１８などの１つ以上の出力デバイスをさらに含むことができる。ディスプレイ５１８は、一例では、ディスプレイを、タッチ入力を感知するように動作可能なタッチ・センシティブ要素と組み合わせるタッチ・センシティブ・ディスプレイであってもよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２に接続することができる。

【0156】

ここでは、単一のバスとして示されているが、装置５００のバス５１２は、複数のバスから構成することができる。さらに、二次ストレージ５１４は、装置５００の他のコンポーネントに直接結合することができ、又はネットワークを介してアクセスすることができ、メモリカードなどの単一の一体化ユニット又は複数のメモリカードなどの複数のユニットを含むことができる。したがって、装置５００は、広範な構成で実装することができる。

【0157】

【0158】

捕捉デバイス３１０２は、データを生成し、上記の実施形態に示す符号化方法によってデータを符号化してもよい。代替的には、捕捉デバイス３１０２は、ストリーミングサーバ（図示せず）にデータを配信することができ、サーバは、データを符号化し、符号化されたデータを端末デバイス３１０６に送信する。捕捉デバイス３１０２は、カメラ、スマートフォン又はパッド、コンピュータ若しくはラップトップ、ビデオ会議システム、ＰＤＡ、車載デバイス、又はそれらのいずれかの組み合わせなどを含むが、これらに限定されない。例えば、捕捉デバイス３１０２は、上述のようにソース・デバイス１２を含んでもよい。データがビデオを含む場合に、捕捉デバイス３１０２に含まれるビデオ符号化器２０は、実際にビデオ符号化処理を実行することができる。データがオーディオ（例えば、音声）を含む場合、捕捉デバイス３１０２に含まれるオーディオ符号化器は、実際にオーディオ符号化処理を実行することができる。いくつかの実際的なシナリオでは、捕捉デバイス３１０２は、符号化されたビデオ及びオーディオ・データを、それらを一緒に多重化することによって配布する。他の実際的なシナリオ、例えば、ビデオ会議システムにおいては、符号化されたオーディオ・データ及び符号化されたビデオ・データは多重化されない。捕捉デバイス３１０２は、符号化されたオーディオ・データ及び符号化されたビデオ・データを、端末デバイス３１０６に別々に配信する。

【0159】

コンテンツ供給システム３１００では、端末デバイス３１０は、符号化されたデータを受信及び再生する。端末デバイス３１０６は、スマートフォン又はＰａｄ３１０８、コンピュータ若しくはラップトップ３１１０、ネットワーク・ビデオ・レコーダ（ＮＶＲ）／デジタル・ビデオ・レコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、セット・トップ・ボックス３１１６、ビデオ会議システム３１１８、ビデオ監視システム３１２０、パーソナル・デジタル・アシスタント（ＰＤＡ）３１２２、車載デバイス３１２４、又はこれらのいずれかの組み合わせなどの、データ受信及び復元能力を有し、前述の符号化されたデータを復号することが可能なデバイスとすることができる。例えば、捕捉デバイス３１０６は、上述のようにソース・デバイス１４を含んでもよい。符号化されたデータがビデオを含む場合に、端末デバイスに含まれるビデオ復号器３０は、ビデオ復号を実行するように優先される。符号化されたデータがオーディオを含む場合に、端末デバイスに含まれるオーディオ復号器は、オーディオ復号処理を実行するように優先される。

【0160】

ディスプレイを有する端末デバイス、例えば、スマートフォン又はパッド３１０８、コンピュータ又はラップトップ３１１０、ネットワーク・ビデオ・レコーダ（ＮＶＲ）／デジタル・ビデオ・レコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、パーソナル・デジタル・アシスタント３１２２、又は車載デバイス３１２４では、端末デバイスは、復号されたデータをそのディスプレイに供給することができる。ディスプレイを搭載しないデバイス、例えば、ＳＴＢ３１１６、ビデオ会議システム３１１８、又はビデオ監視システム３１２０では、外部ディスプレイ３１２６がそこに接触されて、復号されたデータを受信し示す。

【0161】

このシステムの各デバイスが符号化又は復号を行う場合に、前述の実施形態に示すように、ピクチャ符号化デバイス又はピクチャ復号デバイスを使用することができる。図１９は、端末デバイス３１０６の一例の構成を示す図である。端末デバイス３１０６が、捕捉デバイス３１０２からストリームを受信した後、プロトコル進行ユニット３２０２は、ストリームの伝送プロトコルを分析する。このプロトコルは、リアルタイム・ストリーミング・プロトコル（ＲＴＳＰ）、ハイパー・テキスト・トランスファー・プロトコル（ＨＴＴＰ）、ＨＴＴＰライブ・ストリーミング・プロトコル（ＨＬＳ）、ＭＰＥＧ－ＤＡＳＨ、リアルタイム・トランスポート・プロトコル（ＲＴＰ）、リアルタイム・メッセージング・プロトコル（ＲＴＭＰ）、又はそれらの任意の種類の組み合わせなどを含むが、これらに限定されない。プロトコル進行ユニット３２０２がストリームを処理した後に、ストリームファイルは、生成される。ファイルは、逆多重化ユニット３２０４に出力される。逆多重化ユニット３２０４は、多重化されたデータを符号化されたオーディオ・データと符号化されたビデオ・データとに分離することができる。上述したように、いくつかの実際的なシナリオ、例えば、ビデオ会議システムにおいては、符号化されたオーディオ・データ及び符号化されたビデオ・データは多重化されない。この状況では、符号化データは、逆多重化部３２０４を介することなく、ビデオ復号器３２０６及びオーディオ復号器３２０８に送信される。

【0162】

逆多重化処理を介して、ビデオ・エレメントリー・ストリーム（ＥＳ）、オーディオＥＳ、及び任意選択で字幕が生成される。前述の実施形態で説明されたビデオ復号器３０を含むビデオ復号器３２０６は、上述の実施形態に示す復号方法によってビデオＥＳを復号して、ビデオ・フレームを生成し、このデータを同期ユニット３２１２に送信する。オーディオ復号器３２０８は、オーディオＥＳを復号して、オーディオ・フレームを生成し、このデータを同期ユニット３２１２に送信する。代替的には、ビデオ・フレームは、同期ユニット３２１２に供給する前に、バッファ（図Ｙには示さず）に記憶させてもよい。代替的には、オーディオ・フレームは、同期ユニット３２１２に供給する前に、バッファ（図Ｙには示さず）に記憶させてもよい。

【0163】

同期ユニット３２１２は、ビデオ・フレームとオーディオ・フレームを同期させ、ビデオ／オーディオ・ディスプレイ３２１４にビデオ／オーディオを供給する。例えば、同期ユニット３２１２は、ビデオ情報及びオーディオ情報の提示を同期させる。情報は、符号化されたオーディオ及びビジュアル・データの提示に関するタイム・スタンプ及びデータストリーム自体の送達に関するタイム・スタンプを使用して、構文でコーディングすることができる。

【0164】

字幕がストリームに含まれる場合、字幕復号器３２１０は、字幕を復号し、それをビデオ・フレーム及びオーディオ・フレームと同期させ、ビデオ／オーディオ／字幕をビデオ／オーディオ／字幕ディスプレイ３２１６に供給する。

【0165】

ＩＴＵ－ＴＨ．２６５によるマージ候補リスト構成に関する例では、マージ候補リストが、以下の候補に基づいて構成される。
１．５つの空間的隣接ブロックから導出される最大４つの空間的候補ＭＶＰ
２．２つの時間的に共位置にあるブロックから導出された１つの時間的候補、
３．組み合わされたバイ予測候補を含む追加候補
４．ゼロ・モーション・ベクトル候補

【0166】

空間的候補

【0167】

空間的隣接ブロックのモーション情報は、最初に、モーション情報候補としてマージ候補リストに追加される（一例では、マージ候補リストは、最初のモーション・ベクトルがマージ候補リストに追加される前に、空のリストであってもよい）。ここで、マージリストに挿入されると考慮される隣接ブロックが図６ｂに示される。インター予測ブロックマージの場合、Ａ１、Ｂ１、Ｂ０、Ａ０、Ｂ２を順次その順序でチェックすることにより、最大４つの候補がマージリストに挿入される。

【0168】

モーション情報は、１つ又は２つの参照ピクチャ・リストが使用されるかどうかの情報、ならびに各参照ピクチャ・リストに対する参照インデックス及びモーション・ベクトルを含むすべてのモーション・データを含んでもよい。

【0169】

一例では、隣接ブロックが利用可能であり、モーション情報を含んでいるかどうかをチェックした後、隣接ブロックのすべてのモーション・データをモーション情報候補として取り出す前に、いくつかの追加の冗長性チェックが実行される。

【0170】

これらの冗長性チェックは、２つの異なる目的のために２つのカテゴリに分割され得る。
カテゴリ１は、リスト内に冗長なモーション・データを持つ候補を持つことを避ける。
カテゴリ２は、冗長な構文を生成する他の手段によって表現され得る２つのパーティションをマージすることを防止する。

【0171】

時間的候補

【0172】

図６ａは、時間的モーション情報候補が検索されるブロックの座標を示した。共位置にあるブロックは、現在のブロックと同じｘ、ｙ座標を有するが、異なるピクチャ（参照ピクチャのうちの１つ）にあるブロックである。時間的モーション情報候補は、リストが満杯でない場合、マージリストに追加される（一例では、マージリスト内の候補の量が閾値より小さいときに、マージリストが満杯でなく、例えば、閾値は、４、５、６などであってもよい）。

【0173】

生成された候補

【0174】

空間的及び時間的運動情報候補の挿入後、マージリストが依然として満杯でない場合、生成された候補がリストを充填するように追加される。リストサイズは、シーケンスパラメータセットにおいて示され、コーディングされたビデオ・シーケンス全体を通して固定される。

【0175】

ＩＴＵ－ＴＨ．２６５及びＶＶＣにおけるマージリスト構成プロセスは、モーション情報候補のリストを出力する。ＶＶＣのマージリスト構成プロセスは、文書ＪＶＥＴ－Ｌ１００１＿ｖ２ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ３）の「８．３．２．２Ｄｅｒｉｖａｔｉｏｎｐｒｏｃｅｓｓｆｏｒｌｕｍａｍｏｔｉｏｎｖｅｃｔｏｒｓｆｏｒｍｅｒｇｅｍｏｄｅ」のセクションに説明されており、これは、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｖｅｔ／で公衆に利用可能である。用語モーション情報は、モーション補償予測プロセスを行うために必要なモーション・データを指す。
モーション情報は通常、以下の情報を指す。
・ブロックがユニ予測、バイ予測のどちらを適用するか
・予測に使用される参照ピクチャのＩＤ（ブロックがバイ予測を適用する場合、２つのＩＤ）。
・モーション・ベクトル（ブロックがバイ予測される場合、２つのモーション・ベクトル）
・追加情報

【0176】

ＶＶＣ及びＨ．２６５では、マージリスト構成の出力である候補のリストは、Ｎ個の候補モーション情報を含む。数Ｎは、典型的にはビットストリームに含まれ、５、６などの正の整数であってもよい。構成されたマージリストに含まれる候補は、ユニ予測情報又はバイ予測情報を含むかもしれない。これは、マージリストから選択される候補がバイ予測動作を示すかもしれないことを意味する。

【0177】

バイ予測

【0178】

インター予測の特別なモードは、「バイ予測」と呼ばれ、ブロックを予測するために２つのモーション・ベクトルが使用される。モーション・ベクトルは、同じ又は異なる参照ピクチャを指し示すことができ、参照ピクチャは、参照ピクチャ・リストＩＤ及び参照ピクチャ・インデックスによって示され得る。例えば、第１のモーション・ベクトルは、参照ピクチャ・リストＬ０内の最初のピクチャを指し示すかも知れないし、第２のモーション・ベクトルは、参照ピクチャ・リストＬ１内の最初のピクチャを指し示すかもしれない。２つの参照ピクチャ・リスト（例えば、Ｌ０及びＬ１）が維持されるかもしれず、第１のモーション・ベクトルによって指し示されるピクチャがリストＬ０から選択され、第２のモーション・ベクトルによって指し締めされるピクチャがリストＬ１から選択される。

【0179】

一例では、モーション情報がバイ予測を示す場合、モーション情報は２つの部分を含む。
・Ｌ０部：参照ピクチャ・リストＬ０の中のエントリを指し示すモーション・ベクトルと参照ピクチャ・インデックス。
・Ｌ１部：参照ピクチャ・リストＬ１の中のエントリを指し示すモーション・ベクトルと参照ピクチャ・インデックス。

【0180】

ピクチャ・オーダ・カウント（ＰＯＣ）：各ピクチャに関連付けられた変数は、ＣＶＳ（ＣｏｄｅｄＶｉｄｅｏＳｅｑｕｅｎｃｅ）内のすべてのピクチャの中で関連するピクチャを一意に識別し、関連するピクチャが復号されたピクチャ・バッファから出力されるときに、復号されたピクチャ・バッファから出力される同じＣＶＳ内の他のピクチャの出力オーダ位置に対する出力オーダの関連するピクチャの位置を示す。

【0181】

参照ピクチャ・リストＬ０及びＬ１の各々は、各々がＰＯＣで識別される１つ以上の参照ピクチャを含むかもしれない。各参照インデックス及びＰＯＣ値との関連は、ビットストリームにおいてシグナリングされるかもしれない。例として、Ｌ０及びＬ１参照ピクチャ・リストは、以下の参照ピクチャを含むかもしれない。

【表2】

【0182】

上記の例では、参照ピクチャ・リストＬ１の最初のエントリ（参照インデックス０で示される）は、ＰＯＣ値１３の参照ピクチャである。参照ピクチャ・リストＬ１の２番目のエントリ（参照インデックス１で示される）は、ＰＯＣ値１４の参照ピクチャである。

【0183】

三角形予測モード

【0184】

三角形予測モードの概念は、モーション補償予測のための三角形パーティションを開示することである。図７に示すように、対角又は逆対角方向のいずれかにおいて２つの三角形予測単位がＣＵに使用される。ＣＵにおける各三角形予測ユニットは、ユニ予測候補リストから導出されるユニ予測モーション・ベクトルと基準フレームインデックスを用いて、インター予測される。各三角形予測ユニットに関連するサンプルが動き補償又はピクチャ内予測によって予測された後、適応重み付けプロセスが対角エッジに対して実行される。次いで、変換と量子化プロセスがＣＵに適用される。このモードは、スキップ・モード及びマージ・モードに適用されることに留意する。

【0185】

三角形予測モードでは、ブロックは２つの三角形部分に分裂され（図７のように）、各部分は１つのモーション・ベクトルを使用して予測され得る。１つの三角部（ＰＵ１で示される）を予測するために使用されるモーション・ベクトルは、他の三角部（ＰＵ２で示される）を予測するために使用されるモーション・ベクトルとは異なってもよい。一例では、三角形予測モードを実行する複雑さを低減するために、各部分が単一のモーション・ベクトル（ユニ予測）を使用して予測され得ることに留意する。言い換えれば、ＰＵ１及びＰＵ２は、２つのモーション・ベクトルを含むバイ予測を使用して予測されなくてもよい。

【0186】

サブブロック予測モード

【0187】

三角形予測モードは、サブブロック予測の特殊なケースである。サブブロック予測では、ブロックは、２つのブロックに分割される。上記の例では、２つのブロック分割方向（４５度及び１３５度パーティション）が示されており、他のパーティション角度及びパーティション比も可能である（図８の例）。

【0188】

いくつかの例では、ブロックは２つの部分に分裂され、各部分はユニ予測によって適用される。サブブロック予測は、一般化バージョンの三角形予測を表す。

【0189】

三角形予測モードは、ブロックが２つのブロックに分割されるサブブロック予測モードの特殊な場合である。上記の例では、２つのブロック分割方向（４５度及び１３５度パーティション）が示されている。他のパーティション角度及びパーティション比も可能である（例えば、図８の例）。

【0190】

いくつかの例では、ブロックは２つのサブブロックに分裂され、各部分（サブブロック）はユニ予測で予測される。

【0191】

一例では、サブブロック・パーティション・モードに従って、予測サンプルを取得するために以下のステップが適用される。
・ステップ１：コーディング・ブロックは、幾何学的モデルに従って、２つのサブブロックに分割されると考慮される。このモデルは、図９～１２に例示されているように、分離線（例えば、直線）によるブロックの分裂をもたらし得る。このステップでは、幾何学的モデルに従って、コーディング・ブロックにおけるサンプルは、２つのサブブロックに位置すると見なされる。サブブロックＡ又はサブブロックＢは、現在のコーディング・ブロックにおけるサンプルの一部（すべてではない）を含む。サブブロックＡ又はサブブロックＢの概念は、分離線に関係するパラメータによって示されてもよい。
・ステップ２：第１のサブブロックのための第１の予測モードと第２のサブブロックのための第２の予測モードを取得する。一例では、第１の予測モードは第２の予測モードと同一ではない。一例では、予測モード（第１の予測モード又は第２の予測モード）は、インター予測モードであってもよく、相互予測モードのための情報は、参照ピクチャ・インデックス及びモーション・ベクトルを含んでもよい。別の例では、予測モードは、イントラ予測モードであってもよく、イントラ予測モードのための情報は、イントラ予測モード・インデックスを含んでもよい。
・ステップ３：第１予測モードと第２予測モードを使用して、第１の予測値と第２の予測値をそれぞれ生成する。
・ステップ４：第１の予測値と第２の予測値の組み合わせに従って、予測サンプルの組み合わせ値を取得する。一例として、ステップ１では、コーディング・ブロックは、様々な方法で２つのサブブロックに分割されると考慮される。

【0192】

図９は、コーディング・ブロックのパーティションに関する例を示し、分離線１２５０は、ブロックを２つのサブブロックに分割する。線１２５０を説明するために、２つのパラメータがシグナリングされ、一方のパラメータは角度ａｌｐｈａ１２１０であり、他方のパラメータは距離ｄｉｓｔ１２３０である。

【0193】

いくつかの実施形態では、図９に示すように、角度は、ｘ軸と分離線との間で測定され、距離は、分離線に垂直で、現在のブロックの中心を通過するベクトルの長さによって測定される。別の例では、図１０は、分離線を表す別の方法を示しており、角度と距離の例は、図９に示されている例とは異なる。いくつかの例では、ステップ４において、ステップ１で開示された分割を、第１の予測値と第２の予測値との組み合わせに使用して、最終的な予測値を取得する。一例では、任意のアーチファクト（分離線に沿ったエッジ状又はジャグ状の外観）を除去するために、混合動作がステップ４において適用される。混合動作は、分離ラインに沿ったフィルタリング動作として説明されてもよい。

【0194】

符号化器側において、分離線（線を定義するパラメータ、例えば角度及び距離）は、レート歪みベースのコスト関数に基づいて判定される。判定された線パラメータは、ビットストリームに符号化される。復号器側において、線パラメータはビットストリームに従って復号（取得）される。

【0195】

一例では、輝度コンポーネントと２つの色度コンポーネントを含む３つのビデオ・チャネルの場合、各チャネルに対して第１の予測と第２の予測が生成される。

【0196】

コーディング・ブロックを２つのサブブロックに分割する可能性が多くあるため、分割のシグナリング（コーディング）にはビット数が多すぎる。角度値と距離値は、ビットストリームにシグナリングされるにはあまりにも多くのサイド情報を必要とする多くの異なる値を有するため、コーディング効率を改善するために、量子化スキームが角度と距離サイド情報に適用される。

【0197】

一例では、量子化された角度パラメータａｌｐｈａＩｄｘ及び量子化された距離パラメータｄｉｓｔａｎｃｅＩｄｘが、パーティショニング・パラメータのためにシグナリングされる。

【0198】

一例では、量子化スキームにおいて、角度値及び距離値は、以下に従って、線形一様量子化器によって量子化され得る。

【数8】

ここで、変数Δａｌｐｈａ及びΔｄｉｓｔは、分離線の角度パラメータ及び距離パラメータの量子化ステップ・サイズを表す。したがって、角度ａｌｐｈａ及び距離ｄｉｓｔは、以下のように、ビットストリームから取得されたａｌｐｈａＩｄｘ及びｄｉｓｔａｎｃｅＩｄｘの値を使用して、再構成されてもよい。

【数9】

一例では、角度量子化ステップ・サイズがΔａｌｐｈａ＝１１．２５°に等しい場合、ａｌｐｈａＩｄｘの値は、ユークリッド平面内で許容される角度をカバーするために、０～３１（０及び３１を含む）の範囲であり得る。別の例では、角度量子化ステップ・サイズの値は、Δアルファ＝２２．５°に等しく、それによって、ａｌｐｈａＩｄｘの値は、０～１５（０及び１５を含む）の範囲であり得る。いくつかの例では、角度に依存して距離情報を量子化する方法が開示されており、角度を量子化するために線形一様量子化器が使用される場合、与えられたコーディング（復号又は符号化）ブロックについて、Δａｌｐｈａの値が一定であることを意味する。開示される量子化スキームの目標は、異なるサイズ及びアスペクト比を有することができる所与のコーディング・ブロックに対して、許容される分離線を均等に分布させることである。量子化された角度及び距離パラメータの均等に分布した空間は、非矩形コンポーネントのコーディング効率を改善し、分離線パラメータのコンパクトな表現を可能にする。

【0199】

いくつかの例では、直線によって矩形コーディング・ブロックをパーティショニングする方法が開示されており、ここで、直線は、量子化された角度及び量子化された距離の値を表す一対のパラメータによってパラメータ化され、量子化された距離の値は、コーディング・ブロックの角度の値及びアスペクト比に依存して、量子化プロセスに従って導出される。

【0200】

一例では、距離は、ｄｉｓｔａｎｃｅＩｄｘの所与の値範囲が満たされるように、例えば、０～３の値範囲（０及び３を含む）で量子化されてもよい。別の例では、距離は、所与のａｎｇｌｅＩｄｘ及びｄｉｓｔａｎｃｅＩｄｘに対する分離線が均等に分布し、分離線が所与のコーディング・ブロックの領域の外側に存在しないように、所与のブロックに対して量子化されてもよい。

【0201】

最初のステップでは、最大距離ρ_ｍａｘを角度に依存して導出され得、距離０＜ｄｉｓｔ＜ρ_ｍａｘのすべての分離線がコーディング・ブロックに閉じ込められるようにする（例えば、コーディング・ブロックの境界と交差する）。これは、サイズ１６×４の輝度サンプルのコーディング・ブロックに対して図１５に例示されている。

【0202】

一例では、最大距離ρ_ｍａｘが、角度ａｌｐｈａＲとコーディング・ブロックのサイズに依存する関数として、以下に従って導出され得る。

【数10】

ここで、ａｌｐｈａＲは、放射ユニットに関してａｌｐｈａとして前もって示された角度であり、ｗは、幅であり、ｈは、輝度サンプルに関してブロックの高さである。
この例では、角度に依存の距離量子化ステップ・サイズΔｄｉｓｔ（ａｌｐｈａ）の値は、以下のように導出され得る。

【数11】

ここで、Ｎ－１は、ｄｉｓｔａｎｃｅＩｄｘの最大値である。これは、図１６において、Δａｎｇｌｅ＝２２．５°、Ｎ＝４の値のものが例示されている。

【0203】

別の例では、角度に依存の距離量子化ステップ・サイズの値は、以下のように導出されてもよい。

【数12】

ここで、ρｔｈは、コーディング・ブロックための分離ライン間の間隔を修正するために使用されるパラメータである。例では、ρｔｈの値は、ρｔｈ＝１．５にセットされる。

【0204】

別の例では、最大距離ρｍａｘは、コーディング・ブロックの角度及びサイズに依存する関数として、以下に従って導出され得る。

【数13】

ここで、ａｌｐｈａＲは、放射ユニットに関する角度であり、ｗは、幅であり、ｈは、輝度サンプルに関してブロックの高さである。これは、図１７において、Δａｎｇｌｅ＝２２．５°、Ｎ＝４の値のものが例示されている。

【0205】

一例では、Δｄｉｓｔの値は、角度を表す値に依存し、幅を表すパラメータ及び高さを表すパラメータは、符号化又は復号処理の間にΔｄｉｓｔの繰り返される計算を避けるために、事前に計算されたルックアップ・テーブルに記憶されてもよい。

【0206】

一例では、Δｄｉｓｔの値は、整数演算を使用する目的として、以下のようにスケーリング及び丸められ得る。

【数14】

ここで、ｓｔｅｐＤは、線形スケーリングされた距離ステップ・サイズを表し、ｐｒｅｃは、スケーリング・プロセスの精度を調整するために使用される変数である。一例では、ｐｒｅｃの値は、ｐｒｅｃ＝７にセットされる。

【0207】

一例では、それは、コーディング・ブロックの幅及び高さに依存する、ｗｈＲａｔｉｏを示すアスペクト比に基づいてｓｔｅｐＤの予め計算された値をさらに記憶することである。さらに、ｓｔｅｐＤの予め計算された値は、ユークリッド平面の第１象限の角度（例えば、０≦ａｎｇｌｅＮ＊Δａｌｐｈａ≦９０°）に関係するインデックス値である（正規化された）角度値ａｎｇｌｅＮに基づいて記憶される。そのようなルックアップ・テーブルが適用された例を図１３に示す。一例では、以下のステップを適用して、コーディング・ブロックのサンプルに対する予測値を取得する。

【0208】

ステップ１：現在のコーディング・ブロック（復号ブロック又は符号化ブロック）内のサンプルに対して、サンプル距離（ｓａｍｐｌｅ＿ｄｉｓｔ）が計算される。

【0209】

いくつかの例では、サンプル距離は、分離線（分離線は、コーディング・ブロックが２つのサブブロックに分割されることを示すために使用される）へのサンプルの水平距離若しくは垂直距離、又は垂直距離と水平距離の組み合わせを表してもよい。サンプルは、コーディング・ブロックの左上のサンプルに関する座標（ｘ，ｙ）によって表される。サンプル座標とｓａｍｐｌｅ＿ｄｉｓｔは、図１１と図１２に例示される。サブブロックは、必ずしも矩形ではなく、三角形又は台形の形状を有するかもしれない。一例では、第１のパラメータは量子化された角度値（ａｎｇｌｅＩｄｘ）を表し、第２のパラメータは量子化された距離値（ｄｉｓｔａｎｃｅＩｄｘ）を表す。２つのパラメータは、直線方程式を表す。一例では、距離１２３０は、ｄｉｓｔａｎｃｅＩｄｘ（第２のパラメータ）に従って得られ得、角度ａｌｐｈａ（１２１０）は、ａｎｇｌｅＩｄｘ（第１のパラメータ）に従って得られ得る。距離１２３０は、コーディング・ブロックの中心までの距離とすることができ、角度は、分離線と、コーディング・ブロックの中心点を通過する水平（又は同等の垂直）線との間の角度とすることができる。

【0210】

一例では、ステップ１において、コーディング・ブロックは、様々な方法で２つのサブブロックに分割されると考慮される。図９は、コーディング・ブロックのパーティションに関する例を示し、分離線１２５０は、ブロックが２つのサブブロックに分割されていることを示すために使用される。線１２５０を説明するために、１つのパラメータ角ａｌｐｈａ１２１０は、ビットストリームにおいてシグナリングされる。

【0211】

いくつかの実施形態では、図９に示すように、角度は、ｘ軸と分離線との間で測定され、距離は、分離線に垂直で、現在のブロックの中心を通過するベクトルの長さによって測定される。別の例では、図１０は、分離線を表す別の方法を示しており、角度と距離の例は、図９に示されている例とは異なる。

【0212】

ステップ２：算出されたｓａｍｐｌｅ＿ｄｉｓｔを使用して重み付け係数を計算し、その重み付け係数は、サンプルに対応する第１の予測値と第２の予測値との組み合わせのために使用される。一例では、重み付け係数は、ｓａｍｐｌｅＷｅｉｇｈｔ１及びｓａｍｐｌｅＷｅｉｇｈｔ２として示され、これらは、第１の予測値に対応する重み及び第２の予測値に対応する重みを指している。

【0213】

ステップ３：サンプル座標（ｘ，ｙ）での予測サンプルの合計値は、座標（ｘ，ｙ）での第１の予測値、座標（ｘ，ｙ）での第２の予測値、ｓａｍｐｌｅＷｅｉｇｈｔ１及びｓａｍｐｌｅＷｅｉｇｈｔ２に従って計算される。

【0214】

一例では、上記の例におけるＳｔｅｐ１は、以下のステップを含んでもよい。

【0215】

ステップ１．１：現在のブロックに対する角度パラメータ（ａｌｐｈａＮ）のインデックス値、現在のブロックの幅の値（Ｗ）、現在のブロックの高さの値（Ｈ）を取得する。ＷとＨは、サンプル数の現在のブロックの幅と高さである。例えば、幅と高さの両方が８に等しいコーディング・ブロックは、６４のサンプルを含む正方形ブロックである。別の例では、Ｗ及びＨは、ルマ・サンプルの数における現在のブロックの幅及び高さである。

【0216】

ステップ１．２：Ｗの値とＨの値に従って、比ｗｈＲａｔｉｏの値を取得し、ｗｈＲａｔｉｏの値は、現在のコーディング・ブロックの幅と高さの比を表す。

【0217】

ステップ１．３：ルックアップ・テーブル、ａｌｐｈａの値、及びｗｈＲａｔｉｏの値に従って、ｓｔｅｐＤ値を取得し、一例では、図１３に示すように、ａｌｐｈａの値及びｗｈＲａｔｉｏの値が、ルックアップ・テーブルのインデックス値として使用される。

【0218】

ステップ１．４：ｓａｍｐｌｅ＿ｄｉｓｔの値は、ｓｔｅｐＤの値に従って計算される。

【0219】

別の例では、上記の例におけるＳｔｅｐ１は、以下のステップを含んでもよい。

【0220】

ステップ１．１：現在のブロックに対する角度パラメータ（ａｌｐｈａＮ）、距離インデックスの値（ｄｉｓｔａｎｃｅＩｄｘ）、現在のブロックの幅の値（Ｗ）、現在のブロックの高さの値（Ｈ）を取得する。

【0221】

【0222】

ステップ１．３：ルックアップ・テーブル、ａｌｐｈａの値、及びｗｈＲａｔｉｏの値に従って、ｓｔｅｐＤ値を取得し、一例では、図１３に示すように、ａｌｐｈａＮの値及びｗｈＲａｔｉｏの値が、ルックアップ・テーブルのインデックス値として使用される。一例では、ｓｔｅｐＤ値は、サンプル距離計算プロセスのための量子化ステップ・サイズを表す。

【0223】

ステップ１．４：ｓａｍｐｌｅ＿ｄｉｓｔの値は、ｓｔｅｐＤの値、ｄｉｓｔａｎｃｅＩｄｘの値、角度の値（ａｌｐｈａＮ）、Ｗの値、Ｈの値に従って、計算される。
一例では、ｗｈＲａｔｉｏの値が式を使用して取得される。

【数15】

ここで、ｗＩｄｘの値は、ｌｏｇ２（Ｗ）－３であり、ｈＩｄｘの値は、ｌｏｇ２（Ｈ）－３である。

【0224】

別の例では、ｗｈＲａｔｉｏの値は、ｗｈＲａｔｉｏ＝（Ｗ＞＝Ｈ）？Ｗ／Ｈ：Ｈ／Ｗとして計算される。一例では、角度ａｌｐｈａの値を（復号器において）ビットストリームから取得することができる。一例では、角度の値範囲は、ａｎｇｌｅＩｄｘとして示される０～３１（０と３１を含む）の量子化された値範囲である。一例では、量子化された角度値は、３２の異なる値をのみを取る（したがって、０～３１の値は、どの角度値が選択されるかを表すのに十分である）。別の例では、角度値の値範囲は、０～１５の間であってもよく、これは、１６の異なる量子化された角度値が選択され得ることを意味する。一般に、角度値は、ゼロ以上の整数値であってもよいことに留意する。

【0225】

一例では、ａｌｐｈａＮの値は、ビットストリームから得られるインデックス値であるか、又はａｌｐｈａの値は、ビットストリームから取得されるインジケータの値に基づいて計算される。例えば、ａｌｐｈａＮの値は、以下の式に従って計算されてもよい。

【数16】

一方、ａｎｇｌｅＩｄｘは、ビットストリームから得られるインジケータの値である。ａｎｇｌｅＩｄｘの値は整数値で、ａｎｇｌｅＩｄｘの値の範囲は０～３１（０と３１を含む）である。

【0226】

別の例では、値ａｌｐｈａＮは、以下の式の１つに従って計算され得る。

【数17】

上記の式では、Ｌｉｍは量子化された角度値の数に関係する一定の予め定義された値である。例えば、３２の異なる量子化された角度値がある場合、数Ｌｉｍは８に等しくてもよい（４＊Ｌｉｍは、３２に等しい）。別の例では、Ｌｉｍは、４であり得、これは、合計１６の異なる量子化角度値に対応する。

【0227】

一例では、ｓａｍｐｌｅ＿ｄｉｓｔの値が以下の式に従って取得される。

【数18】

・ここで、ｆ１（）及びｆ２（）は関数であり、ａｌｐｈａは、関数に対する入力である。一例では、ｆ１（）とｆ２（）は、ルックアップ・テーブルとして実装され、ａｌｐｈａの値はルックアップ／テーブルのインデックス値である。
・ｓｃａｌｅＳｔｅｐの値は、コーディング（復号又は符号化）ブロックの幅の値、又はコーディング・ブロックの高さの値のいずれかに等しい。
・ｘ及びｙは、コーディング・ブロックの左上のサンプルに対するサンプルの座標である。
・Ｋは、整数のオフセット値である。一例では、Ｋの値は、１である。

【0228】

一例では、関数ｆ１（）及びｆ２（）は、ルックアップ・テーブルとして実装される。一例では、関数ｆ１（）と関数ｆ２（）は、ｘとｙの値の変化に対するｓａｍｐｌｅ＿ｄｉｓｔの値の増分変化を表す。いくつかの例では、ｆ１（ｉｎｄｅｘ）は、ｓａｍｐｌｅ＿ｄｉｓｔの値がｘの値の１ユニットの増加で変化する（ユニットは１に等しい増加かもしれない）ことを表すが、ｆ２（ｉｎｄｅｘ）は、ｓａｍｐｌｅ＿ｄｉｓｔの値がｙの値の１ユニットの増加で変化することを表す。インデックスの値は、ビットストリームにおけるインジケータの値から取得され得る。

【0229】

別の例では、ｓａｍｐｌｅ＿ｄｉｓｔの値が式に従って取得される。

【数19】

ここで、
・ｆ（）は、関数であり、一例では、ｆ（）はルックアップ・テーブルとして実装される。
・ｄｉｓｐＩｄｘＮ又はｄｉｓｐＩｄｘＳは、ビットストリームから取得されるか、又はビットストリームにおけるインジケータの値に基づいて計算されるインデックス値である。
・ｓｃａｌｅＳｔｅｐの値は、コーディング（復号又は符号化）ブロックの幅の値、又はコーディング・ブロックの高さの値のいずれかに等しい。
・ｘ及びｙは、コーディング・ブロックの左上のサンプルに対するサンプルの座標である。
・Ｋは、整数のオフセット値である。一例では、Ｋの値は、１である。

【0230】

一例では、関数ｆ（）は、ルックアップ・テーブルとして実装される。関数ｆ（）は、ｘとｙの値の変化に対するｓａｍｐｌｅ＿ｄｉｓｔの値の増分変化を表す。例では、ｆ（ｉｎｄｅｘ１）は、ｓａｍｐｌｅ＿ｄｉｓｔの値がｘの値の１ユニットの増加で変化し、ｆ（ｉｎｄｅｘ２）は、ｓａｍｐｌｅ＿ｄｉｓｔの値がｙの値の１ユニットの増加で変化することを表す。ｉｎｄｅｘ１及びｉｎｄｅｘ２の値は、ビットストリームにおけるインジケータの値に従って取得され得る（０以上の整数値を有する）テーブルへのインデックスである。

【0231】

一例では、関数ｆ（）の実装が図１４に示す。この例では、ｉｄｘの値が入力パラメータ（ｉｎｄｅｘ１又はｉｎｄｅｘ２である）であり、関数の出力はｆ（ｉｄｘ）として示される。一例では、ｆ（）は、整数演算を使ったコサイン関数の実装形式であり、ｉｄｘ（入力インデックス値）は、量子化された角度値を表す。

【0232】

一実施形態では、ｓｔｅｐＤ値は、サンプル距離計算のための量子化された距離値を表す。

【0233】

一例では、図１３に示すように、ｗｈＲａｔｉｏの値及び角度の値（ａｌｐｈａ）の値に従って、ｓｔｅｐＤの値が取得される。一例では、ｓｔｅｐＤの値は、ｓｔｅｐＤ＝ｌｏｏｋｕｐＴａｂｌｅ［ａｌｐｈａＮ］［ｗｈＲａｔｉｏ］として取得することができ、ここで、ａｌｐｈａＮの値は、ビットストリームから取得されるインデックス値であるか、又はａｌｐｈａＮの値は、ビットストリームから取得されるインジケータの値に基づいて計算される。例えば、ａｌｐｈａは、以下の式に従って計算され得る。

【数20】

ここで、ａｎｇｌｅＩｄｘは、ビットストリームに従って取得されるインデックス値である。

【0234】

別の例では、

【数21】

又は、別の例では、

【数22】

【0235】

一例では、ｓａｍｐｌｅ＿ｄｉｓｔの値は、ｄｉｓｔａｎｃｅＩｄｘ＊ｓｔｅｐＤ＊ｓｃａｌｅＳｔｅｐに従って取得され、ここで、ｄｉｓｔａｎｃｅＩｄｘは、ビットストリームに従って取得されるインデックス値であり、ｓｃａｌｅＳｔｅｐの値は、ブロックの幅の値又はブロックの高さの値のいずれかに従って取得される。乗算の結果は、コーディング・ブロック（座標ｘ＝Ｗ／２及びｙ＝Ｈ／２を有する）の中心点までの分離線の距離を表す。

【0236】

一例では、ルックアップ・テーブルは、予め定義されたテーブルである。予め定義されたテーブルは、以下の利点を有する。
・サンプルの分離線までの距離を取得することは通常複雑であり、大量生産された消費者製品を対象とするビデオ・コーディング規格を実装するときには受け入れ可能ではない三角方程式を解く必要がある。

【0237】

いくつかの例では、サンプル距離は、ルックアップ・テーブル（予め定義されてもよい）に従って取得され、そのテーブルは、ｗｈＲａｔｉｏ及びａｌｐｈａに従って中間結果を予め計算しており、それらは、すでに整数演算（したがって、一例では、すべてのｓｔｅｐＤ値は、整数である）に従っている。ルックアップ・テーブルを使用して得られる中間結果は、以下の理由で慎重に選択される。
・ルックアップ・テーブルは、複素演算に対する中間計算結果（三角計算）を含むため、実装の複雑性は低減される。
・テーブルのサイズは小さく保たれる（これは、メモリを必要とする）。

【0238】

別の例では、ｓａｍｐｌｅ＿ｄｉｓｔの値は、ｄｉｓｔａｎｃｅＩｄｘ＊（ｓｔｅｐＤ＋Ｔ）＊ｓｃａｌｅＳｔｅｐに従って取得され、ここで、Ｔは、整数値を有するオフセット値である。一例では、Ｔの値は、３２である。

【0239】

別の例では（復号器と符号化器の両方の観点から）、
上記の例におけるｓａｍｐｌｅ＿ｄｉｓｔの値は、図１１又は図１２に示すように、現在のコーディング・サブブロックにおけるサンプルと分離線との距離を示す。

【0240】

２つのサブブロックは、０と１でインデックス付けされる。第１のサブブロックは０でインデックス付けされ、第２のサブブロックは１でインデックス付けされる。

【0241】

幾何学的パーティション・モードでは、２つのサブブロックの処理順序はサブブロックのインデックスに基づいて決定される。インデックス０のサブブロックが最初に処理され、その後にインデックス１のサブブロックが処理されるだろう。処理順序は、サンプル重み導出プロセス、モーション情報記憶プロセス、モーション・ベクトル導出プロセスなどにおいて使用されてもよい。

【0242】

一例では、サブブロックのインデックス値は、サブブロックにおけるサンプルのｓａｍｐｌｅ＿ｄｉｓｔ値に基づいて決定される。

【0243】

１つのサブブロックにおける各サンプルのｓａｍｐｌｅ＿ｄｉｓｔ値がゼロより小さい（又は等しい）場合、サブブロックに対するインデックス値は０にセットされる。

【0244】

１つのサブブロックにおける各サンプルのｓａｍｐｌｅ＿ｄｉｓｔ値がゼロより大きい（又は等しい）場合、サブブロックに対するインデックス値は１にセットされる。

【0245】

同じ例では、サブブロックに対するインデックス値は修正（例えば、反転）されてもよい。

【0246】

一例では、サブブロックのインデックス値は、予め定義されたサンプル位置に基づいて修正されてもよい。

【0247】

一例では、コーディング・ブロックの予め定義された位置（例えば、左下の位置）が位置するサブブロックに対するインデックス値は、常に０としてセットされる。

【0248】

一例では、予め定義されたサンプル位置がインデックス値１を有する第２のサブブロックに属する場合、このサブブロックに対するインデックス値は、０に修正されるだろう（他のサブブロックに対するインデックス値は、１に修正される）。

【0249】

一例では、予め定義されたサンプル位置がインデックス０を有する第１のサブブロックに属する場合、サブブロックのインデックスは変更されない。

【0250】

図２０及び図２１に示す例について。予め定義されたサンプル位置は、現在のコーディング・ブロックの左下のサンプル位置である。

【0251】

図２０では、左下のサンプルはインデックス０を有する第１のサブブロックに属し、サブブロックのインデックスは変更されていない。

【0252】

図２１では、左下のサンプルは、インデックス１（図２１ａ）を有する第２のサブブロックに属し、したがって、２つのサブブロックのインデックスが、図２１ｂに示されるように、交換又は反転され、プロセス順序は、交換又は反転されたインデックスに基づくだろう。

【0253】

一例では、インデックス割り当て及び反転処理は、以下のステップで行われ得る。
ステップ１：現在のコーディング・ブロックを分裂モードに基づいて２つのサブブロックに分裂させる。
ステップ２：１つのサブブロック内のサンプルに対してｓａｍｐｌｅ＿ｄｉｓｔ値を計算する。

【0254】

ｓａｍｐｌｅ＿ｄｉｓｔ値が負の値かゼロに等しい場合、このサブブロックに対するインデックス値は０（第１のサブブロックに対応する）にセットされ、他のサブブロックに対するインデックス値は１（第２のサブブロックに対応する）にセットされる。
あるいは、
ｓａｍｐｌｅ＿ｄｉｓｔ値が正の値に等しい場合、このサブブロックに対するインデックス値は１（第２のサブブロックに対応する）にセットされ、他のサブブロックに対するインデックス値は０（第１のサブブロックに対応する）にセットされる。

【0255】

ステップ３：予め定義されたサンプル位置のｓａｍｐｌｅ＿ｄｉｓｔ値が正の値である場合、２つのサブブロックのインデックスを交換する。

【0256】

定義されたサンプル位置のｓａｍｐｌｅ＿ｄｉｓｔ値が負の場合、２つのサブブロックのインデックスは変更されない。

【0257】

本発明の一実施形態では、復号デバイス又は符号化デバイスによって実装されるコーディングの方法が開示される。

【0258】

方法は、以下を含む。

【0259】

Ｓ１０１：現在のコーディング・ブロックに対する分裂（又はパーティション）モードを取得する。

【0260】

分裂モードは、コーディング・ブロックをサブブロックに分裂させるために使用される。分裂モードは、角度及び／又は距離を有するように定義された形式の例であってもよい。水平方向に関する角度は、分離線に垂直な方向として記述される。分割線は、現在のコーディング・ブロックが２つのサブブロックに分割されていることを示すために使用される。距離は、現在のコーディング・ブロックの中心位置から分離線までの距離を説明している。いくつかの例では、分裂モードは、ビットストリームにおけるインジケータの値に従って表される。インジケータの値は、角度パラメータ値と距離パラメータ値を取得するために使用される。一例によれば、対（第１のパラメータ（角度）、第２のパラメータ（距離））は、予め定義された方法又は関数から導出され得る。言い換えれば、パーティション・モードのインジケータは、復号器のビットストリームから解析される。このインジケータは、方法又は関数への入力として定義される。方法又は関数の出力は、対（第１パラメータと第２パラメータ）である。

【0261】

インジケータ（ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ）と予め定義された方法又は関数の一例は、以下のようである。

【0262】

関数１
インジケータＸは、入力（０～６３）である。

【数23】

インジケータＸは、０～６３の値を有し、これは、第１パラメータ（Ａｎｇｌｅ）と第２パラメータ（Ｄｉｓｔ）を導出するために使用される。出力結果の例を表２に示す。テーブル２：関数１の入力及び出力テーブルであり、ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ（例えば、インジケータＸ）は、テーブルのインデックスであり、ａｎｇｌｅＩｄｘ（例えば、ａｎｇｌｅ）は第１のパラメータであり、ｄｉｓｔａｎｃｅＩｄｘ（例えば、Ｄｉｓｔ）は第２のパラメータである。

【表3-1】

【表3-2】

【0263】

インジケータ（ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ）と予め定義された方法又は関数の別の例は、以下のようである。

【0264】

関数２
インジケータＸは、入力（０～６３）である。

【数24】

インジケータＸは、０～６３の値を有し、これは、第１パラメータ（Ａｎｇｌｅ）と第２パラメータ（Ｄｉｓｔ）を導出するために使用される。出力結果の例が表３に記述される。テーブル３：関数２の入力及び出力テーブルであり、ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ（例えば、インジケータＸ）は、テーブルのインデックスであり、ａｎｇｌｅＩｄｘ（例えば、Ａｎｇｌｅ）は第１のパラメータであり、ｄｉｓｔａｎｃｅＩｄｘ（例えば、Ｄｉｓｔ）は第２のパラメータである。

【表4-1】

【表4-2】

【0265】

Ｓ１０２：現在のコーディング・ブロックは、分裂モードに基づいて、２つのサブブロック（サブブロックＡ、サブブロックＢ）に分裂されると考慮される。

【0266】

このステップでは、分割モードに従って、コーディング・ブロックにおけるサンプルは、２つのサブブロックに位置すると考慮される。サブブロックＡ又はサブブロックＢは、現在のコーディング・ブロックにおけるサンプルの一部（すべてではない）を含む。サブブロックＡ又はサブブロックＢは、各サンプルのｓａｍｐｌｅ＿ｄｉｓｔの符号に従って表されてもよい。ｓａｍｐｌｅ＿ｄｉｓｔは、上記の例及び実施形態に従って取得されてもよい。

【0267】

同じ例では、このステップは、コーディング・ブロックを２つのサブブロックに分割することに関する上述の実施形態又は例を指すことができる。例えば、コーディング・ブロックは、幾何学的モデルに従って２つのサブブロックに分割されてもよい。このモデルは、図９～１２に例示されているように、分離線（例えば、直線）によるブロックの分裂をもたらし得る。

【0268】

図９は、分離線１２５０に従って、コーディング・ブロックが２つのサブブロックに分割されていると考えられる、コーディング・ブロックのパーティションに関する例を示す。線１２５０を説明するために、２つのパラメータがシグナリングされ、一方のパラメータは角度ａｌｐｈａ１２１０であり、他方のパラメータは距離ｄｉｓｔ１２３０である。

【0269】

いくつかの実施形態では、図９に示すように、角度は、ｘ軸と分離線との間で測定され、距離は、分離線に垂直で、現在のブロックの中心を通過するベクトルの長さによって測定される。

【0270】

別の例では、図１０は、分離線を表す別の方法を示しており、角度と距離の例は、図９に示されている例とは異なる。符号化器側において、分離線（線を定義するパラメータ、例えば角度及び距離）は、レート歪みベースのコスト関数に基づいて判定される。判定された線パラメータは、ビットストリームに符号化される。復号器側において、線パラメータはビットストリームに従って復号（取得）される。

【0271】

一例では、輝度成分（ルマ）と２つのクロミナンス成分（クロマ）を含む３つのビデオ・チャネルの場合である。この分裂プロセスは、ルマ又はクロマに対して行われてもよい。

【0272】

一実施形態では、コーディング・ブロック内のサンプルに対して、距離値は、このサンプルがどのサブブロック（サブブロックＡ又はサブブロックＢ）に位置するかを決定するために使用される。一例では、コーディング・ブロック内の各サンプルに対して、距離値が取得される。

【0273】

一例では、サンプルに対応する距離値が０以下であるときに、このサンプルはサブブロックＡ（又はサブブロックＢ）内にあり、サンプルに対応する距離値が０より大きいときに、このサンプルはサブブロックＢ（又はサブブロックＡ）内にある。

【0274】

別の例では、サンプルに対応する距離値が０より小さいときに、このサンプルはサブブロックＡ（又はサブブロックＢ）内にあり、サンプルに対応する距離値が０以上であるときに、このサンプルはサブブロックＢ（又はサブブロックＡ）内にある。

【0275】

サンプルに対応する距離値（例えば、ｓａｍｐｌｅ＿ｄｉｓｔ）を取得するプロセスは、上記の例及び実施形態を参照することができ、例えば、ｓａｍｐｌｅ＿ｄｉｓｔは、サンプルに対応する距離値を表す。

【0276】

Ｓ１０３：サブブロックＡのインデックス値を、現在のコーディング・ブロックの予め定義されたサンプル位置に従ってセットする。

【0277】

いくつかの例では、所定のサンプル位置は、現在のコーディング・ブロックの左下、右下、左上、若しくは右上位置、又は中心位置であってもよい。

【0278】

予め定義されたサンプル位置がサブブロックＡ内に位置するときに、サブブロックＡのインデックス値は第１の値に等しくセットされ、この例では、サブブロックＢのインデックス値は第２の値に等しくセットされるだろう。
あるいは、
予め定義されたサンプル位置がサブブロックＡ内に位置するときに（例えば、予め定義あれたサンプル位置がサブブロックＢ内にあるときに）、サブブロックＡのインデックス値は第２の値に等しくセットされ、この例では、サブブロックＢのインデックス値は第１の値に等しくセットされるだろう。第１の値に対応する処理順序は、第２の値に対応する処理順序の前であり、予め定義されたサンプル位置が位置するサブブロックは、常に、他のサブブロックより前に処理される。処理は、サンプル重み導出プロセス、モーション情報記憶プロセス、モーション・ベクトル導出プロセスなどであってもよい。いくつかの例では、幾何学的パーティション・モードでは、２つのサブブロックの処理順序はサブブロックのインデックスに基づいて決定される。インデックス０のサブブロックが最初に処理され、その後にインデックス１のサブブロックが処理されるだろう。

【0279】

第１の値又は第２の値は整数値であってもよい。一例では、第１の値は、０もしくは１、又は他の値であってもよく、第２の値は、０もしくは１、又は他の値であってもよい。第１の値と第２の値が異なる。

【0280】

一例では、予め定義されたサンプル位置がサブブロックＡ内に位置するかどうかは、予め定義されたサンプル位置に対するサンプル距離値（例えば、ｓａｍｐｌｅ＿ｄｉｓｔ）に基づいて判定されてもよい。例えば、サブブロックＡ内のサンプルに対応するサンプル距離値が０より大きく、予め定義されたサンプル位置に対応するサンプル距離値が０より小さい場合、所定のサンプル位置はサブブロックＡ内ではなく、サブブロックＢ内にある。この例では、サブブロックＢ内の各サンプルは、０より小さいサンプル距離値を有する。いくつかの他の例では、サブブロックＢの各サンプルは、０より小さいか、又は０に等しいサンプル距離値を有してもよく、それは、サブブロックＢにおいて０に等しいサンプル距離値に対応するサンプルが考慮されるかどうかに依存する。別の例では、予め定義されたサンプル位置がサブブロックＡ内に位置するかどうかは、予め定義されたサンプル位置に対する座標値に基づいて判定されてもよい。

【0281】

実施形態２

【0282】

別の実施形態では、サブブロック又はブロックのインデックスは、予め定義された関数又はルックアップ・テーブルによってセットされ、予め定義された機能又はルックアップ・テーブルの入力値は、変数又はパラメータ値であってもよく、予め定義されたか、又はルックアップ・テーブルの出力は、サブブロック又はブロックのインデックス値である。

【0283】

一例では、ブロックのインデックスはｉｓＦｌｉｐとして表される分裂インデックスであってもよく、インデックス値ｉｓＦｌｉｐは、以下を満たす。

【数25】

【0284】

一例では、予め定義された関数又はルックアップ・テーブルの入力値は、ビットストリームから解析されてもよい。

【0285】

一例では、予め定義された関数又はルックアップ・テーブルの入力値は、指示情報の値に基づいて導出されてもよい。

【0286】

一例では、入力値は分裂境界の角度インデックスの値であり、これは、構文ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘから導出される。

【0287】

一例では、幾何学的パーティションのサブブロックＡのインデックス（ｉｎｄｅｘ）値は、以下のルックアップ・テーブルから導出されてもよい。

【0288】

ｐａｒｔＩｄｘ［ＡｎｇｌｅＩｄｘ］の値が０に等しい場合、幾何学的パーティションから分裂されたサブブロックＡのパート・インデックスが０であることを意味し、ｐａｒｔＩｄｘ［ＡｎｇｌｅＩｄｘ］の値が１に等しい場合、幾何学的パーティションから分裂されたサブブロックＡのパート・インデックスが１であることを意味する。

【表5】

【0289】

テーブル４は、以下のように関数又は方程式の形式に変換され得る。

【数26】

ＰａｒｔＩｄｘは、幾何学的パーティション・モード場合、部分反転を分裂させるために使用される。

【0290】

一例では、サブブロックＡとサブブロックＢが１つの幾何学的パーティションから分裂されるため、サブブロックＢは、サブブロックＡの反対のインデックス（例えば、値０に対応する値１、又は値１に対応する値０）を有するだろう。

【0291】

いくつかの例では、第１の値（上記の例では０）に対応する処理順序は、第２の値（上記の例では１）に対応する処理順序の前である。したがって、所定のサンプル位置が位置するサブブロックは、常に、他のサブブロックの前に処理される。処理は、サンプル重み導出プロセス、モーション情報記憶プロセス、モーション・ベクトル導出プロセスなどであってもよい。いくつかの例では、幾何学的パーティション・モードでは、２つのサブブロックの処理順序はサブブロックのインデックスに基づいて決定される。インデックス０のサブブロックが最初に処理され、その後にインデックス１のサブブロックが処理されるだろう。

【0292】

いくつかの例では、幾何学的パーティション・モードでは、予測子の値はｐｒｅｄｉｃｔｏｒＡ＊Ｍａｓｋ１＋ｐｒｅｄｉｃｔｏｒＢ＊Ｍａｓｋ２に等しく、ｐｒｅｄｉｃｔｏｒＡの値又はｐｒｅｄｉｃｔｏｒＢの値は、他のモード（例えば、マージ・モード）から導出されてもよく、Ｍａｓｋ１及びＭａｓｋ２は、幾何学的パーティションを形成するサブブロック分裂のための混合マスクである。混合マスクは、他のインジケータに基づいて事前に計算される。

【0293】

一例では、ａｎｇｌｅＩｄｘ及びｄｉｓｔａｎｃｅＩｄｘはｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘから導出され、ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘはビットストリームから解析される。

【0294】

サンプル位置と分裂境界の間の距離は、ａｎｇｌｅＩｄｘ及びｄｉｓｔａｎｃｅＩｄｘに基づいて計算され、混合マスクは、事前に定義されたルックアップ・テーブルを使用して、この距離に依存する。

【0295】

一例では、幾何学的パーティションから分裂されたサブブロックのインデックス値（例えば、０又は１）が、サブブロックのインジケータ・マスク選択に使用されてもよい。

【0296】

一例では、サブブロックのインデックス値が第１の値（例えば０）である場合、Ｍａｓｋ１は、予測子の値を生成するためにこのサブブロックに使用され、サブブロックのインデックス値が第２の値（例えば１）である場合、Ｍａｓｋ２は、予測子の値を生成するためにこのサブブロックに使用される。

【0297】

一例では、サブブロックＡのインデックス値が０である場合、サブブロックＡにはＭａｓｋ１が使用され、サブブロックＢにはＭａｓｋ２が使用される（この例では、サブブロックＢのインデックス値は１である）。

【数27】

【0298】

一例では、サブブロックＡのインデックス値が１である場合、サブブロックＡにはＭａｓｋ２が使用され、サブブロックＢにはＭａｓｋ１が使用される（この例では、サブブロックＢのインデックス値は０である）。

【数28】

【0299】

一般形式では、以下のようである。

【数29】

【0300】

図２２は、復号デバイスによって実装されるコーディングの方法を示し、方法は以下を含む。

【0301】

Ｓ２２０１：現在のコーディング・ブロックに対する分裂モード・インデックス値を取得する。

【0302】

一実装形式では、分裂モード・インデックス値は、どの幾何学的パーティション・モードが現在のコーディング・ブロックに使用されるかを示すために使用される。例えば、ｇｅｏ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘ又はｍｅｒｇｅ＿ｇｐｍ＿ｐａｒｔｉｔｉｏｎ＿ｉｄｘである。

【0303】

【0304】

【0305】

【0306】

【0307】

【0308】

【0309】

【0310】

【0311】

【0312】

【0313】

この項は、ビットストリームを介して与えられる、ソースと復号されたピクチャとの間の関係の一実施形態を指定する。

【0314】

ビットストリームによって表されるビデオ・ソースは、復号順序におけるピクチャのシーケンスである。

【0315】

【0316】

Ｓ２２０２：分裂モード・インデックス値とテーブルに従って、現在のコーディング・ブロックに対する角度インデックス値ａｎｇｌｅＩｄｘを取得する。

【0317】

一実装形式では、ａｎｇｌｅＩｄｘは、現在のコーディング・ブロックの幾何学的パーティションに使用される。

【0318】

一例では、ａｎｇｌｅＩｄｘは、幾何学的パーティションの角度インデックスを指定する。

【0319】

現在のブロックに対する角度パラメータの値は、分裂モードのインデックス値と予め定義されたルックアップ・テーブルの値に従って取得される。

【0320】

【表6】

【0321】

Ｓ２２０３：角度インデックス値ａｎｇｌｅＩｄｘに従って、インデックス値ｐａｒｔＩｄｘをセットする。

【0322】

一実装形式では、インデックス値ｐａｒｔＩｄｘは、以下を満たす。

【数30】

ｔｈｒｅｓｈｏｌｄ１及びｔｈｒｅｓｈｏｌｄ２は整数値であり、ｔｈｒｅｓｈｏｌｄ１はｔｈｒｅｓｈｏｌｄ２より小さい。

【0323】

一例では、ｔｈｒｅｓｈｏｌｄ１が１３であり、ｔｈｒｅｓｈｏｌｄ２が２７である。

【0324】

一例では、インデックス値はｉｓＦｌｉｐとして表される分裂インデックスであってもよく、インデックス値ｉｓＦｌｉｐは、以下も満たす。

【数31】

【0325】

Ｓ２２０４：インデックス値ｐａｒｔＩｄｘに従って、現在のコーディング・ブロックを復号する。

【0326】

【0327】

【0328】

上記の実施形態によれば、コーディング・ブロックは、インデックス値に従って復号される。復号プロセスは、サンプル重み導出プロセス、運動情報記憶プロセス、モーション・ベクトル導出プロセスなどであってもよい。したがって、バッファ利用と復号効率が改善されている。

【0329】

図２３は、ビデオ復号器であって、現在のコーディング・ブロックに対する分裂モード・インデックス値を取得するように構成されている解析ユニット２３０１と、分裂モード・インデックス値、及びテーブルに従って、現在のコーディング・ブロックに対する角度インデックス値ａｎｇｌｅＩｄｘを取得するように構成されている角度インデックス値取得ユニット２３０２と、角度インデックス値ａｎｇｌｅＩｄｘに従って、インデックス値ｐａｒｔＩｄｘをセットするように構成されているセッティング・ユニット２３０３と、インデックス値ｐａｒｔＩｄｘに従って、現在のコーディング・ブロックを復号するように構成されている処理ユニット２３０４と、含む、ビデオ復号器を示す。

【0330】

図２２による方法は、図２３による復号器によって実行され得る。

【0331】

上記方法のさらなる特徴及び実装形式は、復号器の特徴及び実装形式に対応する。

【0332】

１つの具体的な例では、幾何学的パーティショニング・モードのためのモーション・ベクトル記憶プロセスについてである。

【0333】

このプロセスは、ＭｅｒｇｅＧｐｍＦｌａｇ［ｘＣｂ］［ｙＣｂ］が１のコーディング・ユニットを復号するときに呼び出される。

【0334】

このプロセスへの入力は、
現在のピクチャの左上のルマ・サンプルに対する現在のルマ・コーディング・ブロックの左上のサンプルを指定するルマ位置（ｘＣｂ，ｙＣｂ）、
ルマ・サンプルにおける現在のコーディング・ブロックの幅を指定する変数ｃｂＷｉｄｔｈ、
ルマ・サンプルにおける現在のコーディング・ブロックの高さを指定する変数ｃｂＨｅｉｇｈｔ、
幾何学的パーティションの角度インデックスを指定する変数ａｎｇｌｅＩｄｘ、
幾何学的パーティションの距離インデックスを指定する可変ｄｉｓｔａｎｃｅＩｄｘ、
１／１６分数サンプル精度におけるルマ・モーション・ベクトルｍｖＡ及びｍｖＢ、
参照インデックスｒｅｆＩｄｘＡ及びｒｅｆＩｄｘＢ、
予測リスト・フラグｐｒｅＬｉｓｔＦｌａｇＡ及びｐｒｅＬｉｓｔＦｌａｇＢ。
水平方向と垂直方向の現在のコーディング・ブロックの４×４ブロックの数を指定する変数ｎｕｍＳｂＸとｎｕｍＳｂＹは、それぞれｃｂＷｉｄｔｈ＞＞２とｃｂＨｅｉｇｈｔ＞＞２に等しくセットされる。
変数、変位Ｘ、変位Ｙ、ｉｓＦｌｉｐ、及びｓｈｉｆｔＨｏｒは、以下のように導出される。

【数32】

【0335】

変数ｏｆｆｓｅｔＸとｏｆｆｓｅｔＹは、以下のように導出される。
ＳｈｉｆｔＨｏｒが０に等しい場合、以下が適用される。

【数33】

そうではない（ＳｈｉｆｔＨｏｒが１に等しい）場合、以下が適用される。

【数34】

ｘＳｂＩｄｘ＝０．．ｎｕｍＳｂＸ－１、及びｙＳｂＩｄｘ＝０．．ｎｕｍＳｂＹ－１であるサブブロック・インデックス（ｘＳｂＩｄｘ，ｙＳｂＩｄｘ）での各４×４個のサブブロックに対して、以下が適用される：

【0336】

変数ｍｏｔｉｏｎＩｄｘは、以下のように表３７に指定されたアレイｄｉｓＬｕｔに基づき、以下のように計算される。

【数35】

変数ｓＴｙｐｅは、以下のように導出される。

【数36】

ｓＴｙｐｅの値に依存して、以下の割り当てが行われる。

【0337】

ｓＴｙｐｅが０に等しい場合、以下が適用される。

【数37】

そうではなく、ｓＴｙｐｅが１に等しいか、又は（ｓＴｙｐｅが２に等しく、ｐｒｅｄＬｉｓｔＦｌａｇＡ＋ｐｒｅｄＬｉｓｔＦｌａｇＢが１に等しくない）場合、以下が適用される。

【数38】

そうではない（ｓＴｙｐｅが２に等しく、ｐｒｅｄＬｉｓｔＦｌａｇＡ＋ｐｒｅｄＬｉｓｔＦｌａｇＢが１に等しくない）場合、以下が適用される。

【数39】

【0338】

ｘ＝０．．３及びｙ＝０．．３に対して、以下の割り当てが行われる。

【数40】

【0339】

図２４は、本発明による復号器の一実施形態を示すブロック図である。復号器２４００は、プロセッサ２４０１と、プロセッサ２４０１に結合され、プロセッサ２４０１による実行のためのプログラミング命令を記憶する非一時的なコンピュータ可読記憶媒体２４０２と、を含み、プログラミング命令は、プロセッサによって実行されるときに、復号器に、第１の態様又はそれの任意の実装形式もしくは実施形態に従って、方法を実行させる。

【0340】

例１．復号デバイス又は符号化デバイスによって実装されるコーディングの方法であって、
現在のコーディング・ブロックに対する分裂モードを取得することと、
分裂モードに基づいて現在のコーディング・ブロックを２つのサブブロック（サブブロックＡ、サブブロックＢ）に分裂させることと、
予め定義された関数又は予め定義されたテーブルに従って、サブブロックＡのインデックス値をセットすることと、を含む。

【0341】

例２．予め定義された関数又は予め定義されたテーブルに対する入力値は、現在のコーディング・ブロックに対する角度インデックス値である（例えば、角度値は、現在のコーディング・ブロックの幾何学的パーティションに使用される）、例１に記載の方法。

【0342】

例３．予め定義された関数は、

【数41】

ここで、ＡｎｇｌｅＩｄｘは、現在のコーディング・ブロックに対する角度インデックス値であり、ｐａｒｔＩｄｘ［ＡｎｇｌｅＩｄｘ］は、サブブロックＡのインデックス値であり、ｔｈｒｅｓｈｏｌｄ１及びｔｈｒｅｓｈｏｌｄ２は、整数値であり、ｔｈｒｅｓｈｏｌｄ１（ｔｈｒｅｓｈｏｌｄ１の値は１３）は、ｔｈｒｅｓｈｏｌｄ２（閾値２の値は２７）より小さい、例１又は２に記載の方法。

【0343】

【表7】

ここで、ＡｎｇｌｅＩｄｘは、現在のコーディング・ブロックに対する角度インデックス値であり、ｐａｒｔＩｄｘ［ＡｎｇｌｅＩｄｘ］は、サブブロックＡのインデックス値である。

【0344】

例５．復号デバイス又は符号化デバイスによって実装されるコーディングの方法であって、
現在のブロックに対する角度パラメータの値を取得することと、
現在のブロックに対する距離パラメータの値を取得することと、
角度パラメータ及び距離パラメータの値に従って、現在のブロックにおける所定のサンプル（例えば、現在のブロックにおける左下、右下、左上又は右上の位置に位置するサンプル）に対するサンプル距離値を計算することと、
予め定義されたサンプルに対するサンプル距離値に基づいて、現在のブロック内の２つのサブブロックに対する２つのインデックス値をセットすることと、を含む、方法。

【0345】

例６．予め定義されたサンプルに対するサンプル距離の値に基づいて、現在のブロック内の２つのサブブロックに対する２つのインデックス値をセットすることは、
第１の値に等しい、定義されたサンプルが位置する１つのサブブロックに対するインデックス値をセットすることと、
第２の値に等しい、他のサブブロックに対するインデックス値セットすることと、を含み、第１の値に対応する処理順序は、第２の値に対応する処理順序の前である、例５に記載の方法。

【0346】

例７．サブブロックに対するインデックス値に基づいて、値又は混合マスク（例えば、Ｍａｓｋ１又はＭａｓｋ２）を選択することをさらに含む、例１～６のいずれか１つに記載の方法。

【0347】

例８．例１～７のいずれか１つに記載の方法を実施するための処理回路を含む、復号器（３０）又は符号化器。

【0348】

例９．請求項１～７のいずれか一項に記載の方法を実行するためのプログラム・コードを含む、コンピュータ・プログラム製品。

【0349】

例１０．復号器又は符号化器であって、
１つ以上のプロセッサと、
プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ可読記憶媒体であって、プログラミングは、プロセッサによって実行される場合に、例１～７のいずれか一項に記載の方法を実施するように復号器を設定する、非一時的なコンピュータ可読記憶媒体と、を含む、復号器又は符号化器。

【0350】

数学演算子
この出願で使用される数学演算子は、Ｃプログラミング言語で使用されるものに類似する。しかし、整数除算演算と算術シフト演算の結果は、より正確に定義され、べき乗や実数値除算などの追加演算が定義される。番号付けとカウントの規則は一般に０から開始する。例えば、「第１」は、０番に等価であり、「第２」は、１番に等価であるなどである。

【0351】

算術演算子
次の算術演算子は、次のように定義される。
＋加算
－減算（２引数演算子として）又は否定（単項接頭演算子として）
＊行列乗算を含む乗算
ｘ^ｙべき乗。ｘの指数ｙのべき乗を指定する。他の文脈では、そのような表記は、べき乗として解釈することを意図しない上付き文字として使用される。
／結果がゼロに向かって切り捨てられる整数除算。たとえば、７／４と－７／－４は１に切り捨てられ、－７／４と７／－４は－１に切り捨てられる。
÷ 切り捨てや丸めが意図されていない数式の除算を示すために使用される。

【0352】

【数42】

切り捨てや丸めが意図されていない数式の除算を示すために使用される。

【0353】

【数43】

ｘからｙまでのすべての整数値をとるｉのｆ（ｉ）の和である。
ｘ％ｙ剰余。ｘの残りをｙで割った余りであり、ｘ＞＝０及びｙ＞０の整数ｘ及びｙに対してのみ定義される。

【0354】

論理演算子
次の論理演算子は、次のように定義される。
ｘ＆＆ｙｘとｙのブール論理「ａｎｄ」
ｘ｜｜ｙｘとｙのブール論理「ｏｒ」
！ブール論理「否定」
ｘ？ｙ：ｚｘがＴＲＵＥ又は０でない場合、ｙの値、そうでない場合はｚの値で評価される。

【0355】

関係演算子
次の関係演算子は、次のように定義される。
＞より大きい
＞＝以上
＜より小さい
＜＝以下
＝＝等しい
！＝等しくない
値「ｎａ」（適用不可）が割り当てられた構文要素又は変数に関係演算子が適用される場合に、値「ｎａ」はその構文要素又は変数の重複しない値として扱われる。値「ｎａ」は他の値と等しくないとみなされる。

【0356】

ビット単位演算子
次のビット単位演算子は、次のように定義される。
＆ビット単位の「ａｎｄ」である。整数引数について操作する場合に、整数値の２の補数表現について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合に、より短い引数は、０に等しいより大きなビットを加えることによって拡張される。
｜ビット単位の「ｏｒ」である。整数引数について操作する場合に、整数値の２の補数表現について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合に、より短い引数は、０に等しいより大きなビットを加えることによって拡張される。
＾ビット単位の「ｅｘｃｌｕｓｉｖｅｏｒ」である。整数引数について操作する場合に、整数値の２の補数表現について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合に、より短い引数は、０に等しいより大きなビットを加えることによって拡張される。
ｘ＞＞ｙｘをｙバイナリ・ディジットの２の補数整数表現の算術右シフトである。この関数は、ｙの負でない整数値に対してのみ定義される。右シフトの結果として最上位ビット（ＭＳＢ）にシフトされたビットは、シフト演算の前にｘのＭＳＢに等しい値を持つ。
ｘ＜＜ｙｘをｙバイナリ・ディジットの２の補数整数表現の算術左シフトである。この関数は、ｙの負でない整数値に対してのみ定義される。左シフトの結果として最下位ビット（ＬＳＢ）にシフトされたビットは、０に等しい値を持つ。

【0357】

割り当て演算子
次の代入演算子は、次のように定義される。
＝代入演算子
＋＋インクリメント、すなわちｘ＋＋はｘ＝ｘ＋１と等価であり、配列インデックスで使用される場合に、インクリメント演算の前に変数の値で評価される。
－－デクリメント、すなわちｘ＋＋はｘ＝ｘ＋１と等価であり、配列インデックスで使用される場合に、デクリメント演算の前に変数の値で評価される。
＋＝指定された量だけインクリメントする、すなわちｘ＋＝３はｘ＝ｘ＋３と等価であり、ｘ＋＝（－３）はｘ＝ｘ＋（－３）と等価である。
－＝指定された量だけデクリメントする、すなわちｘ－＝３はｘ＝ｘ－３と等価であり、ｘ－＝（－３）はｘ＝ｘ－（－３）と等価である。

【0358】

範囲表記
値の範囲を指定するには、次の表記が使用される。
ｘ＝ｙ．．ｚｘは、ｙからｚまでの整数値をとり、ｘ、ｙ及びｚは、整数であり、ｚは、ｙより大きい。

【0359】

数学関数
次の数学関数が定義される。

【0360】

【数44】

Ａｓｉｎ（ｘ）正弦の逆三角関数であって、－１．０～１．０の範囲の引数ｘについて操作し、
－π÷２～π÷２（ラジアンの単位）の範囲の出力値である。
Ａｔａｎ（ｘ）正接の逆三角関数であって、引数ｘについて操作し、－π÷２～π÷２（ラジアンの単位）の範囲の出力値である。

【0361】

【数45】

Ｃｅｉｌ（ｘ）ｘ以上の最小整数である。

【0362】

【数46】

Ｃｏｓ（ｘ）ラジアン単位の引数ｘについて操作する余弦の三角関数である。
Ｆｌｏｏｒ（ｘ）ｘ以下の最大整数である。

【0363】

【数47】

Ｌｎ（ｘ）ｘの自然対数（底ｅ対数、ｅは自然基本定数２．７１８２８１８２８．．．．）。
ｌｏｇ２（ｘ）ｘの底２の対数
Ｌｏｇ１０（ｘ）ｘの底１０の対数

【0364】

【数48】

Ｓｉｎ（ｘ）ラジアン単位の引数ｘについて操作する正弦の三角関数である。

【0365】

【数49】

Ｔａｎ（ｘ）ラジアン単位の引数ｘについて操作する正接の三角関数である。

【0366】

演算優先度順位
式の優先順位が丸かっこを使用して明示的に示されない場合、次の規則が適用される。
－より高い優先度の演算は、より低い優先度の演算の前に評価される。
－同じ優先度の演算は、左から右へ順次評価される。
以下の表は、最高から最低までの演算の優先度を指定しており、表中のより高い位置は、より高い優先度を示す。
Ｃプログラミング言語でも使用されるこれらの演算子については、本明細書で使用される優先順位は、Ｃプログラミング言語で使用される優先順位と同じである。

【0367】

【表8】

表：（表の上部）最高から（表の下部）最低までの演算優先度

【0368】

論理演算のテキスト記載
本テキストにおいて、次の形式で数学的に記載される論理演算の記述

【0369】

【数50】

は、以下の方式で記載されてもよい。

【0370】

【数51】

本テキストにおいて、各「Ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，．．．」文は、直後に「Ｉｆ．．．」が続く、「．．．ａｓｆｏｌｌｏｗｓ」又は「．．．ｔｈｅｆｏｌｌｏｗｉｎｇａｐｐｌｉｅｓ」で導入される。「Ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，．．．」の最後の条件は、常に「Ｏｔｈｅｒｗｉｓｅ，．．．」である。「Ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，ｉｆ．．．Ｏｔｈｅｒｗｉｓｅ，．．．」文は、「．．．ａｓｆｏｌｌｏｗｓ」又は「．．．ｔｈｅｆｏｌｌｏｗｉｎｇａｐｐｌｉｅｓ」を終わりの「Ｏｔｈｅｒｗｉｓｅ，．．．」と一致させることによって識別することができる。
本テキストにおいて、次の形式で数学的に記載される論理演算の記述

【0371】

【数52】

は、以下の方式で記載されてもよい。

【0372】

【数53】

本テキストにおいて、次の形式で数学的に記載される論理演算の記述

【0373】

【数54】

は、以下の方式で記載されてもよい。

【0374】

【数55】

【0375】

図１８は、コンテンツ配信サービスを実現するためのコンテンツ供給システム３１００を示すブロック図である。このコンテンツ供給システム３１００は、捕捉デバイス３１０２、端末デバイス３１０６を含み、任意選択で、ディスプレイ３１２６を含む。捕捉デバイス３１０２は、通信リンク３１０４を介して端末デバイス３１０６と通信する。通信リンクは、上述の通信チャネル１３を含んでもよい。通信リンク３１０４は、ＷＩＦＩ、イーサネット、ケーブル、無線（３Ｇ／４Ｇ／５Ｇ）、ＵＳＢ、又はそれらの任意の種類の組み合わせなどを含むが、これらに限定されない。捕捉デバイス３１０２は、データを生成し、上記の実施形態に示す符号化方法によってデータを符号化してもよい。代替的には、捕捉デバイス３１０２は、ストリーミングサーバ（図示せず）にデータを配信することができ、サーバは、データを符号化し、符号化されたデータを端末デバイス３１０６に送信する。

【0376】

捕捉デバイス３１０２は、カメラ、スマートフォン又はパッド、コンピュータ若しくはラップトップ、ビデオ会議システム、ＰＤＡ、車載デバイス、又はそれらのいずれかの組み合わせなどを含むが、これらに限定されない。例えば、捕捉デバイス３１０２は、上述のようにソース・デバイス１２を含んでもよい。データがビデオを含む場合に、捕捉デバイス３１０２に含まれるビデオ符号化器２０は、実際にビデオ符号化処理を実行することができる。データがオーディオ（すなわち、音声）を含む場合、捕捉デバイス３１０２に含まれるオーディオ符号化器は、実際にオーディオ符号化処理を実行することができる。いくつかの実際的なシナリオでは、捕捉デバイス３１０２は、符号化されたビデオ及びオーディオ・データを、それらを一緒に多重化することによって配布する。他の実際的なシナリオ、例えば、ビデオ会議システムにおいては、符号化されたオーディオ・データ及び符号化されたビデオ・データは多重化されない。捕捉デバイス３１０２は、符号化されたオーディオ・データ及び符号化されたビデオ・データを、端末デバイス３１０６に別々に配信する。

【0377】

【0378】

ディスプレイを有する端末デバイス、例えば、スマートフォン又はパッド３１０８、コンピュータ又はラップトップ３１１０、ネットワーク・ビデオ・レコーダ（ＮＶＲ）／デジタル・ビデオ・レコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、パーソナル・デジタル・アシスタント（ＰＤＡ）３１２２、又は車載デバイス３１２４では、端末デバイスは、復号されたデータをそのディスプレイに供給することができる。ディスプレイを搭載しないデバイス、例えば、ＳＴＢ３１１６、ビデオ会議システム３１１８、又はビデオ監視システム３１２０では、外部ディスプレイ３１２６がそこに接触されて、復号されたデータを受信し、示す。

【0379】

このシステムの各デバイスが符号化又は復号を行う場合に、前述の実施形態に示すように、ピクチャ符号化デバイス又はピクチャ復号デバイスを使用することができる。

【0380】

図１９は、端末デバイス３１０６の一例の構成を示す図である。端末デバイス３１０６が、捕捉デバイス３１０２からストリームを受信した後、プロトコル進行ユニット３２０２は、ストリームの伝送プロトコルを分析する。このプロトコルは、リアルタイム・ストリーミング・プロトコル（ＲＴＳＰ）、ハイパー・テキスト・トランスファー・プロトコル（ＨＴＴＰ）、ＨＴＴＰライブ・ストリーミング・プロトコル（ＨＬＳ）、ＭＰＥＧ－ＤＡＳＨ、リアルタイム・トランスポート・プロトコル（ＲＴＰ）、リアルタイム・メッセージング・プロトコル（ＲＴＭＰ）、又はそれらの任意の種類の組み合わせなどを含むが、これらに限定されない。

【0381】

プロトコル進行ユニット３２０２がストリームを処理した後に、ストリームファイルは、生成される。ファイルは、逆多重化ユニット３２０４に出力される。逆多重化ユニット３２０４は、多重化されたデータを符号化されたオーディオ・データと符号化されたビデオ・データとに分離することができる。上述したように、いくつかの実際的なシナリオ、例えば、ビデオ会議システムにおいては、符号化されたオーディオ・データ及び符号化されたビデオ・データは多重化されない。この状況では、符号化データは、逆多重化部３２０４を介することなく、ビデオ復号器３２０６及びオーディオ復号器３２０８に送信される。

【0382】

逆多重化処理を介して、ビデオ・エレメントリー・ストリーム（ＥＳ）、オーディオＥＳ、及び任意選択で字幕が生成される。前述の実施形態で説明されたビデオ復号器３０を含むビデオ復号器３２０６は、上述の実施形態に示す復号方法によってビデオＥＳを復号して、ビデオ・フレームを生成し、このデータを同期ユニット３２１２に送信する。オーディオ復号器３２０８は、オーディオＥＳを復号して、オーディオ・フレームを生成し、このデータを同期ユニット３２１２に送信する。代替的には、ビデオ・フレームは、同期ユニット３２１２に供給する前に、バッファ（図１９には示さず）に記憶させてもよい。代替的には、オーディオ・フレームは、同期ユニット３２１２に供給する前に、バッファ（図１９には示さず）に記憶させてもよい。

【0383】

【0384】

【0385】

本発明は、前述のシステムに限定されるものではなく、前述の実施形態におけるピクチャ符号化デバイス又はピクチャ復号デバイスのいずれかを、他のシステム、例えば、自動車システムに組み込むことができる。

【0386】

本発明の実施形態は、主にビデオ・コーディングに基づいて説明されてきたが、コーディング・システム１０、符号化器２０及び復号器３０（並びに対応するシステム１０）の実施形態と、本明細書に説明される他の実施形態もまた、静止ピクチャ処理又はコーディング、例えば、ビデオ・コーディングにおけるように任意の先行又は連続するピクチャから独立した個々のピクチャの処理又はコーディングのために構成されてもよいことに留意されたい。一般に、ピクチャ処理コーディングが単一のピクチャ１７に限定される場合、インター予測ユニット２４４（符号化器）及び３４４（復号器）のみが利用可能ではないことがある。ビデオ符号化器２０及びビデオ復号器３０の他のすべての機能（ツール又は技術とも呼ばれる）は、例えば、残留計算２０４／３０４、変換２０６、量子化２０８、逆量子化２１０／３１０、（逆）変換２１２／３１２、パーティショニング２６２／３６２、フレーム内予測２５４／３５４、及び／又はループ・フィルタリング２２０、３２０、及びエントロピー符号化２７０及びエントロピー復号３０４は、静止ピクチャ処理のために等しく使用されてもよい。

【0387】

例えば、符号化器２０及び復号器３０の実施形態、並びに、例えば、符号化器２０及び復号器３０を参照して、本明細書で説明される機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで実装されてもよい。ソフトウェアで実装される場合、機能は、コンピュータ可読媒体に記憶されるか、又は１つ以上の命令又はコードとして通信媒体を介して送信され、ハードウェアベースの処理ユニットによって実行される。

【0388】

コンピュータ可読媒体は、データ記憶媒体のような有形媒体に対応するコンピュータ可読記憶媒体、又は、例えば通信プロトコルにしたがって、ある場所から他の場所へのコンピュータ・プログラムの転送を容易にする任意の媒体を含む通信媒体を含んでもよい。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形のコンピュータ可読記憶媒体、又は（２）信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明される技術の実装のための命令、コード及び／又はデータ構造を検索するために、１つ以上のコンピュータ又は１つ以上のプロセッサによってアクセス可能な任意の利用可能な媒体であり得る。コンピュータ・プログラム製品は、コンピュータ可読記憶媒体を含んでもよい。

【0389】

例により、限定するものではないが、このようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ又は他の光ディスク記憶デバイス、磁気ディスクストレージ、又は他の磁気記憶デバイス、フラッシュメモリ、又は命令又はデータ構造の形式で所望のプログラム・コードを記憶するために使用することができ、コンピュータによってアクセスすることができる他の任意の媒体を含むことができる。また、任意の接続は、適切にコンピュータ可読媒体とも称される。例えば、同軸ケーブル、光ファイバケーブル、ツイスト・ペア、デジタル加入者線（ＤＳＬ）、又は赤外線、無線、及びマイクロ波などの無線技術を用いて、ウェブサイト、サーバ、又は他のリモート・ソースから命令が送信される場合、同軸ケーブル、光ファイバケーブル、ツイスト・ペア、又は赤外線、無線、及びマイクロ波のような無線技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時的な媒体を含まず、代わりに非一時的で有形の記憶媒体に向けられると理解されたい。ディスクは、本明細書で使用する場合、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピー・ディスク及びブルーレイ・ディスクを含み、ディスクは、通常、磁気的にデータを再生し、ディスクは光学的にレーザでデータを再生する。上記の組み合せはまた、コンピュータ可読媒体の範囲に含まれるべきである。

【0390】

命令は、１つ以上のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル論理アレイ（ＦＰＧＡ）、又は他の同等の集積又は個別論理回路などの１つ以上のプロセッサによって実行されてもよい。したがって、本明細書で使用する用語「プロセッサ」は、前述の構造のいずれか、又は本明細書で説明される技術の実装に好適な他の構造を指してもよい。追加的に、いくつかの態様において、本明細書で説明される機能は、符号化及び復号のために構成される専用ハードウェア及び／又はソフトウェア・モジュール内に提供されてもよく、又は組み合わされたコーデックに組み込まれてもよい。また、この技術は、１つ以上の回路又は論理素子で完全に実装することができる。

【0391】

本開示の技術は、無線ハンドセット、集積回路（ＩＣ）、又はＩＣのセット（例えば、チップセット）を含む、広範な種類のデバイス又は装置で実装されてもよい。本開示では、開示された技術を実行するように構成されているデバイスの機能的態様を強調するために、種々のコンポーネント、モジュール、又はユニットが説明されるが、必ずしも異なるハードウェアユニットによる実現を必要としない。むしろ、上述のように、種々のユニットは、コーデック・ハードウェア・ユニット内で組み合わされてもよく、又は、適切なソフトウェア及び／又はファームウェアと共に、上述の１つ以上のプロセッサを含む、相互動作可能なハードウェアユニットの集合によって提供されてもよい。

【図1A】