特開2022-126817 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ベイジン　バイトダンス　ネットワーク　テクノロジー　カンパニー　リミテッドの特許一覧 ▶ バイトダンス　インコーポレイテッドの特許一覧

特開2022-126817マージ／ＡＭＶＰにＨＭＶＰ候補を追加する際の一部／全部プルーニング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27A
27B
28
29
30
31
32
33A
33B
34A
34B

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022126817

(43)【公開日】2022-08-30

(54)【発明の名称】マージ／ＡＭＶＰにＨＭＶＰ候補を追加する際の一部／全部プルーニング

(51)【国際特許分類】

H04N 19/52 20140101AFI20220823BHJP

【ＦＩ】

H04N19/52

【審査請求】有

【請求項の数】21

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2022102073

(22)【出願日】2022-06-24

(62)【分割の表示】P 2021523110の分割

【原出願日】2019-07-01

(31)【優先権主張番号】PCT/CN2018/093663

(32)【優先日】2018-06-29

(33)【優先権主張国・地域又は機関】CN

(31)【優先権主張番号】PCT/CN2018/105193

(32)【優先日】2018-09-12

(33)【優先権主張国・地域又は機関】CN

(31)【優先権主張番号】PCT/CN2018/117627

(32)【優先日】2018-11-27

(33)【優先権主張国・地域又は機関】CN

(31)【優先権主張番号】PCT/CN2019/071214

(32)【優先日】2019-01-10

(33)【優先権主張国・地域又は機関】CN

(71)【出願人】

【識別番号】520476341

【氏名又は名称】北京字節跳動網絡技術有限公司

【氏名又は名称原語表記】ＢｅｉｊｉｎｇＢｙｔｅｄａｎｃｅＮｅｔｗｏｒｋＴｅｃｈｎｏｌｏｇｙＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】ＲｏｏｍＢ－００３５，２／Ｆ，Ｎｏ．３Ｂｕｉｌｄｉｎｇ，Ｎｏ．３０，ＳｈｉｘｉｎｇＲｏａｄ，ＳｈｉｊｉｎｇｓｈａｎＤｉｓｔｒｉｃｔＢｅｉｊｉｎｇ１０００４１Ｃｈｉｎａ

(71)【出願人】

【識別番号】520477474

【氏名又は名称】バイトダンスインコーポレイテッド

【氏名又は名称原語表記】ＢＹＴＥＤＡＮＣＥＩＮＣ．

【住所又は居所原語表記】１２６５５ＷｅｓｔＪｅｆｆｅｒｓｏｎＢｏｕｌｅｖａｒｄ，ＳｉｘｔｈＦｌｏｏｒ，ＳｕｉｔｅＮｏ．１３７ＬｏｓＡｎｇｅｌｅｓ，Ｃａｌｉｆｏｒｎｉａ９００６６ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】110002000

【氏名又は名称】特許業務法人栄光特許事務所

(72)【発明者】

【氏名】ジャンリー

(72)【発明者】

【氏名】ジャンカイ

(72)【発明者】

【氏名】リウホンビン

(72)【発明者】

【氏名】ワンユエ

(57)【要約】（修正有）

【課題】少なくとも１つの動き候補が記憶された動きベクトルのマージリストに基づく動きベクトル予測技術を実装するより高いコーディング効率を有する映像処理法、装置及びプログラムを提供する。
【解決手段】映像処理方法は、テーブルのセットを維持することを含む。各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる。方法はさらに、動き候補へのプルーニング工程を使用して１つ以上のテーブルで動き候補に基づいて動き候補リストを更新することと、第１の映像ブロックと、構成した候補リストを用いて、前記第１の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、を有する。
【選択図】図２９

【特許請求の範囲】

【請求項1】

テーブルのセットを維持することであって、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる、ことと、
前記動き候補へのプルーニング工程を用いて、１つ以上のテーブルにおける動き候補に基づいて候補リストを更新することと、
前記構成された候補リストを用いて、第１の映像ブロックと、前記第１の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、
を有する、映像処理方法。

【請求項2】

映像データの第１の映像ブロックを含む映像のビットストリーム表現を受信することと、
候補リストを更新するために、１つ以上のテーブルにおける動き候補に対してプルーニング工程を適用することであって、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる、ことと、
前記構成された候補リストを用いて、前記ビットストリーム表現と前記第１の映像ブロックとの間の変換を行うことと、
を有する、映像処理方法。

【請求項3】

前記テーブルの少なくとも１つは、前記第１の映像ブロックの前に復号化された、以前復号化された映像ブロックから導出した動き候補を含む、請求項１または２に記載の方法。

【請求項4】

前記プルーニング工程は、テーブルからの動き候補を前記候補リストに追加する前に行われる、請求項１または２に記載の方法。

【請求項5】

前記候補リストは、マージ候補リストに対応する、請求項４に記載の方法。

【請求項6】

前記プルーニング工程は、テーブルからの動き候補と、利用可能な空間的または時間的マージ候補の少なくとも一部とを比較することを含む、請求項１または２に記載の方法。

【請求項7】

前記プルーニング工程は、テーブルからの動き候補とすべての利用可能なマージ候補とを比較することを含む、請求項１または２に記載の方法。

【請求項8】

前記プルーニング工程は、動き候補をテーブルからサブブロックに基づく動き候補なく行われる、請求項１、２、または４に記載の方法。

【請求項9】

前記プルーニング工程は、前記動き候補を加える前に、テーブルからの動き候補をマージ候補リストにおける利用可能な動き候補の少なくとも１部と比較することを含む、請求項１または２に記載の方法。

【請求項10】

前記プルーニング工程は、複数の工程を含み、その数は、複数の空間的または時間的マージ候補の関数である、請求項１または２に記載の方法。

【請求項11】

前記複数の工程は、マージ候補リストにおいてＭ個の候補が利用可能である場合に、前記プルーニングが、Ｋ個のマージ候補にのみ適用され、Ｋ≦Ｍであり、ＫおよびＭが整数である、請求項１０に記載の方法。

【請求項12】

Ｋをｍｉｎ（Ｋ，２）に設定する、請求項１１に記載の方法。

【請求項13】

前記プルーニング工程は、前記動き候補を前記候補リストに加える前に、テーブルからの動き候補と前記候補リストにおける最初のＮ個の候補とを比較することを含み、Ｎが整数である、請求項１または２に記載の方法。

【請求項14】

前記プルーニング工程は、前記動き候補を前記候補リストに加える前に、チェック対象のテーブルからの動き候補と、前記候補リストにおける最後のＮ個の候補とを比較することを含み、Ｎが整数である、請求項１または２に記載の方法。

【請求項15】

Ｎの値を信号通知することをさらに含む、請求項１３または１４に記載の方法。

【請求項16】

前記プルーニング工程は、前記候補がどのように導出されたかに基づいて、テーブルからの動き候補と前記候補リストにおける、ある候補とを比較することを含む、請求項１に記載の方法。

【請求項17】

前記プルーニング工程は、テーブルからの前記動き候補と、所与の時間的または空間的に近傍のブロックから導出された候補とを比較することを含む、請求項１６に記載の方法。

【請求項18】

テーブルにおける異なる動き候補のエントリを、異なる位置から導出された、以前に追加された異なる候補と比較する、請求項１６に記載の方法。

【請求項19】

テーブルから前記候補リストに動き候補を追加する際に、前記プルーニング工程を呼び出さないことをさらに含む、請求項１または２に記載の方法。

【請求項20】

前記変換を行うことは、前記映像ブロックから前記ビットストリーム表現を生成することを含む、請求項１～１９のいずれか１項に記載の方法。

【請求項21】

前記変換を行うことは、前記ビットストリーム表現から前記映像ブロックを生成することを含む、請求項１～１９のいずれか１項に記載の方法。

【請求項22】

動き候補は、予測方向、参照ピクチャインデックス、動きベクトル値、強度補償フラグ、アフィンフラグ、動きベクトル差精度または動きベクトル差分値のうち少なくとも１つを含む動き情報に関連付けられる、請求項１～２１のいずれか１項に記載の方法。

【請求項23】

前記動き候補は、イントラモードコーディングのためのイントラ予測モードの動き候補に対応する、請求項１～２２のいずれか１項に記載の方法。

【請求項24】

前記動き候補は、ＩＣパラメータコーディングのための照明補償パラメータを含む動き候補に対応する、請求項１～２２のいずれか１項に記載の方法。

【請求項25】

前記変換に基づいて、１つ以上のテーブルを更新することをさらに有する、請求項１～２４のいずれか１項に記載の方法。

【請求項26】

前記１つ以上のテーブルを更新することは、前記変換を行った後、前記第１の映像ブロックの前記動き情報に基づいて１つ以上のテーブルを更新することを有する、請求項２５に記載の方法。

【請求項27】

前記更新されたテーブルに基づいて、前記映像の後続の映像ブロックと前記映像のビットストリーム表現との間で変換を行うことをさらに有する、請求項２６に記載の方法。

【請求項28】

プロセッサと、命令を搭載した非一時的メモリとを備える装置であって、前記命令は、前記プロセッサにより実行された際に、前記プロセッサに、請求項１～２７のいずれか１つ以上に記載の前記方法を実行させる、装置。

【請求項29】

非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、請求項１～２７のいずれか１つ以上に記載の前記方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
パリ条約に基づく適用可能な特許法および／または規則に基づいて、本願は、２０１８年６月２９日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／０９３６６３号、２０１８年９月１２日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／１０５１９３号、２０１８年１１月２７日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／１１７６２７、および２０１９年１月１０日出願の国際特許出願ＰＣＴ／ＣＮ２０１９／０７１２１４号の優先権および利益を適時に主張することを目的とする。米国の法律の下、あらゆる目的のために、国際特許出願ＰＣＴ／ＣＮ２０１８／０９３６６３号、国際特許出願第ＰＣＴ／ＣＮ２０１８／１０５１９３号、国際特許出願ＰＣＴ／ＣＮ２０１８／１１７６２７号および国際特許出願第ＰＣＴ／ＣＮ２０１９／０７１２１４の開示の全文は、本願の開示の一部として参照により援用される。

【0002】

この特許明細書は、映像符号化および復号化技術、デバイスおよびシステムに関する。

【背景技術】

【0003】

映像圧縮の進歩にもかかわらず、デジタル映像は、依然として、インターネットおよび他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像の受信および表示が可能な接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが期待される。

【発明の概要】

【0004】

本明細書は、動きベクトルのマージリストを使用してデジタル映像を符号化および復号化するための方法、システム、およびデバイスを開示する。

【0005】

１つの例示的な態様において、映像処理方法は、テーブルのセットを維持することであって、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる、ことと、動き候補へのプルーニング工程を使用して１つ以上のテーブルで動き候補に基づいて候補リストを更新することと、構成した候補リストを用いて、第１の映像ブロックと、前記第１の映像ブロックを含む映像のビットストリーム表現との間の変換を行うことと、を有する。

【0006】

別の態様において、映像処理方法は、第１の映像ブロックを含む映像のビットストリーム表現を受信することと、候補リストを更新するために、１つまたは複数のテーブルにおける動き候補に対してプルーニング工程を適用することであって、各テーブルが動き候補を含み、各動き候補が対応する動き情報に関連付けられる、ことと、構成された候補リストを用いて、ビットストリーム表現と前記第１の映像ブロックとの間の変換を行うことと、を有するように提供される。

【0007】

さらに別の代表的な態様では、本明細書で説明される様々な技法は、非一時的なコンピュータ可読媒体に記憶されるコンピュータプログラム製品として実施され得る。このコンピュータプログラム製品は、本明細書に記載の方法を実行するためのプログラムコードを含む。

【0008】

さらに別の代表的な態様では、映像符号化または復号化装置は、本明細書で説明される方法を実装し得る。

【0009】

１つ以上の実装形態の詳細は、添付の添付ファイル、図面、および以下の説明に記載されている。他の特徴は、説明および図面、並びに特許請求の範囲の記載から明らかとなろう。

【図面の簡単な説明】

【0010】

【図1】映像エンコーダの実装形態の例を示すブロック図である。

【図2】Ｈ．２６４映像コーディング規格におけるマクロブロックの分割を示す。

【図3】コーディングブロック（ＣＢ：ＣｏｄｉｎｇＢｌｏｃｋ）を予測ブロック（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ）に分割する例を示す。

【図4】ＣＴＢをＣＢおよび変換ブロック（ＴＢ）に細分するための例示的な実装形態を示す。実線はＣＢ境界を示し、点線はＴＢ境界を示し、その分割を含むＣＴＢの例、および対応する４分木を含む。

【図5】映像データを分割するための４分木２分木（ＱＴＢＴ：ＱｕａｄＴｒｅｅＢｉｎａｒｙＴｒｅｅ）構造の一例を示す。

【図6】映像ブロックの分割の例を示す。

【図7】４分木の分割の例を示す。

【図8】ツリー型信号通知の例を示す。

【図9】マージ候補リスト構築のための導出処理の一例を示す。

【図10】空間的マージ候補の位置の例を示す。

【図11】空間的マージ候補の冗長性チェックに考慮される候補対の例を示す。

【図12】Ｎ×２Ｎおよび２Ｎ×Ｎパーティションの第２のＰＵの位置の例を示す。

【図13】時間的マージ候補のための動きベクトルのスケーリングを示す。

【図14】時間的マージ候補の候補位置とその同一位置のピクチャを示す。

【図15】結合双方向予測マージ候補の例を示す。

【図16】動きベクトル予測候補の導出処理の例を示す。

【図17】空間的動きベクトル候補のための動きベクトルのスケーリングの例を示す。

【図18】ＣＵの動き予測のための例示的なＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）を示す。

【図19】ソースブロックおよびソースピクチャの識別の一例を絵で示す。

【図20】４つのサブブロックおよび近傍のブロックを有する１つのＣＵの例を示す。

【図21】バイラテラルマッチングの例を示す。

【図22】テンプレートマッチングの例を示す。

【図23】ＦＲＵＣ（ＦｒａｍｅＲａｔｅＵｐＣｏｎｖｅｒｓｉｏｎ）における一方の動き推定（ＭＥ：ＭｏｔｉｏｎＥｓｔｉｍａｔｉｏｎ）の例を示す。

【図24】バイラテラルテンプレートマッチングに基づくＤＭＶＲの例を示す。

【図25】空間的マージ候補を導出するために使用する空間的に近傍のブロックの例を示す。

【図26】ルックアップテーブル更新のための代表的な位置の選択方法の一例を示す。

【図27A】新しい動き情報のセットでルックアップテーブルを更新する例を示す。

【図27B】新しい動き情報のセットでルックアップテーブルを更新する例を示す。

【図28】本明細書に記載されるビジュアルメディアの復号化またはビジュアルメディアの符号化技術を実装するためのハードウェアプラットフォームの一例を示すブロック図である。

【図29】映像処理方法の一例を示すフローチャートである。

【図30】別の例示の映像処理方法を示すフローチャートである。

【図31】提案されたＨＭＶＰ方法による復号化フローチャートの一例を示す。

【図32】提案されるＨＭＶＰ方法を用いたテーブルの更新の例を示す。

【図33A】冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。

【図33B】冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。

【図34A】冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する）の例を示す。

【図34B】冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する）の例を示す。

【発明を実施するための形態】

【0011】

映像の圧縮率を改善するために、研究者らは、映像を符号化する新しい技術を絶えず求めている。

【0012】

１．導入

【0013】

本明細書は、映像コーディング技術に関する。具体的には、映像コーディングにおける動き情報のコーディング（例えば、マージモード、ＡＭＶＰモード）に関する。ＨＥＶＣのような既存の映像コーディング規格に適用してもよいし、規格（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）を確定させるために適用してもよい。本発明は、将来の映像コーディング規格または映像コーデックにも適用可能である。

【0014】

簡単な説明

【0015】

映像コーディング規格は、主に周知のＩＴＵ－ＴおよびＩＳＯ／ＩＥＣ規格の開発によって発展してきた。ＩＴＵ－ＴはＨ．２６１とＨ．２６３を作り、ＩＳＯ／ＩＥＣはＭＰＥＧ－１とＭＰＥＧ－４Ｖｉｓｕａｌを、両団体はＨ．２６２／ＭＰＥＧ－２ＶｉｄｅｏとＨ．２６４／ＭＰＥＧ－４ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ）とＨ．２６５／ＨＥＶＣ規格を共同で作った。Ｈ．２６２以来、映像コーディング規格は、時間予測と変換コーディングが利用されるハイブリッド映像コーディング構造に基づく。典型的なＨＥＶＣエンコーダフレームワークの一例を図１に示す。

【0016】

２．１パーティション構造

【0017】

２．１．１Ｈ．２６４／ＡＶＣにおけるパーティションツリー構造

【0018】

以前の規格におけるコーディング層のコアは、１６×１６ブロックの輝度サンプルを含み、通常の４：２：０カラーサンプリングの場合、２つの対応する８×８ブロックの彩度サンプル含むマクロブロックであった。

【0019】

イントラ符号化されたブロックは、画素間の空間的相関を利用するために空間予測を使用する。２つのパーティションを規定する。１６×１６および４×４である。

【0020】

インター符号化されたブロックは、ピクチャ間の動きを推定することで、空間的予測の代わりに時間予測を用いる。動きは、１６×１６マクロブロックまたはそのサブマクロブロックパーティションのいずれかに対して独立して推定できる。１６×８、８×１６、８×８、８×４、４×８、４×４（図２参照）。１つのサブマクロブロックパーティション当たり１つの動きベクトル（ＭＶ：ＭｏｔｉｏｎＶｅｃｔｏｒ）のみが許可される。

【0021】

２．１．２ＨＥＶＣにおけるパーティションツリー構造

【0022】

ＨＥＶＣにおいて、ＣＴＵは、様々な局所的特徴に適応するように、コーディングツリーと呼ばれる４分木構造を用いてＣＵに分割される。インターピクチャ（時間的）予測またはイントラピクチャ（空間的）予測を使用する、ピクチャ領域をコーディングするかどうかの決定は、ＣＵレベルで行われる。各ＣＵは、ＰＵ分割タイプに応じて１つ、２つまたは４つのＰＵに更に分割することができる。１つのＰＵの内部では、同じ予測処理が適用され、ＰＵ単位で関連情報がデコーダに送信される。ＰＵ分割タイプに基づく予測処理を適用して残差ブロックを得た後、ＣＵのためのコーディングツリーに類似した別の４分木構造に基づいて、ＣＵを変換ユニット（ＴＵ）に分割することができる。ＨＥＶＣ構造の重要な特徴の１つは、ＣＵ、ＰＵ、ＴＵを含む複数のパーティション概念を有することである。

【0023】

以下、ＨＥＶＣを使用したハイブリッド映像コーディングに関連する様々な特徴に焦点を当てる。

【0024】

１）コーディングツリーユニットおよびコーディングツリーブロック（ＣＴＢ）構造。ＨＥＶＣにおける類似した構造は、コーディングツリーユニット（ＣＴＵ）であり、このコーディングツリーユニットは、エンコーダによって選択されたサイズを有し、従来のマクロブロックよりも大きくてもよい。ＣＴＵは、輝度ＣＴＢと、対応する彩度ＣＴＢおよび構文要素とからなる。輝度ＣＴＢのサイズＬ×Ｌは、Ｌ＝１６、３２、または６４のサンプルとして選択することができ、より大きいサイズは、一般的に、より優れた圧縮を有効にする。ＨＥＶＣは、次いで、ツリー構造および４分木様の信号通知を使用して、ＣＴＢをより小さなブロックに分割することをサポートする。

【0025】

２）コーディングユニット（ＣＵ）およびコーディングブロック（ＣＢ）：ＣＴＵの４分木の構文は、その輝度および彩度ＣＢのサイズおよび位置を指定する。４分木のルートはＣＴＵに関連付けられる。従って、輝度ＣＴＢのサイズは、輝度ＣＢに対してサポートされる最大のサイズである。ＣＴＵを輝度ＣＢおよび彩度ＣＢに分割することは、共に信号通知されることである。１つの輝度ＣＢおよび通常２つの彩度ＣＢは、関連する構文と共に、１つのコーディングユニット（ＣＵ）を形成する。ＣＴＢは、１つのＣＵのみを含んでもよく、または複数のＣＵを形成するように分割されてもよく、各ＣＵは、それに関連付けられた予測ユニット（ＰＵ）への分割と、１つの変換ユニット（ＴＵ）のツリーとを有する。

【0026】

３）予測ユニットおよび予測ブロック（ＰＢ）：インターピクチャまたはイントラピクチャ予測を使用してピクチャ領域をコーディングするかどうかの決定は、ＣＵレベルで行われる。ＰＵの分割構造は、そのルートがＣＵレベルにある。基本的な予測タイプの決定に基づいて、次に、輝度および彩度ＣＢのサイズをさらに分割し、輝度および彩度予測ブロック（ＰＢ）から予測することができる。ＨＥＶＣは、６４×６４から４×４までの可変ＰＢサイズのサンプルをサポートする。図３は、Ｍ×ＭのＣＵのための許可されたＰＢの例を示す。

【0027】

４）ＴＵおよび変換ブロック：予測残差は、ブロック変換を使用してコーディングされる。ＴＵツリー構造は、そのルートがＣＵレベルにある。この輝度ＣＢ残差は、輝度変換ブロック（ＴＢ）と同一であってもよいし、小さな輝度ＴＢにさらに分割されてもよい。彩度ＴＢについても同様である。正方形ＴＢサイズ４×４、８×８、１６×１６、および３２×３２に対して、離散コサイン変換（ＤＣＴ）の整数基底関数に類似した整数基底関数が規定される。輝度イントラピクチャ予測残差の４×４変換のために、離散サイン変換（ＤＳＴ）の形式から導出される整数変換が代替的に指定される。

【0028】

図４は、ＣＴＢをＣＢ［及び変換ブロック（ＴＢ）］に細分する例を示す。実線はＣＢ境界を示し、点線はＴＢ境界を示す。（ａ）ＣＴＢとその分割（ｂ）対応する４分木。

【0029】

２．１．２．１変換ブロックおよびユニットへのツリー構造の分割

【0030】

残差コーディングの場合、ＣＢは、変換ブロック（ＴＢ）に再帰的に分割することができる。この分割は、残差４分木によって信号通知される。図４に示すように、１つのブロックを再帰的に象限に分割することができるように、正方形のＣＢおよびＴＢの分割のみを指定する。サイズＭ×Ｍの所与の輝度ＣＢに対して、フラグは、それがサイズＭ／２×Ｍ／２の４つのブロックに分割されるかどうかを信号通知する。さらなる分割が可能である場合、ＳＰＳに示される残留４分木の最大深さによって信号通知されるように、各象限には、それが４つの象限に分割されているかどうかを示すフラグが割り当てられる。残差４分木の結果得られる葉ノードブロックは、変換コーディングによってさらに処理される変換ブロックである。エンコーダは、それが使用することになる最大輝度ＴＢサイズおよび最小輝度ＴＢサイズを示す。ＣＢサイズが最大ＴＢサイズよりも大きい場合、分割は非明示的に行われる。分割により、示された最小値よりも小さい輝度ＴＢサイズとなる場合、分割は、非明示的に行われない。輝度ＴＢサイズが４×４である場合を除き、彩度ＴＢサイズは、各次元において輝度ＴＢサイズの半分であり、この場合、４つの４×４輝度ＴＢによって覆われる領域には１つの４×４彩度ＴＢが使用される。イントラピクチャ予測ＣＵの場合、最近の近傍のＴＢ（ＣＢ内またはＣＢ外）の復号サンプルを、イントラピクチャ予測のための参照データとして用いる。

【0031】

従来の規格とは対照的に、ＨＥＶＣ設計により、インターピクチャ予測ＣＵのために１つのＴＢが複数のＰＢにまたがることが可能となり、４分木構造のＴＢの分割の潜在的なコーディング効率の利点が最大となる。

【0032】

２．１．２．２親子ノード

【0033】

ＣＴＢは、４分木構造に基づいて分割され、そのノードはコーディングユニットである。４分木構造における複数のノードは、葉ノードおよび非葉ノードを含む。葉ノードは、ツリー構造内に子ノードを持たない（すなわち、葉ノードはそれ以上分割されない）。非葉ノードは、ツリー構造のルートノードを含む。ルートノードは、映像データの最初の映像ブロック（例えば、ＣＴＢ）に対応する。複数のノードのうちのそれぞれの非ルートノードにおいて、それぞれの非ルートノードは、それぞれの非ルートノードのツリー構造における親ノードに対応する映像ブロックのサブブロックである映像ブロックに対応する。複数の非葉ノードのそれぞれの非葉ノードは、ツリー構造において１つ以上の子ノードを有する。

【0034】

２．１．３ＪＥＭにおけるより大きいＣＴＵを有する４分木＋２分木ブロック構造

【0035】

ＨＥＶＣを超えた将来の映像コーディング技術を探索するため、２０１５年には、ＶＣＥＧとＭＰＥＧが共同でＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）を設立した。それ以来、多くの新しい方法がＪＶＥＴによって採用され、ＪＥＭ（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅ）と呼ばれる参照ソフトウェアに組み込まれてきた。

【0036】

２．１．３．１ＱＴＢＴブロックの分割構造

【0037】

ＨＥＶＣとは異なり、ＱＴＢＴ構造は、複数のパーティションタイプの概念を削除する。すなわち、ＣＵ、ＰＵ、ＴＵのコンセプトの切り離しを取り除き、ＣＵパーティションの形状の柔軟性を向上させる。ＱＴＢＴブロック構造において、ＣＵは正方形または長方形のいずれかを有することができる。図５に示すように、まず、コーディングツリーユニット（ＣＴＵ）を４分木構造で分割する。４分木の葉ノードは、２分木構造によってさらに分割される。２分木の分割には、対称水平分割と対称垂直分割の２つの分割タイプがある。２分木の葉ノードは、コーディングユニット（ＣＵ）と呼ばれ、このセグメント化は、それ以上の分割を行うことなく、予測および変換処理に使用される。これは、ＱＴＢＴコーディングブロック構造において、ＣＵ、ＰＵおよびＴＵが同じブロックサイズを有することを意味する。ＪＥＭにおいて、ＣＵは、しばしば異なる色成分のコーディングブロック（ＣＢ）からなり、例えば、４：２：０彩度フォーマットのＰおよびＢスライスの場合、１つのＣＵは１つの輝度ＣＢおよび２つの彩度ＣＢを含み、また、ＣＵは、しばしば単一の成分のＣＢからなり、例えば、Ｉスライスの場合、１つのＣＵは、１つの輝度ＣＢのみ、または、２つの彩度ＣＢのみを含む。

【0038】

ＱＴＢＴ分割スキームに対して以下のパラメータを規定する。
－ＣＴＵのサイズ：１つの４分木のルートノードのサイズ、ＨＥＶＣと同じ概念
－ＭｉｎＱＴＳｉｚｅ：最小許容の４分木の葉ノードサイズ
－ＭａｘＢＴＳｉｚｅ：最大許容の２分木のルートノードサイズ
－ＭａｘＢＴＤｅｐｔｈ：最大許容の２分木の深さ
－ＭｉｎＢＴＳｉｚｅ：最小許容の２分木の葉ノードのサイズ

【0039】

ＱＴＢＴの分割構造の一例において、ＣＴＵのサイズを、２つの対応する６４×６４ブロックの彩度サンプルを有する１２８×１２８の輝度サンプルとして設定し、ＭｉｎＱＴＳｉｚｅを１６×１６として設定し、ＭａｘＢＴＳｉｚｅを６４×６４として設定し、ＭｉｎＢＴＳｉｚｅ（幅および高さの両方について）を４×４として設定し、ＭａｘＢＴＤｅｐｔｈを４として設定する。４分木の分割は、まずＣＴＵに適用され、４分木の葉ノードを生成する。４分木の葉ノードは、１６×１６（即ち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（即ち、ＣＴＵサイズ）までのサイズを有することが可能である。葉４分木のノードが１２８×１２８である場合、サイズがＭａｘＢＴＳｉｚｅ（すなわち、６４×６４）を超えるため、２分木によってさらに分割されない。そうでない場合、葉４分木のノードは、２分木によってさらに分割されてもよい。従って、この４分木の葉ノードは、２分木のルートノードでもあり、その２分木の深さは０である。２分木の深さがＭａｘＢＴＤｅｐｔｈ（すなわち、４）に達した場合、それ以上の分割は考慮されない。２分木のノードの幅がＭｉｎＢＴＳｉｚｅ（すなわち、４である）に等しい場合、それ以上の水平分割は考慮されない。同様に、２分木のノードの高さがＭｉｎＢＴＳｉｚｅに等しい場合、それ以上の垂直分割は考慮されない。２分木の葉ノードは、さらに分割することなく、予測および変換処理によってさらに処理される。ＪＥＭにおいて、最大ＣＴＵサイズは、２５６×２５６個の輝度サンプルである。

【0040】

図５（左）はＱＴＢＴを用いたブロックの分割の例を示し、図５（右）は対応するツリー表現を示す。実線は４分木の分割を表し、点線は２分木の分割を表す。２分木の各分割（即ち、非葉）ノードにおいて、１つのフラグが、どの分割タイプ（即ち、水平または垂直）が使用されるかを示すために信号通知される。ここで、０は、水平分割を表し、１は、垂直分割を表す。４分木の分割の場合、４分木の分割は常にブロックを水平および垂直に分割し、等分したサイズの４つのサブブロックを生成するため、分割タイプを示す必要はない。

【0041】

さらに、ＱＴＢＴ方式は、輝度および彩度が別個のＱＴＢＴ構造を有する能力をサポートする。現在、ＰおよびＢスライスの場合、１つのＣＴＵにおける輝度および彩度ＣＴＢは、同じＱＴＢＴ構造を共有する。しかしながら、Ｉスライスの場合、輝度ＣＴＢはＱＴＢＴ構造によってＣＵに分割され、彩度ＣＴＢは別のＱＴＢＴ構造によって彩度ＣＵに分割される。これは、１つのＩスライスにおける１つのＣＵが１つの輝度成分の１つのコーディングブロックまたは２つの彩度成分の１つのコーディングブロックからなり、１つのＰまたはＢスライスにおける１つのＣＵが３つの色成分すべてのコーディングブロックからなることを意味する。

【0042】

ＨＥＶＣにおいて、小さなブロックのためのインター予測は、動き補償のメモリアクセスを低減するために制限され、その結果、４×８および８×４ブロックのために双方向予測はサポートされず、４×４ブロックのためにインター予測はサポートされない。ＪＥＭのＱＴＢＴにおいて、これらの制限は取り除かれる。

【0043】

２．１．４ＶＶＣの３分木

【0044】

いくつかの実装形態において、４分木および２分木以外のツリータイプがサポートされる。本実装形態において、図６の（ｄ）、（ｅ）部分に示すように、３分木（ＴＴ）分割を２つ以上、すなわち、水平および垂直の中心側の３分木を導入する。

【0045】

図６は、（ａ）４分木分割、（ｂ）垂直２分木分割、（ｃ）水平２分木分割、（ｄ）垂直中心側３分木分割、（ｅ）水平中心側３分木分割を示す。

【0046】

いくつかの実装形態において、２つのレベルのツリー、すなわち、領域ツリー（４分木）および予測ツリー（２分木または３分木）がある。ＣＴＵは、まず、領域ツリー（ＲＴ）によって分割される。ＲＴリーフは、予測ツリー（ＰＴ）によってさらに分割されてもよい。ＰＴ葉はまた、最大ＰＴ深さに達するまで、ＰＴでさらに分割されてもよい。ＰＴ葉が基本コーディングユニットである。便宜上、ここでもＣＵと呼ぶ。１つのＣＵをさらに分割することはできない。予測および変換は両方ともＪＥＭと同様にＣＵに適用される。パーティション構造全体を「マルチタイプツリー」と呼ぶ。

【0047】

２．１．５［８］の分割構造

【0048】

この応答で使用されるツリー構造は、マルチツリータイプ（Ｍｕｌｔｉ－ＴｒｅｅＴｙｐｅ：ＭＴＴ）と呼ばれ、ＱＴＢＴを一般化したものである。ＱＴＢＴにおいて、図５に示すように、まず、コーディングツリーユニット（ＣＴＵ）を４分木構造で分割する。４分木の葉ノードは、２分木構造によってさらに分割される。

【0049】

ＭＴＴの基本構造は、２つのタイプのツリーノードを構成する。図７に示すように、領域ツリー（ＲＴ）および予測ツリー（ＰＴ）は、９つのタイプのパーティションをサポートする。

【0050】

図７は、（ａ）４分木分割、（ｂ）垂直２分木分割、（ｃ）水平２分木分割、（ｄ）垂直３分木分割、（ｅ）水平３分木分割、（ｆ）水平上方非対称２分木分割、（ｇ）水平下方非対称２分木分割、（ｈ）垂直左非対称２分木分割、（ｉ）垂直右非対称２分木分割を示す。

【0051】

１つの領域ツリーは、１つのＣＴＵを４×４サイズの領域ツリーの葉ノードになるように正方形のブロックに再帰的に分割することができる。領域ツリーにおける各ノードにおいて、予測ツリーは、２分木（ＢＴ）、３分木（ＴＴ）、および非対称２分木（ＡＢＴ）の３つのツリータイプのうちの１つから形成されることができる。ＰＴ分割において、予測ツリーの枝に４分木のパーティションを有することは禁止される。ＪＥＭにおけるように、輝度ツリーおよび彩度ツリーは、Ｉ個のスライスに分けられる。ＲＴおよびＰＴの信号通知方法を図８に示す。

【0052】

２．２ＨＥＶＣ／Ｈ．２６５におけるインター予測

【0053】

各インター予測されたＰＵは、１つまたは２つの参照ピクチャリストのための動きパラメータを有する。動きパラメータは、動きベクトルおよび参照ピクチャインデックスを含む。２つの参照ピクチャリストのうちの１つの参照ピクチャリストの使用は、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃを使用して信号通知されてもよい。動きベクトルは、予測因子に関連する差分として明確にコーディングされてもよく、このようなコーディングモードは、ＡＭＶＰモードと呼ばれる。

【0054】

１つのＣＵがスキップモードでコーディングされる場合、１つのＰＵがこのＣＵに関連付けられ、有意な残差係数がなく、コーディングされた動きベクトル差分も参照ピクチャインデックスもない。マージモードを指定し、これにより、現在のＰＵのための動きパラメータを、空間的および時間的候補を含む近傍のＰＵから取得する。マージモードは、スキップモードのためだけでなく、任意のインター予測されたＰＵに適用することができる。マージモードの代替としては、動きパラメータの明確な送信であり、各参照ピクチャリストおよび参照ピクチャリストの使用に対する参照ピクチャインデックスに対応する動きベクトルをＰＵごとに明確に信号通知することである。

【0055】

２つの参照ピクチャリストのうちの１つを使用することを信号通知が示す場合、サンプルのうちの１つのブロックからＰＵを生成する。これを「単一予測」と呼ぶ。ＰスライスおよびＢスライスの両方に対して単一予測が利用可能である。

【0056】

両方の参照ピクチャリストを使用することを信号通知が示す場合、サンプルのうちの２つのブロックからＰＵを生成する。これを「双方向予測」と呼ぶ。Ｂスライスのみに双方向予測が利用可能である。

【0057】

以下、ＨＥＶＣに規定されるインター予測モードについて詳細に説明する。まず、マージモードについて説明する。

【0058】

２．２．１マージモード

【0059】

２．２．１．１マージモードの候補の導出

【0060】

マージモードを使用してＰＵを予測する場合、ビットストリームからマージ候補リストにおけるエントリを指すインデックスを構文解析し、これを使用して動き情報を検索する。このリストの構成は、ＨＥＶＣ規格で規定されており、以下のステップのシーケンスに基づいてまとめることができる。
・ステップ１：初期候補の導出
ｏステップ１．１：空間的候補の導出
ｏステップ１．２：空間的候補の冗長性チェック
ｏステップ１．３：時間的候補の導出
・ステップ２：追加候補の挿入
ｏステップ２．１：双方向予測候補の作成
ｏステップ２．２：動きゼロ候補の挿入

【0061】

これらのステップは図９にも概略的に示されている。空間的マージ候補導出のために、５つの異なる位置にある候補の中から最大４つのマージ候補を選択する。時間的マージ候補導出のために、２つの候補の中から最大１つのマージ候補を選択する。デコーダ側ではＰＵごとに一定数の候補を想定しているので、候補数がスライスヘッダで信号通知されるマージ候補の最大数（ＭａｘＮｕｍＭｅｒｇｅＣａｎｄ）に達しない場合、追加候補を生成する。候補の数は一定であるので、最良マージ候補のインデックスは、短縮された単項２値化（ＴＵ：ｔｒｕｎｃａｔｅｄｕｎａｒｙｂｉｎａｒｉｚａｔｉｏｎ）を使用して符号化される。ＣＵのサイズが８に等しい場合、現在のＣＵのすべてのＰＵは、２Ｎ×２Ｎ予測ユニットのマージ候補リストと同じ１つのマージ候補リストを共有する。

【0062】

以下、上述したステップに関連付けられた動作を詳しく説明する。

【0063】

２．２．１．２空間的候補の導出

【0064】

空間的マージ候補の導出において、図１０に示す位置にある候補の中から、最大４つのマージ候補を選択する。導出の順序はＡ_１、Ｂ_１、Ｂ_０、Ａ_０、Ｂ_２である。位置Ａ_１、Ｂ_１、Ｂ_０、Ａ_０のいずれかのＰＵが利用可能でない場合（例えば、別のスライスまたはタイルに属しているため）、またはイントラ符号化された場合にのみ、位置Ｂ_２が考慮される。位置Ａ_１の候補を加えた後、残りの候補を加えると、冗長性チェックを受け、それにより、同じ動き情報を有する候補を確実にリストから排除でき、コーディング効率を向上させることができる。計算の複雑性を低減するために、前述の冗長性チェックにおいて、考えられる候補対のすべてを考慮することはしない。代わりに、図１１において矢印でリンクされた対のみを考慮し、冗長性チェックに使用される対応する候補が同じ動き情報を有していない場合にのみ、その候補をリストに加える。重複した動き情報の別のソースは、２Ｎ×２Ｎとは異なるパーティションに関連付けられた「第２のＰＵ」である。一例として、図１２は、それぞれＮ×２Ｎおよび２Ｎ×Ｎの場合の第２のＰＵを示す。現在のＰＵをＮ×２Ｎに分割する場合、リスト構成に位置Ａ_１の候補は考慮されない。実際、この候補を加えることにより、同じ動き情報を有する２つの予測ユニットが導かれることとなり、１つのコーディングユニットに１つのＰＵのみを有するためには冗長である。同様に、現在のＰＵを２Ｎ×Ｎに分割する場合、位置Ｂ_１は考慮されない。

【0065】

２．２．１．３時間的候補の導出

【0066】

このステップにおいて、１つの候補のみがリストに追加される。具体的には、この時間的マージ候補の導出において、所与の参照ピクチャリストにおける現在のピクチャとの間に最小のＰＯＣ差を有するピクチャに属する同一位置のＰＵ（ｃｏ－ｌｏｃａｔｅｄＰＵ）に基づいて、スケーリングされた動きベクトルを導出する。スライスヘッダにおいて、同一位置のＰＵの導出に用いられる参照ピクチャリストが明確に信号通知される。図１３に点線で示すように、時間的マージ候補のスケーリングされた動きベクトルが得られる。これは、ＰＯＣ距離ｔｂおよびｔｄを利用して、同一位置のＰＵの動きベクトルからスケーリングしたものである。ｔｂは、現在のピクチャの参照ピクチャと現在のピクチャのＰＯＣ差として規定され、ｔｄは、同一位置のＰＵの参照ピクチャと同一位置のピクチャのＰＯＣ差として規定する。時間的マージ候補の参照ピクチャインデックスをゼロに等しく設定する。このスケーリング処理の実際的な実現については、ＨＥＶＣ仕様［１］に記載されている。Ｂスライスの場合、２つの動きベクトル、即ち、１つは参照ピクチャリスト０のためのもの、もう１つは参照ピクチャリスト１のためのものを取得し、これらを組み合わせることによって、双方向予測マージ候補を形成する。時間的マージ候補のための動きベクトルのスケーリングの説明。

【0067】

参照フレームに属する同一位置のＰＵ（Ｙ）において、図１４に示すように、候補Ｃ０と候補Ｃ１との間で時間的候補の位置を選択する。位置Ｃ０のＰＵが利用可能でない場合、イントラ符号化されている場合、または現在のＣＴＵの外側にある場合、位置Ｃ１が使用される。そうでない場合、位置Ｃ０が時間的マージ候補の導出に使用される。

【0068】

２．２．１．４追加候補の挿入

【0069】

空間的－時間的マージ候補の他に、２つの追加のタイプのマージ候補、すなわち、結合双方向予測マージ候補およびゼロマージ候補がある。空間的－時間的マージ候補を利用して、結合双方向予測マージ候補を生成する。結合双方向予測マージ候補は、Ｂスライスのみに使用される。最初の候補の第１の参照ピクチャリスト動きパラメータと別の候補の第２の参照ピクチャリスト動きパラメータとを組み合わせることで、結合双方向予測候補を生成する。これら２つのタプルが異なる動きの仮説を提供する場合、これらのタプルは、新しい双方向予測候補を形成する。一例として、図１５は、オリジナルリスト（左側）における、ｍｖＬ０およびｒｅｆＩｄｘＬ０、またはｍｖＬ１およびｒｅｆＩｄｘＬ１を有する２つの候補を用いて、最終リスト（右側）に加えられる結合双方向予測マージ候補を生成する場合を示す。これらの追加のマージ候補を生成するために考慮される組み合わせについては、様々な規則が存在する。

【0070】

ゼロ動き候補を挿入し、マージ候補リストにおける残りのエントリを埋めることにより、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄ容量にヒットする。これらの候補は、空間的変位がゼロであり、新しいゼロ動き候補をリストに加える度にゼロから始まり増加する参照ピクチャインデックスを有する。これらの候補が使用する参照フレームの数は、それぞれ、一方向予測の場合は１つ、双方向予測の場合は２つである。最終的には、これらの候補に対して冗長性チェックは行われない。

【0071】

２．２．１．５並列処理のための動き推定領域

【0072】

符号化処理を高速化するために、動き推定を並列に行うことができ、それによって、所与の領域内のすべての予測ユニットの動きベクトルを同時に導出する。１つの予測ユニットは、その関連する動き推定が完了するまで、隣接するＰＵから動きパラメータを導出することができないので、空間的近傍からのマージ候補の導出は、並列処理に干渉する可能性がある。コーディング効率と処理待ち時間との間のトレードオフを緩和するために、ＨＥＶＣは、動き推定領域（ＭＥＲ：ＭｏｔｉｏｎＥｓｔｉｍａｔｉｏｎＲｅｇｉｏｎ）を規定し、そのサイズは、「ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２」構文要素を使用してピクチャパラメータセットにおいて信号通知される。１つのＭＥＲを規定するとき、同じ領域にあるマージ候補は使用不可としてマークされ、それゆえにリスト構築においては考慮されない。
７．３．２．３ピクチャパラメータセットＲＢＳＰ構文
７．３．２．３．１一般ピクチャパラメータセットＲＢＳＰ構文

【0073】

【表1】

【0074】

ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２＋２は、８．５．３．２．２．２節で指定されたマージモードの輝度動きベクトルの導出処理と、８．５．３．２．３節で指定された空間的マージ候補の導出処理で使用される変数Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌの値を指定する。ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２の値は、０～ＣｔｂＬｏｇ２ＳｉｚｅＹ－２を含む範囲内とする。
変数Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌは、以下のように導出される。
Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌ＝ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２＋２（７－３７）
注３：Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌの値は、マージ候補リストを並列に導出する組み込み能力を示す。例えば、Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌが６に等しい場合、６４×６４ブロックに含まれたすべての予測ユニット（ＰＵ）およびコーディングユニット（ＣＵ）のためのマージ候補リストを並列に導出することができる。

【0075】

２．２．２ＡＭＶＰモードにおける動きベクトル予測

【0076】

動きベクトル予測は、動きベクトルと近傍のＰＵとの間の空間的－時間的相関を利用し、これを動きパラメータの明確な伝送に用いる。まず、左側、上側の時間的に近傍のＰＵ位置の可用性をチェックし、冗長な候補を取り除き、ゼロベクトルを加えることで、候補リストの長さを一定にすることで、動きベクトル候補リストを構築する。次いで、エンコーダは、候補リストから最良の予測子を選択し、選択された候補を示す対応するインデックスを送信することができる。マージインデックスの信号通知と同様に、最良の動きベクトル候補のインデックスは、短縮された単項を使用して符号化される。この場合のエンコーディング対象の最大値は２である（例えば、図２～図８）。以下の章では、動きベクトル予測候補の導出処理の詳細を説明する。

【0077】

２．２．２．１動きベクトル予測候補の導出

【0078】

図１６に、動きベクトル予測候補の導出処理をまとめる。

【0079】

動きベクトル予測において、空間的動きベクトル候補と時間的動きベクトル候補という２つのタイプの動きベクトル候補が考慮される。空間的動きベクトル候補の導出のために、図１１に示したように、５つの異なる位置にある各ＰＵの動きベクトルに基づいて、最終的には２つの動きベクトル候補を導出する。

【0080】

時間的動きベクトル候補の導出のために、２つの異なる同一位置の配置に基づいて導出された２つの候補から１つの動きベクトル候補を選択する。空間的－時間的候補の最初のリストを作成した後、リストにおける重複した動きベクトル候補を除去する。可能性のある候補の数が２よりも多い場合、関連づけられた参照ピクチャリストにおける参照ピクチャインデックスが１よりも大きい動きベクトル候補をリストから削除する。空間的－時間的動きベクトル候補の数が２未満である場合は、追加のゼロ動きベクトル候補をリストに加える。

【0081】

２．２．２．２空間的動きベクトル候補

【0082】

空間的動きベクトル候補の導出において、図１１に示したような位置にあるＰＵから導出された５つの可能性のある候補のうち、動きマージと同じ位置にあるものを最大２つの候補を考慮する。現在のＰＵの左側のための導出の順序は、Ａ_０、Ａ_１、スケーリングされたＡ_０、スケーリングされたＡ_１として規定される。現在のＰＵの上側のための導出の順序は、Ｂ_０、Ｂ_１、Ｂ_２、スケーリングされたＢ_０、スケーリングされたＢ_１、スケーリングされたＢ_２として規定される。そのため、辺ごとに、動きベクトル候補として使用できる場合が４つ、すなわち空間的スケーリングを使用する必要がない２つの場合と、空間的スケーリングを使用する２つの場合とがある。４つの異なる場合をまとめると、以下のようになる。
・空間的スケーリングなし
－（１）同じ参照ピクチャリスト、かつ、同じ参照ピクチャインデックス（同じＰＯＣ）
－（２）異なる参照ピクチャリスト、かつ、同じ参照ピクチャ（同じＰＯＣ）
・空間的スケーリング
－（３）同じ参照ピクチャリスト、かつ、異なる参照ピクチャ（異なるＰＯＣ）
－（４）異なる参照ピクチャリスト、かつ、異なる参照ピクチャ（異なるＰＯＣ）

【0083】

最初に非空間的スケーリングの場合をチェックし、次に空間的スケーリングを行う。参照ピクチャリストにかかわらず、ＰＯＣが近傍のＰＵの参照ピクチャと現在のＰＵの参照ピクチャとで異なる場合、空間的スケーリングを考慮する。左側候補のすべてのＰＵが利用可能でないか、またはイントラ符号化されている場合、上側の動きベクトルのスケーリングは、左側および上側のＭＶ候補の並列導出に役立つ。そうでない場合、上側の動きベクトルに対して空間的スケーリングは許可されない。

【0084】

空間的スケーリング処理において、図１７に示すように、時間的スケーリングと同様にして、近傍のＰＵの動きベクトルをスケーリングする。主な違いは、現在のＰＵの参照ピクチャリストおよびインデックスを入力として与え、実際のスケーリング処理は時間的スケーリングと同じであることである。

【0085】

２．２．２．３時間的動きベクトル候補

【0086】

参照ピクチャインデックスを導出する以外は、時間的マージ候補を導出するための処理は、すべて、空間的動きベクトル候補を導出するための処理と同じである（図６参照）。参照ピクチャインデックスはデコーダに信号通知される。

【0087】

２．２．２．４ＡＭＶＰ情報の信号通知

【0088】

ＡＭＶＰモードの場合、ビットストリームにおいて、４つの部分、すなわち、予測方向、参照インデックス、ＭＶＤ、およびｍｖ予測因子候補インデックスが信号通知される。
構文テーブル：

【0089】

【表2】

【0090】

７．３．８．９動きベクトル差構文

【0091】

【表3】

【0092】

２．３ＪＥＭ（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ）における新しいインター予測方法

【0093】

２．３．１サブＣＵに基づく動きベクトル予測

【0094】

ＱＴＢＴを有するＪＥＭにおいて、各ＣＵは、各予測方向に対して最大１つの動きパラメータのセットを有することができる。エンコーダにおいて、大きなＣＵをサブＣＵに分割し、大きなＣＵのすべてのサブＣＵの動き情報を導出することにより、２つのサブＣＵレベルの動きベクトル予測方法を考慮する。ＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）方法により、各ＣＵが、配列された参照ピクチャにおける現在のＣＵよりも小さい複数のブロックから複数の動き情報のセットをフェッチすることが可能となる。ＳＴＭＶＰ（Ｓｐａｔｉａｌ－ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法において、時間的動きベクトル予測因子および空間的近傍動きベクトルを使用して、サブＣＵの動きベクトルを再帰的に導出する。

【0095】

サブＣＵ動き予測のためにより正確な動きフィールドを維持するために、参照フレームの動き圧縮は現在無効にされている。

【0096】

２．３．１．１代替の時間的動きベクトル予測

【0097】

ＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）において、ＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法は、現在のＣＵより小さいブロックから複数セットの動き情報（動きベクトルおよび参照インデックスを含む）をフェッチすることで修正される。図１８に示すように、サブＣＵは、正方形のＮ×Ｎブロックである（デフォルトでは、Ｎは４に設定される）。

【0098】

ＡＴＭＶＰは、ＣＵ内のサブＣＵの動きベクトルを２つのステップで予測する。第１のステップは、参照ピクチャにおける対応するブロックを、いわゆる時間的ベクトルで特定することである。この参照ピクチャを動きソースピクチャと呼ぶ。第２のステップは、図１８に示すように、現在のＣＵをサブＣＵに分割し、各サブＣＵに対応するブロックから各サブＣＵの動きベクトルならびに参照インデックスを取得する。

【0099】

第１のステップにおいて、現在のＣＵの空間的に近傍のブロックの動き情報によって、参照ピクチャおよび対応するブロックを決定する。近傍のブロックの繰り返し走査処理を回避するために、現在のＣＵのマージ候補リストにおける最初のマージ候補を用いる。第１の利用可能な動きベクトルおよびその関連する参照インデックスを、時間的ベクトルおよび動きソースピクチャのインデックスに設定する。このように、ＡＴＭＶＰでは、ＴＭＶＰに比べて、対応するブロックをより正確に特定することができ、対応するブロック（配列されたブロックと呼ばれることがある）は、常に現在のＣＵに対して右下または中心位置にある。１つの例において、最初のマージ候補が左側の近傍のブロック（即ち、図１９のＡ_１）からのものである場合、関連するＭＶおよび参照ピクチャを利用して、ソースブロックおよびソースピクチャを特定する。

【0100】

図１９は、ソースブロックおよびソースピクチャの特定の例を示す。

【0101】

第２のステップにおいて、現在のＣＵの座標に時間ベクトルを加えることで、動きソースピクチャにおける時間的ベクトルによって、サブＣＵの対応するブロックを特定する。サブＣＵごとに、その対応するブロックの動き情報（中心サンプルを覆う最小の動きグリッド）を使用して、サブＣＵの動き情報を導出する。対応するＮ×Ｎブロックの動き情報を特定した後、ＨＥＶＣのＴＭＶＰと同様に、現在のサブＣＵの動きベクトルおよび参照インデックスに変換され、動きスケーリングや他の手順が適用される。例えば、デコーダは、低遅延条件（すなわち、現在のピクチャのすべての参照ピクチャのＰＯＣが現在のピクチャのＰＯＣよりも小さい）が満たされているかどうかをチェックし、場合によっては、動きベクトルＭＶｘ（参照ピクチャリストＸに対応する動きベクトル）を使用して、各サブＣＵの動きベクトルＭＶｙ（Ｘが０または１に等しく、Ｙが１－Ｘに等しい）を予測する。

【0102】

２．３．１．２空間的－時間的動きベクトル予測

【0103】

この方法において、サブＣＵの動きベクトルは、ラスタスキャンの順に沿って再帰的に導出される。図２０にこの概念を示す。４つの４×４サブＣＵである、Ａ、Ｂ、Ｃ、およびＤを含む８×８ＣＵを考える。現在のフレームの近傍の４×４ブロックには、ａ、ｂ、ｃ、ｄというラベルが付けられている。

【0104】

サブＣＵＡの動き導出は、その２つの空間的近傍を特定することで始まる。第１の近傍は、サブＣＵＡの上のＮ×Ｎブロックである（ブロックｃ）。このブロックｃが利用可能でないか、またはイントラ符号化されている場合、サブＣＵＡより上の他のＮ×Ｎ個のブロックをチェックする（ブロックｃから始まり、左から右へ）。第２の近傍は、サブＣＵＡの左側のブロックである（ブロックｂ）。ブロックｂが利用可能でないか、またはイントラ符号化されている場合、サブＣＵＡの左側の他のブロックをチェックする（ブロックｂから始まり、上から下へ）。各リストの近傍のブロックから得られた動き情報を、所与のリストの第１の参照フレームにスケーリングする。次に、ＨＥＶＣに規定されているＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｏｒ）導出と同様の手順に従って、サブブロックＡのＴＭＶＰを導出する。位置Ｄにおける配列されたブロックの動き情報をフェッチし、それに応じてスケーリングする。最後に、動き情報を検索し、スケーリングした後、参照リストごとにすべての利用可能な動きベクトル（３まで）を別々に平均する。この平均化された動きベクトルを現在のサブＣＵの動きベクトルとする。

【0105】

図２０は、４つのサブブロック（Ａ－Ｄ）およびその近傍のブロックを有する１つのＣＵの例を示す。

【0106】

２．３．１．３サブＣＵ動き予測モード信号通知

【0107】

サブＣＵモードは追加のマージ候補として有効とされ、モードを信号通知するために追加の構文要素は必要とされない。ＡＴＭＶＰモードおよびＳＴＭＶＰモードを表すように、各ＣＵのマージ候補リストに２つの追加のマージ候補を加える。シーケンスパラメータセットがＡＴＭＶＰおよびＳＴＭＶＰが有効であることを示す場合、７個までのマージ候補を使用する。追加のマージ候補の符号化ロジックは、ＨＭにおけるマージ候補の場合と同じであり、つまり、ＰまたはＢスライスにおける各ＣＵについて、２つの追加のマージ候補に対して２回以上のＲＤチェックが必要となる。

【0108】

ＪＥＭにおいて、マージインデックスのすべてのビンは、ＣＡＢＡＣによってコーディングされたコンテキストである。一方、ＨＥＶＣにおいては、最初のビンのみがコーディングされたコンテキストであり、残りのビンはバイパスコーディングされたコンテキストである。

【0109】

２．３．２適応型動きベクトル差分解像度

【0110】

ＨＥＶＣにおいて、ｕｓｅ＿ｉｎｔｅｇｅｒ＿ｍｖ＿ｆｌａｇがスライスヘッダにおいて０であるとき、１／４輝度サンプルの単位で動きベクトルの差分（ＭＶＤ：ＭｏｔｉｏｎＶｅｃｔｏｒＤｉｆｆｅｒｅｎｃｅ）（動きベクトルとＰＵの予測動きベクトルとの差）が信号通知される。ＪＥＭにおいて、ＬＡＭＶＲ（ＬｏｃａｌｌｙＡｄａｐｔｉｖｅＭｏｔｉｏｎＶｅｃｔｏｒＲｅｓｏｌｕｔｉｏｎ）が導入される。ＪＥＭにおいて、ＭＶＤは、１／４輝度サンプル、整数輝度サンプルまたは４つの輝度サンプルの単位でコーディングできる。ＭＶＤ解像度はコーディングユニット（ＣＵ）レベルで制御され、ＭＶＤ解像度フラグは、少なくとも１つの非ゼロＭＶＤの構成要素を有する各ＣＵに対して条件付きで信号通知される。

【0111】

少なくとも１つの非ゼロＭＶＤの構成要素を有するＣＵの場合、１／４輝度サンプルＭＶ精度がＣＵにおいて使用されるか否かを示すために、第１のフラグが信号通知される。第１のフラグ（１に等しい）が、１／４輝度サンプルＭＶ精度が使用されていないことを示す場合、整数輝度サンプルＭＶ精度が使用されるかまたは４輝度サンプルＭＶ精度が使用されるかを示すために、別のフラグが信号通知される。

【0112】

ＣＵの第１のＭＶＤ解像度フラグがゼロであるか、またはＣＵに対してコーディングされていない（つまり、ＣＵにおけるすべてのＭＶＤがゼロである）場合、ＣＵに対して１／４輝度サンプルＭＶ解像度が使用される。ＣＵが整数輝度サンプルＭＶ精度または４輝度サンプルＭＶ精度を使用する場合、ＣＵのＡＭＶＰ候補リストにおけるＭＶＰを対応する精度に丸める。

【0113】

エンコーダにおいて、ＣＵレベルのＲＤチェックは、どのＭＶＤ解像度をＣＵに用いるかを決定するために用いられる。すなわち、１つのＭＶＤ解像度ごとに３回、ＣＵレベルのＲＤチェックを行う。エンコーダの速度を速めるために、ＪＥＭにおいては、以下の符号化方式が適用される。

【0114】

通常の１／４輝度サンプルＭＶＤ解像度を有するＣＵのＲＤチェック中、現在のＣＵの動き情報（整数輝度サンプル精度）が記憶される。整数輝度サンプルおよび４輝度サンプルのＭＶＤ解像度を有する同じＣＵのＲＤチェック中に、記憶された動き情報（丸められた後）は、更なる小範囲の動きベクトル改良の開始点として使用されるので、時間がかかる動き推定処理が３回重複しない。

【0115】

４輝度サンプルＭＶＤ解像度を有するＣＵのＲＤチェックを条件付きで呼び出す。ＣＵの場合、整数輝度サンプルＭＶＤ解像度のＲＤコストが１／４輝度サンプルＭＶＤ解像度のそれよりもはるかに大きい場合、ＣＵのための４輝度サンプルＭＶＤ解像度のＲＤチェックは省略される。

【0116】

２．３．３パターンマッチング動きベクトル導出

【0117】

ＰＭＭＶＤ（ＰａｔｔｅｒｎＭａｔｃｈｅｄＭｏｔｉｏｎＶｅｃｔｏｒＤｅｒｉｖａｔｉｏｎ）モードは、ＦＲＵＣ（Ｆｒａｍｅ－ＲａｔｅＵｐＣｏｎｖｅｒｓｉｏｎ）技術に基づく特殊マージモードである。このモードでは、ブロックの動き情報は信号通知されず、デコーダ側で導出される。

【0118】

そのマージフラグが真である場合、ＦＲＵＣフラグは、ＣＵに信号通知される。ＦＲＵＣフラグが偽である場合、マージインデックスは信号通知され、通常のマージモードが使用される。ＦＲＵＣフラグが真である場合、追加のＦＲＵＣモードフラグを信号通知して、どの方法（バイラテラルマッチングまたはテンプレートマッチング）を使用してブロックの動き情報を導出するかを示す。

【0119】

エンコーダ側では、ＣＵのためにＦＲＵＣマージモードを使用するかどうかの決定は、通常のマージ候補に対して行われるのと同じように、ＲＤコスト選択に基づく。つまり、ＲＤコスト選択を使用して、１つのＣＵに対して２つのマッチングモード（バイラテラルマッチングおよびテンプレートマッチング）を両方チェックする。最小コストに導くものが、更に、他のＣＵモードと比較される。ＦＲＵＣマッチングモードが最も効率的なものである場合、ＣＵに対してＦＲＵＣフラグを真に設定し、関連するマッチングモードを使用する。

【0120】

ＦＲＵＣマージモードにおける動き導出処理は、２つのステップを有する。まず、ＣＵレベルの動き探索を実行し、次に、サブＣＵレベルの動き改良を実行する。ＣＵレベルでは、バイラテラルマッチングまたはテンプレートマッチングに基づいて、ＣＵ全体のための初期の動きベクトルを導出する。まず、ＭＶ候補のリストを生成し、最小マッチングコストに導く候補を、さらなるＣＵレベル改善の開始点として選択する。そして、開始点付近のバイラテラルマッチングまたはテンプレートマッチングに基づく局所検索を行い、最小マッチングコストとなるＭＶ結果をＣＵ全体のＭＶとする。続いて、導出されたＣＵ動きベクトルを開始点として、サブＣＵレベルでの動き情報をさらに改良する。

【0121】

例えば、Ｗ×ＨＣＵ動き情報導出のために、以下の導出処理を行う。第１のステージにおいて、Ｗ×ＨＣＵ全体のためのＭＶが導出される。第２のステージにおいて、ＣＵは、Ｍ×ＭのサブＣＵにさらに分割される。Ｍの値は、（１６）のように計算されるが、Ｄは、予め定義された分割深さであり、ＪＥＭにおいてデフォルトで３に設定される。そして、各サブＣＵのＭＶを導出する。

【0122】

【数1】

【0123】

図２１に示すように、このバイラテラルマッチングは、２つの異なる参照ピクチャにおける現在のＣＵの動き軌跡に沿った２つのブロック間の最も近いマッチングを見出すことにより、現在のＣＵの動き情報を導出するために用いられる。連続した動き軌跡を仮定すると、２つの参照ブロックを指す動きベクトルＭＶ０およびＭＶ１は、現在のピクチャと２つの参照ピクチャとの間の時間的距離、例えばＴＤ０およびＴＤ１に比例する。特殊なケースとしては、現在のピクチャが時間的に２つの参照ピクチャの間にあり、現在のピクチャから２つの参照ピクチャまでの時間的な距離が同じである場合、バイラテラルマッチングはミラーに基づく双方向ＭＶとなる。

【0124】

図２２に示すように、現在のピクチャにおけるテンプレート（現在のＣＵの上側および／または左側の近傍のブロック）と、参照ピクチャにおけるブロック（テンプレートと同じサイズ）との間の最も近いマッチングを見出すことで、テンプレートマッチングを使用して、現在のＣＵの動き情報を導出する。前述のＦＲＵＣマージモード以外に、テンプレートマッチングは、ＡＭＶＰモードにも適用される。ＪＥＭにおいて、ＨＥＶＣと同様、ＡＭＶＰは２つの候補を有する。テンプレートマッチング法を用いることで、新しい候補を導出する。テンプレートマッチングによって新規に導出された候補が、第１の既存のＡＭＶＰ候補と異なる場合、ＡＭＶＰ候補リストの最初に挿入し、次に、リストサイズを２（第２の既存のＡＭＶＰ候補を取り除くことを意味する）に設定する。ＡＭＶＰモードに適用される場合、ＣＵレベル検索のみが適用される。

【0125】

２．３．３．１ＣＵレベルＭＶ候補セット

【0126】

ＣＵレベルのＭＶ候補セットは、以下からなる。
（ｉ）現在のＣＵがＡＭＶＰモードになっている場合の元のＡＭＶＰ候補
（ｉｉ）すべてのマージ候補、
（ｉｉｉ）補間ＭＶフィールド内の複数のＭＶ。
（ｉｖ）上と左の近傍の動きベクトル

【0127】

バイラテラルマッチングを使用する場合、マージ候補の各有効なＭＶを入力として使用して、バイラテラルマッチングを仮定してＭＶ対を生成する。例えば、マージ候補の１つの有効なＭＶは、参照リストＡにおいて（ＭＶａ，ｒｅｆａ）である。そして、その対をなすバイラテラルＭＶの参照ピクチャｒｅｆｂが他の参照リストＢにおいて見出され、ｒｅｆａおよびｒｅｆｂは、時間的に現在のピクチャの異なる側にある。参照リストＢにおいてこのようなｒｅｆｂが利用可能でない場合、ｒｅｆｂをｒｅｆａとは異なる参照として決定し、現在のピクチャとの時間的距離はリストＢにおける最小値である。ｒｅｆｂを決定した後、現在のピクチャとｒｅｆａ，ｒｅｆｂとの時間距離に基づいてＭＶａをスケーリングすることでＭＶｂを導出する。

【0128】

補間されたＭＶフィールドからの４つのＭＶもＣＵレベル候補リストに追加する。より具体的には、現在のＣＵの位置（０，０）、（Ｗ／２，０）、（０，Ｈ／２）、（Ｗ／２，Ｈ／２）の補間ＭＶを加算する。

【0129】

ＡＭＶＰモードでＦＲＵＣを適用する場合、元のＡＭＶＰ候補をＣＵレベルＭＶ候補セットにも加える。

【0130】

ＣＵレベルにおいて、ＡＭＶＰＣＵのための最大１５個のＭＶおよびマージＣＵのための最大１３個のＭＶを候補リストに加える。

【0131】

２．３．３．２サブＣＵレベルＭＶ候補セット

【0132】

サブＣＵレベルのＭＶ候補セットは、以下からなる。
（ｉ）ＣＵレベルの検索から決定されたＭＶ、
（ｉｉ）上、左、左上、右上の近傍のＭＶ、
（ｉｉｉ）参照ピクチャからの並置されたＭＶのスケーリングされたバージョン、
（ｉｖ）最大４つのＡＴＭＶＰ候補、
（ｖ）最大４つのＳＴＭＶＰ候補

【0133】

参照ピクチャからのスケーリングされたＭＶは、以下のように導出される。両方のリストにおける参照ピクチャをすべてトラバースする。参照ピクチャにおけるサブＣＵの配列位置にあるＭＶは、開始ＣＵレベルＭＶの参照に対してスケーリングされる。

【0134】

ＡＴＭＶＰおよびＳＴＭＶＰの候補は、最初の４つの候補に限定される

【0135】

サブＣＵレベルにおいて、最大１７個のＭＶが候補リストに追加される。

【0136】

２．３．３．３補間ＭＶフィールドの生成

【0137】

フレームをコーディングする前に、一方のＭＥに基づいてピクチャ全体に対して補間動きフィールドを生成する。そして、この動きフィールドを後にＣＵレベルまたはサブＣＵレベルのＭＶ候補として使用してもよい。

【0138】

まず、両方の参照リストにおける各参照ピクチャの動きフィールドは、４×４ブロックレベルでトラバースされる。各４×４ブロックにおいて、現在のピクチャ（図２３に示す）の４×４ブロックを通過するブロックに関連する動きで、補間動きがまだ割り当てられていない場合、時間的距離ＴＤ０およびＴＤ１に基づいて（ＨＥＶＣにおけるＴＭＶＰのＭＶスケーリングと同様に）、参照ブロックの動きを現在のピクチャにスケーリングし、スケーリングされた動きを現在のフレームのブロックに割り当てる。４×４ブロックにスケーリングされたＭＶが割り当てられていない場合、ブロックの動きは、補間された動きフィールドにおいて利用不可能であるとマークされる。

【0139】

２．３．３．４補間およびマッチングコスト

【0140】

１つの動きベクトルが１つの分数のサンプル位置を指す場合、動きの補償された補間が必要である。複雑性を低減するために、通常の８タップＨＥＶＣ補間の代わりに、バイラテラルマッチングおよびテンプレートマッチングの両方に双線形補間を使用する。

【0141】

マッチングコストの計算は、異なるステップでは少し異なる。ＣＵレベルの候補セットから候補を選択する場合、マッチングコストは、バイラテラルマッチングまたはテンプレートマッチングの差分の絶対値の和（ＳＡＤ）である。開始ＭＶを決定した後、サブＣＵレベル検索におけるバイラテラルマッチングのマッチングコストＣを以下のように算出する。

【0142】

【数2】

【0143】

ここで、ｗは、経験的に４に設定された重み係数であり、ＭＶおよびＭＶ^Ｓは、それぞれ、現在のＭＶおよび開始ＭＶを示す。ＳＡＤは、依然として、サブＣＵレベル検索におけるテンプレートマッチングのマッチングコストとして使用される。

【0144】

ＦＲＵＣモードにおいて、ＭＶは、輝度サンプルのみを使用することによって導出される。導出された動きは、ＭＣインター予測のために、輝度および彩度の両方に使用される。ＭＶを決定した後、輝度用の８タップ補間フィルタおよび彩度用の４タップ補間フィルタを使用して、最終的なＭＣを行う。

【0145】

２．３．３．５ＭＶの改良

【0146】

ＭＶ改良は、バイラテラルマッチングコストまたはテンプレートマッチングコストの基準を有するパターンに基づくＭＶ検索である。ＪＥＭでは、２つの検索パターン、即ち、ＵＣＢＤＳ（ＵｎｒｅｓｔｒｉｃｔｅｄＣｅｎｔｅｒ－ＢｉａｓｅｄＤｉａｍｏｎｄＳｅａｒｃｈ）およびＣＵレベルおよびサブＣＵレベルでのＭＶ改良のための適応的横断検索をそれぞれサポートする。ＣＵおよびサブＣＵレベルのＭＶ改善の両方のために、ＭＶは、１／４輝度サンプルＭＶの正確度で直接検索され、これに続いて１／８輝度サンプルＭＶの改良が行われる。ＣＵおよびサブＣＵステップのためのＭＶ改良の検索範囲は、８つの輝度サンプルに等しく設定される。

【0147】

２．３．３．６テンプレートマッチングＦＲＵＣマージモードにおける予測方向の選択

【0148】

バイラテラルマッチングマージモードにおいては、２つの異なる参照ピクチャにおける現在のＣＵの動き軌跡に沿った２つのブロック間の最も近いマッチングに基づいて、ＣＵの動き情報を導出するため、双方向予測が常に適用される。テンプレートマッチングマージモードについては、そのような制限はない。テンプレートマッチングマージモードにおいて、エンコーダは、ｌｉｓｔ０からの単一予測、ｌｉｓｔ１からの単一予測、またはＣＵのための双方向予測のうちから選択することができる。選択は、テンプレートマッチングコストに基づいて、以下のように行う。
ｃｏｓｔＢｉ≦ｆａｃｔｏｒ＊ｍｉｎ（ｃｏｓｔ０，ｃｏｓｔ１）の場合
双方向予測を用いる。
それ以外の場合において、ｃｏｓｔ０≦ｃｏｓｔ１の場合
ｌｉｓｔ０からの単一予測を用いる。
そうでない場合、
ｌｉｓｔ１からの単一予測を用いる。

【0149】

ここで、ｃｏｓｔ０はｌｉｓｔ０テンプレートマッチングのＳＡＤであり、ｃｏｓｔ１はｌｉｓｔ１テンプレートマッチングのＳＡＤであり、ｃｏｓｔＢｉは双方向予測テンプレートマッチングのＳＡＤである。ｆａｃｔｏｒの値が１．２５である場合、選択処理が双方向予測に偏っていることを意味する。このインター予測方向選択は、ＣＵレベルのテンプレートマッチング処理にのみ適用される。

【0150】

２．３．４デコーダ側動きベクトル改良

【0151】

双方向予測演算において、１つのブロック領域を予測するために、ｌｉｓｔ０の動きベクトル（ＭＶ）およびｌｉｓｔ１のＭＶをそれぞれ使用して構成される２つの予測ブロックを組み合わせ、１つの予測信号を形成する。ＤＭＶＲ（Ｄｅｃｏｄｅｒ－ｓｉｄｅＭｏｔｉｏｎＶｅｃｔｏｒＲｅｆｉｎｅｍｅｎｔ）方法において、バイラテラルテンプレートマッチング処理によって、双方向予測の２つの動きベクトルをさらに改良する。追加の動き情報を送信することなく改良されたＭＶを得るために、デコーダにおいてバイラテラルテンプレートマッチングを適用し、バイラテラルテンプレートと参照ピクチャにおける再構成サンプルとの間の歪みに基づく検索を行う。

【0152】

ＤＭＶＲにおいて、図２３に示すように、ｌｉｓｔ０の最初のＭＶ０とｌｉｓｔ１のＭＶ１とから、それぞれ２つの予測ブロックの重み付け結合（すなわち、平均）としてバイラテラルテンプレートを生成する。テンプレートマッチング操作は、生成されたテンプレートと参照ピクチャにおけるサンプル領域（最初の予測ブロックの付近）との間のコスト尺度を計算することからなる。２つの参照ピクチャの各々について、テンプレートコストが最小となるＭＶを、そのリストの更新されたＭＶと見なし、元のＭＶに置き換える。ＪＥＭにおいて、各リストに対して９つのＭＶ候補を検索する。９つのＭＶ候補は、元のＭＶと、水平または垂直方向のいずれかまたは両方向に元のＭＶに対してオフセットしている１つの輝度サンプルを有する８つの周囲のＭＶを含む。最後に、２つの新しいＭＶ、即ち、図２４に示すようなＭＶ０’およびＭＶ１’を使用して、最終的な双方向予測結果を生成する。差分の絶対値の和（ＳＡＤ）をコスト尺度として使用する。

【0153】

ＤＭＶＲは、追加の構文要素を送信することなく、過去の参照ピクチャからの１つのＭ
Ｖと、将来の参照ピクチャからの１つのＭＶとの間の双方向予測のマージモードに適用さ
れる。ＪＥＭにおいて、ＣＵに対してＬＩＣ、アフィン動き、ＦＲＵＣ、またはサブＣＵ
マージ候補が有効である場合、ＤＭＶＲは適用されない。

【0154】

２．３．５バイラテラルマッチングの改良を伴うマージ／スキップモード

【0155】

まず、利用可能な候補の数が最大候補サイズ１９に達するまで、空間的に近傍のブロックおよび時間的に近傍のブロックの動きベクトルおよび参照インデックスを冗長性チェック付き候補リストに挿入することで、マージ候補リストを構築する。マージ／スキップモードのマージ候補リストは、予め規定された挿入順に基づいて、ＨＥＶＣ（結合候補およびゼロ候補）に用いられる空間的候補（図１１）、時間的候補、アフィン候補、ＡＴＭＶＰ（ＡｄｖａｎｃｅｄＴｅｍｐｏｒａｌＭＶＰ）候補、ＳＴＭＶＰ（ＳｐａｔｉａｌＴｅｍｐｏｒａｌＭＶＰ）候補、および追加候補を挿入することで構築される。

【0156】

－ブロック１～４の空間的候補

【0157】

－ブロック１～４の外挿アフィン候補

【0158】

－ＡＴＭＶＰ

【0159】

－ＳＴＭＶＰ

【0160】

－仮想アフィン候補

【0161】

－空間的候補（ブロック５）（利用可能な候補の数が６よりも少ない場合にのみ使用される）。

【0162】

－外挿アフィン候補（ブロック５）

【0163】

－時間的候補（ＨＥＶＣのように導出）

【0164】

－外挿アフィン候補に続く非隣接空間的候補（図２５に示すブロック６～４９）。

【0165】

－結合候補

【0166】

－ゼロ候補

【0167】

なお、ＩＣフラグは、ＳＴＭＶＰおよびアフィンを除き、マージ候補から継承される。また、最初の４つの空間的候補について、双方向予測のものを単一予測のものの前に挿入する。

【0168】

［８］において、現在のブロックに接続されていないブロックにアクセスすることができる。非隣接ブロックが非イントラモードにてコーディングされている場合、関連する動き情報を追加のマージ候補として追加してもよい。

【0169】

３．本明細書に開示される実施形態が解決しようとする課題の例

【0170】

現在のＨＥＶＣ設計は、動き情報をよりよくコーディングするために、現在のブロックの近傍のブロック（現在のブロックの隣）の相関をとることができる。しかしながら、近傍のブロックが、異なる動き軌跡を有する異なる対象に対応する可能性がある。この場合、その近傍のブロックからの予測は効率的ではない。

【0171】

非隣接ブロックの動き情報からの予測は、全ての動き情報（一般的には４×４レベル）をキャッシュに記憶するコストをかけることになり、付加的なコーディング利得をもたらし、ハードウェア実装の複雑性を大幅に増大させる。

【0172】

４．技術的解決策のいくつかの例

【0173】

本開示の技術の実施形態は、既存の実装の欠点を克服し、それにより、より高いコーディング効率を有する映像コーディングを提供する。本願の説明において、ＬＵＴは、テーブル、リスト、配列またはインデックス付きエントリの他の配列であってもよい。

【0174】

既存の実装形態の欠点を克服するために、様々な実施形態において、ブロックの動き情報を予測するために、少なくとも１つの動き候補が記憶された１つ以上のテーブル（例えばルックアップテーブル）を使用するＬＵＴに基づく動きベクトル予測技術を実装し、より高いコーディング効率を有する映像コーディングを提供することができる。ルックアップテーブルは、ブロックの動き情報を予測するために動き候補を含める際に使用できるテーブルの一例であり、他の実装形態も可能である。各ＬＵＴは、それぞれが対応する動き情報に関連付けられた１つ以上の動き候補を含んでもよい。動き候補の動き情報は、予測方向、参照インデックス／ピクチャ、動きベクトル、ＬＩＣフラグ、アフィンフラグ、ＭＶＤ（ＭｏｔｉｏｎＶｅｃｔｏｒＤｅｒｉｖａｔｉｏｎ）精度、および／またはＭＶＤ値の一部または全部を含んでもよい。動き情報は、動き情報がどこに由来しているかを示すために、ブロック位置情報をさらに含んでもよい。

【0175】

開示される技術に基づいたＬＵＴに基づく動きベクトル予測は、既存のおよび将来の映像コーディング規格の両方を向上させることができ、様々な実施形態のために以下の例で解明される。ＬＵＴは、履歴データ（例えば、既に処理されたブロック）に基づいて符号化／復号化処理を行うことを可能にするため、ＬＵＴに基づく動きベクトル予測は、ＨＭＶＰ（Ｈｉｓｔｏｒｙ－ｂａｓｅｄＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法と呼ぶこともできる。ＬＵＴに基づく動きベクトル予測方法において、以前にコーディングされたブロックからの動き情報を有する１つまたは複数のテーブルは、符号化／復号化処理の間、維持される。ＬＵＴに記憶されたこれらの動き候補をＨＭＶＰ候補と称する。１つのブロックの符号化／復号化の間、ＬＵＴにおける関連付けられた動き情報を動き候補リスト（例えば、マージ／ＡＭＶＰ候補リスト）に追加して、１つのブロックを符号化／復号化した後に、ＬＵＴを使用してもよい。更新されたＬＵＴは、その後、後続のブロックを復号化するために用いられる。このように、ＬＵＴにおける動き候補の更新は、ブロックの符号化／復号化の順に基づく。以下の例は、一般的な概念を説明するための例であると考えられるべきである。

【0176】

以下の実施例は、一般的な概念を説明するための例であると考えられるべきである。これらの例は狭い意味で解釈されるべきではない。さらに、これらの例は、任意の方法で組み合わせることができる。

【0177】

一部の実施形態において、１つのブロックの動き情報を予測するために、少なくとも１つの動き候補が記憶された１つ以上のルックアップテーブルを用いてもよい。実施形態は、動き候補を用いて、ルックアップテーブルに記憶された動き情報のセットを示すことができる。従来のＡＭＶＰまたはマージモードの場合、実施形態では、動き情報を記憶するためにＡＭＶＰまたはマージ候補を使用してもよい。

【0178】

以下の実施例は、一般的な概念を説明する。

【0179】

ルックアップテーブルの例

【0180】

各ルックアップテーブルは、各候補がその動き情報に関連付けられた１つ以上の動き候補を含んでもよい。

【0181】

ＬＵＴの選択

【0182】

例Ｂ１：１つのブロックをコーディングする場合、１つのルックアップテーブルからの動き候補の一部または全部を順にチェックすることができる。１つのブロックをコーディングする間に１つの動き候補をチェックする際に、この動き候補を動き候補リスト（例えば、ＡＭＶＰ、マージ候補リスト）に加えてもよい。

【0183】

ルックアップテーブルの使用法

【0184】

チェック対象のルックアップテーブルにおける動き候補の総数は、予め規定されてもよい。
ａ．それは、コーディングされた情報、ブロックサイズ、ブロック形状等にさらに依存してもよい。
１．例えば、ＡＭＶＰモードの場合、ｍ個の動き候補のみをチェックし、マージモードの場合、ｎ個の動き候補をチェックしてもよい（例えば、ｍ＝２、ｎ＝４４）。
ｂ．一例において、チェック対象の動き候補の総数は、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、スライスヘッダ、タイルヘッダ、ＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）、ＣＴＢ（ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ）、ＣＵ（ＣｏｄｉｎｇＵｎｉｔ）またはＰＵ（ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）、複数のＣＴＵ／ＣＴＢ／ＣＵ／ＰＵを含む領域で信号通知されてもよい。

【0185】

例Ｃ１：１つのルックアップテーブルに含まれる１つ以上の動き候補は、１つのブロックによって直接継承されてもよい。
ａ．それらをマージモードコーディングに使用してもよい。すなわち、マージ候補リスト導出処理において動き候補をチェックしてもよい。
ｂ．これらは、アフィンマージモードコーディングに使用してもよい。
ｉ．アフィンフラグが１である場合、ルックアップテーブルにおける動き候補をアフィンマージ候補として加えることができる。
ｃ．以下の場合、ルックアップテーブルにおける動き候補のチェックを有効にしてもよい。
ｉ．ＴＭＶＰ候補を挿入した後、マージ候補リストが満杯になっていない。
ｉｉ．空間的マージ候補導出のために特定の空間的に近傍のブロックをチェックした後、マージ候補リストが満杯になっていない。
ｉｉｉ．すべての空間的マージ候補の後、マージ候補リストが満杯になっていない。
ｉｖ．結合双方向予測マージ候補の後、マージ候補リストが満杯になっていない。
ｖ．他のコーディング方式（例えば、ＨＥＶＣデザイン、またはＪＥＭデザインのマージ導出処理）からマージ候補リストに入れられた空間的または時間的な（例えば、隣接空間および非隣接空間、ＴＭＶＰ、ＳＴＭＶＰ、ＡＴＭＶＰなどを含む）マージ候補の数が、最大許容されるマージ候補から、所与の閾値を引いた数よりも少ない場合。
１．一例において、閾値は、１または０に設定される。
２．代替的に、閾値は、ＳＰＳ／ＰＰＳ／シーケンス、ピクチャ、スライスヘッダ／タイルにおいて信号通知されてもよく、または予め規定されてもよい。
３．代替的に、閾値は、ブロックごとに適応的に変更されてもよい。例えば、それは、ブロックサイズ／ブロック形状／スライスタイプのようなコーディングされたブロック情報に依存してもよく、および／または利用可能な空間的または時間的マージ候補の数に依存してもよい。
４．他の例において、既にマージ候補リストに追加されたある種のマージ候補の数が、最大許容マージ候補から、所与の閾値を引いた数未満である場合。「ある種のマージ候補」は、ＨＥＶＣのような空間的候補であってもよいし、隣接しないマージ候補であってもよい。
ｖｉ．マージ候補リストに動き候補を追加する前に、プルーニングを適用してもよい。本特許明細書に開示されたこの例および他の例の様々な実装形態において、プルーニングは、ａ）動き情報と既存のエントリとを一意性のために比較すること、または、ｂ）一意である場合、動き情報をリストに追加すること、または、ｃ）一意でない場合、ｃ１）動き情報を追加しない、または、ｃ２）動き情報を追加し、一致した既存のエントリを削除することを含んでもよい。いくつかの実装形態において、テーブルから候補リストに動き候補を追加する際に、プルーニング工程は実行されない。
１．一例において、動き候補は、マージ候補リストの他のコーディング方法から利用可能な空間的または時間的（例えば、隣接空間および非隣接空間、ＴＭＶＰ、ＳＴＭＶＰ、ＡＴＭＶＰ等を含む）マージ候補の全部または一部にプルーニングされてもよい。
２．動き候補は、サブブロックに基づく動き候補、例えば、ＡＴＭＶＰ、ＳＴＭＶＰにプルーニングされなくてもよい。
３．一例において、現在の動き候補は、マージ候補リストにおける利用可能な動き候補（現在の動き候補の前に挿入された）の全部または一部にプルーニングされてもよい。
４．動き候補に関連するプルーニング工程の数（例えば、動き候補をマージリストにおける他の候補と比較する必要がある回数）は、利用可能な空間的または時間的マージ候補の数に依存してもよい。例えば、新しい動き候補をチェックする際に、マージリストに利用可能な候補がＭ個ある場合、新しい動き候補を最初のＫ個（Ｋ≦Ｍ）の候補とのみ比較してもよい。プルーニング関数が偽を返す（例えば、最初のＫ個の候補のいずれとも同一でない）場合、この新しい動き候補は、Ｍ個の候補のすべてと異なると見なされ、マージ候補リストに追加され得る。一例において、Ｋは、ｍｉｎ（Ｋ，２）に設定される。
５．一例において、新しく付加された動き候補とマージ候補リストにおける最初のＮ個の候補とを比較するだけである。例えば、Ｎ＝３、４または５である。Ｎは、エンコーダからデコーダに信号通知されてもよい。
６．一例において、チェック対象の新しい動き候補は、マージ候補リストにおける最後のＮ個の候補と比較されるのみである。例えば、Ｎ＝３、４または５である。Ｎは、エンコーダからデコーダに信号通知されてもよい。
７．一例において、以前リストに追加された候補を選択し、テーブルからの新しい動き候補と比較する方法は、前回追加された候補がどこから導出されたかに依存してもよい。
ａ．一例において、ルックアップテーブルにおける動き候補を、所与の時間的および／または空間的に近傍のブロックから導出された候補と比較してもよい。
ｂ．一例において、ルックアップテーブルにおける動き候補の異なるエントリを、以前追加された異なる候補と比較してもよい（すなわち、異なる位置から導出された）。

【0186】

例Ｃ２：ルックアップテーブルに含まれる動き候補は、ブロックの動き情報をコーディングする予測モジュールとして用いられてもよい使用してもよい。
ａ．それらをＡＭＶＰモードコーディングに使用してもよい。すなわち、ＡＭＶＰ候補リスト導出処理において動き候補をチェックしてもよい。
ｂ．以下の場合、ルックアップテーブルにおける動き候補のチェックを有効にしてもよい。
ｉ．ＴＭＶＰ候補を挿入した後、ＡＭＶＰ候補リストが満杯になっていない。
ｉｉ．ＡＭＶＰ候補リストは、空間的近傍から選択し、プルーニングした後で、ＴＭＶＰ候補を挿入する直前には、満杯になっていない。
ｉｉｉ．上側の隣接ブロックからのＡＭＶＰ候補がスケーリング無しで存在しない場合、および／または、左側の隣接ブロックからのＡＭＶＰ候補がスケーリング無しで存在しない場合。
ｉｖ．ＡＭＶＰ候補リストに動き候補を追加する前に、プルーニングを適用してもよい。
ｃ．現在の参照ピクチャと同一の参照ピクチャを有する動き候補をチェックする。
ｉ．代替的に、現在の参照ピクチャとは異なる参照ピクチャを有する動き候補も（スケーリングされたＭＶと併せて）チェックする。
ｉｉ．代替的に、まず、現在の参照ピクチャと同一の参照ピクチャを有するすべての動き候補をチェックし、次に、現在の参照ピクチャとは異なる参照ピクチャを有する動き候補をチェックする。
ｉｉｉ．代替的に、マージでも同様に動き候補をチェックする。

【0187】

例Ｃ３：以前コーディングされたフレーム／スライス／タイルにおけるルックアップテーブルの動き候補を使用して、異なるフレーム／スライス／タイルにおけるブロックの動き情報を予測してもよい。

【0188】

ルックアップテーブルの更新

【0189】

例Ｄ１：動き情報を有するブロックをコーディングした後（すなわち、ＩｎｔｒａＢＣモード、インター符号化モード）に、１つ以上のルックアップテーブルを更新してもよい。

【0190】

例Ｄ２：１つのブロックが１つのピクチャ／スライス／タイルの境界に位置する場合、ルックアップテーブルの更新は常に許可されない。

【0191】

例Ｄ３：現在のＬＣＵ行をコーディングするために、上記ＬＣＵ行の動き情報を無効にしてもよい。

【0192】

例Ｄ４：新しい時間層インデックスを使用してスライス／タイルをコーディングする開始時に、利用可能な動き候補の数を０にリセットすることができる。

【0193】

例Ｄ５：ルックアップテーブルは、同じ時間層インデックスを有する１つのスライス／タイル／ＬＣＵの行／スライスで連続的に更新されてもよい。

【0194】

例Ｄ６：ルックアップテーブル更新プロセスは、異なる手順内で呼び出されてもよい。

【0195】

追加の例示的な実施形態

【0196】

以前コーディングされたブロックの動き情報としてＨＭＶＰ候補を規定する、ＨＭＶＰ（Ｈｉｓｔｏｒｙ－ｂａｓｅｄＭＶＰ）方法が提案される。符号化／復号化処理中、複数のＨＭＶＰ候補を有するテーブルが維持される。新しいスライスに遭遇した場合、テーブルは空になる。インター符号化されたブロックがあるときはいつでも、関連する動き情報を新しいＨＭＶＰ候補としてテーブルの最後のエントリに加える。全体のコーディングフローを図３１に示す。

【0197】

一例において、テーブルサイズはＬ（例えば、Ｌ＝１６または６、または４４）に設定され、これは、Ｌ個までのＨＭＶＰ候補をテーブルに追加することができることを示す。

【0198】

１つの実施形態（例１１．ｇ．ｉに対応する）において、以前コーディングされたブロックからのＨＭＶＰ候補がＬ個よりも多く存在する場合、テーブルが常に最新の以前コーディングされたＬ個の動き候補を含むように、先入れ先出し（ＦＩＦＯ：Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）規則が適用される。図３２は、ＦＩＦＯ規則を適用してＨＭＶＰ候補を除去し、提案される方法で使用されるテーブルに新しいものを追加する例を示す。

【0199】

別の実施形態（発明１１．ｇ．ｉｉｉに対応する）において、新しい動き候補を追加するときはいつでも（例えば、現在のブロックがインター符号化され、非アフィンモードであるなど）、まず、冗長性チェック処理を適用し、ＬＵＴに同じまたは類似した動き候補があるかどうかを識別する。

【0200】

いくつかの例を以下に示す。

【0201】

図３３Ａは、新しい動き候補を追加する前に、ＬＵＴが満杯であった場合の例を示す。

【0202】

図３３Ｂは、新しい動き候補を追加する前に、ＬＵＴが満杯でない場合の例を示す。

【0203】

図３３Ａおよび図３３Ｂは、ともに、冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。

【0204】

図３４Ａおよび図３４Ｂは、冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する、図では２つの候補を示す）の２つの場合の例示の実装形態を示す。

【0205】

図３４Ａは、新しい動き候補を追加する前に、ＬＵＴが満杯であった場合の例を示す。

【0206】

図３４Ｂは、新しい動き候補を追加する前に、ＬＵＴが満杯でない場合の例を示す。

【0207】

ＨＭＶＰ候補は、マージ候補リスト構築処理において使用され得る。ＴＭＶＰ候補の後に、テーブルにおける最後のエントリから最初のエントリ（または最後のＫ０のＨＭＶＰ、例えば、Ｋ０＝１６または６）までのすべてのＨＭＶＰ候補を挿入する。ＨＭＶＰ候補に対してプルーニングを適用する。利用可能なマージ候補の総数が信号通知された最大許容マージ候補に達すると、マージ候補リスト構築処理を終了する。代替的に、加算された動き候補の総数が、所与の値に達すると、ＬＵＴからの動き候補のフェッチを終了する。

【0208】

同様に、ＨＭＶＰ候補は、ＡＭＶＰ候補リスト構築処理において使用されてもよい。ＴＭＶＰ候補の後に、テーブルにおける最後のＫ１個のＨＭＶＰ候補の動きベクトルを挿入する。ＡＭＶＰ対象参照ピクチャと同じ参照ピクチャを有するＨＭＶＰ候補のみを用いて、ＡＭＶＰ候補リストを構築する。ＨＭＶＰ候補に対してプルーニングを適用する。一例において、Ｋ１は４に設定される。

【0209】

図２８は、映像処理装置２８００のブロック図である。装置２８００は、本明細書に記載の方法の１つ以上を実装するために使用してもよい。装置２８００は、スマートフォン、タブレット、コンピュータ、ＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）受信機等により実装されてよい。装置２８００は、１つ以上のプロセッサ２８０２と、１つ以上のメモリ２８０４と、映像処理ハードウェア２８０６と、を含んでよい。１つまたは複数のプロセッサ２８０２は、本明細書に記載される１つ以上の方法を実装するように構成されてもよい。１または複数のメモリ２８０４は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア２８０６は、本明細書に記載される技術をハードウェア回路にて実装するために用いられてもよい。

【0210】

図２９は、映像処理方法２９００の例のフローチャートである。方法２９００は、ステップ２９０２でテーブルのセットを維持することを含み、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる。方法２９００は、ステップ２９０４において、動き候補へのプルーニング工程を使って、１つ以上のテーブルにおける動き候補に基づいて動き候補リストを更新することをさらに含む。方法２９００は、さらに、ステップ２９０６において、構築された動き候補リストを使って、第１の映像ブロックと、第１の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、を含む。

【0211】

図３０は、映像処理方法３０００の例のフローチャートである。方法３０００は、ステップ３００２において、映像データの第１の映像ブロックを含む映像のビットストリーム表現を受信することを含む。方法３０００は、ステップ３００４において、１つの候補リストを更新するために、１つ以上のテーブルにおける動き候補に対してプルーニング工程を適用することをさらに含み、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる。方法３０００は、ステップ３００６において、構築された候補リストを使用してビットストリーム表現と第１の映像ブロックとの間で変換を行うことをさらに含む。

【0212】

上述した方法／技術の特徴および実施形態を、項目に基づくフォーマットを使用して以下に説明する。

【0213】

１．テーブルのセットを維持することであって、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる、ことと、動き候補へのプルーニング工程を使用して１つ以上のテーブルで動き候補に基づいて候補リストを更新することと、第１の映像ブロックと、構成した候補リストを用いて、前記第１の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、を有する、映像処理方法。

【0214】

２．第１の映像ブロックを含む映像のビットストリーム表現を受信することと、候補リストを構成するために１つまたは複数のテーブルにおける動き候補に対してプルーニング工程を適用することであって、各テーブルが動き候補を含み、各動き候補が対応する動き情報に関連付けられている、ことと、構成された候補リストを用いて、ビットストリーム表現と前記第１の映像ブロックとの間の変換を行うことと、を有する、映像処理方法。

【0215】

３．少なくとも１つのテーブルは、前記第１の映像ブロックの前に復号化された、以前復号化された映像ブロックから導出した動き候補を含む、第１または２項に記載の方法。

【0216】

４．前記プルーニング工程は、テーブルからの動き候補を前記候補リストに追加する前に行われる、第１または２項に記載の方法。

【0217】

５．前記候補リストは、マージ候補リストに対応する、第３項に記載の方法。

【0218】

６．前記プルーニング工程は、テーブルからの動き候補と、利用可能な空間的または時間的マージ候補の少なくとも一部とを比較することを含む、第１または２項に記載の方法。

【0219】

７．前記プルーニング工程は、テーブルからの動き候補とすべての利用可能な空間的マージ候補とを比較することを含む、第１または２項に記載の方法。

【0220】

８．前記プルーニング工程は、動き候補をテーブルからサブブロックに基づく動き候補に変更することなく行われる、第１、２または４項に記載の方法。

【0221】

９．前記プルーニング工程は、動き候補を加える前に、テーブルからの動き候補をマージ候補リストにおける利用可能な動き候補の少なくとも１部と比較することを含む、第１または２項に記載の方法。

【0222】

１０．前記プルーニング工程は、複数の工程を含み、その数は、複数の空間的または時間的マージ候補の関数である、第１または２項に記載の方法。

【0223】

１１．前記複数の工程は、マージ候補リストにおいてＭ個の候補が利用可能である場合に、プルーニングが、Ｋ個のマージ候補にのみ適用され、Ｋ≦Ｍであり、ＫおよびＭが整数である、第９項に記載の方法。

【0224】

１２．Ｋをｍｉｎ（Ｋ，２）に設定する、第１０項に記載の方法。

【0225】

１３．プルーニング工程は、動き候補を候補リストに加える前に、テーブルからの動き候補と候補リストにおける第１のＮ個の候補とを比較することを含み、Ｎが整数である、第１項に記載の方法。

【0226】

１４．前記プルーニング工程は、動き候補を前記候補リストに加える前に、チェック対象のテーブルからの動き候補と、候補リストにおける最後のＮ個の候補とを比較することを含み、Ｎが整数である、第１または２項に記載の方法。

【0227】

１５．Ｎの値を信号通知することをさらに含む、第１２または１３項に記載の方法。

【0228】

１６．プルーニング工程は、候補がどのように導出されたかに基づいて、テーブルからの動き候補と、候補リストにおけるある候補とを比較することを含む、第１項に記載の方法。

【0229】

１７．プルーニング工程は、テーブルからの動き候補と、所与の時間的または空間的に隣接ブロックから導出された候補とを比較することを含む、第１５項に記載の方法。

【0230】

１８．テーブルにおける異なる動き候補のエントリを、異なる位置から導出された、以前に追加された異なる候補と比較する、第１５項に記載の方法。

【0231】

１９．テーブルから前記候補リストに動き候補を追加する際に、プルーニング工程を呼び出さないことをさらに含む、第１項に記載の方法。

【0232】

２０．前記変換を行うことは、前記映像ブロックから前記ビットストリーム表現を生成することを含む、第１～１９項のいずれか１項に記載の方法。

【0233】

２１．前記変換を行うことは、前記ビットストリーム表現から前記映像ブロックを生成することを含む、第１～１９項のいずれか１項に記載の方法。

【0234】

２２．動き候補は、予測方向、参照ピクチャインデックス、動きベクトル値、強度補償フラグ、アフィンフラグ、動きベクトル差精度、または動きベクトル差分値のうちの少なくとも１つを含む動き情報に関連付けられる、第１～２１項のいずれか１項に記載の方法。

【0235】

２３．前記動き候補は、イントラモードコーディングのためのイントラ予測モードの動き候補に対応する、第１～２２項のいずれか１項に記載の方法。

【0236】

２４．前記動き候補は、ＩＣパラメータコーディングのための照明補償パラメータを含む動き候補に対応する、第１～２２項のいずれか１項に記載の方法。

【0237】

２５．前記変換に基づいて、１つ以上のテーブルを更新することをさらに含む、第１項～第２４項のいずれか１項に記載の方法。

【0238】

２６．１つ以上のテーブルを更新することは、前記変換を行った後、前記第１の映像ブロックの動き情報に基づいて１つ以上のテーブルを更新することを含む、第２５項に記載の方法。

【0239】

２７．前記更新されたテーブルに基づいて、前記映像の後続の映像ブロックと前記映像のビットストリーム表現との間で変換を行うことをさらに含む、第２６項に記載の方法。

【0240】

２８．プロセッサと、命令が記憶された非一時的メモリとを備える装置であって、命令は、前記プロセッサによって実装された際に、前記プロセッサに、第１項から第２７項のいずれか１項に記載の方法を実施させる装置。

【0241】

２９．非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、第１～２７項のいずれか１項に記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。

【0242】

以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の技術は、添付の特許請求の範囲による場合を除き、限定されない。

【0243】

本明細書に記載された開示された、およびその他の実施形態、モジュール、および機能操作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの１つ以上の組み合わせで実施してもよい。開示された、およびその他の実施形態は、１つ以上のコンピュータプログラム製品、すなわち、データ処理装置によって実装されるため、またはデータ処理装置の操作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実施することができる。このコンピュータ可読媒体は、機械可読記憶装置、機械可読記憶基板、記憶装置、機械可読伝播信号をもたらす物質の組成物、またはこれらの１つ以上の組み合わせであってもよい。「データ処理装置」という用語は、例えば、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサ、若しくはコンピュータを含め、データを処理するためのすべての装置、デバイス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの１つ以上の組み合わせを構成するコードを含んでもよい。伝播信号は、人工的に生成した信号、例えば、機械で生成した電気、光、または電磁信号であり、適切な受信装置に送信するための情報を符号化するために生成される。

【0244】

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる）は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部（例えば、マークアップ言語文書に格納された１つ以上のスクリプト）に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル（例えば、１つ以上のモジュール、サブプログラム、またはコードの一部を格納するファイル）に記憶されていてもよい。１つのコンピュータプログラムを、１つのサイトに位置する１つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開可能である。

【0245】

本明細書に記載されたプロセスおよびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって行うことができる。プロセスおよびロジックフローはまた、特別目的のロジック回路、例えば、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）またはＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）によって実行することができ、装置はまた、特別目的のロジック回路として実装することができる。

【0246】

コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般的に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための１つ以上の記憶装置とである。一般的に、コンピュータは、データを記憶するための１つ以上の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、および記憶装置を含み、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュ記憶装置、磁気ディスク、例えば内部ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスク等の半導体記憶装置を含む。プロセッサおよびメモリは、専用ロジック回路によって補完されてもよく、または専用ロジック回路に組み込まれてもよい。

【0247】

この特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本特許明細書において別の実施形態の文脈で説明されている特定の特徴は、１つの例において組み合わせて実装してもよい。逆に、単一の例の文脈で説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの１つ以上の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブ組み合わせまたはサブ組み合わせのバリエーションに向けられてもよい。

【0248】

同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で実行されること、または示された全ての操作が実行されることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。

【0249】

いくつかの実装形態および例のみが記載されており、この特許明細書に記載され図示されている内容に基づいて、他の実施形態、拡張および変形が可能である。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24】

【図25】

【図26】

【図27A】

【図27B】

【図28】

【図29】

【図30】

【図31】

【図32】

【図33A】

【図33B】

【図34A】

【図34B】

【手続補正書】

【提出日】2022-07-04

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

映像データの処理の方法であって、
テーブルを維持することであって、前記テーブルは、コーディングされた映像の１または複数のブロックから導出された１または複数の候補を含み、前記テーブルにおける前記候補の配列は、前記テーブルへの前記候補の追加の順序に基づく、ことと、
候補リストを構成することであって、前記テーブルにおける少なくとも１つの第１の候補は、前記構成の間、チェックされ、プルーニング工程が、前記少なくとも１つの第１の候補に対して利用される、ことと、
前記候補リストを用いて動き情報を導出することと、
前記動き情報に基づいて、現在のブロックと、前記映像のビットストリームとの間の変換を実行することと、
を有する方法。

【請求項2】

前記少なくとも１つの第１の候補は、前記候補リストに含まれている少なくとも１つの第２の候補を用いてプルーニングされる、請求項１に記載の方法。

【請求項3】

前記少なくとも１つの第２の候補の各候補は、前記各候補が導出された位置に基づいて決定される、請求項２に記載の方法。

【請求項4】

前記少なくとも１つの第２の候補は、前記現在のブロックの所定の空間的に近傍のブロックから導出される空間的候補を含む、請求項３に記載の方法。

【請求項5】

前記少なくとも１つの第２の候補は、前記候補リストにおける最初のＮ個の候補を含み、
Ｎは、整数である、請求項２に記載の方法。

【請求項6】

前記少なくとも１つの第２の候補の総数は、Ｋであり、
Ｋは、２以下である、請求項２に記載の方法。

【請求項7】

前記少なくとも１つの第２の候補は、ブロックＡ１から導出された空間的候補、および、ブロックＢ１から導出された空間的候補の少なくとも一方を含み、
ブロックＡ１は、前記現在のブロックに対する左の近傍のブロックであり、
ブロックＢ１は、前記現在のブロックに対する上の近傍のブロックである、
請求項６に記載の方法。

【請求項8】

前記少なくとも１つの第２の候補は、前記候補リストに存在する候補の一部である、請求項２に記載の方法。

【請求項9】

前記候補リストの前記候補の一部は、空間的候補の一部である、請求項８に記載の方法。

【請求項10】

前記少なくとも１つの第１の候補のうちの１つの候補が前記少なくとも１つの第２の候補のいずれとも異なる場合、当該候補は前記候補リストに追加される、請求項２に記載の方法。

【請求項11】

前記少なくとも１つの第２の候補は、サブブロックベースの候補を除く、請求項１に記載の方法。

【請求項12】

前記プルーニング工程は、前記テーブルから前記候補リストに候補を追加する際には実行されない、請求項１に記載の方法。

【請求項13】

前記テーブルにおける前記候補は、予測方向、参照ピクチャインデックス、動きベクトル値、強度補償フラグ、アフィンフラグ、動きベクトル差分精度、および動きベクトル差分値の少なくともいずれかを含む動き情報に関連付けられている、請求項１に記載の方法。

【請求項14】

前記現在のブロックの前記動き情報を用いて前記テーブルを更新すること
を更に有する、請求項１に記載の方法。

【請求項15】

前記テーブルが、前記動き情報に対応する候補が前記候補リストに追加される前に満杯になった場合、前記テーブルの候補が除去される、請求項１４に記載の方法。

【請求項16】

前記候補リストは、マージ候補リストである、請求項１に記載の方法。

【請求項17】

前記変換は、前記現在のブロックを前記ビットストリームに符号化することを有する、請求項１に記載の方法。

【請求項18】

前記変換は、前記現在のブロックを前記ビットストリームから復号化することを有する、請求項１に記載の方法。

【請求項19】

プロセッサと、命令を有する非一時的メモリを有する、映像データを処理するための装置であって、
前記命令は、前記プロセッサによって実行された際に、前記プロセッサに、
テーブルを維持することであって、前記テーブルは、現在のブロックに先立ってコーディングされた映像の１または複数の予めコーディングされたブロックから導出された１または複数の候補を含み、前記テーブルにおける前記候補の配列は、前記テーブルへの前記候補の追加の順序に基づく、ことと、
候補リストを構成することであって、前記テーブルを用いる前記構成の間、プルーニング工程が、前記テーブルにおける少なくとも１つの第１の候補に対して利用される、ことと、
前記候補リストを用いて動き情報を導出することと、
前記動き情報に基づいて、前記現在のブロックと、前記映像のビットストリームとの間の変換を実行することと、
を有する方法。

【請求項20】

プロセッサに、
テーブルを維持することであって、前記テーブルは、現在のブロックに先立ってコーディングされた映像の１または複数の予めコーディングされたブロックから導出された１または複数の候補を含み、前記テーブルにおける前記候補の配列は、前記テーブルへの前記候補の追加の順序に基づく、ことと、
候補リストを構成することであって、前記テーブルを用いる前記構成の間、プルーニング工程が、前記テーブルにおける少なくとも１つの第１の候補に対して利用される、ことと、
前記候補リストを用いて動き情報を導出することと、
前記動き情報に基づいて、前記現在のブロックと、前記映像のビットストリームとの間の変換を実行することと、
を行わせる命令を格納した非一時的コンピュータ可読記憶媒体。

【請求項21】

映像のビットストリームを格納するための方法であって、
前記方法は、
テーブルを維持することであって、前記テーブルは、コーディングされた映像の１または複数のブロックから導出された１または複数の候補を含み、前記テーブルにおける前記候補の配列は、前記テーブルへの前記候補の追加の順序に基づく、ことと、
候補リストを構成することであって、前記テーブルにおける少なくとも１つの第１の候補は、前記構成の間、チェックされ、プルーニング工程が、前記少なくとも１つの第１の候補に対して利用される、ことと、
前記候補リストを用いて動き情報を導出することと、
前記動き情報に基づいて、前記映像の前記ビットストリームを生成することと、
非一時的コンピュータ可読記録媒体に前記ビットストリームを格納することと、
を有する方法。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０００１

【補正方法】変更

【補正の内容】

【0001】

関連出願の相互参照
本願は、２０１８年６月２９日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／０９３６６３号、２０１８年９月１２日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／１０５１９３号、２０１８年１１月２７日出願の国際特許出願ＰＣＴ／ＣＮ２０１８／１１７６２７、および２０１９年１月１０日出願の国際特許出願ＰＣＴ／ＣＮ２０１９／０７１２１４号の優先権および利益を適時に主張する２０１９年７月１日出願の国際特許出願ＰＣＴ／ＩＢ２０１９／０５５５８２に基づく日本国特許出願特願２０２１－５２３１１０の分割出願である。上記の特許出願の全ては、本願の開示の一部として参照により援用される。

【外国語明細書】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版