特許7169451 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ テンセント・アメリカ・エルエルシーの特許一覧

特許7169451ビデオ復号の方法、装置、及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-11-01

(45)【発行日】2022-11-10

(54)【発明の名称】ビデオ復号の方法、装置、及びコンピュータプログラム

(51)【国際特許分類】

H04N 19/52 20140101AFI20221102BHJP

【ＦＩ】

H04N19/52

【請求項の数】 12

(21)【出願番号】P 2021532876

(86)(22)【出願日】2020-03-12

(65)【公表番号】

(43)【公表日】2022-04-26

(86)【国際出願番号】 US2020022265

(87)【国際公開番号】W WO2020190617

(87)【国際公開日】2020-09-24

【審査請求日】2021-06-24

(31)【優先権主張番号】62/819,502

(32)【優先日】2019-03-15

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】16/815,940

(32)【優先日】2020-03-11

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】520353802

【氏名又は名称】テンセント・アメリカ・エルエルシー

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】シュイ，シアオジョォン

(72)【発明者】

【氏名】リ，シアン

(72)【発明者】

【氏名】リ，グォイチュン

(72)【発明者】

【氏名】リィウ，シャン

【審査官】岩井健二

(56)【参考文献】

【文献】特開２０２０－０８８４５１（ＪＰ，Ａ）

【文献】国際公開第２０２０／００３２６６（ＷＯ，Ａ１）

【文献】国際公開第２０１３／０９９２８５（ＷＯ，Ａ１）

【文献】Chun-Chia Chen, et al.，CE4-related: Shared merge list，Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11，JVET-L0091-v2，12th Meeting: Macao, CN，2018年10月，pp.1-4

【文献】Chun-Chia Chen, et al.，CE4.3.1: Shared merging candidate list，Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11，JVET-M0170-v1，13th Meeting: Marrakech, MA，2019年01月，pp.1-13

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／００－１９／９８

(57)【特許請求の範囲】

【請求項1】

デコーダが実行するビデオ復号のための方法であって、
一部が現在ピクチャのピクチャ境界の外側に位置する符号化領域の予測情報を復号するステップであって、前記現在ピクチャは、符号化ビデオシーケンスの一部であり、前記符号化領域は複数の符号化ブロックを含む、ステップと、
一部が前記ピクチャ境界の外側に位置する前記符号化領域に共有マージリストを使用するか否かを決定するステップであり、前記共有マージリストは、前記符号化領域に含まれる前記複数の符号化ブロックによって共有される、ステップと、
一部が前記ピクチャ境界の外側に位置している前記符号化領域に前記共有マージリストが使用されると決定されることに応じて、一部が前記ピクチャ境界の外側に位置している前記符号化領域の前記共有マージリストを構築するステップと、
前記共有マージリストに基づいて前記符号化領域を再構築するステップと、を含む方法。

【請求項2】

前記符号化領域のサイズが第１のサイズ閾値以下である場合、前記符号化領域に前記共有マージリストを使用すると決定する、請求項１に記載の方法。

【請求項3】

（ｉ）前記符号化領域のサイズが第２のサイズ閾値以上であり、かつ
（ｉｉ）前記複数の符号化ブロックの１つのブロックサイズが前記第２のサイズ閾値より小さい場合、
前記符号化領域に前記共有マージリストを使用すると決定する、請求項１に記載の方法。

【請求項4】

前記符号化領域に前記共有マージリストを使用することに応じて、前記共有マージリストを構築するステップは、
前記符号化領域の同空間位置領域の中心位置に隣接して位置する第１のブロックを選択するステップであって、前記同空間位置領域が前記符号化領域の参照ピクチャにある、ステップと、
前記第１のブロックが前記現在ピクチャの前記ピクチャ境界の内側に位置し、かつインター予測モードで符号化された場合、前記第１のブロックに基づいて前記共有マージリストを構築するステップと、
をさらに含む請求項１～３のいずれか１項に記載の方法。

【請求項5】

前記符号化領域に前記共有マージリストを使用することに応じて、前記共有マージリストを構築するステップは、
前記符号化領域の同空間位置領域の左上の位置に隣接して位置する第２のブロックを選択するステップであって、前記同空間位置領域が前記符号化領域の参照ピクチャにある、ステップと、
前記第２のブロックがインター予測モードで符号化された場合、前記第２のブロックに基づいて前記共有マージリストを構築するステップと、
をさらに含む請求項１～３のいずれか１項に記載の方法。

【請求項6】

デコーダが実行するビデオ復号のための方法であって、
符号化ビデオシーケンスの一部である現在ピクチャにおける現在ブロックの予測情報を復号するステップであって、前記現在ブロックの一部は、前記現在ピクチャのピクチャ境界の外側に位置し、前記予測情報が前記現在ブロックのマージモードを示すものである、ステップと、
検査順序に従って、前記現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査するステップであって、前記検査順序における２番目の検査位置が前記同空間位置ブロックの左上隅に隣接して位置する前記符号化ブロックのうちの１つであり、前記同空間位置ブロックが前記現在ブロックの参照ピクチャにある、ステップと、
前記検査された符号化ブロックに基づいて時間動きベクトル予測子（ＴＭＶＰ）を決定するステップと、
前記ＴＭＶＰに基づいて前記現在ブロックを再構築するステップと、を含む方法。

【請求項7】

前記検査順序に従って、前記現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査するステップは、
前記検査順序に従って前記符号化ブロックのうちの１つを選択するステップと、
前記選択された符号化ブロックがインター予測モードで符号化されたか否かを決定するステップと、
をさらに含む請求項６に記載の方法。

【請求項8】

前記同空間位置ブロックの左上隅に隣接して位置する前記符号化ブロックは、前記検査順序に従って、前記同空間位置ブロックの右下隅に隣接して位置する符号化ブロックの後に検査される、請求項６又は７に記載の方法。

【請求項9】

処理回路を含む装置であって、
前記処理回路は、請求項１～５のいずれか１項に記載の方法、
を実行するように構成される、装置。

【請求項10】

処理回路を含む装置であって、
前記処理回路は、
符号化ビデオシーケンスの一部である現在ピクチャにおける現在ブロックの予測情報を復号するステップであって、前記現在ブロックの一部は、前記現在ピクチャのピクチャ境界の外側に位置し、前記予測情報が前記現在ブロックのマージモードを示すものである、ステップと、
検査順序に従って、前記現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査するステップであって、前記検査順序における２番目の検査位置が前記同空間位置ブロックの左上隅に隣接して位置する前記符号化ブロックのうちの１つであり、前記同空間位置ブロックが前記現在ブロックの参照ピクチャにある、ステップと、
前記検査された符号化ブロックに基づいて時間動きベクトル予測子（ＴＭＶＰ）を決定するステップと、
前記ＴＭＶＰに基づいて前記現在ブロックを再構築するステップと、
を実行するように構成される、装置。

【請求項11】

少なくとも１つのプロセッサによって実行される場合に、前記少なくとも１つのプロセッサに、請求項１～５のいずれか１項に記載の方法を実行させるコンピュータプログラム。

【請求項12】

少なくとも１つのプロセッサによって実行される場合に、前記少なくとも１つのプロセッサに、
符号化ビデオシーケンスの一部である現在ピクチャにおける現在ブロックの予測情報を復号するステップであって、前記現在ブロックの一部は、前記現在ピクチャのピクチャ境界の外側に位置し、前記予測情報が前記現在ブロックのマージモードを示すものである、ステップと、
検査順序に従って、前記現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査するステップであって、前記検査順序における２番目の検査位置が前記同空間位置ブロックの左上隅に隣接して位置する前記符号化ブロックのうちの１つであり、前記同空間位置ブロックが前記現在ブロックの参照ピクチャにある、ステップと、
前記検査された符号化ブロックに基づいて時間動きベクトル予測子（ＴＭＶＰ）を決定するステップと、
前記ＴＭＶＰに基づいて前記現在ブロックを再構築するステップと、を実行させるコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

［関連出願への相互参照］
本願は、２０１９年３月１５日に提出された、出願番号が６２／８１９５０２であり、発明の名称が「ＴＥＭＰＯＲＡＬＭＶＤＥＲＩＶＡＴＩＯＮＩＮＳＨＡＲＥＤＭＥＲＧＥＲＥＧＩＯＮＡＴＰＩＣＴＵＲＥＢＯＵＮＤＡＲＹ」である米国仮出願に対して優先権を主張する、２０２０年３月１１日に提出された、出願番号が１６／８１５９４０であり、発明の名称が「ＴＥＭＰＯＲＡＬＭＯＴＩＯＮＶＥＣＴＯＲＤＥＲＩＶＡＴＩＯＮＩＮＳＨＡＲＥＤＭＥＲＧＥＲＥＧＩＯＮＡＴＰＩＣＴＵＲＥＢＯＵＮＤＡＲＹ」である米国特許出願に対して優先権を主張する。これらの出願の全ての内容は、参照により本願に組み込むものとする。

【0002】

［技術分野］
本開示は、一般的にビデオ符号化に関する実施形態を記載する。

【背景技術】

【0003】

本明細書で提供される「背景技術」の説明は、本開示の背景を大まかに示すことを目的とする。ここに名を挙げられている発明者の業績は、この背景技術に記載された範囲において、出願時に従来技術として通常見なされえない記載の態様と共に、明示的にも黙示的にも本開示に対する従来技術として認められない。

【0004】

ビデオ符号化および復号は、動き補償を伴うインターピクチャ予測を使用して実行されることができる。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、１９２０×１０８０輝度サンプルと関連する彩度サンプルの空間寸法を持っている。該一連のピクチャは、例えば毎秒６０ピクチャまたは６０Ｈｚの固定または可変ピクチャレート（非公式には「フレームレート」とも呼ぶことができる）を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚフレームレートでの１９２０×１０８０輝度サンプル解像度）には、１．５Ｇｂｉｔ／ｓに近い帯域幅が必要となる。このようなビデオを１時間使用するには、６００ＧＢｙｔｅｓを超えた記憶空間が必要である。

【0005】

ビデオ符号化および復号の１つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶空間の要件を、場合によっては２桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号との間の歪みは、再構築された信号を意図されたアプリケーションに役立てる程度に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ発行アプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能／許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。

【0006】

ビデオエンコーダおよびデコーダは、例えば、動き補償、変換、量子化、およびエントロピー符号化を含むいくつかの幅広いカテゴリからの技法を利用することができる。

【0007】

ビデオコーデック技術は、イントラ符号化として知られる技法を含み得る。イントラ符号化では、サンプル値は、予め再構築された参照ピクチャからのサンプルまたは他のデータを参照せずに表される。一部のビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分される。サンプルのすべてのブロックがイントラモードで符号化されると、そのピクチャはイントラピクチャになる可能性がある。イントラピクチャと、独立したデコーダリフレッシュピクチャなどのその派生物とは、デコーダの状態をリセットするために使用できるため、符号化されたビデオビットストリームとビデオセッションの最初のピクチャとして、または静止画像として使用されることができる。イントラブロックのサンプルは変換にさらされることができ、変換係数はエントロピー符号化の前に量子化されることができる。イントラ予測は、事前変換領域でサンプル値を最小化する技法であり得る。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、エントロピー符号化後のブロックを表すために所定の量子化ステップサイズで必要なビットが少なくなる。

【0008】

例えばＭＰＥＧ－２世代符号化技術から知られているような従来のイントラ符号化は、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、デコード順で先に位置するデータのブロックのエンコード／デコード中に得られた周囲のサンプルデータおよび／またはメタデータからイントラ予測を試みる技法を含む。そのような技法は、以降、「イントラ予測」技法と呼ぶことができる。少なくともいくつかのケースでは、イントラ予測は、再構成中の現在ピクチャからの参照データのみを使用し、参照ピクチャからの参照データを使用しないことに注意されたい。

【0009】

イントラ予測はさまざまな形態で存在し得る。そのような技法の２つ以上が所定のビデオ符号化技術に使用できる場合、使用中の技法はイントラ予測モードで符号化されることができる。場合によっては、モードはサブモードやパラメータを有することができ、それらを個別に符号化するか、もしくはモードコードワードに含めることができる。どのコードワードが所定のモード／サブモード／パラメータの組み合わせに使用されるかは、イントラ予測による符号化効率ゲインに影響を与える可能性があるので、コードワードをビットストリームに変換するために使用されるエントロピー符号化技術にも影響を与える可能性がある。

【0010】

イントラ予測の特定のモードはＨ．２６４で提出され、Ｈ．２６５で改良され、さらに共同探索モデル（ＪＥＭ）、バーサタイルビデオ符号化（ＶＶＣ）、およびベンチマークセット（ＢＭＳ）などのより新しい符号化技術で改良された。予測子ブロックは、すでに利用可能なサンプルに属する隣接サンプル値を使用して形成されることができる。隣接サンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用中の方向への参照は、ビットストリームで符号化されるか、もしくはそれ自体を予測され得る。

【0011】

図１Ａを参照すると、右下に示されているのは、Ｈ．２６５の３３通りの予測可能な方向（３５個のイントラ予測モードのうちの３３個の角度モードに対応）から知られる９通りの予測方向のサブセットである。矢印が収束する点（１０１）は、予測されているサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、水平軸から４５度の角度での右上の１つまたは複数のサンプルから予測されることを示す。同様に、矢印（１０３）は、サンプル（１０１）が、水平軸から２２．５度の角度での、サンプル（１０１）の左下の１つまたは複数のサンプルから予測されることを示す。

【0012】

引き続き図１Ａを参照すると、左上には、４×４サンプルの正方形ブロック（１０４）（太い破線で示されている）が示されている。正方形ブロック（１０４）は、それぞれが、「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、およびＸ次元におけるその位置（例えば、列インデックス）でラベル付けされた１６サンプルを含む。例えば、サンプルＳ２１は、Ｙ次元（上から）における２番目のサンプルかつＸ次元（左から）における１番目のサンプルである。同様に、サンプルＳ４４は、ＹおよびＸ次元の両方においてブロック（１０４）における４番目のサンプルである。ブロックのサイズは４×４サンプルであるから、Ｓ４４は、右下にある。さらに、同様な番号付け体系に従う参照サンプルが示されている。参照サンプルは、Ｒ、ブロック（１０４）に対するそのＹ位置（例えば、行インデックス）およびＸ位置（列インデックス）でラベル付けされる。Ｈ．２６４とＨ．２６５の両方で、予測サンプルは再構築中のブロックに隣接している。したがって、負の値を使用する必要はない。

【0013】

イントラピクチャ予測は、シグナリングされた予測方向で適切な隣接するサンプルから参照サンプル値をコピーすることで機能することができる。例えば、仮に、符号化されたビデオビットストリームは、このブロックについて矢印（１０２）と一致する予測方向（すなわち、サンプルが、水平から４５度の角度での右上の１つまたは複数の予測サンプルから予測される）を示すシグナリングを含むとする。この場合、サンプルＳ４１、Ｓ３２、Ｓ２３、およびＳ１４は同一の参照サンプルＲ０５から予測される。サンプルＳ４４は、参照サンプルＲ０８から予測される。

【0014】

特定の場合において、複数の参照サンプルの値は、参照サンプルを算出するために、特に方向が４５度で均等に分割されていない場合、例えば補間によって組み合わせられることができる。

【0015】

ビデオ符号化技術が発展するにつれて、可能な方向の数は増加した。Ｈ．２６４（２００３年）では、９通りの異なる方向を表すことができた。Ｈ．２６５（２０１３年）で３３通りに増加し、ＪＥＭ／ＶＶＣ／ＢＭＳは開示時に最大６５通りの方向をサポートできる。最も可能性のある方向を識別するための実験が行われ、エントロピー符号化における特定の技法は、数が少ないビットで可能性の高い方向を表すために使用され、可能性の低い方向に対する特定のペナルティを容認する。さらに、方向自体は、隣接する、すでにデコードされたブロックで使用される隣接方向から予測される場合がある。

【0016】

図１Ｂは、経時的な予測方向の増加数を示すために、ＪＥＭによる６５通りのイントラ予測方向を示す概略図（１０５）を示す。

【0017】

方向を表す符号化されたビデオビットストリームにおけるイントラ予測方向ビットのマッピングは、ビデオ符号化技術ごとに異なる可能性があり、また、例えば、イントラ予測モードへ乃至コードワードへの予測方向の単純な直接マッピングから、最も可能性の高いモードや類似した技法を含む複雑な適応方式までの範囲とすることができる。しかしながら、すべての場合において、他の特定の方向よりも統計的にビデオコンテンツにおいて発生する可能性が低い特定の方向が存在する可能性がある。ビデオ圧縮の目的は冗長性の削減であるため、適切に機能するビデオ符号化技術では、これらの可能性の低い方向は、可能性の高い方向よりも多くのビット数で表される。

【0018】

動き補償は、非可逆圧縮技術であり得、予め再構築されたピクチャまたはその一部（参照ピクチャ）からのサンプルデータのブロックを、動きベクトル（以降、「ＭＶ」）によって示される方向に空間的にシフトした後、新しく再構築されたピクチャまたはピクチャ部分の予測に使用する技術に関連し得る。場合によっては、参照ピクチャは現在再構築中のピクチャと同じになることがある。ＭＶは、ＸとＹの２次元、または、第３次元が、使用中の参照ピクチャを示す３次元を持つことができる（後者は間接的に時間次元になることができる）。

【0019】

一部のビデオ圧縮技術では、サンプルデータの特定の領域に適用可能なＭＶは、他のＭＶから、例えば再構築中の領域に空間的に隣接し、デコード順でそのＭＶよりも前であるサンプルデータの別の領域に関連するＭＶから予測されることができる。そうすることで、ＭＶの符号化に必要なデータの量を大幅に減らすことができ、これにより冗長性を取り除き、圧縮を強化する。例えば、カメラから導出される入力ビデオ信号（「ナチュラルビデオ」と呼ぶことができる）を符号化する際に、単一のＭＶが適用される領域より大きい領域が、同様の方向に移動するため、場合によって隣接領域のＭＶから導出された類似の動きベクトルを使用して予測されることができる統計的可能性があるため、ＭＶ予測は有効に働くことができる。その結果、特定の領域に対して検出されたＭＶは、周囲のＭＶから予測されたＭＶと類似または同一であり、逆に、エントロピー符号化後、ＭＶを直接符号化する場合よりも少ないビット数で表されることができる。場合によっては、ＭＶ予測は、元の信号（つまり、「サンプルストリーム」）から導出される信号（つまり、「ＭＶ」）の可逆圧縮の例になってもよい。他の場合では、例えばいくつかの周囲のＭＶから予測子を計算するときの丸め誤差のために、ＭＶ予測自体は非可逆になる可能性がある。

【0020】

Ｈ．２６５／ＨＥＶＣ（ＩＴＵ－Ｔ推奨のＨ．２６５、「高効率ビデオ符号化」、２０１６年１２月）には、様々なＭＶ予測メカニズムが記載されている。Ｈ．２６５が提供する多くのＭＶ予測メカニズムのうち、高度動きベクトル予測（ＡＭＶＰ）モードおよびマージモードについてここで説明される。

【0021】

ＡＭＶＰモードでは、予測残差がさらに符号化されつつ、現在ブロックの空間的および時間的に隣接するブロックの動き情報を用いて、現在ブロックの動き情報を予測することができる。空間的および時間的に隣接する候補の例がそれぞれ図１Ｃと図１Ｄに示されている。２つの候補の動きベクトル予測子リストが形成される。第１の候補予測子は、図１Ｃに示されているように、現在ブロック（１１１）の左下隅に隣接する２つのブロックＡ０（１１２）およびＡ１（１１３）の最初の利用可能な動きベクトルからのものである。第２の候補予測子は、現在ブロック（１１１）の上にある３つのブロックＢ０（１１４）、Ｂ１（１１５）、およびＢ２（１１６）の最初の利用可能な動きベクトルからのものである。チェックされた場所から有効な動きベクトルが見つからない場合、候補はリストに記入されない。２つの利用可能な候補が同じ動き情報を有する場合、１つの候補のみがリストに保持される。リストがいっぱいではない場合、すなわちリストに２つの異なる候補がない場合、図１Ｄに示されているように、参照ピクチャにおける同空間位置ブロック（１２１）の右下隅に隣接するＣ０（１２２）からの時間的同空間位置動きベクトル（スケーリング後）は、別の候補として用いられる。Ｃ０（１２２）位置の動き情報が利用できない場合、その代わりに、参照ピクチャにおける同空間位置ブロックの中心位置Ｃ１（１２３）が用いられる。前記導出では、動きベクトル予測子候補がまだいっぱいではない場合、ゼロ動きベクトルがリストを満たすために用いられる。ｍｖｐ＿１０＿ｆｌａｇとｍｖｐ＿１１＿ｆｌａｇの２つのフラグが、ビットストリームにおいてシグナリングされて、それぞれＭＶ候補リストＬ０とＬ１のＡＭＶＰインデックス（０または１）を示す。

【0022】

インターピクチャ予測のマージモードでは、マージフラグ（スキップフラグを含む）がＴＲＵＥとしてシグナリングされる場合、マージインデックスがシグナリングされて、マージ候補リスト内のどの候補が現在ブロックの動きベクトルを示すために用いられるかを示す。デコーダでは、マージ候補リストが、現在ブロックの空間的および時間的隣接に基づいて構築される。図１Ｃに示されているように、５つの空間的に隣接するブロック（Ａ０～Ｂ２）から導出された最大４つのＭＶがマージ候補リストに追加される。また、図１Ｄに示されているように、参照ピクチャの同空間位置ブロック内の２つの位置（Ｃ０およびＣ１）からの最大１つのＭＶがリストに追加される。追加のマージ候補は、組み合わせられた双予測候補およびゼロ動きベクトル候補などを含む。ブロックの動き情報をマージ候補とする前に、冗長性チェックが行われて、現在マージ候補リスト内の要素と同一であるか否かをチェックする。現在マージ候補リストの各要素とは異なる場合、マージ候補としてマージ候補リストに追加される。ＭａｘＭｅｒｇｅＣａｎｄｓＮｕｍが、候補番号でマージ候補リストのサイズとして定義される。ＨＥＶＣでは、ＭａｘＭｅｒｇｅＣａｎｄｓＮｕｍが、ビットストリームにおいてシグナリングされる。スキップモードが、残差がゼロの特別なマージモードと見なすことができる。

【発明の概要】

【0023】

本開示の態様は、ビデオエンコード／復号のための方法および装置を提供する。一部の例では、ビデオ復号のための装置は、受信回路および処理回路を含む。

【0024】

前記処理回路は、一部が現在ピクチャのピクチャ境界の外側に位置する符号化領域の予測情報を復号する。前記現在ピクチャは、符号化ビデオシーケンスの一部である。前記処理回路は、前記符号化領域に共有マージリストを使用するか否かを決定する。前記処理回路は、前記符号化領域に共有マージリストを使用することに応じて、前記共有マージリストを構築し、前記共有マージリストに基づいて前記符号化領域を再構築する。

【0025】

一実施形態では、前記符号化領域のサイズが第１のサイズ閾値以下である場合、前記符号化領域に前記共有マージリストを使用すると決定する。

【0026】

別の実施形態では、前記符号化領域は、複数の符号化ブロックを含み、（ｉ）前記符号化領域のサイズが第２のサイズ閾値以上であり、かつ（ｉｉ）前記複数の符号化ブロックの１つのブロックサイズが前記第２のサイズ閾値より小さい場合、前記符号化領域に前記共有マージリストを使用すると決定する。

【0027】

前記処理回路は、前記符号化領域の同空間位置領域の中心位置に隣接して位置する第１のブロックを選択することができる。前記同空間位置領域が前記符号化領域の参照ピクチャにある。前記処理回路は、前記第１のブロックが前記現在ピクチャの前記ピクチャ境界の内側に位置し、かつインター予測モードで符号化されたか否かを決定する。前記第１のブロックが前記現在ピクチャの前記ピクチャ境界の内側に位置し、かつ前記インター予測モードで符号化されたと決定された場合、前記処理回路は、前記第１のブロックに基づいて前記共有マージリストを構築する。

【0028】

別の実施形態では、前記処理回路は、前記現在領域の前記同空間位置領域の左上の位置に隣接して位置する第２のブロックを選択する。前記処理回路は、前記第２のブロックがインター予測モードで符号化されたか否かを決定する。前記第２のブロックが前記インター予測モードで符号化されたと決定された場合、前記処理回路は、前記第２のブロックに基づいて前記共有マージリストを構築する。

【0029】

本開示はまた、ビデオ復号のための別の装置を提示する。前記装置は、符号化ビデオシーケンスの一部である現在ピクチャにおける現在ブロックの予測情報を復号する処理回路を含む。前記予測情報は、前記現在ブロックのマージモードを示す。前記処理回路は、検査順序に従って、前記現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査する。前記検査順序における２番目の検査位置が前記同空間位置ブロックの左上隅に隣接して位置する前記符号化ブロックのうちの１つである。前記同空間位置ブロックが前記現在ブロックの参照ピクチャにある。前記処理回路は、前記検査された符号化ブロックに基づいて時間動きベクトル予測子（ＴＭＶＰ）を決定し、前記ＴＭＶＰに基づいて前記現在ブロックを再構築する。

【0030】

一実施形態では、前記処理回路は、前記検査順序に従って前記符号化ブロックのうちの１つを選択し、前記選択された符号化ブロックがインター予測モードで符号化されたか否かを決定する。例えば、前記同空間位置ブロックの前記左上隅に隣接して位置する符号化ブロックは、前記検査順序に従って、前記同空間位置ブロックの右下隅に隣接して位置する符号化ブロックの後に検査することができる。

【0031】

本開示の態様はまた、ビデオ復号のためにコンピュータによって実行されると、前記コンピュータにビデオ復号のための方法の組み合わせのいずれか１つを実行させる命令を記憶する非一時的なコンピュータ可読媒体を提供する。

【0032】

開示された主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになる。

【図面の簡単な説明】

【0033】

【図1A】イントラ予測モードの例示的なサブセットの概略図である。

【0034】

【図1B】例示的なイントラ予測方向の説明図である。

【0035】

【図1C】一例における現在ブロックおよびその周囲の空間マージ候補の概略図である。

【0036】

【図1D】一例における同空間位置ブロックおよび時間的マージ候補の概略図である。

【0037】

【図2】例示的な実施形態に係る通信システムの簡略化されたブロック図の概略図である。

【0038】

【図3】例示的な実施形態に係る通信システムの簡略化されたブロック図の概略図である。

【0039】

【図4】例示的な実施形態に係るデコーダの簡略化されたブロック図の概略図である。

【0040】

【図5】例示的な実施形態に係るエンコーダの簡略化されたブロック図の概略図である。

【0041】

【図6】別の例示的な実施形態に係るエンコーダを示すブロック図である。

【0042】

【図7】別の例示的な実施形態に係るデコーダを示すブロック図である。

【0043】

【図8】本開示の例示的な実施形態に係るマージ共有ノードの４つの例を示す図である。

【0044】

【図9】本開示の例示的な実施形態に係るタイプ１とタイプ２の定義の違いの例を示す図である。

【0045】

【図10】本開示の実施形態に係る同空間位置ブロックおよび時間的マージ候補を示す概略図である。

【0046】

【図11】本開示の実施形態に係る例示的なプロセスの概要を示すフローチャートである。

【0047】

【図12】本開示の別の実施形態に係る例示的なプロセスの概要を示すフローチャートである。

【0048】

【図13】例示的な実施形態に係るコンピュータシステムの概略図である。

【発明を実施するための形態】

【0049】

図２は、本開示の例示的な実施形態における通信システム（２００）の概略ブロック図を示している。通信システム（２００）は、例えばネットワーク（２５０）を介して互いに通信可能な複数の端末装置を含む。例えば、通信システム（２００）は、ネットワーク（２５０）を介して相互接続された第１の対の端末装置（２１０）および（２２０）を含む。図２の例では、第１の対の端末装置（２１０）および（２２０）は、データの単方向送信を実行する。例えば、端末装置（２１０）は、ネットワーク（２５０）を介して他方の端末装置（２２０）へ送信するためにビデオデータ（例えば、端末装置（２１０）によってキャプチャされたビデオピクチャのストリーム）を符号化し得る。エンコードされたビデオデータは、１つ以上の符号化されたビデオビットストリームの形で送信されることができる。端末装置（２２０）は、ネットワーク（２５０）から符号化ビデオデータを受信し、符号化ビデオデータをデコードしてビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。

【0050】

他の例では、通信システム（２００）は、例えば、ビデオ会議中に発生し得る符号化ビデオデータの双方向送信を実行する第２の対の端末装置（２３０）および（２４０）を含む。データの双方向送信の場合、一例では、端末装置（２３０）および（２４０）のそれぞれは、ネットワーク（２５０）を介して端末装置（２３０）および（２４０）のうちの他方の端末装置へ送信するためにビデオデータ（例えば、端末装置によってキャプチャされたビデオピクチャのストリーム）を符号化し得る。端末装置（２３０）および（２４０）の一方は、端末装置（２３０）および（２４０）のうちの他方の端末装置で送信された符号化ビデオデータを受信することができ、符号化ビデオデータをデコードしてビデオピクチャを復元することができ、復元されたビデオデータに従ってビデオピクチャをアクセス可能な表示装置に表示することができる。

【0051】

図２の例では、端末装置（２１０）、（２２０）、（２３０）および（２４０）は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、しかし、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、専用のビデオ会議機器などにおける用途を見出す。ネットワーク（２５０）は、例えば有線および／または無線通信ネットワークを含む、端末装置（２１０）、（２２０）、（２３０）および（２４０）間で符号化ビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（２５０）は、回線交換および／またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび／またはインターネットを含む。本議論の目的のために、ネットワーク（２５０）のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要でないかもしれない。

【0052】

図３は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示している。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、および、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。

【0053】

ストリーミングシステムは、例えば非圧縮のビデオピクチャ（３０２）のストリームを作成するデジタルカメラのようなビデオソース（３０１）を含むことができるキャプチャサブシステム（３１３）を含んでもよい。一例では、ビデオピクチャ（３０２）のストリームは、デジタルカメラによって取得されたサンプルを含む。エンコードされたビデオデータ（３０４）（又は符号化されたビデオビットストリーム）と比較して高データ量を強調するために太線で示されたビデオピクチャ（３０２）のストリームは、ビデオソース（３０１）に結合されたビデオエンコーダ（３０３）を含む電子デバイス（３２０）によって処理されることができる。ビデオエンコーダ（３０３）は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか或いは実施するためのハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ビデオピクチャ（３０２）のストリームと比較してより低いデータ量を強調するために細い線で示された、エンコードされたビデオデータ（３０４）（またはエンコードされたビデオビットストリーム（３０４））は、将来使うためにストリーミングサーバ（３０５）に記憶されることができる。図３のクライアントサブシステム（３０６）および（３０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（３０５）にアクセスして、エンコードされたビデオデータ（３０４）のコピー（３０７）および（３０９）を検索することができる。クライアントサブシステム（３０６）は、例えば、電子デバイス（３３０）におけるビデオデコーダ（３１０）を含むことができる。ビデオデコーダ（３１０）は、エンコードされたビデオデータの入り方向コピー（３０７）をデコードし、ディスプレイ（３１２）（例えば、表示画面）または他のレンダリングデバイス（図示せず）でレンダリングできるビデオピクチャ（３１１）の出方向ストリームを作成する。一部のストリーミングシステムにおいて、エンコードされたビデオデータ（３０４）、（３０７）、および（３０９）（例えば、ビデオビットストリーム）は、特定のビデオ符号化／圧縮規格に従ってエンコードされることができる。これらの規格の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、発展中のビデオ符号化規格は、非公式的にバーサタイルビデオ符号化（ＶＶＣ）として知られている。開示された主題は、ＶＶＣの文脈に使用され得る。

【0054】

なお、電子デバイス（３２０）および（３３０）は、他の構成要素（図示せず）を含むことができる。例えば、電子デバイス（３２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（３３０）は、ビデオエンコーダ（図示せず）を含むこともできる。

【0055】

図４は、本開示の実施形態におけるビデオデコーダ（４１０）のブロック図を示す。ビデオデコーダ（４１０）は、電子デバイス（４３０）に含まれることができる。電子デバイス（４３０）は、受信機（４３１）（例えば、受信回路）を含むことができる。ビデオデコーダ（４１０）は、図３の例におけるビデオデコーダ（３１０）の代わりに使用されることができる。

【0056】

受信機（４３１）は、ビデオデコーダ（４１０）によってデコードされる１つ以上の符号化ビデオシーケンスを受信することができ、同一または別の実施形態では、一度に１つの符号化ビデオシーケンスを受信してもよく、各符号化ビデオシーケンスのデコードは、他の符号化ビデオシーケンスから独立している。符号化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得るチャネル（４０１）から受信されることができる。受信機（４３１）は、それぞれの使用エンティティ（図示せず）に転送され得る他のデータ、例えば、符号化オーディオデータおよび／または補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機（４３１）は、符号化ビデオシーケンスを他のデータから分離することができる。ネットワークジッタを防止するために、バッファメモリ（４１５）は、受信機（４３１）とエントロピーデコーダ／パーサ（４２０）（以降、「パーサ（４２０）」）との間に結合されてもよい。特定のアプリケーションでは、バッファメモリ（４１５）は、ビデオデコーダ（４１０）の一部である。他の場合、バッファメモリ（４１５）は、ビデオデコーダ（４１０）の外部に存在し得る（図示せず）。さらに他の場合、例えば、ネットワークジッタを防止するためにビデオデコーダ（４１０）の外部にバッファメモリ（図示せず）が存在し、さらに、例えば、再生タイミングを取り扱うためにビデオデコーダ（４１０）の内部に別のバッファメモリ（４１５）が存在し得る。受信機（４３１）が十分な帯域幅および可制御性を有する記憶／転送装置から、または等同期ネットワークからデータを受信する際に、バッファメモリ（４１５）は必要とされないことがあり、または小さくされることがある。インターネットのようなベストエフォートパケットネットワークで使用するために、バッファメモリ（４１５）が必要になる場合があり、バッファメモリ（４１５）は、比較的大きいことがあり、有利には適応サイズであることができ、ビデオデコーダ（４１０）の外部のオペレーティングシステムまたは類似の要素（図示せず）で少なくとも部分的に実装され得る。

【0057】

ビデオデコーダ（４１０）は、符号化ビデオシーケンスからシンボル（４２１）を再構築するパーサ（４２０）を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ（４１０）の操作を管理するために使用される情報を含んで、および、電子デバイス（４３０）の不可欠な部分ではないが、図４に示されているように電子デバイス（４３０）に結合され得るレンダリングデバイス（４１２）（例えば、表示画面）のようなレンダリングデバイスを制御する情報を潜在的に含む。レンダリングデバイスのための制御情報は、補助強化情報（ＳＥＩ）メッセージまたはビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（図示せず）の形態であってよい。パーサ（４２０）は、受信された符号化ビデオシーケンスを構文解析／エントロピーデコードすることができる。符号化ビデオシーケンスの符号化は、ビデオ符号化技術または規格に合わせることができ、可変長符号化、ハフマン符号化、文脈感受性を有するもしくは有さない算術符号化などを含む様々な原理に従うことができる。パーサ（４２０）は、グループに対応する少なくとも１つのパラメータに基づいて、符号化ビデオシーケンスからビデオデコーダ内の画素の少なくとも１つのサブグループのためのサブグループパラメータのセットを抽出することができる。サブグループは、グループ・オブ・ピクチャ（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。パーサ（４２０）は、符号化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。

【0058】

パーサ（４２０）は、シンボル（４２１）を作成するために、バッファメモリ（４１５）から受信されたビデオシーケンスに対してエントロピーデコード／構文解析操作を実行することができる。

【0059】

シンボル（４２１）の再構築は、符号化ビデオピクチャまたはその一部のタイプ（例えば、インターおよびイントラピクチャ、インターおよびイントラブロック）、および他の要因に応じて、複数の異なるユニットが関与することができる。どのユニットが、どのように関与するかは、パーサ（４２０）によって符号化ビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（４２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。

【0060】

すでに述べた機能ブロックに加え、ビデオデコーダ（４１０）は、以下で説明されるようにいくつかの機能ユニットに概念的に細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。

【0061】

第１のユニットは、スケーラ／逆変換ユニット（４５１）である。スケーラ／逆変換ユニット（４５１）は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数とを、シンボル（４２１）としてパーサ（４２０）から受信する。スケーラ／逆変換ユニット（４５１）は、アグリゲータ（４５５）に入力可能なサンプル値を含むブロックを出力することができる。

【0062】

場合によっては、スケーラ／逆変換（４５１）の出力サンプルは、イントラ符号化ブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係することがある。このような予測情報は、イントラピクチャ予測ユニット（４５２）によって提供されることができる。場合によっては、イントラピクチャ予測ユニット（４５２）は、現在ピクチャバッファ（４５８）から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。現在ピクチャバッファ（４５８）は、例えば、一部再構築された現在ピクチャおよび／または完全に再構築された現在ピクチャをバッファリングする。アグリゲータ（４５５）は、場合によっては、サンプルごとに、イントラ予測ユニット（４５２）が生成した予測情報を、スケーラ／逆変換ユニット（４５１）によって提供される出力サンプル情報に追加する。

【0063】

他の場合では、スケーラ／逆変換ユニット（４５１）の出力サンプルは、インター符号化された、潜在的に動き補償されたブロックに関係することがある。このような場合、動き補償予測ユニット（４５３）は、参照ピクチャメモリ（４５７）にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル（４２１）に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ（４５５）によってスケーラ／逆変換ユニット（４５１）の出力に追加されることができる（この場合、残差サンプルまたは残差信号と呼ぶことができる）。動き補償予測ユニット（４５３）が予測サンプルを取り出す参照ピクチャメモリ（４５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照ピクチャ成分を有し得るシンボル（４２１）の形態で動き補償予測ユニット（４５３）に利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリ（４５７）から取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。

【0064】

アグリゲータ（４５５）の出力サンプルは、ループフィルタユニット（４５６）において様々なループフィルタリング技法を受けられる。ビデオ圧縮技術は、符号化ビデオシーケンス（符号化されたビデオビットストリームとも呼ぶことができる）に含まれる、パーサ（４２０）からのシンボル（４２１）としてループフィルタユニット（４５６）に利用可能とされたパラメータによって制御されるが、符号化ピクチャまたは符号化ビデオシーケンスの（デコード順で）前の部分のデコード中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできるインループフィルタ技術を含むことができる。

【0065】

ループフィルタユニット（４５６）の出力は、レンダリングデバイス（４１２）へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ（４５７）に記憶されることができるサンプルストリームであり得る。

【0066】

特定の符号化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。例えば、現在ピクチャに対応する符号化ピクチャが完全に再構築され、符号化ピクチャが（例えば、パーサ（４２０）によって）参照ピクチャとして識別されると、現在ピクチャバッファ（４５８）は、参照ピクチャメモリ（４５７）の一部になることができ、次の符号化ピクチャの再構築を開始する前に新しい現在ピクチャバッファを再割当てすることができる。

【0067】

ビデオデコーダ（４１０）は、ＩＴＵ－Ｔ推奨のＨ．２６５のような規格での所定のビデオ圧縮技術に従ってデコード操作を実行することができる。符号化ビデオシーケンスが、ビデオ圧縮技術または規格のシンタックスと、ビデオ圧縮技術または規格で文書化されたプロファイルとの両方に準拠しているという意味で、符号化ビデオシーケンスは、使用されているビデオ圧縮技術または規格によって指定されるシンタックスに準拠し得る。具体的には、プロファイルは、ビデオ圧縮技術または規格で使用可能なすべてのツールから、特定のツールをそのプロファイルで使用できるツールとして選択することができる。符号化ビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート（例えば、１秒あたりのメガサンプルで測定される）、最大参照ピクチャサイズなどがレベルによって制限される。レベルによって設定された制限は、場合によっては、仮想参照デコーダ（ＨＲＤ）仕様および符号化ビデオシーケンスでシグナリングされたＨＲＤバッファ管理のためのメタデータによってさらに制限され得る。

【0068】

一実施形態では、受信機（４３１）は、エンコードされたビデオとともに追加の（冗長な）データを受信することができる。追加のデータは、符号化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、および／または、元のビデオデータをより正確に再構築するためにビデオデコーダ（４１０）によって使用され得る。追加のデータは、例えば、時間的、空間的、または信号対雑音比（ＳＮＲ）エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。

【0069】

図５は、本開示の実施形態におけるビデオエンコーダ（５０３）のブロック図を示す。ビデオエンコーダ（５０３）は、電子デバイス（５２０）に含まれる。電子デバイス（５２０）は、送信機（５４０）（例えば、送信回路）を含む。図３の例におけるビデオエンコーダ（３０３）の代わりにビデオエンコーダ（５０３）を使用することができる。

【0070】

ビデオエンコーダ（５０３）は、ビデオエンコーダ（５０３）によって符号化されるビデオ画像をキャプチャし得るビデオソース（５０１）（図５の例では電子デバイス（５２０）の一部ではない）からビデオサンプルを受信することができる。他の例では、ビデオソース（５０１）は、電子デバイス（５２０）の一部である。

【0071】

ビデオソース（５０１）は、ビデオエンコーダ（５０３）によって符号化されるソースビデオシーケンスを、任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビット、・・・）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、・・・）および任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース（５０１）は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース（５０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて１つ以上のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明ではサンプルを中心に説明する。

【0072】

一実施形態によれば、ビデオエンコーダ（５０３）は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャを符号化し、符号化ビデオシーケンス（５４３）に圧縮することができる。適切な符号化速度を実施することは、コントローラ（５５０）の機能の１つである。一部の実施形態では、コントローラ（５５０）は、以下で説明される他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。分かりやすくするために、結合は示されていない。コントローラ（５５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化、レート歪み最適化技法のラムダ値、・・・）、ピクチャサイズ、グループ・オブ・ピクチャ（ＧＯＰ）レイアウト、最大動きベクトル参照範囲などを含むことができる。コントローラ（５５０）は、特定のシステム設計に対して最適化されたビデオエンコーダ（５０３）に関する他の適切な機能を有するように構成されることができる。

【0073】

一部の実施形態では、ビデオエンコーダ（５０３）は、符号化ループで動作するように構成される。過度に簡略化した説明として、一例では、符号化ループは、ソースコーダ（５３０）（例えば、符号化対象となる入力ピクチャおよび参照ピクチャに基づくシンボルストリームなどのシンボルの作成を担当する）、およびビデオエンコーダ（５０３）に埋め込まれた（ローカル）デコーダ（５３３）を含むことができる。デコーダ（５３３）は、シンボルを再構築して、（リモート）デコーダが作成するのと同様な方法でサンプルデータを作成する（シンボルと符号化されたビデオビットストリームとの間の如何なる圧縮も、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである）。再構築されたサンプルストリーム（サンプルデータ）は参照ピクチャメモリ（５３４）に入力される。シンボルストリームのデコードにより、デコーダの位置（ローカルまたはリモート）に関係なくビット正確な結果が得られるため、参照ピクチャメモリ（５３４）のコンテンツもローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性の該基本原理（および例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト）は、いくつかの関連分野にも使用されている。

【0074】

「ローカル」デコーダ（５３３）の動作は、前文で図４に関連して既に詳細に説明された、ビデオデコーダ（４１０）のような「リモート」デコーダの動作と同様であり得る。しかしながら、図４も簡単に参照すると、シンボルが使用可能であり、エントロピーコーダ（５４５）およびパーサ（４２０）による符号化ビデオシーケンスへのシンボルの符号化／デコードは可逆であり得るので、バッファメモリ（４１５）、およびパーサ（４２０）を含むビデオデコーダ（４１０）のエントロピーデコード部分は、ローカルデコーダ（５３３）では完全に実施されない場合がある。

【0075】

これで分かるように、デコーダに存在する構文解析／エントロピーデコード以外の如何なるデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で必ず存在する必要がある。このため、開示された主題は、デコーダ操作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。

【0076】

操作中、一部の例では、ソースコーダ（５３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の予め符号化されたピクチャを参照して入力ピクチャを予測的に符号化する動き補償予測符号化を実行してもよい。このようにして、符号化エンジン（５３２）は、入力ピクチャの画素ブロックと、入力ピクチャへの予測基準として選択され得る参照ピクチャの画素ブロックとの差異を符号化する。

【0077】

ローカルビデオデコーダ（５３３）は、ソースコーダ（５３０）で作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャの符号化ビデオデータをデコードすることができる。符号化エンジン（５３２）の操作は、有利には非可逆プロセスであり得る。符号化ビデオデータがビデオデコーダ（図５に示されていない）でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ（５３３）は、ビデオデコーダによって参照ピクチャに対して実行され得るデコードプロセスを再現し、再構築された参照ピクチャを参照ピクチャキャッシュ（５３４）に記憶させることができる。このようにして、ビデオエンコーダ（５０３）は、遠端ビデオデコーダによって取得される再構築された参照ピクチャと共通するコンテンツ（送信エラー無し）を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。

【0078】

予測器（５３５）は、符号化エンジン（５３２）の予測検索を実行することができる。つまり、符号化対象となる新しいピクチャについて、予測器（５３５）は、（候補の参照画素ブロックとしての）サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ（５３４）で検索することができる。予測器（５３５）は、適切な予測基準を見つけるために、サンプルブロック／画素ブロックごとに操作することができる。場合によっては、予測器（５３５）で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（５３４）に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。

【0079】

コントローラ（５５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（５３０）の符号化操作を管理することができる。

【0080】

前述のすべての機能ユニットの出力は、エントロピーコーダ（５４５）においてエントロピー符号化を受けられる。エントロピーコーダ（５４５）は、例えば、ハフマン符号化、可変長符号化、算術符号化などの技術に従ってシンボルを可逆圧縮することにより、様々な機能ユニットによって生成されたシンボルを符号化ビデオシーケンスに変換する。

【0081】

送信機（５４０）は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得る通信チャネル（５６０）を介した送信の準備のために、エントロピーコーダ（５４５）によって作成された符号化ビデオシーケンスをバッファリングすることができる。送信機（５４０）は、ビデオコーダ（５０３）からの符号化ビデオデータを、送信されるべき他のデータ、例えば、符号化オーディオデータおよび／または補助データストリーム（ソースは示されていない）とマージすることができる。

【0082】

コントローラ（５５０）は、ビデオエンコーダ（５０３）の操作を管理し得る。符号化中、コントローラ（５５０）は、各符号化ピクチャに特定の符号化ピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得る符号化技法に影響を及ぼし得る。例えば、ピクチャは、多くの場合、次のピクチャタイプのいずれかとして割り当てられ得る。

【0083】

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の他のいかなるピクチャも使用せずに符号化および復号され得るものであり得る。一部のビデオコーデックは、例えば、インディペンデントデコーダリフレッシュ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ、「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャの変形およびそれらのそれぞれの用途および特徴を知っている。

【0084】

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために最大１つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号され得るものであり得る。

【0085】

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号され得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために２つを超えた参照ピクチャおよび関連メタデータを使用することができる。

【0086】

ソースピクチャは、一般に、複数のサンプルブロック（例えば、それぞれ、４×４、８×８、４×８、または１６×１６サンプルのブロック）に空間的に細分され、ブロック単位で符号化され得る。ブロックは、ブロックのそれぞれのピクチャに適用される符号化割り当てによって決定された他の（既に符号化された）ブロックを参照して予測的に符号化され得る。例えば、Ｉピクチャのブロックは、非予測的に符号化されてもよく、或いは、同一のピクチャの既に符号化されたブロック（空間予測またはイントラ予測）を参照して予測的に符号化されてもよい。Ｐピクチャの画素ブロックは、１つの予め符号化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的に符号化され得る。Ｂピクチャのブロックは、１つまたは２つの予め符号化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的に符号化され得る。

【0087】

ビデオエンコーダ（５０３）は、ＩＴＵ－Ｔ推奨のＨ．２６５などの予め設定されたビデオ符号化技術または規格に従って、符号化操作を実行することができる。操作中、ビデオエンコーダ（５０３）は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測符号化操作を含む、様々な圧縮操作を実行することができる。したがって、符号化ビデオデータは、使用されるビデオ符号化技術または規格によって指定されたシンタックスに準拠する場合がある。

【0088】

一実施形態では、送信機（５４０）は、エンコードされたビデオとともに追加のデータを送信することができる。ソースコーダ（５３０）は、このようなデータを符号化ビデオシーケンスの一部として含め得る。追加のデータは、時間的／空間的／ＳＮＲエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含み得る。

【0089】

ビデオは、時系列で複数のソースピクチャ（ビデオピクチャ）としてキャプチャされ得る。イントラピクチャ予測（「イントラ予測」と略されることが多い）は、所定のピクチャにおける空間相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的または他の）相関を利用する。一例では、現在ピクチャと呼ぶことができるエンコード／デコード中の特定のピクチャは、ブロックに分割される。現在ピクチャにおけるブロックが、ビデオにおける予め符号化され、まだバッファリングされている参照ピクチャの参照ブロックに類似している場合、現在ピクチャにおけるブロックは、動きベクトルと呼ぶことができるベクトルによって符号化されることができる。動きベクトルは、参照ピクチャの参照ブロックを指し、複数の参照ピクチャが使用されている場合、参照ピクチャを識別する第３次元を有することができる。

【0090】

一部の実施形態では、インターピクチャ予測において双予測法を使用することができる。双予測法によれば、ビデオにおける現在ピクチャよりもデコード順序がそれぞれ前である（ただし、表示順序でそれぞれ過去および未来にあり得る）第１の参照ピクチャおよび第２の参照ピクチャのような２つの参照ピクチャを使用する。現在ピクチャにおけるブロックは、第１の参照ピクチャにおける第１の参照ブロックを指す第１の動きベクトル、および第２の参照ピクチャにおける第２の参照ブロックを指す第２の動きベクトルによって符号化されることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

【0091】

さらに、マージモード技法をインターピクチャ予測に適用して、符号化効率を向上させることができる。

【0092】

本開示の一部の実施形態によれば、インターピクチャ予測およびイントラピクチャ予測などの予測は、ブロック単位で実行される。例えば、ＨＥＶＣ規格によれば、一連のビデオピクチャにおけるピクチャは、圧縮のために符号化ツリーユニット（ＣＴＵ）に分割され、ピクチャにおけるＣＴＵは、６４×６４画素、３２×３２画素、または１６×１６画素など、同一のサイズを有する。一般に、ＣＴＵは、１つの輝度ＣＴＢと２つの彩度ＣＴＢである３つの符号化ツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つまたは複数の符号化ユニット（ＣＵ）に再帰的に四分木分割されることができる。例えば、６４×６４画素のＣＴＵは、１個の６４×６４画素のＣＵ、４個の３２×３２画素のＣＵ、または１６個の１６×１６画素のＣＵに分割されることができる。一例では、各ＣＵを解析して、インター予測タイプまたはイントラ予測タイプなど、ＣＵの予測タイプを決定する。ＣＵは、時間的および／または空間的予測可能性に応じて、１つ以上の予測ユニット（ＰＵ）に分割される。通常、各ＰＵは、１つの輝度予測ブロック（ＰＢ）と２つの彩度ＰＢとを含む。一実施形態では、符号化（エンコード／デコード）における予測操作は、予測ブロックの単位で実行される。輝度予測ブロックを予測ブロックの例として用いて、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素などの画素の値（例えば、輝度値）の行列を含む。

【0093】

図６は、本開示の他の実施形態におけるビデオエンコーダ（６０３）の図を示す。ビデオエンコーダ（６０３）は、一連のビデオピクチャにおける現在ビデオピクチャにおけるサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックを、符号化ビデオシーケンスの一部である符号化ピクチャにエンコードするように構成される。一例では、図３の例におけるビデオエンコーダ（３０３）の代わりにビデオエンコーダ（６０３）を使用する。

【0094】

ＨＥＶＣの例では、ビデオエンコーダ（６０３）は、８×８サンプルのような予測ブロックなどの処理ブロックのサンプル値の行列を受信する。ビデオエンコーダ（６０３）は、例えばレート歪み最適化を用いて、処理ブロックをイントラモード、インターモード、または双予測モードにより最も良く符号化するか否かを決定する。処理ブロックがイントラモードで符号化されようとする場合、ビデオエンコーダ（６０３）は、イントラ予測法を用いて処理ブロックを符号化ピクチャにエンコードすることができる。また、処理ブロックがインターモードまたは双予測モードで符号化されようとする場合、ビデオエンコーダ（６０３）は、それぞれインター予測または双予測法を用いて、処理ブロックを符号化ピクチャにエンコードすることができる。特定のビデオ符号化技術では、マージモードは、予測子外の符号化動きベクトル成分の恩恵を受けず、１つ以上の動きベクトル予測子から動きベクトルを導出するインターピクチャ予測サブモードであり得る。特定の他のビデオ符号化技術では、対象ブロックに適用可能な動きベクトル成分が存在し得る。一例では、ビデオエンコーダ（６０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）などの他の構成要素を含む。

【0095】

図６の例では、ビデオエンコーダ（６０３）は、図６に示すように互いに結合されたインターエンコーダ（６３０）、イントラエンコーダ（６２２）、残差算出部（６２３）、スイッチ（６２６）、残差エンコーダ（６２４）、統括制御部（６２１）およびエントロピーエンコーダ（６２５）を含む。

【0096】

インターエンコーダ（６３０）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、該ブロックを参照ピクチャにおける１つ以上の参照ブロック（例えば、前のピクチャおよび後のピクチャにおけるブロック）と比較し、インター予測情報（例えば、インターエンコード法による冗長情報の記述、動きベクトル、マージモード情報）を生成し、インター予測情報に基づいて任意の適切な技法を用いてインター予測結果（例えば、予測ブロック）を算出するように構成される。一部の例では、参照ピクチャは、エンコードされたビデオ情報に基づいてデコードされたデコード参照ピクチャである。

【0097】

イントラエンコーダ（６２２）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、場合によっては該ブロックを同一のピクチャで既に符号化されたブロックと比較し、量子化された変換後係数を生成し、場合によってはイントラ予測情報（例えば、１つ以上のイントラエンコード法によるイントラ予測方向情報）をも生成するように構成される。一例では、イントラエンコーダ（６２２）は、イントラ予測情報および同一のピクチャにおける参照ブロックに基づいてイントラ予測結果（例えば、予測ブロック）も算出する。

【0098】

統括制御部（６２１）は、統括制御データを決定し、統括制御データに基づいてビデオエンコーダ（６０３）の他の構成要素を制御するように構成される。一例では、統括制御部（６２１）は、ブロックのモードを決定し、モードに基づいて制御信号をスイッチ（６２６）に提供する。例えば、モードがイントラモードである場合、統括制御部（６２１）は、残差算出部（６２３）が使用するためのイントラモード結果を選択するようにスイッチ（６２６）を制御するとともに、イントラ予測情報を選択してイントラ予測情報をビットストリームに含めるようにエントロピーエンコーダ（６２５）を制御する。また、モードがインターモードである場合、統括制御部（６２１）は、残差算出部（６２３）が使用するためのインター予測結果を選択するようにスイッチ（６２６）を制御するとともに、インター予測情報を選択してインター予測情報をビットストリームに含めるようにエントロピーエンコーダ（６２５）を制御する。

【0099】

残差算出部（６２３）は、受信されたブロックとイントラエンコーダ（６２２）またはインターエンコーダ（６３０）から選択された予測結果との差（残差データ）を算出するように構成される。残差エンコーダ（６２４）は、残差データに基づいて動作し、残差データをエンコードして変換係数を生成するように構成される。一例では、残差エンコーダ（６２４）は、残差データを空間領域から周波数領域へと変換し、変換係数を生成するように構成される。その後、変換係数は量子化処理を受けて、量子化された変換係数が得られる。様々な実施形態では、ビデオエンコーダ（６０３）は、残差デコーダ（６２８）をも含む。残差デコーダ（６２８）は、逆変換を実行し、デコード残差データを生成するように構成される。デコード残差データは、イントラエンコーダ（６２２）およびインターエンコーダ（６３０）によって適切に使用されることができる。例えば、インターエンコーダ（６３０）は、デコード残差データおよびインター予測情報に基づいて、デコードブロックを生成することができ、イントラエンコーダ（６２２）は、デコード残差データおよびイントラ予測情報に基づいて、デコードブロックを生成することができる。一部の例では、デコードブロックは、デコードピクチャを生成するように適切に処理され、デコードピクチャは、メモリ回路（図示せず）にバッファリングされ、参照ピクチャとして使用されることができる。

【0100】

エントロピーエンコーダ（６２５）は、エンコードブロックを含めるようにビットストリームをフォーマットするように構成される。エントロピーエンコーダ（６２５）は、ＨＥＶＣ規格などの適切な規格に従って様々な情報をビットストリームに含めるように構成される。一例では、エントロピーエンコーダ（６２５）は、統括制御データ、選択された予測情報（例えば、イントラ予測情報またはインター予測情報）、残差情報、および他の適切な情報をビットストリームに含めるように構成される。開示された主題によれば、インターモードまたは双予測モードのマージサブモードでブロックを符号化する場合、残差情報はないことに留意されたい。

【0101】

図７は、本開示の他の実施形態におけるビデオデコーダ（７１０）の図を示す。ビデオデコーダ（７１０）は、符号化ビデオシーケンスの一部である符号化ピクチャを受信し、符号化ピクチャをデコードして、再構築ピクチャを生成するように構成される。一例では、図３の例におけるビデオデコーダ（３１０）の代わりにビデオデコーダ（７１０）を使用する。

【0102】

図７の例では、ビデオデコーダ（７１０）は、図７に示されているように互いに結合されたエントロピーデコーダ（７７１）、インターデコーダ（７８０）、残差デコーダ（７７３）、再構築モジュール（７７４）、およびイントラデコーダ（７７２）を含む。

【0103】

エントロピーデコーダ（７７１）は、符号化ピクチャから、符号化ピクチャを構成するシンタックス要素を表す特定のシンボルを再構築するように構成されることができる。このようなシンボルは、例えば、ブロックが符号化されるモード（例えば、イントラモード、インターモード、双予測モード、後の２つのマージサブモードまたは他のサブモード）、それぞれイントラデコーダ（７７２）またはインターデコーダ（７８０）による予測に使用される特定のサンプルまたはメタデータを識別できる予測情報（例えば、イントラ予測情報またはインター予測情報）、例えば、量子化された変換係数の形態での残差情報などを含むことができる。一例では、予測モードがインターまたは双予測モードであれば、インター予測情報は、インターデコーダ（７８０）に提供される。また、予測タイプがイントラ予測タイプであれば、イントラ予測情報は、イントラデコーダ（７７２）に提供される。残差情報は、逆量子化を施されることができ、残差デコーダ（７７３）に提供される。

【0104】

インターデコーダ（７８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

【0105】

イントラデコーダ（７７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

【0106】

残差デコーダ（７７３）は、逆量子化を実行することで、逆量子化された変換係数を抽出し、逆量子化された変換係数を処理して残差を周波数領域から空間領域に変換するように構成される。残差デコーダ（７７３）は、（量子化器パラメータ（ＱＰ）を含めるように）特定の制御情報をも必要とする場合があり、この情報は、エントロピーデコーダ（７７１）によって提供されてもよい（データパスは、低ボリューム制御情報のみであり得るため、示されていない）。

【0107】

再構築モジュール（７７４）は、空間領域において、残差デコーダ（７７３）によって出力された残差と、（場合によってはインターまたはイントラ予測モジュールによって出力される）予測結果とを組み合わせて、再構築ビデオの一部となり得る再構築ピクチャの一部であり得る再構築ブロックを形成するように構成される。なお、視覚的品質を改良するために、デブロッキング操作などの他の適切な操作を実行することができる。

【0108】

なお、ビデオエンコーダ（３０３）、（５０３）および（６０３）とビデオデコーダ（３１０）、（４１０）および（７１０）とは、任意の適切な技法を用いて実施されることができる。一実施形態では、ビデオエンコーダ（３０３）、（５０３）および（６０３）とビデオデコーダ（３１０）、（４１０）および（７１０）とは、１つ以上の集積回路を用いて実施されることができる。他の実施形態では、ビデオエンコーダ（３０３）、（５０３）および（６０３）とビデオデコーダ（３１０）、（４１０）および（７１０）とは、ソフトウェア命令を実行する１つ以上のプロセッサを用いて実施されることができる。

【0109】

一般的に、並列処理は、ビデオコーデックの計算を高速化し、および／またはハードウェアコストを削減するのに役立つことができる。しかしながら、一部の関連技術のマージモードでは、前の符号化ブロックを空間マージ候補として用いて現在ブロックを予測する場合があるので、現在符号化ブロックと前の符号化ブロックを並行して処理することはできない。本開示は、マージモードにおける並列処理を改良する技術を提示する。

【0110】

符号化ユニット（ＣＵ）分割ツリーによれば、符号化ツリーユニット（ＣＴＵ）のような符号化領域は、符号化ブロック（ＣＢ）またはサブブロックのような複数の符号化サブ領域を含むことができる。本願の態様においては、符号化領域が特定の条件を満たす場合、符号化領域に含まれる各符号化サブ領域の間でマージリストを共有することができる。このようなマージリストは、共有マージリストと呼ぶことができる。したがって、符号化領域の祖先ノード、すなわち、符号化サブ領域の親ノードは、マージ共有ノードと呼ぶことができ、マージ共有ノードで、符号化領域の為の共有マージリストが生成される。

【0111】

図８は、本開示の実施形態における、マージ共有ノードの４つの例を示す。各マージ共有ノードは、それぞれ点線の仮想ＣＵ（８０１～８０４）によって示されている。前文に記載したように、符号化領域のマージ共有ノードと見なされるために、符号化領域の祖先ノードは特定の条件を満たす必要があり、例えば、符号化領域のサイズがサイズ閾値以下である条件を満たす場合である。図８の例では、サイズ閾値が６４サンプルに設定されている。したがって、マージ共有ノード（８０１）は、４ｘ４サンプルのブロックを４つ含み、各マージ共有ノード（８０２～８０３）は、４ｘ８サンプルのブロックを２つ含み、マージ共有ノード（８０４）は、４ｘ４サンプルのブロックを２つ、４ｘ８サンプルのブロックを１つ含む。

【0112】

本願の態様においては、マージ共有ノードに２種類の定義（タイプ１およびタイプ２）がある。タイプ１の定義では、祖先ノード（例えば、符号化領域）のサイズが第１のサイズ閾値以下である場合、祖先ノードは、タイプ１のマージ共有ノードと見なすことができる。すなわち、祖先ノードの親ノードのサイズが、第１のサイズ閾値より大きくなければならない。タイプ２の定義では、祖先ノードが次の２つの条件を満たせば、祖先ノードは、タイプ２のマージ共有モードと見なすことができ、当該２つの条件が（１）祖先ノードのサイズが第２のサイズ閾値以上であることと、（２）祖先ノードの複数の子ノードの１つのサイズが、第２のサイズ閾値より小さいこととである。なお、一部の実施形態では、第１のサイズ閾値が第２のサイズ閾値と同じでもよい。

【0113】

本願の態様においては、タイプ１またはタイプ２の定義の使用は、ある実施形態では予測情報に示されてもよく、別の実施形態では事前定義されてもよい。また、ＣＴＵ内の各ＣＵについて、復号プロセスにおける解析段階で、それぞれのマージ共有ノードが決定されてもよい。このルールは、２種類のマージ共有ノードのすべてに適用されてもよい。

【0114】

図９は、本開示の一実施形態におけるタイプ１とタイプ２の定義の違いの例を示す。図９の例では、１２８サンプルのサイズを有する符号化領域（９００）は、３つの子ＣＵ（９０１～９０３）に３分割され、そのうち、２つの子ＣＵ（９０１および９０３）が８ｘ４のサンプルサイズを有し、子ＣＵ（９０２）は８ｘ８のサンプルサイズを有する。タイプ１の定義が符号化領域（９００）に適用され、かつ閾値が６４サンプルに設定された場合、３つの子ＣＵ（９０１～９０３）の何れも、それぞれのマージ共有ノードを有することができる。タイプ２の定義が符号化領域（９００）に適用され、かつ閾値が１２８サンプルに設定された場合、符号化領域（９００）は、１つのマージ共有ノードを有することができ、３つの子ＣＵ（９０１～９０３）は、１つのマージリストを共有することができる。

【0115】

本願の態様においては、共有マージリストは、トランスレーショナルマージモード（例えば、ＨＥＶＣ／ＶＶＣマージモード、トライアングルマージモード、履歴ベースのマージ候補など）とサブブロックベースのマージモード（例えば、アフィンマージモードなど）とに適用することができる。様々なマージモードにおいて、マージ共有ノード自体が子ＣＵと見なされるとすれば、共有マージリストを用いる方法は、共有マージリストがマージ共有ノードで生成されるという点で同様にすることができる。

【0116】

一部の関連技術では、マージ共有ノードがタイプ１であるかタイプ２であるかに関係なく、マージ共有ノードの全てのサンプルは、現在ピクチャのピクチャ境界の内側になければならない。すなわち、祖先ノードのサンプルがピクチャ境界の外側にある場合、この祖先ノードは、タイプ１またはタイプ２のいずれかのマージ共有ノードと見なすことができない。したがって、祖先ノードに複数の子ノードがある場合、マージ共有ノードを決定するために、子ノードの少なくとも１つがチェックされる。

【0117】

本開示は、ピクチャ境界の外側に一部が位置する符号化領域に共有マージリストを適用するための改良技術を提示する。

【0118】

本開示に提示する方法は、別々に用いられてもよく、任意の順序で組み合わせられてもよい。さらに、方法（または実施形態）、エンコーダおよび／またはデコーダのそれぞれは、処理回路（例えば、１つ以上のプロセッサまたは１つ以上の集積回路）によって実施することができる。一例では、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に記憶されるプログラムを実行する。本開示の方法では、ブロックという用語は、予測ブロック、符号化ブロック、または符号化ユニットとして解釈されてもよい。

【0119】

本願の態様においては、符号化領域の一部が現在ピクチャのピクチャ境界の外側に位置する場合も、当該符号化領域に共有マージリストを適用することができる。すなわち、符号化領域がいくつかの特定の要件を満たす場合、当該符号化領域における全てのサブ領域（例えば、ブロックまたはサブブロック）に、共通のマージ候補リストを導出することができる。

【0120】

一実施形態では、符号化領域のサイズが第１のサイズ閾値（例えば、３２または６４サンプル）以下である場合、共有マージリストを当該符号化領域に適用することができる。別の実施形態では、符号化領域のサイズが第２のサイズ閾値以上であり、かつ当該符号化領域の複数の子ＣＵのうちの１つのサイズが第２のサイズ閾値より小さい場合、共有マージリストを当該符号化領域に適用ことができる。なお、第１のサイズ閾値は、第２のサイズ閾値と同じでもよい。

【0121】

本願の態様においては、符号化領域の共有マージリストは、時間動きベクトル予測子（ＴＭＶＰ）を含むことができる。一部の関連技術では、背景技術の部分において既に説明され、そして、図１Ｄに示されているように、ＴＭＶＰは、符号化領域の同空間位置ブロックの右下隅の位置Ｃ０または中心位置Ｃ１のいずれかから導出することができる。同空間位置ブロックは、符号化領域の参照ピクチャ内に位置する。一部の実施形態では、Ｃ０位置からのＴＭＶＰが無効である場合、Ｃ１位置がチェックされる。しかしながら、符号化領域の一部が現在ピクチャのピクチャ境界の外側に位置する場合、同空間位置ブロックのＣ１位置も参照ピクチャのピクチャ境界の外側にある可能性がある。

【0122】

したがって、本開示はさらに、共有マージリストにおけるＴＭＶＰを導出するための改良技術を提示する。一実施形態では、Ｃ１位置からＴＭＶＰを導出する際に、Ｃ１位置からのＭＶがインターモードで符号化されたか否かをチェックすることに加えて、同空間位置ブロックのＣ１位置の存在がチェックされる。

【0123】

別の実施形態では、図１０に示されているように、Ｃ０位置（１００１）からのＴＭＶＰの導出に失敗した場合、Ｃ１位置（１００２）をチェックする代わりに、同空間位置ブロック（１０００）の左上隅に隣接するＣ２位置（１００３）がチェックされる。同空間位置ブロックの左上隅が常にピクチャ境界の内側にあるため、Ｃ２位置の利用可能性チェックは不要である。一方、Ｃ２位置（１００３）の予測モードチェックが依然として適用される。すなわち、Ｃ２位置（１００３）からのＭＶがインター予測で符号化されたか否かを決定する。

【0124】

本願の態様においては、ＴＭＶＰの導出プロセスにおいて、ＴＭＶＰの導出プロセスが共有マージリストに適用されるか否かに関係なく、Ｃ１の位置を、同空間位置ブロックの中心位置から同空間位置ブロックの左上隅に移動させた。すなわち、同空間位置ブロックの右下隅からのＴＭＶＰが無効である場合、一部の実施形態では、同空間位置ブロックの中心位置の代わりに、その左上隅からのＴＭＶＰがチェックされる。

【0125】

図１１は、本開示の一実施形態における例示的なプロセス（１１００）概要を示すフローチャートである。様々な実施形態では、プロセス（１１００）は、端末装置（２１０）、（２２０）、（２３０）および（２４０）の処理回路、ビデオエンコーダ（３０３）の機能を実行する処理回路、ビデオデコーダ（３１０）の機能を実行する処理回路、ビデオデコーダ（４１０）の機能を実行する処理回路、イントラ予測モジュール（４５２）の機能を実行する処理回路、ビデオエンコーダ（５０３）の機能を実行する処理回路、予測器（５３５）の機能を実行する処理回路、イントラエンコーダ（６２２）の機能を実行する処理回路、イントラデコーダ（７７２）の機能を実行する処理回路などの処理回路によって実行される。一部の実施形態では、プロセス（１１００）はソフトウェア命令で実施され、したがって処理回路がソフトウェア命令を実行すると、処理回路はプロセス（１１００）を実行する。

【0126】

プロセス（１１００）は、一般的に、ステップ（Ｓ１１０１）から開始でき、ここで、プロセス（１１００）は、一部が現在ピクチャのピクチャ境界の外側に位置する符号化領域の予測情報を復号する。現在ピクチャは、符号化ビデオシーケンスの一部である。次に、プロセス（１１００）は、ステップ（Ｓ１１０２）に進む。

【0127】

ステップ（Ｓ１１０２）では、プロセス（１１００）は、符号化領域に共有マージリストを使用するか否かを決定する。符号化領域に共有マージリストを使用すると決定された場合、プロセス（１１００）は、ステップ（Ｓ１１０３）に進む。

【0128】

ステップ（Ｓ１１０３）では、プロセス（１１００）は、共有マージリストを構築する。次に、プロセスは、ステップ（Ｓ１１０４）に進む。

【0129】

ステップ（Ｓ１１０４）では、プロセス（１１００）は、共有マージリストに基づいて符号化領域を再構築する。

【0130】

符号化領域を再構築した後、プロセス（１１００）は終了する。

【0131】

一実施形態では、符号化領域のサイズが第１のサイズ閾値以下である場合、符号化領域に共有マージリストを使用すると決定する。

【0132】

別の実施形態では、符号化領域は、複数の符号化ブロックを含み、（ｉ）符号化領域のサイズが第２のサイズ閾値以上であり、かつ（ｉｉ）複数の符号化ブロックの１つのブロックサイズが第２のサイズ閾値より小さい場合、符号化領域に共有マージリストを使用すると決定する。

【0133】

一実施形態では、プロセス（１１００）は、符号化領域の同空間位置領域の中心位置に隣接して位置する第１のブロックを選択する。同空間位置領域は、符号化領域の参照ピクチャにある。次に、プロセス（１１００）は、第１のブロックが現在ピクチャのピクチャ境界の内側に位置し、かつインター予測モードで符号化されたか否かを決定する。第１のブロックが現在ピクチャのピクチャ境界の内側に位置し、かつインター予測モードで符号化されたと決定された場合、プロセス（１１００）は、第１のブロックに基づいて共有マージリストを構築する。

【0134】

別の実施形態では、プロセス（１１００）は、現在領域の同空間位置領域の左上の位置に隣接して位置する第２のブロックを選択する。次に、プロセス（１１００）は、第２のブロックがインター予測モードで符号化されたか否かを決定する。第２のブロックがインター予測モードで符号化された場合、プロセス（１１００）は、第２のブロックに基づいて共有マージリストを構築する。

【0135】

図１２は、本開示の別の実施形態における例示的なプロセス（１２００）の概要を示すフローチャートである。様々な実施形態では、プロセス（１２００）は、端末装置（２１０）、（２２０）、（２３０）および（２４０）の処理回路、ビデオエンコーダ（３０３）の機能を実行する処理回路、ビデオデコーダ（３１０）の機能を実行する処理回路、ビデオデコーダ（４１０）の機能を実行する処理回路、イントラ予測モジュール（４５２）の機能を実行する処理回路、ビデオエンコーダ（５０３）の機能を実行する処理回路、予測器（５３５）の機能を実行する処理回路、イントラエンコーダ（６２２）の機能を実行する処理回路、イントラデコーダ（７７２）の機能を実行する処理回路などの処理回路によって実行される。一部の実施形態では、プロセス（１２００）はソフトウェア命令で実施され、したがって処理回路がソフトウェア命令を実行すると、処理回路はプロセス（１２００）を実行する。

【0136】

プロセス（１２００）は、一般的に、ステップ（Ｓ１２０１）から開始でき、ここで、プロセス（１２００）は、符号化ビデオシーケンスの一部である現在符号化ピクチャにおける現在ブロックの予測情報を復号する。予測情報は、現在ブロックのマージモードを示す。次に、プロセス（１２００）は、ステップ（Ｓ１２０２）に進む。

【0137】

ステップ（Ｓ１２０２）では、プロセス（１２００）は、検査順序に従って、現在ブロックの同空間位置ブロックの複数の符号化ブロックを検査する。検査順序における２番目の検査位置は、同空間位置ブロックの左上隅に隣接して位置する符号化ブロックのうちの１つである。同空間位置ブロックは、現在ブロックの参照ピクチャにある。次に、プロセス（１２００）は、ステップ（Ｓ１２０３）に進む。

【0138】

ステップ（Ｓ１２０３）では、プロセス（１２００）は、検査された符号化ブロックに基づいて時間動きベクトル予測子（ＴＭＶＰ）を決定する。次に、プロセス（１２００）は、ステップ（Ｓ１２０４）に進む。

【0139】

ステップ（Ｓ１２０４）では、プロセス（１２００）は、ＴＭＶＰに基づいて現在ブロックを再構築する。

【0140】

現在ブロックを再構築した後、プロセス（１２００）は終了する。

【0141】

一実施形態では、プロセス（１２００）は、検査順序に従って符号化ブロックのうちの１つを選択し、かつ選択された符号化ブロックがインター予測モードで符号化されたか否かを決定する。選択された符号化ブロックがインター予測モードで符号化されたと決定された場合、プロセス（１２００）は、選択された符号化ブロックからのＴＭＶＰをマージリストに含ませ、かつマージリストに基づいて現在ブロックを再構築する。

【0142】

一実施形態では、同空間位置ブロックの左上隅に隣接して位置する符号化ブロックは、検査順序に従って、同空間位置ブロックの右下隅に隣接して位置する符号化ブロックの後に検査される。

【0143】

以上で説明された技法は、コンピュータ読取可能な命令を使用するコンピュータソフトウェアとして実行され、１つ以上のコンピュータ読取可能な媒体に物理的に記憶されることができる。例えば、図１３は、開示された主題の特定の実施形態を実行することに適したコンピュータシステム（１３００）を示す。

【0144】

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックスプロセッシングユニット（ＧＰＵ）などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いて符号化されることができる。

【0145】

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。

【0146】

コンピュータシステム（１３００）について、図１３に示されている例示的なコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム（１３００）の例示的な実施形態で示されるコンポーネントのうちのいずれか１つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。

【0147】

コンピュータシステム（１３００）は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（キーストローク、スワイプ、データグローブの動きなど）、オーディオ入力（音声、拍手など）、視覚入力（ジェスチャーなど）、嗅覚入力（図示せず）によって、１人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ（音声、音楽、環境音など）、画像（走査画像、静止画像カメラから取得される写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。

【0148】

入力ヒューマンインターフェースデバイスは、キーボード（１３０１）、マウス（１３０２）、トラックパッド（１３０３）、タッチスクリーン（１３１０）、データグローブ（図示せず）、ジョイスティック（１３０５）、マイクフォン（１３０６）、スキャナ（１３０７）、カメラ（１３０８）（それぞれ１つのみ示されている）のうちの１つ以上を含み得る。

【0149】

コンピュータシステム（１３００）は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚／味覚を介して１人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１３１０）、データグローブ（図示せず）、またはジョイスティック（１３０５）による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスでもよい）、オーディオ出力デバイス（スピーカ（１３０９）、ヘッドホン（図示せず）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（１３１０）（それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、２次元の視覚出力または３次元以上の出力を出力することができる）、仮想現実眼鏡（図示せず）、ホログラフィックディスプレおよびスモークタンク（図示せず）など）、およびプリンタ（図示せず）を含み得る。

【0150】

コンピュータシステム（１３００）は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、ＣＤ／ＤＶＤなどの媒体（１３２１）付きのＣＤ／ＤＶＤＲＯＭ／ＲＷ（１３２０）を含む光学媒体、サムドライブ（１３２２）、リムーバブルハードドライブまたはソリッドステートドライブ（１３２３）、テープやフロッピーディスクなどの従来の磁気媒体（図示せず）、セキュリティドングルなどの専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス（図示せず）などをも含むことができる。

【0151】

ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するべきである。

【0152】

コンピュータシステム（１３００）は、１つ以上の通信ネットワークへのインターフェースをさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線ＬＡＮなどのローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、および地上放送ＴＶを含むＴＶ有線または無線広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス（１３４９）（例えば、コンピューターシステム（１３００）のＵＳＢポートなど）に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続することにより、コンピューターシステム（１３００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピューターシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを用いて、コンピュータシステム（１３００）は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ（例えば、放送ＴＶ）、単方向の送信のみ（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。

【0153】

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム（１３００）のコア（１３４０）に接続されることができる。

【0154】

コア（１３４０）は、１つ以上の中央処理装置（ＣＰＵ）（１３４１）、グラフィックスプロセッシングユニット（ＧＰＵ）（１３４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（１３４３）の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１３４４）などを含むことができる。これらのデバイスは、リードオンリメモリ（ＲＯＭ）（１３４５）、ランダムアクセスメモリ（１３４６）、非ユーザアクセス可能な内部ハードドライブ、ＳＳＤなどの内部大容量記憶装置（１３４７）とともに、システムバス（１３４８）を介して接続されてもよい。一部のコンピュータシステムでは、システムバス（１３４８）は、１つ以上の物理プラグの形態でアクセスでき、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にする。周辺機器は、コアのシステムバス（１３４８）に直接、または周辺バス（１３４９）を介して接続されることができる。周辺バスのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

【0155】

ＣＰＵ（１３４１）、ＧＰＵ（１３４２）、ＦＰＧＡ（１３４３）、およびアクセラレータ（１３４４）は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１３４５）またはＲＡＭ（１３４６）に記憶されることができる。推移データはＲＡＭ（１３４６）にも記憶できるが、永続データは、例えば、内部大容量ストレージ（１３４７）に記憶されることができる。１つ以上のＣＰＵ（１３４１）、ＧＰＵ（１３４２）、大容量ストレージ（１３４７）、ＲＯＭ（１３４５）、ＲＡＭ（１３４６）などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。

【0156】

コンピュータ読取可能な媒体は、様々なコンピュータ実施操作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。

【0157】

限定ではなく、一例として、アーキテクチャを有するコンピュータシステム（１３００）、特にコア（１３４０）は、１つ以上の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ（１３４７）またはＲＯＭ（１３４５）などの非一時的な性質を持つコア（１３４０）の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実行するソフトウェアは、このようなデバイスに記憶され、コア（１３４０）によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、１つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（１３４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（１３４６）に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更することを含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路（例えば、アクセラレータ（１３４４））に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。

【0158】

本開示は一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。
付録Ａ：頭字語
ＡＭＶＰ：ＡｄｖａｎｃｅｄＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ（高度動きベクトル予測）
ＡＳＩＣ：Ａｐｐｌｉｃａｔｉｏｎ－ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（特定用途向け集積回路）
ＡＴＭＶＰ：Ａｌｔｅｒｎａｔｉｖｅ／ＡｄｖａｎｃｅｄＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ（代替／高度時間動きベクトル予測）
ＢＭＳ：ＢｅｎｃｈｍａｒｋＳｅｔ（ベンチマークセット）
ＢＶ：ＢｌｏｃｋＶｅｃｔｏｒ（ブロックベクトル）
ＣＡＮＢｕｓ：ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋＢｕｓ（コントローラエリアネットワークバス）
ＣＢ：ＣｏｄｉｎｇＢｌｏｃｋ（符号化ブロック）
ＣＤ：ＣｏｍｐａｃｔＤｉｓｃ（コンパクトディスク）
ＣＰＲ：ＣｕｒｒｅｎｔＰｉｃｔｕｒｅＲｅｆｅｒｅｎｃｉｎｇ（現在ピクチャ参照）
ＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ（中央処理装置）
ＣＲＴ：ＣａｔｈｏｄｅＲａｙＴｕｂｅ（ブラウン管）
ＣＴＢ：ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ（符号化ツリーブロック）
ＣＴＵ：ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ（符号化ツリーユニット）
ＣＵ：ＣｏｄｉｎｇＵｎｉｔ（符号化ユニット）
ＤＰＢ：ＤｅｃｏｄｅｒＰｉｃｔｕｒｅＢｕｆｆｅｒ（デコーダ画像バッファ）
ＤＶＤ：ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ（デジタルビデオディスク）
ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙｓ（フィールドプログラマブルゲートアレイ）
ＧＯＰ：ＧｒｏｕｐｏｆＰｉｃｔｕｒｅｓ（ピクチャ群）
ＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ（グラフィック処理装置）
ＧＳＭ：ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎ（移動通信用グローバルシステム）
ＨＥＶＣ：ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（高効率ビデオ符号化）
ＨＲＤ：ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ（仮想リファレンスデコーダ）
ＩＢＣ：ＩｎｔｒａＢｌｏｃｋＣｏｐｙ（イントラブロックコピー）
ＩＣ：ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（集積回路）
ＪＥＭ：ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ（共同探索モデル）
ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ（ローカルエリアネットワーク）
ＬＣＤ：Ｌｉｑｕｉｄ－ＣｒｙｓｔａｌＤｉｓｐｌａｙ（液晶表示装置）
ＬＴＥ：Ｌｏｎｇ－ＴｅｒｍＥｖｏｌｕｔｉｏｎ（長期的な進化）
ＭＶ：ＭｏｔｉｏｎＶｅｃｔｏｒ（動きベクトル）
ＯＬＥＤ：ＯｒｇａｎｉｃＬｉｇｈｔ－ＥｍｉｔｔｉｎｇＤｉｏｄｅ（有機発光ダイオード）
ＰＢ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ（予測ブロック）
ＰＣＩ：ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ（ペリフェラルコンポーネントインターコネクト）
ＰＬＤ：ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ（プログラマブルロジックデバイス）
ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ（予測ユニット）
ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ（ランダムアクセスメモリ）
ＲＯＭ：Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ（リードオンリメモリ）
ＳＣＣ：ＳｃｒｅｅｎＣｏｎｔｅｎｔＣｏｄｉｎｇ（スクリーンコンテンツ符号化）
ＳＥＩ：ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ（補助強化情報）
ＳＮＲ：ＳｉｇｎａｌＮｏｉｓｅＲａｔｉｏ（信号対雑音比）
ＳＳＤ：Ｓｏｌｉｄ－ｓｔａｔｅＤｒｉｖｅ（ソリッドステートドライブ）
ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ（変換ユニット）
ＵＳＢ：ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ（ユニバーサルシリアルバス）
ＶＵＩ：ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ（ビデオユーザビリティ情報）
ＶＶＣ：ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（多用途ビデオ符号化）

【図1A】