特開2023-99077 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン　バイトダンス　ネットワーク　テクノロジー　カンパニー　リミテッドの特許一覧 ▶ バイトダンス　インコーポレイテッドの特許一覧

特開2023-99077参照ピクチャ再サンプリングのための信号通知

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16A
16B
17
18A
18B
19
20
21A
21B
22
23
24A
24B
24C
24D
24E
24F
24G
24H
24I
24J
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023099077

(43)【公開日】2023-07-11

(54)【発明の名称】参照ピクチャ再サンプリングのための信号通知

(51)【国際特許分類】

H04N 19/132 20140101AFI20230704BHJP

H04N 19/70 20140101ALI20230704BHJP

【ＦＩ】

H04N19/132

H04N19/70

【審査請求】有

【請求項の数】12

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023072497

(22)【出願日】2023-04-26

(62)【分割の表示】P 2021567036の分割

【原出願日】2020-05-12

(31)【優先権主張番号】PCT/CN2019/086513

(32)【優先日】2019-05-12

(33)【優先権主張国・地域又は機関】CN

(71)【出願人】

【識別番号】520476341

【氏名又は名称】北京字節跳動網絡技術有限公司

【氏名又は名称原語表記】ＢｅｉｊｉｎｇＢｙｔｅｄａｎｃｅＮｅｔｗｏｒｋＴｅｃｈｎｏｌｏｇｙＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】ＲｏｏｍＢ－００３５，２／Ｆ，Ｎｏ．３Ｂｕｉｌｄｉｎｇ，Ｎｏ．３０，ＳｈｉｘｉｎｇＲｏａｄ，ＳｈｉｊｉｎｇｓｈａｎＤｉｓｔｒｉｃｔＢｅｉｊｉｎｇ１０００４１Ｃｈｉｎａ

(71)【出願人】

【識別番号】520477474

【氏名又は名称】バイトダンスインコーポレイテッド

【氏名又は名称原語表記】ＢＹＴＥＤＡＮＣＥＩＮＣ．

【住所又は居所原語表記】１２６５５ＷｅｓｔＪｅｆｆｅｒｓｏｎＢｏｕｌｅｖａｒｄ，ＳｉｘｔｈＦｌｏｏｒ，ＳｕｉｔｅＮｏ．１３７ＬｏｓＡｎｇｅｌｅｓ，Ｃａｌｉｆｏｒｎｉａ９００６６ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】110002000

【氏名又は名称】弁理士法人栄光事務所

(72)【発明者】

【氏名】ジャンカイ

(72)【発明者】

【氏名】ジャンリー

(72)【発明者】

【氏名】リウホンビン

(72)【発明者】

【氏名】ワンユエ

(57)【要約】（修正有）

【課題】参照ピクチャの再サンプリングを含む、デジタル映像コーディングのための装置、システム、および方法を提供する。
【解決手段】映像処理方法は、１または複数の映像ユニットを含む１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を行う。ビットストリーム表現は、フォーマット規則に準拠し、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を含み、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが、異なる解像度でコーディングされることの指示が、ヘッダ構文構造、デコーダパラメータセット、映像パラメータセット、ピクチャパラメータセット、シーケンスパラメータセット、および適応パラメータセットとは異なる構文構造のビットストリーム表現に含まれる。
【選択図】図２４Ｅ

【特許請求の範囲】

【請求項1】

映像処理のための方法であって、
１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、前記映像のビットストリーム表現との間の変換を実行することを有し、
前記ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、
Ｋ次の指数ゴロム符号にてコーディングされた前記１または複数の映像ユニットの寸法は、前記ビットストリーム表現にて信号通知され、
Ｋは、正の整数であり、
前記フォーマット規則は、映像セグメントへの前記ＡＲＣ処理の適用を規定し、
前記映像セグメントの前記１または複数の映像ユニットが異なる解像度にてコーディングされていることの指示は、構文構造の前記ビットストリーム表現に含まれる、方法。

【請求項2】

前記寸法は、前記映像ユニットの幅と、前記１または複数の映像ユニットのうちの映像ユニットの高さの少なくとも一方を有する、請求項１に記載の方法。

【請求項3】

前記１または複数の映像ユニットは、ピクチャを有する、請求項１に記載の方法。

【請求項4】

前記構文構造は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、またはタイルグループヘッダである、請求項１に記載の方法。

【請求項5】

前記構文構造は、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）、またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）である、請求項１に記載の方法。

【請求項6】

映像処理のための方法であって、
１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、前記映像のビットストリーム表現との間の変換を実行することを有し、
前記ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、
前記１または複数の映像ユニットのうちの映像ユニットの高さ（Ｈ）および幅（Ｗ）は、前記ビットストリーム表現にて信号通知され、
ＨおよびＷは、正の整数であり、かつ、抑制され、
前記フォーマット規則は、映像セグメントへのＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の適用を規定し、
前記映像セグメントの前記１または複数の映像ユニットが異なる解像度にてコーディングされていることの指示は、構文構造の前記ビットストリーム表現に含まれる、方法。

【請求項7】

Ｗ≦ＴＷ_ｍａｘであり、
ＴＷ_ｍａｘは、正の整数である、請求項６に記載の方法。

【請求項8】

ＴＷ_ｍａｘは、前記ビットストリーム表現にて信号通知される、請求項６に記載の方法。

【請求項9】

ＴＷ_ｍｉｎ≦Ｗであり、
ＴＷ_ｍｉｎは、正の整数である、請求項６に記載の方法。

【請求項10】

ＴＷ_ｍｉｎは、前記ビットストリーム表現にて信号通知される、請求項９に記載の方法。

【請求項11】

Ｈ≦ＴＨ_ｍａｘであり、
ＴＨ_ｍａｘは、正の整数である、請求項６に記載の方法。

【請求項12】

ＴＨ_ｍａｘは、前記ビットストリーム表現にて信号通知される、請求項１１に記載の方法。

【請求項13】

ＴＨ_ｍｉｎ≦Ｈであり、
ＴＨ_ｍｉｎは、正の整数である、請求項６に記載の方法。

【請求項14】

ＴＨ_ｍｉｎは、前記ビットストリーム表現にて信号通知される、請求項１１に記載の方法。

【請求項15】

前記高さＨ＝ｈ×Ｙ、かつ、前記幅Ｗ＝ｗ×Ｘであり、
ｗ、ｈ、Ｘ、およびＹは、正の整数であり、
ｗ、およびｈは、前記ビットストリーム表現にて信号通知される、請求項６に記載の方法。

【請求項16】

Ｘ＝Ｙ＝４である、請求項１５に記載の方法。

【請求項17】

ＸおよびＹは、予め定義された整数である、請求項１５に記載の方法。

【請求項18】

前記１または複数の映像ユニットは、ピクチャを有する、請求項６に記載の方法。

【請求項19】

映像処理のための方法であって、
１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、前記映像のビットストリーム表現との間の変換を実行することを有し、
前記ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、
前記フォーマット規則は、映像セグメントへの前記ＡＲＣ処理の適用を規定し、
前記映像セグメントの前記１または複数の映像ユニットが異なる解像度にてコーディングされていることの指示は、ヘッダ構文構造、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、およびＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）とは異なる構文構造の前記ビットストリーム表現に含まれる、方法。

【請求項20】

前記ＡＲＣ処理に関する前記情報は、前記１または複数の映像ユニットを有するピクチ
ャの高さ（Ｈ）または幅（Ｗ）を有する、請求項１９に記載の方法。

【請求項21】

前記ＡＲＣ処理に関する前記情報は、ＳＥＩ（ＳｕｐｐｌｅｍｅｎｔＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）メッセージにて信号通知される、請求項１９または２０に記載の方法。

【請求項22】

前記ヘッダ構文構造は、ピクチャヘッダ、スライスヘッダ、または、タイルグループヘッダを有する、請求項１９または２０に記載の方法。

【請求項23】

前記ＡＲＣ処理に関する前記情報は、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）、またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）にて信号通知される、請求項１９または２０に記載の方法。

【請求項24】

前記ＡＲＣ処理に関する前記情報は、前記１または複数の映像ユニットを有するピクチャの幅に対する高さの比を有する、請求項１９に記載の方法。

【請求項25】

前記ＡＲＣ処理に関する前記情報は、前記１または複数の映像ユニットを有するピクチャの異なる幅に対する異なる高さの複数の比を有する、請求項１９に記載の方法。

【請求項26】

前記複数の比のうちの許可された比に対応するインデックスは、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）にて信号通知される、請求項２５に記載の方法。

【請求項27】

前記複数の比のうちのいずれかの比は、前記複数の比のうちの他の比とは異なる、請求項２５に記載の方法。

【請求項28】

前記情報は、（ｉ）第１の幅と第２の幅との差、（ｉｉ）第１の高さと第２の高さとの差、（ｉｉｉ）前記第１の幅と前記第２の幅との比、または（ｉｖ）前記第１の高さと前記第２の高さとの比のうちの少なくとも１つを有する、請求項１９に記載の方法。

【請求項29】

前記情報は、ユーナリー符号、トランケイテッドユーナリー符号、または固定長符号にてコーディングされる、請求項２８に記載の方法。

【請求項30】

前記ビットストリーム表現は更に、ＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）サイズを示す構文要素、最小ＣＵ（ＣｏｄｉｎｇＵｎｉｔ）サイズを示す構文要素、最大または最小ＴＢ（ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）サイズを示す構文要素、前記１または複数の映像ユニットに適用可能な分割処理の最大深さを示す構文要素、または、特定のピクチャ解像度にてバインドするように構成される構文要素のうちの少なくとも１つを有する、請求項１９に記載の方法。

【請求項31】

前記１または複数の映像ユニットを有する現在のピクチャに関連付けられた第１の参照ピクチャは、前記現在のピクチャの解像度と等しい第１の解像度を有し、
前記現在のピクチャに関連付けられた第２の参照ピクチャは、前記現在のピクチャの前記解像度よりも大きい第２の解像度を有し、
前記第２の参照ピクチャの参照インデックスは、前記第１の参照ピクチャの参照インデックスよりも大きい、請求項１９に記載の方法。

【請求項32】

前記変換は、前記１または複数の映像ユニットを前記ビットストリーム表現から生成する、請求項１９～３１のいずれか一項に記載の方法。

【請求項33】

前記変換は、前記ビットストリーム表現を前記１または複数の映像ユニットから生成する、請求項１９～３１のいずれか一項に記載の方法。

【請求項34】

プロセッサと、命令を有する非一時的メモリを有する、映像システムにおける装置であって、
前記命令は、前記プロセッサにより実行されることにより前記プロセッサに請求項１９～３３のいずれか一項に記載の方法を実装させる、装置。

【請求項35】

非一時的コンピュータ可読媒体に格納されたコンピュータプログラムプロダクトであって、
請求項１９～３３のいずれか一項に記載の方法を実行するためのプログラムコードを含むコンピュータプログラムプロダクト。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
パリ条約に基づく適用可能な特許法および／または規則に基づいて、本願は、２０１９年５月１２日出願の国際特許出願第ＰＣＴ／ＣＮ２０１９／０８６５１３号の優先権および利益を適時に主張することを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。

【0002】

この特許明細書は、映像コーディング技術、デバイスおよびシステムに関する。

【背景技術】

【0003】

映像圧縮の進歩にもかかわらず、デジタル映像は、依然として、インターネットおよび他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信および表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅の需要は増大し続けることが予測される。

【発明の概要】

【0004】

デジタル映像コーディングに関し、具体的には、映像コーディングのための参照ピクチャ再サンプリングに関するデバイス、システム、および方法に関する。記載された方法は、既存の映像コーディング規格（例えば、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ））および将来の映像コーディング規格またはビデオコーデックの両方に適用されてよい。

【0005】

１つの代表的な態様において、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を行うことを含み、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが、異なる解像度でコーディングされることの指示が、ヘッダ構文構造、ＤＰＳ（ＤｅｃｏｄｅＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、およびＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）とは異なる構文構造のビットストリーム表現に含まれる。

【0006】

別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を行うことを含み、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、Ｋ次の指数ゴロム符号でコーディングされている１または複数の映像ユニットは、ビットストリーム表現で信号通知され、Ｋは正の整数であり、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットの寸法が異なる解像度でコーディングされていることの指示が、構文構造のビットストリーム表現に含まれる。

【0007】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を行うことを含み、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、高さ（Ｈ）と幅（Ｗ）は、ビットストリーム表現にて信号通知され、ＨとＷは、正の整数であり、かつ、抑制され、フォーマット規則は、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされていることの指示が、構文構造のビットストリーム表現に含まれる。

【0008】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、（ａ）映像の現在の映像ブロックの時間的に近傍の第１のブロックの第１の参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度と同一であること、および（ｂ）現在の映像ブロックの時間的に近傍の第２のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と異なること、を判定することと、判定に起因して、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を無効化することによって、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を含む。

【0009】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、（ａ）映像の現在の映像ブロックの時間的に近傍の第１のブロックの第１の参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度と異なること、および（ｂ）現在の映像ブロックの時間的に近傍の第２のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と同一であること、を判定することと、判定に起因して、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を無効化することによって、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を含む。

【0010】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた映像ブロックを有する参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度とは異なることを判定することと、判定に起因して、参照ピクチャの映像ブロックに基づく予測処理を無効化することによって、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することとを含む。

【0011】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、ピクチャの少なくとも１つの寸法に基づいて、ピクチャが現在のピクチャの現在の映像ブロックのための並置された参照ピクチャとして使用することが許可されるかどうかに関する決定を行うことと、決定に基づいて、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することとを含む。

【0012】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、映像の現在の映像ブロックの予測のために、並置されたブロックを有する並置された参照ピクチャの寸法が、現在の映像ブロックを有する現在のピクチャの寸法と同一であることの判定に基づいて、並置されたブロックを識別することと、並置されたブロックを使用して、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することとを含む。

【0013】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた参照ピクチャが、現在の映像ブロックを有する現在のピクチャの解像度とは異なる解像度を有することを判定することと、現在の映像ブロックと映像のビットストリーム表現との間の変換の一部として、参照ピクチャの１または複数の参照サンプル、および現在の映像ブロックに対する動き情報または現在の映像ブロックに対するコーディング情報においてアップサンプリング動作またはダウンサンプリング動作を実行することと、を含む。

【0014】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換のために、現在の映像ブロックを有する現在のピクチャの高さまたは幅が、現在の映像ブロックに関連付けられた並置された参照ピクチャの高さまたは幅とは異なることを判定することと、判定に基づいて、並置された参照ピクチャの１または複数の動きベクトルを格納するバッファにおいてアップサンプリング動作またはダウンサンプリング動作を実行することと、を含む。

【0015】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用されてよい。この方法は、映像の現在の映像ブロックを有する現在のピクチャの寸法と、現在の映像ブロックに関連付けられた並置されたピクチャの寸法に基づいて、現在の映像ブロックに適用されるＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理に関する情報を導出することと、時間的動きベクトルを使用して、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を含む。

【0016】

さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックに対するＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の適用のために、映像のビットストリーム表現を構成することであって、ＡＲＣ処理に関する情報は、ビットストリーム表現にて信号通知され、現在の映像ブロックを有する現在のピクチャは、第１の解像度を有し、ＡＲＣ処理は、第１の解像度とは異なる第２の解像度で現在の映像ブロックの一部分を再サンプリングすることを含む、ことと、構成することに基づいて、現在の映像ブロックと現在の映像ブロックのビットストリーム表現との間の変換を実行することと、を含む。

【0017】

さらに別の代表的な態様において、上記方法は、プロセッサが実行可能なコードの形式で実施され、コンピュータ可読プログラム媒体に記憶される。

【0018】

さらに別の代表的な態様において、上述した方法を行うように構成された、または動作可能なデバイスが開示される。デバイスは、この方法を実装するようにプログラムされたプロセッサを含んでもよい。

【0019】

さらに別の代表的な態様において、映像デコーダ装置は、本明細書で説明されるような方法を実装してもよい。

【0020】

開示される技術の上記および他の態様および特徴は、図面、説明および特許請求の範囲でより詳細に説明される。

【図面の簡単な説明】

【0021】

【図1】異なる解像度でコーディングされた同じコンテンツの２つの表現の適応ストリームの例を示す。

【図2】異なる解像度でコーディングされた同じコンテンツの２つの表現の適応ストリームの別の例を示し、セグメントは、閉ＧＯＰ（ＧｒｏｕｐＯｆＰｉｃｔｕｒｅ）または開ＧＯＰの予測構造のいずれかを使用する。

【図3】２つの表現の開ＧＯＰ予測構造の例を示す。

【図4】開ＧＯＰ位置での表現切り替えの例を示す。

【図5】別のビットストリームからの再サンプリングされた参照ピクチャを、ＲＡＳＬ（ＲａｎｄｏｍＡｃｃｅｓｓＳｋｉｐｐｅｄＬｅａｄｉｎｇ）ピクチャを復号化するための参照として使用する例を示す。

【図6】ＭＣＴＳ（ＭｏｔｉｏｎＣｏｎｓｔｒａｉｎｔｅｄＴｉｌｅＳｅｔ）に基づくＲＷＭＲ（ＲｅｇｉｏｎＷｉｓｅＭｉｘｅｄ－Ｒｅｓｏｌｕｔｉｏｎ）ビューポート依存３６０ストリーミングの例を示す。

【図7】異なるＩＲＡＰ（ＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ）の間隔および異なるサイズの並置されたサブピクチャ表現の例を示す。

【図8】視線の向きの変更がセグメントの始まりに際する解像度の変更を引き起こすときに受信したセグメントの例を示す。

【図9】視線の向きの変更の例を示す。

【図10】２つのサブピクチャ位置のためのサブピクチャ表現の例を示す。

【図11】ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）のためのエンコーダの修正の例を示す。

【図12】ＡＲＣのためのデコーダの修正の例を示す。

【図13】ＡＲＣのためのタイルグループベースの再サンプリングの例を示す。

【図14】ＡＲＣ処理の例を示す。

【図15】コーディングユニットのためのＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）の例を示す。

【図16A】簡略化したアフィン動きモデルの例を示す。

【図16B】簡略化したアフィン動きモデルの例を示す。

【図17】サブブロックごとのアフィンＭＶＦ（ＭｏｔｉｏｎＶｅｃｔｏｒＦｉｅｌｄ）の例を示す。

【図18A】それぞれ４パラメータアフィンモデルおよび６パラメータアフィンモデルの例を示す。

【図18B】それぞれ４パラメータアフィンモデルおよび６パラメータアフィンモデルの例を示す。

【図19】継承されたアフィン候補に対するＡＦ＿ＩＮＴＥＲのＭＶＰ（ＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）の例を示す。

【図20】構築されたアフィン候補に対するＡＦ＿ＩＮＴＥＲのＭＶＰの例を示す。

【図21A】ＡＦ＿ＭＥＲＧＥの候補の例を示す。

【図21B】ＡＦ＿ＭＥＲＧＥの候補の例を示す。

【図22】アフィンマージモードの候補位置の例を示す。

【図23】ＡＲＣを使用してＴＭＶＰ／ＡＴＭＶＰを導出する例を示す。

【図24A】映像処理のための例示的な方法のフローチャートを示す。

【図24B】映像処理のための例示的な方法のフローチャートを示す。

【図24C】映像処理のための例示的な方法のフローチャートを示す。

【図24D】映像処理のための例示的な方法のフローチャートを示す。

【図24E】映像処理のための例示的な方法のフローチャートを示す。

【図24F】映像処理のための例示的な方法のフローチャートを示す。

【図24G】映像処理のための例示的な方法のフローチャートを示す。

【図24H】映像処理のための例示的な方法のフローチャートを示す。

【図24I】映像処理のための例示的な方法のフローチャートを示す。

【図24J】映像処理のための例示的な方法のフローチャートを示す。

【図25】本特許明細書に記載されるビジュアルメディアの復号化またはビジュアルメディアの符号化技術を実装するためのハードウェアプラットフォームの一例を示すブロック図である。

【図26】開示された技術を実装することができる例示的な映像処理システムを示すブロック図である。

【発明を実施するための形態】

【0022】

開示される技術の実施形態は、圧縮性能を向上させるために、既存の映像コーディング規格（例えば、ＨＥＶＣ、Ｈ．２６５）および将来の規格に適用されてもよい。本特許明細書では、説明の可読性を向上させるために章の見出しを使用しており、説明または実施形態（および／または実装形態）をそれぞれの章のみに限定するものではない。

【0023】

１．映像コーディングの導入

【0024】

より高い解像度の映像の需要が増大しているため、近年の技術において、映像コーディング方法および技術は、いたるところに存在している。映像コーデックは、一般的に、デジタル映像を圧縮または展開する電子回路またはソフトウェアを含み、より高いコーディング効率を提供するために絶えず改良されている。映像コーデックは、非圧縮映像を圧縮フォーマットに変換する、またはその逆である。映像の品質、映像を表現するために使用されるデータの数（ビットレートで判定される）、符号化および復号化アルゴリズムの複雑性、データの損失およびエラーに対する敏感さ、編集のしやすさ、ランダムアクセス、およびエンドツーエンドの遅延（待ち時間）の間には複雑な関係がある。圧縮フォーマットは、通常、標準的な映像圧縮仕様、例えば、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）規格（Ｈ．２６５またはＭＰＥＧ－ＨＰａｒｔ２としても知られている）、確立されるべきＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ規格、または他の現在のおよび／または将来の映像コーディング規格に準拠する。

【0025】

映像コーディング規格は、主に周知のＩＴＵ－ＴおよびＩＳＯ／ＩＥＣ規格の開発によって発展してきた。ＩＴＵ－ＴはＨ．２６１とＨ．２６３を作り、ＩＳＯ／ＩＥＣはＭＰＥＧ－１とＭＰＥＧ－４Ｖｉｓｕａｌを作り、両団体はＨ．２６２／ＭＰＥＧ－２ＶｉｄｅｏとＨ．２６４／ＭＰＥＧ－４ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ）とＨ．２６５／ＨＥＶＣ規格を共同で作った。Ｈ．２６２以来、映像コーディング規格は、時間的予測と変換コーディングが利用されるハイブリッド映像コーディング構造に基づく。ＨＥＶＣを超えた将来の映像コーディング技術を探索するため、２０１５年には、ＶＣＥＧとＭＰＥＧが共同でＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）を設立した。それ以来、多くの新しい方法がＪＶＥＴによって採用され、ＪＥＭ（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅ）と呼ばれる参照ソフトウェアに組み込まれてきた。２０１８年４月には、ＶＣＥＧ（Ｑ６／１６）とＩＳＯ／ＩＥＣＪＴＣ１ＳＣ２９／ＷＧ１１（ＭＰＥＧ）の間にＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔＴｅａｍ）が発足し、ＨＥＶＣと比較して５０％のビットレート削減を目標にＶＶＣ規格の策定に取り組んでいる。

【0026】

ＡＶＣおよびＨＥＶＣは、ＩＤＲまたはＩＲＡＰ（ＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ）ピクチャを導入することなく解像度を変更する能力を有しておらず、そのような能力は、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｈａｎｇｅ）とも呼ばれる。以下を含む、ＡＲＣ機能からの恩恵を受けることになる使用事例またはアプリケーションシナリオがある。

【0027】

－テレビ電話および会議におけるレート適応：コーディングされた映像を変化するネットワーク条件に適応させるために、ネットワーク条件が悪化し、利用可能な帯域幅が低下すると、エンコーダは、より解像度の低いピクチャを符号化することでこれに適応してよい。現在、ピクチャの解像度を変更することは、ＩＲＡＰピクチャの後にしか行うことができないため、いくつかの問題がある。妥当な品質のＩＲＡＰピクチャは、インター符号化されたピクチャよりもずっと大きく、それに対応して復号化するのがより複雑となり、これにより時間とリソースがかかる。これは、ローディングの理由でデコーダが解像度の変更を要求した場合に問題となる。また、低遅延バッファ状態を壊し、オーディオを強制的に再同期させ、ストリームのエンドツーエンドの遅延が少なくとも一時的に増加する可能性がある。これにより、ユーザエクスペリアンスが低下する。

【0028】

－マルチパーティビデオ会議におけるアクティブスピーカの変更：マルチパーティによるビデオ会議の場合、アクティブスピーカは、残りの会議参加者の映像よりも大きい映像サイズで示されることが一般的である。アクティブスピーカが変わった場合、各参加者のピクチャ解像度を調整することも必要となり得る。ＡＲＣ機能を有する必要性は、このようなアクティブスピーカの変更が頻繁に発生する場合に、より重要になる。

【0029】

－ストリーミングの高速スタート：ストリーミングアプリケーションの場合、アプリケーションは、表示を開始する前に、復号化されたピクチャの一定の長さをバッファリングすることが一般的である。より小さい解像度でビットストリームを開始することにより、アプリケーションがバッファ内に十分なピクチャを有し、より高速に表示を開始することができるようになる。

【0030】

ストリーミングにおける適応ストリームの切替：ＤＡＳＨ（ＤｙｎａｍｉｃＡｄａｐｔｉｖｅＳｔｒｅａｍｉｎｇｏｖｅｒＨＴＴＰ）仕様は、＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄと呼ばれる特徴を含む。これにより、開ＧＯＰランダムアクセスポイントにおける異なる表現と、復号化不可の先頭ピクチャ、例えば、ＨＥＶＣにおいて関連付けられたＲＡＳＬピクチャを有するＣＲＡピクチャとの間で切り替えることができる。同じ映像の２つの異なる表現は、異なるビットレートを有するが、同じ空間的解像度を有し、＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄの同じ値を有する場合、関連付けられたＲＡＳＬピクチャを有するＣＲＡピクチャで２つの表現の切り替えを行うことができ、ＣＲＡピクチャでの切り替えに関連付けられたＲＡＳＬピクチャは、許容可能な品質で復号化することができるため、シームレスな切り替えを可能にする。ＡＲＣを使用すると、＠ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄ機能は、異なる空間的解像度を有するＤＡＳＨ表現間の切り替えにも利用可能である。

【0031】

ＡＲＣは、動的解像度変換としても知られている。

【0032】

ＡＲＣは、Ｈ．２６３ＡｎｎｅｘＰなどのＲＰＲ（ＲｅｆｅｒｅｎｃｅＰｉｃｔｕｒｅＲｅｓａｍｐｌｉｎｇ）の特殊な場合と見なされてもよい。

【0033】

１．１．Ｈ．２６３ＡｎｎｅｘＰにおける参照ピクチャの再サンプリング

【0034】

このモードは、参照ピクチャを予測に使用する前に、この参照ピクチャをワープするためのアルゴリズムを説明する。それは、予測されるピクチャとは異なるソースフォーマットを有する参照ピクチャを再サンプリングするために有用となり得る。また、参照ピクチャの形状、サイズ、および位置をワープすることにより、グローバルな動き推定、または回転動きの推定に使用されてもよい。構文は、使用されるべきワーピングパラメータおよび再サンプリングアルゴリズムを含む。アップサンプリングおよびダウンサンプリングの処理に対してＦＩＲフィルタのみを適用する必要があるため、参照ピクチャの再サンプリングモードに対する最もシンプルな動作レベルは、暗黙係数が４の再サンプリングである。この場合、（ピクチャヘッダに示された）新しいピクチャのサイズが前のピクチャのサイズと異なる場合にその使用が理解されるため、追加の信号通知のオーバーヘッドは必要ない。

【0035】

１．２．ＡＲＣのＶＶＣへの貢献
１．２．１．ＪＶＥＴ－Ｍ０１３５

【0036】

ＪＣＴＶＣ－Ｆ１５８の一部を除き、以下に述べるＡＲＣの予備設計は、今回の議論のきっかけとなるプレースホルダーとなるべきである。

【0037】

１．２．１．１基本ツールの説明

【0038】

ＡＲＣをサポートするための基本ツールの制約は、以下の通りである。

【0039】

空間的解像度は、両方の寸法に適用された場合、公称解像度とは係数０．５だけ異なってよい。空間的解像度は増加または減少し、０．５および２．０のスケーリング比をもたらし得る。

【0040】

映像フォーマットのアスペクト比および彩度フォーマットは変更されない。

【0041】

クロッピング領域は、空間的解像度に比例してスケーリングされる。

【0042】

参照ピクチャは、必要に応じて簡単に再スケーリングされ、インター予測が従来通りに適用される。

【0043】

１．２．１．２スケーリング動作

【0044】

簡単な、ゼロ位相分離可能なダウンスケーリングフィルタおよびアップスケーリングフィルタを使用することを提案する。なお、これらのフィルタは予測のみのためのものであり、デコーダは、出力のために、より洗練されたスケーリングを使用してよい。

【0045】

ゼロ位相および５つのタップを有する以下の１：２のダウンスケーリングフィルタが使用される。

【0046】

（－１，９，１６，９，－１）／３２

【0047】

ダウンサンプリング点は、偶数個のサンプル位置にあり、かつ、同じ位置にある。輝度および彩度についても同じフィルタが使用される。

【0048】

２：１のアップサンプリングの場合、最新のＶＶＣＷＤにおける１／２画素動き補償補間フィルタ係数を使用して、奇数グリッド位置の追加サンプルが生成される。

【0049】

組み合わされたアップサンプリングおよびダウンサンプリングは、位相、または彩度サンプリング点の位置を変化させない。

【0050】

１．２．１．３パラメータセットにおける解像度記述

【0051】

ＳＰＳにおけるピクチャ解像度の信号通知は、以下のように変更され、本明細書の以下の説明および残りの部分の両方において、二重括弧で囲まれた部分が削除されている（例えば、［［ａ］］は、文字“ａ”の削除を意味する）。

【0052】

シーケンスパラメータセットＲＢＳＰ構文および意味論

【0053】

【表1】

【0054】

［［ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの幅を規定する。ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。

【0055】

ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの高さを規定する。ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。］］

【0056】

ｎｕｍ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１＋１は、コーディングされた映像シーケンスに存在し得る輝度サンプル単位でピクチャサイズ（幅および高さ）の数を規定する。

【0057】

ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、コーディングされた映像シーケンスに存在し得る輝度サンプル単位で復号化されたピクチャのｉ番目の幅を規定する。ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。

【0058】

ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、コーディングされた映像シーケンスに存在し得る輝度サンプル単位で復号化されたピクチャのｉ番目の高さを規定する。ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、０には等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。

【0059】

ピクチャパラメータセットＲＢＳＰ構文および意味論

【0060】

【表2】

【0061】

ｐｉｃ＿ｓｉｚｅ＿ｉｄｘは、シーケンスパラメータセットにおけるｉ番目のピクチャサイズのインデックスを規定する。ピクチャパラメータセットを参照するピクチャの幅は、輝度サンプルにおけるｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ］である。同様に、ピクチャパラメータセットを参照するピクチャの高さは、輝度サンプルにおけるｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ］である。

【0062】

１．２．２．ＪＶＥＴ－Ｍ０２５９
１．２．２．１．背景：サブピクチャ

【0063】

サブピクチャトラックという用語は、ＯＭＡＦ（ＯｍｎｉｄｉｒｅｃｔｉｏｎａｌＭｅｄｉａＦｏｒｍａｔ）において、以下のように定義される。トラックは、他のトラック（複数可）の空間的関係を有し、かつ、コンテンツ制作側で映像符号化する前に空間的サブセットに分割された元の映像コンテンツの空間的サブセットを表す。ＨＥＶＣのためのサブピクチャトラックは、動き制約タイルセットのためのパラメータセットおよびスライスセグメントヘッダを、それが自立型ＨＥＶＣビットストリームになるように書き換えることによって構築することができる。サブピクチャ表現は、サブピクチャトラックを搬送するＤＡＳＨ表現として定義され得る。

【0064】

ＪＶＥＴ－Ｍ０２６１は、ＶＶＣの空間的分割ユニットとしてサブピクチャという用語を使用し、以下のようにまとめた。
１．ピクチャは、サブピクチャ、タイルグループ、およびタイルに分けられる。
２．サブピクチャは、ｔｉｌｅ＿ｇｒｏｕｐ＿ａｄｄｒｅｓｓが０に等しいタイルグループから始まる矩形のタイルグループのセットである。
３．各サブピクチャは、それ自体のＰＰＳを参照してよく、従って、それ自体のタイル分割を有していてよい。
４．サブピクチャは、復号化処理においてピクチャと同様に扱われる。
５．サブピクチャを復号化するための参照ピクチャは、復号化ピクチャバッファにおける参照ピクチャから、現在のサブピクチャと並置される領域を抽出することで生成される。抽出された領域は、復号化されたサブピクチャであり、すなわち、インター予測は、ピクチャ内の同じサイズで同じ位置のサブピクチャ間で行われる。
６．タイルグループは、サブピクチャのタイルラスタスキャンにおけるタイルのシーケンスである。

【0065】

この寄与において、我々は、ＪＶＥＴ－Ｍ０２６１に定義されるような用語サブピクチャを参照する。しかしながら、ＪＶＥＴ－Ｍ０２６１に定義されるようなサブピクチャシーケンスをカプセル化するトラックは、ＯＭＡＦに定義されるサブピクチャトラックと非常に類似した特性を有し、以下に示される例は、いずれの場合も当てはまる。

【0066】

１．２．２．２．ユースケース
１．２．２．２．１．ストリーミングにおける適応的解像度の変更

【0067】

適応ストリーミングのサポートの要件

【0068】

ＭＰＥＧＮ１７０７４の５．１３章（「適応ストリーミングのサポート」）は、ＶＶＣに対して以下の要件を含む。

【0069】

本規格は、それぞれが異なる特性（例えば、空間的解像度またはサンプルビット深度）を有する、同じコンテンツの複数の表現を提供する適応ストリーミングサービスの場合、高速表現切り替えをサポートするものとする。本規格は、異なる空間的解像度などの異なる特性の表現間の高速かつシームレスな表現切り替え能力を損なうことなく、効率的な予測構成（例えば、いわゆるピクチャの開グループ）を使用することを可能にする。

【0070】

表現切り替えを伴う開ＧＯＰ予測構造の例

【0071】

適応ビットレートストリーミングのためのコンテンツ生成は、異なる空間的解像度を有し得る異なる表現の生成を含む。クライアントは、表現にセグメントを要求し、従って、どの解像度およびビットレートでコンテンツが受信されるかを決定することができる。クライアント側では、異なる表現のセグメントを連結し、復号化し、再生する。クライアントは、デコーダインスタンスでシームレスな再生を実現できなければならない。従来、図１に示すように、閉ＧＯＰ構造（ＩＤＲピクチャで始まる）が使用されている。

【0072】

開ＧＯＰ予測構造（ＣＲＡピクチャで始まる）は、それぞれの閉ＧＯＰ予測構造よりも優れた圧縮性能を可能にする。例えば、ＩＲＡＰピクチャ間隔が２４ピクチャである場合、輝度ジョンテガール差分ビットレートの平均ビットレート低減は、５．６％となった。

【0073】

開ＧＯＰ予測構造は、報告によれば、主観的に視認可能な品質のポンピングをも低減する。

【0074】

ストリーミングにおける開ＧＯＰの使用における課題は、表現を切り替えた後、ＲＡＳＬピクチャを正しい参照ピクチャで復号化することができないことである。以下、図２に提示された表現に関連して、この課題を説明する。

【0075】

ＣＲＡピクチャから始まるセグメントは、少なくとも１つの参照ピクチャが前のセグメントにあるＲＡＳＬピクチャを含む。これは、図３に示されており、両方のビットストリームにおけるピクチャ０は、前のセグメントに存在し、ＲＡＳＬピクチャを予測するための基準として使用される。

【0076】

図４には、図２に破線の長方形が付けられた表現切り替えが示されている。ＲＡＳＬピクチャの参照ピクチャ（「ピクチャ０」）は復号化されていないことが分かる。その結果、ＲＡＳＬピクチャは復号化できず、映像の再生にギャップが生じる。

【0077】

しかしながら、本発明の実施形態に基づいて説明したように、再サンプリングした参照ピクチャにてＲＡＳＬピクチャを復号化することは、主観的に許容可能であることが分かった。図５に、「ピクチャ０」を再サンプリングし、ＲＡＳＬピクチャを復号化するための参照ピクチャとして用いることを示す。

【0078】

１．２．２．２．２．ＲＷＭＲ（Ｒｅｇｉｏｎ－ＷｉｓｅＭｉｘｅｄ－Ｒｅｓｏｌｕｔｉｏｎ）３６０°映像ストリーミングにおけるビューポートの変更

【0079】

背景：ＨＥＶＣベースのＲＷＭＲストリーミング

【0080】

ＲＷＭＲ３６０°ストリーミングは、ビューポートの有効空間的解像度を向上させる。ビューポートをカバーするタイルが、６Ｋ（６１４４×３０７２）のＥＲＰピクチャまたは図６に示すように「４Ｋ」の復号化能力（ＨＥＶＣレベル５．１）を有するのと等価なＣＭＰ解像度に由来するスキームは、ＯＭＡＦのＤ．６．３項およびＤ．６．４項に含まれ、かつ、ＶＲ産業協議会の指針にも採用された。このような解像度は、クアッドＨＤ（２５６０×１４４０）ディスプレイパネルを使用したヘッドマウントディスプレイに適していると主張されている。

【0081】

符号化：コンテンツは、それぞれキューブ面サイズ１５３６×１５３６および７６８×７６８の２つの空間的解像度で符号化される。両方のビットストリームにおいて、６×４のタイルグリッドが使用され、各タイル位置に対してＭＣＴＳ（ＭｏｔｉｏｎＣｏｎｓｔｒａｉｎｅｄＴｉｌｅＳｅｔ）がコーディングされる。

【0082】

カプセル化：各ＭＣＴＳシーケンスは、サブピクチャトラックとしてカプセル化され、ＤＡＳＨにおけるサブピクチャ表現として利用可能にされる。

【0083】

ストリーミングされたＭＣＴＳの選択：高解像度ビットストリームから１２個のＭＣＴＳが選択され、低解像度ビットストリームから相補的な１２個のＭＣＴＳが抽出される。よって、ストリーミングされたコンテンツの半球（１８０°×１８０°）は、高解像度ビットストリームに由来する。

【0084】

ＭＣＴＳの復号化されるビットストリームへのマージ：１つの時間インスタンスの受信されたＭＣＴＳは、ＨＥＶＣレベル５．１に準拠する１９２０×４６０８のコーディングされたピクチャにマージされる。マージされたピクチャの別の選択肢は、幅７６８の４つのタイル列、幅３８４の２つのタイル列、および高さ７６８の３つのタイル行の輝度サンプルを有し、３８４０×２３０４の輝度サンプルのピクチャを得ることである。

【0085】

背景：ビューポートに依存する３６０°ストリーミングのための異なるＩＲＡＰ間隔のいくつかの表現

【0086】

ＨＥＶＣベースのビューポートに依存する３６０°のストリーミングにおいて、視線の向きが変化する場合、次のＩＲＡＰに整列されたセグメント境界において、サブピクチャ表現の新たな選択を有効にすることができる。サブピクチャ表現は、復号化のためにコーディングされたピクチャにマージされるので、ＶＣＬＮＡＬユニットタイプは、すべての選択されたサブピクチャ表現において整列される。

【0087】

視線の向きが安定している場合、視線方向の変化に反応する応答時間とレートひずみ性能との間をトレードオフするために、異なるＩＲＡＰ間隔で複数のバージョンのコンテンツをコーディングすることができる。これは、図６に提示された符号化のための、並置された１セットのサブピクチャ表現として図７に示す。

【0088】

図８は、まずサブピクチャの位置が、より低い解像度（３８４×３８４）で受信するように選択される例を提示する。視線の向きを変えることにより、より高い解像度（７６８×７６８）でサブピクチャ位置を新たに選択することができる。この例において、視線の向きの変更は、セグメント４が短ＩＲＡＰ区間のサブピクチャ表現から受信されるように行われる。その後、視線の向きが安定しているので、セグメント５から始まる長ＩＲＡＰ間隔バージョンが使用できる。

【0089】

問題点について

【0090】

典型的な視認状況では、視線の向きが徐々に変化するため、ＲＷＭＲビューポートに依存したストリーミングにおけるサブピクチャ位置のサブセットのみにおいて、解像度が変化する。図９は、図６からわずかに上向きに右側の立方体面に向かって見る向きの変化を示す。前回とは異なる解像度を有するキューブ面分割を「Ｃ」で示す。２４個のキューブ面分割のうち６個のキューブ面分割において、解像度が変化したことがわかる。しかしながら、上述したように、ＩＲＡＰピクチャから始まるセグメントは、視線の向きの変化に呼応して、２４個のキューブ面分割全てについて受信する必要がある。ＩＲＡＰピクチャから始まるセグメントですべてのサブピクチャの位置を更新することは、ストリーミングレートひずみ性能の点で非効率である。

【0091】

さらに、レートひずみ性能を改善し、閉ＧＯＰ予測構造によって引き起こされる可視ピク品質のチャポンピングを回避するために、ＲＷＭＲ３６０°ストリーミングのサブピクチャ表現と共に開ＧＯＰ予測構造を使用できることが望ましい。

【0092】

提案される設計目標

【0093】

以下の設計目標を提案する。

【0094】

１．ＶＶＣ設計は、ランダムアクセスピクチャに由来するサブピクチャと非ランダムアクセスピクチャに由来する別のサブピクチャとを、ＶＶＣに準拠する同じコーディングされたピクチャにマージすることを可能にするべきである。

【0095】

２．ＶＶＣ設計は、サブピクチャ表現を単一のＶＶＣビットストリームにマージすることを可能にしつつ、異なる空間的解像度などの異なる特性のサブピクチャ表現間の高速かつシームレスな表現切り替え能力を損なうことなく、サブピクチャ表現における開ＧＯＰ予測構造の使用を可能にするべきである。

【0096】

設計目標は、２つのサブピクチャ位置のサブピクチャ表現を提示する図１０で説明することができる。両方のサブピクチャ位置に対して、２つの解像度と２つのランダムアクセス間隔との間の各組み合わせに対して、コンテンツの別個のバージョンがコーディングされる。セグメントのいくつかは、開ＧＯＰ予測構造から始まる。視線の向きの変更により、セグメント４の開始時にサブピクチャ位置１の解像度が切り替えられる。セグメント４は、ＲＡＳＬピクチャに関連付けられたＣＲＡピクチャから始まるので、セグメント３にあるＲＡＳＬピクチャのこれらの参照ピクチャを再サンプリングすることが必要である。なお、この再サンプリングはサブピクチャ位置１に適用され、他のサブピクチャ位置の復号化サブピクチャは再サンプリングされない。この例において、視線の向きの変化は、サブピクチャ位置２の解像度を変化させず、従って、サブピクチャ位置２の復号化されたサブピクチャは再サンプリングされない。セグメント４の第１のピクチャにおいて、サブピクチャ位置１のセグメントは、ＣＲＡピクチャに由来するサブピクチャを含み、サブピクチャ位置２のセグメントは、非ランダムアクセスピクチャに由来するサブピクチャを含む。ＶＶＣにおいて、これらのサブピクチャを１つのコーディングされたピクチャにマージすることができるようにすることが提案される。

【0097】

１．２．２．２．３．テレビ会議における適応解像度変更

【0098】

ＪＣＴＶＣ－Ｆ１５８は、主にテレビ会議用の適応解像度変更を提案している。ＪＣＴＶＣ－Ｆ１５８から以下のサブセクションがコピーされ、適応解像度の変更が有用であると主張される使用事例を紹介する。

【0099】

シームレスなネットワーク適応およびエラー耐性

【0100】

ビデオ会議およびパケットネットワークを介したストリーミングなどの適用において、符号化されたストリームは、特にビットレートが高くなり過ぎてデータが失われている場合に、ネットワーク条件の変化に適用することが頻繁に求められている。そのような適用は、一般的に、エンコーダがエラーを検出し、調整を実行できるようにする戻りチャネルを有する。エンコーダには、ビットレートの低減と、時間的または空間的な解像度の変更という２つの主なツールがある。時間的解像度の変更は、階層予測構造を使用したコーディングによって有効に実現することができる。しかしながら、最高品質のために、空間的解像度は、映像通信のためのうまく設計されたエンコーダの一部と同様に、変更が必要である。

【0101】

ＡＶＣ内の空間的解像度を変更するには、ＩＤＲフレームを送信し、ストリームをリセットする必要がある。これは重大な問題を引き起こす。妥当な品質のＩＤＲフレームは、インターピクチャよりもずっと大きく、それに対応して復号化するのがより複雑となり、これにより時間とリソースがかかる。これは、ローディングの理由でデコーダが解像度の変更を要求した場合に問題となる。また、低遅延バッファ状態を壊し、オーディオを強制的に再同期させ、ストリームのエンドツーエンドの遅延が少なくとも一時的に増加する可能性がある。これにより、ユーザエクスペリアンスが低下する。

【0102】

これらの問題を最小限に抑えるために、ＩＤＲは、一般的に、Ｐフレームに類似したビット数を使用して低品質で送信され、所与の解像度の場合、十分な品質に戻るまでにかなりの時間がかかる。十分に低い遅延を得るために、品質は非常に低く、実際には、画像が「リフォーカス」される前に、目に見えるぼやけがあることが多い。実際において、イントラフレームは、圧縮の観点から見て、有用な作業が非常に少なく、ストリームを再スタートさせる方法に過ぎない。

【0103】

そのため、ＨＥＶＣにおいて、主観的な体験への影響を最小限に抑えつつ、特に困難なネットワーク条件において、解像度を変更することができる方法が求められている。

【0104】

高速スタート

【0105】

最初のフレームが低解像度で送信され、次の数フレームにわたって解像度が向上する「高速スタート」モードを有することは、遅延を低減し、開始において受け入れられないほどの画像のぼやけを生じることなく、より迅速に通常の品質にするために有用である。

【0106】

会議「構成」

【0107】

また、テレビ会議は、話している人がフルスクリーンで表示され、他の参加者がより小さい解像度の窓に表示される特徴を有することが多い。これを効率的にサポートするために、小さなピクチャは低い解像度で送信されることが多い。そして、この解像度は、参加者がスピーカになり、フルスクリーンされた場合に高くなる。この時点でイントラフレームを送信すると、映像ストリームにおいて不快なヒックアップを引き起こす。この影響は、スピーカが急速に交互に変わる場合、非常に目立ち、不快になる可能性がある。

【0108】

１．２．２．３．提案される設計目標

【0109】

以下は、ＶＶＣバージョン１のために提案されるハイレベル設計選択肢である。

【0110】

１．以下の使用事例のために、ＶＶＣバージョン１に参照ピクチャ再サンプリング処理を含めることを提案する。

【0111】

－異なる空間的解像度などの異なる特性の表現間の高速かつシームレスな表現切り替え能力を損なうことなく、適応ストリームにおける効率的な予測構造（例えば、いわゆるピクチャの開グループ）を使用すること。

【0112】

－大幅な遅延または遅延の変動を伴わずに、低遅延の会話型映像コンテンツをネットワーク条件およびアプリケーション起源の解像度の変化に適応させること。

【0113】

２．ＶＶＣ設計は、ランダムアクセスピクチャに由来するサブピクチャと非ランダムアクセスピクチャに由来する別のサブピクチャとを、ＶＶＣに準拠する同じコーディングされたピクチャにマージすることを可能にするために提案される。これは、混合品質および混合解像度のビューポート適応型３６０°ストリーミングにおける視線の向きの変化を効率的に処理することを可能にするために主張される。

【0114】

３．ＶＶＣバージョン１において、サブピクチャワイズの再サンプリング処理を含めることを提案する。これは、混合解像度ビューポート適応型３６０°ストリーミングにおける視線の向きの変化をより効率的に処理するための効率的な予測構造を可能にするために主張される。

【0115】

１．２．３．ＪＶＥＴ－Ｎ００４８

【0116】

ＡＲＣ（ＡｄａｐｔｉｖｅｒｅｓｏｌｕｔｉｏｎＣｈａｎｇｉｎｇ）のための使用事例および設計目標は、ＪＶＥＴ－Ｍ０２５９に詳細に記載されている。以下にその概要を示す：

【0117】

１．リアルタイム通信

【0118】

本来、ＪＣＴＶＣ－Ｆ１５８には、適応解像度の変更のための以下の使用事例が含まれていた。

【0119】

ａ．シームレスなネットワーク適応およびエラー耐性（動的適応解像度の変更による）

【0120】

ｂ．高速起動（セッション開始時またはリセット時に徐々に解像度を上げる）

【0121】

ｃ．会議の「構成」（話している人の方に高い解像度を与える）

【0122】

２．適応ストリーミング

【0123】

ＭＰＥＧＮ１７０７４の５．１３章（「適応ストリーミングのサポート」）は、ＶＶＣに対して以下の要件を含む。

【0124】

本規格は、それぞれが異なる特性（例えば、空間的解像度またはサンプルビット深度）を有する、同じコンテンツの複数の表現を提供する適応ストリーミングサービスの場合、高速表現切り替えをサポートする。本規格は、異なる空間的解像度などの異なる特性の表現間の高速かつシームレスな表現切り替え能力を損なうことなく、効率的な予測構造（例えば、いわゆるピクチャの開グループ）を使用することを可能にする。

【0125】

ＪＶＥＴ－Ｍ０２５９は、先頭ピクチャの参照ピクチャを再サンプリングすることで、この要件をどのように満たすかを検討している。

【0126】

３．３６０度ビューポート依存ストリーミング

【0127】

ＪＶＥＴ－Ｍ０２５９は、先頭ピクチャの参照ピクチャの特定の独立してコーディングされたピクチャ領域を再サンプリングすることで、この使用事例にどのように対処するかを検討している。

【0128】

この寄与は、上述したすべての使用事例および設計目標を満たすことを主張する適応解像度コーディングアプローチを提案する。３６０度ビューポートに依存するストリーミングおよび会議「構成」の使用事例は、ＪＶＥＴ－Ｎ００４５（独立したサブピクチャ層を提案する）と共に本提案で取り扱う。

【0129】

提案仕様テキスト

【0130】

信号通知

【0131】

ｓｐｓ＿ｍａｘ＿ｒｐｒ

【0132】

【表3】

【0133】

ｓｐｓ＿ｍａｘ＿ｒｐｒは、ＣＶＳの任意のタイルグループの参照ピクチャリスト０または１の中で、現在のピクチャのｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとそれぞれ等しくないｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓを有するアクティブな参照ピクチャの最大数を規定する。

【0134】

ピクチャの幅と高さ

【0135】

【表4】

【0136】

【表5】

【0137】

ｍａｘ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、このＳＰＳがアクティブになっているＣＶＳの任意のピクチャに対する任意のアクティブなＰＰＳのｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓがｍａｘ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であることが、ビットストリーム適合性の要件であることを規定する。
ｍａｘ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、このＳＰＳがアクティブになっているＣＶＳの任意のピクチャに対する任意のアクティブなＰＰＳのｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓがｍａｘ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であることが、ビットストリーム適合性の要件であることを規定する。

【0138】

高レベル復号化処理

【0139】

復号化処理は、現在のピクチャＣｕｒｒＰｉｃに対して以下のように動作する。
１．ＮＡＬユニットの復号化は８．２項で規定される。
２．８．３項の処理は、タイルグループヘッダ層およびそれより上位の構文要素を使用して、以下の復号化処理を規定する。
－ピクチャオーダカウントに関連する変数および関数は、８．３．１項で規定されるように導出される。これは、ピクチャの第１のタイルグループに対してのみ呼び出す必要がある。
－非ＩＤＲピクチャの各タイルグループに対する復号化処理の最初に、参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ［０］）と参照ピクチャリスト１（ＲｅｆＰｉｃＬｉｓｔ［１］）の導出のために、８．３．２項に規定された参照ピクチャリスト構築のための復号化処理が呼び出される。
－８．３．３項の参照ピクチャマーキングのための復号化処理が呼び出され、参照ピクチャは、「参照のために使用されない」または「長期参照のために使用される」としてマークされてもよい。これは、ピクチャの第１のタイルグループに対してのみ呼び出す必要がある。
－ＲｅｆＰｉｃＬｉｓｔ［０］およびＲｅｆＰｉｃＬｉｓｔ［１］の各アクティブ参照ピクチャのうち、ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓまたはｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓがＣｕｒｒＰｉｃのｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓまたはｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとそれぞれ等しくないものについては、以下のようになる。
－Ｘ．Ｙ．Ｚ項における再サンプリング処理は、入力と同じ参照ピクチャマーキングおよびピクチャオーダカウントを有する出力として呼び出される［Ｅｄ．（ＭＨ）：追加される呼び出しパラメータの詳細］。
－再サンプリング処理の入力として使用された参照ピクチャは、「参照に使用されない」とマークされる。
３．［Ｅｄ．（ＹＫ）：ここで、コーディングツリーユニット、スケーリング、変換、インループフィルタリング等の復号化処理の呼び出しを加える。］
４．現在のピクチャのすべてのタイルグループが復号化された後、現在の復号化されたピクチャは「短期参照に使用される」とマークされる。

【0140】

再サンプリング処理

【0141】

ＳＨＶＣ再サンプリング処理（ＨＥＶＣＨ．８．１．４．２項）に以下を追加することを提案する。
・・・
ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しい場合、ｎ＝０．．７のサンプル値ｔｅｍｐＡｒｒａｙ［ｎ］は、以下のように導出される。
ｔｅｍｐＡｒｒａｙ［ｎ］＝
（ｆＬ［ｘＰｈａｓｅ，０］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ－３），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，１］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ－２），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，２］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ－１），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，３］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，４］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ＋１），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，５］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ＋２），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，６］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ＋３），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，７］＊ｒｌＰｉｃＳａｍｐｌｅＬ［Ｃｌｉｐ３（０，ｒｅｆＷ－１，ｘＲｅｆ＋４），ｙＰｏｓＲＬ］）＞＞ｓｈｉｆｔ１（Ｈ－３８）
そうでない場合、ｎ＝０．．７のサンプル値ｔｅｍｐＡｒｒａｙ［ｎ］は、以下のように導出される。
ｒｅｆＯｆｆｓｅｔ＝（ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｏｆｆｓｅｔ＿ｍｉｎｕｓ１＋１）＊ＭｉｎＣｂＳｉｚｅＹ
ｔｅｍｐＡｒｒａｙ［ｎ］＝
（ｆＬ［ｘＰｈａｓｅ，０］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ－３），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，１］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ－２），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，２］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ－１），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，３］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，４］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ＋１），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，５］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ＋２），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，６］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ＋３），ｙＰｏｓＲＬ］＋
ｆＬ［ｘＰｈａｓｅ，７］＊ｒｌＰｉｃＳａｍｐｌｅＬ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷ，ｘＲｅｆ＋４），ｙＰｏｓＲＬ］）
＞＞ｓｈｉｆｔ１
・・・
ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しい場合、ｎ＝０．．３のサンプル値ｔｅｍｐＡｒｒａｙ［ｎ］は、以下のように導出される。
ｔｅｍｐＡｒｒａｙ［ｎ］＝（ｆＣ［ｘＰｈａｓｅ，０］＊ｒｌＰｉｃＳａｍｐｌｅＣ［Ｃｌｉｐ３（０，ｒｅｆＷＣ－１，ｘＲｅｆ－１），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，１］＊ｒｌＰｉｃＳａｍｐｌｅＣ［Ｃｌｉｐ３（０，ｒｅｆＷＣ－１，ｘＲｅｆ），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，２］＊ｒｌＰｉｃＳａｍｐｌｅＣ［Ｃｌｉｐ３（０，ｒｅｆＷＣ－１，ｘＲｅｆ＋１），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，３］＊ｒｌＰｉｃＳａｍｐｌｅＣ［Ｃｌｉｐ３（０，ｒｅｆＷＣ－１，ｘＲｅｆ＋２），ｙＰｏｓＲＬ］）＞＞ｓｈｉｆｔ１（Ｈ－５０）
そうでない場合、ｎ＝０．．３のサンプル値ｔｅｍｐＡｒｒａｙ［ｎ］は、以下のように導出される。
ｒｅｆＯｆｆｓｅｔ＝（ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｏｆｆｓｅｔ＿ｍｉｎｕｓ１＋１）＊ＭｉｎＣｂＳｉｚｅＹ）／ＳｕｂＷｉｄｔｈＣ
ｔｅｍｐＡｒｒａｙ［ｎ］＝
（ｆＣ［ｘＰｈａｓｅ，０］＊ｒｌＰｉｃＳａｍｐｌｅＣ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷＣ，ｘＲｅｆ－１），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，１］＊ｒｌＰｉｃＳａｍｐｌｅＣ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷＣ，ｘＲｅｆ），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，２］＊ｒｌＰｉｃＳａｍｐｌｅＣ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷＣ，ｘＲｅｆ＋１），ｙＰｏｓＲＬ］＋
ｆＣ［ｘＰｈａｓｅ，３］＊ｒｌＰｉｃＳａｍｐｌｅＣ［ＣｌｉｐＨ（ｒｅｆＯｆｆｓｅｔ，ｒｅｆＷＣ，ｘＲｅｆ＋２），ｙＰｏｓＲＬ］）
＞＞ｓｈｉｆｔ１

【0142】

１．２．４．ＪＶＥＴ－Ｎ００５２

【0143】

映像圧縮規格における概念としての適応型の解像度の変更は、少なくとも１９９６年あたりから行われており、特に、Ｈ．２６３＋に関連した提案が、参照ピクチャ再サンプリング（ＲＰＲ，ＡｎｎｅｘＰ）および低解像度更新（ＡｎｎｅｘＱ）に対して行われている。最初はＪＣＴ－ＶＣの時代にＣｉｓｃｏ社が提案したもので、次にＶＰ９のコンテキストで（現在は適度に広く展開されている）、そして最近ではＶＶＣのコンテキストで、一定の注目を集めるようになった。ＡＲＣは、所与のピクチャに対してコーディングされることが必要とされるサンプルの数を低減でき、所望される場合、結果として得られる参照ピクチャをより高い解像度にアップサンプリングできる。

【0144】

以下の２つのシナリオにおいて、ＡＲＣが特に興味深いと考える。
１）ＩＤＲピクチャのようなイントラ符号化ピクチャは、インターピクチャよりもかなり大きいことが多い。イントラ符号化されることが意図されたピクチャをダウンサンプリングすることは、理由にかかわらず、将来の予測のためのよりよい入力を提供することができる。それはまた、少なくとも低遅延の適用において、レート制御の観点からも明らかに有利である。
２）少なくとも一部のケーブルや衛星放送事業者が日常的に行っているように、コーデックを限界近くまで運用する場合、ＡＲＣはイントラ符号化されたピクチャではない映像でも、困難な遷移点のないシーン遷移などで便利な機能となる。
３）少し先の話になるが、固定解像度という概念は一般的に支持されるのだろうか？ＣＲＴがなくなり、レンダリングデバイスにスケーリングエンジンが普及したことで、レンダリングとコーディングの解像度のハードな縛りは過去のものとなった。また、当方は、映像シーケンスの中で多くの動作が行われている場合、たとえその動作が空間的に別の場所で行われていたとしても、多くの人は（おそらく高解像度に関連した）細かい部分に集中することができないことを示唆する利用可能な研究結果があることにも留意している。それが事実であり、一般的に受け入れられている場合、細かい粒度の解像度の変更は、適応ＱＰよりも優れたレート制御メカニズムとなり得る。当方は、この点を今回の議論に取り上げた。なぜなら、当業者からのデータ－フィードバックが得られていないからである。もちろん、固定解像度のビットストリームという概念をなくすことは、無数のシステム層や実装上の影響があることは、（その詳細な性質はわからないまでも、少なくともその存在のレベルを）認識している。

【0145】

技術的には、ＡＲＣは参照ピクチャの再サンプリングとして実装することができる。参照ピクチャの再サンプリングを実装するには、再サンプリングフィルタと、ビットストリームにおける再サンプリング情報の信号通知という２つの大きな態様がある。本明細書では、後者に焦点を当て、前者については当社の実装経験の範囲内でのみ触れている。適切なフィルタ設計の更なる研究が望まれる

【0146】

既存のＡＲＣ実装形態の概要

【0147】

図１１および図１２は、既存のＡＲＣエンコーダ／デコーダの実装形態をそれぞれ示す。本発明の実装形態において、ピクチャのタイプにかかわらず、ピクチャの粒度でピクチャの幅および高さを変更することが可能である。エンコーダにおいて、入力画像データを、現在のピクチャ符号化のために選択されたピクチャサイズにダウンサンプリングする。最初の入力ピクチャをイントラピクチャとして符号化した後、復号化されたピクチャをＤＰＢ（ＤｅｃｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ）に記憶する。後続のピクチャを異なるサンプリング比でダウンサンプリングし、インターピクチャとして符号化する場合、ＤＰＢにおける参照ピクチャは、参照のピクチャサイズと現在のピクチャサイズとの間の空間的比率に従ってアップスケール／ダウンスケールされる。デコーダにおいて、復号化されたピクチャは再サンプリングされずにＤＰＢに記憶される。しかしながら、ＤＰＢにおける参照ピクチャは、動き補償のために使用される場合、現在の復号化ピクチャと参照との間の空間的比率に対してアップスケール／ダウンスケールされる。復号化されたピクチャは、表示のためにバンプアウトされる時に、元のピクチャサイズまたは所望の出力ピクチャサイズにアップサンプリングされる。動き推定／補償処理において、動きベクトルは、ピクチャサイズ比およびピクチャオーダカウントの差との関連でスケーリングされる。

【0148】

ＡＲＣパラメータの信号通知

【0149】

ＡＲＣパラメータという用語は、本明細書では、ＡＲＣを動作させるために必要な任意のパラメータの組み合わせとして使用される。最も簡単な場合、それはズーム係数であってもよいし、または定義されたズーム係数を有する表へのインデックスであってもよい。これは、オブジェクト解像度（例えば、サンプルまたは最大ＣＵサイズ粒度での）であってもよいし、またはＪＶＥＴ－Ｍ０１３５に提案されているように、オブジェクト解像度を提供する表へのインデックスであってもよい。また、使用されるアップ／ダウンサンプリングフィルタのフィルタセレクタまたはフィルタパラメータ（フィルタ係数まで）も含まれる。

【0150】

最初から、当方は、少なくとも概念的に、ピクチャの異なる部分に対して異なるＡＲＣパラメータを許可することを提案している。当方は、現在のＶＶＣ草案に基づく適切な構文構造は、長方形のＴＧ（ＴｉｌｅＧｒｏｕｐ）であることを提案する。スキャン順序のＴＧを使っている人たちは、ＡＲＣの使用がフルピクチャのみに制限されるか、スキャン順序のＴＧが長方形のＴＧに含まれる範囲に制限されることになる（これまでＴＧのネスティングが議論された記憶はなく、もしかしたら悪しきアイデアかもしれない）。これは、ビットストリーム制約によって容易に規定することができる。

【0151】

異なるＴＧは異なるＡＲＣパラメータを持つ可能性があるため、ＡＲＣパラメータの適切な場所は、ＴＧヘッダの中かＴＧの範囲があるパラメータセットの中のどちらかであり、ＴＧヘッダ、すなわち、現在のＶＶＣ草案での適応パラメータセット、または上位のパラメータセットの表へのより詳細な参照（インデックス）により参照される。これら３つの選択肢のうち、現時点では、ＴＧヘッダを使用してＡＲＣパラメータを含む表のエントリへの参照をコーディングすることを提案するもので、その表をＳＰＳに配置し、表の最大値を（来るべき）ＤＰＳにおいてコーディングする。パラメータセットの値を使用せずに、ＴＧヘッダに直接ズーム係数をコーディングすることの受け入れも可能である。ＪＶＥＴ－Ｍ０１３５で提案されているように、ＰＰＳを参照に使用することは、当方のようにＡＲＣパラメータのタイルグループごとの信号通知を設計基準としている場合には、逆に好ましくない。

【0152】

表のエントリそのものに関して、以下のような多くの選択肢がある。
●ダウンサンプル係数のコーディングは、寸法のいずれか一方または両方であるか、またはＸおよびＹの寸法において独立して行うか？これはほとんど（ＨＷの）実装に関する議論であり、Ｘ寸法のズーム係数はかなり柔軟性があるが、Ｙ寸法のズーム係数は１に固定されているか、または選択肢が非常に少ない選択を好む者もいるであろう。当方は、構文がこのような制約を表現するには場違いであると提言し、もし制約が望ましいのであれば、適合性の要件として制約が表現される方を好む。言い換えれば、構文をフレキシブルに保つ。
●コーディング対象の解像度。これについて、当方は下記のように提案する。現在の解像度に関連して、これらの解像度には多かれ少なかれ複雑な制約が存在し得、おそらくビットストリーム適合性で表される。
●ピクチャの組み立て／抽出を可能にするために、タイルグループごとのダウンサンプリングが好ましい。しかしながら、それは信号通知の観点から重要ではない。グループがＡＲＣをピクチャの粒度でのみ許可するという賢明でない決定をしていた場合、当方は、常に、すべてのＴＧが同じＡＲＣパラメータを使用するというビットストリーム適合性の要件を含めることができる。
●ＡＲＣに関する情報の制御。以下の発明者らの設計には、参照ピクチャサイズを含む。
●フィルタの設計に柔軟性を持たせる必要があるのか？一握りのコードポイントより大きいものはあるか？ある場合、それらをＡＰＳに入れるか？（いいえ、再度のＡＰＳ更新の議論はしないでください。ダウンサンプルフィルタが変化し、ＡＬＦが維持される場合、ビットストリームはオーバーヘッドを受け入れなければならないと、当方は提案する。

【0153】

今回、提案された技術を（可能な限り）一貫したシンプルなものにするために、以下を提案する。
●固定フィルタの設計
●ＳＰＳ内の表に表示されたターゲットの解像度、ビットストリームの制約ＴＢＤ
●キャップの交換／交渉を容易にするためのＤＰＳの最小／最大のターゲット解像度

【0154】

結果として得られる構文は、以下のように確認できる。

【0155】

デコーダパラメータセットＲＢＳＰ構文

【0156】

【表6】

【0157】

ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ビットストリームの輝度サンプル単位で復号化されたピクチャの最大の幅を規定する。ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］の値は、ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値よりも大きくすることはできない。
ｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で復号化されたピクチャの最大の高さを規定する。ｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍でなければならない。ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］の値は、ｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値よりも大きくすることはできない。

【0158】

シーケンスパラメータセットＲＢＳＰ構文

【0159】

【表7】

【0160】

１に等しいａｄａｐｔｉｖｅ＿ｐｉｃ＿ｒｅｓｏｌｕｔｉｏｎ＿ｃｈａｎｇｅ＿ｆｌａｇは、出力ピクチャサイズ（ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）、復号化されたピクチャサイズの数の指示（ｎｕｍ＿ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１）、少なくとも１つの復号化されたピクチャサイズ（ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］、ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］）がＳＰＳに存在することを規定する。参照ピクチャサイズ（ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）は、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｓｉｚｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値を条件に存在する。
ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で出力ピクチャの幅を規定する。ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは０に等しくない。
ｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で出力ピクチャの高さを規定する。ｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは０に等しくない。
１に等しいｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｓｉｚｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓが存在することを規定する。
ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で参照ピクチャの幅を規定する。ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは０に等しくない。存在しない場合、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓと等しいと推測される。
ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で参照ピクチャの高さを規定する。ｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは０に等しくない。存在しない場合、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓと等しいと推測される。

【0161】

注１－出力ピクチャのサイズは、ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値と等しい。参照ピクチャのサイズは、参照ピクチャが動き補償に使用される場合、ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよび＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値と等しい。
ｎｕｍ＿ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１＋１は、符号化された映像シーケンスにおいて、輝度サンプル単位で復号化されたピクチャサイズ（ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］、ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］）の数を規定する。
ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、符号化された映像シーケンスにおいて、輝度サンプルの単位で復号化されたピクチャサイズのｉ番目の幅を規定する。ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、０に等しくなく、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。
ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、符号化された映像シーケンスにおいて、輝度サンプル単位で復号化されたピクチャサイズのｉ番目の幅を規定する。ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］は、０に等しくなく、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。

【0162】

注２－ｉ番目の復号化ピクチャサイズ（ｄｅｃ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］、ｄｅｃ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｉ］）は、符号化された映像シーケンスの復号化されたピクチャサイズと等しくてもよい。

【0163】

タイルグループヘッダ構文

【0164】

【表8】

【0165】

ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘは、復号化されたピクチャの幅がｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ］と等しく、かつ、復号化されたピクチャの高さがｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ［ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ］と等しくなることを規定する。

【0166】

フィルタ

【0167】

提案された設計は、概念的には、４つの異なるフィルタセット、即ち、元のピクチャから入力ピクチャへのダウンサンプリングフィルタ、動き推定／補償のための参照ピクチャを再スケーリングするためのアップ／ダウンサンプリングフィルタ、および、復号化ピクチャから出力ピクチャへのアップサンプリングフィルタ、を含む。最初および最後のものは、非標準的なものとして排除されてもよい。本明細書の範囲内で、アップ／ダウンサンプリングフィルタは、適切なパラメータセットにおいて明示的に信号通知されるか、または予め定義される必要がある。

【0168】

本実装形態は、動き補償に使用される参照ピクチャをリサイズするためにダウンサンプリングを行うための、１２タップおよび２Ｄ分離可能フィルタである、ＳＨＶＣ（ＳＨＭ第１２．４版）のダウンサンプリングフィルタを使用する。現在の実装形態において、２進サンプリングのみがサポートされる。そのため、デフォルトでは、ダウンサンプリングフィルタの位相をゼロに設定する。アップサンプリングの場合、１６位相を有する８タップ補間フィルタが使用され、位相をシフトさせ、輝度および彩度画素の位置を元の位置に合わせる。

【0169】

表１および表２は、輝度アップサンプリング処理に使用されるｐ＝０．．１５およびｘ＝０．．７の８タップフィルタ係数ｆＬ［ｐ，ｘ］と、彩度アップサンプリング処理に使用されるｐ＝０．．１５およびｘ＝０．．３の４タップフィルタ係数ｆＣ［ｐ，ｘ］とを示す。

【0170】

表３は、ダウンサンプリング処理における１２タップのフィルタ係数を示す。同じフィルタ係数が、ダウンサンプリングのために輝度および彩度の両方に使用される。

【0171】

表１．１６位相を有する輝度アップサンプリングフィルタ

【0172】

【表9】

【0173】

表２．１６位相を有する彩度アップサンプリングフィルタ

【0174】

【表10】

【0175】

表３．輝度および彩度のためのダウンサンプリングフィルタ係数

【0176】

【表11】

【0177】

当方は、他のフィルタ設計について実験していない。コンテンツおよび／またはスケーリング係数に適応可能なフィルタを使用する場合、（おそらく有意な）主観的および客観的な利得が期待され得るものと予想する。

【0178】

タイルグループ境界の議論について

【0179】

タイルグループに関連した多くの作業におそらく当てはまるので、本実装形態は、ＴＧ（ＴｉｌｅＧｒｏｕｐ）ベースのＡＲＣに関しては、あまり完成されていない。当方は、圧縮ドメインにおいて、複数のサブピクチャの圧縮されたピクチャへの空間的な組み合わせや抽出に関する議論が、少なくとも作業草案を作成した後に、この実装形態を再検討したいと考えている。しかしながら、それは、私たちが結果をある程度外挿することを妨げず、そして私たちの信号通知の設計をそれに応じて適応させることを妨げない。

【0180】

ここで、既に述べた理由により、タイルグループヘッダは、上述したようにｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘのようなもののための正しい場所であると考える。使用されるＡＲＣパラメータを示すために、タイルグループヘッダに条件付きで存在する単一のｕｅ（ｖ）コードポイントｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘを使用する。ピクチャごとだけのＡＲＣである本実装形態に合わせるためには、今すぐにでも仕様の空きにてやるべきことは、単一のタイルグループのみをコーディングするか、または、所与のコーディングされたピクチャのすべてのＴＧヘッダがｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘの値が同じであること（存在する場合）をビットストリームコンプライアンスの条件とすることである。

【0181】

パラメータｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘは、サブピクチャを開始するいかなるヘッダの中へも移動可能である。今のところ、タイルグループヘッダが継続して存在するのではないかと当方は考える。

【0182】

これらの構文上の考慮を超えて、タイルグループまたはサブピクチャベースのＡＲＣを可能にするために、いくつかの追加の作業が必要である。おそらく最も困難な部分は、サブピクチャをより低いサイズに再サンプリングした場合、ピクチャにおける不要なサンプルの問題にどのように対処するかである。

【0183】

４つのサブピクチャ（ビットストリーム構文では、おそらく４つの長方形のタイルグループとして表現される）で構成されている図１３の右側の部分を考える。左側に向かって、右下のＴＧをサイズの半分にサブサンプリングする。「ハーフ」と記された該当する区域外のサンプルについて、どのように対処するか？

【0184】

既存の映像コーディング規格の中には、共通して、圧縮ドメインにおけるピクチャの一部の空間的抽出がサポートされていないものがある。これは、ピクチャの各サンプルが１または複数の構文要素によって表現され、各構文要素が少なくとも１つのサンプルに影響を与えることを意味する。この状態を維持したいのであれば、ダウンサンプリングされたＴＧでカバーされているサンプルの周辺に「ハーフ」というラベルを付けて、何らかの形で追加投入する必要がある。Ｈ．２６３＋ＡｎｎｅｘＰは、この問題をパディングによって解決した。実際、パディングされたサンプルのサンプル値は、ビットストリームにおいて（ある厳しい制限内で）信号通知されてもよい。

【0185】

これまでの想定から大きく外れるかもしれないが、ピクチャの矩形部分に基づいてサブビットストリームの抽出（および組み合わせ）をサポートしたい場合には、いずれにしても必要となる可能性がある代替案は、（たとえその何かが、スキップされたブロックであっても）、再構成されたピクチャの各サンプルがコーディングされたピクチャの何かで表現されなければならないという現在の理解を緩和することになる。

【0186】

実装上の考慮事項、システムへの影響、プロファイル／レベル

【0187】

当方は、「ベースライン／メイン」プロファイルに含めるべき基本的なＡＲＣを提案する。特定の適用シナリオに必要でない場合、サブプロファイリングを使用してそれらを除去してもよい。特定の制限を許容可能としてもよい。この点については、あるＨ．２６３＋のプロファイルや（プロファイルよりも前に作られた）「推奨モード」には、ＡｎｎｅｘＰを「４の暗黙係数」、すなわち、両方の寸法での２進ダウンサンプリングとしてのみ使用するという制限が含まれていることに、当方は留意している。テレビ会議における高速スタート（Ｉフレームを迅速に取得する）をサポートするのにそれで十分であった。

【0188】

その設計は、すべてのフィルタリングを「オンザフライ」で行うことができ、メモリの帯域幅の増加が全くない、またはごくわずかであると考えられる。その限りで、ＡＲＣをエキゾチックプロファイルに加える必要はない。

【0189】

マラケシュでＪＶＥＴ－Ｍ０１３５に関連して主張されたように、複雑な表などがケイパビリティ・エクスチェンジに有意義に使用できるとは考えていない。オファー・アンサーや同様の限定されたハンドシェイクを想定した場合、意味のあるクロスベンダーの相互運用を可能にするには、単純にオプションの数が多すぎる。現実的には、ケイパビリティ・エクスチェンジのシナリオで意味のある方法でＡＲＣをサポートするためには、せいぜい一握りのインターロップポイントに頼らざるを得ない。例えば、ＡＲＣなし、４の暗黙係数のＡＲＣ、フルＡＲＣなど。別の方法として、すべてのＡＲＣに必要なサポートを仕様化し、ビットストリームの複雑性の制限を上位レベルのＳＤＯに任せることもできる。これはいずれにしても、（サブプロファイリングやフラグコンテキストですでに行ったことを超えて）戦略的な議論をする必要がある。

【0190】

レベルについては、ビットストリーム適合性の条件として、ビットストリームでどれだけアップサンプリングが信号通知されていても、アップサンプリングされたピクチャのサンプル数はビットストリームのレベルに収まらなければならず、また、すべてのサンプルはアップサンプリングされたコーディングされたピクチャに収まらなければならないという基本的な設計原則が必要だと考える。なお、Ｈ２６３＋ではこのようなことはなく、特定のサンプルが存在しない可能性があった。

【0191】

１．２．５．ＪＶＥＴ－Ｎ０１１８

【0192】

以下の態様が提案される。
１）ピクチャの解像度のリストがＳＰＳで信号通知され、リストのインデックスがＰＰＳで信号通知され、個々のピクチャサイズが指定される。
２）出力されるピクチャについては、再サンプリング前の復号化されたピクチャが（必要に応じて）クロップし、出力され、つまり、再サンプリングされたピクチャは出力用ではなく、インター予測の参照用にのみ使用される。
３）１．５ｘおよび２ｘの再サンプリング率をサポート。任意の再サンプリング率をサポートしない。さらに、他の１、２種類の再サンプリング率の必要性を検討する。
４）ピクチャレベルの再サンプリングとブロックレベルの再サンプリングでは、ブロックレベルの再サンプリングの方が支持されている。
ａ．しかしながら、ピクチャレベルの再サンプリングを選択する場合、以下の態様が提案される。
ｉ．参照ピクチャを再サンプリングするとき、再サンプリングされたバージョンの参照ピクチャと元の再サンプリングされたバージョンの参照ピクチャとの両方がＤＰＢに記憶され、したがって、両方がＤＰＢのフルネスに影響を及ぼす。
ｉｉ．対応する再サンプリングされていない参照ピクチャが「参照のために使用されない」とマークされている場合、再サンプリングされた参照ピクチャは、「参照のために使用されない」とマークされる。
ｉｉｉ．ＲＰＬ信号通知構文は変更されず、ＲＰＬ構築処理は以下のように修正される。参照ピクチャをＲＰＬエントリに含めることが必要であり、かつ、現在のピクチャと同じ解像度を有するその参照ピクチャのバージョンがＤＰＢに含まれていない場合、ピクチャ再サンプリング処理が呼び出され、かつ、その参照ピクチャの再サンプリングされたバージョンがＲＰＬエントリに含まれる。
ｉｖ．ＤＰＢに存在し得る再サンプリングされた参照ピクチャの数は、例えば、２以下となるように制限される。
ｂ．そうでない場合（ブロックレベルの再サンプリングが選択される）、以下が提案される。
ｉ．最悪の場合のデコーダの複雑性を制限するために、現在のピクチャとは異なる解像度の参照ピクチャからのブロックの双方向予測が許可されないことを提案する。
ｉｉ．別の選択肢は、再サンプリングおよび１／４画素補間を行う必要がある場合、２つのフィルタを組み合わせ、この動作を直ちに適用することである。
５）ピクチャベースの再サンプリングアプローチとブロックベースの再サンプリングアプローチのどちらを選択するかに関わらず、必要に応じて時間的動きベクトルのスケーリングを適用することを提案する。

【0193】

１．２．５．１．実装

【0194】

ＡＲＣソフトウェアは、ＶＴＭ－４．０．１の上に実装され、以下のように変更された。
－サポートされている解像度のリストがＳＰＳにて信号通知される。
－空間的解像度信号通知は、ＳＰＳからＰＰＳに移された。
－参照ピクチャを再サンプリングするために、ピクチャベースの再サンプリングスキームを実装した。ピクチャが復号化された後、再構成されたピクチャが異なる空間的解像度に再サンプリングされてよい。元の再構成ピクチャおよび再サンプリングされた再構成ピクチャは、両方ともＤＰＢに記憶され、復号化の順序に将来のピクチャによって参照のために利用可能である。
－実装された再サンプリングフィルタは、ＪＣＴＶＣ－Ｈ０２３４で試験されたフィルタに基づいており、以下のように行われる。
ｏアップサンプリングフィルタ：タップ（－４，５４，１６，－２）／６４を有する、４タップ＋／－１／４位相ＤＣＴＩＦ
ｏダウンサンプリングフィルタ：タップ（１，０，－３，０，１０，１６，１０，０，－３，０，１）／３２を有する、ｈ１１フィルタ
－現在のピクチャの参照ピクチャリスト（即ち、Ｌ０およびＬ１）を構築する場合、現在のピクチャと同じ解像度を有する参照ピクチャのみを使用する。なお、参照ピクチャサイズは、元のサイズでも、再サンプリングされたサイズでも利用可能であってよい。
－ＴＭＶＰおよびＡＴＶＭＰは、有効化されてもよい。しかしながら、現在のピクチャと参照ピクチャの元のコーディング解像度が異なる場合、その参照ピクチャに対してＴＭＶＰおよびＡＴＭＶＰは無効化される。
－開始点ソフトウェアの実装形態の便宜上および簡素化のため、ピクチャを出力するとき、デコーダは最も高い利用可能な解像度を出力する。

【0195】

１．２．５．２．ピクチャサイズおよびピクチャ出力の信号通知について
１．ビットストリームにおけるコーディングされたピクチャの空間的解像度のリストにおいて
現在、ＣＶＳにおけるすべてのコーディングされたピクチャは同じ解像度を有する。従って、ＳＰＳにおいて１つの解像度（即ち、ピクチャの幅および高さ）のみを信号通知することは簡単である。ＡＲＣをサポートする場合、１つの解像度の代わりに、ピクチャ解像度のリストを信号通知することが必要であり、個々のピクチャサイズを規定するために、このリストがＳＰＳにて信号通知され、このリストへのインデックスをＰＰＳにて信号通知することを提案する。
２．ピクチャ出力について
出力されるピクチャについては、再サンプリング前の復号化されたピクチャを（必要に応じて）クロップし、出力する、つまり、再サンプリングされたピクチャは出力用ではなく、インター予測の参照用にのみ使用されることを提案する。ＡＲＣ再サンプリングフィルタは、インター予測のために再サンプリングされたピクチャの使用を最適化するように設計されるべきであり、このようなフィルタは、ピクチャの出力／表示の目的に最適ではない場合があり、一方、映像端末デバイスは、通常、最適化された出力ズーム／スケーリング機能を既に実装している。

【0196】

１．２．５．３．再サンプリングについて

【0197】

復号化されたピクチャの再サンプリングは、ピクチャベースのものであってもよいし、ブロックベースのものであってもよい。ＶＶＣの最終的なＡＲＣ設計では、ピクチャベースの再サンプリングよりも、ブロックベースの再サンプリングを優先している。当方は、これら２つのアプローチを検討し、ＪＶＥＴがＶＶＣにおけるＡＲＣサポートのためにこれら２つのアプローチのうちどちらを規定すべきかを決定することを推奨する。

【0198】

ピクチャベースの再サンプリング

【0199】

ＡＲＣのためのピクチャベースの再サンプリングにおいて、ピクチャは特定の解像度のために１回だけ再サンプリングされ、次いでＤＰＢに記憶され、一方、同じピクチャの再サンプリングされていないバージョンもＤＰＢに保持される。

【0200】

ＡＲＣに対してピクチャベースの再サンプリングを使用することには、以下の２つの問題がある。１）再サンプリングされた参照ピクチャを記憶するために、ＤＰＢバッファを追加する必要がある。２）ＤＰＢから参照ピクチャデータを読み取り、ＤＰＢに参照ピクチャデータを書き込む動作が増えるため、メモリの帯域幅を追加する必要がある。

【0201】

ＤＰＢにおいて１つのバージョンの参照ピクチャのみを保持することは、ピクチャベースの再サンプリングにとって好適なアイデアではない。再サンプリングされていないバージョンのみを保持する場合、複数のピクチャが同じ参照ピクチャを参照する場合があるので、参照ピクチャを複数回再サンプリングする必要がある場合がある。一方、参照ピクチャを再サンプリングし、再サンプリングされたバージョンのみを維持する場合、上述したように、再サンプリングされていないピクチャを出力する方がよいため、参照ピクチャを出力する必要がある場合、逆方向の再サンプリングを行う必要がある。これは、再サンプリング処理が可逆演算ではないため問題となる。ピクチャＡをダウンサンプリングした後、アップサンプリングしてＡと同じ解像度のＡ’を得たとしても、ＡとＡ’は同じではない。ダウンサンプリングとアップサンプリングの処理中に高周波の情報が失われているため、Ａ’に含まれる情報はＡよりも少なくなる。

【0202】

追加のＤＰＢバッファおよびメモリ帯域幅の問題に対処するために、当方は、ＶＶＣにおけるＡＲＣ設計がピクチャベースの再サンプリングを使用する場合、以下を適用することを提案する。
１．参照ピクチャを再サンプリングするとき、再サンプリングされたバージョンの参照ピクチャと元の再サンプリングされたバージョンの参照ピクチャとの両方がＤＰＢに記憶され、したがって、両方がＤＰＢのフルネスに影響を及ぼす。
２．対応する再サンプリングされていない参照ピクチャが「参照のために使用されない」とマークされている場合、再サンプリングされた参照ピクチャは、「参照のために使用されない」とマークされる。
３．各タイルグループのＲＰＬ（ＲｅｆｅｒｅｎｃｅＰｉｃｔｕｒｅＬｉｓｔ）は、現在のピクチャと同じ解像度を有する参照ピクチャを含む。ＲＰＬ信号通知構文を変更する必要はないが、ＲＰＬ構築処理は、前文で言及されたことを保証するように、以下のように修正される。参照ピクチャをＲＰＬエントリに含めることが必要であり、かつ、現在のピクチャと同じ解像度を有するその参照ピクチャのバージョンがまだ利用可能でない場合、ピクチャ再サンプリング処理が呼び出され、かつ、その参照ピクチャの再サンプリングされたバージョンが含まれる。
４．ＤＰＢに存在し得る再サンプリングされた参照ピクチャの数は、例えば、２以下となるように制限されるべきである。

【0203】

さらに、時間的ＭＶが現在のものとは異なる解像度の参照フレームに由来する場合、時間的ＭＶの使用（例えば、マージモードおよびＡＴＭＶＰ）を可能にするために、当方は、時間的ＭＶを必要に応じて現在の解像度にスケーリングすることを提案する。

【0204】

ブロックベースのＡＲＣ再サンプリング

【0205】

ＡＲＣのためのブロックベースの再サンプリングにおいて、参照ブロックは必要に応じて再サンプリングされ、再サンプリングされたピクチャはＤＰＢに記憶されない。

【0206】

ここでの主な問題は、付加的なデコーダの複雑性である。これは、参照ピクチャにおけるブロックが、別のピクチャにおける複数のブロックによって、および複数のピクチャにおける複数のブロックによって、複数回参照される場合があるためである。

【0207】

参照ピクチャにおけるブロックが現在のピクチャのブロックによって参照され、参照ピクチャの解像度と現在のピクチャの解像度が異なる場合、補間フィルタを呼び出すことによって、参照ブロックが整数画素の解像度を有するように参照ブロックを再サンプリングする。動きベクトルが１／４画素である場合、再び補間処理が呼び出され、１／４画素解像度で再サンプリングされた参照ブロックが取得される。従って、異なる解像度を伴う参照ブロックからの現在のブロックに対する各動き補償動作のために、１つの補間フィルタリング動作の代わりに２つまでの補間フィルタリング動作が必要である。ＡＲＣサポートがない場合、１つの補間フィルタ動作（すなわち、１／４画素の解像度での参照ブロックの生成）しか必要とされない。

【0208】

最悪の場合の複雑性を抑制するために、ＶＶＣにおけるＡＲＣ設計がブロックベースの再サンプリングを使用する場合、以下が適用されることを提案する。
－現在のピクチャとは異なる解像度を有する参照ピクチャからのブロックの双方向予測が許可されない。
－より正確には、この制約は以下の通りである。現在のピクチャｐｉｃＡにおける現在のブロックｂｌｋＡが、参照ピクチャｐｉｃＢにおける参照ブロックｂｌｋＢを参照する際に、ｐｉｃＡとｐｉｃＢとが異なる解像度を有する場合、ブロックｂｌｋＡは、単一予測ブロックであるとする。

【0209】

この制約により、ブロックを復号化するのに必要な最悪の場合の補間動作の数は、２回に限定される。ブロックが異なる解像度のピクチャからのブロックを参照する場合、上述したように、必要な補間動作の数は２回である。これは、補間演算の数も２回であるため（すなわち、各参照ブロックに対し１／４画素の解像度を得るため）、ブロックが同じ解像度のピクチャからの参照ブロックを参照し、双方向予測ブロックとして符号化した場合と同様である。

【0210】

実装形態を簡単にするために、当方は、ＶＶＣにおけるＡＲＣ設計がブロックベースの再サンプリングを使用する場合、以下を適用する別の変形を提案する。
－参照フレームと現在のフレームの解像度が異なる場合、まず、予測子のすべての画素の対応する位置が計算され、次いで、補間が１回だけ適用される。即ち、２つの補間動作（即ち、１つは再サンプリングのためであり、１つは１／４画素補間のためである）を１つの補間演算のみに結合する。現在のＶＶＣにおけるサブ画素補間フィルタは再利用可能であるが、この場合、補間の粒度を大きくするべきであるが、補間動作の回数を２から１に短縮する。
－時間的ＭＶが現在のものとは異なる解像度の参照フレームに由来する場合に、時間的ＭＶの使用（例えば、マージモードおよびＡＴＭＶＰ）を可能にするために、当方は、時間的ＭＶを必要に応じて現在の解像度にスケーリングすることを提案する。

【0211】

再サンプリング率

【0212】

ＪＶＥＴ－Ｍ０１３５において、ＡＲＣに関する議論を始めるために、ＡＲＣの開始点として、２ｘ（アップサンプリングの場合、２×２、ダウンサンプリングの場合、１／２×１／２を意味する）の再サンプリング比のみを考慮することが提案された。マラケシュ会議の後、このトピックをさらに検討したところ、２ｘの再サンプリング比のみをサポートすることは、非常に限られており、場合によっては、再サンプリング解像度と非再サンプリング解像度の差が小さいほど有益であることが分かった。

【0213】

任意の再サンプリング率をサポートすることが望ましい場合があるが、それをサポートすることは困難であると思われた。これは、任意の再サンプリング率をサポートするために、定義され実装されなければならない再サンプリングフィルタの数が多すぎ、デコーダの実装形態に大きな負担がかかるように思われたためである。

【0214】

当方は、２つ以上であるが少数の再サンプリング比をサポートすべきであるが、少なくとも１．５ｘおよび２ｘの再サンプリング比、および任意の再サンプリング比はサポートされないと提案する。

【0215】

最大ＤＰＢバッファサイズおよびバッファフルネス

【0216】

ＡＲＣの場合、ＤＰＢは、同じＣＶＳ内に、異なる空間的解像度の復号化ピクチャを含んでもよい。ＤＰＢ管理および関連する態様の場合、復号化されたピクチャ単位でＤＰＢのサイズおよびフルネスを計数することは、もはや機能しない。

【0217】

以下は、ＡＲＣがサポートされている場合、最終的なＶＶＣ規格における取り組むべきいくつかの特定の態様および可能な解決策の議論である（当方は、この会議において可能な解決策を採用することを提案していない）。
１．ＭａｘＤｐｂＳｉｚｅ（すなわち、ＤＰＢ内に存在してよい参照ピクチャの最大数）の導出のためにＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹ（すなわち、ＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹ＝ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＊ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）の値を使用するのではなく、ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹの値に基づいて、ＭａｘＤｐｂＳｉｚｅの導出を行う。ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅＹは、以下のように定義される。
ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅＹ＝（ビットストリームにおける最小のピクチャ解像度の幅）＊（ビットストリームにおける最小の解像度の高さ）。
ＭａｘＤｐｂＳｉｚｅの導出は、（ＨＥＶＣ式に基づいて）以下のように修正される。
ｉｆ（ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹ＜＝（ＭａｘＬｕｍａＰｓ＞＞２））
ＭａｘＤｐｂＳｉｚｅ＝Ｍｉｎ（４＊ｍａｘＤｐｂＰｉｃＢｕｆ，１６）
ｅｌｓｅｉｆ（ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹ＜＝（ＭａｘＬｕｍａＰｓ＞＞１））
ＭａｘＤｐｂＳｉｚｅ＝Ｍｉｎ（２＊ｍａｘＤｐｂＰｉｃＢｕｆ，１６）
ｅｌｓｅｉｆ（ＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅｓＹ＜＝（（３＊ＭａｘＬｕｍａＰｓ）＞＞２））
ＭａｘＤｐｂＳｉｚｅ＝Ｍｉｎ（（４＊ｍａｘＤｐｂＰｉｃＢｕｆ）／３，１６）
ｅｌｓｅ
ＭａｘＤｐｂＳｉｚｅ＝ｍａｘＤｐｂＰｉｃＢｕｆ

【0218】

２．各復号化されたピクチャは、ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔと呼ばれる値に関連付けられる。ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは、復号化されたピクチャサイズがＭｉｎＰｉｃＳｉｚｅＩｎＳａｍｐｌｅＹに対してどれぐらい大きいかを規定する整数値である。ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの定義は、ＶＶＣにおけるＡＲＣのためにどのような再サンプリング比がサポートされるかに依存する。
例えば、ＡＲＣが２の再サンプリング比のみをサポートする場合、ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは、次のように定義される。
－ビットストリームにおける最小の解像度を有する復号化されたピクチャは、１のＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔに関連付けられる。
－ビットストリームにおける最小の解像度の２×２の解像度を有する復号化されたピクチャは、４のＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔ（即ち、１＊４）に関連付けられる。
別の例の場合、ＡＲＣが１．５および２の両方の再サンプリング比をサポートする場合、ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは、以下のように定義される。
－ビットストリームにおける最小の解像度を有する復号化されたピクチャは、４のＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔに関連付けられる。
－ビットストリームにおける最小の解像度の１．５×１．５の解像度を有する復号化されたピクチャは、９（すなわち、２．２５＊４）のＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔに関連付けられる。
－ビットストリームにおける最小の解像度の２×２の解像度を有する復号化されたピクチャは、１６（即ち、４＊４）のＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔに関連付けられる。
ＡＲＣがサポートする他の再サンプリングレートの場合、各ピクチャサイズに対するＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの値を判定するために、上記の例に示されるのと同じ原理を使用すべきである。

【0219】

３．変数ＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔをＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの最小可能値とする。すなわち、ＡＲＣが２の再サンプリング比のみをサポートする場合、ＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは１であり、ＡＲＣが１．５および２の再サンプリング比をサポートする場合、ＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは４であり、同様に、同じ原理を使用してＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの値を判定する。

【0220】

４．ｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］の値の範囲は、０～（ＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔ＊（ＭａｘＤｐｂＳｉｚｅ－１））の範囲で規定される。変数ＭｉｎＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔは、ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの最小可能値である。

【0221】

５．ＤＰＢフルネス動作は、ＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔに基づいて、以下のようで規定される。
－ＨＲＤは復号化ユニット０で初期化され、ＣＰＢおよびＤＰＢの両方が空に設定される（ＤＰＢフルネスが０に等しく設定される）。
－ＤＰＢがフラッシュされる（即ち、すべてのピクチャがＤＰＢから除去される）場合、ＤＰＢフルネスは０に等しく設定される。
－ピクチャがＤＰＢから除去されるとき、ＤＰＢフルネスは、除去されたピクチャに関連付けられたＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの値だけデクリメントされる。
－ピクチャがＤＰＢに挿入されるとき、ＤＰＢフルネスは、挿入されたピクチャに関連付けられたＰｉｃｔｕｒｅＳｉｚｅＵｎｉｔの値だけインクリメントされる。

【0222】

１．２．５．４．再サンプリングフィルタ

【0223】

ソフトウェアの実装において、実装された再サンプリングフィルタは、単純に、ＪＣＴＶＣ－Ｈ０２３４に記載されている以前に利用可能なフィルタから得られた。より優れた性能および／またはより低い複雑性を提供する場合、他の再サンプリングフィルタが試験され、使用されるべきである。当方は、複雑性と性能との間のトレードオフを取り決めるために、様々な再サンプリングフィルタを試験することを提案する。このような試験は、ＣＥにおいて行うことができる。

【0224】

１．２．５．５．既存のツールへのその他の必要な修正

【0225】

ＡＲＣをサポートするために、既存のコーディングツールの一部に何らかの修正および／または追加の動作が必要とされる場合がある。例えば、ＡＲＣソフトウェア実装のピクチャベースの再サンプリングにおいて、説明を簡単にするために、現在のピクチャと参照ピクチャの元のコーディング解像度が異なる場合、ＴＭＶＰおよびＡＴＭＶＰを無効化した。

【0226】

１．２．６．ＪＶＥＴ－Ｎ０２７９

【0227】

「将来の映像コーディング規格のための要件」によれば、この規格は、それぞれが異なる特性（例えば、空間的解像度またはサンプルビット深さ）を有する、同じコンテンツの複数の表現を提供する適応ストリーミングサービスの場合、高速表現切り替えをサポートするものとする。リアルタイムの映像通信において、Ｉピクチャを挿入せずにコーディングされた映像シーケンスにおける解像度の変更を許可することは、映像データを動的なチャネル条件またはユーザの好みにシームレスに適応させるだけでなく、Ｉピクチャに起因するビートの影響を除去することができる。適応解像度の変更の仮説例が、異なったサイズの参照ピクチャから現在のピクチャを予測する図１４にて示される。

【0228】

この寄与は、適応解像度の変更を信号通知するための高レベルな構文と、ＶＴＭにおける現在の動き補償予測処理の修正を提案する。これらの修正は、既存の動き補償補間器を変更せずに、動きベクトルのスケーリングおよびサブ画素の位置の導出に限定される。これにより、既存の動き補償補間器を再利用することができ、追加のコストを招くような適応解像度の変更をサポートするための新しい処理ブロックを必要としない。

【0229】

１．２．６．１．適応解像度の変更の信号通知
１．２．６．１．１．ＳＰＳ

【0230】

【表12】

【0231】

［［ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの幅を規定する。ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。］］
［［ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの高さを規定する。ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする］］
ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位でＳＰＳを参照する復号化されたピクチャの最大幅を規定する。ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。
ｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位でＳＰＳを参照する復号化されたピクチャの最大幅を規定する。ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。

【0232】

１．２．６．１．２．ＰＰＳ

【0233】

【表13】

【0234】

１に等しいｐｉｃ＿ｓｉｚｅ＿ｄｉｆｆｅｒｅｎｔ＿ｆｒｏｍ＿ｍａｘ＿ｆｌａｇは、ＰＰＳは、参照されたＳＰＳのｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅとは異なるピクチャ幅またはピクチャ高さ信号通知することを規定する。０に等しいｐｉｃ＿ｓｉｚｅ＿ｄｉｆｆｅｒｅｎｔ＿ｆｒｏｍ＿ｍａｘ＿ｆｌａｇは、ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅが、参照されたＳＰＳのｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓおよびｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅと同じであることを規定する。
ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの幅を規定する。ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓが存在しない場合、ｍａｘ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測される。
ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、輝度サンプル単位で各復号化されたピクチャの高さを規定する。ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなく、かつ、ＭｉｎＣｂＳｉｚｅＹの整数倍とする。ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓが存在しない場合、ｍａｘ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測される。

【0235】

すべてのアクティブな参照ピクチャに対して、水平および垂直のスケーリング比が１／８～２の範囲内にあるべきであることがビットストリーム適合性の要件である。スケーリング比は、以下のように定義される。
－ｈｏｒｉｚｏｎｔａｌ＿ｓｃａｌｉｎｇ＿ｒａｔｉｏ＝（（ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＜＜１４）＋（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ／２））／ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ
－ｖｅｒｔｉｃａｌ＿ｓｃａｌｉｎｇ＿ｒａｔｉｏ＝（（ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＜＜１４）＋（ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ／２））／ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ

【0236】

【表14】

【0237】

参照ピクチャのスケーリング処理

【0238】

ＣＶＳ内で解像度の変更がある場合、ピクチャは、その参照ピクチャの１または複数とは異なるサイズを有していてよい。この提案は、すべての動きベクトルを、それらが対応する参照ピクチャグリッドの代わりに、現在のピクチャグリッドに正規化する。これは、設計の一貫性を保ち、解像度の変更を動きベクトル予測処理に対してトランスペアレントにするために有益であると主張している。そうでない場合、スケールが異なるため、異なるサイズを有する参照ピクチャを指す近傍の動きベクトルを空間的動きベクトル予測に直接使用できない。

【0239】

解像度の変更が生じた場合、動き補償予測を行いながら、動きベクトルおよび参照ブロックの両方をスケーリングしなければならない。スケーリング範囲は［１／８，２］に限定され、即ち、アップスケーリングは１：８に限定され、ダウンスケーリングは２：１に限定される。なお、アップスケーリングは、参照ピクチャが現在のピクチャより小さい場合を指し、ダウンスケーリングは、参照ピクチャが現在のピクチャより大きい場合を指す。以下の章では、スケーリング処理をより詳細に説明する。

【0240】

輝度ブロック

【0241】

スケーリング係数およびその固定小数点表現は、以下のように定義される。

【0242】

【数1】

【0243】

【数2】

【0244】

このスケーリング処理は、２つの部分を含む。
１．現在のブロックの左上隅の画素を参照ピクチャにマッピングする。
２．水平および垂直ステップサイズを使用して、現在のブロックの他の画素の参照位置をアドレス指定する。

【0245】

現在のブロックの左上隅の画素の座標が（ｘ，ｙ）である場合、動きベクトル（ｍｖＸ，ｍｖＹ）が指す参照ピクチャにおけるサブ画素の位置（ｘ’，ｙ’）を、１／１６画素
単位で以下のように規定する。
●参照ピクチャにおける水平位置は、
ｘ’＝（（Ｘ＜＜４）＋ｍｖＸ）・ｈｏｒｉ＿ｓｃａｌｅ＿ｆｐ（３）
であり、ｘ’は１０の小数ビットのみを維持するようにさらにスケールダウンされる。
ｘ’＝Ｓｉｇｎ（ｘ’）・（（Ａｂｓ（ｘ’）＋（１＜＜７））＞＞８（４）
●同様に、参照ピクチャにおける垂直方向の位置は、
ｙ’＝（（ｙ＜＜４）＋ｍｖＹ）・ｖｅｒｔ＿ｓｃａｌｅ＿ｆｐ（５）
であり、ｙ’はさらに次のようにスケールダウンされる。
ｙ’＝Ｓｉｇｎ（ｙ’）・（（Ａｂｓ（ｙ’）＋（１＜＜７））＞＞８）（６）

【0246】

この時点で、現在のブロックの左上隅の画素の参照位置は、（ｗ’，ｙ’）にある。他の参照サブ画素／画素位置は、水平および垂直のステップサイズを有する（ｘ’，ｙ’）に関連して計算される。これらのステップサイズは、上記の水平および垂直スケーリング係数から、１／１０２４画素の精度で、以下のように導出される。
ｘ＿ｓｔｅｐ＝（ｈｏｒｉ＿ｓｃａｌｅ＿ｆｐ＋８）＞＞４（７）
ｙ＿ｓｔｅｐ＝（ｖｅｒｔ＿ｓｃａｌｅ＿ｆｐ＋８）＞＞４（８）

【0247】

一例として、現在のブロックにおける画素が左上隅の画素からｉ列ｊ行離れている場合、その対応する参照画素の水平座標および垂直座標は、以下によって導出される。
ｘ’_ｉ＝ｘ’＋ｉ＊ｘ＿ｓｔｅｐ（９）
ｙ’_ｊ＝ｙ’＋ｊ＊ｙ＿ｓｔｅｐ（１０）

【0248】

サブペル補間において、ｘｉ’およびｙｊ’は、フル画素部分と小数画素部分とに分割されなければならない。
●参照ブロックをアドレス指定するためのフル画素部分は以下に等しい。
（ｘ’_ｉ＋３２）＞＞１０（１１）
（ｙ’_ｊ＋３２）＞＞１０（１２）
●補間フィルタを選択するために使用される小数画素部分は以下に等しい。
Δｘ＝（（ｘ’_ｉ＋３２）＞＞６）＆１５（１３）
Δｙ＝（（ｙ’_ｊ＋３２）＞＞６）＆１５（１４）

【0249】

参照ピクチャ内のフル画素位置および小数画素位置が判定されると、既存の動き補償補間器を追加の変更なしに使用できる。フル画素位置は、参照ピクチャから参照ブロックパッチをフェッチするために使用され、小数画素位置は、適切な補間フィルタを選択するために使用される。

【0250】

彩度ブロック

【0251】

彩度フォーマットが４：２：０である場合、彩度動きベクトルは、１／３２画素の精度を有する。彩度動きベクトルおよび彩度参照ブロックのスケーリング処理は、彩度フォーマットに関連した調整を除いて、輝度ブロックとほぼ同じである。

【0252】

現在の彩度ブロックの左上隅の画素の座標が（ｘｃ，ｙｃ）である場合、参照彩度ピクチャにおける最初の水平および垂直位置は、以下に等しい。
ｘ_ｃ’＝（（ｘｃ＜＜５）＋ｍｖＸ）・ｈｏｒｉ＿ｓｃａｌｅ＿ｆｐ（１）
ｙ_ｃ’＝（（ｙｃ＜＜５）＋ｍｖＹ）・ｖｅｒｔ＿ｓｃａｌｅ＿ｆｐ（２）

【0253】

ｍｖＸおよびｍｖＹは元の輝度動きベクトルであるが、ここでは１／３２画素の精度で検査されるべきである。

【0254】

ｘ_ｃ’、ｙ_ｃ’はさらにスケールダウンされ、１／１０２４画素の精度を維持する。
ｘ_ｃ’＝Ｓｉｇｎ（ｘ_ｃ’）・（（Ａｂｓ（ｘ_ｃ’）＋（１＜＜８））＞＞９
（３）
ｙ_ｃ’＝Ｓｉｇｎ（ｙ_ｃ’）・（（Ａｂｓ（ｙ_ｃ’）＋（１＜＜８））＞＞９
（４）

【0255】

関連する輝度の方程式と比較して、上記の右シフトは、１つの余分なビットだけ増加される。

【0256】

使用されるステップサイズは、輝度の場合と同じである。左上隅の画素に関する（ｉ，ｊ）における彩度画素の場合、その参照画素の水平座標および垂直座標は、以下のように導出される。
ｘ_ｃ’_ｉ＝ｘ_ｃ’＋ｉ＊ｘ＿ｓｔｅｐ（５）
ｙ_ｃ’_ｊ＝ｙ_ｃ’＋ｊ＊ｙ＿ｓｔｅｐ（６）
サブ画素補間において、ｘｃ’ｉおよびｙｃ’ｊは、また、フル画素部分および小数画素部分に分けられる。
●参照ブロックをアドレス指定するためのフル画素部分は以下に等しい。
（ｘ_ｃ’_ｉ＋１６）＞＞１０（７）
（ｙ_ｃ’_ｊ＋１６）＞＞１０（８）
●補間フィルタを選択するために使用される小数画素部分は、以下に等しい。
Δｘ＝（（ｘ_ｃ’_ｉ＋１６）＞＞５）＆３１（９）
Δｙ＝（（ｙ_ｃ’_ｊ＋１６）＞＞５）＆３１（１０）

【0257】

他のコーディングツールとの相互作用

【0258】

参照ピクチャのスケーリングを有する一部のコーディングツールとの相互作用に関連付けられた過度な複雑性とメモリ帯域幅のため、ＶＶＣ仕様に以下の制限を加えることが推奨される。
－ｔｉｌｅ＿ｇｒｏｕｐ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合、現在のピクチャとその並置されたピクチャは同じサイズを有するものとする。
－解像度の変更がシーケンス内で許可されている場合、デコーダ動きベクトルの改善は停止されるものとする。
－解像度の変更がシーケンス内で許可されている場合、ｓｐｓ＿ｂｄｏｆ＿ｅｎａｂｌｅｄ＿ｆｌａｇは０に等しいものとする。

【0259】

１．３．ＪＶＥＴ－Ｎ０４１５におけるＣＴＢ（ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ）ベースのＡＬＦ（ＡｄａｐｔｉｖｅＬｏｏｐＦｉｌｔｅｒ）

【0260】

スライスレベル時間的フィルタ

【0261】

ＶＴＭ４にはＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）が採用された。各ＡＰＳは、１つのセットの信号通知されたＡＬＦフィルタを含み、最大３２個のＡＰＳがサポートされる。本提案では、スライスレベルの時間的フィルタがテストされる。タイルグループは、ＡＰＳからのＡＬＦ情報を再利用することにより、オーバーヘッドを低減することができる。ＡＰＳは、ＦＩＦＯ（Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）バッファとして更新される。

【0262】

ＣＴＢベースのＡＬＦ

【0263】

輝度成分に対し、ＡＬＦが輝度ＣＴＢに適用される際に、１６個の固定された、５個の時間的な、または１つの信号通知されたフィルタセットの中からの選択が示される。フィルタセットインデックスのみが信号通知される。１つのスライスに対して、２５個のフィルタからなる１つの新しいセットのみを信号通知することができる。１つのスライスに対して新しいセットが信号通知された場合、同じスライス内のすべての輝度ＣＴＢはそのセットを共有する。固定フィルタセットを使用して新しいスライスレベルフィルタセットを予測することができ、これを輝度ＣＴＢに対する候補フィルタセットとして使用できる。
フィルタの数は合計６４個である。

【0264】

彩度成分に対し、ＡＬＦが彩度ＣＴＢに適用される際に、スライスに対して新しいフィルタが信号通知する場合、ＣＴＢは新しいフィルタを使用し、そうでない場合、時間スケーラビリティ制約を満たす最も新しい時間的彩度フィルタが適用される。

【0265】

スライスレベルの時間的フィルタとして、ＡＰＳは、ＦＩＦＯ（Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）バッファとして更新される。

【0266】

１．４．代替時間的動きベクトル予測（別名、ＶＶＣにおけるサブブロックベースの時間マージ候補）

【0267】

ＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）において、ＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）は、現在のＣＵより小さいブロックから複数セットの動き情報（動きベクトルおよび参照インデックスを含む）をフェッチすることで修正される。図１５に示すように、サブＣＵは、正方形のＮ×Ｎブロックである（デフォルトでは、Ｎは８に設定される）。

【0268】

ＡＴＭＶＰは、ＣＵ内のサブＣＵの動きベクトルを２つのステップで予測する。第１のステップは、参照ピクチャにおける対応するブロックを、いわゆる時間的ベクトルで特定することである。参照ピクチャは、動きソースピクチャと呼ばれる。第２のステップは、図１５に示すように、現在のＣＵをサブＣＵに分割し、各サブＣＵに対応するブロックから各サブＣＵの動きベクトルならびに参照インデックスを取得する。

【0269】

第１のステップにおいて、現在のＣＵの空間的に近傍のブロックの動き情報によって、参照ピクチャおよび対応するブロックが判定される。近傍のブロックの繰り返しスキャン処理を回避するために、現在のＣＵのマージ候補リストにおけるブロックＡ０（左ブロック）からのマージ候補が使用される。並置された参照ピクチャを参照するブロックＡ０から第１の利用可能な動きベクトルが、時間的ベクトルとなるように設定される。このように、ＡＴＭＶＰでは、ＴＭＶＰに比べて、対応するブロックをより正確に特定することができ、対応するブロック（配列されたブロックと呼ばれることがある）は、常に現在のＣＵに対して右下または中心位置にある。

【0270】

第２のステップにおいて、現在のＣＵの座標に時間ベクトルを加えることにより、サブＣＵの対応するブロックが、動きソースピクチャにおける時間的ベクトルにより特定される。各サブＣＵに対し、その対応するブロックの動き情報（例えば、中心サンプルを覆う最小の動きグリッド）が使用され、サブＣＵの動き情報を導出する。対応するＮ×Ｎブロックの動き情報が特定された後、ＨＥＶＣのＴＭＶＰと同様に、現在のサブＣＵの動きベクトルおよび参照インデックスに変換され、動きスケーリングや他の手順が適用される。

【0271】

１．５．アフィン動き予測

【0272】

ＨＥＶＣにおいて、並進運動モデルのみが、ＭＣＰ（ＭｏｔｉｏｎＣｏｍｐｅｎｓａｔｉｏｎＰｒｅｄｉｃｔｉｏｎ）のために適用される。一方、現実世界において、動きには様々な種類があり、例えば、ズームイン／ズームアウト、回転、透視運動、および他の不規則な動きがある。ＶＶＣにおいて、４パラメータアフィンモデルおよび６パラメータアフィンモデルを使用して、簡易アフィン変換動き補償予測が適用される。図１６に示すように、ブロックのアフィン動きフィールドは、４パラメータアフィンモデルの場合、２つのＣＰＭＶ（ＣｏｎｔｒｏｌＰｏｉｎｔＭｏｔｉｏｎＶｅｃｔｏｒ）によって表され、６パラメータアフィンモデルの場合、３つのＣＰＭＶによって表される。

【0273】

ブロックのＭＶＦ（ＭｏｔｉｏｎＶｅｃｔｏｒＦｉｅｌｄ）は、式（１）における４パラメータアフィンモデル（４パラメータを変数ａ、ｂ、ｅ、ｆとして定義される）および式（２）における６パラメータアフィンモデル（４パラメータを変数ａ、ｂ、ｃ、ｄ、ｅ、ｆとして定義される）をそれぞれ使用して、以下の式で表される。

【0274】

【数3】

【0275】

【数4】

【0276】

ここで、（ｍｖ^ｈ _０，ｍｖ^ｈ _０）は、左上隅の制御点の動きベクトルであり、（ｍｖ^ｈ _１，ｍｖ^ｈ _１）は、右上隅の制御点の動きベクトルであり、（ｍｖ^ｈ _２，ｍｖ^ｈ _２）は、左下隅の制御点の動きベクトルであり、３つの動きベクトルはすべて、ＣＰＭＶ（ＣｏｎｔｒｏｌＰｏｉｎｔＭｏｔｉｏｎＶｅｃｔｏｒ）と呼ばれ、（ｘ，ｙ）は、現在のブロック内の左上サンプルに対する代表点の座標を表し、（ｍｖ^ｈ（ｘ，ｙ），ｍｖ^ｖ（ｘ，ｙ））は、（ｘ，ｙ）に位置するサンプルに対して導出された動きベクトルである。ＣＰ動きベクトルは、（アフィンＡＭＶＰモードのように）信号通知されてもよいし、または、（アフィンマージモードのように）オンザフライで導出されてもよい。ｗおよびｈは、現在のブロックの幅および高さである。実際のところは、この分割は、丸め動作を有する右シフトによって実装される。ＶＴＭにおいて、代表点がサブブロックの中心位置として定義され、例えば、現在のブロックにおける左上のサンプルに対するサブブロックの左上の角の座標が（ｘｓ，ｙｓ）である場合、代表点の座標は（ｘｓ＋２，ｙｓ＋２）として定義される。各サブブロック（すなわち、ＶＴＭにおいて４×４）に対して、代表点を利用して、サブブロック全体の動きベクトルが導出される。

【0277】

動き補償予測をさらに簡単にするために、サブブロックベースのアフィン変換予測が適用される。各Ｍ×Ｎ（現在のＶＶＣでは、ＭおよびＮの両方が４に設定される）個のサブブロックの動きベクトルを導出するために、各サブブロックの中心サンプルの動きベクトルが、図１７に示すように、式（１）および（２）に従って算出され、１／１６の小数精度に丸める。そして、１／１６画素の動き補償補間フィルタが適用され、導出された動きベクトルを使用して各サブブロックの予測が生成される。１／１６画素の補間フィルタは、アフィンモードで導入される。

【0278】

ＭＣＰ後、各サブブロックの高精度動きベクトルが丸められ、通常の動きベクトルと同じ精度で保存される。

【0279】

１．５．１．アフィン予測の信号通知

【0280】

並進動きモデルと同様に、アフィン予測によるサイド情報の信号通知のために２つのモードがある。それらは、ＡＦＦＩＮＥ＿ＩＮＴＥＲおよびＡＦＦＩＮＥ＿ＭＥＲＧＥモードである。

【0281】

１．５．２．ＡＦ＿ＩＮＴＥＲモード

【0282】

幅と高さの両方が８より大きいＣＵの場合、ＡＦ＿ＩＮＴＥＲモードを適用することができる。ＡＦ＿ＩＮＴＥＲモードが使用されているかどうかを示すために、ビットストリームにおいてＣＵレベルのアフィンフラグが信号通知される。

【0283】

本モードにおいて、各参照ピクチャリスト（Ｌｉｓｔ０またはＬｉｓｔ１）に対して、アフィンＡＭＶＰ候補リストが、以下の順に、３つのタイプのアフィン動き予測子を用いて構築され、各候補は、現在のブロックの推定されたＣＰＭＶを含む。エンコーダ側で見出された最良のＣＰＭＶ（例えば、図１８におけるｍｖ_０、ｍｖ_１、ｍｖ_２）と推定されたＣＰＭＶとの差が信号通知される。さらに、推定されたＣＰＭＶが導出されたアフィンＡＭＶＰ候補のインデックスが信号通知される。

【0284】

（１）継承アフィン動き予測子

【0285】

チェック順序は、ＨＥＶＣＡＭＶＰリスト構築における空間的ＭＶＰのチェック順序に類似している。まず、アフィンコーディングされ、かつ、現在のブロックと同じ参照ピクチャを有する｛Ａ１，Ａ０｝における第１のブロックから、左側の継承アフィン動き予測子が導出される。第２に、上記継承アフィン動き予測子は、アフィンコーディングされ、かつ、現在のブロックと同じ参照ピクチャを有する｛Ｂ１，Ｂ０，Ｂ２｝における第１のブロックから導出される。図１９には、５つのブロックＡ１、Ａ０、Ｂ１、Ｂ０、Ｂ２が示されている。

【0286】

近傍のブロックがアフィンモードでコーディングされていることがわかったら、近傍のブロックをカバーするコーディングユニットのＣＰＭＶを使用して、現在のブロックのＣＰＭＶの予測子が導出される。例えば、Ａ１が非アフィンモードでコーディングされ、Ａ０が４パラメータアフィンモードでコーディングされる場合、左側の継承アフィンＭＶ予測子は、Ａ０から導出される。この場合、図２１Ｂの左上のＣＰＭＶをＭＶ_０ ^Ｎで表し、右上のＣＰＭＶをＭＶ_１ ^Ｎで表した、Ａ０をカバーしているＣＵのＣＰＭＶを利用して、現在のブロックの左上（座標（ｘ０，ｙ０））、右上（座標（ｘ１，ｙ１））、右下（座標（ｘ２，ｙ２））の位置をＭＶ_０ ^Ｃ、ＭＶ_１ ^Ｃ、ＭＶ_２ ^Ｃで表した、現在のブロックの推定ＣＰＭＶを導出する。

【0287】

（２）構築されたアフィン動き予測子

【0288】

構築されたアフィン動き予測子は、図２０に示すように、近傍のインター符号化されたブロックから導出された、同じ参照ピクチャを有するＣＰＭＶ（Ｃｏｎｔｒｏｌ－ＰｏｉｎｔＭｏｔｉｏｎＶｅｃｔｏｒ）からなる。現在のアフィン動きモデルが４パラメータアフィンである場合、ＣＰＭＶの数は２であり、そうでない場合、現在のアフィン動きモデルが６パラメータアフィンである場合、ＣＰＭＶの数は３である。左上のＣＰＭＶｍｖ_０￣は、インター符号化され、かつ、現在のブロックと同じ参照ピクチャを有するグループ｛Ａ，Ｂ，Ｃ｝における第１のブロックのＭＶによって導出される。右上のＣＰＭＶｍｖ_１￣は、インター符号化され、かつ、現在のブロックと同じ参照ピクチャを有するグループ｛Ｄ，Ｅ｝における第１のブロックのＭＶによって導出される。左下のＣＰＭＶｍｖ_２￣は、インター符号化され、かつ、現在のブロックと同じ参照ピクチャを有するグループ｛Ｆ，Ｇ｝における第１のブロックのＭＶによって導出される。
－現在のアフィン動きモデルが４パラメータアフィンである場合、ｍｖ_０￣とｍｖ_１￣の両方が成立する場合にのみ、構築されたアフィン動き予測子が候補リストに挿入され、すなわち、ｍｖ_０￣とｍｖ_１￣は、現在のブロックの左上（座標（ｘ０，ｙ０））、右上（座標（ｘ１，ｙ１））の位置に対する推定ＣＰＭＶとして使用される。
－現在のアフィン動きモデルが６パラメータアフィンである場合、ｍｖ_０￣、ｍｖ_１￣、およびｍｖ_２￣がすべて成立している場合にのみ、構築されたアフィン動き予測子が候補リストに挿入され、すなわち、ｍｖ_０￣、ｍｖ_１￣、およびｍｖ_２￣は、現在のブロックの左上（座標（ｘ０，ｙ０））、右上（座標（ｘ１，ｙ１））、および右下（座標（ｘ２，ｙ２））の位置に対する推定ＣＰＭＶとして使用される。構築されたアフィン動き予測子を候補リストに挿入する場合、プルーニング処理は適用されない。

【0289】

１）通常のＡＭＶＰ動き予測子

【0290】

アフィン動き予測子の数が最大に達するまで、以下が適用される。
１）利用可能であれば、すべてのＣＰＭＶをｍｖ_２￣に等しく設定することにより、アフィン動き予測子を導出する。
２）利用可能であれば、すべてのＣＰＭＶをｍｖ_１￣に等しく設定することにより、アフィン動き予測子を導出する。
３）利用可能であれば、すべてのＣＰＭＶをｍｖ_０￣に等しく設定することにより、アフィン動き予測子を導出する。
４）利用可能であれば、すべてのＣＰＭＶをＨＥＶＣＴＭＶＰに等しく設定することにより、アフィン動き予測子を導出する。
５）すべてのＣＰＭＶをゼロＭＶに設定することにより、アフィン動き予測子を導出する。

【0291】

なお、ｍｖ_ｉ￣は、構築されたアフィン動き予測子において導出されたものである。

【0292】

ＡＦ＿ＩＮＴＥＲモードにおいて、４／６パラメータアフィンモードが使用される場合、２／３の制御点が必要であり、従って、図１８Ａおよび図１８Ｂに示すように、これらの制御点のために２／３のＭＶＤがコーディングされることが必要である。ＪＶＥＴ－Ｋ０３３７において、ＭＶを以下のように導出することが提案されており、すなわち、ｍｖｄ_０からｍｖｄ_１およびｍｖｄ_２が予測される。

【0293】

【数5】

【0294】

ｍｖ_ｉ￣、ｍｖｄ_ｉ、およびｍｖ_１は、図１８Ｂに示すように、それぞれ、左上の画素（ｉ＝０）、右上の画素（ｉ＝１）、または左下の画素（ｉ＝２）の予測された動きベクトル、動きベクトルの差分、動きベクトルである。なお、２つの動きベクトル（例えば、ｍｖＡ（ｘＡ，ｙＡ）およびｍｖＢ（ｘＢ，ｙＢ））の和は、２つの成分を別個に合計したものに等しく、即ち、ｎｅｗＭＶ＝ｍｖＡ＋ｍｖＢであり、ｎｅｗＭＶの２つの成分は、それぞれ、（ｘＡ＋ｘＢ）および（ｙＡ＋ｙＢ）に設定される。

【0295】

１．５．２．１．ＡＦ＿ＭＥＲＧＥモード

【0296】

ＡＦ＿ＭＥＲＧＥモードにおいてＣＵを適用する場合、ＣＵは、有効な近傍の再構成ブロックから、アフィンモードでコーディングされた第１のブロックを得る。そして、候補ブロックの選択順序は、図２１Ａに示すように、左、上、右上、左下、左上になる（順にＡ、Ｂ、Ｃ、Ｄ、Ｅと表記する）。例えば、図２１ＢにおいてＡ０で示されるように、近傍の左下のブロックがアフィンモードでコーディングされる場合、ブロックＡを含む近傍のＣＵ／ＰＵの左上隅、右上隅、および左下隅のＣＰ（ＣｏｎｔｒｏｌＰｏｉｎｔ）動きベクトルｍｖ_０ ^Ｎ、ｍｖ_１ ^Ｎ、およびｍｖ_２ ^Ｎがフェッチされる。そして、現在のＣＵ／ＰＵにおける左上隅／右上／左下の動きベクトルｍｖ_０ ^Ｃ、ｍｖ_１ ^Ｃ、ｍｖ_２ ^Ｃ（６パラメータアフィンモデルにのみ使用される）が、ｍｖ_０ ^Ｎ、ｍｖ_１ ^Ｎ、およびｍｖ_２ ^Ｎに基づいて算出される。なお、ＶＴＭ－２．０において、左上隅に位置するサブブロック（例えば、ＶＴＭにおける４×４ブロック）は、ｍｖ０を記憶し、右上隅に位置するサブブロックは、現在のブロックがアフィンコーディングされている場合、ｍｖ１を記憶する。現在のブロックが６パラメータアフィンモデルでコーディングされている場合、左下隅に位置するサブブロックはｍｖ２を記憶し、そうでない場合（４パラメータアフィンモデルでコーディング）、ＬＢはｍｖ２’を記憶する。他のサブブロックは、ＭＣに使用されるＭＶを記憶する。

【0297】

現在のＣＵｍｖ_０ ^Ｃ、ｍｖ_１ ^Ｃ、およびｍｖ_２ ^ＣのＣＰＭＶが導出された後、簡易アフィン動きモデルの式（１）、（２）に従って、現在のＣＵのＭＶＦが生成される。現在のＣＵがＡＦ＿ＭＥＲＧＥモードでコーディングされているかどうかを識別するために、アフィンモードでコーディングされた近傍のブロックが少なくとも１つある場合、ビットストリーム内にてアフィンフラグが信号通知される。

【0298】

ＪＶＥＴ－Ｌ０１４２およびＪＶＥＴ－Ｌ０６３２において、アフィンマージ候補リストは、以下のステップを使用して構築される。
１）継承されたアフィン候補を挿入する
継承されたアフィン候補は、その有効な近傍のアフィンコーディングされたブロックのアフィン動きモデルから候補が導出されることを意味する。最大２つの継承されたアフィン候補が、近傍のブロックのアフィン動きモデルから導出され、候補リストに挿入される。左の予測子の場合、スキャン順序は｛Ａ０，Ａ１｝であり、上の予測子の場合、スキャン順序は｛Ｂ０，Ｂ１，Ｂ２｝である。
２）構築されたアフィン候補を挿入する
アフィンマージ候補リストにおける候補の数がＭａｘＮｕｍＡｆｆｉｎｅＣａｎｄ（例えば、５）未満である場合、構築されたアフィン候補が候補リストに挿入される。構築されたアフィン候補は、各制御点の近傍動き情報を組み合わせることで候補が構築されることを意味する。
ａ）まず、制御点に対する動き情報が、図２２に示される指定された空間的近傍と時間近傍から導出される。ＣＰｋ（ｋ＝１，２，３，４）は、ｋ番目の制御点を表す。Ａ０、Ａ１、Ａ２、Ｂ０、Ｂ１、Ｂ２、およびＢ３は、ＣＰｋ（ｋ＝１，２，３）を予測するための空間的位置であり、Ｔは、予測ＣＰ４の時間的位置である。
ＣＰ１、ＣＰ２、ＣＰ３、およびＣＰ４の座標は、それぞれ、（０，０）、（Ｗ，０）、（Ｈ，０）、および（Ｗ，Ｈ）であり、ＷおよびＨは、現在のブロックの幅および高さである。
各制御点の動き情報は、以下の優先順位に従って取得される。
－ＣＰ１の場合、チェックの優先順位はＢ２－＞Ｂ３－＞Ａ２である。利用可能であれば、Ｂ２が使用される。一方、Ｂ２が利用可能であれば、Ｂ３が使用される。Ｂ２とＢ３の両方が利用不可能な場合、Ａ２が使用される。３つの候補のすべてが利用不可能な場合、ＣＰ１の動き情報を取得することができない。
－ＣＰ２の場合、チェックの優先順位はＢ１－＞Ｂ０である。
－ＣＰ３の場合、チェックの優先順位はＡ１－＞Ａ０である。
－ＣＰ４の場合、Ｔが使用される。
ｂ）次に、制御点の組み合わせを使用して、アフィンマージ候補を構築する。
Ｉ．６パラメータアフィン候補を構築するためには、３つの制御点の動き情報が必要である。３つの制御点は、以下の４つの組み合わせ（｛ＣＰ１，ＣＰ２，ＣＰ４｝、｛ＣＰ１，ＣＰ２，ＣＰ３｝、｛ＣＰ２，ＣＰ３，ＣＰ４｝、｛ＣＰ１，ＣＰ３，ＣＰ４｝）の１つから選択できる。組み合わせ｛ＣＰ１，ＣＰ２，ＣＰ３｝、｛ＣＰ２，ＣＰ３，ＣＰ４｝、｛ＣＰ２，ＣＰ３，ＣＰ４｝、｛ＣＰ１，ＣＰ３，ＣＰ４｝は、左上、右上、および左下の制御点で表現される６パラメータ動きモデルに変換される。
ＩＩ．４パラメータアフィン候補を構築するためには、２つの制御点の動き情報が必要である。２つの制御点は、２つの組み合わせ（｛ＣＰ１，ＣＰ２｝、｛ＣＰ１，ＣＰ３｝）のうちの１つから選択できる。２つの組み合わせは、左上および右上の制御点で表現される４パラメータ動きモデルに変換される。
ＩＩＩ．構築されたアフィン候補の組み合わせは、以下の順にて候補リストに挿入される。
｛ＣＰ１，ＣＰ２，ＣＰ３｝、｛ＣＰ１，ＣＰ２，ＣＰ４｝、｛ＣＰ１，ＣＰ３，ＣＰ４｝、｛ＣＰ２，ＣＰ３，ＣＰ４｝、｛ＣＰ１，ＣＰ２｝、｛ＣＰ１，ＣＰ３｝
ｉ．各組み合わせについて、各ＣＰに対するリストＸの参照インデックスがチェックされ、それらがすべて同じである場合、この組み合わせはリストＸに対して有効なＣＰＭＶを有する。組み合わせがリスト０およびリスト１の両方に対して有効なＣＰＭＶを有していない場合、この組み合わせは無効としてマークされる。そうでない場合、それは有効であり、ＣＰＭＶはサブブロックマージリストに入れられる。
３）動きベクトルがゼロの場合のパディング
アフィンマージ候補リストにおける候補の数が５未満である場合、リストが一杯になるまで、ゼロ参照インデックスを有するゼロ動きベクトルが候補リストに挿入される。
具体的には、サブブロックマージ候補リストについて、ＭＶを有する４パラメータマージ候補が（０，０）に設定され、予測方向がリスト０からの単一予測（Ｐスライスの場合）、および、双方向予測（Ｂスライスの場合）に設定される。

【0299】

２．既存の実装形態の欠点
ＶＶＣに適用される場合、ＡＲＣには以下の問題がある。
１．ＡＲＣに関する情報をどのように信号通知するかは、まだ不明である。
２．参照ピクチャ、並置されたピクチャ、および現在のピクチャが同じ解像度を有していない場合、アフィン／ＴＭＶＰまたはＡＴＭＶＰをどのように適用するかは、依然として不明である。
３．ＡＲＣのためのダウンサンプリングまたはアップサンプリングフィルタの設計は、より優れた設計とすることができる。

【0300】

３．適応解像度変換方法の例
以下の詳細な発明は、一般的な概念を説明するための例であると考えられるべきである。これらの発明は狭い意味で解釈されるべきではない。さらに、これらの発明は、任意の方法で組み合わせることができる。
以下の説明において、ＳａｔＳｈｉｆｔ（ｘ，ｎ）は、以下のように定義される。

【0301】

【数6】

【0302】

Ｓｈｉｆｔ（ｘ，ｎ）は、Ｓｈｉｆｔ（ｘ，ｎ）＝（ｘ＋ｏｆｆｓｅｔ０）＞＞ｎとして定義される。
一例において、ｏｆｆｓｅｔ０および／またはｏｆｆｓｅｔ１は、（１＜＜ｎ）＞＞１または（１＜＜（ｎ－１））に設定される。別の例において、ｏｆｆｓｅｔ０および／またはｏｆｆｓｅｔ１は、０に設定される。
別の例において、ｏｆｆｓｅｔ０＝ｏｆｆｓｅｔ１＝（（１＜＜ｎ）＞＞１）－１または（（１＜＜（ｎ－１）））－１である。
Ｃｌｉｐ３（ｍｉｎ，ｍａｘ，ｘ）は、以下のように定義される。

【0303】

【数7】

【0304】

ｆｌｏｏｒ（ｘ）は、ｘ以下の最大整数として定義される。
Ｃｅｉｌ（ｘ）は、ｘ以上の最小の整数。
Ｌｏｇ２（ｘ）は、ｘの底を２とする対数として定義される。

【0305】

ＡＲＣのための信号通知
１．ＡＲＣに関するピクチャ寸法情報（幅および／または高さ）は、ＤＰＳ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ以外の映像ユニットにて信号通知されてもよいと提案する。
ａ．一例において、ＡＲＣに関するピクチャ寸法情報は、ＳＥＩ（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）メッセージにて信号通知されてよい。
ｂ．一例において、ＡＲＣに関するピクチャ寸法情報は、ＡＲＣのための個々の映像ユニットにおいて信号通知されてよい。例えば、映像ユニットは、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）、ＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｔｅｒＳｅｔ）、または他の名称として命名されてよい。
ｉ．一例において、ＲＰＳまたはＣＰＳと命名されたような、ＡＲＣのための個々の映像ユニットにおいて、幅および高さの２つ以上の組み合わせが信号通知されてよい。

【0306】

２．なお、ピクチャの寸法（幅または高さ）は、０次の指数ゴロム符号ではないように信号通知されてよいと提案する。
ａ．一例において、固定長符号またはユーナリー符号でコーディングされてよい。
ｂ．一例において、Ｋ次（Ｋ＞０）の指数ゴロム符号でコーディングされてもよい。
ｃ．寸法は、ＤＰＳ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダなどの映像ユニットにおいて、または、ＲＰＳもしくはＣＰＳと命名されたＡＲＣのための個々の映像ユニットにおいて信号通知されてよい。

【0307】

３．複数の解像度を信号通知する代わりに、解像度比を信号通知することを提案する。
ａ．一例において、１つの基本解像度の指示を信号通知してもよい。また、許容される比率の組み合わせ（例えば、水平比率、垂直比率）の指示をさらに信号通知してもよい。
ｂ．一例において、１つのピクチャの実際の解像度を示すために、許容される比の組み合わせの指示のインデックスがＰＰＳにて信号通知されてよい。

【0308】

４．単一の映像ユニット、例えばＤＰＳ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダなどにおいて、または、ＲＰＳもしくはＣＰＳと命名されたようなＡＲＣのための個々の映像ユニットにおいて、ピクチャの幅と高さの２つ以上の組み合わせが信号通知される場合、第１の組み合わせにおける幅と高さが共に第２の組み合わせにおける幅と高さであることが許可されないようにすることを提案する。

【0309】

５．信号通知される寸法（幅Ｗおよび高さＨ）は制約内になければならないことを提案する。
ａ．例えば、Ｗは、ＴＷ＿ｍｉｎ＜＝Ｗ＜＝ＴＷ＿ｍａｘを満たすべきである。
ｂ．例えば、Ｈは、ＴＨ＿ｍｉｎ＜＝Ｈ＜＝ＴＨ＿ｍａｘを満たすべきである。
ｃ．一例において、Ｗ－ＴＷ＿ｍｉｎ－Ｂが信号通知されてもよく、Ｂは、０などの固定値である。
ｄ．一例において、Ｈ－ＴＨ＿ｍｉｎ－Ｂが信号通知されてもよく、Ｂは、０などの固定値である。
ｅ．一例において、ＴＷ＿ｍａｘ－Ｗ－Ｂが信号通知されてもよく、Ｂは、０などの固定値である。
ｆ．一例において、ＴＨ＿ｍａｘ－Ｈ－Ｂが信号通知されてもよく、Ｂは、０などの固定値である。
ｇ．一例において、ＴＷ＿ｍｉｎおよび／またはＴＨ＿ｍｉｎが信号通知されてもよい。
ｈ．一例において、ＴＷ＿ｍａｘおよび／またはＴＨ＿ｍａｘが信号通知されてもよい。

【0310】

６．信号通知される寸法（幅Ｗおよび高さＨ）は、Ｗ＝ｗ＊Ｘ、およびＨ＝ｈ＊Ｙの形式でなければならず、ＸおよびＹは、例えば、Ｘ＝Ｙ＝４などの、予め定義された整数であることを提案する。
ａ．一例において、ｗおよびｈが信号通知される。ＷおよびＨは、ｗおよびｈから導出される。

【0311】

７．ピクチャ寸法情報（幅および／または高さ）は、予測方式でコーディングされてもよいことを提案する。
ａ．一例において、第１の幅（Ｗ１）と第２の幅（Ｗ２）との差、すなわち、Ｗ２－Ｗ１、が信号通知されてよい。
ｉ．代替的に、Ｗ２－Ｗ１－Ｂが信号通知されてもよく、Ｂは、１などの固定値である。
ｉｉ．一例において、Ｗ２はＷ１よりも大きくなるべきである。
ｉｉｉ．一例において、差は、ユーナリー符号、またはトランケイテッドユーナリー符号、または固定長符号、または固定長符号でコーディングされてもよい。
ｂ．一例において、第１の高さ（Ｈ１）と第２の高さ（Ｈ２）との差、すなわち、Ｈ２－Ｈ１が信号通知されてもよい。
ｉ．代替的に、Ｈ２－Ｈ１－Ｂが信号通知されてもよく、Ｂは、１などの固定値である。
ｉｉ．一例において、Ｈ２はＨ１よりも大きくなければならない。
ｉｉｉ．一例において、差は、ユーナリー符号、またはトランケイテッドユーナリー符号、または固定長符号、または固定長コーディングされてもよい。
ｃ．一例において、第１の幅（Ｗ１）と第２の幅（Ｗ２）との間の比、すなわち、Ｗ２／Ｗ１が信号通知されてもよい。例えば、Ｗ２＝Ｆ＊Ｗ１である場合、Ｆが信号通知される。別の例において、Ｗ２＝Ｓｈｉｆｔ（Ｆ＊Ｗ１，Ｐ）である場合、Ｆが信号通知され、Ｐは、精度を表す数であり、例えば、Ｐ＝１０である。
ｉ．代替的に、Ｆは、（Ｗ２＊Ｐ＋Ｗ１／２）／Ｗ１に等しくてよく、Ｐは、精度を表す数であり、例えば、Ｐ＝１０である。
ｉｉ．代替的に、Ｆ－Ｂが信号通知されてもよく、Ｂは、１などの固定値である。
ｉｉｉ．一例において、Ｗ２はＷ１よりも大きくなければならない。
ｉｖ．一例において、Ｆは、ユーナリー符号、またはトランケイテッドユーナリー符号、または固定長符号でコーディングされてもよく、または固定長コーディングされてもよい。
ｄ．一例において、第１の高さ（Ｈ１）と第２の高さ（Ｈ２）との間の比、すなわちＨ２／Ｈ１が信号通知されてもよい。例えば、Ｈ２＝Ｆ＊Ｈ１である場合、Ｆが信号通知される。別の例において、Ｈ２＝Ｓｈｉｆｔ（Ｆ＊Ｈ１，Ｐ）である場合、Ｆが信号通知され、Ｐは、精度を表す数であり、例えば、Ｐ＝１０である。
ｉ．代替的に、Ｆは、（Ｈ２＊Ｐ＋Ｈ１／２）／Ｈ１に等しくてもよく、Ｐは、精度を表す数であり、例えば、Ｐ＝１０である。
ｉｉ．代替的に、Ｆ－Ｂが信号通知されてもよく、Ｂは、１などの固定値である。
ｉｉｉ．一例において、Ｈ２はＨ１よりも大きくなければならない。
ｉｖ．一例において、差は、ユーナリー符号、またはトランケイテッドユーナリー符号、または固定長符号でコーディングされてもよく、または固定長コーディングされてもよい。
ｅ．一例において、Ｗ２／Ｗ１はＨ２／Ｈ１に等しくなければならず、Ｗ２／Ｗ１またはＨ２／Ｈ１のみが信号通知されるべきである。

【0312】

８．異なる解像度／解像度比を信号通知する場合、以下の追加の構文要素がさらに信号通知されてよいことを提案する。
ａ．構文要素は、ＣＴＵのサイズの指示であってもよい。
ｂ．構文要素は、最小コーディングユニットのサイズの指示であってもよい。
ｃ．構文要素は、最大および／または最小変換ブロックサイズの指示であってもよい。
ｄ．構文要素は、４分木および／または２分木／３分木の最大深さの指示であってもよい。
ｅ．一例において、追加の構文要素は、特定のピクチャ解像度にバインドされてもよい。

【0313】

参照ピクチャリスト
９．適合ビットストリームは、現在のピクチャとは異なる解像度の参照ピクチャが、同じ解像度の参照ピクチャに比べてより大きい参照インデックスを割り当てられることを満足するものとする。
ａ．代替的に、１つのピクチャ／スライス／タイル／タイルグループを復号化する前に、参照ピクチャリストの場合、現在のピクチャとは異なる解像度の参照ピクチャが、同じ解像度の参照ピクチャに比べてより大きい参照インデックスを割り当てられるように、参照ピクチャリストが再配列されてもよい。

【0314】

ＡＲＣによる時間的ブロック（例えば、ＴＭＶＰおよびＡＴＭＶＰ）からの動き予測
１０．２つのブロックＡとＢがあるとする。ブロックＡの参照ピクチャが現在のブロックと同じ解像度の参照ピクチャであり、ブロックＢの参照ピクチャが現在のブロックと異なる解像度の参照ピクチャである場合、ブロックＢの動き情報を使用してブロックＡを予測することを禁止することを提案する。
ａ．ブロックＡの参照ピクチャが現在のブロックと異なる解像度の参照ピクチャであり、ブロックＢの参照ピクチャが現在のブロックと同じ解像度の参照ピクチャである場合、ブロックＢの動き情報を使用してブロックＡを予測することを禁止することを提案する。

【0315】

１１．現在のピクチャと異なる解像度を有する参照ピクチャにおけるブロックからの予測を許可しないことを提案する。

【0316】

１２．参照ピクチャは、その幅が現在のピクチャの幅と異なるか、またはその高さが現在のピクチャの高さと異なる場合、並置された参照ピクチャでありえないようにすることを提案する。
ｂ．代替的に、参照ピクチャは、その幅が現在のピクチャの幅と異なり、かつ、その高さが現在のピクチャの高さと異なる場合、並置された参照ピクチャでありえない。

【0317】

１３．ＴＭＶＰ／ＡＴＭＶＰにおける並置されたブロック、またはＡＴＭＶＰにおける並置されたサブブロックをどのように見出すかは、並置された参照ピクチャと現在のピクチャとが同じピクチャ幅および高さを有するかどうかに依存してよい。
ａ．一例において、現在のピクチャの寸法がＷ０＊Ｈ０であり、並置された参照ピクチャの寸法がＷ１＊Ｈ１であるとすると、並置されたブロックの位置および／または寸法は、Ｗ０、Ｈ０、Ｗ１、およびＨ１に依存してよい。
ｉ．一例において、現在のブロックまたはサブブロックの左上座標が（ｘ，ｙ）であるとすると、並置されたブロックまたはサブブロックは、並置された参照ピクチャにおける位置（ｘ’，ｙ’）をカバーするブロックとして導出されてもよく、（ｘ’，ｙ’）は、ｘ’＝Ｒｘ＊（ｘ＋ｏｆｆｓｅｔＸ）＋ｏｆｆｓｅｔＸ’およびｙ’＝Ｒｙ＊（ｙ＋ｏｆｆｓｅｔＹ）＋ｏｆｆｓｅｔＹ’として計算してもよい。ｏｆｆｓｅｔＸ’とｏｆｆｓｅｔＹ’は、０のような値である。
１）一例において、現在のブロックまたは現在のサブブロックの寸法がｗ＊ｈであるとすると、（ｏｆｆｓｅｔＸ，ｏｆｆｓｅｔＹ）は（ｘ＋ｗ，ｙ＋ｈ）に等しくてもよい。
ａ）代替例において、（ｏｆｆｓｅｔＸ，ｏｆｆｓｅｔＹ）は、（ｘ＋ｗ／２，ｙ＋ｈ／２）に等しくてもよい。
ｂ）代替例において、（ｏｆｆｓｅｔＸ，ｏｆｆｓｅｔＹ）は、（ｘ＋ｗ／２－１，ｙ＋ｈ／２－１）に等しくてもよい。
ｃ）代替例において、（ｏｆｆｓｅｔＸ，ｏｆｆｓｅｔＹ）は、（０，０）に等しくてもよい。
２）一例において、Ｒｘ＝Ｗ１／Ｗ０である。
３）一例において、Ｒｙ＝Ｈ１／Ｈ０である。
４）１つの代替例において、ｘ’＝Ｓｈｉｆｔ（Ｒｘ＊（ｘ＋ｏｆｆｓｅｔＸ）
，Ｐ）であり、Ｐは、精度を表す値、例えば１０である。
ａ）Ｒｘは、Ｒｘ＝（Ｗ１＊Ｐ＋ｏｆｆｓｅｔ）／Ｗ０として導出されてもよく、ｏｆｆｓｅｔは、０またはＷ０／２などの整数である。
５）１つの代替例において、ｙ’＝Ｓｈｉｆｔ（Ｒｙ＊（ｙ＋ｏｆｆｓｅｔＹ），Ｐ）であり、Ｐは、精度を表す値、例えば１０である。
ａ）Ｒｙは、Ｒｙ＝（Ｈ１＊Ｐ＋ｏｆｆｓｅｔ）／Ｈ０として導出されてもよく、ｏｆｆｓｅｔは、０またはＨ０／２などの整数である。

【0318】

１４．現在のピクチャとは異なる解像度の参照ピクチャにおける参照サンプルをアップサンプリングまたはダウンサンプリングすることに加え、動き情報／符号情報をさらにアップサンプリングまたはダウンサンプリングすること、または、アップサンプリングまたはダウンサンプリングされた情報を、他のフレームにおける後続のブロックをコーディングするために利用できるようにすることを提案する。

【0319】

１５．並置された参照ピクチャの幅または高さが現在のピクチャの幅または高さと異なる場合、並置されたＭＶを記憶するバッファをアップサンプリングしてもよいし、ダウンサンプリングしてもよい。
ｂ．一例において、アップサンプリングされたまたはダウンサンプリングされたＭＶバッファ、および、アップサンプリングまたはダウンサンプリング前のＭＶバッファは、両方とも記憶されてもよい。
ｉ．代替的に、アップサンプリングまたはダウンサンプリング前のＭＶバッファを除外してもよい。
ｃ．一例において、アップサンプリングされたＭＶバッファにおける複数のＭＶは、アップサンプリングの前のＭＶバッファにおける１つのＭＶからコピーされる。
ｉ．例えば、アップサンプリングされたＭＶバッファにおける複数のＭＶは、アップサンプリング前のＭＶバッファにおいてＭＶが存在する領域に対応する領域にあってもよい。
ｄ．一例において、ダウンサンプリングされたＭＶバッファにおける１つのＭＶは、ダウンサンプリング前のＭＶバッファにおける複数のＭＶのうちの１つのＭＶから取り出されてもよい。
ｉ．例えば、ダウンサンプリングされたＭＶバッファにおける１つのＭＶは、ダウンサンプリング前のＭＶバッファにおいて複数のＭＶが存在する領域に対応する領域にあってもよい。

【0320】

１６．ＡＴＭＶＰにおける時間的ＭＶの導出は、現在のピクチャの寸法Ｗ０＊Ｈ０および並置されたピクチャの寸法Ｗ１＊Ｈ１に依存してよいことを提案する。
ｃ．例えば、並置されたピクチャの寸法と現在のピクチャの寸法とが同じでない場合、ｔＭＶとして表される時間的ＭＶがｔＭＶ’に変換されてよい。
ｉ．例えば、ｔＭＶ＝（ｔＭＶｘ，ｔＭＶｙ）、ｔＭＶ’＝（ｔＭＶｘ’，ｔＭＶｙ’）とすると、ｔＭＶｘ’は、ｔＭＶｘ’＝Ｒｘ＊ｔＭＶｘ＋ｏｆｆｓｅｔｘとして計算されてよく、ｔＭＶｙ’は、ｔＭＶｙ’＝Ｒｙ＊ｔＭＶｙ＋ｏｆｆｓｅｔｙとして算出されてよい。ｏｆｆｓｅｔｘおよびｏｆｆｓｅｔｙは、０などの値である。
１）一例において、Ｒｘ＝Ｗ１／Ｗ０である。
２）一例において、Ｒｙ＝Ｈ１／Ｈ０である。
３）１つの代替例において、ｔＭＶｘ’＝Ｓｈｉｆｔ（Ｒｘ＊（ｔＭＶｘ＋ｏｆｆｓｅｔＸ），Ｐ）またはＳａｔＳｈｉｆｔ（Ｒｘ＊（ｔＭＶｘ＋ｏｆｆｓｅｔＸ），Ｐ）であり、Ｐは、精度を表す値であり、例えば１０である。
ａ）Ｒｘは、Ｒｘ＝（Ｗ１＊Ｐ＋ｏｆｆｓｅｔ）／Ｗ０として導出されてもよく、ｏｆｆｓｅｔは、０またはＷ０／２などの整数である。
４）１つの代替例において、ｔＭＶｙ’＝Ｓｈｉｆｔ（Ｒｙ＊（ｔＭＶｙ＋ｏｆｆｓｅｔＹ），Ｐ）またはＳａｔＳｈｉｆｔ（Ｒｙ＊（ｔＭＶｙ＋ｏｆｆｓｅｔＹ），Ｐ）であり、Ｐは、精度を表す値であり、例えば１０である。
ａ）Ｒｙは、Ｒｙ＝（Ｈ１＊Ｐ＋ｏｆｆｓｅｔ）／Ｈ０として導出されてもよく、ｏｆｆｓｅｔは、０またはＨ０／２などの整数である。

【0321】

１７．ＴＭＶＰ／ＡＴＭＶＰにおける現在のブロックまたは現在のサブブロックのＭＶＰ（ＭＶＰｒｅｄｉｃｔｉｏｎ）の導出は、現在のピクチャの寸法、および／または、ＭＶＰが参照する参照ピクチャの寸法、および／または、並置されたピクチャの寸法、および／または、並置されたＭＶが参照する並置されたピクチャの参照ピクチャの寸法に依存してよいことを提案する。並置されたＭＶは、並置されたブロックの中にあるＭＶを示す。図２３は、現在のピクチャ（ＣｕｒＰｉｃ）、ＭＶＰが参照する参照ピクチャ（ＲｅｆＰｉｃ）、並置されたピクチャ（ＣｏｌＰｉｃ）、および並置されたＭＶが参照する並置されたピクチャの参照ピクチャ（ＲｅｆＣｏｌＰｉｃ）が、それぞれ時刻（またはＰＯＣ）Ｔ０、Ｔ１、Ｔ２、Ｔ３にある場合の例を示している。そして、それらの寸法はそれぞれ、Ｗ０＊Ｈ０、Ｗ１＊Ｈ１、Ｗ２＊Ｈ２、およびＷ３＊Ｈ３である。現在のブロック／サブブロックのＭＶＰは、ＭｖＣｕｒ＝（ＭｖＣｕｒＸ，ＭｖＣｕｒＹ）として表され、並置されたＭＶは、ＭｖＣｏｌ（ＭｖＣｏｌＸ，ＭｖＣｏｌＹ）として表される。
ｄ．ＭｖＣｕｒＸは、ＭｖＣｕｒＸ＝Ｒｘ＊ＭｖＣｏｌＸ＋ｏｆｆｓｅｔｘとして計算されてよく、ＭｖＣｕｒＹは、ＭｖＣｕｒＹ＝Ｒｙ＊ＭｖＣｏｌＹ＋ｏｆｆｓｅｔｙとして計算されてもよい。ｏｆｆｓｅｔｘおよびｏｆｆｓｅｔｙは、０などの値である。
ｅ．一例において、Ｒｘ＝Ｗ０／Ｗ２である。
ｆ．一例において、Ｒｙ＝Ｈ０／Ｈ２である。
ｇ．ある代替例では、ＭｖＣｕｒＸ＝Ｓｈｉｆｔ（Ｒｘ＊（ＭｖＣｏｌＸ＋ｏｆｆｓｅｔＸ），Ｐ）またはＭｖＣｕｒＸ＝ＳａｔＳｈｉｆｔ（Ｒｘ＊（ＭｖＣｏｌＸ＋ｏｆｆｓｅｔＸ），Ｐ）となり、Ｐは精度を表す値であり、例えば１０である。
ｉ．Ｒｘは、Ｒｘ＝（Ｗ０＊Ｐ＋ｏｆｆｓｅｔ）／Ｗ２として導出されてよく、ｏｆｆｓｅｔは、０またはＷ２／２などの整数である。
ｈ．１つの代替例では、ＭｖＣｕｒＹ＝Ｓｈｉｆｔ（Ｒｙ＊（ＭｖＣｏｌＹ＋ｏｆｆｓｅｔＹ），Ｐ）またはＭｖＣｕｒＹ＝ＳａｔＳｈｉｆｔ（Ｒｙ＊（ＭｖＣｏｌＹ＋ｏｆｆｓｅｔＹ），Ｐ）であり、Ｐは精度を表す値であり、例えば１０である。
ｉ．Ｒｙは、Ｒｙ＝（Ｈ０＊Ｐ＋ｏｆｆｓｅｔ）／Ｈ２として導出されてよく、ｏｆｆｓｅｔは、０またはＨ２／２などの整数である。
ｉ．一例において、（Ｗ３，Ｈ３）は、（Ｗ２，Ｈ２）に等しくなければならない。そうでない場合、ＭｖＣｏｌは利用不可能であると見なされてよい。
ｊ．一例において、（Ｗ０，Ｈ０）は、（Ｗ１，Ｈ１）に等しくなければならず、そうでなければ、ＭＶＣｕｒは、利用可能でないと見なされてよい。

【0322】

ＡＲＣにおける補間とスケーリング
１８．ＡＲＣのための１または複数のダウンサンプリングまたはアップサンプリングフィルタリング方法は、ＤＰＳ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダなどの映像ユニットにて、ＲＰＳもしくはＣＰＳと命名されたＡＲＣのための個々の映像ユニットにて、信号通知されてよいことを提案する。

【0323】

１９．ＪＶＥＴ－Ｎ０２７９のアプローチにおいて、ｈｏｒｉ＿ｓｃａｌｅ＿ｆｐおよび／またはｖｅｒｔ＿ｓｃａｌｅ＿ｆｐは、ＤＰＳ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダなどの映像ユニットにて、または、ＲＰＳもしくはＣＰＳと命名されたＡＲＣのための個々の映像ユニットにて信号通知されてよい。

【0324】

２０．ｈｏｒｉ＿ｓｃａｌｅ＿ｆｐおよび／またはｖｅｒｔ＿ｓｃａｌｅ＿ｆｐの導出、またはｂｕｌｌｅｔ８＿ｂｕｌｔ１１におけるＲｘおよび／またはＲｙの導出など、ＲＡＣにおけるスケーリング手法における任意の分割動作が、１または複数のテーブルが用いられてよい、１または複数の動作に置き換えまたは近似してもよいことを提案する。例えば、Ｐ１９０５２８９３０１に開示された方法は、分割動作を置き換えるかまたは近似するために使用されてもよい。

【0325】

上述した例は、以下に説明する方法のコンテキスト、例えば、方法２４００、２４１０、２４２０、２４３０、２４４０、２４５０、２４６０、２４７０、２４８０、および２４９０に含まれてもよく、これらの方法は、映像デコーダまたは映像エンコーダにおいて実装されてよい。

【0326】

図２４Ａは、例示的な映像処理のための方法のフローチャートを示す。方法２４００は、ステップ２４０２において、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を実行することを含む。いくつかの実施形態において、ビットストリーム表現は、フォーマット規則に準拠し、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされることの指示が、ヘッダ構文構造、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、およびＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）とは異なる構文構造のビットストリーム表現に含まれる。

【0327】

いくつかの実施形態において、ビットストリーム表現は、フォーマット規則に準拠し、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、Ｋ次の指数ゴロム符号でコーディングされている１または複数の映像ユニットの寸法が、ビットストリーム表現で信号通知され、Ｋは正の整数であり、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされているとことの指示が、構文構造のビットストリーム表現に含まれる。

【0328】

いくつかの実施形態において、ビットストリーム表現は、フォーマット規則に準拠し、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、高さ（Ｈ）と幅（Ｗ）がビットストリーム表現で信号通知され、ＨとＷは、正の整数であり、制約されており、フォーマット規則は、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされているとこと指示が、構文構造のビットストリーム表現に含まれる。

【0329】

図２４Ｂは、例示的な映像処理のための方法のフローチャートを示す。方法２４１０は、ステップ２４１２において、（ａ）映像の現在の映像ブロックの第１の時間的に近傍のブロックの第１の参照ピクチャの解像度が、現在のピクチャの解像度と同一であること、および（ｂ）現在の映像ブロックの第２の時間的に近傍のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と異なることを判定することを含む。

【0330】

方法２４１０は、ステップ２４１４において、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を、判定に起因して、無効化することにより、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することを含む。

【0331】

図２４Ｃは、例示的な映像処理方法のフローチャートを示す。方法２４２０は、ステップ２４２２において、（ａ）映像の現在の映像ブロックの第１の時間的に近傍のブロックの第１の参照ピクチャの解像度が、現在のピクチャの解像度と異なること、および（ｂ）現在の映像ブロックの第２の時間的に近傍のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と同一であることを判定することを含む。

【0332】

方法２４２０は、ステップ２４２４において、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を、判定に起因して、無効化することにより、映像の現在の映像ブロックとビットストリーム表現との間の変換を実行することを含む。

【0333】

図２４Ｄは、例示的な映像処理のための方法のフローチャートを示す。方法２４３０は、ステップ２４３２において、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた映像ブロックを有する参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度とは異なることを判定することを含む。

【0334】

方法２４３０は、ステップ２４３４において、参照ピクチャの映像ブロックに基づいた予測処理を、判定に起因して、無効化することにより、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することを含む。

【0335】

図２４Ｅは、例示的な映像処理のための方法のフローチャートを示す。方法２４４０は、ステップ２４４２において、ピクチャの少なくとも１つの寸法に基づいて、ピクチャが現在のピクチャの現在の映像ブロックのための並置された参照ピクチャとして使用することが許可されるかどうかに関する決定を実行することを含む。

【0336】

方法２４４０は、ステップ２４４４において、決定に基づいて、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することを含む。

【0337】

図２４Ｆは、例示的な映像処理のための方法のフローチャートを示す。方法２４５０は、ステップ２４５２において、映像の現在の映像ブロックの予測のために、並置されたブロックを有する並置された参照ピクチャの寸法が、現在の映像ブロックを有する現在のピクチャの寸法と同一であるとことの判定に基づいて、並置されたブロックを識別する。

【0338】

方法２４５０は、ステップ２４５４において、並置されたブロックを使用して、映像の現在の映像ブロックとビットストリーム表現との間の変換を実行することを含む。

【0339】

図２４Ｇは、例示的な映像処理のための方法のフローチャートを示す。方法２４６０は、ステップ２４６２において、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた参照ピクチャが、現在の映像ブロックを有する現在のピクチャの解像度とは異なる解像度を有することを判定する。

【0340】

方法２４６０は、ステップ２４６４において、映像の現在の映像ブロックとビットストリーム表現との間の変換の一部として、参照ピクチャの１または複数の参照サンプル、および現在の映像ブロックに対する動き情報または現在の映像ブロックに対するコーディング情報に対してアップサンプリング動作またはダウンサンプリング動作を実行することを含む。

【0341】

図２４Ｈは、例示的な映像処理のための方法のフローチャートを示す。方法２４７０は、ステップ２４７２において、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換のために、現在の映像ブロックを有する現在のピクチャの高さまたは幅が、現在の映像ブロックに関連付けられた並置された参照ピクチャの高さまたは幅と異なることを決定することを含む。

【0342】

方法２４７０は、ステップ２４７４において、決定に基づいて、並置された参照ピクチャの１または複数の動きベクトルを記憶するバッファに対してアップサンプリング動作またはダウンサンプリング動作を実行することを含む。

【0343】

図２４Ｉは、例示的な映像処理のための方法のフローチャートを示す。方法２４８０は、ステップ２４８２において、映像の現在の映像ブロックを含む現在のピクチャの寸法と、現在の映像ブロックに関連付けられた、並置されたピクチャの寸法に基づいて、現在の映像ブロックに適用されたＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理に関する情報を導出する。

【0344】

方法２４８０は、ステップ２４８４において、時間的動きベクトルを使用して、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することを含む。

【0345】

図２４Ｊは、例示的な映像処理のための方法のフローチャートを示す。方法２４９０は、ステップ２４９２において、映像の現在の映像ブロックに対してＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の適用のために、映像のビットストリーム表現を構成することを含む。いくつかの実施形態において、ＡＲＣ処理に関する情報がビットストリーム表現で信号通知され、現在の映像ブロックを有する現在のピクチャは第１の解像度を有し、ＡＲＣ処理は、現在の映像ブロックの一部を第１の解像度とは異なる第２の解像度で再サンプリングすることを有する。

【0346】

方法２４９０は、ステップ２４９４において、構成することに基づいて、現在の映像ブロックと現在の映像ブロックのビットストリーム表現との間で変換を実行することを含む。

【0347】

４．開示される技術の例示的な実装形態

【0348】

図２５は、映像処理装置２５００のブロック図である。装置２５００は、本明細書に記載の方法の１または複数を実装するために使用してもよい。装置２５００は、スマートフォン、タブレット、コンピュータ、ＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）受信機等に実施されてもよい。装置２５００は、１または複数のプロセッサ２５０２と、１または複数のメモリ２５０４と、映像処理ハードウェア２５０６と、を含んでもよい。１または複数のプロセッサ２５０２は、本明細書に記載される１または複数の方法（方法２４００、２４１０、２４２０、および２４３０を含むが、これに限定されない）を実装するように構成されてもよい。メモリ２５０４は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア２５０６は、本明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。

【0349】

いくつかの実施形態において、映像コーディング方法は、図２５を参照して説明したように、ハードウェアプラットフォームに実装される装置を使用して実施してもよい。

【0350】

開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを有効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが有効化される場合、エンコーダは、１つの映像ブロックを処理する際にこのツールまたはモードを使用するまたは実装するが、このツールまたはモードの使用に基づいて、結果として得られるビットストリームを必ずしも修正しなくてもよい。すなわち、映像のブロックから映像のビットストリーム表現への変換は、決定または判定に基づいて映像処理ツールまたはモードが有効化される場合に、この映像処理ツールまたはモードを使用する。別の例において、映像処理ツールまたはモードが有効化される場合、デコーダは、ビットストリームが映像処理ツールまたはモードに基づいて修正されたことを知って、ビットストリームを処理する。すなわち、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用して、映像のビットストリーム表現から映像のブロックへの変換を行う。

【0351】

開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを無効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが無効にされている場合、エンコーダは、映像のブロックを映像のビットストリーム表現に変換する際に、このツールまたはモードを使用しない。別の例において、映像処理ツールまたはモードが無効にされている場合、デコーダは、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用してビットストリームが修正されていないことを知って、ビットストリームを処理する。

【0352】

図２６は、本明細書で開示される様々な技術が実装され得る例示的な映像処理システム２６００を示すブロック図である。様々な実装形態は、システム２６００のコンポーネントの一部または全部を含んでもよい。システム２６００は、映像コンテンツを受信するための入力２６０２を含んでもよい。映像コンテンツは、未加工または非圧縮フォーマット、例えば、８または１０ビットのマルチコンポーネント画素値で受信されてもよく、または圧縮または符号化フォーマットで受信されてもよい。入力２６０２は、ネットワークインターフェース、周辺バスインターフェース、または記憶インターフェースを表してもよい。ネットワークインターフェースの例は、イーサネット（登録商標）、ＰＯＮ（ＰａｓｓｉｖｅＯｐｔｉｃａｌＮｅｔｗｏｒｋ）等の有線インターフェース、およびＷｉ－Ｆｉ（登録商標）またはセルラーインターフェース等の無線インターフェースを含む。

【0353】

システム２６００は、本明細書に記載される様々な符号化または符号化方法を実装することができるコーディングコンポーネント２６０４を含んでもよい。コーディングコンポーネント２６０４は、入力２６０２からの映像の平均ビットレートをコーディングコンポーネント２６０４の出力に低減し、映像のコーディングされた表現を生成してもよい。従って、このコーディング技術は、映像圧縮または映像コード変換技術と呼ばれることがある。コーディングコンポーネント２６０４の出力は、コンポーネント２６０６によって表されるように、記憶されてもよいし、接続された通信を介して送信されてもよい。入力２６０２において受信された、記憶されたまたは通信された映像のビットストリーム（またはコーディングされた）表現は、コンポーネント２６０８によって使用されて、表示インターフェース２６１０に送信される画素値または表示可能な映像を生成してもよい。ビットストリーム表現からユーザが見ることができる映像を生成する処理は、映像展開と呼ばれることがある。さらに、特定の映像処理動作を「コーディング」動作またはツールと呼ぶが、コーディングツールまたは動作は、エンコーダおよびそれに対応する、復号化の結果を逆にする復号化ツールまたは動作が、デコーダによって行われることが理解されよう。

【0354】

周辺バスインターフェースユニットまたは表示インターフェースユニットの例は、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）またはＨＤＭＩ（ＨｉｇｈＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ：登録商標）またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、ＳＡＴＡ（ＳｅｒｉａｌＡｄｖａｎｃｅｄＴｅｃｈｎｏｌｏｇｙＡｔｔａｃｈｅｍｅｎｔ）、ＰＣＩ、ＩＤＥインターフェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフォン、またはデジタルデータ処理および／または映像表示を実施可能な他のデバイス等の様々な電子デバイスに実施されてもよい。

【0355】

いくつかの実施形態において、下記のような技術的解決策を実装することができる。

【0356】

Ａ１．映像処理のための方法であって、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を実行することを有し、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、Ｋ次の指数ゴロム符号でコーディングされている１または複数の映像ユニットの寸法が、ビットストリーム表現で信号通知され、Ｋは正の整数であり、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされていることの指示が、構文構造のビットストリーム表現に含まれる、方法。

【0357】

Ａ２．寸法は、１または複数の映像ユニットのうちの映像ユニットの幅および高さの少なくとも１つを含む、解決策Ａ１に記載の方法。

【0358】

Ａ３．１または複数の映像ユニットはピクチャを含む、解決策Ａ１に記載の方法。

【0359】

Ａ４．構文構造は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、またはタイルグループヘッダである、解決策Ａ１に記載の方法。

【0360】

Ａ５．構文構造は、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）である、解決策Ａ１に記載の方法。

【0361】

Ａ６．映像処理のための方法であって、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を実行することを有し、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、１または複数の映像ユニットのうちの映像ユニットの高さ（Ｈ）と幅（Ｗ）がビットストリーム表現で信号通知され、ＨとＷは、正の整数であり、かつ、抑制されており、フォーマット規則は、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の映像セグメントへの適用を規定し、映像セグメントの１または複数の映像ユニットが異なる解像度でコーディングされていることの指示が、構文構造のビットストリーム表現に含まれる、方法。

【0362】

Ａ７．Ｗ≦ＴＷ_ｍａｘであり、ＴＷ_ｍａｘは正の整数である、解決策Ａ６に記載の方法。

【0363】

Ａ８．ＴＷ_ｍａｘはビットストリーム表現で信号通知される、解決策Ａ７に記載の方法。

【0364】

Ａ９．ＴＷ_ｍｉｎ≦Ｗであり、ＴＷ_ｍｉｎは正の整数である、解決策Ａ６に記載の方法。

【0365】

Ａ１０．ＴＷ_ｍｉｎはビットストリーム表現で信号通知される、解決策Ａ９に記載の方法。

【0366】

Ａ１１．Ｈ≦ＴＨ_ｍａｘであり、ＴＨ_ｍａｘは正の整数である、解決策Ａ６に記載の方法。

【0367】

Ａ１２．ＴＨ_ｍａｘはビットストリーム表現で信号通知される、解決策Ａ１１に記載の方法。

【0368】

Ａ１３．ＴＨ_ｍｉｎ≦Ｈであり、ＴＨ_ｍｉｎは正の整数である、解決策Ａ６に記載の方法。

【0369】

Ａ１４．ＴＨ_ｍｉｎはビットストリーム表現で信号通知される、解決策Ａ１３に記載の方法。

【0370】

Ａ１５．高さＨ＝ｈ×Ｙであり、幅Ｗ＝ｗ×Ｘであり、ｗ、ｈ、Ｘ、およびＹは正の整数であり、ｗ、ｈはビットストリーム表現で信号通知される、解決策Ａ６に記載の方法。

【0371】

Ａ１６．Ｘ＝Ｙ＝４である、解決策Ａ１５に記載の方法。

【0372】

Ａ１７．ＸおよびＹが予め定義された整数である、解決策Ａ１５に記載の方法。

【0373】

Ａ１８．１または複数の映像ユニットはピクチャを有する、解決策Ａ６に記載の方法。

【0374】

Ａ１９．映像処理のための方法であって、１または複数の映像ユニットを有する１または複数の映像セグメントを有する映像と、映像のビットストリーム表現との間の変換を実行することを有し、ビットストリーム表現は、フォーマット規則に準拠し、かつ、ＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理に関する情報を有し、フォーマット規則は、ＡＲＣ処理の映像セグメントへの適用を規定し、かつ、映像セグメントの１または複数の映像ユニットが、異なる解像度でコーディングされることの指示が、ヘッダ構文構造、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、およびＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）とは異なる構文構造のビットストリーム表現に含まれる、方法。

【0375】

Ａ２０．ＡＲＣ処理に関する情報は、１または複数の映像ユニットを有するピクチャの高さ（Ｈ）または幅（Ｗ）を有する、解決策Ａ１９に記載の方法。

【0376】

Ａ２１．ＡＲＣ処理に関する情報は、ＳＥＩ（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）メッセージで信号通知される、解決策Ａ１９またはＡ２０に記載の方法。

【0377】

Ａ２２．ヘッダ構文構造は、ピクチャヘッダ、スライスヘッダ、またはタイルグループヘッダを有する、解決策Ａ１９またはＡ２０に記載の方法。

【0378】

Ａ２３．ＡＲＣ処理に関する情報は、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）にて信号通知される、解決策Ａ１９またはＡ２０に記載の方法。

【0379】

Ａ２４．ＡＲＣ処理に関する情報は、１または複数の映像ユニットを有するピクチャの幅に対する高さの比を有する、解決策Ａ１９に記載の方法。

【0380】

Ａ２５．ＡＲＣ処理に関する情報は、１または複数の映像ユニットを有するピクチャの異なる幅に対する異なる高さの複数の比を有する、解決策Ａ１９に記載の方法。

【0381】

Ａ２６．複数の比のうちの許容される比に対応するインデックスは、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）にて信号通知される、解決策Ａ２５に記載の方法。

【0382】

Ａ２７．複数の比のうちの任意の１つの比は、複数の比のうちの任意の他の比と異なる、解決策Ａ２５に記載の方法。

【0383】

Ａ２８．情報は、（ｉ）第１の幅と第２の幅との差、（ｉｉ）第１の高さと第２の高さとの差、（ｉｉｉ）第１の幅と第２の幅との比、または（ｉｖ）第１の高さと第２の高さとの比のうちの少なくとも１つを含む、解決策Ａ１９に記載の方法。

【0384】

Ａ２９．情報は、ユーナリー符号、トランケイテッドユーナリー符号、または固定長符号にてコーディングされる、解決策Ａ２８に記載の方法。

【0385】

Ａ３０．ビットストリーム表現は更に、ＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）サイズを示す構文要素、最小ＣＵ（ＣｏｄｉｎｇＵｎｉｔ）サイズを示す構文要素、最大または最小ＴＢ（ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）サイズを示す構文要素、１または複数の映像ユニットに適用され得る分割処理の最大深さを示す構文要素、または特定のピクチャ解像度にバインドするように構成される構文要素のうちの少なくとも１つを含む、解決策Ａ１９に記載の方法。

【0386】

Ａ３１．１または複数の映像ユニットを有する現在のピクチャに関連付けられた第１の参照ピクチャは、現在のピクチャの解像度に等しい第１の解像度を有し、現在のピクチャに関連付けられた第２の参照ピクチャは、現在のピクチャの解像度よりも大きい第２の解像度を有し、第２の参照ピクチャの参照インデックスは、第１の参照ピクチャの参照インデックスよりも大きい、解決策Ａ１９に記載の方法。

【0387】

Ａ３２．変換は、ビットストリーム表現から１または複数の映像ユニットを生成する、解決策Ａ１９～Ａ３１のいずれかに記載の方法。

【0388】

Ａ３３．変換は、１または複数の映像ユニットからビットストリーム表現を生成する、解決策Ａ１９～Ａ３１のいずれかに記載の方法。

【0389】

Ａ３４．プロセッサと、命令を有する非一時的メモリとを有する、映像システムにおける装置であって、命令は、プロセッサにより実行されることにより、プロセッサに解決策Ａ１９～Ａ３３のいずれかに記載の方法を実装させる装置。

【0390】

Ａ３５．非一時的コンピュータ可読媒体に記憶されたコンピュータプログラムプロダクトであって、解決策Ａ１９～Ａ３３のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラムプロダクト。

【0391】

いくつかの実施形態において、下記のような技術的解決策を実装することができる。

【0392】

Ｂ１．映像処理のための方法であって、（ａ）映像の現在の映像ブロックの時間的に近傍の第１のブロックの第１の参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度と同一であること、および（ｂ）現在の映像ブロックの時間的に近傍の第２のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と異なること、を判定することと、判定に起因して、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を無効化することにより、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を有する、方法。

【0393】

Ｂ２．映像処理のための方法であって、（ａ）映像の現在の映像ブロックの時間的に近傍の第１のブロックの第１の参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度と異なること、および（ｂ）現在の映像ブロックの時間的に近傍の第２のブロックの第２の参照ピクチャの解像度が、現在のピクチャの解像度と同一であること、を判定することと、判定に起因して、第１の時間的に近傍のブロックの予測における第２の時間的に近傍のブロックの動き情報の使用を無効化することにより、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を有する、方法。

【0394】

Ｂ３．映像処理のための方法であって、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた映像ブロックを有する参照ピクチャの解像度が、現在の映像ブロックを有する現在のピクチャの解像度とは異なることを判定することと、判定に起因して、参照ピクチャの映像ブロックに基づく予測処理を無効化することにより、現在の映像ブロックと映像のビットストリーム表現との間の変換を行うことと、を有する、映像処理方法。

【0395】

Ｂ４．映像処理のための方法であって、ピクチャの少なくとも１つの寸法に基づいて、ピクチャを現在のピクチャの現在の映像ブロックのための並置された参照ピクチャとして使用することが許可されるかどうかに関する決定を実行することと、決定に基づいて、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を有する、方法。

【0396】

Ｂ５．参照ピクチャの少なくとも１つの寸法は、現在の映像ブロックを有する現在のピクチャの対応する寸法と異なり、かつ、参照ピクチャは、並置された参照ピクチャとして指定されない、解決策Ｂ４に記載の方法。

【0397】

Ｂ６．映像処理のための方法であって、映像の現在の映像ブロックの予測のために、並置されたブロックを有する並置された参照ピクチャの寸法が、現在の映像ブロックを有する現在のピクチャの寸法と同一であることの判定に基づいて、並置されたブロックを識別することと、並置されたブロックを使用して、現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を有する、映像処理方法。

【0398】

Ｂ７．予測は、ＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理またはＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理を有する、解決策Ｂ６に記載の方法。

【0399】

Ｂ８．現在のピクチャは寸法Ｗ０×Ｈ０を有し、並置された参照ピクチャは寸法Ｗ１×Ｈ１を有し、並置されたブロックの位置またはサイズは、Ｗ０、Ｈ０、Ｗ１またはＨ１のうちの少なくとも１つに基づき、Ｗ０、Ｈ０、Ｗ１、およびＨ１は正の整数である、解決策Ｂ７に記載の方法。

【0400】

Ｂ９．ＡＴＭＶＰ処理における時間的動きベクトルの導出は、Ｗ０、Ｈ０、Ｗ１、またはＨ１のうちの少なくとも１つに基づく、解決策Ｂ８に記載の方法。

【0401】

Ｂ１０．現在の映像ブロックのための動きベクトル予測の導出は、Ｗ０、Ｈ０、Ｗ１、またはＨ１のうちの少なくとも１つに基づく、解決策Ｂ８に記載の方法。

【0402】

Ｂ１１．映像処理のための方法であって、映像の現在の映像ブロックのために、現在の映像ブロックに関連付けられた参照ピクチャが、現在の映像ブロックを有する現在のピクチャの解像度とは異なる解像度を有することを判定することと、現在の映像ブロックと映像のビットストリーム表現との間の変換の一部として、参照ピクチャの１または複数の参照サンプル、および現在の映像ブロックに対する動き情報または現在の映像ブロックに対するコーディング情報においてアップサンプリング動作またはダウンサンプリング動作を実行することと、を有する、映像処理方法。

【0403】

Ｂ１２．現在の映像ブロックを有する現在のフレームと異なるフレームにおける後続の映像ブロックをコーディングするために、アップサンプリング動作またはダウンサンプリング動作に関する情報を使用することをさらに含む、解決策Ｂ１１に記載の方法。

【0404】

Ｂ１３．映像処理のための方法であって、映像の現在の映像ブロックと映像のビットストリーム表現との間の変換のために、現在の映像ブロックを有する現在のピクチャの高さまたは幅は、現在の映像ブロックに関連付けられた並置された参照ピクチャの高さまたは幅とは異なることを判定することと、判定に基づいて、並置された参照ピクチャの１または複数の動きベクトルを記憶するバッファに対してアップサンプリング動作またはダウンサンプリング動作を実行することと、を有する、方法。

【0405】

Ｂ１４．映像処理のための方法であって、映像の現在の映像ブロックを有する現在のピクチャの寸法と、現在の映像ブロックに関連付けられた、並置されたピクチャの寸法とに基づいて、現在の映像ブロックに適用されたＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理のための情報を導出することと、時間的動きベクトルを使用して現在の映像ブロックと映像のビットストリーム表現との間の変換を実行することと、を有する、方法。

【0406】

Ｂ１５．情報は、時間的動きベクトルを有する、解決策Ｂ１４に記載の方法。

【0407】

Ｂ１６．情報は、現在の映像ブロックのためのＭＶＰ（ＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）を含み、導出することは更に、ＭＶＰによって参照される参照ピクチャの寸法に基づく、解決策Ｂ１４に記載の方法。

【0408】

Ｂ１７．映像処理のための方法であって、映像の現在の映像ブロックに対するＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の適用のために、映像のビットストリーム表現を構成することであって、ＡＲＣ処理に関する情報は、ビットストリーム表現にて信号通知され、現在の映像ブロックを有する現在のピクチャは、第１の解像度を有し、ＡＲＣ処理は、第１の解像度とは異なる第２の解像度にて現在の映像ブロックの一部を再サンプリングすることを有する、ことと、構成することに基づいて、現在の映像ブロックと現在の映像ブロックの前記ビットストリーム表現との間の変換を実行することと、を有する、方法。

【0409】

Ｂ１８．ＡＲＣ処理に関する情報は、１または複数のアップサンプリングまたはダウンサンプリングフィルタリング方法のためのパラメータを有する、解決策Ｂ１７に記載の方法。

【0410】

Ｂ１９．ＡＲＣ処理に関する情報は、コーディングされた映像シーケンス内での解像度の変更を可能にするように、参照ピクチャをスケーリングするための水平方向のスケーリング係数または垂直方向のスケーリング係数を有する、解決策Ｂ１７に記載の方法。

【0411】

Ｂ２０．情報は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、または個々の映像ユニットにおいて信号通知される、解決策Ｂ１８またはＢ１９に記載の方法。

【0412】

Ｂ２１．個々の映像ユニットは、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）である、解決策Ｂ２０に記載の方法。

【0413】

Ｂ２２．水平スケーリング係数または垂直スケーリング係数を導出することは、１または複数のテーブルを使用して実装される分割動作を含む、解決策Ｂ１９に記載の方法。

【0414】

Ｂ２３．変換は、ビットストリーム表現から現在の映像ブロックを生成する、解決策Ｂ１～Ｂ２２のいずれかに記載の方法。

【0415】

Ｂ２４．変換は、現在の映像ブロックからビットストリーム表現を生成する、解決策Ｂ１～Ｂ２２のいずれかに記載の方法。

【0416】

Ｂ２５．プロセッサと、命令を有する非一時的メモリとを有する、映像システムにおける装置であって、命令は、プロセッサにより実行されることにより、プロセッサに、解決策Ｂ１～Ｂ２４のいずれかに記載の方法を実装させる装置。

【0417】

Ｂ２６．非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラムプロダクトであって、解決策Ｂ１～Ｂ２４のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラムプロダクト。

【0418】

いくつかの実施形態において、下記のような技術的解決策を実装することができる。

【0419】

Ｃ１．映像処理のための方法であって、現在の映像ブロックに対するＡＲＣ（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｏｎｖｅｒｓｉｏｎ）処理の適用のために、現在の映像ブロックのビットストリーム表現を構成することであって、ＡＲＣ処理に関する情報は、ビットストリーム表現で信号通知され、現在の映像ブロックは、第１の解像度を有し、ＡＲＣ処理は、第１の解像度とは異なる第２の解像度で現在の映像ブロックの一部を再サンプリングすることを有する、ことと、構成することに基づいて、現在の映像ブロックと現在の映像ブロックのビットストリーム表現との間の変換を実行することと、を有する、方法。

【0420】

Ｃ２．ＡＲＣ処理に関する情報は、現在の映像ブロックを有するピクチャの高さ（Ｈ）または幅（Ｗ）を有する、解決策Ｃ１に記載の方法。

【0421】

Ｃ３．ＡＲＣ処理に関する情報は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、およびタイルグループヘッダとは異なるＳＥＩ（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）メッセージにて信号通知される、解決策Ｃ１またはＣ２に記載の方法。

【0422】

Ｃ４．ＡＲＣ処理に関する情報は、個々の映像ユニットにて信号通知される、解決策Ｃ１またはＣ２に記載の方法。

【0423】

Ｃ５．個々の映像ユニットは、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）である、解決策Ｃ４に記載の方法。

【0424】

Ｃ６．ＡＲＣ処理に関する情報は、固定長符号またはユーナリー符号でコーディングされる、解決策Ｃ１～Ｃ５のいずれかに記載の方法。

【0425】

Ｃ７．ＡＲＣ処理に関する情報は、Ｋ次の指数ゴロム符号でコーディングされ、Ｋは正の整数である、解決策Ｃ１～Ｃ５のいずれかに記載の方法。

【0426】

Ｃ８．ＡＲＣ処理に関する情報は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、またはタイルグループヘッダにて信号通知される、解決策Ｃ１またはＣ２に記載の方法。

【0427】

Ｃ９．ＡＲＣ処理に関する情報は、現在の映像ブロックを有するピクチャの幅に対する高さの比を有する、解決策Ｃ１に記載の方法。

【0428】

Ｃ１０．ＡＲＣ処理に関する情報は、現在の映像ブロックを有するピクチャの異なる幅に対する異なる高さの複数の比を有する、解決策Ｃ１に記載の方法。

【0429】

Ｃ１１．複数の比のうちの許容される比に対応するインデックスが、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）にて信号通知される、解決策Ｃ１０に記載の方法。

【0430】

Ｃ１２．複数の比のうちの任意の１つの比率が、複数の比率のうちの任意の他の比率と異なる、解決策Ｃ１０に記載の方法。

【0431】

Ｃ１３．ＴＷ_ｍｉｎ≦Ｗ≦ＴＷ_ｍａｘであり、ＴＷ_ｍｉｎおよびＴＷ_ｍａｘは正の整数である、解決策Ｃ２に記載の方法。

【0432】

Ｃ１４．ＴＷ_ｍｉｎおよびＴＷ_ｍａｘは、現在の映像ブロックのビットストリーム表現にて信号通知される、解決策Ｃ１３に記載の方法。

【0433】

Ｃ１５．ＴＨ_ｍｉｎ≦Ｈ≦ＴＨ_ｍａｘであり、ＴＨ_ｍｉｎおよびＴＨ_ｍａｘは正の整数である、解決策Ｃ２に記載の方法。

【0434】

Ｃ１６．ＴＨ_ｍｉｎおよびＴＨ_ｍａｘは、現在の映像ブロックのビットストリーム表現にて信号通知される、解決策Ｃ１３に記載の方法。

【0435】

Ｃ１７．現在の映像ブロックを有するピクチャは、高さＨ＝ｈ×Ｙおよび幅Ｗ＝ｗ×Ｘを有し、ｗ、ｈ、Ｗ、Ｈ、Ｘ、およびＹは正の整数であり、ＸおよびＹは予め定義された整数であり、ＡＲＣ処理に関する情報はｗおよびｈを有する、解決策Ｃ１に記載の方法。

【0436】

Ｃ１８．Ｘ＝Ｙ＝４である、解決策Ｃ１７に記載の方法。

【0437】

Ｃ１９．ＡＲＣ処理に関する情報は、（ｉ）第１の幅と第２の幅との差、（ｉｉ）第１の高さと第２の高さとの差、（ｉｉｉ）第１の幅と第２の幅との比、または（ｉｖ）第１の高さと第２の高さとの比のうちの少なくとも１つを含む、解決策Ｃ１に記載の方法。

【0438】

Ｃ２０．情報は、ユーナリー符号、トランケイテッドユーナリー符号、または固定長符号でコーディングされる、解決策Ｃ１９に記載の方法。

【0439】

Ｃ２１．ビットストリーム表現は更に、ＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）サイズを示す構文要素、最小ＣＵ（ＣｏｄｉｎｇＵｎｉｔ）サイズを示す構文要素、最大または最小ＴＢ（ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）サイズを示す構文要素、現在の映像ブロックに適用され得る分割処理の最大深さを示す構文要素、または特定のピクチャ解像度にバインドするように構成される構文要素のうちの少なくとも１つを有する、解決策Ｃ１に記載の方法。

【0440】

Ｃ２２．映像処理の方法であって、現在の映像ブロックの予測のために、現在の映像ブロックの時間的に近傍のブロックの参照ピクチャを選択的に使用することに関する決定を実行することと、決定および現在の映像ブロックの参照ピクチャに基づいて、現在の映像ブロックと現在の映像ブロックのビットストリーム表現との間の変換を実行することと、を有する、方法。

【0441】

Ｃ２３．現在の映像ブロックの参照ピクチャの解像度は、現在の映像ブロックの解像度と同一であり、時間的に近傍のブロックの参照ピクチャの解像度は、現在の映像ブロックの解像度とは異なり、現在の映像ブロックの予測は、時間的に近傍のブロックに関連付けられた動き情報を使用しない、解決策Ｃ２２に記載の方法。

【0442】

Ｃ２４．現在の映像ブロックの参照ピクチャの解像度は、現在の映像ブロックの解像度と異なり、時間的に近傍のブロックの参照ピクチャの解像度は、現在の映像ブロックの解像度とは異なり、現在の映像ブロックの予測は、時間的に近傍のブロックに関連付けられた動き情報を使用しない、解決策Ｃ２２に記載の方法。

【0443】

Ｃ２５．映像処理の方法であって、現在の映像ブロックの参照ピクチャの少なくとも１つの寸法に基づいて、参照ピクチャの並置された参照ピクチャとしての指定に関する決定を実行することと、決定に基づいて、現在の映像ブロックと、現在の映像ブロックのビットストリーム表現との間の変換を実行することと、を有する、方法。

【0444】

Ｃ２６．参照ピクチャの少なくとも１つの寸法は、現在の映像ブロックを有する現在のピクチャの対応する寸法と異なり、前記参照ピクチャは、並置された参照ピクチャとして指定されない、解決策Ｃ２５に記載の方法。

【0445】

Ｃ２７．映像処理のための方法であって、現在の映像ブロックを予測するために、並置されたブロックに関連付けられた並置された参照ピクチャの寸法と、現在の映像ブロックを有する現在のピクチャの寸法との比較に基づいて、並置されたブロックを識別することと、識別に基づいて、現在の映像ブロックの予測を実行することと、を有する、方法。

【0446】

Ｃ２８．予測は、時間的動きベクトル予測処理またはＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）処理を有する、解決策Ｃ２７に記載の方法。

【0447】

Ｃ２９．現在のピクチャは寸法Ｗ０×Ｈ０を有し、並置された参照ピクチャは寸法Ｗ１×Ｈ１を有し、並置されたブロックの位置またはサイズは、Ｗ０、Ｈ０、Ｗ１、またはＨ１のうちの少なくとも１つに基づく、解決策Ｃ２７またはＣ２８に記載の方法。

【0448】

Ｃ３０．ＡＴＭＶＰ処理における時間的動きベクトルの導出は、Ｗ０、Ｈ０、Ｗ１、またはＨ１のうちの少なくとも１つに基づく、解決策Ｃ２９に記載の方法。

【0449】

Ｃ３１．現在の映像ブロックのための動きベクトル予測の導出は、Ｗ０、Ｈ０、Ｗ１、またはＨ１のうちの少なくとも１つに基づく、解決策Ｃ２９に記載の方法。

【0450】

Ｃ３２．ＡＲＣ処理に関する情報は、１または複数のアップサンプリングまたはダウンサンプリングフィルタリング方法のためのパラメータを有する、解決策Ｃ１に記載の方法。

【0451】

Ｃ３３．ＡＲＣ処理に関する情報は、ＣＶＳ（ＣｏｄｅｄＶｉｄｅｏＳｅｑｕｅｎｃｅ）内での解像度の変更を可能にするように、参照ピクチャをスケーリングするための水平方向のスケーリング係数または垂直方向のスケーリング係数を有する、解決策Ｃ１に記載の方法。

【0452】

Ｃ３４．情報は、ＤＰＳ（ＤｅｃｏｄｅｒＰａｒａｍｅｔｅｒＳｅｔ）、ＶＰＳ（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ）、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）、ＡＰＳ（ＡｄａｐｔｉｖｅＰａｒａｍｅｔｅｒＳｅｔ）、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、または個々の映像ユニットにて信号通知される、解決策Ｃ３２またはＣ３３に記載の方法。

【0453】

Ｃ３５．個々の映像ユニットは、ＲＰＳ（ＲｅｓｏｌｕｔｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）またはＣＰＳ（ＣｏｎｖｅｒｓｉｏｎＰａｒａｍｅｔｅｒＳｅｔ）である、解決策Ｃ３４に記載の方法。

【0454】

Ｃ３６．プロセッサと、命令を有する非一時的メモリとを有する、映像システムにおける装置であって、命令は、プロセッサにより実行されることにより、プロセッサに、解決策Ｃ１～Ｃ３５のいずれかに記載の方法を実施させる装置。

【0455】

Ｃ３７．非一時的コンピュータ可読媒体に記憶されたコンピュータプログラムプロダクトであって、解決策Ｃ１～Ｃ３５のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラムプロダクト。

【0456】

以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の技術は、添付の特許請求の範囲による場合を除き、限定されない。

【0457】

本特許明細書に記載された主題および機能操作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、様々なシステム、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの１または複数の組み合わせで実施してもよい。本明細書に記載された主題の実装形態は、１または複数のコンピュータプログラムプロダクト、すなわち、データ処理装置によって実行されるため、またはデータ処理装置の動作を制御するために、有形で非可搬性のコンピュータ可読媒体上に符号化されたコンピュータプログラム命令の１または複数のモジュールとして実装することができる。このコンピュータ可読媒体は、機械可読記憶装置、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす物質の組成物、またはこれらの１または複数の組み合わせであってもよい。「データ処理ユニット」または「データ処理装置」という用語は、例えば、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサ若しくはコンピュータを含み、データを処理するためのすべての装置、デバイス、および機械を含む。装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの１または複数の組み合わせを構成するコードを含むことができる。

【0458】

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる）は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部（例えば、マークアップ言語文書に格納された１または複数のスクリプト）に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル（例えば、１または複数のモジュール、サブプログラム、またはコードの一部を格納するファイル）に記憶されていてもよい。コンピュータプログラムを、１つのサイトに位置する１つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開することも可能である。

【0459】

本明細書に記載された処理およびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための１または複数のコンピュータプログラムを実行する１または複数のプログラマブルプロセッサによって行うことができる。処理およびロジックフローはまた、特定用途のロジック回路、例えば、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）またはＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）によって実行することができ、装置はまた、特別目的のロジック回路として実装することができる。

【0460】

コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の１または複数のプロセッサを含む。一般的に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための１または複数のメモリ装置とである。一般的に、コンピュータは、データを記憶するための１または複数の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリデバイス等の半導体メモリデバイスを含む。プロセッサおよびメモリは、特定用途のロジック回路によって補完されてもよく、または特定用途のロジック回路に組み込まれてもよい。

【0461】

本明細書は、図面とともに、例示のみを目的とするものであり、例示的とは例を意味することが意図される。本明細書において、「または」の使用は、文脈からそうでないことが明確に示されていない限り、「および／または」を含むことが意図される。

【0462】

本特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本明細書において別個の実施形態の文脈で説明されている特定の特徴は、１つの例において組み合わせて実装してもよい。逆に、１つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの１または複数の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられてもよい。

【0463】

同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で行われること、または示された全ての動作が行われることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。

【0464】

いくつかの実装形態および例のみが記載されており、この特許文献に記載され図示されているコンテンツに基づいて、他の実施形態、拡張および変形が可能である。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16A】

【図16B】

【図17】

【図18A】

【図18B】

【図19】

【図20】

【図21A】

【図21B】

【図22】

【図23】

【図24A】

【図24B】

【図24C】

【図24D】

【図24E】

【図24F】

【図24G】

【図24H】

【図24I】

【図24J】

【図25】

【図26】

【手続補正書】

【提出日】2023-04-28

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

映像データの処理の方法であって、
映像のビジュアルメディアデータと、前記映像のビットストリームとの間の変換のために、前記ビジュアルメディアデータに対する第１のコーディングモードに関連づけられた第１の情報を決定することと、
前記第１のコーディングモードに少なくとも基づいて、前記変換を実行することと、
を有し、
前記第１のコーディングモードは、前記ビジュアルメディアデータを含む現在のピクチャの解像度とは異なる１または複数の解像度を有する１または複数の参照ピクチャに基づいて、予測サンプルを導出することを含み、
前記現在のピクチャの前記解像度は、前記第１の情報にて示され、
前記第１の情報は、前記現在のピクチャの幅Ｗおよび前記現在のピクチャの高さＨの少なくとも１つを示し、
前記幅Ｗは、第１の値の整数倍であり、
前記高さＨは、第２の値の整数倍である、方法。

【請求項2】

前記第１の情報は、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）にて前記ビットストリームに含まれる、請求項１に記載の方法。

【請求項3】

前記第１の情報は、ＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）にて前記ビットストリームに含まれる、請求項１に記載の方法。

【請求項4】

前記幅Ｗは、最大値ＴＷ＿ｍａｘ以下であり、かつ、最小値ＴＷ＿ｍｉｎ以上であり、
前記高さＨは、最大値ＴＨ＿ｍａｘ以下であり、かつ、最小値ＴＨ＿ｍｉｎ以上である、請求項１から３のいずれか一項に記載の方法。

【請求項5】

前記最大値ＴＷ＿ｍａｘおよび／または前記最大値ＴＨ＿ｍａｘは、前記ビットストリームに含まれる、請求項４に記載の方法。

【請求項6】

前記第１の値および前記第２の値はそれぞれ、少なくとも１つの所定の値に基づく、請求項１から５のいずれか一項に記載の方法。

【請求項7】

前記所定の値は、正の整数である、請求項６に記載の方法。

【請求項8】

前記変換は、前記ビジュアルメディアデータを前記ビットストリームに符号化することを含む、請求項１から７のいずれか一項に記載の方法。

【請求項9】

前記変換は、前記ビジュアルメディアデータを前記ビットストリームから復号することを含む、請求項１から７のいずれか一項に記載の方法。

【請求項10】

プロセッサと、命令を有する非一時的メモリとを有する、映像データを処理するための装置であって、
前記命令は、前記プロセッサによって実行された際に、前記プロセッサに、
映像のビジュアルメディアデータと、前記映像のビットストリームとの間の変換のために、前記ビジュアルメディアデータに対する第１のコーディングモードに関連づけられた第１の情報を決定することと、
前記第１のコーディングモードに少なくとも基づいて、前記変換を実行することと、
を実行させ、
前記第１のコーディングモードは、前記ビジュアルメディアデータを含む現在のピクチャの解像度とは異なる１または複数の解像度を有する１または複数の参照ピクチャに基づいて、予測サンプルを導出することを含み、
前記現在のピクチャの前記解像度は、前記第１の情報にて示され、
前記第１の情報は、前記現在のピクチャの幅Ｗおよび前記現在のピクチャの高さＨの少なくとも１つを示し、
前記幅Ｗは、第１の値の整数倍であり、
前記高さＨは、第２の値の整数倍である、装置。

【請求項11】

プロセッサに、
映像のビジュアルメディアデータと、前記映像のビットストリームとの間の変換のために、前記ビジュアルメディアデータに対する第１のコーディングモードに関連づけられた第１の情報を決定することと、
前記第１のコーディングモードに少なくとも基づいて、前記変換を実行することと、
を実行させ、
前記第１のコーディングモードは、前記ビジュアルメディアデータを含む現在のピクチャの解像度とは異なる１または複数の解像度を有する１または複数の参照ピクチャに基づいて、予測サンプルを導出することを含み、
前記現在のピクチャの前記解像度は、前記第１の情報にて示され、
前記第１の情報は、前記現在のピクチャの幅Ｗおよび前記現在のピクチャの高さＨの少なくとも１つを示し、
前記幅Ｗは、第１の値の整数倍であり、
前記高さＨは、第２の値の整数倍である、命令を格納する非一時的コンピュータ可読媒体。

【請求項12】

映像処理装置によって実行された方法によって生成されたビットストリームを格納する非一時的コンピュータ可読記録媒体であって、
前記方法は、
映像のビジュアルメディアデータに対する第１のコーディングモードに関連づけられた第１の情報を決定することと、
前記第１のコーディングモードに少なくとも基づいて、前記ビジュアルメディアデータから前記ビットストリームを生成することと、
を有し、
前記第１のコーディングモードは、前記ビジュアルメディアデータを含む現在のピクチャの解像度とは異なる１または複数の解像度を有する１または複数の参照ピクチャに基づいて、予測サンプルを導出することを含み、
前記現在のピクチャの前記解像度は、前記第１の情報にて示され、
前記第１の情報は、前記現在のピクチャの幅Ｗおよび前記現在のピクチャの高さＨの少なくとも１つを示し、
前記幅Ｗは、第１の値の整数倍であり、
前記高さＨは、第２の値の整数倍である、非一時的コンピュータ可読記録媒体。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０００１

【補正方法】変更

【補正の内容】

【0001】

関連出願の相互参照
本願は、２０１９年５月１２日出願の国際特許出願第ＰＣＴ／ＣＮ２０１９／０８６５１３号の優先権および利益を主張する、２０２０年５月１２日出願の国際特許出願第ＰＣＴ／ＣＮ２０２０／０８９７４０号に基づく。上記出願の開示全体は、参照によりここに援用される。

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版