特表2023-546253 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ベイジン　バイトダンス　ネットワーク　テクノロジー　カンパニー　リミテッドの特許一覧 ▶ バイトダンス　インコーポレイテッドの特許一覧

特表2023-546253ＶＶＣ映像コーディングにおけるロールサンプルグループ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-11-01

(54)【発明の名称】ＶＶＣ映像コーディングにおけるロールサンプルグループ

(51)【国際特許分類】

H04N 19/70 20140101AFI20231025BHJP

【ＦＩ】

H04N19/70

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023524966

(86)(22)【出願日】2021-10-26

(85)【翻訳文提出日】2023-06-21

(86)【国際出願番号】 CN2021126299

(87)【国際公開番号】W WO2022089397

(87)【国際公開日】2022-05-05

(31)【優先権主張番号】PCT/CN2020/123540

(32)【優先日】2020-10-26

(33)【優先権主張国・地域又は機関】CN

(81)【指定国・地域】

(71)【出願人】

【識別番号】520476341

【氏名又は名称】北京字節跳動網絡技術有限公司

【氏名又は名称原語表記】ＢｅｉｊｉｎｇＢｙｔｅｄａｎｃｅＮｅｔｗｏｒｋＴｅｃｈｎｏｌｏｇｙＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】ＲｏｏｍＢ－００３５，２／Ｆ，Ｎｏ．３Ｂｕｉｌｄｉｎｇ，Ｎｏ．３０，ＳｈｉｘｉｎｇＲｏａｄ，ＳｈｉｊｉｎｇｓｈａｎＤｉｓｔｒｉｃｔＢｅｉｊｉｎｇ１０００４１Ｃｈｉｎａ

(71)【出願人】

【識別番号】520477474

【氏名又は名称】バイトダンスインコーポレイテッド

【氏名又は名称原語表記】ＢＹＴＥＤＡＮＣＥＩＮＣ．

【住所又は居所原語表記】１２６５５ＷｅｓｔＪｅｆｆｅｒｓｏｎＢｏｕｌｅｖａｒｄ，ＳｉｘｔｈＦｌｏｏｒ，ＳｕｉｔｅＮｏ．１３７ＬｏｓＡｎｇｅｌｅｓ，Ｃａｌｉｆｏｒｎｉａ９００６６ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】110002000

【氏名又は名称】弁理士法人栄光事務所

(72)【発明者】

【氏名】ワンイェクイ

(72)【発明者】

【氏名】ジャンリー

(72)【発明者】

【氏名】インハイビン

(72)【発明者】

【氏名】リリンユ

【テーマコード（参考）】

5C159

【Ｆターム（参考）】

5C159MA04

5C159MA05

5C159MA21

5C159MC11

5C159ME01

5C159RC12

5C159UA02

5C159UA05

5C159UA16

(57)【要約】

映像データを処理する仕組みが開示されている。ビジュアルメディアデータとビジュアルメディアデータファイルとの間で変換が行われる。ビジュアルメディアデータファイルは、レイヤのピクチャと、レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループと、グルーピングタイプパラメータとを含む。グルーピングタイプパラメータは、アクセスポイントとレイヤの関連レイヤとの対応を規定する。グルーピングタイプパラメータは、アクセスポイントが、１つ以上の段階的復号リフレッシュ（ＧＤＲ）ピクチャ、およびイントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャを含むことを規定するレイヤ識別子方式識別コードパラメータを含む。
【選択図】図６

【特許請求の範囲】

【請求項1】

レイヤのピクチャ、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループおよびグルーピングタイプパラメータを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行い、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
映像データ処理方法。

【請求項2】

前記変換は、
ビジュアルメディアファイル内の前記レイヤにピクチャを符号化することと、
アクセスポイントを規定するロールサンプルグループを前記レイヤに決定することと、
前記グルーピングタイプパラメータをメディアファイルに符号化することと、
前記ビジュアルメディアファイルを記憶することと、を含む、
請求項１に記載の方法。

【請求項3】

前記変換は、
前記レイヤにコーディングされたピクチャを含むビジュアルメディアファイルを受信することと、
メディアファイルからロールサンプルグループを取得することと、前記ロールサンプルグループは、前記レイヤへの前記アクセスポイントを規定し、
前記メディアファイルから前記グルーピングタイプパラメータを取得することと、
前記グルーピングタイプパラメータに基づき前記メディアファイルを復号化することと、を含む、
請求項１に記載の方法。

【請求項4】

前記グルーピングタイプパラメータは、各ビットが前記関連レイヤの１つを規定する複数のビットを含むターゲットレイヤパラメータを含む、
請求項１から請求項３のいずれか１項に記載の方法。

【請求項5】

前記レイヤ識別子方式識別コードパラメータは、前記アクセスポイントが前記関連レイヤのみに適用されることを規定する、
請求項１から請求項４のいずれか１項に記載の方法。

【請求項6】

前記レイヤ識別子方式識別コードパラメータは、前記アクセスポイントがすべての前記レイヤに適用されることを規定する、
請求項１から請求項５のいずれか１項に記載の方法。

【請求項7】

前記グルーピングタイプパラメータはｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、前記レイヤ識別子方式識別コードパラメータはｌａｙｅｒ＿ｉｄｍｅｔｈｏｄ＿ｉｄｃと表される、
請求項１から請求項６のいずれか１項に記載の方法。

【請求項8】

前記関連レイヤのすべてのアクセスポイントがＧＤＲピクチャであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃがゼロに設定される、
請求項１から請求項７のいずれか１項に記載の方法。

【請求項9】

前記関連レイヤのすべてのアクセスポイントがＧＤＲピクチャであり、前記アクセスポイントが前記関連レイヤのみに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に設定される、
請求項１から請求項８のいずれか１項に記載の方法。

【請求項10】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２に設定される、
請求項１から請求項９のいずれか１項に記載の方法。

【請求項11】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントが前記関連レイヤにのみ適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは３に設定される、
請求項１から請求項１０のいずれか１項に記載の方法。

【請求項12】

プロセッサと、その上に命令を有する非一時的メモリと、を備える映像データ処理装置であって、前記プロセッサによる実行時に、前記命令は、前記プロセッサに、
レイヤのピクチャ、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループおよびグルーピングタイプパラメータを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行わせ、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
映像データ処理装置。

【請求項13】

前記変換は、
ビジュアルメディアファイル内の前記レイヤにピクチャを符号化することと、
アクセスポイントを規定するロールサンプルグループを前記レイヤに決定することと、
前記グルーピングタイプパラメータをメディアファイルに符号化することと、
前記ビジュアルメディアファイルを記憶することと、を含む、
請求項１２に記載の装置。

【請求項14】

【請求項15】

前記グルーピングタイプパラメータは、各ビットが前記関連レイヤの１つを規定する複数のビットを含むターゲットレイヤパラメータを含む、
請求項１２から請求項１４のいずれか１項に記載の装置。

【請求項16】

前記レイヤ識別子方式識別コードパラメータは、前記アクセスポイントが前記関連レイヤのみに適用されることを規定する、
請求項１２から請求項１５のいずれか１項に記載の装置。

【請求項17】

前記レイヤ識別子方式識別コードパラメータは、前記アクセスポイントがすべての前記レイヤに適用されることを規定する、
請求項１２から請求項１６のいずれか１項に記載の装置。

【請求項18】

前記グルーピングタイプパラメータはｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、前記レイヤ識別子方式識別コードパラメータはｌａｙｅｒ＿ｉｄｍｅｔｈｏｄ＿ｉｄｃと表される、
請求項１２から請求項１７のいずれか１項に記載の装置。

【請求項19】

前記関連レイヤのすべてのアクセスポイントがＧＤＲピクチャであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃがゼロに設定される、
請求項１２から請求項１８のいずれか１項に記載の装置。

【請求項20】

関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントが関連するレイヤのみに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは１に設定される、
請求項１２から請求項１９のいずれか１項に記載の装置。

【請求項21】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２に設定される、
請求項１２から請求項２０のいずれか１項に記載の装置。

【請求項22】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントが前記関連レイヤにのみ適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは３に設定される、
請求項１２から請求項２１のいずれか１項に記載の装置。

【請求項23】

ビデオコーディングデバイスによって使用するためのコンピュータプログラム製品を含む非一時的のコンピュータ可読媒体であって、前記コンピュータプログラム製品は、プロセッサによって実行されると、前記ビデオコーディングデバイスに請求項１から請求項１１のいずれか１項に記載の方法を実行させるように、非一時的なコンピュータ可読媒体に格納されたコンピュータ実行命令を含む、
非一時的のコンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本特許出願は、Ｙｅ－ＫｕｉＷａｎｇらによって２０２０年１０月２６日に出願された国際出願番号ＰＣＴ／ＣＮ２０２０／１２３５４０の利益を主張し、タイトルは「ＳｉｇｎａｌｌｉｎｇｏｆＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＩｎｆｏｒｍａｔｉｏｎａｎｄｔｈｅ ‘Ｒｏｌｌ’ ＳａｍｐｌｅＧｒｏｕｐｉｎＶＶＣＶｉｄｅｏＦｉｌｅｓ」であり、これは、参照によりここに組み込まれるものとする。

【0002】

本特許明細書は、ファイルフォーマットによるデジタルオーディオ映像媒体情報の生成、記憶域および消費に関するものである。

【背景技術】

【0003】

デジタル映像は、インターネットおよび他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信および表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予測される。

【発明の概要】

【0004】

第１の態様は、レイヤ内のピクチャ、レイヤへのアクセスポイントを指定するランダムアクセスリカバリポイント（ロール）サンプルグループおよびグルーピングタイプパラメータを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行い、グルーピングタイプパラメータは、アクセスポイントとレイヤの関連レイヤとの間の対応を指定し、アクセスポイントが１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャおよびイントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャの両方を有する１つ以上の混合ネットワーク抽象レイヤ（ＮＡＬ）ユニットピクチャの１つ以上を含むことを指定するレイヤ識別子方式識別コードパラメータを含む、映像データ処理方法に関する。

【0005】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、変換が、ピクチャをビジュアルメディアファイルのレイヤに符号化することと、アクセスポイントをレイヤに指定するロールサンプルグループを決定することと、グルーピングタイプパラメータをメディアファイルに符号化することと、ビジュアルメディアファイルを格納することと、を含むことを規定する。

【0006】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、変換が、レイヤにコーディングされたピクチャを含むビジュアルメディアファイルを受け取り、メディアファイルからロールサンプルグループを取得し、ロールサンプルグループはレイヤへのアクセスポイントを規定し、メディアファイルからグルーピングタイプパラメータを取得し、グルーピングタイプパラメータに基づいてメディアファイルを復号化することを含むことを規定する。

【0007】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、グルーピングタイプパラメータは各ビットが関連するレイヤ１つを規定する複数のビットを含むターゲットレイヤパラメータを含むことを規定する。

【0008】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤ識別子方式識別コードパラメータは、アクセスポイントが該当するレイヤにのみ適用されることを規定する。

【0009】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤ識別子方式識別コードパラメータは、アクセスポイントがすべてのレイヤに適用されることを規定する。

【0010】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、グルーピングタイプパラメータは、ｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、レイヤ識別子方式識別コードパラメータはｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃと表されることを規定する。

【0011】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤのアクセスポイントが全てＧＤＲピクチャであり、アクセスポイントが全てのレイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは０が設定されることを規定する。

【0012】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤのアクセスポイントが全てＧＤＲピクチャであり、レイヤのみに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃに１が設定されることを規定する。

【0013】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤのアクセスポイントがＧＤＲピクチャ、混合されたＮＡＬユニットピクチャまたはそれらの組み合わせであり、アクセスポイントが全レイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃには２が設定されることを規定する。

【0014】

任意選択的に、前述の態様のいずれかにおいて、別の実施態様は、レイヤのアクセスポイントがＧＤＲピクチャ、ＮＡＬユニットピクチャまたはそれらの組み合わせであり、アクセスポイントがレイヤにのみ適用されることを規定される場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃには３が設定されることを規定する。

【0015】

第２の態様は、プロセッサと、命令を備えた非一時的メモリとを備える映像データ処理装置に関し、プロセッサによる命令の実行時に、命令は、プロセッサに、レイヤへのアクセスポイントを指定するランダムアクセスリカバリポイント（ロール）サンプルグループおよびグルーピングタイプパラメータを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行わせ、グルーピングタイプパラメータは、アクセスポイントとレイヤの関連レイヤとの間の対応を指定し、アクセスポイントが１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャおよびイントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャの両方を有する１つ以上の混合ネットワーク抽象レイヤ（ＮＡＬ）ユニットピクチャの１つ以上を含むことを指定するレイヤ識別子方式識別コードパラメータを含む。

【0016】

【0017】

【0018】

【0019】

【0020】

【0021】

【0022】

【0023】

【0024】

【0025】

【0026】

第３の態様は、ビデオコーディングデバイスによって使用するためのコンピュータプログラム製品を含む非一過性のコンピュータ可読媒体に関し、コンピュータプログラム製品は、プロセッサによって実行されるとビデオコーディングデバイスに先のいずれかのアスペクトの方法を実行させるように、非一過性のコンピュータ可読媒体上に格納されたコンピュータ実行可能命令を含む。

【0027】

明確にするために、前述の実施形態のいずれか１項を、他の前述の実施形態のいずれか１項以上と組み合わせて、本開示の範囲内で新たな実施形態を作成することができる。

【0028】

これらおよび他の特徴は、添付の図面および特許請求の範囲と併せて以下の詳細な説明からより明確に理解されるであろう。

【0029】

本開示を完全に理解するために、添付の図面および詳細な説明と併せて、以下の簡単な説明を参照し、ここで、同様の参照数字は同様の部分を表すものとする。

【図面の簡単な説明】

【0030】

【図1】図１は、映像データのＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（ＶＶＣ）ビットストリームを含むメディアファイルの一例の概略図である。

【図2】図２は、ロールサンプルグループを符号化する方法の一例を示すフローチャートである。

【図3】図３は、ロールサンプルグループの復号化方法の一例を示すフローチャートである。

【図4】図４は、映像処理システムの一例を示すブロック図である。

【図5】図５は、映像処理装置の一例を示すブロック図である。

【図6】図６は、映像処理方法の例示的な方法を示すフローチャートである。

【図7】図７は、例示的な映像コーディングシステムを説明するブロック図である。

【図8】図８は、エンコーダの一例を示すブロック図である。

【図9】図９は、デコーダの一例を示すブロック図である。

【図10】図１０は、エンコーダの一例を示す模式図である。

【発明を実施するための形態】

【0031】

１つ以上の実施形態の例示的な実装が以下に提供されるが、開示されたシステムおよび／または方法は、現在知られているか、または今後開発されるかに関わらず、任意の数の技術を使用して実装され得ることが、最初に理解されたい。本開示は、決して、本明細書で説明される例示的な実装形態、図面、および技術に限定されるべきではなく、添付の特許請求の範囲の範囲内で、それらの均等物の全範囲とともに修正することが可能性がある。

【0032】

ＶＶＣ（Ｈ．２６６としても知られている）の用語は、理解を容易にするために一部の説明で用いられており、開示された技術の範囲を制限するためのものではない。このように、本明細書で説明する技術は、他の映像コーデックプロトコルおよび設計にも適用可能である。本明細書では、ＶＶＣ仕様または国際標準化機構（ＩＳＯ）ベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）ファイルフォーマットの現在の草案に関して、編集変更が、取り消したテキストを示す取り消し線と加えたテキストを示す斜体とによって示されている。

【0033】

上述した態様の実装形態例について、以下に説明する。

【0034】

本明細書は、映像ファイルフォーマットに関するものである。具体的には、この文書は、ＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）に基づくＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（ＶＶＣ）ビデオビットストリームを運ぶメディアファイルにおけるデコーダ構成情報および「ロール」サンプルグループのシグナリングに関連するものである。本アイデアは、任意のコーデック、例えばＶＶＣ規格、および任意のビデオファイルフォーマット、例えば開発中のＶＶＣビデオファイルフォーマットによってコーディングされたビデオビットストリームに対して、個別にまたは様々な組み合わせで適用することができる。

【0035】

適応型色変換（ＡＣＴ）、適応ループフィルタ（ＡＬＦ）、適応型動きベクトル解像度（ＡＭＶＲ）、適応パラメータセット（ＡＰＳ）、アクセスユニット（ＡＵ）、アクセスユニット区切り文字（ＡＵＤ）、高度映像コーディング（Ｒｅｃ．ＩＴＵ－ＴＨ．２６４｜ＩＳＯ／ＩＥＣ１４４９６－１０）（ＡＶＣ）、双予測（Ｂ）、ＣＵレベル重み（ＢＣＷ）を使用した双予測、双方向オプティカルフロー（ＢＤＯＦ）、ブロックベースのデルタパルスコード変調（ＢＤＰＣＭ）、バッファリング期間（ＢＰ）、双向オプティカルコーディング（ＣＡＢＡＣ）、コーディングブロック（ＣＢ）、コンスタントビットレート（ＣＢＲ）、クロスコンポーネント適応ループフィルタ（ＣＣＡＬＦ）、コーディングされたレイヤビデオストリーム（ＣＬＶＳ）、コーディングされたピクチャバッファ（ＣＰＢ）、クリーンランダムアクセス（ＣＲＡ）、巡回冗長検査（ＣＲＣ）、コーディングツリーブロック（ＣＴＢ）、コーディングツリーユニット（ＣＴＵ）、コーディングユニット（ＣＵ）、コーディングされた映像シーケンス（ＣＶＳ）、復号化ピクチャバッファ（ＤＰＢ）、復号化能力情報（ＤＣＩ）、依存ランダムアクセスポイント（ＤＲＡＰ）、デコーディングユニット（ＤＵ）、デコーディングユニット情報（ＤＵＩ）、指数－ゴロン（ＥＧ）、ｋ次指数ゴロン（ＥＧｋ）、エンドオブビットストリーム（ＥＯＢ）．エンドオブシーケンス（ＥＯＳ）、フィラーデータ（ＦＤ）、先入れ先出し（ＦＩＦＯ）、固定長（ＦＬ）、緑・青・赤（ＧＢＲ）、一般制約情報（ＧＣＩ）、漸進復号化リフレッシュ（ＧＤＲ）、ジオメトリパーティショニングモード（ＧＰＭ）、Ｒｅｃ．ＩＴＵ－ＴＨ．２６５｜ＩＳＯ／ＩＥＣ２３００８－２とも呼ばれる高効率ビデオコーディング（ＨＥＶＣ）、仮想参照デコーダ（ＨＲＤ）、仮想ストリームスケジューラ（ＨＳＳ）、イントラ（Ｉ）、イントラブロックコピー（ＩＢＣ）、瞬時復号更新（ＩＤＲ）、インターレイヤ参照ピクチャ（ＩＬＲＰ）、イントラランダムアクセスポイント（ＩＲＡＰ）、低周波復号変換（ＬＦＮＳＴ）、最も可能性の低いシンボル（ＬＰＳ）、最少ビット（ＬＳＢ）、長期参照画像（ＬＴＲＰ）、彩度スケーリング付き輝度マッピング（ＬＭＣＳ）、行列ベースのイントラ予測（ＭＩＰ）、最大確率記号（ＭＰＳ）、最上位ビット（ＭＳＢ）、多重変換選択（ＭＴＳ）、動きベクトル予測（ＭＶＰ）、ネットワーク抽象化レイヤ（ＮＡＬ）、出力レイヤセット（ＯＬＳ）、オぺーレーションポイント（ＯＰ）、オペレーションポイント情報（ＯＰＩ）、予測（Ｐ）、ピクチャヘッダ（ＰＨ）、画像順序カウント（ＰＯＣ）、ピクチャパラメータセット（ＰＰＳ）、オプティカルフローによる予測精密化（ＰＲＯＦ）、ピクチャタイミング（ＰＴ）、ピクチャユニット（ＰＵ）、量子化パラメータ（ＱＰ）、ランダムアクセス復号可能リーディングピクチャ（ＲＡＤＬ）、ランダムアクセススキップ型リーディングピクチャ（ＲＡＳＬ）、生バイトシーケンスペイロード（ＲＢＳＰ）、赤緑青（ＲＧＢ）、基準ピクチャリスト（ＲＰＬ）、サンプルアダプトオフセット（ＳＡＯ）、サンプルアスセスレシオ（ＳＡＲ）、補足エンハンスメント情報（ＳＥＩ）、スライスヘッダ（ＳＨ）、サブピクチャレベル情報（ＳＬＩ）、データビット列（ＳＯＤＢ）、シーケンスパラメータセット（ＳＰＳ）、短期参照画像（ＳＴＲＰ）、ステップワイズタイムサブレヤーアクセス（ＳＴＳＡ）、切り捨てライス（ＴＲ）、可変ビットレート（ＶＢＲ）、ビデオコーディングレイヤ（ＶＣＬ）、ビデオパラメータセット（ＶＰＳ）、Ｒｅｃ．ＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７とも呼ばれる多用途の補足拡張情報（ＶＳＥＩ）、映像ユーザビリティ情報（ＶＵＩ）、Ｒｅｃ．ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３ともよばれる汎用ビデオコーディング（ＶＶＣ）、波面並列処理（ＷＰＰ）。

【0036】

映像コーディング規格は、主にＩＴＵ－ＴとＩＳＯ／ＩＥＣの規格開発を通じて発展してきた。ＩＴＵ－ＴはＨ．２６１とＨ．２６３を、ＩＳＯ／ＩＥＣはＭＰＥＧ－１とＭＰＥＧ－４Ｖｉｓｕａｌを、そして両者は共同でＨ．２６２／ＭＰＥＧ－２ＶｉｄｅｏとＨ．２６４／ＭＰＥＧ－４ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）とＨ．２６５／ＨＥＶＣを規定している。Ｈ．２６２以降、映像コーディング規格は、時間的予測と変換コーディングとを利用したハイブリッド映像コーディング構造に基づく。ＨＥＶＣのさらに先の映像コーディング技術を探索するために、ＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）とＭＰＥＧが共同で設立したＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ（ＪＶＥＴ）がある。ＪＶＥＴでは多くの方法が採用され、共同探索モデル（ＪＥＭ）というリファレンスソフトウェアにまとめられた。その後、汎用映像コーディング（ＶＶＣ）プロジェクトが正式に開始されると、ＪＶＥＴはＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔｓＴｅａｍ（ＪＶＥＴ）に改名された。ＶＶＣは、ＨＥＶＣと比較して５０％のビットレート削減を目標としたコーディング規格である。ＶＶＣはＪＶＥＴによって最終的な決定がなされた。

【0037】

汎用映像コーディング（ＶＶＣ）規格（ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３）および関連付けられた汎用補足強化情報（ＶＳＥＩ）規格（ＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７）は、テレビ放送、ビデオ会議またはストレージメディアからの再生といった用途から、適応ビットレートストリーミング、ビデオ領域の抽出、合成、複数のコーディングされたビデオビットストリームからのコンテンツの結合、マルチビュービデオ、スケーラブルレイヤコーディング、ビューポート適応型３６０°没入型メディアといった高度な用途まで、幅広いアプリケーションでの使用を目的として設計されてきた。

【0038】

メディアストリーミングアプリケーションは、一般に、インターネットプロトコル（ＩＰ）、伝送制御プロトコル（ＴＣＰ）、およびハイパーテキスト転送プロトコル（ＨＴＴＰ）の伝送方法に基づき、一般に、ＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）のようなファイルフォーマットに依存する。このようなストリーミングシステムの１つに、ＤＡＳＨ（ｄｙｎａｍｉｃａｄａｐｔｉｖｅｓｔｒｅａｍｉｎｇｏｖｅｒＨＴＴＰ）がある。映像フォーマットをＩＳＯＢＭＦＦおよびＤＡＳＨで用いる場合、ＡＶＣファイルフォーマットやＨＥＶＣファイルフォーマットのような映像フォーマットに特定のファイルフォーマット仕様が、ＩＳＯＢＭＦＦトラックおよびＤＡＳＨ表現およびセグメントにおける映像コンテンツのカプセル化のために使用されるであろう。ビデオビットストリームに関する情報、例えば、プロファイル、ティア、およびレベル、ならびに他の多くの情報は、コンテンツ選択の目的のために、例えば、ストリーミングセッションの始まりにおける初期化とストリーミングセッション中のストリーム適応のための適切なメディアセグメントの選択のために、ファイルフォーマットレベルメタデータおよび／またはＤＡＳＨメディアプレゼンテーション記述（ＭＰＤ）として公開されることになるであろう。

【0039】

同様に、画像フォーマットをＩＳＯＢＭＦＦで使用する場合は、ＡＶＣ画像ファイルフォーマットやＨＥＶＣ画像ファイルフォーマットなど、画像フォーマットに固有のファイルフォーマットの仕様が採用されることになる。ＩＳＯＢＭＦＦに基づくＶＶＣ映像コンテンツの記憶域のファイルフォーマットであるＶＶＣビデオファイルフォーマットは、ＭＰＥＧが開発中である。ＩＳＯＢＭＦＦに基づき、ＶＶＣを使用してコーディングされた画像コンテンツを記憶域とするファイルフォーマットであるＶＶＣ画像ファイルフォーマットは、ＭＰＥＧにより開発中である。

【0040】

以下に、ＶＶＣ画像ファイルフォーマットとＭＰＥＧに基づくいくつかのＶＶＣファイルフォーマットの機能の設計を示す。この従属節は、ＩＳＯ／ＩＥＣ２３０９０－３映像コンテンツのためのデコーダ構成情報を規定する。このレコードは、サンプルエントリに格納されている場合、パラメータセット、ＤＣＩ、ＯＰＩ、ＳＥＩＮＡＬユニットだけでなく、その含むＮＡＬユニットの長さを示すために各サンプルで使用される長さフィールドのサイズを含む。このレコードは、外部フレームである（そのサイズは、それを含む構造によって供給される）。このレコードは、バージョンフィールドを含む。本明細書のこのバージョンは、このレコードのバージョン１を定義している。このレコードに対する互換性のない変化は、バージョン数の変化によって示される。バージョン数が認識できない場合、読取装置は、このレコードまたはこのレコードが適用されるストリームを復号化することを試みてはならない。このレコードの互換性のある拡張は、このレコードを拡張し、構成バージョンコードを変更しない。読取装置は、理解できるデータの定義を超えて、認識できないデータを無視できるように準備する必要がある。

【0041】

ＶＶＣＰｒｏｆｉｌｅＴｉｅｒＬｅｖｅｌＲｅｃｏｒｄ（ＶｖｃＰＴＬＲｅｃｏｒｄ）は、トラックがＶＶＣビットストリームをネイティブに含む場合、または「ｓｕｂｐ」トラック参照を解決する場合に、デコーダ構成レコードに存在する必要があり、この場合、ＶＶＣビットストリームに設定された特定の出力レイヤは、フィールドｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘによって示される。トラックのデコーダ構成レコードにおいてｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しい場合、トラックは、ＶＶＣトラックまたは「ｏｐｅｇ」エンティティグループのいずれかを参照することができるＩＤの「ｏｒｅｆ」トラック参照を持たなければならない。ＶｖｃＰＴＬＲｅｃｏｒｄの構文要素である彩度フォーマット特定コード（ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ）、およびマイナス８フォーマットのビット深度（ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８）の値は、このレコードによって記述されるストリームが復号化される際に参照されるすべてのパラメータセット（本段落の以下の文において「すべてのパラメータセット」と称する）に対して有効でなければならない。具体的には、以下の制限が適用される場合がある。

【0042】

プロファイル指示一般プロファイル特定コード（ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ）は、この構成レコードの出力レイヤセットインデックス（ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ）によって示された出力レイヤセットが準拠するプロファイルを示すものとする。この構成レコードのｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘで識別される出力レイヤセットの異なるＣＶＳに対して異なるプロファイルがマークされる場合、ストリーム全体がどのプロファイルに準拠するかを決定するために、ストリームを検査する必要があるかもしれない。ストリーム全体が検査されないか、または検査によってストリーム全体が準拠するプロファイルが存在しないことが明らかになった場合、ストリーム全体は、これらの規則を満たすことができる別個の構成レコードを持つ２つ以上のサブストリームに分割されることが期待される。階層指示ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇは、この構成レコードのｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘによって識別される出力レイヤセットが準拠する、すべてのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構文構造（すべてのパラメータセット内）で示される最上位の階層以上に相当する階層を示すものとする。

【0043】

ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏの各ビットは、この構成レコードのｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘで識別される出力レイヤセットが準拠するすべてのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構文構造（すべてのパラメータセット）のすべてのｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔｓ＿ｉｎｆｏ（）構文構造にビットが設定される場合にのみ、設定され得る。レベル指示ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃは、この構成レコードのｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘによって示される出力レイヤセットが準拠するすべてのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構文構造（すべてのパラメータセット内）の最上位レベル以上に相当する能力レベルを示すものとする。

【0044】

彩度フォーマット識別コード（ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ）には、以下の制約が適用される。設定記録が適用されるＶＶＣストリームがシングルレイヤビットストリームの場合、ＩＳＯ／ＩＥＣ２３０９０－３で定義されるｓｐｓ＿ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃの値は、現在のサンプルエントリ記述が適用されるサンプルのＶＣＬＮＡＬユニットが参照する全てのＳＰＳで同一であり、ｃｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃの値は、そのｓｐｓ＿ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃの値に等しくなければならない。そうでない場合（構成レコードが適用されるＶＶＣストリームがマルチレイヤビットストリーム）、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｃｈｒｏｍａ＿ｆｏｒｍａｔ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］の値は、］は、現在のサンプルエントリ記述が適用される全てのＣＶＳについて同じでなければならず、ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃの値はｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｃｈｒｏｍａ＿ｆｏｒｍａｔ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］］の値と等しいものでなければならない。

【0045】

ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８には、以下の制約が適用される。構成レコードが適用されるＶＶＣストリームが単一層ビットストリームである場合、ｓｐｓ＿ｂｉｔｄｅｐｔｈ＿ｍｉｎｕｓ８の値は、現在のサンプルエントリ記述が適用されるサンプルのＶＣＬＮＡＬユニットが参照するすべてのＳＰＳにおいて同じでなければならず、ｓｐｓ＿ｂｉｔｄｅｐｔｈ＿ｍｉｎｕｓ８の値は、そのｓｐｓ＿ｂｉｔｄｅｐｔｈ＿ｍｉｎｕｓ８の値に対して等しくなければならない。そうでない場合（構成レコードが適用されるＶＶＣストリームがマルチレイヤビットストリームである）、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｂｉｔｄｅｐｔｈ＿ｍｉｎｕｓ８［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］の値、］は、現在のサンプルエントリ記述が適用されるすべてのＣＶＳについて同じでなければならず、ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８の値は、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｂｉｔｄｅｐｔｈ＿ｍｉｎｕｓ８［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］］のその値と等しいものでなければならない。

【0046】

ｐｉｃｔｕｒｅ＿ｗｉｄｔｈには、以下の制約が適用される。構成レコードが適用されるＶＶＣストリームがシングルレイヤビットストリームである場合、ＩＳＯ／ＩＥＣ２３０９０－３に定義されるｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、現在のサンプルエントリ記述が適用されるサンプルのＶＣＬＮＡＬユニットが参照するすべてのＳＰＳにおいて同じでなければならず、ｐｉｃｔｕｒｅ＿ｗｉｄｔｈの値はｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値と同じでなければならない。そうでない場合（設定記録が適用されるＶＶＣストリームがマルチレイヤビットストリームである場合）、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｐｉｃ＿ｗｉｄｔｈ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］の値は、現在のサンプルエントリの記述が適用されるすべてのＣＶＳに対して同じ値でなければならず、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｐｉｃ＿ｗｉｄｔｈ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］］の値はその値にとって同等とする。

【0047】

ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔには、以下の制約が適用される。設定記録が適用されるＶＶＣストリームがシングルレイヤビットストリームである場合、ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、現在のサンプルエントリ記述が適用されるサンプルのＶＣＬＮＡＬユニットが参照するすべてのＳＰＳにおいて同じでなければならず、ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔの値はｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓのその値に比べて同等としなければならない。そうでない場合（設定記録が適用されるＶＶＣストリームがマルチレイヤビットストリームである場合）、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｐｉｃ＿ｈｅｉｇｈｔ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］］の値は、現在のサンプルエントリの記述が適用されるすべてのＣＶＳに対して同じ値でなければならず、ｖｐｓ＿ｏｌｓ＿ｄｐｂ＿ｐｉｃ＿ｈｅｉｇｈｔ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ］］の値はその値に対して同等でなければならない。

【0048】

ＶＶＣデコーダ構成記録には、ＶＶＣビデオエレメンタリーストリームが使用する彩度フォーマット、ビット深度、その他のフォーマット情報について明示的に指示する。ＶＵＩ情報の色空間やビット深度の指示が異なる２つのシーケンスは、２つの異なるＶＶＣサンプルエントリも採用される。

【0049】

初期化非ＶＣＬＮＡＬユニットを搭載するための配列がある。ＮＡＬユニットタイプは、ＤＣＩ、ＯＰＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、プレフィックスＡＰＳ、およびプレフィックスＳＥＩＮＡＬユニットを示すためにのみ制限されている。予約されたＮＡＬユニットタイプはさらに定義される可能性があり、読取装置はＮＡＬユニットタイプの予約値または未許可値を持つ配列を無視する必要がある。この寛容な動作は、エラーが発生しないように設計されており、本明細書でこれらの配列に後方互換性のある拡張を行う可能性を可能にするものである。サンプルエントリに含まれるＮＡＬユニットは、ＡＵＤおよびＯＰＩＮＡＬユニット（いずれか１項）の直後に含まれ、そうでない場合は、サンプルエントリを参照する第１のサンプルから再構成されたアクセスユニットの始まりに含まれる。

【0050】

配列は、ＤＣＩ、ＯＰＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、プレフィックスＡＰＳ、プレフィックスＳＥＩの順で行うことが推奨されます。

【0051】

ＶＶＣＰＴＬＲｅｃｏｒｄおよびＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄの構文例は以下の通りである：
ａｌｉｇｎｅｄ（８）ｃｌａｓｓＶｖｃＰＴＬＲｅｃｏｒｄ（ｎｕｍ＿ｓｕｂｌａｙｅｒｓ）｛
ｂｉｔ（２）ｒｅｓｅｒｖｅｄ＝０；
ｕｎｓｉｇｎｅｄｉｎｔ（６）ｎｕｍ＿ｂｙｔｅｓ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ；
ｕｎｓｉｇｎｅｄｉｎｔ（７）ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ；
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ；
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ；
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇ；
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ；
ｕｎｓｉｇｎｅｄｉｎｔ（８＊ｎｕｍ＿ｂｙｔｅｓ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ－２）ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ；
ｆｏｒ（ｉ＝ｎｕｍ＿ｓｕｂｌａｙｅｒｓ－２；ｉ＞＝０；ｉ－－）
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｐｔｌ＿ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］；
ｆｏｒ（ｊ＝ｎｕｍ＿ｓｕｂｌａｙｅｒｓ；ｊ＜＝８＆＆ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＞１；ｊ＋＋）
ｂｉｔ（１）ｐｔｌ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿ｂｉｔ＝０；
ｆｏｒ（ｉ＝ｎｕｍ＿ｓｕｂｌａｙｅｒｓ－２；ｉ＞＝０；ｉ－－）
ｉｆ（ｐｔｌ＿ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ［ｉ］）
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｉｄｃ［ｉ］；
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ；
ｆｏｒ（ｊ＝０；ｊ＜ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ；ｊ＋＋）
ｕｎｓｉｇｎｅｄｉｎｔ（３２）ｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｊ］；
｝
ａｌｉｇｎｅｄ（８）ｃｌａｓｓＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄ｛
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｃｏｎｆｉｇｕｒａｔｉｏｎＶｅｒｓｉｏｎ＝１；
ｂｉｔ（５）ｒｅｓｅｒｖｅｄ＝ ‘１１１１１’ｂ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｌｅｎｇｔｈＳｉｚｅＭｉｎｕｓＯｎｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ；
ｉｆ（ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ）｛。
ＶｖｃＰＴＬＲｅｃｏｒｄ（ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ）ｔｒａｃｋ＿ｐｔｌ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ａｖｇＦｒａｍｅＲａｔｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（３）ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ；
ｕｎｓｉｇｎｅｄｉｎｔ（３）ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８；
ｂｉｔ（６）ｒｅｓｅｒｖｅｄ＝ ‘１１１１１１’ｂ；
ｕｎｓｉｇｎｅｄ＿ｉｎｔ（１６）ｐｉｃｔｕｒｅ＿ｗｉｄｔｈ；
ｕｎｓｉｇｎｅｄ＿ｉｎｔ（１６）ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔ；
｝
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｎｕｍＯｆＡｒｒａｙｓ；
ｆｏｒ（ｊ＝０；ｊ＜ｎｕｍＯｆＡｒｒａｙｓ；ｊ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１）ａｒｒａｙ＿ｃｏｍｐｌｅｔｅｎｅｓｓ；
ｂｉｔ（２）ｒｅｓｅｒｖｅｄ＝０；
ｕｎｓｉｇｎｅｄｉｎｔ（５）ＮＡＬ＿ｕｎｉｔ＿ｔｙｐｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｎｕｍＮａｌｕｓ；
ｆｏｒ（ｉ＝０；ｉ＜ｎｕｍＮａｌｕｓ；ｉ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｎａｌＵｎｉｔＬｅｎｇｔｈ；
ｂｉｔ（８＊ｎａｌＵｎｉｔＬｅｎｇｔｈ）ｎａｌＵｎｉｔ；
｝
｝
｝

【0052】

上記の構文要素に対する意味論の例は以下の通りである。

【0053】

ｎｕｍ＿ｂｙｔｅｓ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏは、ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏフィールドの長さを規定するために用いる。ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏフィールドの長さは、ｎｕｍ＿ｂｙｔｅｓ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ＊８－２ビットである。値は０より大きくなければなりません。１に等しい値は、ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏフィールドによって示されるｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ（）構文構造のｇｃｉ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０であることを示す。

【0054】

ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ、ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇ、ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ、ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ［ｊ］、ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｉｄｃ［ｉ］、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ、およびｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｊ］は、フィールドまたは構文の一致する値を含む。ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ，ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ，ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇ，ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ，ｇｅｎｅｒａｌ＿ｃｏｎｓｔｒａｉｎｔ＿ｉｎｆｏ（），ｐｔｌ＿ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ［ｉ］，ｓｕｂｌａｙｅｒ＿ｌｅｖｅｌ＿ｉｄｃ［ｉ］，ｐｔｌ＿ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓおよびｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｊ］のそれぞれのフィールドまたは構文のマッチング値が、この設定レコードに適用するストリームに対して記述される。

【0055】

ｌｅｎｇｔｈＳｉｚｅＭｉｎｕｓＯｎｅｐｌｕｓ１は、この構成レコードが適用されるストリームにおけるＶＶＣビデオストリームサンプルのＮＡＬＵｎｉｔＬｅｎｇｔｈフィールドの長さをバイト単位で示したものである。例えば、１バイトのサイズは０で示され、このフィールドの値は、それぞれ１、２、４バイトで符号化された長さに対応する０、１、３のいずれかでなければならない。

【0056】

ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しい場合、トラックがｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓで規定される動作点に対応するＶＶＣビットストリームを含み、トラック内のすべてのＮＡＬユニットがその動作点に属することを指定する。ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しい場合、トラックは特定の動作点に対応するＶＶＣビットストリームを含まず、複数の出力レイヤセットに対応するＶＶＣビットストリームを含むか、出力レイヤセットを形成しない１つ以上の個々のレイヤ、またはＴｅｍｐｏｒａｌＩｄが０に等しいサブレイヤを除く個々のサブレイヤを含む可能性があることを指定する。

【0057】

ｔｒａｃｋ＿ｐｔｌは、トラックに含まれるＶＶＣビットストリームが表す出力レイヤセットのプロファイル、ティア、レベルを規定する。

【0058】

ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘは、トラックに含まれるＶＶＣビットストリームが表す出力レイヤセットのインデックスを規定する。ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘの値は、トラックに含まれるビットストリームを復号化するために、外部手段またはＯＰＩＮＡＬユニットがＶＶＣデコーダに提供する変数ＴａｒｇｅｔＯｌｓＩｄｘの値として使用することができる。

【0059】

ａｖｇＦｒａｍｅＲａｔｅは、この構成レコードが適用されるストリームの平均フレームレートを、フレーム／（２５６秒）の単位で示す。値０は、規定されていない平均フレームレートを示す。トラックが複数のレイヤを含み、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓで規定される操作点に対してサンプルが再構成される場合、操作点のビットストリームの平均アクセスユニットレートを与える。

【0060】

ｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅが１に等しい場合は、この構成レコードが適用されるストリームが定数フレームレートであることを示す。値２は、ストリームの各時間的層の表現が定数フレームレートであることを示す。値０は、ストリームが定数フレームレートである可能性とない可能性があることを示す。トラックが複数のレイヤを含み、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓによって規定される動作点に対してサンプルが再構築される場合、その動作点のビットストリームがアクセスユニットレートが一定であるかどうかの指標を示す。

【0061】

ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓが１以上であることは、この構成レコードが適用されるトラックが時間的にスケーラブルであり、含まれる時間的レイヤの数（時間的サブレイヤまたはサブレイヤとも呼ばれる）がｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓと同等であることを示す。値１は、この構成レコードが適用されるトラックが時間的にスケーラブルでないことを示す。値０は、この構成レコードが適用されるトラックが時間的にスケーラブルであるかどうかが不明であることを示す。

【0062】

ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃは、このトラックに適用される彩度フォーマットを示す。

【0063】

ｐｉｃｔｕｒｅ＿ｗｉｄｔｈは、このトラックに適用される最大ピクチャ幅をｌｕｍａサンプル単位で示す。

【0064】

ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔは、このトラックに適用される最大ピクチャの高さをｌｕｍａサンプル単位で示す。

【0065】

ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８は、このトラックに適用されるビット深度を示す。

【0066】

ｎｕｍＡｒｒａｙｓは、指示されたタイプのＮＡＬユニットの配列の数を示す。

【0067】

ａｒｒａｙ＿ｃｏｍｐｌｅｔｅｎｅｓｓが１に等しいとき、所与のタイプの全てのＮＡＬユニットが次の配列にあり、ストリームにはないことを示す。ａｒｒａｙ＿ｃｏｍｐｌｅｔｅｎｅｓｓが０に等しいとき、示されたタイプのＮＡＬユニットがさらにストリームにある可能性を示す。許容値は、サンプルエントリ名によって制約されている。

【0068】

ＮＡＬ＿ｕｎｉｔ＿ｔｙｐｅは、次の配列のＮＡＬユニットのタイプ（全てそのタイプであること）を示し、ＤＣＩ、ＯＰＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、プレフィックスＡＰＳまたはプレフィックスＳＥＩＮＡＬユニットを示す値のいずれかを取るよう制限される。

【0069】

ｎｕｍＮａｌｕｓは、この構成レコードが適用されるストリームの構成レコードに含まれる、指示されたタイプのＮＡＬユニットの数を示す。ＳＥＩ配列は、宣言的な性質のＳＥＩメッセージ、すなわち、ストリーム全体に関する情報を提供するＳＥＩメッセージのみを含むものとする。このようなＳＥＩの例としては、ユーザデータＳＥＩが考えられる。

【0070】

ｎａｌＵｎｉｔＬｅｎｇｔｈは、ＮＡＬユニットの長さをバイト単位で示す。

【0071】

ｎａｌＵｎｉｔには、ＤＣＩ、ＯＰＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳまたは宣言的ＳＥＩＮＡＬユニットが含まれる。

【0072】

ランダムアクセスリカバリポイントサンプルグループは、「ロール」サンプルグループとしても知られ、段階的な復号化のためのリカバリポイントの情報を提供するために用いられる。「ロール」サンプルグループをＶＶＣトラックで用いる場合、ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒの構文と意味論は「サップ」サンプルグループと同一に規定される。

【0073】

ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが０および１に等しいのは、「ロール」サンプルグループにマッピングされるサンプルの対象レイヤのピクチャがＧＤＲピクチャである場合に使用される。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが０に等しい場合、「ロール」サンプルグループは、トラック内に存在するすべてのレイヤの動作を規定するものである。

【0074】

ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合の意味論は、ここに規定する。

【0075】

２および３に等しいｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、「ロール」サンプルグループにマッピングされるサンプルの対象層のピクチャがすべてＧＤＲピクチャでない場合に用いられ、ＧＤＲピクチャでない対象レイヤのピクチャについては、以下のことが適用される：参照ＰＰＳがｐｐｓ＿ｍｉｘｅｄ＿ｎａｒｕ＿ｔｙｐｅｓ＿ｉｎ＿ｐｉｃ＿ｆｌａｇを１に等しく持ち、０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の範囲内にあるサブピクチャインデックスｉについて、次のいずれも真である：ｓｐｓ＿ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｉ］が１に等しく、同じＣＬＶＳ内の現在のサンプルの次のサブピクチャインデックスｉと同一であるＩＲＡＰサブピクチャが、少なくとも一つ存在する。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２である場合、「ロール」サンプルグループは、トラック内に存在する全てのレイヤの動作を規定する。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３に等しい場合の意味論は、本明細書で規定する。復号化の開始にｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｃ＿ｉｄｃが２または３に等しいサンプルを使用する場合、リーダはビットストリームのＳＰＳ、ＰＰＳ、およびＰＨＮＡＬユニットをさらに修正する必要がある。これにより、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｃ＿ｉｄｃが２および３に等しいサンプルグループに属するとマークされたサンプルで始まるビットストリームは、そのサンプルで参照されるＳＰＳがｓｐｓ＿ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１となるときに、適合ビットストリームとなり、このようなサンプルによって参照される任意のＰＰＳは、ｐｐｓ＿ｍｉｘｅｄ＿ｎａｒｕ＿ｔｙｐｅｓ＿ｉｎ＿ｐｉｃ＿ｆｌａｇが０に等しく、ＡＵのすべてのＶＣＬＮＡＬユニットはｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＧＤＲ＿ＮＵＴに等しく、ＡＵのいずれかのピクチャヘッダのｐｈ＿ｇｄｒ＿ｐｉｃ＿ｆｌａｇは１に等しく、ｐｈ＿ｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔの値が、このＡＵが属するサンプルグループのｒｏｌｌ＿ｄｉｓｔａｎｃｅに対応する。「ロール」サンプルグループが従属レイヤに関係するが、その参照レイヤ（複数可）には関係しない場合、サンプルグループは、従属レイヤのすべての参照レイヤが利用可能で復号化される場合に適用される特徴を示す。サンプルグループは、予測レイヤの復号化を開始するために使用できる。

【0076】

ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合、フィールドｔａｒｇｅｔ＿ｌａｙｅｒｓの各ビットは、トラック内で搬送されるレイヤを表す。このフィールドは２８ビット長しかないため、トラック内のＳＡＰの指示は最大２８レイヤに制約される。最下位ビット（ＬＳＢ）から始まるこのフィールドの各ビットは、そのサンプルに関連付けられたレイヤ情報サンプルグループ（‘ｌｉｎｆ’）で信号通知されたレイヤＩＤ値のリストに、レイヤＩＤ値の昇順でマッピングされるものとする。

【0077】

以下に、開示された技術的解決策によって解決される技術的問題の例を示す。デコーダ構成情報の信号通知と「ロール」サンプルグループに関するＶＶＣビデオファイルフォーマットの最新設計には、以下の問題がある。第１の問題点は、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて、プロファイル、ティア、レベル情報（ＰＴＬ）が信号通知される際に、カラーフォーマット、ビット深度、ピクチャ幅、ピクチャ高さなどのピクチャフォーマットパラメータが信号通知される。これらの情報は、コンテンツ選択的に使用することができる。しかし、コンテンツ選択の目的に有用な他のパラメータ、例えば、必要な復号されたピクチャバッファサイズ、最大ピクチャ出力順序変更、最大待ち時間、ＧＤＲピクチャ有効化フラグ、ＣＲＡピクチャ有効化フラグ、参照ピクチャリサンプリング有効フラグ、ＣＬＶＳによる空間解像度変更有効化フラグ、サブピクチャ分割有効フラグ、各ピクチャの最大サブピクチャ数、ＷＰＰ有効化フラグ、タイル分割有効化フラグ、ピクチャの最大タイル数、スライス分割有効化フラグ、矩形スライス有効フラグ、ラスタスキャンスライス有効化フラグ、ピクチャの最大スライス数等が、デコーダ構成記録で信号通知されない可能性もある。

【0078】

次に、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて、ＰＴＬ情報を信号通知する場合、ＰＴＬ情報の信号通知の後に、ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓフィールドも信号通知する。ただし、ＰＴＬ情報の信号通知の構文構造は、ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓフィールドに依存する。

【0079】

第３に、ランダムアクセスリカバリポイントサンプルグループ、すなわち「ロール」サンプルグループの説明において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１または３に等しいフィールドの意味論が適切に規定されていない。特定の、特に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合、適用可能なレイヤの信号通知が規定される可能性があるが、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３に等しい場合、規定されない可能性がある。

【0080】

本明細書で開示されるのは、上記の問題の１つ以上に対処するメカニズムである。一例において、ＶＶＣデコーダ構成レコードは、サブレイヤの数をＰＴＬレコードに先行するように位置付けるように修正される。このようにして、デコーダは、最初にサブレイヤの数を取得し、その数を用いてサブレイヤの各々についてＰＴＬレコードを取得することができる。別の例において、ロールサンプルグループのグルーピングタイプパラメータは、ロールサンプルグループ内のアクセス点と、それらのアクセス点が適用されるレイヤとの間の相関をより明確に記述するように修正される。例えば、対象レイヤは、アクセスポイントに相関するレイヤを示すことができる。さらに、層識別子方法識別コードを設定して、アクセスポイントがすべての層に適用されるのか、ターゲット層パラメータ内の層だけに適用されるのかを示すことができる。さらに、アクセスポイントがＧＤＲピクチャのみで構成されるか、ＧＤＲピクチャと混合ＮＡＬユニットピクチャの組み合わせで構成されるかを示すために、レイヤ識別子方法識別符号を設定することができる。

【0081】

上記の問題、およびその他を解決するために、以下に要約されるような方法が開示される。なお、これらの項目は、一般概念を説明するための例であると考えるべきであり、狭義に解釈されるべきではない。さらに、これらの項目は、個々に適用することも、結合されたものを組み合わせることも可能である。

【0082】

例１
第１の問題を解決するために、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて、以下のパラメータのいずれか１項以上がシグナリングされ得る：復号化ピクチャバッファの最大必要サイズ、最大ピクチャ出力順序変更（例えば、復号順でいずれかのピクチャに先行し、出力順でそのピクチャに後続できるピクチャの最大許容数）、最大遅延（例えば、出力順でいずれかのピクチャに先行し、復号順でそのピクチャに後続できるピクチャの最大数）、ＧＤＲピクチャ有効化フラグ、ＣＲＡピクチャ有効化フラグ、参照画像再サンプリング有効化フラグ、ＣＬＶＳによる空間解像度変更有効化フラグ、サブピクチャパーティショニング有効化フラグ、ピクチャごとのサブピクチャ最大数、ＷＰＰ有効化フラグ、タイルパーティショニング最大数、スライスパーティショニング、矩形スライス最大数、ラスタスキャンスライス可能数、ピクチャごとのタイル最大数の順。
（ａ）一例において、上記パラメータの１つ以上は、ＰＴＬ情報がそこで信号通知されるときにのみ、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて信号通知される。
（ｂ）一例において、１つ以上のパラメータは、ＰＴＬ情報の信号通知の前に存在する可能性がある。さらに、バイトアラインメントは、ＰＴＬ情報の前に信号通知されるすべてのパラメータに対して要件となり得る。一例において、予約ビットは、さらに信号通知してもよい。
（ｃ）一例において、１つ以上のパラメータは、ＰＴＬ情報の信号通知の後に存在する可能性がある。さらに、バイトアラインメントは、ＰＴＬ情報の後に信号通知してもよいすべてのパラメータに対して要求される可能性がある。一例において、予約ビットは、さらに信号通知してもよい。
（ｄ）一例において、１つ以上のパラメータのサブセットはＰＴＬ情報の信号通知の前に存在し、残りのパラメータはＰＴＬ情報の信号通知の後に存在することができる。さらに、バイトアラインメントが、ＰＴＬ情報の前に信号通知してもよいすべてのパラメータに対して要求される可能性がある。一例において、予約ビットは、さらに信号通知してもよい。
（ｅ）さらに、ＰＴＬ情報の後に信号通知してもよいすべてのパラメータについて、バイトアラインメントが要求される可能性がある。一例において、予約ビットはさらに信号通知してもよい。

【0083】

例２
第２の課題を解決するために、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄは、ＰＴＬ情報が信号通知されるとき、ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓフィールドもＰＴＬ情報の信号通知の前に信号通知されるように修正される。
（ａ）一例において、ＰＴＬ情報がＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて信号通知されるとき、それはフィールドｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ、ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８、ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ、およびｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅの後で信号通知される。一例において、ＰＴＬ情報は、すべての上述したフィールドといくつかの予約ビットの後に直接通知される。
（ｂ）一例において、ＰＴＬ情報がＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにおいて信号通知されるとき、それはｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ、およびｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅフィールドの後で信号通知される。一例において、ＰＴＬ情報は、すべての上述したフィールドといくつかの予約ビットの後に直接通知される。さらに、予約ビットは、ＰＴＬ情報の後にさらに信号通知される。
（ｃ）別の例において、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄでＰＴＬ情報を信号通知する場合、「ｉｆ（ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ）」を条件とする全フィールドのうち最後のフィールドとして信号通知される。
（ｄ）一例において、予約ビットは、ＰＴＬ情報の信号通知の前に、信号通知される。

【0084】

例３
第３の問題３を解決するために、以下の１つ以上の変化を加える：次の文章：
（ａ）“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合の意味論は、９．５．７項で規定されている。”を次のように変化させる：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合、「ロール」サンプルグループによって動作が規定されるレイヤは、９．５．７項において規定される。”本明細書を使用して、９．５．７項は、情報技術－オーディオビジュアルオブジェクトのコーディング－パート１５：ＩＳＯベースメディアファイルフォーマットのネットワーク抽象化層（ＮＡＬ）ユニット構造化ビデオの運搬と題する文書ＩＳＯ／ＩＥＣ１４４９６－１５：２０２１（Ｅ）の対応した番号の項を指す。
（ｂ）“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３に等しい場合の意味論は、９．５．７項で規定されている。”を以下のように変更する：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３と等しい場合、「ロール」サンプルグループによって動作が規定されるレイヤは、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１と等しい場合と同様、９．５．７項により規定される。”

【0085】

例４
問題３を解決するために、あるいは、代替の１つ以上の変更を行う：
（ａ）９．５．７項の次の文“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しいとき、フィールドｔａｒｇｅｔ＿ｌａｙｅｒｓの各ビットは、トラックで運ばれるレイヤを表す”を、次のように変更する：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１または３に等しいとき、フィールドｔａｒｇｅｔ＿ｌａｙｅｒｓの各ビットは、トラックで搬送されるレイヤを表す。”
（ｂ）次の文：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合の意味論は、９．５．７項で規定される。”は、以下のように変化する：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に等しい場合、「ロール」サンプルグループによって動作が規定されるレイヤは、９．５．７項に規定されている。”
（ｃ）次の文：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３に等しい場合の意味論は、９．５．７項で規定される。”は、以下のように変化する：“ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが３に等しい場合、「ロール」サンプルグループによって動作が規定されるレイヤは、９．５．７項に規定される。”

【0086】

以下に、上記で要約したいくつかの態様において、ＶＶＣビデオファイルフォーマットの標準仕様に適用可能な、いくつかの例示的な実施形態を示す。変化した文章は、上記のように関連する機能の最新の草案仕様に基づくものである。追加または修正された関連部分は下線太字で表され、削除された部分は太字イタリックで表される。

【0087】

一例において、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄの構文は以下のように修正される：

【化1】

【0088】

一例において、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄの意味論は、以下のように修正される：

【0089】

ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しい場合、トラックがｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓとで規定される動作点に対応するＶＶＣビットストリームを含み、トラック内のすべてのＮＡＬユニットがその動作点に属することを指定する。ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しい場合、トラックは特定の動作点に対応するＶＶＣビットストリームを含まず、複数の出力レイヤセットに対応するＶＶＣビットストリームを含むか、出力レイヤセットを形成しない１つ以上の個々のレイヤ、またはＴｅｍｐｏｒａｌＩｄが０に等しいサブレイヤを除く個々のサブレイヤを含む可能性があることを指定する。

【0090】

【化2】

【0091】

【化3】

【0092】

【化4】

【0093】

【化5】

【0094】

ｔｒａｃｋ＿ｐｔｌは、トラックに含まれるＶＶＣビットストリームが表す出力レイヤセットのプロファイル、ティア、レベルを規定する。

【0095】

ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘは、トラックに含まれるＶＶＣビットストリームが表す出力レイヤセットのインデックスを規定する。ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘの値は、トラックに含まれるビットストリームの復号化のために、ＩＳＯ／ＩＥＣ２３０９０－３で規定されるＶＶＣデコーダに対して外部手段またはＯＰＩＮＡＬユニットが提供するＴａｒｇｅｔＯｌｓＩｄｘ変数の値として使用することができる。

【0096】

【化6】

【0097】

【化7】

【0098】

【化8】

【0099】

【化9】

【0100】

ｐｉｃｔｕｒｅ＿ｗｉｄｔｈは、このトラックに適用される最大ピクチャ幅をｌｕｍａサンプル単位で示す。

【0101】

ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔは、このトラックに適用される最大ピクチャの高さをｌｕｍａサンプル単位で示す。

【0102】

【化10】

【0103】

【化11】

【0104】

ｎｕｍＡｒｒａｙｓは、指示されたタイプのＮＡＬユニットの配列の数を示す。

【0105】

一例において、ランダムアクセスリカバリポイントサンプルグループの説明は以下のように修正される：ランダムアクセスリカバリポイントサンプルグループ「ロール」は、段階的な復号化リフレッシュのためのリカバリポイントに関する情報を提供するために用いられる。「ロール」サンプルグループをＶＶＣトラックで使用する場合、ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒの構文と意味論は、「サップ」サンプルグループの構文と等しく規定される。「ロール」サンプルグループにマッピングされるサンプルのターゲットレイヤのピクチャがＧＤＲピクチャである場合、０および１に等しいｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが使用される。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが０に等しい場合、「ロール」サンプルグループはトラック内に存在する全てのレイヤの動作を規定する。

【0106】

【化12】

【0107】

２および３に等しいｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、「ロール」サンプルグループにマッピングされるサンプルの対象層のピクチャがすべてＧＤＲピクチャでない場合に用いられ、ＧＤＲピクチャでない対象層のピクチャについては、以下のことが適用される：参照ＰＰＳがｐｐｓ＿ｍｉｘｅｄ＿ｎａｒｕ＿ｔｙｐｅｓ＿ｉｎ＿ｐｉｃ＿ｆｌａｇを１に等しく持ち、０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の範囲内にあるサブピクチャインデックスｉについて、次のいずれも真である：ｓｐｓ＿ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｉ］が１に等しく、同じＣＬＶＳ内の現在のサンプルの次のサブピクチャインデックスｉと同一であるＩＲＡＰサブピクチャが、少なくとも一つ存在する。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２である場合、「ロール」サンプルグループは、トラック内に存在する全てのレイヤの動作を規定する。

【0108】

【化13】

【0109】

リーダが、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｃ＿ｉｄｃが２または３に等しいサンプルを使用して復号化を開始する場合、リーダは、１１．６項（文書ＩＳＯ／ＩＥＣ１４４９６－１５：２０２１（Ｅ））に従って再構成されたビットストリームのＳＰＳ、ＰＰＳ、ＰＨＮＡＬユニットをさらに修正する必要がある。ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２および３に等しく、このサンプルグループに属するとマークされたサンプルで始まるビットストリームは、そのようなサンプルが参照するＳＰＳがｓｐｓ＿ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、任意のＰＰＳがｐｐｓ＿ｍｉｘｅｄ＿ｎａｌｕ＿ｔｙｐｅｓ＿ｉｎ＿ｐｉｃ＿ｆｌａｇで０等しく、ＡＵのすべてのＶＣＬＮＡＬユニットは、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＧＤＲ＿ＮＵＴに等しく、ＡＵのいずれかのピクチャヘッダは、ｐｈ＿ｇｄｒ＿ｐｉｃ＿ｆｌａｇが１に等しいときに適合ビットストリームとなり、ＡＵのピクチャヘッダは、１に等しいｐｈ＿ｇｄｒ＿ｐｉｃ＿ｆｌａｇと、ＡＵが属するこのサンプルグループのｒｏｌｌ＿ｄｉｓｔａｎｃｅに対応するｐｈ＿ｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔの値を持つ。

【0110】

「ロール」サンプルグループが従属レイヤに関係するが、その参照レイヤ（複数可）には関係しない場合、サンプルグループは、従属レイヤのすべての参照レイヤが利用可能で復号化されるときに適用される特徴を示す。サンプルグループは、予測レイヤの復号化を開始するために使用できる。

【0111】

一例において、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄの構文は以下のように修正される：

【化14】

【0112】

一例において、ＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄの意味論は、以下のように修正される：

【0113】

【0114】

【化15】

【0115】

【0116】

ａｖｇＦｒａｍｅＲａｔｅは、この構成レコードが適用されるストリームの平均フレームレートを、フレーム／（２５６秒）の単位で示す。値０は、規定されていない平均フレームレートを示す。トラックが複数のレイヤを含み、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓとで規定される操作点に対してサンプルが再構成される場合、操作点のビットストリームの平均アクセスユニットレートを与える。

【0117】

ｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅが１に等しい場合は、この構成レコードが適用されるストリームが定数フレームレートであることを示す。値２は、ストリームの各時間的レイヤの表現が定数フレームレートであることを示す。値０は、ストリームが定数フレームレートである可能性とない可能性があることを示す。トラックが複数のレイヤを含み、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘとｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓとによって規定される動作点に対してサンプルが再構築される場合、その動作点のビットストリームがアクセスユニットレートが一定であるかどうかの指標を示す。

【0118】

ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓが１以上であることは、この構成レコードが適用されるトラックが時間的に拡張可能であり、含む時間的レイヤの数（ＩＳＯ／ＩＥＣ２３０９０－３では時間的サブレイヤまたはサブレイヤとも呼ばれる）がｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓと同等であることを示している。値１は、この構成レコードが適用されるトラックが時間的にスケーラブルでないことを示す。値０は、この構成レコードが適用されるトラックが時間的にスケーラブルであるかどうかが不明であることを指示する。

【0119】

ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃは、このトラックに適用される彩度フォーマットを示す。

【0120】

【化16】

【0121】

ｐｉｃｔｕｒｅ＿ｗｉｄｔｈは、このトラックに適用される最大ピクチャ幅をｌｕｍａサンプル単位で示す。

【0122】

ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔは、このトラックに適用される最大ピクチャの高さをｌｕｍａサンプル単位で示す。

【0123】

【化17】

【0124】

【化18】

【0125】

ｎｕｍＡｒｒａｙｓは、指示されたタイプのＮＡＬユニットの配列の数を示す。

【0126】

図１は、映像データのＶＶＣビットストリーム１２７を含むメディアファイル１００の一例の模式図である。メディアファイルは、映像シーケンスを作成するために表示され得るピクチャ１２５を含む。ピクチャ１２５は、ＶＶＣビットストリーム１２７において圧縮される。ビットストリーム１２７はまた、ピクチャ１２５を圧縮するために使用されるパラメータを復号ピクチャに示す様々なパラメータセット１２３から構成される。パラメータセット１２３は、映像全体に対するパラメータ、映像のシーケンスに対するパラメータ、１つ以上のピクチャに対するパラメータ、および１つ以上のピクチャの領域に対するパラメータをそれぞれ含む映像パラメータセット（ＶＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、適応パラメータセット（ＡＰＳ）であっても良い。

【0127】

圧縮は、イントラ予測およびインター予測を含むことができる。イントラ予測では、ピクチャ１２５はブロックに分割され、各ブロックは同じピクチャ１２５内の他のブロックと相対的にコーディングされる。インター予測では、ピクチャ１２５はブロックに分割され、各ブロックは他のピクチャ１２５の他のブロックと相対的にコーディングされる。インター予測またはイントラ予測に応じたコーディングされたピクチャ１２５は、それぞれインターコーディングピクチャまたはイントラコーディングピクチャと呼ばれることがある。インターコーディングされたピクチャの１つの利点は、そのようなピクチャ１２５が、イントラコーディングされたピクチャよりも実質的に圧縮されることである。しかしながら、インターコーディングされたピクチャは他のピクチャ１２５に対して相対的にコーディングされるので、ビデオデコーダは、インターコーディングピクチャで映像シーケンスの復号化を開始することはできない。代わりに、ビデオデコーダは、任意のイントラコーディングされたピクチャでビデオを復号化し始めることができる。イントラコーディングされたピクチャは、ＩＲＡＰピクチャと呼ばれることもある。これは、イントラコーディングされたピクチャが、映像ストリームへのアクセスポイント１３５として機能することができるからである。アクセスポイント１３５は、以下に説明するＧＤＲピクチャを除き、例として情報の欠落による復号化エラーを経験することなく、一般的にデコーダがビデオストリームの復号化を開始することができるビデオストリーム内の任意の位置である。

【0128】

いくつかの実施例では、ピクチャ１２５は、サブピクチャに分割され得る。サブピクチャは、ピクチャ１２５の矩形領域である。サブピクチャの利点は、復号処理および表示処理中にサブピクチャを別個に扱うことができることである。例えば、ピクチャインピクチャプリケーションやバーチャルリアリティアプリケーションなどにおいて、ピクチャ１２５全体を表示する代わりにサブピクチャを表示することができる。また、サブピクチャは、例えば、ビデオ通話アプリケーションにおいて、異なる構成で再配置され、一緒にステッチされ得る。いくつかの実施例では、アクセスポイント１３５のセットは、同じピクチャ１２５内の異なるサブピクチャに対して異なる可能性がある。例えば、重要度の低い映像を有するサブピクチャは、圧縮を高めるためにアクセスポイント１３５をより少なくすることができる。これが発生すると、ピクチャ１２５は、ＩＲＡＰサブピクチャおよびノンＩＲＡＰサブピクチャとも呼ばれる、イントラコーディングされたサブピクチャおよびインターコーディングされたサブピクチャを含むことができ、このようなサブピクチャは、ＩＲＡＰサブピクチャおよびノンＩＲＡＰサブピクチャとも呼ばれる。ビットストリーム１２７は、ネットワーク抽象化レイヤ（ＮＡＬ）ユニットのセットであり、通信ネットワークパケットに収まるサイズにされた映像データエレメントである。したがって、パラメータセット１２３およびピクチャ１２５は、ビットストリーム１２７のＮＡＬユニットで搬送される。それゆえ、ＩＲＡＰサブピクチャと非ＩＲＡＰサブピクチャのいずれも有するピクチャ１２５は、混合ＮＡＬユニットピクチャと参照することができる。

【0129】

別のアクセスポイント１３５のスキームは、ＧＤＲピクチャの使用を含む。ＧＤＲピクチャは、イントラコーディングされたセクションと１つ以上のインターコーディングされたセクションとを含む。ＧＤＲピクチャは、アクセスポイント１３５を作成するためにグループで使用される。具体的には、第１のＧＤＲピクチャは、ピクチャ１２５の左端部分にイントラコーディングされた領域を含み、ピクチャの残りの部分はインターコーディングに応じたコーディングが施される。第２のＧＤＲピクチャは、第１のＧＤＲピクチャのイントラコーディングされた領域と接するが重ならない位置まで右シフトされたイントラコーディングされた領域を含む。第２のＧＤＲピクチャの残りの部分はインターコーディングされたものである。このように、イントラコーディングされたピクチャは、複数のピクチャにまたがって左から右へスイープする。ＧＤＲピクチャの１つの制約は、イントラコーディングされた領域の左側のインターコーディングされた領域は、現在のＧＤＲピクチャのグループ内の前のＧＤＲピクチャを参照することしかできないことである。デコーダは、グループの最初のＧＤＲピクチャで復号を開始する可能性がある。この場合、デコーダは、イントラコーディングされた領域を復号化することが可能であるが、インターコーディングされた領域は復号化することができない。次に、デコーダは、第２のＧＤＲピクチャに進むことができ、この場合、イントラコーディングされた領域と、イントラコーディングされた領域の左側のインターコーディングされた領域とのいずれもデコードすることができる。デコーダが最後のＧＤＲピクチャに到達すると、すべての領域が復号化され、映像を表示することができる。ＧＤＲピクチャは、アクセスポイント１３５として用いるとエラーを生じるが、そのようなエラーは、グループ内の最後のＧＤＲピクチャを越えて持続することはない。したがって、ＧＤＲピクチャは、一般的に、グループがアクセスポイント１３５として使用されるとき、表示されない。ＧＤＲピクチャの利点は、各ＧＤＲピクチャがＩＲＡＰピクチャ全体よりも小さく、各アクセスポイント１３５に関連付けられたデータバーストを低減することである。デコーダがアクセスポイント１３５としてＧＤＲピクチャを使用していない場合、ＧＤＲピクチャのグループの前のビデオは利用可能であり、したがって、デコーダは、インターコーディングされた領域でエラーなしにグループ内のすべてのＧＤＲピクチャを復号することができる。なお、ＧＤＲピクチャは、一般的に、混合ＮＡＬユニットピクチャと組み合わせて使用することが禁止されていることに留意されたい。

【0130】

ピクチャ１２５およびパラメータセット１２３は、レイヤ１２０および／またはサブレイヤに編成され得る。レイヤ１２０は、復号化されて出力レイヤセットの一部として出力され得るピクチャ１２５およびパラメータセット１２３のグループ化である。例えば、異なるレイヤ１２０は、異なる解像度でコーディングされる可能性がある。別の例において、出力レイヤセットは、ベースレイヤおよびエンハンスメントレイヤを含むことができる。これにより、デコーダは、ベースレイヤを復号化して第１の解像度の映像を得、その後、デバイスおよびネットワークの能力に基づいて解像度を高めるために所望の数のエンハンスメントレイヤを復号化することができる。サブレイヤ１２１は、時間的スケーリングを可能にするレイヤ１２０の一種である。例えば、ピクチャ１２５は、時間的識別子（Ｉｄ）に基づく異なるサブレイヤ１２１に割り当てられ得る。このように、各サブレイヤ１２１は、ピクチャ１２５のサブセットを含む。これにより、デコーダは、所望のフレームレートを達成するために選択されたサブレイヤ１２１を復号化し表示することができる。

【0131】

ビットストリーム１２７のレイヤ１２０および／またはサブレイヤ１２１は、トラック１１０に配置することができる。トラック１１０は、デコーダによって復号化および表示され得る特定のタイプのタイムドサンプルのシーケンスを含む。このコンテキストでは、サンプルは媒体データの単位である。例えば、トラック１１０は、圧縮映像サンプル（例えば、経時的なピクチャ１２５）、圧縮オーディオサンプル、ヒントデータサンプル、パラメータサンプルなどの時間指定されたセットを含むことができます。なお、サンプルという用語は、ピクセルの画素値を参照する可能性があるが、それはこのコンテキストで意図される定義ではないことに注意されたい。追跡１１０は、そのようなサンプルを含むいずれか１項のレイヤ１２０および／またはいずれか１項のサブレイヤ１２１を含むことができる。

【0132】

先行する説明によって理解できるように、メディアファイル１００内のデータは、多くの方法で配置することができる。したがって、メディアファイル１００は、トラック１１０に含まれるサンプル（たとえば、媒体データ）を記述するパラメータを含むサンプルテーブルボックス１３０も含む。例えば、デコーダは、サンプルテーブルボックス１３０を読んで、様々なトラック１１０に含まれるデータの処理をどのように開始するかを決定することができる。他の多くのパラメータの中で、サンプルテーブルボックス１３０は、ロールサンプルグループ１３１と、ＶＶＣデコーダ構成レコード１４１とを含む可能性がある。

【0133】

ロールサンプルグループ１３１は、ランダムアクセスリカバリサンプルグループとも呼ばれる。ロールサンプルグループ１３１は、ＶＶＣビットストリーム１２７のレイヤ１２０へのアクセスポイント１３５の信号通知に用いるデータユニットであり、主にＧＤＲピクチャで発生するアクセスポイント１３５の信号通知に用いる。なお、ＩＤＲ、ＣＲＡ、ブロークン・リンク・アクセス（ＢＬＡ）などの他のＩＲＡＰピクチャで発生する信号通知アクセスポイントのために、ランダムアクセスポイント（ＲＡＰ）サンプルグループを採用することも可能である。したがって、ロールサンプルグループ１３１は、ＶＶＣビットストリーム１２７に含まれるＧＤＲピクチャを指すアクセスポイント１３５のリストを含む。アクセスポイント１３５は、ロールサンプルグループ１３１のサンプルであると見なされる。いくつかの実装形態において、ロールサンプルグループ１３１の演算は不明確である。本開示は、ロールサンプルグループ１３１のアクセスポイント１３５とレイヤ１２０との間の関係を明確に記述するパラメータを提供することによって、そのような問題に対処する。

【0134】

ロールサンプルグループ１３１は、ｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表される可能性があるグループ化タイプパラメータ１３７を含む。グループ化タイプパラメータ１３７は、アクセスポイント１３５とレイヤ１２０との間の相関／対応を規定するパラメータである。なお、アクセスポイント１３５がレイヤ１２０に適用される場合、レイヤ１２０は関連するレイヤとして参照され得ることに留意されたい。それゆえ、レイヤ１２０は、すべてのレイヤ１２０のセットまたはレイヤ１２０のサブセットと同様である可能性がある関連するレイヤのグループを含む。グループ化タイプパラメータ１３７は、さらに、ターゲットレイヤパラメータ１３６と、レイヤ識別子方法特定コード１３８とを含み、これらはそれぞれｔａｒｇｅｔ＿ｌａｙｅｒｓおよびｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃとして表され得る。一例の実装形態において、ターゲットレイヤパラメータ１３６は、複数のビットを含み、各ビットは関連するレイヤのうちの１つを規定する。一例において、対象レイヤパラメータ１３６は、２４ビット長であってもよく、したがって、最大２４個の関連するレイヤを規定することができる可能性がある。

【0135】

レイヤ識別子方法識別コード１３８は、アクセスポイント１３５の性質をいずれも規定し、アクセスポイント１３５とレイヤとの間の相関を明確にする。一例において、レイヤ識別子方法識別コード１３８は、４ビット値を含み得る。具体的な実装形態では、レイヤ識別子方法識別コード１３８は、アクセスポイント１３５がすべてのレイヤ１２０に適用されることを示すために、ゼロまたは２に設定することができる。この場合、すべてのレイヤが関連するレイヤであり、対象レイヤパラメータ１３６は、メディアファイル１００から省略され、および／またはデコーダによって無視されることができる。さらに、レイヤ識別子方法識別コード１３８を１または４に設定して、アクセスポイント１３５がターゲットレイヤパラメータ１３６によって示される関連するレイヤのみに適用されることを示すことができる。さらに、レイヤ識別子方法識別コード１３８は、アクセスポイント１３５に存在するピクチャ１２５の性質を示すことができる。例えば、レイヤ識別子方法識別コード１３８は、アクセスポイント１３５がすべてＧＤＲピクチャであることを示すために、ゼロまたは１に設定することができる。さらに、レイヤ識別子方法識別コード１３８は、アクセスポイント１３５がＧＤＲピクチャまたはＩＲＡＰサブピクチャと非ＩＲＡＰサブピクチャの両方を使用して混合されたＮＡＬユニットピクチャのいずれかであり得ることを示すために、２または３に設定することができる。

【0136】

特定の実装形態では、該当レイヤの全てのアクセスポイントがＧＤＲピクチャであり、アクセスポイントが全てのレイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃはゼロに設定され得る。さらに、関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントが関連するレイヤのみに適用されることを規定する場合には、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、１に設定される。また、当該レイヤのアクセスポイントがＧＤＲピクチャ、結合されたＮＡＬユニットピクチャ、およびそれらの組み合わせであり、アクセスポイントが全てのレイヤに適用される場合には、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは２に設定される。最終的に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、該当するレイヤのアクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャ、およびそれらの組み合わせであり、アクセスポイントが該当するレイヤのみに適用されることを規定される場合、３つに設定される。このようにして、デコーダは、アクセスポイント１３５、グループ化タイプパラメータ１３７、対象レイヤ１３６、およびレイヤ識別子方法識別コード１３８を解析して、ロールサンプルグループ１３１のアクセスポイント１３５とレイヤ１２０との間の相関を判定することができる。その後、デコーダは、アクセスポイント１３５を使用して、関連するレイヤにおけるピクチャ１２５の復号化を開始することができる。

【0137】

さらに、サンプルテーブルボックス１３０は、ＶＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄと表される可能性があるＶＶＣデコーダ設定レコード１４１を含んでいてもよい。ＶＶＣデコーダ構成レコード１４１は、デコーダがコンテンツを選択するために使用できるデータを含む。例えば、ＶＶＣデコーダ構成レコード１４１は、トラック１１０の出力レイヤセットおよび対応するレイヤ１２０を記述するデータを含むことができる。そして、デコーダは、そのようなデータを用いて、復号化および表示されるべきトラック１１０を選択することができる。例えば、ＶＶＣデコーダ構成レコード１４１は、ＶＶＣプロファイルティアレベル（ＰＴＬ）レコード１４３、出力レイヤセットインデックス、フレームレート、サブレイヤ１２１の数、ビット深度、彩度フォーマット、ピクチャサイジング等を記述するデータを含むことができる。

【0138】

ＶＶＣＰＴＬレコード１４３は、レイヤ１２０および／またはサブレイヤ１２１のプロファイル、ティア、およびレベル情報を示している。プロファイル、ティアおよびレベルは、ビットストリームの制限を規定し、したがって、ビットストリームを復号化するのに必要な能力の制限を規定する。プロファイル、ティアおよびレベルはまた、個々のデコーダ実装形態間の相互運用性ポイントを示すために使用される可能性がある。プロファイルは、準拠ビットストリームを作成するために使用されるコーディングツールの定義されたセットである。各プロファイルは、そのプロファイルに準拠するすべてのデコーダがサポートしなければならないアルゴリズム機能および制限のサブセットを規定する。レベルとは、ビットストリームの制約のセットである（例：最大輝度サンプルレート、解像度の最大ビットレート、など）。例えば、レベルは、規定されたプロファイルのビットストリームを再生するために必要なデコーダ性能を示す制約のセットであってもよい（例えば、ハードウェア制約）。レベルは、メインとハイの２つのティアに分割される。メインティアは、ハイティアより下位のティアである。ティアは、最大ビットレートが異なる適用可能性に対処するために採用されている。メインティアはほとんどのアプリケーション用に設計され、ハイティアは非常に要求の厳しいアプリケーション用に設計されています。いずれかのプロファイルにおいて、ティアのレベルは、一般的に特定のデコーダの処理負荷とメモリ能力に対応する。従って、デコーダは、デコーダの能力に一致するＰＴＬ情報を有するレイヤ１２０および／またはサブレイヤ１２１を決定することによって、再生のためにレイヤ１２０および／またはサブレイヤ１２１を選択することが望ましい。

【0139】

いくつかの例実装形態において、ＶＶＣデコーダ構成レコード１４１は、ＶＶＣＰＴＬレコード１４３の後にサブレイヤ数１４５がＶＶＣデコーダ構成レコード１４１で信号化されるため、不明瞭である。これは、デコーダがＶＶＣＰＴＬレコード１４３を解釈する前に、デコーダがサブレイヤ１４５の数を必要とするため、問題である。本開示では、サブレイヤ１４５の数は、ＶＶＣＰＴＬレコード１４３の前に、ＶＶＣデコーダ構成レコード１４１で信号通知される。その後、デコーダは、ＶＶＣデコーダ構成レコードを構文解析してサブレイヤ１４５の数を取得し、サブレイヤ１４５の数を使用してサブレイヤ１２１のＶＶＣＰＴＬレコードの数を決定することができる。一例において、ＶＶＣデコーダ構成レコード１４１は、定数フレームレート構文要素、彩度フォーマット識別コード構文要素およびビット深度マイナス８構文要素から構成される。ＶＶＣＰＴＬレコード１４３は、ＶＶＣデコーダ構成レコード１４１において、定数フレームレート構文要素、彩度フォーマット識別コード構文要素、およびビット深度マイナス８構文要素の後に配置することができる。さらに、サブレイヤ１４５の数は、ＶＶＣデコーダ構成レコード１４１において、定数フレームレート構文要素、彩度フォーマット識別コード構文要素およびビット深度マイナス８構文要素の前に配置することが可能である。

【0140】

具体的には、トラック１１０、レイヤ１２０、および／またはサブレイヤ１２１のＰＴＬ情報の判定に使用するＶＶＣＰＴＬレコード１４３の前にサブレイヤ１４５の数を配置するために、ＶＶＣデコーダ構成レコード１４１は、以下のように実装され得る。
ａｌｉｇｎｅｄ（８）ｃｌａｓｓＶｖｃＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄ｛
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｃｏｎｆｉｇｕｒａｔｉｏｎＶｅｒｓｉｏｎ＝１；
ｂｉｔ（５）ｒｅｓｅｒｖｅｄ＝ ‘１１１１１’ｂ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｌｅｎｇｔｈＳｉｚｅＭｉｎｕｓＯｎｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（１）ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ；
ｉｆ（ｐｔｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ）｛
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ；
ｕｎｓｉｇｎｅｄｉｎｔ（３）ｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８；
ｕｎｓｉｇｎｅｄｉｎｔ（３）ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｃｏｎｓｔａｎｔＦｒａｍｅＲａｔｅ；
ｂｉｔ（６）ｒｅｓｅｒｖｅｄ＝ ‘１１１１１１’ｂ；
ＶｖｃＰＴＬＲｅｃｏｒｄ（ｎｕｍＴｅｍｐｏｒａｌＬａｙｅｒｓ）ｔｒａｃｋ＿ｐｔｌ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ；
ｕｎｓｉｇｎｅｄ＿ｉｎｔ（１６）ｐｉｃｔｕｒｅ＿ｗｉｄｔｈ；
ｕｎｓｉｇｎｅｄ＿ｉｎｔ（１６）ｐｉｃｔｕｒｅ＿ｈｅｉｇｈｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ａｖｇＦｒａｍｅＲａｔｅ；
｝
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｎｕｍＯｆＡｒｒａｙｓ；
ｆｏｒ（ｊ＝０；ｊ＜ｎｕｍＯｆＡｒｒａｙｓ；ｊ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１）ａｒｒａｙ＿ｃｏｍｐｌｅｔｅｎｅｓｓ；
ｂｉｔ（２）ｒｅｓｅｒｖｅｄ＝０；
ｕｎｓｉｇｎｅｄｉｎｔ（５）ＮＡＬ＿ｕｎｉｔ＿ｔｙｐｅ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｎｕｍＮａｌｕｓ；
ｆｏｒ（ｉ＝０；ｉ＜ｎｕｍＮａｌｕｓ；ｉ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｎａｌＵｎｉｔＬｅｎｇｔｈ；
ｂｉｔ（８＊ｎａｌＵｎｉｔＬｅｎｇｔｈ）ｎａｌＵｎｉｔ；
｝
｝
｝

【0141】

別の例において、デコーダでのトラック１１０、レイヤ１２０、および／またはサブレイヤ１２１の選択をサポートするために、様々な追加情報をＶＶＣデコーダ構成レコード１４１に含めることができる。そのような情報は、復号されたピクチャバッファの最大必要サイズ、最大ピクチャ出力順序変更、最大待ち時間、ＧＤＲピクチャ有効化フラグ、ＣＲＡピクチャ有効化フラグ、参照ピクチャリサンプリング有効フラグ、ＣＬＶＳ有効による空間解像度変化、サブピクチャパーティショニング有効化フラグ、各ピクチャにおけるサブピクチャの最大数、ＷＰＰ有効化フラグ、タイル分割有効化フラグ、ピクチャあたりのタイルの最大数、スライス分割有効化フラグ、ラスタスキャンスライス有効化フラグ、ピクチャあたりのスライス数、またはそれらの組み合わせを含むことができる。いくつかの例において、そのような情報は、ＶＶＣデコーダ構成レコード１４１がＶＶＣＰＴＬレコード１４３を構成する場合にのみ含まれることができる。

【0142】

そのような情報を含むことによって、および／またはデータの順序を並べ替えることによって、ＶＶＣデコーダ構成レコード１４１は、デコーダによるトラック１１０、レイヤ１２０、および／またはサブレイヤ１２１の追加機能および／またはより効率的な選択を可能にするように改善される。

【0143】

図２は、例えば、ロールサンプルグループをメディアファイル１００に符号化することによる、ロールサンプルグループを符号化する例示的な方法２００のフローチャートである。ステップ２０１で、エンコーダは、メディアファイル１００などのメディアファイル内のレイヤにピクチャを符号化する。

【0144】

ステップ２０３で、エンコーダは、レイヤへのアクセスポイントを規定するロールサンプルグループを決定する。なお、上述のように、ロールサンプルグループは、ＧＤＲピクチャと組み合わせて使用するように設計されている。しかし、様々なレイヤは、ＩＲＡＰサブピクチャと非ＩＲＡＰサブピクチャとのいずれも有する混合ＮＡＬユニットピクチャなど、ＧＤＲピクチャに加えて、他のタイプのアクセスポイントを含む可能性がある。エンコーダは、ロールサンプルグループをメディアファイルに符号化する。

【0145】

ステップ２０５において、エンコーダは、グルーピングタイプパラメータをメディアファイルに、例えば、ロールサンプルグループに符号化する。グルーピングタイプパラメータは、ロールサンプルグループのサンプルであるアクセスポイントと、レイヤの関連するレイヤとの間の対応を規定する。なお、関連するレイヤとは、アクセスポイントによって参照されるいずれかのレイヤのことである。グルーピングタイプパラメータは、アクセスポイントの性質を規定するレイヤ識別子方式識別コードパラメータを含む。例えば、レイヤ識別子方式識別コードパラメータは、アクセスポイントが、（１）１つまたはＧＤＲピクチャ、および（２）ＩＲＡＰサブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ＮＡＬユニットピクチャのうちの１つ以上を含むことを示すように設定することができる。例えば、レイヤ識別子方式識別コードパラメータは、アクセスポイントがすべてＧＤＲピクチャであることを示す第１の値と、アクセスポイントがＧＤＲピクチャと混合ＮＡＬユニットピクチャ（または混合ＮＡＬユニットピクチャのみ）の組み合わせであることを示す第２の値とに設定することができる。

【0146】

一例において、グルーピングタイプパラメータは、ターゲットレイヤパラメータを含む。対象レイヤパラメータは、各ビットが関連するレイヤのうちの１つを規定する複数のビットを含む。一例において、レイヤ識別子方式識別コードパラメータは、アクセスポイントが関連するレイヤのみに適用されるように規定され得る。別の例において、レイヤ識別子識別コードパラメータは、アクセスポイントがすべてのレイヤに適用されることを特定するように設定することができる。なお、いくつかの例では、このような場合、ターゲットレイヤパラメータは省略することができる。いくつかの例では、グルーピングタイプパラメータはｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒ表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、レイヤ識別子方式特定コードパラメータはｌａｙｅｒ＿ｉｄｍｅｔｈｏｄ＿ｉｄｃと表される。

【0147】

一例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントがすべてのレイヤに適用されることを規定する場合、ゼロに設定される。別の例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントが関連するレイヤにのみ適用されると規定する場合に、１に設定される。さらに別の例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのアクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャおよびそれらの組み合わせであり、アクセスポイントがすべてのレイヤに適用されることを規定する場合に２に設定される。さらに一例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのアクセスポイントがＧＤＲピクチャ、ＮＡＬユニットピクチャまたはそれらの組み合わせであり、アクセスポイントが関連するレイヤにのみ適用される場合に、３つに設定される。

【0148】

ステップ２０７で、エンコーダは、メディアファイルを記憶する。実施形態では、メディアファイルは、デコーダに向かって送信される。

【0149】

図３は、方法２００の結果として受信されたメディアファイル１００を採用することによって、例えば、ロールサンプルグループを復号化する例示的な方法３００を示すフローチャートである。ステップ３０１において、デコーダは、レイヤにコーディングされたピクチャを含むメディアファイルを受信する。メディアファイルは、さらに、ロールサンプルグループを含む。

【0150】

ステップ３０３において、デコーダは、メディアファイルからロールサンプルグループを取得する。ロールサンプルグループは、レイヤへのアクセスポイントを特定する。

【0151】

ステップ３０５において、デコーダは、メディアファイルから、例えば、ロールサンプルグループから、グルーピングタイプパラメータを取得する。グルーピングタイプパラメータは、ロールサンプルグループのサンプルであるアクセスポイントと、レイヤの関連するレイヤとの間の対応を規定する。なお、関連レイヤとは、アクセスポイントによって参照されるいずれかのレイヤのことである。グルーピングタイプパラメータは、アクセスポイントの性質を規定するレイヤ識別子方式識別コードパラメータを含む。例えば、レイヤ識別子方式識別コードパラメータは、アクセスポイントが、（１）１つ以上のＧＤＲピクチャおよび（２）ＩＲＡＰサブピクチャと非ＩＲＡＰサブピクチャとの両方を含む１つ以上の混合ＮＡＬユニットピクチャのうちの１つ以上を含むことを示すように設定することができる。例えば、レイヤ識別子方式識別コードパラメータは、アクセスポイントがすべてＧＤＲピクチャであることを示す第１の値と、アクセスポイントがＧＤＲピクチャと混合ＮＡＬユニットピクチャ（または混合ＮＡＬユニットピクチャのみ）の組み合わせであることを示す第２の値とに設定することができる。

【0152】

一例において、グルーピングタイプパラメータは、ターゲットレイヤパラメータを含む。ターゲットレイヤパラメータは、各ビットが関連するレイヤのうちの１つを規定する複数のビットを含む。一例において、レイヤ識別子方式識別コードパラメータは、アクセスポイントが関連するレイヤのみに適用されるように規定され得る。別の例において、レイヤ識別子方式識別コードパラメータは、アクセスポイントがすべてのレイヤに適用されることを特定するように設定することができる。なお、いくつかの例では、このような場合、ターゲットレイヤパラメータは省略することができる。いくつかの例では、グルーピングタイプパラメータはｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、レイヤ識別子方式特定コードパラメータはｌａｙｅｒ＿ｉｄｍｅｔｈｏｄ＿ｉｄｃと表される。

【0153】

一例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントがすべてのレイヤに適用されることを規定する場合、ゼロに設定される。別の例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのすべてのアクセスポイントがＧＤＲピクチャであり、アクセスポイントが関連するレイヤにのみ適用されると規定する場合に、１に設定される。さらに別の例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのアクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャおよびそれらの組み合わせであり、アクセスポイントがすべてのレイヤに適用されることを規定する場合に２にセットされる。さらに一例において、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは、関連するレイヤのアクセスポイントがＧＤＲピクチャ、ＮＡＬユニットピクチャまたはそれらの組み合わせであり、アクセスポイントが関連するレイヤにのみ適用される場合に、３つに設定される。

【0154】

ステップ３０７において、デコーダは、グルーピングタイプパラメータに基づき、メディアファイルを復号化する。デコーダは、次に、復号化メディアファイルまたはその部分（たとえば、特定のレイヤおよび／またはサブレイヤ）を、ユーザによる閲覧のためにディスプレイに向けて転送することができる。

【0155】

図４は、本明細書で開示された様々な技術が実装される可能性がある映像処理システム４００を例示するブロック図である。様々な実装形態は、システム４００の構成要素の一部または全部を含んでもよい。システム４００は、映像コンテンツを受信するための入力機４０２を含む可能性がある。映像コンテンツは、生または非圧縮フォーマット、例えば８ビットまたは１０ビットの多成分画素値で受信されてもよく、圧縮または符号化フォーマットであってもよい。入力４０２は、ネットワークインターフェース、周辺バスインターフェース、または記憶域インターフェースを表す可能性がある。ネットワークインターフェースの例には、イーサネット、パッシブ光ネットワーク（ＰＯＮ）などの有線インターフェースと、Ｗｉ－Ｆｉ（登録商標）またはセルラーインターフェースなどの無線インターフェースとが含まれる。

【0156】

システム４００は、本明細書に記載された様々なコーディングまたは符号化方法を実装することができるコーディングコンポーネント４０４を含んでもよい。コーディング成分４０４は、入力４０２からコーディング成分４０４の出力までの映像の平均ビットレートを低減して、映像のコーディングされた表現を生成することができる。したがって、コーディング技術は、映像圧縮技術または映像変換技術と呼ばれることもある。コーディングコンポーネント４０４の出力は、記憶するか、またはコンポーネント４０６によって表されるように、通信接続されたものを介して送信することが可能性がある。入力４０２で受信された映像の格納されたまたは通信されたビットストリーム（またはコーディングされた）表現は、表示インターフェース４１０に送信される画素値または表示可能な映像の生成のために、コンポーネント４０８によって使用されることがある。ビットストリーム表現からユーザが表示可能な映像を生成する処理は、映像の伸張と呼ばれることがある。さらに、特定のビデオ処理操作は「コーディング」操作またはツールと呼ばれるが、コーディングツールまたは操作はエンコーダで使用され、コーディングの結果を逆転させる対応する復号化ツールまたは操作はデコーダで実行されることが理解されるであろう。

【0157】

周辺バスインターフェースまたはディスプレイインターフェースの例としては、ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ（ＵＳＢ）またはＨｉｇｈＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ（ＨＤＭＩ（登録商標））またはＤｉｓｐｌａｙｐｏｒｔなどを挙げることができる。記憶域インターフェースの例としては、ｓｅｒｉａｌａｄｖａｎｃｅｄｔｅｃｈｎｏｌｏｇｙａｔｔａｃｈｍｅｎｔ（ＳＡＴＡ）、ＰＣＩ、ＩＤＥインターフェースなどを挙げることができる。本明細書に記載された技法は、携帯電話、ノートパソコン、スマートフォンなど、デジタルデータ処理および／または映像表示を行うことが可能な様々な電子デバイスで実施され得る。

【0158】

図５は、例示的な映像処理装置５００のブロック図である。装置５００は、本明細書に記載される方法の１つ以上を実装するために使用することができる。装置５００は、スマートフォン、タブレット、コンピュータ、モノのインターネット（ＩｏＴ）受信機などで実施される可能性がある。装置５００は、１つ以上のプロセッサ５０２、１つ以上のメモリ５０４、および映像処理ハードウェア５０６を含んでもよい。プロセッサ（複数可）５０２は、本明細書に記載の１つ以上の方法を実装するように設定可能である。メモリ（記憶）５０４は、本明細書に記載の方法および技術を実装するために使用されるデータおよびコードを記憶するために使用することができる。映像処理ハードウェア５０６は、本明細書に記載のいくつかの技術をハードウェア回路で実装するために使用してもよい。いくつかの実施形態において、映像処理ハードウェア５０６は、少なくとも部分的にプロセッサ５０２に含まれてもよく、例えば、グラフィックコプロセッサである。

【0159】

図６は、映像処理の例示的な方法６００のフローチャートである。方法６００は、ビジュアルメディアデータとビデオファイルフォーマットに従ってビジュアルメディアデータに対応する情報を格納するファイルとの間での変換を行うことを含む。エンコーダのコンテキストでは、この変換は、視覚メディアデータを映像ファイルフォーマットで視覚メディアデータファイルに符号化することによって行われ得る。デコーダのコンテキストでは、この変換は、映像ファイルフォーマットの視覚メディアデータファイルを復号化して、表示用の視覚メディアデータを得ることによって行うことができる。

【0160】

図７は、本開示の技法を利用し得る例示的な映像コーディングシステム７００を例示するブロック図である。図７に示されるように、映像コーディングシステム７００は、送信元デバイス７１０および送信先デバイス７２０を含み得る。送信元デバイス７１０は、符号化対象映像データを生成し、これは映像符号化デバイスと称される可能性がある。送信先デバイス７２０は、映像デコードデバイスと呼ばれ得るソースデバイス７１０によって生成された符号化ビデオデータを復号化してもよい。

【0161】

ソースデバイス７１０は、映像ソース７１２、映像符号化対象７１４、および入力／出力（Ｉ／Ｏ）インターフェース７１６を含み得る。ビデオソース７１２は、ビデオキャプチャデバイス、ビデオコンテンツプロバイダからビデオデータを受信するためのインターフェースおよび／またはビデオデータを生成するためのコンピュータグラフィックスシステムなどのソース、またはそのようなソースの組み合わせを含むことができる。映像データは、１つ以上のピクチャから構成される可能性がある。ビデオエンコーダ７１４は、ビデオソース７１２からの映像データを符号化して、ビットストリームを生成する。ビットストリームは、映像データのコーディングされた表現を形成するビットのシーケンスを含んでもよい。ビットストリームは、コーディングされたピクチャと関連付けられたデータとを含んでもよい。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連付けられたデータは、シーケンスパラメータセット、ピクチャパラメータセット、および他の構文構造を含んでもよい。Ｉ／Ｏインターフェース７１６は、変調器／復調器（ｍｏｄｅｍ）および／または送信器を含んでもよい。符号化映像データは、ネットワーク７３０を介してＩ／Ｏインターフェース７１６を介して送信先デバイス７２０に直接送信されてもよい。符号化映像データはまた、送信先デバイス７２０によるアクセスのために記憶媒体／サーバ７４０に記憶することが可能である。

【0162】

送信先デバイス７２０は、Ｉ／Ｏインターフェース７２６と、映像復号化デバイス７２４と、表示デバイス７２２とを含み得る。Ｉ／Ｏインターフェース７２６は、受信機および／またはモデムを含んでもよい。Ｉ／Ｏインターフェース７２６は、送信元デバイス７１０または記憶媒体／サーバ７４０から符号化映像データを取得する可能性がある。ビデオデコーダ７２４は、符号化映像データを復号化してもよい。表示デバイス７２２は、復号化映像データをユーザに表示してもよい。表示装置７２２は、送信先デバイス７２０と一体化されてもよく、または送信先デバイス７２０の外部にあってもよく、外部表示装置とインターフェースするよう構成可能である。

【0163】

ビデオエンコーダ７１４およびビデオデコーダ７２４は、ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）規格、ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（ＶＶＭ）規格、および他の現在の規格および／またはさらなる規格などのビデオ圧縮規格に従って動作し得る。

【0164】

図８は、図７に示されるシステム７００におけるビデオエンコーダ７１４である可能性があるビデオエンコーダ８００の例を示すブロック図である。映像エンコーダ８００は、本開示の技術のいずれか１つまたはすべてを実行するように構成可能である。図８の例において、ビデオエンコーダ８００は、複数の機能性モジュールを含有している。本開示で説明する技法は、ビデオエンコーダ８００の様々な構成要素の間で共有される可能性がある。いくつかの例では、プロセッサは、本開示で説明する技法のいずれかまたはすべてを行うように構成可能であろう。

【0165】

ビデオエンコーダ８００の機能性モジュールは、分割ユニット８０１と、モード選択ユニット８０３、動き推定ユニット８０４、動き補償ユニット８０５、イントラ予測ユニット８０６、残差生成ユニット８０７、変換処理ユニット８０８、量子化ユニット８０９、逆量子化ユニット８１１、再構成ユニット８１２、バッファ８１３、およびエントロピー符号化ユニット８１４を含む可能性がある予測ユニット８０２とを含む。

【0166】

他の例において、ビデオエンコーダ８００は、より多くの、より少ない、または異なる機能性モジュールを含むことができる。一例において、予測ユニット８０２は、イントラブロックコピー（ＩＢＣ）ユニットを含んでもよい。ＩＢＣユニットは、少なくとも１つの参照ピクチャが現在の映像ブロックが位置するピクチャであるＩＢＣモードで予測を行うことができる。

【0167】

さらに、動き推定ユニット８０４や動き補償ユニット８０５などの一部の成分は高度に統合されている可能性があるが、図８の例では説明のために別個に表している。

【0168】

分割ユニット８０１は、ピクチャを１つ以上の映像ブロックに分割する可能性がある。映像エンコーダ８００および映像デコーダ９００は、様々な映像ブロックサイズをサポートしてもよい。

【0169】

モード選択ユニット８０３は、例えばエラー結果に基づいて、イントラまたはインターのいずれかのコーディングモードを選択し、得られたイントラまたはインターコーディングされたブロックを残差生成ユニット８０７に提供して残差ブロックデータを生成し、再構成ユニット８１２に提供して参照ピクチャとして使用するために符号化ブロックを再構成してもよい。いくつかの例において、モード選択部８０３は、予測がインター予測信号およびイントラ予測信号に基づく、イントラおよびインター予測（ＣＩＩＰ）の組み合わせモードを選択してもよい。モード選択ユニット８０３は、インター予測の場合のブロックの動きベクトルの解像度（例えば、サブピクセル精度または整数ピクセル精度）を選択する可能性もある。

【0170】

現在の映像ブロックに対してインター予測を行うために、動き推定ユニット８０４は、バッファ８１３からの１つ以上の参照フレームを現在の映像ブロックと比較することによって、現在の映像ブロックの動き情報を生成することができる。動き補償ユニット８０５は、動き情報および現在の映像ブロックに関連付けられたピクチャ以外のバッファ８１３からのピクチャの復号化サンプルに基づいて、現在の映像ブロックの予測映像ブロックを決定してもよい。

【0171】

動き推定ユニット８０４および動き補償ユニット８０５は、例えば、現在の映像ブロックがＩスライス、Ｐスライス、またはＢスライスのいずれであるかに依存して、現在の映像ブロックに対して異なる動作を実行してもよい。

【0172】

いくつかの例において、動き推定ユニット８０４は、現在の映像ブロックに対して単方向予測を実行してもよく、動き推定ユニット８０４は、現在の映像ブロックに対する参照映像ブロックについてリスト０またはリスト１の参照ピクチャを検索してもよい。そして、動き推定ユニット８０４は、参照映像ブロックを含むリスト０またはリスト１の参照ピクチャを示す参照インデックスと、現在の映像ブロックと参照映像ブロックとの間の空間変位を示す動きベクトルとを生成してもよい。動き推定ユニット８０４は、現在の映像ブロックの動き情報として、参照インデックス、予測方向インデックス、及び動きベクトルを出力してもよい。動き補償ユニット８０５は、現在の映像ブロックの動き情報によって示される参照映像ブロックに基づいて、現在のブロックの予測映像ブロックを生成することができる。

【0173】

他の例において、動き推定ユニット８０４は、現在の映像ブロックに対して双方向予測を実行してもよく、動き推定ユニット８０４は、現在の映像ブロックに対する参照映像ブロックについてリスト０内の参照ピクチャを検索してもよく、現在の映像ブロックに対する別の映像ブロックについてリスト１内の参照ピクチャを検索してもよい。次に、動き推定ユニット８０４は、参照映像ブロックを含むリスト０およびリスト１の参照ピクチャを示す参照インデックスと、参照映像ブロックと現在の映像ブロックとの間の空間変位を示す動きベクトルとを生成してもよい。動き推定ユニット８０４は、参照インデックスと現在の映像ブロックの動きベクトルを現在の映像ブロックの動き情報として出力してもよい。動き補償ユニット８０５は、現在の映像ブロックの動き情報によって示される参照映像ブロックに基づいて、現在の映像ブロックの予測映像ブロックを生成することができる。

【0174】

いくつかの例において、動き推定ユニット８０４は、デコーダの復号化処理のために、フルセットの動き情報を出力してもよい。いくつかの例において、動き推定ユニット８０４は、現在の映像の動き情報のフルセットを出力しなくてもよい。むしろ、動き推定ユニット８０４は、現在の映像ブロックの動き情報を別の映像ブロックの動き情報を参照して信号通知してもよい。例えば、動き推定ユニット８０４は、現在の映像ブロックの動き情報が、近くの映像ブロックの動き情報と十分に類似していると決定する可能性がある。

【0175】

一例において、動き推定ユニット８０４は、現在の映像ブロックに関連付けられた構文構造において、現在の映像ブロックが別の映像ブロックと同じ動き情報を有することを映像デコーダ９００に指示する値を示すことができる。

【0176】

別の例において、動き推定ユニット８０４は、現在の映像ブロックに関連付けられた構文構造において、別の映像ブロックと、動きベクトル差（ＭＶＤ）とを識別してもよい。動きベクトル差は、現在の映像ブロックの動きベクトルと、指示された映像ブロックの動きベクトルとの間の差を示す。ビデオデコーダ９００は、現在の映像ブロックの動きベクトルを決定するために、示された映像ブロックの動きベクトルと動きベクトル差とを使用してもよい。

【0177】

上述したように、映像エンコーダ８００は、動きベクトルを予測信号通知することができる。ビデオエンコーダ８００によって実装され得る予測シグナリング技術の２つの例は、高度動きベクトル予測（ＡＭＶＰ）およびマージモードシグナルを含む。

【0178】

イントラ予測ユニット８０６は、現在の映像ブロックに対してイントラ予測を行う可能性がある。イントラ予測ユニット８０６が現在の映像ブロックに対してイントラ予測を行う場合、イントラ予測ユニット８０６は、同じピクチャ内の他の映像ブロックの復号化サンプルに基づく現在の映像ブロックの予測データを生成してもよい。現在の映像ブロックの予測データは、予測映像ブロックと様々な構文要素を含む可能性がある。

【0179】

残差生成ユニット８０７は、現在の映像ブロックから現在の映像ブロックの予測映像ブロック（複数可）を減算する（例えば、マイナス記号によって示される）ことにより、現在の映像ブロックの残差データを生成することができる。現在の映像ブロックの残差データは、現在の映像ブロックのサンプルの異なるサンプル成分に対応する残差映像ブロックを含んでもよい。

【0180】

他の例において、例えばスキップモードにおいて、現在の映像ブロックに対する残差データが存在しない可能性があり、残差生成ユニット８０７は減算演算を実行しない可能性がある。

【0181】

変換処理ユニット８０８は、現在の映像ブロックに関連付けられた残差映像ブロックに１つ以上の変換を適用することによって、現在の映像ブロックに対する１つ以上の変換係数映像ブロックを生成することができる。

【0182】

変換処理ユニット８０８が現在の映像ブロックに関連付けられた変換係数映像ブロックを生成した後、量子化ユニット８０９は、現在の映像ブロックに関連付けられた１つ以上の量子化パラメータ（ＱＰ）値に基づき、現在の映像ブロックに関連付けられた変換係数映像ブロックを量子化してもよい。

【0183】

逆量子化ユニット８１０および逆変換ユニット８１１は、それぞれ、変換係数ビデオブロックに逆量子化および逆変換を適用して、変換係数ビデオブロックから残差映像ブロックを再構成することができる。再構成ユニット８１２は、再構成された残差映像ブロックを、予測ユニット８０２によって生成された１つ以上の予測映像ブロックからの対応するサンプルに追加して、バッファ８１３に格納するための現在のブロックに関連付けられた再構成された映像ブロックを生成してもよい。

【0184】

再構成ユニット８１２がビデオブロックを再構成した後、ビデオブロックのビデオブロッキングアーティファクトを低減するために、ループフィルタリング動作が行われてもよい。

【0185】

エントロピー符号化ユニット８１４は、映像エンコーダ８００の他の機能性モジュールからデータを受信することができる。エントロピー符号化ユニット８１４がデータを受信すると、エントロピー符号化ユニット８１４は、１つ以上のエントロピー符号化演算を行ってエントロピー符号化データを生成し、エントロピー符号化データを含むビットストリームを出力することができる。

【0186】

図９は、図７に示したシステム７００における映像デコーダ７２４となり得る映像デコーダ９００の一例を示すブロック図である。

【0187】

映像デコーダ９００は、本開示の技術のいずれか１つまたはすべてを行うように設定可能である。図９の例において、ビデオデコーダ９００は、複数の機能性モジュールを含む。本開示で説明する技法は、映像デコーダ９００の様々な構成要素の間で共有される可能性がある。いくつかの例では、プロセッサは、本開示で説明する技法のいずれか１項またはすべてを実行するように構成可能である。

【0188】

図９の例において、ビデオデコーダ９００は、エントロピー復号化ユニット９０１、動き補償ユニット９０２、イントラ予測ユニット９０３、逆量子化ユニット９０４、逆変換ユニット９０５、および再構成ユニット９０６とバッファ９０７を含む。ビデオデコーダ９００は、いくつかの例において、ビデオエンコーダ８００（図８）に関して説明した符号化パスと概ね逆の復号化パスを行う可能性がある。

【0189】

エントロピー復号化ユニット９０１は、符号化ビットストリームを取得することができる。符号化ビットストリームは、エントロピーコーディングされた映像データ（例えば、映像データの符号化されたブロック）を含んでいてもよい。エントロピー復号化ユニット９０１は、エントロピーコーディングされたビデオデータを復号化してもよく、エントロピー復号化ビデオデータから、動き補償ユニット９０２は、動きベクトル、動きベクトルの精度、参照ピクチャリストインデックス、および他の動き情報を含む動き情報を決定してもよい。動き補償ユニット９０２は、例えば、ＡＭＶＰおよびマージモードを行うことによって、このような情報を決定することができる。

【0190】

動き補償ユニット９０２は、動き補償対象のブロックを生成してもよく、場合によっては、補間フィルタに基づく補間を行う。サブピクセル精度で使用する補間フィルタの識別子が、構文要素に含まれる可能性がある。

【0191】

動き補償ユニット９０２は、ビデオブロックの符号化中にビデオエンコーダ８００によって使用されたような補間フィルタを使用して、参照ブロックのサブ整数ピクセルに対する補間値を計算することができる。動き補償ユニット９０２は、受信した構文情報に応じたビデオエンコーダ８００によって使用される補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成することができる。

【0192】

動き補償ユニット９０２は、構文情報の一部を使用して、符号化ビデオシーケンスのフレーム（複数可）および／またはスライス（複数可）を符号化するために使用されるブロックのサイズ、符号化ビデオシーケンスのピクチャの各マクロブロックがどのように分割されているかを記述するパーティション情報、各パーティションの符号化の仕方を示すモード、各インターエンコードブロックに対する１つ以上の参照フレーム（および参照フレームリスト）、ならびにその他の情報を、エンコードビデオシーケンスをデコードするために決定する場合がある。

【0193】

イントラ予測ユニット９０３は、例えばビットストリームで受信したイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成することができる。逆量子化ユニット９０４は、ビットストリームで提供され、エントロピー復号化ユニット９０１によって復号化された量子化映像ブロック係数を逆量子化する、すなわち、脱量子化する。逆方向変換ユニット９０５は、逆方向変換を適用する。

【0194】

再構成ユニット９０６は、残差ブロックを、動き補償ユニット９０２またはイントラ予測ユニット９０３によって生成された対応する予測ブロックと合計して、復号化ブロックを形成してもよい。所望であれば、ブロック性アーチファクトを除去するために、デブロッキングフィルタを適用して復号化ブロックをフィルタリングすることもできる。復号化ビデオブロックは、次にバッファ９０７に格納され、バッファ９０７は、後続の動き補償／イントラ予測のための参照ブロックを提供し、また表示装置でのプレゼンテーションのための復号化ビデオを生成する。

【0195】

図１０は、符号化対象エンコーダ１０００の一例を示す模式図である。エンコーダ１０００は、ＶＶＣの技法を実装するのに好適である。エンコーダ１０００は、３つのインループフィルタ、すなわち、デブロッキングフィルタ（ＤＦ）１００２、サンプル適応オフセット（ＳＡＯ）１００４、および適応ループフィルタ（ＡＬＦ）１００６を含む。予め定義されたフィルタを使用するＤＦ１００２とは異なり、ＳＡＯ１００４およびＡＬＦ１００６は、現在のピクチャのオリジナルサンプルを利用して、オフセットを加えることによって、およびオフセットおよびフィルタ係数をシグナリングするコーディングされたサイド情報を有する有限インパルス応答（ＦＩＲ）フィルタをそれぞれ適用することによってオリジナルサンプルと再構成サンプル間の平均平方誤差を低減する。ＡＬＦ１００６は、各ピクチャの最後の処理段階に位置し、前の段階によって作成されたアーチファクトを捕捉して修正しようとするツールと見なすことができる。

【0196】

エンコーダ１０００は、さらに、イントラ予測コンポーネント１００８と、入力映像を受け取るように構成可能な動き推定／補償（ＭＥ／ＭＣ）コンポーネント１０１０とを含んでいる。イントラ予測コンポーネント１００８は、イントラ予測を行うように構成され、一方、ＭＥ／ＭＣコンポーネント１０１０は、インター予測を行うために参照ピクチャバッファ１０１２から得られる参照ピクチャを利用するように構成されている。インター予測またはイントラ予測からの残差ブロックは、変換成分１０１４および量子化成分１０１６に供給されて量子化された残差変換係数を生成し、この係数はエントロピーコーディング成分１０１８に供給される。エントロピーコーディングコンポーネント１０１８は、予測結果と量子化された変換係数をエントロピーコーディングし、ビデオデコーダ（コーディングされていない）に向けて同様なものを送信する。量子化コンポーネント１０１６から出力される量子化コンポーネントは、逆量子化コンポーネント１０２０、逆変換コンポーネント１０２２、および再構成（ＲＥＣ）コンポーネント１０２４に供給することが可能である。ＲＥＣコンポーネント１０２４は、ＤＦ１００２、ＳＡＯ１００４、およびＡＬＦ１００６に画像を出力して、それらの画像が参照ピクチャバッファ１０１２に記憶される前にフィルタリングを行うことができる。

【0197】

次に、いくつかの例では、好ましい解決策のリストが提供される。

【0198】

以下の解決策は、本明細書で論じる技術の例を示すものである。

【0199】

１．視覚メディア処理方法（例えば、図６に示す方法６００）は、ビデオファイルフォーマットに従って、ビジュアルメディアデータと、ビジュアルメディアデータに応じた情報を格納するファイルとの間で変換を実行する（６０２）こと；ここで、ビデオファイルフォーマットは、コンテンツ選択のための情報を構成可能なデコーダ構成レコードを含み、ここで、デコーダ構成レコードは、１以上のフィールドを含むことを備える：要求された復号ピクチャバッファサイズ、最大ピクチャ出力順序変更、最大遅延、段階的復号更新ピクチャ有効化フラグ、クリーンランダムアクセスピクチャ有効化フラグ、参照ピクチャリサンプリング有効フラグ、コーディングされた映像シーケンスによる空間解像度変更、サブピクチャパーティション有効フラグ、各ピクチャのサブピクチャの最大数、波面並列処理有効フラグ、タイル分割有効化フラグ、ピクチャの最大スライス数、スライス分割有効化フラグ、矩形スライス有効フラグ、ラスタスキャンスライス有効化フラグ、ピクチャごとのスライスの最大数。

【0200】

２．ビジュアルメディア処理方法は、規則に従ったビデオファイル形式に従って、ビジュアルメディアデータと、ビジュアルメディアデータに対応する情報を格納するファイルとの間の変換を行うステップと、規則が、ビジュアルメディアデータのプロファイルレベルティア情報がファイルに含まれるかどうかに応じて、時間的層の数を示すフィールドをデコーダ構成レコードに含めることを規定するステップと、規則が、フィールドがプロファイルレベルティア情報より前に含まれることをさらに規定するステップとを備える。

【0201】

３．解決手段２に記載される方法において、規則は、さらに、１つ以上の付加情報フィールドに関して、プロファイルレベルティア情報がビデオファイルフォーマット内で発生する順序を規定される。

【0202】

４．解決手段２に記載される方法において、１つ以上の追加情報フィールドは、彩度フォーマット指示フィールド、ビット深度フィールド、時間的レイヤの数を示すフィールドまたは定数フレームレートが前記視覚メディアデータに使用されるかどうかを示すフィールドを含む。

【0203】

５．解決手段２に記載される方法において、１つ以上の追加情報フィールドは、予約ビットフィールドを含む。

【0204】

６．解決手段２～５のいずれか１つに記載の方法において、ルールは、プロファイルティアレベル情報がデコーダ構成レコードの最後のフィールドとして含まれることを規定する。

【0205】

７．解決手段１～６のいずれか１つに記載の方法において、変換は、ビジュアルメディアデータのビットストリーム表現を生成することと、フォーマット規則に従ってビットストリーム表現をファイルに格納することとを含む。

【0206】

８．解決手段１～６のいずれか１つに記載の方法において、変換は、フォーマット規則に従ったファイルの構文解析を行い、視覚メディアデータを復元することを含む。

【0207】

９．解決手段１～８の１つ以上に記載された方法を実装可能なプロセッサを含む、映像復号化装置。

【0208】

１０．解決手段１～８の１つ以上に記載された方法を実装するように設定可能なプロセッサを含む、映像符号化装置。

【0209】

１１．その上に格納されたコンピュータコードを有するコンピュータプログラム製品であって、該コードは、プロセッサによって実行されると、当該プロセッサに解決策１から８のいずれかに記載された方法を実装させる、コンピュータプログラム製品。

【0210】

１２．解決手段１～８のいずれかに応じて生成されるファイルフォーマットに準拠したビットストリーム表現が記録されたコンピュータ可読媒体。

【0211】

１３．本明細書に記載された方法、装置またはシステム。本明細書に記載の解決策では、エンコーダは、フォーマット規則に従ったコーディングされた表現を生成することにより、フォーマット規則に準拠することが可能である。本明細書に記載の解決策では、デコーダは、フォーマット規則を使用して、フォーマット規則に従った構文要素の有無の知識を用いて、コーディングされた表現内の構文要素を解析し、復号化ビデオを生成することができる。

【0212】

本明細書において、「映像処理」という用語は、映像符号化、映像復号化、映像圧縮または映像伸張を指す可能性がある。例えば、ビデオのピクセル表現から対応するビットストリーム表現への変換中、またはその逆の変換中に、ビデオ圧縮アルゴリズムが適用されてよい。現在の映像ブロックのビットストリーム表現は、例えば、構文によって定義されるように、ビットストリーム内の同一位置にあるか、または異なる場所に広がっているビットに対応することがある。例えば、マクロブロックは、変換およびコーディングされたエラー残差値の観点から、また、ビットストリーム内のヘッダおよび他のフィールドのビットを使用して符号化することができる。さらに、変換中、デコーダは、上記解決策に記載されているように、判定に基づき、いくつかのフィールドが存在する可能性がある、または存在しない可能性があるという知識を持って、ビットストリームを構文解析することができる。同様に、エンコーダは、特定の構文フィールドが含まれる、または含まれないことを決定し、構文フィールドをコーディングされた表現に含める、または除外することによって、コーディングされた表現を応じた形で生成することができる。

【0213】

開示された、および他の解決策、例示、実施形態、モジュール、および本書に記載された機能的動作は、本書に開示された構造およびそれらの構造的同等物を含むデジタル電子回路、またはコンピュータソフトウェア、ファームウェアまたはハードウェアでまたはそれらの一つ以上の組み合わせで実施されることができる。開示された実施形態および他の実施形態は、１つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のため、またはデータ処理装置の動作を制御するためにコンピュータ可読媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実施することができる。コンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす組成物、またはそれらの１つ以上の組み合わせであり得る。「データ処理装置」という用語は、データを処理するためのすべての装置、デバイス、および機械を包含し、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサもしくはコンピュータを含む。装置は、ハードウェアに加えて、当該コンピュータプログラムの実行環境を構築するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステムを構成するコード、またはそれらの１つ以上の組み合わせを含むことができます。伝搬信号とは、人工的に生成した信号、例えば、機械で生成した電気信号、光信号、電磁波信号であり、適切な受信装置に送信するための情報を符号化するために生成される。

【0214】

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても知られている）は、計算言語または解釈言語を含むいずれかの形式のプログラミング言語で記述することができ、スタンドアロンプログラムとして、または計算環境での使用に適したモジュール、コンポーネント、サブルーチン、または他のユニットとしてなど、いずれの形式でも展開することができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応する必要はない。プログラムは、他のプログラムまたはデータ（例えば、マークアップ言語文書に格納された１つ以上のスクリプト）を保持するファイルの一部、当該プログラム専用の単一のファイル、または複数の調整ファイル（モジュール、サブプログラム、またはコードの部分）に格納することができる。コンピュータプログラムは、１つのコンピュータ上で、または１つのサイトに位置する、または複数のサイトに分布し、通信ネットワークによって相互に接続された複数のコンピュータ上で実行されるように配置することができる。

【0215】

本書で説明するプロセスおよびロジックフローは、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって算出することができ、入力データに対する演算および出力の生成によって機能を実行する。また、処理およびロジックフローは、特定用途向け集積回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）により行われ、また、装置は、特定用途向け集積回路として実装されることも可能である。

【0216】

コンピュータプログラムの実行に適したプロセッサには、例として、一般性マイクロプロセッサと特殊性マイクロプロセッサの両方、および、任意の種類のデジタルコンピュータのいずれか１つ以上のプロセッサが含まれる。一般的に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリまたは両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を行うためのプロセッサと、命令およびデータを記憶するための１つ以上のメモリデバイスである。一般的に、コンピュータは、データを記憶するための１つ以上の大容量記憶デバイス、例えば磁気ディスク、光磁気ディスク、または光ディスクからデータを受信するか、データを転送するか、またはその両方も含むか、または操作的に算出される。しかし、コンピュータは、そのようなデバイスを有する必要はない。コンピュータ可読プログラム命令およびデータを格納するのに適したコンピュータ可読媒体には、例において、半導体メモリデバイス、例えばＥＰＲＯＭ、ＥＥＰＲＯＭおよびフラッシュメモリデバイス；磁気ディスク、例えば内部ハードディスクまたはリムーバルディスク；磁気光ディスク；およびＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクを含むあらゆる形態の不揮発性メモリ、媒体およびメモリデバイスを含む。プロセッサおよびメモリは、特定用途のロジック回路によって補完することができ、またはそれに組み込むことができる。

【0217】

本特許文献には多くの具体的事項が含まれているが、これらは、いずれかの主題の範囲または請求項の制限として解釈されるべきではなく、むしろ、特定の技術の特定の実施形態に固有の可能性がある特徴の記述として解釈されるべきである。別個の実施形態のコンテキストで本特許文献に記載されている特定の特徴は、１つの実施形態において組み合わせて実装することも可能である。逆に、１つの実施形態のコンテキストで説明される様々な特徴は、複数の実施形態において別個にまたはいずれか適切なサブコンビネーションで実装することも可能である。さらに、特徴は、特定の組み合わせで作用するものとして上述の通り説明され、そのように初期化されることさえあるが、請求された組み合わせからの１つ以上の特徴は、場合によっては組み合わせから切除され、請求された組み合わせは、サブコンビネーションまたはサブコンビネーションの変形例に向けられることがある。

【0218】

同様に、演算は特定の順序で図面に描かれているが、これは、望ましい結果を得るために、そのような演算が示された特定の順序で行われること、または順番に行われること、または図示されたすべての演算が行われることを要件とするものと理解されるべきではない。さらに、本特許文献に記載された実施形態における様々なシステム成分の分離は、全ての実施形態においてそのような分離が要件であると理解されるべきではないだろう。

【0219】

少数の実装形態および例のみが記載されており、他の実装形態、拡張および変形例は、本特許文献に記載、図示されたものに基づいて行うことができる。

【0220】

第１の成分は、第１の成分と第２の成分との間にライン、トレース、および別の媒体を除き、介在する成分がないときに、第２の成分に直接結合される。第１の成分は、第１の成分と第２の成分との間にライン、トレース、または別の媒体以外の成分が介在している場合、第２の成分に間接的に結合される。用語「結合された」およびその変形は、直接結合および間接結合のいずれも含む。用語「約」の使用は、そうでない場合、後続の数の±１０％を含む範囲を意味する。

【0221】

本開示においていくつかの実施形態が提供されているが、開示されたシステムおよび方法は、本開示の精神または範囲から逸脱することなく、多くの他の特定の形態で実施される可能性があることを理解されたい。本例は、例示であって制限的なものではないと考えられ、その意図は、本明細書で所与の詳細に制限されるものでない。例えば、様々な要素または成分は、別のシステムにおいて結合され、または統合されてもよく、または特定の特徴は省略され、または実装形態でなくてもよい。

【0222】

さらに、様々な実施形態において離散的または別個のものとして説明および図示された技法、システム、サブシステム、および方法は、本開示の範囲から逸脱することなく、他のシステム、モジュール、技術、または方法と結合または統合することができる。結合されたものとして示され、または議論されたそうでない場合、直接接続されてもよいし、電気的、機械的、または他のいずれであっても、何らかのインターフェース、デバイス、または中間構成要素を介して間接的に結合または通信されてもよい。他の変化、置換、および変更の例は、当業者によって確認可能であり、本明細書に開示された精神および範囲から逸脱することなく行うことができる。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【手続補正書】

【提出日】2023-06-21

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

レイヤのピクチャと、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループに基づき、グルーピングタイプパラメータとを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行い、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
ビジュアルメディアデータ処理方法。

【請求項2】

前記変換は、
ビジュアルメディアファイル内の前記レイヤにピクチャを符号化することと、
アクセスポイントを規定するロールサンプルグループを前記レイヤに決定することと、
前記グルーピングタイプパラメータを前記ビジュアルメディアデータファイルに符号化することと、
前記ビジュアルメディアデータファイルを記憶することと、を含む、
請求項１に記載の方法。

【請求項3】

前記変換は、
前記レイヤにコーディングされたピクチャを含む前記ビジュアルメディアデータファイルを受信することと、
前記ビジュアルメディアデータファイルからロールサンプルグループを取得することと、前記ロールサンプルグループは、前記レイヤへの前記アクセスポイントを規定し、
前記ビジュアルメディアデータファイルから前記グルーピングタイプパラメータを取得することと、
前記グルーピングタイプパラメータに基づき前記ビジュアルメディアデータファイルを復号化することと、を含む、
請求項１に記載の方法。

【請求項4】

前記グルーピングタイプパラメータは、各ビットが前記関連レイヤの１つを規定する複数のビットを含むターゲットレイヤパラメータを含む、
請求項１から請求項３のいずれか１つに記載の方法。

【請求項5】

前記レイヤ識別子方式識別コードパラメータの値は、前記アクセスポイントが前記関連レイヤのみに適用されるまたはすべての前記レイヤに適用されることを規定する、
請求項１から請求項４のいずれか１項に記載の方法。

【請求項6】

前記グルーピングタイプパラメータはｇｒｏｕｐ＿ｔｙｐｅ＿ｐａｒａｍｅｔｅｒと表され、ターゲットレイヤパラメータはｔａｒｇｅｔ＿ｌａｙｅｒｓと表され、前記レイヤ識別子方式識別コードパラメータはｌａｙｅｒ＿ｉｄｍｅｔｈｏｄ＿ｉｄｃと表される、
請求項１から請求項５のいずれか１項に記載の方法。

【請求項7】

前記関連レイヤのすべてのアクセスポイントがＧＤＲピクチャであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃがゼロに設定される、
請求項１から請求項６のいずれか１項に記載の方法。

【請求項8】

前記関連レイヤのすべてのアクセスポイントがＧＤＲピクチャであり、前記アクセスポイントが前記関連レイヤのみに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが１に設定される、
請求項１から請求項７のいずれか１項に記載の方法。

【請求項9】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントがすべての前記レイヤに適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃが２に設定される、
請求項１から請求項８のいずれか１項に記載の方法。

【請求項10】

前記関連レイヤにおける前記アクセスポイントがＧＤＲピクチャ、混合ＮＡＬユニットピクチャまたはそれらの組み合わせであり、前記アクセスポイントが前記関連レイヤにのみ適用されることを規定する場合に、ｌａｙｅｒ＿ｉｄ＿ｍｅｔｈｏｄ＿ｉｄｃは３に設定される、
請求項１から請求項９のいずれか１項に記載の方法。

【請求項11】

プロセッサと、その上に命令を有する非一時的メモリと、を備える映像データ処理装置であって、前記プロセッサによる実行時に、前記命令は、前記プロセッサに、
レイヤのピクチャと、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループに基づき、グルーピングタイプパラメータとを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行わせ、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
映像データ処理装置。

【請求項12】

ビデオコーディングデバイスによって使用するためのコンピュータプログラム製品を含む非一時的のコンピュータ可読媒体であって、前記コンピュータプログラム製品は、プロセッサによって実行されると、前記ビデオコーディングデバイスに以下を実行させるように、非一時的なコンピュータ可読媒体に格納されたコンピュータ実行命令を含み、
レイヤのピクチャと、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループに基づき、グルーピングタイプパラメータとを含むビジュアルメディアデータとビジュアルメディアデータファイルとの間の変換を行い、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
非一時的のコンピュータ可読媒体。

【請求項13】

映像処理装置によって実行される方法によって生成されるビジュアルメディアデータファイルを格納する非一時的のコンピュータ可読記憶媒体であって、前記方法は、
レイヤのピクチャと、前記レイヤへのアクセスポイントを規定するランダムアクセスリカバリポイント（ロール）サンプルグループに基づき、グルーピングタイプパラメータとを含むビジュアルメディアデータファイルを生成することを含み、前記グルーピングタイプパラメータは、前記アクセスポイントと前記レイヤの関連レイヤとの間の対応を規定し、前記アクセスポイントが、
１つ以上の段階的復号化リフレッシュ（ＧＤＲ）ピクチャと、
イントラランダムアクセスポイント（ＩＲＡＰ）サブピクチャと非ＩＲＡＰサブピクチャとの両方を有する１つ以上の混合ネットワーク抽象化レイヤ（ＮＡＬ）ユニットピクチャと、
を１つ以上含むことを規定するレイヤ識別子方式識別コードパラメータを含む、
非一時的のコンピュータ可読記憶媒体。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０００１

【補正方法】変更

【補正の内容】

【0001】

関連出願の相互参照
本出願は、２０２１年１０月２６日出願の国際特許出願ＰＣＴ／ＣＮ２０２１／１２６２９９に基づいており、２０２０年１０月２６日出願の国際特許出願ＰＣＴ／ＣＮ２０２０／１２３５４０の優先権および利益を主張する。前述の特許出願は、その全体が参照により本明細書に組み込まれる。

【国際調査報告】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版