(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-02-22
(54)【発明の名称】ビデオストリームにおいて異なるNALユニットタイプのNALユニットを混合するためのデコーダ、エンコーダおよび方法
(51)【国際特許分類】
H04N 19/70 20140101AFI20230215BHJP
H04N 19/31 20140101ALI20230215BHJP
【FI】
H04N19/70
H04N19/31
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022536873
(86)(22)【出願日】2020-12-16
(85)【翻訳文提出日】2022-08-10
(86)【国際出願番号】 EP2020086523
(87)【国際公開番号】W WO2021122817
(87)【国際公開日】2021-06-24
(32)【優先日】2019-12-20
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】サンチェス デ ラ フエンテ ヤゴ
(72)【発明者】
【氏名】ズーリング カルステン
(72)【発明者】
【氏名】ヘルゲ コーネリアス
(72)【発明者】
【氏名】ツェル トーマス
(72)【発明者】
【氏名】スクピン ロベルト
(72)【発明者】
【氏名】ウィーガンド トーマス
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA33
5C159PP04
5C159RC11
5C159UA02
5C159UA05
(57)【要約】
本発明は、第1サブビットストリーム(11-1)及び第2サブビットストリーム(11-2)を含むビデオデータストリーム(11)を処理するためのデコーダ、エンコーダ及び対応する方法に関する。本明細書で説明する概念は、アクセスユニット(30、31、32)内で、異なるNALユニットタイプの異なるNALユニット(301、302、3030、304)を混合するためのソリューションを提供する。例えば、IRAP NALユニットタイプは、異なるIRAP NALユニットタイプまたは非IRAP NALユニットタイプと混合され得、非IRAP NALユニットタイプは、異なる非IRAP NALユニットタイプと混合され得る。
【特許請求の範囲】
【請求項1】
ビデオコンテンツ(12)を復号するためのデコーダ(100)であって、
前記デコーダ(100)は、
前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第1空間セグメント(13
1)に関連する第1サブビットストリーム(11-1)と、前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第2空間セグメント(13
2)に関連する第2サブビットストリーム(11-2)と、を含むビットストリーム(11)を復号するように構成され、
A)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、異なる非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合される非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である、少なくとも1つのアクセスユニット(30)を含む、または、
B)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、さらなるIRAP NALユニットタイプ(IDR、またはCRA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、または、
C)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)またはSTSA NALユニットタイプの何れかである前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、
デコーダ(100)。
【請求項2】
ピクチャ(12a、12b、12c、・・・)の前記空間セグメント(13
1、13
2)は、前記ビデオコンテンツ(12)におけるピクチャ(12a、12b、12c、・・・)の、独立して符号化されたサブピクチャ(20c)に関連し、
前記デコーダ(100)は、サブピクチャ境界を交差する動き補償予測に関して境界拡張を用いるように構成される、
請求項1に記載のデコーダ(100)。
【請求項3】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項4】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項5】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャ(RADL)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項6】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項7】
前記デコーダ(100)は、前記ビットストリーム(11)から指示を導出するように構成され、
前記指示は、前記第2サブビットストリーム(11-2)の前記非IRAP NALユニットタイプの前記NALユニット(304)が、前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)と混合されることを前記デコーダ(100)に明示的に示し、
NALユニット(304)が、トレーリングピクチャユニットタイプ(TRAIL)であり、
NALユニット(302)が、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャ(RADL)の何れかである、
請求項3または請求項4に記載のデコーダ(100)。
【請求項8】
前記指示は、パラメータセットのシンタックス要素を含む、
請求項7に記載のデコーダ(100)。
【請求項9】
前記シンタックス要素は、ピクチャパラメータセットまたはシーケンスパラメータセットの少なくとも1つに含まれる、
請求項8に記載のデコーダ(100)。
【請求項10】
前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)がランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)である場合、
前記デコーダ(100)は、
前記第1サブビットストリーム(11-1)の前記ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)の前記NALユニット(302)に対応する前記第1サブビットストリーム(11-1)の前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c)の第1空間セグメント(13
1)を、
a)無視するまたは出力すること控えること、または
b)破損した空間セグメントとして、出力しマークすることを、
前記デコーダ(100)に向けて指示する前記ビットストリームから指示を導出するように構成される、
請求項1~9の何れか1項に記載のデコーダ(100)。
【請求項11】
b)の場合、前記デコーダ(100)は、SEI(Supplemental Enhancement information)メッセージにより、後続の処理チェーンに向けて前記破損した空間セグメントをマークするように構成される、
請求項10に記載のデコーダ(100)。
【請求項12】
前記デコーダ(100)は、パラメータセットから制約指示を復号するように構成され、
前記制約指示は、前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプが非リーディングピクチャ NALユニットタイプ(TRAILまたはSTSA)である場合、前記第1サブビットストリーム(11-1)の、関連するIRAP NALユニット(301)が前記クリーンランダムアクセスユニットタイプ(CRA)である場合に独占的に、前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプが、ランダムアクセスピクチャであることを、前記デコーダ(100)に向けて示す、
請求項1~11の何れか1項に記載のデコーダ(100)。
【請求項13】
前記第2ビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニット(304)は、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項12に記載のデコーダ(100)。
【請求項14】
A)の場合、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項15】
A)の場合、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項16】
前記デコーダ(100)は、前記ビットストリーム(11)から指示を導出するように構成され、
前記指示は、前記第2サブビットストリーム(11-2)の前記非IRAP NALユニットタイプの前記NALユニット(304)が、前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)と混合されることを前記デコーダ(100)に明示的に示し、
NALユニット(304)が、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であり、
NALユニット(302)が、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャ(RADL)の何れかである、
請求項15に記載のデコーダ(100)。
【請求項17】
前記指示は、パラメータセットのシンタックス要素を含む、
請求項16に記載のデコーダ(100)。
【請求項18】
前記シンタックス要素は、ピクチャパラメータセットまたはシーケンスパラメータセットの少なくとも1つに含まれる、
請求項17に記載のデコーダ(100)。
【請求項19】
前記デコーダ(100)は、前記ビットストリーム(11)のパラメータセットから制約フラグを復号するように構成され、
前記制約フラグは、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)の1つ以上のNALユニット(302)と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット(304)とを混合したものを含む、前記ビットストリーム(11)の任意のアクセスユニット(30)が、前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に関連付けられる制約を満たすことを、前記デコーダ(100)に向けて示す、
請求項14~18の何れか1項に記載のデコーダ(100)。
【請求項20】
前記制約は、復号順序に従い、ステップワイズテンポラルサブレイヤクセス(STSA)より次の上位テンポラルサブレイヤに関連付けられる、任意のピクチャが、前記次の上位テンポラルサブレイヤが前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に先行する場合、前記次の上位テンポラルサブレイヤでピクチャを参照することを許可しないことを前記デコーダ(100)に向けて示す、
請求項19に記載のデコーダ(100)。
【請求項21】
前記デコーダ(100)は、前記ビットストリーム(11)のパラメータセットから制約フラグを復号するように構成され、
前記制約フラグは、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)の1つ以上のNALユニット(302)と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット(304)とを混合したものを含む、前記ビットストリーム(11)の任意のアクセスユニット(30)が、前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に関連付けられる制約に従わないことを、前記デコーダ(100)に向けて示し、
前記デコーダ(100)は、前記制約フラグに応えて、前記ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプの1つ以上のNALユニット(304)を解析することを控え、ステップワイズテンポラルサブレイヤクセスの復号を暗黙的に推測する、
請求項14~18の何れか1項に記載のデコーダ(100)。
【請求項22】
ビデオコンテンツ(12)を復号するためのデコーダ(100)であって、
ビットストリーム(11)を復号し、
前記ビットストリーム(11)のパラメータセットから制約フラグを復号し、
前記制約フラグは、前記ビットストリーム(11)内で、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)のNALユニット(302)を含む任意のアクセスユニット(30)が前記ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプに関連付けられる制約を満たすことを、前記デコーダ(100)に向けて示す、
デコーダ(100)。
【請求項23】
B)の場合、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAPユニットタイプは、クローズドGOP構造に関連付けられるIRAP NALユニットタイプであり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAPユニットタイプは、オープンGOP構造に関連付けられるIRAP NALユニットタイプである、
請求項1または請求項2に記載のデコーダ(100)。
【請求項24】
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプを有するCRAユニットタイプ(CRA_with_RADL)であり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプを有するCRAユニットタイプ(CRA_with_RASL)である、
請求項23に記載のデコーダ(100)。
【請求項25】
B)の場合、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプを有する瞬間デコーディングリフレッシュ(IDR_W_RADL)であり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAP NALユニットタイプは、クリーンランダムアクセスユニットタイプ(CRA)である、
請求項1または請求項2に記載のデコーダ(100)。
【請求項26】
前記デコーダ(100)は、
ビットストリームの順序において、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)の共同設置された空間セグメント(13
2b、13
2c)を復号して提示し、
ビットストリームの順序において、前記第1サブビットストリーム(11-1)の前記NALユニット(302)が関連する少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)の共同設置された空間セグメント(13
1b、13
1c)を破棄するようにマークする、
ように構成され、
共同設置された空間セグメント(13
2b、13
2c)が、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)のピクチャ(12a)の前記第2空間セグメント(13
2a)に一緒に並べられ、
共同設置された空間セグメント(13
1b、13
1c)が、前記第1サブビットストリーム(11-1)の前記NALユニット(302)が関連する少なくとも1つのアクセスユニット(30)のピクチャ(12a)の前記第1空間セグメント(13
1a)に一緒に並べられる、
請求項23~25の何れか1項に記載のデコーダ(100)。
【請求項27】
前記デコーダ(100)は、
通常のプレイアウト中に連続的に復号する場合、ビットストリームの順序において、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)の共同設置された空間セグメント(13
2b、13
2c)を復号して提示するように構成され、共同設置された空間セグメント(13
2b、13
2c)が、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)のピクチャ(12a)の前記第2空間セグメント(13
2a)に一緒に並べられ、
復号開始の場合、ビットストリームの順序において、前記少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)を破棄し、1つ以上のピクチャ(12b、12c・・・)が破棄された後に出力されたピクチャを再開するように構成される、
請求項23~25の何れか1項に記載のデコーダ(100)。
【請求項28】
前記デコーダ(100)は、
通常のプレイアウト中に連続的に復号する場合、ビットストリームの順序において、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)の共同設置された空間セグメント(13
2b、13
2c)を復号して提示するように構成され、共同設置された空間セグメント(13
2b、13
2c)が、前記第2サブビットストリーム(11-2)の前記NALユニット(304)が関連する少なくとも1つのアクセスユニット(30)のピクチャ(12a)の前記第2空間セグメント(13
2a)に一緒に並べられ、
ビットストリームの順序において、前記第1サブビットストリーム(11-1)の前記NALユニット(302)が関連する少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)の共同設置された空間セグメント(13
1b、13
1c)を破棄するようにマークする、ように構成され、共同設置された空間セグメント(13
1b、13
1c)が、前記第1サブビットストリーム(11-1)の前記NALユニット(302)が関連する少なくとも1つのアクセスユニット(30)のピクチャ(12a)の前記第1空間セグメント(13
1a)に一緒に並べられ
復号開始の場合、ビットストリームの順序において、前記少なくとも1つのアクセスユニット(30)に続くアクセスユニット(31、32・・・)の1つ以上のピクチャ(12b、12c・・・)を破棄し、1つ以上のピクチャ(12b、12c・・・)が破棄された後に出力されたピクチャを再開するように構成される、
請求項23~25の何れか1項に記載のデコーダ(100)。
【請求項29】
前記デコーダ(100)は、SEI(Supplemental Enhancement information)メッセージにより、後続の処理チェーンに向けて前記破損した空間セグメントをマークするように構成される、
請求項26~28の何れか1項に記載のデコーダ(100)。
【請求項30】
前記デコーダ(100)は、前記アクセスユニット(30)がクリーンランダムアクセスNALユニットタイプとは異なるIRAP NALユニットタイプ(IDR_W_RADL)のNALユニット(302)を含んでいても、クリーンランダムアクセスNALユニットタイプに対応する方法で、前記第1サブビットストリーム(11-1)および前記第2サブビットストリーム(11-2)と関連する前記少なくとも1つのアクセスユニット(30)を復号するため前記デコーダ(100)に向けて指示する前記ビットストリーム(11)から指示を導出するように構成される、
請求項23~29の何れか1項に記載のデコーダ(100)。
【請求項31】
ビデオコンテンツ(12)を処理するための装置(10)であって、
前記装置(10)は、
前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第1空間セグメント(13
1)に関連する第1サブビットストリーム(11-1)を提供し、前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第2空間セグメント(13
2)に関連する第2サブビットストリーム(11-2)を提供するように構成され、
前記第1サブビットストリーム(11-1)および前記第2サブビットストリーム(11-2)は、ビットストリーム(11)の一部であり、
A)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、異なる非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合される非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である、少なくとも1つのアクセスユニット(30)を含む、または、
B)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、さらなるIRAP NALユニットタイプ(IDR、またはCRA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、または、
C)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)またはSTSA NALユニットタイプの何れかである前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、
装置(10)。
【請求項32】
ピクチャ(12a、12b、12c、・・・)の前記空間セグメント(13
1、13
2)は、前記ビデオコンテンツ(12)におけるピクチャ(12a、12b、12c、・・・)の、独立して符号化されたサブピクチャ(20c)に関連し、
前記デコーダ(100)は、サブピクチャ境界を交差する動き補償予測に関して境界拡張を用いるように構成される、
請求項31に記載の装置(10)。
【請求項33】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項31または請求項32に記載の装置(10)。
【請求項34】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項31または請求項32に記載の装置(10)。
【請求項35】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャ(RADL)である、
請求項31または請求項32に記載の装置(10)。
【請求項36】
A)の場合では、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項31または請求項32に記載の装置(10)。
【請求項37】
前記装置(10)は、前記第2サブビットストリーム(11-2)の前記非IRAP NALユニットタイプの前記NALユニット(304)が、前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)と混合されることを指示するため、前記ビットストリーム(11)から指示を設定するように構成され、
NALユニット(304)が、トレーリングピクチャユニットタイプ(TRAIL)であり、
NALユニット(302)が、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャ(RADL)の何れかである、
請求項33または請求項34に記載の装置(10)。
【請求項38】
前記指示は、パラメータセットのシンタックス要素を含む、
請求項37に記載の装置(10)。
【請求項39】
前記シンタックス要素は、ピクチャパラメータセットまたはシーケンスパラメータセットの少なくとも1つに含まれる、
請求項38に記載のデコーダ(100)。
【請求項40】
前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)がランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)である場合、
前記装置(10)は、
前記第1サブビットストリーム(11-1)の前記ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)の前記NALユニット(302)に対応する前記第1サブビットストリーム(11-1)の前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c)の第1空間セグメント(13
1)を、
a)無視するまたは出力すること控えること、または
b)破損した空間セグメントとして、出力しマークすること、
を指示するため、前記ビットストリームで指示を設定するように構成される、
請求項31~39の何れか1項に記載の装置(10)。
【請求項41】
b)の場合、前記装置(10)は、SEI(Supplemental Enhancement information)メッセージにより、後続の処理チェーンに向けて前記破損した空間セグメントをマークするように構成される、
請求項40に記載の装置(10)。
【請求項42】
前記装置(10)は、前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプが非リーディングピクチャ NALユニットタイプ(TRAILまたはSTSA)である場合、前記第1サブビットストリーム(11-1)の、関連するIRAP NALユニット(301)が前記クリーンランダムアクセスユニットタイプ(CRA)である場合に独占的に、前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプが、ランダムアクセスピクチャであることを、指示するために、パラメータセットで制約指示を設定するように構成される、
請求項31~41の何れか1項に記載の装置(10)。
【請求項43】
前記第2ビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニット(304)は、トレーリングピクチャユニットタイプ(TRAIL)である、
請求項42に記載の装置(10)。
【請求項44】
A)の場合、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である、
請求項31または請求項32に記載の装置(10)。
【請求項45】
A)の場合、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記非IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である、
請求項31または請求項32に記載の装置(10)。
【請求項46】
前記装置(10)は、前記第2サブビットストリーム(11-2)の前記非IRAP NALユニットタイプの前記NALユニット(304)が、前記第1サブビットストリーム(11-1)の前記非IRAP NALユニットタイプの前記NALユニット(302)と混合されることを指示するため、前記ビットストリーム(11)で指示を設定するように構成され、
NALユニット(304)が、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であり、
NALユニット(302)が、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャ(RADL)の何れかである、
請求項45に記載の装置(10)。
【請求項47】
前記指示は、パラメータセットのシンタックス要素を含む、
請求項46に記載の装置(10)。
【請求項48】
前記シンタックス要素は、ピクチャパラメータセットまたはシーケンスパラメータセットの少なくとも1つに含まれる、
請求項47に記載の装置(10)。
【請求項49】
前記装置(10)は、前記ビットストリーム(11)のパラメータセットで制約フラグを設定するように構成され、
前記制約フラグは、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)の1つ以上のNALユニット(302)と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット(304)とを混合したものを含む、前記ビットストリーム(11)の任意のアクセスユニット(30)が、前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に関連付けられる制約を満たすことを、指示する、
請求項44~48の何れか1項に記載の装置(10)。
【請求項50】
前記制約は、復号順序に従い、ステップワイズテンポラルサブレイヤクセス(STSA)より次の上位テンポラルサブレイヤに関連付けられる、任意のピクチャが、前記次の上位テンポラルサブレイヤが前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に先行する場合、前記次の上位テンポラルサブレイヤでピクチャを参照することを許可しないことを指示する、
請求項49に記載の装置(10)。
【請求項51】
前記装置(10)は、前記ビットストリーム(11)のパラメータセットで制約フラグを設定し、前記ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプの1つ以上のNALユニット(304)を解析する代わりに、ステップワイズテンポラルサブレイヤクセスの復号を暗黙的に推測するように構成され、
前記制約フラグは、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)の1つ以上のNALユニット(302)と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット(304)とを混合したものを含む、前記ビットストリーム(11)の任意のアクセスユニット(30)が、前記ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に関連付けられる制約に従わないことを指示する、
請求項44~48の何れか1項に記載の装置(10)。
【請求項52】
ビデオコンテンツ(12)を処理するための装置(10)であって、
ビットストリーム(11)を処理し、
前記ビットストリーム(11)のパラメータセットで制約フラグを設定し、
前記制約フラグは、前記ビットストリーム(11)内で、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)のNALユニット(302)を含む任意のアクセスユニット(30)が前記ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプに関連付けられる制約を満たすことを指示する、
装置(10)。
【請求項53】
B)の場合、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAPユニットタイプは、クローズドGOP構造に関連付けられるIRAP NALユニットタイプであり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAPユニットタイプは、オープンGOP構造に関連付けられるIRAP NALユニットタイプである、
請求項31または請求項32に記載の装置(10)。
【請求項54】
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプを有するCRAユニットタイプ(CRA_with_RADL)であり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプを有するCRAユニットタイプ(CRA_with_RASL)である、
請求項53に記載の装置(10)。
【請求項55】
B)の場合、
前記第2サブビットストリーム(11-2)の前記NALユニット(304)の前記IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプを有する瞬間デコーディングリフレッシュ(IDR_W_RADL)であり、
前記第1サブビットストリーム(11-1)の前記NALユニット(302)の前記IRAP NALユニットタイプは、クリーンランダムアクセスユニットタイプ(CRA)である、
請求項31または請求項32に記載の装置(10)。
【請求項56】
前記装置(10)は、前記アクセスユニット(30)がクリーンランダムアクセスNALユニットタイプとは異なるIRAP NALユニットタイプ(IDR_W_RADL)のNALユニット(302)を含んでいても、クリーンランダムアクセスNALユニットタイプに対応する方法で、前記第1サブビットストリーム(11-1)および前記第2サブビットストリーム(11-2)と関連する前記少なくとも1つのアクセスユニット(30)が処理されることを指示するために、前記ビットストリーム(11)で指示を設定するように構成される、
請求項53~55の何れか1項に記載の装置(10)。
【請求項57】
前記装置(10)は、エンコーダ、マージャー、およびネットワークノードの少なくとも1つを含む、
請求項31~56の何れか1項に記載の装置(10)。
【請求項58】
ビデオコンテンツ(12)を復号するための方法であって、
前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第1空間セグメント(13
1)に関連する第1サブビットストリーム(11-1)と、前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第2空間セグメント(13
2)に関連する第2サブビットストリーム(11-2)と、を含むビットストリーム(11)を復号するステップを含み、
A)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、異なる非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合される非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である、少なくとも1つのアクセスユニット(30)を含む、または、
B)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、さらなるIRAP NALユニットタイプ(IDR、またはCRA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、または、
C)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)またはSTSA NALユニットタイプの何れかである前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、
方法。
【請求項59】
ビデオコンテンツ(12)を処理するための方法であって、
前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第1空間セグメント(13
1)に関連する第1サブビットストリーム(11-1)を提供し、前記ビデオコンテンツ(12)のピクチャ(12a、12b、12c、・・・)の第2空間セグメント(13
2)に関連する第2サブビットストリーム(11-2)を提供するステップを含み、
前記第1サブビットストリーム(11-1)および前記第2サブビットストリーム(11-2)は、ビデオビットストリーム(11)の一部であり、
A)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、異なる非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合される非IRAP NALユニットタイプ(RADL、RASL、TRAIL、またはSTSA)である、少なくとも1つのアクセスユニット(30)を含む、または、
B)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、さらなるIRAP NALユニットタイプ(IDR、またはCRA)である前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、または、
C)前記ビットストリーム(11)は、前記第1サブビットストリーム(11-1)の少なくとも1つの第1NALユニット(302)が、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)またはSTSA NALユニットタイプの何れかである前記第2サブビットストリーム(11-2)の少なくとも1つの異なる第2NALユニット(304)と混合されるIRAP NALユニットタイプ(IDR、またはCRA)である、少なくとも1つのアクセスユニット(30)を含む、
方法。
【請求項60】
前記ビデオビットストリーム(11)の中に前記第1サブビットストリーム(11-1)および前記第2サブビットストリーム(11-2)を組み合わせるステップを含む、
請求項59に記載の方法。
【請求項61】
請求項58~60の何れか1項に記載の方法によって得られる、
データストリーム(11)。
【請求項62】
コンピュータの動作時に、請求項58~60の何れか1項に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムを記憶したコンピュータ読取可能なデジタル記憶媒体。
【請求項63】
ビデオコンテンツ(12)を復号するためのデコーダ(100)であって、
前記デコーダ(100)は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を復号するように構成され、
前記デコーダ(100)は、前記第1および第2サブビットストリーム(11-1、11-2)の前記NALユニット(302、304)のスライスヘッダーから派生するように構成され、NALユニット(302、304)は、IRAP NALユニットタイプ(CRA、IDR_W_LP、IDR_N_LP)の、前記NALユニット(302、304)が参照するピクチャ(12r)のPOCにおける最上位POC部分(POC MSB)を設定するための情報であり、
A)アクセスユニット(32)内の少なくとも1つのNALユニット(302)が非瞬間デコーディングリフレッシュユニットタイプ(CRA)ではない場合、前記前記最上位POC部分(POC MSB)が、前記ビットストリーム(11)のアクセスユニット(32)内で前記IRAP NALユニットタイプの全てのNALユニット(302、304)のための所定値に設定する必要がある、または、
B)任意のピクチャ参照が復号順序において、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が所定値に設定されるスライスヘッダーを有する、前記ビットストリーム(11)の任意のアクセスユニット(32)を交差することを許可されない、または、
C)第1アクセスユニット(31)のピクチャ(12a、12b、12c・・・)の任意のピクチャ参照が許可されず、前記第1アクセスユニット(31)が、前記最上位POC部分(POC MSB)が第1所定値に設定され、ビットストリーム順序において、ピクチャ(12s)により前記ビットストリーム(11)の第2アクセスユニット(32)に先行するスライヘッダーを有するNALユニット(301、303)で構成され、前記第2アクセスユニットが、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が第2所定値に設定されるスライスヘッダーを有しており、ピクチャ(12s)は、前記ビットストリーム順序において、前記ビットストリーム(11)の前記第2アクセスユニット(32)に続く、
デコーダ(100)。
【請求項64】
A)の場合において、
前記所定値は、前記NALユニット(302)が参照するピクチャ(12r)に先行するピクチャ(12a、12b・・・)に関連付けられるPOCの最上位POC部分(POC MSB)以上である、
請求項63に記載のデコーダ(100)。
【請求項65】
前記所定値は、0に等しい、
請求項63または請求項64に記載のデコーダ(100)。
【請求項66】
前記所定値は、暗黙的に導出される最上位POC部分に等しい、
請求項63または請求項64に記載のデコーダ(100)。
【請求項67】
B)の場合において、
前記所定値は、前記NALユニット(302、304)が参照する前記ピクチャ(12r)に先行するピクチャ(12a、12b、12c・・・)に関連付けられるPOCの最上位POC(POC MSB)より小さい、
請求項63に記載のデコーダ(100)。
【請求項68】
前記所定値は、0に等しい、
請求項63または請求項67に記載のデコーダ(100)。
【請求項69】
前記所定値は、暗黙的に導出される最上位POC部分をに等しい、
請求項63または請求項67に記載のデコーダ(100)。
【請求項70】
C)の場合において、
前記第1所定値は、前記第2所定値より大きい、
請求項63に記載のデコーダ(100)。
【請求項71】
前記第2所定値は、0に等しい、
請求項63または請求項70に記載のデコーダ(100)。
【請求項72】
前記第2所定値は、暗黙的に導出される最上位POC部分に等しい、
請求項63または請求項70に記載のデコーダ(100)。
【請求項73】
前記ビットストリーム(11)は、多重レイヤのビットストリームであり、
前記第1サブビットストリーム(11-1)が、第1レイヤ(L0)に属し、
前記第2サブビットストリーム(11-2)が、異なる第2レイヤ(L1)に属する、
請求項63~72の何れか1項に記載のデコーダ(100)。
【請求項74】
前記ピクチャ参照は、短期ピクチャ参照および長期ピクチャ参照の少なくとも1つを含む、
請求項63~73の何れか1項に記載のデコーダ(100)。
【請求項75】
ビデオコンテンツ(12)を符号化するエンコーダ(10)であって、
前記エンコーダ(10)は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を符号化するように構成され、
前記エンコーダ(10)は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を設定するように構成され、NALユニット(302、304)は、IRAP NALユニットタイプ(CRA、IDR_W_LP、IDR_N_LP)の、前記NALユニット(302、304)が参照するピクチャ(12r)のPOCにおける最上位POC部分(POC MSB)であり、
A)アクセスユニット(32)内の少なくとも1つのNALユニット(302)が非瞬間デコーディングリフレッシュユニットタイプ(CRA)ではない場合、前記前記最上位POC部分(POC MSB)が、前記ビットストリーム(11)のアクセスユニット(32)内で前記IRAP NALユニットタイプの全てのNALユニット(302、304)のための所定値に設定する必要がある、または、
B)任意のピクチャ参照が復号順序において、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が所定値に設定されるスライスヘッダーを有する、前記ビットストリーム(11)の任意のアクセスユニット(32)を交差することを許可されない、または、
C)第1アクセスユニット(31)のピクチャ(12a、12b、12c・・・)の任意のピクチャ参照が許可されず、前記第1アクセスユニット(31)が、前記最上位POC部分(POC MSB)が第1所定値に設定され、ビットストリーム順序において、ピクチャ(12s)により前記ビットストリーム(11)の第2アクセスユニット(32)に先行するスライヘッダーを有するNALユニット(301、303)で構成され、前記第2アクセスユニットが、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が第2所定値に設定されるスライスヘッダーを有しており、ピクチャ(12s)は、前記ビットストリーム順序において、前記ビットストリーム(11)の前記第2アクセスユニット(32)に続く、
エンコーダ(10)。
【請求項76】
A)の場合において、
前記所定値は、前記NALユニット(302)が参照するピクチャ(12r)に先行するピクチャ(12a、12b・・・)に関連付けられるPOCの最上位POC部分(POC MSB)以上である、
請求項75に記載のエンコーダ(10)。
【請求項77】
前記所定値は、0に等しい、
請求項75または請求項76に記載のエンコーダ(10)。
【請求項78】
前記所定値は、暗黙的に導出される最上位POC部分に等しい、
請求項75または請求項76に記載のエンコーダ(10)。
【請求項79】
B)の場合において、
前記所定値は、前記NALユニット(302、304)が参照する前記ピクチャ(12r)に先行するピクチャ(12a、12b、12c・・・)に関連付けられるPOCの最上位POC(POC MSB)より小さい、
請求項75に記載のエンコーダ(10)。
【請求項80】
前記所定値は、0に等しい、
請求項75または請求項79に記載のエンコーダ(10)。
【請求項81】
前記所定値は、暗黙的に導出される最上位POC部分をに等しい、
請求項75または請求項79に記載のエンコーダ(10)。
【請求項82】
C)の場合において、
前記第1所定値は、前記第2所定値より大きい、
請求項75に記載のエンコーダ(10)。
【請求項83】
前記第2所定値は、0に等しい、
請求項75または請求項82に記載のエンコーダ(10)。
【請求項84】
前記第2所定値は、暗黙的に導出される最上位POC部分に等しい、
請求項75または請求項82に記載のエンコーダ(10)。
【請求項85】
前記ビットストリーム(11)は、多重レイヤのビットストリームであり、
前記第1サブビットストリーム(11-1)が、第1レイヤ(L0)に属し、
前記第2サブビットストリーム(11-2)が、異なる第2レイヤ(L1)に属する、
請求項75~84の何れか1項に記載のエンコーダ(10)。
【請求項86】
前記ピクチャ参照は、短期ピクチャ参照および長期ピクチャ参照の少なくとも1つを含む、
請求項75~85の何れか1項に記載のエンコーダ(10)。
【請求項87】
ビデオコンテンツ(12)を復号するための方法であって、
前記方法は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を復号するステップと、
前記第1および第2サブビットストリーム(11-1、11-2)の前記NALユニット(302、304)のスライスヘッダーから派生するステップであって、NALユニット(302、304)が、IRAP NALユニットタイプ(CRA、IDR_W_LP、IDR_N_LP)の、前記NALユニット(302、304)が参照するピクチャ(12r)のPOCにおける最上位POC部分(POC MSB)を設定するための情報であるステップと、を含み、
A)アクセスユニット(32)内の少なくとも1つのNALユニット(302)が非瞬間デコーディングリフレッシュユニットタイプ(CRA)ではない場合、前記前記最上位POC部分(POC MSB)が、前記ビットストリーム(11)のアクセスユニット(32)内で前記IRAP NALユニットタイプの全てのNALユニット(302、304)のための所定値に設定する必要がある、または、
B)任意のピクチャ参照が復号順序において、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が所定値に設定されるスライスヘッダーを有する、前記ビットストリーム(11)の任意のアクセスユニット(32)を交差することを許可されない、または、
C)第1アクセスユニット(31)のピクチャ(12a、12b、12c・・・)の任意のピクチャ参照が許可されず、前記第1アクセスユニット(31)が、前記最上位POC部分(POC MSB)が第1所定値に設定され、ビットストリーム順序において、ピクチャ(12s)により前記ビットストリーム(11)の第2アクセスユニット(32)に先行するスライヘッダーを有するNALユニット(301、303)で構成され、前記第2アクセスユニットが、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が第2所定値に設定されるスライスヘッダーを有しており、ピクチャ(12s)は、前記ビットストリーム順序において、前記ビットストリーム(11)の前記第2アクセスユニット(32)に続く、
方法。
【請求項88】
ビデオコンテンツ(12)を符号化する方法であって、
前記方法は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を符号化するステップと、
前記エンコーダ(10)は、第1サブビットストリーム(11-1)および第2サブビットストリーム(11-2)を含むビットストリーム(11)を設定するステップであって、NALユニット(302、304)は、IRAP NALユニットタイプ(CRA、IDR_W_LP、IDR_N_LP)の、前記NALユニット(302、304)が参照するピクチャ(12r)のPOCにおける最上位POC部分(POC MSB)であるステップと、を含み、
A)アクセスユニット(32)内の少なくとも1つのNALユニット(302)が非瞬間デコーディングリフレッシュユニットタイプ(CRA)ではない場合、前記前記最上位POC部分(POC MSB)が、前記ビットストリーム(11)のアクセスユニット(32)内で前記IRAP NALユニットタイプの全てのNALユニット(302、304)のための所定値に設定する必要がある、または、
B)任意のピクチャ参照が復号順序において、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が所定値に設定されるスライスヘッダーを有する、前記ビットストリーム(11)の任意のアクセスユニット(32)を交差することを許可されない、または、
C)第1アクセスユニット(31)のピクチャ(12a、12b、12c・・・)の任意のピクチャ参照が許可されず、前記第1アクセスユニット(31)が、前記最上位POC部分(POC MSB)が第1所定値に設定され、ビットストリーム順序において、ピクチャ(12s)により前記ビットストリーム(11)の第2アクセスユニット(32)に先行するスライヘッダーを有するNALユニット(301、303)で構成され、前記第2アクセスユニットが、全てのNALユニット(302、304)がIRAP NALユニットタイプであり、前記最上位POC部分(POC MSB)が第2所定値に設定されるスライスヘッダーを有しており、ピクチャ(12s)は、前記ビットストリーム順序において、前記ビットストリーム(11)の前記第2アクセスユニット(32)に続く、
方法。
【請求項89】
請求項87または請求項88に記載の方法によって得られる、
データストリーム(11)。
【請求項90】
コンピュータの動作時に、請求項87または請求項88に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムを記憶したコンピュータ読取可能なデジタル記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、ビデオストリームを復号/符号化するためのデコーダおよび対応するエンコーダに関し、特に、少なくとも2つのビデオサブストリームを備えるビデオストリームに関する。前記ビデオストリームは、複数のアクセスユニットを備え得、各アクセスユニットは、前記2つ以上のビデオサブストリームの各々に含まれる少なくとも1つのピクチャを備え得る。各ピクチャは、特定のNALユニットタイプのNAL(Network Abstraction Layer:ネットワーク抽象化レイヤ)ユニットに関連付けられ得る。本明細書で説明する革新的な概念は、異なるNALユニットタイプのNALユニットを混合するための解決策を導入する。
【背景技術】
【0002】
NALユニットは、それぞれ、符号化ピクチャまたは他の関連データを含むかどうかに従って、VCL(Video Coding Layer:ビデオ符号化レイヤ)および非VCL NALユニットに分類され得る。HEVC規格では、デコーダの初期化およびランダムアクセス目的のためのピクチャのカテゴリを識別するいくつかのVCL NALユニットタイプが含まれる。2バイトNALユニットヘッダーの内容を使用して、関連付けられたペイロードデータの目的を簡単に識別できる。
【0003】
ビデオ符号化技術はランダムアクセスとビットストリームの結合を可能にする。ランダムアクセスに関して、ビットストリームは、IDR(Instantaneous Decoding Refresh:瞬間デコーディングリフレッシュ)アクセスユニットで開始することができる。IDRアクセスユニットは、独立して符号化されたピクチャ、すなわち、NALユニットストリーム中の以前のピクチャを復号せずに、復号され得る符号化ピクチャを含む。IDRアクセスユニットの存在は、ビットストリーム中の後続のピクチャが、それが復号されるためにそれが含むピクチャより前のピクチャの参照を必要としないことを示す。IDRピクチャは、クローズドGOP(Group Of Pictures)として知られる符号化構造内で使用される。上述のIDRシンタックスに代わるものとして、RAPまたはIRAP((Intra)Random Access Point)の位置における独立に符号化されたピクチャの使用、すなわち、ビットストリーム内の位置を指定するCRA(Clean Random Access:クリーンランダムアクセス)ピクチャシンタックスがある。このシンタックスは、オープンGOP操作として知られる効率的な時間的符号化順序をサポートする、ビットストリーム内に先に現れたピクチャを復号する必要なしに、デコーダがピクチャを正常に復号し始めることができるビットストリーム内の位置を指定する。
【0004】
ランダムアクセスの良好なサポートは、チャネル切り替え、シーク(seek)動作、および動的ストリーミングサービスを可能にするために重要であり得る。復号順序でCRAピクチャの後に続き、表示順序でそれに先行するいくつかのピクチャは、デコーダにおいて利用可能でないピクチャへのインターピクチャ(interpicture)予測参照を含み得る。したがって、これらの非復号可能ピクチャは、CRA点で復号処理を開始するデコーダによって破棄され得る。この目的のために、そのような非復号ピクチャは、RASLピクチャ(Random Access Skipped Leading:ランダムアクセススキップリーディング)として識別され得る。IRAPピクチャは、IDRまたはCRAピクチャであり得、CRAピクチャの後に、ビットストリーム中のRASLピクチャが続き得る。RASLピクチャは、例えば、結合動作のために、ビットストリーム中に実際には存在しないピクチャへの参照を含み得るので、デコーダによって破棄され得る。
【0005】
復号順序でIRAPピクチャに後続し、出力順序でIRAPピクチャに先行することができるさらなるタイプのピクチャは、RADLピクチャ(Random Access Decordable Leading:ランダムアクセスデコーダブルリーディング)であり、これは、復号順序でIRAPピクチャに先行する任意のピクチャへの参照を含まないことがある。RASLおよびRADLピクチャは、まとめて、リーディングピクチャ(LP:Leading Pictures)と呼ばれることがある。復号順序および出力順序の両方でIRAPピクチャに続くピクチャは、トレーリングピクチャ(trailing:TRAIL)として知られている。それらは、インターピクチャ予測のためのLPへのいかなる参照も含まないことがある。
【0006】
今日のビデオコーディングでは、テンポラルサブレイヤリングサポート(Temporal Sublayering Support)も与えられ得る。したがって、階層的時間的予測構造におけるレベルを示す時間的識別子がNALユニットヘッダーにおいて指定され得る。これは、NALユニットヘッダー以外のビットストリームの部分を解析する必要なく、時間的なスケーラビリティを実現するのに役立つ。特定の状況下では、復号された時間サブレイヤの数は、1つの符号化ビデオシーケンスの復号処理中に調整され得る。サブレイヤの切り替えが、いくつかのより高い時間レイヤの復号を開始することが可能であるビットストリーム中の点の位置は、STSAピクチャ(Stepwise Temporal Sublayer Access:ステップワイズテンポラルサブレイヤクセス)の存在によって示され得る。STSAピクチャの位置において、より低い時間的サブレイヤを復号することから、1つの特定のより高い時間的サブレイヤを復号することに切り替えることが可能であり得る(ただし、それらがSTSAピクチャも含まない限り、その上のさらなるレイヤはそうではない)。
【0007】
複数の参照ピクチャの管理の場合、ビットストリーム中のピクチャの残りの部分の復号のために、以前に復号されたピクチャの特定のセットがDPB(Decorded Picture Buffer)中に存在し得る。これらのピクチャを識別するために、POC(Picture Order Count)識別子のリストが各スライスヘッダーで送信されることがある。保持される参照ピクチャの設定は、RPS(Reference Picture Set)と呼ばれる。POCは、ビットストリーム中の各ピクチャについて、それぞれの現在のピクチャ順序カウント(POC値)を示すための最下位ビット部分(LSB)と最上位ビット部分(MSB)とを含み得、ピクチャ順序は、それぞれのピクチャの復号順序とは異なり得る。したがって、IRAPピクチャの後にピクチャを復号することは、IRAPピクチャの前の参照ピクチャを参照するが、困難であり得る。
【0008】
したがって、特に、IRAPピクチャの後に現れる場合に、ビットストリーム中のピクチャおよびピクチャのシーケンスの適切な処理を提供し得る既存のエンコーダおよびデコーダを改善することが望ましい。
【0009】
したがって、少なくとも独立請求項の特徴を有するデコーダと、少なくとも独立請求項の特徴を有する符号化および/またはマージのための対応する装置とを提供することが提案される。さらに、対応するコンピュータプログラム製品およびビットストリームと同様に、それぞれ符号化および復号化の対応する方法を提供することが提案される。有利な実施形態は、従属請求項に提示される。
【0010】
上述のように、ビットストリームは、IRAP NALユニットタイプに関連付けられているピクチャを備え得、このピクチャは、IRAPピクチャとも呼ばれ得、また、IRAP NALユニットタイプに関連付けられていないピクチャ、すなわち、非IRAP NALユニットタイプに関連付けられているピクチャは、非IRAPピクチャとも呼ばれ得る。
【発明の概要】
【課題を解決するための手段】
【0011】
一態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、ビデオコンテンツのピクチャの第1空間セグメント(131)に関連する第1サブビットストリームと、ビデオコンテンツのピクチャの第2空間セグメント(132)に関連する第2サブビットストリームと、を含むビットストリームを復号するように構成される。この場合、ビットストリームは、第1サブビットストリームの少なくとも1つの第1NALユニットが非IRAP NALユニットタイプ、例えばRASL、RADL、TRAIL、STSAである少なくとも1つのアクセスユニットを備える。少なくとも1つのアクセスユニットは、非IRAP NALユニットタイプ、たとえば、RASL、RADL、TRAIL、STSAである第2サブビットストリームの少なくとも1つの異なる第2NALユニットをさらに備え、第1サブビットストリームの第1NALユニットと第2サブビットストリームの第2NALユニットとが混合される。言い換えれば、非IRAP NALユニットは、異なる非IRAP NALユニットと混合される。例えば、TRAILピクチャNALユニットタイプのNALユニットは、RASLピクチャNALユニットタイプのNALユニットと混合されることができる。この非限定的な例によれば、1つのアクセスユニット内で、第1サブビットストリームのTRAILピクチャは、第2サブビットストリームのRASLピクチャと混合され得る。他の非限定的な例は、1つのアクセスユニット内で、第1サブビットストリームのTRAILピクチャを第2サブビットストリームのRADLピクチャと混合することを可能にし得る。いくつかのさらなる非限定的な例は、1つのアクセスユニット内で、第1サブビットストリームのTRAILピクチャを第2サブビットストリームのSTSAピクチャと混合することを可能にし得る。いくつかのさらなる非限定的な例は、1つのアクセスユニット内で、第1サブビットストリームのSTSAピクチャを第2サブビットストリームのRADLピクチャと混合することを可能にし得る。いくつかのさらなる非限定的な例は、1つのアクセスユニット内で、第1サブビットストリームのSTSAピクチャを第2サブビットストリームのRASLピクチャと混合することを可能にし得る。いくつかのさらなる非限定的な例は、1つのアクセスユニット内で、第1サブビットストリームのRASLピクチャと第2サブビットストリームのRADLピクチャとを混合することを可能にし得る。
【0012】
さらなる態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、ビデオコンテンツのピクチャの第1空間セグメントに関連する第1サブビットストリームと、ビデオコンテンツのピクチャの第2空間セグメントに関連する第2サブビットストリームとを備えるビットストリームを復号するように構成される。この場合、ビットストリームは、第1サブビットストリームの少なくとも1つの第1NALユニットが、さらなるIRAP NALユニットタイプである第2サブビットストリームの少なくとも1つの第2NALユニットと混合されるIRAP NALユニットタイプである少なくとも1つのアクセスユニットを備える。言い換えれば、第1IRAP NALユニットは、さらなる第2IRAP NALユニットと混合される。さらなる第2IRAP NALユニットは、第1IRAP NALユニットと同じNALユニットタイプであってもよく、または第1IRAP NALユニットとは異なるNALユニットタイプであってもよい。たとえば、CRAピクチャNALユニットタイプのNALユニットは、同じNALユニットタイプのさらなるピクチャ、たとえば、さらなるCRAピクチャNALと混合され得るか、または異なるNALユニットタイプのさらなるピクチャ、たとえば、先行ピクチャをもつIDRピクチャNALユニットタイプのNALユニット、すなわち、IDRーwithーRADLピクチャユニットタイプ(IDR_W_RADL)と混合され得る。この非限定的な例によれば、1つのアクセスユニット内で、第1サブビットストリームのCRAピクチャを、第2サブビットストリームのさらなるCRAピクチャまたは第2サブビットストリームのIDR_W_RADLピクチャと混合することができる。
【0013】
さらなる態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、ビデオコンテンツのピクチャの第1空間セグメントに関連する第1サブビットストリームと、ビデオコンテンツのピクチャの第2空間セグメントに関連する第2サブビットストリームとを備えるビットストリームを復号するように構成される。この場合、ビットストリームは、第1サブビットストリームの少なくとも1つの第1NALユニットが、非IRAPリーディングピクチャNALユニットタイプ(たとえば、RASLまたはRADL)またはSTSA NALユニットタイプのいずれかである第2サブビットストリームの少なくとも1つの第2NALユニットと混合されるIRAP NALユニットタイプである少なくとも1つのアクセスユニットを備える。言い換えれば、1つのアクセスユニット内で、IRAP NALユニット(IDR_W_RADLまたはCRA)が非IRAP NALユニットと混合され、非IRAP NALユニットは、RASLピクチャ、RADLピクチャ、またはSTSAピクチャのいずれか1つである。
【0014】
さらなる態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、第1サブビットストリームと第2サブビットストリームとを含むビットストリームを復号するように構成され、デコーダは、第1および第2サブビットストリームのNALユニットのスライスヘッダーから派生するように構成され、NALユニットは、IRAP NALユニットタイプ(例えば、CRA、IDR_W_RADL)であり、NALユニットが参照するピクチャのPOCの最上位POC部分を設定するための情報である。この例では、最上位POC部分は、ビットストリームのアクセスユニット内のIRAP NALユニットタイプのすべてのNALユニットについて、アクセスユニット内の少なくとも1つのNALユニットが非瞬間デコーディングリフレッシュ(nonーInstantaneous Decoding Refresh:非IDR)ユニットタイプである場合、所定値に設定されることが必要である。言い換えれば、アクセスユニット内の少なくとも1つのNALユニットが非IDRピクチャ、例えばCRAピクチャを参照する場合、最上位POC部分は、所定値に設定される必要がある。非限定的な例として、所定値は、NALユニットが参照するピクチャに先行するピクチャに関連付けられているPOCの最上位POC部分以上であり得る。言い換えれば、非IDRピクチャがアクセスユニット内に存在する場合、POCリセットは発生しないことがある。
【0015】
さらなる態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、第1サブビットストリームと第2サブビットストリームとを含むビットストリームを復号するように構成され、デコーダは、第1および第2サブビットストリームのNALユニットのスライスヘッダーから派生するように構成され、NALユニットは、IRAP NALユニットタイプ(例えば、CRA、IDR_W_RADL)であり、NALユニットが参照するピクチャのPOCの最上位POC部分を設定するための情報である。この例では、どのピクチャ参照も、復号順序において、すべてのNALユニットがIRAP NALユニットタイプであり、最上位POC部分が所定値に設定されるスライスヘッダーを有するビットストリームの任意のアクセスユニットを横断することを許可されない。言い換えれば、アクセスユニット内の各ピクチャがIRAP NALユニットタイプ(たとえば、CRAまたはIDR_W_RADL)を参照し得、所定値に設定される最上位POC部分を有し得る場合、前記アクセスユニットに先行する参照ピクチャから参照する任意のピクチャは許可され得ない。非限定的な例として、前記所定値は、NALユニットが参照するピクチャに先行するピクチャに関連するPOCの最上位POC部分よりも小さくてもよい。所定値は、例えば、最上位POC部分のリセットが発生した場合、より小さくてもよい。したがって、上述の非限定的な例によれば、アクセスユニットがIRAPピクチャのみを備える場合があり、最上位POC部分のリセットが発生した場合、先行する参照ピクチャを参照することによるピクチャ参照は許可されない場合がある。
【0016】
さらなる態様によれば、ビデオコンテンツを復号するためのデコーダが提供され、デコーダは、第1サブビットストリームと第2サブビットストリームとを含むビットストリームを復号するように構成され、デコーダは、第1および第2サブビットストリームのNALユニットのスライスヘッダーから派生するように構成され、NALユニットは、IRAP NALユニットタイプ(例えば、CRA、IDR_W_RADL)であり、NALユニットが参照するピクチャのPOCの最上位POC部分を設定するための情報である。この例では、最上位POC部分が第1所定値に設定され、ビットストリーム順序で、すべてのNALユニットがIRAP NALユニットタイプであり、最上位POC部分が第2所定値に設定されるスライスヘッダーを有するビットストリームの第2アクセスユニットに先行するスライスヘッダーを有する第1アクセスユニットの参照ピクチャを、ビットストリーム順序で、ビットストリームの第2アクセスユニットに続くピクチャによって参照することは、許可されない。非限定的な例によれば、第1所定値は、第2所定値よりも大きくてもよい。言い換えれば、(先行する)第1アクセスユニットの最上位POC部分の第1所定値が、第2アクセスユニットの最上位POC部分の第2所定値よりも大きい場合、第2アクセスユニットに続くピクチャが、前記第2アクセスユニットに先行する参照ピクチャを参照し得ることは許可され得ない。
【0017】
さらなる態様によれば、それぞれの対応するエンコーダ、符号化のための方法、および復号化のための方法が提案される。
【0018】
さらなる態様によれば、コンピュータプログラムが提供され、ここで、コンピュータプログラムの各々は、コンピュータまたは信号プロセッサ上で実行されるときに、ここに記載された方法のうちの1つを実装するように構成され、それにより、ここに記載された方法は、コンピュータプログラムのうちの1つによって実装される。
【図面の簡単な説明】
【0019】
以下では、本開示の実施形態が図面を参照してより詳細に説明される。
【
図1】
図1は、実施形態に従って本発明のデコーダおよび符号化/マージのための装置によって処理され得るビットストリームの概略図である。
【
図2】
図2は、IDR_N_LP NALユニットタイプを有するアクセスユニットと、同じNALユニットタイプを有する他のすべてのアクセスユニットとを有するビットストリームの概略図である。
【
図3】
図3は、IDR_W_LP NALユニットタイプを有するアクセスユニットおよびTRAILユニットタイプと混合された対応するRADLユニットタイプを有するビットストリームの概略図である。
【
図4】
図4は、CRA NALユニットタイプを有するアクセスユニットおよびTRAILユニットタイプと混合された対応するRASLユニットタイプを有するビットストリームの概略図である。
【
図5】
図5は、選択的高解像度タイルを有する完全な360度の低解像度のサムネイルを示す図である。
【
図6】
図6は、1つのタイル(上の例)において、ピクチャがステップワイズテンポラルサブレイヤクセスを示すSTSA NALユニットタイプを用い、別のタイル(下の例)において同じピクチャがRASL NAILユニットタイプを用いる、例示的なコーディング構造を示す図である。
【
図7】
図7は、クローズドGOP構造を用いた高解像度領域(上)および、オープンGOP構造を用いた高解像度領域(下)における例示的なコーディング構造を示す図である。
【
図8】
図8は、レイヤ整列されたRAPピクチャでリセットされたPOCを有するマルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図9】
図9は、すべてのNALユニットIDRが許可されていない場合の、POC MSBリセットを伴うマルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図10】
図10は、すべてのNALユニットIDRが許可されている場合の、POC MSBリセットを伴うマルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図11】
図11は、POC MSBリセットおよびLT参照が許可されていない場合の、マルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図12】
図12は、すべてのPOC MSBが0に等しく、LT参照が許可されていない場合の、マルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図13】
図13は、すべてのPOC MSBが0に等しく、LT参照が許可されている場合の、マルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【
図14】
図14は、POC MSBがリセットされてなく、LT参照が許可されている場合の、マルチレイヤビットストリームの例示的なコーディング構造を示す図である。
【発明を実施するための形態】
【0020】
同等または同等の要素または同等または同等の機能を有する要素は、以下の説明において、同等または同等の参照番号によって示される。
【0021】
ブロック図によって描写され、前記ブロック図を参照して説明される方法ステップはまた、描写および/または説明される順序とは異なる順序で実行され得る。さらに、装置の特定の特徴に関する方法ステップは、前記装置の前記特徴と置き換え可能であってもよく、他の方法であってもよい。
【0022】
ピクチャおよびアクセスユニットにおけるNALユニットタイプの混合
1.符号化ピクチャ内の混合ユニットタイプ
図1は、導入目的のために、本発明の実施形態による、ビデオビットストリーム11を符号化および/またはマージするためのデコーダ100および装置10によって処理され得る例示的なビデオビットストリーム11の構造を示す。ビデオビットストリーム11は、連続するピクチャ12a、12b、12cのシーケンスを備え、前記連続するピクチャ12a、12b、12cのうちの2つ以上は、意図されるビデオコンテンツの少なくとも一部を表すことができるGOP(Group of Pictures)12中に一緒にグループ化され得る。
【0023】
コーディングのために、各ピクチャ12a、12b、12cは、空間セグメント、たとえば、スライス、タイル、またはブロックに細分され得る。この限定的でない例では、ピクチャ12a、12b、12cは、それぞれ、2つの空間セグメント、すなわち、第1(例えば、左側の)空間セグメント131と第2(例えば、右側の)空間セグメント132に細分化される。
【0024】
ビットストリーム11は、ピクチャ12a、12b、12cの第1空間セグメント131に関連する第1サブビットストリーム11-1と、ピクチャ12a、12b、12cの第2空間セグメント132に関連する第2サブビットストリーム11-2とに細分化することができる。
【0025】
いくつかのピクチャ12a、12bは、たとえば予測符号化によって、依存的に符号化され得る。これらのピクチャ12bのうちのいくつかは、単一予測によって、たとえば、単一の先行ピクチャを参照することによって予測され得、一方、いくつかの他のピクチャ12aは、たとえば、先行ピクチャおよび後続ピクチャを参照することによって、双予測によって予測され得る。いくつかの他のピクチャ12cは、独立して符号化され得る、すなわち、これらのピクチャ12cは、先行または後続のピクチャを参照し得ない。独立して符号化されたピクチャ12cは、ビットストリーム11内の位置を表す(イントラ)ランダムアクセスポイント((I)RAP)を提供することができ、それは、ビットストリーム11内のより早く現れたピクチャを復号する必要なしに、デコーダが後続のピクチャを復号し始めることができる。たとえば、ピクチャ12cは、(I)RAPピクチャとも呼ばれ得る独立して符号化されたピクチャである。本開示では、RAPおよびIRAPという用語は、同義語として使用され得る。
【0026】
ビットストリーム11は、ビットストリーム11にアクセスするための1つ以上のアクセスユニット30を備えることができる。
図1の非限定的な例では、アクセスユニット30は、第1および第2サブビットストリーム11-1、11-2に含まれるピクチャセグメント13
1、13
2を(提示順序に関して)揃えることができる。これらの整列されたピクチャセグメント13
1、13
2を含むピクチャ12a、12b、12cは、それぞれ、異なるカテゴリ、例えば、(上述したように)IRAPピクチャおよび非IRAPピクチャにグループ化することができる。
【0027】
ネットワークアブストラクションレイヤ(Network Abstraction Layer:NAL)は、それらのピクチャセグメント131、132およびピクチャ12a、12b、12cを定義するためのハイレベルシンタックス(High Level Syntax)を提供することができる。特に、NALユニットは、ピクチャ12a、12b、12cの各々について、前記ピクチャセグメント131、132に関連付けられてもよい。したがって、本開示では、上述のピクチャセグメント131、132、第1および第2サブビットストリーム11-1、11-2のは、NALユニットとも同義であると呼ぶことができる。したがって、第1および第2サブビットストリーム11-1、11-2は、NALユニットストリームとも呼ばれる。各々のNALユニット131、132は、特定のNALユニット型を含むことができる。NALユニットタイプは、次に、NALユニットに含まれるそれぞれのピクチャの前述のカテゴリ、すなわち、それぞれのNALユニットがIRAPタイプであるか非IRAPタイプであるかを識別することができる。
【0028】
ピクチャ内でIRAPタイプを混合することに依存する複数のアプリケーションがあり、IRAPタイプは、NALユニットタイプを通じて示されるアクセスユニット(AU:Access Unit)30またはその一部のランダムアクセスプロパティである。ユースケースは、単一レイヤまたはマルチレイヤのコーデックドメイン、すなわち、同じピクチャの他のスライスがそうでない間、ピクチャがIRAPであるスライスから構成される単一レイヤコーデックビットストリーム、またはアクセスユニットが1つのレイヤにIRAPを含み、他のレイヤが非IRAPピクチャを含むマルチレイヤコーデックビットストリームのいずれかにある。
【0029】
現在、混合NALユニットタイプのサポートは、IRAP NALユニットタイプの単一タイプが、TRAILピクチャと共にピクチャ内で混合され得る従来技術において与えられる。しかしながら、これは、以下に記載され、本発明が解決策を提供するような特徴の必要性を適切に動機付ける使用事例をカバーしない。
【0030】
混合NALユニットタイプの必要性を動機付ける主な使用事例は、360度ビデオであり、タイルストリーミングが使用され、360度全体のサブセットのみが高解像度で送信され、残りは低解像度で送信される。視線方向の変化が起こると、高解像度の一部のタイルはもはや必要とされないが、低解像度で示された新しいタイルは、この時間以降、高解像度で必要とされる。これらのタイルは、変化(高解像度から低解像度へ、およびその逆)に遭遇する唯一のタイルである。これらのタイルは、IRAP で始まる表現を使用してダウンロードされるが、他のタイルにはこのプロパティが必要ない。異なるタイルに対応するビットストリームを単一のビットストリームにマージするとき、タイルのうちのいくつかは、IRAPピクチャに対応するNALユニットタイプを含み、他のものは、非IRAPピクチャのNALユニットタイプを含む。
【0031】
さらに、AUが異なるタイプのNALユニットを有することを可能にすることが望ましいいくつかの他の使用事例がある。例えば、RoI(Region of Interest)の中において、720pの内側にRoIを有する1080pのピクチャがあるシナリオでは、ビデオの異なる部分(RoIまたはその他)が異なるRAP期間を持つことを想定することができる。例えば、1つはビデオ全体に関心があり、もう1つはRoIにのみ関心があるというように、同じビットストリームが2つの受信機にフィードするために使用される場合である。
【0032】
異なるビットストリームのマージが起こる360度ビデオストリーミング、またはビデオが元々、異なる領域のための異なるRAP期間を有する異なる部分に符号化されるRoIストリーミングのいずれかの場合、デコーダは、符号化されたピクチャ内のNALユニットが必ずしも同じではないビットストリームに遭遇することになる。したがって、本発明は、異なるNALユニットタイプのNALユニットを混合するための解決策を提供する。
【0033】
1.1 トレーリングピクチャの混合(先行技術)
従来技術において現在提案されている解決策は、PPSフラグが、RAPピクチャが非RAPピクチャと混合されるかどうかを示し、次いで、混合AUのNALユニットにおいて遭遇することができるNALユニットタイプが、非IRAPタイプのためのTRAILNALユニットタイプ(最大VCL_RSV_6またはGDR)であり、単一の1タイプのIDR_W_RADL(IDR with Leading Pictures:リーディングピクチャを有するIDR)、IDR_N_LP(IDR with No Leading Pictures:リーディングピクチャを有さないIDR)、およびCRA(Clean Random Access:クリーンランダムアクセス)であることである。したがって、従来技術は、IRAPピクチャをTRAILピクチャと混合することを示唆している。
【0034】
図2は、従来技術による例を示し、IRAP NALユニットタイプのNALユニット201が、トレーリングピクチャタイプ(TRAIL)のNALユニット202と混合される。この例のIRAP NALユニットタイプは、リーディングピクチャを有さないIDR(IDR_N_LP)である。他のすべてのアクセスユニットは、同じNALユニットタイプ(すなわち、TRAIL)のNALユニットを有する。
【0035】
1.2 リーディングピクチャの混合
しかしながら、これらの手段は、オープンGOP構造がリーディングピクチャ(LP)を導入して適用され得る想定される用途には十分ではない。
図3は、IRAP NALユニットタイプ(たとえば、IDR_W_RADL)のNALユニット301が、その関連付けられたリーディングピクチャ302とともに示される例示的なケースを示し、このケースでは、NALユニットタイプRADL(Random Access Decordable Leading Picture:ランダムアクセスデコーダブルリーディングピクチャ)のNALユニット302であり得る。IRAPタイプのNALユニット301(たとえば、IDR_W_RADL)は、非IRAP NALユニットタイプのNALユニット303(たとえば、TRAIL)と混合され得る。非IRAPタイプであるリーディングピクチャタイプ(RADL)の関連するNALユニット302は、異なる非IRAPタイプ(たとえば、TRAIL)のNALユニット304と混合され得る。
【0036】
図4は、IRAP NALユニットタイプ(たとえば、CRA)のNALユニット301が、その関連付けられたリーディングピクチャ302とともに示されるさらなる例示的なケースを示し、このケースでは、NALユニットタイプRASL(Random Access skipped Leading Picture:ランダムアクセススキップリーディングピクチャ)のNALユニット302であり得る。代替として、図示されないが、関連するリーディングピクチャ302は、NALユニットタイプRADL(ランダムアクセスデコーダブルリーディングピクチャ)のNALユニット302であり得る。IRAPタイプのNALユニット301(たとえば、CRA)は、非IRAP NALユニットタイプのNALユニット303(たとえば、TRAIL)と混合され得る。非IRAPタイプであるリーディングピクチャタイプ(たとえば、RASL)の関連するNALユニット302は、異なる非IRAPタイプ(たとえば、TRAIL)のNALユニット304と混合され得る。
【0037】
そのため、IRAP NALユニットが含まれる場合だけでなく、混合ピクチャに含まれる非IRAP NALユニットのみを対象として、混合NALユニットタイプを伴う符号化ピクチャを扱う必要がある。
【0038】
簡単に要約すると、従来技術は、IRAP NALユニットをTRAILタイプの非IRAP NALユニットと混合すること、または同じタイプの非IRAP NALユニット、すなわちTRAILタイプのNALユニットをTRAILタイプのNALユニットと混合することを提案することができる。
【0039】
本発明は、代わりに、第1非IRAP NALユニットタイプ(例えば、RASL、RADL、TRAIL、STSA)を、少なくとも1つの異なる第2非IRAP NALユニットタイプ(例えば、RASL、RADL、TRAIL、STSA)と混合することを提案する。
【0040】
したがって、実施形態によれば、ビデオコンテンツ12を復号するためにデコーダ100が設けられ、デコーダ100は、ビデオコンテンツ12のピクチャ12a、12b、12cの第1空間セグメント131に関連する第1サブビットストリーム11-1と、ビデオコンテンツ12のピクチャ12a、12b、12cの第2空間セグメント132に関連する第2サブビットストリーム11-2とを含むビットストリーム11を復号するように構成されている。この実施形態によれば、ビットストリーム11は、第1サブビットストリーム11-1の少なくとも1つの第1NALユニット302が、異なる非IRAP NALユニットタイプ(例えば、RASL、RADL、TRAIL、STSA)である第2サブビットストリーム11-2の少なくとも1つの異なる第2NALユニット304と混合される非IRAP NALユニットタイプ(例えば、RASL、RADL、TRAIL、STSA)である少なくとも1つのアクセスユニット30を備える。
【0041】
例えば、TRAILピクチャは、RADLピクチャまたはRASLピクチャと混合され得る。
・TRAIL + RADL
・TRAIL + RASL
【0042】
したがって、一実施形態によれば、デコーダ100は、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプがランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)であるビットストリーム11を処理するように構成され得る。
【0043】
さらなる実施形態によれば、デコーダ100は、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプがランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)であるビットストリーム11を処理するように構成され得る。
【0044】
本発明の一実施形態では、ビットストリーム11に、例えば、符号化ピクチャ内のNALユニットタイプを以下のように混合することができるパラメータセット(PPS、SPS、VPS)内のフラグとしての指示がある。
・TRAIL + RADL
・TRAIL + RASL
【0045】
このようなシグナリングは、TRAIL+(CRA xor IDR_W_LD xor IDR_N_P)が混合可能であることを示すために、PPSにおいて運ぶことができる。
【0046】
たとえば、フラグがセットされていない(すなわち、フラグ=0)場合、ピクチャのすべてのNALユニットは、同じNALユニットタイプを備え得、ピクチャまたはPUは、ピクチャまたはPUの符号化スライスNALユニットと同じNALユニットタイプを有すると呼ばれる。
【0047】
そうでない場合、フラグがセットされる(すなわち、フラグ=1)場合、ピクチャは、少なくとも2つのサブピクチャを含むことがある。追加または代替として、前記ピクチャのNALユニットは、少なくとも2つの異なるNALユニットタイプを備え得る。さらに、追加的に、または代替的に、前記ピクチャのNALユニットは、GDRのNALユニットタイプを備えなくてもよい。さらに追加または代替として、前記ピクチャの1つのNALユニットが、以下のNALユニットタイプのうちの少なくとも1つのものである場合、
・ランダムアクセスデコードリーディングピクチャによるインスタントデコーダリフレッシュ(IDR_W_RADL)
・リーディングピクチャを有さないインスタントデコーダリフレッシュ(IDR_N_LP)
・クリーンランダムアクセス(CRA)
【0048】
その場合、前記ピクチャの他のすべての入手可能なNALユニットは、上記の3つのユニットタイプ(IDR_W_RADL、IDR_N_LP、CRA)またはトレーリングピクチャユニットタイプ(TRAIL)のうちの1つを備え得る。
【0049】
代替的に、RADLピクチャおよびRASLピクチャは、例えばIRAPピクチャが有するように、TRAILピクチャとは異なる規範的復号処理を有さないので、この指示は、SPSレベルで行われ得る。一実施形態では、例えば、指示は、制約フラグ、例えば、一般的な制約フラグの形態を有することができる。一般的な制約フラグは、NALユニットタイプの特定の混合が許可されるかどうかを示し得る。このような一般的な制約フラグが設定されている場合(すなわち、一般的な制約フラグ= 1)、ピクチャ内にNALユニットタイプが混合していないこと、およびパラメータセット(PPS、SPS、VPS)内の上記のフラグが設定されていない(すなわち、フラグ= 0)ことを示している可能性がある。一般的な制約フラグがセットされていない場合(すなわち、一般的な制約フラグ= 0)、上記の制約は課されない可能性がある。
【0050】
したがって、一実施形態によれば、デコーダ100は、ビットストリーム11から指示を導出するように構成され得、この指示は、第2サブビットストリーム11-2の非IRAP NALユニットタイプのNALユニット304(このNALユニット304は、トレーリングピクチャユニットタイプ(TRAIL)である)が、第1サブビットストリーム11-1の非IRAP NALユニットタイプのNALユニット302と混合され、このNALユニット302は、ランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)のいずれか1つであることをデコーダ100に明示的に知らせる。
【0051】
一実施形態によれば、指示は、パラメータセット中のシンタックス要素を備え得る。例えば、シンタックス要素は、ピクチャパラメータセット(Picture Parameter Set:PPS)またはシーケンスパラメータセット(Sequence Parameter Set:SPS)の少なくとも1つに含まれていてもよい。
【0052】
しかしながら、360度ビデオタイルベースのストリーミングシナリオを仮定すると、RASLプロパティを有するタイルおよびTRAILピクチャのタイルがピクチャ内で混合されるとき、タイルが部分的なRAP点で位置を変更し、したがって、使用される参照ピクチャが正しくない(すなわち、依然として他のタイルのコンテンツを描写している)ので、RASLタイルが正しく再構成され得ないことが起こり得る。アプリケーションにとって、これらの欠陥のある再構成されたピクチャ領域を認識することは極めて重要であり、一方、(TRAIL+RASLタイルを含む)混合リーディングピクチャ全体をドロップすることも、プレイアウト(playout)の連続性の理由のための選択肢ではない。代わりに、クライアントは、復号され出力されたピクチャ内の欠陥領域を認識し、後続の処理のためにそれらを使用しない。
【0053】
代わりに、例えば、
図5に示されるような設定が与えられると、クライアントは、それらの混合されたリーディングピクチャ内で不正確に再構成されるコンテンツのために、ピクチャ内に含まれる低解像度バージョン51を使用することができる。一実施形態では、潜在的に欠陥のある再構成されたタイルに対応する領域は、後続の処理に、例えばSEIメッセージを通して、または外部手段、例えばアプリケーションによって示される。説明された指示は、NALユニットタイプのRASLを有するNALユニットに対応する領域が無視される/出力されないことを意味する。
【0054】
したがって、一実施形態によれば、第1サブビットストリーム11-1の非IRAP NALユニットタイプのNALユニット302がランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)である場合、デコーダ100は、ビットストリーム11から指示を導出するように構成されてもよい。
【0055】
一例では、この指示は、第1サブビットストリーム11-1のランダムアクセススキップリーディングピクチャユニットタイプのNALユニット302に対応する第1サブビットストリーム11-1のビデオコンテンツ12のピクチャ12a、12b、12cにおける第1空間セグメント131を無視するか、または出力しないように、デコーダ100に向けて示すことができる。
【0056】
別の例では、この指示は、デコーダ100に向けて、第1サブビットストリーム11-1のランダムアクセススキップリードピクチャユニットタイプ(RASL)の前記NALユニット302に対応する第1サブビットストリーム11-1のビデオ12内容のピクチャ12a、12b、12cの第1空間セグメント131を出力し、さらに、第1空間セグメント131を、破損した空間セグメントとしてマークするように指示することができる。例えば、デコーダ100は、SEI(Supplemental Enhancement information)メッセージによって、上述の破損した空間セグメント13を後続の処理チェーンに向けてマークするように構成してもよい。
【0057】
さらに、別のオプションは、RASLピクチャがトレーリングピクチャ(TRAIL)と全く混合されることを回避し、したがって、RADLピクチャがTRAILピクチャと混合されることのみを可能にすることである。したがって、一実施形態では、SPSに示される制約があり、CRAがTRAILピクチャと混合されるとき、関連するリーディングピクチャはRADLタイプのみでなければならない。
【0058】
したがって、一実施形態によれば、デコーダ100は、パラメータセットから制約指示を復号するように構成され得、上述の制約指示は、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプが非リーディングピクチャNALユニットタイプ(例えば、TRAILまたはSTSA)である場合、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプは、第1サブビットストリーム11-1のその関連IRAP NALユニット301がクリーンランダムアクセスユニットタイプ(CRA)である場合にのみ、ランダムアクセスデコーダブルリーディング(RADL)ピクチャユニットタイプであることをデコーダ100に向けて示す。
【0059】
これは、特に、第2ビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)である実施形態、すなわち、関連するRADLリーディングピクチャとTRAIL+CRAを混合する場合に当てはまり得る。
【0060】
前の態様では、主にTRAIL NALユニットタイプに焦点を当てた。しかしながら、多くの場合、STSA NALユニットタイプもあり得、段階的で時間的なサブレイヤのアクセス(step-wise temporal sublayer access)を可能にする。すなわち、上述の例は主にTRAIL NALユニットタイプの非IRAP NALユニットに関するものであったが、本発明はまた、STSA(Stepwise Temporal Sublayer Access:ステップワイズテンポラルサブレイヤクセス)ユニットタイプの非IRAP NALユニットを、RASLユニットタイプ、RADLユニットタイプ、およびTRAILユニットタイプのうちの少なくとも1つと混合するための解決策を提供することができる。
・STSA + RASL
・STSA + RADL
・STSA + TRAIL
【0061】
したがって、一実施形態によれば、デコーダ100は、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプがステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがトレーリングピクチャユニットタイプ(TRAIL)であるビットストリーム11を復号するように構成され得る。
【0062】
さらなる実施形態では、デコーダ100は、ビットストリーム11を復号するように構成され得、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプは、ランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプは、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である。
【0063】
さらなる実施形態では、デコーダ100は、第1サブビットストリーム11-1のNALユニット302の非IRAP NALユニットタイプがランダムアクセススキップリーディングピクチャユニットタイプ(RASL)であり、第2サブビットストリーム11-2のNALユニット304の非IRAP NALユニットタイプがステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)であるビットストリーム11を復号するように構成され得る。
【0064】
図6は、1つのピクチャセグメント13
2(例えば、タイル)において、ピクチャ12aがSTSA NALユニットタイプのNALユニット304を使用してステップワイズテンポラルサブレイヤクセスを示す一方で、別のピクチャセグメント13
1(例えば、タイル)の同じピクチャ12aがRASL NALユニットタイプのNALユニット302を使用する例示的な符号化構造を示す。
【0065】
STSA NALユニットタイプは最下位の時間レベル0に配置できないため、STSA NALユニットはIRAP NALユニットと混合しない。しかしながら、これらは、上述のTRAIL NALユニットと同様に、RADLまたはRASL NALユニットタイプと混合することができる。
【0066】
一実施形態では、フラグは、パラメータセットに、例えば、STSA NALユニットがRASLまたはRADL NALユニットタイプと混合されることを示すPPSに含まれる。
【0067】
したがって、本発明の一実施形態では、ビットストリーム11内に、例えば、パラメータセット(PPS、SPS、VPS)内のフラグとして、符号化ピクチャ内のNALユニットタイプを以下のように混合することができるという指示がある。
・STSA + RADL
・STSA + RASL
・STSA + TRAIL
【0068】
さらなる実施形態では、そのような混合が許可されるかどうかは、たとえば、シーケンスレベルまたはピクチャレベルに対する制約フラグを用いて示され得る。
【0069】
したがって、一実施形態によれば、デコーダ100は、ビットストリーム11から指示を導出するように構成されてもよく、ここで、上述の指示は、NALユニット304がステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)である第2サブビットストリーム11-2の非IRAP NALユニットタイプのNALユニット304が、第1サブビットストリーム11-1の非IRAP NALユニットタイプのNALユニット302と混合され、上述のNALユニット302がランダムアクセススキップリーディングピクチャユニットタイプ(RASL)またはランダムアクセスデコーダブルリーディングピクチャユニットタイプ(RADL)のいずれかであることを、デコーダ100に向けて明示的に知らせる。
【0070】
一実施形態によれば、指示は、パラメータセット内のシンタックス要素を含む。さらなる実施形態によれば、シンタックス要素は、ピクチャパラメータセットまたはシーケンスパラメータセットの少なくとも1つに含まれる。
【0071】
さらに、STSA NALユニット304を含むピクチャ12aのすべてのNALユニット302、304が、別のNALユニットタイプ、たとえばRASL(たとえば、NALユニット302を参照)を有する場合でも、STSA NALユニットタイプに関連する制約を満たすことを効果的に示す指示が、ビットストリーム11に追加され得る。これは、RASLピクチャを含む(空間)サブセットのビットストリーム11-1(たとえば、NALユニット302を参照)が、各RASLピクチャもSTSAピクチャであるという制約を満たすことを示すSPS中のフラグによって示され得る。そのようなシグナリングは、RASLまたはRADL NALユニットを含む元のビットストリームが、RADLおよびRASL NALユニットがSTSAピクチャの特性を満たすかどうかを示すことができ、その結果、STSAと混合された場合、混合符号化ピクチャがSTSA特性を有するかどうかを容易に導出することができる、マージのユースケースにとってさらに重要である。
【0072】
したがって、一実施形態によれば、デコーダ100は、ビットストリーム11のパラメータセットから制約フラグを復号するように構成されてもよく、この制約フラグは、非IRAPリーディングピクチャNALユニットタイプ(例えば、RASLまたはRADL)の1つ以上のNALユニット302と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット304との混合を備える、ビットストリーム11の任意のアクセスユニット30が、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に関連付けられている制約を満たすこと、すなわち、各RASLピクチャ302がSTSAピクチャとして扱われてもよいことをデコーダ100に向けて示す。
【0073】
上述の制約は、デコーダ100に向けて、復号順序に従い、ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプよりも次の高いテンポラルサブレイヤに関連付けられた任意のピクチャが、上述の次の高いテンポラルサブレイヤが上述のステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)に先行する場合、上述の次の高いテンポラルサブレイヤ内のピクチャを参照することを許可されないことを示すことができる。
【0074】
代替的に、混合NALユニットタイプ(たとえば、STSA + RASLまたはRADL)を有する符号化ピクチャ12aをもつビットストリーム11は、フラグが設定されるピクチャ12aがSTSA NALユニットタイプのNALユニット304を含み得るが、(合計で)STSA NALユニットタイプに関連する制約に従わないことを示すフラグを含み得る。これは、符号化ピクチャ12aがSTSAに等しいNALユニットタイプを有し得るが、STSAによって暗示される特性(すなわち、さらなる時間レベルがそのAU以降から復号され得る)は適用されないことを示す。したがって、STSAの構文解析は無視され、ステップワイズテンポラルサブレイヤクセスが推測される。
【0075】
したがって、一実施形態によれば、デコーダ100は、パラメータセットからフラグを復号するように構成されてもよく、このフラグは、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)の1つ以上のNALユニット302と、ステップワイズテンポラルサブレイヤクセスユニットタイプ(STSA)の1つ以上のNALユニット304との混合を備える任意のアクセスユニット30が、ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプに関連する制約に従わないことをデコーダ100に向けて示す。さらに、デコーダ100は、上述のフラグに応答して、ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプの1つ以上のNALユニット304を解析することを控え、ステップワイズテンポラルサブレイヤクセスの復号を暗黙的に推測するように構成され得、すなわち、STSA制約は、それぞれのアクセスユニットに適用されない。
【0076】
この概念はまた、上記で説明したように、NALユニットタイプを混合することとは無関係に適用され得る。したがって、一実施形態によれば、ビデオコンテンツ12を復号するためのデコーダ100が提案され、デコーダ100は、ビットストリーム11を復号し、ビットストリーム11のパラメータセットから制約フラグを復号するように構成され、上述の制約フラグは、ビットストリーム11内で、非IRAPリーディングピクチャNALユニットタイプ(たとえば、RASLまたはRADL)のNALユニット302を備える任意のアクセスユニット30が、ステップワイズテンポラルサブレイヤクセス(STSA)ユニットタイプに関連する制約を満たすことをデコーダ100に向かって示す。
【0077】
1.3 さまざまなRAPタイプの混合
先行技術によって可能にされないさらなる重要なケースは、オープンGOP(Group of Pictures)構造のピクチャをクローズドGOP構造のピクチャと混合することを可能にすることである。たとえば、2つの異なるタイプのIRAP NALユニットタイプ(たとえば、IDR、CRA)、たとえば、IDR_W_RADLおよびCRA NALユニットタイプの混合が許可され得るか、または同じNALユニットタイプのNALユニット、たとえば、CRAおよびCRAの混合が許可され得る。
・IDR_W_RADL + CRA
・CRA + CRA
【0078】
上述のように、この実施形態は、オープンGOP構造に関連するNALユニットタイプのIRAP NALユニットと、クローズドGOP構造に関連するNALユニットタイプのIRAP NALユニットとを混合することを可能にするものとする。例えば、RADLを有するCRAは、クローズドGOP構造に関連付けられてもよく、一方、RASLを有するCRAは、オープンGOP構造に関連付けられてもよい。
【0079】
したがって、実施形態によれば、ビデオコンテンツ12を復号するためのデコーダ100が提供されてもよく、デコーダ100は、ビデオコンテンツ12のピクチャ12a、12b、12cの第1空間セグメント131に関連する第1サブビットストリーム11-1と、ビデオコンテンツ12のピクチャ12a、12b、12cの第2空間セグメント132に関連する第2サブビットストリーム11-2とを含むビットストリーム11を復号するように構成されている。この例によれば、ビットストリーム11は、第1サブビットストリーム11-1の少なくとも1つの第1NALユニット302が、さらなる(同じまたは異なる) IRAP NALユニットタイプである第2サブビットストリーム11-2の少なくとも1つの第2NALユニット304と混合されるIRAP NALユニットタイプである少なくとも1つのアクセスユニット30を備える。
【0080】
少なくとも1つのユースケースがあり、これは非常に有用である。例えば、タイル化されたストリーミングを用いた360度のビデオ伝送への1つのアプローチは、(その一部が高解像度タイルとしても伝送されるかどうかにかかわらず)低解像度ビデオコンテンツ全体が伝送される場合である。このような場合、ビューイング方向の変化と、1つのビューポートから別のビューポートへの高解像度タイル選択の対応する変化が、
図5に示されている。
【0081】
低解像度ビデオコンテンツ全体は常にクライアント側で利用可能であり、この領域のためにタイルごとのストリーム切り替えは必要とされないので、低解像度コンテンツはCRAで符号化することができ、したがって、IDRを使用するクローズドGOP構造と比較してより高い符号化効率を利用することができる。また、ストリーム切替えに必要なランダムアクセスポイント期間が長いほど、この領域には十分であり、低解像度ビデオの符号化効率に再び恩恵をもたらす。一方、高解像度タイルは、
図5に示されるように、1つのビューポートから別のビューポートへの高速進行において頻繁に変化する可能性があり、したがって、低解像度ビデオの場合と同様に、CRAおよび関連するRASLピクチャを使用することは、ビューポートのスムーズな切り替えを可能にしない。これは、位置を変更したり、新たに追加されたタイルストリームを表すピクチャ内のRASL領域が適切に復号できず(参照がないため)、ビューポートの変更に遭遇すると破棄されるためである。
【0082】
図7は、クローズドGOP構造に関連付けられているNALユニット304が、オープンGOP構造に関連付けられているNALユニット302と混合される例を示す。この特定の、しかし非限定的な例では、リーディングRADL314(クローズドGOP)を有するCRAタイプのNALユニット304は、リーディングRASL312(オープンGOP)を有するCRAタイプのNALユニット302と混合される。この非限定的な例は、CRAを有するクローズドGOP構造をRADLタイプのリーディングピクチャと組み合わせて使用する第2サブビットストリーム11-2における高解像度領域と、CRAを有するオープンGOP構造をRASLタイプのリーディングピクチャと組み合わせて使用する第1サブビットストリーム11-1における低解像度領域との符号化構造を示す。
【0083】
一実施形態によれば、デコーダ100は、ビットストリーム11を処理するように構成され、第2サブビットストリーム11-2のNALユニット304のIRAP NALユニットタイプは、クローズドGOP構造に関連するIRAP NALユニットタイプであり、第1サブビットストリーム11-1のNALユニット302のIRAP NALユニットタイプは、オープンGOP構造に関連するIRAP NALユニットタイプである。
【0084】
図7に示されるようなこの特定の非限定的な実施形態では、第2サブビットストリーム11-2のNALユニット304のIRAP NALユニットタイプは、ランダムアクセスデコーダブルピクチャユニットタイプ(RADLを有するCRA)を有するCRAユニットタイプであり、第1サブビットストリーム11-1のNALユニット302のIRAP NALユニットタイプは、ランダムアクセススキップリーディングピクチャユニットタイプ(RASLを有するCRA)を有するCRAユニットタイプである。
【0085】
図7は、アクセスユニットのシーケンスと、その中に含まれるピクチャとを、それらの表示順序で示すことに留意されたい。ただし、表示順序は、ビットストリーム順序とも呼ばれる符号化順序とは異なる場合がある。見て分かるように、アクセスユニット30は、第1サブビットストリーム11-1内のピクチャ12aの第1空間セグメント13
1aを表す第1VCL NALユニット302と、第2サブビットストリーム11-2内のピクチャ12aの第2空間セグメント13
2aを表す第2VCL NALユニット304とを含む混合ピクチャ12aを含む。この場合、第1および第2NALユニットはIRAP NALユニットである。この特定のが非限定的な例では、第1および第2NALユニット302、304の両方は、IRAP NALユニットタイプCRAのものである。また、
図7は、連続するピクチャの表示順序を示す。
【0086】
したがって、表示順序では、さらなるアクセスユニット31が、上述のアクセスユニット30に先行し得る。上述のリーディングアクセスユニット31は、第1サブビットストリーム11-1内のピクチャ12bの第1空間セグメント13
1bを表す第1VCL NALユニット312と、第2サブビットストリーム11-2内のピクチャ12bの第2空間セグメント13
2bを表す第2VCL NALユニット314とを含む混合ピクチャ12bを含む。このAU31の第1NALユニット312は、非IRAP NALユニットタイプRASLであり、このAU31の第2NALユニット314は、非IRAP NALユニットタイプRADLである。また、
図7は、連続するピクチャの表示順序を示す。
【0087】
任意選択で、さらに表示順序で、例示的に描写されるアクセスユニット32などの1つ以上のさらなるアクセスユニットは、上記で説明したアクセスユニット31に先行し得る。より一般的には、非IRAP NALユニット312、314(たとえば、RASLまたはRADL)を備えるアクセスユニット31は、表示順序で、好ましくは非IRAP NALユニット322、324(たとえば、RASLまたはRADL)をも備え得る少なくとも1つのさらなるアクセスユニット32の前にあり得る。第1サブビットストリーム11-1におけるオープンGOP構造を維持するために、アクセスユニット31のRASL NALユニット312は、(表示順序で)先行するアクセスユニット32に含まれ、RASLタイプであってもよいNALユニット322によって(表示順序で)先行されてもよい。次に、第2サブビットストリーム11-2におけるクローズドGOP構造を維持するために、アクセスユニット31のRADL NALユニット314は、(表示順序で)先行するアクセスユニット32に含まれ、RADLタイプでもあり得るNALユニット324によって(表示順序で)先行され得る。
【0088】
ビットストリーム順序とも呼ばれる符号化順序は、
図7に示される表示順序とは異なる場合がある。例えば、RADLおよびRASLピクチャ13
1b、13
2b、13
1c、13
2cは、依存的に符号化され、これは、CRAピクチャ13
1a、13
2aを(表示順序で)それぞれのCRAピクチャ13から差動符号化情報を取り出すことを意味する。例えば、アクセス部31に含まれるRADL及びRASLピクチャ13
1b、13
2bは、アクセスユニット30が(表示順に)アクセスユニット31に追従しているにもかかわらず、アクセスユニット30に含まれるCRAピクチャ13
1a、13
2aを(表示順序で)参照する。
【0089】
RASLピクチャ13
1bは、
図7に例示されている先行のRASLピクチャ13
1cのような(表示および符号化の順序で)ピクチャを任意にさらに参照することができ、したがって、先行のアクセスユニット32の先行のRASLピクチャ13
1cは、アクセスユニット31のRASLピクチャ13bの前に符号化されなければならない。しかしながら、先行アクセスユニット32の更に先行するRASLピクチャ13
1cは、アクセスユニット30のIRAPピクチャ13
1aのように、表示順序は追従するが符号化順序は先行するピクチャを自身が参照してもよい。つまり、アクセスユニット30のIRAP(CRA)ピクチャ13
1aは、先に述べた順序(すなわち、CRA)ピクチャ13の最後のピクチャであるが、アクセスユニット30のIRAP(CRA)ピクチャ13
1aは、両方のRASLピクチャ13
1b、13
1cは、符号化中にIRAP(CRA)ピクチャ13
1aを参照するので、符号化順序の最初のピクチャである、すなわち、最初に符号化されなければならない。
【0090】
RADLピクチャについても同様である。RADLピクチャ13
2bは、
図7に例示されている先行RADLピクチャ13
2cのように、(表示及び符号化の順序で)任意に先行するピクチャをさらに参照することができ、したがって、先行アクセスユニット32のさらなる前後のRADLピクチャ13
2cは、アクセスユニット31のRADLピクチャ13
2bの前に符号化されなければならない。しかしながら、先行アクセスユニット32の更に先行するRADLピクチャ13
2cは、アクセスユニット30のIRAPピクチャ13
2aのように、表示順序は追従するが符号化順序は先行するピクチャを自身が参照してもよい。つまり、アクセスユニット30のIRAP(CRA)ピクチャ13
2aは、先に述べた順序(すなわち、CRA)ピクチャ13の最後のピクチャであるが、アクセスユニット30のIRAP(CRA)ピクチャ13
2aは、両方のRADLピクチャ13
2b、13
2cは、符号化の間、IRAP(CRA)ピクチャ13
2aを参照するので、符号化の順序で最初のピクチャである、つまり、最初に符号化されなければならない。
【0091】
より一般的に言えば、リーディングピクチャ(LP)タイプの非IRAPピクチャ(例えば、RASLおよびRADLピクチャ131b、131c、132b、132c)は、(例えば、ディスプレイ順序で)追従するIRAPピクチャ(例えば、CRAピクチャ131a、132a)を参照することができ、IRAPピクチャ(例えば、CRAピクチャ131a、132a)は、最初に、つまり、リーディングピクチャ(LP)タイプの(ディスプレイ順序で)リーディング非IRAPピクチャ(例えば、RASLおよびRADLピクチャ131b、131c、132b、132c)より前に、符号化されなければならない。つまり、IRAPピクチャ(CRAピクチャ131a、132aなど)は、リーディングピクチャ(LP)タイプの非IRAPピクチャ(RASLおよびRADLピクチャ131b、131c、132b、132cなど)に表示順序に従うが、IRAPピクチャ(CRAピクチャ131a、132aなど)は最初に符号化される。言い換えると、リーディングピクチャ(LP)タイプの非IRAPピクチャ(例えば、RASLおよびRADLピクチャ131b、131c、132b、132c)は、表示順序でIRAPピクチャ(例えば、CRAピクチャ131a、132a)をリードし、IRAPピクチャ(例えば、CRAピクチャ131a、132a)は、ビットストリーム順序(符号化順序)で、リーディングピクチャ(LP)タイプの非IRAPピクチャ(例えば、RASLおよびRADLピクチャ131b、131c、132b、132c)をリードする。言い換えると、の先頭ピクチャ(LP)タイプの非IRAPピクチャ(たとえば、RASLおよびRADLピクチャ131b、131c、132b、132c)は、IRAPピクチャ(たとえば、CRAピクチャ131a、132a)を表示順にリードするが、ローディングピクチャ(LP)タイプの非IRAPピクチャ(たとえば、RASLおよびRADLピクチャ131b、131c、132b、132c)は、IRAPピクチャ(たとえば、CRAピクチャ131a、132a)の後に、符号化/ビットストリームの順序で続く。
【0092】
上記の事例および符号化構造を考慮すると、アクセスユニット30のピクチャ内のリーディングRASL(オープンGOP)を有するCRAとリーディングRADL(クローズドGOP)を有するCRAとの混合が許容されることは、本発明の利点の1つである。このような混合NALUアクセスユニット30が通常のプレイアウト(playout)中に符号化ビデオシーケンス(Coded Video Sequence:CVS)内で遭遇すると(最初からビットストリーム11全体を復号する)、必要なすべての参照ピクチャが利用可能となる。したがって、RASL NALユニットを有する混合ピクチャに続くピクチャは、復号され、正常に出力されることになる。
【0093】
しかしながら、シーク動作中にそのような混合NALUに遭遇したとき、または、ランダムアクセス中にそのようなAUから復号処理が開始したとき、利用不可能な参照ピクチャを生成するための処理は、呼び出される必要があり、かつ、以下の何れかである。
・後続の処理チェーンは、RASL領域が正しく復号されず、対応する低解像度領域が、例えば、SEI指示を通して使用されることを知らされる必要がある。
・影響を受けたピクチャは出力から完全に削除される。
【0094】
これは、混合ピクチャの復号を開始するときに、1つのオプションは、それを、いくつかの部分が復号可能であり、示されることができ、他の部分が、示されることができず、経時的に(すべてのRASL NALユニットが終了するまで)リフレッシュされる、GDRピクチャとして扱うことであることを意味する。そのような動作は、例えば、RAPタイプが
図7に示される方法とは反対に選択される360シナリオに関連し、すなわち、低解像度がクローズドGOP構造(例えば、RADLを有するCRA)を使用し、高解像度コンテンツがオープンGOP構造(例えば、RASLを有するCRA)を使用する。次いで、それはクローズドGOP構造を使用し、プレイヤは、オープンGOP構造を使用する高解像度がそれを示すためにきれいに復号されるまで待機するので、低解像度を示すことができる。
【0095】
そのような状況を処理するための他のオプションは、欠落した参照によって影響を受けている(部分的にさえされていない)ピクチャのいずれも表示せず、それらをドロップすること、すなわち、RASLに等しいNALユニットタイプを有する任意のミックスピクチャをドロップすることである。
【0096】
言い換えれば、RASLに等しいNALユニットタイプ312、322を有する任意の混合ピクチャ12b、12cは、連続的な復号挙動を保証するために、ドロップ/破棄されるようにマークされ得る。
【0097】
したがって、一実施形態によれば、デコーダ100は、ビットストリーム順序で、第2サブビットストリーム11-2のNALユニット304が関連する少なくとも1つのアクセスユニット30に続く、アクセスユニット31、32、・・・の1つ以上のピクチャ12b、12c、・・・の共同設置された空間セグメント132b、132c、・・・を復号し、提示するように構成してもよく、このアクセスユニット30には、第2サブビットストリーム11-2のNALユニット304が関連する少なくとも1つのアクセスユニット30のピクチャ12aの第2空間セグメント132aに、共同設置された空間セグメント132b、132c、・・・が一緒に並べられる。さらに、デコーダ100は、第1サブビットストリーム11-1のNALユニット302が関連する少なくとも1つのアクセスユニット30に続く、アクセスユニット31、32、・・・の1つ以上のピクチャ12b、12c、・・・の、共同設置された空間セグメント131b、131c、・・・、を破棄するようにマークするように構成してもよく、このアクセスユニット30には、第1サブビットストリーム11-1のNALユニット302が関連する少なくとも1つのアクセスユニット30のピクチャ12aの第1空間セグメント131aに、共同設置されたセグメント131b、131c、・・・、が一緒に並べられる。
【0098】
さらなる実施形態によれば、デコーダ100は、(最初からビットストリーム11全体を復号する)通常のプレイアウト中の連続復号の場合、または復号の開始の場合(たとえば、シーク動作中に、またはランダムアクセス中に復号処理がそのようなAUから開始する)、ビットストリーム11が復号されるべきかどうかに応じて、動作するように構成され得る。
【0099】
(ビットストリーム11全体を最初から復号する)通常のプレイアウトの際に、デコーダ100は、第2サブビットストリーム11-2のNALユニット304が関連する少なくとも1つのアクセスユニット30(例えば、RADLを有するCRA)をビットストリーム順序で後続する、アクセスユニット31、32、・・・の1つ以上のピクチャ12b、12c、・・・の、共同設置された空間セグメント132b、132c、・・・・、を復号し、提示するように構成することができ、これらのアクセスユニット31、32、・・・・、には、共同設置された空間セグメント132b、132c、・・・・、は、第2サブビットストリーム11-2のNALユニット304が関連する少なくとも1つのアクセスユニット30のピクチャ12aの第2空間セグメント132aが一緒に並べられる。さらに、復号開始の場合(たとえば、シーク動作中、またはランダムアクセス中にそのようなAUから復号処理が開始する場合)、デコーダ100は、少なくとも1つのアクセスユニット30にビットストリーム順序で後続するアクセスユニット31、32、・・・の1つ以上のピクチャ12b、12c、・・・を破棄し、1つまたは複数の破棄されたピクチャ12b、12c、・・・の後にピクチャ出力を再開するように構成されてもよい。言い換えれば、RASLに等しい少なくとも1つのNALユニット312、322を有する任意の混合ピクチャ12b、12cがドロップ/破棄される。
【0100】
さらなる実施形態によれば、デコーダ100は、SEIメッセージによって、後続の処理チェーンに向けて、上述の破損した空間セグメント131b、131c、…にマークするように構成してもよい。
【0101】
さらなる実施形態では、IDR_W_RADL NALユニットタイプがあるかどうかにかかわらず、AUがCRAとして扱われる、すなわち、NoIncorrectPicOutputFlagが1に等しいIRAPであるという指示が、ビットストリーム内に存在する。AUが混合NALUであるが、IRAPおよびオープンGOP構造の言及された特性があることを示す。言い換えると、デコーダ100は、クリーンランダムアクセスNALユニットタイプに対応する方法で、第1サブビットストリーム11-1および第2サブビットストリーム11-2に関連する少なくとも1つのアクセスユニット30を復号するために、デコーダ100に向かって示す指示をビットストリーム11から導出するように構成され得る。
【0102】
上記の説明では、デコーダ100がビットストリーム11を処理するように構成された実施形態について説明したが、ここでは
A)非IRAP NALユニットタイプの非IRAP NALユニット(例えば、RASL、RADL、TRAIL、STSA)は、異なる非IRAP NALユニットタイプの少なくとも1つの異なる第2NALユニット(例えば、RASL、RADL、TRAIL、STSA)と混合される、または
B)IRAP NALユニットタイプのNALユニット(たとえば、IDR_W_RADL、CRA)は、さらなるIRAP NALユニットタイプの少なくとも1つのNALユニット(たとえば、IDR_W_RADL、CRA)と混合される。
【0103】
しかしながら、デコーダ100がビットストリーム11を処理するように構成され得る、さらなる実施形態が存在し得、ここで
C)IRAP NALユニットタイプ(IDR_W_RADL、CRA)のNALユニットは、非IRAPリーディングピクチャNALユニットタイプ(例えば、RASL、RADL)またはSTSA NALユニットタイプのうちの1つのうちの少なくとも1つのNALユニットと混合される。
【0104】
さらなる実施形態はまた、ビットストリーム11の符号化および/または第1および第2サブビットストリーム11-1、11-2のマージ中にビデオビットストリーム11を処理するための対応する装置を提供することを提案する。上述の装置10は、本明細書で説明される革新的な原理に従ってビットストリーム11を処理するためのエンコーダ、マージャー、またはネットワークノードのうちの少なくとも1つであり得る。
【0105】
したがって、実施形態によれば、ビデオコンテンツ12を処理するための装置10が提案され、装置10は、ビデオコンテンツ12のピクチャ12a、12b、12cの第1空間セグメント131に関連する第1サブビットストリーム11-1を提供し、ビデオコンテンツ12のピクチャ12a、12b、12cの第2空間セグメント132に関連する第2サブビットストリーム11-2を提供するように構成され、第1サブビットストリーム11-1および第2サブビットストリーム11-2は、ビットストリーム11の一部であり、
A)ビットストリーム11は、第1サブビットストリーム11-1の少なくとも1つの第1NALユニット302が、異なる非IRAP NALユニットタイプである第2サブビットストリーム11-2の少なくとも1つの異なる第2NALユニット304と混合される非IRAP NALユニットタイプである、少なくとも1つのアクセスユニット30を含む、または、
B)ビットストリーム11は、第1サブビットストリーム11-1の少なくとも1つの第1NALユニット302が、さらなるIRAP NALユニットタイプである第2サブビットストリーム11-2の少なくとも1つの異なる第2NALユニット304と混合されるIRAP NALユニットタイプである、少なくとも1つのアクセスユニット30を含む、または、
C)ビットストリーム11は、第1サブビットストリーム11-1の少なくとも1つの第1NALユニット302が、非IRAPリーディングピクチャNALユニットタイプ(RASLまたはRADL)またはSTSA NALユニットタイプの何れかである第2サブビットストリーム11-2の少なくとも1つの異なる第2NALユニット304と混合されるIRAP NALユニットタイプである、少なくとも1つのアクセスユニット(30)を含む。
【0106】
1.4 要約とシンタックス例
以下に、本発明内で許容される混合タイプの概要を示す。
【表1】
【0107】
本発明に記載される新しい混合タイプでは、2つのタイプの混合が存在し、1つはIRAPタイプを伴うものであり、他の1つはIRAPタイプを有さないものである。
【0108】
オプション1
前のセクションで上述したように、1つのオプションは、IRAPタイプを伴う混合のみをPPS内のフラグで伝えることである。たとえば、IDRまたはCRAとTRAILをVCL_RSV_6(mixed_nalu_types_in_pic_flag)まで混合した既存のものを再利用する。IRAP以外のタイプは、SPS/VPS/DPSで制約フラグを使用して伝えられ得る。
【0109】
1に等しいmixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャが、1つ以上のVCL NALユニットを持つこと、VAL NALユニットが同一のnal_unit_typeの値を持たず、IDR_W_RADLからCRA_NUTの範囲のnal_unit_typeの値を有すること、ピクチャがIRAP IDRピクチャではないこと、を指定する。0に等しいmixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャは1つ以上のVCL NALユニットを持ち、VCL NALユニットがIDR_W_RADLからCRA_NUTの範囲のnal_unit_typeの値を有する場合、PPSを参照する各ピクチャのVCL NALユニットが、nal_unit_typeと同じ値を有することを指定する。
【0110】
次に、AUがビットストリームの最初のAUであるか、1に等しいmixed_nalu_types_in_pic_flagを有するPPSを参照するシーケンス(EOS)NALユニットの後の最初のAUである場合、符号化化ピクチャのNALユニットタイプはCRA_NUTおよびIDR_W_RADLである必要がある。非IRAPタイプを有するIDR/CRAとの混合ピクチャは、AUがビットストリームまたはシーケンスの最初のピクチャではない場合にのみ許可される。
【0111】
1に等しいno_non_irap_mixed_nalu_types_in_pic_constraint_flagは、シーケンスにTRAIL、STSA、RASL、RADLが含まれるピクチャのVCL NALユニットがnal_unit_typeと同じ値を有することがビットストリーム適合の要件であることを指定する。0に等しい値はこのような制約を課さない。すなわち、ピクチャはTRAIL、STSA、RASL、RADLの間で、nal_unit_typeの2つの異なる値を有していてもよい。
【0112】
オプション2
別のオプションは、PPSのフラグ(mixed_nalu_types_in_pic_flag)の代わりに、異なる組み合わせを示す指示(idc)を指定する必要があるだろう。
【0113】
1に等しいno_mixed_nalu_types_in_pic_constraint_flagは、mixed_nalu_types_in_pic_idcが0に等しいことがビットストリーム適合性の要件であることを指定する。0に等しいno_mixed_nalu_types_in_pic_constraint_flagは、このような制約を課さない。
【0114】
0に等しいmixed_nalu_types_in_pic_idcは、PPSを参照する各ピクチャに1つ以上のVCL NALユニットがあり、PPSを参照する各ピクチャのVCL NALユニットがnal_unit_typeと同じ値を有することを指定する。
【0115】
1に等しいmixed_nalu_types_in_pic_idcが、PPSを参照する各ピクチャは複数のVCL NALユニットを持ち、VCL NALユニットはすべてTRAIL_NUTからRSV_VCL_6までの範囲のnal_unit_typeの2つの特定値を持つことを指定する。
【表2】
【0116】
2に等しいmixed_nalu_types_in_pic_idcは、PPSをを参照する各ピクチャが複数のVCL NALユニットを持ち、1つ以上のVCL NALユニットはすべてIDR_W_RADLからCRA_NUTまでの範囲のnal_unit_typeの特定の値を持ち、他のVCL NALユニットはすべてTRAIL_NUTからRSV_VCL_6までの範囲のnal_unit_typeの特定の値を持つか、GRA_NUTに等しいことを指定する。
【0117】
この値は、NALユニットと既存のフラグとの許可された混合に対応する。
【表3】
【0118】
3に等しいmixed_nalu_types_in_pic_idcは、PPSを参照する各ピクチャが、IDR_W_RADLのnal_unit_typeの値を持つ複数のVCL NALユニットと、CRA_NUTのnal_unit_typeの値を持つ1つ以上のVCL NALユニットを持つことを指定する。
【表4】
【0119】
任意の特定のピクチャのVCL NALユニットについて、以下が適用される。
mixed_nalu_types_in_pic_idcが0に等しい場合、nal_unit_typeの値はピクチャのすべての符号化スライスNALユニットで同じになる。ピクチャまたはPUは、ピクチャまたはPUの符号化スライスNALユニットと同じNALユニットタイプを有すると呼ばれる。
mixed_nalu_types_in_pic_idcが1または2の場合、以下が適用される。
ピクチャ内のVCL NALユニットの1つがTRAIL_NUTに等しいnal_unit_typeの値を有する場合、ピクチャまたはPUはトレーリング(trailing)ピクチャまたはトレーリングPUと呼ばれる。
そうでない場合(ピクチャ内にTRAIL_NUT VCL NALユニットがない)、ピクチャまたはPUは、リーディングピクチャまたはリーディングPUであると呼ばれる。
ピクチャ内のVCL NALユニットの1つが、RADL_NUTに等しいnal_unit_typeの値を有する場合、ピクチャまたはPUはRADLピクチャまたはRADL PUと呼ばれる。
それ以外の場合(ピクチャ内のVCL NALユニットが、RADL_NUTに等しいnal_unit_typeの値を有さない場合)、ピクチャまたはPUはRASLピクチャまたはRASL PUと呼ばれる。
それ以外の場合(mixed_nalu_types_in_pic_idcが3に等しい)、ピクチャはCRAピクチャまたはCRA PUと呼ばれる。
【0120】
STSAピクチャとして主要なNALユニットタイプを扱うことに関連する態様は、以下のように制約フラグを用いて実装され得る。
【表5】
【0121】
1に等しいleading_stsa_pictures_flagは、RADLおよびRASLピクチャのインター予測の参照は、次のように制約される。0に等しいno_mixed_nalu_types_in_pic_constraint_flagは、このような制約を課さない。
【0122】
leading_stsa_pictures_flagが1に等しい場合、以下が適用される。
現在のピクチャがRASLピクチャまたはRADLピクチャであるとき、現在のピクチャのTemporalIdに等しいTemporalIdを有するRefPicList[0]またはRefPicList[1]中のアクティブエントリはない。
現在のピクチャが、復号順序で、RASLまたはRADLに続き、現在のピクチャのものと等しいTemporalIdを有する関連するIRAPピクチャに先行するピクチャであるとき、復号順序で、RASLまたはRADLピクチャに先行するRefPicList[0]またはRefPicList[1]中のアクティブエントリとして含まれる現在のピクチャのものと等しいTemporalIdを有するピクチャはないものとする。
【0123】
言い換えれば、STSAピクチャに関連する制限は、復号順序に従い、STSAよりも次の上位のテンポラルサブレイヤ(temporal sub-layer)に関連するピクチャが、STSAに先行する次の上位のテンポラルサブレイヤにおける任意の参照を使用することを禁止し、すなわち、デコーダは、STSA以降から次のテンポラルサブレイヤの復号を開始することができる。そのような制限は、もちろん、上述のようにRASL/RADLピクチャに対しても実施することができ、したがって、上述のシグナリングは、これらの特性の指示としての役割を果たすことができる。
【0124】
2.マルチレイヤクセスユニット内のピクチャタイプの混合
本サブセクションは、非限定的な例として、マルチレイヤビットストリーム中のマルチレイヤクセスユニットに関係し得る。しかしながら、本明細書に記載される特徴は、1つの単一レイヤに既に適用されてもよい。さらに、本サブセクションは、非限定的な例として、長期参照ピクチャを参照することによって、本発明の原理を説明する。しかしながら、本発明の概念は、短期参照ピクチャにも同様に適用可能であり、すなわち、本明細書で説明される特徴は、概して参照するピクチャに適用され得る。さらに、本サブセクションは、非限定的な例として、POC値をゼロに設定することによって、すなわち、MSB = 0に設定することによって、POC MSBリセットを説明することができる。しかしながら、値ゼロは、MSBの減少する値を象徴するプレースホルダとしてのみ作用し、例えば、MSBリセットが、0に等しくないが、それぞれのビットストリーム位置における現在のMSBよりも小さい任意の所定値に起こり得ることも可能である。
【0125】
従来技術は、最上位POC(Picture Order Count:ピクチャオーダーカウント)ビット(poc_msb_val)をシグナリングすることによって、すなわち、アクセスユニットがそのレイヤ中にRAPピクチャと非RAPピクチャとを同時に含む時間インスタンスのために、レイヤ化されたアクセスユニット内の異なるRAPタイプのピクチャを混合するためのサポートを提供し得る。しかしながら、ロングタームリファレンスピクチャ(Long Term Reference Pictures)の例によって以下に示されるように、符号化順序でそれらの関連付けられたIRAPピクチャに先行するピクチャへの参照を伴うが、ショートタームリファレンスピクチャ(Short Term Reference Pictures)にも適用可能であり、本発明が解決策を提供する、リーディングピクチャNALユニットタイプのリファレンスピクチャには問題が残ることがある。
【0126】
現在のPOCシグナリング関連のシンタックスは次の通りである。
【表6】
【表7】
【0127】
上記のPOC MSBシグナリングの例示的な使用法は、すべてのレイヤが同じIRAP NALユニットタイプを有する、例えば、
図8に示されるように、すべてのレイヤがIDR_W_RADLまたはCRAであるときに、POC MSBを0に設定することである。
【0128】
図8は、第1レイヤL0の第1サブビットストリーム11-1と、第2レイヤL1の第2サブビットストリーム11-2で構成されるマルチレイヤビットストリーム11を示している。各レイヤ、L0は、1つ以上のテンポラルサブレイヤT0、T1、T2を備え得る。したがって、ピクチャの空間セグメントは、上述の異なるレイヤL0、L1およびテンポラルサブレイヤT0、T1、T2にわたって分散され得る。
【0129】
図8は、いくつかの例示的なマルチレイヤクセスユニット30、31、32をさらに示す。この例では、マルチレイヤクセスユニット30、31、32は、第2レイヤL1中の第2サブビットストリーム11-2の第2NALユニット304と混合される、第1レイヤL0中の第1サブビットストリーム11-1の第1NALユニット302を備え得る。NALユニットは、上記で説明したように、異なるNALユニットタイプ、特にIRAPおよび非IRAP NALユニットタイプを備え得る。さらに、NALユニットは、上述のように、ピクチャオーダーカウント(POC)がシグナリングされるスライスヘッダーを備え得る。本明細書で説明する概念は、最上位のPOC部分、たとえば最上位のPOCビット、またはPOC MSBに関する。したがって、図では、POC MSBは、各IRAP NALユニットで示されている。
【0130】
たとえば、マルチレイヤクセスユニット30、32は、第1サブビットストリーム11-1中の第1NALユニット302のPOC MSBが、第2サブビットストリーム11-2の第2NALユニット304のPOC MSBと位置合わせされたアクセスユニットを表し、両方のNALユニットはIRAP NALユニットタイプである。
【0131】
マルチレイヤクセスユニット31は、非整列アクセスユニット、すなわち、第1サブビットストリーム11-1内の第1NALユニット302のPOC MSBが、非IRAP NALユニットタイプの第2サブビットストリーム11-2の第2NALユニット304のPOC MSB(例えば、MSB = 0)と非整列アクセスユニットを表す。したがって、第1サブビットストリーム11-1の第1NALユニット302のPOC MSBは、所定値だけ増加され得、たとえば、1だけ増加され得る。
【0132】
図8は、前述のスライスヘッダーにおけるMSBシグナリングが、そのようなマルチレイヤの場合にどのように使用され得るかを示す。シグナリングの目的は、例えば、CRA w MSB=1の非整列アクセスユニット31のような、整列されていないRAPにおいてPOC値を正しく保つことであり、すなわち、すべてのレイヤが同じアクセスユニットにおいてIRAPを有していないときに、POC(LSBおよびMSB)がゼロにリセットされることを回避することである。
【0133】
しかしながら、
図8はまた、POCが位置合わせされるとき、(例えば、ロングタームおよび/またはショートタームの)レファレンスピクチャ12rに問題があることを示す。理解を容易にするために、以下の図は、ロングタームレファレンスピクチャのみを参照し得る。しかしながら、本概念は、ショートタームレファレンスピクチャにも適用可能である。
【0134】
最後のCRAアクセスユニット32の前のピクチャ12a、12b、12c、・・・すなわち、第2の整列されたRAPは、POC MSB>0およびPOC LSB>0を有することに留意されたい。したがって、(
図8に例示的に示されるように)最後のCRAアクセスユニット32におけるMSBを0にリセットするとき、POC MSBまたはそのデルタ(ロングタームレファレンスピクチャのために使用される)を使用して、前のピクチャ12a、12b、12c、・・・のいずれかを参照することは不可能である。1つのそのような例は、
図8において、「LT ref」でマークされた緑色の矢印によって示される。したがって、
図8に示される例は、この場合、ピクチャ参照が不可能であり得ることを示すものとする。
【0135】
したがって、本発明は、ピクチャ参照が可能になるように、この問題に対する解決策を提供する。
【0136】
一実施形態では、制約は、アクセスユニット内のすべてのピクチャがタイプIDR、すなわちIDR_W_RADLまたはIDR_N_LPであるときのみ、MSBを0にセットすることができるビットストリームフラグ(SPS、VPS、DPS)を通じて、明細書において表現されるか、または示される。それによって、CRAが使用されるとき、POCリセットは発生せず、LT参照が許可される(例については、
図9および10を参照されたい)。
【0137】
図9に見られるように、アクセスユニット32は、両方のNALユニット302、304がIRAP NALユニットタイプである、整列されたアクセスユニット32であり得る。しかしながら、第1サブビットストリーム11-1の第1NALユニット302はCRAタイプであるので、POCリセットは発生しない。つまり、
図9は、POCリセットが許可されないシナリオを示している。
【0138】
代わりに、
図10は、第1サブビットストリーム11-1の第1NALユニット302および第2サブビットストリーム11-2の第2NALユニット304が両方ともIDRユニットタイプであるので、POCリセットが許可されるシナリオを示す。
【0139】
したがって、実施形態によれば、ビデオコンテンツ12を復号するためのデコーダ100が提供され、デコーダ100は、第1サブビットストリーム11-1および第2サブビットストリーム11-2を備えるビットストリーム11を復号するように構成され、デコーダ100は、第1および第2サブビットストリーム11-1、11-2のNALユニット302、304のスライスヘッダーから派生するように構成され、ここで、NALユニット302、304は、IRAP NALユニットタイプ(例えば、CRA、IDR_W_LP、IDR_N_LP)、NALユニット302、304が参照するピクチャ12rのPOCの最上位POC部分(POC MSB)を設定するための情報である。この例によれば、最上位POC部分(POC MSB)は、ビットストリーム11のアクセスユニット32内のIRAP NALユニットタイプのすべてのNALユニット302、304について、上述のアクセスユニット32内の少なくとも1つのNALユニット302、304が、非瞬間デコーディングリフレッシュ(non-Instantaneous Decoding Refresh)ユニットタイプ、例えばCRAユニットタイプのものである場合、所定値に設定される必要がある。
【0140】
上述のように、本サブセクションは、非限定的な例として、POC値をゼロに設定することによって、すなわち、MSB = 0に設定することによって、POC MSBリセットを説明することができる。しかしながら、値ゼロは、MSBの減少する値を象徴するプレースホルダとしてのみ作用し、例えば、MSBリセットが、0に等しくないが、それぞれのビットストリーム位置における現在のMSBよりも小さい任意の所定値に起こり得ることも可能である。したがって、上述した所定値は、NALユニット302が参照するピクチャ12rの前のピクチャ12a、12b、・・・に関連付けられたPOCの最上位POC部分以上であってもよい。言い換えれば、アクセスユニット32内のすべてのNALユニット302、304がIDRユニットタイプでない場合、POCリセットは行われない。
【0141】
いくつかの例では、上述の所定値はゼロに等しくてもよく、すなわち、MSB = 0であってもよい。いくつかの他の例では、上述の所定値は、暗黙的に導出された最上位POC部分、例えば、通常のSOTA POC MSBの暗黙導出に等しくてもよい。
【0142】
別の実施形態では、整列されたRAPアクセスユニット32が発生し、アクセスユニット32のPOC MSBが0に設定されるときはいつでも、整列されたRAPアクセスユニット32の前の(ロングタームまたはショートターム)レファレンスピクチャ12a、12b、12c、・・・がビットストリーム順序で整列されたRAPアクセスユニット32に続くピクチャ12sによって参照されることを許可されることを、明細書で表現されるまたは、ビットストリームフラグ(SPS、VPS、DPS)を介して、示される制約があり得る。
【0143】
たとえば、
図11は、ピクチャ12sが提示順序においてピクチャ12rに先行し得るが、ピクチャ12sが復号順序においてピクチャ12rに後続し得ることを示す。
【0144】
図11および
図12は、0に等しいMSBを有する任意のピクチャ12rが、LTレファレンスピクチャを有するリーディングピクチャ12a、12b、12c、・・・を有さないことを示す(一方、
図11は、MSB = 1からMSB = 0へのリセットを表し、
図12は、例えば、POC_LSBが、増加が起こらないほど十分に長いので、0に等しいMSBを表す)。したがって、
図11は、POC MSBリセットおよびピクチャ参照が許可されないシナリオを示し、
図12は、すべてのPOC MSBがゼロに等しいが、ピクチャ参照が許可されないシナリオを示す。
図13は、MSBが0に等しくない場合、LTレファレンスピクチャがリーディングピクチャに対して許可されることを示す。
【0145】
したがって、実施形態によれば、ビデオコンテンツ12を復号するためのデコーダ100が提供され、デコーダ100は、第1サブビットストリーム11-1および第2サブビットストリーム11-2を含むビットストリーム11を復号するように構成され、デコーダ100は、第1および第2サブビットストリーム11-1、11-2のNALユニット302、304のスライスヘッダーから派生するように構成され、ここで、NALユニット302、304は、IRAP NALユニットタイプ(例えば、CRA、IDR_W_LP、IDR_N_LP)、NALユニット302、304が参照するピクチャ12rのPOCの最上位POC部分(POCMSB)を設定するための情報である。この例によれば、任意のピクチャ参照も、復号順序において、すべてのNALユニット302、304がIRAP NALユニットタイプであり、最上位POC部分(POC MSB)が所定値に設定されるスライスヘッダーを有するビットストリーム11の任意のアクセスユニット32と交差することを許可されない。
【0146】
再び、上述のように、本サブセクションは、非限定的な例として、POC値をゼロに設定することによって、すなわち、MSB = 0に設定することによって、POC MSBリセットを説明することができる。しかしながら、値ゼロは、MSBの減少する値を象徴するプレースホルダとしてのみ作用し、例えば、MSBリセットが、0に等しくないが、それぞれのビットストリーム位置における現在のMSBよりも小さい任意の所定値に起こり得ることも可能である。したがって、
図11~
図13を参照して説明した例の前記所定値は、NALユニット(302、304)が参照するピクチャ(12r)に先行するピクチャ(12a、12b、12c、・・・)に関連付けられたPOCの最上位POC部分(POC MSB)、すなわち、POCリセットが発生したものよりも小さくなり得る。
【0147】
いくつかの例では、上述の所定値はゼロに等しくてもよく、すなわち、MSB = 0であってもよい。いくつかの他の例では、上述の所定値は、暗黙的に導出された最上位POC部分、例えば、通常のSOTA POC MSBの暗黙的導出に等しくてもよい。
【0148】
別の実施形態では、整列されたRAPアクセスユニット32が発生し、アクセスユニット32のPOC MSBが0(POCリセット)にセットされるときはいつでも、整列されたRAPアクセスユニット32の前に0とは異なるMSBを有する(ショートタームまたはロングタームの)レファレンスピクチャ12a、12b、12c、・・・・が、整列されたRAPアクセスユニット32の後に続くピクチャ12sによってビットストリーム順序で参照されることを許可する、という、明細書において表される、またはビットストリームフラグ(SPS、VPS、DPS)を通じて示される制約があり得る。
【0149】
LTレファレンスピクチャの参照はPOC_LSB値によってのみ行われるので、
図8に示される上記の例においてMSB増加がなかった場合、LTレファレンスピクチャを使用することが問題にならないことに留意されたい。
【0150】
図14は、この例ではPOC MSBリセットが発生していないことを示している。POC MSBリセットは、アクセスユニット32のPOC MSB値(
図14に示される例では、POC MSB値が増加される、すなわち、MSB = 3)を増加させるか、またはアクセスユニット32のPOC MSB値を前のアクセスユニット31と同じ値のままにするかのいずれかによって示され得ない。
【0151】
したがって、一実施形態によれば、ビデオコンテンツ12を復号するためのデコーダ100が提供され、デコーダ100は、第1サブビットストリーム11-1および第2サブビットストリーム11-2を備えるビットストリーム11を復号するように構成され、デコーダ100は、第1および第2サブビットストリーム11-1、11-2のNALユニット302、304のスライスヘッダーから派生するように構成され、ここで、NALユニット302、304は、IRAP NALユニットタイプ(例えば、CRA、IDR_W_LP、IDR_N_LP)、NALユニット302、304が参照するピクチャ12rのPOCの最上位POC部分(POC MSB)を設定するための情報である。この例によれば、最上位POC部分が第1所定値に設定され、ビットストリーム順序に先行するスライスヘッダーを備えたNALユニット301、303からなる第1アクセスユニット31のリファレンスピクチャ12a、12b、12c、・・・の任意のピクチャ参照は、ビットストリーム順序において、全てのNALユニット302、304がIRAP NALユニットタイプ(例えば、CRA、IDR_W_LP、IDR_N_LP)であり、かつ最上位POC部分(POC MSB)が第2所定値に設定されたスライスヘッダーを有するビットストリーム11の第2アクセスユニット32を、ビットストリーム順序において、ビットストリーム11の第2アクセスユニット32に続くピクチャ12sによって、許容されない。
【0152】
再び、上述のように、本サブセクションは、非限定的な例として、POC値をゼロに設定することによって、すなわち、MSB = 0に設定することによって、POC MSBリセットを説明することができる。しかしながら、値ゼロは、MSBの減少する値を象徴するプレースホルダとしてのみ作用し、例えば、MSBリセットが、0に等しくないが、それぞれのビットストリーム位置における現在のMSBよりも小さい任意の所定値に起こり得ることも可能である。したがって、
図14を参照して説明した例に関して、先行する第1アクセスユニット31の上述のPOC MSBの第1所定値は、後続する第2アクセスユニット32の上述のPOC MSBの第2所定の値よりも大きくてもよい。この場合、ピクチャ参照は許可されない。反対に、後続の第2アクセスユニット32のMSBの第2所定値が、前の第1アクセスユニット31の上述のPOC MSBの第1所定値よりも大きい場合、ピクチャ参照が許可されることを述べることができる。つまり、POCリセットが発生しなかった場合は、ピクチャの参照が許可される。
【0153】
例えば、前記第2所定値は、POCリセットを示すためにゼロに等しくてもよい。したがって、POCリセットが発生した場合、ピクチャ参照は許可されない。いくつかの他の例では、上述の第2所定値は、暗黙的に導出された最上位POC部分、例えば、通常のSOTA POC MSBの暗黙的導出に等しくてもよい。
【0154】
いくつかの態様を装置の文脈で説明してきたが、これらの態様はまた、対応する方法の説明を表し、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応することが明らかである。同様に、方法ステップの文脈で説明される態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。
【0155】
方法ステップの一部または全部は、例えば、マイクロプロセッサ、プログラマブルコンピュータ、または電子回路などのハードウェア装置によって(または使用して)実行され得る。いくつかの実施形態では、最も重要な方法ステップのうちの1つまたは複数は、そのような装置によって実行され得る。
【0156】
特定の実装要件に応じて、本発明の実施形態は、ハードウェアで、またはソフトウェアで、または少なくとも部分的にハードウェアで、または少なくとも部分的にソフトウェアで、実装することができる。実装は、それぞれの方法が実施されるようにプログラマブルコンピュータシステムと協働する(または協働することができる)電子的に読み取り可能な制御信号が記憶されたデジタル記憶媒体、例えば、フロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROM、またはFLASH(登録商標)メモリを使用して実施することができる。したがって、デジタル記憶媒体は、コンピュータ読み取り可能であってもよい。
【0157】
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる、電子的に読み取り可能な制御信号を有するデータキャリアを備える。
【0158】
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で動作するときに方法のうちの1つを実行するように動作する。プログラムコードは、例えば、機械可読キャリア上に記憶されてもよい。
【0159】
他の実施形態は、機械可読キャリアに記憶された、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0160】
言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0161】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを記録したデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には、有形および/または非一時的である。
【0162】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して転送されるように構成されてもよい。
【0163】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するように構成または適合された処理手段、例えば、コンピュータまたはプログラマブル論理デバイスを備える。
【0164】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0165】
本発明によるさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的または光学的に)転送するように構成された装置またはシステムを備える。受信器は、例えば、コンピュータ、モバイル装置、メモリ装置等であってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含むことができる。
【0166】
いくつかの実施形態では、プログラマブル論理デバイス(たとえば、フィールドプログラマブルゲートアレイ)を使用して、本明細書で説明する方法の機能の一部または全部を実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書で説明する方法のうちの1つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、好ましくは、任意のハードウェア装置によって実行される。
【0167】
本明細書で説明される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組合せを使用して実装され得る。
【0168】
本明細書で説明する方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組合せを使用して実行され得る。
【0169】
本開示は、例示的な実施形態を参照して説明されたが、この説明は、限定的な意味で解釈されることは意図されていない。例示的な実施形態の様々な修正および組合せ、ならびに本開示の他の実施形態は、説明を参照することによって当業者に明らかになるであろう。したがって、添付の特許請求の範囲は、任意のそのような修正または実施形態を包含することが意図される。
【手続補正書】
【提出日】2022-08-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
マイクロプロセッサおよびメモリを有するデコーダであって、
前記メモリは、前記マイクロプロセッサに読まれる場合、前記デコーダに、
複数のピクチャに関連付けられる一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagをビットストリームから復号させ、
複数のピクチャパラメータセットを、前記ビットストリームから復号させる、
プログラムコードを有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、mixed_nalu_types_in_pic_idcを有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、前記複数のピクチャ内のピクチャにより参照され、
1に等しい前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、前記複数のピクチャのそれぞれが、0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットを参照するように制約されることを指定し、
0に等しい前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、前記複数のピクチャのそれぞれが、0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットを参照するように制約されないことを指定し、
0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットは、前記0に等しいmixed_nalu_types_in_pic_idcを有する前記ピクチャパラメータセットを参照する各ピクチャが、1つ以上のVCL NALユニットを有することを指定し、
前記1つ以上のVCL NALユニットのそれぞれは、同じ値のnal_unit_typeを有する、
デコーダ。
【請求項2】
前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、1に等しい値を有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、0の値を有するmixed_nalu_types_in_pic_idcを有する、
請求項1に記載のデコーダ。
【請求項3】
前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、0に等しい値を有し、
前記複数のピクチャパラメータセットは、1の値を有するmixed_nalu_types_in_pic_idcを有する第1ピクチャパラメータセットを含む、
請求項1に記載のデコーダ。
【請求項4】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、TRAIL NALユニットと、RADL NALユニット、RASL NALユニット、STSA NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項3に記載のデコーダ。
【請求項5】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、STSA NALユニットと、RADL NALユニット、RASL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項3に記載のデコーダ。
【請求項6】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、RASL NALユニットと、TRAIL NALユニット、RADL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項3に記載のデコーダ。
【請求項7】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、RADL VCL NALユニットと、TRAIL VCL NALユニット、RASL VCL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項3に記載のデコーダ。
【請求項8】
マイクロプロセッサおよびメモリを有するエンコーダであって、
前記メモリは、前記マイクロプロセッサに読まれる場合、前記エンコーダに、
複数のピクチャに関連付けられる一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagをビットストリームに符号化させ、
複数のピクチャパラメータセットを、前記ビットストリームに符号化させる、
プログラムコードを有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、mixed_nalu_types_in_pic_idcを有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、前記複数のピクチャ内のピクチャにより参照され、
1に等しい前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、前記複数のピクチャのそれぞれが、0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットを参照するように制約されることを指定し、
0に等しい前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、前記複数のピクチャのそれぞれが、0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットを参照するように制約されないことを指定し、
0に等しいmixed_nalu_types_in_pic_idcを有するピクチャパラメータセットは、前記0に等しいmixed_nalu_types_in_pic_idcを有する前記ピクチャパラメータセットを参照する各ピクチャが、1つ以上のVCL NALユニットを有することを指定し、
前記1つ以上のVCL NALユニットのそれぞれは、同じ値のnal_unit_typeを有する、
エンコーダ。
【請求項9】
前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、1に等しい値を有し、
前記複数のピクチャパラメータセットの各ピクチャパラメータセットは、0の値を有するmixed_nalu_types_in_pic_idcを有する、
請求項8に記載のエンコーダ。
【請求項10】
前記一般的な制約であるno_mixed_nalu_types_in_pic_constraint_flagは、0に等しい値を有し、
前記複数のピクチャパラメータセットは、1の値を有するmixed_nalu_types_in_pic_idcを有する第1ピクチャパラメータセットを含む、
請求項8に記載のエンコーダ。
【請求項11】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、TRAIL NALユニットと、RADL NALユニット、RASL NALユニット、STSA NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項10に記載のエンコーダ。
【請求項12】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、STSA NALユニットと、RADL NALユニット、RASL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項10に記載のエンコーダ。
【請求項13】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、RASL NALユニットと、TRAIL NALユニット、RADL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項10に記載のエンコーダ。
【請求項14】
前記複数のピクチャは、前記第1ピクチャパラメータセットを参照し、RADL VCL NALユニットと、TRAIL VCL NALユニット、RASL VCL NALユニットのうちの1つとを有する第1ピクチャを含む、
請求項10に記載のエンコーダ。
【国際調査報告】