(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-15
(45)【発行日】2024-11-25
(54)【発明の名称】サブピクチャまたは領域ごとのランダムアクセスを可能にするビデオコーデックとこのビデオコーデックを使用したビデオ合成の概念
(51)【国際特許分類】
H04N 19/70 20140101AFI20241118BHJP
【FI】
H04N19/70
(21)【出願番号】P 2023094171
(22)【出願日】2023-06-07
(62)【分割の表示】P 2021544537の分割
【原出願日】2020-01-31
【審査請求日】2023-07-07
(32)【優先日】2019-02-01
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】スクーパン,ロベルト
(72)【発明者】
【氏名】サンチェス デ ラ フェンテ,ヤーゴ
(72)【発明者】
【氏名】ヘルゲ,コルネリウス
(72)【発明者】
【氏名】シーエル,トーマス
(72)【発明者】
【氏名】ゼーリンク,カルステン
(72)【発明者】
【氏名】ヴィーガント,トーマス
【審査官】田中 純一
(56)【参考文献】
【文献】国際公開第2017/137444(WO,A1)
【文献】国際公開第2013/150943(WO,A1)
【文献】特表2017-507521(JP,A)
【文献】特開2017-069866(JP,A)
【文献】特表2019-506091(JP,A)
【文献】米国特許出願公開第2019/0014337(US,A1)
【文献】特表2015-515822(JP,A)
【文献】米国特許出願公開第2015/0030074(US,A1)
【文献】特表2017-530613(JP,A)
【文献】米国特許出願公開第2017/0163994(US,A1)
【文献】Alexandre Gabriel, et.al.,Proposed design of high-level syntax for spatial relation between independent HEVC sub bitstreams,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 28th Meeting: Torino, IT, 15-21 July 2017,JCTVC-AB0032 v2,JCT-VC インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/28_Torino/wg11/JCTVC-AB0032-v2.zip><JCTVC-AB0032.docx>,2017年07月13日,pp.1-7
【文献】Ye-Kui Wang, et.al.,AHG9: Signalling of regions of interest and gradual decoding refresh,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Shanghai, CN, 10-19 Oct. 2012,JCTVC-K0128r2,JCT-VC インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K0128-v4.zip><JCTVC-K0128r3.doc>,2012年10月19日,pp.1-6
【文献】Osnat Bar-Nir,Proposal to Improve Ultra Low Delay Coding with Minimal Decoder Impact,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 8th Meeting: San Jose, CA, USA, 1-10 February, 2012,JCTVC-H0471,JCT-VC インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H0471-v5.zip><JCTVC-H0471-Proposal to Improve Ultra Low Delay Coding with Minimal Decoder Impact.doc>,2012年02月10日,pp.1-3
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
データストリーム(10)からピクチャのセット(18,42)を復号するための方法であって、
前記データストリーム(10)からフラグ(44)とサブピクチャ関連情報(40)とを復号することであって、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示す、復号することと、
前記フラグ(44)が第1の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じであることを決定することと、
前記フラグ(44)が第2の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化することを決定することと、
前記サブピクチャ関連情報(40)
が第1の状態を示すことに応じて、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていることを決定することと、
前記サブピクチャ関連情報(40)
が第2の状態を示すことに応じて、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていないことを決定することと、
を備える、方法。
【請求項2】
前記フラグ(44)が前記第2の粒度を示すことに応じて、前記サブピクチャ関連情報(40)が、前記ピクチャ(18)の前記サブピクチャ(24)について異なる状態を示す、請求項1に記載の方法。
【請求項3】
前記フラグ(44)は、前記データストリーム(10)のシーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)に含まれており、
前記サブピクチャ関連情報(40)は、前記ピクチャ(18)の特定のスライスに関連付けられている、
請求項1に記載の方法。
【請求項4】
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記方法は、前記ピクチャ(18)の前記サブピクチャ(24)のすべてがランダムアクセスポイント方式で符号化されていることを決定することを備え、
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記方法は、前記ピクチャ(18)のいずれの前記サブピクチャ(24)もランダムアクセスポイント方式で符号化されていないことを決定することを備え、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記方法は、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていることを決定することを備え、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記方法は、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていないことを決定することを備える、
請求項1に記載の方法。
【請求項5】
前記フラグ(44)がゼロにセットされているとき、前記フラグ(44)が前記第1の粒度を示すことを決定することと、
前記フラグ(44)が1にセットされているとき、前記フラグ(44)が前記第2の粒度を示すことを決定することと、
をさらに備える、請求項1に記載の方法。
【請求項6】
前記サブピクチャ関連情報(40)に対応する整数値シンタックス要素に基づいて2つのNALユニットタイプサブセットを区別することをさらに備え、
前記2つのNALユニットタイプサブセットの第1のものは、前記第1の状態に対応し、前記2つのNALユニットタイプサブセットの第2のものは、前記第2の状態に対応する、
請求項1に記載の方法。
【請求項7】
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第1の粒度を示すことを決定することと、
前記ピクチャ(18)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定することと、
をさらに備える、請求項1に記載の方法。
【請求項8】
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第2の粒度を示すことを決定することと、
前記ピクチャ(18)の前記少なくとも1つのサブピクチャ(24)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定することと、
をさらに備える、請求項1に記載の方法。
【請求項9】
前記フラグ(44)が第2の粒度を示す場合、前記サブピクチャ(24)を復号する間に前記サブピクチャ(24)の少なくとも1つをバッファに格納することと、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてが解析または復号された後に前記バッファをフラッシュすることと、
をさらに備える、請求項1に記載の方法。
【請求項10】
データストリーム(10)からピクチャのセット(18,42)を復号するための電子デバイスであって、
前記データストリーム(10)からフラグ(44)とサブピクチャ関連情報(40)とを復号し、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示し、
前記フラグ(44)が第1の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じであることを決定し、
前記フラグ(44)が第2の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化することを決定し、
前記サブピクチャ関連情報(40)
が第1の状態を示すことに応じて、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていることを決定し、
前記サブピクチャ関連情報(40)
が第2の状態を示すことに応じて、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていないことを決定する、
ように構成されたプロセッサを備える、電子デバイス。
【請求項11】
前記フラグ(44)が前記第2の粒度を示すことに応じて、前記サブピクチャ関連情報(40)が前記ピクチャ(18)の前記サブピクチャ(24)について異なる状態を示す、請求項10に記載の電子デバイス。
【請求項12】
前記フラグ(44)は、前記データストリーム(10)のシーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)に含まれており、
前記サブピクチャ関連情報(40)は、前記ピクチャ(18)の特定のスライスに関連付けられている、
請求項10に記載の電子デバイス。
【請求項13】
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記プロセッサは、前記ピクチャ(18)の前記サブピクチャ(24)のすべてがランダムアクセスポイント方式で符号化されていることを決定するように構成され、
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記プロセッサは、実行されたときに少なくとも1つのプロセッサに、前記ピクチャ(18)のいずれの前記サブピクチャ(24)もランダムアクセスポイント方式で符号化されていないことを決定するように構成され、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記プロセッサは、実行されたときに少なくとも1つのプロセッサに、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていることを決定するように構成され、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記プロセッサは、実行されたときに少なくとも1つのプロセッサに、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていないことを決定するように構成される、
請求項10に記載の電子デバイス。
【請求項14】
前記プロセッサは、
前記フラグ(44)がゼロにセットされているとき、前記フラグ(44)が前記第1の粒度を示すことを決定し、
前記フラグ(44)が1にセットされているとき、前記フラグ(44)が前記第2の粒度を示すことを決定する、
ようにさらに構成される、請求項10に記載の電子デバイス。
【請求項15】
前記プロセッサは、前記サブピクチャ関連情報(40)に対応する整数値シンタックス要素に基づいて2つのNALユニットタイプサブセットを区別するようにさらに構成され、
前記2つのNALユニットタイプサブセットの第1のものは、前記第1の状態に対応し、前記2つのNALユニットタイプサブセットの第2のものは、前記第2の状態に対応する、
請求項10に記載の電子デバイス。
【請求項16】
前記プロセッサは、
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第1の粒度を示すことを決定し、
前記ピクチャ(18)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定する、
ようにさらに構成される、請求項10に記載の電子デバイス。
【請求項17】
前記プロセッサは、
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第2の粒度を示すことを決定し、
前記ピクチャ(18)の前記少なくとも1つのサブピクチャ(24)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定する、
ようにさらに構成される、請求項10に記載の電子デバイス。
【請求項18】
前記プロセッサは、
前記フラグ(44)が第2の粒度を示す場合、前記サブピクチャ(24)を復号する間に前記サブピクチャ(24)の少なくとも1つをバッファに格納し、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてが解析または復号された後に前記バッファをフラッシュする、
ようにさらに構成される、請求項10に記載の電子デバイス。
【請求項19】
データストリーム(10)からピクチャのセット(18,42)を復号するための命令を備える非一過性のコンピュータ可読媒体であって、前記命令は、実行された場合、少なくとも1つのプロセッサに、
前記データストリーム(10)からフラグ(44)とサブピクチャ関連情報(40)とを復号させ、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示し、
前記フラグ(44)が第1の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じであることを決定させ、
前記フラグ(44)が第2の粒度を示すことに応じて、前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化することを決定させ、
前記サブピクチャ関連情報(40)
が第1の状態を示すことに応じて前記サブピクチャ(24)の少なくとも1つが、ランダムアクセスポイント方式で符号化されていることを決定させ、
前記サブピクチャ関連情報(40)
が第2の状態を示すことに応じて前記サブピクチャ(24)の少なくとも1つが、ランダムアクセスポイント方式で符号化されていないことを決定させる、
命令を備える、非一過性のコンピュータ可読媒体。
【請求項20】
前記フラグ(44)が前記第2の粒度を示すことに応じて、前記サブピクチャ関連情報(40)が、前記ピクチャ(18)の前記サブピクチャ(24)について異なる状態を示す、請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項21】
前記フラグ(44)は、前記データストリーム(10)のシーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)に含まれており、
前記サブピクチャ関連情報(40)は、前記ピクチャ(18)の特定のスライスに関連付けられている、
請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項22】
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記命令は、実行されたときに少なくとも1つのプロセッサに、前記ピクチャ(18)の前記サブピクチャ(24)のすべてがランダムアクセスポイント方式で符号化されていることを決定させ、
前記フラグ(44)が前記第1の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記命令は、実行されたときに少なくとも1つのプロセッサに、前記ピクチャ(18)のいずれの前記サブピクチャ(24)もランダムアクセスポイント方式で符号化されていないことを決定させ、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第1の状態を示すことに応じて、前記命令は、実行されたときに少なくとも1つのプロセッサに、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていることを決定させ、
前記フラグ(44)が前記第2の粒度を示し、前記サブピクチャ関連情報(40)が前記第2の状態を示すことに応じて、前記命令は、実行されたときに少なくとも1つのプロセッサに、前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていないことを決定させる、
請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項23】
実行された場合、前記少なくとも1つのプロセッサに、
前記フラグ(44)がゼロにセットされているとき、前記フラグ(44)が前記第1の粒度を示すことを決定させ、
前記フラグ(44)が1にセットされているとき、前記フラグ(44)が前記第2の粒度を示すことを決定させる、
命令をさらに備える、請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項24】
実行された場合、前記少なくとも1つのプロセッサに、前記サブピクチャ関連情報(40)に対応する整数値シンタックス要素に基づいて2つのNALユニットタイプサブセットを区別させる命令をさらに備え、
前記2つのNALユニットタイプサブセットの第1のものは、前記第1の状態に対応し、前記2つのNALユニットタイプサブセットの第2のものは、前記第2の状態に対応する、
請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項25】
実行された場合、前記少なくとも1つのプロセッサに、
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第1の粒度を示すことを決定させ、
前記ピクチャ(18)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定させる、
命令をさらに備える、請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項26】
実行された場合、前記少なくとも1つのプロセッサに、
前記フラグ(44)の復号された値に基づいて、前記フラグ(44)が前記第2の粒度を示すことを決定させ、
前記ピクチャ(18)の前記少なくとも1つのサブピクチャ(24)を符号化するためにランダムアクセスポイント方式が使用されたかどうかを前記NALユニットタイプ(34’)が示すことを決定させる、
命令をさらに備える、請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項27】
実行された場合、前記少なくとも1つのプロセッサに、
前記フラグ(44)が第2の粒度を示す場合、前記サブピクチャ(24)を復号する間に前記サブピクチャ(24)の少なくとも1つをバッファに格納させ、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてが解析または復号された後に前記バッファをフラッシュさせる、
命令をさらに備える、請求項19に記載の非一過性のコンピュータ可読媒体。
【請求項28】
ピクチャのセット(18,42)をデータストリーム(10)に符号化するための方法であって、
前記データストリーム(10)にフラグ(44)とサブピクチャ関連情報(40)とを符号化することであって、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示す、符号化することと、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じである場合、前記フラグ(44)が第1の粒度を示すように前記フラグ(44)をセットすることと、
前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化する場合、前記フラグ(44)が第2の粒度を示すように前記フラグ(44)をセットすることと、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されている場合、前記サブピクチャ関連情報(40)
が第1の状態を示すように前記サブピクチャ関連情報(40)をセットすることと、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていない場合、前記サブピクチャ関連情報(40)
が第2の状態を示すように前記サブピクチャ関連情報(40)をセットすることと、
を備える、方法。
【請求項29】
ピクチャのセット(18,42)をデータストリーム(10)に符号化するための電子デバイスであって、
前記データストリーム(10)にフラグ(44)とサブピクチャ関連情報(40)とを符号化し、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示し、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じである場合、前記フラグ(44)が第1の粒度を示すように前記フラグ(44)をセットし、
前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化する場合、前記フラグ(44)が第2の粒度を示すように前記フラグ(44)をセットし、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されている場合、前記サブピクチャ関連情報(40)
が第1の状態を示すように前記サブピクチャ関連情報(40)をセットし、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていない場合、前記サブピクチャ関連情報(40)
が第2の状態を示すように前記サブピクチャ関連情報(40)をセットする、
ように構成されたプロセッサを備える、電子デバイス。
【請求項30】
ピクチャのセット(18,42)をデータストリーム(10)に符号化するための命令を備える非一過性のコンピュータ可読媒体であって、前記命令は、実行された場合、少なくとも1つのプロセッサに、
前記データストリーム(10)にフラグ(44)とサブピクチャ関連情報(40)とを符号化させ、前記フラグ(44)は、前記サブピクチャ関連情報(40)が前記ピクチャのセット(18,42)からのピクチャ(18)のサブピクチャ(24)の間で変化するかどうかを示し、前記サブピクチャ関連情報(40)は、前記サブピクチャ(24)のNALユニットタイプ(34’)を示し、
前記ピクチャ(18)の前記サブピクチャ(24)のすべてに対して前記NALユニットタイプ(34’)が同じである場合、前記フラグ(44)が第1の粒度を示すように前記フラグ(44)をセットさせ、
前記ピクチャ(18)の前記サブピクチャ(24)の少なくとも2つの間で前記NALユニットタイプ(34’)が変化する場合、前記フラグ(44)が第2の粒度を示すように前記フラグ(44)をセットさせ、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されている場合、前記サブピクチャ関連情報(40)
が第1の状態を示すように前記サブピクチャ関連情報(40)をセットさせ、
前記サブピクチャ(24)の少なくとも1つがランダムアクセスポイント方式で符号化されていない場合、前記サブピクチャ関連情報(40)
が第2の状態を示すように前記サブピクチャ関連情報(40)をセットさせる、
命令を備える、非一過性のコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、ビデオ符号化およびビデオ合成(video composition)に関する。
【背景技術】
【0002】
様々なアプリケーションは、サブピクチャを利用しており、つまり、個別の符号化と復号化のために、ビデオピクチャをサブピクチャにサブ分割している。これらのアプリケーションの中には、360°ビデオと段階的復号リフレッシュ(gradual decoding refresh)とがある。
【0003】
360°ビデオの場合、
図10の左側に示すように、サブピクチャ(HEVCの場合はタイル)が異なる解像度で個別に提供される。ユーザーは、
図10の中央に示されているように、あるタイルを高解像度で、他のタイルを低解像度で、彼らの視線方向(viewing orientation)に従って選択し、
図10の右側に示されているように、1つの共通のビットストリームへとマージ(統合)される。ユーザーが視線方向を変化させるときは常に、高解像度のタイルセットと低解像度のタイルのセットも変化する。ただし、高解像度のすべてのタイルが低解像度のタイルに変わるわけではなく、その逆も同様である。これは、解像度が変化するタイルのサブセットに対してのみ、切換ポイントが必要であることを意味する。この切換ポイントは通常、その特定のサブピクチャ・ビットストリームのランダムアクセスポイント(RAP)である。
【0004】
段階的復号リフレッシュ(GDR)は、
図11に示されるように、非RAPでビットストリームの復号を開始し、所与の数のピクチャを復号した後、復号プロセスがRAPで開始された場合と同じような品質でビデオを表示できるようにするメカニズムである。
【0005】
図11では、例えば(符号化順序900で連続する)4つの連続する非RAPピクチャが、3つのタイルグループtile_group0、tile_group1、tile_group2へと、つまりそれぞれのピクチャの領域へと、均等にサブ分割されていることが示される。ビデオ902のピクチャは、参照記号904a~904dによって示され、それらがサブ分割された領域は、参照記号906を使用して示される。各領域906は、その中に「IRAP」と銘記されることによって、自己完結型の方法で、即ちランダムアクセスポイントを形成する方法で符号化されること、又は、そうでなく、その中に「インター」と銘記されることによって、他のピクチャを参照する方法で符号化されること、を示している。
図11に示される4つのピクチャ904a~904dのいずれも、すべての領域906がランダムアクセスポイントとして符号化される訳ではない。むしろ、
図11の例では、その領域の1つだけがランダムアクセスポイントであるが、
図11の例では、ピクチャ904a~904cなどの3つの連続するピクチャのランダムアクセスポイント領域は、ビデオ902のピクチャのピクチャ領域を空間的に完全にカバーしている。したがって、そのようなピクチャのトリプレットの後、そのようなトリプレットの最後のピクチャ、ここではピクチャ904cは、デコーダにおいてある条件下でアーチファクトのない状態で利用可能である。その条件とは、このピクチャ904cの非RAP領域が-例えば予測および/またはエントロピーコンテキスト導出の点で、即ち符号化の相互依存性(coding interdependencies)の点で-RAP領域、または、それら自身RAP領域だけに対して符号化依存性を直接的または間接的に有している非RAP領域である領域を単に参照したことを、エンコーダが管理していたという点である。つまり、復号化がRAPを用いて開始されたときのように、即座に明瞭な復号済みピクチャが達成される訳ではない。むしろ、欠落した参照のアーチファクトを排除するために、復号済みピクチャが段階的にリフレッシュされた後、しばらくして明瞭な復号済みピクチャが達成される。これはピクチャ904cである。典型的には、GDRは、コンテンツを領域(タイルなど)に分割し、それら領域を整列されていないサブピクチャRAPを用いて符号化することで実現できる。
【0006】
上記の2つのシナリオのいずれの結果としても、異なるサブビットストリームにわたる参照は変化する。また、異なるサブピクチャがI_SLICESタイプ(前に復号されたピクチャへの予測が適用されない)としてのみシグナリングされるため、異なるサブピクチャのRAPマーキングは明確には実行されず、かつ参照ピクチャリスト内でI_SLICEタイプのピクチャの前にサブピクチャを含めないことによってのみ、同じサブピクチャ・ビットストリームの連続するサブピクチャの予測が中断される。
【0007】
上記した既存のビデオ符号化の概念にも関わらず、例えば、より効果的なビデオ合成、および/または段階的復号リフレッシュのより効果的な実装を可能にする、ビデオ符号化環境の必要性が依然として存在する。
【先行技術文献】
【特許文献】
【0008】
【文献】WO 2015/059194
【文献】WO 2016/026526
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって、本発明の目的は、より効果的なビデオ合成/統合および/または段階的復号リフレッシュのより効果的な実装を可能にするビデオコーデック、および/または、例えば合成/統合作業の複雑さの観点から、ビデオ合成/統合をより効果的にすることを可能にする概念を提供することである。
【課題を解決するための手段】
【0010】
この目的は、本出願の独立請求項の要旨によって達成される。
【0011】
本出願の第1の態様は、ビデオデコーダに対し、ビデオのピクチャ内でどの粒度においてサブピクチャ関連情報が空間的に変化し得るかを示す、ランダムアクセスポイント・シグナリング粒度指示を導入することによって、ビデオ合成/統合および/またはビデオコーデックにおける段階的復号リフレッシュの実装をより効果的にすることを目的とする。サブピクチャ関連情報は、それぞれのサブピクチャがランダムアクセスポイント方式で符号化されているか、またはランダムアクセスポイント方式で符号化されていないかを識別する。すなわち、サブピクチャ関連情報とは別に、またはそれに追加して、データストリーム内でシグナリングされるランダムアクセスポイント・シグナリング粒度指示が第1の粒度を呈する場合、これは、ランダムアクセスポイント・シグナリング粒度指示の1つの範囲を形成する1つ以上のピクチャから成る1セットの各ピクチャについて、サブピクチャ関連情報がそれぞれのピクチャのすべてのサブピクチャに共通の状態であることを表す。つまりその場合、すべてのサブピクチャは、関連するサブピクチャのランダムアクセスポイント符号化をシグナリングする第1の状態、または関連するサブピクチャの非ランダムアクセスポイント符号化をシグナリングする第2の状態、のいずれかである。しかし、ランダムアクセスポイント・シグナリング粒度指示が第2の粒度を呈している場合、これは、1つ以上のピクチャから成る1セットの各ピクチャに関し、サブピクチャ関連情報がそれぞれのピクチャのサブピクチャについて異なる状態であり得ることを示す。そのようなランダムアクセスポイント・シグナリング粒度指示の導入の結果として、ビデオのピクチャがサブピクチャにサブ分割される方法でデータストリーム内に符号化されたビデオを有するデータストリームを合成する作業は、本明細書ではサブストリームと呼ばれることもある1つ以上の入力ビデオストリームであって、その中に符号化されサブピクチャを有する入力ビデオストリームの、リザーバに課せられる要件の点で軽減される。特に、これらの入力ビデオストリームは、相互に依存する方法で、つまり、1つのサブストリーム内の1つのサブピクチャがRAP符号化される場合、他のサブストリームの時間的に整列されたサブピクチャも同様にRAPで符号化されるような方法で、符号化される必要がない。いくつかのサブストリームが1つの共通の入力ビデオストリームに符号化される場合、それらサブストリームは通常の方法で符号化されてもよく、そこでは、それぞれの入力ビデオデータストリームの各ピクチャは、それぞれのピクチャのすべてのサブピクチャが入力ビデオストリーム内でそれらに関連する1つのサブピクチャ関連情報を有するように、符号化される。そのサブピクチャ関連情報は、それぞれのピクチャのすべてのサブピクチャに関する第1の状態、またはそれぞれのピクチャのすべてのサブピクチャに関する第2の状態のいずれかである。ただし、他のサブストリーム内の時間的に整列されたサブピクチャがRAP方式で符号化されない場合もある。ランダムアクセスポイント・シグナリング粒度指示を含むビデオデータストリームを合成する際、合成器/統合器(composer/merger)は、サブピクチャに分割されたピクチャが存在するように符号化されたビデオのピクチャを合成データストリームへと自由に合成でき、それらのサブピクチャのサブピクチャ関連情報は、それぞれの入力ビデオデータストリームから採用または引き継がれたものであり、その少なくとも1つはRAPであり、他の少なくとも1つはRAPでない。したがって、例えば各サブピクチャのために、合成データストリーム内に存在するサブピクチャ関連情報について、1つ以上の新たな状態を導入する必要はない。言い換えれば、サブピクチャ関連情報は、1つ以上の入力ビデオデータストリームのそれぞれのリザーバから単純に引き継がれ得る。
【0012】
サブピクチャは、タイルまたはタイルのグループであり得、すなわち、サブピクチャは、同じピクチャの他のサブピクチャから独立して符号化され得る。代替的に、サブピクチャは、MCTSを形成するタイルまたはタイルのグループ、すなわち、動き制約タイルセット(motion constrained tile set)であり得る。これは、サブピクチャが、同じピクチャ内で独立して符号化されることに加えて、空間的にオフセットされた他のピクチャのサブピクチャから独立して符号化され得ることを意味する。その場合、異なるピクチャのサブピクチャが、相互に整列され、又は空間的に一致するサブピクチャ境界と空間的に整列されるように、それらピクチャは、一定の方法でサブピクチャに分割されてもよい。これにより、そのようなランダムアクセスポイント・シグナリング粒度指示を含むそのようなデータストリームは、ピクチャ粒度レジームで符号化されたであろうサブストリームのリザーバ内で使用されるのと同じアルファベットを使用することによって、サブピクチャ関連情報をシグナリングできるであろう。サブピクチャ関連情報は、例えば、NALユニットタイプなどの複数のタイプを区別する整数値のシンタックス要素を含み得る。各サブピクチャは、1つ以上のNALユニットに符号化されてもよく、各NALユニットは、例えば、そのような整数値のシンタックス要素を有する。したがって、ランダムアクセスポイント・シグナリング粒度指示が第1または第2の粒度を示すかどうかに関係なく、整数値シンタックス要素によって区別される複数のNALユニットタイプの1つ以上のNALユニットタイプの第1のサブセットは、サブピクチャ関連情報の第1の状態に対応する一方で、1つ以上のNALユニットタイプの第2のサブセットは、サブピクチャ関連情報の第2の状態に対応するであろう。
【0013】
ランダムアクセスポイント・シグナリング粒度指示は、データストリームのSPSまたはVPS内に含まれることができ、1つ以上のピクチャのセットは、ビデオの一連のピクチャを含むか、または全体ビデオをカバーする、ランダムアクセスポイント・シグナリング粒度指示の範囲を形成する。代替的に、ランダムアクセスポイント・シグナリング粒度指示は、データストリーム内でアクセスユニットごとに伝達することができ、1つ以上のピクチャのセットは、1つのピクチャのみを含むランダムアクセスポイント・シグナリング粒度指示の範囲を形成する。
【0014】
ランダムアクセスポイント・シグナリング粒度指示を解析できないビデオデコーダは、サブピクチャ関連情報が、任意のピクチャについて、このピクチャの異なるサブピクチャに対して異なる状態である場合に、データストリームを不適合データストリームとして識別してもよい。ランダムアクセスシグナリング粒度指示を解析および復号できる他のビデオデコーダは、この指示に応じて復号動作を適応させることができる。すなわち、ランダムアクセスポイント・シグナリング粒度指示が第1の粒度を呈し、かつランダムアクセスポイント・シグナリング粒度指示の範囲を形成する1つ以上のピクチャのセットの任意のピクチャについて、サブピクチャ関連情報が、このピクチャの異なるサブピクチャについて異なる状態である場合、データストリームを不適合データストリームとして識別しうる。
【0015】
追加的または代替的に、ビデオデコーダのより多くの機能は、ランダムアクセスポイント・シグナリング粒度指示が第2の粒度、すなわちサブピクチャ粒度を呈する場合に活性化されることができ、これらの機能は、一方ではサブピクチャ関連情報と、他方ではランダムアクセスポイント・シグナリング粒度指示との併用を使用することに関係なく、より効果的なビデオコーデックを達成するために同様に有利に使用され得るので、これについては本願のさらなる態様に関して後述する。すなわち、以下の態様によるデコーダは、サブピクチャ粒度レジームでのみ動作でき、このレジームの使用をシグナリングする必要はない。
【0016】
本願の第2の態様によれば、サブピクチャごとの符号化に関して、例えば、合成されたビデオを表現するための使用に関して、ビデオコーデックをより柔軟にすることが目的である。そのピクチャは、サブピクチャに分割される。この目的は、ビデオデコーダを、各サブピクチャについてデータストリーム内で伝達されるサブピクチャ関連情報の評価に応じてレンダリングすることによって達成される。特に、第2の態様によれば、符号化されたそのようなビデオを有するデータストリームは、各ピクチャのサブピクチャごとに、サブピクチャ関連情報を含み、このサブピクチャ関連情報は、第1の状態のとき、それぞれのサブピクチャをランダムアクセスポイント方式で符号化されているとして識別し、第2の状態のとき、それぞれのサブピクチャをランダムアクセスポイント方式で符号化されていないものとして識別する。ビデオデコーダは、そのサブピクチャのサブピクチャ関連情報に関してピクチャを検査する。サブピクチャ関連情報が、任意のピクチャについて、所定のピクチャのすべてのサブピクチャについて第1の状態である場合、すなわち、そのすべてのサブピクチャがランダムアクセスポイントを表す場合、ビデオデコーダは、その復号済みピクチャバッファをフラッシュする。そのような概念は、第1の態様と同様に、1つのピクチャ内のサブピクチャがサブピクチャ関連情報において一致することが義務付けられていた、すなわち、1つのピクチャのすべてのサブピクチャは同じ状態でなければならない、異なるビデオコーデックドメインのために実際に生成されたサブストリームからデータストリームを合成することを可能にする。しかしながら、そのようなデータストリームを合成する場合には、データストリームを合成するために使用される様々なサブピクチャのサブピクチャ関連情報の状態は、単にそこから採用されるか、またはそこから引き継がれてもよい。さらに、ビデオデコーダは、サブピクチャ関連情報がそれぞれのピクチャのすべてのサブピクチャについて第1の状態をとるピクチャを識別することによって、ピクチャ全体をアーチファクトなしで回復できるという点で、真のランダムアクセスポイントを識別することができる。第1の態様と組み合わせた場合、ビデオデコーダは、ランダムアクセスポイントピクチャを識別するこの機能を適用することができ、その場合、ランダムアクセスポイント・シグナリング粒度指示が第2の粒度、すなわちサブピクチャ粒度を呈するとき、そのようなピクチャのサブピクチャ関連情報がそれぞれのピクチャのすべてのサブピクチャについて第1の状態をとることを確認することに応答して、復号済みピクチャバッファがフラッシュされてもよい。第1の態様と組み合わせた場合、そのようなビデオデコーダは、復号済みピクチャバッファをフラッシュする際のスケジュールを変更することさえできる。すなわち、ランダムアクセスポイント・シグナリング粒度指示が第1の粒度、すなわちピクチャごとの粒度を呈するとき、他のサブピクチャに関連するサブピクチャ関連情報はいずれにせよ同じ状態、つまり第1の状態を呈する必要があるので、ビデオデコーダは、サブピクチャ間の復号化/符号化順序に従って、特定のピクチャの第1のサブピクチャについて第1の状態を呈するサブピクチャ関連情報に応答して、復号済みピクチャバッファをフラッシュすることができる。代わりに、特定のピクチャについて、ランダムアクセスポイント・シグナリング粒度指示が第2の粒度、すなわちサブピクチャ粒度を呈するとき、所定のピクチャのすべてのサブピクチャについてサブピクチャ関連情報が第1の状態であることに応答する復号済みピクチャバッファのフラッシュは、そのピクチャの最後のサブピクチャを復号する際に実行されるようにスケジュールされ得る。
【0017】
本出願の第3および第4の態様は、デコーダ側の復号済みピクチャバッファ管理に関する。本出願のこれらの態様は、第1および第2の態様のいずれかと組み合わせることができ、態様1および態様2に関して上で概説したのと同様の目的を有する。すなわち、本出願の第3および第4の態様は、合成データストリームをサブピクチャ関連のサブストリームから合成できるようにするビデオコーデックを提供することを目的とし、これにより、合成器/統合器は、合成データストリームに寄与するさまざまなサブストリーム内でシグナリングされるDPB内に残るべき参照ピクチャのセットを記述する参照ピクチャバッファ記述を調和または統一する必要がなくなる。それにより、合成データストリームは、各ピクチャの開始時に、現在のピクチャについて、どのピクチャが参照ピクチャのセットを形成するかについて即座にシグナリングすることができ、その結果、デコーダが、この現在のピクチャの開始時に、復号済みピクチャバッファから他のすべてのピクチャを削除してもよい。むしろ、第3および第4の態様によれば、ビデオコーデックは、データストリームが参照ピクチャバッファ記述をシグナリングすることを可能にし、その参照ピクチャバッファ記述は、現在符号化/復号化されるピクチャの各サブピクチャについて、個別に、現在のピクチャを復号しまたはそれぞれの次のピクチャで復号するために必要な、参照ピクチャのセットに関する情報を提供するものであり、参照ピクチャバッファ記述は、現在のピクチャのサブピクチャ間で異なっていてもよい。そのような参照ピクチャバッファ記述は、現在のピクチャの現在のサブピクチャについて、現在のサブピクチャのため、または例えば、1つのサブビデオに関係しているゆえにその起源を介して現在の参照ピクチャに関連付けられている次のピクチャのサブピクチャのため、の参照として機能するサブピクチャを含むピクチャを記述している。別個のサブビデオとして符号化されている場合、サブピクチャのバッファ記述は、同じサブビデオのサブピクチャであり、それらサブピクチャがそのサブビデオの現在のサブピクチャまたは後続のサブピクチャの参照として機能するため、DPB内で維持されるべきサブピクチャを含む参照ピクチャを実際に示している。本出願の第3の態様によれば、デコーダは、サブピクチャの参照ピクチャバッファ記述に従って、この現在のピクチャのサブピクチャのために、復号済みピクチャバッファ内に残るべき参照ピクチャのセットの和集合(union)を形成する機能を有することにより、復号済みピクチャバッファ内に残るべきそれらピクチャをマークし、その一方で、他のピクチャは現在のピクチャの復号の終了時などに復号済みピクチャバッファから削除される。本出願の第4の態様によれば、デコーダは、完全なピクチャではなく、サブピクチャの単位で、復号されたピクチャを空にする操作を実行することができる。サブピクチャのマーキングと削除は、サブピクチャごとに個別に実行される。言い換えれば、第4の態様によれば、復号済みピクチャバッファは、現在復号されるピクチャのサブピクチャごとに1つのサブピクチャ復号済みピクチャバッファの単位で管理され、それぞれのサブピクチャの復号済みピクチャバッファに残るべきサブピクチャのマーキングと、他のピクチャを復号済みピクチャバッファから削除すべきとする動作とは、現在復号されているピクチャのそれぞれのサブピクチャについて、データストリームの中で送信された参照ピクチャバッファ記述に基づいて実行される。すでに上述した通り、後者の第3および第4の態様は、例えば第1の態様と組み合わせることができ、その結果、デコーダは、例えばランダムアクセスポイント・シグナリング粒度指示が第2粒度を呈する場合に、第3および第4の態様に関して上述した機能を有することができ、その一方で、ランダムアクセスポイント・シグナリング粒度指示が第1粒度、すなわちピクチャ粒度を呈する場合、復号済みピクチャバッファをピクチャ単位で管理し/空にし、この場合、デコーダは、現在復号されているピクチャに対して最初に遭遇した参照ピクチャバッファ記述に基づいて、すなわち現在のピクチャに対して最初にシグナリングされた参照ピクチャバッファ記述に基づいて、復号済みピクチャバッファを空にし、マーキングを実行するよう構成することができる。
【0018】
本出願の第5の態様は、POC処理に関する。第3および第4の態様と同様に、第5の態様は、異なるランダムアクセスポイント期間、ピクチャのグループ、または異なるフレームレートなどを使用して別々に符号化されたサブストリームからデータストリームを構成できるようにする、ビデオコーデックを提供することを目的とし、それによって合成データストリームに寄与すべき時間的に整列されたサブピクチャをもたらし、それらは、実際には異なるPOC値を持つ様々なサブストリームの中でシグナリングされる。本出願の第5の態様は、第1~第4の態様のいずれかと組み合わせることができ、異なるサブピクチャに関連付けられ、異なる起源を持つサブストリームのPOC値を同調(harmonize)させる必要から合成器/統合器を解放することによって、そのような合成/統合(composition/merging)手順を軽減することを目的とする。むしろ、このビデオコーデックにより、データストリームは、データストリームの同じピクチャに実際に属するサブピクチャについて異なるPOC値をシグナリングできるようになり、デコーダは、現在復号されているピクチャのサブピクチャごとに、そのサブピクチャの復号されたPOC値に基づくそれぞれのサブピクチャの最終的なPOC値と、それぞれのサブピクチャに関連付けられ、かつそのビデオの各ピクチャについてそれらサブピクチャの最終的なPOC値が互いに等しくなるように、デコーダによって更新され続ける1つ以上のサブピクチャ間POC補償パラメータ(inter-sub-picture POC compensation parameter)と、を導出するように構成される。1つ以上のサブピクチャ間POC補償パラメータは、寄与しているサブストリーム間のフレームレート差、ピクチャのグループの異なるサイズ、異なるPOC最小数などを補償してもよい。1つ以上のサブピクチャ間POC補償パラメータは、POCオフセット値およびPOCステップサイズ差を含み得る。ランダムアクセスポイント・サブピクチャでのPOCオフセット値などの一部のパラメータは、それらのシグナリングされたPOC値とランダムアクセスポイントを形成しない同じピクチャの他の少なくとも1つのサブピクチャの最終POC値との差に基づいて、デコーダ自体によって決定されてもよい。一方、POCステップサイズ差に関するヒントは、デコーダをガイドし、これらのPOCステップサイズ差の決定を軽減するために、データストリームの中で伝達されてもよい。これらのヒントは、寄与するサブストリーム内の高レベルのパラメータに基づいてこの知識にアクセスできる合成器/統合器によって、データストリームに挿入されてもよい。
【0019】
本出願の第6の態様は、段階的復号リフレッシュを実装するビデオコーデックのアイデアに関し、その実装方法は、デコーダが段階的復号リフレッシュについて、段階的復号リフレッシュがここから先に完了するという時点またはピクチャの観点から認識しているだけでなく、段階的復号リフレッシュの最中にデータストリーム内で伝達される符号化パラメータに基づいて予測導出を実行する際の特定の制約を満たすという観点からも、認識している方法である。特に、本出願の第6の態様によれば、ビデオデコーダは、ビデオの参照ピクチャのそれぞれについて、リフレッシュピクチャ領域と非リフレッシュピクチャ領域への参照ピクチャのサブ分割をログ(記録)するように構成される。デコーダは、データストリームから、現在復号されているピクチャ内のリフレッシュ更新領域に関する情報を復号し、インター予測を使用してデータストリームからリフレッシュ更新領域を復号する。さらに、デコーダは、現在復号されているピクチャの第1の領域であって、リフレッシュ更新領域とは重ならず、参照ピクチャの非リフレッシュピクチャ領域から独立して符号化/復号化されるべき領域を決定し、第1の領域についてのデータストリーム内の信号である符号化パラメータに基づいて、参照ピクチャから第1の領域の予測を導出することによって、データストリームから第1の領域を復号する。その際に、予測が参照ピクチャの非リフレッシュピクチャ領域から独立するように、参照ピクチャのリフレッシュピクチャ領域の位置に依存する方法で、予測が導出される。例えば、動きベクトルは、非リフレッシュピクチャ領域に到達するようにクリップされてもよく、および/またはパディングは、リフレッシュピクチャ領域を超えて非リフレッシュピクチャ領域にまで届く、参照ピクチャ内の動き補償予測ブロックの部分を埋めるために使用され得る。代替的に、動きベクトル候補リストの構築は、リフレッシュピクチャ領域の外側から生じる動きベクトルを除外することができる。第2の領域は、デコーダによって異なる方法で処理されてもよい。第2の領域は、第1の領域およびリフレッシュ更新領域と分離され、リフレッシュピクチャ領域および非リフレッシュピクチャ領域からの予測を含んでデコーダによって復号されてもよい。この方法により、リフレッシュピクチャ領域はピクチャからピクチャへと継続的に成長する。デコーダは、リフレッシュピクチャ領域の成長を追跡する必要があり、それに応じて第1の領域に関して予測導出を実行する必要があるので、デコーダはその成長を認識している。デコーダに段階的復号リフレッシュを認識させることには、いくつかの利点がある。すなわち、デコーダは、現在のリフレッシュ状況、考えられるランダムアクセス期間などを認識する。予測導出に関連する努力と、この導出を参照ピクチャのリフレッシュされたピクチャ領域の位置に依存させる必要性とには、デコーダが、例えば、ピクチャの外側境界または独立して符号化されたピクチャタイルの外側境界で同様の手段を実装する必要があるかもしれないので、ほとんどコストがかからない。他方、デコーダが符号化パラメータのいくつかのシグナリング可能な状態を、参照ピクチャの非リフレッシュピクチャ領域への依存をもたらし得る予測から、リフレッシュされたピクチャ領域にのみ依存する予測へとリダイレクトするので、エンコーダは符号化パラメータをより広範囲の値で符号化することができる。しかしながら、符号化パラメータのシグナリング可能な状態を拡大することは、これらの符号化パラメータの符号化に関して、より高い圧縮効率につながる可能性がある。
【0020】
本出願の有利な態様は、従属請求項の要旨である。本出願の好ましい実施形態は、添付の図に関して以下に説明される。
【図面の簡単な説明】
【0021】
【
図1】いくつかの入力サブストリームに基づいてデータストリームを合成するための、またはサブストリームを合成データストリームに統合するための状況を示す概略図であり、そこでは、デコーダがその合成データストリームを復号し、サブストリームを形成するための対応するエンコーダおよび合成器/統合器自身が示されており、
図2~
図8に関して示す実施形態は、合成器/統合器および/またはデコーダによって適用され得る好ましい機能と概念を説明するために使用される。
【
図2】サブピクチャ粒度またはピクチャ粒度がランダムアクセスポイント・シグナライゼーションに使用されるかどうかの指示を可能にする、ビデオコーデックの概念を示す概略図である。
【
図3】復号済みピクチャバッファをフラッシュするためのデコーダが持ち得る機能を示す概略フロー図を示す。
【
図4】復号済みピクチャバッファを空にする操作を実行する際のデコーダの好ましい機能を説明するための概略フロー図を示す。
【
図5】復号済みピクチャバッファにサブピクチャのユニットを空にする操作を実行するように構成されたデコーダを示す概略図である。
【
図6】合成ビデオデータストリームのピクチャ内への連続するサブビデオに属するサブピクチャのサブピクチャ再配置に対処するための可能な手段を示す概略図である。
【
図7】ビデオの異なるサブピクチャのための異なるPOCドメインを処理するためのビデオデコーダの好ましい手段を示す概略図である。
【
図8】一実施形態によるランダムアクセスポイント・サブピクチャにおけるPOCオフセット補償に関して、
図7の概念を示す概略図である。
【
図9】効率的な段階的復号リフレッシュを可能にするエンコーダおよびデコーダの実施形態を示す概略図である。
【
図10】ビデオデータストリームがパノラマシーンの異なるMCTSに関連するサブストリームから構成される、360°ストリーミングの例を示す概略図である。
【
図11】段階的復号リフレッシュを示す概略図である。
【発明を実施するための形態】
【0022】
図1に関し、サブストリームのリザーバからデータストリームを合成する作業を説明する。これは、それに関連する問題、つまり、サブストリームの異なる由来に関連する問題と、例えばランダムアクセスポイントの配置、関連するPOC値、異なるGOP構造など少しばかり後述する違いに関連する問題を、説明するものである。次に、これらの問題は、後に説明する実施形態に従って解決される。これら実施形態は、本出願の異なる態様に関連しており、それらは、後段でさらに説明するように、さらなる実施形態をもたらすために相互に組み合わせることができる。しかしながら、
図1でなされた前提のいくつかは、後で説明する実施形態には必要でなく、または換言すれば、
図1に関して説明および議論された特徴のいくつかは、後段で説明する実施形態については適用されないこともあり、その場合でも、それぞれの実施形態が扱う態様からの利点を達成できる。このような状況についても、以下で説明する。
【0023】
図1は、データストリーム10が、複数のサブストリーム12、またはサブストリーム12のリザーバに基づいて、合成によって生成されるシナリオを示す。この合成または統合のプロセスは、合成器/統合器14によって行われる。特に、データストリーム10は、その中に符号化されたピクチャ18のビデオ16を有するように生成される。
図1の矢印20は、ビデオ16のピクチャ18の間で定義された表示時間順序(presentation time order)、すなわち、デコーダ22がデータストリーム10からビデオ16を復号するときにピクチャ18がデコーダ22によって出力される順序を示すものである。
図1の破線26によって示されるように、ピクチャ18はサブピクチャ24へと空間的にサブ分割され、したがって、破線26はサブピクチャ同士の境界を表す。特に、データストリーム10は、サブピクチャ24が互いに独立して符号化される方法で、その中に符号化されたビデオ16を有する。データストリーム10へのサブピクチャの独立した符号化と、その結果として、互いに独立した方法でデータストリーム10からサブピクチャ24を復号する可能性は、少なくとも、1つのピクチャ18内のサブピクチャに関連し、即ちピクチャ内部的に関連する。例えば、
図1において、ピクチャ18はサブピクチャ24にサブ分割された状態で示され、各ピクチャ18は、それぞれ参照番号を有する6つのサブピクチャを含む。したがって、例えばサブピクチャ3は、同じピクチャ18の他のサブピクチャから独立した方法でデータストリーム10へと符号化される。したがって、
図1にハッチングして示されたサブピクチャ3は、同じピクチャ18の他のハッチングされたサブピクチャ1、2、4、5および6から独立した方法で、デコーダ22によってデータストリーム10から復号され得る。しかしながら、
図1に係るデータストリーム10のさらなる特徴は、ビデオ16のピクチャ18が、ピクチャのシーケンスにわたって一定の方法でサブピクチャ24に空間的にサブ分割されることである。すなわち、それらの境界26は、異なるピクチャと比較すると空間的に一致する。さらに、同一位置に配置されまたは空間的に整列されたサブピクチャ、即ち
図1において同じ参照番号が付されたサブピクチャ24は1つのサブビデオを形成し、そのサブビデオにおいては、各サブピクチャ24が、同じピクチャの他のサブピクチャから独立して符号化されるだけでなく、それぞれのサブピクチャに対して空間的にオフセットされている他のピクチャのサブピクチャからも、即ち他のサブビデオに属する全てのサブピクチャまたは
図1において他の参照番号が付された全てのサブピクチャからも、独立して符号化されている。例えば、HEVCの用語で言えば、
図1の各サブピクチャ24はMCTSであってもよい。ビデオ16の異なるピクチャの空間的にオフセットされたサブピクチャからの符号化独立性という後者の特性がない場合には、サブピクチャ24は、例えばHEVCの用語を使用すれば、1つ以上のタイルであってもよい。
【0024】
ビデオ16の空間的に整列されたサブピクチャ24によって形成された個々のサブビデオは、
図1の中で番号28でも示される。つまり、これらのサブビデオはすべて、サブピクチャ24のシーケンスで構成される。エンコーダ30は、これらのサブビデオ28を、複数のサブストリーム32またはサブストリーム32のリザーバへと独立して符号化する。実際、サブビデオ28は、エンコーダ30によってグループごとに扱われてもよい。サブビデオ28の1グループは1つの入力データストリームへと符号化されてもよく、その入力データストリームは、サブビデオ28のグループが互いに独立して符号化されたビデオを有し、その結果、そのような入力ビデオデータストリームは各サブビデオ28について1つのサブストリーム32から構成される。サブストリーム32は、合成器/統合器14によって受信され、次に、合成器/統合器14はサブストリーム32に基づいてデータストリーム10を合成する。アプリケーションに応じて、サブビデオ28のサブセットのみ、またはサブストリーム32のサブセットのみが、事実上、データストリーム10に寄与してもよく、このサブセットは、さらに、ビデオ16のピクチャ18間で変化または異なっていてもよい。
【0025】
合成器/統合器14によって行われるような合成/統合作業の目的は、符号化されたドメインで作業を実行することである。すなわち、予測残差の再量子化または動き補償の再実行は、合成器/統合器14によって回避される。サブビデオ28の各サブピクチャ24は、例えば、対応するサブストリーム32の1つ以上のNALユニット34に符号化される。サブピクチャ24が、合成データストリーム10のビデオ16に寄与するべきものに属する場合、合成器/統合器14は、同じ参照符号、即ち34を使用して示すように、それぞれの1つ以上のNALユニットをデータストリーム10に挿入するが、しかし、合成器/統合器14は、動きベクトル情報または予測残差データ以外に、これらのNALユニット内の他の符号化パラメータを適応させる必要性が生じる可能性があることを示すために、アポストロフィを付している。以下に本明細書に記載される実施形態によれば、合成器/統合器14は、サブストリーム32に基づいてデータストリーム10を形成するときに適応されるべき、サブストリーム32の部分を減らす機会を与えられる。これはまた、合成器/統合器14がデータストリーム10内に対応するパラメータセット36を形成することを目的とする場合、サブストリーム32またはそのサブストリームが含まれる入力ビデオデータストリームのパラメータセットにも関連する。
【0026】
図1の状況は、さらに
図10を参照することによって説明することができる。
図10は、サブビデオ28のリザーバが360°ビデオのサブセクションを形成する場合を示している。
図10の例では、場面全体が24のサブビデオに分割されていた。
図10の例では、多くのサブビデオが提供されていた。つまり、24のサブビデオがこの場面を高解像度で表示し、エンコーダ30によって、ある時は大きなRAP距離を用いてより効率的に、また別の時には、例えば入力ビデオデータストリーム38bのように小さいRAP距離を使用して低い圧縮効率をもたらしつつ、2つの入力ビデオデータストリーム38aおよび38bに符号化された。同様に、さらに2つの入力ビデオデータストリームが提供され、それぞれが24個のサブビデオが符号化された完全な場面を有し、この場合も、一方38cは大きいRAP距離を持ち、他方38dは小さいRAP距離を持つ。合成されたビデオデータストリームのピクチャ16は、完全な場面を示すものとして示された。特に、各ピクチャ16は、データストリーム38aおよび38bに符号化されたサブビデオの12個の相互に時間的に整列されたサブピクチャと、データストリーム38cおよび38dから取得された、相互に時間的に整列され、高解像度サブピクチャに時間的に整列された12個のサブピクチャとから構成されている。つまり、
図10の例では、ビューポートは12個のサブピクチャ幅またはタイル幅であると想定されていた。
図10の中央において、ハッチングは、合成データストリームのピクチャ16内のサブピクチャ24の選択を示しており、これらは、合成されたビデオのピクチャ16に対して高解像度および低解像度で寄与する。異なるRAP距離バージョンに関して別の選択が行われる。各高解像度サブピクチャ24および各低解像度サブピクチャ24について、特定のピクチャ時点に関し、データストリーム38aおよび38cにはそれぞれ、大きいRAP距離を使用して効率的に符号化された1つ以上のNALユニットがあり、また、別のデータストリーム38bと38dにはそれぞれ、小さいRAP距離を使用して符号化されたNALユニットがある。好ましくは、合成データストリーム10は、効率的に符号化されたデータストリーム38aおよび38cのNALユニットを使用して構成されている。全てのデータストリーム38a~38dは、各データストリーム38a~38d内の同期ランダムアクセスポイントを個別に使用して、その中に符号化されたサブストリーム38を有し得る。すなわち、データストリーム38a~38dのそれぞれに符号化されたビデオのピクチャは、それぞれ24個のサブピクチャ24に分割され、それら各ピクチャについて、全部または皆無のサブピクチャが、ランダムアクセスポイント方式で、それぞれの入力ビデオデータストリーム38a~38dへと符号化される。
【0027】
ビューポートが変化するたびに問題が発生する。すなわち、データストリーム10の合成/統合に寄与する寄与サブストリームの選択が変化する。
図10の例では、96個のサブストリームが利用可能であるが、特定のピクチャに関して、合成データストリーム10に寄与するのは24個だけである。例えば、ビューポートが2つのサブピクチャまたはタイル24分だけ変化すると仮定する。したがって、ピクチャ16のサブピクチャ24のうちの4つは、それらの起源となるサブストリームを変化させる。即ち、高解像度データストリーム38aに由来するこれらの4つのうちの2つは、この場合、低解像度データストリーム38cおよび38dのうちの1つから取得され、低解像度データストリーム38cに起源を持つ他の2つのサブピクチャ24は、この場合、低解像度データストリーム38dから取得される。特に、次のランダムアクセスポイントに遭遇する時間を短縮するために、低いRAP距離バージョンのデータストリーム38bおよび38dが、それぞれ、これらの4つのサブピクチャ24のために予備的に使用される。前記4つのサブピクチャはピクチャ16内でそれらの位置を変える。しかしながら、他のすべてのサブピクチャ24は、それぞれ、データストリーム38aおよび38cのそれぞれのより効率的なバージョンでダウンロードされたままである。それらはランダムアクセスポイントを必要としない。変形例として、合成器/統合器14は、高解像度から低解像度に変化するそれらサブピクチャ24のために、より効率的に符号化された入力ビデオデータストリーム38cの対応するNALユニットを、高解像度から低解像度へのダウンサンプリングを使用して、データストリーム10内に挿入し得ること、それにより低解像度の対応する非RAPサブピクチャの参照ピクチャを導出し得ること、に留意されたい。
【0028】
すなわち、
図1と
図10を組み合わせて説明したこのシナリオの例では、360°ストリーミングに関連する以下の問題が提示されている。特に、ユーザーがサービスに参加するとき、つまりサービスにチューンインするとき、つまりパノラマビデオを見ようとするときは、ランダムアクセスポイントのピクチャが必要となる。すなわち、後述する実施形態がなければ、集められたデータストリーム10は、開始ピクチャ内の各サブピクチャがランダムアクセスポイント方式で符号化されることを必要とするであろう。つまり、そのピクチャのすべてのNALユニットは、ランダムアクセスポイント方式で符号化される必要があるであろう。HEVC言語を用いて言えば、例えば、それらはNALユニットタイプIDR、CRA、またはBLAである必要があるであろう。すなわち、後段でさらに説明する実施形態がなければ、デコーダは、復号を開始するためにRAPピクチャに遭遇することを余儀なくされるであろう。しかしながら、
図10に関して上述したように、ユーザーがビューポートを切り替えたとき、データストリーム10に寄与しまたはデータストリーム10にマージされるビットストリーム32のサブセットに対して、新たに追加されるのは一部のサブビットストリーム32のみであるため、すべてのサブビットストリーム32に対し、すなわち、寄与ビットストリームのサブセット内に残っているものに対してさえ、開始ピクチャ内にそのサブピクチャ24をランダムアクセスポイント方式で符号化された状態で有するよう求めることは、非常に非効率となるであろう。むしろ、
図10に関して概説したように、一部のサブピクチャ・ビットストリーム32だけが効果的にRAPを持ち、他のビットストリームが持たなかった場合が好ましいであろう。ただし、これは次のことを意味する。すなわち、データストリーム10内のNALユニット34’で示されるNALユニットタイプは、基礎となるNALユニット34の設定と比較して変更される必要があるであろう。特に、IDR、CRA、またはBLAに設定された、開始ピクチャのサブピクチャ24のNALユニット34のNALタイプは、対応するバージョン34’およびデータストリーム10の同じNALユニットタイプと関連していなくてもよい。なぜなら、データストリームの要件として、サブピクチャ・ビットストリームの1つがこれらNALユニットタイプの1つを有する場合、他のすべても同じNALユニットタイプを有することが必要となるからである。特に、これまでに定義されたデコーダは、データストリーム10の特定のアクセスユニットに対して、つまりビデオ16の特定のピクチャ18に対して、IDRまたはCRA(以前はEOSNALUを持つ)NALユニットを見つけると、復号プロセスを再開し、そのデコーダピクチャバッファ(DPB)を、そこにあるどのピクチャも参照に使用できない、または使用されていないがゆえに、フラッシュするであろう。これは、例えば、前述のシナリオが、現在のバージョンのデータストリーム10のためにHEVCを使用することによって実現される場合、サブビットストリーム32を一緒にマージする際に、ビデオ16のあるピクチャ18について、すべての寄与サブビットストリーム32がランダムアクセスポイント符号化に対応するNALユニットタイプを含んでいる訳でなく、そのごく一部が含んでいたような場合に、対策を講じる必要があることを意味する。その場合、むしろ、そのようなピクチャ18内のRAPNALユニットは、非RAP NALユニットに書き換えられなければならず、そのプロセスは、スライス、タイル、および/またはタイルグループヘッダーなどの他のヘッダーの変更も必要とするであろう。なぜなら、それらのコンテンツは、問題のNALユニットがRAPであるか否かに依存するためである。
【0029】
したがって、
図2に関して次に説明する実施形態は、これまでの技術を超えて、サブピクチャRAPのシグナリングを改善するよう試みる。例えば、サブピクチャが符号化されているNALタイプが各ピクチャ内で一定になるように、NALユニットタイプをデータストリームのNALユニットに割り当てるという、上述した制約から脱却する提案がすでに存在する。例えば、特許文献1は、例えばNALUヘッダーの中で、NALユニットベースのシグナリングを使用することをすでに提案しており、より具体的には、サブピクチャ・ランダムアクセスポイントタイプを示す専用NALUタイプ、または、HEVC準拠のデータストリームを取得するために必要なすべてのパラメータを代替する代替情報を含む回復ポイントSEIメッセージである。しかしながら、当該文献で提案された方法で上記の課題を解決するには、依然として合成器/統合器14が「ストリーム変換(stream translations)」という面倒な作業を実行する必要がある。そこで、以下に概説する実施形態は、この問題を克服し、合成器/統合器14が追加のRAPタイプのシグナリングオーバーヘッドを費やす必要性を回避しようとするものである。
【0030】
図2は、本出願の第1の態様に関する本出願の一実施形態によるビデオコーデックの概念を示す。
図2は、上述した課題に対応する新たなビデオコーデックに適合し得る、対応するデータストリーム10およびビデオデコーダ22の実施形態を示す。
図1のデータストリーム10は、
図2に関して以下で記載する説明にも対応し得、結果的に、上述した問題に少なくとも部分的に対処できることから、
図1の参照記号10を再利用する。
【0031】
すなわち、
図2のビデオデコーダ22は、符号化されたピクチャのビデオを有するデータストリーム10を受信する。データストリーム10は、ビデオピクチャが空間的にサブ分割されているサブピクチャが互いに独立して符号化される方法で、その中に符号化されたビデオを有する。各サブピクチャは、データストリーム10のそれぞれの1つ以上のNALユニット34’に符号化される。すなわち、NALユニット34’は、とりわけ、動き情報および予測残差情報を伝達する。
図1に関して上述した説明以外に、サブピクチャ符号化の独立性は、データストリーム10に符号化されたビデオの1つのピクチャ18内のサブピクチャにのみ関係してもよい。したがって、
図2は、例示的に1つのピクチャ18、そのサブピクチャ24へのサブ分割、およびサブピクチャ24がデータストリーム10内で符号化される対応するNALユニット34’を示す。当然ながら、この符号化はまた、
図1に関して上述したように、別個に符号化されたサブビデオを生成するためにも行われ得る。
【0032】
デコーダ22は、データストリーム10から、各ピクチャ18の各サブピクチャ24のために、サブピクチャ関連情報40を復号する。特定のサブピクチャ24のサブピクチャ関連情報は、例えば、それぞれのサブピクチャ24が符号化されている1つ以上のNALユニット34’のNALユニットタイプを示すシンタックス要素であってもよい。第1の状態を呈する場合、サブピクチャ関連情報40は、そのサブピクチャ24が、ランダムアクセスポイント方式でその1つ以上のNALユニット34’に符号化されていると識別する。つまり、それはサブピクチャのランダムアクセスを形成する。すなわち、そのサブピクチャは、他のサブブロックを参照することなく、自己完結型の方法でその1つ以上のNALユニット34’に符号化されているであろう。第2の状態を呈する場合、サブピクチャ関連情報は、そのサブピクチャ24が、ランダムアクセスポイント方式で符号化されていないと識別するであろう。すなわち、そのようなサブピクチャ関連情報40を有するNALユニット34’は、他のサブブロックへの符号化依存性を使用して、その中に符号化された関連するサブブロック24を有し得る。特に、サブピクチャ関連情報40は、各サブピクチャ24のための整数値シンタックス要素を含んでもよく、そのシンタックス要素は、複数のNALユニットタイプから、第1の状態すなわちサブピクチャRAP状態に対応する1つ以上のNALユニットタイプの第1のサブセットを区別し、また、第2の状態すなわち非RAP状態に対応する1つ以上のNALユニットタイプの第2のサブセットを区別する。
【0033】
しかしながら、
図2のデコーダ22は、1つ以上のピクチャのセット42に関して、データストリーム10からランダムアクセスポイント・シグナリング粒度指示44を読み取るようにさらに構成される。その指示は、複数のピクチャに関連するある種の高レベルのシグナリングとしてデータストリーム10内で伝達され得る。すなわち、その場合、1つ以上のピクチャ18のセット42は、GOPなどのピクチャのシーケンス、またはビデオ16全体さえも含むであろう。指示44は、例えば、データストリーム10のシーケンスパラメータセットまたはビデオパラメータセットに含まれていてもよい。一方、指示44は、1つのアクセスユニット、すなわち、ビデオ16の1つのピクチャ18のみに関連してもよい。換言すれば、セット42は1つのピクチャを含んでいてもよい。そのようなアクセスユニットごとのシグナリングは、データストリーム10のPPS即ちピクチャパラメータセット、またはアクセスユニット・デリミッタ(access unit delimiter)などに含まれ得る。この指示44は、少なくとも2つの信号伝達可能な状態/粒度を有するであろう。第1の粒度を呈するまたはシグナリングするとき、指示44は、1つ以上のピクチャのセット42の各ピクチャ18について、サブピクチャ関連情報40がそれぞれのピクチャ18のすべてのサブピクチャ24について共通の状態を呈することを示すであろう。換言すれば、サブピクチャ関連情報40は、セット42内の1つのピクチャ18内のすべてのサブピクチャ24について等しい1つの状態を呈するであろう。この同一性は、NALユニットタイプのレベルを考慮する場合にも当てはまり得る。すなわち、1つのピクチャ18のサブピクチャ24に属するNALユニット34'のNALユニットタイプは、第1の粒度すなわちピクチャ粒度をシグナリングする指示44の場合、同一、すなわち、互いに等しいことが求められてもよい。
【0034】
しかしながら、指示44がサブピクチャ粒度と呼ばれ得る第2の粒度を示す場合、これは、セット42の各ピクチャ18について、サブピクチャ関連情報40が、それぞれのピクチャ18のサブピクチャ24について異なる状態をとり得ることを示す。
【0035】
すなわち、
図2のデコーダは、データストリームから指示44を復号し、それに基づいて、データストリーム10は、サブピクチャ関連情報40が各ピクチャ18内で同じであることを求められるタイプであるか、またはデータストリーム10がそのような制限が当てはまらないタイプであるかどうかを決定することができる。デコーダ22は、以下でより詳細に説明する1つ以上の復号作業に関して、指示44に応じて異なるよう動作することができる。
【0036】
しかしながら、いずれの場合でも、前述の合成器/統合器14は、以下の方法で、指示44をサブピクチャ粒度に設定する可能性を利用することができる。合成器/統合器14は、データストリーム10のアクセスユニットを、符号化されたサブストリーム32のリザーバのNALユニット34をまとめることによって合成してもよく、それらは、
図2の46のようなアクセスユニットが参照する現在のピクチャの時間的に整列されたサブピクチャ24に関連しており、またその際に、このアクセスユニット46内のデータストリーム10のNALユニット34'が、サブピクチャ関連情報40において、まとめられたNALユニットと一致するように、NALユニットのNALユニットタイプを引き継ぐか、採用するか、または修正無しで維持してもよい。
【0037】
以下では、指示44がサブピクチャ粒度を示す場合について、
図2のデコーダ22の機能を解説するいくつかの実施形態を説明する。しかしながら、これらすべての実施形態およびその説明は、データストリーム10から指示44を読み取りまたは復号するように構成されていないデコーダにも適用できることを理解すべきである。換言すれば、後述する実施形態は、指示44がデータストリーム内に存在し、デコーダ22がデータストリーム10から指示を読み取るように構成されている場合に限定されない。むしろ、本出願のさらなる態様の後述する実施形態は、サブピクチャのランダムアクセスポイント符号化または非ランダムアクセスポイント符号化などの特定の設定が1つのピクチャ内で変化するという事実に対処することができるデコーダの記述としても、同時に解釈されるべきである。しかしながら、これらデコーダは、指示44に応じて異なる動作をする
図2のデコーダ22に関して真実であるように、いかなる特定の代替機能を持たなくてもよい。
【0038】
これまでに説明したことについて簡単に要約すると、
図2が示す概念は、符号化されたビデオシーケンスの連結であるCVSのために、符号化されたビデオシーケンスレベルまたはビットストリームレベルでのシグナリングなどの高レベルシグナリングのような、データストリーム10内における追加的な指示44が、NALユニットタイプシグナリングなどのNALユニットレベルシグナリングを、サブピクチャ・ランダムアクセス指示として再解釈可能とすることである。例えば、指示44は、sub_picture_random_access_process_enabled_flagと称され得るフラグの形態で信号伝達されることができる。例えば、このフラグがゼロに等しい場合、ランダムアクセス機能を示すNALユニットタイプは、デコーダ22によって、全ピクチャレベルのランダムアクセスとして解釈されるであろう。他方、フラグの値が1に等しい場合、それぞれのNALユニットタイプはサブピクチャ・ランダムアクセスポイントとして解釈されるであろう。
【0039】
代替的に、指示44は、アクセスユニットごとのシグナリングとして実施することができる。例えば、アクセスユニット・デリミッタNALユニットは、そのアクセスユニット・デリミッタNALユニットから開始するアクセスユニット内で、どのタイプのランダムアクセスが許可されるのかを示すために使用され得る。以下の状態のいずれかを示すシンタックス要素を、そのようなアクセスユニット・デリミッタNALユニットに追加することができる。すなわち、(1)デリミッタが属するアクセスユニットのピクチャの全てのサブピクチャ24が1つのランダムアクセスピクチャ(IRAP)を含む状態、(2)幾つかのサブピクチャ24が1つのランダムアクセスピクチャ(IRAP)を含んでもよい状態、(3)サブピクチャ24のいずれもランダムアクセスピクチャ(IRAP)を含まない状態。
【0040】
指示44を使用して、デコーダは、指示44の範囲、すなわち指示44が関係する範囲を画定するセット42のピクチャ18にどの種類のランダムアクセス機能を適用できるか、および以下の実施形態に関して説明する以下のプロセスのうちの1つがデコーダ22によって実行されるべきかどうか、を容易に識別することができる。
【0041】
指示44がサブピクチャ粒度を示す場合にデコーダ22が何をするかについての説明を再開する前に、指示44がピクチャ粒度を示し、かつ指示44が属するセット42の任意のピクチャ18に関し、サブピクチャ関連情報40がそのピクチャの異なるサブピクチャ24について異なる状態を呈する場合、
図2のデコーダ22は、データストリーム10を不適合データストリームとして、即ちビデオコーデックに準拠していないものとして識別するように構成されてもよいことに留意すべきである。
【0042】
図3は、復号済みピクチャバッファをフラッシュすることに関するデコーダ22の挙動の実施形態を示し、そのバッファとは、参照ピクチャがその中にバッファリングされるバッファであり、参照ピクチャとは、未だ復号されていないピクチャがそれに基づいて予測され得るピクチャである。
図3の実線はサブピクチャ粒度の場合のデコーダ22の機能を示し、破線はピクチャ粒度の場合の対応する機能を示している。この場合も、
図3は、次の両方の場合の説明として扱われるべきであることに留意されたい。つまり、指示44を復号し、かつ
図3に示すいずれかのモードに従って動作可能な、
図2に関して説明したデコーダについて上述した機能の拡張、又は、データストリーム10が指示44を含まず、デコーダ22が必然的にサブピクチャ粒度モードに従って動作する場合の代替デコーダ22の説明である。
【0043】
図3に示すように、
図3の実施形態に係るデコーダ22は、特定のアクセスユニットまたは特定のピクチャ18について、ステップ50で示すように、サブピクチャ関連情報40がそのピクチャのすべてのサブピクチャ24についてランダムアクセスポイント状態であるかどうかをチェックするように構成される。その答えが真の場合、それに応じてデコーダは、復号済みピクチャバッファ48をステップ52でフラッシュする。この場合も、デコーダ22は、指示44がサブピクチャ粒度を示すピクチャ18に対し、ステップ50および52のこの機能を適用することができ、他方、指示44がピクチャ粒度を示す場合、
図3の破線で示される代替アプローチを適用できる。この代替アプローチに従えば、デコーダ22は、特定のアクセスユニットまたはピクチャ18について、アクセスユニット内またはそれぞれのピクチャの最初に遭遇したサブピクチャ24についてのサブピクチャ関連情報40が、ランダムアクセスポイント符号化であるかどうかをステップ54でチェックし、その答えが真の場合、それに応じてデコーダは、復号済みピクチャバッファ48をフラッシュ56する。復号済みピクチャバッファ48をフラッシュするためのデコーダ22の異なる挙動、すなわち指示44がサブピクチャ粒度を示す場合の挙動を一方とし、指示44がピクチャ粒度を示す場合の挙動を他方とした場合の異なる挙動によって、結果として、ステップ52又は56における復号済みピクチャバッファのフラッシングの異なるスケジューリングをもたらし得る。つまり、デコーダ22が、符号化済みピクチャバッファからアクセスユニット46のNALユニット34'を回収する時点に関連するスケジューリングのような、デコーダ22がそのアクセスユニット46の個々のNALユニット34'の復号を開始する時点に関連する異なるスケジューリングである。現在のアクセスユニットのすべてのサブピクチャがランダムアクセスポイントであることが明らかである場合、復号済みピクチャバッファ48のフラッシング、即ちサブピクチャ粒度ドメインでのフラッシングが、ステップ52において、復号順序58で最後のサブピクチャ24の1つ以上のNALユニット34'を復号するときに実行され得る。他方で、ステップ56の場合、つまりピクチャ粒度ドメインにおける復号済みピクチャバッファ48のフラッシングは、符号化/復号化順序58で最初のサブピクチャの24の1つ以上のNALユニット34'を復号するときに、実行され得る。つまり、そのサブピクチャに関してデータストリーム内に存在するサブピクチャ関連情報40がランダムアクセスポイント符号化を示すことが明らかである場合、現在のピクチャまたはアクセスユニットの符号化/復号化順序58で2番目のサブピクチャ24を復号する前でも、フラッシングが実行され得る。ここでも、
図3に関してピクチャ粒度モードに関連して説明した機能は、指示44が存在しない代替的な実施形態によれば、デコーダ22内に実装されなくてもよい。
【0044】
すなわち、
図3は、データストリーム10内の特定のピクチャのすべてのサブピクチャ24がサブピクチャ・ランダムアクセスポイントであり、従ってピクチャ全体がランダムアクセスポイントそのものであることが明確である場合にのみ、デコーダ22の復号済みピクチャバッファ48をフラッシュし、ランダムアクセスポイント操作を実行するよう、復号プロセスが変更される実施例を説明したものである。従って、デコーダ22は、現在のアクセスユニットが完全なランダムアクセスポイントであるかどうかを決定するために、このアクセスユニット内の最後のNALユニット34’まで復号するように構成されてもよい。
【0045】
図4に関して次に説明するデコーダの実施形態は、個々の参照ピクチャまたはまだ復号されていないピクチャには必要でない復号済みピクチャバッファ48に格納されたピクチャの、削除に関連するデコーダの機能/動作モードに焦点を合わせている。すなわち、
図3は、復号済みピクチャバッファ48のフラッシング、すなわち、それぞれの復号済みピクチャバッファ内で現在バッファリングされているすべてのピクチャの削除に焦点を合わせている一方で、
図4は、データストリーム10が参照ピクチャバッファ記述を伝達し得る別の態様に焦点を合わせており、その記述とは、すなわち、まだ復号されていないピクチャのインター予測のための可能な基礎として役立つように、復号済みピクチャバッファ48内に残るべき参照ピクチャに関する情報である。この目的のために、データストリーム10は、情報がピクチャごとまたはアクセスユニットごとに更新される、参照ピクチャのセットに関する情報を伝達する。サブピクチャ関連情報40と同様に、将来の使用のために復号済みピクチャバッファ内に維持されるべき参照ピクチャセットに関するこの情報、すなわち参照ピクチャバッファ記述は、各サブピクチャ24についてデータストリーム10内で、即ちその対応する1つ以上のNALユニット34’内で、シグナリングされるものである。
図4に実線および破線を使用して示した変形例によれば、この参照ピクチャバッファ記述は、RAPおよび非RAP符号化を示すためのサブピクチャ関連情報40に関してこれまで説明してきたように、指示44に応じて同様の制約を受ける情報であり得る。したがって、参照ピクチャバッファ記述を
図2に参照記号40'を使用して示した理由は、指示44に依存する制約に関する類似性を示すため、または指示44に対して代替的または追加的に存在し得る類似的な指示として表すためである。特に、特定のピクチャ18の最初のサブピクチャ24に対してバッファ記述40'によって示される参照ピクチャのセットは、同じピクチャ18の他の任意のサブピクチャ24に対してバッファ記述40'によって示される参照ピクチャのセットと等しいことが要件とされてもよいし、または少なくとも、そのピクチャ18の符号化/復号化順序58で2番目以降のサブピクチャについての参照ピクチャバッファ記述40'によって示されるすべての参照ピクチャを含むことが要件とされてもよい。サブピクチャ粒度を示す指示44(または参照ピクチャバッファリング処理についての対応する指示)の場合、1つのピクチャ18の様々なサブピクチャ24についてのバッファ記述40'によって示される参照ピクチャセットのセットは、任意の方法で互いに自由に異なることができ、すなわち、参照ピクチャの相互に異なるセットを示してもよい。相互の違いは、1つのピクチャ内のサブピクチャと、後続のピクチャ内のそれらに対応する後継サブピクチャとが、異なる参照ピクチャを必要とする、即ち異なる参照ピクチャのセットを必要とすることを意味する。なぜなら、例えば、予測参照に由来するそれらの対応する前任サブピクチャが、参照ピクチャの相互に異なるセットの中に含まれているからである。サブピクチャの相互対応は、例えば、それらの起源に起因している。すなわち、それらサブピクチャは、サブビデオ28として対応するサブストリーム32に別個に符号化されていた可能性がある。後者の自由度によって、NALユニットをまとめてデータストリーム10の1つのアクセスユニットを形成する際に、参照ピクチャバッファ記述40'を変更なしで単純に引き継ぐことにより、合成器/統合器がサブストリーム32のリザーバのNALユニット34に基づいてデータストリーム10を合成することが可能になる。よって、参照ピクチャバッファ記述40'は、最終データストリーム10内のNALユニット34'とサブストリーム32のリザーバ内のNALユニット34の間で同一となるであろう。
【0046】
つまりこれは、図の実施形態のデータストリームが必ずしもサブピクチャ関連情報40を含まないことを意味していることを、
図4の説明を再開する前に述べておく。
図2に関して説明した実施形態は、参照ピクチャバッファ記述40’を含んでもよいし、又は含まなくてもよい。次に、
図3に関して上述したことと同様に、
図4の説明は、
図2および
図3に関してこれまでに説明した実施形態の可能な拡張/修正を説明するものとして、また、デコーダが
図4内で実線を使用して示される機能だけを実施する自己完結型の実施形態として、解釈されてもよい。つまり、特に指示44は、データストリームに存在しなくてもよい。
【0047】
図4によれば、デコーダ22は、以下のように、復号済みピクチャバッファ48からピクチャ削除を実行するように構成される。特に、デコーダは、ステップ60において、まだ復号されていないピクチャのための予測参照として機能するために復号済みピクチャバッファ48内に残るべき、復号済みピクチャバッファ48内のピクチャをマークし、さらにステップ62において、復号済みピクチャバッファ48内のマークされていない参照ピクチャ、即ちマークなしで、かつデコーダによる将来の表示/出力に必要とされない参照ピクチャを削除する作業を、各ピクチャに対してこれらステップ60および62を巡回的に行うことによって実行する。しかしながら、マーキング60を実行するために、デコーダは、現在のアクセスユニットまたは現在のピクチャの各サブピクチャiについて、参照ピクチャセットRefPiを示すバッファ記述40’復号する(64)。次に、ステップ60でマークされるべき復号済みバッファ48内のピクチャは、現在のアクセスユニットまたはピクチャのすべてのサブピクチャに対してセットRefPiの和集合を形成することによって識別される(66)。したがって、
図4に示される、ステップ62における復号済みピクチャバッファ内のマークされていない参照ピクチャの削除は、現在のアクセスユニットまたはピクチャの符号化/復号化順序で最後のサブピクチャ24を復号するときに行われ得る。すなわち、削除62は、現在のピクチャのすべてのサブピクチャ24を解析した後、または復号した後、または少なくともすべてのサブピクチャ28を、より正確にはすべてのNALユニット34'を、復号済みピクチャバッファから獲得した後に実行してもよい。当然ながら、マークされていないピクチャは、出力に必要のない場合にのみ削除される。なぜなら、出力ピクチャでないか又は既に出力されたかのいずれかだからである。
【0048】
ステップ60~66に関して説明したサブピクチャ粒度モード、および
図4の破線で示すピクチャ粒度モードで動作できるデコーダ22の場合、つまり両モードの間でデコーダ22が指示44に応じて切替え可能である場合、デコーダ22は、復号済みピクチャバッファからピクチャを削除する際に、代替的に以下のように動作することができる。特に、ピクチャ粒度モードが活性である場合、デコーダ22は、依然として、復号済みピクチャバッファ48内に維持されるべき参照ピクチャのマーキング68と、ステップ70における復号済みピクチャバッファ48からのマークされていない参照ピクチャの削除とを、アクセスユニット/ピクチャ毎に実行できるが、しかし、マークされるべき参照ピクチャを決定するために、かつ削除70のスケジューリングに関しては、異なる挙動が適用され得る。特に、デコーダは、ステップ72において、符号化/復号化順序58で最初に遭遇したサブピクチャ28の参照ピクチャのセットについて通知するバッファ記述を復号し、ステップ68において、マークされるべき参照ピクチャをそのセットとして、即ち復号化/符号化順序に対応するインデックスの場合はRefP1として、識別(74)してもよい。当然ながら、デコーダ22はまた、現在のアクセスユニットまたは現在のピクチャの符号化/復号化順序58における最初のサブピクチャではなく他のサブピクチャについて、データストリーム10から参照ピクチャバッファ記述40'を読み出し/復号することもできるが、しかしこの情報はステップ68におけるマーキングには利用されない。さらに、ステップ70でのマークされていない参照ピクチャの削除は、符号化/復号化順序58で2番目のサブピクチャを復号する前に、または換言すれば、符号化/復号化順序58で最初のサブピクチャを解析しまたは復号した後に、行うことができる。当然ながら、マークされていないピクチャは、出力に必要のない場合にのみ削除される。なぜなら、出力ピクチャでないか又は既に出力されたかのいずれかだからである。
【0049】
上述した可能性に従って、デコーダ22が、特定のアクセスユニットについて符号化/復号化順序58の最初のサブピクチャ以外のサブピクチャ28に関する参照ピクチャバッファ記述をも読み出す場合、デコーダ22は、データストリーム10を不適合データストリームとして識別するよう構成されてもよく、その場合、符号化/復号化順序58で最初のサブピクチャ以外の任意のサブピクチャ28のバッファ記述40'によって示される参照ピクチャのセットは、そのピクチャの最初のサブピクチャ24のバッファ記述40'によって示される参照ピクチャのセットに含まれない参照ピクチャを含んでいる。
【0050】
図5は、
図4に関して叙上で概説された概念に関する代替案を示している。
図4に従えば、復号済みピクチャバッファ48は、ピクチャの単位で空にされてきた。サブピクチャ粒度モードに従って、出力用としてもいずれかのサブピクチャの参照用としても不要になったピクチャのみを削除するために、対策が講じられてきた。
図5の実施形態によれば、デコーダ22は、サブピクチャ24の単位で復号済みピクチャバッファ48を空にする操作を実行することができる。前述の実施形態に対するこの実施形態の可能な組み合わせに関して、
図4に関して上記で提供されたのと同じモードが適用される。すなわち、
図5に関して次に説明する実施形態は、
図2または
図3のデコーダの説明と組み合わせることができ、したがって、
図5に従って実装されるデコーダは、例えば指示44に応答するなど、ピクチャ粒度モードで代替的に動作するように構成されても、構成されなくてもよい。
【0051】
図5による概念を次に説明する。特に、デコーダ22によって復号されるデータストリーム10は、その中に符号化されたビデオ16を有し、その符号化方法は、ビデオピクチャ18が、空間的に重複しないサブピクチャ24または異なるサブビデオに属するサブピクチャが互いに独立して符号化されるように、符号化された互いに整列されたサブピクチャ24へと、常にサブ分割されるような方法である。つまり、この符号化はサブビデオ28内で行われ、それによってサブストリーム32のリザーバをもたらせた。
図1に関して上述したように、各サブストリーム32は、その中に符号化されたそれぞれのサブビデオ28を有し、各サブビデオ28は、特定のサブピクチャ、すなわち、データストリーム10のビデオ16のピクチャ18内のサブピクチャ24の可能な候補を含む。サブストリーム32は、互いに独立して符号化されている。それらサブストリームは、サブピクチャ24ごとに、1つ以上のNALユニット34を含む。符号化プロセスの一部として、NALユニット34は、サブピクチャ識別子80をすでに所持していてもよい。すなわち、各NALユニット34は、サブストリーム32のリザーバ間の区別を可能にするために、そのようなサブピクチャ識別子80でタグ付けされてもよい。
図1に関して説明したように、符号化された現在のタイムスタンプの対応するサブピクチャを有するNALユニット34を使用するために、単に1つのサブセット、またはより正確にはサブストリーム32のリザーバの適切なサブセットが選択されてもよく、それらをまとめることによってデータストリーム10のアクセスユニット46を形成してもよい。それらをまとめる際に、データストリーム10をもたらすNALユニット34'は、依然としてその中にサブピクチャ識別子80を有する。
図5では、これは以下の方法で示されている。すなわち、ビットストリーム32のリザーバの識別子80は整数1…Nによって区別される。データストリーム10に符号化されたビデオ16のピクチャ18は、それぞれ6つのサブピクチャ24を有する。1つのピクチャ18内の各サブピクチャ24のために、データストリーム10は、対応するアクセスユニット46の中に1つ以上のNALユニット34’を有し、これらNALユニットはサブピクチャ識別子80Aiを使用してタグ付けされ、i=1…6であり、Ai∈{1…N}である。データストリーム10を合成するためにどのサブビデオ28またはどのサブストリーム32が選択されるかは、アプリケーションに依存してもよく、または時間的に一定であってもよく変化してもよい。さらに、各NALユニット34およびデータストリーム10にまとめられるそれらのバージョン34’は、上記の参照ピクチャバッファ記述40’を含むものとして示されている。サブストリーム32の別個の符号化のために明らかなように、この情報40’は、異なるサブストリーム32に対して異なっている。
【0052】
サブピクチャ24の単位で復号済みピクチャバッファ48を空にする操作を行う際に、デコーダ22は以下のように動作する。一般的に言えば、デコーダ22は、データストリーム10から、現在復号されているピクチャ18について、現在復号されているピクチャ18の各サブピクチャ24のための参照ピクチャのセットについてのバッファ記述40'を復号する。次に、現在復号されているピクチャ18のサブピクチャ24について、デコーダは、それぞれのサブピクチャ24のための参照ピクチャバッファ記述を使用して、復号済みピクチャバッファ48に残るべきである、それぞれのサブピクチャに空間的に併置された、即ち同じサブビデオ28に属する、復号済みピクチャバッファ48内のサブピクチャを識別する。他のサブピクチャは削除される。したがって、この削除はサブピクチャごとに実行される。
【0053】
図5に示されるように、ビデオデコーダは、この目的のために、デコーダピクチャバッファ48を論理的にサブピクチャDPB48
1~48
6に分割することができ、それらサブピクチャDPBは、ビデオ16のピクチャ18が現在空間的にサブ分割されている各サブピクチャ24にそれぞれ1つずつ対応する。補足として、ピクチャ18は、本出願の図の中では6つのサブピクチャに分割されるように示されているが、これは単に例示を目的としていることに留意されたい。他の数も同様に実行可能であり得る。サブピクチャDPB48
iの各々は、それぞれのサブピクチャDPBに関連付けられた特定のサブピクチャ識別子80によってタグ付けされたデータストリーム10内のNALユニット34'から出現するピクチャ18のサブピクチャ24をバッファリングするために使用される。換言すれば、デコーダ22は、各サブピクチャDPB48
iをある所定のサブピクチャ識別子A
iに関連付け、従って、各サブピクチャDPB48
iは、その所定のサブピクチャ識別子A
iに等しいサブピクチャ識別子80によってタグ付けされたNALユニット34’によって符号化された、前に符号化されたピクチャ18のサブピクチャをバッファリングするために排他的に使用される。現在復号されているピクチャに対し、デコーダ22は以下を行う。すなわち、各サブピクチャDPB48
iについて、デコーダ22は、現在復号されているピクチャ18が、それぞれのサブピクチャDPB48
iに関連付けられた所定のサブピクチャ識別子A
iと等しいサブピクチャ識別子80を持つ対応するサブピクチャ24を含むかどうか、を検査する。もし含む場合、デコーダ22は対応するサブピクチャについてそのバッファ記述40’によって示された参照ピクチャのセットを使用して、そのサブピクチャDPB48
iおよび復号済みピクチャバッファ48のサブピクチャDPB48
iにそれぞれ残るべき、それぞれのサブピクチャDPB48
i内のサブピクチャを識別する。これらのサブピクチャDPB48
i内にあるこれらのサブピクチャはすべて、そのサブピクチャDPB48
i内で、ある特定の識別可能なサブピクチャ識別子によってタグ付けされたNALユニット34'に符号化されたサブピクチャだけを収集することにより、同じサブビデオ28に属することになる。しかしながら、特定のサブピクチャDPB48
iについて、NALユニット34'が現在のアクセスユニットに存在せず、したがって、対応するサブピクチャ24が現在のピクチャ18に含まれない場合には、デコーダ22は、対応するサブピクチャDPB48
iをフラッシュし、それぞれのサブピクチャDPB48
iを、現在復号されているピクチャ18の対応しないサブピクチャ24の別の所定のサブピクチャ識別子に再割り当てする。その別の所定のサブピクチャ識別子は、すべてのサブピクチャDPB48
1~48
6の所定のサブピクチャ識別子と等しくないものである。フラッシュする代わりに、アプリケーションによるが、デコーダは、再割り当てされたサブピクチャDPBをフラッシュする代わりに、そこに含まれる参照サブピクチャを、サブピクチャDPBが再割り当てされた所定のサブピクチャ識別子のサブピクチャ24のための参照サブピクチャとして再利用するために、サブサンプリングなどにかけることができる。
【0054】
さらなる実施形態の説明を伴う本出願の説明に進む前に、
図4および
図5に関して上述した実施形態を、別の言葉で再度要約する。特に、
図4はフルピクチャダンピング(full picture dumping)の概念を示したが、
図5は部分ピクチャダンピングの実施形態を表した。両方の実施形態は、復号済みピクチャバッファを空にする操作が、ランダムアクセスポイントに応答せずに実行されるが、参照ピクチャバッファ記述、すなわち参照にもはや必要とされない参照ピクチャ/サブピクチャに関する情報に応じて実行される、という状況を扱う点で共通する。上述したように、ランダムアクセスポイントは、ピクチャ情報が参照のためにもはや必要でないと判断され、したがって(すでに出力されている場合)それぞれの復号済みピクチャバッファから削除することができる唯一のケースではない。AVCまたはHEVCにおいて、復号済みピクチャバッファ内のピクチャは、復号プロセス中に「参照に使用される」または「参照に使用されない」としてマークされる。例えば、HEVCにおいては、参照ピクチャセット(RPS)と呼ばれるシグナリングがある。RPSは、現在のピクチャまたは復号化順に後続するピクチャの参照のために、復号済みピクチャバッファ内のどのピクチャが使用されるかを示す。つまり、RPS(RefP)は、参照のために使用されるように、どのピクチャをマークすべきかをシグナリングする。RPSに表れないものは、「参照に使用されない」としてマークされ、よって、出力に必要ない場合(例えば、すでに出力されている場合)には、復号済みピクチャバッファから削除できる。
【0055】
上段で説明したように、一部のタイル/サブピクチャのみが高解像度から低解像度に、またはその逆に切り替えられる360°の場合、参照ピクチャが異なる可能性があるため、ランダムアクセスポイントが整列され得る。
【0056】
RAPの場合に関しては、いくつかのビットストリームが一緒につなぎ合わされたとき、すなわち、新たなビットストリーム10のサブピクチャ・ビットストリームに変換されたとき、RPSを書き直す必要があり、そのプロセスは、合成器/統合器14によって実行されるべきそのような操作の複雑さを増大させることになるであろう。
【0057】
新たなビデオコーデックが、参照ピクチャをマーキングする異なる方法を有してもよいが、次のような問題が常に当てはまるであろう。つまり、ビットストリーム内の異なるサブピクチャに対して異なる参照が適用される可能性があり、
図4の破線を用いて示すようにアクセスユニットの最初のスライス/タイルに対してマーキングプロセスが実行され、これがアクセスユニット内のすべてのスライス/タイルのすべての情報を伝達する必要がある場合、ストリームをマージするときにヘッダーの書き換えが必要になるであろう。
【0058】
図4および
図5の実施形態のアイデアは、したがって、復号済みピクチャバッファに対してサブピクチャのランダムアクセスまたはサブピクチャの供給および削除を可能にするために、参照ピクチャのマーキングのプロセスを変更することである。
【0059】
図4の実施形態によれば、復号済みピクチャバッファの削除は、依然としてピクチャの単位で行われるが、サブピクチャのランダムアクセスは依然として許可される。
図4の実施形態を実施する可能性に従えば、指示44のようなシーケンスまたはピクチャレベルでのシグナリングは、マーキングプロセスが
図4の破線を使用して示されるピクチャ粒度の方法で実行されるのか、又は現在のアクセスユニットの最後のサブピクチャのNALユニットまたはスライスまたはタイルを解析しまたは復号した後などのように、マーキングプロセスが現在のアクセスユニットの最後のサブピクチャの後でのみ実行されるのか、どうかを定義する。両方の方法間を切り替えるシグナリングは、sub_picture_management_process_enabled_flagの形式でSPSやPPSなどのパラメータセットに含まれ得る。
【0060】
上段で概説したように、両方のモード間の切り替えがオフになっている唯一のモードであり得るサブピクチャ処理の場合、そのプロセスは、一実装例に従えば、現在のピクチャ18の各サブピクチャ24についての時間的にマークされたピクチャリストを生成することを含み得る。その場合、最後に、どれが「参照に使用されない」とマークされているかがチェックされる。例えば、参照ピクチャ指示の例として、HEVCからのRPSシグナリング40’を使用した場合、復号済みピクチャバッファに残しておくべきピクチャを識別するために、次の擬似コードを使用できるであろう。
【0061】
N=number of pic in DPB.
Mark N pics as “not used for reference”
For i=0…NumSubPicBitstream
{
If Pic in active RPS => mark that picture as “as used for reference”
}
【0062】
現在のアクセスユニットのためのすべてのサブピクチャ・ビットストリームが復号されたとき、「参照に使用されない」とマークされかつすでに出力されたすべてのピクチャを、DPBから削除する。
【0063】
ただし、すべてのRPS情報を書き換えるアプローチと比較すると、このアプローチでは、復号済みピクチャバッファにより多くのメモリが必要になる。
【0064】
サブピクチャDPB削除モードに関する
図4の実施形態の代替的な一実施例において、最初のプロセスは、各ピクチャ開始時に、すなわち、最初のスライス/タイルまたはサブピクチャを処理するときに、すべてのピクチャを「参照に使用されない」とマークすることで実行され、加えて他方で、解析された各スライス/タイル/サブピクチャに対しては、スライス/タイル/サブピクチャごとに示されたピクチャを「参照に使用される」としてマークする別のプロセスが実行される。最終結果に応じた、つまり、最後のスライス/タイル/サブピクチャの解析/復号時の参照ピクチャダンピングは、参照ピクチャがすでに出力されており、かつ現在のピクチャのすべてのスライス/タイル/サブピクチャが伝送/受信された後に実行される。
【0065】
図5は、コンテンツが動き制約タイルすなわちMCTSを用いて符号化された場合、またはより一般的に言えば、空間的にオフセットされたサブピクチャから独立して符号化されたサブピクチャ、または異なるサブビデオに属するサブピクチャであって、同じピクチャのサブピクチャだけでなく他のピクチャのサブピクチャも含むサブピクチャである場合に関する。このような場合、サブピクチャ識別子を使用してサブピクチャ固有の領域にマークを付けて、復号済みピクチャバッファから削除できるようにすることができる。MCTSで符号化されたビットストリームは、それ自身を参照できるだけである。
【0066】
図5では、ピクチャ18のサブピクチャ領域を別々にマークする可能性が利用されている。サブピクチャが「参照に使用されない」とマークされ、そのピクチャがすでに出力されている場合、その領域は復号済みピクチャバッファから削除されてもよい。したがって、アクセスユニットのすべてのNALユニットを解析するまで待つ必要がなく、スライス/タイルグループまたはサブピクチャヘッダーにおいてNALユニットタイプとRPSを解析しながら、サブピクチャごとに個別にマーキングするプロセスを実行できるであろう。
【0067】
これは、データストリーム内の情報、例えばデータストリーム内で伝達される一部のパラメータセットに基づいて、複数のサブピクチャDPB48
iを初期化することによって、またはサブピクチャDPBの再割り当てによって、または(新たなサブビデオごとに)新たに発生する各サブピクチャ識別子に対してDPBスペースを割り当てることによって、
図5に従って行われる。初期化の後で、ピクチャ(再構成されたサンプルおよび動きベクトルなどの予測のための対応する参照可能なデータを意味する)は、サブピクチャ識別子A
iに対応するサブピクチャDPB48
iに格納されるであろう。サブピクチャ識別子A
iは、例えば、1つのタイルグループIDであり得る。
【0068】
次に、参照ピクチャセット、すなわち、復号済みピクチャバッファ48内に予測のために対応するIDと一緒にどのピクチャを保持する必要があるかを示すリストが解析され、それが、その対応するサブピクチャDPB内のサブピクチャが削除され得るかどうかに影響を与える。自明であるが、一部のシナリオでは、ピクチャ内のタイル設定が変更され得る。例えば、サブピクチャ・ビットストリーム統合シナリオでは、ある期間、ID0と1のサブピクチャがマージされ、その後、ID1と2のサブピクチャがマージされるようなことが発生し得る。このような場合、サブピクチャDPBは、パラメータセットの指示に基づいてフラッシュされる。活性化されたパラメータセットが前のサブピクチャIDを含まない場合は常に、そのサブピクチャに対応するサブピクチャDPBがフラッシュされる。明白ではあるが、ピクチャの削除は、ピクチャが出力を目的としていない場合、つまり、それらピクチャがすでに出力されているか、出力に必要なくなった場合にのみ行われる。
【0069】
図4および
図5に関していくつかの注記が必要である。例えば、
図5に関して上述したこと以外に、同時に管理されるサブピクチャDPBの数が、ビデオ16のピクチャ18内のサブピクチャ24の数を超える程度まで、サブピクチャDPBの管理を変更することが可能性であろう。例えば、サブストリーム32のリザーバ内で遭遇した、またはより正確には、データストリーム10内で遭遇した各サブピクチャ識別子80のために、デコーダ22は、別個のサブピクチャDPBを提供することができる。
【0070】
さらに、
図5の説明は、復号済みピクチャバッファを空にする操作に関するサブピクチャ粒度処理に焦点を当てていることに留意されたい。しかしながら、
図5は、それに応じて動作することができるデコーダを説明している一方で、
図5はまた、
図5に示される方法で、すなわち、サブピクチャ処理モードで動作すると共に、
図2に示す指示44または同等のシグナライゼーションに応答するなどしてピクチャ毎の処理モードでも動作できるデコーダの説明としても見られるべきである。その場合、
図5のデコーダ22は、復号済みピクチャバッファ48を、
図4に破線を使用して示される方法でピクチャ毎に管理することが可能であろう。
【0071】
上記のバッファ記述40’に関して言えば、それらバッファ記述は、リスト形式、又は対応する参照ピクチャをPOCなどを用いて示す分析用語形式などの任意の方法で、DPBに残るべき参照ピクチャを示し得ることに留意されたい。バッファ記述40’は、これらのピクチャを積極的に引用する場合もあれば、DPBから削除するべきピクチャを引用する場合もあり得る。
【0072】
さらに、
図4および
図5は、復号済みピクチャバッファの空洞化に焦点を当てたが、これら図のデコーダ22は、復号されたばかりのピクチャコンテンツを使用して復号済みピクチャバッファの充填を行うことが明らかである。例えば、
図4の場合において復号済みピクチャバッファ48の充填は、サブピクチャ処理のときはピクチャごとに実行され、つまりサブピクチャ処理およびピクチャごとの処理の両方の場合において、ピクチャごとに実行され得る。
図5ではサブピクチャごとのDBPの空洞化に焦点を当てたが、特定のサブピクチャが復号されるとすぐに、充填がサブピクチャごとに実行され、そのサブピクチャは対応するサブピクチャDPBに挿入される。当然ながら、復号済みピクチャバッファ48の充填がピクチャ毎に行われる代替的なアプローチもあり得、その場合には、現在復号されつつあるピクチャ18の復号済みサブピクチャ24が、現在のピクチャ18の復号の最後に、それらの対応するサブピクチャDPBに同時に挿入されるであろう。ピクチャごとのDPB空洞化モードの場合、
図5のデコーダは、
図4の対応するモードの1つとして(即ち、
図4の破線で示すように)作動し得る。
【0073】
さらに、復号済みピクチャバッファの処理に関連する上記の実施形態に関して、いくつかの簡単な注記が必要である。特に、これまで、ビデオ16のピクチャ18のサブピクチャ24は所定の方法でサブビデオのように符号化され得ることについて言及してきており、その方法は、サブピクチャが、それらが同じサブビデオに属する限り他のピクチャの他のサブピクチャに依存することができる一方で、任意の他のサブピクチャ、すなわち、同じピクチャ18の他のサブピクチャや異なるサブビデオに属する他のピクチャ18のサブピクチャからは独立している方法である。同じサブビデオに属するそのようなサブピクチャは、時間的にビデオ16のピクチャ18内のサブピクチャ位置を変える可能性がある。
図6はこの場合を示す。このような状況に対処するために、さまざまな可能性が存在する。
図6には、ビデオ16の2つのピクチャ18が例示的に示されている。1つのピクチャ18には、サブビデオに属するサブピクチャIDが2、7、3、4、5および6のサブピクチャ24が存在する。次のピクチャでは、サブピクチャIDが2、7、4、および5のサブビデオのサブピクチャ24がまだ存在しているが、サブピクチャ位置が異なることがわかる。サブピクチャID3および6を有するサブピクチャ24の代わりに、2つの新たなサブピクチャ、またはより正確には、新たなサブピクチャID9および12のサブピクチャが後のピクチャ内に存在する。
【0074】
ここで、後のピクチャ18bのサブピクチャ24であって、前のピクチャ18aでも発生するサブピクチャ識別子に属するサブピクチャが、ランダムアクセスポイント方式で符号化されておらず、さらに、ピクチャ18aのサブピクチャを参照すると仮定する。すなわち、ピクチャ18aの正しいサブピクチャ24は、ピクチャ18bを復号するときにデコーダ28の復号済みピクチャバッファ48に存在するであろうが、これらサブピクチャ識別子のピクチャ18bのサブピクチャ24の復号に関して予測を実行するべく、参照すなわち動き補償予測を正確に実行するために、手段を講じる必要がある。
【0075】
この問題を解決するための1つの可能性は、合成器/統合器14がそのような状況に参加することであり得る。それは、特許文献2に提示された技術を使用することができ、それによれば、出力しないピクチャ18cが合成器/統合器14によってデータストリーム10に挿入され、合成器/統合器14は、ピースごとに一定、つまり各サブピクチャ位置内で一定である動きベクトルフィールドを使用することにより、そのようなピクチャ18aのピクチャコンテンツを再配置して、後続のピクチャ18b内で依然として必要とされるサブピクチャ24が、この後続のピクチャ18b内で想定するそれらの新たなサブピクチャ位置に配置されるようにすることである。さらに、合成器/統合器14は、そのようなピクチャ18bについて、参照ピクチャとしてピクチャ18aを参照する代わりに、ピクチャ18cを参照ピクチャとして表明するようリダイレクトされるようにする。さらに、あるサブビデオに属するピクチャ18bのサブピクチャ24であって、そのサブビデオのサブピクチャがピクチャ18a内に存在しており、しかも出力しないピクチャ18cによってリダイレクトされたサブピクチャについては、動きベクトル予測を禁止すべきである。
【0076】
別の可能性は、
図6においてサブピクチャID2,7,4,5を有するピクチャ18bのサブピクチャのように、サブピクチャがそれらのサブピクチャ位置を変更するとき、新たな再配置された参照ピクチャを生成するために、デコーダ22はそのピクチャを復号済みピクチャバッファ内で再配置することであろう。このような手順によれば、復号済みピクチャバッファ内の参照ピクチャはそれらのサブピクチャへと空間的に分割され、サブピクチャは再スクランブルされるであろう。
図1に関して上述したように、そのような処理はまた、ピクチャ18b内のあるサブピクチャ24が同じピクチャコンテンツに属することが示される場合、空間リサンプリングを含み得るが、しかし、ピクチャ18aなどの以前のピクチャのサブピクチャと比べて空間分解能が低下するであろう。このようにして、あるピクチャ18aのサブピクチャレイアウトから新たなピクチャ18bのサブピクチャレイアウトへの移行は、出力ピクチャ18cを挿入することなく考慮され得るであろう。
【0077】
そして、さらに別の代替案は、デコーダ22が、ピクチャ18bのサブピクチャを符号化するために使用される動きベクトルをリダイレクトすることであり得る。デコーダ22は、参照ピクチャ18aに対するサブピクチャの位置変化を補償するために、ピクチャ18b内の再配置されたサブピクチャの動きベクトルの動きベクトルオフセットを生成することができる。動きベクトルオフセットは、ピクチャ18bのサブピクチャ24の復号に関与する動き補償予測において、ピクチャ18bのサブピクチャ24に属するサブストリーム、またはより正確には、ピクチャ18a内にもサブピクチャが存在するようなサブストリームの、符号化された動きベクトルに追加される。それにより、ピクチャ18aのこれらのサブピクチャのインター予測されたブロックの正しい予測子が導き出され、この予測子は、参照ピクチャ18a内の正しい位置を指し示している。すなわち、両方のピクチャ18aおよび18b内で示される、これらサブビデオに属するサブピクチャ内の正しい位置ではあるが、異なるサブピクチャ位置を示す。
【0078】
参照ピクチャに関する復号済みピクチャバッファ内でのサブピクチャ再配置と、デコーダ22によって実行され得る動きベクトルリダイレクトとは、ビデオ16のピクチャ18内の個々のサブピクチャ位置に対するサブピクチャ識別子の関連性において観察された変化によってトリガーされ得る。この関連性は、参照ピクチャおよびそれらのサブピクチャのデータストリーム10でのサブピクチャ再配置をそれに応じて記述している。代替的に、これらのプロセスは、例えばPPS内などで、合成器/統合器14によってデータストリームに書き込まれたデータストリーム10内の明示的なデータストリーム指示によって、トリガーされ得る。
【0079】
次に
図7に関して説明する実施形態は、
図1に関して上述したアプリケーションを、POC(picture order count;ピクチャ順序カウント)処理の観点から軽減するビデオコーデック環境を説明することを目的としている。したがって、
図7は、その中に符号化されたビデオを有するデータストリームを処理するためのデコーダの可能な機能を説明し、データストリームの中では、ピクチャ18がサブピクチャ24にサブ分割され、かつサブピクチャ24は、
図5などに関して上述したように、サブビデオ28の一部として互いに分離して符号化されている。
図7に関して説明する機能は、例えば
図2に関して説明した指示44などのようなサブピクチャ指示によってトリガーされる、デコーダ22の特定のモードであってもよい。特に、
図7は、ピクチャ18のサブピクチャ24について、データストリーム10内で異なるPOC値が伝送されることを可能にし、その結果、1つのピクチャ18内でさえ異なるPOC値が発生し得るようになる。
図7の機能がデコーダ22の1つのモードだけを表す場合、他のモードは、1つのピクチャ18に対して1つのPOC値だけが許可されることであり得る。
【0080】
データストリーム10が、
図1に関して説明したようにサブストリーム32のリザーバに基づいて合成される場合、例えば、対応するサブビデオ28内のサブピクチャ24の、表示時間順序20におけるピクチャ順序カウント(POC)展開は相違し得る。例えば、その相違は、サブビデオ24間の異なるフレームレートに起因し得る。ビデオ16は、当然ながら、ビデオ16に寄与するサブビデオ28の最小フレームレートを有するであろう。したがって、高いフレームレートのサブビデオ28の対応するピクチャは、データストリーム10を合成する際に、合成器/統合器14によってスキップされなければならないであろう。そのような高いフレームレートのサブビデオ28を対応するサブストリーム32へと符号化する際に、符号化プロセスは、当然ながら、そのようなピクチャが不要であることに注意すべきであろう。なぜなら、他のPまたはBピクチャのための参照ピクチャは残し、低いフレームレートのサブビデオ28のサブピクチャ24と共にビデオ16の合成に寄与するべきであるからである。追加的または代替的に、様々なサブビデオ28および対応するサブストリーム32内のサブピクチャ24のピクチャ順序カウント値の時間的展開におけるそのような相違は、それぞれ、これらのサブストリーム32の根底にある異なるGOP構造に起因し得る。例えば、異なるGOP長、すなわち、GOPごとに異なる数のサブピクチャ24が、異なるサブストリーム32に適用され得る。当然ながら、サブストリーム32をもたらす生成/符号化プロセスは、ビデオ16のピクチャ18の合成に寄与する、少なくとも対応するサブビデオ28のそれらサブピクチャ24に関する限り、それぞれのサブビデオ28およびサブストリーム32内でのそれら起こった順番で、表示時間順序20と符号化/復号化順序58の両方において一致するような方法で実行されなければならない。
【0081】
したがって、
図7は、その中に符号化されたサブビデオ28のサブピクチャ24を有する1つ以上のNALユニット34を示し、これらは、一緒にまとめることによってデータストリーム10の対応するアクセスユニット46に参加すべく使用されるように合成器/統合器14によって選出されたものであり、POC値90を与えられる。POC値は、例えばGOP(ピクチャのグループ)ベースの表示時間順序20で、それぞれのサブビデオ28内のサブピクチャ24を順序付ける。すなわち、NALユニット34内のGOP値90は、新たなGOPが開始されるたびに、順序を新たに開始してもよい。好ましくは、
図7の概念は、合成器/統合器14が、寄与サブストリーム32のNALユニット34をまとめて、データストリーム10のアクセスユニット46内に対応するNALユニット34'をもたらすときに、修正なしで、POC値90を単純に引き継ぐことを可能にする。ハッチングにより、
図7は、様々なサブビデオ28のサブピクチャ24およびそれらの対応するサブストリーム32内の対応するNALユニット34を示し、それらサブストリーム32は、ストリーム10内で対応するアクセスユニット46を一緒に形成するために、符号化/復号化順序58に関する1つの共通の時点および1つの共通の符号化/復号化ランクに対応している。現在復号されているピクチャ18または現在復号されているアクセスユニット46の異なるサブピクチャに対応するNALユニット34’間のPOC値90の違いを考慮するため、デコーダ22は次のように動作する。特に、デコーダ22は、データストリームから、現在復号されているピクチャ18の各サブピクチャ24について、NALユニット34’に含まれるPOC値90を復号する。さらに、デコーダ22は、現在復号されているピクチャ18の各サブピクチャ24について、またはより正確には、現在復号されているピクチャ18内のピクチャ24が由来する各サブビデオ28について、POC補正関数(POC correction function)94をパラメータ化するべき1つ以上のサブピクチャ間POC補償パラメータ92を管理し、このパラメータは、対応するサブビデオ28のPOC値90に適用されると、ビデオ16の各ピクチャ18に対して同じである最終POC値96をもたらす。一例によれば、データストリームの1つのアクセスユニット46内のNALユニット34'によって運ばれるPOC値90は、サブピクチャ24が属し、これらNALユニット34’に符号化されている、サブビデオの符号化に使用される異なるGOP長さに起因して異なっていてもよい。その場合、寄与しているサブビデオ28およびサブストリーム32が合成/統合中に変更されない限り、1つのアクセスユニット46内のPOC値90間の相互オフセットは、寄与サブストリーム32のGOPのどれもが新たなGOPを開始しない限り、連続するアクセスユニット46およびデータストリーム10にわたって一定である傾向がある。サブピクチャ間POC補償パラメータ92は、例えば、GOPの直近の開始に対応するサブビデオ28の現在のサブピクチャ24、即ちそのサブビデオ28内のIRAPサブピクチャ24の様々なサブストリーム32間の相違に対処するため、対応するサブビデオのPOC値90に対して関数94によって追加されるPOC補償オフセットを含み得る。新たなサブビデオ28がビデオ16のピクチャ18に寄与し始めるとき、または作動中のサブビデオ28の1つが、情報40がRAPをシグナリングするサブピクチャを有することによって新たなGOPを開始するときは常に、デコーダ22は、そのサブビデオまたはサブストリーム32のPOC補償オフセットを、比較に基づいて、すなわち差を計算することによって、それぞれ更新、計算またはリセットする。その際、任意のサブビデオ28またはサブストリーム32の任意の最終POC値96が、その時点のビデオ16内で、即ち同じアクセスユニット46内で維持され、そこではいずれのランダムアクセスポイント符号化も持たない。サブストリーム32間のフレームレート差のために、サブピクチャ間POC補償パラメータ92はまた、最終的なPOC値96を生成するために関数94を使用してPOC値90がスケーリングされる、係数を含み得る。そのようなフレームレート差に起因して、データストリーム10のアクセスユニット46内のPOC値90間の相互差は、そのPOC値が前述のPOC補償オフセットを使用してオフセット補償された後、POC値90の相互差と互いに関連している傾向があり、その相互差はPOCステップサイズ差に従って時間的にスケーリングする。このスケーリングされた差は、これらのPOC値を逆スケーリングすることによって補償される。デコーダ22は、そのようなスケーリング係数を、データストリーム10からパラメータ92の一部として導出してもよく、それら係数はサブビデオ28および対応するサブストリーム32の基底にあるフレームレートの評価に基づいて、それぞれ合成器/統合器14によってデータストリームの中に書き込まれたものであってもよい。
【0082】
したがって、簡単に要約すると、デコーダ22は、関数94をパラメータ化するためにPOC補償パラメータ92を管理してもよい。そのようにパラメータ化された関数94は、現在のピクチャ18の特定のサブピクチャ24に対応するPOC値90に適用されると、最終POC値96をもたらす。このようにして得られた最終POC値96は、ビデオ16の各ピクチャ18について互いに等しい。パラメータ92間のオフセットは、非RAPサブピクチャ24がそのピクチャ18またはアクセスユニット46にそれぞれ存在するという条件のもとで、上述の方法により、ランダムアクセスポイント・サブピクチャ24においてデコーダ22によって更新され得る。現在のピクチャ18のすべてのサブピクチャ24がランダムアクセスポイント符号化されている場合、デコーダ22は、そのオフセットをサブピクチャ24と等しい任意のデフォルト値に設定することができる。追加的または代替的に、RAPサブピクチャは、それ自身で、エンコーダ30を適切にパラメータ化することなどにより、同じデフォルトPOC値に設定されてもよい。この値はゼロでもよい。デコーダは、このエンコーダの制約の下で何もする必要はないであろう。しかしながら、エンコーダ30は、1つのピクチャ18のRAPサブピクチャ24のPOCを異なる値に自由に設定できるであろうし、そのような場合、デコーダは、これらのRAPサブピクチャのPOC値をゼロなどのデフォルトPOC値、または最初に遭遇したRAPサブピクチャに対してシグナリングされたPOC値90に等しい値に設定するように構成されてもよい。パラメータ92間のスケーリング係数は、1つのサブビデオ28がビデオ16の合成に新たに寄与するたびに、デコーダ22によって決定されてもよい。
【0083】
以下でさらに概説するように、デコーダ22は、対応するNALユニット34’からのサブピクチャ24を保持するためにデコーダ22によって実行される動きベクトル予測子スケーリングが正しく実行されるように、注意を払う必要があり得る。動き予測子スケーリングは、それぞれの動きベクトル予測子が使用されたブロックを含むピクチャに対するPOC距離aを有する参照ピクチャAに関連する動きベクトル予測子が、現在のピクチャの現在予測されているブロックのためのいくつかの必要なPOC距離bを参照するためにスケーリングされるとき、実行される。スケーリングは、それぞれのサブストリーム32のPOC定義に関連するPOC距離に関して実行されるべきであるため、このスケーリングは、依然として個々のサブストリームのPOC値90に基づいて、デコーダ22によって実行される必要があり得る。例えば、HEVC動きベクトル予測子スケーリングによれば、パラメータ92間のフレームレートスケール係数が2の累乗でなかった場合、異なる動きベクトルスケーリングが生じる可能性がある。
【0084】
すでに上述したように、上記の実施形態は互いに組み合わせることができる。これは、
図3、4、5および7に関して説明した実施形態のそれぞれを
図2の実施形態と組み合わせる場合にのみ真実である訳ではなく、
図3、4、5および7に関して説明した実施形態の間の二つの組み合わせ、三つの組み合わせまたは全ての組合せに関しても真実である。これらの概念のそれぞれは、
図1に関して概説したビデオ合成/統合の作業を遂行する際に、結果として得られるビデオコーデック概念の使用を緩和する。当然ながら、
図1に概説された例は、上記の実施形態に示されているビデオ符号化コーデックの例に限定されるものとして扱われるべきではない。
【0085】
本出願のさらなる態様に関係する本出願のさらなる実施形態であって、わずかに異なるトピック、すなわち段階的復号リフレッシュに関連するものの説明を開始する前に、
図7の実施形態を再度説明し、換言すれば注意喚起する。特に、すでに上段で概説したように、
図7の実施形態は、POCdelta導出に関する。サブピクチャ24について説明したように、各サブピクチャは、例えば、1つのタイルであり得るか、または(ジョイント・ビットストリーム10に適合する)タイルのセットは、整列されていないランダムアクセスポイントまたは異なる参照構造またはGOP構造を有し得る。上段で概説したように、そのような使用例は、例えば、最初に別々に符号化されたビットストリーム32が単一のデータストリーム10に一緒に統合されるときに起こり得る。
【0086】
そのような場合、各サブピクチャ24のサブビットストリーム32内に示されるPOC(ピクチャ順序カウント)は、1つの共通の時点に関連するか、または統合されたデータストリーム10内の1つの共通のアクセスユニット46に寄与するにも関わらず、異なる可能性がある。これが事実である場合、これは、ビットストリーム32内、すなわちNALユニット34内にシグナリングされたPOC値が、1つのアクセスユニットに対して1つのPOC値を生成するように、結果として生じる合成データストリームに統合され得るようにするため、合成器/統合によって書き換えられなければならないという負担につながる。
図7の実施形態は、この負担を軽減し、各サブピクチャ24のヘッダー、すなわちタイルグループヘッダーなどのNALユニットに符号化されるPOC値を調整することなく、そのようなサブピクチャサブストリーム32の統合を可能にする。
【0087】
POCは、アクセスユニットの境界の導出に使用される。すなわち、通常、POCは、スライスのグループまたはタイルグループまたはNALユニットをアクセスユニット46に関連付けるために使用される。これは、
図7のデコーダ22が
図2の実施形態と結合された場合の代替的挙動であり得る。つまり、
図7に記載された概念は、指示44がサブピクチャ粒度を示す場合にデコーダ22によって適用されるであろうし、一方、指示44がピクチャ粒度を示す場合には、デコーダ22は、各アクセスユニット46が、そのアクセスユニット46内で等しい単一のPOC値のみを有すると想定するであろう。ピクチャ粒度の場合、デコーダ22は、1つのNALユニットから別のNALユニットへのPOC値の変化に応答して、次のアクセスユニット46の開始を認識するであろう。
図7に記載されたサブピクチャ粒度の機能の場合、データストリーム10内の連続するアクセスユニットを分離するアクセスユニットインターフェイスの識別は、デコーダ22によって、例えば、合成器/統合器14によってデータストリーム10に挿入されたアクセスユニット・デリミッタに基づいて実行され得る。
【0088】
復号プロセスでPOC値が使用されるさまざまなプロセスの中には、ピクチャ出力がある。つまり、ピクチャは、昇順またはPOCの順序で、ピクチャ参照のため、つまり、ショートターム参照ピクチャまたはロングターム参照ピクチャのどちらを参照に使用するかを決定するために、出力される。
【0089】
図7に関して説明された実施形態は、同じアクセスユニット46内の各サブピクチャ24のNALユニット34’内においてPOCの異なる信号値を許可する一方で、複数のサブピクチャ24が同じデータストリーム10から復号されるとき、ピクチャ出力およびピクチャ参照の上記作業で最終的に使用されるPOC値96の正しい導出をも可能にする。典型的には、ランダムアクセスポイントはPOC値のリセットをもたらし、これによりデコーダがビットストリームの始まりにおいて復号プロセスを開始する。デコーダはIDRを発見すると、通常、そのピクチャに対してゼロのPOC値を割り当て、それに基づいて後続のピクチャのPOC値を導出する。次のアクセスユニットまたはそのアクセスユニット内のNALユニットには、(タイルグループ)ヘッダービットなどの情報が含まれており、それら情報はそれらが属するアクセスユニットのPOCをシグナリングする。典型的には、POCはスライス/タイルグループのヘッダー内のLSBビットでシグナリングされ、MSBビットはデコーダによって導出される。このプロセスは、
図7に概説されているシナリオに適用された場合、1つのアクセスユニットのサブピクチャが1つのアクセスユニット内の異なるPOCLSB値または異なるPOC LSB長を含むとき、アクセスユニット境界、参照ピクチャ、および出力順序の誤った導出につながり得る。
【0090】
図7に関して説明した実施形態は、異なるサブピクチャ・ビットストリーム32間の差を追跡する、サブピクチャごとのdeltaPOC計算を使用した。例えば、デコーダ22の復号プロセスが正規のフルピクチャIRAPで開始する場合、アクセスユニット46のすべてのNALユニット34’は、同じPOC値(NALPOC LSB)を運ぶ。この時点でPOC MSBは0に設定される。ここで、CVSの過程で、サブピクチャRAPが発生し、異なるNAL POC LSB、例えばゼロ値を伝送する可能性があり得るが、他方、そのアクセスユニット内の他のNALPOC LSBは変更されない(0に等しくない)ままである。サブピクチャRAPが上記のように、またはNALユニットタイプまたはSEIメッセージなどによる最新のシグナリングを介して認識されるときはいつでも、deltaPOCは、このサブピクチャについて、そのアクセスユニット内のIRAP NALU POC LSBとその他のNALUPOC LSBとの間の差として導出される。フルピクチャPOC96は、ピクチャ出力、ピクチャ参照などの上記の機能の基礎として、すべてのNALUに対して導出される。サブピクチャIRAPNALUを取り扱う場合、フルピクチャPOC96は非ゼロのdeltaPOCを組み込む一方で、残りの非サブピクチャIRAPNALUについては、フルピクチャPOC96の計算にそれぞれのゼロのdeltaPOCを組み込むことが、1つのアクセスユニット46のすべてのNALUについて同じフルピクチャPOC値96をもたらす。
図8は、一例を使用した
図7によるPOC補償を示し、ここでは、ビデオ16の4つの連続するピクチャ18a~18dが示され、それぞれが3つのサブピクチャ24にサブ分割されており、第1のピクチャ18aはIRAPピクチャ、すなわち、そのすべてのサブピクチャ24はランダムアクセスポイントであり、第2のピクチャ18bおよび第4のピクチャ18dは、それらのすべてのサブピクチャ24が非RAP符号化されている。第3のピクチャ18cは、ランダムアクセスポイント方式で符号化された1つのサブピクチャ24、すなわち
図8の上側のピクチャ24を有する一方で、その他のサブピクチャ24はそのような方式で符号化されていない。図を見てわかるように、
図8は、関数94の簡単な実例を示し、すなわち、POC補償パラメータを表す定数、即ち個々のサブピクチャ24内に表記する加算式の2番目の加数(addend)を用いた加算を示す。1番目の加数は、シグナリングされたPOC値、つまりパラメータ化可能な関数への入力を示し、結果として得られる合計は、最終POC値96に対応する。
図8に示すように、デコーダは、POC補償オフセットを、ピクチャ18cの非RAPサブピクチャ24の1つについての最終POC値から、RAPサブピクチャ24の送信されたPOC値を減算98することによって取得した。
【0091】
説明しているフルピクチャPOCスキームの導入は、SPS/PPSレベルフラグを介してゲートされてもよい。代替的に、deltaPOC値、すなわちPOC補償オフセットの暗黙的な導出の代わりに、データストリーム10内の1つのパラメータセットが、関数94によって各サブピクチャPOC値90に減算/加算されるべきdeltaPOCを示してもよく、その結果として得られるフルピクチャPOC96は、データストリーム10内の現在復号されているピクチャ18または現在のアクセスユニット46の各サブピクチャ24について整列されている。サブピクチャIRAPNALUがアクセスユニット46内にある場合、フルピクチャPOCを導出可能とするために追加的制約が必要な場合もあり得る。
【0092】
例えば、データストリーム10の要件、すなわちビットストリーム適合性の要件が以下のように求められてもよい。すなわち、少なくとも1つのサブピクチャ非IRAPNALUがアクセスユニット46に存在する、つまり各ピクチャ18の少なくとも1つのサブピクチャ24が非RAP方式で符号化されており、それにより現在のフルピクチャPOC96の導出が可能であり、これに従って、すべてのサブピクチャIRAPNALUのdeltaPOC、即ちPOC補償オフセットが導出されるべきである、という要件である。換言すれば、新たなNALユニットタイプであって、異なるNALユニットタイプを許可しないサブRAPがフラグを用いてシグナリングされる場合である。このような場合、このようなシグナリングは、NALユニットの1つが、NALユニットがサブRAPであると示されていない場合にのみ使用できる。
【0093】
別の解決策は次のとおりであり得る。1つのアクセスユニット46内のすべてのサブピクチャがサブピクチャIRAPであると認識されると、POCMSBがリセットされ、すべてのサブピクチャが同じフルピクチャPOCになるように、サブピクチャ24ごとのdeltaPOCが計算される。例えば、この場合の最初のサブピクチャdeltaPOCは0に設定され、他のすべてのサブピクチャdeltaPOCはそれに応じて、アクセスユニット内の最初のサブピクチャIRAPNALUに対し、フルピクチャPOC96をもたらすように設定される。
【0094】
また上段で説明したように、データストリーム10の合成に関与するサブストリーム32は、異なるPOCステップサイズのものであってもよい。これは、例えば、会議のシナリオで発生し得る。1つのストリームは30FPSで符号化され、他のサブストリーム32は60FPSで符号化され得る。このような場合、上記のように、最低の共通フレームレート、つまり30FPSで統合することが1つの選択肢である。この目的のために、60FPSサブストリーム32の最上位の時間レイヤをドロップして、フレームレートを30FPSに下げることができる。ただし、60FPSエンコーダは、30FPSエンコーダに比べて大きなPOCステップサイズを使用して、より多くのフレームを収容する必要があるため、2つのストリーム内の時間的に隣接するピクチャ間のPOCステップサイズは異なるであろう。複数のストリームが1つの共通のビットストリームに統合される上記のシナリオでは、正しいPOC導出を保証するように注意する必要がある。サブピクチャ・ビットストリームのPOCが異なるステップサイズを有する場合、
図7の実施形態は、符号化済みビデオシーケンス10内の個々のサブピクチャ24のPOC値90のスケーリングを強制することが可能である。例えば、統合器/合成器14は、入力サブピクチャ・ビットストリーム32から、POCステップサイズの違いを通知されるか、またはそれ自体を導出し、すべてのフルピクチャPOCを整列させるために、データストリーム10の合成に寄与するすべてのサブピクチャ・ビットストリームについて、それぞれのPOCスケーリング係数をパラメータセット内に書き込むであろう。
【0095】
更なる注意を上述したように、スケーリング済みフルピクチャPOCは、参照ピクチャの導出と出力順序のために使用されるが、他方、動きベクトルスケーリングは、スケーリングされていないPOCの差に応じて実行されるべきことに変わりはない。そうすることにより、当初のエンコーダによって想定されるような正確な動きベクトルスケーリングが実行される。
【0096】
デコーダ側において、個々のサブピクチャ24のすべてのPOC値90、すなわちスケーリングされていないPOCを追跡する代わりに、デコーダは、動きベクトルスケーリングのためのPOC差を導出するに際し、それぞれのPOCスケーリング係数を使用してスケーリングされたPOC値からも、動きベクトル候補スケーリングを実行するためにエンコーダ側で使用されたPOC値の差を導出することができる。
【0097】
さらに、パラメータ92間のPOCオフセット値は、デコーダによって自動的に決定されるように説明したが、代替的または追加的に、POCオフセット値は、POCスケーリング係数に関して上述したように、合成器/統合器14によってデータストリーム10に挿入され得る。
【0098】
図9に関し、本出願は、段階的な復号リフレッシュを可能にするビデオコーデックの一例の説明を進める。
図9は、この実施形態の根底にある概念を示している。
【0099】
特に、
図9は、ビデオ102の連続するピクチャ100、すなわち、それらの符号化/復号化順序58に沿って順序付けられた4つの連続するピクチャを示す。
図9は、ビデオ102をデータストリーム106へと符号化するエンコーダと、データストリーム106からビデオ102を復号または再構築するデコーダ108とを示す。その概念は以下の通りである。段階的な復号リフレッシュを可能にするために、ビデオデコーダ108は、ビデオ102の参照ピクチャのそれぞれについて、リフレッシュピクチャ領域および非リフレッシュピクチャ領域への、それぞれの参照ピクチャのサブ分割をログ(記録)する。特に、参照ピクチャは、復号化順序58で現在復号されているピクチャに先行するピクチャであって、現在復号されているピクチャまたは任意の後続のピクチャのための予測参照として利用可能なピクチャである。上述したリフレッシュピクチャ領域と非リフレッシュピクチャ領域は、以下の説明から明らかになるであろう。特に、デコーダ108は、データストリーム106から、特定のピクチャ100aについて
図9にクロスハッチングにより示されるリフレッシュ更新領域110に関する情報を復号する。
図9の実例では、そのリフレッシュ更新領域はピクチャ100aの左側の3分の1を包含している。エンコーダは、例えば、各ピクチャ100a~100dをそれぞれのアクセスユニット112a~112dへと符号化し、ピクチャ100aについてアクセスユニット112a内で、ピクチャ100a内にリフレッシュ更新領域110を配置する情報114をシグナリングする。リフレッシュ更新領域の指示114により、段階的復号リフレッシュを開始することができ、これにより、後段でより詳細に説明するように、ピクチャ100aといくつかの後続のピクチャとの符号化および復号化について、エンコーダ104とデコーダ108との両側で段階的復号リフレッシュを完了するまで、特別な手段が講じられる。
【0100】
特に、情報114によって配置された領域110は、エンコーダ104によってイントラ符号化のみによって符号化され、すなわち、ランダムアクセスポイント方式で符号化された領域を表し、したがって、デコーダ108は、それに応じて、つまりイントラ予測を使用して、リフレッシュ更新領域110を復号する。ピクチャ100aの他の領域、すなわち残りの領域116の符号化は、これ以上制限されず、以前のピクチャに基づくインター予測および/またはイントラ予測を使用して、エンコーダ104によって符号化されることができ、それに応じて復号化108によって復号されることができる。
【0101】
符号化/復号化順序58における次のピクチャ100bについては、段階的復号リフレッシュはまだ完了していない。エンコーダ104は、このピクチャ100bを対応するアクセスユニット112bへと符号化し、その中で再度、そのピクチャ100b内のリフレッシュ更新領域110に係る情報114をシグナリングする。
図9の例では、ピクチャ100bのリフレッシュ更新領域は、ピクチャ100bの水平方向の中央の3分の1をカバーし、したがって、前のピクチャ100aのリフレッシュ更新領域110に空間的に隣接している。アクセスユニット112a内の情報114が段階的復号リフレッシュを開始したのに対し、ピクチャ112bに関する情報114は、この開始された段階的復号リフレッシュの継続を表す。ピクチャ100bの領域110は、再び、イントラ予測のみによってエンコーダ104によって符号化され、デコーダ108によってそれに応じて復号される。しかしながら、開始された段階的復号リフレッシュの一部として、デコーダ108およびエンコーダ104は、以下の作業を実行する。最初に、エンコーダ104およびデコーダ108は、参照ピクチャのリフレッシュピクチャ領域の前述のロギングを実行する。ピクチャ100aで段階的復号リフレッシュが開始されており、ピクチャ100aが後続のピクチャ100bに対する参照ピクチャを形成するので、ピクチャ100aのリフレッシュ更新領域110は、ピクチャ100aのリフレッシュピクチャ領域を表す一方で、他の領域116は、非リフレッシュピクチャ領域である。リフレッシュピクチャ領域は、
図9に実線118によって囲まれることで示されている。第2に、デコーダ108およびエンコーダ104は、現在符号化/復号化されているピクチャ内、すなわち現在の記述ピクチャ100b内で、同じピクチャ100bのリフレッシュ更新領域110から分離され、かつ参照ピクチャ(ここではピクチャ100a)の非リフレッシュピクチャ領域から独立して符号化および復号化されるべき第1の領域120を決定する。エンコーダ104は、領域120がどこにあるかについての明示的なシグナリングを符号化してもよく、またはより好ましくは、エンコーダ104およびデコーダ108は、ピクチャ100a即ち符号化/復号化順序58における直前のピクチャのリフレッシュピクチャ領域118に対して並置される、ピクチャ100bの領域として、領域120を決定してもよい。リフレッシュ更新領域110から領域120を区別するために、リフレッシュ更新領域110は
図9内でクロスハッチングを使用して示され、単純なハッチングは領域120のために使用されている。
【0102】
エンコーダとデコーダは、領域120を対応するアクセスユニット112bに符号化し、それから復号するために、特別な手段を講じる。特に、エンコーダ104は、例えば、領域120の予測がエンコーダおよびデコーダによって導出されるときの基礎となる符号化パラメータのシグナリング可能なドメインを制限しない。言い換えれば、エンコーダ104は、動き補償予測のような、前のピクチャからこれらピクチャの予測を決定する符号化パラメータを使用して、およびこの予測が修正されるべきときに用いる予測残差を記述する予測残差情報を使用して、ピクチャを対応するアクセスユニットに符号化する。符号化パラメータと予測残差情報は、対応するピクチャを記述するためにアクセスユニット内へと符号化される。しかしながら、リフレッシュ更新領域110内では、エンコーダ104は、イントラ予測を排他的に使用する、すなわち、他の任意のピクチャからの予測は使用されない。領域120に関しては、エンコーダ104はインター予測を使用し、例えば、符号化パラメータのシグナリング可能なドメインを制限しないが、領域116などの他の領域と比較して、シグナリングされた符号化パラメータに基づいて領域120の予測を導出する異なる方法が、エンコーダ104およびデコーダ108によって使用される。特に、それぞれの参照ピクチャ、ここではピクチャ100aのリフレッシュピクチャ領域110の位置が考慮される。例えば、エンコーダ104は、領域120について、予測導出が変更されない場合に、領域120の領域116への依存性をもたらし得る動きベクトルをデータストリーム106に自由に符号化することができる。すなわち、領域116の中に延びる参照ピクチャ100aの部分を実際に指し示す動きベクトルを、符号化することができる。同様に、エンコーダ104は、領域120の動きベクトルを符号化するために動きベクトル予測を使用してもよいが、ピクチャ100aを符号化するために使用される動きベクトルによって形成される動きベクトル予測子候補の対応する動きベクトル予測リストを解釈/構築するにあたって、エンコーダ104は、リフレッシュピクチャ領域110内のブロックに使用される動きベクトルを排他的に使用して、これらの動きベクトル予測子候補リストに排他的に含める。エンコーダ104が、シグナリング可能な状態であって、実際には領域120の符号化パラメータの他の状態によっても実際にシグナリング可能であったであろうと見られる領域120の予測導出結果へとリダイレクトされる状態を使用し得るという可能性により、エンコーダ104に圧縮効率を高める可能性が提供される。なぜなら、例えば、後でエンコーダ104およびデコーダ108によって他の状態にリダイレクトされ、更新されたピクチャ領域110のみに依存する予測につながる符号化パラメータ状態は、エンコーダ104およびデコーダ108によるリダイレクトなしにこの予測を直に記述する符号化パラメータ状態と比較して、少ないビットを使用して符号化できるある状態を含み得るからである。すなわち、エンコーダ104およびデコーダ108は、例えば、領域120のためにデータストリーム106内で実際にシグナリングされた動きベクトルを、参照ピクチャ100aのリフレッシュピクチャ領域110の境界を越えて延伸しないように、クリップすることができる。代替的または追加的に、エンコーダおよびデコーダ108は、リフレッシュピクチャ領域110の境界を超える、領域120のためにデータストリーム106内でシグナリングされた動きベクトルによって指し示された参照ピクチャ100aの部分に対し、パディングを使用してもよい。更に代替的または追加的に、エンコーダ104およびデコーダ108によって行われる動きベクトル候補リストの構築は、参照ピクチャ100a内のリフレッシュピクチャ領域110の外側にあるそのようなリストを含めることから動きベクトルを除外するような方法で行うことができる。エンコーダ104は、例えば、デコーダ108に対し、データストリーム106内でシグナリングすることによって選択された動きベクトル予測子をシグナリングしてもよく、それに応じて解釈/構築されるそのような動きベクトル候補リストにインデックスを付けることができる。ピクチャ100bの残りの領域、つまり
図9の場合はピクチャ100bの右側3分の1は、このピクチャ100bの第1の領域120およびリフレッシュ更新領域110とは分離された領域116であって、ピクチャ100aのリフレッシュピクチャ領域110に対して制限のないインター予測を含む、エンコーダ104によって符号化される領域を表す。すなわち、ピクチャ100bの領域116は、制限のないインター予測領域である。
【0103】
続いて符号化/復号化されるピクチャ100cは、
図9の例では、ピクチャ100aで開始された段階的復号リフレッシュの完了を表す。エンコーダ104は、このピクチャ100cのために、対応するアクセスユニット112cの中にピクチャ100cのリフレッシュ更新領域110の位置を示す情報114を符号化し、このリフレッシュ更新領域は、
図9の場合、ピクチャ100cの右側3分の1をカバーする。すなわち、
図9は、段階的復号リフレッシュの開始を表すピクチャ100aから始まる連続ピクチャ100a~100cのリフレッシュ更新領域110が、ビデオ102のピクチャのピクチャ領域の相互に分離された部分を呈していることを示している。このピクチャ110も、エンコーダ104によってイントラ符号化され、それに応じてデコーダ108によって復号される。
【0104】
ピクチャ100cに対し、ピクチャ100bもまた参照ピクチャを表す。そのリフレッシュピクチャ領域118は、エンコーダおよびデコーダによって、ピクチャ100bの第1の領域120およびリフレッシュ更新領域110の和集合として決定される。これはまた、段階的復号リフレッシュの間に、リフレッシュピクチャ領域118が継続的に成長することを意味する。この場合も、エンコーダ104およびデコーダ108は、例えば、直前のピクチャ、即ちピクチャ100bのリフレッシュピクチャ領域110と空間的に重なる領域となるように、ピクチャ100cの第1の領域120を決定する。この領域120は、ピクチャ100bの領域120に関して前述したように符号化/復号化されるが、この領域120は、2つの参照ピクチャ候補、すなわち、リフレッシュピクチャ領域118を有するピクチャ100aと、リフレッシュピクチャ領域118を有するピクチャ100bとを持たなければならないという違いがある。領域120にはインター予測が使用され、つまり、それはイントラ予測モードのほかに許可された符号化モードであるが、ピクチャ100cの領域120についての符号化パラメータは、結果としての予測が、ピクチャ100aおよび100bのリフレッシュされていない領域116から、領域120の符号化/復号化の依存を生じさせないような状態にリダイレクトされる。
【0105】
ピクチャ100c以降については、ピクチャ100aでエンコーダ104によって開始された段階的復号リフレッシュが完了し、リフレッシュピクチャ領域118は、そのピクチャ100c以降、ビデオ102のピクチャである完全なピクチャをカバーする。間欠的または周期的に、エンコーダ104は、別の段階的復号リフレッシュを開始することができ、その後続の段階的復号リフレッシュの最初の開始ピクチャのリフレッシュ更新領域110に対応するように、リフレッシュピクチャ領域は崩壊するであろう。
【0106】
図9に関して説明されたような段階的復号リフレッシュは、サブピクチャ・イントラリフレッシュ・パディングとして説明され得る。それは、タイルまたはタイルグループを使用して実装することも、タイルを使用せずに実装することもできる。
図9の実施形態では、サブピクチャと呼ばれ得るピクチャのいくつかの部分、すなわち領域110は、イントラ符号化を適用することによってリフレッシュされ、一方、後続のピクチャは、制約付きの方法でインター符号化およびインター復号化される。
図9の例に従えば、ピクチャは列に分割されており、ここでは、例示的にN=3の列に分割されていていた。しかしながら、ここで明確にすべきは、列の数Nは異なるように選択でき、また、そのような段階的復号リフレッシュ間のリフレッシュピクチャ領域118の成長の異なる形態、即ちピクチャの列ではなくブロック単位での成長など、異なる成長の形態でさえも選択できることである。
図9に関して説明したように、最初のサブピクチャRAP、すなわちアクセスユニット0のピクチャ、
図9の場合のピクチャ100aにおいて、第1の列は、それをcolldx=0とすると、イントラブロック内でのみ符号化される。
【0107】
次のアクセスユニットAU=1、つまり
図9の符号化/復号化順序58で2番目のピクチャ100bにおいて、2番目の列、即ちcolldx=1は、イントラブロックのみを用いて符号化され、1番目の列は、前のピクチャの列colldx=0で復号されたサンプルのみを参照できるインター符号化ブロックを用いて符号化される。しかしながら、エンコーダがデータストリーム内で符号化できるように動きベクトルを制約する代わりに、
図9の実施形態はまた、列colldx=0のときに他の領域への依存性を実際にもたらすような動きベクトルを自由に符号化できる。特に、
図9の実施形態によれば、イントラリフレッシュ領域、すなわちこの例の第1の列が示され、最も外側のピクセルラインの直交外挿(orthogonal extrapolation)などのパディングが、インター符号化ブロックの参照ブロックのために使用され、それらインター符号化ブロックは、動きベクトルが指示する場合、アクセスユニット1のピクチャの列colldx=0を超えるブロックである。領域の指示に基づく動きベクトルクリッピングを代替的または追加的に適用することで、リフレッシュされる領域の動きベクトルがリフレッシュされない領域に依存しないことを保証することができる。ピクチャが連続的に復号されるにつれて、リフレッシュされた領域118が増加し、したがって、ピクチャごとにリフレッシュされた領域110が示される。
【0108】
図9の代替案は、エンコーダ104が、連続するピクチャ100a~100cの更新リフレッシュ領域110の連続する位置、すなわち、段階的な復号リフレッシュを形成するピクチャのシーケンスの位置を、これら領域110のパターンを示すことによって、シグナリングすることであろうという点に留意されたい。このパターンは、リフレッシングを説明するであろう。シーケンスごとの領域も示され得る。したがって、この種の情報は、ピクチャ100a、すなわち、GDRシーケンス100a~100cの開始ピクチャに対して1回シグナリングされることができ、それによって、GDR開始をシグナリングし、また、ピクチャ100a~cについて領域110をシグナリングできる。前者の指示は、PPSで指示できる何かであってもよい。代替的に、GDR開始指示は、ピクチャ100aに関し、そのPPS内などでシグナリングされてもよく、一方、そのようなGDR開始ピクチャから始まるGDRピクチャシーケンスにおける領域110の位置のパターンは、SPS内でなど、より高いレベルでシグナリングされる何かであってもよい。
【0109】
上記の実施形態に関して、さらなる注意点を以下に述べる。上記の実施形態は、有利なビデオコーデックの概念を提示している。それらの多くは、上で概説したように有利なビデオ合成を可能にする。しかしながら、エンコーダは、上記の本発明のデータストリーム10のいずれかを直接的に、すなわち、事前に符号化されたサブストリームの合成なしに、形成してもよいことに留意されたい。エンコーダは、そのような作業において、RAP時点および参照ピクチャバッファ記述をピクチャ全体ではなくサブピクチャごとに選択する可能性など、上記説明に存在するデータストリーム10の有利な特性を利用してもよい。
【0110】
したがって、上記の実施形態はまた、データストリーム10からピクチャ18のビデオ16を復号するビデオデコーダ(および対応するビデオエンコーダおよびデータストリーム)に関連し、データストリーム10は、ピクチャが空間的にサブ分割されているサブピクチャ24が互いに独立して符号化される方法でその中に符号化されたビデオを有するものである。このビデオデコーダは、データストリームから、ビデオの1つ以上のピクチャのセット42の各ピクチャの各サブピクチャについて、シンタックス要素nal_unit_typeなどのサブピクチャ関連情報40を復号するように構成され、その関連情報40は、状態IDR_N_LPなどの第1の状態であるときは、それぞれのサブピクチャをランダムアクセスポイント方式で符号化されていると識別し、状態TRAIL_NUTなどの第2の状態であるときは、それぞれのサブピクチャをランダムアクセスポイント方式で符号化されていないと識別する。デコーダは、データストリームから、シンタックス要素mixed_nalu_types_in_pic_flagがそれらのPPSに含まれている1つ以上のピクチャのセット42について、ランダムアクセスポイント・シグナリング粒度指示44を復号し、この指示はmixed_nalu_types_in_pic_flagと称されてもよく、これが第1の粒度または0などの第1の状態であるときは、1つ以上のピクチャのセットの各ピクチャについて、サブピクチャ関連情報が、それぞれのピクチャのすべてのサブピクチャに対してIDR_N_LPなどの1つの共通の状態であることを示し、第2の粒度または1などの第2の状態を呈するときは、1つ以上のピクチャのセットの各ピクチャについて、サブピクチャ関連情報が、それぞれのピクチャのサブピクチャに対して異なる状態、例えば、同じピクチャ内で、少なくとも1つのサブピクチャについてIDR_N_LPであり、少なくとも1つの他のサブピクチャについてTRAIL_NUTである状態をとり得ることを示す。言い換えると、mixed_nalu_types_in_pic_flagが0に等しいなどの第1の状態である場合、nal_unit_typeの値が、1つのピクチャのすべての符号化済みスライスNALユニット、つまり1つのピクチャ内のすべてのサブピクチャについて同じであることを示し得る。しかし、それ以外の場合、mixed_nalu_types_in_pic_flagが他の状態、例えば1に等しい場合、これは、そのピクチャの1つ以上のサブピクチャのVCLNALユニットがすべて、STSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP、およびCRA_NUTの1つ以上から成るNALユニットセットからの1つのような、nal_unit_typeの特異な値を有する一方で、そのピクチャの他のVCL NALユニットはすべて、nal_unit_typeの異なる特異な値、つまり、TRAIL_NUT、RADL_NUTおよびRASL_NUTの1つ以上で構成される別のセットからの1つを有する。さらに換言すれば、mixed_nalu_types_in_pic_flagが1などの第2の状態を呈する場合、mixed_nalu_types_in_pic_flagを含むPPSを参照する各ピクチャは複数のVCL NALユニットを有し、それらVCLNALユニットは同じ値のnal_unit_typeを持たず、かつそのピクチャがIRAPピクチャではないことを特定し得る一方で、mixed_nalu_types_in_pic_flagが0などの他の状態を呈する場合、そのPPSを参照する各ピクチャは1つ以上のVCLNALユニットを有し、PPSを参照する各ピクチャのVCL NALユニットはnal_unit_typeの同じ値を持つことを示し得る。この手段により、mixed_nalu_types_in_pic_flagを1などの第1の状態に設定して、サブピクチャ・ビットストリーム統合(マージ)操作から発生したものなど、PPSを参照するピクチャに対し、それらが異なるNALユニットタイプのスライスを含むことを示し得る。
【0111】
いくつかの態様は装置の文脈で説明されてきたが、これらの態様が対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様はまた、対応するブロックまたはアイテム、または対応する装置の特徴の説明を表す。方法ステップのいくつかまたはすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(または使用して)実行され得る。いくつかの実施形態では、1つ以上の最も重要な方法ステップは、そのような装置によって実行され得る。
【0112】
特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装することができる。実装は、デジタル記憶媒体、例えば、フレキシブルディスク、DVD、Blu-Ray(商標)、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行でき、それらの上には、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協力する(または協力することができる)電子的に読み取り可能な制御信号が格納されている。したがって、デジタル記憶媒体はコンピュータで読み取り可能であってもよい。
【0113】
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協調することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0114】
本発明の符号化されたビデオ信号またはデータストリームは、それぞれ、デジタル記憶媒体に記憶することができ、または無線伝送媒体などの伝送媒体またはインターネットなどの有線伝送媒体で送信することができる。
【0115】
一般に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の1つを実行するために動作可能である。プログラムコードは、例えば、機械可読キャリアに格納され得る。
【0116】
他の実施形態は、機械可読キャリアに格納された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
【0117】
言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0118】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムをその上に記録したデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、通常、有形および/または非一時的である。
【0119】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、インターネットを介して、データ通信接続を介して転送されるように構成され得る。
【0120】
さらなる実施形態は、本明細書に記載の方法の1つを実行するように構成または適合された処理手段、例えば、コンピュータ、またはプログラマブルロジックデバイスを含む。
【0121】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを含む。
【0122】
本発明によるさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを(例えば、電子的または光学的に)受信機に転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバーを備え得る。
【0123】
いくつかの実施形態では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書に記載の方法の機能のいくつかまたはすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法の1つを実行するために、マイクロプロセッサと協調することができる。一般に、これらの方法は、好ましくは、任意のハードウェア装置によって実行される。
【0124】
本明細書に記載の装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組み合わせを使用して実装することができる。
【0125】
本明細書に記載の装置、または本明細書に記載の装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアで実装され得る。
【0126】
本明細書に記載の方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組み合わせを使用して実行することができる。
【0127】
本明細書に記載の方法、または本明細書に記載の装置の任意の構成要素は、ハードウェアおよび/またはソフトウェアによって少なくとも部分的に実行され得る。
【0128】
上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載の配置および詳細の修正および変形は、当業者には明らかであることが理解される。したがって、本明細書の実施形態の説明および説明として提示された特定の詳細によってではなく、添付した特許クレームの範囲によってのみ制限されることが意図されている。