(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-01-08
(45)【発行日】2025-01-17
(54)【発明の名称】描画面サイズ拡張可能ビデオコーディング
(51)【国際特許分類】
H04N 19/33 20140101AFI20250109BHJP
H04N 19/70 20140101ALI20250109BHJP
H04N 19/167 20140101ALI20250109BHJP
【FI】
H04N19/33
H04N19/70
H04N19/167
(21)【出願番号】P 2022507445
(86)(22)【出願日】2020-08-05
(86)【国際出願番号】 US2020045043
(87)【国際公開番号】W WO2021026255
(87)【国際公開日】2021-02-11
【審査請求日】2023-05-08
(32)【優先日】2019-08-06
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-09-19
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-12-10
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ルゥ,タオラン
(72)【発明者】
【氏名】プゥ,ファーンジュイン
(72)【発明者】
【氏名】イン,プオン
(72)【発明者】
【氏名】マッカーシー,ショーン トーマス
(72)【発明者】
【氏名】チェン,タオ
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】特表2018-534827(JP,A)
【文献】国際公開第2015/053287(WO,A1)
【文献】米国特許出願公開第2015/0195573(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
拡張可能な描画面サイズでコーディングビットストリームを復号する方法であって、前記方法は、プロセッサにより実行され、現在ピクチャについて、
符号無し整数値を有する現在ピクチャ幅及び現在ピクチャ高さを受信するステップと、
前記現在ピクチャ上の長方形範囲を決定する第1オフセットパラメータを受信するステップであって、前記第1オフセットパラメータは符号付き整数値を含む、ステップと、
前記現在ピクチャ幅、前記現在ピクチャ高さ、及び前記第1オフセットパラメータに基づき、前記現在ピクチャ上の前記長方形範囲の現在範囲
の幅及び現在範囲
の高さを計算するステップと、
参照範囲について、参照範囲幅、参照範囲高さ、参照範囲左オフセット、及び参照範囲上オフセットにアクセスするステップと、
前記現在範囲
の幅及び前記参照範囲幅に基づき、水平倍率を計算するステップと、
前記現在範囲
の高さ及び前記参照範囲高さに基づき、垂直倍率を計算するステップと、
前記第1オフセットパラメータに基づき、前記現在
範囲の左オフセット調整及び上オフセット調整を計算するステップと、
前記水平及び垂直倍率、前記左オフセット調整、前記上オフセット調整、前記参照範囲左オフセット、及び前記参照範囲上オフセットに基づき、動き補償を実行するステップと、
を含
み、
前記参照範囲幅及び前記参照範囲高さにアクセスするステップは、参照ピクチャについて、
参照ピクチャ幅及び参照ピクチャ高さにアクセスするステップと、
前記参照ピクチャ内の長方形範囲を決定する第2オフセットパラメータを受信するステップであって、前記第2オフセットパラメータは符号付き整数値を有する、ステップと、
前記参照ピクチャ幅、前記参照ピクチャ高さ、及び前記第2オフセットパラメータに基づき、前記参照ピクチャ内の前記長方形範囲について、前記参照範囲幅及び前記参照範囲高さを計算するステップと、
前記第2オフセットパラメータに基づき、前記参照範囲左オフセット及び前記参照範囲上オフセットを計算するステップと、
を更に含む、方法。
【請求項2】
前記第1オフセットパラメータは、左オフセット、上オフセット、右オフセット、及び下オフセットを含む、請求項1に記載の方法。
【請求項3】
前記左オフセット、前記上オフセット、前記右オフセット、又は前記下オフセットのうちの1つ以上は、-2
14から2
14
-1の間の値を有する、請求項2に記載の方法。
【請求項4】
前記現在範囲
の幅を計算するステップは、前記現在ピクチャ幅から、前記左オフセットと前記右オフセットとの第1和を減算するステップを含み、
前記現在範囲
の高さを計算するステップは、前記現在ピクチャ高さから、前記上オフセットと前記下オフセットとの第2和を減算するステップを含む、請求項2に記載の方法。
【請求項5】
前記水平倍率(hori_scale_fp)を計算するステップは、以下を計算するステップを含み:
【数14】
ここで、fRefWidthは前記参照範囲幅を表し、fCurWidthは前記現在範囲
の幅を表す、請求項1に記載の方法。
【請求項6】
動き補償を実行するステップは、以下を計算するステップを含み:
【数15】
ここで、hori_scale_fpは、前記水平倍率を表し、
vert_scale_fpは、前記垂直倍率を表し、
fCurLeftOffsetは、前記左オフセット調整を表し、
fCurTopOffsetは、前記上オフセット調整を表し、
fRefLeftOffsetは、前記参照範囲左オフセットを表し、
fRefTopOffsetは、前記参照範囲上オフセットを表し、
(refxSb
L,refySb
L)及び(refx
L,refy
L)は、1/16サンプルユニットの場合に動きベクトル(refMvLX[0],refMvLX[1])によりポイントされるルマ位置である、請求項1に記載の方法。
【請求項7】
前記参照範囲は参照ピクチャを含む、請求項1に記載の方法。
【請求項8】
前記参照範囲幅、前記参照範囲高さ、前記参照範囲左オフセット、及び前記参照範囲上オフセットは、前記参照ピクチャの適合ウインドウパラメータ、参照ピクチャ幅、参照ピクチャ高さ、又は関心領域オフセットパラメータ、のうちの1つ以上に基づき計算される、請求項
1に記載の方法。
【請求項9】
1つ以上のプロセッサにより請求項1~
8のいずれか一項に記載の方法を実行するためのコンピュータ実行可能命令を格納している非一時的コンピュータ可読記憶媒体。
【請求項10】
プロセッサを含み、請求項1~
8のいずれか一項に記載の方法
を実行するよう構成される機器。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願]
本願は、米国仮出願番号第62/883,195号、2019年8月6日出願、第62/902,818号、2019年9月19日出願、及び第62/945,931号、2019年12月10日出願、の優先権の利益を主張する。
【0002】
[技術分野]
本願明細書は、概して画像に関連する。より具体的には、本発明の実施形態は、描画面サイズ拡張可能ビデオコーディングに関する。
【背景技術】
【0003】
本願明細書で使用されるとき、用語「ダイナミックレンジ(dynamic range (DR))」は、例えば最も暗い灰色(黒)から最も明るい白色(ハイライト)までの画像内の強度(例えば、輝度、ルマ)範囲を知覚する人間の視覚システム(human visual system (HVS))の能力に関連し得る。このシーンでは、DRは「シーン参照」強度に関連する。DRは、特定幅の強度範囲を適切に又は近似的にレンダリングするディスプレイ装置の能力にも関連してよい。このシーンでは、DRは「ディスプレイ参照」強度に関連する。本願明細書の説明の任意の点において、特定のシーンが特定の重要度を有すると明示的に指定されない限り、用語はいずれかのシーンで、例えば同義的に使用されてよいことが推定されるべきである。
【0004】
本願明細書で使用されるとき、用語「高ダイナミックレンジ(high dynamic range (HDR))」は、人間の視覚システム(HVS)の大きさの14~15倍またはそれより大きな程度に渡るDR幅に関連する。実際に、人間が強度範囲の中の広範な幅を同時に知覚し得るDRは、HDRに関連して、何らかの方法で省略され得る。
【0005】
実際には、画像は1つ以上の色成分(例えば、ルマY及びクロマCb及びCr)を含み、各色成分はピクセル当たりnビット(例えば、n=8)の精度により表される。非線形輝度コーディングを使用すると、n≦8である画像(例えば、カラー24ビットJPEG画像)は、標準ダイナミックレンジ(standard dynamic range (SDR))の画像であると考えられる。一方で、n>8である画像は、拡張ダイナミックレンジの画像であると考えられてよい。HDR画像は、Industrial Light and Magicにより開発されたOpenEXRファイルフォーマットのような高精細(例えば、16ビット)浮動小数点フォーマットを用いて格納され配信されてもよい。
【0006】
現在、Dolby laboratoriesのDolby Vision又はBlue-Ray(登録商標)におけるHDR10のようなビデオ高ダイナミックレンジコンテンツの配信は、多くの再生装置の能力により、4K解像度(例えば、4096×2160、又は3840×2160、等)、及び60フレーム毎秒(fps)に限定されている。将来のバージョンでは、最大で8K解像度(例えば、7680×4320)及び120pfsのコンテンツが配信及び再生のために利用可能になることが期待される。Dolby VisionのようなHDR再生コンテンツエコシステムを簡略化するために、将来のコンテンツタイプは、既存の再生装置と互換性があることが望ましい。理想的には、コンテンツ制作者は、(HDR10又はDolby Visionのような)既存のHDR装置と互換性のあるコンテンツの特別バージョンを導出し及び配信する必要無しに、将来のHDR技術を採用し及び配信可能でなければならない。ここで発明者らが認めたように、ビデオコンテンツ、特にHDRコンテンツの拡張可能な配信のための改良された技術が望まれる。
【0007】
本章に記載されるアプローチは、追求可能なアプローチであるが、必ずしも以前に考案又は追求されたアプローチではない。従って、特に示されない限り、本章に記載したアプローチのうちのいずれも、単に本章に含まれることにより従来技術と見なされるべきではない。同様に、1つ以上のアプローチに関して特定される課題は、特に示されない限り、本章に基づき任意の従来技術の中で認識されたものと想定されるべきではない。
【図面の簡単な説明】
【0008】
本発明の実施形態は、限定ではなく、例を用いて説明され、添付の図中の同様の参照符号は同様の要素を表す。
【0009】
【
図1】ビデオ配信パイプラインの例示的な処理を示す。
【0010】
【
図2A】目標ディスプレイの解像度に従い入力コンテンツの表示領域を定めるためのピクチャサブ領域の例を示す。
【0011】
【
図2B】
図2Aのピクチャ領域について、実施形態による、タイル表現における境界に跨がる制限の例を示す。
【0012】
【
図2C】実施形態による、レイヤ適応スライスアドレッシングの例を示す。
【0013】
【
図3】従来技術による、空間拡張可能性の例を示す。
【0014】
【
図4】実施形態による、描画面拡張可能性の例を示す。
【0015】
【
図5】実施形態による、基本レイヤ及び拡張レイヤピクチャ、及び対応する適合ウインドウの例を示す。
【0016】
【
図6A】本発明の実施形態による、描画面サイズ拡張可能性をサポートする例示的な処理フローを示す。
【
図6B】本発明の実施形態による、描画面サイズ拡張可能性をサポートする例示的な処理フローを示す。
【発明を実施するための形態】
【0017】
ビデオコーディングのための描画面サイズ拡張可能性に関連する例示的な実施形態が本願明細書に記載される。以下の詳細な説明では、説明を目的として、本発明の種々の実施形態の完全な理解を提供するために、多数の特定の詳細が説明される。しかしながら、本発明の種々の実施形態がこれらの特定の詳細のうちの一部を有しないで実行されてよいことが明らかである。他の例では、よく知られた構造及び装置は、本発明の実施形態を不必要に抑止し(occluding)、曖昧にし、又は不明瞭にすることを避けるために、徹底的に詳細に記載されない。
【0018】
<要約>
本願明細書に記載される例示的な実施形態は、ビデオコーディングにおける描画面サイズ拡張可能性に関連する。実施形態では、プロセッサは、
第1レイヤにおける適合ウインドウのオフセットパラメータを受信し、
参照レイヤにおけるコーディング領域の参照ピクチャ幅及び参照ピクチャ高さにアクセスし、
前記第1レイヤにおける第1関心領域(ROI)のためのオフセットパラメータを受信し、
前記参照レイヤにおける第2ROIのためのオフセットパラメータを受信し、
前記適合ウインドウのための前記オフセットパラメータに基づき、前記第1レイヤにおけるコーディング領域のための第1ピクチャ幅及び第1ピクチャ高さを計算し、
前記第1ピクチャ幅、前記第1ピクチャ高さ、及び前記第1ROIのための前記オフセットパラメータに基づき、前記第1レイヤにおける現在ROIのための第2ピクチャ幅及び第2ピクチャ高さを計算し、
前記参照ピクチャ幅、前記参照ピクチャ高さ、及び前記参照レイヤにおける前記第2ROIのための前記オフセットパラメータに基づき、前記参照レイヤにおける参照ROIのための第3ピクチャ幅及び第3ピクチャ高さを計算し、
前記第2ピクチャ幅及び前記第3ピクチャ幅に基づき、水平倍率を計算し、
前記第2ピクチャ高さ及び前記第3ピクチャ高さに基づき、垂直倍率を計算し、
前記水平倍率及び前記垂直倍率に基づき前記参照ROIをスケーリングして、スケーリング済み参照ROIを生成し、
前記現在ROI及び前記スケーリング済み参照ROIに基づき、出力ピクチャを生成する。
【0019】
第2の実施形態では、デコーダは、
第1レイヤにおける適合ウインドウのオフセットパラメータを受信し、
参照レイヤにおけるコーディング領域の参照ピクチャ幅及び参照ピクチャ高さにアクセスし、
前記第1レイヤにおける第1関心領域(ROI)のための調整済みオフセットパラメータを受信し、前記調整済みオフセットパラメータは、前記第1ROIのためのオフセットパラメータを前記第1レイヤにおける前記適合ウインドウのための前記オフセットパラメータと結合し、
前記参照レイヤにおける第2ROIのための調整済みオフセットパラメータを受信し、前記調整済みオフセットパラメータは、前記第2ROIのためのオフセットパラメータを、前記参照レイヤにおける適合ウインドウのためのオフセットパラメータと結合し、
前記第1レイヤにおける前記第1ROIのための前記調整済みオフセットパラメータに基づき、前記第1レイヤにおける現在ROIのための第1ピクチャ幅及び第1ピクチャ高さを計算し、
前記参照レイヤにおける前記第2ROIのための前記調整済みオフセットパラメータに基づき、前記参照レイヤにおける参照ROIのための第2ピクチャ幅及び第2ピクチャ高さを計算し、
前記第1ピクチャ幅及び前記第2ピクチャ幅に基づき、水平倍率を計算し、
前記第1ピクチャ高さ及び前記第2ピクチャ高さに基づき、垂直倍率を計算し、
前記水平倍率及び前記垂直倍率に基づき前記参照ROIをスケーリングして、スケーリング済み参照ROIを生成し、
前記現在ROI及び前記スケーリング済み参照ROIに基づき、出力ピクチャを生成する。
【0020】
<例示的なビデオ配信処理パイプライン>
図1は、ビデオキャプチャからビデオコンテンツ表示までの種々の段階を示す従来のビデオ配信パイプライン100の例示的な処理を示す。ビデオフレーム102のシーケンスは、画像生成ブロック105を用いてキャプチャ又は生成される。ビデオフレーム102は、デジタル方式で(例えば、デジタルカメラにより)キャプチャされ、又はコンピュータにより(例えば、コンピュータアニメーションを用いて)生成されてよく、ビデオデータ107を提供する。代替として、ビデオフレーム102は、フィルムカメラによりフィルム上にキャプチャされてよい。フィルムは、デジタルフォーマットに変換されて、ビデオデータ107を提供する。製作(production)段階110において、ビデオデータ107は、ビデオ製作トリーム112を提供するために編集される。
【0021】
製作トリーム112のビデオデータは、次に、ブロック115で、製作後編集のためにプロセッサに提供される。ブロック115の製作後編集は、ビデオ制作者の製作意図に従い画像品質を向上するため又は特定の外観を達成するために、画像の特定領域の色又は明るさの調整又は変更を含んでよい。これは、時に、「色タイミング」又は「色グレーディング」と呼ばれる。他の編集(例えば、シーン選択及び順序付け、画像黒っピング、コンピュータが生成した視覚的特殊効果の追加、激しい振動又はブラー制御、フレームレート制御、等)が、配信のための製作の最終バージョン117を生成するために、ブロック115で実行されてよい。製作後編集115の間、ビデオ画像は、参照ディスプレイ125上で表示される。
製作後115に続いて、最終製作のビデオデータ117は、テレビセット、セットトップボックス、映画劇場、等のような復号及び再生装置へと下流に配信するために、符号化ブロック120に配信されてよい。幾つかの実施形態では、コーディングブロック120は、コーディングビットストリーム122を生成するために、ATSC、DVB、DVD、Blu-Ray(登録商標)、及び他の配信フォーマットにより定義されるような、オーディオ及びビデオエンコーダを含んでよい。受信機では、コーディングビットストリーム122は、信号117と同一のもの又はその非常に近い近似を表す復号信号132を生成するために、復号ユニット130により復号される。受信機は、参照ディスプレイ125と全く異なる特性を有してよい目標ディスプレイ140に取り付けられてよい。その場合、ディスプレイ管理ブロック135は、ディスプレイマッピング済み信号137を生成することにより、復号信号132のダイナミックレンジを目標ディスプレイ140の特性にマッピングするために使用されてよい。
【0022】
<拡張可能なコーディング>
拡張可能なコーディングは、既に、MPEG-2、AVC、及びHEVCのような多数のビデオコーディング規格の一部である。本発明の実施形態では、拡張可能なコーディングは、特に、超高解像度HDRコンテンツに関連するとき、性能及び柔軟性を向上するために拡張される。
【0023】
<描画面サイズ拡張可能性>
従来知られているように、空間拡張可能性は、主に、デコーダが種々の解像度でコンテンツを生成することを可能にするために使用される。本発明の実施形態では、空間又は描画面の拡張可能性は、画像の異なる領域の抽出を可能にするよう設計される。例えば、コンテンツ制作者は、大型ディスプレイと小型ディスプレイとでは異なる方法でコンテンツをフレーム化することを選択する(つまり、表示領域を指定する)ことがある。例えば、表示のためにフレーム化された領域は、スクリーンのサイズ、又はスクリーンからビューアまでの距離、に依存してよい。本発明の実施形態は、画像を重なり合う領域(標準的には長方形)に分割し、選択した数のサブ領域が他のサブ領域と独立して、提示のために復号され得るように、それらを符号化する。
【0024】
図2Aに例が示され、種々の領域は、他の領域を包含し、及び/又は他の領域により包含される。例として、最小領域215は2K解像度を有し、最大領域205は8K解像度を有する。基本レイヤビットストリームは、最小空間領域に対応し、一方で、ビットストリーム内の追加レイヤは、次第に大きくなる画像領域に対応する。従って、2Kディスプレイは、2K領域215の範囲内でのみコンテンツを表示する。4Kディスプレイは、2K及び4K領域の両方(210内の範囲)のコンテンツを表示し、8Kディスプレイは更に広い205内の全てを表示する。別の例では、2Kディスプレイは、4Kコンテンツのダウンサンプリングバージョンを表示してよく、4Kディスプレイは、8Kコンテンツのダウンサンプリングバージョンを表示してよい。理想的には、基本レイヤ領域は、レガシー装置により復号でき、一方で、他の領域は、描画面サイズを拡張するために将来の装置により使用できる。
【0025】
HEVCのような既存のコーディング規格は、タイルを用いて描画面拡張可能性を可能にし得る。タイル表現では、フレームは、長方形の重なり合わない領域のセットに分割される。受信機は、表示のために必要なタイルのセットのみを復号し表示することを決定できる。HEVCでは、タイル間のコーディング依存性は無効である。具体的には、エントロピーコーディング及び再構成依存性は、タイル境界に跨がることを許容されない。これは、動きベクトル予測、イントラ予測、及びコンテキスト選択を含む。(インループフィルタリングは、唯一の例外であり、境界を跨がって許容されるが、ビットストリーム内のフラグにより無効にできる。)更に、基本レイヤが独立して復号可能であるよう、時間動き制約タイル(motion constrained tiles (MCTS))に対するエンコーダ側の制約が必要であり、時間動き制約タイルセット補足拡張情報(supplemental enhancement information (SEI))メッセージが要求される。ビットストリーム抽出及び適合の目的で、動き制約タイルセット抽出情報セットSEIメッセージが必要である。特に独立に復号する能力に伴う、HEVCにおけるタイル定義の欠陥は、コーディング効率の損失である。
【0026】
代替の実装では、HEVCは、関心領域(region of interest (ROI))を抽出するためにパンスキャン長方形(pan-scan rectangle)SEIメッセージを用いて、描画面拡張可能性を可能にする。SEIメッセージ通信は、長方形範囲を指定するが、ROIを他の領域と独立に復号可能にする情報又は制約を提供する。標準的に、デコーダは、ROIを得るために、画像全体を復号する必要がある。
【0027】
実施形態では、HEVCタイル概念に改良を加えることにより、新規なソリューションが提案される。例えば、
図2Aに示す領域が与えられた場合、実施形態では、独立復号は、領域2Kのためにのみ要求される。
図2Bに示すように、2Kの範囲内のタイルでは、提案される方法は、境界を跨がる予測(イントラ/インター)及びエントロピーコーディングを許容する。4Kでは、それは、2kからの及び4Kの範囲内の境界を跨がる予測(イントラ/インター)及びエントロピーコーディングを許容する。8Kでは、それは、2k及び4Kからの及び8Kの範囲内の境界を跨がる予測(イントラ/インター)及びエントロピーコーディングを許容する。ここで、2Kにlayer_id 0を、4Kにlayer_id 1を、8Kにlayer_id 2を割り当てることが提案される。現在復号中のlayer_id=Nが与えられると、境界を跨がるタイル予測及びエントロピーコーディングは、N以下のlayer_idからのみ許される。この場合、コーディング効率の損失は、HEVC型のタイルと比べて低下する。例示的なシンタックスは、以下の表1及び2に示される。ここで、Ref[2]の提案されているVVC(Versatile Video Codec)ドラフト仕様に対して提案される新しいシンタックスエレメントは、灰色で強調表示されて示される。
表1:描画面リサイズを可能にする例示的なシーケンスパラメータセットRBSPシンタックス
【表1】
表2:描画面リサイズのための例示的なピクチャパラメータRBSPシンタックス
【表2】
【0028】
SPS(表1)では、フラグsps_canvas_tile_enabled_flagが追加されている。
sps_canvas_tile_enabled_flagが1に等しいことは、描画面タイルが現在CVSで有効であることを指定する。sps_canvas_tile_enabled_flagが0に等しいことは、描画面タイルが現在CVSで有効ではないことを指定する。
【0029】
PPS(表2)では、新しいlayer_id情報パラメータ、tile_layer_id[i]は、i番目の描画面タイルのレイヤidを指定する。tile_layer_id値が0から開始して連続するよう制約する場合、実施形態では、提案されるVVC策定中ドラフト(Ref.[2])に従い、tile_layer_idの最大可能値は、NumTilesInPic-1であり得る。
【0030】
タイルは説明として使用されるが、VVCで定義される及び従来知られている、「ブリック」、スライス、及びサブピクチャも、同様に構成できる。
【0031】
<レイヤ適応スライスアドレッシング>
発明者らが認識したように、特定のストリーミングアプリケーションでは、以下の特徴が望ましいことがある:
(1)ビデオコーディングレイヤ(video coding layer (VCL))でネットワーク抽象化レイヤ(network abstraction layer (NAL))ユニットを使用するとき、2K解像度ビットストリームは、自己完結型である必要があり、全部のそのNALユニットは、同じ値のnuh_layer_id(例えば、レイヤ0)を有しなければならない。4K解像度を可能にする追加ビットストリームも、自己完結型である必要があり、そのNALユニットは、同じ値の、しかし2Kレイヤのnuh_layer_idとは異なるnuh_layer_id(例えば、レイヤ1)を有しなければならない。最後に、8K解像度を可能にする任意の追加ビットストリームも、自己完結型である必要があり、そのNALユニットは、同じ値の、しかし2K及び4Kレイヤのnuh_layer_id値とは異なるnuh_layer_id(例えば、レイヤ2)を有しなければならない。従って、NALユニットヘッダを分析することにより、nuh_layer_idを用いて、目標解像度又は関心領域(例えば、2K、4K、又は8K)を有するビットストリームを抽出できなければならない。
(2)非VCL NALユニットでは、ストリーム及びピクチャパラメータセットヘッダ(例えば、SPS、PPS、等)は、解像度毎に自己完結型でなければならない。
(3)目標解像度では、ビットストリーム抽出処理は、目標解像度のために必要ではないNALユニットを破棄できなければならない。目標解像度のためのビットストリーム抽出の後に、ビットストリームは、単一レイヤプロファイルに従い、従って、デコーダは単一解像度ビットストリームを単に復号できる。
2K、4K、及び8K解像度は、例として提供されるだけであり、限定ではなく、同じ方法が任意の数の異なる空間解像度又は関心領域に適用できることに留意する。例えば、最高の可能な解像度(例えば、res_layer[0]=8K)のピクチャから開始して、最低解像度におけるサブレイヤ又は関心領域を定義してよい。ここで、i=1,2,…,N-1について、res_layer[i]>res_layer[i+1]であり、Nはレイヤ総数を示す。次に、最初にピクチャ全体を復号することなく、特定のサブレイヤを復号したい場合がある。これは、デコーダが複雑性を低減すること、節電、等を助ける。
【0032】
上述の要件を満たすために、実施形態では、以下の方法が提案される:
・高レベルシンタックスで、レイヤ数、レイヤ間の依存性関係、レイヤの表現フォーマット、DPBサイズ、及び、レイヤセット、出力レイヤセット、プロファイルティアレベル、及びタイミング関連パラメータを含むビットストリームの適合性を定義することに関連する他の情報、を含むレイヤ情報を指定するために、ビデオパラメータセット(video parameter set (VPS))シンタックスを再利用できる。
・各々の異なるレイヤ、ピクチャ解像度、適合ウインドウ、サブピクチャ、等、に関連付けられた信号パラメータセット(signal parameter sets (SPS))では、別個の解像度(例えば、2K、4K、又は8K)に準拠すべきである。
・各々の異なるレイヤ、タイル、ブリック、スライス、等に関連付けられたピクチャパラメータセット(picture parameter sets (PPS))では、情報は、別個の解像度(例えば、2K、4K、又は8K)に準拠すべきである。別個の領域がVCS内で同じになるよう設定される場合、タイル/ブリック/スライス情報はSPSにも設定されてよい。
・スライスヘッダでは、slice_addressは、スライスを含む最低目標解像度に設定されるべきである。
・前述のように、独立レイヤ復号では、予測中、レイヤは、より低いレイヤ及び/又は同じレイヤからのタイル/ブリック/スライス近隣情報のみを使用できる。
【0033】
VVC(Ref.[2])は、スライスとして、単一NALユニットに排他的に含まれる、ピクチャの整数個のブリックを定義する。ブリックは、ピクチャ内の特定のタイル内の長方形領域のCTU行として定義される。CTU(coding tree unit)は、ルマ及びクロマ情報を有するサンプルのブロックである。
【0034】
私たちの2K/4K/8Kの例において、実施形態では、slice_addressの値(これは、スライスのスライスアドレスを示す)は、2Kビットストリームでは、4Kビットストリーム又は8Kビットストリームのものと異なるslice_address値を有する必要があり得る。従って、slice_addressの低解像度から高解像度への変換が必要であり得る。従って、実施形態では、そのような情報はVPSレイヤで提供される。
【0035】
図2Cは、1つのサブレイヤ(例えば、2K及び4Kの場合)を有する4Kピクチャの例を示す。9個のタイル及び3個のスライスを有するピクチャ220を検討する。灰色のタイルが2K解像度の領域を指定するとする。2Kビットストリームでは、灰色領域のslice_addressは0でなければならないが、4Kビットストリームでは、灰色領域のslice_addressは1でなければならない。提案される新しいシンタックスは、解像度レイヤに従いslice_addressを指定することを可能にする。例えば、VPSでは、nul_layer_id=1について、4Kの場合にはslice_addressが1になるよう変更されることを指定するために、slice_address変換情報を追加してよい。実装を単純にするために、実施形態では、解像度毎のスライス情報がコーディングビデオストリーム(coded video stream (CVS))の中で同じに保たれなければならないと制約することを望み得る。HEVCビデオパラメータセットRBSPシンタックスに基づく、VPSにおける例示的なシンタックスが、表3に示される(Ref.[1]のSection7.3.2.1)。情報は、SPS、PPS、スライスヘッダ、及びSEIメッセージのような高レベルシンタックス(high-level syntax (HLS))の他のレイヤを通じても伝達され得る。
表3:レイヤ適応スライスアドレッシングをサポートするVPSにおける例示的なシンタックス
【表3】
vps_layer_slice_info_present_flagが1に等しいことは、VPS()シンタックス構造の中にスライス情報が存在することを指定する。vps_layer_slice_info_present_flagが0に等しいことは、VPS()シンタックス構造の中にスライス情報が存在しないことを指定する。
num_slices_in_layer_minus1[i]がプラス1を指定することは、i番目のレイヤ内のスライス数を指定する。num_slices_in_layer_minus1[i]の値は、i番目のレイヤにおけるnum_slices_in_pic_minus1に等しい。
layer_slice_address[i][j][k]は、j番目のレイヤ内のk番目のスライスの目標のi番目のレイヤスライスアドレスを指定する。
【0036】
例として、
図2Cの例に戻ると、ピクチャ220は、2つのレイヤを含む:
・レイヤ0(例えば2K)には、スライスアドレス0を有する1つのスライス230(灰色)がある。
・レイヤ1(例えば4K)には、スライスアドレス0、1、2を有する3つのスライス(225、230、及び235)がある。
レイヤ1(i=1)を復号するとき、レイヤ0(j=0)内で、スライス0(k=0)230は、スライスアドレス1を有し、従って、表3の表記に従い、layer_slice_address[1][0][0]=1である。
【0037】
<フィルタリング後のSEIメッセージ>
ブリック/タイル/スライス/サブピクチャを用いて描画面拡張可能性を実施するとき、起こり得る問題は、境界に跨がるインループフィルタリング(例えば、デブロッキング、SAO、ALF)の実装である。例として、Ref.[4]は、成分ウインドウが独立領域(又はサブピクチャ)を用いてコーディングされるときの問題を記載している。独立コーディング領域を用いてピクチャ全体を符号化するとき(これは、例として、ブリック/タイル/スライス/サブピクチャ、等により実施できる)、独立コーディング領域を跨がるインループフィルタリングは、ドリフト及び境界アーチファクトを生じ得る。描画面サイズアプリケーションでは、高解像度ビデオ及び低解像度ビデオの両方について良好な視覚的品質を有することが重要である。高解像度ビデオでは、境界アーチファクトは軽減されなければならない。従って、独立コーディング領域に跨がるインループフィルタリング(特に、デブロッキングフィルタ)が有効にされなければならない。低解像度ビデオでも、ドリフト及び境界アーチファクトは最小化されなければならない。
【0038】
Ref.[4]では、インター予測のためにサブピクチャ境界パディングを格納するソリューションが提案されている。このアプローチは、インループフィルタリングにより影響されるそれらのピクセルを使用する動きベクトルを禁じるように、エンコーダのみの制約により実施できる。代替として、実施形態では、SEIメッセージ通信を介してデコーダに通信される後フィルタリングを用いて、この問題を解決することが提案される。
【0039】
先ず、独立コーディング領域(例えば、領域225及び230内のスライス境界)に跨がるインループフィルタリングが無効にされることが提案される。ピクチャ全体に対する独立コーディング領域に跨がるフィルタリングは、フィルタリング後処理において行われてよい。フィルタリング後は、デブロッキング、SAO、ALF、又は他のフィルタのうちの1つ以上を含み得る。デブロッキングは、ROI境界アーチファクトを除去するために最も重要なフィルタであり得る。通常、デコーダ又はディスプレイ/ユーザは、どんなフィルタが使用されるべきかの彼ら自身の選択を有し得る。表4は、ROI関連フィルタリング後のSEIメッセージ通信のための例示的なシンタックスを示す。
表4:ROI関連フィルタリング後の例示的なシンタックス
【表4】
例として、シンタックスパラメータは、以下のように定義されてよい。
【0040】
deblocking_enabled_flagが1に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にデブロッキング処理が適用されてよいことを指定する。deblocking_enabled_flagが0に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にデブロッキング処理が適用されてはならないことを指定する。
【0041】
sao_enabled_flagが1に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にサンプル適応オフセット(sample adaptive offset (SAO))処理が適用されてよいことを指定する。sao_enabled_flagが0に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にサンプル適応処理が適用されてはならないことを指定する。
【0042】
alf_enabled_flagが1に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界に適応ループフィルタ処理(adaptive loop filter process (ALF))が適用されてよいことを指定する。alf_enabled_flagが0に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界に適応ループフィルタ処理が適用されてはならないことを指定する。
【0043】
user_defined_filter_enabled_flagが1に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にユーザ定義フィルタ処理が適用されてよいことを指定する。user_defined_filter_enabled_flagが0に等しいことは、表示する目的で再構成されたピクチャの独立ROI境界にユーザ定義フィルタ処理が適用されてはならないことを指定する。
【0044】
実施形態では、表4のSEIメッセージ通信は、提案されたフラグのうちの1つ以上を除去することにより簡略化できる。全部のフラグが除去された場合、SEIメッセージindependent_ROI_across_boundary_filter(payloadSize){}の存在だけが、ROI関連境界アーチファクトを軽減するために後フィルタが使用されるべきであることを、デコーダに示す。
【0045】
<関心領域(ROI)拡張可能性>
VVC(Ref.[2])の最新の仕様は、Ref.[3]に更に詳細に議論されるように、参照ピクチャ再サンプリング(reference picture resampling (RPR))及び参照ピクチャ選択(reference picture selection (RPS))の組合せを用いて、空間、品質、及びビュー拡張可能性を記載している。それは、単一ループ復号及びブロックに基づくオンザフライ再サンプリングに基づく、RPSは、基本レイヤと1つ以上の拡張レイヤとの間の、又はより具体的には、基本レイヤ又は1つ以上の拡張レイヤのいずれかに割り当てられるコーディングピクチャの間の予測関係を定義するために使用される。RPRは、より小さい/高い基本レイヤピクチャから予測しながら、ピクチャのサブセットを、つまり空間拡張レイヤのピクチャを、基本レイヤより高い/小さい解像度でコーディングするために使用される。
図3は、RPS/RPRの枠組みによる、空間拡張可能性の例を示す。
【0046】
図3に示されるように、ビットストリームは、2つのストリーム、つまり低解像度(low-resolution (LR))ストリーム305(例えば、標準解像度(standard definition, HD)、2K、等)、及び高解像度(higher-resolution (HR))ストリーム310(例えば、HD、2K、4K、8K、等)を含む。矢印は、可能なインター予測コーディング依存性を示す。例えば、HRフレーム310-P1は、LRフレーム305-Iに依存する。310-P1内のブロックを予測するために、デコーダは305-Iをアップスケーリングする必要がある。同様に、HRフレーム310-P2はHRフレーム310-P1及びLRフレーム305P1に依存してよい。LRフレーム305-P1からの任意の予測は、LRからHRへの空間アップスケーリングを必要とする。他の実施形態では、LR及びHRフレームの順序は、逆にされてもよく、従って、基本レイヤがHRストリームであり、拡張レイヤがLRストリームであり得る。基本レイヤピクチャのスケーリングはSHVCにおけるように明示的に実行されないことに留意する。代わりに、インターレイヤ動き補償で取り入れられ、オンザフライで計算される。Ref.[2]では、スケーラビリティ(拡張可能性)比は、クロッピングウインドウを用いて暗示的に導出される。
【0047】
ROI拡張可能性は、HEVC(Ref.[1])において、一般的にSHVCと呼ばれるAnnex H「Scalable high efficiency video coding」の部分としてサポートされている。例えば、SectionF.7.3.2.3.4では、scaled_ref_layer_offset_present_flag[i]及びref_region_offset_present_flag[i]に関連するシンタックスエレメントが定義される。関連するパラメータは、式(H-2)~(H-21)及び(H-67)~(H-68)で導出される。VVCは、関心領域(ROI)拡張可能性を未だサポートしていない。発明者らが認識したように、ROI拡張可能性のサポートは、SHVCにおけるような拡張可能性の拡張を必要とすることなく、同じ単一ループのVVCデコーダを用いて描画面サイズ拡張可能性を可能にし得る。
【0048】
例として、
図2Bに示す3つのデータレイヤ(例えば、2K、4K、及び8K)が与えられる場合、
図4は、既存のRPS/RPRの枠組みを用いて描画面サイズ拡張可能性をサポートするビットストリームの例示的な実施形態を示す。
【0049】
図4に示されるように、ビットストリームは、そのピクチャを3つのレイヤ又はストリーム、2Kストリーム402、4Kストリーム405、及び8Kストリーム410に割り当てる。矢印は、可能なインター予測コーディング依存性の例を示す。例えば、8Kフレーム410-P2内のピクセルブロック亜h、8Kフレーム410-P1、4Kフレーム405-P2、及び2Kフレーム402-P1内のブロックに依存してよい。複数ループデコーダを用いていた従来の拡張可能性方式と比べて、提案のROI拡張可能性方式は、以下の利点及び欠点を有する。
-利点:単一ループデコーダを必要とし、任意の他のツールを必要としない。デコーダは、ブリック/タイル/スライス/サブピクチャ境界の問題をどのように扱うかについて考慮する必要がない。
-欠点:拡張レイヤを復号するために、基本レイヤ及び拡張レイヤの両方の復号ピクチャが、復号ピクチャバッファ(decoded picture buffer (DPB))内に必要であり、従って、非拡張可能性ソリューションよりも大きなDPBサイズを要求する。基本レイヤ及び拡張レイヤの両方が復号される必要があるので、より速いデコーダ速度も要求し得る。
【0050】
SHVCとVVCのために提案された実施形態との間のROI拡張可能性サポートを有効にする際の主な違いは、SHVCではピクチャ解像度が同じレイヤ内の全部のピクチャについて同じである必要があることである。しかし、VVCでは、RPRサポートにより、同じレイヤ内のピクチャは異なる解像度を有してよい。例えば、
図3では、SHVC、305-I、305-P1、及び305-P2は、同じ空間解像度を有する必要がある。しかし、VVCでは、RPRサポートにより、305-I、305-P1、及び305-P2は異なる解像度を有することができる。例えば、305-I及び305-P1は第1低解像度(例えば、720p)を有することができ、305-P2は第2低解像度(例えば、480p)を有することができる。本発明の実施形態は、異なるレイヤ間のROI拡張可能性、及び同じレイヤのピクチャのためのRPRの両方をサポートすることを目的とする。別の主な違いは、SHVCでは、インターレイヤ予測からの動きベクトルが0になるよう制約されることである。しかし、VVCでは、そのような制約は存在せず、動きベクトルは0であること又は0でないことが可能である。これは、インターレイヤ対応を識別するための制約を削減する。
【0051】
VVCのコーディングツリーは、コーディングユニット(coding units (CUs))全体のコーディングのみを許容する。大部分の標準フォーマットは、ピクチャ領域を4又は8個のピクセルの倍数でコーディングするが、非標準フォーマットは、最小CTUサイズに適合するために、エンコーダにおいてパディングする必要があり得る。同じ問題がHEVCに存在した。それは、ピクチャ出力に従うために考慮されるピクチャ範囲を指定する「適合ウインドウ(conformance window)」を生成することにより解決された。適合ウインドウは、VVC(Ref.[2])にも追加され、4つの変数:conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、及びconf_win_bottom_offsetにより指定される。参照を容易にするために、以下のセクションは、Ref.[2]からコピーされる。
【0052】
conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、及びconf_win_bottom_offsetは、出力のためのピクチャ座標の中で指定される長方形領域の観点から、復号処理から出力されるCVS内のピクチャのサンプルを指定する。conformance_window_flagが0に等しいとき、conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、及びconf_win_bottom_offsetの値は、0に等しいと推定される。
適合クロッピングウインドウは、両端を含む、SubWidthC*conf_win_left_offsettopic_width_in_luma_samples-(SubWidthC*conf_win_right_offset+1)からの水平ピクチャ座標、及びSubHeightC*conf_win_top_offsettopic_height_in_luma_samples-(SubHeightC*conf_win_bottom_offset+1)からの垂直座標により、ルマサンプルを制約する。
SubWidthC*(conf_win_left_offset+conf_win_right_offset)の値は、pic_width_in_luma_samplesより小さくなければならず、SubHeightC*(conf_win_top_offset+conf_win_bottom_offset)の値はpic_height_in_luma_samplesより小さくなければならない。
変数PicOutputWidthL及びPicOutputHeightLは、以下のように導出される:
【数1】
【0053】
第1の実施形態では、新たに定義されたROIオフセットは、倍率を導出するために、適合ウインドウの既存のオフセットと結合される。提案されるシンタックスエレメントの例示的な実施形態は、
図5に示され、基本レイヤピクチャ520及び拡張レイヤピクチャ502を、それらの対応する適合ウインドウと共に示す。以下のROIシンタックスエレメントが定義される:
基本レイヤ(Base Layer (BL))
【数2】
BLピクチャ520の幅522及び高さ532は、上述の式(7-43)及び(7-44)を用いて、基本レイヤの適合ウインドウパラメータを用いて計算できる。(例えば、pic_width_in_luma_samplesは幅522に対応してよく、PicOutputWidthは点線ウインドウ540の幅に対応してよい。)
拡張レイヤ
【数3】
【0054】
ELピクチャ502の幅512及び高さ514は、上述の式(7-43)及び(7-44)を用いて、拡張レイヤの適合ウインドウパラメータを用いて計算できる。(例えば、pic_width_in_luma_samplesは幅512に対応してよく、PicOutputWidthは点線ウインドウ518の幅に対応してよい。)
【0055】
例として、表5は、Ref.[2]のSection7.3.2.4に定義されたpic_parameter_set_rbsp()が、新しいシンタックスエレメントをサポートするためにどのように変更されるかを示す(編集が灰色で強調表示される)。
表5:VVCでROI拡張可能性をサポートするための例示的なシンタックス
【表5】
num_ref_loc_offsetsは、PPS内に存在する参照レイヤ位置オフセットの数を指定する。num_ref_loc_offsetsの値は、両端を含む0~vps_max_layers_minus1の範囲であるべきである。
ref_loc_offset_layer_id[i]は、i番目の参照レイヤ位置オフセットパラメータが指定されるnuh_layer_id値を指定する。
注:ref_loc_offset_layer_id[i]は、例えば、補助ピクチャのその関連する1次ピクチャへの空間対応が指定されるとき、直接参照レイヤの間で存在する必要がない。
i番目の参照レイヤ位置オフセットパラメータは、i番目のスケーリング済み参照レイヤオフセットパラメータ及びi番目の参照領域オフセットパラメータを含む。
scaled_ref_layer_offset_present_flag[i]が1に等しいことは、i番目のスケーリング済み参照レイヤオフセットパラメータがPPS内に存在することを指定する。scaled_ref_layer_offset_present_flag[i]が0に等しいことは、i番目のスケーリング済み参照レイヤオフセットパラメータがPPS内に存在しないことを指定する。存在しないとき、scaled_ref_layer_offset_present_flag[i]の値は0に等しいと推定される。
i番目のスケーリング済み参照レイヤオフセットパラメータは、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する複合ピクチャ内の参照領域に対する、このPPSを参照するピクチャの空間対応を指定する。
scaled_ref_layer_left_offset[ref_loc_offset_layer_id[i]]とconf_win_left_offsetとの和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプルと同一位置にある現在ピクチャ内のサンプルと、subWCルマサンプルのユニット内の現在ピクチャの左上ルマサンプルとの間の水平オフセットを指定する。ここで、subWCは、このPPSを参照するピクチャのSubWidthCと等しい。scaled_ref_layer_left_offset[ref_loc_offset_layer_id[i]]とconf_win_left_offsetとの和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、scaled_ref_layer_left_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
scaled_ref_layer_top_offset[ref_loc_offset_layer_id[i]]とconf_win_top_offsetとの和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプルと同一位置にある現在ピクチャ内のサンプルと、subHCルマサンプルのユニット内の現在ピクチャの左上ルマサンプルとの間の垂直オフセットを指定する。ここで、subHCは、このPPSを参照するピクチャのSubHeightCと等しい。scaled_ref_layer_top_offset[ref_loc_offset_layer_id[i]]とconf_win_top_offsetとの和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、scaled_ref_layer_top_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
scaled_ref_layer_right_offset[ref_loc_offset_layer_id[i]]とconf_win_right_offsetとの和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプルと同一位置にある現在ピクチャ内のサンプルと、subWCルマサンプルのユニット内の現在ピクチャの右下ルマサンプルとの間の水平オフセットを指定する。ここで、subWCは、このPPSを参照するピクチャのSubWidthCと等しい。scaled_ref_layer_right_offset[ref_loc_offset_layer_id[i]]とconf_win_right_offsetとの和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、scaled_ref_layer_right_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
scaled_ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]とconf_win_bottom_offsetとの和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプルと同一位置にある現在ピクチャ内のサンプルと、subHCルマサンプルのユニット内の現在ピクチャの右下ルマサンプルとの間の垂直オフセットを指定する。ここで、subHCは、このPPSを参照するピクチャのSubHeightCと等しい。scaled_ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]とconf_win_bottom_offsetとの和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、scaled_ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
currTopLeftSample、currBotRightSample、colRefRegionTopLeftSample、及びcolRefRegionBotRightSampleを、それぞれ、現在ピクチャの左上ルマサンプル、現在ピクチャの右下ルマサンプル、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプルと同一位置にある現在ピクチャ内のサンプル、及びref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプルと同一位置にある現在ピクチャ内のサンプルとする。
(scaled_ref_layer_left_offset[ref_loc_offset_layer_id[i]]+conf_win_left_offset)の値が0より大きいとき、colRefRegionTopLeftSampleはcurrTopLeftSampleの右に位置する。(scaled_ref_layer_left_offset[ref_loc_offset_layer_id[i]]+conf_win_left_offset)の値が0より小さいとき、colRefRegionTopLeftSampleはcurrTopLeftSampleの左に位置する。
(scaled_ref_layer_top_offset[ref_loc_offset_layer_id[i]]+conf_win_top_offset)の値が0より大きいとき、colRefRegionTopLeftSampleはcurrTopLeftSampleの下に位置する。(scaled_ref_layer_top_offset[ref_loc_offset_layer_id[i]]+conf_win_top_offset)の値が0より小さいとき、colRefRegionTopLeftSampleはcurrTopLeftSampleの上に位置する。
(scaled_ref_layer_right_offset[ref_loc_offset_layer_id[i]]+conf_win_right_offset)の値が0より大きいとき、colRefRegionBotRightSampleはcurrBotRightSampleの左に位置する。(scaled_ref_layer_right_offset[ref_loc_offset_layer_id[i]]+conf_win_right_offset)の値が0より小さいとき、colRefRegionTopLeftSampleはcurrBotRightSampleの右に位置する。
(scaled_ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]+conf_win_bottom_offset)の値が0より大きいとき、colRefRegionBotRightSampleはcurrBotRightSampleの上に位置する。(scaled_ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]+conf_win_bottom_offset)の値が0より小さいとき、colRefRegionTopLeftSampleはcurrBotRightSampleの下に位置する。
ref_region_offset_present_flag[i]が1に等しいことは、i番目の参照領域のオフセットパラメータがPPS内に存在することを指定する。ref_region_offset_present_flag[i]が0に等しいことは、i番目の参照領域のオフセットパラメータがPPS内に存在しないことを指定する。存在しないとき、ref_region_offset_present_flag[i]の値は0に等しいと推定される。
i番目の参照領域のオフセットパラメータは、同じ復号ピクチャに対する、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の空間対応を指定する。
refConfLeftOffset[ref_loc_offset_layer_id[i]]、refConfTopOffset[ref_loc_offset_layer_id[i]]、refConfRightOffset[ref_loc_offset_layer_id[i]]、及びrefConfBottomOffset[ref_loc_offset_layer_id[i]]を、それぞれ、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャのconf_win_left_offset、conf_win_top_offset、conf_win_right_offset、及びconf_win_bottom_offsetの値とする。
ref_region_left_offset[ref_loc_offset_layer_id[i]]とrefConfLeftOffset[ref_loc_offset_layer_id[i]]との和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプルとsubWCルマサンプルのユニット内の同じ復号ピクチャの左上ルマサンプルとの間の水平オフセットを指定する。ここで、subWCは、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有するレイヤのSubWidthCに等しい。ref_region_left_offset[ref_loc_offset_layer_id[i]]とrefConfLeftOffset[ref_loc_offset_layer_id[i]]との和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、ref_region_left_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
ref_region_top_offset[ref_loc_offset_layer_id[i]]とrefConfTopOffset[ref_loc_offset_layer_id[i]]との和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプルsubHCルマサンプルのユニット内の同じ復号ピクチャの左上ルマサンプルとの間の垂直オフセットを指定する。ここで、subHCは、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有するレイヤのSubHeightCに等しい。ref_region_top_offset[ref_loc_offset_layer_id[i]]とrefConfTopOffset[ref_loc_offset_layer_id[i]]との和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、ref_region_top_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
ref_region_right_offset[ref_loc_offset_layer_id[i]]とrefConfRightOffset[ref_loc_offset_layer_id[i]]との和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプルとsubWCルマサンプルのユニット内の同じ復号ピクチャの右下ルマサンプルとの間の水平オフセットを指定する。ここで、subWCは、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有するレイヤのSubWidthCに等しい。ref_layer_right_offset[ref_loc_offset_layer_id[i]]とrefConfRightOffset[ref_loc_offset_layer_id[i]]との和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、ref_region_right_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
ref_region_bottom_offset[ref_loc_offset_layer_id[i]]とrefConfBottomOffset[ref_loc_offset_layer_id[i]]との和は、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプルとsubHCルマサンプルのユニット内の同じ復号ピクチャの右下ルマサンプルとの間の垂直オフセットを指定する。ここで、subHCは、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有するレイヤのSubHeightCに等しい。ref_layer_bottom_offset[ref_loc_offset_layer_id[i]]とrefConfBottomOffset[ref_loc_offset_layer_id[i]]との和の値は、両端を含む-2
14~2
14-1の範囲であるべきである。存在しないとき、ref_region_bottom_offset[ref_loc_offset_layer_id[i]]の値は0に等しいと推定される。
refPicTopLeftSample、refPicBotRightSample、refRegionTopLeftSample、及びrefRegionBotRightSampleを、それぞれ、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャの左上ルマサンプル、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャの右下ルマサンプル、ref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の左上ルマサンプル、及びref_loc_offset_layer_id[i]に等しいnuh_layer_idを有する復号ピクチャ内の参照領域の右下ルマサンプル、とする。
(ref_region_left_offset[ref_loc_offset_layer_id[i]]+refConfLeftOffset[ref_loc_offset_layer_id[i]])の値が0より大きいとき、refRegionTopLeftSampleはrefPicTopLeftSampleの右に位置する。(ref_region_left_offset[ref_loc_offset_layer_id[i]]+refConfLeftOffset[ref_loc_offset_layer_id[i]])の値が0より小さいとき、refRegionTopLeftSampleはrefPicTopLeftSampleの左に位置する。
(ref_region_top_offset[ref_loc_offset_layer_id[i]]+refConfTopOffset[ref_loc_offset_layer_id[i]])の値が0より大きいとき、refRegionTopLeftSampleはrefPicTopLeftSampleの下に位置する。
(ref_region_top_offset[ref_loc_offset_layer_id[i]]+refConfTopOffset[ref_loc_offset_layer_id[i]])の値が0より小さいとき、refRegionTopLeftSampleはrefPicTopLeftSampleの上に位置する。
(ref_region_right_offset[ref_loc_offset_layer_id[i]]+refConfRightOffset[ref_loc_offset_layer_id[i]])の値が0より大きいとき、refRegionBotRightSampleはrefPicBotRightSampleの左に位置する。
(ref_region_right_offset[ref_loc_offset_layer_id[i]]+refConfRightOffset[ref_loc_offset_layer_id[i]])の値が0より小さいとき、refRegionBotRightSampleはrefPicBotRightSampleの右に位置する。
(ref_region_bottom_offset[ref_loc_offset_layer_id[i]]+refConfBottomOffset[ref_loc_offset_layer_id[i]])の値が0より大きいとき、refRegionBotRightSampleはrefPicBotRightSampleの上に位置する。(ref_region_bottom_offset[ref_loc_offset_layer_id[i]]+refConfBottomOffset[ref_loc_offset_layer_id[i]])の値が0より小さいとき、refRegionBotRightSampleはrefPicBotRightSampleの下に位置する。
【0056】
提案されたシンタックスエレメントが与えられると、実施形態では、限定ではなく、対応するVVCセクションは以下のように変更され得る。(7-xx)及び(8-xx)と付された式は、VVC仕様に挿入される必要がある新しい式を示し、必要に応じて再番号付けされる。
【数4】
変数PicOutputWidthL及びPicOutputHeightLは、以下のように導出される:
【数5】
変数fRefWidthは、ルマサンプル内の参照ピクチャのPicOutputWidthLに等しく設定される。
変数fRefHeightは、ルマサンプル内の参照ピクチャのPicOutputHeightLに等しく設定される。
変数refConfWinLeftOffsetは、ルマサンプル内の参照ピクチャのConfWinLeftOffsetに等しく設定される。
変数refConfWinTopOffsetは、ルマサンプル内の参照ピクチャのConfWinTopOffsetに等しく設定される。
【数6】
【0057】
ROI(描画面サイズ)拡張可能性をサポートするために、仕様は以下のように変更されなければならない:
【数7】
変数PicOutputWidthL及びPicOutputHeightLは、以下のように導出される:
【数8】
変数rLIdは、直接参照レイヤピクチャのnuh_layer_idの値を指定する。
【数9】
変数fRefWidthは、ルマサンプル内の参照ピクチャのPicOutputWidthLに等しく設定される。
変数fRefHeightは、ルマサンプル内の参照ピクチャのPicOutputHeightLに等しく設定される。
【数10】
【0058】
【0059】
別の実施形態では、SHVCと異なり、VVCでは、インターレイヤコーディング中に動きベクトルのサイズについて制約が無いので、ROI領域の間のピクセル対応を見付けるとき、参照レイヤROIの上左位置及びスケーリング済み参照レイヤ(現在ピクチャ)ROIを考慮する必要がない。従って、上述の全ての式で、fRefLeftOffset、fRefTopOffset、fCurLeftOffset及びfCurTopOffsetへの言及を除去できる。
【0060】
図6Aは、上述の処理フローの例示的な要約を提供する。
図6Aに示されるように、ステップ605で、デコーダは、適合ウインドウに関連するシンタックスパラメータ(例えば、conf_win_xxx_offset、ここで、xxxはleft,top,right,又はbottomである)、現在ピクチャのためのスケーリング済み参照レイヤオフセット(例えば、scaled_ref_layer_xxx_offset[])、及び参照レイヤ領域オフセット(例えば、ref_region_xxx_offset[])を受信してよい。インターコーディングではない場合(ステップ610)、復号は単一レイヤ復号におけるように進行し、その他の場合、ステップ615で、デコーダは、(例えば、式(7-43)及び(7-44)を用いて)参照及び現在ピクチャの両方について適合ウインドウを計算する。インターレイヤコーディングではない場合(ステップ620)、依然として、同じレイヤにおいて異なる解像度を有するピクチャについてのインター予測のためのRPR倍率を計算する必要があり、次に、復号は単一レイヤ復号におけるように進行し、その他の場合(インターレイヤコーディングによる)、デコーダは、受信したオフセットに基づき(例えば、式(8-753)及び(8-754)のhori_scale_fp及びvert_scale_fpを計算することにより)、現在及び参照ピクチャについて倍率を計算する。
【0061】
前述のように(例えば、式(8-x1)~(8-x2)を参照)、デコーダは、参照レイヤピクチャのPicOutputWidthL及びPicOutputHeightLから、参照レイヤの左及び右オフセット値(例えば、RefLayerRegionLeftOffset及びRefLayerRegionRightOffset)並びに上及び下オフセット(例えば、RefLayerRegionTopOffset及びRefLayerRegionBottomOffset)を減算することにより、参照ROIの幅及び高さ(例えば、fRefWidth及びfRefHeight)を計算する必要がある。
【0062】
同様に(例えば、式(8-x3)~(8-x4)を参照)、デコーダは、現在レイヤピクチャのPicOutputWidthL及びPicOutputHeightLから、左及び右オフセット値(例えば、ScaledRefLayerLeftOffset及びScaledRefLayerRightOffset)並びに上及び下オフセット(例えば、ScaledRefLayerTopOffset及びScaledRefLayerBottomOffset)を減算することにより、現在ROIの幅及び高さ(例えば、fCurWidth及びfCurHeight)を計算する必要がある。現在及び参照ROIのこれらの調整済みサイズが与えられると、最小限の追加の変更しか必要なく(上記の灰色強調部分で示される)、デコーダは、既存のVVC RPRブロックにおけるように(例えば、式(8-755)~式(8-766)の処理)、水平及び垂直倍率を決定する(例えば、式(8-753)及び(8-754)を参照)。
【0063】
式(8-x5)~(8-x8)では、適正なピクセル対応のための適合ウインドウの左上角に対する、参照及び現在ROIの正しい位置を決定するために、調整済み左及び上オフセットも計算される。
【0064】
第2の実施形態では、適合ウインドウオフセット及びROIオフセットの両方を(例えば、それらを一緒に加算することにより)結合するために、ref_region_xxx_offset[]及びscaled_ref_region_xxx_offset[]オフセットの定義を再定義してよい。例えば、表5で、scaled_ref_layer_xxx_offsetを以下のように定義されるscaled_ref_layer_xxx_offset_sumにより置き換えてよい:
【数13】
【0065】
同様の定義は、ref_region_xxx_offset_sumについても生成でき、ここで、xxx=bottom、top、left、及びrightである。説明されるように、ステップ615における処理はステップ625における処理と結合されてよいので、これらのパラメータは、デコーダがステップ615をスキップすることを許容する。
【0066】
例として、
図6Aでは、
a)ステップ615で、ピクチャ幅から、適合ウインドウ左及び右オフセットを減算することにより、PicOutputWidthLを計算してよい(例えば、式(7-43)を参照)。
b)fCurWidth=PicOutputWidthLとする。
c)次に、ステップ625で、ScaledRefLayer左及び右オフセットを減算することにより、fCurWidth(例えば、(8-x3)を参照)を調整するが、式(7-xx)から、これらはscaled_ref_layer左及び右オフセットに基づく。例えば、現在ROIの幅だけを調整することを考えると、簡略化した表記では(つまり、SubWidthCスケーリングパラメータを無視することにより)、以下のように計算できる。
ピクチャ出力幅
=ピクチャ幅
-(適合ウインドウ左オフセット+適合ウインドウ右オフセット) (2)
ROI現在幅=ピクチャ出力幅-(ROI現在左オフセット+ROI現在右オフセット) (3)
式(2)及び(3)を一緒に結合することにより、
ROI現在幅
=ピクチャ幅
-((適合ウインドウ左オフセット+ROI現在左オフセット)
+(適合ウインドウ右オフセット+ROI現在右オフセット)) (4)
【0067】
以下の通りであるとすると、
ROI現在左合計オフセット=適合ウインドウ左オフセット+ROI現在左オフセット
ROI現在右合計オフセット=適合ウインドウ右オフセット+ROI現在右オフセット
式(4)は以下のように簡略化できる:
ROI現在幅=ピクチャ幅-((ROI現在左合計オフセット)+(ROI現在右合計オフセット))(5)
新しい「合計(sum)」オフセット(例えば、ROI現在左合計オフセット)の定義は、式(1)で定義されたref_region_left_offset_sumの定義に対応する。
【0068】
従って、上述のように、レイヤのconf_win_left_offsetの合計を含むように、scaled_ref_layer左及び見意義オフセットを再定義する場合、ブロック615及び625に進み、現在及び参照ROIの幅及び高さを計算する(例えば、式(2)及び(3)は1つに結合できる(例えば、式(5)))(例えば、ステップ630)。
【0069】
図6Bに示すように、ステップ615及び625は、単一のステップ630に結合できる。
図6Aと比べて、このアプローチは、幾つかの加算を節約するが、改定されたオフセット(例えば、scaled_ref_layer_left_offset_sum[])は今やより大きな量になり、従って、それらは、ビットストリーム内で符号化されるためにより多くのビットを必要とする。conf_win_xxx_offset値はレイヤ毎に異なってよく、それらの値は各レイヤにおけるPPS情報により抽出できることに留意する。
【0070】
第3の実施形態では、インターレイヤピクチャの間で水平及び垂直倍率(例えば、hori_scale_fp及びvert_scale_fp)を明示的にシグナリングしてよい。そのようなシナリオでは、レイヤ毎に、水平及び垂直倍率、並びに上及び左オフセットを通信する必要がある。
【0071】
同様のアプローチは、任意のアップサンプリング及びダウンサンプリングフィルタを用いて、それぞれに複数のROIを組み込むピクチャを有する実施形態に適用可能である。
<参考文献>
ここに列挙された参考文献の各々は、参照によりその全体がここに組み込まれる。
[1] High efficiency video coding, H.265, Series H, Coding of moving video, ITU, (02/2018)
[2] B. Bross, J. Chen, and S. Liu, “Versatile Video Coding (Draft 6),” JVET output document, JVET-O2001, vE, uploaded July 31, 2019
[3] S. Wenger, et al., “AHG8: Spatial scalability using reference picture resampling,“ JVET-O0045, JVET Meeting, Gothenburg, SE, July 2019
[4] R. Skupin et al., AHG12: “On filtering of independently coded region,” JVET-O0494 (v3), JVET Meeting, Gothenburg, SE, July 2019
<例示的なコンピュータシステムの実装>
本発明の実施形態は、コンピュータシステム、電子回路及びコンポーネント内に構成されるシステム、マイクロコントローラのような集積回路(IC)装置、FPGA(field programmable gate array)、又は別の構成可能な又はプログラム可能な論理装置(PLD)、個別時間又はデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、及び/又はこのようなシステム、装置、又はコンポーネントのうちの1つ以上を含む機器により実装されてよい。コンピュータ及び/又はICは、本願明細書に記載したような描画面サイズ拡張可能性に関連する命令を実行し、制御し、又は実行してよい。コンピュータ及び/又はICは、本願明細書に記載した描画面サイズ拡張可能性に関連する種々のパラメータ又は値のうちのいずれかを計算してよい。画像及びビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、及びそれらの種々の組み合わせで実施されてよい。
【0072】
本発明の特定の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ、等の中の1つ以上のプロセッサは、プロセッサのアクセス可能なプログラムメモリ内のソフトウェア命令を実行することにより、上述の描画面サイズ拡張可能性に関連する方法を実施してよい。本発明bの実施形態は、プログラムプロダクトの形式で提供されてもよい。プログラムプロダクトは、データプロセッサにより実行されるとデータプロセッサに本発明の方法を実行させる命令を含むコンピュータ可読信号のセットを運ぶ任意の非一時的有形媒体を含んでよい。本発明によるプログラムプロダクトは、種々の非一時的有形形式うちの任意のものであってよい。プログラムプロダクトは、例えば、フロッピーディスクを含む磁気データ記憶媒体、ハードディスクドライブ、CDROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体、等のような物理媒体を含んでよい。プログラムプロダクト上のコンピュータ可読信号は、光学的に圧縮又は暗号化されてよい。
【0073】
コンポーネント(例えば、ソフトウェアモジュール、プロセッサ、部品、装置、回路、等)が以上で言及されたが、特に断りのない限り、それらのコンポーネントの言及(「手段」の言及を含む)は、それらのコンポーネントの均等物、記載したコンポーネントの機能を実行する(例えば、機能的に均等な)任意のコンポーネント、本発明の図示の例示的な実施形態における機能を実行する開示の構造と構造的に等しくないコンポーネントを含むと解釈されるべきである。
【0074】
<均等物、拡張機能、代替案、等(Equivalents, Extensions, Alternatives and Miscellaneous)>
従って、描画面サイズ拡張可能性に関連する例示的な実施形態が記載される。以上の明細書において、本発明の実施形態は、実装毎に変化し得る多数の特定の詳細を参照して説明された。従って、本発明が何であるかの単独及び排他的な指示、及び出願人が本発明であることを意図するものは、本願により、いかなる後の補正を含む、特定の形式で発行される請求の範囲に記載される。このような請求の範囲に含まれる用語について本願明細書に明示的に記載された任意の定義は、請求の範囲において使用されるこのような用語の意味を支配するべきである。従って、請求の範囲に明示的に記載されないいかなる限定、要素、特徴、利点、又は属性は、いかなる方法でも、請求の範囲の範囲を限定すべきではない。明細書及び図面は、従って、限定的意味では無く、説明であると考えられるべきである。