(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-11-25
(54)【発明の名称】復号装置、符号化装置、および方法
(51)【国際特許分類】
H04N 19/70 20140101AFI20221117BHJP
H04N 19/167 20140101ALI20221117BHJP
H04N 19/85 20140101ALI20221117BHJP
H04N 19/102 20140101ALI20221117BHJP
H04N 19/33 20140101ALI20221117BHJP
【FI】
H04N19/70
H04N19/167
H04N19/85
H04N19/102
H04N19/33
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022518776
(86)(22)【出願日】2020-09-24
(85)【翻訳文提出日】2022-05-20
(86)【国際出願番号】 EP2020076690
(87)【国際公開番号】W WO2021058638
(87)【国際公開日】2021-04-01
(32)【優先日】2019-09-24
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】サンチェス デ ラ フエンテ ヤゴ
(72)【発明者】
【氏名】ズーリング カルステン
(72)【発明者】
【氏名】ヘルゲ コーネリアス
(72)【発明者】
【氏名】ツェル トーマス
(72)【発明者】
【氏名】スクピン ロベルト
(72)【発明者】
【氏名】ウィーガンド トーマス
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159KK13
5C159LA02
5C159LC08
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159MA32
5C159MC11
5C159ME01
5C159PP04
5C159RC11
5C159TA01
5C159TC34
5C159UA02
5C159UA05
(57)【要約】
ビデオのビデオシーケンスの複数のピクチャを再構成するために、符号化ピクチャデータを含む符号化ビデオ信号を復号するビデオデコーダ(151)。ビデオデコーダ(151)は、符号化ピクチャデータを含む符号化ビデオ信号を受信するように構成された入力インタフェース(160)を備える。さらに、ビデオデコーダ(151)は、符号化ピクチャデータに応じてビデオシーケンスの複数のピクチャを再構成するように構成されたデータデコーダ(170)を備える。さらに、実施形態によるさらなるビデオデコーダ、ビデオエンコーダ、システム、符号化および復号化のための方法、コンピュータプログラム、および符号化ビデオ信号が提供される。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ビデオのビデオシーケンスの複数のピクチャを復号するために、符号化ピクチャデータを備える符号化ビデオ信号を復号するビデオデコーダ(151)であって、ビデオデコーダ(151)は:
前記符号化ピクチャデータおよびメッセージを備える、前記符号化ビデオ信号を受信するように構成された入力インタフェース(160)であって、前記メッセージは、サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、またはサンプルアスペクト比がビデオシーケンス内で変更可能であるか否かを示す指示を備える、入力インタフェース(160)と、
前記符号化ピクチャデータを復号して複数の復号されたピクチャを得るように構成されたデータデコーダ(170)と、
を備え、
前記データデコーダ(170)は、前記指示に応じて前記ビデオシーケンスの前記複数のピクチャを再構成するように構成されており、
前記データデコーダ(170)は、前記複数の復号化ピクチャを出力するように構成されており、
前記データデコーダ(170)は、前記複数の復号化ピクチャのうちの1つまたは複数のためのサンプルアスペクト情報を出力するように構成され、前記複数の復号化ピクチャのうちの1つまたは複数のための前記サンプルアスペクト情報は、サンプルアスペクト比がビデオシーケンスに対して一定であるか否か、またはサンプルアスペクト比がビデオシーケンス内で変更可能であるか否かの指示に依存する、
ビデオデコーダ(151)。
【請求項2】
前記指示が、前記サンプルアスペクト比が一定であることを示す場合、前記メッセージは、前記ビデオシーケンスのためのサンプルアスペクト比値を含み、前記ビデオシーケンスの前記複数のピクチャの前記サンプルアスペクト比情報は、前記ビデオシーケンスの前記複数のピクチャが前記メッセージに備えられる前記サンプルアスペクト比値であるサンプルアスペクト比を有することを特定する、
請求項1に記載のビデオデコーダ(151)。
【請求項3】
前記メッセージは、最初のメッセージであり、
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記入力インタフェース(160)は、前記符号化ビデオ信号内で第2のメッセージを受信するように構成され、前記第2のメッセージは、前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数の第1のグループのための第1の特定のサンプルアスペクト比値を備え、前記第1のグループの前記複数のピクチャのうちの前記1つまたは複数の前記サンプルアスペクト比情報は、前記第1の特定のサンプルアスペクト比値であるサンプルアスペクト比を前記第1のグループの前記複数のピクチャのうちの前記1つまたは複数が有することを特定する、
請求項1または2に記載のビデオデコーダ(151)。
【請求項4】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記入力インタフェース(160)は、前記符号化ビデオ信号内で第3のメッセージを受信するように構成されており、前記第3のメッセージは、前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数の第2のグループのための第2の特定のサンプルアスペクト比値を備え、前記第2のグループは前記第1のグループとは異なり、前記第2のグループの前記複数のピクチャのうちの1つまたは複数のための前記サンプルアスペクト比情報は、前記第2の特定のサンプルアスペクト比値であるサンプルアスペクト比値を有することを特定する、
請求項3に記載のビデオデコーダ(151)。
【請求項5】
前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数のうちの前記第1のグループは、前記第1の特定のサンプルアスペクト比値を備える前記第2のメッセージが前記入力インタフェース(110)によって受信された後であって、前記第2の特定のサンプルアスペクト比値を含む前記第3のメッセージが前記入力インタフェース(110)によって受信される前に、前記入力インタフェース(110)によって受信される前記符号化ピクチャデータ内で符号化される前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数を備えており、
前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数のうちの前記第2のグループは、前記第2の特定のサンプルアスペクト比を備える前記第3のメッセージが前記入力インタフェース(110)によって受信された後に前記入力インタフェース(110)によって受信される前記符号化ピクチャデータ内で符号化される前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数を備えている、
請求項4に記載のビデオデコーダ(151)。
【請求項6】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記第1のメッセージは、前記ビデオシーケンスの前記複数のピクチャのいずれに対しても、いずれのサンプルアスペクト比値も含まない、
請求項4に記載のビデオデコーダ(151)。
【請求項7】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数の前記第1のグループは、前記第2の特定のサンプルアスペクト比を含む前記第3のメッセージが前記入力インタフェース(110)によって受信される前に、前記入力インタフェース(110)によって受信される前記符号化ピクチャデータ内で符号化される前記ビデオシーケンスの複数のピクチャのうちの前記1つまたは複数を備えている、
請求項6に記載のビデオデコーダ(151)。
【請求項8】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記第1のメッセージは、前記ビデオシーケンスのためのデフォルトサンプルアスペクト比値を備えており、前記ビデオシーケンスの前記複数のピクチャのための前記サンプルアスペクト比情報は、前記デフォルトサンプルアスペクト比値に依存する、
請求項3から5のいずれか一項に記載のビデオデコーダ(151)。
【請求項9】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記入力インタフェース(160)が前記第1の特定のサンプルアスペクト比値を備える前記第2のメッセージを受信する前に、前記入力インタフェース(160)によって受信される前記符号化ピクチャデータ内で符号化される、前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数のための前記サンプルアスペクト比情報は、前記複数のピクチャのうちの前記1つまたは複数が前記デフォルトサンプルアスペクト比値であるサンプルアスペクト比を有することを特定する、
請求項8に記載のビデオデコーダ(151)。
【請求項10】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記第1のメッセージは、前記第1のメッセージがデフォルトサンプルアスペクト比値を備えるか否かに関する情報を備え、
前記第1のメッセージが前記デフォルトサンプルアスペクト比値を備える場合、前記ビデオシーケンスの前記複数のピクチャの前記サンプルアスペクト比情報は、前記デフォルトサンプルアスペクト比値に依存する、
請求項3から5のいずれか一項に記載のビデオデコーダ(151)。
【請求項11】
前記第1のメッセージは、シーケンスパラメータセット(sequence parameter set)である、
請求項1から10のいずれか一項に記載のビデオデコーダ(151)。
【請求項12】
前記第2のメッセージは、サプリメンタルエンハンスメント情報(supplemental enhancement information)である、
請求項3から9のいずれか一項に記載のビデオデコーダ(151)。
【請求項13】
前記第2のメッセージは、ピクチャパラメータセット(picture parameter set)である、
請求項3から9のいずれか一項に記載のビデオデコーダ(151)。
【請求項14】
前記複数のピクチャのうちの1つまたは複数のためのサンプルアスペクト比値は、前記複数のピクチャのうちの前記1つまたは複数の前記ピクチャパラメータセット内でシグナリングされ、前記ピクチャパラメータセットは、前記ピクチャのピクチャ解像度をさらに備える、
請求項13に記載のビデオデコーダ(151)。
【請求項15】
ビデオのビデオシーケンスの複数のピクチャを符号化するビデオエンコーダ(101)であって、前記ビデオエンコーダ(101)は:
前記ビデオシーケンスの前記複数のピクチャに応じて符号化ビデオ信号を生成するように構成されたデータエンコーダ(110)と、
前記符号化ビデオ信号を出力する出力インタフェース(120)と、
を備え、
前記データエンコーダ(110)は、前記ビデオシーケンスの前記複数のピクチャを符号化ピクチャデータに符号化するように構成されており、
前記データエンコーダ(110)は、サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、または前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であるか否かを示す指示を備えるメッセージを生成するように構成されており、
前記データエンコーダ(110)は、前記符号化ビデオ信号が前記メッセージおよび前記符号化ピクチャデータを備えるように、前記符号化ビデオ信号を生成するように構成されている、
ビデオエンコーダ(101)。
【請求項16】
前記指示が、前記サンプルアスペクト比が一定であることを示す場合、前記メッセージは、前記ビデオシーケンスのためのサンプルアスペクト比値を備える、
請求項15に記載のビデオエンコーダ(101)。
【請求項17】
前記メッセージは、第1のメッセージであり、
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数の前記第1のグループのための第1の特定のサンプルアスペクト比値を備える第2のメッセージを生成するように構成されており、前記データエンコーダ(110)は、前記符号化ビデオ信号が前記第1のメッセージ、前記第2のメッセージ、および前記符号化ピクチャデータを備えるように、前記符号化ビデオ信号を生成するように構成されている、
請求項15または16に記載のビデオエンコーダ(101)。
【請求項18】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数の第2のグループのための第2の特定のサンプルアスペクト比値を備える第3のメッセージを生成するように構成されており、前記第2のグループは前記第1のグループとは異なり、前記データエンコーダ(110)は、前記符号化ビデオ信号が前記第3のメッセージをさらに備えるように、前記符号化ビデオ信号を生成するように構成されている、
請求項17に記載のビデオエンコーダ(101)。
【請求項19】
前記データエンコーダ(110)は、
前記第2のメッセージの前の前記第1のメッセージ、
前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数の前記第1のグループの符号化の前の前記第2のメッセージ、
前記第3のメッセージの前の前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数の前記第1のグループの前記符号化、
前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数の前記第2のグループの前記符号化の前の前記第3のメッセージを、
前記符号化ビデオ信号内に配置するように構成されている、
請求項18に記載のビデオエンコーダ(101)。
【請求項20】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記第1のメッセージは、前記ビデオシーケンスの前記複数のピクチャのいずれに対しても、いずれのサンプルアスペクト比値も備えない、
請求項18に記載のビデオエンコーダ(101)。
【請求項21】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記第2のメッセージの前に前記第1のメッセージを、前記符号化ビデオ信号内の前記ビデオシーケンスの前記複数のピクチャのうちの前記1つまたは複数の前記第1のグループの符号化の前に前記第2のメッセージを、配置するように構成されている、
請求項20に記載のビデオエンコーダ(101)。
【請求項22】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記第1のメッセージが前記ビデオシーケンスのデフォルトサンプルアスペクト比値を備えるように、前記第1のメッセージを生成するように構成されている、
請求項17から19のいずれか一項に記載のビデオエンコーダ(101)。
【請求項23】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記符号化ビデオ信号内の前記第1のメッセージと前記第2のメッセージとの間に配置される符号化によって符号化される前記ビデオシーケンスの前記複数のピクチャのうちの1つまたは複数が、前記デフォルトサンプルアスペクト比値を有するように、前記符号化ビデオ信号を生成するように構成されている、
請求項22に記載のビデオエンコーダ(101)。
【請求項24】
前記指示が、前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であることを示す場合、前記データエンコーダ(110)は、前記第1のメッセージが前記デフォルトサンプルアスペクト比値を備えるか否かに関する情報を備えるように、前記第1のメッセージを生成するように構成される、
請求項17から19のいずれか一項に記載のビデオエンコーダ(101)。
【請求項25】
データエンコーダ(110)は、シーケンスパラメータセットとして前記第1のメッセージを生成するように構成されている、
請求項15から24のいずれか一項に記載のビデオエンコーダ(101)。
【請求項26】
データエンコーダ(110)は、サプリメンタルエンハンスメント情報として前記第2のメッセージを生成するように構成されている、
請求項17から23のいずれか一項に記載のビデオエンコーダ(101)。
【請求項27】
データエンコーダ(110)は、ピクチャパラメータセットとして前記第2のメッセージを生成するように構成されている、
請求項17から23のいずれか一項に記載のビデオエンコーダ(101)。
【請求項28】
前記複数のピクチャのうちの1つまたは複数のためのサンプルアスペクト比値は、前記複数のピクチャのうちの前記1つまたは複数の前記ピクチャパラメータセット内でシグナリングされ、前記ピクチャパラメータセットは、前記ピクチャの前記ピクチャ解像度をさらに備える、
請求項27に記載のビデオエンコーダ(101)。
【請求項29】
ビデオのビデオシーケンスの複数のピクチャを符号化する符号化ピクチャデータを備える、符号化ビデオ信号を復号するための方法であって、前記方法は:
前記符号化ピクチャデータを備える前記符号化ビデオ信号を受信するステップであって、前記符号化ビデオ信号を受信するステップは、前記符号化ビデオ信号内でメッセージを受信するステップを備え、前記メッセージは、前記サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、または前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であるか否かを示す指示を備える、ステップと、
前記符号化ピクチャデータを復号して複数の復号化ピクチャを得るステップと、
前記複数の復号化ピクチャを出力するステップと、
前記複数の復号化ピクチャのうちの1つまたは複数のためのサンプルアスペクト情報を出力するステップであって、前記複数の復号化ピクチャのうちの前記1つまたは複数のための前記サンプルアスペクト情報は、サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、またはサンプルアスペクト比が前記ビデオシーケンス内で変更可能であるか否かの指示に依存する、ステップと、
を備える、方法。
【請求項30】
ビデオのビデオシーケンスの複数のピクチャを符号化する方法であって、前記方法は:
前記ビデオシーケンスの前記複数のピクチャに応じた符号化ビデオ信号を生成するステップ、および
前記符号化ビデオ信号を出力するステップと、
を備え、
前記符号化ビデオ信号を生成するステップは、前記ビデオシーケンスの前記複数のピクチャを符号化ピクチャデータに符号化するステップを備えており、
前記符号化ビデオ信号を生成するステップは、前記サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、または前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であるか否かを示す指示を含むメッセージを生成するステップを備えており、
前記符号化ビデオ信号を生成するステップは、前記符号化ビデオ信号が前記メッセージおよび前記符号化ピクチャデータを備えるように行われる、
方法。
【請求項31】
コンピュータまたは信号プロセッサ上で実行されるときに、請求項29または30に記載の方法を実施する、
コンピュータプログラム。
【請求項32】
ビデオのビデオシーケンスの複数のピクチャを符号化する符号化ビデオ信号であって、
前記符号化ビデオ信号は、メッセージと符号化ピクチャデータとを備えており、
前記符号化ピクチャデータは、前記ビデオシーケンスの前記複数のピクチャの符号化を備えており、
前記メッセージは、前記サンプルアスペクト比が前記ビデオシーケンスに対して一定であるか否か、または前記サンプルアスペクト比が前記ビデオシーケンス内で変更可能であるか否かを示す指示を備えている、
符号化ビデオ信号。
【請求項33】
符号化ビデオ信号を生成し、ビデオのビデオシーケンスの複数のピクチャを再構成するシステムであって、前記システムは:
請求項15から28のいずれか一項に記載の前記ビデオエンコーダ(101)、および
請求項1から14のいずれか一項に記載の前記ビデオデコーダ(151)、
を備え、
前記ビデオエンコーダ(101)は、前記ビデオシーケンスの前記複数のピクチャに応じて前記符号化ビデオ信号を生成するように構成されており、
前記ビデオデコーダ(151)は、前記符号化ビデオ信号に応じて前記ビデオシーケンスの前記複数のピクチャを再構成するように構成されている、
システム。
【請求項34】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを備える符号化ビデオ信号を復号するビデオデコーダ(151)であって、前記ビデオデコーダ(151)は:
前記符号化ピクチャデータを備える前記符号化ビデオ信号を受信するように構成されている入力インタフェース(160)、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するように構成されているデータデコーダ(170)
を備え、
前記入力インタフェース(160)は、1つまたは複数のメッセージを受信するように構成されており、1つまたは複数の前記メッセージのそれぞれは、前記ビデオの前記複数のピクチャのうちの1つまたは複数に対するスケーリング情報を示しており、
前記データデコーダ(170)は、前記ビデオの前記複数のピクチャのうちの前記1つまたは複数のための前記スケーリング情報に応じて、前記ビデオシーケンスの前記複数のピクチャを再構成するように構成されている、
ビデオデコーダ(151)。
【請求項35】
前記スケーリング情報は、スケーリング係数である、
請求項34に記載のビデオデコーダ(151)。
【請求項36】
リサンプリング規則は、前記ピクチャの参照ピクチャに関して前記ビデオの前記複数のピクチャのリサンプリング比をリサンプリングすることが許可されるかまたは禁止されるかを示しており、
前記入力インタフェース(160)は、1つまたは複数の前記メッセージを受信するように構成され、前記1つまたは複数のメッセージのそれぞれは前記リサンプリング規則に従って、前記ビデオの前記複数のピクチャのうちの前記1つまたは複数のための前記スケーリング情報を示しており、
前記データデコーダ(170)は、前記リサンプリング規則が、前記リサンプリングが禁止されていることを示している場合、前記ピクチャの参照ピクチャに関して前記ビデオの前記複数のピクチャのうちのいずれか1つのリサンプリングを実行することなく、前記1つまたは複数のメッセージに応じて前記ビデオシーケンスの複数のピクチャを再構成するように構成されている、
請求項34または35に記載のビデオデコーダ(151)。
【請求項37】
前記リサンプリング規則は、前記ビデオの前記複数のピクチャの各ピクチャについて、前記ピクチャを前記ピクチャの参照ピクチャに関してリサンプリングすることが許可されるか禁止されるかを示している、
請求項36に記載のビデオデコーダ(151)。
【請求項38】
前記リサンプリング規則は、解像度変更がランダムアクセスポイントにおいてのみ許可されるように定義されている、
請求項36または37に記載のビデオデコーダ(151)。
【請求項39】
前記リサンプリング規則は、解像度変更がピクチャの階層グループ内の所定のキーピクチャにおいてのみ許可されるように定義されている、
請求項36または37に記載のビデオデコーダ(151)。
【請求項40】
前記リサンプリング規則は、プレゼンテーション順序でキーピクチャの直後に続く前記複数のピクチャのうちのピクチャにおいてのみ解像度変更が許可されるように定義されている、
請求項36または37に記載のビデオデコーダ(151)。
【請求項41】
前記リサンプリング規則は、連続する解像度変化間の前記時間的距離がレベル定義における中間の符号化ピクチャの最小数によって制限されるように定義されている、
請求項36または37に記載のビデオデコーダ(151)。
【請求項42】
前記リサンプリング規則は、解像度の変更が破棄不可(non-discardable)として、または参照ピクチャとしてマークされたピクチャにおいてのみ許可されるように定義されている、
請求項36または37に記載のビデオデコーダ(151)。
【請求項43】
前記リサンプリング規則は、解像度の変化率を制限するレベル定義に依存する、
請求項34から42のいずれか一項に記載のビデオデコーダ(151)。
【請求項44】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャに対する参照ピクチャの前記リサンプリングが単一のリサンプリング係数を使用するように制限されるように定義されている、
請求項34から43のいずれか一項に記載のビデオデコーダ(151)。
【請求項45】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャの1つの参照ピクチャがリサンプリングを必要とするとき、リサンプリングを使用するために前記現在のピクチャのすべての参照ピクチャが必要とされるように定義されている、
請求項34から43のいずれか一項に記載のビデオデコーダ(151)。
【請求項46】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャの1つの参照ピクチャのみがリサンプリングを必要とすることを許可されるように定義されている、
請求項34から43のいずれか一項に記載のビデオデコーダ(151)。
【請求項47】
前記入力インタフェース(160)は、解像度変更ポイントでのリサンプリングを必要とする前記複数のピクチャの最大数を示す、前記符号化ビデオ信号内の指示を受信するように構成されており、
前記リサンプリング規則は、前記解像度変更ポイントにおいてリサンプリングを必要とする前記複数のピクチャの前記最大数が、前記指示において特定されるように定義されている、
請求項34から43のいずれか一項に記載のビデオデコーダ(151)。
【請求項48】
前記符号化ビデオ信号内に前記指示が存在しない場合、前記データデコーダ(170)は、レベル定義から前記解像度変更ポイントでのリサンプリングを必要とする前記複数のピクチャの前記最大数を導出するように構成されている、
請求項47に記載のビデオデコーダ(151)。
【請求項49】
前記データデコーダ(170)は、オリジナル参照ピクチャをリサンプリングすることから生じる、リサンプリングされた参照ピクチャのみがそこから利用可能であるように、リサンプリングされた後に参照ピクチャリストからおよび/または復号化ピクチャバッファ(decoded picture buffer)から前記オリジナル参照ピクチャを除去するように構成されている、
請求項34から48のいずれか一項に記載のビデオデコーダ(151)。
【請求項50】
前記リサンプリング規則は、符号化ビデオシーケンス内で使用されるリサンプリング係数が一組のリサンプリング係数に制限されるように定義されている、
請求項34から49のいずれか一項に記載のビデオデコーダ(151)。
【請求項51】
ビデオの複数のピクチャを符号化するビデオエンコーダ(101)であって、前記ビデオエンコーダ(101)は:
前記ビデオの複数のピクチャに応じて符号化ビデオ信号を生成するように構成されておりデータエンコーダ(110)、および
前記符号化ビデオ信号を出力するための出力インタフェース(120)
を備え、
前記データエンコーダ(110)は、前記ビデオの前記複数のピクチャを符号化ピクチャデータに符号化するように構成されており、
前記データエンコーダ(110)は、1つまたは複数のメッセージを生成するように構成され、前記1つまたは複数のメッセージのそれぞれは前記ビデオの前記複数のピクチャのうちの1つまたは複数のためのスケーリング情報を示す、
ビデオエンコーダ(101)
【請求項52】
前記スケーリング情報はスケーリング係数である、
請求項51に記載のビデオエンコーダ(101)。
【請求項53】
前記リサンプリング規則は、前記ビデオの前記複数のピクチャのうちのピクチャを前記ピクチャの参照ピクチャに関してリサンプリングすることが許可されるか禁止されるかを示しており、
前記データエンコーダ(110)は、前記1つまたは複数のメッセージを生成するように構成され、前記1つまたは複数のメッセージのそれぞれは前記リサンプリング規則に従って前記ビデオの前記複数のピクチャのうちの前記1つまたは複数の前記スケーリング情報を示す、
請求項51または52に記載のビデオエンコーダ(101)。
【請求項54】
前記リサンプリング規則は、前記ビデオの前記複数のピクチャの各ピクチャについて、前記ピクチャを前記ピクチャの参照ピクチャに関してリサンプリングすることが許可されるか禁止されるかを示す、
請求項53に記載のビデオエンコーダ(101)。
【請求項55】
前記リサンプリング規則は、解像度変更がランダムアクセスポイントにおいてのみ許可されるように定義されている、
請求項53または54に記載のビデオエンコーダ(101)。
【請求項56】
前記リサンプリング規則は、解像度変更がピクチャの階層グループ内の所定のキーピクチャにおいてのみ許可されるように定義されている、
請求項53または54に記載のビデオエンコーダ(101)。
【請求項57】
前記リサンプリング規則は、プレゼンテーション順序でキーピクチャの直後に続く前記複数のピクチャのうちのピクチャにおいてのみ解像度変更が許可されるように定義されている、
請求項53または54に記載のビデオエンコーダ(101)。
【請求項58】
前記リサンプリング規則は、連続する解像度変化間の前記時間的距離がレベル定義における中間の符号化ピクチャの最小数によって制限されるように定義されている、
請求項53または54に記載のビデオエンコーダ(101)。
【請求項59】
リサンプリング規則は、解像度の変化が破棄不可として、または参照ピクチャとしてマークされたピクチャにおいてのみ生じ得るように定義されている、
請求項53または54に記載のビデオエンコーダ(101)。
【請求項60】
前記リサンプリング規則は、解像度の変化率を制限するレベル定義に依存する、
請求項51から59のいずれか一項に記載のビデオエンコーダ(101)。
【請求項61】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャに対する参照ピクチャの前記リサンプリングが単一のリサンプリング係数を使用するように制限されるように定義されている、
請求項51から60のいずれか一項に記載のビデオエンコーダ(101)。
【請求項62】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャのための1つの参照ピクチャがリサンプリングを必要とするとき、リサンプリングを使用するために前記現在のピクチャのすべての参照ピクチャが必要とされるように定義されている、
請求項51から60のいずれか一項に記載のビデオエンコーダ(101)。
【請求項63】
前記リサンプリング規則は、前記複数のピクチャのうちの現在のピクチャの1つの参照ピクチャのみがリサンプリングを必要とすることが許可されるように定義されている、
請求項51から60のいずれか一項に記載のビデオエンコーダ(101)。
【請求項64】
前記データエンコーダ(110)は、解像度変法ポイントでのリサンプリングを必要とする前記複数のピクチャの最大数を示す指示を、前記符号化ビデオ信号内で生成するように構成されており、
前記リサンプリング規則は、前記解像度変更ポイントにおいてリサンプリングを必要とする前記複数のピクチャの最大数が、前記指示において特定されるように定義されている、
請求項51から60のいずれか一項に記載のビデオエンコーダ(101)。
【請求項65】
前記符号化ビデオ信号内に前記指示が存在しない場合、前記解像度変更ポイントでのリサンプリングを必要とする前記複数のピクチャの前記最大数は、レベル定義に依存する、
請求項64に記載のビデオエンコーダ(101)。
【請求項66】
前記データエンコーダ(110)は、オリジナル参照ピクチャをリサンプリングすることから生じる、リサンプリングされた参照ピクチャのみがそこから利用可能であるように、リサンプリングされた後に参照ピクチャリストからおよび/または復号化ピクチャバッファ(decoded picture buffer)から前記オリジナル参照ピクチャを除去するように構成されている、
請求項51から65のいずれか一項に記載のビデオエンコーダ(101)。
【請求項67】
前記リサンプリング規則は、符号化ビデオシーケンス内で使用されるリサンプリング係数が一組のリサンプリング係数に制限されるように定義されている、
請求項51から66のいずれか一項に記載のビデオエンコーダ(101)。
【請求項68】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを含む符号化ビデオ信号を復号する方法であって、前記方法は:
前記符号化ピクチャデータを備える前記符号化ビデオ信号を受信するステップ、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するステップ
を備え、
前記符号化ビデオ信号を受信するステップは、1つまたは複数のメッセージを受信するステップを備え、前記1つまたは複数のメッセージのそれぞれは前記ビデオの前記複数のピクチャのうちの1つまたは複数のためのスケーリング情報を示しており、
前記ビデオシーケンスの複数のピクチャを再構成するステップは、前記ビデオの前記複数のピクチャのうちの前記1つまたは複数のための前記スケーリング情報に応じて行われる、
方法。
【請求項69】
ビデオの複数のピクチャを符号化する方法であって、前記方法は:
前記ビデオの前記複数のピクチャに応じた符号化ビデオ信号を生成するステップ、および
前記符号化ビデオ信号を出力するステップ、
を備え、
前記符号化ビデオ信号を生成するステップは、前記ビデオの前記複数のピクチャを符号化ピクチャデータに符号化するステップを備えており、
前記符号化ビデオ信号を生成するステップは、1つまたは複数のメッセージを生成するステップを備え、前記1つまたは複数のメッセージのそれぞれは、前記ビデオの前記複数のピクチャのうちの1つまたは複数のためのスケーリング情報を示す、
方法。
【請求項70】
コンピュータまたは信号プロセッサ上で実行されるときに、請求項68または69に記載の方法を実施するためのコンピュータプログラム。
【請求項71】
ビデオのビデオシーケンスの複数のピクチャを符号化する符号化ビデオ信号であって、
前記符号化ビデオ信号は、符号化ピクチャデータと1つまたは複数のメッセージとを備えており、
前記符号化ピクチャデータは、前記ビデオシーケンスの前記複数のピクチャの符号化を備えており、
前記符号化ビデオ信号は、1つまたは複数のメッセージをさらに備え、前記1つまたは複数のメッセージのそれぞれは前記ビデオの前記複数のピクチャのうちの1つまたは複数のためのスケーリング情報を示す、
符号化ビデオ信号。
【請求項72】
符号化ビデオ信号を生成し、ビデオの複数のピクチャを再構成するシステムであって、前記システムは:
請求項51から67のいずれか一項に記載の前記ビデオエンコーダ(101)、および
請求項34から50のいずれか一項に記載の前記ビデオデコーダ(151)
を備え、
前記ビデオエンコーダ(101)は、前記ビデオの前記複数のピクチャに応じて前記符号化ビデオ信号を生成するように構成されており、
前記ビデオデコーダ(151)は、前記符号化ビデオ信号に応じて前記ビデオの前記複数のピクチャを再構成するように構成されている、
システム。
【請求項73】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを備える符号化ビデオ信号を復号するビデオデコーダ(151)であって、前記ビデオデコーダ(151)は:
前記符号化ピクチャデータを備える前記符号化ビデオ信号を受信するように構成された入力インタフェース(160)、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するように構成されたデータデコーダ(170)
を備え、
複数のピクチャが、考慮されたピクチャ(considered picture)と、前記考慮されたピクチャの参照ピクチャとを備え、前記参照ピクチャの初期関心領域は前記参照ピクチャ内の一部を示しており、
前記データデコーダ(170)は、前記初期関心領域を完全に囲む、前記初期関心領域よりも大きい前記参照ピクチャ内の拡大関心領域(enlarged region of interest)を決定するように構成されており、
前記データデコーダ(170)は、前記参照ピクチャの前記拡大関心領域をアップスケールして、前記参照ピクチャの拡大アップスケール領域(enlarged upscaled region)を得るように構成されており、
前記データデコーダ(170)は、アップスケールウィンドウに応じて、または前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを再構成するように構成されている、
ビデオデコーダ(151)。
【請求項74】
前記データデコーダ(170)は、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記符号化ピクチャデータの一部を復号して、前記考慮されたピクチャよりも大きく、前記考慮されたピクチャを囲む符号化されたピクチャを取得するように構成されており、
前記データデコーダ(170)は、前記考慮されたピクチャを得るために前記符号化ピクチャからサンプルを除去するように構成されている、
請求項73に記載のビデオデコーダ(151)。
【請求項75】
前記入力インタフェース(160)は、スケーリング情報を受信するように構成されており、
前記データデコーダ(170)は、前記参照ピクチャの前記拡大関心領域をアップスケールするために、前記スケーリング情報から1つまたは複数のスケーリング係数を決定するように構成されている、
請求項74に記載のビデオデコーダ(151)。
【請求項76】
前記入力インタフェース(160)は、クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記1つまたは複数のスケーリング係数を決定するために無視されるべきか否かを示す、前記符号化ビデオ信号内の指示を受信するように構成されており、
前記データデコーダ(170)は、前記指示に応じて、前記スケーリング情報から前記1つまたは複数のスケーリング係数を決定するように構成されている、
請求項75に記載のビデオデコーダ(151)。
【請求項77】
前記データデコーダ(170)は、
HorScale = CodedPicWidth / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = CodedPicHeight / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記拡大アップスケール領域を得るために、前記拡大関心領域をアップスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
CodedPicWidthは、前記符号化ピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CodedPicHeightは、前記符号化ピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項74から76のいずれか一項に記載のビデオデコーダ(151)。
【請求項78】
前記データデコーダ(170)は、
HorScale = CroppedOutWidthPic / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = CroppedOutHeightPic / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記拡大アップスケール領域を得るために、前記拡大関心領域をアップスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
CroppedOutWidthPicは、前記考慮されたピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CroppedOutHeightPicは、前記考慮されたピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項73から76のいずれか一項に記載のビデオデコーダ(151)。
【請求項79】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを含む符号化ビデオ信号を復号するビデオデコーダ(151)であって、前記ビデオデコーダ(151)は:
前記符号化ピクチャデータを含む前記符号化ビデオ信号を受信するように構成された入力インタフェース(160)、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するように構成されたデータデコーダ(170)、
を備え、
前記入力インタフェース(160)は、スケーリング情報を受信するように構成されており、
前記データデコーダ(170)は、前記複数のピクチャの参照ピクチャ内の領域をアップスケールするために、前記スケーリング情報から1つまたは複数のスケーリング係数を決定するように構成されており、
前記入力インタフェース(160)は、
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記1つまたは複数のスケーリング係数を決定するために無視されるべきか否かを示す、または
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記1つまたは複数のスケーリング係数を決定するために使用されるべきか否かを示す
前記符号化ビデオ信号内の指示を受信するように構成されており、
前記データデコーダ(170)は、前記指示に応じて、前記スケーリング情報から前記1つまたは複数のスケーリング係数を決定するように構成されている、
ビデオデコーダ(151)
【請求項80】
前記データデコーダ(170)は、
HorScale = CodedPicWidth / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = CodedPicHeight / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記拡大アップスケール領域を得るために、前記拡大関心領域をアップスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
CodedPicWidthは、前記符号化ピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、垂直スケール係数であり、
CodedPicHeightは、前記符号化ピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項79に記載のビデオデコーダ(151)。
【請求項81】
前記データデコーダ(170)は、
HorScale = CroppedOutWidthPic / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = CroppedOutHeightPic / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記拡大アップスケール領域を得るために、前記拡大関心領域をアップスケールするように構成されており、
HorScaleは、水平スケール係数であり、
CroppedOutWidthPicは、前記考慮されたピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、垂直スケール係数であり、
CroppedOutHeightPicは、前記考慮されたピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項79に記載のビデオデコーダ(151)。
【請求項82】
前記入力インタフェース(160)は、前記拡大関心領域に関する情報を示す、前記符号化ビデオ信号内の追加情報を受信するように構成されており、
前記データデコーダ(170)は、前記追加情報から前記拡大関心領域のサイズに関する情報を決定するように構成されている、
請求項73から81のいずれか一項に記載のビデオデコーダ(151)。
【請求項83】
前記拡大関心領域の前記サイズに関する情報は、前記拡大関心領域の幅および/または高さに関する情報であって、
前記追加情報は、前記拡大関心領域の前記幅および/または前記高さに関する情報である、または、前記追加情報は、前記拡大関心領域の前記幅および/または前記高さを決定するための1つまたは複数のオフセット値を示す、
請求項82に記載のビデオデコーダ(151)。
【請求項84】
前記入力インタフェース(160)は、前記符号化ビデオ信号内で、左オフセット、右オフセット、上オフセット、および下オフセットに関する情報を受信し、
前記データデコーダ(170)は、前記左オフセット、前記右オフセット、前記上オフセット、および前記下オフセットを使用して、前記初期関心領域から前記拡大関心領域を決定するように構成されている、
請求項82または83に記載のビデオデコーダ(151)。
【請求項85】
前記入力インタフェース(160)は、左オフセット、右オフセット、上オフセット、および下オフセットに関する情報を備えるか否かに関する指示を備える、前記符号化ビデオ信号内のメッセージを受信するように構成されており、
前記指示が、前記メッセージが前記左オフセット、前記右オフセット、前記上オフセット、および前記下オフセットに関する情報を含むことを示す場合、前記データデコーダ(170)は、前記左オフセット、前記右オフセット、前記上オフセット、および前記下オフセットを使用して、前記初期関心領域から前記拡大関心領域を決定するように構成されている、
請求項82または83に記載のビデオデコーダ(151)。
【請求項86】
前記データデコーダ(170)は、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを再構成するように構成されており、
前記データデコーダ(170)は、前記考慮されたピクチャを復号するために、前記参照ピクチャの前記拡大アップスケール領域からの複数の参照サンプルを使用するように構成されている、
請求項73から85のいずれか一項に記載のビデオデコーダ(151)。
【請求項87】
前記複数の参照サンプルのうちの複数の参照サンプルのうちの参照サンプルが前記参照ピクチャの前記拡大アップスケール領域の外側に位置する場合、前記データデコーダ(170)は、前記参照ピクチャの前記拡大アップスケール領域の別のサンプルを使用して、前記サンプルをクリップするか、またはパッド(pad)するように構成されている、
請求項86に記載のビデオデコーダ(151)。
【請求項88】
前記データデコーダ(170)は、前記拡大関心領域をアップスケールして、前記参照ピクチャの他のブロックをアップスケールすることなく、前記参照ピクチャの前記拡大アップスケール領域を得るように構成されている、
請求項73から87のいずれか一項に記載のビデオデコーダ(151)。
【請求項89】
前記参照ピクチャは、2つ以上の参照ピクチャのうちの1つであって、
前記データデコーダ(170)は、前記2つ以上の参照ピクチャに応じて前記考慮されたピクチャを再構成するように構成されている、
請求項73から88のいずれか一項に記載のビデオデコーダ(151)。
【請求項90】
前記入力インタフェース(160)は、前記2つ以上の参照ピクチャのうちのいずれに対して、前記初期関心領域または前記拡大関心領域が定義されるかを示す情報を前記符号化ビデオ信号内で受信するように構成されており、
前記データデコーダ(170)は、前記考慮されたピクチャを再構成するために前記情報を使用するように構成されている、
請求項89に記載のビデオデコーダ(151)。
【請求項91】
前記情報は、前記初期関心領域または前記拡大関心領域が特定された前記2つ以上の参照ピクチャのそれらについて、前記初期関心領域または前記拡大関心領域をさらに示し、
前記データデコーダ(170)は、前記考慮されたピクチャを再構成するために前記情報を使用するように構成されている、
請求項90に記載のビデオデコーダ(151)。
【請求項92】
前記2つ以上の参照ピクチャのうちの参照ピクチャについて、前記初期関心領域または前記拡大関心領域が特定されるか否かは、前記参照ピクチャのピクチャ順序カウントに依存する、
請求項91に記載のビデオデコーダ(151)。
【請求項93】
前記初期関心領域または前記拡大関心領域は、前記2つ以上の参照ピクチャのうちの1つのみについて定義されている、
請求項91に記載のビデオデコーダ(151)。
【請求項94】
前記入力インタフェース(160)は、前記初期関心領域または前記拡大関心領域が前記参照ピクチャについて特定されているか否かを示すフラグであって、前記符号化ビデオ信号のピクチャパラメータセットメッセージ内の前記2つ以上の参照ピクチャの各参照ピクチャのフラグを受信するように構成されており、
前記データデコーダ(170)は、前記考慮されたピクチャを再構成するために前記フラグを使用するように構成されている、
請求項89から93のいずれか一項に記載のビデオデコーダ(151)。
【請求項95】
前記フラグが前記初期関心領域または前記拡大関心領域が特定されることを示す前記2つ以上の参照ピクチャの各参照ピクチャについて、前記入力インタフェース(160)は、適用される複数の関心領域定義のうちの1つを特定する前記符号化ビデオ信号内のインデックスまたはポインタを受信するように構成され、前記データデコーダ(170)は、前記考慮されたピクチャを再構成するために前記インデックスまたはポインタを使用するように構成されている、
請求項94に記載のビデオデコーダ(151)。
【請求項96】
前記データデコーダ(170)は、後続ピクチャが前記符号化ピクチャと比較してズームアウトを表す場合、前記符号化ピクチャを参照として使用し、前記ビデオの前記複数のピクチャのうちの前記後続ピクチャを復号するように構成されている、
請求項74から77のいずれか一項に記載のビデオデコーダ(151)。
【請求項97】
前記データデコーダ(170)は、
HorScale = IdentifiedRegionInPicWidth / CodedRefPicWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = IdentifiedRegionInPicHeight / CodedRefPicHeight
に従って垂直スケール係数を決定することによって、前記後続ピクチャを復号するために、前記符号化ピクチャをダウンスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
IdentifiedRegionInPicWidthは、前記後続のピクチャにおける識別された領域の幅であり、
CodedRefPicWidthは、前記符号化ピクチャの幅であり、
VerScaleは、前記垂直スケール係数であり、
IdentifiedRegionInPicHeightは、前記後続のピクチャにおける識別された領域の高さであり、
CodedRefPicHeightは、前記符号化ピクチャの高さである、
請求項96に記載のビデオデコーダ(151)。
【請求項98】
ビデオの複数のピクチャを符号化するビデオエンコーダ(101)であって、前記ビデオエンコーダ(101)は:
前記ビデオの前記複数のピクチャに応じて符号化ビデオ信号を生成するように構成されたデータエンコーダ(110)、および
前記符号化ビデオ信号を出力するための出力インタフェース(120)
を備え、
前記データエンコーダ(110)は、前記ビデオの前記複数のピクチャを前記符号化ピクチャデータに符号化するように構成されており、
前記複数のピクチャは、前記考慮されたピクチャと、前記考慮されたピクチャの参照ピクチャとを含み、前記参照ピクチャの初期関心領域は前記参照ピクチャ内の一部を示しており、
前記データエンコーダ(110)は、前記初期関心領域を完全に囲む、前記初期関心領域よりも大きい前記参照ピクチャ内の拡大関心領域を決定するように構成されており、
前記データエンコーダ(110)は、前記参照ピクチャの前記拡大関心領域をアップスケールして、前記参照ピクチャの拡大アップスケール領域を得るように構成されており、
前記データエンコーダ(110)は、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを前記符号化ピクチャデータの一部に符号化するように構成されている、
ビデオエンコーダ(101)
【請求項99】
前記データエンコーダ(110)は、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記符号化ピクチャデータの一部を符号化するように構成されている、
請求項98に記載のビデオエンコーダ(101)。
【請求項100】
前記データエンコーダ(110)は、前記符号化ビデオ信号内で、前記拡大関心領域をアップスケールするためのスケーリング情報を生成するように構成されている、
請求項99に記載のビデオエンコーダ(101)。
【請求項101】
前記データエンコーダ(110)は、クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記拡大関心領域をアップスケールするために無視されるべきか否かを示す、前記符号化ビデオ信号内の指示を生成するように構成されている、
請求項100に記載のビデオエンコーダ(101)。
【請求項102】
データエンコーダ(110)は、
HorScale = CodedPicWidth / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または、
VerScale = CodedPicHeight / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記クロッピングウィンドウをアップスケールして、アップスケールウィンドウを得るように構成されており、
HorScaleは、前記水平スケール係数であり、
CodedPicWidthは、前記符号化ピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CodedPicHeightは、前記符号化ピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項99から101のいずれか一項に記載のビデオエンコーダ(101)。
【請求項103】
データエンコーダ(110)は、
HorScale = CroppedOutWidthPic / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または、
VerScale = CroppedOutHeightPic / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記クロッピングウィンドウをアップスケールして、アップスケールウィンドウを得るように構成されており、
HorScaleは、前記水平スケール係数であり、
CroppedOutWidthPicは、前記考慮されたピクチャの幅であり、
RefRoIWidthは、前記拡大関心領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CroppedOutHeightPicは、前記考慮されたピクチャの高さであり、
RefRoIHeightは、前記拡大関心領域の高さである、
請求項98から101のいずれか一項に記載のビデオエンコーダ(101)。
【請求項104】
ビデオの複数のピクチャを符号化するビデオエンコーダ(101)であって、前記ビデオエンコーダ(101)は:
前記ビデオの前記複数のピクチャに応じて符号化ビデオ信号を生成するように構成されたデータエンコーダ(110)、および
前記符号化ビデオ信号を出力する出力インタフェース(120)
を備え、
前記データエンコーダ(110)は、前記ビデオの前記複数のピクチャを符号化ピクチャデータに符号化するように構成されており、
前記データエンコーダ(110)は、前記符号化ビデオ信号内で、前記複数のピクチャの参照ピクチャ内の領域をアップスケールするためのスケーリング情報を生成するように構成されており、
前記データエンコーダ(110)は、
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために無視されるべきか否かを示す、または
前記クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために使用されるべきか否かを示す、
前記符号化ビデオ信号内の指示を生成するように構成されている、
ビデオエンコーダ(101)
【請求項105】
前記データエンコーダ(110)は、
HorScale = CodedPicWidth / RefRoIWidth
VerScale =CodedPicHeight / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記クロッピングウィンドウをアップスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
CodedPicWidthは、前記符号化ピクチャの幅であり、
RefRoIWidthは、前記参照ピクチャ内の領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CodedPicHeightは、前記符号化ピクチャの高さであり、
RefRoIHeightは、前記参照ピクチャ内の領域の高さである、
請求項104に記載のビデオエンコーダ(101)。
【請求項106】
前記データエンコーダ(110)は、
HorScale = CroppedOutWidthPic / RefRoIWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = CroppedOutHeightPic / RefRoIHeight
に従って垂直スケール係数を決定することによって、前記クロッピングウィンドウをアップスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
CroppedOutWidthPicは、前記複数のピクチャのクロップアウトピクチャの幅であり、
RefRoIWidthは、前記参照ピクチャ内の領域の幅であり、
VerScaleは、前記垂直スケール係数であり、
CroppedOutHeightPicは、前記クロップアウトピクチャの高さであり、
RefRoIHeightは、前記参照ピクチャ内の領域の高さである、
請求項104に記載のビデオエンコーダ(101)。
【請求項107】
前記データエンコーダ(110)は、前記符号化ビデオ信号内に、前記拡大関心領域に関する情報を示す追加情報を生成するように構成されている、
請求項98から106のいずれか一項に記載のビデオエンコーダ(101)。
【請求項108】
前記拡大関心領域の前記サイズに関する情報は、前記拡大関心領域の幅および/または高さに関する情報であって、
前記追加情報は、前記拡大関心領域の前記幅および/または前記高さに関する情報であり、または、前記追加情報は、前記拡大関心領域の前記幅および/または前記高さを決定するための1つまたは複数のオフセット値を示す、
請求項107に記載のビデオエンコーダ(101)。
【請求項109】
前記データエンコーダ(110)は、前記符号化ビデオ信号内で、左オフセット、右オフセット、上オフセット、および境界ボックス上の情報を示す下オフセットに関する情報を生成するように構成されている、
請求項107または108に記載のビデオエンコーダ(101)。
【請求項110】
前記データエンコーダ(110)は、左オフセット、右オフセット、上オフセット、および下オフセットに関する情報を含むか否かに関する指示を備える前記メッセージを前記符号化ビデオ信号内に生成するように構成されている、
請求項107または108に記載のビデオエンコーダ(101)。
【請求項111】
前記データエンコーダ(110)は、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを符号化するように構成されており、
前記データエンコーダ(110)は、前記考慮されたピクチャを符号化するために、前記参照ピクチャの前記拡大アップスケール領域からの複数の参照サンプルを使用するように構成されている、
請求項98から110のいずれか一項に記載のビデオエンコーダ(101)。
【請求項112】
前記複数の参照サンプルの複数の参照サンプルのうちの参照サンプルが前記参照ピクチャの前記拡大アップスケール領域の外側に位置する場合、前記データエンコーダ(110)は、前記参照ピクチャの前記拡大アップスケール領域の別のサンプルを使用して、前記サンプルをクリップするか、またはパッドするように構成されている、
請求項111に記載のビデオエンコーダ(101)。
【請求項113】
前記データエンコーダ(110)は、前記参照ピクチャの他のブロックをアップスケールすることなく、前記参照ピクチャの前記拡大アップスケール領域を得るために、前記拡大関心領域をアップスケールするように構成されている、
請求項98から112のいずれか一項に記載のビデオエンコーダ(101)。
【請求項114】
前記参照ピクチャは、2つ以上の参照ピクチャのうちの1つであって、
前記データエンコーダ(110)は、前記2つ以上の参照ピクチャに応じて前記考慮されたピクチャを符号化するように構成されている、
請求項98から113のいずれか一項に記載のビデオエンコーダ(101)。
【請求項115】
前記データエンコーダ(110)は、前記2つ以上の参照ピクチャのうちのいずれに対して、前記初期関心領域または前記拡大関心領域が定義されるかを示す情報を前記符号化ビデオ信号内に生成するように構成されている、
請求項114に記載のビデオエンコーダ(101)。
【請求項116】
前記情報は、前記初期関心領域または前記拡大関心領域が特定される前記2つ以上の参照ピクチャのそれらについて、前記初期関心領域または前記拡大関心領域をさらに示す、
請求項115に記載のビデオエンコーダ(101)。
【請求項117】
前記2つ以上の参照ピクチャのうちの参照ピクチャについて、前記初期関心領域または前記拡大関心領域が特定されるか否かは、前記参照ピクチャのピクチャ順序カウントに依存する、
請求項116に記載のビデオエンコーダ(101)。
【請求項118】
前記初期関心領域または前記拡大関心領域は、前記2つ以上の参照ピクチャのうちの1つのみについて定義されている、
請求項116に記載のビデオエンコーダ(101)。
【請求項119】
前記データエンコーダ(110)は、前記符号化ビデオ信号のピクチャパラメータセットメッセージ内の前記2つ以上の参照ピクチャの各参照ピクチャのフラグを生成するように構成され、前記フラグは前記初期関心領域または前記拡大関心領域が前記参照ピクチャに対して特定されているか否かを示す、
請求項114から118のいずれか一項に記載のビデオエンコーダ(101)。
【請求項120】
前記フラグが前記初期関心領域または前記拡大関心領域が特定されることを示す前記2つ以上の参照ピクチャの各参照ピクチャについて、前記データエンコーダ(110)は、適用される複数の関心領域定義のうちの1つを特定するインデックスまたはポインタを、符号化ビデオ信号内に生成するように構成されている、
請求項119に記載のビデオエンコーダ(101)。
【請求項121】
前記データエンコーダ(110)は、後続ピクチャが前記考慮されたピクチャと比較してズームアウトを表す場合、前記考慮されたピクチャよりも大きく、前記考慮されたピクチャを囲む符号化されたピクチャを使用して、前記ビデオの前記複数のピクチャのうちの前記後続ピクチャを、参照として符号化するように構成されている、
請求項98から120のいずれか一項に記載のビデオエンコーダ(101)。
【請求項122】
前記データエンコーダ(110)は、
HorScale = IdentifiedRegionInPicWidth / CodedRefPicWidth
に従って水平スケール係数を決定することによって、および/または
VerScale = IdentifiedRegionInPicHeight / CodedRefPicHeight
に従って垂直スケール係数を決定することによって、前記後続のピクチャを復号するために、前記符号化ピクチャをダウンスケールするように構成されており、
HorScaleは、前記水平スケール係数であり、
IdentifiedRegionInPicWidthは、前記後続のピクチャにおける識別領域の幅であり、
CodedRefPicWidthは、前記符号化ピクチャの幅であり、
VerScaleは、垂直スケール係数であり、
IdentifiedRegionInPicHeightは、前記後続のピクチャにおける前記識別領域の高さであり、
CodedRefPicHeightは、前記符号化ピクチャの高さである、
請求項121に記載のビデオエンコーダ(101)。
【請求項123】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを含む符号化ビデオ信号を復号するための方法であって、前記方法:
前記符号化ピクチャデータを含む前記符号化ビデオ信号を受信するステップ、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するステップ
を備え、
前記複数のピクチャは、考慮されたピクチャと、前記考慮されたピクチャの参照ピクチャとを備え、前記参照ピクチャの初期関心領域は前記参照ピクチャ内の一部を示しており、
前記複数のピクチャを再構成するステップは、前記初期関心領域を完全に囲む前記初期関心領域よりも大きい前記参照ピクチャ内の拡大関心領域を決定するステップを備えており、
前記複数のピクチャを再構成するステップは、前記参照ピクチャの前記拡大関心領域をアップスケールして、前記参照ピクチャの前記拡大アップスケール領域を得るステップを備えており、
複数のピクチャを再構成するステップは、アップスケールウインドウに応じて、または前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを再構成することを備えている、
方法。
【請求項124】
ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを含む符号化ビデオ信号を復号するための方法であって、前記方法は:
前記符号化ピクチャデータを含む前記符号化ビデオ信号を受信するステップ、および
前記符号化ピクチャデータに応じて前記ビデオの前記複数のピクチャを再構成するステップ
を備え、
前記方法は、スケーリング情報を受信するステップを備えており、
前記方法は、前記複数のピクチャの参照ピクチャ内の領域をアップスケールするために、前記スケーリング情報から1つまたは複数のスケーリング係数を決定するステップを備えており、
前記方法は、
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が1つまたは複数のスケーリング係数を決定するために無視されるべきか否かを示す、または
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が1つまたは複数のスケーリング係数を決定するために使用されるべきか否かを示す、
前記符号化ビデオ信号内の指示を受信するステップを備えており、
前記方法は、前記指示に応じて、前記スケーリング情報から前記1つまたは複数のスケーリング係数を決定するステップを備えている、
方法。
【請求項125】
ビデオの複数のピクチャを符号化する方法であって、前記方法は:
前記ビデオの前記複数のピクチャに応じた符号化ビデオ信号を生成するステップ、および
前記符号化ビデオ信号を出力するステップ
を備え、
前記符号化ビデオ信号を生成するステップは、前記ビデオの前記複数のピクチャを符号化ピクチャデータに符号化するステップを備えており、
前記複数のピクチャは、考慮されたピクチャと、前記考慮されたピクチャの参照ピクチャとを備え、前記参照ピクチャの初期関心領域は前記参照ピクチャ内の一部を示し、
前記ビデオの前記複数のピクチャを前記符号化ピクチャデータに符号化するステップは、前記初期関心領域を完全に囲む、前記初期関心領域よりも大きい、前記参照ピクチャ内の拡大関心領域を決定するステップを備えており、
前記ビデオの前記複数のピクチャを前記符号化ピクチャデータに符号化するステップは、前記参照ピクチャの前記拡大関心領域をアップスケールして、前記参照ピクチャの前記拡大アップスケール領域を得るステップを備えており、
前記ビデオの前記複数のピクチャを前記符号化ピクチャデータに符号化するステップは、前記参照ピクチャの前記拡大アップスケール領域に応じて、前記考慮されたピクチャを符号化ピクチャデータの一部に符号化するステップを備えている、
方法。
【請求項126】
ビデオの複数のピクチャを符号化する方法であって、前記方法は:
前記ビデオの前記複数のピクチャに応じた符号化ビデオ信号を生成するステップ、および
前記符号化ビデオ信号を出力するステップ
を備え、
前記符号化ビデオ信号を生成するステップは、前記ビデオの前記複数のピクチャを符号化ピクチャデータに符号化するステップを備えており、
前記方法は、前記符号化ビデオ信号内で、前記複数のピクチャの参照ピクチャ内の領域をアップスケールするための情報を生成するステップを備えており、
前記方法は、
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために無視されるべきか否かを示す、または
前記クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために使用されるべきか否かを示す、
前記符号化ビデオ信号内の指示を生成するステップを備えている、
方法。
【請求項127】
コンピュータまたは信号プロセッサ上で実行されるときに、請求項123から126のいずれか1項に記載の方法を実施するためのコンピュータプログラム。
【請求項128】
ビデオのビデオシーケンスの複数のピクチャを符号化する符号化ビデオ信号であって、
前記符号化ビデオ信号は、符号化ピクチャデータを備えており、
前記符号化ピクチャデータは、前記ビデオシーケンスの前記複数のピクチャの符号化を備えており、
前記複数のピクチャは、考慮されたピクチャと、前記考慮されたピクチャの参照ピクチャとを備え、前記参照ピクチャの初期関心領域は参照ピクチャ内の一部を示しており、
前記参照ピクチャ内の拡大関心領域は、前記初期関心領域よりも大きく、初期関心領域を完全に囲んでおり、
前記複数のピクチャの前記符号化は、前記考慮されたピクチャの符号化を備え、前記考慮されたピクチャの前記符号化は前記参照ピクチャの前記拡大アップスケール領域に依存し、前記参照ピクチャの前記拡大アップスケール領域は前記参照ピクチャ内の前記拡大関心領域がアップスケールされたものである、
符号化ビデオ信号。
【請求項129】
ビデオのビデオシーケンスの複数のピクチャを符号化する符号化ビデオ信号であって、
符号化ビデオ信号は、符号化ピクチャデータを備えており、
前記符号化ピクチャデータは、前記ビデオシーケンスの前記複数のピクチャの符号化を備えており、
前記符号化ビデオ信号は、前記複数のピクチャの参照ピクチャ内の領域をアップスケールするための情報を備えており、
前記符号化ビデオ信号は、
クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために無視されるべきか否かを示す、または
前記クロッピングウィンドウ上の前記符号化ビデオ信号内の情報が前記参照ピクチャ内の前記領域をアップスケールするために使用されるべきか否かを示す、
指示の生成を備えている、
符号化ビデオ信号。
【請求項130】
前記符号化ビデオ信号は、1つまたは複数のメッセージを備えている、
請求項128または129に記載の符号化ビデオ信号。
【請求項131】
符号化ビデオ信号を生成し、ビデオの複数のピクチャを再構成するシステムであって、前記システムは:
請求項98から122のいずれか一項に記載の前記ビデオエンコーダ(101)、および
請求項73から97のいずれか一項に記載の前記ビデオデコーダ(151)
を備え、
前記ビデオエンコーダ(101)は、前記ビデオの前記複数のピクチャに応じて前記符号化ビデオ信号を生成するように構成されており、
前記ビデオデコーダ(151)は、前記符号化ビデオ信号に応じて前記ビデオの前記複数のピクチャを再構成するように構成されている、
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ビデオ符号化およびビデオ復号化に関し、特に、エンコーダおよびデコーダ、参照ピクチャリサンプリング拡張のための符号化方法および復号化方法に関する。
【0002】
H.265/HEVC(HEVC=High Efficiency Video Coding)は、エンコーダおよび/またはデコーダでの並列処理を向上させる、または可能にするためのツールをすでに提供しているビデオコーデックである。例えば、HEVCは、互いに独立して符号化されるタイルのアレイへのピクチャの細分化(sub-division)をサポートする。HEVCによってサポートされる別の概念はWPPに関し、それによれば、ピクチャのCTU行またはCTUラインは、連続するCTUラインの処理において、いくつかの最小CTUオフセットに従うという条件で、例えばストライプで、左から右に並列に処理されてもよい(CTU=coding tree unit)。しかしながら、ビデオエンコーダおよび/またはビデオデコーダの並列処理能力をさらに効率的にサポートするビデオコーデックを近くに有することが好ましい。
【0003】
以下では、最新技術によるVCLパーティショニングについて説明する(VCL=video coding layer)。
【0004】
通常、ビデオ符号化ではピクチャサンプルの符号化プロセスがより小さなパーティションを必要とし、サンプルは予測符号化または変換符号化などの結合処理のためにいくつかの矩形領域に分割される。従って、ピクチャは、ビデオシーケンスの符号化中に一定である特定のサイズのブロックに分割される。H.264/AVCでは、16×16サンプルの標準固定サイズブロック、いわゆるマクロブロックが使用される(AVC=Advanced Video Coding)。
【0005】
最新のHEVC規格(ISO/IEC, ITU-T. High efficiency video coding. ITU-T Recommendation H.265 | ISO/IEC 23008 10 (HEVC), edition 1, 2013; edition 2, 2014.を参照)では、最大サイズ64×64サンプルの符号化ツリーブロック(CTB)または符号化ツリーユニット(CTU)がある。HEVCのさらなる説明では、そのような種類のブロックについて、より一般的な用語CTUが使用される。
【0006】
CTUは、左上のCTUから開始してラスタスキャン順序で処理され、ピクチャライン単位で右下のCTUまで下がってCTUを処理する。
【0007】
符号化されたCTUデータは、スライスと呼ばれる一種のコンテナに編成される。元来、以前のビデオ符号化規格では、スライスがピクチャの1つまたは複数の連続するCTUを備える区分を意味する。スライスは、符号化されたデータのセグメンテーションのために使用される。別の観点から、完全なピクチャは1つの大きなセグメントとして定義することもでき、従って、歴史的には、スライスという用語が依然として適用される。符号化ピクチャサンプルの他に、スライスは、いわゆるスライスヘッダに入れられるスライス自体の符号化プロセスに関連する追加情報も備える。
【0008】
最新技術によれば、VCL(ビデオ符号化レイヤ(video coding layer))はまた、フラグメンテーションおよび空間分割のための技法を備える。このような分割は、例えば、様々な理由のためにビデオ符号化に適用することができ、その中には、並列化における処理負荷バランシング、ネットワーク伝送におけるCTUサイズマッチング、エラー軽減などがある。
【0009】
他の例は、RoI(RoI=関心領域(Region of Interest))符号化に関連し、この符号化では、例えば、視聴者がズームイン操作(RoIのみの復号化)で選択することができるピクチャの中央の領域、またはイントラデータ(典型的にはビデオシーケンスの1つのフレームに入れられる)が例えば、ピクチャ平面上をスワイプし、ピクチャ平面全体についてイントラピクチャが行うのと同じ様式で時間予測チェーンを局所的にリセットするイントラブロックの列として、いくつかの連続するフレームにわたって時間的に分配される漸進的デコーダリフレッシュ(gradual decoder refresh)(GDR)が存在する。後者の場合、2つの領域が各ピクチャに存在し、1つは最近リセットされ、1つはエラーおよびエラー伝播によって潜在的に影響される。
【0010】
参照ピクチャリサンプリング(Reference Picture Resampling)(RPR)は、粗い量子化パラメータを使用するだけでなく、潜在的に各送信ピクチャの解像度を適応させることによって、ビデオの品質/レートを適応させるためにビデオ符号化で使用される技術である。従って、インター予測に使用される参照は、符号化のために現在予測されているピクチャとは異なるサイズを有することがある。基本的に、RPRは予測ループにおけるリサンプリングプロセス、例えば、定義されるアップサンプリングフィルタおよびダウンサンプリングフィルタを必要とする。
【0011】
フレーバに応じて、RPRは任意のピクチャにおける符号化ピクチャサイズの変更をもたらすことができ、または、例えば、セグメント境界に境界を定められた特定の位置においてのみ、適応HTTPストリーミングのように、特定のピクチャにおいてのみ発生するように制限されうる。
【発明の概要】
【0012】
本発明の目的は、ビデオ符号化およびビデオ復号化のための改善された概念を提供することである。
【0013】
本発明の目的は、独立請求項の主題によって解決される。
【0014】
好ましい実施形態は、従属請求項において提供される。
【図面の簡単な説明】
【0015】
以下、図面を参照して本発明の実施形態を詳細に説明する:
【0016】
【
図4】関心領域(RoI)スケーラビリティ対拡張スケーラビリティを示す。
【
図5a】時間の経過に伴ってピクチャ内で移動するコンテンツ断片(グレー)の第1の例を示す。
【
図5b】時間の経過に伴ってピクチャ内で移動するコンテンツ断片(グレー)の第2の例を示す。
【
図6a】混合参照ピクチャを有する現在のピクチャを示す。
【
図6b】参照ピクチャのクロッピングウィンドウを無視する例を示す。
【
図9】一方では再構成された信号、例えば再構成されたピクチャと、一方ではデータストリームにおいてシグナル化されたような予測残差信号と、予測信号との組み合わせとの間の関係を示す。
【発明を実施するための形態】
【0017】
以下の図面の説明は、本発明の実施形態を組み込むことができる符号化フレームワークの例を形成するために、ビデオのピクチャを符号化するためのブロックベース予測コーデックのエンコーダおよびデコーダの説明から始まる。それぞれのエンコーダおよびデコーダは、
図7から
図9に関して説明される。その後、本発明の概念の実施形態の説明を、
図7および
図8のエンコーダおよびデコーダにそのような概念をそれぞれ組み込む方法についの説明とともに示す。ただし、
図1から
図3および以下で説明した実施形態は、
図7および
図8のエンコーダおよびデコーダの基礎となる符号化フレームワークに従って動作しないエンコーダおよびデコーダを形成するためにも使用されてもよい。
【0018】
図7は、ビデオエンコーダ、典型的には変換ベースの残差符号化(residual coding)を使用して、ピクチャ12をデータストリーム14に予測符号化するための装置を示す。装置、すなわちエンコーダは、参照符号10を用いて示される。
図8は、対応するビデオデコーダ20、例えば、変換ベースの残差復号化(residual decoding)も用いてデータストリーム14からピクチャ12’を予測的に復号化するように構成された装置20を示し、ここで、アポストロフィーは、デコーダ20によって再構成されたピクチャ12’が予測残差信号の量子化によって導入された符号化損失に関して、装置10によって元々エンコードされたピクチャ12から逸脱することを示すために使用されている。
図7および
図8は、例示的に、変換ベースの予測残差符号化を使用するが、本出願の実施形態はこの種の予測残差符号化に限定されない。これは、以下に概説されるように、
図7および
図8に関して説明される他の詳細についても当てはまる。
【0019】
エンコーダ10は、予測残差信号を空間スペクトル変換に掛け、このようにして得られた予測残差信号をデータストリーム14に符号化するように構成される。同様に、デコーダ20は、データストリーム14からの予測残差信号を復号化し、このようにして得られた予測残差信号をスペクトル空間変換に掛けるように構成される。
【0020】
内部的には、エンコーダ10が予測残差24を生成する予測残差信号形成器(prediction residual signal former)22を備えてもよく、これにより、オリジナルの信号から、例えばピクチャ12からの予測信号26の偏差を測定することができる。予測残差信号形成器22は、オリジナルの信号から、例えばピクチャ12からの予測信号を減算する減算器であってもよい。そして、エンコーダ10は、予測残差信号24を空間スペクトル変換に掛けてスペクトル領域予測残差信号24’を得る変換器(transformer)28をさらに備え、この残差信号は、エンコーダ10によっても構成される量子化器(quantizer)32によって量子化される。このように、定量化された予測残差信号24はビットストリーム14に符号化されているが、エンコーダ10は任意に、予測残差信号をエントロピー符号化によってデータストリームに変換および量子化したエントロピーコーダ34を構成し、予測信号26は、エンコーダ10の予測ステージ36によって、データストリーム14に符号化され、またはデータストリーム14から復号化可能である予測残差信号24に基づいて生成される。この目的のために、予測ステージ36は、
図7に示されるように、内部的に、量子化損失を除く信号24’に対応するスペクトル領域予測残差信号24’’’を得るように予測残差信号24’’を逆量子化する逆量子化器(dequantizer)38を備えてもよく、その後、逆変換器(inverse transformer)40が後者の予測残差信号24’’’を逆変換する、例えば、スペクトル-空間変換に掛けて、量子化損失を除くオリジナルの予測残差信号24に対応する予測残差信号24’’’’を取得する。そして、予測ステージ36の結合器(combiner)42が、例えば加算によって、予測信号26と予測残差信号24’’’’とを再結合して、再構成信号46、オリジナルの信号、例えば、ピクチャ12の再構成を取得することができる。再構成信号46は信号12’に対応してもよい。そして、予測ステージ36の予測モジュール44は、例えば空間予測、すなわちピクチャ内予測、および/または時間予測、すなわちピクチャ間予測を使用することによって、信号46に基づいて予測信号26を生成する。
【0021】
同様に、デコーダ20は、
図8に示されるように、予測ステージ36に対応する構成要素から内部的に構成され、かつ、それに対応する方法で相互接続されてもよい。特に、デコーダ20のエントロピーデコーダ50は、データストリームから量子化されたスペクトル領域予測残差信号24’’をエントロピー復号化することができ、そこで、逆量子化器52、逆変換器54、結合器56および予測モジュール58は、予測ステージ36のモジュールに関して上述した方法で相互接続され、協働することにより、予測残差信号24’’に基づいて再構成信号を回復し、それにより、
図8に示すように、結合器56の出力が再構成信号、すなわちピクチャ12’を生じる。
【0022】
具体的に上述したわけではないが、エンコーダ10は例えば、ある種のレートおよび歪み関連基準、例えば符号化コストを最適化する方法、例えば、ある種の最適化スキームに従って、例えば予測モード、運動パラメータ等を含むいくつかの符号化パラメータを設定してもよいことは容易に明らかである。例えば、エンコーダ10およびデコーダ20、ならびに対応するモジュール44、58は、それぞれ、イントラ符号化モードおよびインター符号化モードなどの異なる予測モードをサポートしてもよい。エンコーダおよびデコーダがこれらの予測モードタイプ間で切り替わる粒度(granularity)は、ピクチャ12および12’のそれぞれ符号化セグメントまたは符号化ブロックへの細分化に対応してもよい。これらの符号化セグメントの単位で、例えば、ピクチャは、イントラ符号化されるブロックとインター符号化されるブロックとに再分割されてもよい。イントラ符号化されたブロックは、以下でより詳細に概説されるように、それぞれのブロックの空間的な、すでに符号化/復号化された近傍(neighborhood)に基づいて予測される。いくつかのイントラ符号化モードが存在してもよく、それぞれのイントラ符号化モードは、それぞれの方向性イントラ符号化モードに特有のある方向に沿った近傍のサンプル値をそれぞれのイントラ符号化セグメントに外挿することによって、それぞれのセグメントが満たされる、方向性または角度イントラ符号化モードを含む、それぞれのイントラ符号化セグメントのために選択されてもよい。イントラ符号化モードはまた、例えば、それぞれのイントラ符号化されたブロックのための予測がそれぞれのイントラ符号化されたセグメント内のすべてのサンプルにDC値を割り当てるDC符号化モード、および/または、それぞれのブロックの予測が隣接するサンプルに基づいて2次元線形関数によって定義される平面の駆動傾斜およびオフセットを有するそれぞれのイントラ符号化されたブロックのサンプル位置にわたる2次元線形関数によって記述されるサンプル値の空間分布であると近似または決定されるプレーナ(planar)イントラ符号化モードなどの、1つまたは複数のさらなるモードを備えてもよい。これと比較して、インター符号化されたブロックは例えば、時間的に予測されてもよい。インター符号化ブロックの場合、動きベクトルはデータストリーム内でシグナリングされてもよく、動きベクトルはピクチャ12が属するビデオの以前に符号化されたピクチャの部分の空間変位を示し、以前に符号化/復号されたピクチャはそれぞれのインター符号化されたブロックの予測信号を取得するためにサンプリングされる。これは、量子化されたスペクトル領域予測残差信号24’’を表すエントロピー符号化変換係数レベル(entropy-coded transform coefficient levels)のような、データストリーム14によって備えられる残差信号符号化に加えて、データストリーム14が、符号化モードを様々なブロックに割り当てるための符号化モードパラメータ、インター符号化セグメントのための動きパラメータのようないくつかのブロックのための予測パラメータ、およびピクチャ12および12’のセグメントへの細分化をそれぞれ制御し、シグナリングするためのパラメータのような任意選択のさらなるパラメータを、その中で符号化してもよいことを意味する。デコーダ20は、これらのパラメータを使用して、エンコーダが行ったものと同様の方法でピクチャを細分化し、セグメントに同じ予測モードを割り当て、同じ予測信号に結果をもたらすために同じ予測を行う。
【0023】
図9は、一方では再構成された信号、例えば再構成されたピクチャ12’と、他方ではデータストリーム14でシグナル化された予測残差信号24’’’’と予測信号26との組み合わせとの間の関係を示す。既に上述したように、組み合わせは、追加であってもよい。予測信号26は、
図9において、ハッチングを用いて例示的に示されるイントラ符号化ブロック、および、ハッチングされずに例示的に示されるインター符号化ブロックへのピクチャ領域の細分化として示される。細分化は、ピクチャ領域を正方形ブロックまたは非正方形ブロックの行および列に規則的に細分化するなどの任意の細分化であってもよく、あるいはツリールートブロック(tree root block)から、ピクチャ12を、クアッドツリー(quadtree)細分化などの様々なサイズの複数のリーフブロックに細分化するマルチツリー細分化であってもよく、ピクチャ領域はまず、ツリールートブロックの行および列に細分化され、そして、再帰的(recursive)マルチツリー細分化に従って1つまたは複数のリーフブロックにさらに細分化される、それらの混合物が
図9に示されている。
【0024】
また、データストリーム14は、イントラ符号化ブロック80のためにその中で符号化されたイントラ符号化モードを有してもよく、これは、それぞれのイントラ符号化ブロック80に、いくつかのサポートされるイントラ符号化モードのうちの1つを割り当てる。インター符号化ブロック82のために、データストリーム14は、その中で符号化された1つまたは複数の運動パラメータを有してもよい。一般的に言えば、インター符号化ブロック82は、時間的に符号化されることに限定されない。代替的には、インター符号化ブロック82は、ピクチャ12が属するビデオの以前に符号化されたピクチャ、またはエンコーダおよびデコーダがそれぞれスケーラブルエンコーダおよびデコーダである場合には別のビューまたは階層的に下層ピクチャなど、現在のピクチャ12自体を超えて以前に符号化された部分から予測される任意のブロックとしてもよい。
【0025】
また、
図9の予測残差信号24’’’’は、ブロック84へのピクチャ領域の細分化として図示されている。これらのブロックは、符号化ブロック80および82と同じものを区別するために、変換ブロックと呼ばれることがある。事実上、
図9は、エンコーダ10およびデコーダ20がそれぞれ、ピクチャ12およびピクチャ12’の2つの異なる細分化を、ブロック、即ち、符号化ブロック80および82にそれぞれ細分化する1つ、および変換ブロック84に再分割する別の細分化を用いることができることを示している。両方の細分化は同じであってもよく、例えば、各符号化ブロック80および82は変換ブロック84を同時に形成してもよいが、
図9は例えば、変換ブロック84への細分化がブロック80および82の2つのブロックの間の任意の境界が2つのブロック84の間の境界に重なるように、または代替的に言えば、各ブロック80、82が変換ブロック84のうちの1つと一致するか、または変換ブロック84のクラスタと一致するかのいずれかであるように、符号化ブロック80、82への細分化の拡張を形成する場合を示す。しかしながら、変換ブロック84がブロック80、82の間のブロック境界を交差することができるように、再分割は、互いに独立して決定または選択されてもよい。変換ブロック84への細分化に関する限り、ブロック80、82への細分化に関して提示されたものと同様であり、例えば、ブロック84は、(行および列への配置を伴うまたは伴わない)ブロックへのピクチャ領域の規則的な細分化の結果、ピクチャ領域の再帰的マルチツリー細分化の結果、またはそれらの組み合わせ、または任意の他の種類のブロック化の結果であってもよい。余談として、ブロック80、82、および84は、正方形、長方形、または任意の他の形状であることに限定されないことに留意されたい。
【0026】
図9は、予測信号26と予測残差信号24’’’’との組み合わせが、再構成信号12’を直接もたらすことをさらに示す。しかしながら、代替的な実施形態によれば、2つ以上の予測信号26を予測残差信号24’’’’と組み合わせて、ピクチャ12’をてもよいことに留意されたい。
【0027】
図9において、変換ブロック84は、以下の重要性を有する。変換器28および逆変換器54は、これらの変換ブロック84の単位でそれらの変換を行う。例えば、多くのコーデックは、全ての変換ブロック84に対して何らかの種類のDSTまたはDCTを使用する。いくつかのコーデックは、変換ブロック84のいくつかについて、予測残差信号が空間領域で直接符号化されるように、変換をスキップすることを可能にする。しかしながら、以下に説明する実施形態によれば、エンコーダ10およびデコーダ20は、いくつかの変換をサポートするように構成される。例えば、エンコーダ10およびデコーダ20によってサポートされる変換は、以下を含むことができる:
・DCT-II(またはDCT-III)、DCTは離散コサイン変換(Discrete Cosine Transform)を表す
・DST-IV、ここでDSTは離散サイン変換(Discrete Sine Transform)を表す
・DCT-IV
・DST-VII
・アイデンティティ変換(IT)
【0028】
当然ながら、変換器28は、これらの変換の順方向変換バージョンのすべてをサポートするが、デコーダ20または逆変換器54は、その対応する逆方向または逆方向バージョンをサポートする:
・逆DCT-II(または逆DCT-III)
・逆DST-IV
・逆DCT-IV
・逆DST-VII
・アイデンティティ変換(IT)
【0029】
以降の説明は、どの変換がエンコーダ10およびデコーダ20によってサポートされ得るかについてのさらなる詳細を提供する。いずれの場合も、サポートされる変換のセットは、1つのスペクトル-空間変換または空間-スペクトル変換などの1つの変換のみを備えてもよいことに留意されたい。
【0030】
すでに上記で概説したように、
図7から
図9は本出願によるエンコーダおよびデコーダの特定の例を形成するために、以下でさらに説明する本発明の概念を実施することができる例として提示されている。
図7および
図8のエンコーダおよびデコーダは、それぞれ、以下に記載されるエンコーダおよびデコーダの可能な実装を表してもよい。しかしながら、
図7および
図8は単なる例である。しかしながら、本出願の実施形態によるエンコーダは、以下詳細に概説され、例えば同じものはビデオエンコーダではなく、静止画エンコーダである点、相互予測をサポートしない点、またはブロック80への細分化が
図9に例示された方法とは異なる方法で行われる点で、
図7のエンコーダとは異なるピクチャ12のブロックベース符号化を行ってもよい。同様に、本発明の実施形態によるデコーダは、以下でさらに概説する符号化概念を使用して、データストリーム14からのピクチャ12’のブロックベース復号化を行うことができるが、例えば、同じものはビデオデコーダではなく、静止ピクチャデコーダである点、イントラ予測をサポートしない点、または同じものが、
図9に関して説明したものとは異なる方法でピクチャ12’をブロックに細分化する点、および/または同じものが、例えば、変換領域でデータストリーム14から予測残差を導出しない点で、
図8のデコーダ20とは異なってもよい。
【0031】
以下では、実施形態による汎用ビデオエンコーダが
図1に記載され、実施形態による汎用ビデオデコーダが
図2に記載され、実施形態による汎用システムが
図3に記載される。
【0032】
図1は、実施形態による一般的なビデオエンコーダ101を示す。
【0033】
ビデオエンコーダ101は、符号化ビデオ信号を生成することによってビデオの複数のピクチャを符号化するように構成され、複数のピクチャの各々はオリジナルのピクチャデータを備える。
【0034】
ビデオエンコーダ101は、符号化ピクチャデータ備える符号化ビデオ信号を生成するように構成されたデータエンコーダ110を備え、データエンコーダはビデオの複数のピクチャを符号化ピクチャデータに符号化するように構成される。
【0035】
さらに、ビデオエンコーダ101は、複数のピクチャのそれぞれの符号化ピクチャデータを出力するように構成された出力インターフェース120を備える。
【0036】
図2は、実施形態による汎用ビデオデコーダ151を示す。
【0037】
ビデオデコーダ151は、ビデオの複数のピクチャを再構成するために、符号化ピクチャデータを備える符号化ビデオ信号を復号するように構成される。
【0038】
ビデオデコーダ151は、符号化ビデオ信号を受信するように構成された入力インタフェース160を備える。
【0039】
さらに、ビデオデコーダは、符号化ピクチャデータを復号することによってビデオの複数のピクチャを再構成するように構成されたデータデコーダ170を備える。
【0040】
【0041】
システムは、
図1のビデオエンコーダ101と、
図2のビデオデコーダ151とを含む。
【0042】
ビデオエンコーダ101は、符号化ビデオ信号を生成するように構成される。
【0043】
ビデオデコーダ151は、符号化ビデオ信号を復号して、ビデオのピクチャを再構成するように構成される。
【0044】
本発明の第1の態様は、請求項1から33に記載される。第1の態様は、サンプルアスペクト比信号を提供する。
【0045】
本発明の第2の態様は、請求項34から72に記載されている。第2の態様は、実装負担を軽減するために、参照ピクチャリサンプリング制約(Reference Picture Resampling restrictions)を提供する。
【0046】
本発明の第3の態様は、請求項73から131に記載されている。第3の態様は、参照ピクチャリサンプリングのズームのために柔軟な領域ベースの参照を提供し、特に、より効率的なアドレスズーム使用ケースを提供する。
【0047】
以下、本発明の第1の態様について詳細に説明する。
【0048】
特に、第1の態様は、サンプルアスペクト比シグナリング(sample aspect ratio signalling)を提供する。
【0049】
サンプルアスペクト比(SAR)は、符号化されたビデオを消費者に正しく提示することに関連しており、その結果、符号化されたサンプルアレイのアスペクト比がRPRを経て経時的に変化する場合(例えば、1次元でのサブサンプリングによって)、提示されたピクチャのアスペクト比は、意図した通りに一定に保たれることができる。
【0050】
HEVCまたはAVCのようなシーケンスパラメータセット(SPS)におけるビデオ使用可能性情報(Video Usability Information)(VUI)の最新のSARシグナリングされたビデオシーケンス全体に対して一定のSARを設定することのみを可能にする、例えば、SAR変更は符号化されたビデオシーケンスの開始時にのみ許可される(例えば、サンプルアスペクト比は、符号化されたビデオシーケンスごとに一定である)。
【0051】
従って、本発明の一部として、SARシグナリング新しいモードが、ビデオ符号化に導入される。シーケンスレベルパラメータセット、すなわちSPSは、以下の指示を含む:
・RPRが使用されている(このため、符号化されたピクチャサイズが変化する可能性がある)
・実際のSARはVUIでは与えられない、
・代わりに、符号化されたビデオのSARは、動的であると示され、CVS(符号化ビデオシーケンス(coded video sequence))の中で変化し得る
・符号化ピクチャの実際のSARは、解像度切替ポイントでのSEI(サプリメンタルエンハンスメント情報((supplemental enhancement information))メッセージを介して示される
【表1】
【0052】
【0053】
同様に、vui_aspect_ratio_constant_flagが、例えば、採用されてもよい。
【0054】
vui_aspect_ratio_constant_flagは、例えば、サンプルのアスペクト比がビデオシーケンスに対して一定であるか否か、またはサンプルのアスペクト比がビデオシーケンス内で変更可能であるか否かを示す指標であってもよい。
【0055】
例えば、vui_aspect_ratio_constant_flagが例えば、0に設定され得る(または例えば、FALSEに設定され得る、または例えば、-1に設定され得る)場合、これは例えば、動的SAR情報が、例えばSEIメッセージ中に存在することを示し得る。
【0056】
代替実施形態では、VUI(例えば、SPS)内のSAR情報がデフォルトとして使用され、これはSEIメッセージが利用可能でない限り使用される。SEIメッセージの情報は、SPSの情報で上書きされる。
【表3】
【0057】
別の実施形態では、SAR情報がピクチャ解像度に関連付けられてPPS(ピクチャパラメータセット(picture parameter set))でシグナリングされ、ピクチャ解像度がシグナリングされる。デフォルトSARは、SPSでシグナリングされ、SARが特定のピクチャ解像度に対して変化する場合、異なるSARがシグナリングされ、デフォルトSARを上書きする。
【0058】
【0059】
また、SEIの場合については、SPSはさらに、SARが変更される可能性があること、およびSARがPPSに更新されることを示すことができる(以前のaspect_ratio_dynamic_SEI_present_flagと同様)。従って、いくつかの応用では、SARを変更しないように制約または制限することが可能であり、実施またはRPR/ARCを容易にすることができる。
【0060】
【0061】
pps_aspect_ratio_info_present_flagが0に設定されている場合、デフォルトのSARはSPSから取得され、そうでない場合は実際のSARが提供される。
【0062】
以下、本発明の第2の態様について詳細に説明する。
【0063】
特に、第2の態様は、参照ピクチャリサンプリングのための制約に関するシグナリングを提供する。
【0064】
RPR方式を様々な方法で制限することにより、実装負担を軽減することができる。以下の発明のような、追加の制限を含まない一般的なRPRスキームでは、実装者が以下を実行するためにそのデコーダハードウェアをオーバープロビジョンする必要がある:
・任意の現在のピクチャ、最悪の場合:すべてのピクチャでのリサンプリング
・DPB(符号化ピクチャバッファ(decoded picture buffer))、中間GOP(group of pictures)対、より少ない参照ピクチャを有する定義された位置における任意のピクチャのリサンプリング
・さまざまな解像度の複数の画像のターゲット解像度への同時リサンプリング
・(参照)ピクチャ品質の損失を伴うref picのカスケードリサンプリングチェーン(cascaded resampling chain)
【0065】
以下の発明された制限は、制限されていないRPRコーデックと比較して、そのような制限されたRPRスキームを特徴とするコーデックの実装コストを低減することを可能とする。
【0066】
一実施形態では、解像度変更がRAP(ランダムアクセスポイント(random access point))でのみ許可され、例えば、リサンプリングされたピクチャの最大数はこのRAPにおけるRASL(ランダムアクセス復号可能スキップピクチャ((random access decodable skipped picture))ピクチャの量であり、RAPは通常、1つまたは複数のGOP、例えば、数十ピクチャ離れた距離にあり、これはそのようなリサンプリング操作がサポートされなければならない最悪の場合のレートを低減する。
【0067】
別の実施形態では、解像度変更が階層GOP内のキーピクチャ、例えば、ピクチャが:
・最下層の時間レイヤに属する、および
・すべてのGOPで一度発生する、および
・符号化順序に続くすべてのピクチャは、より低いPOC(例えば、より早いプレゼンテーションタイムスタンプ)を有し、
参照ピクチャがリサンプリングされるとき、より高い時間レイヤのGOP内の直後のピクチャのいずれもカスケードアップ/ダウンサンプリングを必要としない。
【0068】
別の実施形態によれば、解像度変更はプレゼンテーション順序でキーピクチャの直後に続くピクチャ、すなわち、プレゼンテーション順序で次のGOPの最初のピクチャにおいてのみ許可される。
【0069】
別の実施形態では、連続する解像度変化間の時間距離がレベル定義における最小POC(ピクチャ順序カウント(picture order count))距離によって制限される。
【0070】
別の実施形態では、連続する解像度変化間の時間的距離がレベル定義における中間の符号化ピクチャの最小数によって制限される。
【0071】
別の実施形態では、解像度の変化は、破棄不可としてマークされたピクチャ、またはnon_reference_picture_flagが0に等しい参照ピクチャとしてのみ起こり得る。
【0072】
別の実施形態では、解像度変化の速度が、レベル定義によって制限される。
【0073】
別の実施形態では、現在のピクチャに対する参照ピクチャのリサンプリングが単一のリサンプリング比を使用するように制限され、例えば、現在のピクチャとは異なる解像度を有する現在のピクチャのすべての参照ピクチャが同じ解像度を有するように要求される。
【0074】
別の実施形態では、現在のピクチャの1つの参照ピクチャがリサンプリングを必要とするとき、現在のピクチャのすべての参照ピクチャはリサンプリングを使用する必要があり、例えば、1つの参照ピクチャと同じオリジナルの解像度である。
【0075】
別の実施形態では、現在のピクチャの1つの参照ピクチャのみが、リサンプリングを必要とすることが許可される。
【0076】
別の実施形態によれば、解像度変更ポイントにおいてリサンプリングを必要とするピクチャの最大数は、デコーダの保証として符号化ビデオシーケンス/ビットストリーム内に任意選択で示され、指示が存在しない場合、レベル定義による推論または指示が行われる。
【0077】
別の実施形態では、オリジナルの(リサンプリングされていない)参照ピクチャがリサンプリングされた参照ピクチャのみがそこから利用可能であるように、リサンプリングされた後に、参照ピクチャリストおよび/または復号化ピクチャバッファから除去され、例えば、参照のために使用されていないとしてマークされる。
【0078】
別の実施形態では、符号化ビデオシーケンス内で使用されるリサンプリング比が、シーケンスまたはビットストリームスコープを有するパラメータセット(復号パラメータセット(decoding parameter set)、DPS;シーケンスパラメータセット(sequence parameter set)、SPS)に含まれるリサンプリング比のセットに制限される。
【0079】
以下、本発明の第3の態様について詳細に説明する。
【0080】
特に、第2の態様は、参照ピクチャリサンプリングのためのズームのための柔軟な領域ベースの参照を提供する。
【0081】
上述のように、SHVCおよびSVCのような階層化コーデックでは、2つの拡張スケーラビリティモード、すなわち、以下の
図4に示すようなRoIスケーラビリティ(下層ピクチャの領域が上層で拡大される)および拡張スケーラビリティ(下層ピクチャが上層で追加コンテンツを介して拡張される)が対処される。
【0082】
拡張スケーラビリティは、例えば、いわゆるズームアウトと呼ばれる使用ケース、例えば、ビデオがより多くのコンテンツ、例えば、より大きなキャプチャ角度、シーンのより多くの部分、より大きな領域などを完全にカバーするという意味で時間的に変化する使用ケースを参照してもよい。
【0083】
図4は、拡張スケーラビリティに対する関心領域(RoI)スケーラビリティを示す。
【0084】
ズームインおよびズームアウトが許容されるシナリオでは、予測に使用され予測されるズームおよび移動領域が定義される。これは、RoIスケーラビリティ(典型的にはズームイン)または拡張スケーラビリティ(典型的にはズームアウト)として知られている。スケーラブル符号化によるRoIスケーラビリティでは、通常、参照ピクチャの次元にアップスケールされる領域が参照ピクチャ内で定義される。しかしながら、スケーラブル符号化では、予測が実行される上層ピクチャと下層ピクチャとが同じ時間を表す。
【0085】
SHVCおよびSVCの場合、これは層状符号化のために行われ、これらの場合、並置されたベース層はいかなる動きも表さない、例えば、ベース層内の対応するサンプルは既知であるため、ベース層内の既知の領域を完全にアップスケールし、そのアップスケールされた基準に基づいて動作することが可能であった。
【0086】
しかしながら、RPR応用では、それらの間で予測が実行される2つのピクチャが同じ時間インスタンスを描写せず、従って、定義された領域から外れたいくつかのコンテンツは、時間インスタンスA(低解像度)から時間インスタンスB(高解像度)においてズームイン/アウト領域に移動することができる。予測のためにこれらの領域を参照することを禁止することは、符号化効率のために有害である。
【0087】
しかしながら、RPRの場合、例えば、RoIに移動するオブジェクトがエリア内でズームされることにより、参照は、対応する参照領域の外側のあるエリアを指すことができる。これは、符号化解像度を実際に変更することなく
図5aに示されている:
【0088】
図5aは、時間の経過に伴ってピクチャ内で移動するコンテンツ断片(グレー)の第1の例を描写する。
【0089】
第1の実施形態では、RoIズーム領域に入る図中のグレーボックスが参照内にあるように、RoIの面積よりも大きい面積を含む参照領域が定義される:
【0090】
図5bは、時間の経過に伴ってピクチャ内で移動するコンテンツ断片(グレー)の第2の例を描写する。
【0091】
これはRoIに対応するピクチャについて、RoIよりも少し大きい領域を再構成することにつながり、追加の領域はクロッピングウィンドウを示すことによって除去される。この問題は、参照をアップサンプリングするために使用されるスケーリング係数がクロップアウトされたピクチャからVVC(Versative Video Coding)で計算されるという事実から生じる。最初に、RoIがないと仮定すると、水平スケール係数HorScaleおよび垂直スケール係数VerScaleは、以下のように計算される:
HorScale = CroppedOutWidthPic / CroppedOutWidthRefPic
VerScale = CroppedOutHeightPic / CroppedOutHeightRefPic
【0092】
クロップアウトされたピクチャに基づいて比率を示す理由は、コーデックが最小サイズ(VVC 8サンプルにおける)の倍数である必要があるので、関心のあるピクチャサイズに応じて、いくつかの追加のサンプルが復号される必要があるからである。従って、PicまたはRefPicのいずれかが8の倍数でない場合、いくつかのサンプルが入力ピクチャに加算され、それらが8の倍数になって、比率が異なり、誤ったスケーリング係数につながる。この問題は、ビットストリームが「マージ可能(mergeable)」として符号化されることが望まれる場合、例えば、ピクチャサイズが128までのCTUサイズの倍数である必要がある場合のように、ビットストリームを他のビットストリームにマージすることができる場合に、さらに悪化する可能性がある。従って、正しいスケーリング係数は、クロッピングウィンドウを考慮する必要がある。
【0093】
いくつかの追加の参照を含めるためにクロッピングウィンドウを使用する、記述されたシナリオ(RPRをRoIと組み合わせる)では、クロッピングウィンドウの使用は不十分である。
【0094】
上述のように、参照ピクチャ内のRoIを少し大きく定義することができ、RoIは参照のために使用されるが、現在の再構成ピクチャ内のクロッピングウィンドウと共に廃棄される。しかしながら、水平スケール係数HorScaleおよび垂直スケール係数VerScaleが、次のように計算された場合:
HorScale = CroppedOutWidthPic / WidthEnlargedRefRoI
VerScale = CroppedOutHeightPic / HeightEnlargeRefRoI
拡大されたRoI内のサンプルのいくつかは、実際にはクロップアウトされた領域内のサンプルに対応するので、結果が正しくない。
【0095】
以下では、実施形態の第1のグループによるクロッピングウィンドウベース化概念(cropping window based concept)について説明する。
【0096】
従って、上記第1のグループの実施形態では、計算は例えば、以下のようになってもよく:
HorScale = CodedPicWidth / RefRoIWidth
VerScale = CodedPicHeight / RefRoIHeight
このような計算は、スケール係数の計算のために切り取られるサンプルを含む。
【0097】
シグナリングに関して、一実施形態では、拡大されたRoIのシグナリングは、クロッピングウィンドウ情報がスケーリング係数計算において無視されるべきであることを示す。
【0098】
別の実施形態では、スケーリング係数の計算にクロッピングウィンドウを考慮する必要があるか否かは、ビットストリーム(例えば、パラメータセットまたはスライスヘッダ)で示される。
【表6】
【0099】
クロッピングウィンドウは例えば、適合クロッピングウィンドウと呼ばれることもある。クロッピングウィンドウ/適合クロッピングウィンドウに対するオフセットは例えば、pps_conf_win_left_offset、pps_conf_win_top_offset、pps_conf_win_right_offset、およびpps_conf_win_botton_offsetとも呼ばれることがある。
【0100】
use_cropping_for_scale_factor_derivation_flagを用いて、クロッピングウィンドウ上の符号化ビデオ信号内の情報を、参照ピクチャ内の領域をアップスケールするために(または、クロッピングウィンドウ上の符号化ビデオ信号内の情報を参照ピクチャ内の領域のアップスケールに用いるか否かを決定するために)無視するか否かを決定する代わりに、例えば、pps_scaling_window_explicit_signalling_flagを用いてもよい。
【0101】
例えば、pps_scaling_window_explicit_signalling_flagが0に設定されている(または例えば、FALSEに設定されている、または例えば、-1に設定されている)場合、クロッピングウィンドウ上の符号化ビデオ信号内の情報は例えば、参照ピクチャ内の領域をアップスケールするために使用されてもよい。そして、例えば、pps_scaling_window_explicit_signalling_flagが1に設定されている(または、例えば、TRUEに設定されている)場合、クロッピングウィンドウ上の符号化ビデオ信号内の情報は例えば、参照ピクチャ内の領域をアップスケールするために無視されてもよい。
【0102】
上記アプローチの欠点の1つは、RoIの外側のサンプルを参照すること、例えば、拡大されたRoI上のサンプルを参照することを可能にするために、現在のピクチャのために復号される領域がより大きくなることである。より具体的には、サンプルがRoIの外側の領域で復号され、後にクロッピングウィンドウで廃棄される。これは、参照ピクチャ内の対応するRoIの外部での参照を可能にする符号化効率ゲインに潜在的に対抗することができる追加のサンプルオーバーヘッドおよび符号化効率の低減につながる。
【0103】
より効率的なアプローチは、RoIのみを復号化することであるが(上述したように、8倍のピクチャまたはCTUを作るために必要な追加のサンプルについては省略する)、拡大されたRoI内のサンプルを参照することを可能にする。
【0104】
以下では、第2のグループの実施形態によるバウンディングボックスベース化概念(bounding box based concept)について説明する。
【0105】
上記第2のグループの実施形態では、赤色矩形の外側であるが緑色ボックスの内部であるサンプル(RoIオフセットに追加のRoIオフセットを加えたもの)が赤色RoIのみを使用する代わりに、リサンプリングされたref picを決定するために使用される。
【0106】
赤色カットアウト周りのMVのための境界ボックスのサイズは、メモリアクセス/ラインバッファ要求を制限し、また、pic-wiseアップサンプリングアプローチによる実装を可能にする利点と共に定義/シグナリングされる。
【0107】
そのようなシグナリングは、PPS(additional_roi_X)に含めることができる:
【表7】
【0108】
従って、スケーリング係数の導出は次のようになる:
HorScale = CroppedOutWidthPic / RefRoIWidth
VerScale = CroppedOutHeightPic / RefRoIHeight
【0109】
一実施形態では、参照サンプルがRoI_X_offsetを使用して配列されたサンプルを見つけ、参照サンプルがadditional_RoI_xによって示される拡大されたRoIの外側にある場合にクリップされるMVを適用することによって識別される。代替的には、この拡大されたRoIの外側のサンプルが、拡大されたRoI内の最後のサンプルでパッド(pad)される。
【0110】
別の実施形態では、この拡大されたRoIが、実装最適化に使用することができる制限または制約としてのみ使用される。例えば、参照ピクチャが、オンザフライ(on-the-fly)(ブロックベース化)ではなく、必要に応じて最初に完全にアップサンプリングされる場合、拡大されたRoIのみが、ピクチャ全体の代わりにリサンプリングされ、多くの処理を節約する。
【0111】
さらなる問題は、2つ以上の参照ピクチャが同時に使用される場合である。この場合、RoI領域情報が適用されるピクチャを特定する必要がある。このような場合、PPSに情報を追加する代わりに、スライスヘッダは、参照リスト内のエントリの一部がピクチャ全体ではなく、その一部を参照していないことを示す。例えば、
【表8】
【0112】
さらなる実施形態では、追加の制約が適所にある:
・より低いPOCを有する参照ピクチャのみが、RoI情報を有することができる。典型的には、RoIスイッチングが説明された特徴を用いて、オープンGOPスイッチングシナリオに適用され、従って、より高いPOCを有するPOCは既にRoIシーンを表す。
・1つの参照ピクチャのみがRoI情報を有することができる。
【0113】
別の実施形態では、RoIInfo()がピクチャパラメータセットで搬送され、スライスヘッダは参照ピクチャごとにフラグ(RoI_flag)のみを搬送し、RoI情報がリサンプリング(スケーリング係数の導出)のために適用されるべきか否かを示す。以下の図は、スイッチングポイントの2つ前と2つ後の4つの符号化ピクチャにおける原理を示す。スイッチングポイントにおいて、総分解能は一定のままであるが、RoIのアップサンプリングが実行される。2つのPPSが定義され、後者の2つのピクチャのPPSは、参照ピクチャ内のRoIを示す。さらに、後者の2つのピクチャのスライスヘッダはそれらの参照ピクチャのそれぞれについてRoI_flag[i]を搬送し、値は、図では「RoI_flag」または「RF = x」として示される。
【0114】
さらに、スライスヘッダは、上記のようにRoI_flagだけでなく、フラグがtrueの場合、特定の参照ピクチャに適用するRoI情報を識別するためにパラメータセットで運ばれるRoIInfo()の配列への追加インデックスを、各参照ピクチャに対して搬送することができる。
【0115】
図6aは、混合参照ピクチャによる現在のピクチャを示す図である。
【0116】
以下では、第3のグループの実施形態によるズームアウトの場合について説明する。
【0117】
RoIスケーラビリティの代わりに、上記第3のグループの実施形態では、拡張されたスケーラビリティ、例えば、RoIピクチャからより大きなエリアに行くスケーラビリティを考慮することができる。このような場合、特に、電流デコードされたピクチャの領域が、拡大縮小などの拡張性のための領域であると識別される場合、参照ピクチャのクロッピングウィンドウも無視されるべきである。
【0118】
図6bは、現在のピクチャ内で識別された領域の場合に、参照ピクチャのクロッピングウィンドウを無視する例を示す。
【0119】
HorScale = IdentifiedRegionInPicWidth / CodedRefPicWidth
VerScale = IdentifiedRegionInPicHeight / CodedRefPicHeight
【0120】
いくつかの態様を装置の文脈で説明したが、これらの態様はブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応する、対応する方法の説明も表していることは明らかである。同様に、方法ステップの文脈で説明される態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部または全部は例えば、マイクロプロセッサ、プログラマブルコンピュータ、または電子回路などのハードウェア装置によって(またはそれを使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの1つまたは複数を、そのような装置によって実行することができる。
【0121】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアで、またはソフトウェアで、または少なくとも部分的にハードウェアで、または少なくとも部分的にソフトウェアで実施することができる。この実装は、デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD(登録商標)、Blu-ray(登録商標)、CD(登録商標)、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行することができ、これらは、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または協働することができる)電子的に読み取り可能な制御信号が記憶されている。従って、デジタル記憶媒体は、コンピュータ読み取り可能であってもよい。
【0122】
本発明によるいくつかの実施形態は本明細書で説明される方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる、電子的に読み取り可能な制御信号を有するデータキャリアを備える。
【0123】
一般に、本発明の実施形態はプログラムコードを有するコンピュータプログラム製品として実施することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法のうちの1つを実行するように動作可能である。プログラムコードは例えば、機械可読キャリア上に記憶されてもよい。
【0124】
他の実施形態は、機械可読キャリアに記憶された、本明細書に記載された方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0125】
換言すれば、本発明の方法の一実施形態は従って、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書で説明される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0126】
従って、本発明の方法のさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムをその上に記録して備える、データキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、典型的には有形および/または非一時的である。
【0127】
従って、本発明の方法のさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号シーケンスは例えば、データ通信接続を介して、例えば、インターネットを介して転送されるように構成されてもよい。
【0128】
さらなる実施形態は本明細書で説明される方法のうちの1つを実行するように構成された、または適合された、処理手段、例えば、コンピュータ、またはプログラマブル論理デバイスを備える。
【0129】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0130】
本発明によるさらなる実施形態は、本明細書で説明される方法のうちの1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的または光学的に)転送するように構成された装置またはシステムを備える。受信器は例えば、コンピュータ、モバイル装置、メモリ装置等であってもよい。装置またはシステムは例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含むことができる。
【0131】
いくつかの実施形態では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書で説明される方法の機能のいくつかまたはすべてを実行することができる。
【0132】
いくつかの実施形態では、フィールドプログラマブルゲートアレイが本明細書で説明される方法のうちの1つを実行するために、マイクロプロセッサと協働することができる。一般に、方法は、好ましくは任意のハードウェア装置によって実行される。
【0133】
本明細書で説明される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組合せを使用して実装され得る。
【0134】
本明細書で説明される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組合せを使用して実行され得る。
【0135】
上述の実施形態は、単に本発明の原理を説明するためのものである。本明細書で説明される構成および詳細の修正および変形は、他の当業者には明らかであろうことが理解される。従って、本明細書の実施形態の説明および説明によって提示される特定の詳細によってではなく、差し迫った(impending)特許請求の範囲によってのみ限定されることが意図される。
【手続補正書】
【提出日】2022-05-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
マイクロプロセッサとメモリとを備える復号装置であって、前記メモリは:前記マイクロプロセッサによって実行されるとき、前記復号装置に、
ビデオデータストリームのピクチャパラメータセット(PPS)から、pps_conf_win_left_offset、pps_conf_win_top_offset、pps_conf_win_right_offset、およびpps_conf_win_bottom_offsetを備える適合ウインドウパラメータ(conformance cropping window parameters)を復号させ、
前記ピクチャパラメータセット(PPS)から、pps_scaling_window_explicit_signalling_flagを復号させ、
前記pps_scaling_window_explicit_signalling_flagの値がfalseであると判断させ、
前記pps_scaling_window_explicit_signalling_flagの値がfalseであるとの判断に基づいて、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用して参照ピクチャ内の領域のアップスケールを実行させる、
命令を備えるコンピュータプログラムを備える、
復号装置。
【請求項2】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記復号装置に、さらに:
前記ビデオデータストリームの第2のピクチャパラメータセット(PPS)から、第2のpps_conf_win_left_offset、第2のpps_conf_win_top_offset、第2のpps_conf_win_right_offset、および第2のpps_conf_win_bottom_offsetを備える第2の適合クロッピングウインドウパラメータを復号させ、
前記第2のピクチャパラメータセット(PPS)から、第2のpps_scaling_window_explicit_signalling_flagを復号させ、
前記第2のpps_scaling_window_explicit_signalling_flagの値がtrueであると判断させ、
前記第2のpps_scaling_window_explicit_signalling_flagの値がtrueであるとの判断に基づいて、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用せずに、第2の参照ピクチャ内の領域のアップスケールを実行させる、
命令を備える、
請求項1に記載の復号装置。
【請求項3】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記復号装置に、さらに:
前記第2のPPSから、ROIオフセットパラメータおよび追加のROIオフセットパラメータを復号させる
命令を備え、
前記第2の参照ピクチャ内の前記領域の前記アップスケールは、リサンプリングされた参照ピクチャを決定するために、前記ROIオフセットパラメータおよび追加のROIオフセットパラメータを使用して実行される、
請求項2に記載の復号装置。
【請求項4】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記復号装置に、さらに:
前記ROIオフセットパラメータおよび動きベクトルを使用して並置されたサンプルを見つけることによって、参照サンプルを識別させ、
前記参照サンプルが前記追加のオフセットパラメータによって示される拡大ROIの外側にあると判断させ、
前記参照サンプルが前記拡大ROIの外側にあるとの判断に基づいて、前記動きベクトルをクリップさせる、
命令を備える、
請求項3に記載の復号装置。
【請求項5】
マイクロプロセッサとメモリとを備える符号化装置であって、前記メモリは、前記マイクロプロセッサによって実行されるとき、前記符号化装置に:
pps_conf_win_left_offset、pps_conf_win_top_offset、pps_conf_win_right_offset、およびpps_conf_win_bottom_offsetを備える適合クロッピングウインドウを、ビデオデータストリームのピクチャパラメータセット(PPS)に符号化させ、
参照ピクチャ内の領域のアップスケールを実行するために、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用することを決定させ、
前記参照ピクチャ内の前記領域のアップスケールを実行するために、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用するとの決定に基づいて、
値がfalseのpps_scaling_window_explicit_signalling_flagを、前記ピクチャパラメータセット(PPS)に符号化させる、
命令を備えるコンピュータプログラムを備える、
符号化装置。
【請求項6】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記符号化装置に、さらに:
第2のpps_conf_win_left_offset、第2のpps_conf_win_top_offset、第2のpps_conf_win_right_offset、および第2のpps_conf_win_bottom_offsetを備える第2の適合クロッピングウインドウを、前記ビデオデータストリームの第2のピクチャパラメータセット(PPS)に符号化させ、
第2の参照ピクチャ内の領域をアップスケールするために、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用しないことを決定させ、
前記第2の参照ピクチャ内の前記領域の前記アップスケールを実行するために、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用しないとの決定に基づいて、
前記第2のpps_scaling_window_explicit_signalling_flagを、前記第2のピクチャパラメータセット(PPS)に符号化させる、
命令を備える、請求項5に記載の符号化装置。
【請求項7】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記符号化装置に、さらに:
ROIオフセットパラメータ、および追加のROIオフセットパラメータを、前記第2のPPSに符号化させる、
命令をさらに備え、
前記第2の参照ピクチャ内の前記領域の前記アップスケールは、リサンプリングされた参照ピクチャを決定するために、前記ROIオフセットパラメータおよび追加のROIオフセットパラメータを使用して実行される、
請求項6に記載の符号化装置。
【請求項8】
前記コンピュータプログラムは、前記マイクロプロセッサによって実行されるとき、前記符号化装置に、さらに:
前記ROIオフセットパラメータおよび動きベクトルを使用して並置されたサンプルを見つけることによって、参照サンプルを識別させ、
前記参照サンプルが前記追加のオフセットパラメータによって示される拡大ROIの外側にあると判断させ、
前記参照サンプルが前記拡大ROIの外側にあるとの判断に基づいて、前記動きベクトルをクリップさせる、
命令を備える、請求項7に記載の符号化装置。
【請求項9】
ビデオを復号する方法であって、前記方法は:
ビデオデータストリームのピクチャパラメータセット(PPS)から、pps_conf_win_left_offset、pps_conf_win_top_offset、pps_conf_win_right_offset、およびpps_conf_win_bottom_offsetを含む適合クロッピングウインドウパラメータを復号し、
前記ピクチャパラメータセット(PPS)から、pps_scaling_window_explicit_signalling_flagを復号し、
前記pps_scaling_window_explicit_signalling_flagの値がfalseであると判断し、
前記pps_scaling_window_explicit_signalling_flagの値がfalseであるとの判断に基づいて、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用して参照ピクチャ内の領域のアップスケールを実行する、
ステップを備える、方法。
【請求項10】
ビデオデータストリームの第2のピクチャパラメータセット(PPS)から、第2のpps_conf_win_left_offset、第2のpps_conf_win_top_offset、第2のpps_conf_win_right_offset、および第2のpps_conf_win_bottom_offsetを備える第2の適合クロッピングウインドウパラメータを復号し、
前記第2のピクチャパラメータセット(PPS)から、第2のpps_scaling_window_explicit_signalling_flagを復号し、
前記第2のpps_scaling_window_explicit_signalling_flagの値がtrueであると判断し、
前記第2のpps_scaling_window_explicit_signalling_flagの値がtrueであるとの判断に基づいて、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用せずに、第2の参照ピクチャ内の領域のアップスケールを実行する、
ステップをさらに備える、
請求項9に記載の方法。
【請求項11】
前記第2のPPSから、ROIオフセットパラメータ、および追加のROIオフセットパラメータを復号する、
ステップをさらに備え、
前記第2の参照ピクチャ内の前記領域の前記アップスケールは、リサンプリングされた参照ピクチャを決定するために、前記ROIオフセットパラメータおよび追加のROIオフセットパラメータを使用して実行される、
請求項10に記載の方法。
【請求項12】
前記ROIオフセットパラメータおよび動きベクトルを使用して並置されたサンプルを見つけることによって、参照サンプルを識別し、
前記参照サンプルが前記追加のオフセットパラメータによって示される拡大ROIの外側にあると判断し、
前記参照サンプルが前記拡大ROIの外側にあるとの判断に基づいて、前記動きベクトルをクリッピングする、
ステップをさらに備える、請求項11に記載の方法。
【請求項13】
ビデオを符号化する方法であって、前記方法は:
pps_conf_win_left_offset、pps_conf_win_top_offset、pps_conf_win_right_offset、およびpps_conf_win_bottom_offsetを備える適合クロッピングウインドウパラメータを、ビデオデータストリームのピクチャパラメータセット(PPS)に符号化し、
参照ピクチャ内の領域のアップスケールを実行するために、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用することを決定し、
前記参照ピクチャ内の前記領域の前記アップスケールを実行するために、前記pps_conf_win_left_offset、前記pps_conf_win_top_offset、前記pps_conf_win_right_offset、および前記pps_conf_win_bottom_offsetを使用するとの判断に基づいて、
値がfalseのpps_scaling_window_explicit_signalling_flagを、前記ピクチャパラメータセット(PPS)に符号化する、
ステップを備える方法。
【請求項14】
第2のpps_conf_win_left_offset、第2のpps_conf_win_top_offset、第2のpps_conf_win_right_offset、および第2のpps_conf_win_bottom_offsetを備える第2の適合クロッピングウインドウパラメータを、ビデオデータストリームの第2のピクチャパラメータセット(PPS)に符号化し、
第2の参照ピクチャ内の領域をアップスケールするために、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用しないことを決定し、
前記第2の参照ピクチャ内の前記領域のアップスケールを実行するために、前記第2のpps_conf_win_left_offset、前記第2のpps_conf_win_top_offset、前記第2のpps_conf_win_right_offset、および前記第2のpps_conf_win_bottom_offsetを使用しないとの決定に基づいて、
trueの値を有する第2のpps_scaling_window_explicit_signalling_flagを、第2のピクチャパラメータセット(PPS)に符号化する、
ステップをさらに備える、請求項13に記載の方法。
【請求項15】
ROIオフセットパラメータ、および追加のROIオフセットパラメータを、前記第2のPPSに符号化する、
ステップをさらに備え、
前記第2の参照ピクチャ内の前記領域の前記アップスケールは、リサンプリングされた参照ピクチャを決定するために、前記ROIオフセットパラメータおよび追加のROIオフセットパラメータを使用して実行される、
請求項14に記載の方法。
【請求項16】
前記ROIオフセットパラメータおよび動きベクトルを使用して並置されたサンプルを見つけることによって、参照サンプルを識別し、
前記参照サンプルが前記追加のオフセットパラメータによって示される拡大ROIの外側にあると判断し、
前記参照サンプルが前記拡大ROIの外側にあるとの判断に基づいて、前記動きベクトルをクリッピングする、
ステップをさらに備える、請求項15に記載の方法。
【国際調査報告】