(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023118935
(43)【公開日】2023-08-25
(54)【発明の名称】フィルタリングに基づく画像コーディング装置及び方法
(51)【国際特許分類】
H04N 19/70 20140101AFI20230818BHJP
【FI】
H04N19/70
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2023111521
(22)【出願日】2023-07-06
(62)【分割の表示】P 2022535889の分割
【原出願日】2020-12-11
(31)【優先権主張番号】62/947,505
(32)【優先日】2019-12-12
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100165191
【弁理士】
【氏名又は名称】河合 章
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100159259
【弁理士】
【氏名又は名称】竹本 実
(72)【発明者】
【氏名】ヘンドリー ヘンドリー
(72)【発明者】
【氏名】シータル パルリ
(72)【発明者】
【氏名】キム スンファン
(57)【要約】
【課題】画像/ビデオコーディングの効率を高める方法を提供する。
【解決手段】本文書の実施形態等によれば、画像のコーディングのために、サブピクチャ及び/又は仮想境界が使用され得る。例えば、現在ピクチャ内のサブピクチャは、現在ピクチャのための予測、復元、及び/又はフィルタリングのために使用されることができる。仮想境界は、現在ピクチャの復元サンプルのためのフィルタリングのために使用されることができる。本文書の実施形態等に係るサブピクチャ及び/又は仮想境界に基づいた画像コーディングを介して、画像の主観的/客観的品質が向上することができ、そしてコーディングに必要なハードウェア資源の消費が減ることができる。
【選択図】
図5
【特許請求の範囲】
【請求項1】
デコード装置によって行われる画像デコード方法において、
ビットストリームを介してレジデュアル情報及び参照ピクチャ関連情報を含む画像情報を取得するステップと、
前記参照ピクチャ関連情報に基づいて少なくとも1つの参照ピクチャを導出するステップと、
前記レジデュアル情報及び前記少なくとも1つの参照ピクチャに基づいて現在ピクチャの復元サンプルを生成するステップと、
前記復元サンプルに対するインループフィルタリング手順に基づいて修正された復元サンプルを生成するステップと、を含み、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、画像デコード方法。
【請求項2】
前記追加的な仮想境界関連情報は、仮想境界の個数及び仮想境界の位置を含む、請求項1に記載の画像デコード方法。
【請求項3】
前記追加的な仮想境界関連情報は、垂直仮想境界の個数に関する情報、垂直仮想境界の位置に関する情報、水平仮想境界の個数に関する情報、及び水平仮想境界の位置に関する情報を含む、請求項1に記載の画像デコード方法。
【請求項4】
前記画像情報は、参照ピクチャリサンプリング可用フラグを含み、
前記参照ピクチャリサンプリング可用フラグに基づいて、前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かが決定される、請求項1に記載の画像デコード方法。
【請求項5】
前記SPSは、前記SPSが前記追加的な仮想境界関連情報を含むか否かに関連したSPS仮想境界存在フラグを含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であることに基づいて、前記SPS仮想境界存在フラグの値は、0に決定される、請求項1に記載の画像デコード方法。
【請求項6】
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であることに基づいて、前記追加的な仮想境界関連情報は、前記SPSに含まれない、請求項1に記載の画像デコード方法。
【請求項7】
前記画像情報は、ピクチャヘッダ情報を含み、
前記ピクチャヘッダ情報は、前記追加的な仮想境界関連情報を含む、請求項6に記載の画像デコード方法。
【請求項8】
エンコード装置によって行われる画像エンコード方法において、
現在ブロックに対するレジデュアルサンプルを生成するステップと、
前記現在ブロックに対する前記レジデュアルサンプルに基づいてレジデュアル情報を生成するステップと、
現在ピクチャの復元サンプルのための少なくとも1つの参照ピクチャを導出するステップと、
前記少なくとも1つの参照ピクチャに基づいて参照ピクチャ関連情報を生成するステップと、
前記現在ピクチャの復元サンプルのためのインループフィルタリング関連情報を生成するステップと、
前記レジデュアル情報、前記参照ピクチャ関連情報、及び前記インループフィルタリング関連情報を含む画像情報をエンコードするステップと、を含み、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、画像エンコード方法。
【請求項9】
前記追加的な仮想境界関連情報は、仮想境界の個数及び仮想境界の位置を含む、請求項8に記載の画像エンコード方法。
【請求項10】
前記追加的な仮想境界関連情報は、垂直仮想境界の個数に関する情報、垂直仮想境界の位置に関する情報、水平仮想境界の個数に関する情報、及び水平仮想境界の位置に関する情報を含む、請求項8に記載の画像エンコード方法。
【請求項11】
前記画像情報は、参照ピクチャリサンプリング可用フラグを含み、
前記参照ピクチャリサンプリング可用フラグに基づいて、前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かが決定される、請求項8に記載の画像エンコード方法。
【請求項12】
前記SPSは、前記SPSが前記追加的な仮想境界関連情報を含むか否かと関連したSPS仮想境界存在フラグを含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であることに基づいて、前記SPS仮想境界存在フラグの値は、0に決定される、請求項8に記載の画像エンコード方法。
【請求項13】
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であることに基づいて、前記仮想境界関連情報は、前記SPSに含まれない、請求項8に記載の画像エンコード方法。
【請求項14】
前記画像情報は、ピクチャヘッダ情報を含み、
前記ピクチャヘッダ情報は、前記追加的な仮想境界関連情報を含む、請求項13に記載の画像エンコード方法。
【請求項15】
前記現在ピクチャは、ただ1つのサブピクチャとしてのサブピクチャを含み、
前記サブピクチャは、独立的にコーディングされ、
前記復元サンプルは、前記サブピクチャに基づいて生成され、
前記サブピクチャに基づいてサブピクチャ関連情報が生成され、
前記画像情報は、前記サブピクチャ関連情報を含む、請求項8に記載の画像エンコード方法。
【請求項16】
前記画像情報に前記サブピクチャのためのピクチャ取扱フラグは存在しない、請求項15に記載の画像エンコード方法。
【請求項17】
前記サブピクチャのためのピクチャ取扱フラグの値は、1に設定される、請求項16に記載の画像エンコード方法。
【請求項18】
前記現在ピクチャは、サブピクチャを含み、
前記サブピクチャは、2つ以上の独立的に-コーディングされた-サブピクチャの併合手順に基づいて導出され、
前記復元サンプルは、前記サブピクチャに基づいて生成され、
前記サブピクチャに基づいてサブピクチャ関連情報が生成され
前記画像情報は、前記サブピクチャ関連情報を含む、請求項8に記載の画像エンコード方法。
【請求項19】
画像に対するデータの送信方法において、
前記画像に対するビットストリームを取得するステップであって、前記ビットストリームは、現在ブロックに対するレジデュアルサンプルを生成し、前記現在ブロックに対する前記レジデュアルサンプルに基づいてレジデュアル情報を生成し、現在ピクチャの復元サンプルのための少なくとも1つの参照ピクチャを導出し、前記少なくとも1つの参照ピクチャに基づいて参照ピクチャ関連情報を生成し、前記現在ピクチャの復元サンプルのためのインループフィルタリング関連情報を生成し、前記レジデュアル情報、前記参照ピクチャ関連情報、及び前記インループフィルタリング関連情報を含む画像情報をエンコードすることに基づいて生成される、ステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、データ送信方法。
【発明の詳細な説明】
【技術分野】
【0001】
本文書は、フィルタリングに基づく画像コーディング装置及び方法に関する。
【背景技術】
【0002】
近年、4K又は8K以上のUHD(Ultra High Definition)画像/ビデオのような高解像度、高品質の画像/ビデオに対する需要が様々な分野で増加している。画像/ビデオデータが高解像度、高品質になるほど、既存の画像/ビデオデータに比べて相対的に送信される情報量又はビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像/ビデオデータを格納する場合、送信費用と格納費用が増加される。
【0003】
また、近年、VR(Virtual Reality)、AR(Artificial Realtiy)コンテンツやホログラムなどの実感メディア(Immersive Media)に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像/ビデオに対する放送が増加している。
【0004】
これにより、前記のような様々な特性を有する高解像度・高品質の画像/ビデオの情報を効果的に圧縮して送信するか、格納し、再生するために高効率の画像/ビデオ圧縮技術が求められる。
【0005】
具体的に、主観的/客観的ビジュアル品質を高めるために、インループフィルタリング手順が行われ、仮想境界に基づいたインループフィルタリングの実行のための情報のシグナリング効率を上げるための方案に対する議論がある。また、画像コーディングにおける予測及び復元の性能を向上させるためのサブピクチャの適用が検討されている。
【発明の概要】
【課題を解決するための手段】
【0006】
本文書の一実施形態によると、画像/ビデオコーディングの効率を高める方法及び装置を提供する。
【0007】
本文書の一実施形態によると、効率的なフィルタリング適用方法及び装置を提供する。
【0008】
本文書の一実施形態によると、デブロックキング、SAO(sample adaptive loop)、ALF(adaptive loop filtering)を効率的に適用する方法及び装置を提供する。
【0009】
本文書の一実施形態によると、仮想境界に基づいてインループフィルタリングが行われる。
【0010】
本文書の一実施形態によると、参照ピクチャのためのリサンプリングが可用であるか否かに基づいて、SPS(sequence parameter set)が追加的な仮想境界関連情報(例えば、仮想境界の個数及び位置に関する情報)を含むか否かが決定される。
【0011】
本文書の一実施形態によると、サブピクチャに基づいて画像コーディングが行われる。
【0012】
本文書の一実施形態によると、画像コーディングに利用されるサブピクチャが独立的にコーディングされる。
【0013】
本文書の一実施形態によると、ピクチャはただ1つのサブピクチャのみを含み、そして、前記サブピクチャは独立的にコーディングされる。
【0014】
本文書の一実施形態によると、ピクチャはサブピクチャの併合手順に基づいて生成され、そして、前記サブピクチャは独立的にコーディングされたサブピクチャであり得る。
【0015】
本文書の一実施形態によると、画像コーディングに利用されるサブピクチャはそれぞれピクチャとして扱われる。
【0016】
本文書の一実施形態によると、ビデオ/画像エンコードを行うエンコード装置を提供する。
【0017】
本文書の一実施形態によると、本文書の実施形態の少なくとも1つに開示されたビデオ/画像エンコード方法によって生成されたエンコードされたビデオ/画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。
【0018】
本文書の一実施形態によると、デコード装置により本文書の実施形態の少なくとも1つに開示されたビデオ/画像デコード方法を行うように引き起こすエンコードされた情報又はエンコードされたビデオ/画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。
【発明の効果】
【0019】
本文書の一実施形態によると、全般的な画像/ビデオ圧縮効率を上げることができる。
【0020】
本文書の一実施形態によると、効率的なフィルタリングを介して主観的/客観的ビジュアル品質を高めることができる。
【0021】
本文書の一実施形態によると、仮想境界ベースのインループフィルタリング手順が効率的に行われ、フィルタリング性能が改善されることができる。
【0022】
本文書の一実施形態によると、仮想境界ベースのインループフィルタリングのための情報が効率的にシグナリングされることができる。
【0023】
本文書の一実施形態によると、サブピクチャ関連情報が効率的にシグナリングされ、従って、画像の主観的/客観的品質が向上し、そして、コーディングに必要なハードウェアリソースの消耗が減少することができる。
【図面の簡単な説明】
【0024】
【
図1】本文書の実施形態に適用されることができるビデオ/画像コーディングシステムの例を概略的に示す。
【
図2】本文書の実施形態に適用されることができるビデオ/画像エンコード装置の構成を概略的に説明する図面である。
【
図3】本文書の実施形態に適用されることができるビデオ/画像デコード装置の構成を概略的に説明する図面である。
【
図4】コーディングされた画像/ビデオに対する階層構造を例示的に示す。
【
図5】エンコード装置におけるフィルタリングに基づくエンコード方法を説明するための順序図である。
【
図6】デコード装置におけるフィルタリングに基づくデコード方法を説明するための順序図である。
【
図7】本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。
【
図8】本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。
【
図9】本文書の実施形態(等)に係る画像/ビデオデコード方法及び関連コンポーネントの一例を概略的に示す。
【
図10】本文書の実施形態(等)に係る画像/ビデオデコード方法及び関連コンポーネントの一例を概略的に示す。
【
図11】本文書において開示された実施形態等が適用され得るコンテンツストリーミングシステムの例を示す。
【発明を実施するための形態】
【0025】
本文書は、様々な変更を加えることができ、種々の実施形態を有することができ、特定実施形態を図面に例示し、詳細に説明しようとする。しかしながら、これは、本文書を特定実施形態に限定しようとするものではない。本明細書で常用する用語は、単に特定の実施形態を説明するために使用されたものであって、本文書の技術的思想を限定しようとする意図で使用されるものではない。単数の表現は、文脈上明白に異なるように意味しない限り、複数の表現を含む。本明細書において「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定しようとするものであり、1つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加可能性を予め排除しないことと理解されるべきである。
【0026】
一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の都合上、独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち、2つ以上の構成が結合されて1つの構成をなすこともでき、1つの構成を複数の構成に分けることもできる。各構成が統合及び/又は分離された実施形態も本文書の本質から外れない限り、本文書の権利範囲に含まれる。
【0027】
以下、添付の図面を参照して、本文書の好ましい実施形態をより詳細に説明する。以下、図面上の同一の構成要素に対しては同一の参照符号を使用し、同一の構成要素について重複した説明は省略する。
【0028】
この文書は、ビデオ/画像コーディングに関する。例えば、この文書において開示された方法/実施形態は、VVC(Versatile Video Coding)標準(ITU-T Rec.H.266)、VVC以後の次世代ビデオ/イメージコーディング標準、またはそれ以外のビデオコーディング関連標準(例えば、HEVC(High Efficiency Video Coding)標準(ITU-T Rec.H.265)、EVC(essential video coding)標準、AVS2標準など)に関連する。
【0029】
この文書ではビデオ/画像コーディングに関する様々な実施形態を提示し、他の言及がない限り、前記実施形態は、互いに組み合わせて実行されることもできる。
【0030】
この文書においてビデオ(video)は、時間の流れによる一連の画像(image)の集合を意味し得る。ピクチャ(picture)は、一般に特定の時間帯の1つの画像を示す単位を意味し、スライス(slice)/タイル(tile)はコーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含んでもよい。1つのピクチャは1つ以上のスライス/タイルで構成されてもよい。1つのピクチャは1つ以上のタイルグループで構成されてもよい。1つのタイルグループは1つ以上のタイルを含んでもよい。
【0031】
ピクセル(pixel)又はペル(pel)は、1つのピクチャ(又は、画像)を構成する最小の単位を意味し得る。また、ピクセルに対応する用語として「サンプル(sample)」が使用されてもよい。サンプルは、一般的にピクセル又はピクセルの値を示し、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。または、サンプルは、空間ドメインでのピクセル値を意味することもでき、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもできる。
【0032】
ユニット(unit)は、画像処理の基本単位を示す。ユニットは、ピクチャの特定領域及び当該領域に関する情報のうち少なくとも1つを含む。1つのユニットは、1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含む。ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されてもよい。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(または、サンプルアレイ)または変換係数(transform coefficient)の集合(又は、アレイ)を含む。
【0033】
本文書において、「/」と「、」は、「及び/又は」と解釈される。例えば、「A/B」は「A及び/又はB」と解釈され、「A、B」は「A及び/又はB」と解釈される。追加的に、「A/B/C」は「A、B及び/又はCの少なくとも1つ」を意味する。また、「A、B、C」も「A、B及び/又はCの少なくとも1つ」を意味する。
【0034】
追加的に、本文書において「又は」は「及び/又は」と解釈される。例えば、「A又はB」は、1)「A」のみを意味し、2)「B」のみを意味するか、3)「A及びB」を意味し得る。言い換えれば、本文書の「又は」は「追加的に又は代替的に(aditionally or alternatively)」を意味し得る。
【0035】
本明細書において「少なくとも1つのA及びB(at least one of A and B)」は、「Aのみ」、「Bのみ」又は「AとBの両方」を意味し得る。また、本明細書において「少なくとも1つのA又はB(at least one of A or B)」や「少なくとも1つのA及び/又はB(at least one of A and/or B)」という表現は、「少なくとも1つのA及びB(at least one of A and B)」と同様に解釈され得る。
【0036】
また、本明細書において、「少なくとも1つのA、B及びC(at least one of A, B and C)」は、「Aのみ」、「Bのみ」、「Cのみ」又は「A、B及びCの任意の全ての組み合わせ(any combination of A, B and C)」を意味し得る。また、「少なくとも1つのA、B又はC(at least one of A, B or C)」や「少なくとも1つのA、B及び/又はC(at least one of A, B and C)」は「少なくとも1つのA、B及びC(at least one of A, B and C))」を意味し得る。
【0037】
また、本明細書において用いられる括弧は「例えば(for example)」を意味し得る。具体的に、「予測(イントラ予測)」と表示されている場合、「予測」の一例として「イントラ予測」が提案されたものであり得る。言い換えると、本明細書の「予測」は「イントラ予測」に制限(limit)されることなく、「イントラ予測」が「予測」の一例として提案されるものであり得る。また、「予測(すなわち、イントラ予測)」と表示されている場合にも、「予測」の一例として「イントラ予測」が提案されたものであり得る。
【0038】
本明細書において1つの図面内において個別に説明される技術的特徴は、個別に実現されてもよく、同時に実現されてもよい。
【0039】
図1は、本文書が適用されることができるビデオ/画像コーディングシステムの例を概略的に示す。
【0040】
図1に示すように、ビデオ/画像コーディングシステムはソースデバイス及び受信デバイスを備えることができる。ソースデバイスは、エンコードされたビデオ(video)/画像(image)情報又はデータをファイル又はストリーミング形態でデジタル格納媒体又はネットワークを介して受信デバイスに伝達することができる。
【0041】
前記ソースデバイスは、ビデオソース、エンコード装置、送信部を備えることができる。前記受信デバイスは、受信部、デコード装置、及びレンダラを備えることができる。前記エンコード装置は、ビデオ/画像エンコード装置と呼ばれることができ、前記デコード装置は、ビデオ/画像デコード装置と呼ばれることができる。送信機は、エンコード装置に備えられることができる。受信機は、デコード装置に備えられることができる。レンダラは、ディスプレイ部を備えることができ、ディスプレイ部は、別個のデバイス又は外部コンポーネントで構成されることもできる。
【0042】
ビデオソースは、ビデオ/画像のキャプチャ、合成、又は生成過程などを介してビデオ/画像を取得することができる。ビデオソースは、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、1つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ/画像が生成され得るし、この場合、関連データが生成される過程にビデオ/画像キャプチャ過程が代替されることができる。
【0043】
エンコード装置は、入力ビデオ/画像をエンコードすることができる。エンコード装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を行うことができる。エンコードされたデータ(エンコードされたビデオ/画像情報)は、ビットストリーム(bitstream)形態で出力されることができる。
【0044】
送信部は、ビットストリーム形態で出力されたエンコードされたビデオ/画像情報又はデータをファイル又はストリーミング形態でデジタル格納媒体又はネットワークを介して受信デバイスの受信部に伝達することができる。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、様々な格納媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介しての送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信/抽出してデコード装置に伝達することができる。
【0045】
デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を行ってビデオ/画像をデコードすることができる。
【0046】
レンダラは、デコードされたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介してディスプレイされることができる。
【0047】
図2は、本文書が適用されることができるビデオ/画像エンコード装置の構成を概略的に説明する図面である。以下、ビデオエンコード装置というのは、画像エンコード装置を含むことができる。
【0048】
図2に示すように、エンコード装置200は、画像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコード部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260、及びメモリ(memory)270を備えて構成されることができる。予測部220は、インター予測部221及びイントラ予測部222を備えることができる。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を備えることができる。レジデュアル処理部230は、減算部(subtractor、231)をさらに備えることができる。加算部250は、復元部(reconstructor)又は復元ブロック生成部(recontructged block generator)と呼ばれることができる。前述した画像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコード部240、加算部250、及びフィルタリング部260は、実施形態によって1つ以上のハードウェアコンポーネント(例えば、エンコーダチップセット又はプロセッサ)によって構成されることができる。また、メモリ270は、DPB(decoded picture buffer)を備えることができ、デジタル格納媒体によって構成されることもできる。前記ハードウェアコンポーネントは、メモリ270を内/外部コンポーネントとしてさらに備えることもできる。
【0049】
画像分割部210は、エンコード装置200に入力された入力画像(又は、ピクチャ、フレーム)を1つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)又は最大コーディングユニット(largest coding unit、LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造によって再帰的に(recursively)分割されることができる。例えば、1つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/又はターナリ構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/又はターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本開示に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、又は、必要に応じてコーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)又は変換ユニット(TU:Transform Unit)をさらに備えることができる。この場合、前記予測ユニット及び前記変換ユニットは、各々前述した最終コーディングユニットから分割又はパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を導く単位及び/又は変換係数からレジデュアル信号(residual signal)を導く単位であることができる。
【0050】
ユニットは、場合によって、ブロック(block)又は領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル又は変換係数(transform coefficient)等の集合を示すことができる。サンプルは、一般的にピクセル又はピクセルの値を示すことができ、輝度(luma)成分のピクセル/ピクセル値のみを示すことができ、彩度(chroma)成分のピクセル/ピクセル値のみを示すこともできる。サンプルは、1つのピクチャ(又は、画像)をピクセル(pixel)又はペル(pel)に対応する用語として使用することができる。
【0051】
減算部231は、入力画像信号(原本ブロック、原本サンプル又は原本サンプルアレイ)で予測部220から出力された予測信号(予測されたブロック、予測サンプル又は予測サンプルアレイ)を減算してレジデュアル信号(レジデュアルブロック、レジデュアルサンプル又はレジデュアルサンプルアレイ)を生成することができ、生成されたレジデュアル信号は、変換部232に送信される。予測部220は、処理対象ブロック(以下、現在ブロックという)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部220は、現在ブロック又はCU単位でイントラ予測が適用されるか、又はインター予測が適用されるか決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する様々な情報を生成してエントロピーエンコード部240に伝達することができる。予測に関する情報は、エントロピーエンコード部240でエンコードされてビットストリーム形態で出力されることができる。
【0052】
イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することができ、又は、離れて位置することもできる。イントラ予測で予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、DCモード及びプラナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、33個の方向性予測モード又は65個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定によってそれ以上又はそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部222は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0053】
インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは同じであることができ、異なることもできる。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(col CU)などの名前で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、インター予測部221は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われ得るし、例えば、スキップモードとマージモードとの場合に、インター予測部221は、隣接ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が送信されないことがある。動き情報予測(motion vector prediction、MVP)モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。
【0054】
予測部220は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のために、イントラ予測又はインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)を実行することができる。前記イントラブロックコピーは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ画像/動画コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、IBCは、本文書において説明されるインター予測技法のうち、少なくとも1つを用いることができる。
【0055】
インター予測部221及び/又はイントラ予測部222を介して生成された予測信号は、復元信号を生成するために用いられるか、レジデュアル信号を生成するために用いられることができる。変換部232は、レジデュアル信号に変換技法を適用して、変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform) などを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するという際に、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は正方形の同じサイズを有するピクセルブロックに適用されてもよく、正方形ではない可変サイズのブロックに適用されてもよい。
【0056】
量子化部233は、変換係数を量子化してエントロピーエンコード部240に送信され、エントロピーエンコード部240は、量子化された信号(量子化された変換係数に関する情報)をエンコードしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトル形態で再整列することができ、前記1次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などのような様々なエンコード方法を行うことができる。エントロピーエンコード部240は、量子化された変換係数の他に、ビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値等)を共に又は別にエンコードすることもできる。エンコードされた情報(例えば、エンコードされたビデオ/画像情報)は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信又は格納されることができる。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、又はビデオパラメータセット(VPS)等、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本文書において、後述されるシグナリング/送信される情報及び/又はシンタックス要素は、前述したエンコード手順を介してエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、又はデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、様々な格納媒体を含むことができる。エントロピーエンコード部240から出力された信号は、送信する送信部(図示せず)及び/又は格納する格納部(図示せず)がエンコード装置200の内/外部エレメントとして構成されることができ、又は送信部は、エントロピーエンコード部240に含まれることもできる。
【0057】
量子化部233から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元できる。加算部155は、復元されたレジデュアル信号を予測部220から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプル又は復元サンプルアレイ)が生成され得る。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
【0058】
一方、ピクチャエンコード及び/又は復元過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
【0059】
フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに様々なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ270、具体的に、メモリ270のDPBに格納することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset、SAO)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部260は、各フィルタリング方法についての説明で後述するように、フィルタリングに関する様々な情報を生成してエントロピーエンコード部240に伝達することができる。フィルタリングに関する情報は、エントロピーエンコード部240でエンコードされてビットストリーム形態で出力されることができる。
【0060】
メモリ270に送信された修正された復元ピクチャは、インター予測部221で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置100とデコード装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。
【0061】
メモリ270のDPBは、修正された復元ピクチャをインター予測部221における参照ピクチャとして使用するために格納することができる。メモリ270は、現在ピクチャ内の動き情報が導出された(又は、エンコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報又は時間的隣接ブロックの動き情報として活用するために、インター予測部221に伝達することができる。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部222に伝達することができる。
【0062】
図3は、本文書が適用されることができるビデオ/画像デコード装置の構成を概略的に説明する図面である。
【0063】
図3に示すように、デコード装置300は、エントロピーデコード部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350、及びメモリ(memoery)360を備えて構成されることができる。予測部330は、インター予測部331及びイントラ予測部332を備えることができる。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を備えることができる。前述したエントロピーデコード部310、レジデュアル処理部320、予測部330、加算部340、及びフィルタリング部350は、実施形態によって1つのハードウェアコンポーネント(例えば、デコーダチップセット又はプロセッサ)により構成されることができる。また、メモリ360は、DPB(decoded picture buffer)を備えることができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ360を内/外部コンポーネントとしてさらに備えることもできる。
【0064】
ビデオ/画像情報を含むビットストリームが入力されれば、デコード装置300は、
図3のエンコード装置でビデオ/画像情報が処理されたプロセスに対応して画像を復元できる。例えば、デコード装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出できる。デコード装置300は、エンコード装置で適用された処理ユニットを用いてデコードを行うことができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであることができ、コーディングユニットは、コーディングツリーユニット又は最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び/又はターナリツリー構造にしたがって分割されることができる。コーディングユニットから1つ以上の変換ユニットが導出され得る。そして、デコード装置300を介してデコード及び出力された復元画像信号は、再生装置を介して再生されることができる。
【0065】
デコード装置300は、
図3のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコード部310を介してデコードされることができる。例えば、エントロピーデコード部310は、前記ビットストリームをパーシングして画像復元(又は、ピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出できる。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、又はビデオパラメータセット(VPS)など、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。デコード装置は、前記パラメータセットに関する情報及び/又は前記一般制限情報に基づいてさらにピクチャをデコードすることができる。本文書において後述されるシグナリング/受信される情報及び/又はシンタックス要素は、前記デコード手順を介してデコードされて、前記ビットストリームから取得されることができる。例えば、エントロピーデコード部310は、指数ゴロム符号化、CAVLC、又はCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコードし、画像復元に必要なシンタックス要素の値、レジデュアルに関する変換係数の量子化された値を出力できる。より具体的に、CABACエントロピーデコード方法は、ビットストリームで各シンタックス要素に該当するビンを受信し、デコード対象のシンタックス要素情報と隣接及びデコード対象ブロックのデコード情報又は以前ステップでデコードされたシンボル/ビンの情報を利用して文脈(context)モデルを決定し、決定された文脈モデルによってビン(bin)の発生確率を予測してビンの算術デコード(arithmetic decoding)を行い、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピーデコード方法は、文脈モデル決定後、次のシンボル/ビンの文脈モデルのためにデコードされたシンボル/ビンの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコード部310でデコードされた情報のうち、予測に関する情報は、予測部330に提供され、エントロピーデコード部310でエントロピーデコードが行われたレジデュアル情報、すなわち、量子化された変換係数及び関連パラメータ情報は、逆量子化部321に入力されることができる。また、エントロピーデコード部310でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部350に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部(図示せず)がデコード装置300の内/外部エレメントとしてさらに構成されることができ、又は受信部は、エントロピーデコード部310の構成要素であることもできる。一方、本文書に係るデコード装置は、ビデオ/画像/ピクチャデコード装置と呼ばれることができ、前記デコード装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)に区分することもできる。前記情報デコーダは、前記エントロピーデコード部310を備えることができ、前記サンプルデコーダは、前記逆量子化部321、逆変換部322、予測部330、加算部340、フィルタリング部350、及びメモリ360のうち、少なくとも1つを備えることができる。
【0066】
逆量子化部321では、量子化された変換係数を逆量子化して変換係数を出力できる。逆量子化部321は、量子化された変換係数を2次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコード装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
【0067】
逆変換部322では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得するようになる。
【0068】
予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピーデコード部310から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、又はインター予測が適用されるか決定することができ、具体的なイントラ/インター予測モードを決定することができる。
【0069】
予測部は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のために、イントラ予測又はインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)を実行することができる。前記イントラブロックコピーは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ画像/動画コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、IBCは、本文書において説明されるインター予測技法のうち、少なくとも1つを利用することができる。パレットモードは、イントラコーディング又はイントラ予測の一例と見なすことができる。
【0070】
イントラ予測部331は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することができ、又は離れて位置することができる。イントラ予測において予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部331は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0071】
インター予測部332は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを備えることができる。例えば、インター予測部332は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出できる。様々な予測モードに基づいてインター予測が行われ得るし、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。
【0072】
加算部340は、取得されたレジデュアル信号を予測部から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。
【0073】
加算部340は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることができ、又は次のピクチャのインター予測のために使用されることもできる。
【0074】
一方、ピクチャデコード過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
【0075】
フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに様々なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ360、具体的に、メモリ360のDPBに送信することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。
【0076】
メモリ360のDPBに格納された(修正された)復元ピクチャは、インター予測部332で参照ピクチャとして使用されることができる。メモリ360は、現在ピクチャ内の動き情報が導出された(又は、デコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納できる。前記格納された動き情報は、空間的隣接ブロックの動き情報又は時間的隣接ブロックの動き情報として活用するために、インター予測部332に伝達することができる。メモリ360は、現在ピクチャ内の復元されたブロックの復元サンプルを格納でき、イントラ予測部331に伝達することができる。
【0077】
本明細書において、デコード装置300の予測部330、逆量子化部321、逆変換部322、及びフィルタリング部350などで説明された実施形態は、各々、エンコード装置200の予測部220、逆量子化部234、逆変換部235、及びフィルタリング部260などにも同一又は対応されるように適用されることができる。
【0078】
前述したように、ビデオコーディングを実行するにあたって、圧縮効率を上げるために予測を実行する。これを介してコーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン(又は、ピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコード装置及びデコード装置で同じく導出され、前記エンコード装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに対する情報(レジデュアル情報)をデコード装置にシグナリングすることで画像コーディング効率を上げることができる。デコード装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。
【0079】
前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコード装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を(ビットストリームを介して)デコード装置にシグナリングできる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、前記レジデュアル情報に基づいて逆量子化/逆変換の手順を実行してレジデュアルサンプル(又は、レジデュアルブロック)を導出することができる。デコード装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコード装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。
【0080】
本文書において、量子化/逆量子化及び/又は変換/逆変換のうち少なくとも1つは、省略されることができる。前記量子化/逆量子化が省略される場合、前記量子化された変換係数は、変換係数と呼ばれることができる。前記変換/逆変換が省略される場合、前記変換係数は、係数又はレジデュアル係数と呼ばれることもでき、又は、表現の統一性のために、依然として変換係数と呼ばれることもできる。
【0081】
本文書において、量子化された変換係数及び変換係数は、各々、変換係数及びスケーリングされた(scaled)変換係数と呼ばれることができる。この場合、レジデュアル情報は、変換係数(ら)に関する情報を含むことができ、前記変換係数(ら)に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。前記レジデュアル情報(又は、前記変換係数(ら)に関する情報)に基づいて変換係数が導出されることができ、前記変換係数に対する逆変換(スケーリング)を介してスケーリングされた変換係数が導出されることができる。前記スケーリングされた変換係数に対する逆変換(変換)に基づいてレジデュアルサンプルが導出されることができる。これは本文書の他の部分でも同様に適用/表現されることができる。
【0082】
エンコード装置/デコード装置の予測部は、ブロック単位でインター予測を行って予測サンプルを導出することができる。インター予測は、現在ピクチャ以外のピクチャのデータ要素(ex.サンプル値、又は動き情報)に依存的な方法で導出される予測を示すことができる。現在ブロックにインター予測が適用される場合、参照ピクチャのインデックスの指す参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロック(予測サンプルアレイ)を誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、現在ブロックの動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャのインデックスを含むことができる。前記動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)の情報を更に含むことができる。インター予測が適用される場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と、参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間的隣接ブロックを含む参照ピクチャとは同一であってもよく、異なってもよい。前記時間的隣接ブロックは、同じ位置参照ブロック(collocated reference block)、同じ位置CU(colCU)等の名称で呼ばれ得、前記時間的隣接ブロックを含む参照ピクチャは、同じ位置ピクチャ(collocated picture、colPic)と呼ばれることもある。例えば、現在ブロックの隣接ブロックに基づいて動き情報の候補リストが構成されることができ、前記現在ブロックの動きベクトル及び/又は参照ピクチャのインデックスを導出するために、どの候補が選択(使用)されるかを指示するフラグ又はインデックス情報がシグナリングされることができる。様々な予測モードに基づいてインター予測が行われ、例えば、スキップモードとマージモードの場合、現在ブロックの動き情報は、選択された隣接ブロックの動き情報を同一であり得る。スキップモードの場合、マージモードと異なり、レジデュアル信号が送信されないことがある。動き情報予測(motion vector prediction、MVP)モードの場合、選択された隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)はシグナリングされることができる。この場合、前記動きベクトル予測子及び動きベクトル差分の和を用いて、前記現在ブロックの動きベクトルを導出することができる。
【0083】
前記動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)に応じて、L0動き情報及び/又はL1動き情報を含むことができる。L0方向の動きベクトルは、L0動きベクトル又はMVL0と呼ばれ得、L1方向の動きベクトルは、L1動きベクトル又はMVL1と呼ばれ得る。L0動きベクトルに基づいた予測は、L0予測と呼ばれ得、L1動きベクトルに基づいた予測をL1予測と呼ばれ得、前記L0動きベクトル及び前記L1動きベクトルの両方に基づいた予測を双(Bi)予測と呼ばれ得る。ここで、L0動きベクトルは、参照ピクチャリストL0(L0)に関連する動きベクトルを示すことができ、L1動きベクトルは、参照ピクチャリストL1(L1)に関連する動きベクトルを示すことができる。参照ピクチャリストL0は、前記現在ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャに含むことができ、参照ピクチャリストL1は、前記現在ピクチャよりも、出力順序上、以後のピクチャを含むことができる。前記以前のピクチャは、順方向(参照)ピクチャと呼ばれ得、前記以後のピクチャは、逆方向(参照)ピクチャと呼ばれ得る。前記参照ピクチャリストL0は、前記現在ピクチャよりも、出力順序上、以後のピクチャを参照ピクチャにさらに含むことができる。この場合、前記参照ピクチャリストL0内で前記以前のピクチャが先にインデキシングされ、前記以後のピクチャは、その後にインデキシングされ得る。前記参照ピクチャリストL1は、前記現在ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャにさらに含むことができる。この場合、前記参照ピクチャリスト1内で前記以後のピクチャが先にインデキシングされ、前記以前のピクチャは、その後にインデキシングされ得る。ここで、出力順序は、POC(picture order count)順序(order)に対応し得る。
【0084】
図4は、コーディングされた画像/ビデオに対する階層構造を例示的に示す。
【0085】
図4に示すように、コーディングされた画像/ビデオは、画像/ビデオのデコード処理及びその自体を扱うVCL(video coding layer、ビデオコーディング階層)、符号化された情報を送信して格納する下位システム、及びVCLと下位システムとの間に存在してネットワーク適応機能を担当するNAL(network abstraction layer、ネットワーク抽象階層)に区分されている。
【0086】
VCLでは、圧縮された画像データ(スライスデータ)を含むVCLデータを生成し、又は、ピクチャパラメータセット(Picture Parameter Set:PPS)、シーケンスパラメータセット(Sequence Parameter Set:SPS)、ビデオパラメータセット(Video Parameter Set:VPS)などの情報を含むパラメータセット又は画像のデコード過程に付加的に必要なSEI(Supplemental Enhancement Information)メッセージを生成することができる。
【0087】
NALでは、VCLで生成されたRBSP(Raw Byte Sequence Payload)にヘッダ情報(NALユニットヘッダ)を付加してNALユニットを生成することができる。このとき、RBSPは、VCLで生成されたスライスデータ、パラメータセット、SEIメッセージなどを意味する。NALユニットヘッダには該当NALユニットに含まれるRBSPデータによって特定されるNALユニットタイプ情報を含むことができる。
【0088】
前記図面に示すように、NALユニットは、VCLで生成されたRBSPによって、VCL NALユニットとNon-VCL NALユニットとに区分されることができる。VCL NALユニットは、画像に対する情報(スライスデータ)を含んでいるNALユニットを意味することができ、Non-VCL NALユニットは、画像をデコードするために必要な情報(パラメータセット又はSEIメッセージ)を含んでいるNALユニットを意味することができる。
【0089】
前述したVCL NALユニット、Non-VCL NALユニットは、下位システムのデータ規格によってヘッダ情報を付けてネットワークを介して送信されることができる。例えば、NALユニットは、H.266/VVCファイルフォーマット、RTP(Real-time Transport Protocol)、TS(Transport Stream)などのような所定規格のデータ形態に変形されて多様なネットワークを介して送信されることができる。
【0090】
前述したように、NALユニットは、該当NALユニットに含まれるRBSPデータ構造(structure)によってNALユニットタイプが特定されることができ、このようなNALユニットタイプに対する情報は、NALユニットヘッダに格納されてシグナリングされることができる。
【0091】
例えば、NALユニットが画像に対する情報(スライスデータ)を含むかどうかによって、大別して、VCL NALユニットタイプとNon-VCL NALユニットタイプとに分類されることができる。VCL NALユニットタイプは、VCL NALユニットが含むピクチャの性質及び種類などによって分類されることができ、Non-VCL NALユニットタイプは、パラメータセットの種類などによって分類されることができる。
【0092】
下記は、Non-VCL NALユニットタイプが含むパラメータセットの種類などによって特定されたNALユニットタイプの一例においてある。
【0093】
-APS(Adaptation Parameter Set)NAL unit:APSを含むNALユニットに対するタイプ
【0094】
-DPS(Decoding Parameter Set)NAL unit:DPSを含むNALユニットに対するタイプ
【0095】
-VPS(Video Parameter Set)NAL unit:VPSを含むNALユニットに対するタイプ
【0096】
-SPS(Sequence Parameter Set)NAL unit:SPSを含むNALユニットに対するタイプ
【0097】
-PPS(Picture Parameter Set)NAL unit:PPSを含むNALユニットに対するタイプ
【0098】
-PH(Picture header)NAL unit:PHを含むNALユニットに対するタイプ
【0099】
前述したNALユニットタイプは、NALユニットタイプのためのシンタックス情報を有し、前記シンタックス情報は、NALユニットヘッダに格納されてシグナリングされることができる。例えば、前記シンタックス情報は、nal_unit_typeであり、NALユニットタイプは、nal_unit_type値に特定されることができる。
【0100】
一方、前述したように、1つのピクチャは、複数のスライスを含むことができ、1つのスライスは、スライスヘッダ及びスライスデータを含むことができる。この場合、1つのピクチャ内の複数のスライス(スライスヘッダ及びスライスデータ集合)に対して1つのピクチャヘッダがさらに付加されることができる。前記ピクチャヘッダ(ピクチャヘッダシンタックス)は、前記ピクチャに共通的に適用できる情報/パラメータを含むことができる。本文書において、スライスは、タイルグループに混用又は代替されることができる。また、本文書において、スライスヘッダは、タイプグループヘッダに混用又は代替されることができる。
【0101】
前記スライスヘッダ(スライスヘッダシンタックス、スライスヘッダ情報)は、前記スライスに共通的に適用できる情報/パラメータを含むことができる。前記APS(APSシンタックス)又はPPS(PPSシンタックス)は、1つ以上のスライス又はピクチャに共通的に適用できる情報/パラメータを含むことができる。前記SPS(SPSシンタックス)は、1つ以上のシーケンスに共通的に適用できる情報/パラメータを含むことができる。前記VPS(VPSシンタックス)は、多重レイヤに共通的に適用できる情報/パラメータを含むことができる。前記DPS(DPSシンタックス)は、ビデオ全般に共通的に適用できる情報/パラメータを含むことができる。前記DPSは、CVS(coded video sequence)の接合(concatenation)に関連する情報/パラメータを含むことができる。本文書において、上位レベルシンタックス(High level syntax、HLS)とは、前記APSシンタックス、PPSシンタックス、SPSシンタックス、VPSシンタックス、DPSシンタックス、ピクチャヘッダシンタックス、スライスヘッダシンタックスのうち少なくとも1つを含むことができる。
【0102】
本文書において、エンコード装置からデコード装置にエンコードされてビットストリーム形態でシグナリングされる画像/ビデオ情報は、ピクチャ内のパーティショニング関連情報、イントラ/インター予測情報、レジデュアル情報、インループフィルタリング情報などを含むだけでなく、前記スライスヘッダに含まれている情報、前記ピクチャヘッダに含まれている情報、前記APSに含まれている情報、前記PPSに含まれている情報、SPSに含まれている情報、VPSに含まれている情報、及び/又はDPSに含まれている情報を含むことができる。また、前記画像/ビデオ情報は、NALユニットヘッダの情報をさらに含むことができる。
【0103】
一方、量子化など、圧縮符号化過程で発生するエラーによる原本(original)画像と復元画像の差異を補償するために、前述したように、復元サンプル又は復元ピクチャにインループフィルタリング手順が実行されることができる。前述したように、インループフィルタリングは、エンコード装置のフィルタ部及びデコード装置のフィルタ部で実行されることができ、デブロッキングフィルタ、SAO及び/又は適応的ループフィルタ(ALF)が適用されることができる。例えば、ALF手順は、デブロッキングフィルタリング手順及び/又はSAO手順が完了した後に実行されることができる。ただし、この場合も、デブロッキングフィルタリング手順及び/又はSAO手順が省略されることもできる。
【0104】
以下、ピクチャ復元及びフィルタリングに対する具体的な説明が記述される。画像/ビデオコーディングにおいて、各ブロック単位でイントラ予測/インター予測に基づいて復元ブロックが生成されることができ、復元ブロックを含む復元ピクチャが生成されることができる。現在ピクチャ/スライスがIピクチャ/スライスである場合、前記現在ピクチャ/スライスに含まれるブロックは、イントラ予測のみに基づいて復元されることができる。一方、現在ピクチャ/スライスがP又はBピクチャ/スライスである場合、前記現在ピクチャ/スライスに含まれるブロックは、イントラ予測又はインター予測に基づいて復元されることができる。この場合、現在ピクチャ/スライス内の一部ブロックに対してはイントラ予測が適用され、残りのブロックに対してはインター予測が適用されることもできる。
【0105】
イントラ予測は、現在ブロックが属するピクチャ(以下、現在ピクチャという)内の参照サンプルに基づいて現在ブロックに対する予測サンプルを生成する予測を示すことができる。現在ブロックにイントラ予測が適用される場合、現在ブロックのイントラ予測に使用する隣接参照サンプルが導出されることができる。前記現在ブロックの隣接参照サンプルは、nW×nH大きさの現在ブロックの左側(left)境界に隣接したサンプル及び左下側(bottom-left)に隣接した総2×nH個のサンプル、現在ブロックの上側(top)境界に隣接したサンプル及び右上側(top-right)に隣接した総2×nW個のサンプル及び現在ブロックの左上側(top-left)に隣接した1個のサンプルを含むことができる。または、前記現在ブロックの隣接参照サンプルは、複数列の上側隣接サンプル及び複数行の左側隣接サンプルを含むこともできる。また、前記現在ブロックの隣接参照サンプルは、nW×nH大きさの現在ブロックの右側(right)境界に隣接した総nH個のサンプル、現在ブロックの下側(bottom)境界に隣接した総nW個のサンプル、及び現在ブロックの右下側(bottom-right)に隣接した1個のサンプルを含むこともできる。
【0106】
ただし、現在ブロックの隣接参照サンプルのうち一部は、まだデコードされない、又は利用可能でない場合がある。この場合、デコーダは、利用可能なサンプルとして利用可能でないサンプルを代替(substitution)して予測に使用する隣接参照サンプルを構成することができる。または、利用可能なサンプルの補間(interpolation)を介して予測に使用する隣接参照サンプルを構成することができる。
【0107】
隣接参照サンプルが導出された場合、(i)現在ブロックの隣接(neighboring)参照サンプルの平均(average)又は補間(interpolation)に基づいて予測サンプルを誘導することができ、(ii)現在ブロックの隣接参照サンプルのうち、予測サンプルに対して特定(予測)方向に存在する参照サンプルに基づいて前記予測サンプルを誘導することもできる。(i)の場合は、非方向性モード又は非角度モードと呼ばれ、(ii)の場合は、方向性(directional)モード又は角度(angular)モードと呼ばれることができる。また、前記隣接参照サンプルのうち前記現在ブロックの予測サンプルを基準にして、前記現在ブロックのイントラ予測モードの予測方向の反対方向に位置する前記第2の隣接サンプルと前記第1の隣接サンプルとの補間を介して前記予測サンプルが生成されることもできる。前述した場合は、線形補間イントラ予測(Linear interpolation intra prediction、LIP)と呼ばれることができる。また、線形モデル(linear model)を利用してルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、LMモードと呼ばれることができる。また、フィルタリングされた隣接参照サンプルに基づいて前記現在ブロックの臨時予測サンプルを導出し、前記既存の隣接参照サンプル、即ち、フィルタリングされない隣接参照サンプルのうち、前記イントラ予測モードにより導出された少なくとも1つの参照サンプルと前記臨時予測サンプルとを加重和(weighted sum)して前記現在ブロックの予測サンプルを導出することもできる。前述した場合は、PDPC(Position dependent intra prediction)と呼ばれることができる。また、現在ブロックの隣接多重参照サンプルラインの中から最も予測正確度が高い参照サンプルラインを選択して該当ラインで予測方向に位置する参照サンプルを利用して予測サンプルを導出し、この時に使用された参照サンプルラインをデコード装置に指示(シグナリング)する方法でイントラ予測符号化を実行することができる。前述した場合は、multi-reference line(MRL)intra prediction又はMRLベースのイントラ予測と呼ばれることができる。また、現在ブロックを垂直又は水平のサブパーティションに分けて同じイントラ予測モードに基づいてイントラ予測を実行し、前記サブパーティション単位で隣接参照サンプルを導出して利用できる。即ち、この場合、現在ブロックに対するイントラ予測モードが前記サブパーティションに同じく適用され、前記サブパーティション単位で隣接参照サンプルを導出して利用することによって、場合によって、イントラ予測性能を高めることができる。このような予測方法は、intra sub-partitions(ISP)又はISPベースのイントラ予測と呼ばれることができる。前述したイントラ予測方法は、目次1及び2でのイントラ予測モードと区分してイントラ予測タイプと呼ばれることができる。前記イントラ予測タイプは、イントラ予測技法又は付加イントラ予測モードなど、多様な用語で呼ばれることができる。例えば、前記イントラ予測タイプ(又は、付加イントラ予測モードなど)は、前述したLIP、PDPC、MRL、ISPのうち少なくとも1つを含むことができる。前記LIP、PDPC、MRL、ISPなどの特定イントラ予測タイプを除外した一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、前記のような特定イントラ予測タイプが適用されない場合、一般的に適用されることができ、前述したイントラ予測モードに基づいて予測が実行されることができる。一方、必要によって、導出された予測サンプルに対する後処理フィルタリングが実行されることもできる。
【0108】
具体的に、イントラ予測手順は、イントラ予測モード/タイプ決定ステップ、隣接参照サンプル導出ステップ、イントラ予測モード/タイプベースの予測サンプル導出ステップを含むことができる。また、必要によって、導出された予測サンプルに対する後処理フィルタリング(post-filtering)ステップが実行されることもできる。
【0109】
インループフィルタリング手順により修正された(modified)復元ピクチャが生成され、デコード装置から前記修正された復元ピクチャがデコードされたピクチャとして出力され、またエンコード装置/デコード装置の復号ピクチャバッファ又はメモリに格納されて、以後にピクチャのエンコード/デコード時のインター予測手順において参照ピクチャとして使用されることができる。前記インループフィルタリング手順は、前述のようにデブロッキングフィルタリング手順、SAO(sample adaptive offset)手順及び/又はALF(adaptive loop filter)手順などを含む。この場合、前記デブロッキングフィルタリング手順、SAO(sample adaptive offset)手順、ALF(adaptive loop filter)手順及びバイラテラルフィルタ(bi-lateral filter)手順のうちの1つ又は一部が順次適用されてもよく、または全てが順次適用されてもよい。例えば、復元ピクチャに対してデブロッキングフィルタリング手順が適用された後、SAO手順が行われてもよい。または、例えば、復元ピクチャに対してデブロッキングフィルタリング手順が適用された後、ALF手順が行われてもよい。これはエンコード装置においても同様に行われる。
【0110】
デブロッキングフィルタリングは、復元されたピクチャでブロック間の境界に発生する歪曲を除去するフィルタリング技法である。デブロッキングフィルタリング手順は、例えば、復元ピクチャでターゲット境界を導出し、前記ターゲット境界に対するbS(boundary strength)を決定し、前記bSに基づいて前記ターゲット境界に対するデブロッキングフィルタリングを実行することができる。前記bSは、前記ターゲット境界を隣接する2つのブロックの予測モード、動きベクトル差、参照ピクチャ同一可否、0でない有効係数の存在可否などに基づいて決定されることができる。
【0111】
SAOは、サンプル単位で復元ピクチャと原本ピクチャとのオフセット差を補償する方法であって、例えば、バンドオフセット(Band Offset)、エッジオフセット(Edge Offset)などのタイプに基づいて適用されることができる。SAOによると、各SAOタイプによってサンプルを互いに異なるカテゴリに分類し、カテゴリに基づいて各サンプルにオフセット値を足すことができる。SAOのためのフィルタリング情報は、SAO適用可否に関する情報、SAOタイプ情報、SAOオフセット値情報などを含むことができる。SAOは、前記デブロッキングフィルタリング適用後の復元ピクチャに対して適用されることもできる。
【0112】
ALF(Adaptive Loop Filter)は、復元ピクチャに対してフィルタ形状によるフィルタ係数に基づいてサンプル単位でフィルタリングする技法である。エンコード装置は、復元ピクチャと原本ピクチャの比較を介してALF適用可否、ALF形状及び/又はALFフィルタリング係数などを決定することができ、デコード装置にシグナリングすることができる。即ち、ALFのためのフィルタリング情報は、ALF適用可否に関する情報、ALFフィルタ形状(shape)情報、ALFフィルタリング係数情報などを含むことができる。ALFは、前記デブロッキングフィルタリング適用後の復元ピクチャに対して適用されることもできる。
【0113】
図5は、エンコード装置におけるフィルタリングに基づくエンコード方法を説明するための順序図である。
図5の方法は、ステップS500ないしS530を含むことができる。
【0114】
ステップS500において、エンコード装置は、復元ピクチャを生成することができる。ステップS500は、上述した復元ピクチャ(または、復元サンプル)生成手順に基づいて行われることができる。
【0115】
ステップS510において、エンコード装置は、インループフィルタリング関連情報に基づいて(仮想境界を横切って)インループフィルタリングが適用されるか否かを決定できる。ここで、インループフィルタリングは、上述したデブロッキングフィルタリング、SAO、またはALFのうち、少なくとも1つを含むことができる。
【0116】
ステップS520において、エンコード装置は、ステップS510の前記決定に基づいて修正された復元ピクチャ(修正された復元サンプル)を生成することができる。ここで、修正された復元ピクチャ(修正された復元サンプル)は、フィルタリングされた復元ピクチャ(フィルタリングされた復元サンプル)であることができる。
【0117】
ステップS530において、エンコード装置は、インループフィルタリング手順に基づいてインループフィルタリング関連情報を含む画像/ビデオ情報をエンコードすることができる。
【0118】
図6は、デコード装置におけるフィルタリングに基づくデコード方法を説明するための順序図である。
図6の方法は、ステップS600ないしS630を含むことができる。
【0119】
ステップS600において、デコード装置は、ビットストリームからインループフィルタリング関連情報を含む画像/ビデオ情報を取得できる。ここで、ビットストリームは、エンコード装置から送信されたエンコードされた画像/ビデオ情報に基づくことができる。
【0120】
ステップS610において、デコード装置は、復元ピクチャを生成することができる。ステップS610は、上述した復元ピクチャ(または、復元サンプル)生成手順に基づいて行われることができる。
【0121】
ステップS620において、デコード装置は、インループフィルタリング関連情報に基づいて(仮想境界を横切って)インループフィルタリングが適用されるか否かを決定できる。ここで、インループフィルタリングは、上述したデブロッキングフィルタリング、SAO、またはALFのうち、少なくとも1つを含むことができる。
【0122】
ステップS630において、デコード装置は、ステップS620の前記決定に基づいて修正された復元ピクチャ(修正された復元サンプル)を生成することができる。ここで、修正された復元ピクチャ(修正された復元サンプル)は、フィルタリングされた復元ピクチャ(フィルタリングされた復元サンプル)であることができる。
【0123】
前述のように復元ピクチャにインループフィルタリング手順が適用されることができる。この場合、復元ピクチャの主観的/客観的ビジュアル品質をさらに高めるために仮想境界を定義し、前記仮想境界を横切って(across)前記インループフィルタリング手順を適用することもできる。前記仮想境界は、例えば、360度画像、VR画像、またはPIP(picture in picture)などの不連続エッジを含む。例えば、前記仮想境界は予め定められた約束された位置に存在し、その存否及び/又は位置がシグナリングされることができる。一例として、前記仮想境界は、CTU行の上側4番目のサンプルライン(具体的に、例えば、前記CTU行の上側4番目のサンプルラインの上側)に位置する。他の例として、前記仮想境界は、その存否及び/又は位置に関する情報がHLSを介してシグナリングされることもできる。前記HLSは、前述のようにSPS、PPS、ピクチャヘッダ、スライスヘッダなどを含む。
【0124】
以下では、本文書の実施形態に関するハイレベルシンタックスシグナリング及びセマンティックスについて説明する。
【0125】
本文書の一実施形態は、ループフィルタを制御する方法を含む。ループフィルタを制御する本方法は、復元ピクチャに対して適用できる。インループフィルタ(ループフィルタ)はエンコードされたビットストリームのデコードのために使用できる。ループフィルタは前述のデブロッキング、SAO、ALFを含む。SPSはデブロッキング、SAO、ALFのそれぞれに関連するフラグを含む。前記フラグは、前記SPSを参照するCLVS(coded layer video sequence)、CVS(coded video sequence)のコーディングのために各ツールが可用であるか否かを示す。
【0126】
一例において、ループフィルタがCVS内のピクチャのコーディングのために可用である場合、前記ループフィルタの適用は特定の境界を横切らないように制御される。例えば、ループフィルタはサブピクチャ境界を横切らないように制御され、ループフィルタはタイル境界を横切らないように制御され、ループフィルタはスライス境界を横切らないように制御され、そして/またはループフィルタは仮想境界を横切らないように制御されることができる。
【0127】
インループフィルタリング関連情報は、本文書(又は、それに含まれた実施形態)において説明される情報、シンタックス、シンタックス要素、及び/又はセマンティックスを含む。インループフィルタリング関連情報は、インループフィルタリング手順(全体又は一部)が特定境界(例えば、仮想境界、サブピクチャ境界、スライス境界及び/又はタイル境界)を横切って可用であるか否かに関する情報を含む。ビットストリームに含まれた画像情報はハイレベルシンタックス(high level syntax、HLS)を含み、前記HLSは前記インループフィルタリング関連情報を含む。前記インループフィルタリング手順が特定の境界を横切って適用されるか否かに対する決定に基づいて、修正された(又は、フィルタリングされた)復元サンプル(復元ピクチャ)が生成される。一例において、インループフィルタリング手順が全ブロック/境界に対してディスエーブルされると、修正された復元サンプルは復元サンプルと同一であり得る。他の例において、修正された復元サンプルはインループフィルタリングに基づいて導出される修正された復元サンプルを含む。ただし、この場合、前記決定に基づいて復元サンプルの一部(例えば、仮想境界を横切る復元サンプル(reconstructed samples across virtual boundary))はインループフィルタリングされないことがある。例えば、特定境界(インループフィルタリング実行がイネーブルされた仮想境界、サブピクチャ境界、スライス境界及び/又はタイル境界の少なくとも1つを含む)を横切る復元サンプルはインループフィルタリングされることができるが、他の境界(インループフィルタリング実行がディスエーブルされた仮想境界、サブピクチャ境界及び/又はタイル境界の少なくとも1つを含む)を横切る復元サンプルはインループフィルタリングされないことがある。
【0128】
一例において、仮想境界を横切ってインループフィルタリング手順が行われるか否かに関連して、インループフィルタリング関連情報は、SPS仮想境界存在フラグ、ピクチャヘッダ仮想境界存在フラグ、仮想境界の個数に関する情報、仮想境界の位置に関する情報などを含む。
【0129】
本文書に含まれた実施形態において、仮想境界の位置に関する情報は、垂直仮想境界のx座標に関する情報及び/又は水平仮想境界のy座標に関する情報を含む。具体的に、仮想境界の位置に関する情報は、ルマサンプル単位の垂直仮想境界のx座標及び/又は水平仮想境界のy座標に関する情報を含む。また、仮想境界の位置に関する情報は、SPSに存在する垂直仮想境界のx座標に関する情報(シンタックス要素)の個数に関する情報を含む。また、仮想境界の位置に関する情報は、SPSに存在する水平仮想境界のy座標に関する情報(シンタックス要素)の個数に関する情報を含む。または、仮想境界の位置に関する情報は、ピクチャヘッダに存在する垂直仮想境界のx座標に関する情報(シンタックス要素)の個数に関する情報を含む。また、仮想境界の位置に関する情報は、ピクチャヘッダに存在する水平仮想境界のy座標に関する情報(シンタックス要素)の個数に関する情報を含む。
【0130】
次の表は、本実施形態によるSPS(sequence parameter set)の例示的なシンタックス及びセマンティックスを示す。
【0131】
【0132】
【0133】
次の表は、本実施形態によるPPS(picture parameter set)の例示的なシンタックス及びセマンティックスを示す。
【0134】
【0135】
【0136】
次の表は、本実施形態によるピクチャヘッダの例示的なシンタックス及びセマンティックスを示す。
【0137】
【0138】
【0139】
【0140】
【0141】
次の表は、本実施形態によるスライスヘッダの例示的なシンタックス及びセマンティックスを示す。
【0142】
【0143】
【0144】
以下では、サブピクチャに関連する情報とインループフィルタリングにおいて使用できる仮想境界に関する情報及びそれらのシグナリングについて説明する。
【0145】
もし、ピクチャが複数のサブピクチャを含むにもかかわらずピクチャ境界のように取り扱われる境界を有するサブピクチャが1つもないと、サブピクチャを利用する長所を生かすことができない。本文書の一実施形態においては、画像コーディングのための画像/ビデオ情報がサブピクチャをピクチャのように扱うための情報を含み、これはピクチャ取り扱いフラグ(例えば、subpic_treated_as_pic_flag[i])と呼ばれる。
【0146】
サブピクチャのレイアウトをシグナリングするために、サブピクチャが存在するか否かに関連するフラグ(例えば、subpic_present_flag)がシグナリングされる。これは、サブピクチャ存在フラグと呼ばれてもよい。subpic_present_flagの値が1である場合、ピクチャを分割するサブピクチャの個数に関する情報(例えば、sps_num_subpics_minus1)がシグナリングされる。一例において、ピクチャを分割するサブピクチャの個数はsps_num_subpics_minus1+1個(sps_num_subpics_minus1に1を加算する)と同一であり得る。sps_num_subpics_minus1の可能な値は0を含み、これはピクチャ内にただ1つのサブピクチャのみが存在することを意味する。ピクチャがただ1つのサブピクチャのみを含む場合、サブピクチャ自体がピクチャであるため、サブピクチャ関連情報のシグナリングは重複手順とみなされる。
【0147】
既存の実施形態において、ピクチャがただ1つのサブピクチャのみを含み、サブピクチャシグナリングが存在する場合には、ピクチャ取り扱いフラグ(例えば、subpic_treated_as_pic_flag[i])の値及び/又はサブピクチャを横切ってループフィーリングが行われるか否かに関連するフラグ(例えば、loop_filter_across_enabled_flag)の値は0又は1であり得る。ここで、subpic_treated_as_pic_flag[i]の値が0である場合は、サブピクチャ境界がピクチャ境界である場合と矛盾する問題が発生した。これは、デコーダにピクチャ境界がサブピクチャ境界であることを確認させる追加的な重複手順を必要とする。
【0148】
2つ以上のサブピクチャの併合手順に基づいてピクチャが生成される場合、前記併合手順に使用される全てのサブピクチャは独立的にコーディングされたサブピクチャ(ピクチャ取り扱いフラグ(subpic_treated_as_pic_flag[i])の値が1であるサブピクチャ)でなければならない。これは、独立的にコーディングされたサブピクチャではないサブピクチャ(本段落において「第1サブピクチャ」という。)を併合する場合、前記第1サブピクチャ内のブロックが前記第1サブピクチャ外部に存在する参照ブロックを参照してコーディングされることにより併合後の問題を発生させることがあるためである。
【0149】
また、ピクチャがサブピクチャにパーティショニングされた場合、サブピクチャIDシグナリングは存在するか存在しない。サブピクチャIDシグナリングが存在する場合、サブピクチャIDシグナリングはSPS、PPS及び/又はピクチャヘッダ(picture header、PH)に存在する(含まれる)。サブピクチャIDシグナリングがSPSに存在しない場合は、サブピクチャ併合手順の結果としてビットストリームが生成される場合を含む。従って、サブピクチャIDシグナリングがSPSに含まれない場合において、全てのサブピクチャは独立的にコーディングされることが好ましい。
【0150】
仮想境界が利用される画像コーディング手順において、仮想境界の位置に関する情報はSPS又はピクチャヘッダにおいてシグナリングされることができる。SPSにおいて仮想境界の位置に関する情報をシグナリングするということは、CLVS内において前記位置に変化がないことを意味する。ただし、参照ピクチャリサンプリング(reference picture resampling、RPR)が前記CLVSに対してイネーブルされると、前記CLVS内のピクチャは相異なるサイズを有する。ここで、参照ピクチャリサンプリング(又は、適応的解像度変化(adaptive resolution change、ARC)とも呼ばれる)は、相異なる解像度(空間的解像度)を有するピクチャの正常なコーディング動作のために行われる。例えば、参照ピクチャリサンプリングはアップサンプリング及びダウンサンプリングを含む。参照ピクチャリサンプリングにより、ビットレートと空間的解像度の適応のための高いコーディング効率が達成される。参照ピクチャリサンプリングを考慮して、前記仮想境界の位置は全部1つのピクチャ内にあるように保障される必要がある。
【0151】
既存のALF手順において、k=3であるk次数指数ゴロムコードは、ルマ及びクロマALF係数の絶対値をシグナリングするのに使用される。ただし、k次数指数ゴロムコーディングは相当な演算的オーバーヘッドと複雑度を誘発して問題となる。
【0152】
以下の段落において記述される実施形態は、前述の問題を解決するための解決策を提案する。実施形態は独立的に適用してもよい。または、少なくとも2つ以上の実施形態が組み合わさって適用してもよい。
【0153】
本文書の一実施形態において、サブピクチャシグナリングが存在し、そしてピクチャがただ1つのサブピクチャのみを有する場合に、前記ただ1つのサブピクチャは独立的にコーディングされたサブピクチャである。例えば、ピクチャがただ1つのサブピクチャのみを有する場合、前記ただ1つのサブピクチャは独立的にコーディングされたサブピクチャであり、そして前記ただ1つのサブピクチャに対するピクチャ取り扱いフラグ(例えば、subpic_treated_as_pic_flag[i])の値は1である。これにより、サブピクチャに関連する重複手順が省略されることができる。
【0154】
本文書の一実施形態において、サブピクチャシグナリングが存在する場合、サブピクチャの個数は1個より多くてもよい。一例において、サブピクチャシグナリングが存在すると(例えば、subpics_present_flagの値は1)サブピクチャの個数に関する情報(例えば、sps_num_subpics_minus1)は0より大きく、サブピクチャの個数はsps_num_subpics_minus1+1個(sps_num_subpics_minus1に1を加算する)であり得る。他の例において、サブピクチャの個数に関する情報はsps_num_subpics_minus2であり、そしてサブピクチャの個数はsps_num_subpics_minus2+2個(sps_num_subpics_minus2に2を加算する)であり得る。また他の例において、サブピクチャ存在フラグsubpics_present_flagはサブピクチャの個数に関する情報sps_num_subpics_minus1に置き替えられることができ、従って、サブピクチャのシグナリングはsps_num_subpics_minus1が0より大きい場合に存在し得る。
【0155】
本文書の一実施形態において、ピクチャがサブピクチャに分割される場合、前記サブピクチャのうち少なくとも1つのサブピクチャは独立的にコーディングされたサブピクチャであり得る。ここで、独立的にコーディングされたサブピクチャに関するピクチャ取り扱いフラグ(例えば、subpic_treated_as_pic_flag[i])の値は1である。
【0156】
本文書の一実施形態において、2つ以上のサブピクチャの併合手順に基づくピクチャのサブピクチャは独立的にコーディングされたサブピクチャであり得る。
【0157】
本文書の一実施形態において、サブピクチャID(identification)シグナリングがSPSではない他の位置(他のシンタックス、他のハイレベルシンタックス情報)に存在する場合、全てのサブピクチャは独立的にコーディングされたサブピクチャであり、全てのサブピクチャのためのピクチャ取扱フラグ(例えば、subpic_treated_as_pic_flag)の値は1であり得る。一例において、サブピクチャIDシグナリングはPPSに存在し、この場合、全てのサブピクチャは独立的にコーディングされたサブピクチャであり得る。他の例において、サブピクチャIDシグナリングはピクチャヘッダに存在し、この場合、全てのサブピクチャは独立的にコーディングされたサブピクチャであり得る。
【0158】
本文書の一実施形態において、CLVSのために仮想境界シグナリングがSPSに存在し、そして参照ピクチャリサンプリングが可能である場合、全ての水平仮想境界位置はSPSを参照するピクチャの最小ピクチャ高さ以内であり、そして全ての垂直仮想境界位置はSPSを参照するピクチャの最小ピクチャ幅以内であり得る。
【0159】
本文書の一実施形態において、参照ピクチャリサンプリング(RPR)がイネーブルされる場合、仮想境界シグナリングはピクチャヘッダに含まれる。すなわち、参照ピクチャリサンプリングがイネーブルされる場合、仮想境界シグナリングはSPSに含まれないことがある。
【0160】
本文書の一実施形態において、ALFデータをシグナリングするためにビットの個数(又は、ビット長)を相伴う固定長コーディング(fixed length coding、FLC)が用いられる。一例において、ALFデータに関する情報はALFルマ係数絶対値のビット長(bit length)に関する情報(例えば、alf_luma_coeff_abs_len_minus1)及び/又はALFクロマ係数絶対値のビット長に関する情報(例えば、alf_chroma_coeff_abs_len_minus1)を含む。例えば、ALFルマ係数絶対値のビット長に関する情報及び/又はALFクロマ係数絶対値のビット長に関する情報は、ue(v)コーディング(ue(v)coded)されることができる。
【0161】
次の表は、本実施形態によるSPSの例示的なシンタックスを示す。
【0162】
【0163】
次の表は、前記シンタックスに含まれたシンタックス要素に関する例示的なセマンティックスを示す。
【0164】
【0165】
次の表は、本実施形態によるSPSの例示的なシンタックスを示す。
【0166】
【0167】
次の表は、前記シンタックスに含まれたシンタックス要素に関する例示的なセマンティックスを示す。
【0168】
【0169】
次の表は、本実施形態によるALFデータの例示的なシンタックスを示す。
【0170】
【0171】
次の表は、前記シンタックスに含まれたシンタックス要素に関する例示的なセマンティックスを示す。
【0172】
【0173】
前記表とともに説明された本文書の実施形態によると、サブピクチャ及び/又は仮想境界に基づく画像コーディングにより、画像の主観的/客観的品質が向上し、コーディングに必要なハードウェアリソースの消耗が減少する。
【0174】
図7及び
図8は、本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。
【0175】
図7において開示された方法は、
図2または
図8において開示されたエンコード装置によって行われることができる。具体的に、例えば、
図7のS700及びS730は、
図8の前記エンコード装置の予測部220によって行われることができ、
図7のS710及びS720は、
図8の前記エンコード装置のレジデュアル処理部230によって行われることができ、
図7のS740は、
図8の前記エンコード装置のフィルタリング部260によって行われることができ、
図7のS750は、
図8の前記エンコード装置のエントロピーエンコード部240によって行われることができる。また、
図7において図示しなかったが、
図7において前記エンコード装置の予測部220によって予測サンプルまたは予測関連情報を導出することができ、前記エンコード装置のエントロピーエンコード部240によってレジデュアル情報または予測関連情報からビットストリームが生成され得る。
図7において開示された方法は、本文書において上述した実施形態等を含むことができる。
【0176】
図7に示すように、エンコード装置は、少なくとも1つの参照ピクチャを導出することができる(S700)。エンコード装置は、前記少なくとも1つの参照ピクチャに基づいて予測手順を行うことができる。具体的に、エンコード装置は、予測モードに基づいて前記現在ブロックの予測サンプルを生成することができる。この場合、インター予測またはイントラ予測など、本文書において開示された様々な予測方法が適用され得る。エンコード装置は、前記予測手順に基づいて現在ピクチャ内の現在ブロックに対する予測サンプルを生成することができる。例えば、エンコード装置は、前記少なくとも1つの参照ピクチャに基づいてインター予測手順を行い、そして前記インター予測手順に基づいて予測サンプルを生成することができる。
【0177】
エンコード装置は、レジデュアルサンプルを生成/導出することができる(S710)。エンコード装置は、現在ブロックに対するレジデュアルサンプルを導出することができ、前記現在ブロックに対するレジデュアルサンプルは、現在ブロックの原本サンプル及び前記予測サンプルに基づいて導出されることができる。一例において、エンコード装置は、ステップS700の前記少なくとも1つの参照ピクチャに基づいてレジデュアルサンプルを生成することができる。例えば、エンコード装置は、前記少なくとも1つの参照ピクチャに基づいて現在ブロックに対する予測サンプルを生成し、そして前記予測サンプルに基づいてレジデュアルサンプルを生成することができる。
【0178】
エンコード装置は、変換係数を導出することができる。エンコード装置は、前記レジデュアルサンプルに対する変換手順に基づいて変換係数を導出することができる。例えば、変換手順は、DCT、DST、GBT、またはCNTのうち、少なくとも1つを含むことができる。
【0179】
エンコード装置は、量子化された変換係数を導出することができる。エンコード装置は、前記変換係数に対する量子化手順に基づいて量子化された変換係数を導出することができる。量子化された変換係数は、係数スキャン順序に基づいて1次元ベクトル形態を有することができる。
【0180】
エンコード装置は、レジデュアル情報を生成することができる(S720)。エンコード装置は、前記現在ブロックに対する前記レジデュアルサンプルに基づいてレジデュアル情報を生成することができる。エンコード装置は、前記量子化された変換係数を表すレジデュアル情報を生成することができる。レジデュアル情報は、指数ゴロム、CAVLC、CABACなどのような様々なエンコード方法を介して生成されることができる。
【0181】
エンコード装置は、復元サンプルを生成することができる。エンコード装置は、前記レジデュアル情報に基づいて復元サンプルを生成することができる。復元サンプルは、レジデュアル情報に基づいたレジデュアルサンプルを予測サンプルに加算して生成されることができる。具体的に、エンコード装置は、現在ブロックに対する予測(イントラまたはインター予測)を行い、原本サンプルと予測から生成された予測サンプルとに基づいて復元サンプルを生成することができる。
【0182】
復元サンプルは、復元ルマサンプル及び復元クロマサンプルを含むことができる。具体的に、レジデュアルサンプルは、レジデュアルルマサンプル及びレジデュアルクロマサンプルを含むことができる。レジデュアルルマサンプルは、原本ルマサンプル及び予測ルマサンプルに基づいて生成されることができる。レジデュアルクロマサンプルは、原本クロマサンプル及び予測クロマサンプルに基づいて生成されることができる。エンコード装置は、前記レジデュアルルマサンプルに対する変換係数(ルマ変換係数)及び/又は前記レジデュアルクロマサンプルに対する変換係数(クロマ変換係数)を導出することができる。量子化された変換係数は、量子化されたルマ変換係数及び/又は量子化されたクロマ変換係数を含むことができる。
【0183】
エンコード装置は、参照ピクチャ関連情報を生成することができる(S730)。エンコード装置は、前記少なくとも1つの参照ピクチャに基づいて参照ピクチャ関連情報を生成することができる。参照ピクチャ関連情報は、デコード装置によるインター予測のために使用されることができる。
【0184】
エンコード装置は、現在ピクチャの復元サンプルのためのインループフィルタリング関連情報を生成することができる(S740)。エンコード装置は、復元サンプルに対するインループフィルタリング手順を行うことができ、前記インループフィルタリング手順に基づいてインループフィルタリング関連情報を生成することができる。例えば、インループフィルタリング関連情報は、本文書において上述した仮想境界に関する情報(SPS仮想境界可用フラグ、ピクチャヘッダ仮想境界可用フラグ、SPS仮想境界存在フラグ、ピクチャヘッダ仮想境界存在フラグ、仮想境界の位置に関する情報など)を含むことができる。
【0185】
エンコード装置は、ビデオ/画像情報をエンコードすることができる(S750)。前記画像情報は、レジデュアル情報、予測関連情報、参照ピクチャ関連情報、仮想境界関連情報(及び/又は追加的な仮想境界関連情報)、及び/又はインループフィルタリング関連情報を含むことができる。エンコードされたビデオ/画像情報は、ビットストリーム形態で出力されることができる。前記ビットストリームは、ネットワークまたは格納媒体を介してデコード装置に送信されることができる。
【0186】
前記画像/ビデオ情報は、本文書の実施形態に係る様々な情報を含むことができる。例えば、前記画像/ビデオ情報は、上述した表1ないし14のうち、少なくとも1つに開示された情報を含むことができる。
【0187】
一実施形態において、前記画像情報は、SPS(sequence parameter set)を含むことができる。例えば、前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であるか否かに基づいて前記SPSが追加的な仮想境界関連情報を含むか否かが決定され得る。ここで、少なくとも1つの参照ピクチャのためのリサンプリングは、上述したRPR(reference picture resampling)によって行われることができる。追加的な仮想境界関連情報は、単純に仮想境界関連情報と称されることもできる。「追加的な」は、SPS仮想境界存在フラグ及び/又はPH仮想境界存在フラグのような仮想境界関連情報との区分のために使用された。
【0188】
一実施形態において、前記追加的な仮想境界関連情報は、仮想境界の個数及び仮想境界の位置を含むことができる。
【0189】
一実施形態において、前記追加的な仮想境界関連情報は、垂直仮想境界の個数に関する情報、垂直仮想境界の位置に関する情報、水平仮想境界の個数に関する情報、及び水平仮想境界の位置に関する情報を含むことができる。
【0190】
一実施形態において、前記画像情報は、参照ピクチャリサンプリング可用フラグを含むことができる。例えば、前記参照ピクチャリサンプリング可用フラグに基づいて前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であるか否かが決定され得る。
【0191】
一実施形態において、前記SPSは、前記SPSが前記追加的な仮想境界関連情報を含むか否かと関連したSPS仮想境界存在フラグを含むことができる。前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であることに基づいて、前記SPS仮想境界存在フラグの値は、0に決定されることができる。
【0192】
一実施形態において、前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であることに基づいて前記追加的な仮想境界関連情報は、前記SPSに含まれないことができる。前記画像情報は、ピクチャヘッダ情報を含み、そして前記ピクチャヘッダ情報は、前記追加的な仮想境界関連情報を含むことができる。
【0193】
一実施形態において、前記現在ピクチャは、ただ1つのサブピクチャとしてサブピクチャを含むことができる。前記サブピクチャは、独立的にコーディングされることができる(independently coded)。前記復元サンプルは、前記サブピクチャに基づいて生成され、前記サブピクチャに基づいてサブピクチャ関連情報が生成され、そして前記画像情報は、前記サブピクチャ関連情報を含むことができる。
【0194】
一実施形態において、前記画像情報に前記サブピクチャのためのピクチャ取扱フラグ(subpicture treated as picture flag)は、存在しないことができる。したがって、前記サブピクチャのためのピクチャ取扱フラグの値は、デコード装置で推論(推測または予測)を介して設定されることができる。一例において、前記サブピクチャのためのピクチャ取扱フラグの値は、1に設定(set)されることができる。
【0195】
一実施形態において、前記現在ピクチャは、サブピクチャを含むことができる。一例において、前記サブピクチャは、2つ以上の独立的に-コーディングされた-サブピクチャ(independently-coded-subpictures)の併合手順に基づいて導出されることができる。前記復元サンプルは、前記サブピクチャに基づいて生成され、前記サブピクチャに基づいてサブピクチャ関連情報が生成され、そして前記画像情報は、前記サブピクチャ関連情報を含むことができる。
【0196】
図9及び
図10は、本文書の実施形態(等)に係るビデオ/画像デコード方法及び関連コンポーネントの一例を概略的に示す。
【0197】
図9において開示された方法は、
図3または
図10において開示されたデコード装置によって行われることができる。具体的に、例えば、
図9のS900は、前記デコード装置のエントロピーデコード部310によって行われることができ、
図9のS910は、前記デコード装置の予測部310によって行われることができ、S920は、前記デコード装置のレジデュアル処理部320及び/又は加算部340によって行われることができ、そしてS930は、前記デコード装置のフィルタリング部350によって行われることができる。
図9において開示された方法は、本文書において上述した実施形態等を含むことができる。
【0198】
図9に示すように、デコード装置は、ビデオ/画像情報を受信/取得することができる(S900)。ビデオ/画像情報は、レジデュアル情報、予測関連情報、参照ピクチャ関連情報、仮想境界関連情報(及び/又は追加的な仮想境界関連情報)、及び/又はインループフィルタリング関連情報を含むことができる。デコード装置は、ビットストリームを介して前記画像/ビデオ情報を受信/取得することができる。
【0199】
前記画像/ビデオ情報は、本文書の実施形態に係る様々な情報を含むことができる。例えば、前記画像/ビデオ情報は、上述した表1ないし14のうち、少なくとも1つに開示された情報を含むことができる。
【0200】
デコード装置は、量子化された変換係数を導出することができる。デコード装置は、前記レジデュアル情報に基づいて量子化された変換係数を導出することができる。量子化された変換係数は、係数スキャン順序に基づいて1次元ベクトル形態を有することができる。量子化された変換係数は、量子化されたルマ変換係数及び/又は量子化されたクロマ変換係数を含むことができる。
【0201】
デコード装置は、変換係数を導出することができる。デコード装置は、前記量子化された変換係数に対する逆量子化手順に基づいて変換係数を導出することができる。デコード装置は、量子化されたルマ変換係数に基づいて逆量子化を介してルマ変換係数を導出することができる。デコード装置は、量子化されたクロマ変換係数に基づいて逆量子化を介してクロマ変換係数を導出することができる。
【0202】
デコード装置は、レジデュアルサンプルを生成/導出することができる。デコード装置は、前記変換係数に対する逆変換手順に基づいてレジデュアルサンプルを導出することができる。デコード装置は、ルマ変換係数に基づいて逆変換手順を介してレジデュアルルマサンプルを導出することができる。デコード装置は、クロマ変換係数に基づいて逆変換手順を介してレジデュアルクロマサンプルを導出することができる。
【0203】
デコード装置は、参照ピクチャ関連情報に基づいて少なくとも1つの参照ピクチャを導出することができる(S910)。デコード装置は、前記少なくとも1つの参照ピクチャに基づいて予測手順を行うことができる。具体的に、デコード装置は、予測モードに基づいて前記現在ブロックの予測サンプルを生成することができる。この場合、インター予測またはイントラ予測など、本文書において開示された様々な予測方法が適用され得る。デコード装置は、前記予測手順に基づいて現在ピクチャ内の現在ブロックに対する予測サンプルを生成することができる。例えば、デコード装置は、前記少なくとも1つの参照ピクチャに基づいてインター予測手順を行い、そして前記インター予測手順に基づいて予測サンプルを生成することができる。
【0204】
デコード装置は、復元サンプルを生成/導出することができる(S920)。デコード装置は、予測サンプルとレジデュアルサンプルとに基づいて復元サンプルを生成することができる。デコード装置は、予測サンプルと原本サンプルとの間の合算に基づいて復元サンプルを生成することができる。例えば、デコード装置は、復元ルマサンプル及び/又は復元クロマサンプルを生成/導出することができる。デコード装置は、前記レジデュアル情報に基づいて復元ルマサンプル及び/又は復元クロマサンプルを生成することができる。デコード装置は、前記レジデュアル情報に基づいて復元サンプルを生成することができる。復元サンプルは、復元ルマサンプル及び/又は復元クロマサンプルを含むことができる。復元サンプルのルマ成分が復元ルマサンプルに対応し、復元サンプルのクロマ成分が復元クロマサンプルに対応することができる。デコード装置は、予測手順を介して予測ルマサンプル及び/又は予測クロマサンプルを生成することができる。デコード装置は、予測ルマサンプルとレジデュアルルマサンプルとに基づいて復元ルマサンプルを生成することができる。デコード装置は、予測クロマサンプルとレジデュアルクロマサンプルとに基づいて復元クロマサンプルを生成することができる。
【0205】
デコード装置は、修正された(フィルタリングされた)復元サンプルを生成することができる(S930)。デコード装置は、前記復元サンプルに対するインループフィルタリング手順に基づいて修正された復元サンプルを生成することができる。デコード装置は、インループフィルタリング関連情報に基づいて修正された復元サンプルを生成することができる。デコード装置は、修正された復元サンプルを生成するために、デブロッキング手順、SAO手順、及び/又はALF手順を利用できる。
【0206】
一実施形態において、前記画像情報は、SPSを含むことができる。例えば、前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であるか否かに基づいて前記SPSが追加的な仮想境界関連情報を含むか否かが決定され得る。ここで、少なくとも1つの参照ピクチャのためのリサンプリングは、上述したRPRによって行われることができる。追加的な仮想境界関連情報は、単純に仮想境界関連情報と称されることもできる。「追加的な」は、SPS仮想境界存在フラグ及び/又はPH仮想境界存在フラグのような仮想境界関連情報との区分のために使用された。
【0207】
一実施形態において、前記追加的な仮想境界関連情報は、仮想境界の個数及び仮想境界の位置を含むことができる。
【0208】
一実施形態において、前記追加的な仮想境界関連情報は、垂直仮想境界の個数に関する情報、垂直仮想境界の位置に関する情報、水平仮想境界の個数に関する情報、及び水平仮想境界の位置に関する情報を含むことができる。
【0209】
一実施形態において、前記画像情報は、参照ピクチャリサンプリング可用フラグを含むことができる。例えば、前記参照ピクチャリサンプリング可用フラグに基づいて前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であるか否かが決定され得る。
【0210】
一実施形態において、前記SPSは、前記SPSが前記追加的な仮想境界関連情報を含むか否かと関連したSPS仮想境界存在フラグを含むことができる。前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であることに基づいて、前記SPS仮想境界存在フラグの値は、0に決定されることができる。
【0211】
一実施形態において、前記少なくとも1つの参照ピクチャのためのリサンプリングが可用であることに基づいて前記追加的な仮想境界関連情報は、前記SPSに含まれないことができる。前記画像情報は、ピクチャヘッダ情報を含み、そして前記ピクチャヘッダ情報は、前記追加的な仮想境界関連情報を含むことができる。
【0212】
一実施形態において、前記現在ピクチャは、ただ1つのサブピクチャとしてサブピクチャを含むことができる。前記サブピクチャは、独立的にコーディングされることができる。前記復元サンプルは、前記サブピクチャに基づいて生成され、前記サブピクチャに基づいてサブピクチャ関連情報が生成され、そして前記画像情報は、前記サブピクチャ関連情報を含むことができる。
【0213】
一実施形態において、前記画像情報に前記サブピクチャのためのピクチャ取扱フラグ(subpicture treated as picture flag)は存在しないことができる。したがって、前記サブピクチャのためのピクチャ取扱フラグの値は、デコード装置によって推論(推測または予測)を介して設定されることができる。一例において、前記サブピクチャのためのピクチャ取扱フラグの値は、1に設定(set)されることができる。
【0214】
一実施形態において、前記現在ピクチャはサブピクチャを含む。一例において、前記サブピクチャは2つ以上の独立的に-コーディングされた-サブピクチャの併合手順に基づいて導出される。前記復元サンプルは前記サブピクチャに基づいて生成され、前記サブピクチャに基づいてサブピクチャ関連情報が生成され、そして前記画像情報は前記サブピクチャ関連情報を含む。
【0215】
デコード装置は、現在ブロックに対するレジデュアルサンプルが存在する場合、現在ブロックに対するレジデュアルに関する情報を受信することができる。レジデュアルに関する情報は、レジデュアルサンプルに関する変換係数を含むことができる。デコード装置は、レジデュアル情報に基づいて現在ブロックに対するレジデュアルサンプル(又は、レジデュアルサンプルアレイ)を導出することができる。具体的に、デコード装置は、レジデュアル情報に基づいて量子化された変換係数を導出することができる。量子化された変換係数は、係数スキャン順序に基づいて1次元ベクトル形態を有することができる。デコード装置は、前記量子化された変換係数に対する逆量子化手順に基づいて変換係数を導出することができる。デコード装置は、変換係数に基づいてレジデュアルサンプルを導出することができる。
【0216】
デコード装置は、(イントラ)予測サンプルとレジデュアルサンプルとに基づいて復元サンプルを生成することができ、前記復元サンプルに基づいて復元ブロック又は復元ピクチャを導出することができる。具体的に、デコード装置は、(イントラ)予測サンプルとレジデュアルサンプルとの和に基づいて復元サンプルを生成することができる。以後、デコード装置は、必要によって、主観的/客観的画質を向上させるために、デブロッキングフィルタリング及び/又はSAO手順のようなインループフィルタリング手順を前記復元ピクチャに適用できることは、前述の通りである。
【0217】
例えば、デコード装置は、ビットストリーム又はエンコードされた情報をデコードし、前述した情報(又はシンタックス要素)の全部又は一部を含む画像情報を獲得することができる。また、前記ビットストリーム又はエンコードされた情報は、コンピュータ読み取り可能な格納媒体に格納されることができ、前述したデコード方法が行われるように引き起こすことができる。
【0218】
前述した実施形態において、方法は、一連のステップ又はブロックとしてフローチャートに基づいて説明されているが、該当実施形態は、ステップの順序に限定されるわけではなく、あるステップは、前述したところと異なるステップと異なる順序で、又は同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、異なるステップが含まれるか、フローチャートの1つ又はそれ以上のステップが本文書の実施形態の範囲に影響を与えずに削除され得ることを理解することができる。
【0219】
前述した本文書の実施形態に係る方法は、ソフトウェアの形態で実現されることができ、本文書に係るエンコード装置及び/又はデコード装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置等の画像処理を行う装置に含まれ得る。
【0220】
本文書で、実施形態がソフトウェアで実現される際、前述した方法は、前述した機能を行うモジュール(過程、機能等)で実現されることができる。モジュールはメモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部又は外部にあってもよく、よく知られている様々な手段でプロセッサと連結されてもよい。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/又はデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/又は他の格納装置を含むことができる。即ち、本文書で説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で実現されて行われ得る。例えば、各図面で示している機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で実現されて行われ得る。この場合、実現のための情報(ex.information on instructions)又はアルゴリズムがデジタル格納媒体に格納されることができる。
【0221】
また、本文書の実施形態が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、オーダーメイド型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、VR(virtual reality)装置、AR(argumente reality)装置、画像電話ビデオ装置、運送手段端末(ex.車両(自律走行車両含む)端末、飛行機端末、船舶端末など)及び医療用ビデオ装置等に含まれ得、ビデオ信号又はデータ信号を処理するために使用され得る。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネットアクセスTV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)等を含み得る。
【0222】
また、本文書の実施形態が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取ることができる記録媒体に格納されることができる。本文書の実施形態に係るデータ構造を有するマルチメディアデータもまた、コンピュータが読み取ることができる記録媒体に格納されることができる。前記コンピュータが読み取ることができる記録媒体は、コンピュータで読み取られるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取ることができる記録媒体は、例えば、ブルーレイディスク(BD)、汎用直列バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピディスク、及び光学的データ格納装置を含み得る。また、前記コンピュータが読み取ることができる記録媒体は、搬送波(例えば、インターネットを介した送信)の形態で実現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取られる記録媒体に格納されるか、有無線通信ネットワークを介して送信されることができる。
【0223】
また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で実現されることができ、前記プログラムコードは、本文書の実施形態によってコンピュータで実行されることができる。前記プログラムコードは、コンピュータによって読み取り可能なキャリア上に格納されることができる。
【0224】
図11は、本文書に開示された実施形態が適用されることができるコンテンツストリーミングシステムの例を示す。
【0225】
図11を参照すると、本文書の実施形態が適用されるコンテンツストリーミングシステムは、大きくエンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディアストレージ、ユーザ装置、及びマルチメディア入力装置を含むことができる。
【0226】
前記エンコードサーバは、スマートフォン、カメラ、カムコーダ等のようなマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。別の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略され得る。
【0227】
前記ビットストリームは、本文書の実施形態が適用されるエンコード方法又はビットストリームの生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信又は受信する過程で、一時的に前記ビットストリームを格納することができる。
【0228】
前記ストリーミングサーバは、ウェブサーバを介してのユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すれば、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割をする。
【0229】
前記ストリーミングサーバは、メディア格納所及び/又はエンコードサーバからコンテンツを受信することができる。例えば、前記エンコードサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムに受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間、格納することができる。
【0230】
前記ユーザ装置の例では、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末機、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末機(smartwatch)、グラス型端末機(smart glass)、HMD(head mounted display))、デジタルTV、デスクトップコンピュータ、デジタルサイニジなどがありうる。
【0231】
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。
【0232】
本明細書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本明細書の方法請求項の技術的特徴が組み合わせられて装置として実現されることができ、本明細書の装置請求項の技術的特徴が組み合わせられて方法として実現されることができる。また、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて装置として実現されることができ、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて方法として実現されることができる。
【手続補正書】
【提出日】2023-08-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
デコード装置によって行われる画像デコード方法において、
ビットストリームを介してレジデュアル情報及び参照ピクチャ関連情報を含む画像情報を取得するステップと、
前記参照ピクチャ関連情報に基づいて少なくとも1つの参照ピクチャを導出するステップと、
前記レジデュアル情報及び前記少なくとも1つの参照ピクチャに基づいて現在ピクチャの復元サンプルを生成するステップと、
前記復元サンプルに対するインループフィルタリング手順に基づいて修正された復元サンプルを生成するステップと、を含み、
前記参照ピクチャ関連情報は、前記少なくとも1つの参照ピクチャに対するインデックス情報であり、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、画像デコード方法。
【請求項2】
エンコード装置によって行われる画像エンコード方法において、
現在ブロックに対するレジデュアルサンプルを生成するステップと、
前記現在ブロックに対する前記レジデュアルサンプルに基づいてレジデュアル情報を生成するステップと、
現在ピクチャの復元サンプルのための少なくとも1つの参照ピクチャを導出するステップと、
前記少なくとも1つの参照ピクチャに基づいて参照ピクチャ関連情報を生成するステップと、
前記現在ピクチャの復元サンプルのためのインループフィルタリング関連情報を生成するステップと、
前記レジデュアル情報、前記参照ピクチャ関連情報、及び前記インループフィルタリング関連情報を含む画像情報をエンコードするステップと、を含み、
前記参照ピクチャ関連情報は、前記少なくとも1つの参照ピクチャに対するインデックス情報であり、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、画像エンコード方法。
【請求項3】
画像に対するデータの送信方法において、
前記画像に対するビットストリームを取得するステップであって、前記ビットストリームは、現在ブロックに対するレジデュアルサンプルを生成し、前記現在ブロックに対する前記レジデュアルサンプルに基づいてレジデュアル情報を生成し、現在ピクチャの復元サンプルのための少なくとも1つの参照ピクチャを導出し、前記少なくとも1つの参照ピクチャに基づいて参照ピクチャ関連情報を生成し、前記現在ピクチャの復元サンプルのためのインループフィルタリング関連情報を生成し、前記レジデュアル情報、前記参照ピクチャ関連情報、及び前記インループフィルタリング関連情報を含む画像情報をエンコードすることに基づいて生成される、ステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記参照ピクチャ関連情報は、前記少なくとも1つの参照ピクチャに対するインデックス情報であり、
前記画像情報は、シーケンスパラメータセット(SPS)を含み、
前記少なくとも1つの参照ピクチャのためのリサンプリングが可能であるか否かに基づいて、前記SPSが追加的な仮想境界関連情報を含むか否かが決定される、データ送信方法。