IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エルジー エレクトロニクス インコーポレイティドの特許一覧

特許7598352レジデュアルコーディング方法及びその装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-03
(45)【発行日】2024-12-11
(54)【発明の名称】レジデュアルコーディング方法及びその装置
(51)【国際特許分類】
   H04N 19/70 20140101AFI20241204BHJP
   H04N 19/61 20140101ALI20241204BHJP
【FI】
H04N19/70
H04N19/61
【請求項の数】 3
(21)【出願番号】P 2022162498
(22)【出願日】2022-10-07
(62)【分割の表示】P 2020526558の分割
【原出願日】2019-08-30
(65)【公開番号】P2022173594
(43)【公開日】2022-11-18
【審査請求日】2022-10-07
(31)【優先権主張番号】62/729,979
(32)【優先日】2018-09-11
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/735,211
(32)【優先日】2018-09-24
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100108903
【弁理士】
【氏名又は名称】中村 和広
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100165191
【弁理士】
【氏名又は名称】河合 章
(72)【発明者】
【氏名】チェ チュンカ
(72)【発明者】
【氏名】ユ ソンミ
(72)【発明者】
【氏名】ホ チン
(72)【発明者】
【氏名】キム ソンファン
(72)【発明者】
【氏名】チェ チャンウォン
【審査官】坂東 大五郎
(56)【参考文献】
【文献】国際公開第2020/060328(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
デコード装置により行われる画像デコード方法において、
ビットストリームから予測モード情報及びレジデュアル情報を取得するステップと、
前記予測モード情報に基づいて現在ブロックに対する予測サンプルを導出するステップと、
前記レジデュアル情報に基づいて前記現在ブロックに対する量子化された変換係数を導出するステップと、
前記量子化された変換係数に基づいて変換係数を導出するステップと、
前記変換係数に基づいて前記現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記現在ブロックに対する前記予測サンプル及びレジデュアルサンプルに基づいて復元サンプルを生成するステップと、を含み、
前記レジデュアル情報は、
量子化された変換係数が0でない有効係数かどうかを表す有効係数フラグと、
前記量子化された変換係数に対する変換係数レベルのパリティのためのパリティレベルフラグと、
前記変換係数レベルが第1基準値より大きいかどうかに関する第1変換係数レベルフラグと、
前記変換係数レベルが第2基準値より大きいかどうかに関する第2変換係数レベルフラグと、
前記変換係数レベルのリマインダー情報と、を含み、
前記第1基準値及び前記第2基準値は、所定の特定値であり、
前記第1基準値に対する所定の特定値は、1であり、
前記第2基準値に対する所定の特定値は、3であり、
前記量子化された変換係数を導出するステップは、前記有効係数フラグ、前記第1変換係数レベルフラグ、前記パリティレベルフラグ、前記第2変換係数レベルフラグ及び前記リマインダー情報の順にデコードするステップによって、前記量子化された変換係数を導出するステップを含み、
前記第1変換係数レベルフラグの前記デコードは、前記パリティレベルフラグの前記デコードより前に行われ、前記パリティレベルフラグの前記デコードは、前記第1変換係数レベルフラグの値が1であることに基づいて行われ
前記量子化された変換係数は、前記デコードの結果に基づいて、(前記有効係数フラグの値+前記第1変換係数レベルフラグの値+前記パリティレベルフラグの値+(2×前記第2変換係数レベルフラグの値)+(2×前記リマインダー情報の値))の計算に基づいて導出される、方法。
【請求項2】
エンコード装置により行われる画像エンコード方法において、
現在ブロックの予測モードを導出するステップと、
前記予測モードに基づいて、前記現在ブロックの予測サンプルを導出するステップと、
前記導出された予測モードに基づいて、予測モード情報を生成するステップと、
前記予測サンプルに基づいて、前記現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記レジデュアルサンプルに基づいて、前記現在ブロックに対する変換係数を導出するステップと、
前記変換係数に基づいて、量子化された変換係数を導出するステップと、
前記量子化された変換係数に対するレジデュアル情報を生成するステップと、
予測モード情報及びレジデュアル情報を含む画像情報をエンコードするステップと、を含み、
前記レジデュアル情報は、
量子化された変換係数が0でない有効係数かどうかを表す有効係数フラグと、
前記量子化された変換係数に対する変換係数レベルのパリティのためのパリティレベルフラグと、
前記変換係数レベルが第1基準値より大きいかどうかに関する第1変換係数レベルフラグと、
前記変換係数レベルが第2基準値より大きいかどうかに関する第2変換係数レベルフラグと、
前記変換係数レベルのリマインダー情報と、を含み、
前記第1基準値及び前記第2基準値は、所定の特定値であり、
前記第1基準値に対する所定の特定値は、1であり、
前記第2基準値に対する所定の特定値は、3であり、
前記レジデュアル情報の前記エンコードは、前記有効係数フラグ、前記第1変換係数レベルフラグ、前記パリティレベルフラグ、前記第2変換係数レベルフラグ及び前記リマインダー情報の順にエンコードするステップを含み、
前記第1変換係数レベルフラグの前記エンコードは、前記パリティレベルフラグの前記エンコードより前に行われ、前記パリティレベルフラグの前記エンコードは、前記第1変換係数レベルフラグの値が1であることに基づいて行われ
前記量子化された変換係数に対する前記エンコードの結果は、(前記有効係数フラグの値+前記第1変換係数レベルフラグの値+前記パリティレベルフラグの値+(2×前記第2変換係数レベルフラグの値)+(2×前記リマインダー情報の値))の計算に基づいて導出される、方法。
【請求項3】
ビットストリームを送信する方法において、
前記ビットストリームを取得するステップであって、前記ビットストリームは、
現在ブロックの予測モードを導出するステップと、
前記予測モードに基づいて、前記現在ブロックの予測サンプルを導出するステップと、
前記導出された予測モードに基づいて、予測モード情報を生成するステップと、
前記予測サンプルに基づいて、前記現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記レジデュアルサンプルに基づいて、前記現在ブロックに対する変換係数を導出するステップと、
前記変換係数に基づいて、量子化された変換係数を導出するステップと、
前記量子化された変換係数に対するレジデュアル情報を生成するステップと、
予測モード情報及びレジデュアル情報を含む画像情報をエンコードするステップと、によって生成される、ステップと、
前記ビットストリームを送信するステップと、を含み、
前記レジデュアル情報は、
量子化された変換係数が0でない有効係数かどうかを表す有効係数フラグと、
前記量子化された変換係数に対する変換係数レベルのパリティのためのパリティレベルフラグと、
前記変換係数レベルが第1基準値より大きいかどうかに関する第1変換係数レベルフラグと、
前記変換係数レベルが第2基準値より大きいかどうかに関する第2変換係数レベルフラグと、
前記変換係数レベルのリマインダー情報と、を含み、
前記第1基準値及び前記第2基準値は、所定の特定値であり、
前記第1基準値に対する所定の特定値は、1であり、
前記第2基準値に対する所定の特定値は、3であり、
前記レジデュアル情報の前記エンコードは、前記有効係数フラグ、前記第1変換係数レベルフラグ、前記パリティレベルフラグ、前記第2変換係数レベルフラグ及び前記リマインダー情報の順にエンコードするステップを含み、
前記第1変換係数レベルフラグの前記エンコードは、前記パリティレベルフラグの前記エンコードより前に行われ、前記パリティレベルフラグの前記エンコードは、前記第1変換係数レベルフラグの値が1であることに基づいて行われ
前記量子化された変換係数に対する前記エンコードの結果は、(前記有効係数フラグの値+前記第1変換係数レベルフラグの値+前記パリティレベルフラグの値+(2×前記第2変換係数レベルフラグの値)+(2×前記リマインダー情報の値))の計算に基づいて導出される、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像コーディング技術に関し、より詳細には、画像コーディングシステムにおけるレジデュアルコーディング方法及びその装置に関する。
【背景技術】
【0002】
最近、4K又は8K以上のUHD(Ultra High Definition)画像/ビデオのような高解像度、高品質の画像/ビデオに対する需要が多様な分野で増加している。画像/ビデオデータが高解像度、高品質になるほど既存の画像/ビデオデータに比べて相対的に送信される情報量又はビット量が増加するので、既存の有線/無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を用いて画像/ビデオデータを格納する場合、送信コストと格納コストが増加する。
【0003】
また、最近、VR(Virtual Reality)、AR(Artificial Realtiy)コンテンツやホログラムなどの没入型メディア(Immersive Media)に対する関心及び需要が増加しており、ゲーム画像のように現実画像とは異なる画像特性を有する画像/ビデオに関する放送が増加している。
【0004】
従って、前記のような様々な特性を有する高解像度高品質の画像/ビデオの情報を効果的に圧縮して送信するか、格納又は再生するために高効率の画像/ビデオ圧縮技術が要求される。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の技術的課題は、画像コーディング効率を高める方法及び装置を提供することにある。
【0006】
本発明の他の技術的課題は、レジデュアルコーディングの効率を高める方法及び装置を提供することにある。
【0007】
本発明のまた他の技術的課題は、ライスパラメータに基づいてレジデュアル情報に対して二進化過程を行ってレジデュアルコーディング効率を高める方法及び装置を提供することにある。
【0008】
本発明のまた他の技術的課題は、ライスパラメータの最大値を3に設定してレジデュアルコーディングを行う方法及び装置を提供することにある。
【0009】
本発明のまた他の技術的課題は、現在ブロックに含まれたサブブロックに対する少なくとも1つのライスパラメータを導出するために初期化過程(initialization process)を行う方法及び装置を提供することにある。
【課題を解決するための手段】
【0010】
本発明の一実施形態によれば、デコード装置により行われる画像デコード方法が提供される。前記方法は、レジデュアル情報を含むビットストリームを受信するステップと、前記ビットストリームに含まれた前記レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出するステップと、逆量子化過程(inverse quantization process)に基づいて前記量子化された変換係数から変換係数を導出するステップと、前記導出された変換係数に逆変換(inverset ransform)を適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップと、前記現在ブロックに対する前記レジデュアルサンプルに基づいて復元ピクチャを生成するステップと、を含み、前記レジデュアル情報は変換係数レベル情報を含み、前記量子化された変換係数を導出するステップは、ライスパラメータ(rice parameter)に基づいて前記変換係数レベル情報に対する二進化(binarization)過程を行うステップと、前記二進化過程の結果に基づいて前記変換係数レベル情報の値を導出するステップと、前記変換係数レベル情報の前記値に基づいて前記量子化された変換係数を導出するステップと、を含み、前記ライスパラメータの最大値は3であることを特徴とする。
【0011】
本発明の他の実施形態によれば、画像デコードを行うデコード装置が提供される。前記デコード装置は、レジデュアル情報を含むビットストリームを受信し、前記ビットストリームに含まれた前記レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出するエントロピーデコード部と、逆量子化過程に基づいて前記量子化された変換係数から変換係数を導出する逆量子化部と、前記導出された変換係数に逆変換を適用して前記現在ブロックに対するレジデュアルサンプルを導出する逆変換部と、前記現在ブロックに対する前記レジデュアルサンプルに基づいて復元ピクチャを生成する加算部と、を含み、前記レジデュアル情報は、変換係数レベル情報を含み、前記エントロピーデコード部は、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程を行い、前記二進化過程の結果に基づいて前記変換係数レベル情報の値を導出し、前記変換係数レベル情報の前記値に基づいて前記量子化された変換係数を導出し、前記ライスパラメータの最大値は3であることを特徴とする。
【0012】
本発明のまた他の実施形態によれば、エンコード装置により行われる画像エンコード方法が提供される。前記方法は、現在ブロックに対するレジデュアルサンプルを導出するステップと、前記現在ブロックに対する前記レジデュアルサンプルを変換して変換係数を導出するステップと、量子化過程に基づいて前記変換係数から量子化された変換係数を導出するステップと、前記量子化された変換係数に関する情報を含むレジデュアル情報をエンコードするステップと、を含み、前記レジデュアル情報は変換係数レベル情報を含み、前記レジデュアル情報をエンコードするステップは、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程(binarization process)を行って前記変換係数レベル情報の二進化値(binarization value)を導出するステップと、前記変換係数レベル情報の前記二進化値をエンコードするステップとを含み、前記ライスパラメータの最大値は3であることを特徴とする。
【0013】
本発明のまた他の実施形態によれば、画像エンコードを行うエンコード装置が提供される。前記エンコード装置は、現在ブロックに対するレジデュアルサンプルを導出する減算部と、前記現在ブロックに対する前記レジデュアルサンプルを変換して変換係数を導出する変換部と、量子化過程に基づいて前記変換係数から量子化された変換係数を導出する量子化部と、前記量子化された変換係数に関する情報を含むレジデュアル情報をエンコードするエントロピーエンコード部と、を含み、前記レジデュアル情報は係数変換レベル情報を含み、前記エントロピーエンコード部は、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程を行って前記変換係数レベル情報の二進化値を導出し、前記変換係数レベル情報の前記二進化値をエンコードし、前記ライスパラメータの最大値は3であることを特徴とする。
【発明の効果】
【0014】
本発明によれば、全般的な画像/ビデオの圧縮効率を高めることができる。
【0015】
本発明によれば、レジデュアルコーディングの効率を高めることができる。
【0016】
本発明によれば、ライスパラメータに基づいてレジデュアル情報に対して二進化過程を行ってレジデュアルコーディング効率を高めることができる。
【0017】
本発明によれば、ライスパラメータの最大値を3に設定してレジデュアルコーディングを効率的に行うことができる。
【0018】
本発明によれば、現在ブロックに含まれたサブブロックに対する少なくとも1つのライスパラメータを導出するために初期化過程を行うことができる。
【図面の簡単な説明】
【0019】
図1】本発明が適用できるビデオ/画像コーディングシステムの例の概略を示す図である。
図2】本発明が適用できるビデオ/画像エンコード装置の構成の概略を説明する図である。
図3】本発明が適用できるビデオ/画像デコード装置の構成の概略を説明する図である。
図4】一実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する一例を説明するための図である。
図5A】一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する他の一例を説明するための図である。
図5B】一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する他の一例を説明するための図である。
図5C】一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する他の一例を説明するための図である。
図6A】他の一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出するまた他の一例を説明するための図である。
図6B】他の一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出するまた他の一例を説明するための図である。
図6C】他の一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出するまた他の一例を説明するための図である。
図7】一実施形態によって2×2ブロックの量子化された係数を導出する過程を示す図である。
図8A】一実施形態によるエントロピーエンコード部の構成及び動作方法を示す図である。
図8B】一実施形態によるエントロピーエンコード部の構成及び動作方法を示す図である。
図9A】一実施形態によるエントロピーデコード部の構成及び動作方法を示す図である。
図9B】一実施形態によるエントロピーデコード部の構成及び動作方法を示す図である。
図10】一実施形態によるエンコード装置のエントロピーエンコード方法を示すフローチャートである。
図11】一実施形態によるデコード装置のエントロピーデコード方法を示すフローチャートである。
図12】一実施形態によるエンコード装置の動作を示すフローチャートである。
図13】一実施形態によるエンコード装置の構成を示すブロック図である。
図14】一実施形態によるデコード装置の動作を示すフローチャートである。
図15】一実施形態によるデコード装置の構成を示すブロック図である。
図16】本文書において開示された発明が適用できるコンテンツストリーミングシステムの例を示す。
【発明を実施するための形態】
【0020】
本発明の一実施形態によると、デコード装置により行われる画像デコード方法が提供される。前記方法は、レジデュアル情報を含むビットストリームを受信するステップと、前記ビットストリームに含まれた前記レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出するステップと、逆量子化過程(inverse quantization process)に基づいて前記量子化された変換係数から前記現在ブロックに対する変換係数を導出するステップと、前記導出された変換係数に逆変換(inverse transform)を適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップと、前記現在ブロックに対する前記レジデュアルサンプルに基づいて復元ピクチャを生成するステップと、を含み、前記レジデュアル情報は変換係数レベル情報を含み、前記量子化された変換係数を導出するステップは、ライスパラメータ(rice parameter)に基づいて前記変換係数レベル情報に対する二進化(binarization)過程を行うステップと、前記二進化過程の結果に基づいて前記変換係数レベル情報の値を導出するステップと、前記変換係数レベル情報の前記値に基づいて前記量子化された変換係数を導出するステップと、を含み、前記ライスパラメータの最大値は3であることを特徴とする。
【0021】
本発明は、様々な変更を加えることができ、様々な実施形態を有することができるため、特定の実施形態を図面に例示し、詳細に説明しようとする。しかしながら、これは、本発明を特定の実施形態に限定しようとすることではない。本明細書において常用する用語は、単に特定の実施形態を説明するために用いられるものであって、本発明の技術的な思想を限定しようとする意図はない。単数の表現は、文脈上、明白に異なる意味をもたない限り複数の表現を含む。本明細書において、「含む」又は「有する」などの用語は明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品又はこれらを組み合わせたものが存在することを指定するものであって、1つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれを組み合わせたものなどの存在又は付加の可能性を予め排除しないものとして理解しなければならない。
【0022】
一方、本発明において説明される図面上の各構成は、相異なる特徴的な機能に関する説明の便宜のために独立して示されたものであって、各構成が互いに別個のハードウェア又は別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち2つ以上の構成が結合されて1つの構成をなすこともでき、1つの構成を複数の構成に分けることもできる。各構成が統合及び/又は分離された実施例も本発明の本質から外れない限り、本発明の権利範囲に含まれる。
【0023】
以下、添付の図面を参照して、本発明の好ましい実施形態をより詳細に説明する。以下、図面上の同一の構成要素に対しては同一の参照符号を使用し、同一の構成要素に対して重複する説明は省略する。
【0024】
図1は、本発明を適用できるビデオ/画像コーディングシステムの例の概略を示す図である。
【0025】
図1に示すように、ビデオ/画像コーディングシステムは、第1装置(ソースデバイス)及び第2装置(受信デバイス)を含む。ソースデバイスは、エンコードされたビデオ(video)/画像(image)情報又はデータをファイル又はストリーミングの形態でデジタル格納媒体又はネットワークを介して受信デバイスに伝達する。
【0026】
前記ソースデバイスは、ビデオソース、エンコード装置、送信部を含む。前記受信デバイスは、受信部、デコード装置及びレンダラーを含む。前記エンコード装置はビデオ/画像エンコード装置と呼ばれてもよく、前記デコード装置はビデオ/画像デコード装置と呼ばれてもよい。送信部はエンコード装置に含まれてもよい。受信部はデコード装置に含まれてもよい。レンダラーはディスプレイ部を含んでもよく、ディスプレイ部は別個のデバイス又は外部コンポーネントで構成されてもよい。
【0027】
ビデオソースは、ビデオ/画像のキャプチャ、合成又は生成過程などによりビデオ/画像を取得する。ビデオソースは、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含んでもよい。ビデオ/画像キャプチャデバイスは、例えば、1つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含む。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット及びスマートフォンなどを含み、(電子的に)ビデオ/画像を生成する。例えば、コンピュータなどにより仮想のビデオ/画像が生成され、この場合、関連データが生成される過程がビデオ/画像キャプチャ過程に代わってもよい。
【0028】
エンコード装置は、入力ビデオ/画像をエンコードする。エンコード装置は、圧縮及びコーディング効率のために予測、変換、量子化などの一連の手順を行う。エンコードされたデータ(エンコードされたビデオ/画像情報)は、ビットストリーム(bitstream)の形態で出力される。
【0029】
送信部は、ビットストリームの形態で出力されたエンコードされたビデオ/画像情報又はデータをファイル又はストリーミングの形態でデジタル格納媒体又はネットワークを介して受信デバイスの受信部に伝達する。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど多様な格納媒体を含む。送信部は、予め定められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含んでもよく、放送/通信ネットワークを介する送信のためのエレメントを含んでもよい。受信部は、前記ビットストリームを受信/抽出してデコード装置に伝達する。
【0030】
デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像をデコードする。
【0031】
レンダラーは、デコードされたビデオ/画像をレンダリングする。レンダリングされたビデオ/画像はディスプレイ部を介して表示される。
【0032】
この文書は、ビデオ/画像コーディングに関する。例えば、この文書に開示された方法/実施形態は、VVC(versatile video coding)標準、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)又は次世代ビデオ/画像コーディング標準(例えば、H.267又はH.268など)に開示される方法に適用されることができる。
【0033】
この文書においては、ビデオ/画像コーディングに関する様々な実施形態を提示し、他の言及がない限り、前記実施形態は互いに組み合わせて行われることもできる。
【0034】
この文書において、ビデオ(video)は、時間の流れによる一連の画像(image)の集合を意味し得る。ピクチャ(picture)は、一般的に特定の時間帯の1つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、コーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含んでもよい。1つのピクチャは、1つ以上のスライス/タイルで構成される。1つのピクチャは、1つ以上のタイルグループで構成される。1つのタイルグループは、1つ以上のタイルを含む。ブリックは、ピクチャ内のタイル内部のCTU行の四角領域を示す(a brick may represent a rectangular region of CTU rows within a tile in a picture)。タイルは、多数のブリックでパーティショニングされ、各ブリックは、前記タイル内の1つ以上のCTU行で構成される(A tile may be partitioned into multiple bricks, each of which consisting of one or more CTU rows within the tile)。多数のブリックでパーティショニングされていないタイルは、ブリックとも呼ばれてもよい(A tile that is not partitioned into multiple bricks may be also referred to as a brick)。ブリックスキャンは、ピクチャをパーティショニングするCTUの特定のシーケンシャルなオーダリングを示してもよく、前記CTUは、ブリック内でCTUラスタースキャンで整列されてもよく、タイル内のブリックは前記タイルの前記ブリックのラスタースキャンで連続的に整列されてもよく、そして、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタースキャンで連続的に整列されてもよい(A brick scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a brick, bricks within a tile are ordered consecutively in a raster scan of the bricks of the tile, and tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。タイルは、特定タイル列及び特定タイル列内部のCTUの四角領域である(A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture)。前記タイル列はCTUの四角領域であり、前記四角領域は前記ピクチャの高さと同一の高さを有し、幅はピクチャパラメータセット内のシンタックス要素により明示される(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set)。前記タイル行はCTUの四角領域であり、前記四角領域はピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは前記ピクチャの高さと同一であり得る(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture)。タイルスキャンは、ピクチャをパーティショニングするCTUの特定のシーケンシャルなオーダリングを示し、前記CTUは、タイル内のCTUラスタースキャンで連続的に整列され、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタースキャンで連続的に整列される(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。スライスは、ピクチャの整数個のブリックを含み、前記整数個のブリックは1つのNALユニットに含まれる(A slice includes an integer number of bricks of a picture that may be exclusively contained in a single NAL unit)。スライスは、多数の完全なタイルで構成され、又は、1つのタイルの完全なブリックの連続的なシーケンスであり得る(A slice may consists of either a number of complete tiles or only a consecutive sequence of complete bricks of one tile)。この文書において、タイルグループとスライスは混用されてもよい。例えば、本文書においては、タイルグループ/タイルグループヘッダはスライス/スライスヘッダと呼ばれてもよい。
【0035】
ピクセル(pixel)又はペル(pel)は、1つのピクチャ(又は、画像)を構成する最小の単位を意味する。また、ピクセルに対応する用語として「サンプル(sample)」が使用されてもよい。サンプルは、一般的にピクセル又はピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
【0036】
ユニット(unit)は、画像処理の基本単位を示す。ユニットは、ピクチャの特定領域及び当該領域に関する情報の少なくとも1つを含んでもよい。1つのユニットは1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含む。ユニットは、場合によってはブロック(block)又は領域(area)などの用語と混在して使用されてもよい。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(又は、サンプルアレイ)又は変換係数(transform coefficient)の集合(又は、アレイ)を含む。
【0037】
この文書において「/」と「、」は「及び/又は」と解釈される。例えば、「A/B」は「A及び/又はB」と解釈され、「A、B」は「A及び/又はB」と解釈される。追加的に、「A/B/C」は「A、B及び/又はCのいずれか1つ」を意味する。また、「A、B、C」も「A、B及び/又はCのいずれか1つ」を意味する。
【0038】
追加的に、本文書において、「又は」は「及び/又は」と解釈される。例えば、「A又はB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、3)「A及びB」を意味し得る。言い換えると、本文書の「又は」は「追加的に又は代替的に(additionally or alternatively)」を意味し得る。
【0039】
図2は、本発明が適用できるビデオ/画像エンコード装置の構成の概略を説明する図である。以下、ビデオエンコード装置とは画像エンコード装置を含んでもよい。
【0040】
図2に示すように、エンコード装置200は、画像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコード部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260及びメモリ(memory)270を含んで構成される。予測部220は、インター予測部221及びイントラ予測部222を含む。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を含む。レジデュアル処理部230は、減算部(subtractor)231をさらに含む。加算部250は、復元部(reconstructor)又は復元ブロック生成部(recontructged block generator)と呼ばれてもよい。前述した画像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコード部240、加算部250及びフィルタリング部260は、実施形態によって1つ以上のハードウェアコンポーネント(例えば、エンコーダチップセット又はプロセッサ)により構成されてもよい。また、メモリ270は、DPB(decoded picture buffer)を含んでもよく、デジタル格納媒体により構成されてもよい。前記ハードウェアコンポーネントは、メモリ270を内部/外部のコンポーネントとしてさらに含んでもよい。
【0041】
画像分割部210は、エンコード装置200に入力された入力画像(又は、ピクチャ、フレーム)を1つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit:CU)と呼ばれてもよい。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit:CTU)又は最大コーディングユニット(largest coding unit:LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造に応じて再帰的に(recursively)分割される。例えば、1つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/又はターナリツリー構造に基づいてより深い(deeper)深さ(depth)の複数のコーディングユニットに分割される。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/又はターナリツリー構造が後で適用されてもよい。または、バイナリツリー構造が先に適用されてもよい。これ以上分割されない最終コーディングユニットに基づいて本発明によるコーディング手順が行われることができる。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが直ちに最終コーディングユニットとして使用され、または、必要に応じてコーディングユニットは再帰的に(recursively)より深い深さ(depth)のコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順は、後述する予測、変換、及び復元などの手順を含む。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)又は変換ユニット(TU:Transform Unit)をさらに含んでもよい。この場合、前記予測ユニット及び前記変換ユニットは、それぞれ前述した最終コーディングユニットから分割又はパーティショニングされることができる。前記予測ユニットはサンプル予測の単位であってよく、前記変換ユニットは変換係数を誘導する単位及び/又は変換係数からレジデュアル信号(residual signal)を誘導する単位であり得る。
【0042】
ユニットは、場合によって、ブロック(block)又は領域(area)などの用語と混在して使用されてもよい。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル又は変換係数(transform coefficient)の集合を示す。サンプルは、一般的にピクセル又はピクセルの値を示し、輝度(luma)成分のピクセル/ピクセル値のみを示し、彩度(chroma)成分のピクセル/ピクセル値のみを示してもよい。サンプルは、1つのピクチャ(又は、画像)をピクセル(pixel)又はペル(pel)に対応する用語として使用されてもよい。
【0043】
エンコード装置200は、入力画像信号(原本ブロック、原本サンプルアレイ)からインター予測部221又はイントラ予測部222から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算してレジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成し、生成されたレジデュアル信号は変換部232に送信される。この場合、図示されているように、エンコード装置200内において入力画像信号(原本ブロック、原本サンプルアレイ)から予測信号(予測ブロック、予測サンプルアレイ)を減算するユニットは減算部231と呼ばれる。予測部は、処理対象ブロック(以下、現在ブロックという)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成する。予測部は、現在ブロック又はCU単位でイントラ予測が適用されるかインター予測が適用されるかを決定できる。予測部は、各予測モードに関する説明において後述するように、予測モード情報などの予測に関する多様な情報を生成してエントロピーエンコード部240に伝達する。予測に関する情報は、エントロピーエンコード部240においてエンコードされてビットストリームの形態で出力される。
【0044】
イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測する。前記参照されるサンプルは、予測モードに応じて前記現在ブロックの周辺(neighbor)に位置してもよく、又は離れて位置してもよい。イントラ予測において、予測モードは複数の非方向性モードと複数の方向性モードを含む。非方向性モードは、例えば、DCモード及びプラナーモード(Planar mode)を含む。方向性モードは、予測方向の細かさの程度によって、例えば、33個の方向性予測モード又は65個の方向性予測モードを含む。ただし、これは例示であって、設定に応じてそれ以上又はそれ以下の個数の方向性予測モードが使用されてもよい。イントラ予測部222は周辺ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。
【0045】
インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導する。ここで、インター予測モードで送信される動き情報の量を減らすために、周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含む。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含んでもよい。インター予測の場合、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間的周辺ブロック(temporal neighboring block)を含む。前記参照ブロックを含む参照ピクチャと前記時間的周辺ブロックを含む参照ピクチャは同一であってもよく、異なってもよい。前記時間的周辺ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれてもよく、前記時間的周辺ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれてもよい。例えば、インター予測部221は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するためにどの候補が使われるかを指示する情報を生成する。多様な予測モードに基づいてインター予測が行われることができ、例えば、スキップモードとマージモードの場合、インター予測部221は、周辺ブロックの動き情報を現在ブロックの動き情報として利用できる。スキップモードの場合、マージモードとは異なってレジデュアル信号が送信されない場合がある。動き情報予測(motion vector prediction:MVP)モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。
【0046】
予測部220は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のためにイントラ予測又はインター予測を適用できるだけでなく、イントラ予測とインター予測を同時に適用できる。これは、CIIP(combined inter and intra prediction)と呼ばれる。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy:IBC)予測モードに基づくこともでき、又は、パレットモード(pallette mode)に基づくこともできる。前記IBC予測モード又はパレットモードは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点で、インター予測と同様に行われることができる。すなわち、IBCは、本文書において説明されるインター予測技法の少なくとも1つを利用することができる。パレットモードは、イントラコーディング又はイントラ予測の一例として見ることができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングできる。
【0047】
前記予測部(インター予測部221及び/又は前記イントラ予測部222を含む)により生成された予測信号は、復元信号を生成するために利用されるか、レジデュアル信号を生成するために利用される。変換部232は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成する。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform)の少なくとも1つを含む。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとき、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を利用して予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じサイズを有するピクセルブロックに適用されてもよく、正方形でない可変サイズのブロックに適用されてもよい。
【0048】
量子化部233は、変換係数を量子化してエントロピーエンコード部240に送信し、エントロピーエンコード部240は、量子化された信号(量子化された変換係数に関する情報)をエンコードしてビットストリームで出力する。前記量子化された変換係数に関する情報はレジデュアル情報と呼ばれてもよい。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトルの形態で再整列することができ、前記1次元ベクトルの形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などの多様なエンコード方法を行うことができる。エントロピーエンコード部240は、量子化された変換係数の他、ビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を共に又は別途にエンコードすることもできる。エンコードされた情報(例えば、エンコードされたビデオ/画像情報)は、ビットストリームの形態でNAL(network abstraction layer)ユニット単位で送信又は格納される。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、ビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含んでもよい。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含んでもよい。本文書において、エンコード装置からデコード装置に伝達/シグナリングされる情報及び/又はシンタックス要素はビデオ/画像情報に含まれてもよい。前記ビデオ/画像情報は、前述したエンコード手順を経てエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームはネットワークを介して送信されてもよく、又はデジタル格納媒体に格納されてもよい。ここで、ネットワークは、放送網及び/又は通信網などを含み、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなどの様々な格納媒体を含む。エントロピーエンコード部240から出力された信号は、送信する送信部(図示せず)及び/又は格納する格納部(図示せず)がエンコード装置200の内部/外部エレメントとして構成されてもよく、又は、送信部はエントロピーエンコード部240に含まれてもよい。
【0049】
量子化部233から出力された量子化された変換係数は予測信号を生成するために利用される。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元することができる。加算部155は、復元されたレジデュアル信号をインター予測部221又はイントラ予測部222から出力された予測信号に加算することにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成する。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部250は、復元部又は復元ブロック生成部と呼ばれてもよい。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されてもよく、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されてもよい。
【0050】
一方、ピクチャエンコーディング及び/又は復元の過程においてLMCS(luma mapping with chroma scaling)が適用されることもできる。
【0051】
フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに様々なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成し、前記修正された復元ピクチャをメモリ270、具体的にメモリ270のDPBに格納する。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含む。フィルタリング部260は、各フィルタリング方法に関する説明において、後述するようにフィルタリングに関する多様な情報を生成してエントロピーエンコード部240に伝達する。フィルタリングに関する情報は、エントロピーエンコード部240においてエンコードされてビットストリーム形式で出力される。
【0052】
メモリ270に送信された修正された復元ピクチャは、インター予測部221において参照ピクチャとして使用できる。エンコード装置は、これによりインター予測が適用される場合、エンコード装置100とデコード装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。
【0053】
メモリ270のDPBは、修正された復元ピクチャをインター予測部221における参照ピクチャとして使用するために格納する。メモリ270は、現在ピクチャ内の動き情報が導出された(又は、エンコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納する。前記格納された動き情報は、空間的周辺ブロックの動き情報又は時間的周辺ブロックの動き情報として活用するためにインター予測部221に伝達される。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納し、イントラ予測部222に伝達する。
【0054】
図3は、本発明が適用できるビデオ/画像デコード装置の構成の概略を説明する図である。
【0055】
図3に示すように、デコード装置300は、エントロピーデコード部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350及びメモリ(memory)360を含んで構成される。予測部330は、インター予測部331及びイントラ予測部332を含む。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を含む。前述したエントロピーデコード部310、レジデュアル処理部320、予測部330、加算部340及びフィルタリング部350は、実施形態によって1つのハードウェアコンポーネント(例えば、デコーダチップセット又はプロセッサ)により構成されてもよい。また、メモリ360は、DPB(decoded picture buffer)を含んでもよく、デジタル格納媒体により構成されてもよい。前記ハードウェアコンポーネントは、メモリ360を内部/外部コンポーネントとしてさらに含んでもよい。
【0056】
ビデオ/画像情報を含むビットストリームが入力されると、デコード装置300は、図3のエンコード装置においてビデオ/画像情報が処理されたプロセスに対応して画像を復元する。例えば、デコード装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出する。デコード装置300は、エンコード装置において適用された処理ユニットを利用してデコードを行う。従って、デコーディングの処理ユニットは、例えば、コーディングユニットであり、コーディングユニットは、コーディングツリーユニット又は最大コーディングユニットからクアッドツリー構造、バイナリツリー構造及び/又はターナリツリー構造によって分割されることができる。コーディングユニットから1つ以上の変換ユニットが導出されることができる。そして、デコード装置300を介してデコード及び出力された復元画像信号は再生装置により再生される。
【0057】
デコード装置300は、図3のエンコード装置から出力された信号をビットストリーム形態で受信し、受信された信号はエントロピーデコード部310によりデコードされる。例えば、エントロピーデコード部310は、前記ビットストリームをパーシングして画像復元(又は、ピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出する。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含んでもよい。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含んでもよい。デコード装置は、前記パラメータセットに関する情報及び/又は前記一般制限情報にさらに基づいてピクチャをデコードすることができる。本文書において後述されるシグナリング/受信される情報及び/又はシンタックス要素は、前記デコード手順によりデコードされて前記ビットストリームから取得できる。例えば、エントロピーデコード部310は、指数ゴロム符号化、CAVLC又はCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳細に、CABACエントロピーデコード方法は、ビットストリームにおいて各シンタックス要素に該当するビンを受信し、デコード対象シンタックス要素情報と周辺及びデコード対象ブロックのデコード情報又は以前の段階でデコードされたシンボル/ビンの情報を利用してコンテキストモデルを決定し、決定されたコンテキストモデルに応じてビン(bin)の発生確率を予測してビンの算術デコーディング(arithmetic decoding)を行って各シンタックス要素に該当するシンボルを生成することができる。ここで、CABACエントロピーデコード方法は、コンテキストモデルを決定した後、次のシンボル/ビンのコンテキストモデルのためにデコードされたシンボル/ビンの情報を利用してコンテキストモデルをアップデートする。エントロピーデコード部310でデコードされた情報のうち予測に関する情報は、予測部(インター予測部332及びイントラ予測部331)に提供され、エントロピーデコード部310でエントロピーデコードが行われたレジデュアル値、すなわち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部320に入力される。レジデュアル処理部320は、レジデュアル信号(レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ)を導出することができる。また、エントロピーデコード部310でデコードされた情報のうちフィルタリングに関する情報は、フィルタリング部350に提供される。一方、エンコード装置から出力された信号を受信する受信部(図示せず)がデコード装置300の内部/外部エレメントとしてさらに構成されてもよく、又は受信部はエントロピーデコード部310の構成要素であってもよい。一方、本文書によるデコード装置は、ビデオ/画像/ピクチャデコード装置と呼ばれてもよく、前記デコード装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)に区分されてもよい。前記情報デコーダは、前記エントロピーデコード部310を含んでもよく、前記サンプルデコーダは、前記逆量子化部321、逆変換部322、加算部340、フィルタリング部350、メモリ360、インター予測部332及びイントラ予測部331のうち少なくとも1つを含んでもよい。
【0058】
逆量子化部321は、量子化された変換係数を逆量子化して変換係数を出力する。逆量子化部321は、量子化された変換係数を2次元のブロックの形態で再整列する。この場合、前記再整列は、エンコード装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を利用して量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得できる。
【0059】
逆変換部322においては、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得する。
【0060】
予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成する。予測部は、エントロピーデコード部310から出力された前記予測に関する情報に基づいて前記現在ブロックにイントラ予測が適用されるかインター予測が適用されるかを決定し、具体的なイントラ/インター予測モードを決定する。
【0061】
予測部320は、後述する多様な予測方法に基づいて予測信号を生成する。例えば、予測部は、1つのブロックに対する予測のためにイントラ予測又はインター予測を適用できるだけでなく、イントラ予測とインター予測を同時に適用することができる。これは、CIIP(combined inter and intra prediction)と呼ばれてもよい。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy:IBC)予測モードに基づくこともでき、又はパレットモード(palette mode)に基づくこともできる。前記IBC予測モード又はパレットモードは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点でインター予測と同様に行われることができる。すなわち、IBCは、本文書において説明されるインター予測技法の少なくとも1つを利用することができる。パレットモードは、イントラコーディング又はイントラ予測の一例として見ることができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ/画像情報に含まれてシグナリングされることができる。
【0062】
イントラ予測部331は、現在ピクチャ内のサンプルを参照して現在ブロックを予測する。前記参照されるサンプルは、予測モードに応じて前記現在ブロックの周辺(neighbor)に位置するか、離れて位置する。イントラ予測において、予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。イントラ予測部331は、周辺ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。
【0063】
インター予測部332は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導する。ここで、インター予測モードで送信される動き情報の量を減らすために周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含んでもよい。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)の情報をさらに含むことができる。インター予測の場合、周辺ブロックは現在ピクチャ内に存在する空間的周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間的周辺ブロック(temporal neighboring block)を含むことができる。例えば、インター予測部332は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出する。様々な予測モードに基づいてインター予測が行われることができ、前記予測に関する情報は前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。
【0064】
加算部340は、取得されたレジデュアル信号を予測部(インター予測部332及び/又はイントラ予測部331を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加算することにより復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成する。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。
【0065】
加算部340は、復元部又は復元ブロック生成部と呼ばれてもよい。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されてもよく、後述するようにフィルタリングを経て出力されてもよく、又は次のピクチャのインター予測のために使用されてもよい。
【0066】
一方、ピクチャデコーディング過程でLMCS(luma mapping with chroma scaling)が適用されることもある。
【0067】
フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに様々なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成し、前記修正された復元ピクチャをメモリ360、具体的にメモリ360のDPBに送信する。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含む。
【0068】
メモリ360のDPBに格納された(修正された)復元ピクチャはインター予測部332において参照ピクチャとして使用できる。メモリ360は、現在ピクチャ内の動き情報が導出された(又は、デコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納する。前記格納された動き情報は、空間的周辺ブロックの動き情報又は時間的周辺ブロックの動き情報として活用するためにインター予測部260に伝達される。メモリ360は、現在ピクチャ内に復元されたブロックの復元サンプルを格納し、イントラ予測部331に伝達する。
【0069】
本明細書において、エンコード装置100のフィルタリング部260、インター予測部221及びイントラ予測部222において説明された実施形態は、それぞれデコード装置300のフィルタリング部350、インター予測部332及びイントラ予測部331にも同様に又は対応されるように適用されることができる。
【0070】
前述したように、ビデオコーディングを行うにおいて、圧縮効率を向上させるために予測を行う。これにより、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン(又は、ピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコード装置及びデコード装置において同様に導出され、前記エンコード装置は、原本ブロックの原本サンプル値そのものではなく、前記原本ブロックと前記予測されたブロックとの間のレジデュアルに関する情報(レジデュアル情報)をデコード装置にシグナリングすることにより、画像コーディング効率を向上させることができる。デコード装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。
【0071】
前記レジデュアル情報は、変換及び量子化の手順により生成される。例えば、エンコード装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれたレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を行って変換係数を導出し、前記変換係数に量子化手順を行って量子化された変換係数を導出して関連するレジデュアル情報を(ビットストリームを介して)デコード装置にシグナリングすることができる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含む。デコード装置は、前記レジデュアル情報に基づいて逆量子化/逆変換の手順を行い、レジデュアルサンプル(又は、レジデュアルブロック)を導出する。デコード装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成する。エンコード装置は、また、以後のピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成する。
【0072】
一実施形態において、(量子化された)変換係数は、transform_skip_flag、last_sig_coeff_x_prefix、last_sig_coeff_y_prefix、last_sig_coeff_x_suffix、last_sig_coeff_y_suffix、coded_sub_block_flag、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flag、abs_remainder、coeff_sign_flag、mts_idxなどのシンタックス要素(syntax elements)に基づいて符号化及び/又は復号化されることができる。下記の表1は、レジデュアルデータ符号化に関連したシンタックス要素を示す。
【0073】
【表1-1】
【0074】
【表1-2】
【0075】
【表1-3】
【0076】
transform_skip_flagは、関連したブロック(associated block)に変換が省略されるか否かを示す。前記関連したブロックは、CB(coding block)又はTB(Transform block)であり得る。変換(及び量子化)及びレジデュアルコーディング手順に関して、CBとTBは混用されてもよい。例えば、CBに対してレジデュアルサンプルが導出され、前記レジデュアルサンプルに対する変換及び量子化により(量子化された)変換係数が導出できることは前述の通りであり、レジデュアルコーディング手順により前記(量子化された)変換係数の位置、サイズ、符号などを効率的に示す情報(例えば、シンタックス要素)が生成され、シグナリングされることができる。量子化された変換係数は簡単に変換係数と呼ばれてもよい。一般に、CBが最大TBより大きくない場合、CBのサイズはTBのサイズと同一であり、この場合、変換(及び量子化)及びレジデュアルコーディングされる対象ブロックはCB又はTBと呼ばれてもよい。一方、CBが最大TBより大きい場合、変換(及び量子化)及びレジデュアルコーディングされる対象ブロックはTBと呼ばれてもよい。以下、レジデュアルコーディングに関連したシンタックス要素が変換ブロック(TB)単位でシグナリングされると説明するが、これは例示であって、前記TBはコーディングブロック(CB)と混用できることは前述の通りである。
【0077】
一実施形態において、シンタックス要素last_sig_coeff_x_prefix、last_sig_coeff_y_prefix、last_sig_coeff_x_suffix及びlast_coeff_y_suffixに基づいて変換ブロック内の最後の0でない変換係数の(x,y)位置情報を符号化することができる。より具体的に、last_sig_coeff_x_prefixは、変換ブロック内のスキャン順序(scanning order)における最後(last)の有効係数(significant coefficient)の列位置(column position)のプレフィックス(prefix)を示し、last_sig_coeff_y_prefixは、変換ブロック内の前記スキャン順序(scanning order)における最後(last)の有効係数(significant coefficient)の行位置(row position)のプレフィックス(prefix)を示し、last_sig_coeff_x_suffixは、前記変換ブロック内の前記スキャン順序(scanning order)における最後(last)の有効係数(significant coefficient)の列位置(column position)のサフィックス(suffix)を示し、last_sig_coeff_y_suffixは、前記変換ブロック内の前記スキャン順序(scanning order)における最後(last)の有効係数(significant cofficient)の行位置(row position)のサフィックス(suffix)を示す。ここで、有効係数は、前記0ではない係数を示すことができる。前記スキャン順序は、右上向対角スキャン順序であり得る。または、前記スキャン順序は、水平スキャン順序又は垂直スキャン順序であり得る。前記スキャン順序は、対象ブロック(CB、又はTBを含むCB)にイントラ/インター予測が適用されるか否か及び/又は具体的なイントラ/インター予測モードに基づいて決定できる。
【0078】
次に、変換ブロックを4×4サブブロック(sub-block)に分割した後、各4×4サブブロック毎に1ビットのシンタックス要素coded_sub_block_flagを使用して現在サブブロック内に0でない係数が存在するか否か示すことができる。
【0079】
coded_sub_block_flagの値が0であると、それ以上送信する情報がないので、現在サブブロックに対する符号化過程を終了することができる。逆に、coded_sub_block_flagの値が1であると、sig_coeff_flagに対する符号化過程を継続して行うことができる。最後の0でない係数を含むサブブロックはcoded_sub_block_flagに対する符号化が不要であり、変換ブロックのDC情報を含んでいるサブブロックは0でない係数を含む確率が高いので、coded_sub_block_flagは符号化されずにその値が1であると仮定されることができる。
【0080】
もし、coded_sub_block_flagの値が1であるため、現在サブブロック内に0でない係数が存在すると判断される場合、逆にスキャンされた順序に従って二進値を有するsig_coeff_flagを符号化することができる。スキャン順序に従ってそれぞれの係数に対して1ビットシンタックス要素sig_coeff_flagを符号化することができる。もし、現在スキャン位置において変換係数の値が0でないと、sig_coeff_flagの値は1になり得る。ここで、最後の0でない係数を含んでいるサブブロックの場合、最後の0でない係数に対してはsig_coeff_flagを符号化する必要がないので、前記サブブロックに対する符号化過程が省略されてもよい。sig_coeff_flagが1である場合にのみレベル情報符号化が実行でき、レベル情報符号化の過程には4つのシンタックス要素を使用することができる。より具体的に、各sig_coeff_flag[xC][yC]は、現在TB内の各変換係数位置(xC,yC)における当該変換係数のレベル(値)が0でない(non-zero)か否かを示すことができる。
【0081】
sig_coeff_flagに対する符号化以後の残りのレベル値は、下記の数式1のようである。すなわち、符号化すべきレベル値を示すシンタックス要素remAbsLevelは下記の数式1のようである。ここで、coeffは実際の変換係数値を意味する。
【0082】
[数式1]
remAbsLevel = |coeff| - 1
【0083】
par_level_flagにより下記の数式2のように、数式1に記載されたremAbsLevelのleast significant coefficient(LSB)値を符号化することができる。ここで、par_level_flag[n]は、スキャニング位置nにおける変換係数レベル(値)のパリティ(parity)を示すことができる。par_leve_flag符号化後に符号化すべき変換係数レベル値remAbsLevelを下記の数式3のようにアップデートすることができる。
【0084】
[数式2]
par_level_flag = remAbsLevel_1
【0085】
[数式3]
remAbsLevel' = remAbsLevel >> 1
【0086】
rem_abs_gt1_flagは、当該スキャニング位置(n)におけるremAbsLevel’が1より大きいか否かを、rem_abs_gt2_flagは当該スキャニング位置(n)におけるremAbsLevel’が2より大きいか否かを示すことができる。rem_abs_gt2_flagが1である場合にのみabs_remainderに対する符号化が行われることができる。実際の変換係数値であるcoeffと各シンタックス要素の関係を整理すると、例えば、下記の数式4のようであり、下記の表2は数式4に関連した例を示す。また、各係数の符号は1ビットシンボルであるcoeff_sign_flagを用いて符号化できる。|coeff|は変換係数レベル(値)を示し、変換係数に対するAbsLevelと表示される。
【0087】
[数式4]
| coeff | = sig_coeff_flag + par_level_flag + 2 * (rem_abs_gt1_flag + rem_abs_gt2_flag + abs_remainder)
【0088】
【表2】
【0089】
一方、他の一実施形態においては、rem_abs_gt2_flagは、rem_abs_gt3_flagと呼ばれてもよく、また他の実施形態においては、rem_abs_gt1_flagとrem_abs_gt2_flagがabs_level_gtx_flag[n][j]に基づいて現れることもできる。abs_level_gtx_flag[n][j]はスキャニング位置nにおいて変換係数レベル(又は、変換係数レベルを右側に1だけシフトした値)の絶対値が(j<<1)+1より大きいか否かを示すフラグであり得る。前記rem_abs_gt1_flagはabs_level_gtx_flag[n][0]と同一及び/又は類似の機能を行うことができ、前記rem_abs_gt2_flagはabs_level_gtx_flag[n][1]と同一及び/又は類似の機能を行うことができる。前記(j<<1)+1は、場合によって、第1基準値、第2基準値などの所定の基準値に代替されてもよい。
【0090】
各シンタックス要素別の二進化方法は、下記の表3のようである。表3において、TRはトランケーティドライス(Truncated Rice)二進化方法を、FLは固定長 (Fixed-Length) 二進化方法を意味し、各二進化方法に関する詳細な説明は後述する。
【0091】
【表3】
【0092】
一実施形態において、トランケーティドライス二進化過程、0次Exp-Golomb二進化過程に対するパーシング過程、k次Exp-Golomb二進化過程、固定長二進化過程、abs_remainderに対する二進化過程、ライスパラメータ導出過程などは、例えば、下記のような英文スペック(spec)によって実現できる。
【0093】
1.トランケーティドライス二進化処理
【0094】
この過程の入力は、トランケーティドライス(TR)二進化に対する要求、cMax及びcRiceParamである。
【0095】
この過程の出力は、各symbolVal値を対応するビンストリングと関連させるTR二進化である。
【0096】
TRビンストリングは、プレフィックスビンストリングと、存在する場合、サフィックスビンストリングの連結である。
【0097】
プレフィックスビンストリングの導出のために、以下が適用される:
【0098】
-symbolVal、prefixValのプレフィックス値は次のように導出される:
【0099】
prefixVal = symbolVal >> cRiceParam(1)
【0100】
-TRビンストリングのプレフィクスは次のように具体化される:
【0101】
-もし、prefixValがcMax>>cRiceParamより小さい場合、プレフィクスビンストリングは、binIdxによりインデックスされた長さprefixVal+1のビットストリングである。prefixValより小さいbinIdxに対するビンは1に等しい。binIdxがprefixValに等しいビンは0である。表4は、prefixValの単項二進化のビンストリングを示す。
【0102】
-そうでないと、前記ビンストリングは、全てのビンが1に等しい、長さcMax>>cRiceParamのビットストリングである。
【0103】
【表4】
【0104】
cMaxがsymbolValより大きく、cRiceParamが0より大きい場合、TRビンストリングのサフィックスが現れ、これは次のように導出される:
【0105】
-サフィックス値suffixValは次のように導出される:
【0106】
suffixVal = symbolVal - ((prefixVal) << cRiceParam)(2)
【0107】
-TRビンストリングのサフィックスは、cMax値が(1<<cRiceParam)-1に等しいsuffixValに対して4節に明示された固定された長さ(FL)二進化の過程を呼び出すことにより明示される。
【0108】
NOTE:入力パラメータcRiceParam=0に対して、TR二進化は正確にトランケーティド単項二進化であり、これは、常にデコードされたシンタックス要素の最大可能値に等しいcMax値とともに呼び出される。
【0109】
2.0次Exp-Golomb二進化過程に対するパーシング過程
【0110】
ue(v)でコーディングされたシンタックス要素はExp-Golombでコーディングされる。このようなシンタックス要素に対するパーシング過程は、0でない1番目のビットまでのビットストリーム内の現在位置から開始するビットを判読し、0である先のビットの個数をカウントすることから始まる。この過程は次のように明示される:
【0111】
leadingZeroBits = -1
【0112】
for( b = 0; !b; leadingZeroBits++ )(3)
【0113】
b = read_bits(1)
【0114】
変数codeNumは次のように割り当てられる:
【0115】
codeNum = 2leadingZeroBits - 1 + read_bits(leadingZeroBits)(4)
【0116】
ここで、read_bits(leadingZeroBits)からリターンされる値は、最上位ビットが先に記録された符号なしの整数の二進表現と解釈される。
【0117】
表5は、ビットストリングを「プレフィックス」及び「サフィックス」に分離することによりExp-Golombコードの構造を示す。「プレフィックス」ビットはleadingZeroBitsの算出のために上記に明示されたようにパーシングされるビットであり、表5のビットストリング列において0又は1で表現されるビットである。「サフィックス」ビットはcodeNumの算出においてパーシングされるビットであって、表5においてxiと表示されるビットであり、iは0からleadingZeroBits-1の範囲にある。各xiは0又は1に等しい。
【0118】
【表5】
【0119】
表6は、codeNum値にビット列を割り当てることを明示的に示す。すなわち、Exp-Golombビットストリーム及びcodeNumは明示的な形式で表現され、ue(v)として使用される。
【0120】
【表6】
【0121】
ディスクリプタによって、シンタックス要素の値は次のように導出される:
【0122】
-もし、シンタックス要素がue(v)でコーディングされると、シンタックス要素の値はcodeNumに等しい。
【0123】
3.k次Exp-Golomb二進化過程
【0124】
この過程の入力は、k次Exp-Golomb(EGk)二進化に対する要求である。
【0125】
この過程の出力は、各symbolVal値を対応するビンストリングと関連させるEGk二進化である。
【0126】
各symbolVal値に対するEGk二進化過程のビンストリングは次のように明示され、ここで、Xが0又は1であるput(X)関数の各呼び出しはビンストリングの端部に二進値Xを追加する:
【0127】
absV = Abs( symbolVal )
【0128】
stopLoop = 0
【0129】
do
【0130】
if( absV >= ( 1 << k ) ) {
【0131】
put( 1 )
【0132】
absV = absV - ( 1 << k )
【0133】
k++
【0134】
} else {
【0135】
put( 0 )(5)
【0136】
while( k- - )
【0137】
put( ( absV >> k ) & 1 )
【0138】
stopLoop = 1
【0139】
【0140】
while( !stopLoop )
【0141】
NOTE:k次Exp-Golomb(EGk)コードに対するスペックは、2節に明示された0次Exp-Golombコードの単項部分に対して1と0を反対の意味で使用する。
【0142】
4.固定長二進化の過程
【0143】
この過程の入力は、固定長(FL)二進化及びcMaxに対する要求である。
【0144】
この過程の出力は、各symbolValを対応するビンストリングと関連させるFL二進化である。
【0145】
FL二進化は、シンボル値symbolValのfixedLengthビットの符号なし整数ビンストリングを使用して構成され、ここで、fixedLength=Ceil(Log2(cMax×1))である。FL二進化に対するビンのインデックシングは、binIdx=0と関連した最上位ビットから最下位のビットへ向かうbinIdxの値の増加のようであり得る。
【0146】
5.abs_remainderに対する二進化過程
【0147】
この過程の入力は、シンタックス要素abs_remainder[n]、カラーコンポーネントcIdx、ピクチャの左上端ルマサンプルに対する現在ルマ変換ブロックの左上端サンプルを明示するルマ位置(x0,y0)、現在係数スキャン位置(xC,yC)、変換ブロック幅の二進ログlog2TbWidth及び変換ブロック高さの二進ログlog2TbHeightに対する二進化に対する要求である。
【0148】
この過程の出力はシンタックス要素の二進化である。
【0149】
ライスパラメータcRiceParamは、カラーコンポーネントインデックスcIdx、ルマ位置(x0,y0)、変換ブロック高さlog2TbHeightの現在係数スキャン位置hmを入力にして6節に明示されたライスパラメータ導出過程を呼び出すことにより導出される。
【0150】
変数cMaxはcRiceParamから次のように導出される:
【0151】
cMax = ( cRiceParam = = 1 ? 6 : 7 ) << cRiceParam (6)
【0152】
シンタックス要素abs_remainder[n]の二進化は、プレフィックスビンストリング及び(存在する場合)サフィックスビンストリングの連結である。
【0153】
プレフィックスビンストリングの導出のために、以下が適用される:
【0154】
-abs_remainder[n]のプレフィックス値prefixValは次のように導出される:
【0155】
prefixVal = Min( cMax, abs_remainder[ n ] )(7)
【0156】
-プレフィックスビンストリングは、変数cMax及びcRiceParamを入力にするprefixValに対して1節に明示されたTR二進化の過程を呼び出すことにより明示される。
【0157】
-プレフィックスビンストリングが全てのビットが1である長さ4のビットストリングであるとき、サフィックスビンストリングが存在し、これは次のように導出される:
【0158】
-abs_remainder[n]のサフィックス値であるsuffixValは次のように導出される:
【0159】
suffixVal = abs_remainder[ n ] - cMax(8)
【0160】
-サフィックスビンストリングはExp-Golombの次数kがcRiceParam+1であるsuffixValの二進化に対して3節に明示されたk次EGk二進化の過程を呼び出して明示される。
【0161】
6.ライスパラメータ導出過程
【0162】
この過程の入力は、カラーコンポーネントcIdx、現在ピクチャの左上端サンプルに対する現在変換ブロックの左上端サンプルを明示するルマ位置(x0,y0)、現在係数スキャン位置(xC,yC)、変換ブロック幅の二進ログlog2TbWidth及び変換ブロック高さの二進ログlog2TbHeightである。
【0163】
この過程の出力はライスパラメータcRiceParamである。
【0164】
シンタックス要素sig_coeff_flag[x][y]及びコンポーネントインデックスがcIdxであり、左上端ルマ位置が(x0,y0)である変換ブロックに対するAbsLevel[x][C]アレイが与えられたとき、変数locSumAbsは次の疑似コードにより明示されたように導出される:
【0165】
locSumAbs = 0
【0166】
if( xC < (1 << log2TbWidth) - 1 ) {
【0167】
locSumAbs += AbsLevel[ xC + 1 ][ yC ] - sig_coeff_flag[ xC + 1 ][ yC ]
【0168】
if( xC < (1 << log2TbWidth) - 2 )
【0169】
locSumAbs += AbsLevel[ xC + 2 ][ yC ] - sig_coeff_flag[ xC + 2 ][ yC ]
【0170】
if( yC < (1 << log2TbHeight) - 1 )
【0171】
locSumAbs += AbsLevel[ xC + 1 ][ yC + 1 ] - sig_coeff_flag[ xC + 1 ][ yC + 1 ](9)
【0172】
【0173】
if( yC < (1 << log2TbHeight) - 1 ) {
【0174】
locSumAbs += AbsLevel[ xC ][ yC + 1 ] - sig_coeff_flag[ xC ][ yC + 1 ]
【0175】
if( yC < (1 << log2TbHeight) - 2 )
【0176】
locSumAbsPass1 += AbsLevelPass1 [ xC ][ yC + 2 ] - sig_coeff_flag[ xC ][ yC + 2 ]
【0177】
【0178】
ライスパラメータcRiceParmは次のように導出される:
【0179】
-もし、locSumAbsが12より小さいと、cRiceParmは0に設定される。;
【0180】
そうではなく、もし、locSumAbsが25より小さいと、cRiceParmは1のように設定される;
【0181】
-そうでないと(locSumAbsが25より大きいか等しい)、cRiceParamは2に設定される。
【0182】
図4は、一実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する一例を説明するための図である。
【0183】
図3の英文スペック6節に前述されているように、現在変換係数(図4の濃い陰影表示)に対する既に符号化された周辺5つの変換係数(図4の薄い陰影表示)のレベル和とsig_coeff_flagの値に基づいて現在スキャン位置の変換係数のためのライスパラメータを決定することができる。この場合、参照する変換係数の位置が変換ブロックの境界を超えるか否かを毎回確認する必要があり得る。すなわち、1つの変換係数レベルを符号化するたびに5回の境界確認過程が伴う。より具体的に、abs_remainderシンタックス要素符号化が必要な変換係数の5倍に達する境界確認過程が必要であるので、大きなレベル値を有する変換係数が多く発生する場合、演算の複雑度が増加する。
【0184】
ライスパラメータ導出過程で使用する参照変換係数のサイズに比例して演算の複雑度が増加するので、以下の実施形態においては、参照変換係数を5つ未満で使う方法を提案する。図5Aないし図5Cは、参照変換係数を4つ、3つ、2つ利用する場合を示し、各場合に対応する様々な参照変換係数の利用パターンを示す。図6Aないし図6Cは、1つの参照変換係数を用いる場合の様々な参照変換係数の利用パターンを示す。図5Aないし図6Cによる実施形態の目的は、参照変換係数の数を低減することにより演算の複雑度を減らすことにあるので、5つ未満の参照変換係数を用いる場合を全て含み、前述の実施形態に限定されない。
【0185】
図5Aないし図5Cは、一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出する他の一例を説明するための図である。
【0186】
図5Aは、現在変換係数に対する4つの周辺参照変換係数(図5Aの薄い陰影表示)に基づいてライスパラメータを導出する過程を説明するための図である。ライスパラメータを導出するために、途中で臨時合算係数を導出してもよい。臨時合算係数は、例えば、locSumAbsと示す。臨時合算係数(例えば、locSumAbs)の値は最初に0であり、各周辺参照変換係数を検出しながら前記臨時合算係数(例えば、locSumAbs)の値がアップデートされる。
【0187】
図5Aに示す4つの周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表7のようである。
【0188】
【表7】
【0189】
図5Bは、現在変換係数に対する3つの周辺参照変換係数(図5Bの薄い陰影表示)に基づいてライスパラメータを導出する過程を説明するための図である。図5Bに示す3つの周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表8のようである。
【0190】
【表8】
【0191】
図5Cは、現在変換係数に対する2つの周辺参照変換係数(図5Cの薄い陰影表示)に基づいてライスパラメータを導出する過程を説明するための図である。図5Cに示す2つの周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表9のようである。
【0192】
【表9】
【0193】
図6Aないし図6Cは、他の一部の実施形態によって周辺参照変換係数に基づいて現在変換係数に対するライスパラメータを導出するまた他の一例を説明するための図である。
【0194】
図6Aないし図6Cは、現在変換係数に対する1つの周辺参照変換係数(図6Aないし図6Cの薄い陰影表示)に基づいてライスパラメータを導出する過程を説明するための図である。図6Aは、現在変換係数の右側に位置する周辺参照変換係数を用いる過程を説明するための図であり、図6Bは、現在変換係数の右下側の対角線に位置する周辺参照変換係数を用いる過程を説明するための図であり、図6Cは、現在変換係数の下側に位置する周辺参照変換係数を用いる過程を説明するための図である。
【0195】
図6Aに示す右側周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表10のようである。
【0196】
【表10】
【0197】
図6Bに示す右下側対角線の周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表11のようである。
【0198】
【表11】
【0199】
図6Cに示す下側周辺参照変換係数に基づいて臨時合算係数(例えば、locSumAbs)の値をアップデートする過程は、例えば、下記の表12のようである。
【0200】
【表12】
【0201】
一実施形態においては、図3の英文スペック3節に開示されているように、locSumAbs値に基づいて次のスキャン位置の変換係数のためのライスパラメータを決定することができる。例えば、下記の数式5に基づいてライスパラメータを決定できる。
【0202】
【数1】
【0203】
または、例えば、下記の数式6に基づいてライスパラメータを決定できる。
【0204】
【数2】
【0205】
一実施形態において、数式6のth1とth2は数式5の12及び25よりそれぞれ小さい値であり得るが、実施形態がこれに限定されるものではない。
【0206】
一実施形態においては、参照する周辺参照変換係数の位置が変換ブロックの境界を超える場合、参照可能な位置の変換係数値を用いてライスパラメータを予測する方法、以前のライスパラメータが存在すると、以前のライスパラメータ値をアップデートせずにそのまま維持する方法、特定の初期値があると、前記特定の初期値に代替する方法などが利用できる。
【0207】
また、スキャン順序を決定する方法は、対角線スキャン(diagonal scan)方法に限定されず、係数スキャン方法が変形する場合、パターンが変形し得る。
【0208】
図7は、一実施形態によって2×2ブロックの量子化された係数を導出する過程を示す図である。
【0209】
一実施形態において、図7は、色差ブロックを符号化する過程で2×2サブブロックにおける量子化された係数の一例を示す。図7の逆対角線スキャンされる係数に対する符号化結果は、下記の表13のようである。表13においてscan_posは逆対角線スキャンによる係数の位置を示す。2×2ブロックにおいて1番目にスキャンされる、すなわち、右側下端コーナーの係数は、scan_posの値が3と表され、最後にスキャンされる、すなわち、左側上端コーナーの係数は、scan_posの値が0と表される。
【0210】
【表13】
【0211】
一実施形態において、色差ブロックの2×2サブブロックに対する符号化過程でシンタックス要素rem_abs_gt2_flagの個数が制限されることがある。表1に前述したように、2×2サブブロック単位の主要シンタックス要素は、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flag、abs_remainder、coeff_sign_flagなどを含む。このうち、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagは正規符号化エンジンを用いて符号化される文脈符号化ビンに関する情報を含み、abs_remainderとcoeff_sign_flagはバイパス符号化エンジンを利用して符号化されるバイパスビンに関する情報を含む。文脈符号化ビンは、以前のビンを処理しながらアップデートした確率状態と範囲を使用するため、高いデータ依存性を示す。すなわち、文脈符号化ビンは、現在ビンの符号化/復号が全て行われた後に次のビンの符号化/復号を行うことができるので、並列処理に困難があり得る。また、確率区間を読んで現在の状態を判断するのに多くの時間が必要になり得る。従って、一実施形態においては、文脈符号化ビンの数を減少させ、バイパスビンの数を増加させることにより、CABAC処理量を向上させる方法が提案される。
【0212】
一実施形態において、係数レベル情報は、逆スキャン順序で符号化される。すなわち、単位ブロックの右側下端の係数から左側上端方向にスキャンされた後に符号化される。一般に、逆スキャン順序において先にスキャンされる係数レベルは小さい値を有する傾向がある。このような係数に対して、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagを利用することにより、係数レベルを示すときに二進化したビンの長さを減少させることができ、各シンタックス要素は、定められた文脈に基づいて以前に符号化されたコンテキスト(context)に応じて算術符号化(arithmetic coding)により効率的に符号化されることができる。
【0213】
しかしながら、一部の大きな値を有する係数レベル、すなわち、単位ブロックの左側上端に位置する係数レベルである場合、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagを用いることが圧縮性能の向上に役立たない可能性もある。sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagを用いることが符号化効率を低下させる可能性もある。
【0214】
一実施形態においては、文脈符号化ビンで符号化されるシンタックス要素(sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flag)をバイパス符号化エンジンに基づいて符号化される、すなわち、バイパスビンで符号化されるabs_remainderシンタックス要素に迅速にスイッチングすることにより、文脈符号化ビン数を減少させることができる。
【0215】
一実施形態において、rem_abs_gt2_flagで符号化される係数の個数が制限されることができる。2×2ブロックにおいて最大に符号化できるrem_abs_gt2_flagの個数は4であり得る。すなわち、係数の絶対値が2より大きい全ての係数に対してrem_abs_gt2_flagが符号化されることができる。一例において、スキャンの順序に従って2より大きい絶対値を有する最初のN個の係数(すなわち、rem_abs_gt1_flagが1である係数)に対してのみrem_abs_gt2_flagを符号化することができる。Nは符号化器により選択されることもでき、0から4までの任意の値に設定されることもできる。符号器に本実施形態と類似する方法により輝度又は色差4×4サブブロックのための文脈符号化ビンが制限されるとき、このときに用いられる制限値に基づいてNを算出することもできる。Nを算出する方法としては、数式7のように輝度又は色差4×4サブブロックのための文脈符号化ビン制限値(N4×4)をそのまま使用するか、2×2サブブロック画素の数は4であるので、数式8によりNを算出することができる。ここで、aとbは定数を意味し、特定の値に限定されない。
【0216】
[数式7]
N = N4x4
【0217】
[数式8]
N = {N4×4 >> (4 - a)} + b
【0218】
これと同様に、サブブロックの横及び/又は縦サイズの値を用いてNを算出することもできる。サブブロックは正方形の形態であるので、横サイズの値と縦サイズの値が同一である。2×2サブブロックの横又は縦のサイズ値は2であるので、下記の数式9によりNを算出することができる。
【0219】
[数式9]
N = {N4×4 >> (a - 2)} + b
【0220】
下記の表14は、Nが1であるときの適用例を示す。2×2ブロックにおいてXと表示された分だけrem_abs_gt2_flagに対する符号化を減らすことができるので、これにより、文脈符号化ビンの数を減らすことができる。rem_abs_gt2_flagに対する符号化が行われないスキャン位置に対して係数のabs_remainder値は、表13と比較すると、変更される。
【0221】
【表14】
【0222】
一実施形態においては、色差ブロックの2×2サブブロック符号化においてsig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和を制限することができる。sig_coeff_flag、par_level_flag、rem_abs_gt1_flag個の和をKに制限するとき、Kは0から12の値を有する。一例において、sig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和がKを超えて符号化されないとき、rem_abs_gt2_flagも符号化されない可能性がある。
【0223】
Kは符号化器により選択されることができ、0から12までの任意の値に設定されることもできる。符号器に輝度又は色差4×4サブブロックのための文脈符号化ビンが制限される場合、このときに使用される制限値に基づいてKを算出することもできる。Kを算出する方法としては、下記の数式10のように輝度又は色差4×4サブブロックのための文脈符号化ビンの制限値(K4×4)をそのまま使用するか、2×2サブブロック画素の数は4であるので、数式11によりKを算出することができる。ここで、aとbは定数を意味し、特定の値に限定されない。
【0224】
[数式10]
K = K4x4
【0225】
[数式11]
K = {K4x4 >> (4 - a)} + b
【0226】
これと同様に、サブブロックの横/縦のサイズ値を用いてKを算出することもできる。サブブロックは正方形の形態であるので、横サイズの値と縦サイズの値が同一である。2×2サブブロックの横又は縦サイズの値は2であるので、数式12によりKを算出することができる。
【0227】
[数式12]
K = {K4×4 >> (a - 2)} + b
【0228】
下記の表15はKを6に制限した場合を示す。
【0229】
【表15】
【0230】
一実施形態において、色差ブロックの2×2サブブロック符号化においてsig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和と、rem_abs_gt2_flagの個数をそれぞれ制限することができる。すなわち、sig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和を制限する方法とrem_abs_gt2_flagの個数を制限する方法を結合することもできる。sig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和をKに制限し、rem_abs_gt2_flagの個数をNに制限するとき、Kは0から12の値を、Nは0から4の値を有することができる。
【0231】
KとNは、符号器で決定されることもでき、数式7ないし数式12に関連して説明された内容に基づいて算出されることもできる。
【0232】
下記の表16は、Kを6に、Nを1に制限した場合の例を示す。
【0233】
【表16】
【0234】
一実施形態において、par_level_flagとrem_abs_gt1_flagの符号化順序を変更する方法が用いられることができる。例えば、par_level_flag、rem_abs_gt1_flagの順に符号化せずに、rem_abs_gt1_flag、par_level_flagの順に符号化する方法が提案される。一例において、前記のような符号化順序の変更は、色差ブロックの2×2サイズのサブブロックを符号化するときに適用される。par_level_flagとrem_abs_gt1_flagの順序を変更すると、sig_coeff_flagの後にrem_abs_gt1_flagが符号化され、rem_abs_gt1_flagが1であるときにのみpar_level_flagが符号化される。従って、実際の変換係数値であるcoeffと各シンタックス要素の関係は下記の数式13のように変更される。
【0235】
[数式13]
| coeff | = sig_coeff_flag + rem_abs_gt1_flag + par_level_flag + 2 * (rem_abs_gt2_flag + abs_remainder)
【0236】
下記の表17を表2と比較すると、|coeff|が1である場合、par_leve_flagが符号化されないので、処理量及び符号化の面で表16による実施形態が利点を有する。もちろん、|coeff|が2である場合、表2とは異なって、rem_abs_gt2_flagが符号化される必要があり、|coeff|が4である場合、表2と異なって、abs_remainderが符号化される必要があるが、一般に、|coeff|が1である場合が|coeff|が2又は4である場合より多く発生するので、表17による方法が表2による方法に比べて高い処理量及び符号化性能を示す。一例において、図7のような4×4サブブロックを符号化した結果は、下記の表18のようである。
【0237】
【表17】
【0238】
【表18】
【0239】
一実施形態において、par_level_flagとrem_abs_gt1_flagの符号化順序を変更するものの、sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和を制限する方法が提供される。すなわち、sig_coeff_flag、rem_abs_gt1_flag、par_level_flag、rem_abs_gt2_flag、abs_remainder、coeff_sign_flagの順に符号化を行うとき、sig_coeff_flag、rem_bS_gt1_flag、par_leve_flagの数の和を制限する方法が提供される。sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和をKに制限するとき、Kは0から12の値を有する。Kは符号化器により選択されることもでき、0から12の任意の値に設定されることもできる。また、数式10ないし数式12に関連して前述の方法に基づいて算出されることができる。
【0240】
一実施形態において、sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagがそれ以上符号化されないとき、rem_abs_gt2_flagも符号化されない可能性がある。下記の表19はKが6である例を示す。
【0241】
【表19】
【0242】
一実施形態において、シンタックス要素sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagがシンタックス内の1つのforループ内で符号化できる。前記3つのシンタックス要素(sig_coeff_flag、rem_abs_gt1_flag、par_level_flag)の数の和がKを超えないものの、和がKと正確に一致しなくても同一のスキャン位置で符号化が中止されることができる。下記の表19はKが8である例を示す。スキャン位置2まで符号化を行ったとき、sig_coeff_flag、rem_abs_gt1_flag、par_level_flagの個数の和は6である。Kを超えない値であるが、このとき、符号化装置(又は符号器)において次のスキャン位置1(scan_pos=1)の係数レベルの値が分からないので、scan_pos=1で発生する文脈符号化ビンの数が1から3のいずれの値を有するか認知できないことがある。このとき、符号化装置は、scan_pos=2までのみ符号化し、符号化を終了することができる。従って、K値は異なるが、符号化結果は前記表19と下記の表20が同一であり得る。
【0243】
【表20】
【0244】
一実施形態において、par_level_flagとrem_abs_gt1_flagの符号化順序を変更するが、rem_abs_gt2_flagの個数を制限する方法が提供されることができる。すなわち、sig_coeff_flag、rem_abs_gt1_flag、par_level_flag、rem_abs_gt2_flag、abs_remainder、coeff_sign_flagの順に符号化を行うとき、rem_abs_gt2_flagで符号化される係数の和を制限する方法が提供される。一例において、2×2ブロック内で符号化されるrem_abs_gt2_flagの個数は4つであり得る。すなわち、係数の絶対値が2より大きい全ての係数に対してrem_abs_gt2_flagが符号化される。他の例において、スキャン順序に従って2より大きな絶対値を有する最初のN個の係数(すなわち、rem_abs_gt1_flagが1である係数)に対してのみrem_abs_gt2_flagを符号化することもできる。Nは符号化器により選択されることもでき、0から4までの任意の値に設定されることもできる。また、数式7ないし数式9に関連して前記説明した方法に基づいて算出されることもできる。
【0245】
表21は、Nが1であるときの例を示す。4×4ブロックにおいてXと表示された個数の分だけrem_abs_gt2_flagに対する符号化を減少させることができるので、これによって文脈符号化ビンの個数を減少させることができる。rem_abs_gt2_flagに対する符号化が行われないスキャン位置に対して係数のabs_remainder値が、表18と比較すると、下記の表21のように変更される。
【0246】
【表21】
【0247】
一実施形態において、par_level_flagとrem_abs_gt1_flagの符号化順序を変更するものの、sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和とrem_abs_gt2_flagの個数をそれぞれ制限する方法が提供される。すなわち、sig_coeff_flag、rem_abs_gt1_flag、par_level_flag、rem_abs_gt2_flag、abs_remainder、coeff_sign_flagの順に符号化を行うとき、sig_coeff_flag、 rem_abs_gt1_flag及びpar_level_flagの個数の和を制限する方法とrem_abs_gt2_flagの個数を制限する方法を結合することができる。sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和をKに制限し、rem_abs_gt2_flagの個数をNに制限するとき、Kは0から12の値を、Nは0から4の値を有する。KとNは符号化器により選択されることもでき、Kは0から12、Nは0から4までの任意の値に設定されることもできる。または、数式7ないし数式12に関して説明された内容に基づいて算出されることもできる。
【0248】
表22は、Kが6、Nが1である例を示す。
【0249】
【表22】
【0250】
一実施形態によって色差ブロックの2×2又は4×4サブブロック符号化においてsig_coeff_flag、par_level_flag及びrem_abs_gt1_flagの個数の和を制限する場合において、abs_remainderのためのゴロムコードを定義するのに用いられるライスパラメータの決定ステップを簡素化する方法が提供される。一実施形態において、図4を再び参照すると、現在変換係数(図4の濃い陰影表示)の既に符号化された周辺5つの変換係数(図4の薄い陰影表示)のレベル和とsig_coeff_flagに関する情報に基づいて現在スキャン位置の変換係数のためのライスパラメータを決定することができる。下記の表22は、図4に関連した擬似コード(pseudo code)を示す。下記の表23を参照すると、擬似コード上、参照する変換係数の位置が変換ブロックの境界を超えるか否かを毎回チェックしなければならないことが確認できる。すなわち、1つの変換係数レベルを符号化するたびに5回の境界確認過程が伴う必要がある。abs_remainderシンタックス要素に対する符号化においても、符号化が必要な対象の5倍に該当する分だけ変換係数の境界確認過程が必要であるので、大きなレベル値を有する変換係数が多く発生する場合、演算の複雑度が増加する。
【0251】
【表23】
【0252】
一実施形態によってライスパラメータを示すcRiceParamを導出する方法において、もし、locSumAbsが12より小さい場合、cRiceParamの値は0であり、locSumAbsが25より小さい場合、cRiceParamの値は1であり、locSumAbsの値が25以上である場合、cRiceParamの値は2であり得る。
【0253】
一実施形態において、sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和を制限する場合、abs_remainderは次の3つの場合によってそれぞれ異なるように決定される。sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和を制限する方法において、次の (i)、(ii)、(iii)によってサブブロックに様々なコーディングプロセスが適用される。(i)はsig_coeff_flag、par_level_flag、rem_abs_gt1_flag及びrem_abs_gt2_flagが全て存在する場合を示し、(ii)は sig_coeff_flag、par_level_flag及びrem_abs_gt1_flagのみが存在する場合を示し、(iii)はsig_coeff_flag、par_level_flag、rem_abs_gt1_flag及びrem_abs_gt2_flagが全て存在しない場合を示す。
【0254】
(i)の場合、実際の変換係数値であるcoeffとabs_remainderの関係は数式4にようであり、(ii)の場合は数式14のようであり、(iii)の場合は数式15のようである。
【0255】
[数式14]
| coeff | = sig_coeff_flag + par_level_flag + 2 * (rem_abs_gt1_flag + abs_remainder)
【0256】
[数式15]
| coeff | = abs_remainder
【0257】
ライスパラメータを導出する過程で使用される参照変換係数のサイズに比例して演算の複雑度が増加するので、一実施形態においては、色差ブロック符号化に限って4×4又は2×2サブブロックのスキャン順序下で直前のレベル値に基づいてライスパラメータを導出することができる。ここで、ライスパラメータは、サブブロックの開始段階でのみ0に初期化され、サブブロック内のabs_remainderを符号化する(i)、(ii)、(iii)の各段階ではライスパラメータを初期化しない。サブブロック符号化においてライスパラメータは直前のレベル値がth1、th2又はth3より大きいときに1ずつ増加する。本発明において、th1とth2は特定の値に限定されないが、一実施形態において、th1は1、2又は3に、th2は4、5又は6に、th3は10、11又は12に決定される。
【0258】
一実施形態によって色差ブロックの2×2又は4×4サブブロック符号化において、par_level_flagとrem_abs_gt1_flagの符号化順序を変更するものの、sig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagの個数の和を制限する場合において、rem_remainderのためのゴロムコードの定義に利用されるライスパラメータ決定ステップを簡素化する方法が提供される。
【0259】
par_level_flagとrem_abs_gt1_flagの符号化順序を変更する場合において、sig_coeff_flag、rem_abs_gt1_flag、par_level_flagの数の和を制限する場合、abs_remainderは次の3つの場合によってそれぞれ異なるように決定できる。sig_coeff_flag、rem_abs_gt1_flag、par_level_flagの個数の和を制限する方法によると、次の (i)、(ii)、(iii)が1つのサブブロックに関連してチェックされる。(i)は,sig_coeff_flag、rem_abs_gt1_flag、par_level_flag、及びrem_abs_gt2_flagが全て存在する場合であり、(ii)はsig_coeff_flag、rem_abs_gt1_flag及びpar_level_flagのみが存在する場合であり、(iii)は、sig_coeff_flag、rem_abs_gt1_flag、par_level_flag、及びrem_abs_gt2_flagが全て存在しない場合である。
【0260】
(i)の場合、実際の変換係数値であるcoeffとabs_remainderの関係は数式13のようであり、(ii)の場合は数式16のようであり、(iii)の場合は、数式15のようである。
【0261】
[数式16]
| coeff | = sig_coeff_flag + rem_abs_gt1_flag + par_level_flag + (2 * abs_remainder)
【0262】
ライスパラメータを導出する過程で使用する参照変換係数のサイズに比例して演算の複雑度が増加するので、一実施形態においては、色差ブロック符号化に限って4×4又は2×2サブブロックのスキャン順序下で直前のレベル値を用いてライスパラメータを導出する方法を提供することができる。ライスパラメータは、サブブロックの開始段階でのみ0に初期化され、サブブロック内のabs_remainderを符号化する(i)、(ii)、(ii)の各段階ではライスパラメータが初期化されない。サブブロック符号化において、ライスパラメータは直前のレベル値がth1、th2又はth3より大きいときに1ずつ増加する。本発明において、th1とth2は特定の値に限定されないが、一実施形態において、th1は1、2又は3に決定され、th2は4、5又は6に決定され、th3は10、11又は12に決定される。
【0263】
図8A及び図8Bは、一実施形態によるエントロピーエンコード部の構成及び動作方法を示す図である。
【0264】
実施形態によって0次ライスコードから最大2次ライスコードを使用することができ、前記ライスコードの次数はライスコードで表現されることができる。ライスコードの次数、すなわち、最大ライスパラメータの値を増加させると、大きな入力値が入力された場合より少ないビットを割り当てることができるため、利点を有する。下記の表24は、0次ライスコードから3次ライスコードまでのコードワードの長さを例示し、入力値が11より大きい場合、2次ライスコードより3次ライスコードで二進化することが結果コードワードの長さがより短いことが確認できる。従って、一実施形態では、変換係数レベル符号化において最大許容可能なライスコードの次数、すなわち、最大ライスコメータの値を増加させる方法が提供される。
【0265】
【表24】
【0266】
最大ライスパラメータが増加するにつれてライスパラメータをlocSumAbsに基づいて分類した数式6は、下記の数式17のように修正されることができる。数式17は、3次ライスコードまで使用する場合の例を示す。
【0267】
【数3】
【0268】
図8A及び図8Bを参照すると、エンコード装置(エントロピーエンコード部)240は、(量子化された)変換係数に対するレジデュアルコーディング手順を行うことができる。エンコード装置は、前述のように、現在ブロック(現在CB又は現在TB)内の(量子化された)変換係数をスキャン順序に従ってレジデュアルコーディングすることができる。エンコード装置は、例えば、表1に示すようなレジデュアル情報に関する様々なシンタックス要素を生成及びエンコードする。
【0269】
具体的に、エンコード装置は、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagなどをコーディングしながらabs_remainderに対する値を導出し、abs_remainderのためのライスパラメータを導出する(S800)。ライスパラメータは、前述のように周辺参照変換係数に基づいて導出される。より具体的に、現在スキャニング位置(の変換係数)のための前記ライスパラメータは、前述のlocSumAbsに基づいて導出されることができ、前記locSumAbsは、前記周辺参照変換係数のAbsLevel及び/又はsig_coeff_flagに基づいて導出されることができる。前記周辺参照変換係数の位置及び個数は、図4ないし図6Cにおいて前述した内容を含む。前記ライスパラメータ導出手順はエントロピーエンコード部240内のライスパラメータ導出部242により行われる。
【0270】
エンコード装置は、前記導出されたライスパラメータに基づいて前記abs_remainderの値に対する二進化を行う(S810)。前記二進化手順には、前記図3の説明に含まれた英文スペックの5節(Binarization process for abs_remainder)で前述した内容が適用されることができる。エンコード装置は、前記二進化手順により前記abs_remainderに対するビンストリング(bin string)を導出することができる。前記二進化手順は、エントロピーエンコード部240内の二進化部244により行われることができる。本発明によれば、前述したようにライスパラメータに基づいて、前記abs_remainderの値に対するビンストリングの長さが適応的に決定できる。例えば、前記表23に示すようにライスパラメータに基づいてコーディングしようとする値の長さが適応的に決定できる。本発明によれば、周辺参照変換係数に基づいて現在変換係数の前記abs_remainderの値に対するライスパラメータを導出することができ、これにより、前記現在変換係数の前記abs_remainderの値に対して固定されたライスパラメータを使用する時より相対的に短いビンストリングが適応的に割り当てられるようにする。
【0271】
前記ライスパラメータ導出手順は、ライスパラメータを使用せずにFLに基づいて二進化されるsig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagなどに対しては省略できることは当業者に自明である。前記sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagなどに対しては、ライスパラメータに基づいた二進化ではなく、前記図3に関する説明に含まれた英文スペックの4節(Fixed-length binarization process)による二進化が行われることができる。
【0272】
エンコード装置は、前記abs_remainderに対するビンストリングに基づいてエントロピーエンコードを行う(S820)。エンコード装置は、CABAC(context-adaptive arithmetic coding)又はCAVLC(context-adaptive variable length coding)などのエントロピーコーディング技法に基づいて前記ビンストリングをコンテキストに基づいてエントロピーエンコードすることができ、その出力はビットストリームに含まれることができる。前記エントロピーエンコード手順は、エントロピーエンコード部240内のエントロピーエンコード処理部244により行われる。前記ビットストリームは、前述したようにabs_remainderに関する情報を含むレジデュアル情報以外にも予測情報などの画像/ビデオデコーディングのための様々な情報を含むことができる。前記ビットストリームは、(デジタル)格納媒体又はネットワークを介してデコード装置に伝達される。
【0273】
図9A及び図9Bは、一実施形態によるエントロピーデコード部の構成及び動作方法を示す図である。
【0274】
図9A及び図9Bを参照すると、デコード装置(エントロピーデコード部)は、エンコードされたレジデュアル情報をデコードして(量子化された)変換係数を導出する。デコード装置は、前述したように現在ブロック(現在CB又は現在TB)に対するエンコードされたレジデュアル情報をデコードして(量子化された)変換係数を導出する。例えば、デコード装置は、表1に示すようなレジデュアル情報に関する様々なシンタックス要素をデコードし、関連シンタックス要素の値に基づいて前記(量子化された)変換係数を導出する。
【0275】
具体的に、デコード装置は、abs_remainderのためのライスパラメータを導出する(S900)。ライスパラメータ導出は、前述したように、周辺参照変換係数に基づいて行われることができる。具体的には、現在スキャニング位置(の変換係数)のための前記ライスパラメータは、前述のlocSumAbsに基づいて導出されることができ、前記locSumAbsは、前記周辺参照変換係数のAbsLevel及び/又はsig_coeff_flagに基づいて導出されることができる。前記周辺参照変換係数の位置及び個数は、図4ないし図6Cで前述した内容を含む。前記ライスパラメータ導出手順は、エントロピーデコード部310内のライスパラメータ導出部312によって行われる。
【0276】
デコード装置は、前記導出されたライスパラメータに基づいて前記abs_remainderに対する二進化を行う(S910)。前記二進化手順には、前記図3の説明に含まれる英文スペックの5節(Binarization process for abs_remainder)において前述した内容が適用される。デコード装置は、前記二進化手順により前記abs_remainderの利用可能な値に対する利用可能ビンストリングを導出する。前記二進化手順は、エントロピーデコード部310内の二進化部314により行われる。本発明によれば、前述したようにライスパラメータに基づいて、前記abs_remainderの値に対するビンストリングの長さが適応的に決定できる。例えば、前記表23に示すようにライスパラメータに基づいてコーディングしようとする値の長さが適応的に決定できる。本発明によれば、周辺参照変換係数に基づいて現在変換係数の前記abs_remainderの値に対するライスパラメータを導出することができ、これによって、前記現在変換係数の前記abs_remainderの値に対して固定されたライスパラメータを使用する時より相対的に短いビンストリングが適応的に割り当てられるようにする。
【0277】
デコード装置は、前記abs_remainderに対するエントロピーデコードを行う(S920)。デコード装置は、前記abs_remainderに対する各ビンを順次パーシング及びデコーディングしながら、導出されたビンストリングを前記利用可能ビンストリングと比較する。もし、導出されたビンストリングが前記利用可能ビンストリングのいずれか1つと同じであれば、当該ビンストリングに対応する値が前記abs_remainderの値として導出されることができる。もし、そうでない場合、前記ビットストリーム内の次のビットをさらにパーシング及びデコードした後、前記比較手順を行うことができる。このような過程によりビットストリーム内に特定の情報(特定のシンタックス要素)に対するスタートビットやエンドビットを使用しなくても可変長ビットを利用して当該情報をシグナリングすることができる。これによりデコード装置は、低い値に対しては相対的により少ないビットを割り当てることができ、全般的なコーディング効率を高めることができる。
【0278】
デコード装置は、CABAC又はCAVLCなどのエントロピーコーディング技法に基づいてビットストリームから前記ビンストリング内の各ビンをコンテキストに基づいてエントロピーデコードすることができる。前記エントロピーデコード手順は、エントロピーデコード部310内のエントロピーデコーディング処理部316により行われる。前記ビットストリームは、前述したようにabs_remainderに関する情報を含むレジデュアル情報以外にも予測情報などの画像/ビデオデコーディングのための様々な情報を含む。
【0279】
前記ライスパラメータ導出手順は、ライスパラメータを使用せずにFLに基づいて二進化されるsig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagなどに対しては省略できることは当業者に自明である。前記sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flagなどに対して、ライスパラメータに基づいた二進化ではない前記図3に関する説明に含まれた英文スペックの4節(Fixed-length binarization process)による二進化が行われることができる。
【0280】
前記ビットストリームは、前述したようにabs_remainderに関する情報を含むレジデュアル情報以外にも予測情報などの画像/ビデオデコーディングのための様々な情報を含む。前記ビットストリームが(デジタル)格納媒体又はネットワークを介してデコード装置に伝達できることは前述の通りである。
【0281】
デコード装置は、前記(量子化された)変換係数に基づいて逆量子化及び/又は逆変換手順を行って現在ブロックに対するレジデュアルサンプルを導出する。前記レジデュアルサンプル及びインター/イントラ予測により導出された予測サンプルに基づいて復元サンプルが生成され、前記復元サンプルを含む復元ピクチャが生成されることは前述の通りである。
【0282】
図10は、一実施形態によるエンコード装置のエントロピーエンコード方法を示すフローチャートである。
【0283】
図8Aで前述したS810ないしS820は、図10のS1040に含まれてもよい。
【0284】
S1000は、エンコード装置のインター予測部221又はイントラ予測部222により行われ、S1010、S1020、S1030及びS1040は、それぞれエンコード装置の減算部231、変換部232、量子化部233及びエントロピーエンコード部240により行われる。
【0285】
一実施形態によるエンコード装置は、現在ブロックに対する予測により予測サンプルを導出する(S1000)。エンコード装置は、現在ブロックにインター予測を行うかイントラ予測を行うかを決定し、具体的なインター予測モード又は具体的なイントラ予測モードをRDコストに基づいて決定する。決定されたモードに応じて、エンコード装置は前記現在ブロックに対する予測サンプルを導出する。
【0286】
一実施形態によるエンコード装置は、前記現在ブロックに対する原本サンプルと前記予測サンプルを比較してレジデュアルサンプルを導出する(S1010)。
【0287】
一実施形態によるエンコード装置は、前記レジデュアルサンプルに対する変換手順により変換係数を導出し(S1020)、前記導出された変換係数を量子化して量子化された変換係数を導出する(S1030)。
【0288】
一実施形態によるエンコード装置は、予測情報及びレジデュアル情報を含む画像情報をエンコードし、エンコードされた画像情報をビットストリームの形態で出力する(S1040)。前記予測情報は、前記予測手順に関する情報であって、予測モード情報、動き情報に関する情報(例えば、インター予測が適用される場合)などを含む。前記レジデュアル情報は、前記量子化された変換係数に関する情報であって、例えば、前述の表1に開示された情報を含む。
【0289】
出力されたビットストリームは、格納媒体又はネットワークを介してデコード装置に伝達される。
【0290】
図11は、一実施形態によるデコード装置のエントロピーデコード方法を示すフローチャートである。
【0291】
図9で前述したS910ないしS920は、図11のS1110に含まれてもよい。
【0292】
S1100は、デコード装置のインター予測部260又はイントラ予測部265により行われる。S1100でビットストリームに含まれた予測情報をデコードして関連シンタックス要素の値を導出する手順は、エンコード装置のエントロピーデコード部310により行われる。S1110、S1120、S1130、S1140は、それぞれデコード装置のエントロピーデコード部210、逆量子化部220、逆変換部230、加算部235により行われる。
【0293】
一実施形態によるデコード装置は、前記エンコード装置で行われた動作と対応する動作を行うことができる。デコード装置は、受信された予測情報に基づいて現在ブロックに対するインター予測又はイントラ予測を行い、予測サンプルを導出する(S1100)。
【0294】
一実施形態によるデコード装置は、受信されたレジデュアル情報に基づいて前記現在ブロックに対する量子化された変換係数を導出する(S1110)。
【0295】
一実施形態によるデコード装置は、量子化された変換係数を逆量子化して変換係数を導出する(S1120)。
【0296】
一実施形態によるデコード装置は、前記変換係数に対する逆変換手順によりレジデュアルサンプルを導出する(S1130)。
【0297】
一実施形態によるデコード装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成する(S1340)。その後、前記復元ピクチャにインループフィルタリング手順がさらに適用できることは前述の通りである。
【0298】
図12は、一実施形態によるエンコード装置の動作を示すフローチャートであり、図13は、一実施形態によるエンコード装置の構成を示すブロック図である。
【0299】
図12及び図13によるエンコード装置は、図14及び図15によるデコード装置と対応する動作を行うことができる。従って、図14及び図15において後述されるデコード装置の動作は、図12及び図13によるエンコード装置にも同様に適用できる。
【0300】
図12に開示された各ステップは、図2に開示されたエンコード装置200により行われる。より具体的に、S1200は図2に開示された減算部231により行われ、S1210は図2に開示された変換部232により行われ、S1220は図2に開示された量子化部233により行われ、S1230は図2に開示されたエントロピーエンコード部240により行われる。また、S1200ないしS1230による動作は、図4ないし図11で前述された内容の一部に基づいたものである。従って、図2及び図4ないし図11において前述した内容と重複する具体的な内容は説明を省略するか簡略にする。
【0301】
図13に示すように、一実施形態によるエンコード装置は、減算部231、変換部232、量子化部233及びエントロピーエンコード部240を含む。しかしながら、場合によっては、図13に図示された構成要素の全てがエンコード装置の必須構成要素ではない場合があり、エンコード装置は図13に示す構成要素より多い又は少ない構成要素により実現されてもよい。
【0302】
一実施形態に従ったエンコード装置において、減算部231、変換部232、量子化部233及びエントロピーエンコード部240は、それぞれ別途のチップで実現されるか、少なくとも2つ以上の構成要素が1つのチップにより実現されることもできる。
【0303】
一実施形態によるエンコード装置は、現在ブロックに対するレジデュアルサンプルを導出する(S1200)。より具体的に、エンコード装置の減算部231は、現在ブロックに対するレジデュアルサンプルを導出する。
【0304】
一実施形態によるエンコード装置は、現在ブロックに対するレジデュアルサンプルを変換して変換係数を導出する(S1210)。より具体的に、エンコード装置の変換部232は、現在ブロックに対するレジデュアルサンプルを変換して変換係数を導出する。
【0305】
一実施形態によるエンコード装置は、量子化過程に基づいて変換係数から量子化された変換係数を導出する(S1220)。より具体的に、エンコード装置の量子化部233は、量子化過程に基づいて変換係数から量子化された変換係数を導出する。
【0306】
一実施形態によるエンコード装置は、量子化された変換係数に関する情報を含むレジデュアル情報をエンコードする(S1230)。より具体的に、エンコード装置のエントロピーエンコード部240は、量子化された変換係数に関する情報を含むレジデュアル情報をエンコードする。
【0307】
一実施形態において、前記レジデュアル情報は変換係数レベル情報を含み、前記レジデュアル情報をエンコードするステップは、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程(binarization process)を行って前記変換係数レベル情報の二進化値(binarization value)を導出するステップと、前記変換係数レベル情報の前記二進化値をエンコードするステップとを含む。一例において、前記ライスパラメータはcRiceParamと表示される。
【0308】
一実施形態において、前記ライスパラメータの最大値は3であり得る。一例において、cRiceParamの最大値は3であり得る。
【0309】
一実施形態において、前記現在ブロックに含まれた現在サブブロックに対する少なくとも1つのライスパラメータを導出するために初期化過程が行われる。
【0310】
一実施形態において、前記現在サブブロック内の現在変換係数に対するライスパラメータは、前記現在変換係数の以前の順序の変換係数に対する以前ライスパラメータに基づいて導出され、前記現在変換係数が前記現在サブブロックの1番目の変換係数である場合、前記以前の順序の変換係数に対する前記以前ライスパラメータの値は0であり得る。一例において、前記以前ライスパラメータはlastRiceParamと表示される。一例において、前記現在サブブロックのサイズは2×2又は4×4であり得る。
【0311】
一実施形態において、前記現在変換係数に対するライスパラメータは、前記現在変換係数の周辺参照変換係数に基づいて導出され、前記周辺参照変換係数の個数は4つ以下であり得る。
【0312】
一実施形態において、前記周辺参照変換係数に基づいて臨時合算係数が導出され、前記臨時合算係数の値が第1臨界値より小さい場合、前記ライスパラメータの値は0と決定され、前記臨時合算係数の値が前記第1臨界値以上で第2臨界値より小さい場合、前記ライスパラメータの値は1と決定され、前記臨時合算係数の値が前記第2臨界値以上で第3臨界値より小さい場合、前記ライスパラメータの値は2と決定され、前記臨時合算係数の値が前記第3臨界値以上である場合、前記ライスパラメータの値は3と決定される。一例において、前記臨時合算係数はlocSumAbsと表示することができる。
【0313】
一実施形態において、前記第1臨界値は1、2又は3であり、前記第2臨界値は4、5又は6であり、前記第3臨界値は10、11又は12であり得る。一例において、前記第1臨界値はth1と表示し、前記第2臨界値はth2と表示し、前記第3臨界値はth3と表示する。
【0314】
図12及び図13のエンコード装置及びエンコード装置の動作方法によれば、エンコード装置は、現在ブロックに対するレジデュアルサンプルを導出し(S1200)、前記現在ブロックに対する前記レジデュアルサンプルを変換して変換係数を導出し(S1210)、量子化過程に基づいて前記変換係数から量子化された変換係数を導出し(S1220)、前記量子化された変換係数に関する情報を含むレジデュアル情報をエンコード(S1230)するものの、前記レジデュアル情報は変換係数レベル情報を含み、前記レジデュアル情報をエンコードするステップは、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程を行って前記変換係数レベル情報の二進化値を導出するステップと、前記変換係数レベル情報の前記二進化値をエンコードするステップとを含み、前記ライスパラメータの最大値は3であることを特徴とする。すなわち、ライスパラメータの最大値を3に設定してレジデュアルコーディングを効率的に行うことができる。
【0315】
図14は、一実施形態によるデコード装置の動作を示すフローチャートであり、図15は一実施形態によるデコード装置の構成を示すブロック図である。
【0316】
図14に開示された各ステップは、図3に開示されたデコード装置300により行われる。より具体的に、S1400ないしS1410は、図3に開示されたエントロピーデコード部310により行われ、S1420は図3に開示された逆量子化部321により行われ、S1430は逆変換部322により行われ、S1440は加算部340により行われる。また、S1400ないしS1440による動作は、図4ないし図11で前述された内容の一部に基づいたものである。従って、図3ないし図11で前述された内容と重複する具体的な内容は、説明を省略するか簡略にする。
【0317】
図15に示すように、一実施形態によるデコード装置は、エントロピーデコード部310、逆量子化部321、逆変換部322、及び加算部340を含む。しかしながら、場合によっては、図15に示す構成要素の全てがデコード装置の必須構成要素ではない場合があり、デコード装置は図15に示す構成要素より多い又は少ない構成要素により実現されてもよい。
【0318】
一実施形態によるデコード装置において、エントロピーデコード部310、逆量子化部321、逆変換部322、及び加算部340は、それぞれ別途のチップ(chip)で実現されるか、少なくとも2つ以上の構成要素が1つのチップにより実現されてもよい。
【0319】
一実施形態によるデコード装置は、レジデュアル情報を含むビットストリームを受信する(S1400)。より具体的に、デコード装置のエントロピーデコード部310は、レジデュアル情報を含むビットストリームを受信する。
【0320】
一実施形態によるデコード装置は、ビットストリームに含まれたレジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出する(S1410)。より具体的に、デコード装置のエントロピーデコード部310は、ビットストリームに含まれたレジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出する。
【0321】
一実施形態によるデコード装置は、逆量子化過程に基づいて量子化された変換係数から変換係数を導出する(S1420)。より具体的に、デコード装置の逆量子化部321は、逆量子化過程に基づいて量子化された変換係数から変換係数を導出する。
【0322】
一実施形態によるデコード装置は、導出された変換係数に逆変換を適用して現在ブロックに対するレジデュアルサンプルを導出する(S1430)。より具体的に、デコード装置の逆変換部322は、導出された変換係数に逆変換を適用して現在ブロックに対するレジデュアルサンプルを導出する。
【0323】
一実施形態によるデコード装置は、現在ブロックに対するレジデュアルサンプルに基づいて復元ピクチャを生成する(S1440)。より具体的に、デコード装置の加算部340は、現在ブロックに対するレジデュアルサンプルに基づいて復元ピクチャを生成する。
【0324】
一実施形態において、前記レジデュアル情報は変換係数レベル情報を含み、前記量子化された変換係数を導出するステップは、ライスパラメータ(rice parameter)に基づいて前記変換係数レベル情報に対する二進化(binarization)過程を行うステップと、前記二進化過程の結果に基づいて前記変換係数レベル情報の値を導出するステップと、前記変換係数レベル情報の前記値に基づいて前記量子化された変換係数を導出するステップとを含む。一例において、前記ライスパラメータは、cRiceParamと表示される。
【0325】
一実施形態において、前記ライスパラメータの最大値は3であり得る。一例において、cRiceParamの最大値は3であり得る。
【0326】
一実施形態において、前記現在ブロックに含まれる現在サブブロックに対する少なくとも1つのライスパラメータを導出するために初期化過程(initialization process)が行われる。
【0327】
一実施形態では、前記現在サブブロック内の現在変換係数に対するライスパラメータは、前記現在変換係数の以前の順序の変換係数に対する以前ライスパラメータ(rice parameter)に基づいて導出され、前記現在変換係数が前記現在サブブロックの1番目の変換係数である場合、前記以前の順序の変換係数に対する前記以前ライスパラメータの値は0であり得る。一例において、前記以前ライスパラメータはlastRiceParamと表示される。一例において、前記現在サブブロックのサイズは、2×2又は4×4であり得る。
【0328】
一実施形態において、前記現在変換係数に対するライスパラメータは、前記現在変換係数の周辺参照変換係数に基づいて導出され、前記周辺参照変換係数の個数は4つ以下であり得る。
【0329】
一実施形態において、前記周辺参照変換係数に基づいて臨時合算係数が導出され、前記臨時合算係数の値が第1臨界値(例えば、th1)より小さい場合、前記ライスパラメータの値は0と決定され、前記臨時合算係数の値が前記第1臨界値以上で第2臨界値(例えば、th2)より小さい場合、前記ライスパラメータの値は1と決定され、前記臨時合算係数の値が前記第2臨界値以上で前記第3臨界値(例えば、th3)より小さい場合、前記ライスパラメータの値は2と決定され、前記臨時合算係数の値が前記第3臨界値以上である場合、前記ライスパラメータの値は3と決定される。一例において、前記臨時合算係数はlocSumAbsと表示される。
【0330】
一実施形態において、前記第1臨界値は1、2又は3であり、前記第2臨界値は4、5又は6であり、前記第3臨界値は10、11又は12であり得る。一例において、前記第1臨界値はth1と表示され、前記第2臨界値はth2と表示され、前記第3臨界値はth3と表示される。
【0331】
図14及び図15に開示されたデコード装置及びデコード装置の動作方法によれば、デコード装置は、レジデュアル情報を含むビットストリームを受信し(S1400)、前記ビットストリームに含まれた前記レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出し(S1410)、逆量子化過程に基づいて前記量子化された変換係数から変換係数を導出し(S1420)、前記導出された変換係数に逆変換を適用して前記現在ブロックに対するレジデュアルサンプル導出し(S1430)、前記現在ブロックに対する前記レジデュアルサンプルに基づいて復元ピクチャを生成(S1440)するものの、前記レジデュアル情報は変換係数レベル情報を含み、前記量子化された変換係数を導出するステップは、ライスパラメータに基づいて前記変換係数レベル情報に対する二進化過程を行うステップと、前記二進化過程の結果に基づいて前記変換係数レベル情報の値を導出するステップと、前記変換係数レベル情報の前記値に基づいて前記量子化された変換係数を導出するステップとを含み、前記ライスパラメータの最大値は3であることを特徴とする。すなわち、ライスパラメータの最大値を3に設定してレジデュアルコーディングを効率的に行うことができる。
【0332】
前述した実施形態において、方法は、一連のステップ又はブロックとしてフローチャートに基づいて説明されているが、本発明は、ステップの順序に限定されるものではなく、あるステップは、前述とは異なるステップと異なる順序で又は同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、他のステップが含まれるか、フローチャートの1つ又はそれ以上のステップが本発明の範囲に影響を及ぼさずに削除できることが理解できるであろう。
【0333】
前述した本発明による方法は、ソフトウェアの形態で実現されてもよく、本発明によるエンコード装置及び/又はデコード装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの画像処理を行う装置に含まれてもよい。
【0334】
本発明において、実施形態がソフトウェアで実現されるとき、前述の方法は、前述の機能を行うモジュール(プロセス、機能など)で実現できる。モジュールは、メモリに格納され、プロセッサにより行われることができる。メモリは、プロセッサの内部又は外部に位置し、よく知られた様々な手段でプロセッサと接続される。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/又はデータ処理装置を含む。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/又は他の格納装置を含んでもよい。すなわち、本発明において説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で実現されて行われる。例えば、各図に示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で実現されて行われる。この場合、実現のための情報(例えば、information on instructions)又はアルゴリズムがデジタル格納媒体に格納されることができる。
【0335】
また、本発明が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTT(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、VR(virtual reality)装置、AR(argumente reality)装置、画像電話ビデオ装置、運送手段端末(例えは、車両(自律走行車両を含む)端末、飛行機端末、船舶端末など)及び医療用ビデオ装置などに含まれることができ、ビデオ信号及びデータ信号を処理するために使用できる。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などが含まれる。
【0336】
また、本発明が適用される処理方法は、コンピュータにより実行されるプログラムの形態で生産されることができ、コンピュータにより読み取りできる記録媒体に格納できる。本発明によるデータ構造を有するマルチメディアデータもまたコンピュータにより読み取りできる記録媒体に格納できる。前記コンピュータにより読み取りできる記録媒体は、コンピュータにより読み取りできるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータにより読み取りできる記録媒体は、例えば、ブルーレイディスク(BD)、ユニバーサル・シリアル・バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピー(登録商標)ディスク、及び光学データ格納装置を含むことができる。また、前記コンピュータにより読み取りできる記録媒体は、搬送波(例えば、インターネットを介する送信)の形態で実現されたメディアを含む。また、エンコード方法により生成されたビットストリームがコンピュータにより読み取りできる記録媒体に格納されるか、有線/無線通信ネットワークを介して送信できる。
【0337】
また、本発明の実施形態は、プログラムコードによるコンピュータプログラム製品として実現され、前記プログラムコードは、本発明の実施形態によりコンピュータにおいて行われる。前記プログラムコードは、コンピュータにより読み取りできるキャリア上に格納されることができる。
【0338】
図16は、本文書において開示された発明が適用できるコンテンツストリーミングシステムの例を示す。
【0339】
図16に示すように、本発明が適用されるコンテンツストリーミングシステムは、エンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置及びマルチメディア入力装置を含む。
【0340】
前記エンコードサーバは、スマートフォン、カメラ、ビデオカメラなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割を果たす。他の例として、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略されてもよい。
【0341】
前記ビットストリームは、本発明が適用されるエンコード方法又はビットストリーム生成方法により生成され、前記ストリームサーバは、前記ビットストリームを送信又は受信する過程で一時的に前記ビットストリームを格納することができる。
【0342】
前記ストリーミングサーバは、ウェブサーバを介するユーザ要求に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒体としての役割を果たす。ユーザが前記ウェブサーバに希望のサービスを要求すると、前記ウェブサーバはこれをストリーミングサーバに伝達し、前記ストリーミングサーバはユーザにマルチメディアデータを送信する。ここで、前記コンテンツストリーミングシステムは別途の制御サーバを含んでもよく、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たす。
【0343】
前記ストリーミングサーバは、メディア格納所及び/又はエンコードサーバからコンテンツを受信する。例えば、前記エンコードサーバからコンテンツを受信する場合、前記コンテンツをリアルタイムに受信できる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは前記ビットストリームを一定時間格納することができる。
【0344】
前記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(head mounted display))、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどを有することができる。
【0345】
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営でき、この場合、各サーバで受信するデータは分散処理されることができる。
図1
図2
図3
図4
図5A
図5B
図5C
図6A
図6B
図6C
図7
図8A
図8B
図9A
図9B
図10
図11
図12
図13
図14
図15
図16