特開2024-26721 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ エルジー　エレクトロニクス　インコーポレイティドの特許一覧

特開2024-26721選択的変換に基づいた映像コーディング方法およびその装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5A
5B
5C
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024026721

(43)【公開日】2024-02-28

(54)【発明の名称】選択的変換に基づいた映像コーディング方法およびその装置

(51)【国際特許分類】

H04N 19/12 20140101AFI20240220BHJP

H04N 19/46 20140101ALI20240220BHJP

H04N 19/593 20140101ALI20240220BHJP

H04N 19/176 20140101ALI20240220BHJP

【ＦＩ】

H04N19/12

H04N19/46

H04N19/593

H04N19/176

【審査請求】有

【請求項の数】3

【出願形態】ＯＬ

(21)【出願番号】P 2024002581

(22)【出願日】2024-01-11

(62)【分割の表示】P 2023005817の分割

【原出願日】2018-12-21

(31)【優先権主張番号】62/609,270

(32)【優先日】2017-12-21

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】502032105

【氏名又は名称】エルジーエレクトロニクスインコーポレイティド

【氏名又は名称原語表記】ＬＧＥＬＥＣＴＲＯＮＩＣＳＩＮＣ．

【住所又は居所原語表記】１２８，Ｙｅｏｕｉ－ｄａｅｒｏ，Ｙｅｏｎｇｄｅｕｎｇｐｏ－ｇｕ，０７３３６Ｓｅｏｕｌ，ＲｅｐｕｂｌｉｃｏｆＫｏｒｅａ

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100165191

【弁理士】

【氏名又は名称】河合章

(74)【代理人】

【識別番号】100114018

【弁理士】

【氏名又は名称】南山知広

(74)【代理人】

【識別番号】100159259

【弁理士】

【氏名又は名称】竹本実

(72)【発明者】

【氏名】メウディサレヒファー

(72)【発明者】

【氏名】キムスンファン

(72)【発明者】

【氏名】クムンモ

(72)【発明者】

【氏名】イムジェヒョン

(72)【発明者】

【氏名】シータルパルリ

(57)【要約】

【課題】映像コーディング効率を高める方法および装置を実現する。
【解決手段】本発明に従うデコード装置により行われる映像デコード方法は、ビットストリームに基づく変換係数に対する非分離変換に基づいて対象ブロックの残差サンプルを導出することを有し、予測サンプルはイントラ予測に基づいて導出され、６７個のイントラ予測モードのうちの１つは、予測サンプルを導出するのに使用され、６７個のイントラ予測モードは、２個の非角度性予測モードおよび６５個の角度性予測モードを有し、非分離変換は修正された基底ベクトルを有する変換行列に基づいて行われ、修正された基底ベクトルはＮ個の要素より少ない要素を有し、Ｎは対象ブロックで非分離変換が適用される領域に位置する変換係数の数に等しく、非分離変換が適用される領域は対象ブロックの８ｘ８左上段対象領域であり、Ｎは６４に等しい、ことを特徴とする。
【選択図】図１３

【特許請求の範囲】

【請求項1】

デコード装置により行われる映像デコード方法であって、
ビットストリームから対象ブロックの逆量子化された変換係数を導出するステップと、
前記逆量子化された変換係数に対する非分離変換（non-separable transform）に基づいて前記対象ブロックに対する１次変換係数を導出するステップと、
前記１次変換係数に対する分離変換（separable transform）に基づいて前記対象ブロックに対する残差サンプルを導出するステップと、
前記対象ブロックに対する前記残差サンプルおよび前記対象ブロックに対する予測サンプルに基づいて復元ピクチャを生成するステップと、を有し、
前記非分離変換は、変換行列（transform matrix）に基づいて行われ、
前記変換行列は、修正された基底ベクトルを有し、
前記修正された基底ベクトルのそれぞれは、Ｎ個の要素より少ない要素を有し、
Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する逆量子化された変換係数の数に等しく、
前記非分離変換が適用される領域は、前記対象ブロックにおける８ｘ８左上段対象領域であり、
Ｎは、６４に等しく、
前記修正された基底ベクトルの数は、Ｎより小さい、映像デコード方法。

【請求項2】

エンコード装置により行われる映像エンコード方法であって、
対象ブロックの残差サンプルを導出するステップと、
前記残差サンプルに対する分離変換（separable transform）に基づいて前記対象ブロックに対する１次変換係数を導出するステップと、
前記１次変換係数に対する非分離変換（non-separable transform）に基づいて前記対象ブロックに対する２次変換係数を導出するステップと、
前記２次変換係数に基づいて前記対象ブロックに対する量子化された変換係数を導出するステップと、
前記量子化された変換係数に関する情報をエンコードするステップと、を有し、
前記非分離変換は、変換行列（transform matrix）に基づいて行われ、
前記変換行列は、修正された基底ベクトルを有し、
前記修正された基底ベクトルのそれぞれは、Ｎ個の要素より少ない要素を有し、
Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する１次変換係数の数に等しく、
前記非分離変換が適用される領域は、前記対象ブロックにおける８ｘ８左上段対象領域であり、
Ｎは、６４に等しく、
前記修正された基底ベクトルの数は、Ｎより小さい、映像エンコード方法。

【請求項3】

映像に関するビットストリームを有するデータの送信方法であって、
前記映像に関するビットストリームを取得するステップであって、前記ビットストリームは、
対象ブロックの残差サンプルを導出するステップと、
前記残差サンプルに対する分離変換（separable transform）に基づいて前記対象ブロックに対する１次変換係数を導出するステップと、
前記１次変換係数に対する非分離変換（non-separable transform）に基づいて前記対象ブロックに対する２次変換係数を導出するステップと、
前記２次変換係数に基づいて前記対象ブロックに対する量子化された変換係数を導出するステップと、
前記量子化された変換係数に関する情報をエンコードするステップと、によって生成されるステップと、
前記ビットストリームを有する前記データを送信するステップと、を有し、
前記非分離変換は、変換行列（transform matrix）に基づいて行われ、
前記変換行列は、修正された基底ベクトルを有し、
前記修正された基底ベクトルのそれぞれは、Ｎ個の要素より少ない要素を有し、
Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する１次変換係数の数に等しく、
前記非分離変換が適用される領域は、前記対象ブロックにおける８ｘ８左上段対象領域であり、
Ｎは、６４に等しく、
前記修正された基底ベクトルの数は、Ｎより小さい、方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、映像コーディング技術に関し、より詳しくは、映像コーディングシステムにおける選択的変換に従う映像デコード方法および装置に関する。

【背景技術】

【0002】

最近、ＨＤ（High Definition）映像およびＵＨＤ（Ultra High Definition）映像のような高解像度、高品質の映像に対する需要が、多様な分野で増加している。映像データが高解像度、高品質になるほど、既存の映像データに比べて相対的に送信される情報量またはビット量が増加するため、既存の有無線広帯域回線のような媒体を利用して映像データを送信するか、または既存の記憶（格納）媒体を利用して映像データを記憶する場合、送信コスト（費用）および記憶コストが増加する。

【0003】

これによって、高解像度、高品質映像の情報を効果的に送信または記憶し、再生するために高効率の映像圧縮技術が要求される。

【発明の概要】

【発明が解決しようとする課題】

【0004】

本発明の技術的課題は、映像コーディング効率を高める方法および装置を提供することにある。

【0005】

本発明の他の技術的課題は、変換効率を高める方法および装置を提供することにある。

【0006】

本発明のさらに他の技術的課題は、変換を通じて残差（レジデュアル）コーディングの効率を高める方法および装置を提供することにある。

【0007】

本発明のさらに他の技術的課題は、選択的変換（selective transform）に基づいた映像コーディング方法および装置を提供することにある。

【課題を解決するための手段】

【0008】

本発明の一実施例によれば、デコード装置により行われる映像デコード方法が提供される。上記方法は、ビットストリームから対象ブロックの変換係数を導出するステップと、変換係数に対する選択的変換に基づいて対象ブロックに対する残差サンプルを導出するステップと、対象ブロックに対する残差サンプルおよび対象ブロックに対する予測サンプルに基づいて復元ピクチュアを生成するステップと、を有し、選択的変換は、修正された変換行列（マトリックス）に基づいて行われ、修正された変換行列は、修正された基底ベクトルを有する行列であり、修正された基底ベクトルは、Ｎ個の要素のうち、選択された特定個数の要素を有することを特徴とする。

【0009】

本発明の他の一実施例によれば、映像デコーディングを行うデコード装置が提供される。上記デコード装置は、ビットストリームから対象ブロックの変換係数を導出するエントロピデコード部と、変換係数に対する選択的変換（selective transform）に基づいて対象ブロックに対する残差サンプルを導出する逆変換部と、対象ブロックに対する残差サンプルおよび対象ブロックに対する予測サンプルに基づいて復元ピクチュアを生成する加算部と、を有し、選択的変換は、修正された（modified）変換行列（transform matrix）に基づいて行われ、修正された変換行列は、修正された基底ベクトルを有する行列であり、修正された基底ベクトルは、Ｎ個の要素のうち、選択された特定個数の要素を有することを特徴とする。

【0010】

本発明のさらに他の一実施例によれば、エンコード装置により行われるビデオエンコード方法を提供する。上記方法は、対象ブロックの残差サンプルを導出するステップと、残差サンプルに対する選択的変換（selective transform）に基づいて対象ブロックの変換係数を導出するステップと、変換係数に関する情報をエンコードするステップと、を有し、選択的変換は、修正された（modified）変換行列（transform matrix）に基づいて行われ、修正された変換行列は、修正された基底ベクトルを有する行列であり、修正された基底ベクトルは、Ｎ個の要素のうち、選択された特定個数の要素を有することを特徴とする。

【0011】

本発明のさらに他の一実施例によれば、ビデオエンコード装置を提供する。上記エンコード装置は、対象ブロックの残差サンプルを導出する加算部と、残差サンプルに対する選択的変換（selective transform）に基づいて対象ブロックの変換係数を導出する変換部と、変換係数に関する情報をエンコードするエントロピエンコード部と、を有し、選択的変換は、修正された（modified）変換行列（transform matrix）に基づいて行われ、修正された変換行列は、修正された基底ベクトルを有する行列であり、修正された基底ベクトルは、Ｎ個の要素のうち、選択された特定個数の要素を有することを特徴とする。

【発明の効果】

【0012】

本発明によれば、効率の良い変換を通じて残差処理のために転送されなければならないデータ量を減らすことができ、残差コーディング効率を高めることができる。

【0013】

本発明によれば、選択された特定個数の要素を含む基底ベクトルで構成された変換行列に基づいて非分離変換を行うことができ、これを通じて非分離変換のためのメモリ負荷（ロード）および計算複雑度を減らすことができ、残差コーディング効率を高めることができる。

【0014】

本発明によれば、単純化された構造の変換行列に基づいて非分離変換を行うことができ、これを通じて残差処理のために転送（送信）されなければならないデータ量を減らすことができ、残差コーディング効率を高めることができる。

【図面の簡単な説明】

【0015】

【図1】本発明が適用されることができるビデオエンコード装置の構成を概略的に説明する図である。

【図2】本発明が適用されることができるビデオデコード装置の構成を概略的に説明する図である。

【図3】本発明に従う多重変換（multiple transform）技法を概略的に示す図である。

【図4】６５個の予測方向のイントラ方向性モードを例示的に示す図である。

【図5A】本発明の一実施例に従う選択的変換（selective transform）を説明する図である。

【図5B】本発明の一実施例に従う選択的変換（selective transform）を説明する図である。

【図5C】本発明の一実施例に従う選択的変換（selective transform）を説明する図である。

【図6】上記選択的変換を２次変換に適用した多重変換技法を概略的に示す図である。

【図7】本発明の実施例に従う対象ブロックに基づいて変換係数の配列を説明する図である。

【図8】上記簡素化変換と上記選択的変換とが結合された変換を通じて変換係数を導出する一例を示す図である。

【図9】上記選択的変換を通じて変換係数を導出する一例を示す図である。

【図10】関連ベクトルに対する２つのファクタに基づいて、上記関連ベクトルを導出して選択的変換を行う一例を示す図である。

【図11】本発明に従うエンコード装置による映像エンコード方法を概略的に示す図である。

【図12】本発明に従う映像エンコード方法を行うエンコード装置を概略的に示す図である。

【図13】本発明に従うデコード装置による映像デコード方法を概略的に示す図である。

【図14】本発明に従う映像デコード方法を行うデコード装置を概略的に示す図である。

【発明を実施するための形態】

【0016】

本発明は、多様な変更を加えることができ、様々な実施例を有することができ、特定の実施例を図面に例示して詳細に説明する。しかしながら、これは、本発明を特定の実施例に限定するものではない。本明細書で使用する用語は、単に特定の実施例を説明するために使われたものであり、本発明の技術的思想を限定しようとする意図に使われるものではない。単数の表現は、文脈上明白に異なる意味でない限り、複数の表現を含む。本明細書において、“含む”または“有する”などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品またはそれらを組み合わせたものが存在することを指定するものであり、一つまたは複数の他の特徴や数字、ステップ、動作、構成要素、部品またはそれらを組み合わせたものの存在または付加の可能性を予め排除しないと理解しなければならない。

【0017】

一方、本発明で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立して図示されたものであり、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されることを意味しない。例えば、各構成のうちの二つ以上の構成が合わせられて一つの構成をなすこともあり、一つの構成が複数の構成に分けられることもある。各構成が統合および／または分離された実施例も、本発明の本質から外れない限り、本発明の権利範囲に含まれる。

【0018】

以下、添付図面を参照し、本発明の好ましい実施例をより詳細に説明する。以下、図面上の同一の構成要素については同一の参照符号を使用し、同一の構成要素について重複する説明は省略する。

【0019】

一方、本発明は、ビデオ／映像コーディングに関する。例えば、本発明で開示された方法／実施例は、ＶＶＣ（Versatile Video Coding）標準または次世代ビデオ／イメージコーディングに開示された方法に適用されることができる。

【0020】

本明細書において、ピクチャ（picture）は、一般的に特定の時間帯の一つの映像を示す単位を意味し、スライス（slice）は、コーディングにおいてピクチャの一部を構成する単位である。一つのピクチャは、複数のスライスで構成されてもよく、必要に応じて、ピクチャとスライスとは、互いに混用されてもよい。

【0021】

ピクセル（pixel）またはペル（pel）は、一つのピクチャ（または、映像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル（sample）」が使用されることができる。サンプルは、一般的にピクセルまたはピクセルの値を示し、輝度（ルマ）成分のピクセル／ピクセルの値のみを示してもよく、彩度（クロマ）成分のピクセル／ピクセルの値のみを示してもよい。

【0022】

ユニット（unit）は、映像処理の基本単位を示す。ユニットは、ピクチャの特定領域および該当領域に関する情報のうちの少なくとも一つを含むことができる。ユニットは、場合によってブロック（block）または領域（area）などの用語と混用されてもよい。一般的な場合、ＭｘＮのブロックは、Ｍ個の列およびＮ個の行からなるサンプルまたは変換係数（transform coefficient）の集合を示すことができる。

【0023】

図１は、本発明が適用されることができるビデオエンコード装置の構成を概略的に説明する図面である。

【0024】

図１を参照すると、ビデオエンコード装置１００は、ピクチャ分割部１０５、予測部１１０、残差（レジデュアル）処理部１２０、エントロピエンコード部１３０、加算部１４０、フィルタ部１５０、およびメモリ１６０を含むことができる。残差処理部１２０は、減算部１２１、変換部１２２、量子化部１２３、再整列部１２４、逆量子化部１２５、および逆変換部１２６を含むことができる。

【0025】

ピクチャ分割部１０５は、入力されたピクチャを少なくとも一つの処理ユニット（processing unit）に分割できる。

【0026】

一例として、処理ユニットは、コーディングユニット（Coding Unit、ＣＵ）と呼ばれる。この場合、コーディングユニットは、最大コーディングユニット（Largest Coding Unit、ＬＣＵ）からＱＴＢＴ（Quad-Tree Binary-Tree）構造によって再帰的に（recursively）分割されることができる。例えば、一つのコーディングユニットは、四分木（クアッドツリー）構造および／または二分木（バイナリツリー）構造に基づいて下位デプスの（deeper）複数のコーディングユニットに分割されることができる。この場合、例えば、四分木構造が先に適用され、二分木構造が後に適用されることができる。あるいは、二分木構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて、本発明によるコーディング手順が実行されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に（recursively）より下位デプスのコーディングユニットに分割されて最適なサイズのコーディングユニットが最終コーディングユニットとして使われることができる。ここで、コーディング手順とは、後述する予測、変換、および復元などの手順を含むことができる。

【0027】

他の例として、処理ユニットは、コーディングユニット（Coding Unit、ＣＵ）、予測ユニット（Prediction Unit、ＰＵ）または変換ユニット（Transform Unit、ＴＵ）を含むこともできる。コーディングユニットは、最大コーディングユニット（Largest Coding Unit、ＬＣＵ）から四分木構造によって下位デプスの（deeper）コーディングユニットに分割（split）されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に（recursively）より下位デプスのコーディングユニットに分割されて最適なサイズのコーディングユニットが最終コーディングユニットとして使われることができる。最小コーディングユニット（Smallest Coding Unit、ＳＣＵ）が設定された場合、コーディングユニットは、最小コーディングユニットより小さいコーディングユニットに分割されることができない。ここで、最終コーディングユニットとは、予測ユニットまたは変換ユニットにパーティショニングまたは分割される基盤となるコーディングユニットを意味する。予測ユニットは、コーディングユニットからパーティショニング（partitioning）されるユニットであって、サンプル予測のユニットである。このとき、予測ユニットは、サブブロック（subblock）に分けられることもできる。変換ユニットは、コーディングユニットから四分木構造によって分割されることができ、変換係数を導出（誘導）するユニットおよび／または変換係数から残差信号（residual signal）を導出するユニットである。以下、コーディングユニットはコーディングブロック（Coding Block、ＣＢ）、予測ユニットは予測ブロック（Prediction Block、ＰＢ）、変換ユニットは変換ブロック（Transform Block、ＴＢ）とも呼ばれる。予測ブロックまたは予測ユニットは、ピクチャ内におけるブロック形態の特定領域を意味し、予測サンプルのアレイ（array）を含むことができる。また、変換ブロックまたは変換ユニットは、ピクチャ内におけるブロック形態の特定領域を意味し、変換係数または残差サンプルのアレイを含むことができる。

【0028】

予測部１１０は、処理対象ブロック（以下、現（現在）ブロックという）に対する予測を実行し、上記現ブロックに対する予測サンプルを含む予測されたブロック（predicted block）を生成することができる。予測部１１０で実行される予測の単位は、コーディングブロック、または変換ブロック、または予測ブロックである。

【0029】

予測部１１０は、現ブロックにイントラ予測が適用されるか、またはインター予測が適用されるかを決定することができる。一例として、予測部１１０は、ＣＵ単位でイントラ予測またはインター予測のいずれが適用されるかを決定することができる。

【0030】

イントラ予測の場合、予測部１１０は、現ブロックが属するピクチャ（以下、現ピクチャ）内の現ブロックの外部の参照サンプルに基づいて、現ブロックに対する予測サンプルを導出することができる。このとき、予測部１１０は、（ｉ）現ブロックの隣接（neighboring）参照サンプルの平均（average）または補間（interpolation）に基づいて予測サンプルを導出することができ、（ｉｉ）現ブロックの隣接参照サンプルのうち、予測サンプルに対して特定（予測）方向に存在する参照サンプルに基づいて上記予測サンプルを導出することもできる。（ｉ）の場合は、非方向性モードまたは非角度モードと呼ばれ、（ｉｉ）の場合は、方向性（directional）モードまたは角度（angular）モードと呼ばれる。イントラ予測における予測モードは、例えば、３３個の方向性予測モードと少なくとも２個以上の非方向性モードとを有することができる。非方向性モードは、ＤＣ予測モードおよび平面（プラナー）モード（Ｐｌａｎａｒモード）を含むことができる。予測部１１０は、隣接ブロックに適用された予測モードを利用し、現ブロックに適用される予測モードを決定することもできる。

【0031】

インター予測の場合、予測部１１０は、参照ピクチャ上で動きベクトルにより特定されるサンプルに基づいて、現ブロックに対する予測サンプルを導出することができる。予測部１１０は、スキップ（skip）モード、マージ（merge）モード、およびＭＶＰ（Motion Vector Prediction）モードのうちのいずれか一つを適用して、現ブロックに対する予測サンプルを導出することができる。スキップモードおよびマージモードの場合、予測部１１０は、隣接ブロックの動き情報を現ブロックの動き情報として利用できる。スキップモードの場合、マージモードと違って予測サンプルとオリジナル（原本）サンプルとの間の差（残差）が送信されない。ＭＶＰモードの場合、隣接ブロックの動きベクトルを、動きベクトル予測子（Motion Vector Predictor）として利用し、現ブロックの動きベクトル予測子として利用して現ブロックの動きベクトルを導出することができる。

【0032】

インター予測の場合、隣接ブロックは、現ピクチャ内に存在する空間的隣接ブロック（spatial neighboring block）と参照ピクチャ（reference picture）に存在する時間的隣接ブロック（temporal neighboring block）とを含むことができる。上記時間的隣接ブロックを含む参照ピクチャは、コロケート（同一位置）ピクチャ（collocated Picture、ｃｏｌＰｉｃ）とも呼ばれる。動き情報（motion information）は、動きベクトルおよび参照ピクチャインデックスを含むことができる。予測モード情報および動き情報などの情報は、（エントロピ）エンコードされてビットストリーム形態で出力されることができる。

【0033】

スキップモードおよびマージモードで時間的隣接ブロックの動き情報が利用される場合、参照ピクチャリスト（reference picture list）上の最上位ピクチャが参照ピクチャとして利用されることもできる。参照ピクチャリスト（Picture Order Count）に含まれる参照ピクチャは、現ピクチャと該当参照ピクチャとの間のＰＯＣ（Picture Order Count）の差に基づいて整列されることができる。ＰＯＣは、ピクチャの表示順序に対応し、コーディング順序と区分されることができる。

【0034】

減算部１２１は、オリジナルサンプルと予測サンプルとの間の差である残差サンプルを生成する。スキップモードが適用される場合には、前述したように残差サンプルを生成しない。

【0035】

変換部１２２は、変換ブロック単位で残差サンプルを変換して変換係数（transform coefficient）を生成する。変換部１２２は、該当変換ブロックのサイズと、該当変換ブロックと空間的に重なるコーディングブロックまたは予測ブロックに適用された予測モードと、によって変換を実行することができる。例えば、上記変換ブロックと重なる上記コーディングブロックまたは上記予測ブロックにイントラ予測が適用され、上記変換ブロックが４×４の残差アレイ（array）である場合、残差サンプルは、ＤＳＴ（Discrete Sine Transform）変換カーネルを利用して変換され、その他の場合、残差サンプルは、ＤＣＴ（Discrete Cosine Transform）変換カーネルを利用して変換できる。

【0036】

量子化部１２３は、変換係数を量子化し、量子化された変換係数を生成することができる。

【0037】

再整列部１２４は、量子化された変換係数を再整列する。再整列部１２４は、係数スキャン（scanning）方法を介して、ブロック形態の量子化された変換係数を１次元ベクトル形態で再整列できる。ここで、再整列部１２４は、別途の構成で説明したが、量子化部１２３の一部であってもよい。

【0038】

エントロピエンコード部１３０は、量子化された変換係数に対するエントロピエンコーディングを実行することができる。エントロピエンコーディングは、例えば、指数ゴロム（exponential Golomb）、ＣＡＶＬＣ（Context-Adaptive Variable Length Coding）、ＣＡＢＡＣ（Context-Adaptive Binary Arithmetic Coding）などのエンコード方法を含むことができる。エントロピエンコード部１３０は、量子化された変換係数以外にビデオ復元に必要な情報（例えば、シンタックス要素（syntax element）の値など）を、共にまたは別途にエントロピエンコーディングまたは予め（既）設定された方法によってエンコードすることもできる。エンコードされた情報は、ビットストリーム形態でＮＡＬ（Network Abstraction Layer）ユニット単位で送信または記憶されることができる。

【0039】

逆量子化部１２５は、量子化部１２３で量子化された値（量子化された変換係数）を逆量子化し、逆変換部１２６は、逆量子化部１２５で逆量子化された値を逆変換して残差サンプルを生成する。

【0040】

加算部１４０は、残差サンプルと予測サンプルとを加算してピクチャを復元する。残差サンプルと予測サンプルとは、ブロック単位に加算されて、復元ブロックが生成されることができる。ここで、加算部１４０は、別途の構成で説明したが、予測部１１０の一部であってもよい。一方、加算部１４０は、復元部（reconstruction module）または復元ブロック生成部とも呼ばれる。

【0041】

復元されたピクチャ（reconstructed picture）に対してフィルタ部１５０は、デブロッキングフィルタおよび／またはサンプル適応オフセット（sample adaptive offset）を適用することができる。デブロックフィルタリングおよび／またはサンプル適応オフセットを介して、復元ピクチャ内のブロック境界のアーチファクトや量子化過程における歪曲が補正されることができる。サンプル適応オフセットは、サンプル単位に適用されることができ、デブロックフィルタリングの過程が完了した後に適用されることができる。フィルタ部１５０は、ＡＬＦ（Adaptive Loop Filter）を復元されたピクチャに適用することもできる。ＡＬＦは、デブロッキングフィルタおよび／またはサンプル適応オフセットが適用された後の復元されたピクチャに対して適用されることができる。

【0042】

メモリ１６０は、復元ピクチャ（デコードされたピクチャ）またはエンコーディング／デコーディングに必要な情報を記憶することができる。ここで、復元ピクチャは、上記フィルタ部１５０によるフィルタリング手順が完了した復元ピクチャである。上記記憶された復元ピクチャは、他のピクチャの（インター）予測のための参照ピクチャとして活用されることができる。例えば、メモリ１６０は、インター予測に使われる（参照）ピクチャを記憶することができる。このとき、インター予測に使われるピクチャは、参照ピクチャセット（reference picture set）または参照ピクチャリスト（reference picture list）により指定されることができる。

【0043】

図２は、本発明が適用されることができるビデオデコード装置の構成を概略的に説明する図面である。

【0044】

図２を参照すると、ビデオデコード装置２００は、エントロピデコード部２１０、残差処理部２２０、予測部２３０、加算部２４０、フィルタ部２５０、およびメモリ２６０を含むことができる。ここで、残差処理部２２０は、再整列部２２１、逆量子化部２２２、逆変換部２２３を含むことができる。

【0045】

ビデオ情報を含むビットストリームが入力されると、ビデオデコード装置２００は、ビデオエンコード装置でビデオ情報が処理されたプロセスに対応してビデオを復元することができる。

【0046】

例えば、ビデオデコード装置２００は、ビデオエンコード装置で適用された処理ユニットを利用してビデオデコーディングを実行することができる。したがって、ビデオデコーディングの処理ユニットブロックは、一例としてコーディングユニットであり、他の例としてコーディングユニット、予測ユニットまたは変換ユニットである。コーディングユニットは、最大コーディングユニットから四分木構造および／または二分木構造によって分割されることができる。

【0047】

予測ユニットおよび変換ユニットが場合によってさらに使用されることができ、この場合、予測ブロックは、コーディングユニットから導出またはパーティショニングされるブロックであって、サンプル予測のユニットである。このとき、予測ユニットは、サブブロックに分けられることもできる。変換ユニットは、コーディングユニットから四分木構造によって分割されることができ、変換係数を導出するユニットまたは変換係数から残差信号を導出するユニットである。

【0048】

エントロピデコード部２１０は、ビットストリームをパージングしてビデオ復元またはピクチャ復元に必要な情報を出力することができる。例えば、エントロピデコード部２１０は、指数ゴロム符号化、ＣＡＶＬＣまたはＣＡＢＡＣなどのコーディング方法に基づいてビットストリーム内の情報をデコードし、ビデオ復元に必要なシンタックスエレメントの値、残差に対する変換係数の量子化された値を出力することができる。

【0049】

より詳細には、ＣＡＢＡＣエントロピデコード方法は、ビットストリームで各シンタックス要素に該当するＢＩＮを受信し、デコーディング対象シンタックス要素情報ならびに隣接およびデコーディング対象ブロックのデコーディング情報または以前のステップでデコードされたシンボル／ＢＩＮの情報を利用してコンテキスト（context）モデルを決定し、決定されたコンテキストモデルによってＢＩＮの発生確率を予測してＢＩＮの算術復号（デコーディング）（arithmetic decoding）を実行することで、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、ＣＡＢＡＣエントロピデコード方法は、コンテキストモデルの決定後、次のシンボル／ＢＩＮのコンテキストモデルのために、デコードされたシンボル／ＢＩＮの情報を利用してコンテキストモデルをアップデートすることができる。

【0050】

エントロピデコード部２１０でデコードされた情報のうちの予測に関する情報は、予測部２３０に提供され、エントロピデコード部２１０でエントロピデコーディングが実行された残差値、すなわち、量子化された変換係数は、再整列部２２１に入力されることができる。

【0051】

再整列部２２１は、量子化されている変換係数を２次元のブロック形態で再整列できる。再整列部２２１は、エンコード装置で実行された係数スキャンに対応して再整列を実行することができる。ここで、再整列部２２１は、別途の構成で説明したが、逆量子化部２２２の一部であってもよい。

【0052】

逆量子化部２２２は、量子化されている変換係数を、（逆）量子化パラメータに基づいて逆量子化して変換係数を出力することができる。このとき、量子化パラメータを導出するための情報は、エンコード装置からシグナリングされることができる。

【0053】

逆変換部２２３は、変換係数を逆変換して残差サンプルを導出することができる。

【0054】

予測部２３０は、現ブロックに対する予測を実行し、上記現ブロックに対する予測サンプルを含む予測されたブロック（predicted block）を生成することができる。予測部２３０で実行される予測の単位は、コーディングブロック、または変換ブロック、または予測ブロックである。

【0055】

予測部２３０は、上記予測に関する情報に基づいて、イントラ予測を適用するか、またはインター予測を適用するかを決定することができる。このとき、イントラ予測およびインター予測のうちのいずれを適用するかを決定する単位と予測サンプルを生成する単位とは異なる。併せて、インター予測とイントラ予測とにおいて、予測サンプルを生成する単位も異なる。例えば、インター予測およびイントラ予測のうちのいずれを適用するかは、ＣＵ単位で決定されることができる。また、例えば、インター予測において、ＰＵ単位で予測モードを決定して予測サンプルを生成することができ、イントラ予測において、ＰＵ単位で予測モードを決定し、ＴＵ単位で予測サンプルを生成することもできる。

【0056】

イントラ予測の場合、予測部２３０は、現ピクチャ内の隣接参照サンプルに基づいて現ブロックに対する予測サンプルを導出することができる。予測部２３０は、現ブロックの隣接参照サンプルに基づいて方向性モードまたは非方向性モードを適用して、現ブロックに対する予測サンプルを導出することができる。このとき、隣接ブロックのイントラ予測モードを利用して、現ブロックに適用する予測モードが決定されることもできる。

【0057】

インター予測の場合、予測部２３０は、参照ピクチャ上で動きベクトルにより参照ピクチャ上で特定されるサンプルに基づいて、現ブロックに対する予測サンプルを導出することができる。予測部２３０は、スキップ（skip）モード、マージ（merge）モード、およびＭＶＰモードのうちのいずれか一つを適用して、現ブロックに対する予測サンプルを導出することができる。このとき、ビデオエンコード装置で提供された現ブロックのインター予測に必要な動き情報、例えば、動きベクトル、参照ピクチャインデックスなどに関する情報は、上記予測に関する情報に基づいて取得または導出されることができる。

【0058】

スキップモードおよびマージモードの場合、隣接ブロックの動き情報が現ブロックの動き情報として利用されることができる。このとき、隣接ブロックは、空間的隣接ブロックおよび時間的隣接ブロックを含むことができる。

【0059】

予測部２３０は、使用可能（可用）な隣接ブロックの動き情報でマージ候補リストを構成し、マージインデックスがマージ候補リスト上で指示する情報を現ブロックの動きベクトルとして使用することができる。マージインデックスは、エンコード装置からシグナリングされることができる。動き情報は、動きベクトルおよび参照ピクチャを含むことができる。スキップモードおよびマージモードで時間的隣接ブロックの動き情報が利用される場合、参照ピクチャリスト上の最上位ピクチャが参照ピクチャとして利用されることができる。

【0060】

スキップモードの場合、マージモードと違って予測サンプルとオリジナルサンプルとの間の差（残差）が送信されない。

【0061】

ＭＶＰモードの場合、隣接ブロックの動きベクトルを動きベクトル予測子（motion vector predictor）として利用して、現ブロックの動きベクトルが導出されることができる。このとき、隣接ブロックは、空間的隣接ブロックおよび時間的隣接ブロックを含むことができる。

【0062】

一例として、マージモードが適用される場合、復元された空間的隣接ブロックの動きベクトルおよび／または時間的隣接ブロックであるＣｏｌブロックに対応する動きベクトルを利用し、マージ候補リストが生成されることができる。マージモードでは、マージ候補リストから選択された候補ブロックの動きベクトルが現ブロックの動きベクトルとして使われる。上記予測に関する情報は、上記マージ候補リストに含まれている候補ブロックの中から選択された最適な動きベクトルを有する候補ブロックを指示するマージインデックスを含むことができる。このとき、予測部２３０は、上記マージインデックスを利用し、現ブロックの動きベクトルを導出することができる。

【0063】

他の例として、ＭＶＰ（Motion Vector Prediction）モードが適用される場合、復元された空間的隣接ブロックの動きベクトルおよび／または時間的隣接ブロックであるＣｏｌブロックに対応する動きベクトルを利用し、動きベクトル予測子候補リストが生成されることができる。すなわち、復元された空間的隣接ブロックの動きベクトルおよび／または時間的隣接ブロックであるＣｏｌブロックに対応する動きベクトルは、動きベクトル候補として使われることができる。上記予測に関する情報は、上記リストに含まれている動きベクトル候補の中から選択された最適な動きベクトルを指示する予測動きベクトルインデックスを含むことができる。このとき、予測部２３０は、上記動きベクトルインデックスを利用し、動きベクトル候補リストに含まれている動きベクトル候補の中から、現ブロックの予測動きベクトルを選択することができる。エンコード装置の予測部は、現ブロックの動きベクトルと動きベクトル予測子との間の動きベクトルの差分（ＭＶＤ）を求めることができ、これをエンコードしてビットストリーム形態で出力できる。すなわち、ＭＶＤは、現ブロックの動きベクトルから上記動きベクトル予測子を引いた値として求められる。このとき、予測部２３０は、上記予測に関する情報に含まれている動きベクトル差分を取得し、上記動きベクトル差分と上記動きベクトル予測子との加算を介して現ブロックの上記動きベクトルを導出することができる。また、予測部は、参照ピクチャを指示する参照ピクチャインデックスなどを上記予測に関する情報から取得または導出できる。

【0064】

加算部２４０は、残差サンプルと予測サンプルとを加算して現ブロックまたは現ピクチャを復元することができる。加算部２４０は、残差サンプルと予測サンプルとをブロック単位に加算して現ピクチャを復元することもできる。スキップモードが適用された場合には残差が送信されないため、予測サンプルが復元サンプルになることができる。ここで、加算部２４０は、別途の構成で説明したが、予測部２３０の一部であってもよい。一方、加算部２４０は、復元部（reconstruction module）または復元ブロック生成部とも呼ばれる。

【0065】

フィルタ部２５０は、復元されたピクチャにデブロックフィルタリングサンプル適応オフセット、および／またはＡＬＦなどを適用することができる。このとき、サンプル適応オフセットは、サンプル単位に適用されることができ、デブロックフィルタリング以後に適用されることもできる。ＡＬＦは、デブロックフィルタリングおよび／またはサンプル適応オフセット以後に適用されることもできる。

【0066】

メモリ２６０は、復元ピクチャ（デコードされたピクチャ）またはデコーディングに必要な情報を記憶することができる。ここで、復元ピクチャは、上記フィルタ部２５０によるフィルタリング手順が完了した復元ピクチャである。例えば、メモリ２６０は、インター予測に使われるピクチャを記憶することができる。このとき、インター予測に使われるピクチャは、参照ピクチャセットまたは参照ピクチャリストにより指定されることもできる。復元されたピクチャは、他のピクチャに対する参照ピクチャとして利用されることができる。また、メモリ２６０は、復元されたピクチャを出力順序によって出力することもできる。

【0067】

一方、前述した変換を通じて上記現ブロックの残差ブロックに対する低周波数（lower frequency）の変換係数が導出されることができ、上記残差ブロックの端にはゼロテール（zero tail）が導出されることができる。

【0068】

具体的には、上記変換は、２つの主要過程で構成されることができるところ、上記主要過程は、コア（変換）（core transform）および２次変換（secondary transform）を含むことができる。上記コア変換（core transform）および上記２次変換を含む変換は、多重変換技法と示されることができる。

【0069】

図３は、本発明に従う多重変換技法を概略的に示す。

【0070】

図３を参照すると、変換部は、前述した図１のエンコード装置内の変換部に対応することができ、逆変換部は、前述した図１のエンコード装置内の逆変換部または図２のデコード装置内の逆変換部に対応できる。

【0071】

変換部は、残差ブロック内の残差サンプル（残差サンプルアレイ）に基づいて１次変換を行って、（１次）変換係数を導出することができる（Ｓ３１０）。ここで、上記１次変換は、適応的マルチ（多重）コア変換（Adaptive Multiple core Transform、ＡＭＴ）を含むことができる。上記適応的マルチコア変換は、ＭＴＳ（Multiple Transform Set）と示されることができる。

【0072】

上記適応的マルチコア変換は、ＤＣＴ（Discrete Cosine Transform）タイプ２およびＤＳＴ（Discrete Sine Transform）タイプ７、ＤＣＴタイプ８、および／またはＤＳＴタイプ１を追加的に使用して変換する方式を示すことができる。すなわち、上記適応的マルチコア変換は、上記ＤＣＴタイプ２、上記ＤＳＴタイプ７、上記ＤＣＴタイプ８、および上記ＤＳＴタイプ１のうち、選択された複数の変換カーネルに基づいて、空間領域（ドメイン）の残差信号（または、残差ブロック）を周波数領域の変換係数（または、１次変換係数）に変換する変換方法を示すことができる。ここで、上記１次変換係数は、変換部の立場で一時（臨時）変換係数と称されることもできる。

【0073】

言い換えると、既存の変換方法が適用される場合、ＤＣＴタイプ２に基づいて残差信号（または、残差ブロック）に対する空間領域から周波数領域への変換が適用されて、変換係数が生成されることができる。これとは異なり、上記適応的マルチコア変換が適用される場合、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、および／またはＤＳＴタイプ１などに基づいて残差信号（または、残差ブロック）に対する空間領域から周波数領域への変換が適用されて、変換係数（または、１次変換係数）が生成されることができる。ここで、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、およびＤＳＴタイプ１などは、変換タイプ、変換カーネル（kernel）、または変換コア（core）と称されることができる。

【0074】

参考に、上記ＤＣＴ／ＤＳＴ変換タイプは、基底関数（basis functions）に基づいて定義されることができ、上記基底関数は、次の表の通り示すことができる。

【0075】

＜表１＞

【表1】

【0076】

上記適応的マルチコア変換が行われる場合、上記変換カーネルのうち、対象ブロックに対する垂直変換カーネルおよび水平変換カーネルが選択されることができ、上記垂直変換カーネルに基づいて上記対象ブロックに対する垂直変換が行われ、上記水平変換カーネルに基づいて上記対象ブロックに対する水平変換が行われることができる。ここで、上記水平変換は、上記対象ブロックの水平成分に対する変換を示すことができ、上記垂直変換は、上記対象ブロックの垂直成分に対する変換を示すことができる。上記垂直変換カーネル／水平変換カーネルは、残差ブロックを取り囲む（encompass）対象ブロック（ＣＵまたはサブブロック）の予測モードおよび／または変換サブセットを指し示す変換インデックスに基づいて適応的に決定されることができる。

【0077】

例えば、上記適応的マルチコア変換は、対象ブロックの幅（width）および高さ（height）が全て６４より小さいか等しい場合に適用されることができ、上記対象ブロックの上記適応的マルチコア変換が適用されるか否かは、ＣＵレベルフラグに基づいて決定できる。具体的には、上記ＣＵレベルフラグが０の場合、前述した既存の変換方法が適用されることができる。すなわち、上記ＣＵレベルフラグが０の場合、上記ＤＣＴタイプ２に基づいて残差信号（または、残差ブロック）に対する空間領域から周波数領域への変換が適用されて変換係数が生成されることができ、上記変換係数がエンコードされることができる。一方、ここで上記対象ブロックは、ＣＵでありえる。上記ＣＵレベルフラグが０の場合、上記適応的マルチコア変換が上記対象ブロックに適用されることができる。

【0078】

また、上記適応的マルチコア変換が適用される対象ブロックのルマブロックの場合、２つの追加的なフラグがシグナリングされることができ、上記フラグに基づいて垂直変換カーネルおよび水平変換カーネルが選択されることができる。上記垂直変換カーネルに関するフラグは、ＡＭＴ垂直フラグと示されることができ、ＡＭＴ＿ＴＵ＿ｖｅｒｔｉｃａｌ＿ｆｌａｇ（またはＥＭＴ＿ＴＵ＿ｖｅｒｔｉｃａｌ＿ｆｌａｇ）は、上記ＡＭＴ垂直フラグのシンタックス要素（syntax element）を示すことができる。上記水平変換カーネルに関するフラグは、ＡＭＴ水平フラグと示されることができ、ＡＭＴ＿ＴＵ＿ｈｏｒｉｚｏｎｔａｌ＿ｆｌａｇ（または、ＥＭＴ＿ＴＵ＿ｈｏｒｉｚｏｎｔａｌ＿ｆｌａｇ）は、上記ＡＭＴ水平フラグのシンタックス要素を示すことができる。上記ＡＭＴ垂直フラグは、上記垂直変換カーネルに対する変換サブセットに含まれる変換カーネル候補のうちの１つの変換カーネル候補を指し示すことができ、上記ＡＭＴ垂直フラグが指し示す変換カーネル候補は、上記対象ブロックに対する垂直変換カーネルとして導出されることができる。また、上記ＡＭＴ水平フラグは、上記水平変換カーネルに対する変換サブセットに含まれる変換カーネル候補のうちの１つの変換カーネル候補を指し示すことができ、上記ＡＭＴ水平フラグが指し示す変換カーネル候補は、上記対象ブロックに対する水平変換カーネルとして導出されることができる。一方、上記ＡＭＴ垂直フラグは、ＭＴＳ垂直フラグと示されることもでき、上記ＡＭＴ水平フラグは、ＭＴＳ水平フラグと示されることもできる。

【0079】

一方、３個の変換サブセットが予め設定されることができ、上記対象ブロックに適用されたイントラ予測モードに基づいて、上記変換サブセットのうちの１つが上記垂直変換カーネルに対する変換サブセットとして導出されることができる。また、上記対象ブロックに適用されたイントラ予測モードに基づいて、上記変換サブセットのうちの１つが上記水平変換カーネルに対する変換サブセットとして導出されることができる。例えば、上記予め設定された変換サブセットは、次の表の通り導出されることができる。

【0080】

＜表２＞

【表2】

【0081】

表２を参照すると、インデックス値が０である変換サブセットは、ＤＳＴタイプ７およびＤＣＴタイプ８を変換カーネル候補として含む変換サブセットを示すことができ、インデックス値が１である変換サブセットは、ＤＳＴタイプ７およびＤＳＴタイプ１を変換カーネル候補として含む変換サブセットを示すことができ、インデックス値が２である変換サブセットは、ＤＳＴタイプ７およびＤＣＴタイプ８を変換カーネル候補として含む変換サブセットを示すことができる。

【0082】

上記対象ブロックに適用されたイントラ予測モードに基づいて導出される上記垂直変換カーネルに対する変換サブセットおよび上記水平変換カーネルに対する変換サブセットは、次の表の通り導出できる。

【0083】

＜表３＞

【表3】

【0084】

ここで、Ｖは、上記垂直変換カーネルに対する変換サブセットを示し、Ｈは、上記水平変換カーネルに対する変換サブセットを示す。

【0085】

上記対象ブロックに対するＡＭＴフラグ（または、ＥＭＴ＿ＣＵ＿ｆｌａｇ）の値が１の場合、表３に図示したように、上記対象ブロックのイントラ予測モードに基づいて上記垂直変換カーネルに対する変換サブセットと上記水平変換カーネルに対する変換サブセットとが導出されることができる。この後、上記垂直変換カーネルに対する変換サブセットに含まれる変換カーネル候補のうち、上記対象ブロックのＡＭＴ垂直フラグが指し示す変換カーネル候補が上記対象ブロックの垂直変換カーネルとして導出されることができ、上記水平変換カーネルに対する変換サブセットに含まれる変換カーネル候補のうち、上記対象ブロックのＡＭＴ水平フラグが指し示す変換カーネル候補が上記対象ブロックの水平変換カーネルとして導出されることができる。一方、上記ＡＭＴフラグは、ＭＴＳフラグと示されることもできる。

【0086】

参考に、例えば、イントラ予測モードは、２つの非方向性（non-directional、または非角度性（non-angular））イントラ予測モードと６５個の方向性（directional、または角度性（angular））イントラ予測モードとを含むことができる。上記非方向性イントラ予測モードは、０番である平面（プランナー）（planar）イントラ予測モードと１番であるＤＣイントラ予測モードとを含むことができ、上記方向性イントラ予測モードは、２番乃至６６番の６５個のイントラ予測モードを含むことができる。ただし、これは例であって、本発明は、イントラ予測モードの数が異なる場合にも適用されることができる。一方、場合によって６７番イントラ予測モードがさらに使用されることができ、上記６７番イントラ予測モードは、ＬＭ（Linear Model）モードを示すことができる。

【0087】

図４は、６５個の予測方向のイントラ方向性モードを例示的に示す。

【0088】

図４を参照すると、左上向対角予測方向を有する３４番イントラ予測モードを中心として、水平方向性（horizontal directionality）を有するイントラ予測モードと垂直方向性（vertical directionality）を有するイントラ予測モードとを区分することができる。図４のＨおよびＶは、各々水平方向性および垂直方向性を意味し、－３２～３２の数字は、サンプルグリッドポジション（sample grid position）上で１／３２単位の変位を示す。２番乃至３３番イントラ予測モードは水平方向性、３４番乃至６６番イントラ予測モードは垂直方向性を有する。１８番イントラ予測モードおよび５０番イントラ予測モードは、各々水平イントラ予測モード（horizontal intra prediction mode）、垂直イントラ予測モード（vertical intra prediction mode）を示し、２番イントラ予測モードは左下向対角イントラ予測モード、３４番イントラ予測モードは左上向対角イントラ予測モード、６６番イントラ予測モードは右上向対角イントラ予測モード、と称されることができる。

【0089】

変換部は、上記（１次）変換係数に基づいて２次変換を行って（２次）変換係数を導出することができる（Ｓ３２０）。上記１次変換が空間領域から周波数領域への変換であったとすれば、上記２次変換は、周波数領域から周波数領域への変換と見ることができる。上記２次変換は、非分離変換（non-separable transform）を含むことができる。この場合、上記２次変換は、非分離２次変換（Non-Separable Secondary Transform、ＮＳＳＴ）またはＭＤＮＳＳＴ（Mode-Dependent Non-Separable Secondary Transform）と称されることができる。上記非分離２次変換は、上記１次変換を通じて導出された（１次）変換係数を非分離変換行列（non-separable transform matrix）に基づいて２次変換して残差信号に対する変換係数（または、２次変換係数）を生成する変換を示すことができる。ここで、上記非分離変換行列に基づいて上記（１次）変換係数に対して垂直変換および水平変換を分離して（または、水平垂直変換を独立して）適用せず、一度に変換を適用することができる。言い換えると、上記非分離２次変換は、上記非分離変換行列に基づいて上記（１次）変換係数の垂直成分および水平成分を分離せず、共に変換して変換係数（または、２次変換係数）を生成する変換方法を示すことができる。上記非分離２次変換は、（１次）変換係数で構成されたブロック（以下、変換係数ブロックまたは対象ブロックと称されることができる）の左上段（top-left）領域に対して適用されることができる。例えば、上記変換係数ブロックの幅（Ｗ）および高さ（Ｈ）が両方とも８以上である場合、８×８非分離２次変換が上記変換係数ブロックの左上段８×８領域（以下左上段対象領域）に対して適用できる。また、上記変換係数ブロックの幅（Ｗ）および高さ（Ｈ）が両方とも４以上で、かつ上記変換係数ブロックの幅（Ｗ）または高さ（Ｈ）が８より小さい場合、４×４非分離２次変換が上記変換係数ブロックの左上段ｍｉｎ（８、Ｗ）×ｍｉｎ（８、Ｈ）領域に対して適用されることができる。

【0090】

具体的には、例えば、４×４入力ブロックが使われる場合、非分離２次変換は、次の通り遂行できる。

【0091】

上記４×４入力ブロックＸは、次の通り示されることができる。

【0092】

＜数式１＞

【数1】

【0093】

上記Ｘをベクトル形態で示す場合、ベクトル

は、次の通り示されることができる。

【0094】

＜数式２＞

【数2】

【0095】

この場合、上記２次非分離変換は、次の通り計算できる。

【0096】

＜数式３＞

【数3】

【0097】

ここで、

は、変換係数ベクトルを示し、Ｔは、１６×１６（非分離）変換行列を示す。

【0098】

上記数式３を通じて１６×１変換係数ベクトル

が導出されることができ、上記

は、スキャン順序（水平、垂直、対角（diagonal）など）を通じて４×４ブロックに再構成される（re-organized）ことができる。ただし、前述した計算は例であって、非分離２次変換の計算複雑度を減らすためにＨｙＧＴ（Hypercube-Givens Transform）などが非分離２次変換の計算のために使われることもできる。

【0099】

一方、上記非分離２次変換において、モードに依存する（mode dependent）ように変換カーネル（または、変換コア、変換タイプ）が選択されることができる。ここで、モードは、イントラ予測モードおよび／またはインター予測モードを含むことができる。

【0100】

前述したように、上記非分離２次変換は、上記変換係数ブロックの幅（Ｗ）および高さ（Ｈ）に基づいて決定された８×８変換または４×４変換に基づいて遂行できる。すなわち、上記非分離２次変換は、８×８サブブロックサイズまたは４×４サブブロックサイズに基づいて行われることができる。例えば、上記モード依存変換カーネル選択のために、８×８サブブロックサイズおよび４×４サブブロックサイズ両方に対して、非分離２次変換のための３個ずつ３５セットの非分離２次変換カーネルが構成されることができる。すなわち、８×８サブブロックサイズに対して３５個の変換セットが構成され、４×４サブブロックサイズに対して３５個の変換セットが構成されることができる。この場合、８×８サブブロックサイズに対する３５個の変換セットには、各々、８×８変換カーネルが３個ずつ含まれることができ、この場合、４×４サブブロックサイズに対する３５個の変換セットには、各々、４×４変換カーネルが３個ずつ含まれることができる。ただし、上記変換サブブロックサイズ、上記セットの数、およびセット内の変換カーネルの数には、例として８×８もしくは４×４以外のサイズが使われることができ、またはｎ個のセットが構成され、各セット内にｋ個の変換カーネルが含まれることもできる。

【0101】

上記変換セットは、ＮＳＳＴセットと称されることができ、上記ＮＳＳＴセット内の変換カーネルは、ＮＳＳＴカーネルと称されることができる。上記変換セットのうち、特定セットの選択は、例えば、対象ブロック（ＣＵまたはサブブロック）のイントラ予測モードに基づいて遂行できる。

【0102】

この場合、上記３５個の変換セットと上記イントラ予測モードとの間のマッピング（mapping）は、例えば次の表の通り示されることができる。参考として、対象ブロックにＬＭモードが適用される場合、上記対象ブロックに対しては、２次変換が適用されないことがある。

【0103】

＜表４＞

【表4】

【0104】

一方、特定セットが使われると決定されれば、非分離２次変換インデックスを通じて上記特定セット内のｋ個の変換カーネルのうちの１つが選択されることができる。エンコード装置は、ＲＤ（Rate-Distortion）チェックに基づいて特定変換カーネルを指し示す非分離２次変換インデックスを導出することができ、上記非分離２次変換インデックスをデコード装置にシグナリングすることができる。デコード装置は、上記非分離２次変換インデックスに基づいて特定セット内のｋ個の変換カーネルのうちの１つを選択することができる。例えば、ＮＳＳＴインデックス値０は、最初の非分離２次変換カーネルを指し示すことができ、ＮＳＳＴインデックス値１は、２番目の非分離２次変換カーネルを指し示すことができ、ＮＳＳＴインデックス値２は、３番目の非分離２次変換カーネルを指し示すことができる。あるいは、ＮＳＳＴインデックス値０は、対象ブロックに対して最初の非分離２次変換が適用されないことを指し示すことができ、ＮＳＳＴインデックス値１乃至３は、上記３個の変換カーネルを指し示すことができる。

【0105】

また、図３を参照すると、変換部は、選択された変換カーネルに基づいて上記非分離２次変換を行い（２次）変換係数を獲得することができる。上記変換係数は、前述したように、量子化部を通じて量子化された変換係数として導出されることができ、エンコードされてデコード装置にシグナリングおよびエンコード装置内の逆量子化／逆変換部に伝達されることができる。

【0106】

一方、２次変換が省略される場合、上記１次（分離）変換の出力である（１次）変換係数は、前述したように、量子化部を通じて量子化された変換係数として導出されることができ、エンコードされてデコード装置にシグナリングおよびエンコード装置内の逆量子化／逆変換部に伝達されることができる。

【0107】

逆変換部は、前述した変換部で行われた手続きの逆順で一連の手続きを行うことができる。逆変換部は、（逆量子化された）変換係数を受信して、２次（逆）変換を行って、（１次）変換係数を導出し（Ｓ３５０）、上記（１次）変換係数に対して１次（逆）変換を行って残差ブロック（残差サンプル）を獲得することができる（Ｓ３６０）。ここで、上記１次変換係数は、逆変換部の立場で修正された（modified）変換係数と称されることができる。エンコード装置およびデコード装置は、上記残差ブロックおよび予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチュアが生成されることができることは、前述した通りである。

【0108】

一方、前述したように、２次（逆）変換が省略される場合、（逆量子化された）変換係数を受信して上記１次（分離）変換を行って残差ブロック（残差サンプル）を獲得することができる。エンコード装置およびデコード装置は、上記残差ブロックおよび予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチュアが生成されることができることは、前述した通りである。

【0109】

図５Ａから図５Ｃは、本発明の一実施例に従う選択的変換（selective transform）を説明する図である。

【0110】

本明細書において、“対象ブロック”は、コーディングが行われる現ブロックまたは残差ブロックを意味することができる。

【0111】

図５Ａは、変換を通じて変換係数を導出する一例を示す。

【0112】

ビデオコーディングにおける変換（transform）は、図５Ａに図示したように、入力ベクトルＲを変換行列（transform matrix）に基づいて変換して入力ベクトルＲに対する変換係数ベクトルＣを生成する過程を示すことができる。上記入力ベクトルＲは、１次変換係数を示すこともできる。あるいは、上記入力ベクトルＲは、残差ベクトル、すなわち、残差サンプルを示すこともできる。一方、上記変換係数ベクトルＣは、出力ベクトルＣと示されることもできる。

【0113】

図５Ｂは、変換を通じて変換係数を導出する具体的な例を示す。図５Ｂは、図５Ａに図示した変換過程を具体的に示す。図３で前述したように、非分離２次変換（以下、‘ＮＳＳＴ’という）において、１次変換を適用して獲得した変換係数のブロックデータをＭｘＭブロックに分割した後、各ＭｘＭブロックに対してＭ²ｘＭ² ＮＳＳＴが行われることができる。Ｍは、例えば４または８でありえるが、これに限定されない。上記Ｍ²はＮでありえる。この場合、図５Ｂに図示したように、上記入力ベクトルＲは、（１次）変換係数ｒ₁乃至ｒ_Nを含む（１ｘＮ）次元ベクトルでありえ、上記変換係数ベクトルＣは、変換係数ｃ₁乃至ｃ_Nを含む（Ｎｘ１）次元ベクトルでありえる。すなわち、上記入力ベクトルＲ、は、Ｎ個の（１次）変換係数ｒ₁乃至ｒ_Nを含むことができ、上記入力ベクトルＲのサイズは、１ｘＮでありえる。また、上記変換係数ベクトルＣは、Ｎ個の変換係数ｃ₁乃至ｃ_Nを含むことができ、上記変換係数ベクトルＣのサイズは、Ｎｘ１でありえる。

【0114】

上記変換係数ベクトルＣを導出するために、上記入力ベクトルＲは、上記変換行列を通過する（経る、go through）ことができる。すなわち、上記入力ベクトルＲは、上記変換行列に基づいて上記変換係数ベクトルＣとして導出されることができる。

【0115】

一方、上記変換行列は、Ｎ個の基底ベクトル（basis vectors）Ｂ₁乃至Ｂ_Nを含むことができる。図５Ｂ図示したように、上記基底ベクトルＢ₁乃至Ｂ_Nは、（１ｘＮ）次元ベクトルでありえる。すなわち、上記基底ベクトルＢ₁乃至Ｂ_Nのサイズは、１ｘＮでありえる。上記入力ベクトルＲの（１次）変換係数と上記変換行列の上記基底ベクトルの各々とに基づいて変換係数ベクトルＣが生成されることができる。例えば、上記入力ベクトルと各基底ベクトルとの内積（inner product）は、上記変換係数ベクトルＣとして導出できる。

【0116】

一方、前述した変換には、２つの主要な（メイン）問題（イシュー）（main issues）が発生する。具体的には、出力ベクトルを生成するために必要な掛け算および足し算の回数と関連して、高い計算複雑度と生成された係数を記憶するためのメモリ要求（memory requirement）とが主要な問題として発生し得る。

【0117】

例えば、分離変換（separable transform）および非分離変換（non separable transform）に必要な計算複雑度およびメモリ要求は、次の表の通り導出されることができる。

【0118】

＜表５＞

【表5】

【0119】

表５を参照すると、上記分離変換を通じて生成された係数を記憶するためのメモリは、Ｎ²を要求されることができ、上記計算回数は、２Ｎ³でありえる。上記計算回数は、計算複雑度を示す。また、上記非分離変換を通じて生成された係数を記憶（貯蔵）するためのメモリはＮ₄を要求されることができ、上記計算回数は、Ｎ₄でありえる。上記計算回数は、計算複雑度を示す。すなわち、上記計算回数が多いほど計算複雑度が高いことがあり、上記計算回数が少ないほど上記計算複雑度が低いことがある。

【0120】

上記表５に図示したように、上記分離変換と比較して上記非分離変換のためのメモリ要求および計算回数は、格段に増加できる。また、上記非分離変換が行われる対象ブロックのサイズが増加するほど、すなわち、上記Ｎが大きくなるほど、上記分離変換のためのメモリ要求および計算回数と上記非分離変換のためのメモリ要求および計算回数との間の不一致は、増加できる。

【0121】

上記非分離変換は、分離変換と比較してより良いコーディング利得（coding gain）を提供するが、上記表５に図示したように、上記非分離変換の計算複雑度のため、既存のビデオコーディング標準では、上記非分離変換が使われておらず、また、分離変換の計算複雑度も対象ブロックのサイズが大きくなるほど増加するので、既存のＨＥＶＣ標準では、上記分離変換がサイズが３２ｘ３２サイズ以下である対象ブロックのみで使われるように制限された。

【0122】

ここで、本発明は、選択的変換を提案する。上記選択的変換は、計算複雑度およびメモリ要求を格段に減らすことができ、これを通じて計算集約的な変換ブロックの効率性を増加させ、コーディング効率を向上させる効果を発生させることができる。すなわち、上記選択的変換は、サイズの大きいブロックの変換または非分離変換時に発生する演算複雑度（complexity）の問題を解消するために利用されることができる。上記選択的変換は、１次変換（または、コア（核心）変換（core transform）と称されることができる）、２次変換など、いかなるタイプ（類型）の変換にも利用できる。例えば、上記選択的変換は、エンコード装置／デコード装置に対する上記コア変換に適用されることができ、エンコーディング時間／デコーディング時間を格段に減らす効果を発生させることができる。

【0123】

図５Ｃは、上記選択的変換を通じて変換係数を導出する一例を示す。上記選択的変換は、選択的な個数の要素を含む基底ベクトルを含む変換行列に基づいて対象ブロックに対して行われる変換を意味することができる。

【0124】

簡素化変換には、変換行列の基底ベクトルのＮ個の要素のうち、重複するか、または重要でない要素が含まれることがあり、上記要素を除外して計算複雑度およびメモリ要求を減らすことができるという動機（motivation）を通じて提案された方式である。例えば、図５Ｃを参照すると、基底ベクトルＢ₁のＮ個の要素のうち、Ｚ₀個の要素は、重要でない要素であることがあり、この場合、Ｎ₁個の要素のみを含むトランケートされた（truncated）基底ベクトルＢ₁が導出されることができる。ここで、上記Ｎ₁は、Ｎ－Ｚ₀でありえる。上記トランケートされた基底ベクトルＢ₁は、修正された（modified）基底ベクトルＢ₁と示されることができる。

【0125】

図５Ｃを参照すると、上記入力ベクトルＲに上記修正された基底ベクトルＢ₁が変換行列の一部として適用される場合、変換係数Ｃ₁が導出されることができる。実験結果より、上記変換係数Ｃ₁は、上記入力ベクトルＲに既存の基底ベクトルＢ₁が変換行列の一部として適用されて導出される変換係数Ｃ₁と同一の値であることが観察される。すなわち、各基底ベクトルの微小な要素が０であると仮定して結果を導出することが、結果の大きい差無しで必要な掛け算の回数を格段に減らすことができることを意味する。また、次に、この演算のために記憶しなければならない要素（すなわち、変換行列の要素）の数を減らすことができる。

【0126】

基底ベクトルの要素のうち、重要（または、有意義）でない要素の位置を定義するために、関連ベクトル（association vector）が提案される。上記Ｎ₁次元の修正された基底ベクトルＢ₁を導出するために（１ｘＮ）次元の関連ベクトルＡ₁が考慮されることができる。すなわち、１ｘＮ₁サイズの修正された基底ベクトルＢ₁（すなわち、Ｎ₁個の要素を含む修正された基底ベクトルＢ₁）を導出するために１ｘＮサイズの関連ベクトルＡ₁が考慮されることができる。

【0127】

図５Ｃを参照すると、上記入力ベクトルＲに上記基底ベクトルＢ₁乃至Ｂ_Nの各々に対する関連ベクトルが適用されて導出された値が、上記基底ベクトルに伝達されることができる。これを通じて、上記入力ベクトルＲの一部の要素のみが、基底ベクトルの要素と計算されることができる。具体的には、上記関連ベクトルは、０および１を含むことができ、上記入力ベクトルＲの要素のうち、選択された要素には１が掛けられ、選択されていない要素には０が掛けられるように演算されて、上記選択された要素のみが通過して上記基底ベクトルに伝達されることができる。

【0128】

例えば、上記入力ベクトルＲに上記関連ベクトルＡ₁が適用されることができ、上記入力ベクトルＲの要素のうち、上記関連ベクトルＡ₁により指定されたＮ₁個の要素のみが、上記基底ベクトルＢ₁との内積を計算するのに使われることができる。上記内積は、上記変換係数ベクトルＣのＣ₁を示すことができる。ここで、上記基底ベクトルＢ₁は、Ｎ₁個の要素を含むことができ、上記Ｎ₁は、Ｎ以下でありえる。前述した上記入力ベクトルＲと関連ベクトルＡ₁および基底ベクトルＢ₁との演算は、関連ベクトルＡ₂乃至Ａ_Nおよび基底ベクトルＢ₂乃至Ｂ_Nに対しても行われることができる。

【0129】

上記関連ベクトルは、０および／または１、二進数値（binary values）のみを含むので、上記関連ベクトルを記憶するに当たって利点がありえる。上記関連ベクトルの０は、上記０に対する上記入力ベクトルＲの要素が上記内積計算のための変換行列に伝達されないことを示すことができ、上記関連ベクトルの１は、上記１に対する上記入力ベクトルＲの要素が上記内積計算のための上記変換行列に伝達されることを示すことができる。例えば、１ｘＮサイズの関連ベクトルＡ_kは、Ａ_k1乃至Ａ_kNを含むことができる。上記関連ベクトルＡ_kのＡ_knが０の場合、上記入力ベクトルＲのｒ_nは、通過できないことがある。すなわち、上記入力ベクトルＲのｒ_nは、上記変換ベクトルＢ_nに伝達されないことがある。また、上記Ａ_knが１の場合、上記入力ベクトルＲのｒ_nは、通過できる。すなわち、上記入力ベクトルＲのｒ_nは、上記変換ベクトルＢ_nに伝達されることができ、上記変換係数ベクトルＣのｃ_nを導出するための計算に使われることができる。

【0130】

図６は、上記選択的変換を２次変換に適用した多重変換技法を概略的に示す。

【0131】

図６を参照すると、変換部は、前述した図１のエンコード装置内の変換部に対応することができ、逆変換部は、前述した図１のエンコード装置内の逆変換部または図２のデコード装置内の逆変換部に対応できる。

【0132】

変換部は、残差ブロック内の残差サンプル（残差サンプルアレイ）に基づいて１次変換を行って、（１次）変換係数を導出することができる（Ｓ６１０）。ここで、上記１次変換は、前述したＡＭＴを含むことができる。

【0133】

上記適応的マルチコア変換が適用される場合、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、および／またはＤＳＴタイプ１などに基づいて残差信号（または、残差ブロック）に対する空間領域から周波数領域への変換が適用されて、変換係数（または、１次変換係数）が生成されることができる。ここで、上記１次変換係数は、変換部の立場で一時変換係数と称されることができる。また、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、およびＤＳＴタイプ１などは、変換タイプ、変換カーネル（kernel）または変換コア（core）と称されることができる。参考までに、上記ＤＣＴ／ＤＳＴ変換タイプは、基底関数（basis functions）に基づいて定義されることができ、上記基底関数は、前述した表１のように示すことができる。具体的には、上記適応的マルチコア変換を適用して上記１次変換係数を導出する過程は、前述した通りである。

【0134】

変換部は、上記（１次）変換係数に基づいて選択的変換を行って、（２次）変換係数を導出することができる（Ｓ６２０）。選択的変換は、修正された基底ベクトルを含む変換行列および上記基底ベクトルに対する関連ベクトルを含む関連行列（association matrix）に基づいて、対象ブロックに対する上記（１次）変換係数に対して行われる変換を意味することができる。上記修正された基底ベクトルは、Ｎ以下の要素を含む基底ベクトルを示すことができる。すなわち、上記修正された基底ベクトルは、Ｎ個の要素のうちの選択された特定個数の要素を含む基底ベクトルを示すことができる。例えば、修正された基底ベクトルＢ_nは、（１ｘＮ_n）次元ベクトルでありえ、上記Ｎ_nは上記Ｎより小さいか等しいことがある。すなわち、修正された基底ベクトルＢ_nのサイズは、（１ｘＮ_n）サイズでありえ、上記Ｎ_nは、上記Ｎより小さいか等しいことがある。ここで、上記Ｎは、上記選択された変換が適用される上記対象ブロックの左上段対象領域の高さと幅との積でありえる。あるいは、上記Ｎは、上記選択された変換が適用される上記対象ブロックの左上段対象領域の変換係数の総数でありえる。一方、上記修正された基底ベクトルを含む上記変換行列は、修正された（modified）変換行列として示されることができる。また、上記変換行列は、変換ベーシスブロック（Transform Bases Block、ＴＢＢ）として示されることもでき、上記関連行列は、関連ベクトルブロック（Association Vectors Block、ＡＶＢ）として示されることができる。

【0135】

変換部は、上記修正された変換行列および上記関連行列に基づいて上記選択的変換を行い、（２次）変換係数を獲得することができる。上記変換係数は、前述したように、量子化部を通じて量子化された変換係数として導出されることができ、エンコードされてデコード装置にシグナリングおよびエンコード装置内の逆量子化部／逆変換部に伝達されることができる。

【0136】

逆変換部は、前述した変換部で行われた手続きの逆順で一連の手続きを行うことができる。逆変換部は、（逆量子化された）変換係数を受信して、選択的（逆）変換を行って（１次）変換係数を導出し（Ｓ６５０）、上記（１次）変換係数に対して１次（逆）変換を行って残差ブロック（残差サンプル）を獲得することができる（Ｓ６６０）。ここで、上記１次変換係数は、逆変換部の立場で修正された（modified）変換係数と称されることができる。エンコード装置およびデコード装置は、上記残差ブロックおよび予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチュアが生成されることができることは、前述した通りである。

【0137】

一方、本発明は、上記選択的変換の一実施例において、簡素化変換と結合された選択的変換を提案する。

【0138】

本明細書において、“簡素化変換”は、簡素化ファクタ（factor）によってサイズが減少した変換行列（transform matrix）に基づいて対象ブロックに対する残差サンプルに対して行われる変換を意味することができる。

【0139】

一実施例に従う簡素化変換で、Ｎ次元ベクトル（N dimensional vector）が他の空間に位置するＲ次元ベクトル（R dimensional vector）にマッピングされて簡素化変換行列が決定されることができ、ここで、Ｒは、Ｎより小さい。すなわち、上記簡素化変換は、Ｒ個の基底ベクトルを含む簡素化変換行列（reduced transform matrix）に基づいて対象ブロックに対する残差サンプルに対して行われる変換を意味することができる。ここで、Ｎは、変換が適用されるブロック（または、対象領域）の一辺の長さ（length）の自乗または変換が適用されるブロック（または、対象領域）と対応する変換係数の総数を意味することができ、簡素化ファクタは、Ｒ／Ｎ値を意味することができる。簡素化ファクタは、減少したファクタ、減少ファクタ、ｒｅｄｕｃｅｄｆａｃｔｏｒ、ｒｅｄｕｃｔｉｏｎｆａｃｔｏｒ、ｓｉｍｐｌｉｆｉｅｄｆａｃｔｏｒ、ｓｉｍｐｌｅｆａｃｔｏｒなど、多様な用語で称されることができる。一方、Ｒは、簡素化係数（reduced coefficient）と称されることができるが、場合によっては、簡素化ファクタがＲを意味することができる。また、場合によって、簡素化ファクタは、Ｎ／Ｒ値を意味することもできる。

【0140】

一実施例に従う上記簡素化変換行列のサイズは、通常の変換行列のサイズＮｘＮより小さいＲｘＮであり、以下の数式４の通り定義されることができる。

【0141】

＜数式４＞

【数4】

【0142】

対象ブロックの１次変換が適用された変換係数に対して簡素化変換行列Ｔ_RxNが掛けられる場合、上記対象ブロックに対する（２次）変換係数が導出されることができる。

【0143】

上記ＲＳＴが適用される場合、２次変換にＲｘＮサイズである簡素化変換行列が適用されるので、Ｒ＋１からＮまでの変換係数は、暗示的に（implicitly）０になることができる。言い換えると、対象ブロックの変換係数が上記ＲＳＴが適用されて導出された場合、上記Ｒ＋１からＮまでの変換係数の値は、０でありえる。ここで、上記Ｒ＋１からＮまでの変換係数は、変換係数のうち、Ｒ＋１番目の変換係数からＮ番目の変換係数を示すことができる。具体的には、対象ブロックの変換係数の配列は、次のように説明できる。

【0144】

図７は、本発明の実施例に従う対象ブロックに基づいて変換係数の配列を説明する図である。以下、図７で後述する変換に関する説明は、逆変換にも同様に適用できる。対象ブロック（または、残差ブロック）７００に対して、１次変換および簡素化変換を基盤とするＮＳＳＴが行われることができる。一例において、図７に図示された１６ｘ１６ブロックは、対象ブロック７００を示し、Ａ乃至Ｐで表記された４ｘ４ブロックは、対象ブロック７００のサブグループを示すことができる。１次変換は、対象ブロック７００の全体範囲で行われることができ、１次変換が行われた以後、ＮＳＳＴは、サブグループＡ、Ｂ、Ｅ、およびＦが構成する８ｘ８ブロック（以下、左上段対象領域）に対して適用されることができる。この際、簡素化変換に基づくＮＳＳＴが行われれば、Ｒ個（ここで、Ｒは簡素化係数を意味し、ＲはＮより小さい）のＮＳＳＴ変換係数のみ導出されるので、Ｒ＋１番目からＮ番目の範囲のＮＳＳＴ変換係数は、各々０に決定できる。例えば、Ｒが１６の場合、簡素化変換に基づくＮＳＳＴが行われて導出された１６個の変換係数は、対象ブロック７００の左上段対象領域に含まれる左上段４ｘ４ブロックであるサブグループＡに含まれる各ブロックに割り当てられることができ、サブグループＢ、Ｅ、およびＦに含まれるＮ－Ｒ個、すなわち６４－１６＝４８個の各ブロックに対しては、変換係数０が割り当てられることができる。簡素化変換に基づくＮＳＳＴが行われない１次変換係数は、サブグループＣ、Ｄ、Ｇ、Ｈ、Ｉ、Ｊ、Ｋ、Ｌ、Ｍ、Ｎ、Ｏ、およびＰに含まれる各ブロックに割り当てられることができる。

【0145】

図８は、上記簡素化変換と上記選択的変換とが結合された変換を通じて変換係数を導出する一例を示す。図８を参照すると、変換行列は、Ｒ個の基底ベクトルを含むことができ、上記関連行列は、Ｒ個の関連ベクトルを含むことができる。ここで、Ｒ個の基底ベクトルを含む上記変換行列は、簡素化変換行列（reduced transform matrix）として示されることができ、上記Ｒ個の関連ベクトルを含む関連行列は、簡素化関連行列（reduced association matrix）として示されることができる。

【0146】

また、上記基底ベクトルの各々は、Ｎ個の要素のうち、選択された要素のみを含むことができる。例えば、図８を参照すると、基底ベクトルＢ₁は、Ｎ₁個の要素を含む１ｘＮ₁次元ベクトルでありえ、基底ベクトルＢ₂は、Ｎ₂個の要素を含む１ｘＮ₂次元ベクトルでありえ、基底ベクトルＢ_Rは、Ｎ_R個の要素を含む１ｘＮ_R次元ベクトルでありえる。上記Ｎ₁、Ｎ₂、およびＮ_Rは、上記Ｎ以下の値でありえる。上記簡素化変換および上記選択的変換が結合された変換は、２次変換および１次変換など、いかなるタイプの変換にも利用できる。

【0147】

図８を参照すると、エンコード装置およびデコード装置は、上記簡素化変換と上記選択的変換とが結合された変換を２次変換に適用することができる。例えば、上記修正された基底ベクトルを含む簡素化変換行列および簡素化関連行列に基づいて上記選択的変換が行われることができ、（２次）変換係数が獲得されることができる。また、上記選択的変換の計算複雑度を減らすためにＨｙＧＴ（Hypercube-Givens Transform）などが上記選択的変換の計算のために使われることもできる。

【0148】

図９は、上記選択的変換を通じて変換係数を導出する一例を示す。上記選択的変換に対する一実施例において、上記関連行列の関連ベクトルＡ₁、Ａ₂、．．．Ａ_Nに対するパターンは、存在しないことがあり、上記関連ベクトルは、互いに異なる形態として導出されることができる。あるいは、上記選択的変換に対する他の実施例において、上記関連行列の関連ベクトルＡ₁、Ａ₂、．．．Ａ_Nは、同一の形態として導出されることができる。

【0149】

具体的には、例えば、上記関連ベクトルは、同一の個数の１を含むことができる。例えば、１の個数がＭの場合、上記関連ベクトルは、Ｍ個の１およびＮ－Ｍ個の０を含むことができる。この場合、上記入力ベクトルＲの（１次）変換係数のうち、Ｍ個の変換係数が基底ベクトルに伝達できる。したがって、上記基底ベクトルの長さもＭでありえる。すなわち、図９に図示したように、上記基底ベクトルは、Ｍ個の要素を含むことができ、（1xM）次元ベクトルでありえ、Ｎ₁＝Ｎ₂＝．．．＝Ｎ_N＝Ｍとして導出されることができる。図９に図示した関連行列および修正された変換行列構造は、上記選択的変換に対する対称構造（symmetric architecture）と示されることができる。

【0150】

また、他の例において、値が１である要素の特定パターンが存在することができ、任意の方式により上記パターンが反復、回転、および／または変換（translate）されて上記関連ベクトルが導出されることができる。

【0151】

一方、前述した選択的変換は、上記簡素化変換および／または上記ＨｙＧＴだけでなく、他の変換技術と共に適用されることもできる。

【0152】

また、本発明は、前述した選択的変換において、上記関連ベクトルを単純化（simplifying）する方式を提案する。上記関連ベクトルを単純化することによって、上記選択的変換を行うための情報の記憶（storing）および上記選択的変換のハンドリング（handling）がより向上できる。すなわち、上記選択的変換を行うためのメモリ負荷（memory load）が減ることができ、上記選択的変換のハンドリング能力がより向上できる。

【0153】

上記関連ベクトルの単純化による効果は、上記関連ベクトルが含む要素のうち、０でない要素が連続する分布を有する場合にさらに明白に表れることができる。例えば、関連ベクトルＡ_kは、１の連続したストリング（continuous string）を含むことができる。この場合、上記Ａ_kは、２つのファクタ（factors）Ａ_ksおよびＡ_kLを通じて表現されることができる。すなわち、上記ファクタＡ_ksおよびＡ_kLに基づいて上記関連ベクトルＡ_kが導出されることができる。ここで、上記Ａ_ksは、０でない要素（例えば、１）の開始点を示すファクタでありえ、上記Ａ_kLは、０でない要素の長さを示すファクタでありえる。上記ファクタに基づいて示した上記関連ベクトルＡ_kは、次の表の通り導出されることができる。

【0154】

＜表６＞

【表6】

【0155】

表６を参照すると、上記関連ベクトルＡ_kは、１６個の要素を含むことができる。すなわち、上記関連ベクトルＡ_kは、１ｘ１６次元ベクトルでありえる。上記関連ベクトルＡ_kの０でない要素の開始点を示すファクタＡ_ksの値は、０として導出されることができ、この場合、上記ファクタＡ_ksは、上記０でない要素の開始点を上記関連ベクトルＡ_kの最初の要素として指し示すことができる。また、上記関連ベクトルＡ_kの０でない要素の長さを示すファクタＡ_kLの値は、８として導出されることができ、この場合、上記ファクタＡ_kLは、上記０でない要素の長さを８個と指し示すことができる。したがって、上記Ａ_kは、上記ファクタに基づいて、表６に図示したように、最初の要素乃至８番目の要素は１であり、残りの要素は０であるベクトルとして導出されることができる。

【0156】

図１０は、関連ベクトルに対する２つのファクタに基づいて上記関連ベクトルを導出して選択的変換を行う一例を示す。図１０を参照すると、各関連ベクトルに対するファクタに基づいて関連行列が導出されることができ、上記関連行列および上記修正された変換行列に基づいて対象ブロックに対する変換係数が導出されることができる。

【0157】

一方、関連ベクトルの各々の０でない要素の開始点および０でない要素の数は、固定された（fixed）値として導出されることができ、または上記関連ベクトルの各々の０でない要素の開始点および０でない要素の数は、多様に導出されることもできる。

【0158】

また、例えば、関連ベクトルの０でない要素の開始点および０でない要素の数は、変換が行われる左上段対象領域のサイズに基づいて導出されることもできる。ここで、上記左上段対象領域のサイズは、上記左上段対象領域の変換係数の数を示すことができ、または、上記左上段対象領域の高さと幅との積を示すことができる。また、他の例において、関連ベクトルの０でない要素の開始点および０でない要素の数は、対象ブロックのイントラ予測モードに基づいて導出されることもできる。具体的には、例えば、上記対象ブロックの上記イントラ予測モードが非方向性イントラ予測モードか否かに基づいて上記関連ベクトルの０でない要素の開始点および０でない要素の数が導出されることができる。

【0159】

あるいは、例えば、関連ベクトルの０でない要素の開始点および０でない要素の数は、予め設定されることができる。あるいは、例えば、上記関連ベクトルの０でない要素の開始点を示す情報および０でない要素の数を示す情報は、シグナリングされることができ、上記０でない要素の開始点を示す情報および上記０でない要素の数を示す情報に基づいて、上記関連ベクトルが導出されることができる。あるいは、上記０でない要素の開始点を示す情報の代わりに、他の情報が使われることもできる。例えば、上記０でない要素の開始点を示す情報の代わりに、上記０でない要素の最後の位置（last position）を示す情報が使われることができ、上記０でない要素の最後の位置を示す情報に基づいて、上記関連ベクトルが導出されることができる。

【0160】

一方、上記ファクタに基づいて上記関連ベクトルを導出する方式は、分離変換と、簡素化変換ＨｙＧＴなどの非分離変換と、に適用されることができる。

【0161】

図１１は、本発明に従うエンコード装置による映像エンコード方法を概略的に示す。図１１で開示された方法は、図１で開示されたエンコード装置により行われることができる。具体的には、例えば、図１１のＳ１１００は上記エンコード装置の減算部、Ｓ１１１０は上記エンコード装置の変換部、Ｓ１１２０は上記エンコード装置のエントロピエンコード部により遂行できる。また、図示してはいないが、予測サンプルを導出する過程は、上記エンコード装置の予測部により遂行できる。

【0162】

エンコード装置は、対象ブロックの残差サンプルを導出する（Ｓ１１００）。例えば、エンコード装置は、対象ブロックに対してインター予測を行うか、またはイントラ予測を行うかを決定することができ、具体的なインター予測モードまたは具体的なイントラ予測モードをＲＤコストに基づいて決定することができる。決定されたモードによって、エンコード装置は、上記対象ブロックに対する予測サンプルを導出することができ、上記対象ブロックに対するオリジナルサンプルと上記予測サンプルとの加算を通じて上記残差サンプルを導出することができる。

【0163】

エンコード装置は、上記残差サンプルに対する選択的変換（selective transform）に基づいて上記対象ブロックの変換係数を導出する（Ｓ１１１０）。上記選択的変換は、修正された（modified）変換行列（transform matrix）に基づいて行われることができ、上記修正された変換行列は、修正された基底ベクトル（basis vector）を含む行列であり、上記修正された基底ベクトルは、Ｎ個の要素のうちの選択された特定個数の要素を含むことができる。また、上記選択的変換は、上記対象ブロックの左上段対象領域で行われることができ、上記Ｎは、上記左上段対象領域に位置する残差サンプルの数でありえる。あるいは、上記Ｎは、上記左上段対象領域の幅と高さとを掛けた値でありえる。例えば、上記Ｎは、１６または６４でありえる。

【0164】

エンコード装置は、上記残差サンプルに対するコア変換を行って修正された変換係数を導出することができ、上記修正された変換行列および上記修正された基底ベクトルに対する関連ベクトル（association vector）を含む関連行列（association matrix）に基づいて、上記対象ブロックの左上段対象領域に位置する修正された変換係数に対する上記選択的変換を行って、上記対象ブロックの変換係数を導出することができる。

【0165】

具体的には、上記残差サンプルに対するコア変換は、次のように行われることができる。エンコード装置は、上記対象ブロックに対する適応的マルチコア変換（Adaptive Multiple core Transform、ＡＭＴ）を適用するか否かを決定することができる。この場合、上記対象ブロックの適応的マルチコア変換が適用されるか否かを示すＡＭＴフラグを生成できる。上記対象ブロックに上記ＡＭＴが適用されない場合、エンコード装置は、ＤＣＴタイプ２を上記対象ブロックに対する変換カーネルとして導出することができ、上記ＤＣＴタイプ２に基づいて上記残差サンプルに対する変換を行って上記修正された変換係数を導出することができる。

【0166】

上記対象ブロックに上記ＡＭＴが適用される場合、エンコード装置は、水平変換カーネルに対する変換サブセットおよび垂直変換カーネルに対する変換サブセットを構成することができ、上記変換サブセットに基づいて水平変換カーネルおよび垂直変換カーネルを導出することができ、上記水平変換カーネルおよび上記垂直変換カーネルに基づいて上記残差サンプルに対する変換を行って修正された変換係数を導出することができる。ここで、上記水平変換カーネルに対する変換サブセットおよび上記垂直変換カーネルに対する変換サブセットは、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、および／またはＤＳＴタイプ１を候補として含むことができる。また、変換インデックス情報が生成されることができ、上記変換インデックス情報は、上記水平変換カーネルを指し示すＡＭＴ水平フラグおよび上記垂直変換カーネルを指し示すＡＭＴ垂直フラグを含むことができる。一方、上記変換カーネルは、変換タイプまたは変換コア（core）と称されることができる。

【0167】

上記修正された変換係数が導出された場合、エンコード装置は、上記修正された変換行列および上記修正された基底ベクトルに対する関連ベクトル（association vector）を含む関連行列（association matrix）に基づいて、上記対象ブロックの左上段対象領域に位置する修正された変換係数に対する上記選択的変換を行って、上記対象ブロックの上記変換係数を導出することができる。上記対象ブロックの上記左上段領域に位置する上記修正された変換係数以外の修正された変換係数は、そのまま上記対象ブロックの上記変換係数として導出されることができる。

【0168】

具体的には、上記左上段対象領域に位置する上記修正された変換係数のうち、上記関連ベクトルの１である要素（elements）に対する修正された変換係数が導出されることができ、上記導出された修正された変換係数および上記修正された基底ベクトルに基づいて上記対象ブロックの変換係数が導出されることができる。ここで、上記修正された基底ベクトルに対する上記関連ベクトルは、Ｎ個の要素を含むことができ、上記Ｎ個の要素は、１の要素および／または０の要素を含むことができ、上記１の要素の個数は、Ａ個でありえる。また、上記修正された基底ベクトルは、上記Ａ個の要素を含むことができる。

【0169】

一方、一例において、上記修正された変換行列は、Ｎ個の修正された基底ベクトルを含むことができ、上記関連行列は、Ｎ個の関連ベクトルを含むことができる。上記関連ベクトルは同一の個数の１の要素を含むことができ、上記修正された基底ベクトルは、全て同一の個数の要素を含むことができる。あるいは、上記関連ベクトルは、同一の個数の１の要素を含まないことがあり、上記修正された基底ベクトルは、全て同一の個数の要素を含まないことがある。

【0170】

あるいは、他の例において、上記修正された変換行列は、Ｒ個の修正された基底ベクトルを含むことができ、上記関連行列は、Ｒ個の関連ベクトルを含むことができる。上記Ｒは、簡素化係数（reduced coefficient）でありえ、上記Ｒは、Ｎより小さいことがある。上記関連ベクトルは、同一の個数の１の要素を含むことができ、上記修正された基底ベクトルは、全て同一の個数の要素を含むことができる。あるいは、上記関連ベクトルは、同一の個数の１の要素を含まないことがあり、上記修正された基底ベクトルは、全て同一の個数の要素を含まないことがある。

【0171】

一方、上記関連ベクトルは、１の要素が連続するように構成できる。この場合、一例において、上記関連ベクトルに関する情報がエントロピエンコードされることができる。例えば、上記関連ベクトルに関する情報は、１の要素の開始点を示す情報および１の要素の個数を示す情報を含むことができる。あるいは、例えば、上記関連ベクトルに関する情報は、１の要素の最後の位置を示す情報および１の要素の個数を示す情報を含むことができる。

【0172】

また、他の例において、上記左上段対象領域のサイズに基づいて、上記関連ベクトルが導出されることができる。例えば、上記左上段対象領域のサイズに基づいて、上記関連ベクトルの１の要素の開始点および上記１の要素の個数が導出されることができる。

【0173】

あるいは、他の例において、上記対象ブロックのイントラ予測モードに基づいて、上記関連ベクトルが導出されることができる。例えば、上記イントラ予測モードに基づいて、上記関連ベクトルの１の要素の開始点および上記１の要素の個数が導出されることができる。また、例えば、上記イントラ予測モードが非方向性（non-directional）イントラ予測モードか否かに基づいて、上記関連ベクトルの１の要素の開始点および上記１の要素の個数が導出されることができる。

【0174】

エンコード装置は、変換係数に関する情報をエンコードする（Ｓ１３３０）。上記変換係数に関する情報は、上記変換係数のサイズ、位置などに関する情報を含むことができる。また、前述したように、上記関連ベクトルに関する情報をエントロピエンコードできる。例えば、上記関連ベクトルに関する情報は、１の要素の開始点を示す情報および１の要素の個数を示す情報を含むことができる。あるいは、例えば、上記関連ベクトルに関する情報は、１の要素の最後の位置を示す情報および１の要素の個数を示す情報を含むことができる。

【0175】

上記変換係数に関する情報および／または上記関連ベクトルに関する情報を含む映像情報は、ビットストリーム形態で出力されることができる。また、上記映像情報は、予測情報をさらに含むことができる。上記予測情報は、上記予測手続きに関連する情報として予測モード情報および動き情報に関する情報（例えば、インター予測が適用される場合）などを含むことができる。

【0176】

出力されたビットストリームは、記憶媒体またはネットワークを介してデコード装置に伝達されることができる。

【0177】

図１２は、本発明に従う映像エンコード方法を行うエンコード装置を概略的に示す。図１１で開示した方法は、図１２で開示したエンコード装置により遂行できる。具体的には、例えば、図１２の上記エンコード装置の加算部は図１１のＳ１１００を行うことができ、上記エンコード装置の変換部はＳ１１１０を行うことができ、上記エンコード装置のエントロピエンコード部はＳ１１２０乃至Ｓ１１３０を行うことができる。また、図示してはいないが、予測サンプルを導出する過程は、上記エンコード装置の予測部により行われることができる。

【0178】

図１３は、本発明に従うデコード装置による映像デコード方法を概略的に示す。図１３で開示した方法は、図２で開示したデコード装置により行われることができる。具体的には、例えば、図１３のＳ１３００乃至Ｓ１３１０は上記デコード装置のエントロピデコード部、Ｓ１３２０は上記デコード装置の逆変換部、Ｓ１３３０は上記デコード装置の加算部により行われることができる。また、図示してはいないが、予測サンプルを導出する過程は、上記デコード装置の予測部により行われることができる。

【0179】

デコード装置は、上記ビットストリームから上記対象ブロックの変換係数を導出する（Ｓ１３００）。デコード装置は、上記ビットストリームを通じて受信した上記対象ブロックの変換係数に関する情報をデコードして上記対象ブロックの変換係数を導出することができる。上記受信した上記対象ブロックの変換係数に関する情報は、残差（residual）情報として示されることができる。

【0180】

デコード装置は、上記変換係数に対する選択的変換（selective transform）に基づいて、上記対象ブロックに対する残差サンプルを導出する（Ｓ１３１０）。上記選択的変換は、修正された（modified）変換行列（transform matrix）に基づいて行われることができ、上記修正された変換行列は、修正された基底ベクトル（basis vector）を含む行列であり、上記修正された基底ベクトルは、Ｎ個の要素のうちの選択された特定個数の要素を含むことができる。また、上記選択的変換は、上記対象ブロックの左上段対象領域に位置する変換係数に対して行われることができ、上記Ｎは、上記左上段対象領域に位置する変換係数などの数でありえる。あるいは、上記Ｎは、上記左上段対象領域の幅と高さとを掛けた値でありえる。例えば、上記Ｎは、１６または６４でありえる。

【0181】

デコード装置は、上記修正された変換行列および上記修正された基底ベクトルに対する関連ベクトル（association vector）を含む関連行列（association matrix）に基づいて、上記対象ブロックの左上段対象領域に位置する変換係数に対する上記選択的変換を行って修正された変換係数を導出することができる。

【0182】

具体的には、上記左上段対象領域に位置する変換係数のうちの上記関連ベクトルの１の要素（elements）に対する変換係数が導出されることができ、上記導出された変換係数と上記修正された基底ベクトルとに基づいて、修正された変換係数が導出されることができる。ここで、上記修正された基底ベクトルに対する上記関連ベクトルは、Ｎ個の要素を含むことができ、上記Ｎ個の要素は、１の要素および／または０の要素を含むことができ、上記１の要素の個数は、Ａ個でありえる。また、上記修正された基底ベクトルは、上記Ａ個の要素を含むことができる。

【0183】

一方、一例において、上記修正された変換行列は、Ｎ個の修正された基底ベクトルを含むことができ、上記関連行列は、Ｎ個の関連ベクトルを含むことができる。上記関連ベクトルは、同一の個数の１の要素を含むことができ、上記修正された基底ベクトルは、全て同一の個数の要素を含むことができる。あるいは、上記関連ベクトルは、同一の個数の１の要素を含まないことがあり、上記修正された基底ベクトルは、全て同一の個数の要素を含まないことがある。

【0184】

【0185】

一方、上記関連ベクトルは、１の要素が連続するように構成できる。この場合、一例において、上記関連ベクトルに関する情報がビットストリームから獲得されることができ、上記関連ベクトルに関する情報に基づいて、上記関連ベクトルが導出されることができる。例えば、上記関連ベクトルに関する情報は、１の要素の開始点を示す情報および１の要素の個数を示す情報を含むことができる。あるいは、例えば、上記関連ベクトルに関する情報は、１の要素の最後の位置を示す情報および１の要素の個数を示す情報を含むことができる。

【0186】

あるいは、他の例において、上記左上段対象領域のサイズに基づいて、上記関連ベクトルが導出されることができる。例えば、上記左上段対象領域のサイズに基づいて、上記関連ベクトルの１の要素の開始点および上記１の要素の個数が導出されることができる。

【0187】

【0188】

上記修正された変換係数が導出された場合、デコード装置は、上記修正された変換係数を含む上記対象ブロックに対するコア変換を行って、上記残差サンプルを導出することができる。

【0189】

上記対象ブロックに対するコア変換は、次のように行われることができる。デコード装置は、ビットストリームから適応的マルチコア変換（Adaptive Multiple core Transform、ＡＭＴ）が適用されるか否かを示すＡＭＴフラグを獲得することができ、上記ＡＭＴフラグの値が０の場合、デコード装置は、ＤＣＴタイプ２を上記対象ブロックに対する変換カーネルとして導出することができ、上記ＤＣＴタイプ２に基づいて上記修正された変換係数を含む上記対象ブロックに対する逆変換を行って、上記残差サンプルを導出することができる。

【0190】

上記ＡＭＴフラグの値が１の場合、デコード装置は、水平変換カーネルに対する変換サブセットおよび垂直変換カーネルに対する変換サブセットを構成することができ、上記ビットストリームから獲得した変換インデックス情報、上記変換サブセットに基づいて、水平変換カーネル、および垂直変換カーネルを導出することができ、上記水平変換カーネルおよび上記垂直変換カーネルに基づいて、上記修正された変換係数を含む上記対象ブロックに対する逆変換を行って、上記残差サンプルを導出することができる。ここで、上記水平変換カーネルに対する変換サブセットおよび上記垂直変換カーネルに対する変換サブセットは、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、および／またはＤＳＴタイプ１を候補として含むことができる。また、上記変換インデックス情報は、上記水平変換カーネルに対する変換サブセットに含まれる候補のうちの１つを指し示すＡＭＴ水平フラグおよび上記垂直変換カーネルに対する変換サブセットに含まれる候補のうちの１つを指し示すＡＭＴ垂直フラグを含むことができる。一方、上記変換カーネルは、変換タイプまたは変換コア（core）と称されることができる。

【0191】

デコード装置は、上記残差サンプルに基づいて復元ピクチュアを生成する（Ｓ１３２０）。デコード装置は、上記残差サンプルに基づいて復元ピクチュアを生成することができる。例えば、デコード装置は、ビットストリームを通じて受信した予測情報に基づいて対象ブロックに対するインター予測またはイントラ予測を行い、予測サンプルを導出することができ、上記予測サンプルと上記残差サンプルとの加算を通じて上記復元ピクチュアを生成することができる。以後、必要によって、主観的／客観的画質を向上させるために、デブロックフィルタリング、ＳＡＯおよび／またはＡＬＦ手続きなどのインループフィルタリング手続きを上記復元ピクチュアに適用できることは前述した通りである。

【0192】

図１４は、本発明に従う映像デコード方法を行うデコード装置を概略的に示す。図１３で開示した方法は、図１４で開示したデコード装置により行われることができる。具体的には、例えば、図１４の上記デコード装置のエントロピデコード部は図１３のＳ１３００を行うことができ、図１４の上記デコード装置の逆変換部は図１３のＳ１３１０を行うことができ、図１６の上記デコード装置の加算部は図１５のＳ１３２０を行うことができる。また、図示してはいないが、予測サンプルを導出する過程は、図１４の上記デコード装置の予測部により行われることができる。

【0193】

前述した本発明によれば、効率の良い変換を通じて残差処理のために転送されなければならないデータ量を減らすことができ、残差コーディング効率を高めることができる。

【0194】

また、本発明によれば、選択された特定個数の要素を含む基底ベクトルで構成された変換行列に基づいて非分離変換を行うことができ、これを通じて非分離変換のためのメモリ負荷および計算複雑度を減らすことができ、残差コーディング効率を高めることができる。

【0195】

また、本発明によれば、単純化された構造の変換行列に基づいて非分離変換を行うことができ、これを通じて残差処理のために転送されなければならないデータ量を減らすことができ、残差コーディング効率を高めることができる。

【0196】

前述した実施例において、方法は、一連のステップまたはブロックにて順序度（フローチャート）に基づいて説明されているが、本発明は、ステップの順序に限定されるのではなく、あるステップは、前述したのと異なるステップおよび異なる順序で、または同時に発生することができる。また、当業者であれば、フローチャートに示されたステップが排他的でなく、他のステップが含まれるか、またはフローチャートの１つもしくは複数のステップが、本発明の範囲に影響を及ぼさずに削除できることを理解することができる。

【0197】

前述した本発明に従う方法は、ソフトウェア形態で具現されることができ、本発明に従うエンコード装置および／またはデコード装置は、例えばＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの映像処理を行う装置に含まれることができる。

【0198】

本発明において、実施例がソフトウェアで具現されるとき、前述した方法は、前述した機能を行うモジュール（過程、機能など）で具現されることができる。モジュールは、メモリに記憶され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部に在ってもよく、よく知られた多様な手段によりプロセッサと連結されることができる。プロセッサは、ＡＳＩＣ（Application-Specific Integrated Circuit）、他のチップセット、論理回路および／またはデータ処理装置を含むことができる。メモリは、ＲＯＭ（Read-Only Memory）、ＲＡＭ（Random Access Memory）、フラッシュメモリ、メモリカード、記憶媒体、および／または他の記憶装置を含むことができる。すなわち、本発明で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラ、またはチップ上で具現されて遂行できる。例えば、各図面で図示した機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ、またはチップ上で具現されて遂行できる。

【0199】

また、本発明が適用されるデコード装置およびエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、ビデオオンデマンド（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Over the top video）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、画像電話ビデオ装置、および医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使われることができる。例えば、ＯＴＴビデオ（Over The Top video）装置は、ゲームコンソール、ブルーレイプレーヤ、インターネット接続ＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（Digital Video Recorder）などを含むことができる。

【0200】

また、本発明が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータにより読み取りできる記録媒体に記憶されることができる。また、本発明に従うデータ構造を有するマルチメディアデータも、コンピュータにより読み取りできる記録媒体に記憶されることができる。上記コンピュータにより読み取りできる記録媒体は、コンピュータにより読み取りできるデータが記憶される全ての種類の記憶装置および分散記憶装置を含む。上記コンピュータにより読み取りできる記録媒体は、例えば、ブルーレイディスク（ＢＤ）、ユニバーサルシリアル（汎用直列）バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピ（登録商標）ディスク、および光学データ記憶装置を含むことができる。また、上記コンピュータにより読み取りできる記録媒体は、搬送波（例えば、インターネットを通じての転送）の形態に具現されたメディアを含む。また、エンコード方法により生成されたビットストリームがコンピュータにより読み取りできる記録媒体に記憶されるか、または有無線通信ネットワークを介して転送できる。また、本発明の実施例は、プログラムコードによるコンピュータプログラム製品で具現されることができ、上記プログラムコードは、本発明の実施例によりコンピュータで行われることができる。上記プログラムコードは、コンピュータにより読み取り可能なキャリア上に記憶されることができる。

【0201】

また、本発明が適用されるコンテンツストリーミングシステムは、大別してエンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディア記憶所、ユーザ装置、およびマルチメディア入力装置を含むことができる。

【0202】

上記エンコードサーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを上記ストリーミングサーバに転送する役割を担う。他の例において、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置がビットストリームを直接生成する場合、上記エンコードサーバは、省略されることができる。上記ビットストリームは、本発明が適用されるエンコード方法またはビットストリーム生成方法により生成されることができ、上記ストリーミングサーバは、上記ビットストリームを転送または受信する過程で一時的に上記ビットストリームを記憶することができる。

【0203】

上記ストリーミングサーバは、ウェブサーバを通じてのユーザ要求（要請）に基づいてマルチメディアデータをユーザ装置に転送し、上記ウェブサーバは、ユーザにいかなるサービスがあるかを知らせる媒介体の役割を担う。ユーザが上記ウェブサーバに所望のサービスを要求すれば、上記ウェブサーバは、これをストリーミングサーバに伝達し、上記ストリーミングサーバは、ユーザにマルチメディアデータを転送する。この際、上記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、上記制御サーバは、上記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割を担う。

【0204】

上記ストリーミングサーバは、メディア記憶所および／またはエンコードサーバからコンテンツを受信することができる。例えば、上記エンコードサーバからコンテンツを受信するようになる場合、上記コンテンツをリアルタイムに受信することができる。この場合、円滑なストリーミングサービスを提供するために、上記ストリーミングサーバは、上記ビットストリームを一定時間の間記憶することができる。

【0205】

上記ユーザ装置の例には、携帯電話、スマートフォン（smart phone）、ノートブックコンピュータ（laptop computer）、デジタル放送用端末機、ＰＤＡ（Personal Digital Assistants）、ＰＭＰ（Portable Multimedia Player）、ナビゲーション（ナビゲータ）、スレートＰＣ（slate PC）、タブレットＰＣ（tablet PC）、ウルトラブック（ULTRABOOK（登録商標））、ウェアラブルデバイス（wearable device、例えば、スマートウォッチ（smartwatch）、スマートグラス（smart glass）、ＨＭＤ（Head Mounted Display））、デジタルＴＶ、デスクトップコンピュータ、デジタルサイネージなどがありえる。上記コンテンツストリーミングシステム内の各サーバは、分散サーバで運用されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

【図1】

【図2】

【図3】

【図4】

【図5A】

【図5B】

【図5C】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【手続補正書】

【提出日】2024-01-11

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

デコード装置により行われる映像デコード方法であって、
ビットストリームから予測モード情報と対象ブロックの変換係数に関する情報とを取得するステップと、
前記予測モード情報に基づいて前記対象ブロックの予測サンプルを導出するステップと、
前記変換係数に関する前記情報に基づいて前記対象ブロックの変換係数を導出するステップと、
前記変換係数に対する非分離変換に基づいて前記対象ブロックに対する残差サンプルを導出するステップと、
前記予測サンプルと前記残差サンプルとに基づいて復元サンプルを生成するステップと、を含み、
前記予測サンプルは、前記対象ブロックに対するイントラ予測に基づいて導出され、
前記非分離変換は、変換行列に基づいて行われ、
前記変換行列は、修正された基底ベクトルを含む行列であり、
前記修正された基底ベクトルは、Ｎ個より少ない要素を含み、
前記Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する変換係数の数に等しく、
前記非分離変換が適用される前記領域は、前記対象ブロックにおける８ｘ８左上段領域であり、
前記Ｎは、６４に等しい、映像デコード方法。

【請求項2】

エンコード装置により行われる映像エンコード方法であって、
対象ブロックの予測サンプルを導出するステップと、
前記予測サンプルに基づいて前記対象ブロックの残差サンプルを導出するステップと、
前記残差サンプルに対する非分離変換に基づいて前記対象ブロックの変換係数を導出するステップと、
前記予測サンプルを導出するために使用される予測モードに関連する予測モード情報を生成するステップと、
前記変換係数に関する情報を生成するステップと、
前記予測モード情報と前記変換係数に関する前記情報とをエンコードするステップと、を含み、
前記予測サンプルは、前記対象ブロックに対するイントラ予測に基づいて導出され、
前記非分離変換は、変換行列に基づいて行われ、
前記変換行列は、修正された基底ベクトルを含む行列であり、
前記修正された基底ベクトルは、Ｎ個より少ない要素を含み、
前記Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する変換係数の数に等しく、
前記非分離変換が適用される前記領域は、前記対象ブロックにおける８ｘ８左上段領域であり、
前記Ｎは、６４に等しい、映像エンコード方法。

【請求項3】

映像に関するビットストリームを含むデータの送信方法であって、
前記映像に関する前記ビットストリームを取得するステップであって、前記ビットストリームは、
対象ブロックの予測サンプルを導出するステップと、
前記予測サンプルに基づいて前記対象ブロックの残差サンプルを導出するステップと、
前記残差サンプルに対する非分離変換に基づいて前記対象ブロックの変換係数を導出するステップと、
前記予測サンプルを導出するために使用される予測モードに関連する予測モード情報を生成するステップと、
前記変換係数に関する情報を生成するステップと、
前記予測モード情報と前記変換係数に関する前記情報とをエンコードするステップと、によって生成されるステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記予測サンプルは、前記対象ブロックに対するイントラ予測に基づいて導出され、
前記非分離変換は、変換行列に基づいて行われ、
前記変換行列は、修正された基底ベクトルを含む行列であり、
前記修正された基底ベクトルは、Ｎ個より少ない要素を含み、
前記Ｎは、前記対象ブロックにおいて前記非分離変換が適用される領域に位置する変換係数の数に等しく、
前記非分離変換が適用される前記領域は、前記対象ブロックにおける８ｘ８左上段領域であり、
前記Ｎは、６４に等しい、方法。

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版