【文献】
Sandeep Kanumuri et al.,Enhancements to Intra Coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D235,pp.1-7
【文献】
Oguz Bici et al.,Unified planar intra prediction,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 3月,JCTVC-E174,pp.1-5
【文献】
Sandeep Kanumuri and Frank Bossen,CE6.e/f: Planar mode experiments and results,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 3月,JCTVC-E321,pp.1-8
【文献】
Thomas Wiegand et al.,WD3: Working Draft 3 of High-Efficiency Video Coding,Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 6月27日,JCTVC-E603_d8,7.3.2.1, 7.3.5-7.3.6, 7.4.2.1, 7.4.5-7.4.6, 8.3.3-8.3.3.1.8
【文献】
Jianle Chen and Tammy Lee,Planar intra prediction improvement,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 7月,JCTVC-F483,pp.1-5
(58)【調査した分野】(Int.Cl.,DB名)
現在サンプルの予測に用いられる第1コーナーサンプル、及び第2コーナーサンプル、第1側面サンプル、及び第2側面サンプルを含む参照サンプルを獲得する符号化情報獲得部と、
前記現在サンプルが含まれた現在のブロックの大きさが所定の大きさ以上であるとき、前記獲得された参照サンプルを前記参照サンプルの周辺サンプルに基づいてフィルタリングする参照サンプルフィルター部と、
前記参照サンプルに含まれた第1コーナーサンプル、前記第2コーナーサンプル、前記第1側面サンプル、及び前記第2側面サンプルに基づき前記現在サンプルの予測値を決定する予測値決定部と、
前記現在サンプルの前記予測値とオリジナル値との差を示すレジデュアルデータ及び前記現在サンプルの前記予測値を用いて前記現在サンプルの前記オリジナル値を復元する復元部とを備え、
前記第1コーナーサンプルは、前記現在ブロックの上側面に隣接した行及び前記現在ブロックの右側面に隣接した列の交差点に位置し、
前記第2コーナーサンプルは、前記現在ブロックの下側面に隣接した行、及び前記現在ブロックの左側面に隣接した列の交差点に位置し、
前記第1側面サンプルは、前記現在サンプルが位置した行及び前記現在ブロックの左側面に隣接した列の交差点に位置し、
前記第2側面サンプルは、前記現在ブロックの上側面に隣接した行及び前記現在サンプルが位置した列の交差点に位置し、
前記フィルタリング段階は、フィルター係数の比が1:2:1である3タップフィルターが参照サンプルに適用されることを特徴とする映像のイントラ予測装置。
【発明を実施するための形態】
【0010】
以下、添付した図面を参照して本発明の望ましい実施形態について具体的に説明する。
【0011】
図1は、本発明の一実施形態によるビデオ符号化装置のブロック図である。
【0012】
一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を備える。
【0013】
最大符号化単位分割部110は、映像の現在ピクチャーのための最大サイズの符号化単位である最大符号化単位に基づいて現在ピクチャーを区切る。現在ピクチャーが最大符号化単位より大きければ、現在ピクチャーの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であり、横及び縦のサイズが8より大きい2の二乗である正方形のデータ単位である。映像データは、少なくとも1つの最大符号化単位別に符号化単位決定部120に出力される。
【0014】
一実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度と、最小符号化単位が最下位符号化単位と定義される。最大符号化単位の深度が深くなるにつれて深度別符号化単位のサイズが低減するので、上位深度の符号化単位は、複数の下位深度の符号化単位を含む。
【0015】
前述したように、符号化単位の最大サイズによって、現在ピクチャーの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが深度によって階層的に分類される。
【0016】
最大符号化単位の高さ及び幅を階層的に分割できる総回数を制限する最大深度及び符号化単位の最大サイズが予め設定される。
【0017】
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化して、少なくとも1つの分割領域別に最終符号化結果が出力される深度を定める。すなわち、符号化単位決定部120は、現在ピクチャーの最大符号化単位ごとに深度別符号化単位で映像データを符号化して最も小さな符号化誤差が発生する深度を選択し、符号化深度と定める。定められた符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
【0018】
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差の最も小さな深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの符号化深度が定められる。
【0019】
最大符号化単位のサイズは、深度が深くなるにつれて符号化単位が階層的に分割されて分割され、符号化単位の数は増加する。また、1つの最大符号化単位に含まれる同じ深度の符号化単位であっても、それぞれのデータについての符号化誤差を測定して下位深度への分割如何が定められる。よって、1つの最大符号化単位に含まれるデータであっても、位置によって深度別符号化誤差が異なるため、位置によって符号化深度が異なって定められる。よって、1つの最大符号化単位について符号化深度が1つ以上設定され、最大符号化単位のデータは、1つ以上の符号化深度の符号化単位によって区切られる。
【0020】
したがって、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が定められる。一実施形態による‘ツリー構造による符号化単位’は、現在最大符号化単位に含まれるすべての深度別符号化単位のうち、符号化深度と定められた深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で同一領域では深度によって階層的に定められ、他の領域については独立して定められる。同様に、現在領域についての符号化深度は、他の領域についての符号化深度と独立して定められる。
【0021】
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総数を示す。例えば、最大符号化単位の深度が0ならば、最大符号化単位が1回分割された符号化単位の深度は1に設定され、2回分割された符号化単位の深度が2に設定される。この場合、最大符号化単位から4回分割された符号化単位が最小符号化単位ならば、深度0、1、2、3、4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
【0022】
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに深度別符号化単位に基づいて行われる。
【0023】
最大符号化単位が深度別に分割される度に深度別符号化単位の数が増加するので、深度が深くなるにつれて生成されるすべての深度別符号化単位について、予測符号化及び周波数変換を含む符号化が行われねばならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち現在深度の符号化単位に基づいて予測符号化及び周波数変換を説明する。
【0024】
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択できる。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などの段階を経るが、すべての段階にわたって同じデータ単位が使われてもよく、段階別にデータ単位が変更されてもよい。
【0025】
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択できる。
【0026】
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、これ以上分割されない符号化単位に基づいて予測符号化が行われる。以下、予測符号化の基盤になる、これ以上分割されない符号化単位を‘予測単位’と称する。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち少なくとも1つが分割されたデータ単位を含む。
【0027】
例えば、サイズ2N×2N(但し、Nは、正の整数)の符号化単位がこれ以上分割されない場合、サイズ2N×2Nの予測単位になり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的パーティションだけではなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
【0028】
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも1つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションに対してのみ行われる。符号化単位以内の1つの予測単位ごとに独立して符号化が行われ、符号化誤差の最も小さな予測モードが選択される。
【0029】
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位に基づいて符号化単位の映像データの周波数変換を行える。
【0030】
符号化単位の周波数変換のためには、符号化単位より小さいか、または同じサイズのデータ単位に基づいて周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位及びインターモードのためのデータ単位を含む。
【0031】
以下、周波数変換の基盤になるデータ単位は、‘変換単位’と称する。符号化単位と類似した方式で、符号化単位内の変換単位も再帰的にさらに小さなサイズの変換単位に分割されつつ、符号化単位の残差データが、変換深度によってツリー構造による変換単位によって区切られる。
【0032】
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割して変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2N×2Nの現在符号化単位の変換単位のサイズが2N×2Nならば、変換深度0、変換単位のサイズがN×Nならば、変換深度1、変換単位のサイズがN/2×N/2ならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によってツリー構造による変換単位が設定される。
【0033】
符号化深度別符号化情報は、符号化深度だけではなく予測関連情報及び周波数変換関連情報が必要である。よって、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、周波数変換のための変換単位のサイズなどを定める。
【0034】
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、
図3ないし12を参照して詳細に後述する。
【0035】
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian Multiplier)基盤の率−歪曲最適化技法(Rate−Distortion Optimization)を用いて測定できる。
【0036】
出力部130は、符号化単位決定部120で定められた少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ及び深度別符号化モードに関する情報を、ビットストリーム形態に出力する。
【0037】
符号化された映像データは、映像の残差データの符号化結果である。
【0038】
深度別符号化モードに関する情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
【0039】
符号化深度情報は、現在深度で符号化せずに下位深度の符号化単位で符号化するかどうかを示す深度別分割情報を用いて定義される。現在符号化単位の現在深度が符号化深度ならば、現在符号化単位は現在深度の符号化単位で符号化されるので、現在深度の分割情報はこれ以上下位深度に分割されないように定義される。一方、現在符号化単位の現在深度が符号化深度ではなければ、下位深度の符号化単位を用いた符号化を試みる必要があるため、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
【0040】
現在深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位について符号化が行われる。現在深度の符号化単位内に下位深度の符号化単位が1つ以上存在するので、それぞれの下位深度の符号化単位ごとに繰り返して符号化が行われて、同じ深度の符号化単位ごとに再帰的な符号化が行われる。
【0041】
1つの最大符号化単位内にツリー構造の符号化単位が定められ、符号化深度の符号化単位ごとに少なくとも1つの符号化モードに関する情報が定められねばならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに関する情報が定められる。また、最大符号化単位のデータは、深度によって階層的に区切られて位置別に符号化深度が異なるので、データについて符号化深度及び符号化モードに関する情報が設定される。
【0042】
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも1つについて、該符号化深度及び符号化モードについての符号化情報が割り当てられる。
【0043】
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれるすべての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形データ単位である。
【0044】
例えば、出力部130を通じて出力される符号化情報は、深度別符号化単位別符号化情報と予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティション大きさ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に関する情報、インターモードの参照映像インデックスに関する情報、動きベクトルに関する情報、イントラモードのクロマ成分に関する情報、イントラモードの補間方式に関する情報などを含む。また、ピクチャー、スライスまたはGOP別に定義される符号化単位の最大サイズに関する情報及び最大深度に関する情報は、ビットストリームのヘッダに挿入される。
【0045】
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分したサイズの符号化単位である。すなわち、現在深度の符号化単位のサイズが2N×2Nならば、下位深度の符号化単位のサイズはN×Nである。また、2N×2Nサイズの現在符号化単位は、N×Nサイズの下位深度符号化単位を最大4個含む。
【0046】
したがって、一実施形態によるビデオ符号化装置100は、現在ピクチャーの特性を考慮して定められた最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及び大きさの符号化単位を定めて、ツリー構造による符号化単位を構成できる。また、それぞれの最大符号化単位ごとに多様な予測モード、周波数変換方式などで符号化できるので、多様な映像サイズの符号化単位の映像特性を考慮して最適の符号化モードが定められる。
【0047】
したがって、映像の解像度が非常に高いか、データ量の非常に大きい映像を既存マクロブロック単位で符号化すれば、ピクチャー当たりマクロブロックの数が過度に多くなる。これによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなってデータ圧縮効率が低下する傾向がある。よって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して符号化単位の最大サイズを増加させつつ、映像特性を考慮して符号化単位を調節できるので、映像圧縮効率が向上する。
【0048】
図2は、本発明の一実施形態によるビデオ復号化装置のブロック図である。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号化部230を備える。一実施形態によるビデオ復号化装置200の各種プロセッシングのための符号化単位、深度、予測単位、変換単位、各種符号化モードに関する情報など各種用語の定義は、
図1及びビデオ符号化装置100を参照して前述した通りである。
【0049】
受信部205は、符号化されたビデオについてのビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから最大符号化単位別に、ツリー構造による符号化単位によって符号化単位ごとに符号化された映像データを抽出して、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャーについてのヘッダから現在ピクチャーの符号化単位の最大サイズに関する情報を抽出できる。
【0050】
また、映像データ及び符号化情報抽出部220はパージングされたビットストリームから最大符号化単位別にツリー構造による符号化単位についての符号化深度及び符号化モードに関する情報を抽出する。抽出された符号化深度及び符号化モードに関する情報は映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部230が最大符号化単位ごとに映像データを復号化可能にする。
【0051】
最大符号化単位別符号化深度及び符号化モードに関する情報は、1つ以上の符号化深度情報について設定され、符号化深度別符号化モードに関する情報は、該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別分割情報が抽出されてもよい。
【0052】
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードに関する情報は、一実施形態によるビデオ符号化装置100のように、符号化端で、最大符号化単位別深度別符号化単位ごとに繰り返して符号化を行って最小符号化誤差を発生させると定められた符号化深度及び符号化モードに関する情報である。よって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によってデータを復号化して映像を復元できる。
【0053】
一実施形態による符号化深度及び符号化モードについての符号化情報は、該符号化単位、予測単位及び最小単位のうち所定データ単位について割り当てられるので、映像データ及び符号化情報抽出部220は、所定データ単位別に符号化深度及び符号化モードに関する情報を抽出できる。所定データ単位別に、該最大符号化単位の符号化深度及び符号化モードに関する情報が記録されていれば、同じ符号化深度及び符号化モードに関する情報を持っている所定データ単位は、同じ最大符号化単位に含まれるデータ単位と類推される。
【0054】
映像データ復号化部230は、最大符号化単位別符号化深度及び符号化モードに関する情報に基づいて、それぞれの最大符号化単位の映像データを復号化して現在ピクチャーを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含む。
【0055】
映像データ復号化部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとにそれぞれのパーティション及び予測モードによってイントラ予測または動き補償を行う。
【0056】
また、映像データ復号化部230は、最大符号化単位別周波数逆変換のために、符号化深度別符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとにそれぞれの変換単位によって周波数逆変換を行う。
【0057】
映像データ復号化部230は、深度別分割情報を用いて現在最大符号化単位の符号化深度を定める。もし、分割情報が現在深度でこれ以上分割されないことを示していれば、現在深度が符号化深度である。よって、映像データ復号化部230は、現在最大符号化単位の映像データについて現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を用いて復号化する。
【0058】
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位について設定されている符号化情報を観察して、同じ分割情報を含む符号化情報を保有しているデータ単位が集まって、映像データ復号化部230によって同じ符号化モードで復号化する1つのデータ単位と見なされる。
【0059】
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に関する情報を獲得し、現在ピクチャーについての復号化に用いる。すなわち、最大符号化単位ごとに最適符号化単位と定められたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
【0060】
したがって、高い解像度の映像またはデータ量が過度に多い映像であっても、符号化端から伝送された最適符号化モードに関する情報を用いて、映像の特性に適応的に定められた符号化単位のサイズ及び符号化モードによって効率的に映像データを復号化して復元できる。
【0061】
以下、
図3ないし
図13を参照して本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式が詳細に説明される。
【0062】
図3は、階層的符号化単位の概念を示す。
【0063】
符号化単位の例は、符号化単位のサイズは幅×高さで表現され、サイズ64×64の符号化単位から、32×32、16×16、8×8を含む。サイズ64×64の符号化単位は、サイズ64×64、64×32、32×64、32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32、32x16、16×32、16×16のパーティションに、サイズ16×16の符号化単位は、サイズ16×16、16×8、8×16、8×8のパーティションに、サイズ8×8の符号化単位は、サイズ8×8、8×4、4×8、4×4のパーティションに分割される。
【0064】
ビデオデータ310については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が2に設定されている。ビデオデータ320については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が3に設定されている。ビデオデータ330については、解像度は352×288、符号化単位の最大サイズは16、最大深度が1に設定されている。
図3に示された最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
【0065】
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけではなく映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。よって、ビデオデータ330に比べて解像度の高いビデオデータ310、320は、符号化サイズの最大サイズが64に選択される。
【0066】
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズ64の最大符号化単位から2回分割して深度が2階層深くなって、長軸サイズ32、16の符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズ16の符号化単位から1回分割して深度が一階層深くなって、長軸サイズ8の符号化単位まで含む。
【0067】
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズ64の最大符号化単位から3回分割して深度が3階層深くなって、長軸サイズ32、16、8の符号化単位まで含む。深度が深くなるほど詳細情報の表現能が向上する。
【0068】
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部のブロック図である。一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120で映像データの符号化に経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405のうちイントラモードの符号化単位についてイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を用いてインタ推定及び動き補償を行う。
【0069】
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て量子化された変換係数に出力される。量子化された変換係数は、逆量子化部460、周波数逆変換部470を通じて空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて参照フレーム495に出力される。量子化された変換係数は、エントロピー符号化部450を経てビットストリーム455に出力される。
【0070】
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を行わねばならない。
【0071】
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティション及び予測モードを定め、周波数変換部430は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の変換単位のサイズを定めねばならない。
【0072】
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部のブロック図である。ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化に関する情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て逆量子化されたデータに出力され、周波数逆変換部540を経て空間領域の映像データが復元される。
【0073】
空間領域の映像データについて、イントラ予測部550は、イントラモードの符号化単位についてイントラ予測を行い、動き補償部560は、参照フレーム585を共に用いてインターモードの符号化単位について動き補償を行う。
【0074】
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて復元フレーム595に出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
【0075】
ビデオ復号化装置200の映像データ復号化部230で映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後の段階別作業が行われる。
【0076】
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580がいずれも、最大符号化単位ごとにツリー構造による符号化単位に基づいて作業を行わねばならない。
【0077】
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位それぞれごとにパーティション及び予測モードを定め、周波数逆変換部540は、符号化単位ごとに変換単位のサイズを定めねばならない。
【0078】
図6は、本発明の一実施形態による深度別符号化単位及びパーティションを示す。
【0079】
一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために階層的な符号化単位を使う。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に定められてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別符号化単位のサイズが定められる。
【0080】
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64であり、最大深度が4の場合を図示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
【0081】
すなわち、符号化単位610は、符号化単位の階層構造600のうち最大符号化単位であり、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32の深度1の符号化単位620、サイズ16×16の深度2の符号化単位630、サイズ8×8の深度3の符号化単位640、サイズ4×4の深度4の符号化単位650が存在する。サイズ4×4の深度4の符号化単位650は、最小符号化単位である。
【0082】
それぞれの深度別で横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位ならば、予測単位はサイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、サイズ32×32のパーティション616に分割される。
【0083】
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32x16のパーティション622、サイズ16×32のパーティション624、サイズ16×16のパーティション626に分割される。
【0084】
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、サイズ8×8のパーティション636に分割される。
【0085】
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、サイズ4×4のパーティション646に分割される。
【0086】
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位であって最下位深度の符号化単位であり、該予測単位もサイズ4×4のパーティション650のみに設定される。
【0087】
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を定めるために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わねばならない。
【0088】
同一範囲及びサイズのデータを含むための深度別符号化単位の数は、深度が深くなるほど深度別符号化単位の数も増加する。例えば、深度1の符号化単位1つが含むデータに対して、深度2の符号化単位は4つ必要である。よって、同じデータの符号化結果を深度別に比較するために、1つの深度1の符号化単位及び4つの深度2の符号化単位を用いてそれぞれ符号化されねばならない。
【0089】
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行って、該深度で最も小さな符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行って、深度別代表符号化誤差を比較して最小符号化誤差が検索される。最大符号化単位610のうち最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプと選択される。
【0090】
図7は、本発明の一実施形態による符号化単位及び変換単位の関係を示す。
【0091】
一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに最大符号化単位より小さいか、または同じサイズの符号化単位で映像を符号化または復号化する。符号化過程中に周波数変換のための変換単位のサイズは、それぞれの符号化単位より大きくないデータ単位に基づいて選択される。
【0092】
例えば、一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200で、現在符号化単位710が64×64サイズの時、32×32サイズの変換単位720を用いて周波数変換が行われる。
【0093】
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32、16×16、8×8、4×4サイズの変換単位でそれぞれ周波数変換を行って符号化した後、原本との誤差が最も少ない変換単位が選択される。
【0094】
図8は、本発明の一実施形態によって深度別符号化情報を示す。
【0095】
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに関する情報として、それぞれの符号化深度の符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を符号化して伝送する。
【0096】
パーティションタイプに関する情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態に関する情報を示す。例えば、サイズ2N×2Nの現在符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、サイズN×Nのパーティション808のうちいずれか1つのタイプに分割されて用いられる。この場合、現在符号化単位のパーティションタイプに関する情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806及びサイズN×Nのパーティション808のうち1つを示すように設定される。
【0097】
予測モードに関する情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに関する情報810を通じて、パーティションタイプに関する情報800の示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち1つで予測符号化が行われるかどうかが設定される。
【0098】
また、変換単位サイズに関する情報820は、現在符号化単位をいかなる変換単位に基づいて周波数変換を行うかを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インタ変換単位サイズ826、第2イントラ変換単位サイズ828のうち1つである。
【0099】
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を抽出して復号化に用いる。
【0100】
図9は、本発明の一実施形態による深度別符号化単位を示す。
【0101】
深度の変化を示すために分割情報が用いられる。分割情報は、現在深度の符号化単位が下位深度の符号化単位に分割されるかどうかを示す。
【0102】
深度0及び2N_0×2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0×2N_0サイズのパーティションタイプ912、2N_0×N_0サイズのパーティションタイプ914、N_0×2N_0サイズのパーティションタイプ916、N_0×N_0サイズのパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912、914、916、918のみ例示されているが、前述したようにパーティションタイプはこれに限定されず、非対称的なパーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含む。
【0103】
パーティションタイプごとに、1つの2N_0×2N_0サイズのパーティション、2つの2N_0×N_0サイズのパーティション、2つのN_0×2N_0サイズのパーティション、4つのN_0×N_0サイズのパーティションごとに繰り返して予測符号化が行われねばならない。サイズ2N_0×2N_0、サイズN_0×2N_0及びサイズ2N_0×N_0及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。サイズ2N_0×2N_0のパーティションについてのみ、スキップモードで予測符号化が行われる。
【0104】
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912、914、916のうち1つによる符号化誤差が最も小さければ、これ以上下位深度に分割する必要がない。
【0105】
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更しつつ分割し(920)、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930について繰り返して符号化を行って最小符号化誤差を検索する。
【0106】
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含む。
【0107】
また、サイズN_1xN_1サイズのパーティションタイプ948による符号化誤差が最も小さければ、深度1を深度2に変更しつつ分割し(950)、深度2及びサイズN_2×N_2の符号化単位960について繰り返して符号化を行って最小符号化誤差を検索する。
【0108】
最大深度がdの場合、深度別分割情報は深度d−1の時まで設定され、分割情報は深度d−2の時まで設定される。すなわち、深度d−2から分割(950)されて深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、サイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
【0109】
パーティションタイプのうち、1つのサイズ2N_(d−1)×2N_(d−1)のパーティション、2つのサイズ2N_(d−1)×N_(d−1)のパーティション、2つのサイズN_(d−1)×2N_(d−1)のパーティション、4つのサイズN_(d−1)×N_(d−1)のパーティションごとに繰り返して予測符号化を通じる符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
【0110】
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)はこれ以上下位深度への分割過程を経ず、現在最大符号化単位900についての符号化深度が深度d−1と定められ、パーティションタイプはN_(d−1)×N_(d−1)と定められる。また最大深度がdであるので、深度d−1の符号化単位952について分割情報は設定されない。
【0111】
データ単位999は、現在最大符号化単位についての‘最小単位’と称する。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。このような繰り返しの符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較して最も小さな符号化誤差が発生する深度を選択して符号化深度を定め、該パーティションタイプ及び予測モードが符号化深度の符号化モードと設定される。
【0112】
このような形で深度0、1、…、d−1、dのすべての深度別最小符号化誤差を比較して、誤差の最も小さな深度が選択されて符号化深度と定められる。符号化深度、及び予測単位のパーティションタイプ及び予測モードは、符号化モードに関する情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されねばならないので、符号化深度の分割情報のみ‘0’に設定され、符号化深度を除いた深度別分割情報は‘1’に設定されねばならない。
【0113】
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900についての符号化深度及び予測単位に関する情報を抽出して符号化単位912の復号化に用いる。一実施形態によるビデオ復号化装置200は、深度別分割情報を用いて分割情報が‘0’の深度を符号化深度と把握し、該深度についての符号化モードに関する情報を用いて復号化に用いる。
【0114】
図10ないし
図12はそれぞれ、本発明の一実施形態による符号化単位、予測単位、周波数変換単位の関係を示す。
【0115】
符号化単位1010は、最大符号化単位について一実施形態によるビデオ符号化装置100が定めた符号化深度別符号化単位である。予測単位1060は、符号化単位1010のうちそれぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
【0116】
深度別符号化単位1010は、最大符号化単位の深度が0ならば、符号化単位1012、1054は深度が1、符号化単位1014、1016、1018、1028、1050、1052は深度が2、符号化単位1020、1022、1024、1026、1030、1032、1048は深度が3、符号化単位1040、1042、1044、1046は深度が4である。
【0117】
予測単位1060のうち一部のパーティション1014、1016、1022、1032、1048、1050、1052、1054は、符号化単位が分割された形態である。すなわち、パーティション1014、1022、1050、1054は、2N×Nのパーティションタイプであり、パーティション1016、1048、1052は、N×2Nのパーティションタイプ、パーティション1032は、N×Nのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、または同一である。
【0118】
変換単位1070のうち一部1052の映像データについては、符号化単位に比べて小さなサイズのデータ単位で周波数変換または周波数逆変換が行われる。また、変換単位1014、1016、1022、1032、1048、1050、1052、1054は、予測単位1060のうち該予測単位及びパーティションと比較すれば、互いに異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、同じ符号化単位についてのイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であっても、それぞれ別途のデータ単位に基づいて行える。
【0119】
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われて最適符号化単位が定められることで、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位についての分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含む。以下の表1は、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200で設定できる一例を示す。
【0120】
【表1】
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位についての符号化情報を抽出できる。
【0121】
分割情報は、現在符号化単位が下位深度の符号化単位に分割されるかどうかを示す。現在深度dの分割情報が0ならば、現在符号化単位が下位符号化単位にこれ以上分割されない深度が符号化深度であるので、符号化深度についてパーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって1段階さらに分割されねばならない場合には、分割された4個の下位深度の符号化単位ごとに独立して符号化が行われねばならない。
【0122】
予測モードは、イントラモード、インターモード及びスキップモードのうち1つで示す。イントラモード及びインターモードは、すべてのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
【0123】
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的パーティションタイプ2N×2N、2N×N、N×2N及びN×Nと、非対称的な割合で分割された非対称的パーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nとを示す。非対称的パーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
【0124】
変換単位サイズは、イントラモードで2種のサイズ、インターモードで2種のサイズに設定される。すなわち、変換単位分割情報が0ならば、変換単位のサイズが現在符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1ならば、現在符号化単位が分割されたサイズの変換単位が設定される。またサイズ2N×2Nの現在符号化単位についてのパーティションタイプが対称形パーティションタイプならば、変換単位のサイズはN×N、非対称形パーティションタイプならば、N/2×N/2に設定される。
【0125】
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも1つについて割り当てられる。符号化深度の符号化単位は、同じ符号化情報を保有している予測単位及び最小単位を1つ以上含む。
【0126】
したがって、隣接しているデータ単位同士でそれぞれ保有している符号化情報を確認すれば、同じ符号化深度の符号化単位に含まれるかどうかが確認される。また、データ単位が保有している符号化情報を用いれば、該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
【0127】
したがって、この場合に現在符号化単位が周辺データ単位を参照して予測符号化が行われる場合、現在符号化単位に隣接している深度別符号化単位内のデータ単位の符号化情報が直接参照されて用いられる。
【0128】
さらに他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接している深度別符号化単位の符号化情報を用いて、深度別符号化単位内で現在符号化単位に隣接しているデータが検索されることで周辺符号化単位が参照されてもよい。
【0129】
図13は、表1の符号化モード情報による符号化単位、予測単位、変換単位の関係を示す。
【0130】
最大符号化単位1300は、符号化深度の符号化単位1302、1304、1306、1312、1314、1316、1318を含む。このうち1つの符号化単位1318は符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定される。
【0131】
パーティションタイプ情報が対称形パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち1つに設定されている場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1ならば、サイズN×Nの変換単位1344が設定される。
【0132】
パーティションタイプ情報が非対称形パーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定された場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1ならば、サイズN/2×N/2の変換単位1354が設定される。
【0133】
以下、
図4の本発明の一実施形態による映像符号化装置100のイントラ予測部410及び
図5の映像復号化装置200のイントラ予測部550で、予測単位について行われるイントラ予測について具体的に説明する。
【0134】
イントラ予測部410、550は、現在予測単位の予測値を、現在予測単位の周辺ピクセルを用いて獲得するイントラ予測を行う。本発明の一実施形態によるイントラ予測部410、550は、予測単位16×16以上の大きいサイズを持つことを考慮して、従来技術による限定された方向性を持つイントラ予測モード以外に、(dx,dy)パラメタを用いた多様な方向性を持つイントラ予測モードをさらに行う。本発明の一実施形態による多様な方向性を持つイントラ予測モードについては後述する。
【0135】
また、本発明の一実施形態によるイントラ予測部410、550は、現在ピクセルの予測子(predictor)を獲得するために、現在ピクセルの水平方向の線形補間を通じて予測子P1を生成し、垂直方向の線形補間を通じて予測子P2を生成して、予測子P1及びP2の平均値を現在ピクセルの予測子として用いる。このような水平方向の線形補間及び垂直方向の線形補間を通じて獲得された予測子を結合して現在ピクセルの予測子を生成するイントラ予測モードを、プランナーモードと定義する。特に、本発明の一実施形態によるイントラ予測部410、550は、プランナーモードで現在予測単位の右上側に位置している少なくとも1つ以上の周辺ピクセルを用いて水平方向の線形補間に用いられる仮想のピクセルを生成し、左下側に位置している少なくとも1つ以上の周辺ピクセルを用いて垂直方向の線形補間に用いられる仮想のピクセルを生成する。本発明の一実施形態によるプランナーモードについては後述する。
【0136】
図14は、本発明の一実施形態による予測単位のサイズによるイントラ予測モードの数を示す。
【0137】
イントラ予測部410、550は、予測単位のサイズによって予測単位に適用するイントラ予測モードの数を多様に設定できる。一例として
図14を参照すれば、イントラ予測される予測単位のサイズをN×Nとすれば、2x2、4×4、8×8、16×16、32×32、64×64、128×128サイズの予測単位それぞれについして実際に行われるイントラ予測モードの数は、それぞれ5、9、9、17、33、5、5個(Example 2の場合)に設定される。このように予測単位のサイズによって実際に行われるイントラ予測モードの数を差別化する理由は、予測単位のサイズによって予測モード情報を符号化するためのオーバヘッドが異なるからである。すなわち、予測単位の場合、全体映像で占める部分が小さいにもかかわらず、このような小さな予測単位の予測モードなどの付加情報を伝送するためのオーバヘッドが増加する。よって、小さなサイズの予測単位をあまりにも多い予測モードで符号化する場合、ビット量が増加して圧縮効率が低下する。また、大きいサイズを持つ予測単位、例えば64×64以上のサイズを持つ予測単位は、一般的に映像の平坦な領域についての予測単位として選択される場合が多いため、このような平坦な領域の符号化に多く選択される大きいサイズの予測単位をあまりにも多い数の予測モードで符号化することも、圧縮効率側面で非効率的である。よって、予測単位のサイズが所定サイズより非常に大きいか、または小さな場合には、相対的に小数のイントラ予測モードのみを適用させる。このような予測単位のサイズによって適用されるイントラ予測モードの数は、
図14に限定されずに多様に設定される。
図14に示された各予測単位のサイズによって適用される予測モードの数は一実施形態に過ぎず、各予測単位のサイズによる予測モードの数は変更される。また、各予測単位に適用されるイントラ予測モードの数は、予測単位のサイズに関係なく常に一定に設定される。
【0138】
本発明の一実施形態によるイントラ予測部410、550は、予測単位に適用されるイントラ予測モードとして、予測単位内のピクセルを中心として所定の勾配を持つラインを用いて周辺参照ピクセルを定め、定められた周辺参照ピクセルをピクセルの予測子として用いるイントラ予測モードが含まれる。このようなラインの勾配は、(dx,dy)パラメタ(dx、dyは、整数)を用いて設定される。一例として、33個の予測モードをそれぞれmode N(Nは、0〜32の整数)と定義する時、mode 0は垂直モード、mode 1は水平モード、mode 2はDCモード、mode 3はプレーンモード、mode 32はプランナーモードと設定し、mode 4〜mode 31それぞれは、次の表1に表記したような(1,−1)、(1,1)、(1,2)、(2,1)、(1,−2)、(2,1)、(1,−2)、(2,−1)、(2,−11)、(5,−7)、(10,−7)、(11,3)、(4,3)、(1,11)、(1,−1)、(12,−3)、(1,−11)、(1,−7)、(3,−10)、(5,−6)、(7,−6)、(7,−4)、(11,1)、(6,1)、(8,3)、(5,3)、(5,7)、(2,7)、(5,−7)、(4,−3)のうち1つの値に表現される(dx,dy)を用いて、tan
−1(dy/dx)の方向性を持つラインを用いて周辺参照ピクセルを定め、定められた周辺参照ピクセルを予測に用いるイントラ予測モードと定義できる。
【0140】
イントラ予測部410、550で用いられるイントラ予測モードの数は、表2に限定されず、現在予測単位が色差成分であるかまたは輝度成分であるか、現在予測単位のサイズなどの情報に基づいて多様に設定され、また、各mode Nがいかなるイントラ予測モードを示すかも多様に設定される。一例として、全体イントラ予測モードの数を36個に設定し、mode 0は、後述するプランナーモード、mode 1はDCモード、mode 2〜34は、後述する一例のように33個の方向性を持つイントラ予測モード、mode 35は、色差成分の予測単位について対応する輝度成分の予測単位を用いたモード(Intra_FromLuma)と定義してもよい。Mode 35の輝度成分の予測単位から対応する色差成分の予測単位を行うイントラ予測モード(Intra_FromLuma)は、色差成分の予測単位のみについて適用され、輝度成分の予測単位のイントラ予測時には用いられない。
【0141】
図15は、本発明の一実施形態による多様な方向性を持つイントラ予測モードを説明するための参照図である。
【0142】
前述したように、本発明の一実施形態によるイントラ予測部410、550は、複数の(dx,dy)パラメータを用いて定められるtan
−1(dy/dx)の勾配を持つラインを用いて周辺参照ピクセルを定め、定められた周辺参照ピクセルを用いて予測を行う。
【0143】
図15を参照すれば、現在予測単位内部の予測しようとする現在ピクセルPを中心として、表2に表記したモード別(dx,dy)の値によって定められるtan
−1(dy/dx)の角度を持つ延長線150上に位置している周辺ピクセルA、Bを現在ピクセルPの予測子として用いる。この時、予測子として用いられる周辺ピクセルは、以前に符号化されて復元された、現在予測単位の上側、左側、右上側及び左下側の以前予測単位のピクセルであることが望ましい。このように多様な方向性を持つイントラ予測モードによって予測符号化を行うことで、映像の特性によってさらに効率的な圧縮が可能である。
【0144】
図15で、延長線150に位置しているか、または延長線150に近い周辺ピクセルを用いて現在ピクセルPの予測子を生成する場合、延長線150は実際にtan
−1(dy/dx)の方向性を持つが、このような延長線150を用いた周辺ピクセルの決定のためには(dy/dx)の割り算演算が必要なため、ハードウェアやソフトウェアで具現時に小数点演算を含むことができて演算量を増加させる要因になる。よって、参照ピクセルを選択するための予測方向を、dx、dyパラメタを用いて設定する時、演算量を低減させるようにdx、dyを設定する必要がある。
【0145】
図16は、本発明の一実施形態によって(dx,dy)の方向性を持つ延長線上に位置している周辺ピクセルと現在ピクセルとの関係を説明するための図面である。
図16を参照すれば、(j,i)に位置している現在ピクセルをP 1610、現在ピクセルP 1610を過ぎるtan
−1(dy/dx)の方向性、すなわち、勾配を持つ延長線上に位置している上側周辺ピクセルをA 1611、左側周辺ピクセルをB 1612と定義する。現在ピクセルP 1610が含まれた予測単位のサイズがnS×nS(nSは、正の整数)であり、予測単位の各ピクセルの位置は、(0,0)から(nS−1,nS−1)のうち1つであり、x軸上に位置している上側周辺ピクセルの位置を(m,−1)(mは、整数)、y軸上に位置している左側周辺ピクセルの位置を(−1,n)(nは、整数)と仮定する。現在ピクセルP 1610を過ぎる延長線と合う上側周辺ピクセルA 1611の位置は(j+i*dx/dy,−1)、左側周辺ピクセルB 1612の位置は(−1,i+j*dy/dx)である。よって、現在ピクセルP 1610の予測のために、上側周辺ピクセルA 1611または左側周辺ピクセルB 1612を定めるためには、dx/dyまたはdy/dxのような割り算演算が必要である。前述したように、このような割り算演算は演算複雑度が高いため、ソフトウェアまたはハードウェアの具現時に演算速度の低下をもたらす。よって、周辺ピクセルを定めるための予測モードの方向性を示すdx及びdyのうち少なくとも1つの値を2の指数乗と定める。すなわち、n、mをそれぞれ整数とする時、dx及びdyは、それぞれ2^n、2^mである。
【0146】
現在ピクセルP 1610の予測子として左側周辺ピクセルB 1612が用いられ、dxが2^nの値を持つ場合、左側周辺ピクセルB 1612の位置である(−1、i+j*dy/dx)を定めるために必要なj*dy/dx演算は(i*dy)/(2^n)であり、このような2の指数乗で割り算を行う演算は、(i*dy)>>nのようにシフト演算を通じて具現されるため、演算量が減少する。
【0147】
類似して、現在ピクセルP 1610の予測子として上側周辺ピクセルA 1611が用いられ、dyが2^mの値を持つ場合、上側周辺ピクセルAの位置である(j+i*dx/dy、−1)を定めるために必要なi*dx/dy演算は(i*dx)/(2^m)であり、このような2の指数乗で割り算を行う演算は、(i*dx)>>mのようにシフト演算を通じて具現される。
【0148】
図17及び
図18は、本発明の一実施形態によるイントラ予測モード方向を示す図面である。
【0149】
一般的に、映像やビデオ信号で現われる直線パターンは、垂直や水平方向の場合が多い。よって、(dx,dy)のパラメタを用いて多様な方向性を持つイントラ予測モードを定義する時、次のようにdx、dyの値を定義することで映像のコーディング効率を向上させる。
【0150】
具体的に、dyが2^mの値に固定された値を持つ場合、dxの絶対値は、垂直方向に近い予測方向間の間隔は狭く設定され、水平方向に近い予測方向であるほど予測モード間の間隔が広くなるように設定される。例えば、
図17を参照すれば、dyが2^5、すなわち、32の値を持つ場合、dxの値を2、5、9、13、17、21、26、32、−2、−5、−9、−13、−17、−21、−26、−32のように設定することで、垂直方向に近い予測方向間の間隔は相対的に狭く設定され、水平方向に近い予測方向であるほど予測モード間の間隔が相対的に広く設定される。
【0151】
類似して、dxが2^nの値に固定された値を持つ場合、dyの絶対値は、水平方向に近い予測方向間の間隔は狭く設定され、垂直方向に近い予測方向であるほど予測モード間の間隔が広く設定される。例えば、
図18を参照すれば、dxが2^5、すなわち、32の値を持つ場合、dyの値を2、5、9、13、17、21、26、32、−2、−5、−9、−13、−17、−21、−26、−32のように設定することで、水平方向に近い予測方向間の間隔は狭く設定され、垂直方向に近い予測方向であるほど予測モード間の間隔が広く設定される。
【0152】
また、dx及びdyののうちいずれか1つの値が固定された時、固定されていない残りの値は予測モード別に増加するように設定される。例えば、dyが固定された場合、dx間の間隔が所定値ほど増加するように設定される。また、このような増加幅は、水平方向と垂直方向との間の角度を所定単位で区分し、区分された角度別に設定されてもよい。例えば、dyが固定された場合、dxの値は垂直軸との角度が15°以内の区間では、aという増加幅を持ち、15°と30°との間ではbという増加幅を持ち、30°以上ではcという増加幅を持つように設定される。
【0153】
一例として、(dx,dy)を用いてtan
−1(dy/dx)の方向性を持つ予測モードは、次の表3ないし表5に表記した(dx,dy)パラメタで定義される。
【0154】
【表3】
前述したように(dx,dy)パラメータを用いる各イントラ予測モードは、(j,i)に位置しているピクセルの予測子として、左側の周辺ピクセル(−1,i+j*dy/dx)または上側の周辺ピクセル(j+i*dx/dy,−1)を用いる。表2のように、dxまたはdyの値のうち少なくとも1つが2の指数乗を持つ場合、左側の周辺ピクセル(−1,i+j*dy/dx)及び上側の周辺ピクセル(j+i*dx/dy,−1)の位置は、割り算演算なしに乗算及びシフト演算のみで獲得される。前述した表2による(dx,dy)の値のうちdxが32の場合のように、dxが2^nの値を持つ場合、dxを用いた割り算演算は右側シフト演算に取り替えられるので、左側の周辺ピクセルの位置は、(i*dy)>>nの値に基づいて割り算演算なしに獲得される。類似して、表2による(dx,dy)の値のうちdyが32の場合のように、dyが2^mの値を持つ場合、dyを用いた割り算演算は右側シフト演算に取り替えられるので、上側の周辺ピクセルの位置は、(i*dx)>>mの値に基づいて割り算演算なしに獲得される。
【0155】
図19は、本発明の一実施形態による33個の方向性を持つイントラ予測モードの方向を示す図面である。
図19を参照すれば、イントラ予測部410、550は、図示されたような33個の方向性を持つイントラ予測モードによって、現在ピクセルの予測子として用いられる周辺ピクセルを定める。前述したように、各イントラ予測モードによる方向は、水平方向や垂直方向に近いほど予測モードの間の間隔は狭く設定され、垂直方向や水平方向から遠くなるほど予測モード間の間隔が広く設定される。
【0156】
図20A及び
図20Bは、本発明の一実施形態によるプランナーモードを説明するための図面である。
【0157】
前述したように、イントラ予測部410、550は、プランナーモードで現在予測単位の右上側に位置している少なくとも1つ以上の周辺ピクセルを用いて、水平方向の線形補間に用いられる仮想のピクセルを生成し、左下側に位置している少なくとも1つ以上の周辺ピクセルを用いて、垂直方向の線形補間に用いられる仮想のピクセルを生成する。そして、イントラ予測部410、550は、仮想のピクセル及び周辺ピクセルを用いた水平方向及び垂直方向の線形補間を通じて生成された2つの予測子の平均値を用いて、現在ピクセルの予測値を生成する。
【0158】
図20Aを参照すれば、イントラ予測部410、550は、現在予測単位2010の右上側に位置している少なくとも1つの周辺ピクセル2020を用いて、現在予測単位2010の予測される現在ピクセル2011と同じ行に位置しつつ、現在予測単位の最右側に位置しているピクセルに対応する仮想の第1ピクセル2012を獲得する。第1ピクセル2012の獲得に用いられる右上側周辺ピクセル2020の数は予め設定される。例えば、イントラ予測部410、550は、最初の2個の右上側周辺ピクセルであるT1 2021及びT2 2022の平均値や加重平均値を用いて生成された値を、第1ピクセル2012と定める。
【0159】
また、イントラ予測部410、550は、第1ピクセル2012の獲得に用いられる右上側周辺ピクセル2020の数を、現在予測単位2010のサイズに基づいて定める。例えば、現在予測単位のサイズをnS×nS(nSは、整数)とすれば、イントラ予測部410、550は、第1ピクセル2012の獲得に用いられる右上側周辺ピクセル2020のうちnS/(2^m)(mは、2^mがnSより大きくない条件を満たす整数)個の右上側周辺ピクセルを選択し、選択された右上側周辺ピクセルの平均値や加重平均値などを用いて第1ピクセル2012を獲得する。すなわち、イントラ予測部410、550は、右上側周辺ピクセル2020のうちnS/2、nS/4、nS/8、…個のピクセルを選択できる。例えば、現在予測単位2010のサイズが32×32の場合、イントラ予測部410、550は、32/2、32/4、32/8、32/16、32/32、すなわち、1〜16個の右上側周辺ピクセルを選択できる。
【0160】
類似して、
図20Bを参照すれば、イントラ予測部410、550は、現在予測単位2010の左下側に位置している少なくとも1つの周辺ピクセル2030を用いて、現在予測単位2010の予測される現在ピクセル2011と同じ列に位置しつつ、現在予測単位の最下側に位置しているピクセルに対応する仮想の第2ピクセル2014を獲得する。第2ピクセル2014の獲得に用いられる左下側周辺ピクセル2030の数は、予め設定される。例えば、イントラ予測部410、550は、最初の2個の左下側周辺ピクセルであるL1 2031及びL2 2032の平均値や加重平均値を用いて生成された値を、第2ピクセル2014と定める。
【0161】
また、イントラ予測部410、550は、第2ピクセル2014の獲得に用いられる左下側周辺ピクセル2030の数を、現在予測単位2010のサイズに基づいて定める。前述した例のように、現在予測単位のサイズをnS×nS(nSは、整数)とする時、イントラ予測部410、550は、第2ピクセル2014の獲得に用いられる左下側周辺ピクセル2030のうちnS/(2^m)(mは、2^mがnSより大きくない条件を満たす整数)個の左下側周辺ピクセルを選択し、選択された左下側周辺ピクセルの平均値や加重平均値などを用いて第2ピクセル2014を獲得する。
【0162】
一方、右上側周辺ピクセル2020が、現在予測単位2010以後に符号化される予測単位に含まれていて利用不可の場合ならば、イントラ予測部410、550は、右上側周辺ピクセル2020と左側に最も近いT0ピクセルを仮想の第1ピクセル2012として用いられる。また、左下側周辺ピクセル2030が、現在予測単位2010以後に符号化される予測単位に含まれていて利用不可の場合ならば、イントラ予測部410、550は、左下側周辺ピクセル2040と上側に最も近いL0ピクセルを仮想の第2ピクセル2014として用いられる。
【0163】
再び
図20Aを参照すれば、イントラ予測部410、550は、右上側周辺ピクセル2020から獲得された第1ピクセル2012と現在ピクセル2011との距離、現在ピクセル2011とそれと同じ行に位置している左側周辺ピクセル2013との距離を考慮した幾何平均値を用いて線形補間を行うことで、現在ピクセル2011の第1予測値P1を生成する。
【0164】
現在予測単位2010の現在ピクセル2011の位置を(x,y)(x,y=0、1、…nS−1)、現在予測単位2010の周辺ピクセルをrec(x,y)(x,y=−1…2*nS−1)とする時、左側周辺ピクセル2012のピクセル値はrec(−1,y)であり、(nS−1、y)に位置している第1ピクセル2012のピクセル値をT(Tは、実数)、現在ピクセルの予測値をp(x,y)(x,y=0…nS−1)とすれば、第1予測値p1(x,y)は、次の数式;p1(x,y)=(nS−1−x)*rec(−1,y)+(x+1)*Tによって獲得される。前記数式で(ns−1−x)は、現在ピクセル2011課題1ピクセル2012との距離に当たり、(x+1)は、現在ピクセル2011と左側周辺ピクセル2013との距離に当たる。このように、イントラ予測部410、550は、第1ピクセル2012と現在ピクセル2011との距離、現在ピクセル2011とそれと同じ行に位置している左側周辺ピクセル2013との距離、及び第1ピクセル2012のピクセル値と左側周辺ピクセル2013のピクセル値とを用いた線形補間を通じて第1予測値P1を生成する。
【0165】
再び
図20Bを参照すれば、イントラ予測部410、550は、左下側周辺ピクセル2030から獲得された第2ピクセル2014と現在ピクセル2011との距離、現在ピクセル2011とそれと同じ列に位置している上側周辺ピクセル2015との距離を考慮した幾何平均値を用いて線形補間を行うことで、現在ピクセル2011の第2予測値P2を生成する。
【0166】
現在予測単位2010の現在ピクセル2011の位置を(x,y)(x,y=0、1、…nS−1)、現在予測単位2010の周辺ピクセルをrec(x,y)(x,y=−1…2*nS−1)とする時、上側周辺ピクセル2015のピクセル値はrec(x,−1)であり、(x,nS−1)に位置している第2ピクセル2014のピクセル値をL(Lは、実数)、現在ピクセル2011の予測値をp(x,y)(x,y=0…nS−1)とすれば、第2予測値p2(x,y)は、次の数式;p2(x,y)=(nS−1−y)*rec(x,−1)+(y+1)*Lによって獲得される。前記数式で(ns−1−y)は、現在ピクセル2011と第2ピクセル2014との距離に当たり、(y+1)は、現在ピクセル2011と上側周辺ピクセル2015との距離に当たる。このように、イントラ予測部410、550は、第2ピクセル2014と現在ピクセル2011との距離、現在ピクセル2011とそれと同じ列に位置している上側周辺ピクセル2015との距離、及び第2ピクセル2014のピクセル値と上側周辺ピクセル2015のピクセル値とを用いた線形補間を通じて第2予測値P2を生成する。
【0167】
このように、水平方向及び垂直方向の線形補間を通じて、第1予測値p1(x,y)及び第2予測値p2(x,y)が獲得されれば、イントラ予測部410、550は、第1予測値p1(x,y)及び第2予測値p2(x,y)の平均値を用いて現在ピクセルの予測値p(x,y)を獲得する。具体的に、イントラ予測部410、550は、次の数式;p(x,y)={p1(x,y)+p2(x,y)+nS}>>(k+1)(kは、log
2nS)によって現在ピクセルの予測値p(x,y)を獲得する。
【0168】
一方、イントラ予測部410、550は、第1ピクセル及び第2ピクセルの獲得に用いられる右上側周辺ピクセル及び左下側周辺ピクセルをそのまま用いるものではなく、フィルタリングされた右上側周辺ピクセル及び左下側周辺ピクセルを用いて第1ピクセル及び第2ピクセルを獲得する。
【0169】
図21は、本発明の一実施形態によって現在予測単位周辺のフィルタリングされる周辺ピクセルを示す図面である。
図21を参照すれば、イントラ予測部410、550は、現在イントラ予測される現在予測単位2100の上側のX個の周辺ピクセル2110及び左側のY個の周辺ピクセル2120について少なくとも1回以上のフィルタリングを行って、フィルタリングされた周辺ピクセルを生成する。ここで、現在予測単位2100のサイズをnS×nSとすれば、X=2nS、Y=2nSであることが望ましい。
【0170】
nS×nSサイズの現在予測単位2100の上側及び左側に隣接しているX+Y個の原周辺ピクセルをContextOrg[n](nは、0からX+Y−1までの整数)とすれば、左側の周辺ピクセルのうち最下端の周辺ピクセルがn=0の場合、すなわち、ContextOrg[0]であり、かつ上側の周辺ピクセルのうち最右側の周辺ピクセルがn=X+Y−1、すなわち、ContextOrg[X+Y−1]に設定される。
【0171】
図22は、周辺ピクセルのフィルタリング過程を説明するための参照図である。
図22を参照すれば、現在予測単位の上側及び左側に隣接している原周辺ピクセルをContextOrg[n](nは0から4nS−1までの整数)とすれば、原周辺ピクセル間の加重平均値を通じて原周辺ピクセルがフィルタリングされる。第1回フィルタリングされた周辺ピクセルをContextFiltered1[n]とすれば、次の数式;ContextFiltered1[n]=(ContextOrg[n−1]+2*ContextOrg[n]+ContextOrg[n+1])/4のように、原周辺ピクセル(ContextOrg[n])に3タップフィルタを適用してフィルタリングされた周辺ピクセルが獲得される。類似して、第1回フィルタリングされた周辺ピクセル(ContextFiltered1[n])間の加重平均値を再び計算して、第2回フィルタリングされた周辺ピクセル(ContextFiltered2[n])を生成してもよい。例えば、次の数式;ContextFiltered2[n]=(ContextFiltered1[n−1]+2*ContextFiltered1[n]+ContextFiltered1[n+1])/4のようにフィルタリングされた周辺ピクセル(ContextFiltered1[n])に3タップフィルタを適用してフィルタリングされた周辺ピクセルを生成してもよい。
【0172】
これに限定されずに多様な方式で周辺ピクセルをフィルタリングした後、イントラ予測部410、550は、前述したように少なくとも1つ以上のフィルタリングされた右上側周辺ピクセルから第1ピクセルを獲得し、少なくとも1つ以上のフィルタリングされた左下側周辺ピクセルから第2ピクセルを獲得した後、前述したような線形補間を通じて現在ピクセルの予測値を生成できる。このようなフィルタリングされた周辺ピクセルを用いるかどうかは、現在予測単位のサイズに基づいて定められる。例えば、フィルタリングされた周辺ピクセルは、現在予測単位のサイズが16×16以上の場合にのみ用いられる。
【0173】
図23は、本発明の一実施形態によるプランナーモードによるイントラ予測方法を示すフローチャートである。
【0174】
段階2310で、イントラ予測部410、550は、現在予測単位の右上側に位置している少なくとも1つの周辺ピクセルを用いて、現在予測単位の予測される現在ピクセルと同じ行に位置しつつ、現在予測単位の最右側に位置しているピクセルに対応する仮想の第1ピクセルを獲得する。前述したように、第1ピクセルの獲得に用いられる右上側の周辺ピクセルの数は予め設定されるか、または現在予測単位のサイズに基づいて定められる。
【0175】
段階2320で、イントラ予測部410、550は、現在予測単位の左下側に位置している少なくとも1つの周辺ピクセルを用いて、現在ピクセルと同じ列に位置しつつ、現在予測単位の最下側に位置しているピクセルに対応する仮想の第2ピクセルを獲得する。前述したように、第2ピクセルの獲得に用いられる左下側の周辺ピクセルの数は、予め設定されるか、または現在予測単位のサイズに基づいて定められる。
【0176】
段階2330で、イントラ予測部410、550は、第1ピクセル及び現在ピクセルと同じ行に位置している左側周辺ピクセルを用いた線形補間を通じて、現在ピクセルの第1予測値を獲得する。前述したように、現在ピクセルの位置を(x,y)(x,y=0、1、…nS−1)、現在予測単位の周辺ピクセルをrec(x,y)(x,y=−1…2*nS−1)とする時、左側周辺ピクセルのピクセル値はrec(−1,y)であり、(nS−1、y)に位置している第1ピクセルのピクセル値をT(Tは、実数)、現在ピクセルの予測値をp(x,y)(x,y=0…nS−1)とすれば、第1予測値p1(x,y)は、次の数式;p1(x,y)=(nS−1−x)*rec(−1,y)+(x+1)*Tによって獲得される。
【0177】
段階2340で、イントラ予測部410、550は、第2ピクセル及び現在ピクセルと同じ列に位置している上側周辺ピクセルを用いた線形補間を通じて、現在ピクセルの第2予測値を獲得する。上側周辺ピクセルのピクセル値はrec(x,−1)であり、(x,nS−1)に位置している第2ピクセルのピクセル値をL(Lは、実数)とすれば、第2予測値p2(x,y)は、次の数式;p2(x,y)=(nS−1−y)*rec(x,−1)+(y+1)*Lによって獲得される。
【0178】
段階2350で、イントラ予測部410、550は、第1予測値及び第2予測値を用いて現在ピクセルの予測値を獲得する。前述したように、水平方向及び垂直方向の線形補間を通じて第1予測値p1(x,y)及び第2予測値p2(x,y)が獲得されれば、イントラ予測部410、550は、第1予測値p1(x,y)及び第2予測値p2(x,y)の平均値を用いて現在ピクセルの予測値p(x,y)を獲得する。具体的に、イントラ予測部410、550は、次の数式;p(x,y)={p1(x,y)+p2(x,y)+nS}>>(k+1)(kはlog
2nS)によって現在ピクセルの予測値p(x,y)を獲得する。
【0179】
本発明はまた、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるすべての記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。またコンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして保存されて実行される。
【0180】
これまで本発明についてその望ましい実施形態を中心として説明した。当業者ならば、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されるということを理解できるであろう。本発明の範囲は、前述した説明ではなく特許請求の範囲に現われており、それと同等な範囲内にあるすべての差は本発明に含まれていると解釈されねばならない。
【0181】
なお、実施形態に関して次の付記を記す。
(付記1) 映像のイントラ予測方法において、
現在予測単位の右上側に位置している少なくとも1つの周辺ピクセルを用いて、前記現在予測単位の予測される現在ピクセルと同じ行に位置しつつ、前記現在予測単位の最右側に位置しているピクセルに対応する仮想の第1ピクセルを獲得する段階と、
前記現在予測単位の左下側に位置している少なくとも1つの周辺ピクセルを用いて前記現在ピクセルと同じ列に位置しつつ、前記現在予測単位の最下側に位置しているピクセルに対応する仮想の第2ピクセルを獲得する段階と、
前記第1ピクセル及び前記現在ピクセルと同じ行に位置している左側周辺ピクセルを用いた線形補間を通じて、前記現在ピクセルの第1予測値を獲得する段階と、
前記第2ピクセル及び前記現在ピクセルと同じ列に位置している上側周辺ピクセルを用いた線形補間を通じて、前記現在ピクセルの第2予測値を獲得する段階と、
前記第1予測値及び前記第2予測値を用いて前記現在ピクセルの予測値を獲得する段階と、を含むことを特徴とする映像のイントラ予測方法。
(付記2) 前記第1ピクセルは、前記現在予測単位の右上側に位置している2個のピクセルの平均値を用いて獲得され、
前記第2ピクセルは、前記現在予測単位の左下側に位置している2個のピクセルの平均値を用いて獲得されることを特徴とする付記1に記載の映像のイントラ予測方法。
(付記3) 前記第1ピクセル及び前記第2ピクセルの獲得に用いられる前記現在予測単位の右上側に位置している周辺ピクセルの数、及び左下側に位置している周辺ピクセルの数は、前記現在予測単位のサイズに基づいて定められることを特徴とする付記1に記載の映像のイントラ予測方法。
(付記4) 前記現在予測単位のサイズをN×N(Nは、整数)とする時、前記第1ピクセル及び前記第2ピクセルの獲得に用いられる前記現在予測単位の右上側に位置している周辺ピクセルの数、及び左下側に位置している周辺ピクセルの数は、N/(2^m)(mは、2^mがNより大きくない条件を満たす整数)であることを特徴とする付記3に記載の映像のイントラ予測方法。
(付記5) 前記第1ピクセル及び第2ピクセルは、前記周辺ピクセルの平均値を用いて獲得されることを特徴とする付記1に記載の映像のイントラ予測方法。
(付記6) 前記第1ピクセル及び第2ピクセルは、前記周辺ピクセルの加重平均値を用いて獲得されることを特徴とする付記1に記載の映像のイントラ予測方法。
(付記7) 前記第1予測値を獲得する段階は、
前記第1ピクセルと前記現在ピクセルとの距離、前記現在ピクセルと同じ行に位置している左側周辺ピクセル間の距離を考慮した幾何平均値を用いて前記第1予測値を獲得し、
前記第2予測値を獲得する段階は、
前記第2ピクセルと前記現在ピクセルとの距離、前記現在ピクセルとそれと同じ列に位置している上側周辺ピクセルとの距離を考慮した幾何平均値を用いて前記第2予測値を獲得することを特徴とする付記1に記載の映像のイントラ予測方法。
(付記8) 前記現在予測単位は、nS×nS(nSは、整数)であり、前記現在予測単位の周辺ピクセルをrec(x,y)(x,y=−1…2*nS−1)、前記第1ピクセルをT(Tは、実数)、前記第2ピクセルをL(Lは、実数)、前記現在ピクセルの予測値をp(x,y)(x,y=0…nS−1)、第1予測値をp1(x,y)、第2予測値をp2(x,y)とする時、
前記第1予測値p1(x,y)は、次の数式;p1(x,y)=(nS−1−x)*rec(−1,y)+(x+1)*Tによって獲得され、
前記第2予測値p2(x,y)は、次の数式;p2(x,y)=(nS−1−y)*rec(x,−1)+(y+1)*L)によって獲得され、
前記現在ピクセルの予測値p(x,y)は、前記第1予測値p1(x,y)及び第2予測値p2(x,y)の平均値を用いて獲得されることを特徴とする付記7に記載の映像のイントラ予測方法。
(付記9) 前記現在ピクセルの予測値p(x,y)は、次の数式;p(x,y)={p1(x,y)+p2(x,y)+nS}>>(k+1)(kは、log
2nS)によって獲得されることを特徴とする付記8に記載の映像のイントラ予測方法。
(付記10) 前記現在予測単位の上側及び左側に位置している周辺ピクセルに対するフィルタリングを行う段階をさらに含み、
前記現在予測単位の右上側及び左下側に位置している少なくとも1つのフィルタリングされた周辺ピクセルを用いて前記第1ピクセル及び第2ピクセルを獲得し、前記第1予測値及び前記第2予測値の生成に用いられる左側周辺ピクセル及び上側周辺ピクセルは、フィルタリングされた周辺ピクセルであることを特徴とする付記1に記載の映像のイントラ予測方法。
(付記11) 前記周辺ピクセルに対するフィルタリングを行う段階は、
前記周辺ピクセル間の加重平均値を用いることを特徴とする付記10に記載の映像のイントラ予測方法。
(付記12) 前記フィルタリングを行う段階は、前記現在予測単位のサイズが所定サイズ以上の場合に行われることを特徴とする付記10に記載の映像のイントラ予測方法。
(付記13) 映像のイントラ予測装置において、
現在予測単位の右上側に位置している少なくとも1つの周辺ピクセルを用いて、前記現在予測単位の予測される現在ピクセルと同じ行に位置しつつ、前記現在予測単位の最右側に位置しているピクセルに対応する仮想の第1ピクセルを獲得し、前記現在予測単位の左下側に位置している少なくとも1つの周辺ピクセルを用いて、前記現在ピクセルと同じ列に位置しつつ、前記現在予測単位の最下側に位置しているピクセルに対応する仮想の第2ピクセルを獲得し、前記第1ピクセル及び前記現在ピクセルと同じ行に位置している左側周辺ピクセルを用いた線形補間を通じて前記現在ピクセルの第1予測値を獲得し、前記第2ピクセル及び前記現在ピクセルと同じ列に位置している上側周辺ピクセルを用いた線形補間を通じて前記現在ピクセルの第2予測値を獲得し、前記第1予測値及び前記第2予測値を用いて前記現在ピクセルの予測値を獲得するイントラ予測部を備えることを特徴とする映像のイントラ予測装置。
(付記14) 前記イントラ予測部は、
前記第1ピクセルと前記現在ピクセルとの距離、前記現在ピクセルと同じ行に位置している左側周辺ピクセル間の距離を考慮した幾何平均値を用いて前記第1予測値を獲得し、前記第2ピクセルと前記現在ピクセルとの距離、前記現在ピクセルとそれと同じ列に位置している上側周辺ピクセルとの距離を考慮した幾何平均値を用いて前記第2予測値を獲得することを特徴とする付記13に記載の映像のイントラ予測装置。
(付記15) 前記現在予測単位は、nS×nS(nSは、整数)であり、前記現在予測単位の周辺ピクセルをrec(x,y)(x,y=−1…2*nS−1)、前記第1ピクセルをT(Tは、実数)、前記第2ピクセルをL(Lは、実数)、前記現在ピクセルをp(x,y)(x,y=0…nS−1)、第1予測値をp1(x,y)、第2予測値をp2(x,y)とする時、
前記第1予測値p1(x,y)は、次の数式;p1(x,y)=(nS−1−x)*rec(−1,y)+(x+1)*Tによって獲得され、
前記第2予測値p2(x,y)は、次の数式;p2(x,y)=(nS−1−y)*rec(x,−1)+(y+1)*L)によって獲得され、
前記現在ピクセルの予測値p(x,y)は、前記第1予測値p1(x,y)及び第2予測値p2(x,y)の平均値を用いて獲得されることを特徴とする付記14に記載の映像のイントラ予測装置。