【文献】
Marta Karczewicz et al.,A Hybrid Video Coder Based on Extended Macroblock Sizes, Improved Interpolation, and Flexible Motion Representation,IEEE Transactions on Circuits and Systems for Video Technology,IEEE,2010年12月,Vol.20, No.12,pp.1698 - 1708
【文献】
Elena Alshina et al.,CE3: Experimental results of DCTIF by Samsung,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D344_r1,pp.1-15
【文献】
Jianle Chen et al.,CE4: Experimental results of DCTIF application for Chroma MC by Samsung,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D347,p.1-6
【文献】
Jian Lou et al.,CE3: Report on Motorola Mobility's interpolation filter for HEVC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 3月,JCTVC-E358,pp.1-4
【文献】
Thomas Wiegand et al.,WD3: Working Draft 3 of High-Efficiency Video Coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 6月27日,JCTVC-E603_d8,8.4.2.2.2.1 - 8.4.2.2.2.2
【文献】
A.Alshin and E.Alshina,CE3: DCT derived interpolation filter test by Samsung.,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 7月,JCTVC-F247_r2,pp.1-10
【文献】
Elena Alshina et al.,CE3: 7 taps interpolation filters for quarter pel position MC from Samsung and Motorola Mobility.,Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,7th Meeting: Geneva, CH,2011年11月,JCTVC-G778,pp.1-9
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
本発明の一実施形態によって、変換に基づいた補間フィルタを利用して、映像を補間する方法は、画素単位ピクセルの間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、前記副画素単位の補間位置によって個別的に、前記補間位置を中心として対称的な形態の対称形の補間フィルタ、または非対称的な形態の非対称形の補間フィルタを選択するステップと、前記選択された補間フィルタを利用して、画素単位ピクセルのピクセル値を補間して、前記少なくとも一つの副画素単位のピクセル値を生成するステップと、を含む。
【0010】
一実施形態によって、前記対称形の補間フィルタは、前記補間位置を中心として同一な個数のフィルタ係数で構成され、前記非対称形の補間フィルタは、前記補間位置を中心として異なる個数のフィルタ係数で構成された非対称形の補間フィルタを含む。
【0011】
一実施形態によって、前記少なくとも一つの副画素単位のピクセル値を生成するステップは、前記非対称形の補間フィルタが選択された場合、前記非対称形の補間フィルタのフィルタ係数を利用して、前記補間位置を中心として非対称的に位置した画素単位ピクセルを参照してフィルタリングを行うステップと、前記対称形の補間フィルタが選択された場合、前記対称形の補間フィルタのフィルタ係数を利用して、前記補間位置を中心として対称的に位置した画素単位ピクセルを参照してフィルタリングを行うステップと、を含む。
【0012】
一実施形態によって、前記少なくとも一つの副画素単位のピクセル値を生成するステップは、前記補間フィルタのうち、奇数個のフィルタ係数で構成された非対称形の奇数タップ補間フィルタが選択された場合、前記非対称形の奇数タップ補間フィルタの奇数個のフィルタ係数を利用して、前記補間位置を中心として位置した奇数個の画素単位ピクセルを参照してフィルタリングを行うステップと、前記補間フィルタのうち、偶数個のフィルタ係数で構成された対称形の偶数タップ補間フィルタが選択された場合、前記対称形の偶数タップ補間フィルタの偶数個のフィルタ係数を利用して、前記補間位置を中心として位置した偶数個の画素単位ピクセルを参照してフィルタリングを行うステップと、を含む。
【0013】
一実施形態によって、それぞれの補間フィルタは、前記画素単位ピクセルを空間ドメインで補間するために、複数個の基底関数を利用した変換及び逆変換のためのフィルタと、非対称的な形態または対称的な形態であるウィンドウフィルタとを合成したフィルタ係数で構成される。
【0014】
一実施形態によって、前記補間フィルタを選択するステップは、前記補間フィルタのうち、前記選択された補間フィルタを利用した補間結果として発生する周波数応答誤差を最小化するように正規化された補間フィルタを選択するステップを含む。
【0015】
一実施形態によって、前記正規化された補間フィルタは、i)7タップフィルタ係数{−1,4,−10,58,17,−5,1}で構成されたウィンドウサイズ8.7である1/4画素単位補間フィルタ、及びii)8タップフィルタ係数{−1,4,−11,40,40,−11,4,−1}で構成されたウィンドウサイズ9.5である1/2画素単位補間フィルタを含む。
【0016】
本発明の一実施形態によって、変換に基づいた補間フィルタを利用した映像補間装置は、画素単位ピクセルの間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、前記副画素単位の補間位置によって個別的に、前記補間位置を中心として対称的な形態の対称形の補間フィルタ、または非対称的な形態の非対称形の補間フィルタを選択するフィルタ選択部と、前記選択された補間フィルタを利用して、画素単位ピクセルのピクセル値を補間して、前記少なくとも一つの副画素単位のピクセル値を生成する補間部と、を備える。
【0017】
本発明の一実施形態によって、映像補間フィルタを利用したビデオ符号化装置は、入力ピクチャのブロック別に、画素単位ピクセルの間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、前記副画素単位の補間位置によって個別的に、前記補間位置を中心として対称的な形態の対称形の補間フィルタ、または非対称的な形態の非対称形の補間フィルタを選択し、前記選択された補間フィルタを利用して、画素単位ピクセルのピクセル値を補間して、前記少なくとも一つの副画素単位のピクセル値を生成して予測符号化を行い、前記予測符号化による予測結果に対して変換及び量子化を行う符号化部と、前記量子化された変換係数及び符号化情報に対してエントロピー符号化を行って生成されたビットストリームを出力する出力部と、前記補間フィルタのフィルタ係数が保存された保存部と、を備える。
【0018】
本発明の一実施形態によって、映像補間フィルタを利用したビデオ復号化装置は、ビデオの符号化されたビットストリームを受信し、エントロピー復号化を行ってパージングして、符号化情報と前記ビデオのピクチャの符号化されたデータとを抽出する受信抽出部と、前記ピクチャのうち、現在のブロックの符号化されたデータのうち量子化された変換係数に対して逆量子化及び逆変換を行い、画素単位ピクセルの間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、前記副画素単位の補間位置によって個別的に、前記補間位置を中心として対称的な形態の対称形の補間フィルタ、または非対称的な形態の非対称形の補間フィルタを選択し、前記選択された補間フィルタを利用して、画素単位ピクセルのピクセル値を補間して、前記少なくとも一つの副画素単位のピクセル値を生成し、予測復号化を行うことによって、前記ピクチャを復元する復号化部と、前記補間フィルタのフィルタ係数が保存された保存部と、を備える。
【0019】
一実施形態による映像補間方法を電算的に具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を提供する。
【0020】
以下、本明細書に記載の本発明の多様な実施形態において、‘映像’は、静止画像だけでなく、ビデオのような動画を含んで包括的に指す。
【0021】
以下、
図1ないし
図12Bを参照して、一実施形態によって、平滑化を考慮した非対称形の補間フィルタ及び対称形の補間フィルタを利用する映像補間が開示される。また、
図13Aないし
図27を参照して、一実施形態による非対称形の補間フィルタ及び対称形の補間フィルタを利用するビデオの符号化及び復号化が開示され、特に、以下、
図15ないし
図25を参照して、一実施形態によって、ツリー構造による符号化単位に基づいて、非対称形の補間フィルタ及び対称形の補間フィルタを利用するビデオの符号化及び復号化が開示される。
【0022】
以下、
図1ないし
図12Bを参照して、一実施形態によって、平滑化を考慮した非対称形の補間フィルタ及び対称形の補間フィルタを利用する映像補間について詳述する。
【0023】
図1は、一実施形態による映像補間装置10を示すブロック図である。一実施形態による対称形/非対称形の補間フィルタを利用する映像補間装置10は、フィルタ選択部12及び補間部14を備える。映像補間装置10のフィルタ選択部12及び補間部14の動作は、ビデオエンコーディングプロセッサ、中央プロセッサ、グラフィックプロセッサなどによって有機的に制御される。
【0024】
一実施形態による映像補間装置10は、映像を入力されて、画素単位のピクセルを補間して、副画素単位のピクセル値を生成する。入力される映像は、ビデオのピクチャシーケンス、ピクチャ、フレーム、またはブロックである。
【0025】
一実施形態によるフィルタ選択部12は、画素単位の間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置に基づいて、補間フィルタを異なって選択する。
【0026】
一実施形態による補間部14は、フィルタ選択部12で選択された補間フィルタを利用して、副画素単位の補間位置に隣接した画素単位ピクセルを補間して、副画素単位のピクセル値を生成する。副画素単位のピクセル値を生成するための画素単位ピクセルに対する補間フィルタリングは、副画素単位の補間位置に隣接した画素単位ピクセルを含んで、画素単位の参照ピクセル値に対して補間フィルタリングを行う動作を含む。
【0027】
一実施形態による補間フィルタは、複数個の基底関数に基づいて、画素単位の参照ピクセルを変換し、変換結果として生成された複数個の係数を逆変換するためのフィルタ係数で構成される。
【0028】
一実施形態による補間フィルタは、一次元フィルタまたは二次元フィルタの形態である。一実施形態による補間部14は、選択された補間フィルタが一次元フィルタである場合、2方向以上の一次元補間フィルタを利用して、連続的にフィルタリングを行って、現在の副画素単位のピクセル値を生成する。
【0029】
一実施形態によるフィルタ選択部12は、補間フィルタのうち、副画素単位の補間位置によって個別的に補間フィルタを決定する。一実施形態による補間フィルタは、補間位置を中心として同一な個数のフィルタ係数で構成された対称形の補間フィルタと、異なる個数のフィルタ係数で構成された非対称形の補間フィルタとを含む。フィルタ選択部12は、副画素単位の補間位置によって個別的に対称形の補間フィルタまたは非対称形の補間フィルタを選択する。
【0030】
例えば、7タップ補間フィルタは、補間位置を中心として三つのフィルタ係数と、四つのフィルタ係数とで構成される。その場合、7タップ補間フィルタは、非対称形の補間フィルタであるとすることができる。
【0031】
例えば、8タップ補間フィルタは、補間位置を中心として四つのフィルタ係数と、四つのフィルタ係数とで構成される。その場合、8タップ補間フィルタは、対称形の補間フィルタであるとすることができる。
【0032】
フィルタ選択部12で非対称形の補間フィルタが選択された場合には、補間部14は、補間位置を中心として非対称的に位置する画素単位ピクセルを参照して、フィルタリングを行う。また、対称形の補間フィルタが選択された場合には、補間部14は、補間位置を中心として対称的に位置する画素単位ピクセルを参照して、フィルタリングを行う。
【0033】
一実施形態による補間フィルタは、奇数個のフィルタ係数を含む非対称形の奇数タップ補間フィルタと、偶数個のフィルタ係数を含む対称形の偶数タップ補間フィルタとを含む。フィルタ選択部12は、副画素単位の補間位置によって個別的に非対称形の奇数タップ補間フィルタ、または対称形の偶数タップ補間フィルタを選択する。例えば、1/2画素単位補間フィルタと、1/4画素単位補間フィルタとが個別的に異なって選択されて、1/2画素単位補間フィルタとして、対称形の偶数タップ補間フィルタである8タップ補間フィルタが選択され、1/4画素単位補間フィルタとして、非対称形の奇数タップ補間フィルタである7タップ補間フィルタが選択される。
【0034】
一実施形態によるそれぞれの補間フィルタは、画素単位ピクセルを空間ドメインで補間するために、複数個の基底関数を利用した変換及び逆変換のためのフィルタ係数と、低域通過フィルタリングのためのウィンドウフィルタ係数とを合成したフィルタ係数で構成される。
【0035】
一実施形態による補間フィルタは、補間位置を中心として非対称的な形態であるウィンドウフィルタ、または対称的な形態であるウィンドウフィルタに基づいて生成されたフィルタである。
【0036】
一実施形態による非対称形の補間フィルタは、複数個の基底関数に基づいた変換及び逆変換のためのフィルタと、非対称的な形態のウィンドウフィルタとを合成した結果として生成される。
【0037】
一実施形態によって、奇数タップ補間フィルタが選択された場合、補間部14は、奇数タップ補間フィルタの奇数個のフィルタ係数を利用して、補間位置を中心として位置した奇数個の画素単位ピクセルを参照してフィルタリングを行う。
【0038】
一実施形態によって、偶数タップ補間フィルタが選択された場合、補間部14は、偶数タップ補間フィルタの偶数個のフィルタ係数を利用して、補間位置を中心として位置した偶数個の画素単位ピクセルを参照してフィルタリングを行う。
【0039】
一実施形態による奇数タップ補間フィルタは、補間位置を中心として異なる個数のフィルタ係数を含むので、非対称形の補間フィルタである。一実施形態による偶数タップ補間フィルタは、補間位置を中心として同一な個数のフィルタ係数を含む対称形の補間フィルタである。
【0040】
一実施形態によるフィルタ選択部12は、補間フィルタのうち、補間フィルタを利用した補間結果として発生する周波数応答誤差を最小化するように正規化された補間フィルタを選択する。例えば、正規化された補間フィルタは、i)7タップフィルタ係数{−1,4,−10,58,17,−5,1}で構成されたウィンドウサイズ8.7である1/4画素単位補間フィルタ、及びii)8タップフィルタ係数{−1,4,−11,40,40,−11,4,−1}で構成されたウィンドウサイズ9.5である1/2画素単位補間フィルタを含む。
【0041】
また、一実施形態によるフィルタ選択部12は、カラー成分ごとに補間フィルタを個別的に異なって選択してもよい。例えば、ルマピクセルのための正規化された補間フィルタは、1/4画素単位の7タップ補間フィルタ、及び1/2画素単位の8タップ補間フィルタとして決定される。クロマピクセルのための正規化された補間フィルタは、1/8画素単位、1/4画素単位及び1/2画素単位の4タップ補間フィルタとして決定される。
【0042】
一実施形態によって決定されたクロマピクセルのための正規化された補間フィルタは、i)1/8補間位置のための4タップフィルタ係数{−2,58,10,−2}で構成された平滑度0.012である1/8画素単位の補間フィルタ、ii)1/4補間位置のための4タップフィルタ係数{−4,54,16,−2}で構成された平滑度0.016である1/4画素単位の補間フィルタ、iii)3/8補間位置のための4タップフィルタ係数{−6,46,28,−4}で構成された平滑度0.018である1/8画素単位の補間フィルタ、及びiv)1/2補間位置のための4タップフィルタ係数{−4,36,36,−4}で構成された平滑度0.020である1/2画素単位の補間フィルタを含む。
【0043】
一実施形態による補間フィルタは、鏡反射型の対称フィルタであって、補間位置αのフィルタ係数f(α)と、補間位置(1−α)のフィルタ係数f
l(1−α)とが同一である。
【0044】
一実施形態によるルマピクセルのための1/4画素単位の補間フィルタは、鏡反射型の対称フィルタである。したがって、1/4補間位置のための補間フィルタと、3/4補間位置のための補間フィルタは、互いに対称的に同一な係数で構成される。1/4画素単位の7タップルマ補間フィルタが、1/4補間位置で、フィルタ係数{−1,4,−10,58,17,−5,1}で構成されるならば、3/4補間位置では、フィルタ係数{1,−5,17,58,−10,4,−1}で構成される。
【0045】
一実施形態によるクロマピクセルのための1/8画素単位の補間フィルタは、鏡反射型の対称フィルタである。したがって、1/8補間位置のための補間フィルタと、7/8補間位置のための補間フィルタは、互いに対称的に同一な係数で構成される。同様に、3/8補間位置のための補間フィルタと、5/8補間位置のための補間フィルタは、互いに対称的に同一な係数で構成される。
【0046】
一実施形態による補間フィルタは、複数個の基底関数を利用して決定されたフィルタ係数で構成された変換に基づいた補間フィルタに基づいて決定される。また、変換に基づいた補間フィルタが、補間位置と画素単位ピクセルとの間の距離によって平滑度を異ならせてフィルタリングを行うように、変形された平滑化補間フィルタが利用される。
【0047】
一実施形態による平滑化補間フィルタは、補間位置と画素単位ピクセルとの間の距離に基づいて、平滑度が決定される。一実施形態による補間フィルタは、副画素単位の補間位置と平滑度とによって、異なるフィルタ係数で構成される。
【0048】
一実施形態による平滑化補間フィルタは、画素単位ピクセルのうち、補間位置に隣接するピクセルと補間位置との間の距離に基づいて、平滑度が決定されることも可能である。
【0049】
また、一実施形態による補間フィルタは、画素単位の参照ピクセルのうち、補間位置から遠い参照ピクセルであるほど、さらに平滑にするためのフィルタ係数で構成される。
【0050】
一実施形態によって、変換及び逆変換のためのフィルタ係数と、低域通過フィルタリングのためのウィンドウフィルタ係数とが合成された平滑化補間フィルタは、画素単位の参照ピクセルのうち、補間位置に近い参照ピクセルであるほど、大きい加重値を付与し、補間位置から遠い参照ピクセルであるほど、小さい加重値を付与するためのフィルタ係数で構成される。
【0051】
一実施形態による平滑化補間フィルタは、画素単位の参照ピクセルを平滑化し、複数個の基底関数を利用して、平滑化された画素単位の参照ピクセルを変換し、変換結果として生成された複数個の係数を逆変換するためのフィルタ係数で構成される。
【0052】
一実施形態による平滑化補間フィルタは、副画素単位の補間位置と平滑度だけでなく、フィルタ長によって異なるフィルタ係数で構成される。
【0053】
また、一実施形態による平滑化補間フィルタは、副画素単位の補間位置、平滑度及びフィルタ長だけでなく、補間結果のスケーリング割合によって異なるフィルタ係数で構成される。一実施形態によるフィルタ選択部12は、平滑化補間フィルタのうち、フィルタ係数が整数に拡大した補間フィルタを選択する。一実施形態による補間部14は、フィルタ選択部12で選択された平滑化補間フィルタを利用して生成したピクセル値を正規化する。
【0054】
また、一実施形態によるフィルタ選択部12は、ピクセルの特性によって、補間フィルタのうち、異なる補間フィルタを選択する。一実施形態による補間部14は、ピクセルの特性別にそれぞれ選択された異なる補間フィルタを利用して、副画素単位のピクセル値を生成する。
【0055】
一実施形態によるフィルタ選択部12で選択可能な補間フィルタは、一実施形態による平滑化補間フィルタだけでなく、平滑化を考慮しない一般の補間フィルタも含む。したがって、フィルタ選択部12は、映像特性によって、平滑化を全く考慮しない一般の補間フィルタを選択することもできる。
【0056】
具体的に、例えば、他の実施形態による映像補間装置10は、カラー成分別に異なる補間フィルタを利用して、映像補間を行う。
【0057】
他の実施形態によるフィルタ選択部12は、補間フィルタのうち、副画素単位の補間位置及び現在のピクセルのカラー成分に基づいて異なって補間フィルタを選択する。他の実施形態による補間部14は、選択された補間フィルタを利用して、画素単位ピクセルを補間して、少なくとも一つの副画素単位のピクセル値を生成する。
【0058】
例えば、フィルタ選択部12は、ルマ成分の補間フィルタと、クロマ成分の補間フィルタとを異なって決定する。
【0059】
一実施形態によるフィルタ選択部12は、クロマ成分のピクセル補間のために、補間フィルタのうち、ルマ成分のピクセルのための補間フィルタよりも平滑度の大きい平滑化補間フィルタを選択する。
【0060】
また、クロマ成分のピクセル補間のために、ルマ成分のピクセルのための補間フィルタよりも平滑度の大きい平滑度パラメータに基づいて決定されたフィルタ係数で構成された補間フィルタ、ルマ成分のピクセルのための補間フィルタよりも高周波成分を多く除去するウィンドウフィルタと合成されたフィルタ係数で構成された補間フィルタなどが選択される。
【0061】
一実施形態によって、クロマ成分の平滑な補間結果を導出するために、複数個の基底関数に基づいた変換及び逆変換のためのフィルタ係数と、低域通過フィルタリングのためのウィンドウフィルタ係数とが合成された平滑化補間フィルタが選択される。
【0062】
一実施形態による映像補間装置10は、フィルタ選択部12及び補間部14を総括的に制御する中央プロセッサ(図示せず)を備える。または、フィルタ選択部12及び補間部14がそれぞれの自体プロセッサ(図示せず)により作動し、プロセッサ(図示せず)が互いに有機的に作動することによって、映像補間装置10が全体的に作動してもよい。または、一実施形態による映像補間装置10の外部プロセッサ(図示せず)の制御によって、フィルタ選択部12及び補間部14が制御されてもよい。
【0063】
一実施形態による映像補間装置10は、フィルタ選択部12及び補間部14の入出力データが保存される一つ以上のデータ保存部(図示せず)を備える。映像補間装置10は、データ保存部(図示せず)のデータ入出力を制御するメモリ制御部(図示せず)を備えてもよい。
【0064】
一実施形態による映像補間装置10は、映像補間動作を行う回路を含む別のプロセッサを含む。また、映像補間装置10は、映像補間モジュールが記録された記録媒体を含み、中央プロセッサが映像補間モジュールを呼び出して駆動させることによって、一実施形態による映像補間動作を具現する場合も含む。
【0065】
映像補間は、低画質の映像を高画質に変換する時に利用される。インターレース映像をプログレッシブ映像に変換する時に利用されてもよく、低画質の映像をアップサンプリングして、高画質の映像に変換する時に利用されてもよい。また、ビデオ符号化装置が映像を符号化する時、動き推定部及び動き補償部は、補間された参照フレームを利用して、インター予測を行う。参照フレームを補間して、高画質の映像を生成し、高画質の映像に基づいて動き推定及び補償を行うことによって、インター予測の正確度を高くすることができる。同様に、映像復号化装置が映像を復号化する時にも、動き補償部は、補間された参照フレームを利用して、動き補償を行うことによって、インター予測の正確度を高くすることができる。
【0066】
また、一実施形態による映像補間装置10が利用する平滑化補間フィルタは、補間フィルタを利用した補間結果の高周波成分を低減させて、より平滑な補間結果を導出する。高周波成分の存在は、映像圧縮効率を低下させるので、平滑度が調節可能な映像補間を通じて、映像符号化及び映像復号化の効率も向上する。
【0067】
また、補間位置を中心としてフィルタ係数が対称的に構成された対称形の補間フィルタ、及び非対称的に構成された非対称形の補間フィルタが選択的に利用される。また、一実施形態によれば、補間フィルタは、奇数タップ補間フィルタ及び偶数タップ補間フィルタのうち、補間位置によって選択的に利用される。したがって、一実施形態による映像補間装置10が利用した映像補間フィルタリングの場合、必ずしも補間位置を中心として対称的に位置する画素単位ピクセルを参照してフィルタリングを行う必要がなく、非対称的に位置する画素単位ピクセルを参照した補間フィルタリングも可能である。
【0068】
以下、
図2ないし
図7Bを参照して、一実施形態によって、複数個の基底関数に基づいた変換及び逆変換のためのフィルタ係数と、ウィンドウフィルタ係数とが合成された補間フィルタを利用した映像補間について詳述する。
【0069】
図2は、画素単位と副画素単位の関係を示す。
図2を参照すれば、映像補間装置10は、空間ドメインの画素単位のピクセル値、すなわち、所定のブロック20の‘O’位置のピクセル値の間を補間して、補間位置である‘X’位置のピクセル値を生成する。‘X’位置のピクセル値は、α
x及びα
yにより補間位置が決定される副画素単位のピクセル値である。
図2は、所定のブロック20が4×4である場合を例として説明するが、ブロックのサイズは、4×4に限定されず、それよりも大きいか、または小さいサイズのブロックに対する補間フィルタリングを通じて、副画素単位のピクセル値を生成可能であることは、当業者には自明であろう。
【0070】
ビデオ処理分野において、現在の映像の動き補償及び予測のために、動きベクトルが利用される。予測符号化によれば、現在の映像を予測するために、以前に復号化された映像が参照され、動きベクトルは、参照映像の所定の地点を指す。したがって、動きベクトルは、参照映像の画素単位ピクセルを指す。
【0071】
しかし、現在の映像が参照しようとするピクセルの位置が、参照映像の画素単位ピクセルの間に位置する地点である。かかる地点を副画素単位の位置という。副画素単位の位置にはピクセルが存在しないので、画素単位ピクセルのピクセル値を利用して、副画素単位のピクセル値が予測されるだけである。すなわち、画素単位ピクセルに対する補間を通じて、副画素単位のピクセル値が推定される。
【0072】
以下、
図3、
図4Aないし
図4Cを参照して、画素単位ピクセルに対する補間方法について詳述する。
【0073】
図3は、副画素単位のピクセル値を決定するために参照される隣接する画素単位ピクセルを示す。
図3を参照すれば、映像補間装置10は、空間ドメインの画素単位のピクセル値31及び33の間を補間して、補間位置のピクセル値35を生成する。αにより補間位置が決定される副画素単位のピクセル値35である。
【0074】
図4Aないし
図4Cは、一実施形態によって、副画素単位のピクセル値を決定するために参照される画素単位ピクセルを例示する。
【0075】
図4Aを参照すれば、画素単位ピクセルの二つのピクセル値31及び33の間を補間して、副画素単位のピクセル値35を生成するために、ピクセル値31及び33を含む隣接した複数の画素単位ピクセルのピクセル値37及び39を利用する。言い換えれば、−(M−1)番目からM番目までの2M個のピクセル値を一次元補間フィルタリングすることによって、0番目のピクセルと1番目のピクセルとの間を補間する。
【0076】
また、
図4Aは、水平方向のピクセル値の間を補間する場合を例として説明したが、垂直方向のピクセル値の間または対角方向のピクセル値を利用して、一次元補間フィルタリングが可能である。
【0077】
図4Bを参照すれば、垂直方向に隣接したP
0 41及びP
1 43の間を補間して、垂直方向の補間位置αのピクセル値P(α)を生成する。
図4Aと比較して見れば、水平方向に配列されたピクセル値37及び39の代わりに、垂直方向に配列されたピクセル値47及び49を利用して、補間を行うという点のみが異なり、補間フィルタリング方法は類似している。
【0078】
図4Cの実施形態も、
図4Bの実施形態と同様に、水平方向に配列されたピクセル値37及び39の代わりに、対角方向に配列されたピクセル値46及び48を利用するという点のみが異なり、隣接した二つのピクセル値40及び42の間を補間して、補間位置αのピクセル値44を生成する方法は、水平方向の一次元補間フィルタリング方法と類似している。
【0079】
図4Aないし
図4Cで例示された方向の一次元補間フィルタリングだけでなく、より多様な方向の補間位置のピクセル値が生成されることも可能である。
【0080】
副画素単位のピクセル値を生成するための画素単位ピクセルに対する補間は、補間フィルタリングを通じて具現される。補間フィルタリングを数式で表現すれば、下記の通りである。
【0081】
【数1】
2M個の画素単位の参照ピクセル{p
m}={p
−M+1,p
−M+2,…,p
0,p
1,…,p
M}のベクトルpと、フィルタ係数{f
m}={f
−M+1,f
−M+2,…,f
0,f
1,…,f
M}のベクトルf(x)との内積によって、補間結果として生成されたピクセル値p(x)が導出される。補間位置αによって、フィルタ係数f(α)が変わり、これによって補間結果としてピクセル値p(α)が決定されるので、いかなる補間フィルタが選択されるのか、すなわち、フィルタ係数f(x)がどのように決定されるのかが、補間フィルタリングの性能に相当な影響を及ぼす。
【0082】
以下、基底関数に基づいた変換及び逆変換を利用した映像補間及び補間フィルタの決定方法について詳述する。
【0083】
一実施形態によって、変換及び逆変換を利用した補間フィルタは、まず、異なる周波数成分の複数の基底関数を利用して、ピクセル値を変換する。変換は、空間ドメインのピクセル値を、変換ドメインの係数に変換する全ての変換であって、前述した離散コサイン変換である。画素単位のピクセル値は、複数の基底関数を利用して変換される。ピクセル値は、輝度成分に対するピクセル値であってもよく、彩度成分に対するピクセル値であってもよい。基底関数には制限がなく、空間ドメインのピクセル値を、変換ドメインの値に変換する全ての変換である。例えば、基底関数は、離散コサイン変換及び逆離散コサイン変換のためのコサイン関数またはサイン関数である。または、スプライン関数、多項基底関数など多様な基底関数が利用される。また、離散コサイン変換は、変形された離散コサイン変換、またはウィンドウを利用した変形された離散コサイン変換である。
【0084】
一実施形態によって、変換及び逆変換を利用した補間フィルタは、変換に利用された複数の基底関数の位相を変更し、位相が変更された複数の基底関数を利用して生成された複数の係数、すなわち、変換ドメインの値を逆変換する。逆変換の結果、空間ドメインのピクセル値が出力され、出力された値は、補間位置のピクセル値である。
【0085】
<直交基底関数に基づいた直交変換及び逆変換を利用したフィルタ係数>
以下、補間部14が直交基底関数に基づいた変換及び逆変換を利用する補間フィルタリングについて詳述する。特に、直交基底関数の一例として、離散コサイン変換を挙げて説明する。
【0086】
例えば、
図4Aを参照すれば、画素単位ピクセルの二つのピクセル値31及び33の間を補間して、副画素単位のピクセル値35を生成するために、ピクセル値31及び33を含む隣接した複数のピクセル値37及び39を利用して、−(M−1)番目からM番目までの2M個のピクセル値に、一次元の離散コサイン変換を行い、位相が変更された基底関数に基づいて一次元の逆離散コサイン変換を行うことによって、0番目のピクセルと1番目のピクセルとの間を補間する。
【0087】
補間部14は、まず、画素単位のピクセル値に、一次元の離散コサイン変換を行う。一次元の離散コサイン変換は、下記の数式(1)を計算することによって行われる。
【0088】
【数2】
p(l)は、−(M−1)番目からM番目までのピクセル値37及び39であり、C
kは、ピクセル値に一次元の離散コサイン変換を行った結果として生成された複数の周波数ドメインの係数である。この時、kは、数式(1)の条件を満たす正の整数である。
【0089】
補間部14が数式(1)を計算して、ピクセル値37及び39に一次元の離散コサイン変換を行えば、下記の数式(2)を計算して係数を逆変換する。
【0090】
【数3】
αは、
図4Aに示したように二つのピクセル値の間の補間位置を意味するところ、1/2,1/4,3/4,1/8,3/8,5/8,7/8,1/16などのように多様な分数値である。分数値には制限がなく、αは、分数値ではない実数値であってもよい。P(α)は、一次元の逆離散コサイン変換結果として生成される補間位置のピクセル値35を意味する。
【0091】
数式(1)と比較して見れば、逆離散コサイン変換に利用される基底関数であるコサイン関数の位相は、整数lの代わりに、分数αによって決定されるので、一次元の離散コサイン変換に利用される基底関数の位相と異なる。すなわち、逆変換において利用する基底関数、すなわち、コサイン関数の位相がそれぞれ2αによって変更されたということが分かる。補間部14が数式(2)の位相が変更された複数のコサイン関数に基づいて、逆離散コサイン変換を行えば、
図4Aの補間位置、すなわち、P
αのピクセル値35が生成される。
【0092】
数式(1)による離散コサイン変換を行列式で表現すれば、下記の数式(3)の通りである。
【0093】
【数4】
ここで、Cは、数式(1)と関連して前述した2M個の係数についての2M×1行列であり、REFは、数式(1)と関連して前述した画素単位のピクセル値、すなわち、P
−(M−1),…,P
Mピクセル値についての2M×1行列である。補間に利用される画素単位のピクセル位置のピクセル値の個数、すなわち、2Mは、一次元補間フィルタのタップ数を意味する。Dは、一次元の離散コサイン変換のための正方行列であって、下記の数式(4)のように定義される。
【0094】
【数5】
k及びlは、前記条件を満たす整数であって、D
klは、数式(3)の離散コサイン変換のための正方行列Dのk行及びl列を意味する。Mは、数式(3)のMと同一である。
【0095】
数式(2)による位相が変更された複数の基底関数を利用した逆離散コサイン変換を行列式で表現すれば、下記の数式(5)の通りである。
【0096】
【数6】
ここで、P(α)は、数式(2)のP(α)と同一であり、W(α)は、位相が変更された複数の基底関数を利用した一次元の逆離散コサイン変換のための1×2M行列であって、下記の数式(6)のように定義される。
【0097】
【数7】
kは、前記条件を満たす整数であり、W
k(α)は、数式(5)と関連して前述したW(α)行列のk列を意味する。数式(3)、(4)及び(5)に基づいて、一次元の離散コサイン変換及び位相が変更された複数の基底関数を利用した一次元の逆離散コサイン変換のためのフィルタF(α)は、下記の数式(7)のように定義される。
【0098】
【数8】
k及びlは、前記条件を満たす整数であり、F
l(α)は、F(α)のl列を意味し、W(α)及びDは、数式(3)のW(α)及びDと同一である。
【0099】
<拡大補間のための補間フィルタ係数>
一実施形態による多様な補間フィルタ生成方法は、整数ではない浮動小数点数を生成する演算式に基づいており、フィルタ係数の絶対値は、通常1より大きくない。特に、副画素単位の補間位置αにより、整数ではない実数の演算結果が発生する。
【0100】
浮動小数点に基づいた演算効率よりも、整数に基づいた演算効率が高い。これによって、一実施形態による映像補間装置10は、スケーリング割合を利用して、フィルタ係数を整数に拡大することによって、補間フィルタリングの演算効率性を向上させる。また、ピクセル値のビット深さが深くなるにつれて、補間フィルタリングの正確度も向上する。
【0101】
一実施形態による映像補間装置10は、フィルタ係数f
m(α)に所定の値を乗じ、大きい値の係数F
m(α)を利用して、映像を補間する。例えば、数式(8)によって、フィルタ係数F
m(α)は、フィルタ係数f
m(α)から拡大される。
【0102】
【数9】
演算効率のために、スケーリング割合は、2
nの形態である。nは、0及び正の整数である。2
nほど拡大したフィルタ係数による補間フィルタリング結果は、元来のフィルタ係数によるフィルタリング結果に比べて、ビット深さがnビットほど拡大する。
【0103】
拡大したフィルタ係数F
m(α)を利用した整数演算補間フィルタリングは、数式(9)による。すなわち、拡大したフィルタ係数F
m(α)を利用して、補間フィルタリングが行われた後、拡大したビット深さが元来のビット深さに復元されなければならない。
【0104】
【数10】
この時、offsetは、2
n−1である。
【0105】
すなわち、一実施形態による拡大した補間フィルタを利用して拡大されたフィルタリング結果は、元来のビットに復元されるために、スケーリング割合2
nほど縮小しなければならないので、拡大したフィルタリング結果のビット深さがnビットほど縮小する。
【0106】
水平方向の一次元補間フィルタリングと、垂直方向の一次元補間フィルタリングとを通じて、2ステップの補間フィルタリングが行われた場合、総2nビットほど縮小する。したがって、第1一次元補間フィルタがn1ビットほど拡大し、第2一次元補間フィルタがn2ビットほど拡大した場合、第1一次元補間フィルタリングと、第2一次元補間フィルタリングとを通じて、2ステップの補間フィルタリングが行われた後、n1とn2の和2nほど縮小する。第1一次元補間フィルタは、拡大しない補間フィルタである。
【0107】
補間フィルタ係数f
m(α)の総和は1であるので、
【0108】
【数11】
拡大した補間フィルタのフィルタ係数F
m(α)のための正規化条件は、数式(11)による必要がある。
【0109】
【数12】
しかし、数式(11)による正規化条件は、ラウンディングエラーによって誤差が発生する。一実施形態による映像補間装置10は、数式(11)による正規化条件に基づいて、拡大したフィルタ係数F
m(α)を四捨五入する。正規化のために、拡大したフィルタ係数F
m(α)のうち一部は、元来の値に比べて所定の範囲内で調整される。例えば、拡大したフィルタ係数は、ラウンディングエラーを補正するために、±1の範囲内で調整される。
【0110】
一実施形態による補間部14は、参照ピクセルの個数が奇数である補間フィルタや、補間位置を中心として非対称形の補間フィルタのために、基底関数に基づいた変換及び逆変換を利用した補間フィルタを変形する。
【0111】
前述した複数個の基底関数に基づいた変換及び逆変換を利用した補間フィルタの一種として、奇数個のフィルタ係数を含む奇数タップ補間フィルタを利用した映像補間について後述する。
【0112】
<非対称形の補間フィルタ>
図5Aは、一実施形態によって、副画素単位のピクセル値を決定するために、補間位置を中心として非対称的に位置した参照ピクセルを利用する補間フィルタリング方法を示す。
【0113】
副画素単位である補間位置αのピクセルp(α)50を求めるために、補間位置αを中心として、左側の参照ピクセル52と、右側の参照ピクセル54とが補間フィルタリングのために利用される場合を想定する。すなわち、補間位置αを中心として、左側の参照ピクセル52の個数は3であり、右側の参照ピクセル54の個数は5である。すなわち、奇数個のピクセルが参照されるので、補間位置αを中心として参照ピクセル52,54が非対称的に位置している。
【0114】
数式(1)ないし(7)を参照して前述したように、補間位置αを中心として対称的に分布した2M個の画素単位の参照ピクセルp
−M+1,p
−M+2,…,p
0,p
1,…,p
Mを利用して、補間フィルタリングが行われる。すなわち、参照ピクセルをp
lと表現すれば、整数lの範囲は、−M+1≦l≦Mと表現される。
【0115】
数式(1)ないし(7)の補間位置αが適切に(α−h)ほど平行移動されれば、数式(1)ないし(7)を利用して、
図5Aのように補間位置αを中心として非対称的に位置した参照ピクセルを利用する補間フィルタのフィルタ係数が生成される。
【0116】
すなわち、非対称的な参照ピクセル52,54をp
lと表現すれば、整数lの範囲は、−M+1+h≦l≦M+hであり、この時、Mは4、hは1である。すなわち、補間位置αを中心として2M個の参照ピクセルが対称的に分布した場合に比べて、左側の参照ピクセル52の個数が一つ少ない。
【0117】
数式(1)ないし(7)の補間フィルタは、一次元フィルタであり、二次元フィルタリングのためには、一次元フィルタを利用して、垂直方向に補間フィルタリングが行われ、水平方向に補間フィルタリングが行われる。すなわち、一次元補間フィルタリングが二回行われる。動き補償のための二回の一次元補間フィルタリングのうち、二番目の一次元補間フィルタリングは、フィルタタップの数が半分サイズ拡張したフィルタを利用し、最初の一次元補間フィルタリングは、拡張したブロックに対して行われる。
【0118】
ブロックの左側境界に対して補間フィルタリングを行う場合、左側境界の左側外にブロックを拡張しなければならない。補間位置αを中心として対称的に位置する2M個の参照ピクセルを利用する対称形の補間フィルタの場合、補間フィルタリングのために、ブロックの左側外にM個のピクセル距離ほど拡張しなければならない。
【0119】
しかし、補間位置αを中心として非対称的に位置した参照ピクセルを利用する非対称形の補間フィルタの場合、補間フィルタリングのために、ブロックの左側外に(M−h)個のピクセル距離ほどフィルタリング領域を拡張すればよい。同様に、hが負の方向である場合には、ブロックの右側境界についての補間フィルタリングを行う時、ブロックの右側外に(M+h)個のピクセル距離ほどフィルタリング領域を拡張すればよい。すなわち、ブロック境界の補間フィルタリングの場合、対称形の補間フィルタを利用する場合に比べて、非対称形の補間フィルタを利用する場合、ピクセル距離ほどブロック拡張領域が減少する。したがって、ブロック拡張領域が減少することによって、拡張領域のピクセル値を保存するための保存空間が減少し、かつブロック拡張のための演算量も減少する。
【0120】
<奇数タップ補間フィルタ>
図5Bは、一実施形態によって、副画素単位のピクセル値を決定するために、奇数個のフィルタ係数で構成された補間フィルタを利用する補間方法を示す。
【0121】
副画素単位である補間位置αのピクセルp(α)55を求めるために、参照ピクセル{p
−2,p
−1,p
0,p
1,p
2}を利用する補間フィルタを想定すれば、参照ピクセルが総5個、すなわち、奇数個であり、補間位置αを中心として、三つの左側の参照ピクセル51と、二つの右側の参照ピクセル53とが補間フィルタリングのために参照される。
【0122】
補間位置αを中心として、左側の参照ピクセル51と右側の参照ピクセル53とが非対称的に位置し、右側の参照ピクセル53の個数が少ないので、
図5Bの補間フィルタは、ブロックの右側境界についての補間フィルタリングに効果的である。
【0123】
まず、下記の数式(12)ないし(15)によって、整数lの範囲が−M+1≦l≦M−1である参照ピクセル{p
l}を利用するフィルタサイズ(すなわち、フィルタタップの数)Sizeが2M−1である補間フィルタのフィルタ係数{p(α)}が決定される。
【0124】
【数13】
Mが3である場合、
図5Bの補間フィルタ係数は、数式(15)によって決定される。
【0125】
他の例として、下記の数式(16)ないし(19)によって、整数lの範囲が−M+2≦l≦Mであるピクセル{pl}を参照するフィルタサイズ(すなわち、フィルタタップの数)Sizeが2M−1である補間フィルタのフィルタ係数{p(α)}が決定される。
【0126】
【数14】
数式(19)によって決定されるフィルタ係数の補間フィルタリングは、
図5Bの参照ピクセルに比べて、右側に1ほど平行移動されたピクセルを参照する。
【0127】
数式(12)ないし(19)において、αは、0以上1以下の値に制限されない。すなわち、αは、0より小さいか、または1より大きい数であってもよい。したがって、数式(12)ないし(19)に基づいて、一実施形態によって、奇数フィルタタップで構成された補間フィルタ、すなわち、奇数タップ補間フィルタが具現される。補間フィルタのフィルタタップの数が奇数個であるので、補間フィルタを利用した補間フィルタリングは、奇数個の参照ピクセルを参照する。
【0128】
一実施形態による補間フィルタは、前述した補間位置を中心として非対称的に位置した参照ピクセルを利用する補間フィルタと、奇数タップ補間フィルタとが結合された形態も可能である。すなわち、補間位置を中心として非対称的に位置する奇数ピクセルを参照して、補間フィルタリングを行う補間フィルタも利用可能である。
【0129】
数式(12)ないし(15)において参照ピクセルの中心を一般化すれば、下記の数式(20)及び(21)によって、補間フィルタのフィルタ係数が誘導される。
【0130】
【数15】
ここで、M
max及びM
minは、それぞれ参照ピクセルのうち最小インデックス及び最大インデックス値を表し、参照ピクセルの範囲を表す。したがって、フィルタサイズSizeは、(M
max−M
min+1)として決定される。例えば、7タップ補間フィルタの場合、M
max=3及びM
min=−3であれば、参照ピクセルの中央インデックスが0である。Centerは、参照ピクセルのうち中央インデックスを表す。すなわち、Centerは、M
max及びM
minの平均値である。
【0131】
また、数式(20)及び(21)の補間フィルタのための基底関数を、コサイン変換関数の基底関数Wkとして表現すれば、下記の数式(22)及び(23)が誘導される。
【0132】
【数16】
したがって、一実施形態による補間フィルタは、補間位置を中心として非対称的に位置する参照ピクセルを利用する非対称形の補間フィルタであって、総フィルタ係数の個数が奇数である奇数タップ補間フィルタを含む。もちろん、数式(1)ないし(7)を参照して前述したように、一実施形態による補間フィルタは、対称形の補間フィルタと、偶数タップ補間フィルタとを含む。
【0133】
ただし、奇数タップ補間フィルタは、一般的に非対称形の補間フィルタであるが、偶数タップ補間フィルタは、対称形の補間フィルタであってもよく、非対称形の補間フィルタであってもよい。例えば、8タップ補間フィルタが、補間位置を中心として四つのフィルタ係数と、四つのフィルタ係数とで構成された場合には、対称形の偶数タップ補間フィルタであるが、8タップ補間フィルタが、補間位置を中心として三つのフィルタ係数と、五つのフィルタ係数とで構成された場合には、非対称形の偶数タップ補間フィルタであるとすることができる。
【0134】
一実施形態による補間フィルタは、補間位置によって、補間フィルタ応答の平滑度を調節して生成されたフィルタ係数で構成される。
【0135】
以下、実施形態による多様な平滑化補間フィルタを決定するために、ウィンドウフィルタが利用される場合について詳述する。
【0136】
<ウィンドウフィルタを利用した平滑化補間フィルタ>
一実施形態によって、ウィンドウフィルタを利用して、補間フィルタ係数を平滑化する方式について詳述する。
【0137】
一実施形態によって、使用可能なウィンドウフィルタは、ハミングウィンドウ関数、コサインウィンドウ関数、エクスポーネンシャルウィンドウ関数、ハニングウィンドウ関数、ブラックマンウィンドウ関数、及び三角ウィンドウ関数を利用する。以下、説明の便宜上、特定のウィンドウフィルタを利用して、一実施形態による変換及び逆変換に基づいた補間フィルタを平滑化する実施形態について詳述するが、前述したウィンドウ関数以外に、類似した周波数応答を有する他のウィンドウ関数も活用可能であることは当業者にとって容易に理解できるであろう。
【0138】
ハミングウィンドウ関数によるウィンドウ係数は、数式(24)による。
【0139】
【数17】
ハミングウィンドウ関数を含む多様なウィンドウ関数は、入力nがN/2を基準として対称であり、周波数応答が低域通過フィルタと類似している。ウィンドウ関数についての入力のうち、ウィンドウ関数が形成するウィンドウによりカバーされる入力のみが出力される。ウィンドウサイズNは、元来の補間フィルタのフィルタ長よりも大きい正の整数に設定される。例えば、1/2ピクセルまたは1/4ピクセルのように、副画素単位を生成するための補間フィルタにウィンドウ関数を適用するために、ウィンドウ関数の中央位置が1/2または1/4の副画素単位ほど移動される。すなわち、ウィンドウ関数の中央位置が補間位置に移動され、補間位置を中心として対称形態である。
【0140】
例えば、数式(25)及び(26)は、それぞれ1/2ピクセル単位と1/4ピクセル単位の補間フィルタのためのハミングウィンドウ関数によるウィンドウ係数を例示する。
【0141】
【数18】
数式(27)のウィンドウ係数は、副画素単位の補間位置αによって一般化された補間フィルタのためのウィンドウ関数として、順次にハミングウィンドウ関数、コサインウィンドウ関数、及びエクスポーネンシャルウィンドウ関数によるウィンドウ係数を例示する。
【0142】
【数19】
数式(27)によるウィンドウ係数を、元来の補間フィルタf
k(α)に合成することによって、平滑化補間フィルタ係数は、数式(28)によって決定される。
【0143】
【数20】
一実施形態によって、ウィンドウフィルタを利用して、平滑化補間フィルタを決定することによって、画素単位の参照ピクセルと補間位置との間の距離に基づいて、補間フィルタ係数についての加重値が調節される。例えば、ウィンドウ関数により、補間フィルタのフィルタ係数のうち、補間位置から遠い距離に位置した画素単位の参照ピクセルのためのフィルタ係数は大きく平滑化され、補間位置に近い参照ピクセルのためのフィルタ係数は大きく変更しない形態で、平滑化補間フィルタが決定される。
【0144】
また、ウィンドウフィルタを利用して、平滑化補間フィルタを決定することによって、画素単位の参照ピクセルを平滑化した後、補間フィルタリングが行われるという効果がある。入力された画素単位の参照ピクセル(Ref={p
−M+1,p
−M+2,…,p
0,p
1,…,p
M})は、ノイズを含んでいるか、または量子化エラーのようなエラーによって損傷されている。それによって、一実施形態による映像補間装置10は、画素単位の参照ピクセルを利用した補間前に、画素単位の参照ピクセルを平滑化した後、補間フィルタリングを行うことによって、補間効果を向上させることができる。
【0145】
<非対称的なウィンドウフィルタを利用した補間フィルタ>
一実施形態による非対称的なウィンドウフィルタは、フィルタの中央を中心として非対称的な形態である。したがって、補間フィルタのための非対称的なウィンドウフィルタは、補間位置を中心として非対称的に補間フィルタリングが行われる結果を誘導する。
【0146】
下記の数式(29)は、最も単純な形態の非対称的なウィンドウフィルタのフィルタ係数w
lを表す。
【0147】
【数21】
Nは、ウィンドウサイズであり、M
min及びM
maxは、それぞれ参照ピクセルのうち補間位置から最も遠いピクセル位置を表す。
【0148】
一実施形態によるウィンドウフィルタは、ウィンドウサイズNを変更することによって、フィルタ特性が調節される。ウィンドウサイズNは、補間フィルタサイズSizeより大きいか、またはそれと同じであるが、補間フィルタサイズの2倍よりは小さいか、またはそれと同じであることが望ましい(Size≦N≦2*Size)。
【0149】
例えば、数式(1)ないし(7)を数式(29)と組み合わせれば、Mが4である対称形の補間フィルタのフィルタ係数を決定する場合、参照ピクセルの個数(2M)は8であるので、8タップ補間フィルタであり、ウィンドウサイズN=13であるウィンドウ関数を利用した結果、1/4画素単位の補間フィルタ及び1/2画素単位の補間フィルタのフィルタ係数は、下記の通りである。ここで、使われたスケーリングファクターSは64である。
【0150】
1/4画素単位の補間フィルタ係数{p
l}={−1,4,−10,57,19,−7,3,−1};
1/2画素単位の補間フィルタ係数{p
l}={−1,4,−11,40,40,−11,4,−1};
同様に、数式(1)ないし(7)を数式(29)と組み合わせる時、M
min及びM
maxを異なって調節すれば、非対称的なウィンドウフィルタを利用して、非対称形の補間フィルタのフィルタ係数が決定される。
【0151】
<二つのパラメータを利用した平滑化補間フィルタ>
他の実施形態による平滑化補間フィルタは、二つのパラメータに基づいて、フィルタ係数の平滑度を決定する。変換及び逆変換に基づいた補間フィルタ係数と、平滑化マトリックスSとを合成した副画素単位のための平滑化補間フィルタ係数は、数式(30)による。
【0152】
【数22】
数式(31)は、平滑化マトリックスSの一例である。
【0153】
【数23】
数式(31)による平滑化マトリックスSは、3対角マトリックス形態である。すなわち、平滑化マトリックスSの成分のうち、一つの中心対角線、及び中心対角線に隣接し、相応する二つの対角線上の成分を除いた残りの成分は、いずれも0である。
【0154】
平滑化マトリックスSにおいて、平滑度σ
iは、補間される画素単位ピクセルからの距離(i−α)と関係なく決定されてもよい。その場合、平滑化マトリックスSによる平滑化は、均等平滑化と呼ばれる。
【0155】
また、一実施形態による平滑化マトリックスSにおいて、平滑度σ
iは、画素単位ピクセル位置のインデックスiによって変更されもする。その場合、平滑化マトリックスSによる平滑化は、非均等平滑化と呼ばれる。例えば、平滑度σ
iは、数式(32)による。
【0156】
【数24】
正の指数lは、補間される補間位置と画素単位の参照ピクセルとの間の距離が遠いほど、平滑化効果を向上させる。したがって、正の指数lは、平滑化の速度、すなわち、補間位置と画素単位の参照ピクセルとの間の距離によって、平滑化効果が向上する速度を制御することができる。平滑化パラメータβは、平滑化の範囲、すなわち、補間位置近辺での平滑化を制御することができる。
【0157】
若し0より小さいβが使われれば、数式(13)による平滑化マトリックスSは、シャープニングフィルタに変更されもする。したがって、0より小さい平滑化マトリックスSが変換及び逆変換を利用した補間フィルタと合成されれば、高周波成分を増幅させるフィルタが生成されることは、他の実施形態により具現される。
【0158】
一実施形態による映像補間装置10は、副画素単位の予測のために、平滑化補間フィルタ係数データを予めメモリなどに積載して使用する。
【0159】
図6は、一実施形態によって、平滑化補間フィルタの平滑度パラメータによる平滑化ファクターのグラフ67を示す。
【0160】
第1曲線68及び第2曲線69は、一実施形態による離散変換に基づいた補間フィルタを平滑にするための平滑化ファクターのグラフを示す。mが大きいほど、すなわち、補間される画素単位ピクセルから遠くなるほど、平滑化ファクターは0に近くなる。
【0161】
ここで、平滑化パラメータβの小さい第1曲線68は、平滑化パラメータβの大きい第2曲線69に比べて、相対的に平滑化ファクターの幅が広い。すなわち、平滑化パラメータβの大きい平滑化補間フィルタによれば、低周波成分のみが主にフィルタリングされて、相対的に強く平滑化された副画素単位のピクセル値が生成される。平滑化補間フィルタの平滑化パラメータβが相対的に小さければ、相対的に高周波成分が保存されたままで補間されて、副画素単位のピクセル値が生成される。
【0162】
以上、多様な補間フィルタとフィルタ係数とが開示された。特に、補間フィルタのフィルタ係数を決定するための関数として、ウィンドウ関数、スプライン関数、多項式などが利用される。補間フィルタのためには、関数の周波数応答は周波数によって変わるが、関数の周波数応答のフィルタ利得が1に近いことが望ましい。したがって、一実施形態による映像補間装置10は、周波数が変わるとしても、周波数応答のフィルタ利得が1に最も近い関数を利用して、フィルタ係数を決定し、該フィルタ係数で構成された補間フィルタを補間フィルタとして選択する。
【0163】
<正規化された補間フィルタ>
一実施形態によって、補間フィルタは、フィルタサイズが大きくなるほど、補間結果の正確性が向上する。しかし、フィルタサイズが大きくなるほど、フィルタリング結果で高周波成分が保存されるので、ノイズに脆弱である。一実施形態による補間フィルタは、補間位置αを中心とするコサインウィンドウ関数を利用して、参照ピクセル値{p
l}を平滑化することによって、補間フィルタリング結果のノイズを減少させることができる。コサインウィンドウ関数を利用して、参照ピクセル値{p
l}を平滑化する動作は、数式(33)による。
【0164】
【数25】
Nは、平滑化のためのウィンドウサイズであるが、必ずしも整数である必要はない。したがって、数式(7)による変換及び逆変換を利用したフィルタリングと、数式(33)によるウィンドウフィルタリングとが結合されれば、副画素単位の補間位置αのための平滑化補間フィルタリングが可能である。これによる平滑化補間フィルタリングは、FIR(Finite Impulse Response)フィルタにより具現され、下記の数式(34)及び(35)による。
【0165】
【数26】
数式(34)及び(35)において、p
αは、平滑化補間フィルタリング結果として生成されたピクセル値であり、Filter
l(α)は、平滑化補間フィルタのフィルタ係数を表す。M
min及びM
maxは、参照ピクセルの範囲を表す。
【0166】
クロマ成分のピクセルのための平滑化補間フィルタは、高周波成分の影響をさらに除去するために、平滑化補間フィルタの平滑化パラメータを調節する。平滑化パラメータσを利用したクロマ補間フィルタのフィルタ係数は、数式(36)及び(37)によって決定される。
【0167】
【数27】
図7は、一実施形態によって、補間フィルタの振幅周波数応答グラフ70を示す。
【0168】
補間フィルタにサイズ1であるハーモニック信号が入力されれば、補間フィルタの振幅周波数応答グラフ70は、補間フィルタリング結果を表している。
【0169】
振幅周波数応答グラフ70は、一実施形態によって、基底関数として離散コサイン変換及び逆変換を利用する8タップ平滑化補間フィルタの第1周波数応答71、一実施形態によって、正規化された8タップ平滑化補間フィルタの第2周波数応答72、及びH.264ビデオコーディング標準による6タップ補間フィルタの第3周波数応答73を示す。
【0170】
周波数応答71,72,73において、山(hill)711,715,721,731は、当該周波数で信号が増幅することを表し、谷(valley)713は、当該周波数で信号が減衰することを表す。入力信号が増幅したり減衰する効果は、補間フィルタリングに適していない。
【0171】
理想的な振幅周波数応答74は、全ての周波数で1であるので、山や谷が全く存在しない。それは、補間フィルタリングにより歪曲が発生しないことを意味する。
【0172】
補間フィルタの周波数応答が理想的な振幅周波数応答74に近いほど、補間フィルタリング結果がさらに正確になる。理想的な振幅周波数応答74と比較して、補間フィルタの周波数応答の歪曲は、補間フィルタの周波数応答と、理想的な振幅周波数応答74との差の二乗値、すなわち、差領域の広さとして数値化される。
【0173】
例えば、一実施形態による正規化された平滑化補間フィルタは、ウィンドウフィルタサイズN及び平滑度σを調節することによって、理想的な振幅周波数応答74に対する歪曲を最小化できる。理想的な振幅周波数応答74と比較して、正規化された平滑化補間フィルタの周波数応答の歪曲は、振幅周波数応答グラフ70において、理想的な振幅周波数応答74と、第2周波数応答72との間の斜線領域の広さに該当する。すなわち、斜線領域の広さが狭くなるほど、一実施形態による正規化された平滑化補間フィルタを利用した補間結果の正確性が向上する。
【0174】
また、周波数がπに近くなるほど、FIRフィルタの周波数応答は0に近くなるので、FIRフィルタは、高周波成分を生成できない。また、補間フィルタの遮断レベルが低いほど、補間フィルタは、参照映像の詳細情報を復元できない。一般的に、フィルタ長が長いほど、さらに高い遮断レベルが割り当てられる。振幅周波数応答グラフ70において、H.264 6タップ補間フィルタの第3周波数応答73の遮断レベル739に比べて、一実施形態による平滑化補間フィルタと、正規化された平滑化補間フィルタとの第1及び第2周波数応答71,72の遮断レベル719,729がさらに高いので、一実施形態による平滑化補間フィルタ、または正規化された平滑化補間フィルタを利用した補間結果が、H.264補間フィルタを利用した補間結果に比べて、参照映像の詳細情報をさらに正確に復元できる。
【0175】
したがって、一実施形態による8タップ平滑化補間フィルタは、H.264ビデオコーディング標準で利用される6タップ補間フィルタに比べて、入力信号の高周波成分を保存する補間フィルタリング結果を導出できる。また、H.264 6タップ補間フィルタの歪曲領域に比べて、8タップ平滑化補間フィルタの歪曲領域は相対的に狭いので、補間結果の歪曲が相対的に少ない。
【0176】
一実施形態による8タップ平滑化補間フィルタのうち、正規化された平滑化補間フィルタの第2周波数応答72が理想的な振幅周波数応答74に近く、正規化していない第1周波数応答は、山と谷の歪曲領域が発生するので、歪曲領域が相対的にさらに広い。すなわち、正規化された平滑化補間フィルタに比べて、正規化していない平滑化補間フィルタのフィルタリング結果は、相対的に所望しないアーティファクトをさらに含む。
【0177】
したがって、一実施形態による補間フィルタのフィルタ係数を決定するためには、理想的な振幅周波数応答74と比較して、歪曲領域が最小化される正規化された平滑化補間フィルタのフィルタ係数を選択することが有利である。すなわち、一実施形態による平滑化補間フィルタのウィンドウフィルタサイズN及び平滑度σを調節して、フィルタ係数を正規化することによって、平滑化補間フィルタの周波数応答の歪曲領域が最小化されるフィルタ係数が決定される。
【0178】
したがって、一実施形態による映像補間装置10の補間フィルタは、平滑化を考慮して決定されたフィルタ係数で構成される。
【0179】
<位相移動α&動きベクトル値>
従来、動き補償のための正確度は、1/2画素単位または1/4画素単位のように1/2
p画素単位の副画素単位である。これに対し、一実施形態による副画素単位の補間フィルタのフィルタ係数を決定するための補間位置αは、1/2
p画素単位に限定されない。
【0180】
一実施形態によって、補間位置αが1/2または1/4ではない副画素単位の動き補償のために、1/2画素単位または1/4画素単位の動きベクトルの部分ベクトルが利用される。例えば、1/2画素単位の動きベクトルMVの副画素単位成分セット{α,1/2,1−α}を仮定する。αが1/4より小さければ、動きベクトルMVの符号化単位成分の長さはさらに短くなるので、動き補償のための補間フィルタリングの安定性が向上し、差分動きベクトルのための符号化ビットが節約される。
【0181】
ビデオコーディングにおいて最も広く利用されるカラーフォーマットは、4:2:0フォーマットである。その場合、ルマサンプルに比べて、半分個数のクロマサンプルが符号化される。ルマサンプルとクロマサンプルとの間に同一な動きベクトルが共有される場合、クロマ動きベクトルのサイズは、ルマ動きベクトルの半分である。したがって、ルマ補間フィルタの位相移動と、クロマ補間フィルタの位相移動は同期化される。
【0182】
例えば、ルマ補間フィルタの位相移動が{α
i}であれば、クロマ補間フィルタの位相移動は、{α
i/2}∪{1−α
i/2}∪{1/2}に同期化される。
【0183】
例えば、動きベクトルMVの副画素単位成分セットを利用した動き補償の場合、ルマ補間フィルタの位相移動が{α,1/2,1−α}であれば、クロマ補間フィルタの位相移動は、{α/2,(1−α)/2,1/2,1−α/2,1−(1−α)/2}に同期化される。
【0184】
以上、一実施形態による補間フィルタのフィルタ係数を決定するために、複数個の基底関数に基づいた変換及び逆変換を利用する補間フィルタ、副画素単位の補間のための補間フィルタ、対称形/非対称形の補間フィルタ、奇数タップ/偶数タップ補間フィルタ、ウィンドウフィルタを適用した補間フィルタ、平滑化を考慮した補間フィルタ、正規化された補間フィルタなどが述べられた。
【0185】
前記それぞれの補間フィルタは、個別的に完全なフィルタであるが、それぞれの補間フィルタが合成されてもよい。例えば、一実施形態による補間フィルタは、副画素単位の補間が可能であり、補間位置を中心として参照ピクセルが対称的に位置するか、非対称的に位置するかに関係なく、補間フィルタリングを行う。また、フィルタ係数の個数が偶数または奇数であって、偶数個の画素単位ピクセルだけでなく、奇数個の画素単位ピクセルを参照する補間フィルタリングが可能である。また、正規化された平滑化補間フィルタのフィルタ係数が選択されることによって、参照ピクセルの詳細情報を保存しつつ、ノイズのような所望しない高周波成分は最小化して、補間フィルタリングによる歪曲を最小化できる。
【0186】
図8は、一実施形態による映像補間方法を示すフローチャートである。
【0187】
ステップ81において、ピクチャの画素単位の間に位置する少なくとも一つの副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置によって、対称形の補間フィルタまたは非対称形の補間フィルタが選択される。
【0188】
一実施形態によって選択された非対称形の補間フィルタは、奇数タップ補間フィルタである。一実施形態によって選択された対称形の補間フィルタは、偶数タップ補間フィルタである。
【0189】
一実施形態によるそれぞれの補間フィルタは、画素単位ピクセルを空間ドメインで補間するために、複数個の基底関数を利用した変換及び逆変換のためのフィルタと、非対称的な形態または対称的な形態であるウィンドウフィルタとを合成したフィルタ係数で構成される。
【0190】
一実施形態による補間フィルタのうち、選択された補間フィルタを利用した補間結果として発生する周波数応答誤差を最小化するように、正規化された補間フィルタが選択される。また、ノイズのような高周波成分の復元を防止するために、参照ピクセルを平滑化するためのフィルタ係数で構成された補間フィルタが選択される。
【0191】
ステップ83において、ステップ81で選択された補間フィルタを利用して、画素単位ピクセルのピクセル値を補間して、少なくとも一つの副画素単位のピクセル値が生成される。
【0192】
ステップ81で非対称形の補間フィルタが選択された場合には、ステップ83において、補間位置を中心として非対称的に位置する画素単位ピクセルを参照して、フィルタリングが行われる。ステップ81で対称形の補間フィルタが選択された場合には、ステップ83において、補間位置を中心として対称的に位置する画素単位ピクセルを参照して、フィルタリングが行われる。
【0193】
また、ステップ81で非対称形の奇数タップ補間フィルタが選択された場合には、ステップ83において、非対称形の奇数タップ補間フィルタの奇数個のフィルタ係数を利用して、補間位置を中心として位置した奇数個の画素単位ピクセルを参照して、フィルタリングが行われる。ステップ81で対称形の偶数タップ補間フィルタが選択された場合には、ステップ83において、対称形の偶数タップ補間フィルタの偶数個のフィルタ係数を利用して、補間位置を中心として位置した偶数個の画素単位ピクセルを参照して、フィルタリングが行われる。
【0194】
以下、
図9Aないし
図12Bを参照して、副画素単位の補間位置によって選択的に決定された対称形/非対称形の補間フィルタのフィルタ係数の多様な実施形態が開示される。
【0195】
図9Aないし
図12Bに示した補間フィルタは、前述した原理によって、複数個の基底関数に基づいた変換及び逆変換を利用する副画素単位の補間フィルタと、高周波成分の平滑化のためにウィンドウフィルタとが合成されたフィルタであり、補間結果の予測が最小化されるように、ウィンドウサイズ及び平滑度が調節されたフィルタ係数で構成される。また、多様な対称形/非対称形の補間フィルタ、及び奇数タップ/偶数タップ補間フィルタが開示される。
【0196】
一実施形態による補間フィルタは、鏡反射型の対称フィルタであるので、補間位置αのフィルタ係数f
m(α)を利用して、補間位置(1−α)のフィルタ係数f
m(1−α)が決定される。したがって、以下、
図9Aないし
図12Bのテーブルにおいて、動きベクトルMVの副画素単位が1/2より小さいか、またはそれと同じ場合の補間フィルタ係数{f
m(α)}のみが開示されているとしても、動きベクトルMVの副画素単位が1/2より大きい場合の残りの補間フィルタ係数{f
m(α)}が決定されることは当業者にとって容易に理解できるであろう。
【0197】
まず、
図9Aないし
図11Cのテーブルにおいて、テーブルの最初の列‘FracMV’は、1/2
p画素単位の動き補償のための動きベクトルMVの副画素単位を表す。一実施形態による副画素単位の補間フィルタリングのために、‘FracMV’値は、テーブルの二番目の列のフィルタ係数と組み合わせられる。テーブルの三番目の列の補間位置αは、副画素単位の補間位置を定義するためのパラメータであって、画素単位からの位相移動値を表す。テーブルの四番目の列のウィンドウフィルタサイズNは、必ずしも整数である必要はない。補間フィルタのスケーリングビットは、6ビットである。
【0198】
図9Aないし
図9Dは、それぞれ一実施形態によって、補間位置及びウィンドウフィルタサイズによって決定される3タップ、4タップ、5タップ及び6タップ補間フィルタのフィルタ係数を示す。
【0199】
図9Aは、3タップ補間フィルタであり、フィルタ係数{p
−1,p
0,p
1}で構成される非対称形の補間フィルタを示す。したがって、
図9Aの補間フィルタを利用した補間フィルタリングは、補間位置を中心として非対称的に位置した画素単位ピクセルを参照する。例えば、水平補間を行うならば、補間位置を中心として左側に二つ、右側に一つの画素単位の参照ピクセルを利用して、補間フィルタリングが行われる。
【0200】
図9Bは、4タップ補間フィルタであり、フィルタ係数{p
−1,p
0,p
1,p
2}で構成される対称形の補間フィルタを示す。したがって、
図9Bの補間フィルタを利用した補間フィルタリングは、補間位置を中心として対称的に位置した画素単位ピクセルを参照する。例えば、水平補間を行うならば、補間位置を中心として左側に二つ、右側に二つの画素単位の参照ピクセルを利用して、補間フィルタリングが行われる。
【0201】
図9Cは、5タップ補間フィルタであり、フィルタ係数{p
−1,p
0,p
1,p
2,p3}で構成される非対称形の補間フィルタを示す。したがって、
図9Cの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した二つの左側の画素単位の参照ピクセルと、三つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0202】
図9Dは、6タップ補間フィルタであり、フィルタ係数{p
−2,p
−1,p
0,p
1,p
2,p
3}で構成される対称形の補間フィルタを示す。したがって、
図9Dの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として対称的に位置した三つの左側の画素単位の参照ピクセルと、三つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0203】
図10Aないし
図10Cは、それぞれ一実施形態によって、補間位置及びウィンドウフィルタサイズによって決定される7タップ補間フィルタのフィルタ係数を示す。
【0204】
図10Aは、フィルタ係数{p
−3,p
−2,p
−1,p
0,p
1,p
2,p
3}で構成される非対称形の補間フィルタを示す。したがって、
図10Aの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した四つの左側の画素単位の参照ピクセルと、三つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0205】
図10Bは、フィルタ係数{p
−2,p
−1,p
0,p
1,p
2,p
3,p
4}で構成される非対称形の補間フィルタを示す。したがって、
図10Bの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した三つの左側の画素単位の参照ピクセルと、四つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0206】
図10Cは、フィルタ係数{p
−1,p
0,p
1,p
2,p
3,p
4,p
5}で構成される非対称形の補間フィルタを示す。したがって、
図10Cの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した二つの左側の画素単位の参照ピクセルと、五つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0207】
図11Aないし
図11Cは、それぞれ一実施形態によって、補間位置及びウィンドウフィルタサイズによって決定される8タップ補間フィルタのフィルタ係数を示す。
【0208】
図11Aは、フィルタ係数{p
−3,p
−2,p
−1,p
0,p
1,p
2,p
3,p
4}で構成される対称形の補間フィルタを示す。したがって、
図11Aの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として対称的に位置した四つの左側の画素単位の参照ピクセルと、四つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0209】
図11Bは、フィルタ係数{p
−2,p
−1,p
0,p
1,p
2,p
3,p
4,p
5}で構成される非対称形の補間フィルタを示す。したがって、
図11Bの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した三つの左側の画素単位の参照ピクセルと、五つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0210】
図11Cは、フィルタ係数{p
−4,p
−3,p
−2,p
−1,p
0,p
1,p
2,p
3}で構成される非対称形の補間フィルタを示す。したがって、
図11Cの補間フィルタを利用して、水平補間を行うならば、補間位置を中心として非対称的に位置した五つの左側の画素単位の参照ピクセルと、三つの右側の画素単位の参照ピクセルとを利用して、補間フィルタリングが行われる。
【0211】
図12A及び
図12Bは、それぞれ一実施形態によって、正規化されたルマ補間フィルタ及びクロマ補間フィルタのフィルタ係数を示す。
【0212】
図12A及び
図12Bは、<正規化された補間フィルタ>で前述したように、歪曲領域が最小化されるように選択された正規化された補間フィルタのフィルタ係数を示す。
図12Aは、ルマ補間フィルタのフィルタ係数を示し、
図12Bは、クロマ補間フィルタのフィルタ係数を示す。
【0213】
図12Aによれば、一実施形態によって、ルマ補間フィルタの正規化のために、ウィンドウフィルタのフィルタサイズNが調節される。
図9Aないし
図11Cに例示された多様な補間フィルタのうち、1/4画素単位の補間フィルタリングのための正規化されたルマ補間フィルタとして、ウィンドウサイズ8.7を有する7タップ補間フィルタ{−1,4,−10,58,17,−5,−1}が選択される。また、1/2画素単位の補間フィルタリングのための正規化されたルマ補間フィルタとして、ウィンドウサイズ9.5を有する8タップ補間フィルタ{−1,4,−11,40,40,−11,4,−1}が選択される。すなわち、1/4画素単位の正規化されたルマ補間フィルタとして、非対称形の補間フィルタが選択され、1/2画素単位の正規化されたルマ補間フィルタとして、対称形の補間フィルタが選択される。
【0214】
図12Bによれば、一実施形態によって正規化されたクロマ補間フィルタの正規化のために、平滑度σが調節される。一実施形態によって正規化されたクロマ補間フィルタは、1/8画素単位の4タップ対称形の補間フィルタが選択される。
【0215】
以下、
図13Aないし
図27を参照して、一実施形態による補間フィルタを利用するビデオの符号化及び復号化が開示される。
図15ないし
図25を参照して、一実施形態によって、ツリー構造による符号化単位に基づいたビデオの符号化及び復号化が開示され、
図26及び
図27を参照して、一実施形態による補間フィルタを利用するビデオの符号化方法及び復号化方法が開示される。
【0216】
映像に係るデータに対して各種の動作が行われる時、映像に係るデータは、データグループに分割され、同じデータグループに含まれるデータに対して同じ動作が行われる。以下、本明細書において、所定の基準によって形成されるデータグループを‘データ単位’という。以下、本明細書において、‘データ単位’ごとに行われる動作は、データ単位に含まれたデータを利用して、当該動作が行われることを意味する。
【0217】
<補間フィルタを利用するビデオ符号化/復号化>
図13Aは、一実施形態による補間フィルタを利用するビデオ符号化装置を示すブロック図である。
【0218】
ビデオ符号化装置100の符号化部120及び出力部130の動作は、ビデオエンコーディングプロセッサ、中央プロセッサ、グラフィックプロセッサなどによって有機的に制御される。
【0219】
一実施形態によるビデオ符号化装置100は、入力されたビデオのうち、現在のピクチャを符号化するために、現在のピクチャを所定のサイズのデータ単位に分割して、データ単位別に符号化を行う。
【0220】
例えば、現在のピクチャは、空間ドメインの画素で構成される。現在のピクチャのうち、空間的に隣接する画素を共に符号化するために、所定の範囲内の隣接した画素が一つのグループを成すように、現在のピクチャは、所定のサイズの画素グループに分割される。分割された所定のサイズの画素グループの画素についての一連の符号化動作によって、現在のピクチャについての符号化が行われる。
【0221】
ピクチャの符号化処理対象となる初期データが空間ドメインの画素値であるので、それぞれの所定のサイズの画素グループが、符号化処理対象となるデータ単位として利用される。また、空間ドメインの画素グループの画素値に対して、ビデオ符号化のための変換を行って、変換ドメインの変換係数が生成されるが、変換係数も空間ドメインの画素グループと同一なサイズの係数グループを維持する。したがって、変換ドメインの変換係数の係数グループも、ピクチャの符号化のためのデータ単位として利用される。
【0222】
したがって、空間ドメイン及び変換ドメインを合わせて、所定のサイズのデータグループが符号化のためのデータ単位として利用される。この時、データ単位のサイズは、データ単位に含まれるデータの個数として定義される。例えば、空間ドメインの画素の個数、または変換ドメインの変換係数の個数が、データ単位のサイズを表す。
【0223】
ビデオのうち、現在の符号化処理対象であるデータ単位、スライス、ピクチャ及びピクチャシーケンスのうちいずれか一つのデータレベルのデータグループごとに、現在のデータ単位についての符号化方式または符号化特性が決定される。
【0224】
一実施形態によるビデオ符号化装置100は、データ単位別にインター予測及びイントラ予測を含む予測符号化、変換、量子化及びエントロピー符号化を行うことによって、現在のピクチャの符号化を行う。
【0225】
インター予測によれば、時間的に以前のまたはその次のピクチャのピクセル値を参照して、現在のピクセル値が推定されるように、参照ピクチャの参照領域のピクセル値と、現在のピクチャのピクセル値とのレジデュアルデータ、及び参照されたピクセル値を指す参照データが決定される。
【0226】
一実施形態によるビデオ符号化装置100は、より正確なインター予測のために、副画素単位のピクセル値を利用して、レジデュアルデータ及び参照データを決定する。ビデオ符号化装置100は、副画素単位のインター予測のために、隣接する画素単位ピクセルを補間して、隣接する画素単位ピクセルの間に位置する副画素単位のピクセル値を決定する。
【0227】
また、隣接する画素単位ピクセルを含めて二つ以上の画素単位の参照ピクセルについての補間フィルタリングを通じて、副画素単位のピクセル値が生成される。補間フィルタリングのための参照ピクセルは、参照ピクチャ上のピクセルである。
【0228】
一実施形態によるビデオ符号化装置100は、効率的な映像補間のために、補間フィルタ係数を選択的に決定する。一実施形態による符号化部120に、一実施形態による映像補間装置10が搭載される。すなわち、符号化部120は、副画素単位のインター予測のために、映像補間装置10により、変換及び逆変換に基づいて決定されたフィルタ係数で構成された補間フィルタを利用して、副画素単位のピクセル値を生成する。
【0229】
一実施形態によるビデオ符号化装置100は、効果的な補間フィルタリングのために、補間フィルタ係数を予めメモリに保存しておく。一実施形態による補間フィルタ係数は、補間位置、平滑度、フィルタタップの数、ビット深さ、スケーリング割合、変換に基づいた補間フィルタリングの基底関数、ウィンドウ関数、ウィンドウサイズの種類によって、多様な種類の補間フィルタ係数がビデオ符号化装置100のメモリに保存されている。
【0230】
例えば、i)7タップフィルタ係数{−1,4,−10,58,17,−5,1}で構成されたウィンドウサイズ8.7である1/4画素単位の補間フィルタ、及びii)8タップフィルタ係数{−1,4,−11,40,40,−11,4,−1}で構成されたウィンドウサイズ9.5である1/2画素単位の補間フィルタのフィルタ係数がメモリに保存され、本発明による補間フィルタリングのために利用される。
【0231】
本例によるフィルタ係数を含めて、
図9Aないし
図12Bに例示された多様なフィルタ係数のように、多様な基底関数、ウィンドウ関数などを通じて変形可能な補間フィルタ係数が、補間フィルタとして利用されることは前述した通りである。
【0232】
メモリに保存されたフィルタ係数を利用した補間フィルタリングを通じて、インター予測のための演算速度が速くなる。
【0233】
符号化部120は、補間フィルタのうち、副画素単位の補間位置αによって対称形の補間フィルタ/非対称形の補間フィルタを選択して、インター予測に利用できる。加えて、フィルタタップの数、ビット深さ、スケーリング割合、ウィンドウフィルタサイズ、平滑度などによって、現在のピクセルに適している補間フィルタが決定される。
【0234】
一実施形態による符号化部100は、映像特性によって、補間フィルタを決定する。例えば、符号化部100は、ピクセルのカラー成分によって、異なる補間フィルタを決定する。例えば、ルマ成分のピクセルのための補間フィルタと、クロマ成分のピクセルのための補間フィルタとが個々に選択され、異なる補間フィルタリングを通じて、補間された副画素単位のピクセル値がそれぞれ生成される。
【0235】
副画素単位の補間に基づいたインター予測を含めて、イントラ予測、変換/量子化を行って、ビデオが符号化される。
【0236】
一実施形態による出力部130は、符号化情報を符号化して出力し、符号化されたピクチャデータを出力する。符号化情報は、補間フィルタの選択についての情報が別途に符号化される。すなわち、副画素単位の予測符号化のために、いかなる補間フィルタが使われたかについての情報が符号化される。例えば、映像の符号化過程においていなかるフィルタを利用して補間したのか復号化する側が知っていて始めて、符号化過程で利用された補間フィルタと同一なフィルタを利用して、映像を補間して復号化する。このために、補間に利用されたフィルタを特定できる情報が映像と共に符号化される。ただし、フィルタの選択が以前の符号化結果、すなわち、コンテキストに基づいて行われる場合には、フィルタ選択に係る情報を別途に符号化する必要がない。
【0237】
出力部130は、符号化情報及び符号化されたピクチャデータに対して、エントロピー符号化を行い、ビットストリームを出力する。
【0238】
図13Bは、一実施形態による補間フィルタを利用する映像復号化装置を示すブロック図である。
【0239】
一実施形態による補間フィルタを利用するビデオ復号化装置200は、受信抽出部220及び復号化部230を備える。以下、説明の便宜上、一実施形態による補間フィルタを利用するビデオ復号化装置200を‘ビデオ復号化装置200’と縮約して指す。ビデオ復号化装置200の受信抽出部220及び復号化部230の動作は、ビデオデコーディングプロセッサ、グラフィックプロセッサ、中央プロセッサなどにより有機的に制御される。
【0240】
ビデオ復号化装置200は、ビットストリームから映像を復元するために、エントロピー復号化、逆量子化、逆変換、インター予測/補償、及びイントラ予測/補償を含む動作を通じて、ビットストリームの符号化されたピクチャデータを復号化する。
【0241】
一実施形態による受信抽出部220は、符号化されたビデオについてのビットストリームを受信してパージングする。受信抽出部220は、パージングされたビットストリームから、現在のピクチャに対してデータ単位別に符号化されたデータを抽出し、符号化されたデータを復号化するように、符号化方式についての情報が収録された符号化情報を抽出する。
【0242】
符号化情報が補間フィルタ情報を含む場合、復号化部230は、補間フィルタ情報から、いかなる補間フィルタを利用して、副画素単位のイントラ予測を行ったか読み取り、符号化過程で利用された補間フィルタを利用して、動き補償を行う。
【0243】
復号化部230は、符号化モードについての情報に基づいて決定された各種の復号化方式によって、符号化されたピクチャに対して、エントロピー復号化、逆量子化、逆変換、インター予測/補償、イントラ予測/補償などの各種の復号化動作を行うことによって、符号化されたピクチャデータを復号化する。
【0244】
動き補償のために、参照データを利用して、現在のピクチャについての時間的に以前のまたはその次の参照ピクチャの参照領域が決定され、参照領域のピクセル値と、レジデュアルデータとが合成されて、現在のピクセル値が復元される。
【0245】
符号化過程において、副画素単位で補間されたピクセルに基づいて、レジデュアルデータ及び参照データが決定された場合、復号化部230も、副画素単位で補間されたピクセルに基づいて、動き補償を行う。復号化部230は、副画素単位の動き補償のために、参照ピクチャのピクセルのうち、隣接する画素単位ピクセルを補間して、副画素単位のピクセル値を生成する。隣接する画素単位ピクセルを含めて、二つ以上の画素単位の参照ピクセルについての補間フィルタリングを通じて、副画素単位のピクセル値が生成される。
【0246】
一実施形態によるビデオ復号化装置200は、効率的な映像補間のために、補間フィルタ係数を選択的に決定する。一実施形態による復号化部230に、一実施形態による映像補間装置10が搭載される。すなわち、復号化部230は、副画素単位の動き補償のために、変換に基づいた補間フィルタを利用して、副画素単位のピクセル値を生成する。
【0247】
一実施形態によるビデオ復号化装置200は、効果的な補間フィルタリングのために、補間位置、平滑度、フィルタタップの数、ビット深さ、スケーリング割合、及び変換に基づいた補間フィルタリングの基底関数の種類によって、多様に選択可能な補間フィルタのフィルタ係数をメモリに保存しておく。
【0248】
前述したように、例えば、(i)8タップ、スケーリング割合2
6、1/4画素単位のフィルタ係数である{−1,4,−10,57,19,−7,3,−1}、(ii)8タップ、スケーリング割合2
6、1/2画素単位のフィルタ係数である{−1,4,−11,40,40,−11,4,−1}、(iii)4タップ、スケーリング割合2
6、1/8画素単位のフィルタ係数である{−3,60,8,−1}、(iv)4タップ、スケーリング割合2
6、1/4画素単位のフィルタ係数である{−4,54,16,−2}、(v)4タップ、スケーリング割合2
6、3/8画素単位のフィルタ係数である{−5,46,27,−4}、(vi)4タップ、スケーリング割合2
6、1/2画素単位のフィルタ係数である{−4,36,36,−4}のうち少なくとも一つのフィルタ係数がメモリに保存され、本発明による補間フィルタリングのために利用される。本例によるフィルタ係数を含めて、
図8Aないし
図12Cに示したように、多様な基底関数、ウィンドウ関数などを通じて変形可能な補間フィルタ係数が、補間フィルタリングのために利用されることは前述した通りである。
【0249】
復号化部230は、補間フィルタのうち、副画素単位の補間位置α、平滑度、フィルタタップの数、ビット深さ、スケーリング割合などによって、現在のピクセルに適している補間フィルタを選択的に決定して、副画素単位の動き補償を行う。
【0250】
また、復号化部230は、映像特性によって、補間フィルタを決定する。例えば、ピクセルのカラー成分によって、異なる補間フィルタを選択し、ルマ成分のピクセルのための補間フィルタリングと、クロマ成分のピクセルのための補間フィルタリングとが個々に行われ、補間された副画素単位のピクセル値がそれぞれ生成される。
【0251】
したがって、復号化部230は、逆量子化/逆変換を通じて、空間ドメインのデータを復元し、イントラ予測及び画素単位の補間だけでなく、副画素単位の補間に基づいた動き補償を行うことによって、ピクセル値を復元し、現在のピクチャを復元する。ピクチャが復元されることによって、ビデオが復号化される。
【0252】
図14Aは、一実施形態による補間フィルタを利用する映像符号化方法を示すフローチャートである。ステップ1410において、入力されたビデオのうち、現在のピクチャを符号化するために、副画素単位の補間を利用した予測符号化が行われる。副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置及び平滑度に基づいて、異なって補間フィルタが選択される。一実施形態による補間フィルタの平滑度は、補間位置と画素単位との間の距離に基づいて決定される。
【0253】
参照ピクチャ上の二つ以上の画素単位の参照ピクセルについての補間フィルタリングを通じて、副画素単位のピクセル値が生成される。生成された副画素単位のピクセル値を利用して、レジデュアルデータ及び参照データが決定されることによって、予測符号化が行われる。
【0254】
効率的な映像補間のために、補間フィルタ係数を選択的に決定する。メモリは、対称形/非対称形の補間フィルタ、奇数タップ/偶数タップの補間フィルタ、正規化された補間フィルタのフィルタ係数を含んでいる。メモリに予め保存された補間フィルタ係数のうち、副画素単位の補間位置、平滑度、フィルタタップの数、ビット深さ、スケーリング割合、変換に基づいた補間フィルタリングの基底関数の種類、ウィンドウフィルタサイズ、カラー成分などによって、所望する補間フィルタが選択され、副画素単位のピクセル値のための補間が行われる。
【0255】
ステップ1420において、副画素単位の補間に基づいたインター予測を含めて、イントラ予測が行われた結果に対して、変換/量子化が行われる。
【0256】
ステップ1430において、量子化された変換係数の形態である符号化されたピクチャデータ及び符号化情報に対して、エントロピー符号化を行って、ビットストリームを出力する。符号化情報は、副画素単位の予測符号化のために、いかなる補間フィルタが使われたかについての情報を含む。
【0257】
図14Bは、一実施形態による補間フィルタを利用する映像復号化方法を示すフローチャートである。ステップ1450において、符号化されたビデオについてのビットストリームを受信し、エントロピー復号化してパージングし、ビットストリームから、現在のピクチャの量子化された変換係数及び符号化情報が抽出される。
【0258】
符号化情報が補間フィルタ情報を含む場合、補間フィルタ情報から必要な補間フィルタの種類を読み取ることも可能である。
【0259】
ステップ1460において、符号化情報から読み取られた符号化モードに基づいて決定された各種の復号化方式によって、量子化された変換係数に対して逆量子化及び逆変換を行い、レジデュアルデータを含めて、空間ドメインのデータが復元される。
【0260】
ステップ1470において、符号化モードに基づいて、動き補償、イントラ予測などの各種の復号化動作を通じて、符号化されたピクチャデータが復号化される。
【0261】
特に、副画素単位で補間されたピクセルに基づいて、符号化されたレジデュアルデータ及び参照データが抽出された場合、副画素単位で補間されたピクセルに基づいて、動き補償が行われる。副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置及び平滑度に基づいて、異なって補間フィルタが選択される。
【0262】
効率的な映像補間のために、補間フィルタ係数を選択的に決定する。メモリは、対称形/非対称形の補間フィルタ、奇数タップ/偶数タップの補間フィルタ、正規化された補間フィルタのフィルタ係数を含んでいる。メモリに予め保存された補間フィルタ係数のうち、副画素単位の補間位置、平滑度、フィルタタップの数、ヒット深さ、スケーリング割合、変換に基づいた補間フィルタリングの基底関数の種類、ウィンドウフィルタサイズ、カラー成分などによって、所望する補間フィルタが選択され、副画素単位のピクセル値のための補間が行われる。メモリに予め保存された補間フィルタ係数を利用して、補間されたピクセルを参照して動き補償が行われることによって、演算速度が速くなる。メモリは、対称形/非対称形の補間フィルタ、奇数タップ/偶数タップの補間フィルタを含んでいる。
【0263】
参照データを利用して、参照ピクチャ及び参照領域が決定され、参照ピクチャ上の二つ以上の画素単位の参照ピクセルについての補間フィルタリングを通じて、副画素単位のピクセル値が生成される。生成された副画素単位のピクセル値と、レジデュアルデータとが合成されることによって、動き補償が行われ、予測復号化が行われる。
【0264】
ステップ1480において、予測復号化を通じて復元されたピクセル値を利用して、現在のピクチャが復元され、ビデオが復号化される。
【0265】
<ツリー構造による符号化単位に基づいて、補間を利用するビデオ符号化/復号化>
以下、
図15ないし
図27を参照して、一実施形態によって、ツリー構造による符号化単位に基づいて、補間フィルタを利用するビデオ符号化装置及びビデオ復号化装置、並びにそれに相応するビデオ符号化方法及びビデオ復号化方法の実施形態について詳述する。
【0266】
本実施形態によるビデオ符号化装置100は、一実施形態によるツリー構造による符号化単位及び変換単位に基づいて、ビデオを符号化する。
【0267】
ビデオの現在のピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャが区画される。現在のピクチャが最大符号化単位よりも大きければ、現在のピクチャの映像データは、少なくとも一つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であって、横及び縦のサイズが2の二乗である正方形のデータ単位である。本実施形態による符号化部120は、少なくとも一つの最大符号化単位別にピクチャデータを符号化する。
【0268】
一実施形態による符号化単位は、最大サイズ及び深度によって特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位であると定義される。最大符号化単位は、深度が深くなるにつれて、深度別の符号化単位のサイズは減少するので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。
【0269】
前述したように、符号化単位の最大サイズによって、現在のピクチャの映像データを、最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域の映像データが、深度によって階層的に分類される。
【0270】
最大符号化単位の高さ及び幅を階層的に分割可能な総回数を制限する最大深度及び符号化単位の最大サイズは、予め設定されていてもよい。
【0271】
本実施形態による符号化部120は、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、少なくとも一つの分割領域別に、最終の符号化結果が出力される深度を決定する。すなわち、符号化部120は、現在のピクチャの最大符号化単位ごとに、深度別の符号化単位に映像データを符号化して、最小の符号化誤差が発生する深度を選択して、符号化深度として決定する。
【0272】
符号化部120は、最大符号化単位別に決定された符号化深度の符号化単位で符号化された映像データを出力する。また、符号化部120は、決定された符号化深度についての情報を出力部130に伝達して、符号化深度についての情報を符号化情報として符号化する。
【0273】
最大符号化単位内の映像データは、最大深度以下の少なくとも一つの深度によって、深度別の符号化単位に基づいて符号化され、それぞれの深度別の符号化単位に基づいた符号化結果が比較される。深度別の符号化単位の符号化誤差の比較結果、符号化誤差の最も小さい深度が選択される。それぞれの最大符号化単位ごとに、少なくとも一つの符号化深度が決定される。
【0274】
最大符号化単位のサイズは、深度が深くなるにつれて、符号化単位が階層的に分割され、符号化単位の個数は増加する。また、一つの最大符号化単位に含まれる同一な深度の符号化単位であるとしても、それぞれのデータについての符号化誤差を測定し、下位深度への分割如何が決定される。したがって、一つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別の符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。したがって、一つの最大符号化単位に対して、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
【0275】
したがって、一実施形態による符号化部120は、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による‘ツリー構造による符号化単位’は、現在の最大符号化単位に含まれる全ての深度別の符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では深度によって階層的に決定され、異なる領域では独立して決定される。同様に、現在の領域についての符号化深度は、他の領域についての符号化深度と独立して決定される。
【0276】
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を表す。例えば、最大符号化単位の深度が0であるとする時、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であれば、深度0、1、2、3及び4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
【0277】
最大符号化単位の予測符号化及び変換が行われる。予測符号化及び変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別の符号化単位に基づいて行われる。
【0278】
最大符号化単位が深度別に分割される度に、深度別の符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別の符号化単位に対して、予測符号化及び変換を含む符号化が行われなければならない。以下、説明の便宜上、少なくとも一つの最大符号化単位のうち、現在の深度の符号化単位に基づいて、予測符号化及び変換を説明する。
【0279】
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択可能である。映像データの符号化のためには、予測符号化、変換、エントロピー符号化などのステップを経るが、全てのステップにわたって、同一なデータ単位が使われてもよく、ステップ別にデータ単位が変更されてもよい。
【0280】
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。
【0281】
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位に基づいて、予測符号化が行われる。以下、予測符号化の基本となるそれ以上分割されない符号化単位を、‘予測単位’とする。予測単位が分割されたパーティションは、予測単位と、予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位とを含む。
【0282】
例えば、サイズ2N×2N(ただし、Nは、正の整数)の符号化単位がそれ以上分割されない場合、サイズ2N×2Nの予測単位となり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションだけでなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意の形態のパーティションなどを選択的に含んでもよい。
【0283】
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションのみに対して行われる。符号化単位以内の一つの予測単位ごとに、独立して符号化が行われて、符号化誤差の最も小さい予測モードが選択される。
【0284】
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位に基づいて、符号化単位の映像データの変換を行う。
【0285】
符号化単位の変換のためには、符号化単位よりも小さいか、またはそれと同じサイズの変換単位に基づいて、変換が行われる。例えば、変換単位は、イントラモードのためのデータ単位と、インターモードのための変換単位とを含む。
【0286】
一実施形態によるツリー構造による符号化単位と類似した方式によって、符号化単位内の変換単位も、再帰的にさらに小さいサイズの変換単位に分割されつつ、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
【0287】
一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割され、変換単位に達するまでの分割回数を表す変換深度が設定される。例えば、サイズ2N×2Nの現在の符号化単位の変換単位のサイズが2N×2Nであれば、変換深度は0、変換単位のサイズがN×Nであれば、変換深度は1、変換単位のサイズがN/2×N/2であれば、変換深度は2に設定される。すなわち、変換単位に対しても、変換深度によって、ツリー構造による変換単位が設定される。
【0288】
符号化深度別の符号化情報は、符号化深度だけでなく、予測関連情報及び変換関連情報が必要である。したがって、符号化部120は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別の予測モード、変換のための変換単位のサイズなどを決定する。符号化深度別の符号化情報は、インター予測のために、副画素単位の補間のための補間フィルタリングに係る情報を含んでもよい。
【0289】
また、符号化部120は、最大符号化単位または現在符号化単位ごとに予め限定的に設定された変換単位の最多分割レベルに基づいて、符号化単位についての符号化過程において、ツリー構造の変換単位を利用して変換を行う。
【0290】
深度別の符号化単位ごとに、符号化単位よりも小さいか、またはそれと同じサイズの基本変換単位は、段階的に下位変換深度の変換単位に分割される。一実施形態によるツリー構造の変換単位は、現在許容される最大サイズの変換単位である基本変換単位から、符号化単位に許容される最多分割レベルまでの下位レベルの変換単位を含む。
【0291】
符号化部120は、現在符号化単位内で変換深度によるレベル別に変換を行った結果、周辺領域の変換単位とは独立的であり、同一領域の変換深度別の変換単位の間には、階層的な構造を形成するツリー構造による変換単位を決定する。
【0292】
すなわち、符号化単位ごとに多様なサイズの変換単位を利用して変換を行い、変換結果を比較することによって、ツリー構造による変換単位が決定される。符号化単位の決定過程において、符号化単位の変換のための変換単位が決定される。一つ以上の深度の深度別の符号化単位と、それぞれの深度別の符号化ごとに、内部に含まれる一つ以上の変換深度の変換深度別の変換単位が変換に利用される。
【0293】
符号化単位ごとに、符号化誤差の最も小さい変換単位が決定されなければならない。変換単位の最小符号化誤差を発生させる変換深度が決定されるために、全ての変換深度別の変換単位ごとに符号化誤差が測定されて比較される。一実施形態による変換単位は、符号化単位の変換による誤差を最小化するデータ単位として決定されてもよい。
【0294】
したがって、深度別の符号化単位と変換単位の組み合わせのうち、符号化誤差の最も小さい組み合わせが決定され、最大符号化単位内の領域ごとに個別的に組み合わせが決定されるので、ツリー構造の符号化単位と、ツリー構造の変換単位とが決定される。
【0295】
一実施形態による最大符号化単位のツリー構造による符号化単位、パーティション、及びツリー構造による変換単位の決定方式については、
図15ないし
図25を参照して詳細に後述する。
【0296】
符号化部120は、深度別の符号化単位の符号化誤差を、ラグランジュ乗数に基づいた率−歪曲最適化技法を利用して測定する。
【0297】
ビデオ符号化装置100は、符号化部120で決定された少なくとも一つの符号化深度に基づいて符号化された最大符号化単位の映像データと、出力部130により符号化された深度別の符号化モードに係る情報とを共に含むビットストリームの形態で出力する。
【0298】
一実施形態によるツリー構造の符号化単位、予測単位、変換単位などに基づいて、ピクチャが符号化されることによって決定された符号化深度の符号化単位の符号化モードに係る情報は、ビットストリームのヘッダ、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)などに含まれる。
【0299】
符号化された映像データは、映像のレジデュアルデータの符号化結果である。
【0300】
深度別の符号化モードに係る情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
【0301】
符号化深度情報は、現在の深度で符号化せず、下位深度の符号化単位で符号化するか否かを表す深度別の分割情報を利用して定義される。現在の符号化単位の現在の深度が符号化深度であれば、現在の符号化単位は、現在の深度の符号化単位で符号化されるので、現在の深度の分割情報は、それ以上下位深度に分割されないように定義される。逆に、現在の符号化単位の現在の深度が符号化深度でなければ、下位深度の符号化単位を利用した符号化を試みなければならないので、現在の深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
【0302】
現在の深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位に対して、符号化が行われる。現在の深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われて、同一な深度の符号化単位ごとに、再帰的に符号化が行われる。
【0303】
一つの最大符号化単位内に、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも一つの符号化モードに係る情報が決定されなければならないので、一つの最大符号化単位に対しては、少なくとも一つの符号化モードに係る情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画されて、位置別に符号化深度が異なるので、データに対して、符号化深度及び符号化モードに係る情報が設定される。
【0304】
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係る符号化情報を割り当てる。
【0305】
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。一実施形態による最小単位は、最大符号化単位に含まれる全ての符号化単位、予測単位、パーティション単位、及び変換単位内に含まれる最大サイズの正方形のデータ単位である。
【0306】
例えば、出力部130を通じて出力される符号化情報は、深度別の符号化単位別の符号化情報と、予測単位別の符号化情報とに分けられる。深度別の符号化単位別の符号化情報は、予測モード情報及びパーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に係る情報、インターモードの参照映像インデックスに係る情報、動きベクトルに係る情報、イントラモードのクロマ成分に係る情報、イントラモードの補間方式に係る情報などを含む。
【0307】
ピクチャ、スライスまたはGOP別に定義される符号化単位の最大サイズに係る情報、及び最大深度に係る情報は、ビットストリームのヘッダ、SPSまたはPPSに挿入される。
【0308】
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別の符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在の深度の符号化単位のサイズが2N×2Nであれば、下位深度の符号化単位のサイズは、N×Nである。また、2N×2Nサイズの現在の符号化単位は、N×Nサイズの下位深度の符号化単位を最大四つ含む。
【0309】
したがって、ビデオ符号化装置100は、現在のピクチャの特性を考慮して決定された最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を決定して、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに、多様な予測モード、変換方式などにより符号化するので、多様な映像サイズの符号化単位の映像特性を考慮して、最適の符号化モードが決定される。
【0310】
したがって、映像の解像度が高すぎるか、またはデータ量が多すぎる映像を既存のマクロブロック単位で符号化すれば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。したがって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して、符号化単位の最大サイズを増大させつつ、映像特性を考慮して、符号化単位を調節できるので、映像圧縮効率が向上する。
【0311】
出力部130は、ツリー構造の符号化単位及びツリー構造の変換単位に基づいて、ビデオが符号化するのに使われた符号化方式に係る情報を表す符号化情報を符号化して出力する。一実施形態による符号化情報は、符号化深度の符号化単位についての各種の符号化モードに係る情報と、符号化深度に係る情報とを含む。
【0312】
本実施形態によるビデオ復号化装置200の各種のプロセッシングのための符号化単位、深度、予測単位、変換単位、各種の符号化モードに係る情報などの各種の用語の定義は、ビデオ符号化装置100を参照して前述した通りである。
【0313】
ビデオ復号化装置200は、符号化されたビデオについてのビットストリームを受信する。受信抽出部220は、受信されたビットストリームをパージングする。受信抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに、符号化されたピクチャデータを抽出して、復号化部230に出力する。受信抽出部220は、現在のピクチャについてのヘッダ、SPSまたはPPSから、現在のピクチャの符号化単位の最大サイズに係る情報を抽出する。
【0314】
また、受信抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位についての符号化情報を抽出する。符号化情報から、符号化深度に係る情報及び符号化モードに係る情報が抽出される。抽出された符号化深度及び符号化モードに係る情報は、復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、復号化部230が最大符号化単位ごとに映像データを復号化する。
【0315】
最大符号化単位別の符号化深度及び符号化モードに係る情報は、一つ以上の符号化深度情報について設定され、符号化深度別の符号化モードに係る情報は、当該符号化単位のパーティションタイプ情報、予測モード情報、及び変換単位のサイズ情報などを含む。符号化深度別の符号化情報から、インター予測のために、副画素単位の補間のための補間フィルタリングに係る情報が抽出される。また、符号化深度情報として、深度別の分割情報が抽出されることも可能である。
【0316】
受信抽出部220が抽出した最大符号化単位別の符号化深度及び符号化モードに係る情報は、一実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別の深度別の符号化単位ごとに、反復的に符号化を行って、最小符号化誤差を発生させることによって決定された符号化深度及び符号化モードに係る情報である。したがって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号化して、映像を復元する。
【0317】
一実施形態による符号化深度及び符号化モードに係る符号化情報は、当該符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して割り当てられているので、受信抽出部220は、所定のデータ単位別に、符号化深度及び符号化モードに係る情報を抽出する。所定のデータ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係る情報が記録されていれば、同一な符号化深度及び符号化モードに係る情報を有している所定のデータ単位は、同一な最大符号化単位に含まれるデータ単位として類推される。
【0318】
復号化部230は、深度別の分割情報を利用して、現在の最大符号化単位の符号化深度を決定する。若し、分割情報が現在の深度でそれ以上分割されないことを表していれば、現在の深度が符号化深度である。したがって、復号化部230は、現在の最大符号化単位の符号化されたピクチャデータに対しても、現在の深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号化する。
【0319】
すなわち、符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して設定されている符号化情報を観察して、同一な分割情報を含む符号化情報を保有しているデータ単位が集まって、復号化部230により同一な符号化モードに復号化する一つのデータ単位であると見なされる。
【0320】
復号化部230は、最大符号化単位ごとに、前記読み取られた符号化深度及び符号化モードに基づいて、それぞれの最大符号化単位の符号化されたピクチャデータを復号化して、現在のピクチャを復元する。最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、符号化モードとしてパーティションタイプ、予測モード、変換単位構造などが読み取られる。復号化過程は、イントラ予測及び動き補償を含む予測過程と、逆変換過程とを含む。
【0321】
復号化部230は、ツリー構造の符号化単位の予測単位のパーティションタイプ及び予測モードに基づいて、符号化単位ごとにそれぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行う。
【0322】
また、復号化部230は、ツリー構造の変換単位の構造を読み取り、符号化単位ごとに変換単位に基づいた逆変換を行う。
【0323】
ビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に係る情報を獲得して、現在のピクチャについての復号化に利用する。すなわち、最大符号化単位ごとに、最適符号化単位に決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
【0324】
したがって、高い解像度の映像、またはデータ量が多すぎる映像であるとしても、符号化端から伝送された最適符号化モードに係る情報を利用して、映像の特性に適応的に決定された符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。
【0325】
図15は、本発明の一実施形態による符号化単位の概念を示す。
【0326】
符号化単位の例は、符号化単位のサイズが幅×高さで表現され、サイズ64×64の符号化単位から32×32,16×16,8×8を含む。サイズ64×64の符号化単位は、サイズ64×64,64×32,32×64,32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32,32×16,16×32,16×16のパーティションに分割され、サイズ16×16の符号化単位は、サイズ16×16,16×8,8×16,8×8のパーティションに分割され、サイズ8×8の符号化単位は、サイズ8×8,8×4,4×8,4×4のパーティションに分割される。
【0327】
ビデオデータ310については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330については、解像度が352×288、符号化単位の最大サイズが16、最大深度が1に設定されている。
図15に示した最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。
【0328】
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけでなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、ビデオデータ330に比べて解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
【0329】
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が二階層深くなって、長軸サイズが32、16である符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が一階層深くなって、長軸サイズが8である符号化単位まで含む。
【0330】
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が三階層深くなって、長軸サイズが32、16、8である符号化単位まで含む。深度が深くなるほど、詳細情報の表現能力が向上する。
【0331】
図16は、本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。
【0332】
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化部120で、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在のフレーム405のうち、イントラモードの符号化単位に対して、イントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在のフレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
【0333】
一実施形態による動き推定部420及び動き補償部425は、副画素単位の参照ピクセルを利用して、細密に動きを推定するために、画素単位のピクセルを補間して、副画素単位のピクセルを生成する。副画素単位のピクセルを生成するための補間フィルタは、
図1及び
図13Aで前述した補間フィルタである。
【0334】
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460及び周波数逆変換部470を通じて、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
【0335】
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに、最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を行わなければならない。
【0336】
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在の最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位のサイズを決定しなければならない。
【0337】
図17は、本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。
【0338】
ビットストリーム505から、パージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係る情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
【0339】
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
【0340】
一実施形態による動き補償部560は、副画素単位の参照ピクセルを利用して、細密に動きを補償するために、画素単位のピクセルを補間して、副画素単位のピクセルを生成する。副画素単位のピクセルを生成するための補間フィルタは、
図2及び
図13Bで前述した補間フィルタである。
【0341】
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
【0342】
ビデオ復号化装置200の復号化部230で、映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後のステップ別の作業が行われる。
【0343】
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580がいずれも、最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を行わなければならない。
【0344】
特に、イントラ予測部550及び動き補償部560は、ツリー構造による符号化単位ごとに、パーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに、変換単位のサイズを決定しなければならない。
【0345】
図18は、本発明の一実施形態による深度別の符号化単位及びパーティションを示す。
【0346】
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高さ及び幅、最大深度は、映像特性によって適応的に決定されてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別の符号化単位のサイズが決定される。
【0347】
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64であり、最大深度が4である場合を示している。その時、最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による符号化単位の階層構造600の縦軸に沿って、深度が深くなるので、深度別の符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別の符号化単位の予測符号化の基本となる予測単位及びパーティションが示されている。
【0348】
すなわち、符号化単位610は、符号化単位の階層構造600で最大符号化単位であって、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32である深度1の符号化単位620、サイズ16×16である深度2の符号化単位630、サイズ8×8である深度3の符号化単位640が存在する。サイズ8×8である深度3の符号化単位640は、最小符号化単位である。
【0349】
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位であれば、予測単位は、サイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、及びサイズ32×32のパーティション616に分割される。
【0350】
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32×16のパーティション622、サイズ16×32のパーティション624、及びサイズ16×16のパーティション626に分割される。
【0351】
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、及びサイズ8×8のパーティション636に分割される。
【0352】
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、及びサイズ4×4のパーティション646に分割される。
【0353】
一実施形態によるビデオ符号化装置100の符号化部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
【0354】
同一な範囲及びサイズのデータを含むための深度別の符号化単位の個数は、深度が深くなるほど増加する。例えば、深度1の符号化単位が一つ含まれるデータに対して、深度2の符号化単位は四つ必要である。したがって、同一なデータの符号化結果を深度別に比較するために、一つの深度1の符号化単位、及び四つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
【0355】
それぞれの深度別の符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別の符号化単位の予測単位ごとに符号化を行って、当該深度で最小符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って、深度が深くなり、それぞれの深度ごとに符号化を行って、深度別の代表符号化誤差を比較して、最小符号化誤差が検索される。最大符号化単位610のうち、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプとして選択される。
【0356】
図19は、本発明の一実施形態による符号化単位と変換単位の関係を示す
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位よりも小さいか、またはそれと同じサイズの符号化単位の映像を符号化または復号化する。符号化過程中で変換のための変換単位のサイズは、それぞれの符号化単位よりも大きくないデータ単位に基づいて選択される。
【0357】
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200において、現在の符号化単位710が64×64サイズである時、32×32サイズの変換単位720を利用して、変換が行われる。
【0358】
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32,16×16,8×8,4×4サイズの変換単位にそれぞれ変換を行って符号化した後、原本との誤差が最も小さい変換単位が選択される。
【0359】
図20は、本発明の一実施形態による深度別の符号化情報を示す。
【0360】
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに係る情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を符号化して伝送する。
【0361】
パーティションタイプに係る情報800は、現在の符号化単位の予測符号化のためのデータ単位として、現在の符号化単位の予測単位が分割されたパーティションの形態に係る情報を表す。例えば、サイズ2N×2Nの現在の符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうちいずれか一つのタイプに分割されて利用される。その場合、現在の符号化単位のパーティションタイプに係る情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうち一つを表すように設定される。
【0362】
予測モードに係る情報810は、それぞれのパーティションの予測モードを表す。例えば、予測モードに係る情報810を通じて、パーティションタイプに係る情報800が表すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかが設定される。
【0363】
また、変換単位サイズに係る情報820は、現在の符号化単位を、どの変換単位に基づいて変換を行うかを表す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、及び第2イントラ変換単位サイズ828のうち一つである。
【0364】
一実施形態によるビデオ復号化装置200の映像データ及び受信抽出部210は、それぞれの深度別の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を抽出して、復号化に利用可能である。
【0365】
図21は、本発明の一実施形態による深度別の符号化単位を示す。
【0366】
深度の変化を表すために、分割情報が利用される。分割情報は、現在の深度の符号化単位が、下位深度の符号化単位に分割されるか否かを表す。
【0367】
深度0及びサイズ2N_0×2N_0の符号化単位900の予測符号化のための予測単位910は、サイズ2N_0×2N_0のパーティションタイプ912、サイズ2N_0×N_0のパーティションタイプ914、サイズN_0×2N_0のパーティションタイプ916、及びサイズN_0×N_0のパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912,914,916,918のみが例示されているが、前述したように、パーティションタイプは、これらに限定されず、非対称的なパーティション、任意の形態のパーティション、幾何学的な形態のパーティションなどを含む。
【0368】
パーティションタイプごとに、一つのサイズ2N_0×2N_0のパーティション、二つのサイズ2N_0×N_0のパーティション、二つのサイズN_0×2N_0のパーティション、及び四つのサイズN_0×N_0のパーティションごとに、反復的に予測符号化が行わなければならない。サイズ2N_0×2N_0、サイズN_0×2N_0、サイズ2N_0×N_0、及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0×2N_0のパーティションのみに対して、予測符号化が行われる。
【0369】
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最も小さければ、それ以上下位深度に分割する必要がない。
【0370】
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更して分割し(920)、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930に対して、反復的に符号化を行って、最小符号化誤差を検索する。
【0371】
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1×N_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、及びサイズN_1×N_1のパーティションタイプ948を含む。
【0372】
また、サイズN_1×N_1のパーティションタイプ948による符号化誤差が最も小さければ、深度1を2に変更して分割し(950)、深度2及びサイズN_2×N_2の符号化単位960に対して、反復的に符号化を行って、最小符号化誤差を検索する
最大深度がdである場合、深度別の符号化単位は、深度がd−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割されて(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、及びサイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
【0373】
パーティションタイプのうち、一つのサイズ2N_(d−1)×2N_(d−1)のパーティション、二つのサイズ2N_(d−1)×N_(d−1)のパーティション、二つのサイズN_(d−1)×2N_(d−1)のパーティション、及び四つのサイズN_(d−1)×N_(d−1)のパーティションごとに、反復的に予測符号化を通じた符号化が行われて、最小符号化誤差が発生するパーティションタイプが検索される。
【0374】
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在の最大符号化単位900についての符号化深度が、深度d−1として決定され、パーティションタイプは、N_(d−1)×N_(d−1)として決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して、分割情報は設定されていない。
【0375】
データ単位999は、現在の最大符号化単位についての‘最小単位’であると呼ばれる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。かかる反復的な符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別の符号化誤差を比較して、最小符号化誤差が発生する深度を選択して、符号化深度を決定し、当該パーティションタイプ及び予測モードが、符号化深度の符号化モードとして設定される。
【0376】
このように、深度0,1,…,d−1,dの全ての深度別の最小符号化誤差を比較して、誤差が最も小さい深度が選択されて、符号化深度として決定される。符号化深度、予測単位のパーティションタイプ及び予測モードは、符号化モードに係る情報として符号化されて伝送される。また、深度0から符号化深度に達するまで、符号化単位が分割されなければならないので、符号化深度の分割情報のみが‘0’に設定され、符号化深度を除いた深度別の分割情報は、‘1’に設定されなければならない。
【0377】
一実施形態によるビデオ復号化装置200の映像データ及び受信抽出部220は、符号化単位900についての符号化深度及び予測単位に係る情報を抽出して、符号化単位912を復号化するのに利用する。一実施形態によるビデオ復号化装置200は、深度別の分割情報を利用して、分割情報が‘0’である深度を符号化深度として把握し、当該深度についての符号化モードに係る情報を利用して復号化する。
【0378】
図22ないし
図24は、本発明の一実施形態による符号化単位、予測単位及び変換単位の関係を示す。
【0379】
符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別の符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別の符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別の符号化単位の変換単位である。
【0380】
深度別の符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054の深度が1、符号化単位1014,1016,1018,1028,1050,1052の深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048の深度が3、符号化単位1040,1042,1044,1046の深度が4である。
【0381】
予測単位1060のうち、一部のパーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2N×Nのパーティションタイプであり、パーティション1016,1048,1052は、N×2Nのパーティションタイプであり、パーティション1032は、N×Nのパーティションタイプである。深度別の符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位よりも小さいか、またはそれと同じである。
【0382】
変換単位1070のうち、一部の符号化単位1052の映像データについては、符号化単位に比べて小さいサイズのデータ単位で、変換または逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち、当該予測単位及びパーティションと比較すれば、異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、同一な符号化単位についてのイントラ予測/動き推定/動き補償作業、及び変換/逆変換作業であるとしても、それぞれ別途のデータ単位に基づいて行う。
【0383】
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われて、最適符号化単位が決定されることによって、再帰的なツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係る分割情報、パーティションタイプ情報、予測モード情報、及び変換単位サイズ情報を含む。以下、表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定可能な一例を表す。
【0384】
【表1】
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の受信抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位についての符号化情報を抽出する。
【0385】
分割情報は、現在の符号化単位が下位深度の符号化単位に分割されるか否かを表す。現在の深度dの分割情報が0であれば、現在の符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード及び変換単位サイズ情報が定義される。分割情報によってさらに分割されなければならない場合には、分割された四つの下位深度の符号化単位ごとに独立して符号化が行わなければならない。
【0386】
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで表す。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
【0387】
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションタイプ2N×2N、2N×N、N×2N、N×N、及び非対称的な割合で分割された非対称的なパーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nを表す。非対称的なパーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的なパーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態である。
【0388】
変換単位サイズは、イントラモードで二種類のサイズに、インターモードで二種類のサイズに設定される。すなわち、変換単位分割情報が0であれば、変換単位サイズが、現在の符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1であれば、現在の符号化単位が分割されたサイズの変換単位が設定される。また、サイズ2N×2Nである現在の符号化単位についてのパーティションタイプが、対称的なパーティションタイプであれば、変換単位サイズは、N×N、非対称的なパーティションタイプであれば、変換単位サイズは、N/2×N/2に設定される。
【0389】
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一な符号化情報を保有している予測単位及び最小単位を一つ以上含む。
【0390】
したがって、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一な符号化深度の符号化単位に含まれるか否かが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
【0391】
したがって、その場合、現在の符号化単位が、周辺データ単位を参照して予測する場合、現在の符号化単位に隣接する深度別の符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
【0392】
他の実施形態として、現在の符号化単位が、周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別の符号化単位の符号化情報を利用して、深度別の符号化単位内で、現在の符号化単位に隣接するデータが検索されることによって、周辺符号化単位が参照されることも可能である。
【0393】
図25は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。
【0394】
最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち一つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定される。
【0395】
変換単位分割情報(TU size flag)は、変換インデックスの一種であって、変換インデックスに対応する変換単位のサイズは、符号化単位の予測単位タイプまたはパーティションタイプによって変更可能である。
【0396】
例えば、パーティションタイプ情報が、対称的なパーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち一つに設定されている場合、変換単位分割情報が0であれば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1であれば、サイズN×Nの変換単位1344が設定される。
【0397】
パーティションタイプ情報が、非対称的なパーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定されている場合、変換単位分割情報が0であれば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1であれば、サイズN/2×N/2の変換単位1354が設定される。
【0398】
図25を参照して前述した変換単位分割情報は、0または1の値を有するフラグであるが、一実施形態による変換単位分割情報が1ビットのフラグに限定されるものではなく、設定によって0,1,2,3,…に増加し、変換単位が階層的に分割されてもよい。変換単位分割情報は、変換インデックスの一実施例として利用される。
【0399】
その場合、一実施形態による変換単位分割情報を、変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位のサイズが表現される。一実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化する。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、SPSに挿入される。一実施形態によるビデオ復号化装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用して、ビデオ復号化に利用できる。
【0400】
例えば、(a)現在の符号化単位のサイズが64×64であり、最大変換単位サイズが32×32であれば、(a−1)変換単位分割情報が0である時、変換単位のサイズが32×32、(a−2)変換単位分割情報が1である時、変換単位のサイズが16×16、(a−3)変換単位分割情報が2である時、変換単位のサイズが8×8に設定される。
【0401】
他の例として、(b)現在の符号化単位のサイズが32×32であり、最小変換単位サイズが32×32であれば、(b−1)変換単位分割情報が0である時、変換単位のサイズが32×32に設定され、変換単位のサイズが32×32よりも小さいことはないので、それ以上の変換単位分割情報が設定されない。
【0402】
さらに他の例として、(c)現在の符号化単位のサイズが64×64であり、最大変換単位分割情報が1であれば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されない。
【0403】
したがって、最大変換単位分割情報を‘MaxTransformSizeIndex’、最小変換単位サイズを‘MinTransformSize’、変換単位分割情報が0である場合の変換単位、すなわち、基本変換単位RootTuのサイズを‘RootTuSize’と定義する時、現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’は、下記の数式(I)のように定義される。
【0404】
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (I)
現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’と比較して、基本変換単位サイズ‘RootTuSize’は、システム上採択可能な最大変換単位サイズを表す。すなわち、数式(I)によれば、‘RootTuSize/(2^MaxTransformSizeIndex)’は、基本変換単位サイズ‘RootTuSize’を最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、‘MinTransformSize’は、最小変換単位サイズであるので、それらのうち小さい値が、現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’である。
【0405】
一実施形態による基本変換単位サイズ‘RootTuSize’は、予測モードによって変わる。
【0406】
例えば、現在の予測モードがインターモードであれば、‘RootTuSize’は、下記の数式(II)によって決定される。数式(II)において、‘MaxTransformSize’は、最大変換単位サイズを表し、‘PUSize’は、現在の予測単位サイズを表す。
【0407】
RootTuSize=min(MaxTransformSize,PUSize) (II)
すなわち、現在の予測モードがインターモードであれば、変換単位分割情報が0である場合の変換単位である基本変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在の予測単位サイズのうち小さい値に設定される。
【0408】
現在のパーティション単位の予測モードがイントラモードであれば、‘RootTuSize’は、下記の数式(III)によって決定される。‘PartitionSize’は、現在のパーティション単位のサイズを表す。
【0409】
RootTuSize=min(MaxTransformSize,PartitionSize) (III)
すなわち、現在の予測モードがイントラモードであれば、基本変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在のパーティション単位サイズのうち小さい値に設定される。
【0410】
ただし、パーティション単位の予測モードによって変わる一実施例による現在の最大変換単位サイズである基本変換単位サイズ‘RootTuSize’は、一実施例であるのみ、現在の最大変換単位サイズを決定する要因が、それに限定されるものではないことに留意しなければならない。
【0411】
図26は、本発明の一実施形態によって、ツリー構造による符号化単位に基づいて、補間フィルタを利用するビデオ符号化方法を示すフローチャートである。
【0412】
ステップ2610において、入力されたビデオのうち、現在のピクチャを符号化するために、現在のピクチャは、少なくとも一つの最大符号化単位に分割される。最大符号化単位の領域の一つ以上が深度によって分割された少なくとも一つの分割領域がそれぞれ符号化される。深度別に分割領域ごとに符号化するために、副画素単位の補間に基づいたインター予測を含めてイントラ予測が行われた結果に対して、変換/量子化が行われる。
【0413】
ここで、深度別に分割領域の符号化結果を比較して、少なくとも一つの分割領域別に最終の符号化結果が出力される分割深度が決定され、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。ツリー構造の符号化単位と同様に、ツリー構造による変換単位が決定される。すなわち、ピクチャの符号化結果として、決定されたツリー構造の符号化単位と同様に、ツリー構造による変換単位の符号化結果がピクチャの符号化されたデータとして出力される。
【0414】
一実施形態によるインター予測は、符号化単位の予測単位またはパーティションごとに行われる。副画素単位の補間を利用して生成されたピクセルを参照して、現在の予測単位またはパーティションの動きが予測される。副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置に基づいて異なって補間フィルタが選択される。効率的な映像補間のために、補間フィルタ係数を選択的に決定できる。補間フィルタは、補間位置によって、個別的に対称形の補間フィルタ/非対称形の補間フィルタのうち一つとして決定される。補間フィルタは、奇数タップまたは偶数タップの補間フィルタである。
【0415】
メモリに予め保存された補間フィルタ係数のうち、副画素単位の補間位置、平滑度、フィルタタップの数、ヒット深さ、スケーリング割合、変換に基づいた補間フィルタリングの基底関数の種類、ウィンドウフィルタサイズ、カラー成分などによって、所望する補間フィルタが選択され、副画素単位のピクセル値のための補間が行われる。
【0416】
ステップ2620において、最大符号化単位ごとに、少なくとも一つの分割領域別に最終の符号化結果である映像データと、符号化深度及び符号化モードに係る情報とがビットストリームの形態に出力される。
【0417】
符号化モードに係る情報は、符号化深度に係る情報または分割情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位階層構造情報などを含む。符号化情報は、副画素単位の予測符号化のために、いかなる補間フィルタが使われたかについての情報を含む。符号化された符号化モードに係る情報は、符号化された映像データと共に復号化端へ伝送される。
【0418】
図27は、本発明の一実施形態によって、ツリー構造による符号化単位に基づいて、補間フィルタを利用するビデオ復号化方法を示すフローチャートである。
【0419】
ステップ2710において、符号化されたビデオについてのビットストリームが受信される。
【0420】
ステップ2720において、パージングされたビットストリームから、最大サイズの最大符号化単位に割り当てられる現在のピクチャの映像データと、最大符号化単位別の符号化深度及び符号化モードに係る情報とが抽出される。符号化情報から、副画素単位の動き補償のために、いかなる補間フィルタが必要であるかについての情報が抽出されることも可能である。
【0421】
符号化情報から、一実施形態による符号化深度及び符号化モードに係る情報が読み取られる。一実施形態による符号化深度及び符号化モードに係る情報によれば、最大符号化単位がツリー構造による符号化単位に分割される。また、抽出された情報のうち、変換単位階層構造情報によれば、符号化単位内のツリー構造による変換深度の変換単位が決定される。
【0422】
ステップ2730において、最大符号化単位別の符号化深度及び符号化モードに係る情報を利用して、ツリー構造の符号化単位、これについての予測単位、これについてのツリー構造の変換単位に基づいて、それぞれの最大符号化単位の映像データが復号化される。符号化深度及び符号化モードに係る情報に基づいて、現在の符号化単位に対して復号化が行われるので、ツリー構造の変換単位のうち決定された変換単位を利用して、現在の符号化単位に対して逆変換が行われる。
【0423】
符号化単位の予測単位またはパーティションごとに、符号化モードに基づいて、動き補償、イントラ予測などの各種の復号化動作を通じて、符号化されたピクチャデータが復号化される。
【0424】
特に、副画素単位で補間されたピクセルに基づいて符号化されたレジデュアルデータ及び参照データが抽出された場合、現在の予測単位または現在のパーティションについての動き補償は、副画素単位で補間されたピクセルを参照して行われる。副画素単位のピクセル値を生成するための補間フィルタのうち、副画素単位の補間位置に基づいて異なって補間フィルタが選択される。補間フィルタは、補間位置によって、個別的に対称形の補間フィルタ/非対称形の補間フィルタのうち一つとして決定される。補間フィルタは、奇数タップまたは偶数タップの補間フィルタである。
【0425】
効率的な映像補間のために、補間フィルタ係数を選択的に決定できる。メモリに予め保存された補間フィルタ係数のうち、副画素単位の補間位置、平滑度、フィルタタップの数、ヒット深さ、スケーリング割合、変換に基づいた補間フィルタリングの基底関数の種類、ウィンドウフィルタサイズ、カラー成分などによって、所望する補間フィルタが選択され、副画素単位のピクセル値のための補間が行われる。
【0426】
参照データを利用して、参照ピクチャ及び参照領域が決定され、参照ピクチャ上の二つ以上の画素単位の参照ピクセルについての補間フィルタリングを通じて、副画素単位のピクセル値が生成される。生成された副画素単位のピクセル値と、レジデュアルデータとが合成されることによって、現在の予測単位または現在のパーティションについての動き補償が行われ、予測復号化が行われる。
【0427】
最大符号化単位ごとに復号化が行われるので、空間領域の映像データが復元され、ピクチャ及びピクチャシーケンスであるビデオが復元される。復元されたビデオは、再生装置により再生されたり、記録媒体に保存されたり、ネットワークを通じて伝送される。
【0428】
一方、前述した本発明の実施形態は、コンピュータで実行可能なプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用のデジタルコンピュータで具現される。前記コンピュータで読み取り可能な記録媒体は、磁気記録媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的読み取り媒体(例えば、CD−ROM、DVDなど)のような記録媒体を含む。
【0429】
以上、本発明について、その望ましい実施形態を中心に述べた。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で、変形された形態で具現可能であるということを理解できるであろう。したがって、開示された実施形態は、限定的な観点ではなく、説明的な観点で考慮されなければならない。本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての相違点は、本発明に含まれたものと解釈されなければならない。
【解決手段】 現在ブロックの予測のためのルマ参照ピクチャ内のルマ参照ブロックを前記現在ブロックのルマ動きベクトルを用いて決定する段階と、前記ルマ参照ピクチャ内の整数画素位置のサンプルに対して7タップフィルタを適用して、前記ルマ参照ブロックに含まれる1/4−画素位置または3/4−画素位置のルマサンプルを生成する段階と、前記現在ブロックの予測のためのクロマ参照ピクチャ内のクロマ参照ブロックを前記現在ブロックのクロマ動きベクトルを用いて決定する段階と、前記クロマ参照ピクチャ内の整数画素位置のサンプルに対して4タップフィルタを適用して、前記クロマ参照ブロックに含まれる1/8−画素位置または4/8−画素位置のクロマサンプルを生成する段階と、を含む動き補償方法。