【文献】
Jungsun Kim et al.,New intra chroma prediction using inter-channel correlation,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,2nd Meeting: Geneva, CH,2010年 7月,JCTVC-B021,pp.1-9
【文献】
Jianle Chen and Vadim Seregin,Chroma intra prediction by reconstructed luma samples,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,3rd Meeting: Guangzhou, CN,2010年10月,JCTVC-C206,pp.1-7
【文献】
Jianle Chen et al.,CE6.a: Chroma intra prediction by reconstructed luma samples,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D350,pp.1-7
【文献】
Jianle Chen et al.,CE6.a.4: Chroma intra prediction by reconstructed luma samples,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva,2011年 3月,JCTVC-E266_r1,pp.1-10
【文献】
Thomas Wiegand et al.,WD3: Working Draft 3 of High-Efficiency Video Coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 6月27日,JCTVC-E603_d8,8.3.3.1.8
【文献】
Madhukar Budagavi and Akira Osamoto,Luma-based chroma intra prediction simplification,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 6月30日,JCTVC-F233,pp.1-5
【文献】
Jianle Chen et al.,Complexity reduction of chroma intra LM prediction mode ,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 7月,JCTVC-F494_r1,pp.1-6
(58)【調査した分野】(Int.Cl.,DB名)
前記ダウンサンプリングのために所定輝度ピクセルグループから選択される輝度ピクセルの第1位置、第2位置及び第3位置は、それぞれ2×2輝度ピクセルグループ内の輝度ピクセルから独立して選択された輝度ピクセルの相対的位置を示し、
前記輝度ピクセルの第1フィルタリング方式、第2フィルタリング方式及び第3フィルタリング方式それぞれは、フィルタリング方向、フィルタタップ数及びフィルタ係数を独立して選択するフィルタリング方式であることを特徴とする請求項1に記載の色差成分映像の予測方法。
前記輝度予測単位のサイズを2nS×2nS(nSは、正の整数)、前記輝度予測単位に対応する色差予測単位のサイズをnS×nS、前記輝度予測単位の内部に位置しているピクセルをRecL(x,y)(x,y=0、…2nS−1)、前記輝度予測単位の上側に位置しているピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、
前記輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=(RecL(2x−1,−1)+2*RecL(2x,−1)+RecL(2x+1,−1)+2)>>2によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得し、
前記輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−1,2y)+RecL(−1,2y+1))>>1によって、前記色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、
前記輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、前記色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得することを特徴とする請求項1に記載の色差成分映像の予測方法。
前記輝度予測単位のサイズを2nS×2nS(nSは、正の整数)、前記輝度予測単位に対応する色差予測単位のサイズをnS×nS、前記輝度予測単位の内部に位置しているピクセルをRecL(x,y)(x,y=0、…2nS−1)、前記輝度予測単位の上側に位置しているピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、
前記輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=RecL(2x,−1)によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得し、
前記輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−1,2y)+RecL(−1,2y+1))>>1によって、前記色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、
前記輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、前記色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得することを特徴とする請求項1に記載の色差成分映像の予測方法。
前記輝度予測単位のサイズを2nS×2nS(nSは、正の整数)、前記輝度予測単位に対応する色差予測単位のサイズをnS×nS、前記輝度予測単位の内部に位置しているピクセルをRecL(x,y)(x,y=0、…2nS−1)、前記輝度予測単位の上側に位置しているピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、
前記輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=RecL(2x,−1)によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得し、
前記輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−2,2y)+RecL(−2,2y+1))>>1によって、前記色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、
前記輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、前記色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得することを特徴とする請求項1に記載の色差成分映像の予測方法。
前記輝度予測単位のサイズを2nS×2nS(nSは、正の整数)、前記輝度予測単位に対応する色差予測単位のサイズをnS×nS、前記輝度予測単位の内部に位置しているピクセルをRecL(x,y)(x,y=0、…2nS−1)、前記輝度予測単位の上側に位置しているピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、
前記輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=(RecL(2x,−2)+RecL(2x,−1))>>1によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得し、
前記輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−2,2y)+RecL(−2,2y+1))>>1によって、前記色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、
前記輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、前記色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得することを特徴とする請求項1に記載の色差成分映像の予測方法。
前記輝度予測単位のダウンサンプリングされた(x,y)位置の復元されたピクセルをRec_L’(x,y)、前記色差予測単位の(x,y)位置のピクセルの予測値をPred_C(x,y)、前記加重値をa、前記オフセット値をbとする時、
前記相関関係は、次の数式;Pred_C(x,y)=a*Rec_L’(x,y)+bのように定義されることを特徴とする請求項7に記載の色差成分映像の予測方法。
前記ダウンサンプリングのために所定輝度ピクセルグループから選択される輝度ピクセルの第1位置、第2位置及び第3位置は、それぞれ2×2輝度ピクセルグループ内の輝度ピクセルから独立して選択された輝度ピクセルの相対的位置を示し、
前記輝度ピクセルの第1フィルタリング方式、第2フィルタリング方式及び第3フィルタリング方式それぞれは、フィルタリング方向、フィルタタップ数及びフィルタ係数を独立して選択するフィルタリング方式であることを特徴とする請求項11に記載の色差成分映像の予測装置。
前記輝度予測単位のサイズを2nS×2nS(nSは、正の整数)、前記輝度予測単位に対応する色差予測単位のサイズをnS×nS、前記輝度予測単位の内部に位置しているピクセルをRecL(x,y)(x,y=0、…2nS−1)、前記輝度予測単位の上側に位置しているピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、
前記サンプリング部は、
前記輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=(RecL(2x−1,−1)+2*RecL(2x,−1)+RecL(2x+1,−1)+2)>>2によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得し、
前記輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−1,2y)+RecL(−1,2y+1))>>1によって、前記色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、
前記輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、前記色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得することを特徴とする請求項11に記載の色差成分映像の予測装置。
【発明を実施するための形態】
【0011】
本発明の一実施形態による輝度成分映像を用いた色差成分映像の予測方法は、カラーフォーマットによって対応する輝度予測単位及び色差予測単位のサイズを考慮して、以前に符号化された後で復元された輝度予測単位内部のピクセル及び前記輝度予測単位の周辺ピクセルをダウンサンプリングする段階と、前記ダウンサンプリングされた輝度予測単位の周辺ピクセル及び予測される色差予測単位の復元された周辺ピクセルに基づいて、前記輝度予測単位と前記色差予測単位との相関関係を示すパラメータを獲得する段階と、前記獲得されたパラメータを用いて前記ダウンサンプリングされた輝度予測単位から、対応する色差予測単位の予測値を獲得する段階と、を含み、前記ダウンサンプリングする段階は、前記輝度予測単位内部のピクセルに対して、ダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第1位置または輝度ピクセルの第1フィルタリング方式を選択する段階と、前記輝度予測単位の上側周辺ピクセルに対して、ダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第2位置または輝度ピクセルの第2フィルタリング方式を選択する段階と、前記輝度予測単位の左側周辺ピクセルに対して、ダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第3位置または輝度ピクセルの第3フィルタリング方式を選択する段階と、を含むことを特徴とする。
【0012】
本発明の一実施形態による輝度成分映像を用いた色差成分映像の予測装置は、カラーフォーマットによって対応する輝度予測単位及び色差予測単位のサイズを考慮して、以前に符号化された後で復元された輝度予測単位及び前記輝度予測単位の周辺ピクセルをダウンサンプリングするサンプリング部と、前記ダウンサンプリングされた輝度予測単位の周辺ピクセル及び予測される色差予測単位の復元された周辺ピクセルに基づいて、前記輝度予測単位と前記色差予測単位との相関関係を示すパラメータを獲得するパラメータ獲得部と、前記獲得されたパラメータを用いて前記ダウンサンプリングされた輝度予測単位から対応する色差予測単位の予測値を獲得する予測実行部と、を備え、前記サンプリング部は、前記輝度予測単位内部のピクセルに対してダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第1位置または輝度ピクセルの第1フィルタリング方式を選択し、前記輝度予測単位の上側周辺ピクセルに対して、ダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第2位置または輝度ピクセルの第2フィルタリング方式を選択し、前記輝度予測単位の左側周辺ピクセルに対して、ダウンサンプリングのために、所定輝度ピクセルグループから選択される輝度ピクセルの第3位置または輝度ピクセルの第3フィルタリング方式を選択することを特徴とする。
【0013】
以下、添付した図面を参照して本発明の望ましい実施形態について具体的に説明する。
【0014】
図1は、本発明の一実施形態によるビデオ符号化装置のブロック図である。一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を備える。
【0015】
最大符号化単位分割部110は、映像の現在ピクチャーのための最大サイズの符号化単位である最大符号化単位に基づいて現在ピクチャーを区切る。現在ピクチャーが最大符号化単位より大きければ、現在ピクチャーの映像データは少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であり、横及び縦のサイズが8より大きい2の二乗である正方形のデータ単位である。映像データは、少なくとも1つの最大符号化単位別に符号化単位決定部120に出力される。
【0016】
一実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれて深度別符号化単位のサイズは減少するので、上位深度の符号化単位は、複数の下位深度の符号化単位を含む。
【0017】
前述したように符号化単位の最大サイズによって、現在ピクチャーの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが、深度によって階層的に分類される。
【0018】
最大符号化単位の高さ及び幅を階層的に分割できる総回数を制限する最大深度及び符号化単位の最大サイズが予め設定されている。
【0019】
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化して、少なくとも1つの分割領域別に最終符号化結果が出力される深度を定める。すなわち、符号化単位決定部120は、現在ピクチャーの最大符号化単位ごとに深度別符号化単位で映像データを符号化して最も小さな符号化誤差が発生する深度を選択し、符号化深度と定める。定められた符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
【0020】
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差の最も小さな深度が選択される。それぞれの最大化符号化単位ごとに少なくとも1つの符号化深度が定められる。
【0021】
最大符号化単位のサイズは、深度が深くなるにつれて符号化単位が階層的に分割されて分割され、符号化単位の数は増加する。また、1つの最大符号化単位に含まれる同じ深度の符号化単位であっても、それぞれのデータについての符号化誤差を測定して下位深度への分割如何が定められる。よって、1つの最大符号化単位に含まれるデータであっても、位置によって深度別符号化誤差が異なるため、位置によって符号化深度が異なって定められる。よって、1つの最大符号化単位について符号化深度が1つ以上設定され、最大符号化単位のデータは、1つ以上の符号化深度の符号化単位によって区切られる。
【0022】
したがって、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が定められる。一実施形態による‘ツリー構造による符号化単位’は、現在最大符号化単位に含まれるすべての深度別符号化単位のうち、符号化深度と定められた深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で同一領域では深度によって階層的に定められ、他の領域については独立して定められる。同様に、現在領域についての符号化深度は、他の領域についての符号化深度と独立して定められる。
【0023】
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総数を示す。例えば、最大符号化単位の深度が0ならば、最大符号化単位が1回分割された符号化単位の深度は1に設定され、2回分割された符号化単位の深度が2に設定される。この場合、最大符号化単位から4回分割された符号化単位が最小符号化単位ならば、深度0、1、2、3及び4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
【0024】
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに深度別符号化単位に基づいて行われる。
【0025】
最大符号化単位が深度別に分割される度に深度別符号化単位の数が増加するので、深度が深くなるにつれて生成されるすべての深度別符号化単位について、予測符号化及び周波数変換を含む符号化が行われねばならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち現在深度の符号化単位に基づいて予測符号化及び周波数変換を説明する。
【0026】
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択できる。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などの段階を経るが、すべての段階にわたって同じデータ単位が使われてもよく、段階別にデータ単位が変更されてもよい。
【0027】
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択できる。
【0028】
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、これ以上分割されない符号化単位に基づいて予測符号化が行われる。以下、予測符号化の基盤になる、これ以上分割されない符号化単位を‘予測単位’と称する。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち少なくとも1つが分割されたデータ単位を含む。
【0029】
例えば、サイズ2N×2N(但し、Nは、正の整数)の符号化単位がこれ以上分割されない場合、サイズ2N×2Nの予測単位になり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的パーティションだけではなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
【0030】
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも1つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションについて行われる。また、スキップモードは、2N×2Nサイズのパーティションについてのみ行われる。符号化単位以内の1つの予測単位ごとに独立して符号化が行われて、符号化誤差の最も小さな予測モードが選択される。
【0031】
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位に基づいて符号化単位の映像データの周波数変換を行う。
【0032】
符号化単位の周波数変換のためには、符号化単位より小さいか、または同じサイズのデータ単位に基づいて周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位及びインターモードのためのデータ単位を含む。
【0033】
以下、周波数変換の基盤になるデータ単位は‘変換単位’と称する。符号化単位と類似した方式で、符号化単位内の変換単位も再帰的にさらに小さなサイズの変換単位に分割されつつ、符号化単位の残差データが変換深度によって、ツリー構造による変換単位によって区切られる。
【0034】
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割して変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2N×2Nの現在符号化単位の変換単位のサイズが2N×2Nならば、変換深度0、変換単位のサイズがN×Nならば、変換深度1、変換単位のサイズがN/2×N/2ならば、変換深度2に設定される。すなわち、変換単位についても変換深度によってツリー構造による変換単位が設定される。
【0035】
符号化深度別符号化情報は、符号化深度だけではなく予測関連情報及び周波数変換関連情報が必要である。よって、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、周波数変換のための変換単位のサイズなどを定める。
【0036】
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、
図3ないし
図12を参照して詳細に後述する。
【0037】
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian Multiplier)基盤の率−歪曲最適化技法(Rate−Distortion Optimization)を用いて測定できる。
【0038】
出力部130は、符号化単位決定部120で定められた少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ及び深度別符号化モードに関する情報を、ビットストリーム形態に出力する。
【0039】
符号化された映像データは、映像の残差データの符号化結果である。
【0040】
深度別符号化モードに関する情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
【0041】
符号化深度情報は、現在深度に符号化せずに下位深度の符号化単位で符号化するかどうかを示す深度別分割情報を用いて定義される。現在符号化単位の現在深度が符号化深度ならば、現在符号化単位は現在深度の符号化単位で符号化されるので、現在深度の分割情報はこれ以上下位深度に分割されないように定義される。一方、現在符号化単位の現在深度が符号化深度でなければ、下位深度の符号化単位を用いた符号化を試みる必要があるので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
【0042】
現在深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位について符号化が行われる。現在深度の符号化単位内に下位深度の符号化単位が1つ以上存在するので、それぞれの下位深度の符号化単位ごとに繰り返して符号化が行われ、同じ深度の符号化単位ごとに再帰的な符号化が行われる。
【0043】
1つの最大符号化単位内にツリー構造の符号化単位が定められ、符号化深度の符号化単位ごとに少なくとも1つの符号化モードに関する情報が定められらねばならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに関する情報が定められる。また、最大符号化単位のデータは、深度によって階層的に区切られて位置別に符号化深度が異なる可能性があるので、データについて符号化深度及び符号化モードに関する情報が設定される。
【0044】
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも1つについて、該符号化深度及び符号化モードについての符号化情報を割り当てる。
【0045】
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれるすべての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形データ単位である。
【0046】
例えば、出力部130を通じて出力される符号化情報は、深度別符号化単位別符号化情報と予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティション大きさ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に関する情報、インターモードの参照映像インデックスに関する情報、動きベクトルに関する情報、イントラモードのクロマ成分に関する情報、イントラモードの補間方式に関する情報などを含む。また、ピクチャー、スライスまたはGOP別に定義される符号化単位の最大サイズに関する情報及び最大深度に関する情報は、ビットストリームのヘッダに挿入される。
【0047】
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在深度の符号化単位のサイズが2N×2Nならば、下位深度の符号化単位のサイズはN×Nである。また、2N×2Nサイズの現在符号化単位は、N×Nサイズの下位深度符号化単位を最大4個含む。
【0048】
したがって、一実施形態によるビデオ符号化装置100は、現在ピクチャーの特性を考慮して定められた最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を定めて、ツリー構造による符号化単位を構成できる。また、それぞれの最大符号化単位ごとに多様な予測モード、周波数変換方式などで符号化できるので、多様な映像サイズの符号化単位の映像特性を考慮して最適の符号化モードが定められる。
【0049】
したがって、映像の解像度が非常に高いか、またはデータ量の非常に大きい映像を既存マクロブロック単位で符号化すれば、ピクチャー当たりマクロブロックの数が過度に多くなる。これによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなってデータ圧縮効率が低下する傾向がある。よって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して符号化単位の最大サイズを増大させつつ、映像特性を考慮して符号化単位を調節できるので、映像圧縮効率が向上する。
【0050】
図2は、本発明の一実施形態によるビデオ復号化装置のブロック図である。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号化部230を備える。一実施形態によるビデオ復号化装置200の各種プロセッシングのための符号化単位、深度、予測単位、変換単位、各種符号化モードに関する情報など各種用語の定義は、
図1及びビデオ符号化装置100を参照して前述した通りである。
【0051】
受信部205は、符号化されたビデオについてのビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって符号化単位ごとに符号化された映像データを抽出して、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャーについてのヘッダから現在ピクチャーの符号化単位の最大サイズに関する情報を抽出する。
【0052】
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位についての符号化深度及び符号化モードに関する情報を抽出する。抽出された符号化深度及び符号化モードに関する情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部230をして最大符号化単位ごとに映像データを復号化させる。
【0053】
最大符号化単位別符号化深度及び符号化モードに関する情報は、1つ以上の符号化深度情報について設定され、符号化深度別符号化モードに関する情報は、該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別分割情報が抽出されてもよい。
【0054】
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードに関する情報は、一実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別深度別符号化単位ごとに繰り返して符号化を行って最小符号化誤差を発生させると定められた符号化深度及び符号化モードに関する情報である。よって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によってデータを復号化して映像を復元できる。
【0055】
一実施形態による符号化深度及び符号化モードについての符号化情報は、該符号化単位、予測単位及び最小単位のうち所定データ単位について割り当てられるので、映像データ及び符号化情報抽出部220は、所定データ単位別に符号化深度及び符号化モードに関する情報を抽出できる。所定データ単位別に、該最大符号化単位の符号化深度及び符号化モードに関する情報が記録されていれば、同じ符号化深度及び符号化モードに関する情報を持っている所定データ単位は、同じ最大符号化単位に含まれるデータ単位と類推される。
【0056】
映像データ復号化部230は、最大符号化単位別符号化深度及び符号化モードに関する情報に基づいて、それぞれの最大符号化単位の映像データを復号化して現在ピクチャーを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含む。
【0057】
映像データ復号化部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとにそれぞれのパーティション及び予測モードによってイントラ予測または動き補償を行う。
【0058】
また、映像データ復号化部230は、最大符号化単位別周波数逆変換のために、符号化深度別符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとにそれぞれの変換単位によって周波数逆変換を行う。
【0059】
映像データ復号化部230は、深度別分割情報を用いて現在最大符号化単位の符号化深度を定める。もし、分割情報が現在深度でこれ以上分割されないことを示すならば、現在深度が符号化深度である。よって、映像データ復号化部230は、現在最大符号化単位の映像データについて現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を用いて復号化する。
【0060】
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位について設定されている符号化情報を観察して、同じ分割情報を含む符号化情報を保有しているデータ単位が集まって、映像データ復号化部230によって同じ符号化モードで復号化する1つのデータ単位と見なされる。
【0061】
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に関する情報を獲得し、現在ピクチャーについての復号化に用いる。すなわち、最大符号化単位ごとに最適符号化単位と定められたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
【0062】
したがって、高い解像度の映像またはデータ量が過度に多い映像であっても、符号化端から伝送された最適符号化モードに関する情報を用いて、映像の特性に適応的に定められた符号化単位のサイズ及び符号化モードによって効率的に映像データを復号化して復元できる。
【0063】
以下、
図3ないし
図13を参照して、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式が詳述される。
【0064】
図3は、階層的符号化単位の概念を示す。
【0065】
符号化単位の例は、符号化単位のサイズは幅×高さで表現され、サイズ64×64の符号化単位から、32×32、16×16、8×8を含む。サイズ64×64の符号化単位は、サイズ64×64、64×32、32×64、32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32、32x16、16×32、16×16のパーティションに、サイズ16×16の符号化単位は、サイズ16×16、16×8、8×16、8×8のパーティションに、サイズ8×8の符号化単位は、サイズ8×8、8×4、4×8、4×4のパーティションに分割される。
【0066】
ビデオデータ310については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が2に設定されている。ビデオデータ320については、解像度は1920×1080、符号化単位の最大サイズは64、最大深度が3に設定されている。ビデオデータ330については、解像度は352×288、符号化単位の最大サイズは16、最大深度が1に設定されている。
図3に示された最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
【0067】
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけではなく映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。よって、ビデオデータ330に比べて解像度の高いビデオデータ310、320は、符号化サイズの最大サイズが64に選択される。
【0068】
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズ64の最大符号化単位から、2回分割して深度が2階層深くなって長軸サイズ32、16の符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズ16の符号化単位から、1回分割して深度が一階層深くなって長軸サイズ8の符号化単位まで含む。
【0069】
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズ64の最大符号化単位から、3回分割して深度が3階層深くなって長軸サイズ32、16、8の符号化単位まで含む。深度が深くなるほど詳細情報の表現能が向上する。
【0070】
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部のブロック図である。
【0071】
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120で映像データの符号化に経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405のうちイントラモードの符号化単位についてイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を用いてインター推定及び動き補償を行う。
【0072】
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て量子化された変換係数に出力される。量子化された変換係数は、逆量子化部460、周波数逆変換部470を通じて空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて参照フレーム495に出力される。量子化された変換係数は、エントロピー符号化部450を経てビットストリーム455に出力される。
【0073】
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を行わねばならない。
【0074】
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティション及び予測モードを定め、周波数変換部430は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の変換単位のサイズを定めねばならない。
【0075】
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部のブロック図である。
【0076】
ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化に関する情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て逆量子化されたデータとして出力され、周波数逆変換部540を経て空間領域の映像データが復元される。
【0077】
空間領域の映像データについて、イントラ予測部550は、イントラモードの符号化単位についてイントラ予測を行い、動き補償部560は、参照フレーム585を共に用いてインターモードの符号化単位について動き補償を行う。
【0078】
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて復元フレーム595に出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
【0079】
ビデオ復号化装置200の映像データ復号化部230で映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後の段階別作業が行われる。
【0080】
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580がいずれも、最大符号化単位ごとにツリー構造による符号化単位に基づいて作業を行わねばならない。
【0081】
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位それぞれにパーティション及び予測モードを定め、周波数逆変換部540は、符号化単位ごとに変換単位のサイズを定めねばならない。
【0082】
図6は、本発明の一実施形態による深度別符号化単位及びパーティションを示す。
【0083】
一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために階層的な符号化単位を使う。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に定められてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別符号化単位のサイズが定められる。
【0084】
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64であり、最大深度が4の場合を図示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
【0085】
すなわち、符号化単位610は、符号化単位の階層構造600のうち最大符号化単位であり、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32の深度1の符号化単位620、サイズ16×16の深度2の符号化単位630、サイズ8×8の深度3の符号化単位640、サイズ4×4の深度4の符号化単位650が存在する。サイズ4×4の深度4の符号化単位650は、最小符号化単位である。
【0086】
それぞれの深度別で横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位ならば、予測単位はサイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、サイズ32×32のパーティション616に分割される。
【0087】
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32x16のパーティション622、サイズ16×32のパーティション624、サイズ16×16のパーティション626に分割される。
【0088】
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、サイズ8×8のパーティション636に分割される。
【0089】
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、サイズ4×4のパーティション646に分割される。
【0090】
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位かつ最下位深度の符号化単位であり、該予測単位もサイズ4×4のパーティション650のみに設定される。
【0091】
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を定めるために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わねばならない。
【0092】
同一範囲及びサイズのデータを含むための深度別符号化単位の数は、深度が深くなるほど深度別符号化単位の数も増加する。例えば、深度1の符号化単位1つが含むデータについて、深度2の符号化単位は4つ必要である。よって、同じデータの符号化結果を深度別に比較するために、1つの深度1の符号化単位及び4つの深度2の符号化単位を用いてそれぞれ符号化されねばならない。
【0093】
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行って、該深度で最も小さな符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行って、深度別代表符号化誤差を比較して最小符号化誤差が検索される。最大符号化単位610のうち最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプと選択される。
【0094】
図7は、本発明の一実施形態による、符号化単位及び変換単位の関係を示す。
【0095】
一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに最大符号化単位より小さいか、または同じサイズの符号化単位で映像を符号化または復号化する。符号化過程中に周波数変換のための変換単位のサイズは、それぞれの符号化単位より大きくないデータ単位に基づいて選択される。
【0096】
例えば、一実施形態によるビデオ符号化装置100または一実施形態によるビデオ復号化装置200で、現在符号化単位710が64×64サイズの時、32×32サイズの変換単位720を用いて周波数変換が行われる。
【0097】
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32、16×16、8×8、4×4サイズの変換単位でそれぞれ周波数変換を行って符号化した後、原本との誤差の最も少ない変換単位が選択される。
【0098】
図8は、本発明の一実施形態によって深度別符号化情報を示す。一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに関する情報として、それぞれの符号化深度の符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を符号化して伝送する。
【0099】
パーティションタイプに関する情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態に関する情報を示す。例えば、サイズ2N×2Nの現在符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、サイズN×Nのパーティション808のうちいずれか1つのタイプに分割されて用いられる。この場合、現在符号化単位のパーティションタイプに関する情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806及びサイズN×Nのパーティション808のうち1つを示すように設定される。
【0100】
予測モードに関する情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに関する情報810を通じて、パーティションタイプに関する情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち1つで予測符号化が行われるかどうかが設定される。
【0101】
また、変換単位サイズに関する情報820は、現在符号化単位をいかなる変換単位に基づいて周波数変換を行うかを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インタ変換単位サイズ826、第2イントラ変換単位サイズ828のうち1つである。
【0102】
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとにパーティションタイプに関する情報800、予測モードに関する情報810、変換単位サイズに関する情報820を抽出して復号化に用いる。
【0103】
図9は、本発明の一実施形態による深度別符号化単位を示す。
【0104】
深度の変化を示すために分割情報が用いられる。分割情報は、現在深度の符号化単位が下位深度の符号化単位に分割されるかどうかを示す。
【0105】
深度0及び2N_0×2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0×2N_0サイズのパーティションタイプ912、2N_0×N_0サイズのパーティションタイプ914、N_0×2N_0サイズのパーティションタイプ916、N_0×N_0サイズのパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912、914、916、918のみ例示されているが、前述したように、パーティションタイプはこれに限定されず、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含む。
【0106】
パーティションタイプごとに、1つの2N_0×2N_0サイズのパーティション、2つの2N_0×N_0サイズのパーティション、2つのN_0×2N_0サイズのパーティション、4つのN_0×N_0サイズのパーティションごとに繰り返して予測符号化が行われねばならない。サイズ2N_0×2N_0、サイズN_0×2N_0及びサイズ2N_0×N_0及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。サイズ2N_0×2N_0のパーティションについてのみ、スキップモードで予測符号化が行われる。
【0107】
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912、914、916のうち1つによる符号化誤差が最も小さければ、これ以上下位深度に分割する必要がない。
【0108】
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更しつつ分割920し、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930について繰り返して符号化を行って最小符号化誤差を検索する。
【0109】
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含む。
【0110】
また、サイズN_1xN_1サイズのパーティションタイプ948による符号化誤差が最も小さければ、深度1を深度2に変更しつつ分割950し、深度2及びサイズN_2×N_2の符号化単位960について繰り返して符号化を行って最小符号化誤差を検索する。
【0111】
最大深度がdの場合、深度別分割情報は、深度d−1まで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割970されて深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、サイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
【0112】
パーティションタイプのうち、1つのサイズ2N_(d−1)×2N_(d−1)のパーティション、2つのサイズ2N_(d−1)×N_(d−1)のパーティション、2つのサイズN_(d−1)×2N_(d−1)のパーティション、4つのサイズN_(d−1)×N_(d−1)のパーティションごとに繰り返して予測符号化を通じる符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
【0113】
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、これ以上下位深度への分割過程を経ず、現在最大符号化単位900についての符号化深度が深度d−1と定められ、パーティションタイプはN_(d−1)×N_(d−1)と定められる。また最大深度がdであるので、深度d−1の符号化単位952について分割情報は設定されない。
【0114】
データ単位999は、現在最大符号化単位についての‘最小単位’と称する。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。このような繰り返し的な符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較して最も小さな符号化誤差が発生する深度を選択して符号化深度を定め、該パーティションタイプ及び予測モードが符号化深度の符号化モードと設定される。
【0115】
このような形で深度0、1、…、d−1、dのすべての深度別最小符号化誤差を比較して誤差の最も小さな深度が選択され、符号化深度と定められる。符号化深度、及び予測単位のパーティションタイプ及び予測モードは、符号化モードに関する情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されねばならないので、符号化深度の分割情報のみ‘0’に設定され、符号化深度を除いた深度別分割情報は‘1’に設定されねばならない。
【0116】
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900についての符号化深度及び予測単位に関する情報を抽出して、符号化単位912の復号化に用いる。一実施形態によるビデオ復号化装置200は、深度別分割情報を用いて分割情報が‘0’の深度を符号化深度と把握し、該深度についての符号化モードに関する情報を用いて復号化に用いる。
【0117】
図10ないし
図12はそれぞれ、本発明の一実施形態による符号化単位、予測単位、周波数変換単位の関係を示す。
【0118】
符号化単位1010は、最大符号化単位について一実施形態によるビデオ符号化装置100が定めた符号化深度別符号化単位である。予測単位1060は、符号化単位1010のうちそれぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
【0119】
深度別符号化単位1010は、最大符号化単位の深度が0ならば、符号化単位1012、1054は、深度が1、符号化単位1014、1016、1018、1028、1050、1052は、深度が2、符号化単位1020、1022、1024、1026、1030、1032、1048は、深度が3、符号化単位1040、1042、1044、1046は、深度が4である。
【0120】
予測単位1060のうち一部のパーティション1014、1016、1022、1032、1048、1050、1052、1054は、符号化単位が分割された形態である。すなわち、パーティション1014、1022、1050、1054は、2N×Nのパーティションタイプであり、パーティション1016、1048、1052は、N×2Nのパーティションタイプ、パーティション1032は、N×Nのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、または同一である。
【0121】
変換単位1070のうち一部1052の映像データについては、符号化単位に比べて小さなサイズのデータ単位で周波数変換または周波数逆変換が行われる。また、変換単位1014、1016、1022、1032、1048、1050、1052、1054は、予測単位1060のうち該予測単位及びパーティションと比較すれば、互いに異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、同じ符号化単位についてのイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であっても、それぞれ別途のデータ単位に基づいて行う。
【0122】
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われて最適符号化単位が定められることで、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位についての分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含む。以下の表1は、一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200で設定できる一例を示す。
【0123】
【表1】
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームからツリー構造による符号化単位についての符号化情報を抽出する。
【0124】
分割情報は、現在符号化単位が下位深度の符号化単位に分割されるかどうかを示す。現在深度dの分割情報が0ならば、現在符号化単位が下位符号化単位にこれ以上分割されない深度が符号化深度であるので、符号化深度についてパーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって1段階さらに分割されねばならない場合には、分割された4個の下位深度の符号化単位ごとに独立して符号化が行われねばならない。
【0125】
予測モードは、イントラモード、インターモード及びスキップモードのうち1つで示す。イントラモード及びインターモードは、すべてのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
【0126】
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的パーティションタイプ2N×2N、2N×N、N×2N及びN×Nと、非対称的な割合で分割された非対称的パーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nとを示す。非対称的パーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
【0127】
変換単位サイズは、イントラモードで2種のサイズ、インターモードで2種のサイズに設定される。すなわち、変換単位分割情報が0ならば、変換単位のサイズが現在符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1ならば、現在符号化単位が分割されたサイズの変換単位が設定される。またサイズ2N×2Nである現在符号化単位についてのパーティションタイプが対称形パーティションタイプならば、変換単位のサイズはN×N、非対称形パーティションタイプならば、N/2×N/2に設定される。
【0128】
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも1つについて割り当てられる。符号化深度の符号化単位は、同じ符号化情報を保有している予測単位及び最小単位を1つ以上含む。
【0129】
したがって、隣接しているデータ単位同士でそれぞれ保有している符号化情報を確認すれば、同じ符号化深度の符号化単位に含まれるかどうかが確認される。また、データ単位が保有している符号化情報を用いれば、該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
【0130】
したがって、この場合、現在符号化単位が周辺データ単位を参照して予測符号化が行われる場合、現在符号化単位に隣接している深度別符号化単位内のデータ単位の符号化情報が直接参照されて用いられる。
【0131】
さらに他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接している深度別符号化単位の符号化情報を用いて、深度別符号化単位内で現在符号化単位に隣接しているデータが検索されることで周辺符号化単位が参照されてもよい。
【0132】
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。
【0133】
最大符号化単位1300は、符号化深度の符号化単位1302、1304、1306、1312、1314、1316、1318を含む。こののうち1つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定される。
【0134】
パーティションタイプ情報が、対称形パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち1つに設定されている場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1ならば、サイズN×Nの変換単位1344が設定される。
【0135】
パーティションタイプ情報が、非対称形パーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち1つに設定された場合、変換単位分割情報(TU size flag)が0ならば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1ならば、サイズN/2×N/2の変換単位1354が設定される。
【0136】
以下、
図4の本発明の一実施形態による符号化装置400及び
図5の復号化装置500で行われる予測過程について具体的に説明する。本発明の一実施形態による輝度成分予測単位から色差成分予測単位を予測する過程は、
図4のイントラ予測部410及び
図5のイントラ予測部550で新たなイントラ予測モードとして行われる。輝度成分予測単位から色差成分予測単位を予測するイントラ予測モードは、Intra_FromLumaモードと称される。
【0137】
一般的にカラービデオ信号は、カラーを表現するために各ピクセルごとに少なくとも3つの色成分を必要とする。カラー空間は、カラービデオ信号の各サンプルを、赤色(Red)、緑色(Green)、青色(Blue)の相対的な割合を示す3つのピクセル値を通じて示すRGBカラー空間、人間の視覚システム(Human Visual System:HVS)が輝度にさらに敏感であるということを考慮して、カラービデオ信号で輝度と色差成分とを分離して表現するYCbCrカラー空間及びYUVカラー空間などの多様な種類が存在する。一般的なビデオ符号化/復号化方法は、ビデオ信号をこのような複数の色成分に分けて符号化及び復号化を行う。このような複数の色成分を含むビデオ信号で同じピクセルを表現する複数の色成分の間には一定の相関関係が存在する確率が高い。例えば、対応する同一ブロックのピクセルの輝度(Y)成分の値と、色差(Cb,Cr)の値とは、互いに類似したパターンを持つ。
【0138】
したがって、本発明の一実施形態による予測装置は、現在色差予測単位の処理以前に符号化された後で復元された周辺輝度ピクセル及び復元された周辺色差ピクセルを用いて、輝度信号と色差信号との線形的な相関関係を示すパラメータを獲得し、獲得されたパラメータを用いて以前に復元された輝度予測単位から、現在色差予測単位の予測値を生成する。本発明の一実施形態によれば、カラーフォーマットによって輝度予測単位と色差予測単位とのサイズ差を考慮して、輝度予測単位内部のピクセル、上側に隣接しているピクセル及び左側に隣接しているピクセルそれぞれについて互いに異なるダウンサンプリング方式を適用し、色差ピクセルに対応する輝度ピクセルをサンプリングする。また、本発明の一実施形態によれば、輝度信号と色差信号との線形的相関関係を示すパラメータを、ハードウェア的に負担になる除算演算を防止し、シフト、乗算、足し算、引き算演算及びルックアップテーブルアクセスのみを用いて効率的に獲得する方式が提供される。また、本発明の一実施形態によれば、パラメータを獲得する演算過程で必要な値をルックアップテーブル方式で予め保存し、ルックアップテーブルを参照してパラメータを獲得する演算過程を行うことで演算量を低減させる方式が提供される。以下の説明で、輝度成分のピクセルから対応する色差成分のピクセルを予測する過程を中心として説明するが、本発明の思想はこのようなYCbCrカラー空間に限定されず、RGBなどの他のカラー空間にも適用できるということを、当業者ならば、理解できるであろう。
【0139】
図14は、本発明の一実施形態によるイントラ予測装置の構成を示すブロック図である。
図14を参照すれば、本発明の一実施形態によるイントラ予測装置1400は、サンプリング部1410、パラメータ獲得部1420及び予測実行部1430を備える。
【0140】
サンプリング部1410は、輝度予測単位のサイズが対応する色差予測単位のサイズより大きい場合、復元された輝度予測単位のピクセル及び周辺ピクセルをダウンサンプリングして、輝度予測単位のサイズと色差予測単位のサイズとが同じくなるように輝度信号をダウンサンプリングする。具体的な輝度信号のダウンサンプリング過程については、後述する。以下の説明で、輝度成分のピクセルは輝度ピクセルと、色差成分のピクセルは色差ピクセルと記載する。
【0141】
パラメータ獲得部1420は、色差予測単位の復元された周辺ピクセル及び色差予測単位と対応する輝度予測単位の復元された周辺ピクセルに基づいて、色差予測単位と輝度予測単位との相関関係を示すパラメータを獲得する。特に、パラメータ獲得部1410は、後述されるルックアップテーブルのサイズ及びパラメータ獲得のための演算過程で発生するオーバフローを防止するために、ビット深度を変更するスケーリング過程を行う。具体的なパラメータ獲得部1410の動作は、後述する。
【0142】
予測実行部1430は、獲得されたパラメータを用いて復元された輝度ピクセルから対応する色差ピクセルを予測する。
【0143】
図15Aないし
図15Cは、複数の色成分を含む色フォーマットを示す参照図であり、
図16A及び
図16Bは、カラーフォーマットによる輝度予測単位及び色差予測ダンウィウル示す参照図である。
【0144】
図15Aないし
図15Cの4:2:0色フォーマット、4:2:2色フォーマット及び4:4:4色フォーマットにおいて各数字は、水平方向への相対的なサンプリング割合を示す。例えば、4:4:4色フォーマットでは、4つの輝度(Y)ピクセル1530に対して4つのCbピクセル及び4つのCrピクセルが存在する。
図16Aを参照すれば、4:4:4色フォーマットでは、Y輝度予測単位のサイズを2N×2M(N、Mは、整数)とする時、Y輝度予測単位と対応するCb、Cr色差予測単位も2N×2Mのサイズを持つ。4:2:2色フォーマットでは、色差成分Cb、Crは垂直方向には輝度成分Yと同じ解像度を持つが、水平方向には輝度成分の1/2解像度を持つ。すなわち、4:2:2色フォーマットでは、水平方向に4つの輝度ピクセル1510ごとに2つのCbピクセル及び2つのCrピクセルが存在する。また、4:2:0色フォーマットでは、色差成分Cb、Crは、輝度成分Yに比べて水平及び垂直に1/2解像度を持つ。すなわち、色差成分Cb、Crは、輝度成分Yのピクセル数に比べて1/4のピクセルを持つようになり、
図16Bに示されたように、4:2:0フォーマットで2N×2Mのサイズを持つ輝度予測単位Yに比べて、対応する色差予測単位Cb、Crは、水平及び垂直方向に1/2ほど小さなN×Mのサイズを持つ。
【0145】
したがって、サンプリング部1410は、4:2:2色フォーマットまたは4:2:0色フォーマットのように輝度予測単位が色差予測単位に比べて大きい場合、復元された輝度予測単位及び輝度予測単位の周辺ピクセルをダウンサンプリングして、輝度信号と色差信号とを1:1にマッチングさせる。
【0146】
特に、本発明の一実施形態によるサンプリング部1410は、輝度予測単位の内部に位置しているピクセル、輝度予測単位の上側に隣接している周辺ピクセル、前記輝度予測単位の左側に隣接している周辺ピクセルそれぞれについて、独立的なダウンサンプリング方式を適用してダウンサンプリングを行う。ダウンサンプリング方式には、所定サイズの輝度ピクセルグループ、例えば、2×2輝度ピクセルグループから1つのピクセルを選択する方式、所定輝度ピクセルグループ内の輝度ピクセルに対して、フィルタリング方向(水平、垂直)、フィルタタップ数及びフィルタ係数を独立して定め、かつフィルタリングを行って、1つのフィルタリングされた輝度ピクセルを、ダウンサンプリングされたピクセルと選択する方式がある。このように、サンプリング部1410は、所定サイズの輝度ピクセルグループから選択された所定方向のラインに位置している複数の隣接している輝度ピクセルの平均値(2タップフィルタ)を用いたダウンサンプリング方式、所定サイズの輝度ピクセルグループから選択された所定方向に位置している複数の隣接している輝度ピクセルの加重平均値(nタップフィルタ)を用いたダウンサンプリング方式、所定サイズの輝度ピクセルグループから所定位置の輝度ピクセルを選択するダウンサンプリング方式のような多様な方式のダウンサンプリング方式を適用して、色差ピクセルと1:1にマッチングされるように輝度ピクセルをダウンサンプリングする。一例として、サンプリング部1410は、輝度予測単位内部のピクセルに対して、ダウンサンプリングのために所定輝度ピクセルグループから選択される輝度ピクセルの第1位置または輝度ピクセルの第1フィルタリング方式を選択し、輝度予測単位の上側周辺ピクセルに対して、ダウンサンプリングのために所定輝度ピクセルグループから選択される輝度ピクセルの第2位置または輝度ピクセルの第2フィルタリング方式を選択し、輝度予測単位の左側周辺ピクセルに対して、ダウンサンプリングのために所定輝度ピクセルグループから選択される輝度ピクセルの第3位置または輝度ピクセルの第3フィルタリング方式を選択する。ここで、輝度予測単位の内部のピクセルに対して、ダウンサンプリングのために用いられる第1位置及び第1フィルタリング方式、輝度予測単位の上側周辺ピクセルに対して、ダウンサンプリングのために用いられる第2位置及び第2フィルタリング方式、及び輝度予測単位の左側周辺ピクセルに対して、ダウンサンプリングのために用いられる第3位置及び第3フィルタリング方式は、互いに独立して定められたものであり、同一または互いに異なる。そして、サンプリング部1410は、輝度予測単位の内部ピクセル、上側周辺ピクセル及び左側周辺ピクセルに対して、独立して定められたフィルタリング方式を適用してダウンサンプリングを行う。
【0147】
以下、本発明の実施形態によって輝度ピクセルをダウンサンプリングする多様な方式について説明する。
【0148】
図16Aは、本発明の一実施形態によって輝度信号をダウンサンプリングする過程を説明するための参照図である。
図16Aを参照すれば、サンプリング部1410は、4個の輝度ピクセルP
LM(2x,2y)、P
LM(2x+1,2y)、P
LM(2x,2y−1)、P(2x+1,2y−1)を含む輝度ピクセルグループ1610を、1つの輝度ピクセルにダウンサンプリングできる。具体的に、サンプリング部1410は、輝度ピクセルグループ1610内の左下側に位置している輝度ピクセルP
LM(2x,2y)と、輝度ピクセルP
LM(2x,2y)の左右に隣接している輝度ピクセル輝度ピクセルP
LM(2x−1,2y)及び輝度ピクセルP
LM(2x+1,2y)の3個の輝度ピクセルを用いた加重平均値を計算して、(x,y)(x,yは、整数)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルを獲得する。一例として、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルp
r’(x,y)は、次の数式;p
r’(x,y)=(P
LM(2x−1,2y)+2*P
LM(2x,2y)+P
LM(2x+1,2y)+2)>>2によって獲得される。
【0149】
類似して、サンプリング部1410は、4個の輝度ピクセルP
LM(2x+2,2y)、P
LM(2x+3,2y)、P
LM(2x+2,2y−1)、P(2x+3,2y−1)を含む輝度ピクセルグループ1620を、1つの輝度ピクセルにダウンサンプリングできる。具体的に、サンプリング部1410は、輝度ピクセルグループ1620内の左下側に位置している輝度ピクセルP
LM(2x+2,2y)と、輝度ピクセルP
LM(2x+2,2y)の左右に隣接している輝度ピクセル輝度ピクセルP
LM(2x+1,2y)及び輝度ピクセルP
LM(2x+3,2y)の3個の輝度ピクセルを用いた加重平均値を計算して、(x,y)(x,yは、整数)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルを獲得する。一例として、(x+1,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルp
r’(x+1,y)は次の数式;p
r’(x+1,y)=(P
LM(2x+1,2y)+2*P
LM(2x+2,2y)+P
LM(2x+3,2y)+2)>>2によって獲得される。
【0150】
前記例では、サンプリング部1410が、中心輝度ピクセルに2の加重値、中心輝度ピクセルの左右に位置している輝度ピクセルに1の加重値を設定して加重平均値を計算し、ダウンサンプリングを行ったが、このような加重値は変更され、また加重平均値の計算に用いられる中心輝度ピクセルの周辺ピクセルの位置及び数は変更される。
【0151】
図16Bは、本発明の他の実施形態によって輝度信号をダウンサンプリングする過程を説明するための参照図である。
図16Bを参照すれば、サンプリング部1410は、4個の輝度ピクセルP
LM(2x,2y)、P
LM(2x+1,2y)、P
LM(2x,2y−1)、P(2x+1,2y−1)から選択された所定方向のラインに位置している輝度ピクセルの平均値を用いるか、または所定位置の輝度ピクセルを選択することで、(x,y)(x,yは、整数)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルp
r’(x,y)を獲得する。
【0152】
具体的に、サンプリング部1410は、4個の輝度ピクセルP
LM(2x,2y)、P
LM(2x+1,2y)、P
LM(2x,2y−1)、P(2x+1,2y−1)のうち所定位置の1つの輝度ピクセルを選択してダウンサンプリングされた輝度ピクセルp
r’(x,y)を獲得する。また、サンプリング部1410は、水平方向に隣接しているP
LM(2x,2y)及びP
LM(2x+1,2y)の平均値またはP
LM(2x,2y−1)及びP(2x+1,2y−1)の平均値を、ダウンサンプリングされた輝度ピクセルp
r’(x,y)と定める。また、サンプリング部1410は、垂直方向に隣接しているP
LM(2x,2y)及びP
LM(2x,2y−1)の平均値またはP
LM(2x+1,2y)及びP(2x+1,2y−1)の平均値を、ダウンサンプリングされた輝度ピクセルp
r’(x,y)と定める。
【0153】
サンプリング部1410は、このように多様なダウンサンプリング方式を輝度ピクセルの位置によって差別的に適用して、輝度ピクセルが色差ピクセルと1:1にマッチングされるようにダウンサンプリングを行う。
【0154】
図17Aないし
図17Cは、本発明の実施形態によって、輝度ピクセルの位置によってダウンサンプリングを行う過程を説明するための図面である。
【0155】
図17Aを参照すれば、輝度予測単位1710のサイズを2nS×2nS(nSは、正の整数)、色差予測単位1720のサイズをnS×nSとすれば、サンプリング部1410は、輝度予測単位1710及びその周辺ピクセルに対するダウンサンプリングを行ってダウンサンプリングされた輝度予測単位及びその周辺ピクセルを、色差予測単位1720及びその周辺ピクセルとマッチングさせる。
【0156】
具体的に、輝度予測単位1710の内部に位置している輝度ピクセルをRecL(x,y)(x,y=0、…、2nS−1)、前記輝度予測単位1710の上側に位置している輝度ピクセルをRecL(x,−1)(x=0、…、2nS−1)、前記輝度予測単位1710の左側に位置しているピクセルをRecL(−1,y)(y=0、…、2nS−1)、(x,y)位置の色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルをRecL’(x,y)とする時、サンプリング部1410は、輝度予測単位1710の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=(RecL(2x,−2)+RecL(2x,−1))>>1によって、色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得する。一例として、サンプリング部1410は、輝度予測単位1710の上側に位置している輝度ピクセルグループ171のうち(2x,−2)及び(2x,−1)に位置している輝度ピクセルの平均値を用いて、ダウンサンプリングを行う。
【0157】
また、サンプリング部1410は、輝度予測単位1710の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−2,2y)+RecL(−2,2y+1))>>1によって、色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得する。
【0158】
また、サンプリング部1410は、輝度予測単位1710の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得する。
【0159】
図17Bを参照すれば、他の実施形態によるサンプリング部1410は、輝度予測単位1730の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=RecL(2x,−1)によって、色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得する。一例として、サンプリング部1410は、輝度予測単位1730の上側に位置している輝度ピクセルグループ1731のうち(2x,−1)に位置している輝度ピクセルを選択することで、ダウンサンプリングを行う。
【0160】
また、サンプリング部1410は、輝度予測単位1730の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−1,2y)+RecL(−1,2y+1))>>1によって、色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得する。一例として、サンプリング部1410は、輝度予測単位1730の左側に位置している輝度ピクセルグループ1732に含まれたRecL(−1,2y)及びRecL(−1,2y+1)の平均値を用いて、ダウンサンプリングを行う。
【0161】
また、サンプリング部1410は、輝度予測単位1730の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得する。
【0162】
図17Cを参照すれば、また他の実施形態によるサンプリング部1410は、輝度予測単位1740の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=RecL(2x,−1)によって、色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得する。一例として、サンプリング部1410は、輝度予測単位1740の上側に位置している輝度ピクセルグループ1741に含まれた(2x,−1)に位置している輝度ピクセルを選択することで、ダウンサンプリングを行う。
【0163】
また、サンプリング部1410は、輝度予測単位1742の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−2,2y)+RecL(−2,2y+1))>>1によって、色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得する。一例として、サンプリング部1410は、輝度予測単位1740の左側に位置している輝度ピクセルグループ1742に含まれたRecL(−2,2y)及びRecL(−2,2y+1)の平均値を用いて、ダウンサンプリングを行う。
【0164】
また、サンプリング部1410は、輝度予測単位1740の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得する。
【0165】
さらに他の実施形態によるサンプリング部1410は、輝度予測単位の上側に隣接しているピクセルに対しては、次の数式;RecL’(x,−1)=(RecL(2x−1,−1)+2*RecL(2x,−1)+RecL(2x+1,−1)+2)>>2によって、前記色差予測単位の上側に隣接しているピクセルPc(x,−1)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,−1)を獲得する。前述した
図16Aのように、サンプリング部1410は、輝度予測単位の上側に隣接している輝度ピクセルに対して、中心輝度ピクセルに2の加重値、中心輝度ピクセルの左右に位置している輝度ピクセルに1の加重値を設定して加重平均値を計算することで、ダウンサンプリングを行う。
【0166】
また、サンプリング部1410は、輝度予測単位の左側に隣接しているピクセルに対しては、次の数式;RecL’(−1,y)=(RecL(−1,2y)+RecL(−1,2y+1))>>1によって、色差予測単位の左側に隣接しているピクセルPc(−1,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(−1,y)を獲得し、輝度予測単位の内部のピクセルに対しては、次の数式;RecL’(x,y)=(RecL(2x,2y)+RecL(2x,2y+1))>>1によって、色差予測単位の内部のピクセルPc(x,y)に対応する、ダウンサンプリングされた輝度ピクセルRecL’(x,y)を獲得する。
【0167】
このように、本発明の実施形態によるサンプリング部1410は、輝度ピクセルの位置によって多様なダウンサンプリング方式を適用して色差ピクセルに対応する、ダウンサンプリングされた輝度ピクセルを獲得する。
【0168】
前述したサンプリング部1410は、4:2:2または4:2:0カラーフォーマットの場合にのみダウンサンプリングを行い、4:4:4カラーフォーマットの場合に輝度ピクセルと色差ピクセルとが1:1にマッチングされるので、ダウンサンプリング過程をスキップできる。
【0169】
4:4:4色フォーマットの場合には、U及びV信号がY成分の信号に比べて相対的に非常に狭い帯域を持つため、ダウンサンプリングフィルタの代りに、予測効率を向上させるために低域通過フィルタが、復元された輝度信号にさらに行われる。
【0170】
以下、ダウンサンプリングを通じて色差信号と1:1にマッチングされた輝度信号を用いて色差信号を予測する過程を説明する。以下で輝度信号は、色差信号と1:1にマッチングされるようにダウンサンプリングされた輝度信号であると仮定する。
【0171】
図18A及び
図18Bは、本発明の一実施形態による輝度信号と色差信号との相関関係を示すパラメータ獲得過程及び色差信号の予測過程を説明するための参照図である。
【0172】
対応する輝度ピクセルと色差ピクセルとの間には、所定の相関関係、例えば、線形的な相関関係を持つ。
図18A及び
図18Bを参照すれば、以前に復元された輝度予測単位1820の(x,y)位置でのピクセルをRec_L’(x,y)とすれば、予測実行部1430は、次の数式(1)のような輝度信号と色差信号との線形関係を用いて、色差予測単位1810の(x,y)位置での予測値Pred_c(x,y)を獲得する。
【0173】
【数1】
数式(1)でaは、加重値(weight)を示すパラメータ、bは、オフセット(offset)を示すパラメータである。a及びbの値は、次の数式(2)及び(5)のように、色差予測単位1810の周辺ピクセルRec_c(i)(i=0、…、2nS−1)1811、1812、及び輝度予測単位1821の周辺ピクセルRec_L’(i)1821、1822を用いた演算過程を通じて獲得される。
【0174】
【数2】
数式(2)及び(3)で、Iは、色差予測単位1810または輝度予測単位1820の上側及び左側に隣接している周辺ピクセルの数であり、
図18A及び
図18Bに示されたように、色差予測単位1810及び輝度予測単位1820のサイズがnS×nSの場合、Iは2nSである。
図18A及び
図18Bでは、周辺ピクセルとして、上側及び左側に位置しているピクセルを用いる場合を示したが、もし右側または下側に位置している周辺ピクセルが現在予測単位以前に処理されて復元された場合ならば、右側または下側に位置している周辺ピクセルも、a及びbの値の獲得に用いられる。また、乗算や除算演算をシフト演算に取り替えるために、周辺ピクセルの数Iは、2の指数乗(power of 2)であることが望ましい。一般的に、予測単位のサイズを定義するnSの値は2の指数乗であるので、Iも、2の指数乗の値を持つ。
【0175】
一方、数式(2)を用いて、aの値を高いデータ正確度で計算するためには、浮動小数点演算(float point operation)が用いられる。しかし、aの値が浮動小数点の値を持つとすれば、数式(2)の演算は浮動小数点の除算を含むようになって、演算の複雑度が増加する。よって、本発明の実施形態によるパラメータ獲得部1420は、オーバフローを防止する一方、演算を簡略化するために、数式(2)及び(3)を変更した整数演算アルゴリズムによってスケーリングされたパラメータa’及びb’を計算する。
【0176】
具体的に、数式(2)によるaの値の代りに浮動小数点演算を回避するために、次の数式(4)のように、aの値をn
aビットほどアップスケイルリング及び四捨五入した整数値a’を定義する。
【0177】
【数3】
数式(4)によって、浮動小数点数字(number)であるaの値は、レフト演算(<<)を通じてアップスケイルリング及び四捨五入(rounding)されて、整数値a’に変更される。n
aビットは、データ正確度及び計算の複雑度を考慮して設定される。一例として、n
a値は13である。また、数式(3)による浮動小数点bの値も、数式(4)のa’の値を用いて変更され、四捨五入された整数値b’に表現される。このような整数値a’及びb’を用いる場合、数式(1)は、次の数式(5)のように変更される。
【0178】
【数4】
一方、数式(4)に基づいてa’を計算するためには、A1/A2の計算が必要である。A1及びA2の代りに、A1及びA2の所定数の上位ビットを除いた残りのビットを0に変更することで生成された推定値(approximate value)A1’及びA2’が用いられる。具体的に、A1の上位n
A1個のビットを除いた残りのビットを0に変更して生成された推定値A1’、及びA2の上位n
A2個のビットを除いた残りのビットを0に変更して生成された推定値A2’は、それぞれ次の数式(6)及び(7)の通りである。
【0179】
【数5】
数式(6)で[.]演算は、フロア(floor)演算、すなわち、[]内の値より小さな最大定所値を選択する演算を示し、r
A1=max(bdepth(A1)−n
A1、0).r
A2=max(bdepth(A2)−n
A2,0)である。bdepth(A1)及びbdepth(A2)は、それぞれA1及びA2のビット深度を示す。またn
A1は、オーバフローを防止し、乗算時に発生するビット数を考慮して設定され、一例として、n
A1は、15である。また、n
A2は、後述されるルックアップテーブルのサイズに関し、一例として、64個の変数に基づいたルックアップテーブルの場合、n
A2は、6である。
【0180】
図19は、本発明の一実施形態によって推定値A2’を獲得する過程を例示したものである。
【0181】
図示されたように、A2のビット深度(bit depth)を27、全体ビット深度を32と仮定する。n
A2=6とすれば、r
A2=max(27−6,0)=21であり、[A2>>21]の演算を通じてA2の上位6個のビットである‘101011’ 1910が抽出される。[A2>>21]の値に再び2
rA2、すなわち、2
21を掛ければ、上位6個のビットを除いた残りの21個のビットは0の値を持つようになって、推定値A2’が獲得される。
【0182】
前述した数式(6)及び(7)を数式(4)に適用すれば、次の数式(8)の通りである。
【0183】
【数6】
数式(8)で、n
tableは、データ正確度及び演算複雑度を考慮して定められ、一例として、n
tableは、15の値に設定される。
【0185】
【数7】
値は、除算演算を含む。除算演算を防止するために、除算演算の代りに
【0186】
【数8】
の結果値を所定のルックアップテーブル形態に保存し、ルックアップテーブルを参照することで数式(8)によってa’値を獲得する。このようにルックアップテーブルを用いる場合、数式(8)に基づいたa’の計算時に除算演算を行わず、乗算及びシフト演算のみでa’の値を獲得する。
【0187】
図20は、本発明の一実施形態によるルックアップテーブルの一例を示す参照図である。
【0189】
【数9】
が持つことができる場合の数は、A2の上位6個ビットが持つことができる場合の数と同一である。すなわち、2^(n
A2)=2^6で総64個のエレメントを持つルックアップテーブルを用いて
【0190】
【数10】
が定められる。よって、パラメータ獲得部1420は、
図20に示されたようなA2の上位6個のビットが持つことができる64個の変数に対応する
【0191】
【数11】
値を保存したルックアップテーブルを用いて、
【0193】
【数13】
が獲得されれば、数式(8)に基づいてパラメータ獲得部1420は、乗算及びシフト演算のみを用いてa’の値を計算できる。
【0194】
また、パラメータ獲得部1420は、獲得されたa’を用いて次の数式(9)のようにb’の値を計算できる。
【0195】
【数14】
数式(9)に基づいたb’の計算は、Iが2の指数乗(power of 2)である場合に除算演算なしに行われる。もし、周辺ピクセルとして、
図18A及び
図18Bに示された周辺ピクセル以外に左上側や右上側の周辺ピクセルを用いて、Iの値が2の指数乗ではない場合には、(1/I)の値をルックアップテーブル形態に保存し、数式(9)の分子にルックアップテーブルによる(1/I)の値を掛けることで、b’の値が獲得される。
【0196】
数式(8)に基づいたa’の値は、数式(5)による除算演算を所定ビット内で行わせるためにクリッピングされる。例えば、数式(5)による除算演算を16ビットで行う場合、a’の値は[−2
−15、2
15−1]の範囲内でクリッピングされる。n
aが13の場合、実際aの値は[−4、4]の範囲内に制限され、エラーの増幅が防止される。
【0197】
一方、パラメータ獲得部1420は、数式(8)に基づいてa’を計算する時に四捨五入エラー(rounding error)を低減させるために、n
aの値は整数の代りに、A1及びA2の値によって適応的に定められる。一例として、n
aの値は、次の数式(10)のように定められる。
【0198】
【数15】
数式(10)を数式(8)に代入すれば、次の数式(11)を得られる。
【0199】
【数16】
a’の値を所定ビットに維持するためには、a’のビット深度を調整せねばならない場合がある。例えば、a’のビット深度を(a_bits)ビットに維持するために、a’のビット深度を調整するための変数bitAdjustを、次の数式;bitAdjust=max(0,bdepth(abs(a’))−(a_bits−1))の通りであるとすれば、パラメータ獲得部1420は、a’=a’>>bitAdjustを通じてa’のビット深度を低減させる。a’の値が8ビットより小さく表現されるように維持するために、a_bitsの典型的な値は7または8である。数式(11)のn
a値の代りに、次の数式(12)のようなn
a値を数式(5)に適用して、a’の値を所定ビット内に維持しつつa’の四捨五入誤差を低減させる。
【0200】
【数17】
このように、本発明の一実施形態によるパラメータ獲得部1420は、数式(8)または(9)によって、輝度信号と色差信号との相関関係を定義するためのパラメータa’及びb’の値を獲得する。a’及びb’の値が獲得されれば、予測実行部1430は、数式(5)に基づいて復元された輝度ピクセルから対応する色差ピクセルの予測値を生成する。
【0201】
一方、前述した数式(2)は、次の数式(13)のように表現され得る。
【0202】
【数18】
数式(13)で、CL、C、L、LLは、それぞれ次の数式(14)の通りである。
【0203】
【数19】
数式(13)によるaの計算時にオーバフローを防止するために、パラメータ獲得部1420は、CL、C、L、LLの値のビット数を低減させるデスケーリングを行う。
【0204】
一例として、Rec_L’(i)及びRec_c(i)のようなサンプルのビット数をn
sと定義すれば、A1及びA2の最大ビットbits
maxは、次の数式(15)の通りである。
【0205】
【数20】
最大ビットbits
maxを所定のA(Aは、整数)ビットに維持するためには、Aビットを超過するビット数ほどビット深度を低減させねばならない。例えば、A=32とすれば、ビット調節パラメータ(bitAdjust
A)は、次の数式(16)のように定義される。
【0206】
【数21】
数式(16)を適用して、パラメータ獲得部1420は、A1及びA2の値を次の数式(17)のようにスケーリングする。
【0207】
【数22】
もし、Iが2の指数乗(power of 2)の値を持つら、次の数式(18)のようなビット調節パラメータbitAdjust2
Aが新たに定義される。
【0208】
【数23】
数式(18)のビット調節パラメータbitAdjust2
Aを用いて、パラメータ獲得部1420は、A1及びA2を計算する以前にCL、C、LL、L、Iを次の数式(19)のようにデスケーリングできる。
【0209】
【数24】
このように、本発明の他の実施形態によるパラメータ獲得部1420は、A1及びA2が持つことができる値の範囲を考慮して、オーバフローが発生しないように、A1及びA2の計算に用いられるCL、C、LL、L、Iの値を数式(19)のようにデスケーリングして、ビット深度を低減させる。
【0210】
一方、本発明のさらに他の実施形態によるパラメータ獲得部1420は、色差予測単位1810及び輝度予測単位1820のサイズを定義するnS値及びRec_C(i)のビット深度BitDepth
Cに基づいて、次の数式(20)に定義されるパラメータk3を獲得する。
【0211】
【数25】
パラメータ獲得部1420は、A1及びA2の計算時にオーバフローを防止するために、CL、C、LL、Lの値をそれぞれ次の数式(21)のようにデスケーリングする。
【0212】
【数26】
また、パラメータ獲得部1420は、k3及びnS値に基づいて次の数式(22)で定義されるパラメータk2を獲得する。
【0213】
【数27】
また、パラメータ獲得部1420は、前述した数式(21)によってデスケーリングされたCL、C、LL、Lの値及び数式(21)によるk2の値を用いて、次の数式(23)のようにA1及びA2を獲得する。
【0214】
【数28】
パラメータ獲得部1420は、A1及びA2が所定範囲のビット内で表現されるように、次の数式(24)のように獲得されたA1及びA2の値をダウンスケーリングしたA1’及びA2’の値を生成できる。
【0215】
【数29】
このようにA1’及びA2’の値が獲得されれば、パラメータ獲得部1420は、次のアルゴリズムによって輝度信号と色差信号の線形相関関係を示す加重値a及びオフセットbの値を獲得する。
【0216】
{
k1=Max(0、log
2(abs(A2))−5)−Max(0、log
2(abs(A1))−14)+2;
a=A2’<1?0:Clip3(−2
15、2
15−1、A1’*lmDiv+ (1<<(k1−1))>>k1;
a=a>>Max(0、log
2(abs(a))−6);
k=13−Max(0、log
2(abs(a))−6);
b=(L−((a*C)>>k1)+(1<<(k2−1)))>>k2;
}
前記アルゴリズムで、すべての整数は、加重値aの値を7ビットデータで表現するように定められる。lmDivは、数式(23)のA2’によって定められる所定の値を示す。
【0217】
前述したアルゴリズムに基づいてa、bの値が定められれば、本発明のさらに他の実施形態による予測実行部1430は、次の数式(25)によって復元された輝度信号Rec_L’(x,y)に対応する色差信号の予測値Pred_C(x,y)を獲得する。
【0218】
【数30】
kは、13であることが望ましい。予測実行部1430は、色差信号のビット深度を考慮して色差信号が持つことができる値の範囲内にPred_C(x,y)が存在するように、数式(25)による色差信号の予測値Pred_C(x,y)を、次の数式(26)のようにクリッピングできる。
【0219】
【数31】
図21は、本発明の一実施形態による色差成分映像の予測方法を示すフローチャートである。
図21を参照すれば、段階2110で、サンプリング部1410は、カラーフォーマットによって対応する輝度予測単位及び色差予測単位のサイズを考慮して、以前に符号化された後で復元された輝度予測単位及び前記輝度予測単位の周辺ピクセルをダウンサンプリングする。前述したように、サンプリング部1410は、輝度予測単位の内部に位置しているピクセル、輝度予測単位の上側に隣接している周辺ピクセル、前記輝度予測単位の左側に隣接している周辺ピクセルそれぞれについて、所定サイズの輝度ピクセルグループから選択された、所定方向のラインに位置している複数の隣接している輝度ピクセルの平均値を用いたダウンサンプリング方式、所定サイズの輝度ピクセルグループから選択された、所定方向に位置している複数の隣接している輝度ピクセルの加重平均値を用いたダウンサンプリング方式、所定サイズの輝度ピクセルグループから所定位置の輝度ピクセルを選択するダウンサンプリング方式のような多様な方式のダウンサンプリング方式を適用して、色差ピクセルと1:1にマッチングされるように輝度ピクセルをダウンサンプリングする。
【0220】
段階2120で、パラメータ獲得部1420は、ダウンサンプリングされた輝度予測単位の周辺ピクセル及び予測される色差予測単位の復元された周辺ピクセルに基づいて、輝度予測単位と色差予測単位との相関関係を示すパラメータを獲得する。前述したように、パラメータ獲得部1420は、色差予測単位の復元された周辺ピクセル及び輝度予測単位の復元された周辺ピクセルを用いて、数式(2)及び(3)のように加重値a及びオフセットbを計算する。特に、パラメータ獲得部1420は、データ正確度及び演算過程で発生するオーバフローを防止するために、a及びbのビット深度を変更する。また、パラメータ獲得部1420は、a及びbの計算過程に用いられる変数をスケーリングするか、または近似値に取り替えることで、除算演算を除いた乗算、引き算及びシフト演算のみを用いてa及びbの値を獲得する。
【0221】
段階2130で、予測実行部1430は、獲得されたパラメータを用いてダウンサンプリングされた輝度予測単位から、対応する色差予測単位の予測値を獲得する。前述したように、予測実行部1430は、数式(1)に基づいて復元された輝度信号から、対応する色差信号を予測する。また、予測実行部1430は、数式(7)のように浮動小数点を用いた演算の代りに整数演算を行うために、a及びbの値をアップスケイルリングして予測を行ってもよい。
【0222】
本発明はまた、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるすべての記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。またコンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読み取り可能なコードに保存されて実行される。
【0223】
これまで本発明についてその望ましい実施形態を中心として説明した。当業者ならば、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されるということを理解できるであろう。本発明の範囲は、前述した説明ではなく特許請求の範囲に示されており、それと同等な範囲内にあるすべての差は、本発明に含まれていると解釈されねばならない。