【文献】
Ken McCann et al.,Samsung's Response to the Call for Proposals on Video Compression Technology,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,1st Meeting: Dresden, DE,2010年 4月,JCTVC-A124,pp.1-11
【文献】
Xiaoyin Che et al.,Enhanced Context Modeling for Skip and Split Flag,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D254,pp.1-4
【文献】
Vivienne Sze and Madhukar Budagavi,CE11: Reduced neighboring dependency in context selection of significant_coeff_flag for parallel processing (E330),Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 6月,JCTVC-F128,pp.1-5
【文献】
Christopher Rosewarne and Mitsuru Maeda,Predicted neighbour for context selection of significant_coeff_flag for parallel processing,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,,2011年 6月,JCTVC-F186_r1,pp.1-6
【文献】
Jianle Chen and Tammy Lee,Simplified context model selection for block level syntax coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 7月,JCTVC-F497,pp.1-8
【文献】
Wei-Jung Chien et al.,Memory and Parsing Friendly CABAC Context,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,6th Meeting: Torino, IT,2011年 7月,JCTVC-F606_r2,pp.1-17
(58)【調査した分野】(Int.Cl.,DB名)
符号化単位の最大サイズについての情報をビットストリームから獲得し、前記最大サイズについての情報に基づいて映像を複数の最大符号化単位で分割し、分割情報に基づいて前記複数の最大符号化単位のうち一つの最大符号化単位を符号化単位で分割し、前記符号化単位のうち現在符号化単位に属する変換単位が分割されるか否かについての分割変換フラグを前記ビットストリームから獲得し、前記分割変換フラグに基づいて少なくとも一つの変換単位のサイズを決定し、前記変換単位のサイズ及び前記変換単位が属したピクチャのカラー類型に基づいて、コンテキストモデルを決定し、前記決定されたコンテキストモデルを利用して前記ビットストリームをエントロピー復号化することによって、前記変換単位のブロック内に0でない変換係数が存するかを表す変換係数フラグを抽出するエントロピー復号化部と、
前記変換係数フラグに基づいて、前記変換単位内の変換係数を獲得する階層的復号化部とを備え、
前記カラー類型は、輝度成分Y、第1色差成分Cb及び第2色差成分Crのうち一つを指すカラーインデックス情報によって識別され、
前記カラーインデックス情報は、前記輝度成分Yに対して0、前記第1色差成分Cbに対して1、前記第2色差成分Crに対して2の値を有することを特徴とするビデオ復号化装置。
【発明を実施するための形態】
【0007】
本発明の一実施形態によるビデオ符号化方法は、階層的構造のデータ単位に基づいて、前記ビデオを符号化するステップと、エントロピー符号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、前記現在のデータ単位の第1構文要素のエントロピー符号化に利用されるコンテキストモデルを決定するステップと、前記決定されたコンテキストモデルを利用して、前記現在のデータ単位の第1構文要素をエントロピー符号化するステップと、を含むことを特徴とする。
【0008】
本発明の一実施形態によるビデオ符号化装置は、階層的構造のデータ単位に基づいて、前記ビデオを符号化する階層的符号化部と、エントロピー符号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、前記現在のデータ単位の第1構文要素のエントロピー符号化に利用されるコンテキストモデルを決定し、前記決定されたコンテキストモデルを利用して、前記現在のデータ単位の第1構文要素をエントロピー符号化するエントロピー符号化部と、を備えることを特徴とする。
【0009】
本発明の一実施形態によるビデオ復号化方法は、符号化されたビットストリームをパージングして、階層的構造のデータ単位に基づいて符号化されたピクチャについての構文要素を抽出するステップと、エントロピー復号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、前記現在のデータ単位の第1構文要素のエントロピー復号化に利用されるコンテキストモデルを決定するステップと、前記決定されたコンテキストモデルを利用して、前記現在のデータ単位の第1構文要素をエントロピー復号化するステップと、を含むことを特徴とする。
【0010】
本発明の一実施形態によるビデオ復号化装置は、符号化されたビットストリームをパージングして、階層的構造のデータ単位に基づいて符号化されたピクチャについての構文要素を抽出する構文要素抽出部と、エントロピー復号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、前記現在のデータ単位の第1構文要素のエントロピー復号化に利用されるコンテキストモデルを決定し、前記決定されたコンテキストモデルを利用して、前記現在のデータ単位の第1構文要素をエントロピー復号化するエントロピー復号化部と、を備えることを特徴とする。
【0011】
以下、本明細書に記載の本発明の多様な実施形態において、‘映像’は、静止画像だけでなく、ビデオのような動画を含んで包括的に指す。
【0012】
映像に係るデータに対して、各種の動作が行われる時、映像に係るデータは、データグループに分割され、同一なデータグループに含まれるデータに対して、同一な動作が行われる。以下、本明細書において、所定の基準によって形成されるデータグループを‘データ単位’とする。また、‘データ単位’ごとに行われる動作は、データ単位に含まれたデータを利用して、当該動作が行われることを意味する。
【0013】
以下、
図1ないし
図13を参照して、本発明の一実施形態によって、階層的なツリー構造による符号化単位に基づいたツリー構造の構文要素を符号化及び復号化するビデオの符号化及び復号化方法及び装置が開示される。また、
図14ないし
図24を参照して、
図1ないし
図13で述べられたビデオの符号化及び復号化方式において利用されるエントロピー符号化及び復号化の過程が具体的に開示される。
【0014】
図1は、本発明の一実施形態によるビデオ符号化装置を示すブロック図である。一実施形態によるビデオ符号化装置100は、階層的符号化部110と、エントロピー符号化部120とを備える。
【0015】
階層的符号化部110は、符号化される現在のピクチャを、所定のサイズのデータ単位に分割して、データ単位別に符号化を行う。具体的に、階層的符号化部110は、最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャを分割する。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であって、横及び縦のサイズが8よりも大きい2の自乗である正方形のデータ単位である。
【0016】
一実施形態による符号化単位は、最大サイズ及び深度によって特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位であると定義される。最大符号化単位は、深度が深くなるにつれて、深度別の符号化単位のサイズは減少するので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。
【0017】
前述したように、符号化単位の最大サイズによって、現在のピクチャの映像データを、最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域の映像データが、深度によって階層的に分類される。
【0018】
最大符号化単位の高さ及び幅を階層的に分割可能な総回数を制限する最大深度及び符号化単位の最大サイズは、予め設定されていてもよい。
【0019】
階層的符号化部110は、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、少なくとも一つの分割領域別に、最終の符号化結果が出力される深度を決定する。すなわち、階層的符号化部110は、現在のピクチャの最大符号化単位ごとに、深度別の符号化単位で映像データを符号化して、最小の符号化誤差が発生する深度を選択して、符号化深度として決定する。決定された符号化深度及び最大符号化単位別の映像データは、エントロピー符号化部120に出力される。
【0020】
最大符号化単位内の映像データは、最大深度以下の少なくとも一つの深度によって、深度別の符号化単位に基づいて符号化され、それぞれの深度別の符号化単位に基づいた符号化結果が比較される。深度別の符号化単位の符号化誤差の比較結果、符号化誤差の最も小さい深度が選択される。それぞれの最大符号化単位ごとに、少なくとも一つの符号化深度が決定される。
【0021】
最大符号化単位のサイズは、深度が深くなるにつれて、符号化単位が階層的に分割され、符号化単位の個数は増加する。また、一つの最大符号化単位に含まれる同一な深度の符号化単位であるとしても、それぞれのデータについての符号化誤差を測定し、下位深度への分割如何が決定される。したがって、一つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別の符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。したがって、一つの最大符号化単位に対して、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
【0022】
したがって、一実施形態による階層的符号化部110は、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による‘ツリー構造による符号化単位’は、現在の最大符号化単位に含まれる全ての深度別の符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では深度によって階層的に決定され、他の領域では独立して決定される。同様に、現在の領域についての符号化深度は、他の領域についての符号化深度と独立して決定される。
【0023】
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を表す。例えば、最大符号化単位の深度が0であるとする時、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であれば、深度0、1、2、3及び4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
【0024】
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別の符号化単位に基づいて行われる。
【0025】
最大符号化単位が深度別に分割される度に、深度別の符号化単位の個数が増加するので、深度が深くなるにつれて、生成される全ての深度別の符号化単位に対して、予測符号化及び周波数変換を含む符号化が行われなければならない。以下、説明の便宜上、少なくとも一つの最大符号化単位のうち、現在の深度の符号化単位に基づいて、予測符号化及び周波数変換を説明する。
【0026】
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択可能である。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などのステップを経るが、全てのステップにわたって、同一なデータ単位が使われてもよく、ステップ別にデータ単位が変更されてもよい。
【0027】
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。
【0028】
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位に基づいて、予測符号化が行われる。以下、予測符号化の基本となるそれ以上分割されない符号化単位を、‘予測単位’とする。予測単位が分割されたパーティションは、予測単位と、予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位とを含む。
【0029】
例えば、サイズ2N×2N(ただし、Nは、正の整数)の符号化単位がそれ以上分割されない場合、サイズ2N×2Nの予測単位となり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションだけでなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意の形態のパーティションなどを選択的に含んでもよい。
【0030】
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションに対してのみ行われる。符号化単位以内の一つの予測単位ごとに、独立して符号化が行われて、符号化誤差の最も小さい予測モードが選択される。
【0031】
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位に基づいて、符号化単位の映像データの周波数変換を行う。
【0032】
符号化単位の周波数変換のためには、符号化単位よりも小さいか、またはそれと同じサイズのデータ単位に基づいて、周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位と、インターモードのためのデータ単位とを含む。
【0033】
以下、周波数変換の基本となるデータ単位を、‘変換単位’とする。符号化単位と類似した方式によって、符号化単位内の変換単位も、再帰的にさらに小さいサイズの変換単位に分割されつつ、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって分割される。
【0034】
一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割され、変換単位に達するまでの分割回数を表す変換深度が設定される。例えば、サイズ2N×2Nの現在の符号化単位の変換単位のサイズが2N×2Nであれば、変換深度は0、変換単位のサイズがN×Nであれば、変換深度は1、変換単位のサイズがN/2×N/2であれば、変換深度は2に設定される。すなわち、変換単位に対しても、変換深度によって、ツリー構造による変換単位が設定される。
【0035】
符号化深度別の符号化情報は、符号化深度だけでなく、予測関連情報及び周波数変換関連情報が必要である。したがって、階層的符号化部110は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別の予測モード、周波数変換のための変換単位のサイズなどを決定する。
【0036】
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、
図3ないし
図12を参照して詳細に後述する。
【0037】
階層的符号化部110は、深度別の符号化単位の符号化誤差を、ラグランジュ乗数に基づいた率−歪曲最適化技法を利用して測定する。
【0038】
エントロピー符号化部120は、階層的符号化部110で決定された少なくとも一つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別の符号化モードに係る情報を、ビットストリームの形態で出力する。符号化された映像データは、映像のレジデュアルデータの符号化結果である。深度別の符号化モードに係る情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。特に、後述するように、一実施形態によるエントロピー符号化部120は、最大符号化単位の映像データ、及び深度別の符号化モードに係る構文要素を符号化する時、前述した階層的構造のデータ単位の階層構造情報、及び階層構造以外のビデオ符号化方式に利用されたカラー成分などの現在のデータ単位が有する付加情報に基づいて、コンテキストモデルを選択して、エントロピー符号化を行う。また、エントロピー符号化部120は、現在の符号化単位の付加情報以外に、周辺符号化単位が有する付加情報を共に考慮して、現在の符号化単位の構文要素のエントロピー符号化のためのコンテキストモデルを決定する。エントロピー符号化部120で構文要素のエントロピー符号化のためのコンテキストモデルを決定する過程については後述する。
【0039】
符号化深度情報は、現在の深度で符号化せず、下位深度の符号化単位で符号化するか否かを表す深度別の分割情報を利用して定義される。現在の符号化単位の現在の深度が符号化深度であれば、現在の符号化単位は、現在の深度の符号化単位で符号化されるので、現在の深度の分割情報は、それ以上下位深度に分割されないように定義される。逆に、現在の符号化単位の現在の深度が符号化深度でなければ、下位深度の符号化単位を利用した符号化を試みなければならないので、現在の深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
【0040】
現在の深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位に対して、符号化が行われる。現在の深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われて、同一な深度の符号化単位ごとに、再帰的に符号化が行われる。
【0041】
一つの最大符号化単位内に、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも一つの符号化モードに係る情報が決定されなければならないので、一つの最大符号化単位に対しては、少なくとも一つの符号化モードに係る情報が決定される。また、最大符号化単位のデータは、深度によって階層的に分割されて、位置別に符号化深度が異なるので、データに対して、符号化深度及び符号化モードに係る情報が設定される。
【0042】
したがって、一実施形態によるエントロピー符号化部120は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係る符号化情報を割り当てる。
【0043】
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれる全ての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形のデータ単位である。
【0044】
例えば、エントロピー符号化部120を通じて出力される符号化情報は、深度別の符号化単位別の符号化情報と、予測単位別の符号化情報とに分けられる。深度別の符号化単位別の符号化情報は、予測モード情報及びパーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に係る情報、インターモードの参照映像インデックスに係る情報、動きベクトルに係る情報、イントラモードのクロマ成分に係る情報、イントラモードの補間方式に係る情報などを含む。また、ピクチャ、スライスまたはGOP別に定義される符号化単位の最大サイズに係る情報、及び最大深度に係る情報は、ビットストリームのヘッダに挿入される。
【0045】
ビデオ符号化装置100の最も簡単な実施形態によれば、深度別の符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在の深度の符号化単位のサイズが2N×2Nであれば、下位深度の符号化単位のサイズは、N×Nである。また、2N×2Nサイズの現在の符号化単位は、N×Nサイズの下位深度の符号化単位を最大四つ含む。
【0046】
したがって、一実施形態によるビデオ符号化装置100は、現在のピクチャの特性を考慮して決定された最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を決定して、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに、多様な予測モード、周波数変換方式などにより符号化するので、多様な映像サイズの符号化単位の映像特性を考慮して、最適の符号化モードが決定される。
【0047】
したがって、映像の解像度が高すぎるか、またはデータ量が多すぎる映像を既存のマクロブロック単位で符号化すれば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。したがって、一実施形態によるビデオ符号化装置100は、映像のサイズを考慮して、符号化単位の最大サイズを増大させつつ、映像特性を考慮して、符号化単位を調節できるので、映像圧縮効率が向上する。
【0048】
図2は、本発明の一実施形態によるビデオ復号化装置を示すブロック図である。一実施形態によるビデオ復号化装置200は、構文要素抽出部210、エントロピー復号化部220、及び階層的復号化部230を備える。一実施形態によるビデオ復号化装置200の各種のプロセッシングのための符号化単位、深度、予測単位、変換単位、各種の符号化モードに係る情報などの各種の用語の定義は、
図1及びビデオ符号化装置100を参照して説明した通りである。
【0049】
構文要素抽出部210は、符号化されたビデオについてのビットストリームを受信して、パージングする。エントロピー復号化部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに、符号化された映像データを抽出して、階層的復号化部230に出力する。
【0050】
エントロピー復号化部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位についての符号化深度、符号化モード、カラー成分情報、予測モード情報などの付加情報を抽出する。抽出された符号化深度及び符号化モードなどに係る情報は、階層的復号化部230に出力される。ビット列の映像データは、最大符号化単位に分割されて符号化されたので、階層的復号化部230は、最大符号化単位ごとに映像データを復号化する。
【0051】
最大符号化単位別の符号化深度及び符号化モードに係る情報は、一つ以上の符号化深度情報について設定され、符号化深度別の符号化モードに係る情報は、当該符号化単位のパーティションタイプ情報、予測モード情報、及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別の分割情報が抽出されることも可能である。
【0052】
エントロピー復号化部220が抽出した最大符号化単位別の符号化深度及び符号化モードに係る情報は、一実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別の深度別の符号化単位ごとに、反復的に符号化を行って、最小符号化誤差を発生させることによって決定された符号化深度及び符号化モードに係る情報である。したがって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号化して、映像を復元する。
【0053】
一実施形態による符号化深度及び符号化モードに係る符号化情報は、当該符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して割り当てられているので、エントロピー復号化部220は、所定のデータ単位別に、符号化深度及び符号化モードに係る情報を抽出する。所定のデータ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係る情報が記録されていれば、同一な符号化深度及び符号化モードに係る情報を有している所定のデータ単位は、同一な最大符号化単位に含まれるデータ単位として類推される。
【0054】
特に後述するように、一実施形態によるエントロピー復号化部220は、構文要素を復号化する時、前述した階層的構造のデータ単位の階層構造情報、及び階層構造以外にカラー成分などの多様な情報に基づいて、コンテキストモデルを選択して、エントロピー復号化を行う。
【0055】
階層的復号化部230は、最大符号化単位別の符号化深度及び符号化モードに係る情報に基づいて、それぞれの最大符号化単位の映像データを復号化して、現在のピクチャを復元する。すなわち、階層的復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうち、それぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード及び変換単位に基づいて、符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程と、周波数逆変換過程とを含む。
【0056】
階層的復号化部230は、符号化深度別の符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行う。
【0057】
また、階層的復号化部230は、最大符号化単位別の周波数逆変換のために、符号化深度別の符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとに、それぞれの変換単位によって、周波数逆変換を行う。
【0058】
階層的復号化部230は、深度別の分割情報を利用して、現在の最大符号化単位の符号化深度を決定する。若し、分割情報が現在の深度でそれ以上分割されないことを表していれば、現在の深度が符号化深度である。したがって、階層的復号化部230は、現在の最大符号化単位の映像データに対して、現在の深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号化する。
【0059】
すなわち、符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して設定されている符号化情報を観察して、同一な分割情報を含む符号化情報を保有しているデータ単位が集まって、階層的復号化部230によって、同一な符号化モードに復号化する一つのデータ単位であると見なされる。
【0060】
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に係る情報を獲得して、現在のピクチャについての復号化に利用する。すなわち、最大符号化単位ごとに、最適符号化単位に決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
【0061】
したがって、高い解像度の映像、またはデータ量が多すぎる映像であるとしても、符号化端から伝送された最適符号化モードに係る情報を利用して、映像の特性に適応的に決定された符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。
【0062】
以下、
図3ないし
図13を参照して、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式を詳細に説明する。
【0063】
図3は、階層的な符号化単位の概念を示す。
【0064】
符号化単位の例は、符号化単位のサイズが幅×高さで表現され、サイズ64×64の符号化単位から32×32,16×16,8×8を含む。サイズ64×64の符号化単位は、サイズ64×64,64×32,32×64,32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32,32×16,16×32,16×16のパーティションに分割され、サイズ16×16の符号化単位は、サイズ16×16,16×8,8×16,8×8のパーティションに分割され、サイズ8×8の符号化単位は、サイズ8×8,8×4,4×8,4×4のパーティションに分割される。
【0065】
ビデオデータ310については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330については、解像度が352×288、符号化単位の最大サイズが16、最大深度が1に設定されている。
図3に示した最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。
【0066】
解像度が高いか、またはデータ量が多い場合、符号化効率の向上及び映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、ビデオデータ330よりも解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
【0067】
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が二階層深くなって、長軸サイズが32、16である符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が一階層深くなって、長軸サイズが8である符号化単位まで含む。
【0068】
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が三階層深くなって、長軸サイズが32、16、8である符号化単位まで含む。深度が深くなるほど、詳細情報の表現能が向上する。
【0069】
図4は、本発明の一実施形態による階層的構造の符号化単位に基づいたビデオ符号化装置の具体的なブロック図である。
【0070】
イントラ予測部410は、現在のフレーム405のうち、イントラモードの符号化単位に対して、イントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在のフレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
【0071】
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460及び周波数逆変換部470を通じて、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
【0072】
一実施形態によるエントロピー復号化部450は、最大符号化単位の映像データ及び深度別の符号化モードに係る構文要素を符号化する時、階層的構造のデータ単位の階層構造情報、及び階層構造以外にカラー成分などの多様な情報に基づいて、コンテキストモデルを選択して、エントロピー復号化を行う。
【0073】
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに、最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を行わなければならない。
【0074】
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在の最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位のサイズを決定する。また、本発明の一実施形態によるエントロピー符号化部450は、当該構文要素の類型によって、階層的構造のデータ単位の階層構造情報、及び階層構造以外にカラー成分などの多様な情報に基づいて、構文要素をエントロピー符号化するのに利用されるコンテキストモデルを選択して、エントロピー符号化を行う。
【0075】
図5は、本発明の一実施形態による階層的構造の符号化単位に基づいたビデオ復号化装置の具体的なブロック図である。ビットストリーム505から、パージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係る情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
【0076】
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
【0077】
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
【0078】
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580がいずれも、最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を行わなければならない。
【0079】
特に、イントラ予測部550及び動き補償部560は、ツリー構造による符号化単位ごとに、パーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに、変換単位のサイズを決定しなければならない。また、本発明の一実施形態によるエントロピー復号化部520は、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係る情報を表す構文要素をエントロピー復号化するのに利用されるコンテキストモデルを、当該構文要素の類型によって、階層的構造のデータ単位の階層構造情報、及び階層構造以外にカラー成分などの多様な情報に基づいて、コンテキストモデルを選択して、エントロピー復号化を行う。
【0080】
図6は、本発明の一実施形態による深度別の符号化単位及びパーティションを示す。
【0081】
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、映像の特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に決定されてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別の符号化単位のサイズが決定される。
【0082】
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64であり、最大深度が4である場合を示している。一実施形態による符号化単位の階層構造600の縦軸に沿って、深度が深くなるので、深度別の符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別の符号化単位の予測符号化の基本となる予測単位及びパーティションが示されている。
【0083】
すなわち、符号化単位610は、符号化単位の階層構造600で最大符号化単位であって、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32である深度1の符号化単位620、サイズ16×16である深度2の符号化単位630、サイズ8×8である深度3の符号化単位640、及びサイズ4×4である深度4の符号化単位650が存在する。サイズ4×4である深度4の符号化単位650は、最小符号化単位である。
【0084】
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位であれば、予測単位は、サイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、及びサイズ32×32のパーティション616に分割される。
【0085】
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32×16のパーティション622、サイズ16×32のパーティション624、及びサイズ16×16のパーティション626に分割される。
【0086】
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、及びサイズ8×8のパーティション636に分割される。
【0087】
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、及びサイズ4×4のパーティション646に分割される。
【0088】
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位であり、かつ最下位深度の符号化単位であり、当該予測単位も、サイズ4×4のパーティション650のみに設定される。
【0089】
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
【0090】
同一な範囲及びサイズのデータを含むための深度別の符号化単位の個数は、深度が深くなるほど増加する。例えば、深度1の符号化単位が一つ含まれるデータに対して、深度2の符号化単位は四つ必要である。したがって、同一なデータの符号化結果を深度別に比較するために、一つの深度1の符号化単位、及び四つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
【0091】
それぞれの深度別の符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別の符号化単位の予測単位ごとに符号化を行って、当該深度で最小符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って、深度が深くなり、それぞれの深度ごとに符号化を行って、深度別の代表符号化誤差を比較して、最小符号化誤差が検索される。最大符号化単位610のうち、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプとして選択される。
【0092】
図7は、本発明の一実施形態による符号化単位と変換単位の関係を示す。
【0093】
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位よりも小さいか、またはそれと同じサイズの符号化単位に映像を符号化または復号化する。符号化過程で周波数変換のための変換単位のサイズは、それぞれの符号化単位よりも大きくないデータ単位に基づいて選択される。
【0094】
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200において、現在の符号化単位710が64×64サイズである時、32×32サイズの変換単位720を利用して、周波数変換が行われる。
【0095】
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32,16×16,8×8,4×4サイズの変換単位にそれぞれ周波数変換を行って符号化した後、原本との誤差が最も小さい変換単位が選択される。
【0096】
図8は、本発明の一実施形態による深度別の符号化情報を示す。
【0097】
一実施形態によるビデオ符号化装置100のエントロピー符号化部120は、符号化モードに係る情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を符号化して伝送する。
【0098】
パーティションタイプに係る情報800は、現在の符号化単位の予測符号化のためのデータ単位として、現在の符号化単位の予測単位が分割されたパーティションの形態に係る情報を表す。例えば、サイズ2N×2Nの現在の符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうちいずれか一つのタイプに分割されて利用される。その場合、現在の符号化単位のパーティションタイプに係る情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうち一つを表すように設定される。
【0099】
予測モードに係る情報810は、それぞれのパーティションの予測モードを表す。例えば、予測モードに係る情報810を通じて、パーティションタイプに係る情報800が表すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかが設定される。
【0100】
また、変換単位サイズに係る情報820は、現在の符号化単位を、どの変換単位に基づいて周波数変換を行うかを表す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、及び第2イントラ変換単位サイズ828のうち一つである。
【0101】
一実施形態によるビデオ復号化装置200のエントロピー復号化部220は、それぞれの深度別の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を抽出して、復号化に利用可能である。
【0102】
図9は、本発明の一実施形態による深度別の符号化単位を示す。
【0103】
深度の変化を表すために、分割情報が利用される。分割情報は、現在の深度の符号化単位が、下位深度の符号化単位に分割されるか否かを表す。
【0104】
深度0及びサイズ2N_0×2N_0の符号化単位900の予測符号化のための予測単位910は、サイズ2N_0×2N_0のパーティションタイプ912、サイズ2N_0×N_0のパーティションタイプ914、サイズN_0×2N_0のパーティションタイプ916、及びサイズN_0×N_0のパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912,914,916,918のみが例示されているが、前述したように、パーティションタイプは、それらに限定されず、非対称的なパーティション、任意の形態のパーティション、幾何学的な形態のパーティションなどを含む。
【0105】
パーティションタイプごとに、一つのサイズ2N_0×2N_0のパーティション、二つのサイズ2N_0×N_0のパーティション、二つのサイズN_0×2N_0のパーティション、及び四つのサイズN_0×N_0のパーティションごとに、反復的に予測符号化が行わなければならない。サイズ2N_0×2N_0、サイズN_0×2N_0、サイズ2N_0×N_0、及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0×2N_0のパーティションに対してのみ、予測符号化が行われる。
【0106】
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最も小さければ、それ以上下位深度に分割する必要がない。
【0107】
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更して分割し(920)、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930に対して、反復的に符号化を行って、最小符号化誤差を検索する。
【0108】
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1×N_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、及びサイズN_1×N_1のパーティションタイプ948を含む。
【0109】
また、サイズN_1×N_1のパーティションタイプ948による符号化誤差が最も小さければ、深度1を2に変更して分割し(950)、深度2及びサイズN_2×N_2の符号化単位960に対して、反復的に符号化を行って、最小符号化誤差を検索する。
【0110】
最大深度がdである場合、深度別の分割情報は、深度がd−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割されて(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、及びサイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
【0111】
パーティションタイプのうち、一つのサイズ2N_(d−1)×2N_(d−1)のパーティション、二つのサイズ2N_(d−1)×N_(d−1)のパーティション、二つのサイズN_(d−1)×2N_(d−1)のパーティション、及び四つのサイズN_(d−1)×N_(d−1)のパーティションごとに、反復的に予測符号化を通じた符号化が行われて、最小符号化誤差が発生するパーティションタイプが検索される。
【0112】
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在の最大符号化単位900についての符号化深度が、深度d−1として決定され、パーティションタイプは、N_(d−1)×N_(d−1)として決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して、分割情報は設定されていない。
【0113】
データ単位999は、現在の最大符号化単位についての‘最小単位’であると呼ばれる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。かかる反復的な符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別の符号化誤差を比較して、最小符号化誤差が発生する深度を選択して、符号化深度を決定し、当該パーティションタイプ及び予測モードが、符号化深度の符号化モードとして設定される。
【0114】
このように、深度0,1,…,d−1,dの全ての深度別の最小符号化誤差を比較して、誤差が最も小さい深度が選択されて、符号化深度として決定される。符号化深度、予測単位のパーティションタイプ及び予測モードは、符号化モードに係る情報として符号化されて伝送される。また、深度0から符号化深度に達するまで、符号化単位が分割されなければならないので、符号化深度の分割情報のみが‘0’に設定され、符号化深度を除いた深度別の分割情報は、‘1’に設定されなければならない。
【0115】
一実施形態によるビデオ復号化装置200のエントロピー復号化部220は、符号化単位900についての符号化深度及び予測単位に係る情報を抽出して、符号化単位912を復号化するのに利用する。一実施形態によるビデオ復号化装置200は、深度別の分割情報を利用して、分割情報が‘0’である深度を符号化深度として把握し、当該深度についての符号化モードに係る情報を利用して復号化する。
【0116】
図10、
図11及び
図12は、本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別の符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別の符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別の符号化単位の変換単位である。
【0117】
深度別の符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054の深度が1、符号化単位1014,1016,1018,1028,1050,1052の深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048の深度が3、符号化単位1040,1042,1044,1046の深度が4である。
【0118】
予測単位1060のうち、一部のパーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2N×Nのパーティションタイプであり、パーティション1016,1048,1052は、N×2Nのパーティションタイプであり、パーティション1032は、N×Nのパーティションタイプである。深度別の符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位よりも小さいか、またはそれと同じである。
【0119】
変換単位1070のうち、一部の符号化単位1052の映像データについては、符号化単位に比べて小さいサイズのデータ単位で、周波数変換または周波数逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち、当該予測単位及びパーティションと比較すれば、異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、同一な符号化単位についてのイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるとしても、それぞれ別途のデータ単位に基づいて行う。
【0120】
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われて、最適符号化単位が決定されることによって、ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係る分割情報、パーティションタイプ情報、予測モード情報、及び変換単位サイズ情報を含む。以下、表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定可能な一例を表す。
【0121】
【表1】
一実施形態によるビデオ符号化装置100のエントロピー符号化部120は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200のエントロピー復号化部220は、受信されたビットストリームをパージングして、ツリー構造による符号化単位についての符号化情報を抽出する。
【0122】
分割情報は、現在の符号化単位が下位深度の符号化単位に分割されるか否かを表す。現在の深度dの分割情報が0であれば、現在の符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード及び変換単位サイズ情報が定義される。分割情報によってさらに分割されなければならない場合には、分割された四つの下位深度の符号化単位ごとに独立して符号化が行わなければならない。
【0123】
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで表す。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nでのみ定義される。
【0124】
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションタイプ2N×2N、2N×N、N×2N、N×N、及び非対称的な割合で分割された非対称的なパーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nを表す。非対称的なパーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:n(nは、1よりも大きい整数)及びn:1に分割された形態であり、非対称的なパーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:n及びn:1に分割された形態である。
【0125】
変換単位サイズは、イントラモードで二種類のサイズに、インターモードで二種類のサイズに設定される。すなわち、変換単位分割情報が0であれば、変換単位サイズが、現在の符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1であれば、現在の符号化単位が分割されたサイズの変換単位が設定される。また、サイズ2N×2Nである現在の符号化単位についてのパーティションタイプが、対称的なパーティションタイプであれば、変換単位サイズは、N×N、非対称的なパーティションタイプであれば、変換単位サイズは、N/2×N/2に設定される。
【0126】
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一な符号化情報を保有している予測単位及び最小単位を一つ以上含む。
【0127】
したがって、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一な符号化深度の符号化単位に含まれるか否かが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
【0128】
したがって、その場合、現在の符号化単位が、周辺データ単位を参照して予測する場合、現在の符号化単位に隣接する深度別の符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
【0129】
他の実施形態として、現在の符号化単位が、周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別の符号化単位の符号化情報を利用して、深度別の符号化単位内で、現在の符号化単位に隣接するデータが検索されることによって、周辺符号化単位が参照されることも可能である。
【0130】
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち一つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定される。
【0131】
パーティションタイプ情報が、対称的なパーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であれば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1であれば、サイズN×Nの変換単位1344が設定される。
【0132】
パーティションタイプ情報が、非対称的なパーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であれば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1であれば、サイズN/2×N/2の変換単位1354が設定される。
【0133】
変換単位分割情報(TU size flag)は、変換インデックスの一種であって、変換インデックスに対応する変換単位のサイズは、符号化単位の予測単位タイプまたはパーティションタイプによって変更可能である。
【0134】
例えば、パーティションタイプ情報が、対称的なパーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち一つに設定されている場合、変換単位分割情報が0であれば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1であれば、サイズN×Nの変換単位1344が設定される。
【0135】
パーティションタイプ情報が、非対称的なパーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定されている場合、変換単位分割情報が0であれば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1であれば、サイズN/2×N/2の変換単位1354が設定される。
【0136】
図9を参照して説明した変換単位分割情報は、0または1の値を有するフラグであるが、一実施形態による変換単位分割情報が1ビットのフラグに限定されるものではなく、設定によって0,1,2,3,…に増加し、変換単位が階層的に分割されてもよい。変換単位分割情報は、変換インデックスの一実施例として利用される。
【0137】
その場合、一実施形態による変換単位分割情報を、変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位のサイズが表現される。一実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化する。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、SPSに挿入される。一実施形態によるビデオ復号化装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用して、ビデオ復号化に利用できる。
【0138】
例えば、(a)現在の符号化単位のサイズが64×64であり、最大変換単位サイズが32×32であれば、(a−1)変換単位分割情報が0である時、変換単位のサイズが32×32、(a−2)変換単位分割情報が1である時、変換単位のサイズが16×16、(a−3)変換単位分割情報が2である時、変換単位のサイズが8×8に設定される。
【0139】
他の例として、(b)現在の符号化単位のサイズが32×32であり、最小変換単位サイズが32×32であれば、(b−1)変換単位分割情報が0である時、変換単位のサイズが32×32に設定され、変換単位のサイズが32×32よりも小さいことはないので、それ以上の変換単位分割情報が設定されない。
【0140】
さらに他の例として、(c)現在の符号化単位のサイズが64×64であり、最大変換単位分割情報が1であれば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されない。
【0141】
したがって、最大変換単位分割情報を‘MaxTransformSizeIndex’、最小変換単位サイズを‘MinTransformSize’、変換単位分割情報が0である場合の変換単位、すなわち、基本変換単位RootTuのサイズを‘RootTuSize’と定義する時、現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’は、下記の数式(1)のように定義される。
【0142】
CurrMinTuSize
=max(MinTransformSize, RootTuSize/(2^MaxTransformSizeIndex)) (1)
現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’と比較して、基本変換単位サイズ‘RootTuSize’は、システム上採択可能な最大変換単位サイズを表す。すなわち、数式(1)によれば、‘RootTuSize/(2^MaxTransformSizeIndex)’は、基本変換単位サイズ‘RootTuSize’を最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、‘MinTransformSize’は、最小変換単位サイズであるので、それらのうち小さい値が、現在の符号化単位で決定可能な最小変換単位サイズ‘CurrMinTuSize’である。
【0143】
一実施形態による基本変換単位サイズ‘RootTuSize’は、予測モードによって変わる。
【0144】
例えば、現在の予測モードがインターモードであれば、‘RootTuSize’は、下記の数式(2)によって決定される。数式(2)において、‘MaxTransformSize’は、最大変換単位サイズを表し、‘PUSize’は、現在の予測単位サイズを表す。
【0145】
RootTuSize=min(MaxTransformSize, PUSize) (2)
すなわち、現在の予測モードがインターモードであれば、変換単位分割情報が0である場合の変換単位である基本変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在の予測単位サイズのうち小さい値に設定される。
【0146】
現在のパーティション単位の予測モードがイントラモードであれば、‘RootTuSize’は、下記の数式(3)によって決定される。‘PartitionSize’は、現在のパーティション単位のサイズを表す。
【0147】
RootTuSize=min(MaxTransformSize, PartitionSize) (3)
すなわち、現在の予測モードがイントラモードであれば、基本変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在のパーティション単位サイズのうち小さい値に設定される。
【0148】
ただし、パーティション単位の予測モードによって変わる一実施例による現在の最大変換単位サイズである基本変換単位サイズ‘RootTuSize’は、一実施例であるのみ、現在の最大変換単位サイズを決定する要因が、それに限定されるものではないことに留意しなければならない。
【0149】
以下、
図1のビデオ符号化装置100のエントロピー符号化部120で行われる構文要素のエントロピー符号化過程、及び
図2のビデオ復号化装置200のエントロピー復号化部220で行われる構文要素のエントロピー復号化過程について詳細に説明する。
【0150】
前述したように、本発明の一実施形態によるビデオ符号化装置100及びビデオ復号化装置200は、最大符号化単位よりも小さいか、それと同じ符号化単位に最大符号化単位を分割して、符号化及び復号化を行う。予測過程及び変換過程に利用される予測単位及び変換単位は、他のデータ単位と独立してコストに基づいて決定される。このように、最大符号化単位に含まれた階層的構造の符号化単位ごとに再帰的に符号化が行われ、最適符号化単位が決定されることによって、ツリー構造によるデータ単位が構成される。すなわち、最大符号化単位ごとに、ツリー構造の符号化単位、ツリー構造の予測単位及び変換単位が決定される。復号化のために、当該階層的構造のデータ単位の構造情報を表す情報である階層情報、及び階層情報以外に復号化のための階層外情報が伝送される必要がある。
【0151】
階層的構造に係る情報は、
図10ないし
図12で説明したツリー構造の符号化単位、ツリー構造の予測単位、及びツリー構造の変換単位を決定するために必要な情報であって、最大符号化単位のサイズ、符号化深度、予測単位のパーティション情報、符号化単位の分割如何を表す分割フラグ、変換単位のサイズ情報、変換単位の分割如何を表す変換単位分割フラグ(TU size flag)などを含む。階層的構造情報以外の符号化情報としては、各予測単位に適用されたイントラ/インター予測の予測モード情報、動きベクトル情報、予測方向情報、複数個のカラー成分が利用された場合、当該データ単位に適用されたカラー成分情報、変換係数のようなテクスチャ情報などを含む。以下の説明において、復号化のために伝送される階層情報及び階層外情報は、エントロピー符号化の対象である構文要素と呼ばれる。
【0152】
図14は、本発明の一実施形態によるエントロピー符号化装置の構成を示すブロック図である。
図14のエントロピー符号化装置1400は、
図1のビデオ符号化装置100のエントロピー符号化部120に対応する。
【0153】
図14を参照すれば、一実施形態によるエントロピー符号化装置1400は、二進化部1410、コンテキストモデラー1420、及び二進算術符号化部1430を備える。また、二進算術符号化部1430は、レギュラーコーディング部1432と、バイパスコーディング部1434とを備える。
【0154】
エントロピー符号化装置1400に入力される構文要素は、二進値ではないことがあるので、構文要素が二進値ではない場合、二進化部1410は、構文要素を二進化して、0または1の二進値で構成されたビン(Bin)ストリングを出力する。ビンは、0または1で構成されたストリームの各ビットを表すものであって、各ビンは、CABAC(Context Adaptive Binary Arithmetic Coding)を通じて符号化される。構文要素が0と1の頻度の同一なデータであれば、確率値を利用しないバイパスコーディング部1434に出力されて符号化される。
【0155】
コンテキストモデラー1420は、レギュラーコーディング部1432に、現在の符号化シンボルについての確率モデルを提供する。具体的に、コンテキストモデラー1420は、現在の符号化シンボルの二進値を符号化するための二進値の発生確率を、二進算術符号化部1430に出力する。現在の符号化シンボルとは、符号化される現在の構文要素を二進化、すなわち、二進値で構成した時の各二進値を表す。
【0156】
本発明の一実施形態によるコンテキストモデラー1420は、現在の符号化単位の符号化される第1構文要素のためのコンテキストモデルを決定するために、同一な現在の符号化単位内で利用可能な第1構文要素とは異なる第2構文要素の情報に基づいて、第1構文要素に適用されるコンテキストモデルを決定する。従来のH.264標準などでは、現在のブロックの所定の構文要素についてのコンテキストモデルを決定するために、前記所定の構文要素と同一な構文要素についての情報を、周辺ブロックから獲得して、現在のブロックの所定の構文要素に適用されるコンテキストを決定した。しかし、かかる従来のエントロピー符号化のためのコンテキストモデルを決定するためには、周辺ブロックから、同一な類型の構文要素を獲得しなければならないので、システム上で所定のメモリに、当該周辺ブロックの構文要素が保存されなければならず、現在のブロックの構文要素のエントロピー符号化のためのコンテキストモデルの決定時、当該メモリにアクセスを行わなければならなかった。しかし、一実施形態によるコンテキストモデラー1420は、周辺符号化単位の情報を利用するものではなく、現在の符号化単位で利用可能な他の第2構文要素を利用して、第1構文要素のエントロピー符号化のためのコンテキストモデルを選択することによって、メモリアクセス回数を減らすだけでなく、構文要素を保存するためのメモリを減らすことができる。
【0157】
また、後述するように、一実施形態によるコンテキストモデラー1420は、周辺符号化単位から、現在のエントロピー符号化される第1構文要素と同一な類型の構文要素を獲得し、現在の符号化単位から獲得された第2構文要素と、周辺符号化単位の第1構文要素とを組み合わせて、現在の符号化単位の第1構文要素をエントロピー符号化するためのコンテキストモデルを決定する。
【0158】
コンテキストモデルは、ビンについての確率モデルであって、0と1のうちどちらの値がMPS(Most Probable Symbol)及びLPS(Least Probable Symbol)に該当するかについての情報と、MPSまたはLPSの確率とを含む。
【0159】
レギュラーコーディング部1432は、コンテキストモデラー1420から提供されたMPS及びLPSについての情報と、MPSまたはLPSの確率情報とに基づいて、現在の符号化シンボルについての二進算術符号化を行う。
【0160】
以下、
図14のコンテキストモデラー1420で行われる構文要素のエントロピー符号化のためのコンテキストモデルの決定過程について詳細に説明する。
【0161】
図15は、
図14のコンテキストモデラー1420の具体的な構成を示すブロック図である。
図15を参照すれば、一実施形態によるコンテキストモデラー1420は、付加情報獲得部1421と、確率モデル決定部1422とを備える。
【0162】
付加情報獲得部1421は、現在のデータ単位の第1構文要素をエントロピー符号化する時に利用可能な現在の符号化単位の第2構文要素についての情報を獲得する。例えば、第2構文要素は、現在のデータ単位のサイズ情報、現在のデータ単位よりも大きい上位階層のデータ単位との関係で、前記第1構文要素が含まれた現在のデータ単位の相対的なサイズを表す情報、データ単位が属するカラーピクチャのカラー類型情報、予測モード情報などを含み、第1構文要素がエントロピー符号化される時点で利用可能な現在の符号化単位の付加情報である。
【0163】
確率モデル決定部1422は、獲得された第2構文要素についての付加情報に基づいて、第1構文要素のエントロピー符号化に利用されるコンテキストモデルを決定する。具体的に、確率モデル決定部1422は、現在の符号化される第1構文要素のエントロピー符号化のために利用可能な第2構文要素が、a(aは、正の整数)個の状態値を有するとする時、第2構文要素の状態値によって、a個のコンテキストモデルのうち一つを表すコンテキストインデックスを決定することによって、現在の符号化単位の第1構文要素のエントロピー符号化に利用されるコンテキストモデルを決定する。例えば、現在の符号化される第1構文要素が属する現在のデータ単位のサイズが2×2,4×4,8×8,16×16,32×32,64×64の全部で五つの状態値を有し、かかるデータ単位のサイズを第2構文要素として利用する場合を仮定すれば、確率モデル決定部1422は、第2構文要素であるデータ単位のサイズによって、五つ以下のコンテキストモデルを設定し、現在の第2構文要素、すなわち、現在のデータ単位のサイズに基づいて、現在の第1構文要素のエントロピー符号化時に利用されるコンテキストモデルを表すコンテキストインデックスを決定して出力する。
【0164】
また、一実施形態による確率モデル決定部1422は、複数個の第2構文要素を利用して、現在の符号化単位の第1構文要素をエントロピー符号化するためのコンテキストモデルを決定する。具体的に、コンテキストモデルの決定に利用される第2構文要素の個数をn(nは、整数)、n個の第2構文要素それぞれが有する状態値の個数をa
i(iは、1からnまでの整数)とする時、第2構文要素の状態値の組み合わせの個数であるa
1*a
2*…*a
nに基づいて、複数個のコンテキストモデルのうち、第1構文要素のエントロピー符号化に利用される一つのコンテキストモデルを決定する。
【0165】
一例として、変換単位内に、0ではない変換係数が存在するか否かを表すフラグであるCBFフラグcoded_block_flagが、12個のコンテキストモデルを有すると仮定する時、現在の変換単位のCBFフラグのエントロピー符号化のためのコンテキストモデルは、現在の変換単位が属するピクチャのカラー成分情報と、現在の変換単位のサイズ情報とに基づいて決定される。カラー成分情報は、Y、Cb及びCrのうち一つであり、カラー成分を表すインデックスcolor_type_indexは、Y、Cb及びCrそれぞれに対して、0、1及び2に設定されると仮定する。また、変換単位のサイズを表すインデックスTU_Block_size_indexが、4×4,8×8,16×16,32×32に対して、それぞれ0、1、2及び3に設定されたと仮定する。その場合、確率モデル決定部1422は、次の数式;CtxIdx=color_type_index*4+TU_Block_size_indexによって、現在の変換単位のCBFフラグをエントロピー符号化するためのコンテキストモデルを表すコンテキストインデックスCtxIdxを、他の構文要素であるカラー成分を表すインデックスcolor_type_index、及び変換単位のサイズを表すインデックスTU_Block_size_indexを利用して獲得する。前述したように、同一な現在の符号化単位内の他の構文要素情報を利用して、コンテキストモデルを選択することによって、メモリアクセス回数及び必要なメモリのサイズを減らすことができる。
【0166】
前述した例では、CBFフラグの場合、変換単位のサイズ情報と、カラー成分情報とを利用する場合を例示したが、エントロピー符号化される第1構文要素と、コンテキストモデルの選択のために利用される第2構文要素は、現在の利用可能なデータ単位の付加情報を利用して多様に設定可能である。
【0167】
また、付加情報獲得部1421は、現在のデータ単位の付加情報以外に、現在のデータ単位の周辺データ単位から、現在のエントロピー符号化される第1構文要素と同一な類型の第1構文要素を獲得する。確率モデル決定部1422は、周辺符号化単位から獲得された第1構文要素と、現在の符号化単位の他の第2構文要素とを利用して、現在のデータ単位の第1構文要素のエントロピー符号化のための確率モデルを決定する。例えば、現在のデータ単位の符号化される第1構文要素を、現在のデータ単位の分割如何を表す分割フラグであると仮定する。その場合、確率モデル決定部1422は、左側または上側の周辺データ単位から、分割フラグを獲得し、周辺のデータ単位の分割フラグsplit_flag_neighborと、現在のデータ単位の利用可能な分割フラグとを除いた他の構文要素、例えば、現在のデータ単位の深度を第2構文要素として利用して、現在のデータ単位の分割フラグのエントロピー符号化のためのコンテキストモデルを、次の数式;ctxIdx=split_flag_left+(depth>>1)を通じて選択する。一方、付加情報獲得部1421は、現在のデータ単位の第1構文要素のエントロピー符号化のために、周辺データ単位から同一な類型の第1構文要素についての情報を獲得する時、望ましくは、現在のデータ単位の左側に隣接した周辺データから、当該第1構文要素についての情報を獲得することが望ましい。なぜならば、データ単位に係る情報は、一般的にバッファに/からライン単位で保存されて読み出されるので、現在のデータ単位と、上側に隣接した周辺データ単位との第1構文要素情報を利用するよりは、現在のデータ単位と、左側に隣接した周辺データ単位とから第1構文要素情報を獲得することが、バッファのサイズを減少させるので望ましい。また、ラスタースキャンなどの処理順序を考慮する時、上側の周辺データ単位の情報を、現在のデータ単位の第1構文要素のエントロピー符号化のために利用するよりは、現在のデータ単位と同一なラインに位置し、かつ現在のデータ単位以前に処理された左側に隣接した周辺データ単位の情報を利用することが、バッファのサイズを縮小させるので望ましい。
【0168】
他の例として、第1構文要素として、
図1ないし
図13で前述した階層的な符号化単位の情報をエントロピー符号化する過程を説明する。
【0169】
図16は、本発明の一実施形態による階層的構造のデータ単位と、階層的構造のデータ単位分割情報とを示す。データ単位は、前述した符号化単位、予測単位及び変換単位のうちいずれであってもよい。
【0170】
前述したように、本発明の一実施形態によれば、階層的構造の符号化単位、予測単位及び変換単位を利用して符号化が行われる。
図16において、最上位レベルであるレベル0のN×Nサイズのデータ単位1600が、一ステップの下位レベルであるレベル1のデータ単位31a,31b,31c,31dに分割され、レベル1の一部のデータ単位31a,31dは、それぞれさらに一ステップの下位レベルであるレベル2のデータ単位32a,32b,32c,32d,32e,32f,32g,32hに分割された場合を示す。かかるデータ単位の階層的構造を表すためのシンボルとして、それぞれのデータ単位が一ステップ下位レベルのデータ単位に分割されるか否かを表す分割フラグが利用される。例えば、現在のデータ単位についての分割フラグが1であれば、現在のデータ単位が下位レベルのデータ単位に分割されることを表し、分割フラグが0であれば、それ以上分割されないことを表す。
【0171】
レベル0のデータ単位から分割されたデータ単位30,31a,31b,31c,31d,32a,32b,32c,32d,32e,32f,32g,32hが階層的構造を形成することによって、それぞれのデータ単位についての分割情報も、階層的構造を形成する。すなわち、階層的構造のデータ単位分割情報33は、最上位レベル0のデータ単位分割情報34、レベル1のデータ単位分割情報35a,35b,35c,35d、及びレベル2のデータ単位分割情報36a,36b,36c,36d,36e,36f,36g,36hを含む。
【0172】
階層的構造のデータ単位分割情報33のうち、レベル0のデータ単位分割情報34は、最上位レベル0のデータ単位が分割されることを表す。同様に、レベル1の一部のデータ単位分割情報35a,35dは、それぞれレベル1のデータ単位31a,31dが、レベル2のデータ単位32a,32b,32c,32d,32e,32f,32g,32hに分割されることを表す。
【0173】
レベル1の一部のデータ単位31b,31cは、それ以上分割されず、ツリー構造で子ノードが存在しないリーフノードに該当する。同様に、レベル2のデータ単位32a,32b,32c,32d,32e,32f,32g,32hは、それ以上下位レベルのデータ単位に分割されないリーフノードに該当する。
【0174】
このように、上位レベルのデータ単位が、下位レベルのデータ単位に分割されるか否かを表す分割フラグは、データ単位の階層的構造を表すシンボルとして利用される。
【0175】
かかるデータ単位の階層的構造を表す分割フラグをエントロピー符号化する時、一実施形態によるエントロピー符号化部120は、全てのノードのデータ単位の分割フラグをエントロピー符号化するか、または子ノードを有していないリーフノードに該当するデータ単位の分割フラグのみをエントロピー符号化する。
【0176】
図17A及び
図17Bは、本発明の一実施形態によって、データ単位の階層的構造を表すシンボルを示す参照図である。
【0177】
図17A及び
図17Bにおいて、フラグは、
図16のツリー構造33で各ノードのデータ単位が、下位レベルのデータ単位に分割されるか否かを表すデータ単位の分割フラグであると仮定する。
図17Aを参照すれば、一実施形態によるエントロピー符号化部120は、データ単位の階層的構造を表すシンボルとして、全てのレベルのデータ単位30,31a,31b,31c,31d,32a,32b,32c,32d,32e,32f,32g,32hについての分割フラグ情報flag0,flag1a,flag1b,flag1c,flag1d,flag2a,flag2b,flag2c,flag2d,flag2e,flag2f,flag2g,flag2hをいずれもエントロピー符号化する。また、エントロピー符号化部120は、
図17Bに示したように、子ノードを有していないリーフノードに該当するデータ単位の分割フラグ情報flag1b,flag1c,flag2a,flag2b,flag2c,flag2d,flag2e,flag2f,flag2g,flag2hのみをエントロピー符号化する。なぜならば、下位レベルのデータ単位分割フラグ情報の存在如何によって、上位レベルのデータ単位の分割如何が決定されるためである。例えば、
図17Bにおいて、レベル2のデータ単位36a,36b,36c,36dの分割フラグflag2a,flag2b,flag2c,flag2dが存在する場合、レベル2のデータ単位36a,36b,36c,36dの上位レベルであるレベル1のデータ単位35aは、当然のこととして下位レベルであるレベル2のデータ単位に分割されなければならないので、別途にレベル1のデータ単位35aの分割フラグ情報flag1aは符号化される必要がない。
【0178】
一実施形態によるビデオ復号化装置200は、シンボル階層的な復号化モードによって、全てのレベルのデータ単位30,31a,31b,31c,31d,32a,32b,32c,32d,32e,32f,32g,32hについての分割フラグflag,flag1a,flag1b,flag1c,flag1d,flag2a,flag2b,flag2c,flag2d,flag2e,flag2f,flag2g,flag2hをいずれも抽出して読み取ることによって、データ単位の階層的構造を決定する。また、一実施形態によるビデオ復号化装置200は、リーフノードに該当するデータ単位31b,31c,32a,32b,32c,32d,32e,32f,32g,32hについての分割フラグflag1b,flag1c,flag2a,flag2b,flag2c,flag2d,flag2e,flag2f,flag2g,flag2hのみが符号化された場合、抽出された分割フラグflag1b,flag1c,flag2a,flag2b,flag2c,flag2d,flag2e,flag2f,flag2g,flag2hに基づいて、符号化されていない残りのデータ単位の分割フラグflag0,flag1a,flag1b,flag1c,flag1dを決定することによって、データ単位の階層的構造を決定する。
【0179】
コンテキストモデラー1420は、付加情報の組み合わせによる状態値に基づいて、データ単位の階層的構造を表す分割フラグをエントロピー符号化するための複数個のコンテキストモデルのうち一つのコンテキストモデルを決定する。
【0180】
図18A及び
図18Bは、本発明の一実施形態によって、付加情報の組み合わせによってコンテキストモデルを決定するためのコンテキストインデックスの例示を示す図面である。
【0181】
図18Aを参照すれば、コンテキストモデラー1420は、分割フラグが属するデータ単位の分割フラグを除いた利用可能な他の付加情報に基づいて、現在のデータ単位の分割フラグのエントロピー符号化に利用されるコンテキストモデルを決定する。コンテキストモデラー1420は、n個の付加情報がそれぞれa
i(a
iは、整数、iは、1からnまでの整数)個の状態値を有すると仮定すれば、コンテキストモデラー1420は、a
1×a
2×…×a
n個の状態値の組み合わせによって決定されたコンテキストインデックスctxIdxに基づいて、複数個のコンテキストモデルのうち、分割フラグのエントロピー符号化に利用するコンテキストモデルを決定する。
図18Aに示したように、a
1×a
2×…×a
nの値がS
1,S
2,…,S
mの値を有すると仮定すれば、かかるm個の状態値S
1,S
2,…,S
mによって、一つのコンテキストインデックスが決定される。
【0182】
また、コンテキストモデラー1420は、
図18Bに示したように、m個の状態値S
1,S
2,…,S
mをグループ化して、付加情報の組み合わせ値によるコンテキストインデックスを決定する。
【0183】
図19は、本発明の一実施形態によるコンテキストモデルの一例を示す参照図である。
【0184】
確率モデル決定部1422は、付加情報の組み合わせによって決定されたコンテキストインデックス情報を利用して、0と1の二進信号のうち、MPS及びLPSに該当する二進信号についての情報と、MPSまたはLPSについての確率値情報とを決定して出力する。
図19を参照すれば、確率モデル決定部1422は、二進信号の発生確率をルックアップテーブル1900の形態に備え、付加情報の組み合わせによって決定されたコンテキストインデックスctxIdxに対応する確率値情報を、レギュラーコーディング部1432に出力する。具体的に、現在のデータ単位の付加情報の組み合わせに基づいて、現在のシンボルに適用されるコンテキストモデルを表すコンテキストインデックスctxIdxが決定されれば、確率モデル決定部1422は、当該コンテキストインデックスに対応する発生確率表のインデックスpStateIdxと、MPSに該当する二進信号とを決定する。また、コンテキストモデラー1420は、現在のデータ単位の付加情報と、現在のデータ単位と隣接した周辺データ単位の付加情報とを結合した組み合わせによって、同様に複数個のコンテキストのうち、現在のデータ単位の構文要素をエントロピー符号化するためのコンテキストモデルを決定する。
【0185】
図20は、本発明の一実施形態によるMPSの発生確率値の一例を示す。
【0186】
発生確率表は、MPSの確率値を表すものであって、発生確率表のインデックスpStateIdxが指定されれば、当該MPSの確率値が決定される。例えば、コンテキストモデラー1420が、現在のシンボルの符号化に利用されるコンテキストモデルのインデックスの値を1に決定して出力すれば、確率モデル決定部1422は、
図19に示したコンテキストモデルのうち、コンテキストインデックス1に対応するインデックスpStateIdxの値を7に決定し、MPSを0に決定する。また、確率モデル決定部1422は、
図20のように、インデックスpStateIdxの値によって予め設定されたMPSの確率値のうち、pStateIdx=7に対応するMPSの確率値を決定する。MPSとLPSの確率値の和は1であるので、MPSまたはLPSのうち一つの確率値が決定されれば、残りの二進信号の確率値は決定される。
【0187】
一方、確率モデル決定部1422は、レギュラーコーディング部1432で一つのビン(bin)を符号化する度に、MPSを符号化したか、LPSを符号化したかによって、インデックスpStateIdxの値を更新することによって、二進信号の発生統計を考慮して、MPS及びLPSの確率値を更新する。例えば、確率モデル決定部1422は、レギュラーコーディング部1432の符号化結果を考慮して、MPSを符号化する時に更新後のインデックスpStateIdxの値であるtransIdxMPSを、LPSを符号化する時に更新後のインデックスpStateIdxの値であるtranIdxLPSを、所定のルックアップテーブルの形態に設定した後、符号化動作ごとにインデックスpStateIdxの値を更新することによって、MPSの確率値を変更する。
【0188】
レギュラーコーディング部1432は、MPSまたはLPSに該当する二進信号情報及び確率値情報に基づいて、現在の構文要素についてのシンボルの二進信号をエントロピー符号化して出力する。
【0189】
図21は、
図14のレギュラーコーディング部1430で行われる二進算術符号化過程を説明するための図面である。
図21において、データ単位の階層的構造を表す分割フラグが二進値“010”であり、1の発生確率が0.2であり、0の発生確率が0.8であると仮定する。ここで、1及び0の発生確率は、二進値を符号化する度に更新されなければならないが、説明の便宜上、固定された確率値を仮定する。
【0190】
図21を参照すれば、二進値“010”のうち、最初のビン値“0”を符号化する場合、初期区間[0.0〜1.0]のうち、下端の80%部分である[0.0〜0.8]が新たな区間として更新され、次のビン値“1”を符号化する場合、[0.0〜0.8]の上端の20%部分である[0.64〜0.8]が新たな区間として更新される。また、最後のビン値“0”を符号化する場合、[0.64〜0.8]の下端の80%部分である[0.64〜0.768]が新たな区間として更新される。最終的な区間[0.64〜0.768]の間に入る実数である0.75に対応する二進数0.11において、最初の0を除いた小数点以下の“11”が、分割フラグの二進値“010”に対応するビットストリームに出力される。
【0191】
図22は、本発明の一実施形態によるエントロピー符号化方法を示すフローチャートである。
図22を参照すれば、ステップ2210において、階層的符号化部110は、階層的構造のデータ単位に基づいて、ビデオを符号化する。ステップ2220において、コンテキストモデラー1420は、エントロピー符号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、現在のデータ単位の第1構文要素のエントロピー符号化に利用されるコンテキストモデルを決定する。前述したように、第2構文要素の個数をn(nは、整数)、n個の第2構文要素それぞれが有する状態値の個数をa
i(iは、1からnまでの整数)とする時、コンテキストモデラー1420は、第2構文要素の状態値の組み合わせの個数であるa
1*a
2*…*a
nに基づいて決定されたコンテキストインデックスctxIdxが表すコンテキストモデルを決定する。
【0192】
ステップ2230において、レギュラーコーディング部1432は、決定されたコンテキストモデルを利用して、データ単位の第1構文要素をエントロピー符号化する。
【0193】
図23は、本発明の一実施形態によるエントロピー復号化装置の構成を示すブロック図である。
図23を参照すれば、エントロピー復号化装置2300は、コンテキストモデラー2310、レギュラーデコーディング部2320、バイパスデコーディング部2330、及び逆二進化部2340を備える。エントロピー復号化装置2300は、前述したエントロピー符号化装置1400で行われるエントロピー符号化過程の逆過程を行う。
【0194】
バイパスコーディングにより符号化されたシンボルは、バイパスデコーディング部2330に出力されて復号化され、レギュラーコーディングにより符号化されたシンボルは、レギュラーデコーディング部2320により復号化される。レギュラーデコーディング部2320は、コンテキストモデラー2310により提供されるコンテキストモデルに基づいて、現在の符号化シンボルの二進値を算術復号化する。
【0195】
コンテキストモデラー2310は、前述した
図14のコンテキストモデラー1420と同様に、現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータの少なくとも一つ以上の第2構文要素に基づいて、現在のデータ単位の第1構文要素のエントロピー復号化に利用されるコンテキストモデルを決定する。前述したように、コンテキストモデラー2310は、現在のデータ単位と隣接した周辺データ単位から、現在のデータ単位の第1構文要素と同一な類型の第1構文要素についての情報を獲得し、周辺データ単位から獲得された第1構文要素と、現在のデータ単位から獲得された利用可能な第2構文要素とを利用して、現在のデータ単位の第1構文要素をエントロピー復号化するためのコンテキストモデルを決定する。
【0196】
図23のコンテキストモデラー2310の動作は、復号化側で行われるという点を除いて、
図14のコンテキストモデラー1420の動作と同一であるところ、具体的な説明は省略する。
【0197】
逆二進化部2340は、レギュラーデコーディング部2320またはバイパスデコーディング部2330で復元されたビンストリングを、再び構文要素に復元する。
【0198】
図24は、本発明の一実施形態によるエントロピー復号化方法を示すフローチャートである。
図24を参照すれば、ステップ2410において、構文要素抽出部210は、符号化されたビットストリームをパージングして、階層的構造のデータ単位に基づいて符号化されたピクチャについての構文要素を抽出する。ステップ2420において、エントロピー復号化装置2300のコンテキストモデラー2310は、エントロピー復号化される現在のデータ単位の第1構文要素とは異なる利用可能な現在のデータ単位の少なくとも一つ以上の第2構文要素に基づいて、現在のデータ単位の第1構文要素のエントロピー復号化に利用されるコンテキストモデルを決定する。前述したように、コンテキストモデラー2310は、かかる現在のデータ単位の第2構文要素情報以外に、現在のデータ単位と、左側または上側に隣接した周辺データ単位から、第1構文要素と同一な類型の第1構文要素を獲得し、現在のデータ単位から獲得された第2構文要素と組み合わせて、現在の符号化単位の第1構文要素をエントロピー復号化するためのコンテキストモデルを選択する。ステップ2430において、レギュラーデコーディング部2320は、決定されたコンテキストモデルを利用して、データ単位の構文要素をエントロピー復号化する。
【0199】
本発明は、また、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムにより読み取られるデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式によって、コンピュータで読み取り可能なコードに保存されて実行される。
【0200】
以上、本発明について、その望ましい実施形態を中心に述べた。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で、変形された形態で具現可能であるということを理解できるであろう。本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての相違点は、本発明に含まれたものと解釈されなければならない。