(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0015】
以下、図面を参照して本発明の望ましい実施形態を詳細に説明する。
【0016】
図1は、本発明の一実施形態による映像符号化装置を図示する。
図1を参照すれば、本発明の一実施形態による映像符号化装置100は、最大符号化単位分割部110、符号化深度決定部120、映像データ符号化部130及び符号化情報符号化部140を備える。
【0017】
最大符号化単位分割部110は、最大サイズの符号化単位である最大符号化単位に基づいて現在ピクチャーまたは現在スライスを分割できる。現在ピクチャーまたは現在スライスを、少なくとも1つの最大符号化単位で分割できる。
【0018】
本発明の一実施形態によれば、最大符号化単位及び深度を用いて符号化単位が表現される。前述したように、最大符号化単位は、現在ピクチャーの符号化単位のうちサイズの最も大きい符号化単位を表し、深度は、符号化単位が階層的に縮少されたサブ符号化単位のサイズを表す。深度が大きくなりつつ、符号化単位は、最大符号化単位から最小符号化単位まで縮少し、最大符号化単位の深度は最小深度と定義され、最小符号化単位の深度は最大深度と定義される。最大符号化単位は、深度が大きくなるにつれて深度別符号化単位のサイズは減少するので、k深度のサブ符号化単位は、複数のkより大きい深度のサブ符号化単位を含む。
【0019】
符号化されるピクチャーのサイズが大きくなるにつれて、さらに大きい単位で映像を符号化すれば、さらに高い映像圧縮率で映像を符号化できる。しかし、符号化単位を大きくしてそのサイズを固定させれば、変り続ける映像の特性を反映して効率的に映像を符号化できない。
【0020】
例えば、海または空などの平坦な領域を符号化する時には、符号化単位を大きくするほど圧縮率が向上するが、人々またはビルディングなどの複雑な領域を符号化する時には、符号化単位を小さくするほど圧縮率が向上する。
【0021】
このために、本発明の一実施形態は、ピクチャーまたはスライスごとに相異なる最大映像符号化単位を設定し、最大深度を設定する。最大深度は、符号化単位が縮少できる最大回数を意味するので、最大深度によって最大映像符号化単位に含まれた最小符号化単位サイズを可変的に設定できるようになる。
【0022】
符号化深度決定部120は、最大深度を定める。最大深度は、R−Dコスト(Rate−Distortion Cost)計算に基づいて定められる。最大深度は、ピクチャーまたはスライスごとに異なって定められるか、またはそれぞれの最大符号化単位ごとに異なって定められてもよい。定められた最大深度は符号化情報符号化部140に出力され、最大符号化単位別映像データは映像データ符号化部130に出力される。
【0023】
最大深度は、最大符号化単位に含まれうる最も小さなサイズの符号化単位、すなわち、最小符号化単位を意味する。言い換えれば、最大符号化単位は、相異なる深度によって相異なるサイズのサブ符号化単位に分割される。
図8A及び
図8Bを参照して詳細に後述する。また、最大符号化単位に含まれた相異なるサイズのサブ符号化単位は、相異なるサイズの処理単位に基づいて予測または周波数変換される。言い換えれば、映像符号化装置100は、映像符号化のための複数の処理段階を、多様なサイズ及び多様な形態の処理単位に基づいて行える。映像データの符号化のためには、予測、周波数変換、エントロピー符号化などの処理段階を経るが、あらゆる段階にわたって同じサイズの処理単位が用いられてもよく、段階別に相異なるサイズの処理単位が用いられてもよい。
【0024】
例えば、映像符号化装置100は、符号化単位を予測するために、符号化単位と異なる処理単位を選択できる。
【0025】
符号化単位のサイズが2N×2N(ただし、Nは正の整数)である場合、予測のための処理単位は、2N×2N、2N×N、N×2N、N×Nなどでありうる。言い換えれば、符号化単位の高さまたは幅のうち少なくとも1つを半分する形態の処理単位に基づいて動き予測が行われてもよい。以下、予測の基礎になるデータ単位は、‘予測単位’という。
【0026】
予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも1つであり、特定予測モードは、特定サイズまたは形態の予測単位に対してのみ行われる。例えば、イントラモードは、正方形である2N×2N、N×Nサイズの予測単位に対してのみ行われる。また、スキップモードは、2N×2Nサイズの予測単位に対してのみ行われる。符号化単位の内部に複数の予測単位があれば、それぞれの予測単位に対して予測を行って符号化誤差の最も少ない予測モードが選択される。
【0027】
また、映像符号化装置100は、符号化単位と異なるサイズの処理単位に基づいて映像データを周波数変換できる。符号化単位の周波数変換のために、符号化単位より小さいか、または同じサイズのデータ単位に基づいて周波数変換が行われる。以下、周波数変換の基礎になる処理単位を、‘変換単位’という。
【0028】
符号化深度決定部120は、ラグランジュの乗数基盤の率−歪曲最適化技法を用いて、最大符号化単位に含まれたサブ符号化単位を定められる。言い換えれば、最大符号化単位がいかなる形態の複数のサブ符号化単位に分割されるかが決定できるが、ここで、複数のサブ符号化単位は深度によってそのサイズが異なる。次いで、映像データ符号化部130は、符号化深度決定部120で定められた分割形態に基づいて、最大符号化単位を符号化してビットストリームを出力する。
【0029】
符号化情報符号化部140は、符号化深度決定部120で最大符号化単位の符号化モードに関する情報を符号化する。最大符号化単位の分割形態に関する情報、最大深度に関する情報及び深度別サブ符号化単位の符号化モードに関する情報を符号化してビットストリームを出力する。サブ符号化単位の符号化モードに関する情報は、サブ符号化単位の予測単位に関する情報、予測単位別予測モード情報、サブ符号化単位の変換単位に関する情報などを含む。
【0030】
最大符号化単位ごとに相異なるサイズのサブ符号化単位が存在し、それぞれのサブ符号化単位ごとに符号化モードに関する情報が定められねばならないので、1つの最大符号化単位に対しては、少なくとも1つの符号化モードに関する情報が定められる。
【0031】
映像符号化装置100は、深度が大きくなるにつれて最大符号化単位の高さ及び幅を半分してサブ符号化単位を生成できる。すなわち、k深度の符号化単位のサイズが2N×2Nならば、k+1深度の符号化単位のサイズはN×Nである。
【0032】
したがって、一実施形態による映像復号化装置100は、映像の特性を考慮した最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の分割形態が定められる。映像特性を考慮して可変的に最大符号化単位のサイズを調節し、相異なる深度のサブ符号化単位に最大符号化単位を分割して映像を符号化することで、多様な解像度の映像をさらに効率的に符号化できる。
【0033】
図2は、本発明の一実施形態による映像復号化装置を図示する。
図2を参照すれば、本発明の一実施形態による映像復号化装置200は、映像データ獲得部210、符号化情報抽出部220及び映像データ復号化部230を備える。
【0034】
映像関連データ獲得部210は、映像復号化装置200が受信したビットストリームをパージングして、最大符号化単位別に映像データを獲得して映像データ復号化部230に出力する。映像データ獲得部210は、現在ピクチャーまたはスライスに対するヘッダから、現在ピクチャーまたはスライスの最大符号化単位に関する情報を抽出できる。言い換えれば、ビットストリームを最大符号化単位で分割して、映像データ復号化部230をして最大符号化単位ごとに映像データを復号化させる。
【0035】
符号化情報抽出部220は、映像復号化装置200が受信したビット列をパージングして、現在ピクチャーに対するヘッダから、最大符号化単位、最大深度、最大符号化単位の分割形態、サブ符号化単位の符号化モードに関する情報を抽出する。分割形態及び符号化モードに関する情報は、映像データ復号化部230に出力される。
【0036】
最大符号化単位の分割形態に関する情報は、最大符号化単位に含まれた深度によって相異なるサイズのサブ符号化単位に関する情報を含むことができ、符号化モードに関する情報は、サブ符号化単位別予測単位に関する情報、予測モードに関する情報及び変換単位に関する情報などを含む。
【0037】
映像データ復号化部230は、符号化情報抽出部で抽出された情報に基づいてそれぞれの最大符号化単位の映像データを復号化して、現在ピクチャーを復元する。最大符号化単位の分割形態に関する情報に基づいて、映像データ復号化部230は、最大符号化単位に含まれたサブ符号化単位を復号化できる。復号化過程は、イントラ予測及び動き補償を含む動き予測過程、及び周波数逆変換過程を含む。
【0038】
映像データ復号化部230は、サブ符号化単位の予測のために、サブ符号化単位別予測単位に関する情報及び予測モードに関する情報に基づいてイントラ予測またはインター予測を行える。また、映像データ復号化部230は、サブ符号化単位の変換単位に関する情報に基づいてサブ符号化単位ごとに周波数逆変換を行える。
【0039】
図3は、本発明の一実施形態による階層的符号化単位を図示する。
図3を参照すれば、本発明による階層的符号化単位は、幅x高さが64×64の符号化単位から、32×32、16×16、8×8、4×4を含む。正方形状の符号化単位以外にも、幅x高さが64×32、32×64、32×16、16×32、16×8、8×16、8×4、4×8の符号化単位が存在する。
【0040】
図3を参照すれば、解像度が1920×1080の映像データ310に対して、最大符号化単位のサイズは64×64、最大深度が2に設定されている。
【0041】
さらに他の解像度が1920×1080の映像データ320に対して、最大符号化単位のサイズは64×64、最大深度が4に設定されている。解像度が352×288のビデオデータ330に対して、最大符号化単位のサイズは16×16、最大深度が2に設定されている。
【0042】
解像度が高いか、またはデータ量が多い場合、圧縮率向上だけでなく映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、映像データ330に比べて、解像度の高い映像データ310及び320は、最大符号化単位のサイズが64×64に選択されうる。
【0043】
最大深度は、階層的符号化単位で総階層数を表す。映像データ310の最大深度は2であるため、映像データ310の符号化単位315は、長軸サイズが64の最大符号化単位から、深度が増加するにつれて長軸サイズが32、16のサブ符号化単位まで含む。
【0044】
一方、映像データ330の最大深度は2であるため、映像データ330の符号化単位335は、長軸サイズが16の最大符号化単位から、深度が増加するにつれて長軸サイズが8、4の符号化単位まで含む。
【0045】
映像データ320の最大深度は4であるため、ビデオデータ320の符号化単位325は、長軸サイズが64の最大符号化単位から、深度が増加するにつれて長軸サイズが32、16、8、4のサブ符号化単位まで含む。深度が増加するほどさらに小さなサブ符号化単位に基づいて映像を符号化するので、さらに細密な場面を含んでいる映像の符号化に好適になる。
【0046】
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部を図示する。イントラ予測部410は、現在フレーム405のうちイントラモードの予測単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの予測単位に対して、現在フレーム405及び参照フレーム495を用いてインター予測及び動き補償を行う。
【0047】
イントラ予測部410、動き推定部420及び動き補償部425から出力された予測単位に基づいてレジデュアル値が生成され、生成されたレジデュアル値は、周波数変換部430及び量子化部440を経て量子化された変換係数に出力される。
【0048】
量子化された変換係数は、逆量子化部460、周波数逆変換部470を通じて再びレジデュアル値に復元され、復元されたレジデュアル値は、デブロッキング部480及びループフィルタリング部490を経て後処理されて参照フレーム495に出力される。量子化された変換係数は、エントロピー符号化部450を経てビットストリーム455に出力される。
【0049】
本発明の一実施形態による映像符号化方法によって符号化するために、映像符号化部400の構成要素のイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490は、いずれも最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づき映像符号化過程を処理する。
【0050】
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部を図示する。ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て逆量子化されたデータに出力され、周波数逆変換部540を経てレジデュアル値に復元される。レジデュアル値は、イントラ予測部550のイントラ予測の結果または動き補償部560の動き補償結果と加算されて、符号化単位別に復元される。復元された符号化単位は、デブロッキング部570及びループフィルタリング部580を経て次の符号化単位または次のピクチャーの予測に用いられる。
【0051】
本発明の一実施形態による映像復号化方法によって復号化するために、映像復号化部400の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580が皆最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づいて映像復号化過程を処理する。
【0052】
特に、イントラ予測部550、動き補償部560は、最大符号化単位及び深度を考慮してサブ符号化単位内の予測単位及び予測モードを定め、周波数逆変換部540は、変換単位のサイズを考慮して周波数逆変換を行う。
【0053】
図6は、本発明の一実施形態による最大符号化単位、サブ符号化単位及び予測単位を図示する。
【0054】
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、映像特性を考慮して符号化、復号化を行うために、階層的な符号化単位を用いる。最大符号化単位及び最大深度は、映像の特性によって適応的に設定されるか、またはユーザの要求に応じて多様に設定される。
【0055】
本発明の一実施形態による符号化単位の階層構造600は、最大符号化単位610の高さ及び幅が64であり、最大深度が4である場合を図示する。符号化単位の階層構造600の縦軸に沿って深度が増加し、深度の増加によってサブ符号化単位620ないし650の高さ及び幅が縮少される。また、符号化単位の階層構造600の横軸に沿って、最大符号化単位610及びサブ符号化単位620ないし650の予測単位が図示されている。
【0056】
最大符号化単位610は深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が増加し、サイズ32×32の深度1のサブ符号化単位620、サイズ16×16の深度2のサブ符号化単位630、サイズ8×8の深度3のサブ符号化単位640、サイズ4×4の深度4のサブ符号化単位650が存在する。サイズ4×4の深度4のサブ符号化単位650は、最小符号化単位である。
【0057】
図6を参照すれば、それぞれの深度別に横軸に沿って予測単位の例示が図示されている。すなわち、深度0の最大符号化単位610の予測単位は、サイズ64×64の符号化単位610と同一な、または小さなサイズであるサイズ64×64の予測単位610、サイズ64×32の予測単位612、サイズ32×64の予測単位614、サイズ32×32の予測単位616でありうる。
【0058】
深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620と同一な、または小さなサイズであるサイズ32×32の予測単位620、サイズ32×16の予測単位622、サイズ16×32の予測単位624、サイズ16×16の予測単位626でありうる。
【0059】
深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630と同一な、または小さなサイズであるサイズ16×16の予測単位630、サイズ16x8の予測単位632、サイズ8x16の予測単位634、サイズ8×8の予測単位636でありうる。
【0060】
深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640と同一な、または小さなサイズであるサイズ8×8の予測単位640、サイズ8x4の予測単位642、サイズ4x8の予測単位644、サイズ4×4の予測単位646でありうる。
【0061】
最後に、深度4のサイズ4×4の符号化単位650は最小符号化単位であり、最大深度の符号化単位であり、予測単位は、サイズ4×4の予測単位650である。
【0062】
図7は、本発明の一実施形態による符号化単位及び変換単位を図示する。
【0063】
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、最大符号化単位そのままで符号化するか、または最大符号化単位より小さいか、または同じサブ符号化単位に最大符号化単位を分割して符号化する。符号化過程中に周波数変換のための変換単位のサイズは、最適の圧縮率が達成されるように選択される。例えば、現在符号化単位710が64×64サイズである時、32×32サイズの変換単位720を用いて周波数変換が行われる。
図13Aないし
図13Dと関連して後述するように、符号化単位より大きい変換単位を設定してもよい。
【0064】
図8A及び
図8Bは、それぞれ本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の分割形態を図示する。
【0065】
図8Aは、本発明の一実施形態による符号化単位及び予測単位を図示する。
図8Aの左側は、最大符号化単位810を符号化するために、本発明の一実施形態による映像符号化装置100が選択した分割形態を図示する。映像符号化装置100は、多様な形態に最大符号化単位810を分割して符号化した後、多様な分割形態の符号化結果をR−Dコストに基づいて比較して最適の分割形態を選択する。最大符号化単位810をそのまま符号化することが最適である場合には、
図8A及び
図8Bのように、最大符号化単位810を分割せずに最大符号化単位800を符号化してもよい。
【0066】
図8Aの左側を参照すれば、深度0の最大符号化単位810を、深度1以上のサブ符号化単位812、854に分割して符号化する。最大符号化単位810を4つの深度1のサブ符号化単位に分割した後、全部または一部の深度1のサブ符号化単位を、再び深度2のサブ符号化単位に分割する。
【0067】
深度1のサブ符号化単位のうち、右側上部に位置するサブ符号化単位及び左側下部に位置するサブ符号化単位が、深度2以上のサブ符号化単位に分割された。深度2以上のサブ符号化単位のうち一部は、再び深度3以上のサブ符号化単位に分割されうる。
【0068】
図8Aの右側は、最大符号化単位810に対する予測単位の分割形態を図示する。
図8Aの右側を参照すれば、最大符号化単位に対する予測単位860は、最大符号化単位810と異なって分割される。言い換えれば、サブ符号化単位それぞれに対する予測単位は、サブ符号化単位より小さい。
【0069】
例えば、深度1のサブ符号化単位のうち右側下部に位置するサブ符号化単位854に対する予測単位は、サブ符号化単位854より小さい。深度2のサブ符号化単位814、816、818、828、850、852のうち一部のサブ符号化単位815、816、850、852に対する予測単位は、サブ符号化単位より小さい。また、深度3のサブ符号化単位822、832、848に対する予測単位は、サブ符号化単位より小さい。予測単位は、それぞれのサブ符号化単位を高さまたは幅方向に半分にした形態でもあり、高さ及び幅方向に4分にした形態でもありうる。
【0070】
図8Bは、本発明の一実施形態による予測単位及び変換単位を図示する。
図8Bの左側は、
図8Aの右側に示した最大符号化単位810に対する予測単位の分割形態を図示し、
図8Bの右側は、最大符号化単位810の変換単位の分割形態を図示する。
【0071】
図8Bの右側を参照すれば、変換単位870の分割形態は、予測単位860と異なって設定される。
【0072】
例えば、深度1の符号化単位854に対する予測単位が高さを半分にした形態に選択されるとしても、変換単位は、深度1の符号化単位854のサイズと同じサイズに選択される。同様に、深度2の符号化単位814、850に対する予測単位が深度2の符号化単位814、850の高さを半分にした形態に選択されるとしても、変換単位は、深度2の符号化単位814、850の元のサイズと同じサイズに選択される。
【0073】
予測単位よりさらに小さなサイズに変換単位が選択されてもよい。例えば、深度2の符号化単位852に対する予測単位が幅を半分にした形態に選択された場合に、変換単位は、予測単位よりさらに小さなサイズである高さ及び幅を半分にした形態に選択される。最も小さな変換単位として、2×2サイズに設定してもよい。
【0074】
また、
図13Aないし
図13Dを参照して後述するように、変換単位は、符号化単位と関係なく符号化単位のサイズより大きく設定されてもよい。
【0075】
図9は、本発明のさらに他の実施形態による映像符号化装置を図示する。
図9を参照すれば、本発明の一実施形態に他の映像符号化装置900は、予測部910、変換部920、量子化部930及びエントロピー符号化部940を備える。
【0076】
予測部910は、1つまたは複数の符号化単位を、イントラ予測またはインター予測してレジデュアル値を生成する。後述するように、本発明は、複数の予測単位に含まれたレジデュアル値を1つにグループ化して周波数ドメインに変換できるところ、複数の予測単位に基づいて1つまたは複数の符号化単位を予測してレジデュアル値を生成する。周波数ドメインへの変換は、離散コサイン変換でありうる。
【0077】
図8Aと関連して前述したように、本発明の一実施形態による映像符号化方法は、1つの符号化単位が複数の予測単位を含むことができるところ、予測部910は、複数の予測単位をそれぞれ予測して、1つの符号化単位に含まれた複数の予測単位に対するレジデュアル値を生成する。
【0078】
また、予測部910は、複数の符号化単位を一回に予測できる。後述するように、本発明の一実施形態によれば、複数の符号化単位に含まれた複数の予測単位を1つにグループ化して1つの変換単に設定できるので、複数の符号化単位に含まれた複数の予測単位をそれぞれ予測してレジデュアル値を生成する。例えば、1つの最大符号化単位に含まれたあらゆるサブ符号化単位をいずれも予測することで、複数の符号化単位に対するレジデュアル値を生成できる。
【0079】
従来技術によれば、予測単位より小さいか、または同じサイズで離散コサイン変換を行うため、所定の予測単位を独立的に符号化し、再び復元して次の予測単位の予測に用いることができた。しかし、後述する本願発明の一実施形態による映像符号化方法によれば、1つまたは複数の符号化単位に含まれた予測単位を1つにグループ化して離散コサイン変換を行うため、所定の予測単位を独立的に符号化して復元できない。
図10を参照して詳細に説明する。
【0080】
図10は、本発明の一実施形態による予測方法を説明するための図である。
図10を参照すれば、1つの符号化単位1000は、複数の予測単位1010ないし1040を含む。従来技術のように予測単位より小さいか、または同じサイズで離散コサイン変換を行えば、右側下部の予測単位1040を符号化する前に、他の予測単位1010ないし1030を符号化して再び復元できる。
【0081】
したがって、従来技術によって、もし予測単位1040をイントラ予測を用いて予測するためには、予測単位1010ないし1030を符号化した後で再び復元して生成されたピクセルうち、予測単位1040に隣接するピクセルを用いて予測単位1040をイントラ予測せねばならない。
【0082】
しかし、後述する本願発明による一実施形態は、複数の予測単位を1つにグループ化して変換単位を設定し、離散コサイン変換を行う。この時、
図10の予測単位1010ないし1040が1つの変換単位でグループ化されれば、右側下部の予測単位1040も他の予測単位1010ないし1030と共に符号化されるので、右側下部の予測単位1040が符号化する前に他の予測単位1010ないし1030を符号化できない。したがって、他の予測単位1010ないし1030を符号化した後で再び復元したピクセルを用いて予測単位1040をイントラ予測出できないという問題がある。
【0083】
これらの問題を解決するために、本願発明による予測部910は、他の予測単位1010ないし1030の予測値を用いて予測単位1040を予測できる。他の予測単位1010ないし1030を符号化した後で復元したピクセル値ではない、他の予測単位1010ないし1030の予測値を用いて右側下部1040の予測単位を予測する。
【0084】
言い換えれば、1つの変換単位でグループ化される複数の予測単位のうち、イントラ予測によって予測される第1予測単位があれば、第1予測単位は、隣接する少なくとも1つの予測単位の予測値を用いてイントラ予測できる。
【0085】
また、本発明のさらに他の実施形態によれば、1つの変換単位でグループ化される複数の予測単位は、いずれもインター予測のみ用いて予測してもよい。
図10と関連して前述したように、複数の予測単位を1つの変換単位でグループ化するに際して問題になる予測単位は、イントラ予測によって予測される予測単位であるため、1つの変換単位でグループ化されるあらゆる予測単位は、インター予測のみ用いて予測できる。
【0086】
再び
図9を参照すれば、変換部920は、ピクセルドメインの映像処理単位を入力されて周波数ドメインに変換する。予測部910で生成されたレジデュアル値を周波数ドメインに変換する。
【0087】
前述したように、変換部920は、複数の予測単位をグループ化して1つの変換単位を設定し、設定された変換単位によって離散コサイン変換する。レジデュアル値は、1つの符号化単位に含まれた複数の予測単位に対するレジデュアル値でもあり、複数の符号化単位に含まれた複数の予測単位に対するレジデュアル値でもありうる。周波数ドメインに変換した結果、周波数成分等の係数が生成される。
【0088】
本発明の一実施形態によれば、周波数ドメインへの変換は離散コサイン変換であり、離散コサイン変換結果、離散コサイン係数が生成される。以下では、離散コサイン変換を例として説明するが、当業者あらば、あらゆるピクセルドメインの映像を周波数ドメインに変換するあらゆる変換に本発明が適用されうるということが容易に分かる。
【0089】
図11は、本発明の一実施形態による変換部920を図示する。
図11を参照すれば、本発明の一実施形態による変換部910は、選択部1110及び変換実行部1120を備える。
【0090】
選択部1110は、隣接する複数の予測単位を選択して1つの変換単位を設定する。前述したように従来の映像符号化装置によれば、所定の予測単位によってイントラ予測またはインター予測を行い、予測単位より小さいか、または同じサイズで離散コサイン変換を行う。言い換えれば、従来の映像符号化装置は、予測単位より小さいか、または同じ変換単位に基づいて離散コサイン変換を行った。
【0091】
しかし、それぞれの変換単位ごとに付加されるヘッダ情報のため、変換単位が小さいほど付加されるオーバーヘッドが大きくなり映像符号化の圧縮率を低下させた。これらの問題点解決するために、本発明の一実施形態による映像符号化装置900は、隣接する複数の予測単位を1つの変換単位でグループ化し、グループ化結果で生成された変換単位によって離散コサイン変換を行う。特に、隣接する複数の予測単位は、類似したレジデュアル値を含んでいる確率が高いので、隣接する複数の予測単位を合わせて1つの変換単位で離散コサイン変換すれば、符号化の圧縮率を大きく向上させる。
【0092】
したがって、選択部1110は、1つの変換単位でグループ化して離散コサイン変換を行う複数の予測単位を選択する。複数の予測単位は、隣接する複数の予測単位でありうる。
図12Aないし
図12C、
図13Aないし
図13Dを参照して詳細に説明する。
【0093】
図12Aないし
図12Cは、本発明の一実施形態による変換単位の類型を図示する。
【0094】
図12Aないし
図12Cを参照すれば、所定の符号化単位1210に対して、予測単位1220は符号化単位1210の幅を半分にした形態でありうる。符号化単位1210は、前述した最大符号化単位であっても、最大符号化単位より小さなサイズのサブ符号化単位であってもよい。
【0095】
符号化単位1210及び予測単位1220が同じ場合にも、変換単位1230ないし1250は相異なる。
図12Aに示したように、変換単位1230のサイズが予測単位1220より小さいか、または
図12Bに示したように、変換単位1240の再が予測単位1220と同一である。また、本発明の一実施形態による変換単位1250は、
図12Cに示したように、予測単位1220のサイズより大きい。
【0096】
1つの変換単位でグループ化される複数の予測単位は、
図12Aないし
図12Cのように、符号化単位に含まれた複数の予測単位であっても、相異なる符号化単位に含まれた複数の予測単位であってもよい。言い換えれば、1つ以上の符号化単位に含まれた複数の予測単位を1つの変換単位でグループ化して、周波数ドメインに変換できる。
【0097】
図13Aないし
図13Dは、本発明のさらに他の実施形態による変換単位の類型を図示する。
【0098】
図13Aに示したように、1つの最大符号化単位1300は、複数の相異なるサイズのサブ符号化単位1302ないし1308に分けられて符号化され、また、
図13Bに示したように、それぞれのサブ符号化単位1302ないし1308は、少なくとも1つの予測単位1310ないし1340を含む。
【0099】
選択部1110は、
図13Bに示したような複数の予測単位を1つにグループ化して、
図13Cに示したように、1つの変換単位1350に設定して周波数ドメインに変換できる。
【0100】
また、選択部1110は、
図13Dのように、左側半分に含まれている符号化単位1302及び1306に対する複数の予測単位1310及び1330ないし1139を、1つにグループ化して1つの変換単位1360に設定し、右側半分に含まれている符号化単位1304及び1308に対する複数の予測単位1320ないし1328及び1340を、1つにグループ化してさらに1つの変換単位1362を設定してもよい。
【0101】
再び
図11を参照すれば、選択部1110が隣接する複数の予測単位を選択する基準には制限がない。しかし、本発明の一実施形態によれば、選択部1110は、深度に基づいて変換単位を選択できる。深度とは、前述したように、現在スライスまたは現在ピクチャーの最大符号化単位からサブ符号化単位のサイズに段階的に縮少された程度をいう。
図3及び
図6と関連して前述したように、深度が大きいほどサブ符号化単位のサイズが小さいことを意味し、これにより、含まれた予測単位も小さくなる。この場合、予測単位より小さいか、または同じサイズの変換単位によって離散コサイン変換を行えば、前述したように、変換単位ごとにヘッダ情報が付加されて映像符号化の圧縮率が落ちる。
【0102】
したがって、所定深度以上のサブ符号化単位は、サブ符号化単位に含まれた予測単位をグループ化して1つの変換単位に設定し、離散コサイン変換することが望ましい。このために、選択部1110は、サブ符号化単位の深度に基づいて変換単位を設定する。例えば、選択部1110は、
図12Cに示した符号化単位1210の深度がkより大きい場合には、予測単位1220をグループ化して1つの変換単位1250に設定する。
【0103】
また、選択部1110は、最大符号化単位に所定深度以上のサブ符号化単位が複数ならば、深度が所定値以上である複数のサブ符号化単位の予測単位を1つにグループ化して、1つの変換単位で設定できる。
図13Cは、最大符号化単位の深度より大きい深度サブ符号化単位、すなわち、深度が‘1’より大きいあらゆるサブ符号化単位の予測単位を1つにグループ化して1つの変換単位に設定した例である。
【0104】
また、本発明のさらに他の実施形態によれば、選択部1010は同種の予測モードによって予測が行われた隣接する複数の予測単位を、1つの変換単位に設定できる。イントラ予測またはインター予測を用いて予測された隣接する複数の予測単位を1つの変換単位に設定する。同種の予測モードによって予測が行われた隣接する複数の予測単位は類似したレジデュアル値を含む確率が高いので、1つの変換単位でグループ化して離散コサイン変換できる。
【0105】
選択部1010が変換単位を設定すれば、変換実行部1020は、設定された変換単位によって複数の予測単位を周波数ドメインに変換する。選択された複数の予測単位を1つの変換単位で離散コサイン変換して、離散コサイン係数を生成する。
【0106】
再び
図9を参照すれば、量子化部920は、変換部910で生成された周波数成分係数、例えば、離散コサイン係数を量子化する。所定の量子化ステップによって入力された離散コサイン係数を量子化できる。
【0107】
エントロピー符号化部930は、量子化部920で量子化された離散コサイン係数をエントロピー符号化する。CABAC(Context−Adaptive Binary Arithmetic Coding)またはCAVLC(Context−Adaptive Variable Length Coding)を用いて離散コサイン係数をエントロピー符号化する。
【0108】
また、映像符号化装置900は、複数の予測単位をグループ化して生成された変換単位が離散コサイン係数を含むかどうかを表すフラッグ情報を符号化できる。離散コサイン係数を量子化した結果、エントロピー符号化する量子化された係数がない場合、すなわち、量子化された離散コサイン係数がいずれも‘0’である場合には、変換単位が離散コサイン係数を含んでいないことを表すフラッグ情報のみ符号化し、量子化された係数を別途にエントロピー符号化しない。
【0109】
本発明のさらに他の実施形態による映像符号化装置900は、相異なる変換単位に対して前述した離散コサイン変換、量子化及びエントロピー符号化を繰り返して、最適の変換単位を定められる。前述した深度または予測モードの同一性などの所定の基準によって複数の予測単位を選択するものではなく、多様な形態で複数の予測単位を選択する過程を機械的に繰り返して行って最適の変換単位を定めてもよい。最適の変換単位は、R−Dコスト(Rate−Distortion Cost)を考慮して定められるが、
図14を参照して詳細に説明する。
【0110】
図14は、本発明の一実施形態による相異なる変換単位を図示する。
図14を参照すれば、本発明による映像符号化装置900は、相異なる変換単位に対して符号化を繰り返す。
【0111】
図14に示したように、所定の符号化単位1410は、符号化単位より小さなサイズの予測単位1420に基づいて予測符号化される。予測結果で生成されたレジデュアル値は離散コサイン変換されるが、この時、
図14に示したように、相異なる変換単位に基づいて離散コサイン変換される。
【0112】
最初に図示された変換単位1430は、符号化単位1410と同じサイズの変換単位であり、符号化単位1410に含まれたあらゆる予測単位をグループ化したサイズの変換単位である。
【0113】
2番目に図示された変換単位1440は、符号化単位1410の幅を半分にしたサイズの変換単位であり、縦方向に隣接する2つの予測単位をそれぞれグループ化したサイズの変換単位である。
【0114】
3番目に図示された変換単位1450は、符号化単位1410の高さを半分にしたサイズの変換単位であり、横方向に隣接する2つの予測単位をそれぞれグループ化したサイズの変換単位である。
【0115】
4番目に図示された変換単位1450は、予測単位1420と同じサイズで変換を行う場合に用いる変換単位である。
【0116】
映像符号化装置900は、
図14に図示された変換単位に対して離散コサイン変換、量子化及びエントロピー符号化を繰り返して最適の変換単位を定められる。
【0117】
また、映像符号化装置900は、1つの符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定したか、または複数の符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定したかを表すフラッグ情報を符号化してもよい。例えば、
図12Aないし
図12Cに示したように、1つの符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定した場合には、フラッグ情報を‘0’に設定し、
図13Aないし
図13Dに示したように、複数の符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定した場合には、フラッグ情報を‘1’に設定する。
【0118】
図14は、1つの符号化単位に含まれた予測単位をグループ化して1つの変換単位に設定する場合に、最適の変換単位を定める方法を例として図示したが、複数の符号化単位に含まれた予測単位をグループ化して1つの変換単位に設定する場合にも、
図14のように互いに異なる変換単位に対して離散コサイン変換、量子化及びエントロピー符号化を繰り返して最適の変換単位を定められる。
【0119】
図15は、本発明のさらに他の実施形態による映像復号化装置を図示する。
図15を参照すれば、本発明の一実施形態による映像復号化装置1500は、エントロピー復号化部1510、逆量子化部1520、逆変換部1530及び復元部1540を備える。
【0120】
エントロピー復号化部1510は、所定の変換単位に対する周波数成分係数をエントロピー復号化する。
図12Aないし
図12C、
図13Aないし
図13Dと関連して前述したように、変換単位は、複数の予測単位をグループ化して生成された変換単位でありうる。複数の予測単位は、前述したように、隣接する複数の予測単位であり、または1つの符号化単位に含まれた複数の予測単位であるか、または相異な複数の符号化単位に含まれた複数の予測単位でありうる。
【0121】
映像符号化装置900と関連して前述したように、変換単位は、深度に基づいて隣接する複数の予測単位をグループ化した変換単位または同種の予測モード、すなわち、イントラ予測モードまたはインター予測モードによって予測が行われた隣接する複数の予測単位をグループ化した変換単位でありうる。また、
図14と関連して前述したように、複数の予測単位をグループ化する過程を機械的に繰り返して、相異なる変換単位に対して離散コサイン変換、量子化及びエントロピー復号化を繰り返して行うことで選択された最適の変換単位でありうる。
【0122】
また、エントロピー復号化部1510は、変換単位が離散コサイン係数を含んでいない場合には、量子化された係数を別途にエントロピー復号化しない。変換単位が量子化された離散コサイン係数を含まないと、所定のフラッグ情報を参照して量子化された係数を別途にエントロピー復号化しない。
【0123】
逆量子化部1520は、エントロピー復号化部1510でエントロピー復号化された周波数成分係数を逆量子化する。変換単位の符号化時に用いられた量子化ステップによって、エントロピー復号化された周波数成分係数を逆量子化する。
【0124】
逆変換部1530は、逆量子化された周波数成分係数をピクセルドメインに逆変換する。逆量子化された離散コサイン係数を逆離散コサイン変換して、ピクセルドメインの変換単位を復元する。逆変換結果、変換単位に対するレジデュアル値が復元される。
【0125】
復元された変換単位は複数の予測単位を含み、前述したように、複数の予測単位は、1つの符号化単位に含まれた複数の予測単位であるか、または相異なる複数の符号化単位に含まれた複数の予測単位でありうる。
【0126】
復元部1540は、復元された変換単位に含まれている複数の予測単位を予測して予測値を生成する。1つの変換単位でグループ化された複数の予測単位が1つの符号化単位に含まれた複数の予測単位ならば、1つの符号化単位に対する予測値が生成され、1つの変換単位でグループ化された複数の予測単位が複数の符号化単位に含まれた複数の予測単位ならば、複数の符号化単位に対する予測値が生成される。生成された予測値と逆変換部1530で復元されたレジデュアル値とを加算して、1つの符号化単位または複数の符号化単位を復元する。
【0127】
1つの符号化単位に対する予測値が生成されるか、または複数の符号化単位に対する予測値が生成されるかは、符号化時に映像符号化装置900で符号化された1つの符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定したか、または、複数の符号化単位に含まれた複数の予測単位をグループ化して変換単位を設定したかを表すフラッグ情報に基づいて判断できる。
【0128】
本発明の一実施形態によれば、
図10と関連して前述したように、1つの変換単位でグループ化される複数の予測単位がイントラ予測される予測単位を含めば、少なくとも1つの隣接する予測単位の予測値に基づいてイントラ予測を行える。また、本発明のさらに他の実施形態によれば、1つの変換単位でグループ化される複数の予測単位は、いずれもインター予測のみを用いて予測される。
【0129】
図16は、本発明の一実施形態による映像符号化方法を説明するためのフローチャートである。
図16を参照すれば、段階1610で、本発明の一実施形態による映像符号化装置は、1つまたは複数の符号化単位に対して予測を行ってレジデュアル値を生成する。
【0130】
1つの変換単位で設定される複数の予測単位は、1つの符号化単位に含まれた複数の予測単位でもあり、複数の符号化単位に含まれた複数の予測単位でもありうる。したがって、複数の予測単位が1つの符号化単位に含まれた複数の予測単位ならば、1つの符号化単位に対して予測を行ってレジデュアル値を生成し、複数の予測単位が複数の符号化単位に含まれた複数の予測単位ならば、複数の符号化単位に対して予測を行ってレジデュアル値を生成する。
【0131】
複数の予測単位を一回に予測してレジデュアル値を生成する方法は、
図10と関連して前述した。
【0132】
段階1620で、映像符号化装置は、複数の予測単位を選択して1つの変換単位を設定する。複数の予測単位は、1つの符号化単位に含まれた複数の予測単位でもあり、複数の符号化単位に含まれた複数の予測単位でもありうる。深度に基づいて隣接する複数の予測単位を選択するか、または同種の予測モードで予測が行われた隣接する複数の予測単位を選択することができる。
【0133】
段階1630で、映像符号化装置は、段階1620で設定された変換単位によって複数の予測単位を周波数ドメインに変換する。複数の予測単位をグループ化して設定された1つの変換単位を離散コサイン変換することで、離散コサイン係数を生成する。
【0134】
段階1640で、映像符号化装置は、段階1630で生成された周波数成分係数、すなわち、離散コサイン係数を所定の量子化ステップによって量子化する。
【0135】
段階1650で、映像符号化装置は、段階1640で量子化された周波数成分係数をエントロピー符号化する。CABACまたはCAVLCを用いて離散コサイン係数をエントロピー符号化する。
【0136】
本発明のさらに他の実施形態による映像符号化方法は、
図14と関連して前述したように、相異なる変換単位に対して段階1610ないし1640を繰り返して、最適の変換単位を設定する段階をさらに含む。
図14に示したような相異なる変換単位に対して、離散コサイン変換、量子化及びエントロピー符号化を繰り返して最適の変換単位を設定できる。
【0137】
図17は、本発明の一実施形態による映像復号化方法を説明するためのフローチャートである。
図17を参照すれば、段階1710で、本発明の一実施形態による映像復号化装置は、所定の変換単位に対する周波数成分係数をエントロピー復号化する。周波数成分係数は、離散コサイン係数でありうる。変換単位は、複数の予測単位をグループ化して設定された変換単位でありうる。複数の予測単位は、前述したように、隣接する複数の予測単位でもあり、1つの符号化単位に含まれた複数の予測単位であるか、または相異なる複数の符号化単位に含まれた複数の予測単位でありうる。
【0138】
段階1720で、映像復号化装置は、段階1710でエントロピー復号化された周波数成分係数を逆量子化する。符号化時に用いられた量子化ステップを用いて離散コサイン係数を逆量子化する。
【0139】
段階1730で、映像復号化装置は、段階1730で逆量子化された周波数成分係数をピクセルドメインに逆変換して変換単位を復元する。復元された変換単位は、複数の予測単位をグループ化して設定された変換単位である。変換単位に含まれたレジデュアル値が復元される。複数の予測単位が1つの符号化単位に含まれた複数の予測単位ならば、1つの符号化単位に対するレジデュアル値が復元され、複数の予測単位が複数の符号化単位に含まれた複数の予測単位ならば、複数の符号化単位に対するレジデュアル値が復元される。
【0140】
前述したように、変換単位は、深度に基づいて隣接する複数の予測単位をグループ化して設定された変換単位、または、同じ予測モードによって予測が行われた隣接する複数の予測単位をグループ化して設定された変換単位でありうる。
【0141】
段階1740で、映像復号化装置は、段階1730で復元された変換単位に含まれたレジデュアル値に基づいて1つまたは複数の符号化単位を復元する。1つまたは複数の符号化単位を予測して予測値を生成し、生成された予測値を、段階1730で復元されたレジデュアル値と加算して1つまたは複数の符号化単位を復元する。1つまたは複数の符号化単位に含まれた複数の予測単位を予測する方法は、
図10と関連して前述した。
【0142】
変換単位が、1つの符号化単位に含まれた複数の予測単位をグループ化して設定された変換単位ならば、1つの符号化単位が復元され、複数の符号化単位に含まれた複数の予測単位をグループ化して設定された変換単位ならば、複数の符号化単位が復元される。
【0143】
以上のように、本発明は、たとえ限定された実施形態及び図面により説明されたとしても、本発明が前記の実施形態に限定されるものではなく、当業者ならば、これらの記載から多様な修正及び変形ができるであろう。したがって、本発明の思想は、特許請求の範囲のみにより把握され、これと均等または等価的な変形はいずれも本発明の思想の範ちゅうに属するといえる。また、本発明によるシステムは、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現できる。
【0144】
例えば、本発明の例示的な実施形態による映像符号化装置、映像復号化装置、映像符号化部及び映像復号化部は、
図1、2、4、5、9、11、15に示したような装置のそれぞれのユニットにカップリングされたバス、前記バスに結合された少なくとも1つのプロセッサーを備える。また、命令、受信されたメッセージまたは生成されたメッセージを保存するために前記バスに結合されて、前述したような命令を行うための少なくとも1つのプロセッサーにカップリングされたメモリを備える。
【0145】
また、コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるあらゆる種類の記録装置を含む。記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。またコンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードが保存されて行われる。また、コンピュータで読み取り可能な記録媒体は、インターネットなどのネットワークを通じる通信のためのキャリアウェーブまたは信号でもありうる。