特許第6574025号(P6574025)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サムスン エレクトロニクス カンパニー リミテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6574025
(24)【登録日】2019年8月23日
(45)【発行日】2019年9月11日
(54)【発明の名称】ビデオ復号化方法及びビデオ復号化装置
(51)【国際特許分類】
   H04N 19/129 20140101AFI20190902BHJP
   H04N 19/157 20140101ALI20190902BHJP
   H04N 19/18 20140101ALI20190902BHJP
   H04N 19/46 20140101ALI20190902BHJP
【FI】
   H04N19/129
   H04N19/157
   H04N19/18
   H04N19/46
【請求項の数】5
【全頁数】24
(21)【出願番号】特願2018-113773(P2018-113773)
(22)【出願日】2018年6月14日
(62)【分割の表示】特願2017-90992(P2017-90992)の分割
【原出願日】2011年7月8日
(65)【公開番号】特開2018-174551(P2018-174551A)
(43)【公開日】2018年11月8日
【審査請求日】2018年6月14日
(31)【優先権主張番号】61/362,844
(32)【優先日】2010年7月9日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】503447036
【氏名又は名称】サムスン エレクトロニクス カンパニー リミテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】リ,ベ−グン
(72)【発明者】
【氏名】ソン,ユ−ミ
【審査官】 岩井 健二
(56)【参考文献】
【文献】 特表2005−530375(JP,A)
【文献】 国際公開第2011/053020(WO,A2)
【文献】 国際公開第2010/054178(WO,A1)
【文献】 国際公開第2010/018138(WO,A1)
【文献】 Martin Winken et al.,Description of video coding technology proposal by Fraunhofer HHI,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,1st Meeting: Dresden, DE,2010年 4月,JCTVC-A116,pp.1-17
【文献】 Kemal Ugur et al.,Description of video coding technology proposal by Tandberg, Nokia, Ericsson,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,1st Meeting: Dresden, DE,2010年 4月,JCTVC-A119,pp.1-12
【文献】 Sunil Lee et al.,Efficient coefficient coding method for large transform in VLC mode,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,3rd Meeting: Guangzhou, CN,2010年10月,JCTVC-C210,pp.1-6
【文献】 J. Sole et al.,Parallel Context Processing for the significance map in high coding efficiency,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR,2011年 1月,JCTVC-D262,pp.1-4
【文献】 Thomas Wiegand et al.,WD3: Working Draft 3 of High-Efficiency Video Coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 6月,JCTVC-E603_d8,pp.i-vii,28-31,46-52,74-82,128-132,URL,http://phenix.it-sudparis.eu/jct/doc_end_user/documents/5_Geneva/wg11/JCTVC-E603-v8.zip
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 − 19/98
(57)【特許請求の範囲】
【請求項1】
現在変換ブロック内の変換係数のうち、最終有効係数のx座標を示すxインデックス及び前記最終有効係数のy座標を示すyインデックスをビットストリームから獲得する段階と、
前記xインデックス及び前記yインデックスに基づいて前記最終有効係数のスキャンインデックスを決定する段階と、
前記最終有効係数のレベル情報を獲得する段階と、
前記最終有効係数のレベル情報を用いて、前記最終有効係数を復元する段階と、
前記変換係数のうち、前記最終有効係数のスキャンインデックスよりも小さいスキャンインデックスを有する第1変換係数の有効係数フラグを前記ビットストリームから獲得する段階と、
前記有効係数フラグを用いて前記第1変換係数を復元する段階と、
前記最終有効係数及び前記第1変換係数を用いて前記現在変換ブロックを逆変換する段階と、を含み、
前記有効係数フラグは、前記第1変換係数のレベルが0であるか否かを示し、
前記ビットストリームから前記第1変換係数のレベルと前記第1変換係数の符号値を別途に獲得し、前記獲得された前記第1変換係数のレベルと前記第1変換係数の符号値を用いて、前記第1変換係数が復元されることを特徴とするビデオ復号化方法。
【請求項2】
前記xインデックスは、前記変換ブロックの最左上側係数の位置から横軸方向に沿ってx番目(xは、0以上の整数)座標を示し、
前記yインデックスは、前記変換ブロックの最左上側係数の位置から縦軸方向に沿ってy番目(yは、0以上の整数)座標を示すことを特徴とする請求項1に記載のビデオ復号化方法。
【請求項3】
前記xインデックス及びyインデックスを獲得する段階は、
前記ビットストリームに対して復号化を行って前記xインデックスを獲得する段階と、
前記ビットストリームに対して復号化を行って前記yインデックスを獲得する段階と、を含むことを請求項1に記載のビデオ復号化方法。
【請求項4】
前記最終有効係数は、前記変換ブロックの前記変換係数のうち、レベルが0ではない係数のうち、1つであり、
前記x座標及び前記y座標の基準点は、前記変換ブロックの左上端地点であることを特徴とする請求項1に記載のビデオ復号化方法。
【請求項5】
変換ブロックを逆変換するためのプロセッサを含み、
前記プロセッサは、
現在変換ブロック内の変換係数のうち、最終有効係数のx座標を示すxインデックス及び前記最終有効係数のy座標を示すyインデックスをビットストリームから獲得し、
前記xインデックス及び前記yインデックスに基づいて前記最終有効係数のスキャンインデックスを決定し、
前記最終有効係数のレベル情報を獲得し、
前記最終有効係数のレベル情報を用いて前記最終有効係数を復元し、
前記変換係数のうち、前記最終有効係数のスキャンインデックスよりも小さいスキャンインデックスを有する第1変換係数の有効係数フラグを前記ビットストリームから獲得し、
前記有効係数フラグを用いて前記第1変換係数を復元し、
前記最終有効係数、及び前記第1変換係数を用いて、前記現在変換ブロックを逆変換し、
前記有効係数フラグは、前記第1変換係数のレベルが0であるか否かを示し、
前記ビットストリームから前記第1変換係数のレベルと前記第1変換係数の符号値を別途に獲得し、前記獲得された前記第1変換係数のレベルと前記第1変換係数の符号値を用いて、前記第1変換係数が復元されることを特徴とするビデオ復号化装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、変換係数のエントロピ符号化及び復号化に係り、さらに詳細には、変換ブロック内の最後の有効変換係数の位置を効率的にエントロピ符号化、復号化する方法及びその装置に関する。
【背景技術】
【0002】
H.264及びMPEG−4のような、現在国際ビデオコーディング標準で、ビデオ信号は、シーケンス、フレーム、スライス、マクロブロック及びブロックに階層的に分割され、ブロックは、最小処理ユニットになる。エンコーディング側面で、イントラフレーム予測またはインターフレーム予測を介して、ブロックの残差データが獲得される。また、残差データは、変換、量子化、スキャニング、ランレングス・コーディング(run length coding)及びエントロピ・コーディングを介して圧縮される。デコーディング側面で、処理手続きは反対になる。まず、エントロピ・コーディング時に生成された変換ブロックの係数が、ビートストリームから抽出される。その後、逆量子化及び逆変換を介して、ブロックの残差データは再構成され、予測情報は、ブロックのビデオデータを再構成するために使われる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明が解決しようとする課題は、大サイズの変換ブロック内の最後の有効変換係数の位置を効率的にエントロピ符号化及び復号化するためのものである。
【課題を解決するための手段】
【0004】
本発明の一実施形態によれば、変換ブロック内の最後の有効変換係数の位置を変換ブロック内の横軸方向での相対的位置及び縦軸方向への相対的位置を利用して符号化する。
【発明の効果】
【0005】
本発明によれば、大サイズの変換ブロック内に具備された最後の有効変換係数の位置を効率的に表現することができ、最後の有効変換係数の位置を、変換係数の復号化過程と独立して遂行することができる。
【図面の簡単な説明】
【0006】
図1】本発明の一実施形態による映像符号化装置を図示する図面である。
図2】本発明の一実施形態による映像復号化装置を図示する図面である。
図3】本発明の一実施形態による階層的符号化単位を図示する図面である。
図4】本発明の一実施形態による符号化単位に基づいた映像符号化部を図示する図面である。
図5】本発明の一実施形態による符号化単位に基づいた映像復号化部を図示する図面である。
図6】本発明の一実施形態による最大符号化単位、サブ符号化単位及び予測単位を図示する図面である。
図7】本発明の一実施形態による、符号化単位及び変換単位を図示する図面である。
図8A】本発明の一実施形態による、符号化単位、予測単位及び変換単位の分割形態を図示する図面である。
図8B】本発明の一実施形態による、符号化単位、予測単位及び変換単位の分割形態を図示する図面である。
図9】本発明の一実施形態による変換係数のエントロピ符号化方法を示したフローチャートである。
図10】本発明の実施形態による変換係数のエントロピ符号化過程を説明するための参照図である。
図11】本発明の一実施形態によるエントロピ符号化装置の具体的な構成を示したブロック図である。
図12】本発明の一実施形態によるCABAB符号化装置のブロック図である。
図13】本発明の一実施形態による最後の有効変換係数の位置の符号化のためのコンテクスト選択過程を説明するための参照図である。
図14図10に対応するシグニフィカンス・マップを示す図面である。
図15図10の変換ブロックに具備された有効変換係数のレベル値を符号化する過程を説明するための参照図である。
図16】本発明の一実施形態によって利用されるVLCテーブルの一例を示した図面である。
図17】本発明の他の実施形態による変換係数のエントロピ符号化方法を説明するための参照図である。
図18A】本発明のさらに他の実施形態による変換係数のエントロピ符号化方法を説明するための参照図である。
図18B】本発明のさらに他の実施形態による変換係数のエントロピ符号化方法を説明するための参照図である。
図19】本発明の一実施形態による変換係数のエントロピ復号化方法を示したフローチャートである。
図20】本発明の一実施形態によるエントロピ復号化装置の具体的な構成を示したブロック図である。
【発明を実施するための形態】
【0007】
本発明の一実施形態による変換係数のエントロピ符号化方法は、所定スキャニング順序によって、所定サイズの変換ブロックに具備された変換係数のうち、0ではない最後の有効変換係数の位置を決める段階と、前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置を利用して、前記最後の有効変換係数の位置を符号化する段階と、を含むことを特徴とする。
本発明の一実施形態による変換係数のエントロピ復号化方法は、受信されたビットストリームから、所定スキャニング順序によって、変換ブロックに具備された0ではない最後の有効変換係数の前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置に係わる情報を抽出する段階と、前記横軸方向及び縦軸方向への相対的位置情報を復号化し、前記最後の有効変換係数の位置を決定する段階と、を含むことを特徴とする。
【0008】
本発明の一実施形態による変換係数のエントロピ符号化装置は、所定スキャニング順序によって、所定サイズの変換ブロックに具備された変換係数のうち、0ではない最後の有効変換係数の位置を決定し、前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置を利用して、前記最後の有効変換係数の位置を符号化するエントロピ符号化部を含むことを特徴とする。
【0009】
本発明の一実施形態による変換係数のエントロピ復号化装置は、受信されたビットストリームから、所定スキャニング順序によって、変換ブロックに具備された0ではない最後の有効変換係数の前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置に係わる情報を抽出し、前記横軸方向及び縦軸方向への相対的位置情報を復号化し、前記最後の有効変換係数の位置を決定するエントロピ復号化部を含むことを特徴とする。
【0010】
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。
【0011】
図1は、本発明の一実施形態による映像符号化装置を図示している。図1を参照すれば、本発明の一実施形態による映像符号化装置100は、最大符号化単位分割部110、符号化深度決定部120、映像データ符号化部130及び符号化情報符号化部140を含む。
【0012】
最大符号化単位分割部110は、最大サイズの符号化単位である最大符号化単位に基づいて、現在フレームまたは現在スライスを分割することができる。現在フレームまたは現在スライスを、少なくとも1つの最大符号化単位に分割することができる。
【0013】
本発明の一実施形態によれば、最大符号化単位及び深度を利用して、符号化単位が表現される。前述のように、最大符号化単位は、現在フレームの符号化単位のうち、大きさが最大である符号化単位を示し、深度は、符号化単位が階層的に縮小された程度を示す。深度が大きくなりながら、符号化単位は、最大符号化単位から最小符号化単位まで縮小され、最大符号化単位の深度は、最小深度に定義され、最小符号化単位の深度は、最大深度に定義される。最大符号化単位は、深度が大きくなるにつれて、深度別符号化単位の大きさは、低減するので、k深度のサブ符号化単位は、kより大きい深度の複数個のサブ符号化単位を含んでもよい。
【0014】
符号化されるフレームの大きさが大きくなるにつれて、さらに大きい単位に映像を符号化すれば、さらに高い映像圧縮率で映像を符号化することができる。しかし、符号化単位を大きくし、その大きさを固定させてしまえば、次に変わる映像の特性を反映させ、効率的に映像を符号化することができない。
【0015】
例えば、海または空に係わる平坦な領域を符号化するときには、符号化単位を大きくするほど、圧縮率が向上するが、人またはビルに係わる複雑な領域を符号化するときには、符号化単位を小さくするほど圧縮率が向上する。
【0016】
このために、本発明の一実施形態は、フレームまたはスライスごとに異なる大きさの最大映像符号化単位を設定し、最大深度を設定する。最大深度は、符号化単位が縮小される最大回数を意味するので、最大深度によって、最大映像符号化単位に含まれた最小符号化単位サイズを可変的に設定することができるのである。
【0017】
符号化深度決定部120は、最大深度を決定する。最大深度は、R−Dコスト(rate−distortion cost)計算に基づいて決定される。最大深度は、フレームまたはスライスごとに異なるように決定されるか、あるいはそれぞれの最大符号化単位ごとに異なるように決定されもする。決定された最大深度は、符号化情報符号化部140に出力され、最大符号化単位別映像データは、映像データ符号化部130に出力される。
【0018】
最大深度は、最大符号化単位に含まれる最小サイズの符号化単位、すなわち、最小符号化単位を意味する。言い換えれば、最大符号化単位は、異なる深度によって異なるサイズのサブ符号化単位に分割される。図8A及び図8Bを参照して詳細に後述する。また、最大符号化単位に含まれた異なるサイズのサブ符号化単位は、異なるサイズの処理単位に基づいて、予測または直交変換される。言い換えれば、映像符号化装置100は、映像符号化のための複数の処理段階を、多様な大きさ及び多様な形態の処理単位に基づいて遂行することができる。映像データの符号化のためには、予測、直交変換、エントロピ符号化などの処理段階を経るが、全ての段階にわたって、同一サイズの処理単位が利用されもし、段階別に異なるサイズの処理単位を利用することができる。
【0019】
例えば、映像符号化装置100は、所定の符号化単位を予測するために、符号化単位と異なる処理単位を選択することができる。
【0020】
符号化単位の大きさが、2Nx2N(ただし、Nは正の整数)である場合、予測のための処理単位は、2Nx2N、2NxN、Nx2N、NxNなどである。言い換えれば、符号化単位の高さまたは幅のうち、少なくとも一つを半分にする形態の処理単位を基にして動き予測が行われる。以下、予測の基になる処理単位を、「予測単位」とする。
【0021】
予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つであり、特定予測モードは、特定サイズまたは形態の予測単位についてのみ遂行される。例えば、イントラモードは、正方形である2Nx2N,NxNサイズの予測単位についてのみ遂行される。また、スキップモードは、2Nx2Nサイズの予測単位についてのみ遂行される。符号化単位内部に複数の予測単位があるならば、それぞれの予測単位について予測を行い、符号化誤差が最小である予測モードが選択される。
【0022】
また、映像符号化装置100は、符号化単位と異なるサイズの処理単位に基づいて、映像データを直交変換することができる。符号化単位の直交変換のために、符号化単位より小さいか、あるいはそれと同じ大きさのデータ単位を基にして、直交変換が行われる。以下、直交変換の基になる処理単位を「変換単位」とする。
【0023】
符号化深度決定部120は、ラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate−distortion optimization)を利用して、最大符号化単位に含まれたサブ符号化単位を決定することができる。言い換えれば、最大符号化単位が、いかなる形態の複数のサブ符号化単位に分割されるかを決定することができるが、ここで、複数のサブ符号化単位は、深度によって大きさが異なる。その後、映像データ符号化部130は、符号化深度決定部120で決定された分割形態に基づいて、最大符号化単位を符号化してビットストリームを出力する。
【0024】
符号化情報符号化部140は、符号化深度決定部120で決定された最大符号化単位の符号化モードに係わる情報を符号化する。最大符号化単位の分割形態に係わる情報、最大深度に係わる情報、及び深度別サブ符号化単位の符号化モードに係わる情報を符号化してビットストリームを出力する。サブ符号化単位の符号化モードに係わる情報は、サブ符号化単位の予測単位に係わる情報、予測単位別予測モード情報、サブ符号化単位の変換単位に係わる情報などを含んでもよい。
【0025】
最大符号化単位の分割形態に係わる情報は、それぞれの符号化単位について分割いかんを示す情報であってもよい。例えば、最大符号化単位を分割して符号化する場合、最大符号化単位について分割いかんを示す情報を符号化し、最大符号化単位を分割して生成されたサブ符号化単位をさらに分割して符号化する場合にも、それぞれのサブ符号化単位について分割いかんを示す情報を符号化する。分割いかんを示す情報は、分割いかんを示すフラグ情報であってもよい。
【0026】
最大符号化単位ごとに異なるサイズのサブ符号化単位が存在し、それぞれのサブ符号化単位ごとに符号化モードに係わる情報が決まらなければならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに係わる情報が決定される。
【0027】
映像符号化装置100は、深度が大きくなるにつれて、最大符号化単位を、高さ及び幅を半分にしてサブ符号化単位を生成することができる。すなわち、k深度の符号化単位の大きさが2Nx2Nであるならば、k+1深度の符号化単位の大きさは、NxNである。
【0028】
従って、一実施形態による映像符号化装置100は、映像の特性を考慮した最大符号化単位の大きさ及び最大深度を基にして、それぞれの最大符号化単位ごとに、最適の分割形態を決定することができる。映像特性を考慮して、可変的に最大符号化単位の大きさを調節し、異なる深度のサブ符号化単位に最大符号化単位を分割して映像を符号化することにより、多様な解像度の映像をさらに効率的に符号化することができる。
【0029】
図2は、本発明の一実施形態による映像復号化装置を図示している。図2を参照すれば、本発明の一実施形態による映像復号化装置200は、映像データ獲得部210、符号化情報抽出部220及び映像データ復号化部230を含む。
【0030】
映像関連データ獲得部210は、映像復号化装置200が受信したビットストリームをパージングし、最大符号化単位別に映像データを獲得し、映像データ復号化部230に出力する。映像データ獲得部210は、現在フレームまたはスライスに係わるヘッダから、現在フレームまたはスライスの最大符号化単位に係わる情報を抽出することができる。言い換えれば、ビットストリームを最大符号化単位に分割し、映像データ復号化部230が最大符号化単位ごとに映像データを復号化するようにする。
【0031】
符号化情報抽出部220は、映像復号化装置200が受信したビット列をパージングし、現在フレームに係わるヘッダから、最大符号化単位、最大深度、最大符号化単位の分割形態、サブ符号化単位の符号化モードに係わる情報を抽出する。分割形態及び符号化モードに係わる情報は、映像データ復号化部230に出力される。
【0032】
最大符号化単位の分割形態に係わる情報は、最大符号化単位に含まれた深度によって異なるサイズのサブ符号化単位に係わる情報を含んでもよい。前述のように、分割形態に係わる情報は、それぞれの符号化単位について符号化された分割いかんを示す情報(例えば、フラグ情報)でもある。符号化モードに係わる情報は、サブ符号化単位別予測単位に係わる情報、予測モードに係わる情報及び変換単位に係わる情報などを含んでもよい。
【0033】
映像データ復号化部230は、符号化情報抽出部で抽出された情報に基づいて、それぞれの最大符号化単位の映像データを復号化して現在フレームを復元する。
【0034】
最大符号化単位の分割形態に係わる情報に基づいて、映像データ復号化部230は、最大符号化単位に含まれたサブ符号化単位を復号化することができる。復号化過程は、イントラ予測過程及び動き補償を含むインター予測過程、並びに直交逆変換過程を含んでもよい。
【0035】
映像データ復号化部230は、サブ符号化単位の予測のために、サブ符号化単位別予測単位に係わる情報及び予測モードに係わる情報に基づいて、イントラ予測またはインター予測を遂行することができる。また、映像データ復号化部230は、サブ符号化単位の変換単位に係わる情報に基づいて、サブ符号化単位ごとに直交逆変換を行うことができる。
【0036】
図3は、本発明の一実施形態による階層的符号化単位を図示している。図3を参照すれば、本発明による階層的符号化単位は、幅x高さが64x64である符号化単位から、32x32、16x16、8x8及び4x4を含んでもよい。正方形状の符号化単位以外にも、幅x高さが64x32、32x64、32x16、16x32、16x8、8x16、8x4、4x8である符号化単位が存在する。
【0037】
図3を参照すれば、解像度が1920x1080である映像データ310について、最大符号化単位の大きさが64x64、最大深度が2に設定されている。
【0038】
解像度が1920x1080である他の映像データ320について、最大符号化単位の大きさが64x64、最大深度が4に設定されている。解像度が352x288であるビデオデータ330について、最大符号化単位の大きさが16x16、最大深度が2に設定されている。
【0039】
解像度が高いか、あるいはデータ量が多い場合、圧縮率向上だけではなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、映像データ330に比べ、解像度が高い映像データ310及び320は、最大符号化単位の大きさが64x64に選択される。
【0040】
最大深度は、階層的符号化単位で総階層数を示す。映像データ310の最大深度が2であるので、映像データ310の符号化単位315は、長軸サイズが64である最大符号化単位から、深度が増加するにつれて、長軸サイズが32、16であるサブ符号化単位まで含んでもよい。
【0041】
一方、映像データ330の最大深度が2であるので、映像データ330の符号化単位335は、長軸サイズが16である最大符号化単位から、深度が増加するにつれて、長軸サイズが8、4である符号化単位まで含んでもよい。
【0042】
映像データ320の最大深度が4であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、深度が増加するにつれて、長軸サイズが32、16、8、4であるサブ符号化単位まで含んでもよい。深度が増加するほど、さらに小さいサブ符号化単位に基づいて映像を符号化するので、さらに細密な場面を含んでいる映像を符号化するのに適する。
【0043】
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部を図示している。イントラ予測部410は、現在フレーム405において、イントラモードの予測単位についてイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの予測単位について、現在フレーム405及び参照フレーム495を利用して、インター予測及び動き補償を行う。
【0044】
イントラ予測部410、動き推定部420及び動き補償部425から出力された予測単位に基づいて残差値が生成され、生成された残差値は、直交変換部430及び量子化部440を経て、量子化された変換係数として出力される。
【0045】
量子化された変換係数は、逆量子化部460、周波数逆変換部470を介して再び残差値に復元され、復元された残差値は、デブロッキング部480及びループ・フィルタリング部490を経て後処理され、参照フレーム495として出力される。量子化された変換係数は、エントロピ符号化部450を経て、ビットストリーム455として出力される。
【0046】
本発明の一実施形態による映像符号化方法によって符号化するために、映像符号化部400の構成要素である、イントラ予測部410、動き推定部420、動き補償部425、直交変換部430、量子化部440、エントロピ符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループ・フィルタリング部490は、いずれも最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づいて映像符号化過程を処理する。
【0047】
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部を図示している。
【0048】
ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化情報がパージングされる。符号化された映像データは、エントロピ復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、残差値に復元される。残差値は、イントラ予測部550のイントラ予測の結果、または動き補償部560の動き補償結果と加算され、符号化単位別に復元される。復元された符号化単位は、デブロッキング部570及びループ・フィルタリング部580を経て、次の符号化単位または次のフレームの予測に利用される。
【0049】
本発明の一実施形態による映像復号化方法によって復号化するために、映像復号化部400の構成要素である、パージング部510、エントロピ復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループ・フィルタリング部580が、いずれも最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づいて、映像復号化過程を処理する。
【0050】
特に、イントラ予測部550、動き補償部560は、最大符号化単位及び深度を考慮して、サブ符号化単位内の予測単位及び予測モードを決定し、周波数逆変換部540は、変換単位の大きさを考慮して、直交逆変換を行う。
【0051】
図6は、本発明の一実施形態による最大符号化単位、サブ符号化単位及び予測単位を図示している。
【0052】
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、映像特性を考慮して、符号化、復号化を行うために、階層的な符号化単位を利用する。最大符号化単位及び最大深度は、映像の特性によって適応的に設定されるか、あるいはユーザの要求によって多様に設定される。
【0053】
本発明の一実施形態による符号化単位の階層構造600は、最大符号化単位610の高さ及び幅が64であり、最大深度が4である場合を図示している。符号化単位の階層構造600の縦軸に沿って深度が増加し、深度の増加によって、サブ符号化単位620ないし650の幅及び高さが縮小される。また、符号化単位の階層構造600の横軸に沿って、最大符号化単位610及びサブ符号化単位620ないし650の予測単位が図示されている。
【0054】
最大符号化単位610は、深度が0であり、符号化単位の大きさ、すなわち、幅及び高さが64x64である。縦軸に沿って深度が増加し、サイズ32x32である深度1のサブ符号化単位620、サイズ16x16である深度2のサブ符号化単位630、サイズ8x8である深度3のサブ符号化単位640、サイズ4x4である深度4のサブ符号化単位650が存在する。サイズ4x4である深度4のサブ符号化単位650は、最小符号化単位である。
【0055】
図6を参照すれば、それぞれの深度別に、横軸に沿って予測単位の例示が図示されている。すなわち、深度0の最大符号化単位610の予測単位は、サイズ64x64の符号化単位610と同一であるか、あるいはそれよりも小サイズであるサイズ64x64の予測単位610、サイズ64x32の予測単位612、サイズ32x64の予測単位614、サイズ32x32の予測単位616でもある。
【0056】
深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620と同一であるか、あるいはそれよりも小サイズであるサイズ32x32の予測単位620、サイズ32x16の予測単位622、サイズ16x32の予測単位624、サイズ16x16の予測単位626でもある。
【0057】
深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630と同一であるか、あるいはそれよりも小サイズであるサイズ16x16の予測単位630、サイズ16x8の予測単位632、サイズ8x16の予測単位634、サイズ8x8の予測単位636でもある。
【0058】
深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640と同一であるか、あるいはそれよりも小サイズであるサイズ8x8の予測単位640、サイズ8x4の予測単位642、サイズ4x8の予測単位644、サイズ4x4の予測単位646でもある。
【0059】
最後に、深度4のサイズ4x4の符号化単位650は、最大深度の符号化単位であり、予測単位は、サイズ4x4の予測単位650である。しかし、最大深度の符号化単位であるとしても、必ずしも符号化単位と予測単位とのサイズが同一である必要はく、他の符号化単位610ないし650と同様に、符号化単位より小サイズの予測単位に分割して予測を行うこともできる。
【0060】
図7は、本発明の一実施形態による、符号化単位及び変換単位を図示している。
【0061】
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、最大符号化単位そのまま符号化するか、最大符号化単位より小さいか、あるいはそれと同じサブ符号化単位に最大符号化単位を分割して符号化する。符号化過程のうち、直交変換のための変換単位の大きさも、符号化単位及び予測単位と無関係に、最も高い圧縮率のための大きさに選択される。例えば、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して、直交変換が行われる。また、符号化単位より大きい変換単位を設定することもできる。
【0062】
図8A及び図8Bは、本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の分割形態を図示している。
【0063】
図8Aは、本発明の一実施形態による符号化単位及び予測単位を図示している。図8Aの左側は、最大符号化単位810を符号化するために、本発明の一実施形態による映像符号化装置100が選択した分割形態を図示している。映像符号化装置100は、多様な形態に最大符号化単位810を分割し、符号化した後で多様な分割形態の符号化結果をR−Dコストに基づいて比較し、最適の分割形態を選択する。最大符号化単位810をそのまま符号化することが最適である場合には、図8A及び図8Bのように、最大符号化単位810を分割せずに、最大符号化単位800を符号化することもできる。
【0064】
図8Aの左側を参照すれば、深度0である最大符号化単位810を、深度1以上のサブ符号化単位に分割して符号化する。最大符号化単位810を、4つの深度1のサブ符号化単位に分割した後、全部または一部の深度1のサブ符号化単位を、さらに深度2のサブ符号化単位に分割する。
【0065】
深度1のサブ符号化単位のうち、右側上部に位置したサブ符号化単位、及び左側下部に位置したサブ符号化単位が、深度2以上のサブ符号化単位に分割される。深度2以上のサブ符号化単位のうち一部は、さらに深度3以上のサブ符号化単位に分割される。
【0066】
図8Aの右側は、最大符号化単位810に係わる予測単位の分割形態を図示している。図8Aの右側を参照すれば、最大符号化単位に係わる予測単位860は、最大符号化単位810と異なるように分割される。言い換えれば、サブ符号化単位それぞれに係わる予測単位は、サブ符号化単位より小さくもある。
【0067】
例えば、深度1のサブ符号化単位のうち、右側下部に位置したサブ符号化単位854に係わる予測単位は、サブ符号化単位854より小さくもある。深度2のサブ符号化単位814,816,818,828,850,852のうち、一部サブ符号化単位815,816,850,852に係わる予測単位は、サブ符号化単位より小さくもある。また、深度3のサブ符号化単位822,832,848に係わる予測単位は、サブ符号化単位より小さくもある。予測単位は、それぞれのサブ符号化単位を、高さまたは幅方向に半分にした形態でもあり、高さ及び幅方向に4分した形態でもある。
【0068】
図8Bは、本発明の一実施形態による予測単位及び変換単位を図示している。図8Bの左側は、図8Aの右側に図示された最大符号化単位810に係わる予測単位の分割形態を図示し、図8Bの右側は、最大符号化単位810の変換単位の分割形態を図示している。
【0069】
図8Bの右側を参照すれば、変換単位870の分割形態は、予測単位860と異なるように設定されもする。
【0070】
例えば、深度1の符号化単位854に係わる予測単位が、高さを半分にした形態に選択されても、変換単位は、深度1の符号化単位854の大きさと同一サイズに選択されもする。同様に、深度2の符号化単位814,850に係わる予測単位が、深度2の符号化単位814,850の高さを半分にした形態に選択されても、変換単位は、深度2の符号化単位814,850の本来サイズと同一サイズに選択されもする。
【0071】
予測単位よりさらに小サイズに変換単位が選択されもする。例えば、深度2の符号化単位852に係わる予測単位が、幅を半分にした形態に選択された場合、変換単位は、予測単位よりさらに小サイズである高さ及び幅を半分にした形態に選択されもする。最小の変換単位として、2x2サイズに変換単位を設定することもできる。変換単位は、符号化単位と関係なく、符号化単位の大きさより大きく変換単位が設定されもする。
【0072】
以下、図4の本発明の一実施形態による映像符号化装置400のエントロピ符号化部450、及び図5の映像復号化装置500のエントロピ復号化部520で行われるエントロピ符号化及び復号化過程について具体的に説明する。
【0073】
前述のように、本発明の一実施形態による映像符号化装置400、及び映像復号化装置500は、最大符号化単位そのまま符号化するか、最大符号化単位より小さいか、あるいはそれと同じサブ符号化単位に最大符号化単位を分割して符号化する。符号化過程のうち、直交変換のための変換単位の大きさも、符号化単位及び予測単位と関係なく、最も高い圧縮率のための大きさに選択される。例えば、現在符号化単位が、64x64サイズであるとき、32x32サイズの変換単位を利用して、直交変換が行われる。また、符号化単位より大きい変換単位を設定することもできる。従来、H.264のような符号化過程で、4x4サイズの相対的に小サイズの変換単位に基づいて、変換及び量子化された残差データをエントロピ符号化する。しかし、本発明の一実施形態によれば、エントロピ符号化される変換単位(以下、「変換ブロック」とする)は、4x4や8x8だけでなく、16x16、32x32、64x64、128x128のような相対的に大サイズを有することができるので、0ではない有効変換係数間の連続的な0である係数の数を示すラン(run)の長さが長くなる、大きいラン値を適切に符号化する必要がある。また、従来技術によれば、変換ブロック内に具備された係数の情報を符号化するために、0ではない有効変換係数の位置を示すシグニフィカンス・マップ(significance map)のように、各有効変換係数が最後の有効変換係数であるか否かを示すシンタックス・エレメントであるlast_significant_coeff_flagが共にエントロピ符号化される。しかし、このように、シグニフィカンス・マップとlast_significant_coeff_flagとを結合し、変換ブロックをエントロピ符号化する場合、エントロピ復号化時に、各有効変換係数ごとに最後の有効変換係数であるか否かを判断しなければならない。従って、従来技術によれば、受信されたビットストリームから、全体有効変換係数を示すデータをすぐに識別しにくいという問題点がある。従って、本発明の実施形態による変換ブロックのエントロピ符号化方法では、このような大サイズの変換ブロック内の最後の有効変換係数の位置を、効率的にエントロピ符号化及び復号化する方法を提供する。
【0074】
図9は、本発明の一実施形態による変換係数のエントロピ符号化方法を示したフローチャートである。図9を参照すれば、段階910で、エントロピ符号化部450は、所定スキャニング順序によって、所定サイズの変換ブロックに具備された0ではない有効変換係数のうち、最後の有効変換係数の位置を決定する。具体的には、変換過程及び量子化過程を経て、変換係数に構成された変換ブロックが入力されれば、エントロピ符号化部450は、ジグザグスキャン順序のような所定のスキャニング順序によって、変換ブロック内に具備された有効変換係数を判断し、最後にスキャニングされる最後の有効変換係数の位置を決定する。
【0075】
段階920で、エントロピ符号化部450は、変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置を利用して、最後の有効変換係数の位置を符号化する。もし最後の有効変換係数が変換ブロックの最左上側から横軸方向に、x番目(xは、0以上の整数)、縦軸方向にy番目(yは、0以上の整数)に位置した場合、エントロピ符号化部450は、最後の有効変換係数の位置を示すx値及びy値を符号化する。従来技術によれば、各有効変換係数ごとに、最後の有効変換係数であるか否かを示すlast_significant_coeff_flagを符号化したが、本発明の第1実施形態による変換係数のエントロピ符号化方法では、最後の有効変換係数の変換ブロック内の相対的位置を示す座標情報のみを符号化する。最後の有効変換係数の相対的位置情報は、コンテクスト基盤適応的二進算術符号化(CABAC:context−adaptive binary arithmetic coding)方式や、可変長符号化(variable length coding)方式を介して符号化されもする。CABACまたは可変長符号化方式を介して最後の有効変換係数の位置情報を符号化する方法については後述する。
【0076】
エントロピ符号化部450は、最後の有効変換係数の位置情報を符号化した後、変換ブロック内に位置した各有効変換係数のレベル情報を符号化する。レベル情報として、エントロピ符号化部450は、有効変換係数の符号値(sign)及び絶対値(abs)情報を符号化する。
【0077】
図10は、本発明の実施形態による変換係数のエントロピ符号化過程を説明するための参照図である。図10を参照すれば、エントロピ符号化部450は、変換ブロック1000内の変換係数を、図示されているようなジグザグスキャン順序によってスキャニングする。図10で表示されていないスペース空間は、いずれも「0」である値を有する変換係数であると仮定する。図10の例において、最後の有効変換係数は、「−1」の値を有する図面符号1010に表示された変換係数である。図10に図示されているように、最左上側の変換係数を中心に、最後の有効変換係数「−1」1010は、横軸方向に5番目、縦軸方向に5番目に位置する。従って、エントロピ符号化部450は、最後の有効変換係数の位置情報として、x=5、y=5の値を符号化する。
図11は、本発明の一実施形態によるエントロピ符号化装置の具体的な構成を示したブロック図である。
【0078】
図11を参照すれば、本発明の一実施形態によるエントロピ符号化装置1100は、スイッチング部1110、コンテクスト基盤適応的二進算術符号化部(CABAC)1120及び可変長符号化部(VLC)1130を含む。
【0079】
前述のように、最後の有効変換係数の位置が決定されれば、最後の有効変換係数の位置は、CABACまたは可変長符号化方式を介して符号化される。スイッチング部1110は、スライス単位、ピクチャ単位、ピクチャグループ単位に符号化される最後の有効変換係数の相対的位置情報が、CABAC 1120またはVLC 1130に出力されるように制御する。CABACまたは可変長符号化方式のうち、いずれの方式を介して最後の有効変換係数を符号化するかということは、各符号化方式によるR−D(rate−distortion)コストを比べて決定されもする。
【0080】
まず、最後の有効変換係数の位置情報を、CABACを介して符号化する方式について説明する。
【0081】
図12は、本発明の一実施形態によるCABAB符号化装置のブロック図である。図12を参照すれば、CABAC符号化装置は、二進化部(binarizer)1210、コンテクスト・モデラ(context modeler)1220、二進算術符号化部(binary arithmetic coder)1230を含む。また、二進算術符号化部1230は、レギュラ・コーディング部(regular coding engine)1232と、バイパス・コーディング部(bypass coding engine)1234とを含む。
【0082】
二進化部1210は、最後の有効変換係数の位置を示す変換ブロック内の横軸方向への相対的位置x、及び縦軸方向への相対的位置yを二進値に変換し、ビン・ストリング(bin string)を出力する。ビン(bin)は、ビン・ストリングの各ビットを示す。最後の有効変換係数の位置情報を二進化するための方式としては、単項二進符号化(unary binarization)、切削型単項二進符号化(truncated unary binarization)、単項/k次次数ゴロム二進符号化(concatenated unary /k−th order exponential Golomb binarization)、固定長二進符号化(fixed length binarization)などの多様な二進化方式を適用することができる。例えば、図10の例において、最後の有効変換係数の位置が、X=5及びY=5である場合、切削型単項二進符号化を利用して、それぞれX=000001、Y=000001に二進化されもする。
【0083】
二進化部1210によって、二進値にマッピングされた最後の有効変換係数の位置情報は、コンテクスト・モデラ1220に入力される。コンテクスト・モデラ1220は、入力されたビン(bin)値、または以前に符号化されたシンタックス・エレメントに基づいて、現在入力されたビン(bin)を符号化するのに必要な確率モデルであるコンテクストを決定する。特に、本発明の一実施形態によれば、最後の有効変換係数の位置によって、あらかじめ決定された所定のコンテクストのうち一つが選択される。
【0084】
レギュラ・コーディング部1232は、コンテクスト・モデラ1220で決定された確率モデルに基づいて、入力されたビン(bin)値を算術符号化してビットストリームを生成する。
【0085】
バイパス・コーディング部1234は、圧縮を行わずに入力値をそのまま出力するモードであり、PCMデータのようなデータが入力されたとき、当該データを符号化する。
【0086】
図13は、本発明の一実施形態による最後の有効変換係数の位置の符号化のためのコンテクスト選択過程を説明するための参照図である。
【0087】
コンテクスト・モデラ1220は、最後の有効変換係数の位置によって、あらかじめ準備した複数個のコンテクストのうち一つを選択する。複数個のコンテクストは、「0」と「1」との二進信号を、それぞれ発生確率が高いシンボル(MPS:most probable symbol)と、発生確率が低いシンボル(LPS:least probable symbol)とに分類し、MPS及びLPSの確率値を設定したものである。複数個のコンテクストは、最後の有効変換係数の位置によって、「0」と「1」との二進信号のうち、いずれがそれぞれMPS及びLPSに該当し、MPS及びLPSの確率値を設定したものであり、「0」と「1」のうち、いずれのシンボルをMPSまたはLPSに設定し、各MPS及びLPSの確率値をいかように設定するということは、設計可能な事項である。図13では、ジグザグ・スキャニング順序によって、変換ブロック内の変換係数をスキャニングするとき、DCに該当する最左上側を除き、最後の変換係数の位置によって選択されるコンテクストを図示している。図13を参照すれば、コンテクスト・モデラ1220は、4x4変換ブロックについて、0、1、2のインデックス値を有する3個のコンテクストを具備し、最左上側を除いた4x4変換ブロック内の残りの位置内で、最後の有効変換係数の位置によって、0、1、2のインデックス値を有する3個のコンテクストのうち、一つを選択する。すなわち、4x4変換ブロックで、最後の有効変換係数が(1,0)に位置した場合、0のインデックス値を有するコンテクストが選択され、最後の有効変換係数が(0,1)に位置した場合、1のインデックス値を有するコンテクストが選択され、(1,1)に位置した場合、2のインデックス値を有するコンテクストが選択される。同様に、コンテクスト・モデラ1220は、8x8変換ブロックについて、0ないし6のインデックス値を有する7個のコンテクストを具備し、最左上側を除いて、8x8変換ブロック内で、最後の有効変換係数の位置によって、0ないし6のインデックス値を有する7個のコンテクストのうち一つを選択する。同様に、コンテクスト・モデラ1220は、16x16変換ブロックについて、0ないし11のインデックス値を有する12個のコンテクストを具備し、最左上側を除き、16x16変換ブロック内で、最後の有効変換係数の位置によって、0ないし11のインデックス値を有する11個のコンテクストのうち一つを選択する。
【0088】
レギュラ・コーディング部1232は、コンテクスト・モデラ1220で決定されたコンテクストに基づいて、入力された最後の有効変換係数の位置を示すビン(bin)値を算術符号化してビットストリームを生成する。一例として、最後の有効変換係数の横軸方向の位置であるXは、3の値を有し、二進化部1210は、このような3の値を二進化し、「010」というビン・ストリングを生成したと仮定する。また、コンテクスト・モデラ1220で、最後の有効変換係数の位置によって選択されたコンテクストによれば、MPSは、0.8の確率値を有する「0」であり、LPSは、0.2の確率値を有する「1」と仮定する。レギュラ・コーディング部1232は、[0,1]の区間を、「010」のビン・ストリングを構成する最初のビン(bin)である「0」の確率値によって分割して、[0,0.8]に更新し、次のビンである「1」の確率値によって、[0,0.8]の区間をさらに更新し、新しい区間[0.64,0.8]を決定する。また、レギュラ・コーディング部1232は、最後のビンである「0」の確率値によって、区間[0.64,0.8]を更新して新しい区間[0.64,0.768]を決定する。レギュラ・コーディング部1232は、[0.64,0.768]区間内に入る実数0.75の二進表現である「0.11」で、最初の桁数を取った「11」を、最後の有効変換係数の横軸方向の位置を示す3の値に対応するコードワードとして出力する。同様に、レギュラ・コーディング部1232は、最後の有効変換係数の縦軸方向の位置を示す座標値Yを二進化し、選択されたコンテクストによって、二進化された座標値Yを符号化してビットストリームを生成する。
【0089】
一方、図11のCABAC 1120は、前述の最後の有効変換係数の位置情報以外に、変換ブロック内に、0ではない有効変換係数が存在するか否かを示すcoded_block_flag、及び変換ブロック内の各有効変換係数の位置を示すsignificant_coeff_flagを符号化する。coded_block_flag及びsignificant_coeff_flagの符号化過程は、従来のH.264と同一に遂行される。一例として、図10に対応するシグニフィカンス・マップを示した図14を参照すれば、シグニフィカンス・マップ1400は、i番目にスキャニングされる変換係数が有効変換係数である場合、significant_coeff_flag[i]を1に設定し、i番目にスキャニングされる変換係数が0である場合、significant_coeff_flag[i]を0に設定することによって表現される。このようなシグニフィカンス・マップは、H.264のような15個の確率モデルによって符号化されもする。
【0090】
エントロピ符号化部450は、最後の有効変換係数の相対的位置情報を符号化した後、変換ブロック内に位置した各有効変換係数のレベル情報を符号化する。
【0091】
図15は、図10の変換ブロックに具備された有効変換係数のレベル値を符号化する過程を説明するための参照図である。
【0092】
図10及び図15を参照すれば、エントロピ符号化部450は、図10の変換係数をジグザグ・スキャニング順序によって、最左上側変換係数から最後の有効変換係数までスキャニングし、図15のように、一次元形態に配列された変換係数を得る。
【0093】
エントロピ符号化部450は、従来のH.264と同様に、有効変換係数間の連続的な0の個数を示すラン(run)と、各有効変換係数の値を示すレベルとを利用して、図15に図示されているような一次元形態に配列された変換係数を符号化する。具体的には、エントロピ符号化部450は、スキャニング順序と反対に、すなわち、図15で、右側から左側の方向にランとレベルとを決定した後、ランとレベルとを所定のVLCテーブルを利用して符号化する。
【0094】
図16は、本発明の一実施形態によって利用されるVLCテーブルの一例を示したものである。エントロピ符号化部450は、最後の有効変換係数の位置によって、複数個のVLCテーブルVLC0ないしVLC8のうち一つを選択し、ランとレベルとを符号化することができる。一例として、図15に図示されているように、最後の有効変換係数である「−1」を基点にし、各有効変換係数間の連続的な0の個数を示すラン1530,1540,1550,1560が、VLCテーブルを利用して、可変長符号化される。
【0095】
一方、本発明の実施形態による変換ブロックは、16x16以上の大サイズを有することができるので、ラン値が大きくなることがある。例えば、VLCテーブルに設定されたラン値は、0から63までしか存在しないが、該ラン値が、63より大きい値を有するなら、VLCテーブルを利用して、ラン値を符号化することができない。従って、本発明の一実施形態によるエントロピ符号化部450は、VLCテーブルで利用可能な最大ラン値を考慮して、変換ブロックが最大ラン値を超えるラン値を有する場合、最大ラン値までのランを符号化した後で残りのラン値を符号化する。例えば、最大ラン値が63、符号化するラン値が70の値を有するなら、70のランを63と7とに分割し、63と7とのラン値を、ラン情報として符号化する。
【0096】
本発明の他の実施形態によれば、最後の有効変換係数の位置(x,y)値は、前述のCABAC以外に、可変長符号化方式を介して符号化されもする。すなわち、エントロピ符号化部450は、x,yの値によってあらかじめ準備した可変長符号化テーブルを参照し、x,yの値を可変長符号化することができる。
【0097】
図17は、本発明の他の実施形態による変換係数のエントロピ符号化方法を説明するための参照図である。
【0098】
本発明の他の実施形態によるエントロピ符号化部450は、変換ブロックを所定サイズのサブブロックに分割し、サブブロックのうち、最後の有効変換係数が存在するサブブロックのインデックスと共に、最後の有効変換係数が属するサブブロック内で、最後の有効変換係数の相対的位置情報を符号化する。図17で、(Sa,b)は、サブブロックaのb番目スキャンインデックスの変換係数を示すと仮定する。図17を参照すれば、最後の有効変換係数がサブブロック1 1771に存在するS1,12であると仮定すれば、エントロピ符号化部450は、サブブロック1を示す所定インデックス情報と共に、サブブロック1内での最後の有効変換係数S1,12の位置を示す(2,2)を、サブブロック内での最後の有効変換係数の位置情報として符号化する。
【0099】
一方、再び図10を参照すれば、本発明の他の実施形態による変換係数のエントロピ符号化方法では、変換ブロック内の最後の有効変換係数1010(以下、「第1最後の有効変換係数」とする)と、最後の有効変換係数の以前有効変換係数1020(以下、「第2最後の有効変換係数」とする)とを利用して、変換係数を符号化する。具体的には、エントロピ符号化部450は、第2最後の有効変換係数1020の位置である(3,4)を、前述の事実施形態のように符号化する。そして、エントロピ符号化部450は、第1最後の有効変換係数1010と、第2最後の有効変換係数1020との間のラン値を符号化する。このように、第2最後の有効変換係数1020の位置を知っている場合、第2最後の有効変換係数1020に、第1最後の有効変換係数1010と、第2最後の有効変換係数1020との間のラン値を加えれば、第1最後の有効変換係数1010の位置が分かる。
【0100】
図18A及び図18Bは、本発明のさらに他の実施形態による変換係数のエントロピ符号化方法を説明するための参照図である。
【0101】
エントロピ符号化部450は、ジグザグスキャン順序及び逆ジグザグスキャン順序のうちいずれかの順序によるとき、最後の有効変換係数が先にスキャニングされるか、すなわち、最後の有効変換係数が変換ブロックの最左上側地点から近いか、あるいは最右下側地点から近いかによって、1つのスキャン方向を選択し、選択されたスキャン方向に係わるインデックス情報と共に、最後の有効変換係数の位置を符号化することができる。例えば、図18Aに図示されているように、図面符号1812が中間地点を示すとしたとき、最後の有効変換係数1811は、最左上側からさらに近く位置する。このような場合、エントロピ符号化部450は、最後の有効変換係数1811の位置と共に、最左上側からスキャニングを行うことを示すインデックス(forward scan index)を共に符号化することができる。また、図18Bに図示されているように、図面符号1822が中間地点を示し、最後の有効変換係数1821が最右下側からさらに近く位置する場合、エントロピ符号化部450は、最後の有効変換係数1821の位置と共に、最右下側からスキャニングを行うことを示すインデックス(backward scan index)を共に符号化することができる。
【0102】
一方、本発明の他の実施形態によれば、ラン値を符号化するために、所定のグローバルラン(global run)を設定し、ラン値をグローバルランで割った商と余り(RunRefinement)とを介して表現することができる。例えば、ラン値が78であり、グローバルランが16の値を有すると仮定する。この場合、78を16で割ったとき、商の値は4であり、余りは14である。従って、このような78のラン値は、グローバルラン情報、商情報である4の値、余りである14の値を介して表現されもする。エントロピ符号化部450は、このようなグローバルラン情報、商情報及び余り情報を、可変長符号化やCABACを介して符号化することができる。もし符号化側と復号化側とでグローバルランが同一にあらかじめ設定された場合には、グローバルラン情報を別途に符号化する必要はない。
【0103】
また、本発明の他の実施形態によれば、エントロピ符号化部450は、最後の有効変換係数が含まれた変換ブロックの大きさによって、互いに異なる可変長符号化テーブルを適用し、最後の有効変換係数の位置を符号化することができる。
【0104】
図19は、本発明の一実施形態による変換係数のエントロピ復号化方法を示したフローチャートである。図19を参照すれば、段階1910で、エントロピ復号化部520は、受信されたビットストリームから、所定スキャニング順序によって、変換ブロックに具備された0ではない最後の有効変換係数の変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置に係わる情報を抽出する。前述のように、最後の有効変換係数の位置情報は、変換ブロックの最左上側から横軸方向にx番目(xは、0以上の整数)、縦軸方向にy番目(yは、0以上の整数)に位置した場合、x値及びy値に係わる情報を含む。
【0105】
段階1920で、エントロピ復号化部520は、横軸方向及び縦軸方向への相対的位置情報を復号化し、最後の有効変換係数の位置を決定する。エントロピ復号化部520は、エントロピ符号化部450で遂行される符号化過程との逆過程として、コンテクスト基盤適応的二進算術復号化(context−adaptive binary arithmetic decoding)または可変長復号化方法を適用し、最後の有効変換係数の位置を復号化し、最後の有効変換係数の位置を決定する。具体的には、エントロピ復号化部520は、所定の可変長符号化ルックアップ(look−up)テーブルを参照し、最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長復号化することができる。また、エントロピ復号化部520は、複数個のコンテクストのうち、最後の有効変換係数の位置によって1つのコンテクストを選択し、選択されたコンテクストによって、最後の有効変換係数の位置を、コンテクスト基盤適応的二進算術復号化することができる。
【0106】
段階1930で、エントロピ復号化部520は、最後の有効変換係数の位置を利用して、ビットストリームに具備されたランとレベルとの情報を復号化する。エントロピ復号化部520は、ランの長さが、所定臨界値より長い場合、臨界値長までのラン情報を復号化した後、臨界値を超えるラン情報をさらに復号化する。前述のように、63までのラン値を符号化するように臨界値が設定された場合、70のラン値は、63と7との値に分離して符号化されるので、エントロピ復号化部520は、63と7とのラン値をそれぞれ復号化した後、これを結合して70のラン値を復号化することができる。
【0107】
図20は、本発明の一実施形態によるエントロピ復号化装置の具体的な構成を示したブロック図である。図20を参照すれば、本発明の一実施形態によるエントロピ復号化装置2000は、スイッチング部2010、コンテクスト基盤適応的二進算術復号化部(CABAD)2020及び可変長復号化部(VLD)2030を含む。
【0108】
スイッチング部2010は、スライス単位、ピクチャ単位、ピクチャグループ単位で設定された変換係数の符号化モード情報を利用して、符号化された変換係数の情報を、コンテクスト基盤適応的二進算術復号化部(CABAD)2020及び可変長復号化部(VLD)2030のうち一つに出力する。
【0109】
可変長復号化部2030は、所定の可変長符号化ルックアップ(look−up)テーブルを参照し、最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長復号化することができる。また、コンテクスト基盤適応的二進算術復号化部2020は、複数個のコンテクストのうち、最後の有効変換係数の位置によって、1つのコンテクストを選択し、選択されたコンテクストによって、最後の有効変換係数の位置を、コンテクスト基盤適応的二進算術復号化することができる。
【0110】
本発明はまた、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータ・システムによって読み取り可能なデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としてはて、ROM(read−only memory)、RAM(random−access memory)、CD(compact disc)−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータ・システムに分散され、分散方式で、コンピュータで読み取り可能なコードとして保存されて実行される。
【0111】
以上、本発明についてその望ましい実施形態を中心に説明した。本発明が属する技術分野で当業者であるならば、本発明が本発明の本質的な特性から外れない範囲で変形された形態に具現されるものであるということを理解することができるであろう。本発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本発明に含まれたものであると解釈されなければならないのである。
【0112】
上記の実施形態に関し、更に以下の付記を例示的に示す。
(付記1)
変換係数のエントロピ符号化方法において、
所定スキャニング順序によって、所定サイズの変換ブロックに具備された変換係数のうち、0ではない最後の有効変換係数の位置を決定する段階と、
前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置を利用して、前記最後の有効変換係数の位置を符号化する段階と、を含むことを特徴とする変換係数のエントロピ符号化方法。
(付記2)
前記最後の有効変換係数の位置を符号化する段階は、
前記最後の有効変換係数が、前記変換ブロックの最左上側から横軸方向にx番目(xは、0以上の整数)、縦軸方向にy番目(yは、0以上の整数)に位置した場合、前記最後の有効変換係数の位置を示す前記x値及びy値を符号化することを特徴とする付記1に記載の変換係数のエントロピ符号化方法。
(付記3)
前記最後の有効変換係数の位置を符号化する段階は、
前記最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長符号化することを特徴とする付記1に記載の変換係数のエントロピ符号化方法。
(付記4)
前記最後の有効変換係数の位置を符号化する段階は、
所定の可変長符号化ルックアップテーブルを参照し、前記最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長符号化することを特徴とする付記3に記載の変換係数のエントロピ符号化方法。
(付記5)
前記スキャニング順序の逆方向に、前記有効変換係数間の連続的な0である係数の数を示すラン情報、及び前記有効変換係数のレベル情報を符号化する段階をさらに含み、
前記ラン情報を符号化する段階は、前記ランの長さが所定臨界値より大きい場合、前記臨界値長までのラン情報を符号化した後、臨界値を超えるラン情報をさらに符号化することを特徴とする付記3に記載の変換係数のエントロピ符号化方法。
(付記6)
前記最後の有効変換係数の位置を符号化する段階は、
前記最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を二進化する段階と、
前記二進化された相対的位置の符号化に利用されるコンテクストを選択する段階と、
前記選択されたコンテクストによって、前記二進化された相対的位置に対して、コンテクスト基盤適応的二進算術符号化を行う段階と、をさらに含むことを特徴とする付記1に記載の変換係数のエントロピ符号化方法。
(付記7)
前記コンテクストを選択する段階は、
前記最後の有効変換係数の位置によって、あらかじめ決定された所定のコンテクストのうち一つを選択することを特徴とする付記6に記載の変換係数のエントロピ符号化方法。
(付記8)
変換係数のエントロピ復号化方法において、
受信されたビットストリームから、所定スキャニング順序によって、変換ブロックに具備された0ではない最後の有効変換係数の前記変換ブロック内の横軸方向への相対的位置、及び縦軸方向への相対的位置に係わる情報を抽出する段階と、
前記横軸方向及び縦軸方向への相対的位置情報を復号化し、前記最後の有効変換係数の位置を決定する段階と、を含むことを特徴とする変換係数のエントロピ復号化方法。
(付記9)
前記最後の有効変換係数の位置を決定する段階は、
前記最後の有効変換係数が前記変換ブロックの最左上側から横軸方向にx番目(xは、0以上の整数)、縦軸方向にy番目(yは、0以上の整数)に位置した場合、前記最後の有効変換係数の位置を示す前記x値及びy値を復号化することを特徴とする付記8に記載の変換係数のエントロピ復号化方法。
(付記10)
前記最後の有効変換係数の位置を決定する段階は、
前記最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長復号化することを特徴とする付記8に記載の変換係数のエントロピ復号化方法。
(付記11)
前記最後の有効変換係数の位置を決定する段階は、
所定の可変長符号化ルックアップテーブルを参照し、前記最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置を可変長復号化することを特徴とする付記10に記載の変換係数のエントロピ復号化方法。
(付記12)
前記スキャニング順序の逆方向に、前記有効変換係数間の連続的な0である係数の数を示すラン情報、及び前記有効変換係数のレベル情報を復号化する段階をさらに含み、
前記ラン情報を復号化する段階は、前記ランの長さが所定臨界値より大きい場合、前記臨界値長までのラン情報を復号化した後、臨界値を超えるラン情報をさらに復号化することを特徴とする付記10に記載の変換係数のエントロピ復号化方法。
(付記13)
前記最後の有効変換係数の位置を決定する段階は、
二進化された最後の有効変換係数の横軸方向への相対的位置、及び縦軸方向への相対的位置の復号化に利用されるコンテクストを選択する段階と、
前記選択されたコンテクストによって、前記二進化された相対的位置に対して、コンテクスト基盤適応的二進算術復号化を行う段階と、をさらに含むことを特徴とする付記8に記載の変換係数のエントロピ復号化方法。
(付記14)
前記コンテクストを選択する段階は、
前記最後の有効変換係数の位置によって、あらかじめ決定された所定のコンテクストのうち一つを選択することを特徴とする付記13に記載の変換係数のエントロピ復号化方法。
(付記15)
前記変換ブロック内の有効変換係数の位置を示すシグニフィカンス・マップ、及び前記有効変換係数のレベル値を復号化する段階をさらに含むことを特徴とする付記13に記載の変換係数のエントロピ復号化方法。
【先行技術文献】
【特許文献】
【0113】
【特許文献1】国際公開第2010/018138号
【特許文献2】国際公開第2010/054178号
【非特許文献】
【0114】
【非特許文献1】Test Model under Consideration, Joint Collaborative Team on Video Coding (JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 1st Meeting: Dresden, DE, 2010年6月,JCTVC−A205_draft003, pp.1−119
図1
図2
図3
図4
図5
図6
図7
図8A
図8B
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18A
図18B
図19
図20