【文献】
Vadim Seregin, Il-Koo Kim,Binarisation modification for last position coding,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011,2011年 7月16日,JCTVC-F375,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=2847
【文献】
Il-Koo Kim, et al.,CE2: Test results of asymmetric motion partition (AMP),Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, 14-22 July, 2011,2011年 7月12日,JCTVC-F379,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=2851
【文献】
Yamamoto Tomoyuki, et al.,On partition size information coding in B-slices using CABAC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 21-30 November, 2011,2011年11月 9日,JCTVC-G709,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=3970
【文献】
Wei-Jung Chien, et al.,Context reduction for CABAC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, 21-30 November, 2011,2011年11月27日,JCTVC-G718,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=3979
【文献】
Wei-Jung Chien, et al.,Context modeling for asymmetric partitioning on partition mode,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 8th Meeting: San Jose, CA, USA, 1-10 February, 2012,2012年 2月 8日,JCTVC-H0545,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=4854
【文献】
Tomoyuki Yamamoto,On CABAC context for partition mode,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 8th Meeting: San Jose, CA, USA, 1-10 February, 2012,2012年 2月 2日,JCTVC-H0099,URL,http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=4400
(58)【調査した分野】(Int.Cl.,DB名)
前記PU分割タイプ情報PartModeに関するバイナリ値は、前記非対称的分割が縦長または横長であることを示す第1の情報を少なくとも含むことを特徴とする請求項1に記載の画像復号装置。
前記PU分割タイプ情報PartModeに関するバイナリ値は、対称分割であるか否かを示す第2の情報と、前記非対称的分割の境界が対称分割よりも原点側に近いか否かを示す第3の情報とを少なくとも含むことを特徴とする請求項1に記載の画像復号装置。
【発明を実施するための形態】
【0020】
本発明の一実施形態について
図1〜
図24を参照して説明する。まず、
図2を参照しながら、動画像復号装置(画像復号装置)1および動画像符号化装置(画像符号化装置)2の概要について説明する。
図2は、動画像復号装置1の概略的構成を示す機能ブロック図である。
【0021】
図2に示す動画像復号装置1および動画像符号化装置2は、H.264/MPEG−4
AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、および、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている技術を実装している。
【0022】
動画像符号化装置2は、これらの動画像符号化方式において、エンコーダからデコーダに伝送されることが規定されているシンタックス(syntax)の値をエントロピー符号化して符号化データ#1を生成する。
【0023】
エントロピー符号化方式としては、コンテキスト適応型可変長符号化(CAVLC:Context-based Adaptive Variable Length Coding)、および、コンテキスト適応型2値算術符号化(CABAC:Context-based Adaptive Binary Arithmetic Coding)が知られている。
【0024】
CAVLCおよびCABACによる符号化/復号においては、コンテキストに適応した処理が行われる。コンテキストとは、符号化/復号の状況(文脈)のことであり、関連シンタックスの過去の符号化/復号結果により定まるものである。関連シンタックスとしては、例えば、イントラ予測、インター予測に関する各種シンタックス、輝度(Luma)、色差(Chroma)に関する各種シンタックス、およびCU(Coding Unit 符号化単位)サイズに関する各種シンタックスなどがある。また、CABACでは、シンタックスに対応する2値データ(バイナリ列)における、符号化/復号対象となるバイナリの位置をコンテキストとして用いる場合もある。
【0025】
CAVLCでは、符号化に用いるVLCテーブルを適応的に変更して、各種シンタックスが符号化される。一方、CABACでは、予測モードおよび変換係数等の多値を取り得るシンタックスに対して2値化処理が施され、この2値化処理によって得られた2値データが発生確率に応じて適応的に算術符号化される。具体的には、バイナリ値(0または1)の発生確率を保持するバッファを複数用意し、コンテキストに応じて一つのバッファを選択し、当該バッファに記録されている発生確率に基づいて算術符号化を行う。また、復
号/符号化するバイナリ値に基づいて、当該バッファの発生確率を更新することで、コンテキストに応じて適切な発生確率を維持できる。
【0026】
動画像復号装置1には、動画像符号化装置2が動画像を符号化した符号化データ#1が入力される。動画像復号装置1は、入力された符号化データ#1を復号して動画像#2を外部に出力する。動画像復号装置1の詳細な説明に先立ち、符号化データ#1の構成を以下に説明する。
【0027】
〔符号化データの構成〕
図3を用いて、動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データ#1の構成例について説明する。符号化データ#1は、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
【0028】
符号化データ#1におけるピクチャレイヤ以下の階層の構造を
図3に示す。
図3の(a)〜(d)は、それぞれ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤ、ツリーブロックTBLKに含まれる符号化単位(Coding Unit;CU)を規定
するCUレイヤを示す図である。
【0029】
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、
図3の(a)に示すように、ピクチャヘッダPH、及び、スライスS
1〜S
NSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
【0030】
なお、以下、スライスS
1〜S
NSのそれぞれを区別する必要が無い場合、符号の添え字
を省略して記述することがある。また、以下に説明する符号化データ#1に含まれるデータであって、添え字を付している他のデータについても同様である。
【0031】
ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報(entropy_coding_mode_flag)は、ピクチャヘッダPHに含まれる符号化パラメータの一例である。
【0032】
entropy_coding_mode_flagが0の場合、当該ピクチャPICTは、CAVLC(Context-based Adaptive Variable Length Coding)によって符号化されている。また、entropy_coding_mode_flagが1である場合、当該ピクチャPICTは、CABAC(Context-based Adaptive Binary Arithmetic Coding)によって符号化されている。
【0033】
なお、ピクチャヘッダPHは、ピクチャー・パラメーター・セット(PPS:Picture Parameter Set)とも称される。
【0034】
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、
図3の(b)に示すように、スライスヘッダSH、及び、ツリーブロックTBLK
1〜TBLK
NC(NCはスライスSに含まれるツリーブロックの総数)を含んでいる。
【0035】
スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指
定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
【0036】
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単予測、双予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
【0037】
また、スライスヘッダSHには、動画像復号装置1の備えるループフィルタ(不図示)によって参照されるフィルタパラメータが含まれていてもよい。
【0038】
(ツリーブロックレイヤ)
ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
【0039】
ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU
1〜CU
NL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。
【0040】
ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのユニットに分割される。
【0041】
ツリーブロックTBLKの上記ユニットは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
【0042】
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するユニットを、符号化ノード(coding node)として参照する。また、符号化ノード
は、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
【0043】
つまり、符号化単位情報CU
1〜CU
NLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
【0044】
また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
【0045】
なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのユニット)のサイズの縦横とも半分である。
【0046】
また、各符号化ノードの取り得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBLKのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTBLK以下の階層における符号化ノードは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および8×8画素の何れかを取り得る。
【0047】
(ツリーブロックヘッダ)
ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。
具体的には、
図3の(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
【0048】
ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
【0049】
なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグ(split_coding_unit_flag)の集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
【0050】
また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp−qp’である。
【0051】
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
【0052】
ここで、符号化単位情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction
tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予
測ツリーおよび変換ツリーについて説明すると次のとおりである。
【0053】
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
【0054】
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
【0055】
予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
【0056】
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
【0057】
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、N×2N、および、N×Nなどがある。
【0058】
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、
符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
【0059】
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
【0060】
(符号化単位情報のデータ構造)
続いて、
図3の(d)を参照しながら符号化単位情報CUに含まれるデータの具体的な内容について説明する。
図3の(d)に示すように、符号化単位情報CUは、具体的には、スキップモードフラグSKIP、CU予測タイプ情報Pred_type、PT情報PTI、および、TT情報TTIを含む。
【0061】
[スキップフラグ]
スキップフラグSKIPは、対象CUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、その符号化単位情報CUにおけるPT情報PTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
【0062】
[CU予測タイプ情報]
CU予測タイプ情報Pred_typeは、CU予測方式情報PredModeおよびPU分割タイプ情報PartModeを含む。
【0063】
CU予測方式情報PredModeは、対象CUに含まれる各PUについての予測画像生成方法として、イントラ予測(イントラCU)、および、インター予測(インターCU)のいずれを用いるのかを指定するものである。なお、以下では、対象CUにおける、スキップ、イントラ予測、および、インター予測の種別を、CU予測モードと称する。
【0064】
PU分割タイプ情報PartModeは、対象符号化単位(CU)の各PUへの分割のパターンであるPU分割タイプを指定するものである。以下、このように、PU分割タイプに従って、対象符号化単位(CU)を各PUへ分割することをPU分割と称する。
【0065】
PU分割タイプ情報PartModeは、例示的には、PU分割パターンの種類を示すインデックスであってもよいし、対象予測ツリーに含まれる各PUの形状、サイズ、および、対象予測ツリー内での位置が指定されていてもよい。
【0066】
なお、選択可能なPU分割タイプは、CU予測方式とCUサイズに応じて異なる。また、さらにいえば、選択可能できるPU分割タイプは、インター予測およびイントラ予測それぞれの場合において異なる。また、PU分割タイプの詳細については後述する。
【0067】
また、Iスライスでない場合、PU分割タイプ情報PartModeの値は、ツリーブロックの分割(partition)、予測方式、およびCUの分割(split)の方法の組み合わせを指定するインデックス(cu_split_pred_part_mode)によって特定されるようになって
いてもよい。
【0068】
[PT情報]
PT情報PTIは、対象CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合である。上述のとおり予測画像の生成は、PUを単位として行われるので、PT情報PTIは、動画像復号装置1によって予測画像が生成される際に参照される。PT情報PTIは、
図3の(d)に示すように、各PUにおける予測情報等を含むPU情報PUI
1〜PUI
NP
(NPは、対象PTに含まれるPUの総数)を含む。
【0069】
予測情報PUIは、予測タイプ情報Pred_modeが何れの予測方法を指定するのかに応じて、イントラ予測情報、または、インター予測情報を含む。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
【0070】
インター予測情報は、動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータを含む。
【0071】
インター予測パラメータとしては、例えば、マージフラグ(merge_
flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)が挙げられる。
【0072】
イントラ予測情報は、動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。
【0073】
イントラ予測パラメータとしては、例えば、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスが挙げられる。
【0074】
なお、イントラ予測情報では、PCMモードを用いるか否かを示すPCMモードフラグが符号化されていてもよい。PCMモードフラグが符号化されている場合であって、PCMモードフラグがPCMモードを用いることを示しているときには、予測処理(イントラ)、変換処理、および、エントロピー符号化の各処理が省略される。
【0075】
[TT情報]
TT情報TTIは、CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
【0076】
TT情報TTIは、
図3の(d)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TU、および、TU情報TUI
1〜TUI
NT(NT
は、対象CUに含まれるブロックの総数)を含んでいる。
【0077】
TT分割情報SP_TUは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TUは、対象となるノードの分割を行うのか否かを示す情報(split_transform_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。
【0078】
また、例えば、CUのサイズが、64×64の場合、分割により得られる
各TUは、32×32画素から4×4画素までのサイズを取り得る。
【0079】
TU情報TUI
1〜TUI
NTは、TTに含まれる1または複数のTUそれぞれに関する
個別の情報である。例えば、TU情報TUIは、量子化予測残差を含んでいる。
【0080】
各量子化予測残差は、動画像符号化装置2が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
【0081】
処理1:符号化対象画像から予測画像を減算した予測残差をDCT変換(Discrete Cosine Transform)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2
qp/6)。
【0082】
(PU分割タイプ)
PU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2
m(mは1以上の任意の整数)を意味している。以下
、対象CUを分割して得られる領域のことをパーティションとも称する。
【0083】
図4の(a)〜(h)に、それぞれの分割タイプについて、CUにおけるPU分割の境界の位置を具体的に図示している。
【0084】
なお、
図4の(a)は、CUの分割を行わない2N×2NのPU分割タイプを示している。
【0085】
また、
図4の(b)、(c)、および(d)は、それぞれ、PU分割タイプが、それぞれ、2N×N、2N×nU、および、2N×nDである場合のパーティションの形状について示している。以下、PU分割タイプが、2N×N、2N×nU、および、2N×nDである場合のパーティションを、まとめて横長パーティションと称する。
【0086】
また、
図4の(e)、(f)、および(g)は、それぞれ、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションの形状について示している。以下、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションを、まとめて縦長パーティションと称する。
【0087】
また、横長パーティションおよび縦長パーティションをまとめて長方形パーティションと称する。
【0088】
また、
図4の(h)は、PU分割タイプが、N×Nである場合のパーティションの形状を示している。
図4の(a)および(h)のPU分割タイプのことを、そのパーティションの形状に基づいて、正方形分割とも称する。また、
図4の(b)〜(g)のPU分割タイプのことは、非正方形分割とも称する。
【0089】
また、
図4の(a)〜(h)において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。
【0090】
また、
図4の(a)〜(h)において、左上がCUの基準点(原点)であるとする。
【0091】
[インター予測の場合の分割タイプ]インターPUでは、上記8種類の分割タイプのうち、N×N(
図4の(h))以外の7種類が定義されている。なお、上記4つの非対称的分割は、AMP(Asymmetric Motion Partition)と呼ばれることもある。
【0092】
なお、上述のNの具体的な値は、当該PUが属するCUのサイズによって規定され、nU、nD、nL、および、nRの具体的な値は、Nの値に応じて定められる。例えば、128×128画素のインターCUは、128×128画素、128×64画素、64×128画素、64×64画素、128×32画素、128×96画素、32×128画素、および、96×128画素のインターPUへ分割することが可能である。
【0093】
[イントラ予測の場合の分割タイプ]
イントラPUでは、次の2種類の分割パターンが定義されている。すなわち、対象CUを分割しない、すなわち対象CU自身が1つのPUとして取り扱われる分割パターン2N×2Nと、対象CUを、4つのPUへと対称的に分割するパターンN×Nと、である。
【0094】
したがって、イントラPUでは、
図4に示した例でいえば、(a)および(h)の分割パターンを取ることができる。
【0095】
例えば、128×128画素のイントラCUは、128×128画素、および、64×64画素のイントラPUへ分割することが可能である。
【0096】
なお、Iスライスの場合、符号化単位情報CUにおいて、PU分割タイプPartMo
deを特定するためのイントラ分割モード(intra_part_mode)が含まれていてもよい。
【0097】
(TU分割およびノード内のTUの順序)
次に、
図18〜
図20を用いて、TU分割およびノード内のTUの順序について説明する。TU分割のパターンは、CUのサイズ、分割の深度(trafoDepth)、および対象PUのPU分割タイプにより定まる。
【0098】
また、TU分割のパターンには、正方形の4分木分割と、非正方形の4分
木分割とが含まれる。TU分割のパターンの具体例は、
図18および
図19
に示すとおりである。
【0099】
図18は、正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。
【0100】
図18の(a)は、正方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(b)は、正方形のノードを横長の長方形に4分木分割する分割方式を示している。そして、同図の(c)は、正方形のノードを縦長の長方形に4分木分割する分割方式を示している。
【0101】
また、
図19は、非正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。
【0102】
図19の(a)は、横長の長方形のノードを横長の長方形に4分木分割する分割方式を示している。また、同図の(b)は、横長の長方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(c)は、縦長の長方形のノードを縦長の長方形に4分木分割する分割方式を示している。そして、同図の(d)は、縦長の長方形のノードを正方形に4分木分割する分割方式を示している。
【0103】
また、
図20に、PU分割タイプ2N×Nの32×32CUのTU分割の例を示している。同図において、“depth”は、分割の深度(trafoDepth)を示している。また、“split”は、当該depthにおけるsplit_transform_flagの値を示している。“split”が“1”であれば、当該depthのノードについてTU分割を行い、“0
”であれば、TU分割を行わない。
【0104】
CUのサイズ、分割の深度(trafoDepth)、および対象PUのPU分割タイプと、TU分割パターンとの対応関係の詳細については後述する。
【0105】
〔動画像復号装置〕
以下では、本実施形態に係る動画像復号装置1の構成について、
図1〜
図24を参照して説明する。
【0106】
(動画像復号装置の概要)
動画像復号装置1は、PU毎に予測画像を生成し、生成された予測画像と、符号化データ#1から復号された予測残差とを加算することによって復号画像#2を生成し、生成された復号画像#2を外部に出力する。
【0107】
ここで、予測画像の生成は、符号化データ#1を復号することによって得られる符号化パラメータを参照して行われる。符号化パラメータとは、予測画像を生成するために参照されるパラメータのことである。符号化パラメータには、画面間予測において参照される動きベクトルや画面内予測において参照される予測モードなどの予測パラメータに加えて、PUのサイズや形状、ブロックのサイズや形状、および、原画像と予測画像との残差データなどが含まれる。以下では、符号化パラメータに含まれる情報のうち、上記残差データを除く全ての情報の集合を、サイド情報と呼ぶ。
【0108】
また、以下では、復号の対象となるピクチャ(フレーム)、スライス、ツリーブロック、ブロック、および、PUをそれぞれ、対象ピクチャ、対象スライス、対象ツリーブロック、対象ブロック、および、対象PUと呼ぶことにする。
【0109】
なお、ツリーブロックのサイズは、例えば64×64画素であり、PUのサイズは、例えば、64×64画素、32×32画素、16×16画素、8×8画素や4×4画素などである。しかしながら、これらのサイズは、単なる例示であり、ツリーブロックおよびPUのサイズは以上に示したサイズ以外のサイズであってもよい。
【0110】
(動画像復号装置の構成)
再び、
図2を参照して、動画像復号装置1の概略的構成について説明すると次のとおりである。
図2は、動画像復号装置1の概略的構成について示した機能ブロック図である。
【0111】
図2に示すように動画像復号装置1は、復号モジュール10、CU情報復号部11、PU情報復号部12、TU情報復号部13、予測画像生成部14、逆量子化・逆変換部15、フレームメモリ16および加算器17を備えている。
【0112】
[復号モジュール]
復号モジュール10は、バイナリからシンタックス値を復号する復号処理を行う。復号モジュール10は、より具体的には、供給元から供給される符号化データおよびシンタックス種別に基づいて、CABACおよびCAVLC等のエントロピー符号化方式により符号化されているシンタックス値を復号し、復号したシンタックス値を供給元に返す。
【0113】
以下に示す例では、符号化データおよびシンタックス種別の供給元は、CU情報復号部11、PU情報復号部12、およびTU情報復号部13である。
【0114】
復号モジュール10における復号処理の例として、CU情報復号部11から、復号モジュール10に対して、符号化データのバイナリ(ビット列)と、シンタックス種別“spli
t_coding_unit_flag”とが供給された場合について説明すると次のとおりである。すなわち、この場合、復号モジュール10は、“split_coding_unit_flag”に関するビット列とシンタックス値との対応付けを参照して、バイナリからシンタックス値を導出して、導出したシンタックス値をCU情報復号部11に返す。
【0115】
[CU情報復号部]
CU情報復号部11は、復号モジュール10を用いて、動画像符号化装置2から入力された1フレーム分の符号化データ#1について、ツリーブロックおよびCUレベルでの復号処理を行う。CU情報復号部11は、具体的には、以下の手順により符号化データ#1を復号する。
【0116】
まず、CU情報復号部11は、符号化データ#1に含まれる各種ヘッダを参照して、符号化データ#1を、スライス、ツリーブロックに順次分離する。
【0117】
ここで、各種ヘッダには、(1)対象ピクチャのスライスへの分割方法についての情報、および(2)対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報が含まれる。
【0118】
そして、CU情報復号部11は、ツリーブロックヘッダTBLKHに含まれるツリーブロック分割情報SP_TBLKを参照して、対象ツリーブロックをCUに分割する。
【0119】
次に、CU情報復号部11は、分割により得られたCUに対応する符号化単位情報(以下、CU情報と称する)を取得する。CU情報復号部11は、ツリーブロックに含まれる各CUを順に対象CUとして、対象CUに対応するCU情報の復号処理を実行する。
【0120】
すなわち、CU情報復号部11は、対象CUについて得られる変換ツリーに関するTT情報TTI、および、対象CUについて得られる予測ツリーに関するPT情報PTIを逆多重化する。
【0121】
なお、TT情報TTIには、上述のとおり、変換ツリーに含まれるTUに対応するTU情報TUIが含まれる。また、PT情報PTIには、上述のとおり、対象予測ツリーに含まれるPUに対応するPU情報PUIが含まれる。
【0122】
CU情報復号部11は、対象CUについて得られたPT情報PTIをPU情報復号部12に供給する。また、CU情報復号部11は、対象CUについて得られたTT情報TTIをTU情報復号部13に供給する。
【0123】
[PU情報復号部]
PU情報復号部12は、復号モジュール10を用いて、CU情報復号部11から供給されるPT情報PTIについて、PUレベルでの復号処理を行う。PU情報復号部12は、具体的には、以下の手順によりPT情報PTIを復号する。
【0124】
PU情報復号部12は、PU分割タイプ情報Part_typeを参照して、対象予測ツリーにおけるPU分割タイプを決定する。続いて、PU情報復号部12は、対象予測ツリーに含まれる各PUを順に対象PUとして、対象PUに対応するPU情報の復号処理を実行する。
【0125】
すなわち、PU情報復号部12は、対象PUに対応するPU情報から、予測画像の生成に用いられる各パラメータの復号処理を行う。
【0126】
PU情報復号部12は、対象PUについて復号したPU情報を、予測画像生成部14に供給する。
【0127】
[TU情報復号部]
TU情報復号部13は、復号モジュール10を用いて、CU情報復号部11から供給されるTT情報TTIについて、TUレベルでの復号処理を行う。TU情報復号部13は、具体的には、以下の手順によりTT情報TTIを復号する。
【0128】
TU情報復号部13は、TT分割情報SP_TUを参照して、対象変換ツリーをノードまたはTUに分割する。なお、TU情報復号部13は、対象ノードについて、さらに分割を行うことが指定されていれば、再帰的にTUの分割処理を行う。
【0129】
分割処理が終了すると、TU情報復号部13は、対象予測ツリーに含まれる各TUを順に対象TUとして、対象TUに対応するTU情報の復号処理を実行する。
【0130】
すなわち、TU情報復号部13は、対象TUに対応するTU情報から、変換係数の復元に用いられる各パラメータの復号処理を行う。
【0131】
TU情報復号部13は、対象TUについて復号したTU情報を、逆量子化・逆変換部15に供給する。
【0132】
[予測画像生成部]
予測画像生成部14は、対象CUに含まれる各PUについて、PT情報PTIに基づいて予測画像を生成する。具体的には、予測画像生成部14は、対象予測ツリーに含まれる各対象PUについて、対象PUに対応するPU情報PUIに含まれるパラメータに従ってイントラ予測またはインター予測を行うことにより、復号済み画像である局所復号画像P’から予測画像Predを生成する。予測画像生成部14は、生成した予測画像Predを加算器17に供給する。
【0133】
なお、予測画像生成部14が、動き補償予測パラメータ(動きベクトル、参照画像インデックス、インター予測フラグ)に基づいて対象CUに含まれるPUの予測画像を生成する手法について説明すると以下のとおりである。
【0134】
インター予測フラグが単予測を示す場合、予測画像生成部14は、参照画像インデックスの示す参照画像の動きベクトルが示す場所に位置する復号画像に相当する予測画像を生成する。
【0135】
一方、インター予測フラグが双予測を示す場合には、予測画像生成部14は、2組の参照画像インデックスと動きベクトルとの組み合わせのそれぞれについて動き補償により予測画像を生成し、平均を算出することで、もしくは、各予測画像を対象ピクチャと各参照画像との表示時間間隔に基づいて重み付け加算することで、最終的な予測画像を生成する。
【0136】
[逆量子化・逆変換部]
逆量子化・逆変換部15は、対象CUに含まれる各TUについて、TT情報TTIに基づいて逆量子化・逆変換処理を実行する。具体的には、逆量子化・逆変換部15は、対象変換ツリーに含まれる各対象TUについて、対象TUに対応するTU情報TUIに含まれる量子化予測残差を逆量子化および逆直交変換することによって、画素毎の予測残差Dを復元する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことを指す。したがって、逆直交変換は、周波数領域から画素領域への変換である。また、逆直交
変換の例としては、逆DCT変換(Inverse Discrete Cosine Transform)、および逆D
ST変換(Inverse Discrete Sine Transform)等が挙げられる。逆量子化・逆変換部1
5は、復元した予測残差Dを加算器17に供給する。
【0137】
[フレームメモリ]
フレームメモリ16には、復号された復号画像Pが、当該復号画像Pの復号に用いられたパラメータと共に、順次記録される。フレームメモリ16には、対象ツリーブロックを復号する時点において、当該対象ツリーブロックよりも先に復号された全てのツリーブロック(例えば、ラスタスキャン順で先行する全てのツリーブロック)に対応する復号画像が記録されている。フレームメモリ16に記録される復号パラメータの例としては、CU予測方式情報PredModeなどが挙げられる。
【0138】
[加算器]
加算器17は、予測画像生成部14より供給される予測画像Predと、逆量子化・逆変換部15より供給される予測残差Dとを加算することによって、対象CUについての復号画像Pを生成する。
【0139】
なお、動画像復号装置1において、画像内の全てのツリーブロックに対して、ツリーブロック単位の復号画像生成処理が終わった時点で、動画像復号装置1に入力された1フレーム分の符号化データ#1に対応する復号画像#2が外部に出力される。
【0140】
以下では、(1)CU情報復号部11、(2)PU情報復号部12、および(3)TU情報復号部13の構成について、それぞれの構成に対応する復号モジュール10の構成と共に詳細に説明する。
【0141】
(1)CU情報復号部の詳細
次に、
図1を用いて、CU情報復号部11および復号モジュール10の構成例について説明する。
図1は、動画像復号装置1において、CU予測情報を復号するための構成、すなわちCU情報復号部11および復号モジュール10の構成について例示する機能ブロック図である。
【0142】
以下、CU情報復号部11および復号モジュール10の順で、各部の構成について説明する。
【0143】
(CU情報復号部)
図1に示すように、CU情報復号部11は、CU予測モード決定部111、PUサイズ決定部112、およびPUサイズテーブル113を備える。
【0144】
CU予測モード決定部111は、CU予測モードの符号化データおよびシンタックス種別と、PU分割タイプの符号化データおよびシンタックス種別とを、復号モジュール10に供給する。また、CU予測モード決定部111は、復号モジュール10から、復号されたCU予測モードのシンタックス値と、PU分割タイプのシンタックス値とを取得する。
【0145】
具体的には、CU予測モード決定部111は、次のようにして、CU予測モードおよびPU分割タイプを決定する。
【0146】
まず、CU予測モード決定部111は、スキップフラグSKIPを復号モジュール10により復号して、対象CUがスキップCUであるか否かを決定する。
【0147】
対象CUがスキップCUでない場合、CU予測タイプ情報Pred_typeを復号モ
ジュール10により復号する。また、CU予測タイプ情報Pred_typeに含まれるCU予測方式情報PredModeに基づいて、対象CUがイントラCUか、インターCUかを決定するとともに、PU分割タイプ情報PartModeに基づいてPU分割タイプを決定する。
【0148】
PUサイズ決定部112は、PUサイズテーブル113を参照して、対象CUのサイズと、CU予測モード決定部111において決定されたCU予測タイプおよびPU分割タイプとから、PUの個数およびサイズを決定する。
【0149】
PUサイズテーブル113は、CUのサイズとCU予測タイプ−PU分割タイプとの組み合わせにPUの個数およびサイズを対応付けるテーブルである。
【0150】
ここで、
図5を用いて、PUサイズテーブル113の具体的な構成例について説明すると次のとおりである。
【0151】
図5に示すPUサイズテーブル113では、CUのサイズと、PU分割タイプ(イントラCUおよびインターCU)に応じて、PUの個数およびサイズが定義されている。なお、表中の“d”は、CUの分割深度を示す。
【0152】
PUサイズテーブル113では、CUのサイズとして、64×64、32×32、16×16、および8×8の4つが定義されている。
【0153】
また、PUサイズテーブル113では、CUのサイズに対して、各PU分割タイプにおけるPUの個数およびサイズが定義されている。
【0154】
例えば、64×64のインターCUであって、2N×N分割である場合は、PUは2個でサイズは共に64×32である。
【0155】
また、64×64のインターCUであって、2N×nU分割である場合は、PUは2個でサイズは64×16と64×48とである。
【0156】
また、8×8のイントラCUであって、N×N分割である場合は、PUは4個でサイズはすべて4×4である。
【0157】
なお、スキップCUのPU分割タイプは、2N×2Nと推定される。また、表中、“−”で示している箇所は、選択できないPU分割タイプであることを示している。
【0158】
すなわち、CUサイズが、8×8の場合、インターCUにおいて、非対称パーティション(2N×nU、2N×nD、nL×2N、およびnR×2N)のPU分割タイプは選択不可である。また、インターCUの場合、N×NのPU分割タイプは、選択不可である。
【0159】
また、イントラ予測では、CUサイズが、8×8の場合のみ、N×NのPU分割タイプを選択することが可能である。
【0160】
(復号モジュール)
図1に示すように、復号モジュール10は、CU予測モード復号部(復号手段、変更手段)1011、二値化情報記憶部1012、コンテキスト記憶部1013、および確率設定記憶部1014を備える。
【0161】
CU予測モード復号部1011は、CU予測モード決定部111から供給される符号化
データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。具体的には、CU予測モード復号部1011は、二値化情報記憶部1012に記憶されている二値化情報に従って、CU予測モードおよびPU分割タイプの復号処理を行う。また、CU予測モード復号部1011は、スキップフラグの復号処理を行う。
【0162】
二値化情報記憶部1012には、CU予測モード復号部1011が、バイナリから、シンタックス値を復号するための二値化情報が記憶されている。二値化情報は、バイナリ(bin列)と、シンタックス値との対応付けを示す情報である。
【0163】
コンテキスト記憶部1013には、CU予測モード復号部1011が、復号処理の際に参照するコンテキストが記憶されている。
【0164】
確率設定記憶部1014には、CU予測モード復号部1011が、符号化データから算術復号処理によりbin列を復号する際に参照する確率設定値が記録されている。なお、確率設定値は、各コンテキストに対応する記録設定値と、既定の確率設定値がある。各コンテキストに対応する確率設定値は、算術復号の結果に基づいて更新される。一方、既定の確率設定値は一定であり、算術復号の結果により更新されない。なお、確率設定値は、確率の値自体ではなく、確率の値に対応する整数値で示される状態で表現しても良い。
【0165】
[具体的構成例]
[1−1]コンテキストの参照を制限する構成の例
CU予測モード復号部1011は、PU分割タイプが非対称パーティションであるとき、非対称パーティションの分割の種類を示す情報を、CABACのコンテキストを用いないで復号処理を行ってもかまわない。言い換えると、非対称パーティションの分割の種類を示す情報に対応するbin列を算術復号により符号化データから復号する際に、確率設定記憶部1014にコンテキスト毎に記録された確率設定値を用いず、既定の確率設定値(例えば0,1の発生確率が等確率に対応する確率設定値)を用いて復号処理を行ってもかまわない。
【0166】
以下、
図7を参照しながら、このようにコンテキストの参照の制限を行う構成について例示する。
【0167】
CU予測モード復号部1011は、規定の確率を仮定して非対称パーティションの分割の種類を示す情報を復号する。
【0168】
図7を参照しながら、本構成例についてさらに具体的に例示すると次のとおりである。
図7に示す対応付けテーブルBT1では、長方形の分割について、プレフィックス部は、分割の方向が横長(水平)および縦長(垂直)のいずれであるかを示しており、サフィックス部は、分割の種類を示している。
【0169】
例えば、プレフィックス部が、PU分割タイプが横長の分割であることを示すとき、サフィックス部は、2N×N、2N×nU、および2N×nDの3つの横長の分割のうち、いずれを選択するかを示す。
【0170】
CU予測モード復号部1011は、PU分割タイプが、長方形の分割である場合、確率設定記憶部1014に設定されているコンテキスト毎に記録された確率設定値の代わりに、確率設定記憶部1014に設定されている既定の確率設定値を参照して、サフィックス部の各binの算術復号を行う。なお、当該確率設定値は、例えば、等確率を仮定して設定しておくことができる。
【0171】
ここで、コンテキストを用いたCABACの算術復号とは、バイナリの位置(コンテキスト)に応じてバイナリ値の発生確率(を示す状態)を記録・ 更新しておき、その発生
確率(状態)に基づき算術復号を行う処理のことを言う。一方、コンテキストを用いないCABACの算術復号とは、バイナリ値の発生確率(状態)の更新を行わず確率設定値により定まる固定確率に基づき算術復号を行うことを言う。コンテキストを用いない場合には、符号化処理、復号処理における発生確率(状態)の更新が不要である分、処理負荷が低減されスループットが向上する。またコンテキストに応じた発生確率(状態)を蓄積するメモリが不要になる。固定確率として、確率0.5を用いる場合は、EP符号化(等確率、Equal Probability符号化)もしくはBypass(バイパス)と呼ばれることがある。
【0172】
図6を用いて、上記構成による作用・効果を説明する。まず、コンテキストが符号化効率の向上に有効なのは、特定の状況において、同一の符号が連続して発生する場合である。コンテキストを参照してサフィックス部を復号することで符号化効率が向上するのは、具体的には、横長の分割が選択された状況において、2N×N、2N×nU、または2N×nDが連続して選択される場合である。例えば、2N×Nが選択された予測単位の次の予測単位において、2N×Nが選択されるような場合である。
【0173】
一方、パーティションは、
図6に示すようにエッジ境界をまたがないように設定される場合が多い。
【0174】
すなわち、
図6に示すように、傾斜を有するエッジE1が領域内に存在するとき、当該エッジE1をまたがないように、CU10およびC20のPU分割タイプが決定される。
【0175】
より詳細には、CU10では、エッジE1は、領域の垂直方向中央寄りに存在し、CU20では、エッジE1が領域上方に存在する。
【0176】
このように傾斜を有するエッジE1が領域内に存在する場合、CU10は、エッジE1をまたがないように、2N×NのPU分割タイプにより対称なPU11およびPU12分割される。
【0177】
また、CU20は、エッジE1をまたがないように、2N×nUの分割タイプにより、非対称なPU21およびPU22に分割される。
【0178】
このように、傾斜を有するエッジE1が、領域内に存在する場合、同一の形状のパーティションが連続して出現しないときがある。
【0179】
このような場合は、2N×N、2N×nU、または2N×nDが連続して選択される場合に該当しない。このような場合には、コンテキストを用いなくても符号化効率が低下しない場合がある。
【0180】
上記構成のように、プレフィックス部を規定の確率を仮定して上記情報を復号することで、符号化効率を維持しつつ、pred_typeの復号処理を簡略化することができる。
【0181】
[作用・効果]
本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、長方形の予測単位への分割を含み、上記長方形が縦長および横長のいずれであるかを示す符号と、上記
長方形の種類を示す符号とを含む、上記長方形の予測単位への分割を特定するための符号のうち、上記長方形の種類を示す符号を、コンテキストを用いずに復号する復号手段を備える構成である。
【0182】
よって、符号化効率を維持しつつ、コンテキストを参照しないことによる処理の簡略化を図ることができる。
【0183】
なお、上記の例は、複数の長方形パーティションを含むPU分割に対応するPU分割タイプの集合であって、対称分割と非対称分割の分割タイプを共に含むPU分割タイプの集合において、何れかのPU分割タイプを選択するための情報を復号する際に、コンテキストを用いずに復号してもよい、と表現することもできる。
【0184】
また、上記の例において、非対称パーティションの選択に係る情報に対応するbin列のうち、全てのbinの復号にコンテキストを用いないのではなく、一部のbinにコンテキストを用いてもよい。例えば、上述した
図7の例では、8×8より大きいCUで長方形パーティションを含む分割が選択された場合、最大2桁のbinが複号される。このうち1桁目は対称分割か非対称分割かを示す情報である。2桁目は、1桁目が‘0’すなわち非対称分割であることを示す場合に複号されるbinであって、非対称分割における小さいPUと大きいPUの位置関係を表す。1桁目については、前述の
図6に基づき説明した理由から同一の符号が連続しない場合もあるため、コンテキストを設定しないことが好ましい。一方、2桁目については、非対称パーティションが利用されるという前提条件が成立した状態において、小さいPUは局所的には片側の辺(例えば2桁目が2NxnUと2N×nDの選択情報を表す場合、上方側または下方側の何れか)に寄りやすい傾向があるため、コンテキストを設定することが好ましい。
【0185】
[1−2]CU予測タイプ情報(pred_type)を復号する構成CU予測モード復号部1011は、以下に示すように、二値化情報記憶部1012に記憶される二値化情報を参照してCU予測タイプ情報を復号するよう構成してもよい。
【0186】
図7を用いて、二値化情報記憶部1012に記憶される二値化情報の構成例について説明する。
図7は、CU予測タイプおよびPU分割タイプの組み合わせと、bin列との対応付けを定義する二値化情報の一例を示すテーブルである。
【0187】
なお、
図7では、例示的に、二値化情報を、bin列と、CU予測タイプ−PU分割タイプとを対応付けるテーブル形式にて示しているが、これに限られない。二値化情報は、PU分割タイプと、CU予測タイプとを導出するための導出式であってもかまわない。後に説明する二値化情報についても同様である。
【0188】
また、二値化情報は、データとして記憶されていなければならないわけではなく、復号処理を行うプログラムのロジックとして実現されていてもかまわない。
【0189】
図7に例示する対応付けテーブルBT1では、CU予測タイプおよびPU分割タイプと、CUサイズとに応じて、bin列が対応付けられている。
【0190】
まず、CUサイズの定義について説明する。対応付けテーブルBT1では、CUサイズの定義として、CUサイズが8×8より大きい場合(CU>8×8)の非8×8CU1012Bと、CUサイズが8×8(CU==8×8)の場合の8×8CU1012Aの2種類の対応付けが定義されている。
【0191】
なお、非8×8CU1012Bおよび8×8CU1012Aそれぞれにおいて対応付け
られているbin列は、プレフィックス部(prefix)とサフィックス部(suffix)とから構成される。
【0192】
また、対応付けテーブルBT1では、それぞれのCUサイズの定義について、CU予測タイプとして、前述のイントラCU(“Intra”と図示)およびインターCU(“Inter”と図示)の2系統が定義されている。さらに、それぞれのCU予測タイプに応じて、PU分割タイプが定義されている。
【0193】
具体的には、以下のとおりである。まず、イントラCUの場合、2N×2NおよびN×Nの2種類のPU分割タイプについて定義されている。
【0194】
2N×2Nについて説明すると次のとおりである。非8×8CU1012Bでは、プレフィックス部のみが定義されており、bin列は、“000”である。サフィックス部は、符号化されていない。また、8×8CU1012Aでは、プレフィックス部は、“000”であり、サフィックス部は、“0”である。
【0195】
一方、N×Nについては、非8×8CU1012Bにのみ定義されている。この場合、プレフィックス部は、“000”であり、サフィックス部は、“1”である。
【0196】
このように、イントラCUの場合は、サフィックス部については、“000”で共通である。
【0197】
次に、インターCUの場合、2N×2N、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2Nの7つのPU分割タイプについて定義されている。
【0198】
PU分割タイプが、2N×2Nのときは、非8×8CU1012Bおよび8×8CU1012Aのいずれにおいても、プレフィックス部のみが定義されており、bin列は、“1”である。
【0199】
非8×8CU1012Bでは、水平方向の分割を行う横長パーティションのPU分割タイプ、2N×N、2N×nU、および、2N×nDについて、共通のプレフィックス部“01”が割り当てられている。
【0200】
また、2N×N、2N×nU、および、2N×nDのサフィックス部は、それぞれ、“1”、“00”、および“01”である。
【0201】
また、垂直方向の分割を行う縦長パーティションのPU分割タイプ、N×2N、nL×2N、および、nR×2Nについて、共通のプレフィックス部“001”が割り当てられている。
【0202】
N×2N、nL×2N、および、nR×2Nのサフィックス部は、それぞれ、“1”、“00”、および“01”である。サフィックス部については、上述の水平方向の分割を行うPU分割タイプの場合と同様である。
【0203】
つまり、横長パーティションおよび縦長パーティションの定義では、サフィックス部は、分割の種類を表している。すなわち、対称分割である場合、binは、“1”である。また、“00”は、分割の境界が対称分割のときよりも原点側にあることを示し、“01”は、分割の境界が対称分割のときよりも原点から遠い側にあることを示している。
【0204】
続いて、8×8CU1012Aでは、2N×2N、2N×N、および、N×2Nについ
てプレフィックス部のみが定義されている。2N×2N、2N×N、および、N×2Nのプレフィックス部は、それぞれ、“1”、“01”、および、“001”である。
【0205】
CU予測モード復号部1011は、上記の二値化情報に従った復号処理において、プレフィックス部およびサフィックス部の各bin位置に対して異なるコンテキストを用いてもよい。
【0206】
プレフィックス部およびサフィックス部の各bin位置に対して異なるコンテキストを用いる場合、コンテキストは、以下の合計8個になる。
【0207】
まず、プレフィックス部は、最大3ビットのbinが定義されているため、コンテキストの数は、3個である。
【0208】
以下、サフィックス部については、まず、2N×2NおよびN×Nの場合、1個である。そして、横長パーティション(2N×N、2N×nU、および、2N×nD)の場合、2個であり、縦長パーティション(N×2N、nL×2N、および、nR×2N)の場合、2個である。
【0209】
[1−3]小サイズのCUにおいて、イントラCUについて短い符号を復号する構成CU予測モード復号部1011は、小サイズのCUにおいて、イントラCUについて短い符号を復号するよう構成してもよい。小サイズのCUとは、所定サイズ以下のサイズのCUであるが、以下では、例示的に、8×8サイズのCUとする。
【0210】
[構成例1−3−1]
そこで、
図8に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
図8は、二値化情報の定義である8×8CU1012Aの他の構成例を示している。すなわち、
図8に示す8×8CU1012A_1は、
図7に示す対応付けテーブルBT1に含まれる8×8CU1012Aの他の構成例である。
【0211】
図8に示すように、二値化情報の定義である8×8CU1012A_1では、小サイズのCUである8×8サイズのCUにおいて、イントラCUに短い符号を割り当てる。
【0212】
図8に示す8×8CU1012A_1では、大サイズのCUにおいてイントラCUに対して割り当てられている符号に比べて短い符号が割り当てられている(
図7の非8×8CU1012Bを参照)。なお、大サイズのCUとは、小サイズのCUでないCUのことであり、具体的には、サイズが8×8より大きいCUのことを意味する。
【0213】
また、8×8CU1012A_1では、イントラCUに割り当てられている符号のほうが、インターCUに割り当てられている符号よりも短い。言い換えれば、同一サイズのCUにおいては、イントラCUでない他のPU分割タイプに比べて、イントラCUに短い符号が割り当てられる。
【0214】
例えば、8×8CU1012A_1では、イントラCUには、1ビットの符号が割り当てられており、インターCUには、2ビットまたは3ビットの符号が割り当てられている。
【0215】
インター予測が当たりにくい領域では、小さいCUのイントラ予測が用いられる傾向がある。そのため、小さいCUでは、イントラCUの使用率が高い。一方、
図7に示す構成例では、イントラCUに長い符号が割り当てられている。これに対して、上記データ構成によれば、小さいサイズのイントラCUに短い符号が割り当てられるようにする。
【0216】
これにより、インター予測が当たりにくい領域では、CU予測モード復号部1011は、小さいサイズのイントラCUについて、短い符号を復号する。これにより、符号化効率が向上するという効果を奏する。
【0217】
なお、上記構成では、CU予測モード復号部1011は、大サイズのCUのプレフィックス部と、小サイズのCUのプレフィックス部とで、異なるコンテキストを設定することが好ましい。
【0218】
そこで、コンテキスト記憶部1013において、大サイズのCUのプレフィックス部を復号するためのコンテキストである8×8CU prefix1013Aと、小サイズの
CUのプレフィックス部を復号するためのコンテキストである非8×8CU prefi
x1013Bとが記憶されていてもよい。ここで、8×8CU prefix1013A
と、非8×8CU prefix1013Bとは異なるコンテキストである。
【0219】
小サイズのCU(CU==8×8)と、大サイズのCU(CU>8×8)との間で、プレフィックス部の各binの意味が異なる。
【0220】
例えば、プレフィックス部の1ビット目は、小サイズのCUでは、CU予測タイプが、イントラCUおよびインターCUのいずれであるかを示す情報であるのに対して、大サイズのCUでは、2N×2NのインターCUであるか、それとも、それ以外のインターCUであるかを示す情報である。
【0221】
また、意味が異なるbinは、出現傾向が異なる。このため、大サイズのCUおよび小サイズのCU、双方のプレフィックス部に、同一のコンテキストを設定した場合、binの出現傾向が異なるため、符号化効率が低下するおそれがある。
【0222】
上記構成によれば、出現傾向が異なるbinに合わせて、異なるコンテキストを設定することができるため、binの符号化効率を向上させることができる。
【0223】
[構成例1−3−2]
また、
図9に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
図9は、二値化情報の定義である8×8CU1012Aの別の構成例を示している。すなわち、
図9に示す8×8CU1012A_2は、
図7に示す対応付けテーブルBT1に含まれる8×8CU1012Aの別の構成例である。
【0224】
図9に示す8×8CU1012A_2では、bin列が、フラグ(flag)、プレフィックス部およびサフィックス部の3つの部分から構成されている。
【0225】
イントラCUの場合、フラグは、“1”であり、インターCUの場合、フラグは、“0”である。
【0226】
また、イントラCUの場合、サフィックス部のみが定義されている。すなわち、PU分割タイプが、2N×2Nのときは、サフィックス部が“0”であり、N×Nのときは、サフィックス部が“1”である。
【0227】
一方、インターCUの場合、プレフィックス部のみが定義されている。すなわち、2N×2N、2N×N、および、N×2Nのとき、それぞれ、“1”、“01”、および、“00”である。
【0228】
図9に示す8×8CU1012A_2では、
図8に示した8×8CU1012A_1と同様、大サイズのCUにおいてイントラCUに対して割り当てられている符号に比べて短い符号が割り当てられているとともに、イントラCUに割り当てられている符号のほうが、インターCUに割り当てられている符号よりも短い。
【0229】
図9に示すように8×8CU1012A_2を構成することで、インター予測が当たりにくい領域では、CU予測モード復号部1011は、小さいサイズのイントラCUについて、短い符号を復号する。これにより、符号化効率が向上するという効果を奏する。
【0230】
なお、上記構成では、フラグに、プレフィックス部およびサフィックス部に設定されているコンテキストとは別の独自のコンテキストを設定することが好ましい。また、プレフィックス部には、小サイズのCUおよび大サイズのCUの間で、同一のコンテキストを設定することが好ましい。
【0231】
例えば、コンテキスト記憶部1013において、8×8CU prefix1013A
と、非8×8CU prefix1013Bとを統合した一つのコンテキストを記憶して
おけばよい。
【0232】
上記構成では、小サイズのCUのプレフィックス部と、大サイズのCUのプレフィックス部との間で、各binが、同じ意味となるよう設計されている。このため、両者の間で、同一のコンテキストを設定することで、binの符号化効率を向上させることができる。
【0233】
[作用・効果]
本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位毎に、画像を復元するための情報を画像符号化データから復号して画像を復元する画像復号装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を復号する復号手段を備える構成である。
【0234】
よって、所定サイズ以下のサイズの符号化単位において発生確率が高い組み合わせに短い符号を割り当てることができ、符号化効率が向上するという効果を奏する。
【0235】
[1−4]近傍の予測パラメータに応じてbin列の解釈を変更する構成
CU予測モード復号部1011は、隣接領域に割り付けられている予測パラメータを参照して、bin列の解釈を変更するよう構成してもよい。
【0236】
[構成例1−4−1]
そこで、
図10に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
【0237】
図10は、二値化情報記憶部1012に記憶される二値化情報のさらに別の構成例を示す図である。
【0238】
図10に示す二値化情報対応付けテーブルBT20では、
図7に示す8×8CU1012Aを、インターCUの定義(1012D)およびイントラCUの定義(1012C)に置き換えることで、隣接領域の予測パラメータの値に応じて、bin列の解釈が変わるように構成されている。
【0239】
具体的には、対応付けテーブルBT20では、小サイズのCUについての定義において、隣接CUの少なくとも一方がインターCUの場合における二値化情報の定義であるインターCU1012Dと、隣接CUが共にイントラCUの場合における二値化情報の定義であるイントラCU1012Cとの間で、bin列の解釈が変わるように構成されている。
【0240】
インターCU1012D(隣接CUの少なくとも一方がインターCUの場合)では、プレフィックス部のbin列が“000”のとき、対象CUがイントラCU(2N×2NまたはN×N)であると解釈し、プレフィックス部のbin列が“1”のとき、対象CUがインターCUの2N×2Nであると解釈する。
【0241】
一方、イントラCU1012C(隣接CUが共にイントラCUの場合)では、プレフィックス部のbin列が“1”であるとき、対象CUがイントラCU(2N×2NまたはN×N)であると解釈し、プレフィックス部のbin列が“000”のとき、対象CUがインターCUの2N×2Nであると解釈する。
【0242】
近傍のCUが、イントラCUである場合、空間相関性により、対象CUもイントラCUである可能性が高い。よって、近傍のCUがイントラCUである場合に、イントラCUに対して、短い符号に割り当てることで、符号量を削減することができる。
【0243】
また、小サイズのCUでは、イントラCUの発生頻度が高くなる。このため、小さいサイズのCUにおいて、イントラCUに対して短い符号に割り当てることで、符号化効率のより一層の向上を図ることができる。
【0244】
これに対して、小サイズのCUでないCU(例えば、大サイズのCU)では、
図10に示すように、“隣接CUが共にイントラの場合、イントラCUに対して短い符号に割り当てる”構成でなくてもかまわない。どのサイズのCUにおいて、“隣接CUが共にイントラの場合、イントラCUに対して短い符号に割り当てる”構成を適用するかは、イントラCUの発生頻度に応じて決定することができる。一般には、小さいサイズのCUほどイントラCUの選択率が高い傾向があるため、最小サイズのCUを含め、所定の大きさ(例えば16×16)以下のサイズのCUでイントラCUに対して短い符号を割り当てる構成とすることが好ましい。上記構成によれば、近傍のCUがイントラCUである場合、CU予測モード復号部1011が、イントラCU1012Cを参照し、イントラCUに対して、短い符号に割り当てる。一方、近傍のCUにインターCUが含まれている場合、CU予測モード復号部1011が、インターCU1012Dを参照し、インターCUに対して、短い符号に割り当てる。その結果、符号量を削減し、符号化効率の向上を図ることができる。
【0245】
[構成例1−4−2]
また、
図11に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
【0246】
図11は、二値化情報記憶部1012に記憶される二値化情報のさらに別の構成例を示す図である。
【0247】
図11に示す二値化情報対応付けテーブルBT30では、
図7に示す非8×8CU1012Bを、『上CUのサイズが対象CU以上』の定義(1012B_1)および『上CUのサイズが対象CUより小さい』の定義(1012B_2)に置き換えることで、隣接領域の予測パラメータの値に応じて、bin列の解釈が変わるように構成されている。
【0248】
すなわち、対応付けテーブルBT30では、大サイズのCUについての定義において、上隣接CUが対象CU以上のサイズである場合と、上隣接CUが対象サイズより小さい場合との間で、bin列の解釈が変わるように構成されている。
【0249】
『上CUのサイズが対象CU以上』1012B_1(上隣接CUが対象CU以上のサイズである場合)では、プレフィックス部のbin列が“001”のとき、対象CUが縦長パーティションであると解釈し、プレフィックス部のbin列が“01”のとき、対象CUが横長パーティションであると解釈する。
【0250】
一方、『上CUのサイズが対象CUより小さい』1012B_2(上隣接CUが対象CUより小さいサイズである場合)では、プレフィックス部のbin列が“01”のとき、対象CUが縦長パーティションであると解釈し、プレフィックス部のbin列が“001”のとき、対象CUが横長パーティションであると解釈する。
【0251】
隣接CUのサイズが対象CUより小さい場合、当該隣接CU内にエッジが存在する可能性が高い。
【0252】
従って、このような場合、対象CUは、隣接CUとの境界にあたる辺と垂直な方向にパーティション分割される可能性が高い。このため、上隣接CUが対象CUより小さいサイズである場合、縦長パーティションが選択される可能性が高い。
【0253】
よって、上隣接CUが対象CUより小さいサイズである場合、選択される可能性が高い縦長パーティションに短い符号を割り当てることで符号化効率を向上させることができる。
【0254】
上記構成によれば、上隣接CUが対象CUより小さいサイズである場合、CU予測モード復号部1011が、『上CUのサイズが対象CUより小さい』1012B_2を参照し、縦長パーティションに短い符号を割り当てる。
【0255】
一方、上隣接CUが対象CU以上のサイズである場合、CU予測モード復号部1011が、『上CUのサイズが対象CU以上』1012B_1を参照し、横長パーティションに短い符号を割り当てる。その結果、符号量を削減し、符号化効率の向上を図ることができる。
【0256】
さらにいえば、隣接CUに基づくプレフィックス部の解釈に依存せず、サフィックス部の解釈が同じであることが好ましい。対応付けテーブルBT30では、プレフィックス部が、縦長パーティションか、横長パーティションかに依存せず、同一のサフィックス部の解釈は同じである。すなわち、対応付けテーブルBT30の例では、プレフィックス部が、縦長パーティションか、横長パーティションかに応じて、サフィックス部の復号処理を変更しなくてもかまわない。
【0257】
すなわち、対応付けテーブルBT30では、PU分割タイプ(分割数)が、参照するパラメータに依存しないように構成されている。
【0258】
分割数が、参照するパラメータの値に依存しないため、参照パラメータにエラーが生じている場合でも、以降の可変長復号処理への影響が少ない。具体的には、隣接CUのサイズに誤りがあり、プレフィックス部が縦長と横長何れのパーティションを示すかの解釈が誤った場合でも、サフィックス部を含め、後続のシンタックスの復号を継続できる。
【0259】
すなわち、隣接CUのサイズによらずサフィックス部の復号処理が可能となるため、隣
接パラメータのエラーに影響されなくなりエラー耐性が向上する。
【0260】
なお、左隣接CUが対象CUより小さいサイズである場合、横長パーティションが選択される可能性が高い。よって、左隣接CUが対象CUより小さいサイズである場合、選択されやすい横長パーティションに短い符号を割り当てるようにしてもよい。これにより上記と同様の効果を得る事ができる。
【0261】
また、最小サイズのCUに対しては、隣接CUのサイズに基づく解釈の切り替え処理を行わないことが好ましい。対象CUが最小サイズのCUである場合、常に対象CUは、隣接CU以下のサイズであるため、解釈の切り替え処理を省略することで、復号処理を簡略化することができる。
【0262】
なお、上隣接CUのサイズが対象CUのサイズより小さいとは、対象CUの上辺(頂点を除く)において、当該上辺に対して垂直な位置関係にあるCU境界が存在するとも言える。
【0263】
よって、対象CUの上辺(頂点を除く)において、当該上辺に対して垂直な位置関係にあるCU境界またはPU境界が存在する場合、縦長パーティションに短い符号を割り当ててもよい。
【0264】
また、以上では、対象CUに隣接する隣接CUについて説明したがこれに限られない。空間相関性が認められる程度に近傍に位置するCUについても同様のことがいえる。
【0265】
以上の構成を、より一般化して言えば次のとおりである。すなわち、以上の構成は、複数のバイナリ列と、複数の対応する分割数が互いに等しいpred_typeについて、隣接の予測パラメータに応じてpred_typeの発生可能性の優先順位を決定し、優先順位の高いpred_typeほど短いバイナリ列に関連付けるものである。
【0266】
なお、上記説明における、上側隣接CUのサイズが対象CUのサイズより小さい、という条件は、次のように表現することもできる。
【0267】
(1)対象CU内の左上画素を(xc,yc)とする。
【0268】
(2)上側隣接CUとして、(xc,yc-1)を含むCUを導出して、当該上側隣接CUの左
上画素を(xu,yu)とする。
【0269】
(3)「log2CUSize[xu][yu] < log2CUSize[xc][yc] 」が成り立つならば、上側隣接CUのサイズが対象CUのサイズより小さいと判定する。ここで、log2CUSize[x][y]は、(x,y)の画素を左上画素とするCUのサイズの2を底とする対数値である。
【0270】
ここで、上記のように対象CUの左上画素の上に位置するCUのサイズのみを対象CUのサイズと比較して判定することが好ましい。
【0271】
以上では、上側隣接CUの場合について記載したが、左側隣接CUのサイズを判定する場合にも、対象CUの左上画素の左に位置するCUのサイズのみを対象CUのサイズと比較して判定することが好ましい。
【0272】
なお、上記判定手順の(3)ではCUのサイズの値を直接比較する例を挙げたが、CUのサイズと関連付けられた別の値を比較してもよい。例えば、上記(3)の条件は、ツリーブロック(LCU)を何回分割するかに対応するCU分割深度(cuDepth[x][y])の値
を用いて、「cuDepth[xu][yu] > cuDepth[xc][yc]」という式により判定してもよい。
【0273】
[作用・効果]
本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、復号対象となる上記符号化単位である対象符号化単位を上記予測単位へ分割するタイプである分割タイプと予測方式との複数の組に対して対応付けられる複数の符号を、復号の対象となる上記予測単位である対象予測単位の近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて変更する変更手段を備える構成である。
【0274】
よって、近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てることができ、これにより符号化効率を向上させることができる。
【0275】
(2)PU情報復号部の詳細
次に、
図12を用いて、PU情報復号部12および復号モジュール10の構成例について説明する。
図12は、動画像復号装置1において、動き情報を復号するための構成、すなわちPU情報復号部12および復号モジュール10の構成について例示する機能ブロック図である。
【0276】
以下、PU情報復号部12および復号モジュール10の順で、各部の構成について説明する。
【0277】
(PU情報復号部)
図12に示すように、PU情報復号部12は、動き補償パラメータ導出部(双予測制限手段、候補決定手段、推定手段)121、マージ候補優先順位情報記憶部122、および参照フレーム設定情報記憶部123を備える。
【0278】
動き補償パラメータ導出部121は、符号化データから対象CUに含まれる各PUの動き補償パラメータを導出する。
【0279】
動き補償パラメータ導出部121は、具体的には、以下の手順にて、動き補償パラメータを導出する。ここで、対象CUがスキップCUである場合に、マージインデックスの代わりに、スキップインデックスを復号し、その値に基づいてスキップCUにおける予測パラメータを導出してもよい。
【0280】
まず、動き補償パラメータ導出部121は、スキップフラグを判定する。その結果、対象CUが非スキップCUであれば、動き情報復号部1021を用いて、マージフラグを復号する。
【0281】
ここで、対象CUが、スキップCUまたはマージPUである場合、動き補償パラメータ導出部121は、マージインデックスを復号して、復号したマージインデックスの値に基づいて予測パラメータ(動きベクトル、参照画像インデックス、インター予測フラグ)を導出する。なお、動き補償パラメータ導出部121は、マージ候補情報記憶部122に記憶されているマージ候補情報に従って、マージインデックスで指定されるマージ候補を決定する。
【0282】
一方、対象CUが、スキップCUおよびマージPUのいずれでもない場合、動き補償パラメータ導出部121は、予測パラメータ(インター予測フラグ、参照画像インデックス
、動きベクトル差分、推定動きベクトルインデックス)を復号する。
【0283】
さらに、動き補償パラメータ導出部121は、推定動きベクトルインデックスの値に基づいて、推定動きベクトルを導出するとともに、動きベクトル差分と推定動きベクトルとに基づいて動きベクトルを導出する。
【0284】
マージ候補情報記憶部122には、いずれの領域をマージ候補とするかを示す情報およびマージ候補の優先順位を示す情報を含むマージ候補情報が記憶されている。
【0285】
参照フレーム設定記情報記憶部123には、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れの画面間予測の予測方式を用いるかを決定するための参照フレーム設定記情報が記憶されている。
【0286】
(復号モジュール)
図12に示すように、復号モジュール10は、動き情報復号部1021を備える。動き情報復号部1021は、動き補償パラメータ導出部121から供給される符号化データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。動き情報復号部1021が復号する動き補償パラメータは、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、動きベクトル差分(mvd)である。
【0287】
[マージPUにおいて予測パラメータを導出するための構成例]
[2−1]マージ候補の位置および優先順位の例
図13〜
図15を用いて、マージPUにおける予測パラメータ導出について説明する。
【0288】
動き補償パラメータ導出部121は、PU分割タイプが非対称である場合、PU分割タイプが対称である場合と異なる方法でマージ候補の優先順位を決定する構成であってもよい。
【0289】
まず、非対称パーティションの特性について説明する。非対称パーティションでは、小さい方のパーティションに、長辺方向のエッジが存在する可能性が高い。また、エッジが存在する領域は、正確な動きベクトルが導出されている可能性が高い。
【0290】
図13を用いて、具体的に説明すると次のとおりである。
図13は、非対称パーティションが選択されたCUを示している。
図13に示すように、対象CU30では、傾斜を有するエッジE1が領域内に存在し、2N×nUのPU分割タイプが選択されている。
【0291】
対象CUには、PU31とPU32とが含まれる。ここで、対象PUをPU31とする。傾斜を有するエッジE1が、対象PU31の領域内を横断している。
【0292】
図13に示す例では、対象PU31の短辺側付近の領域R10にも、対象PU31の領域内に存在するエッジと同じエッジが存在する可能性が高い。従って、対象PU31と同じ動きベクトル(mv)が割り付けられている可能性が高い。
【0293】
従って、エッジが存在する可能性の高い領域、すなわち小さいパーティションでは、短辺側の領域に割り付けられている動きベクトルを参照し、大きいパーティションでは、小さいパーティションの周辺の領域に割り付けられている動きベクトルを参照することで、動きベクトルの精度を高めることができる。
【0294】
そこで、マージ候補優先順位情報記憶部122において記憶されているマージ候補優先順位情報を、対称PU分割タイプ122Aおよび非対称PU分割タイプ122Bの2つのマージ候補優先順位情報を含む構成とする。
【0295】
図14を用いて、対称PU分割タイプ122Aのマージ候補優先順位情報について説明すると次のとおりである。
【0296】
図14は、対称パーティションが選択されたCUを示している。
図14に示すように、対称CUでは、2N×NのPU分割タイプが選択されている。また、同図では、対象PUを、“Curr PU”にて示している。対象PUでは、マージ候補として、左(L)、
上(U)、右上(UR)、左下(BL)、左上(UL)の順に優先順位が割り当てられている。
【0297】
また、
図15を用いて、非対称PU分割タイプ122Bのマージ候補優先順位情報について説明すると次のとおりである。
図15の(a)および(b)は、それぞれ、2N×n
Uの小さい方のパーティション、および、2N×nUの大きい方のパーティションにおける優先順位の設定について示している。また、
図15の(c)および(d)は、それぞれ、2N×nDの大きい方のパーティション、および、2N×nDの小さい方のパーティションにおける優先順位の設定について示している。
【0298】
図15の(a)および(d)に示すように、非対称パーティション内の小さい方のパーティションでは、短辺側のマージ候補に高い優先順位を割り当てる。
【0299】
具体的には、2N×nUおよび2N×nDの小さい方のPUでは、それぞれ(a)および(d)に示すように、短辺に、隣接(L)、頂点に隣接(UR、BL、UL)、長辺に隣接(U)の順に優先順位が割り当てられている。
【0300】
また、
図15の(b)および(c)に示すように、非対称パーティション内の大きい方のパーティションでは、小さい方のパーティションに近い位置のマージ候補に高い優先順位を割り当てる。
【0301】
具体的には、2N×nUの大きい方のPUでは、
図15の(b)に示すように、小さい方のPU内におけるマージ候補(U)、小さい方のPUに近いマージ候補(UR、UL)、それ以外のマージ候補(L、BL)の順に優先度が割り当てられている。
【0302】
また、2N×nDの大きい方のPUでは、
図15の(c)に示すように、小さい方のPUに近いマージ候補(L、BL)それ以外のマージ候補(U、BL、UL)の順に優先順位が割り当てられている。
【0303】
なお、優先順位の高い候補に対して小さいマージインデックスを割り当て、小さいマージインデックスに短い符号を割り当てる。また、優先順位の高い候補のみを選択可能なマージ候補としてもよい。
【0304】
なお、上記の説明は、マージPUにおける予測パラメータ導出について記載したが、同様の導出方法をインターCU内の非マージPUにおいて動きベクトルの復元に用いる推定動きベクトルの導出に用いても良い。一般的には、非対称PU内の各PUにおいて、隣接領域に対応する動きパラメータの推定値または予測値を導出する際に、上記方式が適応できる。
【0305】
[作用・効果]
本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、上記分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う推定手段を備える構成である。
【0306】
よって、分割タイプが非対称分割である場合と、上記分割タイプが対称分割である場合とで異なる推定方法を変更することで、分割タイプに応じた好ましい推定方法により画面間予測の予測パラメータの推定を行うことができるという効果を奏する。
【0307】
[2−2]CUサイズとスキップ/マージとの組み合わせによるマージ候補の変更動き補償パラメータ導出部121は、CUサイズと、当該CUがスキップ/マージを行うCUであるか否かとの組み合わせに応じてマージ候補を変更する構成であってもよい。そこで、マージ候補優先順位情報記憶部122に記憶されるマージ候補情報を、小PUサイズ122Cおよび大PUサイズ122Dの2つの定義情報を含む構成とする。
【0308】
小PUサイズ122Cのマージ候補情報は、小サイズのPUに適用されるマージ候補数を定義する。また、大PUサイズ122Dのマージ情報は、大サイズのPUに適用されるマージ候補数を定義する。
【0309】
一例としては、マージ候補情報において、小PUサイズ122Cに定義されるマージ候補数(小サイズのPUのマージ候補数)が、大PUサイズ122Dに定義されるマージ候補数(大サイズのPUのマージ候補数)に比べて少なくなるよう定義する。
【0310】
小サイズのPUが選択される領域では、動きが複雑な場合が多い。このため、近傍のPUに割り付けられる動きベクトルの相関が小さくなる傾向がある。
【0311】
このため、マージ候補を増やしても大サイズのPUの場合に比べて推定精度の向上が少ない場合がある。
【0312】
よって、マージ候補数を少なくすることにより、サイド情報の符号量を削減するほうが好ましい。
【0313】
上記例では、マージ候補情報において、動きが複雑な場合が多い小サイズのPUのマージ候補数を大サイズのPUのマージ候補数に比べて少なくするため、サイド情報の符号量を削減することができる。
【0314】
小サイズPUと大サイズPUの組み合わせの例について列挙すると以下の通りである。・小サイズPUは少なくとも一辺が所定の閾値(例えば8)より小さいPUであり、大サイズPUはそれ以外のPUである。例えば、16×4、4×16、8×4、4×8、4×4のサイズのPUは小サイズPUであり、8×8、16×16のサイズのPUが大サイズPUとなる。
・小サイズPUは面積が所定の閾値(例えば64)より小さいPUであり、大サイズPUはそれ以外のPUである。例えば、8×4、4×8、4×4のサイズのPUは小サイズPUであり、8×8、16×4、4×16、16×16等のサイズのPUが大サイズPUとなる。
・小サイズPUは所定のサイズ(例えば8×8)以下のCUに含まれるPUであり、大サ
イズPUはそれより大きいCUに含まれるPUである。例えば、8×8CUに含まれる8×8、8×4、4×8、4×4のサイズのPUは小サイズPUである。
・小サイズPUは、非対称分割が適応されるCUにおいて、小さい方のPUであり、大サイズPUは、非対称分割が適応されるCUにおいて、大きい方のPUである。
【0315】
また、他の例としては、マージ候補情報において、小さいPUでは、時間予測によるマージ候補の数を、大きいPUにおける時間予測によるマージ候補の数に比べて少なくすることが好ましい。小さいPUでは、マージ候補情報において時間予測によるマージ候補を含めないように定義してもよい。
【0316】
また、小サイズのPUが選択されるような、動きが複雑な領域では、時間予測に使用されるcollocated PUと、対象PUとの相関が小さいため、時間予測が選択さ
れる可能性が低い。よって、時間予測によるマージ候補の数を減らす、または、時間予測によるマージ候補を含めないことが好ましい。
【0317】
[作用・効果]
本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、復号の対象となる上記予測単位である対象予測単位が、該対象予測単位の近傍の領域に割り付けられている予測パラメータから、該対象予測単位の予測パラメータの推定を行う予測単位である場合、該対象予測単位のサイズに応じて、推定に用いる領域の候補を決定する候補決定手段を備える構成である。
【0318】
よって、候補数を削減することによりサイド情報を削減することができ、その結果、符号化効率を向上させることができる。
【0319】
[2−3]参照フレーム数の決定
動き補償パラメータ導出部121は、参照フレーム設定情報記憶部123に記憶される参照フレーム設定情報を参照して、インター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
【0320】
また、動き補償パラメータ導出部121は、小サイズのPUでは、双予測を制限する構成であってもよい。そこで、参照フレーム設定情報を、小PUサイズ123Aおよび大PUサイズ123Bの2つの定義情報を含む構成とする。
【0321】
大PUサイズ123Bは、大きいサイズのPUにおいて選択可能な予測方式が定義される。大PUサイズ123Bでは、大きいサイズのPUにおいて双予測および単予測いずれの予測方式も制限なく選択できるよう定義される。
【0322】
小PUサイズ123Aは、小さいサイズのPUにおいて選択可能な予測方式が定義される。小PUサイズ123Aでは、小さいサイズのPUにおいて双予測が制限されるよう定義される。
【0323】
小PUサイズ123Aの定義の一例としては、インターCUに含まれる、マージを適用しないPUであって、サイズが16×16未満のPUにおいて、インター予測フラグの復号を省略して単予測を適用する旨定義する。
【0324】
また、小PUサイズ123Aの定義の他の例としては、インターCUに含まれる、マージを適用するPUであって、サイズが16×16未満のPUにおいて、単予測を適用する
旨定義する。
【0325】
また、小PUサイズ123Aの定義の別の例としては、スキップCUに含まれる各PUにおいて単予測を適用する。
【0326】
また、小PUサイズ123Aの定義のさらに別の例としては、インターCUに含まれる、マージを適用しないPUであって、サイズが16×16未満のPUにおいて、重み付け予測を適用しない。すなわち、重み付け予測に関する情報を省略する。
【0327】
以下、参照フレーム設定情報に基づき双予測を制限する場合に関し、シンタックステーブル及びブロック図を用いて、さらに、符号化データの構成、及び、動画像復号装置の構成の詳細を説明する。
【0328】
(双予測制限の種類)
PUの種類には、対象CUがスキップであるPU(スキップPU)、対象PUがマージを適応するPU(マージPU)、対象PUがスキップでもマージでもないPU(基本インターPU、または、非動き情報省略PU)がある。基本インターPUでは、双予測であるか単予測であるかを示すインター予測フラグを符号化データから復号し、動き補償パラメータを導出する。それに対して、スキップPU及びマージPUでは、インター予測フラグを復号せずに動き補償パラメータを導出する。これらのPUでは、スキップ候補、または、マージ候補から、動き補償に用いる候補をスキップインデックスまたはマージインデックスに基づき選択し、当該選択候補における動き補償パラメータに基づいて、対象PUにおける動き補償パラメータを導出する。通常、スキップPUの動き補償パラメータの導出方法は、マージPUと同様である。なお、シーケンスパラメータセットのフラグなどを用いてマージの利用を制限する場合には、動きベクトル残差(mvd)を復号しない点を除き、基本インターPUと同一の方法を用いてもよい。この場合、スキップPUの双予測制限の動作は、基本インターPUと同じ動作を行う。
【0329】
図35の(a)は、各PUにおける双予測制限の例を示す。場合としては、基本インターPUのみに双予測制限を行う場合と、動き補償予測を適用する全PUに双予測制限を行う場合がある。基本インターPUのみに双予測制限を行う場合には、スキップPU及びマージPUでは双予測制限を行わず、基本インターPUのみに双予測制限を行う。基本インターPUのみに双予測制限を行う場合にも、全PUに双予測制限を行う場合にも、動画像符号化装置および動画像復号装置における処理量の低減と回路規模の削減が可能である。
【0330】
図35の(b)は、各PUにおける双予測制限の方法を示す。スキップPU及びマージPUの場合には、スキップ候補またはマージ候補に基づく動き補償パラメータ導出において双予測を行わないことを示す情報を導出することによって、双予測制限を行う。具体的には、動き補償パラメータ導出部で後述するように、動き補償パラメータに含まれるインター予測フラグの値を双予測から単予測に変換することで双予測制限を行う。基本インターPUに対して双予測制限を行う場合には、PUサイズ情報に応じて双予測制限の適用有無を判定する。双予測制限を適用しない場合にはインター予測フラグの復号を行う。また、双予測制限を適用する場合にはインター予測フラグの復号を省略するとともに、さらにインター予測フラグの値を単予測と推定する処理を行う。
【0331】
ここで、PUサイズ情報とは、小さなPUであるか否かを判定するための情報であり、対象CUのサイズとPU分割タイプ、もしくは、対象CUのサイズとPU分割数、もしくは、PUの幅もしくは高さ、もしくはPUの面積などを用いることができる。
【0332】
スキップPU及びマージPUと、基本インターPUは、動き補償パラメータの復号方法
だけでなく用いられる場面も異なる。スキップPUとマージPUは、選択可能な動き補償パラメータを制限することによって符号量の低減を行う。このようなPUでは、動きが一様であるような領域で主に用いられる。動きが一様である場合には、2つの予測画像が近く双予測によるノイズ除去効果が大きいことが多い。そのため、基本インターPUの双予測制限に比べると、スキップPU及びマージPUでは、基本インターPUと比較して双予測制限により符号化効率が低下する場合が生じやすい。そのため、上述のように基本インターPUのみで双予測を用いる制限や、後述のように、基本インターPUと、スキップPUおよびマージPUで制限するPUサイズを変更する方法も好適である。また、基本インターPUでの双予測制限は、符号化データの構造の観点からみると、インター予測フラグを符号化しないことによる符号量低減効果があるためにより有効である。
【0333】
(インター予測フラグの詳細)
ここでは、インター予測フラグの詳細を説明する。インター予測フラグinter_pred_flagは、単予測であるか双予測であるかを示す2値フラグである場合の他、単予測において
参照する参照画像のリスト(参照リスト)を複数の参照リストの中から選択する情報を含む場合がある。例えば、2種類の参照リスト(L0リストとL1リスト)のいずれかを選択するフラグを含む3値フラグとしてインター予測フラグが定義されていてもよい。以下、各々の場合を説明する。
【0334】
復号モジュール10では、スライスヘッダ等から参照フレームリストとしてL0、L1リストを用いるか、コンバインドリスト(LCリスト)を用いるかを選択するコンバインドリストフラグref_pic_list_combination_flagを復号する。単予測の場合の参照フレーム
決定方法は、コンバインドリストフラグの値に応じて異なる。コンバインドリストフラグが1の場合には、単予測の参照フレームの指定に用いる参照リストとしてコンバインドリストLCを用い、各PUにおいて参照リストを指定するためのフラグは不要である。そのためインター予測フラグinter_pred_flagは2値フラグで良い。コンバインドリストフラグ
が0の場合には、各PUにおいて、参照リストをL0リストもしくはL1リストから選択する必要がある、そのためインター予測フラグinter_pred_flagは3値フラグとなる。
【0335】
図32の(a)は、2値フラグである場合のインター予測フラグの意味を示し、
図32の(b)は、3値フラグである場合のインター予測フラグの意味を示す。
【0336】
(双予測限定におけるシンタックステーブル例)
図31は、従来技術におけるPUのシンタックステーブルの例であり双予測制限を行わない場合の符号化データの構成を示す。
図33は、PUのシンタックステーブルの例であり、(a)および(b)は各々双予測制限を行う場合の符号化データの構成の特にインター予測フラグinter_pred_flagの部分を示す。
図33の(a)は、インター予測フラグが常
に2値フラグである場合のシンタックステーブルの例である。この場合、inter_pred_flagにより単予測を意味するPred_LCと、双予測を意味するPred_Biの2つを区別する。スラ
イスがBスライスでかつ双予測が有効である場合(DisableBiPred = false)には、単予
測と双予測を区別するために符号化データは、インター予測フラグinter_pred_flagを含
み、双予測が有効ではない場合(DisableBiPred =true)には、常に単予測であるからイ
ンター予測フラグinter_pred_flagを含まない。
【0337】
図33の(b)は、インター予測フラグが3値フラグである場合のシンタックステーブルの例である。コンバインドリストを利用する場合にはinter_pred_flagによりLCリスト
の参照フレームを1つ用いる単予測を意味するPred_LCと、双予測を意味するPred_Biの2
つを区別するが、そうでない場合には、L1リストの単予測を意味するPred_L1、L1リスト
の単予測を意味するPred_L2と、双予測を意味するPred_Biの3つを区別する。スライスが
Bスライスでかつ双予測が有効である場合(DisableBiPred = false)には、符号化デー
タは単予測と双予測を指定するために第1のインター予測フラグinter_pred_flag0を含み、双予測が有効ではない場合には、コンバインドリストを用いない場合に限り、符号化データは、参照リストを指定するための単予測と双予測を指定するために第2のインター予測フラグinter_pred_flag1を含む。コンバインドリストを用いない場合とは詳細には
図33の(a)に示すように!UsePredRefLC && !NoBackPredFlagにより判定する。すなわち、コンバインドリストを使用するか否かを指定するフラグUsePredRefLC(UsePredRefLCの値が真の場合にコンバインドリストを使用することを示す)と、後方向予測を用いるか否かを示すフラグNoBackPredFlag(NoBackPredFlagの値が真の場合に後方向予測を用いないことを示す)により指定される。コンバインドリストを利用する場合には、リスト選択をせずともコンバインドリストであることが分かる。後方向予測を用いない場合にはPred_L1
を禁止することであるから、第2のインター予測フラグinter_pred_flag1を符号化しない場合にも使用するリストが、コンバインドリストであるか(Pred_LC)、L0リストである
かPred_L0が分かる。なお、NoBackPredFlagの代わりにL1リストを用いないという意味でNoL1PredFlagという表現を用いることもできる。
【0338】
双予測制限を行うか否か、もしくは、双予測制限を行う場合のPUサイズの判定に用いる閾値を符号化データに含めても構わない。
図34は、双予測制限に関するシンタックステーブルの例である。
図34の(a)は、シーケンスパラメータセットが双予測制限をするか否かを制限するフラグdisable_bipred_in_small_PUを含む場合を示す。図に示すように、双予測制限のフラグは、小サイズのPU(ここでは4x4サイズのPU)を禁止するフラグdisable_inter_4x4と独立に符号化しても良い。なお、小サイズのPUを禁止する
フラグの目的も、双予測制限と同じく、PU予測画像を生成する場合における最悪の処理量の低減であるから、小サイズのPUを禁止するフラグと小サイズの双予測を禁止するフラグを共通フラグとしても用いても良い。
図34の(b)は、共通のフラグとして予測制約フラグuse_restricted_predictionを設ける例である。この場合には、予測制約フラグ
がtrueの場合には、小サイズのPUの適用と小サイズPUにおける双予測を同時に禁止する。
図34の(c)は、双予測を禁止するPUのサイズを示すdisable_bipred_sizeを符
号化データに含める例である。disable_bipred_sizeとしては双予測制限の判定方法で後
述する閾値THの2を底とする対数の値等を用いることなどができる。なお、これらのフラグは、シーケンスパラメータセット以外のパラメータセットで符号化しても構わないし、スライスヘッダで符号化しても構わない。
【0339】
(双予測限定における動き補償パラメータ導出部)
図29は、動き補償パラメータ導出部121の構成を示す。動き補償パラメータ導出部121は、スキップ動き補償パラメータ導出部1211、マージ動き補償パラメータ導出部1212、基本動き補償パラメータ導出部1213、双予測制限PU判定部1218、および、双単予測変換部1219から構成される。
【0340】
動き補償パラメータ導出部121では、特に、インター予測フラグを復号しない場合のPUであるスキップPUとマージPUの双予測制限を行う。
【0341】
スキップ動き補償パラメータ導出部1211は、対象CUがスキップの場合に、スキップPUの動き補償パラメータを導出し、双単予測変換部1219に入力する。双単予測変換部1219は、双予測限定条件に応じて動き補償パラメータを変換し、スキップ動き補償パラメータ導出部1211に戻す。スキップ動き補償パラメータ導出部1211は、双予測限定条件に応じて変換された動き補償パラメータを、対象PUの動き補償パラメータとして外部に出力する。なお、スキップインデックスによって、動き補償パラメータが定まる場合には、スキップ候補の各々に対して、双単予測変換部1219で変換を行い、変換後のスキップ候補をスキップインデックスで選択する構成でも構わない。
【0342】
マージ動き補償パラメータ導出部1212は、対象PUがマージの場合に、対象PUの動き補償パラメータを導出し、双単予測変換部1219に入力する。双単予測変換部1219は、双予測限定条件に応じて動き補償パラメータを変換し、マージ動き補償パラメータ導出部1211に戻す。マージ動き補償パラメータ導出部1211は、双予測限定条件に応じて変換された動き補償パラメータを、対象PUの動き補償パラメータとして外部に出力する。なお、マージインデックスによって、動き補償パラメータが定まる場合には、マージ候補の各々に対して、双単予測変換部1219で変換を行い、変換後のマージ候補を、マージインデックスで選択する構成でも構わない。
【0343】
基本動き補償パラメータ導出部1213は、対象PUがスキップでも、マージでもない場合において、対象PUの動き補償パラメータを導出し、外部に出力する。
【0344】
双予測制限PU判定部1218は、対象PUのPUサイズ情報を参照し、対象PUにおいて双予測を用いない双予測制限を行うか否かを判定する。スキップCU及びマージPUの双予測制限を行うか否か、及び、基本インターPUの双予測制限を行うか否かを、独立に判定しても良い。例えば、全てのPUを同じPUサイズを閾値として双予測制限を行って良いし、スキップPU及びマージPUの方が大きなPUサイズを閾値として双予測制限を行っても良い。またスキップPU及びマージPUは双予測制限を行わず、基本インターPUにのみ双予測制限を行っても良い。
【0345】
なお、マージの利用を制限する場合のように、スキップPUでインター予測フラグを復号する場合には、スキップPU、マージPU、基本インターPUの各々で双予測制限を行うか否かを、独立に判定することも可能である。
【0346】
また、上記の構成では、スキップ動き補償パラメータ導出部1211において設定された双予測・単予測の設定を双単予測変換部1219において双予測制限PU判定部1218に基づき判定すると説明したが、この構成に限らない。例えば、双予測制限PU判定部1218の判定結果を直接スキップ動き補償パラメータ導出部1211に入力し、双予測・単予測の設定を行う構成でも構わない。
(双予測制限の判定方法)
双予測制限PU判定部1218において、双予測制限を行うべき小サイズのPUであるか否かを判定する方法の好適な例を以下に説明する。なお、判定方法は以下の例に限定されるものではなく、PUサイズ情報として他のパラメータを用いることも可能である。
(判定方法の例1)
判定方法の例1では、PUサイズの判定に用いる閾値をTHとした場合に、THxTH未満のPUの場合に双予測制限を行う。この時の対象CUサイズ(ここではCU Width)とPU分割
タイプを用いた判定式は以下の通りである。
【0347】
DisableBiPred = ((CU Width == TH && PU分割タイプ!= 2Nx2N) && CU Width < TH) ? true : false
具体的には、
TH = 16の場合には、16x8、8x16、12x16、4x16、16x12、16x4、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
TH = 8の場合には、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
【0348】
なお、対象CUサイズとPU分割タイプ以外のパラメータを用いて判定を行うことも可能である。例えば、PU分割数NumPartを用いて以下のような判定も可能である。
【0349】
DisableBiPred = ((CU Width == TH && NumPart > 1) && CU Width < TH)? true : false
(判定方法の例2)
判定方法の例2では、THxTH以下のPUにおいて双予測制限を行う。この時の判定式は以
下の通りである。
【0350】
DisableBiPred = ((CU Width == 2*TH && PU分割タイプ== NxN) || CU Width < 2*TH) ? true : false
具体的には、
TH = 16の場合には、16x16、16x8、8x16、12x16、4x16、16x12、16x4、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
TH = 8の場合には、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われ
る。
TH = 4の場合には、4x4のPUにおいて双予測制限が行われる。
【0351】
なお、PUの分割数NumPartを用いて以下のような判定も可能である。
【0352】
DisableBiPred = ((CU Width == 2*TH && NumPart != 4) || CU Width < 2*TH) ? true
: false
なお、上述の例においてスキップPU及びマージPUと、基本インターPUとで異なるPUサイズ(閾値TH)を用いても構わない。また、
図34の(c)で既に示したように、判定に用いるPUサイズ(閾値TH)を符号化しても良い。
【0353】
双単予測変換部1219は、入力された動き補償パラメータが双予測を示しており、さらに、双予測制限PU判定部1218においてスキップPU及びマージPUの双予測制限を行うと判定された場合において、双単予測変換部1219に入力される動き補償パラメータを単予測に変換する。
【0354】
動き補償パラメータは、時間的及び空間的に近接するPUの動き補償パラメータのコピー、もしくは、時間的及び空間的に近接するPUの動き補償パラメータの組み合わせから導出される動き補償パラメータのインター予測フラグinter_pred_flagが双予測を示す2
である場合には、単予測を示す1に変換する。また、内部の処理に用いるインター予測フラグ(内部インター予測フラグ)がL0予測を示す1、L1予測を示す2、双予測を示す3からなるフラグである場合には、以下の動作を行う。内部インター予測フラグが3である場合には、内部インター予測フラグの値がL0予測を意味する1、もしくは、L1予測を意味する2に変換する。また、L0予測に変換する場合にはL1予測に関する動き補償パラメータを例えばゼロにリフレッシュする。L1予測に変換する場合には、L0予測に関する動き補償パラメータを例えばゼロにリフレッシュする。
【0355】
なお、双単予測変換部1219は、スキップ動き補償パラメータ導出部1211及びマージ動き補償パラメータ導出部1212の内部に備える手段として構成しても構わない。また、基本インターPUのみに双予測制限を行う場合には、双単予測変換部1219を備えない構成でも良い。
【0356】
(双予測限定における動き補償復号部)
図30は、動き情報復号部1021の構成を示すブロック図である。動き情報復号部1021は少なくともインター予測フラグ復号部1028を備える。動き情報復号部1021では、特に、インター予測フラグを復号する場合のPUである基本インターPUの双予測制限を行う。インター予測フラグ復号部1028は、上述の双予測制限PU判定部1218で、基本インターPUの双予測制限を行うか否かに応じて、インター予測フラグの復号を行うか否かを変更する。
【0357】
なお、マージの利用を制限する場合のように、スキップPUでインター予測フラグを復号する場合には、スキップPUの双予測制限を行う。
【0358】
動き補償パラメータ導出部121が、小PUサイズ123Aを参照して双予測制限を行うことによる作用・効果は以下のとおりである。双予測は、単予測よりも処理量が大きく、また小サイズのPUは、大サイズのPUに比べて単位面積あたりの処理量が大きい。従って、小サイズのPUにおける双予測は、処理のボトルネックとなりかねない。このため、小サイズのPUでは、双予測を抑制することで、処理量が過度に増大することを抑えることができる。とくに、最も小さいサイズのPUを処理するような最悪ケースの処理量を抑制することができる。
【0359】
なお、インター予測フラグについて補足しておくと次のとおりである。非特許文献1では、インター予測フラグ(inter_pred_flag)は、基本的には、双予測か単予測かを選択するフラグとなっている。しかし、コンバインドリストを使用せず、後方予測禁止フラグが禁止でない場合には、単予測に用いる参照フレームリストとしてL0、L1のいずれかを選択するためのフラグをinter_pred_flagにより送信する場合もある。
【0360】
[作用・効果]
本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、上記画面間予測が適用される、所定サイズ以下のサイズの予測単位である対象予測単位について、双予測を行うことを制限する双予測制限手段を備える構成である。
【0361】
上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができるという効果を奏する。
【0362】
(3)TU情報復号部の詳細
次に、
図16を用いて、TU情報復号部13および復号モジュール10の構成例について説明する。
図16は、動画像復号装置1において、TU分割復号処理、変換係数復号処理、および、予測残差導出処理を行うための構成、すなわち、TU情報復号部13および復号モジュール10の構成について例示する機能ブロック図である。
【0363】
以下、TU情報復号部13および復号モジュール10の順で、各部の構成について説明する。
【0364】
[TU情報復号部]
図16に示すように、TU情報復号部13は、TU分割設定部131および変換係数復元部132を備える。
【0365】
TU分割設定部131は、符号化データから復号したパラメータとCUサイズおよびPU分割タイプとに基づいて、TU分割の方式を設定するものである。また、変換係数復元部132は、TU分割設定部131によって設定されたTU分割に従って、各TUの予測残差を復元するものである。
【0366】
[TU分割設定部]
まず、
図16を参照しながら、TU分割設定部131の詳細について説明する。TU分割設定部131は、より詳細には、対象領域設定部1311、分割決定部1312、分割領域設定部(変換単位分割手段、分割手段)1313、および変換サイズ情報記憶部13
14を備える。
【0367】
対象領域設定部1311は、対象領域となるノードである対象ノードを設定する。対象領域設定部1311は、対象変換ツリーについてTU分割の処理が開始されたとき、対象領域の初期値として、対象CU全体を設定する。また、分割の深度は、“0”に設定する。
【0368】
分割決定部1312は、領域分割フラグ復号部1031を用いて、対象領域設定部1311によって設定された対象ノードを分割するか否かを示す情報(split_transform_flag)を復号し、復号した情報に基づいて対象ノードの分割要否を決定する。
【0369】
分割領域設定部1313は、分割決定部1312によって分割要と決定された対象ノードについて分割領域を設定する。具体的には、分割領域設定部1313は、分割要と決定された対象ノードについて、分割の深度を1加算するとともに、変換サイズ決定情報記憶部1314に記憶されている変換サイズ決定情報に基づいて対象ノードを分割する。
【0370】
なお、分割により得られた各対象ノードは、対象領域設定部1311によりさらに対象領域として設定される。
【0371】
すなわち、TU分割では、分割した対象ノードについて、対象領域設定部1311、分割決定部1312および分割領域設定部1313によって、“対象領域の設定”、“分割の決定”、および“分割領域の設定”の一連の処理が、再帰的に繰り返される。
【0372】
変換サイズ決定情報記憶部1314には、対象ノードの分割方式を示す変換サイズ決定情報が記憶されている。変換サイズ決定情報は、具体的には、CUのサイズ、TU分割の深度(trafoDepth)、および対象PUのPU分割タイプと、TU分割パターンとの対応関係を定義する情報である。
【0373】
ここで、
図17を用いて、変換サイズ決定情報の具体的な構成例について説明すると次のとおりである。
図17に示す変換サイズ決定情報では、CUのサイズ、TU分割の深度(trafoDepth)、および対象PUのPU分割タイプに応じて、TU分割パターンが定義されている。なお、なお、表中の“d”は、CUの分割深度を示す。
【0374】
変換サイズ決定情報では、CUのサイズとして、64×64、32×32、16×16、および8×8の4つが定義されている。
【0375】
また、変換サイズ決定情報では、CUのサイズに応じて、選択可能なPU分割タイプが定義されている。
【0376】
CUのサイズが、64×64、32×32、および16×16である場合、PU分割タイプとして、2N×2N、2N×nU、2N×nD、N×2N、nL×2N、およびnR×2Nのいずれかを選択可能である。
【0377】
また、CUのサイズが、8×8である場合、PU分割タイプとして、2N×2N、2N×NおよびN×2Nのいずれかを選択可能である。
【0378】
また、変換サイズ決定情報では、CUのサイズおよびPU分割タイプに応じて、各TU分割の深度におけるTU分割パターンが定義されている。
【0379】
例えば、CUのサイズが64×64である場合、次のとおりである。まず、TU分割の
深度“0”は定義されておらず、64×64のCUは、強制的に分割が行われる(
図17において※1にて示している)。これは、変換単位の最大サイズが32×32と定義されているためである。
【0380】
TU分割深度“1”および“2”では、正方形の4分木分割のみを含む場合と、非正方形の4分木分割のみを含む場合とで異なるTU分割パターンが定義されている。
【0381】
PU分割タイプが2N×2Nであり、かつ、正方形の4分木分割のみを含むTU分割パターンの場合、TU分割深度“1”では、32×32の正方形4分木分割、TU分割深度“2”では、16×16の正方形4分木分割が定義されている。
【0382】
PU分割タイプが、2N×2N、2N×nU、2N×nD、N×2N、nL×2N、およびnR×2Nのいずれかであり、かつ、非正方形の4分木分割のみを含む場合の定義は次のとおりである。
【0383】
まず、TU分割深度“1”では、32×32の正方形4分木分割が定義されている。続いて、TU分割深度“2”では、PU分割タイプ:2N×2N、2N×nU、2N×nDに対しては、32×8の非正方形4分木分割が定義されており、PU分割タイプ:N×2N、nL×2N、nR×2Nに対しては、8×32の非正方形4分木分割が定義されている。
【0384】
さらに、CUのサイズが8×8である場合について例示すれば次のとおりである。CUのサイズが8×8である場合、選択可能なPU分割タイプは、2N×2N、2N×2、およびN×2Nである。それぞれのPU分割タイプについて、TU分割深度“1”では、8×8の正方形4分木分割、TU分割深度“2”では、4×4の正方形4分木分割が定義されている。なお、TU分割の深度“3”は定義されておらず、強制的に非分割である(
図17において、※2にて示している)。
【0385】
ここで、
図20を用いて、TU分割設定部131におけるTU分割について詳細について説明すると次のとおりである。
図20は、CUのサイズが32×32であり、かつ、PU分割タイプが2N×Nである場合のTU分割の例を示す図である。
【0386】
まず、対象領域設定部1311は、TU分割処理が開始されると、対象CU全体を、対象領域の初期値として設定するとともに、depth=0とする。なお、depth=0では、領域垂直方向中央において点線にて、PU境界B1を示している。
【0387】
次に、分割決定部1312が、対象ノードを分割するか否かを示す情報(split_transform_flag)に基づいて、対象ノードの分割要否を決定する。
【0388】
split=1であるので、分割決定部1312は、対象ノードを分割することを決定する。
【0389】
分割領域設定部1313は、depthを1加算し、変換サイズ決定情報に基づいて、対象ノードについて、TU分割パターンを設定する。分割領域決定部1313は、対象領域である対象CUについて、depth=1のTU分割を実行する。
【0390】
図17に示す変換サイズ決定情報の定義に従って、分割領域設定部1313は、depth=1では、対象ノードを32×8の領域に四分木分割する。
【0391】
これにより、対象ノードは、
図18の(b)に示す分割方式で、TU0、TU1、TU
2、および、TU3の4つの横長の長方形領域に分割される。
【0392】
さらに対象領域設定部1311は、depth=1の分割深度において、TU0、TU1、TU2、および、TU3の各ノードを、順に対象領域に設定する。
【0393】
ここで、TU1について、split=1が設定されているので、分割決定部1312は、TU1を分割する事を決定する。
【0394】
分割領域決定部1313は、TU1について、depth=2のTU分割を実行する。
図17に示す変換サイズ決定情報の定義に従って、分割領域設定部1313は、depth=2では、対象ノードを16×4の領域に四分木分割する。
【0395】
これにより、対象ノードであるTU1は、
図19の(a)に示す分割方式で、TU1−0、TU1−1、TU1−2、およびTU1−3の4つに横長の長方形領域に分割される。
【0396】
[3−1]PU分割タイプが非対称の場合において分割領域サイズを導出する構成の例分割領域設定部1313は、PU分割タイプが非対称の場合、小さい方のPUでは、長方形(非正方形)の変換を適用する一方で、大きい方のPUの少なくとも一部では、正方形の変換を適用する構成であってもよい。
【0397】
例えば、変換サイズ決定情報記憶部1314に記憶される変換サイズ決定情報において、定義情報である小PUサイズ1314Aと、大PUサイズ1314Bとを設ける。
【0398】
小PUサイズ1314Aでは、非対称に分割されたPUのうち、小さいサイズのPUにおいて、長方形の変換が適用されるよう定義する。
【0399】
大PUサイズ1314Bは、非対称に分割されたPUのうち、大きいサイズのPUにおいて、正方形の変換が適用されるよう定義する。
【0400】
また、分割領域設定部1313は、非対称に分割されたPUのサイズに応じて、小PUサイズ1314Aの定義情報と、大PUサイズ1314Bの定義情報とのいずれか一方を参照し、分割領域を設定する。
【0401】
図21を用いて、上記構成例によるTU分割について説明すると次のとおりである。
【0402】
図21は、PU分割タイプが2N×nUである場合の上記構成例によるTU分割の例を示す図である。
【0403】
まず、対象領域設定部1311は、TU分割処理が開始されると、対象CU全体を、対象領域の初期値として設定するとともに、depth=0とする。なお、depth=0では、領域垂直方向中央より上方において点線にて、PU境界B2を示している。
【0404】
次に、分割決定部1312が、対象ノードを分割するか否かを示す情報(split_transform_flag)に基づいて、対象ノードの分割要否を決定する。
【0405】
split=1であるので、分割決定部1312は、対象ノードを分割することを決定する。
【0406】
分割領域設定部1313は、depthを1加算し、変換サイズ決定情報に基づいて、
対象ノードについて、TU分割パターンを設定する。分割領域決定部1313は、対象領域である対象CUについて、depth=1のTU分割を実行する。
【0407】
ここで、分割領域設定部1313は、小PUサイズ1314Aに従って、非対称に分割されたPUのうち、小さいサイズのPUについて、横長の長方形のTU分割を行う。
【0408】
また、分割領域設定部1313は、大PUサイズ1314Bに従って、非対称に分割されたPUのうち、大きいサイズのPUについて、正方形のTU分割を含める。なお、分割領域設定部1313は、PU境界側に位置する領域については、
図21に示すように長方形のTU分割領域を含めてもかまわない。
【0409】
結果として、分割領域設定部1313は、depth=1では、対象ノードを、2つの長方形のノードおよび2つの正方形のノードに四分木分割する。
【0410】
これにより、対象ノードは、横長の長方形のTU0およびTU1と、正方形のTU2およびTU3との4つの領域に分割される。
【0411】
さらに対象領域設定部1311は、depth=1の分割深度において、TU0、TU1、TU2、および、TU3の各ノードを、順に対象領域に設定する。
【0412】
ここで、TU0およびTU2について、split=1が設定されているので、分割決定部1312は、TU0およびTU2を分割する事を決定する。
【0413】
分割領域決定部1313は、TU0およびTU2について、depth=2のTU分割を実行する。分割領域設定部1313は、depth=2では、TU0を、4つの横長の長方形にTU分割し、TU2を、4つの正方形にTU分割する。
【0414】
これにより、TU0は、TU0−0、TU0−1、TU0−2、およびTU0−3の4つに横長の長方形領域に分割される。また、TU2は、TU2−0、TU2−1、TU2−2、およびTU2−3の4つに横長の長方形領域に分割される。
【0415】
なお、上記のようにPU分割タイプが非対称のCUにおけるTU分割を行う場合、パーティションがPU境界をまたがず、かつ、分割後の各TU分割領域の面積が同一となるよう分割することが好ましい。
【0416】
[作用・効果]
本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する変換単位分割手段を備える構成である。
【0417】
よって、分割タイプが非対称分割であるときは、上記対象符号化単位に含まれる予測単位の大きさに応じて、効率よく相関を除去できるような変換単位の分割方式を選択することができる。
【0418】
[3−2]一部のCUサイズにおいて、PU分割タイプが正方形の分割であるとき非矩形変換を適用する構成の例
[構成例3−2−1]
分割領域設定部1313は、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割してもよい。
【0419】
そこで、変換サイズ決定情報記憶部1314に記憶される変換サイズ決定情報において、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割する旨定義する正方形PU分割タイプ1314Cが定義されていてもよい。
【0420】
そして、分割領域設定部1313は、PU分割タイプが正方形の分割である場合、正方形PU分割タイプ1314Cを参照して対象ノードを非正方形に分割する。
【0421】
分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、TU分割において領域を32×8のノードに分割してもよい。
【0422】
また、分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、TU分割の分割方式を示す情報を追加で復号し、復号した情報に基づいて32×8、16×16、8×32のいずれかのノードに分割してもよい。
【0423】
また、分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、隣接CUのサイズおよびPU分割タイプに基づいて、対象CUを分割するTUサイズを推定してもよい。また、分割領域設定部1313は、以下の(i)〜(iii)のとおり推定を行ってもよい。
【0424】
(i) 左辺にCU境界またはPU境界が存在し、上辺にはCU境界およびPU境界の境界が存在しない場合、32×8を選択。
【0425】
(ii) 上辺にCU境界またはPU境界が存在し、左辺にはCU境界およびPU境界の境
界が存在しない場合、8×32を選択。
【0426】
(iii) 上記(i)および(ii)以外(左辺または上辺に境界が存在するか、左辺および上辺のいずれにも境界が存在しない場合)、16×16を選択。
【0427】
[作用・効果]
本発明は、以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記変換単位への分割方式は、正方形および長方形の分割を含み、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する分割手段を備える構成である。
【0428】
上記構成による作用・効果は以下のとおりである。領域内にエッジが存在し、画像に方向性があるにもかかわらず、正方形の予測単位が選択される場合がある。例えば、多数の横エッジが存在するオブジェクトが移動している場合、オブジェクト内では、動きは一様であるため、正方形の予測単位が選択される。しかしながら、このような場合は、変換処理では、横エッジに沿った、水平方向に長い形状の変換単位を適用することが望ましい。
【0429】
上記構成によれば、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。
【0430】
よって、正方形の符号化単位においても、長方形の変換単位を選択することができ、このため上記のような領域に対する符号化効率を向上させることができる。
【0431】
[構成例3−2−2]
上記構成3−2−1に加えて、分割領域設定部1313は、CUサイズが、16×16サイズであり、かつPU分割タイプが、2N×2Nである場合、各分割深度において以下のとおり分割を行う。
【0432】
分割深度=1 … 16×4のTUに分割する。
【0433】
分割深度=2 … 4×4のTUに分割する。
【0434】
上記構成によれば、4×4のTUにおいて、16×16CUのPU分割タイプに依存せず、スキャン順が統一される。4×4のTUにおいて、16×16CUのPU分割タイプが異なることで、スキャン順が統一されていないと、16×16CUのPU分割タイプに応じてスキャン処理を変更しなければならないため、処理が複雑となる。よって、このようなスキャン順の不統一は、処理のボトルネックとなり得る。
【0435】
上記構成によれば、スキャン順が統一されることにより、処理を簡略化できるという効果を奏する。
【0436】
図22および
図23を用いて、より具体的に説明すると、以下のとおりである。まず、
図22に示すTU分割から説明する。
図22は、
図17に示した変換サイズ決定情報に従って分割を行った場合のTU分割の流れを示している。
【0437】
図22の(a)に示すように、PU分割タイプが2N×2Nの場合…depth=1において、分割領域設定部1313は、対象ノードの正方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、正方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。ここで、スキャン順は、再帰的なzスキャンが用いられる。具体的には、
図22に図示するとおりである。
【0438】
図22の(b)に示すように、PU分割タイプが2N×nUの場合…depth=1において、分割領域設定部1313は、対象ノードに対して、横長の長方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、横長の長方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。ここで、各TUのスキャン順は、ラスタスキャンが用いられる。具体的には、
図22に図示するとおりである。
【0439】
次に、
図23に示すTU分割について説明する。
図23は、正方形PU分割タイプ1314Cに従って、PU分割タイプが2N×2Nの領域の分割を行った場合のTU分割の流れを示している。
【0440】
PU分割タイプ:2N×2Nの場合… depth=1において、分割領域設定部13
13は、対象ノードに対して、横長の長方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、横長の長方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。
【0441】
その結果、スキャン順は、ラスタスキャンが用いられる。よって、PU分割タイプが2N×nUである場合と、2N×2Nである場合との間で、スキャン順をラスタスキャンに統一することができる。
【0442】
[変換係数復元部]
次に、再び
図16を参照しながら、変換係数復元部132の詳細について説明する。変換係数復元部132は、より詳細には、非ゼロ係数判定部1321および変換係数導出部1322を備える。
【0443】
非ゼロ係数判定部1321は、判定情報復号部(係数復号手段)1032を用いて、対象CUに含まれる各TUまたは変換ツリーについての非ゼロ変換係数の存否情報を復号し、各TUに非ゼロ変換係数が存在するか否かを判定する。
【0444】
変換係数導出部1322は、変換係数復号部(係数復号手段)1033を用いて非ゼロ変換係数が存在する各TUの変換係数を復元する一方で、非ゼロ変換係数が存在しない各TUの変換係数を0(ゼロ)に設定する。
【0445】
[復号モジュール]
図16に示すように、復号モジュール10は、領域分割フラグ復号部1031、判定情報復号部1032、変換係数復号部1033、およびコンテキスト記憶部1034を備える。
【0446】
領域分割フラグ復号部1031は、分割決定部1312から供給される符号化データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。領域分割フラグ復号部1031は、対象ノードを分割するか否かを示す情報(split_transform_flag)を復号する。
【0447】
判定情報復号部1032は、変換係数導出部1322から供給される非ゼロ変換係数の存否情報の符号化データおよびシンタックス種別に応じて、当該符号化データに含まれるバイナリからシンタックス値の復号を行う。判定情報復号部1032が復号するシンタックスは、具体的には、no_residual_data_flag、cbf_luma、cbf_cb、cbf_cr、およびcbp等である。
【0448】
変換係数復号部1033は、変換係数導出部1322から供給される変換係数の符号化データおよびシンタックス種別に応じて、当該符号化データに含まれるバイナリからシンタックス値の復号を行う。変換係数復号部1033が復号するシンタックスは、具体的には、変換係数の絶対値であるレベル(level)、変換係数の符号(sign)、連続するゼロのランの長さ(run)などである。
【0449】
コンテキスト記憶部1034は、判定情報復号部1032および変換係数復号部1033が、復号処理の際に参照するコンテキストが記憶されている。
【0450】
[3−3]変換係数復号時にコンテキストを参照する具体的構成判定情報復号部1032および変換係数復号部1033は、それぞれ、PU分割タイプが非対称分割である場合、小さい方のPUに含まれるTUと、大きい方のPUに含まれるTUとで異なるコンテキストを用いて、変換係数に係るシンタックス値を復号する構成であってもよい。例えば、そのようなシンタックスの種類として、非ゼロ変換係数フラグ、変換係数レベル、変換係数のラン、TUツリーの各ノードにおける非ゼロ変換係数の存否情報が含まれる。前記シンタックスの組み合わせを含んでいてもよい。
【0451】
そこで、コンテキスト記憶部1034では、小さい方のPUに含まれるTUにおいて参照されるコンテキストにおける変換係数に係る各種シンタックス値に対応する確率設定値である小PUサイズ1034Aと、大きい方のPUに含まれるTUにおいて参照されるコンテキストにおける確率設定値である大PUサイズ1034Bとが記憶されていてもよい。ここで、小PUサイズ1034Aおよび大PUサイズ1034Bは異なるコンテキストに対応する確率設定値である。
【0452】
判定情報復号部1032は、対象TUが、小さいPUに含まれる場合、小PUサイズ1034Aを参照する一方で、対象TUが、大きい方のPUに含まれる場合、大PUサイズ1034Bを参照し、対象TUにおけるCbf(cbf_luma、cbf_cb、cbf_cr等)を算術復号する。
【0453】
また、変換係数復号部1033は、対象TUが、小さいPUに含まれる場合、小PUサイズ1034Aを参照する一方で、対象TUが、大きい方のPUに含まれる場合、大PUサイズ1034Bを参照し、対象TUにおける変換係数(level、sign、run等)を算術復号する。
【0454】
なお、判定情報復号部1032および変換係数復号部1033は、対象TUが、大きい方のPUに含まれる場合であって、対象TUが、小さい方のPUに近い側に位置するとき、小PUサイズ1034Aを参照してもかまわない。
【0455】
言い換えれば、対象TUが、大きい方のPUに含まれる場合であっても、対象TUがPU境界の近傍に位置している場合、判定情報復号部1032および変換係数復号部1033は、小PUサイズ1034Aを参照してもかまわない。
【0456】
小さい方のPUには、エッジが存在する可能性が高く変換係数が発生しやすい。これに対して、大きい方のPUでは変換係数が発生しにくい。対象TUが、小さいPUに含まれる場合と大きい方のPUに含まれる場合とで、異なるコンテキストを用いることで、それぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。
【0457】
[作用・効果]
本発明は、以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、異なる大きさの予測単位に分割する非対称形への分割および同一の大きさの予測単位に分割する対称形への分割を含み、復号の対象となる上記予測単位である対象予測単位の分割タイプが非対称形への分割であるとき、該分割により得られた小さい予測単位および大きい予測単位の間で、異なるコンテキストを参照して変換係数を復号する係数復号手段を備える構成である。
【0458】
よって、小さい予測単位に含まれる変換単位および大きい予測単位に含まれる変換単位のそれぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。
【0459】
(処理の流れ)
図24を用いて、動画像復号装置1におけるCU復号処理について説明すると以下のとおりである。なお、以下では、対象CUは、インターCU、または、スキップCUであるとする。
図24は、動画像復号装置1におけるCU復号処理(インター/スキップCU)の流れの一例について示すフローチャートである。
【0460】
CU復号処理が開始されると、CU情報復号部11が、復号モジュール10を用いて、対象CUについてCU予測情報を復号する(S11)。この処理は、CU単位で行われる。
【0461】
具体的には、CU情報復号部11において、CU予測モード決定部111が、復号モジュール10を用いて、スキップフラグSKIPを復号する。また、スキップフラグがスキップCUであることを示していなければ、さらに、CU予測モード決定部111は、復号モジュール10を用いて、CU予測タイプ情報Pred_typeを復号する。
【0462】
次に、PU単位の処理が行われる。すなわち、PU情報復号部12が備える動き補償パラメータ導出部121が、動き情報を復号するとともに(S12)、予測画像生成部14が、復号された当該動き情報に基づいてインター予測により予測画像を生成する(S13)。
【0463】
次に、TU情報復号部13が、TU分割復号処理を行う(S14)。具体的には、TU情報復号部13において、TU分割設定部131が、符号化データから復号したパラメータとCUサイズおよびPU分割タイプとに基づいて、TU分割の方式を設定する。この処理は、CU単位で行われる。
【0464】
次に、TU単位の処理が行われる。すなわち、TU情報復号部131が、変換係数を復号し(S15)、逆量子化・逆変換部15が、復号された変換係数から予測残差を導出する(S16)。
【0465】
次に、加算部17において、予測画像と予測残差とが加算されることにより、復号画像が生成される(S17)。この処理は、CU単位で行われる。
【0466】
〔動画像符号化装置〕
以下において、本実施形態に係る動画像符号化装置2について、
図25および
図26を参照して説明する。
【0467】
(動画像符号化装置の概要)
動画像符号化装置2は、概略的に言えば、入力画像#10を符号化することによって符号化データ#1を生成し、出力する装置である。
【0468】
(動画像符号化装置の構成)
まず、
図25を用いて、動画像符号化装置2の構成例について説明する。
図25は、動画像符号化装置2の構成について示す機能ブロック図である。
図25に示すように、動画像符号化装置2は、符号化設定部21、逆量子化・逆変換部22、予測画像生成部23、加算器24、フレームメモリ25、減算器26、変換・量子化部27、および符号化データ生成部(符号化手段)29を備えている。
【0469】
符号化設定部21は、入力画像#10に基づいて、符号化に関する画像データおよび各種の設定情報を生成する。
【0470】
具体的には、符号化設定部21は、次の画像データおよび設定情報を生成する。
【0471】
まず、符号化設定部21は、入力画像#10を、スライス単位、ツリーブロック単位に順次分割することにより、対象CUについてのCU画像#100を生成する。
【0472】
また、符号化設定部21は、分割処理の結果に基づいて、ヘッダ情報H’を生成する。ヘッダ情報H’は、(1)対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報、並びに、(2)各ツリーブロックに属するCUのサイズ、形状および対象ツリーブロック内での位置についてのCU情報CU’を含んでいる。
【0473】
さらに、符号化設定部21は、CU画像#100、および、CU情報CU’を参照して、PT設定情報PTI’を生成する。PT設定情報PTI’には、(1)対象CUの各PUへの可能な分割パターン、および、(2)各PUに割り付ける可能な予測モード、の全ての組み合わせに関する情報が含まれる。
【0474】
符号化設定部21は、CU画像#100を減算器26に供給する。また、符号化設定部21は、ヘッダ情報H’を符号化データ生成部29に供給する。また、符号化設定部21は、PT設定情報PTI’を予測画像生成部23に供給する。
【0475】
逆量子化・逆変換部22は、変換・量子化部27より供給される、ブロック毎の量子化予測残差を、逆量子化、および、逆直交変換することによって、ブロック毎の予測残差を復元する。逆直交変換については、
図1に示す逆量子化・逆変換部13について、既に説明したとおりであるので、ここではその説明を省略する。
【0476】
また、逆量子化・逆変換部22は、ブロック毎の予測残差を、TT分割情報(後述)により指定される分割パターンに従って統合し、対象CUについての予測残差Dを生成する。逆量子化・逆変換部22は、生成した対象CUについての予測残差Dを、加算器24に供給する。
【0477】
予測画像生成部23は、フレームメモリ25に記録されている局所復号画像P’、および、PT設定情報PTI’を参照して、対象CUについての予測画像Predを生成する。予測画像生成部23は、予測画像生成処理により得られた予測パラメータを、PT設定情報PTI’に設定し、設定後のPT設定情報PTI’を符号化データ生成部29に転送する。なお、予測画像生成部23による予測画像生成処理は、動画像復号装置1の備える予測画像生成部14と同様であるので、ここでは説明を省略する。
【0478】
加算器24は、予測画像生成部23より供給される予測画像Predと、逆量子化・逆変換部22より供給される予測残差Dとを加算することによって、対象CUについての復号画像Pを生成する。
【0479】
フレームメモリ25には、復号された復号画像Pが順次記録される。フレームメモリ25には、対象ツリーブロックを復号する時点において、当該対象ツリーブロックよりも先に復号された全てのツリーブロック(例えば、ラスタスキャン順で先行する全てのツリーブロック)に対応する復号画像が、当該復号画像Pの復号に用いられたパラメータと共に、記録されている。
【0480】
減算器26は、CU画像#100から予測画像Predを減算することによって、対象CUについての予測残差Dを生成する。減算器26は、生成した予測残差Dを、変換・量子化部27に供給する。
【0481】
変換・量子化部27は、予測残差Dに対して、直交変換および量子化を行うことで量子化予測残差を生成する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことをさす。また、逆直交変換の例としては、DCT変換(Discrete Cosine Transform)、およびDST変換(Discrete Sine Transform)等が挙げられる。
【0482】
具体的には、変換・量子化部27は、CU画像#100、および、CU情報CU’を参照し、対象CUの1または複数のブロックへの分割パターンを決定する。また、決定された分割パターンに従って、予測残差Dを、各ブロックについての予測残差に分割する。
【0483】
また、変換・量子化部27は、各ブロックについての予測残差を直交変換することによって周波数領域における予測残差を生成した後、当該周波数領域における予測残差を量子化することによってブロック毎の量子化予測残差を生成する。
【0484】
また、変換・量子化部27は、生成したブロック毎の量子化予測残差と、対象CUの分割パターンを指定するTT分割情報と、対象CUの各ブロックへの可能な全分割パターンに関する情報とを含むTT設定情報TTI’を生成する。変換・量子化部27は、生成したTT設定情報TTI’を逆量子化・逆変換部22および符号化データ生成部29に供給する。
【0485】
符号化データ生成部29は、ヘッダ情報H’、TT設定情報TTI’、およびPT設定情報PTI’を符号化し、符号化したヘッダ情報H、TT設定情報TTI、およびPT設定情報PTIを多重化して符号化データ#1を生成し、出力する。
【0486】
(動画像復号装置との対応関係)
動画像符号化装置2は、動画像復号装置1の各構成と対応する構成を含む。ここで、対応とは、同様の処理、または、逆の処理を行う関係にあるということである。
【0487】
例えば、上述したように、動画像復号装置1が備える予測画像生成部14の予測画像生成処理と、動画像符号化装置2が備える予測画像生成部23の予測画像生成処理とは、同様である。
【0488】
例えば、動画像復号装置1において、ビット列から、シンタックス値を復号する処理は、動画像符号化装置2において、シンタックス値から、ビット列を符号化する処理と逆の処理としての対応となっている。
【0489】
以下では、動画像符号化装置2における各構成が、動画像復号装置1のCU情報復号部11、PU情報復号部12、およびTU情報復号部13とどのような対応となっているかについて説明する。これにより、動画像符号化装置2における各構成の動作・機能はより詳細に明らかになるだろう。
【0490】
符号化データ生成部29は、復号モジュール10に対応している。より詳しくいえば、復号モジュール10が、符号化データおよびシンタックス種別に基づいてシンタックス値を導出するのに対して、符号化データ生成部29は、シンタックス値およびシンタックス種別に基づいて符号化データを生成する。
【0491】
符号化設定部21は、動画像復号装置1のCU情報復号部11に対応している。符号化設定部21と、CU情報復号部11とを比較すると次のとおりである。
【0492】
CU情報復号部11が、CU予測タイプ情報に係る符号化データとシンタックス種別とを復号モジュール10に供給し、復号モジュール10により復号されたCU予測タイプ情報に基づいてPU分割タイプを決定する。
【0493】
これに対して、符号化設定部21は、PU分割タイプを決定してCU予測タイプ情報を生成し、CU予測タイプ情報に係るシンタックス値とシンタックス種別とを符号化データ
生成部29に供給する。
【0494】
なお、符号化データ生成部29は、復号モジュール10が備える二値化情報記憶部1012、コンテキスト記憶部1013、および確率設定記憶部1014と同様の構成を備えていてもよい。
【0495】
予測画像生成部23は、動画像復号装置1のPU情報復号部12および予測画像生成部14に対応している。これらを比較すると次のとおりである。
【0496】
上述のとおり、PU情報復号部12は、動き情報に係る符号化データとシンタックス種別とを復号モジュール10に供給し、復号モジュール10により復号された動き情報に基づいて動き補償パラメータを導出する。また、予測画像生成部14は、導出された動き補償パラメータに基づいて予測画像を生成する。
【0497】
これに対して、予測画像生成部23は、予測画像生成処理において、動き補償パラメータを決定し、動き補償パラメータに係るシンタックス値とシンタックス種別とを符号化データ生成部29に供給する。
【0498】
また、予測画像生成部23は、PU情報復号部12が備えるマージ候補優先順位情報記憶部122、および参照フレーム設定情報記憶部123と同様の構成を備えていてもよい。
【0499】
変換・量子化部27は、動画像復号装置1のTU情報復号部13および逆量子化・逆変換部15に対応している。これらを比較すると次のとおりである。
【0500】
TU情報復号部13が備えるTU分割設定部131は、ノードの分割を行うのか否かを示す情報に係る符号化データおよびシンタックス種別を復号モジュール10に供給し、復号モジュール10により復号されたノードの分割を行うのか否かを示す情報に基づいてTU分割を行う。
【0501】
さらに、TU情報復号部13が備える変換係数復元部132は、判定情報および変換係数に係る符号化データおよびシンタックス種別を復号モジュール10に供給し、復号モジュール10により復号された判定情報および変換係数に基づいて変換係数を導出する。
【0502】
これに対して、変換・量子化部27は、TU分割の分割方式を決定し、ノードの分割を行うのか否かを示す情報に係るシンタックス値およびシンタックス種別を符号化データ生成部29に供給する。
【0503】
また、変換・量子化部27は、予測残差を変換・量子化して得られる量子化変換係数に係るシンタックス値およびシンタックス種別を符号化データ生成部29に供給する。
【0504】
なお、変換・量子化部27は、TU分割設定部131が備える変換サイズ決定情報記憶部1314と同様の構成を備えていてもよい。また、符号化データ生成部29は、復号モジュール10が備えるコンテキスト記憶部1034と同様の構成を備えていてもよい。
【0505】
(具体的構成との対応関係)
[1]’ 符号化設定部および符号化データ生成部
[1−1]’コンテキストの参照を制限する構成の例
符号化データ生成部29は、PU分割タイプが非対称パーティションであるとき、非対称パーティションの分割の種類を示す情報を、CABACのコンテキストを用いないで符
号化処理を行ってもかまわない。
【0506】
具体的な構成は、例えば、動画像復号装置1の構成例[1−1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1−1]の説明における「CU予測モード復号部1011」、「確率設定記憶部1014」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「確率設定記憶部1014に相当する構成」、および「符号化(する)」と読み替えるものとする。
【0507】
[1−2]’CU予測タイプ情報(pred_type)を符号化する構成
符号化データ生成部29は、二値化情報を参照してCU予測タイプ情報を符号化するよう構成してもよい。
【0508】
具体的な構成は、例えば、動画像復号装置1の構成例[1−2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1−2]の説明における「CU予測モード復号部1011」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「二値化情報記憶部1012に相当する構成」、および「符号化(する)」と読み替えるものとする。
【0509】
[1−3]’小サイズのCUにおいて、イントラCUについて短い符号を符号化する構成
符号化データ生成部29は、小サイズのCUにおいて、イントラCUについて短い符号を符号化するよう構成してもよい。
【0510】
具体的な構成は、例えば、動画像復号装置1の構成例[1−3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1−3]の説明における「CU予測モード復号部1011」、「コンテキスト記憶部1013」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「コンテキスト記憶部1013に相当する構成」、「二値化情報記憶部1012に相当する構成」、および「符号化(する)」と読み替えるものとする。
【0511】
[1−4]’近傍の予測パラメータに応じてbin列の解釈を変更する構成
符号化データ生成部29は、隣接領域に割り付けられている予測パラメータを参照して、bin列の解釈を変更するよう構成してもよい。
【0512】
具体的な構成は、例えば、動画像復号装置1の構成例[1−4]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1−4]の説明における「CU予測モード復号部1011」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「二値化情報記憶部1012に相当する構成」および「符号化(する)」と読み替えるものとする。
【0513】
[2]’予測画像生成部および符号化データ生成部
[2−1]’マージ候補の位置および優先順位の例
予測画像生成部23は、PU分割タイプが非対称である場合、PU分割タ
イプが対称である場合と異なる方法でマージ候補の優先順位を決定する構成
であってもよい。
【0514】
具体的な構成は、例えば、動画像復号装置1の構成例[2−1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2−1]の説明における「動き補償パラメータ導出部121」、および「マージ候補優先順位情報記憶部122」を、それぞれ、「予測画像生成部23」、および「マージ候補優先順位情報記憶部122
に相当する構成」と読み替えるものとする。
【0515】
[2−2]’CUサイズとスキップ/マージとの組み合わせによるマージ候補の変更
予測画像生成部23は、CUサイズと、当該CUがスキップ/マージを行うCUであるか否かとの組み合わせに応じてマージ候補を変更する構成であってもよい。
【0516】
具体的な構成は、例えば、動画像復号装置1の構成例[2−2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2−2]の説明における「動き補償パラメータ導出部121」、および「マージ候補優先順位情報記憶部122」を、それぞれ、「予測画像生成部23」、および「マージ候補優先順位情報記憶部122に相当する構成」と読み替えるものとする。
【0517】
[2−3]’参照フレーム数の決定
予測画像生成部23は、参照フレーム設定情報を参照して、インター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
【0518】
具体的な構成は、例えば、動画像復号装置1の構成例[2−3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2−3]の説明における「動き補償パラメータ導出部121」、および「参照フレーム設定情報記憶部123」を、それぞれ、「予測画像生成部23」、および「参照フレーム設定情報記憶部123に相当する構成」と読み替えるものとする。
【0519】
[3]’変換・量子化部および符号化データ生成部
[3−1]’PU分割タイプが非対称の場合において分割領域サイズを導出する構成の例
変換・量子化部27は、PU分割タイプが非対称の場合、小さい方のPUでは、長方形(非正方形)の変換を適用する一方で、大きい方のPUでは、正方形の変換を適用する構成であってもよい。
【0520】
具体的な構成は、例えば、動画像復号装置1の構成例[3−1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3−1]の説明における「対象領域設定部1311」「分割決定部1312」および「分割領域設定部1313」は、「変換・量子化部27」と読み替えるものとする。また、構成例[3−1]の説明における「変換サイズ決定情報記憶部1314」を、「変換サイズ決定情報記憶部1314に相当する構成」と読み替えるものとする。
【0521】
[3−2]’一部のPU分割タイプが正方形の分割であるとき非矩形変換を適用する構成の例
変換・量子化部27は、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割する構成であってもよい。また、上記構成に加えて、変換・量子化部27は、は、CUサイズが、16×16サイズであり、かつPU分割タイプが、2N×2Nである場合、各分割深度においてスキャン順が統一できるように分割を行う構成であってもよい。
【0522】
具体的な構成は、例えば、動画像復号装置1の構成例[3−2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3−2]の説明における「分割領域設定部1313」、および「変換サイズ決定情報記憶部1314」は、それぞれ、「変換・量子化部27」、および「変換サイズ決定情報記憶部1314に相当する構成」と読み替えるものとする。
【0523】
[3−3]’変換係数符号化時にコンテキストを参照する具体的構成符号化データ生成
部29は、PU分割タイプが非対称分割である場合、小さい方のPUに含まれるTUと、大きい方のPUに含まれるTUとで異なるコンテキストを用いて、非ゼロ変換係数の存否情報および変換係数の少なくとも一方を符号化する構成であってもよい。
【0524】
具体的な構成は、例えば、動画像復号装置1の構成例[3−3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3−3]の説明における「判定情報復号部1032」および「変換係数復号部1033」は、「符号化データ生成部29」と読み替えるものとする。また、構成例[3−3]の説明における「復号(する)」、および「コンテキスト記憶部1034」を、それぞれ、「符号化(する)」、および「コンテキスト記憶部1034に相当する構成」と読み替えるものとする。
【0525】
(処理の流れ)
図26を用いて、動画像符号化装置2におけるCU符号化処理について説明すると以下のとおりである。なお、以下では、対象CUは、インターCU、または、スキップCUであるとする。
図24は、動画像符号化装置2におけるCU符号化処理(インター/スキップCU)の流れの一例について示すフローチャートである。
【0526】
CU符号化処理が開始されると、符号化設定部21が、対象CUについてCU予測情報を決定し、符号化データ生成部29が、符号化設定部21により決定されたCU予測情報を符号化する(S21)。この処理は、CU単位で行われる。
【0527】
具体的には、符号化設定部21が、対象CUがスキップCUであるか否かを決定する。対象CUがスキップCUである場合、符号化設定部21は、スキップフラグSKIPを符号化データ生成部20に符号化させる。また、対象CUがスキップCUでない場合、符号化設定部21は、CU予測タイプ情報Pred_typeを符号化データ生成部20に符号化させる。
【0528】
次に、PU単位の処理が行われる。すなわち、予測画像生成部23が動き情報を導出し、符号化データ生成部29が、予測画像生成部23により導出された動き情報を符号化する(S22)。また、予測画像生成部14は、導出した当該動き情報に基づいてインター予測により予測画像を生成する(S23)。
【0529】
次に、変換・量子化部27が、TU分割符号化処理を行う(S24)。具体的には、変換・量子化部27は、対象CUのCUサイズおよびPU分割タイプに基づいて、TU分割の方式を設定する。この処理は、CU単位で行われる。
【0530】
次に、TU単位の処理が行われる。すなわち、変換・量子化部27が、予測残差を変換係数に変換・量子化し(S25)、符号化データ生成部29が、変換・量子化された変換係数を符号化する(S26)。
【0531】
次に、逆量子化・逆変換部22が、変換・量子化された変換係数を、逆量子化・逆変換して予測残差を復元するとともに、加算器24が、予測画像および予測残差を加算することにより、復号画像が生成される(S27)。この処理は、CU単位で行われる。
【0532】
〔応用例〕
上述した動画像符号化装置2及び動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
【0533】
まず、上述した動画像符号化装置2及び動画像復号装置1を、動画像の送信及び受信に利用できることを、
図27を参照して説明する。
【0534】
図27の(a)は、動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。
図27の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_A1として利用される。
【0535】
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。
図27の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
【0536】
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
【0537】
図27の(b)は、動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。
図27の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置1は、この復号部PROD_B3として利用される。
【0538】
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。
図27の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
【0539】
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
【0540】
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
【0541】
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_B
の一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
【0542】
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービ
スなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
【0543】
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
【0544】
次に、上述した動画像符号化装置2及び動画像復号装置1を、動画像の記録及び再生に利用できることを、
図28を参照して説明する。
【0545】
図28の(a)は、上述した動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。
図28の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_C1として利用される。
【0546】
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(UniversalSerial Bus)フラッシュメモリなど
のように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録
装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
【0547】
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。
図28の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
【0548】
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
【0549】
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、
HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_
C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
【0550】
図28の(b)は、上述した動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。
図28の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置1は、この復号部PROD_D2として利用される。
【0551】
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
【0552】
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。
図28の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
【0553】
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
【0554】
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
〔まとめ〕
符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号装置において、
本発明の一態様に係る画像復号装置は、前記符号化単位を分割する分割タイプを指定する情報を復号するCU情報復号部と、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号する算術復号部とを備え、前記CU情報復号部が、前記分割タイプとして非対称的分割(AMP; Asymmetr
ic Motion Partition)を指定する情報を復号する場合、前記算術復号部は、前記バイナ
リ値の位置に応じて、前記コンテキストを用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号する。
【0555】
本発明の一態様に係る画像復号装置は、前記符号化単位のサイズを2N×2N画素とした場合、前記分割タイプは、少なくとも対称的分割である2N×2N画素、2N×N画素及びN×2N画素と前記非対称的分割である2N×nU画素、2N×nD画素、nL×2N画素及びnR×2N画素を含んでいる。
【0556】
本発明の一態様に係る画像復号装置は、前記CU情報復号部が、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を復号する場合、前記算術復号部は、一部のバイナリ値のみを、前記コンテキストを用いない算術復号により復号する。
【0557】
本発明の一態様に係る画像復号装置は、前記一部のバイナリ値は、少なくとも前記非対称的分割に関する情報に対応するバイナリ値を含んでいる。
【0558】
本発明の一態様に係る画像復号装置は、符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号装置において、前記符号化単位を分割する分割タイプを指定する情報を復号するCU情報復号部と、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号する算術復号部とを備え、前記CU情報復号部が、前記分割タイプとして長方形分割の種類を指定する情報を復号する場合、前記算術復号部は、前記バイナリ値の位置に応じて、前記コンテキストを用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号する。
【0559】
本発明の一態様に係る画像復号方法は、符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号方法において、前記符号化単位を分割する分割タイプを指定する情報を復号するステップと、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号するステップとを少なくとも含み、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を復号する場合、前記バイナリ値の位置に応じて、前記コンテキスト
を用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号する。
【0560】
本発明の一態様に係る画像符号化装置は、符号化単位毎に、画像を復元するための情報を符号化して画像符号化データを生成する画像符号化装置において、前記符号化単位を分割する分割タイプを指定する情報を符号化する符号化設定部と、コンテキストを用いた符号化処理又はコンテキストを用いない符号化処理により、前記画像符号化データを生成する符号化データ生成部とを備え、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を符号化する場合、前記符号化データ生成部は、
前記コンテキストを用いた符号化処理と前記コンテキストを用いない符号化処理とを切り替えて前記画像符号化データを生成する。
【0561】
本発明の一態様に係る画像復号装置は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号装置であって、前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備える。
【0562】
本発明の上記の態様によれば、非対称パーティションを用いる場合における符号量の削減と、非対称パーティションの性質を活用した効率のよい符号化/復号処理を実現することができる。
【0563】
また、本発明は以下のように表現することもできる。本発明の一態様に係る画像復号装置は、符号化単位毎に、画像を復元するための情報を画像符号化データから復号して画像を復元する画像復号装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を復号する復号手段を備えることを特徴とする。
【0564】
上記の構成において、所定サイズ以下のサイズの符号化単位は、当該所定サイズよりも大きいサイズの符号化単位では、インター予測が当たりにくくなるようなサイズの符号化単位である。
【0565】
インター予測が当たりにくい領域では、所定サイズ以下のサイズの小さい符号化単位が適用される傾向がある。なお、以下、所定サイズよりも大きいサイズの符号化単位のことを大きい符号化単位と称する。
【0566】
所定サイズ以下のサイズの符号化単位は、例示的には、最小サイズの符号化単位であり、8×8画素の符号化単位である。
【0567】
このような小さい符号化単位では、大きい符号化単位よりも空間相関性が高くなるので、予測精度の向上を図るためイントラCUが適用されることが多い。
【0568】
上記の構成では、符号化サイズが小さく、予測方式が画面内予測である組み合わせについて、それ以外の組み合わせよりも短い符号が割り当てられる。
【0569】
このため、上記の構成によれば、所定サイズ以下のサイズの符号化単位において発生確率が高い組み合わせに短い符号を割り当てることができ、符号化効率が向上するという効果を奏する。
【0570】
本発明の一態様に係る画像復号装置は、上記復号手段が、上記組み合わせに対して、上記所定サイズより大きいサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して割り当てられている符号に比べて、短い符号を復号することが好ましい。
【0571】
上記の構成によれば、画面内予測が当たりにくい大きい符号化単位において画面内予測の予測方式が適用される場合よりも、画面内予測が当たりやすい小さい符号化単位において画面内予測の予測方式が適用される場合に、より短い符号が復号される。
【0572】
これにより、出現頻度が高い組み合わせに対して、短い符号を復号することができ、その結果、符号化効率を向上させることができる。
【0573】
本発明の一態様に係る画像復号装置は、上記復号手段が、上記組み合わせに対して、上記所定サイズと同一サイズの符号化単位に画面内予測以外の予測方式が適用される組み合わせに対して割り当てられている符号に比べて、短い符号を復号することが好ましい。
【0574】
上記の構成によれば、小さい符号化単位において予測が当たりにくい画面間予測よりも、予測が当たりやすい画面内予測について、短い符号を復号することができる。
【0575】
これにより、出現頻度が高い組み合わせに対して、短い符号を復号することができ、その結果、符号化効率を向上させることができる。
【0576】
本発明の一態様に係る画像復号装置は、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、上記画面間予測が適用される、所定サイズ以下のサイズの予測単位である対象予測単位について、双予測を行うことを制限する双予測制限手段を備えることを特徴とする。
【0577】
双予測は、単予測よりも処理量が多い。なお、双予測とは、画面間予測において参照する画像を2つ用いる予測方式のことである。参照する画像は、対象フレームに対して時間的に前方であっても後方であってもよい。
【0578】
また、所定サイズ以下のサイズの小さい予測単位では、所定サイズよりも大きいサイズの大きい予測単位よりも、単位面積当たりの処理量が多い。
【0579】
従って、小さい予測単位において双予測を行うと、どちらも処理量が多いため、復号処理のボトルネックになりやすい。
【0580】
上記の構成によれば、小さい予測単位において双予測を行うことを制限する。なお、制限するとは、双予測における一部の処理を省略すること、および、双予測の処理を行わないことを含む。
【0581】
上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができるという効果を奏する。
【0582】
本発明の一態様に係る画像復号装置は、上記双予測制限手段が、上記対象予測単位における予測画像の生成に用いる動きベクトルの少なくとも一部の復号を省略しない予測単位であって、かつ、上記対象予測単位の近傍の予測単位に割り付けられている予測パラメータから、該対象予測単位に割り付ける予測パラメータの推定を行わない上記対象予測単位に対して、上記制限を行うことが好ましい。
【0583】
上記の構成によれば、いわゆるスキップ処理およびマージ処理を行わず、実際に対象予測単位に予測パラメータを導出する場合において、双予測を制限する。
【0584】
スキップ処理やマージ処理を行わない場合、動きベクトルを全て復号する必要があり処理量が増加する。したがって、そのような場合に上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができる。
【0585】
本発明の一態様に係る画像復号装置は、上記双予測制限手段が、双予測および単予測のいずれを行うかを示す情報の復号を省略して、単予測を行うことが好ましい。
【0586】
上記構成によれば、双予測を制限する対象予測単位における復号処理を簡略化することができる。また、単予測を行うことが予め決まっているのに、双予測および単予測のいずれを行うかを示す情報を復号するというオーバーヘッドを回避することができる。
【0587】
本発明の一態様に係る画像復号装置は、上記双予測制限手段が、双予測における重み付け予測に関する情報の処理を省略することが好ましい。
【0588】
上記構成によれば、双予測における重み付け予測に関する情報の処理を省略することで、双予測における処理量を軽減できる。その結果、重み付け予測に関する情報の処理のような、復号処理のボトルネックになるような処理の処理量を低減することができる。
【0589】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、復号対象となる上記符号化単位である対象符号化単位を上記予測単位へ分割するタイプである分割タイプと予測方式との複数の組に対して対応付けられる複数の符号を、復号の対象となる上記予測単位である対象予測単位の近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて変更する変更手段を備えることを特徴とする。
【0590】
予測画像を生成する単位は、符号化処理の単位となる符号化単位を基準に決定される。具体的には、符号化単位と同じ領域または符号化単位を分割して得られる領域を予測単位とする。
【0591】
上記の構成において、上記予測単位への分割タイプは、正方形への分割および非正方形への分割を含んでいてもよい。正方形への分割は、分割によって得られる予測単位が正方形である場合である。
【0592】
例えば、正方形の符号化単位を、4つの正方形に四分割する場合がこれに該当する。また、正方形の符号化単位と同じサイズの領域を予測単位とする非分割の場合もこれに該当する。非分割の場合の分割タイプは、一般的には、2N×2Nと表される。
【0593】
非正方形への分割は、分割によって得られる予測単位が非正方形である場合である。例えば、符号化単位の領域を大きな長方形と、小さな長方形とに分割する場合がこれに該当する。
【0594】
また、符号とは、符号化されたパラメータ値のバイナリ(bin)列のことをいう。バイナリ列は直接符号化されてもよいし、算術符号化により符号化されてもよい。予測方式は、画面間予測および画面内予測のいずれかである。また、予測方式および分割タイプの組とは、例えば、(画面内予測,非分割)であり、pred_typeというパラメータ値によって表されることもある。
【0595】
また、上記の構成では、符号と、予測方式および分割タイプの組とは、1対1で対応付けられる。
【0596】
上記の構成によれば、復号済みパラメータに応じて、上記対応付けを変更する。言い換えれば、同じ符号であっても、復号済みパラメータに応じて、いずれの予測方式および分割タイプの組を示すかの解釈を変更するということである。
【0597】
このため、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てることができる。
【0598】
具体的には、対象符号化単位に隣接する符号化単位が、画面内予測を行う符号化単位である場合、対象符号化単位も画面内予測が採用される可能性が高くなる。
【0599】
よって、このような場合、画面内予測を含む組に短い符号を割り当てることが望ましい。
【0600】
上記の構成によれば、近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てるので、符号化効率を向上させることができる。
【0601】
本発明の一態様に係る画像復号装置は、上記変更手段が、上記対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているときに、画面内予測の予測方式を含む組に対応付けられる符号を、短い符号に変更することが好ましい。
【0602】
上記の構成によれば、対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているときに、画面内予測の予測方式を含む組に対応付けられる符号を、短い符号に変更する。
【0603】
なお、近傍とは、複数であってもよく、例えば、上隣接符号化単位および左隣接符号化単位を近傍とすることが挙げられる。
【0604】
この場合、上隣接符号化単位および左隣接符号化単位のいずれか、もしくは、両方において、画面内予測の予測方式が割り付けられていればよい。
【0605】
対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているとき、対象符号化単位も画面内予測が割り付けられる可能性が高い。
【0606】
このため、発生頻度が高い組に対応付けられる符号を短くすることができ、符号化効率が向上する。
【0607】
本発明の一態様に係る画像復号装置は、上記変更手段が、上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいときに、隣接する方向への分割を行う分割タイプを含む組に対応付けられる符号を、短い符号に変更することが好ましい。
【0608】
上記の構成によれば、上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいときに、隣接する方向への分割を行う分割タイプを含む組に対応付けられる符号を、短い符号に変更する。
【0609】
上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいとき、対象符号化単位と、隣接する復号済み符号化単位との間の境界に対し、垂直な方向にエッジが存在する可能性が高い。すなわち、対象符号化単位が上記復号済み符号化単位に隣接する方向にエッジが現れることが多い。
【0610】
このような場合、隣接する方向への分割を行う分割タイプが選択されやすくなる。
【0611】
このため、発生頻度が高い組に対応付けられる符号を短くすることができ、符号化効率が向上する。
【0612】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、復号の対象となる上記予測単位である対象予測単位が、該対象予測単位の近傍の領域に割り付けられている予測パラメータから、該対象予測単位の予測パラメータの推定を行う予測単位である場合、該対象予測単位のサイズに応じて、推定に用いる領域の候補を決定する候補決定手段を備えることを特徴とする。
【0613】
上記の構成によれば、対象予測単位のサイズに応じて、いわゆるスキップや、マージに用いる領域の候補を決定する。または、復号した差分動きベクトルと合わせて動きベクトルを復元するために用いる推定動きベクトルの導出に用いる領域の候補を設定する。
【0614】
対象予測単位のサイズに応じて、画面間予測の動きベクトルの相関は変動する。例えば、所定のサイズ以下の小さい予測単位が選択される領域では、オブジェクトの動きが複雑な場合が多く、動きベクトルの相関は小さい。
【0615】
よって、上記構成によれば、例えば、動きの複雑度に応じて、候補数を削減することができる。これにより、サイド情報を削減することができ、その結果、符号化効率を向上させることができる。
【0616】
本発明の一態様に係る画像復号装置は、上記候補決定手段が、所定のサイズ以下の小さい予測単位の上記候補の数を、該小さい予測単位よりも大きい予測単位の上記候補の数よりも少なくすることが好ましい。
【0617】
上記の構成によれば、所定のサイズ以下の小さい予測単位の上記候補の数を、該小さい予測単位よりも大きい予測単位の上記候補の数よりも少なくする。
【0618】
上述のとおり、所定のサイズ以下の小さい予測単位が選択される領域では、オブジェクトの動きが複雑な場合が多く、動きベクトルの相関は小さい。
【0619】
そのため、上記のような領域では、候補数を少なくしたほうが、サイド情報を削減することができるため好ましい。
【0620】
本発明の一態様に係る画像復号装置は、上記候補決定手段が、所定のサイズ以下の小さい予測単位では、時間予測を上記候補に含めないことが好ましい。
【0621】
上記の構成によれば、所定のサイズ以下の小さい予測単位では、時間予測を上記候補に含めない。
【0622】
小さい予測単位が選択されるような動きが複雑な領域では、時間予測に用いられる関連予測単位(collocated PU)と対象予測単位との相関が小さいため、時間予
測が選択される可能性が小さい。よって、このような領域では、時間予測をマージ候補に含めないことが好ましい。
【0623】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、長方形の予測単位への分割を含み、上記長方形が縦長および横長のいずれであるかを示す符号と、上記長方形の種類を示す符号とを含む、上記長方形の予測単位への分割を特定するための符号のうち、上記長方形の種類を示す符号を、コンテキストを用いずに復号する復号手段を備えることを特徴とする。
【0624】
上記の構成によれば、予測単位への分割タイプが、長方形の予測単位への分割の場合、長方形の種類を示す符号を、コンテキストを用いずに復号する。
【0625】
長方形の種類とは、例えば、分割タイプが、横長の長方形の分割である場合、2N×N、2N×nU、2N×nDの3種類である。
【0626】
予測単位の分割は、符号化単位の領域内に存在するエッジをまたがないように行われることが多い。傾きを有するエッジが領域内に存在する場合、必ずしも同一の長方形の種類が続けて選ばれないことがある。このような領域においては、コンテキストを用いて復号処理を行っても、符号化効率が向上しない場合がある。
【0627】
逆に言えば、このような領域においては、コンテキストを用いないで復号処理を行っても、符号化効率が低下しない場合がある。
【0628】
上記の構成によれば、上述のような領域において、符号化効率を維持しつつ、コンテキストを参照しないことによる処理の簡略化を図ることができる。
【0629】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、上記分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う推定手段を備えることを特徴とする。
【0630】
上記の構成によれば、分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う。
【0631】
非対称分割が選択される符号化単位は、予測単位を得るための分割において、小さい方の予測単位と、大きい方の予測単位とに非対称に分割される。
【0632】
また、非対称分割が選択される符号化単位では、小さい方の予測単位を長辺方向に横切るエッジが存在する可能性が高い。
【0633】
また、エッジが存在する領域は正確な動きベクトルが導出されている可能性が高い。つまり、分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と、精度の高い動きベクトルが導出されている領域が異なる。
【0634】
よって、分割タイプが非対称分割である場合と、上記分割タイプが対称分割である場合とで異なる推定方法を変更することで、分割タイプに応じた好ましい推定方法により画面間予測の予測パラメータの推定を行うことができるという効果を奏する。
【0635】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する変換単位分割手段を備えることを特徴とする。
【0636】
上記の構成によれば、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する。
【0637】
非対称分割が適用されるとき、小さい方の予測単位にはエッジが含まれる可能性が高いのに対して、大きい方の予測単位にはエッジが含まれる可能性が低い。
【0638】
予測残差に方向性がない場合、変換単位の分割方式として、長方形の変換を適用するよりも、正方形の変換を適用したほうが、効率よく相関を除去できる。
【0639】
上記構成によれば、分割タイプが非対称分割であるときは、上記対象符号化単位に含まれる予測単位の大きさに応じて、効率よく相関を除去できるような変換単位の分割方式を選択することができる。その結果、符号化効率が向上する。
【0640】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記変換単位への分割方式は、正方形および長方形の分割を含み、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する分割手段を備えることを特徴とする。
【0641】
領域内にエッジが存在し、画像に方向性があるにもかかわらず、正方形の予測単位が選択される場合がある。例えば、多数の横エッジが存在するオブジェクトが移動している場合、オブジェクト内では、動きは一様であるため、正方形の予測単位が選択される。しかしながら、このような場合は、変換処理では、横エッジに沿った、水平方向に長い形状の変換単位を適用することが望ましい。
【0642】
上記の構成によれば、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。
【0643】
これにより、正方形の符号化単位においても、長方形の変換単位を選択することができ、このため上記のような領域に対する符号化効率を向上させることができる。
【0644】
本発明の一態様に係る画像復号装置は、上記分割手段が、さらに、所定の大きさの符号化単位において分割深度2に対応する変換単位の形状が正方形である場合、上記所定の大きさの符号化単位において、分割深度1に対応する対象変換単位を長方形とすることが好ましい。
【0645】
上記の構成によれば、対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。
【0646】
変換単位を正方形の4分木分割方式により再帰的に2回分割すると、すなわち分割深度を2まで上げると、16個の正方形の変換単位が得られる。この場合、スキャン順は、zスキャンが再帰的に適用されたものになる。従来、対象符号化単位の分割タイプが正方形の分割である場合、この分割方式が適用されていた。
【0647】
一方、変換単位を横長の4分木分割方式により分割する場合は、分割深度2では、各ノードが正方形の変換単位に分割される。すなわち、分割深度を2では、最終的に、16個の正方形の変換単位が得られる。この場合、スキャン順は、16個の正方形の変換単位に対してラスタスキャンが適用される。従来、対象符号化単位の分割タイプが非正方形の分割である場合、この分割方式が適用されていた。
【0648】
よって、対象符号化単位の分割タイプが、正方形の分割である場合と非正方形の分割である場合とで、スキャン順が異なっていた。
【0649】
これに対して、上記の構成によれば、符号化単位の分割タイプが正方形の分割であり、すなわち対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。
【0650】
このため、正方形の分割である場合と非正方形の分割である場合とで、スキャン順を統
一させることができるという効果を奏する。
【0651】
本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位、または、分割した符号化単位として得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、異なる大きさの予測単位への分割である非対称形への分割および同一の大きさの予測単位への分割である対称形への分割を含み、復号の対象となる上記予測単位である対象予測単位の分割タイプが非対称形への分割であるとき、該分割により得られた小さい予測単位および大きい予測単位の間で、異なるコンテキストを参照して変換係数を復号する係数復号手段を備えることを特徴とする。
【0652】
非対称分割により得られた小さい予測単位には、エッジが存在する可能性が高く変換係数が発生しやすい。これに対して、大きい予測単位では変換係数が発生しにくい。対象変換単位が、小さい予測単位に含まれる場合と大きい予測単位に含まれる場合とで、異なるコンテキストを用いることで、それぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。
【0653】
本発明の一態様に係る画像符号化装置は、符号化単位毎に、画像を復元するための情報を符号化して画像符号化データを生成する画像符号化装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を符号化する符号化手段を備えることを特徴とする。
【0654】
なお、上記画像復号装置に対応する構成を備える画像符号化装置も本発明の範疇に入る。上記のように構成された画像符号化装置によれば、本発明の一態様に係る画像復号装置と同様の効果を奏することができる。
【0655】
(ハードウェア的実現およびソフトウェア的実現)
また、上述した動画像復号装置1および動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
【0656】
後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0657】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(Compact Disc Read-Only Memory)/MOディスク(Magneto-Optical disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)/CD−R(CD Recordable)/ブルーレイディスク
(Blu-ray Disc:登録商標)等の光ディスクを含むディスク類、ICカード(メモリカー
ドを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmabl
e Read-Only Memory)/EEPROM(登録商標)(Electrically Erasable and Programmable Read-Only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回
路類などを用いることができる。
【0658】
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna television/Cable Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic
Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE80
2.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(登録商標)(Digital Living Network Alliance)、携帯電話網、衛星回線、地上
波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0659】
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。