【文献】
大久保 榮,インプレス標準教科書シリーズ 改訂版H.264/AVC教科書,株式会社インプレスR&D,2006年 1月 1日,pp.82-84, 277-279, 294-299
【文献】
Keiichi Chono et al.,Pulse code modulation mode for HEVC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, Korea,2011年 1月,JCTVC-D044-rev1,pp.1-9
【文献】
Keiichi Chono et al.,Proposal of enhanced PCM coding in HEVC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,5th Meeting: Geneva, CH,2011年 3月,JCTVC-E192-r2,pp.1-12
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0022】
(実施形態1)
本実施形態1に係る動画像符号化装置について、図面を参照しながら説明する。
【0023】
1.動画像符号化装置の構成
図1は、本実施形態に係る動画像符号化装置100の構成を示すブロック図である。動画像符号化装置100は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理を行い符号列を生成する。
【0024】
この動画像符号化装置100は、ピクチャメモリ101と、予測残差符号化部102と、予測残差復号化部103と、ローカルバッファ104と、予測符号化部105と、量子化値決定部106と、ヘッダ符号列生成部107と、係数符号列生成部108とを備えている。
【0025】
ピクチャメモリ101は、表示を行う順にピクチャ単位で入力される入力画像信号151を、符号化を行う順にピクチャの並び替えを行って蓄積する。次に、ピクチャメモリ101は、差分演算部109または予測符号化部105からの読出し命令を受け付けると当該読出し命令に係る入力画像信号をそれぞれ出力する。このとき、各々のピクチャはコーディングユニット(以下、CUと称す)と呼ばれる複数の画素から構成される符号化単位に分割される。このCUは、例えば水平64×垂直64画素のブロック、水平32×垂直32画素のブロック、水平16×垂直16画素のブロック等である。なお、本実施形態における動画像符号化装置100では、CU単位で以降の処理が行われる。
【0026】
予測残差符号化部102は、差分演算部109から出力される差分画像信号152に対して直交変換を行う。さらに、予測残差符号化部102は、得られた各周波数成分の直交変換係数に対し量子化を行うことで画像情報の圧縮を行い、残差符号化信号153を生成する。予測残差符号化部102は、生成した残差符号化信号153を予測残差復号化部103および係数符号列生成部108に出力する。このとき予測残差符号化部102は、量子化値決定部106において決定された量子化値信号158を用いて、直交変換係数を量子化する。
【0027】
予測残差復号化部103は、予測残差符号化部102から出力される残差符号化信号153に対して、逆量子化および逆直交変換することで残差復号化信号154を生成する。そして、生成した残差復号化信号154を加算演算部110に出力する。
【0028】
ローカルバッファ104は、加算演算部110から出力される再構成画像信号155を格納する。この再構成画像信号155は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理に用いられる。つまり、再構成画像信号155は、現在符号化対象となっているピクチャ以降のピクチャを符号化する際、画素データとして参照される。ローカルバッファ104は、予測符号化部105からの読出し命令に応じて、格納している再構成画像信号155を画素データとして予測符号化部105に出力する。
【0029】
予測符号化部105は、ピクチャメモリ101から出力される入力画像信号を基に、画面内予測、または画面間予測を用いて予測画像信号156を生成する。そして、予測符号化部105は、生成した予測画像信号156を差分演算部109および加算演算部110に出力する。なお、予測符号化部105は、画面間予測を用いる際は、ローカルバッファ104に蓄積されている既に符号化済みの過去のピクチャの再構成画像信号155を用いる。また予測符号化部105は、画面内予測を用いる際は、符号化対象CUに隣接する既に符号化済みのCUの現在のピクチャの再構成画像信号155を用いる。画面内予測を用いるか画面間予測を用いるかのモード判定方法については、どちらの予測方法がより残差信号の情報量を少なくすることができるかを予測して行われる。
【0030】
量子化値決定部106は、ピクチャメモリ101に格納されているピクチャに基づいて、予測残差符号化部102において差分画像信号152を量子化する際の量子化値を設定する。量子化値決定部106は、設定した量子化値を予測残差符号化部102およびヘッダ符号列生成部107に出力する。なお、量子化値決定部106における量子化値の設定方法としては、符号列信号159のビットレートが、目標とするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の設定方法を利用しても構わない。
【0031】
ヘッダ符号列生成部107は、予測符号化部105が出力する予測情報信号157と、量子化値決定部106が出力する量子化値信号158と、その他の符号化制御に関する制御情報を可変長符号化することで符号列を生成する。なお、予測情報信号157に含まれる予測情報には、例えば画面内予測モードを示す情報、画面間予測モードを示す情報、動きベクトルを示す情報、参照ピクチャを示す情報等が含まれる。また、制御情報は係数符号列生成部108における処理前までに取得可能な情報であって、CUの符号化時に適用した符号化条件を示す情報である。例えばブロック符号化タイプ、ブロック分割情報等が含まれる。
【0032】
係数符号列生成部108は、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して生成した符号列、もしくは予測残差復号部103から出力される残差復号化信号154を可変長符号化せずに生成した符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159を生成する。なお、ここでいう可変長符号化には、算術符号化を含む。以下において同様である。
【0033】
つまり、係数符号列生成部108は、入力される信号に応じて2つのモードを切り換えて実行する。第1モードは、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して得られる符号列とヘッダ符号列生成部107が出力する符号列から符号列信号159を生成して出力するモードである。第2モードは、予測残差復号化部103が出力する残差復号化信号154とヘッダ符号列生成部107が出力する符号列から符号列信号159を生成して出力するモードである。この第2モードを用いて符号列信号159を出力する場合、残差復号化信号154は可変長符号化せずに、残差復号化信号154をそのまま符号列として扱う。
【0034】
差分演算部109は、ピクチャメモリ101から読み出された画像信号と、予測符号化部105の出力である予測画像信号156との差分値である差分画像信号152を生成し、予測残差符号化部102に出力する。
【0035】
加算演算部110は、予測残差復号化部103から出力される残差復号化信号154と、予測符号化部105から出力される予測画像信号156とを加算することにより再構成画像信号155を生成し、ローカルバッファ104及び予測符号化部105に出力する。
【0036】
2.符号列信号の生成方法
ヘッダ符号列生成部107および係数符号列生成部108において符号列信号を生成する方法について、
図2のフローチャートを用いて具体的に説明する。
【0037】
まず、ヘッダ符号列生成部107は、前述の符号化処理を行った結果生成された予測情報信号157、量子化値信号158、その他の符号化制御情報を可変長符号化することによってヘッダ情報の符号列を生成する(S401)。
【0038】
次に、係数符号列生成部108は、入力された残差符号化信号153を用いて、符号化対象CUの発生符号量が規定値を超過する可能性があるかどうかを判定する(S402)。
【0039】
ステップS402において、超過する可能性がないと判断された場合は、Residualモードで係数が符号化されていることを示す識別子を符号化し(S403)、つづいて、従来の符号化と同様に入力された残差符号化信号153を可変長符号化する(Residualモード)ことで符号列を生成する(S404)。
【0040】
一方、ステップS402において、超過する可能性があると判断された場合は、PCMモードで係数が符号化されていることを示す識別子を符号化し(S405)、つづいて、入力された残差復号化信号154を可変長符号化せずにそのまま符号列に追加する(PCMモード)ことで符号列を生成する(S406)。
【0041】
なお、ステップS402において、入力された残差符号化信号153を用いて符号化対象CUの発生符号量が規定値を超過する可能性があるかどうかを判定しているが、それ以外の方法を用いて発生符号量が規定値を超過する可能性があるかどうかを判定してもよい。例えば、符号列信号159を用いて符号量が既定値を超過しているか判定する方法がある。この場合、判定を行った時点で既に係数符号列生成部108から符号列が出力されているので、当該符号列において、残差符号化信号153を可変長符号化して得られる符号列に代えて、入力された残差復号化信号154にそのまま置き換えることで処理がなされる。
【0042】
また、CU単位で判定を行う代わりに、複数のCU単位、もしくは別のブロック単位で判定を行ってもよい。
【0043】
3.シンタックス
図3は、本実施の形態によって生成される符号列における、CU単位のシンタックス:coding_unit()の一例を示した図である。
【0044】
シンタックスの先頭には、ヘッダ符号列生成部107によって生成された、予測モード:pred_mode、予測情報:prediction_unit()、量子化値:qp_value等の情報を可変長符号化した符号列が記述されている。
【0045】
つづいて、
図2で説明した識別子であるpcm_flagが記述されている。この識別子が0であることは、Residualモードによって係数符号列がResidual_data()に記述されていることを示す。また、識別子が1であることは、PCMモードによって係数符号列がpcm_data()に記述されていることを示す。pcm_data()に記述される係数符号列は、前述の通り可変長符号化を行わない残差復号化信号154である。
【0046】
図4は本実施の形態によって生成される符号列のCU単位のシンタックス:coding_unit()の別の一例を示した図である。
図3で説明したシンタックスと異なるのは識別子としてpcm_flagの代わりにcbp_yuv_rootを用いている点のみである。
【0047】
この識別子は、従来の符号化において輝度成分および色差成分毎に残差符号化信号があるかないかを示すために用いられていたものである。この識別子が0から7であることは、従来通りResidualモードによって係数符号列がResidual_data()に記述されていることを示す。この識別子が8であることは、PCMモードによって係数符号列がpcm_data()に記述されていることを示す。つまり、従来から存在する0から7までの情報に8番目の情報を追加する。
【0048】
これによって、新たな識別子の追加による符号量の増加を招くことなく、新たな機能を追加することが可能となる。
【0049】
図5は本実施の形態によって生成される符号列のCU単位のシンタックス:coding_unit()のさらに別の一例を示した図である。
図3で説明したシンタックスと異なるのは識別子としてpcm_flagの代わりにresidual_data_flagを用いている点のみである。
【0050】
この識別子は、従来の別の符号化において対象ブロックに残差符号化信号があるかないかを示すために用いられていたものである。つまり、この識別子が0であることは、従来通り係数情報がないことを示す。また、識別子が1であることは、従来通り係数情報がResidualモードによって係数符号列がResidual_data()に記述されていることを示す。さらに、識別子が2であることは、PCMモードによって係数符号列がpcm_data()に記述されていることを示す。
【0051】
これによって、識別子として従来から存在する信号を共有して使用することが可能となり、新たな識別子の追加による符号量の増加を抑制することが可能となる。
【0052】
なお、
図3、
図4、
図5で説明したシンタックスおよび識別子の値については、本実施の形態を説明するための一例であり、ここに記載されている内容と異なるシンタックスや識別子の値を割り当てることによって同様の機能を実現してもよい。
【0053】
なお、
図2のステップS402における規定値とは、前記残差復号化信号154をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述すべき全ての情報を符号化する際に必要となる最大の符号量とを合わせた符号量に余裕量を加えた符号量である。例えば、画像のフォーマットが各画素8ビットのYUV4:2:0であり、符号化対象CUのサイズが32×32画素であった場合、前記残差復号化信号154をそのまま符号列として記述する際に必要となる符号量は1536バイトとなる。この場合、規定値は、この符号量と、前記ヘッダ符号列に記述すべき全ての情報を符号化する際に必要となる最大の符号量と、余裕量とを合わせた符号量とすることが考えられる。例えば13000ビット等の値が考えられる。
【0054】
4.パイプライン改善効果
図6を用いて本実施の形態による動画像符号化装置のパイプラインの例を示す。
【0055】
図6(a)は
図2のステップS402の判定の結果、Residualモードで係数符号列を生成した場合のパイプラインの制御を示す図である。
図14(a)で説明した従来の制御と全く同様の流れで処理が行われている。
【0056】
一方、
図6(b)、は
図2のステップS402の判定の結果、PCMモードで係数符号列を生成した場合のパイプライン制御を示す図である。本実施形態では、第1モードにおいて、前述のように、予測残差符号化部102で生成された残差符号化信号153を可変長符号化して係数符号列を生成し、係数符号列にヘッダ符号列生成部107で生成されたヘッダ情報を対応付けた状態で、係数符号列および前記ヘッダ情報を出力する。一方、第2モードにおいて、予測残差復号化部103で生成された残差復号化信号154を可変長符号化することなく、残差復号化信号154をそのまま係数符号列とし、係数符号列にヘッダ情報符号列生成部107で生成されたヘッダ情報を対応付けた状態で、係数符号列およびヘッダ情報を出力する。ここで、残差復号化信号154は、残差符号化信号153とは同一の入力画像信号151に基づくものである。また、復号化装置において、残差符号化信号153を当該信号とセットの予測情報を用いて復号化すると、残差復号化信号154と同一の信号が得られる。つまり、復号化装置において最終的に生成される再構成画像信号の画素情報は、第1モードの場合でも第2モードの場合でも同一となる。そのため、ブロック1がPCMモードに切り替わっても、ヘッダ符号列に記述されている予測情報の変更や、再度の符号化は不要である。そのため、ブロック1の予測情報や画素情報を参照しながら符号化処理が進行しているブロック2の処理には全く影響を与えない。よって、パイプラインを遡ることなくそのまま係数符号列のみをPCMモードで符号化することが可能となる。
【0057】
なお、残差復号化信号154を出力する場合、復号化装置において、当該信号の復号は不要である。そのため、当該信号を復号する上では、予測情報は不要であるが、この予測情報は、ブロック2の復号等において参照される。
【0058】
このように、本実施の形態による動画像符号化装置は、パイプラインを遡ることなくPCMモードに切替えて符号化を行うことができるため、処理速度の遅延もしくは処理量を増加させることなく、ブロック単位の発生符号量を特定の最大値以下に納めることが可能となる。
【0059】
5.まとめ
本実施形態における動画像符号化装置100は、入力される動画像をブロック単位で符号化する動画像符号化装置100であって、符号化対象画像に対応する予測画像を生成する予測符号化部105と、前記符号化対象画像と前記生成された予測画像との差分画像信号152を生成する差分演算部109と、前記差分演算部109の出力に対して直交変換処理および量子化処理を行い、残差符号化信号153を生成する予測残差符号化部102と、前記残差符号化信号153に対して逆量子化処理および逆直交変換処理を行い、残差復号化信号154を生成する予測残差復号化部103と、前記予測符号化部105で生成された予測画像と前記予測残差復号化部103で生成された残差復号化信号154とを加算することで再構成画像信号155を生成する加算演算部110と、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ情報を生成するヘッダ符号列生成部107と、第1モードにおいて、前記予測残差符号化部102で生成された残差符号化信号153を可変長符号化して係数符号列を生成し、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する一方、第2モードにおいて、前記予測残差復号化部103で生成された残差復号化信号154を可変長符号化することなく、前記残差復号化信号154をそのまま係数符号列とし、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する係数符号列生成部108と、を備える。
【0060】
また好ましくは、前記係数符号列生成部108は、前記係数符号列および前記ヘッダ情報に、前記係数符号列を復号する際に逆量子化および逆直交変換をするか否かを示す識別子を対応付けた状態で、前記係数符号列、前記ヘッダ情報および前記識別子を出力する。
また好ましくは、前記識別子は、前記第1モードにおける係数符号列および前記第2モードにおける係数符号列で共通で使用される識別子であり、当該識別子情報のうち1つは、前記第1モードにおける係数符号列として符号化したことを示すものであり、また別の1つは、前記第2モードにおける係数符号列として符号化したことを示し、かつ符号化した残差符号化信号153があるかないかを示すものである。
【0061】
(実施形態2)
実施形態2に係る動画像符号化装置について、図面を参照しながら説明する。
【0062】
1.動画像符号化装置の構成
図7は、本実施形態に係る動画像符号化装置100−1のブロック図である。動画像符号化装置100−1は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理し、符号列を生成する。
【0063】
この動画像符号化装置100−1は、実施の形態1の動画像符号化装置100の係数符号列生成部108の代わりに、係数符号列生成部108−1を備えている。
【0064】
以下、説明の便宜上、実施形態1と同様の構成についてはその詳細な説明を省略する。さらに、
図7では、
図1と同様の機能を有するブロックについては同じ番号を付す。
【0065】
係数符号列生成部108−1は、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−1を生成する第1モードを有する。さらに、係数符号列生成部108−1は、差分演算部109から出力される差分画像信号152を可変長符号化せずに得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−1を生成する第2モードを有する。
【0066】
なお、上記第2モードは、差分演算部109から出力される差分画像信号152を可変長符号化してえられる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−1を生成するモードでも構わない。
【0067】
係数符号列生成部108−1は、上記の第1モードおよび第2モードを切り換えて実行する。
【0068】
2.符号列の生成方法
図8は、ヘッダ符号列生成部107および係数符号列生成部108−1において符号列信号を生成する方法を示すフローチャートである。
【0069】
このフローチャートは、実施形態1の
図2のフローチャートにおけるステップS406の代わりに、ステップS406−1の処理が行われる。
【0070】
具体的には、ステップS402において符号化対象CUの発生符号量が規定値を超過する可能性があると判断された場合に、PCMモードで係数が符号化されていることを示す識別子を符号化する(S405)。つづいて、入力された差分画像信号152を可変長符号化せずにそのまま符号列に追加する(PCMモード)ことで符号列を生成する(S406−1)。なお、上記において、差分画像信号152を可変長符号化して出力する構成にしても構わない。
【0071】
3.シンタックス
本実施の形態におけるシンタックスおよびS405で符号化する識別子は、実施形態1と同様である。
【0072】
なお、
図8のステップS402における規定値とは、差分画像(差分画像信号152の画素値)をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述すべき全ての情報を符号化する際に必要となる最大の符号量とを合わせた符号量に余裕量を加えた符号量である。例えば、画像のフォーマットが各画素8ビットのYUV4:2:0であり、符号化対象CUのサイズが32×32画素であった場合、差分画像信号152の画素値をそのまま符号列として記述する際に必要となる符号量は1536バイトとなり、これに前記ヘッダ符号列に記述すべき全ての情報を符号化する際に必要となる最大の符号量とを合わせた符号量に余裕量を加えて、前記規定値として13000ビット等の値が考えられる。
【0073】
4.パイプライン改善効果
図9を用いて本実施の形態による動画像符号化装置のパイプラインの例を示す。
【0074】
図9(a)は
図8のステップS402の判定の結果、Residualモードで係数符号列を生成した場合のパイプラインの制御を示す図である。
図14(a)で説明した従来の制御と全く同様の流れで処理が行われている。
【0075】
一方、
図9(b)は
図8のステップS402の判定の結果、PCMモードで係数符号列を生成した場合のパイプラインの制御を示す図である。本実施形態では、前述のように、第1モードにおいて、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−1を生成する。一方、第2モードにおいて、差分演算部109から出力される差分画像信号152を可変長符号化せずに得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−1を生成する。ここで、残差符号化信号153は差分画像信号152とは同一の入力画像信号151に基づくものである。そのため、ブロック1がPCMモードに切り替わった場合でも、ヘッダ符号列に記述されている予測情報の変更は不要である。しかし、復号化装置において残差符号化信号153を当該信号とセットの予測情報を用いて復号化した場合、差分画像信号152とは異なる信号が生成される。そのため、第1モードで符号化したときと、第2モードで符号化したときとで、復号化装置において最終的に得られる再構成画像信号の画素情報が異なるものとなる。このとき、ブロック1の画素情報を参照するブロック2の符号化処理は進行している。そのため、ブロック2においても、画素情報を置き換えて処理をやり直す必要がある。したがって、ブロック1の画面間/内予測の処理まで遡る必要がある。しかし、
図14(b)で説明した従来の制御と比較すると遡る処理の数が少なくなっている。
【0076】
このように、本実施の形態による動画像符号化装置は、パイプラインを遡る処理の量を従来よりも減らすことができる。そのため、処理速度の遅延もしくは処理量の増加を抑制しつつ、ブロック単位の発生符号量を特定の最大値以下に納めることが可能となる。
【0077】
また、本実施の形態では、符号化処理前の差分画像を符号化する。そのため、対応する動画像復号化装置において復号化した画像の画質を向上させることが可能となる。
【0078】
5.まとめ
本実施形態における動画像符号化装置は、入力される動画像をブロック単位で符号化する動画像符号化装置100−1であって、符号化対象画像に対応する予測画像を生成する予測符号化部105と、前記符号化対象画像と前記生成された予測画像との差分画像信号152を生成する差分演算部109と、前記差分演算部109の出力に対して直交変換処理および量子化処理を行い、残差符号化信号153を生成する予測残差符号化部102と、前記残差符号化信号153に対して逆量子化処理および逆直交変換処理を行い、残差復号化信号154を生成する予測残差復号化部103と、前記予測符号化部105で生成された予測画像と前記予測残差復号化部103で生成された残差復号化信号154とを加算することで再構成画像信号155を生成する加算演算部110と、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ情報を生成するヘッダ符号列生成部107と、第1モードにおいて、前記予測残差符号化部102で生成された残差符号化信号153を可変長符号化して係数符号列を生成し、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する一方、第2モードにおいて、前記差分演算部109で生成された差分画像信号152を可変長符号化することなく、前記差分画像信号152をそのまま係数符号列とし、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する係数符号列生成部108−1と、を備える。
【0079】
また、本実施形態における動画像符号化装置は、入力される動画像をブロック単位で符号化する動画像符号化装置100−1であって、符号化対象画像に対応する予測画像を生成する予測符号化部105と、前記符号化対象画像と前記生成された予測画像との差分画像信号152を生成する差分演算部109と、前記差分演算部109の出力に対して直交変換処理および量子化処理を行い、残差符号化信号153を生成する予測残差符号化部102と、前記残差符号化信号153に対して逆量子化処理および逆直交変換処理を行い、残差復号化信号154を生成する予測残差復号化部103と、前記予測符号化部105で生成された予測画像と前記予測残差復号化部103で生成された残差復号化信号154とを加算することで再構成画像信号155を生成する加算演算部110と、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ情報を生成するヘッダ符号列生成部107と、第1モードにおいて、前記予測残差符号化部102で生成された残差符号化信号153を可変長符号化して係数符号列を生成し、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する一方、第2モードにおいて、前記差分演算部109で生成された差分画像信号152を可変長符号化して、前記差分画像信号152をそのまま係数符号列とし、前記係数符号列に前記ヘッダ情報生成部で生成されたヘッダ情報を対応付けた状態で、前記係数符号列および前記ヘッダ情報を出力する係数符号列生成部108−1と、を備える。
【0080】
また好ましくは、前記係数符号列生成部108−1は、前記係数符号列および前記ヘッダ情報に、前記係数符号列を復号する際に逆量子化および逆直交変換をするか否かを示す識別子を対応付けた状態で、前記係数符号列、前記ヘッダ情報および前記識別子を出力する。
【0081】
また好ましくは、前記識別子は、前記第1モードにおける係数符号列および前記第2モードにおける係数符号列で共通で使用される識別子であり、当該識別子情報のうち1つは、前記第1モードにおける係数符号列として符号化したことを示すものであり、また別の1つは、前記第2モードにおける係数符号列として符号化したことを示し、かつ符号化した残差符号化信号153があるかないかを示すものである。
【0082】
(実施形態3)
実施形態3に係る動画像符号化装置について、図面を参照しながら説明する。
【0083】
1.動画像符号化装置の構成
図10は、本実施形態に係る動画像符号化装置100−2のブロック図である。動画像符号化装置100−2は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理し、符号列を生成する。
【0084】
この動画像符号化装置100−2は、実施形態1の動画像符号化装置100の係数符号列生成部108の代わりに係数符号列生成部108−2を備えている。
【0085】
以下、説明の便宜上、実施形態1と同様の構成についてはその詳細な説明を省略する。さらに、
図10では、
図1、
図7と同様の機能を有するブロックについては同じ番号を付す。
【0086】
係数符号列生成部108−2は、入力される信号に応じて2つのモードを切り換えて実行する。第1モードは、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−2を生成するモードである。第2モードは、残差復号化信号154の各係数を1/N倍(Nは自然数)した符号列を可変長符号化せずに得られる符号列を、ヘッダ符号列生成部107が生成した符号列に続けて追記することで最終的な符号列信号159−2を生成するモードである。
【0087】
2.符号列の生成方法
図11は、ヘッダ符号列生成部107および係数符号列生成部108−2において符号列信号を生成する方法を示すフローチャートである。
【0088】
このフローチャートは、実施形態1の
図2のフローチャートにおけるステップS406の代わりに、ステップS406−2の処理が行われる点のみが異なっている。
【0089】
具体的には、ステップS402において、符号化対象CUの発生符号量が規定値を超過する可能性があると判断された場合に、PCMモードで係数が符号化されていることを示す識別子を符号化する(S405)。つづいて、入力された残差復号化信号154の各係数を1/N倍して、可変長符号化せずにそのまま符号列に追加する(PCMモード)ことで符号列を生成する(S406−2)。
【0090】
3.シンタックス
本実施の形態におけるシンタックスおよびS405で符号化する識別子は、実施形態1と同様である。
【0091】
4.パイプライン改善効果
本実施の形態による動画像符号化装置のパイプラインの例は、
図9とほぼ同様で、異なる点を以下に説明する。
【0092】
図8のステップS402の判定の結果、PCMモードが選択された場合、残差復号画像を1/N倍するが、復号時にはN倍して残差復号画像を生成する必要がある。このため、±(N−1)の範囲で誤差が発生する。
【0093】
図9(b)は、
図8のステップS402の判定の結果、PCMモードで係数符号列を生成した場合のパイプライン制御を示す図である。ブロック1がPCMモードに切り替わった場合、ヘッダ符号列に記述されている予測情報は変更されない。しかし、残差復号化画像が変わる。そのため、ブロック1の画素情報を参照するブロック2の符号化処理は進行している。その結果、画素情報を置き換えて処理をやり直す必要がある。そのため、ブロック1の画面間/内予測の処理まで遡っている。しかし、
図14(b)で説明した従来の制御と比較すると遡る処理の数が少なくなっている。
【0094】
このように、本実施の形態による動画像符号化装置は、パイプラインを遡る処理の量を従来よりも減らすことができる。そのため、処理速度の遅延もしくは処理量の増加を抑制しつつ、ブロック単位の発生符号量を特定の最大値以下に納めることが可能となる。
【0095】
また、本実施の形態では、残差復号化画像を1/N倍する。そのため、ビット量を削減することが可能となる。
【0096】
Nの値を固定の値とした場合、シンタックス上に記述しなくてもよい。シンタックス上にNの値を記載する場合、ピクチャ単位で一つの値を設定するフィールドを設けて、その値を記述してもよい。
【0097】
5.まとめ
本実施形態における係数符号列生成部108−2は、前記第1モードの場合、前記残差符号化信号153を可変長符号化して第1係数符号列を生成し、前記第2モードの場合、1/N倍(Nは自然数)にした前記差分復号化画像を第2係数符号列とする。
【0098】
また本実施形態における係数符号列生成部108−2は、前記第1モードの場合、前記残差符号化信号153を可変長符号化して第1係数符号列を生成し、前記第2モードの場合、1/N倍(Nは自然数)にした前記差分画像信号152を第2係数符号列とする。
【0099】
(実施形態4)
実施形態4に係る動画像復号化装置について、図面を参照しながら説明する。
【0100】
1.動画像復号化装置の構成
図12は、実施形態4に係る動画像復号化装置200の構成を示すブロック図である。動画像復号化装置200は、実施形態2で説明した動画像符号化装置によって生成された符号列に対し、コーディングユニット(CU)と呼ばれるブロック単位で復号化処理し、出力画像を生成する。
【0101】
この動画像復号化装置200は、ヘッダ符号列解析部201と、係数符号列解析部202と、予測残差復化部203と、ピクチャメモリ204と、予測復号化部205と、量子化値決定部206とを備えている。
【0102】
ヘッダ符号列解析部201は、入力されたブロック単位の符号列信号251のヘッダ領域に対して可変長復号化を施すことによりヘッダ情報の解析を行う。ヘッダ符号列解析部201は、解析して得られる予測情報信号256を予測復号化部205へ出力する。さらに、ヘッダ符号列解析部201は、解析して得られる量子化値情報を量子化値決定部206へ出力する。
【0103】
係数符号列解析部202は、ヘッダ符号列解析部201によって解析されたヘッダ情報に続いて符号化されている係数符号列の解析を行う。このとき、係数符号列解析部202は、解析の結果、係数符号列が残差符号化信号252の場合、当該残差符号化信号252を予測残差復号化部203に出力する。一方、係数符号列解析部202は、解析の結果、係数符号列が差分画像信号259である場合、当該差分画像信号259を、予測残差復号化部203をバイパスして加算器207に出力する。つまり、係数符号列が差分画像信号259である場合、予測残差復号化部203による残差復号化信号253の生成処理は行わない。なお、係数符号列が可変長符号化されている場合、係数符号列解析部は係数符号列を可変長復号化した後、残差符号化信号252または差分画像信号259として出力する。一方、可変長符号化されていない場合、係数符号列解析部は係数符号列を可変長復号化することなく、残差符号化信号252または差分画像信号259として出力する。
【0104】
予測残差復号化部203は、係数符号列解析部202から入力された残差符号化信号252に対して、逆量子化および逆直交変換することで残差復号化信号253を生成する。そして、予測残差復号化部203は、生成した残差復号化信号253を加算演算部207に出力する。このとき、予測残差復号化部203は、量子化値決定部206において決定された量子化値信号257を用いることで逆量子化を制御する。
【0105】
予測復号化部205は、ヘッダ符号列解析部201から出力された予測情報信号256を基に、画面内予測、または画面間予測を用いて予測画像信号254を生成する。そして、予測復号化部205は、生成した予測画像信号254を加算演算部207に出力する。なお、予測復号化部205は、画面間予測を用いる際、ピクチャメモリ204に蓄積されている既に復号化済みの過去のピクチャの再構成画像信号255を用いる。また、予測復号化部205は、画面内予測を用いる際、復号化対象CUに隣接する既に復号化済みのCUの現在のピクチャの再構成画像信号255を用いる。画面内予測を用いるか画面間予測を用いるかの判定については、入力される予測情報信号256に従って行われる。
【0106】
加算演算部207では、予測残差復号化部203から出力された残差復号化信号253もしくは係数符号列解析部202から出力された差分画像信号259に、予測復号化部205から出力された予測画像信号254を加算することによって再構成画像信号255を生成する。生成された再構成画像信号255はピクチャメモリ204に格納され、最終的にピクチャ単位の出力画像信号258として表示装置に出力される。
【0107】
2.符号列の解析方法
ヘッダ符号列解析部201および係数符号列解析部202において符号列の解析を行う方法について、
図13のフローチャートを用いて具体的に説明する。
【0108】
まず、ヘッダ符号列解析部201は、入力された符号列のヘッダ領域に対して可変長復号化を施すことによりヘッダ情報の解析を行い、生成された予測情報信号256、量子化値情報、その他の復号化制御情報を
図12の各処理ブロックへ出力する(S1201)。
【0109】
次に、係数符号列解析部202は、ステップS1202において識別子の解析を行い、つづいてステップS1203において、解析された識別子が、PCMモードで係数が符号化されていることを示しているか、もしくはResidualモードで係数が符号化されていることを示しているかの判定を行う。
【0110】
ステップS1203において、Residualモードで係数が符号化されていると判定された場合は、従来と同様に入力された係数符号列に対して可変長復号化を施すことによって残差符号化信号252を取得し、予測残差復号化部203に出力する(S1204)。
【0111】
一方、ステップS1203において、PCMモードで係数が符号化されていると判定された場合は、入力された係数符号列に対して可変長復号化を施すことなく、そのまま差分画像信号259として、予測残差復号化部203から出力される残差復号化信号253に置き換えて以降の処理を行う(S1205)。
【0112】
なお、ここでは実施の形態2で説明した動画像符号化装置100−1で生成された符号列に対しての処理方法を説明したが、実施の形態1で説明した動画像符号化装置100で生成された符号列に対しても全く同様の処理方法で復号化することが可能である。その際に、ステップS1205で取得される情報は、対応する符号化装置における残差復号化後の残差復号化信号252に置き換わるが、復号化処理としては区別することなく処理を行うことが可能である。
【0113】
また、実施の形態3で説明した動画像符号化装置100−2で生成された符号列に対しては、ステップS1205で係数符号列解析部202において残差復号化信号252の各係数をN倍したものを残差復号化信号252として出力する部分が異なるのみで、その他の処理は全く同様の処理方法で復号化することが可能である。
【0114】
3.シンタックス
本実施の形態において復号化処理を行う符号列のシンタックスおよびS1202で解析する識別子は、実施形態1と同様である。
【0115】
4.パイプライン改善効果
本実施の形態による動画像復号化装置を用いることにより、これに対応する符号列を生成する動画像符号化装置は、実施の形態1で説明したような構成をとることが可能となり、
図6(b)のようにパイプラインを遡ることなくPCMモードに切替えて符号化を行うことができる。そのため、処理速度の遅延もしくは処理量を増加させることなく、ブロック単位の発生符号量を特定の最大値以下に納めることが可能となる。
【0116】
また同様に、本実施の形態による動画像復号化装置を用いることにより、これに対応する符号列を生成する動画像符号化装置は、実施の形態2あるいは実施の形態3で説明したような構成をとることが可能となり、
図9(b)のようにパイプラインを遡る処理の量を従来よりも減らすことができる。そのため、処理速度の遅延もしくは処理量の増加を抑制しつつ、ブロック単位の発生符号量を特定の最大値以下に納めることができ、さらに復号化した画像の画質を向上させることが可能となる。
【0117】
5.まとめ
本実施形態における動画像復号化装置200は、復号化対象符号列をブロック単位で復号化する動画像復号化装置200であって、符号化された残差係数に基づく情報およびそれに対応付けられたヘッダ情報を含む第1の復号化対象符号列または前記復号化対象符号列の符号化処理過程で得られる残差画像およびそれに対応付けられたヘッダ情報を含む第2の復号化対象符号列を前記復号化対象符号列として受け付けるヘッダ符号列解析部201と、前記ヘッダ情報から少なくとも、前記復号化対象符号列を生成した際に利用された予測画像に関する情報である前記予測情報を取得するヘッダ符号列解析部201と、前記ヘッダ符号列解析部201が受け付けた復号化対象符号列を可変長復号化し残差係数を出力する係数符号列解析部202と、前記係数符号列解析部202が出力する残差係数に対して、逆量子化および逆直交変換を行い、残差復号化画像を生成する予測残差復号化部203と、前記ヘッダ符号列解析部201で取得された前記予測情報に基づいて、前記復号化対象符号列に対応する予測画像を生成する予測復号化部205と、前記ヘッダ符号列解析部201で受け付けた復号化対象符号列が前記第1の復号化対象符号列である場合、前記予測残差復号化部203で生成された前記残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する一方、前記ヘッダ符号列解析部201で受け付けた復号化対象符号列が前記第2の復号化対象符号列である場合、前記第2の復号化対象符号列に含まれる残差画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する加算演算部207と、を備える。
【0118】
また、本実施形態における動画像復号化装置200は、復号化対象符号列をブロック単位で復号化する動画像復号化装置200であって、符号化された残差係数に基づく情報およびそれに対応付けられたヘッダ情報を含む第1の復号化対象符号列または前記復号化対象符号列の符号化処理過程において得られる残差係数をローカルデコードした残差復号化画像およびそれに対応付けられたヘッダ情報を含む第2の復号化対象符号列を復号化対象符号列として受け付けるヘッダ符号列解析部201と、前記ヘッダ情報から少なくとも、前記復号化対象符号列を生成した際に利用された予測画像に関する情報である前記予測情報を取得するヘッダ符号列解析部201と、前記ヘッダ符号列解析部201が受け付けた復号化対象符号列を可変長復号化し残差係数を出力する係数符号列解析部202と、前記係数符号列解析部202が出力する残差係数に対して、逆量子化および逆直交変換を行い、残差復号化画像を生成する予測残差復号化部203と、前記ヘッダ符号列解析部201で取得された前記予測情報に基づいて、前記復号化対象符号列に対応する予測画像を生成する予測復号化部205と、前記ヘッダ符号列解析部201で受け付けた復号化対象符号列が前記第1の復号化対象符号列である場合、前記予測残差復号化部203で生成された前記残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する一方、前記ヘッダ符号列解析部201で受け付けた復号化対象符号列が前記第2の復号化対象符号列である場合、前記第2の復号化対象符号列に含まれる残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する加算演算部207と、を備える。
【0119】
また好ましくは、前記復号化対象符号列は、前記復号化対象符号列の符号化処理過程で得られる残差画像が前記復号化対象符号列に含まれているか否かを示す識別子を含み、前記加算演算部207は、前記識別子が前記復号化対象符号列に前記復号化対象符号列の符号化処理過程で得られる残差画像が含まれないことを示す場合、前記予測残差復号化部203で生成された前記残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力し、前記識別子が前記復号化対象符号列に前記復号化対象符号列の符号化処理過程で得られる残差画像が含まることを示す場合、前記第2の復号化対象符号列に含まれる残差画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する。
【0120】
また好ましくは、前記復号化対象符号列は、前記復号化対象符号列の符号化処理過程において得られる残差係数をローカルデコードした残差復号化画像が前記復号化対象符号列に含まれているか否かを示す識別子を含み、前記加算演算部207は、前記識別子が前記復号化対象符号列に前記復号化対象符号列の符号化処理過程において得られる残差係数をローカルデコードした残差復号化画像が含まれないことを示す場合、前記予測残差復号化部203で生成された前記残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力し、前記識別子が前記復号化対象符号列に前記復号化対象符号列の符号化処理過程において得られる残差係数をローカルデコードした残差復号化画像が含まることを示す場合、前記第2の復号化対象符号列に含まれる残差復号化画像と前記予測復号化部205で生成された前記予測画像とを加算することにより、再構成画像を生成して出力する。
【0121】
また好ましくは、前記ヘッダ符号列解析部201が前記第2の復号化対象符号列を受け付けた場合、前記予測残差復号化部203は前記係数符号列に対して逆量子化および逆直交変換しない。
【0122】
(その他の実施形態)
上記各実施形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録することにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体は、フレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであればよい。
【0123】
また、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。LSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
【0124】
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
【0125】
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
【0126】
また、本発明は、上述した動画像符号化装置および動画像復号化装置を含む、放送局から放送される放送波を圧縮し、記録を行うDVDレコーダー、BDレコーダー等の放送波記録装置に適用しても構わない。
【0127】
また、上記実施の形態に係る、動画像符号化装置および動画像復号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。