(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下、この発明をより詳細に説明するため、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1を用いて、本発明の実施の形態1の符号化装置(復号装置)の特徴となる部分について説明する。同図では、符号化時の動きベクトル探索を、フレーム水平サイズをw、分割領域の垂直方向ライン数をhとした w*h の領域を所定の画面分割単位として実行する例を示す。w*hの領域が有意な画像データとして参照画像をアクセスできる領域(以下、有意参照画像領域)であるとする。この際、予測画像の良さを最大限にするように動きベクトル探索を行うことを考えると、理想的には同図(a)のように、予測画像の一部が有意参照画像領域の外部を指す場合も許容することが望ましい。しかし、このような有意参照画像領域外のデータは、動きベクトル探索を行う回路にとっては存在しないため、実際には、同図(b)のように、動きベクトル探索の範囲を強制的に狭めて、有意参照画像領域にアクセスを完結させるような動きベクトルを見つける必要がある。
【0010】
一方、復号装置側では、同図(c)のように、負荷の高い動きベクトル探索処理を実行しないため、画面分割を行って並列処理を行う必要性は低い。こうした場合には、有意予測画像領域自体が分割されないため、(a),(b)のいずれの動きベクトルであっても、予測画像ブロック内の画素すべてを有意な参照画像データから生成することができる。つまり、復号装置側では理想的な動きベクトルを受信しても問題なく予測画像が生成できるにも関わらず、符号化側で理想的な動きベクトルを探索できない、という問題が生じる。
以下に実施の形態1における画像符号化装置および画像復号装置について説明する。
【0011】
本実施の形態1では、映像の各フレーム画像を入力として、近接フレーム間で動き補償予測を行い、得られた予測差分信号に対して直交変換・量子化による圧縮処理を施した後、可変長符号化を行ってビットストリームを生成する画像符号化装置と、当該画像符号化装置が出力するビットストリームを復号する画像復号装置について説明する。
【0012】
本実施の形態1の画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズの領域に分割してフレーム内・フレーム間適応符号化を行うことを特徴とする。一般に映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を持つ。空間的に見ると、ある特定の映像フレーム上では、空や壁などのような比較的広い画像領域中で均一な信号特性を持つ絵柄もあれば、人物や細かいテクスチャを持った絵画など小さい画像領域内で複雑なテクスチャパターンを持つ絵柄も混在することがある。時間的に見ても、空や壁は局所的に時間方向の絵柄の変化は小さいが、動く人物や物体はその輪郭が時間的に剛体・非剛体の運動をするため、時間的な変化が大きい。符号化処理は、時間・空間的な予測によって信号電力やエントロピーの小さい予測差分差信号を生成して全体の符号量を削減する処理を行うが、予測のためのパラメータをできるだけ大きな画像信号領域に均一に適用できれば、当該パラメータの符号量を小さくすることができる。一方、時間的・空間的に変化の大きい画像信号パターンに対しては、同一の予測パラメータを大きな画像領域に適用することで予測の誤りが増え、予測差分信号の符号量が削減できない。そこで、そういった領域では、予測対象の領域を小さくし、予測のためのパラメータのデータ量を増やしても予測差分信号の電力・エントロピーを低減するほうが望ましい。このような映像信号の一般的な性質に適応した符号化を行うため、本実施の形態1の符号化装置は、所定の最大ブロックサイズからはじめて階層的に映像信号の領域分割を行い、分割された領域ごとに予測、およびその予測差分の符号化処理を適応化させる構成をとる。
【0013】
本実施の形態1の画像符号化装置が処理対象とする映像信号フォーマットは、輝度信号と2つの色差信号からなるYUV信号や、ディジタル撮像素子から出力されるRGB信号等の任意の色空間のカラー映像信号のほか、モノクロ画像信号や赤外線画像信号など、映像フレームが水平・垂直2次元のディジタルサンプル(画素)列から構成される任意の映像信号とする。各画素の階調は8ビットでもよいし、10ビット、12ビットなどの諧調であってもよい。ただし、以下の説明においては、特に断らない限り、入力映像信号はYUV信号とし、かつ2つの色差成分U,Vが輝度成分Yに対してサブサンプルされた4:2:0フォーマットの信号を扱う場合について述べるが、本発明はU,Vのサンプリング間隔が異なる他フォーマットにも適用できる(例えば4:2:2フォーマットや4:4:4フォーマットなど)。また、映像の各フレームに対応する処理データ単位を「ピクチャ」と呼ぶ。本実施の形態1においては、「ピクチャ」は順次走査(プログレッシブスキャン)された映像フレーム信号、として以下の説明を行うが、映像信号がインタレース信号である場合、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号であってもよい。
【0014】
図2は、この発明の実施の形態1に係る画像符号化装置の構成を示すブロック図である。
また、
図3に
図2の画像符号化装置のピクチャレベルの処理フローを示す。以下、これらの図を用いて、本実施の形態1の画像符号化装置の動作を説明する。
図2に示す画像符号化装置は、まず、符号化制御部3において、符号化対象となるピクチャ(カレントピクチャ)の符号化に用いる最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限を決定する(
図3のステップS1)。最大符号化ブロックのサイズの決め方としては、例えば入力映像信号1の解像度に応じてすべてのピクチャに対して同じサイズに定めてもよいし、入力映像信号1の局所的な動きの複雑さの違いをパラメータとして定量化して、動きの激しいピクチャでは小さいサイズ、動きが少ないピクチャでは大きいサイズ、のように定めてもよい。分割階層数上限は例えば入力映像信号1の動きが激しい場合は階層数を深くしてより細かい動きが検出できるように設定し、動きが少ない場合は階層数を抑えるように設定するなどの方法がある。
【0015】
次いで、ブロック分割部2において、ピクチャを上記定めた最大符号化ブロックサイズで分割する。符号化制御部3は、最大符号化ブロックサイズの画像領域ごとに、上記定めた分割階層数上限に至るまで、階層的に符号化ブロックサイズ4と各符号化ブロックに対する符号化モード7を決定する。そして、ブロック分割部2は、符号化ブロックサイズ4にしたがってさらにブロックを分割し符号化ブロック5を出力する(
図3のステップS2)。
【0016】
図4に、最大符号化ブロックが階層的に複数の符号化ブロック5へ分割される様子の例を示す。最大符号化ブロックは、
図4において「第0階層」と記された輝度成分で(L
0, M
0)のサイズをもつ符号化ブロック、として定義する。最大符号化ブロックを出発点として、4分木構造で、別途定める所定の深さまで階層的に分割を行うことによって符号化ブロック5を得る。深さnにおいては、符号化ブロック5はサイズ(L
n, M
n)の画像領域である。L
nはM
nと同じであってもよいし異なっていてもよいが、
図4ではL
n = M
nのケースを示す。
以降、符号化ブロックサイズ4は、符号化ブロック5の輝度成分におけるサイズ(L
n, M
n)と定義する。4分木分割を行うため、常に(L
n+1, M
n+1) = (L
n/2, M
n/2)が成り立つ。なお、RGB信号など、すべての色成分が同一サンプル数をもつカラー映像信号(4:4:4フォーマット)では、すべての色成分のサイズが(L
n, M
n)になるが、4:2:0フォーマットを扱う場合、対応する色差成分の符号化ブロックサイズは(L
n/2, M
n/2)である。以降、第n階層の符号化ブロック5をB
nとし、B
nで選択しうる符号化モード7をm(B
n)と記す。複数の色成分からなるカラー映像信号の場合、符号化モードm(B
n)7は各色成分ごとにそれぞれ個別のモードを用いるように構成されてもよいが、以降、特に断らない限り、YUV信号、4:2:0フォーマットの符号化ブロックの輝度成分に対する符号化モードのことを指すものとして説明を行うが、本発明は任意の映像フォーマット、色成分、符号化モードに適用できる。
【0017】
符号化モードm(B
n)7には、1つないし複数のイントラ符号化モード(総称してINTRAと呼ぶ)、1つないし複数のインター符号化モード(総称してINTERと呼ぶ)があり、符号化制御部3は、後述する選択方法に基づいて、当該ピクチャで利用可能な全てのモードないしそのサブセットの中から、符号化ブロックB
n5に対して最も符号化効率のよい符号化モードを選択する。
【0018】
なお、
図4に示すように、B
nはさらに1つないし複数の予測処理単位(パーティション)に分割される。B
nに属するパーティションを以降、P
in(i: 第n階層におけるパーティション番号)と表記する。B
nのパーティション分割がどのようになされているかは符号化モードm(B
n)7の中に情報として含まれる。パーティションP
inはすべて符号化モードm(B
n)7に従って予測処理が行われるが、パーティションごとに個別の予測パラメータを選択できる。
【0019】
符号化制御部3は、最大符号化ブロックに対して、例えば
図5に示すようなブロック分割状態を生成して、符号化ブロック5を特定する。同図(a)の網がけ部分は分割後のパーティションの分布を、また、(b)には階層分割によって符号化モードm(B
n)7が割り当てられる状況を4分木グラフで図示する。(b)の□で囲んだノードが、符号化モード7が割り当てられたノード、すなわち符号化ブロック5である。符号化制御部3におけるこのような階層分割・符号化モード判定の詳細な処理は後述する。
【0020】
符号化ブロック5においてイントラ符号化モードが選択された場合(m(B
n)∈INTRAの場合)は(
図3のステップS3でYes)、
図2のイントラ予測部8において、イントラ予測パラメータ10に基づいて、B
n内の各パーティションP
inに対するイントラ予測処理が行われ、生成されるイントラ予測画像11が減算部12へ出力される(
図3のステップS4)。イントラ予測画像11の生成に用いられたイントラ予測パラメータ10は、復号装置側でまったく同じイントラ予測画像11を生成するために、可変長符号化部23によってビットストリーム30に多重化される。本実施の形態1におけるイントラ予測処理は、AVC/H.264規格(ISO/IEC 14496-10)に定められるアルゴリズムに限定されないが、イントラ予測パラメータとしては、符号化装置側と復号装置側でまったく同じイントラ予測画像を生成するために必要な情報を含む必要がある。
【0021】
符号化ブロック5においてインター符号化モードが選択された場合(m(B
n)∈INTERの場合)は(
図3のステップS3でNo)、
図2の動き補償予測部9において、インター予測パラメータ16に基づいて、各パーティションP
inに対するフレーム間動き予測処理が行われ、生成されるインター予測画像17が減算部12へ出力されるとともに動きベクトル31が可変長符号化部23に出力される(
図3のステップS5)。インター予測画像17の生成に用いられたインター予測パラメータ16は、復号装置側でまったく同じインター予測画像17を生成するために、可変長符号化部23によってビットストリーム30に多重化される。
インター予測画像の生成に用いられたインター予測パラメータには、
・符号化ブロックB
n内のパーティション分割を記述するモード情報
・各パーティションの動きベクトル
・動き補償予測フレームメモリ14内に複数の参照画像を含む構成の場合、いずれの参照画像を用いて予測を行うかを示す参照画像指示インデックス情報
・複数の動きベクトル予測値候補がある場合にいずれの動きベクトル予測値を選択して使用するかを示すインデックス情報
・複数の動き補償内挿フィルタがある場合にいずれのフィルタを選択して使用するかを示すインデックス情報
・当該パーティションの動きベクトルが複数の画素精度(半画素、1/4画素、1/8画素など)を示すことが可能な場合、いずれの画素精度を使用するかを示す選択情報
などの情報を含み、復号装置側でまったく同じインター予測画像を生成するために、可変長符号化部23によってビットストリームに多重化される。動き補償予測部9の詳細な処理内容は後述する。
【0022】
減算部12は、イントラ予測画像11、またはインター予測画像17のいずれか一方をパーティションP
inから差し引いて、予測差分信号e
in13を得る(
図3のステップS6)。変換・量子化部19は、予測差分信号e
in13に対して、符号化制御部3から指示される予測差分符号化パラメータ20に基づいて、DCT(離散コサイン変換)やあらかじめ特定の学習系列に対して基底設計がなされたKL変換等の直交変換処理を実施して変換係数を算出すると共に、その変換係数を、符号化制御部3から指示される予測差分符号化パラメータ20に基づいて量子化し(
図3のステップS7)、量子化後の変換係数である圧縮データ21を逆量子化・逆変換部22(
図3のステップS8で逆量子化・逆変換処理部)および可変長符号化部23(
図3のステップS8で可変長符号化部)へ出力する。
【0023】
逆量子化・逆変換部22は、変換・量子化部19から入力された圧縮データ21を、符号化制御部3から指示される予測差分符号化パラメータ20に基づいて逆量子化し、さらに逆DCT、逆KL変換等の逆変換処理を実施することで予測差分信号e
in13の局所復号予測差分信号e
in'24を生成し、加算部25へ出力する(
図2のステップS9)。
【0024】
予測差分符号化パラメータ20は、符号化ブロック5の領域ごとに、その内部の予測差分信号e
in13の符号化に用いる量子化パラメータ、変換ブロックサイズの情報を含む。予測差分符号化パラメータ20は、符号化制御部3において、
図3のステップS2の符号化モード判定の一環として決定される。量子化パラメータは、最大符号ブロックの単位でひとつ割り当て、それらを分割した符号化ブロック単位で共通に使用する形式でもよいし、各符号化ブロックごとに最大符号化ブロックの値からの差分値として表現するようにしてもよい。変換ブロックサイズ情報は、符号化ブロック5を起点として最大符号化ブロックの分割と同様、四分木分割表現がされていてもよいし、いくつかの選択可能な変換ブロックサイズがインデックス情報として表現された形式でもよい。変換・量子化部19、逆量子化・逆変換部22は、この変換ブロックサイズの情報に基づいて変換・量子化処理のブロックサイズを特定して処理を行う。なお、この変換ブロックサイズの情報は、符号化ブロック5ではなく、符号化ブロック5を分割するパーティションP
inを単位として決定するように構成されていてもよい。
【0025】
加算部25は、局所復号予測差分信号e
in'24と、イントラ予測画像11またはインター予測画像17とを加算して局所復号パーティション画像P
in'ないしその集まりとしての局所復号符号化ブロック画像B
n' (以下、局所復号画像)26を生成し(
図3のステップS10)、この局所復号画像26をループフィルタ部27へ出力すると共に(
図3のステップS11でループフィルタ部)、イントラ予測用メモリ28に格納する(
図3のステップS11でイントラ予測用メモリ)。局所復号画像26が以降のイントラ予測用の画像信号となる。
出力先がイントラ予測用メモリの場合、続いて、ピクチャ中の全ての符号化ブロックを処理したかどうかを判定し、全符号化ブロックの処理が終了していなければ次の符号化ブロックへ以降して同様の符号化処理を繰り返す(
図3のステップS12)。
【0026】
加算部25の出力先がループフィルタ部27の場合、ループフィルタ部27は、加算部25から出力された局所復号画像26に対し、所定のフィルタリング処理を行い、フィルタリング処理後の局所復号画像29を動き補償予測フレームメモリ14に格納する(
図3のステップS13)。このフィルタリング処理後の局所復号画像29が動き補償予測用の参照画像15となる。ループフィルタ部27によるフィルタリング処理は、入力される局所復号画像信号26の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する局所復号画像信号26が入力された後に1画面分まとめて行ってもよい。
【0027】
可変長符号化部23は、変換・量子化部19から出力された圧縮データ21と、符号化制御部3から出力される(最大符号化ブロックの分割状態を含む)符号化モード7と、イントラ予測パラメータ10ないしインター予測パラメータ16、予測差分符号化パラメータ20とをエントロピー符号化して、それらの符号化結果を示すビットストリーム30を生成する(
図3のステップS14)。
【0028】
以下、本発明のポイントとなる動き補償予測部9について述べる。本実施の形態1では、
図6に示すように、ピクチャを格子状に矩形領域分割し(以下、各分割単位をタイルと呼ぶ)、タイルごとに独立に動き補償予測を行う構成をとる。タイルの水平・垂直方向のサイズは最大符号化ブロックのサイズの倍数とする。タイルの分割状態は符号化装置側で固定的・一意に定めるようにしてもよいし(この場合、復号装置ではタイルという構造は意識せずに復号処理を行う)、動き補償予測以外の処理に対しても独立の処理が行えることを想定し、各タイルの左上隅位置やサイズをそれぞれ自由に決定できるように、復号装置側にビットストリームを介して伝達する仕組みを備えるようにしてもよい。なお、タイルは、従来のAVC/H.264等で用いられているスライスであってもかまわない。動き補償予測部9は、タイル内の各符号化ブロック5に対して処理を実行する。これにより、ピクチャ内を画面分割して動き補償予測の処理を並列に実行することができるため、入力映像信号が高解像度映像であっても高速に符号化処理を行うことができる。
【0029】
図7に動き補償予測部9の構成を示す。まず、動き情報生成部100は、参照画像15を参照して動きベクトル探索を行ったり、動き情報メモリ101に保持される複数の符号化済ブロックの動き情報102を参照するなどして、符号化ブロック5内の各パーティションP
inに関する動き情報103を生成し、インター予測画像生成部104に出力する。この際、動き情報生成部100は、動き補償予測に用いることのできる参照画像15上の領域(以下、有意参照画像領域)を、所定の領域(例えばカレントのタイル領域)に限定するか否かを示す参照画像制限フラグ105の値に基づいて、動き情報の生成を行う。
【0030】
図8、9にこの様子を示す。参照画像制限フラグ105がONすなわち「有意参照画像領域をカレントのタイル領域とする」場合(
図8)、カレントパーティションを動きベクトルで動かした場合に、移動させた位置のパーティション内の画素の一部が有意参照画像領域の外部に位置する場合、有意参照画像領域の端点に位置する画素を所定の方法で拡張して仮想的に予測画像となる画素を生成する処置を行う。拡張の方法には、端点画素を繰り返す方法や、端点画素を中心にミラーリングを行って有意参照画像領域内の画素を補填する方法などがある。このようにすることで、参照ピクチャのメモリはタイルのサイズ分に制限することができるため、使用メモリを削減できる利点がある。使用するメモリを制限しても、所定の方法で画素を拡張することでタイル外も参照可能となるため、
図1のように動きベクトル探索の範囲を強制的に狭める必要がなく、符号化効率の改善に寄与する。
【0031】
一方、参照画像制限フラグ105がOFFすなわち「有意参照画像領域に制限が無い」場合(
図9)は、動き情報生成部100によって生成される動きベクトルは、カレントパーティションを動きベクトルで動かした場合に、移動させた位置のパーティション内の全ての画素が有意参照画像領域(ピクチャ)内に存在するように決定される。使用可能なメモリに制限がない場合(参照画像分のメモリを確保できる場合)は、参照画像内すべての画素を参照可能であるため、符号化効率を向上できるという利点がある。また、参照画像制限フラグ105がOFFで、符号化装置の構成上、使用できるメモリに制限がある場合は動きベクトル探索はタイル内の画素のみを参照するように探索範囲を定めればよいし(
図1(b)の場合)、複数の符号化済みブロックの動き情報を参照して動き情報を生成する場合は、符号化済みブロックの動き情報のうちタイル外を参照する動きベクトルがあればそれを除外したり、補正したりするように構成すればよい。有意参照画像領域の端点での画素拡張を行わないことで、処理量を抑制することが可能であるため、画素拡張を行っても予測性能が向上しないような場合は参照画像制限フラグ105をOFFに設定するなどの制御を行うことも可能である。
【0032】
インター予測画像生成部104は入力された動き情報103と、参照画像15、参照画像制限フラグ105とに基づいて、インター予測画像17を生成し出力する。参照画像制限フラグ105がONの場合は、動きベクトル(動き情報103)によって移動させた位置のパーティション領域について、タイル内に属する画素はタイル内の参照画像データで、タイル外に属する画素は、動き情報生成部100で用いた方法と同一の手順で仮想的に参照画像データを生成してインター予測画像17を得る。一方、参照画像制限フラグ105がOFFの場合はピクチャ全体で予測を行うものと解釈する。参照画像制限フラグ105は可変長符号化部23に入力され、シーケンス単位等の上位シンタックスパラメータとしてエントロピー符号化されビットストリーム30に多重される。なお、後述するようにインター予測画像生成部104で生成されるインター予測画像17は復号装置側で得られるインター予測画像72と等価なデータである必要がある。
【0033】
以上の構成を有する動き補償予測部9により、動き情報生成処理をタイル単位で独立に動作させる場合でも、動きベクトル探索ないし符号化済みブロックの動きベクトルから予測・生成して得られた動きベクトルを最適に生成し、それにより生成される予測画像が常に復号装置側で得られる予測画像と一致するようにできる効果がある。
【0034】
次に本実施の形態の画像符号化装置が出力するビットストリーム30を復号する画像復号装置について説明する。
図10は、この発明の実施の形態1に係る画像復号装置の構成を示すブロック図である。また、
図11に
図10の画像復号装置のピクチャレベルの処理フローを示す。以下、これらの図を用いて、本実施の形態1の画像復号装置の動作を説明する。
【0035】
可変長復号部61は、本実施の形態1に係る画像復号装置がビットストリーム30を受け取ると、そのビットストリーム30を可変長復号処理して(
図11のステップS21)、1フレーム以上のピクチャから構成されるシーケンス単位あるいはピクチャ単位にフレームサイズを復号する。本実施の形態1に係る画像符号化装置で決定された最大符号化ブロックサイズおよび分割階層数上限を符号化装置と同様の手順で決定する(
図11のステップS22)。例えば最大符号化ブロックサイズが入力映像信号の解像度に応じて決められた場合には、復号したフレームサイズに基づいて、符号化装置と同様の手順で最大符号化ブロックサイズを決定する。最大符号化ブロックサイズおよび分割階層数上限が符号化装置側でビットストリーム30に多重化された場合には、ビットストリーム30から復号した値を用いる。本実施の形態1に係る画像符号化装置は、
図4で示されるように最大符号化ブロックを出発点に階層的に複数の符号化ブロックへ分割して得られる符号化ブロック単位に符号化モードや変換・量子化して得られる圧縮データをビットストリーム30に多重化する。
当該ビットストリーム30を受け取った可変長復号部61は、決定された最大符号化ブロック単位に符号化モードに含まれる最大符号化ブロックの分割状態を復号する。復号された分割状態に基づき、階層的に符号化ブロックを特定する(
図11のステップS23)。
【0036】
次に特定された符号化ブロックに割り当てられた符号化モード62を復号する。復号した符号化モード62に含まれる情報に基づき、符号化ブロックをさらに1つないし複数の予測処理単位(パーティション)に分割した単位で予測パラメータ63を復号する(
図11のステップS24)。
【0037】
符号化ブロックに割り当てられた符号化モード62がイントラ符号化モードの場合、符号化ブロックに含まれ、予測処理単位となる1つ以上のパーティションごとにイントラ予測パラメータ63aを復号する。イントラ予測パラメータ63aの復号は、符号化装置側と同じ手順で周辺の復号済みパーティションのイントラ予測パラメータ63aに基づき、復号対象であるパーティションP
inのイントラ予測パラメータ63aの予測値を算出し、算出した予測値を用いて復号する。
【0038】
符号化ブロックに割り当てられた符号化モード62がインター符号化モードの場合、符号化ブロックに含まれ、予測処理単位となる1つ以上パーティションごとにインター予測パラメータ63bを復号する。
【0039】
予測処理単位となるパーティションはさらに予測差分符号化パラメータ65に含まれる変換ブロックサイズ情報(図示せず)に基づき、変換処理単位となる1つないし複数のパーティションに分割され、変換処理単位となるパーティションごとに圧縮データ(変換・量子化後の変換係数)を復号する(
図11のステップS24)。
【0040】
可変長復号部61の出力先が切替スイッチの場合で(
図11のステップS25で切替スイッチ)、符号化ブロックに割り当てられた符号化モード62がイントラ符号化モードの場合(
図11のステップS26でYes)イントラ予測部69では、復号したイントラ予測パラメータ63aに基づき、符号化ブロック内の各パーティションに対するイントラ予測処理が行われ(
図11のステップS27)、生成されるイントラ予測画像71が加算部73へ出力される。イントラ予測パラメータ63aに基づくイントラ予測処理は、符号化装置側のイントラ予測部8における処理と同じである。
【0041】
符号化ブロックに割り当てられた符号化モード62がインター符号化モードの場合(
図11のステップS26でNo)、動き補償部70では、復号したインター予測パラメータ63b(動きベクトルを含む)に基づき、符号化ブロック内の各パーティションに対するフレーム間動き予測処理が行われ(
図11のステップS28)、生成されるインター予測画像72が加算部73へ出力される。
【0042】
一方、可変長復号部61の出力先が逆量子化・逆変換部66である場合(
図11のステップS25で逆量子化・逆変換部)、逆量子化・逆変換部66は、可変長復号部61から変換処理単位ごとに入力される圧縮データ64を、予測差分符号化パラメータ65に含まれる量子化パラメータに基づいて逆量子化し、さらに逆DCT,逆KL変換等の逆変換処理を実施することで復号予測差分信号67を生成し(
図11のステップS29)、加算部73へ出力する。
【0043】
加算部73は、復号予測差分信号67とイントラ予測画像71またはインター予測画像72とを加算して復号パーティション画像を生成し(
図11のステップS30)、符号化ブロック内に含まれる1つないし複数の復号パーティションの集まりとして、復号パーティション画像74をループフィルタ部78へ出力するとともにイントラ予測用メモリ77に格納する。復号パーティション画像74が以降のイントラ予測用の画像信号となる。
【0044】
ループフィルタ部78は、全符号化ブロックの処理後(
図11のステップS31でYes)符号化装置側のループフィルタ部27と同じフィルタリング処理を行い(
図11のステップS32)、フィルタリング処理後の復号画像79を動き補償予測フレームメモリ75に格納する。この復号画像79がその後の動き補償処理用の参照画像76となるとともに再生画像となる。
【0045】
以下、本発明の特徴である動き補償部70について説明する。動き補償部70の内部構成を
図12に示す。まず、動き情報生成部200が、可変長復号部61から与えられるインター予測パラメータ63bと、動き情報メモリ201に保持される複数の符号化済ブロックの動き情報202を参照するなどして、動きベクトルを含む各パーティションP
inに関する動き情報203を生成し、インター予測画像生成部204に入力する。インター予測画像生成部204は入力された動き情報203と、動き補償予測用の参照画像76、可変長復号部61においてビットストリーム30から復号された参照画像制限フラグ105とに基づいて、インター予測画像72を生成し出力する。参照画像制限フラグ105がONの場合は、動きベクトルによって移動させた位置のパーティション領域について、タイル内に属する画素はタイル内の参照画像データで、タイル外に属する画素は、動き情報生成部100で用いた方法と同一の手順で仮想的に参照画像データを生成して予測画像を得る。
一方、参照画像制限フラグ105がOFFの場合は、参照画像の使用範囲に特に制限はなく、動き情報生成部100で用いた方法と同一の手順で参照画像から予測画像を得る。なお、前述したようにインター予測画像生成部204で生成されるインター予測画像72は、符号化装置側で得られるインター予測画像17と等価なデータである必要があるが、参照画像制限フラグ105を導入することによって、符号化装置で動きベクトル探索処理がタイルなどの単位で並列処理されていても、符号化・復号時の予測画像のミスマッチを回避することができ、安定かつ高能率な符号化を行うことができる。
【0046】
また、本実施の形態1では、参照画像制限フラグ105がONのときにタイル外の画素を仮想的に拡張して生成するように構成したが、
図13のように、タイル外の参照可能エリアをカスタマイズできるように構成してもよい。
図13は、有意参照画像領域を拡張した場合の、参照画像制限フラグ105がONのケースの動作を示す。有意参照画像領域範囲を指定するパラメータdx,dyはプロファイル・レベルなどであらかじめ固定の値として決めておいてもよいし、シーケンスヘッダやピクチャヘッダなど上位ヘッダの一部としてビットストリームに多重してもよい。上位ヘッダで規定されるものとすることで、装置の性能に応じて参照エリアを決められるようになるため、性能と実装負荷のバランスをとることが可能となる。この場合であっても、有意参照画像領域外を参照する場合は、
図8等で説明したように、仮想的に画素を拡張して予測画像を生成することが可能である。
【0047】
なお、上記複数の符号化済みブロックから動き情報を生成する場合の例として、
図14に示すように、動き情報メモリ101ないし201に保持される、符号化済みの周囲のブロック、参照画像上で空間的に同じ位置にあるブロックの動き情報(動きベクトル、参照画像インデックス,予測方向など)をそのまま継承して用いるモードが考えられる。このモードに対応する動き情報を得るためには、参照画像制限フラグ105に基づいて、動き情報として使用できる候補のみを残して動き情報を生成するようにすればよい。
図14では、MV_Aに対応する候補が有意参照画像領域の外を指しているため、これを除き、MV_B、MV_Cに対応する候補のみを本モードに対応する動き情報として選択可能とする。MV_Aを除外しない場合、indexは0,1,2の3種類となり、indexとして符号化する情報量が多くなる。除外措置を行うことで、indexに要する符号量も抑制できる効果がある。
【0048】
本実施の形態1では、参照画像制限フラグ105をシーケンスなどの上位ヘッダシンタックスとしてビットストリーム30に多重するとしたが、本フラグに相当する制約をプロファイル、レベルなどで規定しても同様の効果が得られる。
【0049】
本実施の形態1では、
図4に示すようなL
n = M
nのケースを示したが、これはL
n ≠ M
nであってもよい。例えば
図15に示すように、L
n = kM
nとなる場合が考えられる。次の分割では、(L
n+1, M
n+1) = (M
n, M
n)となり、以降の分割は
図4と同様の分割を行ってもよいし
図16に示すように、(L
n+1, M
n+1) = (L
n/2, M
n/2)であってもよい。または
図17のように
図15と
図16の分割のどちらかを選択できるようにしてもよい。選択できるようにした場合は、どちらの分割を選択したかのフラグを符号化する。このケースは、例えば非特許文献1のAVC/H.264のような16x16を1つのブロックとするものを横に連結するだけで可能であるため、既存方式との互換性を維持した符号化がやりやすい効果がある。
【0050】
上記ではL
n = kM
nとしたが、これはkL
n = M
nのように縦に連結したものであっても同様の考えで分割が可能であることはいうまでもない。
【0051】
量子化・変換部、逆量子化・逆変換部の変換ブロック単位は変換処理単位によって一意に決定してもよいし、
図18に示すように階層構造にしてもよい。この場合、各階層では分割するかどうかのフラグを符号化する。
【0052】
上記分割は、パーティション単位で行ってもよいし符号化ブロック単位で行ってもよい。
【0053】
上記変換は正方形での変換を仮定したが、これは長方形など他の矩形であってもよい。
【0054】
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。