(58)【調査した分野】(Int.Cl.,DB名)
上記更新後原画像生成手段は、上記量子化手段の量子化処理で用いられる量子化ステップ幅の半分に相当する値を、量子化誤差とみなして、各パラメータのパラメータ値の選択に用いることを特徴とする請求項1に記載の動画像符号化装置。
上記更新後原画像生成手段は、上記量子化手段の量子化処理で用いられる量子化ステップ幅に相当する値を、量子化誤差とみなして、各パラメータのパラメータ値の選択に用いることを特徴とする請求項1に記載の動画像符号化装置。
上記更新後原画像生成手段が生成する更新後原画像で、予測画像のパラメータ値が選択されたパラメータを示すパラメータ識別情報を出力するパラメータ識別情報生成手段と、
上記誤り訂正符号生成手段が生成した誤り訂正符号と、上記パラメータ識別情報生成手段が生成したパラメータ識別情報を含むデータを非キーフレームに係るデータとして出力する出力手段と
をさらに備えることを特徴とする請求項1〜3のいずれかに記載の動画像符号化装置。
上記誤り訂正手段により生成された非キーフレームの訂正後画像について、上記更新後予測画像生成手段により、第2の予測画像のパラメータ値が適用されたパラメータのパラメータ値を、第1の予測画像のパラメータ値に置き換えた再更新後画像を生成する再更新後画像生成手段をさらに備えることを特徴とする請求項5に記載の動画像復号装置。
上記更新後予測画像生成手段は、上記動画像データに非キーフレームの符号化データとして、1又は複数のパラメータを識別するためのパラメータ識別情報が含まれている場合には、パラメータ識別情報に示されたパラメータについては、第2の予測画像のパラメータ値を選択し、パラメータ識別情報に示されていないパラメータについては再生成された第1の予測画像のパラメータ値を選択することを特徴とする請求項5又は6に記載の動画像復号装置。
フレーム列を有する動画像信号をフレーム単位に符号化した動画像データを生成する動画像符号化装置と、上記動画像符号化装置から供給された動画像データを復号する動画像復号装置とを備える動画像配信システムにおいて、
上記動画像符号化装置として請求項1に記載の動画像符号化装置を適用したことを特徴とする動画像配信システム。
【発明を実施するための形態】
【0019】
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第1の実施形態を、図面を参照しながら詳述する。
【0020】
(A−1)第1の実施形態の構成
図2は、この実施形態の動画像配信システム1の全体構成を示すブロック図である。
【0021】
動画像配信システム1は、動画像符号化装置10及び動画像復号装置20を有している。
【0022】
動画像符号化装置10は、フレーム単位(画像単位)で入力される入力動画像信号(入力映像信号)を符号化して、符号化した符号化データをストリーム化して出力する。
図1に示すように、動画像符号化装置10では、入力動画像信号を構成する各画像が、入力Wyner−Ziv画像と入力Key画像とに分けて符号化される。そして、動画像符号化装置10は、入力Wyner−Ziv画像を符号化した符号化データのストリーム(以下、「Wyner−Zivストリーム」と呼ぶ)と、入力Key画像を符号化したデータのストリーム(以下、「Keyストリーム」と呼ぶ)とを出力する。
【0023】
動画像復号装置20は、動画像符号化装置10から出力された符号化データ(Wyner−Zivストリーム、及びKeyストリーム)を復号して、復号画像(復号フレーム)を生成し、フレーム単位(画像単位)で復号動画像信号(復号映像信号)を出力するものである。動画像復号装置20は、Wyner−Zivストリームを復号して得たWyner−Ziv復号画像と、Keyストリームを復号して得たKey復号画像とを合わせた復号動画像信号を出力する。
【0024】
次に、動画像符号化装置10の機能的構成について
図1を用いて説明する。
【0025】
動画像符号化装置10は、入力Wyner−Ziv画像を符号化してWyner−Zivストリームを出力するWyner−Ziv符号化部110と、入力Key画像を符号化してKeyストリームを出力するKey画像符号化部120とを有している。
【0026】
動画像符号化装置10は、例えば、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成に、実施形態の動画像符号化プログラムをインストールすることにより構築するようにしても良いが、その場合でも、機能的には、
図1のように表すことができる。
【0027】
Key画像符号化部120は、H.264/AVCを初めとする既知の符号化技術(画面内符号化処理)によって入力Key画像を符号化するものである。また、Key画像符号化部120は、入力Key画像に基づいて局所復号画像を生成して、ESI生成部114に供給する。なお、ESI生成部114は、局所復号画像からESIを生成しているが、本発明の効果は、局所復号画像からESIを生成する場合に限定されるものではない。
【0028】
Wyner−Ziv符号化部110は、Slepian−Wolf理論およびWyner−Ziv理論に基づき入力Wyner−Ziv画像の符号化をおこなうものである。なお、本明細書では、動画像符号化装置10側で生成するSIをESI(Encoder Side Information)と表わすものとする。
【0029】
Wyner−Ziv符号化部110は、Wyner−Ziv画像更新部111、Wyner−Ziv画像量子化部112、Slepian−Wolf符号化部113、ESI生成部114、ESI量子化部115、及びレート制御部116を有している。
【0030】
ESI生成部114は、局所復号画像からESIを生成するものである。
【0031】
ESI量子化部115は、ESI生成部114が生成したESIを量子化(2値化)したもの(以下、「量子化後ESI」と呼ぶ)を生成する。
【0032】
Wyner−Ziv画像更新部111は、ESIを利用して入力Wyner−Ziv画像を更新した画像(以下、「更新後Wyner−Ziv画像」と呼ぶ)を生成するものである。Wyner−Ziv画像更新部111が行う補正処理の詳細については後述する。
【0033】
Wyner−Ziv画像量子化部112は、更新後Wyner−Ziv画像を量子化(2値化)したもの(以下、「量子化後Wyner−Ziv画像」と呼ぶ)を生成する。
【0034】
レート制御部116は、量子化後ESIと量子化後Wyner−Ziv画像から、Wyner−Ziv符号化部110のSlepian−Wolf符号処理に設定する1画像(フレーム)あたりの符号量(レート)を決定し、その決定値(以下、「設定レート」と呼ぶ)を出力するものである。設定レートは、Wyner−Zivストリームを構成する1フレーム分の符号量となる。レート制御部116は、例えば、更新後Wyner−Ziv画像とESIとを比較し、ESIの誤りを推定し訂正するために必要な符号量を設定レートとして計算する。レート制御部116において設定レートを決定する方式としては、例えば、非特許文献2の記載技術を利用するようにしてもよい。
【0035】
Slepian−Wolf符号化部113は、量子化後Wyner−Ziv画像をSlepian−Wolf符号化し、設定レートに基づく符号量で、Wyner−Zivストリームを生成するものである。
【0036】
次に、動画像復号装置20の機能的構成について
図3を用いて説明する。
【0037】
動画像復号装置20は、Wyner−Zivストリームを復号して、Wyner−Ziv復号画像を得るWyner−Ziv復号部210と、Keyストリームを復号してKey復号画像を得るKey画像復号部230を有している。
【0038】
動画像復号装置20は、例えば、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成に、実施形態の動画像復号プログラムをインストールすることにより構築するようにしても良いが、その場合でも、機能的には、
図3のように表すことができる。
【0039】
Key画像復号部230は、Key画像符号化部120の符号化処理に対応する復号処理(画面内復号処理)によって、KeyストリームからKey復号画像を得る。
【0040】
Wyner−Ziv復号部210は、Slepian−Wolf理論およびWyner−Ziv理論に基づきWyner−Zivストリームを復号して、Wyner−Ziv復号画像を得るものである。なお、本明細書では、動画像復号装置20側で生成するSIをDSI(Decoder Side Information)と表わすものとする。
【0041】
Wyner−Ziv復号部210は、Slepian−Wolf復号部211、画像再構成部212、反復判定部213、DSI生成部214、及びDSI量子化部215を有している。
【0042】
DSI生成部214は、Key復号画像を利用してDSIを生成するものである。
【0043】
DSI量子化部215は、DSIを画素単位で量子化(2値化)したもの(以下、「量子化後DSI」と呼ぶ)を生成するものである。
【0044】
Slepian−Wolf復号部211は、量子化後DSIに含まれる予測誤りをWyner−Zivストリームを用いて訂正したもの(以下、「訂正後量子化値」と呼ぶ)を生成するものである。
【0045】
画像再構成部212は、訂正後量子化値とDSIとを用いて再構成(逆量子化の一種)した画像(再構成画像)を生成するものである。
【0046】
反復判定部213は、再構成画像を用いてDSIを再生成するかどうかを判定し、再構成する場合は、再構成画像をWyner−Ziv復号画像として、DSI生成部214に出力し、再構成しない場合は、再構成画像をWyner−Ziv復号画像として出力する。
【0047】
反復判定部213が、DSIの再生成を実施するか否かを判定する基準として、DSIの生成回数を利用する方法や再構成画像の品質を客観評価手法で評価する方法等を適用することができる。反復判定部213が、DSI再生成の要否を判定する際に、DSIの生成回数を基準として利用する場合は、DSIの生成回数が、予め定められた生成回数に達するまで、反復判定部213は、Wyner−Ziv復号画像を出力する。
【0048】
そして、DSI生成部214は、Wyner−Ziv復号画像を与えられると、Wyner−Ziv復号画像の情報も利用して、さらに高品質な予測画像を生成する。
【0049】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像配信システム1の動作を説明する。
【0050】
ここでは、動画像符号化装置10の符号化処理の動作について、
図4のフローチャートを用いて説明する。なお、第1の実施形態の動画像復号装置20側の動作については、フローチャートを用いた説明は省略する。
【0051】
まず、Key画像符号化部120において、入力動画像から入力Key画像が取得され、その入力Key画像に基づいて、Keyストリームと局所復号画像とが生成される(S101)。
【0052】
そして、ESI生成部114により、局所復号画像からESIが生成される(S102)。この実施形態では、ESI生成部114は、局所復号画像からESIを生成するものとして説明するが、ESIを生成する元となる画像は局所復号画像に限定されない。
【0053】
そして、ESI量子化部115において、ESIが量子化されて、量子化後ESIが生成される(S103)。
【0054】
そして、Wyner−Ziv画像更新部111は、入力Wyner−Ziv画像とESIとに基づいて、更新後Wyner−Ziv画像を生成する(S104)。Wyner−Ziv画像更新部111では、入力Wyner−Ziv画像とESIとで、それぞれの位置の画素の画素値について比較し、その比較結果に基づいて、それぞれの位置の画素について、更新後Wyner−Ziv画像で採用する画素値を決定する。すなわち、Wyner−Ziv画像更新部111では、それぞれの位置の画素の画素値について、入力Wyner−Ziv画像又はESIのいずれかの画像の画素値を更新後Wyner−Ziv画像に反映する画素値として採用する。なお、Wyner−Ziv画像更新部111において、更新後Wyner−Ziv画像を生成する処理の詳細については後述する。
【0055】
そして、Wyner−Ziv画像量子化部112において、更新後Wyner−Ziv画像が量子化されて、量子化後Wyner−Ziv画像が生成される(S105)。
【0056】
そして、レート制御部116において、量子化後Wyner−Ziv画像と量子化後ESIとに基づいて、Wyner−Zivストリームに適用する設定レート(動画像復号装置20が復号に必要とするSlepian−Wolf符号化のレート)が決定される(S106)。
【0057】
そして、Slepian−Wolf符号化部113において、量子化後Wyner−Ziv画像がSlepian−Wolf符号化され、設定レートに基づいたWyner−Zivストリームが生成される(S107)。
【0058】
次に、上述のステップS104で、Wyner−Ziv画像更新部111が、更新後Wyner−Ziv画像を生成する処理の詳細について説明する。
【0059】
上述の通り、Wyner−Ziv画像更新部111では、入力Wyner−Ziv画像とESIとで、それぞれの位置の画素の画素値について比較し、その比較結果に基づいて、それぞれの位置の画素について、更新後Wyner−Ziv画像で採用する画素値を決定する。ここでは、入力Wyner−Ziv画像とESIとを比較するためのパラメータとして、量子化後Wyner−Ziv画像及び量子化後ESIで発生する量子化誤差Xを用いるものとする。
【0060】
具体的には、Wyner−Ziv画像更新部111では、画素ごとに、「Wyner−Ziv画像の画素値と、ESIの画素値の差」が、量子化誤差Xよりも大きい画素には、Wyner−Ziv画像の画素値を採用し、「Wyner−Ziv画像の画素値とESIの画素値の差」が量子化誤差Xよりも小さい画素には、ESIの画素値を採用するものとする。
【0061】
例えば、Wyner−Ziv画像更新部111では、入力Wyner−Ziv画像の画素値とESIの画素値の差分が量子化誤差Xよりも大きい位置の画素については、入力Wyner−Ziv画像の画素値を採用するものとする。また、この実施形態のWyner−Ziv画像更新部111では、入力Wyner−Ziv画像の画素値とESIの画素値の差分が量子化誤差X以下の位置の画素については、ESIの画素値を採用するものとする。
【0062】
量子化誤差Xは、基本的に画素ごとに異なる値であり、個別に求めることが望ましいが、第1の実施形態のWyner−Ziv画像更新部111では、演算量を低減するために、それぞれの画素について量子化誤差Xを一律の値(以下、「閾値T」と呼ぶ)とみなして処理するものとする。すなわち、Wyner−Ziv画像更新部111では、「Wyner−Ziv画像の画素値と、ESIの画素値の差」と閾値Tとの比較結果によって、更新後Wyner−Ziv画像で採用する画素値を決定するものとする。
【0063】
閾値Tの設定方法は限定されないものであるが、例えば、全ての画素の量子化誤差Xの平均値が、量子化ステップ幅Wの半分であるとみなして、閾値Tを量子化ステップ幅の半分と設定(T=W/2)するようにしても良い。また、例えば、全ての画素の量子化誤差Xは常に最大値(量子化ステップ幅)とみなして、閾値Tを量子化ステップ幅Wと設定(T=W)するようにしても良い。
【0064】
次に、上述の量子化ステップ幅Wについて、
図5を用いて説明する。
【0065】
図5では、更新後Wyner−Ziv画像及びESIの各画素の画素値が0〜255の範囲(8bit相当)である場合の量子化ステップ幅Wについて示している。
図5(a)に示すように、各画素の量子化値を2ビットで表すと00、01、10、11の4つの値のいずれかになる。
図5(a)に示すように、各画素の量子化値が2ビットで表わされる場合、量子化ステップ幅Wを、量子化前と同様に0〜255(10進数)の値で表わすと、64となる。また、
図5(b)に示すように、各画素の量子化値が3ビットで表わされる場合、量子化ステップ幅Wを、量子化前と同様に0〜255(10進数)の値で表わすと、32となる。
【0066】
次に、Wyner−Ziv画像更新部111が、更新後Wyner−Ziv画像を生成する処理の具体例について
図6を用いて説明する。
【0067】
図6では、入力Wyner−Ziv画像、ESI、更新後Wyner−Ziv画像のそれぞれについて、同じ位置の領域A1を構成する縦3画素×横3画素(9つの画素)の画素値を示した例となっている。
図6(a)、
図6(b)、
図6(c)は、それぞれ入力Wyner−Ziv画像、ESI、更新後Wyner−Ziv画像の領域A1における画素値をあらわしている。
図6では、四角形の枠のそれぞれを1つの画素とし、当該四角形の中に図示された数字が当該画素の画素値となっている。例えば、領域A1の画素PX1については、入力Wyner−Ziv画像(
図6(a))における画素値が「12」、ESI(
図6(b))における画素値が「13」、更新後Wyner−Ziv画像(
図6(c))における画素値が「13」となっている。また、例えば、領域A1の画素PX2については、入力Wyner−Ziv画像(
図6(a))における画素値が「17」、ESI(
図6(b))における画素値が「24」、更新後Wyner−Ziv画像(
図6(c))における画素値が「17」となっている。
【0068】
例えば、
図6では、上述の閾値Tを「5」として、更新後Wyner−Ziv画像(
図6(c))を生成している。例えば、領域A1の画素PX1については、入力Wyner−Ziv画像(
図6(a))における画素値が「12」、ESI(
図6(b))における画素値が「13」となっているため、画素PX1に関する差分は「1」となる。したがって、更新後Wyner−Ziv画像(
図6(c))において、画素PX1については、ESI(
図6(b))の画素値「13」が採用されている。また、例えば、領域A1の画素PX2については、入力Wyner−Ziv画像(
図6(a))における画素値が「17」、ESI(
図6(b))における画素値が「24」となっているため、画素PX1に関する差分は「7」となる。したがって、更新後Wyner−Ziv画像(
図6(c))において、画素PX1については、入力Wyner−Ziv画像(
図6(a))の画素値「17」が採用されている。
【0069】
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
【0070】
動画像符号化装置10では、入力Wyner−Ziv画像をそのままSlepian−Wolf符号化に用いずに、ESIを利用して補正した更新後Wyner−Ziv画像を用いてSlepian−Wolf符号化を行っている。Wyner−Ziv画像更新部111では、入力Wyner−Ziv画像の各画素値を量子化誤差X(閾値T)と比較し、その比較結果に応じて、一部の画素値をESIの画素値に置き換えている。したがって、更新後Wyner−Ziv画像では、入力Wyner−Ziv画像よりも、ESIとの差異が少ない画像となっている。そして、レート制御部116は、上述の通り量子化後Wyner−Ziv画像(更新後Wyner−Ziv画像を量子化した画像)と量子化後ESIとを比較し、量子化後ESIの誤りを推定し訂正するために必要な符号量を設定レートとして計算する。レート制御部116では、量子化後ESIと比較の対象となる画像(量子化値列)との差異が少ないほど、訂正すべき誤りが少なく、計算結果が低い設定レート(少ない符号量)となる。また、レート制御部116では、入力Wyner−Ziv画像よりもESIとの差異が少ない更新後Wyner−Ziv画像に基づく量子化後Wyner−Ziv画像を用いて設定レートを計算している。したがって、第1の実施形態のレート制御部116では、従来(入力Wyner−Ziv画像をそのまま量子化用いて、設定レートを計算する場合)以下の設定レートを計算結果として出力することになる。
【0071】
そして、Wyner−Ziv画像更新部111では、上述の通り、「Wyner−Ziv画像の画素値と、ESIの画素値の差」が、量子化誤差Xよりも大きい画素には、Wyner−Ziv画像の画素値を採用し、「Wyner−Ziv画像の画素値とESIの画素値の差」が、上述の量子化誤差よりも小さい画素には、ESIの画素値を採用するものとしている。上述の通り、更新後Wyner−Ziv画像は、入力Wyner−Ziv画像よりもESIとの差分が少なくなるように補正されている。しかし、更新後Wyner−Ziv画像において、補正されている画素は、量子化誤差Xよりも差分の少ない画素についてのみである。したがって、入力Wyner−Ziv画像と更新後Wyner−Ziv画像との間の変化を画素単位(パラメータ単位)で見た場合、その変化は量子化誤差Xの範囲内にとどまることになる。
【0072】
一方、Slepian−Wolf符号化部113では、量子化後ESIの誤りを訂正して量子化後Wyner−Ziv画像とするためのパリティビットを生成する。上述の通り、量子化後Wyner−Ziv画像及び量子化後ESIには、量子化誤差Xを含むことになる。したがって、入力Wyner−Ziv画像と更新後Wyner−Ziv画像との差分が、量子化誤差Xの範囲内とすれば、Wyner−Ziv符号化部110で生成するパリティビットによる誤り訂正の結果は、入力Wyner−Ziv画像をそのままWyner−Ziv符号化を行う場合と比較しても同程度の精度となる。すなわち、この実施形態の動画像符号化装置10のように、更新後Wyner−Ziv画像をWyner−Ziv符号化に用いる場合でも、入力Wyner−Ziv画像をそのままWyner−Ziv符号化に用いる場合でも、動画像復号装置20側で得られる復号品質は同程度となる。
【0073】
しかし、第1の実施形態では、画素ごとの量子化誤差Xを閾値T(例えば、ESIの量子化ステップ幅の半分の値)とみなして一律に適用しているため、実際に更新後Wyner−Ziv画像をWyner−Ziv符号化に用いる場合でも、動画像復号装置20側で得られる復号品質は同程度となるか否かについての検証を行った。以下、第1の実施形態の効果に関する検証結果について、
図7、
図8を用いて説明する。
【0074】
図7では、従来技術と同様に、入力Wyner−Ziv画像をそのまま量子化してSlepian−Wolf符号化を行う例について説明している。一方、
図8では、第1の実施形態の動画像符号化装置10により符号化を行う例(更新後Wyner−Ziv画像を量子化して符号化に用いる場合)について示している。また、
図7、
図8では、説明を簡易とするために、各画像(入力Wyner−Ziv画像、更新後Wyner−Ziv画像、及びESI)は、3つの画素PX1〜PX3による画素列(1×3の画素列)で構成される画像であるものとしている。
【0075】
そして、
図7、
図8では、入力Wyner−Ziv画像を構成する画素列αの画素PX1〜PX3の画素値は、それぞれ79、114、164(10進数)となっているものとする。また、
図7、
図8において、ESIを構成する画素列βの各画素値は、それぞれ97、129、188であったものとする。なお、
図7、
図8では、画素列α、画素列βの各画素値は0〜255(10進数)であるものとして示している。
【0076】
次に、
図7、
図8の例のそれぞれについて、Slepian−Wolf符号化を行う場合に必要な符号量、及び、Wyner−Ziv符号化部110で生成される符号(パリティビット)を用いて動画像復号装置20側で復号処理を行った場合の平均誤差(復号品質)について説明する。
【0077】
まず、
図7の例において、Slepian−Wolf符号化を行う場合に必要な符号量について説明する。
図7の例では、量子化後ESIとして、画素列βを量子化ビット数2ビットで量子化した量子化値列γ1を用いるものとする。
図7では、量子化ビット数2ビットで量子化された量子化値列γ1の各量子化値は先頭から01、10、10(2進数)となっている。
【0078】
また、
図7に示すように、Wyner−Ziv画像の画素列αの各画素値を、量子化ビット数2ビットで量子化した量子化値列δ(量子化後Wyner−Ziv画像)の画素PX1〜PX3の画素値は、それぞれ01、01、10(2進数)となる。
【0079】
そして、量子化ビット数2ビットで量子化された量子化値列γ1(ESI)と、量子化値列δ(入力Wyner−Ziv画像)の間に生じている予測誤りを訂正するのに必要な情報量は、量子化値列γ1(ESI)と量子化値列δ(入力Wyner−Ziv画像)の間のビット誤り確率から条件付きエントロピーを計算し、それに量子化列δのビット数を乗じれば求めることができる。この場合、量子化値列γ1(ESI)と、量子化値列δ(入力Wyner−Ziv画像)の間のビット誤り数は、6個中2個であるので、ビット誤り確率は2/6である。
【0080】
そして、このビット誤り確率からpをビット誤り確率としたときの条件付きエントロピー「−plog(p)−(1−p)log(1−p)」を求め、それに量子化列δのビット数6を乗じると、5.5ビットになる。すなわち、
図7の例では、5.5ビットの符号量(パリティビット)がなければ量子化後ESIから量子化後Wyner−Ziv画像を得ることができないことになる。
【0081】
次に、
図7の例における平均誤差について説明する。
【0082】
ここでは、動画像復号装置20においてSlepian−Wolf復号が成功し、Wyner−Ziv復号部210が出力する訂正後量子化値が、量子化値列δ(Wyner−Ziv画像)と同じになったと仮定する。このとき、訂正後量子化値から、画像を再構成する方法(画像再構成部212の処理方法)には、いくつか提案されているが、例えば、非特許文献4のように、DSIを量子化した値と訂正後量子化値が同じであれば、DSIを再構成結果とし、異なる場合は、量子化区間のなかでDSIに最も近い値を再構成結果にするという方法がある。なお、
図7、
図8の例では、説明を簡易にするためにDSIがESIと同じであったと仮定する。
【0083】
そして、
図7の例では、動画像復号装置20で生成される再構成画像の画素列ε1を構成する各画素の画素値は、97、128、188(10進数)になる。この場合、ε1と、原画像(入力Wyner−Ziv画像)の画素列αとの間の平均誤差(画素ごとの画素値の差分の平均値)を求めると、18.7になる。
【0085】
なお、
図8の例では、量子化後ESIとして、画素列βを量子化ビット数3ビットで表した量子化値列γ2を用いるものとする。
図8では、量子化ビット数2ビットで量子化された量子化値列γの各量子化値は先頭から011、100、101(2進数)となっている。
図7の例と
図8の例で、ESIに適用する量子化ビット数を同じとすると、誤り訂正に必要な符号量が減り、平均誤差が増える結果となり、本発明の効果がわかりにくくなる。そこで、
図8では、量子化ビット数を3ビットとして、
図7の例と同程度の平均誤差を、より少ない符号量で実現できることを検証している。
【0086】
はじめに、Wyner−Ziv画像(画素列α)とESI(画素列β)の間の画素値の差分を計算する。
図8では、先頭から画素PX2の画素値の差分のみが、量子化ステップ幅の半分(2^(8−3)/2=16)よりも小さい15である。したがって、
図8の例における更新後Wyner−Ziv画像の画素列ζでは、画素PX2のみがESIの画素値に補正され、その画素値は先頭から79、129、164(10進数)となる。
【0087】
次に、
図8の例において、Slepian−Wolf符号化を行う場合に必要な符号量について説明する。
【0088】
図8に示すように、ESIの画素列βを、量子化ビット数3ビットで量子化した量子化値列γ2の3つの量子化値は、先頭から011、100、101(2進数)となる。
【0089】
また、更新後Wyner−Ziv画像の画素列ζを、量子化ビット数3ビットで量子化した量子化値列ηの3つの量子化値は、先頭から010、100、101(2進数)となる。
【0090】
そして、量子化ビット数3ビットで量子化された量子化値列γ2(量子化後ESI)と、量子価値列η(量子化後Wyner−Ziv画像)の間に生じている予測誤りを訂正するのに必要な情報量は、量子化値列γ2(量子化後ESI)と量子化値列η(量子化後Wyner−Ziv画像)の間のビット誤り確率から求めた条件付きエントロピーを計算すれば求めることができる。この場合、量子化値列γ2(ESI)と、量子化値列η(更新後Wyner−Ziv画像)の間のビット誤り数は、9個中1個であるので、ビット誤り確率は1/9である。
【0091】
そして、このビット誤り確率からpをビット誤り確率としたときの条件付きエントロピー「−plog(p)−(1−p)log(1−p)」を求め、それに量子化列δのビット数9を乗じると、4.5ビットになる。すなわち、
図8の例では、4.5ビットの符号量(パリティビット)がなければ量子化後ESIから量子化後Wyner−Ziv画像を得ることができないことになる。
【0092】
次に、
図8の例における平均誤差について説明する。
【0093】
ここでは、動画像復号装置20においてSlepian−Wolf復号が成功し、Wyner−Ziv復号部210が出力する訂正後量子化値に基づく画像が、量子化値列ηの画像(量子化後Wyner−Ziv画像)と同じになったと仮定する。このとき、訂正後量子化値から、画像を再構成する方法(画像再構成部212の処理方法)として、上述の
図7と同様の方式を用いるものとする。
【0094】
この場合、
図8の例では、動画像復号装置20で生成される再構成画像の画素列ε2を構成する各画素の画素値は、先頭から97、128、188(10進数)になる。この場合、ε2と、原画像(Wyner−Ziv画像)の画素列αとの間の平均誤差(画素ごとの画素値の差分の平均値)を求めると、18.7になる。
【0095】
以上の計算結果をまとめると、
図7に示す従来技術を用いた場合には、平均誤差18.7を実現するのに5.5ビットの符号量を要していたのに対し、第1の実施形態では、同じ平均誤差18.7を実現するのに、4.5ビットしかしか必要としていない。すなわち、第1の実施形態のように、ESIの量子化ステップ幅の半分の値を量子化誤差Xの平均値とみなして、更新後Wyner−Ziv画像を生成するための閾値Tとして適用しても、従来よりも少ない符号量で同等の復号品質を実現することができることがわかる。
【0096】
以上のように、第1の実施例によれば、符号量あたりの画質改善量が小さい画素を対象にした符号量の増加を防止できることで、復号画像の品質を低下させずに符号量を少なくすることができる。
【0097】
(B)第2の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第2の実施形態を、図面を参照しながら詳述する。
【0098】
第1の実施形態では、動画像復号装置20は、DSIのみを用いてSlepian−Wolf復号を行う例について示した。しかし、DSIとESIで、内容が異なる場合(たとえば、量子化ビット数等の生成方式が異なる)には、動画像符号化装置10においてSlepian−Wolf符号化に更新後Wyner−Ziv画像を用いることの副作用(弊害)が生じる場合がある。
【0099】
通常、DVC方式の動画像配信システムにおいて、動画像符号化装置側ではSIの予測精度よりも符号化に伴う演算量の低さを優先するのに対し、動画像復号装置側では、復号の演算量の低さよりもSIの予測精度を優先することが多い。そのため、従来の動画像配信装置において、動画像符号化装置側で生成するSI(ESI)よりも、動画像復号装置側で生成するSI(DSI)の方が高品質な内容である場合が多い。
【0100】
以下、第1の実施形態において生じる可能性のある副作用について
図9を用いて説明する。
【0101】
図9では、任意の画素に対するESIの量子化値(A)、n−1回目に生成したDSI(以下、「(n−1)−thDSI」とも表わす)の量子化値(B)、(n−1)−thDSIの訂正後(Slepian−Wolf復号部211による訂正後)の量子化値(C)、n回目に生成したDSI(以下、「(n)−thDSI」とも表わす)の量子化値(D)、n−thDSIの訂正後の量子化値(F)に関するそれぞれの評価結果の遷移のルートについて木構造で表わしている。
【0102】
図9において、○印は、各量子化値(A〜D、F)が、原画像(入力Wyner−Ziv画像の量子化値)と等しい場合を表している。また、
図9において、×印(○の枠に×の印)は、各量子化値(A〜D、F)が原画像(入力Wyner−Ziv画像の量子化値)と異なっている場合を表している。さらに、
図9において、△印は、各量子化値(A〜D、F)が原画像(入力Wyner−Ziv画像の量子化値)と異なっているが、動画像符号化装置10における更新後Wyner−Ziv画像の量子化値とは等しい場合を表している。
【0103】
図9では、ESIの量子化値Aの評価結果(左から×、△、○のいずれか)を起点として、量子化値B、C、D、Fの順に評価値が遷移するルートについて木構造で示している。
【0104】
ここで、
図9に示すように、任意の画素についてESIの量子化値Aの評価結果(
図9の評価結果V11)、及び(n−1)−thDSIの訂正後の量子化値Cの評価結果(
図9の評価結果V13)がいずれも△であった場合(即ち、A=Cの場合)のルートについて説明する。そして、このルートではその後、動画像復号装置20において、より高品質(画像全体の平均的な品質が高品質)なDSIが生成され、当該画素についてn−thDSIの量子化値Dが得られ、その評価結果が○(
図9の評価結果V14)となったものとする。しかし、この場合、n−thDSIの量子化値Dは、本来ならば原画像(入力Wyner−Ziv画像)の値と等しいのにも関わらず、動画像復号装置20側のWyner−Ziv復号部210にとっては誤りと認識されて訂正されてしまうため、n−thDSIの訂正後の量子化値Fの段階では評価結果が△(
図9の評価結果V15)となってしまう。上述のように、第1の実施形態では、「A=C、かつ、C≠D」となる画素については、Wyner−Ziv復号画像における誤り数が増加してしまう場合があった。このような、Wyner−Ziv復号画像における誤り数の増加は、Slepian−Wolf復号が失敗する確率を上げるため、復号品質の低下を引き起こすことになる。
【0105】
なお、
図9では、「DSIの量子化値が△または○の場合は、DSIの訂正後の量子化値も△または○になる」という仮定と、「(n−1)−thDSIの量子化値Bが△または○の場合で、なおかつ(n−1)−thDSIの訂正後の量子化値Cが△または○の場合は、n−thDSIの量子化値Dも、△以上になる」という仮定のもとで図示している。そこで、第2の実施形態では、動画像復号装置側でESIも用いた処理を行うことにより、上述のような課題を解決する。
【0106】
(B−1)第2の実施形態の構成
第2の実施形態の動画像配信システム1Aの全体構成も上述の
図2を用いて示すことができる。以下、第2の実施形態について第1の実施形態との差異について説明する。
【0107】
第2の実施形態では、動画像復号装置20が動画像復号装置20Aに置き換わっている点で第1の実施形態と異なっている。
【0108】
図10は、第2の実施形態に係る動画像復号装置20Aの内部構成について示したブロック図である。
【0109】
第2の実施形態の動画像復号装置20Aでは、Wyner−Ziv復号部210がWyner−Ziv復号部210Aに置き換わっている点で第1の実施形態と異なっている。
【0110】
そして、Wyner−Ziv復号部210Aは、ESI生成部216、ESI量子化部217、量子化値更新部218、SI選択部219、及び量子化値再更新部220が追加されている点で第1の実施形態と異なっている。
【0111】
ESI生成部216は、Key復号画像から、動画像符号化装置10側と同様のESIを生成するものである。
【0112】
ESI量子化部217は、ESIを量子化して、量子化後ESIを生成するものである。
【0113】
SI選択部219は、訂正後量子化値と量子化後ESIと量子化後DSIから画素ごとにいずれかの量子化値を選択するためのSI選択信号を生成するものである。SI信号の詳細については後述する。
【0114】
量子化値更新部218は、SI選択信号に基づき、量子化後ESIと量子化後DSIから更新後量子化値(量子化値の列)を生成するものである。更新後量子化値の詳細については後述する。
【0115】
量子化値再更新部220は、SI選択信号に基づき、訂正後量子化値と量子化後DSIから再更新後量子化値(量子化値の列)を生成するものである。再更新後量子化値の詳細については後述する。そして、再更新後量子化値は、画像再構成部212に供給されて画像の再構成画像の生成に用いられることになる。
【0116】
そして、第2の実施形態のSlepian−Wolf復号部211では、更新後量子化値に含まれる予測誤りをWyner−Zivストリームを用いて訂正し、訂正後量子化値を生成する処理を行うことになる。
【0117】
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動画像配信システム1Aの動作を説明する。
【0118】
まず、動画像復号装置20Aの符号化処理の動作について、
図11のフローチャートを用いて説明する。
【0119】
まず、Key画像復号部230において、Keyストリームの復号処理が行われ、Key符号化し、Key復号画像が生成される(S201)。
【0120】
そして、ESI生成部216において、Key復号画像からESIが生成される(S202)。
【0121】
そして、ESI量子化部217において、ESIが量子化され量子化後ESIが生成される(S203)。
【0122】
そして、DSI生成部214において、Key復号画像からDSIが生成される(S204)。なお、DSI生成部214にWyner−Ziv復号画像が入力されている場合は、Wyner−Ziv復号画像も参照してDSIを生成する。
【0123】
そして、DSI量子化部214において、DSIが量子化されて、量子化後DSIが生成される(S205)。
【0124】
そして、SI選択部219において、訂正後量子化値と量子化後ESIと量子化後DSIから、画素ごとにSI選択信号が生成される(S206)。SI選択部219は、量子化後ESIと訂正後量子化値で値が等しく、さらに、訂正後量子化値と量子化後DSIで量子化値が異なる画素については、SI選択信号としてESI側の量子化値(量子化後ESIの量子化値)を選択する制御信号を出力し、それ以外の画素については、SI選択信号としてDSI側の量子化値(量子化後DSIの量子化値)を選択する指示信号を出力する。なお、SI選択部219は、訂正後量子化値が生成されていない段階では、すべての画素でSI選択信号としてDSI側の量子化値を選択する指示信号を出力する。
【0125】
また、SI選択部219は、Slepian−Wolf符号の符号量が少なく、予測誤りを正しく訂正できる確率が低いことが予測される場合、ESIの品質が予め定めた閾値よりも高いと判定した画素については、上記の条件を用いて、SI選択信号を生成し、ESIの品質が予め定めた閾値よりも低いと判定した画素については、SI選択信号としてDSI側の量子化値を指示するようにしてもよい(理由については後述)。この場合、ESI生成部216やESI量子化部217は、ESIや量子化後ESIに、ESIの品質を画素ごとに評価した情報も加えて、出力する必要がある。ESIの評価方法としては、たとえば、ESIを生成する際に計算した動きベクトルのコストによっておこなう方法を適用するようにしても良い。また、その他にも、たとえば、非特許文献3のようにスケーラブル構造を有する場合は、ベースレイヤの復号結果とESIを比較することによって、ESIの品質を評価する方法を適用するようにしても良い
そして、量子化値更新部218において、SI選択信号に基づき、量子化後ESIと量子化後DSIから更新後量子化値を生成する(S207)。
【0126】
量子化値更新部218は、SI選択信号でESI側の量子化値が指示されている画素については、更新後量子化値にESI側の量子化値を設定し、SI選択信号でDSI側の量子化値が指示されている画素については、更新後量子化値にDSI側の量子化値を設定する。
【0127】
そして、Slepian−Wolf復号部211は、更新後量子化値に含まれる予測誤りを、Wyner−Zivストリームを用いて訂正し、訂正後量子化値を生成する(S208)。
【0128】
そして、量子化値再更新部220で、SI選択信号に基づき、訂正後量子化値と量子化後DSIから再更新後量子化値が生成される(S209)。
【0129】
量子化値再更新部220は、SI選択信号でESI側の量子化値が指示されている画素については、量子化後DSIの量子化値を代入し、SI選択信号でDSI側の量子化値が指示されている画素については、訂正後量子化値を代入することで、再更新後量子化値を生成する。言い換えると、量子化値再更新部220は、訂正後量子化値について、SI選択信号でESI側の量子化値が指示されている画素についてだけ量子化後DSIの量子化値に置き換える更新を行って再更新後量子化値を生成する。
【0130】
そして、画像再構成部212において、再更新後量子化値と量子化後DSIから再構成画像が生成される(S210)。
【0131】
そして、1つの画像(フレーム)について上述のステップS204〜S209の処理が終了した後、反復判定部220において、DSIを再生成するか否か判定され(S211)、DSIを再生成すると判定された場合には、Wyner−Ziv復号部210Aは上述のステップS204から動作することになる。
【0132】
一方、上述のステップS211で、DSIを再生成しないと判定された場合、Wyner−Ziv復号部210Aは、最新に生成した再構成画像をWyner−Ziv復号画像として出力する。
【0133】
次に、動画像復号装置20Aにおいて、上述の課題が解決されていることについて説明する。
【0134】
図12は、動画像復号装置20Aにおいて生成される各量子化値の評価結果について、上述の
図9と同様の形式で示した説明図である。
【0135】
図12では、上述の
図9と比較して、(n)−thDSIの更新後量子化値E(量子化値更新部218が出力する量子化値)と、(n)−thDSIの再更新後量子化値G(量子化値再更新部220が出力する量子化値)の段(行)が追加されている。E及びGに係る評価結果(○、×、△)が示す内容については上述の
図9と同様である。
【0136】
そして、
図12において、「A=C、かつ、C≠D」となる画素の評価結果の遷移ルートは、Aの評価結果V21(△)、Bの評価結果V22(△)、Cの評価結果V23(△)、Dの評価結果V24(○)というルートとなる。そして、第2の実施形態(
図14)では、「A=C、かつ、C≠D」となる画素について、第1の実施形態の場合(
図9の場合)と同様に、n−thDSIの訂正後の量子化値Fの段階では評価結果が△(評価結果V26)となる。しかし、第2の実施形態では、量子化値再更新部220による補正により、当該画素の量子化値を、ESIの量子化値Aに置き換えているため、最終的に出力されるn−thDSIの再更新後の量子化値Gの評価結果を○(評価結果V27)とすることができる。
【0137】
したがって、
図12に示すように、「A=C、かつ、C≠D」を満たす画素については、量子化値更新部218において、当該画素の量子化値を、ESIの量子化値Aと同じ値に置き換えることで、Slepian−Wolf符号から見たときの誤り数増加を防止することができる。
【0138】
さらに、量子化値再更新部220において、当該画素の量子化値を、n−thDSIのDSIの量子化値Dに置き換えることで、最終出力の評価結果を○にすることもできる。
【0139】
また、上述のように、量子化値更新部218や量子化値再更新部220において、量子化値の更新をおこなうことによって、以下のような影響が発生する場合がある。「A=C、かつ、C≠D」を満たす画素としては、
図12に示す評価結果V21〜V24のルートの他に、
図12に示す評価結果V31〜V34のルートも存在するからである。
図12に示す評価結果V31〜V34のルートでは、ESIの量子化値Aの評価結果が×(評価結果V31)、(n−1)−thDSIの訂正後の量子化値Cの評価結果が×(評価結果V32)、n−thDSIの量子化値Dが○(評価結果V34)となっている。
【0140】
しかしながら、上述の評価結果V31〜V34のルートでは、(n−1)−thDSIの訂正後の量子化値Cは、Slepian−Wolf復号によって訂正された値であり、たとえ全てのビットが正しく復号されなかったのだとしても、一部のビットは正しく復号された可能性は十分にあり、ESIの量子化値Aと、(n−1)−thDSI訂正後の量子化値Cとの間で等号が成立する可能性は低い。そして、ESIの量子化値Aと訂正後の量子化値Cの間で等号が成立しない場合は、上記条件を満たさないため、副作用を引き起こさない。一部には、評価結果V31〜V34の遷移ルートでA=Cの条件を満たす画素も発生しうるが、その画素についても、
図14に示すように、n−th再更新後の量子化値Gの評価結果(評価結果V37)は○に戻るため、その影響は小さい。
【0141】
また、Slepian−Wolf符号の符号量が十分ではないと予想され、訂正の失敗が高い確率で発生するような状況では、更新後の量子化値Eにおいて、上記副作用の影響が強くなる。そのような状況では、上述のステップS206で説明したとおり、Slepian−Wolf符号の符号量が少なく、予測誤りを正しく訂正できる確率が低いことが予測される場合、ESIの品質が予め定めた閾値よりも高いと判定した画素については、SI選択部219でSI選択信号としてDSIを指示することも有効である。
図12に示す通り、上述の副作用の発生する画素は、ESIの量子化値の評価結果が×となる画素である。ESIの品質が悪いと判定された画素は、ESIの量子化値Aが×となる可能性が高く、そのような画素では上記条件を適用しないことで、上述の副作用の発生を防ぐことができる。
【0142】
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
【0143】
上述の通り、第2の実施形態によれば、Slepian−Wolf符号にとっての誤り増加を防止できるとともに、再生成されたSIの高品質な復号結果を出力に反映することができ、復号品質が改善する。
【0144】
(C)第3の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第3の実施形態を、図面を参照しながら詳述する。
【0145】
(C−1)第3の実施形態の構成
第3の実施形態の動画像配信システム1Bの全体構成も上述の
図2を用いて示すことができる。以下、第3の実施形態について第2の実施形態との差異について説明する。
【0146】
第3の実施形態では、動画像符号化装置10及び動画像復号装置20Aが、動画像符号化装置10B及び動画像復号装置20Bに置き換わっている点で第2の実施形態と異なっている。
【0147】
図13は、第3の実施形態に係る動画像符号化装置10Bの内部構成について示したブロック図である。
【0148】
動画像符号化装置10Bでは、Wyner−Ziv符号化部110がWyner−Ziv符号化部110Bに置き換わっている点で第2の実施形態と異なっている。また、Wyner−Ziv符号化部110Bでは、Wyner−Ziv画像更新部111がWyner−Ziv画像更新部111Bに置き換わっている点で第2の実施形態と異なっている。
【0149】
Wyner−Ziv画像更新部111Bは、更新後Wyner−Ziv画像を生成する際に、ESI側の量子化値を採用した画素の位置を示す情報(以下、「更新画素位置情報」と呼ぶ)を生成する。更新画素位置情報の形式については限定されないものであるが、例えば、更新後Wyner−Ziv画像においてESI側の量子化値を採用した画素を特定(パラメータを特定)するための識別情報(例えば、座標やシーケンス番号等)の一覧を含むようにしても良い。そして、動画像符号化装置10Bでは、画像(フレーム)ごとの更新画素位置情報も出力し、復号側(動画像復号装置20B)に動画像データの一部として供給される。
【0150】
図14は、第3の実施形態に係る動画像復号装置20Bの内部構成について示したブロック図である。
【0151】
動画像復号装置20Bでは、Wyner−Ziv復号部210AがWyner−Ziv復号部210Bに置き換わっている点で第2の実施形態と異なっている。また、Wyner−Ziv復号部210Bでは、SI選択部219がSI選択部219Bに置き換わっている点で第2の実施形態と異なっている。
【0152】
SI選択部219Bでは、動画像符号化装置10Bから供給される更新画素位置情報を利用してSI選択信号を生成する点で第2の実施形態と異なっている。
【0153】
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の動画像配信システム1Bの動作を説明する。
【0154】
まず、動画像符号化装置10の符号化処理の動作について、
図15のフローチャートを用いて説明する。
【0155】
図15に示すフローチャートでは、ステップS104がステップS304に変わっていること以外は、上述の第1の実施形態の
図4のフローチャートと同様であるので、ここではステップS104とステップS304との差異についてのみ説明する。
【0156】
ステップS304では、Wyner−Ziv画像更新部111Bにおいて、更新後Wyner−Ziv画像を生成する際に、ESI側の量子化値を採用した画素の位置を示す更新画素位置情報を生成して出力する処理を行う。動画像符号化装置10Bにおけるその他の動作については、上述の
図4の説明と同様であるので説明を省略する。
【0157】
次に、動画像復号装置20Aの復号処理の動作について、
図16のフローチャートを用いて説明する。
【0158】
図16に示すフローチャートでは、ステップS206がステップS306に変わっていること以外は、上述の第2の実施形態の
図11のフローチャートと同様であるので、ここではステップS206とステップS306との差異についてのみ説明する。
【0159】
ステップS306では、SI選択部315Bにおいて、動画像符号化装置10Bから供給された更新画素位置情報を利用して、画素ごとにSI選択信号が生成される。SI選択部315Bは、更新画素位置情報で指定された画素については、SI選択信号としてESI側の量子化値を指示する制御信号を生成し、それ以外の画素については、SI選択信号としてDSI側の量子化値を指示する制御信号を生成する。動画像復号装置20Bにおけるその他の動作については、上述の
図11の説明と同様であるので説明を省略する。
【0160】
(C−3)第3の実施形態の効果
第3の実施形態によれば、第2の実施形態の効果に加えて以下のような効果を奏することができる。
【0161】
動画像符号化装置10Bにおいて、更新画素位置情報を生成して動画像復号装置20Bに伝送することで、SI選択部219Bは推定誤り(第2の実施形態における上述の副作用)を発生させることなく、SI選択信号を生成することができる。
【0162】
また、第3の実施形態ではSI選択信号を生成するために、訂正後量子化値を利用する必要がないため、DSIを反復生成することは必須ではなくなる。
【0163】
(D)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
【0164】
(D−1)上記の各実施形態では、説明を簡易とするために、符号化及び復号に用いる各画像(入力Wyner−Ziv、ESI、DSI)について、非特許文献1等のようにDCT変換等による変換処理を行わずに、各画素の画素値又は量子化値で表わしたパラメータ形式(ピクセルドメイン形式)のまま処理するものとして説明している。ただし、本発明では、各画像を表現するためのパラメータ形式は、ピクセルドメイン形式に限定されず、DCT変換等により変換係数領域ごとの量子化値で表わしたパラメータ形式(トランスフォームドメイン形式)としても良い。トランスフォームドメイン形式の場合、上記の各実施形態の画素の画素値(量子化値)が、変換係数領域ごとの量子化値に置き換えられることになる。上記の各実施形態で、符号化及び復号に用いる各画像(入力Wyner−Ziv、ESI、DSI)について、トランスフォームドメイン形式で処理する場合には、量子化処理の前段に、トランスフォームドメイン形式のパラメータ列に変換する変換処理部を追加すれば良い。
【0165】
上記の各実施形態では、各画素の画素値をパラメータとして並べたパラメータ列としてみることができる。そして、Slepian−Wolf理論およびWyner−Ziv理論に基づいたDVC方式の符号化処理及び復号処理では、符号化及び復号する対象となるパラメータ列の数や各パラメータの持つ意味は限定されない。したがって、各画像を表現するためのパラメータ列の形式(パラメータの数等)を変更したとしても、上記の各実施形態と同様の効果を奏することができる。
【0166】
(D−2)上記の各実施形態において、動画像復号装置では、Key画像からESIやDSIを生成しているが、他時刻のWyner−Ziv復号画像から生成しても良い。また、動画像復号装置では、非特許文献3のようにスケーラブル構造を有する場合は、ベースレイヤの情報を用いて、DSIを生成しても良い。
【0167】
(D−3)上記の各実施形態では、動画像復号装置においてDSIの再生成を行っているが、第1の実施形態及び第3の実施形態についてはDSIの再生成処理は必須でないので省略するようにしても良い。
【0168】
(D−4)上記の各実施形態の動画像符号化装置では、レート制御部による推定結果により、設定レートを決定する構成となっているが、非特許文献1のように、動画像復号装置側からのフィードバックアプローチによってレート制御する構成としても良い。フィードバックアプローチによってレート制御する場合、ESI量子化部を省略するようにしてもよい。
【0169】
(D−5)上記の各実施形態において、本発明の上述の効果を発揮できない環境である場合には、一部の構成要素の機能をオフ可能な構成とすることで、演算量の増加を抑える用にしても良い。
【0170】
例えば、第1〜第3の実施形態の動画像符号化装置において、本発明の効果を発揮できない環境の場合、Wyner−Ziv画像更新部の機能をオフ可能としても良い。この場合、動画像符号化装置において、入力Wyner−Ziv画像をそのまま、Wyner−Ziv画像量子化部に供給するようにしても良い。
【0171】
また、例えば、第2、第3の実施形態の動画像復号装置において、本発明の効果が発揮できない環境の場合、ESI生成部、ESI量子化部、量子化値更新部、SI選択部、及び量子化値再更新部の機能をオフ可能としても良い。この場合、訂正後量子化値がそのまま画像再構成部に供給されることになる。またこの場合、量子化後DSIがそのままSlepian−Wolf復号部に供給されることになる。
【0172】
本発明の上述の効果を発揮できない環境としては、例えば、動画像符号化装置及び又は動画像復号装置でESI及びDSIの量子化が1ビットで行われる場合が挙げられる。
【0173】
また本発明の効果を発揮できない環境としては、たとえば、第2、第3の実施形態において、動画像符号化装置側と動画像復号装置側とで、ESIを生成するアルゴリズムが異なっている場合が挙げられる。動画像符号化装置と動画像復号装置との間で、相互にESIの生成アルゴリズムが同一であるか否かを確認する方法は限定されないものであるが、例えば、両装置間で対応可能なESIの生成アルゴリズムの形式情報(例えば、アルゴリズムごとに付与されたID)を交換して確認する構成としても良い。なお、動画像符号化装置及び又は動画像復号装置で、複数のESI生成アルゴリズムに対応する場合には、両装置間で対応するESIの生成アルゴリズムの形式情報を交換して、共通して対応する生成アルゴリズムを決定して用いるネゴシエーションの処理を行うようにしても良い。
【0174】
(D−6)上記の各実施形態では、動画像符号化装置と動画像復号装置はネットワーク等の通信路で接続されているものとして説明しているが、動画像符号化装置と動画像復号装置は直接通信可能な構成としなくてもよい。例えば、動画像符号化装置が生成した動画像データ(Wyner−Zivストリーム及びKeyストリームのデータ)を、DVDやハードディスク等の媒体に記録し、オフラインで動画像復号装置に供給するようにしてもよい。