【文献】
岩村俊輔, 松尾康孝, 三須俊枝, 境田慎一,”色・時間相関を考慮したフレーム時間分割による映像符号化の検討”,2012年画像符号化シンポジウム(PCSJ2012),2012年10月26日
(58)【調査した分野】(Int.Cl.,DB名)
入力映像の画素値ベクトルを第一変換し、さらに、圧縮符号化してビットストリームとして伝送する符号化装置と、伝送された前記ビットストリームから前記画素値ベクトルを復号し、さらに、前記画素値ベクトルを第二変換して、出力映像とする復号装置と、を備えた映像処理システムにおける前記符号化装置であって、
入力映像の複数フレームの画素値ベクトルを画素位置ごとにパラメータによって前記第一変換する第一変換手段と、
前記第一変換手段による前記第一変換後の前記複数フレームの画素値ベクトルをフレーム単位でそれぞれ符号化して前記ビットストリームを生成する複数の映像符号化手段と、
前記入力映像の前記複数フレーム間の相関を解析し、その解析結果に応じて前記複数の映像符号化手段のうちの一つ以上による符号化処理と、前記第一変換手段における前記第一変換と、前記復号装置における前記第二変換を制御するパラメータをそれぞれ求める映像解析手段と、を備えることを特徴とする符号化装置。
前記映像解析手段が、少なくとも前記第一変換手段における前記第一変換を制御する互いに独立なパラメータを設定した複数の制御モードを有し、この複数の制御モードを前記入力映像の前記複数フレームに応じて切り替え、
前記複数の制御モードのうち一つ以上の制御モードについて、前記複数の映像符号化手段のうち少なくとも一方を制御する互いに独立なパラメータをさらに設定することを特徴とする請求項1に記載の符号化装置。
前記複数の映像符号化手段でそれぞれ生成されたフレーム単位の前記ビットストリームを入力し、前記復号装置における復号処理をそれぞれ前記フレーム単位で試行して、前記ビットストリームから前記フレームをそれぞれ復号する複数の局部映像復号手段と、
前記複数の局部映像復号手段で復号された前記複数のフレームに対し、前記復号装置における前記第二変換を試行して、変換後の前記複数フレームを前記映像解析手段に出力する局部第二変換手段と、を備え、
前記映像解析手段は、
前記局部第二変換手段による変換後の前記複数フレームを解析して、この解析結果に応じて前記復号装置における前記第二変換を制御するためのパラメータを最適化し、最適化したパラメータによって、前記復号装置における前記第二変換を制御することを特徴とする請求項1または請求項2に記載の符号化装置。
入力映像の画素値ベクトルを第一変換し、さらに、圧縮符号化してビットストリームとして伝送する符号化装置と、伝送されたビットストリームから前記画素値ベクトルを復号し、さらに、前記画素値ベクトルを第二変換して、出力映像とする復号装置と、を備えた映像処理システムにおける前記復号装置であって、
前記ビットストリームから前記複数のフレームをフレーム毎に復号する複数の映像復号手段と、
前記複数の映像復号手段で復号された前記複数フレームの画素位置毎に、前記符号化装置において変換された画素値ベクトルを前記第二変換する第二変換手段と、を備え、
前記第二変換手段は、前記符号化装置における変換で用いられたパラメータに対応するパラメータにしたがって前記第二変換することを特徴とする復号装置。
入力映像の画素値ベクトルを第一変換し、さらに、圧縮符号化してビットストリームとして伝送する符号化装置と、伝送された前記ビットストリームから前記画素値ベクトルを復号し、さらに、前記画素値ベクトルを前記第二変換して、出力映像とする復号装置と、を備えた映像処理システムであって、
請求項1から請求項3のいずれか一項に記載の符号化装置と、請求項4に記載の復号装置と、を備えることを特徴とする映像処理システム。
【発明を実施するための形態】
【0025】
以下、本発明の実施形態に係る映像処理システムについて図面を適宜参照して説明する。
図1に示すように、本発明の実施形態に係る映像処理システム1は、符号化装置2と復号装置3とを備える。符号化装置2は、映像遅延手段21と、映像解析手段22と、第一変換手段23と、複数の映像符号化手段24(
図1では、2つの映像符号化手段24−1および24−2)とを備えている。復号装置3は、複数の映像復号手段31(
図1では、2つの映像復号手段31−1および31−2)と、第二変換手段32と、切替手段33とを備えている。
【0026】
まず、符号化装置2の各構成について説明する。
映像遅延手段21は、外部から入力された映像解析手段22への入力映像のフレームを一時記憶することによって、映像解析手段22に対し過去のフレームを出力可能とするものである。
例えば、映像遅延手段21は、入力映像の現時点におけるフレームの一つ前の時点のフレームを記憶し、記憶したフレームを適宜タイミングで映像解析手段22に対し出力する。
映像遅延手段21は、例えば、入力映像が奇数フレームのときに、当該フレームを一時記憶し、一方、入力映像が偶数フレームのときに、当該フレームを映像解析手段22に出力する。なお、この動作タイミングの説明において、奇数を偶数に、偶数を奇数にそれぞれ読み替えても構わないものとする。
ここでは、外部からの入力映像は、3つの色成分を備えるものとする。この3つの色成分は、赤、緑、青(RGB)の3原色などとしてもよいし、輝度成分Yと2つの色差成分U,Vなどとしてもよい。
【0027】
映像解析手段22は、外部から入力映像の現時点におけるフレーム(現フレーム)を入力し、映像遅延手段21から、現時点の一つ前の時点におけるフレーム(前フレーム)を入力し、現フレームと前フレームとをまとめて解析するものである。
映像解析手段22は、フレーム単位で解析を実行してもよいし、フレームを分割した部分領域(例えばブロック)単位で解析を実行してもよい。
なお、ここでの「フレーム」には、イントラフレーム(Iフレーム)とインターフレーム(P,Bフレーム)のいずれをも含むものとする。
映像解析手段22は、例えば、入力映像の動きの度合い、色味や色の時間変換などを解析する。
【0028】
映像解析手段22は、入力映像の動きを判定する場合には、例えば、複数フレーム間の動きベクトルをブロック単位で求め、さらに、ブロック単位で求めた動きベクトルをブロック数で除算することで、動きベクトルの大きさの平均値を求める。そして、映像解析手段22は、当該平均値を予め設定した閾値と比較し、平均値が閾値を超えた場合には、入力映像に動きがあると判定する。なお、映像解析手段22は、複数フレーム間の動きベクトルを求めるのに代えて、複数フレーム間の画素値の差分値を求め、この差分値の平均値を閾値と比較することで、入力映像(現フレームと前フレーム)の動きの有無を判定してもよい。
【0029】
また、映像解析手段22は、入力映像の色味を判定する場合には、例えば、あるフレーム(例えば、現フレーム)を構成する各画素の色ベクトルについて分散共分散行列を求め、その固有値(各色成分の重み)に基づいて多くの色を含むか否かを判定する。
ここで、映像解析手段22が入力映像の色味を判定する方法について、
図2を参照して説明する。ここでは、入力映像の色成分が3つであるため、3つの固有値(λ
1〜λ
3、ここで、λ
1>λ
2>λ
3とする)に対し、それぞれ閾値θ
1〜θ
3(ここで、θ
1>θ
2>θ
3とする)を予め定め、固有値と対応する閾値とを比較した結果に基づいて、色味を判定する。なお、
図2に示した3つの軸は、入力映像の成分に応じて決定されるものであり、RGBの3成分であれば、それぞれR軸、G軸、B軸となり、YUVの3成分であれば、それぞれY軸、U軸、V軸となる。なお、
図2に示す図形は、3つの色成分の分布の様子をイメージとして示したものである。図形が点状の場合、入力映像が単色で表され、線状の場合、入力映像が単色のグラデーションで表され、面状の場合、入力映像が2色の混色で表され、立体状(球体状)の場合、入力映像が3色の混色で表されることを示している。
【0030】
例えば、映像解析手段22は、
図2(a)に示すように、最大固有値λ
1が対応する閾値θ
1より小さければ、分布が点状となり、単色に近くかつ平坦な絵柄であると判定する。つまり、最も色変化が大きい色変化軸上で色成分がどれだけ大きく変化したか(色成分の分散)を閾値との比較で判定するものとする。その結果、最大固有値λ
1が閾値θ
1より小さければ、最大固有値λ
1に対応する色成分であっても変化がごくわずかであるとわかることから、単色で表現でき、かつ、輝度値の変化も小さい平坦な絵柄であると判定できる。
【0031】
また、映像解析手段22は、
図2(b)に示すように、最大固有値λ
1が閾値θ
1より大きく、かつ、2番目に大きい固有値λ
2が対応する閾値θ
2より小さければ、分布が線状となり、単色のトーンのみに近い絵柄であると判定する。この場合、色味は単色であるが、最大固有値λ
1が閾値θ
1より大きいので、トーンが存在する(例えば、グラデーションのような一次元的な色空間上での分布が存在する)絵柄であると判定できる。
【0032】
さらに、映像解析手段22は、
図2(c)に示すように、最大固有値λ
1が閾値θ
1より大きく、かつ、2番目に大きい固有値λ
2が対応する閾値θ
2より大きく、かつ、最も小さい固有値λ
3が対応する閾値θ
3より小さければ、分布が面状となり、2色の混色で表現できる絵柄であると判定できる。この場合、最大固有値λ
1に対応する色成分と2番目に大きい固有値λ
2に対応する色成分の2色の混色で表現できる絵柄であると判定する。
【0033】
また、さらに、映像解析手段22は、
図2(d)に示すように、全ての固有値λ
1〜λ
3がそれぞれ対応する閾値θ
1〜θ
3以上である場合、分布が立体状となり、全ての色成分の混色であるカラフルな絵柄であると判定する。
【0034】
次に、映像解析手段22により、色の時間変化を判定する場合について説明する。
映像解析手段22は、例えば、複数のフレーム(例えば、現フレームと前フレーム)のそれぞれについて、平均色ベクトル(フレーム内の画素値ベクトルの平均)を求め、その平均色ベクトルの変化(例えば、平均色ベクトルの差分の絶対値)と予め設定した閾値とを比較し、平均色ベクトルの変化の大きさが閾値より大きい場合に、色の時間変化が大きいと判定できる。このように、
図2を参照して前記したように、1色ごとに色成分の変化をみるのではなく、3つの色成分の平均の変化をみることで、3つの色成分の全てについての時間変化の様子を判断することができる。
【0035】
再び
図1に戻って、映像解析手段22は、入力映像の解析結果に応じて、少なくとも第一変換手段23の第一変換処理をパラメータによって制御する。
例えば、映像解析手段22は、入力映像の解析結果に応じて、予め定めた複数の制御モードの中から最適な制御モードを設定し、その制御モードにおいて予め設定したパラメータにより、第一変換手段23の第一変換処理を制御する。なお、制御モードの内容については、後記する。
また、映像解析手段22は、第一変換手段23の第一変換処理を制御するパラメータに基づいて、復号装置3の第二変換手段32の第二変換処理を制御するパラメータを設定する。
【0036】
さらに、映像解析手段22は、制御モードの一つ以上において、複数の映像符号化手段24を制御するパラメータを設定してもよい。例えば、映像解析手段22は、各制御モードにおいて、第一変換手段23の第一変換処理を制御するパラメータに加えて、複数の映像符号化手段24の符号化処理を制御する符号化パラメータ(例えば、量子化パラメータおよびクロマサブサンプリングのフォーマット)をさらに設定することができる。
【0037】
本実施形態では、映像解析手段22において、例えば、
図3に示すように、第一変換手段23の第一変換処理を制御するパラメータ(およびこの第一変換手段23の第一変換処理を制御するパラメータに基づいて設定される復号装置3の第二変換手段32の第二変換処理を制御するパラメータ)と、複数の映像符号化手段24の符号化処理を制御する符号化パラメータとを定めた制御モードを複数設定している。このようにして設定された複数の制御モードは、後記する復号装置3の第二変換手段32にも、図示しない送信手段等を介して通知される。
【0038】
前記したように、映像遅延手段21は、入力映像が偶数フレームのときに当該フレームをそのまま映像解析手段22に出力するとともに、一時記憶した奇数フレームを映像解析手段22に出力するため、映像解析手段22は、映像遅延手段21への入力映像が奇数フレームのときは動作せず、偶数フレームのときのみ動作することになる。
したがって、映像解析手段22によってパラメータ制御される、後記する第一変換手段23、映像符号化手段24、および、復号装置3の第二変換手段32、さらに、映像符号化手段24と対となる復号装置3の映像復号手段31も、映像遅延手段21への入力映像が奇数フレームのときは動作せず、偶数フレームのときのみ動作することになる。
【0039】
ここで、映像解析手段22によるパラメータ制御の具体的な説明に先立ち、映像解析手段22によって制御される第一変換手段23について説明する。
第一変換手段23は、入力映像の複数のフレーム(例えば、現フレームと前フレーム)の画素位置毎の画素値ベクトルを、異なる色空間の画素値ベクトルに変換(第一変換)するものである。
第一変換手段23は、複数のフレームにわたる、ある画素位置(x,y)の画素値ベクトルを一つのベクトルzとして扱う。
以下では、入力映像の第fフレームの画素位置における画素値ベクトル(色ベクトル)をI(f,x,y)とおく。また、「複数のフレーム」のフレーム数が2であり、各フレームの画素値が3次元の画素値ベクトルである場合を例にとって説明する。
【0040】
例えば、第(2f−1)フレームおよび第(2f)フレームの画素値ベクトルをまとめたものをz(2f,x,y)とおくと、ベクトルz(2f,x,y)は、次の式(1)のように表される。
【0042】
さらに、例えば、画素値ベクトルがY,U,Vの3つの色成分からなる場合には、ベクトルz(2f,x,y)は、次の式(2)のように表される。
【0044】
なお、Y,U,Vの各成分は、前記したように、例えば、Yが輝度成分を、U,Vが式差成分を表してもよいし、Y,U,Vがそれぞれ3原色(緑、青、赤)の各1色成分を表してもよい。
第一変換手段23は、次の式(3)に示すように、ベクトルzを異なる色空間に属するベクトルwに変換する。この第一変換手段23でのベクトル関数hによる変換は、映像解析手段22で設定されたパラメータθによって制御される。
【0046】
なお、ベクトル関数hを、次の式(4)に示すように、行列Mとベクトルaによる線形変換によって表現してもよい。
【0048】
前記式(4)におけるベクトルaは、行列Mによるベクトルzの変換結果が負の値とならないように、または、正の値に近づけるように調整するためのものである。
ここで、パラメータθは、行列Mおよびベクトルaを特定するための情報であり、例えば、行列Mおよびベクトルaの各成分そのものとすることができる。すなわち、例えば、行列Mが6行6列の行列であり、ベクトルaが6次元のベクトルである場合、パラメータθは、次の式(5)に示すように表される。
【0050】
つまり、パラメータθを前記式(5)に示すような42次元のベクトルとして定義することができる。
【0051】
なお、ベクトルaは、ベクトルMzの結果の各成分の値域が映像符号化手段24の想定する範囲に収まるように(またはこの想定する範囲を逸脱することが少なくなるように)設定することが好ましい。例えば、映像符号化手段24によって、8ビット(値域0乃至255)の映像しか扱えない場合に、ベクトルMzの結果の各成分の値域が0乃至255を超えてしまう(例えば値域−50乃至300など)と、映像符号化手段24において、アンダーフローやオーバーフローを生じ符号化劣化の要因となる。そのため、ベクトルaを調整することで、ベクトルMzの結果の各成分の値域が8ビットの範囲内に収まるように調整することとした。
【0052】
ここで、ベクトルwの次元をD(ここでは、D=6)としたとき、ベクトルMzは、次の式(6)で表される。
【0054】
このとき、ベクトルaは、例えば、次の式(7)のように設定することができる。
【0056】
このように最小値と最大値の中点(平均値)に予め定めた値r
1〜r
Dを加算することで、求める値域に近づけることができる。例えば、複数の映像符号化手段24でそれぞれ8ビットの映像しか処理できない場合、0〜255の値域で出力を得ることが望ましい。そのため、例えば、値r
1〜r
Dを、128などと設定することで、ベクトルMzの結果の各成分の値域を複数の映像符号化手段24での処理が可能な範囲とすることができる。
【0057】
以上説明したような、第一変換手段23による第一変換後の画素値ベクトルwは、複数の映像符号化手段24(映像符号化手段24−1および24−2)にそれぞれ出力される。
【0058】
再び、映像解析手段22の説明に戻り、映像解析手段22により、第一変換手段23のパラメータθ(つまり、例えば、前記式(4)の行列Mやベクトルa)を制御する方法の一例について
図3(とくに
図3の「第一変換」の列)を参照し、各制御モードと各制御モードに応じたパラメータθの設定例(ここでは行列Mとして表記)と、それに応じた第一変換手段23の挙動について説明する。
【0059】
図3に示すように、制御モード1(無変換)においては、行列Mは、左上および右下の3行3列の部分行列はそれぞれ単位行列に設定され、左下および右上の3行3列はそれぞれ零行列に設定される。つまり、行列Mは、6行6列の単位行列に設定される。制御モード1では、第一変換手段23により、色変換やフレーム間の変換をせずに、現フレームおよび前フレームがそのまま映像符号化手段24に出力される。
【0060】
次に、制御モード2(色変換)においては、行列Mは、左上および右下の3行3列の部分行列はそれぞれ色変換行列C
1およびC
2に設定され、左下および右上の3行3列の部分行列をそれぞれ零行列に設定される。つまり、第一変換手段23により、前フレームに対しては、色変換行列C
1で色変換し、現フレームに対しては、色変換行列C
2で色変換する。なお、色変換行列C
1と色変換行列C
2とを同一としても構わない。
【0061】
制御モード2において、色変換行列C
1は、例えば、前フレームの主成分分析によって決定することができる。すなわち、前フレームを構成する各画素の画素値ベクトル(色ベクトル)のフレーム内全体における統計量(例えば、分散・共分散行列や相関行列)を求め、これに基づいて主成分分析して主成分ベクトルを求め、第1乃至第3主成分ベクトルをそれぞれ行ベクトルとしたものを色変換行列C
1の第1乃至第3行とすることで、色変換行列C
1を設定する。
【0062】
また、制御モード2において、色変換行列C
2は、例えば、現フレームの主成分分析によって決定することができる。すなわち、現フレームを構成する各画素の画素値ベクトル(色ベクトル)のフレーム内全体における統計量(例えば、分散・共分散行列や相関行列)を求め、これに基づいて主成分分析して主成分ベクトルを求め、第1乃至第3主成分ベクトルをそれぞれ行ベクトルとしたものを色変換行列C
2の第1乃至第3行とすることで、色変換行列C
2を設定する。
【0063】
色変換行列C
1と色変換行列C
2とを同一とする場合には、例えば、前記したような方法で求めた色変換行列C
1(または色変換行列C
2)を、色変換行列C
1(または色変換行列C
2)の両方に設定すればよい。
【0064】
または、色変換行列C
1と色変換行列C
2とを同一とする場合に、例えば、現フレームおよび前フレームをまとめて主成分分析して、一つの色変換行列を決定してもよい。
すなわち、現フレームおよび前フレームを構成する各画素の画素値ベクトル(色ベクトル)の2フレーム内全体における例えば、分散・共分散行列や相関行列)を求め、これに基づいて主成分分析を行って主成分ベクトルを求め、第1乃至第3主成分ベクトルをそれぞれ行ベクトルとしたものを色変換行列C
1=色変換行列C
2の第1乃至第3行とすることで、色変換行列C
1と色変換行列C
2を設定する。
【0065】
制御モード3(時間差分)においては、行列Mは、左上および右下の3行3列の各部分行列は単位行列に設定され、左下の3行3列の部分行列は、単位行列の(−1)倍に設定され、右上の3行3列の部分行列は零行列に設定される。制御モード3では、第一変換手段23により、現フレームおよび前フレームに対し色変換やフレーム間の変換がされず、現フレームから前フレームを減じた差分画像(各画像の同一画素位置の画素毎の画素値ベクトルの差分を取った結果画像)が生成される。これにより、前フレームと、現フレームから前フレームを減じた差分画像とが、映像符号化手段24に出力される。
【0066】
制御モード4(色変換・時間差分)において、行列Mは、左上の3行3列の部分行列は、色変換行列C
1、右下の3行3列の部分行列は、色変換行列C
2、左下の3行3列の部分行列は色変換行列(−C
2)、右上の3行3列の部分行列は、零行列に設定される。色変換行列C
1およびC
2の設定方法は、制御モード2の場合と同様である。制御モード4では、第一変換手段23により、前フレームを色変換行列C
1で色変換し、前フレームおよび現フレームを色変換行列C
2で色変換する。これにより、色変換行列C
1で色変換された前フレームと、色変換行列C
2で色変換された現フレームから色変換行列C
2で色変換された前フレームを減じた差分画像とが映像符号化手段24に出力される。
【0067】
制御モード5(主成分分析)においては、行列Mの第k行目(ここでは、kは1以上6以下の整数)を行ベクトルv
kTとおく(v
kを列ベクトルとし、上付きのTは転置を示すものとする)。制御モード5では、第一変換手段23により、現フレームおよび前フレームを行ベクトルv
kTで変換する。この変換結果が、映像符号化手段24に出力される。
【0068】
制御モード6(主成分分析・切り捨て)においては、行列Mの第k行目(ここでは、kは1以上K以下の整数、Kは5以下の整数)を行ベクトルv
kTとおき、第K行目乃至第6行目は、6次元の零ベクトル(行ベクトル)とおく。
図3に示す例では、K=4とした。制御モード6と制御モード6´との違いは、制御モード6の出力が6次元(ただし、下位2成分はいずれも0)である一方で、制御モード6´の出力が4次元である点である。制御モード6と制御モード6´の使い分けについては、詳しくは後記する。
【0069】
制御モード5および制御モード6におけるベクトルv
kは、例えば、前フレームおよび現フレームの同一画素位置の画素値ベクトルをまとめた6次元のベクトルz(2f,x,y)を画面内の複数の画素位置(例えば、画面内全ての画素位置)について、統計量(例えば、ベクトルzの分散・共分散行列または相関行列)を計算により求め、当該統計量に基づいて主成分分析を適用することで得られた第k主成分ベクトルであるものとする。
【0070】
なお、制御モード6の代わりに、制御モード6´(主成分分析・切り捨て)を実装しても構わない。制御モード6´は、行列Mの第k行目(ここでは、kは1以上K以下の整数、Kは5以下の整数)を行ベクトルv
kTとおいたK行6列の行列である。制御モード6´においては、好ましくはK=4とする。
【0071】
次に、映像解析手段22によってパラメータ制御される複数の映像符号化手段24(ここでは、映像符号化手段24−1および24−2)について説明する。
複数の映像符号化手段24は、後記する復号装置3の複数の映像復号手段31と対をなしている。ここでは、映像符号化手段24と、復号装置3の映像復号手段31との対の個数が2個であるものとする。つまり、映像符号化手段24−1は、復号装置3の映像復号手段31−1と対をなし、映像符号化手段24−2は、復号装置3の映像復号手段31−2と対をなしている。
【0072】
映像符号化手段24−1および24−2は、第一変換手段23による第一変換後の画素値ベクトルwをそれぞれ入力し、入力された画素値ベクトルwの異なる一部分を圧縮符号化し、ビットストリームを生成する。
このようにして、生成されたビットストリームは、図示しない通信手段等を介して、復号装置3の映像復号手段31−1または31−2に伝送される。
【0073】
ここで、映像符号化手段24−1および24−2は、同一の符号化方式であっても、異なる符号化方式であっても構わない。符号化方式は、例えば、MPEG−1、MPEG−2、MPEG−4、MPEG−4 AVC|H.264、Motion JPEGなど既存の動画像符号化方式であってもよいし、JPEGなどの静止画の符号化方式であっても構わない。
ただし、前記したような映像符号化手段24−1および24−2の符号化方式は、復号装置3の映像復号手段31−1および31−2のいずれか一方または両方が非可逆な復号方式であるときに、とくに好適である。
【0074】
また、映像解析手段22は、前記したように、各制御モードにおいて、映像符号化手段24−1および24−2を制御する符号化パラメータをさらに設定する。
次に、映像解析手段22による、
図3の「映像符号化手段24−1」および「映像符号化手段24−2」列を参照して、各制御モードにおける符号化パラメータ(ここでは、量子化パラメータQPおよびクロマサブサンプリングのフォーマット)の設定例について説明する。
【0075】
図3に示すように、映像解析手段22は、各制御モードにおいて、量子化パラメータQPとして、Q「QP小」、「QP中」、「QP大」のいずれかを設定し、クロマサブサンプリングとして、4:4:4フォーマットまたは4:0:0フォーマットのいずれかを設定している。
【0076】
ここで、量子化パラメータQPである「QP小」、「QP中」、「QP大」の示す意味について、
図4を参照してさらに説明する。
図4に示すように、量子化パラメータQPに付される小、中、大とは、量子化ステップの細かさを示しており、「QP小」が最も量子化ステップが細かく(画質が高い)、「QP大」が最も量子化ステップが粗い(画質が低い)ことを示している。
この量子化パラメータの設定方法は、
図4に示すように、様々とすることができる。例えば、
図4(1)に示すように、「QP大」、「QP中」、「QP小」の絶対的な値をそれぞれ定めておいてもよいし、
図4(2)に示すように、「QP大」、「QP中」、「QP小」間の相対的な差分を設定してもよいし、
図4(3)に示すように、「QP大」、「QP中」、「QP小」間の取り得る値の組み合わせの集合を定めてもよい。
【0077】
図4(2)のように相対的な差分を与えるやり方によると、バッファの状況等に応じてトータルのビットレートを制御するために、全体的な量子化パラメータQPの制御が必要となる場合に、「QP大」、「QP中」、「QP小」の関係性を保ったまま、それぞれの値を変更することができる点で優れている。例えば、映像符号化手段24−1における量子化パラメータQPを「QP小」とし、映像符号化手段24−2における量子化パラメータQPを「QP大」とした場合、映像符号化手段24−1に入力される3成分は手厚く(細かく)伝送し、映像符号化手段24−2に入力される3成分は映像符号化手段24−1に入力される3成分に比べて手薄く(粗く)伝送する、といった関係性を保ったまま「QP小」または「QP大」そのものの値を変更できる。
【0078】
再び
図3を参照し、各制御モードにおいて設定した、映像符号化手段24−1および24−2の量子化パラメータQPの具体的な内容について説明する。
【0079】
図3に示すように、制御モード1では、映像符号化手段24−1および24−2の両方で量子化パラメータQPを「QP中」としている。これは、制御モード1では、第一変換手段23において、現フレームおよび前フレームに対し何ら変換を施さないため、現フレームと前フレームとの重要度に差が少ないといえる。そのため、制御モード1では、映像符号化手段24−1と映像符号化手段24−2の量子化パラメータQPを同等としたものである。
【0080】
制御モード2では、映像符号化手段24−1および24−2の両方で量子化パラメータQPを「QP中」としている。制御モード2では、第一変換手段23において、現フレームを色変換行列C
2で色変換するとともに、前フレームを色変換行列C
1で色変換しているので、制御モード1における場合と同様に、現フレームと前フレームとの重要度に差が少ないといえるためである。
【0081】
制御モード3では、映像符号化手段24−1の量子化パラメータQPを「QP小」とし、映像符号化手段24−2の量子化パラメータQPを「QP大」としている。ここで、制御モード3では、第一変換手段23において、現フレームから前フレームを減じた差分画像を生成している。例えば、この差分画像を映像符号化手段24−1で処理し、前フレームを映像符号化手段24−2で処理することで、より重要度が高い差分画像を手厚く符号化することができる。
【0082】
制御モード4では、映像符号化手段24−1の量子化パラメータQPを「QP小」とし、映像符号化手段24−2の量子化パラメータQPを「QP大」としている。ここで、制御モード4では、第一変換手段23において、前フレームを色変換行列C
1で色変換するとともに、前フレームおよび現フレームを色変換行列C
2で色変換して現フレームから前フレームを減じた差分画像を生成している。例えば、この色変換後の前フレームを映像符号化手段24−2で処理し、差分画像を映像符号化手段24−1で処理することで、より重要度が高い差分画像を手厚く符号化することができる。
【0083】
制御モード5では、映像符号化手段24−1の量子化パラメータQPを「QP小」とし、映像符号化手段24−2の量子化パラメータQPを「QP大」としている。ここで、制御モード5では、第一変換手段23において、現フレームおよび前フレームをまとめて主成分分析して第1〜第6主成分を得ている。例えば、この第1〜第3主成分を映像符号化手段24−1で処理し、第4〜第6主成分を映像符号化手段24−2で処理することで、より重要度が高い第1〜第3主成分を手厚く符号化することができる。
【0084】
制御モード6および6´では、映像符号化手段24−1の量子化パラメータQPを「QP小」とし、映像符号化手段24−2の量子化パラメータQPを「QP大」としている。ここで、制御モード6および6´では、第一変換手段23において、現フレームおよび前フレームをまとめて主成分分析して第1〜第6主成分(制御モード6´では第4〜第D主成分)を得ている。この結果の第1〜3主成分を映像符号化手段24−1で処理し、第4〜第6主成分(制御モード6´では第4〜第D主成分)を映像符号化手段24−2で処理することで、より重要度が高い第1〜第3主成分を手厚く符号化することができる。
【0085】
次に、各制御モード1〜6(6´)において設定した、映像符号化手段24−1および24−2のクロマサブサンプリングのフォーマットの内容について説明する。
制御モード1〜6では、映像符号化手段24−1および24−2の両方で、クロマサブサンプリングのフォーマットを4:4:4と設定している。
一方、制御モード6´では、映像符号化手段24−1のクロマサブサンプリングのフォーマットを4:4:4と設定し、映像符号化手段24−2のクロマサブサンプリングのフォーマットを4:0:0と設定している。
【0086】
つまり、制御モード6と制御モード6´とでは、映像符号化手段24−1と映像符号化手段24−2に対するクロマサブサンプリングのフォーマットの設定の仕方が異なる。
ここで、制御モード6と制御モード6´は、前記したように、第一変換手段23で用いる行列Mの内容が異なる。つまり、制御モード6では、行列Mの第k行目(kは1以上K以下の整数、Kは5以下の整数)を行ベクトルv
ktとおき、第K行目乃至第6行目を6次元の零ベクトルとしている。一方で、制御モード6´では、行列Mの第k行目(kは1以上K以下の整数、Kは5以下の整数)を行ベクトルv
ktとおいたK行6列の行列である。このように、制御モード6および6´は、いずれも下位主成分を切り捨てている点では共通するが、制御モード6では、第K〜第6主成分に対し0を割り当てている一方で、制御モード6´では、第K〜第6主成分を完全に無いものとしている点で相違する。ただし、結果としては、第一変換手段23で制御モード6および6´にしたがって変換を行って得られた画像は、いずれもモノクロ画像とみなして扱うことができるものである。
【0087】
しかし、映像符号化手段24−1および24−2において、モノクロ画像、カラー画像の別に応じて、クロマサブサンプリングのフォーマットを切り替えることが困難な場合もある。そのため、制御モード6および6´を設け、制御モード6では、モノクロ画像であっても、映像符号化手段24−1および24−2においてカラー画像とみなして符号化処理させることとし、一方、制御モード6´では、モノクロ画像をモノクロ画像のまま映像符号化手段24−1および24−2において符号化処理させることとした。
【0088】
次に、映像解析手段22において設定された各制御モード1〜6(6´)のそれぞれに適した映像例について、
図3の「好適な映像」列を参照して説明する。
図3に示すように、制御モード1は、動きが大きくカラフルなシーンの映像の処理に好適である。これは、制御モード1は、色相関や時間相関を考慮せず、現フレームと前フレームに対し何ら変換を行わないためである。
制御モード2は、動きが大きく色の偏ったシーンの映像の処理に好適である。これは、制御モード2が現フレームと前フレームの色変換を行うためである。例えば、夕焼けのシーンなどに特に有効である。
制御モード3は、動きが小さくカラフルなシーンの映像の処理に好適である。これは、制御モード3が現フレームと前フレームとの時間差分をとるためである。
制御モード4は、動きが小さく色の偏ったシーンの映像の処理に好適である。これは、制御モード4が現フレームと前フレームの色変換を行い、さらに、現フレームと前フレームとの時間差分をとるためである。
制御モード5は、動きが小さくカラフルで色が時間変換するシーンの映像の処理に好適である。これは、制御モード5が、現フレームと前フレームとを主成分分析して得られた各主成分の重みに応じて色変換を行うためである。例えば、音楽ステージのような、照明は変化するが物体の動きは少ないシーンなどに特に有効である。
制御モード6および6´は、動きが小さく色の偏った色が時間変換するシーンの映像の処理に好適である。これは、制御モード6および6´が現フレームと前フレームとを主成分分析して得られた結果から、上位主成分のみについて色変換を行うためである。
【0089】
さらに、映像解析手段22における各制御モードの設定例を、
図5に示した。
図5に示すように、映像解析手段22は、入力映像の「色味」と「動き」という2つの要素により映像を判別し、さらに、「色味」の中で、時間変化の大小、および、色味の偏りの有無を判別し、「動き」の中で動きの大小(静動)を判別することによって、入力映像に適した制御モードを設定する。
【0090】
再び
図1を参照する。映像解析手段22は、前記したように、現フレームと前フレームの画像または画像列を解析することによって、制御モード1〜6(6´)の中から好適な制御モードを設定する。そして、選択された制御モードに応じたパラメータθは、第一変換手段23に出力され(
図1における○囲みのAの信号線経由)、符号化パラメータは、映像符号化手段24−1および24−2にそれぞれ出力される(
図1における○囲みのBおよびCの信号線経由)。
【0091】
また、映像解析手段22によって選択された制御モードについての情報と、この制御モードにおいて設定された第一変換手段23の第一変換処理を制御するパラメータθに対応する、第二変換手段32の第二変換処理制御するためのパラメータφとは、例えば、次に説明する映像符号化手段24−1および24−2で生成されるビットストリームのサイド情報として、復号装置3に伝送することができる(
図1では、映像解析手段22から第二変換手段32へ向かう矢印で表している)。なお、サイド情報は、いずれかの映像符号化手段24−1で生成されるビットストリームに付加すればよい。また例えば、制御モードについての情報とパラメータφとを、映像解析手段22から、図示しない送信手段等を介して、復号装置3の第二変換手段32に直接伝送することとしてもよい。
【0092】
次に、映像符号化手段24−1および24−2で行われる具体的な処理の内容について説明する。
前記したように、映像符号化手段24−1および24−2は、第一変換手段23による第一変換結果である画素値ベクトルw(2f,x,y)のそれぞれ別の一部分を、映像解析手段22から符号化パラメータにしたがって符号化するものである。
例えば、画素値ベクトルwがD次元(Dは、4以上の整数)である場合に、次の式(8)に示すように、映像符号化手段24−1は、画素値ベクトルw(2f,x,y)の第1乃至第3成分からなる画素値ベクトルw
1(2f,x,y)を、映像符号化手段24−2は、画素値ベクトルw(2f,x,y)の第4乃至第D成分からなるベクトルw
2(2f,x,y)を、それぞれ符号化する。
【0094】
映像符号化手段24−1,24−2が、画素値ベクトルwのそれぞれどの部分を符号化するかについての割り振りは、前記した式(8)に示すように、予め定めておいてもよいし、その都度、手動で設定してもよい。
映像符号化手段24−1および24−2は、符号化して生成したビットストリームを、図示しない通信手段等を介して、復号装置3の映像復号手段31−1または31−2にそれぞれ伝送する。
ここでは、映像符号化手段24−1および24−2で生成されたビットストリームには、サイド情報として、映像解析手段22で選択された制御モードの情報と、第二変換手段32による第二変換処理を制御するためのパラメータφとが含まれるものとする。
【0095】
次に、復号装置3の各構成について説明する。
映像復号手段31−1および31−2は、それぞれ対となる符号化装置2の映像符号化手段24−1または24−2から、図示しない受信手段等を介してビットストリームをそれぞれ受信し、このビットストリームを復号して、フレーム毎の映像信号を得る。ここでは、映像復号手段31−1で現フレームの映像信号が復号され、映像復号手段31−2において、前フレームの映像信号が復号される。なお、いずれかのビットストリームにサイド情報が付加されている場合、このサイド情報もさらに復号して、符号化装置2の第一変換手段23による第一変換処理で用いられた制御モードの情報と、第二変換手段32における第二変換処理を制御するためのパラメータφとを得る。このようにして得られたフレーム毎の映像信号と、制御モードの情報と、パラメータφとは、第二変換手段32に出力される。
【0096】
ここでは、映像復号手段31−1から出力される映像信号の第2fフレーム、画像座標(x,y)における画素値ベクトルをw
1´(2f,x,y)とおく。また、映像復号手段31−2から出力される映像信号の第2f−1フレーム、画像座標(x,y)における画素値ベクトルをw
2´(2f−1,x,y)とおく。
【0097】
第二変換手段32は、映像復号手段31−1および31−2でそれぞれ復号されたフレーム毎の映像信号(ここでは、画素値ベクトルw
1´およびw
2´)を入力するとともに、選択された制御モードの情報および変換のためのパラメータφを入力し、制御モードの情報を必要に応じて参照して、フレーム毎の映像信号(ここでは、画素値ベクトルw
1´およびw
2´)を、変換のためのパラメータφによって変換(第二変換)するものである。
【0098】
第二変換手段32は、映像復号手段31−1から、第2fフレーム、画像座標(x,y)における画素値ベクトルw
1´(2f,x,y)を入力するとともに、映像復号手段31−2から、第2f−1フレーム、画像座標(x,y)における画素値ベクトルをw
2´(2f−1,x,y)を入力し、次の式(10)に示すように、これらの画素値ベクトルw
1´(2f,x,y)と画素値ベクトルw
2´(2f−1,x,y)とを合成して画素値ベクトルw´(2f,x,y)とする。そして、第二変換手段32は、画素値ベクトルw´(2f,x,y)に対し、次の式(9)に示すような変換γを施して、画素値ベクトルz´(2f,x,y)を得る。このように、第二変換手段32における第二変換処理は、符号化装置2の第一変換手段23により、入力映像から第一変換された異なる色空間の画素値ベクトルを再変換して、元の色空間の画素値ベクトルを復元するものである。
【0100】
ここで、第二変換手段32は、前記式(9)により画素値ベクトルw´(2f,x,y)に変換を施すときのベクトルz´を、次の式(11)に示すように、ベクトルbと行列Lとによる線形変換によることができる。
【0102】
ここで、式(9)におけるパラメータφは、前記式(11)に示した行列Lとベクトルbとを特定するための情報であり、例えば、行列Lとベクトルbの各成分そのものとすることができる。
【0103】
例えば、前記した符号化装置2の第一変換手段23が前記式(4)に示す線形変換を行い、当該線形変換における行列Mが正則である場合(
図3の例では制御モード1〜5に該当する場合)には、パラメータφを構成する行列Lとベクトルbを、例えば、次の式(12)に示すように設定することができる。
【0105】
この場合、第二変換手段32による前記式(10)を用いた変換は、符号化装置2の第一変換手段23による前記式(4)を用いた変換の逆変換に相当する。
【0106】
一方、第二変換手段32は、制御モードの情報を参照した結果、前記式(4)における行列Mが正則でない場合(
図3の例では制御モード6に該当する場合)には、符号化装置2の第一変換手段23による変換の逆変換を行うことができない。また、
図3に示した制御モード6´の行列Mは正方行列ではないから、正則ではない。したがって、第二変換手段32は、符号化装置2の第一変換手段23による変換の逆変換を行うことができない。
【0107】
そこで、第二変換手段32は、符号化装置2の映像解析手段22により選択された制御モードの情報を参照し、符号化装置2の第一変換手段23において制御モード6による変換が行われたことを確認した場合、パラメータφを構成する行列Lを制御モード5の行列M(これを行列M
5とおく)の逆行列M
5−1としたり、逆行列M
5−1の部分行列を含む行列としたりすることができる。行列Lが制御モード5の行列Mの逆行列M
5−1の部分行列を含む例としては、次の式(13)に示すような形が挙げられる。
【0109】
前記式(13)では、行列Lを、制御モード5の行列Mの逆行列M
5−1そのものではなく、第5,6成分については、0となるように設定している。これは、符号化装置2の映像符号化手段24−1,24−2により行われる符号化処理において、本来の入力映像には含まれないノイズ(符号化劣化)が生じる場合があるためである。そのため、符号化装置2の第一変換手段23による第一変換処理で用いることを前提として設定した制御モード5の行列Mの逆行列M
5−1そのものを、第二変換手段32において、符号化劣化を含んだ画素値ベクトルw´(2f,x,y)に乗算すると、符号化劣化をより強調させるおそれがあり、好ましくない。
そのため、ここでは、第二変換手段32による第二変換処理で用いる行列Lを、制御モード5の行列Mの逆行列M
5−1の部分行列とし、第5,6成分、つまり、ノイズのような重要でない成分については、値が0となるように設定することとした。
【0110】
また、第二変換手段32は、映像解析手段22から送られたモード情報を参照し、第一変換手段23において制御モード6´による変換が実行されていることを確認した場合、行列Lを、制御モード5の行列Mの逆行列M
5−1の部分行列とすることができる。行列Lを制御モード5の行列Mの逆行列M
5−1の部分行列とする例としては、次の式(14)に示すような形が挙げられる。
【0112】
第二変換手段32による第二変換後のベクトルz´は、切替手段33に出力される。
【0113】
切替手段33は、第二変換手段32から出力されたベクトルz´を構成する一部の成分からなる画像と、残りの成分からなる画像とを時間的に多重化(逆多重)し、出力映像I´として出力するものである。
切替手段33は、例えば、次の式(15)に示すように、ベクトルz´の列ベクトルの上半分で構成される画像を出力映像の第2f−1フレームI´(2f−1,x,y)として出力し、また、ベクトルz´の列ベクトルの残りの下半分で構成される画像に切り替えて出力映像の第2fフレームI´(2f,x,y)として出力する。
【0115】
次に、本発明の実施形態に係る映像処理システム1の動作について、
図6を参照して説明する。ここでは、映像処理システム1は、符号化装置2の映像解析手段22によって、2フレーム単位で解析する場合を例にとって説明する。
図6に示すように、映像処理システム1は、符号化装置2の映像遅延手段21によって、外部から映像を入力し、この入力映像を遅延させる(ステップS1)。つまり、映像処理システム1は、符号化装置2の映像遅延手段21によって現時点の1つ前の時点におけるフレーム(ここでは、1フレーム目のフレーム)を入力し、これを一時記憶する。
映像処理システム1は、符号化装置2の映像遅延手段21によって、次のフレーム、つまり現時点におけるフレーム(2フレーム目のフレーム)が入力された段階で、一時記憶した1フレーム目のフレームを、映像解析手段22に出力する(ステップS2)。
【0116】
次に、映像処理システム1は、符号化装置2の映像解析手段22によって、現時点のフレーム(ここでは、2フレーム目のフレーム。以下、現フレーム)を入力するとともに、映像遅延手段21から現時点の1つ前の時点におけるフレーム(ここでは、1フレーム目のフレーム。以下、前フレーム)を入力し、現フレームと前フレームとを合わせて解析する(ステップS3)。映像処理システム1は、符号化装置2の映像解析手段22によって、現フレームと前フレームの解析結果に基づいて予め定めた複数の制御モードの中から1つの制御モードを選択し、その制御モードにおいて予め定めたパラメータをパラメータ制御する各手段にそれぞれ出力する。具体的には、映像処理システム1は、符号化装置2の映像解析手段22によって、第一変換手段23にパラメータθを出力し、複数の映像符号化手段24(映像符号化手段24−1および24−2)に符号化パラメータを出力する。さらに、映像処理システム1は、符号化装置2の映像解析手段22によって、映像符号化手段24−1または24−2に、復号装置3の第二変換手段の第二変換処理を制御するパラメータφと、第一変換手段23の第一変換処理を制御するために選択した制御モードについての情報とを出力する。
【0117】
さらに、映像処理システム1は、符号化装置2の第一変換手段23によって、外部から現フレームを入力するとともに、映像遅延手段21から前フレームを入力し、さらに、映像解析手段22からパラメータθを入力し、現フレームと前フレームとを合わせた画素値ベクトルzを、パラメータθによって画素値ベクトルwに変換(第一変換)する(ステップS4)。映像処理システム1は、符号化装置2の第一変換手段23によって、変換後の画素値ベクトルwを複数の映像符号化手段24にそれぞれ出力する。
【0118】
続いて、映像処理システム1は、符号化装置2の映像符号化手段24−1によって、第一変換手段23から第一変換後の画素値ベクトルw
1を入力するとともに、映像解析手段22から符号化パラメータを入力し、この符号化パラメータに応じて画素値ベクトルw
1を圧縮符号化して、ビットストリームを生成する。また、映像処理システム1は、符号化装置2の映像符号化手段24−2によって、第一変換手段23から第一変換後の画素値ベクトルw
2を入力するとともに、映像解析手段22から符号化パラメータを入力し、この符号化パラメータに応じて画素値ベクトルw
2を圧縮符号化して、ビットストリームを生成する。さらに、映像処理システム1は、符号化装置2の映像符号化手段24−1または24−2によって、映像解析手段22で選択された制御モードについての情報と、パラメータφとをサイド情報としてビットストリームに付加する(ステップS5)。
映像処理システム1は、符号化装置2の映像符号化手段24−1および24−2によって、生成したビットストリームを、図示しない通信手段等を介して、対になる復号装置3の映像復号手段31−1および31−2にそれぞれ伝送する。
【0119】
続いて、映像処理システム1は、復号装置3の映像復号手段31−1および31−2によって、対になる符号化装置2の映像符号化手段24−1または24−2からビットストリームをそれぞれ入力して、このビットストリームをそれぞれ復号し、映像信号(画素値ベクトルw
1´またはw
2´)を得る。さらに、映像処理システム1は、復号装置3の映像復号手段31−1または31−2によって、ビットストリームに付加されたサイド情報を復号して、符号化装置2の映像解析手段22で選択された制御モードについての情報と、パラメータφとを得る(ステップS6)。映像処理システム1は、復号装置3の映像復号手段31−1および31−2によって、復号後の映像信号(画素値ベクトルw
1´およびw
2´)と、パラメータφと制御モードについての情報とを第二変換手段32に出力する。
【0120】
さらに、映像処理システム1は、復号装置3の第二変換手段32によって、映像復号手段31−1または31−2からそれぞれ映像信号(画素値ベクトルw
1´またはw
2´)と、パラメータφと、符号化装置2の映像解析手段22で選択された制御モードについての情報とを入力する。これとともに、映像処理システム1は、復号装置3の第二変換手段32によって、画素値ベクトルw
1´と画素値ベクトルw
2´とを合成して画素値ベクトルw´とし、この画素値ベクトルw´を、制御モードについての情報を参照しつつパラメータφにしたがって変換(第二変換)し、画素値ベクトルz´とする(ステップS7)。映像処理システム1は、復号装置3の第二変換手段32によって、第二変換後の画素値ベクトルz´を、切替手段33に出力する。
【0121】
そして、映像処理システム1は、復号装置3の切替手段33によって、第二変換手段32から画素値ベクトルz´を入力し、画素値ベクトルz´を構成する一部の成分からなる画像と、残りの成分からなる画像とを時間的に多重化して、出力映像I´を出力する(ステップS8)。
そして、映像処理システム1は、動作時点を一つ進め(ステップS9)、ステップS1〜S8を繰り返す。
映像処理システム1は、以上のように動作する。
【0122】
以上説明した映像処理システム1によれば、映像解析手段22が、入力映像の色味や動きに関する情報に基づいて、第一変換手段23、複数の映像符号化手段24および第二変換手段32をパラメータ制御することとした。つまり、映像処理システム1によれば、映像解析手段22で入力映像の色味や動きを解析し、その結果に設定されたパラメータに基づいて、第一変換手段23が、画素値ベクトルの統計的性質を調整する変換を行い、映像符号化手段24が、ビットストリームを生成する。また、映像処理システム1によれば、復号装置3の映像復号手段31が、ビットストリームの復号を行い、第二変換手段32が、復号後の画素値ベクトルの再変換を行う。このような映像処理システム1によれば、これら一連の動作により、映像の色味や動きに応じた情報配分を適切に行って、複数の映像符号化手段24により映像を伝送することができるので、符号化効率を向上することができる。
【0123】
次に、前記実施形態の映像処理システム1の変形例に係る映像処理システム1Aについて、
図7を参照して説明する。
ここで、前記実施形態の映像処理システム1においては、復号装置3の第二変換手段32を、符号化装置2の第一変換手段23に直接連動させているが、これに限られるものではなく、また、符号化装置2の第一変換手段23のみに連動させる必要はない。例えば、第二変換手段32による第二変換は、第一変換手段23、映像符号化手段24−1および24−2、映像復号手段31−1および31−2、および、第二変換手段32の総体によって得られる映像フレームが、入力映像の対応する時刻のフレームを近似するよう、第二変換手段32を制御するパラメータを設定してもよい。このとき、第二変換手段32による第二変換は、画像の場所や時刻毎に異なる変換式を適用するような適応処理によっても構わない。
ここでは、その具体例として、前記実施形態の変形例に係る映像処理システム1Aについて、以下に説明する。
【0124】
図7に示すように、映像処理システム1Aは、符号化装置2Aと復号装置3とを備え、符号化装置2Aが、映像遅延手段21と、映像解析手段22Aと、第一変換手段23と、複数の映像符号化手段24(
図7では、映像符号化手段24−1および24−2)と、複数の局部映像復号手段25(
図7では、局部映像復号手段25−1および25−2)と、局部第二変換手段26と、を備え、復号装置3が、複数の映像復号手段31(
図7では、映像復号手段31−1および31−2)と、第二変換手段32と、切替手段33と、を備えている。
【0125】
変形例に係る映像処理システム1Aは、符号化装置2Aが、前記実施形態に係る映像処理システム1の符号化装置2に対し、映像解析手段22に代えて映像解析手段22Aを備え、複数の局部映像復号手段25(
図7では、局部映像復号手段25−1および25−2)と、局部第二変換手段26とをさらに備える点で相違する。
【0126】
この映像処理システム1Aは、復号装置3における複数の映像復号手段31による復号処理と、第二変換手段32による第二変換処理とを、符号化装置2Aで模擬的に試行することで、符号化装置2Aの映像符号化手段24−1および24−2で行った符号化により生じた画質の劣化が、復号装置3の複数の映像復号手段31による復号処理および第二変換手段32による第二変換処理後の出力映像にどのように現れるのかを予め確認することを可能とする。この映像処理システム1Aは、この試行結果を反映して、復号装置3の第二変換手段32を制御するパラメータφを最適化し、その最適化したパラメータφによって、第二変換手段32の第二変換処理を制御可能とする点にとくに意義がある。
【0127】
以下では、変形例に係る映像処理システム1Aにおいて、前記実施形態に係る映像処理システム1との相違点である映像解析手段22Aと、複数の局部映像復号手段25(
図7では、局部映像復号手段25−1および25−2)と、局部第二変換手段26とについて主に説明する。なお、以下の説明において、前記実施形態に係る映像処理システム1と、変形例に係る映像処理システム1Aとで共通する構成には同一の符号を付し、重複する説明を省略する。
【0128】
複数の局部映像復号手段25−c(cは、1以上C以下の整数。Cは2以上の整数。例えば、C=2)は、前記実施形態で説明した復号装置3の複数の映像復号手段31−c(cは、1以上C以下の整数。Cは2以上の整数。例えば、C=2)と同様に動作する。ここでは、局部映像復号手段25−1または25−2は、対応する映像符号化手段24−1または24−2から、前記した実施形態と同様にして生成されたビットストリームを入力し、このビットストリームとサイド情報とを復号して、画素値ベクトルw
1´およびw
2´と、第一変換手段23での第一変換処理に用いられた制御モードについての情報と、第二変換手段32の第二変換処理を制御するためのパラメータφとを得る。なお、複数の局部映像復号手段25は、復号装置3の複数の映像復号手段31と復号方法は異なっていてもよいが、入出力関係は同一であるものとする。
【0129】
局部第二変換手段26は、局部映像復号手段25−1および25−2の復号結果を、復号装置3の第二変換手段32と同様にパラメータφにより変換することで、復号装置3の第二変換手段32による第二変換処理を試行するものである。局部第二変換手段26は、前記実施形態で説明した復号装置3の第二変換手段32と同様に動作する。つまり、局部第二変換手段26は、局部映像復号手段25−1から画素値ベクトルw
1´を入力し、局部映像復号手段25−2から画素値ベクトルw
2´を入力する。また、局部第二変換手段26は、局部映像復号手段25−1または25−2から、パラメータφと制御モードについての情報とを入力する。そして、局部第二変換手段26は、画素値ベクトルw
1´と画素値ベクトルw
2´とを合成して画素値ベクトルw´とし、画素値ベクトルw´を、パラメータφによって変換する。なお、局部第二変換手段26は、復号装置3の第二変換手段32による第二変換と変換方法は異なっていてもよいが、入出力関係は同一であるものとする。
【0130】
映像解析手段22Aは、入力映像(例えば、現フレーム)と映像遅延手段21からの遅延された入力映像(例えば、前フレーム)と、局部第二変換手段26からの出力(
図7に示す例では、2系統の映像フレームからなる)とを比較し、その比較結果に基づいて、第一変換手段23と、映像符号化手段24−1および24−2と、局部第二変換手段26とをパラメータ制御するものである。
【0131】
また、映像解析手段22Aは、外部からの入力映像(現フレーム)と映像遅延手段21からの遅延された入力映像(前フレーム)と、局部第二変換手段26からの出力(2系統の映像フレームからなる)との間の誤差が小さくなるように、第一変換手段23のパラメータθ(
図7の○囲みのAの信号線経由)、映像符号化手段24−1および24−2の符号化パラメータ(
図7の○囲みのBおよびCの信号線経由)、および、局部第二変換手段26のパラメータ(
図7の○囲みのDの信号線経由)を調整して、パラメータφを最適化するものである。このようにして、局部第二変換手段26を制御するパラメータを調整した結果から決定された最適なパラメータφは、復号装置3の第二変換手段32に通知される(
図7の○囲みのEの信号線経由)。
例えば、パラメータφが最適化された時点で、映像符号化手段24−1または24−2で生成されるビットストリームのサイド情報として、図示しない通信手段等を介して、対応する復号装置3の映像復号手段31−1または31−2に伝送することで、復号装置3の第二変換手段32に通知してもよい。また例えば、パラメータφが最適化された時点で、図示しない通信手段等を介して、映像解析手段22Aから、復号装置3の第二変換手段32に直接伝送してもよい。
【0132】
映像解析手段22Aが、第一変換手段23、映像符号化手段24−1および24−2を制御する方法は、前記の「外部からの入力映像と映像遅延手段21からの遅延された入力映像と、局部第二変換手段26からの出力(2系統の映像フレームからなる)との間の誤差が小さくなるよう」にする最適化によらずに、前記した実施形態において説明した映像解析手段22と同様の方法によって、単に、第一変換手段23、映像符号化手段24−1および24−2を制御するパラメータをそれぞれ決定するものであってもよい。
【0133】
次に、映像解析手段22Aが、復号装置3の第二変換手段32を制御するパラメータφを最適化する方法について、以下に説明する。
なお、復号装置3の第二変換手段32は、前記したように、符号化装置2Aの局部第二変換手段26を制御するパラメータを調整した結果から決定した最適なパラメータφを用いて変換処理を実行するものとする。
【0134】
局部第二変換手段26(局部第二変換手段26−1および26−2)は、局部映像復号手段25−1および25−2による復号結果を、復号装置3の第二変換手段32と同様に、パラメータφにより変換する。
ここでの復号結果とは、前記実施形態において説明したのと同様に、映像解析手段22Aによって、入力映像が解析され、第一変換手段23によって、パラメータθによって入力映像が変換され、映像符号化手段24−1および24−2によって生成されたビットストリームを、それぞれ対応する局部映像復号手段25−1または25−2によって復号したものである。
【0135】
局部第二変換手段26−1および26−2は、次の式(16)に示すように、局部映像復号手段25−1および25−2で復号された映像(画素値ベクトルw
1´およびw
2´)にパラメータφによる変換γを施し、その結果I
φ(2f)およびI
φ(2f−1)を得る。このようにして得られたI
φ(2f)およびI
φ(2f−1)は、映像解析手段22Aに出力される。
【0137】
映像解析手段22Aは、局部第二変換手段26からの出力画像I
φ(2f)およびI
φ(2f−1)を入力画像の現フレームI(2f)および前フレームI(2f−1)と比較し、その結果に応じて、パラメータφを調整する。例えば、映像解析手段22Aは、次の式(17)や式(18)に定義する評価関数E(φ)を最小化するようパラメータφを調整する。
【0140】
例えば、映像解析手段22Aは、複数の異なるパラメータφに対する前記式(17)や、前記式(18)の評価を試行しながら、評価関数E(φ)が最小となるパラメータφを探索する。
また、例えば、映像解析手段22Aは、非線形最小二乗法によって、前記式(17)を最適化するパラメータφを探索してもよい。
【0141】
このような最適化処理、つまり、第一変換手段23による第一変換処理と、映像符号化手段24−1および24−2による符号化処理と、局部映像復号手段25−1および25−2による模擬的な復号処理と、局部第二変換手段26−1および26−2による模擬的な第二変換処理と、映像解析手段22Aによる解析処理とは、パラメータφが最適化されるまで繰り返し行われる。
【0142】
復号装置3の第二変換手段32は、符号化装置2Aの映像解析手段22Aからの「評価関数E(φ)を最小化するパラメータφ」の通知を受けたタイミングで、映像復号手段31−1および31−2で復号された画素値ベクトルw
1´およびw
2´を、この「評価関数E(φ)を最小化するパラメータφ」により変換する。なお、このとき、符号化装置2Aの映像解析手段22Aからの「評価関数E(φ)を最小化するパラメータφ」の通知を受けるタイミングと、映像復号手段31−1および31−2から復号された画素値ベクトルw
1´およびw
2´とを入力するタイミングがずれる場合があるため、タイムスタンプ等を用いた一般的な手法により、適宜、タイミング合わせを行うものとする。
【0143】
次に、変形例に係る映像処理システム1Aの動作について、
図8を参照して説明する。
図8に示すように、映像処理システム1Aは、符号化装置2Aの映像遅延手段21によって、外部から映像のフレームを入力し、この入力映像のフレーム(前フレーム)を一時記憶して遅延させる(ステップS11)。
映像処理システム1Aは、符号化装置2Aの映像遅延手段21によって、現時点におけるフレーム(現フレーム)が入力された段階で、一時記憶した前フレームを、映像解析手段22Aに出力する(ステップS12)。
【0144】
次に、映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、2フレーム分の映像を解析する(ステップS13)。
映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、外部から現フレームを入力するとともに、映像遅延手段21から前フレームを入力し、現フレームと前フレームとを合わせて解析する。映像処理システム1Aは、符号化装置2Aの映像解析手段22によって、現フレームと前フレームとの解析結果に基づいて予め定めた複数の制御モードの中から1つの制御モードを選択し、その制御モードにおいて予め定めたパラメータをパラメータ制御する各手段にそれぞれ出力する。具体的には、映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、第一変換手段23にパラメータθを出力し、複数の映像符号化手段24(映像符号化手段24−1および24−2)に符号化パラメータを出力する。
【0145】
さらに、映像処理システム1Aは、符号化装置2Aの第一変換手段23によって、外部から現フレームを入力し、映像遅延手段21から前フレームを入力するとともに、映像解析手段22Aからパラメータθを入力し、現フレームと前フレームとをまとめた画素値ベクトルzをパラメータθによって変換して画素値ベクトルwとする(ステップS14)。映像処理システム1Aは、第一変換手段23によって、この画素値ベクトルwの一部分である画素値ベクトルw
1を映像符号化手段24−1に出力し、および、この画素値ベクトルwの他の一部分である画素値ベクトルw
2を映像符号化手段24−2に出力する。
【0146】
そして、映像処理システム1Aは、符号化装置2Aの映像符号化手段24−1によって第一変換手段23から第一変換後の画素値ベクトルw
1を入力するとともに、映像解析手段22Aから符号化パラメータを入力して、符号化パラメータに応じて画素値ベクトルw
1を圧縮符号化してビットストリームを生成する。また、映像処理システム1Aは、符号化装置2Aの映像符号化手段24−2によって第一変換手段23から第一変換後の画素値ベクトルw
2を入力するとともに、映像解析手段22Aから符号化パラメータを入力して、符号化パラメータに応じて画素値ベクトルw
2を圧縮符号化してビットストリームを生成する(ステップS15)。このとき、映像処理システム1Aは、符号化装置2Aの映像符号化手段24−1または24−2のいずれか一方は、パラメータφと制御モードについての情報とをサイド情報として付加したビットストリームを生成する。映像処理システム1Aは、符号化装置2Aの映像符号化手段24−1および24−2において生成したビットストリームを、符号化装置2Aの局部映像復号手段25−1および25−2に出力する。
【0147】
続いて、映像処理システム1Aは、符号化装置2Aの局部映像復号手段25−1および25−2によって、図示しない受信手段等を介して、符号化装置2Aの映像符号化手段24−1および24−2からビットストリームをそれぞれ入力し、このビットストリームをそれぞれ復号して、画素値ベクトルw
1´またはw
2´を得る(ステップS16)。映像処理システム1Aは、符号化装置2Aの局部映像復号手段25−1および25−2によって、復号した画素値ベクトルw
1´またはw
2´を局部第二変換手段26にそれぞれ出力する。なお、ビットストリームにサイド情報が付加されている場合、併せて復号し、パラメータφと制御モードについての情報を得る。
【0148】
さらに、映像処理システム1Aは、符号化装置2Aの局部第二変換手段26によって、局部映像復号手段25−1および25−2から画素値ベクトルw
1´またはw
2´を入力するとともに、映像解析手段22Aからパラメータφおよび制御モードについての情報を入力し、この画素値ベクトルw
1´またはw
2´に対し、パラメータφによる変換を施して、出力画像I
φ(2f)およびI
φ(2f−1)を得る(ステップS17)。映像処理システム1Aは、符号化装置2Aの局部第二変換手段26によって、出力画像I
φ(2f)およびI
φ(2f−1)を映像解析手段22Aに出力する。
【0149】
そして、映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、局部第二変換手段26から、出力画像I
φ(2f)およびI
φ(2f−1)を入力し、この出力画像I
φ(2f)およびI
φ(2f−1)を前記式(17)や(18)により評価することで、「評価関数E(φ)を最小化するパラメータφ」を探索する。(ステップS18)。
【0150】
映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、パラメータφが最適化されたか否かを判定する(ステップS19)。そして、映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、パラメータφが最適化されたと判定した場合(ステップS19でYes)、探索結果にかかる「評価関数E(φ)を最小化するパラメータφ」を、最適化されたパラメータφとして映像符号化手段24−1または24−2に出力する。
一方、映像処理システム1Aは、符号化装置2Aの映像解析手段22Aによって、パラメータφが最適化されていないと判定した場合(ステップS19でNo)、ステップS13に戻る。
【0151】
映像処理システム1Aは、符号化装置2Aの映像符号化手段24−1または24−2によって、映像解析手段22Aから最適化されたパラメータφを入力し、当該最適化されたパラメータφを入力した映像符号化手段24−1または24−2において、ステップS15において予め生成したビットストリームに、最適化されたパラメータφと、第一変換手段23による第一変換処理で用いられた制御モードについての情報とをサイド情報としてさらに付加する。そして、映像処理システム1Aは、符号化装置2Aの映像符号化手段24−1および24−2によって、それぞれ生成したビットストリームを、図示しない通信手段等を介して、復号装置3のそれぞれ対応する映像復号手段31−1または31−2に伝送する(ステップS20)。
【0152】
次に、映像処理システム1Aは、復号装置3の映像復号手段31−1および31−2によって、図示しない受信手段等を介して、符号化装置2Aのそれぞれ対応する映像符号化手段24−1または24−2からビットストリームを受信する(ステップS21)。
そして、映像処理システム1Aは、復号装置3の映像復号手段31−1および31−2によって、受信したビットストリームをそれぞれ復号して、映像信号(画素値ベクトルw
1´およびw
2´)と、最適化されたパラメータφと、制御モードについての情報とを得る(ステップS22)。映像処理システム1Aは、復号装置3の映像復号手段31−1および31−2によって、復号した映像信号(画素値ベクトルw
1´およびw
2´)と、最適化されたパラメータφと、制御モードについての情報とを第二変換手段32に出力する。
【0153】
そして、映像処理システム1Aは、復号装置3の第二変換手段32によって、映像復号手段31−1および32−2から画素値ベクトルw
1´およびw
2´と制御モードの情報と、最適化されたパラメータφとを入力する。映像処理システム1Aは、復号装置3の第二変換手段32によって、入力した画素値ベクトルw
1´と画素値ベクトルw
2´とを合成して画素値ベクトルw´とし、この画素値ベクトルw´を、最適化されたパラメータφによって再変換(第二変換)し、画素値ベクトルz´とする(ステップS23)。映像処理システム1Aは、復号装置3の第二変換手段32によって、画素値ベクトルz´を切替手段33に出力する。
【0154】
そして、映像処理システム1Aは、復号装置3の切替手段33によって、第二変換手段32から画素値ベクトルz´を入力し、この画素値ベクトルz´を構成する一部の成分からなる画像と、残りの成分からなる画像とを時間的に多重化して、出力映像I´を出力する(ステップS24)。
そして、映像処理システム1Aは、動作時点を一つ進め(ステップS25)、ステップS11〜S24を繰り返す。映像処理システム1Aは、以上のように動作する。
【0155】
以上説明した映像処理システム1Aによれば、符号化装置2Aにおいて、復号装置3の映像復号手段31−1および32−2で行われる復号処理、および、第二変換手段32で行われる第二変換処理を模擬的に試行することで、符号化装置2Aの映像符号化手段24−1および24−2で行った符号化により生じた画質の劣化が、復号装置3の第二変換手段32による第二変換結果にどのように現れるかを予め確認することができる。そして、映像処理システム1Aによれば、符号化装置2Aにおける確認結果に応じて、復号装置3の第二変換手段32の第二変換処理を制御するパラメータφを、符号化による劣化の影響を抑制するように最適化することで、画質劣化の少ない出力画像を得ることが可能となる。
【0156】
以上説明した本発明の実施形態および変形例では、映像処理システム1,1Aにおいて、符号化装置2の映像解析手段22,22Aが、入力映像を2フレーム単位で解析する場合を例にとって説明したが、本発明はこれに限られない。例えば、本発明の映像処理システムにおいて、符号化装置の入力映像をNフレーム(Nは2以上の自然数)とし、映像解析手段が、このNフレームをまとめて解析しても構わない。
【0157】
本発明の映像処理システムにおいて、符号化装置の入力映像をNフレームとする場合、映像遅延手段はN−1段とし、第一変換手段は1個、映像符号化手段はM個(Mは2以上N以下の自然数)、復号装置の映像復号手段は映像符号化手段と同数のM個、第二変換手段は1個とする。符号化装置において、第n番目の映像符号化手段がC
m色成分(4:4:4,4:2:2,4:2:0においては、C
m=3色、4:0:0においては、C
m=1色)からなる映像を符号化する場合には、第一変換手段は、3N次元のベクトル入力を、Σ[m=1→M]C
m次元のベクトルへ変換して出力する。一方、復号装置において、第二変換手段は、Σ[m=1→M]C
m次元のベクトル入力を、3N次元のベクトルへ変換して出力する。このような映像処理システムにおいては、符号化装置の映像解析手段、第一変換手段、各映像符号化手段、復号装置の各映像復号手段および第二変換手段は、Nフレームに1度だけ動作する。
【0158】
例えば、
図9に、N=3、M=2,C
1=C
2=3の場合に適用される映像処理システムの構成を示した。
図9に示す映像処理システム1Bは、符号化装置2Bと復号装置3とを備えて構成される。符号化装置2Bは、2個(N−1個)の映像遅延手段21−1,21−2と、映像解析手段22と、1個の第一変換手段23と、M個(2個)の映像符号化手段24−1,24−2を備え、復号装置3は、M個(2個)の映像復号手段31−1,31−2と、1個の第二変換手段32と、出力手段33とを備える。つまり、映像処理システム1Bは、
図1を参照して説明した映像処理システム1に対し、符号化装置の映像遅延手段の数が異なる。
【0159】
このような映像処理システム1Bは、符号化装置2Bが、入力映像の1フレーム目を、映像遅延手段21−1および映像解析手段22によって入力し、映像遅延手段21−1によって一時記憶する。続いて、映像処理システム1Bは、符号化装置2Bが、入力映像の1フレーム目を、映像遅延手段21−1および映像解析手段22によって入力し、映像遅延手段21−1が1フレーム目を映像遅延手段21−2および映像解析手段22に出力するとともに、2フレーム目を一時記憶する。これによって、映像遅延手段21−1は、2フレーム目を一時記憶し、映像遅延手段21−2は1フレーム目を一時記憶する。
【0160】
そして、符号化装置2Bが、入力映像の3フレーム目(Nフレーム目)を、映像遅延手段21−1および映像解析手段22によって入力し、映像遅延手段21−1が2フレーム目を映像遅延手段21−2および映像解析手段22に出力するとともに、3フレーム目を一時記憶する。また、映像遅延手段21−2が1フレーム目を映像解析手段22に出力するとともに、2フレーム目を一時記憶する。
【0161】
前記したように、映像処理システムにおいて、符号化装置の映像解析手段、第一変換手段、各映像符号化手段、復号装置の各映像復号手段および第二変換手段は、Nフレームに1度だけ動作する。そのため、映像処理システム1Bは、符号化装置2Bの映像解析手段22が、3フレーム目(Nフレーム目)を入力すると、1〜3フレームを合わせて解析する。映像処理システム1Bにおいて、その他の構成および動作は、
図1を参照して説明した映像処理システム1と同様である。また、映像処理システム1Bは、入力映像の4フレーム目以降も、同様に動作する。
【0162】
また例えば、
図10に、N=3、M=3,C
1=C
2=3の場合に適用される映像処理システムの構成を示した。
図10に示す映像処理システム1Cは、符号化装置2Cと復号装置3Cとを備えて構成される。符号化装置2Bは、2個(N−1個)の映像遅延手段21−1,21−2と、映像解析手段22と、1個の第一変換手段23と、M個(3個)の映像符号化手段24−1,24−2,24−3を備え、復号装置は、M個(3個)の映像符号化手段31−1,31−2,31−3と、1個の第二変換手段32と、出力手段33とを備える。つまり、映像処理システム1Cは、
図1を参照して説明した映像処理システム1に対し、符号化装置の映像遅延手段の数と映像符号化手段の数および復号装置の映像復号手段の数が異なる。
【0163】
なお、
図10に示したように、符号化装置2Cの映像解析手段22によって、第一変換手段23、映像符号化手段24−1,24−2,24−3(映像復号手段31−1,31−2,31−3)および第二変換手段32がパラメータ制御される。映像処理システム1Cにおいて、その他の構成および動作は、
図1を参照して説明した映像処理システム1と同様である。また、映像処理システム1Cは、入力映像の4フレーム目以降も、同様に動作する。
このように、本発明の映像処理システムは、入力するフレーム数に応じて構成を適宜変更することができるので、様々な映像に対応させることができ、利便性が高い。
【0164】
前記した映像処理システム1,1A,1B,1Cは、それぞれ、コンピュータにおいて各手段における処理を実行可能に記述したプログラム(映像符号化プログラム)とすることも可能である。この場合、各映像符号化プログラムは、対応する装置と同様の効果を奏する。