(58)【調査した分野】(Int.Cl.,DB名)
前記視覚特性検出部は、前記評価画像の動きベクトルを、該評価画像の1フレーム前の評価画像を参照画像とする動き推定により生成する注視領域検出部を備えることを特徴とする、請求項1に記載の客観画質評価装置。
【発明を実施するための形態】
【0018】
本発明に係る客観画質評価装置は、評価画像及び該評価画像の原画像を入力し、視覚特性を考慮して評価画像の客観画質評価値を出力するものである。評価画像は、原画像を符号化して復号するなどにより、原画像に対して画質の劣化が生じた画像である。本発明では、通常の手法により算出した客観画質評価値を、評価画像の動きベクトルに関する情報、又は評価画像のブロック歪量に関する情報を含む視覚特性情報に基づいて修正する。
【0019】
(第1の実施形態)
以下、本発明の第1の実施形態について、図面を参照して詳細に説明する。第1の実施形態では、原画像及び評価画像は動画像である。
【0020】
図1は、本発明の一実施形態に係る客観画質評価装置の構成例を示すブロック図である。
図1に示す例では、客観画質評価装置1は、画像分割部10と、客観画質評価値算出部20と、視覚特性検出部30と、客観画質評価値修正部40とを備える。
【0021】
画像分割部10は、評価画像を複数のブロックに分割してブロック評価画像を生成し、客観画質評価値算出部20と視覚特性検出部30とに出力する。また、画像分割部10は、原画像を複数のブロックに分割してブロック原画像を生成し、客観画質評価値算出部20に出力する。ブロック評価画像とブロック原画像のサイズは同じサイズであり、以下、「ブロックサイズ」と称する。ブロックサイズは、例えば32×32画素や64×64画素とする。ブロックサイズはあらかじめ決定されていてもよいし、外部からブロックサイズの情報を入力してもよい。
【0022】
客観画質評価値算出部20は、画像分割部10により生成されたブロック評価画像とブロック原画像とを入力し、ブロックごとに客観画質評価値を算出し、客観画質評価値修正部40に出力する。客観画質評価値は、例えばMSE,PSNR又はSSIMとする。
【0023】
視覚特性検出部30は、第1の実施形態ではブロックごとの動きベクトルを生成する。
図1に示す例では、視覚特性検出部30は注視領域検出部31を備える。
【0024】
注視領域検出部31は、画像分割部10により生成されたブロック評価画像と、該ブロック評価画像の1フレーム前の評価画像とを入力する。そして、注視領域検出部31は、ブロック評価画像を基準画像とし、1フレーム前の評価画像を参照画像として、ブロックマッチングによる動き推定を行い、動きベクトルに関する情報(注視領域情報)を生成し、客観画質評価値修正部40に出力する。
【0025】
注視領域検出部31が出力する注視領域情報は、動きベクトルの大きさを示す情報とすることができる。また、注視領域情報は、動きベクトルの大きさが閾値Thを超えるか否か(すなわち、注視領域であるか否か)を示す情報とすることができる。動きベクトルの大きさが閾値Th以下である場合には、該評価画像は静領域であるため、注視領域(映像中で人間が注視する領域)ではないと判定する。一方、動きベクトルの大きさが閾値Thを超える場合には、該評価画像は動領域であるため、注視領域であると判定する。閾値Thは、例えば画面を2秒で横切る速い動きとする。その場合、HDTVだと閾値Th=1920[画素]/(60[フィールド/秒]×2[秒])=16[画素/フィールド]となる。
【0026】
客観画質評価値修正部40は、客観画質評価値算出部20により算出されたブロックごとの客観画質評価値に、注視領域検出部31により生成された注視領域情報に応じた係数αを乗じ、ブロックごとに修正された客観画質評価値を算出する。そして、評価画像に対する最終的な客観画質評価値(修正客観画質評価値)を算出し、外部に出力する。
【0027】
具体的には、客観画質評価値算出部20の算出する客観画質評価値がブロックごとのMSEである場合、客観画質評価値修正部40は、ブロックごとのMSEに係数αをかけて各ブロックのMSE修正値を算出する。つぎに、各ブロックのMSE修正値をフレーム内の全ブロックについて合計してフレーム単位のMSE修正値を算出した後、式(1)により、フレーム単位のPSNR修正値を算出し、修正客観画質評価値として出力する。
【0028】
また、客観画質評価値算出部20の算出する客観画質評価値がブロックごとのPSNRである場合、客観画質評価値修正部40は、ブロックごとのPSNRに係数αをかけて各ブロックのPSNR修正値を算出する。ここから直接フレーム単位のPSNRは算出できないため、いったん式(1)により、ブロックごとにPSNR修正値に基づくMSE修正値を算出する。つぎに、各ブロックのMSE修正値をフレーム内の全ブロックについて合計してフレーム単位のMSE修正値を算出した後、再度式(1)により、フレーム単位のPSNR修正値を算出し、修正客観画質評価値として出力する。
【0029】
つぎに、客観画質評価値算出部20の算出する客観画質評価値がMSEである場合の係数αについて説明する。注視領域情報が注視領域であるか否かを示す情報である場合、注視領域情報が注視領域であることを示していればMSEに係数α1を乗算し、注視領域情報が注視領域でないことを示していればMSEにα1よりも大きい係数α2を乗算する。また、注視領域情報が動きベクトルの大きさを示す情報である場合、MSEに動きベクトルの大きさと負の相関を有する係数α3を乗算する。なお、客観画質評価がMSEの場合は、客観画質評価値修正部40は、係数乗算後のMSEを用いて、式(1)によりPSNRを算出する。
【0030】
また、客観画質評価値算出部20の算出する客観画質評価値がPSNR又はSSIMである場合の係数αについて説明する。注視領域情報が注視領域であるか否かを示す情報である場合、注視領域情報が注視領域であることを示していればPSNR又はSSIMに係数α4を乗算し、注視領域情報が注視領域でないことを示していればPSNR又はSSIMにα4よりも小さい係数α5を乗算する。また、注視領域情報が動きベクトルの大きさを示す情報である場合、PSNR又はSSIMに動きベクトルの大きさと正の相関を有する係数α6を乗算する。
【0031】
上述したように、本実施形態の客観画質評価装置1は、画像分割部10により評価画像及び該評価画像の原画像を複数のブロックに分割してブロックサイズのブロック評価画像及びブロック原画像を生成する。そして、客観画質評価値算出部20によりブロック評価画像及びブロック原画像から、ブロックごとに評価画像の客観画質評価値を算出し、視覚特性検出部30により評価画像の動きベクトルに関する情報を生成する。最後に、客観画質評価値修正部40により客観画質評価値を視覚特性情報に基づいて修正する。このようにして、客観画質評価装置1は、評価画像の動きベクトルに基づく視覚特性を考慮することにより、主観評価に近い客観画質評価値を測定することができるようになる。
【0032】
(第2の実施形態)
つぎに、本発明の第2の実施形態について、図面を参照して詳細に説明する。第2の実施形態では、原画像及び評価画像は、静止画像であってもよいし、動画像であってもよい。
【0033】
図2は、第2の実施形態に係る客観画質評価装置2の構成例を示すブロック図である。視覚特性検出部30以外の構成については、第1の実施形態と同一である。
【0034】
画像分割部10は、評価画像を複数のブロックに分割しブロックサイズのブロック評価画像を生成し、客観画質評価値算出部20と視覚特性検出部30とに出力する。また、画像分割部10は、原画像を複数のブロックに分割してブロックサイズのブロック原画像を生成し、客観画質評価値算出部20と視覚特性検出部30とに出力する。
【0035】
客観画質評価値算出部20は、画像分割部10により生成されたブロック評価画像とブロック原画像とを入力し、ブロックごとに客観画質評価値を算出し、客観画質評価値修正部40に出力する。
【0036】
視覚特性検出部30は、第2の実施形態ではブロックごとのブロック歪量を生成する。
図2に示す例では、視覚特性検出部30は、差分画像生成部32と、LPC解析部33と、ブロック歪量検出部34とを備える。
【0037】
差分画像生成部32は、画像分割部10により生成されたブロック評価画像とブロック原画像との画素ごとの絶対値差分値を画素値とするブロック差分画像を生成し、LPC解析部33に出力する。
【0038】
LPC解析部33は、差分画像生成部32により生成されたブロック差分画像の水平方向及び垂直方向にLPC解析を適用して、ブロックごとのLPCスペクトル包絡を示す情報であるLPCスペクトル包絡情報を生成し、ブロック歪量検出部34に出力する。LPC解析は、音声認識の分野でスペクトル包絡を求めるのに用いられており、人間の声が声帯振動と声道からなると定義してスペクトル包絡を求めることで、声帯振動による音の強さと周波数、声道共振によるフォルマントを効果的に表現できる。本発明ではこれを画像のブロック歪解析に応用することにより、画像が映像信号とブロック歪雑音からなると定義してスペクトル包絡を求めることで、評価画像に含まれるブロック歪(周期的位相位置のインパルス成分)のレベル及びブロックサイズを効果的に表現することを可能とした。
【0039】
図3は、LPC解析部33により生成されるLPCスペクトル包絡情報の例を示す図である。ここでは、水平方向又は垂直方向のLPCスペクトル包絡情報をグラフ化して表示しており、横軸を周波数、縦軸をレベルとしている。LPCスペクトル包絡情報のピークは、ブロック差分画像に含まれるブロック歪の周期ごとに現れ、その値はブロック歪がインパルスに近いほど、つまり画像に対して目立ちやすいほど、横軸(周波数軸)の高い値まで大きくなる。ブロックサイズをa×a画素とすると、スペクトルのピークは水平周波数方向及び垂直周波数方向にaサンプル間隔で現れる。
【0040】
ブロック歪量検出部34は、LPC解析部33により生成されるLPCスペクトル包絡情報に基づいて、ブロックごとのスペクトルの振幅の大きさをブロック歪量として算出し、ブロック歪量に関する情報(ブロック歪量情報)を客観画質評価値修正部40に出力する。例えば、ブロック歪量検出部34は、aサンプル間隔で現れるスペクトルのピーク値の合計値をブロック歪量とする。なお、ブロックサイズはあらかじめ決定されていてもよいし、外部からブロックサイズの情報を入力してもよい。
【0041】
客観画質評価値修正部40は、客観画質評価値算出部20により算出されたブロックごとの客観画質評価値に、視覚特性検出部30により生成されたブロック歪量情報に応じた係数βを乗じて修正し、ブロックごとに修正された客観画質評価値を算出する。そして、評価画像に対する最終的な客観画質評価値(修正客観画質評価値)を外部に出力する。
【0042】
例えば、客観画質評価値算出部20の算出する客観画質評価値がMSEである場合、MSEにブロック歪量と正の相関を有する係数β1を乗算する。また、客観画質評価値がPSNR又はSSIMである場合、PSNR又はSSIMにブロック歪量と負の相関を有する係数β2を乗算する。
【0043】
上述したように、本実施形態の客観画質評価装置2は、画像分割部10により評価画像及び該評価画像の原画像を複数のブロックに分割してブロックサイズのブロック評価画像及びブロック原画像を生成する。そして、客観画質評価値算出部20によりブロック評価画像及びブロック原画像から、ブロックごとに評価画像の客観画質評価値を算出し、視覚特性検出部30により評価画像のブロック歪量に関する情報を生成する。最後に、客観画質評価値修正部40により客観画質評価値を視覚特性情報に基づいて修正する。このようにして、客観画質評価装置2は、評価画像のブロック歪量に基づく視覚特性を考慮することにより、主観評価に近い客観画質評価値を測定することができるようになる。
【0044】
(第3の実施形態)
つぎに、本発明の第3の実施形態について、図面を参照して詳細に説明する。第3の実施形態では、原画像及び評価画像は動画像である。
【0045】
図4は、第3の実施形態に係る客観画質評価装置3の構成例を示すブロック図である。視覚特性検出部30以外の構成については、第1の実施形態及び第2の実施形態と同一である。
図4に示す例では、視覚特性検出部30は、注視領域検出部31と、差分画像生成部32と、LPC解析部33と、ブロック歪量検出部34とを備える。
【0046】
画像分割部10は、評価画像を複数のブロックに分割しブロックサイズのブロック評価画像を生成し、客観画質評価値算出部20と注視領域検出部31と、差分画像生成部32とに出力する。また、画像分割部10は、原画像を複数のブロックに分割してブロックサイズのブロック原画像を生成し、客観画質評価値算出部20と差分画像生成部32とに出力する。
【0047】
客観画質評価値算出部20は、画像分割部10により生成されたブロック評価画像とブロック原画像とを入力し、ブロックごとに客観画質評価値を算出し、客観画質評価値修正部40に出力する。
【0048】
視覚特性検出部30は、第3の実施形態ではブロックごとの動きベクトル及びブロック歪量を生成する。
図3に示す例では、視覚特性検出部30は注視領域検出部31と、差分画像生成部32と、LPC解析部33と、ブロック歪量検出部34とを備える。
【0049】
注視領域検出部31は、第1の実施形態と同様に、ブロック評価画像を基準画像とし、1フレーム前の評価画像を参照画像として、ブロックマッチングによる動き推定を行い、注視領域情報を客観画質評価値修正部40に出力する。
【0050】
差分画像生成部32は、第2の実施形態と同様に、画像分割部10により生成されたブロック評価画像とブロック原画像との画素ごとの絶対値差分値を画素値とするブロック差分画像を生成し、LPC解析部33に出力する。LPC解析部33は、第2の実施形態と同様に、差分画像生成部32により生成されたブロック差分画像にLPC解析を水平方向及び垂直方向に適用してLPCスペクトル包絡情報を生成し、ブロック歪量検出部34に出力する。ブロック歪量検出部34は、第2の実施形態と同様に、LPC解析部33により生成されるLPCスペクトル包絡情報に基づいて、ブロック歪量情報を生成し、客観画質評価値修正部40に出力する。
【0051】
客観画質評価値修正部40は、客観画質評価値算出部20により算出されたブロックごとの客観画質評価値に、注視領域検出部31により生成された注視領域情報に応じた係数α、及びブロック歪量検出部34により生成されたブロック歪量情報に応じた係数βを乗じ、ブロックごとに修正された客観画質評価値を算出する。そして、評価画像に対する最終的な客観画質評価値(修正客観画質評価値)を外部に出力する。
【0052】
客観画質評価値算出部20が算出する客観画質評価値がMSEの場合の係数について説明する。注視領域情報が注視領域であるか否かを示す情報である場合、注視領域情報が注視領域であることを示していれば係数αをα1(例えば0.8)とし、注視領域情報が注視領域でないことを示していれば係数αをα1よりも大きな値であるα2(例えば0.95)とする。また、係数βは、ブロック歪量と正の相関を有する値とする。例えば、係数βをブロック歪量のとり得る最大値を1に正規化したときのブロック歪量の値をとする。なお、客観画質評価値がMSEの場合は、客観画質評価値修正部40は、係数α及びβの乗算後のMSEを用いて、式(1)によりPSNRを算出する。
【0053】
つぎに、客観画質評価値算出部20の算出する客観画質評価値がPSNR又はSSIMである場合の係数について説明する。注視領域情報が注視領域であるか否かを示す情報である場合、注視領域情報が注視領域であることを示していれば係数αをα3(例えば0.95)とし、注視領域情報が注視領域でないことを示していれば係数αをα3よりも小さな値であるα4(例えば0.8)とする。また、係数βは、ブロック歪量と負の相関を有する値とする。例えば、とり得る最大値を1に正規化したときのブロック歪量の値をβ1とすると、係数βを1−β1とする。
【0054】
上述したように、本実施形態の客観画質評価装置3は、評価画像及び該評価画像の原画像を複数のブロックに分割してブロックサイズのブロック評価画像及びブロック原画像を生成する。そして、客観画質評価値算出部20によりブロック評価画像及びブロック原画像から、ブロックごとに評価画像の客観画質評価値を算出し、視覚特性検出部30により評価画像の動きベクトルに関する情報及びブロック歪量に関する情報を生成する。最後に、客観画質評価値修正部40により客観画質評価値を動きベクトルに関する情報及びブロック歪量に関する情報に基づいて修正する。このようにして、客観画質評価装置3は、評価画像の動きベクトル及びブロック歪量に基づく視覚特性を考慮することにより、主観評価に近い客観画質評価値を測定することができるようになる。
【0055】
また、上述した客観画質評価装置1,2,3を画像符号化や画像超解像に利用することで、従来よりも主観評価に近い最適化されたパラメータを得ることができる。
【0056】
なお、上述した客観画質評価装置1,2,3として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、客観画質評価装置1,2,3の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0057】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。