(58)【調査した分野】(Int.Cl.,DB名)
連続するデジタル映像信号を20msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、映像に生じたエラーを検出し、
前記エラーは映像の乱れであり、前記抽出された高周波成分は、前記デジタル映像信号のブロック単位の分散値の平均であるアクティビティであり、
前記アクティビティ(Vn(t))を時間(t)に対して2階微分してd2Vn(t)/dt2を得たときに、加速度(d2Vn(t)/dt2)/Vn(t−1)が、時間軸にそって、正、負、正又は負、正、負と並んでいたときは、映像の乱れが発生したと判定することを特徴とする映像検査方法。
連続するデジタル音声信号を5msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、音声に生じたエラーを検出し、
時間軸に沿って時刻tでサンプリングを行って、前記サンプリングした信号に対して周波数変換を行い、それぞれn個のパワー値Pn(t)と、所定の帯域内における総合パワー値P(t)を求めた場合において、
[1]該総合パワー値P(t)が第1の閾値を超えていた場合、及び
[2]該総合パワー値P(t)を、それ以前の時刻(t−T)での総合パワー値P(t−T)で除した値(P(t)/P(t−T))と、該総合パワー値P(t)を、それ以降の時刻(t+T)での総合パワー値P(t+T)で除した値(P(t)/P(t+T))が、それぞれ第2の閾値を超えていた場合、及び
[3]個々のパワー値Pn(t)を、総合パワー値P(T)で除した値(Pn(t)/P(T))が第3の閾値を超えていたときは、エラーが発生したと判定することを特徴とする音声検査方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1、2は、圧縮伸張処理された映像信号にのみ適用されるものであり、通信回線の不具合、VTRの不具合エラー、その他の障害など、すべてのノイズに起因したエラーを検出する方法は未だ実現していない。加えて、音声信号における、ノイズに起因した「プツ」音なども、精度良く検査する技術は実現していない。
【0006】
本発明の目的の1つは、デジタル映像信号において種々の原因により発生するノイズに起因した映像のエラーを検出する映像検査方法を提供することにある。又、本発明の別の目的は、デジタル音声信号において種々の原因により発生するノイズに起因した音声のエラーを検出する音声検査方法を提供することにある。
【課題を解決するための手段】
【0007】
第1の本発明の映像検査方法は、連続するデジタル映像信号を20msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、映像に生じたエラーを検出することを特徴とする。
【0008】
本発明によれば、連続するデジタル映像信号を20msec以下の非常に短い時間で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、実際のコンテンツと区別して映像の乱れやブロックノイズを精度良く検出できる。
【0009】
前記デジタル映像信号の1フレームを複数の領域に分割し、前記エラーの検出を各領域毎に行うと好ましい。
【0010】
前記エラーは映像の乱れであり、前記抽出された高周波成分は、前記デジタル映像信号のブロック単位の分散値の平均であるアクティビティであると好ましい。
【0011】
前記アクティビティ(Vn(t))を時間(t)に対して2階微分してd
2Vn(t)/dt
2を得たときに、加速度(d
2Vn(t)/dt
2)/Vn(t−1)が、時間軸にそって、正、負、正又は負、正、負と並んでいたときは、映像の乱れが発生したと判定すると好ましい。
【0012】
前記エラーはブロックノイズであり、前記映像信号の検査ブロック内の画素値に対して直交変換を行い、その変換係数が所定の条件を満たしたときは、ブロックノイズが発生したと判定すると好ましい。
【0013】
前記変換係数が前記所定の条件を満たしたときは、前記映像信号により表示されるコンテンツに角が生じたと判定すると好ましい。
【0014】
前記角の数と偏りから、前記角を、ブロックノイズに起因するものと、コンテンツに起因するものとに区別すると好ましい。
【0015】
第2の本発明の音声検査方法は、連続するデジタル音声信号を5msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、音声に生じたエラーを検出することを特徴とする。
【0016】
本発明によれば、連続するデジタル音声信号を5msec以下と非常に短い時間で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、実際のコンテンツと区別して音声のノイズを精度良く検出できる。
【0017】
前記デジタル音声信号が複数チャンネルに記録されているときは、前記エラーの検出を各チャンネル毎に行うと好ましい。
【0018】
時間軸に沿って時刻tでサンプリングを行って、前記サンプリングした信号に対して周波数変換を行い、それぞれn個のパワー値P
n(t)と、所定の帯域内における総合パワー値P(t)を求めた場合において、
[1]該総合パワー値P(t)が第1の閾値を超えていた場合、及び
[2]該総合パワー値P(t)を、それ以前の時刻(t−T)での総合パワー値P(t−T)で除した値(P(t)/P(t−T))と、該総合パワー値P(t)を、それ以降の時刻(t+T)での総合パワー値P(t+T)で除した値(P(t)/P(t+T))が、それぞれ第2の閾値を超えていた場合、及び
[3]個々のパワー値P
n(t)を、総合パワー値P(T)で除した値(P
n(t)/P(T))が第3の閾値を超えていたときは、エラーが発生したと判定すると好ましい。
【0019】
時間軸に沿った3つのパワー値を比較したときに、1番目のパワー値P
n(t―T5)と3番目のパワー値P
n(t+T+T5)が第4の閾値を上回り、2番目のパワー値の列P
n(t)、・・・、P
n(t+T)が
第5の閾値を下回ったときは、音飛びが発生したと判定すると好ましい。
【0020】
時間軸に沿った3つのパワー値P
n(t)を比較したときに、1番目のパワー値P
n(t―T5)と3番目のパワー値P
n(t+T+T5)が第6の閾値を下回り、2番目のパワー値の列P
n(t)、・・・、P
n(t+T)が
第7の閾値を上回ったときは、ノイズが発生したと判定すると好ましい。
【発明の効果】
【0021】
本発明によれば、デジタル映像信号において種々の原因により発生するノイズに起因した映像のエラーを検出する映像検査方法を提供することができ、又、デジタル音声信号において種々の原因により発生するノイズに起因した音声のエラーを検出する音声検査方法を提供することができる。
【発明を実施するための形態】
【0023】
本実施の形態にかかる映像検査方法及び音声検査方法を実現できる映像・音声検査装置を,図面を参照して説明する。
図1は、映像・音声検査装置10のブロック図である。映像・音声検査装置10は、デジタル映像・音声信号を入力する入力部11と、入力したデジタル映像・音声信号から高周波成分を抽出し、演算を行う抽出部12と、抽出部12の抽出結果に基づいて閾値との比較を行い、映像や音声にエラーが発生したか否かを判定する比較・判定部13と、比較・判定部13に対して閾値等の設定を行う制御部14と、比較・判定部13の判定結果に応じてアラームを出力する出力部15とを有する。
【0024】
(映像の乱れ検出)
「映像の乱れ」とは、コンテンツの像がフレーム間で瞬間的に消失後復帰したり、シフトするような現象をいう。ここでは、一般社団法人電波産業会ARIBが規格化した1125/60方式の高精細度テレビジョン放送HDTV(High-definition television)向けのBTAS-001B規格による映像・音声信号を例にとり説明する。このような映像信号は、輝度信号Yと、色差信号Pb,Prとを含んでいる。
【0025】
入力部11から映像・音声信号が入力されたとき、抽出部12は、
図2(a)に示すように、1フレームにおいて、ラインV1〜V2、画像H1〜H2の範囲内を、4フィールド(領域)A,B,C,Dに分割し、各領域毎に演算を行う。具体的には、フィールド毎に、ビデオレベル(Video Level)、ビデオアクティビティ(Video Activity)を演算する。ここで、Video Levelとは、画像フレームに含まれる画素の値の平均値であり、輝度信号のレベルともいう。又は色差信号のレベルを用いても良い。更に、Video Activityとしては、画像に含まれる小ブロックごとに分散を求めたとき、この分散のフレーム内の画素の平均値を用いても良いし、単純に画像フレームに含まれる画素のフレーム内での分散値を用いても良い。
【0026】
より具体的には、フレーム端からH1,H2までを8画素、フレーム端からV1,V2までを8ラインとすると、検査対象フレームを水平方向にH2=1864画素、垂直方向にV2=536ラインとできるので、これを4分割した1フィールドが928画素、264ラインとなる。ここで、
図2(b)に示すように、1フィールド内にmライン、n画素の小ブロックを形成する。つまり小ブロック内の各画素の輝度値はY(m、n)で表せる。ここで、輝度信号Yは16画素×8ラインで小ブロックに分けると好ましい。輝度信号Yを用いる場合、1フィールドの小ブロック数は1914になる。尚、色差信号Pb,Prを用いる場合、8画素×8ラインで小ブロックに分けると好ましい
【0027】
更に、各小ブロック毎に、直流成分として信号の平均、交流成分として分散を求める。すなわち、ビデオアクティビティとしての分散を求めることは、高周波成分を抽出することとなる。(1)式は、小ブロック#k内の輝度信号Yについての平均A(k)を求める式であり、(2)式は、小ブロック#k内の輝度信号Yについての分散V(k)を求める式である。これにより、フィールドA〜Dでは、それぞれブロック数に応じて平均A(k)と分散V(k)が求まる(k=1〜1914)。
【0029】
更に、(1),(2)式に従って求めた平均A(k)と分散V(k)を、1フィールド毎に平均化する。(3)式は、各フィールドのビデオアベレージFkA=L
11,L
21,L
12,L
22を求める式であり、(4)式は、各フィールドのアクティビティアベレージVkA=S
11,S
21,S
12,S
22を求める式である。
【0031】
ここで、1フィールド内のn番目のブロック#nにおける時刻tでのビデオアクティビティをVn(t)としたときに、その経時変化に注目する。時刻tを基準として、それ以前の時刻(t−2)、(t−1)と、それ以降の時刻(t+1)、(t+2)におけるビデオアクティビティVn(t−2)、Vn(t−1)、Vn(t+1)、Vn(t−1)をそれぞれ計算する。但し、(t−2)、(t−1)、t、(t+1)、(t+2)の時間間隔は20msec以下であって、単位時間とする。
【0032】
ここで、各時刻での一階微分値を求めると、以下のようになる。
dVn(t−1)/dt=Vn(t−1)−Vn(t−2) (5)
dVn(t)/dt=Vn(t)−Vn(t−1) (6)
dVn(t+1)/dt=Vn(t+1)−Vn(t) (7)
dVn(t+2)/dt=Vn(t+2)−Vn(t−1) (8)
【0033】
更に、各時刻での二階微分値を求めると、以下のようになる。
d
2Vn(t)/dt
2=dVn(t)/dt−dVn(t−1)/dt (9)
d
2Vn(t+1)/dt
2=dVn(t+1)/dt−dVn(t)/dt (10)
d
2Vn(t+2)/dt
2=dVn(t+2)/dt−dVn(t+1)/dt (11)
【0034】
ここで、(d
2Vn(t)/dt
2)/Vn(t−1)を、時刻tにおけるコンテンツの加速度ACと定義するが、これは正負の値をとりうる。加速度ACは、抽出部12から比較・判定部13へと入力される。
図3に、時間軸に沿って、時刻(t−2)、(t−1)、t、(t+1)、(t+2)における加速度ACを矢印で示した一例を示す。映像の乱れが生じた場合、コンテンツの加速度ACが、実際の被写体の動きとは異なる異常な動きをするので、加速度ACが大きく変化する。
【0035】
具体的には、比較・判定部13が、時間軸に沿って連続する3つの加速度ACを比較する。まず
図3において、時刻(t−2)、(t−1)では、双方とも加速度ACが正の値であって閾値Th1を超えている。一方、時刻(t)では、加速度ACが負の値であって、閾値Th2を下回っている。この場合、時刻(t−2)、(t−1)間では加速度ACの向きが同じであるので、映像の乱れを生じていないと判断できる。一方、時刻tでは加速度ACの向きが負となっているので、映像の乱れを生じている可能性がある。
【0036】
次いで、時刻(t+1)では加速度ACの向きが再び正の値に戻り、閾値Th1を超えている。従って、時刻(t−1)、t、(t+1)間では加速度ACが閾値を超え,且つ正、負、正の並びとなっている。このように加速度ACが大きく変化した場合、時刻tで領域#nのブロック内で映像の乱れが生じたと判定できる。同様に、加速度ACが閾値を超え,且つ負、正、負の並びとなっている場合も、映像の乱れが生じたと判定できる。
【0037】
更に、時刻(t+2)では加速度ACの向きが再び負の値に戻ったが、閾値Th2を下回っていない。よって、時刻t、(t+1)、(t+2)間では加速度ACが時間軸に沿って負、正、負の並びとなっているが、閾値を超えていないのでコンテンツの像の動きは正常の範囲内であるとして、時刻(t+1)では映像の乱れを生じていないと判断する。尚、閾値Th1,Th2の値は、装置制御部14からの入力で任意に変更することが可能である。以上の演算及び比較を、全ての小ブロックで行う。
【0038】
比較・判定部13が、映像の乱れが生じたと判定した場合、どのフィールドの、どの小ブロックで映像の乱れが生じたかを示す情報を、アラーム出力部15に入力する。アラーム出力部15は、入力された情報に基づいて、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。このとき、モニタに表示される映像に重ねて、アラームを表示することが好ましく、例えば映像の乱れを検出したフィールドの縁が赤く光るようにすることができる。
【0039】
(映像のブロックノイズの検出)
「映像のブロックノイズ」とは、コンテンツの像が、ブロック状に別の像に変換されてしまう現象をいう。ここでも、HDTVの映像・音声信号を例にとり説明する。
図4に示すように、入力されたデジタル映像信号を20msec以下で区切ってサンプリングした際に、検査対象フレームを、水平方向に1920画素、垂直方向に540ラインで表すとする。ここで、m画素、nラインの輝度信号の画素値をY(m,n)で表し、これを左上端として8画素×8ラインの画素ブロック(検査ブロック)を定義する。検査ブロックの範囲は、これに限られない。入力部11から映像・音声信号が入力されたとき、抽出部12は、検査ブロック内の画素値に対して、直交変換である2次元離散フーリエ変換を実行する。尚、直交変換としては,これ以外にも離散コサイン変換、ウェーブレット変換などがあり、いずれの直交変換を用いても同様の態様でブロックノイズの角を検出できる。
【0040】
このとき、検査ブロック内の64個の画素値をY(0,0)・・・、Y(7,7)で表し、フーリエ変換係数をF(u、v)=F(0,0)・・・、F(7,7)で表すと、(12)式の関係が成立する。このフーリエ変換により、高周波成分を抽出することとなる。
【0042】
比較・判定部13は、抽出部12で行ったフーリエ変換の結果、フーリエ変換係数が以下の条件1〜4のいずれかを満たす場合、その検査ブロックDBが、
図4(a)に示すブロックノイズBNの四隅の角のいずれかに存在すると判定する。具体的には、以下の通りである。
[1]条件1が成立する場合、検査ブロックDBの画素Y(6,6)、Y(7,6)、Y(6,7)、Y(7,7)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、
図4(b)において示す検査ブロックDB(1)が、ブロックノイズBNの左上にあることを意味する。
[2]条件2が成立する場合、検査ブロックDBの画素Y(0,6)、Y(1,6)、Y(0,7)、Y(1,7)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、
図4(b)において示す検査ブロックDB(2)が、ブロックノイズBNの右上にあることを意味する。
[3]条件3が成立する場合、検査ブロックDBの画素Y(6,0)、Y(7,0)、Y(6,1)、Y(7,1)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、
図4(b)において示す検査ブロックDB(3)が、ブロックノイズBNの左上にあることを意味する。
[4]条件4が成立する場合、検査ブロックDBの画素Y(0,0)、Y(1,0)、Y(0,1)、Y(1,1)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、
図4(b)において示す検査ブロックDB(4)が、ブロックノイズBNの左上にあることを意味する。
【0043】
よって、
図4(a)の矢印に示すように、検査ブロックDBをフレーム全体にわたって移動させることで、ブロックノイズが発生している場合には、その位置と大きさが分かる。検査対象フレームを例えば4つに分割して、各領域毎にブロックノイズが発生したか否かを検出しても良い。
【0044】
【数4】
但し、W
uvはF(u,v)の実数部(A)と虚数部(B)の二乗和の平方根(√(A
2+B
2))である。
【0045】
ところで、上述した条件のみでは、コンテンツとしてのビルの窓や、映像に挿入された文字などがブロックノイズとして誤って検出される恐れがある。そこで、ブロックノイズと、窓や文字とを区別する必要がある。これは、以下のようにして比較・判定部13が行う。
【0046】
より具体的に説明すると、
図5に示すように、検査対象領域(又はフレーム)が、N個の画素(v
1〜v
N)×M本のライン(h
1〜h
M)から構成されているとした場合、コンテンツの窓や文字などの場合、同一垂直線もしくは同一水平線(
図5では直線VL,HLが相当)上に角が生じる可能性が高い。そこで、角の出現傾向を標準偏差で表すことで、ブロックノイズと、窓や文字とを区別することが可能になる。
【0047】
まず、検査対象領域内の総角数Ncは、角が発生した画素の総数に等しく、また角が発生したラインの総数に等しいから、(13)式で表せる。更に、検査対象領域内で水平方向に発生した角の標準偏差(Dh)
2を、(14)式で表し、垂直方向に発生した角の標準偏差(Dv)
2を、(15)式で表すものとする。
【0049】
ここで、角の標準偏差が小さければ、同一垂直線もしくは同一水平線上に角が乗っている傾向が強い。従って、検査対象領域内において、α=N×Dh×Dvを求めたとき、αの値が比較的小さければ、コンテンツに起因する角が多いと推定できる。そこで、比較・判定部13は、検査対象領域内に角が発生していたと判断した場合、閾値Th5に対してαがそれ以上か否かを判断し、α≧Th5である場合に、検査対象領域内にブロックノイズが発生したと判定するのである。尚、閾値Th3〜Th5の値は、装置制御部14からの入力で任意に変更することが可能である。
【0050】
比較・判定部13が、映像のブロックノイズが生じたと判定した場合、角を示す位置情報等を含む情報をアラーム出力部15に入力する。アラーム出力部15は、入力された情報に基づいて、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。このとき、モニタに表示される映像に重ねて、ブロックノイズの角の位置を表示することが好ましい。
【0051】
(音声のエラー検出)
本実施の形態で検出する音声のエラーの1つは、瞬間的に発生し消滅する、いわゆる「プツ」音である。デジタル音声は、例えば4チャンネルで入力されるので、個々のチャンネル毎のエラーを検出する。
【0052】
まず、抽出部12が、
図6に示すように、デジタル音声を時間軸に沿って1msecで区切り、例えば48個の音声データをサンプリングする。これ以上の細かいデータは、人間の可聴域を超えるため不要である。更に各音声データに対し、直交変換である離散フーリエ変換により周波数変換を実行する。ここでx(t)は、時刻tにおける音声の振れ幅を示す音声レベルの値である。これにより時刻tにおいて、直流成分を除く23のサンプルデータの高周波成分fj(t)が、(16)式に示すように抽出される。尚、サンプリングは、
図6に示すように、例えば0.5msec毎にずらしながら採取する。
【0054】
(プツ音の検出)
比較・判定部13が、時刻tにおける高周波成分fj(t)から実数部と虚数部の二乗和を計算することで、パワーが得られる。よって全てのサンプルについてパワーを計算し、これをP
n(t)、(但しn=1〜23)とする。
【0055】
プツ音のパワーは、サンプルデータ間で一様であることが分かっている。時刻tにおける、サンプルデータm1〜m2までの総合パワーをP(t)とすると、(17)式で表せる。
【0057】
比較・判定部13は、以下の(18)〜(20)式を満たすとき、プツ音が発生したと判定する。(18)式の条件は、音声信号がゼロでないことを示し、(19)式は、プツ音前後で比較的大きな音声の変化があることを示し、(20)式は、サンプリング時間内でパワーが比較的一定であることを示す。尚、閾値Th6〜Th8、T,m1,m2,n1,n2の値は、装置制御部14からの入力で任意に変更することが可能である。
P(t)≧Th6 (18)
P(t)/P(t−T)≧Th7 且つ P(t)/P(t+T)≧Th7 (19)
P
n(t)/P(t)≧Th8 (但し、nはサンプルデータ#1〜#23のうち任意の連番n1〜n2のサンプルデータ) (20)
【0058】
(音飛びの検出)
図7は、時間軸を横軸としてパワーP
n(t)の変化を示す図である。比較・判定部13は、n=1〜23全てにおいて、以下の(21)〜(23)式を満たすとき、時刻tで音飛びが発生したと判定する。これは時刻tより時間Tにわたって、音声のパワーが閾値Th10を下回っているが、その前後ではパワーが閾値Th9を上回っていることを意味する。尚、閾値Th9,Th10、T,T5の値は、装置制御部14からの入力で任意に変更することが可能である。
P
n(t−T5)≧Th9 (21)
P
n(t)、P
n(t+1)、・・・P
n(t+T)≦Th10 (22)
P
n(t+T−T5)≧Th9 (23)
【0059】
(ノイズ挿入の検出)
図7は、時間軸を横軸としてパワーP
n(t)の変化を示す図である。比較・判定部13は、n=1〜23全てにおいて、以下の(24)〜(26)式を満たすとき、時刻tでノイズ挿入が発生したと判定する。これは時刻tより時間Tにわたって、音声のパワーが閾値Th11を上回っているが、その前後ではパワーが閾値Th9を下回っていることを意味する。尚、閾値Th11,Th12、T,T5の値は、装置制御部14からの入力で任意に変更することが可能である。
P
n(t−T5)≦Th11 (24)
P
n(t)、P
n(t+1)、・・・P
n(t+T)≧Th12 (25)
P
n(t+T−T5)≦Th11 (26)
【0060】
比較・判定部13が、音声のエラーが生じたと判定した場合、音声アラーム信号を、アラーム出力部15に入力する。アラーム出力部15は、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。