特許第6222854号(P6222854)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社K−WILLの特許一覧

<>
  • 特許6222854-映像検査方法及び音声検査方法 図000009
  • 特許6222854-映像検査方法及び音声検査方法 図000010
  • 特許6222854-映像検査方法及び音声検査方法 図000011
  • 特許6222854-映像検査方法及び音声検査方法 図000012
  • 特許6222854-映像検査方法及び音声検査方法 図000013
  • 特許6222854-映像検査方法及び音声検査方法 図000014
  • 特許6222854-映像検査方法及び音声検査方法 図000015
  • 特許6222854-映像検査方法及び音声検査方法 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6222854
(24)【登録日】2017年10月13日
(45)【発行日】2017年11月1日
(54)【発明の名称】映像検査方法及び音声検査方法
(51)【国際特許分類】
   H04N 21/442 20110101AFI20171023BHJP
   H04N 19/89 20140101ALI20171023BHJP
【FI】
   H04N21/442
   H04N19/89
【請求項の数】6
【全頁数】14
(21)【出願番号】特願2015-543639(P2015-543639)
(86)(22)【出願日】2013年10月23日
(86)【国際出願番号】JP2013078660
(87)【国際公開番号】WO2015059782
(87)【国際公開日】20150430
【審査請求日】2016年7月22日
(73)【特許権者】
【識別番号】599161292
【氏名又は名称】株式会社K−WILL
(74)【代理人】
【識別番号】100107272
【弁理士】
【氏名又は名称】田村 敬二郎
(74)【代理人】
【識別番号】100109140
【弁理士】
【氏名又は名称】小林 研一
(72)【発明者】
【氏名】浜田 高宏
【審査官】 松元 伸次
(56)【参考文献】
【文献】 特表平09−503890(JP,A)
【文献】 特開2011−203500(JP,A)
【文献】 特開2009−094892(JP,A)
【文献】 特開平09−037244(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N7/10−7/173
7/20−7/56
19/00−21/858
(57)【特許請求の範囲】
【請求項1】
連続するデジタル映像信号を20msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、映像に生じたエラーを検出し、
前記エラーは映像の乱れであり、前記抽出された高周波成分は、前記デジタル映像信号のブロック単位の分散値の平均であるアクティビティであり、
前記アクティビティ(Vn(t))を時間(t)に対して2階微分してd2Vn(t)/dt2を得たときに、加速度(d2Vn(t)/dt2)/Vn(t−1)が、時間軸にそって、正、負、正又は負、正、負と並んでいたときは、映像の乱れが発生したと判定することを特徴とする映像検査方法。
【請求項2】
前記デジタル映像信号の1フレームを複数の領域に分割し、前記エラーの検出を各領域毎に行うことを特徴とする請求項1に記載の映像検査方法。
【請求項3】
連続するデジタル音声信号を5msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、音声に生じたエラーを検出し、
時間軸に沿って時刻tでサンプリングを行って、前記サンプリングした信号に対して周波数変換を行い、それぞれn個のパワー値Pn(t)と、所定の帯域内における総合パワー値P(t)を求めた場合において、
[1]該総合パワー値P(t)が第1の閾値を超えていた場合、及び
[2]該総合パワー値P(t)を、それ以前の時刻(t−T)での総合パワー値P(t−T)で除した値(P(t)/P(t−T))と、該総合パワー値P(t)を、それ以降の時刻(t+T)での総合パワー値P(t+T)で除した値(P(t)/P(t+T))が、それぞれ第2の閾値を超えていた場合、及び
[3]個々のパワー値Pn(t)を、総合パワー値P(T)で除した値(Pn(t)/P(T))が第3の閾値を超えていたときは、エラーが発生したと判定することを特徴とする音声検査方法。
【請求項4】
前記デジタル音声信号が複数チャンネルに記録されているときは、前記エラーの検出を各チャンネル毎に行うことを特徴とする請求項3に記載の音声検査方法。
【請求項5】
時間軸に沿った3つのパワー値を比較したときに、1番目のパワー値Pn(t―T5)と3番目のパワー値Pn(t+T+T5)が第4の閾値を上回り、2番目のパワー値の列Pn(t)、・・・、Pn(t+T)が第5の閾値を下回ったときは、音飛びが発生したと判定することを特徴とする請求項3又は4に記載の音声検査方法。
【請求項6】
時間軸に沿った3つのパワー値Pn(t)を比較したときに、1番目のパワー値Pn(t―T5)と3番目のパワー値Pn(t+T+T5)が第6の閾値を下回り、2番目のパワー値の列Pn(t)、・・・、Pn(t+T)が第7の閾値を上回ったときは、ノイズが発生したと判定することを特徴とする請求項3〜5のいずれかに記載の音声検査方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル映像音声信号に含まれた映像や音声のエラーを検出できる映像検査方法及び音声検査方法に関する。
【背景技術】
【0002】
通信回線等のインフラが整備された現在では、海外からデジタル映像音声信号が伝送されるようになり、海外のコンテンツを国内で手軽に視聴できるようになってきた。しかるに、国内の通信設備と海外の通信設備とでは方式が異なる場合があり、デジタル映像音声信号を変換する際にノイズが混入することを完全に回避するのは困難である。このようなノイズが映像信号に混入すると、映像の乱れやブロックノイズ等のエラーを発生させる場合がある。又、ノイズが音声信号に混入すると、いわゆる「プツ」音(Audio Pop Noise)などのエラーとして認識される場合がある。このようなエラーの発生により、視聴者が違和感を覚える恐れがあるので、予め検査者がコンテンツを実際に視聴してエラーを発見するコンテンツ検査が行われている。ところが、コンテンツ検査は人間の目と耳を使い長時間の視聴を行うために、体調に応じて或いは個人差により検査結果が大きくばらつくという問題がある。また、検査のための設備も大きな負担となる。そこで、人間の代わりに機械で検査できないかという要望がある。
【0003】
これに対し、特許文献1には、所定の矩形ブロック単位で画素の微分を行ってブロックノイズを機械的に検出する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】2001−119695号公報
【特許文献2】2013−81078号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1、2は、圧縮伸張処理された映像信号にのみ適用されるものであり、通信回線の不具合、VTRの不具合エラー、その他の障害など、すべてのノイズに起因したエラーを検出する方法は未だ実現していない。加えて、音声信号における、ノイズに起因した「プツ」音なども、精度良く検査する技術は実現していない。
【0006】
本発明の目的の1つは、デジタル映像信号において種々の原因により発生するノイズに起因した映像のエラーを検出する映像検査方法を提供することにある。又、本発明の別の目的は、デジタル音声信号において種々の原因により発生するノイズに起因した音声のエラーを検出する音声検査方法を提供することにある。
【課題を解決するための手段】
【0007】
第1の本発明の映像検査方法は、連続するデジタル映像信号を20msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、映像に生じたエラーを検出することを特徴とする。
【0008】
本発明によれば、連続するデジタル映像信号を20msec以下の非常に短い時間で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、実際のコンテンツと区別して映像の乱れやブロックノイズを精度良く検出できる。
【0009】
前記デジタル映像信号の1フレームを複数の領域に分割し、前記エラーの検出を各領域毎に行うと好ましい。
【0010】
前記エラーは映像の乱れであり、前記抽出された高周波成分は、前記デジタル映像信号のブロック単位の分散値の平均であるアクティビティであると好ましい。
【0011】
前記アクティビティ(Vn(t))を時間(t)に対して2階微分してd2Vn(t)/dt2を得たときに、加速度(d2Vn(t)/dt2)/Vn(t−1)が、時間軸にそって、正、負、正又は負、正、負と並んでいたときは、映像の乱れが発生したと判定すると好ましい。
【0012】
前記エラーはブロックノイズであり、前記映像信号の検査ブロック内の画素値に対して直交変換を行い、その変換係数が所定の条件を満たしたときは、ブロックノイズが発生したと判定すると好ましい。
【0013】
前記変換係数が前記所定の条件を満たしたときは、前記映像信号により表示されるコンテンツに角が生じたと判定すると好ましい。
【0014】
前記角の数と偏りから、前記角を、ブロックノイズに起因するものと、コンテンツに起因するものとに区別すると好ましい。
【0015】
第2の本発明の音声検査方法は、連続するデジタル音声信号を5msec以下で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、音声に生じたエラーを検出することを特徴とする。
【0016】
本発明によれば、連続するデジタル音声信号を5msec以下と非常に短い時間で区切ってサンプリングし、サンプリングした信号から高周波成分を抽出して、抽出された高周波成分に基づいて、実際のコンテンツと区別して音声のノイズを精度良く検出できる。
【0017】
前記デジタル音声信号が複数チャンネルに記録されているときは、前記エラーの検出を各チャンネル毎に行うと好ましい。
【0018】
時間軸に沿って時刻tでサンプリングを行って、前記サンプリングした信号に対して周波数変換を行い、それぞれn個のパワー値Pn(t)と、所定の帯域内における総合パワー値P(t)を求めた場合において、
[1]該総合パワー値P(t)が第1の閾値を超えていた場合、及び
[2]該総合パワー値P(t)を、それ以前の時刻(t−T)での総合パワー値P(t−T)で除した値(P(t)/P(t−T))と、該総合パワー値P(t)を、それ以降の時刻(t+T)での総合パワー値P(t+T)で除した値(P(t)/P(t+T))が、それぞれ第2の閾値を超えていた場合、及び
[3]個々のパワー値Pn(t)を、総合パワー値P(T)で除した値(Pn(t)/P(T))が第3の閾値を超えていたときは、エラーが発生したと判定すると好ましい。
【0019】
時間軸に沿った3つのパワー値を比較したときに、1番目のパワー値Pn(t―T5)と3番目のパワー値Pn(t+T+T5)が第4の閾値を上回り、2番目のパワー値の列Pn(t)、・・・、Pn(t+T)が第5の閾値を下回ったときは、音飛びが発生したと判定すると好ましい。
【0020】
時間軸に沿った3つのパワー値Pn(t)を比較したときに、1番目のパワー値Pn(t―T5)と3番目のパワー値Pn(t+T+T5)が第6の閾値を下回り、2番目のパワー値の列Pn(t)、・・・、Pn(t+T)が第7の閾値を上回ったときは、ノイズが発生したと判定すると好ましい。
【発明の効果】
【0021】
本発明によれば、デジタル映像信号において種々の原因により発生するノイズに起因した映像のエラーを検出する映像検査方法を提供することができ、又、デジタル音声信号において種々の原因により発生するノイズに起因した音声のエラーを検出する音声検査方法を提供することができる。
【図面の簡単な説明】
【0022】
図1】映像・音声検査装置10のブロック図である。
図2】(a)映像の乱れを検出する対象となるフレームを示す図である。(b)分割した領域を示す図である。
図3】時間軸に沿って、時刻(t−2)、(t−1)、t、(t+1)、(t+2)における加速度ACを矢印で示した一例を示す図である。
図4】(a)映像のブロックノイズを検出する対象となるフレームを示す図である。(b)検査ブロックとブロックノイズの関係を示す図である。
図5】コンテンツを表示するフレームの一例である。
図6】デジタル音声を時間軸に沿って1msecで区切り、48個の音声データをサンプリングすることを示す図である。
図7】時間軸を横軸としてパワーPn(t)の変化を示す図である
図8】時間軸を横軸としてパワーPn(t)の変化を示す図である
【発明を実施するための形態】
【0023】
本実施の形態にかかる映像検査方法及び音声検査方法を実現できる映像・音声検査装置を,図面を参照して説明する。図1は、映像・音声検査装置10のブロック図である。映像・音声検査装置10は、デジタル映像・音声信号を入力する入力部11と、入力したデジタル映像・音声信号から高周波成分を抽出し、演算を行う抽出部12と、抽出部12の抽出結果に基づいて閾値との比較を行い、映像や音声にエラーが発生したか否かを判定する比較・判定部13と、比較・判定部13に対して閾値等の設定を行う制御部14と、比較・判定部13の判定結果に応じてアラームを出力する出力部15とを有する。
【0024】
(映像の乱れ検出)
「映像の乱れ」とは、コンテンツの像がフレーム間で瞬間的に消失後復帰したり、シフトするような現象をいう。ここでは、一般社団法人電波産業会ARIBが規格化した1125/60方式の高精細度テレビジョン放送HDTV(High-definition television)向けのBTAS-001B規格による映像・音声信号を例にとり説明する。このような映像信号は、輝度信号Yと、色差信号Pb,Prとを含んでいる。
【0025】
入力部11から映像・音声信号が入力されたとき、抽出部12は、図2(a)に示すように、1フレームにおいて、ラインV1〜V2、画像H1〜H2の範囲内を、4フィールド(領域)A,B,C,Dに分割し、各領域毎に演算を行う。具体的には、フィールド毎に、ビデオレベル(Video Level)、ビデオアクティビティ(Video Activity)を演算する。ここで、Video Levelとは、画像フレームに含まれる画素の値の平均値であり、輝度信号のレベルともいう。又は色差信号のレベルを用いても良い。更に、Video Activityとしては、画像に含まれる小ブロックごとに分散を求めたとき、この分散のフレーム内の画素の平均値を用いても良いし、単純に画像フレームに含まれる画素のフレーム内での分散値を用いても良い。
【0026】
より具体的には、フレーム端からH1,H2までを8画素、フレーム端からV1,V2までを8ラインとすると、検査対象フレームを水平方向にH2=1864画素、垂直方向にV2=536ラインとできるので、これを4分割した1フィールドが928画素、264ラインとなる。ここで、図2(b)に示すように、1フィールド内にmライン、n画素の小ブロックを形成する。つまり小ブロック内の各画素の輝度値はY(m、n)で表せる。ここで、輝度信号Yは16画素×8ラインで小ブロックに分けると好ましい。輝度信号Yを用いる場合、1フィールドの小ブロック数は1914になる。尚、色差信号Pb,Prを用いる場合、8画素×8ラインで小ブロックに分けると好ましい
【0027】
更に、各小ブロック毎に、直流成分として信号の平均、交流成分として分散を求める。すなわち、ビデオアクティビティとしての分散を求めることは、高周波成分を抽出することとなる。(1)式は、小ブロック#k内の輝度信号Yについての平均A(k)を求める式であり、(2)式は、小ブロック#k内の輝度信号Yについての分散V(k)を求める式である。これにより、フィールドA〜Dでは、それぞれブロック数に応じて平均A(k)と分散V(k)が求まる(k=1〜1914)。
【0028】
【数1】
【0029】
更に、(1),(2)式に従って求めた平均A(k)と分散V(k)を、1フィールド毎に平均化する。(3)式は、各フィールドのビデオアベレージFkA=L11,L21,L12,L22を求める式であり、(4)式は、各フィールドのアクティビティアベレージVkA=S11,S21,S12,S22を求める式である。
【0030】
【数2】
【0031】
ここで、1フィールド内のn番目のブロック#nにおける時刻tでのビデオアクティビティをVn(t)としたときに、その経時変化に注目する。時刻tを基準として、それ以前の時刻(t−2)、(t−1)と、それ以降の時刻(t+1)、(t+2)におけるビデオアクティビティVn(t−2)、Vn(t−1)、Vn(t+1)、Vn(t−1)をそれぞれ計算する。但し、(t−2)、(t−1)、t、(t+1)、(t+2)の時間間隔は20msec以下であって、単位時間とする。
【0032】
ここで、各時刻での一階微分値を求めると、以下のようになる。
dVn(t−1)/dt=Vn(t−1)−Vn(t−2) (5)
dVn(t)/dt=Vn(t)−Vn(t−1) (6)
dVn(t+1)/dt=Vn(t+1)−Vn(t) (7)
dVn(t+2)/dt=Vn(t+2)−Vn(t−1) (8)
【0033】
更に、各時刻での二階微分値を求めると、以下のようになる。
2Vn(t)/dt2=dVn(t)/dt−dVn(t−1)/dt (9)
2Vn(t+1)/dt2=dVn(t+1)/dt−dVn(t)/dt (10)
2Vn(t+2)/dt2=dVn(t+2)/dt−dVn(t+1)/dt (11)
【0034】
ここで、(d2Vn(t)/dt2)/Vn(t−1)を、時刻tにおけるコンテンツの加速度ACと定義するが、これは正負の値をとりうる。加速度ACは、抽出部12から比較・判定部13へと入力される。図3に、時間軸に沿って、時刻(t−2)、(t−1)、t、(t+1)、(t+2)における加速度ACを矢印で示した一例を示す。映像の乱れが生じた場合、コンテンツの加速度ACが、実際の被写体の動きとは異なる異常な動きをするので、加速度ACが大きく変化する。
【0035】
具体的には、比較・判定部13が、時間軸に沿って連続する3つの加速度ACを比較する。まず図3において、時刻(t−2)、(t−1)では、双方とも加速度ACが正の値であって閾値Th1を超えている。一方、時刻(t)では、加速度ACが負の値であって、閾値Th2を下回っている。この場合、時刻(t−2)、(t−1)間では加速度ACの向きが同じであるので、映像の乱れを生じていないと判断できる。一方、時刻tでは加速度ACの向きが負となっているので、映像の乱れを生じている可能性がある。
【0036】
次いで、時刻(t+1)では加速度ACの向きが再び正の値に戻り、閾値Th1を超えている。従って、時刻(t−1)、t、(t+1)間では加速度ACが閾値を超え,且つ正、負、正の並びとなっている。このように加速度ACが大きく変化した場合、時刻tで領域#nのブロック内で映像の乱れが生じたと判定できる。同様に、加速度ACが閾値を超え,且つ負、正、負の並びとなっている場合も、映像の乱れが生じたと判定できる。
【0037】
更に、時刻(t+2)では加速度ACの向きが再び負の値に戻ったが、閾値Th2を下回っていない。よって、時刻t、(t+1)、(t+2)間では加速度ACが時間軸に沿って負、正、負の並びとなっているが、閾値を超えていないのでコンテンツの像の動きは正常の範囲内であるとして、時刻(t+1)では映像の乱れを生じていないと判断する。尚、閾値Th1,Th2の値は、装置制御部14からの入力で任意に変更することが可能である。以上の演算及び比較を、全ての小ブロックで行う。
【0038】
比較・判定部13が、映像の乱れが生じたと判定した場合、どのフィールドの、どの小ブロックで映像の乱れが生じたかを示す情報を、アラーム出力部15に入力する。アラーム出力部15は、入力された情報に基づいて、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。このとき、モニタに表示される映像に重ねて、アラームを表示することが好ましく、例えば映像の乱れを検出したフィールドの縁が赤く光るようにすることができる。
【0039】
(映像のブロックノイズの検出)
「映像のブロックノイズ」とは、コンテンツの像が、ブロック状に別の像に変換されてしまう現象をいう。ここでも、HDTVの映像・音声信号を例にとり説明する。図4に示すように、入力されたデジタル映像信号を20msec以下で区切ってサンプリングした際に、検査対象フレームを、水平方向に1920画素、垂直方向に540ラインで表すとする。ここで、m画素、nラインの輝度信号の画素値をY(m,n)で表し、これを左上端として8画素×8ラインの画素ブロック(検査ブロック)を定義する。検査ブロックの範囲は、これに限られない。入力部11から映像・音声信号が入力されたとき、抽出部12は、検査ブロック内の画素値に対して、直交変換である2次元離散フーリエ変換を実行する。尚、直交変換としては,これ以外にも離散コサイン変換、ウェーブレット変換などがあり、いずれの直交変換を用いても同様の態様でブロックノイズの角を検出できる。
【0040】
このとき、検査ブロック内の64個の画素値をY(0,0)・・・、Y(7,7)で表し、フーリエ変換係数をF(u、v)=F(0,0)・・・、F(7,7)で表すと、(12)式の関係が成立する。このフーリエ変換により、高周波成分を抽出することとなる。
【0041】
【数3】
【0042】
比較・判定部13は、抽出部12で行ったフーリエ変換の結果、フーリエ変換係数が以下の条件1〜4のいずれかを満たす場合、その検査ブロックDBが、図4(a)に示すブロックノイズBNの四隅の角のいずれかに存在すると判定する。具体的には、以下の通りである。
[1]条件1が成立する場合、検査ブロックDBの画素Y(6,6)、Y(7,6)、Y(6,7)、Y(7,7)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、図4(b)において示す検査ブロックDB(1)が、ブロックノイズBNの左上にあることを意味する。
[2]条件2が成立する場合、検査ブロックDBの画素Y(0,6)、Y(1,6)、Y(0,7)、Y(1,7)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、図4(b)において示す検査ブロックDB(2)が、ブロックノイズBNの右上にあることを意味する。
[3]条件3が成立する場合、検査ブロックDBの画素Y(6,0)、Y(7,0)、Y(6,1)、Y(7,1)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、図4(b)において示す検査ブロックDB(3)が、ブロックノイズBNの左上にあることを意味する。
[4]条件4が成立する場合、検査ブロックDBの画素Y(0,0)、Y(1,0)、Y(0,1)、Y(1,1)がブロックノイズ内にあることを示し、それ以外の画素がブロックノイズ外にあることを示すので、図4(b)において示す検査ブロックDB(4)が、ブロックノイズBNの左上にあることを意味する。
【0043】
よって、図4(a)の矢印に示すように、検査ブロックDBをフレーム全体にわたって移動させることで、ブロックノイズが発生している場合には、その位置と大きさが分かる。検査対象フレームを例えば4つに分割して、各領域毎にブロックノイズが発生したか否かを検出しても良い。
【0044】
【数4】

但し、WuvはF(u,v)の実数部(A)と虚数部(B)の二乗和の平方根(√(A2+B2))である。
【0045】
ところで、上述した条件のみでは、コンテンツとしてのビルの窓や、映像に挿入された文字などがブロックノイズとして誤って検出される恐れがある。そこで、ブロックノイズと、窓や文字とを区別する必要がある。これは、以下のようにして比較・判定部13が行う。
【0046】
より具体的に説明すると、図5に示すように、検査対象領域(又はフレーム)が、N個の画素(v1〜vN)×M本のライン(h1〜hM)から構成されているとした場合、コンテンツの窓や文字などの場合、同一垂直線もしくは同一水平線(図5では直線VL,HLが相当)上に角が生じる可能性が高い。そこで、角の出現傾向を標準偏差で表すことで、ブロックノイズと、窓や文字とを区別することが可能になる。
【0047】
まず、検査対象領域内の総角数Ncは、角が発生した画素の総数に等しく、また角が発生したラインの総数に等しいから、(13)式で表せる。更に、検査対象領域内で水平方向に発生した角の標準偏差(Dh)2を、(14)式で表し、垂直方向に発生した角の標準偏差(Dv)2を、(15)式で表すものとする。
【0048】
【数5】
【0049】
ここで、角の標準偏差が小さければ、同一垂直線もしくは同一水平線上に角が乗っている傾向が強い。従って、検査対象領域内において、α=N×Dh×Dvを求めたとき、αの値が比較的小さければ、コンテンツに起因する角が多いと推定できる。そこで、比較・判定部13は、検査対象領域内に角が発生していたと判断した場合、閾値Th5に対してαがそれ以上か否かを判断し、α≧Th5である場合に、検査対象領域内にブロックノイズが発生したと判定するのである。尚、閾値Th3〜Th5の値は、装置制御部14からの入力で任意に変更することが可能である。
【0050】
比較・判定部13が、映像のブロックノイズが生じたと判定した場合、角を示す位置情報等を含む情報をアラーム出力部15に入力する。アラーム出力部15は、入力された情報に基づいて、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。このとき、モニタに表示される映像に重ねて、ブロックノイズの角の位置を表示することが好ましい。
【0051】
(音声のエラー検出)
本実施の形態で検出する音声のエラーの1つは、瞬間的に発生し消滅する、いわゆる「プツ」音である。デジタル音声は、例えば4チャンネルで入力されるので、個々のチャンネル毎のエラーを検出する。
【0052】
まず、抽出部12が、図6に示すように、デジタル音声を時間軸に沿って1msecで区切り、例えば48個の音声データをサンプリングする。これ以上の細かいデータは、人間の可聴域を超えるため不要である。更に各音声データに対し、直交変換である離散フーリエ変換により周波数変換を実行する。ここでx(t)は、時刻tにおける音声の振れ幅を示す音声レベルの値である。これにより時刻tにおいて、直流成分を除く23のサンプルデータの高周波成分fj(t)が、(16)式に示すように抽出される。尚、サンプリングは、図6に示すように、例えば0.5msec毎にずらしながら採取する。
【0053】
【数6】
【0054】
(プツ音の検出)
比較・判定部13が、時刻tにおける高周波成分fj(t)から実数部と虚数部の二乗和を計算することで、パワーが得られる。よって全てのサンプルについてパワーを計算し、これをPn(t)、(但しn=1〜23)とする。
【0055】
プツ音のパワーは、サンプルデータ間で一様であることが分かっている。時刻tにおける、サンプルデータm1〜m2までの総合パワーをP(t)とすると、(17)式で表せる。
【0056】
【数7】
【0057】
比較・判定部13は、以下の(18)〜(20)式を満たすとき、プツ音が発生したと判定する。(18)式の条件は、音声信号がゼロでないことを示し、(19)式は、プツ音前後で比較的大きな音声の変化があることを示し、(20)式は、サンプリング時間内でパワーが比較的一定であることを示す。尚、閾値Th6〜Th8、T,m1,m2,n1,n2の値は、装置制御部14からの入力で任意に変更することが可能である。
P(t)≧Th6 (18)
P(t)/P(t−T)≧Th7 且つ P(t)/P(t+T)≧Th7 (19)
n(t)/P(t)≧Th8 (但し、nはサンプルデータ#1〜#23のうち任意の連番n1〜n2のサンプルデータ) (20)
【0058】
(音飛びの検出)
図7は、時間軸を横軸としてパワーPn(t)の変化を示す図である。比較・判定部13は、n=1〜23全てにおいて、以下の(21)〜(23)式を満たすとき、時刻tで音飛びが発生したと判定する。これは時刻tより時間Tにわたって、音声のパワーが閾値Th10を下回っているが、その前後ではパワーが閾値Th9を上回っていることを意味する。尚、閾値Th9,Th10、T,T5の値は、装置制御部14からの入力で任意に変更することが可能である。
n(t−T5)≧Th9 (21)
n(t)、Pn(t+1)、・・・Pn(t+T)≦Th10 (22)
n(t+T−T5)≧Th9 (23)
【0059】
(ノイズ挿入の検出)
図7は、時間軸を横軸としてパワーPn(t)の変化を示す図である。比較・判定部13は、n=1〜23全てにおいて、以下の(24)〜(26)式を満たすとき、時刻tでノイズ挿入が発生したと判定する。これは時刻tより時間Tにわたって、音声のパワーが閾値Th11を上回っているが、その前後ではパワーが閾値Th9を下回っていることを意味する。尚、閾値Th11,Th12、T,T5の値は、装置制御部14からの入力で任意に変更することが可能である。
n(t−T5)≦Th11 (24)
n(t)、Pn(t+1)、・・・Pn(t+T)≧Th12 (25)
n(t+T−T5)≦Th11 (26)
【0060】
比較・判定部13が、音声のエラーが生じたと判定した場合、音声アラーム信号を、アラーム出力部15に入力する。アラーム出力部15は、検査対象となる映像・音声を表示したモニタ(不図示)に、アラームを表示させる。
【産業上の利用可能性】
【0061】
本発明により、体調や個人差により検査の精度が左右される検査者に頼ることなく、高精度に映像や音声のエラーを検出できる。
【符号の説明】
【0062】
10 映像・音声検査装置
11 入力部
12 抽出部
13 比較・判定部
14 制御部
15 アラーム出力部
図1
図2
図3
図4
図5
図6
図7
図8