(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-21
(45)【発行日】2024-07-01
(54)【発明の名称】コンテンツ特徴量抽出装置およびそのプログラム、ならびに、監視装置およびそのプログラム
(51)【国際特許分類】
H04N 17/00 20060101AFI20240624BHJP
G10L 25/60 20130101ALI20240624BHJP
H04N 19/89 20140101ALI20240624BHJP
【FI】
H04N17/00 A
G10L25/60
H04N19/89
(21)【出願番号】P 2020072195
(22)【出願日】2020-04-14
【審査請求日】2023-03-09
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(73)【特許権者】
【識別番号】599161292
【氏名又は名称】株式会社K-WILL
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】岩崎 俊雅
(72)【発明者】
【氏名】合田 貴仁
(72)【発明者】
【氏名】山田 彩香
(72)【発明者】
【氏名】小郷 直人
(72)【発明者】
【氏名】加藤 辰典
(72)【発明者】
【氏名】浜田 高宏
(72)【発明者】
【氏名】川村 琢磨
(72)【発明者】
【氏名】工藤 靖英
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特許第6222854(JP,B2)
【文献】特許第4932741(JP,B2)
【文献】国際公開第2011/089689(WO,A1)
【文献】特開2000-350238(JP,A)
【文献】特開2009-200957(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 17/00
G10L 25/60
H04N 19/89
(57)【特許請求の範囲】
【請求項1】
映像信号を含むコンテンツの特徴量を抽出するコンテンツ特徴量抽出装置であって、
前記映像信号のフレームを予め定めた大きさのブロックに分割する映像フレーム分割部と、
前記ブロックごとに、
画素値の時間方向における2時点の微分値の絶対値がともに閾値以上となる画素を累計するブロック別変動画素累計部と、
前記ブロックごとの累計値を時間方向に二階微分することで、前記フレームにおける映像特徴量を算出するブロック別累計二階微分算出部と、
を備えることを特徴とするコンテンツ特徴量抽出装置。
【請求項2】
前記コンテンツは音声信号を含み、
前記映像信号のフレーム区間ごとに、前記音声信号の予め定めた時間区間に含まれる音声信号の信号値の分散である音声ブロック分散を算出する音声ブロック分散算出部と、
前記音声ブロック分散を時間方向に二階微分した二階微分値を算出するブロック別分散二階微分算出部と、
前記フレーム区間において、前記二階微分値が予め定めた値以上の変動区間の前記二階微分値の絶対値和平均と、前記変動区間に隣接する区間の前記二階微分値の絶対値和平均とを、前記フレーム区間における音声特徴量として算出するフレーム内変動特徴量算出部と、
を備えることを特徴とする請求項1に記載のコンテンツ特徴量抽出装置。
【請求項3】
コンピュータを、請求項1または請求項2に記載のコンテンツ特徴量抽出装置として機能させるためのコンテンツ特徴量抽出プログラム。
【請求項4】
複数のコンテンツ特徴量抽出装置から異なるチャンネルで入力された映像信号を含むコンテンツの特徴量から、前記コンテンツの障害を監視する監視装置であって、
前記映像信号のフレームの予め定めた大きさのブロックごとに、画素値の時間方向における2時点の微分値の絶対値がともに閾値以上となる画素を累計した累計値を時間方向に二階微分した、前記映像信号のフレームごとの映像特徴量であ
る二階微分値の変動の大きさに基づいて、前記映像信号のフレームの障害を検出する映像障害フレーム検出部と、
前記二階微分値の変動の大きさを前記チャンネル間で比較し、障害が発生した映像信号の前記チャンネルを検出する映像障害チャンネル検出部と、
を備えることを特徴とする監視装置。
【請求項5】
前記映像信号のフレーム区間における音声信号の予め定めた時間区間の信号値の分散に対する時間方向の二階微分値が予め定めた値以上となる変動区間の前記二階微分値の絶対値和平均と、前記変動区間に隣接する区間の前記二階微分値の絶対値和平均とを、音声特徴量として前記コンテンツの特徴量に含み、
前記変動区間の絶対値和平均と前記変動区間に隣接する区間の絶対値和平均との比に基づいて、前記フレーム区間における前記音声信号の障害を検出する音声障害フレーム検出部と、
前記変動区間の絶対値和平均を前記チャンネル間で比較し、障害が発生した音声信号の前記チャンネルを検出する音声障害チャンネル検出部と、
を備えることを特徴とする請求項4に記載の監視装置。
【請求項6】
コンピュータを、請求項4または請求項5に記載の監視装置として機能させるための監視プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツ特徴量抽出装置およびそのプログラム、ならびに、監視装置およびそのプログラムに関する。
【背景技術】
【0002】
従来、伝送路上のコンテンツ(映像信号、音声信号)の障害を監視するため、映像信号の特徴量や音声信号の特徴量の時間変化に基づいてエラーを検出する手法が存在する(特許文献1参照)。
また、伝送路上のコンテンツの障害を監視するため、伝送元のコンテンツの特徴量と、伝送後のコンテンツの特徴量とを比較して、エラーの発生の有無を監視する手法が存在する(特許文献2参照)。
これらの従来手法は、映像信号や音声信号のフレーム単位の信号の平均値、分散、パワー等の統計量を用いてエラーを検出している。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6222854号公報
【文献】特許第4932741号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来手法のように、コンテンツの特徴量として、映像信号や音声信号のフレーム単位の統計量を用いた場合、映像信号や音声信号のフレームの一部に、急激に画質や音質が劣化するデジタルクリフ(Digital Cliff)型のノイズが発生すると、統計量の中にノイズの特徴が積分され埋もれてしまうことがある。
そのため、従来手法は、デジタルクリフ型のノイズを検出することが困難であり、さらなるノイズ検出精度を高めた手法が望まれていた。
【0005】
本発明は、このような要望に鑑みてなされたもので、デジタルクリフ型のノイズを精度よく検出することが可能なコンテンツ特徴量を抽出するコンテンツ特徴量抽出装置およびそのプログラム、ならびに、そのコンテンツ特徴量を用いて障害を検出することが可能な監視装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0006】
前記課題を解決するため、本発明に係るコンテンツ特徴量抽出装置は、映像信号を含むコンテンツの特徴量を抽出するコンテンツ特徴量抽出装置であって、映像フレーム分割部と、ブロック別変動画素累計部と、ブロック別累計二階微分算出部と、を備える構成とした。
【0007】
かかる構成において、コンテンツ特徴量抽出装置は、映像フレーム分割部によって、映像信号のフレーム(フィールド)を予め定めた大きさのブロックに分割する。
そして、コンテンツ特徴量抽出装置は、ブロック別変動画素累計部によって、ブロックごとに、画素値の時間方向における2時点の微分値の絶対値がともに閾値以上となる画素を累計する。これによって、ノイズが発生している画素をブロックごとに累計することができる。
そして、コンテンツ特徴量抽出装置は、ブロック別累計二階微分算出部によって、ブロックごとの累計値を時間方向に二階微分することで、フレームにおける映像特徴量をブロックごとに算出する。このように、二階微分値を用いることで、コンテンツ特徴量抽出装置は、画素値の変動において、動きの加速度を求めることになり、短時間で変動するデジタルクリフ型の特徴を抽出することができる。
このコンテンツ特徴量抽出装置は、コンピュータを、前記した各機能部として機能させるためのコンテンツ特徴量抽出プログラムで動作させることができる。
【0008】
また、前記課題を解決するため、本発明に係る監視装置は、複数のコンテンツ特徴量抽出装置から異なるチャンネルで入力された映像信号を含むコンテンツの特徴量から、前記コンテンツの障害を監視する監視装置であって、映像障害フレーム検出部と、映像障害チャンネル検出部と、を備える構成とした。
【0009】
かかる構成において、監視装置は、映像障害フレーム検出部によって、映像信号のフレームの予め定めた大きさのブロックごとに、画素値の時間方向における2時点の微分値の絶対値がともに閾値以上となる画素を累計した累計値を時間方向に二階微分した、映像信号のフレームごとの映像特徴量である二階微分値の変動の大きさに基づいて、映像信号のフレームの障害を検出する。この二階微分値を用いることで、1つの映像信号のみで、一重刺激方式による映像信号そのものの障害を検出することができる。
そして、監視装置は、映像障害チャンネル検出部によって、二階微分値の変動の大きさをチャンネル間で比較し、障害が発生した映像信号のチャンネルを検出する。これによって、二重刺激方式による映像信号のチャンネルの障害を検出することができる。
この監視装置は、コンピュータを、前記した各機能部として機能させるためのコンテンツ監視プログラムで動作させることができる。
【発明の効果】
【0010】
本発明は、以下に示す優れた効果を奏するものである。
本発明のコンテンツ特徴量抽出装置によれば、コンテンツから、デジタルクリフ型のノイズを精度よく検出することが可能なコンテンツ特徴量を抽出することができる。
また、本発明の監視装置によれば、コンテンツ特徴量から、デジタルクリフ型のノイズを検出することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施形態に係る監視システムの構成を示す構成図である。
【
図2】本発明の実施形態に係るコンテンツ特徴量抽出装置の構成を示すブロック構成図である。
【
図3】映像信号のフレームをブロックに分割する処理を説明するための説明図である。
【
図4】画素値の微分処理を説明するための説明図である。
【
図5】デジタルクリフ画素数の二階微分によって映像特徴量を算出する処理を説明するための説明図である。
【
図6】音声信号のブロックを説明するための説明図である。
【
図7】音声ブロックの分散の二階微分によりクリフ波形を抽出する処理を説明するための説明図である。
【
図8】本発明の実施形態に係るコンテンツ特徴量抽出装置の動作を示すフローチャートである。
【
図9】本発明の実施形態に係る監視装置の構成を示すブロック構成図である。
【
図10】障害検出結果の表示画面を示す画面例である。
【
図11】映像特徴量を用いた一重刺激方式によりフレーム障害を検出する動作を示すフローチャートである。
【
図12】音声特徴量を用いた一重刺激方式によりフレーム障害を検出する動作を示すフローチャートである。
【
図13】映像特徴量を用いた二重刺激方式によりフレーム障害のチャンネルを検出する動作を示すフローチャートである。
【
図14】音声特徴量を用いた二重刺激方式によりフレーム障害のチャンネルを検出する動作を示すフローチャートである。
【
図15】監視システムの変形例を説明するための説明図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について図面を参照して説明する。
[監視システム]
最初に、
図1を参照して、本発明の実施形態に係るコンテンツ特徴量抽出装置1および監視装置2を含む監視システムSAの構成について説明する。
【0013】
監視システムSAは、伝送路上のコンテンツを監視し、コンテンツの障害を検出するものである。
ここでは、監視システムSAとして、2地点(地点A、地点B)を中継する伝送路上でコンテンツを監視するシステムの例で説明する。
監視システムSAは、複数のコンテンツ特徴量抽出装置1と、監視装置2とをIPネットワーク等のネットワークNで接続して構成する。なお、監視装置2には、障害の検出結果を表示するための表示装置3を接続している。
また、ここでは、中継元(地点A)から放送局(地点B)まで、カメラ4が撮影したコンテンツ(映像信号Vs、音声信号As)を、通信衛星伝送(CS)で伝送する本線と、マイクロ波伝送(FPU)で伝送する予備線とで、中継回線を二重化している。
【0014】
コンテンツ特徴量抽出装置1は、コンテンツから、デジタルクリフ型のノイズ(以下、デジタルクリフという)を検出可能なコンテンツ特徴量を抽出し、監視装置2に出力するものである。
ここでは、監視システムSAは、4台のコンテンツ特徴量抽出装置1A1,1A2,1B1,1B2を備える。
【0015】
コンテンツ特徴量抽出装置1A1は、カメラ4と通信衛星伝送を行う中継車5との間の伝送路である本線AMで伝送されるコンテンツから特徴量を抽出するものである。
コンテンツ特徴量抽出装置1A2は、カメラ4とマイクロ波伝送を行う中継伝送装置7との間の伝送路である予備線ASで伝送されるコンテンツの特徴量を抽出するものである。
【0016】
コンテンツ特徴量抽出装置1B1は、通信衛星伝送の受信装置6と放送局内の受信設備(不図示)との間の伝送路である本線BMで伝送されるコンテンツから特徴量を抽出するものである。
コンテンツ特徴量抽出装置1B2は、マイクロ波伝送を行う中継伝送装置8と放送局内の受信設備(不図示)との間の伝送路である予備線BSで伝送されるコンテンツから特徴量を抽出するものである。
コンテンツ特徴量抽出装置1A1,1A2,1B1,1B2は、コンテンツ(映像信号Vs、音声信号As)から抽出したコンテンツ特徴量である映像特徴量Cと音声特徴量Z,Z′とを、ネットワークNを介して監視装置2に送信する。
【0017】
監視装置2は、複数のコンテンツ特徴量抽出装置1から異なるチャンネル(入手経路)で入力されたコンテンツ特徴量から、コンテンツの障害を監視するものである。
この監視装置2は、コンテンツ特徴量抽出装置1で抽出されたコンテンツ特徴量から、映像フレームの時間区間におけるデジタルクリフを検出し、各地点におけるコンテンツの障害を監視する。また、監視装置2は、コンテンツ特徴量抽出装置1が抽出するコンテンツ特徴量から、一重刺激障害方式および二重刺激方式により障害検出を行う。
一重刺激方式は、1つのコンテンツ特徴量抽出装置1が抽出するコンテンツ特徴量そのものから、デジタルクリフを検出する方式である。また、二重刺激方式は、2つのコンテンツ特徴量抽出装置1(例えば、1A1,1A2)が抽出するコンテンツ特徴量を比較することで、デジタルクリフを検出する方式である。
以下、コンテンツ特徴量抽出装置1および監視装置2の構成および動作について詳細に説明する。
【0018】
[コンテンツ特徴量抽出装置の構成]
まず、
図2を参照(適宜
図1参照)して、コンテンツ特徴量抽出装置1の構成について説明する。
コンテンツ特徴量抽出装置1は、映像特徴量抽出部10と、音声特徴量抽出部11と、特徴量送出部12と、を備える。
【0019】
映像特徴量抽出部10は、コンテンツの映像信号Vsから、映像特徴量を抽出するものである。
映像特徴量抽出部10は、映像フレーム分割部100と、ブロック別変動画素累計部101と、ブロック別累計二階微分算出部102と、を備える。
【0020】
映像フレーム分割部100は、映像信号Vsのフレームを予め定めた大きさのブロックに分割するものである。
ブロックの大きさは特に限定するものではないが、水平16画素×垂直16画素、水平32画素×垂直32画素等である。
映像フレーム分割部100は、
図3に示すように、時系列(…,t-1,t,t+1,…)に連続するフレームFを、予め定めた大きさのブロックBに分割するように、水平方向にH分割、垂直方向にV分割する。
なお、時刻tのフレームFにおける分割された水平位置h、垂直位置vのブロックB内の座標(x,y)の画素値をS(t,x,y,v,h)とする。
映像フレーム分割部100は、分割したブロックをフレームごとにブロック別変動画素累計部101に出力する。
【0021】
ブロック別変動画素累計部101は、映像フレーム分割部100で分割されたブロックごとに、時間方向の画素値の微分値が予め定めた閾値以上に変動する画素を累計するものである。この閾値以上に変動する画素は、デジタルクリフが発生した画素とみなすことができる。
【0022】
ここで、
図4を参照して、ブロック別変動画素累計部101が行う処理について詳細に説明する。
図4は、時系列(…,t-1,t,t+1,…)に連続するフレームFとフレームF内の同一位置の画素Sを示している。
ブロック別変動画素累計部101は、画素Sの画素値S(t,x,y,v,h)を用いて時間方向に微分処理を行う。
【0023】
デジタルクリフは、発生時にフレーム間で大きな画素値の変化(クリフ=崖)が生じ、消失時に再びフレーム間で大きな画素値の変化が生じる現象である。そこで、ブロック別変動画素累計部101は、画素値S(t,x,y,v,h)の時間方向の2時点の微分値の大きさがともに閾値以上となる画素をデジタルクリフが発生した画素と判定する。
そして、ブロック別変動画素累計部101は、ブロックごとにデジタルクリフが発生した画素を累計する。
具体的には、時刻tのフレームにおいてデジタルクリフが発生した画素を累計する場合、ブロック別変動画素累計部101は、連続する5フレーム(t-2,t-1,t,t+1,t+2)を用いて、以下の式(1)~式(3)により、デジタルクリフの発生の判定と画素の累計とを行う。
【0024】
【0025】
dS(t,x,y,v,h)/dtは、時刻tにおける位置(v,h)のブロックB内の座標(x,y)の画素Sにおける微分値を示す。具体的には、画素値の差分であって、S(t-1,x,y,v,h)-S(t,x,y,v,h)である。
dS(t+1,x,y,v,h)/dt、dS(t+2,x,y,v,h)/dt、dS(t-1,x,y,v,h)/dtも時刻が異なるだけで、dS(t,x,y,v,h)/dtと同様、画素Sにおける微分値である。
【0026】
B(t,v,h)は、時刻tにおける位置(v,h)のブロックBのデジタルクリフが発生した画素数(累計値)を示す。なお、B(t,v,h)の初期値は“0”とし、前記式(1)~式(3)のAND(論理積)条件を満たす場合に、それぞれ加算される。
【0027】
前記式(1)は、
図4の(A)に示すように、時刻t-1のフレームと時刻tのフレームとの画素値の差、および、時刻tのフレームと時刻t+1のフレームとの画素値の差を、デジタルクリフの発生の判定のために用いる。
これによって、時刻tのフレームにノイズが発生し、その前後で画素値の大きな(閾値“Th1”以上)の変化が発生するデジタルクリフを検出することができる。
【0028】
前記式(2)は、
図4の(B)に示すように、時刻t-1のフレームと時刻tのフレームとの画素値の差、および、時刻t+1のフレームと時刻t+2のフレームとの画素値の差を、デジタルクリフの発生の判定のために用いる。
これによって、時刻t,t+1の2フレームにノイズが発生し、その前後で画素値の大きな(閾値“Th1”以上)の変化が発生するデジタルクリフを検出することができる。
前記式(3)は、
図4の(C)に示すように、時刻t-2のフレームと時刻t-1のフレームとの画素値の差、および、時刻tのフレームと時刻t+1のフレームとの画素値の差を、デジタルクリフの発生の判定のために用いる。
これによって、時刻t-1,tの2フレーム連続するノイズが発生し、その前後で画素値の大きな(閾値“Th1”以上)の変化が発生するデジタルクリフを検出することができる。
【0029】
ここでは、1フレームまたは2フレーム連続でノイズが発生する場合におけるデジタルクリフの検出例を説明した。しかし、ノイズが発生する連続フレーム数が3フレーム以上でもデジタルクリフの検出を可能とするには、判定に使用するフレーム数を多くすればよい。その場合、ノイズが発生する連続フレームには必ず時刻tのフレームが含まれる。
例えば、ノイズが3フレームまで継続する場合、ブロック別変動画素累計部101は、
図4の(D)に示すように、時刻t-2のフレームと時刻t-1のフレームとの差、および、時刻t+1のフレームと時刻t+2のフレームとの差、
図4の(E)に示すように、時刻t-1のフレームと時刻tのフレームとの差、および、時刻t+2のフレームと時刻t+3のフレームとの差、
図4(F)に示すように、時刻t-3のフレームと時刻t-2のフレームとの差、および、時刻tのフレームと時刻t+1のフレームとの差を、さらに判定の条件に追加すればよい。
【0030】
また、ノイズが4フレームまで継続する場合、ブロック別変動画素累計部101は、
図4の(G)~(J)に示すように、時刻tのフレームを含んで連続する4フレームの前後におけるフレーム間の画素値の差を、判定の条件に追加すればよい。
もちろん、ノイズが5フレーム以上継続する場合を許容する場合も、同様にフレーム間隔を開けて、判定の条件に追加すればよい。
図2に戻って、コンテンツ特徴量抽出装置1の構成について説明を続ける。
【0031】
ブロック別変動画素累計部101は、累計したブロック別のデジタルクリフの画素数を、フレームごとにブロック別累計二階微分算出部102に出力する。
ここでは、ブロック別変動画素累計部101は、前記式(1)等によって累計されたB(t,v,h)をブロック別累計二階微分算出部102に出力する。
【0032】
ブロック別累計二階微分算出部102は、ブロック別変動画素累計部101で累計されたブロック別のデジタルクリフが発生した画素数(累計値)を、時間方向に二階微分することで、フレームにおけるブロック別の映像特徴量を算出するものである。
ブロック別のデジタルクリフが発生した画素数B(t,v,h)は、
図4で説明したように、複数のフレーム間でデジタルクリフの有無を判定し、その数を累計したものであるため、通常、ゼロではない値をとり、時間方向に滑らかに変化する。そのため、B(t,v,h)を二階微分して、動きの加速度を求めると、ほぼ一定の値、あるいはゼロ近傍の値となる。
しかし、ブロックノイズのように、1フレームまたは2フレームという非常に短い時間間隔内に2回のデジタルクリフが存在する場合、B(t,v,h)を二階微分すると、加速度の急激な上昇と下降というδ超関数、すなわち、パルス状の波形となる。
【0033】
ここで、
図5を参照して、ブロック別累計二階微分算出部102が行う処理について詳細に説明する。
図5は、時系列(…,t-1,t,t+1,…)に連続するフレームFとフレームF内の同一位置のブロックBを示している。
ブロック別累計二階微分算出部102は、ブロックBごとの画素数B(t,v,h)を用いて時間方向に二階微分の演算を行う。
すなわち、ブロック別累計二階微分算出部102は、以下の式(4)により、ブロック別の映像特徴量C(t,v,h)を算出する。
【0034】
【0035】
このように算出された映像特徴量C(t,v,h)は、1フレームまたは2フレームという非常に短い時間間隔内に2回のデジタルクリフが存在する場合、
図5に示すように、δ超関数となり、デジタルクリフの特徴を表すことができる。
図2に戻って、コンテンツ特徴量抽出装置1の構成について説明を続ける。
【0036】
ブロック別累計二階微分算出部102は、算出した時系列のフレームごとのブロック別の映像特徴量C(t,v,h)を特徴量送出部12に出力する。
このように、映像特徴量抽出部10は、映像信号Vsから、フレームごとに、デジタルクリフの特徴を表したブロック別の値を特徴量として抽出するため、映像信号に比べて少量のデータで特徴量を生成することができる。
【0037】
音声特徴量抽出部11は、コンテンツの音声信号Asから、音声特徴量を抽出するものである。
音声特徴量抽出部11は、音声ブロック分散算出部110と、ブロック別分散二階微分算出部111と、フレーム内変動特徴量算出部112と、を備える。
【0038】
音声ブロック分散算出部110は、映像信号Vsのフレーム区間ごとに、音声信号Asの予め定めた時間区間に含まれる音声信号の信号値(サンプル値)の分散である音声ブロック分散を算出するものである。
具体的には、音声ブロック分散算出部110は、
図6に示すように、予め定めた時間区間のNサンプルの音声信号の信号値x(t)~x(t+N)から音声ブロック分散を算出する。
ここで、時間区間の時刻(例えば、先頭時刻)をTとし、当該時間区間内の音声信号のサンプル数をNとしたとき、音声ブロック分散算出部110は、以下の式(5)により、音声ブロック分散P(T)を算出する。
【0039】
【0040】
なお、A(t)は、以下の式(6)で算出される信号値x(t)~x(t+N)の平均値である。
【0041】
【0042】
これによって、音声ブロック分散算出部110は、音声信号Asを、N個のサンプルの信号値で区分した音声ブロックごとのデータに変換する。
図2に戻って、コンテンツ特徴量抽出装置1の構成について説明を続ける。
音声ブロック分散算出部110は、算出した音声ブロック分散をブロック別分散二階微分算出部111に出力する。
【0043】
ブロック別分散二階微分算出部111は、映像信号のフレーム区間ごとに、音声ブロック分散算出部110で算出された時系列の音声ブロック分散を、時間方向に二階微分するものである。
このブロック別分散二階微分算出部111は、ブロック別累計二階微分算出部102と同様に、二階微分により動きの加速度を求める。
すなわち、ブロック別分散二階微分算出部111は、以下の式(7)により、音声ブロック分散P(T)の二階微分値P″(T)を算出する。
【0044】
【0045】
ブロック別分散二階微分算出部111は、算出した音声ブロック分散P(T)の二階微分値P″(T)を、フレーム内変動特徴量算出部112に出力する。
【0046】
フレーム内変動特徴量算出部112は、ブロック別分散二階微分算出部111で算出された二階微分値の時系列の変動から、映像信号のフレーム区間ごとに、デジタルクリフ型の変動の特徴を数値化した音声特徴量を算出するものである。
フレーム内変動特徴量算出部112は、時系列の音声ブロック分散の二階微分値から、閾値判定により、デジタルクリフ型の変動の波形(クリフ波形)を検出する。そして、フレーム内変動特徴量算出部112は、映像信号のフレーム区間ごとに、クリフ波形に含まれる二階微分値の絶対値加算平均と、クリフ波形の予め定めた周辺区間の波形(周辺波形)に含まれる二階微分値の絶対値加算平均とを、クリフ波形とその周辺波形との特徴を数値化した音声特徴量とする。
【0047】
具体的には、フレーム内変動特徴量算出部112は、音声ブロック分散の二階微分値の時系列の波形で、正から負、負から正に変動するゼロクロスポイントの中央および前後の二階微分値の大きさが予め定めた閾値以上で、かつ、周辺の二階微分値の大きさが予め定めた閾値以下の波形を構成する二階微分値を抽出する。
すなわち、フレーム内変動特徴量算出部112は、映像信号のフレーム区間において、以下の式(8)の条件を満たす二階微分値P″(T-m),…,P″(T+m)を抽出する。
【0048】
【0049】
この式(8)の条件は、(T-1)および(T+1)における二階微分値が閾値“Th2”以上、Tにおける二階微分値が閾値“-Th2”以下で、(T-m),…,(T-2),(T+2),…,(T+m)における二階微分値の絶対値が閾値“Th3”以下であるという条件である。
ここで、閾値“Th2”は、デジタルクリフの発生を判定するための予め定めた値である。閾値“Th3”は、デジタルクリフが発生していないことを判定するための、“Th2”よりも小さい予め定めた値である。
これによって、フレーム内変動特徴量算出部112は、映像信号のフレーム区間において、デジタルクリフが発生した時点とその前後の区間の二階微分値を抽出する。
【0050】
なお、映像信号のフレーム区間において、デジタルクリフは複数発生する場合があるため、
図7に示すように、抽出した二階微分値を、#1,…,#e,…,#Eとナンバリングして識別することとする。以下、#e番目の二階微分値を、P″(T,e)とする。
そして、フレーム内変動特徴量算出部112は、以下の式(9)に示すように、デジタルクリフが発生した時点である“T-1”,“T”,“T+1”の二階微分値の絶対値和平均を、フレームF(時刻t)内のデジタルクリフの特徴を表す音声特徴量Z(t)として算出する。
【0051】
【0052】
また、フレーム内変動特徴量算出部112は、以下の式(10)に示すように、デジタルクリフが発生した時点の前後の区間である“T-m”,…,“T-2”、および、“T+2”,…,“T+m”の二階微分値の絶対値和平均を、フレームF内のデジタルクリフの前後の特徴を表す音声特徴量Z′(F)として算出する。
【0053】
【0054】
このように算出された音声特徴量Z(t),Z′(t)は、1フレームまたは2フレームという非常に短い時間間隔内に2回のデジタルクリフが存在する場合、音声特徴量Z(t)が音声特徴量Z′(t)と比較して大きな値を持つことになり、デジタルクリフの特徴を表すことができる。
【0055】
フレーム内変動特徴量算出部112は、算出した時系列のフレームごとの音声特徴量Z(t),Z′(t)を特徴量送出部12に出力する。
このように、音声特徴量抽出部11は、音声信号Asから、映像信号Vsのフレーム区間ごとに、デジタルクリフの特徴を表した値を特徴量として抽出するため、音声信号に比べて少量のデータで特徴量を生成することができる。
【0056】
特徴量送出部12は、映像特徴量抽出部10で抽出されたフレームごとのブロック別の映像特徴量C(t,v,h)と、音声特徴量抽出部11で抽出されたフレーム区間に対応する音声特徴量Z(t),Z′(t)とを、コンテンツ特徴量として、ネットワークNを介して、監視装置2に送出するものである。
この特徴量送出部12は、1フレーム分の映像特徴量C(t,v,h)と、フレーム区間に対応する音声特徴量Z(F),Z′(F)とを、予め定めた順番で連結した数値列として、フレームごとに監視装置2に送出する。
【0057】
これによって、コンテンツ特徴量抽出装置1は、映像信号および音声信号から、映像信号および音声信号に比べて少ないデータ量で、デジタルクリフの特徴を表したコンテンツ特徴量を抽出することができる。
なお、コンテンツ特徴量抽出装置1は、コンピュータを、前記した各機能部とし機能させるためのプログラム(コンテンツ特徴量抽出プログラム)で動作させることができる。
【0058】
[コンテンツ特徴量抽出装置の動作]
次に、
図8を参照(構成については適宜
図2参照)して、コンテンツ特徴量抽出装置1の動作について説明する。なお、
図8は、映像信号の1フレーム分の動作を示し、順次、フレームごとにこの動作が繰り返される。
コンテンツ特徴量抽出装置1は、映像特徴量抽出部10によるステップS1からS4までの動作と、音声特徴量抽出部11によるステップS5からS8までの動作とを、映像のフレーム区間ごとに並列して行う。
【0059】
ステップS1において、映像フレーム分割部100は、映像信号Vsを構成するフレームを、フレームごとに予め定めた大きさのブロックに分割する。
ステップS2において、ブロック別変動画素累計部101は、ステップS1で分割されたブロックごとに、画素値の時間方向の微分値を算出する。
ステップS3において、ブロック別変動画素累計部101は、ステップS2で算出された微分値が予め定めた閾値以上の画素をデジタルクリフが発生した画素としてブロックBごとに累計する(前記式(1)~式(3)参照)。
ステップS4において、ブロック別累計二階微分算出部102は、ステップS3で累計されたブロック別のデジタルクリフが発生した画素数を、時間方向に二階微分して、ブロック別の映像特徴量Cを算出する(前記式(4)参照)。
このステップS1からS4までの動作によって、映像フレームのブロックごとの映像特徴量が生成される。
【0060】
ステップS5において、音声ブロック分散算出部110は、映像信号のフレーム区間ごとに、音声信号Asの予め定めた時間区間に含まれる音声信号Asの信号値の分散(音声ブロック分散)を算出する(前記式(5),式(6)参照)。
ステップS6において、ブロック別分散二階微分算出部111は、映像信号のフレーム区間ごとに、ステップS5で算出された時系列の音声ブロック分散を、時間方向に二階微分する(前記式(7)参照)。
ステップS7において、フレーム内変動特徴量算出部112は、ステップS6で算出された二階微分値の時系列の変動から、デジタルクリフが発生した時点とその前後の区間の二階微分値をクリフ波形および周辺波形として抽出する(前記式(8)参照)。
ステップS8において、フレーム内変動特徴量算出部112は、デジタルクリフが発生した時点(クリフ波形)の二階微分値の絶対値和平均Zと、デジタルクリフが発生した時点の前後の区間(周辺波形)の二階微分値の絶対値和平均Z′とを、音声特徴量として算出する(前記式(9),式(10)参照)。
このステップS5からS8までの動作によって、映像フレームの時間区間に対応した音声特徴量が生成される。
【0061】
ステップS9において、特徴量送出部12は、ステップS4で算出された映像特徴量Cと、ステップS8で算出された音声特徴量Z,Z′とを、コンテンツ特徴量として、ネットワークNを介して、監視装置2に送出する。
【0062】
[監視装置の構成]
次に、
図9を参照(適宜
図1参照)して、監視装置2の構成について説明する。
監視装置2は、特徴量受信部20と、特徴量同期部21と、特徴量記憶部22と、一重刺激障害検出部23と、二重刺激障害検出部24と、監視画面表示部25と、アラーム発報部26と、アラームログ記憶部27と、を備える。
【0063】
特徴量受信部20は、コンテンツ特徴量抽出装置1で抽出されたコンテンツ特徴量(映像特徴量C、音声特徴量Z,Z′)を、ネットワークNを介して受信するものである。
特徴量受信部20は、受信したコンテンツ特徴量を特徴量同期部21と、特徴量記憶部22と、一重刺激障害検出部23と、に出力する。
【0064】
特徴量同期部21は、複数のコンテンツ特徴量抽出装置1から異なるチャンネルで受信したコンテンツ特徴量の同期を行うものである。
ここでは、特徴量同期部21は、個々の地点のコンテンツ特徴量抽出装置1から受信したコンテンツ特徴量の相互相関を演算し、相関が最も高くなるようにコンテンツ特徴量の同期合わせを行う。
特徴量同期部21は、同期合わせを行ったコンテンツ特徴量を二重刺激障害検出部24に出力する。なお、特徴量同期部21は、同期状態を監視画面表示部25に通知することとしてもよい。
【0065】
特徴量記憶部22は、特徴量受信部20で受信したコンテンツ特徴量抽出装置1ごとのコンテンツ特徴量を記憶するものである。この特徴量記憶部22は、ハードディスク等の一般的な記憶媒体で構成することができる。
特徴量記憶部22にコンテンツ特徴量を記憶しておくことで、障害発生後に、障害発生時刻、障害発生時点等の解析が可能になる。
【0066】
一重刺激障害検出部23は、コンテンツ特徴量抽出装置1から受信したコンテンツ特徴量から、障害を検出するものである。この一重刺激障害検出部23は、単独のコンテンツ特徴量を用いて障害検出を行う一重刺激方式の検出部である。この一重刺激障害検出部23は、主に映像信号および音声信号そのものの評価を行う。
ここでは、一重刺激障害検出部23は、映像障害フレーム検出部230と、音声障害フレーム検出部231と、を備える。
【0067】
映像障害フレーム検出部230は、映像特徴量から、フレームの障害(デジタルクリフ)を検出するものである。
具体的には、映像障害フレーム検出部230は、以下の式(11)および式(12)の条件を満たすブロックが予め定めた閾値以上であるフレームを障害フレームとして検出する。
【0068】
【0069】
式(11)の条件は、時刻t、位置(v,h)のブロックのデジタルクリフの特徴を示す映像特徴量C(t,v,h)が、予め定めた閾値ThV1以上であるという条件である。式(12)の条件は、映像特徴量C(t,v,h)が、時系列で前後のTs(2以上の偶数)個のフレームにおける映像特徴量に対して、予め定めた閾値ThV2以上の割合で大きいという条件である。
そして、映像障害フレーム検出部230は、フレーム内のすべて位置(v,h)において、前記式(11)および式(12)を満たすブロック数が予め定めた閾値ThV3以上であるフレームを障害(デジタルクリフ)が発生したフレームと判定する。
【0070】
映像障害フレーム検出部230は、各地点の映像特徴量とともに、検出結果(地点、時刻)を監視画面表示部25に出力する。また、映像障害フレーム検出部230は、障害を検出した場合、検出結果(時刻、地点)をアラーム発報部26に出力するとともに、アラームログ記憶部27に記憶する。
【0071】
音声障害フレーム検出部231は、音声特徴量から、フレーム(映像フレームの区間)の障害(デジタルクリフ)を検出するものである。
具体的には、音声障害フレーム検出部231は、時刻tのフレームにおける音声特徴量Z(t)とZ′(t)との比(Z(t)/Z′(t))が予め定めた閾値ThA1以上のフレームを、音声の障害(デジタルクリフ)が発生したフレームと判定する。
音声障害フレーム検出部231は、各地点の音声特徴量とともに、検出結果(地点、時刻)を監視画面表示部25に出力する。また、音声障害フレーム検出部231は、障害を検出した場合、検出結果(時刻、地点)をアラーム発報部26に出力するとともに、アラームログ記憶部27に記憶する。
これによって、一重刺激障害検出部23は、単独のコンテンツ特徴量から、フレームごとの障害を検出することができる。
【0072】
二重刺激障害検出部24は、特徴量同期部21で同期したコンテンツ特徴量を比較して、障害を検出するものである。この二重刺激障害検出部24は、一対のコンテンツ特徴量抽出装置1から抽出されたコンテンツ特徴量を用いて障害検出を行う二重刺激方式の検出部である。この二重刺激障害検出部24は、異なるチャンネルのコンテンツ特徴量を比較することで、処理系の評価を行う。
ここでは、二重刺激障害検出部24は、映像障害チャンネル検出部240と、音声障害チャンネル検出部241と、を備える。
【0073】
映像障害チャンネル検出部240は、異なる一対のチャンネル(一方をチャンネルA、他方をチャンネルBとする)ごとに、映像特徴量から、チャンネルの障害を検出するものである。なお、映像障害チャンネル検出部240は、すべてのチャンネルの組み合わせで障害の検出を行うこととする。
具体的には、映像障害チャンネル検出部240は、フレームごとに、チャンネルAの映像特徴量CAが予め定めた閾値以上、かつ、チャンネルAの映像特徴量CAとチャンネルBの映像特徴量CBとの差(CA-CB)が予め定めた閾値以上、かつ、チャンネルAの映像特徴量CAとチャンネルBの映像特徴量CBとの比(CA/CB)が予め定めた閾値以上のブロックをチャンネルAにおいて累計する。チャンネルBにおいてもチャンネルA,Bを入れ替えただけで同様に累計する。
そして、映像障害チャンネル検出部240は、その累計値が予め定めた閾値以上で、かつ、他方のチャンネルよりも多いチャンネルを、フレームの障害が発生したチャンネルと判定する。
【0074】
映像障害チャンネル検出部240は、検出結果を監視画面表示部25に出力する。また、映像障害チャンネル検出部240は、障害を検出した場合、検出結果(時刻、チャンネル)をアラーム発報部26に出力するとともに、アラームログ記憶部27に記憶する。
【0075】
音声障害チャンネル検出部241は、異なる一対のチャンネル(一方をチャンネルA、他方をチャンネルBとする)ごとに、音声特徴量から、チャンネルの障害を検出するものである。
具体的には、音声障害チャンネル検出部241は、フレームごとに、チャンネルAの音声特徴量ZAとチャンネルBの音声特徴量ZBとの比(ZA/ZB)が予め定めた閾値以上、かつ、チャンネルAの音声特徴量ZAとチャンネルBの音声特徴量ZBとの差(ZA-ZB)が予め定めた閾値以上の場合、チャンネルAをフレームの障害が発生したチャンネルと判定する。チャンネルBにおいてもチャンネルA,Bを入れ替えただけで同様に判定する。
【0076】
音声障害チャンネル検出部241は、検出結果を監視画面表示部25に出力する。また、音声障害チャンネル検出部241は、障害を検出した場合、検出結果(時刻、チャンネル)をアラーム発報部26に出力するとともに、アラームログ記憶部27に記憶する。
これによって、二重刺激障害検出部24は、一対のチャンネルのコンテンツ特徴量から、チャンネルの障害を検出することができる。
【0077】
監視画面表示部25は、一重刺激障害検出部23および二重刺激障害検出部24から通知される検出結果に基づいて監視画面を生成し、表示装置3に表示するものである。
なお、監視画面表示部25が表示する内容は、どのコンテンツ特徴量抽出装置1から入力したコンテンツ特徴量から障害が検出されたか否かを示す情報であればその形式は問わない。
【0078】
図10を参照(適宜
図1参照)して、監視画面表示部25が表示する監視画面30の画面例について説明する。なお、ここでは、本線A
MをチャンネルA、予備線A
SをチャンネルA′、本線B
MをチャンネルB、予備線B
SをチャンネルB′とする。
【0079】
監視画面30は、特徴量グラフ表示領域31(31A1,31A2,31B1,31B2)と、特徴量差分グラフ表示領域32(32AA1,32BB1,32AB1,321AB2)と、警告表示領域33と、特徴量取得状態表示領域34と、監視判定表示領域35と、障害検出状態表示領域36と、を有している。
【0080】
特徴量グラフ表示領域31は、コンテンツ特徴量をグラフ化して表示する領域である。「映像」は、例えば、フレームを構成するブロックの特徴量の総和をフレームごとに時系列に表示したグラフである。「音声」は、例えば、映像のフレームに対応した音声特徴量Zを時系列に表示したグラフである。なお、「音声1」および「音声2」は、音声チャンネルが2つある場合(例えば、主音声、副音声)のそれぞれの特徴量である。
特徴量グラフ表示領域31A1は、コンテンツ特徴量抽出装置1A1が抽出したチャンネルAの特徴量グラフである。
特徴量グラフ表示領域31A2は、コンテンツ特徴量抽出装置1A2が抽出したチャンネルA′の特徴量グラフである。
特徴量グラフ表示領域31B1は、コンテンツ特徴量抽出装置1B1が抽出したチャンネルBの特徴量グラフである。
特徴量グラフ表示領域31B2は、コンテンツ特徴量抽出装置1B2が抽出したチャンネルB′の特徴量グラフである。
【0081】
特徴量差分グラフ表示領域32は、2つのチャンネルのコンテンツ特徴量の差分をグラフ化して表示する領域である。
特徴量差分グラフ表示領域32AA1は、チャンネルAとチャンネルA′とのコンテンツ特徴量の差分グラフである。
特徴量差分グラフ表示領域32BB1は、チャンネルBとチャンネルB′とのコンテンツ特徴量の差分グラフである。
特徴量差分グラフ表示領域32AB1は、チャンネルAとチャンネルBとのコンテンツ特徴量の差分グラフである。
特徴量差分グラフ表示領域32AB2は、チャンネルA′とチャンネルB′とのコンテンツ特徴量の差分グラフである。
【0082】
警告表示領域33は、障害の発生状態を表示する領域である。ここでは、地点Bで障害が発生した状態を示している。なお、例えば、地点Bの障害とは、チャンネルBまたはチャンネルB′のフレームにおいて一重刺激方式で障害が検出された状態、あるいは、チャンネルA,BまたはチャンネルB,B′のチャンネルBにおいて二重刺激方式で障害が検出された状態である。
【0083】
特徴量取得状態表示領域34は、各チャンネルにおけるコンテンツ特徴量の取得状態を示す領域である。ここでは、コンテンツ特徴量の取得状態としては、特徴量同期部21(
図9参照)から通知される同期状態を示している。
【0084】
監視判定表示領域35は、一重刺激方式または二重刺激方式による障害判定の結果を表示する領域である。ここでは、地点Bを示すアイコンの色、パターン等によって、チャンネルBのフレームにおいて一重刺激方式で障害が検出された状態を示している。また、矢印の色、パターン等によって、チャンネルA,Bにおいて二重刺激方式で障害が検出された状態、チャンネルB,B′において二重刺激方式で障害が検出された状態を示している。
【0085】
障害検出状態表示領域36は、障害が検出された履歴を表示する領域である。ここでは、障害が発生した時刻と、障害内容とを対応付けて表示した状態を示している。
このように、監視画面表示部25は、障害状態をリアルタイムで表示装置3の監視画面30に表示することで、運用者が障害の地点や症状を素早く発見することができる。
図9に戻って、監視装置2の構成について説明を続ける。
【0086】
アラーム発報部26は、一重刺激障害検出部23または二重刺激障害検出部24から障害発生時の検出結果を入力し、アラームを発報するものである。
このアラーム発報部26は、例えば、アラームメッセージとして、運用者の端末(不図示)にSNMP(Simple Network Management Network)トラップで検出結果を送信することとしてもよい。
【0087】
アラームログ記憶部27は、一重刺激障害検出部23または二重刺激障害検出部24が検出した障害のログ(アラームログ)を記憶するものである。このアラームログ記憶部27は、ハードディスク等の一般的な記憶媒体で構成することができる。
アラームログ記憶部27に、アラームログを記憶しておくことで、障害発生後に、障害発生時刻、障害発生時点等の解析が可能になる。
これによって、監視装置2は、複数のコンテンツ特徴量抽出装置1で抽出されたコンテンツ特徴量から、映像信号および音声信号におけるデジタルクリフ型のノイズを検出することができる。
なお、監視装置2は、コンピュータを、前記した各機能部とし機能させるためのプログラム(監視プログラム)で動作させることができる。
【0088】
[監視装置の動作]
次に、
図11~
図14を参照(構成については適宜
図9参照)して、監視装置2の動作について説明する。ここでは、一重刺激障害検出部23および二重刺激障害検出部24の動作について説明する。
【0089】
まず、
図11を参照して、一重刺激障害検出部23の映像障害フレーム検出部230の動作を説明する。なお、ここでは、映像信号の1フレームに対する動作のみを示し、時系列にフレームが入力されるたびに順次この動作が繰り返される。
【0090】
ステップS10において、映像障害フレーム検出部230は、初期値設定として、時刻tのフレームのブロックの位置(v,h)を(1,1)に設定するとともに、カウンタcnt(t)を“0”に設定する。
ステップS11において、映像障害フレーム検出部230は、映像特徴量C(t,v,h)を入力する。
【0091】
ステップS12において、映像障害フレーム検出部230は、映像特徴量C(t,v,h)が予め定めた閾値ThV1以上であるか否かを判定する。
ここで、映像特徴量C(t,v,h)がThV1未満の場合(S12でNo)、映像障害フレーム検出部230は、ブロックの位置(v,h)を更新して、ステップS11に動作を戻す。一方、映像特徴量C(t,v,h)がThV1以上の場合(S12でYes)、映像障害フレーム検出部230は、ステップS13に動作を進める。
【0092】
ステップS13において、映像障害フレーム検出部230は、映像特徴量C(t,v,h)が、時系列で前後の予め定めた数のフレームにおける映像特徴量に対して、予め定めた閾値ThV2以上の割合で大きいか否かを判定する(前記式(12)参照)。
ここで、映像特徴量C(t,v,h)が時系列の前後の映像特徴量に対して、ThV2倍未満の場合(S13でNo)、映像障害フレーム検出部230は、ブロックの位置(v,h)を更新して、ステップS11に動作を戻す。一方、映像特徴量C(t,v,h)が時系列の前後の映像特徴量に対して、ThV2倍以上の場合(S13でYes)、映像障害フレーム検出部230は、ステップS14に動作を進める。
ステップS14において、映像障害フレーム検出部230は、カウンタcnt(t)に“1”を加算する。
【0093】
ステップS15において、映像障害フレーム検出部230は、フレーム内のすべての位置(v,h)の処理が完了したか否かを判定する。
ここで、すべての位置(v,h)の処理が完了していない場合(S15でNo)、映像障害フレーム検出部230は、ブロックの位置(v,h)を更新して、ステップS11に動作を戻す。一方、すべての位置(v,h)の処理が完了した場合(S15でYes)、映像障害フレーム検出部230は、ステップS16に動作を進める。
【0094】
ステップS16において、映像障害フレーム検出部230は、カウンタcnt(t)が予め定めた閾値ThV3以上であるか否かを判定する。
ここで、カウンタcnt(t)が予め定めた閾値ThV3以上の場合(S16でYes)、ステップS17において、映像障害フレーム検出部230は、時刻tのフレームに障害が発生した旨の検出結果を監視画面表示部25およびアラーム発報部26に通知し、時刻tのフレームの処理を終了する。
【0095】
一方、カウンタcnt(t)が予め定めた閾値ThV3未満の場合(S16でNo)、映像障害フレーム検出部230は、時刻tのフレームに障害が発生していないと判定し、時刻tのフレームの処理を終了する。
映像障害フレーム検出部230は、以上の動作を映像信号のフレームごとに順次繰り返し実行する。
【0096】
次に、
図12を参照して、一重刺激障害検出部23の音声障害フレーム検出部231の動作を説明する。なお、ここでは、映像信号の1フレーム区間に対する動作のみを示し、時系列にフレーム区間ごとに順次この動作が繰り返される。
【0097】
ステップS20において、音声障害フレーム検出部231は、時刻tのフレーム区間に対応する音声特徴量Z(t),Z′(t)を入力する。
ステップS21において、音声障害フレーム検出部231は、音声特徴量Z(t)とZ′(t)との比(Z(t)/Z′(t))が予め定めた閾値ThA1以上であるか否かを判定する。
【0098】
ここで、Z(t)とZ′(t)との比が予め定めた閾値ThA1以上の場合(S21でYes)、ステップS22において、音声障害フレーム検出部231は、時刻tのフレーム区間の音声信号に障害が発生した旨の検出結果を監視画面表示部25およびアラーム発報部26に通知し、時刻tのフレーム区間の処理を終了する。
一方、Z(t)とZ′(t)との比が予め定めた閾値ThA1未満の場合(S21でNo)、音声障害フレーム検出部231は、時刻tのフレーム区間の音声信号に障害が発生していないと判定し、時刻tのフレーム区間の処理を終了する。
音声障害フレーム検出部231は、以上の動作をフレーム区間ごとに順次繰り返し実行する。
【0099】
次に、
図13を参照して、二重刺激障害検出部24の映像障害チャンネル検出部240の動作を説明する。なお、ここでは、映像信号の1フレームに対する動作のみを示し、時系列に2チャンネル(A,B)のフレームが入力されるたびに順次この動作が繰り返される。
【0100】
ステップS30において、映像障害チャンネル検出部240は、初期値設定として、時刻tのフレームのブロックの位置(v,h)を(1,1)に設定するとともに、カウンタcntA(t)およびcntB(t)を“0”に設定する。
ステップS31において、映像障害チャンネル検出部240は、チャンネルAの映像特徴量CA(t,v,h)およびチャンネルBの映像特徴量CB(t,v,h)を入力する。
以降、映像障害チャンネル検出部240は、チャンネルAとチャンネルBとで並列に処理を実行する。ただし、ステップS35A,S35Bは、ステップS34A,S34Bまでの両動作が完了した時点で実行される。なお、この並列処理は、チャンネルを相互に入れ替えた処理であるため、ここでは、チャンネルAについてのみ説明し、チャンネルBについては説明を省略する。
【0101】
ステップS32Aにおいて、映像障害チャンネル検出部240は、映像特徴量CAが予め定めた閾値ThV4以上、かつ、映像特徴量CAと映像特徴量CBとの差(CA-CB)が予め定めた閾値ThV5以上、かつ、映像特徴量CAと映像特徴量CBとの比(CA/CB)が予め定めた閾値ThV6以上であるか否かを判定する。
ここで、ステップS32Aの条件を満たさない場合(S32AでNo)、映像障害チャンネル検出部240は、ブロックの位置(v,h)を更新して、ステップS31に動作を戻す。一方、ステップS32Aの条件を満たす場合(S32AでYes)、映像障害チャンネル検出部240は、ステップS33Aに動作を進める。
ステップS33Aにおいて、映像障害チャンネル検出部240は、カウンタcntA(t)に“1”を加算する。
【0102】
ステップS34Aにおいて、映像障害チャンネル検出部240は、フレーム内のすべての位置(v,h)の処理が完了したか否かを判定する。
ここで、すべての位置(v,h)の処理が完了していない場合(S34AでNo)、映像障害チャンネル検出部240は、ブロックの位置(v,h)を更新して、ステップS31に動作を戻す。一方、すべての位置(v,h)の処理が完了した場合(S34AでYes)、映像障害チャンネル検出部240は、ステップS35Aに動作を進める。
【0103】
ステップS35Aにおいて、映像障害チャンネル検出部240は、カウンタcntA(t)が予め定めた閾値ThV7以上、かつ、カウンタcntA(t)がカウンタcntB(t)よりも大きいか否かを判定する。
ここで、ステップS35Aの条件を満たす場合(S35AでYes)、ステップ36Aにおいて、映像障害チャンネル検出部240は、チャンネルAにおいて時刻tのフレームに障害が発生した旨の検出結果を監視画面表示部25およびアラーム発報部26に通知し、時刻tのフレームの処理を終了する。
一方、ステップS35Aの条件を満たさない場合(S35AでNo)、映像障害チャンネル検出部240は、チャンネルAにおいて時刻tのフレームに障害が発生していないと判定し、時刻tのフレームの処理を終了する。
【0104】
映像障害チャンネル検出部240は、チャンネルBについても、チャンネルAと同様に障害の検出を行う。
映像障害チャンネル検出部240は、以上の動作を映像信号のフレームごとに順次繰り返し実行する。
【0105】
次に、
図14を参照して、二重刺激障害検出部24の音声障害チャンネル検出部241の動作を説明する。なお、ここでは、映像信号の1フレーム区間に対する動作のみを示し、時系列にフレーム区間ごとに順次この動作が繰り返される。
【0106】
ステップS40において、音声障害チャンネル検出部241は、初期値設定として、時刻tのフレーム区間に対応するチャンネルAの音声特徴量ZA(t)およびチャンネルBの音声特徴量ZB(t)を入力する。
以降、音声障害チャンネル検出部241は、チャンネルAとチャンネルBとで並列に処理を実行する。なお、この並列処理は、チャンネルを相互に入れ替えた処理であるため、ここでは、チャンネルAについてのみ説明し、チャンネルBについては説明を省略する。
【0107】
ステップS41Aにおいて、音声障害チャンネル検出部241は、音声特徴量ZA(t)と音声特徴ZB(t)との比(ZA(t)/ZB(t))が予め定めた閾値ThA2以上、かつ、音声特徴量ZA(t)と音声特徴量ZB(t)との差(ZA(t)-ZB(t))が予め定めた閾値ThA3以上であるか否かを判定する。
ここで、ステップS41Aの条件を満たす場合(S41AでYes)、ステップ42Aにおいて、音声障害チャンネル検出部241は、チャンネルAにおいて時刻tのフレーム区間の音声信号に障害が発生した旨の検出結果を監視画面表示部25およびアラーム発報部26に通知し、時刻tのフレーム区間の処理を終了する。
一方、ステップS41Aの条件を満たさない場合(S41AでNo)、音声障害チャンネル検出部241は、チャンネルAにおいて時刻tのフレーム区間の音声信号に障害が発生していないと判定し、時刻tのフレーム区間の処理を終了する。
【0108】
音声障害チャンネル検出部241は、チャンネルBについても、チャンネルAと同様に障害の検出を行う。
音声障害チャンネル検出部241は、以上の動作をフレーム区間ごとに順次繰り返し実行する。
【0109】
以上、本発明の実施形態に係るコンテンツ特徴量抽出装置1および監視装置2を備えた監視システムSAの構成および動作について説明したが、本発明は、この実施形態に限定されるものではない。
ここでは、監視システムSAを、2地点間の中継伝送の監視システムの例で説明した。しかし、これは一例であって、例えば、
図15の監視システムSBに示すように、コンテンツプロバイダCP、放送局BC、通信事業者NT、視聴者VWへと順次配信される、コンテンツのバリューチェーンの各ポイントにコンテンツ特徴量抽出装置1を配置して、大規模な映像配信サービスを監視装置2が監視することも可能である。
【符号の説明】
【0110】
1 コンテンツ特徴量抽出装置
10 映像特徴量抽出部
100 映像フレーム分割部
101 ブロック別変動画素累計部
102 ブロック別累計二階微分算出部
11 音声特徴量抽出部
110 音声ブロック分散算出部
111 ブロック別分散二階微分算出部
112 フレーム内変動特徴量算出部
12 特徴量送出部
2 監視装置
20 特徴量受信部
21 特徴量同期部
22 特徴量記憶部
23 一重刺激障害検出部
230 映像障害フレーム検出部
231 音声障害フレーム検出部
24 二重刺激障害検出部
240 映像障害チャンネル検出部
241 音声障害チャンネル検出部
25 監視画面表示部
26 アラーム発報部
27 アラームログ記憶部
3 表示装置
SA,SB 監視システム