(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-05-26
(45)【発行日】2025-06-03
(54)【発明の名称】データ分析装置、データ分析方法、およびプログラム
(51)【国際特許分類】
G01H 17/00 20060101AFI20250527BHJP
G05B 23/02 20060101ALI20250527BHJP
【FI】
G01H17/00 Z
G05B23/02 302Z
(21)【出願番号】P 2023518568
(86)(22)【出願日】2021-05-07
(86)【国際出願番号】 JP2021017458
(87)【国際公開番号】W WO2022234635
(87)【国際公開日】2022-11-10
【審査請求日】2023-11-01
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100178216
【氏名又は名称】浜野 絢子
(74)【代理人】
【識別番号】100149618
【氏名又は名称】北嶋 啓至
(72)【発明者】
【氏名】太田 裕子
(72)【発明者】
【氏名】美島 咲子
【審査官】森口 正治
(56)【参考文献】
【文献】特開平08-221117(JP,A)
【文献】特開2020-126021(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01H 17/00
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
時系列データの性質を判定する判定手段と、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択する選択手段と、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する識別手段とを備え
、
前記判定手段は、前記時系列データが含む周期成分の周期のばらつきの大きさを判定し、
前記選択手段は、前記時系列データを分析するための複数の手法の中から、前記周期のばらつきの大きさに応じた手法を選択する
データ分析装置。
【請求項2】
前記判定手段は、前記時系列データのピークを検出するピーク検出手段を備え、
前記判定手段は、前記時系列データの前記ピークが検出されてから、次のピークが検出されるまでの時間幅に基づいて、前記時系列データの前記性質を判定する
ことを特徴とする請求項1に記載のデータ分析装置。
【請求項3】
前記判定手段は、前記時系列データをスペクトログラムに変換するデータ変換手段を備え、
前記判定手段は、前記スペクトログラムから所定の時間幅ごとに切り出された周波数スペクトルのピーク強度に基づいて、前記時系列データの前記性質を判定する
ことを特徴とする請求項1に記載のデータ分析装置。
【請求項4】
前記周期のばらつきの大きさが閾値を下回る場合、前記選択手段は、NMF(Nonnegative Matrix Factorization)を選択する
ことを特徴とする請求項
1から3のいずれか1項に記載のデータ分析装置。
【請求項5】
コンピュータが、
時系列データの性質を判定し、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択し、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する
データ分析方法であって、
前記コンピュータが、
前記時系列データが含む周期成分の周期のばらつきの大きさを判定し、
前記時系列データを分析するための複数の手法の中から、前記周期のばらつきの大きさに応じた手法を選択する
データ分析方法。
【請求項6】
時系列データの性質を判定することと、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択することと、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別することと
、
をコンピュータに実行させるための
プログラムであって、
前記時系列データが含む周期成分の周期のばらつきの大きさを判定することと、
前記時系列データを分析するための複数の手法の中から、前記周期のばらつきの大きさに応じた手法を選択することと、
を前記コンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ分析装置、データ分析方法、および記録媒体に関し、特に、時系列データを分析するデータ分析装置、データ分析方法、および記録媒体に関する。
【背景技術】
【0002】
鉄道車両、自動車のエンジンルーム、および工場などにおいて、機器や部品の動作状態を監視するための技術が研究されている。例えば、特許文献1に記載の関連する技術では、機械学習によって生成された学習モデルを用いて、センサが検知する物理量に基づいて、機械の動作状態をリアルタイムで診断する。
【0003】
さらに、他の関連する技術の一例では、時系列データを分析するために、非負値行列因子分解(Non-negative Matrix Factorization: NMF)が用いられる。具体的には、関連する技術では、時系列データを振幅スペクトログラムに変換し、そのスペクトログラムを、基底行列およびアクティベーション行列に分解する。そして、アクティベーション行列を音響特徴量として用いることによって、時系列データに含まれる異音を識別する。
【先行技術文献】
【特許文献】
【0004】
特開2020-204937号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
NMFは、スペクトログラムの表現である非負値行列を、より低次元の非負値行列の積で近似するものである。そのため、時系列データにおけるピークの周期が安定しない場合、あるいは雑音環境下などでは、NMFを用いる関連する技術は、異音を識別する精度が低下する。
【0006】
本発明は、上記の課題に鑑みてなされたものであり、その目的は、さまざまな性質の時系列データから、異音を正確に識別することにある。
【課題を解決するための手段】
【0007】
本発明の一態様に係わるデータ分析装置は、時系列データの性質を判定する判定手段と、前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択する選択手段と、選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する識別手段とを備えている。
【0008】
本発明の一態様に係わるデータ分析方法では、時系列データの性質を判定し、前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択し、選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する。
【0009】
本発明の一態様に係わる記録媒体は、時系列データの性質を判定することと、前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択することと、選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別することとをコンピュータに実行させるためのプログラムを格納している。
【発明の効果】
【0010】
本発明の一態様によれば、さまざまな性質の時系列データから、異音を正確に識別することができる。
【図面の簡単な説明】
【0011】
【
図1】実施形態1に係わるデータ分析装置の構成を示すブロック図である。
【
図2】実施形態1に係わるデータ分析装置の動作を説明するフローチャートである。
【
図3】実施形態2に係わるデータ分析装置の構成を示すブロック図である。
【
図4】実施形態2に係わるデータ分析装置による分析の対象である時系列データの一例を示す図である。
【
図5】実施形態2に係わるデータ分析装置の動作を説明するフローチャートである。
【
図6】実施形態3に係わるデータ分析装置の構成を示すブロック図である。
【
図7】時系列データから変換されたスペクトログラムの一例を示す図である。
【
図8】時系列データのある時間幅のセグメントから変換された周波数スペクトルの一例を示すグラフである。
【
図9】実施形態3に係わるデータ分析装置の動作を説明するフローチャートである。
【
図10】周波数スペクトルのピーク強度の閾値を決定するために用いられるスコアの分布を示すグラフの一例である。
【
図11】実施形態1から3のいずれかに係わるデータ分析装置のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0012】
本発明を実施するためのいくつかの形態について、以下で説明する。
【0013】
〔実施形態1〕
図1~
図2を参照して、実施形態1について説明する。
【0014】
(異音識別装置10)
図1は、本実施形態1に係わる異音識別装置10の構成を示すブロック図である。
図1に示すように、異音識別装置10は、判定部11、選択部12、識別部13、および提供部14を備えている。
【0015】
判定部11は、時系列データの性質を判定する。判定部11は、判定手段の一例である。
【0016】
第1の例では、判定部11は、時系列データのピークを追跡する。ここでは、判定部11は、周知のピークトラッキング技術を用いることができる。判定部11は、時系列データの1つ目のピークから、次のピークまでの時間を計測する。続いて、判定部11は、2番目のピークから、3番目のピークまでの時間を計算する。繰り返して、判定部11は、時系列データの隣接するピーク間の時間幅(周期と呼ぶ)を計算する。その後、判定部11は、時系列データにおけるピークの周期の揺らぎを計算する。例えば、判定部11は、時系列データにおけるピークの周期の分散または標準偏差を、時系列データにおけるピークの周期の揺らぎの大きさを示す指標として計算する。そして、時系列データにおけるピークの周期の揺らぎの大きさが閾値以下である場合、時系列データは性質aであると、判定部11は判定する。一方、時系列データにおけるピークの周期の揺らぎの大きさが閾値を超える場合、時系列データは性質bであると、判定部11は判定する(実施形態1)。
【0017】
第2の例では、判定部11は、時系列データをスペクトルにフーリエ変換する。判定部11は、スペクトルのピーク強度を計算する。そして、判定部11は、スペクトルの全てのピーク強度が閾値以上である場合、時系列データは性質aであると、判定部11は判定する。一方、時系列データの1つ以上のピーク強度が閾値を下回る場合、時系列データは性質bであると、判定部11は判定する(実施形態2)。なお、判定部11が時系列データの性質を判定する手法は、ここで説明した第1の例及び第2の例には限定されない。
【0018】
判定部11は、時系列データの性質の判定結果を、選択部12へ出力する。また、判定部11は、時系列データを識別部13へ出力する。
【0019】
選択部12は、時系列データの性質に基づき、時系列データを分析するための手法を選択する。選択部12は、選択手段の一例である。
【0020】
一例では、選択部12は、判定部11から、時系列データの性質の判定結果を受信する。選択部12は、時系列データの性質の判定結果に基づいて、時系列データを分析するための手法を選択する。例えば、時系列データが性質aである場合、選択部12は、非負値行列因子分解(Nonnegative Matrix Factorization: NMF)を用いる第1の手法を選択する。非負値行列因子分解(以下、NMF)を用いる手法では、時系列データのスペクトルを時間順に並べたスペクトログラムを、基底行列およびアクティベーション行列に分解する。こうして得られたアクティベーション行列が、第1の手法での特徴量である。
【0021】
一方、時系列データが性質bである場合、選択部12は、メル周波数ケプストラム係数(Mel-Frequency Cepstrum Coefficients: MFCC)を用いる第2の手法を選択する。メル周波数ケプストラム係数(以下、MFCC)は、時系列データをケプストラム分析することによって得られる重みづけられたケプストラムの低次成分である。こうして得られたMFCCが第2の手法での特徴量である。選択部12は、時系列データを分析するための手法(第1の手法又は第2の手法)を、識別部13へ通知する。
【0022】
識別部13は、選択した手法を用いて、時系列データを分析することによって、時系列データに含まれる異音を識別する。識別部13は、識別手段の一例である。
【0023】
一例では、識別部13は、判定部11から、時系列データを受信する。また、識別部13は、選択部12から、時系列データを分析するための手法(第1の手法および第2の手法のいずれか)を通知される。識別部13は、選択部12により選択された手法を用いて、時系列データを分析する。例えば、第1の手法が選択された場合、識別部13は、まず、時系列データをスペクトログラムに変換する。そして、識別部13は、NMFを用いて、スペクトログラムを分解することによって、アクティベーション行列を得る。識別部13は、アクティベーション行列を特徴量として用いて機械学習した識別器(以下、識別器Aと呼ぶ)に、得られたアクティベーション行列を特徴量として入力する。識別器Aは、入力されたアクティベーション行列の特徴量に基づいて、時系列データを識別し、その識別結果を出力する。
【0024】
一方、第2の手法が選択された場合、識別部13は、まず、時系列データをケプストラム分析することによって、MFCCを得る。識別部13は、MFCCを特徴量として用いて機械学習した識別器(以下、識別器Bと呼ぶ)に、ケプストラム分析によって得られたMFCCを特徴量として入力する。識別器Bは、入力されたMFCCの特徴量に基づいて、時系列データを識別し、その識別結果を出力する。このようにして、識別部13は、選択部12により選択された手法に応じて、識別器Aまたは識別器Bを用いて、時系列データを識別する。識別部13は、時系列データの識別結果を、後段の処理部(図示せず)へ出力してもよいし、記録媒体又は外部機器へ提供してもよい。
【0025】
(異音識別装置10の動作)
図2を参照して、本実施形態1に係わる異音識別装置10の動作を説明する。
図2は、異音識別装置10の各部が実行する処理の流れを示すフローチャートである。
【0026】
まず、異音識別装置10へ時系列データが入力される。時系列データは、例えば、運行中の鉄道車両内、工場、自動車のエンジンルーム内などにおいて、機器又は部品が発する音をマイクロフォンにより集音することによって生成された音響信号である。異音識別装置10は、無線又は有線の任意のネットワークを介して、音響信号などの時系列データを受信する。その後、異音識別装置10は、以下の動作を開始する。
【0027】
図2に示すように、判定部11は、時系列データの性質を判定する(S1)。一例では、判定部11は、時系列データのピークから次のピークまでの時間幅(周期)を測定する。そして、周期の揺らぎの大きさが閾値以下である場合、判定部11は、時系列データが性質aを有すると判定する。一方、周期の揺らぎの大きさが閾値を超える場合、判定部11は、時系列データが性質bを有すると判定する。判定部11は、時系列データの性質の判定結果を、選択部12へ出力する。また、判定部11は、時系列データを識別部13へ出力する。
【0028】
次に、選択部12は、時系列データの性質に基づいて、時系列データを分析するための手法を選択する(S2)。例えば、時系列データが性質aを有する場合、選択部12は、NMFを用いる第1の手法を選択する。以降、時系列データが性質bを有する場合、選択部12は、MFCCを用いる第2の手法を選択する。選択部12は、時系列データを分析するための手法を、識別部13へ通知する。
【0029】
識別部13は、選択部12により選択された手法を用いて、時系列データを分析することによって、時系列データに含まれる異音を識別する(S3)。
【0030】
以上で、本実施形態1に係わる異音識別装置10の動作は終了する。
【0031】
(本実施形態の効果)
本実施形態の構成によれば、判定部11は、時系列データの性質を判定する。選択部12は、時系列データの性質に基づき、時系列データを分析するための手法を選択する。識別部13は、選択した手法を用いて、時系列データを分析することによって、時系列データに含まれる異音を識別する。時系列データにはさまざまな種類の音響(異音を含む)および雑音が含まれており、時系列データの性質もさまざまである。例えば、周期の揺らぎが大きい異音が時系列データに含まれている場合もあるし、雑音が大きい(目的音が小さい)場合もある。
【0032】
異音識別装置10は、まず時系列データの性質を判定し、その判定結果に基づき、時系列データを分析するための手法を選択する。これにより、さまざまな性質の時系列データから、異音を正確に識別することができる。
【0033】
〔実施形態2〕
図3~
図5を参照して、実施形態2について説明する。本実施形態2では、時系列データの性質を判定する方法の一例を説明する。本実施形態2では、前記実施形態1で説明した構成に関して、前記実施形態1の説明を引用し、その説明を省略する。
【0034】
(異音識別装置20)
図3は、本実施形態2に係わる異音識別装置20の構成を示すブロック図である。
図3に示すように、異音識別装置20は、判定部21、選択部12、識別部13を備えている。また、異音識別装置20の判定部21は、ピーク検出部24を備えている。ピーク検出部24は、時系列データのピークを検出する。
【0035】
図4を参照して、時系列データの性質を判定する方法の一例を具体的に説明する。
図4は、性質aを有する時系列データ、および性質bを有する時系列データをそれぞれ例示する。
図4において、ピーク検出部24が検出するピークは、点(黒塗りの円)で示されている。
【0036】
本実施形態2において、判定部21は、時系列データのピークが検出されてから、次のピークが検出されるまでの時間幅(周期と呼ぶ)に基づいて、時系列データの性質を判定する。
【0037】
図4において、時系列データにおけるピークの周期は、時系列データのピークを示す点と点との間の距離(すなわち両矢印の長さ)で表されている。上側の時系列データでは、時系列データにおけるピークの周期がほぼ一定である。言い換えれば、上側の時系列データは、周期の差分(周期の揺らぎ)が小さい。一方、下側の時系列データでは、時系列データにおけるピークの周期にばらつきがある。言い換えれば、下側の時系列データは、周期の差分(周期の揺らぎ)が大きい。
【0038】
判定部21は、時系列データにおけるピークの周期の差分(周期の揺らぎ)の大きさと、予め定めた閾値とを比較する。例えば、時系列データにおけるピークの周期の揺らぎの大きさを差分の偏差で表す場合、閾値Xは0.5である。本例では、時系列データにおけるピークの周期の揺らぎがX=0.5以下である場合、判定部21は、時系列データは性質aを有すると判定する。一方、時系列データにおけるピークの周期の揺らぎがX=0.5を超える場合、判定部21は、時系列データは性質bを有すると判定する。
【0039】
(異音識別装置20の動作:S1)
図5を参照して、本実施形態2に係わる異音識別装置20の動作を説明する。ここでは、判定部21が実行する処理の流れの詳細、すなわち
図2に示すステップS1の内容のみを説明する。
【0040】
前記実施形態1と同様に、異音識別装置20は、時系列データを受信する。その後、異音識別装置20の判定部21は、以下で説明するように、時系列データの性質を判定する。
【0041】
図5に示すように、判定部21のピーク検出部24は、時系列データのピークを検出する(S21)。
【0042】
判定部21は、時系列データのピーク間の時間幅に基づいて、時系列データにおけるピークの周期の揺らぎを計算する(S22)。
【0043】
判定部21は、時系列データにおけるピークの周期の揺らぎの大きさが閾値以下であるか否かを判定する(S23)。
【0044】
時系列データにおけるピークの周期の揺らぎの大きさが閾値以下である場合(S23でYes)、判定部21は、時系列データは性質aを有すると判定する(S24A)。一方、時系列データにおけるピークの周期の揺らぎの大きさが閾値を超える場合(S23でNo)、判定部21は、時系列データは性質bを有すると判定する(S24B)。
【0045】
以上で、判定部21の処理は終了する。その後、前記実施形態1で説明した選択部12の処理(ステップS2)へ進む。本実施形態2では、選択部12の処理(ステップS2)以降についての説明を省略する。
【0046】
(本実施形態の効果)
本実施形態の構成によれば、判定部21は、時系列データの性質を判定する。選択部12は、時系列データの性質に基づき、時系列データを分析するための手法を選択する。識別部13は、選択した手法を用いて、時系列データを分析することによって、時系列データに含まれる異音を識別する。時系列データにはさまざまな種類の音響(異音を含む)および雑音が含まれており、時系列データの性質もさまざまである。例えば、周期の揺らぎが大きい異音が時系列データに含まれている場合もあるし、雑音が大きい(目的音が小さい)場合もある。
【0047】
異音識別装置10は、まず時系列データの性質を判定し、その判定結果に基づき、時系列データを分析するための手法を選択する。これにより、さまざまな性質の時系列データから、異音を正確に識別することができる。
【0048】
さらに、本実施形態2の構成によれば、判定部21は、時系列データのピークを検出するピーク検出部24を備えている。判定部21は、時系列データのピークが検出されてから、次のピークが検出されるまでの時間幅に基づいて、時系列データの性質を判定する。時系列データのピークが検出されてから、次のピークが検出されるまでの時間幅より、時系列データにおけるピークの周期の揺らぎの大きさを計算できる。そして、時系列データにおけるピークの周期の揺らぎの大きさと閾値とを比較することによって、時系列データにおけるピークの周期の揺らぎが比較的小さい性質と、時系列データにおけるピークの周期の揺らぎが比較的大きい性質とを判定することができる。
【0049】
〔実施形態3〕
図6~
図9を参照して、実施形態3について説明する。本実施形態3では、時系列データの性質を判定する方法の他の一例を説明する。本実施形態3では、前記実施形態1で説明した構成に関して、前記実施形態1の説明を引用し、その説明を省略する。
【0050】
(異音識別装置30)
図6は、本実施形態3に係わる異音識別装置30の構成を示すブロック図である。
図6に示すように、異音識別装置30は、判定部31、選択部12、識別部13を備えている。また、異音識別装置30の判定部31は、データ変換部34を備えている。データ変換部34は、時系列データや波形などの時間領域の信号を、スペクトルやスペクトログラムといった周波数領域の信号に変換する。以下では、時系列データをスペクトログラムに変換する例を説明する。
【0051】
図7は、時系列データから変換されたスペクトログラムの一例を示す。
図7に示すスペクトログラムにおいて、周波数スペクトル強度が濃淡で表現されている。また、周波数スペクトルのピークが太線(バー)で示されている。
図7に示す例では、周波数スペクトルのピークの一部が、縦軸および横軸に対して傾斜している。これは、ピーク周波数が時間とともに遷移していることを表している。言い換えれば、元の時系列データにおけるピークの周期(=1/ピーク周波数)が揺らいでいる。
【0052】
図8は、時系列データから変換された周波数スペクトルの一例を示すグラフである。周波数スペクトルは、スペクトログラムにおける所定の時間幅に対応する。
図8において、周波数スペクトルのピークは、グラフ上に点(黒塗りの円)で示されている。
【0053】
周波数スペクトルのピークが鋭く高いことは、所定の時間幅において、元の時系列データにおけるピークの周期がほぼ一定である(すなわち周期の揺らぎが小さい)ことと対応する。一方、周波数スペクトルのピークが鈍く低いことは、所定の時間幅において、元の時系列データにおけるピークの周期にばらつきがある(すなわち周期の揺らぎが大きい)ことと対応する。
【0054】
判定部31は、スペクトログラムから所定の時間幅ごとに切り出された周波数スペクトルのピーク強度に基づいて、時系列データの性質を判定する。例えば、判定部31は、周波数スペクトルにおけるピーク強度と、ピーク周波数を中心とする所定の帯域における強度の平均との差分を計算する。判定部31は、得られた差分と閾値Yとを比較する。本例では、周波数スペクトルにおけるピーク強度と、ピーク周波数を中心とする所定の帯域における強度の平均との差分が閾値Y以上である場合、判定部31は、時系列データは性質aを有すると判定する。一方、周波数スペクトルにおけるピーク強度と、所定の時間幅における強度の平均との差分が閾値Y未満である場合、判定部31は、時系列データは性質bを有すると判定する。
【0055】
なお、後段の識別部13による異音の識別結果の信頼度の情報を、判定部31へフィードバックすることによって、判定部31は、識別部13による異音の識別結果の信頼度が上昇するように、閾値Yを更新してもよい。
【0056】
(異音識別装置30の動作:S1)
図9を参照して、本実施形態3に係わる異音識別装置30の動作を説明する。ここでは、判定部31が実行する処理の流れの詳細、すなわち
図2に示すステップS1の内容のみを説明する。
【0057】
前記実施形態1と同様に、異音識別装置30は、時系列データを受信する。その後、異音識別装置30の判定部31は、以下で説明するように、時系列データの性質を判定する。
【0058】
図9に示すように、判定部31のデータ変換部34は、時系列データ(時間領域の信号)を、スペクトログラム(
図7)(周波数領域の信号)に変換する(S31)。
【0059】
判定部31は、スペクトログラムから、所定の時間幅のセグメントを切り出すことによってごとに、周波数スペクトルを生成する。判定部31は、周波数スペクトルにおけるピーク強度を計算する(S32)。
【0060】
判定部31は、周波数スペクトルにおけるピーク強度が閾値以上であるか否かを判定する(S33)。例えば、閾値は、ピーク周波数を中心とする所定の帯域における強度の平均である。
【0061】
周波数スペクトルにおけるピーク強度が閾値以上である場合(S33でYes)、判定部31は、時系列データは性質aを有すると判定する(S34A)。一方、周波数スペクトルにおけるピーク強度が閾値を下回る場合(S33でNo)、判定部31は、時系列データは性質bを有すると判定する(S34B)。
【0062】
以上で、判定部31の処理は終了する。その後、前記実施形態1で説明した選択部12の処理(ステップS2)へ進む。本実施形態3では、選択部12の処理(ステップS2)以降についての説明を省略する。
【0063】
(閾値の決定方法)
ここでは、判定部31が、周波数スペクトルのピーク強度と閾値とを比較することによって、時系列データの性質を判定する構成を説明した。ここでは、周波数スペクトルのピーク強度の閾値を決定する方法の一例を説明する。
【0064】
図10は、周波数スペクトルのピーク強度の閾値を決定するために用いられるスコアの分布を示すグラフの一例である。
【0065】
判定部31は、性質aを有すると判定済の時系列データおよび性質bを有すると判定済の時系列データの両方を同数またはほぼ同数ずつ含む多数の学習データについてのスコアを計算する。ここでのスコアは、ピーク周波数を中心とする所定の帯域における強度の平均と、ピーク強度との差分である。スコアの算出結果から、
図10に示すようなスコアの分布が得られる。そして、判定部31は、スコアの分布に基づいて、性質aを有する時系列データと、性質bを有する時系列データとを区別できるように、閾値を決定する。例えば、判定部31は、性質bを有する時系列データのスコアの最大値の2倍を閾値に決定する。ある時系列データのスコアが閾値以上である場合、その時系列データは性質aを有する蓋然性が高い一方、ある時系列データのスコアが閾値を下回る場合、その時系列データは性質bを有する蓋然性が高い。判定部31は、このようにして決定された閾値を用いることにより、時系列データの性質を上述のように判定することができる。
【0066】
(本実施形態の効果)
本実施形態の構成によれば、判定部31は、時系列データの性質を判定する。選択部12は、時系列データの性質に基づき、時系列データを分析するための手法を選択する。識別部13は、選択した手法を用いて、時系列データを分析することによって、時系列データに含まれる異音を識別する。時系列データにはさまざまな種類の音響(異音を含む)および雑音が含まれており、時系列データの性質もさまざまである。例えば、周期の揺らぎが大きい異音が時系列データに含まれている場合もあるし、雑音が大きい(目的音が小さい)場合もある。
【0067】
異音識別装置10は、まず時系列データの性質を判定し、その判定結果に基づき、時系列データを分析するための手法を選択する。これにより、さまざまな性質の時系列データから、異音を正確に識別することができる。
【0068】
さらに、本実施形態3の構成によれば、判定部31は、時系列データをスペクトログラムに変換するデータ変換部34を備えている。判定部31は、スペクトログラムから所定の時間幅ごとに切り出された周波数スペクトルのピーク強度に基づいて、時系列データの性質を判定する。周波数スペクトルのピークが鋭く強いことは、元の時系列データにおけるピークの周期の揺らぎが小さいことと対応する。そして、周波数スペクトルのピーク強度と閾値とを比較することによって、時系列データにおけるピークの周期の揺らぎが比較的小さい性質と、時系列データにおけるピークの周期の揺らぎが比較的大きい性質とを判定することができる。
【0069】
(変形例)
前記実施形態1~3のいずれかの一変形例では、識別部13は、3つ以上の識別器を用いて、時系列データに含まれる異音を識別する。
【0070】
例えば、本変形例に係わる識別部13は、MFCCを特徴量として用いて機械学習した識別器Bとともに、DCTC(Discrete Cosine Transform Coefficients)を特徴量とする識別器(以下、識別器Cと呼ぶ)を併用する。識別部13は、2つの識別器のそれぞれによって、時系列データに含まれる異音を識別し、その識別結果の信頼度の大小を比較する。識別器Bによる識別結果の信頼度がより高い場合、識別部13は、識別器Bによる識別結果を出力する。一方、識別器Cによる識別結果の信頼度がより高い場合、識別部13は、識別器Cによる識別結果を出力する。
【0071】
他の変形例では、識別部13は、時系列データの元となる音響信号が取得された場所に応じて、複数の識別器を使い分けてもよい。本変形例では、各識別器と、互いに異なる場所を示す情報とが、予め対応付けられている。本変形例に係わる識別部13は、判定部11から、時系列データとともに、時系列データに紐づけられた場所を示す情報も受信する。識別部13は、場所を示す情報に基づいて、複数の識別器の中から、対応する識別器を選択する。そして、識別部13は、選択した識別器を用いて、時系列データに含まれる異音を識別する。
【0072】
本変形例の構成によれば、2つの識別器のうち、識別結果の信頼度がより高い一方を選択するので、識別部13が出力する識別結果の信頼性を向上させることができる。
【0073】
〔ハードウェア構成〕
前記実施形態1~3で説明した異音識別装置10,20,30の各構成要素は、機能単位のブロックを示している。これらの構成要素の一部又は全部は、例えば
図11に示すような情報処理装置900により実現される。
図11は、情報処理装置900のハードウェア構成の一例を示すブロック図である。
【0074】
図11に示すように、情報処理装置900は、一例として、以下のような構成を含む。
【0075】
・CPU(Central Processing Unit)901
・ROM(Read Only Memory)902
・RAM(Random Access Memory)903
・RAM903にロードされるプログラム904
・プログラム904を格納する記憶装置905
・記録媒体906の読み書きを行うドライブ装置907
・通信ネットワーク909と接続する通信インタフェース908
・データの入出力を行う入出力インタフェース910
・各構成要素を接続するバス911
前記実施形態1~3で説明した異音識別装置10,20,30の各構成要素は、これらの機能を実現するプログラム904をCPU901が読み込んで実行することで実現される。各構成要素の機能を実現するプログラム904は、例えば、予め記憶装置905やROM902に格納されており、必要に応じてCPU901がRAM903にロードして実行される。なお、プログラム904は、通信ネットワーク909を介してCPU901に供給されてもよいし、予め記録媒体906に格納されており、ドライブ装置907が当該プログラムを読み出してCPU901に供給してもよい。
【0076】
上記の構成によれば、前記実施形態1~3において説明した異音識別装置10,20,30が、ハードウェアとして実現される。したがって、前記実施形態1~3において説明した効果と同様の効果を奏することができる。
【0077】
〔付記〕
本発明の一態様は、以下の付記のようにも記載されるが、以下に限定されない。
【0078】
(付記1)
時系列データの性質を判定する判定手段と、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択する選択手段と、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する識別手段とを備えた
データ分析装置。
【0079】
(付記2)
前記判定手段は、前記時系列データのピークを検出するピーク検出手段を備え、
前記判定手段は、前記時系列データの前記ピークが検出されてから、次のピークが検出されるまでの時間幅に基づいて、前記時系列データの前記性質を判定する
ことを特徴とする付記1に記載のデータ分析装置。
【0080】
(付記3)
前記判定手段は、前記時系列データをスペクトログラムに変換するデータ変換手段を備え、
前記判定手段は、前記スペクトログラムから所定の時間幅ごとに切り出された周波数スペクトルのピーク強度に基づいて、前記時系列データの前記性質を判定する
ことを特徴とする付記1に記載のデータ分析装置。
【0081】
(付記4)
前記判定手段は、前記時系列データが含む周期成分の周期のばらつきの大きさを判定し、
前記選択手段は、前記時系列データを分析するための複数の手法の中から、前記周期のばらつきの大きさに応じた手法を選択する
ことを特徴とする付記1から3のいずれか1項に記載のデータ分析装置。
【0082】
(付記5)
前記周期のばらつきの大きさが閾値を下回る場合、前記選択手段は、NMF(Nonnegative Matrix Factorization)を選択する
ことを特徴とする付記4に記載のデータ分析装置。
【0083】
(付記6)
時系列データの性質を判定し、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択し、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別する
データ分析方法。
【0084】
(付記7)
時系列データの性質を判定することと、
前記時系列データの前記性質に基づき、前記時系列データを分析するための手法を選択することと、
選択した前記手法を用いて、前記時系列データを分析することによって、前記時系列データに含まれる異音を識別することと
をコンピュータに実行させるためのプログラムを格納した、一時的でない記録媒体。
【産業上の利用可能性】
【0085】
本発明は、例えば、鉄道、自動車のエンジンルーム、工場、その他の機器又は部品が発する異音を識別する異音識別装置に利用することができる。
【符号の説明】
【0086】
10 異音識別装置
11 判定部
12 選択部
13 識別部
20 異音識別装置
24 ピーク検出部
30 異音識別装置
34 データ変換部