(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-30
(45)【発行日】2023-04-07
(54)【発明の名称】異音判定装置、異音判定方法および異音判定システム
(51)【国際特許分類】
G01H 3/00 20060101AFI20230331BHJP
G01M 99/00 20110101ALI20230331BHJP
G06N 20/00 20190101ALI20230331BHJP
【FI】
G01H3/00 A
G01M99/00 Z
G06N20/00
(21)【出願番号】P 2019088442
(22)【出願日】2019-05-08
【審査請求日】2022-04-28
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100138771
【氏名又は名称】吉田 将明
(72)【発明者】
【氏名】藤井 亮太
【審査官】福田 裕司
(56)【参考文献】
【文献】特開2011-185846(JP,A)
【文献】特開2000-298058(JP,A)
【文献】特開2010-197124(JP,A)
【文献】特開2007-199017(JP,A)
【文献】特開2009-236645(JP,A)
【文献】特開2008-008708(JP,A)
【文献】特開平07-319509(JP,A)
【文献】実開昭53-166483(JP,U)
(58)【調査した分野】(Int.Cl.,DB名)
G01H 1/00~17/00
G01M 99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
対象機器から発せられる音を収音するマイクに接続される入力部と、
前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、
前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、
前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
異音判定装置。
【請求項2】
前記プロセッサは、前記対象機器から発せられる音に異音が含まれると識別した場合に、前記対象機器から発せられる音に異音が含まれる旨の異音検知通知をディスプレイに表示する、
請求項1に記載の異音判定装置。
【請求項3】
前記プロセッサは、前記学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データのパワーが最小となる音データを検出し、その検出された音データを前記正常音の音データとして前記メモリに保存する、
請求項1に記載の異音判定装置。
【請求項4】
前記プロセッサは、前記運用モード中に前記定常音と判定された1以上の前記1フレーム期間の音データのパワーが最小となる音データを検出し、その検出された音データと前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項3に記載の異音判定装置。
【請求項5】
前記プロセッサは、前記学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から2つ以上の定常音を前記正常音として前記メモリに保存する、
請求項1に記載の異音判定装置。
【請求項6】
前記プロセッサは、前記運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された2つ以上の前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項5に記載の異音判定装置。
【請求項7】
前記メモリは、複数の異なる環境に置かれた、前記対象機器から発せられる音の所定期間分の音データを記憶すると共に、前記環境ごとに、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに前記環境ごとに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項1に記載の異音判定装置。
【請求項8】
異常判定装置により実行される異音判定方法であって、
対象機器から発せられる音を収音するマイクから、前記対象機器から発せられる音の所定期間分の音データを入力するステップと、
入力された前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するステップと、
学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から正常音として記憶された少なくとも1つの定常音を取得するステップと、
前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと取得された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別するステップと、を有する、
異音判定方法。
【請求項9】
対象機器から発せられる音を収音するマイクに接続される入力部と、
前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、
前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するコントローラと、を備え、
前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記コントローラは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
異音判定システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、対象機器から発せられた異音を判定する異音判定装置、異音判定方法および異音判定システムに関する。
【背景技術】
【0002】
建物内の設備機器あるいは工場の機器など、営業時間中に常時稼働している機器が異常の発生により停止した場合、生産ができなくなることによる生産効率の低下やもしくは害の発生など、甚大な被害が起きる場合がある。このような機器の異常を事前に発見するために、異常傾向を電流、振動、音などを検知可能なセンサを用いて監視することは有効であると考えられている。
【0003】
例えば特許文献1には、鉄塔もしくは送電線などの対象機器から発せられる異音を判定する異音判定装置が示される。通常、風切り音などによって発生する外乱音は、異音でない。この異音判定装置は、外乱音がある中で異音を効率良く判断するために、異音を含む複数の音データと異音を含まない複数の音データとの2種類のサンプルデータを用いて、異音の有無を判定する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1の異音判定装置では、不定期に発生する、多様な音を含む外乱音が検査の対象機器から発せられた異音と類似した周波数スペクトルを有する場合に、検査の対象機器から発せられた音に異音が含まれるか否かの識別が困難となる。
【0006】
また、異音の有無の識別のために、異音を含む複数の音データと異音を含まない複数の音データとをそれぞれサンプルデータとして収音する場合、多くの手間がかかる。また、異音の有無の識別精度を確保する上で、十分なサンプルデータの量は、検査の対象機器の種類あるいはその設置環境によって大きく変動するので、サンプルデータの的確な量の判断が困難である。
【0007】
本開示は、上述した従来の状況に鑑みて案出され、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上し、対象機器の異常の有無を適切に検知する異音判定装置、異音判定方法および異音判定システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示は、対象機器から発せられる音を収音するマイクに接続される入力部と、前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、異音判定装置を提供する。
【0009】
また、本開示は、異常判定装置により実行される異音判定方法であって、対象機器から発せられる音を収音するマイクから、前記対象機器から発せられる音の所定期間分の音データを入力するステップと、入力された前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するステップと、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から正常音として記憶された少なくとも1つの定常音を取得するステップと、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと取得された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別するステップと、を有する、異音判定方法を提供する。
【0010】
また、本開示は、対象機器から発せられる音を収音するマイクに接続される入力部と、前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、異音判定システムを提供する。
【発明の効果】
【0011】
本開示によれば、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させ、対象機器の異常の有無を適切に検知することができる。
【図面の簡単な説明】
【0012】
【
図1】実施の形態1に係る異音判定システムの概略構成の一例を示す図
【
図2】異音判定システムのハードウェア構成を示す図
【
図3】音データの学習動作手順を示すフローチャート
【
図4】ステップS4における定常音抽出手順を示すフローチャート
【
図5】ステップS5における最小定常検出手順を示すフローチャート
【
図6】学習モード時に収音された音の音圧レベルおよび周波数分布の時間変化を表す特性図
【
図7】音データの運用動作手順を示すフローチャート
【
図8】ステップS16における正常異常識別手順を示すフローチャート
【
図9】運用モード時に収音された正常状態および異常状態のそれぞれにおける音の音圧レベルと周波数分布との時間変化をそれぞれ表す特性図
【
図10】実施の形態2に係る異音判定システムの概略構成の一例を示す図
【
図11】異音判定システムのハードウェア構成を示す図
【
図12】音データの学習動作手順を示すフローチャート
【
図13】音データの運用動作手順を示すフローチャート
【
図14】ステップS65における正常異常識別手順を示すフローチャート
【発明を実施するための形態】
【0013】
以下、適宜図面を参照しながら、本開示に係る異音判定装置、異音判定方法および異音判定システムを具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0014】
(実施の形態1)
図1は、実施の形態1に係る異音判定システム5の概略構成の一例を示す図である。異音判定システム5は、マイク10と、AD変換器20と、情報処理装置30とを含む構成である。マイク10は、監視などの目的のために定常的に行われる検査の対象機器100から発せられる音を収音する。検査の対象機器として、例えば企業もしくはデータセンタなどに設置されたサーバ、工場などに設置されたコンプレッサ、モータなどが挙げられる。検査の対象機器100から異音が頻繁に発せられる場合、情報処理装置30は、対象機器100が異常状態にあると判断する。
【0015】
マイク10は、検査の対象機器100が設置された、例えば機械室に設置される。マイク10は、対象機器100に受音面を向けて対象機器100が発する音を収音し、入力した音波を電気信号に変換して音信号として出力する。マイク10は、1つであってもよいし、複数であってもよい。例えばマイクは、高音質小型エレクトレットコンデンサーマイクロホン(ECM:Electret Condenser Microphone)の単体や、複数のECMで構成されるマイクアレイでもよい。
【0016】
AD変換器20は、マイク10と同じ機械室に設置される。AD変換器20は、1つもしくは複数のマイク10で収音された音を入力し、アナログ形式の音信号を同時にあるいは時分割でアナログデジタル変換し、デジタル形式の音データを出力する。AD変換器20は、所定の量子化ビットおよびサンプリング周波数でアナログ信号をデジタル信号に変換する。AD変換器20の数は、マイク10の数と同数であってもよいし、マイク10の数よりも少なくてもよい。
【0017】
情報処理装置30は、検査の対象機器100の状態を定常的に監視する監視装置である。情報処理装置30は、例えばPC(Personal Computer)もしくはタブレット端末で構成される。情報処理装置30は、対象機器が設置された機械室と異なる監視室に設置される。
【0018】
情報処理装置30は、機械室とは別室である監視室に配置される。なお、マイク10、AD変換器20および情報処理装置30のいずれも、同じ室内である機械室あるいは監視室に配置されてもよい。
【0019】
図2は、異音判定システム5のハードウェア構成を示す図である。情報処理装置30は、AD変換器20と接続され、AD変換器20から出力されるデジタル形式の音データを入力する。情報処理装置30は、入力した音データを基に、検査の対象機器100が発する音に異音が含まれているか否かを判定する(異音判定処理)。
【0020】
この異音判定処理において、情報処理装置30は、予めディープラーニングなどの機械学習を行って学習済みモデルを生成しておく。なお、情報処理装置30は、別のコンピュータが生成した学習済みモデルを複製して使用してもよい。ここでは、学習済みモデルは、所定時間分の音データの中からフレーム単位で定常音を抽出する定常音抽出処理(
図4参照)を実行するプログラムとして生成される。また、学習済みモデルは、対象機器から発せられる音に異音が含まれるか否かを判定する正常異常識別処理(
図8参照)を実行するプロクラムとして生成される。情報処理装置30は、生成した学習済みモデルを用いて、定常音抽出処理および正常異常識別処理を行う。なお、情報処理装置30は、機械学習による学習済みモデルを用いることなく、相互相関関数を用いて定常音抽出処理および正常異常識別処理を行ってもよい。また、情報処理装置30は、1つのコンピュータなどの装置によって処理を実行する構成であってもよいし、複数のコンピュータなどの装置によって処理を実行する構成であってもよく、物理的な装置構成に限定されない。
【0021】
情報処理装置30は、プロセッサ301と、メモリ302と、ストレージ303と、通信部304と、操作部305と、ディスプレイ306と、入力部307とを有する。
【0022】
プロセッサ301は、例えばCPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)などの各種処理デバイスを用いて構成され、音データに関する処理を統括的に実行する。
【0023】
メモリ302は、RAM(Random Access Memory)などのメモリデバイスを有し、プロセッサ301のワーキングメモリとして使用され、データ処理時の演算などにおいて一時記憶に利用する。また、メモリ302は、ROM(Read Only Memory)などのメモリデバイスを有し、プロセッサ301の処理を実行するための各種実行プログラム、機械学習などの処理に関する各種設定データを記憶する。
【0024】
ストレージ303は、例えばHDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスクドライブなどの各種ストレージデバイスを用いて構成され、対象の音データ、機械学習により生成した学習モデルなどのデータを格納する。
【0025】
通信部304は、有線または無線の通信を行うインタフェースである。
【0026】
操作部305は、ユーザの操作を受付けるものであり、マウス、キーボード、タッチパッド、タッチパネル、マイクロホン、又はその他の入力デバイスを含んでよい。
【0027】
ディスプレイ306は、異音が含まれる旨の判定の結果、プロセッサ301により生成される異音検知通知を表示する。ディスプレイ306は、液晶表示デバイス、有機ELデバイス、又はその他の表示デバイスを含んでよい。なお、ディスプレイは、情報処理装置30によって制御可能な遠隔の監視モニタであってもよい。また、操作部305およびディスプレイ306は、一体化されたタッチパネルであってもよい。
【0028】
入力部307は、マイク10によって収音され、AD変換器20から出力されるデジタル形式の音データを入力する。
【0029】
次に、実施の形態1に係る異音判定システム5の動作を示す。
【0030】
異音判定システム5は、学習モードおよび運用モードで動作し、異音判定処理を行う。学習モードとは、対象機器から発せられる音に含まれる定常音のうち最小の定常音を学習して検出し、その検出結果を学習結果として情報処理装置30内に記憶する動作モードである。一方、運用モードとは、学習モード以外の実際の運用環境において、学習モードで記憶された学習結果を用いて、対象機器から発せられる音に異音が含まれるか否かを判定する動作モードである。
【0031】
(学習モード)
プロセッサ301は、学習モード時、マイク10で収音された音に含まれる複数の定常音を抽出し、抽出した複数の定常音のうち、最小定常音の音データをストレージ303に記憶する。複数の定常音は、検査の対象機器100が正常状態である時に発する音を含む。学習は、検査の対象機器100が設置された初期状態において1回だけ行われてもよいし、メンテナンスなどにおいて定期的に行われてもよい。
【0032】
図3は、音データの学習動作手順を示すフローチャートである。マイク10は、検査の対象機器100から発せられる音を主に収音する。プロセッサ301は、マイク10で収音され、AD変換器20によってアナログデジタル変換された音データを入力する(S1)。プロセッサ301は、入力した音データをストレージ303に蓄積する。プロセッサ301は、所定時間が経過し、マイク10による録音が終了したか否かを判別する(S2)。マイク10による録音は、所定時間行われる。所定時間は、30分、1時間、1日などの任意の一定時間である。また、所定時間は、一定時間でなく、ユーザ(管理者を含む)が手動で停止するまでの時間であってもよい。また、所定時間は、運用モード時の録音時間(一定時間)に揃えることが、異音判定処理を行う上で好ましい。
【0033】
ステップS2で録音が終了していない場合、プロセッサ301の処理は、ステップS1に戻る。一方、ステップS2で録音が終了した場合、プロセッサ301は、ストレージ303に蓄積された時系列の音データに対し、周波数解析を行う(S3)。この周波数解析は、例えばFFT(Fast Fourier Transform)で100ms単位の音データに対して行われる。プロセッサ301は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S4)。フレーム(1フレーム)は、例えば音データが定常音であるか突発音であるかを判定するための音の長さである。1フレームの長さは、検査の対象機器の種類などによって異なり、例えば10ms~500msの範囲で任意に設定される。また、1フレームは、突発音の時間幅(例えばパルス的な突発音の場合にパルス幅)より広く設定される。この定常音を抽出する処理は、機械学習による学習済みモデルを用いて行われる。なお、この処理は、相互相関関数を用いて行われてもよい。
【0034】
プロセッサ301は、抽出した1つ以上の定常音の音データをストレージ303に蓄積する。プロセッサ301は、1つ以上の定常音の中から、音のスペクトルパワーが最小である定常音(以下、最小定常音という)を検出する最小定常音検出処理を行う(S5)。プロセッサ301は、この最小定常音を、検査の対象機器100が正常状態である時の定常音(正常音)であるとしてストレージ303に記憶する(S6)。なお、プロセッサ301は、通信部304を介して接続される外部のストレージに最小定常音の音データを記憶してもよい。この後、プロセッサ301は、学習モード時の動作を終了する。
【0035】
図4は、ステップS4における定常音抽出手順を示すフローチャートである。プロセッサ301は、ストレージ303に蓄積された音データのうち、一定時間分の音データを読み出す。一定時間は、例えば10秒、30分、所定フレーム分(20フレームや50フレーム)の時間であってもよい。プロセッサ301は、一定時間分の音データのスペクトルパワーを積算し、この積算値を1フレーム期間で除することで、1フレーム当たりの平均スペクトルパワーを算出する(S21)。
【0036】
プロセッサ301は、一定時間分の音データの中で、1フレーム期間の音データのスペクトルパワーが平均スペクトルパワーを上回っているか否かを順に判別する(S22)。1フレーム期間の音データのスペクトルパワーは、フレーム単位で各周波数の音響パワーを算出して平均化したものである。1フレーム期間の音データのスペクトルパワーが平均スペクトルパワー以下である場合、プロセッサ301は、1フレーム期間の音データが定常音であると判定する(S23)。
【0037】
プロセッサ301は、定常音であると判定された1フレームの音データが、ストレージ303に既に記憶された定常音の音データと類似する周波数特性を有するか否かを判別する(S24)。この音データの類似性の判断は、機械学習による学習済みモデルを用いて行われる。なお、この類似性の判断は、相互相関関数を用いて行われてもよい。
【0038】
1フレームの音データが、ストレージ303に記憶された定常音の音データと類似すると判別された場合、プロセッサ301は、ステップS26の処理に進む。一方、ステップS24で1フレームの音データが、ストレージ303に記憶された定常音の音データと類似しないと判別された場合、プロセッサ301は、この1フレームの音データを新規の定常音であるとしてストレージ303に記憶する(S25)。
【0039】
ステップS24,S25の処理後、プロセッサ301は、一定時間分のフレーム単位の音データを全て処理したか否かを判別する(S27)。例えば、1フレーム期間が0.5秒(500ms)、一定時間が30分である場合、プロセッサ301は、3600(=60/0.5×30)分のフレームの音データに対し、定常音の抽出処理を行うことになる。一定時間分のフレーム単位の音データを全て処理していない場合、プロセッサ301の処理は、ステップS22に戻る。一方、ステップS27で一定時間分のフレーム単位の音データを全て処理した場合、プロセッサ301は、本定常音抽出処理を終了し、メインの処理に復帰する。
【0040】
また、ステップS22で1フレーム期間の音データのスペクトルパワーが平均スペクトルパワーを上回っている場合、プロセッサ301は、この1フレームの音データが突発音であると判定する(S26)。プロセッサ301の処理は、ステップS27に進む。
【0041】
なお、1フレームの音データが突発音を含んでいても、1つの突発音のパワーが小さく、ステップS22でスペクトルパワーが平均スペクトルパワー以下である場合、プロセッサ301は、定常音であると判定する。一方、1つの突発音のパワーが小さくても、1フレームの音データが多くの突発音を含み、スペクトルパワーが平均スペクトルパワーを上回っている場合、プロセッサ301は、突発音であると判定する。
【0042】
図5は、ステップS5における最小定常音検出手順を示すフローチャートである。プロセッサ301は、ストレージ303に蓄積された、一定時間分の定常音の音データを読み出す。プロセッサ301は、1以上の定常音のスペクトルパワーを相互に比較する(S31)。プロセッサ301は、比較の結果、最もスペクトルパワーが最小である定常音を最小定常音としてストレージ303に記憶する(S32)。この後、プロセッサ301は、本処理を終了し、メインの処理に復帰する。
【0043】
このように、プロセッサ301は、1つ以上の定常音のスペクトルパワーを相互に比較し、1以上の定常音の中から最小定常音を選択することで、外乱音を含む定常音を選択しないようにする。したがって、プロセッサ301は、運用モード時において正常異常識別処理における比較の対象から外乱音を含む定常音を排除できる。
【0044】
図6は、学習モード時に収音された音の音圧レベルおよび周波数分布の時間変化を表す特性図である。特性図gh1は音圧レベルの時間変化を表す。特性図gh2は周波数分布の時間変化を表す。特性図gh1,gh2の横軸は時間を表す。特性図gh1の縦軸は、音圧レベルを表す。特性図gh2の縦軸は周波数を表す。また、特性図gh2は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。
【0045】
学習モード時、音データは、一定時間(例えば30分)収音され、ストレージ303に蓄積される。特性図gh1,gh2は、30分のうち、10秒分の音データを示す。ここで、音データの状態を判定する区間を1フレームとし、1フレームを0.5秒(500msec)に設定する場合を想定する。なお、1フレームは、例えば10ms~500msの中で任意に設定可能である。1フレームが500msecである場合、10秒分の音データは、20フレーム分の音データで表される。
【0046】
第1フレームF1(0~500ms)では、音圧レベルが低い定常的な音データが継続している。したがって、第1フレームF1は、音のスペクトルパワーが極めて小さい定常音の区間である。第2フレームF2(500~1000ms)は、第1フレームF1(0~500ms)と同じ状況である。
【0047】
第3フレームF3(1000~1500ms)では、1000mを僅かに経過して時点で音圧レベルが高い突発音が発生している。したがって、第3フレームF3は、音のスペクトルパワーが大きい突発音の区間である。第4フレームF4(1500~2000ms)は、第1フレームF1(0~500ms)と同じ状況である。
【0048】
第5フレームF5(2000~2500ms)では、音圧レベルが少し高い連続的な音データが発生している。このような連続的な音データとして、例えばモータ音が挙げられる。第5フレームF5は、連続的な音データによる音のスペクトルパワーはそれほど大きくなく、スペクトルパワーが少し大きな定常音の区間である。第6フレームF6(2500~3000ms)では、第5フレームF5に引き続き、音圧レベルが少し高い連続的な音データが発生している状態において、さらに、2500mを僅かに経過して時点で音圧レベルが高い突発音が発生している。したがって、第6フレームF6は、音のスペクトルパワーが大きい突発音の区間である。第7フレームF7(3000~3500ms)および第8フレームF8(3500~4000ms)は、第5フレームF5(2000~2500ms)と同じ状況である。
【0049】
第9フレームF9(4000~4500ms)では、音圧レベルが少し高い連続的な音データが無くなり、第1フレームF1(0~500ms)と同様、音圧レベルが低い定常的な音データが継続している。したがって、第9フレームF9は、音のスペクトルパワーが極めて小さい定常音の区間である。第10フレームF10(4500~5000ms)は、第9フレームF9と同じ状況である。
【0050】
第11フレームF11(5000~5500ms)では、音圧レベルが極めて高い突発音が頻繁に発生している。したがって、第11フレームF11は、音のスペクトルパワーが極めて大きい突発音の区間である。第12フレームF12(5500~6000ms)では、音圧レベルがやや高い突発音が発生している。第12フレームF12は、音のスペクトルパワーが平均スペクトルパワーを超えて突発音の区間と判定される。平均スペクトルパワーは、例えば一定時間(30分)あるいは20フレーム分(10秒)内に算出される音のスペクトルパワーの平均値である。
【0051】
第13フレームF13(6000~6500ms)および第14フレームF14(6500~7000ms)は、第9フレームF9と同じ状況である。
【0052】
第15フレームF15(7000~7500ms)および第16フレームF16(7500~8000ms)は、音圧レベルが高い連続的な音データが発生している。第5フレームF5は、連続的な音データによる音のスペクトルパワーは大きく、スペクトルパワーが平均スペクトルパワーを超える大きな非定常音の区間である。
【0053】
第17フレーム(8000~8500ms)~第20フレーム(9500~10000ms)は、第14フレームF14と同じ状況である。
【0054】
このように、各フレームにおいて、音のスペクトルパワーが平均スペクトルパワーを超えていない場合、連続的に少し高い音が発生しても、音データは、定常音であると判定される。一方、各フレームにおいて、音のスペクトルパワーが平均パワーを超えている場合、音データは、突発音であると判定される。プロセッサ301は、定常音であると判定された、複数の音データを全てストレージ303に蓄積し、正常状態の音データを取得する際に用いる。
【0055】
(運用モード)
運用モード時、プロセッサ301は、一定時間(例えば、30分、1日)ごとに、学習モード時と同様の処理で最小定常音を検出する。プロセッサ301は、現時点の最小定常音と、ストレージ303に記憶された、検査の対象機器100が正常状態である時の最小定常音とを比較する。プロセッサ301は、この比較結果を基に、対象機器100の正常状態/異常状態を判定する。
【0056】
図7は、音データの運用動作手順を示すフローチャートである。運用動作は、定期あるいは不定期に行われる。運用モード時、マイク10は、検査の対象機器100から発せられる音を収音する。プロセッサ301は、マイク10で収音され、AD変換器20によってアナログデジタル変換された音データを入力する(S11)。プロセッサ301は、入力した音データをストレージ303に蓄積する。
【0057】
プロセッサ301は、マイク10による収音を開始してから一定時間が経過したか否かを判別する(S12)。一定時間は、定常音の抽出精度を上げるため長めの時間に設定され、例えば30分、1時間、1日などの任意の一定時間である。また、一定時間は、学習モード時の所定時間に揃えることが、異音判定処理を行う上で好ましい。一定時間が経過していない場合、プロセッサ301は、ステップS11の処理に戻る。なお、ここでは、プロセッサ301が自動(例えばタイマ開始)で運用動作を開始する場合を示したが、ユーザが任意の時期に手動で運用動作の開始を指示してもよい。ユーザ(管理者を含む)が運用開始を指示すると、プロセッサ301が操作部305を介してこの指示を受け付けてもよい。
【0058】
ステップS12で一定時間が経過した場合、プロセッサ301は、ストレージ303に蓄積された時系列の音データに対し、周波数解析を行う(S13)。この周波数解析は、学習モード時と同様である。
【0059】
プロセッサ301は、周波数解析の結果を基に、音データに含まれる、フレーム単位に定常音を抽出する定常音抽出処理を行う(S14)。この定常音抽出処理は、学習モード時と同様である。プロセッサ301は、抽出した1つ以上の定常音の音データをストレージ303に蓄積する。プロセッサ301は、1つ以上の定常音の中から最小定常音を検出する最小定常音検出処理を行う(S15)。この最小定常音検出処理は、学習モード時と同様である。
【0060】
プロセッサ301は、ステップS15で検出された最小定常音を基に、検査の対象機器100が正常状態であるか異常状態であるかを識別する正常異常識別処理を行う(S16)。この正常異常識別処理では、最小定常音どうしを比較することで、連続的に発生する外乱音や頻度の少ない突発音が含まれる定常音は、比較の対象から外れる。したがって、正常異常の識別精度を高めることができる。この正常異常識別処理の詳細については後述する。
【0061】
プロセッサ301は、運用動作を終了するか否かを判別する(S17)。運用動作の終了は、ユーザ(管理者を含む)が手動で停止を指示し、プロセッサ301が操作部305を介してこの指示を受け付けることで認識される。なお、運用動作の終了は、プロセッサ301が自動(例えばタイマ終了)で行ってもよい。この場合、ユーザの手動操作を省くことができる。運用動作を終了しない場合、プロセッサ301は、ステップS11の処理に戻り、同様の処理を繰り返す。なお、プロセッサ301は、ステップS13の処理に戻り、同様の処理を繰り返してもよい。この場合、ステップS11,S12で蓄積された一定時間の音データに対し、繰り返し異音判定が行われることになる。一方、ステップS17で運用動作を終了する場合、プロセッサ301は本運用動作を終了する。
【0062】
図8は、ステップS16における正常異常識別手順を示すフローチャートである。プロセッサ301は、学習モード時にストレージ303に正常音であるとして記憶された、最小定常音の音データを読み込む(S41)。プロセッサ301は、ステップS15で検出された、現時点の最小定常音の音データと、正常音の音データとの類似度を算出する(S42)。この類似度の算出は、機械学習による学習済みモデルや相互相関関数を用いて行われてよい。
【0063】
プロセッサ301は、ステップS42で算出された類似度が閾値TH1以上であるか否かを判別する(S43)。閾値TH1は、プロセッサ301が定常音の音データが類似するか否かを判別するための値である。類似度が閾値TH1未満である場合、プロセッサ301は、検査の対象機器100が異常音を発していると判定する(S44)。プロセッサ301は、通知処理を行う(S45)。この通知処理では、プロセッサ301は、ディスプレイ306に異常状態である旨の異常検知通知を表示する。なお、プロセッサ301は、通信部304を介してネットワークに接続された遠隔の監視装置(図示せず)に対し、検査の対象機器100が異常音を発して異常状態にある旨の異常検知通知を通知してもよい。この後、プロセッサ301は、本運用動作を終了してメインの処理に復帰する。
【0064】
ステップS43で類似度が閾値TH1以上である場合、プロセッサ301は、検査の対象機器100が正常音を発していると判定する(S46)。この場合、検査の対象機器100が正常状態であるので、プロセッサ301は、通知処理を行わない。なお、検査の対象機器100が正常状態である場合、プロセッサ301は、ディスプレイ306に正常である旨を表示するなど、通知処理を行ってもよい。
【0065】
図9は、運用モード時に収音された正常状態および異常状態における音の音圧レベルおよび周波数分布の時間変化をそれぞれ表す特性図である。
【0066】
正常状態の特性図gh3は音圧レベルの時間変化を表す。正常状態の特性図gh4は周波数分布の時間変化を表す。正常状態の特性図gh3,gh4の横軸は時間を表す。正常状態の特性図gh3の縦軸は、音圧レベルを表す。正常状態の特性図gh4の縦軸は周波数を表す。また、正常状態の特性図gh4は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。
【0067】
同様に、異常状態の特性図gh5は音圧レベルの時間変化を表す。異常状態の特性図gh6は周波数分布の時間変化を表す。異常状態の特性図gh5,gh6の横軸は時間を表す。異常状態の特性図gh5の縦軸は、音圧レベルを表す。異常状態の特性図gh6の縦軸は周波数を表す。また、異常状態の特性図gh6は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。
【0068】
なお、
図9に示す音データの特性では、対象機器の正常状態と異常状態とで、突発音が同一のタイミングで発生しているが、この特性は、一例である。多くの場合、突発音の発生タイミングは、対象機器の正常状態と異常状態とで異なってもよい。
【0069】
運用モード時、音データは、一定時間(例えば30分)収音され、ストレージ303に蓄積される。特性図gh3,gh4および特性図gh5,gh6は、30分のうち、10秒分の音データを示す。学習モード時と同様、1フレームが500msecである場合、10秒分の音データは、20フレーム分の音データで表される。
【0070】
図9では、一例として、運用モード時、対象機器の正常状態における音データは、学習モード時の
図6に示す音データと同一である。したがって、正常状態で収音された音データの各フレームにおける音圧レベルおよび周波数分布の時間変化についての説明を省略する。ここでは、対象機器の異常状態における音データの特性を、正常状態における音データの特性とフレーム単位で比較して説明する。
【0071】
第1フレームF31(0~500ms)では、正常状態において、音圧レベルが低い定常的な音データが継続している。一方、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが低い定常的な音データに重畳している。ただし、第1フレームF31において、異常状態の音データは、周辺のフレームと同等のスペクトルパワーを有するために定常音であると判定される。つまり、第1フレームF31は、正常状態において、音のスペクトルパワーが極めて小さい定常音の区間であり、異常状態においても、音のスペクトルパワーが小さい定常音の区間である。
【0072】
第2フレームF32(500~1000ms)は、第1フレームF31(0~500ms)とほぼ同じ状況である。
【0073】
第3フレームF33(1000~1500ms)では、正常状態において、1000mを僅かに経過して時点で音圧レベルが高い突発音が発生している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生している音データに、音圧レベルが高い突発音が重畳している。したがって、第3フレームF33は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが大きい突発音の区間である。第4フレームF34(1500~2000ms)は、第1フレームF31と同じ状況である。
【0074】
第5フレームF35(2000~2500ms)では、正常状態において、音圧レベルが少し高い連続的な音データが発生している。このような連続的な音データとして、例えばモータ音が挙げられる。第5フレームF35は、連続的な音データによる音のスペクトルパワーはそれほど大きくなく、スペクトルパワーが少し大きな定常音の区間である。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが少し高い連続的な音データに重畳している。第5フレームF35は、正常状態および異常状態のいずれにおいても、定常音の区間である。
【0075】
第6フレームF36(2500~3000ms)では、正常状態において、第5フレームF35に引き続き、音圧レベルが少し高い連続的な音データが発生している状態において、さらに、2500msを僅かに経過して時点で音圧レベルが高い突発音が発生している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生している、音圧レベルが少し高い連続的な音データに、音圧レベルが高い突発音が重畳している。したがって、第6フレームF36は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが大きい突発音の区間である。第7フレームF37(3000~3500ms)および第8フレームF38(3500~4000ms)は、第5フレームF35と同じ状況である。
【0076】
第9フレームF39(4000~4500ms)では、正常状態において、音圧レベルが少し高い連続的な音データが無くなり、第1フレームF31(0~500ms)と同様、音圧レベルが低い定常的な音データが継続している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが低い定常的な音データに重畳している。第9フレームF39は、正常状態および異常状態のいずれにおいても、定常音の区間である。第10フレームF40(4500~5000ms)は、第9フレームF39とほぼ同じ状況である。
【0077】
第11フレームF41(5000~5500ms)では、正常状態において、音圧レベルが極めて高い突発音が頻繁に発生している。また、異常状態においては、音圧レベルが極めて高い突発音が頻繁に発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。したがって、第11フレームF41は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが極めて大きい突発音の区間である。
【0078】
第12フレームF42(5500~6000ms)では、正常状態において、音圧レベルがやや高い突発音が発生している。また、異常状態においては、音圧レベルがやや高い突発音が発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。したがって、第12フレームF42は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが平均スペクトルパワーを超えて突発音の区間と判定される。
【0079】
第13フレームF43(6000~6500ms)および第14フレームF44(6500~7000ms)は、第9フレームF9と同じ状況である。
【0080】
第15フレームF45(7000~7500ms)および第16フレームF46(7500~8000ms)は、正常状態において、音圧レベルが高い連続的な音データが発生している。また、異常状態においては、音圧レベルが高い連続的な音データが発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。第15フレームF45および第16フレームF46は、正常状態および異常状態のいずれにおいても、連続的な音データによる音のスペクトルパワーが平均スペクトルパワーを超えて大きく、非定常音の区間である。
【0081】
第17フレームF47(8000~8500ms)、第18フレームF48(8500~9000ms)および第19フレームF49(9000~9500ms)は、第13フレームF43および第14フレームF44と同じ状況である。
【0082】
第20フレームF50(9500~10000ms)は、正常状態および異常状態のいずれにおいても、音圧レベルが低い定常的な音データが継続している。また、異常状態において、異音が発生していない。第20フレームF50は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが極めて小さい定常音の区間である。
【0083】
ここで、プロセッサ301は、第20フレームF50の最小定常音を用いて正常異常識別処理を行った場合、対象機器が異常状態であっても、現時点の最小定常音と学習モード時に記憶した正常音との類似度が閾値TH1以上となり、正常状態であると判定してしまうことになる。この場合、プロセッサ301は、第20フレームF50を除くフレームの最小定常音を用いて正常異常識別処理を行うことが望ましい。また、第20フレームF50の音データが存在しても、異音判定処理は、ストレージ303に一定時間蓄積された音データを用いて、プロセッサ301によって繰り返し実行されており、別のタイミングで異音判定は可能である。
【0084】
このように、実施の形態1における異音判定システム5では、プロセッサ301は、対象機器100が発する音の音データから定常音を抽出し、予め記憶しておいた正常状態における定常音と比較することで、対象機器100の正常異常識別処理を行う。定常音どうしを比較することで、マイクで収音される音に外乱音が含まれる環境においても、プロセッサ301は、正常異常の識別精度を向上できる。特に、プロセッサ301は、正常状態における最小定常音と現時点の最小定常音とを比較することで、対象機器100が発する音データに、外乱音(例えば突発音や音圧レベルが少し高い連続的なモータ音など)が含まれる場合においても、対象機器100の異常状態を適正に検出できる。また、プロセッサ301は、対象機器100の設置時など、始動初期における最小定常音を学習することで、対象機器100が良好な状態で正常音を学習できる。また、異音判定システム5は、対象機器100が様々な環境に設置されても対応可能である。なお、異音判定システムは、1つのマイクおよび1台のAD変換器を含む構成に限らず、任意の数のマイクおよび任意の数のAD変換器を含む構成であってもよい。
【0085】
以上により、情報処理装置30(異音判定装置の一例)は、対象機器100から発せられる音を収音するマイク10に接続される入力部307と、対象機器100から発せられる音の所定期間分の音データを記憶するストレージ303(メモリの一例)と、所定期間分の音データを用い、所定期間より短い1フレーム期間ごとに1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサ301と、を備える。ストレージ303は、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶する。プロセッサ301は、学習モード時と異なる運用モード中に定常音と判定された1フレーム期間の音データとストレージ303に記憶された正常音の音データとの比較に応じて、対象機器100から発せられる音に異音が含まれるか否かを判定(識別の一例)する。
【0086】
これにより、情報処理装置30は、対象機器100から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させ、対象機器の異常の有無を適切に検知できる。
【0087】
また、プロセッサ301は、対象機器100から発せられる音に異音が含まれると識別した場合に、対象機器100から発せられる音に異音が含まれる旨の異音検知通知をディスプレイ306に表示する。これにより、ユーザ(管理者を含む)は、対象機器の異常状態に気付くことができる。
【0088】
また、プロセッサ301は、学習モード中に定常音と判定された1以上の1フレーム期間の音データのスペクトルパワーが最小となる最小定常音の音データを検出し、その検出された最小定常音の音データを正常音の音データとしてストレージ303に保存する。これにより、情報処理装置30は、学習モードにおいて、外乱音などが最も少ない状態でマイクにより収音された1フレーム期間の音を、対象機器が発する音の正常音として記憶できる。したがって、情報処理装置30は、対象機器から発せられる音に異音が含まれるか否かを識別する際、比較の対象となる正常音を、外乱音が最も少ない状態で得ることができる。
【0089】
また、プロセッサ301は、運用モード中に定常音と判定された1以上の1フレーム期間の音データのスペクトルパワーが最小となる最小定常音の音データを検出し、その検出された最小定常音の音データと正常音の音データとの比較に応じて、対象機器100から発せられる音に異音が含まれるか否かを識別する。これにより、情報処理装置30は、運用モードにおいて、外乱音などが抑えられた、現時点の最小定常音と正常音として記憶された最小定常音とを比較することで、対象機器の正常状態/異常状態の識別精度を向上できる。
【0090】
(実施の形態2)
実施の形態1では、一定時間内で抽出された複数の定常音のうち最小定常音を用いて正常異常識別処理が行われたが、実施の形態2では、最小定常音だけを用いることなく1以上の定常音を用いて正常異常識別処理を行う場合を示す。
【0091】
また、実施の形態2の異音判定システムにおいて、実施の形態1と同一の構成要素については同一の符号を付すことで、その説明を省略する。
【0092】
図10は、実施の形態2における異音判定システム5Aの概略構成の一例を示す図である。異音判定システム5Aは、2つのマイク10A、10B、AD変換器20、情報処理装置30、およびクラウドサーバ50を含む構成である。2つのマイク10A、10BおよびAD変換器20は、検査の対象機器100A,100Bが設置された機械室に置かれる。情報処理装置30は、ユーザ(管理者を含む)が所在する監視室に置かれる。
【0093】
図11は、異音判定システム5Aのハードウェア構成を示す図である。2つのマイク10A、10Bは、実施の形態1におけるマイク10と同一の仕様を有する。マイク10Aは、対象機器100Aが発する音を主に収音する。マイク10Bは、対象機器100Bが発する音を主に収音する。なお、マイクの数は、検査の対象機器の数に対応した任意の数であってよい。
【0094】
AD変換器20は、2つのマイク10A、10Bで収音された音をそれぞれアナログデジタル変換し、デジタル形式の音データを出力する。このアナログデジタル変換は、2つのマイク10A、10Bからの音信号に対し、時分割あるいは同時に行われてよい。
【0095】
情報処理装置30は、クラウドサーバ50に接続可能な端末装置であり、実施の形態1と同一の構成を有する。情報処理装置30は、AD変換器20から出力される音データを、ネットワーク機器41を介して受信する。情報処理装置30は、2つのマイク10A、10Bによる音データをストレージ303に一定時間(例えば、30分、1時間など)蓄積する。情報処理装置30は、ストレージ303に蓄積した一定時間分の音データを、ネットワーク機器45を介してクラウドサーバ50に送信する。なお、情報処理装置30は、ストレージ303に蓄積された一定時間分の音データのうち、正常異常識別処理に必要な長さ分の音データだけを送信してもよい。また、情報処理装置30は、正常異常識別つ処理の結果を表示可能なディスプレイとしても機能する。
【0096】
クラウドサーバ50は、プロセッサ501、メモリ502、ストレージ503、通信部504を有する。プロセッサ501は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)などの各種処理デバイスを有し、音データに関する処理を実行する。メモリ502は、RAM(Random Access Memory)などのメモリデバイスを有し、プロセッサ501のワーキングメモリとして使用され、データ処理時の演算などにおいて一時記憶に利用する。また、メモリ502は、ROM(Read Only Memory)などのメモリデバイスを有し、プロセッサ301の処理を実行するための各種実行プログラム、機械学習などの処理に関する各種設定データを記憶する。ストレージ503は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスクドライブなどの各種ストレージデバイスを有し、対象機器の音データや、機械学習により生成した学習済みモデルなどのデータを格納する。ストレージ503は、様々な環境で収音された音データを蓄積するために、情報処理装置30に内蔵されたストレージ303と比べ、大容量の記憶媒体である。通信部504は、有線又は無線の通信を行うインタフェースであり、クラウドNWに接続された情報処理装置30とネットワーク機器45を介して通信を行い、音データや学習済みモデルなどのデータを送受信する。
【0097】
ネットワーク機器41は、社内LAN(Local Area Network)などのイントラネットに接続された2つのマイク10A,10Bと情報処理装置30との間で送受信されるデータを中継する。なお、AD変換器20がネットワークI/F(Interface)を備える場合、ネットワーク機器41は省略可能である。
【0098】
ネットワーク機器45は、イーサネット(登録商標)などの通信プロトコルに則って、情報処理装置30とクラウドサーバ50との間で送受信されるデータを中継する。
【0099】
次に、異音判定システム5Aの動作を示す。
【0100】
(学習モード)
学習は、検査の対象機器100A,100Bが設置された初期状態において1回だけ行われてもよいし、メンテナンスなどにおいて定期的または不定期に行われてもよい。音データの学習モード時、マイク10A,10Bは、それぞれ検査の対象機器100A,100Bから発せられる音を主に収音する。マイク10A,10Bによる録音は、所定時間行われる。所定時間は、30分、1時間、1日などの任意の一定時間である。また、所定時間は、一定時間でなく、ユーザや管理者が手動で停止する時間であってもよい。
【0101】
図12は、音データの学習動作手順を示すフローチャートである。ステップS51~S54の処理は、前記実施の形態1の
図3におけるステップS1~S4の処理と同様である。
【0102】
クラウドサーバ50のプロセッサ501は、マイク10A,10Bで収音され、AD変換器20によってアナログデジタル変換された音データを、情報処理装置30およびネットワーク機器45を介して受信する(S51)。
【0103】
プロセッサ501は、受信した音データをストレージ503に蓄積する。プロセッサ501は、所定時間が経過し、マイク10による録音が終了したか否かを判別する(S52)。録音が終了していない場合、プロセッサ501は、ステップS51の処理に戻る。
【0104】
ステップS52で録音が終了した場合、プロセッサ501は、ストレージ503に蓄積された時系列の音データに対し、周波数解析を行う(S53)。この周波数解析は、前記実施の形態1と同様である。
【0105】
プロセッサ501は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S54)。この定常音抽出処理は、前記実施の形態1と同様である。
【0106】
プロセッサ501は、抽出した1以上の定常音の音データをストレージ503に全て蓄積する(S55)。この後、プロセッサ501は、本学習動作を終了する。
【0107】
(運用モード)
運用モード時、プロセッサ501は、学習モード時と同様の処理で定常音を検出する。プロセッサ501は、現時点の定常音と、ストレージ503に記憶された、検査の対象機器100A,100Bが正常状態である時の1以上の定常音とを比較する。プロセッサ501は、この比較結果を基に、対象機器100A,100Bの正常状態/異常状態を識別する。
【0108】
図13は、音データの運用動作手順を示すフローチャートである。運用動作は、定期あるいは不定期に行われる。運用モード時、マイク10A,10Bは、検査の対象機器100A,100Bから発せられる音を主に収音する。
【0109】
運用動作において、ステップS61~S64,S65,S66の処理は、前記実施の形態1の
図7におけるステップS11~S14,S16,S17の処理と同様である。
【0110】
クラウドサーバ50のプロセッサ501は、マイク10A,10Bで収音され、AD変換器20によってアナログデジタル変換された音データを、情報処理装置30およびネットワーク機器45を介して受信する(S61)。プロセッサ501は、受信した音データをストレージ503に蓄積する。
【0111】
プロセッサ501は、マイク10A,10Bによる収音を開始してから一定時間(例えば30分、1日など)が経過したか否かを判別する(S62)。ステップS62で一定時間が経過した場合、プロセッサ501は、ストレージ503に蓄積された時系列の音データに対し、周波数解析を行う(S63)。この周波数解析は、学習モード時と同様である。
【0112】
プロセッサ501は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S64)。この定常音抽出処理は、学習モード時と同様である。
【0113】
プロセッサ501は、ステップS64で抽出された1以上の定常音を基に、検査の対象機器100A,100Bが正常状態であるか異常状態であるかを識別する正常異常識別処理を行う(S65)。正常異常識別処理は、対象機器100A,100Bそれぞれに対して行われる。この正常異常識別処理の詳細については後述する。
【0114】
プロセッサ501は、運用動作を終了するか否かを判別する(S66)。運用動作の終了は、ユーザ(管理者を含む)が手動で停止を指示し、プロセッサ301が操作部305を介してこの指示を受け付けることで認識される。プロセッサ501は、情報処理装置30から停止指示を受信する。なお、運用動作の終了は、プロセッサ501が自動(例えばタイマ終了)で行ってもよい。この場合、ユーザの手動操作を省くことができる。運用動作を終了しない場合、プロセッサ501は、ステップS61の処理に戻り、同様の処理を繰り返す。一方、運用動作を終了する場合、プロセッサ501は本運用動作を終了する。
【0115】
図14は、ステップS65における正常異常識別手順を示すフローチャートである。プロセッサ501は、学習モード時にストレージ503に記憶された、1以上の定常音の音データを読み込む(S71)。プロセッサ501は、ステップS64で抽出された、現時点の定常音の音データと、ストレージ503に記憶した定常音の音データとの類似度を算出する(S72)。この類似度の算出は、機械学習による学習済みモデルや相互相関関数を用いて行われる。
【0116】
プロセッサ501は、ステップS72で算出された類似度が閾値TH2以上となる定常音が少なくとも1つ以上あるか否かを判別する(S73)。閾値TH2は、プロセッサ501が定常音の音データが類似するか否かを判別するための値である。閾値TH2は、閾値TH1と同じ値であってもよいし、異なる値であってもよい。類似度が閾値TH2未満である場合、プロセッサ501は、検査の対象機器100A,100Bが異常音を発していると判定する(S74)。プロセッサ501は、通知処理を行う(S75)。
【0117】
この通知処理では、プロセッサ501は、通信部504、クラウドNWおよびネットワーク機器45を介して対象機器100A,100Bの少なくとも一方が異常状態である旨を表すデータを情報処理装置30に送信する。情報処理装置30は、クラウドサーバ50から対象機器100A,100Bの少なくとも一方が異常である旨を表すデータを受信すると、ディスプレイ306に対象機器100A,100Bの少なくとも一方が異常状態である旨を表示する。なお、クラウドサーバ50がディスプレイを備える場合、自装置のディスプレイに対象機器100A,100Bが異常状態である旨を表示してもよい。この後、プロセッサ501は、本運用動作を終了してメインの処理に復帰する。
【0118】
ステップS73で類似度が閾値TH2以上である場合、プロセッサ501は、検査の対象機器100A,100Bが正常音を発していると判定する(S76)。この場合、検査の対象機器100A,100Bが正常状態であるので、プロセッサ501は、通知処理を行わない。なお、検査の対象機器100A,100Bが正常状態である場合、プロセッサ501は、通信部504、クラウドNWおよびネットワーク機器45を介して対象機器100A,100Bが正常状態である旨を表すデータを情報処理装置30に送信してもよい。情報処理装置30は、クラウドサーバ50から対象機器100A,100Bが正常状態である旨を表すデータを受信すると、ディスプレイ306に対象機器100A,100Bが正常状態である旨を表示する。
【0119】
このように、実施の形態2における異音判定システム5Aでは、クラウドサーバ50のプロセッサ501は、学習モード時、1以上の定常音をストレージ503に蓄積しておく。プロセッサ501は、運用モード時、マイク10A,10Bにより収音された音データの定常音がストレージ503に蓄積された複数の定常音のいずれかと類似する場合、つまり、1以上の定常音の中に類似度が高い定常音が存在する場合、対象機器100A,100Bが正常状態であると判定する。また、クラウドサーバ50は、複数の定常音の中に類似度が高い定常音が存在しない場合、対象機器100A,100Bが異常状態であると判定する。したがって、クラウドサーバ50は、対象機器が他の環境に置かれた場合でも、いずれかの定常音と類似する場合、対象機器100A,100Bの正常異常を識別できる。
【0120】
以上により、プロセッサ501は、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から2つ以上の定常音を正常音としてストレージ503に保存する。これにより、クラウドサーバ50のプロセッサ501は、学習モードにおいて、1以上の定常音を正常音としてストレージ503に記憶できる。したがって、プロセッサ501は、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する際、比較の対象となる正常音を多く得ることができる。この場合、クラウドサーバ50は、学習モード時に複数の定常音の中からスペクトルパワーが最小である最小定常音を選択する処理を省くことができる。
【0121】
また、プロセッサ501は、運用モード中に定常音と判定された1フレーム期間の音データとストレージ503に記憶された2つ以上の正常音の音データとの比較に応じて、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する。これにより、クラウドサーバ50のプロセッサ501は、複数の定常音の中に類似度が高い定常音が存在する場合、対象機器100A,100Bが正常状態であると識別する。一方、プロセッサ501は、複数の定常音の中に類似度が高い定常音が存在しない場合、対象機器100A,100Bが異常状態であると識別する。この場合、クラウドサーバ50のプロセッサ501は、運用モード時に複数の定常音の中からスペクトルパワーが最小である最小定常音を選択する処理を省くことができる。
【0122】
なお、クラウドサーバは、前記実施の形態1と同様、抽出された複数の定常音の中から最小定常音を正常音として学習し、運用モード時、現時点の最小定常音と正常音とを比較することで、対象機器100A,100Bの正常異常を識別してもよい。
【0123】
また、実施の形態2では、クラウドサーバ50が学習動作および運用動作を行う場合を示したが、情報処理装置30が、クラウドサーバ50と同様の学習動作および運用動作を行ってもよい。この場合、クラウドサーバ50を省くことができる。
【0124】
(実施の形態2の変形例)
また、クラウドサーバ50のプロセッサ501は、学習モード時、様々な環境(例えば、対象機器が設置された種々の場所)でマイク10,10Bにより収音された正常音をストレージ503に蓄積してもよい。運用モード時、クラウドサーバ50のプロセッサ501は、ストレージ503に蓄積された多くの正常音の音データを用いて、様々な環境において、対象機器100A,100Bの正常異常状態を識別できる。
【0125】
このように、ストレージ503は、複数の異なる環境に置かれた、対象機器100A,100Bから発せられる音の所定期間分の音データを記憶すると共に、環境ごとに、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶する。プロセッサ501は、学習モード時と異なる運用モード中に定常音と判定された1フレーム期間の音データとストレージ503に環境ごとに記憶された正常音の音データとの比較に応じて、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する。
【0126】
これにより、対象機器が様々な環境に置かれた場合であっても、クラウドサーバ50は、様々な環境に対応して対象機器100A,100Bの異常状態または正常状態を識別できる。
【0127】
以上、図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されないことはいうまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
【産業上の利用可能性】
【0128】
本開示は、異常判定装置において、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させることができ、有用である。
【符号の説明】
【0129】
5 異音判定システム
10、10A、10B マイク
20 AD変換器
30 情報処理装置
50 クラウドサーバ
100 対象機器
301、501 プロセッサ
302、502 メモリ
303、503 ストレージ
304、504 通信部
305 操作部
306 ディスプレイ
307 入力部