IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社小野測器の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023091528
(43)【公開日】2023-06-30
(54)【発明の名称】信号処理装置、及び、信号処理方法
(51)【国際特許分類】
   G01H 17/00 20060101AFI20230623BHJP
   G06N 3/08 20230101ALI20230623BHJP
   F02D 45/00 20060101ALI20230623BHJP
   G01M 99/00 20110101ALI20230623BHJP
【FI】
G01H17/00 Z
G06N3/08
F02D45/00 368A
F02D45/00 368S
F02D45/00 345
G01M99/00 Z
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021206313
(22)【出願日】2021-12-20
(71)【出願人】
【識別番号】000145806
【氏名又は名称】株式会社小野測器
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】笠原 太郎
(72)【発明者】
【氏名】渡部 光
(72)【発明者】
【氏名】吉越 洋志
【テーマコード(参考)】
2G024
2G064
3G384
【Fターム(参考)】
2G024AD01
2G024CA13
2G024FA04
2G024FA06
2G024FA11
2G064AA11
2G064AA15
2G064AB01
2G064AB02
2G064AB13
2G064AB15
2G064BA02
2G064BD02
2G064CC02
2G064CC42
2G064CC43
2G064DD02
3G384AA01
3G384DA28
3G384EA24
3G384EA27
3G384EC01
3G384EC12
3G384FA29Z
3G384FA33Z
3G384FA58Z
(57)【要約】
【課題】入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行う。
【解決手段】信号処理装置10は、入力物理量(エンジン近傍音90)に含まれるノイズ成分(雑音91b)を低減したノイズ低減入力物理量90Aを生成するノイズ低減入力物理量生成部15と、入力物理量とノイズ低減入力物理量のいずれか一方又は双方を選択する選択部16と、入力物理量とノイズ低減入力物理量の中の選択部が選択したものからノイズ成分を除去するためのノイズ除去マスクαを生成するニューラルネットワークの重みを学習する学習部21と、を備える。
【選択図】図3A
【特許請求の範囲】
【請求項1】
入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成部と、
前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択部と、
前記入力物理量と前記ノイズ低減入力物理量の中の前記選択部が選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習部と、を備える
ことを特徴とする信号処理装置。
【請求項2】
請求項1に記載の信号処理装置において、
前記ノイズ低減入力物理量生成部は、前記ノイズ除去マスクをフィルタ処理した処理マスクを用いて、前記入力物理量から前記ノイズ成分を低減した前記ノイズ低減入力物理量を生成する
ことを特徴とする信号処理装置。
【請求項3】
請求項1又は請求項2に記載の信号処理装置において、
前記学習部は、前記ノイズ成分と教師信号との関連性が小さくなるとともに、前記入力物理量又は前記ノイズ低減入力物理量から前記ノイズ成分を除去した抽出信号と前記教師信号との関連性が大きくなるように、前記ニューラルネットワークの重みを学習する
ことを特徴とする信号処理装置。
【請求項4】
請求項3に記載の信号処理装置において、
前記学習部は、前記ノイズ除去マスクを用いて、前記入力物理量又は前記ノイズ低減入力物理量から前記ノイズ成分を除去した前記抽出信号を生成して、前記抽出信号を前記教師信号と同じ次元の推定信号に変換するための伝達関数を学習する
ことを特徴とする信号処理装置。
【請求項5】
請求項4に記載の信号処理装置において、
前記学習部は、前記教師信号に対する前記推定信号の誤差が小さくなるように、前記ニューラルネットワークの重みと前記伝達関数とを学習する
ことを特徴とする信号処理装置。
【請求項6】
請求項1から請求項5のいずれか一項に記載の信号処理装置において、
前記選択部は、前記入力物理量と前記ノイズ低減入力物理量をシャッフルしたデータセットを前記学習部に供給する
ことを特徴とする信号処理装置。
【請求項7】
入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成工程と、
前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択工程と、
前記入力物理量と前記ノイズ低減入力物理量の中の前記選択工程で選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習工程と、を含む
ことを特徴とする信号処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力物理量をノイズ成分とノイズ成分が除去された抽出信号とに良好に分離するための学習を行う信号処理装置、及び、信号処理方法に関する。
【背景技術】
【0002】
例えば、ガソリンエンジンなどの内燃機関における点火時期は、出力トルクの向上を目的として、ノッキングが発生しないクランク角度の範囲内において可能な限り進角されることが一般的である。そこで、点火時期を調整する過程では、ノッキングが発生しているか否かが試験者又はノッキング判定装置によって判定される。こうしたノッキング判定装置の一例が特許文献1に記載されている。
【0003】
特許文献1に記載のノッキング判定装置は、ノッキングの有無が判定される判定信号と比較される対象信号とを、判定信号との関係(例えば、時間的な関係や運転条件における関係)で定まる条件に基づいて選択する。
【0004】
特許文献1に記載のノッキング判定装置では、ノッキングの有無の判定結果しか外部に提示できず、判定結果の裏付けをとることが困難である。そこで、本発明の発明者らによって、判定結果の裏付けとなる所望の物理量を推定することが可能な装置として、特許文献2又は特許文献3に記載の装置が提案された。
【0005】
特許文献2に記載の装置は、「入力物理量に含まれるノイズ成分を除去し、前記ノイズ成分が除去された入力物理量から所望の物理量を推定するための学習装置であって、前記ノイズ成分は、内燃機関で発生するノッキング音以外の雑音であり、前記入力物理量は、前記雑音及び前記ノッキング音が含まれる前記内燃機関の音圧であり、前記所望の物理量は、ノッキング発生時の前記内燃機関の筒内圧であり、ニューラルネットワークにより、前記雑音を除去し、かつ、前記ノッキング音を抽出するマスクを生成するニューラルネットワークの重み、及び/又は、前記マスクにより抽出されたノッキング音を前記ノッキング発生時の内燃機関の筒内圧に変換する伝達関数を学習する学習部、を備えることを特徴とする学習装置。」というものである。
【0006】
特許文献3に記載の装置は、「内燃機関で発生するノッキング音以外の雑音を除去し、前記雑音が除去されたノッキング音を推定するノッキング判定装置であって、ニューラルネットワークにより、前記雑音を除去し、かつ、前記ノッキング音を抽出するマスクを生成するニューラルネットワークの重み、及び、前記マスクにより抽出されたノッキング音をノッキング発生時の内燃機関の筒内圧に変換する伝達関数を学習する学習部と、ニューラルネットワークにより、前記マスクを用いて、前記雑音が含まれるノッキング音から前記雑音が除去されたノッキング音を推定する第2推定部と、を備えることを特徴とするノッキング判定装置。」というものである。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2017-44148号公報
【特許文献2】特許第6605170号公報
【特許文献3】特許第6651040号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献2及び特許文献3に記載された従来技術は、入力物理量に含まれるノイズ成分の量(ノイズ量)が大きい場合(特に、入力物理量から取りたい信号(抽出したい信号)よりもノイズの音圧が比較的大きい場合)に、分離後のノイズ成分に教師信号と関連のある成分が含まれていることがあった。したがって、入力物理量をノイズ成分と抽出信号とに良好に分離することができないときがあった。
【0009】
本発明は、前記の課題を解決するためになされたものであり、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行う信号処理装置、及び、信号処理方法を提供することを主な目的とする。
【課題を解決するための手段】
【0010】
前記課題を解決するため、本発明は、信号処理装置であって、入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成部と、前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択部と、前記入力物理量と前記ノイズ低減入力物理量の中の前記選択部が選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習部と、を備える構成とする。
【0011】
また、本発明は、信号処理方法であって、入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成工程と、前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択工程と、前記入力物理量と前記ノイズ低減入力物理量の中の前記選択工程で選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習工程と、を含む構成とする。
その他の手段は、後記する。
【発明の効果】
【0012】
本発明によれば、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。
【図面の簡単な説明】
【0013】
図1】第1実施形態に係る信号処理装置(推定装置)を含む信号処理システムの全体構成を示すブロック図である。
図2】第1実施形態に係る信号処理装置(推定装置)の構成を示すブロック図である。
図3A】学習モードの説明図である。
図3B】第1実施形態に係る信号処理装置(推定装置)の学習モード時の動作説明図である。
図4A】閾値算出モードの説明図である。
図4B】第1実施形態に係る信号処理装置(推定装置)の閾値算出モード時の動作説明図である。
図5A】判定モードの説明図である。
図5B】第1実施形態に係る信号処理装置(推定装置)の判定モード時の動作説明図である。
図6A】分離モードの説明図である。
図6B】第1実施形態に係る信号処理装置(推定装置)の分離モード時の動作説明図である。
図7A】官能試験モードの説明図である。
図7B】第1実施形態に係る信号処理装置(推定装置)の官能試験モード時の動作説明図である。
図8A】学習時におけるノイズ成分と教師信号との関係を表す説明図である。
図8B】学習時における抽出信号と教師信号との関係を表す説明図である。
図8C】学習時における抽出信号と推定信号との関係を表す説明図である。
図9】第1実施形態において、ノイズ除去マスクを生成するニューラルネットワークの重みの学習の説明図である。
図10A】圧力や、振動、音などの位相成分が考慮されていない場合の計算例の説明図である。
図10B】圧力や、振動、音などの位相成分が考慮されている場合の計算例の説明図である。
図11A】官能試験における信号処理の説明図(1)である。
図11B】官能試験における信号処理の説明図(2)である。
図11C】官能試験における信号処理の説明図(3)である。
図12A】官能試験における信号処理の説明図(4)である。
図12B】官能試験における信号処理の説明図(5)である。
図12C】官能試験における信号処理の説明図(6)である。
図13】第1実施形態において、信号処理装置(推定装置)のデータ収集処理を示すフローチャートである。
図14A】第1実施形態において、信号処理装置(推定装置)の学習処理を示すフローチャートである。
図14B】学習処理のサブルーチンを示すフローチャートである。
図14C】学習処理のサブルーチンの変更例を示すフローチャートである。
図15A】第1実施形態において、信号処理装置(推定装置)の閾値算出処理を示すフローチャートである。
図15B】第1実施形態において、図17の分離処理及び図18の官能試験処理の後に行われる信号処理装置(推定装置)の閾値算出処理を示すフローチャートである。
図16】第1実施形態において、信号処理装置(推定装置)の判定処理を示すフローチャートである。
図17】第1実施形態において、信号処理装置(推定装置)の分離処理を示すフローチャートである。
図18】第1実施形態において、信号処理装置(推定装置)の官能試験処理を示すフローチャートである。
図19A】比較例に係る信号処理装置(推定装置)の構成を示すブロック図である。
図19B】比較例に係る信号処理装置(推定装置)の学習モードの説明図である。
図19C】比較例に係る信号処理装置(推定装置)の学習モード時の動作説明図である。
図20】第1実施形態の変形例に係る信号処理装置(推定装置)の用途変更を実現するための信号処理システムの全体構成を示すブロック図である。
図21】用途変更された第1実施形態に係る信号処理装置(推定装置)の学習モードの説明図である。
図22A】比較例に係る信号処理装置(推定装置)において発生する不適切な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できなくなる場合の例)の説明図(1)である。
図22B】比較例に係る信号処理装置(推定装置)において発生する不適切な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できなくなる場合の例)の説明図(2)である。
図22C】比較例に係る信号処理装置(推定装置)において発生する不適切な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できなくなる場合の例)の説明図(3)である。
図22D】比較例に係る信号処理装置(推定装置)において発生する不適切な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できなくなる場合の例)の説明図(4)である。
図23A】第1実施形態に係る信号処理装置(推定装置)において実現される好適な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できる場合の例)の説明図(1)である。
図23B】第1実施形態に係る信号処理装置(推定装置)において実現される処理マスクを用いて図23Aに示す信号のスペクトログラムからノイズを低減したノイズ低減入力物理量の説明図(2)である。
図23C】第1実施形態に係る信号処理装置(推定装置)において実現される好適な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できる場合の例)の説明図(3)である。
図23D】第1実施形態に係る信号処理装置(推定装置)において実現される好適な例(入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できる場合の例)の説明図(4)である。
図23E】好適な例における取り逃がした信号の説明図(5)である。
図24】処理マスクの生成方法の概略説明図である。
図25】処理マスクの生成方法の説明図である。
図26】ノイズ低減入力物理量の生成方法の説明図である。
図27】ノイズ低減入力物理量の生成方法の説明図である。
図28】第1実施形態に係る信号処理装置(推定装置)の学習モードにおけるシャッフル処理の説明図である。
図29】第1実施形態に係る信号処理装置(推定装置)の学習モード時における動作の変更例の説明図である。
図30】第2実施形態に係る信号処理装置(推定装置)の構成を示すブロック図である。
【発明を実施するための形態】
【0014】
図面を参照して、本発明の実施形態(以下、「本実施形態」と称する)について詳細に説明する。なお、各図は、本発明を十分に理解できる程度に、概略的に示しているに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
【0015】
特許文献2及び特許文献3に記載された従来技術は、分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価していない。このような従来技術は、入力物理量をノイズ成分と抽出信号とに良好に分離できない。そこで、本発明は、分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価して、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行う信号処理装置を提供することも意図している。
【0016】
また、特許文献2及び特許文献3に記載された従来技術は、入力物理量に関連する位相成分を考慮することなく、入力物理量をノイズ成分と抽出信号とに分離する構成になっていた。そのため、従来技術は、入力物理量をノイズ成分と抽出信号とに分離しても、ノイズ成分に抽出信号が混入してしまい、抽出信号を正確に分離できなかった。そこで、本発明は、位相成分を考慮した構成を実現することにより、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行う信号処理装置を提供することも意図している。
【0017】
また、特許文献2及び特許文献3の従来技術では、伝達関数を用いて所望の物理量を推定しているが、本発明は伝達関数を使用するか否かは問わない。
【0018】
[第1実施形態]
本第1実施形態は、入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成部と、前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択部と、前記入力物理量と前記ノイズ低減入力物理量の中の前記選択部が選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習部と、を備える信号処理装置を提供するものである。
【0019】
<信号処理装置(推定装置)を含む信号処理システムの全体構成>
図1を参照して、本第1実施形態に係る信号処理装置10(推定装置)を含む信号処理システム100の全体構成について説明する。図1は、信号処理装置10を含む信号処理システム100の全体構成を示すブロック図である。
【0020】
信号処理装置10は、信号に対して各種の処理を行う装置である。本実施形態では、信号処理装置10が、ノイズ成分が除去された抽出信号に伝達関数を掛け合わせて、教師信号と同じ次元(単位)の推定信号を推定する推定装置として機能するものとして説明する。また、本実施形態では、ガソリンエンジンなどの内燃機関でノッキングが発生しているか否かを検証する用途に信号処理装置10が用いられるものとして説明する。ただし、信号処理装置10は、このような用途に限らず、様々な用途に用いることができる。例えば、信号処理装置10は、後記するように、検証対象を電子装置に搭載された複数の電子部品のうちの1つとして、この検証対象の電子部品でどのような動作音が発生しているかを検証する用途に用いることができる。
【0021】
図1に示すように、信号処理システム100は、試験対象となるエンジン1のノッキングの有無を判定するものであり、音圧センサ4と、筒内圧センサ5と、データ収集装置6と、モニタ7と、ヘッドホン8と、レベル指定部9と、信号処理装置10とを備える。
【0022】
図1に示すように、試験対象のエンジン1は、車両3に搭載されている。なお、試験対象のエンジン1は、車両3に搭載されない状態、例えば単独の状態で用いられてもよい。エンジン1には、エンジン1の駆動を制御するエンジンECU(Electronic Control Unit)2が接続されている。エンジンECU2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random access memory)、その他の記憶装置等で構成されている。エンジンECU2は、ROMや記憶装置に記憶されたプログラムをCPUで演算処理することで、エンジン1の駆動制御に必要な各種情報をエンジンECU2の外部から取得しながらエンジン1の駆動を制御する。
【0023】
エンジンECU2は、エンジン1の現在の回転角度を表す角度情報をデータ収集装置6に出力する。角度情報には、例えば、基準角度パルスとクランク角度パルスとが含まれる。基準角度パルスは、クランク軸の一回転中の基準角度位置で出力される基準のパルスで、例えば、クランク軸が1回転する毎に1パルスが出力される。また、クランク角度パルスは、クランク軸が一定角度回転する毎に出力されるパルスであって、例えば、1°毎に1パルスが出力される場合、吸入、圧縮、燃焼及び排気の4行程を1サイクルとする4ストロークエンジンにおいて、1サイクルにクランク軸が回転する2回転の間に720パルスが出力される。なお、角度情報がデータ収集装置6に入力されるのであれば、エンジンECU2を介さず、クランク軸の回転角度の原点を検出する原点センサや、クランク軸の回転角度を検出する角度センサからの角度情報がデータ収集装置6に入力されてもよい。
【0024】
エンジン1の近くには、音圧センサ4が設置されている。音圧センサ4は、エンジン1から発生する音を検出し、この検出した音に基づく音圧信号をデータ収集装置6に出力する。詳述すると、音圧センサ4は、エンジン1に発生する筒内圧力変動に基づく物理量の一例である音圧を検出し、検出された音圧の大きさを示す音圧信号を生成する。よって、エンジン1にノッキングが発生していないとき、音圧センサ4から出力される音圧信号には、ノッキングに相関のある音は含まれない。一方、エンジン1にノッキングが発生しているとき、音圧センサ4から出力される音圧信号には、ノッキングに相関のある音が含まれている。
【0025】
エンジン1には、エンジン1の筒内圧を検出する筒内圧センサ5を取り付ける。筒内圧センサ5は、筒内の燃焼ガス振動に応じた波形成分を含む筒内圧信号をデータ収集装置6に出力する。ここで、エンジン1にノッキングが発生していないとき、筒内圧センサ5から出力される筒内圧信号には、ノッキングに相関した成分が含まれない。一方、エンジン1にノッキングが発生しているとき、筒内圧センサ5から出力される筒内圧信号には、ノッキングに相関した成分が含まれている。筒内圧センサ5は、点火プラグと一体化したものを用いてもよいし、点火プラグとは別個に構成されたものを用いてもよい。
【0026】
データ収集装置6は、音圧センサ4からの音圧信号を入力してA/D変換する。また、データ収集装置6は、音圧信号を入力するタイミングで、エンジンECU2から現在の角度情報を取得する。そして、データ収集装置6は、角度情報に基づいてエンジン1の1サイクル分の音圧信号を取得する。よって、4ストローク単気筒エンジンを例とすると、データ収集装置6は、単位時間当たりのエンジン1の回転速度に応じた数、例えば、回転速度が3000[r/min]であれば1分間に1500個の音圧信号を生成する。また、データ収集装置6は、一部又は全部の音圧信号に角度情報を関連付ける。そして、データ収集装置6は、角度情報が関連付けられた音圧信号を信号処理装置10に出力する。なお、データ収集装置6は、音圧信号を一時的に保持したり、一旦蓄えたりしてから信号処理装置10に出力してもよい。また、データ収集装置6は、音圧信号に時刻情報を関連付けてもよい。
【0027】
モニタ7は、信号処理装置10が抽出したエンジン1のノッキング音や推定したエンジン1の筒内圧、信号処理装置10によるノッキングの有無の判定結果を表示する。モニタ7の一例として、一般的なフラットパネルディスプレイがある。
【0028】
ヘッドホン8は、音を発する放音部である。ヘッドホン8は、後記する官能試験モードで試験対象物(本実施形態では、エンジン1)の状況を検査する際に、検査者の頭部に装着される。
【0029】
レベル指定部9は、信号に対する上昇レベル又は下降レベルを指定するレベル指定情報を受け付ける入力部である。レベル指定部9は、例えばタッチパネルディスプレイや、テンキー、専用のスイッチなどによって構成されている。本実施形態では、抽出信号(抽出ノッキング音91a(図11B))のレベルを変更してレベル変更抽出信号(レベル変更ノッキング音91aa(図12A))を生成する場合に、抽出信号の上昇レベル又は下降レベルを指定(入力)するために、検査者を含む、その周囲の人物によってレベル指定部9が操作される。
【0030】
信号処理装置10は、ノイズ除去マスクαを生成するニューラルネットワーク94(図3A)の重みW(図3B)及び伝達関数H(図3A)を学習する。以下、「ノイズ除去マスクαを生成するニューラルネットワーク94」を「マスク生成ネットワーク94A(図3A)」と称する場合がある。また、「マスク生成ネットワーク94Aの重みW」を「ニューラルネットワークの重みW」と称する場合がある。ここで、ノイズ除去マスクαは、ノイズ成分が含まれている入力物理量からノイズ成分を除去するための実数又は複素数の行列である。ノイズ除去マスクαは、入力物理量に合わせて変化する。また、伝達関数Hは、複素数の重みベクトルであり、エンジン1の構造減衰補正量の逆数と解釈する。構造減衰補正量とは、エンジン燃焼時の筒内圧に起因する振動がエンジン1を通り、音となって音圧センサに到達するまでの伝達特性のことである。エンジン1の筒内圧の周波数成分に構造減衰補正量を乗算したものがエンジン1の燃焼騒音レベルとなる。
【0031】
そのため、音圧であるエンジン1の近傍音に含まれる燃焼騒音に構造減衰補正量の逆数を乗算すれば、エンジン1の筒内圧が求められる。したがって、エンジン1の近傍音からエンジン1の筒内圧を推定することができる。
【0032】
エンジン1の近傍音からエンジン1の筒内圧を推定する原理については、例えば、前記の特許文献2に記載されている。前記の特許文献2によれば、「まず、エンジン1の近傍音yと、教師データ(教師信号)として、実測したエンジン1の筒内圧xとを収集する。(中略)。エンジン1の近傍音y及びエンジン1の実測筒内圧xを用いて、未知数であるマスクを生成するニューラルネットワークの重み及び伝達関数をニューラルネットワークにより学習する。そして、学習したニューラルネットワークが生成したマスク及び伝達関数を用いて、試験時に測定したエンジン1の近傍音yから、エンジン1の筒内圧xを推定する。」と記載されている。
【0033】
信号処理装置10は、学習したニューラルネットワーク94(図3A)が生成したノイズ除去マスクα及び伝達関数Hを用いて、エンジン1の近傍音からノッキング音を抽出し、エンジン1のノッキング筒内圧を推定し、抽出したノッキング音に基づいて、ノッキングの有無を判定する。そして、信号処理装置10は、抽出したノッキング音や推定したエンジン1のノッキング筒内圧、ノッキングの有無の判定結果をモニタ7に表示する。
【0034】
ここで、信号処理装置10は、CPU、ROM、RAM、その他の記憶装置等で構成されている。信号処理装置10は、ROMや記憶装置に記憶されているプログラムをCPUで演算処理する。なお、信号処理装置10は、以下の処理を実行するプログラムを有するパーソナルコンピュータ(PC)等であってもよい。
【0035】
本実施形態では、信号処理装置10は、学習モード、閾値算出モード、判定モード、分離モード、官能試験モードという5つの動作モードで動作する。1つ目の学習モードは、ノイズ除去マスクα(図3A)を生成するニューラルネットワークの重みW(図3B)及び伝達関数H(図3A)を学習する動作モードである。2つ目の閾値算出モードは、ノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数Hの学習後、ノッキングの有無を閾値判定するときの閾値を算出する動作モードである。3つ目の判定モードは、学習したニューラルネットワーク94(図3A)に入力物理量を入力することで生成されたノイズ除去マスクαを用いて入力物理量(本実施形態では、エンジン近傍音90)から抽出信号(本実施形態では、抽出ノッキング音91a)を抽出し、ノッキングの有無を判定する動作モードである。4つ目の分離モードは、入力物理量を抽出信号とノイズ成分(本実施形態では、雑音91b)とに分離する動作モードである。5つ目の官能試験モードは、検査者が後記する加工音を聞き取り、検査者の聴感によって検査すべき目的音(本実施形態では、ノッキング音)における閾値算出モードで使用するデータを決定するための動作モードである。5つ目の官能試験モードでは、例えば許容範囲外となった音から閾値を算出する。
【0036】
これら5つの動作モードは、任意に切り替えることができる。例えば、図示を省略した管理装置により、CAN(Controller Area Network)を介して、信号処理装置10の動作モードを切り替えることができる。また、図示を省略したマウス、キーボード等の操作手段を用いて、信号処理装置10の動作モードを切り替えてもよい。
【0037】
学習モードの場合、ノッキングが発生する運転条件、及び、ノッキングが発生しない運転条件でそれぞれエンジン1を運転し、データ収集装置6が、教師データ(教師信号)として、筒内圧信号を収集する。このとき、データ収集装置6は、筒内圧センサ5からの筒内圧信号を入力してA/D変換し、これを音圧信号に関連付けておく。
【0038】
閾値算出モードの場合、ノッキングが発生しない運転条件でエンジン1を運転し、データ収集装置6が、音圧信号を収集する。
【0039】
判定モードの場合、学習したニューラルネットワークにより生成されたノイズ除去マスクαを用いてエンジン近傍音90(入力物理量)から抽出ノッキング音91a(抽出信号)を抽出し、信号処理装置10が、閾値に基づいてノッキングの有無を判定する。
【0040】
なお、閾値算出モード又は判定モードの場合、データ収集装置6が、筒内圧信号を収集する必要はない。つまり、学習モードの場合、音圧センサ4と筒内圧センサ5の双方が動作するが、閾値算出モード又は判定モードの場合、音圧センサ4のみが動作する。
【0041】
分離モードの場合、エンジン1を運転し、信号処理装置10が、エンジン近傍音90(入力物理量)を学習したニューラルネットワークに入力してノイズ除去マスクαを生成し、雑音91b(ノイズ成分)と抽出ノッキング音91a(抽出信号)とに分離する。その際に、信号処理装置10は、雑音91bをノイズ成分記憶部26cに、抽出ノッキング音91aを抽出信号記憶部26dに、それぞれ記憶する。本発明では、入力物理量に関連する振幅と位相を考慮して、ノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数Hを学習することにより分離性能が向上している。ノイズ除去マスクαは実数又は複素数、伝達関数Hは複素数で実装する。これにより、信号処理装置10は、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。
【0042】
官能試験モードの場合、信号処理装置10が、レベル指定部9からレベル指定情報を受け付け、レベル指定情報に基づいて、雑音91b(ノイズ成分)と抽出ノッキング音91a(抽出信号)とを用いて加工音を生成する。
【0043】
仮に振幅スペクトルが同じだとしても、位相スペクトルによって信号波形は大きく変わるため、聴感印象に多大な影響を及ぼす。そのため、品質の良い加工音を生成するには、位相を考慮して、加工音に用いる抽出信号(本実施形態では、抽出ノッキング音91a)を取得することが重要である。換言すると、信号処理装置10は、入力物理量に関連する振幅と位相を考慮して、ノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数Hを学習することにより分離性能が向上し、品質の良い加工音(聴感上、ノッキング音が自然な加工音)を生成することができる。
【0044】
<信号処理装置(推定装置)の構成>
図2を参照して、信号処理装置10(推定装置)の構成について説明する。図2は、信号処理装置10の構成を示すブロック図である。図2に示すように、信号処理装置10は、信号切出部11と、スペクトログラム算出部12と、信号記憶部13と、スイッチ14と、学習処理部20(学習装置)と、判定処理部30と、分離部40と、信号合成部50と、を備える。ここで、信号処理装置10は、データ収集装置6から、音圧信号と、この音圧信号に関連付けられた角度情報とが入力される。さらに、学習モードの場合、信号処理装置10は、データ収集装置6から筒内圧信号が入力される。
【0045】
信号切出部11は、データ収集装置6から入力された角度情報に基づいて、入力された音圧信号から所定の切出角度範囲の音圧信号を切り出す。例えば、切出角度範囲はATDC(After Top Dead Center)の約-10~90°の角度範囲である。本実施形態では、TDC(Top Dead Center)を基準として切り出されているため、点火タイミングが変更されても切出角度範囲は固定されたままであるが、点火タイミングの変更に応じて切出角度範囲を変更してもよい。信号切出部11は、音圧信号を切り出すと、切り出した音圧信号をスペクトログラム算出部12に出力する。
【0046】
スペクトログラム算出部12は、信号切出部11が切り出した音圧信号に対して短時間フーリエ変換(STFT:Short Time Fourier Transform)を行い、音圧信号のスペクトログラムを算出する。短時間フーリエ変換は、例えば、離散フーリエ変換を高速に計算する高速フーリエ変換(FFT:Fast Fourier Transform)により行われる。
その後、スペクトログラム算出部12は、音圧信号のスペクトログラムを信号記憶部13に書き込む。
【0047】
信号記憶部13は、スペクトログラム算出部12が変換した音圧信号のスペクトログラムを記憶するメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の記憶装置である。なお、学習モードの場合、信号記憶部13は、データ収集装置6から入力された筒内圧信号(観測ノッキング筒内圧93(図3A))を、教師データ(教師信号)として記憶する。ここで、「ノッキング筒内圧」とは、筒内圧信号に重畳したノッキング成分を表す。ノッキング筒内圧は、筒内圧をノッキングの周波数成分以上の周波数帯を通過させるハイパスフィルタ処理することで得られる。
【0048】
スイッチ14は、前記した5つの動作モードに対応する学習モード用接続部M1、閾値算出モード用接続部M2、判定モード用接続部M3、分離モード用接続部M4、官能試験モード用接続部M5に任意に切り替えることができる。信号処理装置10は、信号処理装置10の動作モードに応じてスイッチ14を切り替えることにより、信号記憶部13に記憶されている信号を任意の出力先に出力することができる。
【0049】
例えば学習モードの場合、信号処理装置10は、スイッチ14を学習モード用接続部M1に接続して、信号記憶部13に記憶されている音圧信号のスペクトログラム及び筒内圧信号を後記するノイズ低減入力物理量生成部15と後記する選択部16に出力する。また、閾値算出モードの場合、信号処理装置10は、スイッチ14を閾値算出モード用接続部M2に接続して信号記憶部13に記憶されている音圧信号のスペクトログラムを後記する第1推定部23に出力する。また、判定モードの場合、信号処理装置10は、スイッチ14を判定モード用接続部M3に接続して、信号記憶部13に記憶されている音圧信号のスペクトログラムを後記する第2推定部31(抽出信号推定部)に出力する。また、分離モードの場合、信号処理装置10は、スイッチ14を分離モード用接続部M4に接続して、信号記憶部13に記憶されている音圧信号のスペクトログラムを後記する分離部40に出力する。また、官能試験モードの場合、信号処理装置10は、スイッチ14を官能試験モード用接続部M5に接続して、図示せぬ信号生成部によって予め生成されて信号記憶部13に記憶された官能試験モードの実行指示信号を後記する信号調整部51に出力する。ここでは、官能試験モードの実行指示信号が図示せぬ信号生成部によって予め生成されて信号記憶部13に記憶されているものとして説明する。ただし、官能試験モードの実行指示信号は、スイッチ14が官能試験モード用接続部M5に接続されたときに、図示せぬ信号生成部によって生成されて、信号記憶部13を介さずに、図示せぬ信号生成部から後記する信号調整部51に出力されるようにしてもよい。
【0050】
<学習処理部>
学習処理部20は、学習モードにおいて、ノイズ除去マスクαを生成するニューラルネットワーク94(図3A)の重みW及び伝達関数Hを学習する学習処理(図14A)を行い、閾値算出モードにおいて、エンジン1の抽出したノッキング音の閾値判定に用いる閾値を算出する閾値算出処理(図15A)を行う。図2に示すように、学習処理部20は、ノイズ低減入力物理量生成部15と、選択部16と、学習部21と、学習済みパラメータ記憶部22と、第1推定部23と、閾値算出部24と、閾値記憶部25と、教師信号記憶部26aと、推定信号記憶部26bと、ノイズ成分記憶部26cと、抽出信号記憶部26dと、を備える。
【0051】
ノイズ低減入力物理量生成部15は、入力物理量(本実施形態では、エンジン近傍音90(図3A))に含まれるノイズ成分(本実施形態では、雑音91b(図3A))を低減したノイズ低減入力物理量90A(図3A)を生成する。ノイズ低減入力物理量生成部15は、入力物理量(本実施形態では、エンジン近傍音90(図3A))からノイズ低減入力物理量90Aを生成するための処理マスクβを生成する機能を有している。処理マスクβは、ノイズ除去マスクαをフィルタ処理したものである。処理マスクβについては、後記する。
【0052】
選択部16は、入力物理量(エンジン近傍音90(図3A))とノイズ低減入力物理量90A(図3A)をシャッフルしたデータセットを学習部21に供給するシャッフル機能を有している。なお、ここで、「シャッフル」とは、順番をばらばらにして混ぜることを意味している。選択部16は、入力物理量とノイズ低減入力物理量のいずれか一方又は双方を選択して学習部21に供給する。
【0053】
学習部21は、学習モードにおいて、入力物理量(エンジン近傍音90(図3A))とノイズ低減入力物理量90A(図3A)の中の選択部16が選択したものからノイズ成分(雑音91b(図3A))を除去するためのノイズ除去マスクαを生成するニューラルネットワーク94の重みを学習する。また、学習部21は、生成されたノイズ除去マスクαで抽出した抽出信号(抽出ノッキング音91a(図3A))をノッキング発生時のエンジン1の推定ノッキング筒内圧92に変換する伝達関数H(図3A)を学習する。本実施形態では、学習部21は、信号記憶部13から入力された音圧信号のスペクトログラム及び筒内圧信号を用いて、ノイズ除去マスクαを生成するニューラルネットワーク94の重みW及び伝達関数Hを学習する。その後、学習部21は、学習したノイズ除去マスクαを生成するニューラルネットワーク94の重みW及び伝達関数Hを学習済みパラメータ記憶部22に書き込む。
【0054】
学習済みパラメータ記憶部22は、学習済みのパラメータ(ノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数H)を記憶するメモリ、HDD、SSD等の記憶装置である。
【0055】
第1推定部23は、閾値算出モードにおいて、ニューラルネットワーク94により生成されたノイズ除去マスクαを用いて、音圧信号のスペクトログラムからエンジン1の抽出ノッキング音91aを抽出する。この第1推定部23が抽出した抽出ノッキング音91aは、後記する閾値を算出するときに利用される。具体的には、第1推定部23は、学習済みパラメータ記憶部22のノイズ除去マスクαを生成するニューラルネットワークの重みWが反映されたニューラルネットワーク94に、信号記憶部13から入力された音圧信号のスペクトログラムを入力する。すると、学習したニューラルネットワークにより生成されたノイズ除去マスクαが音圧信号のスペクトログラムから抽出ノッキング音91aを抽出する。その後、第1推定部23は、抽出ノッキング音91aを閾値算出部24に出力する。
【0056】
閾値算出部24は、第1推定部23が抽出したエンジン1の抽出ノッキング音91aに基づいて閾値を算出する。具体的には、閾値算出部24は、抽出ノッキング音91aのスペクトログラムの絶対値を所定時間(例えば、エンジン1の1サイクル)毎に総和する。例えば、複数の気筒を有するエンジン1では、抽出ノッキング音91aを総和すると、気筒別に1つのスコアが求められる。続いて、閾値算出部24は、所定時間毎に総和した抽出ノッキング音91aの中央値を算出する。例えば、閾値算出部24は、全てのサイクルについて、抽出ノッキング音91aの総和の中央値を算出する。このとき、閾値算出部24は、任意の値で予め設定したマージンを中央値に加算し、閾値とする。なお、閾値算出部24は、気筒毎に抽出ノッキング音91aを総和して中央値を求め、気筒毎の閾値を算出してもよい。また、閾値算出部24は、各気筒で抽出ノッキング音91aを総和し、全気筒で中央値を求め、全気筒で共通の閾値を算出してもよい。また、後述する官能試験にて、検査者により許容不可能と判断された加工音91cの抽出ノッキング音91aの総和を求め、総和値以下の任意の値を閾値としてもよい。その後、閾値算出部24は、算出した閾値を閾値記憶部25に書き込む。
【0057】
閾値記憶部25は、閾値算出部24が算出した閾値を記憶するメモリ、HDD、SSD等の記憶装置である。
【0058】
教師信号記憶部26aは、教師信号(本実施形態では、観測ノッキング筒内圧93(図3A))を記憶するメモリ、HDD、SSD等の記憶装置である。
【0059】
推定信号記憶部26bは、推定信号(本実施形態では、推定ノッキング筒内圧92(図3A))を記憶するメモリ、HDD、SSD等の記憶装置である。
【0060】
ノイズ成分記憶部26cは、入力物理量に含まれているノイズ成分(本実施形態では、雑音91b(図6A))を記憶するメモリ、HDD、SSD等の記憶装置である。
【0061】
抽出信号記憶部26dは、ノイズ成分が含まれている入力物理量からノイズ成分を除去した抽出信号(本実施形態では、抽出ノッキング音91a(図6A))を記憶するメモリ、HDD、SSD等の記憶装置である。
【0062】
<判定処理部>
判定処理部30は、判定モードにおいて、音圧信号のスペクトログラムからエンジン1のノッキング音を抽出し、ノッキングの有無を判定する判定処理(図16)を行う。図2に示すように、判定処理部30は、第2推定部31(抽出信号推定部)と、閾値判定部32とを備える。
【0063】
第2推定部31(抽出信号推定部)は、判定モードにおいて、ニューラルネットワーク94により生成されたノイズ除去マスクαを用いて、音圧信号のスペクトログラムから抽出ノッキング音91a(抽出信号)を抽出する。この第2推定部31が抽出した抽出ノッキング音91aは、後記する閾値判定に利用される。なお、第2推定部31の処理内容は、第1推定部23と同様のため、説明を省略する。
その後、第2推定部31は、抽出ノッキング音91aを閾値判定部32に出力する。
【0064】
閾値判定部32は、判定モードにおいて、閾値記憶部25に記憶されている閾値と、第2推定部31が抽出した抽出ノッキング音91aとの閾値判定により、ノッキングの有無を判定する。具体的には、閾値判定部32は、閾値算出部24と同様、抽出ノッキング音91aのスペクトログラムの絶対値を所定時間毎に総和する。そして、閾値判定部32は、総和した抽出ノッキング音91aと閾値とを比較し、総和した抽出ノッキング音91aが閾値を超える場合にはノッキング有りと判定し、総和した抽出ノッキング音91aが閾値以下の場合にはノッキング無しと判定する。その後、閾値判定部32は、ノッキングの有無の判定結果と、第2推定部31から入力された抽出ノッキング音91aをモニタ7(図1)に出力する。
【0065】
<分離部>
分離部40は、ノイズ除去マスクαを用いて入力物理量をノイズ成分と抽出信号とに分離する。本実施形態では、図6Aに示すように、分離部40は、入力物理量としてのエンジン近傍音90をノイズ成分である雑音91bと抽出信号である抽出ノッキング音91aとに分離する。
【0066】
<信号合成部>
信号合成部50は、各種の信号を合成して加工音を生成する。本実施形態では、図11Aから図12Cに示すように、信号合成部50は、抽出ノッキング音91(抽出信号)のレベルを変更して、エンジン近傍音90(入力物理量)から分離された雑音91b(ノイズ成分)と合成して加工音を生成する。信号合成部50は、信号調整部51と、信号出力部52とを有している。信号調整部51は、レベル指定部9で指定(入力)された信号の上昇レベル又は下降レベルに応じて抽出ノッキング音91のレベルを変更し、レベルが変更された抽出ノッキング音91(レベル変更抽出信号)とノイズ成分とを合成して加工音を生成する。信号出力部52は、加工音(信号)を放音部(ヘッドホン8)に出力して、放音部に加工音を放音させる。
【0067】
<学習モード時の動作>
図3A図3B図8A図8B図8C、及び図9を参照して、信号処理装置10の学習モード時の動作について説明する。図3Aは、学習モードの説明図である。図3Bは、信号処理装置10の学習モード時の動作説明図である。図8Aは、学習時におけるノイズ成分と教師信号との関係を表す説明図である。図8Bは、学習時における抽出信号と教師信号との関係を表す説明図である。図8Cは、学習時における抽出信号と推定信号との関係を表す説明図である。図9は、第1実施形態において、ノイズ除去マスクαを生成するニューラルネットワークの重みWの学習の説明図である。
【0068】
図3Aに示すように、学習モード時において、信号処理装置10では、エンジン近傍音90(入力物理量)がノイズ低減入力物理量生成部15と選択部16とに供給される。また、図3Bに示すように、観測ノッキング筒内圧93(教師信号)がノイズ低減入力物理量生成部15と選択部16とに供給される。
【0069】
ノイズ低減入力物理量生成部15は、ノイズ除去マスクαをフィルタ処理した処理マスクβを用いて、エンジン近傍音90から、エンジン近傍音90に含まれる雑音91bを低減したノイズ低減入力物理量90Aを生成して選択部16に供給する。ノイズ除去マスクαは、学習部21が、ニューラルネットワークの重みWを学習する際に、前記エンジン近傍音90(入力物理量)とノイズ低減入力物理量90Aのいずれか一方又は双方が学習部21に入力される度に、ニューラルネットワークの重みWを用いて、生成される。
【0070】
選択部16は、エンジン近傍音90とノイズ低減入力物理量生成部15によって生成されたノイズ低減入力物理量90Aのいずれか一方又は双方を選択して、学習部21に供給する。
【0071】
学習部21は、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものから雑音91bを除去するためのノイズ除去マスクαを生成するニューラルネットワークの重みWを学習する。このとき、学習部21は、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものを雑音91bと抽出ノッキング音91aとに分離する。その際に、学習部21は、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものにノイズ除去マスクαを掛け合わせて抽出ノッキング音91aを取得する。また、学習部21は、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものから抽出ノッキング音91aを差し引くことで、雑音91bを取得する。本実施形態では、ノイズ除去マスクαは、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものに含まれるノッキング音の割合と位相成分(位相の修正量)を表す。位相成分については、図10A及び図10Bを用いて後記する。
【0072】
学習部21は、ニューラルネットワークの重みWを学習する際に、ノイズ除去マスクαを取得し、ノイズ除去マスクαをノイズ低減入力物理量生成部15に供給する。ノイズ低減入力物理量生成部15は、ノイズ除去マスクαをフィルタ処理して処理マスクβを取得する。そして、ノイズ低減入力物理量生成部15は、処理マスクβを用いて、エンジン近傍音90からノイズ低減入力物理量90Aを生成して選択部16に供給する。
【0073】
学習部21は、ニューラルネットワークの重みWを学習するとともに、抽出ノッキング音91a(抽出信号)を観測ノッキング筒内圧93(教師信号)と同じ次元(単位)の推定ノッキング筒内圧92(推定信号)に位相を加味して変換するための伝達関数Hを学習する。換言すると、学習部21は、ニューラルネットワークの重みW、及び、伝達関数Hを学習する際に、ノイズ除去マスクα、及び、伝達関数Hに対して、エンジン近傍音90(入力物理量)に関連する振幅と位相成分を加味して学習する。本実施形態では、学習部21は、抽出ノッキング音91aに対して、逆短時間フーリエ変換(ISTFT)と高速フーリエ変換(FFT)とを行い、伝達関数Hを掛け、逆高速フーリエ変換(IFFT)と短時間フーリエ変換(STFT)とを行うことで、抽出ノッキング音91aを推定ノッキング筒内圧92に変換している。なお、本実施形態では、伝達関数Hは、抽出ノッキング音91aを推定ノッキング筒内圧92に変換するための振幅(ゲイン)と位相成分である。位相成分については、図10A及び図10Bを用いて後記する。
【0074】
本実施形態では、図3Aに示すように、学習部21は、雑音91b(ノイズ成分)と教師信号(観測ノッキング筒内圧93)との関連性が小さくなるとともに、抽出ノッキング音91a(抽出信号)と教師信号(観測ノッキング筒内圧93)との関連性が大きくなるように、ニューラルネットワークの重みを学習する。具体的には、学習部21は、雑音91b(ノイズ成分)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfiと観測ノッキング筒内圧93(教師信号)とのコヒーレンスが小さくなるとともに、抽出ノッキング音91a(抽出信号)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sseと観測ノッキング筒内圧93(教師信号)とのコヒーレンスが大きくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みWを学習する。これにより、信号処理装置10は、雑音91bから筒内圧に起因する音を除去することができる。
【0075】
図3Bに、信号処理装置10の学習モード時の動作を示す。図3Bの太枠は学習モード時の作動する構成要素を示している。また、図3Bの太線矢印は、学習モード時に出力される信号を示している。
【0076】
図3Bに示すように、学習モード時において、信号処理装置10は、スイッチ14を学習モード用接続部M1に接続して、信号記憶部13に記憶されているエンジン近傍音90のスペクトログラム及び観測ノッキング筒内圧93をノイズ低減入力物理量生成部15と選択部16とに出力する。
【0077】
これに応答して、ノイズ低減入力物理量生成部15は、処理マスクβを用いて、エンジン近傍音90からノイズ低減入力物理量90Aを生成して選択部16に供給する。選択部16は、エンジン近傍音90とノイズ低減入力物理量生成部15によって生成されたノイズ低減入力物理量90Aのいずれか一方又は双方を選択して、学習部21に供給する。学習部21は、エンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものを用いてニューラルネットワークの重みWを学習する。また、学習部21は、生成されたノイズ除去マスクαで抽出した抽出ノッキング音91aをノッキング発生時のエンジン1の推定ノッキング筒内圧92に変換する伝達関数Hを学習する。このとき、学習部21は、新しいエンジン近傍音90とノイズ低減入力物理量90Aの中の選択部16が選択したものが入力される度に、選択部16が選択したものに対応するノイズ除去マスクαを生成する。
【0078】
そして、学習部21は、学習されたパラメータ(ノイズ除去マスクαを生成するニューラルネットワークの重みWと伝達関数H)を学習済みパラメータ記憶部22に記憶する。また、学習部21は、観測ノッキング筒内圧93を教師信号記憶部26aに記憶するとともに、推定ノッキング筒内圧92を推定信号記憶部26bに記憶する。
【0079】
<閾値算出モード時の動作>
図4A及び図4Bを参照して、信号処理装置10の閾値算出モード時の動作について説明する。図4Aは、閾値算出モードの説明図である。図4Bは、信号処理装置10の閾値算出モード時の動作説明図である。
【0080】
図4Bに示すように、閾値算出モード時において、図3Bの学習モード時と異なり、信号処理装置10の学習部21は、停止した状態になっている。その代わりに、図4Bに示すように、学習処理部20の第1推定部23と閾値算出部24が作動して、エンジン1の抽出ノッキング音91aの閾値判定に用いる閾値Tを算出する。図4Bの太枠は閾値算出モード時の作動する構成要素を示している。また、図4Bの太線矢印は、閾値算出モード時に出力される信号を示している。
【0081】
図4Bに示すように、閾値算出モード時において、信号処理装置10は、スイッチ14を閾値算出モード用接続部M2に接続して、信号記憶部13に記憶されているエンジン近傍音90のスペクトログラムを第1推定部23に出力する。
【0082】
これに応答して、第1推定部23は、学習済みパラメータ記憶部22から、ノイズ除去マスクαを生成するニューラルネットワークの重みWを取得する。そして、第1推定部23は、ニューラルネットワーク94(図4A)により生成したノイズ除去マスクαを用いてエンジン近傍音90からエンジン1の抽出ノッキング音91aを抽出する。図4Aは、このときの第1推定部23の動作の概要を示している。この後、第1推定部23は、抽出ノッキング音91aを閾値算出部24に出力する。
【0083】
これに応答して、閾値算出部24は、エンジン1の各サイクルで抽出ノッキング音91aのスペクトログラムの絶対値を総和し、予め設定したマージンを加算して、閾値Tを算出する。そして、閾値算出部24は、閾値Tを閾値記憶部25に記憶する。
【0084】
<判定モード時の動作>
図5A及び図5Bを参照して、信号処理装置10の判定モード時の動作について説明する。図5Aは、判定モードの説明図である。図5Bは、信号処理装置10の判定モード時の動作説明図である。
【0085】
図5Bに示すように、判定モード時において、図3Bの学習モード時と異なり、信号処理装置10の学習部21は、停止した状態になっている。その代わりに、図5Bに示すように、判定処理部30の第2推定部31(抽出信号推定部)と閾値判定部32が作動して、ノッキングの有無を判定する。図5Bの太枠は判定モード時の作動する構成要素を示している。また、図5Bの太線矢印は、判定モード時に出力される信号を示している。
【0086】
図5Bに示すように、判定モード時において、信号処理装置10は、スイッチ14を判定モード用接続部M3に接続して、信号記憶部13に記憶されているエンジン近傍音90のスペクトログラムを第2推定部31に出力する。
【0087】
これに応答して、第2推定部31は、学習済みパラメータ記憶部22から、ノイズ除去マスクαを生成するニューラルネットワークの重みWを取得する。そして、第2推定部31は、ニューラルネットワーク94(図5A)により生成したノイズ除去マスクαを用いてエンジン近傍音90から抽出ノッキング音91aを抽出する。図5Aは、このときの第2推定部31の動作の概要を示している。この後、第2推定部31は、抽出ノッキング音91aを閾値判定部32に出力する。
【0088】
これに応答して、閾値判定部32は、閾値記憶部25から閾値Tを取得し、抽出ノッキング音91aの絶対値の総和と閾値Tを比較してノッキングの有無を判定する。そして、閾値判定部32は、例えば、ノッキングの有無の判定結果や、抽出ノッキング音91aと閾値Tとの関係を表す波形図等をモニタ7に出力して表示させる。
【0089】
<分離モード時の動作>
図6A及び図6Bを参照して、信号処理装置10の分離モード時の動作について説明する。図6Aは、分離モードの説明図である。図6Bは、信号処理装置10の分離モード時の動作説明図である。
【0090】
図6Bに示すように、分離モード時において、図3Bの学習モード時と異なり、信号処理装置10の学習部21は、停止した状態になっている。その代わりに、図6Bに示すように、分離部40が作動して、エンジン近傍音90を抽出ノッキング音91aと雑音91bとに分離する。図6Bの太枠は分離モード時の作動する構成要素を示している。また、図6Bの太線矢印は、分離モード時に出力される信号を示している。
【0091】
図6Bに示すように、分離モード時において、信号処理装置10は、スイッチ14を分離モード用接続部M4に接続して、信号記憶部13に記憶されているエンジン近傍音90のスペクトログラムを分離部40に出力する。
【0092】
これに応答して、分離部40は、学習済みパラメータ記憶部22から、ノイズ除去マスクαを生成するニューラルネットワークの重みWを取得する。そして、分離部40は、ニューラルネットワーク94(図6A)により生成したノイズ除去マスクαを用いて、エンジン近傍音90を抽出ノッキング音91aと雑音91bとに分離する。図6Aは、このときの分離部40の動作の概要を示している。この後、分離部40は、抽出ノッキング音91a(抽出信号)を抽出信号記憶部26dに記憶するとともに、雑音91bをノイズ成分記憶部26cに記憶する。
【0093】
<官能試験モード時の動作>
図7A及び図7Bを参照して、信号処理装置10の官能試験モード時の動作について説明する。図7Aは、官能試験モードの説明図である。図7Bは、信号処理装置10の官能試験モード時の動作説明図である。官能試験モードは、検査者の聴感に基づく閾値Tを算出するモードである。
【0094】
図7Bに示すように、官能試験モード時において、図3Bの学習モード時と異なり、信号処理装置10の学習部21は、停止した状態になっている。その代わりに、図7Bに示すように、信号合成部50の信号調整部51と信号出力部52、並びに、学習処理部20の第1推定部23と閾値算出部24が作動して、検査者の聴感に基づく閾値Tを算出する。図7Bの太枠は官能試験モード時の作動する構成要素を示している。また、図7Bの太線矢印は、官能試験モード時に出力される信号を示している。
【0095】
図7Bに示すように、官能試験モード時において、信号処理装置10は、スイッチ14を官能試験モード用接続部M5に接続することで、図示せぬ信号生成部によって予め生成されて信号記憶部13に記憶された官能試験モードの実行指示信号を信号調整部51に出力する。ただし、官能試験モードの実行指示信号は、スイッチ14が官能試験モード用接続部M5に接続されたときに、図示せぬ信号生成部によって生成されて、信号記憶部13を介さずに、図示せぬ信号生成部から信号調整部51に出力されるようにしてもよい。
【0096】
これに応答して、信号調整部51は、レベル指定部9からレベル指定情報を受け取るとともに、抽出信号記憶部26dに記憶されている抽出ノッキング音91aとノイズ成分記憶部26cに記憶されている雑音91bとを取得する。そして、信号調整部51は、レベル指定情報に基づいて、抽出ノッキング音91aと雑音91bとを用いて加工音91cを生成する。このとき、信号調整部51は、レベル指定情報によって指定された量だけ抽出ノッキング音91aのレベル(大きさ)を上昇又は下降させてから、雑音91bと合成することによって、加工音91cを生成して信号出力部52に出力する。信号出力部52は、加工音91cをヘッドホン8(放音部)に出力して放音させる。
【0097】
また、信号調整部51は、加工音91cを第1推定部23に出力する。第1推定部23は、学習済みパラメータ記憶部22から、ノイズ除去マスクαを生成するニューラルネットワークの重みWを取得する。そして、第1推定部23は、ニューラルネットワーク94(図7A)により生成したノイズ除去マスクαを用いて加工音91cから抽出ノッキング音91aを抽出する。図7Aは、このときの第1推定部23の動作の概要を示している。この後、第1推定部23は、抽出ノッキング音91aを閾値算出部24に出力する。閾値算出部24は、エンジン1の各サイクルで抽出ノッキング音91aのスペクトログラムの絶対値を総和し、総和値以下の任意の値を閾値Tとする。そして、閾値算出部24は、閾値Tを閾値記憶部25に記憶する。
【0098】
ところで、特許文献2及び特許文献3に記載された従来技術は、ニューラルネットワークの学習時における目的関数に音の分離度合いを測る関数を含めていないため、エンジン近傍音(入力物理量)から除去される雑音(ノッキング音以外の音(背景音))の中にノッキング音(目的音)が混入する可能性があった。つまり、特許文献2及び特許文献3に記載された従来技術は、学習時に、推定筒内圧と実測筒内圧(教師データ)との二乗誤差を最小化するだけであるため、「雑音が除去されたエンジン音」が雑音だけを良好に除去されたものであるか否かを監視するものではなかった。例えば、特許文献3に記載された従来技術は、エンジン近傍音(入力物理量)に関連する位相成分が考慮されていないノイズ除去マスクαをエンジン近傍音に掛けることで、「雑音が除去されたエンジン音」すなわちノッキング音(本実施形態の「抽出信号」に相当)を抽出する。その際に、特許文献3に記載された従来技術は、音の分離度合いを測る関数を用いていないため、雑音と共に、除去されるべきでないノッキング音(目的音)がエンジン近傍音から除去される可能性があった。そのため、特許文献3に記載された従来技術は、ノッキングの有無の評価性能を低下させる可能性があった。
【0099】
これに対して、本実施形態に係る信号処理装置10は、学習時に、エンジン近傍音(入力物理量)から除去される雑音の中にノッキング音(目的音)が混入しているか否かを評価する構成になっている。そのための構成として、本実施形態に係る信号処理装置10は、ノイズ成分(雑音91b)と教師信号(観測ノッキング筒内圧93)との関連性が小さくなるように学習する構成になっている。具体的には、図3Aに示すように、ノイズ成分(雑音91b)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfiと教師信号(観測ノッキング筒内圧93)とのコヒーレンスが小さくなるように学習する。また、本実施形態に係る信号処理装置10は、抽出ノッキング音91a(抽出信号)と教師信号(観測ノッキング筒内圧93)との関連性が大きくなるように学習する構成になっている。具体的には、図3Aに示すように、抽出ノッキング音91a(抽出信号)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sseと教師信号(観測ノッキング筒内圧93)とのコヒーレンスが大きくなるように学習する。このような本実施形態に係る信号処理装置10は、特許文献2及び特許文献3に記載された従来技術よりも、ノッキングの有無の評価性能を向上させることができる。
【0100】
図8Aは、雑音91b(ノイズ成分)のスペクトログラムF11と、スペクトログラムF11に対して逆短時間フーリエ変換(ISTFT)を行うことにより得られる第1信号Sfi(図3A)の信号波形F12と、観測ノッキング筒内圧93(教師信号)の信号波形F93と、を示している。また、図8Aは、第1信号Sfi(図3A)の信号波形F12と観測ノッキング筒内圧93(教師信号)の信号波形F93との学習の過程で最小化されるコヒーレンスF13を示している。
【0101】
図8Bは、抽出ノッキング音91a(抽出信号)のスペクトログラムF21と、スペクトログラムF21に対して逆短時間フーリエ変換(ISTFT)を行うことにより得られる第2信号Sse(図3A)の信号波形F22と、観測ノッキング筒内圧93(教師信号)の信号波形F93を示している。また、図8Bは、第2信号Sse(図3A)の信号波形F22と観測ノッキング筒内圧93(教師信号)の信号波形F93との学習の過程で最大化されるコヒーレンスF23を示している。
【0102】
コヒーレンスは以下の式(1)によって定義される。コヒーレンス関数γは、系の入力と出力の関連度合いを示すものである。コヒーレンス関数γは、以下の式(1)に示すように、クロススペクトルの絶対値の2乗を測定入力及び系の出力の各々のパワースペクトルで割り算したものである。
【数1】

【0103】
ここで、Wxyはクロススペクトルの平均値、Wxxはxのパワースペクトルの平均値、Wyyはyのパワースペクトルの平均値を意味している。コヒーレンス関数γは、0から1までの値をとる。γ(f)が1の場合、その周波数fにおいて、系の出力がすべて測定入力に起因していることを示している。また、γ(f)が0の場合、その周波数fにおいて、系の出力が測定入力にまったく関係ないことを示している。また、0<γ(f)<1の場合、測定とは無関係な信号、系内部で発生しているノイズ、系の非線形性等があるものと考えられる。
【0104】
また、エンジン近傍音(入力物理量)から除去される雑音の中にノッキング音(目的音)が混入しているか否かを評価する方法としてコヒーレントアウトプットパワーを用いても良い。学習部21は、ノイズ成分(雑音91b)を逆短時間フーリエ変換(ISTFT)して求めた信号波形と教師信号(観測ノッキング筒内圧93)とのコヒーレンス又はコヒーレントアウトプットパワーが小さくなるとともに、抽出信号(抽出ノッキング音91a)を逆短時間フーリエ変換(ISTFT)して求めた信号波形と教師信号(観測ノッキング筒内圧93)とのコヒーレンス又はコヒーレントアウトプットパワーが大きくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。これにより、信号処理装置10は、ノッキングの有無の評価性能を更に向上させることができる。
【0105】
なお、コヒーレンスとコヒーレントアウトプットパワーについて、評価対象を以下の「I」と「II」の2組とし、評価方法を以下の「A」と「B」の2通りとする場合に、信号処理装置10は、以下の4つの評価パターンの評価を可能にする。
(評価対象)
I :ノイズ成分と教師信号
II:抽出信号と教師信号
(評価方法)
A :コヒーレンス
B :コヒーレントアウトプットパワー
(評価パターン)
1 :IをAで評価、IIをAで評価。
2 :IをBで評価、IIをBで評価。
3 :IをAで評価、IIをBで評価。
4 :IをBで評価、IIをAで評価。
【0106】
コヒーレントアウトプットパワーはコヒーレンス関数γとyのパワースペクトルの平均値Wyyとの積で定義される。コヒーレントアウトプットパワーは、系の出力に含まれる入力に起因したパワーを示すものである。
【0107】
また、図3Aに示すように、学習部21は、観測ノッキング筒内圧93(教師信号)に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムと推定ノッキング筒内圧92(推定信号)との誤差が最小となるように、ニューラルネットワーク94により、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。これにより、信号処理装置10は、ノイズ除去マスクαを生成するニューラルネットワークの重みWと伝達関数Hの学習精度を向上させることができる。
【0108】
また、学習部21は、観測ノッキング筒内圧93(教師信号)と、抽出信号(抽出ノッキング音91a)に対して、逆短時間フーリエ変換(ISTFT)と高速フーリエ変換(FFT)とを行い、伝達関数Hを掛け、逆高速フーリエ変換(IFFT)を行い求めた推定ノッキング筒内圧92(推定信号)の信号波形との誤差が最小となるように、ニューラルネットワーク94により、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習しても良い。これにより、信号処理装置10は、ノイズ除去マスクαを生成するニューラルネットワークの重みWと伝達関数Hの学習精度を更に向上させることができる。
【0109】
図8Cは、抽出ノッキング音91a(抽出信号)を推定ノッキング筒内圧92(推定信号)に変換する際の一例を示している。図8Cは、抽出ノッキング音91a(抽出信号)のスペクトログラムF31と、スペクトログラムF31に対して逆短時間フーリエ変換(ISTFT)を行うことにより得られる信号波形F32と、さらに高速フーリエ変換(FFT)を行うことにより得られるスペクトルF33と、を示している。また、図8Cは、スペクトルF33の信号に伝達関数Hを掛けることにより得られる推定ノッキング筒内圧のスペクトルF35と、を示している。なお、図8Cでは、伝達関数Hの一例として、周波数と係数との対応関係を示す周波数応答特性F34が示されている。また、図8Cは、スペクトルF35に逆高速フーリエ変換(IFFT)を行うことにより得られる信号波形F36と、さらに、短時間フーリエ変換(STFT)を行うことにより得られる、推定ノッキング筒内圧92(推定信号)のスペクトログラムF37と、を示している。
【0110】
本実施形態では、学習部21は、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)によりノイズ除去マスクαを生成するニューラルネットワークの重みWを学習する。さらに、学習部21は、伝達関数Hとして、抽出信号のスペクトルF33に乗じる重みを学習する。なお、学習部21はCNNに限らずリカレントニューラルネットワーク(RNN:Recurrent Neural Network)やTransformer等の他の構成をとっても良いし、他の機械学習手法を用いても良い。
【0111】
なお、図9に示すように、ノイズ除去マスクαを生成するニューラルネットワークの重みWを学習するニューラルネットワーク94の一例として、U-Net95がある。このU-Net95は、Encoder‐Decoderモデルの一種で、画像認識や音の分離に使用されている深層学習の一手法である。音の分離において、U-Net95では、下向きパス96(Encoder)で畳み込み(ストライドは2以上)を行い、階層97が深くなるにつれて音の特徴を抽出する。一方、上向きパス98(Decoder)では、抽出された音の特徴から逆畳み込みとUPサンプリング(膨張)を行うことによりノイズ除去マスクαを生成する。ここまでは、一般的なEncoder‐Decoderモデルの構成である。さらに、U-Net95では、各Encoderの畳み込み層からの出力99をDecoderの畳み込み層にマージする。これにより、U-Net95では、一般的なEncoder‐Decoderモデルよりも高精度なノイズ除去マスクαを生成できる。信号処理装置10は、ノイズ除去マスクαを生成し、エンジン近傍音90に掛け合わせることで、抽出信号(抽出ノッキング音91a)を取得できる。ノイズ除去マスクαは、周波数と時間で表される空間のマスクになっている。
【0112】
このように、学習部21がU-Net95でノイズ除去マスクαを生成するニューラルネットワークの重みWを学習するので、学習したニューラルネットワークは入力されるエンジン1の近傍音に応じて適切なノイズ除去マスクαを生成するようになる。よって、信号処理装置10は、エンジン1のノッキング筒内圧を正確に推定し、エンジン1のノッキング音を良好に抽出することができる。
【0113】
<位相成分の影響>
図10A及び図10Bを参照して、位相成分の影響について説明する。図10Aは、圧力や、振動、音などの位相成分が考慮されていない場合の計算例の説明図である。図10Bは、圧力や、振動、音などの位相成分が考慮されている場合の計算例の説明図である。図10A及び図10Bにおいて、円内の矢印は、圧力や、振動、音などに含まれる位相成分を表している。
【0114】
図10A及び図10Bに示す例では、ともに、以下の条件が仮定されている。
・系が線形時不変系(入力と出力との間の伝達特性が線形かつ時間に依存して変化しない系)である。
【0115】
図10Aの例では、エンジン1が駆動されると、筒内圧センサ5(図1)により、観測ノッキング筒内圧93が観測されている。観測ノッキング筒内圧93がエンジン1内を伝搬することで、ノッキング音82が放出される。さらに、ノッキング音82が背景音であるメカニカルノイズ83(ノイズ成分)と合わさり、音圧センサ4によりエンジン近傍音90(入力物理量)が観測される。
【0116】
図10Aは、以下のように、観測ノッキング筒内圧93、ノッキング振動81、ノッキング音82、メカニカルノイズ83、及びエンジン近傍音90の概略的な計算の一例を示しており、位相φは変わらないと仮定している。
観測ノッキング筒内圧93=ASin(Ωt+φ)
ノッキング振動81=ABSin(Ωt+φ)
ノッキング音82=ABCSin(Ωt+φ)
メカニカルノイズ83=NSin(Ωt+φN)
エンジン近傍音90=(ABC+N)Sin(Ωt+φ)
【0117】
これに対して、図10Bは位相を考慮した例である。以下のように、観測ノッキング筒内圧93、ノッキング振動81、ノッキング音82、メカニカルノイズ83、及びエンジン近傍音90の概略的な計算の一例を示しており、次元(単位)が変化する度に位相φが変化することを考慮している。
観測ノッキング筒内圧93=ASin(Ωt+φA)
ノッキング振動81=ABSin(Ωt+φA+φB)
ノッキング音82=ABCSin(Ωt+φA+φB+φC)
メカニカルノイズ83=NSin(Ωt+φN)
エンジン近傍音90=ABCSin(Ωt+φA+φB+φC)+NSin(Ωt+φN)
【0118】
図10Bに示す例は、圧力が振動となり、音となって放射される際の位相成分の変化が考慮されているため、図10Aに示す例よりも、信号を良好に解析することができる。そこで、信号処理装置10は、図3Aに示すように、ノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数Hの学習時に、位相を加味して学習する構成となっている。このような信号処理装置10は、エンジン近傍音90(入力物理量)を抽出ノッキング音91a(抽出信号)と雑音91b(ノイズ成分)とに良好に分離することができる。つまり、信号処理装置10は、雑音の中にノッキング音(目的音)が混入しないように、エンジン近傍音90を抽出ノッキング音91aと雑音91bとに分離することができる。このような信号処理装置10は、特許文献2及び特許文献3に記載された従来技術よりも、ノッキングの有無の評価性能を向上させることができる。また、このような信号処理装置10は、良好な官能試験を行うことができる。
【0119】
(官能試験の概要)
図11Aから図12Cを参照して、官能試験の概要について説明する。図11Aから図12Cは、官能試験における信号処理の説明図である。
【0120】
図2に示すように、圧力と音の各信号は、データ収集装置6によって収集され、信号処理装置10に出力される。信号処理装置10は、信号切出部11で各信号を切り出し、スペクトログラム算出部12でスペクトログラムを算出して、スペクトログラムを信号記憶部13に記憶する。
【0121】
本実施形態に係る信号処理装置10は、前記した分離モードと前記した官能試験モードとを実行することができる。分離モード時に、信号処理装置10は、エンジン近傍音90(入力物理量)を抽出ノッキング音91a(抽出信号)と雑音91b(ノイズ成分)とに分離する。そして、官能試験モード時に、信号処理装置10は、抽出ノッキング音91aのレベルを変更してレベル変更抽出信号(レベル変更ノッキング音91aa(図12A))を生成し、雑音91bと合成して加工音91c(図12C)を生成する。
【0122】
官能試験モード時において、検査者は、頭部にヘッドホン8(図1)を装着する。そして、検査者自身または別途レベル指定をする操作者は、許容可能なレベルを周囲に宣告して、レベル指定部9を操作してレベル指定情報を信号処理装置10に入力する。信号処理装置10は、入力されたレベル指定情報に基づいて、抽出ノッキング音91aのレベルを変更する。
【0123】
図11Aは、エンジン近傍音90(入力物理量)を示しており、図11B図11Cは、分離モード時にエンジン近傍音90から分離された抽出ノッキング音91a(抽出信号)と雑音91b(ノイズ成分)とを示している。図12Aは、官能試験モード時に、抽出ノッキング音91a(抽出信号)のレベルを3dB上昇させる変更を行って生成されたレベル変更ノッキング音91aa(レベル変更抽出信号)を示しており、図12Bは、レベル変更ノッキング音91aaと合成される雑音91bを示しており、図12Cは、レベル変更ノッキング音91aaと雑音91bとを合成した加工音91cを示している。信号処理装置10は、加工音91cを生成することにより、検査すべき目的音(ノッキング音)を聞き分け易い状態にすることができる。このような信号処理装置10は、目的音(ノッキング音)の有無を高精度に検査者に把握させることができ、検査性能を向上させることができる。また、信号処理装置10は、検査者により許容不可能と判断された加工音91cのスペクトログラムの絶対値の総和を求めて、総和値以下の任意の値を閾値記憶部25に書き込む。これにより、閾値Tは検査者の官能にあった値となる。
【0124】
なお、信号処理装置10は、運用に応じて、官能試験モード時に、レベル変更抽出信号(レベル変更ノッキング音91aa)に測定対象から受聴者の耳位置までの伝達関数He(図示せず)を掛けてから、前記受聴者の耳位置でのノイズ成分を合成して加工音を生成するようにしてもよい。
【0125】
<信号処理装置(推定装置)の動作>
図13から図18を参照して、信号処理装置10の動作について説明する。図13は、信号処理装置10のデータ収集処理を示すフローチャートである。図14Aは、信号処理装置10の学習処理を示すフローチャートである。図14Bは、学習処理のサブルーチンを示すフローチャートである。学習モードの場合、信号処理装置10は、図13のデータ収集処理を行った後、図14A図14Bの学習処理を行う。図14Cは、学習処理のサブルーチンの変更例を示すフローチャートである。図15Aは、信号処理装置10の閾値算出処理を示すフローチャートである。閾値算出モードの場合、信号処理装置10は、図13のデータ収集処理を行った後、図15Aの閾値算出処理を行う。図15Bは、閾値算出処理を示すフローチャートである。分離モードで分離処理を行った場合及び官能試験モードで官能試験処理を行った場合に、信号処理装置10は、図15Bの閾値算出処理を行う。図16は、信号処理装置10の判定処理を示すフローチャートである。判定モードの場合、信号処理装置10は、図13のデータ収集処理を行った後、図16の判定処理を行う。ただし、信号処理装置10は、図13のデータ収集処理を行いながら、リアルタイムで図16の判定処理を行うようにしてもよい。図17は、信号処理装置10の分離処理を示すフローチャートである。分離モードの場合、信号処理装置10は、図13のデータ収集処理を行った後、図17の分離処理を行う。図18は、信号処理装置10の官能試験処理を示すフローチャートである。官能試験モードの場合、信号処理装置10は、図15Bの閾値算出処理を行う前に、図18の官能試験処理を行う。
【0126】
(データ収集処理)
図13を参照して、データ収集処理を説明する。
図13に示すように、ステップS20において、データ収集装置6が、音圧信号、筒内圧信号(教師信号)、及び、角度情報を信号切出部11に入力する。なお、分離モード、閾値算出モード、又は判定モードの場合、ステップS20では、筒内圧信号を入力する必要はない。
ステップS21において、信号切出部11は、角度情報から各気筒の燃焼行程タイミングを算出する。
【0127】
ステップS22において、信号切出部11は、ステップS21で算出した燃焼行程タイミングに合わせて、TDC付近の音圧信号と筒内圧信号を切り出す。
ステップS23において、スペクトログラム算出部12は、ステップS22で切り出した音圧信号に対して短時間フーリエ変換(STFT)を行い、音圧信号のスペクトログラムを算出する。
ステップS24において、スペクトログラム算出部12は、音圧信号のスペクトログラムを信号記憶部13に書き込む。また、信号切出部11は、筒内圧信号が存在する場合は、筒内圧信号(教師信号)を信号記憶部13に書き込む。
【0128】
(学習処理)
図14Aから図14Cを参照して、学習モードで実行される学習処理を説明する。
図14Aに示すように、ステップS30において、信号処理装置10は、信号記憶部13から音圧信号のスペクトログラム及び筒内圧信号を読み出して、学習部21に入力する。
ステップS31において、学習部21は、ステップS30で入力された音圧信号のスペクトログラム及び筒内圧信号を用いて、ニューラルネットワーク94で入力物理量に関連する振幅と位相成分を加味して、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。学習部21は、畳み込みニューラルネットワーク(例えば、U-Net)によりノイズ除去マスクαを生成するニューラルネットワークの重みWを学習し、伝達関数Hとして、抽出信号のスペクトルに乗じる重みを学習する。
【0129】
ステップS32において、学習部21は、学習したノイズ除去マスクαを生成するニューラルネットワークの重みW及び伝達関数Hを学習済みパラメータ記憶部22に書き込む。
【0130】
なお、ステップS31の処理は、例えば図14Bに示す一連の処理によって行われる。
図14Bに示すように、ステップS31aにおいて、学習処理部20は、ニューラルネットワーク94によりノイズ除去マスクαを生成する。
ステップS101において、学習部21は、ステップS31aにおいて生成したノイズ除去マスクαを用いて入力物理量(エンジン近傍音90)をノイズ成分(雑音91b)と抽出信号(抽出ノッキング音91a)とに分離する。
【0131】
ステップS102において、学習部21は、伝達関数Hを掛け合わせて抽出信号(抽出ノッキング音91a)を推定信号(推定ノッキング筒内圧92)に変換する。
ステップS103において、学習部21は、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hの更新を行う。ステップS103では、学習部21は、ノイズ成分(雑音91b)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfi(図3A)と教師信号(観測ノッキング筒内圧93)とのコヒーレンスが小さくなるとともに、抽出信号(抽出ノッキング音91a)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sse(図3A)と教師信号(観測ノッキング筒内圧93)とのコヒーレンスが大きくなるように、また、推定信号(推定ノッキング筒内圧92)と教師信号(観測ノッキング筒内圧93)に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムとの誤差が小さくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを更新する。
【0132】
ステップS104において、学習部21は、コヒーレンスと誤差が収束したか否かを判定し、収束したと判定された場合(“Yes”の場合)に、ステップS31の処理を終了し、一方、収束していないと判定された場合(“No”の場合)に、ステップS105の処理を行う。
【0133】
ステップS105において、学習部21は、ノイズ低減入力物理量90Aを生成して、エンジン近傍音90とノイズ低減入力物理量90Aとをシャッフルする。ステップS105の後、学習部21は、ステップS31a以降の処理を繰り返す。なお、ステップS104において、コヒーレンスと誤差が収束した状態とは、教師信号(観測ノッキング筒内圧93)とノイズ成分(雑音91b)を逆短時間フーリエ変換(ISTFT)して求めた信号波形とのコヒーレンスが「0」に近い値で、かつ、教師信号(観測ノッキング筒内圧93)と抽出信号(抽出ノッキング音91a)を逆短時間フーリエ変換(ISTFT)して求めた信号波形とのコヒーレンスが「1」に近い値で、かつ、教師信号(観測ノッキング筒内圧93)に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムに対する推定信号(推定ノッキング筒内圧92)の誤差が「0」に近い値に収束した状態である。
【0134】
なお、ステップS31の処理は、図14Bの代わりに、例えば図14Cに示す処理を行うようにしてもよい。
図14Cに示す処理は、図14Bに示す処理と比べると、ステップS103の処理の代わりに、ステップS103aの処理を行う点で相違している。
ステップS103aにおいて、学習部21は、ステップS103の条件に加え、さらに、推定信号(推定ノッキング筒内圧92)に対して逆短時間フーリエ変換(ISTFT)を行い求めた信号波形の最大値、及び、最大値と最小値との差(ノッキングインテンシティ)と、教師信号(観測ノッキング筒内圧93)の最大値、及び、最大値と最小値との差(ノッキングインテンシティ)を算出し、前者の最大値と後者の最大値との誤差、及び、前者の最大値と最小値との差(ノッキングインテンシティ)と後者の最大値と最小値との差(ノッキングインテンシティ)における誤差がそれぞれ小さくなるようにするという条件を満たすように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hの更新を行う。すなわち、ステップS103aでは、学習部21は、ノイズ成分(雑音91b)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfi(図3A)と教師信号(観測ノッキング筒内圧93)とのコヒーレンスが小さくなるとともに、抽出信号(抽出ノッキング音91a)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sse(図3A)と教師信号(観測ノッキング筒内圧93)とのコヒーレンスが大きくなるように、また、推定信号(推定ノッキング筒内圧92)と教師信号(観測ノッキング筒内圧93)に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムとの誤差が小さくなるように、さらに、推定信号(推定ノッキング筒内圧92)に対して逆短時間フーリエ変換(ISTFT)を行い求めた信号波形の最大値、及び、最大値と最小値との差(ノッキングインテンシティ)と、教師信号(観測ノッキング筒内圧93)の最大値、及び、最大値と最小値との差(ノッキングインテンシティ)を算出し、前者の最大値と後者の最大値との誤差、及び、前者の最大値と最小値との差(ノッキングインテンシティ)と後者の最大値と最小値との差(ノッキングインテンシティ)における誤差がそれぞれ小さくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを更新する。
【0135】
なお、図14B及び図14Cに示すフローは、ステップS105を初回(ステップS31の後)に行うようにしてもよい。また、図14B及び図14Cに示すフローは、ステップS105を抜いて一度目の処理を行い、学習が終了した後に、ステップS105を含んで二度目の処理を行うようにしてもよい。
【0136】
(閾値算出処理)
図15Aを参照して、閾値算出モードで実行される閾値算出処理を説明する。
図15Aに示すように、ステップS40において、学習処理部20は、ニューラルネットワーク94によりノイズ除去マスクαを生成する。
ステップS41において、第1推定部23は、ニューラルネットワーク94により生成したノイズ除去マスクαを用いて、音圧信号のスペクトログラムからエンジン1のノッキング音を抽出する。
ステップS42において、閾値算出部24は、エンジン1の各サイクルでノッキング音のスペクトログラムの絶対値を総和する。
【0137】
ステップS43において、閾値算出部24は、エンジン1の全サイクルにおけるノッキング音のスペクトログラムの中央値を算出する。
ステップS44において、閾値算出部24は、中央値に任意のマージンを加算し、閾値とする。
ステップS45において、閾値算出部24は、算出した閾値を閾値記憶部25に書き込む。
【0138】
なお、信号処理装置10は、図17の分離処理及び図18の官能試験処理の後に、図15Bの閾値算出処理を実行する機能を有している。以下、図15Bを参照して、図17の分離処理及び図18の官能試験処理の後に行われる閾値算出処理を説明する。
図15Bに示すように、ステップS140において、信号調整部51は、ノイズ成分記憶部26cと抽出信号記憶部26dから、官能試験で許容不可となった信号を取得し、第1推定部23に供給する。
ステップS141において、学習処理部20は、ニューラルネットワーク94によりノイズ除去マスクαを生成する。
ステップS142において、第1推定部23は、ニューラルネットワーク94により生成したノイズ除去マスクαを用いて、官能試験で許容不可となった信号のスペクトログラムからノッキング音のスペクトログラムを取得し、閾値算出部24に供給する。
ステップS143において、閾値算出部24は、第1推定部23から供給されたノッキング音のスペクトログラムの絶対値を総和する。
【0139】
ステップS144において、閾値算出部24は、総和値以下の任意の値を閾値とする。
ステップS145において、閾値算出部24は、算出した閾値を閾値記憶部25に書き込む。
【0140】
(判定処理)
図16を参照して、判定モードで実行される判定処理を説明する。
図16に示すように、ステップS50において、学習処理部20は、ニューラルネットワーク94によりノイズ除去マスクαを生成する。
ステップS51において、第2推定部31は、ニューラルネットワーク94により生成したノイズ除去マスクαを用いて、信号記憶部13より入力された音圧信号のスペクトログラムからエンジン1のノッキング音を抽出する。
【0141】
ステップS52において、閾値判定部32は、エンジン1の各サイクルでノッキング音のスペクトログラムの絶対値を総和する。
ステップS53において、閾値判定部32は、閾値記憶部25に記憶済みの閾値と、総和したノッキング音とを比較し、ノッキング音が閾値を超えているか否かを判定する。
総和したノッキング音が閾値を超えている場合(ステップS53でYes)、閾値判定部32は、ノッキング有りと判定する(ステップS54)。
【0142】
総和したノッキング音が閾値以下の場合、(ステップS53でNo)、閾値判定部32は、ノッキング無しと判定する(ステップS55)。
ステップS56において、閾値判定部32は、閾値判定の結果及びノッキング音をモニタ7に出力する。
【0143】
(分離処理)
図17を参照して、分離モードで実行される分離処理を説明する。
図17に示すように、ステップS60において、学習処理部20は、ニューラルネットワーク94によりノイズ除去マスクαを生成する。
ステップS61において、分離部40は、ニューラルネットワーク94により生成されたノイズ除去マスクαを用いて、入力物理量をノイズ成分と抽出信号とに分離する。
ステップS62において、学習処理部20は、分離したノイズ成分と抽出信号を、それぞれに対応するノイズ成分記憶部26cと抽出信号記憶部26dに記憶する。
【0144】
(官能試験処理)
図18を参照して、官能試験モードで実行される官能試験処理を説明する。
図18に示すように、ステップS70において、信号合成部50の信号調整部51は、レベル指定部9からのレベル指定情報の入力を受け付ける。
ステップS71において、信号調整部51は、抽出信号記憶部26dから抽出信号を取得するとともに、ノイズ成分記憶部26cからノイズ成分を取得し、レベル指定情報に応じて抽出信号のレベルを変更してレベル変更抽出信号を生成する。
【0145】
ステップS72において、信号調整部51は、レベル変更抽出信号とノイズ成分とを合成して加工音を生成する。
ステップS73において、信号合成部50の信号出力部52は、加工音を放音部(ヘッドホン8)に出力して、放音部から加工音を放音させる。
ステップS74において、信号合成部50は、レベル指定部9からの終了の指示があったか否かを判定し、終了の指示があったと判定された場合(“Yes”の場合)に、加工音を第1推定部23に出力し、閾値算出部24により閾値を算出したのち、閾値記憶部25に書き込み、図18の処理を終了する。一方、終了の指示がないと判定された場合(“No”の場合)に、ステップS75において、信号合成部50の信号調整部51は、レベル指定部9からのレベル指定情報の変更を受け付け、ステップS71以降の処理を繰り返す。
【0146】
なお、図17の分離処理及び図18の官能試験処理の後に、信号処理装置10は、官能試験(図18)で許容不可となった信号に対して図15Bに示す閾値算出処理を行う。
【0147】
なお、本実施形態では、関連性を表す要素としてコヒーレンスを用いる場合を説明したが、関連性を表す要素としてコヒーレントアウトプットパワーを用いるようにしてもよい。
【0148】
<ノイズ低減入力物理量生成機能とシャッフル機能>
本第1実施形態に係る信号処理装置10は、学習モードにおいて、ノイズ低減入力物理量生成機能と、シャッフル機能を有している。ノイズ低減入力物理量生成機能は、入力物理量(エンジン近傍音90(図3A))よりもノイズが少ないノイズ低減入力物理量90Aを生成する機能である。シャッフル機能は、入力物理量(エンジン近傍音90(図3A))とノイズ低減入力物理量90Aとをシャッフルする機能である。
【0149】
以下、ノイズ低減入力物理量生成機能とシャッフル機能について説明する。ここでは、ノイズ低減入力物理量生成機能とシャッフル機能を分かり易く説明するために、比較例に係る信号処理装置10Zの構成及び動作について説明し、その後に、本第1実施形態に係る信号処理装置10の動作について説明する。比較例に係る信号処理装置10Zは、ノイズ低減入力物理量生成機能とシャッフル機能を有していない装置である。
【0150】
まず、図19Aから図19Cを参照して、比較例に係る信号処理装置10Zの構成及び動作について説明する。図19Aは、比較例に係る信号処理装置10Zの構成を示すブロック図である。図19Bは、比較例に係る信号処理装置10Zの学習モードの説明図である。図19Cは、比較例に係る信号処理装置10Zの学習モード時の動作説明図である。
【0151】
図19Aの信号処理装置10Zは、図1に示す信号処理システム100とは異なり、ノイズ低減入力物理量生成機能とシャッフル機能が搭載されていない比較例の信号処理システム100Zを具現化したものである。図19Aに示すように、比較例に係る信号処理装置10Zは、本第1実施形態に係る信号処理装置10(図2参照)と比較すると、学習処理部20(図2参照)の代わりに、学習処理部20Zを有している点で相違している。学習処理部20Zは、学習処理部20(図2参照)と比較すると、ノイズ低減入力物理量生成部15と選択部16とを有していない点、及び、学習部21(図2参照)の代わりに、学習部21Zを有している点で相違している。学習部21Zは、学習部21(図2参照)と比較すると、学習モードにおいて、入力物理量(エンジン近傍音90(図19B))からノイズ成分(雑音91b(図19B))を除去するためのノイズ除去マスクαを生成するニューラルネットワーク94の重みを学習する点で相違している。
【0152】
図19Bに示すように、学習モード時において、比較例に係る信号処理装置10Zでは、エンジン近傍音90が学習部21Zに供給される。これに応答して、信号処理装置10Zの学習部21Zは、エンジン近傍音90を雑音91b(ノイズ成分)と抽出ノッキング音91a(抽出信号)とに分離する。その際に、信号処理装置10Zの学習部21Zは、エンジン近傍音90にノイズ除去マスクαを掛け合わせて抽出ノッキング音91a(抽出信号)を取得する。また、信号処理装置10Zの学習部21Zは、エンジン近傍音90から抽出ノッキング音91a(抽出信号)を差し引くことで、雑音91b(ノイズ成分)を取得する。
【0153】
信号処理装置10Zの学習部21Zは、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、抽出ノッキング音91a(抽出信号)を観測ノッキング筒内圧93(教師信号)と同じ次元(単位)の推定ノッキング筒内圧92(推定信号)に位相を加味して変換するための伝達関数Hを学習する。このとき、比較例では、信号処理装置10Zの学習部21Zは、抽出ノッキング音91a(抽出信号)に対して、逆短時間フーリエ変換(ISTFT)と高速フーリエ変換(FFT)とを行い、伝達関数Hを掛け、逆高速フーリエ変換(IFFT)と短時間フーリエ変換(STFT)とを行うことで、抽出ノッキング音91a(抽出信号)を推定ノッキング筒内圧92(推定信号)に変換している。なお、伝達関数Hは、抽出ノッキング音91a(抽出信号)を推定ノッキング筒内圧92(推定信号)に変換するための振幅(ゲイン)と位相成分である。
【0154】
また、信号処理装置10Zの学習部21Zは、雑音91b(ノイズ成分)に対して任意の処理を行うことにより取得された第1信号Sfiと教師信号(観測ノッキング筒内圧93)との関連性が小さくなるとともに、抽出ノッキング音91a(抽出信号)に対して任意の処理を行うことにより取得された第2信号Sseと教師信号(観測ノッキング筒内圧93)との関連性が大きくなるように、ニューラルネットワークの重みを学習する。具体的には、学習部21Zは、雑音91b(ノイズ成分)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfiと観測ノッキング筒内圧93(教師信号)とのコヒーレンスが小さくなるとともに、抽出ノッキング音91a(抽出信号)のスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sseと観測ノッキング筒内圧93(教師信号)とのコヒーレンスが大きくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。これにより、信号処理装置10Zは、雑音91bから筒内圧に起因する音を除去することができる。
【0155】
図19Cに、比較例に係る信号処理装置10Zの学習モード時の動作を示す。図19Cの太枠は、学習モード時の作動する構成要素を示している。また、図19Cの太線矢印は、学習モード時に出力される信号を示している。
【0156】
図19Cに示すように、学習モード時において、比較例に係る信号処理装置10Zは、スイッチ14を学習モード用接続部M1に接続して、信号記憶部13に記憶されているエンジン近傍音90のスペクトログラム及び観測ノッキング筒内圧93(教師信号)を学習部21Zに出力する。
【0157】
これに応答して、信号処理装置10Zの学習部21Zは、エンジン近傍音90から雑音91b(ノイズ成分)を除去するノイズ除去マスクαを生成するニューラルネットワーク94(図19B)の重みWと、生成されたノイズ除去マスクαで抽出した抽出ノッキング音91a(抽出信号)をノッキング発生時のエンジン1の推定ノッキング筒内圧92(推定信号)に変換する伝達関数Hとを学習する。このとき、信号処理装置10Zの学習部21Zは、新しいエンジン近傍音90が入力される度に、エンジン近傍音90に対応するノイズ除去マスクαを生成する。
【0158】
そして、信号処理装置10Zの学習部21Zは、学習されたパラメータ(ノイズ除去マスクαを生成するニューラルネットワークの重みWと伝達関数H)を学習済みパラメータ記憶部22に記憶する。また、信号処理装置10Zの学習部21Zは、観測ノッキング筒内圧93(教師信号)を教師信号記憶部26aに記憶するとともに、推定ノッキング筒内圧92(推定信号)を推定信号記憶部26bに記憶する。
【0159】
<用途変更例>
ところで、本実施形態に係る信号処理装置10は、前記した用途に限らず、様々な用途に用いることができる。例えば、本実施形態に係る信号処理装置10は、検証対象を電子装置に搭載された複数の電子部品のうちの1つとして、この検証対象の電子部品でどのような動作音が発生しているかを検証する用途にも用いることができる。この場合の入力物理量は、この電子部品が搭載された電子装置近傍音となる。電子装置近傍音には、この電子装置に搭載された全ての電子部品の過渡的な動作音と、その他のノイズが重畳した音が含まれており、検証対象の電子部品の動作音はその一部である。ノイズ成分には、この電子装置に搭載された電子部品のうち、検証対象の電子部品を除く他の電子部品の動作音と、その他のノイズが含まれる。電子装置近傍音は、過渡的なノイズ成分が大きく、エンジン近傍音90よりも目的音の取り逃しが発生し易い信号である。また、電子装置近傍音は、定常的なノイズ成分が小さいため、取り逃した音が目立ち易い信号である。
【0160】
以下、図20を参照して、このような用途変更例に適した信号処理システム100の全体構成を説明し、さらに、図21を参照して、このような用途変更例における信号処理装置10の適した信号処理システム100の学習モード時の処理について説明する。図20は、信号処理装置10の用途変更例を実現するための信号処理システム100の全体構成を示すブロック図である。図21は、用途変更された信号処理装置10における学習モードの説明図である。
【0161】
本実施形態に係る信号処理装置10は、図20に示すように、例えば、検証対象を電子装置103に搭載された複数の電子部品101,102のうちの1つである電子部品101として、この検証対象の電子部品101でどのような動作音が発生しているかを検証する用途に用いることができる。この場合の入力物理量は、電子装置近傍音となる。電子装置近傍音には、この電子装置103に搭載された電子部品101,102の過渡的な動作音と、その他のノイズが重畳した音が含まれており、検証対象の電子部品101の動作音はその一部である。ノイズ成分には、検証対象でない他の電子部品102の動作音と、その他のノイズが含まれる。
【0162】
図20に示す例では、信号処理システム100は、図1と同様に音圧センサ4と、データ収集装置6と、モニタ7と、ヘッドホン8と、レベル指定部9と、信号処理装置10とを備え、図1の筒内圧センサ5の代わりに加速度センサ105を備える。音圧センサ4は、電子装置103に搭載された全ての電子部品101,102の動作音やその他のノイズを含む電子装置103の動作音を取得して音圧信号とすると、データ収集装置6に出力する。
【0163】
加速度センサ105は、検証対象である電子部品101に接するように取り付けられており、検証対象である電子部品101の振動加速度を取得して振動加速度信号とすると、データ収集装置6に出力する。ここで、電子部品101に動作音が発生していないとき、加速度センサ105から出力される振動加速度信号には、動作音に相関した成分が含まれない。一方、電子部品101に動作音が発生しているとき、加速度センサ105から出力される振動加速度信号には、動作音に相関した成分が含まれている。
【0164】
データ収集装置6は、電子装置103の音圧信号と、検証対象の電子部品101の振動加速度信号をA/D変換して信号処理装置10に出力する。信号処理装置10は、ノイズ除去マスクαを生成するニューラルネットワーク94(図21)の重みW(図21)及び伝達関数H(図21)を学習する。モニタ7とヘッドホン8とレベル指定部9と信号処理装置10については、図1で前記しているので、ここでは説明を省略する。
【0165】
つまり、エンジンのノッキング音の処理におけるエンジン近傍音は、電子装置103の動作音の処理における受聴者の耳位置の音に対応し、よって電子装置近傍音A90に対応する。エンジンのノッキング音の処理における抽出ノッキング音は、検証対象の電子部品101の動作音に対応する。エンジンのノッキング音の処理における推定ノッキング筒内圧は、検証対象の電子部品101の振動加速度を推定した値に対応する。エンジンのノッキング音の処理における観測ノッキング筒内圧は、検証対象の電子部品101の振動加速度を観測した値に対応する。つまり、電子部品101の動作音の処理における教師信号は、検証対象の電子部品101の振動加速度を観測した値である。
【0166】
図1の信号処理装置10をこの用途変更例に用いる場合において、図21に示す用途変更例の学習モードでの信号処理装置10の動作は、図3Aに示す用途例の学習モードでの信号処理装置10の動作と比較すると、以下の点で相違する。
(1)入力物理量としてエンジン近傍音90(図3A)の代わりに電子装置近傍音A90がノイズ低減入力物理量生成部15と選択部16に入力される点。
(2)ノイズ低減入力物理量生成部15が、ノイズ低減入力物理量90A(図3A)の代わりに、入力物理量(用途変更例では、電子装置近傍音A90)に含まれるノイズ成分(用途変更例では、雑音A91b)を低減したノイズ低減入力物理量A90Aを生成する点。
(3)選択部16が、入力物理量である電子装置近傍音A90とノイズ低減入力物理量A90Aのいずれか一方又は双方を選択して学習部21に供給する点。
(4)学習部21は、信号記憶部13から入力された音圧信号のスペクトログラム及び振動加速度信号を用いて、入力物理量である電子装置近傍音A90とノイズ低減入力物理量A90Aの中の選択部16が選択したものからノイズ成分(雑音A91b)を除去するためのノイズ除去マスクαを生成するニューラルネットワーク94の重みWを学習する点。
(5)学習部21は、信号記憶部13から入力された音圧信号のスペクトログラム及び振動加速度信号を用いて、生成されたノイズ除去マスクαで抽出した抽出信号を電子部品101の推定振動加速度A92に変換する伝達関数Hを学習する点。
(6)学習部21は、抽出信号として、抽出ノッキング音91a(図3A)の代わりに、抽出動作音A91aを抽出する点。
(7)学習部21は、ノイズ成分である雑音A91bに対して任意の処理を行うことにより取得された第1信号Sfiと教師信号である観測振動加速度A93との関連性が小さくなるとともに、抽出信号である抽出動作音A91aに対して任意の処理を行うことにより取得された第2信号Sseと教師信号である観測振動加速度A93との関連性が大きくなるように、ニューラルネットワークの重みを学習する点。具体的には、学習部21は、雑音A91bのスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第1信号Sfiと観測振動加速度A93とのコヒーレンスが小さくなるとともに、抽出動作音A91aのスペクトログラムに対して逆短時間フーリエ変換(ISTFT)を行うことにより取得された第2信号Sseと観測振動加速度A93とのコヒーレンスが大きくなるように、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する点。
(8)さらに、学習部21は、教師信号である観測振動加速度A93に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムと推定信号である推定振動加速度A92との誤差が最小となるように、ニューラルネットワーク94により、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する点。
【0167】
このような用途変更例において、信号処理装置10は、エンジン近傍音90(図3A)の代わりに、受聴者の耳位置の音である電子装置近傍音A90(図21)を入力物理量として扱う。また、信号処理装置10は、抽出ノッキング音91a(図3A)の代わりに、検証対象の電子部品101の動作音である抽出動作音A91a(図21)を抽出信号として扱う。また、信号処理装置10は、雑音91b(図3A)の代わりに雑音A91b(図21)をノイズ成分として扱う。また、信号処理装置10は、推定ノッキング筒内圧92(図3A)の代わりに、検証対象の電子部品101の推定振動加速度A92(図21)を推定信号として扱う。また、信号処理装置10は、観測ノッキング筒内圧93(図3A)の代わりに、検証対象の電子部品101の観測振動加速度A93(図21)を教師信号として扱う。そして、信号処理装置10は、これらの信号を用いて、学習モード、閾値算出モード、判定モード、分離モード、官能試験モードを実行する。このような信号処理装置10は、官能試験モードにおいて、電子部品101でどのような動作音が発生しているかを検証することができる。
【0168】
なお、前記した比較例に係る信号処理装置10Zも、検証対象を電子装置に搭載された複数の電子部品のうちの1つとして、この検証対象の電子部品でどのような動作音が発生しているかを検証する用途変更例に用いることができる。しかし、前記した比較例に係る信号処理装置10Zは、この用途変更例に用いられた場合の学習モードにおいて、入力物理量に含まれるノイズ成分が比較的大きい場合、入力物理量からノイズ成分を除去して抽出信号を抽出する際に、取り逃した信号SG13(抽出し損ねた信号)(図22C)が発生し、抽出信号を正確に分離できなくなる可能性がある。つまり、比較例に係る信号処理装置10Zは、学習モードにおいて、入力物理量に含まれるノイズ成分が比較的大きい場合に、入力物理量から抽出したい信号(取りたい信号SG12(図22B))を綺麗に分離できなくなる可能性がある。
【0169】
図22Aから図22Dは、それぞれ、比較例に係る信号処理装置10Zにおいて発生する不適切な例(入力物理量から取りたい信号SG11(抽出したい信号)を綺麗に分離できない場合の例)の説明図である。ここでは、前記した比較例に係る信号処理装置10Zが、検証対象を電子装置に搭載された複数の電子部品のうちの1つとして、この検証対象の電子部品でどのような動作音が発生しているかを検証する用途変更例に用いられる場合を想定して説明する。
【0170】
図22Aは、入力物理量のスペクトログラムの一例である。入力物理量には、取りたい信号SG11(抽出したい信号)とノイズNO11とが混在している。
【0171】
図22Bは、図22Aに示す入力物理量から取りたい信号SG12(抽出したい信号)を抽出した抽出信号のスペクトログラムを示している。
【0172】
図22Cは、図22Aに示す入力物理量から抽出信号を抽出した後のノイズ成分のスペクトログラムである。ノイズ成分には抽出信号を抽出する際に取り逃した信号SG13(抽出し損ねた信号)とノイズNO11が混在している。取り逃した信号SG13はノイズNO11よりも音圧が小さいため、ノイズ成分と教師信号とのコヒーレンスは低くなる(図22D)。
【0173】
図22Dは、不適切な例におけるノイズ成分と教師信号とのコヒーレンスを示している。図22Dに示すように、不適切な例では、取り逃した信号SG13が含まれているノイズ成分と教師信号とのコヒーレンスが低くなっている。この場合に、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習において、ノイズ成分に取り逃した信号SG13が含まれているにもかかわらず学習が止まってしまい、取り逃がしが発生する。この点について、ノイズNO11が無ければ(ノイズの音圧が小さければ)(図23C)、取り逃した信号SG13が含まれているノイズ成分と教師信号とのコヒーレンスが高くなる(図23D)。本第1実施形態に係る信号処理装置10は、図23Dに示すように取り逃した信号SG13を含むノイズ成分と教師信号とのコヒーレンスを高くなるようにして、ニューラルネットワークの重みWと伝達関数Hの学習が止まらないように改善したものである。
【0174】
図23Aから図23Eは、それぞれ、本第1実施形態に係る信号処理装置10において実現される好適な例(入力物理量から取りたい信号SG21(抽出したい信号)を綺麗に分離できる場合の例)の説明図である。
【0175】
図23Aは、好適な例における、入力物理量のスペクトログラムの一例である。入力物理量には取りたい信号SG21(抽出したい信号)とノイズNO21とが混在している。
【0176】
図23Bは、処理マスクを用いて図23Aに示す入力物理量からノイズNO21を低減した後の、取りたい信号SG22(抽出したい信号)が含まれているノイズ低減入力物理量のスペクトログラムを示している。図23Bに示すノイズ低減入力物理量には、取りたい信号SG22と処理マスクによって低減されたノイズNO22とが含まれている。
【0177】
図23Cは、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習途中における、図23Bに示すノイズ低減入力物理量から抽出信号を抽出した後のノイズ成分のスペクトログラムである。図23Cに示す例のノイズ成分には、取り逃した信号SG23が含まれており、取り逃した信号SG23よりもノイズNO23の音圧が小さくなっている。そのため、図23Bに示すノイズ低減入力物理量から抽出信号を抽出した後におけるノイズ成分と教師信号とのコヒーレンスが高くなる(図23D)。
【0178】
図23Dは、適切な例におけるノイズ成分と教師信号とのコヒーレンスを示している。図23Dに示すように、適切な例では、取り逃した信号SG23が含まれているノイズ成分と教師信号とのコヒーレンスが高くなっている。本第1実施形態に係る信号処理装置10は、図23Dに示すように取り逃した信号SG23を含むノイズ成分と教師信号とのコヒーレンスを高くなるようにすることで、ニューラルネットワークの重みWと伝達関数Hの学習の際に、ノイズ成分に取り逃した信号SG23が含まれている場合に学習が止まらないようにすることができる。図22Dに示す不適切な場合では、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習において、ノイズ成分に取り逃した信号SG13が含まれていても学習が止まってしまい、取り逃がしが発生する。本第1実施形態に係る信号処理装置10は、このような取り逃がしの発生を抑制することができる。
【0179】
図23Eは、図23Aの好適な例における入力物理量のスペクトログラムから抽出信号を抽出した後のノイズ成分のスペクトログラムである。図23Eに示す好適な例における取り逃した信号SG24の音圧は、図22Cに示す不適切な例における取り逃した信号SG13の音圧よりも小さい。このように、本第1実施形態に係る信号処理装置10は、取り逃した信号SG24を小さくすることができる。
【0180】
本第1実施形態に係る信号処理装置10は、学習が途中で止まらないようにするために、入力物理量である電子装置近傍音A90からノイズが支配的な部分についてノイズを低減したデータであるノイズ低減入力物理量A90Aを生成しながら、ニューラルネットワークの重みWと伝達関数Hを学習する。学習モード時において、入力物理量に含まれるノイズの音圧が比較的大きいと、入力物理量から取りたい信号(抽出したい信号)を綺麗に分離できなくなる。そのため、取りたい信号(抽出したい信号)の分離性能を向上させるために本第1実施形態に係る信号処理装置10に、前記のノイズ低減入力物理量生成機能とシャッフル機能が付与されている。前記のノイズ低減入力物理量生成機能は、ノイズ低減入力物理量生成部15によって実現される(図3A及び図3B)。また、前記のシャッフル機能は、選択部16によって実現される(図3A及び図3B)。
【0181】
図24は、処理マスクβの生成方法の概略説明図である。処理マスクβは、電子装置近傍音A90のスペクトログラムの内、ノイズが支配的ではない部分については信号を通すように、一方で、ノイズが支配的な部分についてはノイズを低減するように動作する。処理マスクβは、ノイズ除去マスクαをフィルタ処理することにより生成される。図24に示す例では、ノイズ除去マスクαをマックスプーリングとアップサンプリングを用いる方法でフィルタ処理することにより生成する例を示している。
【0182】
図25は、処理マスクβの生成方法の説明図である。図25は、マックスプーリングとアップサンプリングを用いる方法の概要を示している。図25に示すように、マックスプーリングとアップサンプリングを用いる方法は、指定された領域内のすべての要素を最大値の要素に置き換える操作を行うものである。その他にも最大値フィルタや二値化手法、またはそれらの組み合わせた処理を用いても良い。これにより、ノイズが支配的ではない部分を所定領域だけ拡張し、誤って抽出したい信号を低減することがないようにしている。
【0183】
信号処理装置10のノイズ低減入力物理量生成部15は、これらの手法を用いてノイズ除去マスクαから処理マスクβを生成する。なお、これらの手法は一例に過ぎず、ノイズ低減入力物理量生成部15は、これら以外の手法を用いてノイズ除去マスクαから処理マスクβを生成することができる。
【0184】
図26及び図27は、それぞれ、ノイズ低減入力物理量A90Aの生成方法の説明図である。図26及び図27は、ノイズ低減入力物理量生成部15が電子装置近傍音A90と処理マスクβとの要素積を演算することにより、ノイズ低減入力物理量A90Aを生成することを示している。このようなノイズ低減入力物理量生成部15は、処理マスクβで電子装置近傍音A90からノイズが支配的な部分を低減したノイズ低減入力物理量A90Aのスペクトログラムを生成することができる。ノイズ低減入力物理量生成部15によって生成されたノイズ低減入力物理量A90Aは、教師信号である観測振動加速度A93と関連付けされたデータセットとして選択部16に供給される。
【0185】
図28は、本第1実施形態に係る信号処理装置10の学習モードにおけるシャッフル処理の説明図である。図28は、複数の電子装置近傍音A90とそれに対応する教師信号である観測振動加速度A93とが関連付けされたデータセットDS90が用意されるとともに、複数のノイズ低減入力物理量A90Aとそれに対応する観測振動加速度A93とが関連付けされたデータセットDS90Aが用意されることを示している。そして、図28は、選択部16が、データセットDS90とデータセットDS90Aとをシャッフルして、学習部21に供給することを示している。なお、データセットDS90の観測振動加速度A93とデータセットDS90Aの観測振動加速度A93は同じものとなっている。
【0186】
学習部21は、データセットDS90とデータセットDS90Aの中の選択部16が選択したデータセットに基づいてニューラルネットワークの重みWと伝達関数Hを学習する。その際に、データセットDS90Aに含まれているノイズ低減入力物理量A90Aのスペクトログラムは、処理マスクβによりノイズの支配的な部分についてはノイズが低減されているため、図23Dに示すように取りたい信号SG22と教師信号とのコヒーレンスを高くすることができる。学習部21は、ニューラルネットワークの重みWと伝達関数Hを学習する際に、そのコヒーレンスが下がるように学習を行う。
【0187】
このような本第1実施形態に係る信号処理装置10は、入力物理量から取りたい信号(抽出したい信号)よりもノイズの音圧が比較的大きい場合であっても、取り逃した信号がノイズ成分に含まれているにもかかわらず、ノイズ成分と教師信号との関連の度合い(例えばコヒーレンス)が低下して学習が止まることを避けられる。そのため、本実施形態に係る信号処理装置10は、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習において、取り逃した信号が発生することを抑制することができる。
【0188】
ところで、図29に示すように、本第1実施形態に係る信号処理装置10の学習部21は、学習モード時に、伝達関数Hを用いずに、ニューラルネットワークの重みWを学習する構成にすることができる。つまり、本第1実施形態に係る信号処理装置10の学習部21は学習モード時に、一部の学習の最適化を行わない構成にすることができる。図29は、本第1実施形態に係る信号処理装置10の学習モード時における動作の変更例の説明図である。図29に示すように、変形例の学習部21は、図3Aに示す例の学習部21と比較すると、推定信号である推定振動加速度A92と教師信号である観測振動加速度A93との関連性が小さくなる判定処理(誤差の最小化の判定処理)を削除している点で相違している。したがって、変形例の学習部21は、学習モード時に、ノイズ成分である雑音A91bと教師信号である観測振動加速度A93との関連性が小さくなる判定処理(コヒーレンスの最小化の判定処理)と、抽出信号である抽出動作音A91aと教師信号である観測振動加速度A93との関連性が大きくなる判定処理(コヒーレンスの最大化の判定処理)のみを行う構成になっている。
【0189】
<信号処理装置(推定装置)の主な特徴>
本実施形態に係る信号処理装置10は、主に以下のような特徴を有する。なお、以下の説明において、「入力物理量」は、例えば図3Aに示す用途例では「エンジン近傍音90」を意味し、図21に示す用途変更例では「電子装置近傍音A90」を意味する。また、「ノイズ低減入力物理量」は、例えば図3Aに示す用途例では「ノイズ低減入力物理量90A」を意味し、図21に示す用途変更例では「ノイズ低減入力物理量A90A」を意味する。また、「抽出信号」は、例えば図3Aに示す用途例では「抽出ノッキング音91a」を意味し、図21に示す用途変更例では「抽出動作音A91a」を意味する。また、「ノイズ成分」は、例えば図3Aに示す用途例では「雑音91b」を意味し、図21に示す用途変更例では「雑音A91b」を意味する。また、「推定信号」は、例えば図3Aに示す用途例では「推定ノッキング筒内圧92」を意味し、図21に示す用途変更例では「推定振動加速度A92」を意味する。また、「教師信号」は、例えば図3Aに示す用途例では「観測ノッキング筒内圧93」を意味し、図21に示す用途変更例では「観測振動加速度A93」を意味する。
【0190】
(1)図2に示すように、本実施形態に係る信号処理装置10は、ノイズ低減入力物理量生成部15と、選択部16と、学習部21と、を備える。図3A及び図21に示すように、ノイズ低減入力物理量生成部15は、入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成する。つまり、本実施形態に係る信号処理装置10は、ノイズ低減入力物理量生成部15でノイズの小さいデータとしてノイズ低減入力物理量を生成する。選択部16は、入力物理量とノイズ低減入力物理量のいずれか一方又は双方を選択して、学習部21に供給する。学習部21は、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものからノイズ成分を除去するためのノイズ除去マスクαを生成するニューラルネットワークの重みWを学習する。
【0191】
ここで、「入力物理量とノイズ低減入力物理量の中の選択部16が選択したもの」とは、具体的には、複数の電子装置近傍音A90(入力物理量)とそれに対応する観測振動加速度A93(教師信号)とが関連付けされたデータセットDS90(図28)と複数のノイズ低減入力物理量A90Aとそれに対応する観測振動加速度A93(教師信号)とが関連付けされたデータセットDS90A(図28)の中の選択部16が選択したデータセットを意味する。
【0192】
このような本実施形態に係る信号処理装置10は、入力物理量に含まれるノイズ成分を低減したノイズ低減入力物理量を生成するノイズ低減入力物理量生成工程と、前記入力物理量と前記ノイズ低減入力物理量のいずれか一方又は双方を選択する選択工程と、前記入力物理量と前記ノイズ低減入力物理量の中の前記選択工程で選択したものからノイズ成分を除去するためのノイズ除去マスクを生成するニューラルネットワークの重みを学習する学習工程と、を含むことを特徴とする信号処理方法を実現することができる。
【0193】
このような本実施形態に係る信号処理装置10は、ノイズ量が大きい場合(特に、入力物理量から取りたい信号(抽出したい信号)よりもノイズの音圧が比較的大きい場合)であっても、取り逃した信号がノイズ成分に含まれているにもかかわらず、ノイズ成分と教師信号との関連の度合い(例えばコヒーレンス)が低下して学習が止まることを避けられる。そのため、本実施形態に係る信号処理装置10は、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習において、取り逃した信号が発生することを抑制することができる。これにより、本実施形態に係る信号処理装置10は、ノイズ量が大きい場合であっても、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。
【0194】
(2)図3A及び図21に示すように、本実施形態に係る信号処理装置10のノイズ低減入力物理量生成部15は、ノイズ除去マスクαをフィルタ処理した処理マスクβを用いて、入力物理量からノイズ成分を低減したデータ(ノイズ低減入力物理量)を生成するとよい。
【0195】
このような本実施形態に係る信号処理装置10は、取り逃した信号が含まれるノイズ成分と教師信号とのコヒーレンスを高くし、ニューラルネットワークの重みWを学習する際に、そのコヒーレンスが下がるように学習を行うことで、ニューラルネットワークの重みWの良好な学習を行うことができる。
【0196】
(3)図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ノイズ成分と教師信号との関連性が小さくなるとともに、入力物理量又はノイズ低減入力物理量からノイズ成分を除去した抽出信号と教師信号との関連性が大きくなるように、ニューラルネットワークの重みWを学習するとよい。
【0197】
このような本実施形態に係る信号処理装置10は、分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価することができる。したがって、本実施形態に係る信号処理装置10は、ノイズ低減入力物理量生成部15で入力物理量(入力信号)に含まれるノイズ量を低減したノイズ低減入力物理量を生成して、学習部21で分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価することにより、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。
【0198】
(4)図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ノイズ除去マスクαを用いて、入力物理量又はノイズ低減入力物理量からノイズ成分を除去した抽出信号を生成して、抽出信号を教師信号と同じ次元の推定信号に変換するための伝達関数Hを学習するとよい。その際に、学習部21は、教師信号に対する推定信号の誤差が小さくなるように、ニューラルネットワークの重みWと伝達関数Hとを学習するとよい。
【0199】
このような本実施形態に係る信号処理装置10は、教師信号に対する推定信号の誤差が小さくなるように、ニューラルネットワークの重みWと伝達関数Hとを学習することで、最適なニューラルネットワークの重みWと伝達関数Hとを学習することができる。
【0200】
(5)図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから位相を加味してノイズ成分を除去するためのノイズ除去マスクαを生成するニューラルネットワークの重みWを学習する。また、学習部21は、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものからノイズ成分が除去された抽出信号を、教師信号と同じ次元(単位)の推定信号に位相を加味して変換するための伝達関数Hを学習する。係る構成において、図3A及び図21に示すように、学習部21は、ノイズ成分と教師信号との関連性が小さくなるとともに、抽出信号と教師信号との関連性が大きくなるように、ニューラルネットワーク94の重みWを学習する。
【0201】
このような本実施形態に係る信号処理装置10は、ニューラルネットワーク94の重みWを学習する際に、入力物理量(入力信号)に含まれるノイズ量を低減したノイズ低減入力物理量を生成して、分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価することにより、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。このような信号処理装置10は、ノイズ成分と、官能試験でのレベル変更に適した信号とに良好に分離することができる。また、信号処理装置10は、背景音に目的音(ノッキング音や、検証対象の電子部品の動作音)が混入しているか否かを評価し易くすることができる。そのため、信号処理装置10は、例えば特許文献2及び特許文献3に記載された従来技術よりも、ノッキング音や検証対象の電子部品の動作音の評価性能を向上させることができる。また、信号処理装置10は、良好な官能試験を行うことができ、官能試験で許容不可となったデータに基づいて閾値を決定することで、検査者に近い判定ができる。
【0202】
(6)図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する際に、入力物理量に関連する振幅と位相成分を加味して学習する。
【0203】
このような本実施形態に係る信号処理装置10は、雑音の中にノッキング音や、検証対象の電子部品の動作音(目的音)が混入しないように、入力物理量を抽出信号とノイズ成分とに分離することができる。このような信号処理装置10は、特許文献2及び特許文献3に記載された従来技術よりも、ノッキング音や検証対象の電子部品の動作音の評価性能を向上させることができる。また、このような信号処理装置10は、良好な官能試験を行うことができる。
【0204】
(7)本実施形態に係る信号処理装置10の学習部21は、ノイズ成分と教師信号との関連性が小さくなるとともに、抽出信号と教師信号との関連性が大きくなるように、ニューラルネットワークの重みW、及び、伝達関数Hを学習する。その際に、例えば、図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ノイズ成分と教師信号とのコヒーレンスをノイズ成分と教師信号との関連性を表す要素として用いるとよい。また、本実施形態に係る信号処理装置10の学習部21は、抽出信号と教師信号とのコヒーレンスを抽出信号と教師信号との関連性を表す要素として用いるとよい。具体的には、図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ノイズ成分を逆短時間フーリエ変換(ISTFT)して求めた信号波形と教師信号とのコヒーレンス(又はコヒーレントアウトプットパワー)が小さくなるとともに、抽出信号を逆短時間フーリエ変換(ISTFT)して求めた信号波形と教師信号とのコヒーレンス(又はコヒーレントアウトプットパワー)が大きくなるように、ニューラルネットワークの重みW、及び、伝達関数Hを学習するとよい。
【0205】
このような本実施形態に係る信号処理装置10は、ノイズ成分からノッキング筒内圧や、検証対象の電子部品の動作に起因する音を除去することができる。
【0206】
(8)図3A及び図21に示すように、本実施形態に係る信号処理装置10の学習部21は、ニューラルネットワークの重みW、及び、伝達関数Hを学習する場合に、教師信号に対する推定信号の誤差が小さくなるように、学習する。具体的には、信号処理装置10の学習部21は、教師信号に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムに対する推定信号の誤差が小さくなるように、学習する。又は、信号処理装置10の学習部21は、教師信号と、抽出信号に対して、逆短時間フーリエ変換(ISTFT)と高速フーリエ変換(FFT)とを行い、伝達関数Hを掛け、逆高速フーリエ変換(IFFT)を行い求めた推定信号の信号波形との誤差が小さくなるように、学習する。
【0207】
このような本実施形態に係る信号処理装置10は、教師信号に対して短時間フーリエ変換(STFT)を行い求めたスペクトログラムに対する推定信号の誤差が小さくなるように、ニューラルネットワークの重みW、及び、伝達関数Hを学習することができる。又は、信号処理装置10は、教師信号と、抽出信号に対して、逆短時間フーリエ変換(ISTFT)と高速フーリエ変換(FFT)とを行い、伝達関数Hを掛け、逆高速フーリエ変換(IFFT)を行い求めた推定信号の信号波形との誤差が小さくなるように、ニューラルネットワークの重みW、及び、伝達関数Hを学習することができる。
【0208】
(9)図7Bに示すように、本実施形態に係る信号処理装置10は、抽出信号のレベルを変更して、入力物理量から分離されたノイズ成分と合成して加工音を生成する信号合成部50を備える。
【0209】
このような本実施形態に係る信号処理装置10は、検査すべき目的音(ノッキング音/検証対象の電子部品の動作音)を聞き分け易い状態にすることができる。このような信号処理装置10は、目的音(ノッキング音/検証対象の電子部品の動作音)の有無を高精度に検査者に把握させることができ、官能試験で許容不可となったデータに基づいて閾値を決定することで、検査者に近い判定ができる。
【0210】
(10)図7Bに示すように、本実施形態に係る信号処理装置10の信号合成部50は、検査者、または操作者による抽出信号のレベルの指定を受け付ける信号調整部51を有している。
【0211】
このような本実施形態に係る信号処理装置10は、抽出信号のレベルを任意にかつ細やかに変更することができる。
【0212】
(11)図14A及び図17に示すように、本実施形態に係る信号処理装置10は、以下の信号処理方法を実現することができる。すなわち、本実施形態に係る信号処理方法は、学習工程(図14AのステップS30からステップS32の工程)と、分離工程(図17のステップS60からステップS62の工程)と、を含む。学習工程では、ノイズ成分が含まれている入力物理量からノイズ成分を除去するためのノイズ除去マスクαを生成するニューラルネットワーク94の重みWを学習する。その際に、ノイズ成分と教師信号との関連性が小さくなるとともに、抽出信号と教師信号との関連性が大きくなるように、ニューラルネットワーク94の重みWを学習する。また、その際に、ニューラルネットワーク94により、ノイズ成分が含まれている入力物理量から位相を加味してノイズ成分を除去するためのノイズ除去マスクαを生成するニューラルネットワーク94の重みW、及び、入力物理量からノイズ成分が除去された抽出信号を、教師信号と同じ次元(単位)の推定信号に位相を加味して変換するための伝達関数Hを学習するとよい。分離工程では、ノイズ除去マスクαを用いて入力物理量をノイズ成分とノイズ成分が除去された抽出信号とに分離する。
【0213】
このような本実施形態に係る信号処理方法は、入力物理量をノイズ成分と抽出信号とに良好に分離することができる。特に、ノイズ成分と、官能試験でのレベル変更に適した信号とに分離することができる。
【0214】
(12)図3A及び図21に示すように、本実施形態に係る信号処理装置10は、入力物理量からノイズ成分を除去した抽出信号に伝達関数Hを掛け合わせて、教師信号と同じ次元(単位)の推定信号を推定する推定装置である。本実施形態に係る信号処理装置10の学習部21は、ニューラルネットワーク94により、入力物理量からノイズ成分を除去して抽出信号を抽出するためのノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。
【0215】
このような本実施形態に係る信号処理装置10は、ニューラルネットワークの重みW、及び、伝達関数Hを学習する際に、ノイズ除去マスクα、及び、伝達関数Hに対して、入力物理量に関連する振幅と位相成分を加味して学習することができる。
【0216】
(13)本実施形態に係る信号処理装置10は、以下の推定方法を実現することができる。すなわち、本実施形態に係る推定方法は、入力物理量からノイズ成分を除去した抽出信号に伝達関数Hを掛け合わせて、教師信号と同じ次元(単位)の推定信号を推定する方法である。図14B又は図14Cに示すように、本実施形態に係る推定方法は、学習工程(ステップS103又はステップS103aの工程)と、推定信号推定工程(ステップS102の工程)と、を含む。学習工程(ステップS103又はステップS103aの工程)では、ニューラルネットワーク94により、入力物理量からノイズ成分を除去して抽出信号を抽出するためのノイズ除去マスクαを生成するニューラルネットワークの重みW、及び、伝達関数Hを学習する。推定信号推定工程(ステップS102の工程)では、ニューラルネットワーク94により、ノイズ除去マスクαを用いて、ノイズ成分が除去された抽出信号を取得し、伝達関数Hを掛け合わせることで抽出信号を推定信号に変換する。本実施形態に係る推定方法は、学習工程(ステップS103又はステップS103aの工程)において、ニューラルネットワークの重みW、及び、伝達関数Hを学習する際に、ノイズ除去マスクα、及び、伝達関数Hに対して、入力物理量に関連する振幅と位相成分を加味して学習する。
【0217】
このような本実施形態に係る推定方法は、ニューラルネットワークの重みW、及び、伝達関数Hを学習する際に、ノイズ除去マスクα、及び、伝達関数Hに対して、入力物理量に関連する振幅と位相成分を加味して学習することができる。
【0218】
以上の通り、本実施形態に係る信号処理装置10によれば、ノイズ量が大きい場合(特に、入力物理量から取りたい信号(抽出したい信号)よりもノイズの音圧が比較的大きい場合)であっても、取り逃した信号がノイズ成分に含まれているにもかかわらず、ノイズ成分と教師信号とのコヒーレンスが低下して学習が止まることを避けられる。そのため、本実施形態に係る信号処理装置10は、学習部21によるニューラルネットワークの重みWと伝達関数Hの学習において、取り逃した信号が発生することを抑制することができる。これにより、本実施形態に係る信号処理装置10は、ノイズ量が大きい場合であっても、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。
【0219】
また、本第1実施形態に係る信号処理装置10によれば、ニューラルネットワーク94の重みWを学習する際に、入力物理量(入力信号)に含まれるノイズ量を低減したノイズ低減入力物理量を生成して、分離後のノイズ成分に教師信号と関連のある成分が含まれていないかを評価しながら、評価結果を学習データに加えることにより、入力物理量をノイズ成分と抽出信号とに良好に分離するための学習を行うことができる。また、本第1実施形態に係る信号処理装置10によれば、入力物理量をノイズ成分と抽出信号とに良好に分離することができる。特に、信号処理装置10は、ノイズ成分と、官能試験でのレベル変更に適した信号とに分離することができる。このような信号処理装置10は、背景音に目的音(ノッキング音/検証対象の電子部品の動作音)が混入しているか否かを評価し易くすることができる。そのため、信号処理装置10は、ノッキング音や検証対象の電子部品の動作音の評価性能を向上させることができる。また、信号処理装置10は、良好な官能試験を行うことができる。
【0220】
[第2実施形態]
図30を参照して、本第2実施形態に係る信号処理装置10A(推定装置)の構成について説明する。図30は、第2実施形態に係る信号処理装置10A(推定装置)の構成を示すブロック図である。
【0221】
図30の信号処理システム100Aは、信号処理装置10Aによって実現される。図30に示すように、本第2実施形態に係る信号処理装置10A(推定装置)は、第1実施形態に係る信号処理装置10(図2参照)と比較すると、信号合成部50が以下の機能を有する点で相違している。すなわち、信号合成部50は、教師信号に伝達関数Hの逆数を掛け、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから分離されたノイズ成分と合成して加工音を生成する機能を有する。
【0222】
このような本第2実施形態に係る信号処理装置10A(推定装置)は、第1実施形態に係る信号処理装置10と同様に、目的音(エンジン1のノッキング音や電子部品101の動作音等)の有無を高精度に検査者に把握させることができ、検査性能を向上させることができる。
【0223】
なお、信号合成部50は、教師信号のレベル(大きさ)を変更したレベル変更教師信号に伝達関数Hの逆数を掛け、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから分離されたノイズ成分と合成して加工音を生成する機能を有してもよい。
【0224】
また、信号合成部50は、教師信号ではなく、教師信号と同じ次元である任意の信号(例えば、任意のノッキング筒内圧信号や振動加速度)に伝達関数Hの逆数を掛け、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから分離されたノイズ成分と合成して加工音を生成する機能を有してもよい。
【0225】
また、信号合成部50は、伝達関数Hの値を変更した変更伝達関数Hcの逆数を教師信号に掛け、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから分離されたノイズ成分と合成して加工音を生成するようにしてもよい。
【0226】
また、信号合成部50は、教師信号のレベル(大きさ)を変更したレベル変更教師信号に伝達関数Hの値を変更した変更伝達関数Hcの逆数を掛け、入力物理量とノイズ低減入力物理量の中の選択部16が選択したものから分離されたノイズ成分と合成して加工音を生成する機能を有してもよい。
【0227】
ここで、例えば、変更伝達関数Hcは、伝達関数Hのある周波数帯に該当する振幅を増加又は減少させたもの、及び/又は位相を変更させたものである。
【0228】
なお、本発明は、前記した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々の変更や変形を行うことができる。
【0229】
例えば、前記した実施形態は、本発明の要旨を分かり易く説明するために詳細に説明したものである。そのため、本発明は、必ずしも説明した全ての構成要素を備えるものに限定されるものではない。また、本発明は、ある構成要素に他の構成要素を追加したり、一部の構成要素を他の構成要素に変更したりすることができる。また、本発明は、一部の構成要素を削除することもできる。
【符号の説明】
【0230】
1…エンジン
2…エンジンECU
3…車両
4…音圧センサ
5…筒内圧センサ
6…データ収集装置
7…モニタ
8…ヘッドホン(放音部)
9…レベル指定部
10,10A,10Z…信号処理装置(推定装置)
11…信号切出部
12…スペクトログラム算出部
13…信号記憶部
14…スイッチ
15…ノイズ低減入力物理量生成部
16…選択部
20,20Z…学習処理部
21,21Z…学習部
22…学習済みパラメータ記憶部
23…第1推定部
24…閾値算出部
25…閾値記憶部
26a…教師信号記憶部
26b…推定信号記憶部
26c…ノイズ成分記憶部
26d…抽出信号記憶部
30…判定処理部
31…第2推定部(抽出信号推定部)
32…閾値判定部
40…分離部
50…信号合成部
51…信号調整部
52…信号出力部
81…ノッキング振動
82…ノッキング音
83…メカニカルノイズ(ノイズ成分)
90…エンジン近傍音(入力物理量)
90A…ノイズ低減入力物理量
91a…抽出ノッキング音(抽出信号)
91aa…レベル変更ノッキング音(レベル変更抽出信号)
91b…雑音(ノイズ成分)
91c…加工音
92…推定ノッキング筒内圧(推定信号)
93…観測ノッキング筒内圧(教師信号)
94…ニューラルネットワーク
94A…マスク生成ネットワーク
95…U-Net
96…下向きパス(Encoder)
97…階層
98…上向きパス(Decoder)
99…出力
100,100A,100Z…信号処理システム
101…電子部品(検証対象)
102…電子部品
103…電子装置
105…加速度センサ
α…ノイズ除去マスク
β…処理マスク
A90…電子装置近傍音(入力物理量)
A90A…ノイズ低減入力物理量
A91a…抽出動作音(抽出信号)
A91b…雑音(ノイズ成分)
A92…推定振動加速度(推定信号)
A93…観測振動加速度(教師信号)
DS90,DS90A…データセット
F11,F21,F31,F37…スペクトログラム
F12,F22,F32,F36,F93…信号波形
F13,F23…コヒーレンス
F33,F35…スペクトル
F34…周波数応答特性
H,He…伝達関数
Hc…変更伝達関数
M1…学習モード用接続部
M2…閾値算出モード用接続部
M3…判定モード用接続部
M4…分離モード用接続部
M5…官能試験モード用接続部
NO11、NO21,NO22…ノイズ
SG11,SG12,SG21,SG22…取りたい信号(抽出したい信号)
SG13,SG23…取り逃した信号(抽出し損ねた信号)
W…重み
T…閾値
図1
図2
図3A
図3B
図4A
図4B
図5A
図5B
図6A
図6B
図7A
図7B
図8A
図8B
図8C
図9
図10A
図10B
図11A
図11B
図11C
図12A
図12B
図12C
図13
図14A
図14B
図14C
図15A
図15B
図16
図17
図18
図19A
図19B
図19C
図20
図21
図22A
図22B
図22C
図22D
図23A
図23B
図23C
図23D
図23E
図24
図25
図26
図27
図28
図29
図30