(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-23
(45)【発行日】2025-01-07
(54)【発明の名称】写像の学習方法
(51)【国際特許分類】
G01H 17/00 20060101AFI20241224BHJP
G01M 17/007 20060101ALI20241224BHJP
【FI】
G01H17/00 Z
G01M17/007 Z
(21)【出願番号】P 2022103603
(22)【出願日】2022-06-28
【審査請求日】2024-01-25
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100105957
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】竹内 伸一
(72)【発明者】
【氏名】田端 淳
(72)【発明者】
【氏名】則竹 真吾
(72)【発明者】
【氏名】村上 亮
(72)【発明者】
【氏名】柳川 涼
【審査官】福田 裕司
(56)【参考文献】
【文献】特開2021-181945(JP,A)
【文献】国際公開第2020/026829(WO,A1)
【文献】特開2022-020940(JP,A)
【文献】特開2021-154816(JP,A)
【文献】特開2022-061072(JP,A)
【文献】特開2022-036594(JP,A)
【文献】特開2021-113001(JP,A)
【文献】特開2021-056677(JP,A)
【文献】特開2005-156334(JP,A)
【文献】特開平04-295900(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01H 17/00
G01M 17/007
(57)【特許請求の範囲】
【請求項1】
マイクが感知した音に関する信号である音信号を基に車両での音の発生要因を推定するために用いる写像の学習方法であって、
前記写像は、前記音信号が入力変数として入力されると、前記車両での音の発生要因を示す変数を出力する学習モデルであり、
前記音信号に対してノイズ信号を重畳することにより、当該音信号を補正する信号補正処理と、
前記信号補正処理で補正した前記音信号を訓練データとするとともに、当該音信号と組となっている音の発生要因を教師データとする機械学習によって、前記写像を更新する更新処理と、を学習装置に実行させ
、
前記信号補正処理は、前記音信号のうちの第1周波数域の部分に重畳するノイズの振幅が、前記音信号のうちの前記第1周波数域よりも高周波な第2周波数域の部分に重畳するノイズの振幅よりも大きくなるように、当該音信号を補正する処理である
写像の学習方法。
【請求項2】
前記信号補正処理は、前記音信号のうちの前記第1周波数域の部分に、振幅の異なる複数のノイズを重畳する処理であり、
前記音信号のうちの前記第1周波数域の部分に重畳する複数のノイズの振幅の平均値は、前記音信号のうちの前記第2周波数域の部分に重畳するノイズの振幅の平均値よりも大きい
請求項1に記載の写像の学習方法。
【請求項3】
前記信号補正処理は、前記音信号のうちの前記第2周波数域の部分に、振幅の異なる複数のノイズを重畳する処理である
請求項2に記載の写像の学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、写像データによって規定される写像の学習方法に関する。
【背景技術】
【0002】
機械学習の施された写像を用いて音の発生要因を推定する方法が知られている。当該方法では、マイクが感知した音に関する信号である音信号を入力変数として写像に入力すると、写像から出力変数が出力される。そして、当該出力変数に基づいて音の発生要因が推定される。
【0003】
特許文献1には、マイクが感知した音に関する音信号からノイズを除去する方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
走行中の車両の車室にマイクを設置し、当該マイクが感知した音の発生要因を推定する場合を考える。この場合、マイクが感知した音に関する音信号には様々なノイズが重畳してしまう。そのため、上記特許文献1に開示されているような方法で音信号に対してノイズの除去処理を施したとしても、当該音信号からノイズを安定的に除去するのは困難である。したがって、ノイズの除去処理を施した後の音信号を入力変数として上記の写像に入力した際における当該写像の出力変数に基づいて音の発生要因を推定した場合、その精度がばらつきやすい。
【課題を解決するための手段】
【0006】
上記課題を解決するための写像の学習方法は、マイクが感知した音に関する信号である音信号を基に車両での音の発生要因を推定するために用いる方法である。前記写像は、前記音信号が入力変数として入力されると、前記車両での音の発生要因を示す変数を出力する学習モデルである。当該学習方法は、前記音信号に対してノイズ信号を重畳することにより、当該音信号を補正する信号補正処理と、前記信号補正処理で補正した前記音信号を訓練データとするとともに、当該音信号と組となっている音の発生要因を教師データとする機械学習によって、前記写像を更新する更新処理と、を学習装置に実行させる。
【0007】
マイクが感知した音に関する音信号を写像に入力することによって当該写像から出力された要因変数に基づいて、音の発生要因を推定する場合を考える。この場合、マイクが感知した音には暗騒音が含まれていることがある。すなわち、暗騒音の成分をも含む音信号が写像に入力されることがある。
【0008】
この点、上記の学習方法では、意図的にノイズ信号を重畳した音信号を訓練データとする機械学習を行うことによって写像が更新される。すなわち、訓練データとして用いる音信号は、上記の暗騒音の成分に相当する信号も含んでいる。
【0009】
そのため、このような機械学習を施した写像に対してマイクが感知した音に関する音信号を入力した際の当該写像の出力変数に基づいて音の発生要因を推定する場合、マイクによって感知された暗騒音の影響によって音の発生要因の推定精度がばらつきにくくなる。したがって、上記の学習方法は、マイクが感知した音に暗騒音が含まれていたとしても音の発生要因の推定精度がばらつきにくい写像を生成できる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施形態にかかるシステムの構成を示すブロック図である。
【
図2】
図2において、(A)は車両制御装置で実行される一連の処理の流れを示すフローチャートであり、(B)は携帯端末で実行される一連の処理の流れを示すフローチャートである。
【
図3】
図3は、携帯端末のマイクが感知した音に関する音信号の一例を示す図である。
【
図4】
図4は、センター制御装置で実行される一連の処理の流れを示すフローチャートである。
【
図5】
図5は、写像に機械学習を施す学習装置の構成を示すブロック図である。
【
図6】
図6は、学習方法の一実施形態を示すフローチャートである。
【
図7】
図7は、ノイズ信号の振幅を定めるマップを示す図である。
【
図8】
図8において、(A)は補正前の音信号を示す図であり、(B)はノイズ信号を示す図であり、(C)は補正した音信号を示す図である。
【
図9】
図9は、写像を用いた異音の発生要因の推定結果が正しいか否かを検証するための処理の流れを示すフローチャートである。
【
図10】
図10は、ノイズ信号の振幅を定めるマップの変更例を示す図である。
【発明を実施するための形態】
【0011】
以下、写像の学習方法の一実施形態を
図1~
図9に従って説明する。
図1は、車両10と、車両10の乗員が所有する携帯端末30と、車両10の外部に設置されているデータ解析センター60とを含むシステムを図示している。
【0012】
<車両>
車両10は、検出系11と、通信機13と、車両制御装置15とを備えている。
検出系11は、N個のセンサ111,112,113,…,11Nを有している。「N」は4以上の整数である。複数のセンサ111~11Nは、検出結果に応じた信号を車両制御装置15に出力する。複数のセンサ111~11Nは、車速や加速度などの車両状態量を検出するセンサ、及びアクセル操作量やブレーキ操作量などの乗員の操作量を検出するセンサを含んでいる。また、複数のセンサ111~11Nは、エンジンや電気モータなどの車両10の駆動装置の動作状態を検出するセンサ、及び冷却水の温度や油温を検出するセンサを含んでいてもよい。
【0013】
通信機13は、車両10の車室内に持ち込まれた携帯端末30と通信を行う。通信機13は、携帯端末30から受信した情報を車両制御装置15に出力したり、車両制御装置15から出力された情報を携帯端末30に送信したりする。
【0014】
車両制御装置15は、複数のセンサ111~11Nの出力信号を基に車両10を制御する。すなわち、車両制御装置15は、車両10の駆動装置、制動装置及び転舵装置などを作動させることにより、車両10の走行速度、加速度及びヨーレートなどを制御する。
【0015】
車両制御装置15は、CPU16と第1記憶装置17と第2記憶装置18とを有している。第1記憶装置17は、CPU16によって実行される各種の制御プログラムを記憶している。また、第1記憶装置17は、車両10の車種及びグレードなどに関する情報である車種情報も記憶している。第2記憶装置18には、CPU16の演算結果などが記憶される。
【0016】
<携帯端末>
携帯端末30は、例えば、スマートフォン及びタブレット端末である。携帯端末30は、タッチパネル31と、表示画面33と、マイク35と、通信機37と、端末制御装置39とを備えている。タッチパネル31は、表示画面33と重ねて配置されたユーザーインターフェースである。携帯端末30が車室に持ち込まれた場合、マイク35は車室に伝わった音を感知できる。
【0017】
通信機37は、車両10の車室内に位置する場合に車両10と通信する機能を有している。通信機37は、車両制御装置15から受信した情報を端末制御装置39に出力したり、端末制御装置39が出力した情報を車両制御装置15に送信したりする。
【0018】
また、通信機37は、グローバルネットワーク100を介して他の携帯端末30及びデータ解析センター60と通信する機能を有している。通信機37は、他の携帯端末30又はデータ解析センター60から受信した情報を端末制御装置39に出力したり、端末制御装置39が出力した情報を他の携帯端末30又はデータ解析センター60に送信したりする。
【0019】
端末制御装置39は、CPU41と第1記憶装置42と第2記憶装置43とを有している。第1記憶装置42は、CPU41によって実行される各種の制御プログラムを記憶している。第2記憶装置43には、CPU41の演算結果などが記憶される。
【0020】
<データ解析センター>
データ解析センター60は、マイク35が感知した音の発生要因を推定する。車両10で異音が発生する要因がM個あるとする。「M」は2以上の整数である。このとき、データ解析センター60は、M個の要因の候補の中から1つの要因を選択する。
【0021】
データ解析センター60は、通信機61とセンター制御装置63とを備えている。
通信機61は、グローバルネットワーク100を介して複数の携帯端末30と通信する機能を有している。通信機61は、携帯端末30から受信した情報をセンター制御装置63に出力したり、センター制御装置63が出力した情報を携帯端末30に送信したりする。
【0022】
センター制御装置63は、CPU64と第1記憶装置65と第2記憶装置66とを有している。第1記憶装置65は、CPU64によって実行される各種の制御プログラムを記憶している。
【0023】
第2記憶装置66は、機械学習が施された写像を規定する写像データ71を記憶している。写像は、入力変数が入力されると、車両10での音の発生要因を特定する変数を出力する学習済モデルである。写像の一例は、関数近似器である。例えば、写像は、中間層が1層である全結合順伝搬型のニューラルネットワークである。
【0024】
写像の出力変数yについて説明する。上述したように車両10には、M個の異音の発生要因の候補が存在する。そのため、入力変数が写像に入力されると、M個の出力変数y(1),y(2),…,y(M)が写像から出力される。実際の発生要因を実要因としたとき、出力変数y(1)は、M個の発生要因の候補のうちの第1発生要因の候補が実要因である確率を示す値である。出力変数y(2)は、M個の発生要因の候補のうちの第2発生要因の候補が実要因である確率を示す値である。出力変数y(M)は、M個の発生要因の候補のうちの第M発生要因の候補が実要因である確率を示す値である。
【0025】
第2記憶装置66は、要因特定データ72を記憶している。要因特定データ72は、写像の出力変数yを基に、車両10での音の発生要因を推定するためのデータである。要因特定データ72にはM個の発生要因の候補が記憶されている。M個の発生要因の候補のうち、第1発生要因の候補は出力変数y(1)に対応している。M個の候補のうち、第2発生要因の候補は出力変数y(2)に対応している。M個の候補のうち、第M発生要因の候補は出力変数y(M)に対応している。
【0026】
<異音の発生要因特定方法>
図2~
図4を参照し、発生要因特定方法を説明する。
図2(A)は、車両制御装置15のCPU16が実行する処理の流れを図示している。第1記憶装置17に記憶されている制御プログラムをCPU16が実行することにより、
図2(A)に示した一連の処理が繰り返し実行される。
【0027】
図2(A)に示す一連の処理においてステップS11では、CPU16は、携帯端末30との同期が確立しているか否かを判定する。CPU16は、同期が確立していると判定した場合(S11:YES)、処理をステップS13に移行する。一方、CPU16は、同期が確立していないと判定した場合(S11:NO)、一連の処理を一旦終了する。
【0028】
ステップS13において、CPU16は、車両10の車種情報を携帯端末30に送信済みであるか否かを判定する。CPU16は、車種情報を携帯端末30に送信済みである場合(S13:YES)、処理をステップS17に移行する。一方、CPU16は、車種情報を未だ携帯端末30に送信していない場合(S13:NO)、処理をステップS15に移行する。ステップS15において、CPU16は、車種情報を通信機13から携帯端末30に送信させる。その後、CPU16は処理をステップS17に移行する。
【0029】
ステップS17において、CPU16は、車両10の状態変数を取得する。具体的には、CPU16は、各種のセンサ111~11Nの検出値、及び、当該検出値を加工した値である加工値を、状態変数として取得する。例えば、CPU16は、車両10の走行速度SPD、車両10の加速度G、エンジン回転数NE及びエンジントルクTrqなどを取得する。
【0030】
ステップS19において、CPU16は、取得した車両10の状態変数を通信機13から携帯端末30に送信させる。その後、CPU16は一連の処理を一旦終了する。
図2(B)は、端末制御装置39のCPU41が実行する処理の流れを図示している。第1記憶装置42に記憶されている制御プログラムをCPU41が実行することにより、
図2(B)に示した一連の処理が繰り返し実行される。
【0031】
図2(B)に示す一連の処理においてステップS31では、CPU41は、車両制御装置15との同期が確立しているか否かを判定する。CPU41は、同期が確立していると判定した場合(S31:YES)、処理をステップS33に移行する。一方、CPU41は、同期が確立していないと判定した場合(S31:NO)、一連の処理を一旦終了する。
【0032】
ステップS33において、CPU41は、車両制御装置15から送信された車種情報を取得する。ステップS35において、CPU41はマイク35による録音を開始させる。ステップS37において、CPU41は、車両制御装置15から送信された車両10の状態変数の取得を開始する。
【0033】
ステップS39において、CPU41は、車両10で発生した異音を車両10の乗員が感知したことを示す合図があるか否かを判定する。例えば、乗員が、予め定めた所定操作を携帯端末30で行った場合は、当該合図があると見なす。反対に、乗員が当該所定操作を携帯端末30で行っていない場合は、当該合図がないと見なす。CPU41は、当該合図があると判定した場合(S39:YES)、処理をステップS41に移行する。一方、CPU41は、当該合図がないと判定した場合(S39:NO)、合図があると判定するまでステップS39の判定を繰り返し実行する。
【0034】
ここで、
図3は、車両10で発生した異音の一例を図示している。
図3に示すような異音が発生した場合、車両10の乗員が、当該異音に対して不快に感じることがある。このよう場合、乗員が、携帯端末30で所定操作を行うことがある。なお、マイク35が感知した異音には、
図3に破線で示すような暗騒音が重畳されている。ここでいう暗騒音は、ロードノイズ及び風切り音などを含んでいる。
【0035】
図2(B)に戻り、ステップS41において、CPU41は、マイク35が感知した音に関する信号である音信号、及び車両制御装置15から取得した車両10の状態変数の記憶を開始する。この際、CPU41は、音信号と状態変数とを紐付けて第2記憶装置43に記憶させる。ステップS43において、CPU41は、上記合図があると判定した時点から所定時間が経過したか否かを判定する。CPU41は、当該時点からの経過時間が所定時間に達していない場合、所定時間が経過していないと判定し(S43:NO)、処理をステップS41に戻す。すなわち、CPU41は、音信号と状態変数とを第2記憶装置43に記憶させる処理を継続する。一方、CPU41は、当該時点からの経過時間が所定時間に達した場合、所定時間が経過したと判定し(S43:YES)、処理をステップS45に移行する。
【0036】
ステップS45において、CPU41は送信処理を実行する。すなわち、CPU41は、送信処理において、第2記憶装置43に記憶した音信号の時系列データ及び車両10の状態変数の時系列データを、通信機37からデータ解析センター60に送信させる。また、CPU41は、送信処理において、ステップS33で取得した車種情報を、通信機37からデータ解析センター60に送信させる。そして、CPU41は、送信を完了すると、一連の処理を一旦終了する。
【0037】
図4は、センター制御装置63のCPU64が実行する処理の流れを図示している。第1記憶装置65に記憶されている制御プログラムをCPU64が実行することにより、
図4に示した一連の処理が繰り返し実行される。
【0038】
一連の処理においてステップS61では、CPU64は、上記ステップS45で携帯端末30がデータ解析センター60に送信したデータを通信機61が受信したか否かを判定する。CPU64は、データを通信機61が受信した場合(S61:YES)、処理をステップS63に移動する。一方、CPU64は、データを通信機61が受信していない場合(S61:NO)、一連の処理を一旦終了する。
【0039】
ステップS63において、CPU64は、通信機61が受信した車両10の車種情報を取得する。ステップS65において、CPU64は、通信機61が受信した音信号の時系列データ及び車両10の状態変数の時系列データを取得する。
【0040】
ステップS67において、CPU64は、ステップS65で取得した音信号の時系列データ及び車両10の状態変数の時系列データを入力変数xとして写像に入力する。そしてステップS69において、CPU64は、写像から出力された出力変数yを取得する。
【0041】
ステップS71において、CPU64は、ステップS69で取得した出力変数yを基に、マイク35が感知した音の発生要因を推定する。具体的には、CPU64は、M個の出力変数y(1),y(2),…,y(M)の中から、最も大きい値の出力変数を選択する。そして、CPU64は、要因特定データ72を用いることにより、選択した出力変数に応じた発生要因の候補を実候補として推定する。
【0042】
ステップS73において、CPU64は、推定した音の発生要因に関する情報を通信機61から携帯端末30に送信させる。その後、CPU64は一連の処理を一旦終了する。
なお、端末制御装置39のCPU41は、データ解析センター60が送信した音の発生要因に関する情報を取得すると、当該情報が示す音の発生要因を乗員に通知する。例えば、CPU41は発生要因を表示画面33に表示する。
【0043】
<写像の学習方法>
図5を参照し、写像に機械学習を施す学習装置80について説明する。
学習装置80には、マイク35Aが感知した音に関する信号である音信号が入力される。また、学習装置80には、学習用検出系11Aから検出信号が入力される。学習用検出系11Aを構成するセンサは、車両10の検出系11を構成するセンサと同じである。
【0044】
学習装置80は、CPU81と第1記憶装置82と第2記憶装置83とを備えている。第1記憶装置82は、CPU81によって実行される制御プログラムを記憶している。第2記憶装置83には、写像を規定する写像データ71aと、要因特定データ72とが記憶されている。写像データ71aによって規定される写像は、機械学習が完了していない学習モデルである。
【0045】
学習装置80は、写像の機械学習に先立って、訓練データと教師データとからなるL個のデータ対を取得する。訓練データは、マイク35Aが感知した音に関する音信号の時系列データと、車両10の状態変数の時系列データとを含んでいる。教師データは、マイク35Aが感知した異音の発生要因を含んでいる。
【0046】
なお、マイク35Aが感知した音に関する音信号の一例が
図8(A)に図示されている。
図8(A)に示すように、マイク35Aが感知した音に関する音信号には、暗騒音が重畳されていない。すなわち、マイク35Aが暗騒音を感知しないような状況下でマイク35Aによる音の感知が行われる。
【0047】
図6を参照し、写像に機械学習を施すために学習装置80が実行する処理の流れを説明する。すなわち、本実施形態における写像の学習方法は、
図6に示す一連の処理を学習装置80のCPU81に実行させることを含んでいる。なお、第1記憶装置82に記憶されている制御プログラムをCPU81が実行することにより、当該一連の処理が繰り返し実行される。
【0048】
図6に示すように、一連の処理においてステップS91では、CPU81は、事前に用意したL個のデータ対のうちの1つのデータ対を構成する音信号の時系列データ及び状態変数の時系列データを取得する。ステップS93において、CPU81は、ステップS91で取得した音信号の時系列データ及び状態変数の時系列データと組となっている異音の発生要因を取得する。
【0049】
ステップS95において、CPU81は、ステップS91で取得した音信号の時系列データを補正する。すなわち、CPU81は、音信号に対してノイズ信号を重畳することにより、音信号を補正する。したがって、ステップS95が「信号補正処理」に対応する。なお、信号補正処理については後述する。
【0050】
CPU81は、音信号の補正を完了すると、処理をステップS97に移行する。ステップS97において、CPU81は、ステップS95で補正した音信号の時系列データ及びステップS91で取得した状態変数の時系列データを入力変数xとして写像に入力する。そしてステップS99において、CPU81は、写像から出力された出力変数yを取得する。
【0051】
ステップS101において、CPU81は、ステップS99で取得した出力変数yと、ステップS93で取得した異音の発生要因とを用いて写像を更新する。ここでは、ステップS93で教師データとして取得した異音の発生要因を「学習用要因」というものとする。例えば、CPU81は、M個の出力変数y(1),y(2),…,y(M)の中から、最も大きい値の出力変数を選択する。CPU81は、要因特定データ72を用いることにより、選択した出力変数に応じた発生要因の候補を選択する。CPU81は、選択した候補が学習用要因と相違している場合、出力変数y(1)~y(M)のうち、学習用要因に対応する出力変数が大きくなるように、写像の関数近似器における各種の変数を調整する。例えば学習用要因が第1発生要因の候補である場合、CPU81は、出力変数y(1)~y(M)の中で出力変数y(1)が最も大きくなるように写像の関数近似器における各種の変数を調整する。本実施形態では、ステップS97~S101が、信号補正処理で補正した音信号を訓練データとするとともに、当該音信号と組となっている異音の発生要因を教師データとする機械学習によって、写像を更新する「更新処理」に対応する。
【0052】
写像を更新すると、CPU81は、一連の処理を一旦終了する。本実施形態では、CPU81は、写像の更新に用いるデータ対を変更して一連の処理を再び実行する。つまり、CPU81は、一連の処理をL回だけ実行する。
【0053】
図7及び
図8を参照し、信号補正処理について説明する。
図7は、音信号に重畳するノイズ信号の振幅を定めるマップMPの一例を図示している。
図8(A)は、補正を行う前の音信号である生音信号を示す。
図8(B)は、生音信号に重畳するノイズ信号の一例を示す。
図8(C)は、補正した音信号である補正後音信号を示す。
【0054】
CPU81は、マップMPを用い、ノイズ信号の振幅を設定する。CPU81は、周波数によってノイズ信号の振幅を変える。具体的には、CPU81は、ノイズ信号のうち、周波数が規定周波数FqA以下の部分の振幅を、ノイズ信号のうち、周波数が規定周波数FqAよりも高い部分の振幅よりも大きくする。なお、本実施形態では、規定周波数FqA以下の周波数領域が「第1周波数域」に対応し、規定周波数FqAよりも高い周波数領域が「第2周波数域」に対応する。この場合、音信号のうちの第1周波数域の部分に重畳するノイズの振幅が、音信号のうちの第2周波数域の部分に重畳するノイズの振幅よりも大きくなる。
【0055】
さらに、CPU81は、音信号のうちの第1周波数域の部分に、振幅の異なる複数のノイズを重畳する。マップMPで設定されている第1周波数域でのノイズ信号の振幅を「第1振幅AM1」とする。このとき、
図8(B)に示すように、CPU81は、第1振幅AM1を超えない範囲でノイズ信号の振幅を変える。例えば、CPU81は、第1周期のノイズ信号の振幅が、第1周期の次の周期である第2周期のノイズ信号の振幅と相違するようにノイズ信号の振幅をランダムに変える。
【0056】
同様に、CPU81は、音信号のうちの第2周波数域の部分にも、振幅の異なる複数のノイズを重畳する。マップMPで設定されている第2周波数域でのノイズ信号の振幅を「第2振幅AM2」とする。このとき、
図8(B)に示すように、CPU81は、第2振幅AM2を超えない範囲でノイズ信号の振幅を変える。例えば、CPU81は、第3周期のノイズ信号の振幅が、第3周期の次の周期である第4周期のノイズ信号の振幅と相違するようにノイズ信号の振幅をランダムに変える。
【0057】
ただし、CPU81は、音信号のうちの第1周波数域の部分に重畳する複数のノイズの振幅の平均値が、音信号のうちの第2周波数域の部分に重畳するノイズの振幅の平均値よりも大きくなるように、ノイズ信号を生成する。
【0058】
そして、CPU81は、
図8(A)に示す生音信号に対して
図8(B)に示すノイズ信号を重畳することにより、
図8(C)に示すような補正後音信号を生成する。
なお、生音信号のピーク値が比較的小さいと、ノイズ信号を生音信号に重畳した際に、実際の異音のピーク値が、ノイズ信号に埋もれてしまうおそれがある。そこで、CPU81は、生音信号のピーク値の大きさに応じてノイズ信号の振幅を補正することが好ましい。これにより、実際の異音のピーク値がノイズ信号に埋もれることを抑制できる。
【0059】
<写像の評価方法>
図9を参照し、上記の学習方法で機械学習が施された写像の評価方法について説明する。
【0060】
はじめのステップS121では、上記のステップS95で補正した音信号である補正後音信号が示す音を再生する。次のステップS123では、再生した音を作業者が確認できたか否かを判定する。再生した音を作業者が確認できた場合(S123:YES)、処理がステップS125に移行される。一方、再生した音を作業者が確認できない場合(S123:NO)、処理がステップS121に戻る。すなわち、作業者が音を確認できるまで、音の再生が繰り返される。
【0061】
ステップS125では、生音信号から、写像から出力された出力変数yに基づいて推定した異音の発生要因に対応する音の成分を削除する。このように生成した音信号を「削除済み音信号」という。
【0062】
ステップS127では、削除済み音信号が示す音を再生する。
ステップS129では、再生した音から異音が消えたか否かを作業者に判定させる。そして、再生した音から異音が消えていると作業者が判定した場合(S129:YES)、処理がステップS131に移行される。一方、再生した音から異音が消えていないと作業者が判定した場合(S129:NO)、処理がステップS133に移行される。
【0063】
ステップS131において、異音の発生要因が確定される。この場合、異音の発生要因の推定結果が正しい。
ステップS133において、異音の発生要因が半確定される。この場合、異音の発生要因の推定結果が正しくない。そのため、
図7に示したマップMPを修正した上で、
図6を用いて説明した写像の機械学習を再度行うことが好ましい。ここでいうマップMPの修正は、規定周波数FqAを変更すること、第1振幅AM1及び第2振幅AM2のうち少なくとも一方の大きさを変更することを含んでいる。
【0064】
<本実施形態の作用及び効果>
(1)車両10の車室に配置されたマイク35は、車両10で発生した異音に加え、暗騒音も感知してしまう。そのため、車両10で発生した異音の発生要因を推定する際には、暗騒音の成分も含む音信号が写像に入力されることになる。
【0065】
そこで、本実施形態では、マイク35Aが感知した音に関する音信号である生音信号に対して意図的にノイズ信号を重畳することによって、
図8(C)に示したような補正後音信号が生成される。そして、写像の機械学習時には、補正後音信号が入力変数xとして写像に入力される。すなわち、訓練データとして用いる音信号は、上記の暗騒音の成分に相当する信号成分を含んでいる。
【0066】
そのため、このような機械学習を施した写像に対してマイク35が感知した音に関する音信号を入力した際の当該写像の出力変数yに基づいて音の発生要因を推定する場合、音の発生要因の推定精度が暗騒音の影響によってばらつきにくい。したがって、マイク35が感知した音に暗騒音が含まれていたとしても音の発生要因の推定精度がばらつきにくい写像を生成できる。
【0067】
(2)本件発明者は、
図3に示したように、マイク35が感知する暗騒音の音圧レベルは、低周波数の領域ほど大きくなりやすいという知見を得た。そこで、本実施形態では、生音信号に重畳するノイズ信号では、低周波数の領域の部分の振幅を、高周波数の領域の部分の振幅よりも大きくしている。そのため、信号補正処理によって補正した音信号の周波数特性を、車両10の車室に配置されたマイク35が感知した音に関する音信号の周波数特性に近づけることができる。そのため、信号補正処理によって補正した音信号である補正後音信号を用いて写像を更新することにより、音の発生要因の推定精度がばらつきにくい写像を生成できる。
【0068】
(3)センター制御装置63には、上記のような学習方法で生成された写像を規定する写像データ71が記憶されている。そして、こうした写像に対してマイク35が感知した音に関する音信号が入力変数xとして入力されると、当該写像の出力変数yに基づいて異音の発生要因が推定される。入力変数xとして写像に入力された音信号に、暗騒音の成分が含まれていたとしても、異音の発生要因を精度良く推定できる。
【0069】
<変更例>
上記実施形態は、以下のように変更して実施することができる。上記実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
【0070】
・信号補正処理では、
図7に示したマップMPとは異なるマップを用いることにより、ノイズ信号の振幅を設定するようにしてもよい。例えば、信号補正処理において、CPU81は、
図10に実線で示すマップMP1を用いてノイズ信号の振幅を設定してもよいし、
図10に一点鎖線で示すマップMP2を用いてノイズ信号の振幅を設定してもよい。この場合、CPU81は、周波数が高くなるにつれて徐々に振幅が小さくなるようなノイズ信号を生成できる。この場合でも、音信号のうちの第1周波数域の部分に重畳するノイズ信号の振幅を、音信号のうちの第2周波数域の部分に重畳するノイズ信号の振幅よりも大きくすることが好ましい。
【0071】
また例えば、CPU81は、
図10に破線で示すマップMP3を用いてノイズ信号の振幅を設定してもよい。この場合、CPU81は、周波数の高低によらず、振幅が同じとなるノイズ信号を生成できる。
【0072】
また例えば、CPU81は、
図10に二点鎖線で示すマップMP4を用いてノイズ信号の振幅を設定してもよい。
・上記実施形態では、音信号のうちの第1周波数域の部分に、振幅の異なる複数のノイズを重畳しているが、これに限らない。例えば、音信号のうちの第1周波数域の部分に重畳するノイズ信号の振幅は一定であってもよい。
【0073】
・上記実施形態では、音信号のうちの第2周波数域の部分に、振幅の異なる複数のノイズを重畳しているが、これに限らない。例えば、音信号のうちの第2周波数域の部分に重畳するノイズ信号の振幅は一定であってもよい。
【0074】
・ニューラルネットワークは、中間層が1層のフィードフォワードネットワークに限らない。例えば、ニューラルネットワークは、中間層が2層以上のネットワークであってもよいし、畳み込みニューラルネットワークやリカレントニューラルネットワークであってもよい。
【0075】
・機械学習による学習済みモデルは、ニューラルネットワークでなくてもよい。例えば、学習済みモデルとして、サポートベクトルマシンを採用してもよい。
・学習装置80は、CPUとROMとを備えて、ソフトウェア処理を実行するものに限らない。すなわち、学習装置80は、以下(a)~(c)の何れかの構成であればよい。
【0076】
(a)学習装置80は、コンピュータプログラムに従って各種処理を実行する一つ以上のプロセッサを備えている。プロセッサは、CPU並びに、RAM及びROMなどのメモリを含んでいる。メモリは、処理をCPUに実行させるように構成されたプログラムコード又は指令を格納している。メモリ、すなわちコンピュータ可読媒体は、汎用又は専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含んでいる。
【0077】
(b)学習装置80は、各種処理を実行する一つ以上の専用のハードウェア回路を備えている。専用のハードウェア回路としては、例えば、特定用途向け集積回路、すなわちASIC又はFPGAを挙げることができる。なお、ASICは、「Application Specific Integrated Circuit」の略記であり、FPGAは、「Field Programmable Gate Array」の略記である。
【0078】
(c)学習装置80は、各種処理の一部をコンピュータプログラムに従って実行するプロセッサと、各種処理のうちの残りの処理を実行する専用のハードウェア回路とを備えている。
【0079】
<技術的思想>
次に、上記複数の実施形態及び複数の変更例から把握できる技術的思想を付記として記載する。
【0080】
[付記1]マイクが感知した音に関する信号である音信号を基に車両での音の発生要因を推定するために用いる写像の学習方法であって、
前記写像は、前記音信号が入力変数として入力されると、前記車両での音の発生要因を示す変数を出力する学習モデルであり、
前記音信号に対してノイズ信号を重畳することにより、当該音信号を補正する信号補正処理と、
前記信号補正処理で補正した前記音信号を訓練データとするとともに、当該音信号と組となっている音の発生要因を教師データとする機械学習によって、前記写像を更新する更新処理と、を学習装置に実行させる、写像の学習方法。
【0081】
[付記2]前記信号補正処理は、前記音信号のうちの第1周波数域の部分に重畳するノイズ信号の振幅が、前記音信号のうちの第2周波数域の部分に重畳するノイズ信号の振幅とは異なるように、当該音信号を補正する処理である、付記1に記載の写像の学習方法。
【0082】
[付記3]前記第1周波数域は、前記第2周波数域よりも周波数の低い領域であり、
前記信号補正処理は、前記音信号のうちの前記第1周波数域の部分に重畳するノイズの振幅が、前記音信号のうちの前記第2周波数域の部分に重畳するノイズの振幅よりも大きくなるように、当該音信号を補正する処理である、付記2に記載の写像の学習方法。
【0083】
[付記4]前記信号補正処理は、前記音信号のうちの前記第1周波数域の部分に、振幅の異なる複数のノイズを重畳する処理であり、
前記音信号のうちの前記第1周波数域の部分に重畳する複数のノイズの振幅の平均値は、前記音信号のうちの前記第2周波数域の部分に重畳するノイズの振幅の平均値よりも大きい、付記2又は付記3に記載の写像の学習方法。
【0084】
[付記5]前記信号補正処理は、前記音信号のうちの前記第2周波数域の部分に、振幅の異なる複数のノイズを重畳する処理である、付記2~付記4のうち何れか一項に記載の写像の学習方法。
【符号の説明】
【0085】
10…車両
15…車両制御装置
30…携帯端末
35,35A…マイク
39…端末制御装置
60…データ解析センター
63…センター制御装置
80…学習装置
81…CPU
83…第2記憶装置