(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023039850
(43)【公開日】2023-03-22
(54)【発明の名称】音声処理システム、音声処理装置、及び音声処理方法
(51)【国際特許分類】
H04R 3/00 20060101AFI20230314BHJP
G10K 11/34 20060101ALI20230314BHJP
【FI】
H04R3/00 320
G10K11/34 130
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021147174
(22)【出願日】2021-09-09
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】番場 裕
(72)【発明者】
【氏名】山梨 智史
(72)【発明者】
【氏名】持木 南生也
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA02
5D220BA06
5D220BA30
5D220BC05
(57)【要約】
【課題】複数のマイクのうち一部が故障した場合でも、出力される信号の変化を小さくすることができる音声処理システム、音声処理装置及び音声処理方法を提供する。
【解決手段】本開示に係る音声処理装置は、第1音声を収音し、第1音声に対応する第1音声信号を出力する第1マイクと、第2音声を収音し、第2音声に対応する第2音声信号を出力する第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する故障検出部と、第1音声信号及び第2音声信号の少なくとも一方に基づいて第1出力信号を生成する信号生成部と、故障検出情報に基づいて、信号生成部を制御する制御部と、を備え、制御部は、故障検出情報が、第2マイクが故障しているという情報を含むとき、故障が検出されていない第1マイクが出力する第1音声信号に基づいて第1出力信号を生成する、第1モードで動作するように信号生成部を制御する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
第1音声を収音し、前記第1音声に対応する第1音声信号を出力する第1マイクと、
第2音声を収音し、前記第2音声に対応する第2音声信号を出力する第2マイクと、
前記第1マイクと前記第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する故障検出部と、
前記第1音声信号及び前記第2音声信号の少なくとも一方に基づいて第1出力信号を生成する信号生成部と、
前記故障検出情報に基づいて、前記信号生成部を制御する制御部と、を備え、
前記制御部は、前記故障検出情報が、前記第2マイクが故障しているという情報を含むとき、故障が検出されていない前記第1マイクが出力する前記第1音声信号に基づいて前記第1出力信号を生成する第1モードで動作するように前記信号生成部を制御する、
音声処理システム。
【請求項2】
前記制御部は、前記故障検出情報が、前記第1マイク及び前記第2マイクのいずれも故障していないという情報を含むとき、前記第1音声信号及び前記第2音声信号に基づいて前記第1出力信号を生成する、第2モードで動作するように前記信号生成部を制御する、
請求項1に記載の音声処理システム。
【請求項3】
前記信号生成部は、前記第1音声信号及び前記第2音声信号の少なくとも一方に基づく信号である減算信号を、前記第1音声信号から減算することにより前記第1出力信号を生成する、
請求項2に記載の音声処理システム。
【請求項4】
前記第1モードにおいて、前記減算信号は、前記第1音声信号に基づく信号であり、
前記第2モードにおいて、前記減算信号は、前記第2音声信号に基づく信号である、
請求項3に記載の音声処理システム。
【請求項5】
前記第1モードにおいて、前記信号生成部は、前記第1音声信号を第2遅延量だけ遅延させることにより前記減算信号を生成する、
前記第2モードにおいて、前記信号生成部は、前記第2音声信号を第1遅延量だけ遅延させることにより前記減算信号を生成し、
請求項3または請求項4に記載の音声処理システム。
【請求項6】
前記第2遅延量は、前記第1遅延量よりも大きい、
請求項5に記載の音声処理システム。
【請求項7】
前記第2遅延量は、前記第1遅延量の2倍である、
請求項5または6に記載の音声処理システム。
【請求項8】
前記信号生成部は、前記第1音声信号及び前記第2音声信号の少なくとも一方に基づいて第2出力信号を生成し、前記第1マイクに対応する信号として前記第1出力信号を出力し、前記第2マイクに対応する信号として前記第2出力信号を出力し、
前記制御部は、前記故障検出情報が、前記第2マイクが故障しているという情報を含むとき、前記第2出力信号を出力しないように前記信号生成部を制御する、
請求項1から請求項7のいずれか一項に記載の音声処理システム。
【請求項9】
前記故障検出部は、前記故障検出情報が、前記第1マイク及び前記第2マイクの少なくとも一方が故障しているという情報を含むとき、前記故障検出情報を通知機器に出力し、
前記通知機器は、前記第1マイク及び前記第2マイクの少なくとも一方が故障していることを通知する、
請求項1から請求項8のいずれか一項に記載の音声処理システム。
【請求項10】
第1音声を収音し、前記第1音声に対応する第1音声信号を出力する第1マイクと、第2音声を収音し、前記第2音声に対応する第2音声信号を出力する第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する故障検出部と、
前記第1音声信号及び前記第2音声信号の少なくとも一方に基づいて第1出力信号を生成する信号生成部と、
前記故障検出情報に基づいて、前記信号生成部を制御する制御部と、を備え、
前記制御部は、前記故障検出情報が、前記第2マイクが故障しているという情報を含むとき、故障が検出されていない前記第1マイクが出力する前記第1音声信号に基づいて前記第1出力信号を生成する、第1モードで動作するように前記信号生成部を制御する、
音声処理装置。
【請求項11】
音声処理装置で実行される音声処理方法であって、
第1音声を収音し、前記第1音声に対応する第1音声信号を出力する第1マイクと、第2音声を収音し、前記第2音声に対応する第2音声信号を出力する第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する故障検出ステップと、
前記第1音声信号及び前記第2音声信号の少なくとも一方に基づいて第1出力信号を生成する信号生成ステップと、
前記故障検出情報に基づいて、前記信号生成ステップを制御する制御ステップ部と、を含み、
前記故障検出情報が、前記第2マイクが故障しているという情報を含むとき、故障が検出されていない前記第1マイクが出力する前記第1音声信号に基づいて前記第1出力信号を生成する、第1モードで動作するように前記信号生成ステップを制御する、
音声処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音声処理システム、音声処理装置、及び音声処理方法に関する。
【背景技術】
【0002】
2つのマイクのペアを一組あるいは複数組用いることにより、特定の方向の音声を強調して集音する音声処理システムが知られている。
【0003】
このような音声処理システムに関し、集音するマイクが故障した場合、例えば特許文献1には、故障していない残りのマイクを用いて,故障前となるべく近い形になるように指向性合成を形成することができる構成が開示されている。また、特許文献2には、マイクの故障が検知された場合に,マイクロホンアレイの出力を遮断することができる構成が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009-152949号公報
【特許文献2】特開2009-278620号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
このような音声処理システムに対し、更なる改善が求められている。
【0006】
本開示は、複数のマイクのうち一部が故障した場合でも、出力される信号の変化を小さくすることができる音声処理システム、音声処理装置及び音声処理方法を提供する。
【課題を解決するための手段】
【0007】
本開示の一態様に係る音声処理システムは、第1音声を収音し、前記第1音声に対応する第1音声信号を出力する第1マイクと、第2音声を収音し、前記第2音声に対応する第2音声信号を出力する第2マイクと、前記第1マイクと前記第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する故障検出部と、前記第1音声信号及び前記第2音声信号の少なくとも一方に基づいて第1出力信号を生成する信号生成部と、前記故障検出情報に基づいて、前記信号生成部を制御する制御部と、を備え、前記制御部は、前記故障検出情報が、前記第2マイクが故障しているという情報を含むとき、故障が検出されていない前記第1マイクが出力する前記第1マイクが出力する前記第1音声信号に基づいて前記第1出力信号を生成する、第2モードで動作するように前記信号生成部を制御する。
【発明の効果】
【0008】
本開示の一態様に係る音声処理システムによれば、複数のマイクのうち一部が故障した場合でも、出力される信号の変化を小さくすることができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る音声処理システムの概略構成の一例を示す図である。
【
図2】
図2は、実施形態に係る音声処理装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、実施形態に係る音声処理装置が備える機能の一例を示すブロック図である。
【
図4】
図4は、実施形態に係る音声処理装置のBF処理部の構成の一例を示す図である。
【
図5】
図5は、実施形態に係る遅延量を説明する図である。
【
図6】
図6は、実施形態に係るBF処理部が出力する出力信号の周波数特性の一例を示すグラフである。
【
図7】
図7は、実施形態に係るBF処理部が出力する出力信号の群遅延特性の一例を示すグラフである。
【
図8】
図8は、実施形態に係る音声処理装置で実行される制御処理の流れの一例を示すフローチャートである。
【
図9】
図9は、実施形態に係る音声処理装置で実行される動作の一例を示すテーブルである。
【
図10】
図10は、比較例のBF処理部の構成の一例を示す図である。
【
図11】
図11は、比較例のBF処理部が出力する出力信号の周波数特性の一例を示すグラフである。
【
図12】
図12は、比較例のBF処理部が出力する出力信号の群遅延特性の一例を示すグラフである。
【発明を実施するための形態】
【0010】
以下、適宜図面を参照しながら、本開示の実施形態を詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0011】
(実施形態の概略構成)
図1は、本実施形態に係る音声処理システム5の概略構成の一例を示す図である。音声処理システム5は、例えば車両10に搭載される。以下、音声処理システム5が車両10に搭載される例について説明する。
【0012】
車両10の車室内には、複数の座席が設けられる。複数の座席は、例えば、運転席、助手席、及び左右の後部座席の4席である。なお、座席の数は、これに限られない。以降では、助手席に着座する者を乗員hm1、運転席に着座する者を乗員hm2、後部座席の左側に着座する者を乗員hm3、後部座席の右側に着座する者を乗員hm4と表記する。
【0013】
音声処理システム5は、マイクMC1、マイクMC2、マイクMC3、マイクMC4、及び音声処理装置20を有する。
図1に示す音声処理システム5は、座席の数と等しい数、つまり4つのマイクを有しているが、マイクの数は座席の数と等しくなくてもよい。マイクMC1、マイクMC2、マイクMC3、及びマイクMC4は、音声信号を音声処理装置20に出力する。
【0014】
マイクMC1とマイクMC2は、いずれも無指向性のマイクである。マイクMC1とマイクMC2は、両者が近接した状態で配置される。マイクMC1とマイクMC2は、例えば、オーバーヘッドコンソールにおける、運転席と助手席の中央位置に配置される。また、マイクMC1は乗員hm1側に、マイクMC2は乗員hm2側にそれぞれ配置される。
【0015】
マイクMC3とマイクMC4は、いずれも無指向性のマイクである。マイクMC3とマイクMC4は、両者が近接した状態で配置される。マイクMC3とマイクMC4は、例えば、天井における、左後部座席と右後部座席の中央位置に配置される。また、マイクMC3は乗員hm3側に、マイクMC4は乗員hm4側にそれぞれ配置される。
【0016】
また、
図1に示すマイクMC1、マイクMC2、マイクMC3、及びマイクMC4の配置位置は一例であって、他の位置に配置されてもよい。以下、マイクMC1を第1マイク、マイクMC2を第2マイク、マイクMC3を第3マイク、マイクMC4を第4マイクと呼ぶことがある。
【0017】
各マイクは、小型のMEMS(Micro Electro Mechanical Systems)マイクであってもよいし、ECM(Electret Condenser Microphone)であってもよい。
【0018】
図1に示す音声処理システム5は、音声処理装置20を備える。なお、
図1では、車両10に4人が乗車している場合を示したが、乗車する人数はこれに限られない。乗車人数は、車両10の最大乗車定員以下であればよい。例えば、車両10の最大乗車定員が6人である場合、乗車人数は6人であってもよく、5人以下であってもよい。
【0019】
(実施形態のハードウェア構成)
図2は、本実施形態に係る音声処理装置20のハードウェア構成の一例を示す図である。
図2に示す例では、音声処理装置20は、DSP(Digital Signal Processor)2001、RAM(Random Access Memory)2002、ROM(Read Only Memory)2003、及びI/O(Input/Output)インタフェース2004を備える。
【0020】
DSP2001は、コンピュータプログラムを実行可能なプロセッサである。なお、音声処理装置20が備えるプロセッサの種類はDSP2001に限定されない。例えば、音声処理装置20は、CPU(Central Processing Unit)であってもよいし、他のハードウェアであってもよい。また、音声処理装置20は、複数のプロセッサを備えていてもよい。
【0021】
RAM2002は、キャッシュまたはバッファなどとして使用される揮発性メモリである。なお、音声処理装置20が備える揮発性メモリの種類はRAM2002に限定されない。音声処理装置20は、RAM2002に代えてレジスタを備え得る。また、音声処理装置20は、複数の揮発性メモリを備えていてもよい。
【0022】
ROM2003は、コンピュータプログラムを含む各種情報を記憶する不揮発性メモリである。DSP2001は、特定のコンピュータプログラムをROM2003から読み出して実行することによって、音声処理装置20の機能を実現する。音声処理装置20の機能については後述する。なお、音声処理装置20が備える不揮発性メモリの種類はROM2003に限定されない。例えば、音声処理装置20は、ROM2003に代えてフラッシュメモリを備え得る。また、音声処理装置20は、複数の不揮発性メモリを備えていてもよい。
【0023】
I/Oインタフェース2004には、外部の装置が接続されるインタフェース装置である。ここでは、外部の装置は、例えば、マイクMC1や、マイクMC2や、マイクMC3や、マイクMC4等の装置である。また、音声処理装置20は、複数のI/Oインタフェース2004を備えていてもよい。
【0024】
このように、音声処理装置20は、コンピュータプログラムが格納されたメモリと当該コンピュータプログラムを実行可能なプロセッサとを備える。つまり、音声処理装置20は、コンピュータと見なされ得る。なお、音声処理装置20としての機能を実現するために要するコンピュータの数は1に限定されない。音声処理装置20としての機能は、2以上のコンピュータの協働によって実現されてもよい。
【0025】
(実施形態の機能構成)
図3は、本実施形態に係る音声処理装置20が備える機能の一例を示すブロック図である。音声処理装置20には、音声入力部220、BF(Beam Forming)処理部230、帯域分割部240、発話位置特定部250、CTC(Cross Talk Canceller)処理部260、及び帯域合成部270を備える。音声処理装置20には、マイクMC1、マイクMC2、マイクMC3、及びマイクMC4から音声信号が入力される。そして、音声処理装置20は、入力された音声信号を処理し、音声処理結果を出力する。
【0026】
マイクMC1は、第1音声を収音し、第1音声に対応する第1音声信号を出力する。具体的には、マイクMC1は、収音した音声を電気信号に変換することにより音声信号Aを生成する。そして、マイクMC1は、音声信号Aを音声入力部220に出力する。音声信号Aは、乗員hm1の音声と、乗員hm1以外の者の音声やオーディオ機器から発せられる音楽や走行騒音などのノイズと、を含む信号である。
【0027】
マイクMC2は、第2音声を収音し、第2音声に対応する第2音声信号を出力する。具体的には、マイクMC2は、収音した音声を電気信号に変換することにより音声信号Bを生成する。そして、マイクMC2は、音声信号Bを音声入力部220に出力する。音声信号Bは、乗員hm2の音声と、乗員hm2以外の者の音声やオーディオ機器から発せられる音楽や走行騒音などのノイズと、を含む信号である。
【0028】
マイクMC3は、第3音声を収音し、第3音声に対応する第3音声信号を出力する。具体的には、マイクMC3は、収音した音声を電気信号に変換することにより音声信号Cを生成する。そして、マイクMC3は、音声信号Cを音声入力部220に出力する。音声信号Cは、乗員hm3の音声と、乗員hm3以外の者の音声やオーディオ機器から発せられる音楽や走行騒音などのノイズと、を含む信号である。
【0029】
マイクMC4は、第4音声を収音し、第4音声に対応する第4音声信号を出力する。具体的には、マイクMC4は、収音した音声を電気信号に変換することにより音声信号Dを生成する。そして、マイクMC4は、音声信号Dを音声入力部220に出力する。音声信号Dは、乗員hm4の音声と、乗員hm4以外の者の音声やオーディオ機器から発せられる音楽や走行騒音などのノイズと、を含む信号である。
【0030】
音声入力部220は、マイクMC1、マイクMC2、マイクMC3、及びマイクMC4のそれぞれから音声信号が入力される。音声入力部220は、入力される音声信号がアナログ信号である場合、入力された音声信号をアナログ/デジタル変換を行った後、変換されたデジタル信号をBF処理部に出力する。音声入力部220は、入力部の一例である。なお、音声処理装置20に音声入力部220は必須ではない。
【0031】
BF処理部230は、指向性制御により、ターゲット席の方向の音声を強調する。ここで、マイクMC1から出力された第1音声信号のうち、助手席の方向の音声を強調する場合を例に説明する。マイクMC1及びマイクMC2は近傍に配置されている。そのため、マイクMC1から出力された第1音声信号には、助手席の乗員hm1及び運転席の乗員hm2の音声が含まれていることが想定される。同様に、マイクMC2から出力された第2音声信号には、助手席の乗員hm1及び運転席の乗員hm2の音声が含まれていることが想定される。
【0032】
マイクMC1は、運転席までの距離はマイクMC2よりもわずかに遠い。そのため、助手席の乗員hm1が発話した場合、マイクMC2から出力された第2音声信号に含まれる助手席の乗員hm1の音声は、マイクMC1から出力された第1音声信号に含まれる助手席の乗員hm1の音声よりもわずかに遅延している。
【0033】
よって、BF処理部230は、例えば音声信号に対して時間遅延を示す遅延量を適用することにより、ターゲット席の方向以外の方向に対して、感度が低くなる死角を形成することで、相対的にターゲット席の方向の音声を強調する。そして、BF処理部230は、ターゲット席の方向の音声を強調した音声信号を発話位置特定部250に出力する。但し、BF処理部230が、ターゲット席の方向の音声を強調する方法は上記に限定されない。
【0034】
帯域分割部240は、BF処理部230が出力した出力信号を、複数の周波数帯域の信号に分割する。具体的には、帯域分割部241は、BF処理部230が出力した音声信号Aに対応する出力信号を既定の所定の帯域ごとに分割する。帯域分割部242は、BF処理部230が出力した音声信号Bに対応する出力信号を既定の所定の帯域ごとに分割する。帯域分割部243は、BF処理部230が出力した音声信号Cに対応する出力信号を既定の所定の帯域ごとに分割する。帯域分割部244は、BF処理部230が出力した音声信号Dに対応する出力信号を既定の所定の帯域ごとに分割する。
【0035】
発話位置特定部250は、帯域分割部240が出力した出力信号に基づいて発話位置を特定する。具体的には、発話位置特定部250は、帯域分割部240が分割した帯域ごとに、最も強度の高い出力信号を検知し、それに基づいて発話位置を特定する。
【0036】
また、発話位置特定部250は、発話位置の特定結果に応じて、CTC処理部260に信号を出力する。例えば、CTC処理部260が適応フィルタを備える場合、発話位置特定部250は、発話位置の特定結果に応じて他の音声を抑圧する適応フィルタの係数を更新するように指示を出力する。発話位置特定部250は、それにより、適応フィルタの学習を制御する。
【0037】
CTC処理部260は、ターゲット席以外の方向から発せられた音声をキャンセルする。すなわち、CTC処理部260は、クロストークキャンセル処理を実行する。CTC処理部260には、全てのマイクからの音声信号が、BF処理部230による指向性制御処理を経て、帯域分割部240による帯域分割された出力信号が入力される。
【0038】
CTC処理部260は、入力された音声信号のうち、ターゲット席のマイク以外のマイクからの音声信号を参照信号として用いることによって、ターゲット席以外の方向から収音した音声成分をキャンセルする。すなわち、CTC処理部260は、ターゲット席のマイクに関連した音声信号から、参照信号により特定される音声成分をキャンセルする。そして、CTC処理部260は、クロストークキャンセル処理後の音声信号を出力する。
【0039】
帯域合成部270は、CTC処理部260によりクロストークキャンセル処理された後の音声を合成し、出力信号を出力する。
【0040】
具体的には、帯域合成部271は、CTC処理部260によってクロストーク成分が抑圧された、各帯域の音声信号を合成することで、クロストーク成分抑圧後の音声信号Aを合成する。帯域合成部271は、合成した音声信号Aを出力する。帯域合成部272は、CTC処理部260によってクロストーク成分が抑圧された、各帯域の音声信号を合成することで、クロストーク成分抑圧後の音声信号Bを合成する。帯域合成部272は、合成した音声信号Bを出力する。
【0041】
帯域合成部273は、CTC処理部260によってクロストーク成分が抑圧された、各帯域の音声信号を合成することで、クロストーク成分抑圧後の音声信号Cを合成する。帯域合成部273は、合成した音声信号Cを出力する。帯域合成部274は、CTC処理部260によってクロストーク成分が抑圧された、各帯域の音声信号を合成することで、クロストーク成分抑圧後の音声信号Dを合成する。帯域合成部271は、合成した音声信号Dを出力する。
【0042】
図4は本実施形態に係るBF処理部230の構成の一例を示す図である。BF処理部230は、故障検出部231、制御部232、加算器233、加算器234、EQ(Equalizer)処理部236、EQ処理部237、遅延量付加部2301、遅延量付加部2302、遅延量付加部2303、遅延量付加部2304、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を備える。
【0043】
また、加算器233、加算器234、EQ処理部236、EQ処理部237、遅延量付加部2301、遅延量付加部2302、遅延量付加部2303、遅延量付加部2304、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4、を含む構成を信号生成部238と呼ぶこともある。なお、
図4に示される例では、マイクMC1及びマイクMC2は車両10のオーバーヘッドコンソールに備えられる。また、
図4に示すマイクの形態はこれに限られず、車両10の後部座席付近の天井の中央にも適用できる。
【0044】
故障検出部231は、第1マイクと第2マイクの少なくとも一方における故障の有無を検出し、検出結果を故障検出情報として制御部232へ送信する。また、故障検出部231は、故障検出情報が、第1マイク及び第2マイクの少なくとも一方が故障しているという情報を含むとき、故障検出情報を通知機器40に出力する。例えば、故障検出部231は、マイクMC1と、マイクMC2の信号の特定周波数帯域レベルが設定される閾値を外れる場合に、マイクが故障していると検出する。
【0045】
制御部232は、故障検出部231が送信する故障検出情報に基づいて、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する。具体的には、制御部232は、故障検出情報が、第2マイクが故障しているという情報を含むとき、故障が検出されていない第1マイクが出力する第1音声信号に基づいて第1出力信号を生成する、第1モードで動作するようにスイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する。
【0046】
さらに、制御部232は、故障検出情報が第1マイク及び第2マイクのいずれも故障していないという情報を含むときは、第1音声信号及び第2音声信号に基づいて第1出力信号を生成する、第2モードで動作するようにスイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する。第1モードと第2モードの詳細な説明は後述する。
【0047】
また、制御部232は、故障検出情報が、第2マイクが故障しているという情報を含むとき、第2出力信号を出力しないようにスイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御してもよい。
【0048】
制御部232は、第2マイクが故障している場合は遅延量付加部2302が第1音声信号に遅延量を付加するように、スイッチSW1を切り替える。また、制御部232は、第1マイク、及び第2マイクのいずれも故障していない場合、すなわち第2モードである場合は遅延量付加部2301が第2音声信号に遅延量を付加するように、スイッチSW1を切り替える。
【0049】
さらに、制御部232は、第1マイクが故障している場合、遅延量付加部2301が第2音声信号に遅延量を付加する、あるいは、遅延量付加部2302が第1音声信号に遅延量を付加する、のどちらが選択されるようにスイッチSW1を切り替えてもよい。制御部232は、第1マイク及び第2マイクの両方が故障している場合は、遅延量付加部2301が第2音声信号に遅延量を付加する、あるいは、遅延量付加部2302が第1音声信号に遅延量を付加する、のどちらが選択されるようにスイッチSW1を切り替えてもよい。
【0050】
制御部232は、第1マイクが故障している場合は遅延量付加部2304が第2音声信号に遅延量を付加するように、スイッチSW2を切り替える。また、制御部232は、第1マイク、及び第2マイクのいずれも故障していない場合、すなわち第2モードである場合は遅延量付加部2303が第1音声信号に遅延量を付加するように、スイッチSW2を切り替える。
【0051】
さらに、制御部232は、第2マイクが故障している場合、遅延量付加部2303が第1音声信号に遅延量を付加する、あるいは遅延量付加部2304が第2音声信号に遅延量を付加する、のどちらが選択されるようにスイッチSW2を切り替えてもよい。制御部232は、第1マイク及び第2マイクの両方が故障している場合は、遅延量付加部2303が第1音声信号に遅延量を付加する、あるいは遅延量付加部2304が第2音声信号に遅延量を付加する、のどちらが選択されるようにスイッチSW2を切り替えてもよい。
【0052】
制御部232は、第1マイクのみが故障している場合、スイッチSW3をONに切り替えてもよい。また、制御部232は、第1マイク、及び第2マイクの両方が故障している場合、スイッチSW3をONに切り替えてもよい。スイッチSW3がONの状態は、第1出力信号が出力されない状態、すなわちMUTEの状態である。制御部232は、第1マイク、及び第2マイクのいずれも故障していない場合、スイッチSW3をOFFに切り替える。制御部232は、第2マイクのみが故障している場合、スイッチSW3をOFFに切り替える。スイッチSW3がOFFの状態は、第1出力信号が出力される状態である。第1出力信号の詳細な説明は後述する。
【0053】
制御部232は、第2マイクのみが故障している場合、スイッチSW4をONに切り替えてもよい。また、制御部232は、第1マイク、及び第2マイクの両方が故障している場合、スイッチSW4をONに切り替えてもよい。スイッチSW4がONの状態は、第2出力信号が出力されない状態、すなわちMUTEの状態である。制御部232は、第1マイク、及び第2マイクのいずれも故障していない場合、スイッチSW4をOFFに切り替える。制御部232は、第1マイクのみが故障している場合、スイッチSW4をOFFに切り替える。スイッチSW4がOFFの状態は、第2出力信号が出力される状態である。第2出力信号の詳細な説明は後述する。遅延量付加部2301、及び遅延量付加部2302の詳細な説明は後述する。
【0054】
加算器233は、スイッチSW1からの出力を第1マイクの音声信号から減算し、減算の結果を第1の音圧傾度処理出力としてEQ処理部236へ出力する。また、加算器234は、スイッチSW2からの出力を第2マイクの音声信号から減算し、減算の結果を第2の音圧傾度処理出力としてEQ処理部237へ出力する。
【0055】
EQ処理部236は、加算器234から出力される第1の音圧傾度処理出力の周波数特性を補正し、補正後の信号を第1マイクに対応する信号である第1出力信号として出力する。EQ処理部237は、加算器234から出力される第2の音圧傾度処理出力の周波数特性を補正し、補正後の信号を第2マイクに対応する信号である第2出力信号として出力する。以下、EQ処理部236、及びEQ処理部237を総称してEQ処理部235と呼ぶことがある。
【0056】
信号生成部238は、第1音声信号及び第2音声信号の少なくとも一方に基づいて第1出力信号を生成する。より具体的には、信号生成部238は、第1音声信号及び第2音声信号の少なくとも一方に基づく信号である減算信号を、第1音声信号から減算することにより第1出力信号を生成する。
【0057】
また、信号生成部238は、第1モードにおいて、第1音声信号を第2遅延量だけ遅延させることにより減算信号を生成する。信号生成部238は、第2モードにおいて、第2音声信号を第1遅延量だけ遅延させることにより減算信号を生成する。さらに、信号生成部238は、第1音声信号及び第2音声信号の少なくとも一方に基づいて第2出力信号を生成し、第1マイクに対応する信号として第1出力信号を出力し、第2マイクに対応する信号として第2出力信号を出力する。
【0058】
本実施形態において、音声処理装置20に含まれる、故障検出部231、制御部232、加算器233、加算器234、EQ処理部235、信号生成部238、遅延量付加部2301、遅延量付加部2302、遅延量付加部2303、遅延量付加部2304、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4は、ハードウェアで構成されることで実現する。あるいは、故障検出部231、制御部232、加算器233、加算器234、EQ処理部235、信号生成部238、遅延量付加部2301、遅延量付加部2302、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4は、プロセッサがメモリに保持されたプログラムを実行することで、その機能が実現されても良い。
【0059】
通知機器40は、故障検出情報が、第1マイク及び第2マイクの少なくとも一方が故障しているという情報を含むとき、第1マイク及び第2マイクの少なくとも一方が故障していることを通知する。通知機器40は、例えば、車両10にある電子機器であっても良いし、車両10内のスピーカであっても良いし、車両10内の天井にあるルームランプやマップランプであっても良い。
【0060】
次に、制御部232が、故障検出情報に基づいて、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する内容について説明する。第1モードはマイクMC1、及びマイクMC2のいずれか一方が故障している状態である。第2モードはマイクMC1、及びマイクMC2のいずれも故障していない状態である。
【0061】
まず、第1モードのうち、マイクMC2が故障している場合について説明する。このとき、第1出力信号は、マイクMC1が出力する第1音声信号に基づいて、生成される。より具体的には、まず、マイクMC1が出力する第1音声信号から、第1音声信号に遅延量付加部2302によって遅延量が付加された信号を加算器233にて減算する。減算の結果に対して、EQ処理部236が周波数特性の補正を行うことにより、第1出力信号を生成する。このとき、スイッチSW2の入力は、遅延量付加部2301によって第1音声信号に遅延量が付加された信号でもよく、遅延量付加部2302によって第2音声信号に遅延量が付加された信号でもよい。このとき、スイッチSW4をONとして第2出力信号がミュートとなるようにしてもよい。
【0062】
また、第1モードのうちマイクMC1が故障している場合について説明する。このとき、第2出力信号は、マイクMC2が出力する第2音声信号に基づいて、生成される。より具体的には、まず、マイクMC2が出力する第2音声信号から、第2音声信号に遅延量付加部2302によって遅延量が付加された信号を加算器234にて減算する。減算の結果に対して、EQ処理部237が周波数特性の補正を行うことにより、第2出力信号を生成する。このとき、スイッチSW1の入力は、遅延量付加部2301によって第2音声信号に遅延量が付加された信号でもよく、遅延量付加部2302によって第1音声信号に遅延量が付加された信号でもよい。このとき、スイッチSW3をONとして第1出力信号がミュートとなるようにしてもよい。
【0063】
次に、マイクMC1及びマイクMC2が故障していない場合の動作である、第2モードについて説明する。第2モードにおいて、第1出力信号は、マイクMC1が出力する第1音声信号、及びマイクMC2が出力する第2音声信号に基づいて生成される。より具体的には、まず、マイクMC1が出力する第1音声信号から、マイクMC2が出力する第2音声信号に遅延量付加部2301によって遅延量が付加された信号を加算器233にて減算する。減算の結果に対して、EQ処理部236が周波数特性の補正を行うことにより、第1出力信号を生成する。
【0064】
また、第2モードにおいて、第2出力信号は、マイクMC1が出力する第1音声信号、及びマイクMC2が出力する第2音声信号に基づいて生成される。より具体的には、まず、マイクMC2が出力する第2音声信号から、マイクMC1が出力する第1音声信号に遅延量付加部2301によって遅延量が付加された信号を加算器234にて減算する。減算の結果に対して、EQ処理部237が周波数特性の補正を行うことにより、第2出力信号を生成する。
【0065】
ここで、
図5を用いて、マイクMC1及びマイクMC2の故障状態に応じて、マイクが出力する音声信号に対し、異なる遅延量を付加する内容について説明する。
図5は、本実施形態に係る遅延量について説明するための図である。本実施形態の遅延量は、遅延量付加部2301が付加する遅延量、及び遅延量付加部2302が付加する遅延量である。遅延量付加部2301が付加する遅延量を第1遅延量、遅延量2302が付加する遅延量を第2遅延量とで呼ぶこともある。第2遅延量は第1遅延量よりも大きい。例えば、第2遅延量は第1遅延量の2倍である。
【0066】
図5において、マイクMC1、及びマイクMC2は距離dを隔てて配置されている。また、
図5では、矢印AR1の方向に沿って音波が到来する態様を示しており、ここでは、当該矢印の方向が目的方向音源到来方向に相当する。マイクMC1およびマイクMC2を結ぶ線分の中点を原点とし、原点から紙面左側に向かう方向を0°、原点からマイクMC1に向かう方向を90°、原点からマイクMC2に向かい方向を-90°とすると、目的方向音源到来角度は90°となっている。このとき、遅延量τは、音速をCとしたときに、τ=d/C[sec]となるように設定される。
【0067】
また、このとき、マイクMC2が収音する音声は、マイクMC1によって収音される音声に対して遅延量τ[sec]分遅れて到来する。すなわち、音源到来方向が矢印AR1の方向に固定されている場合、マイクMC2が出力する第2音声信号は、マイクMC1が出力する第1音声信号に対して遅延量τが付加された信号によって置き換えることができる。このときの遅延量τは、第1遅延量に相当する。
【0068】
また、音源到来方向が矢印AR1の方向に固定されている場合、マイクMC2が出力する第2音声信号に対して第1遅延量が付加された信号は、マイクMC1が出力する第1音声信号に第1遅延量の2倍の遅延量が付加された信号によって置き換えることができる。なお、第1遅延量の2倍の遅延量は、言い換えると、第2遅延量である。
【0069】
例えば、マイクMC2が故障している場合、加算器233は、マイクMC1が出力する第1音声信号から、マイクMC1が出力する第1音声信号に第2遅延量が付加された減算信号を減算し、減算結果に対してEQ処理部236が周波数特性の補正を行うことによって、第1出力信号を生成する。これにより、音源到来方向が一定の場合、マイクMC2が故障している場合でも、マイクMC1が出力する第1音声信号に第2遅延量が付加された減算信号を用いることで、マイクMC2が故障していない状態と同等な処理をすることができる。
【0070】
図6は、BF処理部230が出力する出力信号の周波数特性を示すグラフである。
図6の横軸は周波数[Hz]を表し、縦軸は振幅[dB]を表す。
【0071】
周波数特性GR1は、例えば、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC1及びマイクMC2が故障していない状態において、BF処理部230が出力する第1出力信号の周波数特性である。周波数特性GR2は、例えば、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC1及びマイクMC2が故障していない状態における第2出力信号の周波数特性である。
【0072】
周波数特性GR3は、マイクMC2が故障している状態において、第1音声信号から、第1音声信号に対して第2遅延量が付加された信号を、加算器233が減算した後に、減算の結果に対してEQ処理部236が周波数特性を補正することによって生成された第1出力信号の周波数特性である。周波数特性GR4は、マイクMC2が故障してマイクMC2の出力信号が0である状態において、第1音声信号から、第2音声信号に対して第1遅延量が付加された信号を、加算器233が減算した後に、減算の結果に対してEQ処理部236が周波数特性を補正することによって生成された第1出力信号の周波数特性である。
図6から、周波数特性GR3の方が、周波数特性GR4よりも周波数特性GR1に近い値を取ることがわかる。
【0073】
次に、
図7を用いて、本実施形態のBF処理部230が出力する第1出力信号の群遅延特性について説明する。
図7の横軸は周波数[Hz]を表し、縦軸は群遅延[サンプル]を表す。群遅延特性GR5は、音源到来方向が
図5に示す矢印AR1の方向に固定される場合、かつ、マイクMC1、及びマイクMC2が故障していない状態における第1出力信号の群遅延特性である。群遅延特性GR6は、マイクMC2が故障している状態において、遅延量付加部2302が選択された場合に出力される第1出力信号の群遅延特性である。
【0074】
信号生成部238は、マイクの故障状態に応じて、異なる処理を行っているが、
図6で示したとおり、音源到来方向が
図5に示す矢印AR1の方向に固定される場合に、周波数特性GR1と周波数特性GR3は重なる。同様に、EQ処理部236が出力する第1出力信号の群遅延特性GR5と、群遅延特性GR6は近い値をとる。
【0075】
これにより、本実施形態によれば、故障が検出されていないマイクMC1の第1音声信号に基づいて第1出力信号を生成することで、マイクMC2が故障状態であったとしても、故障が検出されていない状態と同様の出力信号の周波数振幅特性、及び群遅延特性を確保することができる。
【0076】
次に、本実施形態に係る音声処理システム5の動作例について説明する。
図8は、本実施形態に係る音声処理装置20の動作の一例を示すフローチャートである。
図9は、本実施形態の制御部232が処理する動作の内容の一例について説明する。
【0077】
制御部232は、故障検出部231が送信する故障検出情報を取得する(ステップS1)。
【0078】
次に、制御部232は、取得した故障検出情報にマイクMC1が故障しているという情報を含まれるかを確認する(ステップS2)。故障検出情報が、マイクMC1が故障しているという情報を含むとき(ステップS2:Yes)、ステップS3へ進む。故障検出情報が、マイクMC1が故障していないという情報を含むとき(ステップS2:No)、ステップS6へ進む。
【0079】
次に、制御部232は、取得した故障検出情報にマイクMC2が故障しているという情報を含まれるかを確認する(ステップS3)。故障検出情報が、マイクMC2が故障しているという情報を含むとき(ステップS3:Yes)、ステップS4へ進む。故障検出情報が、マイクMC2が故障していないという情報を含むとき(ステップS2:No)、ステップS5へ進む。
【0080】
続いて、制御部232は、スイッチSW3、及びスイッチSW4を制御する(ステップS4)。処理が完了すると、再びステップS1へ戻る。
【0081】
続いて、制御部232は、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する(ステップS5)。処理が完了すると、再びステップS1へ戻る。
【0082】
次に、制御部232は、取得した故障検出情報にマイクMC2が故障しているという情報を含まれるかを確認する(ステップS6)。故障検出情報が、マイクMC2が故障しているという情報を含むとき(ステップS6:Yes)、ステップS7へ進む。故障検出情報が、マイクMC2が故障していないという情報を含むとき(ステップS6:No)、ステップS8へ進む。
【0083】
続いて、制御部232は、スイッチSW1、スイッチSW3、及びスイッチSW4を制御する(ステップS7)。処理が完了すると、再びステップS1へ戻る。
【0084】
続いて、制御部232は、スイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4を制御する(ステップS8)。処理が完了すると、再びステップS1へ戻る。
【0085】
ここで、制御部232が処理するステップS4、ステップS5、ステップS7、及びステップS8の内容について具体的に説明する。
図9は、制御部232が処理する処理ステップに対応して、各スイッチの動作を示したテーブルである。
【0086】
ステップS4において、制御部232は、スイッチSW3をONに切り換え、スイッチSW4をONに切り換えるように制御する。なお、ステップS4において、制御部232は、遅延量付加部2301および遅延量付加部2302のどちらが選択されるようにスイッチSW1を切り換えても良い。なお、ステップS4において、制御部232は、遅延量付加部2303および遅延量付加部2304のどちらが選択されるようにスイッチSW2を切り換えても良い。
【0087】
ステップS5において、制御部232は、遅延量付加部2304が選択されるようにスイッチSW2を切り換え、スイッチSW3をONに切り換え、スイッチSW4をOFFに切り換えるように制御する。なお、ステップS5において、制御部232は、遅延量付加部2301および遅延量付加部2302のどちらが選択されるようにスイッチSW1を切り換えても良い。
【0088】
ステップS7において、遅延量付加部2302が選択されるようにスイッチSW1を切り換え、スイッチSW3をOFFに切り換え、スイッチSW4をONに切り換えるように制御する。なお、ステップS7において、制御部232は、遅延量付加部2303および遅延量付加部2304のどちらが選択されるようにスイッチSW2を切り換えても良い。
【0089】
ステップS8において、遅延量付加部2301が選択されるようにスイッチSW1を切り換え、遅延量付加部2303が選択されるようにスイッチSW2を切り換え、スイッチSW3をOFFに切り換え、スイッチSW4をOFFに切り換えるように制御する。
【0090】
上述した各ステップの処理内容は、制御部232がスイッチSW1、スイッチSW2、スイッチSW3、及びスイッチSW4のスイッチの切り換えを行うことによって実現される。あるいは、音声処理装置20が物理的なスイッチSW1、スイッチSW2、スイッチSW3、およびスイッチSW4を備えず、プロセッサがメモリに保持されたプログラムを実行することで、その機能が実現されてもよい。
【0091】
以上説明したように、本開示の一態様に係る音声処理システム5は、第1音声信号を出力する第1マイクと、第2音声信号を出力する第2マイクの少なくとも一方における故障の有無を検出し、検出の結果を故障検出情報として送信する。また、第1音声信号及び第2音声信号の少なくとも一方に基づいて第1出力信号を生成する。さらに、故障検出情報が、第2マイクが故障しているという情報を含むとき、故障が検出されていない第1音声信号に基づいて第1出力信号を生成する。
【0092】
これにより、音声処理システム5は複数のマイクのうち一部が故障した場合でも、出力される信号の変化を小さくすることができる。これにより、例えば後段の処理への影響を小さくすることができるので、音声処理システム5を安定して運用することができる。
【0093】
次に、
図10を用いて、比較例であるBF処理部280が処理する内容について説明する。
図10はBF処理部280の構成の一例を示す。BF処理部280は、加算器281、加算器282、EQ処理部284、EQ処理部285、及び遅延量付加部2601を備える。以下、EQ処理部284、及びEQ処理部285を総称してEQ処理部283と呼ぶことがある。
【0094】
まず、マイクMC2が故障し、出力が0である場合において、BF処理部280が音声信号を処理する流れについて説明する。BF処理部280は、マイクMC1が出力する第1音声信号に基づいて、第1出力信号を生成する。より具体的には、EQ処理部284が、マイクMC1が出力する第1音声信号に対して、周波数特性の補正を行い、第1出力信号を生成する。
【0095】
また、BF処理部280は、マイクMC1が出力する第1音声信号に基づいて、第2出力信号を生成する。より具体的には、EQ処理部285が、マイクMC1が出力する第1音声信号に遅延量付加部2601によって遅延量が付加され、さらに符号が反転した信号に対して、周波数特性の補正を行い、第2出力信号を生成する。
【0096】
次に、マイクMC1、及びマイクMC2の何れも故障していない場合において、BF処理部280が音声信号を処理する流れについて説明する。BF処理部280は、マイクMC1が出力する第1音声信号、及びマイクMC2が出力する第2音声信号に基づいて、第1出力信号を生成する。
【0097】
より具体的には、まず、マイクMC1が出力する第1音声信号から、マイクMC2が出力する第2音声信号に遅延量付加部2601によって遅延量が付加された信号を加算器233が減算する。減算の結果に対して、EQ処理部284が周波数特性の補正を行い、第1出力信号を生成する。遅延量付加部2601が付加する遅延量は、例えば、遅延量付加部2301が付加する遅延量と同じ値である。
【0098】
また、BF処理部280は、マイクMC1が出力する第1音声信号、及びマイクMC2が出力する第2音声信号に基づいて、第1出力信号を生成する。より具体的には、まず、マイクMC2が出力する第2音声信号から、マイクMC1が出力する第1音声信号に遅延量付加部2601によって遅延量が付加された信号を加算器234が減算する。減算の結果に対して、EQ処理部285が周波数特性の補正を行い、第2出力信号を生成する。
【0099】
次に、
図11を用いて、比較例のBF処理部280が生成する出力信号の周波数特性について説明する。
図11の横軸は周波数[Hz]を表し、縦軸は振幅[dB]を表す。ここで、
図10に示されるマイクMC1とマイクMC2の配置は、
図5に示したものと同じである。
【0100】
周波数特性GR7は、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC1及びマイクMC2が故障していない状態において、BF処理部280が出力する第1出力信号の周波数特性である。周波数特性GR8は、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC1及びマイクMC2が故障していない状態において、BF処理部280が出力する第2出力信号の周波数特性である。
【0101】
周波数特性GR9は、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC2が故障している状態において、BF処理部280が出力する第1出力信号の周波数特性である。周波数特性GR10は、音源到来方向が
図5に示す矢印AR1のように固定されている場合、かつ、マイクMC2が故障している状態においてBF処理部280が出力する第2出力信号の周波数特性である。
【0102】
マイクMC1及びマイクMC2が故障していない状態と、マイクMC2が故障している状態を比較すると、後者においてはマイクMC2の出力が0であるため、マイクMC2が出力する第2音声信号に遅延量が付加された信号をマイクMC1の出力信号から減算する処理が行われない。したがって、周波数特性GR7と周波数特性GR9は異なる特性となる。
【0103】
また、マイクMC2が故障している場合には、EQ処理部285には、マイクMC2が出力する第2音声信号が入力されず、第1遅延量が付加されたマイクMC1の信号のみが入力される。そのため、EQ処理部285の出力は、無指向信号に対しEQ特性をかけたものになる。したがって、周波数特性GR8と周波数特性GR10も異なる特性となる。
【0104】
これにより、比較例であるBF処理部280が出力する信号は、いずれのマイクも故障していない場合と一部のマイクが故障している場合とで異なる特性を示す。したがって、仮に一部のマイクが故障している場合に、比較例のBF処理部280の出力信号に基づいて、本実施形態の発話位置特定部250が発話位置を特定すると、誤った発話位置が特定される可能性がある。発話位置検出においては各出力信号の周波数バランスを考慮するが、いずれのマイクも故障していない場合と、一部のマイクが故障している場合とでは、出力信号の周波数振幅特性が異なるためである。
【0105】
さらに、発話位置特定部250が誤った発話位置を特定し、その発話位置に基づいて、本実施形態のCTC処理部260がクロストークキャンセル処理を実行する場合、クロストークキャンセルが適切に実行できない可能性がある。すなわち、一部のマイクが故障状態である場合、比較例のBF処理部280が処理した出力信号を用いると、音声処理装置20が正しく処理できない可能性がある。
【0106】
次に、
図12を用いて、比較例のBF処理部280が出力する第1出力信号の群遅延特性について説明する。
図12の横軸は周波数[Hz]を表し、縦軸は群遅延[サンプル]を表す。群遅延特性GR11は、音源到来方向が
図5に示す矢印AR1の方向に固定される場合、かつ、マイクMC1、及びマイクMC2が故障していない状態において、BF処理部280が出力する第1出力信号の群遅延特性である。群遅延特性GR12は、音源到来方向が
図5に示す矢印AR1の方向に固定される場合、かつ、マイクMC2が故障している状態において、BF処理部280が出力する第1出力信号の群遅延特性である。
【0107】
BF処理部280は、マイクが故障している場合においても、マイクが故障していない場合と同じ処理を行っている。このため、
図11で示したとおり、周波数特性GR7と周波数特性GR9は重ならない。また、群遅延特性GR11と、群遅延特性GR12は異なる群遅延特性となる。
【0108】
本実施形態の音声処理システム5で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
【0109】
また、本実施形態の音声処理システム5で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態の音声処理システム5で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。また、本実施形態の音声処理システム5で実行されるプログラムを、ROM32等に予め組み込んで提供するように構成してもよい。
【0110】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これらの実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0111】
5 音声処理システム
10 車両
20 音声処理装置
40 通知機器
220 音声入力部
230 BF(Beam Forming)処理部
231 故障検出部
232 制御部
233、234 加算器
235、236、237 EQ(Equalizer)処理部
238 信号生成部
240、241、242、243、244 帯域分割部
250 発話位置特定部
260 CTC(Cross Talk Canceller)処理部
270、271、272、273、274 帯域合成部
2001 DSP(Digital Signal Processor)
2002 RAM(Random Access Memory)
2003 ROM(Read Only Memory)
2004 I/O(Input/Output)インタフェース
2301、2302、2303、2304 遅延量付加部
hm1、hm2、hm3、hm4 乗員
MC1、MC2、MC3、MC4 マイク
SW1、SW2、SW3、SW4 スイッチ