(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-13
(45)【発行日】2024-02-21
(54)【発明の名称】エコーキャンセル装置、エコーキャンセル方法およびプログラム
(51)【国際特許分類】
H04R 3/02 20060101AFI20240214BHJP
H04M 1/60 20060101ALI20240214BHJP
【FI】
H04R3/02
H04M1/60 C
(21)【出願番号】P 2019215773
(22)【出願日】2019-11-28
【審査請求日】2022-09-30
(73)【特許権者】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】中村 真巳
【審査官】大石 剛
(56)【参考文献】
【文献】特開平02-158253(JP,A)
【文献】特開昭64-024667(JP,A)
【文献】特開2006-033802(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/02
H04M 1/60
(57)【特許請求の範囲】
【請求項1】
スピーカから出力するための音声信号である出力音声信号を受け付ける出力音声信号受付部と、
ユーザの発話音声を取得して入力音声信号を生成するマイクロホンと、
前記入力音声信号から、第1振幅信号と、当該第1振幅信号より小さい振幅の第2振幅信号と、をそれぞれ生成する振幅信号生成部と、
前記第1振幅信号と前記第2振幅信号とを比較
し、前記第1振幅信号に歪みであるクリップが発生していることを検出する比較部と
前記比較の結果
から、前記クリップが検出されたか否かに基づいて前記第1振幅信号または前記第2振幅信号のいずれかを選択信号として選択する選択部と、
前記選択信号と、前記出力音声信号とに基づいて、前記選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成するエコーキャンセラと、
前記エコーキャンセル後の音声信号を出力する出力部と、を備える
エコーキャンセル装置。
【請求項2】
前記エコーキャンセル後の音声信号に含まれるエコー漏れ信号を検出するエコー漏れ検出部をさらに備え、
前記選択部は、前記比較の結果から前記第1振幅信号にクリップが発生したことを検出し、かつ、予め設定された期間内に予め設定された量の前記エコー漏れ信号が検出された場合には、前記選択信号として前記第2振幅信号を選択する、
請求項1に記載のエコーキャンセル装置。
【請求項3】
前記エコーキャンセラは、前記出力音声信号と前記マイクロホンからの音声信号とから前記選択信号に適用するフィルタを最適化するための学習を行う適応フィルタを含み、
前記適応フィルタは、前記期間内において前記学習を抑制する、
請求項2に記載のエコーキャンセル装置。
【請求項4】
前記エコーキャンセル後の音声信号に対して信号レベルを抑制する処理を施すエコーサプレッサをさらに備える、
請求項1~3のいずれか一項に記載のエコーキャンセル装置。
【請求項5】
前記エコーサプレッサは、前記選択信号が前記第1振幅信号であり、前記第1振幅信号にクリップが発生している場合の前記エコーキャンセル後の音声信号に対して施す第1抑制量が、前記クリップが発生していない場合の前記エコーキャンセル後の音声信号に対して施す第2抑制量よりも大きく設定されている、
請求項4に記載のエコーキャンセル装置。
【請求項6】
スピーカから出力するための音声信号である出力音声信号を受け付ける出力音声信号受付ステップと、
ユーザの発話音声を取得して入力音声信号を生成する入力音声信号生成ステップと、
前記入力音声信号から、第1振幅信号と、当該第1振幅信号より小さい振幅の第2振幅信号と、をそれぞれ生成する振幅信号生成ステップと、
前記第1振幅信号と前記第2振幅信号とを比較
し、前記第1振幅信号に歪みであるクリップが発生していることを検出する比較ステップと
前記クリップが検出されたか否かに基づいて、前記第1振幅信号または前記第2振幅信号のいずれかを選択信号として選択する選択ステップと、
前記選択信号と、前記出力音声信号とに基づいて、前記選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成するエコーキャンセルステップと、
前記エコーキャンセル後の音声信号を出力する信号出力ステップと、を備え、
前記選択ステップは、前記比較の結果から前記第1振幅信号にクリップが発生したことを検出した後に、予め設定された期間内に予め設定された量のエコー漏れ信号が検出された場合には、前記選択信号として前記第2振幅信号を選択する、
エコーキャンセル方法。
【請求項7】
スピーカから出力するための音声信号である出力音声信号を受け付ける出力音声信号受付ステップと、
ユーザの発話音声を取得して入力音声信号を生成する入力音声信号生成ステップと、
前記入力音声信号から、第1振幅信号と、当該第1振幅信号より小さい振幅の第2振幅信号と、をそれぞれ生成する信号振幅信号生成ステップと、
前記第1振幅信号と前記第2振幅信号とを比較
し、前記第1振幅信号に歪みであるクリップが発生していることを検出する比較ステップと
前記クリップが検出されたか否かに基づいて、前記第1振幅信号または前記第2振幅信号のいずれかを選択信号として選択する選択ステップと、
前記選択信号と、前記出力音声信号とに基づいて、前記選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成するエコーキャンセルステップと、
前記エコーキャンセル後の音声信号を出力する信号出力ステップと、を備えるエコーキャンセル方法をコンピュータに実行させるプログラムであって、
前記選択ステップは、前記比較の結果から前記第1振幅信号にクリップが発生したことを検出した後に、予め設定された期間内に予め設定された量のエコー漏れ信号が検出された場合には、前記選択信号として前記第2振幅信号を選択する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はエコーキャンセル装置、エコーキャンセル方法およびプログラムに関する。
【背景技術】
【0002】
自動車の室内で利用されるハンズフリーシステムが知られている。ハンズフリーシステムでは、通話先から送られる音声をカーオーディオ用のスピーカ等から出力する。そのため、マイクロホンにより集音された音声に、スピーカから出力された音声がエコーとして含まれ、通話先に送信されてしまう。そこで、ハンズフリーシステムには、通話先に送信する信号からエコーをキャンセルするための種々の技術が利用されている。特に、スピーカから出力される音量が大きいと、マイクロホンに入力される音声の音声信号がクリップしてしまう場合がある。このような場合に、効果的にエコーをキャンセルする技術が望まれる。
【0003】
特許文献1に記載のエコーキャンセル装置は、マイクロホン入力がクリップした場合に、受話信号に所定のフィルタ処理を施して疑似的にクリップした信号に対応した疑似エコー信号を生成する。そして、エコーキャンセル装置は、入力されたデジタル収音信号から擬似エコー信号を差し引いて送話端に出力する送話信号を生成する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の技術における疑似エコー信号は、受話信号に含まれるエコー信号とは完全に一致するものではない。そのため、キャンセル処理を施した送話信号にノイズが含まれる虞があった。
【0006】
本発明は、このような課題を解決するためになされたものであって、好適にエコーキャンセルを行うエコーキャンセル装置等を提供するものである。
【課題を解決するための手段】
【0007】
本発明にかかるエコーキャンセル装置は、出力音声信号受付部、マイクロホン、振幅信号生成部、比較部、選択部、エコーキャンセラおよび出力部を有している。出力音声信号受付部は、スピーカから出力するための音声信号である出力音声信号を受け付ける。マイクロホンは、ユーザの発話音声を取得して入力音声信号を生成する。振幅信号生成部は、入力音声信号から、第1振幅信号と当該第1振幅信号より小さい振幅の第2振幅信号とをそれぞれ生成する。比較部は、第1振幅信号と第2振幅信号とを比較する。選択部は、比較の結果に基づいて第1振幅信号または第2振幅信号のいずれかを選択信号として選択する。エコーキャンセラは、選択信号と、出力音声信号とに基づいて、選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成する。出力部は、エコーキャンセル後の音声信号を出力する。
【0008】
本発明にかかるエコーキャンセル方法は、出力音声信号受付ステップ、入力音声信号生成ステップ、振幅信号生成ステップ、選択ステップ、エコーキャンセルステップおよび出力ステップを有している。出力音声信号受付ステップは、スピーカから出力するための音声信号である出力音声信号を受け付ける。入力音声信号生成ステップは、ユーザの発話音声を取得して入力音声信号を生成する。振幅信号生成ステップは、入力音声信号から第1振幅信号と当該第1振幅信号より小さい振幅の第2振幅信号とをそれぞれ生成する。比較ステップは、第1振幅信号と第2振幅信号とを比較する。選択ステップは、第1振幅信号または第2振幅信号のいずれかを選択信号として選択する。エコーキャンセルステップは、選択信号と、出力音声信号とに基づいて、選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成する。出力ステップは、エコーキャンセル後の音声信号を出力する。また、上記選択ステップは、比較の結果から第1振幅信号にクリップが発生したことを検出した後に、予め設定された期間内に予め設定された量のエコー漏れ信号が検出された場合には、選択信号として第2振幅信号を選択する。
【0009】
本発明にかかるプログラムは、出力音声信号受付ステップ、入力音声信号生成ステップ、振幅信号生成ステップ、比較ステップ、選択ステップ、エコーキャンセルステップおよび出力ステップを有しているエコーキャンセル方法をコンピュータに実行させる。出力音声信号受付ステップは、スピーカから出力するための音声信号である出力音声信号を受け付ける。入力音声信号生成ステップは、ユーザの発話音声を取得して入力音声信号を生成する。振幅信号生成ステップは、入力音声信号から第1振幅信号と当該第1振幅信号より小さい振幅の第2振幅信号とをそれぞれ生成する。比較ステップは、第1振幅信号と第2振幅信号とを比較する。選択ステップは、第1振幅信号または第2振幅信号のいずれかを選択信号として選択する。エコーキャンセルステップは、選択信号と、出力音声信号とに基づいて、選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成する。出力ステップは、エコーキャンセル後の音声信号を出力する。また、上記選択ステップは、比較の結果から第1振幅信号にクリップが発生したことを検出した後に、予め設定された期間内に予め設定された量のエコー漏れ信号が検出された場合には、選択信号として第2振幅信号を選択する。
【発明の効果】
【0010】
本発明によれば、好適にエコーキャンセルを行うエコーキャンセル装置等を提供することができる。
【図面の簡単な説明】
【0011】
【
図1】実施の形態1にかかるエコーキャンセル装置のブロック図である。
【
図2】エコーキャンセル装置における振幅信号の例を示す第1の図である。
【
図3】エコーキャンセル装置における振幅信号の例を示す第2の図である。
【
図4】エコーキャンセル装置の処理を示すフローチャートである。
【
図5】実施の形態2にかかるエコーキャンセル装置のブロック図である。
【発明を実施するための形態】
【0012】
以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲にかかる発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。説明の明確化のため、以下の記載および図面は、適宜、省略、および簡略化がなされている。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0013】
<実施の形態1>
実施の形態1にかかるエコーキャンセル装置は、電話機と、スピーカおよびマイクとの間に介在してハンズフリーシステムを構成する。
図1は、実施の形態1にかかるエコーキャンセル装置のブロック図である。
図1に示すエコーキャンセル装置10は、ハンズフリーシステム1の構成要素であり、エコーキャンセル装置の一実施態様である。エコーキャンセル装置10のハードウェアは、例えば複数の電気部品が実装された基板により構成されている。
【0014】
エコーキャンセル装置10は、電話機11から音声信号を受け取り、受け取った音声信号を、スピーカ130に出力する。エコーキャンセル装置10は、電話機11とスピーカ130との間に、出力音声信号受付部100、信号処理部110、DAコンバータ121(DAC、Digital-to-Analog converter)、出力調整部122および出力信号増幅部123を有している。
【0015】
またエコーキャンセル装置10は、第1マイク131および第2マイク132からそれぞれ音声信号を受け取り受け取った音声信号にエコーキャンセル処理を施したうえで、かかる処理を施した信号を電話機11に供給する。エコーキャンセル装置10は、かかるマイクと電話機11との間に、第1振幅信号生成部141、第2振幅信号生成部142、第1ADコンバータ151(ADC、Analog-to-Digital converter)、第2ADコンバータ152、信号処理部110および出力部160を有している。
【0016】
以下に、各構成要素について説明する。出力音声信号受付部100は、電話機11に接続し、電話機11から供給される音声信号を受け付けるインタフェースである。本実施の形態においては、電話機11から供給される音声信号を、出力音声信号と称する。出力音声信号は、電話機11からエコーキャンセル装置10を介してスピーカ130に供給され、スピーカから音声として出力される。出力音声信号受付部100は、電話機11と通信可能に接続し、電話機11から出力音声信号を受け付けると、受け付けた出力音声信号を信号処理部110に供給する。
【0017】
信号処理部110は、例えばDSP(Digital Signal Processor)、SoC(System-on-a-Chip)またはCPU(Central Processing Unit)などの演算処理装置を主な構成として含む。また信号処理部110は、上述のハードウェアが所定のプログラムを実行することにより、予め設定された機能を実現する。信号処理部110は、主な構成として、比較部111、選択部112、エコーキャンセラ113およびエコー漏れ検出部116を有している。また信号処理部110は、上述の各構成を適宜制御する機能を有している。
【0018】
以下に、信号処理部110が有する主な構成について説明する。比較部111は、第1ADコンバータ151から供給された第1振幅信号D151と第2ADコンバータ152から供給された第2振幅信号D152とを比較し、比較の結果を出力する。比較部111は、例えば、2つのデジタル信号を比較するための比較器(コンパレータ)を含む。第1振幅信号D151をデジタル処理にて第2振幅信号D152とのレベル差分を調整後、第1振幅信号D151の波高値と第2振幅信号D152の波高値とを比較することにより、比較部111は、第1振幅信号D151がクリップしていることを検出できる。比較部111は、例えば、第1振幅信号D151と第2振幅信号D152をそれぞれに周波数変換して周波数特性を比較し、歪みがあるか否かに基づいて、第1振幅信号D151がクリップしていることを検出してもよい。なお、「信号がクリップする」とは、入力された信号が回路の出力ゲインの上限または下限を超えることにより、歪んだ状態になることをいう。「信号がクリップする」ことを、「信号にクリップが発生する」ということもある。
【0019】
比較部111は、第1振幅信号D151がクリップしていることを判定するために、第1ADコンバータ151の出力の最大値または最小値が出力されている場合や、第1ADコンバータ151の出力の最大値または最小値が連続して出力されていることを判定してもよい。比較部111は、第1ADコンバータ151が出力するエラー信号(クリップしている場合にエラーとして判定し、出力される信号)に基づいてクリップしていることを判定してもよい。
【0020】
選択部112は、比較部111が出力した比較の結果を受け取り受け取った結果に応じて、第1ADコンバータ151から供給された第1振幅信号D151または第2ADコンバータ152から供給された第2振幅信号D152の内いずれか一の信号を選択する。そして、選択部112は、選択した信号を、選択信号D112としてエコーキャンセラ113に供給する。
【0021】
より具体的には、選択部112は、比較部111が出力した比較の結果から第1振幅信号D151にクリップが発生したことを検出した後に、予め設定された期間内に予め設定された量のエコー漏れ信号が検出された場合には、選択信号D112として第2振幅信号D152を選択する。なお、エコー漏れの検出は、後述のように、エコー漏れ検出部116が行う。
【0022】
エコーキャンセラ113は、マイクロホンを介して受け取った音声信号(入力音声信号)に含まれるエコーを除去する。本実施の形態において「エコー」とは、入力音声信号に含まれる通話先からの音声に起因する信号をいう。ハンズフリーシステム1において、スピーカ130は、電話機11から供給された出力音声信号を出力する。第1マイク131および第2マイク132は、ユーザの発話を集音する際に、スピーカ130から出力される音声も併せて集音する。上述のように、スピーカ130から出力される音声を第1マイク131および第2マイク132が集音することにより、入力音声信号にエコーが含まれる。
【0023】
より具体的には、エコーキャンセラ113は、選択信号D112と、出力音声信号とに基づいて、選択信号に含まれるエコーをキャンセル処理してエコーキャンセル後の音声信号を生成する。すなわちエコーキャンセラ113は、まず通話先から受信した音声である出力音声信号を参照データとして受け取って適切に処理し、キャンセルデータ(エコーキャンセル信号)を生成する。その後に選択部112からの選択信号D112からキャンセルデータを除去する処理を行うことで、エコーキャンセル後の音声信号を生成し、出力部160に供給する。またエコーキャンセラ113は、エコーキャンセル後の音声信号および参照データを、エコー漏れ検出部116にも供給する。エコーキャンセラ113は、適応フィルタ114および減算部115を有している。
【0024】
適応フィルタ114は、スピーカ130の出力から第1マイク131または第2マイク132への入力までの空間すなわちエコーパスの特性に基づいて参照データを処理してキャンセルデータを生成する。より具体的には、適応フィルタ114は、エコーパスの遅延時間、周波数特性およびレベル特性を模擬した特性情報を設定し、設定した特性情報と参照データとを畳み込み処理により掛け合わせてキャンセルデータを生成する。言い換えると、適応フィルタ114は、第1マイク131または第2マイク132を介して受け取った音声信号に含まれる、スピーカ130の出力の遅延量や周波数特性、音量レベルなどの特性情報に基づいてエコー成分を抽出し、キャンセルデータとして生成する。適応フィルタ114は、生成したキャンセルデータを減算部115に入力する。
【0025】
減算部115は、選択部112から受け取った選択信号D112からキャンセルデータを減算することで、エコーキャンセル後の音声信号を生成する。ここで減算部115は、生成したエコーキャンセル後の音声信号を、誤差信号として適応フィルタ114に入力する。さらに適応フィルタ114は、フィードバックされた誤差信号を用いてフィルタ係数を更新する。適応フィルタ114は、誤差信号が最小になるように収束させる動作を行う。すなわち、適応フィルタ114は、参照データとエコーキャンセル後の音声信号とから、選択信号に適用するフィルタを最適化するための学習を行う。
【0026】
エコー漏れ検出部116は、エコーキャンセラ113からエコーキャンセル後の音声信号と参照データとを受け取り、エコーキャンセル後の音声信号に含まれるエコー漏れ信号を検出する。また、エコー漏れ検出部116は、比較部111から比較の結果を受け取る。比較の結果から、第1振幅信号D151がクリップしていることを検出した場合、エコー漏れ信号の積分を開始し、予め設定された期間の積分量を算出する。信号処理部110は、エコー漏れ検出部116が算出した積分量から、選択部112が選択する信号を設定する。すなわち、第1振幅信号D151がクリップしていることを検出し、かつ、予め設定された期間において、予め設定された閾値を超える積分量が算出された場合、信号処理部110は、選択部112に第2振幅信号D152を選択させる。
【0027】
以上、信号処理部110が有する主な構成について説明した。信号処理部110は、出力音声信号受付部100から受け取った出力音声信号をエコーキャンセラ113に供給するとともに、DAコンバータ121に供給する。また、信号処理部110は、第1ADコンバータ151から第1振幅信号D151を受け取るとともに第2ADコンバータ152から第2振幅信号D152を受け取り、これらのいずれかの信号と出力音声信号受付部100から受け取った参照データとを内部で処理し、エコーキャンセル後の音声信号を出力部160に供給する。
【0028】
DAコンバータ121は、信号処理部110から出力音声信号を受け取り、受け取った出力音声信号をアナログ信号に変換(DA変換)する。またDAコンバータ121は、変換したアナログ信号を出力調整部122に供給する。出力調整部122は例えば可変抵抗器を含む回路であり、スピーカ130から出力する音声の出力レベルすなわち音量を調整する。出力調整部122は、調整したアナログ信号を出力信号増幅部123に供給する。出力信号増幅部123は、いわゆる増幅器またはAMP(amplifier)と称される増幅回路を含む。出力信号増幅部123は、出力調整部122からアナログ信号を受け取り、受け取ったアナログ信号を増幅してスピーカ130に供給する。
【0029】
第1振幅信号生成部141は、例えば、増幅回路を含み、第1マイク131から受け取った第1音声信号D131を増幅し、第1振幅信号D141を生成する。第1振幅信号生成部141は、生成した第1振幅信号D141を、第1ADコンバータ151に供給する。第1振幅信号生成部141は、第1マイク131から受け取った第1音声信号D131を増幅せず、そのまま第1振幅信号D141としてもよい。第1振幅信号生成部141は、第1マイク131から受け取った第1音声信号D131の振幅を減縮して第1振幅信号D141を生成してもよい。
【0030】
第2振幅信号生成部142は、例えば、増幅回路を含み、第2マイク132から受け取った第2音声信号D132を増幅し、第2振幅信号D142を生成する。第2振幅信号生成部142は、生成した第2振幅信号D142を、第2ADコンバータ152に供給する。なお、第2振幅信号生成部142が出力する第2振幅信号D142の出力レベルは、第1振幅信号生成部141が出力する第1振幅信号D141の出力レベルよりも小さくなるように設定されている。第2振幅信号生成部142は、第1振幅信号D141の出力レベルよりも小さい出力レベルとなる第2振幅信号D142を生成すればよく、増幅回路は無くともよい。第2振幅信号生成部142は、第2マイク132から受け取った第2音声信号D132の振幅を減縮して第2振幅信号D142を生成してもよい。
【0031】
第1ADコンバータ151は、第1振幅信号生成部141から受け取った第1振幅信号D141をアナログ信号からデジタル信号に変換(AD変換)する。第1ADコンバータ151は、デジタル信号に変換した第1振幅信号D151を、信号処理部110の比較部111に供給する。第2ADコンバータ152は、第2振幅信号生成部142から受け取った第2振幅信号D142をアナログ信号からデジタル信号に変換する。第2ADコンバータ152は、デジタル信号に変換した第2振幅信号D152を、信号処理部110の比較部111に供給する。なお本発明において、アナログ信号である第1振幅信号D141をデジタル信号に変換した信号が、第1振幅信号D151である。アナログかデジタルかの差はあるものの、これらは実質的に同一の信号であるため、共に第1振幅信号と呼ぶ。第2振幅信号D142と第2振幅信号D152も同様に、共に第2振幅信号と呼ぶ。
【0032】
出力部160は、信号処理部110から受け取ったエコーキャンセル後の音声信号を電話機11に供給するインタフェースである。出力部160は、電話機11に通信可能に接続し、エコーキャンセル後の音声信号を出力する。
【0033】
スピーカ130は、エコーキャンセル装置10の出力信号増幅部123から出力音声信号を受け取り、受け取った出力音声信号を音声として出力する。スピーカ130は例えば自動車の室内に設置されたカーオーディオ用スピーカである。
【0034】
第1マイク131および第2マイク132は、ユーザの発話音声を取得して入力音声信号を生成するマイクロホンである。第1マイク131は、第1入力音声信号を生成し、生成した第1入力音声信号を第1振幅信号生成部141に供給する。第2マイク132は、第2入力音声信号を生成し、生成した第2入力音声信号を第2振幅信号生成部142に供給する。
図1において点線による矢印で示すように、ハンズフリーシステム1においては、スピーカ130が出力した音声が第1マイク131および第2マイク132にエコーとして入力される場合がある。
【0035】
電話機11は、携帯電話であり、通話先の音声をエコーキャンセル装置10の出力音声信号受付部100に供給し、ユーザの発話音声を、エコーキャンセル装置10の出力部160から受け取る。
【0036】
次に、
図2および
図3を参照して第1振幅信号生成部141および第2振幅信号生成部142が行う処理について説明する。
図2は、エコーキャンセル装置における振幅信号の例を示す第1の図である。
図2は、エコーキャンセル装置10の第1振幅信号生成部141および第2振幅信号生成部142を抽出して示している。また第1振幅信号生成部141の右側に、第1入力音声信号D131の一例として第1入力音声信号D131(1)を示し、第1振幅信号生成部141の左側に、第1入力音声信号D131(1)が増幅されることにより生成される第1振幅信号D141(1)を示している。同様に、第2振幅信号生成部142の右側に、第2入力音声信号D132(1)を示し、第2振幅信号生成部142の左側に、第2振幅信号D142(1)を示している。
【0037】
図2に示す例では、第1マイク131および第2マイク132は、同等の特性を有している。そのため、第1入力音声信号D131(1)と第2入力音声信号D132(1)とはいずれも振幅W10を有している。
図2に示すように、第1振幅信号生成部141は、第1入力音声信号D131(1)を受け取ると、第1振幅信号D141(1)を生成し、これを出力する。第1振幅信号D141(1)と第1入力音声信号D131(1)とを比較すると、周波数は変化していないが、振幅W10から振幅W11に増幅されている。
【0038】
一方、第2振幅信号生成部142は、第2入力音声信号D132(1)を受け取ると、第2振幅信号D142(1)を生成し、これを出力する。第2振幅信号D142(1)と第2入力音声信号D132(1)とを比較すると、周波数は変化していないが、振幅W10から振幅W12に増幅されている。
【0039】
上述の通り、第2振幅信号生成部142が出力する第2振幅信号D142の出力レベルは、第1振幅信号生成部141が出力する第1振幅信号D141の出力レベルよりも小さくなるように設定されている。すなわち、第1振幅信号生成部141が有するゲイン(増幅率)は、第2振幅信号生成部142が有するゲインより大きい。そのため、第1振幅信号D141(1)の振幅W11と第2振幅信号D142(1)の振幅W12とを比較すると、振幅W12は、振幅W11より小さい。このように、第1振幅信号生成部141は、第2振幅信号生成部142よりも入力された信号を相対的に大きく増幅する。第2振幅信号生成部142は、第1振幅信号生成部141よりも入力された信号を相対的に小さく増幅する。
【0040】
次に
図3を参照しながら、入力音声信号にクリップが発生について説明する。
図3は、エコーキャンセル装置における振幅信号の例を示す第2の図である。
図3に示す例では、第1振幅信号生成部141に第1入力音声信号D131(2)が入力されている。第1入力音声信号D131(2)の振幅W20は、
図2に示した第1入力音声信号D131(1)の振幅W10より大きい。同様に、第2振幅信号生成部142に第2入力音声信号D132(2)が入力されている。第2入力音声信号D132(2)の振幅W20は、
図2に示した第2入力音声信号D132(1)の振幅W10より大きい。
【0041】
第1振幅信号生成部141は、第1入力音声信号D131(2)を受け取ると、第1振幅信号D141(2)を出力する。図に示すように、第1振幅信号D141(2)は、振幅W20よりも大きい振幅W21を有している。また第1振幅信号D141(2)は、信号波形の上下端が曲線ではなく直線に変化している。すなわちここで示す例では、第1入力音声信号D131(2)が増幅された結果、第1振幅信号D141(2)にクリップが発生している。
【0042】
一方、第2振幅信号生成部142は、第2入力音声信号D132(2)を受け取ると、第2振幅信号D142(2)を出力する。図に示すように、第2振幅信号D142(2)は、振幅W20よりも大きい振幅W22を有している。ここで、振幅W22は、第1振幅信号D141が有する振幅W21より小さい。このように、第2振幅信号生成部142のゲインは第1振幅信号生成部141のゲインより小さいため、第1振幅信号D141がクリップした場合でも、第2振幅信号D142がクリップしないという状態になる。
【0043】
以上、第1振幅信号生成部141および第2振幅信号生成部142が行う処理について説明した。
図2に示した例の場合、第1振幅信号D141(1)と第2振幅信号D142(1)とを比較すると、第1振幅信号D141(1)のSN比(Signal/Noise比)の方が、第2振幅信号D142(1)のSN比より相対的に良い。そのため、エコーキャンセル装置10は、
図2に示した例の場合、第1振幅信号D141(1)をAD変換した第1振幅信号D151を選択信号D112として選択する。これにより、エコーキャンセル装置10は、より良好な音質のエコーキャンセル後の音声信号を生成できる。
【0044】
一方、
図3に示した例の場合、第1振幅信号D141はクリップしているため、この信号を利用してエコーキャンセル処理を行うと、好適にエコーを除去することができない。そこで、エコーキャンセル装置10は、第2振幅信号D142(2)をAD変換した第2振幅信号D152を選択信号D112として選択する。これにより、エコーキャンセル装置10は、より良好な音質のエコーキャンセル後の音声信号を生成できる。なお、
図3では模式的に第1振幅信号D141がクリップしているものとして示したが、第1振幅信号D141ではなく、第1ADコンバータ151の出力である第1振幅信号D151がクリップしている場合もある。
【0045】
次に、
図4を参照して、エコーキャンセル装置10が行う処理について説明する。
図4は、エコーキャンセル装置の処理を示すフローチャートである。
【0046】
まず、エコーキャンセル装置10の出力音声信号受付部100は、電話機11から出力音声信号(参照データ)を受け付ける(ステップS10)。
【0047】
次に、エコーキャンセル装置10は、入力音声信号すなわち第1入力音声信号D131および第2入力音声信号D132を受け付ける(ステップS11)。
【0048】
次に、エコーキャンセル装置10の第1振幅信号生成部141および第2振幅信号生成部142は、入力音声信号である第1入力音声信号D131および第2入力音声信号D132をそれぞれ増幅する(ステップS12)。
【0049】
次に、エコーキャンセル装置10の比較部111は、増幅されてAD変換された第1振幅信号D151がクリップしているか否かを比較して判定する(ステップS13)。ここでクリップしていると判定された場合に、ステップS17に進んでもよい。
【0050】
次に、信号処理部110のエコー漏れ検出部116は、エコー漏れ信号を積分する(ステップS14)。
【0051】
次に、信号処理部110は、エコー漏れ信号の積分量Dが、閾値Dthを超えたか否かを判断する(ステップS15)。エコー漏れ信号の積分量Dが、閾値Dthを超えたと判断する場合(ステップS15:Yes)、信号処理部110は、ステップS16に進む。一方、エコー漏れ信号の積分量Dが、閾値Dthを超えたと判断しない場合(ステップS15:No)、信号処理部110は、ステップS17に進む。
【0052】
ステップS16において、信号処理部110の選択部112は、選択信号D112として第2振幅信号D152を選択し(ステップS16)、ステップS18に進む。
【0053】
ステップS17において、信号処理部110の選択部112は、選択信号D112として第1振幅信号D151を選択し(ステップS17)、ステップS18に進む。
【0054】
ステップS18において、信号処理部110は、出力音声信号(参照データ)から適応フィルタによりキャンセルデータを生成し、信号処理部110の減算部115は、選択信号D112からキャンセルデータを減算してエコーキャンセル後の音声信号を生成し(ステップS18)、ステップS19に進む。
【0055】
ステップS19において、信号処理部110の出力部160は、エコーキャンセル後の音声信号を電話機11に出力し(ステップS19)、ステップS20に進む。
【0056】
ステップS20において、信号処理部110は、一連の処理が終了か否かを判断する(ステップS20)。一連の処理が終了する場合とは、例えばハンズフリーシステム1がシャットダウンされる場合や、電話機11による通話が終了する場合などである。一連の処理が終了すると判断しない場合(ステップS20:No)、エコーキャンセル装置10は、ステップS10に戻り処理を続ける。一方、一連の処理が終了すると判断する場合(ステップS20:Yes)、エコーキャンセル装置10は、処理を終了する。
【0057】
以上、エコーキャンセル装置10が行う処理について説明した。上述の構成により、エコーキャンセル装置10は、第1振幅信号D151にクリップが発生した場合であっても、過渡的な信号に対する過度な反応を抑制できる。また、エコーキャンセル装置10は、定常的にクリップが発生する場合には、相対的に低いゲインにより増幅された第2振幅信号D152を選択する。
【0058】
以上、実施の形態1について説明したが、実施の形態1にかかるエコーキャンセル装置10は、上述の構成に限られない。例えば、第1マイク131および第2マイク132は、同等の特性を有しているものに代えて、出力ゲインが異なるものを有していても良い。また、マイクロホンは2つではなく、1つでもよい。その場合、マイクロホンは、第1振幅信号生成部141および第2振幅信号生成部142にそれぞれ接続する。
【0059】
なお、上述のように、エコーキャンセル装置10が第1マイク131および第2マイク132を有することにより、それぞれのマイクロホンからエコーキャンセル装置10までの配線の信頼性が向上する。すなわち、2つのマイクロホンとエコーキャンセル装置10とを接続する配線の一方が断線した場合には、断線していない他方を使用できる。この場合、断線した方の入力音声信号はエコーキャンセル装置10に届かないため、信号処理部110は、断線していないマイクロホンから受け付けた信号を利用して処理を行うことができる。このような利点は、特に、長い配線を引き回す必要がある自動車用のハンズフリーシステムにおいては、有効となる。
【0060】
エコーキャンセラ113の適応フィルタ114は、エコー漏れ信号の積分が行われている期間(積分期間)においては、フィルタを最適化する学習を抑制するものであってもよい。これにより、エコーキャンセラ113は、受け付けた入力音声信号がクリップしている場合、言い換えると、第1振幅信号D151が第1振幅信号D141と周波数特性的に一致しない、または、第1振幅信号D151の波高値が第1ADコンバータ151出力の上限値または下限値に達している、異常な信号である場合に、適応フィルタ114が誤ったキャンセルデータを生成し、また、以降のキャンセルデータの生成に悪影響を及ぼすことが無いように、適応フィルタ114が誤ったキャンセルデータ学習を止めることで、弊害を抑制できる。この場合、
図4に示したフローチャートにおいて、ステップS14の積分処理と同時に、適応フィルタ114は学習を抑制する。また、ステップS16またはステップS17の処理と同時に、適応フィルタ114は、学習の抑制を解除する。
【0061】
以上、実施の形態1によれば、好適にエコーキャンセルを行うエコーキャンセル装置等を提供することができる。
【0062】
<実施の形態2>
次に、実施の形態2について説明する。実施の形態2にかかるエコーキャンセル装置は、信号処理部110にエコーサプレッサをさらに有している点が、実施の形態1と異なる。
図5は、実施の形態2にかかるエコーキャンセル装置のブロック図である。
【0063】
図5に示すハンズフリーシステム1は、エコーキャンセル装置20を有している。エコーキャンセル装置20は、信号処理部110に代えて、信号処理部210を有している点が、実施の形態1にかかるエコーキャンセル装置10と異なる。
【0064】
信号処理部210は、エコーサプレッサ117を有している。以下に、実施の形態1にかかる信号処理部110と異なる点について主に説明する。
【0065】
エコーサプレッサ117は、出力音声信号(参照データ)を受け取るとともに、エコーキャンセラ113からエコーキャンセル後の音声信号を受け取る。そして、受け取った参照データとエコーキャンセル後の音声信号との信号レベルに応じて、エコーキャンセル後の音声信号に対してエコーの抑制処理を行う。さらにエコーサプレッサ117は、抑制処理を行った音声信号を、出力部160に供給する。
【0066】
また、エコーサプレッサ117は、異なる2つの抑制量として、第1抑制量と第2抑制量とが設定できる構成となっている。第1抑制量は、第2抑制量よりもエコーキャンセル信号を抑制する量が大きい。エコーサプレッサ117は、エコー漏れ検出部116が積分処理を行っていることを示す信号をエコー漏れ検出部116から受け取る。エコーサプレッサ117は、エコー漏れ検出部116がエコー漏れを検出しているか否かに応じて、上述の第1抑制量と第2抑制量とのいずれかを設定する。
【0067】
すなわち、エコーサプレッサ117は、選択信号が第1振幅信号D151であり、第1振幅信号D151にクリップが発生している場合には、エコーキャンセル後の音声信号に対して第1抑制量により抑制処理を施す。また、エコーサプレッサ117は、第1振幅信号D151にクリップが発生していない場合には、エコーキャンセル後の音声信号に対して第1抑制量より小さい第2抑制量により抑制処理を施す。
【0068】
第1振幅信号D151にクリップが発生した場合における上述の積分期間において、エコーキャンセル後の音声信号は、エコー漏れが含まれる可能性が比較的に高くなる。そこで、実施の形態2にかかるエコーキャンセル装置20は、上述のように、積分期間においては、エコーサプレッサ117による抑制量を比較的に大きいものとしている。上述の積分期間は、選択部112が選択信号D112を切り替える場合には、過渡期となる。実施の形態2によれば、上述の過渡期において、エコーサプレッサ117による抑制量を大きくすることにより、より好適にエコー漏れを抑制できる。よって、実施の形態2によれば、より好適にエコーキャンセルを行うエコーキャンセル装置等を提供することができる。
【0069】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、エコーキャンセル装置10は、上述のハンズフリーシステムに代えて、携帯電話機や家庭用のコードレス電話機におけるスピーカホン機能、電話会議システムにも適用可能である。また、自動音声と対話をするスマートスピーカ(AIスピーカ)にも適用可能である。
【0070】
本発明では、第1振幅信号生成部141および第2振幅信号生成部142を備える形態として説明したが、この形態に限定されず、エコーキャンセル装置10は、第1ADコンバータ151および第2ADコンバータ152の入力振幅の基準値を制御する入力基準値制御部を備える形態であってもよい。入力基準値制御部を備えることで、ADコンバータに入力するアナログ信号の振幅を変更することなく、第1ADコンバータ151の出力値および第2ADコンバータ152の出力値を可変させることができ、本発明と同等の効果を得ることができる。
【0071】
本発明では、第2振幅信号生成部142および第2ADコンバータ152を備える形態として説明したが、この形態に限定されず、エコーキャンセル装置10は、第2振幅信号生成部142および第2ADコンバータ152を備えなくともよい。第1振幅信号D151がクリップしていることを判定した場合に、第1振幅信号生成部141の増幅量を低減させるまたは第1ADコンバータ151の入力基準値を広げることにより、第1振幅信号D151がクリップしないようにすることで、本発明と同等の効果を得ることができる。この場合、上述したマイクロホンとエコーキャンセル装置10とを接続する配線の一方が断線した場合に、断線していない他方を使用できる利点は無いが、エコーキャンセル装置10を低コストで構成することができ、また消費電力を低減させることができる。
【符号の説明】
【0072】
1 ハンズフリーシステム
10、20 エコーキャンセル装置
11 電話機
100 出力音声信号受付部
110、210 信号処理部
111 比較部
112 選択部
113 エコーキャンセラ
114 適応フィルタ
115 減算部
116 エコー漏れ検出部
117 エコーサプレッサ
121 DAコンバータ
122 出力調整部
123 出力信号増幅部
130 スピーカ
131 第1マイク
132 第2マイク
141 第1振幅信号生成部
142 第2振幅信号生成部
151 第1ADコンバータ
152 第2ADコンバータ
160 出力部