IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社トランストロンの特許一覧

特許7196002エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
<>
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図1
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図2
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図3
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図4
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図5
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図6
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図7
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-16
(45)【発行日】2022-12-26
(54)【発明の名称】エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
(51)【国際特許分類】
   H04M 1/60 20060101AFI20221219BHJP
   H04R 3/02 20060101ALI20221219BHJP
   H04B 3/20 20060101ALI20221219BHJP
【FI】
H04M1/60 D
H04R3/02
H04B3/20
【請求項の数】 9
(21)【出願番号】P 2019072738
(22)【出願日】2019-04-05
(65)【公開番号】P2020170986
(43)【公開日】2020-10-15
【審査請求日】2021-10-15
(73)【特許権者】
【識別番号】391008559
【氏名又は名称】株式会社トランストロン
(74)【代理人】
【識別番号】100170070
【弁理士】
【氏名又は名称】坂田 ゆかり
(72)【発明者】
【氏名】里見 祐樹
【審査官】山岸 登
(56)【参考文献】
【文献】特開2013-187810(JP,A)
【文献】米国特許出願公開第2012/0307980(US,A1)
【文献】米国特許出願公開第2015/0030168(US,A1)
【文献】米国特許出願公開第2004/0120271(US,A1)
【文献】米国特許出願公開第2015/0011266(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04B1/76-3/44
3/50-3/60
7/00-7/015
H04M1/00
1/24-1/82
99/00
H04R3/00-3/14
(57)【特許請求の範囲】
【請求項1】
スピーカから出力される音声信号がマイクロホンに入力することによって生じるエコーを抑圧するエコー抑圧装置であって、
遠端側からの受話信号を前記スピーカへ信号を伝送する受話側信号経路に設けられたレベル調整部と、
前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられ、前記マイクロホンから出力された収音信号から残留エコーを除去するエコー除去部と、
前記送話側信号経路及び前記受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するダブルトーク検知部と、
を備え、
前記レベル調整部は、前記ダブルトーク検知部により前記ダブルトーク状態であると検知された場合に、前記受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うコンプレッサを有する
ことを特徴とするエコー抑圧装置。
【請求項2】
前記コンプレッサは、前記ダブルトーク検知部により前記ダブルトーク状態であることが検知されなかった場合に、前記受話信号のうちの前記第1閾値より大きい第2閾値より大きい信号に対して圧縮処理を行う
ことを特徴とする請求項1に記載のエコー抑圧装置。
【請求項3】
前記レベル調整部は、前記受話信号のゲインを調整するゲイン調整部を有し、
前記コンプレッサは、前記ゲインが大きくなるにつれて前記第1閾値が小さくなるように閾値調整をして、前記ゲイン調整部から出力された信号に対して処理を行う
ことを特徴とする請求項1又は2に記載のエコー抑圧装置。
【請求項4】
前記コンプレッサは、前記ゲインが大きくなるにつれて圧縮率を高くする
ことを特徴とする請求項3に記載のエコー抑圧装置。
【請求項5】
前記コンプレッサは、前記スピーカの歪みに関する情報に基づいて圧縮率を変える
ことを特徴とする請求項1から3のいずれか一項に記載のエコー抑圧装置。
【請求項6】
前記エコー除去部により残留エコーが除去された信号に対してエコーを抑圧する処理を行うエコーサプレッサをさらに備えた
ことを特徴とする請求項1から5のいずれか一項に記載のエコー抑圧装置。
【請求項7】
前記コンプレッサは、周波数帯域毎に前記受話信号の値と第3閾値とを比較し、前記ダブルトーク検知部により前記ダブルトーク状態であると検知された場合に、前記受話信号の値が前記第3閾値より大きい信号に対して圧縮処理を行う
ことを特徴とする請求項1から6のいずれか一項に記載のエコー抑圧装置。
【請求項8】
スピーカとマイクロホンとを有する近端端末においてエコーを抑圧するエコー抑圧方法であって、
前記マイクロホンから入力された信号を伝送する送話側信号経路及び前記スピーカへ信号を伝送する受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するステップと、
前記ダブルトーク状態であると検知された場合に、遠端側からの受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うステップと、
前記圧縮処理後の信号を前記スピーカから出力するステップと、
前記マイクロホンから出力された収音信号から残留エコーを除去するステップと、
を含むことを特徴とするエコー抑圧方法。
【請求項9】
スピーカとマイクロホンとを有する近端端末においてエコーを抑圧するエコー抑圧プログラムであって、
コンピュータを、
前記マイクロホンから入力された信号を伝送する送話側信号経路及び前記スピーカへ信号を伝送する受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するダブルトーク検知部、
前記ダブルトーク状態であると検知された場合に、遠端側からの受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うコンプレッサ、
前記マイクロホンから出力された収音信号から残留エコーを除去するエコー除去部、
として機能させることを特徴とするエコー抑圧プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムに関する。
【背景技術】
【0002】
特許文献1には、送話側信号経路を信号が伝送されておらず、受話側信号経路を信号が伝送されていることが検知された場合に、エコーサプレッサを用いて収音信号に対してエコーを抑圧する処理を行うエコー抑圧装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-201147号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載のエコー抑圧装置では、スピーカやスピーカアンプの性能が低い場合や、スピーカが小型である場合に、非線形エコーが増加し、エコーの消し残りが増加したり、会話音声の品質が劣化したりするおそれがある。
【0005】
本発明はこのような事情に鑑みてなされたもので、非線形エコーの発生を抑制し、音声劣化を抑えることができるエコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明に係るエコー抑圧装置は、例えば、スピーカから出力される音声信号がマイクロホンに入力することによって生じるエコーを抑圧するエコー抑圧装置であって、遠端側からの受話信号を前記スピーカへ信号を伝送する受話側信号経路に設けられたレベル調整部と、前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられ、前記マイクロホンから出力された収音信号から残留エコーを除去するエコー除去部と、前記送話側信号経路及び前記受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するダブルトーク検知部と、を備え、前記レベル調整部は、前記ダブルトーク検知部により前記ダブルトーク状態であると検知された場合に、前記受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行い、前記ダブルトーク検知部により前記ダブルトーク状態であることが検知されなかった場合に、前記受話信号のうちの前記第1閾値より大きい第2閾値より大きい信号に対して圧縮処理を行うコンプレッサを有することを特徴とする。
【0007】
本発明に係るエコー抑圧装置によれば、ダブルトーク状態であると検知された場合に、遠端側からの受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うコンプレッサが、受話信号をスピーカへ信号を伝送する受話側信号経路に設けられている。これにより、非線形エコーの発生を防ぐことができる。その結果、音声劣化を抑えることができる。
【0008】
ここで、前記コンプレッサは、前記ダブルトーク検知部により前記ダブルトーク状態であることが検知されなかった場合に、前記受話信号のうちの前記第1閾値より大きい第2閾値より大きい信号に対して圧縮処理を行ってもよい。これにより、非線形エコーの発生をより確実に防ぐことができる。
【0009】
ここで、前記レベル調整部は、前記受話信号のゲインを調整するゲイン調整部を有し、前記コンプレッサは、前記ゲインが大きくなるにつれて前記第1閾値が小さくなるように閾値調整をして、前記ゲイン調整部から出力された信号に対して処理を行ってもよい。これにより、大きな音声信号がゲイン調整部から出力される場合にも、コンプレッサで音声信号のピークを抑えることで、非線形エコーの発生を抑えることができる。
【0010】
ここで、前記コンプレッサは、前記ゲインが大きくなるにつれて圧縮率を高くしてもよい。これにより、大きな音声信号がゲイン調整部から出力される場合にも、コンプレッサで音声信号のピークを抑えることで、非線形エコーの発生を抑えることができる。
【0011】
ここで、前記コンプレッサは、前記スピーカの歪みに関する情報に基づいて圧縮率を変えてもよい。これにより、非線形エコーの発生を抑えることができる。
【0012】
ここで、前記エコー除去部により残留エコーが除去された信号に対してエコーを抑圧する処理を行うエコーサプレッサをさらに備えてもよい。これにより、外部環境の雑音が大きい等により、スピーカ音量を大きく設定し、非線形エコーが多く発生した場合にも、エコー成分を除去することができる。
【0013】
ここで、前記コンプレッサは、周波数帯域毎に前記受話信号の値と第3閾値とを比較し、前記ダブルトーク検知部により前記ダブルトーク状態であると検知された場合に、前記受話信号の値が前記第3閾値より大きい信号に対して圧縮処理を行ってもよい。これにより、コンプレッサが圧縮させる信号の割合を減らしてより自然な音声とし、これにより通話品質を向上させることができる。
【0014】
上記課題を解決するために、本発明に係るエコー抑圧方法は、例えば、スピーカとマイクロホンとを有する近端端末においてエコーを抑圧するエコー抑圧方法であって、前記マイクロホンから入力された信号を伝送する送話側信号経路及び前記スピーカへ信号を伝送する受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するステップと、前記ダブルトーク状態であると検知された場合に、遠端側からの受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うステップと、前記圧縮処理後の信号を前記スピーカから出力するステップと、前記マイクロホンから出力された収音信号から残留エコーを除去するステップと、を含むことを特徴とする。これにより、非線形エコーの発生を抑制し、音声劣化を抑えることができる。
【0015】
上記課題を解決するために、本発明に係るエコー抑圧プログラムは、例えば、スピーカとマイクロホンとを有する近端端末においてエコーを抑圧するエコー抑圧プログラムであって、コンピュータを、前記マイクロホンから入力された信号を伝送する送話側信号経路及び前記スピーカへ信号を伝送する受話側信号経路に同時に信号が伝送されるダブルトーク状態であるか否かを検知するダブルトーク検知部、前記ダブルトーク状態であると検知された場合に、遠端側からの受話信号のうちの第1閾値より大きい信号に対して圧縮処理を行うコンプレッサ、前記マイクロホンから出力された収音信号から残留エコーを除去するエコー除去部、として機能させることを特徴とする。これにより、非線形エコーの発生を抑制し、音声劣化を抑えることができる。
【発明の効果】
【0016】
本発明によれば、非線形エコーの発生を抑制し、音声劣化を抑えることができる。
【図面の簡単な説明】
【0017】
図1】第1の実施の形態に係るエコー抑圧装置1が設けられた音声通信システム100を模式的に示す図である。
図2】エコー抑圧装置1の概略構成を示すブロック図である。
図3】ダブルトーク状態であると検知された場合のコンプレッサの処理を模式的に示す図である。
図4】ダブルトーク状態であることが検知されなかった場合のコンプレッサの処理を模式的に示す図である。
図5】ゲインが変化したときのコンプレッサの処理を模式的に示す図である。
図6】エコー抑圧装置2の概略構成を示すブロック図である。
図7】エコー抑圧装置3の概略構成を示すブロック図である。
図8】コンプレッサの処理を模式的に示す図である。
【発明を実施するための形態】
【0018】
以下、本発明に係るエコー抑圧装置の実施形態を、図面を参照して詳細に説明する。エコー抑圧装置は、音声通信システムにおいて、通話の際に発生するエコーを抑圧する装置である。
【0019】
<第1の実施の形態>
図1は、第1の実施の形態に係るエコー抑圧装置1が設けられた音声通信システム100を模式的に示す図である。音声通信システム100は、主として、マイクロホン51及びスピーカ52を有する端末50と、2台の携帯電話53、54と、スピーカアンプ55と、エコー抑圧装置1と、を有する。
【0020】
音声通信システム100は、端末50(近端端末)を利用する利用者(近端側にいる利用者A)が、携帯電話54(遠端端末)を利用する利用者(遠端側にいる利用者B)と音声通信を行なうシステムである。携帯電話54を介して入力された音声信号をスピーカ52によって拡声出力し、かつ、近端側にいる利用者の発する音声をマイクロホン51により集音して携帯電話54へ伝送することで、利用者Aは、携帯電話53を把持することなく拡声通話(ハンズフリー通話)が可能となる。携帯電話53と携帯電話54とは、一般的な電話回線により接続されている。
【0021】
エコー抑圧装置1は、スピーカ52から出力される音声信号がマイクロホン51に入力することによって生じるエコーを抑圧するものである。エコー抑圧装置1は、端末50と携帯電話53との間、すなわち、マイクロホン51を介して入力された収音信号を、マイクロホン51から携帯電話53へ伝送する送話側信号経路、及び、遠端側の携帯電話54からの受話信号を携帯電話53からスピーカ52へ伝送する受話側信号経路に設けられる。
【0022】
エコー抑圧装置1は、例えば、音声通信システム100内の通信端末等(例えば、車載装置、会議システム、携帯端末)に搭載される専用ボードとして構築されてもよい。また、エコー抑圧装置1は、例えば、コンピュータのハードウエア及びソフトウエア(エコー抑圧プログラム)によって構成されてもよい。エコー抑圧プログラムは、コンピュータ等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておき、そこからコンピュータにインストールされてもよい。また、エコー抑圧プログラムは、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスク等のリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておいてもよい。
【0023】
図2は、エコー抑圧装置1の概略構成を示すブロック図である。エコー抑圧装置1は、主として、レベル調整部11と、エコー除去部13と、ダブルトーク検知部15と、を有する。図2において、上側の信号経路は送話側信号経路であり、下側の信号経路は受話側信号経路である。
【0024】
レベル調整部11は、受話側信号経路に設けられている。レベル調整部11は、主として、ゲインコントローラ111と、コンプレッサ112とを有する。
【0025】
ゲインコントローラ111は、入力された受話信号のゲインを調整するゲイン調整部である。具体的には、ゲインコントローラ111は、入力した信号を増幅させる程度(ゲイン)を調整することで、出力する信号のレベル(大きさ)を調整する。ゲインコントローラ111は、端末50が搭載されている環境の雑音等によって自動的にゲインを変えるようにしてもよい。また、ツマミ等の入力部が操作されたときに、ゲインコントローラ111は、入力部の位置に基づいてゲインを変えるようにしてもよい。
【0026】
コンプレッサ112には、ゲインコントローラ111から出力された信号が入力される。コンプレッサ112は、入力された受話信号のうち、閾値より大きい受信信号に対して予め定められた係数(係数は1より小さい値)で増幅(すなわち、圧縮)を行い、出力を行うものである。コンプレッサ112については、後に詳述する。
【0027】
なお、本実施の形態では、レベル調整部11がゲインコントローラ111及びコンプレッサ112を有したが、ゲインコントローラ111は必須ではない。ゲインコントローラ111を有しない場合には、携帯電話53から伝送された受話信号がコンプレッサ112に直接入力され、コンプレッサ112は、入力された受話信号のうち閾値より大きい受信信号に対して圧縮を行うようにすればよい。
【0028】
エコー除去部13は、送話側信号経路に設けられており、マイクロホン51から出力された収音信号から残留エコーを除去する。エコー除去部13は、適応フィルタを用いて残留エコーを除去する線形エコーキャンセラである。具体的には、エコー除去部13は、与えられた手順に従ってフィルタ係数を更新して、受話側信号経路を伝送される信号から擬似エコー信号を生成し、送話側信号経路を伝送される信号から擬似エコー信号を減算することで、残留エコーを除去する。なお、適応フィルタについては既に公知であるため、説明を省略する。
【0029】
なお、本実施の形態では、エコー除去部13に適応フィルタを適用したが、エコー除去部13がその他の公知のエコー除去技術を採用することもできる。
【0030】
エコー除去部13で残留エコーが除去された信号は、携帯電話53へ伝送される。また、エコー除去部13で残留エコーが除去された信号は、ダブルトーク検知部15に入力される。
【0031】
ダブルトーク検知部15は、エコー抑圧装置1に入力された音声信号が、シングルトーク状態かダブルトーク状態かを検知する。ここでシングルトークとは、利用者A及び利用者Bのいずれか一方が音声を発しており、送話側信号経路及び受話側信号経路のいずれか一方に信号が伝送されている状態(近端発話又は遠端発話)のことである。ダブルトークとは、利用者A及び利用者Bが両方とも音声を発しており、送話側信号経路及び受話側信号経路に同時に信号が伝送されている状態(近端発話及び遠端発話)のことである。
【0032】
例えば、ダブルトーク検知部15は、学習用信号に基づいて生成された周波数マスクを保持している。学習用信号は、マイクロホン51にスピーカ52から出力された音のみが入力される遠端側の片側発話(シングルトーク)時に送話側信号経路を伝送される信号であり、周波数マスクは、入力された複数の学習用信号のパワースペクトルの値のうちの最大値を取得したものである。
【0033】
そして、ダブルトーク検知部15は、収音信号のパワースペクトルの値と周波数マスクの値とを周波数帯域毎に比較し、収音信号の値が周波数マスクの値を上回る周波数帯域の数が一定値以上の場合には、マイクロホン51から音が入力されており、送話側信号経路を信号が伝送されている(近端発話あり)ことを検知する。また、ダブルトーク検知部15は、受話信号のパワースペクトルの値と周波数マスクの値とを周波数帯域毎に比較し、受話信号の値が周波数マスクの値を上回る周波数帯域の数が一定値以上の場合には、受話側信号経路を信号が伝送されている(遠端発話あり)ことを検知する。
【0034】
ただし、ダブルトーク検知部15は、他の公知の様々な方法を用いてシングルトーク状態かダブルトーク状態かを検知するようにしてもよい。
【0035】
ここで、コンプレッサ112について詳述する。コンプレッサ112には、ダブルトーク検知部15から結果が入力される。コンプレッサ112は、ダブルトーク状態か否かによって異なる処理を行う。
【0036】
図3は、ダブルトーク状態であると検知された場合のコンプレッサ112の処理を模式的に示す図である。コンプレッサ112は、ダブルトーク検知部15によりダブルトーク状態であると検知された場合に、受話信号のうちの閾値Iより大きい信号に対して圧縮処理を行う。
【0037】
図4は、ダブルトーク状態であることが検知されなかった場合のコンプレッサ112の処理を模式的に示す図である。コンプレッサ112は、ダブルトーク検知部15によりダブルトーク状態であることが検知されなかった場合に、受話信号のうちの閾値IIより大きい信号に対して圧縮処理を行う。閾値IIは、閾値Iより大きい。
【0038】
ダブルトーク状態である場合は、エコー除去部13の動作が不安定になりがちである。したがって、閾値Iを低くし、スピーカ52から出力される音声信号のピークを低くして、エコー除去部13が確実に動くようにする。それに対し、ダブルトーク状態でない場合は、音声信号のピークを低くしすぎることによる音声の違和感を覚えやすいため、閾値Iより大きい閾値IIを用いて、音声の品質を保つようにする。
【0039】
図3、4において、実線はコンプレッサ112が圧縮処理をする前の信号であり、点線はコンプレッサ112が圧縮処理をした後の信号である。圧縮処理では、コンプレッサ112は、ゲインコントローラ111から入力された受話信号のうち、閾値I又は閾値IIより大きい受信信号に対して受話信号に予め定められた1以下の係数をかけて、信号の出力レベルを小さくする。
【0040】
その結果、スピーカ52やスピーカ52を保持する筐体、筐体内に設けられた部品等が大きく振動することにより発生する歪音を減らすことができる。特に、スピーカ52やスピーカアンプ55の性能が低かったり、端末50が小型であったり等の場合には、スピーカ52の振動等により歪音が発生しやすいが、音声レベルを下げることで歪音が著しく減少する。
【0041】
スピーカ52での歪音を減らすことにより、マイクロホン51で収音されてエコー除去部13に入力される信号に非線形エコーがほとんど含まれなくなり、エコー除去部13で十分にエコーを除去することができる。
【0042】
また、コンプレッサ112は、閾値I又は閾値IIより小さい受信信号に対しては、圧縮処理を行わず、入力された信号をそのまま出力する。そのため、スピーカ52の音量変化による違和感や音声の途切れが大きく軽減される。
【0043】
本実施の形態によれば、閾値I又は閾値IIより大きい信号に対して圧縮処理を行うことで、非線形エコーの発生を防ぎ、エコー除去部13の挙動を安定させることができる。これにより、エコーの消し残りを減らしつつ、音声劣化を抑えることができる。
【0044】
また、本実施の形態によれば、非線形エコーが発生しにくいため、線形エコーを除去するエコー除去部13のみで済み、エコーを除去するのに必要な計算量を減らすことができる。
【0045】
例えば、コンプレッサ112を有しない場合には、非線形エコーが大きく、エコーを消すためには従来技術のようにエコーサプレッサが必須になる。したがって、常時、大量の計算が必要になり、処理が遅延してしまう。また、例えば、非線形エコーを消すために、ボルテラフィルタ等の非線形適応フィルタを用いたエコー除去部を用いることも考えられるが、莫大な計算量(線形エコーキャンセラの10倍以上)が必要となってしまう。
【0046】
それに対し、本実施の形態によれば、スピーカ52等の振動を抑えることで、受話側で受けた受話信号とスピーカ52から出力される音声信号との差が小さくなり、それにより非線形エコーの発生を抑え、線形エコーキャンセラであるエコー除去部13のみで十分にエコーを除去することができる。
【0047】
なお、本実施の形態では、コンプレッサ112は、ダブルトーク状態であると検知された場合に、閾値Iより大きい受話信号に対して圧縮処理を行い、ダブルトーク状態であることが検知されなかった場合に、閾値II(閾値Iより大きい)より大きい受話信号に対して圧縮処理を行ったが、ダブルトーク状態であることが検知されなかった場合に、閾値IIより大きい受話信号に対して圧縮処理を行うことは必須ではない。ただし、非線形エコーの発生を抑えつつ、音声劣化を防止するためには、ダブルトーク状態であると検知された場合及びダブルトーク状態であることが検知されなかった場合の双方において圧縮処理を行うことが望ましい。
【0048】
また、本実施の形態では、コンプレッサ112は、ダブルトーク検知部15によりダブルトーク状態であると検知された場合に、受話信号のうちの閾値Iより大きい信号に対して圧縮処理を行ったが、ダブルトーク状態であるときに適用する閾値を状況に応じて変動させてもよい。
【0049】
例えば、変動する閾値を閾値Iαとすると、コンプレッサ112は、ゲインコントローラ111において受話信号を増幅させるゲインがある値(値aとする)のときの閾値Iαを閾値Iaと設定し、ゲインが値aより大きくなるにつれて閾値Iαを閾値Iaより小さくし、ゲインが値aより小さくなるにつれて閾値Iαを閾値Iaより大きくする。ただし、閾値Iαの最大値は閾値IIより小さくする。この結果、大きな音声信号がゲインコントローラ111から出力される場合にも、コンプレッサ112で音声信号のピークを抑えることで、非線形エコーの発生を抑えることができる。
【0050】
また、本実施の形態では、コンプレッサ112が圧縮処理において用いる係数(1より小さい値)は一定であったが、圧縮処理において用いる係数を状況に応じて変動させてもよい。
【0051】
図5は、ゲインが変化したときのコンプレッサ112の処理を模式的に示す図である。例えば、変動する係数を係数bとすると、コンプレッサ112は、ゲインコントローラ111において受話信号を増幅させるゲインが値aのときの係数bを係数cと設定し、ゲインが値aより大きくなるにつれて係数bを係数cより小さくし、ゲインが値aより小さくなるにつれて係数bを係数cより大きくする。ここで、圧縮処理において出力レベルが小さくなる割合を圧縮率とすると、係数が小さくなるにつれて圧縮率は高くなる。すなわち、ゲインが大きくなるにつれて圧縮率が高くなり、ゲインが小さくなるにつれて圧縮率が小さくなる。この結果、大きな音声信号がゲインコントローラ111から出力される場合にも、コンプレッサ112で音声信号のピークを抑えることで、非線形エコーの発生を抑えることができる。
【0052】
また、例えば、コンプレッサ112は、スピーカ52の歪みに関する情報に基づいて圧縮率を変えてもよい。ここで、スピーカ52の歪みに関する情報とは、例えば、信号の歪みの程度を表す全高調波歪率(又は、歪率)である。全高調波歪率は、値が小さければスピーカ52の歪みが小さく、値が大きければスピーカ52の歪みが大きいことを示す。したがって、コンプレッサ112は、全高調波歪率が大きい場合には圧縮率を高くし、全高調波歪率が小さくなるにつれて圧縮率を小さくしてもよい。この結果、ひずみが発生しやすいスピーカ52を用いる場合にコンプレッサ112で音声信号のピークを抑えることで、非線形エコーの発生を抑えることができる。
【0053】
<第2の実施の形態>
本発明の第2の実施の形態は、エコーサプレッサを有する形態である。以下、第2の実施の形態に係るエコー抑圧装置2について説明する。エコー抑圧装置2は、特に、車載装置等の外部環境が大きく変化し得る場合に適している。なお、第1の実施の形態に係るエコー抑圧装置1と同一の部分については、同一の符号を付し、説明を省略する。
【0054】
図6は、エコー抑圧装置2の概略構成を示すブロック図である。エコー抑圧装置2は、主として、主として、レベル調整部11と、イコライザー(EQ)12と、エコー除去部13と、エコーサプレッサ14と、ダブルトーク検知部15と、雑音推定部16と、雑音抑圧部17と、イコライザー(EQ)18と、を有する。
【0055】
イコライザー12、18は、音声信号の特定の周波数帯域を強調又は減少させるものである。ただし、イコライザー12、18は必須ではない。
【0056】
エコーサプレッサ14は、エコー除去部13によって線形エコーを消去した後の信号に対して高速フーリエ変換を行い、高速フーリエ変換後の信号に対してエコーサプレス処理(エコーを強く抑圧する処理)を行い、エコーサプレス処理後の信号に対して逆高速フーリエ変換を行うことで、非線形エコーを除去する。エコーサプレス処理は、既に公知であるため、詳細な説明を省略する。
【0057】
なお、エコーサプレッサ14は、ダブルトーク検知部15により、送話側信号経路を信号が伝送されておらず、かつ、受話側信号経路を信号が伝送されていることが検知された場合に、エコー除去部13により残留エコーが除去された信号に対してエコーを抑圧する処理を行うようにしてもよい。
【0058】
ただし、本実施の形態では、コンプレッサ112により非線形エコーが抑えられており、エコー除去部13でエコー成分が十分に除去されているため、エコーサプレッサ14は、実質的に、外部の雑音の音声レベルが大きい場合等スピーカ52の音量を大きく設定し、非線形エコーが多く発生した場合にのみ動作する。
【0059】
なお、本実施の形態では、エコーサプレッサ14で高速フーリエ変換を用いて周波数分析を行なったが、高速フーリエ変換の代わりに、離散フーリエ変換(DFT、Discrete Fourier Transform)を用いて周波数分析を行なうことができる。また、エコーサプレッサ14において、高速フーリエ変換の代わりに逆離散フーリエ変換行ってもよい。
【0060】
雑音推定部16は、エコーサプレッサ14において周波数領域の関数に変換されたエコー除去信号に含まれる雑音成分、すなわち推定雑音信号を周波数領域ごとに推定し、推定した推定雑音信号のパワースペクトル密度に基づいて、エコー除去信号のSN比を推定する。雑音抑圧部17は、雑音推定部16によって推定される推定雑音信号のパワースペクトル密度に基づいて、エコー除去信号から雑音信号を抑圧し、被抑圧信号を生成する。なお、雑音推定部16及び雑音抑圧部17は必須ではない。
【0061】
本実施の形態によれば、非線形エコーが多く発生してしまった場合にも、エコー成分を除去することができる。例えば車載装置では、車の走行により外部環境が大きく変化し得る。そして、外部雑音が大きい場合には、スピーカ52の音が聞こえにくく、スピーカ52の音量を上げたり、遠端側の利用者Bの話す声の大きさを大きくしたりする必要があり、その結果線形エコー及び非線形エコーが増加する。線形エコーについてはエコー除去部13で除去可能であるが、非線形エコーはエコー除去部13で除去できない。本実施の形態では、エコーサプレッサ14を有するため、非線形エコーが多く発生してしまった場合にも、エコー成分を除去することができる。
【0062】
<第3の実施の形態>
第3の実施の形態は、周波数帯域毎にコンプレッサ―の動作が異なる形態である。以下、第3の実施の形態に係るエコー抑圧装置3について説明する。なお、第1の実施の形態に係るエコー抑圧装置1と同一の部分については、同一の符号を付し、説明を省略する。
【0063】
図7は、エコー抑圧装置3の概略構成を示すブロック図である。エコー抑圧装置3は、主として、レベル調整部11Aと、エコー除去部13と、ダブルトーク検知部15と、を有する。レベル調整部11Aは、主として、ゲインコントローラ111と、コンプレッサ112Aとを有する。
【0064】
コンプレッサ112Aは、周波数帯域毎に音声レベルと閾値とを比較し、音声レベルが閾値より大きい周波数帯域については受話信号に圧縮処理を行う。コンプレッサ112Aは、フーリエ変換及び逆フーリエ変換を行う処理部を有する。
【0065】
コンプレッサ112Aは、受話信号をフーリエ変換することで、単位時間当たりの平均エネルギーであるパワーを周波数帯域毎に分割し、周波数帯域毎のパワーを周波数の関数として表したパワースペクトルを単位時間毎に計算する。そして、コンプレッサ112Aは、周波数帯域毎に受話信号の値と閾値とを比較し、閾値以上の周波数帯域の信号について圧縮処理を行う。
【0066】
図8は、コンプレッサ112Aの処理を模式的に示す図である。図8の実線は受話信号を示す。コンプレッサ112Aは、ダブルトーク検知部15によりダブルトーク状態であると検知された場合に、信号の値が閾値IIIより大きい周波数帯域の信号に対して圧縮処理を行う。図8の点線は、コンプレッサ112Aが閾値IIIより大きい信号に対して圧縮処理をした後の信号である。また、コンプレッサ112Aは、ダブルトーク検知部15によりダブルトーク状態であることが検知されなかった場合に、信号の値が閾値IVより大きい周波数帯域の信号に対して圧縮処理を行う。図8の破線は、コンプレッサ112Aが閾値IVより大きい信号に対して圧縮処理をした後の信号である。閾値IVは、閾値IIIより大きい。
【0067】
コンプレッサ112Aは、圧縮後の信号を逆フーリエ変換したものを出力する。
【0068】
本実施の形態によれば、周波数帯域毎に圧縮処理の有無を変えることで、コンプレッサ112が圧縮させる信号の割合を減らしてより自然な音声とし、これにより通話品質を向上させることができる。
【0069】
なお、本実施の形態では、コンプレッサ112Aは、周波数帯域によらず閾値III又は閾値IVより大きい周波数帯域の信号に対して圧縮処理を行ったが、周波数帯域によって閾値を変えてもよい。例えば、周波数が低い音声成分は歪みの原因となりやすいので、周波数が低くなるほど閾値を小さくし、周波数が高くなるほど閾値を大きくしてもよい。
【0070】
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0071】
1、2、3:エコー抑圧装置
11、11A:レベル調整部
12 :イコライザー
13 :エコー除去部
14 :エコーサプレッサ
15 :ダブルトーク検知部
16 :雑音推定部
17 :雑音抑圧部
18 :イコライザー
50 :端末
51 :マイクロホン
52 :スピーカ
53 :携帯電話
54 :携帯電話
55 :スピーカアンプ
100 :音声通信システム
111 :ゲインコントローラ
112、112A:コンプレッサ
図1
図2
図3
図4
図5
図6
図7
図8