IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社トランストロンの特許一覧

特許7043344エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
<>
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図1
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図2
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図3
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図4
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図5
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図6
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図7
  • 特許-エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-18
(45)【発行日】2022-03-29
(54)【発明の名称】エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
(51)【国際特許分類】
   G10L 19/028 20130101AFI20220322BHJP
   G10L 21/0208 20130101ALI20220322BHJP
【FI】
G10L19/028
G10L21/0208 100B
【請求項の数】 9
(21)【出願番号】P 2018095767
(22)【出願日】2018-05-17
(65)【公開番号】P2019200366
(43)【公開日】2019-11-21
【審査請求日】2020-11-10
(73)【特許権者】
【識別番号】391008559
【氏名又は名称】株式会社トランストロン
(74)【代理人】
【識別番号】100170070
【弁理士】
【氏名又は名称】坂田 ゆかり
(72)【発明者】
【氏名】里見 祐樹
【審査官】山下 剛史
(56)【参考文献】
【文献】特開2008-287046(JP,A)
【文献】特開2002-169599(JP,A)
【文献】特開平11-74822(JP,A)
【文献】特開2002-41100(JP,A)
【文献】特表2004-534263(JP,A)
【文献】米国特許第6522746(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-25/93
(57)【特許請求の範囲】
【請求項1】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、前記エコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成部であって、前記エコー除去信号の各周波数帯域のSN比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
を備えことを特徴とするエコー抑圧装置。
【請求項2】
前記重畳部は、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する
ことを特徴とする請求項1に記載のエコー抑圧装置。
【請求項3】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部であって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
を備えたことを特徴とするエコー抑圧装置。
【請求項4】
前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
をさらに備え、
前記雑音推定部は、前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、周波数帯域ごとに前記推定雑音信号を生成し、
前記コンフォートノイズ生成部は、周波数帯域ごとの前記推定雑音信号に基づいて前記コンフォートノイズを周波数帯域ごとに生成する
ことを特徴とする請求項に記載のエコー抑圧装置。
【請求項5】
前記コンフォートノイズ生成部は、各周波数帯域において前記推定雑音信号を一定量だけ小さくしたものを前記コンフォートノイズとする
ことを特徴とする請求項に記載のエコー抑圧装置。
【請求項6】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去してエコー除去信号を生成するエコー除去ステップと、
前記エコー除去信号を周波数領域の関数に変換するステップと、
周波数領域の関数に変換された前記エコー除去信号に基づいて、前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定ステップと、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成ステップであって、前記エコー除去信号の各周波数帯域のSN比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳した信号を時間領域の関数に変換するステップと、
を含むことを特徴とするエコー抑圧方法。
【請求項7】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去するエコー除去ステップと、
前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定ステップと、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップであって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、
を含むことを特徴とするエコー抑圧方法。
【請求項8】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、
コンピュータを、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、前記エコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成部であって、前記エコー除去信号の各周波数帯域のSN比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
して機能させることを特徴とするエコー抑圧プログラム。
【請求項9】
スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、
コンピュータを、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部であって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
して機能させることを特徴とするエコー抑圧プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムに関する。
【背景技術】
【0002】
スピーカ及びマイクが組み込まれた製品、例えば電話会議やテレビ会議用のヘッドセット、車載用の通話装置、及びインターホンなどにおける音響エコーを低減するためのエコー抑圧装置が知られている。
【0003】
エコー抑圧装置は、送話側の音声と受話側の音声における重複部分を低減するため、送話側の音声が無音になってしまい、違和感を生じる場合がある。そこで、エコー抑圧装置は背景雑音としてのコンフォートノイズを、音響エコーが低減された信号に付加する。
【0004】
特許文献1には、不要成分が除去された音声信号に、それに合わせたコンフォートノイズを生成して付加するエコー抑圧装置において、不要成分が除去された後の音声信号に重畳するノイズを発生させるノイズ発生手段と、不要成分除去前の音声信号の信号パワーを測定する信号レベル分析手段と、この信号レベル分析手段による分析結果に応じて、ノイズ発生手段で発生するノイズの特性を可変してコンフォートノイズを生成する可変手段と、この可変手段で生成したコンフォートノイズを不要成分除去後の音声信号に重畳する合成手段とから構成されるエコー抑圧装置が記載されている。
【0005】
特許文献2には、非線形処理手段によって微小雑音が除去された部分の前後で背景雑音の音色を整えて、音声の断裂感を改善するディジタル音声処理装置が記載されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2000-022603号公報
【文献】特開2002-41100号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1、2に記載の発明では、コンフォートノイズを白色雑音信号に基づいて生成している。しかしながら、自動車等の移動体における車載用通話装置のような環境雑音の変化が大きい環境では、白色雑音信号に基づいたコンフォートノイズは実際の環境雑音とは異なる大きさ、音色になる。したがって、コンフォートノイズ付加後の音を聞いた利用者が不自然さを感じるという問題がある。
【0008】
本発明はこのような事情を鑑みてなされたもので、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができるエコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明に係るエコー抑圧装置は、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、を備えることを特徴とする。
【0010】
本発明に係るエコー抑圧装置によれば、入力信号からエコーを除去したエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成し、推定雑音信号に基づいてコンフォートノイズを生成する。言い換えれば、マイクロホンから収音される音の環境雑音に基づいてコンフォートノイズが生成される。これにより、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができる。
【0011】
ここで、前記エコー除去信号を周波数領域の関数に変換する変換部と、前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、をさらに備え、前記雑音推定部は、前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、周波数帯域ごとに前記推定雑音信号を生成し、前記コンフォートノイズ生成部は、周波数帯域ごとの前記推定雑音信号に基づいて前記コンフォートノイズを周波数帯域ごとに生成してもよい。これにより、より環境の騒音に近いコンフォートノイズを作ることができる。
【0012】
ここで、前記コンフォートノイズ生成部は、各周波数帯域において前記推定雑音信号を一定量だけ小さくしたものを前記コンフォートノイズとてもよい。これにより、推定雑音信号をそのままコンフォートノイズとする構成に比べてSN比が良好になり、コンフォートノイズが大きすぎて音声信号が不明瞭になることを防ぐことができる。
【0013】
ここで、前記コンフォートノイズ生成部は、前記エコー除去信号の各周波数帯域のSN比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとしてもよい。これにより、コンフォートノイズが大きすぎて音声信号が不明瞭になることを防ぐことができる。また、広い周波数帯域に渡って入力信号のSN比を略一定にすることができるため、違和感の少ない自然なコンフォートノイズとすることができる。
【0014】
ここで、前記重畳部は、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳してもよい。これにより、パワーの小さい周波数帯域にのみコンフォートノイズを重畳することができるため、出力信号の全体の音量を抑えつつ、必要なノイズのみを付加することができる。すなわち、コンフォートノイズが重畳された音の違和感を少なくすると共に、エコー抑圧装置から出力される音声信号をより明瞭にすることができる。
【0015】
上記課題を解決するために、本発明に係るエコー抑圧方法は、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去するエコー除去ステップと、前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定ステップと、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズステップと、前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、を含むことを特徴とする。
【0016】
上記課題を解決するために、本発明に係るエコー抑圧プログラムは、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、コンピュータを、前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができる。
【図面の簡単な説明】
【0018】
図1】第1の実施の形態に係るエコー抑圧装置1が設けられた音声通信システム100を模式的に示す図である。
図2】エコー抑圧装置1の概略構成を示すブロック図である。
図3】エコー抑圧装置1が有する雑音推定部22の機能ブロック図である。
図4】重畳部25が行う処理を模式的に示す図であり、(a)は無音時の被抑圧信号のパワースペクトル密度であり、(b)は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、(c)は有音時の被抑圧信号のパワースペクトル密度であり、(d)は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。
図5】エコー抑圧装置1が行う処理の流れを示すフローチャートである。
図6】従来のコンフォートノイズ重畳処理を模式的に示す図であり、(a)は無音時の被抑圧信号のパワースペクトル密度であり、(b)は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、(c)は有音時の被抑圧信号のパワースペクトル密度であり、(d)は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。
図7】エコー抑圧装置1Aの概略構成を示すブロック図である。
図8】エコー抑圧装置1Bの概略構成を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、本発明に係るエコー抑圧装置の実施形態を、図面を参照して詳細に説明する。エコー抑圧装置は、音声通信システムにおいて、通話の際に発生するエコーを抑圧する装置である。
【0020】
<第1の実施の形態>
図1は、第1の実施の形態に係るエコー抑圧装置1が設けられた音声通信システム100を模式的に示す図である。音声通信システム100は、主として、マイクロホン51及びスピーカ52を有する端末50(例えば、車載装置、会議システム、携帯端末)と、2台の携帯電話53、54と、スピーカアンプ55と、エコー抑圧装置1と、を有する。
【0021】
音声通信システム100は、端末50(近端端末)を利用する利用者(近端側にいる利用者A)が、携帯電話54(遠端端末)を利用する利用者(遠端側にいる利用者B)と音声通信を行なうシステムである。携帯電話54を介して入力された音声信号をスピーカ52によって拡声出力し、かつ、近端側にいる利用者の発する音声をマイクロホン51により集音して携帯電話54へ伝送することで、利用者Aは、携帯電話53を把持することなく拡声通話(ハンズフリー通話)が可能となる。携帯電話53と携帯電話54とは、一般的な電話回線により接続されており、相互に通話が可能である。
【0022】
エコー抑圧装置1は、マイクロホン51から入力された入力信号を、端末50から携帯電話53へ伝送する送話側信号経路に設けられる。
【0023】
エコー抑圧装置1は、例えば、音声通信システム100内の端末50等に搭載される専用ボードとして構築されてもよい。また、エコー抑圧装置1は、例えば、コンピュータのハードウエア及びソフトウエア(エコー抑圧プログラム)によって構成されてもよい。エコー抑圧プログラムは、コンピュータ等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておき、そこからコンピュータにインストールされてもよい。また、エコー抑圧プログラムは、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスク等のリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておいてもよい。
【0024】
図2は、エコー抑圧装置1の概略構成を示すブロック図である。エコー抑圧装置1は、マイクロホン51と携帯電話53の送話側の信号入力端531との間に接続されている。図2において、上側の信号経路は、マイクロホン51から入力された入力信号を伝送する送話側信号経路であり、下側の信号経路は、スピーカ52へ信号を伝送する受話側信号経路である。
【0025】
エコー抑圧装置1は、主として、エコー除去部11と、コンフォートノイズ付加部2と、を有する。
【0026】
エコー除去部11は、マイクロホン51により収音される入力信号からエコーを除去する機能部である。エコー除去部11は、携帯電話53により受信される音声信号(参照信号)を取得し、参照信号に基づいて入力信号のエコーを除去する。エコー除去部11は、例えば携帯電話53からの参照信号の位相を180度ずらして入力信号と合成することで、入力信号に内在するエコーを除去し、エコー除去信号を生成する。
【0027】
コンフォートノイズ付加部2は、コンフォートノイズを生成し、生成したコンフォートノイズをエコー除去信号に重畳して出力する機能部である。コンフォートノイズ付加部2は、主として、変換部21と、雑音推定部22と、雑音抑圧部23と、コンフォートノイズ生成部24と、重畳部25と、逆変換部26と、を有する。
【0028】
変換部21は、エコー除去部11からのエコー除去信号を周波数領域の関数に変換する機能部である。変換部21には、時間領域の関数で表したエコー除去信号x(t)が入力される。エコー除去信号x(t)に含まれる音声信号をs(t)、エコー除去信号x(t)に含まれる雑音信号をn(t)とすると、以下の式(1)が成り立つ。
[式1]
x(t)=s(t)+n(t) (t:時間) ・・・(1)
【0029】
変換部21は、式(1)の両辺を周波数領域の関数に変換する。以下の式(2)は、式(1)を周波数領域の関数に変換した結果である。
[式2]
X(ω)=S(ω)+N(ω) (ω:周波数) ・・・(2)
【0030】
本実施形態では、変換部21はエコー除去信号に対してフーリエ変換を行うが、フーリエ変換以外の変換手法を用いて周波数領域の関数に変換してもよい。
【0031】
雑音推定部22及び雑音抑圧部23は、エコー除去信号から雑音を抑制して被抑圧信号を生成するための機能部である。雑音推定部22及び雑音抑圧部23は、本実施形態ではスペクトルサブスクリプション法により雑音を抑制するが、これは例示である。
【0032】
図3は、エコー抑圧装置1が有する雑音推定部22の機能ブロック図である。雑音推定部22は、周波数領域の関数に変換されているエコー除去信号に含まれる雑音成分、すなわち推定雑音信号を周波数領域ごとに推定する機能部である。雑音推定部22は、雑音推定主部221及びSNR推定部222により構成される。
【0033】
雑音推定主部221は、雑音信号N(ω)のパワースペクトルを推定する機能部である。まず、雑音推定主部221は、コンフォートノイズ付加部2の起動時を無音区間として、無音区間4~20フレームの平均値を起動時の雑音信号のパワースペクトル密度とする。起動時の雑音信号のパワースペクトル密度|N(ω,0)|は、式(3)で表される。
[式3]
(N:フレーム)・・・(3)
【0034】
次いで、雑音推定主部221は、t個目のフレームにおけるエコー除去信号のパワースペクトル密度|X(ω,t)|が無音区間すなわち雑音信号のみを含む区間であるか、有音区間、すなわち音声信号及び雑音信号を含む区間であるかを判定する。雑音推定主部221は、t個目のフレームにおけるエコー除去信号のパワースペクトル密度|X(ω,t)|がある閾値Threに対して以下の式(4)を満たすとき、t個目のフレームは無音区間であると判定する。
[式4]
|X(ω,t)|<Thre*|N(ω,t)| ・・・(4)
【0035】
t個目のフレームが無音区間であるとき、t+1個目の雑音信号のパワースペクトル密度|N(ω,t+1)|は、式(5)で表される。
[式5]
|N(ω,t+1)|=α*|N(ω,t)|+(1-α)*|X(ω,t)|
(α:0<α<1の自然数) ・・・(5)
【0036】
雑音推定主部221は、t個目のフレームにおけるエコー除去信号のパワースペクトル密度|X(ω,t)|が式(4)を満たさないとき、t個目のフレームは有音区間であると判定する。
【0037】
t個目のフレームが有音区間であるとき、t+1目のフレームにおける雑音信号のパワースペクトル密度|N(ω,t+1)|は、式(6)で表される。
[式6]
|N(ω,t+1)|=|N(ω,t)| ・・・(6)
【0038】
SNR推定部222は、雑音推定主部221により推定された推定雑音信号のパワースペクトル密度に基づいて、エコー除去信号のSN比を推定する機能部である。SN比、すなわち音声信号のパワースペクトル密度と雑音信号のパワースペクトル密度の比ξ(ω)は、式(7)で表される。
[式7]
・・・(7)
【0039】
ここで、エコー除去信号のパワースペクトル密度X(ω)と音声信号のパワースペクトル密度S(ω)の推定値との関係は、式(8)のように表される。
[式8]
・・・(8)
式(7)及び式(8)を解き、エコー除去信号のパワースペクトル密度X(ω)と音声信号のパワースペクトル密度S(ω)の推定値がそれぞれガウス分布に従うと仮定して計算すると、式(9)に示すようなウィーナー・フィルタが得られる。
[式9]
・・・(9)
【0040】
SNR推定部222は、例えばDecision-Directed法を用いて以下の式(10)で表されるξ(ω)を式(9)に適用することで、エコー除去信号から音声信号の推定値を求める。
[式10]
β:定数 ・・・(10)
ここで、γは式(11)で表される関数である。
[式11]
(σnは雑音信号の分散) ・・・(11)
【0041】
雑音抑圧部23は、雑音推定部22によって推定される推定雑音信号のパワースペクトル密度S(ω)に基づいて、エコー除去信号から雑音信号を抑圧し、被抑圧信号を生成する機能部である。雑音抑圧部23は、雑音推定部22で得られるG(ω)をエコー除去信号のパワースペクトル密度X(ω)に乗じて、すなわち式(8)を計算することにより、音声信号のパワースペクトル密度S(ω)の推定値を算出する。
【0042】
図2の説明に戻る。コンフォートノイズ生成部24は、雑音推定部22によって推定される推定雑音信号のパワースペクトル密度に基づいて、コンフォートノイズを生成する機能部である。言い換えれば、コンフォートノイズ生成部24は、利用者Aのいる環境に合わせたコンフォートノイズを生成する。そして、コンフォートノイズは、利用者Aのいる環境が変化するのに応じて時々刻々と変化する。
【0043】
コンフォートノイズ生成部24は、雑音推定部22が周波数領域ごとに推定した推定雑音信号に基づいて、周波数帯域ごとにコンフォートノイズを生成する。これにより、より環境の騒音に近いコンフォートノイズを作ることができる。
【0044】
また、コンフォートノイズ生成部24は、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとする。推定雑音信号をそのままコンフォートノイズとすると、コンフォートノイズが大きすぎて音声信号が不明瞭になるため、推定雑音信号を小さくしてコンフォートノイズとすることが望ましい。例えば、コンフォートノイズ生成時に推定雑音信号から小さくする量は、1dB~20dB程度である。これにより、比較的単純な計算により推定雑音信号からコンフォートノイズを生成することができるため、コンフォートノイズ付加部2の演算処理に関わる負担を抑えることができる。
【0045】
重畳部25は、雑音抑圧部23により生成される被抑圧信号にコンフォートノイズを重畳する機能部である。重畳部25は、周波数領域毎に、被抑圧信号のパワースペクトル密度にコンフォートノイズのパワースペクトル密度を足し合わせる。すなわち、重畳部25は、周波数領域において両者を重畳する。
【0046】
重畳部25は、被抑圧信号の大きさがコンフォートノイズの大きさを下回る周波数帯域についてのみ、コンフォートノイズのみを被抑圧信号に重畳する。言い換えれば、重畳部25は、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳する。
【0047】
図4は、重畳部25が行う処理を模式的に示す図であり、(a)は無音時の被抑圧信号のパワースペクトル密度であり、(b)は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、(c)は有音時の被抑圧信号のパワースペクトル密度であり、(d)は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。図4(a)、(c)に示す点線はコンフォートノイズのパワースペクトル密度であり、実線は被抑圧信号のパワースペクトル密度である。
【0048】
図4(a)に示すように、無音時は、いずれの周波数帯域においても被抑圧信号のパワースペクトル密度の値が小さい。つまり、コンフォートノイズのパワースペクトル密度は、いずれの周波数帯域においても被抑圧信号のパワースペクトル密度より大きい。したがって、図4(b)に示すように、重畳部25では、すべての周波数帯域について、コンフォートノイズのパワースペクトル密度が被抑圧信号のパワースペクトル密度に重畳される。
【0049】
それに対し、有音時においては、音声信号が存在する周波数帯域のパワースペクトル密度は、コンフォートノイズのパワースペクトル密度より大きい。図4(c)に示す例では、周波数帯域A1において、コンフォートノイズのパワースペクトル密度が被抑圧信号のパワースペクトル密度より大きい。したがって、図4(d)に示すように、重畳部25では、周波数帯域A1にのみ、対応する周波数帯域のコンフォートノイズが被抑圧信号のパワースペクトル密度に重畳される。
【0050】
このように、周波数帯域A1にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳するため、コンフォートノイズを付加した音をより違和感の少ない自然な音とすることができる。
【0051】
なお本実施の形態では、重畳部25は、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳したが、閾値として用いるのはコンフォートノイズのパワースペクトル密度に限られない。例えば、コンフォートノイズのパワースペクトル密度を、全周波数帯域に渡って一定量だけ小さくしたものを閾値として用いてもよい。つまり、重畳部25は、周波数帯域ごとに被抑圧信号の大きさとコンフォートノイズに基づいた閾値とを比較し、被抑圧信号の大きさが閾値を下回る周波数帯域についてのみコンフォートノイズを被抑圧信号に重畳すればよい。
【0052】
なお、重畳部25は、全周波数帯域に渡って、被抑圧信号のパワースペクトル密度をコンフォートノイズのパワースペクトル密度に重畳してもよい。ただし、コンフォートノイズを付加した音をより違和感の少ない自然な音とするためには、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳することが望ましい。
【0053】
図2の説明に戻る。逆変換部26は、コンフォートノイズが重畳されている被抑圧信号のパワースペクトル密度を逆変換し、時間領域の関数に変換する機能部である。逆変換部26は、例えば逆フーリエ変換を行う。逆変換部26により変換された時間領域の出力信号は、送話側の信号入力端531に入力され、携帯電話53を介して利用者Bが有する携帯電話54に伝達される。
【0054】
図5は、エコー抑圧装置1が行う処理の流れを示すフローチャートである。図5を用いて、エコー抑圧装置1が収音された入力信号のエコーを除去し、コンフォートノイズと共に出力するまでの処理の流れについて説明する。
【0055】
まず、エコー抑圧装置1は、マイクロホン51から入力信号を収音する(ステップS1)。次に、エコー抑圧装置1は、信号出力端532からの参照信号を受信する(ステップS2)。そして、エコー除去部11は、信号出力端532からの参照信号に基づいて入力信号のエコーを除去する(ステップS3)。
【0056】
変換部21は、エコー除去部11でエコーが除去されたエコー除去信号を、周波数領域の関数に変換する(ステップS4)。
【0057】
雑音推定部22は、ステップS4で求められたエコー除去信号のパワースペクトル密度に基づいて、エコー除去信号に含まれる雑音信号のパワースペクトル密度を推定する(ステップS5)。
【0058】
雑音抑圧部23は、ステップS5で求められた推定雑音信号のパワースペクトル密度を雑音推定部22から取得し、推定雑音信号のパワースペクトル密度に基づいて、変換部21から取得したエコー除去信号の雑音を抑圧し、被抑圧信号を生成する(ステップS6)。
【0059】
コンフォートノイズ生成部24は、ステップS5で求められた推定雑音信号のパワースペクトル密度に基づいてコンフォートノイズを生成する(ステップS7)。
【0060】
次いで、重畳部25は、ステップS6で求められた被抑圧信号のパワースペクトル密度に、ステップS7で求められたコンフォートノイズのパワースペクトル密度を重畳する(ステップS8)。
【0061】
逆変換部26は、ステップS8で重畳部25から出力された信号を時間領域の関数に変換する(ステップS9)。ステップS9で時間領域の関数に変換された信号は、信号入力端531から出力される。エコー抑圧装置1は、ステップS1~S10に示す処理を繰り返し行う。
【0062】
本実施の形態によれば、推定雑音信号に基づいたコンフォートノイズ、すなわち利用者Aのいる環境に合わせたコンフォートノイズを重畳するようにしたため、環境雑音の変化が大きい環境においても、違和感の少ない自然なコンフォートノイズを付加することができる。すなわち、図1に示す利用者Bは、自らの発話の有無に関わらず、利用者A側の自然な環境雑音を聞くことができる。
【0063】
また、本実施の形態によれば、重畳部25において、被抑圧信号の大きさがコンフォートノイズの大きさを下回る周波数帯域についてのみ、コンフォートノイズのみを被抑圧信号に重畳するため、コンフォートノイズが付加された音を、利用者Aの音声が明瞭であり、かつ違和感のない音にすることができる。
【0064】
図6は、従来のコンフォートノイズ重畳処理を模式的に示す図であり、(a)は無音時の被抑圧信号のパワースペクトル密度であり、(b)は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、(c)は有音時の被抑圧信号のパワースペクトル密度であり、(d)は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。図6(a)、(c)に示す点線はコンフォートノイズのパワースペクトル密度であり、実線は被抑圧信号のパワースペクトル密度である。
【0065】
図6に示すような従来のエコー抑圧装置においては、被抑圧信号及びコンフォートノイズのパワースペクトル密度の大きさに関わらず、すべての周波数帯域においてコンフォートノイズを被抑圧信号に重畳する。図6(a)に示すような無音時には、図6(b)に示すようにコンフォートノイズがほぼそのまま出力される。また、従来のエコー抑圧装置は、図6(c)に示すような有音時においても、全ての周波数帯域においてあらかじめ用意されたコンフォートノイズを重畳する。
【0066】
つまり、関連技術におけるエコー抑圧装置においては、被抑圧信号及びコンフォートノイズの重畳を周波数領域で行う必要はなく、被抑圧信号及びコンフォートノイズは時間領域で足し合わせられる。図6(d)に示すように、コンフォートノイズが被抑圧信号に重畳されたパワースペクトル密度は、すべての周波数帯域において大きくなる。そのため、エコー抑圧装置から出力される音は全体的に大きく、不自然な音となってしまう。
【0067】
それに対し、本実施の形態では、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳するため、コンフォートノイズを付加した音をより違和感の少ない自然な音とすることができる。
【0068】
<第2の実施の形態>
第1の実施の形態では、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとしたが、コンフォートノイズの形態はこれに限られない。第2の実施の形態は、推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものをコンフォートノイズとする形態である。以下、第2の実施の形態に係るエコー抑圧装置1Aについて説明する。なお、第1の実施の形態に係るエコー抑圧装置1と同一の部分については、同一の符号を付し、説明を省略する。
【0069】
図7は、エコー抑圧装置1Aの概略構成を示すブロック図である。エコー抑圧装置1Aは、主として、エコー除去部11と、コンフォートノイズ付加部2Aと、を有する。コンフォートノイズ付加部2Aは、主として、変換部21と、雑音推定部22と、雑音抑圧部23と、コンフォートノイズ生成部24Aと、重畳部25と、逆変換部26と、を有する。
【0070】
コンフォートノイズ生成部24Aは、推定雑音信号を、エコー除去信号の各周波数帯域のSN比に基づいて、周波数帯域ごとに異なる割合で小さくしたものをコンフォートノイズとする。
【0071】
具体的には、コンフォートノイズ生成部24Aは、推定雑音信号のパワースペクトル密度に、ウィーナー・フィルタを乗じることによりコンフォートノイズを生成する。雑音信号のパワースペクトル密度が音声信号のパワースペクトル密度に比べて小さい周波数帯域においては、ウィーナー・フィルタの値は小さくなり、コンフォートノイズは比較的小さい値になる。雑音信号のパワースペクトル密度が音声信号のパワースペクトル密度に比べて大きい周波数帯域においては、ウィーナー・フィルタの値は大きくなり、コンフォートノイズは比較的大きい値になる。
【0072】
これにより、広い周波数帯域に渡って入力信号のSN比を略一定にし、違和感の少ない自然なコンフォートノイズを出力すると共に、音声信号をより明瞭に出力することができる。
【0073】
また、雑音抑圧部23が使用するフィルタを使用してコンフォートノイズ生成部24がコンフォートノイズを生成するため、別のフィルタを使用する構成に比べて少ない処理でコンフォートノイズを生成することができる。また、雑音を抑圧するための構成がコンフォートノイズの生成にも利用可能であるため、別途コンフォートノイズを計算及び格納するためのメモリを搭載する必要がなく、コンフォートノイズ付加部2をより簡素な構成、例えば安価で小型な構成にすることができる。
【0074】
ただし、コンフォートノイズ生成部24は、雑音抑圧部23が使用するフィルタ、すなわちウィーナー・フィルタとは異なるフィルタを用いてノイズを抑圧してもよい。エコー除去信号のうち、無音区間と有音区間とでは、推定される抑圧量が異なる。そこで、コンフォートノイズ生成部24が雑音抑圧部23に使用されるフィルタとは異なるフィルタを使用することで、音声信号の有無による推定結果の違いの影響を受けづらくなり、より自然なコンフォートノイズを生成することができる。
【0075】
<第3の実施の形態>
第1の実施の形態では、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとしたが、コンフォートノイズの形態はこれに限られない。第3の実施の形態は、推定雑音信号のパワースペクトル密度の平均値に基づいてコンフォートノイズのレベルを決定する形態である。以下、第3の実施の形態に係るエコー抑圧装置1Bについて説明する。なお、第1の実施の形態に係るエコー抑圧装置1と同一の部分については、同一の符号を付し、説明を省略する。
【0076】
図7は、エコー抑圧装置1Bの概略構成を示すブロック図である。エコー抑圧装置1Bは、主として、エコー除去部11と、コンフォートノイズ付加部2Bと、を有する。コンフォートノイズ付加部2Bは、主として、変換部21と、雑音推定部22と、雑音抑圧部23と、コンフォートノイズ生成部24Bと、重畳部25と、逆変換部26と、を有する。
【0077】
コンフォートノイズ生成部24Bは、推定雑音信号のパワースペクトル密度の平均値(以下、ノイズレベルという)に基づいてコンフォートノイズのレベルを決定する。ノイズレベルが大きい、すなわち推定される雑音のレベルが大きい周波数については、コンフォートノイズ生成部24は、レベルの大きいコンフォートノイズを生成する。ノイズレベルが小さい、すなわち推定される雑音のレベルが小さい周波数については、コンフォートノイズ生成部24は、レベルの小さいコンフォートノイズを生成する。
【0078】
以下、具体的な例を用いて説明する。うるさい環境下、例えばノイズレベルが90dB以上の場合には、各周波数帯域において推定雑音信号を-6dBしたものをコンフォートノイズとする。うるさい環境下ではノイズが支配的であるので、他の場合(後に詳述)よりも推定雑音信号から引くデシベル数を小さくし、コンフォートノイズを大きくする。ただし、推定雑音信号から引くデシベル数は-6dBに限られない。ノイズが支配的な環境では人はノイズの変化を敏感に感じるため、推定雑音信号から引くデシベル数を-6dBより大きくしても良い。
【0079】
静かな環境下、例えばノイズレベルが50dB以下の場合には、各周波数帯域において推定雑音信号を-20dBしたものをコンフォートノイズとする。元々存在する雑音が小さい場合、エコー抑圧によって有音区間と無音区間との間に生じる違和感が小さいため、小さいコンフォートノイズを重畳するだけでも違和感を充分軽減することができる。ただし、静かな環境下ではノイズが支配的でなく、ノイズの変化に人は鈍感である。したがって、推定雑音信号から引くデシベル数を-20dB以上としてコンフォートノイズを更に小さくしたり、コンフォートノイズを0としたりしてもよい。
【0080】
うるさい環境と静かな環境との間の環境下、例えばノイズレベルが50dB~90dBの場合には、各周波数帯域において推定雑音信号を-12dBしたものをコンフォートノイズとする。ここで推定雑音信号から引くデシベル数は、うるさい環境下より小さく、静かな環境下より大きければよく、-12dBに限られない。
【0081】
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0082】
1 :エコー抑圧装置
2 :コンフォートノイズ付加部
11 :エコー除去部
21 :変換部
22 :雑音推定部
23 :雑音抑圧部
24 :コンフォートノイズ生成部
25 :重畳部
26 :逆変換部
50 :端末
51 :マイクロホン
52 :スピーカ
53 :携帯電話
54 :携帯電話
55 :スピーカアンプ
100 :音声通信システム
221 :雑音推定主部
222 :SNR推定部
531 :信号入力端
532 :信号出力端
図1
図2
図3
図4
図5
図6
図7
図8