特許7043344 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社トランストロンの特許一覧

特許7043344エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-03-18

(45)【発行日】2022-03-29

(54)【発明の名称】エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

(51)【国際特許分類】

G10L 19/028 20130101AFI20220322BHJP

G10L 21/0208 20130101ALI20220322BHJP

【ＦＩ】

G10L19/028

G10L21/0208 100B

【請求項の数】 9

(21)【出願番号】P 2018095767

(22)【出願日】2018-05-17

(65)【公開番号】P2019200366

(43)【公開日】2019-11-21

【審査請求日】2020-11-10

(73)【特許権者】

【識別番号】391008559

【氏名又は名称】株式会社トランストロン

(74)【代理人】

【識別番号】100170070

【弁理士】

【氏名又は名称】坂田ゆかり

(72)【発明者】

【氏名】里見祐樹

【審査官】山下剛史

(56)【参考文献】

【文献】特開２００８－２８７０４６（ＪＰ，Ａ）

【文献】特開２００２－１６９５９９（ＪＰ，Ａ）

【文献】特開平１１－７４８２２（ＪＰ，Ａ）

【文献】特開２００２－４１１００（ＪＰ，Ａ）

【文献】特表２００４－５３４２６３（ＪＰ，Ａ）

【文献】米国特許第６５２２７４６（ＵＳ，Ｂ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１９／００－２５／９３

(57)【特許請求の範囲】

【請求項1】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、前記エコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成部であって、前記エコー除去信号の各周波数帯域のＳＮ比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
を備えたことを特徴とするエコー抑圧装置。

【請求項2】

前記重畳部は、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する
ことを特徴とする請求項１に記載のエコー抑圧装置。

【請求項3】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部であって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
を備えたことを特徴とするエコー抑圧装置。

【請求項4】

前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
をさらに備え、
前記雑音推定部は、前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、周波数帯域ごとに前記推定雑音信号を生成し、
前記コンフォートノイズ生成部は、周波数帯域ごとの前記推定雑音信号に基づいて前記コンフォートノイズを周波数帯域ごとに生成する
ことを特徴とする請求項３に記載のエコー抑圧装置。

【請求項5】

前記コンフォートノイズ生成部は、各周波数帯域において前記推定雑音信号を一定量だけ小さくしたものを前記コンフォートノイズとする
ことを特徴とする請求項４に記載のエコー抑圧装置。

【請求項6】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去してエコー除去信号を生成するエコー除去ステップと、
前記エコー除去信号を周波数領域の関数に変換するステップと、
周波数領域の関数に変換された前記エコー除去信号に基づいて、前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定ステップと、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成ステップであって、前記エコー除去信号の各周波数帯域のＳＮ比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳した信号を時間領域の関数に変換するステップと、
を含むことを特徴とするエコー抑圧方法。

【請求項7】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去するエコー除去ステップと、
前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定ステップと、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成ステップと、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップであって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、
を含むことを特徴とするエコー抑圧方法。

【請求項8】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、
コンピュータを、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号を周波数領域の関数に変換する変換部と、
前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、前記エコー除去信号に含まれる雑音信号を周波数帯域ごとに推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
周波数帯域ごとの前記推定雑音信号に基づいて、コンフォートノイズを周波数帯域ごとに生成するコンフォートノイズ生成部であって、前記エコー除去信号の各周波数帯域のＳＮ比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとするコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、
して機能させることを特徴とするエコー抑圧プログラム。

【請求項9】

スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、
コンピュータを、
前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、
前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、
前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、
前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、
前記コンフォートノイズを前記被抑圧信号に重畳する重畳部であって、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、
して機能させることを特徴とするエコー抑圧プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムに関する。

【背景技術】

【0002】

スピーカ及びマイクが組み込まれた製品、例えば電話会議やテレビ会議用のヘッドセット、車載用の通話装置、及びインターホンなどにおける音響エコーを低減するためのエコー抑圧装置が知られている。

【0003】

エコー抑圧装置は、送話側の音声と受話側の音声における重複部分を低減するため、送話側の音声が無音になってしまい、違和感を生じる場合がある。そこで、エコー抑圧装置は背景雑音としてのコンフォートノイズを、音響エコーが低減された信号に付加する。

【0004】

特許文献１には、不要成分が除去された音声信号に、それに合わせたコンフォートノイズを生成して付加するエコー抑圧装置において、不要成分が除去された後の音声信号に重畳するノイズを発生させるノイズ発生手段と、不要成分除去前の音声信号の信号パワーを測定する信号レベル分析手段と、この信号レベル分析手段による分析結果に応じて、ノイズ発生手段で発生するノイズの特性を可変してコンフォートノイズを生成する可変手段と、この可変手段で生成したコンフォートノイズを不要成分除去後の音声信号に重畳する合成手段とから構成されるエコー抑圧装置が記載されている。

【0005】

特許文献２には、非線形処理手段によって微小雑音が除去された部分の前後で背景雑音の音色を整えて、音声の断裂感を改善するディジタル音声処理装置が記載されている。

【先行技術文献】

【特許文献】

【0006】

【文献】特開２０００－０２２６０３号公報

【文献】特開２００２－４１１００号公報

【発明の概要】

【発明が解決しようとする課題】

【0007】

特許文献１、２に記載の発明では、コンフォートノイズを白色雑音信号に基づいて生成している。しかしながら、自動車等の移動体における車載用通話装置のような環境雑音の変化が大きい環境では、白色雑音信号に基づいたコンフォートノイズは実際の環境雑音とは異なる大きさ、音色になる。したがって、コンフォートノイズ付加後の音を聞いた利用者が不自然さを感じるという問題がある。

【0008】

本発明はこのような事情を鑑みてなされたもので、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができるエコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラムを提供することを目的とする。

【課題を解決するための手段】

【0009】

上記課題を解決するために、本発明に係るエコー抑圧装置は、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号を伝送する送話側信号経路に設けられるエコー抑圧装置であって、前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、を備えることを特徴とする。

【0010】

本発明に係るエコー抑圧装置によれば、入力信号からエコーを除去したエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成し、推定雑音信号に基づいてコンフォートノイズを生成する。言い換えれば、マイクロホンから収音される音の環境雑音に基づいてコンフォートノイズが生成される。これにより、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができる。

【0011】

ここで、前記エコー除去信号を周波数領域の関数に変換する変換部と、前記重畳部により生成された信号を時間領域の関数に変換する逆変換部と、をさらに備え、前記雑音推定部は、前記変換部により周波数領域の関数に変換された前記エコー除去信号に基づいて、周波数帯域ごとに前記推定雑音信号を生成し、前記コンフォートノイズ生成部は、周波数帯域ごとの前記推定雑音信号に基づいて前記コンフォートノイズを周波数帯域ごとに生成してもよい。これにより、より環境の騒音に近いコンフォートノイズを作ることができる。

【0012】

ここで、前記コンフォートノイズ生成部は、各周波数帯域において前記推定雑音信号を一定量だけ小さくしたものを前記コンフォートノイズとてもよい。これにより、推定雑音信号をそのままコンフォートノイズとする構成に比べてＳＮ比が良好になり、コンフォートノイズが大きすぎて音声信号が不明瞭になることを防ぐことができる。

【0013】

ここで、前記コンフォートノイズ生成部は、前記エコー除去信号の各周波数帯域のＳＮ比に基づいて、前記推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものを前記コンフォートノイズとしてもよい。これにより、コンフォートノイズが大きすぎて音声信号が不明瞭になることを防ぐことができる。また、広い周波数帯域に渡って入力信号のＳＮ比を略一定にすることができるため、違和感の少ない自然なコンフォートノイズとすることができる。

【0014】

ここで、前記重畳部は、周波数帯域ごとに前記被抑圧信号の大きさと前記コンフォートノイズに基づいた閾値とを比較し、前記被抑圧信号の大きさが前記閾値を下回る周波数帯域についてのみ前記コンフォートノイズを前記被抑圧信号に重畳してもよい。これにより、パワーの小さい周波数帯域にのみコンフォートノイズを重畳することができるため、出力信号の全体の音量を抑えつつ、必要なノイズのみを付加することができる。すなわち、コンフォートノイズが重畳された音の違和感を少なくすると共に、エコー抑圧装置から出力される音声信号をより明瞭にすることができる。

【0015】

上記課題を解決するために、本発明に係るエコー抑圧方法は、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された入力信号からエコーを除去するエコー除去ステップと、前記入力信号からエコーが除去された信号であるエコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定ステップと、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧ステップと、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズステップと、前記コンフォートノイズを前記被抑圧信号に重畳する重畳ステップと、を含むことを特徴とする。

【0016】

上記課題を解決するために、本発明に係るエコー抑圧プログラムは、例えば、スピーカとマイクロホンとを有する端末のうちの前記マイクロホンから入力された信号を伝送する送話側信号経路に設けられるエコー抑圧プログラムであって、コンピュータを、前記入力信号からエコーを除去してエコー除去信号を生成するエコー除去部と、前記エコー除去信号に含まれる雑音信号を推定して推定雑音信号を生成する雑音推定部と、前記推定雑音信号に基づいて、前記エコー除去信号に含まれる前記雑音信号を抑圧して被抑圧信号を生成する雑音抑圧部と、前記推定雑音信号に基づいて、コンフォートノイズを生成するコンフォートノイズ生成部と、前記コンフォートノイズを前記被抑圧信号に重畳する重畳部と、として機能させることを特徴とする。

【発明の効果】

【0017】

本発明によれば、環境雑音の変化が大きい環境においても、自然なコンフォートノイズを付加することができる。

【図面の簡単な説明】

【0018】

【図1】第１の実施の形態に係るエコー抑圧装置１が設けられた音声通信システム１００を模式的に示す図である。

【図2】エコー抑圧装置１の概略構成を示すブロック図である。

【図3】エコー抑圧装置１が有する雑音推定部２２の機能ブロック図である。

【図4】重畳部２５が行う処理を模式的に示す図であり、（ａ）は無音時の被抑圧信号のパワースペクトル密度であり、（ｂ）は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、（ｃ）は有音時の被抑圧信号のパワースペクトル密度であり、（ｄ）は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。

【図5】エコー抑圧装置１が行う処理の流れを示すフローチャートである。

【図6】従来のコンフォートノイズ重畳処理を模式的に示す図であり、（ａ）は無音時の被抑圧信号のパワースペクトル密度であり、（ｂ）は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、（ｃ）は有音時の被抑圧信号のパワースペクトル密度であり、（ｄ）は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。

【図7】エコー抑圧装置１Ａの概略構成を示すブロック図である。

【図8】エコー抑圧装置１Ｂの概略構成を示すブロック図である。

【発明を実施するための形態】

【0019】

以下、本発明に係るエコー抑圧装置の実施形態を、図面を参照して詳細に説明する。エコー抑圧装置は、音声通信システムにおいて、通話の際に発生するエコーを抑圧する装置である。

【0020】

＜第１の実施の形態＞
図１は、第１の実施の形態に係るエコー抑圧装置１が設けられた音声通信システム１００を模式的に示す図である。音声通信システム１００は、主として、マイクロホン５１及びスピーカ５２を有する端末５０（例えば、車載装置、会議システム、携帯端末）と、２台の携帯電話５３、５４と、スピーカアンプ５５と、エコー抑圧装置１と、を有する。

【0021】

音声通信システム１００は、端末５０（近端端末）を利用する利用者（近端側にいる利用者Ａ）が、携帯電話５４（遠端端末）を利用する利用者（遠端側にいる利用者Ｂ）と音声通信を行なうシステムである。携帯電話５４を介して入力された音声信号をスピーカ５２によって拡声出力し、かつ、近端側にいる利用者の発する音声をマイクロホン５１により集音して携帯電話５４へ伝送することで、利用者Ａは、携帯電話５３を把持することなく拡声通話（ハンズフリー通話）が可能となる。携帯電話５３と携帯電話５４とは、一般的な電話回線により接続されており、相互に通話が可能である。

【0022】

エコー抑圧装置１は、マイクロホン５１から入力された入力信号を、端末５０から携帯電話５３へ伝送する送話側信号経路に設けられる。

【0023】

エコー抑圧装置１は、例えば、音声通信システム１００内の端末５０等に搭載される専用ボードとして構築されてもよい。また、エコー抑圧装置１は、例えば、コンピュータのハードウエア及びソフトウエア（エコー抑圧プログラム）によって構成されてもよい。エコー抑圧プログラムは、コンピュータ等の機器に内蔵されている記憶媒体としてのＨＤＤや、ＣＰＵを有するマイクロコンピュータ内のＲＯＭ等に予め記憶しておき、そこからコンピュータにインストールされてもよい。また、エコー抑圧プログラムは、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスク等のリムーバブル記憶媒体に、一時的あるいは永続的に格納（記憶）しておいてもよい。

【0024】

図２は、エコー抑圧装置１の概略構成を示すブロック図である。エコー抑圧装置１は、マイクロホン５１と携帯電話５３の送話側の信号入力端５３１との間に接続されている。図２において、上側の信号経路は、マイクロホン５１から入力された入力信号を伝送する送話側信号経路であり、下側の信号経路は、スピーカ５２へ信号を伝送する受話側信号経路である。

【0025】

エコー抑圧装置１は、主として、エコー除去部１１と、コンフォートノイズ付加部２と、を有する。

【0026】

エコー除去部１１は、マイクロホン５１により収音される入力信号からエコーを除去する機能部である。エコー除去部１１は、携帯電話５３により受信される音声信号（参照信号）を取得し、参照信号に基づいて入力信号のエコーを除去する。エコー除去部１１は、例えば携帯電話５３からの参照信号の位相を１８０度ずらして入力信号と合成することで、入力信号に内在するエコーを除去し、エコー除去信号を生成する。

【0027】

コンフォートノイズ付加部２は、コンフォートノイズを生成し、生成したコンフォートノイズをエコー除去信号に重畳して出力する機能部である。コンフォートノイズ付加部２は、主として、変換部２１と、雑音推定部２２と、雑音抑圧部２３と、コンフォートノイズ生成部２４と、重畳部２５と、逆変換部２６と、を有する。

【0028】

変換部２１は、エコー除去部１１からのエコー除去信号を周波数領域の関数に変換する機能部である。変換部２１には、時間領域の関数で表したエコー除去信号ｘ（ｔ）が入力される。エコー除去信号ｘ（ｔ）に含まれる音声信号をｓ（ｔ）、エコー除去信号ｘ（ｔ）に含まれる雑音信号をｎ（ｔ）とすると、以下の式（１）が成り立つ。
［式１］
ｘ（ｔ）＝ｓ（ｔ）＋ｎ（ｔ）（ｔ：時間）・・・（１）

【0029】

変換部２１は、式（１）の両辺を周波数領域の関数に変換する。以下の式（２）は、式（１）を周波数領域の関数に変換した結果である。
［式２］
Ｘ（ω）＝Ｓ（ω）＋Ｎ（ω）（ω：周波数）・・・（２）

【0030】

本実施形態では、変換部２１はエコー除去信号に対してフーリエ変換を行うが、フーリエ変換以外の変換手法を用いて周波数領域の関数に変換してもよい。

【0031】

雑音推定部２２及び雑音抑圧部２３は、エコー除去信号から雑音を抑制して被抑圧信号を生成するための機能部である。雑音推定部２２及び雑音抑圧部２３は、本実施形態ではスペクトルサブスクリプション法により雑音を抑制するが、これは例示である。

【0032】

図３は、エコー抑圧装置１が有する雑音推定部２２の機能ブロック図である。雑音推定部２２は、周波数領域の関数に変換されているエコー除去信号に含まれる雑音成分、すなわち推定雑音信号を周波数領域ごとに推定する機能部である。雑音推定部２２は、雑音推定主部２２１及びＳＮＲ推定部２２２により構成される。

【0033】

雑音推定主部２２１は、雑音信号Ｎ（ω）のパワースペクトルを推定する機能部である。まず、雑音推定主部２２１は、コンフォートノイズ付加部２の起動時を無音区間として、無音区間４～２０フレームの平均値を起動時の雑音信号のパワースペクトル密度とする。起動時の雑音信号のパワースペクトル密度｜Ｎ（ω，0）｜は、式（３）で表される。
［式３］

（Ｎ：フレーム）・・・（３）

【0034】

次いで、雑音推定主部２２１は、ｔ個目のフレームにおけるエコー除去信号のパワースペクトル密度｜Ｘ（ω，ｔ）｜が無音区間すなわち雑音信号のみを含む区間であるか、有音区間、すなわち音声信号及び雑音信号を含む区間であるかを判定する。雑音推定主部２２１は、ｔ個目のフレームにおけるエコー除去信号のパワースペクトル密度｜Ｘ（ω，ｔ）｜がある閾値Ｔｈｒｅに対して以下の式（４）を満たすとき、ｔ個目のフレームは無音区間であると判定する。
［式４］
｜Ｘ（ω,ｔ）|^２＜Ｔｈｒｅ＊｜Ｎ（ω,ｔ）|^２・・・（４）

【0035】

ｔ個目のフレームが無音区間であるとき、ｔ＋１個目の雑音信号のパワースペクトル密度｜Ｎ（ω，ｔ＋１）｜は、式（５）で表される。
［式５］
｜Ｎ（ω,ｔ＋１）|^２＝α＊｜Ｎ（ω,ｔ）|^２＋（１－α）＊｜Ｘ（ω,ｔ）|^２
（α：０＜α＜１の自然数）・・・（５）

【0036】

雑音推定主部２２１は、ｔ個目のフレームにおけるエコー除去信号のパワースペクトル密度｜Ｘ（ω，ｔ）｜が式（４）を満たさないとき、ｔ個目のフレームは有音区間であると判定する。

【0037】

ｔ個目のフレームが有音区間であるとき、ｔ＋１目のフレームにおける雑音信号のパワースペクトル密度｜Ｎ（ω，ｔ＋１）｜は、式（６）で表される。
［式６］
｜Ｎ（ω,ｔ＋１）|^２＝｜Ｎ（ω,ｔ）|^２・・・（６）

【0038】

ＳＮＲ推定部２２２は、雑音推定主部２２１により推定された推定雑音信号のパワースペクトル密度に基づいて、エコー除去信号のＳＮ比を推定する機能部である。ＳＮ比、すなわち音声信号のパワースペクトル密度と雑音信号のパワースペクトル密度の比ξ（ω）は、式（７）で表される。
［式７］

・・・（７）

【0039】

ここで、エコー除去信号のパワースペクトル密度Ｘ（ω）と音声信号のパワースペクトル密度Ｓ（ω）の推定値との関係は、式（８）のように表される。
［式８］

・・・（８）
式（７）及び式（８）を解き、エコー除去信号のパワースペクトル密度Ｘ（ω）と音声信号のパワースペクトル密度Ｓ（ω）の推定値がそれぞれガウス分布に従うと仮定して計算すると、式（９）に示すようなウィーナー・フィルタが得られる。
［式９］

・・・（９）

【0040】

ＳＮＲ推定部２２２は、例えばＤｅｃｉｓｉｏｎ－Ｄｉｒｅｃｔｅｄ法を用いて以下の式（１０）で表されるξ（ω）を式（９）に適用することで、エコー除去信号から音声信号の推定値を求める。
［式１０］

β：定数・・・（１０）
ここで、γは式（１１）で表される関数である。
［式１１］

（σｎ^２は雑音信号の分散）・・・（１１）

【0041】

雑音抑圧部２３は、雑音推定部２２によって推定される推定雑音信号のパワースペクトル密度Ｓ（ω）に基づいて、エコー除去信号から雑音信号を抑圧し、被抑圧信号を生成する機能部である。雑音抑圧部２３は、雑音推定部２２で得られるＧ（ω）をエコー除去信号のパワースペクトル密度Ｘ（ω）に乗じて、すなわち式（８）を計算することにより、音声信号のパワースペクトル密度Ｓ（ω）の推定値を算出する。

【0042】

図２の説明に戻る。コンフォートノイズ生成部２４は、雑音推定部２２によって推定される推定雑音信号のパワースペクトル密度に基づいて、コンフォートノイズを生成する機能部である。言い換えれば、コンフォートノイズ生成部２４は、利用者Ａのいる環境に合わせたコンフォートノイズを生成する。そして、コンフォートノイズは、利用者Ａのいる環境が変化するのに応じて時々刻々と変化する。

【0043】

コンフォートノイズ生成部２４は、雑音推定部２２が周波数領域ごとに推定した推定雑音信号に基づいて、周波数帯域ごとにコンフォートノイズを生成する。これにより、より環境の騒音に近いコンフォートノイズを作ることができる。

【0044】

また、コンフォートノイズ生成部２４は、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとする。推定雑音信号をそのままコンフォートノイズとすると、コンフォートノイズが大きすぎて音声信号が不明瞭になるため、推定雑音信号を小さくしてコンフォートノイズとすることが望ましい。例えば、コンフォートノイズ生成時に推定雑音信号から小さくする量は、１ｄＢ～２０ｄＢ程度である。これにより、比較的単純な計算により推定雑音信号からコンフォートノイズを生成することができるため、コンフォートノイズ付加部２の演算処理に関わる負担を抑えることができる。

【0045】

重畳部２５は、雑音抑圧部２３により生成される被抑圧信号にコンフォートノイズを重畳する機能部である。重畳部２５は、周波数領域毎に、被抑圧信号のパワースペクトル密度にコンフォートノイズのパワースペクトル密度を足し合わせる。すなわち、重畳部２５は、周波数領域において両者を重畳する。

【0046】

重畳部２５は、被抑圧信号の大きさがコンフォートノイズの大きさを下回る周波数帯域についてのみ、コンフォートノイズのみを被抑圧信号に重畳する。言い換えれば、重畳部２５は、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳する。

【0047】

図４は、重畳部２５が行う処理を模式的に示す図であり、（ａ）は無音時の被抑圧信号のパワースペクトル密度であり、（ｂ）は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、（ｃ）は有音時の被抑圧信号のパワースペクトル密度であり、（ｄ）は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。図４（ａ）、（ｃ）に示す点線はコンフォートノイズのパワースペクトル密度であり、実線は被抑圧信号のパワースペクトル密度である。

【0048】

図４（ａ）に示すように、無音時は、いずれの周波数帯域においても被抑圧信号のパワースペクトル密度の値が小さい。つまり、コンフォートノイズのパワースペクトル密度は、いずれの周波数帯域においても被抑圧信号のパワースペクトル密度より大きい。したがって、図４（ｂ）に示すように、重畳部２５では、すべての周波数帯域について、コンフォートノイズのパワースペクトル密度が被抑圧信号のパワースペクトル密度に重畳される。

【0049】

それに対し、有音時においては、音声信号が存在する周波数帯域のパワースペクトル密度は、コンフォートノイズのパワースペクトル密度より大きい。図４（ｃ）に示す例では、周波数帯域Ａ１において、コンフォートノイズのパワースペクトル密度が被抑圧信号のパワースペクトル密度より大きい。したがって、図４（ｄ）に示すように、重畳部２５では、周波数帯域Ａ１にのみ、対応する周波数帯域のコンフォートノイズが被抑圧信号のパワースペクトル密度に重畳される。

【0050】

このように、周波数帯域Ａ１にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳するため、コンフォートノイズを付加した音をより違和感の少ない自然な音とすることができる。

【0051】

なお本実施の形態では、重畳部２５は、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳したが、閾値として用いるのはコンフォートノイズのパワースペクトル密度に限られない。例えば、コンフォートノイズのパワースペクトル密度を、全周波数帯域に渡って一定量だけ小さくしたものを閾値として用いてもよい。つまり、重畳部２５は、周波数帯域ごとに被抑圧信号の大きさとコンフォートノイズに基づいた閾値とを比較し、被抑圧信号の大きさが閾値を下回る周波数帯域についてのみコンフォートノイズを被抑圧信号に重畳すればよい。

【0052】

なお、重畳部２５は、全周波数帯域に渡って、被抑圧信号のパワースペクトル密度をコンフォートノイズのパワースペクトル密度に重畳してもよい。ただし、コンフォートノイズを付加した音をより違和感の少ない自然な音とするためには、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳することが望ましい。

【0053】

図２の説明に戻る。逆変換部２６は、コンフォートノイズが重畳されている被抑圧信号のパワースペクトル密度を逆変換し、時間領域の関数に変換する機能部である。逆変換部２６は、例えば逆フーリエ変換を行う。逆変換部２６により変換された時間領域の出力信号は、送話側の信号入力端５３１に入力され、携帯電話５３を介して利用者Ｂが有する携帯電話５４に伝達される。

【0054】

図５は、エコー抑圧装置１が行う処理の流れを示すフローチャートである。図５を用いて、エコー抑圧装置１が収音された入力信号のエコーを除去し、コンフォートノイズと共に出力するまでの処理の流れについて説明する。

【0055】

まず、エコー抑圧装置１は、マイクロホン５１から入力信号を収音する（ステップＳ１）。次に、エコー抑圧装置１は、信号出力端５３２からの参照信号を受信する（ステップＳ２）。そして、エコー除去部１１は、信号出力端５３２からの参照信号に基づいて入力信号のエコーを除去する（ステップＳ３）。

【0056】

変換部２１は、エコー除去部１１でエコーが除去されたエコー除去信号を、周波数領域の関数に変換する（ステップＳ４）。

【0057】

雑音推定部２２は、ステップＳ４で求められたエコー除去信号のパワースペクトル密度に基づいて、エコー除去信号に含まれる雑音信号のパワースペクトル密度を推定する（ステップＳ５）。

【0058】

雑音抑圧部２３は、ステップＳ５で求められた推定雑音信号のパワースペクトル密度を雑音推定部２２から取得し、推定雑音信号のパワースペクトル密度に基づいて、変換部２１から取得したエコー除去信号の雑音を抑圧し、被抑圧信号を生成する（ステップＳ６）。

【0059】

コンフォートノイズ生成部２４は、ステップＳ５で求められた推定雑音信号のパワースペクトル密度に基づいてコンフォートノイズを生成する（ステップＳ７）。

【0060】

次いで、重畳部２５は、ステップＳ６で求められた被抑圧信号のパワースペクトル密度に、ステップＳ７で求められたコンフォートノイズのパワースペクトル密度を重畳する（ステップＳ８）。

【0061】

逆変換部２６は、ステップＳ８で重畳部２５から出力された信号を時間領域の関数に変換する（ステップＳ９）。ステップＳ９で時間領域の関数に変換された信号は、信号入力端５３１から出力される。エコー抑圧装置１は、ステップＳ１～Ｓ１０に示す処理を繰り返し行う。

【0062】

本実施の形態によれば、推定雑音信号に基づいたコンフォートノイズ、すなわち利用者Ａのいる環境に合わせたコンフォートノイズを重畳するようにしたため、環境雑音の変化が大きい環境においても、違和感の少ない自然なコンフォートノイズを付加することができる。すなわち、図１に示す利用者Ｂは、自らの発話の有無に関わらず、利用者Ａ側の自然な環境雑音を聞くことができる。

【0063】

また、本実施の形態によれば、重畳部２５において、被抑圧信号の大きさがコンフォートノイズの大きさを下回る周波数帯域についてのみ、コンフォートノイズのみを被抑圧信号に重畳するため、コンフォートノイズが付加された音を、利用者Ａの音声が明瞭であり、かつ違和感のない音にすることができる。

【0064】

図６は、従来のコンフォートノイズ重畳処理を模式的に示す図であり、（ａ）は無音時の被抑圧信号のパワースペクトル密度であり、（ｂ）は無音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度であり、（ｃ）は有音時の被抑圧信号のパワースペクトル密度であり、（ｄ）は有音時の被抑圧信号にコンフォートノイズが重畳された信号のパワースペクトル密度である。図６（ａ）、（ｃ）に示す点線はコンフォートノイズのパワースペクトル密度であり、実線は被抑圧信号のパワースペクトル密度である。

【0065】

図６に示すような従来のエコー抑圧装置においては、被抑圧信号及びコンフォートノイズのパワースペクトル密度の大きさに関わらず、すべての周波数帯域においてコンフォートノイズを被抑圧信号に重畳する。図６（ａ）に示すような無音時には、図６（ｂ）に示すようにコンフォートノイズがほぼそのまま出力される。また、従来のエコー抑圧装置は、図６（ｃ）に示すような有音時においても、全ての周波数帯域においてあらかじめ用意されたコンフォートノイズを重畳する。

【0066】

つまり、関連技術におけるエコー抑圧装置においては、被抑圧信号及びコンフォートノイズの重畳を周波数領域で行う必要はなく、被抑圧信号及びコンフォートノイズは時間領域で足し合わせられる。図６（ｄ）に示すように、コンフォートノイズが被抑圧信号に重畳されたパワースペクトル密度は、すべての周波数帯域において大きくなる。そのため、エコー抑圧装置から出力される音は全体的に大きく、不自然な音となってしまう。

【0067】

それに対し、本実施の形態では、コンフォートノイズのパワースペクトル密度を閾値として、被抑圧信号のパワースペクトル密度がコンフォートノイズのパワースペクトル密度を下回る周波数帯域にのみ、対応する周波数帯域のコンフォートノイズを被抑圧信号のパワースペクトル密度に重畳するため、コンフォートノイズを付加した音をより違和感の少ない自然な音とすることができる。

【0068】

＜第２の実施の形態＞
第１の実施の形態では、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとしたが、コンフォートノイズの形態はこれに限られない。第２の実施の形態は、推定雑音信号を周波数帯域ごとに異なる割合で小さくしたものをコンフォートノイズとする形態である。以下、第２の実施の形態に係るエコー抑圧装置１Ａについて説明する。なお、第１の実施の形態に係るエコー抑圧装置１と同一の部分については、同一の符号を付し、説明を省略する。

【0069】

図７は、エコー抑圧装置１Ａの概略構成を示すブロック図である。エコー抑圧装置１Ａは、主として、エコー除去部１１と、コンフォートノイズ付加部２Ａと、を有する。コンフォートノイズ付加部２Ａは、主として、変換部２１と、雑音推定部２２と、雑音抑圧部２３と、コンフォートノイズ生成部２４Ａと、重畳部２５と、逆変換部２６と、を有する。

【0070】

コンフォートノイズ生成部２４Ａは、推定雑音信号を、エコー除去信号の各周波数帯域のＳＮ比に基づいて、周波数帯域ごとに異なる割合で小さくしたものをコンフォートノイズとする。

【0071】

具体的には、コンフォートノイズ生成部２４Ａは、推定雑音信号のパワースペクトル密度に、ウィーナー・フィルタを乗じることによりコンフォートノイズを生成する。雑音信号のパワースペクトル密度が音声信号のパワースペクトル密度に比べて小さい周波数帯域においては、ウィーナー・フィルタの値は小さくなり、コンフォートノイズは比較的小さい値になる。雑音信号のパワースペクトル密度が音声信号のパワースペクトル密度に比べて大きい周波数帯域においては、ウィーナー・フィルタの値は大きくなり、コンフォートノイズは比較的大きい値になる。

【0072】

これにより、広い周波数帯域に渡って入力信号のＳＮ比を略一定にし、違和感の少ない自然なコンフォートノイズを出力すると共に、音声信号をより明瞭に出力することができる。

【0073】

また、雑音抑圧部２３が使用するフィルタを使用してコンフォートノイズ生成部２４がコンフォートノイズを生成するため、別のフィルタを使用する構成に比べて少ない処理でコンフォートノイズを生成することができる。また、雑音を抑圧するための構成がコンフォートノイズの生成にも利用可能であるため、別途コンフォートノイズを計算及び格納するためのメモリを搭載する必要がなく、コンフォートノイズ付加部２をより簡素な構成、例えば安価で小型な構成にすることができる。

【0074】

ただし、コンフォートノイズ生成部２４は、雑音抑圧部２３が使用するフィルタ、すなわちウィーナー・フィルタとは異なるフィルタを用いてノイズを抑圧してもよい。エコー除去信号のうち、無音区間と有音区間とでは、推定される抑圧量が異なる。そこで、コンフォートノイズ生成部２４が雑音抑圧部２３に使用されるフィルタとは異なるフィルタを使用することで、音声信号の有無による推定結果の違いの影響を受けづらくなり、より自然なコンフォートノイズを生成することができる。

【0075】

＜第３の実施の形態＞
第１の実施の形態では、推定雑音信号を各周波数帯域において一定量だけ小さくしたものをコンフォートノイズとしたが、コンフォートノイズの形態はこれに限られない。第３の実施の形態は、推定雑音信号のパワースペクトル密度の平均値に基づいてコンフォートノイズのレベルを決定する形態である。以下、第３の実施の形態に係るエコー抑圧装置１Ｂについて説明する。なお、第１の実施の形態に係るエコー抑圧装置１と同一の部分については、同一の符号を付し、説明を省略する。

【0076】

図７は、エコー抑圧装置１Ｂの概略構成を示すブロック図である。エコー抑圧装置１Ｂは、主として、エコー除去部１１と、コンフォートノイズ付加部２Ｂと、を有する。コンフォートノイズ付加部２Ｂは、主として、変換部２１と、雑音推定部２２と、雑音抑圧部２３と、コンフォートノイズ生成部２４Ｂと、重畳部２５と、逆変換部２６と、を有する。

【0077】

コンフォートノイズ生成部２４Ｂは、推定雑音信号のパワースペクトル密度の平均値（以下、ノイズレベルという）に基づいてコンフォートノイズのレベルを決定する。ノイズレベルが大きい、すなわち推定される雑音のレベルが大きい周波数については、コンフォートノイズ生成部２４は、レベルの大きいコンフォートノイズを生成する。ノイズレベルが小さい、すなわち推定される雑音のレベルが小さい周波数については、コンフォートノイズ生成部２４は、レベルの小さいコンフォートノイズを生成する。

【0078】

以下、具体的な例を用いて説明する。うるさい環境下、例えばノイズレベルが９０ｄＢ以上の場合には、各周波数帯域において推定雑音信号を－６ｄＢしたものをコンフォートノイズとする。うるさい環境下ではノイズが支配的であるので、他の場合（後に詳述）よりも推定雑音信号から引くデシベル数を小さくし、コンフォートノイズを大きくする。ただし、推定雑音信号から引くデシベル数は－６ｄＢに限られない。ノイズが支配的な環境では人はノイズの変化を敏感に感じるため、推定雑音信号から引くデシベル数を－６ｄＢより大きくしても良い。

【0079】

静かな環境下、例えばノイズレベルが５０ｄＢ以下の場合には、各周波数帯域において推定雑音信号を－２０ｄＢしたものをコンフォートノイズとする。元々存在する雑音が小さい場合、エコー抑圧によって有音区間と無音区間との間に生じる違和感が小さいため、小さいコンフォートノイズを重畳するだけでも違和感を充分軽減することができる。ただし、静かな環境下ではノイズが支配的でなく、ノイズの変化に人は鈍感である。したがって、推定雑音信号から引くデシベル数を－２０ｄＢ以上としてコンフォートノイズを更に小さくしたり、コンフォートノイズを０としたりしてもよい。

【0080】

うるさい環境と静かな環境との間の環境下、例えばノイズレベルが５０ｄＢ～９０ｄＢの場合には、各周波数帯域において推定雑音信号を－１２ｄＢしたものをコンフォートノイズとする。ここで推定雑音信号から引くデシベル数は、うるさい環境下より小さく、静かな環境下より大きければよく、－１２ｄＢに限られない。

【0081】

以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。

【符号の説明】

【0082】

１：エコー抑圧装置
２：コンフォートノイズ付加部
１１：エコー除去部
２１：変換部
２２：雑音推定部
２３：雑音抑圧部
２４：コンフォートノイズ生成部
２５：重畳部
２６：逆変換部
５０：端末
５１：マイクロホン
５２：スピーカ
５３：携帯電話
５４：携帯電話
５５：スピーカアンプ
１００：音声通信システム
２２１：雑音推定主部
２２２：ＳＮＲ推定部
５３１：信号入力端
５３２：信号出力端

【図1】