特許第6555057号(P6555057)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特許6555057音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法
<>
  • 特許6555057-音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法 図000034
  • 特許6555057-音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法 図000035
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6555057
(24)【登録日】2019年7月19日
(45)【発行日】2019年8月7日
(54)【発明の名称】音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法
(51)【国際特許分類】
   H04B 3/20 20060101AFI20190729BHJP
   H04R 3/02 20060101ALI20190729BHJP
   H04R 3/00 20060101ALI20190729BHJP
【FI】
   H04B3/20
   H04R3/02
   H04R3/00 320
【請求項の数】5
【全頁数】22
(21)【出願番号】特願2015-192748(P2015-192748)
(22)【出願日】2015年9月30日
(65)【公開番号】特開2017-69745(P2017-69745A)
(43)【公開日】2017年4月6日
【審査請求日】2018年5月15日
(73)【特許権者】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(74)【代理人】
【識別番号】100090620
【弁理士】
【氏名又は名称】工藤 宣幸
(72)【発明者】
【氏名】川畑 尚也
【審査官】 前田 典之
(56)【参考文献】
【文献】 特開2015−070290(JP,A)
【文献】 特開2010−268129(JP,A)
【文献】 米国特許出願公開第2014/0341384(US,A1)
【文献】 米国特許第7003099(US,B1)
【文献】 米国特許出願公開第2009/0089054(US,A1)
【文献】 特開2014−229932(JP,A)
【文献】 特開2002−237769(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04B 3/20
H04R 3/00
H04R 3/02
(57)【特許請求の範囲】
【請求項1】
音源分離された音源分離信号に含まれる音響エコー成分を抑圧する音源分離エコー抑圧装置において、
入力された遠端信号を周波数領域の信号に変換して、上記遠端信号の振幅スペクトルを求める遠端信号振幅スペクトル算出部と、
入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求める近端入力信号振幅スペクトル算出部と、
保持している推定エコーパス特性と上記遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求める推定エコー信号推定部と、
上記複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力する音源分離部と、
上記音源分離信号の振幅スペクトルを求める音源分離信号振幅スペクトル算出部と、
上記推定エコー信号の振幅スペクトルと上記音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求めるエコーサプレスゲイン算出部と、
上記音源分離ゲインと上記エコーサプレスゲインとに基づいて、上記エコーサプレスゲインを補正するエコーサプレスゲイン補正部と、
上記補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧するエコーサプレス部と、
上記遠端信号の振幅スペクトルと上記音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新する推定エコーパス更新部と
を備えることを特徴とする音源分離エコー抑圧装置。
【請求項2】
上記エコーサプレスゲイン補正部が、上記音源分離ゲインと上記エコーサプレスゲインとの比較結果に応じて、上記エコーサプレスゲインを補正することを特徴とする請求項1に記載の音源分離エコー抑圧装置。
【請求項3】
上記エコーサプレスゲイン補正部が、上記音源分離ゲインと閾値との比較結果に応じて、上記エコーサプレスゲインを補正することを特徴とする請求項1に記載の音源分離エコー抑圧装置。
【請求項4】
音源分離された音源分離信号に含まれる音響エコー成分を抑圧する音源分離エコー抑圧プログラムにおいて、
コンピュータを、
入力された遠端信号を周波数領域の信号に変換して、上記遠端信号の振幅スペクトルを求める遠端信号振幅スペクトル算出部と、
入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求める近端入力信号振幅スペクトル算出部と、
保持している推定エコーパス特性と上記遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求める推定エコー信号推定部と、
上記複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力する音源分離部と、
上記音源分離信号の振幅スペクトルを求める音源分離信号振幅スペクトル算出部と、
上記推定エコー信号の振幅スペクトルと上記音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求めるエコーサプレスゲイン算出部と、
上記音源分離ゲインと上記エコーサプレスゲインとに基づいて、上記エコーサプレスゲインを補正するエコーサプレスゲイン補正部と、
上記補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧するエコーサプレス部と、
上記遠端信号の振幅スペクトルと上記音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新する推定エコーパス更新部と
して機能させることを特徴とする音源分離エコー抑圧プログラム。
【請求項5】
音源分離された音源分離信号に含まれるエコー成分を抑圧する音源分離エコー抑圧方法において、
遠端信号振幅スペクトル算出部が、入力された遠端信号を周波数領域の信号に変換して、上記遠端信号の振幅スペクトルを求め、
近端入力信号振幅スペクトル算出部が、入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求め、
推定エコー信号推定部が、保持している推定エコーパス特性と上記遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求め、
音源分離部が、上記複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力し、
音源分離信号振幅スペクトル算出部が、上記音源分離信号の振幅スペクトルを求め、
エコーサプレスゲイン算出部が、上記推定エコー信号の振幅スペクトルと上記音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求め、
エコーサプレスゲイン補正部が、上記音源分離ゲインと上記エコーサプレスゲインとに基づいて、上記エコーサプレスゲインを補正し、
エコーサプレス部が、上記補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧し、
推定エコーパス更新部が、上記遠端信号の振幅スペクトルと上記音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新する
ことを特徴とする音源分離エコー抑圧方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法に関し、例えば、テレビ会議システムや電話会議システム等において用いられる音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法である。
【背景技術】
【0002】
例えば、テレビ会議システムや電話会議システム等の拡声通話システムでは、スピーカから放音された音(ここで、音は音響や音声等を含む。)がマイクに回り込んで送話側に戻る音響エコー信号が発生する。音響エコー信号は、通話の著しい妨げとなるため、音響エコー抑圧方法に関して、これまでも多くの研究、開発が行なわれている。
【0003】
音響エコー信号を抑圧する1つの手法として、エコー抑圧装置(エコーサプレッサー)を使用する手法がある。エコー抑圧装置とは、遠端信号と近端入力信号とから推定エコーパス特性、推定エコー信号、エコーサプレスゲインを求めて、近端入力信号とエコーサプレスゲインを乗算することで音響エコー信号を抑圧する手法である。
【0004】
近年、エコー抑圧装置は,多チャンネルのマイク入力を備え、エコー抑圧処理の前に音源分離処理(指向性処理)を行うことで,雑音や騒音を抑圧してから,エコー抑圧処理を行う音源分離エコー抑圧装置が特許文献1によって提案されている。
【先行技術文献】
【非特許文献】
【0005】
【特許文献1】特開2013−165496号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の音源分離エコー抑圧装置では、音源分離処理で抑圧された音響エコー信号をエコー抑圧処理で再び抑圧してしまうため、エコー抑圧処理で音の歪が発生し、音質が悪くなる問題がある。
【0007】
そのため、音源分離処理で抑圧した音響エコー信号は、エコー抑圧処理部では抑圧されないようにし、音の歪が小さき、音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法が望まれている。
【0008】
本発明は、上記課題に鑑みてなされたものであり、音源分離処理で抑圧された音響エコー信号を判定し、エコー抑圧処理では音源分離処理で抑圧された音響エコー信号を抑圧しないようにすることで、音響エコー信号の引き過ぎにより発生する音の歪みを改善しようとするものである。
【課題を解決するための手段】
【0009】
本発明は、上記課題を解決するために、以下の構成を備えるものである。
【0010】
第1の本発明に係る音源分離エコー抑圧装置は、音源分離された音源分離信号に含まれる音響エコー成分を抑圧する音源分離エコー抑圧装置において、(1)入力された遠端信号を周波数領域の信号に変換して、遠端信号の振幅スペクトルを求める遠端信号振幅スペクトル算出部と、(2)入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求める近端入力信号振幅スペクトル算出部と、(3)保持している推定エコーパス特性と遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求める推定エコー信号推定部と、(4)複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力する音源分離部と、(5)音源分離信号の振幅スペクトルを求める音源分離信号振幅スペクトル算出部と、(6)推定エコー信号の振幅スペクトルと音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求めるエコーサプレスゲイン算出部と、(7)音源分離ゲインとエコーサプレスゲインとに基づいて、上記エコーサプレスゲインを補正するエコーサプレスゲイン補正部と、(8)補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧するエコーサプレス部と、(9)遠端信号の振幅スペクトルと音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新する推定エコーパス更新部とを備えることを特徴とする。
【0011】
第2の本発明に係る音源分離エコー信号抑圧プログラムは、音源分離された音源分離信号に含まれる音響エコー成分を抑圧する音源分離エコー抑圧プログラムにおいて、コンピュータを、(1)入力された遠端信号を周波数領域の信号に変換して、遠端信号の振幅スペクトルを求める遠端信号振幅スペクトル算出部と、(2)入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求める近端入力信号振幅スペクトル算出部と、(3)保持している推定エコーパス特性と遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求める推定エコー信号推定部と、(4)複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力する音源分離部と、(5)音源分離信号の振幅スペクトルを求める音源分離信号振幅スペクトル算出部と、(6)推定エコー信号の振幅スペクトルと音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求めるエコーサプレスゲイン算出部と、(7)音源分離ゲインとエコーサプレスゲインとに基づいて、エコーサプレスゲインを補正するエコーサプレスゲイン補正部と、(8)補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧するエコーサプレス部と、(9)遠端信号の振幅スペクトルと音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新する推定エコーパス更新部として機能させることを特徴とする。
【0012】
第3の本発明に係る音源分離エコー抑圧方法は、音源分離された音源分離信号に含まれる音響エコー成分を抑圧する音源分離エコー抑圧方法において、(1)遠端信号振幅スペクトル算出部が、入力された遠端信号を周波数領域の信号に変換して、遠端信号の振幅スペクトルを求め、(2)近端入力信号振幅スペクトル算出部が、入力された複数の近端入力信号を周波数領域の信号に変換して、各近端入力信号の振幅スペクトルを求め、(3)推定エコー信号推定部が、保持している推定エコーパス特性と遠端信号の振幅スペクトルを乗算し推定エコー信号の振幅スペクトルを求め、(4)音源分離部が、複数の近端入力信号の振幅スペクトルに基づいて目的音信号を音源分離する音源分離ゲインを求め、音源分離信号を出力し、(5)音源分離信号振幅スペクトル算出部が、音源分離信号の振幅スペクトルを求め、(6)エコーサプレスゲイン算出部が、推定エコー信号の振幅スペクトルと音源分離信号の振幅スペクトルに基づいて、エコーサプレスゲインを求め、(7)エコーサプレスゲイン補正部が、音源分離ゲインとエコーサプレスゲインとに基づいて、エコーサプレスゲインを補正し、(8)エコーサプレス部が、補正されたエコーサプレスゲインを用いて音響エコー成分を抑圧し、(9)推定エコーパス更新部が、遠端信号の振幅スペクトルと音源分離信号の振幅スペクトルとに基づいて算出した推定エコーパス特性を更新することを特徴とする。
【発明の効果】
【0013】
本発明によれば、音源分離処理で抑圧された音響エコー信号を判定し、音源分離処理で抑圧された音響エコー信号はエコー抑圧処理では抑圧しないようにし、音源分離処理で抑圧されなかった音響エコー信号はエコー抑圧処理で抑圧することで引き過ぎによる音の歪みを改善できる。
【図面の簡単な説明】
【0014】
図1】第1の実施形態に係る音源分離エコー抑圧装置の構成を示すブロック図である。
図2】第2の実施形態に係る音源分離エコー抑圧装置の構成を示すブロック図である。
【発明を実施するための形態】
【0015】
(A)第1の実施形態
以下では、本発明の音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法の第1の実施形態を、図面を参照しながら詳細に説明する。
【0016】
第1の実施形態は、例えば、テレビ会議システムや電話会議システム等の拡声通話システムの音声送受信装置の音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法に本発明を適用した場合を例示したものである。
【0017】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音源分離エコー抑圧装置100の構成を示すブロック図である。
【0018】
第1の実施形態に係る音源分離エコー抑圧装置100は、例えば、専用ボードとして構築されるようにしても良いし、DSP(デジタルシグナルプロセッサ)への音源分離エコー抑圧プログラムの書き込みによって実現されたものであっても良く、CPUと、CPUが実行するソフトウェア(音源分離エコー抑圧プログラム)によって実現されたものであっても良いが、機能的には、図1で表すことができる。
【0019】
図1において、第1の実施形態に係る音源分離エコー抑圧装置100は、遠端信号入力端子101、DA変換器102、スピーカ103、マイク104a、104b、AD変換器105a、105b、遠端信号周波数領域変換部106、遠端信号振幅スペクトル計算部107、推定エコーパス特性保持部108、推定エコー信号計算部109、近端入力信号周波数領域変換部110a、110b、音源分離ゲイン計算部111、音源分離部112、音源分離信号振幅スペクトル計算部113、エコーサプレスゲイン計算部114、エコーサプレスゲイン補正部115、エコーサプレス部116、近端出力信号時間領域変換部117、近端信号入力端子118、近端出力信号振幅スペクトル計算部119、シングルトーク判定部120、推定エコーパス特性計算部121、推定エコーパス特性更新部122を有する。
【0020】
遠端信号入力端子101は、入力された遠端信号をDA変換器102、遠端信号周波数領域変換部106に出力する。DA変換器102は、遠端信号であるデジタル音信号をアナログ音信号に変換して、スピーカ103を通して近端側に出力する。
【0021】
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ103から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク104a、104bにおいて受音され、AD変換器105a、105bにおいてデジタル音信号に変換され、デジタル音信号を近端入力信号として音源分離エコー抑圧装置100に入力される。
【0022】
遠端信号周波数領域変換部106は、例えば、高速フーリエ変換(FFT)等により、時間領域の信号である遠端信号を周波数領域の信号に変換し、遠端信号の周波数スペクトルを、遠端信号振幅スペクトル計算部107に出力する。
【0023】
遠端信号振幅スペクトル計算部107は、遠端信号の周波数スペクトルに基づいて、遠端信号の振幅スペクトルを算出し、算出した遠端信号の振幅スペクトルを推定エコー信号計算部109、及び推定エコーパス特性計算部121に出力する。
【0024】
推定エコーパス特性保持部108は、エコーパス特性を保持している。推定エコーパス特性保持部108は、保持しているエコーパス特性を推定エコー信号計算部109、及び推定エコーパス特性更新部122に出力する。
【0025】
推定エコー信号計算部109は、遠端信号の振幅スペクトルとエコーパス特性とを乗じて推定エコー信号の振幅スペクトルを算出し、エコーサプレスゲイン計算部114に出力する。
【0026】
一方、マイク104a、104bは、近端側の話者を音源とする音信号を受音する。なお、この実施形態では、2個のマイク104a、104bにより受音された2つの音信号から、音源である近端側の話者が発した音信号(目的音)を非目的音から分離する場合を例示する。なお、3個以上のマイクを備え、3個以上のマイクが受音した音信号から目的音を分離するようにしても良い。
【0027】
近端入力信号周波数領域変換部110a、110bはそれぞれ、例えば、高速フーリエ変換(FFT)等により、AD変換器105a、105bのそれぞれからの近端入力信号を周波数領域の信号に変換し、近端入力信号の周波数スペクトルを音源分離ゲイン計算部111と音源分離部112に出力する。
【0028】
音源分離ゲイン計算部111は、近端入力信号の周波数スペクトルから音源分離ゲインを算出し、音源分離部112、及びエコーサプレスゲイン補正部115に出力する。
【0029】
音源分離部112は、近端入力信号と音源分離ゲインから音源分離信号を算出し、音源分離信号振幅スペクトル計算部113、及びエコーサプレス部116に出力する。
【0030】
音源分離信号振幅スペクトル計算部113は、音源分離信号の周波数スペクトルに基づいて、音源分離信号の振幅スペクトルを算出し、音源分離信号の振幅スペクトルをエコーサプレスゲイン計算部114、シングルトーク判定部120、及び推定エコーパス特性計算部121に出力する。
【0031】
エコーサプレスゲイン計算部114は、音源分離信号の振幅スペクトルと推定エコー信号の振幅スペクトルとを用いて、音源分離信号に重畳されている音響エコー信号を抑圧するエコーサプレスゲインを算出し、算出したエコーサプレスゲインをエコーサプレスゲイン補正部115に出力する。
【0032】
エコーサプレスゲイン補正部115は、エコーサプレスゲインと音源分離ゲインから、音源分離で抑圧された音響エコー信号を判定し、音源分離で抑圧された音響エコー信号を抑圧しないようエコーサプレスゲインを補正し、補正したエコーサプレスゲインをエコーサプレス部116に出力する。
【0033】
エコーサプレス部116は、補正したエコーサプレスゲインと音源分離信号の周波数スペクトルを乗じることにより、音源分離入力信号に重畳されている音源分離部112で抑圧できなかった音響エコー信号を抑圧した周波数スペクトルを求め、近端出力信号の周波数スペクトルとして、近端出力信号時間領域変換部117に出力する。
【0034】
近端出力信号時間領域変換部117は、近端出力信号の周波数スペクトルを、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換し、近端出力信号を近端信号出力端子118に出力する。
【0035】
近端信号出力端子118は、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、接続されている回線を介して遠端側(相手側)へ近端出力信号が出力される。
【0036】
近端出力信号振幅スペクトル計算部119は、近端出力信号の周波数スペクトルに基づいて、近端出力信号の振幅スペクトルを算出し、算出した近端出力信号の振幅スペクトルをシングルトーク判定部120に出力する。
【0037】
シングルトーク判定部120は、近端入力信号の振幅スペクトルと近端出力信号の振幅スペクトル等を用いてシングルトークかシングルトーク以外かを判定し、シングルトーク判定結果を推定エコーパス特性更新部122に出力する。
【0038】
推定エコーパス特性計算部121は、遠端信号の振幅スペクトルと近端入力信号の振幅スペクトルに基づいて、現フレームの推定エコーパス特性を算出し、算出した現フレームの推定エコーパス特性を推定エコーパス特性更新部122に出力する。
【0039】
推定エコーパス特性更新部122は、推定エコーパス特性計算部121で算出された現フレームの推定エコーパス特性と推定エコーパス特性保持部108に保持している推定エコーパス特性とシングルトーク判定部120のシングルトーク判定結果に基づき、エコーパス特性を更新し、更新したエコーパス特性を推定エコーパス特性保持部108に保存する。
【0040】
(A−2)第1の実施形態の動作
次に、本発明の実施形態に係る音源分離エコー抑圧装置100の音源分離エコー抑圧処理の動作を詳細に説明する。
【0041】
まず、音源分離エコー抑圧装置100の動作開始後、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯端末等の無線ネットワークの電波等に接続されており、接続されている回線を介して、遠端側の遠端信号が遠端信号入力端子101に入力される。
【0042】
遠端信号入力端子101に入力された遠端信号は、DA変換器102に遠端信号を出力される。遠端信号は、DA変換器102によりデジタル音信号からアナログ音信号に変換され、スピーカ103を通して近端側に出力される。
【0043】
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ103から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク104a、104bにおいて受音される。マイク104a、104bのそれぞれにより受音されたアナログ音信号は、AD変換器105a、105bのそれぞれによりデジタル音信号(図1の近端入力信号a、b)に変換され、デジタル音信号が近端入力信号として音源分離エコー抑圧装置100に入力される。
【0044】
遠端信号周波数領域変換部106では、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換され、変換された遠端信号の周波数スペクトルROUT(i,ω)を遠端信号振幅スペクトル計算部107に出力する。
【0045】
遠端信号振幅スペクトル計算部107では、周波数スペクトルROUT(i,ω)を用いて、(1)式に従い、遠端信号の振幅スペクトル|ROUT(i,ω)|が求められる。
【数1】
【0046】
ここで、iはフレーム、ωは周波数ビン、ROUT_real(i,ω)とROUT_image(i,ω)は、フレームiにおける周波数ビンωの遠端信号の周波数スペクトルROUT(i,ω)の実数部と虚数部を示しており、遠端信号の周波数スペクトルROUT(i,ω)は、(2)式で表すことができる。(2)式のjは虚数を表している。
【数2】
【0047】
そして、遠端信号振幅スペクトル計算部107により求められた遠端信号の周波数スペクトル|ROUT(i,ω)|は、推定エコー信号計算部109に出力する。
【0048】
推定エコー信号計算部109では、推定エコーパス特性保持部108に保持している推定エコーパス特性|H(i−1,ω)|と、遠端信号の振幅スペクトル|ROUT(i,ω)|を用いて、(3)式により、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が求められる。
【数3】
【0049】
(3)式は遠端信号の振幅スペクトル|ROUT(i,ω)|に、推定エコーパス特性保持部108に保持している推定エコーパス特性|H(i−1,ω)|の対応する周波数ビンを乗じて、当該周波数ビンの推定エコー信号の振幅スペクトル|ECHO(i,ω)|を求めるという式である。そして、推定エコー信号計算部109により求められた推定エコー信号の振幅スペクトル|ECHO(i,ω)|をエコーサプレスゲイン計算部114に出力する。
【0050】
一方、近端入力信号周波数領域変換部110a、110bでは、AD変換器105a、105bから出力されたデジタル音信号を近端入力信号として、例えば、高速フーリエ変換(FFT)等により、近端入力信号を時間領域の信号から周波数領域の信号に変換し、変換された近端入力信号の周波数スペクトルSINa(i,ω),SINb(i,ω)を、音源分離ゲイン計算部111と音源部分離部112に出力する。
【0051】
音源分離ゲイン計算部111では、マイクロフォンアレー処理を行い、音源を分離する音源分離ゲインを算出する。音源分離ゲインの手法は、例えば、従来のマイクロフォンアレー処理である遅延和アレー処理で、(4)式に従い、音源分離ゲインGSEPA(i,ω)を算出する手法がある。
【数4】
【0052】
なお、音源分離ゲインGSEPA(i,ω)の算出手段は、種々の方法を広く適用することができ、例えば、近端入力信号の一方をマイク間隔の時間分遅延させた信号を算出し、もう一方の近端入力信号から引く、差分型アレー方式でゲインを算出しても良い。音源分離ゲイン計算部111は、算出した音源分離ゲインを音源分離部112とエコーサプレスゲイン補正部115に出力する。
【0053】
音源分離部112では、例えば、近端入力分離信号のスペクトルSINa(i,ω)と音源分離ゲインGSEPA(i,ω)とを用いて、(5)式、(6)式に従い、音源分離信号を算出する。
【数5】
【0054】
ここで、SEPA_real(i,ω)とSEPA_image(i,ω)は、フレームiにおける周波数ビンωの音源分離信号の周波数スペクトルの実数部と虚数部を示しており、音源分離信号の周波数スペクトルSEPA(i,ω)は、(7)式で表すことができる。(7)式のjは虚数を表している。
【数6】
【0055】
(5)式と(6)式は、音源分離信号の周波数スペクトルの実数部、虚数部に音源分離ゲインGSEPA(i,ω)を周波数ビン毎に乗じて、音源を分離した音源分離信号の周波数スペクトルSEPA(i,ω)を求めるという式である。なお、音源分離信号の算出の手段は、種々の方法を広く適用することができ、例えば,近端入力分離信号のスペクトルSINb(i,ω)と音源分離ゲインGSEPA(i,ω)とを(5)式、(6)式と同様に乗算することで算出しても良く、近端入力分離信号のスペクトルSINa(i,ω)、SINb(i,ω)と音源分離ゲインGSEPA(i,ω)とを用いて算出しても良い。より具体的には、例えば、近端入力分離信号のスペクトルSINa(i,ω)とSINb(i,ω)との平均値に音源分離ゲインを乗算する方法を用いても良い。音源分離部112により求められた音源分離信号の周波数スペクトルSEPA(i,ω)をエコーサプレス部116に出力する。
【0056】
音源分離信号振幅スペクトル計算部113は、音源分離信号の周波数スペクトルSEPA(i,ω)を用いて、(8)式に従い、音源分離信号の振幅スペクトル|SEPA(i,ω)|が求められる。
【数7】
【0057】
そして、音源分離信号振幅スペクトル計算部113により求められた音源分離信号の振幅スペクトル|SEPA(i,ω)|は、エコーサプレスゲイン計算部114、シングルトーク判定部120、及び推定エコーパス特性計算部121に出力する。
【0058】
エコーサプレスゲイン計算部114では、音源分離信号の振幅スペクトル|SEPA(i,ω)|と推定エコー信号の振幅スペクトル|ECHO(i、ω)|とを取得して、(9)式を用いて、エコーサプレスゲインGES(i,ω)を求める。
【数8】
【0059】
(9)式は、周波数ビン毎に音源分離信号の振幅スペクトル|SEPA(i,ω)|から推定エコー信号の振幅スペクトル|ECHO(i,ω)|を差し引いた振幅スペクトルを、音源分離信号の振幅スペクトル|SEPA(i,ω)|で除することで、エコーサプレスゲインGES(i,ω)を求めるという式である。エコーサプレスゲイン計算部114により求められたエコーサプレスゲインGES(i,ω)は、エコーサプレスゲイン補正部115に出力する。
【0060】
エコーサプレスゲイン補正部115では、音源分離部112で抑圧されている音響エコー信号を音源分離ゲインGSEPA(i,ω)とエコーサプレスゲインGES(i,ω)とを比較して、その比較結果に応じてエコーサプレスゲインGES(i,ω)の値を補正する。
【0061】
ここで、音源分離部112で抑圧されている音響エコー信号の判定方法は、例えば、(10)式に従い、補正するかを判定する。また、エコーサプレスゲイン補正部115が判定して出力するエコーサプレスゲインGES(i,ω)の値を、エコーサプレスゲインGES_r(i,ω)と表記する。
【数9】
【0062】
(10)式において、音源分離ゲインGSEPA(i,ω)がエコーサプレスゲインGES(i,ω)より小さいときは、音源分離部112で十分抑圧されている音響エコー信号と判定する。このとき、エコーサプレス部116で大きく抑圧しないようにするために、エコーサプレスゲイン補正部115は、(10)式に従い、エコーサプレスゲインGES_r(i,ω)の値を1とする。
【0063】
一方、音源分離ゲインGSEPA(i,ω)の値がエコーサプレスゲインGES(i,ω)以上のときは、音源分離部112で十分抑圧されていない音響エコー信号と判定する。このとき、エコーサプレス部116で抑圧するために、エコーサプレスゲイン補正部115は、(10)式に従い、エコーサプレスゲインGES(i,ω)の値をエコーサプレスゲインGES_r(i,ω)とする。
【0064】
なお、音源分離部112で十分抑圧されているかの判定方法は、種々の方法を広く適用することができる。この実施形態では、エコーサプレスゲイン補正部115が、音源分離ゲインGSEPA(i,ω)とエコーサプレスゲインGES(i,ω)とを比較する場合を例示しているが、その他に例えば、エコーサプレスゲイン補正部115が、音源分離ゲインGSEPA(i,ω)のみを用いて、音源分離ゲインGSEPA(i,ω)が閾値以下の場合、音源分離部112で十分抑圧されていると判定し、エコーサプレスゲインGES_r(i,ω)を1に補正するとしても良い。エコーサプレスゲイン補正部115は補正したエコーサプレスゲインGES_r(i,ω)をエコーサプレス部116に出力する。
【0065】
エコーサプレス部116では、音源分離信号のスペクトルSEPA(i,ω)と、エコーサプレスゲイン補正部115からのエコーサプレスゲインGES_r(i,ω)とを用いて、(11)式、(12)式に従い、音源分離信号のスペクトルSEPA(i,ω)に重畳されている音響エコー信号を抑圧する。
【数10】
【0066】
ここで、SOUT_real(i,ω)とSOUT_image(i,ω)は、フレームiにおける周波数ビンωの近端出力信号の周波数スペクトルの実数部と虚数部を示しており、近端出力信号の周波数スペクトルSOUT(i,ω)は、(13)式で表すことができる。(13)式のjは虚数を表している。
【数11】
【0067】
(11)式と(12)式は周波数スペクトルの実数部、虚数部にエコーサプレスゲインGES_r(i,ω)を周波数ビン毎に乗じて、音響エコー信号を抑圧した近端出力信号の周波数スペクトルSOUT(i,ω)を求めるという式である。そして、エコーサプレス部116により求められた音響エコー信号が抑圧された近端出力信号の周波数スペクトルSOUT(i,ω)を近端出力信号時間領域変換部117に出力する。
【0068】
近端出力信号時間領域変換部117では、近端出力信号のスペクトルSOUT(i,ω)が、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換し、近端出力信号を近端信号出力端子118に出力する。
【0069】
近端信号出力端子118は、例えば、IP網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、近端出力信号を接続されている回線を介して通話相手である遠端側に出力する。
【0070】
近端出力信号振幅スペクトル計算部119では、近端出力信号の周波数スペクトルSOUT(i,ω)を用いて、(14)式に従い、近端出力信号の振幅スペクトル|SOUT(i,ω)|が求められる。
【数12】
【0071】
そして、近端出力信号振幅スペクトル計算部124は、算出した近端入力信号の振幅スペクトル|SOUT(i,ω)|をシングルトーク判定部120に出力する。
【0072】
シングルトーク判定部120では、音源分離信号がシングルトークかシングルトーク以外かを音源分離入力信号の振幅スペクトルと近端出力信号の振幅スペクトルとを用いて判定する。シングルトークかシングルトーク以外かを判定する手法は、例えば、(15)式に従い、シングルトークかシングルトーク以外かを判定する手法がある。(15)式のFsはサンプリング周波数、TH1は閾値である。
【数13】
【0073】
(15)式の条件が真のときはシングルトークと判定し、偽のときはシングルトーク以外として判定する。閾値TH1は、(15)式の場合、シングルトーク時は(15)式の左辺が小さい値になるので、小さい固定値(例えばTH1=0.3)やフレームで変化する変数などにしても良い。なお、シングルトークかシングルトーク以外か否かの判定方法は、種々の方法を広く適用することができ、例えば、遠端信号の振幅スペクトルと各近端入力信号の振幅スペクトルとの相関を求めて相関が高いときはシングルトークとする方法で判定しても良い。シングルトーク判定部120は、シングルトーク判定結果を推定エコーパス特性更新部122に出力する。
【0074】
推定エコーパス特性計算部121は、現フレームの推定エコーパス特性|H(i,ω)|、を遠端信号の振幅スペクトル|ROUT(i,ω)|と音源分離信号の振幅スペクトル|SEPA(i,ω)|を用いて、(16)式に従い求める。
【数14】
【0075】
現フレームの推定エコーパス特性|H(i,ω)|が求まれば推定エコーパス特性更新部122に現フレームの推定エコーパス特性|H(i,ω)|を出力する。
【0076】
推定エコーパス特性更新部122は、シングルトーク判定部120でシングルトークと判定されたフレームで、推定エコーパス特性|H(i,ω)|と推定エコーパス特性保持部108に保持されている推定エコーパス特性|H(i−1,ω)|から推定エコーパス特性|H(i,ω)|を(17)式に従って更新する。
【数15】
【0077】
aは時定数フィルタの係数であり、aは0以上、1以下の値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えばa=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えばa=0.01等の値)。推定エコーパス特性更新部122は更新したエコーパス特性|H(i,ω)|を推定エコーパス特性保持部108に保持させる。
【0078】
一方、シングルトーク判定部120でシングルトーク以外と判定されたフレームはエコーパス特性の更新を行わない。
【0079】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、音源分離処理で抑圧された信号は、エコーサプレス処理で抑圧しないようにすることで、エコー抑圧処理の引きすぎによる音の歪を防止し、音響エコー信号を抑圧することができる。
【0080】
(B)第2の実施形態
次に、本発明の音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法の第2の実施形態を、図面を参照しながら詳細に説明する。
【0081】
第2の実施形態は、本発明の音源分離エコー抑圧装置が、複数のスピーカを有してステレオエコーを抑圧する場合を例示する。
【0082】
(B−1)第2の実施形態の構成
上述した第1の実施形態では、音源分離エコー抑圧装置100が1個のスピーカ103を有する場合を例示したが、スピーカの数を増設しても良い。そこで、第2の実施形態では、音源分離エコー抑圧装置が2個のスピーカで構成され、ステレオエコー信号を抑圧する場合を例示する。
【0083】
図2は、変形実施形態に係る2個のスピーカ103a、103bを有する音源分離エコー抑圧装置100Aの内部構成を示すブロック図である。
【0084】
図2に示す音源分離エコー抑圧装置100Aは、遠端信号入力端子101a、101b、DA変換器102a、102b、スピーカ103a、103b、マイク104a、104b、AD変換器105a、105b、遠端信号周波数領域変換部106a、106b、遠端信号振幅スペクトル計算部107a、107b、推定エコーパス特性保持部108a、108b、推定エコー信号計算部109a、109b、近端入力信号周波数領域変換部110a、110b、音源分離ゲイン計算部111、音源分離部112、音源分離信号振幅スペクトル計算部113a、エコーサプレス後音源分離信号振幅スペクトル計算部113b、エコーサプレスゲイン計算部114a、114b、エコーサプレスゲイン補正部115a、115b、エコーサプレス部116a、116b、近端出力信号時間領域変換部117、近端信号入力端子118、近端出力信号振幅スペクトル計算部119、シングルトーク判定部120、推定エコーパス特性計算部121a、121b、推定エコーパス特性更新部122a、122bを有する。
【0085】
(B−2)第2の実施形態の動作
第2の実施形態に係る音源分離エコー抑圧装置100Aにおける音源分離エコー抑圧処理の基本的な動作は、第1の実施形態で説明した音源分離エコー抑圧処理と同様である。
【0086】
以下では、エコーサプレスゲイン補正部115a、115bにおける処理動作を中心に詳細に説明する。
【0087】
遠端信号周波数領域変換部106a、106bはそれぞれ、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換し、変換された遠端信号の周波数スペクトルROUTa(i,ω)、ROUTb(i,ω)を遠端信号振幅スペクトル計算部107に出力する。
【0088】
遠端信号振幅スペクトル計算部107b、107bはそれぞれ、周波数スペクトルROUTa(i,ω)、ROUTb(i,ω)を用いて、(18)式、(19)式に従い、遠端信号の振幅スペクトル|ROUTa(i,ω)|、|ROUTb(i,ω)|を求める。
【数16】
【0089】
ここで、iはフレーム、ωは周波数ビン、ROUTa_real(i,ω)、ROUTb_real(i,ω)とROUTa_image(i,ω)、ROUTb_image(i,ω)は、フレームiにおける周波数ビンωの遠端信号の周波数スペクトルROUTa(i,ω)、ROUTb(i,ω)の実数部と虚数部を示しており、遠端信号の周波数スペクトルROUTa(i,ω)、ROUTb(i,ω)は、(20)式、(21)式で表すことができる。(20)式、(21)式のjは虚数を表している。
【数17】
【0090】
そして、遠端信号振幅スペクトル計算部107a、107bにより求められた遠端信号の周波数スペクトル|ROUTa(i,ω)|、|ROUTb(i,ω)|は、推定エコー信号計算部109a、109bに出力する。
【0091】
推定エコー信号計算部109a、109bはそれぞれ、推定エコーパス特性保持部108a、108bに保持している推定エコーパス特性|Ha(i−1,ω)|、|Hb(i−1,ω)|と、遠端信号の振幅スペクトル|ROUTa(i,ω)|、|ROUTb(i,ω)|を用いて、(22)式、(23)式により、推定エコー信号の振幅スペクトル|ECHOa(i,ω)|、|ECHOb(i,ω)|が求められる。
【数18】
【0092】
(22)式、(23)式は、遠端信号の振幅スペクトル|ROUTa(i,ω)|、|ROUTb(i,ω)|に、推定エコーパス特性保持部108a、108bに保持しているエコーパス特性|Ha(i−1,ω)|、|Hb(i−1,ω)|の対応する周波数ビンを乗じて、当該周波数ビンの推定エコー信号の振幅スペクトル|ECHOa(i,ω)|、|ECHOb(i,ω)|を求めるという式である。
【0093】
そして、推定エコー信号計算部109a、109bにより求められた推定エコー信号の振幅スペクトル|ECHOa(i,ω)|、|ECHOb(i,ω)|をエコーサプレスゲイン計算部114a、114bに出力する。
【0094】
音源分離信号振幅スペクトル計算部113aは、音源分離部112から音源分離信号の周波数スペクトルSEPA(i,ω)を用いて、(24)式に従い、近端入力信号の振幅スペクトル|SEPA(i,ω)|が求められる。音源分離信号の周波数スペクトルSEPA(i,ω)は、第1の実施形態の(5)式〜(7)式で表わされる。
【数19】
【0095】
そして、音源分離信号振幅スペクトル計算部113aにより求められた音源分離信号の振幅スペクトル|SEPA(i,ω)|は、エコーサプレスゲイン計算部114a、シングルトーク判定部120、及び推定エコーパス特性計算部121aに出力する。
【0096】
エコーサプレスゲイン計算部114aでは、音源分離信号の振幅スペクトル|SEPA(i,ω)|と推定エコー信号の振幅スペクトル|ECHOa(i、ω)|とを取得して、(25)式を用いて、エコーサプレスゲインGESa(i,ω)を求める。
【数20】
【0097】
(25)式は、周波数ビン毎に音源分離信号の振幅スペクトル|SEPA(i,ω)|から推定エコー信号の振幅スペクトル|ECHOa(i,ω)|を差し引いた振幅スペクトルを、音源分離信号の振幅スペクトル|SEPA(i,ω)|で除することで、エコーサプレスゲインGESa(i,ω)を求めるという式である。エコーサプレスゲイン計算部114aにより求められたエコーサプレスゲインGESa(i,ω)は、エコーサプレスゲイン補正部115aに出力する。
【0098】
エコーサプレスゲイン補正部115aでは、第1の実施形態のエコーサプレスゲイン補正部115と同様にして、音源分離部112で抑圧されている音響エコー信号を音源分離ゲインGSEPA(i,ω)とエコーサプレスゲインGESa(i,ω)とを比較して、その比較結果に応じてエコーサプレスゲインGESa_r(i,ω)の値を補正する。
【0099】
ここで、音源分離部112で抑圧されている音響エコー信号の判定方法は、例えば、(26)式に従い、補正するか判定する。また、エコーサプレスゲイン補正部115aが判定して出力するエコーサプレスゲインGESa(i,ω)の値を、エコーサプレスゲインGESa_r(i,ω)と表記する。
【数21】
【0100】
(26)式において、音源分離ゲインGSEPA(i,ω)がエコーサプレスゲインGESa(i,ω)より小さいときは、音源分離部112で十分抑圧されている音響エコー信号と判定する。このとき、エコーサプレス部116aで大きく抑圧しないようにするために、エコーサプレスゲイン補正部115aは、(26)式に従い、エコーサプレスゲインGESa_r(i,ω)の値を1とする。
【0101】
一方、音源分離ゲインGSEPA(i,ω)の値がエコーサプレスゲインGESa(i,ω)以上のときは、音源分離部112で十分抑圧されていない音響エコー信号と判定する。このとき、エコーサプレス部116aで抑圧するために、エコーサプレスゲイン補正部115aは、(26)式に従い、エコーサプレスゲインGESa(i,ω)の値をエコーサプレスゲインGESa_r(i,ω)とする。
【0102】
エコーサプレスゲイン補正部115aは補正したエコーサプレスゲインGESa_r(i,ω)をエコーサプレス部116aに出力する。
【0103】
エコーサプレス部116aでは、音源分離信号のスペクトルSEPA(i,ω)と、エコーサプレスゲイン補正部115aからのエコーサプレスゲインGESa_r(i,ω)とを用いて、(27)式、(28)式に従い、音源分離信号のスペクトルSEPA(i,ω)に重畳されている音響エコー信号を抑圧する。
【数22】
【0104】
ここで、SOUTa_real(i,ω)とSOUTa_image(i,ω)は、フレームiにおける周波数ビンωの音源分離信号の周波数スペクトルの実数部と虚数部を示しており、音源分離信号の周波数スペクトルSOUTa(i,ω)は、(29)式で表すことができる。(29)式のjは虚数を表している。
【数23】
【0105】
エコーサプレス後音源分離信号振幅スペクトル計算部113bは、エコーサプレス部116aによりエコーサプレス後の音源分離信号の周波数スペクトルSOUTa(i,ω)を用いて、(30)式に従い、近端入力信号の振幅スペクトル|SOUTa(i,ω)|を求める。
【数24】
【0106】
そして、音源分離信号振幅スペクトル計算部113aにより求められたエコーサプレス後の音源分離信号の振幅スペクトル|SOUTa(i,ω)|は、エコーサプレスゲイン計算部114b、推定エコーパス特性計算部121bに出力する。
【0107】
エコーサプレスゲイン計算部114bでは、エコーサプレス部116によるエコーサプレス後の音源分離信号の振幅スペクトル|SOUTa(i,ω)|と推定エコー信号の振幅スペクトル|ECHOb(i、ω)|とを取得して、(31)式を用いて、エコーサプレスゲインGESb(i,ω)を求める。
【数25】
【0108】
(31)式は、周波数ビン毎に、エコーサプレス後の音源分離信号の振幅スペクトル|SOUTa(i,ω)|から推定エコー信号の振幅スペクトル|ECHOb(i,ω)|を差し引いた振幅スペクトルを、エコーサプレス後の音源分離信号の振幅スペクトル|SOUTa(i,ω)|で除することで、エコーサプレスゲインGESb(i,ω)を求めるという式である。エコーサプレスゲイン計算部114bにより求められたエコーサプレスゲインGESb(i,ω)は、エコーサプレスゲイン補正部115bに出力する。
【0109】
エコーサプレスゲイン補正部115bでは、音源分離部112で抑圧されている音響エコー信号を音源分離ゲインGSEPA(i,ω)とエコーサプレスゲインGESb(i,ω)とを比較して、その比較結果に応じてエコーサプレスゲインGESb_r(i,ω)の値を補正する。
【0110】
ここで、音源分離部112で抑圧されている音響エコー信号の判定方法は、例えば、(32)式に従い、補正するか否かを判定する。また、エコーサプレスゲイン補正部115bが判定して出力するエコーサプレスゲインGESb(i,ω)の値を、エコーサプレスゲインGESb_r(i,ω)と表記する。
【数26】
【0111】
(32)式において、音源分離ゲインGSEPA(i,ω)がエコーサプレスゲインGESb(i,ω)より小さいときは、音源分離部112で十分抑圧されている音響エコー信号と判定する。このとき、エコーサプレス部116bで大きく抑圧しないようにするために、エコーサプレスゲイン補正部115bは、(32)式に従い、エコーサプレスゲインGESb_r(i,ω)の値を1とする。
【0112】
一方、音源分離ゲインGSEPA(i,ω)の値がエコーサプレスゲインGESb(i,ω)以上のときは、音源分離部112で十分抑圧されていない音響エコー信号と判定する。このとき、エコーサプレス部116bで抑圧するために、エコーサプレスゲイン補正部115bは、(32)式に従い、エコーサプレスゲインGESb(i,ω)の値をエコーサプレスゲインGESb_r(i,ω)とする。
【0113】
エコーサプレスゲイン補正部115bは補正したエコーサプレスゲインGESb_r(i,ω)をエコーサプレス部116bに出力する。
【0114】
エコーサプレス部116bでは、音源分離信号のスペクトルSOUTa(i,ω)と、エコーサプレスゲイン補正部115bからのエコーサプレスゲインGESb_r(i,ω)とを用いて、(33)式、(34)式に従い、エコーサプレス後の音源分離信号のスペクトルSOUTa(i,ω)に重畳されている音響エコー信号を抑圧する。
【数27】
【0115】
ここで、SOUTb_real(i,ω)とSOUTb_image(i,ω)は、フレームiにおける周波数ビンωの近端出力信号の周波数スペクトルの実数部と虚数部を示しており、近端出力信号の周波数スペクトルSOUTb(i,ω)は、(35)式で表すことができる。(35)式のjは虚数を表している。
【数28】
【0116】
近端出力信号時間領域変換部117は、第1の実施形態と同様にして、近端出力信号のスペクトルSOUTb(i,ω)が、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換し、近端出力信号を近端信号出力端子118に出力する。
【0117】
近端信号出力端子118は、例えば、IP網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、近端出力信号を接続されている回線を介して通話相手である遠端側に出力する。
【0118】
近端出力信号振幅スペクトル計算部119では、近端出力信号の周波数スペクトルSOUTb(i,ω)を用いて、(36)式に従い、近端出力信号の振幅スペクトル|SOUTb(i,ω)|が求められる。
【数29】
【0119】
そして、近端出力信号振幅スペクトル計算部124は、算出した近端入力信号の振幅スペクトル|SOUTb(i,ω)|をシングルトーク判定部120に出力する。
【0120】
シングルトーク判定部120では、音源分離信号がシングルトークかシングルトーク以外かを音源分離入力信号の振幅スペクトル|SEPA(i,ω)|と近端出力信号の振幅スペクトル|SOUTb(i,ω)|とを用いて判定する。シングルトークかシングルトーク以外かを判定する手法は、例えば、(37)式に従い、シングルトークかシングルトーク以外かを判定する手法がある。(37)式のFsはサンプリング周波数、TH1は閾値である。
【数30】
【0121】
(37)式の条件が真のときはシングルトークと判定し、偽のときはシングルトーク以外として判定する。閾値TH1は、(37)式の場合、シングルトーク時は(37)式の左辺が小さい値になるので、小さい固定値(例えばTH1=0.3)やフレームで変化する変数などにしても良い。なお、シングルトークかシングルトーク以外か否かの判定方法は、種々の方法を広く適用することができ、例えば、遠端信号の振幅スペクトルと各近端入力信号の振幅スペクトルとの相関を求めて相関が高いときはシングルトークとする方法で判定しても良い。シングルトーク判定部120は、シングルトーク判定結果を推定エコーパス特性更新部122a、122bに出力する。
【0122】
推定エコーパス特性計算部121a、121bは、現フレームの推定エコーパス特性|Ha(i,ω)|、|Hb(i,ω)|を遠端信号の振幅スペクトル|ROUTa(i,ω)|、|ROUTb(i,ω)|と音源分離信号の振幅スペクトル|SEPA(i,ω)|を用いて、(38)式、(39)式に従い求める。
【数31】
【0123】
現フレームの推定エコーパス特性|Ha(i,ω)|、|Hb(i,ω)|が求まれば推定エコーパス特性更新部122a、122bに現フレームの推定エコーパス特性|Ha(i,ω)|、|Hb(i,ω)|を出力する。
【0124】
推定エコーパス特性更新部122a、122bは、シングルトーク判定部120a、120bでシングルトークと判定されたフレームで、推定エコーパス特性|Ha(i,ω)|、|Hb(i,ω)|と推定エコーパス特性保持部108a、108bに保持されている推定エコーパス特性|Ha(i−1,ω)|、|Hb(i−1,ω)|から推定エコーパス特性|Ha(i,ω)|、|Ha(i,ω)|を(40)式、(41)式に従って更新する。
【数32】
【0125】
aは時定数フィルタの係数であり、aは0以上、1以下の値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えばa=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えばa=0.01等の値)。推定エコーパス特性更新部122a、120bは更新したエコーパス特性|H(i,ω)|を推定エコーパス特性保持部108a、108bに保持させる。
【0126】
一方、シングルトーク判定部120a、120bでシングルトーク以外と判定されたフレームはエコーパス特性の更新を行わない。
【0127】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、第1の実施形態の効果に加えて、スピーカを増設したステレオエコーを抑圧することができる。
【0128】
(C)他の実施形態
上述した各実施形態においても、種々の変形実施形態を説明したが、本発明は以下の変形実施形態についても適用することができる。
【0129】
(C−1)上述した各実施形態で説明した音源分離エコー抑圧装置は、例えば、テレビ会議システムや電話会議システム等に用いられる音声通信装置を含む装置に搭載されるようにしても良い。また、携帯電話機やスマートフォン等の携帯端末に本発明の音源分離エコー抑圧装置が搭載されるようにしても良い。
【0130】
(C−2)上述した第2の実施形態において、推定した推定エコー信号の相関を考慮して、複数のステレオ信号の相関があるときには、過度の抑圧を防止するために、推定エコー信号の振幅スペクトルと音源分離信号の振幅スペクトルとの差分をとることで、相関成分を除去するようにしても良い。
【符号の説明】
【0131】
100…音源分離エコー抑圧装置、101(101a、101b)…遠端信号入力端子、102(102a、102b)…DA変換器、103(103a、103b)…スピーカ、104a、104b…マイク、105a、105b…AD変換器、106(106a、106b)…遠端信号周波数領域変換算部、107(107a、107b)…遠端信号振幅スペクトル計算部、108(108a、108b)…推定エコーパス特性保持部、109(109a、109b)…推定エコー信号計算部、110a、110b…近端入力信号周波数領域変換部、111…音源分離ゲイン計算部、112…音源分離部、113、113a…音源分離信号振幅スペクトル計算部、113b…エコーサプレス後音源分離信号振幅スペクトル計算部、114(114a、114b)…エコーサプレスゲイン計算部、115(115a、115b)…エコーサプレスゲイン補正部115(116a、116b)…エコーサプレス部、117…近端出力信号時間領域変換部、118…近端信号入力端子、119…近端出力信号振幅スペクトル計算部、120…シングルトーク判定部120…推定エコーパス特性計算部、122…推定エコーパス特性更新部。
図1
図2