特許第6435613号(P6435613)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧
特許6435613トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム
<>
  • 特許6435613-トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム 図000002
  • 特許6435613-トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム 図000003
  • 特許6435613-トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム 図000004
  • 特許6435613-トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6435613
(24)【登録日】2018年11月22日
(45)【発行日】2018年12月12日
(54)【発明の名称】トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラム
(51)【国際特許分類】
   H04B 3/23 20060101AFI20181203BHJP
   H04R 3/02 20060101ALI20181203BHJP
【FI】
   H04B3/23
   H04R3/02
【請求項の数】9
【全頁数】14
(21)【出願番号】特願2014-42049(P2014-42049)
(22)【出願日】2014年3月4日
(65)【公開番号】特開2015-170867(P2015-170867A)
(43)【公開日】2015年9月28日
【審査請求日】2016年11月15日
(73)【特許権者】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(74)【代理人】
【識別番号】100090620
【弁理士】
【氏名又は名称】工藤 宣幸
(72)【発明者】
【氏名】石黒 高詩
【審査官】 後澤 瑞征
(56)【参考文献】
【文献】 特表2007−519316(JP,A)
【文献】 特開平01−198155(JP,A)
【文献】 特開平9−181651(JP,A)
【文献】 特開平5−130207(JP,A)
【文献】 特開平7−66756(JP,A)
【文献】 国際公開第2002/095975(WO,A1)
【文献】 特開2004−228939(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04B 3/20−3/23
H04R 3/02
(57)【特許請求の範囲】
【請求項1】
エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、上記エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出器において、
受信入力信号の特定帯域を減衰し、減衰後の信号を上記受信出力信号として出力する特定帯域減衰手段と、
上記送信入力信号の上記特定帯域を抽出する特定帯域抽出手段と、
上記送信入力信号の上記特定帯域以外の帯域を抽出する特定帯域外抽出手段と、
上記特定帯域減衰手段から出力される上記受信出力信号の電力値が第1の閾値を超えており、かつ、上記特定帯域抽出手段からの出力信号の電力値と、上記特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、上記トーク状態をシングルトーク状態と判定するトーク状態判定手段と
を備えることを特徴とするトーク状態検出器。
【請求項2】
エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、上記エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出器において、
受信入力信号の特定帯域を減衰し、減衰後の信号を上記受信出力信号として出力する特定帯域減衰手段と、
上記送信入力信号の上記特定帯域を抽出する特定帯域抽出手段と、
上記送信入力信号の上記特定帯域以外の帯域を抽出する特定帯域外抽出手段と、
上記特定帯域抽出手段からの出力信号の電力値に基づいて、近端側の第1の背景雑音電力値を推定する第1の背景雑音電力値推定手段と、
上記特定帯域抽出手段からの出力信号の電力値から、上記第1の背景雑音電力値推定手段による背景雑音電力値を減算する第1の減算手段と、
上記特定帯域外抽出手段からの出力信号の電力値に基づいて、近端側の第2の背景雑音電力値を推定する第2の背景雑音電力値推定手段と、
上記特定帯域抽出手段からの出力信号の電力値から、上記第2の背景雑音電力値推定手段による背景雑音電力値を減算する第2の減算手段と、
上記特定帯域減衰手段から出力される上記受信出力信号の電力値が第1の閾値を超えており、かつ、上記特定帯域抽出手段からの出力信号の電力値と、上記特定帯域外抽出手段からの出力信号の電力値との比が第3の閾値未満のとき、上記トーク状態をシングルトーク状態と判定するトーク状態判定手段と
を備えることを特徴とするトーク状態検出器。
【請求項3】
上記第1の背景雑音電力値推定手段は、上記特定帯域抽出手段からの出力信号の所定区間における最小電力値を検出し、これを上記第1の背景雑音電力値とし、
上記第2の背景雑音電力値推定手段は、特定帯域外抽出手段からの出力信号の所定区間における最小電力値を検出し、これを上記第2の背景雑音電力値とする
ことを特徴とする請求項2に記載のトーク状態検出器。
【請求項4】
上記特定帯域が、聴感上の影響の少ない帯域のものであることを特徴とする請求項1〜3のいずれかに記載のトーク状態検出器。
【請求項5】
上記特定帯域が、2.5〜3.0kHzの帯域であることを特徴とする請求項1〜4のいずれかに記載のトーク状態検出器。
【請求項6】
エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、上記エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出方法において、
特定帯域減衰手段が、受信入力信号の特定帯域を減衰し、減衰後の信号を上記受信出力信号として出力し
特定帯域抽出手段が、上記送信入力信号の上記特定帯域を抽出し、
特定帯域外抽出手段が、上記送信入力信号の上記特定帯域以外の帯域を抽出し、
トーク状態判定手段が、上記特定帯域減衰手段から出力される上記受信出力信号の電力値が第1の閾値を超えており、かつ、上記特定帯域抽出手段からの出力信号の電力値と、上記特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、上記トーク状態をシングルトーク状態と判定する
ことを特徴とするトーク状態検出方法。
【請求項7】
請求項1〜5のいずれかに記載のトーク状態検出器を備えることを特徴とするエコーキャンセラ。
【請求項8】
請求項1〜5のいずれかに記載のトーク状態検出器を備えることを特徴とするエコーサプレッサ。
【請求項9】
エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、上記エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出プログラムにおいて、
コンピュータを、
受信入力信号の特定帯域を減衰し、減衰後の信号を上記受信出力信号として出力する特定帯域減衰手段と、
上記送信入力信号の上記特定帯域を抽出する特定帯域抽出手段と、
上記送信入力信号の上記特定帯域以外の帯域を抽出する特定帯域外抽出手段と、
上記特定帯域減衰手段から出力される上記受信出力信号の電力値が第1の閾値を超えており、かつ、上記特定帯域抽出手段からの出力信号の電力値と、上記特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、上記トーク状態をシングルトーク状態と判定するトーク状態判定手段と
して機能させることを特徴とするトーク状態検出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラムに関し、例えば、エコーキャンセラ又はエコーサプレッサの適応制御において、適応処理のイネーブル(Enable)/ディセーブル(Disable)制御を行うトーク状態検出器、トーク状態検出方法及びエコーキャンセラ、並びに、トーク状態検出プログラムに適用し得るものである。
【背景技術】
【0002】
図4は、一般的なエコーキャンセラの構成図である。まず、図4を用いて、エコーキャンセラ及びダブルトーク検出器の動作について説明する。
【0003】
図4に示すように、エコーキャンセラ1は、擬似エコー生成部11、減算器12、ダブルトーク検出器13を有する。
【0004】
擬似エコー生成部11は、学習機能を持つ適応フィルタであって、受信出力端子Routより出力される受信出力信号x(n)から、擬似エコーyr(n)を生成するものである。また、疑似エコー生成部11は、残差出力端子RESより出力される残差信号e(n)を、適応フィルタ特性とエコーパス伝達特性の差分によって生じた誤差とみなし、適応フィルタ特性がエコーパス伝達特性に収束するように、適応フィルタの係数を更新していくものである。
【0005】
エコーキャンセラ1の受信入力端子Rinには、遠端話者から受信する受信入力信号xi(n)が入力される。この受信入力信号xi(n)は、近端側に向けて受信出力端子Routからx(n)として出力されるとともに、疑似エコー生成部11(適応フィルタ)にx(n)として入力される。ここで、x(n)=xi(n)である。
【0006】
受信出力端子Routから出力される信号x(n)は、2線4線変換機能をもつハイブリッド回路2を経由して、近端話者へ送られる。また、ハイブリッド回路(エコーパス)2では、エコーy(n)が発生し、エコーy(n)と近端話者から送出される近端送出信号t(n)とが加算された送信入力信号d(n)が、エコーキャンセラ1の送信入力端子Sinに入力される。
【0007】
d(n)=y(n)+t(n) …(1)
減算器12は、送信入力信号d(n)から擬似エコー信号yr(n)を差し引き、残差信号e(n)を出力するものである。
【0008】
e(n)=d(n)−yr(n) …(2)
減算器12の出力である残差信号e(n)には、フィルタ特性とエコーパス伝達特性の差分によって生じる残留エコーΔy(n)(=y(n)−yr(n))と、近端送出信号t(n)が含まれる。
【0009】
Δy(n)=y(n)−yr(n) …(3)
式(2)に、式(1)を代入する。
【0010】
e(n)=d(n)−yr(n)=y(n)+t(n)−yr(n)
=(y(n)−yr(n))+t(n) …(4)
式3、式4より、
e(n)=Δy(n)+t(n) …(5)
受信出力信号x(n)が無信号(x(n)=0)のとき、残差信号e(n)の信号成分は近端送出信号t(n)のみとなるので、適応フィルタの係数更新をディセーブルにすることにより、適応フィルタの係数が発散しないように制御する必要がある。
【0011】
受信出力信号x(n)に音声信号が存在し、近端送出信号t(n)が無信号(t(n)=0)であるとき、即ち、シングルトーク状態のとき、残差信号e(n)の信号成分は残留エコーΔy(n)のみとなるので、この残差信号e(n)を適応フィルタ特性とエコーパス伝達特性の差分によって生じた誤差とみなして適応フィルタの係数を更新していけば、適応フィルタの特性はエコーパスの特性に収束していく。従って、シングルトーク状態においては、適応フィルタの係数更新をイネーブルにすれば良い。
【0012】
受信出力信号x(n)と近端送出信号t(n)の両方に音声信号が存在するとき、即ち、ダブルトーク状態の時、残差信号e(n)には、適応フィルタ特性とエコーパス伝達特性の差分によって生じる残留エコーΔy(n)と、近端送出信号t(n)とが含まれるので、適応フィルタの係数更新をディセーブルにすることにより、適応フィルタの係数が発散しないように制御する必要がある。
【0013】
そこで、ダブルトーク検出器13は、受信出力信号x(n)、送信入力信号d(n)および残差信号e(n)を監視して通話状態を判定し、受信出力信号無信号またはダブルトーク状態の時には適応フィルタの係数更新をディセーブルにし、シングルトーク状態の時には適応フィルタの係数更新をイネーブルにする制御を行っている。
【0014】
従来、ダブルトーク検出方法の一例として、特許文献1に開示される方法がある。特許文献1には、エコーパス減衰量を推定し、推定結果に基づきダブルトーク判定を実施する方法が開示されている。
【先行技術文献】
【特許文献】
【0015】
【特許文献1】特開2009−033344号公報
【発明の概要】
【発明が解決しようとする課題】
【0016】
しかしながら、エコーパスの周波数特性は、フラットではなく、又近端背景雑音の影響を受け得る等の理由から、エコーパス減衰量の推定値は誤差を含んでいる。そのため、特許文献1の記載技術を用いても、ダブルトーク検出器が、シングルトーク時にダブルトークと誤判定してしまったり、ダブルトーク時にシングルトークと誤判定してしまったりするおそれが生じ得る。
【0017】
例えば、ダブルトーク検出器が、シングルトーク時にダブルトークと誤判定した場合、適応制御をディセーブルとするため、適応フィルタの収束が遅くなってしまう。逆に、ダブルトーク検出器が、ダブルトーク時にシングルトークと誤判定した場合、適応制御をイネーブルとするので、適応フィルタの係数が発散してしまうという問題がある。
【0018】
そのため、シングルトーク状態を高精度で検出することができるトーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラムが求められている。
【課題を解決するための手段】
【0019】
かかる課題を解決するために、第1の本発明のトーク状態検出器は、エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出器において、(1)受信入力信号の特定帯域を減衰し、減衰後の信号を受信出力信号として出力する特定帯域減衰手段と、(2)送信入力信号の特定帯域を抽出する特定帯域抽出手段と、(3)送信入力信号の特定帯域以外の帯域を抽出する特定帯域外抽出手段と、(4)特定帯域減衰手段から出力される受信出力信号の電力値が第1の閾値を超えており、かつ、特定帯域抽出手段からの出力信号の電力値と、特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、トーク状態をシングルトーク状態と判定するトーク状態判定手段とを備えることを特徴とする。
第2の本発明のトーク状態検出器は、エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出器において、(1)受信入力信号の特定帯域を減衰し、減衰後の信号を受信出力信号として出力する特定帯域減衰手段と、(2)送信入力信号の特定帯域を抽出する特定帯域抽出手段と、(3)送信入力信号の特定帯域以外の帯域を抽出する特定帯域外抽出手段と、(4)特定帯域抽出手段からの出力信号の電力値に基づいて、近端側の第1の背景雑音電力値を推定する第1の背景雑音電力値推定手段と、(5)特定帯域抽出手段からの出力信号の電力値から、第1の背景雑音電力値推定手段による背景雑音電力値を減算する第1の減算手段と、(6)特定帯域外抽出手段からの出力信号の電力値に基づいて、近端側の第2の背景雑音電力値を推定する第2の背景雑音電力値推定手段と、(7)特定帯域抽出手段からの出力信号の電力値から、第2の背景雑音電力値推定手段による背景雑音電力値を減算する第2の減算手段と、(8)特定帯域減衰手段から出力される受信出力信号の電力値が第1の閾値を超えており、かつ、特定帯域抽出手段からの出力信号の電力値と、特定帯域外抽出手段からの出力信号の電力値との比が第3の閾値未満のとき、トーク状態をシングルトーク状態と判定するトーク状態判定手段とを備えることを特徴とする。
【0020】
第3の本発明のトーク状態検出方法は、エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出方法において、(1)特定帯域減衰手段が、受信入力信号の特定帯域を減衰し、減衰後の信号を受信出力信号として出力し、(2)特定帯域抽出手段が、送信入力信号の上記特定帯域を抽出し、(3)特定帯域外抽出手段が、送信入力信号の上記特定帯域以外の帯域を抽出し、(4)トーク状態判定手段が、特定帯域減衰手段から出力される受信出力信号の電力値が第1の閾値を超えており、かつ、特定帯域抽出手段からの出力信号の電力値と、特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、トーク状態をシングルトーク状態と判定することを特徴とするトーク状態検出方法。
【0021】
の本発明のエコーキャンセラは、第1の本発明のトーク状態検出器を備えることを特徴とする。
【0022】
第5の本発明のエコーサプレッサは、第1の本発明のトーク状態検出器を備えることを特徴とする。
第6の本発明のトーク状態検出プログラムは、エコーキャンセラの受信出力信号、送信入力信号に基づいてトーク状態を検出し、エコーキャンセラが有する適応フィルタの係数更新を制御するトーク状態検出プログラムにおいて、コンピュータを、(1)受信入力信号の特定帯域を減衰し、減衰後の信号を受信出力信号として出力する特定帯域減衰手段と、(2)送信入力信号の特定帯域を抽出する特定帯域抽出手段と、(3)送信入力信号の特定帯域以外の帯域を抽出する特定帯域外抽出手段と、(4)特定帯域減衰手段から出力される受信出力信号の電力値が第1の閾値を超えており、かつ、特定帯域抽出手段からの出力信号の電力値と、特定帯域外抽出手段からの出力信号の電力値との比が第2の閾値未満のとき、トーク状態をシングルトーク状態と判定するトーク状態判定手段として機能させることを特徴とする。
【発明の効果】
【0023】
本発明によれば、シングルトーク状態を高精度で検出することができる。
【図面の簡単な説明】
【0024】
図1】第1の実施形態に係るダブルトーク検出器の内部構成を示す内部構成図である。
図2】第1の実施形態に係る送信入力端子Sinに入力される送信入力信号の周波数特性を説明する説明図である。
図3】第2の実施形態に係るダブルトーク検出器の内部構成を示す内部構成図である。
図4】実施形態に係るエコーキャンセラの内部構成を示す内部構成図である。
【発明を実施するための形態】
【0025】
(A)第1の実施形態
以下では、本発明に係るトーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラムの第1の実施形態を、図面を参照しながら詳細に説明する。
【0026】
(A−1)第1の実施形態の構成
第1の実施形態に係るエコーキャンセラは、図4に示す従来のエコーキャンセラと同一又は対応する構成要素を有する。すなわち、第1の実施形態のエコーキャンセラ1は、疑似エコー生成部11、減算器12、トーク状態検出器としてのダブルトーク検出器13を有する。
【0027】
図1は、第1の実施形態に係るダブルトーク検出器13の内部構成を示す内部構成図である。
【0028】
図1において、第1の実施形態に係るダブルトーク検出器13は、帯域阻止フィルタ101、帯域通過フィルタ102、帯域通過フィルタ103、電力算出部104、電力算出部105、電力算出部106、ダブルトーク判定部107を有する。
【0029】
ここで、特定帯域減衰手段は、帯域阻止フィルタ101及び電力算出部106を含むものである。特定帯域抽出手段は、帯域通過フィルタ102及び電力算出部104を含むものである。特定帯域外抽出手段は、帯域通過フィルタ103及び電力算出部105を含むものである。
【0030】
帯域阻止フィルタ(BEF)101は、受信入力端子Rinと接続しており、受信入力端子Rinからの受信入力信号のうち特定帯域の信号を阻止して受信出力端子Routに出力するものである。また、帯域阻止フィルタ101からの出力信号は、電力算出部106に与えられる。
【0031】
ここで、帯域阻止フィルタ101により阻止する特定帯域の信号は、2.5〜3.0kHz帯域の信号であり、聴覚上ほとんど影響を与えない帯域の信号である。また、2.5〜3.0kHzの減衰量は、例えば40dBである。
【0032】
帯域通過フィルタ(BPF)102は、送信入力端子Sinと接続し、送信入力信号のうち特定帯域の信号(2.5〜3.0kHz帯域の信号)を通過させるものである。また、帯域通過フィルタ102からの出力信号は、電力算出部104に与えられる。
【0033】
ここで、帯域通過フィルタ102が通過させる特定帯域の信号は、上述した帯域阻止フィルタ101の阻止帯域内の帯域である。この実施形態では、帯域通過フィルタ102は、2.5〜3.0kHz帯域の信号を通過させるものとする。
【0034】
帯域通過フィルタ(BPF)103は、送信入力端子Sinと接続し、送信入力端子のうち特定帯域の信号(2.0〜2.5kHz帯域の信号)を通過させるものである。また、帯域通過フィルタ103からの出力信号は、電力算出部105に与えられる。
【0035】
ここで、帯域通過フィルタ103は、帯域通過フィルタ102と同様に、上記の帯域阻止フィルタ101の阻止帯域外の帯域を通過させるものである。この実施形態では、2.0〜2.5kHz帯域の信号を通過させるものとする。
【0036】
電力算出部104は、帯域通過フィルタ102からの出力信号が入力され、その入力信号の各サンプル値を平均化した電力値P_BPF1を算出して、ダブルトーク判定部107に与えるものである。
【0037】
ここで、電力算出部104による入力信号の平均電力値の算出方法は、例えば、入力信号の各サンプル値を2乗した値をFIR形フィルタにより平均化して電力値P_BPF1を算出する方法を適用することができる。なお、電力算出部104が入力信号の平均電力値の算出する方法は、サンプル値を2乗する方法に限定されるものではなく、入力信号のサンプル値の絶対値を用いるようにしても良い。また、電力算出部104は、FIRフィルタに代えて適当な時定数を持つIIR形LPFを用いるようにしても良い。
【0038】
電力算出部105は、帯域通過フィルタ103からの出力信号が入力され、その入力信号の各サンプル値を平均化した電力値P_BPF2を算出して、ダブルトーク判定部107に与えるものである。電力算出部105による入力信号の平均電力値の算出方法は、電力算出部104と同様の方法を適用することができる。
【0039】
電力算出部106は、帯域阻止フィルタ101からの出力信号が入力され、その入力信号の各サンプル値を平均化した電力値P_BEFを算出して、ダブルトーク判定部107に与えるものである。電力算出部106による入力信号の平均電力値の算出方法は、電力算出部104と同様の方法を適用することができる。
【0040】
ダブルトーク判定部107は、電力算出部104〜106からの各電力値P_BPF1、P_BPF2、P_BEFに基づき、ダブルトーク状態又はシングルトーク状態を判定して、その判定結果をエコー消去部108に出力するものである。
【0041】
ダブルトーク判定結果がシングルトーク状態となった場合、疑似エコー生成部11の適応制御がイネーブルとなり、適応処理の学習が更新される。
【0042】
エコー消去部108は、図4の疑似エコー生成部11、減算器12を含むものである。擬似エコー生成部11は、学習機能を持つ適応フィルタであって、受信出力端子Routより出力される受信出力信号x(n)から、擬似エコーyr(n)を生成するものである。また、疑似エコー生成部11は、残差出力端子RESより出力される残差信号e(n)を、適応フィルタ特性とエコーパス伝達特性の差分によって生じた誤差とみなし、適応フィルタ特性がエコーパス伝達特性に収束するように、適応フィルタの係数を更新していくものである。また、減算器12は、送信入力信号d(n)から擬似エコー信号yr(n)を差し引き、残差信号e(n)を出力するものである。
【0043】
(A−2)第1の実施形態の動作
次に、第1の実施形態に係るダブルトーク検出器13によるダブルトーク検出方法の処理動作を、図面を参照しながら詳細に説明する。
【0044】
図1において、遠端話者からの受信入力信号xi(n)は、受信入力端子Rinに入力される。受信入力端子Rinに入力された受信入力信号xi(n)は、帯域阻止フィルタ101に入力され、2.5〜3.0kHzの特定帯域の信号成分が阻止される。そして、2.5〜3.0kHzの特定帯域の信号成分が減衰した信号x(n)が、受信出力端子Rout及び電力算出部106に出力される。
【0045】
ここで、帯域阻止フィルタ101により2.5〜3.0kHz帯域の信号は減衰される。例えば、この実施形態では、帯域阻止フィルタ101による2.5〜3.0kHzの減衰量は40dBとする。これにより、受信入力信号xi(n)が帯域阻止フィルタ101を通過することにより、特定帯域2.5〜3.0kHzの信号は、ほとんど無くなった状態でx(n)として出力される。
【0046】
受信出力端子Routから出力される受信出力信号x(n)は、2線4線変換機能をもつハイブリッド回路2を経由して、近端話者へ送られる。また、ハイブリッド回路(エコーパス)2では、エコーy(n)が発生し、エコーy(n)と近端話者から送出される近端送出信号t(n)とが加算された送信入力信号d(n)が、エコーキャンセラ1の送信入力端子Sinに入力される。
【0047】
エコーキャンセラ1のダブルトーク検出器13では、帯域阻止フィルタ101により2.5〜3.0kHzの特定帯域の信号が阻止された信号が、電力算出部106に入力される。電力算出部106は、例えば、特定帯域2.5〜3.0kHzの信号が阻止された受信出力信号のサンプル値を2乗して、平均化した電力値P_BEFがダブルトーク判定部107に与えられる。
【0048】
また、エコーキャンセラ1において、送信入力端子Sinからの送信入力信号は、帯域通過フィルタ102及び帯域通過フィルタ103に入力される。
【0049】
このとき、帯域通過フィルタ102は、帯域阻止フィルタ101が帯域阻止を行う特定帯域2.5〜3.0kHz内の信号を通過させるようにし、帯域通過フィルタ103は、帯域阻止フィルタ101の特定帯域2.5〜3.0kHz外の帯域(例えば、2.0〜2.5kHz)の信号を通過させるようにする。
【0050】
ここで、帯域通過フィルタ102の通過帯域は、帯域阻止フィルタ101が阻止する特定帯域の範囲を含む帯域であれば良く、例えば特定帯域と同じ帯域を通過させるようにしても良いし、また例えば特定帯域の範囲内の一部を通過させるようにしても良い。
【0051】
また、帯域通過フィルタ103の通過帯域は、帯域阻止フィルタ101が阻止する特定帯域外の帯域を通過させればよく、例えば、特定帯域2.5〜3.0kHzに隣接する帯域2.0〜2.5kHzとしてもよい。
【0052】
図2は、第1の実施形態に係る送信入力端子Sinに入力される送信入力信号の周波数特性を説明する説明図である。図2(A)は、遠端話者のみが発話するシングルトーク時の送信入力信号の周波数特性を示しており、図2(B)は、近端話者及び遠端話者が発話するダブルトーク時の送信入力信号の周波数特性を示している。
【0053】
帯域阻止フィルタ101により受信出力信号x(n)の2.5〜3.0kHzの特定帯域の信号は減衰されている。
【0054】
従って、遠端話者のみが発話するシングルトーク時は、送信入力端子Sinからの送信入力信号は、図2(A)に示すように、2.5〜3.0kHzが減衰している。
【0055】
そのため、特定帯域2.5〜3.0kHzを通過させる帯域通過フィルタ102を通過する信号の平均電力値P_BPF1は、特定帯域以外の帯域2.0〜2.5kHzを通過させる帯域通過フィルタ103を通過する信号の平均電力値P_BPF2に比べて大きく減衰する傾向となる。
【0056】
一方、遠端話者と近端話者とが同時に発話するダブルトーク時は、近端話者が発話するため、近端話者の音声が、直接、送信入力端子Sinから入力される。従って、送信入力信号には、2.5〜3.0kHzの特定帯域の信号パワーが大きくなる。
【0057】
そのため、2.5〜3.0kHz帯域(BEF阻止帯域内)のパワーP_BPF1は、2.0〜2.5kHz帯域(BEF阻止帯域外)のパワーP_BPF2に比べて、それほど大きく減衰する傾向とはならない。
【0058】
ダブルトーク判定部107は、図2(A)及び図2(B)に示す送信入力信号の周波数特性に基づいて、下記の式(6)及び式(7)の条件が成立したときにシングルトークと判定し、式(6)及び式(7)の条件が成立しないときにダブルトークと判定する。
【0059】
P_BEF>TH1 …(6)
P_BPF1/P_BPF2<TH2 …(7)
ここで、式(6)は、帯域阻止フィルタ101からの出力信号の平均電力値P_BEFが閾値TH1を超えることを条件としている。これは、遠端話者が発話した音声信号があるか否かを判断するためである。例えば、この実施形態では、閾値TH1は「−35dBm」とする場合を例示する。
【0060】
式(7)は、帯域通過フィルタ102を通過した信号の平均電力値P_BPF1と、帯域通過フィルタ103を通過した信号の平均電力値P_BPF2との比が閾値TH2未満であることを条件としている。これは、図2)に示すように、ダブルトーク時には、特定帯域2.5〜3.0kHzの信号の電力値の減衰量が小さいことを判断するためである。例えば、この実施形態では、閾値TH2は「−10dB」とする場合を例示する。
【0061】
ダブルトーク判定部107は、式(6)及び式(7)の条件を満たすか否かの判定結果を、エコー消去部108に与える。
【0062】
エコー消去部108における処理動作は、従来の疑似エコー生成部11及び減算12の動作と同じである。
【0063】
擬似エコー生成部11は、学習機能を持つ適応フィルタであって、受信出力端子Routより出力される受信出力信号x(n)から、擬似エコーyr(n)を生成する。また、疑似エコー生成部11は、残差出力端子RESより出力される残差信号e(n)を、適応フィルタ特性とエコーパス伝達特性の差分によって生じた誤差とみなし、適応フィルタ特性がエコーパス伝達特性に収束するように、適応フィルタの係数を更新していく。
【0064】
減算器12は、送信入力信号d(n)から擬似エコー信号yr(n)を差し引き、残差信号e(n)を出力するものである。
【0065】
減算器12の出力である残差信号e(n)には、フィルタ特性とエコーパス伝達特性の差分によって生じる残留エコーΔy(n)(=y(n)−yr(n))と、近端送出信号t(n)が含まれる。
【0066】
受信出力信号x(n)が無信号(x(n)=0)のとき、残差信号e(n)の信号成分は近端送出信号t(n)のみとなるので、適応フィルタの係数更新をディセーブルにすることにより、適応フィルタの係数が発散しないように制御する。
【0067】
受信出力信号x(n)に音声信号が存在し、近端送出信号t(n)が無信号(t(n)=0)であるとき、即ち、シングルトーク状態のとき、残差信号e(n)の信号成分は残留エコーΔy(n)のみとなるので、この残差信号e(n)を適応フィルタ特性とエコーパス伝達特性の差分によって生じた誤差とみなして適応フィルタの係数を更新していけば、適応フィルタの特性はエコーパスの特性に収束していく。従って、シングルトーク状態においては、適応フィルタの係数更新をイネーブルにすれば良い。
【0068】
受信出力信号x(n)と近端送出信号t(n)の両方に音声信号が存在するとき、即ち、ダブルトーク状態の時、残差信号e(n)には、適応フィルタ特性とエコーパス伝達特性の差分によって生じる残留エコーΔy(n)と、近端送出信号t(n)とが含まれるので、適応フィルタの係数更新をディセーブルにすることにより、適応フィルタの係数が発散しないように制御する。
【0069】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、エコー信号の2.5〜3.0kHz帯域の信号は減衰しほとんど無くなるようにしたので、遠端話者のみが発話しているシングルトーク状態を高精度で検出することができる。
【0070】
(B)第2の実施形態
次に、本発明のトーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ、並びに、トーク状態検出プログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
【0071】
(B−1)第2の実施形態の構成及び動作
図3は、第2の実施形態に係るダブルトーク検出器13の内部構成を示す内部構成図である。
【0072】
図3において、第2の実施形態に係るダブルトーク検出器13は、帯域阻止フィルタ101、帯域通過フィルタ102、帯域通過フィルタ103、電力算出部104、電力算出部105、電力算出部106、ダブルトーク判定部107、所定区間最小値検出部201、減算器202、所定区間最小値検出部203、減算器204を有する。
【0073】
ここで、第1の背景雑音電力値推定手段は、所定区間最小値検出部201を含むものである。第1の減算手段は、減算器202を含むものである。また、第2の背景雑音電力値推定手段は、所定区間最小値検出部203を含むものである。第2の減算手段は、減算器204を含むものである。
【0074】
第2の実施形態では、第1の実施形態に係る図1の構成要素に加えて、所定区間最小値検出部201、減算器202、所定区間最小値検出部203、減算器204を備える点で第1の実施形態と異なる。なお、第2の実施形態において、第1の実施形態と同一又は対応する構成要素については、第1の実施形態に係る図1で示した符号を用いて説明する。
【0075】
所定区間最小値検出部201は、帯域通過フィルタ102の通過した信号の平均電力値P_BPF1を電力算出部104から入力して、所定区間における最小値を検出して、その最小値を減算器202に与えるものである。
【0076】
減算器202は、電力算出部104からの平均電力値P_BPF1から、所定区間最小値検出部201の出力値を減算して、その減算した値をダブルトーク判定部107に与えるものである。
【0077】
所定区間最小値検出部203は、帯域通過フィルタ103の通過した信号の平均電力値P_BPF2を電力算出部105から入力して、所定区間における最小値を検出して、その最小値を減算器204に与えるものである。
【0078】
減算器204は、電力算出部105からの平均電力値P_BPF2から、所定区間最小値検出部203の出力値を減算して、その減算した値をダブルトーク判定部107に与えるものである。
【0079】
つまり、減算器202及び204は、送信入力端子Sinからの送信入力信号の特定帯域2.5〜3.0kHz(BEF阻止帯域内)のパワーP_BPF1と、特定帯域以外の帯域2.0〜2.5kHz帯域(BEF阻止帯域外)のP_BPF2との各入力信号に対して、所定区間の最小値を減算するものである。
【0080】
無通話状態においても近端の背景雑音が存在する。そのため、2.5〜3.0kHz帯域(BEF阻止帯域内)のパワーP_BPF1と、2.0〜2.5kHz帯域(BEF阻止帯域外)のパワーP_BPF2とは「0」とはならない。これは、遠端話者のみが発話するシングルトーク状態においても同様である。そのため、近端の背景雑音の影響により、ダブルトーク判定精度が劣化するという問題がある。
【0081】
そこで、第2の実施形態において、所定区間の信号電力値のうち最小値を検出する所定区間最小値検出部201を備え、所定区間最小値検出部201が、近端の背景雑音の2.5〜3.0kHz帯域(BEF阻止帯域内)の背景雑音電力値P_BEF1_BGを推定する。そして、減算器202が、平均電力値P_BEF1から背景雑音電力値P_BEF1_BGを差引くことにより、近端の背景雑音電力の影響を低減する。
【0082】
また、送信入力端子Sinの送信入力信号の2.0〜2.5kHz帯域(BEF阻止帯域外)の平均電力値P_BPF2にも近端の背景雑音電力値の影響が生じるので、同様に、所定区間最小値検出部203が、近端の背景雑音の2.0〜2.5kHz帯域(BEF阻止帯域外)の背景雑音電力値P_BEF2_BGを推定する。そして、減算器204が、平均電力値P_BEF2から背景雑音電力値P_BEF2_BGを差引くことにより、近端の背景雑音電力値の影響を低減する。
【0083】
ダブルトーク判定部107は、減算器202及び減算器204からの各出力信号と、帯域阻止フィルタ101からの出力信号とに基づいて、ダブルトーク状態又はシングルトーク状態を判定するものである。
【0084】
ここで、第2の実施形態に係るダブルトーク判定部107の判定方法の処理動作を説明する。
【0085】
第2の実施形態に係るダブルトーク判定部107は、図2(A)及び図2(B)に示した送信入力信号の周波数特性の傾向を利用し、下記の式(6)及び式(8)の両方の条件が成立した場合にシングルトーク判定とする。
【0086】
P_BEF>TH1 …(6)
P_BPF1a/P_BPF2a<TH3 …(8)
但し、
P_BPF1a=(P_BPF1)−(P_BPF1_BG) …(9)
P_BPF2a=(P_BPF2)−(P_BPF2_BG) …(10)
式(6)において、閾値TH1は、例えば−35dBmである。
【0087】
式(8)において、閾値TH3は、例えば−10dBである。
【0088】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態において、近端背景雑音の影響も低減するようにしたので、遠端話者のみが発話しているシングルトーク状態を更に高精度で検出することができる。
【0089】
(C)他の実施形態
上述した各実施形態においても種々の変形実施形態を言及したが、本発明は、以下の変形実施形態にも適用することができる。
【0090】
上述した各実施形態では、BEF阻止帯域として2.5〜3.0kHz帯域、BEF阻止帯域外の帯域として2.0〜2.5kHz帯域とする場合を例示した。しかし、BEF阻止帯域及びBEF阻止帯域外の帯域は、上述した各実施形態で説明した帯域と異なる帯域で実現しても良い。また、帯域通過フィルタ102は、BEF阻止帯域と同じ2.5〜3.0kHz帯域を通過させるようにしたが、BEF阻止帯域の範囲内であれば、BEF阻止帯域の範囲よりも狭くしても良い。
【0091】
上述した各実施形態では、BEF阻止帯域を1つのみとしたが、複数の帯域を阻止するようにしても良い。また、高域通過フィルタ(HPF)を用いて低域阻止しても良いし、低域通過フィルタ(LPF)を用いて高域阻止しても良い。例えば、0.2kHz以下および2.5〜3.0kHzの帯域阻止としても良い。
【0092】
上述した第1及び第2の実施形態では、式(7)及び式(8)において、閾値TH2及び閾値TH3は固定閾値としたが、閾値を適応的に制御するようにしても良い。
【0093】
上述した各実施形態では、帯域阻止及び帯域抽出(帯域通過)に帯域阻止フィルタ及び帯域通過フィルタを用いる方法を説明したが、FFTなどを用いても良い。
【符号の説明】
【0094】
1…エコーキャンセラ、11…疑似エコー生成部、12…減算器、13…ダブルトーク検出器、101…帯域阻止フィルタ、102…帯域通過フィルタ、103…帯域通過フィルタ、104〜106…電力算出部、107…ダブルトーク判定部、201及び203…所定区間最小値検出部、202及び204…減算器。
図1
図2
図3
図4