(58)【調査した分野】(Int.Cl.,DB名)
外部から受信した受話信号の前記ターゲット周波数以上の帯域を制限して前記出力音声信号を生成して前記音声出力部と前記遅延処理部に出力する帯域制限部を有する請求項1に記載のエコーキャンセル装置。
前記フィルタ係数更新判断部は、前記音声区間情報が前記音声区間であることを示し、かつ、前記音響信号に話者の音声成分が含まれている場合は前記係数更新信号をディスイネーブル状態とする請求項1乃至3のいずれか1項に記載のエコーキャンセル装置。
前記送話信号を第1の送話信号として入力し、前記第1の送話信号に含まれる残留エコー信号成分を抑圧して第2の送話信号として出力する残留エコー信号抑圧部を更に有する請求項1乃至6のいずれか1項に記載のエコーキャンセル装置。
【発明を実施するための形態】
【0013】
実施の形態1
以下、図面を参照して本発明の実施の形態について説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0014】
また、以下で説明する機能ブロックの各構成は、ハードウェア又はソフトウェア、もしくはその両方によって構成され、1つのハードウェア又はソフトウェアから構成してもよいし、複数のハードウェア又はソフトウェアから構成してもよい。各機能(各処理)を、CPUやメモリ等を有する演算部(例えば、コンピュータ)により実現してもよい。例えば、記憶装置に実施形態における作成方法を行うためのプログラムを格納し、各機能を、記憶装置に格納されたプログラムをCPUで実行することにより実現してもよい。
【0015】
これらのプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0016】
図1に実施の形態1にかかるエコーキャンセル装置1を含むハンズフリー装置の構成を説明するブロック図を示す。
図1に示す構成は、ハンズフリー装置の構成の一例であり、スピーカーとマイクとを有していれば他の構成であっても良い。また、
図1に示した例は、ハンズフリー装置を自動車の車内に設けた例であるが、ハンズフリー装置は、自動車以外の場所で用いられても構わない。
【0017】
図1に示すように、ハンズフリー装置は、自動車の車内に設けられる。また、実施の形態1にかかるハンズフリー装置は、自動車の車体に設けられたマイクロフォン(以下、単にマイクと称す)とスピーカーSPとを有する。実施の形態1にかかるハンズフリー装置は、マイクロフォンを音声入力部として利用し、スピーカーSPを音声出力部として利用する。
【0018】
実施の形態1にかかるハンズフリー装置は、音声の入出力インタフェースとして利用されるものであり、通話先との通話は携帯電話等を用いて行う。そこで、
図2に実施の形態1にかかるハンズフリー装置を含む通話システムを説明するブロック図を示す。
図2に示すように、実施の形態1にかかるハンズフリー装置は、携帯電話との間で受話信号と送話信号を送受信することで、携帯電話の音声入力インタフェースとして機能する。そして、実施の形態1にかかるエコーキャンセル装置1は、ハンズフリー装置内に設けられるものとする。また、実施の形態1にかかる通話システムでは、携帯電話とエコーキャンセル装置1とが同じサンプリングレートで音声信号を扱うものとする。以下で、実施の形態1にかかるエコーキャンセル装置1の詳細について説明する。
【0019】
図3に実施の形態1にかかるエコーキャンセル装置1のブロック図を示す。なお、
図3で示す例は、エコーキャンセル装置1が16kHzのサンプリングレートでサンプリングされた受話信号と送話信号を扱うものとする。
【0020】
図3に示すように、実施の形態1にかかるエコーキャンセル装置1は、受話信号入力部11、送話信号出力部12、音声出力部13、音声入力部14、遅延処理部15、音声区間検出処理部16、音声区間検出処理部16、フィルタ係数更新判断部17、エコー信号低減処理部18、帯域制限部19を有する。
【0021】
受話信号入力部11は、外部から与えられる送話信号を受信して、内部に出力する。帯域制限部19は、受話信号入力部11から与えられた送話信号に帯域制限処理を施して、出力音声信号を出力する。帯域制限部19は、例えば、ローパスフィルタであって、受話信号のターゲット周波数以上の帯域を制限して出力音声信号を生成する。ここで、ターゲット周波数は予め定められているものとする。
【0022】
音声出力部13は、帯域制限部19から出力された出力音声信号S1を空間に第1の音声信号として出力する。音声出力部13が出力する出力音声信号S1は、ターゲット周波数以下の周波数成分を含むように帯域制限がされているため、第1の音声信号(例えば、
図3のエコー信号)はターゲット周波数以上の音声成分が抑制された状態である。
【0023】
音声入力部14は、空間を介して伝搬する第2の音声信号を収音して、ターゲット周波数よりも高い周波数成分を含む音響信号S2を生成する。ここで、第2の音声信号には、話者が発する音声成分、騒音源から発せられるロードノイズ、第1の音声信号として出力されたエコー信号成分が含まれる。
【0024】
送話信号出力部12は、エコー信号低減処理部18において音響信号S2に対してエコーキャンセル処理がなされた後に生成される送話信号を携帯電話に出力する。
【0025】
遅延処理部15は、出力音声信号S1を遅延させて音声区間検出処理部16に与える。ここで、遅延処理部15による出力音声信号S1の遅延量は、音声出力部13により出力された第1の音声信号が車室空間の空間伝搬係数を経て変化したエコー信号が第2の音声信号に含まれる形で収音されるところまでの合計遅延時間に相当する時間である。
【0026】
音声区間検出処理部16は、遅延処理部15で遅延された出力音声信号S1が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する。この音声区間情報は、フィルタ係数更新判断部17に与えられる。ここで。音声区間検出処理部16では、出力音声信号S1において、一定の時間間隔において予め設定した閾値を超える振幅レベルの信号の存在の有無を確認することで音声区間の有無を検出する。例えば、時間間隔を5msecに設定し、閾値を−24dBに設定した時、遅延処理部15で遅延処理した出力音声信号S1の振幅レベルの絶対値を確認し、−24dBを超える振幅レベルを検知した場合に音声区間と判定し、この振幅レベルを下回った場合に非音声区間と判定する。
【0027】
フィルタ係数更新判断部17は、音声区間情報が音声区間であることを示す場合に、音響信号に出力音声信号S1に対応するエコー信号成分の有無を判断し、エコー信号成分が含まれていると判断した場合に係数更新信号S3をイネーブル状態とする。ここで、フィルタ係数更新判断部17は、音響信号の特徴量を算出し、ターゲット周波数以下の周波数帯の第1の特徴量と、ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、係数更新信号S3をイネーブル状態とする。
【0028】
フィルタ係数更新判断部17は、エコー経路推定処理判断部21、特徴量検出処理部22、周波数信号変換処理部23を有する。周波数信号変換処理部23は、音響信号S2を周波数信号に変換する。より具体的には、周波数信号変換処理部23は、FFT(Fast Fourier Transform)或いはDCT(discrete cosine transform)を用いて、音響信号S2を時間領域から周波数領域の信号に変換する。また、周波数信号変換処理部23は、ターゲット周波数よりも高い周波数帯域までの音声を記録可能なサンプリングレート(例えば、16kHz)で音響信号S2を周波数信号に変換するものとする。
【0029】
周波数信号変換処理部23は、例えば、サンプリングレートが16kHz、周波数信号変換処理のサンプル数を1024sampleとした場合、周波数分解能を(1)式により求めると、15.625Hzとなる。
【数1】
【0030】
また、この場合の周波数変換周期の時間は(2)式により算出すると0.032secとなる。
【数2】
【0031】
特徴量検出処理部22は、波数変換処理部にて変換された周波数信号から第1の特徴量及び第2の特徴量を算出する。より具体的には、特徴量検出処理部22は、周波数領域の信号に変換された音響信号S2のスペクトル信号からスペクトルの特徴量を検出する。エコースペクトルの特徴量の検出方法は、音響信号S2の広域周波数帯域のスペクトル強度を検出する。具体的な検出方法は後述する。
【0032】
さらに、特徴量検出処理部22では、車室内の話者が発話した話者スペクトル信号も同時に検出する。話者スペクトルの特徴量の検出は、ターゲット周波数以上でかつ音声スペクトル強度が検出可能な周波数帯域におけるスペクトル強度の時間変化を監視する方法がある。
【0033】
エコー経路推定処理判断部21は、音声区間検出処理部16が出力した音声区間情報と特徴量検出処理部22のスペクトル特徴量検出情報を用いて、エコー経路推定処理を実行するか否かを判断する。より具体的には、音声区間情報が音声区間であることを示す場合に、第1の特徴量及び第2の特徴量との差が予め設定した更新判断閾値以上であった場合に係数更新信号S3をイネーブル状態とする。特徴量検出処理部22が出力するスペクトル特徴量検出情報は、車室内の騒音による影響による誤検出を防ぐために、音声区間情報を用いて、音声区間情報が音声区間であるときに特徴量検出処理部22が算出するターゲット周波数帯域におけるスペクトル特徴量検出情報を用いる。ターゲット周波数帯域のスペクトル特徴量検出情報が閾値を超えていると判断した場合、エコー信号が含まれていると判断し、エコー経路推定処理を実行するようにエコー信号低減処理部18の適応フィルタ部31へ通知する。しかし、エコー信号が含まれており、かつ車室内の話者が発話したとき、いわゆるダブルトーク状態でエコー推定処理を実行すると適応フィルタ係数の更新に誤差が生じ、エコーキャンセル効果が低下してしまう。このためダブルトーク状態では、エコー推定処理を実行しないように適応フィルタ部31へ通知する。
【0034】
エコー信号低減処理部18は、音響信号S2から出力音声信号に対応するエコー信号成分の抑圧度合いを設定するフィルタ係数を係数更新信号S2に応じて更新しながら、音響信号S2からエコー信号成分を低減した送話信号を生成する。エコー信号低減処理部18は、適応フィルタ部31、加算器32を有する。
【0035】
適応フィルタ部31は、係数更新信号S3に応じてフィルタ係数を更新しながら、遅延処理部遅延処理部15により遅延された出力音声信号S1と加算部32が出力した送話信号とに基づき疑似エコー信号を生成する。適応フィルタ部31は、例えば、LMS(Least Mean Square)アルゴリズムで300Tap程度のフィルタ長でよい。この適応フィルタ部31では、遅延処理部15で遅延させた出力音声信号S1を参照信号として用いる。また、適応フィルタ部31では、加算器32で加算処理した後の残留エコー信号を誤差信号として用いる。そして、適応フィルタ部31は、エコー経路推定処理判断部21がエコー経路推定処理をする判断をした場合(例えば、係数更新信号S3がイネーブル状態となっている場合)に適応フィルタの係数を更新する。
【0036】
加算器32は、音響信号S2から適応フィルタ部31が出力した疑似エコー信号成分を減算して送話信号を出力する。
【0037】
続いて、実施の形態1にかかるエコーキャンセル装置1の動作について説明する。以下の説明では、特にエコーキャンセル装置1におけるエコーキャンセル処理について説明する。そこで、
図4に、実施の形態1にかかるエコーキャンセル装置1の動作を説明するフローチャートを示す。
【0038】
図4に示すように、実施の形態1にかかるエコーキャンセル装置1は、エコーキャンセル処理を開始すると、まず、出力音声信号S1の音声区間情報をフィルタ係数更新判断部17にて取得する(ステップS11)。そして、フィルタ係数更新判断部17は、出力音声信号S1に音声信号が含まれているか否かを判定する(ステップS12)。このステップS12において、音声区間情報が非音声区間であると判断された場合(ステップS12のNOの枝)、音響信号S2にエコー成分が含まれないため、エコーキャンセル装置1はエコーキャンセル処理を実施することなくエコーキャンセル処理を終了する。
【0039】
一方、ステップS12において、音声区間情報が音声区間であると判断された場合(ステップS12のYESの枝)、周波数信号変換処理部23にて音響信号S2の周波数変換処理が行われる(ステップS13)。その後、特徴量検出処理部22にて高域周波数帯域の特徴量抽出処理が行われる(ステップS14)。そして、エコー経路推定処理判断部21にてエコー信号の有無の検出処理が行われる(ステップS15)。
【0040】
ステップS15のエコー信号の検出処理において、エコー信号が検出されなかった場合(ステップS15のNOの枝)、エコーキャンセル装置1は、エコーキャンセル処理を実施することなくエコーキャンセル処理を終了する。一方、ステップS15のエコー信号の検出処理において、エコー信号が検出された場合(ステップS15のYESの枝)、適応フィルタ部31においてエコー経路推定処理と(ステップS16)、疑似エコー信号生成処理(ステップS17)とを実施する。そして、加算器32にてエコー信号除去処理を実施する(ステップS18)。
【0041】
ここで、ステップS14の特徴量抽出処理と、ステップS15について、音響信号S2の具体的な例を示してより詳細に説明する。そこで、まず、音響信号S2として入力される音声信号の特徴を説明する図を
図5に示す。
図5で示す例は、静かな部屋で音声のみを録音した音声信号の波形である。この
図5では、上部に音声信号の時間信号波形を示し、下部に音声信号のスペクトログラムを示した。なお、
図5では、時間波形(上部)のグラフは横軸を時間、縦軸を振幅とするものであり、スペクトログラム(下部)のグラフは横軸を時間、縦軸を周波数とし、信号のスペクトル強度を濃淡で示したものである。
【0042】
図5に示すように、音声スペクトルは、子音と母音とで高いスペクトル強度を示す周波数帯域が異なる。母音は10〜4000Hzの範囲でスペクトル強度が強く、4000Hz〜8000Hzの範囲でスペクトル強度が弱くなる傾向がある。子音は、3000Hz〜9000Hzの範囲でスペクトル強度が強く、9000Hz〜15000Hzの範囲でスペクトル強度が弱くなる傾向がある。
【0043】
また、
図6に実施の形態1にかかるエコーキャンセル装置1に入力される雑音信号の特徴を説明する図を示す。
図6に示す図は、自動車が高速道路を走行している状態で自動車の車内で収音したロードノイズのスペクトル信号のグラフである。この
図6に示すグラフは、横軸を周波数、縦軸をロードノイズの信号強度とするものである。
【0044】
図6に示すように、ロードノイズは、20〜1500Hzに強いスペクトルを有する。特に、ロードノイズでは500Hz以下の低域周波数において非常に強いスペクトルを有する。つまり、ロードノイズは、2000Hz以上の周波数帯域の音声信号に与える影響は少ない。
【0045】
続いて、
図7に実施の形態1にかかるエコーキャンセル装置1で扱う音声信号の時間波形とスペクトログラムを説明する図を示す。また、
図8に実施の形態1にかかるエコーキャンセル装置で扱う音声信号のスペクトルを説明する図を示す。
図7及び
図8に示す例は、サンプリングレートを16kHzとした波形であって、帯域制限部19による帯域制限処理を行ってない状態の音声信号を示すものである。
図7及び
図8に示すように、サンプリングレートを16kHzとした場合、音声信号の再生周波数帯域は8kHz程度まである。
【0046】
一方、
図9及び
図10に
図7及び
図8で示した音声信号に帯域制限処理を施した場合の音声信号の特徴を説明する図を示す。
図9及び
図10に示す例は、ターゲット周波数を4kHzとしたものであり、帯域制限部19で4kHz以上の周波数帯域の信号成分を減衰させたものである。
図9及び
図10に示すようにターゲット周波数(例えば、4kHz)を上限とした帯域制限を行うと、ターゲット周波数以上の周波数帯の音声成分はほぼなくなる。
【0047】
実施の形態1にかかるエコーキャンセル装置1では、
図7及び
図8に示した特徴を有する音響信号S2を取得可能な音声入力部14及び周波数信号変換処理部23において、
図9及び
図10で示した特徴を有するエコー信号を含む音響信号S2が取得される。そして、実施の形態1にかかるエコーキャンセル装置1では、
図9及び
図10で示した特徴を有するエコー信号を含む音響信号S2に基づきエコー信号の有無を判断する。そこで、特徴量検出処理部22及びエコー経路推定処理判断部21における処理を具体的な数値例を挙げて説明する。
【0048】
まず、音声入力部14がサンプリングレート16kHzで音響信号S2を生成し、周波数信号変換処理部23がサンプル数を1024sample、周波数分解能15.625Hzで周波数変換処理を実施し、出力音声信号S1の帯域が制限されるターゲット周波数が4kHzで設定されている場合、ターゲット周波数に相当する周波数信号は256番目のスペクトル信号となる。そこで、特徴量検出処理部22は、第1の特徴量として3750Hzの周波数信号となる240番目のスペクトル信号から256番目のスペクトル信号の強度の平均値を算出する。また、特徴量検出処理部22は、第2の特徴量として256番目のスペクトル信号から4250Hzの周波数信号となる272番目のスペクトル信号の強度の平均値を算出する。ステップS14の特徴量検出処理では、特徴量検出処理部22が上記の特徴量を算出する。
【0049】
そして、エコー経路推定処理判断部21は、ステップS15のエコー信号検出処理において、第1の特徴量と第2の特徴量との差が予め設定した更新判断閾値(例えば、12dB)以上を超えているか否かに基づきエコー信号の有無を判定する。具体的には、第1の特徴量と第2の特徴量との差が更新判断閾値を下回っていれば、エコー信号はないとしてエコー経路推定処理判断部21は係数更新信号S3をディスイネーブル状態とする。また、第1の特徴量と第2の特徴量との差が更新判断閾値以上であれば、エコー信号が有るとしてエコー経路推定処理判断部21は係数更新信号S3をイネーブル状態とする。
【0050】
ここで、実施の形態1にかかるエコー経路推定処理判断部21では、音響信号S2の特徴量の算出とともに、話者が発話した話者スペクトル信号も同時に検出する。そこで、以下で話者スペクトル信号の検出方法について説明する。
【0051】
例えば、ハンズフリー通話装置1のサンプリングレートが16kHz、ターゲット周波数が4kHz、周波数変換処理のフレームサイズが1024sampleに設定されていた場合、周波数分解能は15.625Hz、1フレームあたりの時間は32msec、マイクより収音可能な周波数は8kHzとなる。スペクトル信号においてターゲット周波数の4kHzに相当するスペクトル信号は256番目になる。そこで、特徴量検出処理部22は、話者スペクトル信号の検出においては音声帯域の上限を最大の512番目の8kHzとして、この256番目から512番目までの256個のスペクトル信号のスペクトル強度を算出する。そして、エコー経路推定処理判断部21は、現在フレームと過去フレームの話者スペクトル信号のスペクトル強度を比較することで話者の音声区間を検出する。エコー経路推定処理判断部21は、現在フレームが音声区間である場合、係数更新信号S3をディスイネーブル状態に維持することで、適応フィルタ部31のフィルタ係数の更新を停止させる。
【0052】
また、ハンズフリー通話装置1のサンプリングレートが人間音声の周波数帯域を十分に超えるシステムである場合、検出する周波数帯域に上限を設ければよい。例えば、ハンズフリー通話装置1のサンプリングレートが64kHz、ターゲット周波数が4kHz、周波数変換処理のフレームサイズを4096sample、とする場合、周波数分解能は15.625Hz、1フレームあたりの時間は32msec、マイクより収音可能な周波数は32kHzまでとなる。スペクトル信号でターゲット周波数の4kHzに相当するスペクトル信号は256番目になる。この場合、特徴量検出処理部22が検出する音声帯域の上限を640番目の10kHzとする。そして、特徴量検出処理部22は、256番目から640番目までの384個のスペクトル信号についてスペクトル信号の強度を算出する。エコー経路推定処理判断部21は、現在フレームと過去フレームのスペクトル強度を比較することで話者の音声区間を検出する。
【0053】
スペクトル強度の比較には、過去フレームのスペクトルに対し現在フレームのスペクトルの方がある閾値(例えば12dB)を超えているか否かを判断する。さらに、閾値を超えるスペクトル信号の個数がある閾値(例えば、100[個])を超えるか否かより車室内の話者の音声であるかを判断する。過去フレームのスペクトル信号は、次の(3)式で更新することができる。なお、(3)式において、iはスペクトル番号を示す。
【数3】
【0054】
上記説明より、実施の形態1にかかるエコーキャンセル装置1では、収音可能な周波数帯域よりも低い周波数のターゲット周波数で帯域制限がされた出力音声信号S1を出力し、収音した音声から生成される音響信号S2のターゲット周波数以下の所定の周波数帯の音響信号S2の第1の特徴量とターゲット周波数より高い所定の周波数帯の音響信号S2の第2の特徴量とを比較することでエコー信号の有無を検出する。これにより、実施の形態1にかかるエコーキャンセル装置1は、高い精度でエコー信号の有無を検出することができる。
【0055】
また、実施の形態1にかかるエコーキャンセル装置は、第1の特徴量及び第2の特徴量の算出に用いるスペクトル信号の周波数帯をターゲット周波数の近傍に限定している。そのため、実施の形態1にかかるエコーキャンセル装置1は、エコー信号の検出に用いるメモリ量を削減することができる。また、第1の特徴量及び第2の特徴量の算出に用いるスペクトル信号の周波数帯をターゲット周波数の近傍に限定することで、実施の形態1にかかるエコーキャンセル装置1は、ロードノイズ等の影響を受けることなく、エコー信号の有無を検出することができる。
【0056】
さらに、実施の形態1にかかるエコーキャンセル装置1は、第1の特徴量及び第2の特徴量の算出と共に、ターゲット周波数よりも高い周波数帯域の音響信号S2のスペクトル信号から話者が発した音声の話者スペクトルの有無を検出する。そして、実施の形態1にかかるエコーキャンセル装置1は、音響信号S2が話者スペクトルを含む音声区間であると判断した場合、適応フィルタ部31のフィルタ係数の更新を停止する。これにより、実施の形態1にかかるエコーキャンセル装置1は、話者の発話によるフィルタ係数の誤った更新を防止してエコーキャンセル効果を高めることができる。
【0057】
実施の形態2
実施の形態2では、出力音声信号S1の周波数帯域の制限方法の別の形態について説明する。そこで、実施の形態2にかかるエコーキャンセル装置2のブロック図を
図11に示す。
図11に示すように、実施の形態2にかかるエコーキャンセル装置2は、実施の形態1にかかるエコーキャンセル装置1から帯域制限部19を除いたものである。
【0058】
実施の形態2にかかるエコーキャンセル装置2では、携帯電話等から受信する受話信号よりも高いサンプリングレートで音響信号S2を生成し、この音響信号S2から送話信号を生成する。これにより、実施の形態2にかかるエコーキャンセル装置2では、出力音声信号S1の周波数帯域を音響信号S2の周波数帯域よりも低く制限する。
【0059】
具体的には、例えば、受話信号のサンプリングレートが8kHzであった場合、出力音声信号S1の周波数帯域は4kHzに制限される。一方、音響信号S2のサンプリングレートを16kHzとした場合、音響信号S2の周波数帯域は8kHzとなる。これにより、実施の形態2では、出力音声信号S1から生成されるエコー信号の信号特性が
図9及び
図10に示した周波数帯域制限が施された信号と同等とし、かつ、音響信号S2の信号特性を
図7及び
図8に示した帯域制限を施していない信号と同等とすることができる。つまり、実施の形態2にかかるエコーキャンセル装置2では、エコーキャンセル装置2を送話信号のサンプリングレートよりも高いサンプリングレートで動作させることで、実施の形態1にかかるエコーキャンセル装置1と同等なエコー信号の検出及びエコーキャンセル処理を実施することが可能となる。
【0060】
なお、人の音声信号の特徴は、性別や個人差はあるが基本周波数はおおむね100〜250Hzに強いスペクトルがあり、倍音構造より基本周波数を基準に2倍、3倍、4倍、・・・・n倍の周波数帯域になるに連れてスペクトル強度は弱くなる特徴がある。人の音声信号は、おおむね10〜12kHz程度までスペクトル信号が存在する。
【0061】
上記説明より、実施の形態2にかかるエコーキャンセル装置2では、帯域制限部19を用いることなく、実施の形態1にかかるエコーキャンセル装置1と同等なエコー信号の検出及びエコーキャンセル処理を行うことができる。
【0062】
実施の形態3
実施の形態3では、1回のエコーキャンセル処理を施した後に送話信号中に残留する残留エコー信号成分を除去する残留エコーキャンセル処理を実施の形態1にかかるエコーキャンセル装置1に追加した例について説明する。そこで、まず、残留エコー信号成分について説明する。
【0063】
図12及び
図13に、エコーキャンセル装置でエコーキャンセル処理を施す前の音声信号の特徴を説明する図を示す。
図12は、音声信号の時間波形とスペクトログラムを説明する図であり、
図13は、音声信号のスペクトルを説明する図である。一方、
図14及び
図15にエコーキャンセル装置でエコーキャンセル処理を施した後の音声信号の残留エコー信号成分を説明する図を示す。
図14は、残留エコー信号成分の時間波形とスペクトログラムを説明する図であり、
図15は、残留エコー信号成分のスペクトルを説明する図である。
【0064】
実施の形態1、2で説明したエコーキャンセル処理を施した場合であっても、適応フィルタ部31のフィルタ係数に誤差を含んでしまった場合には、適応フィルタ部31で生成した疑似エコー信号により、完全にエコー信号をキャンセルすることができない可能性がある。この場合、
図12及び
図13の音声信号に対して
図14及び
図15で示した残留エコー信号成分が残留する。実施の形態3にかかるエコーキャンセル装置3では、この残留エコー信号成分を除去する。
【0065】
そこで、実施の形態3にかかるエコーキャンセル装置3のブロック図を
図16に示す。
図16に示すように、実施の形態3にかかるエコーキャンセル装置3は、実施の形態1にかかるエコーキャンセル装置1のエコー信号低減処理部18と送話信号出力部12との間に残留エコー信号抑圧部41を追加したものである。
【0066】
残留エコー信号抑圧部41は、エコー信号低減処理部18が出力した送話信号を第1の送話信号として入力し、第1の送話信号に含まれる残留エコー信号成分を抑圧して第2の送話信号として出力する。残留エコー信号抑圧部41は、周波数信号変換処理部42、残留エコー信号減衰処理判断部43、残留エコー信号抑圧処理部44、時間信号変換処理部45を有する。なお、周波数信号変換処理部42及び残留エコー信号減衰処理判断部43内の特徴量検出処理部52は、周波数信号変換処理部23及び特徴量検出処理部22と同等のブロックであるため、
図16では、特徴量検出処理部22が第1の特徴量検出処理部、周波数信号変換処理部23が第1の周波数信号変換処理部、周波数信号変換処理部42が第2の周波数信号変換処理部、特徴量検出処理部52が第2の特徴量検出処理部となる。
【0067】
周波数信号変換処理部42は、加算器32が出力するエコーキャンセル処理後の第1の送話信号を時間領域から周波数領域の信号(周波数信号)に変換する。周波数信号変換処理部42はFFT或いはDCTを用いて第1の送話信号を周波数信号に変換する。
【0068】
残留エコー信号減衰処理判断部43は、残留エコー信号の有無を判断して残留エコー信号抑圧処理を施すか否かを決定する。そこで、残留エコー信号減衰処理判断部43は、エコー経路推定処理判断部51及び特徴量検出処理部52を有する。
【0069】
特徴量検出処理部52は、残留エコースペクトルの特徴量を検出する。特徴量検出処理部52における残留エコースペクトルの特徴量算出方法は、特徴量検出処理部22のスペクトル算出方法と同様の方法を採用することができる。
【0070】
エコー経路推定処理判断部51は、特徴量検出処理部52の残留エコースペクトルの検出情報により、残留エコー信号成分があると判断した場合に残留エコー信号抑圧処理部44に残留エコー信号抑圧処理の実施を指示する。
【0071】
残留エコー信号抑圧処理部44は、定常スペクトル推定処理と、残留エコースペクトル推定処理と、残留エコースペクトル抑圧処理とを実施する。定常スペクトル推定処理は、残留エコーおよび話者よる発話が無いときに定常スペクトル強度の情報について更新する。定常スペクトル情報は(4)式により更新される。なお、(4)式においてiは、スペクトル番号を示す。
【数4】
【0072】
残留エコースペクトル推定処理は、残留エコー信号成分を検出し、話者よる発話が無いときに残留スペクトル強度の情報について更新する。残留スペクトル情報は(5)式により行進される。なお、(5)式においてiは、スペクトル番号を示す。
【数5】
【0073】
残留エコースペクトル抑圧処理は、残留エコースペクトルと定常エコースペクトルの差分量を現在のスペクトル信号から差し引くことで残留エコー信号を抑圧することができる。残留エコースペクトル抑圧方法は、(6)式及び(7)式で求めることができる。なお、(6)式及び(7)式においてiは、スペクトル番号を示す。
【数6】
【数7】
【0074】
時間信号変換処理部45は、残留エコー信号成分を抑圧したスペクトル信号を周波数領域から時間領域に変換する周波数逆変換処理を行うことで第2の送話信号を生成する。
【0075】
続いて、実施の形態3にかかるエコーキャンセル装置3の残留エコー信号成分の抑圧処理の動作について、
図17に示すフローチャートを用いて説明する。
図17に示すように、実施の形態3にかかるエコーキャンセル装置3では、残留エコー抑圧処理を開始すると、まず、周波数信号変換処理部42による周波数変換処理(ステップS21)と特徴量検出処理部52による高域周波数帯域の特徴量抽出処理(ステップS22)を行う。
【0076】
そして、エコーキャンセル装置3では、ステップS22で抽出された特徴量に基づきエコー経路推定処理判断部51で残留エコー信号の検出処理を行う(ステップS23)。このステップS23において、残留エコー信号成分があると判断された場合(ステップS23のYESの枝)には、エコー経路推定処理判断部51にて音声信号の有無を検出する(ステップS26)。一方、ステップS23において、残留エコー信号成分がないと判断された場合(ステップS23のNOの枝)においても、エコー経路推定処理判断部51にて音声信号の有無を検出する(ステップS24)。
【0077】
ステップS24において、音声信号が検出された場合(ステップS24のYESの枝)には、エコーキャンセル装置3は、エコー信号の抑圧処理を施すことなく第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。一方、ステップS24において、音声信号が検出さなかった場合(ステップS24のNOの枝)には、残留エコー信号抑圧処理部44において定常スペクトル推定処理(ステップS25)を行った後に第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。
【0078】
ステップS26において、音声信号が検出された場合(ステップS27のYESの枝)には、残留エコー信号抑圧処理部44において残留エコースペクトル抑圧処理(ステップS28)を行った後に、残留エコースペクトル抑圧後の第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。一方、ステップS26において、音声信号が検出さなかった場合(ステップS26のNOの枝)には、残留エコー信号抑圧処理部44において残留エコースペクトル推定処理(ステップS27)を行った後に残留エコースペクトル抑圧処理(ステップS28)を行う。その後、エコーキャンセル装置3は、残留エコースペクトル抑圧後の第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。
【0079】
上記説明より、実施の形態3にかかるエコーキャンセル装置3では、エコーキャンセル処理後に残留したエコー信号成分についても抑圧処理を施す。これにより、実施の形態3にかかるエコーキャンセル装置3は、実施の形態1にかかるエコーキャンセル装置1よりも高いエコーキャンセル効果を奏する。
【0080】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。