(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-19
(45)【発行日】2023-01-27
(54)【発明の名称】会話支援装置
(51)【国際特許分類】
G10K 11/178 20060101AFI20230120BHJP
H04R 3/02 20060101ALI20230120BHJP
【FI】
G10K11/178 120
H04R3/02
(21)【出願番号】P 2020508299
(86)(22)【出願日】2019-03-15
(86)【国際出願番号】 JP2019010723
(87)【国際公開番号】W WO2019181758
(87)【国際公開日】2019-09-26
【審査請求日】2020-09-24
(31)【優先権主張番号】P 2018050337
(32)【優先日】2018-03-19
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100106116
【氏名又は名称】鎌田 健司
(74)【代理人】
【識別番号】100131495
【氏名又は名称】前田 健児
(72)【発明者】
【氏名】大橋 宏正
【審査官】渡邊 正宏
(56)【参考文献】
【文献】米国特許出願公開第2005/0207585(US,A1)
【文献】特開平05-035284(JP,A)
【文献】特開2012-195801(JP,A)
【文献】米国特許第06496581(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
G10L 19/00-19/26
G10L 21/00-21/18
G10L 25/00-25/93
G10L 99/00
G10K 11/00-13/00
H04R 3/00- 3/14
(57)【特許請求の範囲】
【請求項1】
スピーカと、
マイクと、
雑音を示す雑音信号を取得する雑音源取得部と、
前記スピーカと前記マイクとの間の二次経路の伝達特性を算出する第一の算出部と、
前記二次経路の伝達特性を用いて
、前記スピーカと前記マイクとの間のエコーを抑圧するエコー抑圧部と、
前記二次経路の伝達特性および前記雑音信号に基づいて、適応フィルタの係数を算出する第二の算出部と、
前記適応フィルタの係数
、前記雑音信号
および前記エコーが抑圧されたエコー抑圧後信号を用いて、前記雑音の抑圧を制御する制御信号を生成する能動的雑音抑圧制御部と、を備える、
会話支援装置。
【請求項2】
前記第二の算出部は、帯域制限フィルタを含み、
前記能動的雑音抑圧制御部は、前記帯域制限フィルタによって帯域が制限された信号を用いて、前記制御信号を生成する、
請求項1に記載の会話支援装置。
【請求項3】
前記第二の算出部は、前記第一の算出部と連携して動作する、
請求項1に記載の会話支援装置。
【請求項4】
前記第二の算出部は、前記第一の算出部が前記二次経路の伝達特性の算出を完了した後に、前記適応フィルタの係数を算出する、
請求項3に記載の会話支援装置。
【請求項5】
前記第一の算出部は、前記マイクへの入力と、前記スピーカからの出力とに基づいて、前記二次経路の伝達特性を算出する、
請求項1に記載の会話支援装置。
【請求項6】
前記マイクは、入力信号を取得し、
前記エコー抑圧部は、前記二次経路の伝達特性を用いてキャンセル信号を生成し、
前記能動的雑音抑圧制御部は、前記入力信号、前記キャンセル信号、および、前記制御信号に基づき、出力信号を生成し、
前記スピーカは、前記出力信号に基づいて音を出力する、
請求項1に記載の会話支援装置。
【請求項7】
前記二次経路の伝達特性は、次式で求められるように決定され、
【数12】
c^
(k)
f
は時刻kにおいて推定される適応フィルタであり、c^
(k)
f
は、1時刻前の適応フィルタに適応フィルタ更新量Δc^
f
に比例した値を加算することによって更新され、μは一回の更新あたりの更新量を制御するためのステップパラメータである、
請求項1に記載の会話支援装置。
【請求項8】
スピーカとマイクとの間の二次経路の伝達特性を算出し、
前記二次経路の伝達特性を用いて
、前記スピーカと前記マイクとの間のエコーを抑圧し、
前記二次経路の伝達特性および雑音源取得装置から取得した雑音信号に基づいて、適応フィルタの係数を算出し、
前記適応フィルタの係数
、前記雑音信号
および前記エコーが抑圧されたエコー抑圧後信号を用いて、前記雑音の抑圧を制御する制御信号を生成する、
会話支援方法。
【請求項9】
前記二次経路の伝達特性は、次式で求められるように決定され、
【数12】
c^
(k)
f
は時刻kにおいて推定される適応フィルタであり、c^
(k)
f
は、1時刻前の適応フィルタに適応フィルタ更新量Δc^
f
に比例した値を加算することによって更新され、μは一回の更新あたりの更新量を制御するためのステップパラメータであり、
請求項8に記載の会話支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、聞き取りたい音声が雑音によって妨害される環境において、話者の位置における雑音を抑圧する会話支援装置に関する。
【背景技術】
【0002】
特許文献1は、車室内に備え付けられたマイクおよびスピーカを用いて、話者間の双方向での会話支援を実現するための双方向会話補助装置を開示する。この双方向会話補助装置は、第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助装置であって、第1話者の第1音声を入力するための第1マイクと、第1音声を出力するための第1スピーカと、第2話者の第2音声を入力するための第2マイクと、第2音声を出力するための第2スピーカと、エコー・クロストークキャンセラと、を備える。エコー・クロストークキャンセラは、第2スピーカへの入力信号を用いて、第2スピーカから出力された第2音声が第1マイクに入力される第1エコー、及び、第2音声が第1マイクに入力されるクロストークの程度を示す妨害信号の推定値を算出する。そして、エコー・クロストークキャンセラは、算出した妨害信号の推定値を、第1マイクの出力信号から除去する。
【0003】
特許文献2は、車室内においてロードノイズやエンジン騒音を含む車室内騒音を車室内空間において抑圧するための能動的騒音抑圧装置を開示する。この能動的騒音抑圧装置は、車室内の騒音を空間的に相殺するための相殺音を生成するための制御部と、騒音を抑圧するための相殺音を出力するスピーカと、前記騒音と前記相殺音との相殺誤差音を検出するための誤差検出マイクを備える。前記制御部は、予め同定された前記相殺音出力スピーカと前記誤差検出マイクとの間の伝達特性に対応する補正値に基づいて、前記相殺音スピーカより再生された相殺音を前記誤差検出マイクにより検出された相殺誤差音からキャンセルするためのエコーキャンセル信号を生成するエコーキャンセル部を備える。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2017/064839号
【文献】特開2008-247342号公報
【発明の概要】
【0005】
本開示は、マイクとスピーカとの間において周囲環境変化に伴う音の伝達経路が変化した場合であっても、その変化に追従することによって能動的雑音抑圧を実現する会話支援装置を提供する。
【0006】
本開示における会話支援装置は、スピーカと、マイクと、雑音を示す雑音信号を取得する雑音源取得部と、スピーカとマイクとの間の二次経路の伝達特性を算出する第一の算出部と、二次経路の伝達特性を用いて、スピーカとマイクとの間のエコーを抑圧するエコー抑圧部と、二次経路の伝達特性および雑音信号に基づいて、適応フィルタの係数を算出する第二の算出部と、適応フィルタの係数、雑音信号およびエコーが抑圧されたエコー抑圧後信号を用いて、雑音の抑圧を制御する制御信号を生成する能動的雑音抑圧制御部と、を備える。
【0007】
本開示における会話支援装置は、マイクとスピーカとの間での環境が変化した場合であっても、その変化に追従することによって能動的雑音抑圧を実現することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、本開示におけるエコーキャンセル装置および能動的雑音制御装置を備えた会話支援装置の概要図である。
【
図2】
図2は、本開示におけるエコーキャンセル装置および能動的雑音制御装置を備えた会話支援装置の構成を示す構成図である。
【
図3】
図3は、実施の形態1における会話支援装置の構成を示すブロック図である。
【
図4】
図4は、実施の形態1における会話支援装置のエコー抑圧部および二次経路推定部の構成を示すブロック図である。
【
図5】
図5は、実施の形態1における会話支援装置の能動的雑音制御信号生成部の構成を示すブロック図である。
【
図6】
図6は、会話支援装置に含まれるエコーキャンセル装置の前段に雑音源取得部で取得した雑音源信号を用いて、入力信号から雑音を抑圧する場合の構成を示すブロック図である。
【
図7】
図7は、実施の形態2における会話支援装置の構成を示すブロック図である。
【
図8】
図8は、本開示における会話支援装置のマイクを配置する箇所の一例を示す外観図である。
【
図9】
図9は、本開示の別の態様に係る会話支援装置の構成を示す構成図である。
【
図10】
図10は、本開示のさらに別の態様に係る会話支援装置の構成を示す構成図である。
【発明を実施するための形態】
【0009】
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0010】
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために、提供されるのであって、これらにより請求の範囲に記載の主題を限定することは意図されていない。
【0011】
以下、
図1~2を用いて、本開示における会話支援装置1の構成を説明する。
【0012】
図1は、本開示におけるエコーキャンセル装置40および能動的雑音制御装置50を備えた会話支援装置1の構成図である。本開示においては、会話支援装置1の使用例として自動車を一例に説明する。すなわち、会話支援装置1は、自動車等の乗物に設けられている。
【0013】
本開示における会話支援装置1は、近端側マイク11、遠端側マイク21、近端側スピーカ12、遠端側スピーカ22、エコーキャンセル装置40、能動的雑音制御装置50を備える。
【0014】
近端側マイク11は、近端側話者2の発話を収音しつつ、雑音源30より近端側話者2近傍へと到来する雑音をモニタリングする。すなわち、近端側マイク11は、近端側話者2の発話を収音するための収音マイクと、近端側話者2近傍の雑音と能動的雑音制御装置50により生成し再生された雑音相殺音との誤差をモニタリングするための誤差マイクとを兼用する。
【0015】
遠端側マイク21は、遠端側話者3の発話を収音しつつ、雑音源30より遠端側話者3近傍へと到来する雑音をモニタリングする。すなわち、遠端側マイク21は、遠端側話者3の発話を収音するための収音マイクと、遠端側話者3近傍の雑音と能動的雑音制御装置50により生成し再生された雑音相殺音との誤差をモニタリングするための誤差マイクとを兼用する。
【0016】
近端側スピーカ12は、遠端側話者3の発話を拡声しつつ、近端側話者2近傍の雑音を消去するための信号を再生する。すなわち、近端側スピーカ12は、遠端側話者3の発話を拡声するための拡声スピーカと、近端側話者2近傍の雑音を消去するための消去スピーカとを兼用する。言い換えると、近端側スピーカ12は、遠端側マイク21と電気的に接続されており、遠端側マイク21への入力に基づいて音を出力する。
【0017】
遠端側スピーカ22は、近端側話者2の発話を拡声しつつ、遠端側話者3近傍の雑音を消去するための信号を再生する。すなわち、遠端側スピーカ22は、近端側話者2の発話を拡声するための拡声スピーカと、遠端側話者3近傍の雑音を消去するための消去スピーカとを兼用する。言い換えると、遠端側スピーカ22は、近端側マイク11と電気的に接続されており、近端側マイク11への入力に基づいて音を出力する。
【0018】
なお、近端側は、車体における進行方向に対して近い側のことであり、例えば、運転席側または助手席側を指す。また、遠端側は、車体における進行方向に対して遠い側のことであり、例えば、後列席側を指す。
【0019】
エコーキャンセル装置40は、近端側スピーカ12より再生された音声信号が空間を伝搬し近端側マイク11へと伝達することにより発生する到来エコー信号を、近端側マイク11による収音信号から除去する。さらに、エコーキャンセル装置40は、遠端側スピーカ22より再生された音声信号が空間を伝搬し遠端側マイク21へと伝達することにより発生する到来エコー信号を、遠端側マイク21による収音信号から除去する。
【0020】
能動的雑音制御装置50は、近端側マイク11によりモニタリングされた近端側話者2近傍の雑音信号と、別途手段により取得される雑音源30の雑音信号とを用いて近端側話者2近傍の雑音量を制御するための制御信号を生成する。さらに、能動的雑音制御装置50は、遠端側マイク21によりモニタリングされた遠端側話者3近傍の雑音信号と、別途手段により取得される雑音源30の雑音信号とを用いて遠端側話者3近傍の雑音量を制御するための制御信号を生成する。
【0021】
会話支援装置1では、近端側から遠端側に対しては、近端側マイク11により収音された近端側話者2の発話をエコーキャンセル装置40へと入力する。そして、不要な到来エコー信号の除去を行った発話信号を遠端側スピーカ22から遠端側話者3に向けて拡声する。これにより、車室内における近端側話者2から遠端側話者3への会話支援が実現される。
【0022】
すなわち、遠端側では会話支援装置1により近端側話者2の発話が拡声される。これにより、例えば走行中に雑音が発生する環境において、近端側話者2の発話が聴取困難な場合でも、近端側話者2の音声に対する聞き取りが向上できる。
【0023】
このとき、能動的雑音制御装置50は、会話支援装置1による拡声により聴取を補助するだけでなく、遠端側受聴位置での雑音の抑圧も行う。そのため、双方向の会話支援を向上することができる。
【0024】
図2は、本開示における会話支援装置1の構成を示す図である。会話支援装置1は、近端側マイク11、近端側スピーカ12、遠端側マイク21、遠端側スピーカ22、二次経路推定部60、エコーキャンセル装置40、雑音源取得部80、能動的雑音制御装置50を備える。エコーキャンセル装置40は、エコー抑圧部70を含む。能動的雑音制御装置50は、能動的雑音制御信号生成部90を含む。なお、雑音源取得部80、二次経路推定部60、エコーキャンセル装置40、および能動的雑音制御装置50の全部または一部は、一または複数の集積回路で実現されてもよい。また、雑音源取得部80、二次経路推定部60、エコーキャンセル装置40、および能動的雑音制御装置50の全部または一部は、会話支援装置1が備えるメモリに格納されたプログラムを、会話支援装置1が備えるプロセッサが実行することによって実現されてもよい。
【0025】
二次経路推定部60は、近端側では近端側マイク11からエコーを抑圧した後の信号であるエコー抑圧後信号、および、近端側スピーカ12における拡声信号を用いて、二次経路情報を推定する。また、二次経路推定部60は、遠端側では、遠端側マイク21からエコーを抑圧した後の信号であるエコー抑圧後信号、および、遠端側スピーカ22における拡声信号を用いて、二次経路情報を推定する。ここで、近端側の二次経路情報は、近端側スピーカ12における出力信号が近端側マイク11へと伝達する際の空間の伝達特性である。また、遠端側の二次経路情報は、遠端側スピーカ22における出力信号が遠端側マイク21へと伝達する際の空間の伝達特性である。
【0026】
なお、以下では、エコーキャンセル装置40、および能動的雑音制御装置50に関して近端側マイク11にて収音した音声を対象として説明を行う。しかし、遠端側マイク21に対しても同様の説明が成り立つ。
【0027】
エコー抑圧部70は、エコーキャンセル装置40に備えられる。エコー抑圧部70は、近端側マイク11で収音された音声の信号である収音信号を入力し、エコー信号を抑圧するための疑似エコー信号を生成する。そして、エコー抑圧部70は、生成した疑似エコー信号を収音信号から減算することによってエコー信号を抑圧する。ここで、エコー信号は、近端側スピーカ12から拡声された音声が空間を伝搬することで近端側マイク11に収音される信号である。
【0028】
なお、エコー抑圧部70は、近端側スピーカ12から出力される出力信号と、二次経路情報と、を用いて、疑似エコー信号を生成する。すなわち、二次経路情報がエコー抑圧部70へ入力されることで、エコー抑圧部70は疑似エコー信号を生成する。
【0029】
エコー抑圧部70によりエコー信号が抑圧されたエコー抑圧後信号は、別途遠端側に備えられた能動的雑音制御装置50により生成された制御信号と加算され、遠端側スピーカ22より再生される。
【0030】
雑音源取得部80は、雑音源30の雑音を示す雑音信号を取得する。例えば、雑音源30がエンジン回転音の場合、エンジンの近傍に外部マイクを配置することで、雑音源取得部80は、エンジン回転音を雑音信号として取得することができる。また、雑音源取得部80は、エンジンパルスの波形を雑音信号として取得しても良い。なお、上記の外部マイクは、一般的に、参照マイクまたは雑音参照マイクとも呼ばれる。
【0031】
また、雑音源30が道路とタイヤの間で生じる雑音である場合には、タイヤ近傍に外部マイクを配置することで、雑音源取得部80は、雑音信号を取得することができる。なお、雑音源取得部80は、雑音源取得部80という独立した構成としたが、近端側マイク11または遠端側マイク21に備えられる構成であってもよい。
【0032】
能動的雑音制御信号生成部90は、近端側話者2近傍の雑音を制御するための制御信号を生成する。能動的雑音制御信号生成部90は、生成された制御信号を近端側スピーカ12の再生信号に加算し、加算後の信号を拡声する。これにより、近端側マイク11近傍の雑音を制御することができる。また、制御信号は、雑音発生位置から近端側話者2近傍へと到来する騒音を空間的に抑圧するための信号として推定される。すなわち、制御信号は、アクティブノイズコントロール(ANC)のための信号である。
【0033】
能動的雑音制御信号生成部90が制御信号を生成するためには、雑音源取得部80によって取得された雑音信号と、近端側話者2の近傍の制御空間上での雑音抑圧量を測るための誤差信号と、二次経路情報と、が必要である。ここで、誤差信号は、近端側話者2の近傍位置での雑音信号が、近端側スピーカ12より再生された制御信号によって空間的にどれだけ抑圧されているかを、近端側マイク11でモニタリングすることによって得られる。また、二次経路情報は、近端側スピーカ12から再生された制御信号が雑音源30をモニタリングする位置においてどのように変化するかを表す情報である。
【0034】
しかしながら、近端側マイク11でモニタリングする信号には近端側スピーカ12より再生された遠端側話者3の発話などのエコー信号が混入している。そのため、能動的雑音制御装置50においては、エコー抑圧部70がエコー信号を消去したエコー抑圧後信号を誤差信号として用いる必要がある。また、予め二次経路推定部60によって推定された二次経路情報を能動的雑音制御信号生成部90へと入力することによって、二次経路情報は得られる。
【0035】
以上のように、能動的雑音制御信号生成部90は、雑音信号、誤差信号、そして二次経路情報を用いて制御信号を生成する。
【0036】
(実施の形態1)
以下、
図3~6を用いて、実施の形態1における会話支援装置1の処理を説明する。
【0037】
[1-1.会話支援装置における処理]
図3は実施の形態1における会話支援装置におけるブロック図である。
【0038】
ここで近端側を添字f、遠端側を添字rで表すとする。また、kを離散時間インデックスとする。数式において太字で表現されている記号はベクトルであり、時系列信号ベクトルまたは時系列に対応した係数ベクトルを表す。
【0039】
なお、本実施の形態では、一例として近端側の動作について説明するが、近端側、遠端側のどちらも同様の動作を行うとして良い。
【0040】
近端側マイク11によって収音されるマイク(入力)信号mf[k]は、近端側話者2による発話などを表す音声信号sf[k]、到来エコー信号df[k]、雑音信号nf[k]の和として、数式1のように表現される。
【0041】
【0042】
ここで、到来エコー信号df[k]は、数式2に示すように、消去信号加算前の近端側スピーカ12の再生信号yf[k]の時系列信号yfに、二次経路情報cfを畳み込むことによって得られる。二次経路情報cfとは、近端側スピーカ12から近端側マイク11への空間的な伝達特性を有限長のFIRフィルタとして表現した際の経路情報である。
【0043】
【0044】
ここで*は畳み込み演算を表す。
【0045】
また、二次経路情報cfはフィードフォワード型の能動的雑音制御装置50から見た際の二次経路の伝達特性である。なお、フィードフォワード型とは、雑音の影響が及ぶ前に雑音を打ち消す制御動作である。ここで、二次経路は、直接音の伝達経路および反射音の伝達経路を含む。すなわち、二次経路は、スピーカから出力された音波が空気を介してマイクへと伝搬する経路を意味する。
【0046】
到来雑音信号nf[k]は、数式3に示すように、雑音源30を表すv1[k]の時系列信号v1に、一次経路情報hfを畳み込むことによって得られる。一次経路情報hfとは、雑音源位置から近端側マイク11への空間的な伝達特性を有限長のFIRフィルタとして表現した際の経路情報である。
【0047】
【0048】
なお、雑音源30を表すvの添字の1は、複数の雑音源が存在することを想定した場合の1番目の雑音源を表す。また、一次経路情報hfはフィードフォワード型の能動的雑音制御装置50から見た場合の一次経路の伝達特性である。
【0049】
以上のように、マイク信号mf[k]には、近端側スピーカ12から到来したエコー信号df[k]と、雑音源30から到来した到来雑音信号nf[k]が重畳する。会話支援装置1は、この混入した到来エコー信号df[k]を抑圧することによって、近端側話者2の発話sf[k]だけを遠端側話者3へと伝える必要がある。
【0050】
また、能動的雑音制御装置50は、混入したエコー信号を抑圧した後のエコー抑圧後信号と、エコーキャンセルの際に得られた二次経路と、を用いて、空間的に雑音を抑圧するための制御信号を生成する必要がある。
【0051】
この目的を達成するため、本開示では以下のようなフローでの処理を実施する。
【0052】
まず、エコー抑圧部70は、マイク信号mf[k]からエコー信号df[k]の除去を行う。
【0053】
エコー信号の除去の際に、エコー抑圧部70は、エコー信号df[k]を除去するための疑似エコー信号d^
f[k]を生成する。
【0054】
次に、二次経路推定部60は、疑似エコー信号d
^
f[k]を生成するために二次経路情報c
fを二次経路情報c
^
fとして推定する。例えば、二次経路推定部60は、近端側マイク11への入力と、近端側スピーカ12からの出力とに基づいて、二次経路情報c
^
f(二次経路の伝達特性)を算出する。具体的な到来エコー信号d
f[k]の抑圧方法については、
図4を用いて後述する。
【0055】
エコー抑圧後信号ef[k]は、数式4に示すように、得られた疑似エコー信号d^
f[k]をマイク信号mf[k]から減算することで、得られる。
【0056】
【0057】
ここで、疑似エコー信号d^
f[k]は数式5のように表現される。
【0058】
【0059】
すなわち、疑似エコー信号d^
f[k]は、近端側スピーカ12から再生される信号に対し、二次経路推定部60で推定した二次経路情報c^
fを畳み込んで生成される信号である。
【0060】
そして、到来エコー信号df[k]と疑似エコー信号d^
f[k]が一致した場合にエコー抑圧が達成されることが分かる。
【0061】
次に、雑音源取得部80から得られた雑音信号と、到来エコー信号が抑圧されたエコー抑圧後信号ef[k]と、二次経路推定部60によって推定された二次経路情報c^
fと、を用いて、能動的雑音制御信号生成部90は、空間的に雑音を制御かつ抑圧するための制御信号n^’
f[k]を生成する。
【0062】
すなわち、二次経路推定部60で推定した二次経路情報c^fを利用することにより、二次経路変動時においても安定して能動的雑音制御が実現できる。
【0063】
なお、能動的雑音制御信号生成部90における制御信号の具体的な説明については
図5を用いて後述する。
【0064】
得られた制御信号n^’
f[k]は、近端側スピーカ12による再生信号yf[k]から減算され、再生信号y’
f[k](=yf[k] - n^’
f[k])が得られる。
【0065】
再生信号y’
f[k]の時系列信号y’
fが近端側スピーカ12から再生された場合、d’
f[k]は、数式6のように表される。
【0066】
【0067】
ここで、打ち消し雑音信号n^
f[k]は、数式7のように表される。
【0068】
【0069】
すなわち、制御信号n^’
f[k]に二次経路情報cfが畳み込まれると近端側マイク11の位置での雑音を抑圧するための打ち消し雑音信号n^
f[k]が得られる。そして、打ち消し雑音信号n^
f[k]が近端側スピーカ12から出力された場合、数式1は数式8のように修正される。
【0070】
【0071】
また、数式8の表現により、数式4は数式9のように修正される。
【0072】
【0073】
数式8、9のどちらも、到来雑音信号nf[k]と、制御信号n^’
f[k]に二次経路情報cfが畳み込まれて生成された打ち消し雑音信号n^
f[k]とが一致した場合に、雑音抑圧が達成される。
【0074】
そのため、雑音抑圧動作はエコーキャンセルとは異なり、信号処理上ではなく、実際にスピーカから制御信号が出力され空間的に加算されることによって実現される。そのため、空間上におけるマイク位置において効果がさらに発揮される。
【0075】
以上のように、会話支援装置1は、収音したマイク信号に対し、制御信号をスピーカから出力することによる空間的な雑音抑圧と、雑音が抑圧された信号に対しエコーキャンセラによるエコー抑圧と、を同時に実現することができる。近端側マイク11は、マイク信号mf[k](入力信号)を取得する。エコー抑圧部70は、二次経路の伝達特性c^
fを用いて疑似エコー信号d^
f[k](キャンセル信号)を生成する。能動的雑音制御信号生成部90は、マイク信号mf[k]、疑似エコー信号d^
f[k]、制御信号n^’
f[k]に基づき、エコー抑圧後信号ef[k](出力信号)を生成する。近端側スピーカ12は、エコー抑圧後信号ef[k]に基づいて音を出力する。
【0076】
また、数式9において、エコー抑圧および雑音抑圧が理想的に実現された場合、数式9は、数式10と表現される。このとき、本来収音する対象である近端側話者2の発話を表す音声信号sf[k]のみを通過させる。
【0077】
【0078】
なお、上記構成は遠端側マイク21および遠端側スピーカ22に対しても同様な構成を取ることが可能である。しかし、当業者による理解を容易にするべく簡略化するため、
図3においては省略している。
【0079】
[1-2.会話支援装置における二次経路推定部60およびエコー抑圧部70の処理]
図4は、実施の形態1における二次経路推定部60およびエコー抑圧部70の構成を示すブロック図である。
【0080】
エコー抑圧部70は、数式4のようにエコーキャンセルを行う。数式4に数式2および数式5を代入すると、エコー抑圧後信号ef[k]は、数式11のように表現される。
【0081】
【0082】
これにより、エコー抑圧を達成するためには空間の伝達特性である二次経路情報cfと、適応フィルタとして推定された二次経路情報c^
fと、が一致する必要がある。
【0083】
二次経路情報c^
fは二次経路推定部60にて推定される。二次経路推定部60は、数式12のように逐次更新式による適応フィルタとしての二次経路情報c^
fの推定を行う。
【0084】
【0085】
ここで、c^(k)
fは時刻kにおいて推定される適応フィルタである。c^(k)
fは、1時刻前の適応フィルタに適応フィルタ更新量Δc^
fに比例した値を加算することによって更新される。また、μは一回の更新あたりの更新量を制御するためのステップパラメータであり、一般に適応フィルタのタップに応じて減衰するような値である。
【0086】
また、Δc^
fを求める方法としては、一般にLMS法や学習同定法(NLMS法)、時間領域ICAといった手法が用いられる。いずれの手法においても数式13のようにエコー抑圧後信号ef[k]によりエコー消去量を反映し、到来エコー信号の元となるスピーカ信号yf[k]を参照することにより、Δc^
fは求められる。
【0087】
【0088】
ここでlは適応フィルタにおけるlタップ目を表すインデックスである。
【0089】
また、Nf[k]は更新量を正規化するためのノルム信号である。Nf[k]として、現在時刻kから一定時間過去までの参照信号パワーなどが用いられる。また、数式13では誤差信号ef[k]をそのまま乗算しているが、時間領域ICAにおいては符号関数やtanh関数により非線形変換した値を用いる。なお、適応フィルタの推定方法としてはアフィン射影法(APA法)や再帰最小二乗法(RLS法)といった、複数時刻に渡るサンプルを用いる適応フィルタ推定法を用いても良い。
【0090】
数式13により算出された更新量Δc^
fは、二次経路推定部60において数式12のように適応フィルタc^(k)
fへと加算される。このようにして算出された適応フィルタc^(k)
fがエコー抑圧部70においてスピーカ信号yfに畳み込まれることで、エコーキャンセルが実現される。
【0091】
[1-3.会話支援装置における能動的雑音抑圧信号生成部の処理]
図5は、実施の形態1における能動的雑音制御信号生成部90の構成を示すブロック図である。なお、
図5では、
図3および
図4に示した詳細ブロック図において記載した二次経路推定部60およびエコー抑圧部70を省略している。
【0092】
能動的雑音制御信号生成部90は、参照信号生成部91、適応フィルタ推定部92、制御信号生成部93を備える。
【0093】
なお、実施の形態1においては、フィードフォワード型の能動的雑音制御装置50において、filtered-x型の適応フィルタ更新を行うことを前提とする。しかし、同様な構成を持ったフィードバック型の能動的雑音制御についても実現が可能である。
【0094】
数式8で説明したように、能動的雑音制御装置50においては、内部で生成した制御信号を拡声スピーカから再生することにより、近端側マイク11位置において空間的な雑音抑圧が実現される。能動的雑音制御装置50では、上記制御信号を生成するための適応フィルタの係数wfを内部的に推定する。制御信号生成部93は、内部的に推定した適応フィルタの係数wfを雑音源取得部80で取得された雑音信号v1[k]の時系列信号v1に畳み込むことで制御信号n^’
f[k]を数式14のように生成する。
【0095】
【0096】
なお、適応フィルタの係数wfは、雑音源位置から一次経路情報hfを伝達してマイクロホンへと到来する雑音信号を二次経路情報cfの影響を踏まえながら打ち消すための係数である。適応フィルタの係数wfは、適応フィルタ推定部92において推定される。
【0097】
適応フィルタの係数wfの推定のためには、参照信号生成部91において生成された参照信号が必要となる。
【0098】
参照信号生成部91は、二次経路推定部60により推定された二次経路情報c^
fを元に、フィードフォワード型の能動的雑音制御装置50における参照信号r1[k]を、数式15のように生成する。参照信号r1[k]は、エコーキャンセル内部で適応フィルタとして推定された二次経路情報c^
fと雑音源取得部80で取得された雑音信号v1[k]の時系列信号v1に基づいて生成される。
【0099】
【0100】
フィードフォワード型の能動的雑音制御では、生成した制御信号を近端側スピーカ12から拡声する場合、近端側スピーカ12から近端側マイク11位置まで音が伝搬する際の空間特性(二次経路情報)が制御信号に畳み込まれる。そのため、参照信号を生成する理由として、能動的雑音制御で用いる適応フィルタを推定するためにはこの二次経路の影響を考慮した雑音信号を参照する必要があるということが挙げられる。
【0101】
数式14で表現される制御信号n^’
f[k]は、近端側マイク11位置においては数式7で示したように二次経路情報cfが畳み込まれた信号として観測される。したがって、近端側マイク11位置で実際に観測される雑音抑圧後の誤差信号は、数式10に数式3、数式7、数式15を代入し、到来エコーが理想的にキャンセルされ、近端側発話信号sf[k]が存在しない場合として、数式16のように表される。
【0102】
【0103】
数式16から分かるように、一次経路情報hfが適応フィルタの係数wfに二次経路情報cfを畳み込んだ特性と一致した場合に雑音の消去が達成されることとなる。この場合、適応フィルタの係数wfは二次経路情報cfの逆フィルタと一次経路情報hfを畳み込んだ特性に収束するものと考えられる。
【0104】
ここで、二次経路情報cfは制御信号を近端側スピーカ12から再生した場合に、自動的に空間上を伝達することにより畳み込まれる特性である。数式16の誤差信号を最小化するための適応フィルタの係数wfを推定するための参照信号は、数式16の第三番目の変形式第二項の畳み込みの順番を変更すると、数式17として表現できる。
【0105】
【0106】
そのため、雑音源取得部80で取得された雑音信号v1[k]の時系列信号v1をcfに畳み込むことによって変形したcf * v1を参照する。これによって適応フィルタの係数wfを推定することが可能であると考えられる。
【0107】
このように二次経路情報を畳み込んだ参照信号を用いて適応フィルタの係数を推定する能動的雑音制御の方式はfiltered-X型の能動的雑音制御と呼ばれる。この方式は、能動的雑音制御装置50においては従来から広く用いられているものである。filtered-X型の能動的雑音制御において、参照信号cf * v1の生成に用いられる二次経路情報cfは、一般には予め静的に測定しておく必要がある。しかし、静的に測定した二次経路情報を用いた場合、測定時と使用時において二次経路の伝達特性が異なると、想定した消音性能を発揮することができないという点が問題となる。
【0108】
そこで、本開示においてはこの二次経路情報として、二次経路推定部60において適応フィルタとして推定された二次経路情報c^
fを用いる。そして、数式15のように参照信号を生成することにより、動的な経路変動を能動的雑音制御装置50に反映させることができる。
【0109】
数式15で表現される参照信号r1[k]と、数式10で表現される誤差信号ef[k]とにより、適応フィルタ推定部92は、能動的雑音制御用の適応フィルタの係数wfの推定を行う。
【0110】
適応フィルタの係数wfを推定するためには、エコーキャンセルにおける適応フィルタと同じく、次の逐次更新するための数式18を用いる。
【0111】
【0112】
ここでw(k)
fは時刻kにおいて推定される適応フィルタである。w(k)
fは、1時刻前の適応フィルタに適応フィルタ更新量Δwfに比例した値を加算することによって更新される。μは一回の更新あたりの更新量を制御するためのステップパラメータであり、一般に適応フィルタのタップに応じて減衰するような値である。
【0113】
Δwfを求める方法としては、一般にLMS法や学習同定法(NLMS法)、時間領域ICAといった手法が用いられる。いずれの手法においても、Δwfは、数式19のように誤差信号ef[k]により空間的な雑音抑圧量を反映し、数式15で表現される参照信号r1[k]を参照することにより求められる。
【0114】
【0115】
ここでlは適応フィルタにおけるlタップ目を表すインデックスである。またN1[k]は更新量を正規化するためのノルム信号である。N1[k]として、現在時刻kから一定時間過去までの参照雑音信号パワーなどが用いられる。数式19では誤差信号ef[k]をそのまま乗算しているが、時間領域ICAにおいては符号関数やtanh関数により非線形変換した値を用いる。なお、エコーキャンセラにおける適応フィルタと同様に、アフィン射影法(APA法)や再帰最小二乗法(RLS法)といった、複数時刻に渡るサンプルを用いる適応フィルタ推定法を用いることも考えられる。
【0116】
以上より、能動的雑音制御信号生成部90は、学習された適応フィルタの係数wfを数式14のように雑音信号v1に畳み込むことによって制御信号n^’
f[k]を生成する。そして、制御信号n^’
f[k]を近端側スピーカ12から再生することにより、数式10のように雑音抑圧が実現される。
【0117】
[1-4.帯域制限フィルタ(LPF)による学習用信号の帯域制限]
図5において、適応フィルタ推定部92に入力される数式15で生成された参照雑音信号、および数式10で表現される誤差信号のそれぞれの後段に、帯域を制御するためのローパスフィルタ(LPF)921が挿入されている。二次経路推定部60で推定された二次経路情報c
^
fが全帯域信号を用いて学習されている場合、数式15で生成された参照信号も全帯域成分を含む信号となる。
【0118】
数式10の誤差信号についても、適応フィルタ推定部92に入力される手前までで帯域制限が行われていない場合は、全帯域信号を含むこととなる。
【0119】
一方、能動的雑音制御の対象とする周波数帯域は騒音源となる信号の種類によると考えられる。例えばエンジンノイズに起因する雑音信号を抑圧する場合は、騒音源周波数はエンジン回転数によって決まる。そのため、高々300Hz程度までの制御信号が生成できれば良い。
【0120】
ただし、参照雑音を取得するために、エンジンパルスではなく外部マイクを用いた場合においては、制御したい帯域を誤差マイクロホン位置やスピーカ位置などに応じて決めた上でLPF921の制御周波数を変えることとなる。
【0121】
このように制御したい周波数帯域が予め決まっている場合、全帯域信号を用いて能動騒音制御用適応フィルタを学習するのではなく、それらに用いられる学習用信号を帯域制限した上で学習に用いる。これにより、学習される適応フィルタの通過帯域を制限することが可能となる。
【0122】
能動的雑音制御信号生成部90は、このようにして学習された適応フィルタを雑音信号に畳み込む。これにより、実際の制御信号生成時はLPFによる群遅延を雑音信号が受けることなく制御信号を生成することができる。すなわち、適応フィルタ推定部92は、LPF921(帯域制限フィルタ)を含む。制御信号生成部93は、LPF921によって帯域が制限された信号を用いて、制御信号n
^’
f[k]を生成する。具体的には、
図5に示すように、適応フィルタ推定部92は、雑音信号v
1を二次経路情報c
^
fに畳み込むことによって得られた参照信号r
1[k]の帯域をLPF921によって制限する。制御信号生成部93は、LPF921によって帯域が制限された信号を用いて、制御信号n
^’
f[k]を生成する。
【0123】
[1-5.誤差信号に含まれる音声信号への対処]
数式13で表現されるエコーキャンセラ適応フィルタの更新式や数式19で表現される能動的雑音制御用適応フィルタの更新式において、分子に現れる数式10で表現される誤差信号は、音声信号sf[k]が存在しない場合、0に近づく。すなわち、理想的に各適応フィルタの学習が行われた場合、到来エコーや到来雑音が抑圧されることにより、誤差信号は0に近づく。これにより、数式13、数式19の更新量はsf[k]が存在しない区間では0に近づく。
【0124】
一方で、数式10に含まれる音声信号sf[k]が存在する場合、数式13、数式19の更新量は0とならず、誤差量を0に近付けずに誤った方向に適応フィルタ係数を修正するダブルトークが発生する。このダブルトークを回避するためには、sf[k]が存在しない区間を検出するためにダブルトーク検出器(DTD)を設けるか、あるいはダブルトーク状態でも学習が可能である更新則(時間領域ICAなど)を用いる必要がある。
【0125】
[1-6.エコーキャンセル装置の適応フィルタの収束状態が能動的雑音制御装置の適応フィルタに及ぼす影響]
[1-5]で述べたように、誤差信号中に学習において誤った方向に適応フィルタを修正し得る信号が含まれている場合、適応フィルタ係数の更新に影響が発生する。この点は、数式10において左側等式の右辺第二項が0ではない場合にも同様の現象が発生する。上記の場合とは、エコーキャンセル装置40の適応フィルタの収束が不十分であり到来エコーの抑圧が達成されきっていない場合、あるいは、第三項が0ではない場合、すなわち能動的雑音制御装置50において適応フィルタの収束が不十分であり到来雑音の抑圧が達成されきっていない場合である。
【0126】
能動的雑音制御装置50は、エコーキャンセル装置40における適応フィルタの係数を二次経路情報とみなして動的な経路変動に対応する。そのため、能動的雑音制御装置50の動作はエコーキャンセル装置40の適応フィルタの収束状態に依存することとなる。すなわち、エコーキャンセル装置40の適応フィルタが収束していない場合、数式15で算出される参照雑音信号が正しく算出されないだけでなく、誤差信号中のエコー抑圧残差信号により適応フィルタの更新に影響が及ぶこととなる。したがって、能動的雑音制御装置50における適応フィルタの学習は、エコーキャンセル装置40の適応フィルタの学習状態を反映させる必要があると考えられる。
【0127】
エコーキャンセル装置40の適応フィルタの学習状態を把握する方法として、シングルトーク区間においてエコーキャンセル装置の入出力のレベル比率を計算することが考えられる。ここで、シングルトーク区間とは数式1において近端音声sf[k]が存在しない区間のことを言う。
【0128】
近端音声sf[k]が存在しない区間を検出するために、近端側マイク11と近端側スピーカ12の間にダブルトークディテクタ(DTD)を設ける。
【0129】
DTDは、近端側マイク信号と近端スピーカ信号を監視し、それぞれの平均信号レベルや最大ピークレベルを元にシングルトーク区間およびダブルトーク区間を検出するための装置である。ここで、ダブルトーク区間とは近端音声sf[k]およびエコー信号df[k]が同時に存在する区間のことを言う。
【0130】
DTDは、ダブルトーク区間でなく、シングルトーク区間を検出した際に、エコーキャンセル装置40の入出力信号のレベル比を算出する。
【0131】
エコーキャンセル装置40の入力信号はエコー信号df[k]および雑音信号nf[k]が加算された信号である。また、出力信号はエコー消去後信号(df[k]-d^
f[k])および雑音信号nf[k]が加算された信号である。そのため、そのレベル比率は{(df[k]-d^
f[k])+ nf[k]}/ {df[k]+ nf[k]}となる。エコーキャンセラが収束していない状態では打ち消しエコー信号d^
f[k]が0となるため、この比率は1に近い値となる。
【0132】
一方、適応フィルタが理想的に収束している場合は分子第一項が0に近い値に近付くため、この比率は1よりも小さい値となる。
【0133】
従って、エコーキャンセル装置40の入出力比を計算することによって、エコーキャンセル装置40における適応フィルタの収束度合いを判定することができる。
【0134】
この入出力信号は瞬時値ではなく、一定時間に渡る平均信号レベルや、他適当な手段によって算出されたそれぞれの信号ノルムによる比率であっても良い。
【0135】
上記手段によって計算された信号レベル比率を元に能動的雑音制御装置50の適応フィルタ更新を制御する場合、例えば前記信号レベル比率が適当に定めたしきい値よりも下回った場合のみに能動的雑音制御装置50の適応フィルタを学習させることが考えられる。または、能動的雑音制御装置50の適応フィルタは常時学習させておくが、前記信号レベル比率がしきい値を下回った場合には学習におけるステップサイズを増加させることなどが考えられる。
【0136】
なお、適応フィルタ振幅のおおよその収束点が測定などによって事前に分かっている場合は、エコーキャンセル装置40の学習状態を把握するための他の方法としてエコーキャンセル装置40の適応フィルタの振幅ピーク最大値を監視する。そして、予め定めたしきい値を超過した場合に能動的雑音制御装置50側の適応フィルタの学習を制御することも考えられる。
【0137】
なお、能動的雑音制御装置50側の適応フィルタが収束していない場合のエコーキャンセル装置40側適応フィルタ学習についても同様の事項が発生する。
【0138】
この問題の解決方法としては、エコーキャンセル装置40の適応フィルタの更新則として主信号に雑音が重畳した状態においても学習が可能となるような更新則を用いることが考えられる。あるいは、
図6に示したように、エコーキャンセル装置40に近端音声信号を入力する前段で、雑音源取得部80によって取得した雑音信号を参照する。そして、これとマイク信号を用いて適応的に雑音を消去するための適応フィルタg
fを推定し、適応的に雑音成分を回線上で差し引く雑音除去部を設ける構成が考えられる。
【0139】
この雑音除去部は電気的に雑音成分を消去するためのブロックとなり、能動的雑音制御装置50による空間的な雑音抑圧による効果と重なる。そのため、このブロックはエコーキャンセル装置40における適応フィルタが安定化するまでの間のみ動作させ、その後は停止させるといった方法が考えられる。適応フィルタの安定化の判定としては、エコーキャンセル装置の入出力レベル比などを用いて行うことができる。
【0140】
以上のように、適応フィルタ推定部92は、二次経路推定部60と連携して動作する。具体的には、適応フィルタ推定部92は、二次経路推定部60が二次経路の伝達特性(二次経路情報c^
f)の算出を完了した後に、適応フィルタの係数wfを算出する。
【0141】
(実施の形態2)
以下、
図7を用いて、実施の形態2における会話支援装置1の処理を説明する。
【0142】
[2-1.遠端側スピーカを併用した能動的雑音制御装置]
図7は実施の形態2における会話支援装置1の構成を示すブロック図である。
【0143】
図7ではエコー抑圧部70における記号との区別を図るため、記号の下添字を到来元スピーカ位置(近端:f、遠端:r)および到達先マイク位置(近端:f、遠端:r)を順に並べることで表す。
【0144】
例えば、遠端側スピーカ22から近端側マイク11へと到来するフィードバック特性をcrf、フィードバック信号をdrf[k]と表すこととする。
【0145】
また、伝達特性に対応した能動的雑音制御に用いる適応フィルタは対応する二次経路と同じ下添字を用いることとする。
【0146】
図7では近端側マイク11に関係する構成のみを示しているが、遠端側マイク21側に着目した場合においても同様のブロック構成を取ることが可能である。
【0147】
会話支援装置1では、近端側マイク11で収録された音声が遠端側スピーカ22で再生された後に拡声音が近端側マイク11へと空間的にフィードバック信号drf[k]として伝達する問題が発生する。フィードバック信号drf[k]を消去するために、会話支援装置1は、フィードバック特性crfを推定するための適応フィルタ推定部92を備える。さらに、会話支援装置1は、適応フィルタ推定部92において推定した適応フィルタを用いて疑似フィードバック信号d^rf[k]を生成し、これをマイク入力信号から差し引くことによってフィードバック信号を消去するフィードバック消去部(不図示)を備える。
【0148】
実施の形態2においては、前記フィードバック特性を能動的雑音制御における二次経路として捉える。これにより、実施の形態1における近端側スピーカ12を用いた能動的雑音制御装置50と同様の構成によって、遠端側スピーカ22を用いた能動的雑音制御を行う。
【0149】
図7におけるマイク(入力)信号m
f[k]は、近端側入力音声s
f[k]、近端側スピーカ12からの到来エコー信号d
ff[k]、到来フィードバック信号d
rf[k]、雑音を示すv
1[k]から一次経路情報h
fを伝達し到来する雑音信号n
f[k]の和として数式20のように定式化される。
【0150】
【0151】
マイク信号から到来エコー信号を消去するために、数式20のマイク信号mf[k]から、疑似エコー信号d^ff[k]および疑似フィードバック信号d^rf[k]を差し引くことで誤差信号ef[k]を計算する(数式21)。ここで、疑似エコー信号d^ff[k]は、エコー信号が到来する伝達特性を適応フィルタとして推定した二次経路情報c^ffに近端側スピーカ信号yf[k]を畳み込むことで推定される。また、疑似フィードバック信号d^rf[k]は、フィードバック信号が到来する伝達特性を適応フィルタとして推定した二次経路情報c^rfに遠端側スピーカ信号yr[k]を畳み込むことで推定される。
【0152】
【0153】
誤差信号ef[k]はエコー伝達特性cffを推定するため、エコー伝達特性に対応した二次経路推定部60へと近端側スピーカ信号と共に入力される。また、誤差信号ef[k]はフィードバック伝達特性crfを推定するため、フィードバック伝達特性に対応した二次経路推定部60へと遠端側スピーカ信号と共に入力される。二次経路推定部60において推定された適応フィルタとしての二次経路情報c^ff,c^rfは、雑音源30より取得された雑音信号v1[k]を時系列信号として表したv1に畳み込むことにより、能動的雑音制御における適応フィルタ推定部92へと誤差信号とともに入力される。能動的雑音制御における適応フィルタ推定部92において推定された適応フィルタの係数wffおよびwrfを雑音源信号ベクトルv1を畳み込むことで、能動的雑音制御における制御信号n^’
ff[k]、n^’
rf[k]を生成する。
【0154】
制御信号n^’
ff[k]を近端スピーカ信号から減算し、またn^’
rf[k]を遠端側スピーカ信号から減算することで、最終的なスピーカ再生信号y’f[k]およびy’r[k]が生成される。スピーカ再生信号y’f[k]およびy’r[k]に含まれる制御信号n^’
ff[k]、n^’
rf[k]は、二次経路情報cffおよびcrfを伝達することにより相殺ノイズn^
ff[k]、n^
rf[k]となる。
【0155】
従って、数式20で表されるマイク信号は、能動的雑音制御によって数式22のように表される。
【0156】
【0157】
従って、誤差マイクにおける到来ノイズnf[k]は能動的雑音制御によって相殺ノイズn^
ff[k]、n^
rf[k]の和と一致する際に消去されることとなる。
【0158】
また、数式21の誤差信号は数式23のように表される。
【0159】
【0160】
数式23は理想的にエコー抑圧、フィードバック抑圧、および雑音抑圧が実現された場合、近端側のマイク信号のみを通過させることとなる。
【0161】
なお、
図7では到来エコー信号と到来フィードバック信号は同時に消去を行い、その誤差信号を適応フィルタの学習に用いる並列構成となっている。しかし、到来エコー信号のみを消去した誤差信号を用いて適応フィルタとしての二次経路情報c^
ffを学習し、前記誤差信号から更に到来フィードバック信号を消去した誤差信号を用いて適応フィルタとしての二次経路情報c^
rfを学習する直列構成となっていても良い。
【0162】
また、当構成は遠端側マイク21が存在しない前方から後方への片方向会話支援を想定した場合においても、フィードバック特性のみを二次経路情報として用いる能動的雑音制御として実現が可能である。即ち遠端側スピーカ22から近端側マイク11へのフィードバック信号のみが近端側マイク11に混入する場合においても、能動的雑音制御を行うことが可能となる。
【0163】
実施の形態2の例としては、車両の2列目ドアスピーカを遠端側スピーカ22として用いる会話支援装置において、遠端側スピーカ22を用いた能動的雑音制御を実現する場合が考えられる。
【0164】
(設置例)
[3-1.マイクおよびスピーカの設置箇所について]
本開示における近端側マイク11は音声発話に対する収音用マイクロホンと能動的雑音制御装置50における誤差マイクを兼用する。したがって設置箇所としては話者口元の近傍であることが好ましく、また話者耳元位置に近接していることがより強く要求される。
【0165】
図8にマイク設置箇所の一例を示す。
図8では座席頭上または側面上部に近端側マイク11を設置している。
図8以外の設置の例としては、マイクをヘッドレストに埋め込む構成も考えられる。実際のマイク設置箇所は能動的雑音制御装置50によって制御したい周波数帯域に従って決定する必要がある。これは高い周波数であればあるほど波長としては短くなるためであり、耳元からマイクへの距離が離れれば離れるほど制御可能な周波数が低くなる。
【0166】
また、単一のマイクを用いるのでなく、
図8に示すように複数のマイクをアレイ構成として用いるマイクアレイを用いても良い。マイクアレイを用いる理由としては、指向性合成を行うことによって話者方向音声のみを高SN比で収音し、かつ複数の誤差マイクを用いた能動的雑音制御を行うことに寄って、耳元での消音性能を向上させるためである。この場合、指向性合成、または能動的雑音制御装置50に先駆けてマイクアレイの各マイクからエコー信号を除去することが必要となる。そのため、各マイクに対応した複数のエコーキャンセル装置40およびエコー抑圧部70を設けることが必要となる。また、能動的雑音制御装置に関しても、各マイクに対応した能動的雑音制御装置50および能動的雑音制御信号生成部90を設ける必要がある。
【0167】
ここで、能動的雑音制御装置50は制御したい領域内に存在する各マイクに対してのみ設ければ良い。これらの能動的雑音制御装置50によって生成された雑音制御御信号は、近端側スピーカ信号に加算される。
【0168】
スピーカの設置位置としては、エコーキャンセルの観点からは近端側の音響結合量が増えるため近端側マイク11からできるだけ遠い位置となることが好ましい。しかし、能動的雑音制御の観点からは雑音制御信号を低い空間遅延で放射するため、近端側誤差マイクに対してできるだけ近い位置となることが好ましい。これは、雑音信号を検知した後で、その雑音が制御領域に空間的に到達するまでに雑音制御信号を生成し、スピーカから放射する必要があるためである。従って、スピーカの設置位置としてはエコーキャンセル動作に支障が生じない程度に近端側マイク11に近接した位置となることが好ましい。
【0169】
(実施の形態のまとめ1)
本開示の一態様に係る会話支援装置1は、
図2および
図5に示すように、近端側スピーカ12と、近端側マイク11と、雑音源取得部80と、二次経路推定部60(第一の算出部の一例)と、エコー抑圧部70と、適応フィルタ推定部92(第二の算出部の一例)と、制御信号生成部93(能動的雑音抑圧制御部の一例)とを備える。
【0170】
雑音源取得部80は、雑音源30の雑音を示す雑音信号v1を取得する。二次経路推定部60は、近端側スピーカ12と近端側マイク11との間の二次経路の伝達特性(二次経路情報c^
f)を算出する。エコー抑圧部70は、二次経路情報c^
fを用いて、近端側スピーカ12から近端側マイク11へのエコーを抑圧する(数式5および数式9参照)。適応フィルタ推定部92は、二次経路情報c^
fおよび雑音信号v1に基づいて、適応フィルタの係数wfを算出する(数式15,数式18および数式19参照)。制御信号生成部93は、適応フィルタの係数wfおよび雑音信号v1を用いて、雑音の抑圧を制御する制御信号n^’
f[k]を生成する(数式14参照)。
【0171】
(実施の形態のまとめ2)
本開示の別の態様に係る会話支援装置1Aは、
図9に示すように、会話支援装置1のエコーキャンセル装置40に代えて、フィードバックキャンセル装置40Aを備える。フィードバックキャンセル装置40Aは、フィードバック抑圧部70Aを含む。
【0172】
本態様においては、二次経路推定部60は、例えば、遠端側スピーカ22と近端側マイク11との間の二次経路の伝達特性を算出する。フィードバック抑圧部70Aは、上記二次経路の伝達特性を用いて、遠端側スピーカ22から近端側マイク11へのフィードバックを抑圧する。
【0173】
これにより、本態様に係る会話支援装置1Aは、二次経路の伝達特性を用いて、フィードバックおよび近端側マイク11の位置における雑音を抑圧することができる。なお、会話支援装置1Aが抑圧できるフィードバックは、遠端側スピーカ22から近端側マイク11へのフィードバックに限定されない。会話支援装置1Aは、近端側スピーカ12と遠端側マイク21との間の二次経路を算出することによって、近端側スピーカ12から遠端側マイク21へのフィードバックを抑圧することもできる。
【0174】
(実施の形態のまとめ3)
本開示のさらに別の態様に係る会話支援装置1Bは、
図10に示すように、会話支援装置1のエコーキャンセル装置40に代えて、キャンセル装置40Bを備える。キャンセル装置40Bは、抑圧部70Bを含む。
【0175】
二次経路推定部60は、近端側スピーカ12と近端側マイク11との間の二次経路(第一の二次経路)の伝達特性c^
ffと、遠端側スピーカ22と近端側マイク11との間の二次経路(第二の二次経路)の伝達特性c^
rfとを算出する。抑圧部70Bは、第一の二次経路の伝達特性c^
ffを用いて近端側マイク11に到来するエコーを抑圧し、第二の二次経路の伝達特性c^
rfを用いて近端側マイク11に到来するフィードバックを抑圧する。適応フィルタ推定部92は、第一の二次経路の伝達特性c^
ffおよび雑音信号v1に基づいて、第一の適応フィルタの係数wffを算出し、第二の二次経路の伝達特性c^
rfおよび雑音信号v1に基づいて、第二の適応フィルタの係数wrfを算出する。制御信号生成部93は、第一の適応フィルタの係数wffおよび雑音信号v1を用いて、雑音の抑圧を制御する第一の制御信号n^’
ff[k]を生成し、第二の適応フィルタの係数wrfおよび雑音信号v1を用いて、雑音の抑圧を制御する第二の制御信号n^’
rf[k]を生成する。
【0176】
これにより、本態様に係る会話支援装置1Bは、第一および第二の制御信号n^’
ff[k],n^’
rf[k]を用いて近端側マイク11の位置における雑音をさらに抑圧することができる。上記では近端側マイク11を用いる例を示したが、会話支援装置1Bは、遠端側マイク21を用いることで、遠端側マイク21の位置における雑音を抑圧することもできる。
【0177】
なお、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
【産業上の利用可能性】
【0178】
本開示は、聞き取りたい音声を妨害する雑音が発生される環境において、話者の位置において雑音を抑圧する会話支援装置に適用可能である。具体的には、自動車、飛行機内、電車、船などの乗物に、本開示は適用可能である。
【符号の説明】
【0179】
1,1A,1B 会話支援装置
2 近端側話者
3 遠端側話者
11 近端側マイク
12 近端側スピーカ
21 遠端側マイク
22 遠端側スピーカ
30 雑音源
40 エコーキャンセル装置
50 能動的雑音制御装置
60 二次経路推定部
70 エコー抑圧部
80 雑音源取得部
90 能動的雑音制御信号生成部
91 参照信号生成部
92 適応フィルタ推定部
93 制御信号生成部