IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

特表2024-538563音響エコー消去のための堅牢な前景/背景フィルタリング制御
<>
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図1
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図2
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図3
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図4
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図5
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図6
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図7
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図8
  • 特表-音響エコー消去のための堅牢な前景/背景フィルタリング制御 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-23
(54)【発明の名称】音響エコー消去のための堅牢な前景/背景フィルタリング制御
(51)【国際特許分類】
   H04B 3/23 20060101AFI20241016BHJP
【FI】
H04B3/23
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024518594
(86)(22)【出願日】2022-09-27
(85)【翻訳文提出日】2024-03-25
(86)【国際出願番号】 US2022044774
(87)【国際公開番号】W WO2023055695
(87)【国際公開日】2023-04-06
(31)【優先権主張番号】21200054.1
(32)【優先日】2021-09-30
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】63/250,565
(32)【優先日】2021-09-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Blu-ray
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【弁理士】
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】ワーン,ニーン
(72)【発明者】
【氏名】リー,グオドーン
【テーマコード(参考)】
5K046
【Fターム(参考)】
5K046HH02
5K046HH31
5K046HH79
(57)【要約】
適応フィルタリング・コンポーネントを制御するためのシステムおよび方法が記載される。遠端信号は、前景フィルタおよび背景フィルタのそれぞれによってフィルタ処理されてもよく、ここで、両方のフィルタは、エコー推定を出力する適応エコー消去フィルタである。制御論理は、偏差信号に基づいて、背景フィルタによる適応を停止させてもよい。偏差信号を決定するために、両方のフィルタによって生成されたエコー推定についての相互相関係数が、遠端信号の各周波数ビンについて決定されうる。決定された相互相関係数は、複数の周波数ビンにわたって合計されうる。次いで、ヒステリシス関数が、フィルタリングされた結果を生成するために使用されるエコー推定に関連するフィルタに関連する和に適用されうる。偏差信号は、ヒステリシス関数が高い値を出力することに応答してアクティブにされてもよく、それを、制御論理が背景フィルタによる適応をオフにするために使用する。
【特許請求の範囲】
【請求項1】
音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御する方法であって、当該方法は:
制御論理と通信する前景フィルタによって、受領された周波数領域の遠端信号をフィルタリングする段階であって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、段階と;
前記制御論理と通信する背景フィルタによって、前記受領された周波数領域の遠端信号をフィルタリングする段階であって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、段階と;
前記制御論理によって、近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
前記制御論理によって、偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを含み、前記偏差信号は前記制御論理によって決定され、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
方法。
【請求項2】
受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、請求項1に記載の方法。
【請求項3】
前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
請求項2に記載の方法。
【請求項4】
前記第1の平滑化因子が前記第2の平滑化値よりも低い値である、請求項3に記載の方法。
【請求項5】
前記偏差信号はさらに、決定された相互相関係数をフィルタリングすることに基づいて決定され、相互相関係数は、発話の閾値レベルよりも大きいビンについてのみ決定され、発話の前記閾値レベルよりも小さいビンは、所定の値に設定された相互相関係数を有する、請求項1ないし4のうちいずれか一項に記載の方法。
【請求項6】
発話の前記閾値レベルは、ビンについての前記近端マイクロフォン信号の大きさとノイズ・フロア値との比較が、所定の信号対雑音比閾値よりも大きいことに基づく、請求項5に記載の方法。
【請求項7】
発話の前記閾値レベルは、前記近端マイクロフォン信号の大きさが所定の最小レベル閾値よりも大きいことに基づく、請求項5に記載の方法。
【請求項8】
前記複数の周波数ビンにわたって前記決定された相互相関係数を加算することは、300Hz~3400Hzの範囲内の周波数ビンについての決定された相互相関係数を加算することを含む、請求項1ないし4のうちいずれか一項に記載の方法。
【請求項9】
非一時的なコンピュータ可読媒体から取り出されたときに一つまたは複数のプロセッサによって実行されるコンピュータ可読プログラム・コードを含むコンピュータ・プログラム・プロダクトであって、前記プログラム・コードは:
前景フィルタによって、受領された周波数領域の遠端信号をフィルタリングする段階であって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、段階と;
背景フィルタによって、前記受領された周波数領域の遠端信号をフィルタリングする段階であって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、段階と;
近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを実行するための命令を含み、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
コンピュータ・プログラム・プロダクト。
【請求項10】
受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、請求項9に記載のコンピュータ・プログラム・プロダクト。
【請求項11】
前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
請求項10に記載のコンピュータ・プログラム・プロダクト。
【請求項12】
前記第1の平滑化因子が前記第2の平滑化値よりも低い値である、請求項11に記載のコンピュータ・プログラム・プロダクト。
【請求項13】
前記偏差信号はさらに、決定された相互相関係数をフィルタリングすることに基づいて決定され、相互相関係数は、発話の閾値レベルよりも大きいビンについてのみ決定され、発話の前記閾値レベルよりも小さいビンは、所定の値に設定された相互相関係数を有する、請求項9ないし12のうちいずれか一項に記載のコンピュータ・プログラム・プロダクト。
【請求項14】
発話の前記閾値レベルは、ビンについての前記近端マイクロフォン信号の大きさとノイズ・フロア値との比較が、所定の信号対雑音比閾値よりも大きいことに基づく、請求項13に記載のコンピュータ・プログラム・プロダクト。
【請求項15】
発話の前記閾値レベルは、前記近端マイクロフォン信号の大きさが所定の最小レベル閾値よりも大きいことに基づく、請求項14に記載のコンピュータ・プログラム・プロダクト。
【請求項16】
前記複数の周波数ビンにわたって前記決定された相互相関係数を加算することは、300Hz~3400Hzの範囲内の周波数ビンについての決定された相互相関係数を加算することを含む、請求項9ないし12のうちいずれか一項に記載のコンピュータ・プログラム・プロダクト。
【請求項17】
音響エコー消去システムであって:
受領された周波数領域の遠端信号をフィルタリングする前景フィルタであって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、前景フィルタと;
前記受領された周波数領域の遠端信号をフィルタリングする背景フィルタであって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、背景フィルタと;
前記前景フィルタおよび前記背景フィルタのそれぞれと通信する制御論理とを有しており、前記制御論理は:
近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを実行し、前記偏差信号は前記制御論理によって決定され、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
システム。
【請求項18】
受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、請求項17に記載のシステム。
【請求項19】
前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
請求項18に記載のシステム。
【請求項20】
前記第1の平滑化因子が前記第2の平滑化値よりも低い値である、請求項19に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、2021年9月30日に出願された米国仮出願第63/250,565号および2021年9月30日に出願された欧州特許出願第21200054.1号の優先権を主張する。これらは、参照により本明細書に組み込まれる。
【0002】
技術分野
本明細書の実施形態は、概括的には、オーディオ信号処理に関し、より詳細には、従来の解決策と比較してより堅牢な仕方で種々のフィルタ偏差〔ディビエーション(deviation)〕に応答するように音響エコー消去〔キャンセレーション(cancellation)〕のためのフィルタリングを制御することに関する。
【発明の概要】
【課題を解決するための手段】
【0003】
音響エコー消去システムの前景〔フォアグラウンド〕および背景〔バックグラウンド〕適応フィルタリング・コンポーネントを制御するためのシステムおよび方法が記載される。音響エコー消去システムの前景・フィルタは、制御論理と通信してもよく、受領された周波数領域の遠端信号をフィルタリングして、前景・エコー推定を与える。前景・フィルタは、前景係数に基づいて動作する適応エコー消去フィルタでありうる。音響エコー消去システムは、受領された周波数領域の遠端信号をフィルタリングする背景フィルタを含むこともできる。背景フィルタは、背景係数に基づいて動作し、背景エコー推定を出力する適応エコー消去フィルタであってもよい。
【0004】
前景フィルタと背景フィルタの両方と通信する制御論理は、近端マイクロフォン信号と、前景エコー推定および背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定しうる。フィルタリングされた結果は、その後、音響エコー消去システムのための近端音声信号を生成するために使用されうる。制御論理は、偏差信号(deviation signal)に基づいて、背景フィルタによる適応を停止させてもよい。偏差信号は、受領された周波数領域の遠端信号の各周波数ビンについて前景エコー推定と背景エコー推定の両方のための相互相関係数を決定することによって、制御論理によって決定されうる。各相互相関係数は、受領されたマイクロフォン入力信号と、各周波数ビンについてのフィルタによるそれぞれのエコー推定との比較に基づきうる。決定された相互相関係数は、前景エコー推定と背景エコー推定の両方のために前記周波数ビンのうちの複数にわたって加えられてもよく、前景エコー推定のための相互相関係数の和と背景エコー推定のための相互相関係数の和のうちの1つが、どのフィルタがエコー推定のうちの前記選択された1つに関連するかに基づいて選択されうる。最後に、ヒステリシス関数が、選択された、相互相関係数の和に適用されてもよい。選択された和が第1の閾値よりも大きいとき、ヒステリシス関数は高い値を出力してもよく、選択された和が第2の閾値よりも小さいとき、ヒステリシス関数は低い値を出力してもよい。ヒステリシス関数が高い値を出力することに応答して、制御論理によってアクティブ化される偏差信号は、制御論理が、背景フィルタの適応をオフにするために使用する。
【図面の簡単な説明】
【0005】
本開示は、添付の図面の図において、限定ではなく例として示される。図面において、同様の参照符号は同様の要素を示す。
【0006】
図1】ある実施形態による、音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御するための方法のフロー図を示す。
【0007】
図2】ある実施形態による、音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御するためのシステムの簡略化されたブロック図を示す。
【0008】
図3】ある実施形態による、偏差信号を利用して背景フィルタの適応を停止する音響エコー消去システムの簡略化されたブロック図を示す。
【0009】
図4】ある実施形態に基づいて、ノイズ推定値が、推定信号がマイクロフォン入力を追跡する能力をどのように改善しうるかを示すプロットを示す。
【0010】
図5】さまざまな実施形態による、偏差信号の相関係数を決定するためのシステムの簡略化されたブロック図を示す。
【0011】
図6】ある実施形態による、偏差信号を決定する方法のフロー図を示す。
【0012】
図7】さまざまな実施形態による、偏差信号についての相関係数を決定するためのシステムの簡略化されたブロック図を示す。
【0013】
図8】ある実施形態による、偏差信号に適用されるヒステリシス関数を示す。
【0014】
図9】ある実施形態による、音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御するための例示的なシステムのブロック図である。
【発明を実施するための形態】
【0015】
前景/背景フィルタリング方式は、従来、オーディオ会議システムにおける音響エコー消去のために使用されている。前景/背景フィルタリング方式の1つの利点は、デッドロック問題に対処する能力である。エコー経路変更およびダブルトークについての2つの非常に類似したフィルタ偏差を非常に異なる仕方で扱うのである。エコー経路変更については、フィルタはできるだけ迅速に適応することが望ましい。対照的に、ダブルトークについては、適応は最小限であるほうがよい。よって、前景フィルタと背景フィルタとの間で適応フィルタ係数をいつ転送すべきかを決定する制御論理は、音響エコーキャンセラー(acoustic echo canceller、AEC)の全体的なパフォーマンスにとって重要でありうる。さらに、制御論理の精度、よってAECパフォーマンスは、マイクロフォン環境におけるノイズ・レベルによって悪影響を及ぼされることがありうる。よって、制御論理が異なる動作環境下で適切に機能するためには、堅牢なアルゴリズムが望ましい。
【0016】
前景/背景適応フィルタリング用途において広く使用されうる前景/背景フィルタリング方式のための制御論理のための新規で堅牢なシステムおよび方法が、本明細書に記載される。図1は、ある実施形態による、音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御するための方法100のためのフロー図を示す。図2は、図1に記載された方法100を使用する、ある実施形態による、音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御するためのシステム200の簡略化されたブロック図を示す。システム200は、音響エコー消去のために使用される、より大きなシステムの一部であってもよい。例示的なシステム200は、前景適応フィルタ220と、背景適応フィルタ240と、前景フィルタおよび背景フィルタのそれぞれと通信する制御論理270とを含む。信号Xi[k] 210は、近端デバイスによって再生されるべき、遠端信号x[t]の時間領域サンプルから導出された周波数領域の遠端信号を指す。同様に、信号Yi[k] 260は、近端マイクロフォン捕捉信号y[t]の時間領域サンプルから導出された周波数領域の近端マイクロフォン捕捉信号である。マイクロフォン捕捉信号y[t]は、近端発話が存在しないときには、遠端信号x[t]から、次式を使って決定されてもよい:
y[t]=h[t]*x[t]+n(t)
ここで、h[t]は、スピーカー‐部屋‐マイクロフォンのインパルス応答である。n[t]は、加法性ノイズ(周囲音響ノイズまたは回路によって導入される電子ノイズでありうる)である。x[t]およびy[t]を周波数領域に変換するために、それらは、フィルタバンク(図示せず)を通過してもよく、または短時間フーリエ変換(「STFT」)を使用して処理されてもよい。よって、表現Xi[k]、Yi[k]、Ni[i]は、本明細書では、フレームkについてのx[t]、y[t]、n[t]のi番目のビン・データを表すために使用される。
【0017】
方法100は、ステップ110で開始してもよく、ここで、音響エコー消去システム200の前景フィルタ220が、受領された周波数領域の遠端信号Xi[k]をフィルタリングして、前景エコー推定
【数1】
〔便宜上、^Xi f[k]と書くことがある;以下同様〕230を与えてもよい。前景フィルタ220は、推定されたエコー推定^Xi f[k]と捕捉されたマイクロフォン信号Yi[k] 260との間の差に基づいて適応される前景係数に基づいて動作する適応エコー消去フィルタでありうる。ステップ120において、背景フィルタ240が、受領された周波数領域の遠端信号Xi[k]をフィルタリングして、背景エコー推定^Xi b[k] 280を与える。背景フィルタ240は、前景係数と同様に(すなわち、推定されたエコー推定^Xi b[k] 280と捕捉されたマイクロフォン信号Yi[k] 260との間の差に基づいて)適応される背景係数に基づいて動作する適応エコー消去フィルタであってもよい。
【0018】
制御論理270は、前景フィルタ220および背景フィルタ240の両方と通信し、受領された周波数領域の遠端信号Xi[k] 210と、前景エコー推定^Xi f[k] 230および背景エコー推定^Xi b[k] 280のうちの選択された1つとに基づいて、ステップ130において、フィルタリングされた結果Ei[k] 290を決定してもよい。音響エコー消去システム200に見られるように、各ビンiについて、Ei f[k] 238およびEi b[k] 288は、それぞれ前景フィルタおよび背景フィルタの残差(ビンごとの誤差)である。残差Ei f[k] 238を得るために、決定された前景エコー推定^Xi f[k] 230が周波数領域の近端マイクロフォン捕捉信号Yi[k] 260から減算される。次いで、残差Ei f[k] 238は、制御論理270に渡されうる。同様に、残差Ei b[k] 288を得るために、決定された前景エコー推定^Xi b[k] 280が周波数領域の近端マイクロフォン捕捉信号Yi[k] 260から減算される。
【0019】
制御論理270は、残差Ei f[k] 238および残差Ei b[k] 288のうちの1つをフィルタリングされた結果Ei[k] 290として選択しうる。フィルタリングされた結果Ei[k]290は、(たとえば、リモート位置での再生のためにネットワークを通じて伝送される)近端音声信号を生成するために後に使用され、および/または時間領域信号に変換されうる。近端発話が存在するときは、フィルタリングされた結果Ei[k] 290は、エコー残差と近端発話の両方を含みうる。前記選択は、エコー消去プロセスの開始時に、前景残差Ei f[k] 238を使用することによって初期化できる。初期化の後、制御論理270は、2つのフィルタからの残差の値が近いシナリオにおいては、前のフレームにおいて使用された残差を選択することに進んでもよい。(たとえば、所定の閾値を超える)有意な差がある場合には、以下でより詳細に説明するように、異なる論理が使用されうる。
【0020】
典型的には、最小平均二乗(「LMS」)アルゴリズムの変形が、適応フィルタ更新方式として実装されうる(たとえば、NLMS、NAG-LMS、PNLMS)。高レベルでは、制御論理270は、以下のようにして、前景適応フィルタ220および背景適応フィルタ240の適応を制御してもよい。
・前景適応フィルタ220 LMS適応アルゴリズムの更新ステップ・サイズは、比較的大きくてもよく、各フレームについて連続的に更新してもよい。
・背景適応フィルタ240 LMS適応アルゴリズムの更新ステップ・サイズは、比較的小さく、たとえば、前景フィルタ220 LMS適応アルゴリズムよりも1桁または2桁小さくてもよい。
制御論理270が、すべての周波数ビンにわたる前景フィルタ220の残差(誤差)信号Ei f[k] 238の総合が、閾値数の連続するフレーム(これはたとえば、2つ以上のフレームなど、所定の数でありうる)について背景フィルタ240の残差信号Ei b[k] 288の同様の総合よりも著しく大きい(たとえば、6dBなどの所定の閾値よりも大きい)ことを見出す場合、背景フィルタ240の係数が前景フィルタ220の係数にコピーされてもよい(NAG-LMSが使用される場合、モメンタム(momentum)もコピーされる)。これは、制御論理270が、当該状況をy[t]内の近端発話によって引き起こされているものとして識別しているからである(たとえば、遠端信号が再生されているのと同時に近端で話者が話している、遠隔会議におけるダブルトーク)。
【0021】
しかしながら、制御論理270が、すべての周波数ビンにわたる背景フィルタ240の残差信号Ei b[k] 288が所定の連続するいくつかのフレーム(3~5フレームが望ましいことがあるが、任意の複数が選択されうる)についてすべての周波数ビンにわたる前景フィルタ220の残差(誤差)信号Ei f[k] 238の総合よりも著しく大きい場合は、背景フィルタ240の係数は、前景フィルタ係数によって置き換えられてもよい。これは、制御論理270が、前景フィルタおよび背景フィルタが収束し始めるとき、またはエコー経路が変化するとき(たとえば、ユーザーが近端マイクロフォンの一部を覆うなど、近端オーディオ・システムの話者と近端マイクロフォンとの間に障害物があるとき)を識別するからである。
【0022】
図1の方法100に戻ると、AECのパフォーマンスをさらに改善するために、ステップ140において、偏差信号I[k]が制御論理270によってシグナリングされているときはいつでも、背景フィルタ240はフリーズされうる(すなわち、適応が停止されうる)。偏差信号I[k]は、適応されたフィルタ(前景または背景のいずれか)と実際のスピーカー‐部屋‐マイク応答h[t]との間に著しい発散があるときを反映するように導出されうる。例示的実施形態によれば、偏差信号は、捕捉されたマイクロフォン信号Yi[k]と適応フィルタの決定されたエコー推定^Xi[k]との間で決定された相互相関係数に基づきうる。相互相関係数に関する追加の情報は、参照により本明細書に組み込まれる非特許文献1に見出されうる。
【非特許文献1】Ghose, K. and Reddy, V.U.、2000、A Double-Talk Detector for Acoustic Echo Cancellation Applications、Signal Processing, 80(8),pp.1459-1467
【0023】
偏差信号を決定するための1つの可能な式は、以下のようになりうる。
【数2】
ここで、ρi[k]は、フレームkのi番目のビンの相互相関係数である。ビンi0からi1まで、これらの相互相関係数は、偏差信号を得るために累積されうる。いくつかの実施形態では、これらのビンは、音声帯域幅の大部分、たとえば300Hz~3400Hzをカバーし、Hは、二値ヒステリシス関数(図8の説明を参照して以下でさらに説明される)でありうる。図3は、例示的なブロック図 300において上記の式を示す。動作320は、(上述のように)現在フレームについての選択されたエコー推定に関連付けられたフィルタのフレームkのすべてのビンについて、相互相関係数ρi[k] 310のそれぞれを合計する。ヒステリシス関数Hは、相互相関係数ρi[k] 310の選択された総合に適用されて、偏差信号I[k] 340を出力する。図3に示されるように、偏差信号I[k] 340は、制御論理が背景フィルタ360の適応を停止し、それにより残差信号Ei b[k] 350を生成するために使用される背景係数の値を、偏差信号I[k] 340が低になるまでフリーズするための制御信号である。
【0024】
適応フィルタが収束するとき、およびマイクロフォン入力y[t]上に提示されるローカル発話もエコー経路の変化もないときは、推定信号は入力と極めて密接に相関しているはずである。幾何学的には、それは、信号y[t]と^x[t]の間の角度が小さいことを意味する。一方、何らかのローカル発話が提示される(たとえば、ダブルトーク)か、またはエコー経路の変化があるときはいつでも、信号y[t]と^x[t]の間の相互相関は、それらの間の角度の増加を反映して、低下する。
【0025】
よって、異なるノイズ環境の下でρi[k]の堅牢性を高めるために、各周波数ビンについてのノイズ・フロア値が決定されうる。図4は、ノイズ・レベルが、フィルタのエコー推定の信頼性(credibility)を大きく低下させ、フィルタ・パフォーマンスを損なうことがあることを示している。図4は、ある実施形態に基づいて、ノイズ推定値が、推定信号がマイクロフォン入力を追跡する能力をどのように改善しうるかを示すプロット400である。偏差角推定(θ1とθ2との間の変動)がどれほどノイズが多いものかは、SNRレベル(Yi[k] 420の長さをノイズ・パワーFi[k] 435の半径440で割ったもの))によってかなり定義されることができる。プロット400では、Hi 0 450は、ビンiでのスピーカー‐部屋‐マイクロフォン応答を表す。ノイズ・パワーFi[k] 435が大きいほど、捕捉されたマイクロフォン信号Yi[k] 420とエコー除去後の残差信号^Ei[k] 410との間の角度θ2が大きくなる(よって、エコー消去の効果がより小さくなる)。ノイズ・フロア推定値を使用することにより、角度の属性を改善することができる。角度は、入力信号Yi[k] 420および推定されたエコー信号^Ei[k] 410の間の偏差がどれくらい大きいかを示す。たとえば、相関係数の和を生成するとき、ノイズ・パワーFi[k] 435が(Yi[k] 420の大きさに対して)十分に小さいビンのみを使用することで、入力信号Yi[k] 420と推定されたエコー信号^Ei[k] 410との間の偏差を小さくすることができる。
【0026】
ノイズ・フロア推定は図5に示されている。図5は、さまざまな実施形態による、偏差信号のために相関係数ρi[k] 585を決定することの簡略化されたブロック図 550を示す。その堅牢性を高めるために、各ビンについてYi[k] 555は、ビンiのノイズ・フロアを捕捉するために、ノイズ推定器560によって処理されうる。Yi[k]は、時間領域データのSTFTとして見ることができ、窓のタイプおよびストライド・サイズに依存し、極端に低い絶対値のデータを示すことがあることに注意されたい。このため、ノイズ・フロアの伝統的な最小フォロワ推定(minimum follower estimation)は好適ではなくなる。
【0027】
よって、ブロック図 550に示されるように、次の関数が、ノイズ・フロアFi[k]を決定するために使用されうる。
【数3】
ここで、αは、βより小さい平滑化因子である。ここでの発想は、マイクロフォン入力555がノイズ・フロアよりも大きいときは(たとえば、ケース565)、ノイズ・フロアの増加を抑制するために、より大きい時定数が平滑化のために使用されるということである。対照的に、マイクロフォン入力555がノイズ・フロアよりも小さいときは(たとえば、ケース570)、より小さい時定数が使用されうる。αおよびβの値は、周波数領域信号を生成するために使用されるSTFTのストライド・サイズおよび窓に基づいて選ばれる所定の定数でありうる。これは、通常の発話については、ノイズ・フロアが発話レベルに追従せず、非発話フレームについては、フロアが、ノイズを全く表していないYi[k] 555の非常に低い値にすぐに行かないことを確実にするためでありうる。ノイズ・フロアは、相関係数ρi[k] 585を決定するために関数580に送信されてもよい。そこで、ノイズ・フロアは、AECの制御論理の堅牢性を改善するために使用されうる。たとえば、図4に示されるように、ノイズ・フロアが低いビンのみを選択することによって、信号y[t]と^x[t]の間の、より小さな角度変動が、I[k]のより良い品質をもたらす。
【0028】
図6は、ある実施形態による、背景フィルタ240の適応を停止するために使用されうる偏差信号を決定する方法600のフロー図を示す。任意的なステップ605において、各周波数ビンについてのノイズ・フロア値が、上述のように決定されうる。受領された周波数領域の遠端信号の各周波数ビンについての前景エコー推定と背景エコー推定の両方についての相互相関係数が、ステップ610において決定されうる。各相互相関係数は、受領されたマイクロフォン入力信号と、各周波数ビンについてのフィルタによるそれぞれのエコー推定値との比較に基づきうる。図7は、各フィルタ710についての相互相関係数の生成を説明する例示的な簡略化されたブロック図 700を示す。遠端信号Xi[k] 705は、上述したように、フィルタ710によって処理されて、エコー推定値^Xi[k] 720を出力しうる。相互相関推定器725は、エコー推定値^Xi[k] 720をマイクロフォン入力Yi[k]と比較して、相互相関ρi[k]を決定しうる。ある例示的な実施形態では、i番目のビンについての相互相関は、以下の公式を使用して決定されうる。
【数4】
【0029】
任意的なステップ615において、相互相関係数は、発話の閾値レベルを満たすビンについてのみ、決定された値を使用するようにフィルタリングされうる。ある例示的な実施形態では、2つの別個の試験が、有意な発話のあるビンのρi[k]のみが計算されることを確実にする。第1の試験はSNR試験であり、すなわち、発話のレベルがノイズ・フロアよりも高いあるレベルを超えるべきである。第2の試験は、絶対レベル試験であり、(数値誤差を低減するために)入力のレベルが単独で十分に大きくあるべきである。数学的には、これは、以下のように表されうる。
【数5】
ここで、SNR0およびL0は、事前定義された閾値である。
【0030】
決定された相互相関係数は、ステップ620において、前景エコー推定と背景エコー推定の両方のために前記周波数ビンのうちの複数にわたって加算されうる。相互相関係数は、各フレームについて、i0からi1まで各ビンについて、前景エコー推定と背景エコー推定の両方について、計算される。ヒステリシス関数への入力、すなわち、相互相関係数の累積は、上述のように、E[k]を出力するためにどのフィルタ出力が選択されるかに基づいて、前景累積と背景累積との間で選択される。制御論理は、(方法100のステップ130に関して説明されたように)現在フレームについて前景フィルタと背景フィルタとの間のどちらのエコー推定を使用するべきかを決定してもよい。この信号は、選択されたエコー推定値に関連するフィルタに関連する相関係数の和を選択するために使用されうる。
【0031】
最後に、ステップ640において、ヒステリシス関数が、選択された、相互相関係数の和に適用されうる。図8は、相関係数の和
【数6】
818に適用される例示的な二値ヒステリシス関数のプロットを示す。選択された和818が第1の閾値th0 820よりも小さいとき、ヒステリシス関数I[k]は(たとえば、時点845において)高い値を出力しうる。選択された和818が第2の閾値th1 830よりも大きいとき、ヒステリシス関数I[k] 840は、(たとえば、時点855において)低い値を出力しうる。図8に示されるように、第2の閾値th1 830は、いくつかの実施形態において、過度のスイッチングを低減するのを助けるために、第1の閾値th0 820よりも高く設定されてもよい。ヒステリシス関数が高い値を出力することに応答して制御論理によってアクティブ化される偏差信号は、制御論理が、背景フィルタによる適応をオフにするために使用する。
【0032】
偏差信号が高である(I[k]が1)であるときはいつでも、背景フィルタは更新を停止する。エコー経路変更シナリオについては、これは、前景フィルタが、新しいスピーカー‐部屋‐マイク応答への更新を継続することを許容し、背景フィルタの誤差は前景よりも大きくなり、これは、制御論理が新しく適応された前景フィルタを背景にコピーすることを許容する。ダブルトークの場合については、前景フィルタは、ローカル発話が提示されたフレームの間、更新し続けるので、実際のスピーカー‐部屋‐マイク応答から発散し、前景誤差は、背景フィルタよりも大きくなり、これは、制御論理が、前景フィルタをフリーズされた背景フィルタと置き換えることを許容する。
【0033】
堅牢な偏差信号は、制御論理が、エコー経路が変化するときはいつでも前景フィルタを迅速に更新する能力を失うことなく、背景フィルタをフリーズすることを大いに助ける。この向上により、AECは、異なる環境においてより良好で、より一貫した性能を達成することができる。
【0034】
上述の方法およびモジュールは、コンピューティング・システム上で実行されるハードウェアまたはソフトウェアを使用して実装されてもよい。図9は、本発明のさまざまな実施形態による、マルチフォーマット音声通信システムにおける、パケット損失を隠蔽するための例示的なコンピューティング・システムのブロック図である。図9を参照すると、上述した諸方法を含む、本明細書に開示される主題を実装するための例示的なシステムは、処理ユニット902、メモリ904、ストレージ906、データ入力モジュール908、ディスプレイアダプター910、通信インターフェース912、および要素904~912を処理ユニット902に結合するバス914を含むハードウェアデバイス900を含む。
【0035】
バス914は、任意のタイプのバス・アーキテクチャーを備えうる。例は、メモリバス、周辺バス、ローカルバスなどを含む。処理ユニット902は、命令実行マシン、装置、またはデバイスであり、マイクロプロセッサ、デジタル信号プロセッサ、グラフィックス処理ユニット、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などを備えてもよい。処理ユニット902は、メモリ904および/またはストレージ906に記憶された、および/またはデータ入力モジュール908を介して受領されたプログラム命令を実行するように構成されてもよい。
【0036】
メモリ904は、読み出し専用メモリ(ROM)916およびランダムアクセスメモリ(RAM)918を含みうる。メモリ904は、デバイス900の動作中にプログラム命令およびデータを記憶するように構成されうる。さまざまな実施形態において、メモリ904は、たとえばデュアルデータレートシンクロナスDRAM(DDR SDRAM)、誤り訂正符号シンクロナスDRAM(ECC SDRAM)、またはラムバスDRAM(RDRAM)などの変形を含むダイナミックRAM(DRAM)またはスタティックランダムアクセスメモリ(SRAM)などの多様なメモリ技術の任意のものを含みうる。メモリ904は、不揮発性フラッシュRAM(NVRAM)またはROMなどの不揮発性メモリ技術を含むこともできる。いくつかの実施形態では、メモリ904は、前述のような技術および具体的に言及されていない他の技術の組み合わせを含みうることが想定される。主題がコンピュータシステムにおいて実装される場合、起動中などにコンピュータシステム内の要素間で情報を転送するのを助ける基本ルーチンを含む基本入出力システム(BIOS)920が、ROM 916に格納される。
【0037】
ストレージ906は、フラッシュメモリに対して読み書きするためのフラッシュメモリデータストレージデバイス、ハードディスクに対して読み書きするためのハードディスクドライブ、リムーバブル磁気ディスクに対して読み書きするための磁気ディスクドライブ、および/または、リムーバブル光ディスク、たとえばCD-ROM、DVD、または他の光学媒体に対して読み書きするための光ディスクドライブを含みうる。ドライブおよびそれらの関連するコンピュータ可読媒体は、ハードウェアデバイス900のためのコンピュータ可読命令、データ構造、プログラムモジュール、および他のデータの不揮発性記憶を提供する。
【0038】
本明細書に記載された方法は、コンピュータベースのまたはプロセッサを含む機械、装置、またはデバイスなどの命令実行機械、装置、またはデバイスによって、またはそれに関連して使用するための、非一時的コンピュータ可読媒体に記憶された実行可能命令で具現化されうることに留意されたい。いくつかの実施形態については、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌーイカートリッジ、RAM、ROMなどの、コンピュータによってアクセス可能なデータを記憶することができる他のタイプのコンピュータ可読媒体が使用されてもよく、例示的な動作環境で使用されてもよいことが当業者によって理解されるであろう。本明細書で使用される場合、「コンピュータ可読媒体」は、命令実行マシン、システム、装置、またはデバイスが、コンピュータ可読媒体から前記命令を読み取り(またはフェッチし)、記載される方法を実施するために前記命令を実行することができるように、電子、磁気、光学、および電磁フォーマットのうちの一つまたは複数でコンピュータ・プログラムの実行可能命令を記憶するために任意の適切な媒体のうちの一つまたは複数を含むことができる。従来の例示的なコンピュータ可読媒体の非網羅的なリストは、ポータブルコンピュータディスケット、RAM、ROM、消去可能なプログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、ポータブルコンパクトディスク(CD)、ポータブルデジタルビデオディスク(DVD)、高精細度DVD(HD-DVD(商標))、BLU-RAYディスクを含む光学ストレージデバイスなどを含む。
【0039】
オペレーティングシステム922、一つまたは複数のアプリケーションプログラム924、プログラムデータ926、および他のプログラムモジュール928を含む、いくつかのプログラムモジュールが、ストレージ906、ROM 916、またはRAM 918に記憶されうる。ユーザーは、データ入力モジュール908を通じてハードウェアデバイス900にコマンドおよび情報を入力することができる。データ入力モジュール908は、キーボード、タッチスクリーン、ポインティングデバイス等のような機構を含んでいてもよい。他の外部入力装置(図示せず)は、外部データ入力インターフェース930を介してハードウェア装置900に接続される。限定ではなく例として、外部入力デバイスは、マイクロフォン、ジョイスティック、ゲームパッド、衛星アンテナ、スキャナなどを含むことができる。いくつかの実施形態では、外部入力デバイスは、ビデオカメラ、スチールカメラなどのビデオまたはオーディオ入力デバイスを含みうる。データ入力モジュール908は、デバイス900の1人または複数のユーザーから入力を受領し、そのような入力をバス914を介して処理ユニット902および/またはメモリ904に送達するように構成されうる。
【0040】
ハードウェアデバイス900は、通信インターフェース912を介して一つまたは複数のリモートノード(図示せず)への論理接続を使用して、ネットワーク化された環境で動作することができる。リモートノードは、別のコンピュータ、サーバー、ルーター、ピアデバイス、または他の一般的なネットワークノードであってもよく、典型的には、ハードウェアデバイス900に関して上述した要素の多くまたはすべてを含む。通信インターフェース912は、無線ネットワークおよび/または有線ネットワークとインターフェースしうる。無線ネットワークの例は、たとえば、BLUETOOTH(登録商標)ネットワーク、無線パーソナルエリアネットワーク、無線802.11ローカルエリアネットワーク(LAN)、および/または無線電話ネットワーク(たとえば、セルラー、PCS、またはGSM(登録商標)ネットワーク)を含む。有線ネットワークの例は、たとえば、LAN、光ファイバーネットワーク、有線パーソナルエリアネットワーク、電話ネットワーク、および/または広域ネットワーク(WAN)を含む。そのようなネットワーキング環境は、イントラネット、インターネット、オフィス、企業規模のコンピュータネットワークなどで一般的である。いくつかの実施形態では、通信インターフェース912は、メモリ904と他のデバイスとの間のダイレクトメモリアクセス(DMA)転送をサポートするように構成された論理を含みうる。
【0041】
ネットワーク環境では、ハードウェアデバイス900に関して図示されたプログラムモジュール、またはその一部は、たとえばサーバー上などのリモートストレージデバイスに記憶されてもよい。ハードウェアデバイス900と他のデバイスとの間の通信リンクを確立するために他のハードウェアおよび/またはソフトウェアが使用されてもよいことが理解されるであろう。
【0042】
図9に示されたハードウェアデバイス900の構成は、1つの可能な実装にすぎず、他の構成が可能であることを理解されたい。また、特許請求の範囲によって定義され、上述され、さまざまなブロック図に示されたさまざまなシステム構成要素(および手段)は、本明細書で説明される機能を実行するように構成された論理構成要素を表すことも理解されたい。たとえば、これらのシステムコンポーネント(および手段)のうちの一つまたは複数は、ハードウェアデバイス900の構成に示されるコンポーネントのうちの少なくともいくつかによって、全体的にまたは部分的に実現されうる。加えて、これらの構成要素のうちの少なくとも1つは、少なくとも部分的に電子ハードウェアコンポーネントとして実装され、したがって、機械を構成するが、他の構成要素は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組み合わせで実装されうる。より具体的には、特許請求の範囲によって定義される少なくとも1つの構成要素は、命令実行マシン(たとえば、プロセッサベースのマシンまたはプロセッサを含むマシン)などの電子ハードウェアコンポーネントとして、および/または図9に示されるものなどの特化した回路もしくは回路類(たとえば、特化した機能を実行するように相互接続された離散的な論理ゲート)として少なくとも部分的に実装される。他の構成要素は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組み合わせで実装されうる。さらに、本明細書に記載された機能を依然として達成しながら、これらの他の構成要素の一部または全部を組み合わせることができ、一部を完全に省略することができ、追加の構成要素を追加することができる。よって、本明細書に記載された主題は、多くの異なる変形形態で具現されることができ、そのような変形はすべて、特許請求されるものの範囲内にあるものと考えられる。
【0043】
上記の説明では、主題は、別段の指示がない限り、一つまたは複数のデバイスによって実行される工程および動作の記号的表現を参照して説明されうる。よって、コンピュータ実行されると呼ばれることがあるそのような工程および動作は、構造化された形のデータの処理ユニットによる操作を含むことが理解されよう。この操作は、データを変換するか、またはコンピュータのメモリシステム内の位置にデータを維持し、それにより、当業者にはよく理解される仕方で、デバイスの動作を再構成するか、または他の仕方で変更する。データが維持されるデータ構造は、データのフォーマットによって定義される特定の特性を有するメモリの物理的な位置である。しかしながら、主題は、前述の文脈で説明されているが、それは限定することを意図していない。以下で説明されるさまざまな工程および動作がハードウェアでも実装されうることを当業者は理解するであろう。
【0044】
本明細書の目的のために、用語「コンポーネント」、「モジュール」、および「プロセス」は、特定の機能を実行し、電算プログラム・コード(ソフトウェア)、デジタルもしくはアナログ回路、コンピュータファームウェア、またはそれらの任意の組み合わせを通じて実装されうる処理ユニットを指すために交換可能に使用されうる。
【0045】
本明細書で開示されるさまざまな機能は、それらの挙動、レジスタ転送、論理構成要素、および/または他の特性に関して、ハードウェア、ファームウェアの任意の数の組み合わせを使用して、ならびに/あるいはさまざまな機械可読媒体またはコンピュータ可読媒体において具現されるデータおよび/または命令として説明されうることに留意されたい。そのようなフォーマットされたデータおよび/または命令が具現化されうるコンピュータ可読媒体は、限定はしないが、光記憶媒体、磁気記憶媒体、または半導体記憶媒体など、さまざまな形態の物理的な(非一時的な)不揮発性媒体を含む。
【0046】
文脈が明らかにそうでないことを要求している場合を除き、本明細書および特許請求の範囲を通して、「含む」、「有する」などの語は、排他的または網羅的な意味ではなく、包含的な意味で、すなわち、「含むが、それに限定されない」という意味で解釈されるべきである。さらに、単数または複数を使用する語は、それぞれ複数または単数をも含む。さらに、「本明細書において」、「以下で」、「上記で」、「以下で」という単語、および同様の意味の単語は、本願全体を指し、本願のどの特定の部分を指すものでもない。「または」という単語が2つ以上の項目のリストに関して使用される場合、その単語は、その単語の以下の解釈のすべてをカバーする:リスト内の項目のいずれか、リスト内の項目のすべて、およびリスト内の項目の任意の組み合わせ。
【0047】
上記の説明および全体を通して、本開示の十全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示がこれらの具体的な詳細なしに実施されうることは、当業者には明らかであろう。他方では、説明を容易にするために、周知の構造およびデバイスはブロック図の形で示される。好ましい実施形態の説明は、本明細書に添付された特許請求の範囲を限定することを意図していない。さらに、本明細書に開示される方法において、本開示の機能のいくつかを示すさまざまなステップが開示される。これらのステップは、単なる例示であり、決して限定することを意味しないことが理解されるであろう。本開示から逸脱することなく、他のステップおよび機能が考えられてもよい。
【0048】
本発明のさまざまな側面は、以下の箇条書き例示的実施形態(enumerated example embodiment、EEE)から理解されうる。
【0049】
EEE1:音響エコー消去システムの前景および背景適応フィルタリング・コンポーネントを制御する方法であって、当該方法は:
制御論理と通信する前景フィルタによって、受領された周波数領域の遠端信号をフィルタリングする段階であって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、段階と;
前記制御論理と通信する背景フィルタによって、前記受領された周波数領域の遠端信号をフィルタリングする段階であって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、段階と;
前記制御論理によって、近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
前記制御論理によって、偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを含み、前記偏差信号は前記制御論理によって決定され、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
方法。
【0050】
EEE2:受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、EEE1に記載の方法。
【0051】
EEE3:前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
EEE2に記載の方法。
【0052】
EEE4:第1の平滑化因子が前記第2の平滑化値よりも低い値である、EEE3に記載の方法。
【0053】
EEE5:前記偏差信号はさらに、決定された相互相関係数をフィルタリングすることに基づいて決定され、相互相関係数は、発話の閾値レベルよりも大きいビンについてのみ決定され、発話の前記閾値レベルよりも小さいビンは、所定の値に設定された相互相関係数を有する、EEE1ないし4のうちいずれか一項に記載の方法。
【0054】
EEE6:発話の前記閾値レベルは、ビンについての前記近端マイクロフォン信号の大きさとノイズ・フロア値との比較が、所定の信号対雑音比閾値よりも大きいことに基づく、EEE5に記載の方法。
【0055】
EEE7:発話の前記閾値レベルは、前記近端マイクロフォン信号の大きさが所定の最小レベル閾値よりも大きいことに基づく、EEE5に記載の方法。
【0056】
EEE8:前記複数の周波数ビンにわたって前記決定された相互相関係数を加算することは、300Hz~3400Hzの範囲内の周波数ビンについての決定された相互相関係数を加算することを含む、EEE1~7のうちいずれか一項に記載の方法。
【0057】
EEE9:非一時的なコンピュータ可読媒体から取り出されたときに一つまたは複数のプロセッサによって実行されるコンピュータ可読プログラム・コードを含むコンピュータ・プログラム・プロダクトであって、前記プログラム・コードは:
前景フィルタによって、受領された周波数領域の遠端信号をフィルタリングする段階であって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、段階と;
背景フィルタによって、前記受領された周波数領域の遠端信号をフィルタリングする段階であって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、段階と;
近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを実行するための命令を含み、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
コンピュータ・プログラム・プロダクト。
【0058】
EEE10:受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、EEE9に記載のコンピュータ・プログラム・プロダクト。
【0059】
EEE11:前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
EEE10に記載のコンピュータ・プログラム・プロダクト。
【0060】
EEE12:第1の平滑化因子が前記第2の平滑化値よりも低い値である、EEE11に記載のコンピュータ・プログラム・プロダクト。
【0061】
EEE13:前記偏差信号はさらに、決定された相互相関係数をフィルタリングすることに基づいて決定され、相互相関係数は、発話の閾値レベルよりも大きいビンについてのみ決定され、発話の前記閾値レベルよりも小さいビンは、所定の値に設定された相互相関係数を有する、EEE9ないし12のうちいずれか一項に記載のコンピュータ・プログラム・プロダクト。
【0062】
EEE14:発話の前記閾値レベルは、ビンについての前記近端マイクロフォン信号の大きさとノイズ・フロア値との比較が、所定の信号対雑音比閾値よりも大きいことに基づく、EEE13に記載のコンピュータ・プログラム・プロダクト。
【0063】
EEE15:発話の前記閾値レベルは、前記近端マイクロフォン信号の大きさが所定の最小レベル閾値よりも大きいことに基づく、EEE14に記載のコンピュータ・プログラム・プロダクト。
【0064】
EEE16:前記複数の周波数ビンにわたって前記決定された相互相関係数を加算することは、300Hz~3400Hzの範囲内の周波数ビンについての決定された相互相関係数を加算することを含む、EEE9~15のうちいずれか一項に記載のコンピュータ・プログラム・プロダクト。
【0065】
EEE17:音響エコー消去システムであって:
受領された周波数領域の遠端信号をフィルタリングする前景フィルタであって、前記前景フィルタによるフィルタリングは前景エコー推定を与え、前記前景フィルタは前景係数に基づいて動作する適応エコー消去フィルタである、前景フィルタと;
前記受領された周波数領域の遠端信号をフィルタリングする背景フィルタであって、前記背景フィルタによるフィルタリングは背景エコー推定を与え、前記背景フィルタは、背景係数に基づいて動作する適応エコー消去フィルタである、背景フィルタと;
前記前景フィルタおよび前記背景フィルタのそれぞれと通信する制御論理とを有しており、前記制御論理は:
近端マイクロフォン信号と、前記前景エコー推定および前記背景エコー推定のうちの選択された1つとに基づいて、フィルタリングされた結果を決定する段階であって、前記フィルタリングされた結果は、その後、近端音声信号を生成するために使用される、段階と;
偏差信号に基づいて前記背景フィルタによる適応を停止する段階とを実行し、前記偏差信号は前記制御論理によって決定され、前記偏差信号の決定は:
前記受領された周波数領域の遠端信号の各周波数ビンについて前記前景エコー推定と前記背景エコー推定の両方のための相互相関係数を決定する段階であって、各相互相関係数が、各周波数ビンの受領されたマイクロフォン入力信号と前記それぞれのエコー推定との比較に基づく、段階と;
前記前景エコー推定と前記背景エコー推定の両方について、前記周波数ビンのうちの複数にわたって前記決定された相互相関係数を加算する段階と;
前記前景エコー推定についての前記相互相関係数の和と前記背景エコー推定についての前記相互相関係数の和とのうちの1つを選択する段階であって、該選択は、前記エコー推定のうちの前記選択された1つに関連する前記フィルタに基づく、段階と;
相互相関係数の前記選択された和にヒステリシス関数を適用する段階であって、前記選択された和が第1の閾値よりも大きいときに前記ヒステリシス関数が高い値を出力し、前記選択された和が第2の閾値よりも小さいときに前記ヒステリシス関数が低い値を出力するようにし、前記偏差信号は、前記ヒステリシス関数が前記高い値を出力することに応答してアクティブとなる、段階とに基づく、
システム。
【0066】
EEE18:受領された近端マイクロフォン信号が、前記相互相関係数を決定する前に、各周波数ビンについてのノイズ・フロア値を決定するために処理され、前記ノイズ・フロアは、各ビンについての前記相互相関係数を決定するために使われる、EEE17に記載のシステム。
【0067】
EEE19:前記ノイズ・フロア値を決定するための処理が:
前記近端マイクロフォン信号の大きさが前のビンについての修正された近端マイクロフォン信号以下であるときは、第1の平滑化因子および前のビンについてのノイズ・フロア値に基づき、
前記近端マイクロフォン信号の前記大きさが前記前のビンについての前記修正された近端マイクロフォン信号よりも大きいときは、第2の平滑化因子および前記前のビンについての前記ノイズ・フロア値に基づく、
EEE18に記載のシステム。
【0068】
EEE20:前記第1の平滑化因子が前記第2の平滑化値よりも低い値である、EEE19に記載のシステム。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【国際調査報告】