特許7585264 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ノキア　テクノロジーズ　オサケユイチアの特許一覧

特許7585264制御パラメータを用いた音響エコーキャンセル

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
1A
2
3
4A
4B
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-11-08

(45)【発行日】2024-11-18

(54)【発明の名称】制御パラメータを用いた音響エコーキャンセル

(51)【国際特許分類】

H04R 3/02 20060101AFI20241111BHJP

H04B 3/23 20060101ALI20241111BHJP

【ＦＩ】

H04R3/02

H04B3/23

【請求項の数】 18

【外国語出願】

(21)【出願番号】P 2022121401

(22)【出願日】2022-07-29

(65)【公開番号】P2023024338

(43)【公開日】2023-02-16

【審査請求日】2022-12-02

(31)【優先権主張番号】17/393,904

(32)【優先日】2021-08-04

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】515076873

【氏名又は名称】ノキアテクノロジーズオサケユイチア

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100092624

【弁理士】

【氏名又は名称】鶴田準一

(74)【代理人】

【識別番号】100141162

【弁理士】

【氏名又は名称】森啓

(72)【発明者】

【氏名】カールヌズマン

(72)【発明者】

【氏名】シリンジャラリ

【審査官】渡邊正宏

(56)【参考文献】

【文献】特開２００４－３４９８０６（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ２１／０２０８

Ｈ０４Ｂ１／７６－３／４４

Ｈ０４Ｂ３／５０－３／６０

Ｈ０４Ｂ７／００－７／０１５

Ｈ０４Ｍ１／６０

Ｈ０４Ｍ９／０８

Ｈ０４Ｒ３／００－３／１４

(57)【特許請求の範囲】

【請求項1】

双方向オーディオ通信のエコーキャンセルのための方法であって、
１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生された遠端信号に基づくオーディオ信号を受信するステップであって、１つ以上のラウドスピーカは、前記遠端信号を再生する、ステップと、
前記１つ以上のラウドスピーカから前記１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に、少なくとも２つのフィルタで前記適応エコーキャンセルシステムを動作させるステップと、
値の範囲から、構成可能であり、かつ、少なくとも１つの値に設定される前記適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定するステップであって、少なくとも１つの制御パラメータを決定する該ステップは、前記音響チャネルの係数の前記推定値の精度を推定すること、および前記近端信号の特性に基づいている、ステップと、
前記適応エコーキャンセルシステムによって、異なる時点において前記少なくとも１つの制御パラメータの異なる値の前記少なくとも２つのフィルタを制御するステップ、
を含む方法であって、
第１フィルタの上で使用される前記異なる値のうちの１つの値は、前記２つのフィルタの第２フィルタの上で使用される前記異なる値の別の値とは異なる、
方法。

【請求項2】

前記少なくとも２つのフィルタを、異なる時刻において、前記少なくとも１つの制御パラメータの異なる値を用いて、制御する前記ステップは、前記音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第１および第２のそれぞれの制御パラメータの異なる値で前記第１フィルタおよび第２フィルタを制御するステップであって、前記第１フィルタのための第１制御パラメータセットの値が、前記第２フィルタに対する第２制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、ステップと、
前記第１および第２フィルタの誤差キャンセル性能を推定するステップと、
該誤差キャンセル性能の推定の後に、より低い性能を有すると推定された前記第１または第２フィルタの係数を、より高い性能を有すると推定された前記第１または第２フィルタの他方の係数に近づけるように更新するステップと、
を、さらに含む、請求項１に記載の方法。

【請求項3】

前記更新するステップは、より低い性能を有すると推定された前記第１または第２フィルタの前記係数を、より高い性能を有すると推定された前記第１または第２フィルタの前記他方の係数と少なくとも実質的に等しいように更新するステップをさらに備える、請求項２に記載の方法。

【請求項4】

前記少なくとも２つのフィルタの前記第１フィルタおよび前記第２フィルタを、対応する第１および第２のそれぞれの制御パラメータの異なる値を用いて制御するステップは、
さらに、残存遠端対近端比の２つの推定値、第１推定値および第２推定値の過去の履歴に基づく残存遠端から近端への比の第１推定値であって、前記比の低い値であるとして選択される前記第１推定値と、前記１つ以上のマイクロフォンからの信号および前記遠端信号の観測に基づいて、上限が最高値として選択され、前記残存遠端対近端比の上限である前記第２推定値と、を決定するステップと、
第１適応フィルタの第１信頼パラメータを前記第１推定値に設定するステップと、
第２適応フィルタの第２信頼パラメータを前記第２推定値に設定するステップと、
を含む、請求項２に記載の方法。

【請求項5】

より低い性能を有すると推定される前記第１または第２フィルタの推定電力レベルを、より高い性能を有すると推定される前記第１または第２フィルタの前記他方の電力レベルと実質的に等しくなるように設定するステップと、
前記第１フィルタより低い性能を有すると推定される前記第２フィルタに応答して、前記第１フィルタの推定ミスアライメントを増加させるステップと、
のうちの少なくとも１つをさらに含む、請求項２に記載の方法。

【請求項6】

前記第１フィルタの前記推定されたミスアラインメントを増加するステップは、コンスタントな増殖の要因によって前記第１フィルタの前記推定されたミスアラインメントを増加するステップを更に含む、請求項５に記載の方法。

【請求項7】

前記近端信号の特性は、前記近端信号の信号強度を含む、請求項１に記載の方法。

【請求項8】

少なくとも１つの制御パラメータを決定する前記ステップは、前記近端信号の強度の測度に対する、前記音響チャネルの前記係数の前記推定における誤差の測度の比を推定することに基づく、請求項１に記載の方法。

【請求項9】

第１時刻に使用される前記異なる値の第１値は、第２時刻に使用される前記異なる値の第２値とは異なる、請求項１に記載の方法。

【請求項10】

双方向オーディオ通信のエコーキャンセルのための装置であって、該装置は、１つ以上のプロセッサと、コンピュータプログラムコードを含む１つ以上のメモリと、を備え、
前記１つ以上のメモリおよび前記コンピュータプログラムコードは、前記１つ以上のプロセッサを用いて、前記装置に、１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に、近端信号および再生された遠端信号に基づくオーディオ信号を受信させ、ここで、１つ以上のラウドスピーカが前記遠端信号を再生したのであり、
前記１つ以上のラウドスピーカから前記１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に、少なくとも２つのフィルタを用いて、前記適応エコーキャンセルシステムを動作させ、
値の範囲から少なくとも１つの値に構成可能であり、かつ、設定される前記適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定させ、ここで、少なくとも１つの制御パラメータを前記決定することは、前記音響チャネルの係数の推定値の精度の前記推定値および前記近端信号の特性を推定することに基づいており、
前記適応エコーキャンセルシステムによって、異なる時点で、前記少なくとも１つの制御パラメータの異なる値を有する前記少なくとも２つのフィルタを制御させる
ように構成される、装置であって、
第１フィルタの上で使用される前記異なる値のうちの１つの値は、前記２つのフィルタの第２フィルタの上で使用される前記異なる値の別の値とは異なる、
装置。

【請求項11】

前記少なくとも１つの制御パラメータの異なる値で、異なる時刻に前記少なくとも２つのフィルタを前記制御することは、
前記音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第１および第２のそれぞれの制御パラメータの異なる値で前記第１フィルタおよび第２フィルタを制御することと、ここで、前記第１フィルタのための第１制御パラメータセットの値が、前記第２フィルタのための第２制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させ、
前記第１および第２フィルタの誤差キャンセル性能を繰り返し推定することと、
前記繰り返し推定の後に、前記第１または第２フィルタの係数がより高い性能を有すると推定された前記第１または第２フィルタの他方の係数に近づくように、より低い性能を有すると推定された前記第１または第２フィルタの係数を更新することと、
をさらに備える、
請求項１０に記載の装置。

【請求項12】

前記更新することは、より低い性能を有すると推定された前記第１または第２フィルタの前記係数を、より高い性能を有すると推定された前記第１または第２フィルタの他方の係数と少なくとも実質的に等しいように更新することをさらに備える、請求項１１に記載の装置。

【請求項13】

前記少なくとも２つのフィルタの前記第１フィルタおよび前記第２フィルタを、対応する第１および第２のそれぞれの制御パラメータの異なる値で制御するステップは、
残存遠端対近端比の２つの推定値の決定するステップであって、第１推定値および第２推定値の過去の履歴に基づく残存遠端から近端への比の第１推定値であって、前記第１推定値は比の低い値であるとして選択され、前記第２推定値は、前記１つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択され得る、前記残存遠端対近端比の上限である、ステップと、
第１適応フィルタの第１信頼パラメータを第１推定値に設定するステップと、
第２適応フィルタの第２信頼パラメータを前記第２推定値に設定するステップと、
をさらに含む、
請求項１１に記載の装置。

【請求項14】

前記第１推定値は、前記第２推定値よりも係数が著しく低い前記比の低い値として選択される、請求項１３に記載の装置。

【請求項15】

前記１つ以上のメモリおよび前記コンピュータプログラムコードは、前記１つ以上のプロセッサを用いて、前記装置に、
より低い性能を有すると推定される前記第１または第２フィルタの推定電力レベルを、より高い性能を有すると推定される前記第１または第２フィルタの他方の電力レベルに実質的に等しいように設定するステップと、
前記第１フィルタより低い性能を有すると推定される前記第２フィルタに応答して、前記第１フィルタの推定ミスアライメントを増加するステップと
のうちの少なくとも１つを実行させるようにさらに構成される、
請求項１１に記載の装置。

【請求項16】

前記近端信号の特性が、前記近端信号の信号強度を含む、請求項１０に記載の装置。

【請求項17】

少なくとも１つの制御パラメータを前記決定することは、前記近端信号の強度の測度に対する、前記音響チャネルの前記係数の前記推定における誤差の測度の比を推定することに基づく、請求項１０に記載の装置。

【請求項18】

第１時刻に使用される前記異なる値の第１値は、第２時刻に使用される前記異なる値の第２値とは異なる、請求項１０に記載の装置。

【発明の詳細な説明】

【技術分野】

【0001】

本明細書の例示的な実施形態は概して、音響エコーキャンセル（ＡＥＣ）に関し、より具体的には、最大尤度（ＭＬ）技法を使用してＡＥＣを実行するためのプロセスおよび装置に関する。

【背景技術】

【0002】

双方向オーディオシステムでは、多くの場合、「遠端」と「近端」がある。１つの部屋にいる人が、ビデオ会議を介して別の場所にいる同僚と話すことを考える。部屋は「近端」（人に対する）であると考えられ、同僚との場所は「遠端」であると考えられる。

【0003】

ラウドスピーカーとマイクロフォンが近端部で物理的に隔離されていない（ラウドスピーカーフォンや会議室など）あらゆる双方向オーディオシステムでは、ラウドスピーカーによって生成された遠端信号がマイクロフォンを介して遠端部にフィードバックされないようにするために、エコーキャンセレーションが必要である。そのようなシステムは今日すでに広く使用されているが、空間的オーディオおよび没入型経験を含む新しい使用事例は技術的問題をより困難にする。

【0004】

音響エコーキャンセルシステムの望ましい特性は、
１）遠端信号が強く相関していても、急速に変化する物理的環境を追跡する能力、
２）収束後の非常に低い残留エコー、
３）断続的な強い近端信号の存在に対するロバスト性、および
４）許容可能な複雑さ（例えば、除去フィルタの長さがリニア）
の１つ以上を含む。

【発明の概要】

【0005】

このセクションは例を含むことを意図しており、限定することを意図していない。

【0006】

例示的な実施形態では、１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信することを含む、双方向オーディオ通信のエコーキャンセルのための方法が開示される。遠端信号を再生する１つ以上のラウドスピーカにおいて、本願方法は、１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも１つのフィルタを用いて、適応エコーキャンセルシステムを動作させることを含む。本方法はまた、値の範囲から、構成可能であり、少なくとも１つの値に設定される、適応エコーキャンセルシステムの動作に影響を与える少なくとも１つの制御パラメータを決定することを含む。少なくとも１つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度と、近端信号の特性とを推定することに基づく。本方法は、適応エコーキャンセルシステムによって、少なくとも１つの制御パラメータの異なる値を有する少なくとも１つのフィルタを異なる時刻に制御することを含む。

【0007】

追加の例示的実施形態は、コンピュータプログラムがプロセッサ上で実行されるときに、前の段落の方法を実行するためのコードを含むコンピュータプログラムを含む。本段落に記載のコンピュータプログラムは、コンピュータと共に使用するためにその中に具体化されたコンピュータプログラムコードを有するコンピュータ可読媒体を含むコンピュータプログラム製品である。別の例は、この段落に従ったコンピュータプログラムであり、プログラムは、コンピュータの内部メモリに直接ロード可能である。

【0008】

例示的な装置は、１つ以上のプロセッサと、コンピュータプログラムコードを含む１つ以上のメモリとを含む。前記１つ以上のメモリおよびコンピュータプログラムコードは、該１つ以上のプロセッサを用いて、該装置に、１つ以上のプロセッサとともに、装置に、１つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を適応エコーキャンセルシステムで受信させ、ここで、１つ以上のラウドスピーカが遠端信号を再生し、１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に適応エコーキャンセルシステムを動作させ、構成可能であり、値の範囲から、少なくとも１つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定させ、ここで、少なくとも１つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づいており、適応エコーキャンセルシステムによって、異なる時点における前記少なくとも１つの制御パラメータの異なる値で、前記少なくとも１つのフィルタを制御させるように構成される。

【0009】

例示的なコンピュータ・プログラム製品はコンピュータと共に使用するために、そこに具体化されたコンピュータ・プログラム・コードを有するコンピュータ読み取り可能な記憶媒体を含む。コンピュータプログラムコードは、１つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生された遠端信号に基づくオーディオ信号を受信するためのコードと、ここで、１つ以上のラウドスピーカが、該遠端信号を再生するものであり、少なくとも部分的に、少なくとも１つのフィルタを用いて、１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、適応エコーキャンセルシステムを動作させるためのコードと、構成可能であり、値の範囲から少なくとも１つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定するためのコードであって、少なくとも１つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づく、コードと、適応エコーキャンセルシステムによって、少なくとも１つのフィルタを、異なる時刻に、制御するためのコードとを含む。

【0010】

別の例示的な実施形態では、装置が、１つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するステップであって、１つ以上のラウドスピーカが遠端信号を再生する、ステップと、１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも１つのフィルタで、適応エコーキャンセルシステムを動作させるステップと、構成可能であり、値の範囲から少なくとも１つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定するステップであって、少なくとも１つの制御パラメータを決定することは音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づく、ステップと、適応エコーキャンセルシステムによって、少なくとも１つのフィルタを、少なくとも１つの制御パラメータの異なる値で、異なる時刻に制御するステップと、を実行するための手段を備える。

【図面の簡単な説明】

【0011】

添付図面について説明する。

【図1】図１は、エコーキャンセルを有する典型的なオーディオシステムの論理フロー図である。

【図1A】図１Ａは、例示的な実施形態による、エコーキャンセルを実装するのに適した通信装置のブロック図である。

【図2】図２は、実施形態１と呼ばれる第１の実施形態の論理フロー図である。

【図3】図３は、例示的な実施形態による、実施形態２と呼ばれる第２の実施形態のエコーキャンセルモジュールのブロック図である。

【図4】図４は、図４Ａおよび図４Ｂにわたる、実施形態２のための一般的な更新プロセスの論理フロー図である。

【図5】図５は、実施例２の定期更新ルールの論理フロー図である。

【図6】図６は、例示的な実施形態において、ＩＭＬアルゴリズムを実行する２つの並列フィルタを用いたエコーキャンセルを使用する、シミュレートされたＳＩＳＯエコーキャンセルシナリオにおける信号電力の発展を示す。

【図7】図７は、例示的な実施形態における、ＩＭＬアルゴリズムを実行する２つの並列フィルタを用いたエコーキャンセルを使用した、図６のシミュレートされたＳＩＳＯエコーキャンセルシナリオにおける正規化されたミスアライメント

【数1】

の展開を示す。

【図8】図８は制御パラメータを使用したアコースティックエコーキャンセルのためのロジックフロー図であり、例示的な方法または方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータプログラム命令の実行の結果、ハードウエア内に実装されたロジックによって実行された機能、および／または例示的な実施形態による機能を実行するための相互接続された手段を示す。

【発明を実施するための形態】

【0012】

明細書および／または図面の図に見られる略語は詳細な説明のセクションの近端に、以下に定義される。

【0013】

「例示的」という用語は本明細書では「例、事例、または例示としての役割を果たす」ことを意味するために使用される。「例示的」として本明細書で説明される任意の実施形態は必ずしも他の実施形態よりも好ましいまたは有利であると解釈されるべきではない。
この詳細な説明に記載された実施形態の全ては、当業者が本発明を実施または使用することを可能にするために提供される例示的な実施形態であり、特許請求の範囲によって定義される本発明の範囲を限定するものではない。

【0014】

用語「含む（ｃｏｍｐｒｉｓｅｓ）」、「備える（ｃｏｍｐｒｉｓｉｎｇ）」、「有する（ｈａｓ）」、「有する（ｈａｖｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」、および／または「含む（ｉｎｃｌｕｄｉｎｇ）」は、本明細書で使用される場合、述べられた特徴、素子、および／またはコンポーネントなどの存在を特定するが、1つ以上の他の特徴、要素、コンポーネント、および／またはそれらの組み合わせの存在または追加を排除するものではない、ことがさらに理解される。

【0015】

５Ｇ没入型音声などのシステムの適用のために、複数のラウドスピーカおよび複数のマイクロフォンを活用して、より現実的なオーディオ体験を提供することが望ましい。
例えば、異なる遠隔音声が異なる方向から来るように見せることによって、理解を向上させることができる。

【0016】

大規模でダイナミックな物理環境で複数のラウドスピーカーとマイクロフォンを活用すると、いくつかの理由、すなわち、
１)複数のラウドスピーカーが遠端信号の相関を高め、収束を遅くする、
２)計算の複雑さを増す複数のマイクロホン、
３)大きな物理的環境は、キャンセルフィルタの必要な長さを増加させる、および／または、
４) 動的な物理的環境は、システムの必要な追跡速度を増加させる、
などの理由から、音響エコーキャンセレーションの課題がより困難になる。

【0017】

没入型音声アプリケーションを可能にするには、迅速な追跡、低残留エコー、近端信号に対するロバスト性、および低複雑性を同時にかつ自動的に達成できるエコー・キャンセル方法を有することが有用である。

【0018】

音響エコー・キャンセルの一般的問題に対しては、多数のアルゴリズムが存在する。音響エコー・キャンセルフィルタの係数を適応させるための３つの鍵となるアルゴリズムは、
最小平均二乗（ＬＭＳ）、再帰最小二乗（ＲＬＳ）、およびアフィン射影アルゴリズム（ＡＰＡ）を含む。これらの全ては有用であり得るが、本明細書に提示される技術が対処しようとする以下の制限を有する。
１）ＬＭＳは、特に相関近端信号の面において、収束が悪くなる。
２）ＲＬＳは優れた性能を持つが、フィルタ長に二次複雑性がある。
３）ＡＰＡは収束は速いが、収束後の残留エコーは比較的高い。

【0019】

サブバンド法は課題を別々の周波数帯域に効果的に分割する。次いで、上記の３つの方法を、サブバンドの各々の中で適用することができる。重み付け重複加算（ＷＯＬＡ）アプローチは、このカテゴリに分類される。

【0020】

ＬＭＳアルゴリズムに対して、収束速度と定常残留エコーの間のトレードオフを制御するステップサイズとして知られる重要なスカラーパラメータが存在する。ステップサイズを適応させるためのいくつかの現在の方式がある。例えば、ＮＰ－ＮＬＭＳおよびＪＯ－ＮＬＭＳについては、「Benesty, J., Rey, H., Vega, L. R., and Tressens, S., "A nonparametric VSS NLMS algorithm", IEEE Signal Processing Letters, 13(10), 581-584 (2006)」、および、「Paleologu, C., Ciochin, S., Benesty J., and Grant, S. L., "An overview on optimized NLMS algorithms for acoustic echo cancellation", EUROSIP Journal on Advances in Signal Processing, 2015:97 (2015)」を参照されたい。このアイデアは、チャネル推定誤差が高く、雑音が低い場合は大きなステップを使用し、誤差が低く、および／または雑音が高い場合は、小さなステップを使用することである。
音声指向アプリケーションでは、音声アクティビティ検出（ＶＡＤ）アルゴリズムを使用して、近端音声信号が存在するときを決定することができる。ＶＡＤはステップサイズ制御に供給することができ、音声アクティビティの期間中、ステップサイズをゼロ（またはゼロに近い）にし、近端音声が無音であるとき、より大きくする。これは、高い音声アクティビティが他の信号を圧倒することが予想されるためであり、したがって、これらの時刻のために適応が選択されないことが低いからである。

【0021】

ＡＰＡアルゴリズムはステップサイズと正則化パラメータの二つのパラメータを持つ。従来、正則化パラメータは数値的な不調和を回避するために、小型固定レベルに設定される。原則として、ステップは、ＬＭＳアルゴリズムと同様の方法によって制御することができる。第３のパラメータはしばしばＰと表されるメモリ長である。Ｐのより大きい値が高速収束のために有利であるが、Ｐのより小さい値は収束後により下側残存エコーを与える。
異なる条件下でＰを適応させる方法は、「Albu, F., Paleologu, C., and Benesty, J., "A variable step size evolutionary affine projection algorithm", in 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 429-432), IEEE (2011, May)」のように提案されている。ステップサイズ、正則化、およびＰを一緒に選択または制御する効果的な方法は、
知られていないようである。

【0022】

これらおよび他の問題に対処するために、および概要として、本明細書の例示的な提案はすべてのコンポーネントが同時に必要ではないが、以下の３つのコンポーネントを含む。参照を容易にするために、コンポーネントをＣ１、Ｃ２、およびＣ３と表示する。

【0023】

（Ｃ１）双方向オーディオ設定においてエコーチャネル係数を適応的に学習するための新しい更新規則、増分最大尤度（ＩＭＬ）。ＩＭＬ更新ルールは２つのパラメータ、すなわち、
ｉ）固定メモリ順序Ｐと、
ｉｉ）適応的に設定される信頼性パラメータ（ＣＰ）と
を有する。

【0024】

（Ｃ２）音響エコーキャンセル設定で利用可能な情報に基づいてＣＰを適応的に設定するための理論的に正当化された実用的な方法。この更新ルールは、ＩＭＬが、例えば、ＩＭＬが（例えば、近端音声アクティビティ検出の助けを借りて）低近端アクティビティの期間においてのみ動作され得る場合、ＩＭＬが高速収束および低定常状態誤差を有することを可能にし得る。

【0025】

（Ｃ３）例えば、近端アクティビティに対してロバストでＩＭＬベースのエコーキャンセル方法。この方法は、２つのＩＭＬフィルタを並列に実行することを含む。２つのフィルタは、それらのＣＰを設定するために異なる仮定を使用し得る。

【0026】

ここで、追加の概要が提示され、より詳細な説明が以下に関連する。

【0027】

例示的な実施形態は、遠端音をエンドユーザに伝えるために１つ（または複数）のラウドスピーカが設けられ、遠端ユーザに伝えられる近端音を捕らえるために１つ（または複数）のマイクロフォンが設けられる、移動装置におけるハンズフリー通信に関する。遠端音がラウドスピーカ、ローカル音響チャネル、およびマイクロフォンの鎖を介して遠エンドユーザに逆伝搬するのを防止するために、エコーキャンセレーションモジュールが提供される。チャネル推定における不確実性の多次元統計モデルを形成するためにＰ個の過去のサンプルの窓を使用し、そのモデルの下で最尤推定値にフィルタ係数を更新するエコー消去部のための適応機構を提供した。この機構は、本明細書では増分最大尤度（ＩＭＬ）アルゴリズムと呼ばれる。この機構は、チャネル推定における不確実性のレベルと近端信号の電力レベルとの間の変化するバランスを反映するように修正することができる、信頼性パラメータと呼ばれる制御パラメータを有する。上記コンポーネント（Ｃ１）を参照のこと。様々な態様は例えば、コンポーネント（Ｃ２、Ｃ３）を使用して、利用可能な情報に基づいて信頼性パラメータが修正される方法が異なる。

【0028】

例示的な実施形態によって対処される一態様は、信頼性パラメータが異なる実施形態における様々な技法によって推定され得る理論的な最適値を有することである。特に、分析は、信頼性パラメータが例えば、残存遠端信号電源と近端信号電源の比に等しく設定され得ることを示す。この比は、本明細書ではＲＦＮＲ(残存遠端対近端比）と呼ばれる。ＩＭＬメカニズムの信頼パラメータを推定ＲＦＮＲに等しく設定することにより、適応メカニズムは異なる状況において異なる挙動をすることができ、したがって、いくつかの他の周知の適応メカニズムの１つのメカニズムポジティブな特徴を組み合わせることができる。
例えば、ＲＦＮＲが高く、それに応じて信頼パラメータが設定されるとき、ＩＭＬ更新は、高い残留エコーレベルを迅速に低減することができるＡＰＡ更新とほぼ同一である。ＲＦＮＲが低く、信頼性パラメータがそれに応じて設定されるとき、ＩＭＬ更新は高い近端雑音レベルに対してロバストであり、低い残留エコーを達成する、小さいステップサイズを有するＬＭＳ更新とほぼ同一である。ＲＦＮＲの中間値について、ＩＭＬ更新は、ＡＰＡまたはＬＭＳ単独のいずれによっても捕捉されない中間挙動を提供する。ＩＭＬアルゴリズムが、ＲＦＮＲにほぼ等しい信頼パラメータセットで動作される場合、例示的な実施形態は収束後に、高速収束と低残留エコーの両方を提供する。ＡＰＡおよびＬＭＳと同様に、ＩＭＬの複雑さは、エコーキャンセレーションフィルタの長さにおいてのみ線形である。「等しい」という用語が本明細書で使用されるときはいつでも、これは、等しいといういくつかの（たとえば、比較的小さい）閾値内にあるなど、多くの例で実質的に等しいことが暗示され得ることに留意されたい。たとえば、信頼パラメータは、１パーセントまたは数パーセント以下の閾値内にあるなど、ＲＦＮＲに実質的に等しく設定され得る。

【0029】

ＲＦＮＲは直接観察可能ではなく、様々な態様はＲＦＮＲが推定される方法に従って異なる。「直接的に観察可能」とは、ＲＦＮＲが測定不可能でまたは測定が困難であるなど、データーから推定することが困難な手段である。正確なＶＡＤ部が利用可能である音声指向アプリケーションでは、ＲＦＮＲが近端ラウドスピーカが非アクティブであるとき、扁平状バックグラウンドノイズモデルに基づいて推定することができ、近端音声アクティビティが検出されたとき、非常に低いと単純に仮定することができる（コンポーネントＣ２を参照）。
正確なＶＡＤが利用可能でない用途において、例えば、近端信号が単なる音声信号ではない場合、信頼性パラメータは、一対の平行なエコーキャンセルフィルタを使用して効果的に制御することができる。一方のフィルタはＲＦＮＲの積極的な推定値で制御され、他方はＲＦＮＲの保守的な推定値で制御され、両方が頻繁に同期される（ポイントＣ３参照）。例示的な実施形態では積極的な推定がより高い信頼度パラメータを使用し、保守的な推定はより下側信頼度パラメータを使用する。

【0030】

本明細書に提示される技術の一部の技術的効果には、以下のものが含まれる。

【0031】

コンポーネントＣ１の可能な効果は、以下の通りである。信頼パラメータが残存遠端から近端への比にほぼ等しく設定されるとき、ＩＭＬ更新ルールは、平均して、ＲＬＳなどの最適な方法よりもはるかに低い複雑さで、ＡＰＡまたはＮＬＭＳで達成され得るよりも低い残存遠端信号を達成する。

【0032】

コンポーネントＣ１およびＣ２の考えられる効果には、以下のものが含まれる。強い近端活動の周期が既知であるか、効果的に推定することができる用途では、Ｃ１およびＣ２で動作するエコーキャンセラが音響チャネル条件の変化後（または初期化時）の残留エコーの高速縮小を達成し、一方、チャネルが安定しているときには非常に低い残留エコーを達成する。より速い縮小はＡＰＡに対する縮小との類似性に基づき、ＬＭＳよりもより速い縮小を有する。低残差エコーはＬＭＳによって達成されるものと同様の残差エコーに基づいており、ＡＰＡによって達成されるものよりも低い。

【0033】

コンポーネントＣ１およびＣ３の可能な効果は一緒に、以下を含む。一般的なアプリケーションでは、
Ｃ１およびＣ３で動作するエコーキャンセラが音響チャネル条件の変化後（または初期化時）の残留エコーの高速縮小を達成し、一方、チャネルが安定しているときは非常に低い残留エコーも達成し、一方、高い近端活動の期間中は低い残留エコーも維持する。

【0034】

ここで、概要が提供されたので、追加の詳細が提供される。

【0035】

追加の詳細を進める前に、以下に提示される概念のうちのいくつかは、数学的形式で特徴付けられる。以下の表は、パラメータとそれに対応する例示的な意味への参照ガイドである。

【表1】

この表は参照を容易にするために提供されており、網羅的なまたは限定的であることを意味するものではない。また、これらのパラメータは、時に他の名前を使用して参照されることがある。

【0036】

図１に示すセットアップを考える。図１は、エコーキャンセルを有する典型的なオーディオシステムのブロック図である。遠端から信号１５があり、遠端に信号６５がある。オーディオ・システム１０は、ラウドスピーカ・アレイ１２（この例では３つのラウドスピーカを有する）、マイクロホン・アレイ３０（この例では３つのマイクロホンを有する）、アコースティック・エコー・キャンセラ９０、および加算器７６を含む。この例のＡＥＣ９０は、係数を有するエコーキャンセラモジュール５０と、適応重み更新機能７０と、近端アクティビティ検出モジュール８０とを含む。アレイ１２および３０は１つの要素から多くの要素を有することができ、アレイ１２、３０の各々の要素の数は同じである必要はない。

【0037】

遠端からの信号１５は、ラウドスピーカ信号１１ｘ_ｔを含み、マイクロフォン（マイク）信号ｙ_ｔ３５は、ノイズ信号ｚ_ｔ４０、近端信号ｕ_ｔ４５、およびエコーを有する遠端信号ｘ_ｔ ^Ｔｗ^＊６０を含む。ｗ^＊は、ラウドスピーカー１２とマイクロフォン３０の間のチャネルを表す。この例ではシステム１０の環境は部屋２０内にあり、近端信号４５は少なくとも利用者（図示せず）などの近端オーディオソース２２によって生成される。

【0038】

エコーキャンセラ５０は係数を使用して適用し、マイクロホン信号３５から加算器７６によって減算されるエコー推定値ｘ_ｔ ^Ｔｗ_ｔ７５を生成し、エコーキャンセレーション出力ｅ_ｔ６５を生成する。適応重み更新機能７０は係数を更新し、係数は、重みであると考えることもできる。近端アクティビティ検出モジュール８０はＶＡＤを実行し、ハード出力（例えば、検出された音声がない場合はゼロ、検出された音声がある場合は１）、またはゼロと１との間の（および場合によっては含む）数のいずれかを適応重み更新機能７０に出力する。これに応答して、適応重み更新機能７０は例えば、使用される場合、異なるステップサイズを使用して、更新を実行するか、または実行しない。

【0039】

図１Ａは、例示的な実施形態に従ったエコーキャンセレーションを実施するのに適した通信装置１１０のブロック図である。通信装置１１０の一例は、無線ネットワークにアクセス可能な無線、典型的にはモバイル装置である。通信装置１１０は、１つ以上のバス１２７を介して相互接続された、１つ以上のプロセッサ１２０と、１つ以上のメモリ１２５と、１つ以上のトランシーバ１３０と、１つ以上のネットワーク（Ｎ／Ｗ）インターフェース（ＩＦ）１６１とを含む。１つ以上のトランシーバ１３０の各々は、受信機、Ｒｘ、１３２および送信機、Ｔｘ、１３３を含む。１つ以上のバス１２７は、アドレス、データ、または制御バスであり得、マザーボードまたは集積回路上の一連の回線、光ファイバまたは他の光通信機器などの任意の相互接続機構を含み得る。

【0040】

通信装置１１０は、有線、無線、またはその両方とすることができる。無線通信の場合、１つ以上のトランシーバ１３０は、１つ以上のアンテナ１２８に接続される。１つ以上のメモリ１２５は、コンピュータプログラムコード１２３を含む。Ｎ／ＷＩ／Ｆは、１つ以上の有線リンク１６２を介して通信する。

【0041】

通信装置１１０は、いくつかの方法で実装され得る、部分１４０－１および／または１４０－２の一方または両方を備える制御モジュール１４０を含む。制御モジュール１４０は１つ以上のプロセッサ１２０の一部として実装されるように、制御モジュール１４０－１としてハードウェアで実装されてもよい。制御モジュール１４０－１はまた、集積回路として、またはプログラマブルゲートアレイなどの他のハードウェアを介して実装され得る。別の例では、制御装置１４０がコンピュータプログラムコード１２３として実装され、１つ以上のプロセッサ１２０によって実行される制御装置１４０－２として実装されてもよい。例えば、１つ以上のメモリ１２５およびコンピュータ・プログラム・コード１２３は、１つ以上のプロセッサ１２０を用いて、ユーザ装置１１０に本明細書に記載する１つ以上の動作を実行させるように構成してもよい。ＡＥＣ９０は、同様に、制御モジュール１４０－１の一部としてエコーキャンセラモジュール９０－１として、制御モジュール１４０－２の一部としてエコーキャンセラモジュール５９－２として実装され得る。ＡＥＣ９０は典型的にはエコーキャンセラモジュール５０および適応重み更新機能７０を含み、近端アクティビティ検出モジュール８０は含んでも含まなくてもよい。

【0042】

コンピュータ可読メモリ１２５は、ローカル技術環境に適した任意のタイプのものとすることができ、半導体ベースのメモリデバイス、フラッシュメモリ、ファームウェア、磁気メモリデバイスおよびシステム、光学メモリデバイスおよびシステム、固定メモリおよび取り外し可能メモリなどの任意の適切なデータ記憶技術を使用して実装することができる。コンピュータ可読メモリ１２５は、記憶機能を実行するための手段であってもよい。プロセッサ１２０は、ローカル技術環境に適した任意のタイプであってもよく、非限定的な例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、およびマルチコアプロセッサアーキテクチャに基づくプロセッサのうちの１つ以上を含むことができる。プロセッサ１２０は、通信装置１１０を制御することなどの機能、および本明細書で説明する他の機能を実行するための手段であり得る。

【0043】

一般に、通信デバイス１１０の様々な実施形態は、限定はしないが、セルラー電話
（スマートフォン、携帯電話、携帯電話、ボイスオーバーインターネットプロトコル(ＩＰ)(ＶｏＩＰ)電話、および／またはワイヤレスローカルループ電話など）、タブレット、ポータブルコンピュータ、ルームオーディオ機器、没入型オーディオ機器、車両または車両搭載デバイス、たとえばワイヤレスＶ２Ｘ（車間）通信用、デジタルカメラなどの画像キャプチャデバイス、ゲームデバイス、音楽ストレージおよび再生機器、インターネット機器（モノのインターネット、ＩｏＴ、デバイスを含む）、たとえば自動化アプリケーション用のセンサおよび／またはアクチュエータを備えたＩｏＴデバイス、ならびにそのような機能の組合せを組み込んだポータブルユニットまたは端末、ラップトップ、ラップトップ組み込み機器（ＬＥＥ）、ラップトップ搭載機器（ＬＭＥ）、ユニバーサルシリアルバス（ＵＳＢ）ドングル、スマートデバイス、ワイヤレスカスタマープレミス機器（ＣＰＥ）、モノのインターネット（ｌｏＴ）デバイス、時計または他のウェアラブル、ヘッドマウントディスプレイ（ＨＭＤ）、車両、ドローン、医療デバイスおよびアプリケーション（たとえば、遠隔手術）、産業デバイスおよびアプリケーション（たとえば、産業および／または自動処理チェーンコンテキストで動作するロボットおよび／または他のワイヤレスデバイス）、家電デバイス、商業および／または産業ワイヤレスネットワーク上で動作するデバイスなどを含むことができる。すなわち、通信装置１１０は、無線または有線通信が可能な任意の装置とすることができる。

【0044】

単一のラウドスピーカー（アレイ１２内）と単一のマイクロフォン（アレイ３０内）があると仮定する。このアルゴリズムは複数のラウドスピーカおよび／または複数のマイクロホンの場合に、簡単な方法で一般化する。時刻ｔにおいて、ＡＥＣ９０は、以下を入力として受信する。

【0045】

１)最新のラウドスピーカー信号ベクトルは、

【数2】

であり、ここで、ｎ_ｗは、ｗ_ｔにおける係数の数であり、Ｒは、長さｎ_ｗの実ベクトルのセットである。

【0046】

２)最新のマイク測定は、

【数3】

である。

【0047】

３)Ｐ－１以前のラウドスピーカーとマイクロフォンの測定は、

【数4】

である。

【0048】

４)エコーチャネルの係数の現在の推定値は、ｗ_ｔである。

【0049】

ここで、提案されたエコーキャンセル方法、すなわちＩＭＬが、その入力の機能としてどのようにｗ_ｔを更新するかを説明する。

【0050】

ｎ_ｗ×P行列

【数5】

と、P×1ベクトル

【数6】

を定義する。また、ｎ_ｗ×(Ｐ－１)行列

【数7】

を定義する。（Ｕ_ｔ－１は、最初の列がないＸ_ｔであることに留意する。）

【0051】

信頼性パラメータｃ_ｔを与え、正規化係数パラメータを、

【数8】

のように定義する。そして、ＩＭＬは、係数ｗ_ｔを、

【数9】

のように更新する。

【0052】

信頼パラメータ（ＣＰ）に関して、ＩＭＬの記述における唯一のパラメータは信頼パラメータｃ_ｔである。まず、このパラメータを理想的に設定する方法を説明する。ラウドスピーカとマイクロフォンとの間のチャネルは、

【数10】

によって記述することができ、従って、

【数11】

である。ここで、ｚ_ｔは、分散σ_ｚ ^２を持つ加法ガウス雑音を示し、ｕ_ｔは、エンドユーザの信号を示す。まず、近端ユーザが無音であり、

【数12】

である場合を考える。この場合、パラメータｃ_ｔを

【数13】

として設定することが理想的には望ましい。このようにパラメータを設定するには、ｗ^＊にアクセスする必要があるが、これは利用できない。パラメータを設定するための実用的な方法を説明する前に、ＩＭＬを明らかにする２つの極端なケースをレビューした。

【0053】

第１のケースは、

【数14】

に関する。この場合、ミスアライメントエラー

【数15】

は、付加的ノイズが支配的であり、ｃ_ｔは、ｃ_ｔ ^-1をゼロに近い値に設定して、非常に大きくする必要がある。これは、エコーキャンセラが係数の信頼できる推定値を有していない場合、通信セッションの開始時に起こる。

【数16】

の極端な場合には、ＩＭＬが正則化なしに標準ＡＰＡに減少することを示すことができる。より一般的には、このレジームｃ^－１が、正規化ＡＰＡにおける正規化パラメータに類似した役割を果たす。

【0054】

第２のケースは、

【数17】

に関する。この場合、システムはエコーチャネル係数ｗ^＊の良好な推定値を有し、付加雑音が支配的である。この場合、ｃ_ｔは、小さい値に設定され、ＩＭＬは小さいステップサイズでＬＭＳに縮小される。

【0055】

二つの極端なケースは、ＩＭＬがチャネル推定の精度と測定における雑音に関するレベルに依存して、ＡＰＡとＬＭＳの間のスマート適応補間として説明できることを示した。

【0056】

信頼性パラメータの設定に関しては前述のように、理想的にはＩＭＬが時刻tにおけるミスアライメントのパワーに基づいてパラメータｃ_ｔを設定する。しかし、これは実際には利用できない。理想的な選択によってインスパイアされる実用的な代替案は、ｃ_ｔを、

【数18】

としてセットするものである。この実用的な選択は、実験において、うまく機能した。

【0057】

ＭＬＥへのＩＭＬの接続に関して、ＩＭＬとその導出を理解するために、正規化ＡＰＡ(Ｒ-ＡＰＡ)をレビューした。Ｒ－ＡＰＡは、

【数19】

のように係数ｗ_ｔを更新する。

【0058】

ここで、δは、正則化パラメータを示す。

【数20】

行列Ｐ_ｔを、

【数21】

として定義する。

【0059】

【数22】

として開始し、反復ｔにおいて、

【数23】

となる。ここで、

【数24】

である。Ｐ_ｔは、１に等しい固有値

【数25】

と１より厳密に小さい固有値Pとを持つ行列である。このキャラクタリゼーションは、ｗ_ｔ、すなわち、

【数26】

におけるバイアスが、指数関数的速度でゼロに収束することを示している。したがって、近似的に、ｗ_ｔは、

【数27】

としてモデル化することができ、

【数28】

行列Ｍ_ｔは、ｗ_ｔ共分散行列を表す。ここで、

【数29】

および、

【数30】

とすると、ｗ_ｏの最尤推定（ＭＬＥ）は、

【数31】

次のようになる。

【0060】

このＭＬベースの更新ルールを簡素化するために、

【数32】

と仮定する。すると、

【数33】

となる。ここで、

【数34】

である。実際には、σ_ｗ ^２は、

【数35】

として近似することができる。このＭＬベースのアプローチをさらに改善するために、この導出において、過去のP観察が等しく扱われたことに留意されたい。ただし、最新の観測値(ｘ_ｔ，ｙ_ｔ)は、ｗ_ｔの推定に用いられていない新しい観測値である。また、ここでは、Ｍ_ｔは、単に対角行列とする。さらにより良い更新ルールを導出するために、ＩＭＬを使用することが提案され、ＩＭＬは２つのステップ、すなわち、最初に

【数36】

個の過去の観測値に基づいてＭ_ｔを推定すること、および２番目に、導出された推定値Ｍ_ｔと共に最新の観測値を使用して更新することを採用する。

【0061】

ここで、いくつかの実施形態が導入され、検討される。特に、第１の実施形態（実施形態１）および第２の実施形態（実施形態２）について説明する。

【0062】

実施形態１は、音声アクティビティ検出（ＶＡＤ）を介して近端信号に対するロバスト性に対処する。いくつかの音声指向アプリケーションでは、近端信号音声信号がオンまたはオフのいずれかであるランダムプロセスとしてモデル化され得る。各種音声アクティビティ検出方法を使用して、近端音声がオンであるかオフであるかを検出することができる。ハードＶＡＤの場合、音声アクティビティ検出モジュールの出力は、音声アクティビティが検出されたとき、

【数37】

と示すことができ、および、音声アクティビティが検出されなかったとき、

【数38】

と示すことができる。ここで、「ａ」は、アクティビティを示すために使用される。
ソフトＶＡＤでは、ａ^ｔは、音声信号がアクティブである推定確率を反映するために、０（ゼロ）と１（１）との間の任意の値をとることができる。

【0063】

図２は、実施形態１と呼ばれる第１の実施形態の論理フロー図である。図２は、１つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および／または、機能を実行するための相互接続された手段を、例示的な実施形態により示す。図２のブロックは、ＡＥＣ９０および制御モジュール１４０の制御下で、通信装置１１０によって実行されるものとする。

【0064】

ブロック２１０において、通信装置１１０は、ラウドスピーカ（図１のラウドスピーカ信号１１）、マイクロフォン（マイク信号３５）、およびＶＡＤ(近端アクティビティ検出モジュール８０を介して）のための入力信号を受信する。

【0065】

次いで、１つの例示的な実施形態は、以下のように各時刻ステップで動作する（図２も参照）。

【0066】

生の信頼パラメータは、

【数39】

として計算される（ブロック２２０）。音声アクティビティ検出モジュールは値ａ^ｔを提供する。組み合わされた信頼性パラメータは、

【数40】

のように計算される。更新された重みベクトルｗ_ｔ＋１は、ＩＭＬ更新ステップを介して信頼性ｃ_ｔをもって計算される（ブロック２３０）。１つの例では、

【数41】

での更新が、

【数42】

のＩＭＬ更新式の制限として解釈されるという規則を使用する。つまり、ステップサイズがゼロ

【数43】

のＬＭＳ更新と解釈される。これは、ブロック２４０においてエコーフィルタの重みの更新も実行し得る、図１の適応重み更新機能７０によって実行され得る。この更新は、それに応じてエコーキャンセラモジュール５０の応答を変更する。

【0067】

次に、第２の実施の形態である実施の形態２について説明する。この実施形態は、音声アクティビティ検出（ＶＡＤ）を必要とすることなく、近端信号に対するロバスト性を提供する。すなわち、いくつかのアプリケーションでは、音声アクティビティ検出（ＶＡＤ）ユニットが利用可能ではないか、または十分ではない場合がある。例えば、用途によっては、近端信号４５が可変強度を有する連続信号であってもよい。例えば、音楽または他の周囲雑音の場合である。この場合、近端信号が存在する場合でも、変化するチャネルを追跡できることは有益であるが、追跡速度と精度の間の適切なトレードオフが行われる可能性がある。

【0068】

このようなシナリオではエコーキャンセラから出てくるパワーレベルが大きくなると、パワーの増大が近端信号ｕ_ｔの強度の増大によるものであるか、残留エコー

【数44】

の増大によるものであるか、例えば、チャネル応答ｗ^＊の変化によるものであるかを区別することが難しくなる。前者の場合、チャネル応答の変化によるものであるが、強い近端信号が（既に正確である）重みベクトルｗ_ｔを破壊するのを防止するために、低い信頼度でＩＭＬ更新を行うことが望ましい。後者の場合、可能な限り迅速に（不正確である）重みベクトルｗ_ｔを補正するために、高い信頼度でＩＭＬ更新を実行することが望ましい。

【0069】

２つの事例を事前に区別することが困難であるため、本明細書では、両方の行動過程が並行して試みられる方法が提案される。これらの２つのアプローチの結果は頻繁に比較され、その時点で適切な行動は「後知恵」において明確である。エコーキャンセルは通常、低信頼度分岐の結果を出力するが、この分岐が優れた性能を示す場合、高信頼度分岐に切り替わる。このようにして、強い近端信号およびチャネル応答変化に対する速い応答に対してロバスト性が達成される。

【0070】

ここで、このアプローチをより詳細に説明する。図３を参照すると、この図は、例示的な実施形態による、実施形態２と呼ばれる第２の実施形態のＡＥＣ３００のブロック図である。この例では、ＡＥＣ３００が近端アクティビティ検出モジュール８０を含まない。図３において、２つのフィルタ、すなわち、コンサバティブフィルタ３１０および積極的フィルタ３６０が存在する。コンサバティブフィルタ３１０は、係数ｗ_ｔ ⁽¹⁾を有し、それは、参照３２０によって示されるように調整可能であり、マイク信号３５と共に加算器３１５を介して加算後の出力ｅ_ｔ ^（１）を生成する係数を有する。アグレッシブ・フィルタ３６０は、係数ｗ_ｔ ^(２)を有し、それは、参照３７０によって示されるように調整可能であり、
マイク信号３５と共に加算器３８０を介して加算後の出力ｅ_ｔ ^（２）を生成する係数を有する。コンサバティブフィルタ３１０は、ｅ_ｔ ^（１）の出力、ＩＭＬモジュール３２５を有する加算器３１５を有し、アグレッシブフィルタ３６０は、ｅ_ｔ ^（２）の出力およびＩＭＬモジュール３６５を有する加算器３８０を有する。制御装置３４５、いくつかの電力推定器３３０、３４０、および３５０、ならびに周期的同期ブロック３３５がある。電力推定器３５０からの電力の推定に少なくとも基づいて、制御装置３４５はコンサバティブフィルタ３１０およびそのＩＭＬモジュール３２５のための信頼パラメータｃ_ｔ ⁽¹⁾を生成し、アグレッシブフィルタ３６０およびそのＩＭＬモジュール３６５のための信頼パラメータｃ_ｔ ⁽²⁾を生成する。ＩＭＬモジュール３２５、３６５は、適応重み更新機能７０の例である。参照３２０および３７０はエコーキャンセラモジュール５０の例であり、それぞれ、対応するエラー出力ｅ_ｔ ^（１）またはｅ_ｔ ^（２）を生成する。

【0071】

簡単に説明すると、コンサバティブフィルタ３１０はフィルタの重みｗ_ｔ ⁽¹⁾（参照３２０）をラウドスピーカ信号ｘ_ｔに適用し、その結果をマイクロホン信号ｙ_ｔから減算する。ＩＭＬモジュール３２５は、制御装置３４５によって提供される信頼パラメータｃ_ｔ ⁽¹⁾に基づいてフィルタ重みを適応させる。底部の同様の構造はアグレッシブフィルター３６０を実装し、ここで、適応は、信頼パラメータ

【数45】

に基づく。すなわち、アグレッシブフィルタ３６０はフィルタの重みｗ_ｔ ⁽²⁾（参照３７０）をラウドスピーカ信号ｘ_ｔに適用し、その結果をマイクロホン信号ｙ_ｔから減算する。ＩＭＬモジュール３６５は、制御装置３４５によって提供される信頼パラメータｃ_ｔ ⁽²⁾に基づいてフィルタ重みを適応させる。周期的同期モジュール３３５は２つのフィルタの性能を周期的に比較し、より悪い性能のフィルタのパラメータをより良いものパラメータに置き換える。周期同期モジュール３３５は、図５の論理フローを実行する。

【0072】

この例では２つの平行なエコーキャンセルフィルタ３１０、３６０が維持され、これは、ｗ_ｔ ⁽¹⁾を有するコンサバティブフィルタと、ｗ_ｔ ⁽²⁾を有するアグレッシブフィルタとである。
対応するエコーキャンセラ出力は、

【数46】

である。各フィルタの出力電力は、指数平均

【数47】

を介して計算することができる。

【0073】

遠端信号と近端信号は統計的に独立であると仮定し、固定フィルタ係数に対して、出力電力は近端信号電力と残存遠端エコー電力の和である。したがって、一方のフィルタが他方よりも低い出力電力を有する場合（例えば、電力推定器３３０、３４０によって決定されるように）、そのフィルタは、より低い残存遠端エコーを有しなければならず、したがって、より低い出力電力を有するフィルタが好ましい。これは、どの時点で２つの分岐のどちらが好ましいかを決定する方法の一例である。

【0074】

しかしながら、フィルタが継続的に適応されているとき、このアプローチはバイアスされ、補正を必要とする。これは、現在のフィルタｗ_ｔ ^(j)が過去の観測値

【数48】

に依存するためであり、これは通常、現在の観測値(ｙ_ｔ，ｘ_ｔ)と強く相関する。このバイアスを補正するために、イノベーション観測値が計算される。これは、変換された観測値

【数49】

であり、遠端信号

【数50】

は以前の

【数51】

観測値

【数52】

と（ほぼ）直交している。

【0075】

現在の遠端信号ｘ_ｔ、過去の遠端信号Ｕ_ｔ－１、および（例えば、高レベルの）信頼性パラメータｃが与えられると、変換されたラウドスピーカ信号は、

【数53】

のように計算され得る。ここで、

【数54】

の定義が使用される。

【0076】

【数55】

である場合、

【数56】

となり、変換された遠端信号は、直近の過去の遠端信号と直交することを意味する。より一般的には、ｃ^－１が小さい場合、これはほぼ真である。送信されていたであろう仮想の測定値

【数57】

を得るために、

【数58】

が送信されていたならば、係数ｂ_ｔが、

【数59】

であるマイクロホン信号を形成するために使用される。

【0077】

変換プロセスは、

【数60】

と過去の測定値との間の統計的依存性を減少させる。したがって、変換された誤り

【数61】

および対応する変換された出力電力

【数62】

が計算される場合、２つのエコーフィルタｗ_ｔ ⁽¹⁾およびｗ_ｔ ⁽²⁾の品質を比較するためのより信頼性の高い測定が達成される。

【0078】

アグレッシブ・フィルタの信頼パラメータがどのように推定されるかを説明するために、いくつかの表記法および分析も必要である。エコーキャンセラ出力信号は、

【数63】

である。

【0079】

簡単にするために、いくつかの時変ミスアライメントパラメータｍ_ｔについて、

【数64】

と仮定する。ｗ_ｔ、ｘ_ｔ、およびｚ_ｔが、統計的に独立であると仮定すると、

【数65】

のようになる。ここで、

【数66】

は、遠端信号強度を捕捉し、

【数67】

は、近端信号強度である。

【0080】

なお、出力パワーＰ_ｔと遠端信号強度ｓ_ｔは、経験的に観測可能であり、比

【数68】

を形成するために、ｍ_ｔおよびν_ｔを知りたい、ことに留意する。ν_ｔが与えられると、ミスアライメントを、

【数69】

のように計算することができる。ミスアライメントが与えられると、近端信号電源は、

【数70】

のように計算できる。

【0081】

アグレッシブフィルタ３６０については、出力電力は、ミスアライメント項に支配され、近端信号が低いと仮定される。無限信頼推定を防止するために、例示的な実施形態において、ノイズ推定は、出力電力の所与のフラクションεより下に進むことは許されない。ミスアライメントの積極的な推定は、

【数71】

である。

【0082】

この背景を適所に用いて、２つの並列フィルタの例示的な動作が説明される。

【0083】

使用される例示的なパラメータには、
１）メモリ長

【数72】

２）パワーアベレージングステップサイズ

【数73】

３）最小ミスアライメント比

【数74】

４)テスト閾値

【数75】

５)乗算係数

【数76】

６)更新期間Ｔが含まれる。

【0084】

初期化プロセスの１つとして、次のものが考えられる。時刻

【数77】

において、２つのエコーフィルタ３１０、３６０は、同じ値

【数78】

を有する。初期ミスアライメント推定値

【数79】

を設定する。初期変数

【数80】

をすべてゼロに設定する。

【0085】

次に、例示的な一般的な更新プロセスについて説明する。図４（Ａ）および図４（Ｂ）は、実施例２の一般的な更新処理の論理フロー図である。図４は、例示的な実施形態による、１つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および／または機能を実行するための相互接続された手段を示す。図４のブロックは、ＡＥＣ９０および制御モジュール１４０の制御下で、通信装置１１０によって実行されるものとする。

【0086】

ブロック４０５において、通信装置１１０は、ラウドスピーカおよびマイクロフォンから入力信号を受信する。通信装置１１０は、フィルタ出力

【数81】

を計算する。ブロック４１０および４２５を参照されたい。なお、コンサバティブフィルタ３１０に対して

【数82】

、およびアグレッシブフィルタ３６０について、ｊ＝２である。エコーキャンセラ出力を

【数83】

に設定する。これは、出力をコンサバティブフィルタ３１０の出力として設定する。ブロック４１５を参照のこと。

【0087】

遠端の信号強度

【数84】

を更新する。ブロック４３０を参照のこと。

【0088】

ブロック４５５および４３５において、電力レベルは、それぞれ、コンサバティブフィルタおよび積極的フィルタに対して、

【数85】

のように更新される。これらのブロックに対して、それぞれ、電力推定器３３０および３４０を使用する。

【0089】

ブロック４４０において、積極的なミスアライメント推定値は、

【数86】

のように計算され得る。この公式は観測値が与えられたミスアラインメントの上限であり、ｃ_２の以下の式と共に、ＲＦＮＲの上限をもたらす。保守的なミスアラインメントの推定値は、ブロック４６０における

【数87】

のように計算される。この公式は、低い推定値の履歴および積極的な推定値に基づいて、ミスアラインメントの低い推定値を提供する。ｃ_１に対する以下の方程式と共に、これは、ＲＦＮＲについての第１推定値をもたらす。

【0090】

直観的には、比の推定のための合理的に低い値は、ミスアライメント（すなわち、係数の推定における誤差）が過去のミスアライメントと同じであると仮定することに基づき得る。推定値の合理的に低い値を定義する別の方法は積極的な推定値よりも、例えば、１０分の１だけ著しく低いものである。しかし、信頼パラメータの推定値が必ずしも異なるとは限らないことに留意することが重要である。しかし、パフォーマンスにとって重要なことは、それらが時には非常に異なることである。

【0091】

ブロック４６５および４４５では、コンサバティブフィルタおよびアグレッシブフィルタについて、それぞれ、

【数88】

として信頼パラメータ推定値が計算される。「信頼パラメータ」という用語は、システムが測定ｙ_ｔがエコーチャネルについての有用な情報を搬送することをどの程度確信しているかを示すために使用される。

【0092】

測定の信頼性がより高い場合、より大きなステップサイズをとることができる。同様に、測定の信頼性がより低い場合、より小さいステップサイズをとることができる。

【0093】

フィルタｗ_ｔ ^(j)は、信頼パラメータｃ_ｊ、ここで、

【数89】

を用いて、ＩＭＬ方程式を使用して更新される。これは、コンサバティブエコーフィルタの重みが更新されるブロック４７０と、アグレッシブエコーフィルタの重みが更新されるブロック４５０とによって示される。

【0094】

追加の可能なアクションには、次のものがある。

【0095】

マイクロホン信号を形成するために使用する係数を、

【数90】

のように算出する。

【0096】

近端信号強度を、

【数91】

のように算出する。

【0097】

その他の副次的な作業としては、変換された見積もりの更新が含まれる。
１）

【数92】

２）

【数93】

３）

【数94】

４）

【数95】

５）

【数96】

【0098】

（３）における電力レベルについて、これは、指数平均によって得られる、フィルタ出力信号の平均電力レベルの実行中の推定値である。

【0099】

図５を参照して説明される周期的更新ステップもある。図５は、実施例２の定期更新ルールの論理フロー図である。図５は、例示的な実施形態による、１つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および／または機能を実行するための相互接続された手段を示す。図５のブロックは、ＡＥＣ９０および制御モジュール１４０の制御下で、通信装置１１０によって実行されるものとする。

【0100】

ブロック５５０は、図４が何度も繰り返された後に図５が実行され、それによってフィルタの誤り消去性能を繰り返し推定することを示す。周期性を決定する回数について、その例を以下に説明する。

【0101】

定期的に（たとえば、更新期間Tと任意の整数kに対して、

【数97】

の場合）、２つのフィルタが比較され、同期される。図３の周期的同期ブロック３３５も参照されたい。このプロセスは、一定の係数

【数98】

および乗算係数

【数99】

を有することができる。

【0102】

ブロック５０５では、保守的かつ積極的なエコーフィルタ係数、出力電力、およびミスアラインメントがブロック５０５で受信される。ブロック５１０では、アグレッシブフィルタの出力電力がコンサバティブフィルタの出力電力×一定係数よりも小さい場合、通信装置１１０によって決定される。

【数100】

（ブロック５１０＝Ｙｅｓ）の場合、アグレッシブフィルタは、コンサバティブフィルタよりも良好に機能しているとみなされる。

【0103】

これに応じて、以下を実行する。

【0104】

【数101】

を設定する。これは、コンサバティブフィルタの係数（ｃｏｅｆｆｓ）をアグレッシブフィルタの係数（ｃｏｅｆｆｓ）に等しく設定する。ブロック５２０を参照のこと。

【0105】

【数102】

を設定する。すなわち、コンサバティブフィルタの電力レベルは、アグレッシブフィルタの電力レベルと等しく設定される。ブロック５２５を参照のこと。

【0106】

【数103】

を設定する（ミスアライメントの控えめな見積もりを増やす）。これはブロック５３０によって示され、そこではコンサバティブフィルタのミスアラインメントが一定の倍率によって示される。

【0107】

そうでない場合（ブロック５１０＝いいえ）、コンサバティブフィルタが最良であると見なされる。応答で以下を実行する。

【0108】

【数104】

を設定する。これはブロック５３５によって示され、アグレッシブフィルタの係数はコンサバティブフィルタの係数に等しく設定される。

【0109】

【数105】

を設定する。これはブロック５４０において行われ、アグレッシブフィルタの電力レベルはコンサバティブフィルタに等しく設定される。

【0110】

上のブロック５２０および５３５では、悪いフィルタの係数が良好なフィルタの係数に等しく設定される。ただし、これは１つのオプションのみである。ブロック５２１、５３６が示すように、係数は代わりに、他の係数に「より近く」設定されてもよい。例えば、悪いフィルタの係数を、両方のフィルタの係数の平均とすることができる。これは係数をより良いフィルタの係数に近づけるが、より緩やかな方法である。すなわち、「より近い」という用語は、（ベクトルによって記述される各フィルタの係数を考慮して）２つのフィルタの係数間の差のベクトルノルムを減少させるものとして定義することができる。

【0111】

さらに、ブロック５１０において出力電力が使用されるが、代わりに性能が使用されてもよい。ブロック５１１を参照のこと。性能は、より良好な性能を手段するエコーキャンセラのより低い出力電力として決定することができる。他の性能メトリックがあり得、電力出力は、性能の１つの例示的なメトリックである。

【0112】

音声アクティビティ検出を伴わない実施形態の技術的効果を例示するために、エコーキャンセレーションシミュレーションからの性能結果が図６および図７に示されている。このシミュレーションでは、遠端信号は連続音声信号であり、近端信号は断続音声信号に少量のバックグラウンド雑音を加えたものである。エコーチャネルは、単一のラウドスピーカーから単一のマイクロフォンまで、典型的なルームアコースティックエコー応答である。チャネルは通常一定であるが、３つの異なる時刻隔（７～９秒（ｓ）、１４～１６秒、および２６～２８秒）ではチャネルは著しく変化する。

【0113】

図６は、遠端信号、近端信号、および残留エコーの強度を時刻の関数として示す。この図は、ＩＭＬアルゴリズムを実行する２つの並列フィルタによるエコーキャンセレーションを使用した、シミュレートされたＳＩＳＯエコーキャンセレーションシナリオにおける信号電力の進化を示している。参照６１０では、近端信号強度（間欠音声プラス背景雑音）が提示される。参照６２０では、エコー信号強度（近端マイクロフォンで受信されるような音声遠端信号）が提示される。参照６３０では、キャンセル出力における残留エコー信号が提示される。エコーチャネルが変化している時刻隔は、参照６４０によって強調表示される。参照１は、近端信号が高いときにチャネルが変化する場合、近端信号が減少するとすぐに追従が回復することを示している。参照２は、近端信号が低くなったときにチャネルが変化した場合、追従が速く、有効であることを示している。参照３は、チャネルが固定されている場合、残留エコーは近端信号の影響を受けないことを示している。

【0114】

図７は、ミスアライメント

【数106】

の経時変化を示す。参照番号１、２、および３は、図６に関して行ったものと同じであることを示す。アグレッシブフィルタがコンサバティブフィルタよりも選択されるモーメントはこの図において参照番号６５０によって強調され、コンサバティブフィルタは他のすべてのインスタンスにおいて選択される。エコーチャネルが変化している時刻隔は、参照６４０によって強調表示される。図７は、ＩＭＬアルゴリズムを実行する２つの並列フィルタによるエコーキャンセレーションを用いた、図６のシミュレートされたＳＩＳＯエコーキャンセレーションシナリオにおける、正規化されたミスアラインメント

【数107】

の進展を示す。

【0115】

近端信号が低い期間では、ミスアライメントと残留エコーが急激に減少する。たとえば、時刻０ｓ(ゼロ秒）近辺と時刻１７ｓである。これらの期間において、アルゴリズムはアグレッシブフィルタを正しく使用しており、高信頼度パラメータでＩＭＬを実行している。近端信号が強く、チャネルがスタティックの場合、エコーチャネルの精度は保たれる。たとえば、１～５秒と２０～２５秒の間隔で設定する。これらの期間では、アルゴリズムがコンサバティブフィルタを正しく使用し、低信頼度パラメータでＩＭＬを実行する。チャネルを変更すると、ミスアラインメントが一時的に大きくなる。チャネル変化が低近端アクティビティ（参照２６～２８ｓ）の期間中に発生するとき、フィルタは、低残留エコーを維持するのに十分に迅速に適応することができる。高い近端アクティビティ（ｃｆ７－９ｓ）の期間中にチャネル変更が発生すると、新しいエコーチャネルを学習するために、フィルタは必然的に近端信号の中断を待たなければならない。

【0116】

この例は、２つの並列分岐においてＩＭＬ更新アルゴリズムを実装したエコーキャンセラが迅速な追跡、低残留エコー、近端信号に対するロバスト性、および低複雑性を達成できる方法を例示した。

【0117】

まとめると、例示的な実施形態のうちのいくつかは、以下の利点および技術的効果のうちの１つ以上を有し得る。
１)ＩＭＬは測定値の信頼度が高いときに、最新のＰ測定値からの情報を完全に活用するから、（ＡＰＡ、ＲＬＳのよう）残留誤差が高いときの高速収束、
２)測定値の信頼性が低い場合、ＩＭＬは近端信号からの変動を平均化するので、（小ステップＬＭＳのように）小型漸近残差誤差、
３)信頼性パラメータの最適設定の理論的理解による、ＶＡＤ(実施形態１）を使用するか、またはＶＡＤを使用しない（実施形態２）、近端活動への自動適応、
４）ＩＭＬはＡＰＡと同じ計算フレームワークを使用するため、計算量が少なくなる（フィルタ長がリニア）。

【0118】

いくつかの実施形態では、エコーキャンセルがフィルタバンクを使用して実行され得、マイクロフォン信号およびラウドスピーカ信号は複数のサブバンド配列を生成するために相補的な通過帯域を有する２つ以上の平行なフィルタを通過し、エコーキャンセルは各サブバンド内で独立して平行なに実行され、各サブバンド内のエコーキャンセルの出力は時刻領域において最終出力配列を生成するために合成される。この場合、前述の例は、各サブバンド内のシーケンス上で直接使用することができる。

【0119】

ある実施形態では離散フーリエ変換（ＤＦＴ）に基づくフィルタバンクを使用する場合、または搬送波変調信号に対してベースバンド表現を使用する場合などに、ラウドスピーカおよびマイクロホン信号、および推定チャネル係数は実数値ではなく複素値として表されてもよい。前述の式は当業者には明らかであるように、複雑な場合に自然に拡張される。例えば、前述のα_ｔ（正規化係数パラメータ）および段落のｗ_ｔ＋１の式は、

【数108】

の式に置き換えられる。ここで、Ａ^Ｈは、複素行列またはベクトルＡのエルミート転置を表す。

【0120】

図８を参照すると、この図は、制御パラメータを使用した音響エコーキャンセレーションのための論理フロー図である。この図はまた、例示的な実施形態による、例示的な１つ以上の方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータプログラム命令の実行の結果、ハードウエア内に実装されたロジックによって実行される機能、および／または機能を実行するための相互接続された手段を示す。この図は、通信装置１１０がＡＥＣ９０を用いて行うものとする。

【0121】

ブロック８１０において、１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するための動作が実行される。１台以上のラウドスピーカーが遠端信号を再生した。

【0122】

ブロック８２０において、１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するために、少なくとも部分的に少なくとも１つのフィルタを用いて、適応エコーキャンセルシステムを動作させる動作が実行される。ブロック８３０において、構成可能であり、値の範囲から少なくとも１つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータの判定が行われる。少なくとも１つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度と、近端信号の特性とを推定することに基づく。

【0123】

ブロック８４０では、適応エコーキャンセルシステムによって制御動作が行われ、
少なくとも１つの制御パラメータの異なる値を有する少なくとも１つのフィルタを異なる時点で制御する。

【0124】

ここで、追加の実施例を提示する。

【0125】

例２.
図８の例の方法であって、少なくとも１つのフィルタは、第１フィルタと第２フィルタとを備え、前記第１フィルタの上で第１時刻に使用される前記異なる値のうちの１つの値が、前記第２フィルタの上で前記第１時刻に使用される前記異なる値の別の値とは異なる、方法。

【0126】

例３.
前記少なくとも１つのフィルタを、異なる時刻において、前記少なくとも１つの制御パラメータの異なる値を用いて、制御する前記ステップは、音響チャネルの係数の前記対応する推定値の変化率に影響を及ぼす、対応する第１および第２のそれぞれの制御パラメータの異なる値で、前記第１フィルタおよび第２フィルタを制御するステップと、前記第１フィルタのための前記第１制御パラメータセットの値が、前記第２フィルタに対する前記第２制御パラメータセットの値によって引き起こされる変化率よりも遅い速度で前記チャネル係数推定値を変化させる、ステップと、反復して、前記第１および第２フィルタの誤差キャンセル性能を推定するステップと、前記反復推定後に、より低い性能を有すると推定される前記第１または第２フィルタの係数を、前記第１または第２フィルタの係数がより高い性能を有すると推定された前記第１または第２フィルタの他方の係数に近づくように、ように更新するステップと、をさらに含む、例２に記載の方法。

【0127】

例４.
前記更新するステップは、より低い性能を有すると推定された前記第１または第２フィルタの前記係数を、より高い性能を有すると推定された前記第１または第２フィルタの前記他方の係数と等しいように更新することをさらに備える、例３に記載の方法。

【0128】

例５.
前記性能は、出力電力によって特徴付けられる、例３に記載の方法。

【0129】

例６.
前記少なくとも２つのフィルタの前記第１フィルタおよび前記第２フィルタを、対応する第１および第２のそれぞれの制御パラメータの異なる値で制御するステップは、残存遠端／近端比の２つの推定値の決定するステップであって、前記第１推定値および第２推定値の過去の履歴に基づく残存遠端から近端への比の第１推定値であって、前記第１推定値は比の合理的に低い値であるとして選択され、前記第２推定値は、前記１つ以上のマイクロフォンからの信号および前記遠端信号の観測に基づいて、上限が最高値として選択され得る、前記残存遠端対近端比の上限である、ステップと、前記第１適応フィルタの第１信頼パラメータを前記第１推定値に設定するステップと、前記第２適応フィルタの第２信頼パラメータを前記第２推定値に設定するステップと、さらに含む、例３に記載の方法。

【0130】

例７.
前記第１推定値は、比の合理的に低い値であるとして、前記第２推定値よりも係数が著しく低いとして選択される、例６に記載の方法。

【0131】

例８.
より低い性能を有すると推定される前記第１または第２フィルタの推定電力レベルを、より高い性能を有すると推定された前記第１または第２フィルタの他方の前記電力レベルに等しいように設定するステップを更に含む、例３に記載の方法。

【0132】

例９.
前記第１フィルタより低い性能を有すると推定される前記第２フィルタに応答して、前記第１フィルタの推定ミスアライメントを増加するステップを更に含む、例３に記載の方法。

【0133】

例１０.
前記第１フィルタの前記推定されたミスアラインメントを増加するステップは、
コンスタントな増殖の要因によって前記第１フィルタの前記推定されたミスアラインメントを増加するステップをさらに含む、例９に記載の方法。

【0134】

例１１.
前記近端信号の特性は、前記近端信号の信号強度を含む、図８の例の方法。

【0135】

例１２.
前記信号強度は、前記近端信号の平均電力によって特徴付けられる、例１１に記載の方法。

【0136】

例１３.
少なくとも１つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値の誤差の測度の比を推定することに基づく、図８に記載の例の方法。

【0137】

例１４.
第１時刻に使用される異なる値の第１値が、第２時刻に使用される異なる値の第２値とは異なる、図８の例の方法。

【0138】

例１５.
コンピュータプログラムがコンピュータ上で実行されるとき、例１ないし１４のいずれかの方法を実行するためのコードを含む、コンピュータプログラム。

【0139】

例１６.
前記コンピュータプログラムは、前記コンピュータと共に使用するために、そこに具体化されたコンピュータプログラムコードを含むコンピュータ可読媒体を含むコンピュータプログラム製品である、例１５に記載のコンピュータプログラム。

【0140】

例１７.
前記コンピュータプログラムは、前記コンピュータの内部メモリに直接ロード可能である、例１５に記載のコンピュータプログラム。

【0141】

例１８.
１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するステップであって、１つ以上のラウドスピーカが遠端信号を再生する、ステップと、
１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも１つのフィルタで適応エコーキャンセルシステムを動作させるステップと、
構成可能であり、かつ値の範囲から少なくとも１つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定するステップであって、前記決定するステップは、音響チャネルの係数の推定値の精度および近端信号の特性の推定値を推定するステップに基づいており、前記適応エコーキャンセルシステムによって、少なくとも１つの制御パラメータの異なる値を少なくとも異なる時点で有する前記少なくとも１つのフィルタを制御するステップと、
を実行するための手段を含む、双方向音声通信のエコーキャンセルのための装置。

【0142】

例１９.
少なくとも１つのフィルタが第１フィルタと第２フィルタとを備え、第１フィルタの上で第１時刻に使用される異なる値のうちの１つの値が第２フィルタの上で第１時刻に使用される異なる値の別の値と異なる、例１５に記載の装置。

【0143】

例２０.
前記少なくとも１つのフィルタを前記少なくとも１つの制御パラメータの異なる値で異なる時刻に制御することは、対応する第１および第２のそれぞれの制御パラメータの異なる値で第１フィルタおよび第２フィルタを制御することであって、音響チャネルの係数の対応する推定値の変化率に影響を及ぼし、第１フィルタのための第１制御パラメータセットの値が、第２フィルタのための第２制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、制御することと、第１および第２フィルタの誤差キャンセル性能を繰り返し推定することと、繰り返し推定した後に、第１または第２フィルタの係数がより高い性能を有すると推定された第１または第２フィルタの他方の係数に近づくように、より低い性能を有すると推定された第１または第２フィルタの係数を更新することと、をさらに備える、例１６に記載の装置。

【0144】

例２１.
前記更新するステップは、より低い性能を有すると推定される前記第１または第２フィルタの係数を、より高い性能を有すると推定される前記第１または第２フィルタの他の係数に等しいと推定されるように更新するステップをさらに含む、例１７に記載の装置。

【0145】

例２２.
性能が出力電力によって特徴付けられる、例１７に記載の装置。

【0146】

例２３.
前記少なくとも２つのフィルタの前記第１フィルタおよび前記第２フィルタを、対応する第１および第２のそれぞれの制御パラメータの異なる値で制御するステップは、
残存遠端／近端比の２つの推定値、第１推定値および第２推定値の過去の履歴に基づく残存遠端対近端比の第１推定値であって、その比の合理的に低い値であるとして選択される第１推定値を決定するステップであって、１つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択される、残存遠端対近端比の上限である、第２推定値とステップと、
第１適応フィルタの第１信頼パラメータを第１推定値に設定するステップと、
第２適応フィルタの第２信頼パラメータを第２推定値に設定するステップと、
をさらに備える、例１７に記載の装置。

【0147】

例２４.
前記第１推定値は、前記比の合理的に低い値として、前記第２推定値よりも有意に低い値として選択される、例２０に記載の装置。

【0148】

例２５.
前記手段は、より低い性能を有すると推定される前記第１または第２フィルタの推定電力レベルを、より高い性能を有すると推定される前記第１または第２フィルタの他方の前記電力レベルに等しくなるように設定するステップを実行するようにさらに構成される、例１７に記載の装置。

【0149】

例２６.
前記手段は、前記第２フィルタが前記第１フィルタよりも低い性能を有すると推定されることに応じて、前記第１フィルタの推定ミスアライメントを増加させることを実行するようにさらに構成される、例１７に記載の機器。

【0150】

例２７.
前記第１フィルタの推定ミスアラインメントを増加させることは、前記第１フィルタの推定ミスアラインメントを一定の倍率だけ増加させることを更に含む、例２３に記載の装置。

【0151】

例２８.
近端信号の特性が、近端信号の信号強度を含む、例１５に記載の装置。

【0152】

例２９.
前記信号強度が、前記近端信号の平均電力によって特徴付けられる、例２５に記載の装置。

【0153】

例３０.
少なくとも１つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値における誤差の測度の比を推定することに基づく、例１５に記載の装置。

【0154】

例３１.
第１時刻に使用される前記異なる値の第１値は、第２時刻に使用される前記異なる値の第２値とは異なる、例１５に記載の装置。

【0155】

例３２.
前記手段は、少なくとも１つのプロセッサ、および少なくとも１つのプロセッサを含む少なくとも１つのメモリを備え、少なくとも１つのメモリおよびコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置の実行をさせる、例１ないし３１のいずれか１例に記載の装置。

【0156】

例３３.
１つ以上のプロセッサとコンピュータプログラムコードを含む１つ以上のメモリと、を備える、双方向オーディオ通信のエコーキャンセルのための装置であって、前記１つ以上のメモリおよび前記コンピュータプログラムコードは、前記１つ以上のプロセッサを用いて、前記装置に、
１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に、近端信号、および、１つ以上のラウドスピーカが再生した再生遠端信号に基づくオーディオ信号を受信させ、
１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも１つのフィルタで、適応エコーキャンセルシステムを動作させ、
構成可能であり、かつ値の範囲から少なくとも１つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定させ、ここで、前記決定することは、音響チャネルの係数の推定値の精度および近端信号の特性の推定値を推定するステップに基づいており、
適応エコーキャンセルシステムによって、少なくとも１つの制御パラメータの異なる値を少なくとも異なる時点で有する少なくとも１つのフィルタを制御させる
ように構成される、装置。

【0157】

例３４.
少なくとも１つのフィルタが第１フィルタと第２フィルタとを備え、第１フィルタの上で第１時刻に使用される異なる値のうちの１つの値が第２フィルタの上で第１時刻に使用される異なる値の別の値と異なる、例３３に記載の装置。

【0158】

例３５.
前記少なくとも１つのフィルタを前記少なくとも１つの制御パラメータの異なる値で異なる時刻に制御することは、
音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第１および第２のそれぞれの制御パラメータの異なる値で第１フィルタおよび第２フィルタを制御することであって、第１フィルタのための第１制御パラメータセットの値が、第２フィルタのための第２制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、ことと、
第１および第２フィルタの誤差キャンセル性能を繰り返し推定することと、
繰り返し推定した後に、第１または第２フィルタの係数が、より高い性能を有すると推定された第１または第２フィルタの他方の係数に近づくように、より低い性能を有すると推定された第１または第２フィルタの係数を更新することと、
をさらに備える、例３４に記載の装置。

【0159】

例３６.
前記更新するステップは、より低い性能を有すると推定される前記第１または第２フィルタの係数を、より高い性能を有すると推定される前記第１または第２フィルタの他の係数に等しいと推定されるように更新するステップをさらに含む、例３５に記載の装置。

【0160】

例３７.
前記性能が出力電力によって特徴付けられる、例３５に記載の装置。

【0161】

例３８.
前記少なくとも２つのフィルタの前記第１フィルタおよび前記第２フィルタを、対応する第１および第２のそれぞれの制御パラメータの異なる値で制御するステップは、
第１推定値および第２推定値の過去の履歴に基づく残存遠端対近端比の第１推定値であって、その比の合理的に低い値であるとして選択される第１推定値と、１つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択される、残存遠端対近端比の上限である、第２推定値との、残存遠端から近端比の２つの推定値を決定するステップと、
第１適応フィルタの第１信頼パラメータを第１推定値に設定するステップと、
第２適応フィルタの第２信頼パラメータを第２推定値に設定するステップと、
をさらに備える、例３５に記載の装置。

【0162】

例３９.
前記第１推定値は、前記比の合理的に低い値であるとして選択され、前記比は前記第２推定値よりも有意に低い、例３８に記載の装置。

【0163】

例４０.
前記１つ以上のメモリおよび前記コンピュータプログラムコードは、前記１つ以上のプロセッサを用いて、前記装置に、より高い性能を有すると推定される前記第１または第２フィルタのうちの他方の電力レベルに等しいより低い性能を有すると推定される前記第１または第２フィルタの推定電力レベルを設定させるようにさらに構成される、例３５に記載の装置。

【0164】

例４１.
前記１つ以上のメモリおよび前記コンピュータプログラムコードは、前記１つ以上のプロセッサを用いて、前記装置に前記第２フィルタが前記第１フィルタよりも低い性能を有すると推定されることに応答して、前記第１フィルタの推定されたミスアライメントを増加させるようにさらに構成される、例３５に記載の装置。

【0165】

例４２.
前記第１フィルタの推定ミスアラインメントを増加させることは、前記第１フィルタの推定ミスアラインメントを一定の倍率だけ増加させることを更に含む、例４１に記載の装置。

【0166】

例４３.
近端信号の特性が、近端信号の信号強度を含む、例３３に記載の装置。

【0167】

例４４.
前記信号強度が、前記近端信号の平均電力によって特徴付けられる、例４３に記載の装置。

【0168】

例４５.
少なくとも１つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値の誤差の測度の比を推定することに基づく、例３３に記載の装置。

【0169】

例４６.
第１時刻に使用される前記異なる値の第１値は、第２時刻に使用される前記異なる値の第２値とは異なる、例３３に記載の装置。

【0170】

例４７.
コンピュータと共に使用するためにその中に具体化されたコンピュータプログラムコードを有するコンピュータ可読記憶媒体を含むコンピュータプログラム製品であって、前記コンピュータプログラムコードは、
１つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するためのコードであって、１つ以上のラウドスピーカが遠端信号を再生した、コードと、
１つ以上のラウドスピーカから１つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように少なくとも部分的に少なくとも１つのフィルタで適応エコーキャンセルシステムを動作させるためのコードと、
構成可能であり、値の範囲から少なくとも１つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも１つの制御パラメータを決定するためのコードであって、少なくとも１つの制御パラメータを決定することは、音響チャネルの係数の推定の精度および近端信号の特性を推定することに基づく、コードと、
適応エコーキャンセルシステムによって、少なくとも１つの制御パラメータの異なる値を有する少なくとも１つのフィルタを異なる時刻に制御するためのコードと、
を含む、コンピュータプログラム製品。

【0171】

本出願で使用される場合、「回路」という用語は、以下のうちの１つ以上またはすべてを指し得る。
(ａ)ハードウェアのみの回路実装（アナログおよび／またはデジタル回路のみの実装など）、および、
(ｂ)（適用可能な)
(ｉ)アナログおよび／またはデジタルハードウェア回路とソフトウェア／ファームウェアとの組み合わせ、および
（ｉｉ）ハードウェアプロセッサの任意の部分とソフトウェア（デジタル信号プロセッサを含む）、ソフトウェア、およびメモリとの組み合わせであって、携帯電話またはサーバなどの装置に様々な機能を実行させるように協働する組み合わせ、などのハードウェア回路とソフトウェアの組み合わせ、および、
(ｃ)動作のためにソフトウェア（例えば、ファームウェア）を必要とするが、動作のために必要とされないときにはソフトウェアが存在しなくてもよい、マイクロプロセッサまたはマイクロプロセッサの一部などのハードウェア回路および／またはプロセッサ。

【0172】

回路のこの定義は、任意の特許請求の範囲を含む、本出願におけるこの用語の全ての使用に適用される。さらなる例として、本出願で使用されるように、回路という用語は、単にハードウェア回路もしくはプロセッサ（または複数のプロセッサ）、またはハードウェア回路もしくはプロセッサの一部、およびそれ（またはそれらの）付随するソフトウェアおよび／またはファームウェアの実装も包含する。回路という用語は例えば、特定の請求項要素に適用可能な場合、サーバ、セルラーネットワークデバイス、または他のコンピューティングもしくはネットワークデバイスにおけるモバイルデバイスまたは同様の集積回路のためのベースバンド集積回路またはプロセッサ集積回路も包含する。

【0173】

本明細書の実施形態は、ソフトウェア（１つ以上のプロセッサによって実行される）、ハードウェア（たとえば、特定用途向け集積回路）、またはソフトウェアとハードウェアとの組合せで実装され得る。例示的な実施形態ではソフトウェア（たとえば、アプリケーションロジック、命令セット）は様々な従来のコンピュータ可読媒体のうちのいずれか１つ上に維持される。本明細書の文脈では、「コンピュータ可読媒体」が、例えば図１Ａに記載され描かれたコンピュータの一例を有する、コンピュータなどの命令実行システム、機器、または装置によって、またはそれらと関連して使用するための命令を含む、記憶する、通信する、伝播する、または移送することができる任意の媒体または手段であり得る。コンピュータ可読媒体は、コンピュータなどの命令実行システム、機器、またはデバイスによって、またはそれらと関連して使用するための命令を含む、記憶する、および／または移送することができる任意の媒体または手段であり得るコンピュータ可読記憶媒体（たとえば、メモリ１２５または他のデバイス）を備えることができる。コンピュータ可読記憶媒体は、伝搬信号を含まない。

【0174】

必要に応じて、本明細書で論じられる異なる機能は、異なる順序で、および／または互いに同時に実行され得る。さらに、必要に応じて、上述の機能のうちの１つ以上は、任意選択であってもよく、または組み合わせられてもよい。

【0175】

本発明の様々な態様が独立請求項に記載されているが、本発明の他の態様は記載された実施形態および／または従属請求項からの特徴と独立請求項の特徴との他の組み合わせを含み、請求項に明示的に記載されている組み合わせのみを含むものではない。

【0176】

また、本明細書では上記は本発明の例示的な実施形態を説明しているが、これらの説明は限定的な意味で見られるべきではないことに留意されたい。むしろ、添付の特許請求の範囲に定義される本発明の範囲から逸脱することなくなされ得るいくつかの変形および修正がある。

【0177】

明細書および／または図面において見られ得る以下の略語は、以下のように定義される。

【0178】

５Ｇ：第５世代（fifth generation）
ＡＥＣ：音響エコーキャンセルまたは音響エコーキャンセラ（Acoustic Echo Cancellation or Acoustic Echo Canceller）
ＡＰＡ：アフィン投影アルゴリズム（Affine Projection Algorithm）
ｃｆ：比較する（compare）
ｃｏｅｆｆｓ：係数（coefficients）
ＣＰ：信頼性パラメータ（Confidence Parameter）
ＩＭＬ：増分最大尤度（Incremental Maximum Likelihood）
ＪＯ－ＮＬＭＳ：ジョイント最適化正規化最小二乗平均値（Jointly Optimized Normalized Least Mean Square）
ＬＭＳ：最小二乗平均（Least Mean Square）
マイク：マイクロホン（microphone）
ＭＩＭＯ：複数入力、複数出力（Multiple Input, Multiple Output）
ＭＩＳＯ：複数入力、単一出力（Multiple Input, Single Output）
ＭＬＥ：最大尤度推定（Maximum Likelihood Estimation）
ＮＬＭＳ：正規化最小二乗平均（Normalized Least Mean Square）
ＮＰ-ＮＬＭＳ：ノンパラメトリック正規化最小平均平方（Non-parametric Normalized Least Mean Square）
Ｒ－ＡＰＡ：正規化アフィン投影アルゴリズム（Regularized Affine Projection Algorithm）
ＲＦＮＲ：残存遠端近端比（Residual Far-end to Near-end Ratio）
ＲＬＳ：再帰最小二乗法（Residual Far-end to Near-end Ratio）
ｓ：秒（seconds）
ＳＩＳＯ：単一入力、単一出力（Single Input, Single Output）
ＶＡＤ：ボイス活動の検出（Voice Activity Detection）
ＷＯＬＡ：重み付き重複加算（Weighted Overlap-Add）

【図1】