(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】制御パラメータを用いた音響エコーキャンセル
(51)【国際特許分類】
H04R 3/02 20060101AFI20241111BHJP
H04B 3/23 20060101ALI20241111BHJP
【FI】
H04R3/02
H04B3/23
【外国語出願】
(21)【出願番号】P 2022121401
(22)【出願日】2022-07-29
【審査請求日】2022-12-02
(32)【優先日】2021-08-04
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】515076873
【氏名又は名称】ノキア テクノロジーズ オサケユイチア
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100141162
【氏名又は名称】森 啓
(72)【発明者】
【氏名】カール ヌズマン
(72)【発明者】
【氏名】シリン ジャラリ
【審査官】渡邊 正宏
(56)【参考文献】
【文献】特開2004-349806(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/0208
H04B 1/76- 3/44
H04B 3/50- 3/60
H04B 7/00-7/015
H04M 1/60
H04M 9/08
H04R 3/00- 3/14
(57)【特許請求の範囲】
【請求項1】
双方向オーディオ通信のエコーキャンセルのための方法であって、
1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生された遠端信号に基づくオーディオ信号を受信するステップであって、1つ以上のラウドスピーカは、前記遠端信号を再生する、ステップと、
前記1つ以上のラウドスピーカから前記1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に、少なくとも
2つのフィルタで前記適応エコーキャンセルシステムを動作させるステップと、
値の範囲から、構成可能であり、かつ、少なくとも1つの値に設定される前記適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定するステップであって、少なくとも1つの制御パラメータを決定する該ステップは、前記音響チャネルの係数の前記推定値の精度を推定すること、および前記近端信号の特性に基づいている、ステップと、
前記適応エコーキャンセルシステムによって、異なる時点において前記少なくとも1つの制御パラメータの異なる値の前記少なくとも
2つのフィルタを制御するステップ、
を含む方法
であって、
第1フィルタの上で使用される前記異なる値のうちの1つの値は、前記2つのフィルタの第2フィルタの上で使用される前記異なる値の別の値とは異なる、
方法。
【請求項2】
前記少なくとも
2つのフィルタを、異なる時刻において、前記少なくとも1つの制御パラメータの異なる値を用いて、制御する前記ステップは、前記音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第1および第2のそれぞれの制御パラメータの異なる値で前記第1フィルタおよび第2フィルタを制御するステップであって、前記第1フィルタのための第1制御パラメータセットの値が、前記第2フィルタに対する第2制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、ステップと、
前記第1および第2フィルタの誤差キャンセル性能を推定するステップと、
該誤差キャンセル性能の推定の後に、より低い性能を有すると推定された前記第1または第2フィルタの係数を、より高い性能を有すると推定された前記第1または第2フィルタの他方の係数に近づけるように更新するステップと、
を、さらに含む、請求項
1に記載の方法。
【請求項3】
前記更新するステップは、より低い性能を有すると推定された前記第1または第2フィルタの前記係数を、より高い性能を有すると推定された前記第1または第2フィルタの前記他方の係数と少なくとも実質的に等しいように更新するステップをさらに備える、請求項
2に記載の方法。
【請求項4】
前記少なくとも2つのフィルタの前記第1フィルタおよび前記第2フィルタを、対応する第1および第2のそれぞれの制御パラメータの異なる値を用いて制御するステップは、
さらに、残存遠端対近端比の2つの推定値、第1推定値および第2推定値の過去の履歴に基づく残存遠端から近端への比の第1推定値であって、前記比の低い値であるとして選択される前記第1推定値と、前記1つ以上のマイクロフォンからの信号および前記遠端信号の観測に基づいて、上限が最高値として選択され、前記残存遠端対近端比の上限である前記第2推定値と、を決定するステップと、
第1適応フィルタの第1信頼パラメータを前記第1推定値に設定するステップと、
第2適応フィルタの第2信頼パラメータを前記第2推定値に設定するステップと、
を含む、請求項
2に記載の方法。
【請求項5】
より低い性能を有すると推定される前記第1または第2フィルタの推定
電力レベルを、より高い性能を有すると推定される前記第1または第2フィルタの前記他方の
電力レベルと実質的に等しくなるように設定するステップと、
前記第1フィルタより低い性能を有すると推定される前記第2フィルタに応答して、前記第1フィルタの推定ミスアライメントを増加させるステップと、
のうちの少なくとも1つをさらに含む、請求項
2に記載の方法。
【請求項6】
前記第1フィルタの前記推定されたミスアラインメントを増加するステップは、コンスタントな増殖の要因によって前記第1フィルタの前記推定されたミスアラインメントを増加するステップを更に含む、請求項
5に記載の方法。
【請求項7】
前記近端信号の特性は、前記近端信号の信号強度を含む、請求項1に記載の方法。
【請求項8】
少なくとも1つの制御パラメータを決定する前記ステップは、前記近端信号の強度の測度に対する、前記音響チャネルの前記係数の前記推定における誤差の測度の比を推定することに基づく、請求項1に記載の方法。
【請求項9】
第1時刻に使用される前記異なる値の第1値は、第2時刻に使用される前記異なる値の第2値とは異なる、請求項1に記載の方法。
【請求項10】
双方向オーディオ通信のエコーキャンセルのための装置であって、該装置は、1つ以上のプロセッサと、コンピュータプログラムコードを含む1つ以上のメモリと、を備え、
前記1つ以上のメモリおよび前記コンピュータプログラムコードは、前記1つ以上のプロセッサを用いて、前記装置に、1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に、近端信号および再生された遠端信号に基づくオーディオ信号を受信させ、ここで、1つ以上のラウドスピーカが前記遠端信号を再生したのであり、
前記1つ以上のラウドスピーカから前記1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に、少なくとも
2つのフィルタを用いて、前記適応エコーキャンセルシステムを動作させ、
値の範囲から少なくとも1つの値に構成可能であり、かつ、設定される前記適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定させ、ここで、少なくとも1つの制御パラメータを前記決定することは、前記音響チャネルの係数の推定値の精度の前記推定値および前記近端信号の特性を推定することに基づいており、
前記適応エコーキャンセルシステムによって、異なる時点で、前記少なくとも1つの制御パラメータの異なる値を有する前記少なくとも
2つのフィルタを制御させる
ように構成される、装置
であって、
第1フィルタの上で使用される前記異なる値のうちの1つの値は、前記2つのフィルタの第2フィルタの上で使用される前記異なる値の別の値とは異なる、
装置。
【請求項11】
前記少なくとも1つの制御パラメータの異なる値で、異なる時刻に前記少なくとも
2つのフィルタを前記制御することは、
前記音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第1および第2のそれぞれの制御パラメータの異なる値で前記第1フィルタおよび第2フィルタを制御することと、ここで、前記第1フィルタのための第1制御パラメータセットの値が、前記第2フィルタのための第2制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させ、
前記第1および第2フィルタの誤差キャンセル性能を繰り返し推定することと、
前記繰り返し推定の後に、前記第1または第2フィルタの係数がより高い性能を有すると推定された前記第1または第2フィルタの他方の係数に近づくように、より低い性能を有すると推定された前記第1または第2フィルタの係数を更新することと、
をさらに備える、
請求項
10に記載の装置。
【請求項12】
前記更新することは、より低い性能を有すると推定された前記第1または第2フィルタの前記係数を、より高い性能を有すると推定された前記第1または第2フィルタの他方の係数と少なくとも実質的に等しいように更新することをさらに備える、請求項
11に記載の装置。
【請求項13】
前記少なくとも2つのフィルタの前記第1フィルタおよび前記第2フィルタを、対応する第1および第2のそれぞれの制御パラメータの異なる値で制御するステップは、
残存遠端対近端比の2つの推定値の決定するステップであって、第1推定値および第2推定値の過去の履歴に基づく残存遠端から近端への比の第1推定値であって、前記第1推定値は比の低い値であるとして選択され、前記第2推定値は、前記1つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択され得る、前記残存遠端対近端比の上限である、ステップと、
第1適応フィルタの第1信頼パラメータを第1推定値に設定するステップと、
第2適応フィルタの第2信頼パラメータを前記第2推定値に設定するステップと、
をさらに含む、
請求項11に記載の装置。
【請求項14】
前記第1推定値は、前記第2推定値よりも係数が著しく低い前記比の低い値として選択される、請求項
13に記載の装置。
【請求項15】
前記1つ以上のメモリおよび前記コンピュータプログラムコードは、前記1つ以上のプロセッサを用いて、前記装置に、
より低い性能を有すると推定される前記第1または第2フィルタの推定電力レベルを、より高い性能を有すると推定される前記第1または第2フィルタの他方の電力レベルに実質的に等しいように設定するステップと、
前記第1フィルタより低い性能を有すると推定される前記第2フィルタに応答して、前記第1フィルタの推定ミスアライメントを増加するステップと
のうちの少なくとも1つを実行させるようにさらに構成される、
請求項
11に記載の装置。
【請求項16】
前記近端信号の特性が、前記近端信号の信号強度を含む、請求項
10に記載の装置。
【請求項17】
少なくとも1つの制御パラメータを前記決定することは、前記近端信号の強度の測度に対する、前記音響チャネルの前記係数の前記推定における誤差の測度の比を推定することに基づく、請求項
10に記載の装置。
【請求項18】
第1時刻に使用される前記異なる値の第1値は、第2時刻に使用される前記異なる値の第2値とは異なる、請求項
10に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書の例示的な実施形態は概して、音響エコーキャンセル(AEC)に関し、より具体的には、最大尤度(ML)技法を使用してAECを実行するためのプロセスおよび装置に関する。
【背景技術】
【0002】
双方向オーディオシステムでは、多くの場合、「遠端」と「近端」がある。1つの部屋にいる人が、ビデオ会議を介して別の場所にいる同僚と話すことを考える。部屋は「近端」(人に対する)であると考えられ、同僚との場所は「遠端」であると考えられる。
【0003】
ラウドスピーカーとマイクロフォンが近端部で物理的に隔離されていない(ラウドスピーカーフォンや会議室など)あらゆる双方向オーディオシステムでは、ラウドスピーカーによって生成された遠端信号がマイクロフォンを介して遠端部にフィードバックされないようにするために、エコーキャンセレーションが必要である。そのようなシステムは今日すでに広く使用されているが、空間的オーディオおよび没入型経験を含む新しい使用事例は技術的問題をより困難にする。
【0004】
音響エコーキャンセルシステムの望ましい特性は、
1)遠端信号が強く相関していても、急速に変化する物理的環境を追跡する能力、
2)収束後の非常に低い残留エコー、
3)断続的な強い近端信号の存在に対するロバスト性、および
4)許容可能な複雑さ(例えば、除去フィルタの長さがリニア)
の1つ以上を含む。
【発明の概要】
【0005】
このセクションは例を含むことを意図しており、限定することを意図していない。
【0006】
例示的な実施形態では、1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信することを含む、双方向オーディオ通信のエコーキャンセルのための方法が開示される。遠端信号を再生する1つ以上のラウドスピーカにおいて、本願方法は、1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも1つのフィルタを用いて、適応エコーキャンセルシステムを動作させることを含む。本方法はまた、値の範囲から、構成可能であり、少なくとも1つの値に設定される、適応エコーキャンセルシステムの動作に影響を与える少なくとも1つの制御パラメータを決定することを含む。少なくとも1つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度と、近端信号の特性とを推定することに基づく。本方法は、適応エコーキャンセルシステムによって、少なくとも1つの制御パラメータの異なる値を有する少なくとも1つのフィルタを異なる時刻に制御することを含む。
【0007】
追加の例示的実施形態は、コンピュータプログラムがプロセッサ上で実行されるときに、前の段落の方法を実行するためのコードを含むコンピュータプログラムを含む。本段落に記載のコンピュータプログラムは、コンピュータと共に使用するためにその中に具体化されたコンピュータプログラムコードを有するコンピュータ可読媒体を含むコンピュータプログラム製品である。別の例は、この段落に従ったコンピュータプログラムであり、プログラムは、コンピュータの内部メモリに直接ロード可能である。
【0008】
例示的な装置は、1つ以上のプロセッサと、コンピュータプログラムコードを含む1つ以上のメモリとを含む。前記1つ以上のメモリおよびコンピュータプログラムコードは、該1つ以上のプロセッサを用いて、該装置に、1つ以上のプロセッサとともに、装置に、1つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を適応エコーキャンセルシステムで受信させ、ここで、1つ以上のラウドスピーカが遠端信号を再生し、1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に適応エコーキャンセルシステムを動作させ、構成可能であり、値の範囲から、少なくとも1つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定させ、ここで、少なくとも1つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づいており、適応エコーキャンセルシステムによって、異なる時点における前記少なくとも1つの制御パラメータの異なる値で、前記少なくとも1つのフィルタを制御させるように構成される。
【0009】
例示的なコンピュータ・プログラム製品はコンピュータと共に使用するために、そこに具体化されたコンピュータ・プログラム・コードを有するコンピュータ読み取り可能な記憶媒体を含む。コンピュータプログラムコードは、1つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生された遠端信号に基づくオーディオ信号を受信するためのコードと、ここで、1つ以上のラウドスピーカが、該遠端信号を再生するものであり、少なくとも部分的に、少なくとも1つのフィルタを用いて、1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、適応エコーキャンセルシステムを動作させるためのコードと、構成可能であり、値の範囲から少なくとも1つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定するためのコードであって、少なくとも1つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づく、コードと、適応エコーキャンセルシステムによって、少なくとも1つのフィルタを、異なる時刻に、制御するためのコードとを含む。
【0010】
別の例示的な実施形態では、装置が、1つ以上のマイクロフォンから、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するステップであって、1つ以上のラウドスピーカが遠端信号を再生する、ステップと、1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも1つのフィルタで、適応エコーキャンセルシステムを動作させるステップと、構成可能であり、値の範囲から少なくとも1つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定するステップであって、少なくとも1つの制御パラメータを決定することは音響チャネルの係数の推定値の精度および近端信号の特性を推定することに基づく、ステップと、適応エコーキャンセルシステムによって、少なくとも1つのフィルタを、少なくとも1つの制御パラメータの異なる値で、異なる時刻に制御するステップと、を実行するための手段を備える。
【図面の簡単な説明】
【0011】
添付図面について説明する。
【
図1】
図1は、エコーキャンセルを有する典型的なオーディオシステムの論理フロー図である。
【
図1A】
図1Aは、例示的な実施形態による、エコーキャンセルを実装するのに適した通信装置のブロック図である。
【
図2】
図2は、実施形態1と呼ばれる第1の実施形態の論理フロー図である。
【
図3】
図3は、例示的な実施形態による、実施形態2と呼ばれる第2の実施形態のエコーキャンセルモジュールのブロック図である。
【
図4】
図4は、
図4Aおよび
図4Bにわたる、実施形態2のための一般的な更新プロセスの論理フロー図である。
【
図5】
図5は、実施例2の定期更新ルールの論理フロー図である。
【
図6】
図6は、例示的な実施形態において、IMLアルゴリズムを実行する2つの並列フィルタを用いたエコーキャンセルを使用する、シミュレートされたSISOエコーキャンセルシナリオにおける信号電力の発展を示す。
【
図7】
図7は、例示的な実施形態における、IMLアルゴリズムを実行する2つの並列フィルタを用いたエコーキャンセルを使用した、
図6のシミュレートされたSISOエコーキャンセルシナリオにおける正規化されたミスアライメント
【数1】
の展開を示す。
【
図8】
図8は制御パラメータを使用したアコースティックエコーキャンセルのためのロジックフロー図であり、例示的な方法または方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータプログラム命令の実行の結果、ハードウエア内に実装されたロジックによって実行された機能、および/または例示的な実施形態による機能を実行するための相互接続された手段を示す。
【発明を実施するための形態】
【0012】
明細書および/または図面の図に見られる略語は詳細な説明のセクションの近端に、以下に定義される。
【0013】
「例示的」という用語は本明細書では「例、事例、または例示としての役割を果たす」ことを意味するために使用される。「例示的」として本明細書で説明される任意の実施形態は必ずしも他の実施形態よりも好ましいまたは有利であると解釈されるべきではない。
この詳細な説明に記載された実施形態の全ては、当業者が本発明を実施または使用することを可能にするために提供される例示的な実施形態であり、特許請求の範囲によって定義される本発明の範囲を限定するものではない。
【0014】
用語「含む(comprises)」、「備える(comprising)」、「有する(has)」、「有する(having)」、「含む(includes)」、および/または「含む(including)」は、本明細書で使用される場合、述べられた特徴、素子、および/またはコンポーネントなどの存在を特定するが、1つ以上の他の特徴、要素、コンポーネント、および/またはそれらの組み合わせの存在または追加を排除するものではない、ことがさらに理解される。
【0015】
5G没入型音声などのシステムの適用のために、複数のラウドスピーカおよび複数のマイクロフォンを活用して、より現実的なオーディオ体験を提供することが望ましい。
例えば、異なる遠隔音声が異なる方向から来るように見せることによって、理解を向上させることができる。
【0016】
大規模でダイナミックな物理環境で複数のラウドスピーカーとマイクロフォンを活用すると、いくつかの理由、すなわち、
1)複数のラウドスピーカーが遠端信号の相関を高め、収束を遅くする、
2)計算の複雑さを増す複数のマイクロホン、
3)大きな物理的環境は、キャンセルフィルタの必要な長さを増加させる、および/または、
4) 動的な物理的環境は、システムの必要な追跡速度を増加させる、
などの理由から、音響エコーキャンセレーションの課題がより困難になる。
【0017】
没入型音声アプリケーションを可能にするには、迅速な追跡、低残留エコー、近端信号に対するロバスト性、および低複雑性を同時にかつ自動的に達成できるエコー・キャンセル方法を有することが有用である。
【0018】
音響エコー・キャンセルの一般的問題に対しては、多数のアルゴリズムが存在する。音響エコー・キャンセルフィルタの係数を適応させるための3つの鍵となるアルゴリズムは、
最小平均二乗(LMS)、再帰最小二乗(RLS)、およびアフィン射影アルゴリズム(APA)を含む。これらの全ては有用であり得るが、本明細書に提示される技術が対処しようとする以下の制限を有する。
1)LMSは、特に相関近端信号の面において、収束が悪くなる。
2)RLSは優れた性能を持つが、フィルタ長に二次複雑性がある。
3)APAは収束は速いが、収束後の残留エコーは比較的高い。
【0019】
サブバンド法は課題を別々の周波数帯域に効果的に分割する。次いで、上記の3つの方法を、サブバンドの各々の中で適用することができる。重み付け重複加算(WOLA)アプローチは、このカテゴリに分類される。
【0020】
LMSアルゴリズムに対して、収束速度と定常残留エコーの間のトレードオフを制御するステップサイズとして知られる重要なスカラーパラメータが存在する。ステップサイズを適応させるためのいくつかの現在の方式がある。例えば、NP-NLMSおよびJO-NLMSについては、「Benesty, J., Rey, H., Vega, L. R., and Tressens, S., "A nonparametric VSS NLMS algorithm", IEEE Signal Processing Letters, 13(10), 581-584 (2006)」、および、「Paleologu, C., Ciochin, S., Benesty J., and Grant, S. L., "An overview on optimized NLMS algorithms for acoustic echo cancellation", EUROSIP Journal on Advances in Signal Processing, 2015:97 (2015)」を参照されたい。このアイデアは、チャネル推定誤差が高く、雑音が低い場合は大きなステップを使用し、誤差が低く、および/または雑音が高い場合は、小さなステップを使用することである。
音声指向アプリケーションでは、音声アクティビティ検出(VAD)アルゴリズムを使用して、近端音声信号が存在するときを決定することができる。VADはステップサイズ制御に供給することができ、音声アクティビティの期間中、ステップサイズをゼロ(またはゼロに近い)にし、近端音声が無音であるとき、より大きくする。これは、高い音声アクティビティが他の信号を圧倒することが予想されるためであり、したがって、これらの時刻のために適応が選択されないことが低いからである。
【0021】
APAアルゴリズムはステップサイズと正則化パラメータの二つのパラメータを持つ。従来、正則化パラメータは数値的な不調和を回避するために、小型固定レベルに設定される。原則として、ステップは、LMSアルゴリズムと同様の方法によって制御することができる。第3のパラメータはしばしばPと表されるメモリ長である。Pのより大きい値が高速収束のために有利であるが、Pのより小さい値は収束後により下側残存エコーを与える。
異なる条件下でPを適応させる方法は、「Albu, F., Paleologu, C., and Benesty, J., "A variable step size evolutionary affine projection algorithm", in 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 429-432), IEEE (2011, May)」のように提案されている。ステップサイズ、正則化、およびPを一緒に選択または制御する効果的な方法は、
知られていないようである。
【0022】
これらおよび他の問題に対処するために、および概要として、本明細書の例示的な提案はすべてのコンポーネントが同時に必要ではないが、以下の3つのコンポーネントを含む。参照を容易にするために、コンポーネントをC1、C2、およびC3と表示する。
【0023】
(C1)双方向オーディオ設定においてエコーチャネル係数を適応的に学習するための新しい更新規則、増分最大尤度(IML)。IML更新ルールは2つのパラメータ、すなわち、
i)固定メモリ順序Pと、
ii)適応的に設定される信頼性パラメータ(CP)と
を有する。
【0024】
(C2)音響エコーキャンセル設定で利用可能な情報に基づいてCPを適応的に設定するための理論的に正当化された実用的な方法。この更新ルールは、IMLが、例えば、IMLが(例えば、近端音声アクティビティ検出の助けを借りて)低近端アクティビティの期間においてのみ動作され得る場合、IMLが高速収束および低定常状態誤差を有することを可能にし得る。
【0025】
(C3)例えば、近端アクティビティに対してロバストでIMLベースのエコーキャンセル方法。この方法は、2つのIMLフィルタを並列に実行することを含む。2つのフィルタは、それらのCPを設定するために異なる仮定を使用し得る。
【0026】
ここで、追加の概要が提示され、より詳細な説明が以下に関連する。
【0027】
例示的な実施形態は、遠端音をエンドユーザに伝えるために1つ(または複数)のラウドスピーカが設けられ、遠端ユーザに伝えられる近端音を捕らえるために1つ(または複数)のマイクロフォンが設けられる、移動装置におけるハンズフリー通信に関する。遠端音がラウドスピーカ、ローカル音響チャネル、およびマイクロフォンの鎖を介して遠エンドユーザに逆伝搬するのを防止するために、エコーキャンセレーションモジュールが提供される。チャネル推定における不確実性の多次元統計モデルを形成するためにP個の過去のサンプルの窓を使用し、そのモデルの下で最尤推定値にフィルタ係数を更新するエコー消去部のための適応機構を提供した。この機構は、本明細書では増分最大尤度(IML)アルゴリズムと呼ばれる。この機構は、チャネル推定における不確実性のレベルと近端信号の電力レベルとの間の変化するバランスを反映するように修正することができる、信頼性パラメータと呼ばれる制御パラメータを有する。上記コンポーネント(C1)を参照のこと。様々な態様は例えば、コンポーネント(C2、C3)を使用して、利用可能な情報に基づいて信頼性パラメータが修正される方法が異なる。
【0028】
例示的な実施形態によって対処される一態様は、信頼性パラメータが異なる実施形態における様々な技法によって推定され得る理論的な最適値を有することである。特に、分析は、信頼性パラメータが例えば、残存遠端信号電源と近端信号電源の比に等しく設定され得ることを示す。この比は、本明細書ではRFNR(残存遠端対近端比)と呼ばれる。IMLメカニズムの信頼パラメータを推定RFNRに等しく設定することにより、適応メカニズムは異なる状況において異なる挙動をすることができ、したがって、いくつかの他の周知の適応メカニズムの1つのメカニズムポジティブな特徴を組み合わせることができる。
例えば、RFNRが高く、それに応じて信頼パラメータが設定されるとき、IML更新は、高い残留エコーレベルを迅速に低減することができるAPA更新とほぼ同一である。RFNRが低く、信頼性パラメータがそれに応じて設定されるとき、IML更新は高い近端雑音レベルに対してロバストであり、低い残留エコーを達成する、小さいステップサイズを有するLMS更新とほぼ同一である。RFNRの中間値について、IML更新は、APAまたはLMS単独のいずれによっても捕捉されない中間挙動を提供する。IMLアルゴリズムが、RFNRにほぼ等しい信頼パラメータセットで動作される場合、例示的な実施形態は収束後に、高速収束と低残留エコーの両方を提供する。APAおよびLMSと同様に、IMLの複雑さは、エコーキャンセレーションフィルタの長さにおいてのみ線形である。「等しい」という用語が本明細書で使用されるときはいつでも、これは、等しいといういくつかの(たとえば、比較的小さい)閾値内にあるなど、多くの例で実質的に等しいことが暗示され得ることに留意されたい。たとえば、信頼パラメータは、1パーセントまたは数パーセント以下の閾値内にあるなど、RFNRに実質的に等しく設定され得る。
【0029】
RFNRは直接観察可能ではなく、様々な態様はRFNRが推定される方法に従って異なる。「直接的に観察可能」とは、RFNRが測定不可能でまたは測定が困難であるなど、データーから推定することが困難な手段である。正確なVAD部が利用可能である音声指向アプリケーションでは、RFNRが近端ラウドスピーカが非アクティブであるとき、扁平状バックグラウンドノイズモデルに基づいて推定することができ、近端音声アクティビティが検出されたとき、非常に低いと単純に仮定することができる(コンポーネントC2を参照)。
正確なVADが利用可能でない用途において、例えば、近端信号が単なる音声信号ではない場合、信頼性パラメータは、一対の平行なエコーキャンセルフィルタを使用して効果的に制御することができる。一方のフィルタはRFNRの積極的な推定値で制御され、他方はRFNRの保守的な推定値で制御され、両方が頻繁に同期される(ポイントC3参照)。例示的な実施形態では積極的な推定がより高い信頼度パラメータを使用し、保守的な推定はより下側信頼度パラメータを使用する。
【0030】
本明細書に提示される技術の一部の技術的効果には、以下のものが含まれる。
【0031】
コンポーネントC1の可能な効果は、以下の通りである。信頼パラメータが残存遠端から近端への比にほぼ等しく設定されるとき、IML更新ルールは、平均して、RLSなどの最適な方法よりもはるかに低い複雑さで、APAまたはNLMSで達成され得るよりも低い残存遠端信号を達成する。
【0032】
コンポーネントC1およびC2の考えられる効果には、以下のものが含まれる。強い近端活動の周期が既知であるか、効果的に推定することができる用途では、C1およびC2で動作するエコーキャンセラが音響チャネル条件の変化後(または初期化時)の残留エコーの高速縮小を達成し、一方、チャネルが安定しているときには非常に低い残留エコーを達成する。より速い縮小はAPAに対する縮小との類似性に基づき、LMSよりもより速い縮小を有する。低残差エコーはLMSによって達成されるものと同様の残差エコーに基づいており、APAによって達成されるものよりも低い。
【0033】
コンポーネントC1およびC3の可能な効果は一緒に、以下を含む。一般的なアプリケーションでは、
C1およびC3で動作するエコーキャンセラが音響チャネル条件の変化後(または初期化時)の残留エコーの高速縮小を達成し、一方、チャネルが安定しているときは非常に低い残留エコーも達成し、一方、高い近端活動の期間中は低い残留エコーも維持する。
【0034】
ここで、概要が提供されたので、追加の詳細が提供される。
【0035】
追加の詳細を進める前に、以下に提示される概念のうちのいくつかは、数学的形式で特徴付けられる。以下の表は、パラメータとそれに対応する例示的な意味への参照ガイドである。
【表1】
この表は参照を容易にするために提供されており、網羅的なまたは限定的であることを意味するものではない。また、これらのパラメータは、時に他の名前を使用して参照されることがある。
【0036】
図1に示すセットアップを考える。
図1は、エコーキャンセルを有する典型的なオーディオシステムのブロック図である。遠端から信号15があり、遠端に信号65がある。オーディオ・システム10は、ラウドスピーカ・アレイ12(この例では3つのラウドスピーカを有する)、マイクロホン・アレイ30(この例では3つのマイクロホンを有する)、アコースティック・エコー・キャンセラ90、および加算器76を含む。この例のAEC90は、係数を有するエコーキャンセラモジュール50と、適応重み更新機能70と、近端アクティビティ検出モジュール80とを含む。アレイ12および30は1つの要素から多くの要素を有することができ、アレイ12、30の各々の要素の数は同じである必要はない。
【0037】
遠端からの信号15は、ラウドスピーカ信号11xtを含み、マイクロフォン(マイク)信号yt35は、ノイズ信号zt40、近端信号ut45、およびエコーを有する遠端信号xt
Tw*60を含む。w*は、ラウドスピーカー12とマイクロフォン30の間のチャネルを表す。この例ではシステム10の環境は部屋20内にあり、近端信号45は少なくとも利用者(図示せず)などの近端オーディオソース22によって生成される。
【0038】
エコーキャンセラ50は係数を使用して適用し、マイクロホン信号35から加算器76によって減算されるエコー推定値xt
Twt75を生成し、エコーキャンセレーション出力et65を生成する。適応重み更新機能70は係数を更新し、係数は、重みであると考えることもできる。近端アクティビティ検出モジュール80はVADを実行し、ハード出力(例えば、検出された音声がない場合はゼロ、検出された音声がある場合は1)、またはゼロと1との間の(および場合によっては含む)数のいずれかを適応重み更新機能70に出力する。これに応答して、適応重み更新機能70は例えば、使用される場合、異なるステップサイズを使用して、更新を実行するか、または実行しない。
【0039】
図1Aは、例示的な実施形態に従ったエコーキャンセレーションを実施するのに適した通信装置110のブロック図である。通信装置110の一例は、無線ネットワークにアクセス可能な無線、典型的にはモバイル装置である。通信装置110は、1つ以上のバス127を介して相互接続された、1つ以上のプロセッサ120と、1つ以上のメモリ125と、1つ以上のトランシーバ130と、1つ以上のネットワーク(N/W)インターフェース(IF)161とを含む。1つ以上のトランシーバ130の各々は、受信機、Rx、132および送信機、Tx、133を含む。1つ以上のバス127は、アドレス、データ、または制御バスであり得、マザーボードまたは集積回路上の一連の回線、光ファイバまたは他の光通信機器などの任意の相互接続機構を含み得る。
【0040】
通信装置110は、有線、無線、またはその両方とすることができる。無線通信の場合、1つ以上のトランシーバ130は、1つ以上のアンテナ128に接続される。1つ以上のメモリ125は、コンピュータプログラムコード123を含む。N/W I/Fは、1つ以上の有線リンク162を介して通信する。
【0041】
通信装置110は、いくつかの方法で実装され得る、部分140-1および/または140-2の一方または両方を備える制御モジュール140を含む。制御モジュール140は1つ以上のプロセッサ120の一部として実装されるように、制御モジュール140-1としてハードウェアで実装されてもよい。制御モジュール140-1はまた、集積回路として、またはプログラマブルゲートアレイなどの他のハードウェアを介して実装され得る。別の例では、制御装置140がコンピュータプログラムコード123として実装され、1つ以上のプロセッサ120によって実行される制御装置140-2として実装されてもよい。例えば、1つ以上のメモリ125およびコンピュータ・プログラム・コード123は、1つ以上のプロセッサ120を用いて、ユーザ装置110に本明細書に記載する1つ以上の動作を実行させるように構成してもよい。AEC90は、同様に、制御モジュール140-1の一部としてエコーキャンセラモジュール90-1として、制御モジュール140-2の一部としてエコーキャンセラモジュール59-2として実装され得る。AEC90は典型的にはエコーキャンセラモジュール50および適応重み更新機能70を含み、近端アクティビティ検出モジュール80は含んでも含まなくてもよい。
【0042】
コンピュータ可読メモリ125は、ローカル技術環境に適した任意のタイプのものとすることができ、半導体ベースのメモリデバイス、フラッシュメモリ、ファームウェア、磁気メモリデバイスおよびシステム、光学メモリデバイスおよびシステム、固定メモリおよび取り外し可能メモリなどの任意の適切なデータ記憶技術を使用して実装することができる。コンピュータ可読メモリ125は、記憶機能を実行するための手段であってもよい。プロセッサ120は、ローカル技術環境に適した任意のタイプであってもよく、非限定的な例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、およびマルチコアプロセッサアーキテクチャに基づくプロセッサのうちの1つ以上を含むことができる。プロセッサ120は、通信装置110を制御することなどの機能、および本明細書で説明する他の機能を実行するための手段であり得る。
【0043】
一般に、通信デバイス110の様々な実施形態は、限定はしないが、セルラー電話
(スマートフォン、携帯電話、携帯電話、ボイスオーバーインターネットプロトコル(IP)(VoIP)電話、および/またはワイヤレスローカルループ電話など)、タブレット、ポータブルコンピュータ、ルームオーディオ機器、没入型オーディオ機器、車両または車両搭載デバイス、たとえばワイヤレスV2X(車間)通信用、デジタルカメラなどの画像キャプチャデバイス、ゲームデバイス、音楽ストレージおよび再生機器、インターネット機器(モノのインターネット、IoT、デバイスを含む)、たとえば自動化アプリケーション用のセンサおよび/またはアクチュエータを備えたIoTデバイス、ならびにそのような機能の組合せを組み込んだポータブルユニットまたは端末、ラップトップ、ラップトップ組み込み機器(LEE)、ラップトップ搭載機器(LME)、ユニバーサルシリアルバス(USB)ドングル、スマートデバイス、ワイヤレスカスタマープレミス機器(CPE)、モノのインターネット(loT)デバイス、時計または他のウェアラブル、ヘッドマウントディスプレイ(HMD)、車両、ドローン、医療デバイスおよびアプリケーション(たとえば、遠隔手術)、産業デバイスおよびアプリケーション(たとえば、産業および/または自動処理チェーンコンテキストで動作するロボットおよび/または他のワイヤレスデバイス)、家電デバイス、商業および/または産業ワイヤレスネットワーク上で動作するデバイスなどを含むことができる。すなわち、通信装置110は、無線または有線通信が可能な任意の装置とすることができる。
【0044】
単一のラウドスピーカー(アレイ12内)と単一のマイクロフォン(アレイ30内)があると仮定する。このアルゴリズムは複数のラウドスピーカおよび/または複数のマイクロホンの場合に、簡単な方法で一般化する。時刻tにおいて、AEC90は、以下を入力として受信する。
【0045】
1)最新のラウドスピーカー信号ベクトルは、
【数2】
であり、ここで、n
wは、w
tにおける係数の数であり、Rは、長さn
wの実ベクトルのセットである。
【0046】
【0047】
3)P-1以前のラウドスピーカーとマイクロフォンの測定は、
【数4】
である。
【0048】
4)エコーチャネルの係数の現在の推定値は、wtである。
【0049】
ここで、提案されたエコーキャンセル方法、すなわちIMLが、その入力の機能としてどのようにwtを更新するかを説明する。
【0050】
n
w×P行列
【数5】
と、P×1ベクトル
【数6】
を定義する。また、n
w×(P-1)行列
【数7】
を定義する。(U
t-1は、最初の列がないX
tであることに留意する。)
【0051】
信頼性パラメータc
tを与え、正規化係数パラメータを、
【数8】
のように定義する。そして、IMLは、係数w
tを、
【数9】
のように更新する。
【0052】
信頼パラメータ(CP)に関して、IMLの記述における唯一のパラメータは信頼パラメータc
tである。まず、このパラメータを理想的に設定する方法を説明する。ラウドスピーカとマイクロフォンとの間のチャネルは、
【数10】
によって記述することができ、従って、
【数11】
である。ここで、z
tは、分散σ
z
2を持つ加法ガウス雑音を示し、u
tは、エンドユーザの信号を示す。まず、近端ユーザが無音であり、
【数12】
である場合を考える。この場合、パラメータc
tを
【数13】
として設定することが理想的には望ましい。このようにパラメータを設定するには、w
*にアクセスする必要があるが、これは利用できない。パラメータを設定するための実用的な方法を説明する前に、IMLを明らかにする2つの極端なケースをレビューした。
【0053】
第1のケースは、
【数14】
に関する。この場合、ミスアライメントエラー
【数15】
は、付加的ノイズが支配的であり、c
tは、c
t
-1をゼロに近い値に設定して、非常に大きくする必要がある。これは、エコーキャンセラが係数の信頼できる推定値を有していない場合、通信セッションの開始時に起こる。
【数16】
の極端な場合には、IMLが正則化なしに標準APAに減少することを示すことができる。より一般的には、このレジームc
-1が、正規化APAにおける正規化パラメータに類似した役割を果たす。
【0054】
第2のケースは、
【数17】
に関する。この場合、システムはエコーチャネル係数w
*の良好な推定値を有し、付加雑音が支配的である。この場合、c
tは、小さい値に設定され、IMLは小さいステップサイズでLMSに縮小される。
【0055】
二つの極端なケースは、IMLがチャネル推定の精度と測定における雑音に関するレベルに依存して、APAとLMSの間のスマート適応補間として説明できることを示した。
【0056】
信頼性パラメータの設定に関しては前述のように、理想的にはIMLが時刻tにおけるミスアライメントのパワーに基づいてパラメータc
tを設定する。しかし、これは実際には利用できない。理想的な選択によってインスパイアされる実用的な代替案は、c
tを、
【数18】
としてセットするものである。この実用的な選択は、実験において、うまく機能した。
【0057】
MLEへのIMLの接続に関して、IMLとその導出を理解するために、正規化APA(R-APA)をレビューした。R-APAは、
【数19】
のように係数w
tを更新する。
【0058】
ここで、δは、正則化パラメータを示す。
【数20】
行列P
tを、
【数21】
として定義する。
【0059】
【数22】
として開始し、反復tにおいて、
【数23】
となる。ここで、
【数24】
である。P
tは、1に等しい固有値
【数25】
と1より厳密に小さい固有値Pとを持つ行列である。このキャラクタリゼーションは、w
t、すなわち、
【数26】
におけるバイアスが、指数関数的速度でゼロに収束することを示している。したがって、近似的に、w
tは、
【数27】
としてモデル化することができ、
【数28】
行列M
tは、w
t共分散行列を表す。ここで、
【数29】
および、
【数30】
とすると、w
oの最尤推定(MLE)は、
【数31】
次のようになる。
【0060】
このMLベースの更新ルールを簡素化するために、
【数32】
と仮定する。すると、
【数33】
となる。ここで、
【数34】
である。実際には、σ
w
2は、
【数35】
として近似することができる。このMLベースのアプローチをさらに改善するために、この導出において、過去のP観察が等しく扱われたことに留意されたい。ただし、最新の観測値(x
t,y
t)は、w
tの推定に用いられていない新しい観測値である。また、ここでは、M
tは、単に対角行列とする。さらにより良い更新ルールを導出するために、IMLを使用することが提案され、IMLは2つのステップ、すなわち、最初に
【数36】
個の過去の観測値に基づいてM
tを推定すること、および2番目に、導出された推定値M
tと共に最新の観測値を使用して更新することを採用する。
【0061】
ここで、いくつかの実施形態が導入され、検討される。特に、第1の実施形態(実施形態1)および第2の実施形態(実施形態2)について説明する。
【0062】
実施形態1は、音声アクティビティ検出(VAD)を介して近端信号に対するロバスト性に対処する。いくつかの音声指向アプリケーションでは、近端信号音声信号がオンまたはオフのいずれかであるランダムプロセスとしてモデル化され得る。各種音声アクティビティ検出方法を使用して、近端音声がオンであるかオフであるかを検出することができる。ハードVADの場合、音声アクティビティ検出モジュールの出力は、音声アクティビティが検出されたとき、
【数37】
と示すことができ、および、音声アクティビティが検出されなかったとき、
【数38】
と示すことができる。ここで、「a」は、アクティビティを示すために使用される。
ソフトVADでは、a
tは、音声信号がアクティブである推定確率を反映するために、0(ゼロ)と1(1)との間の任意の値をとることができる。
【0063】
図2は、実施形態1と呼ばれる第1の実施形態の論理フロー図である。
図2は、1つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および/または、機能を実行するための相互接続された手段を、例示的な実施形態により示す。
図2のブロックは、AEC 90および制御モジュール140の制御下で、通信装置110によって実行されるものとする。
【0064】
ブロック210において、通信装置110は、ラウドスピーカ(
図1のラウドスピーカ信号11)、マイクロフォン(マイク信号35)、およびVAD(近端アクティビティ検出モジュール80を介して)のための入力信号を受信する。
【0065】
次いで、1つの例示的な実施形態は、以下のように各時刻ステップで動作する(
図2も参照)。
【0066】
生の信頼パラメータは、
【数39】
として計算される(ブロック220)。音声アクティビティ検出モジュールは値a
tを提供する。組み合わされた信頼性パラメータは、
【数40】
のように計算される。更新された重みベクトルw
t+1は、IML更新ステップを介して信頼性c
tをもって計算される(ブロック230)。1つの例では、
【数41】
での更新が、
【数42】
のIML更新式の制限として解釈されるという規則を使用する。つまり、ステップサイズがゼロ
【数43】
のLMS 更新と解釈される。これは、ブロック240においてエコーフィルタの重みの更新も実行し得る、
図1の適応重み更新機能70によって実行され得る。この更新は、それに応じてエコーキャンセラモジュール50の応答を変更する。
【0067】
次に、第2の実施の形態である実施の形態2について説明する。この実施形態は、音声アクティビティ検出(VAD)を必要とすることなく、近端信号に対するロバスト性を提供する。すなわち、いくつかのアプリケーションでは、音声アクティビティ検出(VAD)ユニットが利用可能ではないか、または十分ではない場合がある。例えば、用途によっては、近端信号45が可変強度を有する連続信号であってもよい。例えば、音楽または他の周囲雑音の場合である。この場合、近端信号が存在する場合でも、変化するチャネルを追跡できることは有益であるが、追跡速度と精度の間の適切なトレードオフが行われる可能性がある。
【0068】
このようなシナリオではエコーキャンセラから出てくるパワーレベルが大きくなると、パワーの増大が近端信号u
tの強度の増大によるものであるか、残留エコー
【数44】
の増大によるものであるか、例えば、チャネル応答w
*の変化によるものであるかを区別することが難しくなる。前者の場合、チャネル応答の変化によるものであるが、強い近端信号が(既に正確である)重みベクトルw
tを破壊するのを防止するために、低い信頼度でIML更新を行うことが望ましい。後者の場合、可能な限り迅速に(不正確である)重みベクトルw
tを補正するために、高い信頼度でIML更新を実行することが望ましい。
【0069】
2つの事例を事前に区別することが困難であるため、本明細書では、両方の行動過程が並行して試みられる方法が提案される。これらの2つのアプローチの結果は頻繁に比較され、その時点で適切な行動は「後知恵」において明確である。エコーキャンセルは通常、低信頼度分岐の結果を出力するが、この分岐が優れた性能を示す場合、高信頼度分岐に切り替わる。このようにして、強い近端信号およびチャネル応答変化に対する速い応答に対してロバスト性が達成される。
【0070】
ここで、このアプローチをより詳細に説明する。
図3を参照すると、この図は、例示的な実施形態による、実施形態2と呼ばれる第2の実施形態のAEC300のブロック図である。この例では、AEC300が近端アクティビティ検出モジュール80を含まない。
図3において、2つのフィルタ、すなわち、コンサバティブフィルタ310および積極的フィルタ360が存在する。コンサバティブフィルタ310は、係数w
t
(1)を有し、それは、参照320によって示されるように調整可能であり、マイク信号35と共に加算器315を介して加算後の出力e
t
(1)を生成する係数を有する。アグレッシブ・フィルタ360は、係数w
t
(2)を有し、それは、参照370によって示されるように調整可能であり、
マイク信号35と共に加算器380を介して加算後の出力e
t
(2)を生成する係数を有する。コンサバティブフィルタ310は、e
t
(1)の出力、IMLモジュール325を有する加算器315を有し、アグレッシブフィルタ360は、e
t
(2)の出力およびIMLモジュール365を有する加算器380を有する。制御装置345、いくつかの電力推定器330、340、および350、ならびに周期的同期ブロック335がある。電力推定器350からの電力の推定に少なくとも基づいて、制御装置345はコンサバティブフィルタ310およびそのIMLモジュール325のための信頼パラメータc
t
(1)を生成し、アグレッシブフィルタ360およびそのIMLモジュール365のための信頼パラメータc
t
(2)を生成する。IMLモジュール325、365は、適応重み更新機能70の例である。参照320および370はエコーキャンセラモジュール50の例であり、それぞれ、対応するエラー出力e
t
(1)またはe
t
(2)を生成する。
【0071】
簡単に説明すると、コンサバティブフィルタ310はフィルタの重みw
t
(1)(参照320)をラウドスピーカ信号x
tに適用し、その結果をマイクロホン信号y
tから減算する。IMLモジュール325は、制御装置345によって提供される信頼パラメータc
t
(1)に基づいてフィルタ重みを適応させる。底部の同様の構造はアグレッシブフィルター360を実装し、ここで、適応は、信頼パラメータ
【数45】
に基づく。すなわち、アグレッシブフィルタ360はフィルタの重みw
t
(2)(参照370)をラウドスピーカ信号x
tに適用し、その結果をマイクロホン信号y
tから減算する。IMLモジュール365は、制御装置345によって提供される信頼パラメータc
t
(2)に基づいてフィルタ重みを適応させる。周期的同期モジュール335は2つのフィルタの性能を周期的に比較し、より悪い性能のフィルタのパラメータをより良いものパラメータに置き換える。周期同期モジュール335は、
図5の論理フローを実行する。
【0072】
この例では2つの平行なエコーキャンセルフィルタ310、360が維持され、これは、w
t
(1)を有するコンサバティブフィルタと、w
t
(2)を有するアグレッシブフィルタとである。
対応するエコーキャンセラ出力は、
【数46】
である。各フィルタの出力電力は、指数平均
【数47】
を介して計算することができる。
【0073】
遠端信号と近端信号は統計的に独立であると仮定し、固定フィルタ係数に対して、出力電力は近端信号電力と残存遠端エコー電力の和である。したがって、一方のフィルタが他方よりも低い出力電力を有する場合(例えば、電力推定器330、340によって決定されるように)、そのフィルタは、より低い残存遠端エコーを有しなければならず、したがって、より低い出力電力を有するフィルタが好ましい。これは、どの時点で2つの分岐のどちらが好ましいかを決定する方法の一例である。
【0074】
しかしながら、フィルタが継続的に適応されているとき、このアプローチはバイアスされ、補正を必要とする。これは、現在のフィルタw
t
(j)が過去の観測値
【数48】
に依存するためであり、これは通常、現在の観測値(y
t,x
t)と強く相関する。このバイアスを補正するために、イノベーション観測値が計算される。これは、変換された観測値
【数49】
であり、遠端信号
【数50】
は以前の
【数51】
観測値
【数52】
と(ほぼ)直交している。
【0075】
現在の遠端信号x
t、過去の遠端信号U
t-1、および(例えば、高レベルの)信頼性パラメータcが与えられると、変換されたラウドスピーカ信号は、
【数53】
のように計算され得る。ここで、
【数54】
の定義が使用される。
【0076】
【数55】
である場合、
【数56】
となり、変換された遠端信号は、直近の過去の遠端信号と直交することを意味する。より一般的には、c
-1が小さい場合、これはほぼ真である。送信されていたであろう仮想の測定値
【数57】
を得るために、
【数58】
が送信されていたならば、係数b
tが、
【数59】
であるマイクロホン信号を形成するために使用される。
【0077】
変換プロセスは、
【数60】
と過去の測定値との間の統計的依存性を減少させる。したがって、変換された誤り
【数61】
および対応する変換された出力電力
【数62】
が計算される場合、2つのエコーフィルタw
t
(1)およびw
t
(2)の品質を比較するためのより信頼性の高い測定が達成される。
【0078】
アグレッシブ・フィルタの信頼パラメータがどのように推定されるかを説明するために、いくつかの表記法および分析も必要である。エコーキャンセラ出力信号は、
【数63】
である。
【0079】
簡単にするために、いくつかの時変ミスアライメントパラメータm
tについて、
【数64】
と仮定する。w
t、x
t、およびz
tが、統計的に独立であると仮定すると、
【数65】
のようになる。ここで、
【数66】
は、遠端信号強度を捕捉し、
【数67】
は、近端信号強度である。
【0080】
なお、出力パワーP
tと遠端信号強度s
tは、経験的に観測可能であり、比
【数68】
を形成するために、m
tおよびν
tを知りたい、ことに留意する。ν
tが与えられると、ミスアライメントを、
【数69】
のように計算することができる。ミスアライメントが与えられると、近端信号電源は、
【数70】
のように計算できる。
【0081】
アグレッシブフィルタ360については、出力電力は、ミスアライメント項に支配され、近端信号が低いと仮定される。無限信頼推定を防止するために、例示的な実施形態において、ノイズ推定は、出力電力の所与のフラクションεより下に進むことは許されない。ミスアライメントの積極的な推定は、
【数71】
である。
【0082】
この背景を適所に用いて、2つの並列フィルタの例示的な動作が説明される。
【0083】
使用される例示的なパラメータには、
1)メモリ長
【数72】
2)パワーアベレージングステップサイズ
【数73】
3)最小ミスアライメント比
【数74】
4)テスト閾値
【数75】
5)乗算係数
【数76】
6)更新期間Tが含まれる。
【0084】
初期化プロセスの1つとして、次のものが考えられる。時刻
【数77】
において、2つのエコーフィルタ310、360は、同じ値
【数78】
を有する。初期ミスアライメント推定値
【数79】
を設定する。初期変数
【数80】
をすべてゼロに設定する。
【0085】
次に、例示的な一般的な更新プロセスについて説明する。
図4(A)および
図4(B)は、実施例2の一般的な更新処理の論理フロー図である。
図4は、例示的な実施形態による、1つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および/または機能を実行するための相互接続された手段を示す。
図4のブロックは、AEC 90および制御モジュール140の制御下で、通信装置110によって実行されるものとする。
【0086】
ブロック405において、通信装置110は、ラウドスピーカおよびマイクロフォンから入力信号を受信する。通信装置110は、フィルタ出力
【数81】
を計算する。ブロック410および425を参照されたい。なお、コンサバティブフィルタ310に対して
【数82】
、およびアグレッシブフィルタ360について、j=2である。エコーキャンセラ出力を
【数83】
に設定する。これは、出力をコンサバティブフィルタ310の出力として設定する。ブロック415を参照のこと。
【0087】
遠端の信号強度
【数84】
を更新する。ブロック430を参照のこと。
【0088】
ブロック455および435において、電力レベルは、それぞれ、コンサバティブフィルタおよび積極的フィルタに対して、
【数85】
のように更新される。これらのブロックに対して、それぞれ、電力推定器330および340を使用する。
【0089】
ブロック440において、積極的なミスアライメント推定値は、
【数86】
のように計算され得る。この公式は観測値が与えられたミスアラインメントの上限であり、c
2の以下の式と共に、RFNRの上限をもたらす。保守的なミスアラインメントの推定値は、ブロック460における
【数87】
のように計算される。この公式は、低い推定値の履歴および積極的な推定値に基づいて、ミスアラインメントの低い推定値を提供する。c
1に対する以下の方程式と共に、これは、RFNRについての第1推定値をもたらす。
【0090】
直観的には、比の推定のための合理的に低い値は、ミスアライメント(すなわち、係数の推定における誤差)が過去のミスアライメントと同じであると仮定することに基づき得る。推定値の合理的に低い値を定義する別の方法は積極的な推定値よりも、例えば、10分の1だけ著しく低いものである。しかし、信頼パラメータの推定値が必ずしも異なるとは限らないことに留意することが重要である。しかし、パフォーマンスにとって重要なことは、それらが時には非常に異なることである。
【0091】
ブロック465および445では、コンサバティブフィルタおよびアグレッシブフィルタについて、それぞれ、
【数88】
として信頼パラメータ推定値が計算される。「信頼パラメータ」という用語は、システムが測定y
tがエコーチャネルについての有用な情報を搬送することをどの程度確信しているかを示すために使用される。
【0092】
測定の信頼性がより高い場合、より大きなステップサイズをとることができる。同様に、測定の信頼性がより低い場合、より小さいステップサイズをとることができる。
【0093】
フィルタw
t
(j)は、信頼パラメータc
j、ここで、
【数89】
を用いて、IML方程式を使用して更新される。これは、コンサバティブエコーフィルタの重みが更新されるブロック470と、アグレッシブエコーフィルタの重みが更新されるブロック450とによって示される。
【0094】
追加の可能なアクションには、次のものがある。
【0095】
マイクロホン信号を形成するために使用する係数を、
【数90】
のように算出する。
【0096】
【0097】
その他の副次的な作業としては、変換された見積もりの更新が含まれる。
1)
【数92】
2)
【数93】
3)
【数94】
4)
【数95】
5)
【数96】
【0098】
(3)における電力レベルについて、これは、指数平均によって得られる、フィルタ出力信号の平均電力レベルの実行中の推定値である。
【0099】
図5を参照して説明される周期的更新ステップもある。
図5は、実施例2の定期更新ルールの論理フロー図である。
図5は、例示的な実施形態による、1つ以上の例示的な方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータープログラム命令の実行、ハードウエア内に実装されたロジックによって実行される機能、および/または機能を実行するための相互接続された手段を示す。
図5のブロックは、AEC 90および制御モジュール140の制御下で、通信装置110によって実行されるものとする。
【0100】
ブロック550は、
図4が何度も繰り返された後に
図5が実行され、それによってフィルタの誤り消去性能を繰り返し推定することを示す。周期性を決定する回数について、その例を以下に説明する。
【0101】
定期的に(たとえば、更新期間Tと任意の整数kに対して、
【数97】
の場合)、2つのフィルタが比較され、同期される。
図3の周期的同期ブロック335も参照されたい。このプロセスは、一定の係数
【数98】
および乗算係数
【数99】
を有することができる。
【0102】
ブロック505では、保守的かつ積極的なエコーフィルタ係数、出力電力、およびミスアラインメントがブロック505で受信される。ブロック510では、アグレッシブフィルタの出力電力がコンサバティブフィルタの出力電力×一定係数よりも小さい場合、通信装置110によって決定される。
【数100】
(ブロック510=Yes)の場合、アグレッシブフィルタは、コンサバティブフィルタよりも良好に機能しているとみなされる。
【0103】
これに応じて、以下を実行する。
【0104】
【数101】
を設定する。これは、コンサバティブフィルタの係数(coeffs) をアグレッシブフィルタの係数(coeffs) に等しく設定する。ブロック520を参照のこと。
【0105】
【数102】
を設定する。すなわち、コンサバティブフィルタの電力レベルは、アグレッシブフィルタの電力レベルと等しく設定される。ブロック525を参照のこと。
【0106】
【数103】
を設定する(ミスアライメントの控えめな見積もりを増やす)。これはブロック530によって示され、そこではコンサバティブフィルタのミスアラインメントが一定の倍率によって示される。
【0107】
そうでない場合(ブロック510=いいえ)、コンサバティブフィルタが最良であると見なされる。応答で以下を実行する。
【0108】
【数104】
を設定する。これはブロック535によって示され、アグレッシブフィルタの係数はコンサバティブフィルタの係数に等しく設定される。
【0109】
【数105】
を設定する。これはブロック540において行われ、アグレッシブフィルタの電力レベルはコンサバティブフィルタに等しく設定される。
【0110】
上のブロック520および535では、悪いフィルタの係数が良好なフィルタの係数に等しく設定される。ただし、これは1 つのオプションのみである。ブロック521、536が示すように、係数は代わりに、他の係数に「より近く」設定されてもよい。例えば、悪いフィルタの係数を、両方のフィルタの係数の平均とすることができる。これは係数をより良いフィルタの係数に近づけるが、より緩やかな方法である。すなわち、「より近い」という用語は、(ベクトルによって記述される各フィルタの係数を考慮して)2つのフィルタの係数間の差のベクトルノルムを減少させるものとして定義することができる。
【0111】
さらに、ブロック510において出力電力が使用されるが、代わりに性能が使用されてもよい。ブロック511を参照のこと。性能は、より良好な性能を手段するエコーキャンセラのより低い出力電力として決定することができる。他の性能メトリックがあり得、電力出力は、性能の1つの例示的なメトリックである。
【0112】
音声アクティビティ検出を伴わない実施形態の技術的効果を例示するために、エコーキャンセレーションシミュレーションからの性能結果が
図6および
図7に示されている。このシミュレーションでは、遠端信号は連続音声信号であり、近端信号は断続音声信号に少量のバックグラウンド雑音を加えたものである。エコーチャネルは、単一のラウドスピーカーから単一のマイクロフォンまで、典型的なルームアコースティックエコー応答である。チャネルは通常一定であるが、3つの異なる時刻隔(7~9秒(s)、14~16秒、および26~28秒)ではチャネルは著しく変化する。
【0113】
図6は、遠端信号、近端信号、および残留エコーの強度を時刻の関数として示す。この図は、IMLアルゴリズムを実行する2つの並列フィルタによるエコーキャンセレーションを使用した、シミュレートされたSISOエコーキャンセレーションシナリオにおける信号電力の進化を示している。参照610では、近端信号強度(間欠音声プラス背景雑音)が提示される。参照620では、エコー信号強度(近端マイクロフォンで受信されるような音声遠端信号)が提示される。参照630では、キャンセル出力における残留エコー信号が提示される。エコーチャネルが変化している時刻隔は、参照640によって強調表示される。参照1は、近端信号が高いときにチャネルが変化する場合、近端信号が減少するとすぐに追従が回復することを示している。参照2は、近端信号が低くなったときにチャネルが変化した場合、追従が速く、有効であることを示している。参照3は、チャネルが固定されている場合、残留エコーは近端信号の影響を受けないことを示している。
【0114】
図7は、ミスアライメント
【数106】
の経時変化を示す。参照番号1、2、および3は、
図6に関して行ったものと同じであることを示す。アグレッシブフィルタがコンサバティブフィルタよりも選択されるモーメントはこの図において参照番号650によって強調され、コンサバティブフィルタは他のすべてのインスタンスにおいて選択される。エコーチャネルが変化している時刻隔は、参照640によって強調表示される。
図7は、IMLアルゴリズムを実行する2つの並列フィルタによるエコーキャンセレーションを用いた、
図6のシミュレートされたSISOエコーキャンセレーションシナリオにおける、正規化されたミスアラインメント
【数107】
の進展を示す。
【0115】
近端信号が低い期間では、ミスアライメントと残留エコーが急激に減少する。たとえば、時刻0s(ゼロ秒) 近辺と時刻17sである。これらの期間において、アルゴリズムはアグレッシブフィルタを正しく使用しており、高信頼度パラメータでIMLを実行している。近端信号が強く、チャネルがスタティックの場合、エコーチャネルの精度は保たれる。たとえば、1~5秒と20~25秒の間隔で設定する。これらの期間では、アルゴリズムがコンサバティブフィルタを正しく使用し、低信頼度パラメータでIMLを実行する。チャネルを変更すると、ミスアラインメントが一時的に大きくなる。チャネル変化が低近端アクティビティ(参照26~28s)の期間中に発生するとき、フィルタは、低残留エコーを維持するのに十分に迅速に適応することができる。高い近端アクティビティ(cf7-9s)の期間中にチャネル変更が発生すると、新しいエコーチャネルを学習するために、フィルタは必然的に近端信号の中断を待たなければならない。
【0116】
この例は、2つの並列分岐においてIML更新アルゴリズムを実装したエコーキャンセラが迅速な追跡、低残留エコー、近端信号に対するロバスト性、および低複雑性を達成できる方法を例示した。
【0117】
まとめると、例示的な実施形態のうちのいくつかは、以下の利点および技術的効果のうちの1つ以上を有し得る。
1)IMLは測定値の信頼度が高いときに、最新のP測定値からの情報を完全に活用するから、(APA、RLSのよう)残留誤差が高いときの高速収束、
2)測定値の信頼性が低い場合、IMLは近端信号からの変動を平均化するので、(小ステップLMSのように)小型漸近残差誤差、
3)信頼性パラメータの最適設定の理論的理解による、VAD(実施形態1)を使用するか、またはVADを使用しない(実施形態2)、近端活動への自動適応、
4)IMLはAPAと同じ計算フレームワークを使用するため、計算量が少なくなる(フィルタ長がリニア)。
【0118】
いくつかの実施形態では、エコーキャンセルがフィルタバンクを使用して実行され得、マイクロフォン信号およびラウドスピーカ信号は複数のサブバンド配列を生成するために相補的な通過帯域を有する2つ以上の平行なフィルタを通過し、エコーキャンセルは各サブバンド内で独立して平行なに実行され、各サブバンド内のエコーキャンセルの出力は時刻領域において最終出力配列を生成するために合成される。この場合、前述の例は、各サブバンド内のシーケンス上で直接使用することができる。
【0119】
ある実施形態では離散フーリエ変換(DFT)に基づくフィルタバンクを使用する場合、または搬送波変調信号に対してベースバンド表現を使用する場合などに、ラウドスピーカおよびマイクロホン信号、および推定チャネル係数は実数値ではなく複素値として表されてもよい。前述の式は当業者には明らかであるように、複雑な場合に自然に拡張される。例えば、前述のα
t(正規化係数パラメータ)および段落のw
t+1の式は、
【数108】
の式に置き換えられる。ここで、A
Hは、複素行列またはベクトルAのエルミート転置を表す。
【0120】
図8を参照すると、この図は、制御パラメータを使用した音響エコーキャンセレーションのための論理フロー図である。この図はまた、例示的な実施形態による、例示的な1つ以上の方法の動作、コンピュータ可読メモリ上に具現化されたコンピュータプログラム命令の実行の結果、ハードウエア内に実装されたロジックによって実行される機能、および/または機能を実行するための相互接続された手段を示す。この図は、通信装置110がAEC90を用いて行うものとする。
【0121】
ブロック810において、1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するための動作が実行される。1台以上のラウドスピーカーが遠端信号を再生した。
【0122】
ブロック820において、1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するために、少なくとも部分的に少なくとも1つのフィルタを用いて、適応エコーキャンセルシステムを動作させる動作が実行される。ブロック830において、構成可能であり、値の範囲から少なくとも1つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータの判定が行われる。少なくとも1つの制御パラメータを決定することは、音響チャネルの係数の推定値の精度と、近端信号の特性とを推定することに基づく。
【0123】
ブロック840では、適応エコーキャンセルシステムによって制御動作が行われ、
少なくとも1つの制御パラメータの異なる値を有する少なくとも1つのフィルタを異なる時点で制御する。
【0124】
ここで、追加の実施例を提示する。
【0125】
例2.
図8の例の方法であって、少なくとも1つのフィルタは、第1フィルタと第2フィルタとを備え、前記第1フィルタの上で第1時刻に使用される前記異なる値のうちの1つの値が、前記第2フィルタの上で前記第1時刻に使用される前記異なる値の別の値とは異なる、方法。
【0126】
例3.
前記少なくとも1つのフィルタを、異なる時刻において、前記少なくとも1つの制御パラメータの異なる値を用いて、制御する前記ステップは、音響チャネルの係数の前記対応する推定値の変化率に影響を及ぼす、対応する第1および第2のそれぞれの制御パラメータの異なる値で、前記第1フィルタおよび第2フィルタを制御するステップと、前記第1フィルタのための前記第1制御パラメータセットの値が、前記第2フィルタに対する前記第2制御パラメータセットの値によって引き起こされる変化率よりも遅い速度で前記チャネル係数推定値を変化させる、ステップと、反復して、前記第1および第2フィルタの誤差キャンセル性能を推定するステップと、前記反復推定後に、より低い性能を有すると推定される前記第1または第2フィルタの係数を、前記第1または第2フィルタの係数がより高い性能を有すると推定された前記第1または第2フィルタの他方の係数に近づくように、ように更新するステップと、をさらに含む、例2に記載の方法。
【0127】
例4.
前記更新するステップは、より低い性能を有すると推定された前記第1または第2フィルタの前記係数を、より高い性能を有すると推定された前記第1または第2フィルタの前記他方の係数と等しいように更新することをさらに備える、例3に記載の方法。
【0128】
例5.
前記性能は、出力電力によって特徴付けられる、例3に記載の方法。
【0129】
例6.
前記少なくとも2つのフィルタの前記第1フィルタおよび前記第2フィルタを、対応する第1および第2のそれぞれの制御パラメータの異なる値で制御するステップは、残存遠端/近端比の2つの推定値の決定するステップであって、前記第1推定値および第2推定値の過去の履歴に基づく残存遠端から近端への比の第1推定値であって、前記第1推定値は比の合理的に低い値であるとして選択され、前記第2推定値は、前記1つ以上のマイクロフォンからの信号および前記遠端信号の観測に基づいて、上限が最高値として選択され得る、前記残存遠端対近端比の上限である、ステップと、前記第1適応フィルタの第1信頼パラメータを前記第1推定値に設定するステップと、前記第2適応フィルタの第2信頼パラメータを前記第2推定値に設定するステップと、さらに含む、例3に記載の方法。
【0130】
例7.
前記第1推定値は、比の合理的に低い値であるとして、前記第2推定値よりも係数が著しく低いとして選択される、例6に記載の方法。
【0131】
例8.
より低い性能を有すると推定される前記第1または第2フィルタの推定電力レベルを、より高い性能を有すると推定された前記第1または第2フィルタの他方の前記電力レベルに等しいように設定するステップを更に含む、例3に記載の方法。
【0132】
例9.
前記第1フィルタより低い性能を有すると推定される前記第2フィルタに応答して、前記第1フィルタの推定ミスアライメントを増加するステップを更に含む、例3に記載の方法。
【0133】
例10.
前記第1フィルタの前記推定されたミスアラインメントを増加するステップは、
コンスタントな増殖の要因によって前記第1フィルタの前記推定されたミスアラインメントを増加するステップをさらに含む、例9に記載の方法。
【0134】
例11.
前記近端信号の特性は、前記近端信号の信号強度を含む、
図8の例の方法。
【0135】
例12.
前記信号強度は、前記近端信号の平均電力によって特徴付けられる、例11に記載の方法。
【0136】
例13.
少なくとも1つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値の誤差の測度の比を推定することに基づく、
図8に記載の例の方法。
【0137】
例14.
第1時刻に使用される異なる値の第1値が、第2時刻に使用される異なる値の第2値とは異なる、
図8の例の方法。
【0138】
例15.
コンピュータプログラムがコンピュータ上で実行されるとき、例1ないし14のいずれかの方法を実行するためのコードを含む、コンピュータプログラム。
【0139】
例16.
前記コンピュータプログラムは、前記コンピュータと共に使用するために、そこに具体化されたコンピュータプログラムコードを含むコンピュータ可読媒体を含むコンピュータプログラム製品である、例15に記載のコンピュータプログラム。
【0140】
例17.
前記コンピュータプログラムは、前記コンピュータの内部メモリに直接ロード可能である、例15に記載のコンピュータプログラム。
【0141】
例18.
1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するステップであって、1つ以上のラウドスピーカが遠端信号を再生する、ステップと、
1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも1つのフィルタで適応エコーキャンセルシステムを動作させるステップと、
構成可能であり、かつ値の範囲から少なくとも1つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定するステップであって、前記決定するステップは、音響チャネルの係数の推定値の精度および近端信号の特性の推定値を推定するステップに基づいており、前記適応エコーキャンセルシステムによって、少なくとも1つの制御パラメータの異なる値を少なくとも異なる時点で有する前記少なくとも1つのフィルタを制御するステップと、
を実行するための手段を含む、双方向音声通信のエコーキャンセルのための装置。
【0142】
例19.
少なくとも1つのフィルタが第1フィルタと第2フィルタとを備え、第1フィルタの上で第1時刻に使用される異なる値のうちの1つの値が第2フィルタの上で第1時刻に使用される異なる値の別の値と異なる、例15に記載の装置。
【0143】
例20.
前記少なくとも1つのフィルタを前記少なくとも1つの制御パラメータの異なる値で異なる時刻に制御することは、対応する第1および第2のそれぞれの制御パラメータの異なる値で第1フィルタおよび第2フィルタを制御することであって、音響チャネルの係数の対応する推定値の変化率に影響を及ぼし、第1フィルタのための第1制御パラメータセットの値が、第2フィルタのための第2制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、制御することと、第1および第2フィルタの誤差キャンセル性能を繰り返し推定することと、繰り返し推定した後に、第1または第2フィルタの係数がより高い性能を有すると推定された第1または第2フィルタの他方の係数に近づくように、より低い性能を有すると推定された第1または第2フィルタの係数を更新することと、をさらに備える、例16に記載の装置。
【0144】
例21.
前記更新するステップは、より低い性能を有すると推定される前記第1または第2フィルタの係数を、より高い性能を有すると推定される前記第1または第2フィルタの他の係数に等しいと推定されるように更新するステップをさらに含む、例17に記載の装置。
【0145】
例22.
性能が出力電力によって特徴付けられる、例17に記載の装置。
【0146】
例23.
前記少なくとも2つのフィルタの前記第1フィルタおよび前記第2フィルタを、対応する第1および第2のそれぞれの制御パラメータの異なる値で制御するステップは、
残存遠端/近端比の2つの推定値、第1推定値および第2推定値の過去の履歴に基づく残存遠端対近端比の第1推定値であって、その比の合理的に低い値であるとして選択される第1推定値を決定するステップであって、1つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択される、残存遠端対近端比の上限である、第2推定値とステップと、
第1適応フィルタの第1信頼パラメータを第1推定値に設定するステップと、
第2適応フィルタの第2信頼パラメータを第2推定値に設定するステップと、
をさらに備える、例17に記載の装置。
【0147】
例24.
前記第1推定値は、前記比の合理的に低い値として、前記第2推定値よりも有意に低い値として選択される、例20に記載の装置。
【0148】
例25.
前記手段は、より低い性能を有すると推定される前記第1または第2フィルタの推定電力レベルを、より高い性能を有すると推定される前記第1または第2フィルタの他方の前記電力レベルに等しくなるように設定するステップを実行するようにさらに構成される、例17に記載の装置。
【0149】
例26.
前記手段は、前記第2フィルタが前記第1フィルタよりも低い性能を有すると推定されることに応じて、前記第1フィルタの推定ミスアライメントを増加させることを実行するようにさらに構成される、例17に記載の機器。
【0150】
例27.
前記第1フィルタの推定ミスアラインメントを増加させることは、前記第1フィルタの推定ミスアラインメントを一定の倍率だけ増加させることを更に含む、例23に記載の装置。
【0151】
例28.
近端信号の特性が、近端信号の信号強度を含む、例15に記載の装置。
【0152】
例29.
前記信号強度が、前記近端信号の平均電力によって特徴付けられる、例25に記載の装置。
【0153】
例30.
少なくとも1つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値における誤差の測度の比を推定することに基づく、例15に記載の装置。
【0154】
例31.
第1時刻に使用される前記異なる値の第1値は、第2時刻に使用される前記異なる値の第2値とは異なる、例15に記載の装置。
【0155】
例32.
前記手段は、少なくとも1つのプロセッサ、および少なくとも1つのプロセッサを含む少なくとも1つのメモリを備え、少なくとも1つのメモリおよびコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置の実行をさせる、例1ないし31のいずれか1例に記載の装置。
【0156】
例33.
1つ以上のプロセッサとコンピュータプログラムコードを含む1つ以上のメモリと、を備える、双方向オーディオ通信のエコーキャンセルのための装置であって、前記1つ以上のメモリおよび前記コンピュータプログラムコードは、前記1つ以上のプロセッサを用いて、前記装置に、
1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に、近端信号、および、1つ以上のラウドスピーカが再生した再生遠端信号に基づくオーディオ信号を受信させ、
1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように、少なくとも部分的に少なくとも1つのフィルタで、適応エコーキャンセルシステムを動作させ、
構成可能であり、かつ値の範囲から少なくとも1つの値に設定される適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定させ、ここで、前記決定することは、音響チャネルの係数の推定値の精度および近端信号の特性の推定値を推定するステップに基づいており、
適応エコーキャンセルシステムによって、少なくとも1つの制御パラメータの異なる値を少なくとも異なる時点で有する少なくとも1つのフィルタを制御させる
ように構成される、装置。
【0157】
例34.
少なくとも1つのフィルタが第1フィルタと第2フィルタとを備え、第1フィルタの上で第1時刻に使用される異なる値のうちの1つの値が第2フィルタの上で第1時刻に使用される異なる値の別の値と異なる、例33に記載の装置。
【0158】
例35.
前記少なくとも1つのフィルタを前記少なくとも1つの制御パラメータの異なる値で異なる時刻に制御することは、
音響チャネルの係数の対応する推定値の変化率に影響を及ぼす対応する第1および第2のそれぞれの制御パラメータの異なる値で第1フィルタおよび第2フィルタを制御することであって、第1フィルタのための第1制御パラメータセットの値が、第2フィルタのための第2制御パラメータセットの値によって引き起こされる変化率よりも遅い速度でチャネル係数推定値を変化させる、ことと、
第1および第2フィルタの誤差キャンセル性能を繰り返し推定することと、
繰り返し推定した後に、第1または第2フィルタの係数が、より高い性能を有すると推定された第1または第2フィルタの他方の係数に近づくように、より低い性能を有すると推定された第1または第2フィルタの係数を更新することと、
をさらに備える、例34に記載の装置。
【0159】
例36.
前記更新するステップは、より低い性能を有すると推定される前記第1または第2フィルタの係数を、より高い性能を有すると推定される前記第1または第2フィルタの他の係数に等しいと推定されるように更新するステップをさらに含む、例35に記載の装置。
【0160】
例37.
前記性能が出力電力によって特徴付けられる、例35に記載の装置。
【0161】
例38.
前記少なくとも2つのフィルタの前記第1フィルタおよび前記第2フィルタを、対応する第1および第2のそれぞれの制御パラメータの異なる値で制御するステップは、
第1推定値および第2推定値の過去の履歴に基づく残存遠端対近端比の第1推定値であって、その比の合理的に低い値であるとして選択される第1推定値と、1つ以上のマイクロフォンからの信号および遠端信号の観測に基づいて、上限が最高値として選択される、残存遠端対近端比の上限である、第2推定値との、残存遠端から近端比の2つの推定値を決定するステップと、
第1適応フィルタの第1信頼パラメータを第1推定値に設定するステップと、
第2適応フィルタの第2信頼パラメータを第2推定値に設定するステップと、
をさらに備える、例35に記載の装置。
【0162】
例39.
前記第1推定値は、前記比の合理的に低い値であるとして選択され、前記比は前記第2推定値よりも有意に低い、例38に記載の装置。
【0163】
例40.
前記1つ以上のメモリおよび前記コンピュータプログラムコードは、前記1つ以上のプロセッサを用いて、前記装置に、より高い性能を有すると推定される前記第1または第2フィルタのうちの他方の電力レベルに等しいより低い性能を有すると推定される前記第1または第2フィルタの推定電力レベルを設定させるようにさらに構成される、例35に記載の装置。
【0164】
例41.
前記1つ以上のメモリおよび前記コンピュータプログラムコードは、前記1つ以上のプロセッサを用いて、前記装置に前記第2フィルタが前記第1フィルタよりも低い性能を有すると推定されることに応答して、前記第1フィルタの推定されたミスアライメントを増加させるようにさらに構成される、例35に記載の装置。
【0165】
例42.
前記第1フィルタの推定ミスアラインメントを増加させることは、前記第1フィルタの推定ミスアラインメントを一定の倍率だけ増加させることを更に含む、例41に記載の装置。
【0166】
例43.
近端信号の特性が、近端信号の信号強度を含む、例33に記載の装置。
【0167】
例44.
前記信号強度が、前記近端信号の平均電力によって特徴付けられる、例43に記載の装置。
【0168】
例45.
少なくとも1つの制御パラメータを決定することは、近端信号の強度の測度に対する音響チャネルの係数の推定値の誤差の測度の比を推定することに基づく、例33に記載の装置。
【0169】
例46.
第1時刻に使用される前記異なる値の第1値は、第2時刻に使用される前記異なる値の第2値とは異なる、例33に記載の装置。
【0170】
例47.
コンピュータと共に使用するためにその中に具体化されたコンピュータプログラムコードを有するコンピュータ可読記憶媒体を含むコンピュータプログラム製品であって、前記コンピュータプログラムコードは、
1つ以上のマイクロフォンから適応エコーキャンセルシステムにおいて、少なくとも部分的に近端信号および再生遠端信号に基づくオーディオ信号を受信するためのコードであって、1つ以上のラウドスピーカが遠端信号を再生した、コードと、
1つ以上のラウドスピーカから1つ以上のマイクロフォンへの音響チャネルの係数の推定値を更新するように少なくとも部分的に少なくとも1つのフィルタで適応エコーキャンセルシステムを動作させるためのコードと、
構成可能であり、値の範囲から少なくとも1つの値に設定される、適応エコーキャンセルシステムの動作に影響を及ぼす少なくとも1つの制御パラメータを決定するためのコードであって、少なくとも1つの制御パラメータを決定することは、音響チャネルの係数の推定の精度および近端信号の特性を推定することに基づく、コードと、
適応エコーキャンセルシステムによって、少なくとも1つの制御パラメータの異なる値を有する少なくとも1つのフィルタを異なる時刻に制御するためのコードと、
を含む、コンピュータプログラム製品。
【0171】
本出願で使用される場合、「回路」という用語は、以下のうちの1つ以上またはすべてを指し得る。
(a)ハードウェアのみの回路実装(アナログおよび/またはデジタル回路のみの実装など)、および、
(b)(適用可能な)
(i)アナログおよび/またはデジタルハードウェア回路とソフトウェア/ファームウェアとの組み合わせ、および
(ii)ハードウェアプロセッサの任意の部分とソフトウェア(デジタル信号プロセッサを含む)、ソフトウェア、およびメモリとの組み合わせであって、携帯電話またはサーバなどの装置に様々な機能を実行させるように協働する組み合わせ、などのハードウェア回路とソフトウェアの組み合わせ、および、
(c)動作のためにソフトウェア(例えば、ファームウェア)を必要とするが、動作のために必要とされないときにはソフトウェアが存在しなくてもよい、マイクロプロセッサまたはマイクロプロセッサの一部などのハードウェア回路および/またはプロセッサ。
【0172】
回路のこの定義は、任意の特許請求の範囲を含む、本出願におけるこの用語の全ての使用に適用される。さらなる例として、本出願で使用されるように、回路という用語は、単にハードウェア回路もしくはプロセッサ(または複数のプロセッサ)、またはハードウェア回路もしくはプロセッサの一部、およびそれ(またはそれらの)付随するソフトウェアおよび/またはファームウェアの実装も包含する。回路という用語は例えば、特定の請求項要素に適用可能な場合、サーバ、セルラーネットワークデバイス、または他のコンピューティングもしくはネットワークデバイスにおけるモバイルデバイスまたは同様の集積回路のためのベースバンド集積回路またはプロセッサ集積回路も包含する。
【0173】
本明細書の実施形態は、ソフトウェア(1つ以上のプロセッサによって実行される)、ハードウェア(たとえば、特定用途向け集積回路)、またはソフトウェアとハードウェアとの組合せで実装され得る。例示的な実施形態ではソフトウェア(たとえば、アプリケーションロジック、命令セット)は様々な従来のコンピュータ可読媒体のうちのいずれか1つ上に維持される。本明細書の文脈では、「コンピュータ可読媒体」が、例えば
図1Aに記載され描かれたコンピュータの一例を有する、コンピュータなどの命令実行システム、機器、または装置によって、またはそれらと関連して使用するための命令を含む、記憶する、通信する、伝播する、または移送することができる任意の媒体または手段であり得る。コンピュータ可読媒体は、コンピュータなどの命令実行システム、機器、またはデバイスによって、またはそれらと関連して使用するための命令を含む、記憶する、および/または移送することができる任意の媒体または手段であり得るコンピュータ可読記憶媒体(たとえば、メモリ125または他のデバイス)を備えることができる。コンピュータ可読記憶媒体は、伝搬信号を含まない。
【0174】
必要に応じて、本明細書で論じられる異なる機能は、異なる順序で、および/または互いに同時に実行され得る。さらに、必要に応じて、上述の機能のうちの1つ以上は、任意選択であってもよく、または組み合わせられてもよい。
【0175】
本発明の様々な態様が独立請求項に記載されているが、本発明の他の態様は記載された実施形態および/または従属請求項からの特徴と独立請求項の特徴との他の組み合わせを含み、請求項に明示的に記載されている組み合わせのみを含むものではない。
【0176】
また、本明細書では上記は本発明の例示的な実施形態を説明しているが、これらの説明は限定的な意味で見られるべきではないことに留意されたい。むしろ、添付の特許請求の範囲に定義される本発明の範囲から逸脱することなくなされ得るいくつかの変形および修正がある。
【0177】
明細書および/または図面において見られ得る以下の略語は、以下のように定義される。
【0178】
5G:第5世代(fifth generation)
AEC:音響エコーキャンセルまたは音響エコーキャンセラ(Acoustic Echo Cancellation or Acoustic Echo Canceller)
APA:アフィン投影アルゴリズム(Affine Projection Algorithm)
cf:比較する(compare)
coeffs:係数(coefficients)
CP:信頼性パラメータ(Confidence Parameter)
IML:増分最大尤度(Incremental Maximum Likelihood)
JO-NLMS:ジョイント最適化正規化最小二乗平均値(Jointly Optimized Normalized Least Mean Square)
LMS:最小二乗平均(Least Mean Square)
マイク:マイクロホン(microphone)
MIMO:複数入力、複数出力(Multiple Input, Multiple Output)
MISO:複数入力、単一出力(Multiple Input, Single Output)
MLE:最大尤度推定(Maximum Likelihood Estimation)
NLMS:正規化最小二乗平均(Normalized Least Mean Square)
NP-NLMS:ノンパラメトリック正規化最小平均平方(Non-parametric Normalized Least Mean Square)
R-APA:正規化アフィン投影アルゴリズム(Regularized Affine Projection Algorithm)
RFNR:残存遠端近端比(Residual Far-end to Near-end Ratio)
RLS:再帰最小二乗法(Residual Far-end to Near-end Ratio)
s:秒(seconds)
SISO:単一入力、単一出力(Single Input, Single Output)
VAD:ボイス活動の検出(Voice Activity Detection)
WOLA:重み付き重複加算(Weighted Overlap-Add)