IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2023-100220信号処理装置、信号処理方法、および信号処理プログラム
<>
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図1
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図2
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図3
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図4
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図5
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図6
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図7
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図8
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図9
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図10
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023100220
(43)【公開日】2023-07-18
(54)【発明の名称】信号処理装置、信号処理方法、および信号処理プログラム
(51)【国際特許分類】
   H03H 21/00 20060101AFI20230710BHJP
   G10L 21/0208 20130101ALI20230710BHJP
   H04R 3/00 20060101ALI20230710BHJP
   H04R 3/02 20060101ALI20230710BHJP
【FI】
H03H21/00
G10L21/0208 100B
G10L21/0208 100A
H04R3/00 320
H04R3/02
【審査請求】未請求
【請求項の数】17
【出願形態】OL
(21)【出願番号】P 2022000759
(22)【出願日】2022-01-05
(71)【出願人】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】杉山 昭彦
【テーマコード(参考)】
5D220
5J023
【Fターム(参考)】
5D220BA04
5D220BB04
5D220CC06
5J023DA04
5J023DA05
5J023DB01
5J023DC06
5J023DD03
5J023DD05
5J023DD07
(57)【要約】
【課題】適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズを手動制御することなく、高速収束と低歪出力信号とを両立すること。
【解決手段】本願に係る信号処理装置は、第1入力手段と、第2入力手段と、第1適応フィルタと、第1減算部と、推定部とを備える。第1入力手段は、第1信号と第2信号が混在した第1混在信号を入力する。第2入力手段は、第1信号と相関のある第3信号と第2信号と相関のある第4信号とが混在した第2混在信号を入力する。第1適応フィルタは、第2混在信号をフィルタ処理して第2信号の推定値を生成する。第1減算部とは、第1混在信号と第2信号の推定値とから第1信号の推定値を生成する。推定部は、第1信号の推定値と第2信号の推定値と第2混在信号と第1適応フィルタの係数とを用いて第1信号と第2信号の振幅または電力の比を第1混在比として推定する。第1適応フィルタは、第1混在比を用いて係数を制御する。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の推定値とから前記第1信号の推定値を生成する第1減算部と、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する推定部と、
を備え、
前記第1混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
【請求項2】
前記推定部は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部と、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部と、
を備えた請求項1に記載の信号処理装置。
【請求項3】
前記第1混合部は、
前記第1適応フィルタの係数更新開始時に前記第1混在比における前記第3混在比の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき、前記第1混在比における前記第3混在比の含有割合を0%に設定する
請求項2に記載の信号処理装置。
【請求項4】
前記推定部は、
前記第2混在信号と前記第2信号の推定値とを、前記第1適応フィルタの係数の時間変化に基づいて混合して第1混合信号を生成する第2混合部と、
前記第1混合信号と前記第1信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を前記第1混在比として推定する第3信号比推定部と、
を備えた請求項1に記載の信号処理装置。
【請求項5】
前記第2混合部は、
前記第1適応フィルタの係数更新開始時に前記第1混合信号における前記第2混在信号の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき、前記第1混合信号における前記第2混在信号の含有割合を0%に設定する
請求項4に記載の信号処理装置。
【請求項6】
前記第1信号の推定値をフィルタ処理して前記第3信号の推定値を生成する第2適応フィルタと、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成する第2減算部と、をさらに備え、
前記第1適応フィルタは、
前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記推定部は、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定し、
前記第4混在比を用いて前記第2適応フィルタを制御する
請求項1に記載の信号処理装置。
【請求項7】
前記推定部は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部と、
前記第1信号の推定値と前記第4信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部と、
前記第4信号の推定値と前記第3信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第5混在比として推定する第4信号比推定部と、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する第5信号比推定部と、
前記第5混在比と前記第6混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第4混在比を生成する第3混合部と、
を備えた請求項6に記載の信号処理装置。
【請求項8】
前記推定部は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部と、
前記第1信号の推定値と前記第4信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部と、
前記第4信号の推定値と前記第3信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第5混在比として推定する第4信号比推定部と、
前記第3混在比の逆数を求めることによって前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する逆数計算部と、
前記第5混在比と前記第6混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第4混在比を生成する第3混合部と、
を備えた請求項6に記載の信号処理装置。
【請求項9】
前記第1混合部は、
前記第1適応フィルタの係数更新開始時に前記第1混在比における前記第3混在比の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき前記第1混在比における前記第3混在比の含有割合を0%に設定し、
前記第3混合部は、
前記第2適応フィルタの係数更新開始時に前記第4混在比における前記第6混在比の含有割合を100%に設定し、前記第2適応フィルタの係数の時間変化が十分に小さくなったとき前記第4混在比における前記第6混在比の含有割合を0%に設定する
請求項7または8に記載の信号処理装置。
【請求項10】
前記推定部は、
前記第4信号の推定値と前記第2信号の推定値を、前記第1適応フィルタの係数の時間変化に基づいて混合して第1混合信号を生成する第2混合部と、
前記第1混合信号と前記第1信号の推定値を用いて前記第1信号と前記第2信号の振幅または電力の比を前記第1混在比として推定する第3信号比推定部と、
前記第1信号の推定値と前記第3信号の推定値を、前記第2適応フィルタの係数の時間変化に基づいて混合して第2混合信号を生成する第4混合部と、
前記第2混合信号と前記第4信号の推定値を用いて前記第4信号と前記第3信号の振幅または電力の比を前記第4混在比として推定する第6信号比推定部と、
を備えた請求項6に記載の信号処理装置。
【請求項11】
前記第2混合部は、
前記第1適応フィルタの係数更新開始時に前記第1混合信号における前記第4信号の推定値の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき前記第1混合信号における前記第4信号の推定値の含有割合を0%に設定し、
前記第4混合部は、
前記第2適応フィルタの係数更新開始時に前記第2混合信号における前記第1信号の推定値の含有割合を100%に設定し、前記第2適応フィルタの係数の時間変化が十分に小さくなったとき前記第2混合信号における前記第1信号の推定値の含有割合を0%に設定する
請求項10に記載の信号処理装置。
【請求項12】
前記係数の時間変化は、
前記係数の2乗総和または絶対値総和の時間変化である
請求項3または5または9または11に記載の信号処理装置。
【請求項13】
前記係数の時間変化は、
前記係数の2乗部分和または絶対値部分和の時間変化である
請求項3または5または9または11に記載の信号処理装置。
【請求項14】
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号を第1適応フィルタで処理して前記第2信号の推定値を生成し、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を用いて前記第2信号の推定値の生成を制御する
信号処理方法。
【請求項15】
前記第1信号の推定値を第2適応フィルタで処理して前記第3信号の推定値を生成し、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成し、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を処理し、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、
前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定し、
前記第4混在比を用いて前記第3信号の推定値の生成を制御する
請求項14に記載の信号処理方法。
【請求項16】
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号を第1適応フィルタで処理して前記第2信号の推定値を生成するステップと、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を用いて前記第2信号の推定値の生成を制御するステップと
を実行させる信号処理プログラム。
【請求項17】
コンピュータに、
前記第1信号の推定値を第2適応フィルタで処理して前記第3信号の推定値を生成するステップと、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成するステップと、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を処理するステップと、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、
前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定するステップと、
前記第4混在比を用いて前記第3信号の推定値の生成を制御するステップと
を実行させる請求項16に記載の信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号に混在する雑音、妨害信号、エコーなどを消去する信号処理技術に関する。
【背景技術】
【0002】
マイクロホンやハンドセット等から入力された音声信号には、しばしば背景雑音が重畳されており、音声符号化や音声認識を行う上で大きな問題となる。音響的に重畳した雑音の消去を目的とした信号処理装置として、特許文献1および2には、2つの適応フィルタを用いた2入力型雑音消去装置が開示されている。劣化信号(所望の信号と雑音とが混合された信号)と参照信号(主として雑音と相関のある信号を含む)を入力して、雑音の一部または全部を消去し、強調信号(所望の信号を強調した信号)を出力する。2つの適応フィルタの内、第1の適応フィルタを用いて推定した劣化信号における信号対雑音比を用いて、ステップサイズ算出部が第2の適応フィルタの係数更新ステップサイズを算出する。なお、第1の適応フィルタは第2の適応フィルタと同様に動作するが、第1の適応フィルタの係数更新ステップサイズは第2の適応フィルタの係数更新ステップサイズよりも大きな値に設定される。このため、第1の適応フィルタの出力は、環境変化への追従性が高いが雑音の推定精度が第2の適応フィルタよりも劣る。
【0003】
ステップサイズ算出部は、第1の適応フィルタを用いて推定した劣化信号における信号対雑音比を評価し、音声信号が雑音より大きいときには音声信号による妨害が大きいとみなし、小さな係数更新ステップサイズを第2の適応フィルタに提供する。逆に、音声信号が雑音より小さいときには音声信号による妨害が小さいとみなし、大きな係数更新ステップサイズを第2の適応フィルタに提供する。このように、ステップサイズ算出部から提供された係数更新ステップサイズで第2の適応フィルタを制御することにより、十分な環境変化への追従性と雑音消去後の信号における低歪とを出力される。
【0004】
特許文献3には、上記特許文献1および2の構成から第1の適応フィルタを削除した構成が開示されている。第2の適応フィルタを用いて推定した所望信号(音声等)と第2の適応フィルタ出力の比で信号対雑音比を近似して、その信号対雑音比に基づいて算出したステップサイズで、第2の適応フィルタ自身を制御する。さらに、特許文献3には、上記特許文献1および2の構成を拡張して、2雑音入力装置の入力において雑音に混入している音声信号の影響が大きい、いわゆる音声信号によるクロストークが存在する際に雑音に混入する音声信号の消去をも行なう雑音消去装置の構成が開示されている。特許文献3においては、上記特許文献1および2の構成に加えて、参照信号からクロストークを消去する第3の適応フィルタを備えている。音声信号入力から正確に雑音を消去するため、第2のステップサイズ算出部において係数更新ステップサイズを算出し、第3の適応フィルタを制御する。
【0005】
すなわち、特許文献1乃至3の雑音消去装置は、雑音消去後の信号と適応フィルタ出力を用いて推定した信号対雑音比で、適応フィルタの係数更新を制御する。信号対雑音比が高いときには小さなステップサイズを、信号対雑音比が低いときには大きなステップサイズを用いることで、高速収束と低歪出力信号を両立している。
【0006】
しかしながら、特許文献1乃至3の雑音消去装置では、適応フィルタの係数が全く更新されない。これは、通常、適応フィルタ係数の初期値がゼロに設定されるためである。ゼロ係数の適応フィルタはゼロを出力する。これが信号対雑音比の推定値の分母であるために、信号対雑音比の推定値は極めて大きな値となり、対応するステップサイズとしてゼロが設定される。ゼロのステップサイズは、係数更新を行わないことを意味する。これを避けるためには、係数更新開始直後に強制的にステップサイズを非ゼロの値に設定しなければならないが、実際にどの値をステップサイズに設定するか、どれだけの期間、非ゼロの値に設定しなければならないかに関して明確な設計方法は開示されていない。すなわち、2入力雑音消去装置で高速収束と低歪出力信号を両立するためには、ステップサイズの手動制御が必要である。
【0007】
特許文献4には、ステップサイズの手動制御が不要で、高速収束と低歪出力信号を両立できる2入力型雑音消去装置の構成が開示されている。雑音消去後の信号と参照信号の比で定義される新たな信号対雑音比を装置の動作直後に用いて適応フィルタの係数更新を制御し、係数更新が行われない問題を解決する。適応フィルタの係数が成長したとき、特許文献3に開示された信号対雑音比に切り替える。係数成長の評価は、前記新たな信号対雑音比が前記従来の信号対雑音比に十分近くなったことによって行う。クロストークが存在する際には、雑音入力信号から音声信号を消去する第3の適応フィルタを導入して、第2の適応フィルタと同様の原理でステップサイズを制御する。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開平10-215193号公報
【特許文献2】特開2000-172299号公報
【特許文献3】国際公開第2012/046582号
【特許文献4】国際公開第2019/092798号
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、特許文献4に記載の信号処理装置では、適応フィルタの同定する音響インパルス応答の利得が1未満である場合、推定した信号対雑音比の切換えが行われない。これは、1未満の音響インパルス応答利得で、新たな信号対雑音比が従来の信号対雑音比に十分近くならないためである。その結果、信号対雑音比の推定精度が低く、高速収束と低歪出力信号を両立できない。
【0010】
本発明の目的は、上記の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0011】
上記目的を達成するため、本発明に係る装置は、
第1信号と第2信号とが混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の推定値とから、前記第1信号の推定値を生成する第1減算部と、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数を用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する推定部と、
を備え、
前記第1混在比を用いて前記第1の適応フィルタを制御する。
【0012】
上記目的を達成するため、本発明に係る方法は、
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号をフィルタ処理して前記第2信号の推定値を生成し、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を用いて前記第2信号の推定値の生成を制御する。
【0013】
上記目的を達成するため、本発明に係るプログラムは、
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号をフィルタ処理して前記第2信号の推定値を生成するステップと、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を用いて前記第2信号の推定値の生成を制御するステップと、
を実行させる。
【発明の効果】
【0014】
本発明によれば、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズを手動制御することなく、高速収束と低歪出力信号を両立できる信号処理装置を得ることができる。
【図面の簡単な説明】
【0015】
図1】本発明の第1実施形態に係る信号処理装置の構成を示すブロック図である。
図2】本発明の第2実施形態に係る信号処理装置の構成を示すブロック図である。
図3】本発明の第2実施形態に係る推定部の第1の構成を示すブロック図である。
図4】本発明の第2実施形態に係る値の時間推移を示す図である。
図5】本発明の第2実施形態に係る推定部の第2の構成を示すブロック図である。
図6】本発明の第3実施形態に係る信号処理装置の構成を示すブロック図である。
図7】本発明の第3実施形態に係る推定部の第1の構成を示すブロック図である。
図8】本発明の第3実施形態に係る推定部の第2の構成を示すブロック図である。
図9】本発明の第3実施形態に係る推定部の第3の構成を示すブロック図である。
図10】本発明の第1の実施形態に係るコンピュータの構成を示すブロック図である。
図11図10に示すコンピュータのプロセッサによる信号処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0017】
〔1,第1実施形態〕
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。図1の信号処理装置100は、第1信号と第2信号とが混在する第1混在信号xP(k)から、第1信号の推定値e1(k)を求める装置である。
【0018】
図1に示すように、信号処理装置100は、第1入力部101と、第2入力部102と、適応フィルタ103と、減算部104と、推定部106と、係数更新制御部107とを含む。
【0019】
このうち、第1入力部101は第1信号と第2信号とが混在した第1混在信号xP(k)を入力する。第2入力部102は、第3信号と第4信号とが混在した第2混在信号xR(k)を入力する。第1信号と第3信号は、同一の信号源Aから生じており、互いに相関を有する。第2信号と第4信号は、同一の信号源Bから生じており、互いに相関を有する。
【0020】
減算部104は、第1混在信号xP(k)に混在する第2信号の推定値n1(k)と第1混在信号xP(k)を受けて、第1信号の推定値e1(k)を出力する。そして、適応フィルタ103は、第2信号の推定値n1(k)を求めるため、第2混在信号xR(k)に対して、第1信号の推定値e1(k)に基づいて更新される係数141を用いてフィルタ処理を施す。
【0021】
推定部106は、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第2混在信号xR(k)と適応フィルタ103の係数ベクトルw1(k)とを用いて、第1信号と第2信号の振幅または電力の比を第1混在比R1(k)として推定する。係数更新制御部107は、推定部106によって得られた第1混在比R1(k)の値が大きい場合に、適応フィルタ103の係数141の更新量を小さくするための制御信号μ1(k)を適応フィルタ103に出力する。
【0022】
このような構成を備えた本実施形態によれば、第1信号と第2信号とが混在する混在信号から、低演算量で、遅延なく第2信号を除くことができ、結果として、適応フィルタ103の同定する音響インパルス応答の利得が1未満であっても、第2信号の消し残りが少なく、かつ、歪が少ない第1信号の推定値を得ることができる。
【0023】
〔2,第2実施形態]
本発明の第2実施形態に係る信号処理装置として、劣化信号(所望の信号と雑音とが混合された信号)と参照信号(主として雑音と相関のある信号を含む)を入力して、雑音の一部または全部を消去し、強調信号(所望の信号を強調した信号)を出力する雑音消去装置について説明する。ここで、劣化信号は第1信号と第2信号が混在する第1混在信号に相当し、参照信号は第3信号と第4信号が混在する第2混在信号に相当し、強調信号は所望信号(第1信号の推定値)に相当する。
【0024】
〔2,1.雑音消去の基礎技術の説明〕
以下、マイクロホン、ハンドセット、通信路等から入力された所望信号に混在する雑音、妨害信号、エコーなどを適応フィルタによって消去し、または所望信号を強調する雑音消去の基礎技術の説明を簡単に行なう。
【0025】
特許文献1乃至3に開示されているように、2入力型の雑音消去装置は、雑音源から音声入力端子に至る音響経路のインパルス応答を近似する適応フィルタを用いて、参照信号から音声入力端子において音声に混入する雑音成分に対応した擬似雑音(第2信号の推定値)を生成する。そして、音声入力端子に入力された信号(第1混在信号)からこの擬似雑音を差し引くことによって、雑音成分を抑圧するように動作する。ここで、混在信号とは、所望(音声)信号と雑音とが混在した信号のことであり、一般に、マイクロホンやハンドセットから音声入力端子に供給される。また、参照信号とは、雑音源における雑音成分と相関のある信号であり、雑音源近傍において捕捉される。このように、雑音源近傍において参照信号を捕捉することで、参照信号は雑音源における雑音成分とほぼ等しいとみなすことができる。適応フィルタには、参照入力端子に供給される参照信号を入力する。
【0026】
適応フィルタの係数は、劣化信号から擬似雑音を差し引いた誤差と参照入力端子に入力された参照信号との相関をとることにより修正される。このような適応フィルタの係数修正アルゴリズムとして、特許文献1乃至3には、「LMSアルゴリズム(Least Mean-Square Algorithm)」や「LIM(Learning Identification Method):学習同定法」が開示されている。LIMはまた、正規化LMSアルゴリズムとも呼ばれる。
【0027】
正規化LMSアルゴリズムによる係数更新は、時刻kにおけるステップサイズをμ1(k)とすれば、式(1)で表される。係数ベクトルw1(k)は、その要素を用いて式(2)で定義される。参照信号ベクトルxR(k)は、その要素を用いて式(3)で表される。なお、Tはベクトルの転置を表し、係数の総数はLとする。
【数1】
【0028】
LMSアルゴリズムやLIMは、勾配法と呼ばれるアルゴリズムの一種であり、係数更新の速度と精度は、係数更新ステップサイズと呼ばれる定数に依存する。係数更新ステップサイズと誤差との積によってフィルタ係数を更新するが、誤差に含まれる所望信号(第1信号の推定値)による係数更新への妨害を低減するためには、係数更新ステップサイズを極めて小さな値またはゼロに設定する必要がある。係数更新ステップサイズを常に小さい値に設定すると、適応フィルタ係数の環境変化への追従性が低下する。上記特許文献1乃至3は、出力誤差が増大し、あるいは所望信号に歪が生じるという問題を解決する1つの方法を開示するものである。また、所望信号は一般的に音声であるために、以降音声と表記するが、本発明の趣旨は音声には限定されず、音響(オーディオ)信号を含むあらゆる種類の信号を表す。
【0029】
〔2.2.雑音消去装置の構成〕
図2は、本実施形態としての雑音消去装置200の全体構成を示すブロック図である。雑音消去装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話、補聴器、テレビジョン、スマートスピーカ、またはロボットなどといった装置の一部としても機能するが、本発明はこれに限定されるものではなく、入力信号からの雑音消去を要求されるあらゆる信号処理装置に適用可能である。
【0030】
図2に示すように、雑音消去装置200は、入力端子201から音声(第1信号)と雑音(第2信号)の混在した劣化信号(第1混在信号)xP(k)を入力する。そして、入力端子202から音声と雑音の混在した参照信号(第2混在信号)xR(k)を入力し、出力端子205から音声の推定値e1(k)(強調信号)を出力する。また、雑音消去装置200は、適応フィルタ203と、減算部204と、推定部206と、を備えている。適応フィルタ203は、図1における適応フィルタ103と係数更新制御部107とを包含する構成であり、第1混在比R1(k)を受けてステップサイズμ1(k)を算出し、算出したステップサイズμ1(k)を用いて係数ベクトルw1(k)を更新する。雑音消去装置200は、消去しようとする雑音と相関のある参照信号xR(k)を適応フィルタ203で変形して擬似雑音n1(k)を生成し、これを雑音の重畳した音声信号である劣化信号xP(k)から減算することで、雑音の消去を行うものである。
【0031】
入力端子201には、劣化信号xP(k)が、サンプル値系列として供給される。劣化信号xP(k)は、減算部204に伝達される。入力端子202には、参照信号xR(k)が、サンプル値系列として供給される。参照信号xR(k)は、適応フィルタ203と推定部206に伝達される。
【0032】
適応フィルタ203は、参照信号xR(k)とフィルタ係数の畳込み演算を行い、その結果を擬似雑音n1(k)として減算部204と推定部206に伝達する。また、適応フィルタ203は、係数ベクトルw1(k)を推定部206に供給する。
【0033】
減算部204には、入力端子201から劣化信号xP(k)が、適応フィルタ203から擬似雑音n1(k)が供給される。減算部204は、劣化信号xP(k)から擬似雑音n1(k)を減算し、その結果を音声信号の推定値e1(k)(第1信号の推定値)として出力端子205に伝達すると同時に適応フィルタ203に帰還する。
【0034】
推定部206は、音声の推定値e1(k)、擬似雑音n1(k)(適応フィルタ203の出力)、参照信号xR(k)、および適応フィルタ203の係数ベクトルw1(k)を受けて、音声と雑音の振幅または電力の比を第1混在比R1(k)として推定し、適応フィルタ203に伝達する。適応フィルタ203は、第1混在比R1(k)が大きいときに小さなステップサイズμ1(k)を、第1混在比R1(k)が小さいときに大きなステップサイズμ1(k)を用いて、係数ベクトルw1(k)を更新する。第1混在比R1(k)、すなわち信号対雑音比の推定値を用いてステップサイズを制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に開示されているように、第1混在比R1(k)を平均化してから、ステップサイズμ1(k)の計算に用いてもよい。音声と雑音の振幅または電力の比に対する推定精度が向上する。
【0035】
〔2.3.推定部206の第1の構成〕
図3は、推定部206の第1の内部構成を示すブロック図である。推定部206は、信号比推定部301、信号比推定部302、および混合部305を備えている。信号比推定部301は、音声の推定値e1(k)と擬似雑音n1(k)とを受けて、音声と雑音の振幅または電力の比を第2混在比R2(k)として推定する。第2混在比R2(k)は、音声の推定値e1(k)と擬似雑音n1(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と擬似雑音n1(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0036】
信号比推定部302は、音声の推定値e1(k)と参照信号xR(k)(第2混在信号)とを受けて、音声と雑音の振幅または電力の比を第3混在比R3(k)として推定する。第3混在比R3(k)は、音声の推定値e1(k)と参照信号xR(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と参照信号xR(k)のいずれかまたは両方を、平均化してから用いてもよい。
【0037】
混合部305は、第2混在比R2(k)と第3混在比R3(k)とを混合して、混合結果を第1混在比R1(k)として出力する。第2混在比R2(k)と第3混在比R3(k)は、重み付き加算によって混合してもよいし、さらに複雑な高次多項式などを用いて混合してもよい。混合に先立って、第2混在比R2(k)と第3混在比R3(k)のいずれかまたは両方を平均化してもよい。平均化によって、第1混在比R1(k)の計算精度、すなわち音声と雑音の振幅または電力の近似精度を向上することができる。
【0038】
ここで、単純化のために、第2混在比R2(k)と第3混在比R3(k)を重み付き加算で混合することで、第1混在比R1(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。適応フィルタ203の係数は、ゼロに初期化されることが一般的である。そのため、係数更新開始時には擬似雑音n1(k)はゼロであり、第2混在比R2(k)は分母がゼロで無限大となる。このため、第2混在比R2(k)によって適応フィルタ203のステップサイズμ1(k)を算出すると、極めて小さな値またはゼロとなり、係数が成長しない。係数が成長しないと、擬似雑音n1(k)も大きくならず、同じ問題が継続する。
【0039】
一方、第3混在比R3(k)の分母は参照信号xR(k)であり、係数更新開始時にゼロとは限らない。これは、マイク入力には環境雑音など微小な信号が含まれるためである。仮に参照信号xR(k)がゼロであっても、ゼロが継続することはない。このため、第3混在比R3(k)が無限大になることはなく、対応するステップサイズμ1(k)も極小値とはならない。したがって、適応フィルタ203の係数は、係数更新とともに成長し、雑音の信号源から入力端子201に至る経路の音響特性を表す値に収束する。参照信号xR(k)がゼロのときは、適応フィルタ203の係数は更新しないので、第3混在比R3(k)が極めて大きな値をとっても問題とはならない。しかし、適応フィルタ203の係数がある程度成長して、擬似雑音n1(k)が成長したときには、第3混在比R3(k)は第2混在比R2(k)よりも、音声と雑音の振幅または電力の比に対する近似精度が低い。
【0040】
そこで、混合部305は、適応フィルタ203の係数更新開始時に第3混在比R3(k)の重みを大きな値に設定し、係数の成長とともに減少させる。第2混在比R2(k)の重みは、適応フィルタ203の係数更新開始時に小さな値に設定し、時間とともに増加させる。これは、第3混在比R3(k)の第1混在比R1(k)における含有割合を、係数更新回数に対応して減少させることを表す。
【0041】
例えば、適応フィルタ203の係数更新開始時に第3混在比R3(k)の重みを1に設定すれば、重みの和が1という条件から、第2混在比R2(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ203の係数更新開始時に第3混在比R3(k)の重みを1に設定し、係数ベクトルw1(k)の係数更新回数に対応してその重みを0に向かって減少させる。対応して、第2混在比R2(k)の重みは0から1へ増加する。第3混在比R3(k)の重みの初期値を1と設定し、ある時点で重みが1になるか重みを1に設定すれば、第3混在比R3(k)から第2混在比R2(k)へ切り換えることになる。前記重みの和として1以外の値を設定しても、第3混在比R3(k)に対する重みの初期値を1以外に設定しても、同様の効果が得られる。重みは、適応フィルタ203の係数ベクトルw1(k)の変化量を用いて決定することができる。
【0042】
図4は、第2実施形態に係る信号の時間推移を模式的に示す図であり、参照信号xR(k)、適応フィルタ203の出力である擬似雑音n1(k)、および係数ベクトルw1(k)が示されている。図4の縦軸は、信号の値をパワーで表したものであり、係数は係数ベクトルのノルムとする。横軸は、サンプル数kで表した適応フィルタ203の係数更新回数である。xR(k)とn1(k)を比較することは、同一の分子を有し、分母がそれぞれxR(k)とn1(k)である第3混在比R3(k)と第2混在比R2(k)を比較することと等価である。xR(k)は係数更新と無関係なので、n1(k)が第3混在比R3(k)と第2混在比R2(k)の関係を決定する。n1(k)はxR(k)と係数ベクトルw1(k)で決定され、xR(k)の増減に起因する変化を除くと、その振幅またはパワーは係数更新に伴って増加する。すなわち、xR(k)は一定で、n1(k)は係数更新による係数ベクトルw1(k)の増加と共に増加する。
【0043】
以上説明した参照信号xR(k)、適応フィルタ203の出力である擬似雑音n1(k)、および係数ベクトルw1(k)の関係は、図4から明らかである。図4では、係数更新と無関係なxR(k)は、簡単のため一定として表した。xR(k)に依存するn1(k)は、スムーズに増加し、係数ベクトルw1(k)が収束するとn1(k)も飽和する。適応フィルタ203の係数ベクトルw1(k)の変化量は係数更新に伴って小さくなるので、n1(k)がゼロからどれだけ成長したかの指標として、係数ベクトルw1(k)の変化量を用いることができる。すなわち、混合部305は、係数ベクトルw1(k)の時間変化によって、第3混在比R3(k)の重みを決定する。
【0044】
係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の要素の2乗総和または絶対値総和の時間変化としてもよいし、2乗部分和または絶対値部分和の時間変化であってもよい。部分和とする際には、係数ベクトルの要素を間引いたものを用いてもよいし、係数ベクトルの一部を切り出したものを用いてもよい。部分和を用いることで、時間変化の評価精度低下を抑えつつ、係数の時間変化に必要とする演算量を削減することができる。また、係数は入力信号に依存しないで変化するので、滑らかである。従って、入力信号に依存する他の指標よりも最小的に変動が小さく、飽和状態を正確に検出できる。
【0045】
式(4)に、第2混在比R2(k)と第3混在比R3(k)とを重み付き加算によって混合する例を示す。式(5)で表されるζ1(k)はζ1(0)=0を満たし、係数更新と共に増加する。適応フィルタ203の係数ベクトルw1(k)の時間変化に相当するδ1(k)は式(6)で求めることができる。Mは自然数であり、係数ベクトルw1(k)の時間変化を計算する頻度を決定する。Mが大きいほどδ1(k)の変動が小さく係数飽和の検出が正確になるが、δ1(k)の変化に生じる大きな遅延によって係数飽和の検出が遅れる。式(5)は、時間変化δ1(k)の値が閾値ε1未満になったとき、第1混在比R1(k)における第3混在比R3(k)の含有割合を0に設定する例を表し、第1混在比R1(k)を第3混在比R3(k)から第2混在比R2(k)に切り換える。これは、時間変化δ1(k)の値が十分に小さくなったことを判定する方法の一例である。式(5)の代わりにζ1(k)=δ1(k)/|δ1(M)|とすれば、係数ベクトルw1(k)の時間変化が第3混在比R3(k)の含有割合を計測して定める構成となる。
【数2】
【0046】
このように、混合部305は、時間変化δ1(k)と閾値ε1との比較結果に基づいて、第1混在比R1(k)における第3混在比R3(k)の含有割合を100%および0%のうちのいずれかに設定することができる。なお、係数ベクトルw1(k)の時間変化δ1(k)と閾値ε1とを繰り返し比較し、係数ベクトルw1(k)の時間変化δ1(k)が閾値ε1以上である場合に、第1混在比R1(k)における第3混在比R3(k)の含有割合を100%にし、そうでない場合に、第1混在比R1(k)における第3混在比R3(k)の含有割合を0%にする処理を繰り返してもよい。これにより、環境の変化に対する追従性の高い第1混在比R1(k)を得ることができ、例えば、適応フィルタ203の係数ベクトルw1(k)の更新量が急増した場合であっても、より正確な係数更新が可能となる。
【0047】
混合部305は、係数ベクトルw1(k)の時間変化δ1(k)が予め定められた第1定数L1以上連続して閾値ε1未満になった場合に、第1混在比R1(k)における第3混在比R3(k)の含有割合を0%にし、それ以外の場合には、第1混在比R1(k)における第3混在比R3(k)の含有割合を100%にすることもできる。第3混在比R3(k)の含有割合が1回0%に設定された後、閾値を十分に大きく設定することで、δ1(k)とε1の比較を停止してもよい。ここに、L1は、2以上の整数である。
【0048】
混合部305は、係数ベクトルw1(k)の時間変化δ1(k)が予め定められた第2定数L2と等しいサンプル数を有する区間において、予め定められた第3定数L3以上連続してδ1(k)が閾値ε1未満になったときに、第1混在比R1(k)における第3混在比R3(k)の含有割合を0%にし、それ以外の場合には、第1混在比R1(k)における第3混在比R3(k)の含有割合を100%にすることもできる。第2定数L2及び第3定数L3は共に2以上の整数で、L2>L3を満足する。さらに、上記評価から連続の条件を削除して、予め定められた第3定数L3以上δ1(k)が閾値ε1未満になる回数を評価することもできる。第3混在比R3(k)の含有割合が1回0%に設定された後、L3をL2より大きな値に設定することで、δ1(k)の評価を停止してもよい。
【0049】
なお、混合部305は、第2混在比R2(k)および第3混在比R3(k)の重みの最小値を0ではなく、0よりも大きな値とすることもできる。
【0050】
〔2.4.推定部206の第2の構成〕
図5は、推定部206の第2の内部構成を示すブロック図である。推定部206は、混合部506と信号比推定部503とを備えている。混合部506は、参照信号xR(k)(第2混在信号)と擬似雑音n1(k)(第2信号の推定値)とを係数ベクトルw1(k)に基づいて混合して、第1混合信号n3(k)を生成する。信号比推定部503は、音声の推定値e1(k)と第1混合信号n3(k)とを受けて、音声と雑音の振幅または電力の比を第1混在比R1(k)として推定する。第1混在比R1(k)は、音声の推定値e1(k)と第1混合信号n3(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、推定値e1(k)と第1混合信号n3(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0051】
図5に示す推定部206の第2の内部構成は、図3に示す推定部206の第1の内部構成と等価である。すなわち、図3に示す第1の内部構成は、音声と雑音の振幅または電力の比に対して2つの推定値を信号比推定部301、302で生成し、それらを混合して第1混在比R1(k)を算出する。図5に示す推定部206の第2の内部構成は、2種類の雑音の推定値、すなわち参照信号xR(k)と擬似雑音n1(k)を混合して第1混合信号n3(k)を生成して分母を確定し、分子である音声の推定値e1(k)と作用させて第1混在比R1(k)を算出する。これら2種類の構成が可能となったのは、図3に示す第1の内部構成と図5に示す第2の内部構成において、音声と雑音の振幅または電力の比を推定する際に、同一の分子、すなわち音声の推定値e1(k)を用いるからである。図5に示す推定部206の第2の内部構成は、図3に示す第1の内部構成よりも、構成が単純である。
【0052】
ここで、単純化のために、参照信号xR(k)と擬似雑音n1(k)とを適応フィルタ203の係数ベクトルw1(k)に基づいて重み付き加算で混合することで、第1混合信号n3(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。このとき、混合部506は、適応フィルタ203の係数更新開始時に参照信号xR(k)の重みを大きな値に設定し、係数ベクトルw1(k)の時間変化の減少とともに減少させる。擬似雑音n1(k)の重みは、適応フィルタ203の係数更新開始時に小さな値に設定し、係数ベクトルw1(k)の時間変化の減少とともに増加させる。これは、擬似雑音n1(k)が係数更新開始時にゼロとなるので、信号対雑音比が大きくなって係数が更新されないことを回避するためである。このような制御は、参照信号xR(k)の第1混合信号n3(k)における含有割合を、係数ベクトルw1(k)の時間変化の減少に対応して減少させることを表す。
【0053】
例えば、適応フィルタ203の係数更新開始時に参照信号xR(k)の重みを1に設定すれば、擬似雑音n1(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ203の係数更新開始時に参照信号xR(k)の重みを1に設定し、係数更新回数に対応してその重みを0に向かって減少させる。対応して、擬似雑音n1(k)の重みは、0から1へ増加する。
【0054】
参照信号xR(k)の重みは減少し、擬似雑音n1(k)の重みは増加する。両者の重みを1と0の2値で表せば、参照信号xR(k)の重みは1を維持した後に0に変化する。擬似雑音n1(k)の重みは0を維持した後に1に変化する。
【0055】
混合部506の動作は、入力信号である第2混在比と第3混在比が擬似雑音と参照信号(第2混在信号)にそれぞれ置き換わったことを除いて、混合部305の動作と同様である。従って、すでに説明した混合部305の動作に関する変更例は、混合部506にも同様に適用できる。
【0056】
また、混合部506は、参照信号xR(k)および擬似雑音n1(k)の重みの最小値を0ではなく、0よりも大きな値とすることもできる。
【0057】
以上の構成により、本実施形態は、ステップサイズに特別な値を強制的に設定することなく、円滑に係数更新を行うことができ、結果として、雑音の消し残りが少なく、かつ、信号歪が少ない出力信号を得ることができる。
【0058】
〔3.第3実施形態〕
これまでの説明では、雑音源近傍において参照信号の捕捉を行うことによって、参照信号は雑音そのものであると仮定してきた。しかし、現実にはこの条件を満たすことのできない場合が存在する。このような場合には、参照信号は雑音とそれに混入する音声信号とから構成される。このような参照信号に対する音声信号の混入成分はクロストークと呼ばれる。クロストークが存在する際の雑音消去装置の構成が、特許文献3に開示されている。
【0059】
本実施形態では、雑音の消去と同様に、クロストークを消去するための第2の適応フィルタを導入する。音声信号源から参照入力端子に至る音響経路(クロストークパス)のインパルス応答を近似する第2の適応フィルタを用いて、参照入力端子において混入する音声信号成分に対応した擬似クロストーク信号を生成する。そして、参照入力端子に入力された信号(参照信号)からこの擬似クロストーク信号を差し引くことによって、音声信号成分(クロストーク)を消去する。
【0060】
本発明の第3実施形態としての雑音消去装置について、図6を用いて説明する。第2実施形態と比べた場合、本実施形態に係る雑音消去装置は、減算部204、適応フィルタ203に加えて、減算部804、適応フィルタ803とを備え、推定部206が推定部806に置換されている。その他の構成および動作は、第2実施形態と同様であるため、同じ構成には同じ符号を付して詳しい説明を省略する。
【0061】
雑音消去装置800は、消去しようとするクロストークに相関のある信号(出力端子205における出力=推定音声信号あるいは強調信号)を適応フィルタで変形して擬似クロストークn2(k)(第3信号の推定値)を生成する。そして、これを音声と雑音の混在した参照信号xR(k)から減算することで、クロストークの消去を行う。適応フィルタ803の係数更新を行う際に、第4信号と第3信号の振幅またはパワーの比を近似する第4混在比R4(k)を用いてステップサイズを制御するために、係数更新を円滑に進めることができ、結果として、雑音の消し残りが少なく、かつ、信号歪が少ない出力信号を得ることができる。
【0062】
入力端子201には、劣化信号xP(k)が、サンプル値系列として供給され、減算部204に伝達される。入力端子202には、参照信号xR(k)がサンプル値系列として供給され、減算部804に伝達される。
【0063】
減算部804には、入力端子202から参照信号xR(k)が、適応フィルタ803から擬似クロストークn2(k)が供給される。減算部804は、参照信号xR(k)から擬似クロストークn2(k)を減算し、その結果を雑音の推定値e2(k)(第4信号の推定値)として出力端子805に伝達すると同時に適応フィルタ803に帰還する。また、減算部804は、雑音の推定値e2(k)を推定部806に供給する。
【0064】
適応フィルタ803は、音声の推定値e1(k)(強調信号)とフィルタ係数の畳込み演算を行い、その結果を擬似クロストークn2(k)(第3信号の推定値)として減算部804と推定部806に伝達する。また、適応フィルタ803は、係数ベクトルw2(k)を推定部806に供給する。
【0065】
減算部804には、入力端子202から参照信号xR(k)が、適応フィルタ803から擬似クロストークn2(k)が供給される。減算部804は、参照信号xR(k)から擬似クロストークn2(k)を減算し、その結果を雑音推定値(第4信号の推定値)として出力端子805に伝達すると同時に適応フィルタ803に帰還する。
【0066】
推定部806は、音声の推定値e1(k)、擬似雑音n1(k)(適応フィルタ203の出力)、雑音の推定値e2(k)(第4信号の推定値)、および適応フィルタ203の係数ベクトルw1(k)を受けて、音声と雑音の振幅または電力の比を第1混在比R1(k)として推定し、適応フィルタ203に伝達する。適応フィルタ203は、第1混在比R1(k)が大きいときに小さなステップサイズμ1(k)を、第1混在比R1(k)が小さいときに大きなステップサイズμ1(k)を用いて、係数を更新する。なお、図6に示す適応フィルタ203は、参照信号xR(k)に代えて雑音の推定値e2(k)が入力される点で、図2に示す適応フィルタ203とは異なる。第1混在比R1(k)、すなわち信号対雑音比の推定値を用いてステップサイズを制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に開示されているように、第1混在比R1(k)を平均化してから、ステップサイズμ1(k)の計算に用いてもよい。音声と雑音の振幅または電力の比に対する推定精度が向上する。
【0067】
推定部806は、さらに、擬似クロストークn2(k)(適応フィルタ803の出力)と適応フィルタ803の係数ベクトルw2(k)を受けて、第4信号と第3信号の振幅または電力の比を第4混在比R4(k)として推定し、適応フィルタ803に伝達する。式(7)に示す係数ベクトルw2(k)のサイズは、係数ベクトルw1(k)のサイズLと等しくてもよいし、異なってもよい。
【数3】
【0068】
適応フィルタ803は、第4混在比R4(k)が大きいときに小さなステップサイズμ2(k)を、第4混在比R4(k)が小さいときに大きなステップサイズμ2(k)を用いて、係数を更新する。第4混在比R4(k)、すなわち信号対雑音比の推定値を用いてステップサイズμ2(k)を制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に詳細に開示されているように、第4混在比R4(k)を平均化してから、ステップサイズμ2(k)の計算に用いてもよい。第4信号と第3信号の振幅または電力の比に対する推定精度が向上する。
【0069】
〔3.1.推定部806の第1の構成〕
図7は、推定部806の第1の内部構成を示すブロック図である。推定部806は、推定部206の構成に加えて、信号比推定部901、信号比推定部902、および混合部905を備えている。図7に示す信号比推定部302は、参照信号xR(k)に代えて雑音の推定値e2(k)を用いる点で、図3に示す信号比推定部302と異なるが、それ以外の動作は等しい。信号比推定部901は、雑音の推定値e2(k)と擬似クロストークn2(k)を受けて、雑音とクロストークの振幅または電力の比を第5混在比R5(k)として推定する。第5混在比R5(k)は、雑音の推定値e2(k)と擬似クロストークn2(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、雑音の推定値e2(k)と擬似クロストークn2(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0070】
信号比推定部902は、雑音の推定値e2(k)と音声の推定値e1(k)(第1信号の推定値)を受けて、雑音とクロストークの振幅または電力の比を第6混在比R6(k)として推定する。第6混在比R6(k)は、雑音の推定値e2(k)と音声の推定値e1(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、雑音の推定値e2(k)と音声の推定値e1(k)のいずれかまたは両方を、平均化してから用いてもよい。
【0071】
混合部905は、第5混在比R5(k)と第6混在比R6(k)とを適応フィルタ803の係数ベクトルw2(k)を用いて混合して、混合結果を第4混在比R4(k)として出力する。第5混在比R5(k)と第6混在比R6(k)は、適応フィルタ803の係数ベクトルw2(k)を用いた重み付き加算によって混合してもよいし、さらに複雑な高次多項式などを用いて混合してもよい。混合に先立って、第5混在比R5(k)と第6混在比R6(k)のいずれかまたは両方を平均化してもよい。平均化によって、第4混在比R4(k)の計算精度、すなわち雑音とクロストークの振幅または電力の近似精度を向上することができる。
【0072】
ここで、単純化のために、第5混在比R5(k)と第6混在比R6(k)を重み付き加算で混合することで、第4混在比R4(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。適応フィルタ803の係数は、ゼロに初期化されることが一般的である。そのため、係数更新開始時には擬似クロストークn2(k)はゼロであり、第5混在比R5(k)は分母がゼロで無限大となる。このため、第5混在比R5(k)によって適応フィルタ803のステップサイズを算出すると、極めて小さな値またはゼロとなり、係数が成長しない。係数が成長しないと、擬似クロストークn2(k)も大きくならず、同じ問題が継続する。
【0073】
一方、第6混在比R6(k)の分母は音声の推定値e1(k)であり、係数更新開始時にゼロとは限らない。これは、マイク入力である劣化信号には環境雑音など微小な信号が含まれるためである。仮に劣化信号がゼロであっても、ゼロが継続することはない。このため、第6混在比R6(k)が無限大になることはなく、対応するステップサイズも極小値とはならない。したがって、適応フィルタ803の係数は、係数更新とともに成長し、音声の信号源から入力端子202に至る経路の音響特性を表す値に収束する。音声の推定値e1(k)がゼロのときは、適応フィルタ803の係数は更新しないので、第6混在比R6(k)が極めて大きな値をとっても問題とはならない。しかし、適応フィルタ803の係数がある程度成長して、擬似クロストークn2(k)が十分に大きく成長したときには、第6混在比R6(k)は第5混在比R5(k)よりも、雑音とクロストークの振幅または電力の比に対する近似精度が低い。
【0074】
そこで、混合部905は、適応フィルタ803の係数更新開始時に第6混在比R6(k)の重みを大きな値に設定し、係数の成長とともに減少させる。第5混在比R5(k)の重みは、適応フィルタ803の係数更新開始時に小さな値に設定し、係数の成長とともに増加させる。これは、第6混在比R6(k)の第4混在比R4(k)における含有割合を、係数更新回数に対応して減少させることを表す。
【0075】
例えば、適応フィルタ803の係数更新開始時に第6混在比R6(k)の重みを1に設定すれば、重みの和が1という条件から、第5混在比R5(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ803の係数更新開始時に第6混在比R6(k)の重みを1に設定し、係数ベクトルw2(k)の時間変化の減少に対応してその重みを0に向かって減少させる。対応して、第5混在比R5(k)の重みは、0から1へ増加する。第6混在比R6(k)の重みの初期値を1と設定し、ある時点で重みが1になるか重みを1に設定すれば、第6混在比R6(k)から第5混在比R5(k)へ切り換えることになる。前記重みの和として1以外の値を設定しても、第6混在比R6(k)に対する重みの初期値を1以外に設定しても、同様の効果が得られる。重みは、適応フィルタ803の係数ベクトルw2(k)の変化量を用いて決定することができる。すなわち、混合部905の動作は、混合部305に関する説明において入出力信号を図7で示されるように混合部905のものに変更することで、混合部305の動作と同様になる。
【0076】
〔3.2.推定部806の第2の構成〕
図8は、第3実施形態に係る推定部806の第2の構成を示すブロック図である。図8に示す推定部806の第2の内部構成は、図7に示す推定部806の第1の内部構成と等価である。図8に示す推定部806は、信号比推定部902に代えて、逆数計算部1006を備える点で、図7に示す推定部806と異なる。
【0077】
逆数計算部1006は、第3混在比R3(k)の逆数を求めることによって第4信号と第3信号の振幅または電力の比を第6混在比R6(k)として推定する。これにより、図8に示す推定部806は、図7に示す推定部806に比べて、演算負荷を軽減することができる。
【0078】
〔3.3.推定部806の第3の構成〕
図9は、推定部806の第3の内部構成を示すブロック図である。推定部806は、混合部506と信号比推定部503に加えて、さらに混合部1106と信号比推定部1103を備えている。混合部1106は、音声の推定値e1(k)(強調信号)(第1信号の推定値)と擬似クロストークn2(k)(第3信号の推定値)とを適応フィルタ803の係数ベクトルw2(k)を用いて混合して、第2混合信号n4(k)を生成する。信号比推定部1103は、雑音の推定値e2(k)と第2混合信号n4(k)を受けて、雑音とクロストークの振幅または電力の比を第4混在比R4(k)として推定する。第4混在比R4(k)は、雑音の推定値e2(k)と第2混合信号n4(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、雑音の推定値e2(k)と第2混合信号n4(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0079】
図9に示す推定部806の第3の内部構成は、図7に示す推定部806の第1の内部構成と等価である。すなわち、図7に示す第1の内部構成は、雑音とクロストークの振幅または電力の比に対して2つの推定値を信号比推定部901と902で生成し、それらを混合して第4混在比R4(k)を算出する。図9に示す第3の内部構成は、2種類の推定値、すなわち音声の推定値e1(k)と擬似クロストークn2(k)を適応フィルタ803の係数ベクトルw2(k)を用いて混合して第2混合信号n4(k)を生成して分母を確定し、分子である雑音の推定値e2(k)と作用させて第4混在比R4(k)を算出する。これら2種類の構成が可能となったのは、図7に示す第1の内部構成と図9に示す第3の内部構成において、雑音とクロストークの振幅または電力の比を推定する際に、同一の分子、すなわち雑音の推定値e2(k)を用いるからである。図9に示す推定部806の第3の内部構成は、図7に示す第1の内部構成よりも、構成が単純である。なお、図9に示す混合部506は、参照信号xR(k)に代えて雑音の推定値e2(k)を用いる点で図5に示す混合部506と異なるが、その動作は同様である。
【0080】
ここで、単純化のために、音声の推定値e1(k)と擬似クロストークn2(k)を適応フィルタ803の係数ベクトルw2(k)を用いて重み付き加算で混合することで、第2混合信号n4(k)を求める、且つ、両者の重みの和が1となるように設定する場合を考える。
【0081】
混合部1106は、適応フィルタ803の係数更新開始時に音声の推定値e1(k)の重みを大きな値に設定し、係数の成長とともに減少させる。また、混合部1106は、適応フィルタ803の係数更新開始時に擬似クロストークn2(k)の重みを小さな値に設定し、係数の成長とともに増加させる。これは、擬似クロストークn2(k)が係数更新開始時にゼロとなり、信号対雑音比の推定値が大きくなって係数が更新されないことを回避するためである。
【0082】
例えば、適応フィルタ803の係数更新開始時に音声の推定値e1(k)の重みを1に設定すれば、重みの和が1という条件から、擬似クロストークn2(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ803の係数更新開始時に音声の推定値e1(k)の重みを1に設定し、係数更新回数に対応してその重みを0に向かって減少させる。対応して、擬似クロストークn2(k)の重みは0から1へ増加する。重みは、適応フィルタ803の係数ベクトルw2(k)の変化量を用いて決定することができる。すなわち、混合部1106の動作は、混合部506に関する説明において入出力信号を図9で示されるように混合部1106のものに変更することで、混合部506の動作と同様になる。
【0083】
以上の構成により、本実施形態は、クロストークが存在する場合でも、ステップサイズに特別な値を強制的に設定することなく、円滑に係数更新を行うことができ、結果として、雑音の消し残りが少なく、かつ、信号歪が少ない出力信号を得ることができる。
【0084】
〔4.他の実施形態〕
以上、本発明の複数の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0085】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、上述の実施形態の機能を実現する情報処理プログラム(信号処理プログラム)が、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。そのようなプログラムは、信号処理装置あるいは雑音消去装置を構成するDSP(Digital Signal Processor)などのプロセッサで実行される。さらには、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
【0086】
図10は、第1~第3実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ1200の構成図である。コンピュータ1200は、入力部1201と、プロセッサ1203と、出力部1202と、メモリ1204とを含む。
【0087】
プロセッサ1203は、メモリ1204に記憶された信号処理プログラムを読み込むことにより、コンピュータ1200の動作を制御する。プロセッサ1203は、例えば、DSP、CPU(Central Processing Unit)、またはMPU(Micro Processing Unit)などのプロセッサである。メモリ1204は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、およびEEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)のうち1つ以上を含む。
【0088】
図11は、図10に示すコンピュータのプロセッサによる信号処理の一例を示すフローチャートである。図11に示す例は、コンピュータ1200が第1実施形態に係る信号処理装置100として機能する場合のフローチャートである。
【0089】
図11に示すように、信号処理プログラムを実行したプロセッサ1203は、ステップS10において、まず、入力部1201から、第1信号と第2信号が混在した第1混在信号xP(k)を入力し、第1信号と相関のある第3信号と第2信号と相関のある第4信号とが混在した第2混在信号xR(k)を入力する。
プロセッサ1203は、ステップS11において、第2混在信号xR(k)を第1適応フィルタ(適応フィルタ103)で処理して第2信号の推定値n1(k)を生成し、ステップS12において、第1混在信号xP(k)と第2信号の推定値n1(k)から第1信号の推定値e1(k)を生成する。
プロセッサ1203は、ステップS13において、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第2混在信号xR(k)と第1適応フィルタ(適応フィルタ103)の係数ベクトルw1(k)を用いて第1信号と第2信号の振幅または電力の比を第1混在比R1(k)として推定する。
プロセッサ1203は、ステップS14において、第1混在比R1(k)を用いて第2信号の推定値n1(k)の生成を制御する。これにより、第1実施形態と同様の効果を得ることができる。
【0090】
また、コンピュータ1200が第2実施形態に係る信号処理装置として機能する場合、プロセッサ1203は、ステップS10において、第1混在信号xP(k)と第2混在信号xR(k)とを入力し、ステップS11において、第2混在信号xR(k)を第1適応フィルタ(適応フィルタ203)で処理して第2信号の推定値n1(k)を生成する。プロセッサ1203は、ステップS12において第1混在信号xP(k)と第2信号の推定値n1(k)とから第1信号の推定値e1(k)を生成する。プロセッサ1203は、ステップS13において、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第2混在信号xR(k)と第1適応フィルタ(適応フィルタ203)の係数141とを用いて第1混在比R1(k)を生成する。プロセッサ1203は、ステップS14において、第1混在比R1(k)を用いて第2信号の推定値n1(k)の生成を制御する。
【0091】
また、コンピュータ1200が第3実施形態に係る信号処理装置として機能する場合、プロセッサ1203は、ステップS13において、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第4信号の推定値e2(k)と第1適応フィルタ(適応フィルタ203)の係数141とを用いて第1混在比R1(k)を生成する。さらに、プロセッサ1203は、第1信号の推定値e1(k)を第2適応フィルタ(適応フィルタ803)で処理して第3信号の推定値n2(k)を生成し、第2混在信号xR(k)から第3信号の推定値n2(k)を減算して第4信号の推定値e2(k)を生成する。また、プロセッサ1203は、第1適応フィルタ(適応フィルタ203)において第3信号の推定値xR(k)に代えて第4信号の推定値e2(k)を処理し、第4信号の推定値e2(k)と第3信号の推定値n2(k)と第1信号の推定値e1(k)と第2適応フィルタ(適応フィルタ803)の係数とをさらに用いて、雑音と音声信号の振幅または電力の比を第4混在比R4(k)としてさらに推定する。
【0092】
〔5.その他〕
また、上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0093】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0094】
〔6.効果〕
上述してきたように、第1実施形態に係る信号処理装置100は、第1入力部101(第1入力手段の一例に相当)と、第2入力部102(第2入力手段の一例に相当)と、適応フィルタ103(第1適応フィルタの一例に相当)と、減算部104(第1減算部の一例に相当)と、推定部106とを備える。第1入力部101は、第1信号と第2信号が混在した第1混在信号xP(k)を入力する。第2入力部102は、第1信号と相関のある第3信号と第2信号と相関のある第4信号とが混在した第2混在信号xR(k)を入力する。適応フィルタ103は、第2混在信号xR(k)をフィルタ処理して第2信号の推定値n1(k)を生成する。減算部104は、第1混在信号xP(k)と第2信号の推定値n1(k)とから第1信号の推定値e1(k)を生成する。推定部106は、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第2混在信号xR(k)と適応フィルタ103の係数141とを用いて第1信号と第2信号の振幅または電力の比を第1混在比R1(k)として推定する。係数更新制御部107は、推定部106によって得られた第1混在比R1(k)の値が大きい場合に、適応フィルタ103の係数141の更新量を小さくするための制御信号μ1(k)を適応フィルタ103に出力する。信号処理装置100は、制御信号μ1(k)を用いて適応フィルタ103を制御する。これにより、信号処理装置100は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0095】
また、第2実施形態に係る信号処理装置は、入力端子201(第1入力手段の一例に相当)と、入力端子202(第2入力手段の一例に相当)と、適応フィルタ203(第1適応フィルタの一例に相当)と、減算部204(第1減算部の一例に相当)と、推定部206とを備える。入力端子201は、音声信号(第1信号の一例に相当)と雑音(第2信号の一例に相当)とが混在した劣化信号xP(k)(第1混在信号の一例に相当)を入力する。入力端子202は、音声信号と相関のある信号(第3信号の一例に相当)と雑音と相関のある信号(第4信号の一例に相当)とが混在した参照信号xR(k)(第2混在信号の一例に相当)を入力する。適応フィルタ203は、参照信号xR(k)をフィルタ処理して擬似雑音n1(k)(第2信号の推定値の一例に相当)を生成する。減算部104は、劣化信号xP(k)と擬似雑音n1(k)とから音声の推定値e1(k)(第1信号の推定値e1(k)の一例に相当)を生成する。推定部206は、音声の推定値e1(k)と擬似雑音n1(k)と参照信号xR(k)と適応フィルタ203の係数とを用いて音声信号と雑音の振幅または電力の比を第1混在比R1(k)として推定する。信号処理装置100は、第1混在比R1(k)を用いて適応フィルタ203を制御する。これにより、第2実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0096】
また、推定部206は、信号比推定部301(第1信号比推定部の一例に相当)と、信号比推定部302(第2信号比推定部の一例に相当)と、混合部305(第1混合部の一例に相当)とを備える。信号比推定部301は、音声の推定値e1(k)と擬似雑音n1(k)とを用いて音声信号と雑音の振幅または電力の比を第2混在比R2(k)として推定する。信号比推定部302は、音声の推定値e1(k)と参照信号xR(k)とを用いて音声信号と雑音の振幅または電力の比を第3混在比R3(k)として推定する。混合部305は、第2混在比R2(k)と第3混在比R3(k)を、適応フィルタ203の係数ベクトルw1(k)の時間変化に基づいて混合して第1混在比R1(k)を生成する。これにより、第2実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0097】
また、混合部305は、適応フィルタ203の係数更新開始時に第1混在比R1(k)における第3混在比R3(k)の含有割合を100%に設定し、適応フィルタ203の係数ベクトルw1(k)の時間変化が十分に小さくなったとき、第1混在比R1(k)における第3混在比R3(k)の含有割合を0%に設定する。これにより、第2実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0098】
また、推定部206は、混合部506(第2混合部の一例に相当)と、信号比推定部503(第3信号比推定部の一例に相当)とを備える。混合部506は、参照信号xR(k)と擬似雑音n1(k)とを、適応フィルタ203の係数ベクトルw1(k)の時間変化に基づいて混合して第1混合信号n3(k)を生成する。信号比推定部503は、第1混合信号n3(k)と音声の推定値e1(k)とを用いて音声信号と雑音の振幅または電力の比を第1混在比R1(k)として推定する。これにより、第2実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0099】
また、混合部506は、適応フィルタ203の係数更新開始時に第1混合信号n3(k)における参照信号xR(k)の含有割合を100%に設定し、適応フィルタ203の係数ベクトルw1(k)の時間変化が十分に小さくなったとき、第1混合信号n3(k)における参照信号xR(k)の含有割合を0%に設定する。これにより、第2実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0100】
また、第3実施形態に係る信号処理装置は、入力端子201と、入力端子202と、適応フィルタ203と、減算部204と、減算部804(第2減算部の一例に相当)と、適応フィルタ803(第2適応フィルタの一例に相当)と、推定部806とを備える。適応フィルタ803は、第1信号の推定値e1(k)をフィルタ処理して擬似クロストークn2(k)(第3信号の推定値の一例に相当)を生成する。減算部804は、参照信号xR(k)から擬似クロストークn2(k)を減算して雑音の推定値e2(k)(第4信号の推定値の一例に相当)を生成する。適応フィルタ203は、参照信号xR(k)に代えて雑音の推定値e2(k)を入力とする。推定部806は、推定部206の機能に加えて、雑音の推定値e2(k)と擬似クロストークn2(k)と第1信号の推定値e1(k)と適応フィルタ803の係数とをさらに用いて、雑音と音声信号の振幅または電力の比を第4混在比R4(k)としてさらに推定する。第4実施形態に係る信号処理装置は、第4混在比R4(k)を用いて適応フィルタ803を制御する。これにより、第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0101】
また、推定部806は、信号比推定部301と、信号比推定部302と、混合部305と、信号比推定部901(第4信号比推定部の一例に相当)と、信号比推定部902(第5信号比推定部の一例に相当)と、混合部905(第3混合部の一例に相当)とを備える。信号比推定部301は、音声の推定値e1(k)と擬似雑音n1(k)とを用いて音声信号と雑音の振幅または電力の比を第2混在比R2(k)として推定する。信号比推定部302は、音声の推定値e1(k)と雑音の推定値e2(k)とを用いて音声信号と雑音の振幅または電力の比を第3混在比R3(k)として推定する。混合部305は、第2混在比R2(k)と第3混在比R3(k)を、適応フィルタ203の係数ベクトルw1(k)の時間変化に基づいて混合して第1混在比R1(k)を生成する。信号比推定部901は、雑音の推定値e2(k)と擬似クロストークn2(k)とを用いて雑音と音声信号の振幅または電力の比を第5混在比R5(k)として推定する。信号比推定部902は、雑音の推定値e2(k)と音声の推定値e1(k)とを用いて雑音と音声信号の振幅または電力の比を第6混在比R6(k)として推定する。混合部905は、第5混在比R5(k)と第6混在比R6(k)を、適応フィルタ803の係数ベクトルw2(k)の時間変化に基づいて混合して第4混在比R4(k)を生成する。これにより、第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0102】
また、推定部806は、信号比推定部301と、信号比推定部302と、混合部305と、信号比推定部901と、逆数計算部1006と、混合部905とを備える。信号比推定部301は、音声の推定値e1(k)と擬似雑音n1(k)とを用いて音声信号と雑音の振幅または電力の比を第2混在比R2(k)として推定する。信号比推定部302は、音声の推定値e1(k)と雑音の推定値e2(k)とを用いて音声信号と雑音の振幅または電力の比を第3混在比R3(k)として推定する。混合部305は、第2混在比R2(k)と第3混在比R3(k)を、適応フィルタ203の係数ベクトルw1(k)の時間変化に基づいて混合して第1混在比R1(k)を生成する。信号比推定部901は、雑音の推定値e2(k)と擬似クロストークn2(k)とを用いて雑音と音声信号の振幅または電力の比を第5混在比R5(k)として推定する。逆数計算部1006は、第3混在比R3(k)の逆数を求めることによって雑音と音声信号の振幅または電力の比を第6混在比R6(k)として推定する。混合部905は、第5混在比R5(k)と第6混在比R6(k)を、適応フィルタ803の係数ベクトルw2(k)の時間変化に基づいて混合して第4混在比R4(k)を生成する。これにより、第3実施形態に係る信号処理装置は、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とをより精度よく達成することができる。
【0103】
また、混合部305は、適応フィルタ203の係数更新開始時に第1混在比R1(k)における第3混在比R3(k)の含有割合を100%に設定し、適応フィルタ203の係数ベクトルw1(k)の時間変化が十分に小さくなったとき、第1混在比R1(k)における第3混在比R3(k)の含有割合を0%に設定する。また、混合部905は、適応フィルタ803の係数更新開始時に第4混在比R4(k)における第6混在比R6(k)の含有割合を100%に設定し、適応フィルタ803の係数ベクトルw2(k)の時間変化が十分に小さくなったとき第4混在比R4(k)における第6混在比R6(k)の含有割合を0%に設定する。これにより、第3実施形態に係る信号処理装置は、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とをより精度よく達成することができる。
【0104】
また、推定部806は、混合部506と、信号比推定部503と、混合部1106(第4混合部の一例に相当)と、信号比推定部1103(第6信号比推定部の一例に相当)とを備える。混合部506は、雑音の推定値e2(k)と擬似雑音n1(k)を、適応フィルタ203の係数ベクトルw1(k)の時間変化に基づいて混合して第1混合信号n3(k)を生成する。信号比推定部503は、第1混合信号n3(k)と音声の推定値e1(k)を用いて音声信号と雑音の振幅または電力の比を第1混在比R1(k)として推定する。混合部1106は、音声の推定値e1(k)と擬似クロストークn2(k)を、適応フィルタ803の係数ベクトルw2(k)の時間変化に基づいて混合して第2混合信号n4(k)を生成する。信号比推定部1103は、第2混合信号n4(k)と雑音の推定値e2(k)を用いて雑音と音声信号の振幅または電力の比を第4混在比R4(k)として推定する。これにより、第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0105】
また、混合部506は、適応フィルタ203の係数更新開始時に第1混合信号n3(k)における雑音の推定値e2(k)の含有割合を100%に設定し、適応フィルタ203の係数ベクトルw1(k)の時間変化が十分に小さくなったとき、第1混合信号n3(k)における雑音の推定値e2(k)の含有割合を0%に設定する。また、混合部1106は、適応フィルタ803の係数更新開始時に第2混合信号n4(k)における音声の推定値e1(k)の含有割合を100%に設定し、適応フィルタ803の係数ベクトルw2(k)の時間変化が十分に小さくなったとき第2混合信号n4(k)における音声の推定値e1(k)の含有割合を0%に設定する。これにより、第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0106】
また、適応フィルタ203の係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の2乗総和または絶対値総和の時間変化であり、適応フィルタ803の係数ベクトルw2(k)の時間変化は、係数ベクトルw2(k)の2乗総和または絶対値総和の時間変化である。これにより、第1~第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0107】
また、適応フィルタ203の係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の2乗部分和または絶対値部分和の時間変化であり、適応フィルタ803の係数ベクトルw2(k)の時間変化は、係数ベクトルw2(k)の2乗部分和または絶対値部分和の時間変化である。これにより、第1~第3実施形態に係る信号処理装置は、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、ステップサイズμ1(k),μ2(k)を手動制御することなく、高速収束と低歪出力信号とを両立できる。
【0108】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0109】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、減算部は、減算手段や減算回路に読み替えることができる。

(付記1)
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の推定値を生成する第1適応フィルタ(適応フィルタ103、203)と、
前記第1混在信号と前記第2信号の推定値とから前記第1信号の推定値を生成する第1減算部(減算部104、204)と、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する推定部(推定部106、206、806)と、
を備え、
前記第1混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
(付記2)
前記推定部(推定部106、206)は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部(信号比推定部301)と、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部(信号比推定部302)と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部(混合部305)と、
を備えた付記1に記載の信号処理装置。
(付記3)
前記第1混合部(混合部305)は、
前記第1適応フィルタの係数更新開始時に前記第1混在比における前記第3混在比の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき、前記第1混在比における前記第3混在比の含有割合を0%に設定する
付記2に記載の信号処理装置。
(付記4)
前記推定部(推定部106、206)は、
前記第2混在信号と前記第2信号の推定値とを、前記第1適応フィルタの係数の時間変化に基づいて混合して第1混合信号を生成する第2混合部(混合部506)と、
前記第1混合信号と前記第1信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を前記第1混在比として推定する第3信号比推定部(信号比推定部503)と、
を備えた付記1に記載の信号処理装置。
(付記5)
前記第2混合部(混合部506)は、
前記第1適応フィルタの係数更新開始時に前記第1混合信号における前記第2混在信号の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき、前記第1混合信号における前記第2混在信号の含有割合を0%に設定する
付記4に記載の信号処理装置。
(付記6)
前記第1信号の推定値をフィルタ処理して前記第3信号の推定値を生成する第2適応フィルタ(適応フィルタ803)と、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成する第2減算部(減算部804)と、をさらに備え、
前記第1適応フィルタは、
前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記推定部は、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定し、
前記第4混在比を用いて前記第2適応フィルタを制御する
付記1に記載の信号処理装置。
(付記7)
前記推定部(推定部806)は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部(信号比推定部301)と、
前記第1信号の推定値と前記第4信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部(信号比推定部302)と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部(混合部305)と、
前記第4信号の推定値と前記第3信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第5混在比として推定する第4信号比推定部(信号比推定部901)と、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する第5信号比推定部(信号比推定部902)と、
前記第5混在比と前記第6混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第4混在比を生成する第3混合部(混合部905)と、
を備えた付記6に記載の信号処理装置。
(付記8)
前記推定部(推定部806)は、
前記第1信号の推定値と前記第2信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第1信号比推定部(信号比推定部301)と、
前記第1信号の推定値と前記第4信号の推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第3混在比として推定する第2信号比推定部(信号比推定部302)と、
前記第2混在比と前記第3混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第1混在比を生成する第1混合部(混合部305)と、
前記第4信号の推定値と前記第3信号の推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第5混在比として推定する第4信号比推定部(信号比推定部901)と、
前記第3混在比の逆数を求めることによって前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する逆数計算部(逆数計算部1006)と、
前記第5混在比と前記第6混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第4混在比を生成する第3混合部(混合部905)と、
を備えた付記6に記載の信号処理装置。
(付記9)
前記第1混合部(混合部305)は、
前記第1適応フィルタの係数更新開始時に前記第1混在比における前記第3混在比の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき前記第1混在比における前記第3混在比の含有割合を0%に設定し、
前記第3混合部(混合部905)は、
前記第2適応フィルタの係数更新開始時に前記第4混在比における前記第6混在比の含有割合を100%に設定し、前記第2適応フィルタの係数の時間変化が十分に小さくなったとき前記第4混在比における前記第6混在比の含有割合を0%に設定する
付記7または8に記載の信号処理装置。
(付記10)
前記推定部(推定部806)は、
前記第4信号の推定値と前記第2信号の推定値を、前記第1適応フィルタの係数の時間変化に基づいて混合して第1混合信号を生成する第2混合部(混合部506)と、
前記第1混合信号と前記第1信号の推定値を用いて前記第1信号と前記第2信号の振幅または電力の比を前記第1混在比として推定する第3信号比推定部(信号比推定部503)と、
前記第1信号の推定値と前記第3信号の推定値を、前記第2適応フィルタの係数の時間変化に基づいて混合して第2混合信号を生成する第4混合部(混合部1106)と、
前記第2混合信号と前記第4信号の推定値を用いて前記第4信号と前記第3信号の振幅または電力の比を前記第4混在比として推定する第6信号比推定部(信号比推定部1103)と、
を備えた付記6に記載の信号処理装置。
(付記11)
前記第2混合部(混合部506)は、
前記第1適応フィルタの係数更新開始時に前記第1混合信号における前記第4信号の推定値の含有割合を100%に設定し、前記第1適応フィルタの係数の時間変化が十分に小さくなったとき前記第1混合信号における前記第4信号の推定値の含有割合を0%に設定し、
前記第4混合部(混合部1106)は、
前記第2適応フィルタの係数更新開始時に前記第2混合信号における前記第1信号の推定値の含有割合を100%に設定し、前記第2適応フィルタの係数の時間変化が十分に小さくなったとき前記第2混合信号における前記第1信号の推定値の含有割合を0%に設定する
付記10に記載の信号処理装置。
(付記12)
前記係数の時間変化は、
前記係数の2乗総和または絶対値総和の時間変化である
付記3または5または9または11に記載の信号処理装置。
(付記13)
前記係数の時間変化は、
前記係数の2乗部分和または絶対値部分和の時間変化である
付記3または5または9または11に記載の信号処理装置。
(付記14)
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号を第1適応フィルタ(適応フィルタ103、203)で処理して前記第2信号の推定値を生成し、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を用いて前記第2信号の推定値の生成を制御する
信号処理方法。
(付記15)
前記第1信号の推定値を第2適応フィルタ(適応フィルタ803)で処理して前記第3信号の推定値を生成し、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成し、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を処理し、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、
前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定し、
前記第4混在比を用いて前記第3信号の推定値の生成を制御する
付記14に記載の信号処理方法。
(付記16)
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号を第1適応フィルタ(適応フィルタ103、203)で処理して前記第2信号の推定値を生成するステップと、
前記第1混在信号と前記第2信号の推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の推定値と前記第2混在信号と前記第1適応フィルタの係数とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を用いて前記第2信号の推定値の生成を制御するステップと
を実行させる信号処理プログラム。
(付記17)
コンピュータに、
前記第1信号の推定値を第2適応フィルタ(適応フィルタ803)で処理して前記第3信号の推定値を生成するステップと、
前記第2混在信号から前記第3信号の推定値を減算して前記第4信号の推定値を生成するステップと、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を処理するステップと、
前記第4信号の推定値と前記第3信号の推定値と前記第1信号の推定値と前記第2適応フィルタの係数とをさらに用いて、
前記第4信号と前記第3信号の振幅または電力の比を第4混在比としてさらに推定するステップと、
前記第4混在比を用いて前記第3信号の推定値の生成を制御するステップと
を実行させる付記16に記載の信号処理プログラム。
【符号の説明】
【0110】
100 信号処理装置
101 第1入力部
102 第2入力部
103,203 適応フィルタ(第1適応フィルタの一例に相当)
104,204 減算部(第1減算部の一例に相当)
106,206,806 推定部
107 係数更新制御部
141 係数
200,800 雑音消去装置(信号処理装置の一例に相当)
201 入力端子(第1入力部の一例に相当)
202 入力端子(第2入力部の一例に相当)
205,805 出力端子
301 信号比推定部(第1信号比推定部の一例に相当)
302 信号比推定部(第2信号比推定部の一例に相当)
305 混合部(第1混合部の一例に相当)
506 混合部(第2混合部の一例に相当)
503 信号比推定部(第3信号比推定部の一例に相当)
803 適応フィルタ(第2適応フィルタの一例に相当)
804 減算部(第2減算部の一例に相当)
901 信号比推定部(第4信号比推定部の一例に相当)
902 信号比推定部(第5信号比推定部の一例に相当)
905 混合部(第3混合部の一例に相当)
1006 逆数計算部
1106 混合部(第4混合部の一例に相当)
1103 信号比推定部(第6信号比推定部の一例に相当)
A 信号源
B 信号源
e1(k) 第1信号の推定値,音声信号の推定値、劣化信号
e2(k) 雑音の推定値(第4信号の推定値の一例に相当)
n1(k) 第2信号の推定値,擬似雑音(第2信号の推定値の一例に相当)
n2(k) 擬似クロストーク(第3信号の推定値の一例に相当)
n3(k) 混合信号(第1混合信号の一例に相当)
n4(k) 混合信号(第2混合信号の一例に相当)
R1(k) 第1混在比
R2(k) 第2混在比
R3(k) 第3混在比
R4(k) 第4混在比
R5(k) 第5混在比
R6(k) 第6混在比
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11