IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2024-84082信号処理装置、信号処理方法、および信号処理プログラム
<>
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図1
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図2
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図3
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図4
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図5
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図6
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図7
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図8
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図9
  • 特開-信号処理装置、信号処理方法、および信号処理プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024084082
(43)【公開日】2024-06-24
(54)【発明の名称】信号処理装置、信号処理方法、および信号処理プログラム
(51)【国際特許分類】
   G10L 21/0208 20130101AFI20240617BHJP
   H04B 1/10 20060101ALI20240617BHJP
   H04B 3/23 20060101ALI20240617BHJP
   H03H 21/00 20060101ALI20240617BHJP
   H03H 17/02 20060101ALI20240617BHJP
   G10L 21/0224 20130101ALI20240617BHJP
【FI】
G10L21/0208 100B
H04B1/10 L
H04B3/23
H03H21/00
H03H17/02 601M
G10L21/0224
【審査請求】未請求
【請求項の数】34
【出願形態】OL
(21)【出願番号】P 2022198271
(22)【出願日】2022-12-12
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】杉山 昭彦
【テーマコード(参考)】
5J023
5K046
5K052
【Fターム(参考)】
5J023DC07
5J023DD02
5J023DD03
5J023DD05
5K046HH11
5K046HH46
5K046HH79
5K052AA01
5K052DD01
5K052FF05
5K052FF32
5K052GG19
(57)【要約】
【課題】信号対雑音比を高精度で推定し、高速収束と低歪出力信号を両立する信号処理装置を得ること。
【解決手段】本願に係る信号処理装置は、第1適応フィルタと、第1平均部と、第2平均部と、第1混合部と、を備える。第1平均部は、第1信号と第2信号の振幅または電力の比である第1混在比を第1の時定数で平均化して第1平均混在比を求める。第2平均部は、第1信号と第2信号の振幅または電力の比である第2混在比を第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求める。第1混合部は、第1平均混在比と第2平均混在比を、第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成する。第1適応フィルタは、第3混在比を用いて係数を制御する。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成する第1減算部と、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する第1信号比推定部と、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求める第1平均部と、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第2信号比推定部と、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求める第2平均部と、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成する第1混合部と、
を備え、
前記第3混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
【請求項2】
前記第1の時定数はゼロであり、前記第1平均混在比は前記第1混在比に等しい、
請求項1に記載の信号処理装置。
【請求項3】
前記第1混合部は、
前記第1適応フィルタの係数更新開始時に前記第2混在比の含有割合を100%に設定し、
前記第1適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第2混在比の含有割合を0%に設定する
請求項1に記載の信号処理装置。
【請求項4】
前記第1平均部は、
前記第1混在比の分散を求め、分散が大きいときに前記第1の時定数を大きい値に設定することで前記第1平均混在比の分散を小さくする請求項1に記載の信号処理装置。
【請求項5】
前記第2平均部は、
前記第2混在比の分散を求め、分散が大きいとき前記第2の時定数を大きい値に設定することで前記第2平均混在比の分散を小さくする請求項1に記載の信号処理装置。
【請求項6】
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成する第1減算部と、
前記第2信号の第1推定値を第3の時定数で平均化して前記第2信号の平均推定値を求める第3平均部と、
前記第2混在信号を前記第3の時定数より大きい第4の時定数で平均化して前記第2混在信号の平均値を求める第4平均部と、
前記第2信号の平均推定値と前記第2混在信号の平均値を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第2信号の第2推定値を生成する第2混合部と、
前記第1信号の推定値を第5の時定数で平均化して前記第1信号の平均第1推定値を求める第5平均部と、
前記第1信号の平均推定値と前記第2信号の第2推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第4混在比として推定する第3信号比推定部と、
を備え、
前記第4混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
【請求項7】
前記第3の時定数はゼロであり、前記第2信号の平均第2推定値は前記第2信号の第1推定値に等しい、
請求項6に記載の信号処理装置。
【請求項8】
前記第5の時定数はゼロであり、前記第1信号の平均第1推定値は前記第1信号の推定値に等しい、
請求項6に記載の信号処理装置。
【請求項9】
前記第2混合部は、
前記第1適応フィルタの係数更新開始時に前記第2混在信号の平均値の含有割合を100%に設定し、
前記第1適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第2混在信号の含有割合を0%に設定する
請求項6に記載の信号処理装置。
【請求項10】
前記第3平均部は、
前記第2信号の第1推定値の分散を求め、分散が大きいときに前記第3の時定数を大きい値に設定することで前記第2信号の平均推定値の分散を小さくする
請求項6に記載の信号処理装置。
【請求項11】
前記第4平均部は、
前記第2混在信号の分散を求め、分散が大きいとき前記第4の時定数を大きい値に設定することで前記第2混在信号の平均値の分散を小さくする
請求項6に記載の信号処理装置。
【請求項12】
前記第5平均部は、
前記第1信号の推定値の分散を求め、分散が大きいとき前記第5の時定数を大きい値に設定することで前記第1信号の平均推定値の分散を小さくする
請求項6に記載の信号処理装置。
【請求項13】
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を生成する第2適応フィルタと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成する第2減算部と、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定する第4信号比推定部と、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求める第6平均部と、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定する第5信号比推定部と、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求める第7平均部と、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成する第3混合部と、
をさらに備え、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第2信号比推定部は前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第7混在比を用いて前記第2適応フィルタを制御する
請求項1に記載の信号処理装置。
【請求項14】
前記第6の時定数はゼロであり、前記第5平均混在比は前記第5混在比に等しい、
請求項13に記載の信号処理装置。
【請求項15】
前記第3混合部は、
前記第2適応フィルタの係数更新開始時に前記第6平均混在比の含有割合を100%に設定し、
前記第2適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第6平均混在比の含有割合を0%に設定する
請求項13に記載の信号処理装置。
【請求項16】
前記第6平均部は、
前記第5混在比の分散を求め、分散が大きいときに前記第6の時定数を大きい値に設定することで前記第5平均混在比の分散を小さくする
請求項13に記載の信号処理装置。
【請求項17】
前記第7平均部は、
前記第6混在比の分散を求め、分散が大きいとき前記第7の時定数を大きい値に設定することで前記第6平均混在比の分散を小さくする
請求項13に記載の信号処理装置。
【請求項18】
前記第5信号比推定部の代わりに、
前記第2混在比の逆数を前記第6混在比として求める第1逆数計算部を備える
請求項13に記載の信号処理装置。
【請求項19】
前記第2信号比推定部の代わりに、
前記第6混在比の逆数を前記第2混在比として求める第2逆数計算部を備える
請求項13に記載の信号処理装置。
【請求項20】
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を生成する第2適応フィルタと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成する第2減算部と、
前記第3信号の第1推定値を第8の時定数で平均化して前記第3信号の平均第1推定値を求める第8平均部と、
前記第1信号の推定値を前記第8の時定数より大きい第9の時定数で平均化して前記第1信号の推定値の平均値を求める第9平均部と、
前記第3信号の平均第1推定値と前記第1信号の推定値の平均値を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第3信号の第2推定値を生成する第4混合部と、
前記第4信号の推定値を第10の時定数で平均化して前記第4信号の平均推定値を求める第10平均部と、
前記第4信号の平均推定値と前記第3信号の第2推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する第6信号比推定部と、
をさらに備え、
前記第6混在比を用いて前記第2適応フィルタを制御する
請求項6に記載の信号処理装置。
【請求項21】
前記第8の時定数はゼロであり、前記第3信号の平均第1推定値は前記第3信号の第1推定値に等しい、
請求項20に記載の信号処理装置。
【請求項22】
前記第9の時定数はゼロであり、前記第1信号の平均推定値は前記第1信号の推定値に等しい、
請求項20に記載の信号処理装置。
【請求項23】
前記第4混合部は、
前記第2適応フィルタの係数更新開始時に前記第1信号の推定値の平均値の含有割合を100%に設定し、
前記第2適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第1信号の推定値の平均値の含有割合を0%に設定する
請求項20に記載の信号処理装置。
【請求項24】
前記第8平均部は、
前記第3信号の第1推定値の分散を求め、分散が大きいときに前記第8の時定数を大きい値に設定することで前記第3信号の平均第1推定値の分散を小さくする
請求項20に記載の信号処理装置。
【請求項25】
前記第9平均部は、
前記第1信号の推定値の分散を求め、分散が大きいとき前記第9の時定数を大きい値に設定することで前記第1信号の推定値の平均値の分散を小さくする
請求項20に記載の信号処理装置。
【請求項26】
前記第10平均部は、
前記第4信号の推定値の分散を求め、分散が大きいとき前記第10の時定数を大きい値に設定することで前記第4信号の平均推定値の分散を小さくする
請求項20に記載の信号処理装置。
【請求項27】
前記第1適応フィルタの係数値の時間変化は、
前記係数値の2乗総和または絶対値総和の時間変化である
請求項1または6に記載の信号処理装置。
【請求項28】
前記第2適応フィルタの係数値の時間変化は、
前記係数値の2乗総和または絶対値総和の時間変化である
請求項13または20に記載の信号処理装置。
【請求項29】
前記第1適応フィルタの係数値の時間変化は、
前記係数値の2乗部分和または絶対値部分和の時間変化である
請求項1または6に記載の信号処理装置。
【請求項30】
前記第2適応フィルタの係数値の時間変化は、
前記係数値の2乗部分和または絶対値部分和の時間変化である
請求項13または20に記載の信号処理装置。
【請求項31】
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成し、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求め、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定し、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求め、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成し、
前記第3混在比を用いて前記第1適応フィルタを制御する
信号処理方法。
【請求項32】
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を第2適応フィルタで生成し、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成し、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定し、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求め、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定し、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求め、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成し、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第7混在比を用いて前記第2適応フィルタを制御する
請求項31に記載の信号処理方法。
【請求項33】
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成するステップと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求めるステップと、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定するステップと、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求めるステップと、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成するステップと、
前記第3混在比を用いて前記第1適応フィルタを制御するステップと
を実行させる信号処理プログラム。
【請求項34】
コンピュータに、
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を第2適応フィルタで生成するステップと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成するステップと、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定するステップと、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求めるステップと、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定するステップと、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求めるステップと、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成するステップと、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力するステップと、
前記第2混在信号に代えて前記第4信号の推定値を入力するステップと、
前記第7混在比を用いて前記第2適応フィルタを制御するステップと
を実行させる請求項33に記載の信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号に混在する雑音、妨害信号、エコーなどを消去する信号処理技術に関する。
【背景技術】
【0002】
マイクロホンやハンドセット等から入力された音声信号には、しばしば背景雑音が重畳されており、音声符号化や音声認識を行う上で大きな問題となる。音響的に重畳した雑音の消去を目的とした信号処理装置として、特許文献1および2には、2つの適応フィルタを用いた2入力型雑音消去装置が開示されている。劣化信号(所望の信号と雑音とが混合された信号)と参照信号(主として雑音と相関のある信号を含む)を入力して、雑音の一部または全部を消去し、強調信号(所望の信号を強調した信号)を出力する。2つの適応フィルタの内、第1の適応フィルタを用いて推定した劣化信号における信号対雑音比を用いて、ステップサイズ算出部が第2の適応フィルタの係数更新ステップサイズを算出する。なお、第1の適応フィルタは第2の適応フィルタと同様に動作するが、第1の適応フィルタの係数更新ステップサイズは第2の適応フィルタの係数更新ステップサイズよりも大きな値に設定される。このため、第1の適応フィルタの出力は、環境変化への追従性が高いが雑音の推定精度が第2の適応フィルタよりも劣る。
【0003】
ステップサイズ算出部は、第1の適応フィルタを用いて推定した劣化信号における信号対雑音比を評価し、音声信号が雑音より大きいときには音声信号による妨害が大きいとみなし、小さな係数更新ステップサイズを第2の適応フィルタに提供する。逆に、音声信号が雑音より小さいときには音声信号による妨害が小さいとみなし、大きな係数更新ステップサイズを第2の適応フィルタに提供する。このように、ステップサイズ算出部から提供された係数更新ステップサイズで第2の適応フィルタを制御することにより、十分な環境変化への追従性と雑音消去後の信号における低歪とを出力される。
【0004】
特許文献3には、上記特許文献1および2の構成から第1の適応フィルタを削除した構成が開示されている。第2の適応フィルタを用いて推定した所望信号(音声等)と第2の適応フィルタ出力の比で信号対雑音比を近似して、その信号対雑音比に基づいて算出したステップサイズで、第2の適応フィルタ自身を制御する。さらに、特許文献3には、上記特許文献1および2の構成を拡張して、2雑音入力装置の入力において雑音に混入している音声信号の影響が大きい、いわゆる音声信号によるクロストークが存在する際に雑音に混入する音声信号の消去をも行なう雑音消去装置の構成が開示されている。特許文献3においては、上記特許文献1および2の構成に加えて、参照信号からクロストークを消去する第3の適応フィルタを備えている。音声信号入力から正確に雑音を消去するため、第2のステップサイズ算出部において係数更新ステップサイズを算出し、第3の適応フィルタを制御する。
【0005】
すなわち、特許文献1乃至3の雑音消去装置は、雑音消去後の信号と適応フィルタ出力を用いて推定した第1の信号対雑音比で、適応フィルタの係数更新を制御する。第1の信号対雑音比が高いときには小さなステップサイズを、第1の信号対雑音比が低いときには大きなステップサイズを用いることで、高速収束と低歪出力信号を両立している。
【0006】
しかしながら、特許文献1乃至3の雑音消去装置では、適応フィルタの係数が全く更新されない。これは、通常、適応フィルタ係数の初期値がゼロに設定されるためである。ゼロ係数の適応フィルタはゼロを出力する。これが第1の信号対雑音比の推定値の分母であるために、第1の信号対雑音比の推定値は極めて大きな値となり、対応するステップサイズとしてゼロが設定される。ゼロのステップサイズは、係数更新を行わないことを意味する。これを避けるためには、係数更新開始直後に強制的にステップサイズを非ゼロの値に設定しなければならないが、実際にどの値をステップサイズに設定するか、どれだけの期間、非ゼロの値に設定しなければならないかに関して明確な設計方法は開示されていない。すなわち、2入力雑音消去装置で高速収束と低歪出力信号を両立するためには、ステップサイズの手動制御が必要である。
【0007】
特許文献4には、ステップサイズの手動制御が不要で、高速収束と低歪出力信号を両立できる2入力型雑音消去装置の構成が開示されている。雑音消去後の信号と参照信号の比で定義される第2の信号対雑音比を装置の動作直後に用いて適応フィルタの係数更新を制御し、係数更新が行われない問題を解決する。適応フィルタの係数が成長したとき、特許文献3に開示された第1の信号対雑音比に切り替える。係数成長の評価は、前記第2の信号対雑音比が前記第1の信号対雑音比に十分近くなったことによって行う。クロストークが存在する際には、雑音入力信号から音声信号を消去する第3の適応フィルタを導入して、第2の適応フィルタと同様の原理でステップサイズを制御する。
【0008】
しかしながら、特許文献4に記載の信号処理装置では、適応フィルタの同定する音響インパルス応答の利得が1未満である場合、推定した信号対雑音比の切換えが行われない。これは、1未満の音響インパルス応答利得で、第2の信号対雑音比が第1の信号対雑音比に十分近くならないためである。その結果、信号対雑音比の推定精度が低く、高速収束と低歪出力信号を両立できない。
【0009】
非特許文献1には、適応フィルタの同定する音響インパルス応答の利得が1未満であっても、推定した信号対雑音比を切換えることができる、2入力型雑音消去装置の構成が開示されている。適応フィルタの係数成長を係数2乗総和の時間変化を用いて評価する。具体的には、係数2乗総和の時間変化における傾きが十分に小さくなったときに、係数が成長したと判断して信号対雑音比の切り替えを行う。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開平10-215193号公報
【特許文献2】特開2000-172299号公報
【特許文献3】国際公開第2012/046582号
【特許文献4】国際公開第2019/092798号
【非特許文献】
【0011】
【非特許文献1】Sugiyama, ”Robust Convergence Algorithm for Adaptive Noise Cancellers with SNR-Based Stepsize Control and Gain Adjustment”, IEEE International Conference on Consumer Electronics, CD-ROM,January 2022
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、非特許文献1に記載の信号処理装置では、適応フィルタ係数の初期成長速度と精度が十分に高くない。これは、第1及び第2の信号対雑音比が真の信号対雑音比の近似値であり、近似精度が十分に高くないためである。その結果、信号対雑音比の推定精度が低く、高速収束と低歪出力信号を両立できない。
【0013】
本発明の目的は、上記の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0014】
上記目的を達成するため、本発明に係る装置は、
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成する第1減算部と、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する第1信号比推定部と、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求める第1平均部と、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第2信号比推定部と、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求める第2平均部と、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成する第1混合部と、
を備え、
前記第3混在比を用いて前記第1適応フィルタを制御する。
【0015】
上記目的を達成するため、本発明に係る方法は、
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成し、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求め、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定し、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求め、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成し、
前記第3混在比を用いて前記第1適応フィルタを制御する。
【0016】
上記目的を達成するため、本発明に係るプログラムは、
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成するステップと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求めるステップと、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定するステップと、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求めるステップと、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成するステップと、
前記第3混在比を用いて前記第1適応フィルタを制御するステップと
を実行させる。
【発明の効果】
【0017】
本発明によれば、信号対雑音比の推定精度が高く、高速収束と低歪出力信号を両立できる信号処理装置を得ることができる。
【図面の簡単な説明】
【0018】
図1】本発明の第1実施形態に係る信号処理装置の構成を示すブロック図である。
図2】本発明の第2実施形態に係る信号処理装置の構成を示すブロック図である。
図3】本発明の第2実施形態に係る係数値の時間推移を示す図である。
図4】本発明の第3実施形態に係る信号処理装置の構成を示すブロック図である。
図5】本発明の第4実施形態に係る信号処理装置の構成を示すブロック図である。
図6】本発明の第5実施形態に係る信号処理装置の構成を示すブロック図である。
図7】本発明の第6実施形態に係る信号処理装置の構成を示すブロック図である。
図8】本発明の第7実施形態に係る信号処理装置の構成を示すブロック図である。
図9】本発明の第1の実施形態に係るコンピュータの構成を示すブロック図である。
図10図9に示すコンピュータのプロセッサによる信号処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0019】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0020】
〔1.第1実施形態〕
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。図1の信号処理装置100は、第1信号と第2信号とが混在する第1混在信号xP(k)から、第1信号の推定値e1(k)を求める装置である。
【0021】
図1に示すように、信号処理装置100は、第1入力部101と、第2入力部102と、適応フィルタ103と、減算部104と、信号比推定部111と、平均部112と、信号比推定部113と、平均部114と、混合部115と、係数更新制御部107とを含む。
【0022】
このうち、第1入力部101は第1信号と第2信号とが混在した第1混在信号xP(k)を入力する。第2入力部102は、第3信号と第4信号とが混在した第2混在信号xR(k)を入力する。第1信号と第3信号は、同一の信号源Aから生じており、互いに相関を有する。第2信号と第4信号は、同一の信号源Bから生じており、互いに相関を有する。
【0023】
減算部104は、第1混在信号xP(k)に混在する第2信号の推定値n1(k)と第1混在信号xP(k)を受けて、第1信号の推定値e1(k)を出力する。そして、適応フィルタ103は、第2信号の推定値n1(k)を求めるため、第2混在信号xR(k)に対して、第1信号の推定値e1(k)に基づいて更新される係数141を用いてフィルタ処理を施す。
【0024】
信号比推定部111は、音声の推定値e1(k)と擬似雑音n1(k)とを受けて、音声と雑音の振幅または電力の比を第1混在比R1(k)として推定する。第1混在比R1(k)は、音声の推定値e1(k)と擬似雑音n1(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と擬似雑音n1(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0025】
平均部112は、第1混在比R1(k)を受けて時定数α1で平均化し、平均第1混在比バーR1(k)を求める。この平均化は、第1混在比R1(k)の分散を小さくし、精度を向上する効果がある。第1混在比R1(k)の分散が大きいときには時定数α1を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第1混在比R1(k)の分散を評価して、得られた分散に応じてα1を適切に設定する。
【0026】
信号比推定部113は、音声の推定値e1(k)と参照信号xR(k)(第2混在信号)とを受けて、音声と雑音の振幅または電力の比を第2混在比R2(k)として推定する。第2混在比R2(k)は、音声の推定値e1(k)と参照信号xR(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と参照信号xR(k)のいずれかまたは両方を、平均化してから用いてもよい。
【0027】
平均部114は、第2混在比R2(k)を受けて時定数α2で平均化し、平均第2混在比バーR2(k)を求める。この平均化は、第2混在比R2(k)の分散を小さくし、精度を向上する効果がある。第2混在比R2(k)の分散が大きいときには時定数α2を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第2混在比R2(k)の分散を評価して、得られた分散に応じてα2を適切に設定する。
【0028】
第1混在比R1(k)も第2混在比R2(k)も、音声と雑音の振幅または電力の比の推定値である。しかし、第2混在信号xR(k)は第3信号と第4信号をそのまま含むのに対して、音声すなわち第1信号の推定値e1(k)は雑音、すなわち第2信号を除去した結果である。このため、第1混在比R1(k)は第2混在比R2(k)よりも音声と雑音の振幅または電力の比に対する推定精度が高く、分散が小さい。したがって、時定数α1とα2は、α1<α2となるように選択する。特に、第1混在比R1(k)の精度が十分に高く、分散が十分に小さい場合には、α1=0と設定して、第1混在比R1(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α1とα2を用いた平均化によって、音声と雑音の振幅または電力の比を正確に推定することができる。
【0029】
混合部115は、平均第1混在比バーR1(k)と平均第2混在比バーR2(k)とを混合して、混合結果を第3混在比R3(k)として出力する。平均第1混在比バーR1(k)と平均第2混在比バーR2(k)は、重み付き加算によって混合してもよいし、さらに複雑な高次多項式などを用いて混合してもよい。
【0030】
混合部115は、適応フィルタ103の係数更新開始時に平均第2混在比バーR2(k)の重みを大きな値に設定し、係数の成長とともに減少させる。平均第1混在比バーR1(k)の重みは、適応フィルタ103の係数更新開始時に小さな値に設定し、時間とともに増加させる。これは、平均第2混在比バーR2(k)の第3混在比R3(k)における含有割合を、係数更新回数に対応して減少させることを表す。
【0031】
ここで、単純化のために、平均第1混在比バーR1(k)と平均第2混在比バーR2(k)を重み付き加算で混合することで、第3混在比R3(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。
【0032】
適応フィルタ103の係数更新開始時に平均第2混在比バーR2(k)の重みを1に設定すれば、重みの和が1という条件から、平均第1混在比バーR1(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ103の係数更新開始時に平均第2混在比バーR2(k)の重みを1に設定し、係数ベクトルw1(k)の係数更新回数に対応してその重みを0に向かって減少させる。対応して、平均第1混在比バーR1(k)の重みは0から1へ増加する。平均第2混在比バーR2(k)の重みの初期値を1と設定し、ある時点で重みが0になるか重みを0に設定すれば、平均第2混在比バーR2(k)から平均第1混在比バーR1(k)へ切り換えることになる。前記重みの和として1以外の値を設定しても、平均第2混在比バーR2(k)に対する重みの初期値を1以外に設定しても、同様の効果が得られる。重みは、適応フィルタ103の係数ベクトルw1(k)の変化量を用いて決定することができる。
【0033】
係数更新制御部107は、混合部115によって得られた第3混在比R3(k)の値が大きい場合に、適応フィルタ103の係数141の更新量を小さくするための制御信号μ1(k)を適応フィルタ103に出力する。
【0034】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0035】
〔2.第2実施形態〕
本発明の第2実施形態に係る信号処理装置として、劣化信号(所望の信号と雑音とが混合された信号)と参照信号(主として雑音と相関のある信号を含む)を入力して、雑音の一部または全部を消去し、強調信号(所望の信号を強調した信号)を出力する雑音消去装置について説明する。ここで、劣化信号は第1信号と第2信号が混在する第1混在信号に相当し、参照信号は第3信号と第4信号が混在する第2混在信号に相当し、強調信号は所望信号(第1信号の推定値)に相当する。
【0036】
〔2.1.雑音消去の基礎技術の説明〕
以下、マイクロホン、ハンドセット、通信路等から入力された所望信号に混在する雑音、妨害信号、エコーなどを適応フィルタによって消去し、または所望信号を強調する雑音消去の基礎技術の説明を簡単に行なう。
【0037】
特許文献1乃至3に開示されているように、2入力型の雑音消去装置は、雑音源から音声入力端子に至る音響経路のインパルス応答を近似する適応フィルタを用いて、参照信号から音声入力端子において音声に混入する雑音成分に対応した擬似雑音(第2信号の推定値)を生成する。そして、音声入力端子に入力された信号(第1混在信号)からこの擬似雑音を差し引くことによって、雑音成分を抑圧するように動作する。ここで、混在信号とは、所望(音声)信号と雑音とが混在した信号のことであり、一般に、マイクロホンやハンドセットから音声入力端子に供給される。また、参照信号とは、雑音源における雑音成分と相関のある信号であり、雑音源近傍において捕捉される。このように、雑音源近傍において参照信号を捕捉することで、参照信号は雑音源における雑音成分とほぼ等しいとみなすことができる。適応フィルタには、参照入力端子に供給される参照信号を入力する。
【0038】
適応フィルタの係数は、劣化信号から擬似雑音を差し引いた誤差と参照入力端子に入力された参照信号との相関をとることにより修正される。このような適応フィルタの係数修正アルゴリズムとして、特許文献1乃至3には、「LMSアルゴリズム(Least Mean-Square Algorithm)」や「LIM(Learning Identification Method):学習同定法」が開示されている。LIMはまた、正規化LMSアルゴリズムとも呼ばれる。
【0039】
正規化LMSアルゴリズムによる係数更新は、時刻kにおけるステップサイズをμ1(k)とすれば、式(1)で表される。係数ベクトルw1(k)は、その要素を用いて式(2)で定義される。参照信号ベクトルxR(k)は、その要素を用いて式(3)で表される。なお、Tはベクトルの転置を表し、係数の総数はLとする。
【数1】
【0040】
LMSアルゴリズムやLIMは、勾配法と呼ばれるアルゴリズムの一種であり、係数更新の速度と精度は、係数更新ステップサイズと呼ばれる定数に依存する。係数更新ステップサイズと誤差との積によってフィルタ係数を更新するが、誤差に含まれる所望信号(第1信号の推定値)による係数更新への妨害を低減するためには、係数更新ステップサイズを極めて小さな値またはゼロに設定する必要がある。係数更新ステップサイズを常に小さい値に設定すると、適応フィルタ係数の環境変化への追従性が低下する。上記特許文献1乃至3は、出力誤差が増大し、あるいは所望信号に歪が生じるという問題を解決する1つの方法を開示するものである。また、所望信号は一般的に音声であるために、以降音声と表記するが、本発明の趣旨は音声には限定されず、音響(オーディオ)信号を含むあらゆる種類の信号を表す。
【0041】
〔2.2.雑音消去装置の構成〕
図2は、本実施形態としての雑音消去装置200の全体構成を示すブロック図である。雑音消去装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話、補聴器、テレビジョン、スマートスピーカ、またはロボットなどといった装置の一部としても機能するが、本発明はこれに限定されるものではなく、入力信号からの雑音消去を要求されるあらゆる信号処理装置に適用可能である。
【0042】
図2に示すように、雑音消去装置200は、入力端子201から音声(第1信号)と雑音(第2信号)の混在した劣化信号(第1混在信号)xP(k)を入力する。そして、入力端子202から音声と雑音の混在した参照信号(第2混在信号)xR(k)を入力し、出力端子205から音声の推定値e1(k)(強調信号)を出力する。また、雑音消去装置200は、適応フィルタ203と、減算部204と、信号比推定部211と、平均部212と、信号比推定部213と、平均部214と、混合部215と、を備えている。適応フィルタ203は、図1における適応フィルタ103と係数更新制御部107とを包含する構成であり、第3混在比R3(k)を受けてステップサイズμ1(k)を算出し、算出したステップサイズμ1(k)を用いて係数ベクトルw1(k)を更新する。雑音消去装置200は、消去しようとする雑音と相関のある参照信号xR(k)を適応フィルタ203で変形して擬似雑音n1(k)を生成し、これを雑音の重畳した音声信号である劣化信号xP(k)から減算することで、雑音の消去を行うものである。
【0043】
入力端子201には、劣化信号xP(k)が、サンプル値系列として供給される。劣化信号xP(k)は、減算部204に伝達される。入力端子202には、参照信号xR(k)が、サンプル値系列として供給される。参照信号xR(k)は、適応フィルタ203と信号比推定部213に伝達される。
【0044】
適応フィルタ203は、参照信号xR(k)とフィルタ係数の畳込み演算を行い、その結果を擬似雑音n1(k)として減算部204と信号比推定部211に伝達する。また、適応フィルタ203は、係数ベクトルw1(k)を混合部215に供給する。
【0045】
減算部204には、入力端子201から劣化信号xP(k)が、適応フィルタ203から擬似雑音n1(k)が供給される。減算部204は、劣化信号xP(k)から擬似雑音n1(k)を減算し、その結果を音声信号の推定値e1(k)(第1信号の推定値)として出力端子205に伝達すると同時に適応フィルタ203に帰還する。
【0046】
信号比推定部211は、音声の推定値e1(k)と擬似雑音n1(k)とを受けて、音声と雑音の振幅または電力の比を第1混在比R1(k)として推定する。第1混在比R1(k)は、音声の推定値e1(k)と擬似雑音n1(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と擬似雑音n1(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0047】
平均部212は、第1混在比R1(k)を受けて時定数α1で平均化し、平均第1混在比バーR1(k)を求める。この平均化は、第1混在比R1(k)の分散を小さくし、精度を向上する効果がある。第1混在比R1(k)の分散が大きいときには時定数α1を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第1混在比R1(k)の分散を評価して、得られた分散に応じてα1を適切に設定する。
【0048】
信号比推定部213は、音声の推定値e1(k)と参照信号xR(k)(第2混在信号)とを受けて、音声と雑音の振幅または電力の比を第2混在比R2(k)として推定する。第2混在比R2(k)は、音声の推定値e1(k)と参照信号xR(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、音声の推定値e1(k)と参照信号xR(k)のいずれかまたは両方を、平均化してから用いてもよい。
【0049】
平均部214は、第2混在比R2(k)を受けて時定数α2で平均化し、平均第2混在比バーR2(k)を求める。この平均化は、第2混在比R2(k)の分散を小さくし、精度を向上する効果がある。第2混在比R2(k)の分散が大きいときには時定数α2を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第2混在比R2(k)の分散を評価して、得られた分散に応じてα2を適切に設定する。
【0050】
第2混在比R2(k)の分母は参照信号xR(k)であり、係数更新開始時にゼロとは限らない。これは、マイク入力には環境雑音など微小な信号が含まれるためである。仮に参照信号xR(k)がゼロであっても、ゼロが継続することはない。このため、第2混在比R2(k)が無限大になることはなく、対応するステップサイズμ1(k)も極小値とはならない。したがって、適応フィルタ203の係数は、係数更新とともに成長し、雑音の信号源から入力端子201に至る経路の音響特性を表す値に収束する。参照信号xR(k)がゼロのときは、適応フィルタ203の係数は更新しないので、第2混在比R2(k)が極めて大きな値をとっても問題とはならない。しかし、適応フィルタ203の係数がある程度成長して、擬似雑音n1(k)が成長したときには、第2混在比R2(k)は第1混在比R1(k)よりも、音声と雑音の振幅または電力の比に対する近似精度が低い。
【0051】
第1混在比R1(k)も第2混在比R2(k)も、音声と雑音の振幅または電力の比の推定値である。しかし、第2混在信号xR(k)は第3信号と第4信号をそのまま含むのに対して、音声すなわち第1信号の推定値e1(k)は雑音、すなわち第2信号を除去した結果である。このため、第1混在比R1(k)は第2混在比R2(k)よりも音声と雑音の振幅または電力の比に対する推定精度が高く、分散が小さい。したがって、時定数α1とα2は、α1<α2となるように設定する。特に、第1混在比R1(k)の精度が十分に高く、分散が十分に小さい場合には、α1=0と設定して、第1混在比R1(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α1とα2を用いた平均化によって、音声と雑音の振幅または電力の比を正確に推定することができる。
【0052】
混合部215は、平均第1混在比バーR1(k)と平均第2混在比バーR2(k)とを混合して、混合結果を第3混在比R3(k)として出力する。平均第1混在比バーR1(k)と平均第2混在比バーR2(k)は、重み付き加算によって混合してもよいし、さらに複雑な高次多項式などを用いて混合してもよい。
【0053】
混合部215は、適応フィルタ203の係数更新開始時に平均第2混在比バーR2(k)の重みを大きな値に設定し、係数の成長とともに減少させる。平均第1混在比バーR1(k)の重みは、適応フィルタ203の係数更新開始時に小さな値に設定し、時間とともに増加させる。これは、平均第2混在比バーR2(k)の第3混在比R3(k)における含有割合を、係数更新回数に対応して減少させることを表す。
【0054】
ここで、単純化のために、平均第1混在比バーR1(k)と平均第2混在比バーR2(k)を重み付き加算で混合することで、第3混在比R3(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。
【0055】
適応フィルタ203の係数更新開始時に平均第2混在比バーR2(k)の重みを1に設定すれば、重みの和が1という条件から、平均第1混在比バーR1(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ203の係数更新開始時に平均第2混在比バーR2(k)の重みを1に設定し、係数ベクトルw1(k)の係数更新回数に対応してその重みを0に向かって減少させる。対応して、平均第1混在比バーR1(k)の重みは0から1へ増加する。平均第2混在比バーR2(k)の重みの初期値を1と設定し、ある時点で重みが0になるか重みを0に設定すれば、平均第2混在比バーR2(k)から平均第1混在比バーR1(k)へ切り換えることになる。前記重みの和として1以外の値を設定しても、平均第2混在比バーR2(k)に対する重みの初期値を1以外に設定しても、同様の効果が得られる。重みは、適応フィルタ203の係数ベクトルw1(k)の変化量を用いて決定することができる。
【0056】
適応フィルタ203は、第3混在比R3(k)が大きいときに小さなステップサイズμ1(k)を、第3混在比R3(k)が小さいときに大きなステップサイズμ1(k)を用いて、係数ベクトルw1(k)を更新する。第3混在比R3(k)、すなわち信号対雑音比の推定値を用いてステップサイズを制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に開示されているように、第3混在比R3(k)を平均化してから、ステップサイズμ1(k)の計算に用いてもよい。音声と雑音の振幅または電力の比に対する推定精度が向上する。
【0057】
図3は、第2実施形態に係る信号の時間推移を模式的に示す図であり、参照信号xR(k)、適応フィルタ203の出力である擬似雑音n1(k)、および係数ベクトルw1(k)が示されている。図3の縦軸は、信号の値をパワーで表したものであり、係数w1(k)は係数ベクトルのノルムとする。横軸は、サンプル数kで表した適応フィルタ203の係数更新回数である。xR(k)とn1(k)を比較することは、同一の分子を有し、分母がそれぞれxR(k)とn1(k)である第2混在比R2(k)と第1混在比R1(k)を比較することと等価である。xR(k)は係数更新と無関係なので、n1(k)が第2混在比R2(k)と第1混在比R1(k)の関係を決定する。n1(k)はxR(k)と係数ベクトルw1(k)で決定され、xR(k)の増減に起因する変化を除くと、その振幅またはパワーは係数更新に伴って増加する。すなわち、xR(k)は一定で、n1(k)は係数更新による係数ベクトルw1(k)の増加と共に増加する。
【0058】
以上説明した参照信号xR(k)、適応フィルタ203の出力である擬似雑音n1(k)、および係数ベクトルw1(k)の関係は、図3から明らかである。図3では、係数更新と無関係なxR(k)は、簡単のため一定として表した。xR(k)に依存するn1(k)は、スムーズに増加し、係数ベクトルw1(k)が収束するとn1(k)も飽和する。適応フィルタ203の係数ベクトルw1(k)の変化量は係数更新に伴って小さくなるので、n1(k)がゼロからどれだけ成長したかの指標として、係数ベクトルw1(k)の変化量を用いることができる。すなわち、混合部305は、係数ベクトルw1(k)の時間変化によって、平均第2混在比バーR2(k)の重みを決定する。
【0059】
係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の要素の2乗総和または絶対値総和の時間変化としてもよいし、2乗部分和または絶対値部分和の時間変化であってもよい。部分和とする際には、係数ベクトルの要素を間引いたものを用いてもよいし、係数ベクトルの一部を切り出したものを用いてもよい。部分和を用いることで、時間変化の評価精度低下を抑えつつ、係数の時間変化に必要とする演算量を削減することができる。また、係数は入力信号に依存しないで変化するので、滑らかである。従って、入力信号に依存する他の指標よりも最終的に変動が小さく、飽和状態を正確に検出できる。
【0060】
式(4)に、平均第1混在比バーR1(k)と平均第2混在比バーR2(k)とを重み付き加算によって混合する例を示す。式(5)で表されるζ1(k)はζ1(0)=0を満たし、係数更新と共に増加する。適応フィルタ203の係数ベクトルw1(k)の時間変化に相当するδ1(k)は式(6)で求めることができる。M1は自然数であり、係数ベクトルw1(k)の時間変化を計算する頻度を決定する。M1が大きいほどδ1(k)の変動が小さく係数飽和の検出が正確になるが、δ1(k)の変化に生じる大きな遅延によって係数飽和の検出が遅れる。式(5)は、時間変化δ1(k)の値が閾値ε1未満になったとき、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を0に設定する例を表し、第3混在比R3(k)を平均第2混在比バーR2(k)から平均第1混在比バーR1(k)に切り換える。これは、時間変化δ1(k)の値が十分に小さくなったことを判定する方法の一例である。式(5)の代わりにζ1(k)=δ1(k)/|δ1(M1)|とすれば、係数ベクトルw1(k)の時間変化が平均第2混在比バーR2(k)の含有割合を計測して定める構成となる。
【数2】
【0061】
このように、混合部215は、時間変化δ1(k)と閾値ε1との比較結果に基づいて、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を100%および0%のうちのいずれかに設定することができる。なお、係数ベクトルw1(k)の時間変化δ1(k)と閾値ε1とを繰り返し比較し、係数ベクトルw1(k)の時間変化δ1(k)が閾値ε1以上である場合に、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を100%にし、そうでない場合に、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を0%にする処理を繰り返してもよい。これにより、環境の変化に対する追従性の高い第3混在比R3(k)を得ることができ、例えば、適応フィルタ203の係数ベクトルw1(k)の更新量が急増した場合であっても、より正確な係数更新が可能となる。
【0062】
混合部215は、係数ベクトルw1(k)の時間変化δ1(k)が予め定められた第1定数L1以上連続して閾値ε1未満になった場合に、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を0%にし、それ以外の場合には、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を100%にすることもできる。平均第2混在比バーR2(k)の含有割合が1回0%に設定された後、閾値を十分に大きく設定することで、δ1(k)とε1の比較を停止してもよい。ここに、L1は、2以上の整数である。
【0063】
混合部215は、係数ベクトルw1(k)の時間変化δ1(k)が予め定められた第2定数L2と等しいサンプル数を有する区間において、予め定められた第3定数L3以上連続してδ1(k)が閾値ε1未満になったときに、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を0%にし、それ以外の場合には、第3混在比R3(k)における平均第2混在比バーR2(k)の含有割合を100%にすることもできる。第2定数L2及び第3定数L3は共に2以上の整数で、L2>L3を満足する。さらに、上記評価から連続の条件を削除して、予め定められた第3定数L3以上δ1(k)が閾値ε1未満になる回数を評価することもできる。平均第2混在比バーR2(k)の含有割合が1回0%に設定された後、L3をL2より大きな値に設定することで、δ1(k)の評価を停止してもよい。
【0064】
なお、混合部215は、平均第1混在比バーR1(k)および平均第2混在比バーR2(k)の重みの最小値を0ではなく、0よりも大きな値とすることもできる。
【0065】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0066】
〔3.第3実施形態〕
図4は、本発明の第3実施形態を示すブロック図である。図4に示す本発明の第3実施形態は、図2に示す本発明の第2実施形態と等価である。すなわち、図2に示す本発明の第2実施形態は、音声と雑音の振幅または電力の比に対して2つの推定値を信号比推定部211、213で生成し、それらを平均部212,214で平均化してから混合して第3混在比R3(k)を算出する。図4に示す本発明の第3実施形態は、2種類の雑音の推定値、すなわち参照信号xR(k)と擬似雑音n1(k)をそれぞれ平均部413,412で平均化してから混合して第1混合信号n3(k)を生成して分母を確定し、分子である音声の推定値e1(k)を平均部415で平均化した平均音声推定値と作用させて第4混在比R4(k)を算出する。これら2種類の構成が可能となったのは、図2に示す本発明の第2実施形態と図4に示す本発明の第3実施形態において、音声と雑音の振幅または電力の比を推定する際に、同一の分子、すなわち音声の推定値e1(k)を平均化した結果を用いるからである。図4に示す本発明の第3実施形態は、図2に示す本発明の第2実施形態よりも、構成が単純である。
【0067】
平均部412は、擬似雑音n1(k)を受けて時定数α3で平均化し、平均擬似雑音バーn1(k)を求める。この平均化は、擬似雑音n1(k)の分散を小さくし、精度を向上する効果がある。擬似雑音n1(k)の分散が大きいときには時定数α3を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、擬似雑音n1(k)の分散を評価して、得られた分散に応じてα3を適切に設定する。
【0068】
平均部413は、参照信号xR(k)を受けて時定数α4で平均化し、平均参照信号バーxR(k)を求める。この平均化は、参照信号xR(k)の分散を小さくし、精度を向上する効果がある。参照信号xR(k)の分散が大きいときには時定数α4を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、参照信号xR(k)の分散を評価して、得られた分散に応じてα4を適切に設定する。
【0069】
擬似雑音n1(k)も参照信号xR(k)も、雑音の振幅または電力の推定値である。しかし、第2混在信号xR(k)は第3信号と第4信号をそのまま含むのに対して、擬似雑音n1(k)は適応フィルタ203による雑音の推定値である。このため、擬似雑音n1(k)は第2混在信号xR(k)よりも雑音の振幅または電力に対する推定精度が高く、分散が小さい。したがって、時定数α3とα4は、α3<α4となるように設定する。特に、擬似雑音n1(k)の精度が十分に高く、分散が十分に小さい場合には、α3=0と設定して、擬似雑音n1(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α3とα4を用いた平均化によって、雑音の振幅または電力を正確に推定することができる。
【0070】
混合部414は、平均参照信号バーxR(k)および平均擬似雑音バーn1(k)を適応フィルタ203の係数w1(k)に基づいて混合し、第1混合信号n3(k)を生成する。ここで、単純化のために、平均参照信号バーxR(k)と平均擬似雑音バーn1(k)とを適応フィルタ203の係数ベクトルw1(k)に基づいて重み付き加算で混合することで、第1混合信号n3(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。このとき、混合部414は、適応フィルタ203の係数更新開始時に平均参照信号バーxR(k)に対する重みを大きな値に設定し、係数ベクトルw1(k)の時間変化の減少とともに減少させる。平均擬似雑音バーn1(k)に対する重みは、適応フィルタ203の係数更新開始時に小さな値に設定し、係数ベクトルw1(k)の時間変化の減少とともに増加させる。これは、平均擬似雑音バーn1(k)が係数更新開始時にゼロとなるので、推定された信号対雑音比が大きくなって係数が更新されないことを回避するためである。このような制御は、第1混合信号n3(k)における平均参照信号バーxR(k)の含有割合を、係数ベクトルw1(k)の時間変化の減少に対応して減少させることを表す。
【0071】
例えば、適応フィルタ203の係数更新開始時に平均参照信号バーxR(k)に対する重みを1に設定すれば、平均擬似雑音バーn1(k)に対する重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ203の係数更新開始時に平均参照信号バーxR(k)に対する重みを1に設定し、係数更新回数に対応してその重みを0に向かって減少させる。対応して、平均擬似雑音バーn1(k)に対する重みは、0から1へ増加する。
【0072】
平均参照信号バーxR(k)に対する重みは減少し、平均擬似雑音バーn1(k)に対する重みは増加する。両者の重みを1と0の2値で表せば、平均参照信号バーxR(k)に対する重みは1を維持した後に0に変化する。平均擬似雑音バーn1(k)に対する重みは0を維持した後に1に変化する。これは、混合部414の出力が平均参照信号バーxR(k)から平均擬似雑音バーn1(k)に切り替わったことに相当する。
【0073】
平均部415は、音声(第1信号)の推定値e1(k)を受けて時定数α5で平均化し、平均第1信号推定値バーe1(k)を求める。この平均化は、第1信号の推定値e1(k)の分散を小さくし、精度を向上する効果がある。第1信号の推定値e1(k)の分散が大きいときには時定数α5を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第1信号の推定値e1(k)の分散を評価して、得られた分散に応じてα5を適切に設定する。
【0074】
擬似雑音n1(k)と音声(第1信号)の推定値e1(k)は同等の推定精度であり、分散も同等である。したがって、時定数α5は、α5≒α3<α4となるように設定する。特に、音声(第1信号)の推定値e1(k)の精度が十分に高く、分散が十分に小さい場合には、α5=0と設定して、音声(第1信号)の推定値e1(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α5を用いた平均化によって、音声の振幅または電力を正確に推定することができる。
【0075】
信号比推定部416は、平均第1信号推定値バーe1(k)と第1混合信号n3(k)とを受けて、音声と雑音の振幅または電力の比を第4混在比R4(k)として推定する。適応フィルタ203は、第4混在比R4(k)を用いて、係数ベクトルw1(k)の更新を制御する。
【0076】
適応フィルタ203は、第4混在比R4(k)が大きいときに小さなステップサイズμ1(k)を、第4混在比R4(k)が小さいときに大きなステップサイズμ1(k)を用いて、係数ベクトルw1(k)を更新する。第4混在比R4(k)、すなわち信号対雑音比の推定値を用いてステップサイズを制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に開示されているように、第4混在比R4(k)を平均化してから、ステップサイズμ1(k)の計算に用いてもよい。音声と雑音の振幅または電力の比に対する推定精度が向上する。
【0077】
混合部414の動作は、入力信号である第1混在比の平均値と第2混在比の平均値が平均擬似雑音と平均参照信号(平均第2混在信号)にそれぞれ置き換わったことを除いて、混合部215の動作と同様である。従って、すでに説明した混合部215の動作に関する変更例は、混合部414にも同様に適用できる。
【0078】
また、混合部414は、平均参照信号バーxR(k)および平均擬似雑音バーn1(k)に対する重みの最小値を0ではなく、0よりも大きな値とすることもできる。
【0079】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0080】
〔4.第4実施形態〕
これまでの説明では、雑音源近傍において参照信号の捕捉を行うことによって、参照信号は雑音そのものであると仮定してきた。しかし、現実にはこの条件を満たすことのできない場合が存在する。このような場合には、参照信号は雑音とそれに混入する音声信号とから構成される。このような参照信号に対する音声信号の混入成分はクロストークと呼ばれる。クロストークが存在する際の雑音消去装置の構成が、特許文献3に開示されている。
【0081】
本実施形態では、雑音の消去と同様に、クロストークを消去するための第2の適応フィルタを導入する。音声信号源から参照入力端子に至る音響経路(クロストークパス)のインパルス応答を近似する第2の適応フィルタを用いて、参照入力端子において混入する音声信号成分に対応した擬似クロストーク信号を生成する。そして、参照入力端子に入力された信号(参照信号)からこの擬似クロストーク信号を差し引くことによって、音声信号成分(クロストーク)を消去する。
【0082】
本発明の第4実施形態としての雑音消去装置について、図5を用いて説明する。第2実施形態と比べた場合、本実施形態に係る雑音消去装置は、減算部204、適応フィルタ203に加えて、減算部504、適応フィルタ503とを備えている。また、信号比推定部211,平均部212,信号比推定部213、平均部214,混合部215に加えて、信号比推定部521,平均部522,信号比推定部523、平均部524,混合部525を備えている。図5に示す適応フィルタ203は、参照信号xR(k)に代えて雑音の推定値e2(k)が入力される点で、図2に示す適応フィルタ203と異なる。また、図5に示す信号比推定部213は、参照信号xR(k)に代えて雑音の推定値e2(k)を用いる点で、図2に示す信号比推定部213と異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成には同じ符号を付して詳しい説明を省略する。
【0083】
雑音消去装置500は、消去しようとするクロストークに相関のある信号(出力端子205における出力=推定音声信号あるいは強調信号)を適応フィルタで処理して擬似クロストークn2(k)(第3信号の第1推定値)を生成する。そして、これを音声と雑音の混在した参照信号xR(k)から減算することで、クロストークの消去を行う。適応フィルタ503の係数更新を行う際に、第4信号と第3信号の振幅またはパワーの比を近似する第7混在比R7(k)を用いてステップサイズを制御するために、係数更新を円滑に進めることができ、結果として、高速収束と低歪出力信号を両立することができる。
【0084】
入力端子201には、劣化信号xP(k)が、サンプル値系列として供給され、減算部204に伝達される。入力端子202には、参照信号xR(k)がサンプル値系列として供給され、減算部504に伝達される。
【0085】
減算部504には、入力端子202から参照信号xR(k)が、適応フィルタ503から擬似クロストークn2(k)が供給される。減算部504は、参照信号xR(k)から擬似クロストークn2(k)を減算し、その結果を雑音(第4信号)の推定値e2(k)として出力端子505に伝達すると同時に適応フィルタ503に帰還する。また、減算部504は、雑音の推定値e2(k)を信号比推定部213,521,523に供給する。
【0086】
適応フィルタ503は、音声の推定値e1(k)(強調信号)とフィルタ係数の畳込み演算を行い、その結果を擬似クロストークn2(k)(第3信号の第1推定値)として減算部504と信号比推定部521に伝達する。また、適応フィルタ503は、係数ベクトルw2(k)を混合部525に供給する。
【0087】
信号比推定部521は、雑音の推定値e2(k)と擬似クロストークn2(k)を受けて、雑音とクロストークの振幅または電力の比を第5混在比R5(k)として推定する。第5混在比R5(k)は、雑音の推定値e2(k)と擬似クロストークn2(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、雑音の推定値e2(k)と擬似クロストークn2(k)のいずれかまたは両方を、平均化してから用いてもよい。平均化によって、比の計算精度を向上することができる。
【0088】
平均部522は、第5混在比R5(k)を受けて時定数α5で平均化し、平均第5混在比バーR5(k)を求める。この平均化は、第5混在比R5(k)の分散を小さくし、精度を向上する効果がある。第5混在比R5(k)の分散が大きいときには時定数α5を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第5混在比R5(k)の分散を評価して、得られた分散に応じてα5を適切に設定する。
【0089】
信号比推定部523は、雑音の推定値e2(k)と音声の推定値e1(k)(第1信号の推定値)を受けて、雑音とクロストークの振幅または電力の比を第6混在比R6(k)として推定する。第6混在比R6(k)は、雑音の推定値e2(k)と音声の推定値e1(k)の振幅または電力の比としてもよいし、それらの振幅または電力に微小定数を加算してから比を計算してもよい。微小定数の加算は、除算による商の発散を防ぐ効果がある。また、雑音の推定値e2(k)と音声の推定値e1(k)のいずれかまたは両方を、平均化してから用いてもよい。
【0090】
平均部524は、第6混在比R6(k)を受けて時定数α6で平均化し、平均第6混在比バーR6(k)を求める。この平均化は、第6混在比R6(k)の分散を小さくし、精度を向上する効果がある。第6混在比R6(k)の分散が大きいときには時定数α6を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第6混在比R6(k)の分散を評価して、得られた分散に応じてα6を適切に設定する。
【0091】
混合部525は、平均第5混在比バーR5(k)と平均第6混在比バーR6(k)とを適応フィルタ503の係数ベクトルw2(k)を用いて混合して、混合結果を第7混在比R7(k)として適応フィルタ503に伝達する。式(7)に示す係数ベクトルw2(k)のサイズは、係数ベクトルw1(k)のサイズLと等しくてもよいし、異なってもよい。
【数3】
【0092】
平均第5混在比バーR5(k)と平均第6混在比バーR6(k)は、適応フィルタ503の係数ベクトルw2(k)を用いた重み付き加算によって混合してもよいし、さらに複雑な高次多項式などを用いて混合してもよい。混合に先立って、平均第5混在比バーR5(k)と平均第6混在比バーR6(k)のいずれかまたは両方を平均化してもよい。平均化によって、第7混在比R7(k)の計算精度、すなわち雑音とクロストークの振幅または電力の近似精度を向上することができる。
【0093】
ここで、単純化のために、平均第5混在比バーR5(k)と平均第6混在比バーR6(k)を重み付き加算で混合することで、第7混在比R7(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。適応フィルタ503の係数は、ゼロに初期化されることが一般的である。そのため、係数更新開始時には擬似クロストークn2(k)はゼロであり、第5混在比R5(k)は分母がゼロで無限大となる。このため、第5混在比R5(k)によって適応フィルタ503のステップサイズを算出すると、極めて小さな値またはゼロとなり、係数が成長しない。係数が成長しないと、擬似クロストークn2(k)も大きくならず、同じ問題が継続する。
【0094】
一方、第6混在比R6(k)の分母は音声の推定値e1(k)であり、係数更新開始時にゼロとは限らない。これは、マイク入力である劣化信号には環境雑音など微小な信号が含まれるためである。仮に劣化信号がゼロであっても、ゼロが継続することはない。このため、第6混在比R6(k)が無限大になることはなく、対応するステップサイズも極小値とはならない。したがって、適応フィルタ503の係数は、係数更新とともに成長し、音声の信号源から入力端子202に至る経路の音響特性を表す値に収束する。音声の推定値e1(k)がゼロのときは、適応フィルタ503の係数は更新しないので、第6混在比R6(k)が極めて大きな値をとっても問題とはならない。しかし、適応フィルタ503の係数がある程度成長して、擬似クロストークn2(k)が十分に大きく成長したときには、第6混在比R6(k)は第5混在比R5(k)よりも、雑音とクロストークの振幅または電力の比に対する近似精度が低い。
【0095】
そこで、混合部525は、適応フィルタ503の係数更新開始時に平均第6混在比バーR6(k)の重みを大きな値に設定し、係数の成長とともに減少させる。平均第5混在比バーR5(k)の重みは、適応フィルタ503の係数更新開始時に小さな値に設定し、係数の成長とともに増加させる。これは、平均第6混在比バーR6(k)の第7混在比R7(k)における含有割合を、係数更新回数に対応して減少させることを表す。
【0096】
例えば、適応フィルタ503の係数更新開始時に平均第6混在比バーR6(k)の重みを1に設定すれば、重みの和が1という条件から、平均第5混在比バーR5(k)の重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ503の係数更新開始時に平均第6混在比バーR6(k)の重みを1に設定し、係数ベクトルw2(k)の時間変化の減少に対応してその重みを0に向かって減少させる。対応して、平均第5混在比バーR5(k)の重みは、0から1へ増加する。平均第6混在比バーR6(k)の重みの初期値を1と設定し、ある時点で重みが0になるか重みを0に設定すれば、平均第6混在比バーR6(k)から平均第5混在比バーR5(k)へ切り換えることになる。前記重みの和として1以外の値を設定しても、平均第6混在比バーR6(k)に対する重みの初期値を1以外に設定しても、同様の効果が得られる。重みは、適応フィルタ503の係数ベクトルw2(k)の変化量を用いて決定することができる。すなわち、混合部525の動作は、混合部215に関する説明において入出力信号を図5で示されるように混合部525のものに変更することで、混合部215の動作と同様になる。
【0097】
適応フィルタ503は、第7混在比R7(k)が大きいときに小さなステップサイズμ2(k)を、第7混在比R7(k)が小さいときに大きなステップサイズμ2(k)を用いて、係数を更新する。第7混在比R7(k)、すなわち信号対雑音比の推定値を用いてステップサイズμ2(k)を制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に詳細に開示されているように、第7混在比R7(k)を平均化してから、ステップサイズμ2(k)の計算に用いてもよい。第4信号と第3信号の振幅または電力の比に対する推定精度が向上する。
【0098】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0099】
〔5.第5実施形態〕
図6は、本発明の第5実施形態に係るブロック図である。図6に示す本発明の第5実施形態は、図5に示す本発明の第4実施形態と等価である。図6に示す本発明の第5実施形態は、信号比推定部523に代えて、逆数計算部631を備える点で、図5に示す本発明の第4実施形態と異なる。
【0100】
逆数計算部631は、第2混在比R2(k)の逆数を求めることによって第4信号と第3信号の振幅または電力の比を第6混在比R6(k)として推定する。これにより、図6に示す本発明の第5実施形態は、図5に示す本発明の第4実施形態に比べて、演算負荷を軽減することができる。
【0101】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0102】
〔6.第6実施形態〕
図7は、本発明の第6実施形態に係るブロック図である。図7に示す本発明の第6実施形態は、図5に示す本発明の第4実施形態と等価である。図7に示す本発明の第6実施形態は、信号比推定部213に代えて、逆数計算部731を備える点で、図5に示す本発明の第4実施形態と異なる。
【0103】
逆数計算部731は、第6混在比R6(k)の逆数を求めることによって第4信号と第3信号の振幅または電力の比を第2混在比R2(k)として推定する。これにより、図7に示す本発明の第6実施形態は、図5に示す本発明の第4実施形態に比べて、演算負荷を軽減することができる。
【0104】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0105】
〔7.第7実施形態〕
図8は、本発明の第7実施形態に係るブロック図である。本発明の第7実施形態は、
図5に示す本発明の第4実施形態と等価である。すなわち、図5に示す本発明の第4実施形態は、音声と雑音の振幅または電力の比に対して2つの推定値を信号比推定部211、213で生成し、それらを平均部212と平均部214で平均化してから混合して第3混在比R3(k)を算出する。そして、第3混在比R3(k)を用いて、適応フィルタ203の係数更新を制御する。同様に、音声と雑音の振幅または電力の比に対して2つの推定値を信号比推定部521、523で生成し、それらを平均部522,524で平均化してから混合して第7混在比R7(k)を算出する。そして、第7混在比R7(k)を用いて、適応フィルタ503の係数更新を制御する。
【0106】
図8に示す本発明の第7実施形態は、2種類の雑音の推定値、すなわち参照信号xR(k)と擬似雑音n1(k)をそれぞれ平均部413,412で平均化してから混合部414で混合して第1混合信号n3(k)を生成して分母を確定し、分子である音声の推定値e1(k)を平均部415で平均化した平均音声推定値と信号比推定部416で作用させて第4混在比R4(k)を算出する。そして、第4混在比R4(k)を用いて、適応フィルタ203の係数更新を制御する。同様に、2種類のクロストークの推定値、すなわち音声の推定値e1(k)と擬似クロストークn2(k)を平均部823、822で平均化してから、混合部824で混合して第2混合信号n4(k)を生成して分母を確定し、分子である雑音の推定値e2(k)を平均部825で平均化した雑音推定値の平均値と信号比推定部826で作用させて第6混在比R6(k)を算出する。そして、第6混在比R6(k)を用いて、適応フィルタ503の係数更新を制御する。
【0107】
これら2種類の構成が可能となったのは、図5に示す本発明の第4実施形態と図8に示す本発明の第7実施形態において、音声と雑音の振幅または電力の比を推定する際に、同一の分子、すなわち雑音の推定値e2(k)を用いるからである。図8に示す本発明の第7実施形態は、図5に示す本発明の第4実施形態よりも、構成が単純である。
【0108】
図8に示す本発明の第7実施形態は、図4に示す本発明の第3実施形態における平均部412、平均部413、混合部414、平均部415、信号比推定部416に加えて、さらに平均部822、平均部823、混合部824、平均部825、信号比推定部826を備えている。
【0109】
平均部822は、擬似クロストークn2(k)を受けて時定数α8で平均化し、平均擬似クロストークバーn2(k)を求める。この平均化は、擬似クロストークn2(k)の分散を小さくし、精度を向上する効果がある。擬似クロストークn2(k)の分散が大きいときには時定数α8を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、擬似クロストークn2(k)の分散を評価して、得られた分散に応じてα8を適切に設定する。
【0110】
平均部823は、音声の推定値e1(k)を受けて時定数α9で平均化し、平均音声推定値バーe1(k)を求める。この平均化は、音声の推定値e1(k)の分散を小さくし、精度を向上する効果がある。音声の推定値e1(k)の分散が大きいときには時定数α9を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、音声の推定値e1(k)の分散を評価して、得られた分散に応じてα9を適切に設定する。
【0111】
擬似クロストークn2(k)も音声の推定値e1(k)も、クロストークの振幅または電力の推定値である。しかし、音声の推定値e1(k)は適応フィルタ503で処理されていないのに対して、擬似クロストークn2(k)は適応フィルタ503で処理されたクロストークの推定値である。このため、擬似クロストークn2(k)は音声の推定値e1(k)よりもクロストークの振幅または電力に対する推定精度が高く、分散が小さい。したがって、時定数α8とα9は、α8<α9となるように設定する。特に、擬似クロストークn2(k)の精度が十分に高く、分散が十分に小さい場合には、α8=0と設定して、擬似クロストークn2(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α8とα9を用いた平均化によって、雑音の振幅または電力を正確に推定することができる。
【0112】
混合部824は、平均音声推定値バーe1(k)および平均擬似クロストークバーn2(k)を適応フィルタ503の係数w2(k)に基づいて混合し、第2混合信号n4(k)を生成する。ここで、単純化のために、平均音声推定値バーe1(k)と平均擬似クロストークバーn2(k)とを適応フィルタ503の係数ベクトルw2(k)に基づいて重み付き加算で混合することで、第2混合信号n4(k)を求める場合を考える。また、両者の重みの和が1となるように設定する。このとき、混合部824は、適応フィルタ503の係数更新開始時に平均音声推定値バーe1(k)に対する重みを大きな値に設定し、係数ベクトルw2(k)の時間変化の減少とともに減少させる。平均擬似クロストークバーn2(k)に対する重みは、適応フィルタ503の係数更新開始時に小さな値に設定し、係数ベクトルw2(k)の時間変化の減少とともに増加させる。これは、平均擬似クロストークバーn2(k)が係数更新開始時にゼロとなるので、推定された信号対雑音比が大きくなって係数が更新されないことを回避するためである。このような制御は、第2混合信号n4(k)における平均音声推定値バーe1(k)の含有割合を、係数ベクトルw2(k)の時間変化の減少に対応して減少させることを表す。
【0113】
例えば、適応フィルタ503の係数更新開始時に平均音声推定値バーe1(k)に対する重みを1に設定すれば、平均擬似クロストークバーn2(k)に対する重みは0となる。係数の成長は係数更新回数と対応する。したがって、適応フィルタ503の係数更新開始時に平均音声推定値バーe1(k)に対する重みを1に設定し、係数更新回数に対応してその重みを0に向かって減少させる。対応して、平均擬似クロストークバーn2(k)に対する重みは、0から1へ増加する。
【0114】
平均音声推定値バーe1(k)に対する重みは減少し、平均擬似クロストークバーn2(k)に対する重みは増加する。両者の重みを1と0の2値で表せば、平均音声推定値バーe1(k)に対する重みは1を維持した後に0に変化する。平均擬似クロストークバーn2(k)に対する重みは0を維持した後に1に変化する。これは、混合部414の出力が平均音声推定値バーe1(k)から平均擬似クロストークバーn2(k)に切り替わったことに相当する。
【0115】
平均部825は、雑音(第4信号)の推定値e2(k)を受けて時定数α10で平均化し、平均第4信号推定値バーe2(k)を求める。この平均化は、第4信号の推定値e2(k)の分散を小さくし、精度を向上する効果がある。第4信号の推定値e2(k)の分散が大きいときには時定数α10を大きな値に設定し、分散が小さいときには小さな値に設定することで、さらに精度を向上することができる。すなわち、第4信号の推定値e2(k)の分散を評価して、得られた分散に応じてα10を適切に設定する。
【0116】
擬似雑音n2(k)と雑音(第4信号)の推定値e2(k)は同等の推定精度であり、分散も同等である。したがって、時定数α10は、α10≒α8<α9となるように設定する。特に、雑音(第4信号)の推定値e2(k)の精度が十分に高く、分散が十分に小さい場合には、α10=0と設定して、雑音(第4信号)の推定値e2(k)に対する平均化を行わないように設定することもできる。適切に設定した時定数α10を用いた平均化によって、雑音の振幅または電力を正確に推定することができる。
【0117】
信号比推定部826は、平均第4信号推定値バーe2(k)と第2混合信号n4(k)とを受けて、音声と雑音の振幅または電力の比を第6混在比R6(k)として推定する。適応フィルタ503は、第6混在比R6(k)を用いて、係数ベクトルw2(k)の更新を制御する。
【0118】
適応フィルタ503は、第6混在比R6(k)が大きいときに小さなステップサイズμ2(k)を、第6混在比R6(k)が小さいときに大きなステップサイズμ2(k)を用いて、係数ベクトルw2(k)を更新する。第6混在比R6(k)、すなわち信号対雑音比の推定値を用いてステップサイズを制御する方法に関しては、特許文献1から3に詳細に開示されている。また、特許文献1から3に開示されているように、第6混在比R6(k)を平均化してから、ステップサイズμ2(k)の計算に用いてもよい。音声と雑音の振幅または電力の比に対する推定精度が向上する。
【0119】
混合部824の動作は、入力信号である平均擬似雑音と雑音推定値の平均値が平均擬似クロストークと平均音声推定値(平均第1信号推定値)にそれぞれ置き換わったことを除いて、混合部414の動作と同様である。従って、すでに説明した混合部414の動作に関する変更例は、混合部824にも同様に適用できる。また、混合部824は、平均音声推定値バーe1(k)および平均擬似クロストークバーn2(k)に対する重みの最小値を0ではなく、0よりも大きな値とすることもできる。
【0120】
このような構成を備えた本実施形態によれば、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0121】
〔8.他の実施形態〕
以上、本発明の複数の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0122】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、上述の実施形態の機能を実現する情報処理プログラム(信号処理プログラム)が、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。そのようなプログラムは、信号処理装置あるいは雑音消去装置を構成するDSP(Digital Signal Processor)などのプロセッサで実行される。さらには、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
【0123】
図9は、第1~第7実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ900の構成図である。コンピュータ900は、入力部901と、プロセッサ(CPU)902と、出力部903と、メモリ904とを含む。
【0124】
プロセッサ902は、メモリ904に記憶された信号処理プログラムを読み込むことにより、コンピュータ900の動作を制御する。プロセッサ902は、例えば、DSP、CPU(Central Processing Unit)、またはMPU(Micro Processing Unit)などのプロセッサである。メモリ904は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、およびEEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)などのうち1つ以上を含む。
【0125】
図10は、図9に示すコンピュータのプロセッサによる信号処理の一例を示すフローチャートである。図10に示す例は、コンピュータ900が第1実施形態に係る信号処理装置100として機能する場合のフローチャートである。
【0126】
図10に示すように、信号処理プログラムを実行したプロセッサ902は、ステップS1010において、まず、第1入力部101から、第1信号と第2信号が混在した第1混在信号xP(k)を入力し、第1信号と相関のある第3信号と第2信号と相関のある第4信号とが混在した第2混在信号xR(k)を入力する。プロセッサ902は、ステップS1020において、第2混在信号xR(k)を第1適応フィルタ(適応フィルタ103)で処理して第2信号の推定値n1(k)を生成し、ステップS1030において、第1混在信号xP(k)と第2信号の推定値n1(k)から第1信号の推定値e1(k)を生成する。プロセッサ902は、ステップS1040において、第1信号の推定値e1(k)と第2信号の第1推定値n1(k)を用いて、第1信号と第2信号の振幅または電力の比を第1混在比R1(k)として推定する。プロセッサ902は、ステップS1050において、第1信号の推定値e1(k)と第2混在信号xR(k)を用いて、第1信号と第2信号の振幅または電力の比を第2混在比R2(k)として推定する。プロセッサ902は、ステップS1060において、第1混在比R1(k)を第1の時定数α1で平均化して平均第1混在比を生成し、第2混在比R2(k)を第1の時定数α1より大きい第2の時定数α2で平均化して平均第2混在比を生成する。プロセッサ902は、ステップS1070において、平均第1混在比と平均第2混在比を第1適応フィルタ係数141の時間変化に基づいて混合して第3混在比R3(k)を生成する。プロセッサ902は、ステップS1080において、第3混在比R3(k)を用いて、第2信号の推定値の生成を制御する。これにより、第1実施形態と同様の効果を得ることができる。
【0127】
また、コンピュータ900が第2実施形態に係る信号処理装置として機能する場合、プロセッサ902は、ステップS1010において、第1混在信号xP(k)と第2混在信号xR(k)とを入力し、ステップS1020において、第2混在信号xR(k)を第1適応フィルタ(適応フィルタ203)で処理して第2信号の推定値n1(k)を生成する。プロセッサ902は、ステップS1030において第1混在信号xP(k)と第2信号の推定値n1(k)とから第1信号の推定値e1(k)を生成する。プロセッサ902は、ステップS1040において、第1信号の推定値e1(k)と第2信号の第1推定値n1(k)を用いて、第1信号と第2信号の振幅または電力の比を第1混在比R1(k)として推定する。プロセッサ902は、ステップS1050において、第1信号の推定値e1(k)と第2混在信号xR(k)を用いて、第1信号と第2信号の振幅または電力の比を第2混在比R2(k)として推定する。プロセッサ902は、ステップS1060において、第1混在比R1(k)を第1の時定数α1で平均化して平均第1混在比を生成し、第2混在比R2(k)を第1の時定数α1より大きい第2の時定数α2で平均化して平均第2混在比を生成する。プロセッサ902は、ステップS1070において、平均第1混在比と平均第2混在比を第1適応フィルタ係数141の時間変化に基づいて混合して第3混在比R3(k)を生成する。プロセッサ902は、ステップS1080において、第3混在比R3(k)を用いて、第2信号の推定値の生成を制御する。
【0128】
また、コンピュータ900が第3実施形態に係る信号処理装置として機能する場合、プロセッサ902は、ステップS1040からS1070において、第1信号の推定値e1(k)と第2信号の推定値n1(k)と第4信号の推定値e2(k)と第1適応フィルタ(適応フィルタ203)の係数141とを用いて第3混在比R3(k)を生成する。さらに、プロセッサ902は、第1信号の推定値e1(k)を第2適応フィルタ(適応フィルタ503)で処理して第3信号の第1推定値n2(k)を生成し、第2混在信号xR(k)から第3信号の第1推定値n2(k)を減算して第4信号の推定値e2(k)を生成する。また、プロセッサ902は、第1適応フィルタ(適応フィルタ203)において参照入力信号xR(k)に代えて第4信号の推定値e2(k)を処理し、第4信号の推定値e2(k)と第3信号の第1推定値n2(k)と第1信号の推定値e1(k)と第2適応フィルタ(適応フィルタ503)の係数とをさらに用いて、雑音と音声信号の振幅または電力の比を第6混在比R6(k)としてさらに推定する。
【0129】
〔9.その他〕
また、上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0130】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0131】
〔10.効果〕
上述してきたように、第1実施形態に係る信号処理装置100は、第1入力部101(第1入力手段の一例に相当)と、第2入力部102(第2入力手段の一例に相当)と、適応フィルタ103(第1適応フィルタの一例に相当)と、減算部104(第1減算部の一例に相当)と、信号比推定部111と、平均部112と、信号比推定部113と、平均部114と、混合部115と、係数更新制御部107とを備える。第1入力部101は、第1信号と第2信号が混在した第1混在信号xP(k)を入力する。第2入力部102は、第1信号と相関のある第3信号と第2信号と相関のある第4信号とが混在した第2混在信号xR(k)を入力する。適応フィルタ103は、第2混在信号xR(k)をフィルタ処理して第2信号の推定値n1(k)を生成する。減算部104は、第1混在信号xP(k)と第2信号の推定値n1(k)とから第1信号の推定値e1(k)を生成する。信号比推定部111は、第1信号の推定値e1(k)と第2信号の推定値n1(k)の比として第1混合比R1(k)を生成する。平均部112は、第1混合比R1(k)を第1の時定数α1で平均化して平均第1混合比バーR1(k)を生成する。信号比推定部113は、第1信号の推定値e1(k)と第2混在信号xR(k)の比として第2混合比R2(k)を生成する。平均部114は、第2混合比R2(k)を第1の時定数α1より大きい第2の時定数α2で平均化して平均第2混合比バーR2(k)を生成する。混合部115は、適応フィルタ103の係数141を用いて平均第1混合比バーR1(k)と平均第2混合比バーR2(k)を混合し、第1信号と第2信号の振幅または電力の比を第3混合比バーR3(k)として推定する。係数更新制御部107は、混合部115によって得られた第3混在比R3(k)の値が大きい場合に、適応フィルタ103の係数141の更新量を小さくするための制御信号μ1(k)を適応フィルタ103に出力する。信号処理装置100は、制御信号μ1(k)を用いて適応フィルタ103を制御する。これにより、信号処理装置100は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0132】
また、第2実施形態に係る信号処理装置は、入力端子201(第1入力手段の一例に相当)と、入力端子202(第2入力手段の一例に相当)と、適応フィルタ203(第1適応フィルタの一例に相当)と、減算部204(第1減算部の一例に相当)と、信号比推定部211(第1信号比推定部の一例に相当)と、平均部212(第1平均部の一例に相当)と,信号比推定部213(第2信号比推定部の一例に相当)と、平均部214(第2平均部の一例に相当)と、混合部215(第1混合部の一例に相当)とを備える。入力端子201は、音声信号(第1信号の一例に相当)と雑音(第2信号の一例に相当)とが混在した劣化信号xP(k)(第1混在信号の一例に相当)を入力する。入力端子202は、音声信号と相関のある信号(第3信号の一例に相当)と雑音と相関のある信号(第4信号の一例に相当)とが混在した参照信号xR(k)(第2混在信号の一例に相当)を入力する。適応フィルタ203は、参照信号xR(k)をフィルタ処理して擬似雑音n1(k)(第2信号の推定値の一例に相当)を生成する。減算部204は、劣化信号xP(k)と擬似雑音n1(k)とから音声の推定値e1(k)(第1信号の推定値e1(k)の一例に相当)を生成する。信号比推定部211は、第1信号の推定値e1(k)と第2信号の推定値n1(k)の比として第1混合比R1(k)を生成する。平均部212は、第1混合比R1(k)を第1の時定数α1で平均化して平均第1混合比バーR1(k)を生成する。信号比推定部213は、第1信号の推定値e1(k)と第2混在信号xR(k)の比として第2混合比R2(k)を生成する。平均部214は、第2混合比R2(k)を第1の時定数α1より大きい第2の時定数α2で平均化して平均第2混合比バーR2(k)を生成する。混合部215は、適応フィルタ203の係数141を用いて平均第1混合比バーR1(k)と平均第2混合比バーR2(k)を混合し、第1信号と第2信号の振幅または電力の比を第3混合比バーR3(k)として推定する。信号処理装置200は、第3混在比R3(k)を用いて適応フィルタ203を制御する。これにより、第2実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0133】
また、平均部112は、第1混在比R1(k)を時定数α1で平均化して分散を小さくし、精度を向上する。また、平均部114は、第2混在比R2(k)をα1より大きい時定数α2で平均化して分散を小さくし、精度を向上する。これにより、第1実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0134】
また、平均部212は、第1混在比R1(k)を時定数α1で平均化して分散を小さくし、精度を向上する。また、平均部214は、第2混在比R2(k)をα1より大きい時定数α2で平均化して分散を小さくし、精度を向上する。これにより、第2実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0135】
また、平均部412は、擬似雑音n1(k)を時定数α3で平均化して分散を小さくし、精度を向上する。また、平均部413は、参照信号xR(k)をα3より大きい時定数α4で平均化して分散を小さくし、精度を向上する。これにより、第3実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0136】
また、平均部212は、第1混在比R1(k)を時定数α1で平均化して分散を小さくし、精度を向上する。また、平均部214は、第2混在比R2(k)をα1より大きい時定数α2で平均化して分散を小さくし、精度を向上する。さらに、平均部522は、第5混在比R5(k)を時定数α5で平均化して分散を小さくし、精度を向上する。また、平均部524は、第6混在比R6(k)をα5より大きい時定数α6で平均化して分散を小さくし、精度を向上する。これにより、第4から第6実施形態に係る信号処理装置は、クロストークが無視できないときでも、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0137】
また、平均部412は、擬似雑音n1(k)を時定数α3で平均化して分散を小さくし、精度を向上する。また、平均部413は、参照信号xR(k)をα3より大きい時定数α4で平均化して分散を小さくし、精度を向上する。さらに、平均部822は、擬似クロストークn2(k)を時定数α8で平均化して分散を小さくし、精度を向上する。また、平均部823は、音声の推定値e1(k)をα8より大きい時定数α9で平均化して分散を小さくし、精度を向上する。これにより、第7実施形態に係る信号処理装置は、クロストークが無視できないときでも、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0138】
また、適応フィルタ203の係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の2乗総和または絶対値総和の時間変化であり、適応フィルタ503の係数ベクトルw2(k)の時間変化は、係数ベクトルw2(k)の2乗総和または絶対値総和の時間変化である。これにより、第1~第7実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0139】
また、適応フィルタ203の係数ベクトルw1(k)の時間変化は、係数ベクトルw1(k)の2乗部分和または絶対値部分和の時間変化であり、適応フィルタ503の係数ベクトルw2(k)の時間変化は、係数ベクトルw2(k)の2乗部分和または絶対値部分和の時間変化である。これにより、第1~第7実施形態に係る信号処理装置は、適切に設定された時定数による平均化を通じて音声と雑音の振幅または電力の比を正確に推定することができ、高速収束と低歪出力信号を両立する信号処理装置を得ることができる。
【0140】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0141】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、減算部は、減算手段や減算回路に読み替えることができる。
(付記1)
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成する第1減算部と、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定する第1信号比推定部と、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求める第1平均部と、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定する第2信号比推定部と、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求める第2平均部と、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成する第1混合部と、
を備え、
前記第3混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
(付記2)
前記第1の時定数はゼロであり、前記第1平均混在比は前記第1混在比に等しい、
(付記1)に記載の信号処理装置。
(付記3)
前記第1混合部は、
前記第1適応フィルタの係数更新開始時に前記第2混在比の含有割合を100%に設定し、
前記第1適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第2混在比の含有割合を0%に設定する
(付記1)に記載の信号処理装置。
(付記4)
前記第1平均部は、
前記第1混在比の分散を求め、分散が大きいときに前記第1の時定数を大きい値に設定することで前記第1平均混在比の分散を小さくする(付記1)に記載の信号処理装置。
(付記5)
前記第2平均部は、
前記第2混在比の分散を求め、分散が大きいとき前記第2の時定数を大きい値に設定することで前記第2平均混在比の分散を小さくする(付記1)に記載の信号処理装置。
(付記6)
第1信号と第2信号が混在した第1混在信号を入力する第1入力手段と、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力する第2入力手段と、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を生成する第1適応フィルタと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成する第1減算部と、
前記第2信号の第1推定値を第3の時定数で平均化して前記第2信号の平均推定値を求める第3平均部と、
前記第2混在信号を前記第3の時定数より大きい第4の時定数で平均化して前記第2混在信号の平均値を求める第4平均部と、
前記第2信号の平均推定値と前記第2混在信号の平均値を、前記第1適応フィルタの係数の時間変化に基づいて混合して前記第2信号の第2推定値を生成する第2混合部と、
前記第1信号の推定値を第5の時定数で平均化して前記第1信号の平均第1推定値を求める第5平均部と、
前記第1信号の平均推定値と前記第2信号の第2推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第4混在比として推定する第3信号比推定部と、
を備え、
前記第4混在比を用いて前記第1適応フィルタを制御する
信号処理装置。
(付記7)
前記第3の時定数はゼロであり、前記第2信号の平均第2推定値は前記第2信号の第1推定値に等しい、
(付記6)に記載の信号処理装置。
(付記8)
前記第5の時定数はゼロであり、前記第1信号の平均第1推定値は前記第1信号の推定値に等しい、
(付記6)に記載の信号処理装置。
(付記9)
前記第2混合部は、
前記第1適応フィルタの係数更新開始時に前記第2混在信号の平均値の含有割合を100%に設定し、
前記第1適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第2混在信号の含有割合を0%に設定する
(付記6)に記載の信号処理装置。
(付記10)
前記第3平均部は、
前記第2信号の第1推定値の分散を求め、分散が大きいときに前記第3の時定数を大きい値に設定することで前記第2信号の平均推定値の分散を小さくする
(付記6)に記載の信号処理装置。
(付記11)
前記第4平均部は、
前記第2混在信号の分散を求め、分散が大きいとき前記第4の時定数を大きい値に設定することで前記第2混在信号の平均値の分散を小さくする
請求項6に記載の信号処理装置。
(付記12)
前記第5平均部は、
前記第1信号の推定値の分散を求め、分散が大きいとき前記第5の時定数を大きい値に設定することで前記第1信号の平均推定値の分散を小さくする
(付記6)に記載の信号処理装置。
(付記13)
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を生成する第2適応フィルタと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成する第2減算部と、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定する第4信号比推定部と、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求める第6平均部と、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定する第5信号比推定部と、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求める第7平均部と、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成する第3混合部と、
をさらに備え、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第2信号比推定部は前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第7混在比を用いて前記第2適応フィルタを制御する
(付記1)に記載の信号処理装置。
(付記14)
前記第6の時定数はゼロであり、前記第5平均混在比は前記第5混在比に等しい、
(付記13)に記載の信号処理装置。
(付記15)
前記第3混合部は、
前記第2適応フィルタの係数更新開始時に前記第6平均混在比の含有割合を100%に設定し、
前記第2適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第6平均混在比の含有割合を0%に設定する
(付記13)に記載の信号処理装置。
(付記16)
前記第6平均部は、
前記第5混在比の分散を求め、分散が大きいときに前記第6の時定数を大きい値に設定することで前記第5平均混在比の分散を小さくする
(付記13)に記載の信号処理装置。
(付記17)
前記第7平均部は、
前記第6混在比の分散を求め、分散が大きいとき前記第7の時定数を大きい値に設定することで前記第6平均混在比の分散を小さくする
(付記13)に記載の信号処理装置。
(付記18)
前記第5信号比推定部の代わりに、
前記第2混在比の逆数を前記第6混在比として求める第1逆数計算部を備える
(付記13)に記載の信号処理装置。
(付記19)
前記第2信号比推定部の代わりに、
前記第6混在比の逆数を前記第2混在比として求める第2逆数計算部を備える
(付記13)に記載の信号処理装置。
(付記20)
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を生成する第2適応フィルタと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成する第2減算部と、
前記第3信号の第1推定値を第8の時定数で平均化して前記第3信号の平均第1推定値を求める第8平均部と、
前記第1信号の推定値を前記第8の時定数より大きい第9の時定数で平均化して前記第1信号の推定値の平均値を求める第9平均部と、
前記第3信号の平均第1推定値と前記第1信号の推定値の平均値を、前記第2適応フィルタの係数の時間変化に基づいて混合して前記第3信号の第2推定値を生成する第4混合部と、
前記第4信号の推定値を第10の時定数で平均化して前記第4信号の平均推定値を求める第10平均部と、
前記第4信号の平均推定値と前記第3信号の第2推定値とを用いて前記第4信号と前記第3信号の振幅または電力の比を第6混在比として推定する第6信号比推定部と、
をさらに備え、
前記第6混在比を用いて前記第2適応フィルタを制御する
(付記6)に記載の信号処理装置。
(付記21)
前記第8の時定数はゼロであり、前記第3信号の平均第1推定値は前記第3信号の第1推定値に等しい、
(付記20)に記載の信号処理装置。
(付記22)
前記第9の時定数はゼロであり、前記第1信号の平均推定値は前記第1信号の推定値に等しい、
(付記20)に記載の信号処理装置。
(付記23)
前記第4混合部は、
前記第2適応フィルタの係数更新開始時に前記第1信号の推定値の平均値の含有割合を100%に設定し、
前記第2適応フィルタの係数値の時間変化が十分に小さくなったとき、
前記第1信号の推定値の平均値の含有割合を0%に設定する
(付記20)に記載の信号処理装置。
(付記24)
前記第8平均部は、
前記第3信号の第1推定値の分散を求め、分散が大きいときに前記第8の時定数を大きい値に設定することで前記第3信号の平均第1推定値の分散を小さくする
(付記20)に記載の信号処理装置。
(付記25)
前記第9平均部は、
前記第1信号の推定値の分散を求め、分散が大きいとき前記第9の時定数を大きい値に設定することで前記第1信号の推定値の平均値の分散を小さくする
(付記20)に記載の信号処理装置。
(付記26)
前記第10平均部は、
前記第4信号の推定値の分散を求め、分散が大きいとき前記第10の時定数を大きい値に設定することで前記第4信号の平均推定値の分散を小さくする
(付記20)に記載の信号処理装置。
(付記27)
前記第1適応フィルタの係数値の時間変化は、
前記係数値の2乗総和または絶対値総和の時間変化である
(付記1)または(付記6)に記載の信号処理装置。
(付記28)
前記第2適応フィルタの係数値の時間変化は、
前記係数値の2乗総和または絶対値総和の時間変化である
(付記13)または(付記20)に記載の信号処理装置。
(付記29)
前記第1適応フィルタの係数値の時間変化は、
前記係数値の2乗部分和または絶対値部分和の時間変化である
(付記1)または(付記6)に記載の信号処理装置。
(付記30)
前記第2適応フィルタの係数値の時間変化は、
前記係数値の2乗部分和または絶対値部分和の時間変化である
(付記13)または(付記20)に記載の信号処理装置。
(付記31)
第1信号と第2信号が混在した第1混在信号を入力し、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力し、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成し、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成し、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定し、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求め、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定し、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求め、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成し、
前記第3混在比を用いて前記第1適応フィルタを制御する
信号処理方法。
(付記32)
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を第2適応フィルタで生成し、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成し、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定し、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求め、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定し、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求め、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成し、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第2混在信号に代えて前記第4信号の推定値を入力とし、
前記第7混在比を用いて前記第2適応フィルタを制御する
(付記31)に記載の信号処理方法。
(付記33)
コンピュータに、
第1信号と第2信号が混在した第1混在信号を入力するステップと、
前記第1信号と相関のある第3信号と前記第2信号と相関のある第4信号とが混在した第2混在信号を入力するステップと、
前記第2混在信号をフィルタ処理して前記第2信号の第1推定値を第1適応フィルタで生成するステップと、
前記第1混在信号と前記第2信号の第1推定値から前記第1信号の推定値を生成するステップと、
前記第1信号の推定値と前記第2信号の第1推定値とを用いて前記第1信号と前記第2信号の振幅または電力の比を第1混在比として推定するステップと、
前記第1混在比を第1の時定数で平均化して第1平均混在比を求めるステップと、
前記第1信号の推定値と前記第2混在信号とを用いて前記第1信号と前記第2信号の振幅または電力の比を第2混在比として推定するステップと、
前記第2混在比を前記第1の時定数より大きい第2の時定数で平均化して第2平均混在比を求めるステップと、
前記第1平均混在比と前記第2平均混在比を、前記第1適応フィルタの係数の時間変化に基づいて混合して第3混在比を生成するステップと、
前記第3混在比を用いて前記第1適応フィルタを制御するステップと
を実行させる信号処理プログラム。
(付記34)
コンピュータに、
前記第1信号の推定値をフィルタ処理して前記第3信号の第1推定値を第2適応フィルタで生成するステップと、
前記第2混在信号から前記第3信号の第1推定値を減算して前記第4信号の推定値を生成するステップと、
前記第3信号の第1推定値と前記第4信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第5混在比として推定するステップと、
前記第5混在比を第6の時定数で平均化して第5平均混在比を求めるステップと、
前記第4信号の推定値と前記第1信号の推定値とを用いて前記第3信号と前記第4信号の振幅または電力の比を第6混在比として推定するステップと、
前記第6混在比を前記第6の時定数より大きい第7の時定数で平均化して第6平均混在比を求めるステップと、
前記第5平均混在比と前記第6平均混在比を、前記第2適応フィルタの係数の時間変化に基づいて混合して第7混在比を生成するステップと、
前記第1適応フィルタは前記第2混在信号に代えて前記第4信号の推定値を入力するステップと、
前記第2混在信号に代えて前記第4信号の推定値を入力するステップと、
前記第7混在比を用いて前記第2適応フィルタを制御するステップと
を実行させる(付記33)に記載の信号処理プログラム。
【符号の説明】
【0142】
100 信号処理装置
101 第1入力部
102 第2入力部
103,203 適応フィルタ(第1適応フィルタの一例に相当)
104,204 減算部(第1減算部の一例に相当)
107 係数更新制御部
111,211 信号比推定部(第1信号比推定部の一例に相当)
113,213 信号比推定部(第2信号比推定部の一例に相当)
416 信号比推定部(第3信号比推定部の一例に相当)
521 信号比推定部(第4信号比推定部の一例に相当)
523 信号比推定部(第5信号比推定部の一例に相当)
826 信号比推定部(第6信号比推定部の一例に相当)
112,212 平均部(第1平均部の一例に相当)
114,214 平均部(第2平均部の一例に相当)
412 平均部(第3平均部の一例に相当)
413 平均部(第4平均部の一例に相当)
415 平均部(第5平均部の一例に相当)
522 平均部(第6平均部の一例に相当)
524 平均部(第7平均部の一例に相当)
822 平均部(第8平均部の一例に相当)
823 平均部(第9平均部の一例に相当)
825 平均部(第10平均部の一例に相当)
115,215 混合部(第1混合部の一例に相当)
414 混合部(第2混合部の一例に相当)
525 混合部(第3混合部の一例に相当)
824 混合部(第4混合部の一例に相当)
631 逆数計算部(第1逆数計算部の一例に相当)
731 逆数計算部(第2逆数計算部の一例に相当)
141 係数
200,400,500,600,700,800 雑音消去装置(信号処理装置の一例に相当)
201 入力端子(第1入力部の一例に相当)
202 入力端子(第2入力部の一例に相当)
205,505 出力端子
503 適応フィルタ(第2適応フィルタの一例に相当)
504 減算部(第2減算部の一例に相当)
A 信号源
B 信号源
e1(k) 第1信号の推定値,音声信号の推定値、劣化信号
e2(k) 雑音の推定値(第4信号の推定値の一例に相当)
n1(k) 第2信号の推定値,擬似雑音(第2信号の推定値の一例に相当)
n2(k) 擬似クロストーク(第3信号の第1推定値の一例に相当)
n3(k) 混合信号(第1混合信号の一例に相当)
n4(k) 混合信号(第2混合信号の一例に相当)
R1(k) 第1混在比
R2(k) 第2混在比
R3(k) 第3混在比
R4(k) 第4混在比
R5(k) 第5混在比
R6(k) 第6混在比
R7(k) 第7混在比
R8(k) 第8混在比
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10