特許第6288561号(P6288561)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 齋藤 晋哉の特許一覧 ▶ 大石 邦夫の特許一覧 ▶ 古川 利博の特許一覧

<>
  • 特許6288561-ブラインド信号分離方法およびその装置 図000025
  • 特許6288561-ブラインド信号分離方法およびその装置 図000026
  • 特許6288561-ブラインド信号分離方法およびその装置 図000027
  • 特許6288561-ブラインド信号分離方法およびその装置 図000028
  • 特許6288561-ブラインド信号分離方法およびその装置 図000029
  • 特許6288561-ブラインド信号分離方法およびその装置 図000030
  • 特許6288561-ブラインド信号分離方法およびその装置 図000031
  • 特許6288561-ブラインド信号分離方法およびその装置 図000032
  • 特許6288561-ブラインド信号分離方法およびその装置 図000033
  • 特許6288561-ブラインド信号分離方法およびその装置 図000034
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6288561
(24)【登録日】2018年2月16日
(45)【発行日】2018年3月7日
(54)【発明の名称】ブラインド信号分離方法およびその装置
(51)【国際特許分類】
   G10L 21/0272 20130101AFI20180226BHJP
【FI】
   G10L21/0272 100Z
【請求項の数】4
【全頁数】19
(21)【出願番号】特願2014-101793(P2014-101793)
(22)【出願日】2014年4月24日
(65)【公開番号】特開2015-210512(P2015-210512A)
(43)【公開日】2015年11月24日
【審査請求日】2017年3月16日
(73)【特許権者】
【識別番号】509257961
【氏名又は名称】齋藤 晋哉
(73)【特許権者】
【識別番号】506178874
【氏名又は名称】大石 邦夫
(73)【特許権者】
【識別番号】513234798
【氏名又は名称】古川 利博
(72)【発明者】
【氏名】齋藤 晋哉
(72)【発明者】
【氏名】大石 邦夫
(72)【発明者】
【氏名】古川 利博
【審査官】 菊池 智紀
(56)【参考文献】
【文献】 特開2011−81373(JP,A)
【文献】 特開2008−33307(JP,A)
【文献】 齋藤晋哉 他,"逆行列の補題を用いた適応ALSアルゴリズムにおけるブラインド音源分離",電子情報通信学会技術研究報告,2007年 2月27日,Vol.106,No.570,pp.63-67
【文献】 SAITO, Shinya et al.,"AN APPROACH TO CONVOLUTIVE BACKWARD-MODEL BLIND SOURCE SEPARATION BASED ON JOINT DIAGONALIZATION",Proc. of EUSIPCO2012,2012年 8月27日,pp.579-583
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/0208−21/0364,
15/20
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみからブラインドで推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、正規化された空間相関行列から混合行列を推定するために、制約条件付きフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法と反復法の組み合わせにより解法する手順と、手順の収束後、累乗法を1回用いて最小2乗型同時対角化問題の解となる混合行列を求め、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底を補い、次いで、ランク落ちした混合行列の特異値とその総和が変わらないように特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求め、同一信号源から発生した信号の周波数ビンの電力比に相関があることを利用してパーミュテーション問題を、多数決を利用して解法することによって信号分離精度の高い分離行列を求めることを特徴とするブラインド信号分離方法。
【請求項2】
請求項1記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することを特徴とするブラインド信号分離方法。
【請求項3】
請求項1乃至請求項2のいずれか1項に記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を、全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とするブラインド信号分離方法。
【請求項4】
請求項1乃至請求項3のいずれか1項に記載のブラインド信号分離方法を用いて信号源分離を行うように構成されていることを特徴とするブラインド信号分離方法を用いたブラインド信号分離装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみから推定するブラインド信号分離方法に係わり、特に、最小2乗型同時対角化問題の解法を用いて高い精度で信号を分離することができるブラインド信号分離装置に関する。
【背景技術】
【0002】
複数の未知信号源信号が未知の畳み込み混合系により混在されて観測されるとき、観測信号を分離して混在前の未知信号源信号を推定する処理をブラインド信号分離という。ブラインド信号分離では、未知信号源信号間の統計的独立性のみを条件として、観測信号から未知信号源信号を推定する方法であり、信号源の位置或いは観測信号の到来方向の推定を必ずしも必要としない方法である。
【0003】
勾配法に基づく周波数領域の信号分離方法が非特許文献1で提案されている。勾配法に基づき周波数ビン毎に分離行列を更新することによって分離信号を推定する。
【0004】
最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法が非特許文献2と非特許文献3で提案されている。これらの方法は、最小2乗型同時対角化問題の解法による混合行列の推定、最小2乗型一般化逆行列を用いた混合行列からの分離行列の推定、スケーリング問題の解法、パーミュテーション問題の解法の4つの手順から成る。
【0005】
周波数ビン間の電力比の相関に基づきパーミュテーション行列を推定する方法が非特許文献4で提案されている。
【先行技術文献】
【0006】
【非特許文献1】 L.Parra and C.Spence,”Convolutive blind separation of non−stationary Sources”,IEEE Transactions on Speech and Audio Processing,vol.8,no.3,pp.320−327,May,2000
【非特許文献2】 A.Yeredor,”Non−orthogonal joint diagonalization in the least−squares sense with application in blind source separation”,IEEE Transactions on Signal Processing,vol.50,no.7,pp.1545−1553,July 2002
【非特許文献3】 K.Rahbar and J.P.Reilly,”A frequency domain method for blind source separation of convolutive audio mixtures”,IEEE Transactions on Speech and Audio Processing,vol.13,no.5,pp.832−844,Sept.2005
【非特許文献4】 H.Sawada,S.Araki,and S.Makino,”Measuring dependence of bin−wise separated signals for permutation alignment in frequency−domain BSS”,Proc.IEEE Int.Symp.Circuits Syst.,pp.3247−3250,May 2007
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来のブラインド信号分離方法で使用されている勾配法は演算量が少ないが、収束が遅く、実環境下で十分な信号分離精度を得ることができない。
【0008】
従来のブラインド信号分離方法では、時間周波数領域で周波数ビンとエポック毎、即ち、ポイント毎に観測信号の空間相関行列をそのフロベニウスノルムで正規化しているため、未知信号源信号が音声の場合、音声の特徴を表す周波数特性が失われ、周波数ビンに対して振幅特性が一定になり、信号分離精度が劣化する。
【0009】
従来のブラインド信号分離方法では、時間周波数領域で観測信号の空間相関行列から最小2乗型同時対角化問題の解法を用いて混合行列を推定し、次いで最小2乗型一般化逆行列を用いて混合行列から分離行列を推定しているため、最小2乗型同時対角化問題に分離行列の推定が含まれず、仮に混合行列を精度良く推定できても分離行列が精度良く推定できるとは限らず、信号分離精度が劣化する場合がある。
【0010】
従来のブラインド信号分離方法では、時間周波数領域で観測信号の空間相関行列から制約条件を課すことなく最小2乗型同時対角化問題の解法を用いて混合行列を推定し、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定する前に、塁乗法により制約条件を課しているので、手順が収束に要する反復回数は大幅に増加する。
【0011】
更に、従来のブラインド信号分離方法において混合行列の最小2乗型一般化逆行列を単に分離行列として取り扱うと、加法性雑音が存在する場合、雑音の影響が大きくなって信号分離性能の劣化につながる。
【0012】
同一信号源から発生した信号の隣接周波数ビンに相関があることを利用した従来のパーミュテーション問題の解法では、1度誤りが生じると、これ以降の解法が誤り続ける確率が非常に高くなる。
【0013】
本発明はこのような事情を鑑みてなされたものであり、信号源とブラインド信号分離装置出力間を表した混合行列と分離行列の縦続接続モデルを最小2乗型同時対角化問題に取り込み、更にモデルに因果性を与えることによって信号分離性能の向上と反復手順の収束高速化の両立、更に、同一信号源から発生した信号の周波数ビン間の電力比相関性と多数決を組み合わせによってパーミュテーション問題を正確に解法することを目的とする。
【課題を解決するための手段】
【0014】
このような目的に応えるために本発明(請求項1記載の発明)に係るブラインド信号分離方法は、未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみからブラインドで推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、正規化された空間相関行列から混合行列を推定するために、制約条件付きフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法と反復法の組み合わせにより解法する手順と、手順の収束後、累乗法を1回用いて最小2乗型同時対角化問題の解となる混合行列を求め、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底を補い、次いで、ランク落ちした混合行列の特異値とその総和が変わらないように特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求め、同一信号源から発生した信号の周波数ビンに相関があることを利用してパーミュテーション問題を、多数決を利用して解法することによって信号分離精度の高い分離行列を求めることを特徴とする。
【0015】
本発明(請求項2記載の発明)に係るブラインド信号分離方法は、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することを特徴とする。
【0016】
本発明(請求項3記載の発明)に係るブラインド信号分離方法は、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を、全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とする。
【0017】
すなわち、本発明によれば、観測信号の空間相関行列を制約条件付き最小2乗型同時対角化問題の対象に、ラグランジュの未定乗数法と反復法を組み合わせることによって最小2乗型同時対角化問題の近似解、即ち、混合行列を求めることができ、推定性能の向上と反復回数の低減を両立させる。
【0018】
また、本発明によれば、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって当該周波数ビンに割り当てられるパーミュテーション行列を決定し、全体の信号分離性能を向上させる。
【発明の効果】
【0019】
本発明によれば、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、これに制約条件付き最小2乗型同時対角化問題を適用する。制約条件付き最小2乗型同時対角化問題では、ラグランジュの未定乗数法と反復法を組み合わせることによって近似解、即ち、混合行列を求める。本発明に係るブラインド信号分離方法及びブラインド信号分離装置では、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底と特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求めるため、少ない反復回数で近似解に収束するという効果がある。
【0020】
また、本発明に係るブラインド信号分離方法及びブラインド信号分離装置では、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することによって雑音の影響を最小にする分離行列を推定できるという効果がある。
【0021】
更に、パーミュテーション問題の解法では、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とすることによって本発明に係るブラインド信号分離方法及びブラインド信号分離装置には、信号分離性能を高めることができるという効果がある。
【図面の簡単な説明】
【0022】
図1】 本発明に係るブラインド信号分離方法の実施の形態を示す図である。
図2】 本発明に係るブラインド信号分離方法において最小2乗型同時対角化問題の対角化行列のラグランジェ未定乗数法の適用について説明するためのフローチャートである。
図3】 本発明に係るブラインド信号分離方法において最小2乗型同時対角化問題の対角行列の解法について説明するためのフローチャートである。
図4】 本発明に係るブラインド信号分離方法のパーミュテーション問題の解法について説明するためのフローチャートである。
図5】 本発明に係る信号分離方法の実施例1における信号源(スピーカ)とマイクロホンの位置関係を表す平面図である。
図6】 本発明に係る信号分離方法の実施例1における部屋の残響時間と信号分離性能の関係を示す図である。
図7】 本発明に係る信号分離方法の実施例1におけるSNRと信号分離性能の関係を示す図である。
図8】 実施例2における従来のパーミュテーション問題の解法によるパーミュテーション行列の割り当て結果を示す図である。
図9】 実施例2における本発明に係るブラインド信号分離方法によるパーミュテーション行列の割り当て結果を示す図である。
図10】 分離行列の推定に本発明に係るブラインド信号分離方法を使用して、パーミュテーション問題の解法には非特許文献4を使用した場合と、本発明に係るブラインド信号分離方法の実施例2におけるパーミュテーション行列の割り当て正答率と信号分離性能を比較する図である。
【発明を実施するための形態】
【0023】
本発明に係るブラインド信号分離方法の実施の形態について図面を参照して説明する。
【0024】
1.畳み込み混合モデル
図1に示すように、時刻tにおいてN個の信号源11、12、…、1Nから発せられた信号源信号s(t)が畳み込み混合されてx(t)として観測される。s(t)は平均0で互いに統計的独立な非定常信号である。hij(t)は信号源1jからマイクロホン2iまでの経路の時不変なインパルス応答で、因巣的で非最小位相系である。また、n(t)はマイクロホン2iに加わる平均0、分散σのガウス性白色雑音で、s(t)と統計的独立である。時刻tにおいてJ個のマイクロホン21、22、…、2Jで観測される観測信号x(t)は式(1)で表される。ここで、J≧N≧2とする。
【0025】
【数1】
ここで、*は畳み込み演算を表す。
【0026】
観測信号x(t)を31で短時間フーリエ変換すると、フレーム時刻mにおける観測信号は式(2)により表される。式(2)において、win(t)は窓関数、Kは短時間フーリエ変換の点数、Tは2つの重複窓間のシフトサイズ、ω=2πk/K、k=0,1,…,K−1、をそれぞれ表す。離散フーリエ変換の点数Kがhij(t)のインパルス応答長より十分に大きいとき観測信号は式(3)により近似される。ここで、hij(t)のK点離散フーリエ変換をhij(ω)、s(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの信号源信号をs(ω,m)、同様に、n(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの雑音をn(ω,m)とそれぞれ表記している。また、式(3)において、x(ω,m)はフレーム時刻mに各マイクロホンでの観測信号ベクトル、s(ω,m)はフレーム時刻mに各信号源信号ベクトル、混合行列H(ω)はN個の信号源からJ個のマイクロホンまでの混合行列、n(ω,m)は雑音ベクトルでそれぞれ式(4)、(7)、(5)、(8)により定義される。入手可能なエポック時刻の総数をMとすると、1≦m≦Mとなる。信号源信号の共分散行列はP(ω,m)=E[s(ω,m)s(ω,m)]∈RN×Nで、対角行列となる。E[・]と上付き添字は期待値と複素共役転置をそれぞれ表す。また、上付き添字とRN×Nは転置とN×Nの実数空間を表す。
【0027】
【数2】
【0028】
信号を分離するには51、52、…、5Kで周波数ビン毎に式(9)を満足する分離行列W(ω)を推定し、60で信号源の割り当てを定めるパーミュテーション行列Π(ω)∈RN×Nを決定する。周波数ビン毎に独立にΠ(ω)を決定しても信号が完全に分離する保証はなく、同一信号源から発生した信号の隣接または近接周波数ビンに相関があることを利用してパーミュテーション行列Π(ω)を決定する。
【0029】
【数3】
ここで、D(ω)∈CN×Nは周波数ビン毎に異なる任意の対角行列である。
【0030】
スケーリング問題とパーミュテーション問題を順に解法した後、71、72、…、7Kでx(ω,m)に左から分離行列W(ω)を乗算すると、周波数ビンωにおける分離信号y(ω,m)は式(10)で表される。尚、スケーリング問題の解法については後述する。式(10)を80で短時間逆フーリエ変換と重複加算によって時間領域に変換すると分離信号y(t)が求められる。雑音の分散σが十分に小さいとき、y(t)≒s(t)になる。尚、分離信号ベクトルy(ω,m)は式(11)により表される。
【0031】
【数4】
【0032】
本発明に関するブラインド信号分離方法について、図1乃至図4を参照して詳細に説明する。図2乃至図4は、図1の31における短時間フーリエ変換後、ブラインド信号分離システム40において本発明により周波数ビン毎に推定される分離行列の算出手順を示したものである。図4は、分離行列の算出後、ブラインド信号分離システム40において本発明によりパーミュテーション行列の算出手順を示したものである。
【0033】
観測信号x(ω,m)の共分散行列P(ω,m)∈CJ×Jは式(12)で与えられる。式(13)の制約条件を課して式(14)を満足する対角化行列B(ω)と対角行列Λ(ω,m)を求めると、式(9)よりB(ω)とW(ω)の関係は式(15)で与えられる。ただし、CJ×JはJ×Jの複素空間を表す。
【0034】
【数5】
ただし、Iは単位行列である。
【0035】
2.最小2乗型同時対角化問題とその解法
観測信号x(ω,m)の共分散行列P(ω,m)の推定値P(ω,m)を正規化して、式(17)を最小にする対角化行列B(ω)と対角行列Λ(ω,m)を求める。式(17)は最小2乗型同時対角化問題の解法として知られている。
【数6】
【0036】
本発明では、制約条件付き最小2乗型同時対角化問題を解法することによって混合行列B(ω)を推定した後、分離行列W(ω)を求める。次いで、対角行列Λ(ω,m)を推定するために、最小2乗法を用いて分離行列W(ω)を用いた評価量を最小化する。本発明では、混合行列と対角行列の推定を交互に繰り返す。音声は低域周波数帯にフォルマントと呼ばれる振幅スペクトルのピークを有している。この音声波形の特徴を失うことなく、式(19)によって観測信号x(ω,m)の共分散行列P(ω,m)を正規化することが、本発明の特徴の一つである。
【0037】
2.1 時間周波数領域における観測信号の共分散行列の正規化
時間領域観測信号は式(18)の短時間フーリエ変換によって時間周波数領域に変換される。
【0038】
【数7】
式(17)において、w(t)は窓関数、Kは短時間フーリエ変換の点数、Tは2つの重複窓間のシフトサイズ、Tはエポックサイズ、N+1は各エポックにおける総重複フレーム数でK+N≦T、l=0,1,…,Nをそれぞれ表す。
【0039】
ステップS101においてエポック時刻mにおける時間周波数領域観測信号の共分散行列を式(19)によって推定される。
【0040】
【数8】
【0041】
混合行列B(ω)と分離行列W(ω)を縦続に接続したとき、そのインパルス応答は式(15)を最小にすることによって求められる。式(21)の評価量e(ω)をW(ω)によって微分すると、分離行列W(ω)は式(22)によって求められる。B(ωB(ω)のランクがNのときのみ、式(21)の評価量e(ω)は零になる。一方、B(ωB(ω)のランクがN未満のとき、e(ω)は零より大きくなる。そこで、制約条件‖b(ω)‖=1に制約条件rank(B(ωB(ω))=Nを付け加え、混合行列B(ω)の推定のための最小2乗型同時対角化問題を解法する。ここで、b(ω)はB(ω)のj番目の列ベクトル、‖・‖はユークリッドノルム、rank(A)は行列Aのランクをそれぞれ表す。
【0042】
【数9】
ここで、‖・‖はフロベニウスノルムを表す。
【0043】
ステップS102においてP(ω,m)を式(23)によって正規化する。
【0044】
【数10】
【0045】
2.2 対角化行列の解法
制約条件‖b(ω)‖=1を課したフォワードモデル型最小2乗型同時対角化問題を周波数ビンω毎に解くことによって、対角化行列B(ω)、即ち、混合行列を求める。
評価量を式(24)に示す。式(24)はフォワードモデル型最小2乗型同時対角化問題として知られている。
【0046】
【数11】
ここで、γはラグランジェの未定乗数を表す。
【0047】
ベクトル表現を用いると、式(24)の評価関数は式(26)のように表現することができる。ここで、r(ω,m)、G(ω)、d(ω,m)、G(ω)d(ω,m)はそれぞれ式(28)〜(31)により表される。ただし、vec{A}は行列Aの列を積み重ね
れぞれ表す。λは対角行列Aのi番目の要素を表す。
【0048】
【数12】
【0049】
反復法によって混合行列B(ω)を求めるためにz(ω)とT(ω)を式(32)、(33)によって定義され、ステップS103において作成される。
【0050】
【数13】
【0051】
ステップS104においてg(ω)を求める際、g(ω)(j≠i)を式(34)のように、z(ω)を式(34)のようにそれぞれ定数に設定して、F(ω)を計算する。ここで、g(ω)はG(ω)のj番目の列ベクトルである。
【0052】
【数14】
【0053】
式(26)の制約条件付きフォワードモデル型最小2乗型同時対角化問題を式(35)のように書き直すことができ、その近似解g(ω)はステップS105において式(36)のラグランジェの未定乗数法によって求められる。
【0054】
【数15】
ここで、unvec{A}は、J×1の列ベクトルAをJ×Jの行列に変換することを表す。
【0055】
ステップS107においてj=1,2,…,Nについて誤差の限界がεの近似解g(ω)を反復法によって推定した後、ステップS108において累乗法を1回用いて式(37)を最小にするb(ω)を算出する。次いで、ステップS109において式(38)のようにB(ω)を特異値分解する。ここで、tr[A]は行列Aのトレースを表す。
【0056】
【数16】
【0057】
ステップS110においてB(ωB(ω)のランクがN未満のとき、式(21)の評価量e(ω)を零にするために、B(ω)を式(44)の行列によって置き換える。ここで、ステップS111において正規直交基底v(ω),v(ω),…,v(ω)によって張られる空間に直交する空間の正規直交基底vr+1(ω),vr+2(ω),…,v(ω)、同様に、ステップS112において正規直交基底u(ω),u(ω),…,u(ω)によって張られる空間に直交する空間の正規直交基底ur+1(ω),ur+2(ω),…,u(ω)はそれぞれ求められる。
【0058】
【数17】
ここで、δ(ω)>0とする。ステップS113において追加される特異値δ(ω)は、式(44)の右辺の√N/(√N+δ(ω)N)によって条件tr[Σ(ω)]=√Nを満足するように設定される。
【0059】
2.3 対角行列の解法
ステップS114においてB(ω)から分離行列W(ω)を式(22)の最小2乗型一般化逆行列によって求める。式(14)、(15)よりΛ(ω,m)の左からW(ω)B(ω)、右からB(ωW(ωをそれぞれ乗算すると、式(47)を得る。
【数18】
【0060】
(ω,m)の推定値を使用して誤差Ψ(ω,m)を式(48)で定義すると、式(49)のバックワード型最小2乗型同時対角化問題に最小2乗法を適用すると、対角行列Λ(ω,m)はステップS115において式(50)で推定される。式(50)においてdiag[A]は行列Aの対角行列を表す。
【0061】
【数19】
【0062】
誤差の限界がεの近似解g(ω)と近似解Λ(ω,m)を推定するまで、上記のアルゴリズムはステップS116において繰り返される。
【0063】
3.パーミュテーション問題の解法
ステップS117において基準周波数ビンを複数選択し、基準周波数ビン間において電力比の相関に基づきパーミュテーション行列を推定するためにΞ(ω)を式(53)によりステップS118で算出する。
【0064】
【数20】
ここで、Tr(・)は行列のトレースを表す。また、Qは行列の各行に1となる要素が1箇所、その他の要素は0で、1となる要素の位置が他の行と重複しない行列の集合である。
【0065】
ステップS119において基準周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を式(54)によって推定する。
【0066】
ステップS120において複数の基準周波数ビンから1つの基準周波数ビンを任意に選択し、ステップS121において全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を式(54)によって推定する。
【0067】
ステップS122において選択された全ての基準周波数ビンが1度選択されるまで、上記のパーミュテーション行列の推定手順を繰り返す。この結果、基準周波数ビンを除き、各周波数ビンに複数のパーミュテーション行列が割り当てられることになる。
【0068】
ステップS123において多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定する。ただし、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用する。式(55)のように観測信号x(ω,m)にΠ(ω)W(ω)を左から乗算して分離信号y(ω,m)を得る。
【実施例1】
【0069】
4.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に3個の信号源(スピーカ)11、12、13を半径1.2メートルの円の円周上に、円の中心に位置する一辺が20センチメートルの正三方形の頂点に3個のマイクロホン21、22、23をそれぞれ配置した。尚、図5は信号源(スピーカ)とマイクロホンの位置関係を示す平面図である。部屋の残響時間は100ミリ秒から900ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率99%の23個のフレームの使用、窓関数にはハニング窓を用いた。SNRは5dB間隔で0〜30dBの範囲で変化させた。マイクロホン21、22、23のSNRの設定方法については4.2で説明する。本発明に係るブラインド信号分離方法では、ε=ε=10−6、δ(ω)=σ(ω)を用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。C言語で作成したプログラムをインテル製コアi7−2600 3.4GHzプロセッサを用いて実行した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω−1D(ω−1W(ω)にe−jπkを乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
【0070】
4.2 評価指標
ブラインド信号分離方法の信号分離性能を次の方法で評価した.式(56)によって観測信号における所望信号源信号と干渉信号の電力の比、式(57)によって出力信号における所望信号源信号と干渉信号の電力の比をそれぞれ計算し、ブラインド信号分離装置の各出力の信号分離性能を求める。各出力の平均を信号分離性能とした。γij(t)は式(58)のΓ(ω)のi行j列の要素を、wij(t)はW(ω)の要素をそれぞれ離散逆フーリエ変換したものである。また、分離行列の推定アルゴリズムにおいて収束に要した反復回数と計算時間も評価指標とする。SNRは、最適な分離行列e−jπkD(ω−1(H(ωH(ω))−1H(ωとパーミュテーション行列Πopt(ω)を使用して観測信号から信号源信号を分離した後、分離信号y(t)に含まれる雑音と干渉信号の電力と所望信号源信号の電力の比によって計算した。最適なパーミュテーション行列Πopt(ω)は式(59)によって求めた。また、非ブラインド法は、受信信号を使用して分離行列を計算した後、混合行列が入手可能であるとして、式(60)によってパーミュテーション行列を求めた。即ち、推定した分離行列に最適なパーミュテーション行列を求めることになり、ブラインド信号分離装置の性能の上限を与えることになる。
【0071】
【数22】
ここで、Copt(ω)=e−jπkD(ω−1(H(ωH(ω))−1H(ωH(ω)、C(ω)=W(ω)H(ω)である。
【0072】
4.3 評価対象
勾配法を用いたバックワードモデル型ブラインド信号分離方法(非特許文献1)、最小2乗型同時対角化問題の解法を用いた2種類のフォワードモデル型ブラインド信号分離方法(非特許文献2、非特許文献3)を比較対象とする。従来のブラインド信号分離方法(非特許文献1、非特許文献2、非特許文献3)と本発明に係るブラインド信号分離方法における分離行列の推定精度を比較するため、パーミュテーション行列の推定法は共通の手法(非特許文献4)を使用した。尚、基準周波数ビンの番号には614を用いた。
【0076】
4.4 評価結果
部屋の残響時間と信号分離性能の関係を図6に、SNRと信号分離性能の関係を図7にそれぞれ示す。尚、図6においてSNRは20dBに設定している。両図において太字の数字が最も優れた性能を表している。両図の信号分離性能から明らかなように、計算時間では非特許文献1より劣るものの、本発明に係るブラインド信号分離方法が従来のブラインド信号分離方法よりも最も高い信号分離性能(高い出力SIR)を最も少ない反復回数で得ることができた。この要因はラグランジェの未定乗数法を最小2乗型同時対角化問題に導入したこと、推定した混合行列がランク落ちしていた場合、補空間を補い分離行列を推定したことが高い信号分離性能の実現に貢献したと考えられる。また、非ブラインド法の出力SIR、即ち、ブラインド信号分離装置の上限に近い値を、本発明に係るブラインド信号分離装置が実現できることが分かる。
【実施例2】
【0077】
5.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に3個の信号源(スピーカ)11、12、13を半径1.2メートルの円の円周上に、円の中心に位置する一辺が20センチメートルの正三方形の頂点に3個のマイクロホン21、22、23をそれぞれ配置した。部屋の残響時間は700ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率80%の2個のフレームの使用、窓関数にはハニング窓を用いた。SNRは20dBに設定した。本発明に係るブラインド信号分離方法では、ε=ε=10−6、δ(ω)=σ(ω)、基準周波数ビンの番号は616、617、618を用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω−1D(ω−1W(ω)にe−jπk乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
【0078】
5.2 評価指標
信号源とマイクロホンの個数が共に3である場合、式(61)に示す6種類のパーミュテーション行列の何れか1つが各周波数ビンに割り当てられる。割り当てられたパーミュテーション行列が、任意のパーミュテーション行列に一致する割合と信号分離性能を計算する。
【0079】
【数23】
【0080】
5.3 評価対象
同一信号源から発生した信号の周波数ビン間の電力比に相関があることを利用したパーミュテーション問題の解法(非特許文献4)を比較対象とする。基準周波数ビンの番号には614を用いた。従来のブラインド信号分離方法(非特許文献1、非特許文献2、非特許文献3)と本発明に係るブラインド信号分離方法におけるパーミュテーション行列の推定精度を比較するため、分離行列の推定法は共通の手法(本発明に係る分離行列推定法)を使用した。
【0081】
5.4 評価結果
図8図9に各周波数ビンに割り当てられたパーミュテーション行列の番号を×印で示す。パーミュテーション行列Πとパーミュテーション行列の番号iの関係を式(61)に示している。図8図9では、各周波数ビンでパーミュテーション行列の番号3に割り当てられると未知信号源への割り当てが揃うことになる。したがって、番号3を除く他の番号への割り当ては間違いになる。低周波数帯域(0〜2kHz)と全周波数帯域におけるパーミュテーション行列の割り当て結果を図10にまとめる。本発明に係るパーミュテーション行列の推定法が非特許文献4の方法に比べ正答率が向上していることが分かる。また、信号分離性能においても、本発明に係るパーミュテーション行列の推定法が高い出力SIRを達成することができた。
【符号の説明】
【0082】
11〜1N…信号源、21〜2J…マイクロホン、31…短時間フーリエ変換、40…ブラインド信号分離システム、51、52、…、5K…最小2乗型同時対角化問題の解法、60…パーミュテーション問題の解法、71、72、…、7K…畳み込み演算、80…離散逆フーリエ変換と重複加算
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10