【文献】
齋藤晋哉 他,"逆行列の補題を用いた適応ALSアルゴリズムにおけるブラインド音源分離",電子情報通信学会技術研究報告,2007年 2月27日,Vol.106,No.570,pp.63-67
【文献】
SAITO, Shinya et al.,"AN APPROACH TO CONVOLUTIVE BACKWARD-MODEL BLIND SOURCE SEPARATION BASED ON JOINT DIAGONALIZATION",Proc. of EUSIPCO2012,2012年 8月27日,pp.579-583
(58)【調査した分野】(Int.Cl.,DB名)
未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみからブラインドで推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、正規化された空間相関行列から混合行列を推定するために、制約条件付きフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法と反復法の組み合わせにより解法する手順と、手順の収束後、累乗法を1回用いて最小2乗型同時対角化問題の解となる混合行列を求め、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底を補い、次いで、ランク落ちした混合行列の特異値とその総和が変わらないように特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求め、同一信号源から発生した信号の周波数ビンの電力比に相関があることを利用してパーミュテーション問題を、多数決を利用して解法することによって信号分離精度の高い分離行列を求めることを特徴とするブラインド信号分離方法。
請求項1記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することを特徴とするブラインド信号分離方法。
請求項1乃至請求項2のいずれか1項に記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を、全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とするブラインド信号分離方法。
請求項1乃至請求項3のいずれか1項に記載のブラインド信号分離方法を用いて信号源分離を行うように構成されていることを特徴とするブラインド信号分離方法を用いたブラインド信号分離装置。
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来のブラインド信号分離方法で使用されている勾配法は演算量が少ないが、収束が遅く、実環境下で十分な信号分離精度を得ることができない。
【0008】
従来のブラインド信号分離方法では、時間周波数領域で周波数ビンとエポック毎、即ち、ポイント毎に観測信号の空間相関行列をそのフロベニウスノルムで正規化しているため、未知信号源信号が音声の場合、音声の特徴を表す周波数特性が失われ、周波数ビンに対して振幅特性が一定になり、信号分離精度が劣化する。
【0009】
従来のブラインド信号分離方法では、時間周波数領域で観測信号の空間相関行列から最小2乗型同時対角化問題の解法を用いて混合行列を推定し、次いで最小2乗型一般化逆行列を用いて混合行列から分離行列を推定しているため、最小2乗型同時対角化問題に分離行列の推定が含まれず、仮に混合行列を精度良く推定できても分離行列が精度良く推定できるとは限らず、信号分離精度が劣化する場合がある。
【0010】
従来のブラインド信号分離方法では、時間周波数領域で観測信号の空間相関行列から制約条件を課すことなく最小2乗型同時対角化問題の解法を用いて混合行列を推定し、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定する前に、塁乗法により制約条件を課しているので、手順が収束に要する反復回数は大幅に増加する。
【0011】
更に、従来のブラインド信号分離方法において混合行列の最小2乗型一般化逆行列を単に分離行列として取り扱うと、加法性雑音が存在する場合、雑音の影響が大きくなって信号分離性能の劣化につながる。
【0012】
同一信号源から発生した信号の隣接周波数ビンに相関があることを利用した従来のパーミュテーション問題の解法では、1度誤りが生じると、これ以降の解法が誤り続ける確率が非常に高くなる。
【0013】
本発明はこのような事情を鑑みてなされたものであり、信号源とブラインド信号分離装置出力間を表した混合行列と分離行列の縦続接続モデルを最小2乗型同時対角化問題に取り込み、更にモデルに因果性を与えることによって信号分離性能の向上と反復手順の収束高速化の両立、更に、同一信号源から発生した信号の周波数ビン間の電力比相関性と多数決を組み合わせによってパーミュテーション問題を正確に解法することを目的とする。
【課題を解決するための手段】
【0014】
このような目的に応えるために本発明(請求項1記載の発明)に係るブラインド信号分離方法は、未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみからブラインドで推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、正規化された空間相関行列から混合行列を推定するために、制約条件付きフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法と反復法の組み合わせにより解法する手順と、手順の収束後、累乗法を1回用いて最小2乗型同時対角化問題の解となる混合行列を求め、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底を補い、次いで、ランク落ちした混合行列の特異値とその総和が変わらないように特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求め、同一信号源から発生した信号の周波数ビンに相関があることを利用してパーミュテーション問題を、多数決を利用して解法することによって信号分離精度の高い分離行列を求めることを特徴とする。
【0015】
本発明(請求項2記載の発明)に係るブラインド信号分離方法は、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することを特徴とする。
【0016】
本発明(請求項3記載の発明)に係るブラインド信号分離方法は、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を、全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とする。
【0017】
すなわち、本発明によれば、観測信号の空間相関行列を制約条件付き最小2乗型同時対角化問題の対象に、ラグランジュの未定乗数法と反復法を組み合わせることによって最小2乗型同時対角化問題の近似解、即ち、混合行列を求めることができ、推定性能の向上と反復回数の低減を両立させる。
【0018】
また、本発明によれば、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって当該周波数ビンに割り当てられるパーミュテーション行列を決定し、全体の信号分離性能を向上させる。
【発明の効果】
【0019】
本発明によれば、時間周波数領域においてエポック時刻毎に観測信号ベクトルから空間相関行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる空間相関行列を求め、そのノルムで全ての同エポック時刻の空間相関行列を正規化した後、これに制約条件付き最小2乗型同時対角化問題を適用する。制約条件付き最小2乗型同時対角化問題では、ラグランジュの未定乗数法と反復法を組み合わせることによって近似解、即ち、混合行列を求める。本発明に係るブラインド信号分離方法及びブラインド信号分離装置では、混合行列のランクが落ちていた場合は、混合行列がフルランクになるように特異値分解を用いて基底と特異値を補い、最小2乗型一般化逆行列を用いて混合行列から分離行列を推定し、バックワード型最小2乗型同時対角化問題を最小2乗法で解いて対角行列を求めるため、少ない反復回数で近似解に収束するという効果がある。
【0020】
また、本発明に係るブラインド信号分離方法及びブラインド信号分離装置では、信号源とブラインド信号分離装置出力間の伝達関数を表した混合行列と分離行列の縦続接続モデルにラグランジュの未定乗数を導入した制約条件付きフォワードモデル型最小2乗型同時対角化問題とバックワード型最小2乗型同時対角化問題を導入し、更に分離行列に遅延を与えることによって信号源とブラインド信号分離装置出力間の因果的なモデルを推定することによって雑音の影響を最小にする分離行列を推定できるという効果がある。
【0021】
更に、パーミュテーション問題の解法では、基準周波数ビンを複数選択し、基準周波数ビン間において最も電力比の相関が大きいパーミュテーション行列を推定し、複数の基準周波数ビンから基準周波数ビンを1つ選択し、全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を推定する手順を全ての基準周波数ビンが1度選択されるまで繰り返した後、各周波数ビンに複数割り当てられたパーミュテーション行列から多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定し、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用することを特徴とすることによって本発明に係るブラインド信号分離方法及びブラインド信号分離装置には、信号分離性能を高めることができるという効果がある。
【発明を実施するための形態】
【0023】
本発明に係るブラインド信号分離方法の実施の形態について図面を参照して説明する。
【0024】
1.畳み込み混合モデル
図1に示すように、時刻tにおいてN個の信号源11、12、…、1Nから発せられた信号源信号s
j(t)が畳み込み混合されてx
i(t)として観測される。s
j(t)は平均0で互いに統計的独立な非定常信号である。h
ij(t)は信号源1jからマイクロホン2iまでの経路の時不変なインパルス応答で、因巣的で非最小位相系である。また、n
i(t)はマイクロホン2iに加わる平均0、分散σ
2のガウス性白色雑音で、s
j(t)と統計的独立である。時刻tにおいてJ個のマイクロホン21、22、…、2Jで観測される観測信号x
i(t)は式(1)で表される。ここで、J≧N≧2とする。
【0025】
【数1】
ここで、*は畳み込み演算を表す。
【0026】
観測信号x
i(t)を31で短時間フーリエ変換すると、フレーム時刻mにおける観測信号は式(2)により表される。式(2)において、win(t)は窓関数、Kは短時間フーリエ変換の点数、T
bは2つの重複窓間のシフトサイズ、ω
k=2πk/K、k=0,1,…,K−1、をそれぞれ表す。離散フーリエ変換の点数Kがh
ij(t)のインパルス応答長より十分に大きいとき観測信号は式(3)により近似される。ここで、h
ij(t)のK点離散フーリエ変換をh
ij(ω
k)、s
j(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの信号源信号をs
j(ω
k,m)、同様に、n
i(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの雑音をn
i(ω
k,m)とそれぞれ表記している。また、式(3)において、x(ω
k,m)はフレーム時刻mに各マイクロホンでの観測信号ベクトル、s(ω
k,m)はフレーム時刻mに各信号源信号ベクトル、混合行列H(ω
k)はN個の信号源からJ個のマイクロホンまでの混合行列、n(ω
k,m)は雑音ベクトルでそれぞれ式(4)、(7)、(5)、(8)により定義される。入手可能なエポック時刻の総数をMとすると、1≦m≦Mとなる。信号源信号の共分散行列はP
s(ω
k,m)=E[s(ω
k,m)s(ω
k,m)
H]∈R
N×Nで、対角行列となる。E[・]と上付き添字
Hは期待値と複素共役転置をそれぞれ表す。また、上付き添字
TとR
N×Nは転置とN×Nの実数空間を表す。
【0028】
信号を分離するには51、52、…、5Kで周波数ビン毎に式(9)を満足する分離行列W(ω
k)を推定し、60で信号源の割り当てを定めるパーミュテーション行列Π(ω
k)∈R
N×Nを決定する。周波数ビン毎に独立にΠ(ω
k)を決定しても信号が完全に分離する保証はなく、同一信号源から発生した信号の隣接または近接周波数ビンに相関があることを利用してパーミュテーション行列Π(ω
k)を決定する。
【0029】
【数3】
ここで、D(ω
k)∈C
N×Nは周波数ビン毎に異なる任意の対角行列である。
【0030】
スケーリング問題とパーミュテーション問題を順に解法した後、71、72、…、7Kでx(ω
k,m)に左から分離行列W(ω
k)を乗算すると、周波数ビンω
kにおける分離信号y(ω
k,m)は式(10)で表される。尚、スケーリング問題の解法については後述する。式(10)を80で短時間逆フーリエ変換と重複加算によって時間領域に変換すると分離信号y
i(t)が求められる。雑音の分散σ
2が十分に小さいとき、y
i(t)≒s
i(t)になる。尚、分離信号ベクトルy(ω
k,m)は式(11)により表される。
【0032】
本発明に関するブラインド信号分離方法について、
図1乃至
図4を参照して詳細に説明する。
図2乃至
図4は、
図1の31における短時間フーリエ変換後、ブラインド信号分離システム40において本発明により周波数ビン毎に推定される分離行列の算出手順を示したものである。
図4は、分離行列の算出後、ブラインド信号分離システム40において本発明によりパーミュテーション行列の算出手順を示したものである。
【0033】
観測信号x(ω
k,m)の共分散行列P
x(ω
k,m)∈C
J×Jは式(12)で与えられる。式(13)の制約条件を課して式(14)を満足する対角化行列B(ω
k)と対角行列Λ(ω
k,m)を求めると、式(9)よりB(ω
k)とW(ω
k)の関係は式(15)で与えられる。ただし、C
J×JはJ×Jの複素空間を表す。
【0034】
【数5】
ただし、Iは単位行列である。
【0035】
2.最小2乗型同時対角化問題とその解法
観測信号x(ω
k,m)の共分散行列P
x(ω
k,m)の推定値P
x(ω
k,m)を正規化して、式(17)を最小にする対角化行列B(ω
k)と対角行列Λ(ω
k,m)を求める。式(17)は最小2乗型同時対角化問題の解法として知られている。
【数6】
【0036】
本発明では、制約条件付き最小2乗型同時対角化問題を解法することによって混合行列B(ω
k)を推定した後、分離行列W(ω
k)を求める。次いで、対角行列Λ(ω
k,m)を推定するために、最小2乗法を用いて分離行列W(ω
k)を用いた評価量を最小化する。本発明では、混合行列と対角行列の推定を交互に繰り返す。音声は低域周波数帯にフォルマントと呼ばれる振幅スペクトルのピークを有している。この音声波形の特徴を失うことなく、式(19)によって観測信号x(ω
k,m)の共分散行列P
x(ω
k,m)を正規化することが、本発明の特徴の一つである。
【0037】
2.1 時間周波数領域における観測信号の共分散行列の正規化
時間領域観測信号は式(18)の短時間フーリエ変換によって時間周波数領域に変換される。
【0038】
【数7】
式(17)において、w(t)は窓関数、Kは短時間フーリエ変換の点数、T
sは2つの重複窓間のシフトサイズ、T
sはエポックサイズ、N
s+1は各エポックにおける総重複フレーム数でK+N
sT
s≦T
b、l=0,1,…,N
sをそれぞれ表す。
【0039】
ステップS101においてエポック時刻mにおける時間周波数領域観測信号の共分散行列を式(19)によって推定される。
【0041】
混合行列B(ω
k)と分離行列W(ω
k)を縦続に接続したとき、そのインパルス応答は式(15)を最小にすることによって求められる。式(21)の評価量e(ω
k)をW(ω
k)によって微分すると、分離行列W(ω
k)は式(22)によって求められる。B(ω
k)
HB(ω
k)のランクがNのときのみ、式(21)の評価量e(ω
k)は零になる。一方、B(ω
k)
HB(ω
k)のランクがN未満のとき、e(ω
k)は零より大きくなる。そこで、制約条件‖b
j(ω
k)‖
2=1に制約条件rank(B(ω
k)
HB(ω
k))=Nを付け加え、混合行列B(ω
k)の推定のための最小2乗型同時対角化問題を解法する。ここで、b
j(ω
k)はB(ω
k)のj番目の列ベクトル、‖・‖
2はユークリッドノルム、rank(A)は行列Aのランクをそれぞれ表す。
【0042】
【数9】
ここで、‖・‖
Fはフロベニウスノルムを表す。
【0043】
ステップS102においてP
x(ω
k,m)を式(23)によって正規化する。
【0045】
2.2 対角化行列の解法
制約条件‖b
j(ω
k)‖
2=1を課したフォワードモデル型最小2乗型同時対角化問題を周波数ビンω
k毎に解くことによって、対角化行列B(ω
k)、即ち、混合行列を求める。
評価量を式(24)に示す。式(24)はフォワードモデル型最小2乗型同時対角化問題として知られている。
【0046】
【数11】
ここで、γ
iはラグランジェの未定乗数を表す。
【0047】
ベクトル表現を用いると、式(24)の評価関数は式(26)のように表現することができる。ここで、r
x(ω
k,m)、G(ω
k)、d(ω
k,m)、G(ω
k)d(ω
k,m)はそれぞれ式(28)〜(31)により表される。ただし、vec{A}は行列Aの列を積み重ね
れぞれ表す。λ
iは対角行列Aのi番目の要素を表す。
【0049】
反復法によって混合行列B(ω
k)を求めるためにz
i(ω
k)とT(ω
k)を式(32)、(33)によって定義され、ステップS103において作成される。
【0051】
ステップS104においてg
j(ω
k)を求める際、g
j(ω
k)(j≠i)を式(34)のように、z
j(ω
k)を式(34)のようにそれぞれ定数に設定して、F
j(ω
k)を計算する。ここで、g
j(ω
k)はG(ω
k)のj番目の列ベクトルである。
【0053】
式(26)の制約条件付きフォワードモデル型最小2乗型同時対角化問題を式(35)のように書き直すことができ、その近似解g
j(ω
k)はステップS105において式(36)のラグランジェの未定乗数法によって求められる。
【0054】
【数15】
ここで、unvec{A}は、J
2×1の列ベクトルAをJ×Jの行列に変換することを表す。
【0055】
ステップS107においてj=1,2,…,Nについて誤差の限界がε
Gの近似解g
j(ω
k)を反復法によって推定した後、ステップS108において累乗法を1回用いて式(37)を最小にするb
j(ω
k)を算出する。次いで、ステップS109において式(38)のようにB(ω
k)を特異値分解する。ここで、tr[A]は行列Aのトレースを表す。
【0057】
ステップS110においてB(ω
k)
HB(ω
k)のランクがN未満のとき、式(21)の評価量e(ω
k)を零にするために、B(ω
k)を式(44)の行列によって置き換える。ここで、ステップS111において正規直交基底v
1(ω
k),v
2(ω
k),…,v
r(ω
k)によって張られる空間に直交する空間の正規直交基底v
r+1(ω
k),v
r+2(ω
k),…,v
N(ω
k)、同様に、ステップS112において正規直交基底u
1(ω
k),u
2(ω
k),…,u
r(ω
k)によって張られる空間に直交する空間の正規直交基底u
r+1(ω
k),u
r+2(ω
k),…,u
N(ω
k)はそれぞれ求められる。
【0058】
【数17】
ここで、δ(ω
k)>0とする。ステップS113において追加される特異値δ(ω
k)は、式(44)の右辺の√N/(√N+δ(ω
k)N)によって条件tr[Σ(ω
k)]=√Nを満足するように設定される。
【0059】
2.3 対角行列の解法
ステップS114においてB(ω
k)から分離行列W(ω
k)を式(22)の最小2乗型一般化逆行列によって求める。式(14)、(15)よりΛ(ω
k,m)の左からW(ω
k)B(ω
k)、右からB(ω
k)
HW(ω
k)
Hをそれぞれ乗算すると、式(47)を得る。
【数18】
【0060】
P
x(ω
k,m)の推定値を使用して誤差Ψ(ω
k,m)を式(48)で定義すると、式(49)のバックワード型最小2乗型同時対角化問題に最小2乗法を適用すると、対角行列Λ(ω
k,m)はステップS115において式(50)で推定される。式(50)においてdiag[A]は行列Aの対角行列を表す。
【0062】
誤差の限界がε
Cの近似解g
j(ω
k)と近似解Λ(ω
k,m)を推定するまで、上記のアルゴリズムはステップS116において繰り返される。
【0063】
3.パーミュテーション問題の解法
ステップS117において基準周波数ビンを複数選択し、基準周波数ビン間において電力比の相関に基づきパーミュテーション行列を推定するためにΞ(ω
k)を式(53)によりステップS118で算出する。
【0064】
【数20】
ここで、Tr(・)は行列のトレースを表す。また、Qは行列の各行に1となる要素が1箇所、その他の要素は0で、1となる要素の位置が他の行と重複しない行列の集合である。
【0065】
ステップS119において基準周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を式(54)によって推定する。
【0066】
ステップS120において複数の基準周波数ビンから1つの基準周波数ビンを任意に選択し、ステップS121において全ての周波数ビン間で電力比の相関が最も大きいパーミュテーション行列を式(54)によって推定する。
【0067】
ステップS122において選択された全ての基準周波数ビンが1度選択されるまで、上記のパーミュテーション行列の推定手順を繰り返す。この結果、基準周波数ビンを除き、各周波数ビンに複数のパーミュテーション行列が割り当てられることになる。
【0068】
ステップS123において多数決によって周波数ビンに割り当てられるパーミュテーション行列を決定する。ただし、多数決によってパーミュテーション行列が決定できない場合には、最も相関値が大きいパーミュテーション行列を採用する。式(55)のように観測信号x(ω
k,m)にΠ(ω
k)W(ω
k)を左から乗算して分離信号y(ω
k,m)を得る。
【実施例1】
【0069】
4.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に3個の信号源(スピーカ)11、12、13を半径1.2メートルの円の円周上に、円の中心に位置する一辺が20センチメートルの正三方形の頂点に3個のマイクロホン21、22、23をそれぞれ配置した。尚、
図5は信号源(スピーカ)とマイクロホンの位置関係を示す平面図である。部屋の残響時間は100ミリ秒から900ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率99%の23個のフレームの使用、窓関数にはハニング窓を用いた。SNRは5dB間隔で0〜30dBの範囲で変化させた。マイクロホン21、22、23のSNRの設定方法については4.2で説明する。本発明に係るブラインド信号分離方法では、ε
G=ε
C=10
−6、δ(ω
k)=σ
r(ω
k)を用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。C言語で作成したプログラムをインテル製コアi7−2600 3.4GHzプロセッサを用いて実行した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω
k)
−1D(ω
k)
−1W(ω
k)にe
−jπkを乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
【0070】
4.2 評価指標
ブラインド信号分離方法の信号分離性能を次の方法で評価した.式(56)によって観測信号における所望信号源信号と干渉信号の電力の比、式(57)によって出力信号における所望信号源信号と干渉信号の電力の比をそれぞれ計算し、ブラインド信号分離装置の各出力の信号分離性能を求める。各出力の平均を信号分離性能とした。γ
ij(t)は式(58)のΓ(ω
k)のi行j列の要素を、w
ij(t)はW(ω
k)の要素をそれぞれ離散逆フーリエ変換したものである。また、分離行列の推定アルゴリズムにおいて収束に要した反復回数と計算時間も評価指標とする。SNRは、最適な分離行列e
−jπkD(ω
k)
−1(H(ω
k)
HH(ω
k))
−1H(ω
k)
Hとパーミュテーション行列Π
opt(ω
k)を使用して観測信号から信号源信号を分離した後、分離信号y
i(t)に含まれる雑音と干渉信号の電力と所望信号源信号の電力の比によって計算した。最適なパーミュテーション行列Π
opt(ω
k)は式(59)によって求めた。また、非ブラインド法は、受信信号を使用して分離行列を計算した後、混合行列が入手可能であるとして、式(60)によってパーミュテーション行列を求めた。即ち、推定した分離行列に最適なパーミュテーション行列を求めることになり、ブラインド信号分離装置の性能の上限を与えることになる。
【0071】
【数22】
ここで、C
opt(ω
k)=e
−jπkD(ω
k)
−1(H(ω
k)
HH(ω
k))
−1H(ω
k)
HH(ω
k)、C(ω
k)=W(ω
k)H(ω
k)である。
【0072】
4.3 評価対象
勾配法を用いたバックワードモデル型ブラインド信号分離方法(非特許文献1)、最小2乗型同時対角化問題の解法を用いた2種類のフォワードモデル型ブラインド信号分離方法(非特許文献2、非特許文献3)を比較対象とする。従来のブラインド信号分離方法(非特許文献1、非特許文献2、非特許文献3)と本発明に係るブラインド信号分離方法における分離行列の推定精度を比較するため、パーミュテーション行列の推定法は共通の手法(非特許文献4)を使用した。尚、基準周波数ビンの番号には614を用いた。
【0076】
4.4 評価結果
部屋の残響時間と信号分離性能の関係を
図6に、SNRと信号分離性能の関係を
図7にそれぞれ示す。尚、
図6においてSNRは20dBに設定している。両図において太字の数字が最も優れた性能を表している。両図の信号分離性能から明らかなように、計算時間では非特許文献1より劣るものの、本発明に係るブラインド信号分離方法が従来のブラインド信号分離方法よりも最も高い信号分離性能(高い出力SIR)を最も少ない反復回数で得ることができた。この要因はラグランジェの未定乗数法を最小2乗型同時対角化問題に導入したこと、推定した混合行列がランク落ちしていた場合、補空間を補い分離行列を推定したことが高い信号分離性能の実現に貢献したと考えられる。また、非ブラインド法の出力SIR、即ち、ブラインド信号分離装置の上限に近い値を、本発明に係るブラインド信号分離装置が実現できることが分かる。
【実施例2】
【0077】
5.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に3個の信号源(スピーカ)11、12、13を半径1.2メートルの円の円周上に、円の中心に位置する一辺が20センチメートルの正三方形の頂点に3個のマイクロホン21、22、23をそれぞれ配置した。部屋の残響時間は700ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率80%の2個のフレームの使用、窓関数にはハニング窓を用いた。SNRは20dBに設定した。本発明に係るブラインド信号分離方法では、ε
G=ε
C=10
−6、δ(ω
k)=σ
r(ω
k)、基準周波数ビンの番号は616、617、618を用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω
k)
−1D(ω
k)
−1W(ω
k)にe
−jπk乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
【0078】
5.2 評価指標
信号源とマイクロホンの個数が共に3である場合、式(61)に示す6種類のパーミュテーション行列の何れか1つが各周波数ビンに割り当てられる。割り当てられたパーミュテーション行列が、任意のパーミュテーション行列に一致する割合と信号分離性能を計算する。
【0079】
【数23】
【0080】
5.3 評価対象
同一信号源から発生した信号の周波数ビン間の電力比に相関があることを利用したパーミュテーション問題の解法(非特許文献4)を比較対象とする。基準周波数ビンの番号には614を用いた。従来のブラインド信号分離方法(非特許文献1、非特許文献2、非特許文献3)と本発明に係るブラインド信号分離方法におけるパーミュテーション行列の推定精度を比較するため、分離行列の推定法は共通の手法(本発明に係る分離行列推定法)を使用した。
【0081】
5.4 評価結果
図8と
図9に各周波数ビンに割り当てられたパーミュテーション行列の番号を×印で示す。パーミュテーション行列Π
iとパーミュテーション行列の番号iの関係を式(61)に示している。
図8と
図9では、各周波数ビンでパーミュテーション行列の番号3に割り当てられると未知信号源への割り当てが揃うことになる。したがって、番号3を除く他の番号への割り当ては間違いになる。低周波数帯域(0〜2kHz)と全周波数帯域におけるパーミュテーション行列の割り当て結果を
図10にまとめる。本発明に係るパーミュテーション行列の推定法が非特許文献4の方法に比べ正答率が向上していることが分かる。また、信号分離性能においても、本発明に係るパーミュテーション行列の推定法が高い出力SIRを達成することができた。