特開2024-160451 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 公立大学法人首都大学東京の特許一覧

特開2024-160451音源信号推定装置、音源信号推定方法、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024160451

(43)【公開日】2024-11-14

(54)【発明の名称】音源信号推定装置、音源信号推定方法、プログラム

(51)【国際特許分類】

G10L 21/028 20130101AFI20241107BHJP

【ＦＩ】

G10L21/028 B

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2023075445

(22)【出願日】2023-05-01

【新規性喪失の例外の表示】特許法第３０条第２項適用申請有りウェブサイト掲載日：２０２３年３月１日（予稿日）（発表日２０２３年３月１７日）ウェブサイトのアドレス：一般社団法人日本音響学会日本音響学会第１４９回（２０２３年春季）研究発表会ｈｔｔｐｓ：／／ａｃｏｕｓｔｉｃｓ．ｊｐ／ａｎｎｕａｌｍｅｅｔｉｎｇ／

(71)【出願人】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(71)【出願人】

【識別番号】305027401

【氏名又は名称】東京都公立大学法人

(74)【代理人】

【識別番号】100121706

【弁理士】

【氏名又は名称】中尾直樹

(74)【代理人】

【識別番号】100128705

【弁理士】

【氏名又は名称】中村幸雄

(74)【代理人】

【識別番号】100147773

【弁理士】

【氏名又は名称】義村宗洋

(72)【発明者】

【氏名】池下林太郎

(72)【発明者】

【氏名】荒木章子

(72)【発明者】

【氏名】中谷智広

(72)【発明者】

【氏名】中嶋大志

(72)【発明者】

【氏名】小野順貴

(57)【要約】

【課題】マイクロホンの数が多くても高速に動作する音源追跡技術を提供する。
【解決手段】分離行列W(f, t-1)を用いて、観測信号x(f, t)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t)を計算する第１計算部と、近似分離信号^y(f, t)を用いて、値r_k(t)を更新する第２計算部と、近似分離信号^y(f, t)と値r_k(t)を用いて、k=λに対しては重みG_λ(f, t)を更新し、k≠λに対しては重みG_k(f, t)と重みg_k(f, t)を更新する第３計算部と、重みG_k(f, t)と重みg_k(f, t)を用いて、分離行列W(f, t)と分離信号y(f, t)を更新する第４計算部とを含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、
K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、
分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、
時間フレームtをt<-T’+1により初期化する初期化部と、
分離行列W(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算部と、
近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算部と、
近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算部と、
重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算部と、
時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定部と、
を含む音源信号推定装置。

【請求項2】

請求項１に記載の音源信号推定装置であって、
前記第１計算部は、次式により、近似分離信号^y(f, t) (f=1, …, F)を計算するものであり、

【数40】

前記第２計算部は、次式により、値r_k(t) (k=1, …, K)を更新するものであり、

【数41】

αを0<α≦1を満たす定数、φ(r)をφ(r)=ψ’(r)/2r（ただし、ψ(r)は0以上の実数の集合R_≧0から実数の集合Rへの微分可能な関数であり、ψ’はψの微分を表す）により定義される音源の特性を表す関数とし、
前記第３計算部は、次式により、重みG_k(f, t) (k=1, …, K, f=1, …, F), g_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を更新するものであり、

【数42】

【数43】

前記第４計算部は、次式により、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新するものである

【数44】

【数45】

ことを特徴とする音源信号推定装置。

【請求項3】

x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、
K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、
分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、
時間フレームtをt<-T’+1により初期化する初期化部と、
W(f, t-1)=~Q(f, t-1)W(f, T’)を満たす補助分離行列~Q(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算部と、
近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算部と、
近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算部と、
重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算部と、
時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定部と、
を含む音源信号推定装置。

【請求項4】

請求項３に記載の音源信号推定装置であって、
前記第１計算部は、次式により、近似分離信号^y(f, t) (f=1, …, F)を計算するものであり、

【数46】

前記第２計算部は、次式により、値r_k(t) (k=1, …, K)を更新するものであり、

【数47】

【数48】

【数49】

前記第４計算部は、次式により、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新するものである

【数50】

【数51】

（ただし、e_kは第k要素が1、それ以外の要素は0である単位ベクトル）

【数52】

（ただし、~Q(f, T’)は単位行列）

【数53】

ことを特徴とする音源信号推定装置。

【請求項5】

x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、
K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、
分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、
音源信号推定装置が、時間フレームtをt<-T’+1により初期化する初期化ステップと、
前記音源信号推定装置が、分離行列W(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算ステップと、
前記音源信号推定装置が、近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算ステップと、
前記音源信号推定装置が、近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算ステップと、
前記音源信号推定装置が、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算ステップと、
前記音源信号推定装置が、時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定ステップと、
を含む音源信号推定方法。

【請求項6】

x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、
K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、
分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、
音源信号推定装置が、時間フレームtをt<-T’+1により初期化する初期化ステップと、
前記音源信号推定装置が、W(f, t-1)=~Q(f, t-1)W(f, T’)を満たす補助分離行列~Q(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算ステップと、
前記音源信号推定装置が、近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算ステップと、
前記音源信号推定装置が、近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算ステップと、
前記音源信号推定装置が、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算ステップと、
前記音源信号推定装置が、時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定ステップと、
を含む音源信号推定方法。

【請求項7】

請求項１ないし４のいずれか１項に記載の音源信号推定装置としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、複数のマイクロホンを用いて観測された混合音響信号に含まれる混合前の音源からの信号を逐次的に分離するオンライン音源分離技術に関する。

【背景技術】

【0002】

補聴器に内蔵されているマイクロホンにより集音された信号には、複数の音声信号や音響信号が混入する。補聴器の利用者が複数の音声信号や音響信号を高精度かつリアルタイムに聞き分けることができるようにするために、オンライン音源分離技術が盛んに研究されている。オンライン音源分離技術とは、複数のマイクロホンを用いて観測された混合音響信号（以下、単に観測信号という）から混合前の音源からの信号（以下、音源信号という）を逐次的に分離する技術のことである。

【0003】

以下、オンライン音源分離を短時間フーリエ変換領域における問題として定式化し説明する。

【0004】

K個（Kは2以上の整数）のマイクロホンを用いてK個の音源からの信号が観測されている状況を考える。ただし、K個の音源は移動してもよいものとする。fを周波数ビンを表すインデックス、tを時間フレームを表すインデックスとして、短時間フーリエ変換領域における観測信号x(f, t)(f=1, …, F, t=1, …,T)は以下のように表される。

【数1】

【数2】

【数3】

ここで、Cは複素数の集合を表し、s_k(f, t)∈C (k=1, …, K)は第k音源からの信号（以下、第k音源信号という）、a_k(f, t)∈C^K (k=1, …, K)は第k音源のステアリングベクトルである。また、式(2)のTは転置を表す。

【0005】

y_k(f, t)を第k音源信号s_k(f, t)の推定信号（以下、第k分離信号という）、y(f, t)を式(4)で定義されるベクトル（以下、分離信号という）とする。

【数4】

式(5)で定義される分離行列W(f, t)を用いると、分離信号y(f, t)は観測信号x(f, t)から式(6)により得られる。

【数5】

【数6】

ここで、w_k(f, t)∈C^K (k=1, …, K)は第k音源信号を分離するためのフィルタ（以下、第k分離フィルタという）である。また、式(5)のHはエルミート転置を表す。

【0006】

オンライン音源分離は、K個の音源が移動する場合において、現在の時間フレームにおける観測信号やそれより前の時間フレームにおける観測信号を用いて現在の時間フレームにおける分離行列を逐次的に推定する問題として定式化される。特に、1個の音源のみが移動し、その他のK-1個の音源が移動しない場合は、音源追跡という。移動する1個の音源のことを目的音源、移動しないK-1個の音源のことを非目的音源という。第λ音源（λは1≦λ≦Kを満たす）が目的音源であるものとすると、第λ音源のステアリングベクトルa_λ(f, t)は時間的に変化するが、その他の音源のステアリングベクトルa_k(f, t) (k≠λ)は時間的に変化しない。したがって、非目的音源のステアリングベクトルa_k(f, t) (k≠λ)は既知としてもよい。

【0007】

オンライン音源分離及び音源追跡を実現するアルゴリズムとして、例えば非特許文献１に開示されているアルゴリズムがある。非特許文献１のアルゴリズムを以下に示す。

【0008】

＜＜非特許文献１のアルゴリズム＞＞
------------------------------------------------------------------
1: for t=1, …, T
2: 観測信号x(f, t) (f=1, …, F)を取得する
3: 次式により、分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する。

【数7】

4: 次式により、第k重み付き共分散行列V_k(f, t) (k=1, …, K, f=1, …, F)を更新する。

【数8】

（ただし、αは0<α≦1を満たす定数）

【数9】

5: if オンライン音源分離
6: for k=1, …, K
7: 次式により、第k分離フィルタw_k(f, t) (f=1, …, F)を更新する。

【数10】

【数11】

【数12】

8: eise if 音源追跡
9: 次式により、第λ分離フィルタw_λ(f, t) (f=1, …, F)を更新する。

【数13】

【数14】

------------------------------------------------------------------
ここで、ステップ４におけるφ(r)はφ(r)=ψ’(r)/2r（ただし、ψ(r)は0以上の実数の集合R_≧0から実数の集合Rへの微分可能な関数であり、ψ’はψの微分を表す）により定義される音源の特性を表す関数である。

【先行技術文献】

【非特許文献】

【0009】

【非特許文献1】T. Nakashima and N. Ono, “Inverse-free online independent vector analysis with flexible iterative source steering,” in Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA), pp.750-754, 2022.

【発明の概要】

【発明が解決しようとする課題】

【0010】

しかし、非特許文献１のアルゴリズムの計算量は、ステップ４における重み付き共分散行列の計算をみればわかるように、オンライン音源分離、音源追跡のいずれの場合もO(K³)となり、補聴器のように計算能力が限られる機器ではマイクロホンの数が増加するとリアルタイムでの動作を保証することが困難となる。

【0011】

そこで本発明では、マイクロホンの数が多くても高速に動作する音源追跡技術を提供することを目的とする。

【課題を解決するための手段】

【0012】

本発明の一態様は、x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、時間フレームtをt<-T’+1により初期化する初期化部と、分離行列W(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算部と、近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算部と、近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算部と、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算部と、時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定部と、を含む。

【0013】

本発明の一態様は、x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）をK個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号、y(f, t)=[y₁(f, t),…, y_K(f, t)]^T (f=1, …, F, t=T’+1, …,T)を分離信号、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)を第k音源信号を分離するためのフィルタである第k分離フィルタ、W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)を分離行列とし、K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとし、分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)は得られているものとし、時間フレームtをt<-T’+1により初期化する初期化部と、W(f, t-1)=~Q(f, t-1)W(f, T’)を満たす補助分離行列~Q(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する第１計算部と、近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する第２計算部と、近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する第３計算部と、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する第４計算部と、時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合は第１計算部の処理に戻る終了条件判定部と、を含む。

【発明の効果】

【0014】

本発明によれば、マイクロホンの数が多い場合において高速に音源信号を推定することが可能となる。

【図面の簡単な説明】

【0015】

【図1】音源信号推定装置１００／２００の構成を示すブロック図である。

【図2】音源信号推定装置１００の動作を示すフローチャートである。

【図3】音源信号推定装置２００の動作を示すフローチャートである。

【図4】本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

【発明を実施するための形態】

【0016】

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

【0017】

各実施形態の説明に先立って、この明細書における表記方法について説明する。

【0018】

^（キャレット）は上付き添字を表す。例えば、x^{y^z}はy^zがxに対する上付き添字であり、x_y^zはy^zがxに対する下付き添字であることを表す。また、_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

【0019】

ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

【0020】

＜技術的背景＞
非特許文献１の音源追跡を実現するアルゴリズムにおいて重み付き共分散行列を計算しないようにすることにより、計算量を抑制することを考える。以下に示すアルゴリズム１、アルゴリズム２は、いずれも非特許文献１の音源追跡を実現するアルゴリズムと等価であり、重み付き共分散行列を陽に計算しないようにしたアルゴリズムである。アルゴリズム１、アルゴリズム２は、重み付き共分散行列を陽に計算しないため、計算量がO(K²)となっている。

【0021】

まず、アルゴリズム１を示す。なお、アルゴリズム１、アルゴリズム２のいずれにおいても分離行列W(f, T’) (f=1, …, F)は得られているものとする。
＜＜アルゴリズム１＞＞
------------------------------------------------------------------
1: for t=T’+1, …, T
2: 観測信号x(f, t) (f=1, …, F)を取得する
3: 次式により、近似分離信号^y(f, t) (f=1, …, F)を計算する。

【数15】

4: 次式により、値r_k(t) (k=1, …, K)を更新する。

【数16】

5: for f=1, …, F
6: 次式により、重みG_k(f, t) (k=1, …, K), g_k(f, t) (k=1, …, λ-1, λ+1, …, K)を更新する。

【数17】

【数18】

ここで、*は複素共役を表す。
7: 次式により、第k分離フィルタw_k(f, t) (k=1, …, K)と第k分離信号y_k(f, t) (k=1, …, K)を更新する。

【数19】

【数20】

------------------------------------------------------------------

【0022】

次に、アルゴリズム２を示す。
＜＜アルゴリズム２＞＞
------------------------------------------------------------------
1: for t=T’+1, …, T
2: 観測信号x(f, t) (f=1, …, F)を取得する
3: 次式により、近似分離信号^y(f, t) (f=1, …, F)を計算する。

【数21】

ただし、~Q(f, t-1)に対してW(f, t-1)=~Q(f, t-1)W(f, T’)が成り立つ。
4: 次式により、値r_k(t) (k=1, …, K)を更新する。

【数22】

5: for f=1, …, F
6: 次式により、重みG_k(f, t) (k=1, …, K), g_k(f, t) (k=1, …, λ-1, λ+1, …, K)を更新する。

【数23】

【数24】

7: 次式により、補助分離行列Q(f, t), ~Q(f, t)と分離信号y(f, t)を更新する。

【数25】

【数26】

（ただし、e_kは第k要素が1、それ以外の要素は0である単位ベクトル）

【数27】

（ただし、~Q(f, T’)は単位行列）

【数28】

------------------------------------------------------------------
＜第１実施形態＞
本実施形態では、アルゴリズム１に基づく音源追跡の形態について説明する。

【0023】

音源信号推定装置１００は、K個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）から分離信号y(f, t)=[y₁(f, t),…, y_K(f, t)]^T(f=1, …, F, t=T’+1, …,T)（ただし、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)は第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号である）を推定する。その際、音源信号推定装置１００は、分離行列W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)（ただし、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)は第k音源信号を分離するためのフィルタである第k分離フィルタである）を用いる。なお、K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとする。

【0024】

以下、図１～図２を参照して音源信号推定装置１００を説明する。図１は、音源信号推定装置１００の構成を示すブロック図である。図２は、音源信号推定装置１００の動作を示すフローチャートである。図１に示すように音源信号推定装置１００は、初期化部１１０と、第１計算部１２０と、第２計算部１３０と、第３計算部１４０と、第４計算部１５０と、終了条件判定部１６０と、記録部１９０を含む。記録部１９０は、音源信号推定装置１００の処理に必要な情報を適宜記録する構成部である。記録部１９０は、例えば、所定の推定方法によりあらかじめ得られている分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)を記録しておく。

【0025】

図２に従い音源信号推定装置１００の動作について説明する。

【0026】

Ｓ１１０において、初期化部１１０は、時間フレームtをt<-T’+1により初期化する。

【0027】

Ｓ１２０において、第１計算部１２０は、分離行列W(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する。第１計算部１２０は、次式により、近似分離信号^y(f, t) (f=1, …, F)を計算する。

【数29】

なお、観測信号x(f, t)(f=1, …, F, t=T’+1, …, T)は、第１計算部１２０に入力として与える代わりに、あらかじめ記録部１９０に記録しておいてもよい。

【0028】

Ｓ１３０において、第２計算部１３０は、近似分離信号^y(f, t) (f=1, …, F)を用いて、値r_k(t) (k=1, …, K)を更新する。第２計算部１３０は、次式により、値r_k(t) (k=1, …, K)を更新する。

【数30】

Ｓ１４０において、第３計算部１４０は、近似分離信号^y(f, t) (f=1, …, F)と値r_k(t) (k=1, …, K)を用いて、k=λに対しては重みG_λ(f, t) (f=1, …, F)を更新し、k≠λに対しては重みG_k(f, t) (f=1, …, F)と重みg_k(f, t) (f=1, …, F)を更新する。第３計算部１４０は、次式により、重みG_k(f, t) (k=1, …, K, f=1, …, F), g_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を更新する。

【数31】

【数32】

ただし、αは0<α≦1を満たす定数、φ(r)はφ(r)=ψ’(r)/2r（ただし、ψ(r)は0以上の実数の集合R_≧0から実数の集合Rへの微分可能な関数であり、ψ’はψの微分を表す）により定義される音源の特性を表す関数である。

【0029】

Ｓ１５０において、第４計算部１５０は、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する。第４計算部１５０は、次式により、分離行列W(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する。

【数33】

【数34】

Ｓ１６０において、終了条件判定部１６０は、時間フレームtをt<-t+1により更新し、t>Tを満たす場合は処理を終了し、それ以外の場合はS１２０の処理に戻り、Ｓ１２０～Ｓ１５０の処理を繰り返す。終了条件判定部１６０は、処理の終了に際して、分離信号y(f, t) (f=1, …, F, t=T’+1, …, T)を出力してもよい。

【0030】

本発明の実施形態によれば、マイクロホンの数が多い場合において高速に音源信号を推定することが可能となる。

【0031】

＜第２実施形態＞
本実施形態では、アルゴリズム２に基づく音源追跡の形態について説明する。

【0032】

音源信号推定装置２００は、K個（ただし、Kは2以上の整数）のマイクロホンを用いて観測されたK個の音源からの混合音の観測信号x(f, t)(f=1, …, F, t=T’+1, …, T)（ただし、fは周波数ビンを表すインデックス、tは時間フレームを表すインデックス、T’は1以上の整数）から分離信号y(f, t)=[y₁(f, t),…, y_K(f, t)]^T(f=1, …, F, t=T’+1, …,T)（ただし、y_k(f, t)(k=1, …, K, f=1, …, F, t=T’+1, …,T)は第k音源からの信号（以下、第k音源信号という）の推定信号である第k分離信号である）を推定する。その際、音源信号推定装置２００は、分離行列W(f, t)=[w₁(f, t),…, w_K(f, t)]^H (f=1, …, F, t=T’+1, …,T)（ただし、w_k(f, t) (k=1, …, K, f=1, …, F, t=T’+1, …,T)は第k音源信号を分離するためのフィルタである第k分離フィルタである）の代わりにW(f, t)=~Q(f, t)W(f, T’)を満たす補助分離行列~Q(f, t) (f=1, …, F, t=T’+1, …,T)を用いる。なお、K個の音源のうち、第λ音源（ただし、λは1≦λ≦Kを満たす）は移動し、第λ音源以外のK-1個の音源は移動しないものとする。

【0033】

以下、図１、図３を参照して音源信号推定装置２００を説明する。図１は、音源信号推定装置２００の構成を示すブロック図である。図３は、音源信号推定装置２００の動作を示すフローチャートである。図１に示すように音源信号推定装置２００は、初期化部１１０と、第１計算部２２０と、第２計算部１３０と、第３計算部１４０と、第４計算部２５０と、終了条件判定部１６０と、記録部１９０を含む。記録部１９０は、音源信号推定装置２００の処理に必要な情報を適宜記録する構成部である。記録部１９０は、例えば、所定の推定方法によりあらかじめ得られている分離行列W(f, t)の初期値W(f, T’) (f=1, …, F)を記録しておく。音源信号推定装置２００は第１計算部１２０の代わりに第１計算部２２０を、第４計算部１５０の代わりに第４計算部２５０を含む点においてのみ音源信号推定装置１００と異なる。

【0034】

図３に従い音源信号推定装置２００の動作について説明する。ここでは、音源信号推定装置２００が音源信号推定装置１００と異なる第１計算部２２０と第４計算部２５０の動作についてのみ説明する。

【0035】

Ｓ２２０において、第１計算部２２０は、W(f, t-1)=~Q(f, t-1)W(f, T’)を満たす補助分離行列~Q(f, t-1) (f=1, …, F)を用いて、観測信号x(f, t) (f=1, …, F)から分離信号y(f, t)の近似信号である近似分離信号^y(f, t) (f=1, …, F)を計算する。第１計算部２２０は、次式により、近似分離信号^y(f, t) (f=1, …, F)を計算する。

【数35】

なお、観測信号x(f, t)(f=1, …, F, t=T’+1, …, T)は、第１計算部２２０に入力として与える代わりに、あらかじめ記録部１９０に記録しておいてもよい。

【0036】

Ｓ２５０において、第４計算部２５０は、重みG_k(f, t) (k=1, …, K, f=1, …, F)と重みg_k(f, t) (k=1, …, λ-1, λ+1, …, K, f=1, …, F)を用いて、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する。第４計算部２５０は、次式により、補助分離行列~Q(f, t) (f=1, …, F)と分離信号y(f, t) (f=1, …, F)を更新する。

【数36】

【数37】

（ただし、e_kは第k要素が1、それ以外の要素は0である単位ベクトル）

【数38】

（ただし、~Q(f, T’)は単位行列）

【数39】

本発明の実施形態によれば、マイクロホンの数が多い場合において高速に音源信号を推定することが可能となる。

【0037】

＜補記＞
上述した各装置の各部の処理をコンピュータにより実現してもよく、この場合は各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図４に示すコンピュータ２０００の記録部２０２０に読み込ませ、演算処理部２０１０、入力部２０３０、出力部２０４０、補助記録部２０２５などを動作させることにより、上記各装置における処理機能がコンピュータ上で実現される。

【0038】

本発明の装置は、例えば単一のハードウェアエンティティとして、ハードウェアエンティティの外部から信号を入力可能な入力部、ハードウェアエンティティの外部に信号を出力可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、演算処理部であるCPU（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

【0039】

ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。

【0040】

ハードウェアエンティティでは、外部記憶装置（あるいはROMなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行、処理される。その結果、CPUが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。つまり、本発明の実施形態の各構成部は、処理回路(Processing Circuitry)により構成されてもよい。

【0041】

既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

【0042】

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体は、例えば、非一時的な記録媒体であり、具体的には、磁気記録装置、光ディスク等である。

【0043】

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

【0044】

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の非一時的な記憶装置である補助記録部２０２５に格納する。そして、処理の実行時、このコンピュータは、自己の非一時的な記憶装置である補助記録部２０２５に格納されたプログラムを記録部２０２０に読み込み、読み込んだプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを記録部２０２０に読み込み、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

【0045】

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【0046】

本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版