(58)【調査した分野】(Int.Cl.,DB名)
直角二等辺三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
上記3個のマイクロホンのうち、目的方向と同じ方向に位置している2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
を備えることを特徴とする音源分離装置。
正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
上記3個のマイクロホンのうち、目的方向に対して、それぞれ±60度の角度に位置している2個のマイクロホンの組み合わせにより収音された音響信号を用いて、それぞれ目的方向に対して±60度に死角を向ける2個の単一指向性を形成する単一指向性形成手段と、
上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
を備えることを特徴とする音源分離装置。
正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
上記3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を平均した信号と、残りのマイクロホンにより収音された音響信号とを用い、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
を備えることを特徴とする音源分離装置。
上記双指向性形成手段の出力から上記単一指向性形成手段の出力をスペクトル減算することにより、又は、上記単一指向性形成手段の出力から上記双指向性形成手段の出力をスペクトル減算することにより、上記双指向性形成手段の出力と上記単一指向性形成手段の出力との間に重複している信号成分を消去する重複指向性消去手段を備え、
上記目的音抽出手段が、上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記重複指向性消去手段の出力をスペクトル減算して、目的音を抽出するものである
ことを特徴とする請求項1〜3のいずれかに記載の音源分離装置。
上記指向性形成手段からの上記マイクロホンアレイ毎の出力間で、目的エリア音の上記各マイクロホンアレイへの伝搬遅延時間の差を吸収する補正処理を行う遅延補正手段を備えることを特徴とする請求項8又は9に記載の収音装置。
【発明を実施するための形態】
【0027】
(A)本発明の技術的思想の説明
以下では、まず、本発明の音源分離装置及びプログラムの技術的思想を説明する。
【0028】
本発明は、3個の全指向性のマイクロホンを用いて双指向性と単一指向性とを形成し、入力信号から各指向性フィルタの出力をまとめてスペクトル減算(SS)を行うことにより、目的方向にのみ鋭い指向性を形成する。
【0029】
図4は、本発明に係る各指向性フィルタにより形成される指向特性の一例を説明する説明図である。
【0030】
ここでは、例えば、マイクロホンは目的方向に対して水平に2個配置し、これらを第1のマイクロホンM1、第2のマイクロホンM2とする。さらに、第1のマイクロホンM1と第2のマイクロホンM2と結んだ直線と直交し、かつ、第1のマイクロホンM1若しくは第2のマイクロホンM2のいずれかのマイクロホン(ここでは、第2のマイクロホンM2)を通る直線上に第3のマイクロホンM3を配置する。この際、第3のマイクロホンM3と第2のマイクロホンM2との距離は、第1のマイクロホンM1と第2のマイクロホンM2との距離と同じとする。すなわち、3個のマイクロホンM1、M2、M3は、直角二等辺三角形の頂点となるようにする。
【0031】
まず、第1のマイクロホンM1及び第2のマイクロホンM2からの信号を双指向性フィルタに入力する。また、第2のマイクロホンM2及び第3のマイクロホンM3からの信号を目的方向に死角を向ける単一指向性フィルタに入力する。
【0032】
そうすると、
図4に示す通り、2個の指向性はどちらも目的方向に死角を向けていることが分かる。この双指向性フィルタの出力は目的方向に対して左右方向に存在する非目的音となり、また単一指向性フィルタの出力は目的方向に対して後方に存在する非目的音となる。これら2つの指向性フィルタを用いることで、目的方向以外に存在する全ての非目的音を抽出することができる。最後に各指向性フィルタの出力を全て入力信号からSSし、目的音を抽出する。ここで、対象となる入力信号は、第1のマイクロホンM1若しくは第2のマイクロホンM2の入力信号、又は、第1のマイクロホンM1と第2のマイクロホンM2との入力信号を平均したものである。
【0033】
上記方式では、SSを双指向性フィルタの出力信号と単一指向性フィルタの出力信号の2個を用いて行なっている。
図4の斜線部分が示すように双指向性と単一指向性とは一部重なっており、そのままSSを行うと重複部分は2回減算することとなる。SSは、個々の音成分が周波数領域で重なる確率が低いスパース性という性質を利用して目的音を抽出する手法である。
【0034】
しかし、ある音成分が単独で特定の周波数に存在するか否かは、音源の数と周波数の分解能に依存する。そのため、複数の音成分が同じ周波数に存在する状況が考えられる。そのような状況下でSSを複数回行うと、減算の度に目的音成分が削られて音質が劣化してしまう可能性がある。
【0035】
そこで、本発明は、SSを行う前に予め双指向性と単一指向性の重なっている部分を消去する。双指向性フィルタで抽出した非目的音の振幅スペクトルから単一指向性フィルタで抽出した非目的音の振幅スペクトルを減算すると、双指向性フィルタで抽出した非目的音成分の内、単一指向性フィルタで抽出した非目的音成分と共通に含まれる成分が消去される。その後、単一指向性フィルタで抽出した非目的音成分と、重複成分を消去した双指向性フィルタで抽出した非目的音を入力信号からSSする。これにより、目的音成分の引き過ぎが起こらず、目的音の音質の劣化を防ぐことができる。
【0036】
(B)第1の実施形態
以下、本発明に係る音源分離装置及びプログラムの第1の実施形態を、図面を参照にしながら詳細に説明する。
【0037】
(B−1)第1の実施形態の構成
図1は、第1の実施形態に係る音源分離装置10Aの構成を示すブロック図である。マイクロホンを除く
図1に示す部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAM等を有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良く、いずれの構築方法を採用した場合であっても機能的には、
図1で表すことができる。
【0038】
図1において、第1の実施形態の音源分離装置10Aは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1、1−2、1−3、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
【0039】
第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、全指向性マイクロホンである。
【0040】
第1のマイクロホンM1と第2のマイクロホンM2は、目的方向に対して水平に配置する。第3のマクロホンM3は、第1のマイクロホンM1及び第2のマイクロホンM2と同一平面上に存在し、第1のマイクロホンM1と第2のマイクロホンM2とを結んだ直線に直交し、かつ、第2のマイクロホンM2を通る直線上に配置する。
【0041】
このとき、第3のマイクロホンM3と第2のマイクロホンM2との距離は、第1のマイクロホンM1と第2のマイクロホンM3との距離と同じとなるようにする。これにより、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、直角二等辺三角形の頂点となるようにする。
【0042】
なお、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、空間における同一平面上で直角二等辺三角形の頂点に配置されていればよい。
【0043】
信号入力部1−1は、信号加算部2及び双指向性形成部3と接続しており、第1のマイクロホンM1が収音したアナログ信号の音響信号(音声信号、音響信号を含むもの)をデジタル信号に変換して入力し、信号加算部2及び双指向性形成部3に出力するものである。
【0044】
信号入力部1−2は、信号加算部2、双指向性形成部3及び単一指向性形成部4と接続しており、第2のマイクロホンM2が収音したアナログ信号の音響信号をデジタル信号に変換して入力し、信号加算部2、双指向性形成部3及び単一指向性形成部4に出力するものである。
【0045】
信号入力部1−3は、単一指向性形成部4と接続しており、第3のマイクロホンM3が収音したアナログ信号の音響信号(音声信号、音響信号)をデジタル信号に変換して入力し、単一指向性形成部4に出力するものである。
【0046】
図1において、信号入力部1−1、1−2、1−3は、入力信号を時間領域から周波数領域に変換するために、例えば高速フーリエ変換等を行う。
【0047】
信号加算部2は、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍して目的信号抽出部6に出力する。信号加算部2の出力信号は、目的信号抽出部6におけるスペクトル減算法(SS)を行う際の入力信号となる。第1の実施形態では、信号加算部2が第1のマイクロホンM1及び第2のマイクロホンM2からの音響信号を平均した信号を目的信号抽出部6に出力する場合を例示するが、第1のマイクロホンM1又は第2のマイクロホンM2のいずれかの信号を目的信号抽出部6に出力するようにしても良い。
【0048】
双指向性形成部3は、信号入力部1−1及び信号入力部1−2からの出力(デジタル信号)に対するビームフォーマ(BF)により、目的方向に死角を向ける双指向性を形成する双指向性フィルタであり、形成した双指向性を重複指向性消去部5に出力する。
【0049】
単一指向性形成部4は、信号入力部1−2及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
【0050】
重複指向性消去部5は、目的信号抽出部6においてスペクトル減算法(SS)を行う前に、双指向性と単一指向性との指向性重複部分を消去するため、双指向性形成部3の出力信号と単一指向性形成部4の出力信号とに共通に含まれる信号成分を消去するものである。
【0051】
目的信号抽出部6は、信号加算部2と重複指向性消去部5と接続しており、信号加算部2からの信号を入力信号として、この入力信号から重複指向性消去部5の出力信号をスペクトル減算することにより、目的音を抽出するものである。
【0052】
目的音を抽出するための処理では、全ての出力が周波数領域で表現されていることを要する。従って、上述したように、信号入力部1−1、1−2、1−3は、時間領域の信号を周波数領域の信号に変換する変換部を有している。
【0053】
(B−2)第1の実施形態の動作
次に、第1の実施形態に係る音源分離装置10Aにおける動作を説明する。
【0054】
第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、それぞれ直角二等辺三角形の頂点になるように配置される。例えば、第1のマイクロホンM1及び第2のマイクロホンM2の間隔と、第2のマイクロホンM2及び第3のマイクロホンM3の間隔とが例えば3cmとなるように配置したものとする。
【0055】
目的とする音源が発した音(音声や音響)が第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3により収音(捕捉)される。
【0056】
第1のマイクロホンM1が捕捉して得た音響信号(アナログ信号)は、信号入力部1−1によりデジタル変換され、更に信号入力部1−1により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて信号加算部2及び双指向性形成部3に与えられる。
【0057】
また、第2のマイクロホンM2が捕捉して得た音響信号(アナログ信号)は、信号入力部1−2によりデジタル変換され、更に信号入力部1−2により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて信号加算部2、双指向性形成部3及び単一指向性形成部4に与えられる。
【0058】
さらに、第3のマイクロホンM3が捕捉して得た音響信号(アナログ信号)は、信号入力部1−3によりデジタル変換され、更に信号入力部1−3により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて単一指向性形成部4に与えられる。
【0059】
信号加算部2において、時間軸が揃えられた信号入力部1−1からの出力信号と信号入力部1−2からの出力信号とが加算され、この加算された信号のパワーが1/2倍されて、目的音成分が強調される。
【0060】
双指向性形成部3では、(1)式に従い、θ
L=0として、第1のマイクロホンM1と第2のマイクロホンM2との間の距離d(例えば3cm)に基づいて、第1のマイクロホンM1に到来した信号と第2のマイクロホンM2に到来した信号との時間差が算出される。更に、双指向性形成部3では、(3)式に従って、信号入力部1−1からの周波数領域の出力信号と、信号入力部1−2からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける双指向性が形成される。
【0061】
つまり、双指向性形成部3により形成される双指向性は、
図4に示す通り、目的方向に対して、第1のマイクロホンM1及び第2のマイクロホンM2を結んだ直線方向(
図4における左右方向)に存在する非目的音となる。
【0062】
単一性形成部4では、(1)式に従い、θ
L=−π/2とし、第2のマイクロホンM2と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第2のマイクロホンM2に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4では、(3)式に従って、信号入力部1−2からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける単一指向性が形成される。
【0063】
つまり、単一指向性形成部4により形成される単一指向性は、
図4に示す通り、目的方向に対して後方(すなわち、目的方向の反対側)に存在する非目的音となる。
【0064】
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDに共通に含まれる信号成分が消去される。
【0065】
ここで、重複指向性消去部5による重複する信号成分の消去方法は、(5)式に従って行なわれる。
【数1】
【0066】
ここで、N
UD1はN
UDとN
BDの重複成分を消去した出力信号の振幅スペクトルである。
【0067】
重複指向性消去部5による重複信号成分の減算の結果、N
UD1がマイナスの値になった場合、重複指向性消去部5はフロアリング処理を行う。また、この例では、重複指向性消去部5がN
UDからN
BDを減算しているが、逆にN
BDからN
UDを減算し、重複成分を消去した出力信号の振幅スペクトルN
BD1としても良い。なお、BFによる指向性は、マイクロホン間隔により周波数毎のゲインが違ってくるが、N
BDとN
UDはともにゲイン補正を行なっているものとする。
【0068】
ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるが、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDとは共にゲイン補正を行っているものとする。例えば、重複指向性消去部5が、時間軸が揃えられた双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDとに基づいて、周波数毎の振幅スペクトルの比率を求め、出力パワーを揃えるための補正係数を用いてゲイン補正するようにしても良い。
【0069】
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルX
DSと、重複指向性消去部5から非目的音としての出力の振幅スペクトルN
BD及び重複部分減算後の出力の振幅スペクトルN
UD1とが与えられる。
【0070】
そして、目的信号抽出部6では、信号加算部2の出力の振幅スペクトルX
DSから、重複指向性消去部5の出力の振幅スペクトルN
BD及び重複部分減算後の出力の振幅スペクトルN
UD1を減算して、強調した目的音が抽出される。
【0071】
目的信号抽出部6による目的音の抽出は、(6)式に従って行なわれる。
【0072】
Y=X
DS−β
1N
BD−β
2N
UD1 (6)
ここで、β
1とβ
2はスペクトル減算による強度を調節するための係数である。
【0073】
(B−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、3個の全指向性マイクロホンにより収音された音響信号を用いて、単一指向性フィルタと双指向性フィルタにより非目的音を抽出し、抽出した非目的音を入力信号からSSすることにより、目的方向にのみ鋭い指向性を形成することができる。
【0074】
また、第1の実施形態によれば、目的方向の指向性の形成にSSしか使用していないため、雑音が増えたとしても音源分離性能が急激に悪化することはない。さらに、第1の実施形態によれば、双指向性と単一指向性の重複する指向性重複部分を予め消去してからSSを行うことで、重複部分の複数回の減算による目的音の音質の劣化を防ぐことができる。
【0075】
(C)第2の実施形態
次に、本発明に係る音源分離装置及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
【0076】
第1の実施形態では、3個のマイクロホンを直角二等辺三角形の頂点に配置する場合を例示したが、第2の実施形態では、正三角形の頂点に3個のマイクロホンを配置する場合を例示する。
【0077】
(C−1)第2の実施形態の構成
図5は、第2の実施形態に係る音源分離装置10Bの構成を示すブロック図であり、第1の実施形態に係る
図1との同一、対応部分には同一符号を付して示している。
【0078】
図5において、第2の実施形態に係る音源分離装置10Bは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1〜1−3、信号加算部2、双指向性形成部3、単一指向性形成部4−1及び4−2、重複指向性消去部5、目的信号抽出部6を備える。
【0079】
第1のマイクロホンM1と第2のマイクロホンM2は、目的方向に対して水平に配置する。第3のマクロホンM3は、第1のマイクロホンM1及び第2のマイクロホンM2と同一平面上であって、目的方向の反対側に位置するようにして、第1のマイクロホンM1、第2のマイクロホンM2及び第3のマイクロホンM3が正三角形の頂点になるように配置される。
【0080】
信号入力部1−1は、信号加算部2、双指向性形成部3及び単位値指向性形成部4−1と接続しており、出力信号を信号加算部2、双指向性形成部3及び単位値指向性形成部4−1に与える。
【0081】
信号入力部1−2は、信号加算部2及び単一指向性形成部4−2と接続しており、出力信号を信号加算部2及び単一指向性形成部4−2に与える。
【0082】
信号入力部1−3は、単一指向性形成部4−1及び4−2に接続しており、出力信号を単一指向性形成部4−1及び4−2に与える。
【0083】
単一指向性形成部4−1は、信号入力部1−1及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に対し+60°の角度に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
【0084】
単一指向性形成部4−2は、信号入力部1−2及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に対し−60°の角度に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
【0085】
重複指向性消去部5は、双指向性形成部3と単一指向性形成部4−1及び4−2とのそれぞれの出力に共通に含まれる信号成分を消去するものである。
【0086】
(C−2)第2の実施形態の動作
第2の実施形態の音源分離装置10Bにおける動作は、単一指向性形成部4−1及び4−2、重複指向性消去部5、目的信号抽出部6の動作が異なっているため、以下ではこれらの構成要素の動作を説明する。
【0087】
上述したように、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3はそれぞれ、正三角形の頂点になるように配置される。
【0088】
第2の実施形態では、第1のマイクロホンM1及び第3のマイクロホンM3の音響信号に基づいて単一指向性を形成し、第2のマイクロホンM2及び第3のマイクロホンM3の音響信号に基づいて単一指向性を形成する。
【0089】
単一性形成部4−1では、(1)式に従い、θ
L=−π/2とし、第1のマイクロホンM1と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第1のマイクロホンM1に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4−1では、(3)式に従って、信号入力部1−1からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に対し+60°に死角を向ける単一指向性が形成される。
【0090】
単一性形成部4−2では、(1)式に従い、θ
L=−π/2とし、第2のマイクロホンM2と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第2のマイクロホンM2に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4−2では、(3)式に従って、信号入力部1−2からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に対し−60°に死角を向ける単一指向性が形成される。
【0091】
重複指向性消去部5では、双指向性形成部3の出力と単一指向性形成部4−1及び4−2の出力とのそれぞれに共通に含まれる成分を消去する。
【0092】
図6は、第2の実施形態に係る各指向性フィルタにより形成される指向特性を説明する説明図である。
【0093】
図6に示すように、指向性の重複部分は、双指向性形成部3からの双指向性と単一指向性形成部4−1からの単一指向性との間、双指向性形成部3からの双指向性と単一指向性形成部4−2からの単一指向性との間に存在すると共に、単一指向性形成部4−1及び4−2からの単一指向性の間にも存在している。
【0094】
そこで、重複指向性消去部5による重複部分の消去方法は、(5)式を拡張した(7)式〜(9)式を使用する。
【数2】
【0095】
ここで、N
BDは双指向性形成部3の出力の振幅スペクトル、N
UDLは単一指向性形成部4−1の出力の振幅スペクトル、N
UDRは単一指向性形成部4−2の出力の振幅スペクトルである。
【0096】
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4−1の出力の振幅スペクトルN
UDLに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(7)式に従って、単一指向性形成部4−1の出力の振幅スペクトルN
UDLから双指向性形成部3の出力の振幅スペクトルN
BDを減算して、重複部分減算後の出力の振幅スペクトルN
UDL1が求められる。
【0097】
また、重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4−2の出力の振幅スペクトルN
UDRに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(8)式に従って、単一指向性形成部4−2の出力の振幅スペクトルN
UDRから双指向性形成部3の出力の振幅スペクトルN
BDを減算して、重複部分減算後の出力の振幅スペクトルN
UDR1が求められる。
【0098】
さらに、重複指向性消去部5では、N
BDとの重複成分を消去した出力の振幅スペクトルN
UDL1と、N
BDとの重複成分を消去した出力の振幅スペクトルN
UDR1とに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(9)式に従って、N
BDとの重複成分を消去した出力の振幅スペクトルN
UDR1から、N
BDとの重複成分を消去した出力の振幅スペクトルN
UDL1を減算して、重複部分減算後の出力の振幅スペクトルN
UDR2が求められる。
【0099】
また、(7)式〜(9)式において、重複成分を消去する順番は、変更することができる。つまり、各振幅スペクトルを入れ替えて、N
UDL2=N
UDL1−N
UDR1や、N
BD1=N
BD−N
UDLとして処理を進めても良い。
【0100】
なお、(7)式〜(9)式において、重複部分の減算後の出力の振幅スペクトルN
UDL1、N
UDR1、N
UDR2の値がマイナスになった場合には、重複部分減算後の出力の振幅スペクトルN
UDL1、N
UDR1、N
UDR2の値を0に置き換えるフロアリング処理がなされる。なお、フロアリング処理は、重複部分の減算後の出力の振幅スペクトルの元の値(直前の値)を小さくした値に置き換えるようにしても良い。
【0101】
また、第1の実施形態と同様に、ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるため、出力の振幅スペクトルについて、周波数毎のゲイン補正を行うようにしても良い。
【0102】
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルX
DSと、重複指向性消去部5から非目的音としての重複部分減算後の出力の振幅スペクトルN
UDL1及び重複部分減算後の出力の振幅スペクトルN
UDR2とが与えられる。
【0103】
そして、目的信号抽出部6では、(10)式に従って、信号加算部2の出力の振幅スペクトルX
DSから、重複部分減算後の出力の振幅スペクトルN
UDL1及びN
UDR2を減算して、強調した目的音が抽出される。ここで、β
1とβ
2、β
3はそれぞれSSの強度を調節するための係数である。
【0104】
Y=X
DS−β
1N
BD−β
2N
UDL1−β
3N
UDR2 (10)
(C−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、正三角形の頂点に3個の全指向性マイクロホンを配置した場合でも、第1の実施形態と同様の効果が得られる。
【0105】
(D)第3の実施形態
次に、本発明に係る音源分離装置及びプログラムの第3の実施形態を、図面を参照しながら詳細に説明する。
【0106】
上述した第2の実施形態では、第1のマイクロホンM1と第3のマイクロホンM3、第2のマイクロホンM2と第3のマイクロホンM3の2つの組合せでそれぞれ単一指向性を形成した。
【0107】
ここで、目的方向に存在する音源は、第1のマイクロホンM1と第2のマイクロホンM2に同時に到達するため、信号加算部2の出力を第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホンで収音した音響信号と擬似的にみなすことができる。
【0108】
そこで、第3の実施形態では、信号加算部2の出力と信号入力部1−3の出力とを用いて、目的方向に死角を向ける単一指向性を形成する場合を説明する。
【0109】
(D−1)第3の実施形態の構成
図7は、第3の実施形態に係る音源分離装置10Cの構成を示すブロック図であり、第1及び第2の実施形態に係る
図1及び
図5との同一、対応部分には同一符号を付して示している。
【0110】
図7において、第3の実施形態に係る音源分離装置10Cは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1〜1−3、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
【0111】
信号入力部1−1は、第1の実施形態と同様に、信号加算部2及び双指向性形成部3と接続しており、出力信号を信号加算部2及び双指向性形成部3に与える。
【0112】
信号入力部1−2は、信号加算部2及び双指向性形成部3と接続しており、出力信号を信号加算部2及び双指向性形成部3に与える。
【0113】
信号入力部1−3は、単一指向性形成部4に接続しており、出力信号を単一指向性形成部4に与える。
【0114】
信号加算部2は、第1の実施形態と同様に、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍して目的信号抽出部6及び単一指向性形成部4に出力する。
【0115】
単一指向性形成部4は、信号入力部1−3からの出力及び信号加算部2からの出力に対するビームフォーマにより、目的方向に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
【0116】
双指向性形成部3、重複指向性消去部5及び目的信号抽出部6は、第1の実施形態と同様の構成である。
【0117】
(D−2)第3の実施形態の動作
第3の実施形態の音源分離装置10Cにおける動作は、単一指向性形成部4の動作が異なっているため、以下では単一指向性形成部4の動作を説明する。
【0118】
信号加算部2において、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍した信号が、単一指向性形成部4に出力される。
【0119】
この信号加算部2からの出力は、目的方向に対して水平に配置された信号入力部1−1及び1−2からの出力を平均しているため、第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホン(疑似的なマイクロホン)で収音した音響信号とみなすことができる。
【0120】
単一性形成部4では、(1)式に従い、θ
L=−π/2とし、第3のマイクロホンM3の出力と、信号加算部2の出力との時間差を算出する。更に、単一指向性形成部4では、(3)式に従って、信号入力部1−3からの周波数領域の出力信号と、信号加算部2からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける単一指向性が形成される。
【0121】
双指向性形成部3、重複指向性消去部5及び目的信号抽出部6の動作は、第1の実施形態と同様であり、目的信号抽出部6により強調された目的音が抽出される。
【0122】
(D−3)第3の実施形態の効果
以上のように、第3の実施形態によれば、正三角形の頂点に3個の全指向性マイクロホンを配置した場合でも、第1のマイクロホンM1と第2のマイクロホンM2に同時に到達するため、信号加算部2の出力を、第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホンで収音した音響信号とみなすことにより、第1及び第2の実施形態と同様の効果が得られる。
【0123】
(E)第4の実施形態
次に、本発明に係る音源分離装置、音源分離プログラム、収音装置及び収音プログラムの第4の実施形態を、図面を参照しながら詳細に説明する。
【0124】
第4の実施形態は、第1の実施形態で説明した3個の全指向性マイクロホンからなるマイクロホンアレイを用いて、ある特定のエリア内に存在する目的エリア音を収音する収音装置に本発明を適用する場合を例示する。
【0125】
(E−1)第4の実施形態の構成
図8は、第4の実施形態に係る収音装置20Aの構成を示すブロック図である。
図8において、第1の実施形態に係る
図1との同一、対応部分には同一符号を付して示している。
【0126】
マイクロホンを除く
図8に示す部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAM等を有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良く、いずれの構築方法を採用した場合であっても機能的には、
図8で表すことができる。
【0127】
図8において、第4の実施形態に係る収音装置20Aは、第1のマイクロホンアレイMA1、第2のマイクロホンアレイMA2、データ入力部1、指向性形成部21、遅延補正部22、空間座標データ保持部23、目的エリア音パワー補正係数算出部24、目的エリア音抽出部25を備える。
【0128】
第1のマイクロホンアレイMA1は、目的エリア(以下、TARとも呼ぶ、
図10参照。)が存在する空間の、目的エリアTARを指向できる場所に配置される。
【0129】
第1のマイクロホンアレイMA1は、
図8に示すように、3個のマイクロホンM1、M2及びM3から構成されており、3個のマイクロホンM1、M2及びM3が直角二等辺三角形の頂点に配置されている。各マイクロホンM1、M2及びM3が収音(捕捉)して得た音響信号は当該収音装置20Aの本体に入力される。
【0130】
第2のマイクロホンアレイMA2は、第1のマイクロホンアレイMA1と同様に、3個のマイクロホンM1、M2及びM3が直角二等辺三角形の頂点に配置された構成であり、各マイクロホンM1、M2及びM3が収音(捕捉)して得た音響信号は当該収音装置20Aの本体に入力される。
【0131】
また、第2のマイクロホンアレイMA2は、第1のマイクロホンアレイMA1とは異なる、目的エリアTARを指向できる場所に配置されている。つまり、目的エリアTARに対する第1及び第2のマイクロホンアレイMA1及びMA2の位置は、各マイクロホンアレイMA1及びMA2の指向性が目的エリアTARでのみ重なっていればよく、例えば目的エリアTARを挟んで対向する位置にそれぞれが配置するようにしても良い。
【0132】
なお、マクロホンアレイの数は2個に限定されるものではなく、目的エリアTARが複数存在する場合、全ての目的エリアTARをカバーできる数のマイクロホンアレイを配置するようにしても良い。
【0133】
また、第1及び第2のマイクロホンアレイMA1及びMA2を構成するマイクロホンM1、M2及びM3は、直角二等辺三角形の頂点に配置されるものであっても良いし、正三角形の頂点に配置されるものであっても良い。
【0134】
データ入力部1は、第1及び第2のマイクロホンアレイMA1、MA2で収音した音響信号をアナログ信号からデジタル信号に変換するものである。データ入力部1は、例えば高速フーリエ変換等を用いて、時間領域から周波数領域に変換して、指向性形成部21に出力する。
【0135】
指向性形成部22は、各マイクロホンアレイMA1、MA2からの出力(デジタル信号)に対するビームフォーマにより、目的エリア方向に対して各マイクロホンアレイMA1、MA2の前方に指向性を向けた指向性ビームを形成し、各マイクロホンアレイMA1、MA2についてのビームフォーマ出力を得るものである。ビームフォーマ法は、加算型の遅延和法、減算型のスペクトル減算法など各種手法を使うことができる。また、ターゲットとする目的エリアTARの範囲に応じて指向性の強度を変更するようにしても良い。
【0136】
空間座標データ保持部23は、目的エリアTAR(の中心)の位置情報や、各マイクロホンアレイMA1、MA2の位置情報を保持しているものである。
【0137】
遅延補正部22は、目的アリアTARと各マイクロホンアレイMA1、MA2の距離の違いにより発生する遅延(伝搬遅延時間)の差を算出し、その差を吸収するように、各マイクロホンアレイMA1、MA2についてのビームフォーマ出力の少なくとも1つを補正するものである。具体的な手順例は、まず、空間座標データ保持部23から、目的エリアTARの位置と各マイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間(伝搬遅延時間)の差を算出する。目的エリアTARから最も遠い位置に配置されたマイクロホンアレイに目的エリア音が到達するタイミングを基準とし、全てのマイクロホンアレイに目的エリア音が同時に到達するように、基準のマイクロホンアレイ以外の他の全てのマイクロホンアレイのビームフォーマ出力に遅延を加える。
【0138】
なお、目的エリアTARが変更されることなく、かつ、その目的エリアTARと各マイクロホンアレイMA1、MA2との距離が等しい場合には、遅延補正部22及び空間座標データ保持部23を省略することができる。
【0139】
目的エリア音パワー補正係数算出部24は、各ビームフォーマ出力における目的エリア音のパワーを揃えるための補正係数を算出するものである。
【0140】
ここで、目的エリア音パワー補正係数算出部24による補正係数の算出手法の一例として、各マイクロホンアレイのBF出力に含まれる目的エリア音のパワーの比率を推定し、それを補正係数とする方法を使用できる。
【0141】
目的エリア音抽出部25は、遅延補正部22から出力された各ビームフォーマ出力と、目的エリア音パワー補正係数算出部24から出力された補正係数とに基づいて、目的エリア音を抽出するものである。
【0142】
図9は、第4の実施形態に係る指向性形成部21の内部構成を示すブロック図である。
【0143】
指向性形成部21は、第1の実施形態で説明した音源分離装置10Aと同一、対応する構成を、マイクロホンアレイMA1、MA2毎に備えており、対応する構成要素には、第1の実施形態の
図1と同一符号を付している。
【0144】
つまり、指向性形成部21は、マイクロホンアレイMA1、MA2毎に、目的方向に対してマイクロホンアレイの前方を指向性方向とする指向性を形成するため、指向性形成部21は、マイクロホンアレイMA1又はMA2毎に、
図9に示す内部構成を有する。
【0145】
図9において、第4の実施形態の指向性形成部21は、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
【0146】
(E−2)第4の実施形態の動作
次に、第4の実施形態に係る収音装置20Aの動作を説明する。
【0147】
目的エリアTARに位置している全ての音源が放音した音は、目的エリアTARを処理対象としている、全てのマイクロホンアレイMA1、MA2のマイクロホンM1、M2及びM3によって捕捉される。なお、マイクロホンアレイMA1及びMA2のマイクロホンM1、M2及びM3は目的エリアTAR以外のエリアに存在する音源からの音も捕捉する。
【0148】
第1のマイクロホンアレイMA1の全てのマイクロホンM1、M2及びM3が、収音(捕捉)して得た音響信号(アナログ信号)は、データ入力部1によってデジタル信号に変換されて指向性形成部21に与えられる。同様に、第2のマイクロホンアレイMA2の全てのマイクロホンM1、M2及びM3が、収音(捕捉)して得た音響信号(アナログ信号)は、データ入力部1によってデジタル信号に変換されて指向性形成部21に与えられる。
【0149】
第1のマイクロホンアレイMA1からのデジタル信号に変換された全ての音響信号に対し、指向性形成部21によって、目的エリアTARの方向に対してマイクロホンアレイMA1の前方を指向性方向とするビームフォーマ処理が施されて、ビームフォーマ出力が遅延補正部22に与えられる。また、第2のマイクロホンアレイMA2からのデジタル信号に変換された全ての音響信号に対し、指向性形成部21によって、目的エリアTARの方向に対してマイクロホンアレイMA1の前方を指向性方向とするビームフォーマ処理が施されて、ビームフォーマ出力が遅延補正部22に与えられる。
【0150】
ここで、指向性形成部21における詳細な動作を、
図9を用いて説明する。
【0151】
第1のマイクロホンアレイMA1の、目的方向に対して水平に位置するマイクロホンM1からの入力信号x11とマイクロホンM2からの入力信号x12が信号加算部2に与えられる。信号加算部2では、入力信号x11と入力信号x12を加算した後、加算した信号のパワーを1/2倍して、目的音成分を強調する。
【0152】
また、第1のマイクロホンアレイMA1のマイクロホンM1及びM2の入力信号x11及びx12が、双指向性形成部3に与えられる。双指向性形成部3では、入力信号x11と入力信号x12を用い、目的方向に死角を向ける双指向性フィルタを形成する。双指向性の形成は、第1の実施形態と同様にして、(1)と(3)式に従い、θ
L=0として求められる。
【0153】
さらに、第1のマイクロホンアレイMA1の、目的方向と同じ方向に位置するするマイクロホンM2及びM3の入力信号x12及び入力信号x13が単一指向性形成部4に与えられる。単一指向性形成部4では、目的方向と同じ方向に位置するするマイクロホンM2及びM3の入力である入力信号x12及び入力信号x13を用い、目的方向に死角を向ける単一指向性フィルタを形成する。双指向性の形成は、第1の実施形態と同様に、(1)と(3)式に従い、θ
L=−π/2として求められる。
【0154】
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(5)式に従って、単一指向性形成部4の出力の振幅スペクトルN
UDから双指向性形成部3の出力の振幅スペクトルN
BDを減算して、重複部分減算後の出力の振幅スペクトルN
UD1が求められる。
【0155】
ここで、重複部分減算後の出力の振幅スペクトルN
UD1を求める際、重複部分減算後の出力の振幅スペクトルN
UD1の値がマイナスになった場合には、重複部分減算後の出力の振幅スペクトルN
UD1の値を0又は元の値を小さくした値に置き換えるフロアリング処理がなされる。なお、フロアリング処理は、重複部分減算後の出力の振幅スペクトルN
UD1の元の値(直前の値)を小さくした値に置き換えるようにしても良い。
【0156】
ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるが、双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDとは共にゲイン補正を行っているものとする。例えば、重複指向性消去部5が、時間軸が揃えられた双指向性形成部3の出力の振幅スペクトルN
BDと単一指向性形成部4の出力の振幅スペクトルN
UDとに基づいて、周波数毎の振幅スペクトルの比率を求め、出力パワーを揃えるための補正係数を用いてゲイン補正するようにしても良い。
【0157】
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルX
DSと、重複指向性消去部5から非目的音としての出力の振幅スペクトルN
BD及び重複部分減算後の出力の振幅スペクトルN
UD1とが与えられる。そして、目的信号抽出部6では、(6)式に従って、信号加算部2の出力の振幅スペクトルX
DSから、重複指向性消去部5の出力の振幅スペクトルN
BD及び重複部分減算後の出力の振幅スペクトルN
UD1を減算して、強調した目的音が抽出される。
【0158】
第2のマイクロホンアレイMA2についても、マイクロホンM1、M2及びM3からの入力信号x21、x22及びx23は指向性形成部21に与えられ、第1のマイクロホンアレイMA1の場合と同様にして、目的方向に対して第2のマイクロホンアレイMA2の前方にのみ強調された目的音が抽出される。
【0159】
遅延補正部3では、空間座標データ保持部23の保持データに基づいて、目的エリアTARと各マイクロホンアレイMA1、MA2の距離の違いにより発生する目的エリアTARから第1のマイクロホンアレイMA1への伝搬遅延時間と、目的エリアTARから第1のマイクロホンアレイMA2への伝搬遅延時間との差が算出され、その時間差を吸収するように各マイクロホンアレイMA1、MA2についてのビームフォーマ出力X
ma1(t)及びX
ma2(t−τ)の少なくとも1つの時間軸が補正される。
【0160】
以上のようにして時間軸が揃えられたビームフォーマ出力X
ma1(t)及びX
ma2(t−τ)が目的エリア音抽出部25及び目的エリア音パワー補正係数算出部24に与えられる。
【0161】
また、目的エリア音パワー補正係数算出部24では、時間軸が揃えられたビームフォーマ出力X
ma1(t)及びX
ma2(t−τ)に基づいて、これらビームフォーマ出力X
ma1(t)及びX
ma2(t−τ)における目的エリア音のパワーを揃えるための補正係数が算出される。
【0162】
例えば2個のマイクロホンアレイMA1、MA2を使用する場合、目的エリア音パワーの補正係数は、(11)式、(12)式、又は(13)式、(14)式により算出される。
【数3】
【0163】
ここで、X
1k(n)、X
2k(n)はマイクロホンアレイMA1、MA2のビームフォーマ出力の振幅スペクトル、Nは周波数ビンの総数、kは周波数、α
1(n)、α
2(n)は各ビームフォーマ出力に対するパワー補正係数である。またmodeは最頻値、medianは中央値を表している。
【0164】
目的エリア音抽出部25は、目的エリア音パワー補正係数算出部24からの補正係数α
1(n)、α
2(n)により補正した各ビームフォーマ出力データを、(15)式、(16)式に従ってスペクトル減算を行い、目的エリア方向に存在する雑音を抽出する。つまり、補正係数α
1(n)、α
2(n)により各ビームフォーマ出力を補正し、スペクトル減算を行うことで、目的エリア方向に存在する非目的エリア音を抽出する。
【0165】
N
1(n)=X
1(n)−α
2(n)X
2(n) (15)
N
2(n)=X
2(n)−α
1(n)X
1(n) (16)
マイクロホンアレイMA1からみた目的エリア方向に存在する非目的エリア音N
1(n)を抽出するには、(15)式に示すように、マイクロホンアレイMA1のビームフォーマ出力X
1(n)からマイクロホンアレイMA2のビームフォーマ出力X
2(n)にパワー補正係数α
2を掛けたものをスペクトル減算する。同様に、(16)式に従い、マイクロホンアレイMA2からみた目的エリア方向に存在する非目的エリア音N
2(n)を抽出する。
【0166】
さらに、目的エリア音抽出部25は、抽出した雑音を各ビームフォーマ出力から(17)式、(18)式に従ってスペクトル減算することにより、目的エリア音を抽出する。ここで、γ
1(n)、γ
2(n)はスペクトル減算時の強度を変更するための係数である。
【0167】
Y
1(n)=X
1(n)−γ
1(n)N
1(n) (17)
Y
2(n)=X
2(n)−γ
2(n)N
2(n) (18)
図10は、第4の実施形態に係る収音装置20Aによるエリア収音のイメージを示すイメージ図である。
図10の点線は、特願2012−217315で提案した従来の双指向性による減算型BFの指向性を示しており、塗りつぶしてある部分が第4の実施形態の手法の指向性を示している。
【0168】
図10に示すように、各マイクロホンアレイMA1、MA2において、マイクロホンM1及びM2は目的方向に対して水平に配置し、さらにマイクロホンM1及びM2を結んだ直線と直交し、かつ、いずれかのマイクロホン(ここでは、マイクロホンM2)を通る直線上にマイクロホンM3を配置する。
【0169】
各マイクロホンアレイMA1、MA2の指向性は前方にのみ形成されるため、後方から回りこむ残響の影響を抑えることができる。また、
図10の点線で示す各マイクロホンアレイMA1、MA2の後方に位置する非目的エリア音1、2を予め抑圧することで、エリア収音のSN比を改善することができる。
【0170】
従来のエリア収音手法は、各マイクロホンアレイMA1、MA2の指向性が目的エリアでのみ重なる必要がある。そのため、従来の双指向性による減算型BFは目的方向に鋭い指向性を形成できるが、
図10に示したように目的方向に対してマイクロホンアレイMA1、MA2の前方だけでなく、後方にも直線的に指向性を形成する。そのため、2個のマイクロホンアレイMA1、MA2に挟まれたエリアを収音しようとしても、各マイクロホンアレイMA1、MA2の指向性が全て重なり、2個のマイクロホンアレイMA1、MA2を結ぶ直線上に存在する全てのエリアを収音してしまうことになる。
【0171】
しかし、第4の実施形態の場合、マイクロホンアレイMA1、MA2の指向性が目的エリアTARに対して前方にのみ形成されているため、2個のマイクロホンアレイMA1、MA2に挟まれたエリアを収音することが可能である。
【0172】
図11は、第4の実施形態に係る収音装置20Aによるエリア収音の別のイメージを示すイメージ図である。
図11では、目的エリアTARを挟んで対向する位置に、2個のマイクロホンアレイMA1、MA2を配置している。
【0173】
この場合、2個のマイクロホンアレイMA1、MA2のそれぞれ指向性を形成すると、マイクロホンアレイMA1の指向性には目的エリア音と非目的エリア音2が含まれることになる。
【0174】
また、マイクロホンアレイMA2の指向性には目的エリア音と非目的エリア音1が含まれることになる。
【0175】
各指向性に含まれる非目的エリア音成分は違うため、共通に含まれる目的エリア音のみ抽出することができる。このようなマイクロホンアレイMA1、MA2の配置でエリア収音を行うと、残響の影響を更に抑えることができる。
【0176】
つまり、2個のマイクロホンアレイMA1、MA2を用いてエリア収音する場合、特願2012−217315で提案した従来のエリア収音手法では、各マイクロホンアレイMA1、MA2の指向性の織りなす角度は90度であるのに対し、第4の実施形態の手法によれば180度となる。このため、反射した非目的エリア音が、各マイクロホンアレイMA1、MA2の指向性に同時に侵入する確率は低くなり、エリア収音性能の劣化が起こり難くなる。
【0177】
(E−3)第4の実施形態の効果
以上のように、第4の実施形態によれば、3個の全指向性マイクロホンからなるマイクロホンアレイを用いることで、目的エリアに対して前方にのみ指向性を形成し、エリア収音を行うことで、残響の影響を抑え、かつSN比を向上させることができる。
【0178】
(F)第5の実施形態
次に、本発明に係る音源分離装置、音源分離プログラム、収音装置及び収音プログラムの第5の実施形態を、図面を参照しながら詳細に説明する。
【0179】
3個のマイクロホンから構成されるマイクロホンアレイを用いる場合、双指向性や単一指向性を形成するマイクロホンの組み合わせを変えることで、指向性を形成する方向を変えることができる。
【0180】
そこで、第5の実施形態では、各マイクロホンアレイの指向性の方向を変えることで、マイクロホンアレイ自体を動かさずに別のエリアを収音することが可能となる実施形態を例示する。
【0181】
(F−1)第5の実施形態の構成
図12は、第5の実施形態に係る収音装置20Bの構成を示すブロック図であり、第4の実施形態に係る
図1との同一、対応部分には同一符号を付して示している。
【0182】
図12において、第5の実施形態に係る収音装置20Bは、第1のマイクロホンアレイMA1、第2のマイクロホンアレイMA2、データ入力部1、指向性形成部21、遅延補正部22、空間座標データ保持部23、目的エリア音パワー補正係数算出部24、目的エリア音抽出部25に加えて、エリア選択部26、エリア切替部27を備える。
【0183】
エリア選択部26は、例えばGUIなどを介してユーザが選択した目的エリアTARの情報を受け取り、エリア切替部8に与えるものである。目的エリアTARの数は、1個だけでなく、同時に複数選択することもできる。
【0184】
エリア切替部27は、エリア選択部7から与えられた目的エリアTARの情報に基づいて、空間座標データ保持部23から目的エリアTARと各マイクロホンアレイMA1、MA2と各マイクロホンアレイMA1、MA2を構成するマイクロホンM1、M2及びM3の位置情報を取得し、目的エリアTARに向けて指向性を形成するために必要なマイクロホンアレイとマイクロホンとの組み合わせを決定し、指向性形成部21へ入力される信号を制御するものである。
【0185】
(F−2)第5の実施形態の動作
第5の実施形態に係る収音装置20Bの動作は、エリア選択部26及びエリア切替部27の動作が第4の実施形態の収音装置20Aと異なるため、エリア選択部26及びエリア切替部27の動作を詳細に説明する。
【0186】
エリア選択部26は、例えばGUIなどを介してユーザが選択した1又は複数の目的エリアTARの情報を受け取り、エリア切替部27に送信する。
【0187】
エリア切替部27では、エリア選択部26から送信された目的エリアの情報をもとに、空間座標データ保持部23から選択された目的エリアTARの位置情報と、各マイクロホンアレイMA1、MA2の位置情報と、各マイクロホンアレイを構成するマイクロホンM1、M2及びM3の位置情報を取得する。また、エリア切替部27は、目的エリア向けて指向性を形成するために必要なマイクロホンアレイとマイクロホンの組み合わせを決定し、指向性形成部21へ入力される信号を制御する。
【0188】
図13は、第5の実施形態に係る3個のマイクロホンから構成されるマイクロホンアレイMA1、MA2を2個用いて、2個のエリアを切り替えて収音する状況のイメージ例を示すイメージ図である。
【0189】
マイクロホンアレイMA1は、マイクロホンM
11、MA
12及びMA
13から構成されており、マイクロホンアレイMA2は、マイクロホンM
21、MA
22及びMA
23から構成されているものとする。
【0190】
例えば、ユーザにより目的エリアAが選択されると、エリア選択部26から目的エリアAの選択情報がエリア切替部27に与えられる。エリア切替部27は、選択された目的エリアAの位置情報を空間座標データ保持部23から取得する。
【0191】
このとき、エリア選択部26から目的エリアAに指向性を形成できるマイクロホンアレイMA1及びMA2を選択し、マイクロホンアレイMA1及びMA2の位置情報と、マイクロホンアレイMA1のマイクロホンM
11、MA
12及びMA
13及びマイクロホンアレイMA2のマイクロホンM
21、MA
22及びMA
23の位置情報を空間座標データ保持部23から取得する。マイクロホンアレイMA1及びMA2の選択方法としては、例えば、複数のマイクロホンアレイが配置されている場合に、任意の2個のマイクロホンアレイMA1及びMA2を選択するようにしても良いし、予め目的エリア毎に指向性を形成できるマイクロホンアレイMA1及びMA2を決めておくようにしても良い。
【0192】
次に、エリア切替部27は、マイクロホンアレイMA1のマイクロホンM
12及びM
13と、マイクロホンアレイMA2のマイクロホンM
22及びM
23の組み合わせで双指向性を形成し、またマイクロホンアレイMA1のマイクロホンM
11及びM
12、マイクロホンアレイMA2のマイクロホンM
21及びM
22の組み合わせで単一指向性を形成するように指向性形成部21への入力信号を制御する。
【0193】
指向性形成部21は、エリア切替部27からの指示に従って、データ入力部1からの入力信号を双指向性形成部3及び単一指向性形成部4に入力するようにして、双指向性及び単一指向性を形成する。
【0194】
一方、目的エリアBが選択された場合は、マイクロホンアレイMA1のマイクロホンM
11及びM
12、マイクロホンアレイMA2のマイクロホンM
21及びM
22の組み合わせで双指向性を形成し、またマイクロホンアレイMA1のマイクロホンM
12及びM
13、マイクロホンアレイMA2のマイクロホンM
12及びM
23の組み合わせで単一指向性を形成するように指向性形成部21への入力信号を制御することで収音エリアを切り替える。この場合も、指向性形成部21は、エリア切替部27からの指示に従って、データ入力部1からの入力信号を双指向性形成部3及び単一指向性形成部4に入力するようにして、双指向性及び単一指向性を形成する。
【0195】
また、目的エリアが目的エリアAと目的エリアBとが同時に選択された場合は、エリア切替部27は、選択された目的エリア毎に、並列してマイクロホンアレイのマイクロホンの組み合わせを選択して指示する。こえにより、それぞれの選択された目的エリア毎の双指向性及び単一指向性を形成することができる。
【0196】
(F−3)第5の実施形態の効果
以上のように、第5の実施形態によれば、第4の実施形態の効果に加えて、各マイクロホンアレイの指向性の方向を変えることで、マイクロホンアレイ自体を動かさずに別のエリアを収音することが可能となる。
【0197】
(G)他の実施形態
上述した実施形態においても種々の変形実施形態を言及したが、さらに、以下に示すような変形実施形態を挙げることができる。
【0198】
上述した各実施形態において、信号加算部2を備えるものとして説明したが、目的信号抽出部6に与える入力信号を、マイクロホンM1又はM2が捕捉して得た信号とする場合には、信号加算部2を省略するようにしても良い。
【0199】
第4及び第5の実施形態では、3個のマイクロホンが直角二等辺三角形の頂点に配置されたマイクロホンアレイを用いる場合を例示したが、正三角形の頂点に配置されたマイクロホンアレイを使用するようにしても良い。この場合、指向性形成部21は、第2又は第3の実施形態で説明した信号加算部2、双指向性形成部3、単一指向性形成部4(4−1、4−2)、重複指向性消去部5、目的信号抽出部6を備え、第2又は第3の実施形態で説明した動作により目的信号を抽出するようにしても良い。
【0200】
第4及び第5の実施形態では、マイクロホンアレイが2個のものを示したが、マイクロホンアレイが3つの以上であっても良い。例えば、マイクロホンアレイが3つの場合において、第1及び第2のマイクロホンアレイからの出力から、上述した第4及び第5の実施形態の方法によって得た目的エリア音、第2及び第3のマイクロホンアレイからの出力から上記各実施形態の方法によって得た目的エリア音の計3個の目的エリア音から出力する目的エリア音を定めるようにしても良い。
【0201】
上記各実施形態では、マイクロホンが捕捉して得た音響信号をリアルタイムに処理するものを示したが、マイクロホンが捕捉して得た音響信号を記憶媒体に記憶し、その後、記憶媒体から読み出して処理して目的音、目的エリア音の強調信号を得るようにしても良い。このように記憶媒体を利用する場合には、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良い。同様に、リアルタイム処理をする場合でも、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良く、通信により信号を遠隔地に供給するようにしても良い。
【0202】
以上のような記憶媒体や通信を利用したりする場合も、本発明の収音装置の概念に含まれる。