と、第1のマイクロホンアレーに対して平行に、所望音源から見て第1のマイクロホンアレーよりも手前側に配置され、所望音源から到来する音波を観測する複数個のマイクロホンが直線的に配置された第2のマイクロホンアレーと12
を備え、複数の第1の音波信号に含まれる所望音源からの音波と複数の第2の音波信号に含まれる所望音源からの音波との関係性、および、複数の第1の音波信号に含まれる所望音源以外の音源からの音波と複数の第2の音波信号に含まれる所望音源以外の音源からの音波との関係性に基づいて、所望音源から到来する音波を抽出する。
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、
前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、
所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部と
を備える収音装置。
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
前記抽出処理部は、所定数の前記第1の音波信号に含まれる前記球面波の成分と前記第2の音波信号に含まれる前記球面波の成分との関係性、並びに、所定数の前記第1の音波信号に含まれる前記平面波の成分と前記第2の音波信号に含まれる前記平面波の成分との関係性に基づいて、前記球面波を抽出する
請求項1に記載の収音装置。
前記球面波抽出処理部により抽出された前記球面波成分波数領域信号に対して、前記第1または第2のマイクロホンアレーの各マイクロホンの位置に従った逆空間フーリエ変換を施すことにより、それらのマイクロホンの個数に応じた複数の球面波成分周波数領域信号を算出する逆空間フーリエ変換部と、
前記逆空間フーリエ変換部により求められた複数の前記球面波成分周波数領域信号の中から、音波信号として出力するために逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号を決定する信号決定部と
をさらに備え、
前記信号決定部は、複数の前記球面波成分周波数領域信号に対応する前記マイクロホンから前記所定音源までの距離に従った遅延を補償した後に和を取った信号を、前記逆高速フーリエ変換を施す対象として決定する
請求項3に記載の収音装置。
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える収音装置の収音方法において、
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出し、
所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出し、
所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求め、
所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求め、
前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出する
ステップを含む収音方法。
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える収音装置のコンピュータに実行させるプログラムにおいて、
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出し、
所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出し、
所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求め、
所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求め、
前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出する
ステップを含む処理をコンピュータに実行させるプログラム。
【発明を実施するための形態】
【0017】
以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
【0018】
図1は、本技術を適用した収音装置の一実施の形態の構成例を示すブロック図である。
【0019】
図1に示すように、収音装置11は、2つのマイクロホンアレー12
1および12
2、並びに、音波抽出処理部13を備えて構成される。そして、収音装置11は、所望音源から到来する音波と、所望音源以外の音源から到来する音波との両方が含まれる音波から、所望音源からの音波を抽出(または強調)して出力する。
【0020】
マイクロホンアレー12
1および12
2は、それぞれ同様に、所定個数のマイクロホン素子が直線的に並べられて構成される。即ち、マイクロホンアレー12
1は、M個のマイクロホン素子21
1−1乃至21
1−Mが直線アレー状に並べられて構成され、マイクロホンアレー12
2は、M個のマイクロホン素子21
2−1乃至21
2−Mが直線アレー状に並べられて構成される。
【0021】
また、マイクロホンアレー12
1および12
2は、互いに平行になるように配置される。そして、マイクロホンアレー12
2が、所望音源から見てマイクロホンアレー12
1よりも手前側に、例えば、
図1に示すように所望音源が左側にあるときにはマイクロホンアレー12
1の左側に配置される。
【0022】
マイクロホン素子21
1−1乃至21
1−M、およびマイクロホン素子21
2−1乃至21
2−Mはそれぞれ、音波によって発生する振動板などの機械的な振動を、電気的な信号(音波信号)に変換する。つまり、マイクロホン素子21
1−1乃至21
1−M、およびマイクロホン素子21
2−1乃至21
2−Mは、所望音源から到来する音波と、所望音源以外の音源から到来する音波との両方が含まれる音波を観測して得られる音波信号を出力する。
【0023】
音波抽出処理部13は、M個の高速フーリエ変換部31
1−1乃至31
1−M、M個の高速フーリエ変換部31
2−1乃至31
2−M、2つの空間フーリエ変換部32
1および32
2、球面波抽出処理部33、逆空間フーリエ変換部34、信号決定部35、および逆高速フーリエ変換部36を備えて構成される。
【0024】
高速フーリエ変換部31
1−1乃至31
1−Mはそれぞれ、マイクロホン素子21
1−1乃至21
1−Mから供給される音波信号に対して高速フーリエ変換を施し、その結果得られる周波数領域信号を空間フーリエ変換部32
1に供給する。同様に、高速フーリエ変換部31
2−1乃至31
2−Mはそれぞれ、マイクロホン素子21
2−1乃至21
2−Mから供給される音波信号に対して高速フーリエ変換を施し、その結果得られる周波数領域信号を空間フーリエ変換部32
2に供給する。
【0025】
空間フーリエ変換部32
1は、高速フーリエ変換部31
1−1乃至31
1−Mから供給される周波数領域信号に対してマイクロホン素子21
1−1乃至21
1−Mの位置に従った空間フーリエ変換を施し、その結果得られる波数領域信号を球面波抽出処理部33に供給する。同様に、空間フーリエ変換部32
2は、高速フーリエ変換部31
2−1乃至31
2−Mから供給される周波数領域信号に対してマイクロホン素子21
2−1乃至21
2−Mの位置に従った空間フーリエ変換を施し、その結果得られる波数領域信号を球面波抽出処理部33に供給する。
【0026】
球面波抽出処理部33は、空間フーリエ変換部32
1から供給される波数領域信号と、空間フーリエ変換部32
2から供給される波数領域信号とを用いて、所望音源から到来した音波信号に基づく波数領域信号を抽出する。
【0027】
ここで、収音装置11において観測される音波について説明する。例えば、収音装置11によって抽出の対象となる音波を発する所望音源が収音装置11の近傍となる位置にあり、所望音源以外の音源であって、雑音として処理する音波の音源(以下、適宜、雑音源と称する)が、所望音源よりも遠い位置にあるとする。このとき、収音装置11では、所望音源から到来する音波は、球面状に広がりながら伝播している状態で観測され、雑音源から到来する音波は十分に広がっていて平面状に伝搬する状態で観測される。即ち、収音装置11では、所望音源からの音波は球面波として観測され、雑音源からの音波は平面波として観測される。従って、球面波抽出処理部33に供給される波数領域信号には、平面波に対応する成分と、球面波に対応する成分との両方が含まれたものとなっている。
【0028】
そこで、球面波抽出処理部33は、空間フーリエ変換部32
1から供給される波数領域信号に含まれる平面波に対応する成分と、空間フーリエ変換部32
2から供給される波数領域信号に含まれる平面波に対応する成分との関係性、並びに、空間フーリエ変換部32
1から供給される波数領域信号に含まれる球面波に対応する成分と、空間フーリエ変換部32
2から供給される波数領域信号に含まれる球面波に対応する成分との関係性に基づいて、球面波の成分を抽出する処理を行う。そして、球面波抽出処理部33は、波数領域信号に含まれる球面波に対応する成分、即ち、その球面波が空間フーリエ変換された球面波成分波数領域信号を、逆空間フーリエ変換部34に供給する。
【0029】
逆空間フーリエ変換部34は、球面波抽出処理部33から供給される球面波成分波数領域信号に対して逆空間フーリエ変換を施し、その結果得される球面波成分周波数領域信号を信号決定部35に供給する。例えば、マイクロホンアレー12
1において観測された球面波を抽出する場合、逆空間フーリエ変換部34は、マイクロホン素子21
1−1乃至21
1−Mの位置に従った逆空間フーリエ変換を行うことにより、マイクロホン素子21
1−1乃至21
1−Mの個数(即ち、M個)に応じた複数の球面波成分周波数領域信号を算出する。
【0030】
信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号の中から、音波信号として出力するために逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号を決定する。例えば、信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号のうちの、任意の位置(例えば、中央の位置)にあるマイクロホン素子21
1に対応する球面波成分周波数領域信号を、逆高速フーリエ変換を施す対象として決定する。
【0031】
逆高速フーリエ変換部36は、信号決定部35により決定された球面波成分周波数領域信号に対して逆高速フーリエ変換を施し、その結果得られる球面波の音波信号を、図示しない後段の装置(例えば、音声認識装置や録音装置など)に出力する。
【0032】
このように構成される収音装置11では、マイクロホンアレー12
1および12
2の近傍にある所望音源からの音波と、遠方にある雑音源からの音波とが混在する中から、所望音源からの音波を、より確実に抽出することができる。このように、複数の位置から発生した複数の音の中から,任意の場所にある音を抽出することで、電話や、テレビ電話、テレビ中継、会話録音などにおいて、周囲の雑音による悪影響を排除することができ、例えば、音声認識率の低下を抑制することができる。
【0033】
次に、球面波抽出処理部33が球面波を抽出する処理について、数式を用いて詳細に説明する。
【0034】
まず、
図1に示すように、マイクロホンアレー12
1および12
2においてマイクロホン素子21が直線的に並ぶ方向を、X軸方向と設定する。また、X軸方向に対して直交する方向、即ち、平行に配置されるマイクロホンアレー12
1および12
2の間隔方向を、Y軸方向と設定する。なお、
図1において紙面に対して垂直方向となるZ方向については、所望音源とマイクロホンアレー12
1および12
2とが同一となるZ方向の位置(高さ)に配置されているものとし、以下の説明では、Z方向のパラメータは省略するものとする。
【0035】
また、マイクロホンアレー12
1および12
2それぞれにおけるマイクロホン素子21どうしは、X軸方向に間隔d
xとなるように配置され、マイクロホンアレー12
1および12
2は、Y軸方向に間隔d
yとなるように配置される。また、所望音源は、マイクロホンアレー12
1の中心位置を基準(0,0)としたとき、位置(x
r,y
r)に配置される。また、雑音としての平面波は、X軸方向に対して角度θとなるように所望音源よりも遠方から飛来する。
【0036】
なお、以下の説明では、音波はそれぞれ単一の周波数にフーリエ変換などにより分解されているものとして扱い、さらに単一の周波数音を表す関数exp(jωt)は省略する。ここで、ωは角周波数であり、角周波数ωと周波数fとには、ω=2πfの関係がある。また、全帯域に渡る信号として合成するときは、周波数ごとの処理を終えた後に逆フーリエ変換を施すことで合成可能である。
【0037】
そして、マイクロホンアレー12
1で観測される音波信号が、高速フーリエ変換部31
1−1乃至31
1−Mにおいて高速フーリエ変換が施されることにより得られる周波数領域信号D
1は、次の式(1)で表される。同様に、マイクロホンアレー12
2で観測される音波信号が、高速フーリエ変換部31
2−1乃至31
2−Mにおいて高速フーリエ変換が施されることにより得られる周波数領域信号D
2は、次の式(2)で表される。
【0039】
即ち、周波数領域信号D
1は、式(1)に示すように、音波信号に含まれる平面波の成分が高速フーリエ変換された平面波成分周波数領域信号P
1と、音波信号に含まれる球面波の成分が高速フーリエ変換された球面波成分周波数領域信号Q
1とが重畳されたものとして表される。同様に、周波数領域信号D
2は、式(2)に示すように、音波信号に含まれる平面波の成分が高速フーリエ変換された平面波成分周波数領域信号P
2と、音波信号に含まれる球面波の成分が高速フーリエ変換された球面波成分周波数領域信号Q
2とが重畳されたものとして表される。
【0040】
ここで、式(1)において、1つめの引数は、マイクロホンアレー12
1を構成するマイクロホン素子21
1−1乃至21
1−MそれぞれのX軸方向の位置xを表す。同様に、式(2)において、1つめの引数は、マイクロホンアレー12
2を構成するマイクロホン素子21
2−1乃至21
2−MそれぞれのX軸方向の位置xを表す。また、式(1)および式(2)において、2つめの引数は、マイクロホンアレー12
1および12
2それぞれのY軸方向の位置を表す。ここでは、マイクロホンアレー12
1の位置をY軸方向の基準とし、式(1)に示すように、マイクロホンアレー12
1のY軸方向の位置は0となり、式(2)に示すように、マイクロホンアレー12
2のY軸方向の位置は間隔d
yとなる。
【0041】
また、平面波成分周波数領域信号P
1およびP
2は、
図1に示すように角度θから平面波が到来することより、雑音源からの音の大きさを表すパラメータA、X軸方向のトレース波長k
x、およびY軸方向のトレース波長k
yを用いて、次の式(3)および式(4)で表すことができる。
【0043】
ここで、X軸方向のトレース波長k
xは、音の周波数で決定される波数k=ω/c(ω:角周波数、c:音速)との間に、次の式(5)に示す関係を有する。また、Y軸方向のトレース波長k
yは、X軸方向のトレース波長k
xおよび波数kとの間に、次の式(6)に示す関係を有する。
【0045】
一方、球面波成分周波数領域信号Q
1は、
図1に示すように位置(x
r,y
r)から球面波が到来することより、所望音源からの音の大きさを表すパラメータB、および、所望音源から位置xにあるマイクロホン素子21
1までの距離r
1(x)を用いて、次の式(7)で表すことができる。同様に、球面波成分周波数領域信号Q
2は、所望音源からの音の大きさを表すパラメータB、および、所望音源から位置xにあるマイクロホン素子21
2までの距離r
2(x)を用いて、次の式(8)で表すことができる。
【0047】
また、距離r
1(x)および距離r
2(x)は、所望音源の位置(x
r,y
r)を用いて、次の式(9)および式(10)で表される。
【0049】
ところで、式(1)および式(2)に示したように、マイクロホンアレー12
1および12
2で観測される音波信号が高速フーリエ変換された周波数領域信号D
1およびD
2は、平面波と球面波とが混在した波形である。このため、音波抽出処理部13において、周波数領域信号D
1およびD
2から球面波成分周波数領域信号Q
1またはQ
2を抽出するために、まず、周波数領域信号D
1およびD
2をX軸方向に沿って空間フーリエ変換が施される。このような空間フーリエ変換を施す際には、マイクロホン素子21どうしのX軸方向の間隔d
xが一定のものである必要がある。なお、周波数領域信号D
1およびD
2に対して、通常のフーリエ変換処理と同様に、ハニング窓などによる窓掛けを行うことで、両端のマイクロホン素子21で観測した信号のレベルを小さくし、両端が滑らかに小さくなり区間外につながるように処理することができる。
【0050】
ここで、X軸方向に沿った空間フーリエ変換を、次の式(11)のように定義する。
【0052】
但し、式(11)は、例えば、周波数領域信号S(x,y)をX軸方向に沿って空間フーリエ変換して得られる波数領域信号S’(x,y)を表しており、式(11)において、Mは、マイクロホン素子21がX軸方向に並ぶ個数である。また、式(11)において、k’
xは、X軸方向のトレース波長k
xを逆フーリエ変換するときの変数であり、あらゆる値をとることができる。
【0053】
このようにX軸方向に沿った空間フーリエ変換を定義すると、周波数領域信号D
1に対して空間フーリエ変換が施された結果得られる波数領域信号D
1’は、次の式(12)で表される。また、周波数領域信号D
2に対して空間フーリエ変換が施された結果得られる波数領域信号D
2’は、次の式(13)で表される。
【0055】
同様に、平面波成分周波数領域信号P
1に対して空間フーリエ変換が施された結果得られる平面波成分波数領域信号P
1’は、次の式(14)で表される。また、平面波成分周波数領域信号P
2に対して空間フーリエ変換が施された結果得られる平面波成分波数領域信号P
2’は、次の式(15)で表される。
【0057】
ここで、式(14)および式(15)において、δは、デルタ関数である。
【0058】
さらに、球面波成分周波数領域信号Q
1に対して空間フーリエ変換が施された結果得られる球面波成分波数領域信号Q
1’は、次の式(16)で表される。また、球面波成分周波数領域信号Q
2に対して空間フーリエ変換が施された結果得られる球面波成分波数領域信号Q
2’は、所望音源のY軸方向の位置y
rを用いて、次の式(17)で表される。
【0060】
ここで、式(16)および式(17)において、H
0(2)は、0次の第二種ハンケル関数であり、K
0は、0次の変形ベッセル関数である。また、式(16)および式(17)に示すように、球面波成分波数領域信号Q
1’およびQ
2’は、変数k’
xとの絶対値、波数kの絶対値との大小関係に従って異なるものとなる。
【0061】
次に、マイクロホンアレー12
1により観測される音波の平面波の成分と、マイクロホンアレー12
2により観測される音波の平面波の成分との関係性、および、マイクロホンアレー12
1により観測される音波の球面波の成分と、マイクロホンアレー12
2により観測される音波の球面波の成分との関係性について考える。つまり、上述の式(14)および式(15)から、雑音源からの音の大きさを表すパラメータAを消去すると、次の式(18)に示す関係が成り立つ。同様に、上述の式(16)および式(17)から、所望音源からの音の大きさを表すパラメータBを消去すると、次の式(19)に示す関係が成り立つ。
【0063】
そして、式(18)および式(19)に示す関係に基づいて、上述した式(13)は、次の式(20)で表すことができる。
【0065】
ここで、式(20)において、G
0は、上述したような変数k’
xの絶対値と波数kの絶対値との大小関係に従って、0次の第二種ハンケル関数H
0(2)および0次の変形ベッセル関数K
0のいずれか一方に置き換わる関数である。
【0066】
そして、この式(20)と、上述の式(12)とを用いて、連立方程式が成り立つことより、球面波抽出処理部33は、次の式(21)を演算することで、球面波成分波数領域信号Q
1’を抽出することができる。
【0068】
その後、逆空間フーリエ変換部34は、球面波抽出処理部33が式(21)を演算した結果得られる球面波成分波数領域信号Q
1’に対して逆空間フーリエ変換を施すことで、球面波成分周波数領域信号Q
1を求めることができる。そして、逆高速フーリエ変換部36は、逆空間フーリエ変換部34が求めた、球面波成分周波数領域信号Q
1に対して逆高速フーリエ変換を施すことで、音波信号に含まれていた球面波の成分を出力することができる。
【0069】
以上のように、音波抽出処理部13では、マイクロホンアレー12
1および12
2により観測される音波に含まれる平面波の関係性と球面波の関係性とに基づいて、球面波の成分を抽出すること、即ち、所望音源からの音波を抽出することができる。
【0070】
ところで、上述したように、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号のうち、逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号が、信号決定部35により決定される。このとき、信号決定部35は、任意の位置にあるマイクロホン素子21に対応する球面波成分周波数領域信号を逆高速フーリエ変換の対象として決定する他、例えば、複数の球面波成分周波数領域信号それぞれのタイミングを合わせた後に合算した信号を、逆高速フーリエ変換の対象として決定してもよい。つまり、所望音源から球面状に広がる球面波は、直線的に配置されたマイクロホン素子21において、所望音源との距離に従って、所望音源から遠いマイクロホン素子21では、所望音源に近いマイクロホン素子21よりも遅延して観測される。
【0071】
そこで、例えば、信号決定部35は、所望音源の位置を仮定し、その位置からマイクロホン素子21
1−1乃至21
1−Mそれぞれに音波が到達するまでの遅延を考慮した遅延和アレーを構成する。そして、信号決定部35は、それぞれの遅延を補償した後に和を取った信号を、逆高速フーリエ変換の対象として決定することができる。
【0072】
ここで、遅延和アレーについて説明する。例えば、所望音源が位置(x
r,y
r)に配置されていると仮定したとき、所望音源からマイクロホン素子21
1−1乃至21
1−Mそれぞれまでの距離r
1(x)は、次の式(22)で表される。また、所望音源からマイクロホン素子21
1−1乃至21
1−Mそれぞれに到達する時間差τ(x)は、音速cを用いて、次の式(23)で表される。
【0074】
従って、信号決定部35は、この時間差τ(x)を補償する逆時間伝達関数exp(jωτ(x))を、マイクロホン素子21
1−1乃至21
1−Mそれぞれの位置に応じて求められる球面波成分波数領域信号Q
1’に対し、それぞれ対応する位置xで掛け合わせて和を取った信号を算出し、逆高速フーリエ変換の対象として決定することができる。
【0075】
このように、信号決定部35において遅延和アレーを用いて、音波信号として出力するために逆高速フーリエ変換の対象とする球面波成分波数領域信号Q
1’を算出することで、球面波の成分を増幅することができ、例えば、SN比を向上させることができる。
【0076】
ところで、上述の式(20)における平面波についてのマイクロホンアレー12
1および12
2の間の関係を表す関数を関係関数E(k’
x,d
y)とすると、関係関数E(k’
x,d
y)は、次の式(24)で表される。
【0078】
同様に、上述の式(20)における球面波についてのマイクロホンアレー12
1および12
2の間の関係を表す関数を関係関数F(k’
x,d
y)とすると、関係関数F(k’
x,d
y)は、次の式(25)で表される。そして、上述した変数k’
xの絶対値と波数kの絶対値との大小関係に従って、第二種ハンケル関数および変形ベッセル関数に置き換わる関数G
0を用いると、関係関数F(k’
x,d
y)は、次の式(26)で表される。
【0080】
従って、この式(24)および式(26)より、上述の式(20)は、次の式(27)と表すことができる。
【0082】
そして、この式(27)と、上述の式(12)との連立方程式に基づいて、球面波成分波数領域信号Q
1’は、次の式(28)と表すことができる。
【0084】
ここで、上述したように、関係関数E(k’
x,d
y)は、平面波についてのマイクロホンアレー12
1および12
2の間の関係を表すものであり、関係関数F(k’
x,d
y)は、球面波についてのマイクロホンアレー12
1および12
2の間の関係を表すものである。従って、マイクロホンアレー12
1および12
2の関係が固定のものであれば、それらの関係は変化することはないことより、関係関数E(k’
x,d
y)および関係関数F(k’
x,d
y)を演算することにより求められる出力値として、事前の観測などにより求められた値を使用することができる。
【0085】
具体的には、収音装置11を用いて事前に、平面波のみが観測される状態において、あらゆる角度θから到来する平面波を観測し、それらの角度θごとの変数k’
xを平面波成分波数領域信号P
1’およびP
2’に入力して、次の式(29)を演算することにより、関係関数E(k’
x,d
y)の出力値を求めることができる。同様に、収音装置11を用いて事前に、球面波のみが観測される状態において、あらゆる角度θおよび位置y
rから到来する球面波を観測し、それらの角度θごとの変数k’
xおよび位置y
rを球面波成分波数領域信号Q
1’およびQ
2’に入力して、次の式(30)を演算することにより、関係関数F(k’
x,d
y)の出力値を求めることができる。
【0087】
そして、球面波抽出処理部33は、このように予め求めてある関係関数E(k’
x,d
y)および関係関数F(k’
x,d
y)の出力値を保持しておき、上述した式(28)を演算することにより、球面波成分波数領域信号Q
1’を求めることができる。
【0088】
このように、収音装置11では、抽出する音波を観測する時に、上述の式(24)および式(26)を演算することにより求められる関係関数E(k’
x,d
y)および関係関数F(k’
x,d
y)を用いる他、事前の計測などにより取得された関係関数E(k’
x,d
y)および関係関数F(k’
x,d
y)の出力値を用いて、所望音源からの音波を抽出してもよい。
【0089】
次に、
図2乃至5を参照して、収音装置11により所望音源を抽出する効果について、空間感度分布図を用いて説明する。空間感度分布図は、位置(x,y)にある音をマイクロホンで収音した時に、どれくらいの大きさとしてその音を収音できるかを示すものである。
【0090】
図2には、単一の無指向性マイクロホンの空間感度分布図が示されている。
図2において、マイクロホンが位置(0,0)に配置されており、空間感度分布図は等高線図として表されている。
図2の空間感度分布図では、例えば、音源がマイクロホンから1.5m離れていると-30dB小さな音として収音されることが表されている。
【0091】
図3乃至5には、収音装置11の空間感度分布図が示されている。これらの空間感度分布図は、マイクロホンアレー12
1および12
2が、10cmの間隔で離れて配置(間隔d
y=10cm)され、マイクロホンアレー12
1および12
2には、64個のマイクロホン素子21がX軸方向に5cm間隔で配置(間隔d
x=5cm)されたとして、計算機シミュレーションにより求めたものである。なお、マイクロホンアレー12
1の中心を位置(0,0)とする。
【0092】
また、空間感度分布は、周波数ごとに特性が異なるため、代表的な周波数として人間の声にとって重要な周波数(500Hz,1kHz,2kHz)について示されている。つまり、
図3には、収音する音の周波数が500Hzであるときの空間感度分布図が示されている。また、
図4には、収音する音の周波数が1kHzであるときの空間感度分布図が示されており、
図5には、収音する音の周波数が2kHzであるときの空間感度分布図が示されている。
【0093】
図3乃至5に示すように、収音装置11は、所定距離より離れた位置にある音源からの音が小さくなったものとして収音することができる。例えば、
図3に示すように、収音装置11は、収音する音の周波数が500Hzであるとき、0.75m離れた位置にある音源については-30dB以上、音の大きさが小さくなったものとして収音することができる。このように、近い音と遠い音が混在していても、マイクロホンアレー12
1および12
2に近い音のみを抽出することができることが示されている。なお、
図4および
図5に示すように、収音する音の周波数が1kHzおよび2kHzであるとき、より大きな差で、マイクロホンアレー12
1および12
2に近い音のみを抽出することができる。
【0094】
このように、収音装置11では、遠方から到来する雑音(平面波)を抑制し、マイクロホンアレー12
1および12
2の近傍にある所望音源から到来する音(球面波)のみを抽出することができる。
【0095】
次に、
図6は、
図1の収音装置11が所望音源からの音を抽出する処理を説明するフローチャートである。
【0096】
例えば、マイクロホンアレー12
1および12
2により音波が観測されて、マイクロホン素子21
1−1乃至21
1−Mから高速フーリエ変換部31
1−1乃至31
1−Mに音波信号が供給され、マイクロホン素子21
2−1乃至21
2−Mから高速フーリエ変換部31
2−1乃至31
2−Mに音波信号が供給されると処理が開始される。
【0097】
ステップS11において、高速フーリエ変換部31
1−1乃至31
1−Mは、マイクロホン素子21
1−1乃至21
1−Mから供給される音波信号に対して高速フーリエ変換を施した周波数領域信号を空間フーリエ変換部32
1に供給する。同様に、高速フーリエ変換部31
2−1乃至31
2−Mは、マイクロホン素子21
2−1乃至21
2−Mから供給される音波信号に対して高速フーリエ変換を施した周波数領域信号を空間フーリエ変換部32
2に供給する。
【0098】
ステップS12において、空間フーリエ変換部32
1は、高速フーリエ変換部31
1−1乃至31
1−Mから供給される周波数領域信号に対してマイクロホン素子21
1−1乃至21
1−Mの位置に従った空間フーリエ変換を施した波数領域信号を球面波抽出処理部33に供給する。同様に、空間フーリエ変換部32
2は、高速フーリエ変換部31
2−1乃至31
2−Mから供給される周波数領域信号に対してマイクロホン素子21
2−1乃至21
2−Mの位置に従った空間フーリエ変換を施した波数領域信号を球面波抽出処理部33に供給する。
【0099】
ステップS13において、球面波抽出処理部33は、空間フーリエ変換部32
1から供給される波数領域信号と、空間フーリエ変換部32
2から供給される波数領域信号とを用いて、所望音源から到来した音波信号に基づく波数領域信号を抽出する。例えば、球面波抽出処理部33は、上述した次の式(21)を演算することで、マイクロホンアレー12
1から出力される音波信号に含まれる球面波成分波数領域信号Q
1’を抽出することができる。
【0100】
ステップS14において、逆空間フーリエ変換部34は、球面波抽出処理部33から供給される球面波成分波数領域信号に対して、マイクロホン素子21
1−1乃至21
1−Mの位置に従った逆空間フーリエ変換を施して複数の球面波成分周波数領域信号を算出する。
【0101】
ステップS15において、信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号に対して、上述したような遅延和アレーを用いて求められる球面波成分周波数領域信号を、音波信号として出力するために逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象として決定する。
【0102】
ステップS16において、逆高速フーリエ変換部36は、信号決定部35により決定された球面波成分周波数領域信号に対して逆高速フーリエ変換を施し、その結果得られる球面波の音波信号を出力する。
【0103】
以上のように、音波抽出処理部13は、マイクロホンアレー12
1および12
2により観測される音波信号に含まれている球面波の成分、即ち、所望音源からの音波を抽出することができる。つまり、収音装置11では、これまで人の声を抽出するために利用されてきた直線マイクロホンアレーを基礎としながら、音響ホログラフィの考え方を導入することで、2次元平面ではなく、前後に2つ並んだマイクロホンアレー12
1および12
2を利用して、所望音源からの音波を抽出することができる。
【0104】
特に、収音装置11では、所望音源と雑音源とが同一方向にある場合であっても、球面波と平面波との関係に基づいて、所望音源からの音を抽出することができる。具体的には、収音装置11を自動販売機に採用して、例えば、自動販売機に近い発話のみを収音することにより、自動販売機による音声認識率の向上を図ることができる。また、収音装置11は、例えば、ドライブスルーなどの発話注文において、店員が音声を聞き取るのにも活用することができる。さらに、収音装置11をテレビ会議などに採用することで、参加者のみの声を捉え、ある程度離れた距離の音は収音しないようにすることができる。
【0105】
このように、収音装置11は、複数の位置から発生した複数の音の中から、任意の場所にある音を抽出することができ、電話や、テレビ電話、テレビ中継、会話録音などのように音を収音する技術に適用することができる。
【0106】
なお、本実施の形態においては、所望音源を、収音装置11から所定距離の近い位置にあるものとして説明を行ったが、例えば、収音装置11から離れた遠い位置にあるものとして、その遠い所望音源からの音を抽出してもよい。即ち、上述の式(21)を演算して球面波成分波数領域信号Q
1’を求めるのに替えて、上述の式(12)および式(20)を用いた連立方程式において平面波成分波数領域信号P
1’を求めるようにすることで、遠い所望音源から到来する平面波を抽出することができる。
【0107】
なお、上述のフローチャートを参照して説明した各処理は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。また、プログラムは、1のCPUにより処理されるものであってもよいし、複数のCPUによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。
【0108】
また、上述した一連の処理(情報処理方法)は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラムが記録されたプログラム記録媒体からインストールされる。
【0109】
図7は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
【0110】
コンピュータにおいて、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
【0111】
バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
【0112】
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105及びバス104を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。
【0113】
コンピュータ(CPU101)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア111に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0114】
そして、プログラムは、リムーバブルメディア111をドライブ110に装着することにより、入出力インタフェース105を介して、記憶部108にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
【0115】
なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。