特開2015-164267(P2015-164267A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人電気通信大学の特許一覧

特開2015-164267収音装置および収音方法、並びにプログラム
<>
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000038
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000039
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000040
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000041
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000042
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000043
  • 特開2015164267-収音装置および収音方法、並びにプログラム 図000044
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-164267(P2015-164267A)
(43)【公開日】2015年9月10日
(54)【発明の名称】収音装置および収音方法、並びにプログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20150814BHJP
   H04R 1/40 20060101ALI20150814BHJP
   G10L 15/20 20060101ALI20150814BHJP
   G10L 21/0272 20130101ALI20150814BHJP
   G10L 21/028 20130101ALI20150814BHJP
   G10L 21/0232 20130101ALI20150814BHJP
   G10L 21/0264 20130101ALI20150814BHJP
   G10L 21/0308 20130101ALI20150814BHJP
【FI】
   H04R3/00 320
   H04R1/40 320B
   G10L15/20 370D
   G10L21/0272 100A
   G10L21/028 B
   G10L21/0232
   G10L21/0264 Z
   G10L21/0308 Z
   H04R1/40 320A
【審査請求】未請求
【請求項の数】12
【出願形態】OL
【全頁数】24
(21)【出願番号】特願2014-39642(P2014-39642)
(22)【出願日】2014年2月28日
(71)【出願人】
【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
(74)【代理人】
【識別番号】100082131
【弁理士】
【氏名又は名称】稲本 義雄
(74)【代理人】
【識別番号】100121131
【弁理士】
【氏名又は名称】西川 孝
(72)【発明者】
【氏名】羽田 陽一
(72)【発明者】
【氏名】戀川 真己
【テーマコード(参考)】
5D018
5D220
【Fターム(参考)】
5D018BB23
5D220BA06
5D220BB04
5D220BC05
(57)【要約】      (修正有)
【課題】所望音源からの音波をより確実に抽出して音声認識装置に出力する収音装置を提供する。
【解決手段】収音装置11は、所望音源から到来する音波を観測する複数個のマイクロホンが直線的に配置された第1のマイクロホンアレー12と、第1のマイクロホンアレーに対して平行に、所望音源から見て第1のマイクロホンアレーよりも手前側に配置され、所望音源から到来する音波を観測する複数個のマイクロホンが直線的に配置された第2のマイクロホンアレーと12を備え、複数の第1の音波信号に含まれる所望音源からの音波と複数の第2の音波信号に含まれる所望音源からの音波との関係性、および、複数の第1の音波信号に含まれる所望音源以外の音源からの音波と複数の第2の音波信号に含まれる所望音源以外の音源からの音波との関係性に基づいて、所望音源から到来する音波を抽出する。
【選択図】図1
【特許請求の範囲】
【請求項1】
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、
前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、
所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部と
を備える収音装置。
【請求項2】
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
前記抽出処理部は、所定数の前記第1の音波信号に含まれる前記球面波の成分と前記第2の音波信号に含まれる前記球面波の成分との関係性、並びに、所定数の前記第1の音波信号に含まれる前記平面波の成分と前記第2の音波信号に含まれる前記平面波の成分との関係性に基づいて、前記球面波を抽出する
請求項1に記載の収音装置。
【請求項3】
前記抽出処理部は、
所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出する所定個数の第1の高速フーリエ変換部と、
所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出する所定個数の第2の高速フーリエ変換部と、
所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求める第1の空間フーリエ変換部と、
所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求める第2の空間フーリエ変換部と、
前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出する球面波抽出処理部と
を有する請求項2に記載の収音装置。
【請求項4】
前記球面波抽出処理部は、以下の式(1)を演算することにより、前記第1の音波信号に含まれる前記球面波の成分が空間フーリエ変換された第1の球面波成分波数領域信号を算出する
【数1】
但し、前記式(1)において、Q’(k’,0)は、前記第1の球面波成分波数領域信号を示し、D’(k’,0)は、前記第1の波数領域信号を示し、D’(k’,d)は、前記第2の波数領域信号を示し、E(k’,0)は、前記第1の音波信号に含まれる前記平面波と前記第2の音波信号に含まれる前記平面波との関係性を表す平面波関係関数を示し、F(k’,d)は、前記第2の音波信号に含まれる前記球面波と前記第2の音波信号に含まれる前記球面波との関係性を表す球面波関係関数を示し、dは、前記第1のマイクロホンアレーおよび前記第2のマイクロホンアレーの間隔を示し、kは、前記第1のマイクロホンアレーおよび前記第2のマイクロホンアレーがX軸方向に平行であるとしたときの波数を示し、k’は、前記波数kを逆空間フーリエ変換するときの変数を示す
請求項3に記載の収音装置。
【請求項5】
前記平面波関係関数は、以下の式(2)で表される
【数2】
但し、前記式(2)において、P’(k’,0)は、前記第1の平面波成分波数領域信号を示し、P’(k’,d)は、前記第2の平面波成分波数領域信号を示す
請求項4に記載の収音装置。
【請求項6】
前記平面波関係関数の出力値は、平面波のみが観測される状態において得られる前記第1の平面波成分波数領域信号および前記第2の平面波成分波数領域信号を用いて、事前に求めることができ、以下の式(3)で求められる
【数3】
但し、前記式(3)において、P’(k’,0)は、事前に行われる観測により得られた前記第1の平面波成分波数領域信号を示し、P’(k’,d)は、事前に行われる観測により得られた前記第2の平面波成分波数領域信号を示す
請求項4に記載の収音装置。
【請求項7】
前記球面波関係関数は、波数の大きさにより、以下の式(4)で表される
【数4】
但し、前記式(4)において、Q’(k’,0)は、前記第1の球面波成分波数領域信号を示し、Q’(k’,d)は、前記第2の球面波成分波数領域信号を示し、H(2)は、0次の第二種ハンケル関数を示し、Kは、0次の変形ベッセル関数を示し、yは、前記所望音源のY軸方向の位置を示す
請求項4に記載の収音装置。
【請求項8】
前記球面波関係関数の出力値は、球面波のみが観測される状態において得られる前記第1の球面波成分波数領域信号および前記第2の球面波成分波数領域信号を用いて、事前に求めることができ、以下の式(5)で求められる
【数5】
但し、前記式(5)において、Q’(k’,0)は、事前に行われる観測により得られた前記第1の球面波成分波数領域信号を示し、Q’(k’,d)は、事前に行われる観測により得られた前記第2の球面波成分波数領域信号を示す
請求項4に記載の収音装置。
【請求項9】
前記球面波抽出処理部により抽出された前記球面波成分波数領域信号に対して、前記第1または第2のマイクロホンアレーの各マイクロホンの位置に従った逆空間フーリエ変換を施すことにより、それらのマイクロホンの個数に応じた複数の球面波成分周波数領域信号を算出する逆空間フーリエ変換部と、
前記逆空間フーリエ変換部により求められた複数の前記球面波成分周波数領域信号の中から、音波信号として出力するために逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号を決定する信号決定部と
をさらに備え、
前記信号決定部は、複数の前記球面波成分周波数領域信号に対応する前記マイクロホンから前記所定音源までの距離に従った遅延を補償した後に和を取った信号を、前記逆高速フーリエ変換を施す対象として決定する
請求項3に記載の収音装置。
【請求項10】
前記第1および第2の空間フーリエ変換部は、前記第1および第2の周波数領域信号に対して、それぞれ窓関数を施した後に、空間フーリエ変換を行う
請求項3に記載の収音装置。
【請求項11】
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える収音装置の収音方法において、
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出し、
所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出し、
所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求め、
所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求め、
前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出する
ステップを含む収音方法。
【請求項12】
直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える収音装置のコンピュータに実行させるプログラムにおいて、
前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、
所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出し、
所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出し、
所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求め、
所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求め、
前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出する
ステップを含む処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、収音装置および収音方法、並びにプログラムに関し、特に、所望の音源からの音波をより確実に抽出することができるようにした収音装置および収音方法、並びにプログラムに関する。
【背景技術】
【0002】
従来、マイクロホンで音を受けて電気信号として捉える収音を行う収音装置において、周囲の雑音による悪影響を排除するために、所望の音源から到来する音を抽出(あるいは強調)する技術が用いられている。例えば、周囲の雑音は、音声認識技術における音声認識率の低下の原因となったり、テレビ会議システムにおける了解性の低下や臨場感の欠如などの原因となっていた。
【0003】
そこで、これらの原因を解決するために、マイクロホンを複数並べたマイクロホンアレー処理技術を利用する研究が以前から行われている。例えば、マイクロホンアレー処理技術では、人間の声などの所望の音源からの音と、エアコンの音や、周囲の話し声、テレビやラジオから流れる音などの雑音とにおいて、マイクロホンアレーに到来する入射角が異なることを利用して、アレー処理が行われる。
【0004】
例えば、特許文献1には、二次元平面マイクロホンアレーで収音した信号を、空間フーリエ変換領域処理することで、音源信号などを高いSN比(Signal to Noise ratio)で抽出する技術が開示されている。
【0005】
ところが、通常の環境においては、雑音が話者の背面にあることも多く、例えば、音声認識で購入可能な自動販売機などを想定すると、自動販売機の購入者の後ろでは、車が往来している音や、通行人の声、街頭アナウンスなど、ありとあらゆる方向から音が到来する環境となる。このように、所望の音源からの音と雑音とが同一の方向から到来するような環境では、従来のように、それらの音が到来する入射角度が異なることを利用したマイクロホンアレー技術では、所望の音源からの音を抽出することは困難であった。
【0006】
また、従来のマイクロホンアレー処理技術についての一つの応用例として、例えば、エンジンや車両などのどの部位から多くの音が発生しているかを突き止めるための音響ホログラフィの研究も行われている。
【0007】
例えば、特許文献2および3には、音響ホログラフィ法を改良することにより、音源の位置を探索する技術が開示されている。
【0008】
これらの技術では、音が物理的にどのように伝搬してきているかを仮定し、その伝搬を逆にたどることで音の発生源が特定される。そして、これらの技術では、マイクロホンを二次元平面上に多数用意するか、あるいは2本程度のマイクを掃引することで面積を稼いで実施するなどの方法が採られている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2012−165273号公報
【特許文献2】特開平6−109528号公報
【特許文献3】特開平8−233931号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
上述したように、従来のマイクロホンアレー処理技術では、マイクロホンアレーに対する音波の到来角に基づいて音を抽出することが行われていた。このため、所望の音と、雑音などの不要な音とが同じ方向から到来する場合には、両者を区別することが困難であることより、マイクロホンアレー処理技術を適用しても、所望の音を確実に抽出することは困難であった。
【0011】
本開示は、このような状況に鑑みてなされたものであり、所望の音源からの音波をより確実に抽出することができるようにするものである。
【課題を解決するための手段】
【0012】
本開示の一側面の収音装置は、直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える。
【0013】
本開示の一側面の収音方法またはプログラムは、直線的に配置された所定個数のマイクロホンにより、所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号を出力する第1のマイクロホンアレーと、前記第1のマイクロホンアレーに対して略平行に、前記所望音源から見て前記第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンにより、前記所望音源から到来する音波と前記所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号を出力する第2のマイクロホンアレーと、所定数の前記第1の音波信号に含まれる前記所望音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源からの音波の成分との関係性、および、所定数の前記第1の音波信号に含まれる前記所望音源以外の音源からの音波の成分と所定数の前記第2の音波信号に含まれる前記所望音源以外の音源からの音波の成分との関係性に基づいて、前記所望音源から到来する音波を抽出する抽出処理部とを備える収音装置の収音方法、または、収音装置のコンピュータに実行させるプログラムにおいて、前記第1および第2のマイクロホンアレーの各マイクロホンでは、前記所望音源からの音波が球面状に広がりながら伝播する球面波として観測されるとともに、前記所望音源以外の音源からの音波が平面的に伝搬する平面波として観測され、所定数の前記第1の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第1の周波数領域信号を算出し、所定数の前記第2の音波信号に対してそれぞれ高速フーリエ変換を施すことにより、所定数の第2の周波数領域信号を算出し、所定数の前記第1の周波数領域信号に対して、前記第1のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第1のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第1の波数領域信号を求め、所定数の前記第2の周波数領域信号に対して、前記第2のマイクロホンアレーの各マイクロホンの位置に従った空間フーリエ変換を施すことにより、前記第2のマイクロホンアレーに到来する音波の波数を引数とする関数により表される第2の波数領域信号を求め、前記第1の波数領域信号および前記第2の波数領域信号から、前記第1の音波信号または前記第2の音波信号に含まれる前記球面波の成分が空間フーリエ変換された球面波成分波数領域信号を算出するステップを含む。
【0014】
本開示の一側面においては、直線的に配置された所定個数のマイクロホンを有する第1のマイクロホンアレーにより、所望音源から到来する音波と所望音源以外の音源から到来する音波とを観測して得られる所定数の第1の音波信号が出力される。また、第1のマイクロホンアレーに対して略平行に、所望音源から見て第1のマイクロホンアレーよりも手前側に配置され、直線的に配置された所定個数のマイクロホンを有する第2のマイクロホンアレーにより、所望音源から到来する音波と所望音源以外の音源から到来する音波とを観測して得られる所定数の第2の音波信号が出力される。そして、所定数の第1の音波信号に含まれる所望音源からの音波の成分と所定数の第2の音波信号に含まれる所望音源からの音波の成分との関係性、および、所定数の第1の音波信号に含まれる所望音源以外の音源からの音波の成分と所定数の第2の音波信号に含まれる所望音源以外の音源からの音波の成分との関係性に基づいて、所望音源から到来する音波が抽出される。
【発明の効果】
【0015】
本開示の一側面によれば、所望の音源からの音波をより確実に抽出することができる。
【図面の簡単な説明】
【0016】
図1】本技術を適用した収音装置の一実施の形態の構成例を示すブロック図である。
図2】単一の無指向性マイクロホンの空間感度分布図である。
図3】収音装置により抽出される音の周波数が500Hzであるときの空間感度分布図である。
図4】収音装置により抽出される音の周波数が1kHzであるときの空間感度分布図である。
図5】収音装置により抽出される音の周波数が2kHzであるときの空間感度分布図である。
図6】収音装置が所望音源からの音を抽出する処理を説明するフローチャートである。
図7】本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
【0018】
図1は、本技術を適用した収音装置の一実施の形態の構成例を示すブロック図である。
【0019】
図1に示すように、収音装置11は、2つのマイクロホンアレー12および12、並びに、音波抽出処理部13を備えて構成される。そして、収音装置11は、所望音源から到来する音波と、所望音源以外の音源から到来する音波との両方が含まれる音波から、所望音源からの音波を抽出(または強調)して出力する。
【0020】
マイクロホンアレー12および12は、それぞれ同様に、所定個数のマイクロホン素子が直線的に並べられて構成される。即ち、マイクロホンアレー12は、M個のマイクロホン素子21−1乃至21−Mが直線アレー状に並べられて構成され、マイクロホンアレー12は、M個のマイクロホン素子21−1乃至21−Mが直線アレー状に並べられて構成される。
【0021】
また、マイクロホンアレー12および12は、互いに平行になるように配置される。そして、マイクロホンアレー12が、所望音源から見てマイクロホンアレー12よりも手前側に、例えば、図1に示すように所望音源が左側にあるときにはマイクロホンアレー12の左側に配置される。
【0022】
マイクロホン素子21−1乃至21−M、およびマイクロホン素子21−1乃至21−Mはそれぞれ、音波によって発生する振動板などの機械的な振動を、電気的な信号(音波信号)に変換する。つまり、マイクロホン素子21−1乃至21−M、およびマイクロホン素子21−1乃至21−Mは、所望音源から到来する音波と、所望音源以外の音源から到来する音波との両方が含まれる音波を観測して得られる音波信号を出力する。
【0023】
音波抽出処理部13は、M個の高速フーリエ変換部31−1乃至31−M、M個の高速フーリエ変換部31−1乃至31−M、2つの空間フーリエ変換部32および32、球面波抽出処理部33、逆空間フーリエ変換部34、信号決定部35、および逆高速フーリエ変換部36を備えて構成される。
【0024】
高速フーリエ変換部31−1乃至31−Mはそれぞれ、マイクロホン素子21−1乃至21−Mから供給される音波信号に対して高速フーリエ変換を施し、その結果得られる周波数領域信号を空間フーリエ変換部32に供給する。同様に、高速フーリエ変換部31−1乃至31−Mはそれぞれ、マイクロホン素子21−1乃至21−Mから供給される音波信号に対して高速フーリエ変換を施し、その結果得られる周波数領域信号を空間フーリエ変換部32に供給する。
【0025】
空間フーリエ変換部32は、高速フーリエ変換部31−1乃至31−Mから供給される周波数領域信号に対してマイクロホン素子21−1乃至21−Mの位置に従った空間フーリエ変換を施し、その結果得られる波数領域信号を球面波抽出処理部33に供給する。同様に、空間フーリエ変換部32は、高速フーリエ変換部31−1乃至31−Mから供給される周波数領域信号に対してマイクロホン素子21−1乃至21−Mの位置に従った空間フーリエ変換を施し、その結果得られる波数領域信号を球面波抽出処理部33に供給する。
【0026】
球面波抽出処理部33は、空間フーリエ変換部32から供給される波数領域信号と、空間フーリエ変換部32から供給される波数領域信号とを用いて、所望音源から到来した音波信号に基づく波数領域信号を抽出する。
【0027】
ここで、収音装置11において観測される音波について説明する。例えば、収音装置11によって抽出の対象となる音波を発する所望音源が収音装置11の近傍となる位置にあり、所望音源以外の音源であって、雑音として処理する音波の音源(以下、適宜、雑音源と称する)が、所望音源よりも遠い位置にあるとする。このとき、収音装置11では、所望音源から到来する音波は、球面状に広がりながら伝播している状態で観測され、雑音源から到来する音波は十分に広がっていて平面状に伝搬する状態で観測される。即ち、収音装置11では、所望音源からの音波は球面波として観測され、雑音源からの音波は平面波として観測される。従って、球面波抽出処理部33に供給される波数領域信号には、平面波に対応する成分と、球面波に対応する成分との両方が含まれたものとなっている。
【0028】
そこで、球面波抽出処理部33は、空間フーリエ変換部32から供給される波数領域信号に含まれる平面波に対応する成分と、空間フーリエ変換部32から供給される波数領域信号に含まれる平面波に対応する成分との関係性、並びに、空間フーリエ変換部32から供給される波数領域信号に含まれる球面波に対応する成分と、空間フーリエ変換部32から供給される波数領域信号に含まれる球面波に対応する成分との関係性に基づいて、球面波の成分を抽出する処理を行う。そして、球面波抽出処理部33は、波数領域信号に含まれる球面波に対応する成分、即ち、その球面波が空間フーリエ変換された球面波成分波数領域信号を、逆空間フーリエ変換部34に供給する。
【0029】
逆空間フーリエ変換部34は、球面波抽出処理部33から供給される球面波成分波数領域信号に対して逆空間フーリエ変換を施し、その結果得される球面波成分周波数領域信号を信号決定部35に供給する。例えば、マイクロホンアレー12において観測された球面波を抽出する場合、逆空間フーリエ変換部34は、マイクロホン素子21−1乃至21−Mの位置に従った逆空間フーリエ変換を行うことにより、マイクロホン素子21−1乃至21−Mの個数(即ち、M個)に応じた複数の球面波成分周波数領域信号を算出する。
【0030】
信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号の中から、音波信号として出力するために逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号を決定する。例えば、信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号のうちの、任意の位置(例えば、中央の位置)にあるマイクロホン素子21に対応する球面波成分周波数領域信号を、逆高速フーリエ変換を施す対象として決定する。
【0031】
逆高速フーリエ変換部36は、信号決定部35により決定された球面波成分周波数領域信号に対して逆高速フーリエ変換を施し、その結果得られる球面波の音波信号を、図示しない後段の装置(例えば、音声認識装置や録音装置など)に出力する。
【0032】
このように構成される収音装置11では、マイクロホンアレー12および12の近傍にある所望音源からの音波と、遠方にある雑音源からの音波とが混在する中から、所望音源からの音波を、より確実に抽出することができる。このように、複数の位置から発生した複数の音の中から,任意の場所にある音を抽出することで、電話や、テレビ電話、テレビ中継、会話録音などにおいて、周囲の雑音による悪影響を排除することができ、例えば、音声認識率の低下を抑制することができる。
【0033】
次に、球面波抽出処理部33が球面波を抽出する処理について、数式を用いて詳細に説明する。
【0034】
まず、図1に示すように、マイクロホンアレー12および12においてマイクロホン素子21が直線的に並ぶ方向を、X軸方向と設定する。また、X軸方向に対して直交する方向、即ち、平行に配置されるマイクロホンアレー12および12の間隔方向を、Y軸方向と設定する。なお、図1において紙面に対して垂直方向となるZ方向については、所望音源とマイクロホンアレー12および12とが同一となるZ方向の位置(高さ)に配置されているものとし、以下の説明では、Z方向のパラメータは省略するものとする。
【0035】
また、マイクロホンアレー12および12それぞれにおけるマイクロホン素子21どうしは、X軸方向に間隔dとなるように配置され、マイクロホンアレー12および12は、Y軸方向に間隔dとなるように配置される。また、所望音源は、マイクロホンアレー12の中心位置を基準(0,0)としたとき、位置(x,y)に配置される。また、雑音としての平面波は、X軸方向に対して角度θとなるように所望音源よりも遠方から飛来する。
【0036】
なお、以下の説明では、音波はそれぞれ単一の周波数にフーリエ変換などにより分解されているものとして扱い、さらに単一の周波数音を表す関数exp(jωt)は省略する。ここで、ωは角周波数であり、角周波数ωと周波数fとには、ω=2πfの関係がある。また、全帯域に渡る信号として合成するときは、周波数ごとの処理を終えた後に逆フーリエ変換を施すことで合成可能である。
【0037】
そして、マイクロホンアレー12で観測される音波信号が、高速フーリエ変換部31−1乃至31−Mにおいて高速フーリエ変換が施されることにより得られる周波数領域信号Dは、次の式(1)で表される。同様に、マイクロホンアレー12で観測される音波信号が、高速フーリエ変換部31−1乃至31−Mにおいて高速フーリエ変換が施されることにより得られる周波数領域信号Dは、次の式(2)で表される。
【0038】
【数1】
【数2】
【0039】
即ち、周波数領域信号Dは、式(1)に示すように、音波信号に含まれる平面波の成分が高速フーリエ変換された平面波成分周波数領域信号Pと、音波信号に含まれる球面波の成分が高速フーリエ変換された球面波成分周波数領域信号Qとが重畳されたものとして表される。同様に、周波数領域信号Dは、式(2)に示すように、音波信号に含まれる平面波の成分が高速フーリエ変換された平面波成分周波数領域信号Pと、音波信号に含まれる球面波の成分が高速フーリエ変換された球面波成分周波数領域信号Qとが重畳されたものとして表される。
【0040】
ここで、式(1)において、1つめの引数は、マイクロホンアレー12を構成するマイクロホン素子21−1乃至21−MそれぞれのX軸方向の位置xを表す。同様に、式(2)において、1つめの引数は、マイクロホンアレー12を構成するマイクロホン素子21−1乃至21−MそれぞれのX軸方向の位置xを表す。また、式(1)および式(2)において、2つめの引数は、マイクロホンアレー12および12それぞれのY軸方向の位置を表す。ここでは、マイクロホンアレー12の位置をY軸方向の基準とし、式(1)に示すように、マイクロホンアレー12のY軸方向の位置は0となり、式(2)に示すように、マイクロホンアレー12のY軸方向の位置は間隔dとなる。
【0041】
また、平面波成分周波数領域信号PおよびPは、図1に示すように角度θから平面波が到来することより、雑音源からの音の大きさを表すパラメータA、X軸方向のトレース波長k、およびY軸方向のトレース波長kを用いて、次の式(3)および式(4)で表すことができる。
【0042】
【数3】
【数4】
【0043】
ここで、X軸方向のトレース波長kは、音の周波数で決定される波数k=ω/c(ω:角周波数、c:音速)との間に、次の式(5)に示す関係を有する。また、Y軸方向のトレース波長kは、X軸方向のトレース波長kおよび波数kとの間に、次の式(6)に示す関係を有する。
【0044】
【数5】
【数6】
【0045】
一方、球面波成分周波数領域信号Qは、図1に示すように位置(x,y)から球面波が到来することより、所望音源からの音の大きさを表すパラメータB、および、所望音源から位置xにあるマイクロホン素子21までの距離r(x)を用いて、次の式(7)で表すことができる。同様に、球面波成分周波数領域信号Qは、所望音源からの音の大きさを表すパラメータB、および、所望音源から位置xにあるマイクロホン素子21までの距離r(x)を用いて、次の式(8)で表すことができる。
【0046】
【数7】
【数8】
【0047】
また、距離r(x)および距離r(x)は、所望音源の位置(x,y)を用いて、次の式(9)および式(10)で表される。
【0048】
【数9】
【数10】
【0049】
ところで、式(1)および式(2)に示したように、マイクロホンアレー12および12で観測される音波信号が高速フーリエ変換された周波数領域信号DおよびDは、平面波と球面波とが混在した波形である。このため、音波抽出処理部13において、周波数領域信号DおよびDから球面波成分周波数領域信号QまたはQを抽出するために、まず、周波数領域信号DおよびDをX軸方向に沿って空間フーリエ変換が施される。このような空間フーリエ変換を施す際には、マイクロホン素子21どうしのX軸方向の間隔dが一定のものである必要がある。なお、周波数領域信号DおよびDに対して、通常のフーリエ変換処理と同様に、ハニング窓などによる窓掛けを行うことで、両端のマイクロホン素子21で観測した信号のレベルを小さくし、両端が滑らかに小さくなり区間外につながるように処理することができる。
【0050】
ここで、X軸方向に沿った空間フーリエ変換を、次の式(11)のように定義する。
【0051】
【数11】
【0052】
但し、式(11)は、例えば、周波数領域信号S(x,y)をX軸方向に沿って空間フーリエ変換して得られる波数領域信号S’(x,y)を表しており、式(11)において、Mは、マイクロホン素子21がX軸方向に並ぶ個数である。また、式(11)において、k’は、X軸方向のトレース波長kを逆フーリエ変換するときの変数であり、あらゆる値をとることができる。
【0053】
このようにX軸方向に沿った空間フーリエ変換を定義すると、周波数領域信号Dに対して空間フーリエ変換が施された結果得られる波数領域信号D’は、次の式(12)で表される。また、周波数領域信号Dに対して空間フーリエ変換が施された結果得られる波数領域信号D’は、次の式(13)で表される。
【0054】
【数12】
【数13】
【0055】
同様に、平面波成分周波数領域信号Pに対して空間フーリエ変換が施された結果得られる平面波成分波数領域信号P’は、次の式(14)で表される。また、平面波成分周波数領域信号Pに対して空間フーリエ変換が施された結果得られる平面波成分波数領域信号P’は、次の式(15)で表される。
【0056】
【数14】
【数15】
【0057】
ここで、式(14)および式(15)において、δは、デルタ関数である。
【0058】
さらに、球面波成分周波数領域信号Qに対して空間フーリエ変換が施された結果得られる球面波成分波数領域信号Q’は、次の式(16)で表される。また、球面波成分周波数領域信号Qに対して空間フーリエ変換が施された結果得られる球面波成分波数領域信号Q’は、所望音源のY軸方向の位置yを用いて、次の式(17)で表される。
【0059】
【数16】
【数17】
【0060】
ここで、式(16)および式(17)において、H(2)は、0次の第二種ハンケル関数であり、Kは、0次の変形ベッセル関数である。また、式(16)および式(17)に示すように、球面波成分波数領域信号Q’およびQ’は、変数k’との絶対値、波数kの絶対値との大小関係に従って異なるものとなる。
【0061】
次に、マイクロホンアレー12により観測される音波の平面波の成分と、マイクロホンアレー12により観測される音波の平面波の成分との関係性、および、マイクロホンアレー12により観測される音波の球面波の成分と、マイクロホンアレー12により観測される音波の球面波の成分との関係性について考える。つまり、上述の式(14)および式(15)から、雑音源からの音の大きさを表すパラメータAを消去すると、次の式(18)に示す関係が成り立つ。同様に、上述の式(16)および式(17)から、所望音源からの音の大きさを表すパラメータBを消去すると、次の式(19)に示す関係が成り立つ。
【0062】
【数18】
【数19】
【0063】
そして、式(18)および式(19)に示す関係に基づいて、上述した式(13)は、次の式(20)で表すことができる。
【0064】
【数20】
【0065】
ここで、式(20)において、Gは、上述したような変数k’の絶対値と波数kの絶対値との大小関係に従って、0次の第二種ハンケル関数H(2)および0次の変形ベッセル関数Kのいずれか一方に置き換わる関数である。
【0066】
そして、この式(20)と、上述の式(12)とを用いて、連立方程式が成り立つことより、球面波抽出処理部33は、次の式(21)を演算することで、球面波成分波数領域信号Q’を抽出することができる。
【0067】
【数21】
【0068】
その後、逆空間フーリエ変換部34は、球面波抽出処理部33が式(21)を演算した結果得られる球面波成分波数領域信号Q’に対して逆空間フーリエ変換を施すことで、球面波成分周波数領域信号Qを求めることができる。そして、逆高速フーリエ変換部36は、逆空間フーリエ変換部34が求めた、球面波成分周波数領域信号Qに対して逆高速フーリエ変換を施すことで、音波信号に含まれていた球面波の成分を出力することができる。
【0069】
以上のように、音波抽出処理部13では、マイクロホンアレー12および12により観測される音波に含まれる平面波の関係性と球面波の関係性とに基づいて、球面波の成分を抽出すること、即ち、所望音源からの音波を抽出することができる。
【0070】
ところで、上述したように、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号のうち、逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象となる球面波成分周波数領域信号が、信号決定部35により決定される。このとき、信号決定部35は、任意の位置にあるマイクロホン素子21に対応する球面波成分周波数領域信号を逆高速フーリエ変換の対象として決定する他、例えば、複数の球面波成分周波数領域信号それぞれのタイミングを合わせた後に合算した信号を、逆高速フーリエ変換の対象として決定してもよい。つまり、所望音源から球面状に広がる球面波は、直線的に配置されたマイクロホン素子21において、所望音源との距離に従って、所望音源から遠いマイクロホン素子21では、所望音源に近いマイクロホン素子21よりも遅延して観測される。
【0071】
そこで、例えば、信号決定部35は、所望音源の位置を仮定し、その位置からマイクロホン素子21−1乃至21−Mそれぞれに音波が到達するまでの遅延を考慮した遅延和アレーを構成する。そして、信号決定部35は、それぞれの遅延を補償した後に和を取った信号を、逆高速フーリエ変換の対象として決定することができる。
【0072】
ここで、遅延和アレーについて説明する。例えば、所望音源が位置(x,y)に配置されていると仮定したとき、所望音源からマイクロホン素子21−1乃至21−Mそれぞれまでの距離r(x)は、次の式(22)で表される。また、所望音源からマイクロホン素子21−1乃至21−Mそれぞれに到達する時間差τ(x)は、音速cを用いて、次の式(23)で表される。
【0073】
【数22】
【数23】
【0074】
従って、信号決定部35は、この時間差τ(x)を補償する逆時間伝達関数exp(jωτ(x))を、マイクロホン素子21−1乃至21−Mそれぞれの位置に応じて求められる球面波成分波数領域信号Q’に対し、それぞれ対応する位置xで掛け合わせて和を取った信号を算出し、逆高速フーリエ変換の対象として決定することができる。
【0075】
このように、信号決定部35において遅延和アレーを用いて、音波信号として出力するために逆高速フーリエ変換の対象とする球面波成分波数領域信号Q’を算出することで、球面波の成分を増幅することができ、例えば、SN比を向上させることができる。
【0076】
ところで、上述の式(20)における平面波についてのマイクロホンアレー12および12の間の関係を表す関数を関係関数E(k’,d)とすると、関係関数E(k’,d)は、次の式(24)で表される。
【0077】
【数24】
【0078】
同様に、上述の式(20)における球面波についてのマイクロホンアレー12および12の間の関係を表す関数を関係関数F(k’,d)とすると、関係関数F(k’,d)は、次の式(25)で表される。そして、上述した変数k’の絶対値と波数kの絶対値との大小関係に従って、第二種ハンケル関数および変形ベッセル関数に置き換わる関数Gを用いると、関係関数F(k’,d)は、次の式(26)で表される。
【0079】
【数25】
【数26】
【0080】
従って、この式(24)および式(26)より、上述の式(20)は、次の式(27)と表すことができる。
【0081】
【数27】
【0082】
そして、この式(27)と、上述の式(12)との連立方程式に基づいて、球面波成分波数領域信号Q’は、次の式(28)と表すことができる。
【0083】
【数28】
【0084】
ここで、上述したように、関係関数E(k’,d)は、平面波についてのマイクロホンアレー12および12の間の関係を表すものであり、関係関数F(k’,d)は、球面波についてのマイクロホンアレー12および12の間の関係を表すものである。従って、マイクロホンアレー12および12の関係が固定のものであれば、それらの関係は変化することはないことより、関係関数E(k’,d)および関係関数F(k’,d)を演算することにより求められる出力値として、事前の観測などにより求められた値を使用することができる。
【0085】
具体的には、収音装置11を用いて事前に、平面波のみが観測される状態において、あらゆる角度θから到来する平面波を観測し、それらの角度θごとの変数k’を平面波成分波数領域信号P’およびP’に入力して、次の式(29)を演算することにより、関係関数E(k’,d)の出力値を求めることができる。同様に、収音装置11を用いて事前に、球面波のみが観測される状態において、あらゆる角度θおよび位置yから到来する球面波を観測し、それらの角度θごとの変数k’および位置yを球面波成分波数領域信号Q’およびQ’に入力して、次の式(30)を演算することにより、関係関数F(k’,d)の出力値を求めることができる。
【0086】
【数29】
【数30】
【0087】
そして、球面波抽出処理部33は、このように予め求めてある関係関数E(k’,d)および関係関数F(k’,d)の出力値を保持しておき、上述した式(28)を演算することにより、球面波成分波数領域信号Q’を求めることができる。
【0088】
このように、収音装置11では、抽出する音波を観測する時に、上述の式(24)および式(26)を演算することにより求められる関係関数E(k’,d)および関係関数F(k’,d)を用いる他、事前の計測などにより取得された関係関数E(k’,d)および関係関数F(k’,d)の出力値を用いて、所望音源からの音波を抽出してもよい。
【0089】
次に、図2乃至5を参照して、収音装置11により所望音源を抽出する効果について、空間感度分布図を用いて説明する。空間感度分布図は、位置(x,y)にある音をマイクロホンで収音した時に、どれくらいの大きさとしてその音を収音できるかを示すものである。
【0090】
図2には、単一の無指向性マイクロホンの空間感度分布図が示されている。図2において、マイクロホンが位置(0,0)に配置されており、空間感度分布図は等高線図として表されている。図2の空間感度分布図では、例えば、音源がマイクロホンから1.5m離れていると-30dB小さな音として収音されることが表されている。
【0091】
図3乃至5には、収音装置11の空間感度分布図が示されている。これらの空間感度分布図は、マイクロホンアレー12および12が、10cmの間隔で離れて配置(間隔d=10cm)され、マイクロホンアレー12および12には、64個のマイクロホン素子21がX軸方向に5cm間隔で配置(間隔d=5cm)されたとして、計算機シミュレーションにより求めたものである。なお、マイクロホンアレー12の中心を位置(0,0)とする。
【0092】
また、空間感度分布は、周波数ごとに特性が異なるため、代表的な周波数として人間の声にとって重要な周波数(500Hz,1kHz,2kHz)について示されている。つまり、図3には、収音する音の周波数が500Hzであるときの空間感度分布図が示されている。また、図4には、収音する音の周波数が1kHzであるときの空間感度分布図が示されており、図5には、収音する音の周波数が2kHzであるときの空間感度分布図が示されている。
【0093】
図3乃至5に示すように、収音装置11は、所定距離より離れた位置にある音源からの音が小さくなったものとして収音することができる。例えば、図3に示すように、収音装置11は、収音する音の周波数が500Hzであるとき、0.75m離れた位置にある音源については-30dB以上、音の大きさが小さくなったものとして収音することができる。このように、近い音と遠い音が混在していても、マイクロホンアレー12および12に近い音のみを抽出することができることが示されている。なお、図4および図5に示すように、収音する音の周波数が1kHzおよび2kHzであるとき、より大きな差で、マイクロホンアレー12および12に近い音のみを抽出することができる。
【0094】
このように、収音装置11では、遠方から到来する雑音(平面波)を抑制し、マイクロホンアレー12および12の近傍にある所望音源から到来する音(球面波)のみを抽出することができる。
【0095】
次に、図6は、図1の収音装置11が所望音源からの音を抽出する処理を説明するフローチャートである。
【0096】
例えば、マイクロホンアレー12および12により音波が観測されて、マイクロホン素子21−1乃至21−Mから高速フーリエ変換部31−1乃至31−Mに音波信号が供給され、マイクロホン素子21−1乃至21−Mから高速フーリエ変換部31−1乃至31−Mに音波信号が供給されると処理が開始される。
【0097】
ステップS11において、高速フーリエ変換部31−1乃至31−Mは、マイクロホン素子21−1乃至21−Mから供給される音波信号に対して高速フーリエ変換を施した周波数領域信号を空間フーリエ変換部32に供給する。同様に、高速フーリエ変換部31−1乃至31−Mは、マイクロホン素子21−1乃至21−Mから供給される音波信号に対して高速フーリエ変換を施した周波数領域信号を空間フーリエ変換部32に供給する。
【0098】
ステップS12において、空間フーリエ変換部32は、高速フーリエ変換部31−1乃至31−Mから供給される周波数領域信号に対してマイクロホン素子21−1乃至21−Mの位置に従った空間フーリエ変換を施した波数領域信号を球面波抽出処理部33に供給する。同様に、空間フーリエ変換部32は、高速フーリエ変換部31−1乃至31−Mから供給される周波数領域信号に対してマイクロホン素子21−1乃至21−Mの位置に従った空間フーリエ変換を施した波数領域信号を球面波抽出処理部33に供給する。
【0099】
ステップS13において、球面波抽出処理部33は、空間フーリエ変換部32から供給される波数領域信号と、空間フーリエ変換部32から供給される波数領域信号とを用いて、所望音源から到来した音波信号に基づく波数領域信号を抽出する。例えば、球面波抽出処理部33は、上述した次の式(21)を演算することで、マイクロホンアレー12から出力される音波信号に含まれる球面波成分波数領域信号Q’を抽出することができる。
【0100】
ステップS14において、逆空間フーリエ変換部34は、球面波抽出処理部33から供給される球面波成分波数領域信号に対して、マイクロホン素子21−1乃至21−Mの位置に従った逆空間フーリエ変換を施して複数の球面波成分周波数領域信号を算出する。
【0101】
ステップS15において、信号決定部35は、逆空間フーリエ変換部34により求められた複数の球面波成分周波数領域信号に対して、上述したような遅延和アレーを用いて求められる球面波成分周波数領域信号を、音波信号として出力するために逆高速フーリエ変換部36が逆高速フーリエ変換を施す対象として決定する。
【0102】
ステップS16において、逆高速フーリエ変換部36は、信号決定部35により決定された球面波成分周波数領域信号に対して逆高速フーリエ変換を施し、その結果得られる球面波の音波信号を出力する。
【0103】
以上のように、音波抽出処理部13は、マイクロホンアレー12および12により観測される音波信号に含まれている球面波の成分、即ち、所望音源からの音波を抽出することができる。つまり、収音装置11では、これまで人の声を抽出するために利用されてきた直線マイクロホンアレーを基礎としながら、音響ホログラフィの考え方を導入することで、2次元平面ではなく、前後に2つ並んだマイクロホンアレー12および12を利用して、所望音源からの音波を抽出することができる。
【0104】
特に、収音装置11では、所望音源と雑音源とが同一方向にある場合であっても、球面波と平面波との関係に基づいて、所望音源からの音を抽出することができる。具体的には、収音装置11を自動販売機に採用して、例えば、自動販売機に近い発話のみを収音することにより、自動販売機による音声認識率の向上を図ることができる。また、収音装置11は、例えば、ドライブスルーなどの発話注文において、店員が音声を聞き取るのにも活用することができる。さらに、収音装置11をテレビ会議などに採用することで、参加者のみの声を捉え、ある程度離れた距離の音は収音しないようにすることができる。
【0105】
このように、収音装置11は、複数の位置から発生した複数の音の中から、任意の場所にある音を抽出することができ、電話や、テレビ電話、テレビ中継、会話録音などのように音を収音する技術に適用することができる。
【0106】
なお、本実施の形態においては、所望音源を、収音装置11から所定距離の近い位置にあるものとして説明を行ったが、例えば、収音装置11から離れた遠い位置にあるものとして、その遠い所望音源からの音を抽出してもよい。即ち、上述の式(21)を演算して球面波成分波数領域信号Q’を求めるのに替えて、上述の式(12)および式(20)を用いた連立方程式において平面波成分波数領域信号P’を求めるようにすることで、遠い所望音源から到来する平面波を抽出することができる。
【0107】
なお、上述のフローチャートを参照して説明した各処理は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。また、プログラムは、1のCPUにより処理されるものであってもよいし、複数のCPUによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。
【0108】
また、上述した一連の処理(情報処理方法)は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラムが記録されたプログラム記録媒体からインストールされる。
【0109】
図7は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
【0110】
コンピュータにおいて、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
【0111】
バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
【0112】
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105及びバス104を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。
【0113】
コンピュータ(CPU101)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア111に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0114】
そして、プログラムは、リムーバブルメディア111をドライブ110に装着することにより、入出力インタフェース105を介して、記憶部108にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
【0115】
なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0116】
11 収音装置, 12および12 マイクロホンアレー, 13 音波抽出処理部, 21−1乃至21−Mおよび21−1乃至21−M マイクロホン素子, 31−1乃至31−Mおよび31−1乃至31−M 高速フーリエ変換部, 32および32 空間フーリエ変換部, 33 球面波抽出処理部, 34 逆空間フーリエ変換部, 35 信号決定部, 36 逆高速フーリエ変換部
図1
図2
図3
図4
図5
図6
図7