(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-23
(45)【発行日】2025-05-02
(54)【発明の名称】接話用マイクロホンアレイ及び接話用マイクロホンアレイの設定方法
(51)【国際特許分類】
H04R 3/00 20060101AFI20250424BHJP
H04R 1/40 20060101ALI20250424BHJP
【FI】
H04R3/00 320
H04R1/40 320A
(21)【出願番号】P 2021132379
(22)【出願日】2021-08-16
【審査請求日】2024-06-26
(73)【特許権者】
【識別番号】501241645
【氏名又は名称】学校法人 工学院大学
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】貝塚 勉
【審査官】川▲崎▼ 博章
(56)【参考文献】
【文献】特開2002-099297(JP,A)
【文献】特開2009-036810(JP,A)
【文献】特開2011-259398(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00
H04R 1/40
(57)【特許請求の範囲】
【請求項1】
複数のマイクロホンの集合であるマイクロホンアレイの表面における比音響インピーダンスの実部を要素とする行列と前記比音響インピーダンスの虚部を要素とする行列とに関する一般化固有値問題から算出される固有値と固有ベクトルとに基づいて、前記複数のマイクロホンの各々の感度及び端子の極性が設定された接話用マイクロホンアレイ。
【請求項2】
前記複数のマイクロホンの各々の感度及び端子の極性は、前記比音響インピーダンスの虚部を要素とする行列と前記固有ベクトルを列とする実数行列との積が、前記比音響インピーダンスの実部を要素とする行列と前記固有ベクトルを列とする実数行列と前記固有値を要素とする対角行列との積に等しい場合に、前記固有値が最大値となる固有ベクトルの要素に基づいて設定される請求項1に記載の接話用マイクロホンアレイ。
【請求項3】
前記複数のマイクロホンの各々の感度及び端子の極性は、前記比音響インピーダンスの実部を要素とする行列と前記固有ベクトルを列とする実数行列との積が、前記比音響インピーダンスの虚部を要素とする行列と前記固有ベクトルを列とする実数行列と前記固有値を要素とする対角行列との積に等しい場合に、前記固有値が最小値となる固有ベクトルの要素に基づいて設定される請求項1に記載の接話用マイクロホンアレイ。
【請求項4】
前記複数のマイクロホンが線状に配設された請求項1~3のいずれか1項に記載の接話用マイクロホンアレイ。
【請求項5】
前記複数のマイクロホンは、前記複数のマイクロホンの各々が計測対象とする上限周波数における半波長以下の間隔で配設される請求項3に記載の接話用マイクロホンアレイ。
【請求項6】
複数のマイクロホンの集合であるマイクロホンアレイの表面における比音響インピーダンスの実部を要素とする行列と前記比音響インピーダンスの虚部を要素とする行列とに関する一般化固有値問題から固有値と固有ベクトルとを算出するステップと、
算出した前記固有値と前記固有ベクトルとに基づいて、前記複数のマイクロホンの各々の感度及び端子の極性を設定するステップと、
を含む接話用マイクロホンアレイの設定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、接話用マイクロホンアレイ及び接話用マイクロホンアレイの設定方法に関する。
【背景技術】
【0002】
雑音の大きい場所で携帯電話等を用いて通話を行うと、話者の音声に周囲の雑音が混ざり、通話相手は話者の音声を聞き取りにくくなるので、音声から雑音を除去する技術が提案されている。例えば、音声に雑音が混入したマイクロホンの計測信号から雑音に係る周波数スペクトルを推定し、推定した周波数スペクトルの値をマイクロホンの計測信号から差し引くという信号処理がある。かかる信号処理では、「音声+雑音」であるマイクロホンの計測信号から「雑音の推定値」を控除することによって、音声から雑音を除去する。
【0003】
しかしながら、音声と雑音とが混在した信号から雑音に係る周波数スペクトルを推定するのは一般的に容易ではなく、推定誤差が生じ得る。マイクロホンの計測信号から推定誤差を含んだ推定値を差し引くと、音声が歪み、通話の明瞭度が劣化するおそれがある。また、通話の明瞭度の劣化をおそれて、マイクロホンの計測信号からの雑音成分の控除を抑制すると、雑音が十分に取り除けないおそれがあった。従って、マイクロホンの計測信号からの雑音成分を控除して音声を明瞭化する際には、雑音に係る周波数スペクトルの推定精度の向上が技術的課題となる。
【0004】
特許文献1には、受信音に含まれる直接音と間接音(残響音)との比である直間比がマイクロホンと音源との距離に応じて単調に変化することに基づいてマイクロホンと各々の音源との距離を推定し、一定の距離範囲内にあると判定された音源の成分の振幅を強調又は抑圧するフィルタリングによって雑音を除去するマイクロホンアレイに係る発明が開示されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の発明は、音源毎にマイクロホンとの距離を推定すると共に、推定した距離に応じて各々の音源に係る信号の振幅を強調又は抑圧するという処理が煩雑であるという問題があった。
【0007】
本発明は、近い音源の音を優先的に検出可能な接話用マイクロホンアレイ及び接話用マイクロホンアレイの設定方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、請求項1に記載の発明は、複数のマイクロホンの集合であるマイクロホンアレイの表面における比音響インピーダンスの実部を要素とする行列と前記比音響インピーダンスの虚部を要素とする行列とに関する一般化固有値問題から算出される固有値と固有ベクトルとに基づいて、前記複数のマイクロホンの各々の感度及び端子の極性が設定される。
【0009】
この発明によれば、一般化固有値問題から算出される固有値と固有ベクトルとに基づいて、複数のマイクロホンの各々の感度及び端子の極性を最適化できる。
【0010】
なお、請求項2に記載したように、前記複数のマイクロホンの各々の感度及び端子の極性は、前記比音響インピーダンスの虚部を要素とする行列と前記固有ベクトルを列とする実数行列との積が、前記比音響インピーダンスの実部を要素とする行列と前記固有ベクトルを列とする実数行列と前記固有値を要素とする対角行列との積に等しい場合に、前記固有値が最大値となる固有ベクトルの要素に基づいて設定されるようにしてもよい。
【0011】
なお、請求項3に記載したように、前記複数のマイクロホンの各々の感度及び端子の極性は、前記比音響インピーダンスの実部を要素とする行列と前記固有ベクトルを列とする実数行列との積が、前記比音響インピーダンスの虚部を要素とする行列と前記固有ベクトルを列とする実数行列と前記固有値を要素とする対角行列との積に等しい場合に、前記固有値が最小値となる固有ベクトルの要素に基づいて設定されるようにしてもよい。
【0012】
請求項4に記載の発明は、前記複数のマイクロホンが線状に配設されている。
【0013】
請求項5に記載の発明は、前記複数のマイクロホンは、前記複数のマイクロホンの各々が計測対象とする上限周波数における半波長以下の間隔で配設されている。
【0014】
請求項6に記載の発明である接話用マイクロホンアレイの設定方法は、複数のマイクロホンの集合であるマイクロホンアレイの表面における比音響インピーダンスの実部を要素とする行列と前記比音響インピーダンスの虚部を要素とする行列とに関する一般化固有値問題から固有値と固有ベクトルとを算出するステップと、算出した前記固有値と前記固有ベクトルとに基づいて、前記複数のマイクロホンの各々の感度及び端子の極性を設定するステップと、を含んでいる。
【発明の効果】
【0015】
本発明によれば、近い音源の音を優先的に検出可能な接話用マイクロホンアレイ及び接話用マイクロホンアレイの設定方法を提供できる、という効果を有する。
【図面の簡単な説明】
【0016】
【
図1】マイクロホンアレイの構成の一例を示したブロック図である。
【
図2】マイクロホンが5個の場合のマイクロホンアレイを示したブロック図である。
【
図3】(A)はマイクロホンが2個の場合、(B)はマイクロホンが3個の場合、(C)はマイクロホンが4個の場合、(D)はマイクロホンが5個の場合、の各々の配置図である。
【
図4】(A)はマイクロホンが2個の場合、(B)はマイクロホンが3個の場合、(C)はマイクロホンが4個の場合、(D)はマイクロホンが5個の場合、の各々の周波数に対する固有値の変化を示した説明図である。
【
図5】(A)はマイクロホンが2個の場合、(B)はマイクロホンが3個の場合、(C)はマイクロホンが4個の場合、(D)はマイクロホンが5個の場合、の各々の周波数に対する1次固有ベクトルの変化の一例を示した説明図である。
【
図6】(A)は周波数が300Hzの場合、(B)は周波数が1850Hzの場合、(C)は周波数が3400Hzの場合の、2個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【
図7】(A)は周波数が300Hzの場合、(B)は周波数が1850Hzの場合、(C)は周波数が3400Hzの場合の、3個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【
図8】(A)は周波数が300Hzの場合、(B)は周波数が1850Hzの場合、(C)は周波数が3400Hzの場合の、4個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【
図9】(A)は周波数が300Hzの場合、(B)は周波数が1850Hzの場合、(C)は周波数が3400Hzの場合の、5個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【
図10】1個のマイクロホンの感度分布の一例を示した説明図である。
【
図11】(A)は周波数が300Hzの場合、(B)は周波数が1850Hzの場合、(C)は周波数が3400Hzの場合の、4個のマイクロホンで構成された2次勾配マイクにおける感度分布の一例を示した説明図である。
【
図12】(A)は1個のマイクロホンの周波数に対する感度特性を、(B)5個のマイクロホンが線状に配置されたマイクロホンアレイの周波数に対する感度特性を、各々示した説明図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について説明する。本実施形態では、接話用マイクロホンアレイに本発明を適用した場合について説明する。
【0018】
本実施形態では、後処理によってマイクロホンの計測信号から雑音成分を除去するのではなく、雑音を拾いにくいマイクロホンを構成するというアプローチが提案されている。携帯電話やヘッドセット等の接話型の通話機器では、話者の口とマイクロホンの距離が近いのに対し、周囲の雑音源とマイクロホンの距離は遠い。従って、近くの音源から出される音を高い感度で計測し、遠くの音源から出される音を低い感度で計測するマイクロホンであれば、話者の音声を優先的に検出できる。
【0019】
実用化済みの技術例として、勾配マイク(差動マイク)がある。 勾配マイクは、2個のマイクロホンを並べ、両者の計測信号の差分を検出する。検出される差分は、音圧の勾配に比例する。音圧そのものよりも、音圧の勾配の方が、近くの音源を強調する感度特性となる。また、より多くのマイクロホンを用意し、より高次の勾配を求めれば、近くの音源を更に強調できる。しかしながら、音圧の勾配が近くの音源を強調するのは確かだが、音圧の勾配が近くの音源を最大限に強調するとは限らない。
【0020】
本実施形態では、マイクロホンアレイの表面の比音響インピーダンスに関する固有値及び固有ベクトルを算出し、算出した固有値及び固有ベクトルに基づいてマイクロホンアレイを構成する各々のマイクロホンの感度を示す振幅(以下、「感度」と称する)及び各々のマイクロホンの端子の電気的極性を示す位相(以下、「極性」と称する)を設定することにより、近くの音源からの音声を有効に検出すると共に、周囲の雑音を拾いにくくする。
【0021】
図1は、本実施形態に関わる音響入力装置10の構成を示す説明図である。音響入力装置10は、マイクロホンアレイ20と、アンプアレイ30とを備えている。マイクロホンアレイ20は、線状に配列されているN個のマイクロホン20-1、20-2、20-3、…、20-Nを備えている。ここで、Nは2以上の整数である。マイクロホンアレイ20を駆動する事前準備として、マイクロホンアレイ20の所定の固有ベクトルは、計算済みであるものとする。固有ベクトルは、N個のマイクロホン20-1、20-2、20-3、…、20-Nのそれぞれの感度及び極性に対応するN個のベクトル要素を有する。例えば、固有ベクトルのN個のベクトル要素のうちi番目のベクトル要素は、マイクロホンアレイ20のうちi番目のマイクロホン20-iの感度及び極性を示す。ここで、iは1以上N以下の整数である。アンプアレイ30は、N個のアンプ30-1、30-2、30-3、…、30-Nを備えている。アンプアレイ30のうちi番目のアンプ30-iは、固有ベクトルのN個のベクトル要素のうちi番目のベクトル要素に従って、マイクロホンアレイ20のうちi番目のマイクロホン20-iの感度及び極性を制御する。
【0022】
本実施形態では、アンプアレイ30によって、マイクロホン20-1、20-2、20-3、…、20-Nの各々の感度及び極性を調整するが、アンプアレイ30を介さずに、マイクロホン20-1、20-2、20-3、…、20-Nの各々の感度及び極性を任意に設定可能であってもよい。
【0023】
マイクロホン20-1、20-2、20-3、…、20-Nの各々は、ダイナミックマイクロホン、コンデンサマイクロホン、カーボンマイクロホン、及び圧電マイクロホンのいずれかである。
【0024】
まず、マイクロホンアレイに代えてスピーカアレイを考える。スピーカアレイから出される音(複素音響パワー)は、遠距離まで届く成分と(複素音響パワーの実部)、近距離に留まる成分(複素音響パワーの虚部)とに分けられる。複素音響パワーの実部は、アクティブ音響パワーと呼ばれる。一方、複素音響パワーの虚部は、リアクティブ音響パワーと呼ばれる。アクティブ音響パワーに対するリアクティブ音響パワーの比率を高められれば、近くにだけ音を届けることができる。後述の一般化固有値問題の固有値が、アクティブ音響パワーに対するリアクティブ音響パワーの比率に相当する。後述の一般化固有値問題の固有ベクトルが、スピーカアレイを構成する各スピーカの振幅及び極性に相当する。つまり、固有値が最大の固有ベクトルに従って各スピーカの振幅及び極性を設定すれば、近くにだけ音を届けやすいスピーカアレイを実現できる。相反性により、この考えはマイクロホンアレイの設計に応用できる。すなわち、固有値が最大の固有ベクトルに従って各マイクロホンの感度及び極性を設定すれば、近くの音源から出される音だけを計測しやすいマイクロホンアレイを実現できる。
【0025】
ここで、マイクロホンに代えてN個のスピーカを想定する。N個のスピーカの各々の表面の複素音圧をベクトル要素とする列ベクトルである複素音圧ベクトルをpとし、N個のスピーカのそれぞれの複素速度(振動面の法線方向の振動速度)をベクトル要素とする列ベクトルである複素速度ベクトルをvとし、スピーカ表面の比音響インピーダンスを行列要素とする比音響インピーダンス行列をZとすると、下記の式(1)が成立する。比音響インピーダンス行列Zは、音響の相反性により、対称行列となる。ここで、pがN行1列のベクトルであり、vがN行1列のベクトルであるなら、ZはN行N列の行列となる。そして、Zのi行j列要素は、i番目のスピーカ表面とj番目のスピーカ表面との間の比音響インピーダンスになる。
【0026】
複素音響パワーWは、下記の式(2)で表される。式(2)中のsは各スピーカの振動面の面積である。説明の便宜上、式(2)では、各スピーカの振動面の面積は、同一である場合を想定しているが、各スピーカの振動面の面積は必ずしも同一である必要はない。
また、v
Hは、複素速度ベクトルvの共役転置である。
【0027】
複素音響パワーWは、下記のように実部W
rと虚部W
iとを含む。下記の式において、W
rはアクティブ音響パワーを示し、W
iは、リアクティブ音響パワーを示す。
【0028】
また、比音響インピーダンス行列Zも、下記のように実部Z
rと虚部Z
iとを含む。下記の式において、Z
rは、音響レジスタンス行列を示し、Z
iは、音響リアクタンス行列を示す。
【0029】
従って、複素音響パワーWの実部W
r及び虚部W
iは、下記の式(3)、(4)のようになる。
【0030】
スピーカアレイにおいては、アクティブ音響パワーWrに対するリアクティブ音響パワーWiの比率(Wi/Wr)であるRA比を高めることにより、近距離場での聞き取りに適した構成を得ることができる。RA比は、後述するように、一般化固有値問題における固有値に一致し、固有値が最大となる固有ベクトルに基づいて、マイクロホンアレイ20を構成する個々のマイクロホンの感度及び極性を設定する。
【0031】
下記の式(5)に示したように、音響レジスタンス行列と音響リアクタンス行列とにおける一般化固有値問題を定義する。下記の式において、Λは固有値を要素とする対角行列であり、Φは固有ベクトルを列とする実数行列である。また、音響レジスタンス行列Z
rは、実数、正定である対称行列であり、音響リアクタンス行列Z
iは、実数である対称行列である。また、一般化固有値問題において、固有値は実数、固有ベクトルは実数ベクトルである。一般化固有値問題は、下記の式(5)において、音響リアクタンス行列Z
iと音響レジスタンス行列Z
rとの各々を、左辺と右辺とで入れ替えても成立する。ただし、式(5)において音響リアクタンス行列Z
iと音響レジスタンス行列Z
rと入れ替えた場合の一般化固有値問題の固有値は、元の式(5)におけるRA比の逆数となる。従って、かかる場合には、固有値が最小となる場合の固有ベクトルに基づいて、マイクロホンアレイ20を構成する個々のマイクロホンの感度及び極性を設定する。
【0032】
一般化固有値問題を解くに際して、音響レジスタンス行列Z
rについての標準固有値問題を最初に解く。実数、正である固有値を要素とする対角行列Λ
rと、実数である固有ベクトルを列とする直交行列Φ
rとは、下記の式(6)を満たす。
【0033】
上記の式(6)において、Φ
T
rは、Φ
rの転置行列である。Φ
rΛ
r
-1/2を用いることにより、音響リアクタンス行列Z
iを下記の式(7)のように変換する。
【0034】
上記の式(7)において、-1/2は、対角要素の平方根の逆数を意味する。Z
i’は、実数である対称行列である。次に、Z
i’についての標準固有値問題を解く。実数である固有値を各対角要素に並べた対角行列Λと、実数である固有ベクトルを各列に並べた直交行列Φ
iとは、下記の式(8)を満たす。
【0035】
実数行列であるΦを下記の式(9)のように定義すると、式(10)及び式(11)に示すような対角化が可能になる。
【0036】
式(10)におけるIは、単位行列である。式(10)の両辺に右側からΛを乗じ、その結果を式(11)と比較すると、式(5)が得られる。式(10)及び式(11)に示す対角化により、複素音響パワーWは、式(13)のように記述できる。
【0037】
複数のスピーカで構成されたスピーカアレイでは複数の固有値及び固有ベクトルが存在するが、特定の次数m(m次)の固有ベクトルφ
mにのみ基づいてスピーカアレイを設計する場合、複素速度ベクトルvは下記の式(12)で示される。ただし、u
mは任意の係数である。
【0038】
このとき、複素音響パワーWは、下記の式(13)で示される。
【0039】
m次の固有値λmは、アクティブ音響パワーWr に対するリアクティブ音響パワーWiの比であるRA比を意味する。また、固有ベクトルφmは、各スピーカの振幅及び位相を意味する(この固有ベクトルは一般化放射モードとも呼ばれる)。従って、RA比を最大にするには、固有値が最大の固有ベクトルに従って各スピーカの振幅及び位相を設定する。なお,固有値λmも固有ベクトルφmも実数なので、位相の設定と言っても、スピーカの端子の電気的な極性の正負を設定するだけでよい。
【0040】
上述のスピーカアレイの理論を、接話用マイクロホンアレイに応用していく。まず、スピーカアレイにおける式(12)を考慮すると、RA比を最大にするには、固有値が最大の固有ベクトルに従って各スピーカの振幅及び位相を設定することになる。
【0041】
ここで、任意の位置r
oで観測される複素音圧p(r
o)は、下記の式(14)で表される。下記の式(14)において、zは音源と観測点との間の音響伝達関数である比音響インピーダンスの行ベクトルである。音圧レベルは、スピーカアレイから近い場合は高くなり、遠い場合は低くなることが予想される。
【0042】
続いて、音源と観測点とを入れ替えて考えると、相反性により、下記の式(15)が成り立つ。式(15)におけるq(r
o)=Svは、r
oに位置する音源の複素体積速度(m
3/s)であり、ここでのvは、この音源の表面積をSとしたときに対応する複素速度である。
【0043】
式(15)中のpは、マイクロホンアレイを構築する各マイクロホンで観測される複素音圧をベクトル要素とする列ベクトルである。そして、下記の式(16)で表されるフィルタ処理を行う。
【0044】
式(16)左辺のφT
mpは、φT
mzTに比例し、かつφT
mzT=zφmであり、さらに式(14)より、複素音圧p(ro)は、zφmに比例する。それゆえに、マイクロホンアレイの感度は、マイクロホンアレイが音源からから近い場合は高くなり、遠い場合は低くなることが見込まれる。
【0045】
本実施形態では、音響レジスタンス行列Zr及び音響リアクタンス行列Ziに係る一般化固有値問題を解くことにより、マイクロホンアレイを構成する各マイクロホンの感度及び極性を決定する。マイクロホンアレイにおける至適なフィルタφT
mは、固有値が最大となる固有ベクトルとして得られる。比音響インピーダンスは周波数に依存し、固有値及び固有ベクトルは周波数に依存する。
【0046】
本実施形態では、最大固有値に係る固有ベクトルは、マイクロホンアレイを構成する個々のマイクロホンの感度(振幅)及び極性(位相)を示す。上述のように、固有値及び固有ベクトルは実数で構成されるので、個々のマイクロホンの位相の調整は、正又は負のうち何れか一方の符号を設定するだけでよい。
【0047】
続いて、本実施の形態に係るマイクロホンアレイ20の作用について説明する。本実施形態では、シミュレーションモデルを用いて、マイクロホンアレイ20の特性を解析する。当該シミュレーションでは、マイクロホンアレイ20表面の比音響インピーダンスzは、マイクロホンアレイ20と同じ幾何学形状のスピーカアレイ表面の比音響インピーダンスとして、下記の式(17)によって算出される。
【0048】
上記の式(17)において、ρは空気密度で、ρ=1.21kg/m3であり、kは波数で、k=ω/cであり、ωは角周波数、cは空気中の音速であり、c=340m/sであり、rは音源と観測点との距離である。
【0049】
前述のように、比音響インピーダンス行列Zのi行j列要素は、i番目のスピーカ表面とj番目のスピーカ表面の間の比音響インピーダンスである。式(17)左辺のzは、比音響インピーダンス行列Zの行列要素を示す。式(17)右辺のrは、i番目のスピーカ表面とj番目のスピーカ表面との間の距離である。行列Zの非対角要素(i≠j)を計算する場合、r≠0なので、rを右辺の分母に有する式(17)を適用できる。しかし、行列Zの対角要素(i=j)を計算する場合、r=0なので、右辺の分母にrを有する式(17)では、計算結果が発散してしまう。かかる場合には、上記の式(17)に代えて、下記の式(18)を用いてzを算出する。
【0050】
特異な場合として、r=0での比音響インピーダンスzを算出する式(18)は下記のようになる。式(18)において、l
pは、正方形であるとみなしたマイクロホンの振動板の一辺の長さであり、S=l
p
2(一例として、l
p=0.005m)である。
【0051】
図2は本発明の実施形態に関わるマイクロホンアレイ20の一例を示す説明図である。
図2に示すマイクロホンアレイ20は、固有値及び固有ベクトルの数値解析を行うためのシミュレーションモデルであり、この例では、マイクロホンアレイ20は、XYZ空間内のXY平面(無限大バッフル)のX軸上に配置される5個のマイクロホン20-1、20-2、…、20-5を備えている。
【0052】
X方向における各マイクロホンの間隔はLxである。後述するように、数値解析のシミュレーションでは、Lx=0.015mとした。
【0053】
図3は、本実施形態におけるシミュレーションにおける、各々のマイクロホンが線状に配置されたマイクロホンアレイ20の構成の一例を示した説明図である。
図3(A)はマイクロホンが2個の場合、
図3(B)はマイクロホンが3個の場合、
図3(C)はマイクロホンが4個の場合、
図3(D)はマイクロホンが5個の場合を各々示している。
【0054】
図3(A)~(D)のいずれの場合も、マイクロホンアレイの中心はx軸の原点Oと一致している。隣接したマイクロホンの間隔は、計測対象とする上限周波数である3400Hz時の音波の波長の半波分の長さである0.015mである。一般に、音声通話の周波数帯は300Hzから3400Hzであり、3400Hzは、当該周波数帯の上限値に相当する。
【0055】
図4は、本実施形態におけるシミュレーションにおける、各々のマイクロホンが線状に配置されたマイクロホンアレイ20の周波数に対する固有値の変化を示した説明図である。
図4(A)はマイクロホンが2個の場合、
図4(B)はマイクロホンが3個の場合、
図4(C)はマイクロホンが4個の場合を、
図4(D)はマイクロホンが5個の場合を各々示している。
【0056】
一般化放射モードは、マイクロホンアレイ20を構成するマイクロホンの個数に応じた次数の放射モードで構成される。例えば、マイクロホンアレイ20を構成するマイクロホンが2個の場合は、1次の放射モードと2次の放射モードを有し、マイクロホンが3個の場合は、1次の放射モードと2次の放射モードと3次の放射モードとを有する。
【0057】
図4では、固有値の大きい順に、1次、2次、3次…と番号を付けている。従って、次数が小さいほど、固有値は大きくなり、1次の固有値が、最大の固有値となる。また、マイクロホンアレイ20を構成するマイクロホンの数が多いほど、固有値の最大値は大きくなる。
【0058】
従って、マイクロホンアレイ20を構成するマイクロホンの個数が多いほど、マイクロホンアレイ20におけるRA比を大きくすることができる。
【0059】
図5(A)はマイクロホンが2個の場合、
図5(B)はマイクロホンが3個の場合、
図5(C)はマイクロホンが4個の場合、
図5(D)はマイクロホンが5個の場合、の各々における周波数300Hz、1850Hz、3400Hzでの固有ベクトルの変化の一例を示した説明図である。
【0060】
図5(A)~(D)の各々は、各々の固有ベクトルのベクトル要素における最大の絶対値で正規化されている。また、固有ベクトルの各々はマイクロホンアレイ20を構成する個々のマイクロホンの振幅(感度)及び位相(極性)を示す。具体的には、固有ベクトルのベクトル要素の数値は個々のマイクロホンの振幅(感度)を、固有ベクトルのベクトル要素の符号は個々のマイクロホンの位相(極性)を、各々示している。例えば、固有ベクトルのベクトル要素の数値の絶対値が大きければ、当該マイクロホンには高い感度が要求され、当該マイクロホンの固有ベクトルのベクトル要素の符号がマイナスであれば、符号がプラスを示すマイクロホンとは電気的な端子の極性が逆であることを示している。
【0061】
図5(A)は、2個のマイクロホンで構成されたマイクロホンアレイ20が、一次勾配マイクロホンに帰着することを示している。
【0062】
図5(B)は、3個のマイクロホンで構成されたマイクロホンアレイ20が、3個のマイクロホンで構成された二次勾配マイクロホンに帰着することを示している。
【0063】
図5(C)は、4個のマイクロホンで構成されたマイクロホンアレイ20が、4個のマイクロホンで構成された二次勾配マイクロホンとは異なることを示している。当該二次勾配マイクロホンの出力pは、下記の式のようになる。下記の式中のx
1、x
2、x
3、及びx
4は、
図3(C)に示したような各々のマイクロホンのx座標である。4個のマイクロホンで構成されたマイクロホンアレイ20と、二次勾配マイクロホンとの感度の違いについては後述する。 p=p(x
1,0,0)-p(x
2,0,0)-p(x
3,0,0)+p(x
4,0,0)
【0064】
図5(D)は、5個のマイクロホンで構成されたマイクロホンアレイ20を構成する各マイクロホンの感度及び極性を意味する。
【0065】
図5(A)~(D)に示したように、固有値が最大となる固有ベクトルは、ほとんど周波数に依存しない。従って、ある周波数における固有ベクトルは、当該周波数を含む一定の周波数範囲において、実用上十分なレベルで近い音源の音を優先的に検出することに用いることができる。これにより、周波数毎に異なる固有ベクトルに従って各マイクロホンの振幅(感度)及び位相(極性)を制御する必要がなく、マイクロホンアレイ20の構築に係る手順を簡素化できる。
【0066】
図6、
図7、
図8及び
図9の各々は、
図2に示した位置関係において、y=0としたx-z平面でのマイクロホンアレイ20の周波数300Hz、1850Hz及び3400Hzにおける感度分布を示した説明図である。
図6、
図7、
図8及び
図9の各々において、暗く表示された領域は感度が低く、明るく表示された領域は感度が高い。
【0067】
図6、
図7、
図8及び
図9の各々は、x-z平面での|φ
T
mp|の最大値によって正規化された数値をdB単位でプロットしている。具体的には、|φ
T
mp|の最大値をMAX(|φ
T
mp|)とすると、20log
10[|φ
T
mp|/MAX(|φ
T
mp|)]dBとして定義された値がプロットされている。
【0068】
図6(A)は周波数が300Hzの場合、
図6(B)は周波数が1850Hzの場合、
図6(C)は周波数が3400Hzの場合の、2個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
図6(A)~(C)に示したように、各々の周波数において、x軸の中心0mでは望ましくない節状の感度が低い領域があるが、0mを除くx軸の中心領域で最も感度が高く、当該中心領域からx軸方向、又はz軸方向に離れるに従って感度は徐々に低下する。節状の感度が低い領域は、後述する
図8(A)、
図8(B)及び
図8(C)でも認められる。
【0069】
図7(A)は周波数が300Hzの場合、
図7(B)は周波数が1850Hzの場合、
図7(C)は周波数が3400Hzの場合の、3個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【0070】
図8(A)は周波数が300Hzの場合、
図8(B)は周波数が1850Hzの場合、
図8(C)は周波数が3400Hzの場合の、4個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【0071】
図9(A)は周波数が300Hzの場合、
図9(B)は周波数が1850Hzの場合、
図9(C)は周波数が3400Hzの場合の、5個のマイクロホンが線状に配置されたマイクロホンアレイの感度分布の一例を示した説明図である。
【0072】
図7~
図9では、周波数の違いによる感度の差異が若干あり、特に周波数300Hzでは、マイクロホンが配置された0mの位置において、マイクロホンから近距離の感度が顕著に高い。そして、マイクロホンアレイ20を構成するマイクロホンの個数が3、4、5と増えるに従って、感度が高い領域がよりマイクロホンに近い領域に限定されていくことを示す。
【0073】
図10は、原点Oに配置した1個のマイクロホンの感度分布の一例を示した説明図である。マイクロホンが1個の場合は、周波数による顕著な変化が認められないので、周波数300Hzの場合のみを例示する。
【0074】
マイクロホンが1個の場合である
図10と、マイクロホンが2個の場合である
図6(A)~(C)を比較すると、マイクロホンが配置された原点Oを中心に感度が徐々に低下する
図10に対して、
図6(A)~(C)の場合は、一次勾配マイクロホンと同様であることが窺える。しかしながら、
図6(A)~(C)の場合は、前述のように原点Oを中心に、望ましくない節状の感度の低い領域が生じている、かかる感度が低い領域は、マイクロホンが4個の場合である図(8)、
図8(B)及び
図8(C)にも認められる。
【0075】
マイクロホンが偶数個の場合に、
図6(A)~(C)、
図8(A)~(C)のような原点Oを中心とした感度の低い領域が生じるのは、マイクロホンが2個の場合の
図5(A)及びマイクロホンが4個の場合の
図5(C)に示したように、原点Oを挟んで固有ベクトルが同振幅・逆位相の様相を呈していることに関係がある。また、前述のように、マイクロホンアレイ20を構成するマイクロホンの個数が3、4、5と増えるに従って、感度が高い領域がよりマイクロホンに近い領域に限定されていくことを示すので、マイクロホンアレイ20を構成するマイクロホンは奇数個が望ましく、さらには3個よりも5個というように、マイクロホンアレイ20を構成するマイクロホンの数が多い方が接話用マイクロホンアレイとしてより良好な特性が見込める。
【0076】
図11(A)は周波数が300Hzの場合、
図11(B)は周波数が1850Hzの場合、
図11(C)は周波数が3400Hzの場合の、4個のマイクロホンで構成された2次勾配マイクにおける感度分布の一例を示した説明図である。当該二次勾配マイクロホンは、出力が、p(x
1,0,0)-p(x
2,0,0)-p(x
3,0,0)+p(x
4,0,0)となる。
【0077】
本実施形態に係る4個のマイクロホンで構成されたマイクロホンアレイ20の感度特性を示す
図8(A)~(C)と、
図11とを比較すると、本実施形態に係る4個のマイクロホンで構成されたマイクロホンアレイ20は、原点O近傍での感度の遠近におけるコントラストが
図11(A)~(C)で示した二次勾配マイクロホンよりも顕著であり、
図8(A)~(C)に示したマイクロホンアレイ20は、感度の高い領域が原点Oの近傍に集中している。
【0078】
図12(A)は、原点Oに配置した1個のマイクロホンの周波数に対する感度特性を、
図12(B)は、
図3(D)に示したような、左右から3番目のマイクロホンを原点Oに配置した5個のマイクロホンが線状に配置されたマイクロホンアレイの周波数に対する感度特性を、各々示した説明図である。
図12(A)及び
図12(B)では、マイクロホンアレイからz軸方向の各々異なる距離に1個の点音源が存在する場合の周波数に対するマイクロホンアレイの感度の変化を示している。点音源の座標は、(0m、0m、0.01m)、(0m、0m、0.05m)、(0m、0m、0.1m)、(0m、0m、0.5m)、(0m、0m、1m)である。音源の出力が一定であれば、音圧は前述の式(17)に示したように、周波数に比例するので、本実施形態では、音源の出力が周波数に反比例するように操作している。その結果、
図12(A)においては、1個のマイクロホンにおける周波数に対する反応が平坦になっている。
【0079】
図12(A)に示したように、1個のマイクロホンの感度は、音源との距離に従って減少し、球形波の距離減衰を示す。
【0080】
図12(B)の場合も、
図12(A)の場合と同様に、音源の出力が周波数に反比例するように操作している。
図12(A)及び
図12(B)に示したように、本実施形態に係るマイクロホンアレイ20の特性を示した
図12(B)では、距離減衰が
図12(A)の場合よりも顕著となっている。また、音源から至近距離では周波数に対する反応はほとんど平坦であるが、音源から離れる程、低周波数域の感度が低下するハイパスフィルタのような特性を示す。
【0081】
周波数に対する反応を平坦にするには、追加のイコライザが必要となる。
【0082】
以上説明したように、本実施形態に係るマイクロホンアレイ20は、固有値が最大となる固有ベクトルに従って、各々のマイクロホンの感度及び極性を設定することにより、マイクロホンアレイ20と音源とが接近した場合に感度が高く、マイクロホンアレイ20と音源とが離れている場合に感度が低くなる接話用に適した特性を有するマイクロホンアレイ20を実現できる。
【0083】
一般化固有値問題は、上述の式(5)において、音響リアクタンス行列Ziと音響レジスタンス行列Zrとの各々を、左辺と右辺とで入れ替えても成立するが、かかる入れ替えを行った場合の一般化固有値問題の固有値は、元の式(5)におけるRA比の逆数となる。従って、かかる場合には、固有値が最小となる場合の固有ベクトルに基づいて、マイクロホンアレイ20を構成する個々のマイクロホンの感度及び極性を設定する。本実施形態では、式(5)に基づいて一般化固有値問題を扱った場合も、式(5)において音響リアクタンス行列Ziと音響レジスタンス行列Zrとの各々を、左辺と右辺とで入れ替えた場合も、固有値が極値となる場合の固有ベクトルに基づいて各々のマイクロホンの感度及び極性を設定する。
【0084】
まとめると、式(5)における一般化固有値問題では、比音響インピーダンスの虚部を要素とする行列である音響リアクタンス行列Ziと固有ベクトルを列とする実数行列Φとの積が、比音響インピーダンスの実部を要素とする行列である音響レジスタンス行列Zrと固有ベクトルを列とする実数行列Φと固有値を要素とする対角行列Λとの積に等しい場合に、固有値が最大値となる固有ベクトルの要素に基づいて各々のマイクロホンの感度及び極性を設定する。固有値が最大値となるのは、アクティブ音響パワーWrに対してリアクティブ音響パワーWiが最大となる場合である。
【0085】
また、式(5)において音響リアクタンス行列Ziと音響レジスタンス行列Zrとの各々を、左辺と右辺とで入れ替えた場合の一般化固有値問題では、音響レジスタンス行列Zrと実数行列Φとの積が、音響リアクタンス行列Ziと実数行列Φと対角行列Λとの積に等しい場合に、固有値が最小値となる固有ベクトルの要素に基づいて各々のマイクロホンの感度及び極性を設定する。固有値が最小値となるのは、リアクティブ音響パワーWiに対してアクティブ音響パワーWrが最小となる場合である。
【0086】
複数のマイクロホンで構成されたマイクロホンアレイには一次勾配マイクロホン又は二次勾配マイクロホンが存在するが、一次勾配マイクロホン及び二次勾配マイクロホンは、本実施形態に係るマイクロホンアレイ20のように、固有値と固有ベクトルから個々のマイクロホンの最適な設定を考慮しておらず、マイクロホンを4個、又は5個備えた本実施形態に係るマイクロホンアレイ20に匹敵するような接話用に適した特性を備えていない。
【0087】
本実施形態に係るマイクロホンアレイ20では、マイクロホンの個数も重要で、偶数個のマイクロホンを原点Oに対して対称に配置すると、
図5(A)及び
図5(C)に示したように、原点Oを挟んで固有ベクトルが同振幅・逆位相の様相を呈することにより、
図6(A)~(C)、
図8(B)及び図(C)に示したように、原点Oでマイクロホンアレイ20の感度が著しく低下する現象が生じ得る。
【0088】
かかる現象を回避するには、マイクロホンアレイ20を奇数個のマイクロホンで構成し、原点Oに1個のマイクロホンを配置し、残りのマイクロホンを原点Oに対して対称に配置する。かかる配置により、原点Oでマイクロホンアレイ20の感度が著しく低下する現象を回避できる。
【0089】
また、マイクロホンアレイ20を構成するマイクロホンの個数も、同じ奇数個であっても、3個よりも5個の方が、より接話用に適した特性を備えるようになる。
【0090】
本実施形態に係るマイクロホンアレイ20は、電話又はヘッドセット等での用途に適した接話用に適した特性を有するが、これに限定されない。接話用以外にも、周囲の喧騒を検出せずに、川のせせらぎや虫が羽ばたく音等の収音を行う為の近音源用マイクロホンアレイとしての特性も有している。
【0091】
以上、説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更又は改良され得るととともに、本発明にはその等価物も含まれる。すなわち、実施形態に当業者が適宜設計変更を加えたものも、本発明の特徴を備えている限り、本発明の範囲に包含される。また、実施形態が備える各要素は、技術的に可能な限りにおいて組み合わせることができ、これらを組み合わせたものも、本発明の特徴を含む限り、本発明の範囲に包含される。
【符号の説明】
【0092】
10 音響入力装置
20 マイクロホンアレイ
20-1、20-2、20-3、20-4、20-5 マイクロホン
30 アンプアレイ
30-1、20-2、20-3、20-4、20-5 アンプ