(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0006】
自動車の車室内においては領域によって優先的に聞き取りたい音情報が異なる。例えば、上記の通り運転席においてはカーナビゲーションによる音声ガイダンスを優先的に聞き取れることが好ましく、後部座席においては音楽を優先的に聴けることが好ましい。
【0007】
特許文献1で提案されている発明は、運転席においてカーナビゲーションによる音声ガイダンスを優先的に聞き取れるようにすることはできる。しかしながら、自動車の車室内全体に対して音場特性や出力音声を調整するため、運転席においてカーナビゲーションによる音声ガイダンスを優先的に聞き取れるようにすると、後部座席においてもカーナビゲーションによる音声ガイダンスが優先的に聞こえるようになってしまっていた。
【0008】
かかる点に鑑みてなされた本発明の目的は、閉空間において、領域ごとに独立して重要な音情報を聞き取ることができるように音場を制御することができる音場制御装置、音場制御システム及び音場制御方法を提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するため、本発明に係る音場制御装置は、複数のスピーカを有する閉空間において、入力される複数の音情報による該閉空間における音場を制御する音場制御装置であって、前記複数の音情報の各々に対し、該各音情報の伝達対象の領域に応じたフィルタ係数を有するフィルタを通して複数の音響信号を生成する音響信号生成部と、前記複数の音響信号を加算する信号加算部と、加算された前記音響信号を前記複数のスピーカに供給する音響出力部とを備え、前記フィルタ係数は、前記複数のスピーカから前記閉空間内の複数の領域への伝達行列と、前記複数の領域における目標音場に基づいて算出されることを特徴とするものである。
【0010】
また、本発明に係る音場制御装置において、前記フィルタ係数は、前記伝達行列と前記目標音場に関する最適化問題の解として算出されることが好ましい。
【0011】
また、本発明に係る音場制御装置において、前記最適化問題の解は正則化係数βを含み、前記フィルタ係数は、該正則化係数βに応じて異なる値となることが好ましい。
【0012】
また、本発明に係る音場制御装置において、前記最適化問題の解は下記の式(1)で与えられることが好ましい。
【数1】
ただし、式(1)において、A
Fは最適化問題の解を示し、Gは伝達行列を示し、βは正則化係数を示し、Iは単位行列を示し、H
targetは目標音場を示す。
【0013】
また、本発明に係る音場制御装置において前記正則化係数βは下記の式(2)で与えられることが好ましい。
【数2】
ただし、式(2)において、fは周波数を示し、α及びbは、α>0、b>0となる数を示す。
【0014】
また、本発明に係る音場制御装置において、b=1/2であることが好ましい。
【0015】
また、本発明に係る音場制御装置において、前記正則化係数βを設定する設定部をさらに備えることが好ましい。
【0016】
また、本発明に係る音場制御装置において、前記設定部は、複数の前記領域において前記複数の音情報の音量をそれぞれ設定することが好ましい。
【0017】
また、本発明に係る音場制御装置において、前記設定部は、複数の前記領域において音像位置をそれぞれ設定することが好ましい。
【0018】
また、上記課題を解決するため、本発明に係る音場制御システムは、閉空間において、入力される複数の音情報による該閉空間における音場を制御する音場制御装置と、複数のスピーカとを備える音場制御システムであって、前記音場制御装置は、前記複数の音情報の各々に対し、該各音情報の伝達対象の領域に応じたフィルタ係数を有するフィルタを通して複数の音響信号を生成する音響信号生成部と、前記複数の音響信号を加算する信号加算部と、加算された前記音響信号を前記複数のスピーカに供給する音響出力部とを備え、前記フィルタ係数は、前記複数のスピーカから前記閉空間内の複数の領域への伝達行列と、前記複数の領域における目標音場に基づいて算出されていることを特徴とするものである。
【0019】
また、本発明に係る音場制御システムにおいて、前記複数のスピーカは、スピーカ配置選択装置によって選択されたスピーカであり、前記スピーカ配置選択装置は、前記複数のスピーカの数より多い初期配置数のスピーカが設置された状態において、該初期配置数のスピーカから前記閉空間内の複数の領域への伝達行列に対して特異値分解を行い、前記特異値分解によって得られた直交行列から前記初期配置数のEfI(Effective Independence)値を算出し、前記初期配置数のEfI値から、EfI値が上位のスピーカを所望の個数選択することにより前記複数のスピーカを選択することが好ましい。
【0020】
また、上記課題を解決するため、本発明に係る音場制御方法は、複数のスピーカを有する閉空間において、入力される複数の音情報による該閉空間における音場を制御する音場制御方法であって、前記複数の音情報の各々に対し、該各音情報の伝達対象の領域に応じたフィルタ係数を有するフィルタを通して複数の音響信号を生成するステップと、前記複数の音響信号を加算するステップと、加算された前記音響信号を前記複数のスピーカに供給するステップとを含み、前記フィルタ係数は、前記複数のスピーカから前記閉空間内の複数の領域への伝達行列と、前記複数の領域における目標音場に基づいて算出されることを特徴とするものである。
【発明の効果】
【0021】
本発明によれば、閉空間において、領域ごとに独立して重要な音情報を聞き取ることができるように音場を制御することができる音場制御装置、音場制御システム及び音場制御方法を提供することができる。
【発明を実施するための形態】
【0023】
以下、本発明に係る実施形態について、図面を参照して説明する。
【0024】
図1は、本発明の一実施形態に係る音場制御システム10の概略構成を示す図である。音場制御システム10は、例えば自動車の車室内のような閉空間において、多領域で独立した音情報を伝達するシステムである。ここで、「多領域」とは、運転席や後部座席のような複数の領域を意味する。また、「音情報」は、例えば、音楽やカーナビゲーションの音声ガイダンスなどである。音場制御システム10は、例えば、運転席では音声ガイダンスが聞き取りやすく、後部座席では音楽が聴き取りやすくなるように、領域ごとに音場を独立して制御する。
【0025】
音場制御システム10は、音場を制御する音場制御装置100と、各種の音情報を出力する信号再生装置200と、複数のスピーカ300とを備える。
【0026】
音場制御装置100は、信号再生装置200から入力される複数の音情報について、領域ごとに音場を独立制御して、複数のスピーカ300から音情報を再生させる。音場制御装置100の詳細については後述する。
【0027】
信号再生装置200は、例えば、CDやHDDなどに記録された音楽、カーナビゲーションの音声ガイダンス、電話音声、ラジオ放送、インターネット上にあるサーバから配信された音情報などを音場制御装置100に各種フォーマットで出力する。
図1では、信号再生装置200が1台の構成を示しているが、信号再生装置200は、複数の装置であってもよい。
【0028】
スピーカ300は、閉空間に複数個設置されている。例えば、
図2に示す例においては、自動車の車室内において24箇所に設置されている。
図2においては、スピーカ300の位置は「音源位置」として白丸で示されている。
【0029】
音場制御装置100は、信号分離部101と、環境音信号調整部102と、音響信号生成部103と、信号加算部104と、複数の音響出力部105と、記憶部106と、設定部107とを備える。
【0030】
信号分離部101は、信号再生装置200から入力された音情報を分離して、音情報に応じて、環境音信号調整部102又は音響信号生成部103に出力する。
【0031】
信号分離部101は、独立して音場を制御する必要がなく各領域で共通して聴取する音情報は環境音信号調整部102に出力する。また、信号分離部101は、独立して音場を制御する必要がある音情報は音響信号生成部103に出力する。
【0032】
また、信号分離部101は、例えば音情報が5.1chフォーマットの場合、センタースピーカに配分されている音声情報を分離することもできる。
【0033】
環境音信号調整部102は、信号分離部101から入力された音情報を信号加算部104に出力する。
【0034】
音響信号生成部103は、入力された複数の音情報の各々に対し、各音情報の伝達対象の領域に応じたフィルタ係数を有するフィルタを通して複数の音響信号を生成する。音響信号生成部103は、例えば、カーナビゲーションによる音声ガイダンスの伝達対象の領域が運転席(領域A)であり、音声ガイダンスを、領域Aで聞き取りやすく、後部座席左側(領域B)ではほとんど聞こえないようにする場合、音声ガイダンスの音情報は、領域A用のフィルタ係数を有するフィルタ(領域A用のフィルタ)に通して音響信号を生成して信号加算部104に出力する。ここで、領域A用のフィルタとは、領域Aの音場を中心に制御するフィルタであり、例えば、領域Aでは聞き取りやすく、領域Bではほとんど聞こえなくなるように音場を制御するフィルタである。
【0035】
音響信号生成部103は、設定部107による設定に応じてフィルタ特性を変更することができる。音響信号生成部103は、設定部107による設定に応じて、フィルタ特性を変更するために必要なフィルタ係数を記憶部106から読み出す。
【0036】
信号加算部104は、環境音信号調整部102及び音響信号生成部103から入力された複数の音響信号を加算し、複数の音響出力部105に出力する。
【0037】
音響出力部105は、信号加算部104で加算された音響信号をスピーカ300に供給する。音響出力部105の数はスピーカ300の個数に対応している。
【0038】
記憶部106は、音響信号生成部103が用いるフィルタのフィルタ係数を記憶している。記憶部106は、各領域用のフィルタ係数を記憶している。また、記憶部106は、各領域について設定の異なる複数のフィルタ係数を記憶している。
【0039】
設定部107は、ユーザから各種設定を受け付け、受け付けた設定を音響信号生成部103に出力する。設定部107が設定する内容の詳細については後述する。
【0040】
ここで、
図2及び
図3を参照して、記憶部106が記憶しているフィルタ係数について説明する。フィルタ係数は、予め記憶部106に記憶されているが、以下に示すような方法により、算出されている。
【0041】
図2は、自動車の車室内に設置されたスピーカ300の位置(音源位置)と、マイクロホンの位置(測定位置)を示す図である。
図2に示す例においては、スピーカは24箇所に設置されている。また、
図2に示す例においては、領域A(運転席)及び領域B(後部座席左側)にマイクロホンが設置されている。マイクロホンの位置は黒丸で示されている。
【0042】
実際に各スピーカ300から音を出力し、各マイクロホンで音を測定することにより、各スピーカ300と各マイクロホンとの組み合わせについて伝達関数を測定することができる。
図2に示す例においては、スピーカとマイクロホンはそれぞれ複数あり、音源と音場との関係は、伝達行列Gとして定義することができる。
【0043】
複数の音源(スピーカ)で構成された音源アレーによる音圧応答Hは、下記の式(3)によって求められる。
【数3】
【0044】
ここで、A
Fは、各音源間の相対的な音源強度や位相の差を表現するベクトルである。目標音場がH
targetで与えられれば、必要な音源条件は下記の式(4)によって求められる。
【数4】
【0045】
ここで、(G)
+は、Gの疑似逆行列である。
【0046】
音源に入力される入力パワーを最適化するため、下記の式(5)のような最適化問題において、目標音場H
targetと実音場(音圧応答)H(=GA
F)との誤差Jを最小化する解A
Fを求める。
【数5】
【0047】
ここで、右上のHは、転置行列であることを意味する。式(5)を、J=0としてA
Fについて解くと、下記の式(6)のように変形することができる。
【数6】
【0048】
ここで、正則化係数βは対角成分の加重値であり、Iは単位行列である。記憶部106は、このようにして求めたA
Fに対応するフィルタ係数を記憶している。
【0049】
また、式(5)は、連立方程式の条件数を下げて雑音の影響を低減するティホノフ(Tikhonov)正則化と同じ形であり、行列の対角成分に加重値をかけることによって、条件数を低くする方法である。
【0050】
ここで、「条件数」とは、誤差に対するシステムの敏感度を評価する指標である。条件数が小さくなるようにシステムを構成することにより、システムのロバスト性を高めることができる。自動車の車室内のような体積の小さい閉空間では伝達関数に誤差が生じやすいため、条件数を小さくしてロバスト性を高めることが有効である。
【0051】
図3に、多領域音場制御によって各制御領域に対して求められた音圧集中の解を、重畳の原理に基づき合成する様子の概念図を示す。音圧集中問題は逆問題法以外でも様々な方法が提案されているが、狭い内部空間の特性を反映するため逆問題法を適用する。まず、一つの領域Aに音を伝達させ、他の領域Bに音を伝達させないフィルタを導く。次に、領域Aと領域Bを入れ替えて領域Bに音を伝達させ、他の領域Aに音を伝達させないフィルタを導く。これらの二つのフィルタを重ねて用いることで各領域の音場を独立して制御することができる。領域A及び領域Bにおける目標音場を、それぞれ、H
target,A及びH
target,Bとすると、目標音場は、それぞれ、下記の式(7)及び(8)によって表現することができる。
【数7】
【数8】
【0052】
ここで、A
Tは作りたい仮想の音場を構成する音源の音源強度であり、Wは自由音場の伝達行列である。
【0053】
以後、実際に音場が分離される様子を示す。
【0054】
式(5)及び(6)における正則化係数βは一意に決まるものではなく、種々の形式を取り得る。例えば、正則化係数βは下記の式(9)に示すような形式とすることができる。
【数9】
【0055】
ここでfは周波数である。また、α及びbは、α>0、b>0となる数である。
【0056】
一例として、正則化係数βを下記の式(10)としてフィルタ係数を計算した場合の領域A及び領域Bにおける平均音圧レベルを比較した結果を
図4に示す。ここで、平均音圧レベルとは、領域に設置した複数のマイクロホンが測定した音圧レベルの平均値である。
【数10】
【0057】
図4の横軸は周波数であり、縦軸は平均化した音圧レベルである。
図4(a)は領域A用のフィルタを通した信号の音圧レベルを示し、
図4(b)は領域B用のフィルタを通した信号の音圧レベルを示す。
図4(a)においては、200Hz〜2kHzの周波数帯域の全体にわたって領域Aで測定した音圧レベルが領域Bで測定した音圧レベルより大きく、音場を効果的に分離できている。しかしながら、
図4(b)においては、領域Aで測定した音圧レベルが領域Bで測定した音圧レベルより大きくなっている周波数があるなど、音場を効果的に分離できていない。
【0058】
次に、
図5に、正則化係数βを下記の式(11)とした場合の結果を示す。
【数11】
【0059】
図5は、正則化係数βがβ=40/√fである場合の、領域A及び領域Bにおける平均音圧レベルを比較した結果を示す図である。
図5(a)は領域A用のフィルタを通した信号の音圧レベルを示し、
図5(b)は領域B用のフィルタを通した信号の音圧レベルを示す。
図5(a)においては、200Hz〜2kHzの周波数帯域の全体にわたって領域Aで測定した音圧レベルが領域Bで測定した音圧レベルより10dB以上大きく、音場を効果的に分離できている。また、
図5(b)においても、200Hz〜2kHzの周波数帯域の全体にわたって領域Bで測定した音圧レベルが領域Aで測定した音圧レベルより10dB以上大きく、音場を効果的に分離できている。
【0060】
図6は、正則化係数βをβ=α/√fの形式とし、αの値をふった場合の各領域における音圧レベルの差を示す図である。領域Aではαが小さい程音圧レベルの差が大きく、領域Bではαが大きいほど音圧レベルの差が大きい。
【0061】
このように、αの値によって音圧レベルの差が異なる値となるため、設定部107で設定して、例えばαの値を可変にして正則化係数βの値を変えることにより、音圧レベルの差を制御することができる。本実施形態においては、ユーザが設定部107でαを設定し、音響信号生成部103が、設定されたαに応じたフィルタで信号を処理することにより、音圧レベルの差を制御することができる。これにより、例えば領域Aにおいて、2つの音情報のうちの片方だけを聞き取りやすくするように制御することもできるし、2つの音情報が同等程度に聞こえるようにすることもできる。
【0062】
図7は、正則化係数βが、β=1/fの場合と、β=40/√fとで、条件数を比較したものである。β=40/√fとした場合の方が、β=1/fとした場合よりも条件数が小さく、条件数が小さいほど音場分離効果が大きいことが想定される。
【0063】
[音量操作]
設定部107は、ユーザから各音情報についての音量設定を受け付けることができる。設定部107は、受け付けた音量設定を音響信号生成部103に出力し、音響信号生成部103は、音量設定に応じて音量を調整する。これにより、各領域において二つの音情報の混合比率を変えることができる。また、周波数ごとに音情報の混合比率を調整したい場合は、入力情報にイコライザを用いることにより、周波数ごとに混合比率を調整することもできる。
【0064】
図8に、多領域において音量を操作するための操作インタフェースの一例を示す。例えば、操作インタフェースがタッチスクリーンである場合、ピンチインやピンチアウトなどの操作を行うことにより、各音情報に対してそれぞれ独立した音量を操作することができる。なお、
図8に示す例は、あくまで一例であって、操作インタフェースは、異なる方法によるものであってもよい。
【0065】
[音像操作]
式(7)及び式(8)においては、二つの領域A及びBにおいて、目標音場H
taget,A及びH
target,Bを自由に表現することができる。例えば、領域Aにおいて音像が無い状態にする場合は、領域Aの全てのマイクロホンにおいて1となるような目標音場とする。また、領域Aにおいて音像を付けた状態にする場合は、例えば横壁面よりの音像にしたい場合には横壁面の反対側のマイクロホンを1未満にするなどとする。このように、それぞれの目標音場に対してマイクロホンへの入力バランスを考慮することにより、音像の位置を制御することができる。
【0066】
設定部107は、ユーザから音像設定を受け付けることができる。設定部107は、受け付けた音像設定を音響信号生成部103に出力し、音響信号生成部103は、音像設定に応じたフィルタ係数を記憶部106から読み込み音像を調整する。
図9に、音像を操作するための操作インタフェースの一例を示す。
図9(a)は、領域ごとに音像位置を指定するための操作インタフェースの一例である。
図9(a)に示す例においては、例えば、領域Aにおいては音像位置が右前に設定されており、領域Bにおいては音像位置が左前に設定されている。また、
図9(b)は、信号ごとに音像位置を指定するための操作インタフェースの一例である。
図9(b)に示す例においては、例えば、信号Aの音像位置は右前に設定されており、信号Bの音像位置が左前に設定されている。
【0067】
[音源(スピーカ)選択]
これまで、音源(スピーカ)の設置位置は予め与えられたものとして説明してきたが、制御領域に対して影響を与えやすい音源の位置を適切に選択することにより、余剰を排除し音源配置を効率化することができる。以下、音源位置を適切に選択する方法について説明する。
【0068】
図10は、本発明の一実施形態に係るスピーカ配置選択装置400の概略構成を示す図である。スピーカ配置選択装置400は、音響信号送信部401と、音響信号受信部402と、音響伝達関数算出部403と、EfI値算出部404と、スピーカ数設定部405とスピーカ配置選択部406とを備える。
【0069】
音響信号送信部401は、所定の初期信号によりスピーカから音を出力させる。
図11に、自動車の車室内に初期配置数として64個のスピーカが設置されている例を示す。
【0070】
音響信号受信部402は、例えば領域A及び領域B周辺に設置されたマイクロホンが受信した音響信号をマイクロホンから受信する。
【0071】
音響伝達関数算出部403は、音響信号送信部401から入力された信号と、音響信号受信部402から入力された信号とに基づいて伝達行列Gを算出し、EfI値算出部404に出力する。
【0072】
EfI値算出部404は、音響伝達関数算出部403から入力された伝達行列Gと、スピーカ数設定部405から取得したスピーカ数とに基づいてEfI(Effective Independence)値を算出する。EfI値の算出方法の詳細については後述する。
【0073】
スピーカ数設定部405は、ユーザから設置したいスピーカの個数の入力を受け付け、EfI値算出部404及びスピーカ配置選択部406に出力する。
【0074】
スピーカ配置選択部406は、EfI値算出部404から取得した各スピーカのEfI値に基づいて、スピーカを選択する。スピーカ配置選択部406が選択するスピーカの個数は、スピーカ数設定部405から取得した個数であり、スピーカ配置選択部406は、EfI値が上位のスピーカを、スピーカ数設定部405において設定された数の分だけ選択する。
【0075】
以下、EfI値算出部404における処理について説明する。
【0076】
EfI値算出部404は、EfI法(Effective Independence Method)により、EfI値を算出する。EfI法は、行列を構成する行や列の線形独立性を評価し、その成分の重複度を評価する方法である。線形独立性が高い要素は必要性が高い成分であることを意味し、線形独立性が低い要素は必要性が低い余剰な成分であることを意味する。線形独立性が高い成分を選択して余剰な成分を排除することにより条件数を低くすることができる。
【0077】
EfI値算出部404は、音響伝達関数算出部403から伝達行列Gを取得し、下記の式(12)のように特異値分解を行う。
【数12】
【0078】
ここで、マイクロホンの個数をm個、スピーカの個数をn個とすると、伝達行列Gはm×nの行列である。また、Uはm×mの直交行列、Λはm×nの対角行列、Wはn×nの直交行列である。Wの右上のHは、転置行列であることを意味する。
【0079】
続いて、EfI値算出部404は、スピーカ数設定部405から取得したスピーカ数を用いて行列Waを生成する。Waは、n×aの行列であり、ここで「a」は、スピーカ数設定部405から取得したスピーカ数である。EfI値算出部404は、行列Wの1番目からa番目までの列ベクトルを選択することにより行列Waを生成する。例えば、64個のスピーカから24個のスピーカを選択する場合、n=64、a=24である。
【0080】
続いて、EfI値算出部404は、下記の式(13)のようにしてEfI値のベクトルE
Wを算出する。
【数13】
【0081】
ここで、関数diagは、対角成分を取り出して列ベクトルを生成する操作をする関数である。
【0082】
ベクトルE
Wの成分は、各スピーカのEfI値に対応し、0〜1の間の数値を有する。EfI値は、高い数値であるほど線形独立性が高いことを意味する。EfI値の高いスピーカを選択することにより条件数を下げることができ、効率的に音場を制御することができる。
【0083】
図12に、64個のスピーカからEfI値が高い24個のスピーカ(すなわち線形独立性が高い24個のスピーカ)を選択する様子の一例を示す。
【0084】
図13は、64個のスピーカと、選択した24個のスピーカとで条件数を比較した様子を示す図である。
図13に示すように、64個のスピーカから線形独立性の高い24個のスピーカを選択することにより条件数が下がる。したがって、音場に対して適切にスピーカが配置されていることがわかる。
【0085】
本手法によれば、ガラス面などの反射の多い空間においても適切な音源配置を選択することができ、特に制限を受けることなく、様々な空間において本手法を適用することができる。
【0086】
このように、本実施形態によれば、複数の音情報の各々に対し、該各音情報の伝達対象の領域に応じたフィルタ係数を有するフィルタを通して複数の音響信号を生成することにより、閉空間において、領域ごとに独立して重要な音情報を聞き取ることができるように音場を制御することができる。
【0087】
また、フィルタ係数を伝達行列と目標音場に関する最適化問題の解として算出し、最適化問題の解に含まれる正則化係数βを設定部107で設定することにより、多領域の音場を分離させる程度を制御することができる。
【0088】
また、設定部107で、複数の領域において複数の音情報の音量をそれぞれ設定することにより、多領域の音量の比率を制御することができる。
【0089】
また、設定部107で、複数の領域において音像位置をそれぞれ設定することにより、多領域の音像位置を制御することができる。
【0090】
また、スピーカ配置選択装置400によって、EfI値が高いスピーカ300を選択して配置することにより、選択されたスピーカ300の線形独立性を高めることができ、効率的にスピーカ300を配置することができる。
【0091】
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各構成部、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の構成部やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。また、本発明について装置を中心に説明してきたが、本発明は装置が備えるプロセッサにより実行される方法、プログラム、又はプログラムを記録した記憶媒体としても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。