(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-06
(45)【発行日】2023-01-17
(54)【発明の名称】頭部伝達関数学習装置および頭部伝達関数推論装置
(51)【国際特許分類】
H04S 1/00 20060101AFI20230110BHJP
G06N 20/00 20190101ALI20230110BHJP
H04S 7/00 20060101ALI20230110BHJP
【FI】
H04S1/00 500
G06N20/00 130
H04S7/00 300
(21)【出願番号】P 2019071103
(22)【出願日】2019-04-03
【審査請求日】2022-03-29
(73)【特許権者】
【識別番号】000101732
【氏名又は名称】アルパイン株式会社
(74)【代理人】
【識別番号】100103171
【氏名又は名称】雨貝 正彦
(74)【代理人】
【識別番号】100105784
【氏名又は名称】橘 和之
(74)【代理人】
【識別番号】100098497
【氏名又は名称】片寄 恭三
(74)【代理人】
【識別番号】100099748
【氏名又は名称】佐藤 克志
(72)【発明者】
【氏名】矢部 哲朗
(72)【発明者】
【氏名】川崎 康博
【審査官】辻 勇貴
(56)【参考文献】
【文献】特開2009-260574(JP,A)
【文献】特開昭51-052812(JP,A)
【文献】特開2016-039493(JP,A)
【文献】特開2016-181105(JP,A)
【文献】特開2017-028525(JP,A)
【文献】特表2008-527821(JP,A)
【文献】特表2019-536395(JP,A)
【文献】特開2017-085362(JP,A)
【文献】米国特許第06996244(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00
G06N 20/00
H04S 7/00
(57)【特許請求の範囲】
【請求項1】
耳介形状に対応する複数の耳介形状パラメータのそれぞれに対応する複数の可変部位を有し、これら複数の可変部位の配置および/または大きさを変更することで前記複数の耳介形状パラメータのそれぞれの値の変更が可能な測定モデルと、
音源座標パラメータによって音源位置が特定される音源と、
前記測定モデルにおいて耳穴に相当する位置に配置されたマイクロホンと、
前記音源から出力される測定音に対応して前記マイクロホンで検出した検出音に基づいて前記耳介形状パラメータと前記音源座標パラメータの組み合わせに対応する頭部伝達関数を測定する頭部伝達関数測定手段と、
前記耳介形状パラメータおよび前記音源座標パラメータと、これらに対応して測定された前記頭部伝達関数とを教師データとして用いて機械学習を行って頭部伝達関数モデルを作成する頭部伝達関数モデル作成手段と、
を備えることを特徴とする頭部伝達関数学習装置。
【請求項2】
前記頭部伝達関数測定手段は、前記耳介形状パラメータと前記音源座標パラメータの組み合わせの内容が変更されたときに、この変更後の内容に対応する前記頭部伝達関数を測定することを特徴とする請求項1に記載の頭部伝達関数学習装置。
【請求項3】
前記音源座標パラメータは、前記測定モデルからの距離rと2種類の角度θ、φによって示される極座標によって特定される音源位置に対応しており、前記測定モデルを回転させることにより、前記角度θ、φの少なくとも一方を変更することを特徴とする請求項1または2に記載の頭部伝達関数学習装置。
【請求項4】
前記測定モデルは、外耳道に相当する穴と、耳介において音が反射する反射壁と、耳介において外耳道への音の進入を妨げる塞ぐ壁とを有することを特徴とする請求項1~3のいずれか一項に記載の頭部伝達関数学習装置。
【請求項5】
前記測定モデルは、径が変更可能な前記穴を有することを特徴とする請求項4に記載の頭部伝達関数学習装置。
【請求項6】
前記測定モデルは、前記穴からの距離と高さが変更可能な前記反射壁を有することを特徴とする請求項4または5に記載の頭部伝達関数学習装置。
【請求項7】
前記測定モデルは、傾きと前記穴に接する高さが変更可能な前記塞ぐ壁を有することを特徴とする請求項4~6のいずれか一項に記載の頭部伝達関数学習装置。
【請求項8】
受聴者の頭部を撮像するカメラと、
前記カメラによって撮像された画像に基づいて受聴者の耳介形状を特定し、この特定内容に基づいて前記耳介形状パラメータの各値を決定するパラメータ値決定手段と、
請求項1~7のいずれか一項に記載された前記頭部伝達関数モデルを用いて、前記パラメータ値決定手段によって決定された値に対応する、特定の受聴者固有の頭部伝達関数を推定する頭部伝達関数推定手段と、
を備えることを特徴とする頭部伝達関数推論装置。
【請求項9】
前記カメラは、車両に搭載されたドライバーモニタリングシステム用のカメラが用いられることを特徴とする請求項8に記載の頭部伝達関数推論装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習によって頭部伝達関数モデルを作成する頭部伝達関数学習装置とこの頭部伝達関数モデルを用いて各個人に対応する頭部伝達関数を推定する頭部伝達関数推論装置に関する。
【背景技術】
【0002】
従来から、頭部伝達関数(HRTF)を用いて、ヘッドホンから出力するバイノーラル信号を生成するようにした「モデル化によってHRTFを個別化するための方法および装置」が知られている(例えば、特許文献1参照。)。この方法によると、空間の全ての方向の、全ての個人についての複数のHRTFを含むデータベースの知識取得を使用してモデルを構築することができる。また、このモデルは、一連の測定、さらには任意に固定された方向のHRTFの大まかな測定から空間の全ての方向についてHRTFを計算することができる人工ニューロンのネットワーク(ニューラルネットワーク)に基づくものである。さらに、任意に固定された方向の個人のHRTFの大まかな測定は、任意の特定の個人についてだけ行われ、上記のモデルが測定に適用され、空間内の個人のHRTFを取得することが可能となる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、上述した特許文献1に開示された方法および装置では、特定の個人について大まかな測定を行うだけで、全ての個人についての複数のHRTFを含むデータベースの知識取得を使用してモデルを構築することができる、となっているが、少なくとも何人かの個人についての測定が必要であって、HRTFのデータを取得するための負担が大きいという問題があった。また、測定対象となる個人の数や音源の設置箇所の数が少ないため、ニューラルネットワークを用いた学習によって得られるHRTFモデルの精度が低いという問題があった。
【0005】
本発明は、このような点に鑑みて創作されたものであり、その目的は、各個人についてのデータ収集が不要であって負担軽減が可能であり、HRTFモデルの精度を上げることができる頭部伝達関数学習装置および頭部伝達関数推論装置を提供することにある。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明の頭部伝達関数学習装置は、耳介形状に対応する複数の耳介形状パラメータのそれぞれに対応する複数の可変部位を有し、これら複数の可変部位の配置および/または大きさを変更することで複数の耳介形状パラメータのそれぞれの値の変更が可能な測定モデルと、音源座標パラメータによって音源位置が特定される音源と、測定モデルにおいて耳穴に相当する位置に配置されたマイクロホンと、音源から出力される測定音に対応してマイクロホンで検出した検出音に基づいて耳介形状パラメータと音源座標パラメータの組み合わせに対応する頭部伝達関数を測定する頭部伝達関数測定手段と、耳介形状パラメータおよび音源座標パラメータと、これらに対応して測定された頭部伝達関数とを教師データとして用いて機械学習を行って頭部伝達関数モデルを作成する頭部伝達関数モデル作成手段とを備えている。
【0007】
測定モデルを用いることで受聴者(個人)についてのデータ収集をなくすることができるため、データ収集に際しての受聴者の負担軽減が可能となる。また、測定モデルの可変部位の配置や大きさを変更することで各受聴者の耳介形状を再現することにより、頭部伝達関数モデルの精度を上げることができる。
【0008】
また、上述した頭部伝達関数測定手段は、耳介形状パラメータと音源座標パラメータの組み合わせの内容が変更されたときに、この変更後の内容に対応する頭部伝達関数を測定することが望ましい。これにより、多くの受聴者を想定した頭部伝達関数モデルの作成が可能となる。
【0009】
また、上述した音源座標パラメータは、測定モデルからの距離rと2種類の角度θ、φによって示される極座標によって特定される音源位置に対応しており、測定モデルを回転させることにより、角度θ、φの少なくとも一方を変更することが望ましい。これにより、測定モデルを回転させることで、音源位置の変更が不要になるため、音源座標パラメータの値を変更しながら頭部伝達関数を繰り返し測定する際の手間を軽減でき、これに伴って一連の頭部伝達関数測定に要する時間の短縮が可能になる。
【0010】
また、上述した測定モデルは、外耳道に相当する穴と、耳介において音が反射する反射壁と、耳介において外耳道への音の進入を妨げる塞ぐ壁とを有することが望ましい。特に、上述した測定モデルは、径が変更可能な穴や、穴からの距離と高さが変更可能な反射壁や、傾きと穴に接する高さが変更可能な塞ぐ壁を有することが望ましい。このような測定モデルを用いることにより、多くの受聴者の耳介形状に対応する耳介形状パラメータを再現することが可能になり、機械学習の精度を高めることができる。
【0011】
また、本発明の頭部伝達関数推論装置は、受聴者の頭部を撮像するカメラと、カメラによって撮像された画像に基づいて受聴者の耳介形状を特定し、この特定内容に基づいて耳介形状パラメータの各値を決定するパラメータ値決定手段と、上述した頭部伝達関数モデルを用いて、パラメータ値決定手段によって決定された値に対応する、特定の受聴者固有の頭部伝達関数を推定する頭部伝達関数推定手段とを備えることが望ましい。これにより、受聴者(個人)固有の耳介形状を容易かつ短時間で判別し、この受聴者に対応する正確な頭部伝達関数モデルを特定し、この受聴者に対応する頭部伝達関数を推定することが可能となる。
【0012】
また、上述したカメラは、車両に搭載されたドライバーモニタリングシステム用のカメラが用いられることが望ましい。これにより、車載のオーディオ装置やその他の装置に本発明を適用する際に、装置本体以外の外付け部品が不要になって、部品コストの低減や設置に要する手間の軽減が可能となる。
【図面の簡単な説明】
【0013】
【
図1】一実施形態の車載装置の全体構成を示す図である。
【
図2】HRTFの推論を行うためのHRTFの教師あり機械学習の説明図である。
【
図3】学習用の教師データの測定方法を示す図である。
【
図5】HRTFモデルを生成するHRTFモデル作成装置の構成図である。
【
図6】バイノーラル信号生成装置によるバイノーラル信号生成の説明図である。
【
図7】トランスオーラル再生装置によるトランスオーラル再生の説明図である。
【
図8】視聴環境の伝達関数を測定する場合の説明図である。
【
図9】音響シミュレーションにより伝達関数を計算する場合の説明図である。
【発明を実施するための形態】
【0014】
以下、本発明を適用した一実施形態の車載装置について、図面を参照しながら説明する。
【0015】
図1は、一実施形態の車載装置の全体構成を示す図である。
図1に示すように、本実施形態の車載装置1は、HRTF推論装置100、バイノーラル信号生成装置200、トランスオーラル再生装置300、スピーカ410、412を含んで構成されている。
【0016】
本実施形態では、高さ方向も加えて立体的(3D)に音像を定位させる「3Dサウンド」をHRTF(頭部伝達関数)を用いて実現している。
【0017】
HRTFを用いた3Dサウンドに関しては、例えば論文「石井要次、他2名、「耳介形状と頭部伝達関数のなぞ」、日本音響学会誌、2015年、第71巻、3号(2015)、p.127-135」に記載がある。
【0018】
この記載などによると、耳介形状とHRTFとの関係が明らかになって、受聴者毎に個人差が大きい耳介形状を特定することができれば、上記の3Dサウンドを実現することができる。
【0019】
HRTF推論装置100は、HRTF推論部110、カメラ120、122、パラメータ値決定部130を含んで構成されている。パラメータ値決定部130がパラメータ値決定手段に、HRTF推論部110が頭部伝達関数推定手段にそれぞれ対応する。
【0020】
HRTF推論部110は、音源の座標を示す音源座標パラメータと、受聴者(例えば、車両の運転者)の耳介形状を示す耳介形状パラメータとが指定されたときに、教師あり機械学習によって作成されたHRTFモデル100A(右耳用のHRTF100A(R)と左耳用のHRTF100A(L))を用いて、この受聴者の右耳および左耳のそれぞれに対応する固有のHRTFを推定する。
【0021】
一方のカメラ120は、受聴者の右耳が含まれるように頭部を撮像する。また、他方のカメラ122は、受聴者の左耳が含まれるように頭部を撮像する。これらのカメラ120、122は、受聴者の耳介形状が判別可能な状態で左右の耳介を撮像する必要がある。また、これらのカメラ120、122は、HRTF推論装置100のためだけに用意してもよいが、車両の運転者を撮像して安全運転等を支援するためのドライバーモニタリングシステム(Driver Monitoring System:DMS)に用いられるカメラ(例えば、2台)が備わっている場合には、このカメラをカメラ120、122として用いるようにしてもよい。
【0022】
パラメータ値決定部130は、カメラ120、122によって撮像された受聴者の耳介形状を特定し、この特定内容に基づいて耳介形状パラメータを決定する。この決定した耳介形状パラメータは、HRTF推論部110に入力される。
【0023】
バイノーラル信号生成装置200は、モノラルの音声信号が入力され、この音声信号とHRTF推論装置100によって推定された受聴者固有のHRTFとの畳込み積分により、左耳用のバイノーラル信号と右耳用のバイノーラル信号を生成する。
【0024】
トランスオーラル再生装置300は、バイノーラル信号生成装置200によって生成される左右のバイノーラル信号に基づいて、左右のスピーカ410、412のそれぞれから車室内400に出力するための左右のトランスオーラル信号を生成する。
【0025】
本実施形態の車載装置1はこのような概略的な構成を有しており、次に、それぞれの詳細について説明する。
【0026】
(1)HRTFの推定
図2は、HRTFの推論を行うためのHRTFの教師あり機械学習の説明図である。
【0027】
HRTFの推論を行うために、左耳と右耳のそれぞれに対応するHRTFモデル100Aをあらかじめ用意する必要がある。また、これらのHRTFモデル100Aは、教師あり機械学習を用いて作成される。
【0028】
本実施形態では、音源座標パラメータSと耳介形状パラメータPを導入する。例えば、音源座標パラメータSは、モノラル音源の位置を極座標(r,θ,φ)で表したものである(次元数=3、rは音源までの距離、θは方位角、φは仰角)。また、耳介形状パラメータPとして、耳介形状の特徴を示すN個の値p1、p2、p3、・・・、pNを用いる(次元数=N)。
【0029】
これらのパラメータP、Sのサンプル値を教師あり機械学習における「入力変数」とする。また、これらのパラメータP、Sの複数の組み合わせのそれぞれに対応して測定された左耳用と右耳用のそれぞれのHRTF実測値を教師あり機械学習における「出力変数」とする。HRTF実測値の次元数は、時間領域で表現する場合には時間のサンプリング数、周波数領域で表現する場合には周波数のサンプリング数となるが、他の表現形式を用いるようにしてもよい。
【0030】
上記のHRTFモデル100Aは、パラメータP、Sが与えられたときに得られるであろうHRTFを機械学習によってモデル化したものである。このHRTFモデル100Aを用いることにより、学習用のデータセット(パラメータP、S)に含まれないパラメータの未知の組み合わせが与えられた場合であっても、この与えられたパラメータに対応するHRTF100Aを生成(推定)することが可能となる。
【0031】
教師あり機械学習の実現方法としては、例えば、回帰分析、サポートベクターマシン、ニューラルネットワーク、などの手法を用いることができる。
【0032】
図3は、学習用の教師データの測定方法を示す図である。一般には、実際に人の耳にマイクロホンを装着し、音源となるスピーカの位置を移動させてHRTFを測定することを、人を変えて繰り返すことにより、教師あり機械学習によってHRTFモデルを生成することができる。しかし、このように実際に人を使ってHRTFを測定しようとするとそのための時間が長くなり、しかも、耳介形状が異なる多くの人について同様の測定を行わなければならないことを考えると、このような方法による機械学習は実質的には不可能といえる。
【0033】
そこで、本実施形態では、実際の人の耳ではなく、簡易化された測定モデル(
図3(A))を作成し、音源としてのスピーカを固定し、測定モデルの角度を変更することにより、測定を行う。これにより、音源座標パラメータS(r,θ,φ)について、音源までの距離rが一定となる条件で、測定モデルを回転させることで、角度θと角度φを変更しながらHRTFの測定が可能となる。この測定を、距離rを変更しながら繰り返すことにより、一組の耳介形状パラメータPについて、広範囲のパラメータSに対応するHRTFの測定が終了する。以後、耳介形状パラメータPを変更しながら、同様の測定を繰り返すことにより、HRTFモデルを生成することができる。
【0034】
上述した論文によると、HRTFのノッチとピークが各々の耳介形状、角度で異なることに関して、「耳甲介腔と耳道入口で生じる定常波が原因である」ことがわかっている。
図4は、耳の外観形状を示す図である。
【0035】
図3(A)に示した測定モデルには、反射壁W1、塞ぐ壁W2、穴Hが備わっている。反射壁W1は、耳介において音が反射する対輪(g)と耳甲介舟(c)に相当するものであり、測定モデルでは、穴Hからの距離と高さが変えられるようになっている。塞ぐ壁W2は、耳介において外耳道(e)への音の進入を妨げる耳珠(h)に相当するものであり、穴Hに接する高さが変えられるとともに、矢印a方向に倒す(傾斜させる)ことができるようになっている。これらの反射壁W1と塞ぐ壁W2でつくる空間が耳甲介腔(d)に相当する。穴Hは、外耳道(e)に相当する部分であり、穴の半径を変更することができる。この穴Hには、音源から出力されてこの測定モデルに到達した測定音を集音するマイクロホンMが配置される。
【0036】
このような測定モデルにおいて、耳介形状パラメータPとして以下に示す3つの値p1、p2、p3を用いるものとする。
【0037】
p1:穴Hから反射壁W1までの距離
p2:穴Hから塞ぐ壁W2までの距離
p3:塞ぐ壁W2によって穴Hを塞いでいる割合(音源から穴Hに進入する音を防ぐ割合)。
【0038】
上述したように、受聴者の耳にマイクロホンMを装着し、音源としてのスピーカSPの位置を移動させながら収集音の周波数特性やインパルス応答を測定することにより、この受聴者に対応するHRTFを測定することができるが、スピーカSPの位置を広範囲にわたって移動させながら多くの位置での測定を繰り返す必要があることから、このような測定はほとんど困難である。そこで、本実施形態では、上述した測定用モデルを導入している。具体的には、HRTF測定の対象となる受聴者を想定し、その右耳と左耳のそれぞれに対応するように2つの測定モデルを配置するとともに、それらの測定モデルの中心oから距離r、角度θ、φの位置に音源としてのスピーカSPを配置することで(
図3(B))、一組の音源座標パラメータSと耳介形状パラメータPを特定し、対応するHRTFを測定することができる。
【0039】
ところで、スピーカSPの位置を広範囲にわたって移動させようとすると、その移動の設備が必要になって設備が大型化してしまう。本実実施形態では、このような設備の大型化を回避するために、左右の測定モデルの中心oからの距離が一定の音源については、スピーカの位置を移動させるのではなく、スピーカSPの位置を固定し、測定モデルを回転させている。例えば、
図3(C)は想定している受聴者を上部から見た状態を示しており、中心oを中心にして測定モデルを水平面内で回転させる。
図3(D)は想定している受聴者を前方から見た状態を示しており、中心oを中心にして鉛直面内で回転させる。
図3(E)は想定している受聴者を横方向から見た状態を示しており、2つの測定モデルをそれらを穴Hの中心軸回りで回転させる。このような回転操作を組み合わせることにより、測定モデルの周囲の同一半径rの球面に沿って音源としてのスピーカSPを移動させた場合と同様の相対的な位置関係を実現することができる。
【0040】
距離rを変えながら同様の測定を繰り返すことにより、受聴者の周りで広範囲にわたって音源の位置を変えた場合と同等のHRTFの測定結果を得ることができる。また、耳介形状パラメータPについても同様であり、耳介形状パラメータPとしての3つの値p1、p2、p3のそれぞれを所定の範囲で変えながら同様の測定を繰り返すことにより、様々な耳介形状を有する多くの受聴者を考慮したHRTFの測定結果を得ることができる。このようにして、教師あり機械学習によってHRTFモデル100A(右耳用のHRTFモデル100A(R)と左耳用のHRTFモデル100A(L))が生成される。なお、このHRTFモデル100Aの生成は、専用の測定室(例えば、無響室)で行われる。
【0041】
図5は、HRTFモデルを生成するHRTFモデル作成装置の構成図である。
図5に示すHRTFモデル作成装置150は、HRTF測定部152とHRTFモデル作成部154を含んで構成されている。なお、HRTF測定部152とHRTFモデル作成部154は、右耳用と左耳用が別々に備わっており、
図5ではその一方のみ(例えば右耳用)が示されている。HRTFモデル作成装置が頭部伝達関数学習装置に、HRTF測定部152が頭部伝達関数測定手段に、HRTFモデル作成部154が頭部伝達関数モデル作成手段にそれぞれ対応する。
【0042】
HRTF測定部152は、音源としてのスピーカSPから出力される測定音に対応して、測定モデル(
図3)に含まれるマイクロホンMで検出した検出音に基づいて、その時点で指定された音源座標パラメータSと耳介形状パラメータPの組み合わせに対応するHRTFを測定する。このHRTFの測定は、音源座標パラメータSと耳介形状パラメータPの各値を変更した多くの組み合わせについて実施される。
【0043】
HRTFモデル作成部154は、音源座標パラメータSと耳介形状パラメータPの多くの組み合わせと、各組み合わせに対応して測定されたHRTF測定値とを教師データセットとして教師あり機械学習を行うことにより、HRTFモデル100Aを作成する。
【0044】
上述したHRTF推論装置100は、このようにして予め作成された右耳用のHRTFモデル100A(R)と左耳用のHRTFモデル100A(L)を有しており、実際の再生対象となる音源に対応する音源座標パラメータSと、受聴者(
図1に示す例では車両の運転者)に対応する右耳の耳介形状パラメータPと左耳の耳介形状パラメータPとが特定されたときに、HRTFモデル100A(R)、100A(L)に基づいて、この受聴者に対応する右耳用のHRTF(R)と左耳用のHRTF(L)を推定する。
【0045】
(2)バイノーラル信号の生成
図6は、バイノーラル信号生成装置200によるバイノーラル信号生成の説明図である。バイノーラル信号生成装置200は、畳込み積分フィルタ210Rと畳込み積分フィルタ210Lを含んで構成されている。一方の畳込み積分フィルタ210Rは、音源の音声信号(モノラル)が入力され、この音声信号とHRTF推論装置100によって生成された右耳用のHRTF(R)の畳込み積分を行うことにより、右耳用のバイノーラル信号B(R)を生成する。他方の畳込み積分フィルタ210Lは、音源の音声信号(モノラル)が入力され、この音声信号とHRTF推論装置100によって生成された左耳用のHRTF(L)の畳込み積分を行うことにより、左耳用のバイノーラル信号B(L)を生成する。
【0046】
(3)トランスオーラル再生
図7は、トランスオーラル再生装置300によるトランスオーラル再生の説明図である。トランスオーラル再生装置300は、トランスオーラル信号生成部310と音声再生部340を含んで構成されている。
【0047】
トランスオーラル信号生成部310は、バイノーラル信号生成装置200によって生成されたバイノーラル信号B(R)、B(L)に基づいて、左右のスピーカ410、412のそれぞれに対応する2種類のトランスオーラル信号T(R)、T(L)を生成する。このために、トランスオーラル信号生成部310は、2つの逆フィルタ320R、320Lと、2つのフィルタ制御部330R、330Lとを含んで構成されている。
【0048】
一方のフィルタ制御部330Rは、車室内400における右側のスピーカ410から受聴者の右耳までの音響空間の伝達関数E(R)で表される特性を打ち消すように一方の逆フィルタ320Rの特性を制御する。逆フィルタ320Rは、バイノーラル信号生成装置200によって生成されたバイノーラル信号B(R)が入力され、伝達関数E(R)の音響空間による影響を排除したトランスオーラル信号T(R)を出力する。このトランスオーラル信号T(R)は、音声再生部340内のDAC・アンプ350Rを通すことで、アナログ信号への変換および増幅が行われ、右側のスピーカ410から出力される。
【0049】
他方のフィルタ制御部330Lは、車室内400における左側のスピーカ412から受聴者の左耳までの音響空間の伝達関数E(L)で表される特性を打ち消すように他方の逆フィルタ320Lの特性を制御する。逆フィルタ320Lは、バイノーラル信号生成装置200によって生成されたバイノーラル信号B(L)が入力され、伝達関数E(L)の音響空間による影響を排除したトランスオーラル信号T(L)を出力する。このトランスオーラル信号T(L)は、音声再生部340内のDAC・アンプ350Lを通すことで、アナログ信号への変換および増幅が行われ、左側のスピーカ412から出力される。
【0050】
ところで、上述した2種類の伝達関数E(R)、(L)は、事前に測定等によって取得し、逆フィルタを設計しておく必要がある。例えば、(1)伝達関数測定用のマイクロホン付きダミーヘッドを視聴環境(車室内400)に設置して伝達関数を測定し、この伝達関数に基づいて逆フィルタを設計する、(2)視聴環境の三次元形状や音響特性をモデル化し、音響シミュレーションにより伝達関数を計算し、この伝達関数に基づいて逆フィルタを設計する、などの方法が考えられる。
【0051】
図8は、視聴環境の伝達関数を測定する場合の説明図である。
図8に示す構成の中で、視聴環境としての車室内400、スピーカ410、412、音声再生部340は、
図1や
図7に含まれるものがそのまま用いられる。
【0052】
ダミーヘッド500Aは、一般的な受聴者の頭部形状を模したものであり、受聴者の頭部を想定した位置に配置されている。また、このダミーヘッド500Aには、右耳に対応する位置にマイクロホン510が、左耳に対応する位置にマイクロホン512が取り付けられている。
【0053】
伝達関数測定器520は、車室内400の伝達関数を測定するためのものであり、テスト信号生成部530R、530L、伝達関数測定部540R、540Lを備えている。
【0054】
一方のテスト信号生成部530Rは、右側のスピーカ410からダミーヘッド500Aの右耳までの音響空間の伝達関数E(R)を測定するためのテスト信号を生成する。このテスト信号は、音声再生部340内のDAC・アンプ350Rを通すことで、アナログ信号への変換および増幅が行われ、右側のスピーカ410から出力される。伝達関数測定部540Rは、ダミーヘッド500Aの右耳の位置に取り付けられたマイクロホン510によって集音されたテスト音声に基づいて伝達関数E(R)を測定する。
【0055】
他方のテスト信号生成部530Lは、左側のスピーカ412からダミーヘッド500Aの左耳までの音響空間の伝達関数E(L)を測定するためのテスト信号を生成する。このテスト信号は、音声再生部340内のDAC・アンプ350Lを通すことで、アナログ信号への変換および増幅が行われ、左側のスピーカ412から出力される。伝達関数測定部540Lは、ダミーヘッド500Aの左耳の位置に取り付けられたマイクロホン512によって集音されたテスト音声に基づいて伝達関数E(L)を測定する。
【0056】
図9は、音響シミュレーションにより伝達関数を計算する場合の説明図である。
図9において、音響シミュレータ600は、座席等の構成要素を含む車室内400の視聴環境を再現するように構築された三次元仮想モデル610を有している。音響シミュレータ600は、この三次元仮想モデル610を用いて、実際の右側のスピーカ410に対応する仮想的なスピーカ410Aから受聴者の右耳を想定した測定ポイント420Aまでの伝達関数E(R)を音響シミュレーションによって算出する。また、音響シミュレータ600は、この三次元仮想モデル610を用いて、実際の左側のスピーカ412に対応する仮想的なスピーカ412Aから受聴者の左耳を想定した測定ポイント422Aまでの伝達関数E(L)を音響シミュレーションによって算出する。
【0057】
このように、本実施形態のHRTFモデル作成装置150では、
図3に示した測定モデルを用いることで受聴者(個人)についてのデータ収集をなくすることができるため、データ収集に際しての受聴者の負担軽減が可能となる。また、測定モデルの可変部位の配置や大きさを変更することで各受聴者の耳介形状を再現することにより、HRTFモデルの精度を上げることができる。
【0058】
また、耳介形状パラメータと音源座標パラメータの組み合わせの内容が変更されたときに、この変更後の内容に対応する頭部伝達関数を測定することにより、多くの受聴者を想定したHRTFモデルの作成が可能となる。
【0059】
また、音源座標パラメータは、測定モデルからの距離rと2種類の角度θ、φによって示される極座標によって特定される音源位置に対応しており、測定モデルを回転させることにより、角度θ、φの少なくとも一方を相対的に変更している。このように、測定モデルを回転させることで、音源位置の角度方向に沿った変更が不要になるため、音源座標パラメータの値を変更しながらHRTFを繰り返し測定する際の手間を軽減でき、これに伴って一連のHRTF測定に要する時間の短縮が可能になる。
【0060】
また、本実施形態で用いた測定モデルは、外耳道に相当する穴Hと、耳介において音が反射する反射壁W1と、耳介において外耳道への音の進入を妨げる塞ぐ壁W2とを有している。また、この測定モデルでは、穴Hは径が変更可能で、反射壁W1は穴Hからの距離と高さが変更可能で、塞ぐ壁W2は傾きと穴Hに接する高さが変更可能となっている。このような測定モデルを用いることにより、多くの受聴者の耳介形状に対応する耳介形状パラメータを再現することが可能になり、機械学習の精度を高めることができる。
【0061】
また、本実施形態のHRTF推論装置100では、カメラ120、122によって撮像された画像に基づいて受聴者の耳介形状を特定し、この特定内容に基づいて耳介形状パラメータPの各値を決定している。これにより、受聴者(個人)固有の耳介形状を容易かつ短時間で判別し、この受聴者に対応する正確なHRTFモデルを特定し、この受聴者に対応するHRTFを推定することが可能となる。
【0062】
また、カメラ120、122として、車両に搭載されたドライバーモニタリングシステム用のカメラを用いることにより、車載のオーディオ装置やその他の装置に本発明を適用する際に、装置本体以外の外付け部品が不要になって、部品コストの低減や設置に要する手間の軽減が可能となる。
【0063】
なお、本発明は上記実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形実施が可能である。例えば、上述した実施形態では、
図3に示した穴Hと反射壁W1と塞ぐ壁W2とを有する測定モデルを用いてHRTFモデルの作成を行ったが、これらの可変部位は適宜追加や変更してもよい。これらの可変部位をカメラで撮像して得られた画像に基づいて耳介形状パラメータPを決定できればよい。また、耳介形状パラメータP(p
1、p
2、p
3)の数や内容を変更するようにしてもよい。
【0064】
また、上述した実施形態では、車載装置1に本発明を適用したが、車室内400以外の環境において受聴者が音声を聴取する場合にも本発明を適用することができる。
【産業上の利用可能性】
【0065】
上述したように、本発明によれば、測定モデルを用いることで受聴者(個人)についてのデータ収集をなくすることができるため、データ収集に際しての受聴者の負担軽減が可能となる。また、測定モデルの可変部位の配置や大きさを変更することで各受聴者の耳介形状を再現することにより、頭部伝達関数モデルの精度を上げることができる。
【符号の説明】
【0066】
1 車載装置
100 HRTF推論装置
110 HRTF推論部
120、122 カメラ
130 パラメータ値決定部
150 HRTFモデル作成装置
152 HRTF測定部
154 HRTFモデル作成部
200 バイノーラル信号生成装置
300 トランスオーラル再生装置
410、412 スピーカ
400 車室内