(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
従来、頭外に音像を定位させる方法として、受聴者の頭部伝達関数HRTF(Head Related Transfer Function)を用いる方法が知られている(例えば、特許文献1参照)。また、HRTFは個人差が大きく、特に耳介形状の違いによるHRTFの変化が著しいことが知られている。
【0003】
ここで、受聴者の前方にステレオスピーカが設置されている場合の、HRTFの測定方法について述べる。
図13は、HRTFを測定する時の概略を示した図である。受聴者1の左耳3L、右耳3Rの外耳道入口、または鼓膜位置に収音用のマイク2L、2Rがそれぞれ設置される。左スピーカ(SpL)5L又は右スピーカ(SpR)5Rから再生した信号を収音することにより、4つの頭部伝達関数(以下、伝達特性ともいう)Ls、Lo、Ro、Rsを算出する。例えば、左スピーカ5Lによるインパルス応答測定と右スピーカ5Rによるインパルス応答測定をそれぞれ行う。このようにすることで、4つの伝達特性Ls、Lo、Ro、Rsを測定することができる。受聴者の耳介形状等に応じた伝達特性Ls、Lo、Ro、Rsを求めることができる。
【0004】
図14は、HRTFを用いて頭外定位を実現するための処理を示している。畳み込み演算部11は、ステレオ信号のLチャンネル入力信号XLに対して伝達特性Lsを畳み込む。畳み込み演算部21は、Rチャンネル入力信号XRに対して伝達特性Roを畳み込む。加算器24は、畳み込み演算部11の畳み込みデータと、畳み込み演算部21の畳み込みデータを加算する。これにより、加算器24が、Lチャンネル(Lch)の出力信号YLを得る。
【0005】
同様に、畳み込み演算部12は、ステレオ信号のLチャンネル入力信号XLに対して伝達特性Loを畳み込む。畳み込み演算部22は、ステレオ信号のRチャンネル入力信号XRに対して伝達特性Rsを畳み込む。加算器25は、畳み込み演算部12の畳み込みデータと、畳み込み演算部22の畳み込みデータを加算する。これにより、加算器25が、Rチャンネル(Rch)の出力信号YRを得る。
【0006】
出力信号YL、YRを、
図13に示すマイク2Lとマイク2Rの位置で再生することにより、受聴者1は、スピーカ5L、5Rで再生されているように受聴することができる。上記したように、HRTFの測定には、適切な機材、収音環境、知識が必要であり、一般的に容易に測定することはできない。そのため、予め少数の典型的な音像定位フィルタを用意し、利用者が最適なフィルタを選択して頭外定位を実現する方法が考案されている(特許文献2)。特許文献2の方法によって、機材、収音環境がない場合でも、適切な頭部伝達関数HRTFを得ることができる。
【発明を実施するための形態】
【0016】
まず、本実施形態に係る頭外定位処理の概要について説明する。
頭部伝達関数HRTFの個人特性は、特に音源が近距離の場合に、耳介の形状や大きさなどの特性が大きく影響する。ここで、個人特性が完全に左右対称になっている人は少なく、多くの人が左右異なる特性を持つ。そのため、本実施の形態では、プリセットされた頭部伝達関数からユーザが最適な近似値を選択できるよう、左右の耳介の特性を別々に選択できるようにしている。
【0017】
理論上では、頭部伝達関数は音源ごとに左右の耳への伝達関数をセットにして扱う必要がある。ゆえに、ステレオ音源の場合は、各チャンネルに2セットの伝達特性が必要となる。しかしながら、上記のようにユーザが個人特性を左右別々に選択できるようにした場合、音源毎のセットを用いると、クロストーク側の特性に異なる耳の特性が含まれてしまう。そこで、本実施の形態では、ステレオ音源の各音源と片方の耳との間の伝達関数をセットにして扱うことで、全体的な頭外定位感と音のバランスを向上させている。
【0018】
実施の形態1.
本実施の形態にかかる頭外定位処理装置について、
図1を用いて説明する。
図1は、頭外定位処理装置のブロック図である。頭部伝達関数記憶部101と、耳介特性選択部102と、仮想音源信号生成部103と、出力部104と、頭部伝達関数生成部105を備えている。
【0019】
具体的には、頭外定位処理装置100は、パーソナルコンピュータなどの情報処理装置であり、プロセッサ等の処理部、メモリやハードディスクなどの記憶部、液晶モニタ等の表示部、タッチパネル、キーボード、マウスなどの入力部を備えている。頭外定位処理装置100は、LchとRchのステレオ入力信号について、頭外定位処理を行う。具体的には、頭外定位処理装置100は、プリセットされた頭部伝達関数からユーザUの耳介特性に応じた適切な頭部伝達関数を選択して、頭外定位フィルタとする。LchとRchのステレオ入力信号は、CDプレーヤなどから出力される信号である。なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。
【0020】
頭部伝達関数生成部105は、インパルス応答等の測定結果に基づいて、頭部伝達関数を生成する。頭部伝達関数生成部105は、後述するように、多数の受聴者の伝達特性の測定結果から、代表的な頭部伝達関数を生成する。あるいは、典型的な耳介形状を有するダミーヘッドを受聴者とした伝達特性の測定結果から頭部伝達関数を生成する。頭部伝達関数生成部105は、頭外定位処理装置100と異なる装置に設けてもよい。
【0021】
頭部伝達関数記憶部101は、メモリ等を備え、頭部伝達関数を記憶する。ここでは、頭部伝達関数生成部105で生成された複数の頭部伝達関数が頭部伝達関数記憶部101にプリセットされている。頭部伝達関数記憶部101は、スピーカを音源とする測定により得られた複数の頭部伝達関数を耳介特性と対応付けて記憶する。
【0022】
頭部伝達関数は、例えば、
図13に示す測定装置で測定されたデータに基づいて生成されている。
図13では、受聴者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。また、受聴者1の左耳3Lの外耳道入口、または鼓膜位置に収音用のマイク2Lが設置される。受聴者1の右耳3Rの外耳道入口、または鼓膜位置に収音用のマイク2Rが設置される。なお、受聴者1は、人でもよく、ダミーヘッドでもよい。したがって、本実施の形態において、受聴者1は人だけでなく、ダミーヘッドを含む概念である。
【0023】
左スピーカ(SpL)5Lからのインパルス応答を左のマイク2L、及び右のマイク2Rで測定する。これにより、左スピーカ5Lと左のマイク2L間の伝達特性(伝達関数ともいう)Lsと、左スピーカ5Lと右のマイク2R間の伝達特性Loを得ることができる。また、右スピーカ(SpR)5Rからのインパルス応答を左のマイク2L、及び右のマイク2Rで測定する。これにより、右スピーカ5Rと左のマイク2L間の伝達特性Roと、右スピーカ5Rと右のマイク2R間の伝達関数Rsを求めることができる。このように、ある受聴者1に対して2回のインパルス応答測定を行うことで、4つの伝達特性Ls、Lo、Ro、Rsが得られる。ここで、4つの伝達特性Ls、Lo、Ro、Rsを1セットの頭部伝達関数HRTFとする。
【0024】
ある受聴者1における測定では、4つの伝達特性Ls、Lo、Ro、Rsが測定される。さらに、受聴者1を変えて、同様の測定を行う。すなわち、異なる耳介特性の受聴者1に対して、4つの伝達特性Ls、Lo、Ro,Rsを測定する。4つの伝達特性Ls、Lo、Ro,Rsを1セットの頭部伝達関数HRTFとすると、複数セットの頭部伝達関数HRTFが求められる。頭部伝達関数生成部105は、多数の頭部伝達関数HRTFの測定結果に基づいて、頭部伝達関数記憶部101にプリセットする複数の頭部伝達関数HRTFを生成する。ここでは、8セットの頭部伝達関数HRTFが、頭部伝達関数記憶部101にプリセットされている。
【0025】
なお、8セットの頭部伝達関数HRTFは、代表的な耳介特徴を持った8つのダミーヘッドを受聴者1として測定したデータであってもよい。あるいは、人を受聴者とする測定によって算出されたデータをそのまま頭部伝達関数記憶部101が記憶してもよい。
【0026】
ここで、ある受聴者1において測定した頭部伝達関数HRTFのパワースペクトルを
図2〜
図5に示す。また、別の受聴者1において測定された頭部伝達関数HRTFのパワースペクトルを
図6〜
図9に示す。
図2、
図6は、左スピーカ5Lに関する伝達特性Ls、LoをaLとして示している。
図3、
図7は、右スピーカ5Rに関する伝達特性Ro、RsをaRとして示している。
図4、
図8は左耳に関する伝達特性Ls、RoをbLとして示している。
図5、
図9は左耳に関する伝達特性Rs、LoをbRとして示している。
図4、
図5、
図8、
図9は、それぞれ
図2、
図3、
図6、
図7のクロストーク側の伝達特性Lo、Roを入れ替えたものである。
図2〜
図9において、横軸は対数尺度の周波数(Hz)であり、縦軸はパワー(dB)である。
【0027】
一般的に音像定位はaL、aRのそれぞれのセットで形成され、プリセットされた近似値を選択する場合にも、該セットが適用される。また、伝達特性Ls、Rsは直接音(音源から耳へ直接届く音)の伝達特性であり、耳介の特性を大きく反映しているとされる。一方、クロストーク信号の伝達特性Lo、Roは、反射音や回折音の伝達特性であり、受聴環境や頭部形状に影響を受けるとされる。しかし、bL、bRに示されたパワースペクトルから、クロストーク側の伝達特性Lo、Roにも、伝達特性Ls、Rsに見てとれる耳介の特性が少なからず影響を与えていることは明白である(
図4、
図5、
図8、
図9参照)。すなわち、左耳に関する伝達特性Lsと伝達特性Roは類似しており、右耳に関する伝達特性Rsと伝達特性Loは類似している。ゆえに、後述するように、各耳の特性に着目したクラスタリング、および耳介特性選択部により、左右の耳の整合性を保つことができる。
【0028】
図10を用いて、頭部伝達関数生成部105におけるクラスタリング処理について説明する。
図10は、頭部伝達関数の生成方法を示すフローチャートである。まず、頭部伝達関数生成部105が、頭部伝達関数HRTFのデータを取得する(S11)。すなわち、
図13に示す装置を用いて、受聴者(ダミーヘッドでもよい)1に対するインパルス応答測定を行う。ここでは、プリセットする数(
図1では8個)よりも多い数の受聴者1に対して頭部伝達関数HRTFの測定が行われる。各頭部伝達関数HRTFは、上記のように4つの伝達特性Ls、Lo、Ro、Rsを含んでいる。スピーカを音源とする測定を複数回行うことで、異なる耳介毎に4つの伝達特性Ls、Lo、Ro、Rsが測定される。
【0029】
頭部伝達関数生成部105は、各頭部伝達関数HRTFに含まれる4つの伝達特性Ls、Lo、Ro、Rsの特徴量を抽出する(S12)。特徴量としては、例えば、20次のケプストラム係数、パワースペクトルのピーク周波数位置(Hz)やピーク高さ(dB)を特徴量とすることができる。特徴量を20次のケプストラム係数とする場合、伝達特性Lsから20個の特徴量が算出される。同様に、伝達特性Lo、Ro、Rsのそれぞれからも20個の特徴量が算出される。
【0030】
次に、頭部伝達関数生成部105は、伝達特性Ls、Roの特徴ベクトルと、伝達特性Rs、Loの特徴ベクトルを生成する(S13)。頭部伝達関数生成部105は、伝達特性Lsの特徴量と、伝達特性Roの特徴量とをペアリングして、第1の特徴ベクトルとする。頭部伝達関数生成部105は、伝達特性Rsの特徴量と、伝達特性Loの特徴量とをペアリングして、第2の特徴ベクトルとする。同じ耳介における測定結果から、第1の特徴ベクトルが抽出される。同じ耳介における測定結果から、第2の特徴ベクトルが抽出される。
【0031】
特徴量が20次のケプストラム係数である場合、第1の特徴ベクトルは20次のケプストラム係数を2セット有しているため、40個のデータを含んでいる。同様に、第2の特徴ベクトルは20次のケプストラム係数を2セット有しているため、40個のデータを含んでいる。このように、第1の特徴ベクトルに含まれる特徴量と第2の特徴ベクトルに含まれる特徴量の数は同じとなっている。なお、S11において、N(Nは2以上の整数)個の耳介について、頭部伝達関数HRTFを測定した場合、S13では、N個の第1の特徴ベクトルとN個の第2の特徴ベクトルが生成される。
【0032】
そして、頭部伝達関数生成部105は、各特徴ベクトルをクラスタリングする(S14)。すなわち、頭部伝達関数生成部105は、N個の第1の特徴ベクトルをクラスタリングして、複数のクラスタに分ける。同様に、頭部伝達関数生成部105は、N個の第2の特徴ベクトルをクラスタリングして、複数のクラスタに分ける。ここで、生成されるクラスタの数は、頭部伝達関数記憶部101においてプリセットされる頭部伝達関数HRTFの数となっている(
図1ではA〜Hの8個)。例えば、本実施の形態では、階層クラスタリングを用いて、第1及び第2の特徴ベクトルを8つのクラスタに分ける。
【0033】
次に、頭部伝達関数生成部105は、クラスタリング結果から、各クラスタの代表値を算出する(S15)。代表値としては、例えば、クラスタのセントロイド(重心)を用いることができる。すなわち、各クラスタに含まれる第1の特徴ベクトルの重心座標が代表値となる。上記の例では、第1の特徴ベクトルのクラスタリングにより、8つのクラスタが生成されているため、第1の特徴ベクトルについて、8つの代表値P
A〜P
Hが算出される。なお、代表値P
A〜P
Hはそれぞれ第1の特徴ベクトルと同じ次数のベクトルとなり、ここでは2セットの20次のケプストラム係数に相当する。同様に、第2の特徴ベクトルのクラスタリングについても8つの代表値Q
A〜Q
Hが算出される。代表値Q
A〜Q
Hはそれぞれ第2の特徴ベクトルと同じ次数のベクトルとなり、ここでは2セットの20次のケプストラム係数に相当する。
【0034】
そして、各クラスタにおいて、代表値から伝達特性を生成する(S16)。すなわち、頭部伝達関数生成部105は、2セットの20次のケプストラム係数から、2つの伝達特性を求める。第1の特徴ベクトルのクラスタリングについては、8つの代表値P
A〜P
Hがあるため、伝達特性Ls、Roがそれぞれ8つ算出される。ここで、1つ目の代表値P
Aから得られる伝達特性を伝達特性Ls
A、Ro
Aとし、2つ目の代表値P
Bから得られる伝達特性Ls、Roを伝達特性Ls
B、Ro
Bとして識別する。3〜8つ目の代表値P
C〜P
Hから得られる伝達特性Ls、Roについても、同様に伝達特性Ls
C〜Ls
H、Ro
C〜Ro
Hとして識別する。同様に、第2の特徴ベクトルについても8つの代表値Q
A〜Q
Hが算出されるため、それぞれに対応する伝達特性Lo、Rsを伝達特性Rs
A〜Rs
H、Lo
A〜Lo
Hとして識別する。
【0035】
頭部伝達関数記憶部101は、上記のように算出された伝達特性を記憶する。すなわち、頭部伝達関数記憶部101は、左スピーカと左耳間の伝達特性Ls
A〜Ls
H、左スピーカと右耳間の伝達特性Lo
A〜Lo
Hと、右スピーカと右耳間の伝達特性Rs
A〜Rs
H、右スピーカと左耳間の伝達特性Ro
A〜Ro
Hを格納している。頭部伝達関数記憶部101は、伝達特性Lsと伝達特性Roとをペアリングして、左耳特性に対応付けて格納している。すなわち、頭部伝達関数記憶部101は、左耳の耳介特性と、伝達特性Ls及び前記伝達特性Roとを対応付けて記憶する。例えば、左耳特性Aには、伝達特性Ls
Aと伝達特性Ro
Aとのペアが対応付けられ、左耳特性Bには、伝達特性Ls
Bと伝達特性Ro
Bとのペアが対応付けられている。同様に、頭部伝達関数記憶部101は、伝達特性Loと伝達特性Rsとをペアリングして、右耳特性に対応付けて格納している。すなわち、頭部伝達関数記憶部101は、右耳の耳介特性と、伝達特性Rs及び伝達特性Loとを対応付けて記憶する。例えば、右耳特性Aには、伝達特性Rs
Aと伝達特性Lo
Aとのペアが対応付けられ、右耳特性Bには、伝達特性Rs
Bと伝達特性Lo
Bとのペアが対応付けられている。
【0036】
耳介特性選択部102は、左耳特性選択装置51Lと右耳特性選択装置51Rとを備えており、ユーザUの耳介特性を左右独立に選択することができる。ユーザUはタッチパネル等の入力部を操作して、左耳の耳介特性、及び右耳の耳介特性をそれぞれ選択する。左耳特性選択装置51Lは、ユーザUからの入力を受け付けて、左耳の耳介特性を選択する。右耳特性選択装置51Rは、ユーザUからの入力を受け付けて、右耳の耳介特性を選択する。ここでは、ユーザUが8つの左耳特性A〜Hから左耳特性Cを選択しているため、左耳特性選択装置51Lは、伝達特性Ls
cと伝達特性Ro
cとのペアを選択する。ユーザUが8つの右耳特性A〜Hから右耳特性Aを選択しているため、右耳特性選択装置51Rは、伝達特性Rs
Aと伝達特性Lo
Aとのペアを選択する。
【0037】
このように、左耳特性選択装置51L、右耳特性選択装置51Rはペアリングされた2つの伝達特性を選択する。よって、異なる代表値から算出された伝達特性Lsと伝達特性Ro(例えば伝達特性Ls
Aと、伝達特性Ro
B)を左耳特性選択装置51Lが選択することはない。同様に、異なる代表値から算出された伝達特性Rsと伝達特性Lo(例えば伝達特性Rs
Aと伝達特性Lo
B)を右耳特性選択装置51Rが選択することはない。
【0038】
ユーザUが耳介特性の選択を入力する際、スピーカ又はヘッドホン43から参照信号として左右にパンするホワイトノイズを提示する。そして、ユーザUが、最も音像が適切な位置に定位する信号を選択する。具体的には、後述する仮想音源信号生成部103が、左耳に関する伝達特性Ls
A〜Ls
H、Ro
A〜Ro
Hと、右耳に関する伝達特性Rs
A〜Rs
H、Lo
A〜Lo
Hとを用いて、仮想音源信号を生成する。そして、スピーカ又はヘッドホン43から出力された仮想音源信号をユーザUが受聴した結果によって、ユーザUが最適な耳介特性を決定する。すなわち、ユーザUは最も頭外定位感が得られる仮想音源信号を特定すると、特定された仮想音源信号の生成に用いられた左耳特性と右耳特性を入力する。
【0039】
なお、左耳特性と右耳特性がそれぞれ8個プリセットされているので、ユーザUは、仮想音源信号を64回(=8×8)受聴して、最適な組み合わせの耳介特性を特定することができる。なお、仮想音源信号は、後述する仮想音源信号生成部103で生成された信号である。あるいは、ユーザUは、左耳特性に対応する仮想音源信号をLchヘッドホン又はLchスピーカから受聴し、最も左側に頭外感が得られる左耳特性を選び、右耳特性に対応する仮想音源信号をRchヘッドホン又はRchスピーカから受聴し、最も右側に頭外感が得られる右耳特性を選ぶようにしてもよい。この場合、16回の受聴で最適な耳介特性の組み合わせを選択することができる。なお、特性の選択方法については特に限定されるものではない。
【0040】
仮想音源信号生成部103は、畳み込み演算部11、12、21、22を備えている。仮想音源信号生成部103には、CDプレーヤなどからのステレオ入力信号XL、XRが入力される。仮想音源信号生成部103は、各チャンネルのステレオ入力信号XL、XRに対し、耳介特性選択部102で設定された伝達特性を畳み込んで出力部104に出力する。仮想音源信号生成部103は、伝達特性Ls,Lo,Rs,Roを読み出して、畳み込み演算を行う。
【0041】
例えば、左耳特性Cと右耳特性Aが選択されている場合を説明する。この場合、畳み込み演算部11は、左耳特性選択装置51Lによって読み出された伝達特性Ls
cを格納する。畳み込み演算部12は、右耳特性選択装置51Rによって読み出された伝達特性Lo
Aを格納する。畳み込み演算部21は、左耳特性選択装置51Lによって読み出された伝達特性Ro
cを格納する。畳み込み演算部22は、右耳特性選択装置51Rによって読み出された伝達特性Rs
Aを格納する。
【0042】
そして、畳み込み演算部11は、Lチャンネルのステレオ入力信号XLに対して伝達特性Ls
cを畳み込む。畳み込み演算部11は、畳み込み演算データを加算器24に出力する。畳み込み演算部21は、Rチャンネルのステレオ入力信号XRに対して伝達特性Ro
cを畳み込む。畳み込み演算部21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算データを加算して、出力部104に出力する。このように、加算器24は、同じ左耳特性Cに対応付けられた伝達特性Ls
c、Ro
cを用いた2つの畳み込み演算結果を加算する。
【0043】
畳み込み演算部12は、Lチャンネルのステレオ入力信号XLに対して伝達特性Lo
Aを畳み込む。畳み込み演算部12は、畳み込み演算データを加算器25に出力する。畳み込み演算部22は、Rチャンネルのステレオ入力信号XRに対して伝達特性Rs
Aを畳み込む。畳み込み演算部22は、畳み込み演算データを加算器25に出力する。加算器25は2つの畳み込み演算データを加算して、出力部104に出力する。このように、加算器25は、同じ右耳特性Aに対応付けられた伝達特性Rs
A、Lo
Aを用いた2つの畳み込み演算結果を加算する。
【0044】
出力部104は、Lch出力信号とRch出力信号をユーザUに向けて出力するため、補正処理部41、42とヘッドホン43とを備えている。加算器24からのLch信号は補正処理部42に入力される。加算器25からのRch信号は補正処理部42に入力される。補正処理部41、42には、それぞれヘッドホン特性の逆フィルタが設定されている。補正処理部41は加算器24からのLch信号に対して逆フィルタを畳み込む。同様に、補正処理部42は加算器25からのRch信号に対して逆フィルタを畳み込む。逆フィルタは、ユーザUがヘッドホン43を装着した場合に、ユーザ各人の外耳道入口とヘッドホンスピーカユニット間の伝達特性をキャンセルする。このようにすることで、ヘッドホン43の特性が補正される。なお、ダミーヘッドを用いる場合は鼓膜位置にマイクを設置できるため、この場合の逆フィルタは、鼓膜とヘッドホンスピーカユニット間の伝達特性をキャンセルすることになる。
【0045】
なお、逆フィルタは、予め計測しておいたものを用いてもよいし、いくつかのプリセットされた特性から選択してもよい。あるいは、バイノーラルマイク等を用いて測定することで得られた逆フィルタを用いてもよい。また、Henrik Moller ”Fundamentals of Binaural Technology ”Applied Acoustics 36 (1992)に記載された手法を用いて、外耳道補正関数Gcから逆フィルタを算出することも可能である。
【0046】
補正処理部41は、補正されたLch出力信号をヘッドホン43の左ユニット43Lに出力する。補正処理部42は、補正されたRch出力信号をヘッドホン43の右ユニット43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、Lch出力信号とRch出力信号をユーザUに向けて出力する。これにより、ユーザUが受聴する音の音像は、ユーザUの頭外に定位される。
【0047】
音像の位置を知覚する際、音源から左右の耳への伝達特性がそろって初めて定位する。しかしながら、従来法では、各音源からの伝達関数をセットとして扱うため、あるいは4つの伝達特性をバラバラに扱うため、左右のバランスが十分ではなかった。本実施の形態に示すように、まず、頭部伝達関数生成部105はLsとRoをペアリングし、かつRsとLoをペアリングする。そして、耳介特性選択部102は左耳特性の選択を受け付けると、ペアとなる伝達特性Ls、Roを読み出す。耳介特性選択部102は右耳特性の選択を受け付けると、ペアとなる伝達特性Rs、Loを読み出す。よって、全体のバランスを崩さずに十分な頭外定位感を得られるようになる。したがって、頭外定位処理を適切に行うことができる。
【0048】
さらに、各ペアについて、耳単体での特徴をクラスタリングすることにより、耳一つ一つの特性を選択できるようになる。よって、全体のバランスを崩さずに十分な頭外定位感を得られるようになる。したがって、適切に音像を頭外に定位することができる。
【0049】
このように、ステレオ音源を対象とした頭外定位処理装置において、受聴者がプリセットされたいくつかの伝達特性から最適値を選択する場合でも、全体の音のバランスを崩さず、十分な頭外定位感を得ることができる。なお、上記の説明では、ヘッドホン43を用いて音像を再生したが、イヤホンを用いて音像を再生してもよい。この場合、補正処理部41、補正処理部42がイヤホンに応じた逆フィルタを用いて補正処理を行う。
【0050】
なお、頭部伝達関数記憶部101に記憶される頭部伝達関数については、パラメトリックな手法により算出した複数の代表的なデータであってもよい。パラメトリックな手法では、
図10に示すようにパワースペクトルのピークとノッチを抽出する。図では、周波数の低い方からピークP1、P2、P3、P4と、ノッチN1、N2、N3、N4としている。そして、各ピークと各ノッチの周波数とスペクトル値(パワー)を特徴量として抽出する。周波数とスペクトル値をパラメータとして生成されるスペクトル概形から求められるHRTFを、パラメトリックな手法により算出したデータとする。これは、各周波数帯域におけるピークとノッチの分布が音像定位の手掛かりになるためである。すなわち、本実施の形態におけるパラメトリックな手法は、ピークとノッチの位置(周波数)及び形状(振幅)に基づいて、頭部伝達関数を決定する手法である。パラメトリックな手法については、例えば、IIR(無限インパルス応答)フィルタ、FIR(有限インパルス応答)フィルタ等を用いることで頭部伝達関数が得られる。もちろん、頭部伝達関数記憶部101に記憶される頭部伝達関数は、上記の手法以外の手法によって求めてもよい。
【0051】
なお、
図13に示す頭部伝達関数HRTFの測定では、人を受聴者とせずに、ダミーヘッドを受聴者としてもよい。この場合、代表的な耳介特徴を持った複数のダミーヘッドを受聴者1として測定したデータであってもよい。これにより、
図10に示すような伝達特性を求めるためのクラスタリングが不要になる。もちろん、この場合も、左耳に関する伝達特性Lsと伝達特性Roをペアリングし、かつ右耳に関する伝達特性Rsと伝達特性Loをペアリングする。そして、耳介特性選択部102はペアリングされた2つの伝達特性をセットで読み出す。よって、全体のバランスを崩さずに十分な頭外定位感を得られるようになる。したがって、適切に音像を頭外に定位することができる。
【0052】
実施の形態2.
実施の形態2における頭外定位処理装置100について、
図12を用いて説明する。
図12は、頭外定位処理装置100の構成を示すブロック図である。本実施の形態では、ヘッドホンではなくスピーカを用いて、音場を再生している。したがって、出力部104がクロストークキャンセル部45と、左スピーカ46Lと、右スピーカ46Rとを備えている。なお、出力部104以外の構成、及び処理については、実施の形態1と同様であるため、説明を省略する。
【0053】
加算器24からのLch信号と、加算器25のRch信号がクロストークキャンセル部45に入力される。クロストークキャンセル部45は、右スピーカ46RからのクロストークがキャンセルされたLchの出力信号を左スピーカ46Lに出力する。同様に、左スピーカ46LからのクロストークがキャンセルされたRchの出力信号を右スピーカ46Rに出力する。なお、クロストークキャンセル処理については公知であるため、説明を省略する。このようにすることで、ニアフィールドスピーカ等を音像が頭部に近くなるスピーカ46として用いた場合でも、音像を頭外に定位することができる。
【0054】
なお、スピーカは左右のスピーカ46L、46Rからなるステレオスピーカに限らず、3以上のスピーカを用いてもよい。スピーカが3つの場合、3つのスピーカを用いた測定によって、それぞれのスピーカと左耳間の伝達特性を対応付けて記憶する。そして、選択された左耳特性に基づいて、仮想音源信号生成部103が対応付けられた3つの伝達特性を読み込む。同様に、それぞれのスピーカと右耳間の伝達特性を対応付けて記憶する。そして、選択された右耳特性に基づいて、仮想音源信号生成部103が対応付けられた3つの伝達特性を読み込む。4つ以上のスピーカがある場合も各チャンネルのスピーカと左耳間の伝達特性を1セットとし、各チャンネルのスピーカと右耳間の伝達特性を1セットとして取り扱えばよい。
【0055】
上記信号処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0056】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。