(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-15
(45)【発行日】2024-04-23
(54)【発明の名称】音声再生システムおよび頭部伝達関数選択方法
(51)【国際特許分類】
H04S 1/00 20060101AFI20240416BHJP
H04R 3/00 20060101ALI20240416BHJP
【FI】
H04S1/00 500
H04R3/00 310
(21)【出願番号】P 2020054235
(22)【出願日】2020-03-25
【審査請求日】2023-01-25
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】粂原 和也
(72)【発明者】
【氏名】多田 幸生
(72)【発明者】
【氏名】有田 光希
【審査官】冨澤 直樹
(56)【参考文献】
【文献】特開2014-099797(JP,A)
【文献】特開2017-143469(JP,A)
【文献】特開2015-211235(JP,A)
【文献】特開2008-193382(JP,A)
【文献】特開2015-019360(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00-7/00
H04R 3/00
(57)【特許請求の範囲】
【請求項1】
ユーザが両耳に装用する放音部と、
複数の頭部伝達関数を記憶した記憶部と、
前記放音部から放音する音声信号を前記頭部伝達関数により処理する信号処理部と、
頭部伝達関数選択処理を実行する制御部と、
を備えた
音声再生システムであって、
前記制御部は、前記頭部伝達関数選択処理において、
ユーザのプロファイルを入力し、前記複数の頭部伝達関数から
入力した前記プロファイルに対応する2以上の頭部伝達関数を候補関数として選択し、
選択した各候補関数について、
所定のテスト音声を、所定の定位方向である発音定位方向に定位するよう前記候補関数で処理して前記放音部から放音し、
前記放音部から放音された前記テスト音声の、前記ユーザの聴覚上の定位方向である聴覚定位方向を取得し、
前記発音定位方向と前記聴覚定位方向の差である定位差を算出し、
2以上の前記候補関数についての前記定位差に基づいて、前記ユーザに適用する頭部伝達関数を選択する
音声再生システム。
【請求項2】
前記プロファイルは、前記ユーザの頭部形状または耳介形状の情報を含む請求項1に記載の
音声再生システム。
【請求項3】
前記制御部は、前記複数の候補関数から一つの頭部伝達関数を選択することに代えて、2または3以上の候補関数を選択し、選択された関数値を補間して作成した新たな頭部伝達関数を前記ユーザに適用する請求項1または請求項2に記載の
音声再生システム。
【請求項4】
前記ユーザの頭部の向きを検出する方位検出部をさらに備え、
前記制御部は、前記テスト音声を聴いたユーザが向いたときの前記方位検出部の検出方向を前記聴覚定位方向として取得する
請求項1乃至請求項3のいずれかに記載の
音声再生システム。
【請求項5】
オーディオ再生装置が有線または無線で接続され、前記記憶部、信号処理部、および、制御部の一部または全部が前記オーディオ再生装置に設けられている請求項1乃至請求項4のいずれかに記載の
音声再生システム。
【請求項6】
前記オーディオ再生装置は、ネットワーク通信部を備え、
前記記憶部および前記制御部の一部がネットワーク上のサーバに設けられている
請求項5に記載の
音声再生システム。
【請求項7】
前記放音部は、ネットワーク通信部を備え、
前記記憶部および前記制御部の一部がネットワーク上のサーバに設けられている
請求項1乃至請求項5のいずれかに記載の
音声再生システム。
【請求項8】
前記制御部は、前記ユーザに適用すべく選択された頭部伝達関数の情報を、前記サーバに送信する請求項6または請求項7に記載の
音声再生システム。
【請求項9】
前記候補関数
として、
入力した前記プロファイルに近いプロファイル
に対応する2以上の頭部伝達関数が選択される
請求項1乃至請求項8のいずれかに記載の
音声再生システム。
【請求項10】
信号処理部を備えた装置が、
ユーザのプロファイルを入力し、複数の頭部伝達関数のうち、入力した前記プロファイルに対応する2以上の頭部伝達関数を候補関数として選択し、
選択した各候補関数について、所定のテスト音声を、所定の定位方向である発音定位方向に定位するよう前記候補関数で信号処理してユーザが両耳に装用する放音部から放音し、
前記放音部から放音された前記テスト音声の、前記ユーザの聴覚上の定位方向である聴覚定位方向を取得し、
前記発音定位方向と前記聴覚定位方向の差である定位差を算出し、
2以上の前記候補関数についての前記定位差に基づいて、前記ユーザに適用する頭部伝達関数を選択する
頭部伝達関数選択方法。
【請求項11】
前記プロファイルは、前記ユーザの頭部形状または耳介形状の情報を含む請求項10に記載の頭部伝達関数選択方法。
【請求項12】
前記複数の候補関数から一つの頭部伝達関数を選択することに代えて、2または3以上の候補関数を選択し、選択された関数値を補間して作成した新たな頭部伝達関数を前記ユーザに適用する請求項10
または請求項11に記載の頭部伝達関数選択方法。
【請求項13】
前記ユーザの頭部の向きを検出し、
前記テスト音声を聴いたユーザが向いたとき検出された方向を前記聴覚定位方向として取得する
請求項10
乃至請求項12のいずれかに記載の頭部伝達関数選択方法。
【請求項14】
オーディオ再生装置を、有線または無線で接続し、
前記候補関数を選択する処理、前記テスト音声を前記候補関数で信号処理して放音する処理、前記聴覚定位方向の入力を受け付ける処理、前記定位差を算出する処理、および、前記ユーザに適用する頭部伝達関数を選択する処理、の一部または全部を前記オーディオ再生装置に実行させる
請求項10乃至請求項
13のいずれかに記載の頭部伝達関数選択方法。
【請求項15】
ネットワーク通信部を介してサーバと通信し、
前記候補関数を選択する処理、前記テスト音声を前記候補関数で信号処理して放音する処理、前記聴覚定位方向の入力を受け付ける処理、前記定位差を算出する処理、および、前記ユーザに適用する頭部伝達関数を選択する処理、の一部または全部を前記サーバに実行させる
請求項10乃至請求項
14のいずれかに記載の頭部伝達関数選択方法。
【請求項16】
前記ユーザに適用すべく選択された頭部伝達関数の情報を前記サーバに送信する請求項
15に記載の頭部伝達関数選択方法。
【請求項17】
前記候補関数
として、
入力した前記プロファイルに近いプロファイル
に対応する2以上の頭部伝達関数が選択される
請求項10乃至請求項
16のいずれかに記載の頭部伝達関数選択方法。
【発明の詳細な説明】
【技術分野】
【0001】
この発明の一実施形態は、ユーザに対して所定方向に定位するように音声を放音する音響デバイスにおける頭部伝達関数の選択に関する。
【背景技術】
【0002】
近年、音響でAR(拡張現実:Augmented Reality)を実現する技術が提案されている(例えば、特許文献1)。音響ARでは、ユーザにヘッドホンなどの音響デバイスを装用させ、その音響デバイスで音声を再生する。音響ARを実現するためには、決められた位置に音声を定位させることが必要である。音声を決められた定位位置に定位させる定位処理は、頭部伝達関数の畳み込みによって行われる。
【0003】
頭部伝達関数とは、音源位置からユーザの両耳の外耳道までの音声の伝達関数である。具体的に言うと、頭部伝達関数は、音源位置で発生した音声がユーザの耳に到達するまでの間に、頭部形状、耳介形状などによりどのような周波数特性の変化を受けるかを表した関数である。音源位置からユーザの両耳に到来する音声は、ユーザの頭部形状や耳介形状などの影響を受けて、その到来方向特有の周波数特性となる。ユーザは、この特有の周波数特性を聞き分けて、音声の到来方向を判断している。したがって、ARシステムが、音声を所定方向の頭部伝達関数を用いて加工して再生することにより、ユーザにさも所定方向から音声が聞こえてきたかのような感覚をもたせることができる。なお、音声の定位は、方向と距離で定義される定位位置で表されるが、説明を容易にするため、以下では、主として定位の方向について説明する。定位位置の距離感は、音量の調整等により比較的容易に付加することができる。
【0004】
頭部伝達関数は、予め測定されたものが音響デバイスに記憶される。音響デバイスは、音声を再生するとき、この音声に頭部伝達関数を畳み込むことで定位方向特有の周波数特性を付与する。この音声は、ユーザが装用するヘッドホンなどでバイノーラル再生される。これにより、決められた定位方向から到来した音声と同じ周波数特性を持つ音声がユーザに対して再生されるため、ユーザは、この音声がさも定位方向から聴こえてくるかのような聴感で聴くことができる。
【0005】
バイノーラル再生で音声を全方向に定位可能にするために、頭部伝達関数は、全方向のものが両耳分用意される。実際には、水平方向または垂直方向に所定角度ごとの頭部伝達関数がセットとして用意される。たとえば、水平方向360度(全周)、垂直方向0度から90度(天頂)までの範囲で、10度間隔で頭部伝達関数が用意される。なお、頭部伝達関数セットは、水平面内のみで垂直方向成分を持たない頭部伝達関数セットも含む。頭部伝達関数は、非特許文献1に示されるように、モデル(被験者)の両耳にマイクを挿入し、各音源方向で再生されたテスト音声をマイクで収音することによって測定される。
【0006】
上に述べたように、頭部伝達関数は、全方向のものがセット(一揃い)として用意され、そのうち音声を定位させる1方向の頭部伝達関数が実際の音声の定位に用いられる。以下の説明で、セットの頭部伝達関数と1方向の頭部伝達関数とを区別する必要がある場合、それぞれ「頭部伝達関数セット」および「単一方向頭部伝達関数」と呼ぶこととする。
【先行技術文献】
【特許文献】
【0007】
【非特許文献】
【0008】
【文献】松井健太郎、技研だよりNo.32「頭部伝達関数」[online]、2007年11月、NHK放送技術研究所、[2020年3月5日検索]、インターネット<URL: https://www.nhk.or.jp/strl/publica/giken_dayori/jp2/rd-0711.html>
【発明の開示】
【発明が解決しようとする課題】
【0009】
頭部伝達関数は、主としてユーザの頭部形状や耳介形状によって決定されるものであるため、音声の定位には、ユーザ本人について測定された頭部伝達関数を用いることが理想的である。しかし、ユーザごとに、非特許文献1に示したような設備を用いて、頭部伝達関数を測定することは極めて面倒であり、現実的でない。そこで、ユーザに似たモデルの頭部伝達関数を使用することが考えられるが、予め用意されている複数の頭部伝達関数のなかから適切な頭部伝達関数を選択することも容易ではない。
【0010】
本発明の一実施形態に係る目的の一つは、音響デバイスにおいて、簡易な手順で適切な頭部伝達関数を選択できるようにすることにある。
【課題を解決するための手段】
【0011】
本発明の一実施形態に係る音響デバイスは、ユーザが両耳に装用する放音部と、複数の頭部伝達関数を記憶した記憶部と、信号処理部と、制御部とを備える。信号処理部は、放音部から放音する音声信号を頭部伝達関数により処理する。制御部は、頭部伝達関数選択処理を実行する。制御部は、頭部伝達関数選択処理において以下の処理を実行する。制御部は、複数の頭部伝達関数から2以上の頭部伝達関数を候補関数として選択する。制御部は、選択した各候補関数について、所定のテスト音声を、所定の発音定位方向に定位するよう候補関数で処理して前記放音部から放音する。制御部は、選択した各候補関数について、放音部から放音されたテスト音声の、ユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。制御部は、選択した各候補関数について、発音定位方向と聴覚定位方向の差である定位差を算出する。制御部は、2以上の前記候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。
【0012】
本発明の一実施形態に係る頭部伝達関数選択方法では、信号処理部を備えたデバイスが、以下の処理を実行する。デバイスが、2以上の頭部伝達関数を候補関数として選択する。デバイスが、選択した各候補関数について、テスト音声を所定の発音定位方向に定位するよう候補関数で信号処理し、ユーザが両耳に装用する放音部から放音する。デバイスが、放音部から放音されたテスト音声のユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。デバイスが、発音定位方向と聴覚定位方向の差である定位差を算出して記憶する。デバイスが、2以上の前記候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。
【発明の効果】
【0013】
この発明によれば、簡易な手順で適切な頭部伝達関数を選択することが可能になる。
【図面の簡単な説明】
【0014】
【
図1】この発明が適用される音声再生システムの構成を示す図である。
【
図2】この発明が適用される携帯端末装置のブロック図である。
【
図3】この発明が適用されるヘッドホンのブロック図である。
【
図6】頭部伝達関数選択処理を示すフローチャートである。
【発明を実施するための形態】
【0015】
図1は、本発明が適用される音声再生システム1の構成図である。
図2は、本発明が適用される携帯端末装置10のブロック図である。
図3は、本発明が適用されるヘッドホン20のブロック図である。音声再生システム1は、携帯端末装置10および音響デバイスであるヘッドホン20を含む。
図1は、ユーザLが、携帯端末装置10を手に持ち、ヘッドホン20を両耳に装用した状態を示している。携帯端末装置10は、例えば、スマートホン(多機能携帯電話)が用いられる。携帯端末装置10とヘッドホン20とは、Bluetooth(登録商標)で接続(ペアリング)されており、相互に通信可能である。携帯端末装置10とヘッドホン20との接続は、Bluetoothに限定されず、他の無線通信規格または有線でもよい。携帯端末装置10は、インターネットを含むネットワーク4を介してサーバ3と通信する。ヘッドホン20は、2個のスピーカ21R,21Lとヘッドバンド22とを組み合わせた、いわゆる耳掛け型である。ヘッドホン20は、ヘッドバンド22に3軸のジャイロセンサ(センサ)23を有し、ユーザLの頭部の向きをトラッキング可能である。なお、音響デバイスとして、ヘッドホン20に代えてイヤホンを用いてもよい。サーバ3は、複数の音声再生システム1と通信し、音声再生システム1から収集した頭部伝達関数の選択ログなどを記憶する。また、サーバ3は、複数の頭部伝達関数を記憶しており、必要に応じて音声再生システム1に頭部伝達関数をダウンロードする。
【0016】
音声再生システム1は、アプリケーションプログラム70により、頭部伝達関数選択処理、および、コンテンツ再生処理を実行する。携帯端末装置10では、制御部100を含むハードウェア、および、アプリケーションプログラム70が、協働することにより、候補選択手段、テスト音声放音手段、聴覚定位検出手段、定位差算出手段、および、関数決定手段として機能する。
【0017】
音声再生システム1は、再生する音声をユーザLに対して所定の方向に定位させる。この定位処理に頭部伝達関数が用いられる。頭部伝達関数は、音声の定位位置からユーザLの耳に到達するまでの間に、頭部形状や耳介形状などによって受ける周波数特性の変化を表した関数である。
【0018】
音声再生システム1は、複数の頭部伝達関数を予め記憶しており、その中からユーザLに最も適したものを選択して音声の定位処理に用いる。記憶されている複数の伝達関数は、例えば、それぞれプロファイルの異なるモデル(被験者)から測定したものである。プロファイルとは、
図4のプロファイルテーブル74に示すように、頭部伝達関数を測定したモデルの人種、性別、年齢、頭部形状、耳介形状など、モデルについての頭部伝達関数の決定に影響を与えると考えられる情報である。以下、頭部伝達関数を測定したモデルのプロファイルを、単に、頭部伝達関数のプロファイルと呼ぶ。なお、頭部伝達関数は、複数の測定データの平均値を取る等して機械的に作り上げた伝達関数を使用しても良い。
【0019】
頭部伝達関数選択処理においては以下の処理が実行される。ユーザLが、ヘッドホン20を装用した状態で、携帯端末装置10に自身のプロファイルを入力する。音声再生システム1は、入力されたプロファイルに似たプロファイルを持つ頭部伝達関数を候補として選択する。候補として選択された頭部伝達関数は、候補関数と呼ばれる。候補関数は複数選択される。音声再生システム1は、選択した候補関数を用いてテスト音声を発生する。すなわち、携帯端末装置10が、テスト音声を発生し、このテスト音声に所定の定位方向の頭部伝達関数を畳み込み演算する。この畳み込み演算によってテスト音声に付与された定位特性は、この候補関数のモデルに対して「所定の定位方向」に定位する特性であり、このテスト音声を聴くユーザLに対するものではない。畳み込み演算によって付与された所定の定位方向は、発音定位方向と呼ばれる。
【0020】
この畳み込み演算されたテスト音声が、ヘッドホン20に出力され、ユーザLに向けて放音される。候補関数を畳み込み演算されたテスト音声は、ユーザLに対しても定位特性を有するため、発音定位方向と一致しなくても何らかの定位方向に定位する。この定位方向は聴覚定位方向と呼ばれる。
【0021】
ユーザLは、テスト音声を聴いて、聴覚的にどの方向に定位しているか、すなわち、聴覚定位方向をシステムに入力する。音声再生システム1は、発音定位方向と聴覚定位方向とのずれである定位差を測定して記録する。ずれは、角度差、ずれの方向などの情報である。
【0022】
音声再生システム1は、選択した候補関数の全てについて上の処理を行い、各候補関数の定位差を測定する。そして、この定位差に基づき、複数の候補関数の中から、このユーザLにとって最適な頭部伝達関数を決定する。この決定された頭部伝達関数がコンテンツ再生処理でコンテンツである音声データの定位に使用される。
【0023】
コンテンツ再生処理では、音声再生システム1は、以下の処理を実行する。携帯端末装置10が、ユーザLの居る場所や時刻等を検出し、所定の場所、時刻になると、その場所、時刻に応じた音声を再生する。再生される音声は予め決められた方向に定位される。携帯端末装置10は、ユーザLの現在位置、ユーザLの頭部の向き、および、音声の定位位置に基づいて、ユーザLの頭部が向いている方向に対する音声の定位方向(相対定位方向)を算出する。携帯端末装置10は、頭部伝達関数選択処理で決定された頭部伝達関数(セット)から相対定位方向に対応する角度の頭部伝達関数を読み出して信号処理部105にセットする。信号処理部105は、再生された音声信号に対して頭部伝達関数を畳み込む信号処理を行う。信号処理された音声信号は、ヘッドホン20に送信される。ヘッドホン20は、受信した音声をスピーカ21R,21Lから出力する。これにより、ユーザLは、所定の方向から聞こえてくるような感覚で音声を聞くことができる。
【0024】
図2を参照して携帯端末装置10を詳細に説明する。携帯端末装置10は、制御部100、記憶部101、ネットワーク通信部102、GPS測位部103、音声生成部104、信号処理部105、および、デバイス通信部106を有するスマートホンである。制御部100は、CPUを含んでいる。記憶部101は、ROM、RAMおよびフラッシュメモリを含んでいる。
【0025】
記憶部101には、アプリケーションプログラム70、音声データ71、シナリオファイル72、頭部伝達関数データベース73、プロファイルテーブル74、および、選択ログ75が記憶されている。
【0026】
アプリケーションプログラム70は、この携帯端末装置10およびヘッドホン20を、本実施形態の音声再生システム1として機能させるためのプログラムである。音声データ71は、頭部伝達関数の選択時に再生されるテスト音声、および、シナリオファイル72に基づいて再生されるコンテンツとしての音声データを含んでいる。シナリオファイル72は、コンテンツである音声データの再生イベントが記述されたファイルであり、コンテンツ再生処理で使用される。シナリオファイル72には、イベントごとに、音声データの再生タイミング、再生される音声の定位位置、再生する音声データの識別情報が記載されている。
【0027】
頭部伝達関数データベース73には、複数の頭部伝達関数が記憶されている。各頭部伝達関数は、それぞれ異なるプロファイルのモデルで測定されたものである。プロファイルテーブル74は、頭部伝達関数データベース73に記憶されている各頭部伝達関数のプロファイルを記憶したテーブルである。頭部伝達関数選択処理において、ユーザLが自身のプロファイルを入力すると、このプロファイルでプロファイルテーブル74が参照され、似たプロファイルを有する頭部伝達関数が候補関数として選択される。
【0028】
図4はプロファイルテーブル74の例を示す図である。プロファイルテーブル74には、頭部伝達関数データベース73に記憶されている各頭部伝達関数の(モデルの)プロファイルがそれぞれ記憶される。プロファイルとして、この例では、人種、性別、年齢、頭部形状、耳介形状が記憶されている。「人種」は、東アジア(モンゴロイド)、白人(コーカソイド)、黒人(ネグロイド)など骨格の違いで分類されている。「性別」、「年齢」は、モデルおよびユーザLの体格、体型を推定する指標である。「頭部形状」は、たとえば、丸形、四角形、逆三角形、五角形などの形状で表され、頭部伝達関数を決定する重要な要素である。「耳介形状」は、たとえば、丸形、四角型、三角形などの形状で表され、頭部伝達関数を決定する重要な要素である。
図4の例では、以上のプロファイルで頭部伝達関数を分類しているが、プロファイルはこれに限定されない。例えば、モデルの身長、体重などをプロファイルの項目に入れてもよい。
【0029】
頭部伝達関数選択処理において、ユーザLは、自身のプロファイルとして、プロファイルテーブル74に記載されている項目の全部または一部を入力する。音声再生システム1は、ユーザLによって入力されたプロファイルと、プロファイルテーブル74に記憶されている各頭部伝達関数のプロファイルとを比較し、一致するものが多いものなどを候補関数として選択する。この選択において、プロファイルの各項目を平等に扱ってもよく、影響の大きいと思われる項目の係数を大きくするなど、重み付けをしてもよい。また、プロファイルは、例えば携帯端末装置10に予め設定されている情報、例えば、住んでいる地域または使用している言語等に基づいて選択してもよい。この場合、携帯端末装置10は、予め設定されている各種の情報と、プロファイルと、を対応付けるテーブルを記憶部101に記憶しておく。携帯端末装置10は、当該テーブルに基づいてプロファイルを選択することで、プロファイルの選択の精度を簡易に高めることができる。
【0030】
図5は、選択ログ75の例を示す図である。選択ログ75には、頭部伝達関数選択処理の選択結果が記録される。すなわち、頭部伝達関数選択処理において、ユーザLのユーザID、ユーザLによって入力されたプロファイル、および、最終的にユーザLに適用すべく選択された頭部伝達関数とが対応付けて記録される。選択ログ75の内容は、定期的または不定期にサーバ3にアップロードされる。
【0031】
ネットワーク通信部102は、ネットワーク4を介してサーバ3と通信する。制御部100は、ネットワーク通信部102を用いて、サーバ3に選択ログ75の内容をアップロードする。この実施形態では、頭部伝達関数データベース73が、携帯端末装置10の記憶部101に記憶されているが、サーバ3に記憶されていてもよい。この場合、携帯端末装置10は、ユーザLのプロファイルでプロファイルテーブル74を参照して複数の候補関数(頭部伝達関数)を選択し、選択した頭部伝達関数をサーバ3からダウンロードすればよい。GPS測位部103は、GPS(Global Positioning System)衛星の信号を受信して、自身の正確な位置を測定する。
【0032】
音声生成部104は、ヘッドホン20に出力する音声を生成する。音声生成部104によって生成された音声信号は、信号処理部105に入力される。信号処理部105には、頭部伝達関数がセットされている。具体的には、信号処理部105は、FIRフィルタとして構成されており、頭部伝達関数を時間領域に変換した頭部インパルス応答がフィルタ係数としてセットされる。信号処理部105は、音声信号に頭部伝達関数(頭部インパルス応答)に畳み込むことにより、この音声が指定された方向から聴こえてくるような周波数特性に加工する。
【0033】
デバイス通信部106は、Bluetooth対応機器であるヘッドホン20と通信する。デバイス通信部106は、ヘッドホン20に対して音声信号の送信を行うとともに、ヘッドホン20からジャイロセンサ23の検出値を受信する。
【0034】
図3のブロック図を参照して、ヘッドホン20の構成を説明する。ヘッドホン20は、スピーカ21L,21R、ジャイロセンサ23、デバイス通信部24、AIF25、DAC26L,26R、アンプ27L,27Rを備えている。
【0035】
デバイス通信部24は、Bluetooth対応機器である携帯端末装置10(デバイス通信部106)と通信する。AIF(Audio Interface)25は、携帯端末装置10から受信した音声信号を左右チャンネル毎にDAC26L,26Rに送信する。DAC(Digtal to Analog Converter)26L,26Rは、AIF25から入力されたデジタル信号をアナログ信号に変換する。アンプ27L,27Rは、DAC26L,26Rから入力されたアナログ信号を増幅してスピーカ21L,21Rに供給する。これにより、携帯端末装置10から受信した音声信号は、音響としてスピーカ21L,21Rから放音される。上述したように、音声信号は、予め決められた位置に定位するよう信号処理されているため、ユーザLが移動しても且つ頭部の向きを変えても、ユーザLには同じ位置から発音しているように聞こえる。
【0036】
図6のフローチャートを参照して、頭部伝達関数選択処理について説明する。この実施形態では、頭部伝達関数選択処理は、携帯端末装置10の制御部100によって実行される。
図6において、ユーザLが自身のプロファイルを入力する(S11)。携帯端末装置10は、入力されたユーザプロファイルでプロファイルテーブル74を参照し、候補となる頭部伝達関数(候補関数)を複数選択する(S12)。S12で選択される候補関数の数は、m個(n=1~m)とする。
【0037】
テストされる候補関数を示す引数nに1がセットされる(S13)。テストでは、候補関数nを用いて定位されたテスト音声が、ユーザLには、どの方向に聞こえるかが判定される。携帯端末装置10は、テスト音声の定位方向(発音定位方向)を決定する(S14)。テスト音声の定位方向は、予め一つの方向を決めておいてもよいが、ユーザLの慣れを防ぐため、毎回異なる方向を決定すればよい。また、携帯端末装置10が、テスト音声の定位方向を、決定した発音定位方向を中心にわずかに揺らせることにより、ユーザLが定位方向を認識しやすくなる。発音定位方向を揺らせる処理は、信号処理部105にセットされた頭部インパルス応答の1または数個のフィルタ係数を、わずかに上下させることによって可能である。
【0038】
携帯端末装置10は、この定位方向の単一方向頭部伝達関数をn番目の候補関数セットから読み出して信号処理部105にセットする(S15)。頭部伝達関数がセットされたのち、携帯端末装置10は、テスト音声を発生する(S16)。
【0039】
テスト音声が発生されると、ユーザLが、自身の聴覚上のテスト音声の定位方向(聴覚定位方向)を入力する(S17)。ユーザLによる聴覚定位方向の入力は、どのような方法であってもよい。たとえば、「ユーザLが、手に持っている携帯端末装置10を聴覚定位方向に向ける。」、「ユーザLが、聴覚定位方向に頭を向け、ジャイロセンサ23でその方向を検出する。」などの方法採用することができる。
【0040】
候補関数はユーザL自身の頭部伝達関数ではないため、発音定位方向とユーザLの聴覚定位方向には、ずれが生じることが考えられる。S18では、そのずれである定位差を算出して記録する(S18)。定位差として、ずれの大きさ(角度の絶対値)、ずれの方向(発音定位方向から聴覚定位方向への相対角度)などが記録される。
【0041】
携帯端末装置10は、候補関数1~mについて、S14-S18の処理を繰り返し実行する(S19,S20)。S14-S18の処理は、テスト発音を発生して発音定位方向とユーザLの聴覚定位方向の定位差を測定する処理である。候補関数1~mの定位差を算出・記録したのち、この記録に基づいて、候補関数1~mのなかから最適な頭部伝達関数を決定する(S21)。頭部伝達関数の決定方法は制限がないが、例えば、「角度差の最も小さいものを選択する。」、「水平方向の角度差が最も小さいものを選択する。」などの手法を採用することが可能である。そして、今回の選択結果をユーザLのプロファイルとともに選択ログ75に記録する(S22)。
【0042】
図6の頭部伝達関数選択処理において、ユーザLからのプロファイルの入力がない場合、過去の選択ログ75を参照して、以前に選択された頭部伝達関数を今回も選択するようにしてもよい。
【0043】
以上詳述した実施形態から、以下のような態様が把握される。
【0044】
一実施形態に係る音響デバイスは、ユーザが両耳に装用する放音部と、複数の頭部伝達関数を記憶した記憶部と、信号処理部と、制御部とを備える。信号処理部は、放音部から放音する音声信号を頭部伝達関数により処理する。制御部は、頭部伝達関数選択処理を実行する。制御部は、頭部伝達関数選択処理において以下の処理を実行する。制御部は、複数の頭部伝達関数から2以上の頭部伝達関数を候補関数として選択する。制御部は、選択した各候補関数について、所定のテスト音声を、所定の発音定位方向に定位するよう候補関数で処理して前記放音部から放音する。制御部は、選択した各候補関数について、放音部から放音されたテスト音声の、ユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。制御部は、選択した各候補関数について、発音定位方向と聴覚定位方向の差である定位差を算出する。制御部は、2以上の候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。制御部は、例えば、定位差が所定の閾値を超える候補関数を選択する。
【0045】
一態様においては、放音部が、ヘッドホンまたはイヤホンであってもよい。
【0046】
一態様においては、制御部は、複数の候補関数から一つの頭部伝達関数を選択することに代えて、2または3以上の候補関数を選択してもよい。制御部は、選択したこれらの関数値を補間して作成した新たな頭部伝達関数をユーザに適用してもよい。
【0047】
一態様においては、ユーザの頭部の向きを検出する方位検出部をさらに備えてもよい。制御部は、テスト音声を聴いたユーザが向いたときの方位検出部の検出方向を聴覚定位方向として取得してもよい。
【0048】
一態様においては、音響デバイスが、オーディオ再生装置が有線または無線で接続された構成であってもよい。記憶部、信号処理部、および、制御部の一部または全部がオーディオ再生装置に設けられていてもよい。
【0049】
一態様においては、オーディオ再生装置または放音部にネットワーク通信部を備えてもよい。記憶部および制御部の一部がネットワーク上のサーバに設けられていてもよい。
【0050】
一態様において、制御部は、ユーザに適用するよう選択された候補関数の情報を、サーバに送信してもよい。サーバは、複数の音響デバイスから頭部伝達関数の選択情報を収集してもよい。
【0051】
一態様においては、複数の頭部伝達関数として、異なる(various)プロファイルの頭部伝達関数が記憶されていてもよい。ユーザのプロファイルに近いプロファイルの頭部伝達関数が候補関数として選択されてもよい。
【0052】
《変形例1》
上記実施形態では、携帯端末装置10は、各候補関数について1回ずつテスト音声が発生されるようにしていた。各候補関数について、それぞれ別の発音定位方向で複数回ずつテスト音声が発生されるようにしてもよい。この場合、携帯端末装置10は、同じ候補関数についてS14-S18の処理を複数回繰り返せばよい。
【0053】
《変形例2》
上記実施形態では、携帯端末装置10は、定位差に基づいて一つの候補関数を選択し、この候補関数(頭部伝達関数)をユーザLに適用している。携帯端末装置10が、定位差に基づいて複数の候補関数を選択し、これらの候補関数を補間してユーザに適用してもよい。
【0054】
《変形例3》
上記実施形態では、本発明の音響デバイスが、携帯端末装置10とヘッドホン20との組み合わせで構成されていた。本発明の音響デバイスの全ての構成が、ヘッドホン20に集約されていてもよい。
【0055】
《変形例4》
本発明の音響デバイスの構成の一部が、ネットワーク上のサーバ3に存在していてもよい。たとえば、頭部伝達関数データベース73がサーバ3に設けられ、プロファイルに基づいて選択された候補関数がサーバ3からダウンロードされてもよい。
【0056】
《変形例5》
上記実施形態では、ユーザが入力したプロファイルに基づいて候補関数が選択される。ユーザが装用するヘッドホンが、カメラなどのセンサを備え、センサによってヘッドトラッキングデータ取得してもよい。システムは、ヘッドトラッキングデータに基づいてユーザの頭の形状を推定し、候補関数またはユーザに設定される頭部伝達関数を自動選択する。
【符号の説明】
【0057】
1 音声再生システム
10 携帯端末装置(スマートホン)
20 ヘッドホン
21 スピーカ
23 ジャイロセンサ
70 アプリケーションプログラム
73 頭部伝達関数データベース
74 プロファイルテーブル
75 選択ログ
101 記憶部
105 信号処理部