(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024159912
(43)【公開日】2024-11-08
(54)【発明の名称】音響処理方法、音響処理装置、及び音響処理プログラム
(51)【国際特許分類】
H04S 7/00 20060101AFI20241031BHJP
【FI】
H04S7/00 300
H04S7/00 340
H04S7/00 360
【審査請求】未請求
【請求項の数】16
【出願形態】OL
【公開請求】
(21)【出願番号】P 2024140853
(22)【出願日】2024-08-22
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110004303
【氏名又は名称】弁理士法人三協国際特許事務所
(72)【発明者】
【氏名】中 光波
(72)【発明者】
【氏名】中橋 康太
(72)【発明者】
【氏名】石川 智一
(57)【要約】
【課題】音像の頭外定位の効果を分かりやすくユーザに伝えることができる技術を提供する。
【解決手段】音響処理方法は、コンピュータにより実行される音響処理方法であって、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付けることと、開始音の音像をユーザの頭外の開始位置に定位させるとともに、定位させた音像をユーザの側方を通るように移動させることとを含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
コンピュータにより実行される音響処理方法であって、
再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付けることと、
開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させることと、
を含む音響処理方法。
【請求項2】
前記開始位置は、前記ユーザの側方に存在し、
前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させることを含む、
請求項1記載の音響処理方法。
【請求項3】
前記開始位置は、前記ユーザの側方に存在し、
前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記ユーザの後方を通って、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させることを含む、
請求項1記載の音響処理方法。
【請求項4】
前記開始位置は、前記ユーザの側方に存在し、
前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させ、さらに前記再生位置から前記ユーザの周囲に沿って前記音像を一周させることを含む、
請求項1記載の音響処理方法。
【請求項5】
前記開始位置は、前記再生音が到達する前記所定方向に存在する再生位置であり、
前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から前記ユーザの周囲に沿って前記音像を一周させることを含む、
請求項1記載の音響処理方法。
【請求項6】
前記開始指示が受け付けられた場合、前記開始音を再生することをさらに含む、
請求項1~5のいずれか1項に記載の音響処理方法。
【請求項7】
前記移動は、前記開始指示が受け付けられた場合、前記開始指示が受け付けられた際に再生している前記再生音の前記音像を前記開始音の前記音像として前記開始位置に定位させることを含む、
請求項1~5のいずれか1項に記載の音響処理方法。
【請求項8】
前記移動は、
前記開始音を含む音情報に対して、音を、前記音像の方向から到達する音として定位させるための第1頭部伝達関数を畳み込むことで、第1出力音信号を生成することと、
前記音情報に対して、前記音を、前記音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、前記第1出力音信号によって知覚される前記開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰を有する音として定位させるための第2頭部伝達関数を畳み込むことで、第2出力音信号を生成することと、
生成した前記第1出力音信号と前記第2出力音信号とを合成した出力音信号を出力することと、
を含む、
請求項1~5のいずれか1項に記載の音響処理方法。
【請求項9】
前記移動は、
前記開始音を含む音情報に対して、音を、前記音像の方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成することと、
前記音情報に対して、前記音を、前記音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、前記第1出力音信号によって知覚される前記開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰量を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成することと、
生成した前記第1出力音信号と前記第2出力音信号とを合成した出力音信号を出力することと、
を含み、
前記第1合成バイノーラルルームインパルス応答は、前記ユーザの第1頭部特性を示すとともに前記音像の方向と前記ユーザの正面方向とがなす第1音像角度に対応付けられた第1頭部インパルス応答の直接音成分と、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すとともに前記第1音像角度に対応付けられた第1バイノーラルルームインパルス応答の残響音成分とを合成することにより作成され、
前記第2合成バイノーラルルームインパルス応答は、前記第1頭部特性を示すとともに前記第1方向と前記ユーザの前記正面方向とがなす第2音像角度に対応付けられた第2頭部インパルス応答の直接音成分と、前記第2頭部特性及び前記空間特性を示すとともに前記第2音像角度に対応付けられた第2バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される、
請求項1~5のいずれか1項に記載の音響処理方法。
【請求項10】
出力された前記出力音信号は、前記ユーザの頭部に装着されたヘッドホン又はイヤホンを用いて再生される、
請求項9記載の音響処理方法。
【請求項11】
前記第1角度は、前記音像の方向との角度が90度より大きく、270度より小さい角度範囲内の角度である、
請求項9記載の音響処理方法。
【請求項12】
前記第1出力音信号の生成は、
前記第1バイノーラルルームインパルス応答の波形及び前記第1頭部インパルス応答の波形をトリミングすることと、
前記第1頭部インパルス応答の前記直接音成分の終端期間において、前記第1頭部インパルス応答と前記第1バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、
前記置換時刻以前の前記第1バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記第1頭部インパルス応答の前記直接音成分に置換することと、
を含み、
前記第2出力音信号の生成は、
前記第2バイノーラルルームインパルス応答の波形及び前記第2頭部インパルス応答の波形をトリミングすることと、
前記第2頭部インパルス応答の前記直接音成分の終端期間において、前記第2頭部インパルス応答と前記第2バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、
前記置換時刻以前の前記第2バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記第2頭部インパルス応答の前記直接音成分に置換することと、
を含む、
請求項9記載の音響処理方法。
【請求項13】
前記第1頭部インパルス応答の前記トリミングは、前記第1バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記第1頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記第1バイノーラルルームインパルス応答の波形及び前記第1頭部インパルス応答の波形をトリミングすることを含み、
前記第2頭部インパルス応答の前記トリミングは、前記第2バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記第2頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記第2バイノーラルルームインパルス応答の波形及び前記第2頭部インパルス応答の波形をトリミングすることを含む、
請求項12記載の音響処理方法。
【請求項14】
前記第1出力音信号の生成は、
前記第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、
前記第1バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、
前記第1バイノーラルルームインパルス応答に前記第1頭部インパルス応答を畳み込むことと、
を含み、
前記第2出力音信号の生成は、
前記第2バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、
前記第2バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、
前記第2バイノーラルルームインパルス応答に前記第2頭部インパルス応答を畳み込むことと、
を含む、
請求項9記載の音響処理方法。
【請求項15】
プロセッサを備える音響処理装置であって、
前記プロセッサは、
再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付け、
開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させる、
音響処理装置。
【請求項16】
再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付け、
開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させるようにコンピュータを機能させる、
音響処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音像をユーザの頭外に定位させる技術に関する。
【背景技術】
【0002】
従来、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理装置が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の技術では、音像の頭外定位の効果を分かりやすくユーザに伝えることが困難であり、更なる改善が必要とされていた。
【0005】
本開示は、上記の問題を解決するためになされたもので、音像の頭外定位の効果を分かりやすくユーザに伝えることができる技術を提供することを目的とするものである。
【課題を解決するための手段】
【0006】
本開示の一態様に係る音響処理方法は、コンピュータにより実行される音響処理方法であって、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付けることと、開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させることと、を含む。
【発明の効果】
【0007】
本開示によれば、音像の頭外定位の効果を分かりやすくユーザに伝えることができる。
【図面の簡単な説明】
【0008】
【
図1】本実施の形態に係る音響再生装置の使用事例1を示す概略図である。
【
図2】本実施の形態に係る音響再生装置の使用事例2を示す概略図である。
【
図3】本実施の形態に係る音響再生装置の機能構成を示すブロック図である。
【
図4】本実施の形態に係る音響処理装置のより詳細な機能構成を示すブロック図である。
【
図5】本実施の形態において、頭外に定位させた音像を移動させる第1音像定位処理について説明するための模式図である。
【
図6】本実施の形態において、頭外に定位させた音像を移動させる第2音像定位処理について説明するための模式図である。
【
図7】本実施の形態において、頭外に定位させた音像を移動させる第3音像定位処理について説明するための模式図である。
【
図8】本実施の形態において、頭外に定位させた音像を移動させる第4音像定位処理について説明するための模式図である。
【
図9】本実施の形態に係る音量減衰について説明するための図である。
【
図10】本実施の形態に係る、音響処理装置によって出力された再生音の到達方向を説明するための図である。
【
図11】本実施の形態に係る第1信号処理部の構成を示すブロック図である。
【
図12】本実施の形態に係る第2信号処理部の構成を示すブロック図である。
【
図13】本実施の形態における第1合成バイノーラルルームインパルス応答の作成方法を説明するための図である。
【
図14】本実施の形態に係る第1作成部の構成を示すブロック図である。
【
図15】本実施の形態に係る第2作成部の構成を示すブロック図である。
【
図16】本実施の形態に係る音響処理装置の動作を示すフローチャートである。
【
図17】本実施の形態に係る第1処理部による第1出力音信号生成処理について説明するためのフローチャートである。
【
図18】本実施の形態に係る第2処理部による第2出力音信号生成処理について説明するためのフローチャートである。
【
図19】本開示の実施の形態に係る第1作成部による第1合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【
図20】本実施の形態における第1バイノーラルルームインパルス応答及び第1頭部インパルス応答の一例を示す図である。
【
図21】本実施の形態における第1合成バイノーラルルームインパルス応答の一例を示す図である。
【
図22】本実施の形態において、第1バイノーラルルームインパルス応答の最大振幅位置と第1頭部インパルス応答の最大振幅位置とを揃える処理について説明するための図である。
【
図23】本実施の形態に係る、適切な第1角度の一例について説明するための図である。
【
図24】本実施の形態に係る、適切な第1遅延時間の一例について説明するための図である。
【
図25】本実施の形態に係る、適切な第1音量減衰量の一例について説明するための図である。
【
図26】本実施の形態の変形例1における第1作成部の構成を示すブロック図である。
【
図27】本実施の形態の変形例1における第2作成部の構成を示すブロック図である。
【
図28】本開示の実施の形態の変形例1に係る第1作成部による第1合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【
図29】本実施の形態の変形例1における第1バイノーラルルームインパルス応答の一例を示す図である。
【
図30】本実施の形態の変形例1において、第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する処理を説明するための図である。
【
図31】本実施の形態の変形例1において、第1バイノーラルルームインパルス応答の時刻0における振幅を1に設定する処理を説明するための図である。
【
図32】本実施の形態の変形例1における第1合成バイノーラルルームインパルス応答の一例を示す図である。
【
図33】本実施の形態の変形例2に係る音響再生装置の機能構成を示すブロック図である。
【
図34】本実施の形態の変形例2に係る音響処理装置の詳細な機能構成を示すブロック図である。
【
図35】本実施の形態の変形例2に係る、音響処理装置によって出力された音の到達方向を説明するための図である。
【
図36】本実施の形態の変形例2に係る音響処理装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0009】
(本開示の基礎となった知見)
従来、仮想的な三次元空間内(以下、三次元音場という場合がある)で、ユーザの感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている。仮想的な三次元空間内における所定位置に音像を定位させることで、ユーザは、当該所定位置とユーザとを結ぶ直線に平行な方向(すなわち所定方向)から到達する音であるかのごとく、この音を知覚することができる。このように仮想的な三次元空間内の所定位置に音像を定位させるには、例えば、収音された音に対して、立体的な音として知覚されるような両耳間での音の到達時間差、及び、両耳間での音のレベル差(又は音圧差)などを生じさせる計算処理が必要となる。
【0010】
ここで、近年、通信回線を利用して映像と音声とを双方向に送受信して通信相手とコミュニケーションをとるといった、いわゆるオンライン会議システムが盛んに利用されている。このようなオンライン会議システムでは、ヘッドホンなどの頭部装着型の音響再生装置が用いられることも多い。上記のようなオンライン会議システムに代表されるように、音をヘッドホンで受聴するような場合に、当該音を三次元音場に展開してユーザに知覚させることは困難である。例えば、単に通信相手が表示されている表示装置の方向を音の到達方向として、この方向から到達するように音を知覚させる頭部伝達関数を畳み込むだけでは、十分な頭外感が得られないことが知られている。すなわち、ユーザの頭部内に音像が定位されるため、表示装置の先にいる通信相手の映像と、頭部内に定位された音とに違和感が生じる。そして、このような違和感を抱えたまま、受聴を継続すると、必要以上に疲労してしまうという場合がある。同様の課題は、VR(VirtualReality)及びAR(Augmented Reality)等の三次元映像空間を利用したコンテンツの音を、ヘッドホン等の音響再生装置で受聴した場合などにも生じうる。
【0011】
そこで、ヘッドホンを利用しても音を三次元音場に展開することが可能な技術が知られている。例えば、疑似的な部屋を想定して、反射音がどのように発生するかをシミュレーションすることで、これらの反射音を人為的に作り出して合成し、ユーザに受聴させるという手法がある。すると、ユーザは、合成された反射音を含む音によって、本来の音が疑似的な部屋内で所定方向から到達しているかのように知覚することができる。
【0012】
上記の従来技術の音響処理装置では、主に、ユーザの正面方向に再生音の音像が定位されている。音像の頭外定位の効果はユーザによって感じ方に違いがあり、効果を感じにくい人もいる。特に、音像がユーザの正面方向にある場合は音像が定位しにくいという傾向がある。そのため、上記の従来技術では、音像の頭外定位の効果を分かりやすくユーザに伝えることが困難であった。
【0013】
以上の課題を解決するために、下記の技術が開示される。
【0014】
(1)本開示の一態様に係る音響処理方法は、コンピュータにより実行される音響処理方法であって、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付けることと、開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させることと、を含む。
【0015】
音像がユーザの正面方向にある場合よりも、音像がユーザの側方にある場合の方が、両耳間の音圧特性及び位相特性の差異が大きくなり、音像の定位が容易になる。上記の構成によれば、開始音の音像がユーザの側方を通るので、音像の頭外定位の効果を分かりやすくユーザに伝えることができる。
【0016】
(2)上記(1)記載の音響処理方法において、前記開始位置は、前記ユーザの側方に存在し、前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させることを含んでもよい。
【0017】
この構成によれば、開始音の音像が、ユーザの側方から再生位置に向けてユーザの周囲に沿って移動されるので、音像が定位される効果を高めることができる。
【0018】
(3)上記(1)記載の音響処理方法において、前記開始位置は、前記ユーザの側方に存在し、前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記ユーザの後方を通って、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させることを含んでもよい。
【0019】
この構成によれば、開始音の音像が、ユーザの側方から、ユーザの後方を通って、再生位置に向けてユーザの周囲に沿って移動されるので、音像が定位される効果を高めることができる。
【0020】
(4)上記(1)記載の音響処理方法において、前記開始位置は、前記ユーザの側方に存在し、前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から、前記再生音が到達する前記所定方向に存在する再生位置に向けて前記ユーザの周囲に沿って前記音像を移動させ、さらに前記再生位置から前記ユーザの周囲に沿って前記音像を一周させることを含んでもよい。
【0021】
この構成によれば、開始音の音像が、ユーザの側方から再生位置に向けてユーザの周囲に沿って移動され、さらに再生位置からユーザの周囲に沿って一周されるので、音像が定位される効果を高めることができる。
【0022】
(5)上記(1)記載の音響処理方法において、前記開始位置は、前記再生音が到達する前記所定方向に存在する再生位置であり、前記移動は、前記音像を前記開始位置に定位させるとともに、前記開始位置から前記ユーザの周囲に沿って前記音像を一周させることを含んでもよい。
【0023】
この構成によれば、開始音の音像が、再生位置からユーザの周囲に沿って一周されるので、音像が定位される効果を高めることができる。
【0024】
(6)上記(1)~(5)のいずれか1つに記載の音響処理方法において、前記開始指示が受け付けられた場合、前記開始音を再生することをさらに含んでもよい。
【0025】
この構成によれば、開始指示が受け付けられた場合、再生音とは異なる開始音が再生されるので、音像を頭外に定位させる音響処理が開始されることを開始音によってユーザに通知することができる。
【0026】
(7)上記(1)~(5)のいずれか1つに記載の音響処理方法において、前記移動は、前記開始指示が受け付けられた場合、前記開始指示が受け付けられた際に再生している前記再生音の前記音像を前記開始音の前記音像として前記開始位置に定位させることを含んでもよい。
【0027】
この構成によれば、開始指示が受け付けられた場合、開始指示が受け付けられた際に再生している再生音の音像が開始音の音像として開始位置に定位されるので、音像を頭外に定位させる音響処理が開始されることを再生音によってユーザに通知することができる。
【0028】
(8)上記(1)~(7)のいずれか1つに記載の音響処理方法において、前記移動は、前記開始音を含む音情報に対して、音を、前記音像の方向から到達する音として定位させるための第1頭部伝達関数を畳み込むことで、第1出力音信号を生成することと、前記音情報に対して、前記音を、前記音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、前記第1出力音信号によって知覚される前記開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰を有する音として定位させるための第2頭部伝達関数を畳み込むことで、第2出力音信号を生成することと、生成した前記第1出力音信号と前記第2出力音信号とを合成した出力音信号を出力することと、を含んでもよい。
【0029】
この構成によれば、第2出力音信号が、第1方向から到達し、第1遅延時間及び第1音量減衰量を有する音として定位されるので、疑似的な反射壁によって開始音が反射された反射音としてユーザに知覚される。このため、直接音としての開始音とともに、第1遅延時間及び第1音量減衰量を有して反射音が知覚されるので、直接音の音像が定位される位置の頭外感が向上される。
【0030】
(9)上記(1)~(7)のいずれか1つに記載の音響処理方法において、前記移動は、前記開始音を含む音情報に対して、音を、前記音像の方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成することと、前記音情報に対して、前記音を、前記音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、前記第1出力音信号によって知覚される前記開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰量を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成することと、生成した前記第1出力音信号と前記第2出力音信号とを合成した出力音信号を出力することと、を含み、前記第1合成バイノーラルルームインパルス応答は、前記ユーザの第1頭部特性を示すとともに前記音像の方向と前記ユーザの正面方向とがなす第1音像角度に対応付けられた第1頭部インパルス応答の直接音成分と、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すとともに前記第1音像角度に対応付けられた第1バイノーラルルームインパルス応答の残響音成分とを合成することにより作成され、前記第2合成バイノーラルルームインパルス応答は、前記第1頭部特性を示すとともに前記第1方向と前記ユーザの前記正面方向とがなす第2音像角度に対応付けられた第2頭部インパルス応答の直接音成分と、前記第2頭部特性及び前記空間特性を示すとともに前記第2音像角度に対応付けられた第2バイノーラルルームインパルス応答の残響音成分とを合成することにより作成されてもよい。
【0031】
この構成によれば、第2出力音信号が、第1方向から到達し、第1遅延時間及び第1音量減衰量を有する音として定位されるので、疑似的な反射壁によって開始音が反射された反射音としてユーザに知覚される。このため、直接音としての開始音とともに、第1遅延時間及び第1音量減衰量を有して反射音が知覚されるので、直接音の音像が定位される位置の頭外感が向上される。
【0032】
また、特に、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答が音情報に畳み込まれるとともに、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答が音情報に畳み込まれるので、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を音情報に畳み込むことができ、より立体的な音をユーザに知覚させることができる。
【0033】
(10)上記(9)記載の音響処理方法において、出力された前記出力音信号は、前記ユーザの頭部に装着されたヘッドホン又はイヤホンを用いて再生されてもよい。
【0034】
この構成によれば、ユーザの頭部に装着されたヘッドホン又はイヤホンを用いて、より適切に立体的な音をユーザに知覚させることができる。
【0035】
(11)上記(9)又は(10)記載の音響処理方法において、前記第1角度は、前記音像の方向との角度が90度より大きく、270度より小さい角度範囲内の角度であってもよい。
【0036】
この構成によれば、開始音が到達する方向とは反対側から反射音が到達することになり、より立体的な音をユーザに知覚させることができる。
【0037】
(12)上記(9)~(11)のいずれか1つに記載の音響処理方法において、前記第1出力音信号の生成は、前記第1バイノーラルルームインパルス応答の波形及び前記第1頭部インパルス応答の波形をトリミングすることと、前記第1頭部インパルス応答の前記直接音成分の終端期間において、前記第1頭部インパルス応答と前記第1バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、前記置換時刻以前の前記第1バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記第1頭部インパルス応答の前記直接音成分に置換することと、を含み、前記第2出力音信号の生成は、前記第2バイノーラルルームインパルス応答の波形及び前記第2頭部インパルス応答の波形をトリミングすることと、前記第2頭部インパルス応答の前記直接音成分の終端期間において、前記第2頭部インパルス応答と前記第2バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、前記置換時刻以前の前記第2バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記第2頭部インパルス応答の前記直接音成分に置換することと、を含んでもよい。
【0038】
この構成によれば、第1バイノーラルルームインパルス応答の直接音成分が、第1頭部インパルス応答の直接音成分に置換されることにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。また、第2バイノーラルルームインパルス応答の直接音成分が、第2頭部インパルス応答の直接音成分に置換されることにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。
【0039】
(13)上記(12)記載の音響処理方法において、前記第1頭部インパルス応答の前記トリミングは、前記第1バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記第1頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記第1バイノーラルルームインパルス応答の波形及び前記第1頭部インパルス応答の波形をトリミングすることを含み、前記第2頭部インパルス応答の前記トリミングは、前記第2バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記第2頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記第2バイノーラルルームインパルス応答の波形及び前記第2頭部インパルス応答の波形をトリミングすることを含んでもよい。
【0040】
この構成によれば、第1バイノーラルルームインパルス応答と第1頭部インパルス応答との時刻を合わせるように、第1バイノーラルルームインパルス応答に第1頭部インパルス応答を適切に合成することができるとともに、第2バイノーラルルームインパルス応答と第2頭部インパルス応答との時刻を合わせるように、第2バイノーラルルームインパルス応答に第2頭部インパルス応答を適切に合成することができる。
【0041】
(14)上記(9)~(11)のいずれか1つに記載の音響処理方法において、前記第1出力音信号の生成は、前記第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、前記第1バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、前記第1バイノーラルルームインパルス応答に前記第1頭部インパルス応答を畳み込むことと、を含み、前記第2出力音信号の生成は、前記第2バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、前記第2バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、前記第2バイノーラルルームインパルス応答に前記第2頭部インパルス応答を畳み込むことと、を含んでもよい。
【0042】
この構成によれば、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定された第1バイノーラルルームインパルス応答に第1頭部インパルス応答が畳み込まれることにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。また、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定された第2バイノーラルルームインパルス応答に第2頭部インパルス応答が畳み込まれることにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。
【0043】
また、本開示は、以上のような特徴的な処理を実行する音響処理方法として実現することができるだけでなく、音響処理方法が実行する特徴的な処理に対応する特徴的な構成を備える音響処理装置などとして実現することもできる。また、このような音響処理方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。したがって、以下の他の態様でも、上記の音響処理方法と同様の効果を奏することができる。
【0044】
(15)本開示の他の態様に係る音響処理装置は、プロセッサを備える音響処理装置であって、前記プロセッサは、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付け、開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させる。
【0045】
(16)本開示の他の態様に係る音響処理プログラムは、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示を受け付け、開始音の音像を前記ユーザの頭外の開始位置に定位させるとともに、定位させた前記音像を前記ユーザの側方を通るように移動させるようにコンピュータを機能させる。
【0046】
(17)本開示の他の態様に係る非一時的なコンピュータ読み取り可能な記録媒体は、上記(16)記載の音響処理プログラムを記録する。
【0047】
以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。
【0048】
(実施の形態)
図1は、本実施の形態に係る音響再生装置の使用事例1を示す概略図であり、
図2は、本実施の形態に係る音響再生装置の使用事例2を示す概略図である。
【0049】
音響再生装置100は、ユーザ99の頭部に装着される音提示デバイスである。したがって、音響再生装置100は、ユーザ99の頭部と一体的に移動する。例えば、本実施の形態における音響再生装置100は、
図1に示すように、いわゆるオーバーイヤーヘッドホン型のデバイスであってもよいし、
図2に示すように、ユーザ99の左右の耳にそれぞれ独立して装着される2つの耳栓型のデバイス(インナーイヤーヘッドホン型デバイス)であってもよい。この2つのデバイスは、互いに通信することで、右耳用の音と左耳用の音とを同期して提示する。
【0050】
なお、本開示の音響再生装置100は、オーバーイヤーヘッドホン型デバイス及びインナーイヤーヘッドホン型デバイスなどの頭部装着型の音響再生装置に限られない。例えば、ヘッドレストスピーカのようにスピーカがユーザ99に装着されていない状態で、ユーザ99の両耳に近接して設置される音響再生装置などにも適用可能である。
【0051】
音響再生装置100は、ユーザ99の頭部の動きに応じて提示する音を変化させることで、ユーザ99が三次元音場内で頭部を動かしているようにユーザ99に知覚させる。このため、上記したように、音響再生装置100は、ユーザ99の動きに対して三次元音場をユーザの動きとは逆方向に移動させる。
【0052】
次に、
図3及び
図4を参照して、本実施の形態に係る音響再生装置100の構成について説明する。
【0053】
図3は、本実施の形態に係る音響再生装置100の機能構成を示すブロック図である。また、
図4は、本実施の形態に係る音響処理装置101のより詳細な機能構成を示すブロック図である。
【0054】
図3に示すように、本実施の形態に係る音響再生装置100は、音響処理装置101と、通信モジュール102と、センサ103と、ドライバ104と、開始受付部105と、を備える。
【0055】
開始受付部105は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示のユーザによる入力を受け付ける。開始受付部105は、ボタン又はスイッチなどで構成され、音像を頭内定位から頭外定位に切り替える。
【0056】
音響処理装置101は、音響再生装置100における各種の信号処理を行うための演算装置である、音響処理装置101は、例えば、プロセッサとメモリとを備え、メモリに記憶されたプログラムがプロセッサによって実行されることで、各種の機能を発揮する。なお、音響処理装置101は、例えば、処理回路によるハード実装によって、又は、処理回路によるメモリに保持される、若しくは、外部サーバから配信されるソフトウェアプログラムの実行によって、又は、これらハード実装とソフト実装との組み合わせによって実現されてもよい。
【0057】
音響処理装置101は、取得部111、開始音再生部112、音像制御部113、第1処理部121、第2処理部131、及びコンバイナ150を有する。取得部111については、通信モジュール102の説明と併せて、コンバイナ150については、ドライバ104の説明と併せてそれぞれ後述する。
【0058】
開始音再生部112は、開始受付部105によって開始指示が受け付けられた場合、開始音を取得し、取得した開始音を再生する。開始音は、メモリに予め記憶されている。開始音は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始をユーザに通知するための音である。例えば、開始音は、5秒程度の効果音である。
【0059】
音像制御部113は、開始音の音像をユーザの頭外の開始位置に定位させるとともに、定位させた音像をユーザの側方を通るように移動させる。
【0060】
図5は、本実施の形態において、頭外に定位させた音像を移動させる第1音像定位処理について説明するための模式図である。
【0061】
図5では、ユーザ99の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。
図5では、紙面上方向を正面とした姿勢のユーザ99を示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ99の正面方向に、再生音が定位される所定方向が設定されている。なお、開始位置301,311及び再生位置304が黒丸印で示されている。
【0062】
開始位置301,311は、ユーザ99の側方に存在する。開始位置301は、ユーザ99の左方に存在する。
【0063】
音像制御部113は、開始音の音像を開始位置301に定位させるとともに、開始位置301から、再生音が到達する所定方向に存在する再生位置304に向けてユーザ99の周囲に沿って音像を移動させる。まず、音像制御部113は、頭内にある音像を、ユーザ99の左方にある開始位置301に定位させる(矢印302)。そして、音像制御部113は、開始位置301から、再生音が到達する所定方向に存在する再生位置304に向けてユーザ99の周囲に沿って音像を時計回りに移動させる(矢印303)。これにより、ユーザ99は、左方から前方に向かって時計回りに移動する開始音を聞くことができる。そして、ユーザ99は、再生位置304から再生音を聞くことができる。
【0064】
また、開始位置311は、ユーザ99の右方に存在してもよい。音像制御部113は、開始音の音像を開始位置311に定位させるとともに、開始位置311から、再生音が到達する所定方向に存在する再生位置304に向けてユーザ99の周囲に沿って音像を移動させてもよい。まず、音像制御部113は、頭内にある音像を、ユーザ99の右方にある開始位置311に定位させてもよい(矢印312)。そして、音像制御部113は、開始位置311から、再生音が到達する所定方向に存在する再生位置304に向けてユーザ99の周囲に沿って音像を反時計回りに移動させてもよい(矢印313)。これにより、ユーザ99は、右方から前方に向かって反時計回りに移動する開始音を聞くことができる。
【0065】
なお、ユーザ99の側方は、ユーザ99の正面方向に対して垂直な方向であるが、本開示は特にこれに限定されない。例えば、ユーザ99の側方は、ユーザ99の正面方向に対して垂直な方向の±45度の範囲内であってもよい。
【0066】
図6は、本実施の形態において、頭外に定位させた音像を移動させる第2音像定位処理について説明するための模式図である。
【0067】
図6では、ユーザ99の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。
図6では、紙面上方向を正面とした姿勢のユーザ99を示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ99の正面方向に、再生音が定位される所定方向が設定されている。なお、開始位置321,331及び再生位置324が黒丸印で示されている。
【0068】
開始位置321,331は、ユーザ99の側方に存在する。開始位置321は、ユーザ99の左方に存在する。
【0069】
音像制御部113は、開始音の音像を開始位置321に定位させるとともに、開始位置321から、ユーザ99の後方を通って、再生音が到達する所定方向に存在する再生位置324に向けてユーザ99の周囲に沿って音像を移動させる。まず、音像制御部113は、頭内にある音像を、ユーザ99の左方にある開始位置321に定位させる(矢印322)。そして、音像制御部113は、開始位置321から、ユーザ99の後方を通って、再生音が到達する所定方向に存在する再生位置324に向けてユーザ99の周囲に沿って音像を反時計回りに移動させる(矢印323)。これにより、ユーザ99は、左方から後方に向かって反時計回りに移動するとともに、後方から前方に向かって反時計回りに移動する開始音を聞くことができる。そして、ユーザ99は、再生位置304から再生音を聞くことができる。
【0070】
また、開始位置331は、ユーザ99の右方に存在してもよい。音像制御部113は、開始音の音像を開始位置331に定位させるとともに、開始位置331から、ユーザ99の後方を通って、再生音が到達する所定方向に存在する再生位置324に向けてユーザ99の周囲に沿って音像を移動させてもよい。まず、音像制御部113は、頭内にある音像を、ユーザ99の右方にある開始位置331に定位させてもよい(矢印332)。そして、音像制御部113は、開始位置331から、ユーザ99の後方を通って、再生音が到達する所定方向に存在する再生位置304に向けてユーザ99の周囲に沿って音像を時計回りに移動させてもよい(矢印333)。これにより、ユーザ99は、右方から後方に向かって時計回りに移動するとともに、後方から前方に向かって時計回りに移動する開始音を聞くことができる。
【0071】
図7は、本実施の形態において、頭外に定位させた音像を移動させる第3音像定位処理について説明するための模式図である。
【0072】
図7では、ユーザ99の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。
図7では、紙面上方向を正面とした姿勢のユーザ99を示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ99の正面方向に、再生音が定位される所定方向が設定されている。なお、開始位置341,351及び再生位置344が黒丸印で示されている。
【0073】
開始位置341,351は、ユーザ99の側方に存在する。開始位置341は、ユーザ99の左方に存在する。
【0074】
音像制御部113は、開始音の音像を開始位置341に定位させるとともに、開始位置341から、再生音が到達する所定方向に存在する再生位置344に向けてユーザ99の周囲に沿って音像を移動させ、さらに再生位置344からユーザ99の周囲に沿って音像を一周させる。まず、音像制御部113は、頭内にある音像を、ユーザ99の左方にある開始位置341に定位させる(矢印342)。そして、音像制御部113は、開始位置341から、再生音が到達する所定方向に存在する再生位置344に向けてユーザ99の周囲に沿って音像を時計回りに移動させ、さらに再生位置344からユーザ99の周囲に沿って音像を時計回りに一周させる(矢印343)。これにより、ユーザ99は、左方から前方に向かって時計回りに移動するとともに、前方から時計回りに一周する開始音を聞くことができる。そして、ユーザ99は、再生位置344から再生音を聞くことができる。
【0075】
また、開始位置351は、ユーザ99の右方に存在してもよい。音像制御部113は、開始音の音像を開始位置351に定位させるとともに、開始位置351から、再生音が到達する所定方向に存在する再生位置344に向けてユーザ99の周囲に沿って音像を移動させ、さらに再生位置344からユーザ99の周囲に沿って音像を一周させる。まず、音像制御部113は、頭内にある音像を、ユーザ99の右方にある開始位置351に定位させる(矢印352)。そして、音像制御部113は、開始位置351から、再生音が到達する所定方向に存在する再生位置344に向けてユーザ99の周囲に沿って音像を反時計回りに移動させ、さらに再生位置344からユーザ99の周囲に沿って音像を反時計回りに一周させる(矢印353)。これにより、ユーザ99は、右方から前方に向かって反時計回りに移動するとともに、前方から反時計回りに一周する開始音を聞くことができる。
【0076】
図8は、本実施の形態において、頭外に定位させた音像を移動させる第4音像定位処理について説明するための模式図である。
【0077】
図8では、ユーザ99の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。
図8では、紙面上方向を正面とした姿勢のユーザ99を示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ99の正面方向に、再生音が定位される所定方向が設定されている。なお、開始位置361及び再生位置364が黒丸印で示されている。
【0078】
開始位置361は、再生音が到達する所定方向に存在する再生位置364である。
【0079】
音像制御部113は、開始音の音像を開始位置361に定位させるとともに、開始位置361からユーザ99の周囲に沿って音像を一周させる。まず、音像制御部113は、頭内にある音像を、再生音が到達する所定方向に存在する再生位置364である開始位置361に定位させる(矢印362)。そして、音像制御部113は、開始位置361からユーザ99の周囲に沿って音像を反時計回りに一周させる(矢印363)。これにより、ユーザ99は、前方から反時計回りに一周する開始音を聞くことができる。そして、ユーザ99は、再生位置364から再生音を聞くことができる。
【0080】
また、音像制御部113は、再生位置364である開始位置361からユーザ99の周囲に沿って音像を時計回りに一周させてもよい(矢印373)。これにより、ユーザ99は、前方から時計回りに一周する開始音を聞くことができる。
【0081】
音像がユーザ99の正面方向にある場合よりも、音像がユーザ99の側方にある場合の方が、両耳間の音圧特性及び位相特性の差異が大きくなり、音像の定位が容易になる。本実施の形態によれば、開始音の音像がユーザ99の側方を通るので、音像の頭外定位の効果を分かりやすくユーザ99に伝えることができる。
【0082】
音像制御部113は、ユーザから開始音の音像の位置に向かう方向とユーザの正面方向とがなす第1音像角度を第1処理部121及び第2処理部131に出力する。この第1音像角度は、開始音の音像の位置の動きに応じて変化する。
図5において、ユーザの正面方向の角度が0度であり、時計回りに角度が増加する場合、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置301の270度から再生位置304の360度(0度)まで徐々に増加させる。または、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置311の90度から再生位置304の0度まで徐々に減少させる。
【0083】
また、
図6において、ユーザの正面方向の角度が0度であり、時計回りに角度が増加する場合、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置321の270度から再生位置324の0度まで徐々に減少させる。または、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置331の90度から再生位置324の360度まで徐々に増加させる。
【0084】
また、
図7において、ユーザの正面方向の角度が0度であり、時計回りに角度が増加する場合、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置341の270度から再生位置344の360度(0度)まで徐々に増加させるとともに、再生位置344の0度から再生位置344の360度(0度)まで徐々に増加させる。または、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置351の90度から再生位置344の0度まで徐々に減少させるとともに、再生位置344の360度から再生位置344の0度まで徐々に減少させる。
【0085】
また、
図8において、ユーザの正面方向の角度が0度であり、時計回りに角度が増加する場合、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置361の360度から再生位置364の0度まで徐々に減少させる。または、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を開始位置361の0度から再生位置364の360度まで徐々に増加させる。
【0086】
なお、本実施の形態では、開始位置は、ユーザ99の側方又は再生位置に予め決められているが、本開示は特にこれに限定されず、ユーザ99にとって頭外定位の効果が最も高い方向が事前に測定され、当該方向が開始位置に設定されてもよい。
【0087】
第1処理部121は、開始音及び再生音の第1出力音信号を生成する。第1処理部121は、開始音を含む音情報に対して、情報に含まれる音を、音像の方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。また、第1処理部121は、再生音を含む音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。
【0088】
第1合成バイノーラルルームインパルス応答は、ユーザの第1頭部特性を示すとともに開始音の音像の方向とユーザの正面方向とがなす第1音像角度に対応付けられた第1頭部インパルス応答の直接音成分と、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第1音像角度に対応付けられた第1バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。第1頭部インパルス応答と第1バイノーラルルームインパルス応答とは異なる頭部を用いて測定される。
【0089】
また、第1合成バイノーラルルームインパルス応答は、ユーザの第1頭部特性を示すとともに所定方向とユーザの正面方向とがなす第1旋回角度に対応付けられた第1頭部インパルス応答の直接音成分と、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第1旋回角度に対応付けられた第1バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。
【0090】
第1処理部121は、第1信号処理部123、第1合成BRIR畳み込み部124、及び第1音量減衰部125を備える。
【0091】
第1信号処理部123は、第1頭部インパルス応答の直接音成分と第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答を作成する。なお、第1信号処理部123の詳細は後述される。
【0092】
第1合成BRIR畳み込み部124は、開始音を含む音情報に対して第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。また、第1合成BRIR畳み込み部124は、再生音を含む音情報に対して第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。
【0093】
第1音量減衰部125は、ユーザ99の頭部の角度に応じて第1出力音信号の音量を減衰させる。第1音量減衰部125は、第1出力音信号の音量から音量減衰量α(第3音量減衰量)を減衰させる。なお、第1音量減衰部125の詳細は後述される。
【0094】
第1処理部121は、入力された開始音の音情報に対して、音を音像の方向に定位させるための第1合成バイノーラルルームインパルス応答の畳み込みを行い、第1音量減衰部125を介して、音量が減衰された第1出力音信号を出力する。第1出力音信号は、第1イコライザ(EQ)122に入力される。音響処理装置101は、第1EQ122をさらに備える。第1EQ122は、第1出力音信号に対して低域及び高域の音の調整を行い、第1出力音信号をコンバイナ150に出力する。
【0095】
また、第1処理部121は、入力された再生音の音情報に対して、音を所定方向に定位させるための第1合成バイノーラルルームインパルス応答の畳み込みを行い、第1音量減衰部125を介して、音量が減衰された第1出力音信号を出力する。第1出力音信号は、第1イコライザ(EQ)122に入力される。
【0096】
第2処理部131は、第1の反射音の第2出力音信号を生成する。第2処理部131は、開始音を含む音情報に対して、情報に含まれる音を、開始音の音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、第1出力音信号によって知覚される開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰量を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。
【0097】
また、第2処理部131は、再生音を含む音情報に対して、情報に含まれる音を、所定方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰量を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。
【0098】
第2合成バイノーラルルームインパルス応答は、第1頭部特性を示すとともに開始音の音像の方向に対する第1方向とユーザの正面方向とがなす第2音像角度に対応付けられた第2頭部インパルス応答の直接音成分と、第2頭部特性及び空間特性を示すとともに第2音像角度に対応付けられた第2バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。第2頭部インパルス応答と第2バイノーラルルームインパルス応答とは異なる頭部を用いて測定される。
【0099】
また、第2合成バイノーラルルームインパルス応答は、第1頭部特性を示すとともに所定方向に対する第1方向とユーザの正面方向とがなす第2旋回角度に対応付けられた第2頭部インパルス応答の直接音成分と、第2頭部特性及び空間特性を示すとともに第2旋回角度に対応付けられた第2バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。
【0100】
音響処理装置101は、第1角度決定部130をさらに備える。第1角度決定部130は、予め設定されている第1角度を決定する。また、第1角度決定部130は、開始音の音像の方向に対して決定される第1角度を有する第1方向と、取得部111によって得られるユーザの正面方向とがなす第2音像角度を算出し、算出した第2音像角度を第2信号処理部133へ出力する。また、第1角度決定部130は、所定方向に対して決定される第1角度を有する第1方向と、取得部111によって得られるユーザの正面方向とがなす第2旋回角度を算出し、算出した第2旋回角度を第2信号処理部133へ出力する。
【0101】
開始音の音像が移動することにより、第1音像角度及び第2音像角度は変化する。開始音の音像が移動しても、第1角度の大きさは変化せずに維持される。そのため、開始音の音像が移動することによって、第1の反射音の音像の位置も移動する。例えば、ユーザの正面方向と開始音の音像の方向との角度が270度であり、第1角度が120度である場合、ユーザの正面方向と第1方向との角度は30度となる。そして、ユーザの正面方向と開始音の音像の方向との角度が300度に変化した場合、ユーザの正面方向と第1方向との角度は60度に変化する。
【0102】
第2処理部131は、第2信号処理部133、第2合成BRIR畳み込み部134、第1遅延部135、及び第2音量減衰部136を備える。
【0103】
第2信号処理部133は、第2頭部インパルス応答の直接音成分と第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答を作成する。なお、第2信号処理部133の詳細は後述される。
【0104】
第2合成BRIR畳み込み部134は、開始音を含む音情報に対して第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。また、第2合成BRIR畳み込み部134は、再生音を含む音情報に対して第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。
【0105】
第1遅延部135は、第1遅延時間に応じて第2出力音信号を遅延させる。なお、第1遅延時間は後述される。
【0106】
第2音量減衰部136は、第2出力音信号の音量を減衰させる。第2音量減衰部136は、第2出力音信号の音量から音量減衰量β(第1音量減衰量)を減衰させる。なお、第2音量減衰部136の詳細は後述される。
【0107】
第2処理部131は、入力された開始音の音情報に対して、音を第1方向に定位させるための第2合成バイノーラルルームインパルス応答の畳み込みを行い、第2音量減衰部136を介して、音量が減衰された第2出力音信号を出力する。第2出力音信号は、第2イコライザ(EQ)132に入力される。音響処理装置101は、第2EQ132をさらに備える。第2EQ132は、第2出力音信号に対して低域及び高域の音の調整を行い、第2出力音信号をコンバイナ150に出力する。
【0108】
また、第2処理部131は、入力された再生音の音情報に対して、音を第1方向に定位させるための第2合成バイノーラルルームインパルス応答の畳み込みを行い、第2音量減衰部136を介して、音量が減衰された第2出力音信号を出力する。第2出力音信号は、第2イコライザ(EQ)132に入力される。
【0109】
通信モジュール102は、音響再生装置100への音情報の入力を受け付けるためのインタフェース装置である。通信モジュール102は、例えば、アンテナと信号変換器とを備え、無線通信により外部の装置から音情報を受信する。より詳しくは、通信モジュール102は、無線通信のための形式に変換された音情報を示す無線信号を、アンテナを用いて受波し、信号変換器により無線信号から音情報への再変換を行う。これにより、音響再生装置100は、外部の装置から無線通信により音情報を取得する。通信モジュール102によって取得された音情報は、取得部111によって取得される。このようにして音情報は、音響処理装置101に入力される。なお、音響再生装置100と外部の装置との通信は、有線通信によって行われてもよい。
【0110】
また、音響処理装置101は、
図4に示す残響抑圧処理部120をさらに備える。反射音を生成して合成する際に、元の音に残響音成分、すなわち、音の収音環境において反射などで遅れて収音器に入力された音の成分が含まれると、反射音を合成したことによる音の頭外感の向上効果が低減される。このため、音響処理装置101では、残響抑圧処理部120によって、情報に含まれる音に対して、当該情報に含まれる残響音成分を減少させる残響抑圧処理を行う。開始音又は再生対象の再生音と、残響音成分とを含む原音情報から、残響抑圧処理を行うことで、原音情報に含まれる音のうち、減少した残響音成分以外の音を再生音として含んでいる音情報を生成して、第1処理部121及び第2処理部131に入力することができる。残響抑圧処理部120は、取得部111の前段に挿入されていてもよいし、取得部111の後段に挿入されていてもよい。
【0111】
音響再生装置100が取得する音情報は、例えば、MPEG-H 3D Audio(ISO/IEC 23008-3)等の所定の形式で符号化されている。一例として、符号化された音情報には、音響再生装置100によって再生される再生音についての情報と、当該音の音像を三次元音場内において所定位置に定位させる(つまり所定方向から到達する音として知覚させる)際の定位位置に関する情報、すなわち所定方向に関する情報とが含まれる。例えば、音情報には第1の再生音及び第2の再生音を含む複数の音に関する情報が含まれ、それぞれの音が再生された際の音像を三次元音場内における異なる方向から到達する音として知覚させるように音像を定位させる。
【0112】
この立体的な音によって、例えば、表示装置を用いて視認される画像と併せて、視聴されるコンテンツなどの臨場感を向上することができる。なお、音情報には、再生音についての情報のみが含まれていてもよい。この場合、所定方向に関する情報を別途取得してもよい。また、上記したように、音情報は、第1の再生音に関する第1音情報、及び、第2の再生音に関する第2音情報を含むが、これらを別個に含む複数の音情報をそれぞれ取得し、同時に再生することで三次元音場内における異なる位置に音像を定位させてもよい。このように、入力される音情報の形態に特に限定はなく、音響再生装置100(特に、音響処理装置101)に各種の形態の音情報に応じた取得部111が備えられればよい。
【0113】
本実施の形態における取得部111は、例えば、エンコード音情報入力部、デコード処理部、及び、センシング情報入力部を備える。
【0114】
エンコード音情報入力部は、取得部111が取得した、符号化された(言い換えるとエンコードされている)音情報が入力される処理部である。エンコード音情報入力部は、入力された音情報をデコード処理部へと出力する。デコード処理部は、エンコード音情報入力部から出力された音情報を復号する(言い換えるとデコードする)ことにより音情報に含まれる所定音に関する情報と、所定方向に関する情報とを、以降の処理に用いられる形式で生成する処理部である。センシング情報入力部については、センサ103の機能とともに、以下に説明する。
【0115】
センサ103は、ユーザ99の頭部の動き速度を検知するための装置である。センサ103は、ジャイロセンサ、加速度センサなど動きの検知に使用される各種のセンサを組み合わせて構成される。本実施の形態では、センサ103は、音響再生装置100に内蔵されているが、例えば、音響再生装置100と同様にユーザ99の頭部の動きに応じて動作する立体映像再生装置等、外部の装置に内蔵されていてもよい。この場合、センサ103は、音響再生装置100に含まれなくてもよい。また、センサ103として、外部の撮像装置などを用いて、ユーザ99の頭部の動きを撮像し、撮像された画像を処理することでユーザ99の頭部の動きを検知してもよい。
【0116】
センサ103は、例えば、音響再生装置100の筐体に一体的に固定され、筐体の動きの速度を検知する。上記の筐体を含む音響再生装置100は、ユーザ99が装着した後、ユーザ99の頭部と一体的に移動するため、センサ103は、結果としてユーザ99の頭部の動きの速度を検知することができる。
【0117】
センサ103は、例えば、ユーザ99の頭部の動きの量として、三次元空間内で互いに直交する3軸の少なくとも一つを回転軸とする回転量を検知してもよいし、上記3軸の少なくとも一つを変位方向とする変位量を検知してもよい。また、センサ103は、ユーザ99の頭部の動きの量として、回転量及び変位量の両方を検知してもよい。
【0118】
また、本実施の形態において、音響再生装置100は、音が到達する所定方向のユーザによる設定入力を事前に受け付けてもよい。例えば、ユーザは、再生音の音像を定位させる方向に正面を向けた状態で、設定ボタンを押下する。これにより、センサ103によって検出された現在のユーザの正面方向が、再生音が到達する所定方向(0度)に設定されてもよい。そして、取得部111は、所定方向とユーザの正面方向とがなす第1旋回角度を算出してもよい。また、音像制御部113は、開始音の音像の方向とユーザの正面方向とがなす第1音像角度を決定してもよい。
【0119】
取得部111のセンシング情報入力部は、センサ103からユーザ99の頭部の動き速度を取得する。より具体的には、センシング情報入力部は、単位時間あたりにセンサ103が検知したユーザ99の頭部の動きの量を動きの速度として取得する。このようにしてセンシング情報入力部は、センサ103からセンシング結果として回転速度及び変位速度の少なくとも一方を取得する。ここで取得されるユーザ99の頭部の動きの量は、三次元音場内のユーザ99の座標及び向きを決定するために用いられる。音響再生装置100では、決定されたユーザ99の座標及び向きに基づいて、音像の相対的な位置を決定して音が再生される。取得部111は、再生音が到達する所定方向と、センサ103によって得られるユーザ99の正面方向とがなす第1旋回角度を算出し、算出した第1旋回角度を第1信号処理部123へ出力する。また、音像制御部113は、開始音が到達する方向と、センサ103によって得られるユーザ99の正面方向とがなす第1音像角度を第1信号処理部123へ出力する。
【0120】
さらに、本実施の形態では、取得部111のセンシング情報入力部がセンサ103から取得したセンシング結果が、第1音量減衰部125及び第2音量減衰部136の音量減衰量の制御に用いられる。つまり、センシング結果に応じて、第1音量減衰部125及び第2音量減衰部136の音量減衰量が自動的に変化する。これは、ユーザ99が反射音の方向に向いたときに、その方向からの反射音が明確に鳴っていると、ユーザ99が違和感を抱く可能性があるためである。したがって、第2音量減衰部136は、ユーザ99が頭部を回転させた際に、ユーザ99の正面方向が反射音の方向に近づくにつれて、反射音の音量を減衰させるように制御する。これと同時に、第1音量減衰部125は、全体としての音量が変化しないように、再生音の音量を増幅させる(音量減衰量を減少させる)ことを同時に行う。つまり、第1処理部121における第1音量減衰部125は、第2処理部131における第2音量減衰部136の音量減衰量βが増加した場合、音量減衰量αを減少させ、第2処理部131における第2音量減衰部136の音量減衰量βが減少した場合、音量減衰量αを増加させる。
【0121】
図9は、本実施の形態に係る音量減衰について説明するための図である。
図9では、ユーザ99の頭部の上下方向に平行な軸周りにユーザ99の頭部が回転した際の回転角(ヨー角)に対する、第1音量減衰部125の音量減衰量α(破線)及び第2音量減衰部136の音量減衰量β(実線)が示されている。なお、ここでの第1角度は、120度に設定されている。ここでは、下記の式(1)に基づいて、第1音量減衰部125の音量減衰量α及び第2音量減衰部136の音量減衰量βが算出されている。
【0122】
(α2+β2)1/2=1・・・(1)
なお、上記の式(1)において、αは、第1音量減衰部125の音量減衰量(ゲイン)を示し、βは、第2音量減衰部136の音量減衰量(ゲイン)を示している。この例では、所定方向との角度が120度の方向に設定された反射音に対して、ユーザ99がその半分の60度の方向まで頭部を回転させると反射音がなくなることが分かる。このようにして、音響処理装置101では、反射音そのものが違和感の要因とならないように、適宜再生音及び反射音の音量減衰量が変化される。上記の式(1)を用いて説明した音量減衰量α及び音量減衰量βの関係は一例であり、反射音の方向に向かってユーザ99が頭部を回転させるほど、反射音の音量減衰量βが増加されれば、どのような関係が用いられてもよい。また、以上の関係は、音量減衰量α及び音量減衰量βの関係だけでなく、音量減衰量γを有する他の反射音(変形例にて後述する)を生成する場合の音量減衰量α及び音量減衰量γの関係についても成立してもよい。
【0123】
コンバイナ150は、第1処理部121によって生成された第1出力音信号と第2処理部131によって生成された第2出力音信号とを合成した出力音信号をドライバ104へ出力する。コンバイナ150は、第1出力音信号及び第2出力音信号を加算することによって合成した出力音信号を出力する。コンバイナ150は、さらに、出力音信号に基づいてデジタル信号からアナログ信号への信号変換などを行うことで、波形信号を生成し、波形信号に基づいてドライバ104に音波を発生させ、ユーザ99に音を提示する。出力された出力音信号は、ユーザ99の頭部に装着されたヘッドホン又はイヤホンを用いて再生される。
【0124】
ドライバ104は、例えば、振動板と、マグネット及びボイスコイルなどの駆動機構とを有する。ドライバ104は、波形信号に応じて駆動機構を動作させ、駆動機構によって振動板を振動させる。このようにして、ドライバ104は、出力音信号に応じた振動板の振動により、音波を発生させ、音波が空気を伝播してユーザ99の耳に伝達し、ユーザ99が音を知覚する。
【0125】
以上のようにしてコンバイナ150から出力された出力音信号がドライバ104によって再生されると、
図10のような音場が形成される。
【0126】
図10は、本実施の形態に係る、音響処理装置101によって出力された再生音の到達方向を説明するための図である。
【0127】
図10では、ユーザ99の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。
図10では、紙面上方向を正面とした姿勢のユーザ99を示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ99の正面方向に、再生音が定位される所定方向が設定されている。なお、再生音が定位されている位置P1を、黒丸印として示しており、仮想的なスピーカが併せて示されている。
【0128】
図10に示すように、所定方向から時計回りに第1角度を有する方向に、第1の反射音が定位されている(位置P2)。
【0129】
また、
図10のユーザ99の左右に延びる1点鎖線は、ユーザ99の頭部を前後に分ける仮想的な境界面を示している。この境界面は、ユーザ99の外耳道に沿う面であってもよいし、ユーザ99の耳殻の最後端の点を通る面であってもよいし、単にユーザ99の頭部の重心を通る面であってもよい。このような境界面の前後において、つまり、ユーザ99の前後で音の聞き取りやすさに差があることが知られている。第2処理部131は、反射音を定位させる際、反射音そのものの存在を感じにくくするために、ユーザ99の後面側に反射音を定位することが有効である。したがって、第1角度は、所定方向との角度が90度より大きく、270度より小さい角度範囲内の角度に設定されるとよい。
【0130】
なお、以上に説明した第1角度、第1遅延時間、及び第1音量減衰量は、音響処理装置101によってあらかじめ設定された数値、又はセンサ103によるセンシング結果に応じて変化する数値であるとして説明したが、これらのうち、少なくとも1つは、ユーザ99が任意に入力した数値によって調整可能に構成されてもよい。つまり、音響処理装置101は、第1角度、第1遅延時間、及び第1音量減衰量の少なくとも1つを調整するためのユーザ99による入力を受け付けてもよい。
【0131】
また、上記の説明では、再生音に対する第1の反射音について説明しているが、開始音に対する第1の反射音は、開始音の音像の方向から時計回りに第1角度を有する方向に定位される。開始音が再生される場合、第1角度は、開始音の音像の方向との角度が90度より大きく、270度より小さい角度範囲内の角度に設定されるとよい。
【0132】
続いて、
図4に示す第1信号処理部123の詳細について説明する。
【0133】
図11は、本実施の形態に係る第1信号処理部123の構成を示すブロック図である。
【0134】
図11に示す第1信号処理部123は、第1HRIRデータベース11、第1BRIRデータベース12、第1HRIR取得部13、第1BRIR取得部14、第1作成部15、及び第1出力部16を備える。
【0135】
第1HRIRデータベース11は、人の頭部特性を示す頭部インパルス応答(Head-Related Impulse Response:HRIR)を予め記憶する。頭部伝達関数(Head-Related Transfer Function:HRTF)は、頭部周辺による入射音波の物理特性の変化を周波数領域で表現したものである。頭部インパルス応答は、頭部伝達関数を時間領域で表現したものである。頭部インパルス応答は、無響空間において測定される。そのため、頭部インパルス応答は、直接音成分を含み、残響音成分をほぼ含まない。
【0136】
なお、第1HRIRデータベース11は、左チャンネル及び右チャンネルそれぞれの頭部インパルス応答を記憶してもよい。また、第1HRIRデータベース11は、複数の頭部特性に対応する複数の頭部インパルス応答を記憶してもよい。また、第1HRIRデータベース11は、音が到達する方向とユーザの正面方向とがなす複数の角度に対応する複数の頭部インパルス応答を記憶してもよい。複数の角度は、例えば、360度を、2度毎、5度毎、又は10度毎に分割したそれぞれの角度である。なお、音が到達する方向が0度であり、角度は、音が到達する方向とユーザの正面方向とが時計回りになす角度を示す。
【0137】
第1BRIRデータベース12は、人の頭部特性及び人がいる空間の空間特性を示すバイノーラルルームインパルス応答(Binaural Room Impulse Response:BRIR)を予め記憶する。バイノーラルルームインパルス応答は、時間領域で表現される。バイノーラルルームインパルス応答は、有響空間において測定される。そのため、バイノーラルルームインパルス応答は、直接音成分と残響音成分とを含む。
【0138】
なお、第1BRIRデータベース12は、左チャンネル及び右チャンネルそれぞれのバイノーラルルームインパルス応答を記憶してもよい。また、第1BRIRデータベース12は、複数の空間特性に対応する複数のバイノーラルルームインパルス応答を記憶してもよい。例えば、第1BRIRデータベース12は、複数の空間の大きさ毎に複数のバイノーラルルームインパルス応答を記憶してもよい。また、第1BRIRデータベース12は、音が到達する所定方向とユーザの正面方向とがなす複数の角度に対応する複数のバイノーラルルームインパルス応答を記憶してもよい。複数の角度は、例えば、360度を、2度毎、5度毎、又は10度毎に分割したそれぞれの角度である。なお、音が到達する方向が0度であり、角度は、音が到達する所定方向とユーザの正面方向とが時計回りになす角度を示す。
【0139】
第1HRIR取得部13は、ユーザの第1頭部特性を示すとともに開始音の音像の方向とユーザの正面方向とがなす第1音像角度に対応付けられた第1頭部インパルス応答を第1HRIRデータベース11から取得する。なお、開始音が出力される場合、第1HRIR取得部13は、第1音像角度を音像制御部113から取得する。また、第1HRIR取得部13によって取得される第1頭部インパルス応答は、受聴者であるユーザ自身の外耳道入り口に装着された測定機器により測定されてもよいし、ユーザに近い頭部特性を有する人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0140】
また、第1HRIR取得部13は、ユーザの第1頭部特性を示すとともに所定方向とユーザの正面方向とがなす第1旋回角度に対応付けられた第1頭部インパルス応答を第1HRIRデータベース11から取得する。なお、再生音が出力される場合、第1HRIR取得部13は、第1旋回角度を取得部111から取得する。
【0141】
第1BRIR取得部14は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第1音像角度に対応付けられた第1バイノーラルルームインパルス応答を第1BRIRデータベース12から取得する。なお、開始音が出力される場合、第1BRIR取得部14は、第1音像角度を音像制御部113から取得する。また、第1BRIR取得部14によって取得される第1バイノーラルルームインパルス応答は、受聴者であるユーザがいる空間の空間特性に近い空間特性を有する空間において、ユーザとは異なる人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0142】
また、第1BRIR取得部14は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第1旋回角度に対応付けられた第1バイノーラルルームインパルス応答を第1BRIRデータベース12から取得する。なお、再生音が出力される場合、第1BRIR取得部14は、第1旋回角度を取得部111から取得する。
【0143】
第1作成部15は、第1HRIR取得部13によって取得された第1頭部インパルス応答の直接音成分と、第1BRIR取得部14によって取得された第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答を作成する。
【0144】
第1出力部16は、第1作成部15によって作成された第1合成バイノーラルルームインパルス応答を出力する。
【0145】
続いて、
図4に示す第2信号処理部133の詳細について説明する。
【0146】
図12は、本実施の形態に係る第2信号処理部133の構成を示すブロック図である。
【0147】
図12に示す第2信号処理部133は、第2HRIRデータベース21、第2BRIRデータベース22、第2HRIR取得部23、第2BRIR取得部24、第2作成部25、及び第2出力部26を備える。
【0148】
第2HRIRデータベース21の構成は、
図11に示す第1HRIRデータベース11の構成と同じであり、第2BRIRデータベース22の構成は、
図11に示す第1BRIRデータベース12の構成と同じである。
【0149】
第2HRIR取得部23は、ユーザの第1頭部特性を示すとともに開始音の音像の方向に基づく第1方向とユーザの正面方向とがなす第2音像角度に対応付けられた第2頭部インパルス応答を第2HRIRデータベース21から取得する。なお、第2HRIR取得部23は、第2音像角度を第1角度決定部130から取得する。また、第2HRIR取得部23によって取得される第2頭部インパルス応答は、受聴者であるユーザ自身の外耳道入り口に装着された測定機器により測定されてもよいし、ユーザに近い頭部特性を有する人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0150】
また、第2HRIR取得部23は、ユーザの第1頭部特性を示すとともに所定方向に基づく第1方向とユーザの正面方向とがなす第2旋回角度に対応付けられた第2頭部インパルス応答を第2HRIRデータベース21から取得する。なお、第2HRIR取得部23は、第2旋回角度を第1角度決定部130から取得する。また、第2HRIR取得部23によって取得される第2頭部インパルス応答は、受聴者であるユーザ自身の外耳道入り口に装着された測定機器により測定されてもよいし、ユーザに近い頭部特性を有する人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0151】
第2BRIR取得部24は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第2音像角度に対応付けられた第2バイノーラルルームインパルス応答を第2BRIRデータベース22から取得する。なお、第2BRIR取得部24は、第2音像角度を第1角度決定部130から取得する。また、第2BRIR取得部24によって取得される第2バイノーラルルームインパルス応答は、受聴者であるユーザがいる空間の空間特性に近い空間特性を有する空間において、ユーザとは異なる人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0152】
また、第2BRIR取得部24は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第2旋回角度に対応付けられた第2バイノーラルルームインパルス応答を第2BRIRデータベース22から取得する。なお、第2BRIR取得部24は、第2旋回角度を第1角度決定部130から取得する。また、第2BRIR取得部24によって取得される第2バイノーラルルームインパルス応答は、受聴者であるユーザがいる空間の空間特性に近い空間特性を有する空間において、ユーザとは異なる人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0153】
第2作成部25は、第2HRIR取得部23によって取得された第2頭部インパルス応答の直接音成分と、第2BRIR取得部24によって取得された第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答を作成する。
【0154】
第2出力部26は、第2作成部25によって作成された第2合成バイノーラルルームインパルス応答を出力する。
【0155】
ここで、本実施の形態において作成される第1合成バイノーラルルームインパルス応答及び第2合成バイノーラルルームインパルス応答について説明する。なお、第1合成バイノーラルルームインパルス応答の作成方法は、第2合成バイノーラルルームインパルス応答の作成方法と同じであるので、以下の説明では、第1合成バイノーラルルームインパルス応答の作成方法のみを説明する。
【0156】
図13は、本実施の形態における第1合成バイノーラルルームインパルス応答の作成方法を説明するための図である。
図13では、左チャンネル(L)及び右チャンネル(R)それぞれの第1合成バイノーラルルームインパルス応答が示されている。
【0157】
図13に示すように、第1作成部15は、第1頭部インパルス応答の直接音成分201L,201Rと、第1バイノーラルルームインパルス応答の残響音成分202L,202Rとを合成する。これにより、第1作成部15は、第1合成バイノーラルルームインパルス応答203L,203Rを作成する。
【0158】
図14は、本実施の形態に係る第1作成部15の構成を示すブロック図である。
【0159】
図14に示す第1作成部15は、第1ピーク位置補正部151、第1特定部152、第1直接音成分置換部153、及び第1音圧レベル変更部154を備える。
【0160】
第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の波形及び第1頭部インパルス応答の波形をトリミングする。このとき、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の振幅が最大となる時刻と、第1頭部インパルス応答の振幅が最大となる時刻とが一致するように、第1バイノーラルルームインパルス応答の波形及び第1頭部インパルス応答の波形をトリミングする。
【0161】
第1特定部152は、第1頭部インパルス応答の直接音成分の終端期間において、第1頭部インパルス応答と第1バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定する。すなわち、第1特定部152は、第1頭部インパルス応答の直接音成分の終端期間において、第1頭部インパルス応答の振幅の絶対値と第1バイノーラルルームインパルス応答の振幅の絶対値との差が最小となる置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。
【0162】
第1直接音成分置換部153は、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分を、置換時刻以前の第1頭部インパルス応答の直接音成分に置換する。これにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とが合成される。
【0163】
第1音圧レベル変更部154は、置換時刻以前の第1頭部インパルス応答の直接音成分の音圧レベルを、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更する。
【0164】
具体的には、第1音圧レベル変更部154は、置換時刻以前の第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。第1音圧レベル変更部154は、第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値と、第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を、第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。第1音圧レベル変更部154は、算出した比率を第1頭部インパルス応答の直接音成分の音圧レベルに乗算する。これにより、置換時刻以前の第1頭部インパルス応答の直接音成分の音圧レベルが、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分の音圧レベルに揃えられる。
【0165】
なお、第1音圧レベル変更部154は、置換時刻以後の第1バイノーラルルームインパルス応答の残響音成分の音圧レベルを、置換時刻以前の第1頭部インパルス応答の直接音成分の音圧レベルに応じて変更してもよい。
【0166】
具体的には、第1音圧レベル変更部154は、置換時刻以前の第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。第1音圧レベル変更部154は、第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値と、第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、第1頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を、第1バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。第1音圧レベル変更部154は、算出した比率を置換時刻以後の第1バイノーラルルームインパルス応答の残響音成分の音圧レベルに乗算する。これにより、置換時刻以後の第1バイノーラルルームインパルス応答の残響音成分の音圧レベルが、置換時刻以前の第1頭部インパルス応答の直接音成分の音圧レベルに揃えられる。
【0167】
図15は、本実施の形態に係る第2作成部25の構成を示すブロック図である。
【0168】
図15に示す第2作成部25は、第2ピーク位置補正部251、第2特定部252、第2直接音成分置換部253、及び第2音圧レベル変更部254を備える。
【0169】
第2ピーク位置補正部251は、第2バイノーラルルームインパルス応答の波形及び第2頭部インパルス応答の波形をトリミングする。このとき、第2ピーク位置補正部251は、第2バイノーラルルームインパルス応答の振幅が最大となる時刻と、第2頭部インパルス応答の振幅が最大となる時刻とが一致するように、第2バイノーラルルームインパルス応答の波形及び第2頭部インパルス応答の波形をトリミングする。
【0170】
第2特定部252は、第2頭部インパルス応答の直接音成分の終端期間において、第2頭部インパルス応答と第2バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定する。すなわち、第2特定部252は、第2頭部インパルス応答の直接音成分の終端期間において、第2頭部インパルス応答の振幅の絶対値と第2バイノーラルルームインパルス応答の振幅の絶対値との差が最小となる置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。
【0171】
第2直接音成分置換部253は、置換時刻以前の第2バイノーラルルームインパルス応答の直接音成分を、置換時刻以前の第2頭部インパルス応答の直接音成分に置換する。これにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とが合成される。
【0172】
第2音圧レベル変更部254は、置換時刻以前の第2頭部インパルス応答の直接音成分の音圧レベルを、置換時刻以前の第2バイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更する。
【0173】
具体的には、第2音圧レベル変更部254は、置換時刻以前の第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前の第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。第2音圧レベル変更部254は、第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値と、第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を、第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。第2音圧レベル変更部254は、算出した比率を第2頭部インパルス応答の直接音成分の音圧レベルに乗算する。これにより、置換時刻以前の第2頭部インパルス応答の直接音成分の音圧レベルが、置換時刻以前の第2バイノーラルルームインパルス応答の直接音成分の音圧レベルに揃えられる。
【0174】
なお、第2音圧レベル変更部254は、置換時刻以後の第2バイノーラルルームインパルス応答の残響音成分の音圧レベルを、置換時刻以前の第2頭部インパルス応答の直接音成分の音圧レベルに応じて変更してもよい。
【0175】
具体的には、第2音圧レベル変更部254は、置換時刻以前の第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前の第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。第2音圧レベル変更部254は、第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値と、第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、第2頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を、第2バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。第2音圧レベル変更部254は、算出した比率を置換時刻以後の第2バイノーラルルームインパルス応答の残響音成分の音圧レベルに乗算する。これにより、置換時刻以後の第2バイノーラルルームインパルス応答の残響音成分の音圧レベルが、置換時刻以前の第2頭部インパルス応答の直接音成分の音圧レベルに揃えられる。
【0176】
なお、本実施の形態では、開始受付部105によって開始指示が受け付けられた場合、開始音再生部112が開始音を再生するが、本開示は特にこれに限定されない。開始受付部105によって開始指示が受け付けられた場合、音像制御部113は、開始指示が受け付けられた際に再生している再生音の音像を開始音の音像として開始位置に定位させてもよい。
【0177】
次に、
図16を参照して、上記に説明した音響再生装置100の動作について説明する。
【0178】
図16は、本実施の形態に係る音響処理装置101の動作を示すフローチャートである。
【0179】
まず、ステップS1において、開始受付部105は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理の開始指示のユーザによる入力を受け付ける。
【0180】
次に、ステップS2において、開始音再生部112は、開始音を再生する。開始受付部105によって開始指示が受け付けられた場合、開始音再生部112は、メモリから開始音を含む音情報を取得する。
【0181】
次に、ステップS3において、音像制御部113は、開始音の音像の位置を決定する。具体的には、音像制御部113は、開始音の音像を最初に頭外に定位させるための開始位置を決定し、決定した開始位置の方向とユーザの正面方向とがなす第1音像角度を第1信号処理部123及び第1角度決定部130に出力する。
【0182】
次に、ステップS4において、第1処理部121は、開始音を含む音情報に対して、情報に含まれる音を、開始音の音像の方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。
【0183】
次に、ステップS5において、第2処理部131は、開始音を含む音情報に対して、情報に含まれる音を、第1方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい第1遅延時間、及び、0より大きい音量減衰量β(第1音量減衰量)を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。
【0184】
以上のステップS4及びステップS5の処理は、実行される順序が入れ替えられてもよく、並列に実行されてもよい。
【0185】
次に、ステップS6において、コンバイナ150は、第1処理部121によって生成された第1出力音信号と、第2処理部131によって生成された第2出力音信号とを合成し、合成した出力音信号を出力する。
【0186】
このようにして出力された出力音信号がドライバ104によって再生されることで、開始音に、反射音が重畳されて三次元的な音としてユーザ99に知覚される。特に、反射音を1つしか生成していないので、大規模な演算装置などは必要なく、効果的な立体音響をユーザ99に知覚させることができる。
【0187】
次に、ステップS7において、音像制御部113は、開始音の音像の位置が、再生音が到達する所定方向に存在する再生位置であるか否かを判定する。
【0188】
ここで、開始音の音像の位置が再生位置ではないと判定された場合(ステップS7でNO)、処理がステップS3に戻り、音像制御部113は、前回決定した開始音の音像の位置から移動させた開始音の音像の位置を決定する。具体的には、音像制御部113は、開始位置から再生位置に向けてユーザの周囲に沿って移動させた音像の位置を決定する。例えば、
図5の例では、開始位置の方向とユーザの正面方向との第1音像角度が270度であり、音像制御部113は、開始位置から再生位置まで所定角度(例えば、2度)ずつ増加させる。
【0189】
一方、開始音の音像の位置が再生位置であると判定された場合(ステップS7でYES)、処理が終了する。
【0190】
開始音の出力が終了した後、再生音の出力が開始される。まず、音響再生装置100の動作が開始されると、取得部111が通信モジュール102を介して原音情報を取得する。原音情報には、再生音の他に残響音成分が含まれている。そのため、残響抑圧処理部120は、残響音成分が減少された再生音を含む音情報を生成する。
【0191】
再生音が出力される場合、
図16のステップS4~ステップS6の処理が行われる。
【0192】
まず、第1処理部121は、音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成する。
【0193】
次に、第2処理部131は、再生音を含む音情報に対して、情報に含まれる音を、第1方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい第1遅延時間、及び、0より大きい音量減衰量β(第1音量減衰量)を有する音として定位させるための第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成する。
【0194】
次に、コンバイナ150は、第1処理部121によって生成された第1出力音信号と、第2処理部131によって生成された第2出力音信号とを合成し、合成した出力音信号を出力する。
【0195】
このようにして出力された出力音信号がドライバ104によって再生されることで、再生音に、反射音が重畳されて三次元的な音としてユーザ99に知覚される。特に、反射音を1つしか生成していないので、大規模な演算装置などは必要なく、効果的な立体音響をユーザ99に知覚させることができる。
【0196】
続いて、
図16のステップS4における第1処理部121による第1出力音信号生成処理について説明する。
【0197】
図17は、本実施の形態に係る第1処理部121による第1出力音信号生成処理について説明するためのフローチャートである。
【0198】
まず、ステップS11において、第1HRIR取得部13は、ユーザの第1頭部特性を示すとともに音像の方向とユーザの正面方向とがなす第1音像角度に対応付けられた第1頭部インパルス応答を第1HRIRデータベース11から取得する。なお、第1HRIR取得部13は、左チャンネルの第1頭部インパルス応答及び右チャンネルの第1頭部インパルス応答を取得してもよい。
【0199】
次に、ステップS12において、第1BRIR取得部14は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第1音像角度に対応付けられた第1バイノーラルルームインパルス応答を第1BRIRデータベース12から取得する。なお、第1BRIR取得部14は、左チャンネルの第1バイノーラルルームインパルス応答及び右チャンネルの第1バイノーラルルームインパルス応答を取得してもよい。
【0200】
次に、ステップS13において、第1作成部15は、第1HRIR取得部13によって取得された第1頭部インパルス応答の直接音成分と、第1BRIR取得部14によって取得された第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答を作成する第1合成バイノーラルルームインパルス応答作成処理を実行する。なお、第1合成バイノーラルルームインパルス応答作成処理については、
図19を用いて後述する。また、第1作成部15は、左チャンネルの第1合成バイノーラルルームインパルス応答及び右チャンネルの第1合成バイノーラルルームインパルス応答を作成してもよい。
【0201】
次に、ステップS14において、第1出力部16は、第1合成バイノーラルルームインパルス応答を出力する。なお、第1出力部16は、左チャンネルの第1合成バイノーラルルームインパルス応答及び右チャンネルの第1合成バイノーラルルームインパルス応答を出力してもよい。
【0202】
次に、ステップS15において、第1合成BRIR畳み込み部124は、開始音を含む音情報に対して第1合成バイノーラルルームインパルス応答を畳み込む。これにより、第1出力音信号が生成される。
【0203】
次に、ステップS16において、第1音量減衰部125は、第1出力音信号の音量から音量減衰量α(第3音量減衰量)を減衰させる。そして、第1出力音信号は、第1イコライザ(EQ)122を介してコンバイナ150に出力される。
【0204】
続いて、
図16のステップS5における第2処理部131による第2出力音信号生成処理について説明する。
【0205】
図18は、本実施の形態に係る第2処理部131による第2出力音信号生成処理について説明するためのフローチャートである。
【0206】
まず、ステップS21において、第2HRIR取得部23は、ユーザの第1頭部特性を示すとともに第1方向とユーザの正面方向とがなす第2音像角度に対応付けられた第2頭部インパルス応答を第2HRIRデータベース21から取得する。なお、第2HRIR取得部23は、左チャンネルの第2頭部インパルス応答及び右チャンネルの第2頭部インパルス応答を取得してもよい。
【0207】
次に、ステップS22において、第2BRIR取得部24は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すとともに第2音像角度に対応付けられた第2バイノーラルルームインパルス応答を第2BRIRデータベース22から取得する。なお、第2BRIR取得部24は、左チャンネルの第2バイノーラルルームインパルス応答及び右チャンネルの第2バイノーラルルームインパルス応答を取得してもよい。
【0208】
次に、ステップS23において、第2作成部25は、第2HRIR取得部23によって取得された第2頭部インパルス応答の直接音成分と、第2BRIR取得部24によって取得された第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答を作成する第2合成バイノーラルルームインパルス応答作成処理を実行する。なお、第2合成バイノーラルルームインパルス応答作成処理については、
図19を用いて後述する。また、第2作成部25は、左チャンネルの第2合成バイノーラルルームインパルス応答及び右チャンネルの第2合成バイノーラルルームインパルス応答を作成してもよい。
【0209】
次に、ステップS24において、第2出力部26は、第2合成バイノーラルルームインパルス応答を出力する。なお、第2出力部26は、左チャンネルの第2合成バイノーラルルームインパルス応答及び右チャンネルの第2合成バイノーラルルームインパルス応答を出力してもよい。
【0210】
次に、ステップS25において、第2合成BRIR畳み込み部134は、開始音を含む音情報に対して第2合成バイノーラルルームインパルス応答を畳み込む。これにより、第2出力音信号が生成される。
【0211】
次に、ステップS26において、第1遅延部135は、第1遅延時間に応じて第2出力音信号を遅延させる。
【0212】
次に、ステップS27において、第2音量減衰部136は、第2出力音信号の音量から音量減衰量β(第1音量減衰量)を減衰させる。そして、第2出力音信号は、第2イコライザ(EQ)132を介してコンバイナ150に出力される。
【0213】
このように、第2出力音信号が、第1方向から到達し、第1遅延時間及び第1音量減衰量を有する音として定位されるので、疑似的な反射壁によって開始音が反射された反射音としてユーザに知覚される。このため、直接音としての開始音とともに、第1遅延時間及び第1音量減衰量を有して反射音が知覚されるので、直接音の音像が定位される位置の頭外感が向上される。
【0214】
また、特に、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答が音情報に畳み込まれるとともに、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答が音情報に畳み込まれるので、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を音情報に畳み込むことができ、より立体的な音をユーザに知覚させることができる。
【0215】
続いて、
図17のステップS13の第1合成バイノーラルルームインパルス応答作成処理及び
図18のステップS23の第2合成バイノーラルルームインパルス応答作成処理について説明する。なお、第2合成バイノーラルルームインパルス応答作成処理は、第1合成バイノーラルルームインパルス応答作成処理と同じであるので、以下では、第1合成バイノーラルルームインパルス応答作成処理のみを説明する。
【0216】
図19は、本開示の実施の形態に係る第1作成部15による第1合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【0217】
まず、ステップS31において、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の振幅が最大となる時刻と、第1頭部インパルス応答の振幅が最大となる時刻とが一致するように、第1バイノーラルルームインパルス応答の波形及び第1頭部インパルス応答の波形をトリミングする。
【0218】
次に、ステップS32において、第1特定部152は、第1頭部インパルス応答の直接音成分の終端期間において、第1頭部インパルス応答と第1バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定する。
【0219】
次に、ステップS33において、第1直接音成分置換部153は、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分を、置換時刻以前の第1頭部インパルス応答の直接音成分に置換する。これにより、第1直接音成分置換部153は、置換時刻以前の第1頭部インパルス応答の直接音成分と、置換時刻以後の第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答を作成する。
【0220】
次に、ステップS34において、第1音圧レベル変更部154は、置換時刻以前の第1頭部インパルス応答の直接音成分の音圧レベルを、置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更する。
【0221】
なお、開始音が再生され、頭部の複数の角度毎に第1合成バイノーラルルームインパルス応答が作成される場合、第1音圧レベル変更部154は、音が到達する開始位置の方向に対応する第1合成バイノーラルルームインパルス応答を作成する際に算出された比率を用いて、他の角度に対応する第1頭部インパルス応答の直接音成分の音圧レベル又は第1バイノーラルルームインパルス応答の残響音成分の音圧レベルを変更してもよい。
【0222】
また、再生音が再生され、頭部の複数の角度毎に第1合成バイノーラルルームインパルス応答が作成される場合、第1音圧レベル変更部154は、音が到達する所定方向(0度)に対応する第1合成バイノーラルルームインパルス応答を作成する際に算出された比率を用いて、他の角度に対応する第1頭部インパルス応答の直接音成分の音圧レベル又は第1バイノーラルルームインパルス応答の残響音成分の音圧レベルを変更してもよい。
【0223】
以上の第1合成バイノーラルルームインパルス応答作成処理により、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答が作成される。また、第2合成バイノーラルルームインパルス応答作成処理により、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答が作成される。
【0224】
なお、上記の第1合成バイノーラルルームインパルス応答作成処理では、左チャンネル及び右チャンネルのそれぞれに対して第1合成バイノーラルルームインパルス応答が作成されてもよい。また、頭部の複数の角度毎に第1合成バイノーラルルームインパルス応答が作成されてもよい。また、音が到達する方向に対するユーザの頭部の正面方向の角度が取得された場合、取得された角度に対応する第1合成バイノーラルルームインパルス応答が作成されてもよい。
【0225】
このように、第1バイノーラルルームインパルス応答の直接音成分が、第1頭部インパルス応答の直接音成分に置換されることにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成することができる。また、第2バイノーラルルームインパルス応答の直接音成分が、第2頭部インパルス応答の直接音成分に置換されることにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成することができる。
【0226】
また、第1及び第2バイノーラルルームインパルス応答の直接音成分は頭部特性を含み、第1及び第2バイノーラルルームインパルス応答の残響音成分は空間特性を含む。第1及び第2バイノーラルルームインパルス応答の残響音成分にも頭部特性は含まれるが、その影響はかなり小さい。そのため、所望の空間特性を含む第1及び第2バイノーラルルームインパルス応答の直接音成分を、所望の頭部特性を含む第1及び第2頭部インパルス応答の直接音成分に置換することにより、所望の頭部特性及び所望の空間特性を含む第1及び第2バイノーラルルームインパルス応答を疑似的に再現することができる。
【0227】
図20は、本実施の形態における第1バイノーラルルームインパルス応答及び第1頭部インパルス応答の一例を示す図である。
【0228】
なお、以下では、第1バイノーラルルームインパルス応答、第1頭部インパルス応答、及び第1合成バイノーラルルームインパルス応答についてのみ説明するが、第2バイノーラルルームインパルス応答、第2頭部インパルス応答、及び第2合成バイノーラルルームインパルス応答は、第1バイノーラルルームインパルス応答、第1頭部インパルス応答、及び第1合成バイノーラルルームインパルス応答と同様である。
【0229】
図20において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1バイノーラルルームインパルス応答211L,211Rを示し、破線は、第1頭部インパルス応答212L,212Rを示す。
図20の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1バイノーラルルームインパルス応答211L及び第1頭部インパルス応答212Lを示し、
図20の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1バイノーラルルームインパルス応答211R及び第1頭部インパルス応答212Rを示している。
【0230】
図20に示すように、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答211L,211Rの振幅が最大となる時刻と、第1頭部インパルス応答212L,212Rの振幅が最大となる時刻とが一致するように、第1バイノーラルルームインパルス応答211L,211Rの波形及び第1頭部インパルス応答212L,212Rの波形をトリミングする。
【0231】
具体的には、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答及び第1頭部インパルス応答それぞれの角度0度における左右の最大振幅位置の平均時刻t_b,t_hを算出する。そして、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の平均時刻t_bと第1頭部インパルス応答の平均時刻t_hとが一致するように、第1バイノーラルルームインパルス応答及び第1頭部インパルス応答のいずれか一方を信号処理する。
【0232】
すなわち、t_b=t_hであれば、第1ピーク位置補正部151は、信号処理を行わない。
【0233】
また、t_b<t_hであれば、第1ピーク位置補正部151は、t_b=t_hとなるように、第1バイノーラルルームインパルス応答の冒頭に0を付加する。あるいは、第1ピーク位置補正部151は、t_b=t_hとなるように、第1頭部インパルス応答の冒頭をカットする。
【0234】
また、t_b>t_hであれば、第1ピーク位置補正部151は、t_b=t_hとなるように、第1頭部インパルス応答の冒頭に0を付加する。あるいは、第1ピーク位置補正部151は、t_b=t_hとなるように、第1バイノーラルルームインパルス応答の冒頭をカットする。
【0235】
また、第1特定部152は、第1頭部インパルス応答212L,212Rの直接音成分の終端期間(例えば、1.5msec~2.0msec)において、第1頭部インパルス応答212L,212Rと第1バイノーラルルームインパルス応答211L,211Rとの音圧差が最小となる置換時刻213L,213Rを特定する。
【0236】
置換時刻213L,213R以前が直接音成分を示し、置換時刻213L,213R以後が残響音成分を示す。
図20において、四角の枠で囲まれた部分が、第1バイノーラルルームインパルス応答211L,211R及び第1頭部インパルス応答212L,212Rの直接音成分を示している。第1直接音成分置換部153は、置換時刻213L,213R以前の第1バイノーラルルームインパルス応答211L,211Rの直接音成分を、置換時刻213L,213R以前の第1頭部インパルス応答212L,212Rの直接音成分に置換する。
【0237】
図21は、本実施の形態における第1合成バイノーラルルームインパルス応答の一例を示す図である。
【0238】
図21において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1合成バイノーラルルームインパルス応答214L,214Rを示し、破線は、第1バイノーラルルームインパルス応答211L,211Rを示す。
図21の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1合成バイノーラルルームインパルス応答214Lを示し、
図21の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1合成バイノーラルルームインパルス応答214Rを示している。
【0239】
第1合成バイノーラルルームインパルス応答214L,214Rは、第1バイノーラルルームインパルス応答211L,211Rの直接音成分が、第1頭部インパルス応答212L,212Rの直接音成分に置換されることにより、作成される。そのため、第1合成バイノーラルルームインパルス応答214L,214Rは、第1頭部インパルス応答212L,212Rの直接音成分と、第1バイノーラルルームインパルス応答211L,211Rの残響音成分とで構成される。
【0240】
また、
図21に示すように、第1音圧レベル変更部154は、第1頭部インパルス応答212L,212Rの直接音成分に対応する第1合成バイノーラルルームインパルス応答214L,214Rの直接音成分の音圧レベルを、第1バイノーラルルームインパルス応答211L,211Rの直接音成分の音圧レベルに応じて変更する。これにより、
図21に示す第1合成バイノーラルルームインパルス応答214L,214Rの直接音成分の振幅は、
図16に示す第1頭部インパルス応答212L,212Rの直接音成分の振幅より小さくなっている。
【0241】
図22は、本実施の形態において、第1バイノーラルルームインパルス応答の最大振幅位置と第1頭部インパルス応答の最大振幅位置とを揃える処理について説明するための図である。
【0242】
図22において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1バイノーラルルームインパルス応答を示し、破線は、第1頭部インパルス応答を示す。
図22の上から1番目及び3番目の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1バイノーラルルームインパルス応答及び第1頭部インパルス応答を示し、
図22の上から2番目及び4番目の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1バイノーラルルームインパルス応答及び第1頭部インパルス応答を示している。
【0243】
図22に示すように、左チャンネルの第1バイノーラルルームインパルス応答の最大振幅位置と右チャンネルの第1バイノーラルルームインパルス応答の最大振幅位置とが異なるとともに、左チャンネルの第1頭部インパルス応答の最大振幅位置と右チャンネルの第1頭部インパルス応答の最大振幅位置とが異なる場合がある。
【0244】
そこで、第1ピーク位置補正部151は、左チャンネルの第1バイノーラルルームインパルス応答の振幅が最大となる時刻と、右チャンネルの第1バイノーラルルームインパルス応答の振幅が最大となる時刻との平均時刻を算出するとともに、左チャンネルの第1頭部インパルス応答の振幅が最大となる時刻と、右チャンネルの第1頭部インパルス応答の振幅が最大となる時刻との平均時刻を算出してもよい。そして、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の振幅が最大となる平均時刻と、第1頭部インパルス応答の振幅が最大となる平均時刻とが一致するように、第1バイノーラルルームインパルス応答の波形及び第1頭部インパルス応答の波形をトリミングしてもよい。
【0245】
さらに、第1ピーク位置補正部151は、左チャンネルの第1バイノーラルルームインパルス応答の最大振幅と、右チャンネルの第1バイノーラルルームインパルス応答の最大振幅との平均最大振幅を算出するとともに、左チャンネルの第1頭部インパルス応答の最大振幅と、右チャンネルの第1頭部インパルス応答の最大振幅との平均最大振幅を算出してもよい。そして、第1ピーク位置補正部151は、第1頭部インパルス応答の平均最大振幅と、第1バイノーラルルームインパルス応答の平均最大振幅との比率を算出してもよい。比率は、第1頭部インパルス応答の平均最大振幅を、第1バイノーラルルームインパルス応答の平均最大振幅で除算することにより算出される。そして、第1ピーク位置補正部151は、算出した比率を第1バイノーラルルームインパルス応答に乗算してもよい。これにより、第1バイノーラルルームインパルス応答の振幅が、第1頭部インパルス応答の振幅に揃えられる。
【0246】
なお、第1ピーク位置補正部151は、第1バイノーラルルームインパルス応答の平均最大振幅と、第1頭部インパルス応答の平均最大振幅との比率を算出してもよい。比率は、第1バイノーラルルームインパルス応答の平均最大振幅を、第1頭部インパルス応答の平均最大振幅で除算することにより算出される。そして、第1ピーク位置補正部151は、算出した比率を第1頭部インパルス応答に乗算してもよい。これにより、第1頭部インパルス応答の振幅が、第1バイノーラルルームインパルス応答の振幅に揃えられる。
【0247】
図23は、本実施の形態に係る、適切な第1角度の一例について説明するための図である。
図24は、本実施の形態に係る、適切な第1遅延時間の一例について説明するための図である。
図25は、本実施の形態に係る、適切な第1音量減衰量の一例について説明するための図である。
【0248】
図23では、第1角度を0度から180度まで振ったときの被験者によって知覚された音像位置までの距離(知覚距離)、つまり、所定方向にどの程度離れて聞こえたかを示している。知覚距離は、大きいほど、頭外感が強く、効果的に三次元的な音を知覚させることができているといえる。なお、ここでは、第1音量減衰量(音量減衰量β)が-3dB、第1遅延時間が2.2msの条件に設定している。
図23に示すように、105度又は120度の方向に第1方向を設定することで高い頭外感が得られている。
【0249】
また、
図24では、第1遅延時間を0msから3.4msまで振ったときの被験者によって知覚された知覚距離を示している。なお、ここでは、第1音量減衰量(音量減衰量β)が-3dB、第1角度が105度の条件に設定している。
図24に示すように、2.4msから2.8msに第1遅延時間を設定することで高い頭外感が得られ、1.8msから3.0msに第1遅延時間を設定することで十分な頭外感が得られている。ただし、遅延時間の増加は、音質の劣化に繋がるため、比較的短い第1遅延時間が適切である。したがって、1.8msから2.4ms、例えば、2.2ms等に第1遅延時間を設定するとよい。
【0250】
また、
図25では、第1音量減衰量(音量減衰量β)を-30dBから0dBまで振ったときの被験者によって知覚された知覚距離を示している。なお、ここでは、第1遅延時間が2.2ms、第1角度が105度の条件に設定している。
図25に示すように、-5dB~-3dBに第1音量減衰量を設定することで高い頭外感が得られ、-3dB以上の第1音量減衰量を設定してもそれ以上の頭外感の向上は見られなかった。なお、大音量の反射音は、音質の劣化の要因となるため、音量減衰量は可能な限り小さい方がよいと考えられる。
【0251】
(変形例)
次に、以上に説明した実施の形態の変形例に係る音響処理装置について説明する。以下説明される変形例では、上記に説明した実施の形態と実質的に同一の構成について、上記の説明を参照することで、ここでの説明を省略する。
【0252】
上記の実施の形態では、バイノーラルルームインパルス応答の直接音成分を、頭部インパルス応答の直接音成分に置換することにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。これに対し、実施の形態の変形例1では、直接音成分の振幅が全て0に置換されたバイノーラルルームインパルス応答に頭部インパルス応答が畳み込まれることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。
【0253】
図26は、本実施の形態の変形例1における第1作成部15の構成を示すブロック図である。
【0254】
図26に示す第1作成部15は、第1特定部161、第1振幅置換部162、第1振幅設定部163、及び第1畳み込み部164を備える。
【0255】
第1特定部161は、第1バイノーラルルームインパルス応答の直接音成分の終端期間において、第1バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。サンプリングした時刻によっては、必ずしも振幅が0になるとは限らない。そのため、第1特定部161は、第1バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。
【0256】
第1振幅置換部162は、第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する。すなわち、第1振幅置換部162は、第1特定部161によって特定された置換時刻以前の第1バイノーラルルームインパルス応答の振幅を全て0に置換する。
【0257】
第1振幅設定部163は、第1振幅置換部162によって直接音成分の振幅が全て0に置換された第1バイノーラルルームインパルス応答の時刻0における振幅を1に設定する。第1バイノーラルルームインパルス応答の時刻0における振幅が1に設定されることにより、第1バイノーラルルームインパルス応答に第1頭部インパルス応答が畳み込まれた際に、第1バイノーラルルームインパルス応答に第1頭部インパルス応答の直接音成分が現れる。
【0258】
第1畳み込み部164は、第1振幅設定部163によって時刻0における振幅が1に設定された第1バイノーラルルームインパルス応答に第1頭部インパルス応答を畳み込む。これにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とが合成される。
【0259】
図27は、本実施の形態の変形例1における第2作成部25の構成を示すブロック図である。
【0260】
図27に示す第2作成部25は、第2特定部261、第2振幅置換部262、第2振幅設定部263、及び第2畳み込み部264を備える。
【0261】
第2特定部261は、第2バイノーラルルームインパルス応答の直接音成分の終端期間において、第2バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。サンプリングした時刻によっては、必ずしも振幅が0になるとは限らない。そのため、第2特定部261は、第2バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。
【0262】
第2振幅置換部262は、第2バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する。すなわち、第2振幅置換部262は、第2特定部261によって特定された置換時刻以前の第2バイノーラルルームインパルス応答の振幅を全て0に置換する。
【0263】
第2振幅設定部263は、第2振幅置換部262によって直接音成分の振幅が全て0に置換された第2バイノーラルルームインパルス応答の時刻0における振幅を1に設定する。第2バイノーラルルームインパルス応答の時刻0における振幅が1に設定されることにより、第2バイノーラルルームインパルス応答に第2頭部インパルス応答が畳み込まれた際に、第2バイノーラルルームインパルス応答に第2頭部インパルス応答の直接音成分が現れる。
【0264】
第2畳み込み部264は、第2振幅設定部263によって時刻0における振幅が1に設定された第2バイノーラルルームインパルス応答に第2頭部インパルス応答を畳み込む。これにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とが合成される。
【0265】
続いて、本実施の形態の変形例1における第1合成バイノーラルルームインパルス応答作成処理について説明する。なお、第2合成バイノーラルルームインパルス応答作成処理は、第1合成バイノーラルルームインパルス応答作成処理と同じであるので、以下では、第1合成バイノーラルルームインパルス応答作成処理のみを説明する。
【0266】
図28は、本開示の実施の形態の変形例1に係る第1作成部15による第1合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【0267】
まず、ステップS41において、第1特定部161は、第1バイノーラルルームインパルス応答の直接音成分の終端期間において、第1バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。
【0268】
次に、ステップS42において、第1振幅置換部162は、第1特定部161によって特定された置換時刻以前の第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する。
【0269】
次に、ステップS43において、第1振幅設定部163は、第1振幅置換部162によって直接音成分の振幅が全て0に置換された第1バイノーラルルームインパルス応答の時刻0における振幅を1に設定する。
【0270】
次に、ステップS44において、第1畳み込み部164は、第1振幅設定部163によって時刻0における振幅が1に設定された第1バイノーラルルームインパルス応答に第1頭部インパルス応答を畳み込む。
【0271】
以上の第1合成バイノーラルルームインパルス応答作成処理により、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成した第1合成バイノーラルルームインパルス応答が作成される。また、第2合成バイノーラルルームインパルス応答作成処理により、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成した第2合成バイノーラルルームインパルス応答が作成される。
【0272】
なお、上記の第1合成バイノーラルルームインパルス応答作成処理では、左チャンネル及び右チャンネルのそれぞれに対して第1合成バイノーラルルームインパルス応答が作成されてもよい。また、頭部の複数の角度毎に第1合成バイノーラルルームインパルス応答が作成されてもよい。また、音が到達する方向に対するユーザの頭部の正面方向の角度が取得された場合、取得された角度に対応する第1合成バイノーラルルームインパルス応答が作成されてもよい。
【0273】
このように、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定された第1バイノーラルルームインパルス応答に第1頭部インパルス応答が畳み込まれることにより、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答の残響音成分とを合成することができる。また、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定された第2バイノーラルルームインパルス応答に第2頭部インパルス応答が畳み込まれることにより、第2頭部インパルス応答の直接音成分と、第2バイノーラルルームインパルス応答の残響音成分とを合成することができる。
【0274】
図29は、本実施の形態の変形例1における第1バイノーラルルームインパルス応答の一例を示す図である。
【0275】
なお、以下では、第1バイノーラルルームインパルス応答、第1頭部インパルス応答、及び第1合成バイノーラルルームインパルス応答についてのみ説明するが、第2バイノーラルルームインパルス応答、第2頭部インパルス応答、及び第2合成バイノーラルルームインパルス応答は、第1バイノーラルルームインパルス応答、第1頭部インパルス応答、及び第1合成バイノーラルルームインパルス応答と同様である。
【0276】
図29において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1バイノーラルルームインパルス応答221L,221Rを示す。
図29の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1バイノーラルルームインパルス応答221Lを示し、
図29の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1バイノーラルルームインパルス応答221Rを示している。
【0277】
図29に示すように、第1特定部161は、第1バイノーラルルームインパルス応答221L,221Rの直接音成分の終端期間(例えば、1.5msec~2.0msec)において、第1バイノーラルルームインパルス応答221L,221Rの振幅が最も0に近似する置換時刻223L,223Rを特定する。
【0278】
図30は、本実施の形態の変形例1において、第1バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する処理を説明するための図である。
【0279】
図30において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1バイノーラルルームインパルス応答221L,221Rを示す。
図30の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1バイノーラルルームインパルス応答221Lを示し、
図30の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1バイノーラルルームインパルス応答221Rを示している。
【0280】
図30に示すように、第1振幅置換部162は、置換時刻223L,223R以前の第1バイノーラルルームインパルス応答221L,221Rの直接音成分の振幅を全て0に置換する。
【0281】
図31は、本実施の形態の変形例1において、第1バイノーラルルームインパルス応答の時刻0における振幅を1に設定する処理を説明するための図である。
【0282】
図31において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1バイノーラルルームインパルス応答221L,221Rを示す。
図31の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1バイノーラルルームインパルス応答221Lを示し、
図31の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1バイノーラルルームインパルス応答221Rを示している。
【0283】
図31に示すように、第1振幅設定部163は、第1振幅置換部162によって直接音成分の振幅が全て0に置換された第1バイノーラルルームインパルス応答221L,221Rの時刻0における振幅を1に設定する。
【0284】
図32は、本実施の形態の変形例1における第1合成バイノーラルルームインパルス応答の一例を示す図である。
【0285】
図32において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、第1合成バイノーラルルームインパルス応答224L,224Rを示す。
図32の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの第1合成バイノーラルルームインパルス応答224Lを示し、
図32の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの第1合成バイノーラルルームインパルス応答224Rを示している。
【0286】
第1合成バイノーラルルームインパルス応答224L,224Rは、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定された第1バイノーラルルームインパルス応答221L,221Rに、第1頭部インパルス応答が畳み込まれることにより、作成される。そのため、第1合成バイノーラルルームインパルス応答224L,224Rは、第1頭部インパルス応答の直接音成分と、第1バイノーラルルームインパルス応答221L,221Rの残響音成分とで構成される。
【0287】
続いて、本実施の形態の変形例2に係る音響再生装置について説明する。
【0288】
図33は、本実施の形態の変形例2に係る音響再生装置100Aの機能構成を示すブロック図である。また、
図34は、本実施の形態の変形例2に係る音響処理装置101Aの詳細な機能構成を示すブロック図である。
図33及び
図34に示すように、変形例2に係る音響再生装置100Aは、音響処理装置101Aを備える。また、音響処理装置101Aは、第3処理部141を有する点で上記の実施の形態に係る音響処理装置101の構成と異なっている。
【0289】
第3処理部141は、第2の反射音の第3出力音信号を生成する。第3処理部141は、開始音を含む音情報に対して、情報に含まれる音を、開始音の音像の方向との角度が0度より大きく360度より小さい、第1角度とは異なる第2角度を有する第2方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい、第1遅延時間とは異なる第2遅延時間、及び、0より大きい、第1音量減衰量とは異なる第2音量減衰量を有する音として定位させるための第3合成バイノーラルルームインパルス応答を畳み込むことで、第3出力音信号を生成する。
【0290】
また、第3処理部141は、再生音を含む音情報に対して、情報に含まれる音を、所定方向との角度が0度より大きく360度より小さい、第1角度とは異なる第2角度を有する第2方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい、第1遅延時間とは異なる第2遅延時間、及び、0より大きい、第1音量減衰量とは異なる第2音量減衰量を有する音として定位させるための第3合成バイノーラルルームインパルス応答を畳み込むことで、第3出力音信号を生成する。
【0291】
第3合成バイノーラルルームインパルス応答は、第1頭部特性を示すとともに第2方向とユーザの正面方向とがなす第3音像角度に対応付けられた第3頭部インパルス応答の直接音成分と、第2頭部特性及び空間特性を示すとともに第3音像角度に対応付けられた第3バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。第3頭部インパルス応答と第3バイノーラルルームインパルス応答とは異なる頭部を用いて測定される。
【0292】
また、第3合成バイノーラルルームインパルス応答は、第1頭部特性を示すとともに第2方向とユーザの正面方向とがなす第3旋回角度に対応付けられた第3頭部インパルス応答の直接音成分と、第2頭部特性及び空間特性を示すとともに第3旋回角度に対応付けられた第3バイノーラルルームインパルス応答の残響音成分とを合成することにより作成される。
【0293】
第3処理部141は、入力された開始音の音情報に対して、音を第2方向に定位させるための第3合成バイノーラルルームインパルス応答の畳み込みを行い、第3音量減衰部146を介して、音量が減衰された第3出力音信号を出力する。第3出力音信号は、第3イコライザ(EQ)142に入力される。音響処理装置101Aは、第3EQ142をさらに備える。第3EQ142は、第3出力音信号に対して低域及び高域の音の調整を行い、第3出力音信号をコンバイナ150に出力する。
【0294】
また、第3処理部141は、入力された再生音の音情報に対して、音を第2方向に定位させるための第3合成バイノーラルルームインパルス応答の畳み込みを行い、第3音量減衰部146を介して、音量が減衰された第3出力音信号を出力する。第3出力音信号は、第3イコライザ(EQ)142に入力される。
【0295】
音響処理装置101Aは、第2角度決定部140をさらに備える。第2角度決定部140は、予め設定されている第2角度を決定する。また、第2角度決定部140は、開始音の音像の方向に対して決定される第2角度を有する第2方向と、取得部111によって得られるユーザの正面方向とがなす第3音像角度を算出し、算出した第3音像角度を第3信号処理部143へ出力する。また、第2角度決定部140は、所定方向に対して決定される第2角度を有する第2方向と、取得部111によって得られるユーザの正面方向とがなす第3旋回角度を算出し、算出した第3旋回角度を第3信号処理部143へ出力する。
【0296】
開始音の音像が移動することにより、第3音像角度は変化する。開始音の音像が移動しても、第2角度の大きさは変化せずに維持される。そのため、開始音の音像が移動することによって、第2の反射音の音像の位置も移動する。例えば、ユーザの正面方向と開始音の音像の方向との角度が270度であり、第2角度が250度である場合、ユーザの正面方向と第2方向との角度は160度となる。そして、ユーザの正面方向と開始音の音像の方向との角度が300度に変化した場合、ユーザの正面方向と第1方向との角度は190度に変化する。
【0297】
第3処理部141は、第3信号処理部143、第3合成BRIR畳み込み部144、第2遅延部145、及び第3音量減衰部146を備える。
【0298】
第3信号処理部143は、第3頭部インパルス応答の直接音成分と第3バイノーラルルームインパルス応答の残響音成分とを合成した第3合成バイノーラルルームインパルス応答を作成する。なお、第3信号処理部143の構成は、
図12に示す第2信号処理部133の構成と同じであり、第3信号処理部143が備える第3作成部(不図示)の構成は、
図15又は
図27に示す第2作成部25の構成と同じである。
【0299】
第3合成BRIR畳み込み部144は、開始音を含む音情報に対して第3合成バイノーラルルームインパルス応答を畳み込むことで、第3出力音信号を生成する。また、第3合成BRIR畳み込み部144は、再生音を含む音情報に対して第3合成バイノーラルルームインパルス応答を畳み込むことで、第3出力音信号を生成する。
【0300】
第2遅延部145は、第2遅延時間に応じて第3出力音信号を遅延させる。
【0301】
第3音量減衰部146は、第3出力音信号の音量を減衰させる。第3音量減衰部146は、第3出力音信号の音量から音量減衰量γ(第2音量減衰量)を減衰させる。
【0302】
コンバイナ150は、第1処理部121によって生成された第1出力音信号と、第2処理部131によって生成された第2出力音信号と、第3処理部141によって生成された第3出力音信号とを合成した出力音信号をドライバ104へ出力する。コンバイナ150は、第1出力音信号、第2出力音信号、及び第3出力音信号を加算することによって合成した出力音信号を出力する。つまり、音響処理装置101Aは、第2処理部131及び第3処理部141のそれぞれが異なる2つの反射音を生成し、コンバイナ150がこれらを再生音に重畳させる。本変形例2のように、反射音を2つ生成して再生音に重畳させる場合、条件により三次元音場に展開する効果をより向上させることが可能となる。
【0303】
以上のようにしてコンバイナ150から出力された出力音信号がドライバ104によって再生されると、
図35のような音場が形成される。
【0304】
図35は、本実施の形態の変形例2に係る、音響処理装置101Aによって出力された音の到達方向を説明するための図である。
図35では、
図10と同様の視点における仮想的な三次元音場を平面視した図を示している。
【0305】
図35に示すように、所定方向から時計回りに第1角度を有する方向に、第1の反射音が定位されている(位置P2)。そして、所定方向から時計回りに第2角度を有する方向に、第2の反射音が定位されている(位置P3)。
図35に示すように、第1角度と第2角度とは一致しておらず、また、ユーザ99の正面奥に平行(所定方向にも平行)な2点鎖線に対して、線対称な方向になっていない。仮に、第1方向と第2方向とが線対称となる場合、条件によっては、2つの反射音が重畳されてユーザ99の背後に1つの反射音として定位されてしまうことがある。したがって、第2角度は、360度から第2角度を減じた差分角度が、第1角度と一致しない角度になっている。
【0306】
また、
図35に示すように、第1角度及び第2角度は、ユーザ99の頭部を前後に分ける仮想的な境界面よりもユーザ99の後面側に定位されている。したがって、第1角度及び第2角度は、いずれも所定方向との角度が90度より大きく、270度より小さい角度範囲内の角度に設定されている。
【0307】
なお、以上に説明した第2角度、第2遅延時間、及び第2音量減衰量は、第1角度、第1遅延時間、及び第1音量減衰量と同様に音響処理装置101Aによってあらかじめ設定された数値、又はセンサ103によるセンシング結果に応じて変化する数値であるが、これらのうち、少なくとも1つは、ユーザ99が任意に入力した数値によって調整可能に構成されてもよい。つまり、音響処理装置101Aは、第2角度、第2遅延時間、及び第2音量減衰量の少なくとも1つを調整するためのユーザ99による入力を受け付けてもよい。
【0308】
また、上記の説明では、再生音に対する第2の反射音について説明しているが、開始音に対する第2の反射音は、開始音の音像の方向から時計回りに第2角度を有する方向に定位される。開始音が再生される場合、第2角度は、開始音の音像の方向との角度が90度より大きく、270度より小さい角度範囲内の角度に設定されるとよい。また、第2角度は、360度から第2角度を減じた差分角度が、第1角度と一致しない角度になっている。
【0309】
次に、
図36を参照して、上記に説明した音響再生装置100Aの動作について説明する。
【0310】
図36は、本実施の形態の変形例2に係る音響処理装置101Aの動作を示すフローチャートである。
【0311】
まず、
図16を参照して説明した、ステップS1~ステップS5の動作と同様に、ステップS51~ステップS55の動作が実施される。
【0312】
次に、ステップS56において、第3処理部141は、開始音を含む音情報に対して、情報に含まれる音を、第2方向から到達し、第1出力音信号によって知覚される再生音に対して0より大きい第2遅延時間、及び、0より大きい音量減衰量γ(第2音量減衰量)を有する音として定位させるための第3合成バイノーラルルームインパルス応答を畳み込むことで、第3出力音信号を生成する。
【0313】
以上のステップS54、ステップS55、及びステップS56の処理は、実行される順序が入れ替えられてもよく、並列に実行されてもよい。
【0314】
次に、ステップS57において、コンバイナ150は、第1処理部121によって生成された第1出力音信号と、第2処理部131によって生成された第2出力音信号と、第3処理部141によって生成された第3出力音信号とを合成し、合成した出力音信号を出力する。
【0315】
ステップS58の処理は、
図16に示すステップS7の処理と同じであるので、説明を省略する。
【0316】
このようにして出力された出力音信号がドライバ104によって再生されることで、開始音に、2つの反射音が重畳されて三次元的な音としてユーザ99に知覚される。特に、反射音を2つしか生成していないので、この場合も大規模な演算装置などは必要なく、効果的な立体音響をユーザ99に知覚させることができる。
【0317】
なお、音響処理装置は、処理部をさらに増やして、3つ以上の反射音を再生音に重畳させてもよい。
【0318】
(その他の実施の形態)
以上、実施の形態について説明したが、本開示は、上記の実施の形態に限定されるものではない。
【0319】
例えば、上記の実施の形態では、開始音が再生される場合、第1出力音信号及び第2出力音信号が生成され、生成された第1出力音信号及び第2出力音信号を合成した出力音信号が出力されているが、本開示は特にこれに限定されない。開始音が再生される場合、第2出力音信号が生成されず、第1出力音信号のみが生成され、第1出力音信号のみが出力されてもよい。
【0320】
また、例えば、上記の実施の形態では、ユーザの頭部の動きに音が追従しない例を説明したが、本開示の内容は、ユーザの頭部の動きに音が追従する場合においても有効である。つまり、ユーザの頭部の動きとともに相対的に移動する第1位置から到達する音として所定音をユーザに知覚させる動作の中で、所定音の到達方向の変動量が閾値より小さい場合に、立体音響フィルタを選択して、変動が強調されるようにしてもよい。
【0321】
また、上記の実施の形態では、第1処理部121は、開始音を含む音情報に対して、第1合成バイノーラルルームインパルス応答を畳み込むことで、第1出力音信号を生成し、第2処理部131は、開始音を含む音情報に対して、第2合成バイノーラルルームインパルス応答を畳み込むことで、第2出力音信号を生成しているが、本開示は特にこれに限定されない。第1処理部121は、開始音を含む音情報に対して、音を、音像の方向から到達する音として定位させるための第1頭部伝達関数を畳み込むことで、第1出力音信号を生成してもよい。また、第2処理部131は、音情報に対して、音を、音像の方向との角度が0度より大きく360度より小さい第1角度を有する第1方向から到達し、第1出力音信号によって知覚される開始音に対して0より大きい第1遅延時間、及び、0より大きい第1音量減衰を有する音として定位させるための第2頭部伝達関数を畳み込むことで、第2出力音信号を生成してもよい。
【0322】
また、例えば、上記の実施の形態に説明した音響再生装置は、構成要素をすべて備える一つの装置として実現されてもよいし、複数の装置に各機能が割り振られ、この複数の装置が連携することで実現されてもよい。後者の場合には、処理モジュールに該当する装置として、スマートフォン、タブレット端末、又は、パーソナルコンピュータなどの情報処理装置が用いられてもよい。
【0323】
上記実施の形態の説明と異なる構成として例えば、デコード処理部によって、元の音情報を補正することにより、変更された立体音響フィルタを選択させることもできる。具体的には、本例におけるデコード処理部は、音情報に含まれる所定方向に関する情報を生成するとともに、元の音情報の補正を行う処理部である。デコード処理部は、時間軸上での所定方向の変動の角度量を算出し、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、所定方向に関する情報を補正する。これにより、デコード処理部から出力された補正後の所定方向に関する情報に基づいて、所定音が到達する到達方向を規定する立体音響フィルタが選択されるだけで、上記の実施の形態における変更後の立体音響フィルタが適用されることとなる。
【0324】
このように、本開示の情報処理方法等は、元の音情報における所定方向に関する情報を補正することによって実現されてもよい。上記のようなデコード処理部は、例えば、従来の立体音響再生装置のデコード処理を行う処理部と入れ替えて挿入するだけで、本願開示と同様の効果を奏することができる音響再生装置を実現することができる。
【0325】
なお、本開示の実施の形態に係る装置の機能の一部又は全てを、CPU等のプロセッサがプログラムを実行することにより実現してもよい。
【0326】
また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。
【0327】
また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。
【産業上の利用可能性】
【0328】
本開示に係る技術は、音像の頭外定位の効果を分かりやすくユーザに伝えることができるので、音像をユーザの頭外に定位させる技術として有用である。
【符号の説明】
【0329】
11 第1HRIRデータベース
12 第1BRIRデータベース
13 第1HRIR取得部
14 第1BRIR取得部
15 第1作成部
16 第1出力部
21 第2HRIRデータベース
22 第2BRIRデータベース
23 第2HRIR取得部
24 第2BRIR取得部
25 第2作成部
26 第2出力部
99 ユーザ
100,100A 音響再生装置
101,101A 音響処理装置
102 通信モジュール
103 センサ
104 ドライバ
105 開始受付部
111 取得部
112 開始音再生部
113 音像制御部
120 残響抑圧処理部
121 第1処理部
122 第1EQ
123 第1信号処理部
124 第1合成BRIR畳み込み部
125 第1音量減衰部
130 第1角度決定部
131 第2処理部
132 第2EQ
133 第2信号処理部
134 第2合成BRIR畳み込み部
135 第1遅延部
136 第2音量減衰部
140 第2角度決定部
141 第3処理部
142 第3EQ
143 第3信号処理部
144 第3合成BRIR畳み込み部
145 第2遅延部
146 第3音量減衰部
150 コンバイナ
151 第1ピーク位置補正部
152 第1特定部
153 第1直接音成分置換部
154 第1音圧レベル変更部
161 第1特定部
162 第1振幅置換部
163 第1振幅設定部
164 第1畳み込み部
251 第2ピーク位置補正部
252 第2特定部
253 第2直接音成分置換部
254 第2音圧レベル変更部
261 第2特定部
262 第2振幅置換部
263 第2振幅設定部
264 第2畳み込み部