(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-06
(45)【発行日】2024-11-14
(54)【発明の名称】ヘッドホン再生装置及びプログラム
(51)【国際特許分類】
H04S 3/00 20060101AFI20241107BHJP
H04S 7/00 20060101ALI20241107BHJP
【FI】
H04S3/00 400
H04S7/00 340
(21)【出願番号】P 2020203004
(22)【出願日】2020-12-07
【審査請求日】2023-11-01
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100121119
【氏名又は名称】花村 泰伸
(72)【発明者】
【氏名】松井 健太郎
【審査官】齊田 寛史
(56)【参考文献】
【文献】特開2018-152669(JP,A)
【文献】特開2016-039568(JP,A)
【文献】特開2003-078999(JP,A)
【文献】KUDO, A. et al.,"A study on switching of the transfer functionsfocusing on sound quality",Acoustical Science and Technology,日本,日本音響学会,2005年,Vol.26, No.3,pp.267-278
(58)【調査した分野】(Int.Cl.,DB名)
H04S 3/00
H04S 7/00
(57)【特許請求の範囲】
【請求項1】
音源の位置から聴取者の位置までの頭部インパルス応答を、前記音源から入力した音源信号に畳み込むことで、ヘッドホン再生のための再生信号を生成するヘッドホン再生装置において、
前記音源から前記音源信号を入力し、所定サイズのバッファ単位の音源信号を入力バッファに格納する音源信号入力部と、
前記音源及び前記聴取者の位置関係を測定する外部センサから、前記位置関係を示す位置パラメータを入力し、前記位置パラメータに基づいて、前記聴取者の位置から前記音源の位置への方向を算出し、前記方向を前記入力バッファに格納する位置パラメータ入力部と、
前記入力バッファに格納された前記バッファ単位の音源信号を、所定分割サイズの分割バッファ単位の音源信号に分割する音源信号分割部と、
前記入力バッファに格納された
2以上の所定数の前記方向を
用いて、内挿、外挿、または内挿及び外挿による補間を行うことで
、分割バッファ単位の方向
を生成する方向補間部と、
前記方向補間部により生成された前記分割バッファ単位の方向に対応する予め設定された前記頭部インパルス応答を、前記音源信号分割部により分割された前記分割バッファ単位の音源信号に畳み込むことで、前記再生信号を生成する畳み込み部と、
を備えたことを特徴とするヘッドホン再生装置。
【請求項2】
コンピュータを、請求項
1に記載のヘッドホン再生装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ヘッドホン再生により、所定位置に所望の音響信号(音像)を提示するためのヘッドホン再生装置及びプログラムに関する。特に、本発明は、ストリーミング等の音源信号を逐次入力する場合に、音源の移動または頭部の運動に追従して頭部インパルス応答を音源信号に畳み込むバイノーラル再生法において、音源信号を入力するタイミングと音源の移動または頭部の運動のタイミングが一致しない場合の音源信号を再生する技術に関する。
【背景技術】
【0002】
従来、ヘッドホンによる立体音響再生法(音像定位技術)の一つとして、頭部伝達関数を用いたバイノーラル再生法が知られている。
【0003】
図10は、頭部伝達関数を説明する図である。頭部伝達関数は、自由音場に聴取者101の頭部がないときの両耳の中心位置から音源100の位置を経て、頭部があるときの左右の外耳道入口または鼓膜の位置までの伝達関数(左耳頭部伝達関数及び右耳頭部伝達関数)である。
【0004】
図10に示すように、頭部伝達関数は、近似的に、音源100の位置から聴取者101の外耳道入口または鼓膜の位置までの伝達関数として定義されることが多い。頭部伝達関数は、音源100から両耳までの伝達関数であることから、音像の方向感等の知覚に寄与するとされている。尚、頭部伝達関数の時間領域の表現を、頭部インパルス応答という。
【0005】
バイノーラル再生法は、音源信号にこの頭部インパルス応答を畳み込むことにより実現される。
図11は、バイノーラル再生法を説明する図である。音源100から出力された音源信号は、畳み込み器102-1,103-1を経て、聴取者101の右の外耳道入口または鼓膜に到達すると共に、畳み込み器102-2,103-2を経て、左の外耳道入口または鼓膜に到達する。
【0006】
畳み込み器102-1は、右耳頭部インパルス応答Xrを音源信号に畳み込み、畳み込み器102-2は、左耳頭部インパルス応答Xlを音源信号に畳み込む。
【0007】
畳み込み器103-1は、右耳用のヘッドホンの逆特性を、畳み込み器102-1から出力された音響信号に畳み込み、畳み込み器103-2は、左耳用のヘッドホンの逆特性を、畳み込み器102-2から出力された音響信号に畳み込む。
【0008】
畳み込み器103-1,103-2から出力されたそれぞれの音響信号は、聴取者101の右及び左の外耳道入口または鼓膜に到達する。畳み込み器103-1,103-2により、聴取者101が音を聞くときのヘッドホンの影響をキャンセルすることができる。
【0009】
例えば、
図10を参照して、聴取者101を基準にした左斜め前方の頭部インパルス応答を右耳頭部インパルス応答X
r及び左耳頭部インパルス応答X
lとすると、
図11に示したバイノーラル再生法により、人は左斜め前方に音像を知覚することができる。
【0010】
音源100が移動する場合、その音源100の移動に伴う音源100と聴取者101の頭部の位置関係に応じて、頭部インパルス応答を切り替えることにより、バイノーラル再生法が実現される。
【0011】
図12は、音源100が移動する場合を説明する図である。D1,D2は、聴取者101の両耳の中心位置から音源100への方向をそれぞれ示す。聴取者101の位置を固定として、音源100が、時刻T1の方向D1から時刻T2の方向D2へ移動した場合を想定する。
【0012】
この場合、時刻T1から時刻T2の直前までの間の音源信号に対し、方向D1の頭部インパルス応答が畳み込まれ、時刻T2の音源信号に対し、方向D2の頭部インパルス応答が畳み込まれる。
【0013】
また、聴取者101が移動する場合も同様に、聴取者101の移動に伴う音源100と聴取者101の頭部の位置関係に応じて、頭部インパルス応答を切り替えることにより、バイノーラル再生法が実現される。
【0014】
図13は、聴取者101が移動する場合を説明する図である。D1は、聴取者101が場所a1に存在する場合の両耳の中心位置から音源100への方向を示し、D2は、聴取者101が場所a2に存在する場合の両耳の中心位置から音源100への方向を示す。音源100の位置を固定として、聴取者101が、時刻T1において存在していた場所a1から、時刻T2において存在する場所a2へ移動した場合を想定する。
【0015】
この場合、時刻T1から時刻T2の直前までの間の音源信号に対し、方向D1の頭部インパルス応答が畳み込まれ、時刻T2の音源信号に対し、方向D2の頭部インパルス応答が畳み込まれる。
【0016】
ところで、音源100が移動した場合であっても、その移動に対してスムーズに追随した再生信号を生成する手法が提案されている(例えば特許文献1を参照)。この手法は、音源信号に対し、並列に頭部伝達関数の処理を行うことで音源100の位置を検出し、この検出結果に基づいて、頭部伝達関数の処理が行われた音響信号を補間して再生信号を生成するものである。
【先行技術文献】
【特許文献】
【0017】
【発明の概要】
【発明が解決しようとする課題】
【0018】
従来、音源信号及び頭部インパルス応答がデジタル信号の場合、畳み込み処理は、サンプル単位または一定サイズ(256サンプル、1024サンプル等)の単位で行われる。また、音源100または聴取者101の移動によるその相対的な位置関係を表す位置パラメータは、外部センサ等から一定周期のデータとして取得される。
【0019】
ヘッドホン再生により所定位置に所望の音像を提示するための再生信号を生成する装置(ヘッドホン再生装置)は、音源100から音源信号を逐次入力すると共に、外部センサから一定周期の位置パラメータを入力する。そして、ヘッドホン再生装置は、位置パラメータの示す方向Dの頭部インパルス応答を、所定サイズのバッファ単位の音源信号に畳み込むことで再生信号を生成する。
【0020】
この場合、音源信号に畳み込む頭部インパルス応答の方向Dは、所定サイズのバッファ単位の音源信号が入力されるタイミング、または位置パラメータが入力されるタイミングで切り替えられる。
【0021】
音源100または聴取者101が移動する場合の時間分解能は、その位置パラメータを生成する外部センサの分解能に依存する。
【0022】
図12を参照して、ヘッドホン再生装置は、時刻T1において、外部センサから第一の位置パラメータを入力して方向D1を求め、音源100の連続移動に伴い時刻T2において、外部センサから第二の位置パラメータを入力して方向D2を求めたとする。
【0023】
この場合、時刻T1から時刻T2の直前までの間に音源100の位置が連続的に変わっているにもかかわらず、時刻T1から時刻T2の直前までの間の畳み込み処理は、方向D1を用いて行われる。
【0024】
図14は、従来技術において、時刻T、方向D、音源信号のバッファB(バッファ単位の音源信号)及び付与される方向Dについて説明する図である。時刻Tは、等間隔で刻まれているものとする。方向Dは、外部センサから入力した位置パラメータに基づいて求めたデータであり、音源信号のバッファBは、音源100から入力した所定サイズのバッファ単位の音源信号である。
【0025】
方向Dについては、時刻T1,T5,T9,T13,T17,T21,T25等のタイミングにおいて、外部センサから入力したそれぞれの位置パラメータに基づいて、方向D1,D5,D9,D13,D17,D21,D25等が求められるものとする。
【0026】
音源信号については、音源100から入力した時刻T1から時刻T6(時刻T7の直前)までの音源信号が、時刻T6のタイミングにおいて、バッファB1の音源信号としてバッファリングされるものとする。また、時刻T7から時刻T12(時刻T13の直前)までの音源信号が、時刻T12のタイミングにおいて、バッファB2の音源信号としてバッファリングされるものとする。また、時刻T13から時刻T18(時刻T19の直前)までの音源信号が、時刻T18のタイミングにおいて、バッファB3の音源信号としてバッファリングされるものとする。また、時刻T19から時刻T24(時刻T25の直前)までの音源信号が、時刻T24のタイミングにおいて、バッファB4の音源信号としてバッファリングされるものとする。
【0027】
畳み込み処理については、時刻T6のタイミングにおいてバッファリングされたバッファB1の音源信号に対し、その時点で保持されている方向D5に対応する頭部インパルス応答が畳み込まれる。このため、バッファB1の音源信号、つまり時刻T1から時刻T6までの音源信号には、方向D5が付与される。
【0028】
また、時刻T12のタイミングにおいてバッファリングされたバッファB2の音源信号に対し、その時点で保持されている方向D9に対応する頭部インパルス応答が畳み込まれる。このため、バッファB2の音源信号、つまり時刻T7から時刻T12までの音源信号には、方向D9が付与される。
【0029】
また、時刻T18のタイミングにおいてバッファリングされたバッファB3の音源信号に対し、その時点で保持されている方向D17に対応する頭部インパルス応答が畳み込まれる。このため、バッファB3の音源信号、つまり時刻T13から時刻T18までの音源信号には、方向D17が付与される。
【0030】
また、時刻T24のタイミングにおいてバッファリングされたバッファB4の音源信号に対し、その時点で保持されている方向D21に対応する頭部インパルス応答が畳み込まれる。このため、バッファB4の音源信号、つまり時刻T19から時刻T24までの音源信号には、方向D21が付与される。
【0031】
しかしながら、実際には、外部センサから方向Dが取得される時刻T1,T5,T9,T13等の間の時間期間において、例えば音源100は、方向D1,D5,D9,D13等の間を連続して移動している。このため、時刻T1,T5,T9,T13等の間の時間期間に付与される方向Dは、正確でない。例えば、時刻T5の音源信号に付与される方向D5は正確であるが、時刻T1,T2,T3,T4,T6の音源信号に付与される方向D5は正確でない。
【0032】
また、所定サイズのバッファ単位の音源信号において、所定サイズ(バッファのサイズ)が大きいほど、当該音源信号に付与される方向Dが大きく変動してしまう。このため、ヘッドホン再生装置により生成される再生信号が不連続となり、すなわち音像が不連続となり、そのつなぎ目(バッファ単位の音源信号の変わり目)で不要なノイズが発生する可能性がある。
【0033】
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、音源の移動または頭部の運動に追従して畳み込みを行うバイノーラル再生法において、再生信号の不連続性を緩和し、ノイズの発生を抑制可能なヘッドホン再生装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0034】
前記課題を解決するために、請求項1のヘッドホン再生装置は、音源の位置から聴取者の位置までの頭部インパルス応答を、前記音源から入力した音源信号に畳み込むことで、ヘッドホン再生のための再生信号を生成するヘッドホン再生装置において、前記音源から前記音源信号を入力し、所定サイズのバッファ単位の音源信号を入力バッファに格納する音源信号入力部と、前記音源及び前記聴取者の位置関係を測定する外部センサから、前記位置関係を示す位置パラメータを入力し、前記位置パラメータに基づいて、前記聴取者の位置から前記音源の位置への方向を算出し、前記方向を前記入力バッファに格納する位置パラメータ入力部と、前記入力バッファに格納された前記バッファ単位の音源信号を、所定分割サイズの分割バッファ単位の音源信号に分割する音源信号分割部と、前記入力バッファに格納された2以上の所定数の前記方向を用いて、内挿、外挿、または内挿及び外挿による補間を行うことで、分割バッファ単位の方向を生成する方向補間部と、前記方向補間部により生成された前記分割バッファ単位の方向に対応する予め設定された前記頭部インパルス応答を、前記音源信号分割部により分割された前記分割バッファ単位の音源信号に畳み込むことで、前記再生信号を生成する畳み込み部と、を備えたことを特徴とする。
【0036】
さらに、請求項2のプログラムは、コンピュータを、請求項1に記載のヘッドホン再生装置として機能させることを特徴とする。
【発明の効果】
【0037】
以上のように、本発明によれば、音源の移動または頭部の運動に追従して畳み込みを行うバイノーラル再生法において、再生信号の不連続性を緩和し、ノイズの発生を抑制することができる。
【図面の簡単な説明】
【0038】
【
図1】本発明の実施形態によるヘッドホン再生装置の構成例を示すブロック図である。
【
図2】入力バッファに格納された音源信号の単位等の変遷を説明する図である。
【
図3】再生部によるバッファ単位の音源信号に対する再生信号生成処理例を示すフローチャートである。
【
図4】補間処理の第一例(ステップS302)を説明する図である。
【
図5】補間処理の第二例(ステップS302)を説明する図である。
【
図6】本発明の実施形態における時刻T、方向D、音源信号のバッファB、音源信号の分割バッファB-n及び付与される方向Dについて説明する図である。
【
図8】畳み込み処理の例(ステップS304)を説明する図である。
【
図9】畳み込み結果の加算処理の例(ステップS305)を説明する図である。
【
図13】聴取者が移動する場合を説明する図である。
【
図14】従来技術において、時刻T、方向D、音源信号のバッファB及び付与される方向Dについて説明する図である。
【発明を実施するための形態】
【0039】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、バッファ単位の音源信号を分割バッファ単位に分割し、外部センサ等から入力した音源及び頭部の位置関係を示す位置パラメータに基づいて頭部から音源への方向を求め、分割バッファ単位の音源信号に対応するように方向を補間する。そして、本発明は、補間後の方向に対応する頭部インパルス応答を分割バッファ単位の音源信号に畳み込むことで、再生信号を生成する。
【0040】
これにより、より自然な方向に音像を定位知覚させると共に、不要なノイズを低減することができる。つまり、音源の移動または頭部の運動に追従して畳み込みを行うバイノーラル再生法において、再生信号の不連続性を緩和し、ノイズの発生を抑制することができる。
【0041】
〔ヘッドホン再生装置〕
本発明の実施形態によるヘッドホン再生装置について説明する。
図1は、本発明の実施形態によるヘッドホン再生装置の構成例を示すブロック図である。
【0042】
このヘッドホン再生装置1は、音源信号入力部10、位置パラメータ入力部11、入力バッファ12、再生部13、メモリ14、再生バッファ15及び再生信号出力部16を備えている。再生部13は、音源信号分割部20、方向補間部21及び畳み込み部22を備えている。
【0043】
音源信号入力部10は、音源2からストリーミング等の音源信号を逐次入力する。音源信号入力部10は、所定サイズのバッファ単位の音源信号の入力を待って、当該バッファ単位の音源信号を入力バッファ12に格納する。
【0044】
位置パラメータ入力部11は、図示しない音源2及び聴取者101の頭部の位置関係を測定する外部センサ3から、当該位置関係を示す位置パラメータを入力する。そして、位置パラメータ入力部11は、位置パラメータに基づいて、聴取者101の頭部の位置から音源2の位置への方向情報(以下、単に「方向」という。)を算出し、方向を入力バッファ12に格納する。
【0045】
ここで、方向は、所定の直交する2軸において、聴取者101の頭部の位置から音源2の位置への角度及び距離を示すベクトルである。また、音源2の移動または頭部の運動に伴い、入力される位置パラメータは変化するものとし、算出される方向も変化するものとする。さらに、音源信号入力部10が音源信号を入力するタイミングと、音源2の移動または頭部の運動のタイミングは一致していないものとする。すなわち、音源信号の入力タイミングと、外部センサ3が位置パラメータを更新して出力するタイミング(位置パラメータ入力部11が位置パラメータを入力するタイミング)は一致していないものとする。
【0046】
入力バッファ12には、後述する
図6に示すように、所定時刻間隔の方向D、音源信号のバッファB、並びに、時刻T毎の音源信号の分割バッファB-n及び付与される方向Dが格納される。音源信号のバッファBは、所定サイズのバッファ単位の音源信号であり、時刻T毎の音源信号の分割バッファB-nは、所定分割サイズの分割バッファ単位の音源信号である。
【0047】
図2は、入力バッファ12に格納された音源信号の単位等の変遷を説明する図である。
図2(1)に示すように、音源信号入力部10により、時刻T=T6のタイミングにおいて、時刻T1から時刻T6までの音源信号(所定サイズのバッファ単位の音源信号)が格納される。時刻Tは、等間隔で刻まれているものとする。後述する
図4、
図5及び
図6についても同様である。
【0048】
また、
図2(1)に示すように、位置パラメータ入力部11により、時刻T1のタイミングにおいて方向D=D1が格納され、時刻T5のタイミングにおいて方向D5が格納される。
【0049】
図1に戻って、再生部13は、入力バッファ12に格納されたバッファ単位の音源信号を分割し、入力バッファ12に格納された方向Dを補間する。そして、再生部13は、補間後の方向Dに対応する頭部インパルス応答を分割バッファ単位の音源信号に畳み込むことで、ヘッドホン再生のための再生信号を生成する。ここで、補間とは、内挿、外挿、または内挿及び外挿等の各種処理をいう。
【0050】
具体的には、再生部13は、入力バッファ12に格納された所定サイズのバッファ単位の音源信号を、所定分割サイズの分割バッファ単位の音源信号に分割する。また、再生部13は、入力バッファ12に格納された方向Dを、分割バッファ単位の音源信号に対応するように補間する。
【0051】
再生部13は、メモリ14から、補間後の方向Dに対応する頭部インパルス応答を読み出し、頭部インパルス応答を分割バッファ単位の音源信号に畳み込み、畳み込み結果を加算処理することで、再生バッファ15に格納する。再生バッファ15には再生信号が格納される。再生部13及びメモリ14の詳細については後述する。
【0052】
再生信号出力部16は、再生バッファ15から再生信号を読み出し、再生信号を出力する。
【0053】
これにより、聴取者101が方向Dの音源2から取得する音源信号を、再生信号としてヘッドホン再生することができる。
【0054】
(再生部13の処理)
次に、
図1に示した再生部13の処理について詳細に説明する。
図3は、再生部13によるバッファ単位の音源信号に対する再生信号生成処理例を示すフローチャートである。
【0055】
再生部13は、入力バッファ12に所定サイズのバッファ単位の音源信号が格納される毎に(後述する
図6において、時刻T6,T12,T18,T24,・・・毎に)、後述するステップS301~S307の処理を行う。
【0056】
(音源信号の分割処理)
再生部13の音源信号分割部20は、入力バッファ12に所定サイズのバッファ単位の音源信号が格納されたことを判定すると、当該音源信号を、最小単位である所定分割サイズの分割バッファ単位の音源信号に分割する(ステップS301)。
【0057】
ここで、所定サイズのバッファ単位の音源信号における所定サイズは、任意に予め設定される。また、所定分割サイズの分割バッファ単位の音源信号における所定分割サイズも任意に予め設定され、所定サイズよりも小さければよく、1サンプルのサイズでもよい。
【0058】
図2(2)に示すように、時刻T6のタイミングにて、バッファ単位の音源信号(バッファB1)が入力バッファ12に格納されたとする(すなわち、音源2からバッファ単位の音源信号が入力されたとする)。
【0059】
そうすると、
図2(3)に示すように、ステップS301の処理により、バッファ単位の音源信号(バッファB1)が分割バッファ単位の音源信号(分割バッファB1-1,・・・,B1-6)に分割される。ここでは、所定サイズを6等分したサイズが所定分割サイズである。
【0060】
これにより、入力バッファ12には、時刻T1における分割バッファ単位の音源信号(分割バッファB1-1)、及び時刻T2における分割バッファ単位の音源信号(分割バッファB1-2)が格納された状態となる。また、入力バッファ12には、時刻T3における分割バッファ単位の音源信号(分割バッファB1-3)、・・・及び時刻T6における分割バッファ単位の音源信号(分割バッファB1-6)が格納された状態となる。
【0061】
(方向Dの補間処理)
図3に戻って、方向補間部21は、ステップS301から移行して、入力バッファ12から方向Dを読み出し、方向Dを用いた補間を行い、分割バッファ単位の音源信号に対応する方向Dを求める。そして、方向補間部21は、補間後の方向Dを入力バッファ12に格納する(ステップS302)。
【0062】
図2(4)に示すように、ステップS302により、方向D1,D2等を用いた補間処理が行われ、時刻T2,T3,T4,T6における方向D2’,D3’,D4’,D6’が求められる。時刻T1,T2,・・・,T5,T6における方向D1,D2’,・・・,D5,D6’は、分割バッファ単位の音源信号である分割バッファB1-1,B1-2,・・・,B1-5,B1-6にそれぞれ対応することとなる。
【0063】
これにより、音源2の移動または頭部の運動に伴い、聴取者101から見て音源2がより正確な位置で滑らかに移動するように、方向Dの軌跡が補間され、分割バッファ単位の音源信号に対応する方向Dを得ることができる。
【0064】
(補間処理の例)
次に、ステップS302における補間処理の例について説明する。
【0065】
図4は、補間処理の第一例(ステップS302)を説明する図であり、内挿及び外挿処理の例を示している。入力バッファ12に、時刻T13において方向D13が格納され、時刻T17において方向D17が格納され、時刻T18において、バッファ単位の音源信号であるバッファB3が格納されたものとする。また、バッファ単位の音源信号であるバッファB3が、分割バッファ単位の音源信号である分割バッファB3-1,B3-2,・・・,B3-6に分割されたものとする。
【0066】
そうすると、方向補間部21は、時刻T18において、過去2度の時刻T13,T17における方向D13,D17を用いた内挿処理により、時刻T14,T15,T16における方向D14’,D15’,D16’を付与する。また、方向補間部21は、方向D13,D17を用いた外挿処理により、時刻T18における方向D18’を付与する。
【0067】
具体的には、方向D13をベクトルD
→
13、方向D17をベクトルD
→
17として、方向補間部21は、以下の式にて、方向D14’,D15’,D16’,D18’のベクトルD
→
14,D
→
15,D
→
16,D
→
18を求める。
【数1】
【0068】
図5は、補間処理の第二例(ステップS302)を説明する図であり、内挿処理の例を示している。入力バッファ12に、時刻T13において方向D13が格納され、時刻T17において方向D17が格納され、時刻T18において、バッファ単位の音源信号であるバッファB3が格納されたものとする。また、バッファ単位の音源信号であるバッファB3が、分割バッファ単位の音源信号である分割バッファB3-1,B3-2,・・・,B3-6に分割されたものとする。また、時刻T21において方向D21が格納されるものとする。
【0069】
そうすると、方向補間部21は、時刻T18の後に、時刻T21における方向D21が入力バッファ12に格納されるのを待つ。そして、方向補間部21は、過去3度の時刻T13,T17,T21における方向D13,D17,D21を用いた内挿処理により、時刻T14,T15,T16,T18,T19,T20における方向D14’,D15’,D16’,D18’,D19’,D20’を付与する。
【0070】
つまり、方向補間部21は、時刻T18において、方向D13,D17を用いた内挿処理により、方向D14’,D15’,D16’を付与し、時刻T21において、方向D17,D21を用いた内挿処理により、方向D18’,D19’,D20’を付与する。
【0071】
具体的には、方向D13をベクトルD
→
13、方向D17をベクトルD
→
17、方向D21をベクトルD
→
21として、方向補間部21は、以下の式にて、方向D14’,D15’,D16’,D18’,D19’,D20’のベクトルD
→
14,D
→
15,D
→
16,D
→
18,D
→
19,D
→
20を求める。
【数2】
【0072】
前述のとおり、時刻T18において、方向D13,D17を用いた内挿処理により方向D14’,D15’,D16’が求められ、時刻T21において、方向D17,D21を用いた内挿処理により方向D18’,D19’,D20’が求められる。このため、方向D18’,D19’,D20’の内挿処理は、方向D21が入力バッファ12に格納される時刻T21を待って行われるため、処理遅延が生じることとなる。
【0073】
尚、方向補間部21は、以下の式にて、過去の複数の方向Dを用いた線形予測により補間を行うようにしてもよい。
【数3】
iは、内挿処理の対象である方向Dの番号(分割バッファ単位の番号)(時刻の番号)であり、Nは、遡る過去の方向Dの数であり、ω
i-jは、過去の方向Dに対する重み係数である。
【0074】
方向補間部21は、前記式(3)において、過去に入力バッファ12に格納された方向Dと、補間処理により求めた方向Dとを比較し、その誤差e
iが最小となるように重みω
i-jを更新する。この場合の誤差e
iは、最小二乗誤差を用いた場合、例えば以下の式にて算出される。
【数4】
n
j<jは、j番目の方向Dが格納される番号(時刻)とする。
【0075】
また、方向補間部21は、過去の方向Dを用いて、スプライン補間を行うようにしてもよい。
【0076】
このように、方向補間部21による
図3のステップS302の補間処理により、入力バッファ12は、分割バッファ単位の音源信号毎に(時刻T毎に)、当該音源信号に対応する方向Dが格納された状態となる。
【0077】
図6は、本発明の実施形態における時刻T、方向D、音源信号のバッファB(バッファ単位の音源信号)、音源信号の分割バッファB-n(分割バッファ単位の音源信号)及び付与される方向Dについて説明する図である。
図6に示す時刻T、方向D等は、
図14に示した従来技術における時刻T、方向D等に対応している。
【0078】
方向Dについては、
図14と同様に入力バッファ12に、時刻T1,T5,T9,T13,T17,T21,T25等において、方向D1,D5,D9,D13,D17,D21,D25等が格納される。
【0079】
また、音源信号については、
図14と同様に入力バッファ12に、時刻T6,T12,T18,T24等において、バッファ単位の音源信号であるバッファB1,B2,B3,B4等が格納される。
【0080】
本発明の実施形態では、音源信号分割部20によりバッファ単位の音源信号が分割バッファ単位の音源信号に分割される。これにより、
図6に示すとおり、入力バッファ12は、時刻T1の分割バッファB1-1、時刻T2の分割バッファB1-2、・・・、時刻T26の分割バッファB5-2等が格納された状態となる。
【0081】
また、本発明の実施形態では、方向補間部21により方向Dが補間される。これにより、
図6に示すとおり、時刻T1の方向D1、時刻T2の方向D2’、・・・、時刻T26の方向D26’等が格納された状態となる。
【0082】
(頭部インパルス応答の畳み込み処理)
図3に戻って、畳み込み部22は、ステップS302から移行して、バッファ単位の音源信号において、最初の分割バッファ単位の音源信号(における時刻T)を処理対象に設定する(ステップS303)。
【0083】
図2(4)の例では、時刻T1~T6のバッファ単位の音源信号であるバッファB1において、最初の分割バッファ単位の音源信号である分割バッファB1-1が処理対象に設定される。
【0084】
畳み込み部22は、入力バッファ12から、処理対象の分割バッファ単位の音源信号である分割バッファB-nを読み出すと共に、処理対象の分割バッファ単位の音源信号に対応する方向Dを読み出す。また、畳み込み部22は、メモリ14から、当該方向Dに対応する頭部インパルス応答を読み出す。そして、畳み込み部22は、方向Dに対応する頭部インパルス応答を分割バッファ単位の音源信号である分割バッファB-nに畳み込む(ステップS304)。
【0085】
つまり、畳み込み部22は、分割バッファ単位の音源信号のそれぞれについて、当該時刻Tの方向Dに対応する頭部インパルス応答を、当該時刻Tの分割バッファ単位の音源信号に畳み込む。
【0086】
図7は、メモリ14のデータ構成例を示す図である。メモリ14には、方向D、及び当該方向Dに対応する頭部インパルス応答が格納されている。方向Dに対応する頭部インパルス応答は予め測定され、メモリ14に格納されているものとする。頭部インパルス応答は、右耳頭部インパルス応答X
r及び左耳頭部インパルス応答X
lからなる。畳み込み部22により、方向Dに対応する頭部インパルス応答が読み出される。
【0087】
図3に戻って、畳み込み部22は、ステップS304にて畳み込みが行われた畳み込み結果を、再生バッファ15に既に格納されているデータ(格納済みデータ)に加算する(ステップS305)。これにより、畳み込み結果が再生バッファ15に格納される。このような処理が分割バッファ単位の音源信号毎に行われることにより、再生バッファ15には再生信号が格納される。
【0088】
図8は、畳み込み処理の例(ステップS304)を説明する図であり、
図9は、畳み込み結果の加算処理の例(ステップS305)を説明する図である。
【0089】
音源信号及び頭部インパルス応答がデジタル信号の場合、畳み込み処理は、所定分割サイズであるサンプル単位または一定サイズ(256サンプル、1024サンプル等)の分割バッファ単位で実行される。
【0090】
図8を参照して、畳み込み部22は、ステップS304において、時刻T13における方向D13に対応する左耳頭部インパルス応答を、時刻T13における分割バッファ単位の音源信号である分割バッファB3-1に畳み込み、左耳畳み込み結果を求める。
【0091】
また、畳み込み部22は、ステップS304において、時刻T13における方向D13に対応する右耳頭部インパルス応答を、時刻T13における分割バッファ単位の音源信号である分割バッファB3-1に畳み込み、右耳畳み込み結果を求める。
【0092】
ここで、分割バッファB3-1はNサンプルの音源信号であり、左耳頭部インパルス応答及び右耳頭部インパルス応答はそれぞれMサンプルの応答であるとする。そうすると、左耳畳み込み結果及び右耳畳み込み結果のサンプル数は、それぞれ(M+N-1)となる。
【0093】
そして、畳み込み部22は、ステップS305において、左耳畳み込み結果を、再生バッファ15における時刻T13の分割バッファB3-1に対応する位置を基準にして、既に格納されている格納済みデータに加算する。このような処理を分割バッファ単位の音源信号毎に行うことにより、再生バッファ15には左耳再生信号が格納される。
【0094】
また、畳み込み部22は、ステップS305において、右耳畳み込み結果を、再生バッファ15における時刻T13の分割バッファB3-1に対応する位置を基準にして、既に格納されている格納済みデータに加算する。このような処理を分割バッファ単位の音源信号毎に行うことにより、再生バッファ15には右耳再生信号が格納される。
【0095】
図9を参照して、畳み込み結果の加算処理について説明する。
図9では、左耳畳み込み結果及び右耳畳み込み結果を特に示していないが、いずれについても適用される。
【0096】
畳み込み部22は、時刻T13における分割バッファ単位の音源信号である分割バッファB3-1に対するステップS304において、方向D13に対応する頭部インパルス応答を分割バッファB3-1に畳み込み、畳み込み結果C1を求める。
【0097】
そして、畳み込み部22は、分割バッファB3-1に対するステップS305において、畳み込み結果C1を、再生バッファ15における位置kを基準にして、既に格納されている格納済みデータに加算する。これにより、畳み込み結果C1を用いた加算処理の結果が、再生バッファ15における位置kから位置βまでの領域に格納される。
【0098】
畳み込み部22は、時刻T14における分割バッファ単位の音源信号である分割バッファB3-2に対するステップS304において、方向D14に対応する頭部インパルス応答を分割バッファB3-2に畳み込み、畳み込み結果C2を求める。
【0099】
そして、畳み込み部22は、分割バッファB3-2に対するステップS305において、畳み込み結果C2を、再生バッファ15における位置(k+N)を基準にして、既に格納されている格納済みデータに加算する。これにより、畳み込み結果C2を用いた加算処理の結果が、再生バッファ15における位置(k+N)から位置αまでの領域に格納される。
【0100】
ここで、分割バッファB3-2に対するステップS305の処理について詳細に説明する。再生バッファ15には、畳み込み結果C1を用いた加算処理の結果が位置kから位置βまでの領域に格納されているものする。つまり、再生バッファ15には、分割バッファB3-1までの分割バッファ単位の加算結果が、位置oから位置βまでの領域に格納されているものとする。
【0101】
このような再生バッファ15の状態において、畳み込み部22は、(M+N-1)サンプルの畳み込み結果C2を、位置(k+N)を基準にして、位置(k+N)から位置αまでの領域の格納済みデータに加算する。
【0102】
具体的には、畳み込み部22は、(M+N-1)サンプルの畳み込み結果C2のうち、時間軸上の前方部の(M-1)サンプルの信号を、再生バッファ15における位置(k+N)から位置βまでの領域の(M-1)サンプルの格納済みデータに加算する。また、畳み込み部22は、(M+N-1)サンプルの畳み込み結果C2のうち、時間軸上の後方部のNサンプルの信号を、再生バッファ15における位置β+1から位置αまでの領域に格納する(位置β+1から位置αまでの領域にはデータが格納されていないが、ヌルデータが格納されているものとみなすことで、時間軸上の前方部のNサンプルの信号を位置β+1から位置αまでの領域に格納する処理は、当該Nサンプルの信号を位置β+1から位置αまでの格納済みデータ(ヌルデータ)に加算する処理と等価である)。
【0103】
図3に戻って、畳み込み部22は、ステップS305から移行して、全ての分割バッファ単位の音源信号について、ステップS304,S305の処理が完了したか否かを判定する(ステップS306)。
【0104】
畳み込み部22は、ステップS306において、全ての分割バッファ単位の音源信号について処理が完了していないと判定した場合(ステップS306:N)、次の分割バッファ単位の音源信号を処理対象に設定する(ステップS307)。そして、畳み込み部22は、ステップS304へ移行し、ステップS304,S305の処理を行う。
【0105】
一方、畳み込み部22は、ステップS306において、全ての分割バッファ単位の音源信号について処理が完了したと判定した場合(ステップS306:Y)、当該バッファ単位の音源信号について処理を終了する。
【0106】
このように、バッファ単位の音源信号毎に、ステップS301~S307の処理が行われ、分割バッファ単位の音源信号毎に、ステップS304~S307の処理が行われる。分割バッファ単位の音源信号に対して繰り返し行われるステップS304~S307の処理は、ステップS301にて分割された分割バッファ単位の音源信号の数だけ行われる。
【0107】
以上のように、本発明の実施形態のヘッドホン再生装置1によれば、音源信号入力部10は、音源2から入力したバッファ単位の音源信号を入力バッファ12に格納する。また、位置パラメータ入力部11は、外部センサ3から入力した、音源2及び聴取者101の頭部の位置関係を示す位置パラメータに基づいて、聴取者101の位置から音源2の位置への方向Dを算出し、方向Dを入力バッファ12に格納する。
【0108】
再生部13の音源信号分割部20は、入力バッファ12に格納されたバッファ単位の音源信号を、分割バッファ単位の音源信号に分割し、方向補間部21は、入力バッファ12に格納された方向Dを、分割バッファ単位の音源信号に対応するように補間する。
【0109】
方向Dが補間されることにより、音源2の移動または頭部の運動に伴い、聴取者101から見て音源2がより正確な位置で滑らかに移動するように、分割バッファ単位の音源信号に対応する方向Dを得ることができる。
【0110】
畳み込み部22は、補間後の方向Dに対応する頭部インパルス応答を、分割バッファ単位の音源信号に畳み込み、再生信号を生成して再生バッファ15に格納する。再生信号出力部16は、再生バッファ15から再生信号を読み出して出力する。
【0111】
これにより、音源信号を逐次入力するタイミングと、音源2の移動または頭部の運動のタイミング、すなわち位置パラメータを離散的に入力して方向Dを算出するタイミングとが一致しない場合であっても、再生信号の不連続性を緩和し、ノイズの発生を抑制することができる。
【0112】
また、本発明の実施形態によるヘッドホン再生装置1は、メモリ14に格納された方向D及び当該方向Dに対応する頭部インパルス応答を用いることを前提とするものである。
【0113】
この方向Dに対応する頭部インパルス応答は、音源2の位置から聴取者101の頭部の位置までの応答であり、例えば頭部の位置にマイクを設置し、マイクの位置を自動的に連続移動させることにより予め測定される。このため、方向Dに対応する頭部インパルス応答は、様々な方向Dに応じたデータとして測定することが可能であり、メモリ14には、様々な方向D及び当該方向Dに対応する頭部インパルス応答を格納することができる。
【0114】
これに対し、頭部インパルス応答が様々な方向Dから測定することができない場合には、測定した頭部インパルス応答を補間する必要がある。この頭部インパルス応答の補間処理は、周波数毎のレベル差及び時間差を考慮する必要があるため(前述の特許文献1を参照)、本発明の実施形態による方向D(角度及び距離)の補間処理よりも処理負荷が高く、多くの処理時間を必要とする。
【0115】
そこで、本発明の実施形態によるヘッドホン再生装置1では、予め測定された頭部インパルス応答、すなわちメモリ14に格納された様々な方向Dに対応する頭部インパルス応答を利用することとした。つまり、ヘッドホン再生装置1は、方向Dに対応する頭部インパルス応答を補間するのではなく、方向Dを補間した後に、補間後の方向Dに対応する頭部インパルス応答をメモリ14から読み出すこととした。
【0116】
これにより、負荷の高い頭部インパルス応答の補間を行うことなく、予め測定により得られた様々な方向Dに対応する頭部インパルス応答を有効に利用することができ、バイノーラル再生法を実現するヘッドホン再生装置1を実用的に運用することができる。
【0117】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。
【0118】
例えば前記実施形態では、ヘッドホン再生装置1の位置パラメータ入力部11は、外部センサ3から位置パラメータを入力するようにした。本発明は、外部センサ3から位置パラメータを入力することに限定するものではなく、外部センサ3以外の装置から位置パラメータを入力するようにしてもよい。
【0119】
尚、本発明の実施形態によるヘッドホン再生装置1のハードウェア構成としては、通常のコンピュータを使用することができる。ヘッドホン再生装置1は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
【0120】
ヘッドホン再生装置1に備えた音源信号入力部10、位置パラメータ入力部11、入力バッファ12、再生部13、メモリ14、再生バッファ15及び再生信号出力部16の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0121】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
【産業上の利用可能性】
【0122】
本発明の実施形態によるヘッドホン再生装置1及びプログラムは、ヘッドホンによる音場再現にかかる技術分野において、特に、頭部伝達関数(頭部インパルス応答)を用いたバイノーラル再生に関する技術として有用である。
【符号の説明】
【0123】
1 ヘッドホン再生装置
2,100 音源
3 外部センサ
10 音源信号入力部
11 位置パラメータ入力部
12 入力バッファ
13 再生部
14 メモリ
15 再生バッファ
16 再生信号出力部
20 音源信号分割部
21 方向補間部
22 畳み込み部
101 聴取者
102-1,102-2,103-1,103-2 畳み込み器
T 時刻
B バッファ
B-n 分割バッファ
D 方向