(58)【調査した分野】(Int.Cl.,DB名)
前記有効周波数帯域外において前記振幅成分のゲイン値が0[dB]を超える帯域が存在する場合、左右チャンネルの共通の補正量を算出する全体ゲイン調整手段をさらに備え、
前記平滑化手段は、前記全体ゲイン調整手段により算出された前記補正量を前記基準ゲイン値として、左右チャンネルの前記振幅成分を補正する請求項1または2に記載の頭外音像定位装置。
前記有効周波数帯域内において、前記振幅成分のゲイン値が第1のゲイン閾値及び前記第1のゲイン閾値よりも小さい第2のゲイン閾値を下回る場合、前記第1のゲイン閾値を下回る帯域のゲイン値が前記第1のゲイン閾値以上のゲイン値となるように、前記振幅成分のゲイン値を補正するノッチ調整手段をさらに備える請求項1〜3のいずれか一項に記載の頭外音像定位装置。
【発明を実施するための形態】
【0012】
<実施の形態1>
以下、図面を参照して本発明の実施の形態について説明する。本実施の形態にかかる頭外音像定位装置1のブロック図を
図1に示す。頭外音像定位装置1は、時間−周波数変換手段11と、極座標変換手段12と、平滑化手段13と、直交座標変換手段14と、周波数−時間変換手段15と、パラメータ設定手段16と、逆フィルタ生成手段17と、畳み込み手段18、19と、を備える。
【0013】
初めに、頭外音像定位装置1の全体的な流れを簡単に説明する。頭外音像定位装置1は、外耳道インパルス応答補正手段を用いて、外耳道インパルス応答信号を補正し、補正外耳道インパルス応答信号を生成する。そして、頭外音像定位装置1は、補正外耳道インパルス応答信号に基づいて、逆フィルタを生成する。最後に、頭外音像定位装置1は、空間インパルス応答信号と、音源信号と、逆フィルタと、を畳み込み、再生出力信号を生成する。
【0014】
頭外音像定位装置1は、イヤホンやヘッドホン等の受聴者の両耳に装着可能なスピーカ機器に適用することを想定している。そのため、受聴者の左耳に出力されるLチャンネル(左チャンネル)の信号と、右耳に出力されるRチャンネル(右チャンネル)の信号と、の2つのチャンネルの信号に対して処理を行う。なお、説明の便宜のために、
図1においては、Lチャンネルの信号を処理するブロック図のみを図示しているが、Rチャンネルについても同様の構成のブロック図が存在する。
【0015】
<頭外音像定位装置1の構成>
時間−周波数変換手段11(伝達関数取得手段)は、外耳道インパルス応答信号を取得し、複素周波数成分に変換する。例えば、時間−周波数変換手段11は、時間成分である外耳道インパルス応答信号に対してフーリエ変換を行い、周波数成分の外耳道伝達関数(ECTF : Ear Canal Transfer Function)を生成する。つまり、外耳道伝達関数は、外耳道インパルス応答信号の周波数特性を示している。なお、外耳道インパルス応答信号とは、イヤホン等から受聴者の外耳道に出力したインパルス信号に対する応答信号(受信信号)を意味する。
【0016】
極座標変換手段12(振幅位相取得手段)は、直交座標の外耳道伝達関数の実数部と虚数部を、極座標に変換し、振幅成分及び位相成分を取得する。
【0017】
平滑化手段13は、パラメータ設定手段16から取得した境界周波数及び平滑化ゲイン値(基準ゲイン値)に基づいて、外耳道伝達関数の振幅成分を補正する。境界周波数とは、有効周波数帯域を規定するための情報であり、例えば、有効周波数帯域の高域側の境界周波数と低域側の境界周波数である。平滑化手段13は、取得した高域側の境界周波数からナイキスト周波数までの帯域の振幅成分のゲイン値を、取得した平滑化ゲイン値に置き換える。低域側も同様に、平滑化手段13は、DC成分から取得した低域側の境界周波数までの帯域の振幅成分のゲイン値を、取得した平滑化ゲイン値に置き換える。これらの置換処理により、平滑化手段13は、補正後の振幅成分を生成する。
【0018】
直交座標変換手段14(伝達関数生成手段)は、極座標の位相成分及び補正後の振幅成分を、直交座標に変換し、複素周波数成分である外耳道伝達関数を生成する。なお、直交座標変換手段14により生成される外耳道伝達関数は、時間−周波数変換手段11により生成された外耳道伝達関数とは振幅成分が異なっている。以下では、直交座標変換手段14により生成された外耳道伝達関数を、補正外耳道伝達関数と称す。
【0019】
周波数−時間変換手段15は、補正外耳道伝達関数を取得し、時間成分に変換する。例えば、周波数−時間変換手段15は、周波数成分である補正外耳道伝達関数に対して逆フーリエ変換を行い、時間成分の外耳道インパルス応答信号を生成する。以下では、補正外耳道伝達関数に基づいて生成される外耳道インパルス応答信号を、補正外耳道インパルス応答信号と称す。
【0020】
パラメータ設定手段16は、平滑化手段13に対して境界周波数及び平滑化ゲイン値を供給する。このとき、境界周波数及び平滑化ゲイン値は、ユーザにより適宜設定される。パラメータ設定手段16は、例えば、ROM(Read Only Memory)やRAM(Random Access Memory)等のメモリを有し、当該メモリに境界周波数及び平滑化ゲイン値等のパラメータを格納する。なお、
図1に示すように、パラメータ設定手段16は、Lチャンネル及びRチャンネルに対して共通の境界周波数及び平滑化ゲイン値を供給している。つまり、パラメータ設定手段16は、Lチャンネルの平滑化手段13に供給した境界周波数及び平滑化ゲイン値と同じ値の境界周波数及び平滑化ゲイン値を、Rチャンネルの平滑化手段(図示省略)に対して供給する。
【0021】
逆フィルタ生成手段17は、補正外耳道インパルス応答信号に基づいて、逆フィルタを生成する。つまり、逆フィルタ生成手段17は、補正外耳道インパルス応答信号の周波数特性を打ち消すような特性を有する逆フィルタを生成する。なお、外耳道インパルス応答信号から逆フィルタを生成する方法については、既存の種々の方法を用いることができるため、ここでは、詳細な説明を省略する。
【0022】
畳み込み手段18は、逆フィルタ生成手段により生成された外耳道インパルス応答逆フィルタと、空間インパルス応答信号と、を畳み込み、頭外音像定位インパルス応答信号を生成する。
【0023】
畳み込み手段19は、畳み込み手段18により生成された頭外音像定位インパルス応答信号と、音源信号と、を畳み込み、再生出力信号を生成する。当該再生出力信号は、イヤホンやヘッドホンのスピーカから出力される信号である。
【0024】
<頭外音像定位装置1の動作>
続いて、本実施の形態にかかる頭外音像定位装置1の動作について説明する。
図2は、頭外音像定位装置1の全体動作を説明するためのフローチャートである。
【0025】
まず、時間−周波数変換手段11が、外耳道インパルス応答信号を取得する(ステップS101)。そして、時間−周波数変換手段11は、外耳道インパルス応答信号を用いて、外耳道伝達関数を生成する(ステップS102)。
【0026】
次に、極座標変換手段12が、時間−周波数変換手段11により生成された外耳道伝達関数の極座標変換を行い、振幅成分及び位相成分を算出する(ステップS103)。
【0027】
平滑化手段13は、パラメータ設定手段16から供給された境界周波数及び平滑化ゲイン値を用いて、極座標変換手段12により算出された振幅成分のゲイン値を補正する(ステップS104)。なお、補正処理の詳細については後述する。
【0028】
直交座標変換手段14は、ステップS103において算出された位相成分と、ステップS104において補正された振幅成分と、を用いて、補正外耳道伝達関数を算出する(ステップS105)。このとき用いられる位相成分は、ステップS103において、極座標変換手段12により算出された位相成分であり、補正処理は行われていない。言い換えると、外耳道伝達関数の補正の前後において、位相成分は保持されている。
【0029】
周波数−時間変換手段15は、直交座標変換手段14により算出された補正外耳道伝達関数に逆フーリエ変換を行い、時間成分に変換した補正外耳道インパルス応答信号を算出する(ステップS106)。
【0030】
逆フィルタ生成手段17は、周波数−時間変換手段15により算出された補正外耳道インパルス応答信号に基づいて、逆フィルタを生成する(ステップS107)。
【0031】
畳み込み手段18は、逆フィルタ生成手段17により生成された逆フィルタと、空間インパルス応答信号と、を畳み込み、頭外音像定位インパルス応答信号を生成する(ステップS108)。
【0032】
畳み込み手段19は、畳み込み手段18により生成された頭外音像定位インパルス応答信号と、音源信号と、を畳み込み、再生出力信号を生成する(ステップS109)。
【0033】
<平滑化手段13の動作の詳細>
続いて、
図2のステップS104における平滑化手段13の補正処理について詳細に説明する。
図3は、平滑化手段13の詳細な動作を説明するためのフローチャートである。まず、平滑化手段13に、外耳道伝達関数の振幅成分が入力される(ステップS201)。
【0034】
平滑化手段13は、取得した振幅成分を対数変換する(ステップS202)。具体的には、平滑化手段13は、以下の式(1)を用いて、対数変換を行う。なお、Amp_dB[w]が対数変換後の振幅成分を示し、wは周波数を示す。
【0036】
平滑化手段13は、パラメータ設定手段16から低域境界周波数及び低域平滑化ゲイン値を取得する(ステップS203)。このとき、低域境界周波数とは、有効音源周波数帯域の下限を示す周波数である。また、低域平滑化ゲイン値とは、低域境界周波数を含む低域側のゲイン値の置き換えに用いられるゲイン値である。
【0037】
平滑化手段13は、DC成分から低域境界周波数までの振幅成分のゲイン値を低域平滑化ゲイン値に置き換える(ステップS204)。つまり、外耳道伝達関数の振幅成分において、DC成分から低域境界周波数までの帯域のゲイン値は、全て低域平滑化ゲイン値になる。これにより、DC成分から低域境界周波数までの帯域の平滑化が行われる。
【0038】
同様に、平滑化手段13は、高域側の平滑化を行う。平滑化手段13は、パラメータ設定手段16から高域境界周波数及び高域平滑化ゲイン値を取得する(ステップS205)。このとき、高域境界周波数とは、有効音源周波数帯域の上限を示す周波数である。また、高域平滑化ゲイン値とは、高域境界周波数を含む高域側のゲイン値の置き換えに用いられるゲイン値である。
【0039】
平滑化手段13は、高域境界周波数からナイキスト周波数までの帯域における振幅成分のゲイン値を高域平滑化ゲイン値に置き換える(ステップS206)。つまり、外耳道伝達関数の振幅成分において、高域境界周波数からナイキスト周波数までのナイキスト周波数を含まない帯域のゲイン値は、全て高域平滑化ゲイン値になる。これにより、高域境界周波数からナイキスト周波数までのナイキスト周波数を含まない帯域の平滑化が行われる。
【0040】
平滑化手段13は、平滑化後の振幅成分の逆対数変換を行う(ステップS207)。これにより、対数の振幅成分が、ステップS201の入力時と同じ線形成分に戻る。
【0041】
ここで、
図4〜
図6を参照して、平滑化処理の作用について具体的に説明する。
図4は、ステップS206において平滑化が行われた振幅成分を示すグラフである。
図5は、逆フィルタと外耳道伝達関数(ECTF)の畳み込みを示すグラフである。
図6は、逆フィルタと外耳道伝達関数とが畳み込まれた特性を示すグラフである。
図4〜
図6のグラフにおいて、縦軸は対数変換後のゲイン値を示し、横軸は周波数を示す。なお、
図4〜
図6に示した例においては、高域平滑化ゲイン値として0[dB]が設定されているものとする。
【0042】
図4に示すように、高域境界周波数よりも高域側においては、補正前の振幅成分(破線)が高域平滑化ゲイン値(太線)に置き換えられている。太線で示す特性が、補正外耳道伝達関数の特性である。つまり、補正外耳道伝達関数は、補正前の外耳道伝達関数の特性に関わらず、高域境界周波数からナイキスト周波数までのゲイン値が高域平滑化ゲイン値(0[dB])になる。
【0043】
次に、
図5を参照して、逆フィルタについて説明する。
図5の太線で示したグラフが逆フィルタの特性を示す。細線で示したグラフが外耳道内で畳み込まれる外耳道伝達関数(ECTF)の特性を示す。外耳道内では、
図5に示した逆フィルタと外耳道伝達関数とが畳み込まれる。逆フィルタは、外耳道伝達関数の特性を打ち消すためのフィルタであるため、
図4に示した補正外耳道伝達関数の振幅成分に対して、0[dB]を基準に線対称となる特性を有する。高域境界周波数からナイキスト周波数までの帯域においては、補正外耳道伝達関数の振幅成分が0[dB]の一定値であるため、逆フィルタも0[dB]の一定値になる。つまり、高域境界周波数からナイキスト周波数までの帯域においては、逆フィルタは、外耳道伝達関数の振幅成分に対して、0[dB]を基準に線対称にはならない。
【0044】
最後に、
図6を参照して、畳み込み後の振幅成分の特性について説明する。
図6は、逆フィルタと外耳道伝達関数との畳み込み後の特性を示しているが、逆フィルタと外耳道伝達関数とが畳み込まれる場合とは、逆フィルタと音源信号とを畳み込んだ再生出力信号がイヤホン等のスピーカから出力されてから鼓膜に届くまでの間に、再生出力信号と外耳道伝達関数とが畳み込まれるときである。つまり、
図6に示したグラフは、イヤホンなどから出力された再生出力信号が鼓膜に届いたときに逆フィルタと外耳道伝達関数の畳み込みの結果として発生する特性である。
【0045】
図6に示すように、高域境界周波数よりも低域側の帯域においては、外耳道伝達関数と逆フィルタとが相殺され、畳み込み後の特性は0[dB]となる。つまり、鼓膜に届いた音声信号の有効周波数帯域には、外耳道伝達関数の特性は含まれていない。
【0046】
一方、高域境界周波数からナイキスト周波数までの帯域においては、逆フィルタの振幅成分は0[dB]の一定値であるため、外耳道伝達関数は畳み込み後も打ち消されない。その結果、鼓膜に届いた音声信号の高域境界周波数からナイキスト周波数までの帯域には、外耳道伝達関数の特性が残っている。
【0047】
以上のように、本実施の形態にかかる頭外音像定位装置1の構成によれば、平滑化手段13は、Lチャンネルの振幅成分及びRチャンネルの振幅成分を補正するパラメータとしてLRチャンネル共通の有効周波数帯域及び平滑化ゲイン値を使用している。具体的には、平滑化手段13は、LRチャンネルの振幅成分の有効周波数帯域外のゲイン値を、平滑化ゲイン値に置き換える。これにより、LRチャンネルの振幅成分のうち同じ帯域が補正される。また、有効周波数帯域外における補正後のゲイン値もLRチャンネルで同じ値である。そのため、LRチャンネルにおいて、有効周波数帯域の幅や、有効周波数帯域外のゲイン値が同じとなり、LRチャンネル間で差が生じない。その結果、LRチャンネル間の音像の偏りを抑制することができる。
【0048】
また、逆フィルタと外耳道伝達関数とが畳み込まれた後においても、有効周波数帯域外の外耳道伝達関数の特性は残ったままである。このため、有効周波数帯域外においては、音源信号が受聴者の外耳道に応じた特性で減衰する。したがって、受聴者が聞き慣れた特性で音源信号が減衰するため、受聴者に補正の違和感を与えることを抑制することができる。
【0049】
さらに、高域境界周波数よりも高域側において、外耳道伝達関数の振幅成分にノッチ等が生じ、振幅成分のゲイン値が大きくマイナスに振れている場合を考える。この場合、そのまま逆フィルタを生成してしまうと、ノッチを打ち消すために、逆フィルタのノッチに対応する帯域のゲイン値が急峻な立ち上がり波形となってしまう。そのため、高域境界周波数よりも高域側において音源が増幅されてしまい、高音のノイズが発生してしまう恐れがある。
【0050】
これに対して、本実施の形態にかかる頭外音像定位装置1は、高域境界周波数よりも高域側においては、外耳道伝達関数の振幅成分にかかわらず、逆フィルタの振幅成分は、一定値(平滑化ゲイン値)となる。その結果、外耳道伝達関数のノッチに起因する高音ノイズの発生を防止することができる。
【0051】
<実施の形態2>
本発明にかかる実施の形態2について説明する。本実施の形態にかかる頭外音像定位装置2のブロック図を
図7に示す。頭外音像定位装置2は、
図1に示した頭外音像定位装置1の構成に加えて、入替手段21を備える。なお、その他の構成については、頭外音像定位装置1の構成と同様であるため、適宜説明を省略する。
【0052】
入替手段21は、周波数−時間変換手段15により生成される補正外耳道インパルス応答信号の波形を入れ替えて、逆フィルタ生成手段17に供給する。具体的には、補正外耳道インパルス応答信号の時間軸の中心時間を基準に、中心時間よりも前の波形と、中心時間よりも後の波形と、を入れ替える。そして、入替手段21は、入れ替えた後の補正外耳道インパルス応答信号(以下では、入替後の補正外耳道インパルス応答信号を修正外耳道インパルス応答信号と称す。)を逆フィルタ生成手段17に出力する。
【0053】
図8を参照して、入替手段21の入れ替え動作について説明する。
図8(a)は、入れ替え前の補正外耳道インパルス応答信号の波形を示す。
図8(b)は、入れ替え後の補正外耳道インパルス応答信号(修正外耳道インパルス応答信号)の波形を示す。
図8において、横軸は時間を示し、縦軸は振幅の相対値である。入替手段21は、補正外耳道インパルス応答信号の波形の最大時間N−1の半分(中心時間)である時刻(N/2)−1と、時刻N/2と、の間を基準として、補正外耳道インパルス応答信号の前後を入れ替える。これにより、入替手段21は、
図8(b)に示すように、連続的な修正外耳道インパルス応答信号を生成する。なお、
図8(a)に示すように、演算結果の波形が切れて現れてしまうのは、逆フーリエ変換の特性上、時間軸がインパルス応答長の半分だけシフトしたような波形が生じるためである。なお、中心時間とは、補正外耳道インパルス応答信号の時間軸の丁度中間の時間だけでなく、時間軸の中心付近であり、補正外耳道インパルス応答信号の波形を含まない時間も含まれる。
【0054】
以上のように、本実施の形態にかかる頭外音像定位装置2の構成によれば、入替手段21が補正外耳道インパルス応答信号の時間軸における中心時間を基準に、波形の前後を入れ替える。これにより、入替手段21は、連続的な修正外耳道インパルス応答信号を生成する。その結果、逆フィルタ生成手段17は、連続的な修正外耳道インパルス応答信号に基づいて、逆フィルタを生成することができるため、安定した逆フィルタ生成を実現することができる。
【0055】
<実施の形態3>
本発明にかかる実施の形態3について説明する。本実施の形態にかかる頭外音像定位装置3のブロック図を
図9に示す。頭外音像定位装置3は、
図7に示した頭外音像定位装置2の構成に加えて、ノッチ調整手段31を備える。なお、その他の構成については、頭外音像定位装置2の構成と同様であるため、適宜説明を省略する。
【0056】
ノッチ調整手段31は、パラメータ設定手段16から、ノッチ探索周波数、ノッチ制限値(第1のゲイン閾値)、及びノッチ判定値(第2のゲイン閾値)を取得する。ノッチ調整手段31は、取得したノッチ探索周波数に基づいて、ノッチを探索する。そして、ノッチ調整手段31は、ノッチを発見した場合、ノッチ制限値及びノッチ判定値を用いて、当該ノッチを平滑化または補間する。
【0057】
続いて、ノッチ調整手段31の具体的な動作について
図10に示すフローチャートを参照して説明する。まず、
図3に示したフローチャートと同様に、平滑化手段13に、極座標変換手段12から外耳道伝達関数の振幅成分が入力される(ステップS301)。次に、平滑化手段13は、上述した式(1)を用いて、外耳道伝達関数の振幅成分を対数変換する(ステップS302)。そして、パラメータ設定手段16から平滑化手段13に、高域境界周波数及び高域平滑化ゲイン値が入力される(ステップS303)。平滑化手段13は、高域境界周波数からナイキスト周波数までのナイキスト周波数を含まない帯域における振幅成分のゲイン値を高域平滑化ゲイン値に置き換える(ステップS304)。
【0058】
次に、パラメータ設定手段16からノッチ調整手段31に、ノッチ探索周波数、ノッチ制限値、及び、ノッチ判定値が入力される(ステップS305)。なお、ノッチ探索周波数には、ノッチ開始周波数と、ノッチ終了周波数が含まれる。
【0059】
次に、ノッチ調整手段31は、ノッチ探索開始周波数からノッチの探索を開始し、ノッチ制限値を下回る帯域を検出する。そして、ノッチ制限値を下回る帯域が存在する場合、ノッチ調整手段31は、その帯域の開始周波数と終了周波数とを取得する(ステップS306)。
【0060】
ノッチ調整手段31は、取得した開始周波数から終了周波数までの範囲内において、最小のゲイン値を検出する(ステップS307)。そして、ノッチ調整手段31は、検出した最小ゲイン値が、ノッチ判定を行うための閾値であるノッチ判定値以下であるか否かを判定する(ステップS308)。なお、ノッチ判定値は、ノッチ制限値よりも小さい値である。
【0061】
最小ゲイン値がノッチ判定値以下である場合(ステップS308:Yes)、ノッチ調整手段31は、当該波形の凹部をノッチと判定する。そして、ノッチ調整手段31は、ノッチ情報として、ノッチの開始周波数、ノッチの終了周波数、及び、ノッチの調整に必要なノッチ制限値を保存する(ステップS309)。そして、ノッチ調整手段31は、ノッチ個数をカウントアップする(ステップS310)。ノッチ個数とは、検出されたノッチの個数を示す情報である。
【0062】
一方、最小ゲイン値がノッチ判定値よりも大きい場合(ステップS308:No)、ノッチ調整手段は、当該波形の凹部をノッチと判定しない。そして、ノッチ調整手段31は、ノッチ探索終了周波数までの全ての範囲を探索したか否かを判定する(ステップS311)。
【0063】
ノッチ探索終了周波数までの全ての範囲の探索が完了していない場合(ステップS311:No)、ノッチ調整手段31は、ステップS306に戻り、ノッチの探索を再開する。
【0064】
一方、ノッチ探索周波数の全範囲の探索が完了した場合(ステップS311:Yes)、ノッチ調整手段31は、保存したノッチ情報を参照し、各ノッチに対して、ノッチの開始周波数から終了周波数までの帯域の振幅成分を、ノッチ制限値を用いて平滑化または補間する(ステップS312)。
【0065】
ノッチ調整手段31は、ステップS310においてカウントしたノッチ個数を参照して、検出したノッチ個数分の平滑化または補間を実行したか否かを判定する(ステップS313)。
【0066】
ノッチ個数分の平滑化または補間を実行した場合(ステップS313:Yes)、ノッチ調整手段31は、平滑化または補間を行った振幅成分の逆対数変換を行う(ステップS314)。
【0067】
一方、ノッチ個数分の平滑化または補間を実行していない場合(ステップS313:No)、ノッチ調整手段31は、ステップS312に戻り、残りのノッチの平滑化または補間を実行する。
【0068】
ここで、
図11を参照して、ノッチ調整手段31の動作について説明する。
図11は、平滑化手段13の平滑化処理後の振幅成分を示している。
図11(a)は、ノッチ調整手段31がノッチと判定した場合を示している。
図11(b)は、ノッチ調整手段31がノッチと判定しなかった場合を示している。
【0069】
図11(a)に示すように、ノッチ調整手段31は、平滑化手段13による平滑化実施領域と被らない帯域をノッチ探索周波数としてノッチの探索を行う。そして、ノッチ調整手段31は、ノッチ制限値を下回る帯域を検出した場合、ノッチ制限値を下回る帯域の開始周波数(ノッチ開始周波数)と、終了周波数(ノッチ終了周波数)と、を取得する。そして、ノッチ調整手段31は、ノッチ開始周波数からノッチ終了周波数までの帯域内で、最小ゲイン値を検出する。そして、ノッチ調整手段31は、最小ゲイン値がノッチ判定値を下回っている場合には、その帯域をノッチと見なす。ノッチ調整手段31は、ノッチと見なした帯域(ノッチ開始周波数からノッチ終了周波数までの帯域)の平滑化を実行する(
図11(a)の太線部分)。つまり、ノッチ調整手段31は、ノッチ開始周波数からノッチ終了周波数までの帯域を、ノッチ制限値の一定値に置き換える。なお、ノッチ調整手段31は、平滑化処理ではなく、ノッチ開始周波数からノッチ終了周波数までを曲線で補間する補間処理を行ってもよい。
【0070】
一方、
図11(b)に示すように、最小ゲイン値がノッチ判定値を上回っている場合、ノッチ調整手段31は、その帯域をノッチと見なさない。
【0071】
以上のように、本実施の形態にかかる頭外音像定位装置3の構成によれば、ノッチ調整手段31が、外耳道伝達関数の振幅成分のノッチを検出し、ノッチの平滑化または補間を行う。そのため、ノッチを打ち消すための逆フィルタが急峻に立ち上がりを持った特性となることを抑制することができる。したがって、ノッチの帯域が不自然に強調されることを抑制でき、安定した頭外音像定位を実現することができる。
【0072】
<実施の形態4>
本発明にかかる実施の形態4について説明する。本実施の形態にかかる頭外音像定位装置4のブロック図を
図12に示す。頭外音像定位装置4は、
図9に示した頭外音像定位装置3の構成に加えて、全体ゲイン調整手段41を備える。なお、その他の構成については、頭外音像定位装置3の構成と同様であるため、適宜説明を省略する。
【0073】
全体ゲイン調整手段41は、パラメータ設定手段16からの境界周波数に基づく高域境界周波数より高域の帯域において、逆フィルタと外耳道伝達関数が畳み込まれた後の有効周波数帯域外の外耳道伝達関数の振幅のゲイン値が0[dB]を下回るように、補正量を平滑化手段13に送る。
【0074】
図12に示したLチャンネルの全体ゲイン調整手段41は、Rチャンネルの全体調整手段(図示省略)と接続されている。全体ゲイン調整手段41は、Lチャンネルにおける補正量とRチャンネルにおける補正量のうち、大きい方を補正量としてLチャンネル側の平滑化手段13に送る。Lチャンネル側の平滑化手段13では、得られた補正量が0[dB]でない場合には、平滑化ゲイン値を補正量で置換して、平滑化を行う。Rチャンネル側の全体ゲイン調整手段41も同様に、同一の補正量をRチャンネル側の平滑化手段13に送り、補正量が0[dB]でない場合には、平滑化ゲイン値を補正量で置換して、平滑化を行う。
【0075】
続いて、全体ゲイン調整手段41の具体的な動作について
図13に示すフローチャートを参照して説明する。まず、パラメータ設定手段16からLチャンネルの全体ゲイン調整手段41及びRチャンネルの全体ゲイン調整手段に、高域境界周波数が入力される(ステップS401)。
【0076】
次に、Lチャンネルの外耳道伝達関数の振幅成分が極座標変換手段12から全体ゲイン調整手段41に入力される(ステップS402)。全体ゲイン調整手段41は、Lチャンネルの外耳道伝達関数の振幅成分を対数変換する(ステップS403)。
【0077】
全体ゲイン調整手段41は、ナイキスト周波数から高域境界周波数までの範囲において、0[dB]を超える最大ゲイン値(MaxGainL)を探索する(ステップS404)。
【0078】
次に、Rチャンネルの全体ゲイン調整手段も同様の動作を行う。具体的には、Rチャンネルの外耳道伝達関数の振幅成分が極座標変換手段12から全体ゲイン調整手段に入力される(ステップS405)。全体ゲイン調整手段は、Rチャンネルの外耳道伝達関数の振幅成分を対数変換する(ステップS406)。
【0079】
全体ゲイン調整手段は、ナイキスト周波数から高域境界周波数までの範囲において、0[dB]を超える最大ゲイン値(MaxGainR)を探索する(ステップS407)。
【0080】
Lチャンネルの全体ゲイン調整手段41は、Rチャンネルの全体ゲイン調整手段から最大ゲイン値(MaxGainR)を取得し、MaxGainLとMaxGainRとを比較する。
【0081】
そして、全体ゲイン調整手段41は、MaxGainLとMaxGainRのうち、大きい値を補正量(CGain)として設定する(ステップS408)。
【0082】
ここで、
図14〜
図18を参照して、全体ゲイン調整手段41の動作について説明する。なお、
図14〜
図18のグラフにおいて、縦軸は対数変換後のゲイン値を示し、横軸は周波数を示す。全体ゲイン調整手段41は、ナイキスト周波数から高域境界周波数までの範囲において、0[dB]を超える最大ゲイン値を探索する。つまり、全体ゲイン調整手段41は、平滑化手段13により平滑化が行われる帯域において、最大ゲイン値を探索する。
図14において、点Pをピークとすると、全体ゲイン調整手段41は、点Pのゲイン値を最大ゲイン値(MaxGainL)として検出する。
【0083】
全体ゲイン調整手段41は、最大ゲイン値(MaxGainL)と最大ゲイン値(MaxGainR)とを比較し、大きい値を補正量(CGain)として設定して、Lチャンネルの平滑化手段13、Rチャンネルの平滑化手段に送る。そして、平滑化手段13では、送られてきた補正量が0[dB]でない場合には、高域平滑化ゲインの値を補正量に置き換えて使用する。この結果、平滑化手段13は、
図15に示すように、高域平滑化ゲインが正の値を有することなるため、平滑化帯域が正の値となるように平滑化が行われる。このような平滑化がなされた後、
図16に示すように、逆フィルタ生成手段17が、平滑化が行われた振幅成分に基づいて、平滑化帯域が負の値を有するような逆フィルタを生成する。その後、
図17に示すように、太線で示した逆フィルタと、細線で示した外耳道伝達関数と、が外耳道内で畳み込まれる。その結果、
図18に示すように、有効周波数帯域においては、外耳道伝達関数の周波数特性が打ち消される。一方、有効周波数帯域外(平滑化帯域)においては、受聴者の外耳道伝達関数の特性を残したまま、ゲイン値が0[dB]を下回る。なお、
図18に示したグラフは、イヤホンなどから出力された再生出力信号が鼓膜に届いたときに逆フィルタと外耳道伝達関数の畳み込みの結果として発生する特性である。
【0084】
実施の形態1において説明した通り、平滑化が実施された帯域においては、外耳道伝達関数(ECTF)の周波数特性が残る。その際に、外耳道伝達関数の周波数特性において、平滑化の実施された帯域内に、0[dB]を超える帯域が存在した場合、当該周波数特性はそのまま再現される。このため、外耳道において再生出力信号と外耳道伝達関数と畳み込まれた際に、0[dB]を超える帯域においては、ゲイン強調が発生することになる。しかしながら、本実施の形態にかかる頭外音像定位装置4の構成によれば、全体ゲイン調整手段41が、平滑化の実施される帯域において、0[dB]を超える帯域が存在するかを確認し、補正量を平滑化手段13に送る。平滑化手段13では、送られてきた補正量が0[dB]でない場合には、高域平滑化ゲインの値を補正量に置き換えて使用することで、平滑化帯域は正の値に平滑化が行われ、逆フィルタ生成手段17では、平滑化帯域が負の値を有するような逆フィルタが生成される。このため、外耳道において再生出力信号と外耳道伝達関数と畳み込まれた際に、平滑化の実施帯域において0[dB]を超えることを防止できる。その結果、平滑化が実施される帯域におけるゲイン強調を抑制することができる。
【0085】
<実施の形態5>
本発明にかかる実施の形態5について説明する。本実施の形態にかかる頭外音像定位装置5のブロック図を
図19に示す。頭外音像定位装置5は、
図12に示した頭外音像定位装置4の構成に比べて、逆フィルタ生成手段17の構成が異なる。なお、その他の構成については、頭外音像定位装置4の構成と同様であるため、適宜説明を省略する。
【0086】
図19に示すように、本実施の形態にかかる逆フィルタ生成手段17は、Lチャンネルの入替手段21LからLチャンネルの修正外耳道インパルス応答信号の供給を受ける。また、逆フィルタ生成手段17は、Rチャンネルの入替手段21RからRチャンネルの修正外耳道インパルス応答信号の供給を受ける。そして、逆フィルタ生成手段17は、Lチャンネル用の逆フィルタ(外耳道インパルス応答逆フィルタ)を、Lチャンネルの畳み込み手段18Lに供給する。また、逆フィルタ生成手段17は、Rチャンネル用の逆フィルタを、Rチャンネルの畳み込み手段18Rに供給する。
【0087】
次に、本実施の形態にかかる逆フィルタ生成手段17の具体的なブロック図を
図20に示す。逆フィルタ生成手段17は、左チャンネル用の第1の逆フィルタ生成手段171Lと、右チャンネル用の第1の逆フィルタ生成手段171Rと、遅延サンプル数決定手段172と、Lチャンネル用の第2の逆フィルタ生成手段173Lと、Rチャンネル用の第2の逆フィルタ生成手段173Rと、を備える。
【0088】
第1の逆フィルタ生成手段171Lは、Lチャンネルの修正外耳道インパルス応答信号を取得し、当該修正外耳道インパルス応答信号に基づいて、逆フィルタを生成する。第1の逆フィルタ生成手段171Lは、逆フィルタの生成の際に算出された遅延サンプル数を遅延サンプル数決定手段172に供給する。一方、第1の逆フィルタ生成手段171Lは、生成した逆フィルタを出力しない。つまり、第1の逆フィルタ生成手段171Lにより生成された逆フィルタは使用されない。なお、第1の逆フィルタ生成手段171Rの構成及び動作も第1の逆フィルタ生成手段171Lと同様であるため、説明を省略する。また、Lチャンネルの遅延サンプル数とRチャンネルの遅延サンプル数とは、異なる値になる。
【0089】
遅延サンプル数決定手段172は、第1の逆フィルタ生成手段171L及び第1の逆フィルタ生成手段171Rから遅延サンプル数を取得する。そして、遅延サンプル数決定手段172は、Lチャンネルの遅延サンプル数(第1の遅延サンプル数)と、Rチャンネルの遅延サンプル数(第2の遅延サンプル数)と、に基づいて、共通遅延サンプル数を算出する。例えば、遅延サンプル数決定手段172は、Lチャンネルの遅延サンプル数とRチャンネルの遅延サンプル数との平均値を、共通遅延サンプル数として算出する。なお、共通遅延サンプル数の算出方法は平均値の算出に限られない。
【0090】
そして、遅延サンプル数決定手段172は、共通遅延サンプル数を、第2の逆フィルタ生成手段173Lと第2の逆フィルタ生成手段173Rに供給する。つまり、第2の逆フィルタ生成手段173L及び第2の逆フィルタ生成手段173Rには、同じ遅延サンプル数が供給される。
【0091】
第2の逆フィルタ生成手段173Lは、Lチャンネルの修正外耳道インパルス応答信号と共通遅延サンプル数を用いてスパイクポイント位置を固定した逆フィルタの生成を行う。つまり、第2の逆フィルタ生成手段173Lは、Lチャンネルの修正外耳道インパルス応答信号とその逆フィルタを畳み込んだ際に、共通遅延サンプル数を伴ったスパイクポイント位置に、インパルス信号が生成されるように、逆フィルタを生成する。これにより、Lチャンネルの外耳道インパルス応答逆フィルタが生成される。なお、第2の逆フィルタ生成手段173Rの構成及び動作も第2の逆フィルタ生成手段173Lと同様であるため、説明を省略する。
【0092】
以上のように、本実施の形態にかかる頭外音像定位装置5の構成によれば、逆フィルタ生成手段17が、Lチャンネル及びRチャンネルで共通の遅延サンプル数を用いて、逆フィルタを生成する。このため、Lチャンネルの逆フィルタのスパイクポイント位置と、Rチャンネルの逆フィルタのスパイクポイント位置と、が同じ位置になる。したがって、逆フィルタにより外耳道特性が打ち消されるまでにかかる時間が同じ時間となる。その結果、LチャンネルとRチャンネルとの間で、頭外定位音像の偏りが生じることを抑制することができる。
【0093】
なお、本実施の形態にかかる逆フィルタ生成手段17の構成は、平滑化手段13とは独立した構成であり、LRチャンネルの外耳道インパルス応答信号が取得できれば、逆フィルタを生成できる。そのため、逆フィルタ生成手段17は、平滑化手段13が存在しない構成であっても、LチャンネルとRチャンネルとの間における頭外定位音像の偏りを防止するという課題を解決することができる。
【0094】
また、遅延サンプル数決定手段172は、第1の逆フィルタ生成手段171Lにより算出された遅延サンプル数と、第1の逆フィルタ生成手段171Rにより算出された遅延サンプル数と、を用いて、共通遅延サンプル数を算出する。そのため、逆フィルタ生成手段17は、Lチャンネルの修正外耳道インパルス応答信号とRチャンネルの修正外耳道インパルス応答信号の両方に適した逆フィルタを生成することができる。
【0095】
ここで、比較例にかかる逆フィルタ生成手段の構成を
図21に示す。比較例にかかる逆フィルタ生成手段は、第1の逆フィルタ生成手段171L及び第2の逆フィルタ生成手段171Rのみを備え、LRチャンネルが完全に独立した処理をする。第1の逆フィルタ生成手段171Lは、Lチャンネルの修正外耳道インパルス応答信号に基づいて、Lチャンネル用の逆フィルタ(外耳道インパルス応答逆フィルタ)を生成し、その際に考慮された遅延サンプル数を出力する。第1の逆フィルタ生成手段171Rは、Rチャンネルの修正外耳道インパルス応答信号に基づいて、Rチャンネル用の逆フィルタ(外耳道インパルス応答逆フィルタ)を生成し、その際に考慮された遅延サンプル数を出力する。
【0096】
逆フィルタ生成の際には、遅延サンプル数を伴ったスパイクポイント位置に、インパルス信号が生成される。スパイクポイントの位置決定においては、第1の逆フィルタ生成手段171Lは、修正外耳道インパルス応答信号とその逆フィルタを畳み込んで得られるインパルス信号と、理想インパルス信号と、の二乗誤差の和が最小になるようなスパイクポイントを選択する。つまり、第1の逆フィルタ生成手段171Lでは、スパイクポイントを1サンプルずつずらしながら最小二乗誤差が得られるポイントを探す処理が行われる。しかし、このようにLRチャンネルで独立して逆フィルタを生成した場合、第1の逆フィルタ生成手段171L、171Rにおいてスパイクポイント位置が異なる逆フィルタが生成される。したがって、外耳道特性が打ち消されるまでにかかる時間がLチャンネルとRチャンネルで異なってしまう。その結果、頭外定位音像のどちらかのチャンネルへの偏りが発生してしまう。
【0097】
<実施の形態6>
本発明にかかる実施の形態6について説明する。本実施の形態にかかる頭外音像定位装置6のブロック図を
図22に示す。頭外音像定位装置6は、
図19に示した頭外音像定位装置5の構成に比べて、畳み込み手段19L、19Rが、外耳道インパルス応答逆フィルタとバイノーラル音源信号とを畳み込む点が異なる。また、頭外音像定位装置6においては、畳み込み手段18L、18Rが除かれている。なお、その他の構成については、頭外音像定位装置5の構成と同様であるため、適宜説明を省略する。
【0098】
バイノーラル音源信号とは、音源の方向感や、上下感、距離感等の音場情報を持った信号である。言い換えると、バイノーラル音源信号は、音源信号に空間インパルス応答信号(HRTF)が畳み込まれた信号である。バイノーラル音源信号は、例えば、ダミーヘッドまたは人の頭の外耳道にイヤホンマイクを設置して録音することにより生成することができる。
【0099】
以上のように、本実施の形態にかかる頭外音像定位装置6の構成によれば、畳み込み手段19L、19Rが逆フィルタとバイノーラル音源信号とを畳み込んで、再生出力信号を生成する。このため、空間インパルス応答信号の畳み込みをする必要がなくなる。
【0100】
なお、上述の頭外音像定位装置の任意の処理は、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0101】
また、コンピュータが上述の実施の形態の機能を実現するプログラムを実行することにより、上述の実施の形態の機能が実現される場合だけでなく、このプログラムが、コンピュータ上で稼動しているOS(Operating System)もしくはアプリケーションソフトウェアと共同して、上述の実施の形態の機能を実現する場合も、本発明の実施の形態に含まれる。さらに、このプログラムの処理の全てもしくは一部がコンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットによって行われて、上述の実施の形態の機能が実現される場合も、本発明の実施の形態に含まれる。
【0102】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更及び組み合わせをすることが可能である。