IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

特開2024-152932信号処理方法、信号処理装置、及び信号処理プログラム
<>
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図1
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図2
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図3
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図4
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図5
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図6
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図7
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図8
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図9
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図10
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図11
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図12
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図13
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図14
  • 特開-信号処理方法、信号処理装置、及び信号処理プログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024152932
(43)【公開日】2024-10-25
(54)【発明の名称】信号処理方法、信号処理装置、及び信号処理プログラム
(51)【国際特許分類】
   H04S 7/00 20060101AFI20241018BHJP
【FI】
H04S7/00 360
【審査請求】未請求
【請求項の数】10
【出願形態】OL
【公開請求】
(21)【出願番号】P 2024140852
(22)【出願日】2024-08-22
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110004303
【氏名又は名称】弁理士法人三協国際特許事務所
(72)【発明者】
【氏名】中 光波
(72)【発明者】
【氏名】中橋 康太
(72)【発明者】
【氏名】石川 智一
(57)【要約】
【課題】所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができる技術を提供する。
【解決手段】信号処理方法は、ユーザの第1頭部特性を示す頭部インパルス応答を取得することと、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得することと、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成することと、作成した合成バイノーラルルームインパルス応答を出力することとを含む。
【選択図】図4
【特許請求の範囲】
【請求項1】
コンピュータにより実行される信号処理方法であって、
ユーザの第1頭部特性を示す頭部インパルス応答を取得することと、
前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得することと、
前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成することと、
作成した前記合成バイノーラルルームインパルス応答を出力することと、
を含む信号処理方法。
【請求項2】
前記合成バイノーラルルームインパルス応答の作成は、
前記バイノーラルルームインパルス応答の波形及び前記頭部インパルス応答の波形をトリミングすることと、
前記頭部インパルス応答の前記直接音成分の終端期間において、前記頭部インパルス応答と前記バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、
前記置換時刻以前の前記バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分に置換することと、
を含む、
請求項1記載の信号処理方法。
【請求項3】
前記トリミングは、前記バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記バイノーラルルームインパルス応答の波形及び前記頭部インパルス応答の波形をトリミングすることを含む、
請求項2記載の信号処理方法。
【請求項4】
前記終端期間は、1.5msecから2.5msecの期間である、
請求項2記載の信号処理方法。
【請求項5】
前記合成バイノーラルルームインパルス応答の作成は、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分の音圧レベルを、前記置換時刻以前の前記バイノーラルルームインパルス応答の前記直接音成分の音圧レベルに応じて変更することをさらに含む、
請求項2記載の信号処理方法。
【請求項6】
前記合成バイノーラルルームインパルス応答の作成は、前記置換時刻以後の前記バイノーラルルームインパルス応答の前記残響音成分の音圧レベルを、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分の音圧レベルに応じて変更することをさらに含む、
請求項2記載の信号処理方法。
【請求項7】
前記合成バイノーラルルームインパルス応答の作成は、
前記バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、
前記バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、
前記バイノーラルルームインパルス応答に前記頭部インパルス応答を畳み込むことと、
を含む、
請求項1記載の信号処理方法。
【請求項8】
前記合成バイノーラルルームインパルス応答の作成は、前記バイノーラルルームインパルス応答の前記直接音成分の終端期間において、前記バイノーラルルームインパルス応答の前記振幅が最も0に近似する置換時刻を特定することをさらに含み、
前記振幅の前記置換は、前記置換時刻以前の前記バイノーラルルームインパルス応答の前記振幅を全て0に置換することを含む、
請求項7記載の信号処理方法。
【請求項9】
プロセッサを備える信号処理装置であって、
前記プロセッサは、
ユーザの第1頭部特性を示す頭部インパルス応答を取得し、
前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得し、
前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成し、
作成した前記合成バイノーラルルームインパルス応答を出力する、
信号処理装置。
【請求項10】
ユーザの第1頭部特性を示す頭部インパルス応答を取得し、
前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得し、
前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成し、
作成した前記合成バイノーラルルームインパルス応答を出力するようにコンピュータを機能させる、
信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音像をユーザの頭外に定位させる技術に関する。
【背景技術】
【0002】
例えば、特許文献1には、ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された、第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する合成部を備える信号処理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第7384162号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の技術では、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することが困難であり、更なる改善が必要とされていた。
【0005】
本開示は、上記の問題を解決するためになされたもので、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができる技術を提供することを目的とするものである。
【課題を解決するための手段】
【0006】
本開示の一態様に係る信号処理方法は、コンピュータにより実行される信号処理方法であって、ユーザの第1頭部特性を示す頭部インパルス応答を取得することと、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得することと、前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成することと、作成した前記合成バイノーラルルームインパルス応答を出力することと、を含む。
【発明の効果】
【0007】
本開示によれば、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができる。
【図面の簡単な説明】
【0008】
図1】本実施の形態1における信号処理装置の構成を示す図である。
図2】本実施の形態1における合成バイノーラルルームインパルス応答の作成方法を説明するための図である。
図3】本実施の形態1における作成部の構成を示す図である。
図4】本開示の実施の形態1における信号処理装置による処理について説明するためのフローチャートである。
図5】本開示の実施の形態1における作成部による合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
図6】本実施の形態1におけるバイノーラルルームインパルス応答及び頭部インパルス応答の一例を示す図である。
図7】本実施の形態1における合成バイノーラルルームインパルス応答の一例を示す図である。
図8】本実施の形態1において、バイノーラルルームインパルス応答の最大振幅位置と頭部インパルス応答の最大振幅位置とを揃える処理について説明するための図である。
図9】本実施の形態2における信号処理装置の構成を示す図である。
図10】本実施の形態2における作成部の構成を示す図である。
図11】本開示の実施の形態2における作成部による合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
図12】本実施の形態2におけるバイノーラルルームインパルス応答の一例を示す図である。
図13】本実施の形態2において、バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する処理を説明するための図である。
図14】本実施の形態2において、バイノーラルルームインパルス応答の時刻0における振幅を1に設定する処理を説明するための図である。
図15】本実施の形態2における合成バイノーラルルームインパルス応答の一例を示す図である。
【発明を実施するための形態】
【0009】
(本開示の基礎となった知見)
従来、仮想的な三次元空間内(以下、三次元音場という場合がある)で、ユーザの感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている。仮想的な三次元空間内における所定位置に音像を定位させることで、ユーザは、当該所定位置とユーザとを結ぶ直線に平行な方向(すなわち所定方向)から到達する音であるかのごとく、この音を知覚することができる。このように仮想的な三次元空間内の所定位置に音像を定位させるには、例えば、収音された音に対して、立体的な音として知覚されるような両耳間での音の到達時間差、及び、両耳間での音のレベル差(又は音圧差)などを生じさせる計算処理が必要となる。
【0010】
ここで、近年、通信回線を利用して映像と音声とを双方向に送受信して通信相手とコミュニケーションをとるといった、いわゆるオンライン会議システムが盛んに利用されている。このようなオンライン会議システムでは、ヘッドホンなどの頭部装着型の音響再生装置が用いられることも多い。上記のようなオンライン会議システムに代表されるように、音をヘッドホンで受聴するような場合に、当該音を三次元音場に展開してユーザに知覚させることは困難である。通常、ヘッドホンで音を聴く場合、音像が頭内に定位する。そのため、ヘッドホンで音声を聴く場合であっても、音像を頭外に定位させる技術の開発が進められている。
【0011】
一般的に、空間性を持たせた頭外定位の音像再現には、所望の音場におけるバイノーラルルームインパルス応答の畳み込みが有効とされている。バイノーラルルームインパルス応答を得るためには、所望の頭部特性と所望の音場の空間特性とが揃った条件で測定する必要がある。しかしながら、頭部特性はユーザ毎に異なり、空間特性も音場毎に異なるため、所望の条件のバイノーラルルームインパルス応答を得るには、非常に手間がかかる。
【0012】
上記の従来技術では、周波数領域における信号処理であり、時間領域における信号処理ではない。また、従来技術の目的は、再生帯域が狭いデバイスで測定した頭部伝達関数に対して十分な周波数帯域の特性を持つ頭部伝達関数を合成することで、測定した帯域よりも広い特性を持つ頭部伝達関数を再現することが目的であり、空間の特性をもつ残響音成分を頭部伝達関数に付与することが目的ではない。そのため、上記従来の技術では、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することが困難であった。
【0013】
以上の課題を解決するために、下記の技術が開示される。
【0014】
(1)本開示の一態様に係る信号処理方法は、コンピュータにより実行される信号処理方法であって、ユーザの第1頭部特性を示す頭部インパルス応答を取得することと、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得することと、前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成することと、作成した前記合成バイノーラルルームインパルス応答を出力することと、を含む。
【0015】
この構成によれば、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答が作成されるので、擬似的に所望の頭部の特性を含むバイノーラルルームインパルス応答を作成することができ、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができる。
【0016】
(2)上記(1)記載の信号処理方法において、前記合成バイノーラルルームインパルス応答の作成は、前記バイノーラルルームインパルス応答の波形及び前記頭部インパルス応答の波形をトリミングすることと、前記頭部インパルス応答の前記直接音成分の終端期間において、前記頭部インパルス応答と前記バイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定することと、前記置換時刻以前の前記バイノーラルルームインパルス応答の前記直接音成分を、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分に置換することと、を含んでもよい。
【0017】
この構成によれば、バイノーラルルームインパルス応答の直接音成分が、頭部インパルス応答の直接音成分に置換されることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。
【0018】
(3)上記(2)記載の信号処理方法において、前記トリミングは、前記バイノーラルルームインパルス応答の振幅が最大となる時刻と、前記頭部インパルス応答の振幅が最大となる時刻とが一致するように、前記バイノーラルルームインパルス応答の波形及び前記頭部インパルス応答の波形をトリミングすることを含んでもよい。
【0019】
この構成によれば、バイノーラルルームインパルス応答と頭部インパルス応答との時刻を合わせるように、バイノーラルルームインパルス応答に頭部インパルス応答を適切に合成することができる。
【0020】
(4)上記(2)又は(3)記載の信号処理方法において、前記終端期間は、1.5msecから2.5msecの期間であってもよい。
【0021】
この構成によれば、1.5msecから2.5msecの期間において、バイノーラルルームインパルス応答の直接音成分を頭部インパルス応答の直接音成分に置換するための置換時刻を特定することができる。
【0022】
(5)上記(2)~(4)のいずれか1つに記載の信号処理方法において、前記合成バイノーラルルームインパルス応答の作成は、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分の音圧レベルを、前記置換時刻以前の前記バイノーラルルームインパルス応答の前記直接音成分の音圧レベルに応じて変更することをさらに含んでもよい。
【0023】
この構成によれば、頭部インパルス応答の直接音成分の音圧レベルが、バイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更されるので、頭部インパルス応答の直接音成分とバイノーラルルームインパルス応答の残響音成分とを違和感なく合成することができる。
【0024】
(6)上記(2)~(4)のいずれか1つに記載の信号処理方法において、前記合成バイノーラルルームインパルス応答の作成は、前記置換時刻以後の前記バイノーラルルームインパルス応答の前記残響音成分の音圧レベルを、前記置換時刻以前の前記頭部インパルス応答の前記直接音成分の音圧レベルに応じて変更することをさらに含んでもよい。
【0025】
この構成によれば、バイノーラルルームインパルス応答の残響音成分の音圧レベルが、頭部インパルス応答の直接音成分の音圧レベルに応じて変更されるので、頭部インパルス応答の直接音成分とバイノーラルルームインパルス応答の残響音成分とを違和感なく合成することができる。
【0026】
(7)上記(1)記載の信号処理方法において、前記合成バイノーラルルームインパルス応答の作成は、前記バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換することと、前記バイノーラルルームインパルス応答の時刻0における前記振幅を1に設定することと、前記バイノーラルルームインパルス応答に前記頭部インパルス応答を畳み込むことと、を含んでもよい。
【0027】
この構成によれば、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定されたバイノーラルルームインパルス応答に頭部インパルス応答が畳み込まれることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを容易に合成することができる。
【0028】
(8)上記(7)記載の信号処理方法において、前記合成バイノーラルルームインパルス応答の作成は、前記バイノーラルルームインパルス応答の前記直接音成分の終端期間において、前記バイノーラルルームインパルス応答の前記振幅が最も0に近似する置換時刻を特定することをさらに含み、前記振幅の前記置換は、前記置換時刻以前の前記バイノーラルルームインパルス応答の前記振幅を全て0に置換することを含んでもよい。
【0029】
この構成によれば、バイノーラルルームインパルス応答のうちの頭部インパルス応答の直接音成分を合成する位置を決めることができる。
【0030】
また、本開示は、以上のような特徴的な処理を実行する信号処理方法として実現することができるだけでなく、信号処理方法が実行する特徴的な処理に対応する特徴的な構成を備える信号処理装置などとして実現することもできる。また、このような信号処理方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。したがって、以下の他の態様でも、上記の信号処理方法と同様の効果を奏することができる。
【0031】
(9)本開示の他の態様に係る信号処理装置は、プロセッサを備える信号処理装置であって、前記プロセッサは、ユーザの第1頭部特性を示す頭部インパルス応答を取得し、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得し、前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成し、作成した前記合成バイノーラルルームインパルス応答を出力する。
【0032】
(10)本開示の他の態様に係る信号処理プログラムは、ユーザの第1頭部特性を示す頭部インパルス応答を取得し、前記第1頭部特性とは異なる第2頭部特性及び前記ユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答を取得し、前記頭部インパルス応答の直接音成分と、前記バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成し、作成した前記合成バイノーラルルームインパルス応答を出力するようにコンピュータを機能させる。
【0033】
(11)本開示の他の態様に係る非一時的なコンピュータ読み取り可能な記録媒体は、上記(10)記載の信号処理プログラムを記録する。
【0034】
以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。
【0035】
(実施の形態1)
図1は、本実施の形態1における信号処理装置1の構成を示す図である。
【0036】
図1に示す信号処理装置1は、HRIRデータベース11、BRIRデータベース12、HRIR取得部13、BRIR取得部14、作成部15、及び出力部16を備える。
【0037】
信号処理装置1は、例えば、制御プログラムと、当該制御プログラムを実行するプロセッサ又は論理回路等の処理回路と、当該制御プログラムを記憶する内部メモリ又はアクセス可能な外部メモリ等の記録装置と、を備えるコンピュータシステムを少なくとも備える。なお、信号処理装置1は、例えば、処理回路によるハード実装によって、又は、処理回路によるメモリに保持される、若しくは、外部サーバから配信されるソフトウェアプログラムの実行によって、又は、これらハード実装とソフト実装との組み合わせによって実現されてもよい。また、信号処理装置1は、サーバであってもよい。
【0038】
HRIRデータベース11は、人の頭部特性を示す頭部インパルス応答(Head-Related Impulse Response:HRIR)を予め記憶する。頭部伝達関数(Head-Related Transfer Function:HRTF)は、頭部周辺による入射音波の物理特性の変化を周波数領域で表現したものである。頭部インパルス応答は、頭部伝達関数を時間領域で表現したものである。頭部インパルス応答は、無響空間において測定される。そのため、頭部インパルス応答は、直接音成分を含み、残響音成分をほぼ含まない。
【0039】
なお、HRIRデータベース11は、左チャンネル及び右チャンネルそれぞれの頭部インパルス応答を記憶してもよい。また、HRIRデータベース11は、複数の頭部特性に対応する複数の頭部インパルス応答を記憶してもよい。また、HRIRデータベース11は、音が到達する方向とユーザの正面方向とがなす複数の旋回角度に対応する複数の頭部インパルス応答を記憶してもよい。複数の旋回角度は、例えば、360度を、2度毎、5度毎、又は10度毎に分割したそれぞれの角度である。なお、音が到達する方向が0度であり、旋回角度は、音が到達する方向とユーザの正面方向とが時計回りになす角度を示す。
【0040】
BRIRデータベース12は、人の頭部特性及び人がいる空間の空間特性を示すバイノーラルルームインパルス応答(Binaural Room Impulse Response:BRIR)を予め記憶する。バイノーラルルームインパルス応答は、時間領域で表現される。バイノーラルルームインパルス応答は、有響空間において測定される。そのため、バイノーラルルームインパルス応答は、直接音成分と残響音成分とを含む。
【0041】
なお、BRIRデータベース12は、左チャンネル及び右チャンネルそれぞれのバイノーラルルームインパルス応答を記憶してもよい。また、BRIRデータベース12は、複数の空間特性に対応する複数のバイノーラルルームインパルス応答を記憶してもよい。例えば、BRIRデータベース12は、複数の空間の大きさ毎に複数のバイノーラルルームインパルス応答を記憶してもよい。また、BRIRデータベース12は、音が到達する方向とユーザの正面方向とがなす複数の旋回角度に対応する複数のバイノーラルルームインパルス応答を記憶してもよい。複数の旋回角度は、例えば、360度を、2度毎、5度毎、又は10度毎に分割したそれぞれの角度である。なお、音が到達する方向が0度であり、旋回角度は、音が到達する方向とユーザの正面方向とが時計回りになす角度を示す。
【0042】
HRIR取得部13は、ユーザの第1頭部特性を示す頭部インパルス応答をHRIRデータベース11から取得する。なお、HRIR取得部13によって取得される頭部インパルス応答は、受聴者であるユーザ自身の外耳道入り口に装着された測定機器により測定されてもよいし、ユーザに近い頭部特性を有する人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0043】
BRIR取得部14は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答をBRIRデータベース12から取得する。BRIR取得部14によって取得されるバイノーラルルームインパルス応答は、受聴者であるユーザがいる空間の空間特性に近い空間特性を有する空間において、ユーザとは異なる人物の外耳道入り口に装着された測定機器又はダミーヘッドに装着された測定機器により測定されてもよい。
【0044】
作成部15は、HRIR取得部13によって取得された頭部インパルス応答の直接音成分と、BRIR取得部14によって取得されたバイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成する。
【0045】
出力部16は、作成部15によって作成された合成バイノーラルルームインパルス応答を出力する。
【0046】
ここで、本実施の形態1において作成される合成バイノーラルルームインパルス応答について説明する。
【0047】
図2は、本実施の形態1における合成バイノーラルルームインパルス応答の作成方法を説明するための図である。図2では、左チャンネル(L)及び右チャンネル(R)それぞれの合成バイノーラルルームインパルス応答が示されている。
【0048】
図2に示すように、作成部15は、頭部インパルス応答の直接音成分201L,201Rと、バイノーラルルームインパルス応答の残響音成分202L,202Rとを合成する。これにより、作成部15は、合成バイノーラルルームインパルス応答203L,203Rを作成する。
【0049】
図3は、本実施の形態1における作成部15の構成を示す図である。
【0050】
図3に示す作成部15は、ピーク位置補正部151、特定部152、直接音成分置換部153、及び音圧レベル変更部154を備える。
【0051】
ピーク位置補正部151は、バイノーラルルームインパルス応答の波形及び頭部インパルス応答の波形をトリミングする。このとき、ピーク位置補正部151は、バイノーラルルームインパルス応答の振幅が最大となる時刻と、頭部インパルス応答の振幅が最大となる時刻とが一致するように、バイノーラルルームインパルス応答の波形及び頭部インパルス応答の波形をトリミングする。
【0052】
特定部152は、頭部インパルス応答の直接音成分の終端期間において、頭部インパルス応答とバイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定する。すなわち、特定部152は、頭部インパルス応答の直接音成分の終端期間において、頭部インパルス応答の振幅の絶対値とバイノーラルルームインパルス応答の振幅の絶対値との差が最小となる置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。
【0053】
直接音成分置換部153は、置換時刻以前のバイノーラルルームインパルス応答の直接音成分を、置換時刻以前の頭部インパルス応答の直接音成分に置換する。これにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。
【0054】
音圧レベル変更部154は、置換時刻以前の頭部インパルス応答の直接音成分の音圧レベルを、置換時刻以前のバイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更する。
【0055】
具体的には、音圧レベル変更部154は、置換時刻以前の頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前のバイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。音圧レベル変更部154は、バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値と、頭部インパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を、頭部インパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。音圧レベル変更部154は、算出した比率を頭部インパルス応答の直接音成分の音圧レベルに乗算する。これにより、置換時刻以前の頭部インパルス応答の直接音成分の音圧レベルが、置換時刻以前のバイノーラルルームインパルス応答の直接音成分の音圧レベルに揃えられる。
【0056】
なお、音圧レベル変更部154は、置換時刻以後のバイノーラルルームインパルス応答の残響音成分の音圧レベルを、置換時刻以前の頭部インパルス応答の直接音成分の音圧レベルに応じて変更してもよい。
【0057】
具体的には、音圧レベル変更部154は、置換時刻以前の頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を算出するとともに、置換時刻以前のバイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値を算出する。音圧レベル変更部154は、頭部インパルス応答の直接音成分のA特性音圧レベルの平均値と、バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値との比率を算出する。比率は、頭部インパルス応答の直接音成分のA特性音圧レベルの平均値を、バイノーラルルームインパルス応答の直接音成分のA特性音圧レベルの平均値で除算することにより算出される。音圧レベル変更部154は、算出した比率を置換時刻以後のバイノーラルルームインパルス応答の残響音成分の音圧レベルに乗算する。これにより、置換時刻以後のバイノーラルルームインパルス応答の残響音成分の音圧レベルが、置換時刻以前の頭部インパルス応答の直接音成分の音圧レベルに揃えられる。
【0058】
続いて、本開示の実施の形態1における信号処理装置1による処理について説明する。
【0059】
図4は、本開示の実施の形態1における信号処理装置1による処理について説明するためのフローチャートである。
【0060】
まず、ステップS1において、HRIR取得部13は、ユーザの第1頭部特性を示す頭部インパルス応答をHRIRデータベース11から取得する。なお、HRIR取得部13は、左チャンネルの頭部インパルス応答及び右チャンネルの頭部インパルス応答を取得してもよい。
【0061】
次に、ステップS2において、BRIR取得部14は、第1頭部特性とは異なる第2頭部特性及びユーザがいる空間の空間特性を示すバイノーラルルームインパルス応答をBRIRデータベース12から取得する。なお、BRIR取得部14は、左チャンネルのバイノーラルルームインパルス応答及び右チャンネルのバイノーラルルームインパルス応答を取得してもよい。
【0062】
次に、ステップS3において、作成部15は、HRIR取得部13によって取得された頭部インパルス応答の直接音成分と、BRIR取得部14によって取得されたバイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成する合成バイノーラルルームインパルス応答作成処理を実行する。なお、合成バイノーラルルームインパルス応答作成処理については、図5を用いて後述する。また、作成部15は、左チャンネルの合成バイノーラルルームインパルス応答及び右チャンネルの合成バイノーラルルームインパルス応答を作成してもよい。
【0063】
次に、ステップS4において、出力部16は、合成バイノーラルルームインパルス応答を出力する。なお、出力部16は、左チャンネルの合成バイノーラルルームインパルス応答及び右チャンネルの合成バイノーラルルームインパルス応答を出力してもよい。
【0064】
なお、出力された合成バイノーラルルームインパルス応答は、再生音信号に畳み込まれる。合成バイノーラルルームインパルス応答が畳み込まれた再生音信号が、ユーザが装着するヘッドホン又はイヤホンによって再生される。これにより、ユーザは、再生音を三次元音場上における所定方向から到達する音として知覚することができ、再生音の音像を頭外の所定位置に定位させることができる。
【0065】
このように、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答が作成されるので、擬似的に所望の頭部の特性を含むバイノーラルルームインパルス応答を作成することができ、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができる。
【0066】
続いて、図4のステップS3の合成バイノーラルルームインパルス応答作成処理について説明する。
【0067】
図5は、本開示の実施の形態1における作成部15による合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【0068】
まず、ステップS11において、ピーク位置補正部151は、バイノーラルルームインパルス応答の振幅が最大となる時刻と、頭部インパルス応答の振幅が最大となる時刻とが一致するように、バイノーラルルームインパルス応答の波形及び頭部インパルス応答の波形をトリミングする。
【0069】
次に、ステップS12において、特定部152は、頭部インパルス応答の直接音成分の終端期間において、頭部インパルス応答とバイノーラルルームインパルス応答との音圧差が最小となる置換時刻を特定する。
【0070】
次に、ステップS13において、直接音成分置換部153は、置換時刻以前のバイノーラルルームインパルス応答の直接音成分を、置換時刻以前の頭部インパルス応答の直接音成分に置換する。これにより、直接音成分置換部153は、置換時刻以前の頭部インパルス応答の直接音成分と、置換時刻以後のバイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成する。
【0071】
次に、ステップS14において、音圧レベル変更部154は、置換時刻以前の頭部インパルス応答の直接音成分の音圧レベルを、置換時刻以前のバイノーラルルームインパルス応答の直接音成分の音圧レベルに応じて変更する。
【0072】
なお、頭部の複数の旋回角度毎に合成バイノーラルルームインパルス応答が作成される場合、音圧レベル変更部154は、音が到達する所定方向(0度)に対応する合成バイノーラルルームインパルス応答を作成する際に算出された比率を用いて、他の旋回角度に対応する頭部インパルス応答の直接音成分の音圧レベル又はバイノーラルルームインパルス応答の残響音成分の音圧レベルを変更してもよい。
【0073】
以上の合成バイノーラルルームインパルス応答作成処理により、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答が作成される。
【0074】
なお、上記の合成バイノーラルルームインパルス応答作成処理では、左チャンネル及び右チャンネルのそれぞれに対して合成バイノーラルルームインパルス応答が作成されてもよい。また、頭部の複数の旋回角度毎に合成バイノーラルルームインパルス応答が作成されてもよい。また、音が到達する方向に対するユーザの頭部の正面方向の旋回角度が取得された場合、取得された旋回角度に対応する合成バイノーラルルームインパルス応答が作成されてもよい。
【0075】
このように、バイノーラルルームインパルス応答の直接音成分が、頭部インパルス応答の直接音成分に置換されることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成することができる。
【0076】
また、バイノーラルルームインパルス応答の直接音成分は頭部特性を含み、バイノーラルルームインパルス応答の残響音成分は空間特性を含む。バイノーラルルームインパルス応答の残響音成分にも頭部特性は含まれるが、その影響はかなり小さい。そのため、所望の空間特性を含むバイノーラルルームインパルス応答の直接音成分を、所望の頭部特性を含む頭部インパルス応答の直接音成分に置換することにより、所望の頭部特性及び所望の空間特性を含むバイノーラルルームインパルス応答を疑似的に再現することができる。
【0077】
図6は、本実施の形態1におけるバイノーラルルームインパルス応答及び頭部インパルス応答の一例を示す図である。
【0078】
図6において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、バイノーラルルームインパルス応答211L,211Rを示し、破線は、頭部インパルス応答212L,212Rを示す。図6の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルのバイノーラルルームインパルス応答211L及び頭部インパルス応答212Lを示し、図6の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルのバイノーラルルームインパルス応答211R及び頭部インパルス応答212Rを示している。
【0079】
図6に示すように、ピーク位置補正部151は、バイノーラルルームインパルス応答211L,211Rの振幅が最大となる時刻と、頭部インパルス応答212L,212Rの振幅が最大となる時刻とが一致するように、バイノーラルルームインパルス応答211L,211Rの波形及び頭部インパルス応答212L,212Rの波形をトリミングする。
【0080】
具体的には、ピーク位置補正部151は、バイノーラルルームインパルス応答及び頭部インパルス応答それぞれの角度0度における左右の最大振幅位置の平均時刻t_b,t_hを算出する。そして、ピーク位置補正部151は、バイノーラルルームインパルス応答の平均時刻t_bと頭部インパルス応答の平均時刻t_hとが一致するように、バイノーラルルームインパルス応答及び頭部インパルス応答のいずれか一方を信号処理する。
【0081】
すなわち、t_b=t_hであれば、ピーク位置補正部151は、信号処理を行わない。
【0082】
また、t_b<t_hであれば、ピーク位置補正部151は、t_b=t_hとなるように、バイノーラルルームインパルス応答の冒頭に0を付加する。あるいは、ピーク位置補正部151は、t_b=t_hとなるように、頭部インパルス応答の冒頭をカットする。
【0083】
また、t_b>t_hであれば、ピーク位置補正部151は、t_b=t_hとなるように、頭部インパルス応答の冒頭に0を付加する。あるいは、ピーク位置補正部151は、t_b=t_hとなるように、バイノーラルルームインパルス応答の冒頭をカットする。
【0084】
また、特定部152は、頭部インパルス応答212L,212Rの直接音成分の終端期間(例えば、1.5msec~2.0msec)において、頭部インパルス応答212L,212Rとバイノーラルルームインパルス応答211L,211Rとの音圧差が最小となる置換時刻213L,213Rを特定する。
【0085】
置換時刻213L,213R以前が直接音成分を示し、置換時刻213L,213R以後が残響音成分を示す。図6において、四角の枠で囲まれた部分が、バイノーラルルームインパルス応答211L,211R及び頭部インパルス応答212L,212Rの直接音成分を示している。直接音成分置換部153は、置換時刻213L,213R以前のバイノーラルルームインパルス応答211L,211Rの直接音成分を、置換時刻213L,213R以前の頭部インパルス応答212L,212Rの直接音成分に置換する。
【0086】
図7は、本実施の形態1における合成バイノーラルルームインパルス応答の一例を示す図である。
【0087】
図7において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、合成バイノーラルルームインパルス応答214L,214Rを示し、破線は、バイノーラルルームインパルス応答211L,211Rを示す。図7の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの合成バイノーラルルームインパルス応答214Lを示し、図7の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの合成バイノーラルルームインパルス応答214Rを示している。
【0088】
合成バイノーラルルームインパルス応答214L,214Rは、バイノーラルルームインパルス応答211L,211Rの直接音成分が、頭部インパルス応答212L,212Rの直接音成分に置換されることにより、作成される。そのため、合成バイノーラルルームインパルス応答214L,214Rは、頭部インパルス応答212L,212Rの直接音成分と、バイノーラルルームインパルス応答211L,211Rの残響音成分とで構成される。
【0089】
また、図7に示すように、音圧レベル変更部154は、頭部インパルス応答212L,212Rの直接音成分に対応する合成バイノーラルルームインパルス応答214L,214Rの直接音成分の音圧レベルを、バイノーラルルームインパルス応答211L,211Rの直接音成分の音圧レベルに応じて変更する。これにより、図7に示す合成バイノーラルルームインパルス応答214L,214Rの直接音成分の振幅は、図6に示す頭部インパルス応答212L,212Rの直接音成分の振幅より小さくなっている。
【0090】
図8は、本実施の形態1において、バイノーラルルームインパルス応答の最大振幅位置と頭部インパルス応答の最大振幅位置とを揃える処理について説明するための図である。
【0091】
図8において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、バイノーラルルームインパルス応答を示し、破線は、頭部インパルス応答を示す。図8の上から1番目及び3番目の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルのバイノーラルルームインパルス応答及び頭部インパルス応答を示し、図8の上から2番目及び4番目の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルのバイノーラルルームインパルス応答及び頭部インパルス応答を示している。
【0092】
図8に示すように、左チャンネルのバイノーラルルームインパルス応答の最大振幅位置と右チャンネルのバイノーラルルームインパルス応答の最大振幅位置とが異なるとともに、左チャンネルの頭部インパルス応答の最大振幅位置と右チャンネルの頭部インパルス応答の最大振幅位置とが異なる場合がある。
【0093】
そこで、ピーク位置補正部151は、左チャンネルのバイノーラルルームインパルス応答の振幅が最大となる時刻と、右チャンネルのバイノーラルルームインパルス応答の振幅が最大となる時刻との平均時刻を算出するとともに、左チャンネルの頭部インパルス応答の振幅が最大となる時刻と、右チャンネルの頭部インパルス応答の振幅が最大となる時刻との平均時刻を算出してもよい。そして、ピーク位置補正部151は、バイノーラルルームインパルス応答の振幅が最大となる平均時刻と、頭部インパルス応答の振幅が最大となる平均時刻とが一致するように、バイノーラルルームインパルス応答の波形及び頭部インパルス応答の波形をトリミングしてもよい。
【0094】
さらに、ピーク位置補正部151は、左チャンネルのバイノーラルルームインパルス応答の最大振幅と、右チャンネルのバイノーラルルームインパルス応答の最大振幅との平均最大振幅を算出するとともに、左チャンネルの頭部インパルス応答の最大振幅と、右チャンネルの頭部インパルス応答の最大振幅との平均最大振幅を算出してもよい。そして、ピーク位置補正部151は、頭部インパルス応答の平均最大振幅と、バイノーラルルームインパルス応答の平均最大振幅との比率を算出してもよい。比率は、頭部インパルス応答の平均最大振幅を、バイノーラルルームインパルス応答の平均最大振幅で除算することにより算出される。そして、ピーク位置補正部151は、算出した比率をバイノーラルルームインパルス応答に乗算してもよい。これにより、バイノーラルルームインパルス応答の振幅が、頭部インパルス応答の振幅に揃えられる。
【0095】
なお、ピーク位置補正部151は、バイノーラルルームインパルス応答の平均最大振幅と、頭部インパルス応答の平均最大振幅との比率を算出してもよい。比率は、バイノーラルルームインパルス応答の平均最大振幅を、頭部インパルス応答の平均最大振幅で除算することにより算出される。そして、ピーク位置補正部151は、算出した比率を頭部インパルス応答に乗算してもよい。これにより、頭部インパルス応答の振幅が、バイノーラルルームインパルス応答の振幅に揃えられる。
【0096】
(実施の形態2)
実施の形態1では、バイノーラルルームインパルス応答の直接音成分を、頭部インパルス応答の直接音成分に置換することにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。これに対し、実施の形態2では、直接音成分の振幅が全て0に置換されたバイノーラルルームインパルス応答に頭部インパルス応答が畳み込まれることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。
【0097】
図9は、本実施の形態2における信号処理装置1Aの構成を示す図である。
【0098】
図9に示す信号処理装置1Aは、HRIRデータベース11、BRIRデータベース12、HRIR取得部13、BRIR取得部14、作成部15A、及び出力部16を備える。なお、本実施の形態2において、実施の形態1と同じ構成については同じ符号を付し、説明を省略する。
【0099】
信号処理装置1Aは、例えば、制御プログラムと、当該制御プログラムを実行するプロセッサ又は論理回路等の処理回路と、当該制御プログラムを記憶する内部メモリ又はアクセス可能な外部メモリ等の記録装置と、を備えるコンピュータシステムを少なくとも備える。なお、信号処理装置1Aは、例えば、処理回路によるハード実装によって、又は、処理回路によるメモリに保持される、若しくは、外部サーバから配信されるソフトウェアプログラムの実行によって、又は、これらハード実装とソフト実装との組み合わせによって実現されてもよい。また、信号処理装置1Aは、サーバであってもよい。
【0100】
作成部15Aは、HRIR取得部13によって取得された頭部インパルス応答の直接音成分と、BRIR取得部14によって取得されたバイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答を作成する。
【0101】
図10は、本実施の形態2における作成部15Aの構成を示す図である。
【0102】
図10に示す作成部15Aは、特定部161、振幅置換部162、振幅設定部163、及び畳み込み部164を備える。
【0103】
特定部161は、バイノーラルルームインパルス応答の直接音成分の終端期間において、バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。終端期間は、例えば、1.5msecから2.0msecの期間である。なお、終端期間は、例えば、2.0msecから2.5msecの期間であってもよい。また、終端期間は、1.5msecから2.5msecの間の任意の期間であってもよい。また、測定環境における音源とマイクロホンとの位置に基づいて直接音が伝播される時間が算出され、算出された伝播時間に基づいて終端期間が決定されてもよい。サンプリングした時刻によっては、必ずしも振幅が0になるとは限らない。そのため、特定部161は、バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。
【0104】
振幅置換部162は、バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する。すなわち、振幅置換部162は、特定部161によって特定された置換時刻以前のバイノーラルルームインパルス応答の振幅を全て0に置換する。
【0105】
振幅設定部163は、振幅置換部162によって直接音成分の振幅が全て0に置換されたバイノーラルルームインパルス応答の時刻0における振幅を1に設定する。バイノーラルルームインパルス応答の時刻0における振幅が1に設定されることにより、バイノーラルルームインパルス応答に頭部インパルス応答が畳み込まれた際に、バイノーラルルームインパルス応答に頭部インパルス応答の直接音成分が現れる。
【0106】
畳み込み部164は、振幅設定部163によって時刻0における振幅が1に設定されたバイノーラルルームインパルス応答に頭部インパルス応答を畳み込む。これにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とが合成される。
【0107】
なお、本開示の実施の形態2における信号処理装置1Aによる処理は、図4に示す実施の形態1における信号処理装置1による処理と同じであり、ステップS3の合成バイノーラルルームインパルス応答作成処理のみが異なる。そのため、以下の説明では、本実施の形態2における合成バイノーラルルームインパルス応答作成処理について説明する。
【0108】
図11は、本開示の実施の形態2における作成部15Aによる合成バイノーラルルームインパルス応答作成処理について説明するためのフローチャートである。
【0109】
まず、ステップS21において、特定部161は、バイノーラルルームインパルス応答の直接音成分の終端期間において、バイノーラルルームインパルス応答の振幅が最も0に近似する置換時刻を特定する。
【0110】
次に、ステップS22において、振幅置換部162は、特定部161によって特定された置換時刻以前のバイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する。
【0111】
次に、ステップS23において、振幅設定部163は、振幅置換部162によって直接音成分の振幅が全て0に置換されたバイノーラルルームインパルス応答の時刻0における振幅を1に設定する。
【0112】
次に、ステップS24において、畳み込み部164は、振幅設定部163によって時刻0における振幅が1に設定されたバイノーラルルームインパルス応答に頭部インパルス応答を畳み込む。
【0113】
以上の合成バイノーラルルームインパルス応答作成処理により、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成した合成バイノーラルルームインパルス応答が作成される。
【0114】
なお、上記の合成バイノーラルルームインパルス応答作成処理では、左チャンネル及び右チャンネルのそれぞれに対して合成バイノーラルルームインパルス応答が作成されてもよい。また、頭部の複数の旋回角度毎に合成バイノーラルルームインパルス応答が作成されてもよい。また、音が到達する方向に対するユーザの頭部の正面方向の旋回角度が取得された場合、取得された旋回角度に対応する合成バイノーラルルームインパルス応答が作成されてもよい。
【0115】
このように、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定されたバイノーラルルームインパルス応答に頭部インパルス応答が畳み込まれることにより、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答の残響音成分とを合成することができる。
【0116】
図12は、本実施の形態2におけるバイノーラルルームインパルス応答の一例を示す図である。
【0117】
図12において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、バイノーラルルームインパルス応答221L,221Rを示す。図12の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルのバイノーラルルームインパルス応答221Lを示し、図12の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルのバイノーラルルームインパルス応答221Rを示している。
【0118】
図12に示すように、特定部161は、バイノーラルルームインパルス応答221L,221Rの直接音成分の終端期間(例えば、1.5msec~2.0msec)において、バイノーラルルームインパルス応答221L,221Rの振幅が最も0に近似する置換時刻223L,223Rを特定する。
【0119】
図13は、本実施の形態2において、バイノーラルルームインパルス応答の直接音成分の振幅を全て0に置換する処理を説明するための図である。
【0120】
図13において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、バイノーラルルームインパルス応答221L,221Rを示す。図13の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルのバイノーラルルームインパルス応答221Lを示し、図13の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルのバイノーラルルームインパルス応答221Rを示している。
【0121】
図13に示すように、振幅置換部162は、置換時刻223L,223R以前のバイノーラルルームインパルス応答221L,221Rの直接音成分の振幅を全て0に置換する。
【0122】
図14は、本実施の形態2において、バイノーラルルームインパルス応答の時刻0における振幅を1に設定する処理を説明するための図である。
【0123】
図14において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、バイノーラルルームインパルス応答221L,221Rを示す。図14の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルのバイノーラルルームインパルス応答221Lを示し、図14の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルのバイノーラルルームインパルス応答221Rを示している。
【0124】
図14に示すように、振幅設定部163は、振幅置換部162によって直接音成分の振幅が全て0に置換されたバイノーラルルームインパルス応答221L,221Rの時刻0.0における振幅を1.0に設定する。
【0125】
図15は、本実施の形態2における合成バイノーラルルームインパルス応答の一例を示す図である。
【0126】
図15において、縦軸は振幅を示し、横軸は時間(msec)を示し、実線は、合成バイノーラルルームインパルス応答224L,224Rを示す。図15の左側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における左チャンネルの合成バイノーラルルームインパルス応答224Lを示し、図15の右側の波形図は、音が到達する所定方向(0度)がユーザの正面方向と一致する場合における右チャンネルの合成バイノーラルルームインパルス応答224Rを示している。
【0127】
合成バイノーラルルームインパルス応答224L,224Rは、直接音成分の振幅が全て0に置換されるとともに時刻0における振幅が1に設定されたバイノーラルルームインパルス応答221L,221Rに、頭部インパルス応答が畳み込まれることにより、作成される。そのため、合成バイノーラルルームインパルス応答224L,224Rは、頭部インパルス応答の直接音成分と、バイノーラルルームインパルス応答221L,221Rの残響音成分とで構成される。
【0128】
なお、本開示の実施の形態に係る装置の機能の一部又は全てを、CPU等のプロセッサがプログラムを実行することにより実現してもよい。
【0129】
また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。
【0130】
また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。
【産業上の利用可能性】
【0131】
本開示に係る技術は、所望の頭部の特性及び所望の空間の特性を含むバイノーラルルームインパルス応答を作成することができるので、音像をユーザの頭外に定位させる技術として有用である。
【符号の説明】
【0132】
1,1A 信号処理装置
11 HRIRデータベース
12 BRIRデータベース
13 HRIR取得部
14 BRIR取得部
15,15A 作成部
16 出力部
151 ピーク位置補正部
152 特定部
153 音成分置換部
154 音圧レベル変更部
161 特定部
162 振幅置換部
163 振幅設定部
164 畳み込み部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15