(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022190624
(43)【公開日】2022-12-26
(54)【発明の名称】インパルス応答生成装置及びインパルス応答生成プログラム
(51)【国際特許分類】
G10K 15/00 20060101AFI20221219BHJP
【FI】
G10K15/00 Z
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021099052
(22)【出願日】2021-06-14
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(74)【代理人】
【識別番号】100185225
【弁理士】
【氏名又は名称】齋藤 恭一
(72)【発明者】
【氏名】西口 敏行
(72)【発明者】
【氏名】大久保 洋幸
(72)【発明者】
【氏名】佐々木 陽
(57)【要約】
【課題】インパルス応答の初期反射音と後部残響音の境目を自動的に弁別し、一つのインパルス応答から、類似した音色を持ち互いに相関の低いインパルス応答を多数生成する。
【解決手段】インパルス応答を初期反射音と後部残響音とに分離する信号分離部と、所定時間長の時間窓を複数回シフトして得られる窓関数を前記初期反射音及び前記後部残響音に乗ずる時間窓乗算部と、時間シフト量を乱数により発生させる乱数発生部と、前記時間シフト量に基づき、前記時間窓毎に、前記初期反射音と前記後部残響音をそれぞれ時間シフトする時間シフト部と、時間シフトされた前記初期反射音及び前記後部残響音を加算する信号加算部と、を備えるインパルス応答生成装置において、前記信号分離部は前記インパルス応答の減衰曲線の所定の区間に含まれる変曲点に基づき前記インパルス応答を前記初期反射音と前記後部残響音とに分離することを特徴とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
インパルス応答を初期反射音と後部残響音とに分離する信号分離部と、
前記初期反射音に適した所定時間長の第1時間窓を複数回シフトして得られる第1窓関数を前記初期反射音に乗ずる第1時間窓乗算部、及び前記後部残響音に適した所定時間長の第2時間窓を複数回シフトして得られる第2窓関数を前記後部残響音に乗ずる第2時間窓乗算部と、
前記初期反射音に適した分布幅に基づいて第1時間シフト量を乱数により発生させる第1乱数発生部、及び前記後部残響音に適した分布幅に基づいて第2時間シフト量を乱数により発生させる第2乱数発生部と、
前記第1時間シフト量に基づき、前記第1時間窓毎に、前記初期反射音に関する前記第1時間窓乗算部の出力を前記初期反射音の時間範囲内で時間シフトする第1時間シフト部、及び前記第2時間シフト量に基づき、前記第2時間窓毎に、前記後部残響音に関する前記第2時間窓乗算部の出力を前記後部残響音の時間範囲内で時間シフトする第2時間シフト部と、
前記初期反射音に関する前記第1時間シフト部の出力と前記後部残響音に関する前記第2時間シフト部の出力を加算する信号加算部と、
を備え、前記信号分離部は前記インパルス応答の減衰曲線の所定の区間に含まれる変曲点に基づき前記インパルス応答を前記初期反射音と前記後部残響音とに分離することを特徴とするインパルス応答生成装置。
【請求項2】
請求項1に記載のインパルス応答生成装置であって、
さらに、前記初期反射音に関する前記第1時間窓乗算部及び前記後部残響音に関する前記第2時間窓乗算部の少なくとも一方の出力について、時間窓単位のブロックを複数選択してこれらを削除又は時間窓単位のブロックを複数選択してそれぞれを複製して時間長を変更する時間設定部を備え、
前記第1時間シフト部は、前記第1時間シフト量に基づき、前記第1時間窓毎に、前記初期反射音に関する前記時間設定部の出力を前記初期反射音の時間範囲内で時間シフトし、前記第2時間シフト部は、前記第2時間シフト量に基づき、前記第2時間窓毎に、前記後部残響音に関する前記時間設定部の出力を前記後部残響音の時間範囲内で時間シフトすることを特徴とするインパルス応答生成装置。
【請求項3】
請求項1又は2に記載のインパルス応答生成装置であって、
前記信号分離部は、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記時間範囲内で前記評価関数が最大となる時刻で前記分離を行うことを特徴とするインパルス応答生成装置。
【請求項4】
請求項1又は2に記載のインパルス応答生成装置であって、
前記信号分離部は、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記時間範囲の時刻の遅い方から前記評価関数を検索し、前記評価関数が、前記時間範囲内の前記評価関数の最大値と所定の閾値係数から求めた閾値を超えた時刻で前記分離を行うことを特徴とするインパルス応答生成装置。
【請求項5】
請求項1又は2に記載のインパルス応答生成装置であって、
前記信号分離部は、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記インパルス応答の残響時間が所定時間未満のときは、前記時間範囲内で前記評価関数が最大となる時間で前記分離を行い、前記インパルス応答の残響時間が所定時間以上のときは、前記時間範囲内で前記評価関数が2番目に大きな値となる時刻で前記分離を行うことを特徴とするインパルス応答生成装置。
【請求項6】
コンピュータを、請求項1乃至5のいずれか一項に記載のインパルス応答生成装置として機能させる、インパルス応答生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、インパルス応答生成装置及びインパルス応答生成プログラムに関し、特に、予め与えられたインパルス応答から、予め与えられたインパルス応答と類似した音色を持ちかつ互いに相関が低いインパルス応答を多数生成する、インパルス応答生成技術に関する。
【背景技術】
【0002】
映画やテレビの音響方式には、従来の2チャンネル(ch)ステレオシステムや5.1chサラウンドに加え、近年は7.1ch、10.2ch、22.2chなどチャンネル数の多いマルチチャンネル音響方式などが採用されている。マルチチャンネル音響のコンテンツ制作では、従来のステレオシステムや5.1chの音響方式と同様、空間の拡がり感や豊かな臨場感を付与するため、残響付加装置が用いられる。
【0003】
残響付加装置には、空間の残響をシミュレーションで模擬したIIR(Infinite impulse response、無限インパルス応答)フィルタ型のものや、実空間で測定したインパルス応答を用いて残響を生成するFIR(Finite impulse response、有限インパルス応答)フィルタ型のものなど、様々なものがあるが、FIRフィルタ型のようにインパルス応答を音源に畳み込んで残響を付加する場合、再生方式のチャンネル数に応じた数のインパルス応答が必要となる。例えば22.2マルチチャンネル音響方式の場合は22ch分のインパルス応答が必要となる。さらに、それらのインパルス応答をコンサートホール等の拡散音場(各到来方向から音色が等しくかつ互いに無相関な音が到来する状態)で測定することを考えると、類似した音色を持ちかつ互いに相関が低いことが求められる。
【0004】
このような多数のインパルス応答を実測により求めることもできるが、互いに充分に離れた点でインパルス応答を測定することが必要となるため、大規模な測定システムと長い測定時間を要することから容易ではない。
【0005】
そこで、与えられた一つのインパルス応答から、類似した音色を持ちかつ互いに相関の低いインパルス応答を多数生成する装置が提案された(例えば特許文献1及び2、非特許文献1及び2を参照)。特許文献1及び2に記載の装置は、インパルス応答を初期反射音部分(直接音が到来後から比較的短い時間内に到達する、床や天井、壁などからの低次回反射で構成される部分)と後部残響音部分(初期反射音に続き、多次回反射を繰り返し、個々の音を分離して聴くことができない部分)とに分離する。そして、インパルス応答の初期反射音部分と後部残響音部分のそれぞれに対し所定の処理を加え、当該処理したインパルス応答の初期反射音部分と後部残響音部分を合成して出力することで、多数のインパルス応答を生成している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第6212336号公報
【特許文献2】特許第6348773号公報
【非特許文献】
【0007】
【非特許文献1】小野一穂、小宮山摂、西口敏行、「共通の音色を持つ多数の残響音の生成法に関する一考察」、日本音響学会春季研究発表会講演論文集2-6-7、1996年、pp. 555-556
【非特許文献2】森千晶、西口敏行、小野一穂、「共通の音色を持つ多数の残響音生成のための初期反射音の処理方法」、日本音響学会春季研究発表会講演論文集2-1-17、2013年、pp. 669-670
【非特許文献3】羽生敏樹、「インパルス応答から求める室内音響指標」、日本音響学会誌69 巻6 号、2013年、pp. 291-296
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1及び2に記載の実施例において、与えられた一つのインパルス応答から、類似した音色を持ちかつ互いに相関の低いインパルス応答を多数生成するには、初期反射音部分と後部残響音部分とで異なる適切な処理パラメータを使い分ける必要がある。そこで、信号分離部10を設けて初期反射音と後部残響音を分離して、別々に処理している。特許文献1及び2の信号分離部10では、入力されたインパルス応答の振幅が所定の閾値を超える範囲の音を初期反射音として扱う、又は、直接音から所定の時間を初期反射音として扱うことで初期反射音と後部残響音を分離するとしているが、前記所定の閾値、所定の時間は、インパルス応答を取得した実音場の音響特性により異なってくるため、ユーザーが生成の元になるインパルス応答の波形を確認して初期反射音と後部残響音の境目を見定め、その時間に基づいて処理を行う必要が生じていた。
【0009】
したがって、上記のような問題点に鑑みてなされた本発明の目的は、インパルス応答の初期反射音と後部残響音の境目(初期反射音の長さ)を自動的に弁別し、与えられた一つのインパルス応答から、類似した音色を持ちかつ互いに相関の低いインパルス応答を多数生成することができるインパルス応答生成装置及びインパルス応答生成プログラムを提供することにある。
【課題を解決するための手段】
【0010】
上記課題を解決するために本発明に係るインパルス応答生成装置は、インパルス応答を初期反射音と後部残響音とに分離する信号分離部と、前記初期反射音に適した所定時間長の第1時間窓を複数回シフトして得られる第1窓関数を前記初期反射音に乗ずる第1時間窓乗算部、及び前記後部残響音に適した所定時間長の第2時間窓を複数回シフトして得られる第2窓関数を前記後部残響音に乗ずる第2時間窓乗算部と、前記初期反射音に適した分布幅に基づいて第1時間シフト量を乱数により発生させる第1乱数発生部、及び前記後部残響音に適した分布幅に基づいて第2時間シフト量を乱数により発生させる第2乱数発生部と、前記第1時間シフト量に基づき、前記第1時間窓毎に、前記初期反射音に関する前記第1時間窓乗算部の出力を前記初期反射音の時間範囲内で時間シフトする第1時間シフト部、及び前記第2時間シフト量に基づき、前記第2時間窓毎に、前記後部残響音に関する前記第2時間窓乗算部の出力を前記後部残響音の時間範囲内で時間シフトする第2時間シフト部と、前記初期反射音に関する前記第1時間シフト部の出力と前記後部残響音に関する前記第2時間シフト部の出力を加算する信号加算部と、を備え、前記信号分離部は前記インパルス応答の減衰曲線の所定の区間に含まれる変曲点に基づき前記インパルス応答を前記初期反射音と前記後部残響音とに分離することを特徴とする。
【0011】
また、前記インパルス応答生成装置は、さらに、前記初期反射音に関する前記第1時間窓乗算部及び前記後部残響音に関する前記第2時間窓乗算部の少なくとも一方の出力について、時間窓単位のブロックを複数選択してこれらを削除又は時間窓単位のブロックを複数選択してそれぞれを複製して時間長を変更する時間設定部を備え、前記第1時間シフト部は、前記第1時間シフト量に基づき、前記第1時間窓毎に、前記初期反射音に関する前記時間設定部の出力を前記初期反射音の時間範囲内で時間シフトし、前記第2時間シフト部は、前記第2時間シフト量に基づき、前記第2時間窓毎に、前記後部残響音に関する前記時間設定部の出力を前記後部残響音の時間範囲内で時間シフトすることが望ましい。
【0012】
また、前記インパルス応答生成装置は、前記信号分離部が、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記時間範囲内で前記評価関数が最大となる時刻で前記分離を行うことが望ましい。
【0013】
また、前記インパルス応答生成装置は、前記信号分離部が、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記時間範囲の時刻の遅い方から前記評価関数を検索し、前記評価関数が、前記時間範囲内の前記評価関数の最大値と所定の閾値係数から求めた閾値を超えた時刻で前記分離を行うことが望ましい。
【0014】
また、前記インパルス応答生成装置は、前記信号分離部が、前記減衰曲線の2階微分の絶対値を評価関数として、前記インパルス応答の残響時間によって前記初期反射音と前記後部残響音とに分離する時間範囲を定め、前記インパルス応答の残響時間が所定時間未満のときは、前記時間範囲内で前記評価関数が最大となる時間で前記分離を行い、前記インパルス応答の残響時間が所定時間以上のときは、前記時間範囲内で前記評価関数が2番目に大きな値となる時刻で前記分離を行うことが望ましい。
【0015】
上記課題を解決するために本発明に係るインパルス応答生成プログラムは、コンピュータを、上記のインパルス応答生成装置として機能させることを特徴とする。
【発明の効果】
【0016】
本発明のインパルス応答生成装置及びインパルス応答生成プログラムによれば、インパルス応答の初期反射音と後部残響音の境目(初期反射音の長さ)を自動的に弁別し、与えられた一つのインパルス応答から、類似した音色を持ちかつ互いに相関の低いインパルス応答を多数生成することができる。
【図面の簡単な説明】
【0017】
【
図1】第1の実施形態に係るインパルス応答生成装置の構成の一例を示す図である。
【
図2】拡散音場の残響音(インパルス応答)を模式的に示した図である。
【
図3】小空間(小ブース)の初期反射音と後部残響音の分離例を示す図である。
【
図4】大空間(コンサートホール)の初期反射音と後部残響音の分離例を示す図である。
【
図5】減衰曲線のサーチ範囲に2つ変曲点をもつ音場の例を示す図である。
【
図6】時間シフトによる新たなインパルス応答生成の概要を示す図である。
【
図7】第2の実施形態に係るインパルス応答生成装置の構成の一例を示す図である。
【
図8】残響時間を短くする場合の処理の概要を示す図である。
【
図9】残響時間を長くする場合の処理の概要を示す図である。
【発明を実施するための形態】
【0018】
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。
【0019】
(第1の実施形態)
図1は、本発明の第1の実施形態に係るインパルス応答生成装置の構成の一例を示す図である。本実施形態に係るインパルス応答生成装置は、インパルス応答を初期反射音と後部残響音とに分離する信号分離部10と、所定時間長の時間窓を複数回シフトして得られる窓関数を初期反射音及び後部残響音に乗ずる時間窓乗算部20と、時間シフト量を乱数により発生させる乱数発生部30と、時間シフト量に基づき時間窓乗算部20の出力を時間シフトする時間シフト部40と、初期反射音及び後部残響音に関する時間シフト部40の出力を加算する信号加算部50と、を備える。インパルス応答生成装置の各機能部10~50は、CPU等の好適なプロセッサや好適な電気回路により構成されるものである。
【0020】
時間窓乗算部20は、第1時間窓乗算部21及び第2時間窓乗算部22を備え、乱数発生部30は、第1乱数発生部31及び第2乱数発生部32を備え、時間シフト部40は、第1時間シフト部41及び第2時間シフト部42を備える。後述のとおり、第1時間窓乗算部21、第1乱数発生部31、及び第1時間シフト部41は、インパルス応答の初期反射音に対して処理を行い、第2時間窓乗算部22、第2乱数発生部32、及び第2時間シフト部42は、インパルス応答の後部残響音に対して処理を行うものである。
【0021】
信号分離部10は、入力されたインパルス応答h(t)を初期反射音e(t)と後部残響音r(t)とに自動的に分離する。当該インパルス応答h(t)は、新たに生成されるインパルス応答h'(t)の基準となるものである。
【0022】
初めに、拡散音場の残響音(インパルス応答)を模式的に示した
図2により、残響音の初期反射音と後部残響音とを概説する。楽器やスピーカなどの音源から発せられた音は、まず直接音として到来する。次に、床や天井、壁によって反射された初期反射音が到来する。初期反射音部では、条件によっては各反射音を他の音から分離して聴くことができる低次回反射で構成される。さらに反射を繰り返した多次回反射音は、直接音から一般に数ms~150ms程度以上遅れた後部残響音として続々と到来する。後部残響音になると反射音密度が急激に高くなり、あらゆる方向から到来する反射音が互いに重なり合って、全体として方向性を持たない拡散音となる。このように残響音は、異なる性質を持つ初期反射音と後部残響音によって構成される。
【0023】
しかしながら、特に実際の音場で測定されたインパルス応答においては、個々の初期反射音も時間的な広がりを持ち、後部残響音や音場の暗騒音も重なってくるため、
図2の模式図の波形のように初期反射音と後部残響音の境界は明確にならない。そこで、信号分離部10で初期反射音と後部残響音を自動的に分離するには、双方の境界となる時間を自動的に定める必要がある。
【0024】
詳細は後述するが、本実施形態では、インパルス応答を所定の形状と時間長の窓関数(時間窓)で切り出した反射音群を,所定の時間長の中でランダムにシフト(並べ替え)することにより、互いに相関の低い多数のインパルス応答を生成する。生成した多数のインパルス応答が、互いに相関が低く、類似した音色の残響音であるためには、時間窓の時間長と反射音群を時間シフト量が重要なパラメータであり、初期反射音と後部残響音の処理においてこれらパラメータの最適値が異なることが、実験で確かめられている(非特許文献1、2)。初期反射音部分は、低次回反射による個々のピークを時間窓で分割し直接音から境界時間まで時間内でシフトする必要がある。このため、本願の信号分離部10は、直接音が到来してから、後部残響音より振幅の大きい主要な低次回反射音の最後の到来時刻近傍までを初期反射音の長さとして自動弁別できることを特徴とする。
【0025】
信号分離部10の動作について説明する。
【0026】
まず、入力されたインパルス応答h(t)から、次式(1)により、シュレーダーの減衰曲線E(t)を求める(非特許文献3)。ただし直接音はt=0で到達しているとする。
【0027】
【0028】
本発明者らは、初期反射音と後部残響音の境界時間では、この減衰曲線E(t)の減衰の傾きが変わることを確認した。このことから、減衰曲線E(t)の変曲点をE(t)の2階微分関数から探る手段を採用する。すなわちE(t)の2階微分の絶対値を次式(2)で求め、この値が最大となる時間を所望の初期反射音の長さt0と定める。
【0029】
【0030】
ただし、E(t)の減衰の傾きは直接音到達の直後や、後部残響音のレベルが暗騒音と同等になるところなど、初期反射音と後部残響音の境界以外の時間でも変わるため、最大値をサーチする時間の範囲を予め定める。初期反射音と後部残響音の境界時間は、室容積の大きな空間では、音源からの音波が反射して受音点に到達するまでの平均行路が長くなるため、その空間の残響時間も境界時間も大きな値となる。一般に初期反射音が到来する時間は直接音到来後、数msから凡そ150msの間とされるが、アリーナな洞窟など大空間では、更に遅れて初期反射音が到来することも考慮し、残響時間TRTとしたときTRTに応じて最大値をサーチする時間範囲を変え、初期反射音の長さt0として弁別する時間の範囲を定める。一例として、次の(3)の条件を初期反射音と後部残響音を分離する時間範囲とし、これを満たす時間範囲で式(2)の最大値をサーチする。
【0031】
【0032】
残響時間TRTは、例えば非特許文献3のT30(30dBレンジの評価により求める残響時間)のとおり、減衰曲線E(t)の初期レベルから-5dB~-35dBまでの評価区間を最小2乗法で直線近似して傾きを求め、その傾きで60dB減衰相当となる時間から求める。
【0033】
実際に測定したインパルス応答は、デジタル処理による離散時間データのため、式(1)に相当する離散時間系の減衰曲線は、次式(4)として求められる(Nは測定の最大範囲)。
【0034】
【0035】
同様に式(2)に相当する減衰曲線の2階差分の絶対値に関する評価関数を、式(5)として定める。
【0036】
【0037】
実測インパルス応答のサンプリング周波数をfsとすると初期反射音の長さt0=n0/fsであって、条件(3)を満たし、式(5)の評価関数の値を最大とするn0を求めれば、t0も定めることが出来る。
【0038】
この方法で、コンサートホールやスタジオの小ブースなどの室内で実測したインパルス応答から初期反射音の長さを弁別した例を示す。
【0039】
図3は、残響時間350ms(T
RT<1sの場合)の小空間の例として小ブースの初期反射音と後部残響音の分離例である。
図3の3つのグラフは、横軸を時間(最大0.25秒で共通)として、上からインパルス応答の時間波形、式(4)から求めた減衰曲線、式(5)から求めた評価関数(減衰曲線の2階差分)である。グラフ中の破線が前述の方法で弁別した初期反射音と後部残響音の境界(初期反射音の長さ)t
0であり、この例ではt
0=10.4ms(10ms~150msの間で評価関数最大となる時刻)である。
【0040】
図4は、残響時間1.7s(T
RT≧1sの場合)の比較的大空間の例としてコンサートホールの初期反射音と後部残響音の分離例である。
図4の3つのグラフは、
図3と同様に、横軸を時間(最大1秒で共通)として、上からインパルス応答の時間波形、式(4)から求めた減衰曲線、式(5)から求めた評価関数である。グラフ中の破線が前述の方法で弁別した初期反射音と後部残響音の境界(初期反射音の長さ)t
0であり、この例ではt
0=78ms(50ms~300msの間で評価関数最大となる時刻)である。
【0041】
図3及び
図4のインパルス応答波形上に示した破線のとおり、主要な初期反射音の最後のピーク部分を弁別できており、これにより、初期反射音と後部残響音の分離が自動的に行えることが示されている。
【0042】
本実施形態では、条件(3)で残響時間を1s未満と以上の2つの場合に分けて、所望の初期反射音と後部残響音の境界(初期反射音の長さ)t0をサーチ(検索)する時間範囲を設定したが、多様な音響空間に対応するために、この場合分けを増やしてもよい。
【0043】
また、きわめて室容積の大きい音場や、容積が大きく異なる複数の部屋がつながった構造の音場では、時間的に大きく遅れて初期反射が到来する場合があり、これにより減衰曲線のサーチ(検索)を行う時間範囲に複数の変曲点が生じる音場がある。例として残響時間が8.6sで、減衰曲線が2つの変曲点を有する例を
図5に示す。サーチする時間範囲の最初の変曲点は点線で示した80ms、2番目の変曲点は一点鎖線で示した99msであり、このように2つの変曲点が生じる音場では、2番目の変曲点を初期反射音と後部残響音の境界と定めたいところである。
【0044】
この場合、条件(3)の初期反射音と後部残響音を分離する時間範囲内での式(5)の評価関数の最大値をE
max、閾値係数をα(0<α<1)としてαの値を適宜定め、式(5)の評価関数をサーチ時間範囲の時刻の遅い方からサーチ(検索)して、閾値α・E
maxを超えた時刻をt
0とすることで、2つ目(遅い時刻)の変曲点をt
0として検出することができる。
図5の例では、α=0.5として300msから時刻前方に50msまで評価関数の値をサーチすると、閾値を超える点として2番目の変曲点の99msを境界t
0として検出できる。この方法は、
図3、
図4のインパルス応答の初期反射音と後部残響音の分離にも適用できる。
【0045】
又は、残響時間TRTによる場合分けを増やし、例えば、残響時間TRTが5秒未満の場合は、前述のとおり、式(5)により残響時間で定めた初期反射音と後部残響音とに分離する時間範囲内で評価関数が最大となる時刻をt0とし、残響時間TRTが5秒以上の場合は、評価関数の値の所定の時間範囲(例えば、50ms ≦ t0 ≦ 300ms)内で、評価関数の値をサーチして2番目に大きな値となる時刻をt0としてもよい。なお、時間範囲内で評価関数の最大値もしくは2番目に大きな値が同値で複数ある場合は、遅い方の時刻をt0として採用することが望ましい。
【0046】
信号分離部10は上述のとおり、インパルス応答h(t)の波形の特徴に基づき、直接音から初期反射音の長さt0までの音を初期反射音e(t)とし、t0以降の音を後部残響音r(t)として、両者を自動的に分離する。そして、信号分離部10は、初期反射音e(t)を第1時間窓乗算部21に出力し、後部残響音r(t)を第2時間窓乗算部22に出力する。
【0047】
これ以降、初期反射音e(t)に対する第1時間窓乗算部21、第1乱数発生部31、及び第1時間シフト部41の処理について詳述する。
【0048】
第1時間窓乗算部21は、所定時間長Twの時間窓We(t)を複数回(k回)シフトして得られる窓関数Wen(t) (n=1,2,…k)を初期反射音e(t)に乗じて出力en(t)=Wen(t)×e(t) (n=1,2,…k)を生成する。なお、時間窓は、窓の乗算による振幅周波数特性の変化の少ないハニング窓を用いることができる。また、窓としてハミング窓、ブラックマン窓等を用いても良い。窓関数Wen(t)が、時間窓We(t)を等間隔Tedでシフトして得られたものである場合、出力en(t)は、式(6)で表される。第1時間窓乗算部21は、出力en(t)を第1時間シフト部41に出力する。
【0049】
【0050】
第1乱数発生部31は、時間シフト量を乱数により発生させる。第1時間シフト部41は、当該時間シフト量に基づき、時間窓毎に、初期反射音e(t)に関する第1時間窓乗算部21の出力en(t)を初期反射音e(t)の時間範囲内で時間シフトして出力e´(t)を生成する。ここで、第1乱数発生部31が発生させる時間シフト量N*(n)を分布幅Nの整数値をとる一様分布の乱数とすると、式(6)で表される出力en(t)を時間シフトした出力e´(t)は次式(7)により表される。
【0051】
【0052】
第1時間シフト部41は、初期反射音e(t)に関する出力en(t)を初期反射音の時間範囲内で時間シフトするため、n+N*(n)が1≦n+N*(n)≦kとなるように制御する。第1時間シフト部41は、e´(t)が初期反射音e(t)の範囲外になった場合は、第1乱数発生部31に再び乱数による時間シフト量を発生させ、初期反射音e(t)の時間範囲内で第1時間窓乗算部21の出力en(t)を時間シフトさせる。第1時間シフト部41は、生成したe´(t)を信号加算部50に出力する。
【0053】
図6は、時間シフトによる新たなインパルス応答生成の概要を示す図である。
図6(a)は、新たなインパルス応答生成の基準となるインパルス応答を示し、窓幅Twの窓関数が所定間隔Tedで配置された窓関数We
n(t)が初期反射音e(t)に対して乗じられている。ここで、ハッチングで示すn番目の窓関数に対応する第1時間窓乗算部21の出力e
n(t)に対し、第1乱数発生部31は、例えば幅N=5の時間シフト量(-2,-1,0,1,2)を乱数により発生させる。第1時間シフト部41は、
図6(b)のとおり、時間シフト量(例えば-1)に基づき、n番目の窓関数に対応する出力e
n(t)を時間シフトする。このように、時間窓毎に第1時間窓乗算部21の出力を乱数に基づき時間シフトすることにより、予め与えられたインパルス応答h(t)の初期反射音e(t)と類似した音色を持ち、かつ互いに相関の低い初期反射音e´(t)を持つインパルス応答h'(t)が生成されることになる。
【0054】
後部残響音r(t)に対する第2時間窓乗算部22、第2乱数発生部32、及び第2時間シフト部42の処理は、それぞれ初期反射音e(t)に対する第1時間窓乗算部21、第1乱数発生部31、及び第1時間シフト部41の処理と同様である。なお、窓関数の長さ(窓幅)や時間シフト量の乱数の範囲(分布幅)等のパラメータ値は、初期反射音e(t)及び後部残響音r(t)それぞれに適した値を個別に設定することができるものである。すなわち、第1時間窓乗算部21では初期反射音に適した所定時間長の第1時間窓とし、第2時間窓乗算部22では後部残響音に適した所定時間長の第2時間窓とし、第1乱数発生部31では初期反射音に適した分布幅に基づいて第1時間シフト量を発生させ、第2乱数発生部32では後部残響音に適した分布幅に基づいて第2時間シフト量を発生させることが望ましい。
【0055】
第2時間窓乗算部22は、所定時間長Trの時間窓Wr(t)を複数個それぞれシフトして得られる窓関数Wrn(t) (n=1,2,…m)を後部残響音r(t)に乗じて出力rn(t) (n=1,2,…m)を生成する。第2乱数発生部32は、時間シフト量を乱数により発生させる。第2時間シフト部42は、当該時間シフト量に基づき、時間窓毎に、後部残響音r(t)に関する第2時間窓乗算部22の出力rn(t)を後部残響音r(t)の時間範囲内で時間シフトして出力r'(t)を生成する。第2時間シフト部42は、r'(t)が後部残響音r(t)の範囲外になる場合は、第2乱数発生部32に再び後部残響音r(t)の範囲内となる時間シフト量を発生させる。第2時間シフト部42は、生成したr'(t)を信号加算部50に出力する。
【0056】
信号加算部50は、初期反射音e(t)に関する第1時間シフト部41の出力e´(t)と、後部残響音r(t)に関する第2時間シフト部42の出力r'(t)とを加算し、新たなインパルス応答h'(t)を生成する。
【0057】
このように、本実施形態によれば、信号分離部10は、インパルス応答を初期反射音と後部残響音とに自動的に分離し、時間窓乗算部20は、所定時間長の時間窓を複数回シフトして得られる窓関数を初期反射音及び後部残響音に乗じ、乱数発生部30は、時間シフト量を乱数により発生させ、時間シフト部40は、時間シフト量に基づき、時間窓毎に、初期反射音に関する第1時間窓乗算部21の出力を初期反射音の時間範囲内で時間シフトし、後部残響音に関する第2時間窓乗算部22の出力を後部残響音の時間範囲内で時間シフトさせ、信号加算部50は、初期反射音及び後部残響音に関する時間シフト部40の出力を加算して新たなインパルス応答を生成する。これにより、予め与えられたインパルス応答と類似した音色を持ち、かつ互いに相関の低いインパルス応答を多数生成することが可能となり、多チャンネル音響方式における残響付加で使用するのに十分な品質のインパルス応答を提供することが可能となる。特に、本実施形態によれば、初期反射音と後部残響音とを正確に自動的に分離し、初期反射音及び後部残響音の相関がそれぞれ低いインパルス応答を多数生成することが可能となり、インパルス応答を畳み込んだ際に同じインパルス応答からは得られない拡がり感を得ることができる。
【0058】
(第2の実施形態)
図7は、本発明の第2の実施形態に係るインパルス応答生成装置の構成の一例を示す図である。本実施形態に係るインパルス応答生成装置は、インパルス応答を初期反射音と後部残響音とに分離する信号分離部10と、所定時間長の時間窓を複数回シフトして得られる窓関数を初期反射音及び後部残響音に乗ずる時間窓乗算部20と、インパルス応答を任意の時間長に変更する時間設定部60と、時間シフト量を乱数により発生させる乱数発生部30と、時間シフト量に基づき時間設定部60の出力を時間シフトする時間シフト部40と、初期反射音及び後部残響音に関する時間シフト部40の出力を加算する信号加算部50と、を備える。インパルス応答生成装置の各機能部10~60は、CPU等の好適なプロセッサや好適な電気回路により構成されるものである。
【0059】
時間窓乗算部20は、第1時間窓乗算部21及び第2時間窓乗算部22を備え、時間設定部60は、第1時間設定部61及び第2時間設定部62を備え、乱数発生部30は、第1乱数発生部31及び第2乱数発生部32を備え、時間シフト部40は、第1時間シフト部41及び第2時間シフト部42を備える。後述のとおり、第1時間窓乗算部21、第1時間設定部61、第1乱数発生部31、及び第1時間シフト部41は、インパルス応答の初期反射音に対して処理を行い、第2時間窓乗算部22、第2時間設定部62、第2乱数発生部32、及び第2時間シフト部42は、インパルス応答の後部残響音に対して処理を行うものである。
【0060】
信号分離部10は、第1の実施形態の信号分離部10と同じ構成であり、入力されたインパルス応答h(t)を初期反射音e(t)と後部残響音r(t)とに自動的に分離する。すなわち、信号分離部10は、まず、入力されたインパルス応答h(t)から、シュレーダーの減衰曲線E(t)を求める。実際のインパルス応答は、デジタル処理による離散時間データのため、離散時間系の減衰曲線を式(4)で求める。次いで、減衰曲線の変曲点を求めるため、減衰曲線の2階差分の絶対値に関する評価関数を式(5)から求める。そして、式(5)の評価関数の値を最大とするn0を求め、初期反射音の長さt0と定める。
【0061】
なお、初期反射音の長さt0を求めるにあたって、残響時間TRTに応じて最大値をサーチする時間範囲を変え、(3)の条件の下で評価関数の最大値をサーチして、初期反射音の長さt0を求めることができる。或いは、条件(3)の初期反射音と後部残響音を分離する時間範囲内での式(5)の評価関数の最大値をEmax、閾値係数をα(0<α<1)としてαの値を適宜定め、式(5)の評価関数をサーチ時間範囲の時刻の遅い方からサーチして、閾値α・Emaxを超えた時刻をt0とすることで、初期反射音の長さt0を求めてもよい。また、残響音TRTが長い場合は、評価関数が2番目に大きな値となる時刻を初期反射音の長さt0としてもよい。
【0062】
このように、信号分離部10は、直接音から初期反射音の長さt0までの音を初期反射音e(t)とし、t0以降の音を後部残響音r(t)として、両者を自動的に分離する。そして、初期反射音e(t)を第1時間窓乗算部21に出力し、後部残響音r(t)を第2時間窓乗算部22に出力する。
【0063】
次いで、初期反射音e(t)に対する第1時間窓乗算部21、第1時間設定部61、第1乱数発生部31、及び第1時間シフト部41の処理について詳述する。
【0064】
第1時間窓乗算部21は、第1の実施形態の第1時間窓乗算部21と同じであり、所定時間長Twの時間窓We(t)を複数回(k回)シフトして得られる窓関数Wen(t) (n=1,2,…k)を初期反射音e(t)に乗じて出力en(t)=Wen(t)×e(t) (n=1,2,…k)を生成する。窓関数Wen(t)が、時間窓We(t)を等間隔Tedでシフトして得られたものである場合、出力en(t)は、式(6)で表される。第1時間窓乗算部21は、出力en(t)を第1時間設定部61に出力する。
【0065】
第1時間設定部61は、入力されたインパルス応答h(t)の初期反射音e(t)(長さt0)に関する第1時間窓乗算部21の出力を時間窓毎に削除又は複製して長さteの新たな初期反射音e'(t)を生成する。第1時間設定部61は、残響時間を短くする場合(te<t0)には、元の初期反射音e(t)の窓関数乗算後のブロックを適宜削除し、また、残響時間を長くする場合(te>t0)には元の初期反射音e(t)の窓関数乗算後のブロックを適宜複製して、新たな初期反射音e'(t)を生成する。削除又は複製の方法については、例えば等間隔のブロックに対して行ってもよいし、ランダムに選択したブロックに対して行ってもよい。また、連続する任意の区間のブロックを削除又は複製してもよい。後述のとおり、新たな初期反射音e'(t)と新たな後部残響音r'(t)とから、残響時間が変更されたインパルス応答h'(t)が生成される。
【0066】
図8は、残響時間を短くする場合の処理の概要を示す図である。初期反射音e(t)をe1~e12とした場合、新たな初期反射音e'(t)は、例えば時間窓単位のブロックe2,e5,e8,e11が削除されたe1,e3,e4,e6,e7,e9,e10,e12により表される。これにより、第1時間設定部61は、元の長さの2/3の長さの新たな初期反射音e'(t)を生成することができる。
【0067】
図9は、残響時間を長くする場合の処理の概要を示す図である。初期反射音e(t)をe1~e12とした場合、新たな初期反射音e'(t)は、例えば時間窓単位のブロックe3,e6,e9,e12が複製されたe1,e2,e3,e3,e4,e5,e6,e6,e7,e8,e9,e9,e10,e11,e12,e12により表される。これにより、第1時間設定部61は元の長さの4/3の長さの新たな初期反射音e'(t)を生成することができる。
【0068】
第1乱数発生部31は、第1の実施形態と同じであり、時間シフト量を乱数により発生させる。ここで、第1乱数発生部31が発生させる時間シフト量N*(n)を、分布幅Nの整数値をとる一様分布の乱数とする。
【0069】
第1時間シフト部41は、当該時間シフト量に基づき、第1時間設定部61の出力である時間長変更後の初期反射音e'(t)の各成分e'n(t)を、初期反射音e'(t)の時間範囲内で時間シフトして出力e''(t)を生成する。
【0070】
時間シフトによる新たなインパルス応答生成の概要は、
図6と同様である。すなわち、n番目の窓関数に対応する出力e'
n(t)[
図6(a)のハッチングで示す成分に相当]を、第1乱数発生部31からの時間シフト量N
*(n)に基づいて時間シフトする[
図6(b)]。このように、時間窓毎に乱数に基づき時間シフトすることにより、インパルス応答h'(t)の初期反射音e'(t)と類似した音色を持ち、かつ互いに相関の低い初期反射音e''(t)が生成されることになる。
【0071】
なお、第1時間シフト部41は、時間長変更後の初期反射音e'(t)に関する各出力e'n(t)を初期反射音の時間範囲内で時間シフトするため、n+N*(n)が1≦n+N*(n)≦(te-Tw+Ted)/Tedとなるように制御する。第1時間シフト部41は、e''(t)が初期反射音e'(t)の範囲外になった場合は、第1乱数発生部31に再び乱数による時間シフト量を発生させ、初期反射音e'(t)の時間範囲内で第1時間窓乗算部21の出力e'n(t)を時間シフトさせる。第1時間シフト部41は、生成したe''(t)を信号加算部50に出力する。
【0072】
後部残響音r(t)に対する第2時間窓乗算部22、第2時間設定部62、第2乱数発生部32、及び第2時間シフト部42の処理は、それぞれ初期反射音e(t)に対する第1時間窓乗算部21、第1乱数発生部31、及び第1時間シフト部41の処理と同様である。なお、窓関数の長さ(窓幅)や時間シフト量の乱数の範囲(分布幅)等のパラメータ値は、初期反射音e(t)及び後部残響音r(t)それぞれに適した値を個別に設定することができるものである。すなわち、第1時間窓乗算部21では初期反射音に適した所定時間長の第1時間窓とし、第2時間窓乗算部22では後部残響音に適した所定時間長の第2時間窓とし、第1乱数発生部31では初期反射音に適した分布幅に基づいて第1時間シフト量を発生させ、第2乱数発生部32では後部残響音に適した分布幅に基づいて第2時間シフト量を発生させることが望ましい。
【0073】
第2時間窓乗算部22は、所定時間長Trの時間窓Wr(t)を複数個それぞれシフトして得られる窓関数Wrn(t) (n=1,2,…m)を後部残響音r(t)に乗じて出力rn(t) (n=1,2,…m)を生成する。第2時間設定部62は、入力されたインパルス応答h(t)の後部残響音r(t) (長さt1)に関する第2時間窓乗算部22の出力を時間窓毎に削除又は複製して長さtrの新たな後部残響音r'(t)を生成する。第2時間設定部62は、残響時間を短くする場合(tr<t1)には元の後部残響音r(t)のブロックを適宜削除し、また、残響時間を長くする場合(tr>t1)には元の後部残響音r(t)のブロックを適宜複製して、新たな後部残響音r'(t)を生成する。第2乱数発生部32は、時間シフト量を乱数により発生させる。第2時間シフト部42は、当該時間シフト量に基づき、時間窓毎に、時間長変更後の後部残響音r'(t)の各成分r'n(t)を後部残響音r'(t)の時間範囲内で時間シフトして出力r''(t)を生成する。第2時間シフト部42は、r''(t)が時間長変更後の後部残響音r'(t)の範囲外になる場合は、第2乱数発生部32に再び後部残響音r'(t)の範囲内となる時間シフト量を発生させる。第2時間シフト部42は、生成したr''(t)を信号加算部50に出力する。
【0074】
信号加算部50は、初期反射音e(t)に関する第1時間シフト部41の出力e''(t)と、後部残響音r(t)に関する第2時間シフト部42の出力r''(t)とを加算し、新たなインパルス応答h''(t)を生成する。
【0075】
なお、本実施形態では、残響時間の長さを変更する時間設定部60の後段に、時間窓毎に残響成分をシフトさせる時間シフト部40を備える構成としているが、時間シフト部40及び関連する乱数発生部30を省略し、時間設定部60の出力からそのまま新たなインパルス応答h'(t)を生成する構成としても良い。この場合、信号加算部50は、初期反射音e(t)に関する第1時間設定部61の出力e'(t)と、後部残響音r(t)に関する第2時間設定部62の出力r'(t)とを加算し、新たなインパルス応答h'(t)を生成する。
【0076】
このように、本実施形態によれば、信号分離部10は、インパルス応答を初期反射音と後部残響音とに自動的に分離し、時間窓乗算部20は、所定時間長の時間窓を複数回シフトして得られる窓関数を初期反射音及び後部残響音に乗じ、時間設定部60は、初期反射音又は後部残響音の少なくとも一方に関する時間窓乗算部20の出力を時間窓毎に削除又は複製して時間長を変更する。時間長を変更した初期反射音と後部残響音を加算することにより、予め与えられたインパルス応答と類似した音色を持ち、かつ互いに相関が低く設定した任意の残響時間を持つインパルス応答を多数生成することが可能となり、多チャンネル音響方式における残響付加で使用するのに十分な品質かつ様々な種類のインパルス応答を提供することが可能となる。
【0077】
さらに、乱数発生部30は、時間シフト量を乱数により発生させ、時間シフト部40は、時間シフト量に基づき、時間窓毎に、初期反射音に関する第1時間設定部61の出力を初期反射音の時間範囲内で時間シフトさせる。これにより、初期反射音の相関が低いインパルス応答を多数生成することが可能となり、インパルス応答を畳み込んだ際に同じ初期反射音のインパルス応答からは得られない拡がり感を得ることができる。後部残響音についても同様である。
【0078】
上記の実施の形態では、インパルス応答生成装置の構成と動作について説明したが、本発明はこれに限らず、多数のインパルス応答を生成する方法として構成されてもよい。すなわち、
図1又は
図7のデータの流れに従って、インパルス応答生成装置の各部での処理工程を順に備えた、インパルス応答生成装置におけるインパルス応答生成方法として構成されても良い。
【0079】
なお、上述したインパルス応答生成装置として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、インパルス応答生成装置の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラム(インパルス応答生成プログラム)は、コンピュータ読取り可能な記録媒体に記録可能である。
【0080】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態に記載の各ブロック、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成ブロック、ステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
【符号の説明】
【0081】
10 信号分離部
20 時間窓乗算部
21 第1時間窓乗算部
22 第2時間窓乗算部
30 乱数発生部
31 第1乱数発生部
32 第2乱数発生部
40 時間シフト部
41 第1時間シフト部
42 第2時間シフト部
50 信号加算部
60 時間設定部
61 第1時間設定部
62 第2時間設定部