(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023113505
(43)【公開日】2023-08-16
(54)【発明の名称】ラウドネス測定装置およびプログラム
(51)【国際特許分類】
G10L 25/21 20130101AFI20230808BHJP
H04S 1/00 20060101ALI20230808BHJP
【FI】
G10L25/21
H04S1/00 700
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022015930
(22)【出願日】2022-02-03
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100141139
【弁理士】
【氏名又は名称】及川 周
(74)【代理人】
【識別番号】100171446
【弁理士】
【氏名又は名称】高田 尚幸
(74)【代理人】
【識別番号】100114937
【弁理士】
【氏名又は名称】松本 裕幸
(74)【代理人】
【識別番号】100171930
【弁理士】
【氏名又は名称】木下 郁一郎
(72)【発明者】
【氏名】伊藤 敦郎
(72)【発明者】
【氏名】武井 友香
(72)【発明者】
【氏名】杉本 岳大
(72)【発明者】
【氏名】中山 靖茂
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA04
5D162CA05
5D162CA26
5D162CB18
5D162CD07
5D162CD22
5D162CD24
5D162EA07
(57)【要約】
【課題】より人間の聴感に即したラウドネス値を得る。
【解決手段】特性フィルタ処理部には、複数チャネルの音響信号が入力され、各チャネルの音響信号に所定の空間音響特性を付加する第1フィルタ処理を実行する第1フィルタ処理部と、前記第1フィルタ処理部から入力される音響信号に所定の聴覚特性を付加する第2フィルタ処理を実行する第2フィルタ処理部と、を備え、ラウドネス演算部は、前記特性フィルタ処理部から入力される音響信号のパワーをチャネル間で加重平均して得られる強度に基づいてラウドネス値を定め、フィルタ制御部は、前記複数チャネルの音響信号がバイノーラル信号であるか否かに応じて、前記第1フィルタ処理を実行しないか否かを定める。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数チャネルの音響信号が入力され、
各チャネルの音響信号に所定の空間音響特性を付加する第1フィルタ処理を実行する第1フィルタ処理部と、
前記第1フィルタ処理部から入力される音響信号に所定の聴覚特性を付加する第2フィルタ処理を実行する第2フィルタ処理部と、を備える特性フィルタ処理部と、
前記特性フィルタ処理部から入力される音響信号のパワーをチャネル間で加重平均して得られる強度に基づいてラウドネス値を定めるラウドネス演算部と、
前記複数チャネルの音響信号がバイノーラル信号であるか否かに応じて、前記第1フィルタ処理を実行しないか否かを定めるフィルタ制御部と、を備える
ラウドネス測定装置。
【請求項2】
前記バイノーラル信号は、左耳に提示する音の左耳用信号と、右耳に提示する音の右耳用信号を含み、
音源信号に音源から左耳への伝達特性を付加して前記左耳用信号を生成し、
前記音源信号に前記音源から右耳への伝達特性を付加して前記右耳用信号を生成するバイノーラル信号生成部を備え、
請求項1に記載のラウドネス測定装置。
【請求項3】
前記フィルタ制御部は、
所定の基準周波数以下の低い周波数における前記空間音響特性の利得が所定の基準利得以上であるか否かに応じて、前記第2フィルタ処理を実行するか否かを定める
請求項1または請求項2に記載のラウドネス測定装置。
【請求項4】
コンピュータに請求項1から請求項3のいずれか一項に記載のラウドネス測定装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ラウドネス測定装置およびプログラム、例えば、音響信号のバイノーラル再生における音量を定めるための技術に関する。
【背景技術】
【0002】
バイノーラル再生技術は、任意の位置に設置された音源から放射された音波が両耳の外耳道入口に到達するときの音圧を再現する技術である。バイノーラル再生では、ヘッドホン、イヤホンなど、左右両耳に近接した再生音源を用いて音を提示する。音源から到達する音圧を再現する際、音源から左右各耳までの音の伝達特性には、受聴者本人の頭部、耳介、胴体、以下、など(以下、「胴体等」と呼ぶ)における音波の反射、回折、減衰等の影響が含まれる。バイノーラル再生技術には、人間の頭部の形状を模した疑似頭(ダミーヘッド)の外耳道入口に設置したマイクロホンを用いて収音した音を再生に用いる方法と、音源信号に音源から各耳までの予め測定した伝達特性を付加した音を再生する方法がある。伝達特性を表す情報として頭部伝達関数(HRTF:Head-Related Transfer Function)または頭部インパルス応答(HRIR:Head-Related Impulse Response)が用いられる。HRTFは、音源から左右両耳の外耳道入口までの音の伝達特性を周波数領域で表す関数である。HRTFを用いて伝達特性を付加する際、音響信号を周波数領域に変換して得られる周波数ごとの変換係数にHRTFを乗算する。HRIRは、音源から左右両耳の外耳道入口までの音の伝達特性を時間領域で表す応答係数である。HRIRは、HRTFを時間領域で表現したインパルス応答に相当する。HRIRを用いて伝達特性を付加する際、時間領域でのサンプル値の時系列である音響信号に対してHRIRを用いて畳み込み演算を行う。
【0003】
近年では、マルチチャンネル音響が普及する一方、携帯情報機器を用いて個々人が所望のコンテンツを視聴するという利用形態が定着している。マルチチャンネル音響には、例えば、例えば、5.1サラウンド(「5.1ch音響」とも呼ばれる)、22.2マルチチャンネル音響(「22.2ch音響」とも呼ばれる)、などの方式が提案されている(非特許文献1)。携帯情報機器として、例えば、スマートフォン、タブレット端末、など必ずしも音響再生を主目的としない情報処理装置がしばしば用いられる。かかる状況のもとでは、バイノーラル再生技術は、疑似的にマルチチャンネル音響コンテンツを楽しむための手段として有用である。
【0004】
放送分野においては、バイノーラル再生技術を包含する音響処理方式の標準化が進められている。例えば、非特許文献2に記載の音響定義モデル(ADM:Audio Definition Model)、非特許文献3に記載の音響符号化方式MPEG-H 3DAにおいて、バイノーラル再生技術は、再生フォーマットの一つとして規定されている。ADMは、再生フォーマット情報の他、番組音声素材情報などを記述するための音響メタデータ、または、その形式である。
【0005】
音響再生技術の差異はもとより、個々に制作される音響コンテンツにおいて音量にばらつきが生じうる。複数のコンテンツ間で音量を統一することを目的として、ラウドネス値に基づく番組全体の音量管理が運用されることがある。ラウドネス値は、心理的な音量を表す指標値である。例えば、特許文献1-3では、モノラル再生、ステレオ再生、マルチチャンネル音響などの各再生方式でのコンテンツのラウドネス値測定法が提案されている。また、非特許文献4において、マルチチャンネル音響におけるラウドネス値測定法(以下、既存のラウドネス値測定法を「従来法」と総称する)や目標値が標準化されている。
図4に例示されるように、従来法では、入力された各チャンネルの音響信号がK特性フィルタを用いてフィルタリングされる。K特性フィルタは、2段階のプリフィルタ(前置フィルタ)であり、第1段のプリフィルタ(第1プリフィルタ)は、主に頭部による音の伝搬に対する影響の物理的な効果を模擬するフィルタである。第2段のプリフィルタ(第2プリフィルタ)は、人間の聴感特性を模擬する修正低域B特性(RLB:Revised Low-frequency B-weighting)を付加するフィルタである。K特性フィルタ処理により得られた音声信号の二乗平均に対して、チャンネルごとに予め設定された重み係数を用いて加重平均して加重平均値が得られる。得られた加重平均値を対数領域に変換し、ゲーティング処理において変換された値のうち一定のラウドネス値の閾値以下の値を切り捨てラウドネス値が算出される。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第3462390号公報
【特許文献2】特開2006-279242号公報
【特許文献3】特許第6510757号公報
【非特許文献】
【0007】
【非特許文献1】Rec. ITU-R BS.2051-2 「Advanced sound system for programme production」(2018)
【非特許文献2】Rec. ITU-R BS.2076-2 「Audio definition model」(2019)
【非特許文献3】ISO/IEC 23008-3:2019 「Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, Second edition」(2019)
【非特許文献4】Rec. ITU-R BS.1770-4 「Algorithms to measure audio programme loudness and true-peak audio level」(2015)
【発明の概要】
【発明が解決しようとする課題】
【0008】
マルチチャンネル音響コンテンツに対するラウドネス値測定法が標準化されているにも関わらず、バイノーラル再生コンテンツのラウドネス値測定法は明確に定められていない。バイノーラル信号(上記の疑似頭を用いて収録した音響信号、HRIRまたはHRTFを用いて音の伝達特性を付加した音響信号が該当)は、一種の複数チャンネルの音響信号であるため、従来法を適用することも考えられる。しかしながら、バイノーラル信号には、人間の頭部における音波の反射、回折などの物理的な音響効果が反映されている。従来法をそのまま用いる場合、K特性フィルタ処理による音響効果が重複して含まれることになる。また、HRIRまたはHRTFの測定に用いられる機器固有の周波数特性と聴感特性の補正が重複することもある。従って、従来法では必ずしも人間の聴感に即したラウドネス値が得られるとは限らない。
【0009】
本発明は上記の課題を解決するためになされたものであり、より人間の聴感に即したラウドネス値が得られるラウドネス値測定装置およびプログラムを提供することを一つの課題とする。
【課題を解決するための手段】
【0010】
[1]本発明の一態様は、複数チャネルの音響信号が入力され、各チャネルの音響信号に所定の空間音響特性を付加する第1フィルタ処理を実行する第1フィルタ処理部と、前記第1フィルタ処理部から入力される音響信号に所定の聴覚特性を付加する第2フィルタ処理を実行する第2フィルタ処理部と、を備える特性フィルタ処理部と、前記特性フィルタ処理部から入力される音響信号のパワーをチャネル間で加重平均して得られる強度に基づいてラウドネス値を定めるラウドネス演算部と、前記複数チャネルの音響信号がバイノーラル信号であるか否かに応じて、前記第1フィルタ処理を実行しないか否かを定めるフィルタ制御部と、を備えるラウドネス測定装置である。
[1]の構成によれば、特性フィルタ処理部にバイノーラル信号が入力される場合には第1フィルタ処理が実行されないため、バイノーラル信号に含まれる空間音響特性と第1フィルタ処理による空間音響特性が重複しない。そのため、聴感に即したラウドネス値が得られる。また、特性フィルタ処理部にバイノーラル信号が入力されない場合には第1フィルタ処理が実行されるため、既存のラウドネス測定の要件を満足することができる。
【0011】
[2]本発明の一態様は、上述のラウドネス測定装置であって、前記バイノーラル信号は、左耳に提示する音の左耳用信号と、右耳に提示する音の右耳用信号を含み、音源信号に音源から左耳への伝達特性を付加して前記左耳用信号を生成し、前記音源信号に前記音源から右耳への伝達特性を付加して前記右耳用信号を生成するバイノーラル信号生成部を備えてもよい。
[2]の構成によれば、音源信号に基づいてバイノーラル信号が生成されるため、生成されたバイノーラル信号に対するラウドネス値が得られる。そのため、得られたラウドネス値に基づいてバイノーラル信号を含むコンテンツの編集または制作を効率化することができる。
【0012】
[3]本発明の一態様は、上述のラウドネス測定装置であって、前記フィルタ制御部は、
所定の基準周波数以下の低い周波数における前記空間音響特性の利得が所定の基準利得以上であるか否かに応じて、前記第2フィルタ処理を実行するか否かを定めてもよい。
[3]の構成によれば、低域における伝達特性の利得が高い場合に第2フィルタ処理が行われるため、低域における聴感に対する寄与の少なさを考慮して、聴感に合ったラウドネス値が得ることができる。
【0013】
[4]本発明の一態様は、コンピュータに上述のラウドネス測定装置として機能させるためのプログラムであってもよい。
[4]の構成によれば、特性フィルタ処理部にバイノーラル信号が入力される場合には第1フィルタ処理が実行されないため、バイノーラル信号に含まれる空間音響特性と第1フィルタ処理による空間音響特性が重複しないため、聴感に合ったラウドネス値が得られる。また、特性フィルタ処理部にバイノーラル信号が入力されない場合には第1フィルタ処理が実行されるため、既存のラウドネス測定の要件を満足することができる。
【発明の効果】
【0014】
本発明によれば、より人間の聴感に即したラウドネス値が得られる。
【図面の簡単な説明】
【0015】
【
図1】本実施形態に係るラウドネス測定装置の機能構成の一例を示す概略ブロック図である。
【
図2】本実施形態に係るラウドネス測定装置の機能構成の他の例を示す概略ブロック図である。
【
図3】本実施形態に係る畳込演算部の機能構成例を示す概略ブロック図である。
【
図4】既存のラウドネス測定方法の一例を示す概略ブロック図である。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら本発明の実施形態について説明する。まず、本実施形態に係るラウドネス測定装置10の機能構成例について説明する。
図1は、本実施形態に係るラウドネス測定装置10の機能構成の一例を示す概略ブロック図である。
ラウドネス測定装置10は、特性フィルタ処理部110と、ラウドネス演算部120と、フィルタ制御部140と、を備える。
図1の例では、特性フィルタ処理部110の個数は2個である。この個数は、入力される音響信号のチャンネル数に相当する。個々の特性フィルタ処理部110、および、その一部をなす部位は、110-1、110-2などと、子番号を用いて区別されている。但し、本願では、複数の特性フィルタ処理部110に対して共通の事項については、特に子番号を付さないこともある。
【0017】
個々の特性フィルタ処理部110は、それぞれ対応するチャンネルの音響信号xに対してフィルタ処理(フィルタリング)を実行する。特性フィルタ処理部110は、個々のチャネルの音響信号に対して第1フィルタ処理と第2フィルタ処理をそれぞれ実行可能とする。また、特性フィルタ処理部110では、第1フィルタ処理と第2フィルタ処理のそれぞれの実行の要否が可変である。
図1の例では、特性フィルタ処理部110は、2個のスイッチ部112、116と、第1フィルタ処理部114と、第2フィルタ処理部118と、を備える。
【0018】
スイッチ部112は、フィルタ制御部140から入力される第1制御信号に基づいて、自部に入力される音響信号の出力先を第1フィルタ処理部114とするか、第1フィルタ処理部114を迂回(スルー)してスイッチ部116とするかを制御する。第1フィルタ処理部114を迂回するか否かは、第1フィルタ処理の実行の要否により定まる。第1フィルタ処理要を示す第1制御信号が入力されるとき、スイッチ部112は、自部に入力される音響信号を第1フィルタ処理部114に出力する。第1フィルタ処理否を示す第2制御信号が入力されるとき、スイッチ部112は、自部に入力される音響信号を第2フィルタ処理部118に出力する。
【0019】
第1フィルタ処理部114は、スイッチ部112から入力される音響信号に対して第1前置フィルタ処理(プリフィルタ処理;pre-filtering)を実行して得られる音響信号を第1フィルタ信号としてスイッチ部116に出力する。第1前置フィルタ処理は、非特許文献4に記載のK特性フィルタ(K-filter)の第1段階の前置フィルタ処理(first stage of pre-filtering)と同様の処理であってもよい。第1前置フィルタは、人間の頭部を剛体球としてモデル化して生じる音響効果を模擬する。第1前置フィルタは、周波数が高いほど利得が高くなるが、周波数が0に近似するほど利得が第1基準値に漸近し、周波数が無限大に近似するほど利得が第2基準値に漸近するシェルフフィルタ(shelving filter)として機能する。第2基準値は、第1基準値よりも大きい正の実数となる。第1前置フィルタは、例えば、自己回帰移動平均(ARMA:Auto-Regressive Moving Average)フィルタとして実装される。
【0020】
スイッチ部116は、自部に入力される音響信号として、フィルタ制御部140から入力される第2制御信号に基づいて、スイッチ部112から入力される音響信号、または、第1フィルタ処理部114から入力される第1フィルタ信号の出力先を第2フィルタ処理部118とするか、第2フィルタ処理部118を迂回してラウドネス演算部120とするかを制御する。第2フィルタ処理部118を迂回するか否かにより、第2フィルタ処理の実行の要否が定まる。第2フィルタ処理要を示す第2制御信号が入力されるとき、スイッチ部116は、自部に入力される音響信号を第2フィルタ処理部118に出力する。第2フィルタ処理否を示す第2制御信号が入力されるとき、スイッチ部116は、自部に入力される音響信号を出力信号yとしてラウドネス演算部120に出力する。
【0021】
第2フィルタ処理部118は、スイッチ部116から入力される音響信号に対して第2前置フィルタ処理を実行して得られる音響信号を出力信号yとしてラウドネス演算部120に出力する。第2フィルタ処理は、非特許文献4に記載のK特性フィルタの第2段階の前置フィルタ処理(second stage of pre-filtering)と同様の構成のもとで、異なるパラメータを用いた演算であってもよい。第2前置フィルタも、例えば、ARMAフィルタとして実装されうる。第2前置フィルタは、人間の聴感特性を模擬する聴感重みフィルタとして機能する。第2前置フィルタは、周波数が高いほど利得が高くなるが、一定の基準値に漸近する高域通過フィルタ(high-pass filter)として機能する。
【0022】
ラウドネス演算部120は、各チャンネルに対応する特性フィルタ処理部110から入力される出力信号yからライドネス値を算出する。ラウドネス演算部120は、二乗平均部122と、重み付け部124と、加算部126と、デシベル変換部128と、ゲート処理部130とを備える。ラウドネス演算部120において、二乗平均部122と、重み付け部124は、チャンネルごとに備わり、個々のチャンネルの信号、または、その信号から得られた数値を処理対象とする。
【0023】
二乗平均部122は、所定の期間Tよりも短いゲーティングブロック(切り出し区間)ごとに出力信号yをなす各サンプルの信号値の二乗平均値(mean square)zを算出する。互いに隣接するゲーティングブロック間で、重なり合う期間が存在していてもよい。二乗平均部122は、二乗平均値を算出する際、直後のゲーティングブロックと重複する期間(重複期間)を除いた期間(ステップ期間)内の信号値を採用し、それ以外の期間における信号値を無視してもよい。二乗平均部122は、算出した二乗平均値zを重み付け部124に出力する。
重み付け部124は、二乗平均部122から入力された二乗平均値zに、そのチャンネルに対し予め設定された重み係数(weighting coefficient)Gを乗じて加重二乗平均値を算出する。重み付け部124は、算出した加重二乗平均値を加算部126に出力する。バイノーラル信号に対しては、重み係数としてチャンネル間で等しい値に設定しておく。
加算部126は、重み付け部124から入力されるチャンネルごとの加重二乗平均値のチャンネル間の総和をチャンネル間加重平均値として算出する。加算部126は、算出したチャンネル間加重平均値をデシベル変換部128に出力する。
【0024】
デシベル変換部128は、加算部126から入力されるチャンネル間加重平均値のデシベル値に変換する。デシベル値は、10を底とする常用対数値に10倍して得られる値である。デシベル変換部128は、変換したデシベル値をゲート処理部130に出力する。
ゲート処理部130は、デシベル変換部128から入力されるデシベル値に所定の係数を加算してゲーティングブロックラウドネス値として算出する。ゲート処理部130は、定めたゲーティングブロックラウドネス値が所定のゲーティング閾値よりも大きいか否かを判定する。
【0025】
ゲート処理部130は、期間Tにおいてゲーティングブロックラウドネス値がゲーティング閾値を超えたゲーティングブロックごとのゲーティングブロックラウドネス値を採用し、それ以外のゲーティングブロックラウドネス値を棄却する。ゲート処理部130は、採用したゲーティングブロックラウドネス値の平均値を、その期間Tにおけるゲート処理済ラウドネス値(gated loudness)として算出する。受聴者が無音として意識されない、ごく短時間の無音期間におけるラウドネス値が棄却されるので、聴感に即した音の大きさが定量化される。ゲート処理部130は、算出したゲート処理済ラウドネス値をラウドネス測定装置10の外部に出力する。
【0026】
フィルタ制御部140は、特性フィルタ処理部110に入力される音響信号がバイノーラル信号であるか否かにより、第1フィルタ処理を実行しないか否かを制御する。特性フィルタ処理部110に入力される音響信号がバイノーラル信号である場合、フィルタ制御部140は、第1フィルタ処理要を示す第1制御信号を生成し、生成した第1制御信号をスイッチ部112に出力する。特性フィルタ処理部110に入力される音響信号がバイノーラル信号でない場合、フィルタ制御部140は、第1フィルタ処理否を示す第1制御信号を生成し、生成した第1制御信号をスイッチ部112に出力する。特性フィルタ処理部110に入力される音響信号がバイノーラル信号であるか否かの判定例については、後述する。
【0027】
フィルタ制御部140は、常時第2フィルタ処理を実行するように設定されてもよい。バイノーラル信号の生成に用いるHRIRまたはHRTF(以下、「HRIR等」と総称する)に示される伝達特性はあくまで物理的な特性であって、人間の聴感のように心理的な特性が含まれないためである。しかしながら、測定または合成により取得されるHRIR等の低域における利得は、取得時における条件により極端に低くなることがある。例えば、音の再生に用いられるスピーカ、収音に用いられるマイクロホン、編集に用いられるミキサなどのいずれか、または、いずれかの組において、聴感補正が施されうるためである。そのような場合に第2フィルタ処理を実行すると、低域のラウドネス値に対する寄与が小さくなる。
【0028】
そこで、フィルタ制御部140は、所定の基準周波数よりも周波数が低い低域において、利得が所定の基準利得以上であるか否かにより、第2フィルタ処理を実行するか否かを制御してもよい。低域における利得が基準利得以上である場合、フィルタ制御部140は、第2フィルタ処理要を示す第2制御信号を生成し、生成した第2制御信号をスイッチ部116に出力する。低域における利得が基準利得以上でない場合、フィルタ制御部140は、第2フィルタ処理否を示す第2制御信号を生成し、生成した第2制御信号をスイッチ部116に出力する。低域における利得が基準利得以上であるか否かの判定例については、後述する。
【0029】
(バイノーラル信号の判定例)
次に、特性フィルタ処理部110に入力される音響信号がバイノーラル信号であるか否かの判定例について説明する。
フィルタ制御部140は、例えば、ユーザの操作により測定対象とする音響信号としてバイノーラル信号が指示されるとき、第1フィルタ処理を実行せず、それ以外の音響信号が指示されるとき、第1フィルタ処理を実行すると判定する。ユーザの処理により指示される情報は、操作入力部(図示せず)から入力される操作信号で伝達されうる。操作入力部は、ユーザの操作を受け付け、受け付けた操作に応じた操作信号を生成する部材を含んで構成される。かかる部材は、ボタン、レバー、つまみ、などの専用の部材であってもよいし、タッチセンサ、マウス、などの汎用の部材であってもよい。
【0030】
また、特性フィルタ処理部110からバイノーラル信号生成部150(後述)から2チャンネルの音響信号の入力が通知されるとき、第1フィルタ処理を実行しないと判定してもよい。特性フィルタ処理部110は、バイノーラル信号生成部150から2チャンネルの音響信号の入力を検出するとき、その入力を示す信号入力情報をフィルタ制御部140に出力することより2チャンネルの音響信号の入力を通知することができる。バイノーラル信号生成部150が、ラウドネス測定装置10の他の部材から着脱可能である場合には、バイノーラル信号生成部150の装着を検出する検出部(図示せず)を備えてもよい。フィルタ制御部140は、検出部からバイノーラル信号生成部150の装着を示す装着情報が入力されるとき、第1フィルタ処理を実行しないと判定し、装着なしを示す装着情報が入力されるとき、第1フィルタ処理を実行すると判定してもよい。検出部は、バイノーラル信号生成部150との物理的な接触を検出する接触センサを備えてもよいし、バイノーラル信号生成部150との電気的な接続を検出する導通センサを備えてもよい。
【0031】
また、フィルタ制御部140は、特性フィルタ処理部110に入力される2チャンネルの音響信号を分析し、入力される音響信号がバイノーラル信号であるか否かを判定してもよい。フィルタ制御部140は、所定の基準周波数よりも周波数が低い低域成分について、チャンネル間の相関係数が所定の相関係数の閾値以上であって、周波数が基準周波数以上である高域における複数の周波数帯域間で、周波数帯域ごとのチャンネル間の相関係数の分散が所定の分散の閾値よりも大きいとき、入力される音響信号がバイノーラル信号であると判定し、それ以外の場合、入力される音響信号はバイノーラル信号ではないと判定することができる。これにより、低域におけるチャンネル間の相関が高く、高域におけるチャンネル間の相関の分散が顕著という特性を捉えて、入力される音響信号がバイノーラル信号であるか否かを判定することができる。
【0032】
(低域における利得の判定例)
次に、低域における利得が基準利得以上であるか否かの判定例について説明する。フィルタ制御部140は、バイノーラル信号生成部150からバイノーラル信号の生成に用いられるHRIR等を読み出す。フィルタ制御部140は、読み出したHRIR等に示される伝達特性を分析し、周波数が基準周波数以下である低域における伝達特性の利得について、所定の基準利得以上であるか否かを判定することができる。
フィルタ制御部140は、特性フィルタ処理部110に入力される音響信号を分析し、周波数が基準周波数以下である低域におけるパワーの基準周波数におけるパワーに対する比が所定の基準パワー比以上であるか否かにより、低域における伝達特性の利得について、所定の基準利得以上であるか否かを判定することができる。
【0033】
(バイノーラル信号生成部)
次に、本実施形態に係るラウドネス測定装置10の他の機能構成例について説明する。
図2に例示されるように、ラウドネス測定装置10は、さらにバイノーラル信号生成部150を備えてもよい。バイノーラル信号生成部150は、音源信号sから受聴者の左耳に提示する音を提示するための左耳用信号x
1と、右耳に提示する音を提示するための右耳用信号x
2を生成する。生成した左耳用信号と右耳用信号の組をバイノーラル信号として特性フィルタ処理部110に出力する。バイノーラル信号生成部150は、音源信号に音源が設置される方向である音源方向から左耳への伝達特性を付加して左耳用信号を生成し、音源方向から右耳への伝達特性を付加して右耳用信号を生成することができる。
【0034】
バイノーラル信号生成部150は、記憶部152と、畳込演算部156とを備える。
記憶部152には、HRIRデータを予め記憶させておく。HRIRデータは、音源方向ごとに音源から左耳までの伝達特性を示すHRIRと、音源から右耳までの伝達特性を示すHRIRを示すデータである。音源方向に設置された音源から左右各耳までのHRIRは、畳込演算部156により読み出される。
【0035】
畳込演算部156は、バイノーラル再生において目標とする目標方向(target direction)に相当する音源方向から左右各耳までのHRIRを、記憶部152から読み出す。畳込演算部156は、入力される音源信号に対し左耳までのHRIRを用いて畳み込み演算を行って左耳用信号を生成し、音源信号に対し右耳までのHRIRを用いて畳み込み演算を行って右耳用信号を生成する。畳込演算部156は、生成した左耳用信号と右耳用信号をそれぞれ特性フィルタ処理部110-1、110-2に出力する。
【0036】
なお、畳込演算部156には、一定の目標方向が予め設定されていてもよいし、時間経過に応じて変動しうる目標方向を示す目標方向情報が入力されてもよい(レンダリング)。畳込演算部156は、入力される目標方向情報に示される目標方向を特定し、特定した目標方向に対応するHRIRを記憶部152から読み出す。目標方向情報として、例えば、非特許文献2において規定されたADMに準拠した形式を有する情報が用いられてもよいし、操作入力部(図示せず)から入力される操作信号で指示される情報が用いられてもよい。操作入力部は、ラウドネス測定装置10に内蔵または接続されたものでもよいし、ラウドネス測定装置10とは別個の外部機器(例えば、ミキシングコンソール)に内蔵または接続されたものでもよい。
【0037】
図2は、1個の音源に対応する1系統の音源信号から2チャンネルのバイノーラル信号を生成するための機能構成を例示するが、これには限られない。バイノーラル信号生成部150は、複数の音源に対して、音源ごとに音源別左耳用信号と音源別右耳用信号を生成してもよい。バイノーラル信号生成部150は、さらに音源間で音源別左耳用信号を加算(混合)して出力用左耳用信号を生成し、音源間で音源別右耳用信号を加算(混合)して出力用右耳用信号を生成してもよい。その場合、目標方向は、個々の音源に対応する1系統の音源信号ごとに設定されればよい。
【0038】
図3は、N(Nは、2以上の所定の整数)系統の音源信号から2チャンネルのバイノーラル信号を生成するための機能構成を例示する。
畳込演算部156は、N組のHRIR畳込部157-1L~157-NRと、2個の加算部158-1L、158-1Rを備える。HRIR畳込部157-nL、157-nR(nは、1以上N以下の整数)は、第n音源に係る音源信号に対して、それぞれ第n音源方向から左耳までのHRIRの畳込演算を行って第n音源に対する音源別左耳用信号を生成し、第n音源方向から右耳までのHRIRの畳込演算を行って第n音源に対する音源別右耳用信号を生成する。HRIR畳込部157-nL、157-nRは、それぞれ生成した音源別左耳用信号を加算部158-1Lに出力し、音源別右耳用信号を加算部158-1Rに出力する。
加算部158-1Lは、自部に入力される音源別左耳用信号をN個の音源間で加算して出力用左耳用信号を生成し、生成した出力用左耳用信号を音響信号x
1として特性フィルタ処理部110-1に出力する。
加算部158-1Rは、自部に入力される音源別右耳用信号をN個の音源間で加算して出力用右耳用信号を生成し、生成した出力用右耳用信号を音響信号x
2として特性フィルタ処理部110-2に出力する。
【0039】
畳込演算部156は、レンダリングの他、マルチチャンネル音響再生に応用されてもよい。マルチチャンネル音響再生に応用するには、まず、利用する再生方式において規定された個々の音源位置から聴取位置に所在する受聴者の左右各耳までのHRIRを予め取得しておく。個々の音源位置は、各1チャンネルの再生音源の設置位置に相当する。そして、左右各耳について、各再生音源から耳までのHRIRを用いて音源信号に対して畳み込み演算を行って得られる音源別信号をN個の音源間でミキシングして各耳用の信号が得られる。例えば、22.2ch音響に応用するためには、非特許文献1に規定された24(=N)チャンネルの再生音源のそれぞれが設置される音源位置から所定の聴取位置に所在する受聴者の左右各耳までのHRIRを予め測定しておく。HRIR畳込部157は、チャンネルごとに左右各耳に対して測定したHRIRを音源信号に対して畳込演算を行い、音源別左耳用信号と音源別右耳用信号を生成する。但し、予め取得したHRIRを、対応するチャンネルおよび耳に係るHRIR畳込部157に設定しておく。24チャンネルの音響信号は、それぞれのチャンネルに係る左右1組のHRIR畳込部157に供給される。そのため、生成されたバイノーラル信号に基づく音として、24個の音源から到来する音と同様の音が受聴者の左右各耳に提示される。
【0040】
なお、応用対象とするマルチチャンネル音響再生方式は、22.2ch音響に限られず、5.1ch音響、7.1ch音響、などであってもよい。例えば、5.1ch音響、7.1ch音響では、それぞれ6個、8個の音源位置と聴取位置との位置関係が規定されている。この位置関係に従って、HRIR畳込部157にHRIRを設定すればよい。
なお、本実施形態では、音響信号に対するHRIRの畳込演算に代えて、音響信号を周波数領域に変換して得られる変換係数とそのHRIRに対応するHRTFの乗算と、乗算により得られる乗算値の時間領域への変換がなされてもよい。
【0041】
以上に説明したように、本実施形態に係るラウドネス測定装置10は、複数チャネルの音響信号が入力され、各チャネルの音響信号に所定の空間音響特性を付加する第1フィルタ処理を実行する第1フィルタ処理部114と、第1フィルタ処理部114から入力される音響信号に所定の聴覚特性を付加する第2フィルタ処理を実行する第2フィルタ処理部118と、を備える特性フィルタ処理部110と、特性フィルタ処理部110から入力される音響信号のパワーをチャネル間で加重平均して得られる強度に基づいてラウドネス値を定めるラウドネス演算部120と、複数チャネルの音響信号がバイノーラル信号であるか否かに応じて、第1フィルタ処理を実行しないか否かを定めるフィルタ制御部140と、を備える。
この構成によれば、特性フィルタ処理部110にバイノーラル信号が入力される場合には第1フィルタ処理が実行されない。そのため、バイノーラル信号に含まれる空間音響特性と第1フィルタ処理による空間音響特性が重複しないため、聴感に即したラウドネス値が得られる。また、特性フィルタ処理部110にバイノーラル信号が入力されない場合には第1フィルタ処理が実行されるため、既存のラウドネス測定の要件を満足することができる。
【0042】
バイノーラル信号は、左耳に提示する音の左耳用信号と、右耳に提示する音の右耳用信号を含み、音源信号に音源から左耳への伝達特性を付加して左耳用信号を生成し、音源信号に前記音源から右耳への伝達特性を付加して前記右耳用信号を生成するバイノーラル信号生成部150を備えてもよい。
この構成によれば、音源信号に基づいてバイノーラル信号が生成されるため、生成されたバイノーラル信号に対するラウドネス値が得られる。そのため、得られたラウドネス値に基づいてバイノーラル信号を含むコンテンツの編集または制作を効率化することができる。
【0043】
フィルタ制御部140は、所定の基準周波数以下の低い周波数における空間音響特性の利得が所定の基準利得以上であるか否かに応じて、第2フィルタ処理を実行するか否かを定めてもよい。
この構成によれば、低域における伝達特性の利得が高い場合に第2フィルタ処理が行われるため、低域における聴感に対する寄与の少なさを考慮して、聴感に合ったラウドネス値が得ることができる。
【0044】
なお、ラウドネス測定装置10は、ラウドネス値測定専用の測定装置として実現されてもよいし、パーソナルコンピュータ、タブレット端末装置、などの情報端末装置のように、ラウドネス値の測定を主機能としない装置として実現されてもよい。ラウドネス測定装置10は、各種のコンテンツの制作、編集、配信(放送を含む)に係る機器(例えば、ミキシングコンソールなど)の一部として実現されてもよい。
【0045】
なお、上述のラウドネス測定装置10の一部または全部、例えば、特性フィルタ処理部110、ラウドネス演算部120、フィルタ制御部140、および、バイノーラル信号生成部150のいずれか、または、それらのいずれかの組み合わせをコンピュータでそれぞれ実現するようにしてもよい。その場合、それぞれの制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録しておき、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、ラウドネス測定装置10に内蔵されたコンピュータシステムであって、OS(Operating System)や周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0046】
また、上述した実施形態におけるラウドネス測定装置10の一部、または全部をLSI(Large Scale Integration)等の集積回路として実現してもよい。ラウドネス測定装置10の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【0047】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0048】
10…ラウドネス測定装置、110(110-1、110-2)…特性フィルタ処理部、112(112-1、112-2)、116(116-1、116-2)…スイッチ部、114(114-1、114-2)…第1フィルタ処理部、118(118-1、118-2)…第2フィルタ処理部、120…ラウドネス演算部、122(122-1、122-2)…二乗平均部、124(124-1、124-2)…重み付け部、126…加算部、128…デシベル変換部、130…ゲート処理部、140…フィルタ制御部、150…バイノーラル信号生成部、152…記憶部、156…畳込演算部、157(157-1L~157-NR)…HRIR畳込部、158(158-1L、158-1R)…加算部