(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-12
(45)【発行日】2024-11-20
(54)【発明の名称】ラウドネス測定装置及びプログラム
(51)【国際特許分類】
G10K 15/00 20060101AFI20241113BHJP
G10L 25/21 20130101ALI20241113BHJP
【FI】
G10K15/00 L
G10L25/21
(21)【出願番号】P 2021012333
(22)【出願日】2021-01-28
【審査請求日】2023-12-28
(31)【優先権主張番号】P 2020015269
(32)【優先日】2020-01-31
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】西口 敏行
(72)【発明者】
【氏名】久保 弘樹
(72)【発明者】
【氏名】大出 訓史
【審査官】▲徳▼田 賢二
(56)【参考文献】
【文献】特表2019-501563(JP,A)
【文献】特表2016-522911(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/00
G10L 25/21
(57)【特許請求の範囲】
【請求項1】
複数チャンネルのオブジェクトベース音声信号のラウドネス値を測定するラウドネス測定装置であって、
前記オブジェクトベース音声信号に関するメタデータを解析し、各チャンネルの再生位置を示す再生位置情報を取得するメタデータ解析部と、
前記オブジェクトベース音声信号に対して、聴感補正フィルタによりフィルタ処理を行うK特性フィルタ部と、
前記K特性フィルタ部によって処理された信号を二乗平均したパワー信号を生成する二乗平均部と、
前記再生位置情報に基づいて各チャンネルの重み係数を決定し、重み付けを行う重み付け部と、
前記重み付け部により重み付けされた各チャンネルの信号の合算値を算出する合算部と、
を備える、ラウドネス測定装置。
【請求項2】
前記メタデータ解析部は、各チャンネルのゲインを示すゲイン情報をさらに取得し、
前記ゲイン情報に従い、前記オブジェクトベース音声信号にゲインを乗じるゲイン処理部をさらに備え、
前記K特性フィルタ部は、前記ゲイン処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行う、請求項1に記載のラウドネス測定装置。
【請求項3】
前記メタデータ解析部は、前記オブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報をさらに取得し、
前記マトリクス情報に従い、前記オブジェクトベース音声信号に対して前記係数を用いてマトリクス演算を行うマトリクス処理部をさらに備え、
前記K特性フィルタ部は、前記マトリクス処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行う、請求項1に記載のラウドネス測定装置。
【請求項4】
前記メタデータ解析部は、前記オブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報、及び各チャンネルのゲインを示すゲイン情報をさらに取得し、
前記マトリクス情報及び前記ゲイン情報に従い、前記オブジェクトベース音声信号に対してマトリクス演算及びゲイン乗算を行うマトリクス・ゲイン処理部をさらに備え、
前記K特性フィルタ部は、前記マトリクス・ゲイン処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行う、請求項1に記載のラウドネス測定装置。
【請求項5】
複数チャンネルのオブジェクトベース音声信号のラウドネス値を測定するラウドネス測定装置であって、
前記オブジェクトベース音声信号に関するメタデータの記述に基づいて前記オブジェクトベース音声信号に対してレンダリング処理を行うとともに、各チャンネルの再生位置を示す再生位置情報を取得するレンダリング処理部と、
前記レンダリング処理部による処理後のオブジェクトベース音声信号に対して、聴感補正フィルタによりフィルタ処理を行うK特性フィルタ部と、
前記K特性フィルタ部によって処理された信号を二乗平均したパワー信号を生成する二乗平均部と、
前記再生位置情報に基づいて各チャンネルの重み係数を決定し、重み付けを行う重み付け部と、
前記重み付け部により重み付けされた各チャンネルの信号の合算値を算出する合算部と、
を備える、ラウドネス測定装置。
【請求項6】
コンピュータを、請求項1から5のいずれか一項に記載のラウドネス測定装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
オブジェクトベース方式の音声信号のラウドネス値を測定できるラウドネス測定装置及びプログラムを提供する。
【背景技術】
【0002】
放送コンテンツ等に含まれる音声信号レベルの測定方法として、人間の感覚に近い音の大きさを示すラウドネス値を測定する方法が標準化され、これに基づいてラウドネス測定装置(ラウドネスメータ)が実用化、運用されている(例えば、非特許文献1及び特許文献1参照)。
【0003】
従来の放送音声は、番組制作現場で音の素材をミキシングして、完成した番組の音を家庭に伝送している。各テレビ受信機は伝送された音声信号をそのまま再生しており、このような再生方式は、チャンネルベース方式(又はチャンネルベース音響方式)と称される。例えば、非特許文献2には、チャンネルベース方式に対応したサウンドシステムが記載されている。
【0004】
また、近年では、番組制作現場からの音の素材(オブジェクト音)と、それらの構成や再生位置などの情報(メタデータ)を家庭へ伝送し、各テレビ受信機で目的に合わせて合成(レンダリング)することで、番組音声を完成させることが提案されている(例えば、非特許文献3参照)。このような再生方式は、オブジェクトベース方式(又はオブジェクトベース音響方式)と称される。
【0005】
オブジェクトベース方式におけるメタデータについては、例えば非特許文献4及び非特許文献5記載するように、国際電気通信連合(ITU;International Telecommunication Union)で規格化されている。また、非特許文献6には、S-ADM(Audio Definition Model)に基づくメタデータの形式について記載されており、非特許文献7には、マルチチャネルファイル及びメタデータを伝送可能なBW64(Broadcast Wave 64Bit)オーディオファイル形式の仕様について記載されている。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】「デジタルテレビ放送番組におけるラウドネス運用規定」、ARIB TR-B32、一般財団法人電波産業会、1.5版
【文献】“Advanced sound system for programme production”, Recommendation ITU-R BS.2051-2, 07/2018
【文献】久保弘樹、外1名、「オブジェクトベース音響を用いた次世代音声放送サービス」、日本音響学会講演論文集、2018年9月、1-1-1
【文献】“Audio Definition Model”, Recommendation ITU-R BS.2076-2, 10/2019
【文献】“Common definitions for the Audio Definition Model”, Recommendation ITU-R BS.2094-1, 06/2017
【文献】“A serial representation of the Audio Definition Model (S-ADM)”, Recommendation ITU-R BS.2125-0, 01/2019
【文献】“Long-form file format for the international exchange of audio programme materials with metadata”, Recommendation ITU-R BS.2088-1, 10/2019
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来のラウドネス測定装置は、非特許文献1に記載の規格に基づき、チャンネルベース方式の音声信号のラウドネス値を測定するものであり、オブジェクトベース方式の音声信号(オブジェクトベース音声信号)のラウドネス値を測定することはできなかった。オブジェクトベース音声信号は、メタデータに基づいて再生環境のスピーカ配置に合わせてレンダリング処理されるため、ラウドネス値を測定するには、メタデータに記述されている音声信号の再生位置情報に応じた所定の重み付けなどを行う必要がある。
【0009】
かかる事情に鑑みてなされた本発明の目的は、オブジェクトベース方式の音声信号のラウドネス値を測定することが可能なラウドネス測定装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0010】
一実施形態に係るラウドネス測定装置は、複数チャンネルのオブジェクトベース音声信号のラウドネス値を測定するラウドネス測定装置であって、前記オブジェクトベース音声信号に関するメタデータを解析し、各チャンネルの再生位置を示す再生位置情報を取得するメタデータ解析部と、前記オブジェクトベース音声信号に対して、聴感補正フィルタによりフィルタ処理を行うK特性フィルタ部と、前記K特性フィルタ部によって処理された信号を二乗平均したパワー信号を生成する二乗平均部と、前記再生位置情報に基づいて各チャンネルの重み係数を決定し、重み付けを行う重み付け部と、前記重み付け部により重み付けされた各チャンネルの信号の合算値を算出する合算部と、を備える。
【0011】
一実施形態において、前記メタデータ解析部は、各チャンネルのゲインを示すゲイン情報をさらに取得し、前記ゲイン情報に従い、前記オブジェクトベース音声信号にゲインを乗じるゲイン処理部をさらに備え、前記K特性フィルタ部は、前記ゲイン処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行うようにしてもよい。
【0012】
一実施形態において、前記メタデータ解析部は、前記オブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報をさらに取得し、前記マトリクス情報に従い、前記オブジェクトベース音声信号に対して前記係数を用いてマトリクス演算を行うマトリクス処理部をさらに備え、前記K特性フィルタ部は、前記マトリクス処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行うようにしてもよい。
【0013】
一実施形態において、前記メタデータ解析部は、前記オブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報、及び各チャンネルのゲインを示すゲイン情報をさらに取得し、前記マトリクス情報及び前記ゲイン情報に従い、前記オブジェクトベース音声信号に対してマトリクス演算及びゲイン乗算を行うマトリクス・ゲイン処理部をさらに備え、前記K特性フィルタ部は、前記マトリクス・ゲイン処理部による処理後のオブジェクトベース音声信号に対してフィルタ処理を行うようにしてもよい。
【0014】
また、一実施形態に係るラウドネス測定装置は、複数チャンネルのオブジェクトベース音声信号のラウドネス値を測定するラウドネス測定装置であって、前記オブジェクトベース音声信号に関するメタデータの記述に基づいて前記オブジェクトベース音声信号に対してレンダリング処理を行うとともに、各チャンネルの再生位置を示す再生位置情報を取得するレンダリング処理部と、前記レンダリング処理部による処理後のオブジェクトベース音声信号に対して、聴感補正フィルタによりフィルタ処理を行うK特性フィルタ部と、前記K特性フィルタ部によって処理された信号を二乗平均したパワー信号を生成する二乗平均部と、前記再生位置情報に基づいて各チャンネルの重み係数を決定し、重み付けを行う重み付け部と、前記重み付け部により重み付けされた各チャンネルの信号の合算値を算出する合算部と、を備える。
【0015】
また、一実施形態に係るプログラムは、コンピュータを、上記ラウドネス測定装置として機能させる。
【発明の効果】
【0016】
本発明によれば、オブジェクトベース方式の音声信号のラウドネス値を測定することが可能となる。
【図面の簡単な説明】
【0017】
【
図1】第1の実施形態に係るラウドネス測定装置の構成例を示すブロック図である。
【
図2A】再生位置情報に関して記載されたメタデータの一例を示す図である。
【
図2B】再生位置情報に関して記載されたメタデータの一例を示す図である。
【
図2C】再生位置情報の記載が省略されたメタデータの一例を示す図である。
【
図3】非特許文献6のA2.3 Example of S-ADM XML derived from ADM XML.に記載されたメタデータの一例を示す図である。
【
図5】第2の実施形態に係るラウドネス測定装置の構成例を示すブロック図である。
【
図6】ゲイン情報に関して記載されたメタデータの一例を示す図である。
【
図7】第3の実施形態に係るラウドネス測定装置の構成例を示すブロック図である。
【
図8】マトリクス情報に関して記載されたメタデータの第1の例を示す図である。
【
図9】マトリクス情報に関して記載されたメタデータの第2の例を示す図である。
【
図10】第4の実施形態に係るラウドネス測定装置の構成例を示すブロック図である。
【
図11A】第4の実施形態に係るラウドネス測定装置におけるマトリクス・ゲイン処理部の第1の構成例を示す図である。
【
図11B】第4の実施形態に係るラウドネス測定装置におけるマトリクス・ゲイン処理部の第2の構成例を示す図である。
【
図11C】第4の実施形態に係るラウドネス測定装置におけるマトリクス・ゲイン処理部の第3の構成例を示す図である。
【
図12】第5の実施形態に係るラウドネス測定装置の構成例を示すブロック図である。
【発明を実施するための形態】
【0018】
以下、実施形態について、図面を参照して詳細に説明する。実施形態に係るラウドネス測定装置は、一例として非特許文献1に記載の規格に準じてラウドネス測定を行うものとする。また、入力されるオブジェクトベース音声信号に関するメタデータを、非特許文献4,5に記載のADM(Audio Definition Model)に則った形式とし、ラウドネス測定装置は非特許文献6に規定されたS-ADM形式のメタデータを含むデジタルオーディオ信号、又は、非特許文献7に規定されたファイル(BW64、BWF形式等)からメタデータを読み込むこととするが、これに限定されるものではない。また、メタデータが読み込まれなかった場合に使用する数値を事前に決めて、読み込むメタデータの代わりに測定に用いてもよい。事前に決めておく数値としては、非特許文献5に共通定義として規定されるスピーカ配置(audioPackFormat)やスピーカ位置(audioChannelFormart)、非特許文献4に省略した場合に使用する数値が決まっている開始時刻(start)や信号利得(gain)のほか、頻繁に使用するメタデータの組合せなどを独自に設定してもよい。
【0019】
(第1の実施形態)
第1の実施形態に係るラウドネス測定装置について、以下に説明する。
図1は、第1の実施形態に係るラウドネス測定装置の構成例を示す図である。
図1に示すラウドネス測定装置1は、K特性フィルタ部11と、二乗平均部12と、重み付け部13と、メタデータ解析部14と、合算部15と、デシベルスケール変換部16と、ゲーティング部17と、を備える。ラウドネス測定装置1は、複数チャンネルのオブジェクトベース音声信号のラウドネス値を測定する。
【0020】
K特性フィルタ部11は、入力されたオブジェクトベース音声信号xk(k=1~m)に対して、勧告ITU-R BS.1770で規定されている聴感補正フィルタによりフィルタ処理を行い、二乗平均部12に出力する。K特性フィルタ部11は、2つのプリフィルタで構成されている。1段目のフィルタは、頭部音響効果をシミュレーションしたフィルタである。2段目のフィルタは、RLB特性(修正B特性)を有するハイパスフィルタである。K特性フィルタ部11により、人の聴感特性に近い測定が可能となる。
【0021】
二乗平均部12は、信号のパワーを求めるために、各チャンネルについてK特性フィルタによって処理された信号を二乗平均したパワー信号を生成し、パワー信号を重み付け部13に出力する。
【0022】
メタデータ解析部14は、オブジェクトベース音声信号に関するメタデータを入力し、デコードする。そして、メタデータ解析部14は、メタデータを解析して、オブジェクトベース音声信号の各チャンネルの再生位置を示す方位角θm及び仰角φmの情報(再生位置情報)を取得し、再生位置情報を重み付け部13に出力する。
【0023】
メタデータ解析部14の再生位置情報の取得方法について、以下に具体例を示す。
図2は、再生位置情報に関して記載されたメタデータの一例を示す図である。なお、下線は説明のために付したものである。メタデータ解析部14は、〈position coordinate="azimuth"〉30.0の記載から、方位角(azimuth)θ=30.0°と判断する。また、メタデータ解析部14は、〈position coordinate="elevation"〉0.0の記載から、仰角(elevation)φ=0.0°と判断する。
【0024】
ところで、現在実用化されているモノ(mono)、ステレオ(stereo, 0+2+0)など大半のチャンネルベース方式のサウンドシステムについては、予め共通定義(一例として、非特許文献5)を定めることにより、記載するメタデータ量を削減することできる。したがって、メタデータ解析部14は、再生位置情報などをメタデータとして入力する代わりに、予め保持する共通定義から取得してもよい。
【0025】
例えば、
図2Bでは、〈position coordinate="azimuth"〉、〈position coordinate="elevation"〉の記載から、方位角(azimuth)θ=0.0°、仰角(elevation)φ=0.0°と判断できる。一方、<audioPackFormatIDRef>AP_00010001の記載と非特許文献5の共通定義を併せると、TABLE2の定義からaudioChannelIDがAC_00010003であり、TABLE1の定義から、AC_00010003は方位角(Azimuth)θ=0.0°、仰角(Elevation)φ=0.0°と対応するため、audioChannelFormatなどの要素を省略し、
図2Cのようにメタデータを記載することが許されている。この場合、
図2Cのメタデータの解析には、メタデータ解析部14が、予め非特許文献5のTABLE1、2に示すような共通定義を保持しておき、該共通定義から再生位置情報を取得する。
【0026】
音声信号が実際に記録されている音声チャンネルの番号(物理的なチャンネル番号)とメタデータに記載されている音声信号の順番(重み付けを適用するチャンネル番号)との対応は、S-ADM入力の場合には〈audioTrackUIDRef〉と〈audioTrack trackID〉で対応付けられ(非特許文献6参照)、ファイル入力の場合には〈trackIndex〉で対応付けられる(非特許文献7参照)。
【0027】
図3は、非特許文献6のA2.3 Example of S-ADM XML derived from ADM XML.に記載されたメタデータの一例を示す図である。なお、下線は説明のために付したものである。例えば、非特許文献4に記載の
図1のようにID関連のメタデータをたどると、
図3に記載のS-ADM入力のメタデータの例では、〈audioTrackUIDRef〉ATU_00000001に対応する〈audioTrack trackID=“1”〉から、入力信号のチャンネル1が物理的なチャンネル番号であることが分かる。
【0028】
図4は、メタデータの一例を示す図である。なお、下線は説明のために付したものである。
図4に記載のファイル入力のメタデータの例では、〈audioTrackUIDRef〉ATU_00000001に対応するのはAT_00031001_01であるから、物理的なチャンネル(トラック)1がメタデータ上での音声チャンネルAC_00031001の重み付けを適用するチャンネルであることが分かる。すなわち、メタデータ解析部14は、
図2の記載と、
図3又は
図4の記載とから、オブジェクトベース音声信号x
1の再生位置は、方位角θ
1=30.0°及び仰角φ
1=0.0°であると解析する。
【0029】
重み付け部13は、メタデータ解析部14から入力された再生位置情報に基づいて、方位角及び仰角に応じて各チャンネルの重み係数を決定する。例えば、重み付け部13は、下記の表1に従って、重み係数を決定する。表1に従うと、上述したようにメタデータ解析部14がオブジェクトベース音声信号x1の再生位置を、方位角θ1=30.0°及び仰角φ1=0.0°と解析した場合には、重み付け部13は、チャンネル1の重み係数を1.0と決定する。
【0030】
【0031】
そして、重み付け部13は、二乗平均部12から入力されたパワー信号に対して、決定した重み係数を乗じて重み付けを行い、合算部15に出力する。人が聴取する音は、到来方向(耳に対する音の入射角)によって、耳殻、頭部、肩などの影響が異なり、その結果、聴取する音量も変化することが知られており、重み付け部13によりこの音量の変化を補正することができる。
【0032】
合算部15は、重み付け部13により重み付けされた各チャンネルの信号の合算値を算出し、デシベルスケール変換部16に出力する。
【0033】
デシベルスケール変換部16は、重み付け部13から入力された合算値を、次式(1)によりデシベルスケールに変換してラウドネス値LKを算出し、ゲーティング部17に出力する。
【0034】
【0035】
ゲーティング部17は、デシベルスケール変換部16から入力されたラウドネス値LKに対して、ゲーティングブロック、オーバーラップ法、絶対ゲーティング、及び相対ゲーティングの4つの要素からなるゲーティング関数を適用して平均ラウドネス値を算出する。詳細については、非特許文献1を参照されたい。
【0036】
上述したように、ラウドネス測定装置1は、オブジェクトベース音声信号に関するメタデータを解析して再生位置情報を取得し、再生位置情報に基づいて重み付けを行う。そのため、ラウドネス測定装置1によれば、オブジェクトベース音声信号のラウドネス値を測定することが可能となる。また、ラウドネス測定装置1は、レンダリング処理を行わないため、信号処理コストを低くすることができ、さらに再生フォーマットによらず一意にラウドネス値を定めることが可能となる。
【0037】
(第2の実施形態)
次に、第2の実施形態に係るラウドネス測定装置について説明する。
図5は、第2の実施形態に係るラウドネス測定装置の構成例を示す図である。
図5に示すラウドネス測定装置2は、K特性フィルタ部11と、二乗平均部12と、重み付け部13と、メタデータ解析部14と、合算部15と、デシベルスケール変換部16と、ゲーティング部17と、ゲイン処理部18と、を備える。本実施形態のラウドネス測定装置2は、第1の実施形態のラウドネス測定装置1と比較して、さらにゲイン処理部18を備える点が相違する。
【0038】
メタデータ解析部14は、オブジェクトベース音声信号に関するメタデータを解析してオブジェクトベース音声信号の各チャンネルのゲインを示すゲイン情報を取得し、ゲイン処理部18に出力する。具定例については、非特許文献4のセクション12を参照されたい。また、メタデータ解析部14は、第1の実施形態と同様に再生位置情報を取得し、重み付け部13に出力する。
【0039】
図6は、ゲイン情報に関して記載されたメタデータの一例を示す図である。なお、下線は説明のために付したものである。
【0040】
上述したように、各チャンネル番号とメタデータとの対応は、S-ADM入力の場合には〈audioTrackUIDRef〉と〈audioTrack trackID〉で対応付けられ(非特許文献6参照)、ファイル入力の場合には〈trackIndex〉で対応づけられる(非特許文献7参照)。
【0041】
例えば、
図3に示したメタデータの例では、〈audioTrackUIDRef〉がATU_00000001であり、
図6を参照すると〈gain〉1.0であり、S-ADMのATU_00000001に対応するのは〈audioTrack trackID=“1”〉であるから、メタデータ解析部14は、入力信号のチャンネル1(オブジェクトベース音声信号x
1)のゲインは1.0倍であると判断する。また、
図4に示したメタデータの例では、ATU_00000001に対応するのはtrackIndex=1であるから、メタデータ解析部14は、ファイルのチャンネル(トラック)1のゲインは1.0倍であると判断する。すなわち、メタデータ解析部14は、
図6の記載と、
図3又は
図4の記載とから、オブジェクトベース音声信号x
1のゲインは1.0倍であると解析する。
【0042】
ゲイン処理部18は、メタデータ解析部14から入力されたゲイン情報に従い、オブジェクトベース音声信号xk(k=1~m)のそれぞれにゲインを乗じて信号yk(k=1~m)を生成し、K特性フィルタ部11に出力する。
【0043】
K特性フィルタ部11は、ゲイン処理部18によるゲイン乗算処理後のオブジェクトベース音声信号yk(k=1~m)に対してフィルタ処理を行う。以降の処理は第1の実施形態と同様であるため、説明を省略する。
【0044】
上述したように、ラウドネス測定装置2は、オブジェクトベース音声信号に関するメタデータを解析してゲイン情報を取得し、ゲイン情報に基づいてゲインの乗算を行う。そのため、ラウドネス測定装置2によれば、ゲイン調整が行われる場合であっても、オブジェクトベース音声信号のラウドネス値を測定することが可能となる。また、ラウドネス測定装置2は、第1の実施形態と同様にレンダリング処理を行わないため、信号処理コストを低くすることができ、さらに再生フォーマットによらず一意にラウドネス値を定めることが可能となる。
【0045】
(第3の実施形態)
次に、第3の実施形態に係るラウドネス測定装置について説明する。
図7は、第3の実施形態に係るラウドネス測定装置の構成例を示す図である。
図7に示すラウドネス測定装置3は、K特性フィルタ部11と、二乗平均部12と、重み付け部13と、メタデータ解析部14と、合算部15と、デシベルスケール変換部16と、ゲーティング部17と、マトリクス処理部19と、を備える。本実施形態のラウドネス測定装置3は、第1の実施形態のラウドネス測定装置1と比較して、さらにマトリクス処理部19を備える点が相違する。
【0046】
オブジェクトベース方式では、あるオブジェクト音を複数のチャンネルから所定のゲインで再生させることができる。例えば、5.1サラウンドや22.2チャンネルなどマルチチャンネル音響方式のコンテンツにおいて、あるオブジェクト音の音像に幅をもたせたいとか、解説音声が他チャンネルの背景音で埋もれないよう、主となるチャンネルの近傍の複数チャンネルにも当該音声信号を分配するなどダイバージェンスと呼ばれる処理を行う際には、マトリクス処理が行われる。ラウドネス測定装置3は、マトリクス処理が行われる場合のラウドネス値の測定を可能とするものである。
【0047】
メタデータ解析部14は、オブジェクトベース音声信号に関するメタデータを解析して、オブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報を取得し、マトリクス処理部19に出力する。また、メタデータ解析部14は、第1の実施形態と同様に再生位置情報を取得し、重み付け部13に出力する。
【0048】
図8は、マトリクス情報に関して記載されたメタデータの第1の例を示す図である。なお、下線は説明のために付したものである。ここでは、3チャンネル目の入力信号x
3(AC_00010003)が、マトリクス処理により1チャンネル目の出力信号y
1(AC_00010001)と2チャンネル目の出力信号y
2(AC_00010002)にルーティングされる例を示している。メタデータ解析部14は、
図8の下線部の記載から、出力信号y
1及び出力信号y
2を得るための、入力信号x
3に対する係数が0.354813であると判断する。
【0049】
図9は、マトリクス情報に関して記載されたメタデータの第2の例を示す図である。なお、下線は説明のために付したものである。ここでは、1チャンネル目の入力信号x
1(AC_00010001)と2チャンネル目の入力信号x
2(AC_00010002)をまとめて3チャンネル目の出力信号y
3(AC_00010003)から出力する例を示している。メタデータ解析部14は、
図9の下線部の記載から、出力信号y
3を得るための、入力信号x
1及び入力信号x
2に対する係数が0.707106であると判断する。
【0050】
マトリクス処理部19は、メタデータ解析部14から入力されたマトリクス情報に従い、オブジェクトベース音声信号x
k(k=1~m)に対して係数を用いてマトリクス演算を行い、信号y
k(k=1~p)生成し、K特性フィルタ部11に出力する。具体的には、上述した
図8に示す例では、出力信号y
1の値を、入力信号x
3の値に0.354813を乗じた値とし、出力信号y
2の値を、入力信号x
3の値に0.354813を乗じた値とする。また、上述した
図9に示す例では、出力信号y
3の値を、入力信号x
1の値に0.707106を乗じた値と、入力信号x
3の値に0.707106を乗じた値とを加算した値とする。
【0051】
K特性フィルタ部11は、マトリクス処理部19によるマトリクス演算処理後のオブジェクトベース音声信号yk(k=1~p)に対してフィルタ処理を行う。以降の処理は第1の実施形態と同様であるため、説明を省略する。
【0052】
上述したように、ラウドネス測定装置3は、オブジェクトベース音声信号に関するメタデータを解析してマトリクス情報を取得し、マトリクス情報に基づいてマトリクス演算を行う。そのため、ラウドネス測定装置3によれば、ダイバージェンス処理やミックス処理が行われる場合であっても、オブジェクトベース音声信号のラウドネス値を測定することが可能となる。また、ラウドネス測定装置3は、第1の実施形態と同様にレンダリング処理を行わないため、信号処理コストを低くすることができ、さらに再生フォーマットによらず一意にラウドネス値を定めることが可能となる。
【0053】
(第4の実施形態)
次に、第4の実施形態に係るラウドネス測定装置について説明する。
図10は、第4の実施形態に係るラウドネス測定装置の構成例を示す図である。
図10に示すラウドネス測定装置4は、K特性フィルタ部11と、二乗平均部12と、重み付け部13と、メタデータ解析部14と、合算部15と、デシベルスケール変換部16と、ゲーティング部17と、マトリクス・ゲイン処理部20と、を備える。本実施形態のラウドネス測定装置4は、第1の実施形態のラウドネス測定装置1と比較して、さらにマトリクス・ゲイン処理部20を備える点が相違する。
【0054】
本実施形態では、マトリクス・ゲイン処理部20において、マトリクス処理に加えてゲイン処理を行う。そのため、メタデータ解析部14は、オブジェクトベース音声信号に関するメタデータを解析して、第3の実施形態と同様にオブジェクトベース音声信号のマトリクス演算に用いる係数を示すマトリクス情報を取得し、マトリクス・ゲイン処理部20に出力する。また、メタデータ解析部14は、第2の実施形態と同様に各チャンネルのゲインを示すゲイン情報を取得し、マトリクス・ゲイン処理部20に出力する。また、メタデータ解析部14は、第1の実施形態と同様に再生位置情報を取得し、重み付け部13に出力する。
【0055】
マトリクス・ゲイン処理部20は、メタデータ解析部14から入力されたマトリクス情報及びゲイン情報に従い、オブジェクトベース音声信号xk(k=1~m)に対してマトリクス演算及びゲイン乗算を行い信号yk(k=1~p)生成し、K特性フィルタ部11に出力する。
【0056】
図11は、マトリクス・ゲイン処理部20の構成例を示す図である。
図11Aに示す例では、マトリクス・ゲイン処理部20は、マトリクス処理部201と、第1ゲイン処理部202とを備える。マトリクス処理部201は、メタデータ解析部14から入力されたマトリクス情報に従い、入力信号x
1~x
mに対してマトリクス演算処理を行い、信号y’
1~y’
pを求め、第1ゲイン処理部202に出力する。第1ゲイン処理部202は、メタデータ解析部14から入力されたゲイン情報に従い、信号y’
1~y’
pに対してゲイン処理を行い、出力信号y
1~y
pを求める。
【0057】
図11Bに示す例では、マトリクス・ゲイン処理部20は、第2ゲイン処理部203と、マトリクス処理部201と、を備える。第2ゲイン処理部203は、メタデータ解析部14から入力されたゲイン情報に従い、入力信号x
1~x
mに対してゲイン処理を行い、出力信号y’
1~y’
mを求め、マトリクス処理部201に出力する。マトリクス処理部201は、メタデータ解析部14から入力されたマトリクス情報に従い、信号y’
1~y’
mに対してマトリクス演算処理を行い、出力信号y
1~y
pを求める。
【0058】
図11Cに示す例では、マトリクス・ゲイン処理部20は、第2ゲイン処理部203と、マトリクス処理部201と、第1ゲイン処理部202と、を備える。第2ゲイン処理部203は、メタデータ解析部14から入力されたゲイン情報に従い、入力信号x
1~x
mに対してゲイン処理を行い、出力信号y’
1~y’
mを求め、マトリクス処理部201に出力する。マトリクス処理部201は、メタデータ解析部14から入力されたマトリクス情報に従い、信号y’
1~y’
mに対してマトリクス演算処理を行い、信号y”
1~y”
pを求める。第1ゲイン処理部202は、メタデータ解析部14から入力されたゲイン情報に従い、信号y”
1~y”
pに対してゲイン処理を行い、出力信号y
1~y
pを求める。
【0059】
K特性フィルタ部11は、マトリクス・ゲイン処理部20によるマトリクス演算及びゲイン乗算の処理後のオブジェクトベース音声信号yk(k=1~p)に対してフィルタ処理を行う。以降の処理は第1の実施形態と同様であるため、説明を省略する。
【0060】
上述したように、ラウドネス測定装置4は、オブジェクトベース音声信号に関するメタデータを解析してマトリクス情報及びゲイン情報を取得し、マトリクス情報及びゲイン情報に基づいてマトリクス演算及びゲイン乗算を行う。そのため、ラウドネス測定装置4によれば、ダイバージェンス処理やミックス処理に加えてゲイン調整が行われる場合であっても、オブジェクトベース音声信号のラウドネス値を測定することが可能となる。また、ラウドネス測定装置4は、第1の実施形態と同様にレンダリング処理を行わないため、信号処理コストを低くすることができ、さらに再生フォーマットによらず一意にラウドネス値を定めることが可能となる。
【0061】
(第5の実施形態)
次に、第5の実施形態に係るラウドネス測定装置について説明する。
図12は、第5の実施形態に係るラウドネス測定装置の構成例を示す図である。
図12に示すラウドネス測定装置5は、K特性フィルタ部11と、二乗平均部12と、重み付け部13と、合算部15と、デシベルスケール変換部16と、ゲーティング部17と、レンダリング処理部21と、を備える。本実施形態のラウドネス測定装置5は、第1の実施形態のラウドネス測定装置1と比較して、さらにレンダリング処理部21を備え、メタデータ解析部14がレンダリング処理部21に含まれる点が相違する。
【0062】
レンダリング処理部21は、メタデータ解析部14を有する。メタデータ解析部14は、オブジェクトベース音声信号に関するメタデータを解析して、第2の実施形態で説明したゲイン情報、第3の実施形態で説明したマトリクス情報の処理だけでなく、再生時のスピーカ配置に応じてオブジェクトベース音声信号をチャンネルベース方式の音声信号に変換する。レンダリング処理部21は二乗平均部12より前段に挿入されるため、音声信号を加算する際には位相情報も考慮される。レンダリング処理の詳細については、一例として下記文献を参照されたい。
“Audio Definition Model renderer for advanced sound systems”, Recommendation ITU-R BS. 2127-0, 06/2019
【0063】
メタデータ解析部14は、第1の実施形態と同様に再生位置情報を取得し、重み付け部13に出力する。
【0064】
レンダリング処理部21は、メタデータ解析部14により取得したレンダリング情報に従い、オブジェクトベース音声信号xk(k=1~m)に対してレンダリング処理を行い、チャンネルベース方式(5.1ch,7.1chなど)のnチャンネルの音声信号yk(k=1~n)に変換する。例えば、5.1chスピーカで再生する場合にはn=5であり、7.1chスピーカで再生する場合にはn=7である。
【0065】
K特性フィルタ部11は、レンダリング処理部21によるレンダリング処理後のオブジェクトベース音声信号yk(k=1~n)に対してフィルタ処理を行う。以降の処理は第1の実施形態と同様であるため、説明を省略する。
【0066】
上述したように、ラウドネス測定装置5は、オブジェクトベース音声信号に関するメタデータを解析してオブジェクトベース音声信号に対してレンダリング処理を行った後に、ラウドネス値を測定する。そのため、ラウドネス測定装置5によれば、再生フォーマットごとにラウドネス値を測定することになるが、測定されるラウドネス値が実際の聴感とより一致するため、ラウドネス値をより高精度に測定することが可能となる。
【0067】
〈プログラム〉
上記の実施形態として機能させるためにプログラム命令を実行可能なコンピュータを用いることも可能である。コンピュータは、ラウドネス測定装置1~5の機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのプロセッサによってこのプログラムを読み出して実行させることで実現することができ、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。プロセッサは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)などであってもよい。
【0068】
また、このプログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROMなどの記録媒体であってもよい。また、このプログラムは、ネットワークを介したダウンロードによって提供することもできる。
【0069】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の構成ブロックについて、複数を1つに組み合わせたり、1つを複数に分割したりすることが可能である。
【符号の説明】
【0070】
1,2,3,4,5 ラウドネス測定装置
11 K特性フィルタ部
12 二乗平均部
13 重み付け部
14 メタデータ解析部
15 合算部
16 デシベルスケール変換部
17 ゲーティング部
18 ゲイン処理部
19,201 マトリクス処理部
20 マトリクス・ゲイン処理部
21 レンダリング処理部
202 第1ゲイン処理部
203 第2ゲイン処理部