IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許6998823マルチチャンネル客観評価装置及びプログラム
<>
  • 特許-マルチチャンネル客観評価装置及びプログラム 図1
  • 特許-マルチチャンネル客観評価装置及びプログラム 図2
  • 特許-マルチチャンネル客観評価装置及びプログラム 図3
  • 特許-マルチチャンネル客観評価装置及びプログラム 図4
  • 特許-マルチチャンネル客観評価装置及びプログラム 図5
  • 特許-マルチチャンネル客観評価装置及びプログラム 図6
  • 特許-マルチチャンネル客観評価装置及びプログラム 図7
  • 特許-マルチチャンネル客観評価装置及びプログラム 図8
  • 特許-マルチチャンネル客観評価装置及びプログラム 図9
  • 特許-マルチチャンネル客観評価装置及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-23
(45)【発行日】2022-02-04
(54)【発明の名称】マルチチャンネル客観評価装置及びプログラム
(51)【国際特許分類】
   G10L 25/60 20130101AFI20220128BHJP
【FI】
G10L25/60
【請求項の数】 6
(21)【出願番号】P 2018078019
(22)【出願日】2018-04-13
(65)【公開番号】P2019184933
(43)【公開日】2019-10-24
【審査請求日】2021-02-26
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100121119
【弁理士】
【氏名又は名称】花村 泰伸
(72)【発明者】
【氏名】小倉 知美
(72)【発明者】
【氏名】小森 智康
(72)【発明者】
【氏名】杉本 岳大
【審査官】中村 天真
(56)【参考文献】
【文献】米国特許出願公開第2009/0171671(US,A1)
【文献】特表2016-521532(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-25/93
H04S 3/00- 3/02
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
2チャンネルを超えるマルチチャンネル音響信号を客観評価するマルチチャンネル客観評価装置において、
前記マルチチャンネル音響信号を構成するそれぞれの音響信号のチャンネルに対応して、チャンネル毎の伝搬特性を表す頭部インパルス応答(HRIR)またはバイノーラル室内インパルス応答(BRIR)を畳み込み信号として出力する畳み込み信号出力部と、
前記マルチチャンネル音響信号の原音及び劣化音を入力すると共に、前記畳み込み信号出力部により出力されたチャンネル毎の前記畳み込み信号を入力し、
チャンネル毎の前記原音に前記畳み込み信号を畳み込み、全てのチャンネルの畳み込み結果に基づいて、全てのチャンネルに共通の基本信号を生成すると共に、
チャンネル毎に、当該チャンネルを含む1または複数のチャンネルの前記劣化音に前記畳み込み信号を畳み込み、第1の畳み込み結果を生成し、全てのチャンネルのうち前記1または複数のチャンネル以外のチャンネルの前記原音に前記畳み込み信号を畳み込み、第2の畳み込み結果を生成し、前記第1の畳み込み結果及び前記第2の畳み込み結果に基づいて被測定信号を生成し、
チャンネル毎に、前記基本信号及び前記被測定信号からなるバイノーラル信号を生成する信号処理部と、
前記信号処理部により生成されたチャンネル毎の前記バイノーラル信号を入力し、チャンネル毎に、当該チャンネルの前記バイノーラル信号に基づき、所定のPEAQ(Perceptual Evaluation of Audio Quality)客観音質測定法を用いて、客観評価結果を生成する評価部と、
前記評価部により生成されたチャンネル毎の前記客観評価結果に基づいて、前記マルチチャンネル音響信号の客観評価結果をマルチチャンネル客観評価結果として生成するマルチチャンネル評価部と、
を備えたことを特徴とするマルチチャンネル客観評価装置。
【請求項2】
請求項1に記載のマルチチャンネル客観評価装置において、
前記畳み込み信号出力部は、
前記マルチチャンネル音響信号のチャンネルの数及び配置を定める音響方式の情報を入力し、予め設定されたデータベースから、前記音響方式に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、
前記データベースには、前記音響方式のチャンネル、及び当該チャンネルに対応する前記畳み込み信号が格納されている、ことを特徴とするマルチチャンネル客観評価装置。
【請求項3】
請求項1に記載のマルチチャンネル客観評価装置において、
前記畳み込み信号出力部は、
前記マルチチャンネル音響信号を構成するそれぞれの音響信号についての再生位置を定めるチャンネル毎の角度の情報を入力し、予め設定されたデータベースから、チャンネル毎の前記角度に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、
前記データベースには、前記角度、及び当該角度に対応する前記畳み込み信号が格納されている、ことを特徴とするマルチチャンネル客観評価装置。
【請求項4】
請求項1から3までのいずれか一項に記載のマルチチャンネル客観評価装置において、
前記マルチチャンネル評価部は、
前記評価部により生成されたチャンネル毎の前記客観評価結果のうち最低値を検出し、当該最低値を前記マルチチャンネル客観評価結果として生成する、ことを特徴とするマルチチャンネル客観評価装置。
【請求項5】
請求項1から3までのいずれか一項に記載のマルチチャンネル客観評価装置において、
前記マルチチャンネル評価部は、
前記評価部により生成されたチャンネル毎の前記客観評価結果に対し、所定のチャンネル毎の重み付け係数をそれぞれ乗算し、チャンネル毎の乗算結果を加算し、加算結果を前記マルチチャンネル客観評価結果として生成する、ことを特徴とするマルチチャンネル客観評価装置。
【請求項6】
コンピュータを、請求項1から5までのいずれか一項に記載のマルチチャンネル客観評価装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、2チャンネルを超えるマルチチャンネル音響システムに用いるマルチチャンネル音響信号の品質を客観評価するマルチチャンネル客観評価装置及びプログラムに関する。
【背景技術】
【0002】
従来、マルチチャンネル音響システムにおいて、音響信号の品質を評価する方法が知られている。例えば、音響信号の品質を主観的に評価する方法として、マルチチャンネル音響システムを含む劣化の少ない音響システムの主観評価法がITU-R勧告BS.1116-3に定められている(例えば、非特許文献1を参照)。
【0003】
一方、ITU-R勧告BS.1116-3に則して行った主観評価に対応した音質を客観的に測定する客観評価法がITU-R勧告BS.1387-1に定められている(例えば、非特許文献2を参照)。このITU-R勧告BS.1387-1に定めた客観評価法は、PEAQ(Perceptual Evaluation of Audio Quality)客観音質測定法と呼ばれている。
【0004】
PEAQ客観音質測定法は、音響信号の品質を客観的に測定するための標準化アルゴリズムにて実現され、人間の耳の知覚特性を反映した聴覚モデル、及びニューラルネットワーク構造を有する認識モデルを用いて、客観評価値を求めるものである。詳細については後述する。
【0005】
一般に、信頼性の高い主観評価を行うには、多くの被験者、多大な時間及び労力を必要とするため、全ての音源に対して主観評価を行うのは現実的でない。このため、予め客観評価を行うことにより、主観評価に使用するパラメータを選定するようにしている。
【0006】
しかしながら、前述のITU-R勧告BS.1387-1に定めた客観評価法は、1チャンネルまたは2チャンネルの音響システムに適用した方法である。このため、この客観評価法は、22.2ch(チャンネル)等の2チャンネルを超えるマルチチャンネル音響システム(例えば、非特許文献3を参照)に対して用いることができない。
【0007】
そこで、2チャンネルを超えるマルチチャンネル音響システムにおいて、マルチチャンネル音響信号の品質を客観的に評価する方法が提案されている(例えば、非特許文献4を参照)。この方法は、マルチチャンネル音響信号の原音及び劣化音に頭部インパルス応答HRIR(Head Related Impulse Response)をそれぞれ畳み込んで2チャンネル信号に変換し、客観評価を行うものである。
【先行技術文献】
【非特許文献】
【0008】
【文献】Rec. ITU-R BS.1116-3,“Methods for the subjective assessment of small impairments in audio systems”,2015
【文献】Rec. ITU-R BS.1387-1,“Method for objective measurements of perceived audio quality”,2001
【文献】Rec. ITU-R BS.2051,“Advanced sound system for programme production”,2014
【文献】J.LIEBETRAU etc,“Standardization of PEAQ-MC:Extension of ITU-R BS.1387-1 to multichannel audio”,J. Audio Eng. Soc. 40th International Conference,2010
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、前述の非特許文献4は、2チャンネルを超えるマルチチャンネル音響システムに用いるマルチチャンネル音響信号の品質を客観的に評価する場合に、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法とは異なり、両耳間時間差、両耳間レベル差等も用いた認識モデルを用いている。また、非特許文献4により求められる客観評価結果は、前述の非特許文献1のITU-R勧告BS.1116-3に定めた主観評価法により求められる主観評価結果を十分に反映した値ではない。このため、ITU-R(国際電気通信連合の無線通信部門)は、前述の非特許文献4の方法を用いて標準化を試みたが、承認されずに現在に至っている。
【0010】
ところで、2チャンネルを超えるマルチチャンネル音響システムにおいて、符号化等により劣化した音響信号を主観評価する場合、人間は、全ての方向の音響信号を集中して聞き比べることが苦手である。このため、音響信号のチャンネル数が多い場合、主観評価値が上がる傾向がある。
【0011】
また、音像が動くコンテンツについても、人間は、全ての方向の音響信号を頭で記憶しながら集中して聞き比べることが苦手である。このため、チャンネル数が多い場合には、同様に主観評価値が上がる傾向がある。
【0012】
マルチチャンネル音響信号は人間へ提示されるものであるから、客観評価値は、このような主観評価値の傾向が反映された値となることが望ましい。つまり、2チャンネルを超えるマルチチャンネル音響信号の品質を客観的に評価する方法は、主観評価値への影響を考慮した客観評価法であることが望ましい。
【0013】
前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法は、主観評価値への影響を考慮した客観評価法であるが、2チャンネルの音響信号に適用する方法であり、2チャンネルを超えるマルチチャンネル音響信号に適用する方法ではない。
【0014】
ここで、前述の非特許文献4の方法に、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法を組み込んだ新たな手法を想定することができる。この想定手法は、マルチチャンネル音響信号の原音及び劣化音に頭部インパルス応答HRIRをそれぞれ畳み込み、原音及び劣化音の畳み込み結果をそれぞれ加算して2チャンネル信号を生成し、この2チャンネル信号を用いて、PEAQ客観音質測定法により客観評価値を求めるものである。
【0015】
この想定手法は、主観評価に対応した音質を客観的に測定するPEAQ客観音質測定法を用いるものであるが、後述する図10の実験結果に示すように、その客観評価結果は、主観評価結果に近い値にならない。
【0016】
主観評価結果と客観評価結果が異なる要因として、加算された音響信号にはそれぞれのチャンネルの劣化も加算されているが、評価者がその全てに対してステレオ信号と同様の精度で評価することが難しいということが推察される。
【0017】
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、2チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能なマルチチャンネル客観評価装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0018】
前記課題を解決するために、請求項1のマルチチャンネル客観評価装置は、2チャンネルを超えるマルチチャンネル音響信号を客観評価するマルチチャンネル客観評価装置において、前記マルチチャンネル音響信号を構成するそれぞれの音響信号のチャンネルに対応して、チャンネル毎の伝搬特性を表す頭部インパルス応答(HRIR)またはバイノーラル室内インパルス応答(BRIR)を畳み込み信号として出力する畳み込み信号出力部と、前記マルチチャンネル音響信号の原音及び劣化音を入力すると共に、前記畳み込み信号出力部により出力されたチャンネル毎の前記畳み込み信号を入力し、チャンネル毎の前記原音に前記畳み込み信号を畳み込み、全てのチャンネルの畳み込み結果に基づいて、全てのチャンネルに共通の基本信号を生成すると共に、チャンネル毎に、当該チャンネルを含む1または複数のチャンネルの前記劣化音に前記畳み込み信号を畳み込み、第1の畳み込み結果を生成し、全てのチャンネルのうち前記1または複数のチャンネル以外のチャンネルの前記原音に前記畳み込み信号を畳み込み、第2の畳み込み結果を生成し、前記第1の畳み込み結果及び前記第2の畳み込み結果に基づいて被測定信号を生成し、チャンネル毎に、前記基本信号及び前記被測定信号からなるバイノーラル信号を生成する信号処理部と、前記信号処理部により生成されたチャンネル毎の前記バイノーラル信号を入力し、チャンネル毎に、当該チャンネルの前記バイノーラル信号に基づき、所定のPEAQ(Perceptual Evaluation of Audio Quality)客観音質測定法を用いて、客観評価結果を生成する評価部と、前記評価部により生成されたチャンネル毎の前記客観評価結果に基づいて、前記マルチチャンネル音響信号の客観評価結果をマルチチャンネル客観評価結果として生成するマルチチャンネル評価部と、を備えたことを特徴とする。
【0019】
また、請求項2のマルチチャンネル客観評価装置は、請求項1に記載のマルチチャンネル客観評価装置において、前記畳み込み信号出力部が、前記マルチチャンネル音響信号のチャンネルの数及び配置を定める音響方式の情報を入力し、予め設定されたデータベースから、前記音響方式に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、前記データベースには、前記音響方式のチャンネル、及び当該チャンネルに対応する前記畳み込み信号が格納されている、ことを特徴とする。
【0020】
また、請求項3のマルチチャンネル客観評価装置は、請求項1に記載のマルチチャンネル客観評価装置において、前記畳み込み信号出力部が、前記マルチチャンネル音響信号を構成するそれぞれの音響信号についての再生位置を定めるチャンネル毎の角度の情報を入力し、予め設定されたデータベースから、チャンネル毎の前記角度に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、前記データベースには、前記角度、及び当該角度に対応する前記畳み込み信号が格納されている、ことを特徴とする。
【0021】
また、請求項4のマルチチャンネル客観評価装置は、請求項1から3までのいずれか一項に記載のマルチチャンネル客観評価装置において、前記マルチチャンネル評価部が、前記評価部により生成されたチャンネル毎の前記客観評価結果のうち最低値を検出し、当該最低値を前記マルチチャンネル客観評価結果として生成する、ことを特徴とする。
【0022】
また、請求項5のマルチチャンネル客観評価装置は、請求項1から3までのいずれか一項に記載のマルチチャンネル客観評価装置において、前記マルチチャンネル評価部が、前記評価部により生成されたチャンネル毎の前記客観評価結果に対し、所定のチャンネル毎の重み付け係数をそれぞれ乗算し、チャンネル毎の乗算結果を加算し、加算結果を前記マルチチャンネル客観評価結果として生成する、ことを特徴とする。
【0023】
また、請求項6のプログラムは、コンピュータを、請求項1から5までのいずれか一項に記載のマルチチャンネル客観評価装置として機能させることを特徴とする。
【発明の効果】
【0024】
以上のように、本発明によれば、2チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。
【図面の簡単な説明】
【0025】
図1】本発明の実施形態によるマルチチャンネル客観評価装置の構成例を示すブロック図である。
図2】マルチチャンネル客観評価装置の処理例を示すフローチャートである。
図3】畳み込み信号出力部の処理例を示すフローチャートである。
図4】DBのデータ構成例を示す図である。
図5】信号処理部の第1処理例を示すフローチャートである。
図6】信号処理部の第2処理例を示すフローチャートである。
図7】マルチチャンネル評価部の第1処理例を示すフローチャートである。
図8】マルチチャンネル評価部の第2処理例を示すフローチャートである。
図9】マルチチャンネル評価部による重み付け係数W1~24の設定処理例を示すフローチャートである。
図10】実験結果を示す図である。
【発明を実施するための形態】
【0026】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔発明の概要〕
符号化等により劣化した音響信号(以下、「劣化音」という。)を主観評価する場合、人間は、個別の音源の音質劣化に着目して評価する傾向がある。また、マルチチャンネル音響システムにおいて、マルチチャンネル音響信号を再生する際の音源は、あるチャンネル(例えば正面方向のチャンネル、またはペアとなるチャンネル)について最も大きなレベルでミキシングされる。
【0027】
このような状況を鑑み、本発明の実施形態のマルチチャンネル客観評価装置は、あるチャンネルの音質劣化の度合いを主観評価と近似させるために、所定のチャンネルのみを劣化音とし、その他のチャンネルを原音として扱う。そして、マルチチャンネル客観評価装置は、これらの劣化音及び原音を用いてバイノーラル信号を生成し、このバイノーラル信号を客観評価対象の入力信号とし、客観評価を行う。
【0028】
具体的には、マルチチャンネル客観評価装置は、2チャンネルを超えるマルチチャンネル音響信号を構成するそれぞれの音響信号の原音及び劣化音を入力する。そして、マルチチャンネル客観評価装置は、チャンネル毎に、例えば全ての原音及び当該チャンネルのみの劣化音を用いた畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号を生成する。
【0029】
マルチチャンネル客観評価装置は、バイノーラル信号を客観評価対象の入力信号として、チャンネル毎に、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法により客観評価値を求める。そして、マルチチャンネル客観評価装置は、チャンネル毎の客観評価値に基づいて、マルチチャンネルの客観評価値を求める。
【0030】
これにより、客観評価対象のバイノーラル信号は、個別の音源の音質劣化に着目して生成される主観評価を考慮した信号であるから、バイノーラル信号の客観評価値から生成されるマルチチャンネルの客観評価値は、主観評価値に近い値となる。したがって、2チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。
【0031】
〔マルチチャンネル客観評価装置〕
まず、本発明の実施形態によるマルチチャンネル客観評価装置の構成及び処理について説明する。図1は、本発明の実施形態によるマルチチャンネル客観評価装置の構成例を示すブロック図である。
【0032】
このマルチチャンネル客観評価装置1は、2チャンネルを超えるマルチチャンネル音響信号を客観的に評価する装置であり、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法を活用し、前述の非特許文献1のITU-R勧告BS.1116-3に定めた主観評価法により求められる主観評価値に近いマルチチャンネルの客観評価値z(マルチチャンネル客観評価結果)を求める。マルチチャンネル客観評価装置1は、畳み込み信号出力部10、信号処理部11、PEAQ評価部12及びマルチチャンネル評価部13を備えている。
【0033】
マルチチャンネル客観評価装置1は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24を入力すると共に、再生位置情報Pを入力し、再生位置情報Pに基づいて、チャンネル毎の畳み込み信号を特定する。そして、マルチチャンネル客観評価装置1は、主観評価を考慮したチャンネル毎のバイノーラル信号を生成し、バイノーラル信号をPEAQ評価し、その結果に基づいて、主観評価を考慮したマルチチャンネルの客観評価値zを算出する。
【0034】
以下、マルチチャンネル音響信号の例として、音響方式が22.2chの場合の音響信号を挙げて具体的に説明する。22.2chのマルチチャンネル音響信号は、24チャンネルの音響信号により構成される。
【0035】
再生位置情報Pは、マルチチャンネル音響システムにおけるそれぞれの音響信号の再生位置に関する情報であり、例えば、マルチチャンネル音響信号の音響方式の情報、または再生位置に関する角度の情報である。本例の場合、再生位置情報Pとして、22.2chの音響方式の情報が入力される。音響方式により、チャンネルの数及び配置が一義的に決定される。または、再生位置情報Pとして、22.2chのマルチチャンネル音響信号を構成するそれぞれの音響信号についての(それぞれのチャンネルについての)仰角及び方位角(水平面の角度及び垂直面の角度)からなる角度の情報が入力される。
【0036】
図2は、マルチチャンネル客観評価装置1の処理例を示すフローチャートである。マルチチャンネル客観評価装置1は、マルチチャンネル音響信号を構成するそれぞれの音響信号の原音x1~24及び劣化音x’1~24を入力すると共に、再生位置情報Pを入力する(ステップS201)。マルチチャンネル客観評価装置1により、マルチチャンネル音響信号の原音x1~24を基準として劣化音x’1~24が客観的に評価される。
【0037】
マルチチャンネル客観評価装置1は、再生位置情報Pに基づき、チャンネル毎の畳み込み信号として、例えばチャンネル毎の伝搬特性を表す頭部インパルス応答HRIR1~24を特定する(ステップS202)。
【0038】
マルチチャンネル客観評価装置1は、チャンネル毎の原音x1~24、劣化音x’1~24及び頭部インパルス応答HRIR1~24に基づいて、主観評価を考慮した畳み込み処理を行い、チャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成する(ステップS203)。
【0039】
マルチチャンネル客観評価装置1は、チャンネル毎に、当該チャンネルのバイノーラル信号y1_ori~24_ori,y1_sig~24_sigに基づいて、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法によるPEAQ評価を行う(ステップS204)。そして、マルチチャンネル客観評価装置1は、チャンネル毎の客観評価値z1~24を求める。
【0040】
マルチチャンネル客観評価装置1は、チャンネル毎の客観評価値z1~24に基づいて、マルチチャンネルの客観評価値zを算出して出力する(ステップS205)。
【0041】
(畳み込み信号出力部10)
図1を参照して、畳み込み信号出力部10は、予め設定されたデータベース(DB、図示せず)を備えている。畳み込み信号出力部10は、24チャンネルの音響信号の再生位置情報Pを入力し、DBから、再生位置情報Pに対応するチャンネル毎の畳み込み信号、例えばチャンネル毎の頭部インパルス応答HRIR1~24を読み出す。そして、畳み込み信号出力部10は、チャンネル毎の頭部インパルス応答HRIR1~24を信号処理部11に出力する。
【0042】
図3は、畳み込み信号出力部10の処理例を示すフローチャートである。畳み込み信号出力部10は、再生位置情報Pを入力し(ステップS301)、再生位置情報Pに音響方式の情報が含まれるか、または角度の情報が含まれるかを判定する(ステップS302)。
【0043】
再生位置情報Pには、音響方式及び角度のうちいずれか一方の情報が含まれるものとする。22.2ch、11.1ch、7.1ch、5.1ch等のように、スピーカー配置が非特許文献3のように標準化された音響方式の場合、再生位置は固定であるため、プリセットを登録しておく。この場合、再生位置情報Pには、22.2ch等を識別するための音響方式の情報が含まれる。一方、固定の音響方式を用いない場合、再生位置情報Pには、チャンネル毎に再生位置を特定するための角度の情報が含まれる。
【0044】
畳み込み信号出力部10は、ステップS302において、再生位置情報Pに音響方式の情報が含まれると判定した場合(ステップS302:音響方式)、DBから、再生位置情報Pに含まれる音響方式に対応する頭部インパルス応答HRIR1~24を読み出す(ステップS303)。
【0045】
一方、畳み込み信号出力部10は、ステップS302において、再生位置情報Pに角度の情報が含まれると判定した場合(ステップS302:角度)、DBから、再生位置情報Pに含まれる角度に対応する頭部インパルス応答HRIR1~24を読み出す(ステップS304)。
【0046】
畳み込み信号出力部10は、ステップS303またはステップS304から移行して、チャンネル毎の頭部インパルス応答HRIR1~24を信号処理部11に出力する(ステップS305)。
【0047】
図4は、DBのデータ構成例を示す図である。このDBは、音響方式、チャンネル番号(ラベル)、仰角、方位角、及びこれらの情報に対応する畳み込み信号である頭部インパルス応答HRIR(スピーカー位置と人間の耳の位置との間の伝達関数に対応するインパルス応答)のデータから構成される。
【0048】
音響方式は、22.2ch、11.1ch、7.1ch、5.1ch等であり、チャンネル番号は、音響方式の各音響信号に対応した番号である。仰角は、スピーカー位置と人間の耳の位置との間の線が水平面となす角度であり、方位角は、スピーカー位置と人間の耳の位置との間の線が垂直面となす角度である。一般的に正面方向を仰角0度、方位角0度とする。
【0049】
図4に示すDBには、音響方式が22.2chの場合において、チャンネル番号3(ラベルがFC(フロントセンター))、仰角0°、方位角0°、及びこれらの情報に対応する頭部インパルス応答HRIR3等が格納されている。また、DBには、22.2ch以外の5.1ch等の音響方式のデータも格納されており、音響方式が5.1chの場合において、チャンネル番号3(ラベルがC(センター))、仰角0°、方位角0°、及びこれらの情報に対応する頭部インパルス応答HRIR3等が格納されている。
【0050】
畳み込み信号出力部10は、22.2chの音響方式の情報を含む再生位置情報Pを入力した場合、ステップS303において、22.2chの音響方式をキーとして図4のDBを検索する。そして、畳み込み信号出力部10は、DBから、22.2chの音響方式のチャンネル番号1~24に対応する頭部インパルス応答HRIR1~24をそれぞれ読み出す。
【0051】
これにより、畳み込み信号出力部10は、22.2chの音響方式に対応するチャンネル毎の頭部インパルス応答HRIR1~24を、各チャンネルの角度を意識することなく特定することができる。この場合のDBには、音響方式、チャンネル番号(ラベル)、及びこれらの情報に対応する頭部インパルス応答HRIRが格納されていればよい。
【0052】
また、畳み込み信号出力部10は、チャンネル毎の仰角及び方位角の情報を含む再生位置情報Pを入力した場合、ステップS304において、チャンネル毎の仰角及び方位角をキーとして図4のDBを検索する。そして、畳み込み信号出力部10は、DBから、チャンネル毎の仰角及び方位角に対応する頭部インパルス応答HRIR1~24をそれぞれ読み出す。
【0053】
これにより、畳み込み信号出力部10は、スピーカー配置がプリセットされていない、2以上のスピーカーが任意に配置されたマルチチャンネルシステムについて、チャンネル毎の角度に対応するチャンネル毎の頭部インパルス応答HRIR1~24を特定することができる。この場合のDBには、仰角、方位角、及びこれらの情報に対応する頭部インパルス応答HRIRが格納されていればよい。
【0054】
(信号処理部11)
図1に戻って、信号処理部11は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24を入力すると共に、畳み込み信号出力部10から頭部インパルス応答HRIR1~24を入力する。
【0055】
信号処理部11は、原音x1~24、劣化音x’1~24及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成する。具体的には、信号処理部11は、チャンネル毎に、例えば全ての原音x1~24、当該チャンネルを含む所定のチャンネルのみの劣化音x’(当該チャンネルのみの1つの劣化音x’、または当該チャンネルを含む複数チャンネルの劣化音x’)、及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行う。信号処理部11は、チャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigをPEAQ評価部12に出力する。
【0056】
ここで、マルチチャンネル音響信号のチャンネル数をM(本例ではM=24)とすると、チャンネル毎の(M個の)バイノーラル信号y1_ori~M_oriまたはy1_sig~M_sigを生成する際に、チャンネル毎にチャンネル数N(<M)の劣化音x’または原音xが用いられる。Mは2より大きい正の整数であり、劣化音x’または原音xのチャンネル数Nは、1以上かつマルチチャンネル音響信号のチャンネル数Mよりも小さい整数である(1≦N<M)。
【0057】
劣化音x’または原音xのチャンネル数Nは、チャンネル番号k(k=1~M)のチャンネルのバイノーラル信号yk_ori,yk_sigを生成する際の、そのチャンネル(チャンネル番号kのチャンネル)を含む1または2以上のチャンネルの数である。チャンネル番号kのチャンネルに加え、そのチャンネルに対して隣接するチャンネルを含むようにしてもよいし、チャンネル間相関を算出し、正規化相関係数が大きいチャンネルから選択するようにしてもよい。ここで、チャンネル番号kの信号をf(t)、隣接するチャンネルの信号をg(t)とすると、正規化相関関数σfgは、以下の数式(1)にて算出される。σf,σgは信号f(t),g(t)の標準偏差である。
【数1】
【0058】
バイノーラル信号y1_ori~24_ori,y1_sig~24_sigは、原音x1~24に対応する基本信号y1_ori~24_ori、及び劣化音x’1~24に対応する被測定信号y1_sig~24_sigにより構成される。基本信号y1_ori~24_ori及び被測定信号y1_sig~24_sigは、信号処理部11により、後述する図5または図6に示す処理例にて生成される。
【0059】
図5は、信号処理部11の第1処理例を示すフローチャートである。この第1処理例は、チャンネル毎に、全ての原音x1~24、当該チャンネルのみの劣化音x’、及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行い、バイノーラル信号y_ori,y1_sig~24_sigを生成する例である。マルチチャンネル音響信号のチャンネル数M=24、劣化音x’のチャンネル数N=1とする。
【0060】
信号処理部11は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24を入力すると共に、畳み込み信号出力部10から頭部インパルス応答HRIR1~24を入力する(ステップS501)。
【0061】
信号処理部11は、全ての原音x1~24及び頭部インパルス応答HRIR1~24を用いて畳み込み処理を行い、共通の基本信号y_oriを生成する(ステップS502)。
【0062】
具体的には、信号処理部11は、以下の数式(2)に示すように、チャンネル毎の原音x1~24にチャンネル毎の頭部インパルス応答HRIR1~24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、加算結果を、共通の基本信号y_oriとして生成する。
【数2】
【0063】
ここで、チャンネル番号kの基本信号をyk_ori、チャンネル番号iの原音をxi、チャンネル番号iの頭部インパルス応答をHRIRiとすると、基本信号yk_oriは、y_oriと同じになる。k,iは、それぞれ1から24までの整数であり、*は畳み込み演算を示す。
【0064】
信号処理部11は、チャンネル毎に、チャンネル数23(=M-N=24-1)の原音x及びチャンネル数1(=N)の劣化音x’、並びに全てのチャンネルの頭部インパルス応答HRIR1~24を用いて畳み込み処理を行い、チャンネル毎の被測定信号y1_sig~24_sigを生成する(ステップS503)。
【0065】
具体的には、信号処理部11は、チャンネル毎に、当該チャンネル(チャンネル番号kとする。)以外のチャンネル数23の原音xに頭部インパルス応答HRIRをそれぞれ畳み込み、チャンネル数23の畳み込み結果を加算し、チャンネル数23の原音xの加算結果を得る。そして、信号処理部11は、当該チャンネルにおけるチャンネル数1の劣化音x’に頭部インパルス応答HRIRを畳み込み、チャンネル数1の劣化音x’の畳み込み結果を得る。
【0066】
信号処理部11は、チャンネル数23の原音xの加算結果に、チャンネル数1(チャンネル番号kとする。)の劣化音x’の畳み込み結果を加算し、当該加算結果を、当該チャンネルの被測定信号yk_sigとし、チャンネル毎の被測定信号y1_sig~24_sigを生成する。
【0067】
尚、信号処理部11は、原音x1~24に頭部インパルス応答HRIR1~24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、当該チャンネルの原音xに頭部インパルス応答HRIRを畳み込み、前者の加算結果から後者の畳み込み結果を減算することで、チャンネル数23の原音xの加算結果を得るようにしてもよい。そして、信号処理部11は、チャンネル数23の原音xの加算結果に、チャンネル数1の劣化音x’の畳み込み結果を加算し、チャンネル毎の被測定信号y1_sig~24_sigを生成する。これは、後述する数式(3)の演算に相当する。
【0068】
ここで、チャンネル番号kの被測定信号をyk_sig、チャンネル番号i,kの原音をそれぞれxi,xk、チャンネル番号i,kの頭部インパルス応答をそれぞれHRIRi,HRIRk、チャンネル番号kの劣化音をx’kとすると、被測定信号yk_sigは、以下の数式にて表される。
【数3】
【0069】
尚、前記数式(3)は、劣化音x’のチャンネル数N=1の式であり、人間が1つのチャンネルに注目して主観評価することを想定したものである。しかし、実際は、音源の種類によっては人間が2以上のチャンネルに着目して主観評価することもあり得る。この場合、劣化音x’のチャンネル数N>1としたときの被測定信号yk_sigが算出される。劣化音x’のチャンネル数N>1の場合、前記数式(3)の右辺の第2項は、チャンネル数N分の原音xについて畳み込み演算が行われ、それぞれの演算結果が減算される。また、前記数式(3)の右辺の第3項は、チャンネル数N分の劣化音x’について畳み込み演算が行われ、それぞれの演算結果が加算される。
【0070】
信号処理部11は、ステップS502にて生成した基本信号y_ori、及びステップS503にて生成した被測定信号y1_sig~24_sigをPEAQ評価部12に出力する(ステップS504)。
【0071】
このように、基本信号y_oriは、全てのチャンネルの原音x1~24を用いた畳み込み処理にて生成される。また、被測定信号y1_sig~24_sigは、チャンネル毎に、当該チャンネル以外のチャンネル数23の原音x、及び当該チャンネルのチャンネル数1の劣化音x’を用いた畳み込み処理にて生成される。
【0072】
つまり、所定チャンネル(チャンネル番号kのチャンネル)のバイノーラル信号yk_ori,yk_sigは、全てのチャンネルの原音x1~24に基づいた基本信号y_oriと、全てのチャンネルの劣化音x’1~24のうち当該チャンネルの劣化音x’kに基づいた被測定信号yk_sigとにより構成される。このため、被測定信号y1_sig~24_sigは、マルチチャンネル音響において、個別の音源の音質劣化に着目して評価する主観評価を考慮したバイノーラル信号となる。
【0073】
図6は、信号処理部11の第2処理例を示すフローチャートである。この第2処理例は、チャンネル毎に、全ての劣化音x’1~24、当該チャンネルのみの原音x、及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行い、バイノーラル信号y1_ori~24_ori,y_sigを生成する例である。マルチチャンネル音響信号のチャンネル数M=24、劣化音x’のチャンネル数N=1とする。
【0074】
信号処理部11は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24を入力すると共に、畳み込み信号出力部10から頭部インパルス応答HRIR1~24を入力する(ステップS601)。
【0075】
信号処理部11は、全ての劣化音x’1~24及び頭部インパルス応答HRIR1~24を用いて畳み込み処理を行い、共通の被測定信号y_sigを生成する(ステップS602)。
【0076】
具体的には、信号処理部11は、以下の数式(4)に示すように、チャンネル毎の劣化音x’1~24にチャンネル毎の頭部インパルス応答HRIR1~24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、加算結果を、共通の被測定信号y_sigとして生成する。
【数4】
【0077】
ここで、チャンネル番号kの被測定信号をyk_sig、チャンネル番号iの劣化音をx’i、チャンネル番号iの頭部インパルス応答をHRIRiとすると、被測定信号をyk_sigは、y_sigと同じになる。
【0078】
信号処理部11は、チャンネル毎に、チャンネル数23の劣化音x’及びチャンネル数1の原音x、並びに全てのチャンネルの頭部インパルス応答HRIR1~24を用いて畳み込み処理を行い、チャンネル毎の基本信号y1_ori~24_oriを生成する(ステップS603)。
【0079】
具体的には、信号処理部11は、チャンネル毎に、当該チャンネル以外のチャンネル数23の劣化音x’に頭部インパルス応答HRIRをそれぞれ畳み込み、チャンネル数23の畳み込み結果を加算し、チャンネル数23の劣化音x’の加算結果を得る。そして、信号処理部11は、当該チャンネルにおけるチャンネル数1の原音xに頭部インパルス応答HRIRを畳み込み、チャンネル数1の原音xの畳み込み結果を得る。
【0080】
信号処理部11は、チャンネル数23の劣化音x’の加算結果に、チャンネル数1(チャンネル番号kとする。)の原音xの畳み込み結果を加算し、当該加算結果を、当該チャンネルの基本信号yk_oriとし、チャンネル毎の基本信号y1_ori~24_oriを生成する。
【0081】
尚、信号処理部11は、劣化音x’1~24に頭部インパルス応答HRIR1~24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、当該チャンネルの劣化音x’に頭部インパルス応答HRIRを畳み込み、前者の加算結果から後者の畳み込み結果を減算することで、チャンネル数23の劣化音x’の加算結果を得るようにしてもよい。そして、信号処理部11は、チャンネル数23の劣化音x’の加算結果に、チャンネル数1の原音xの畳み込み結果を加算し、チャンネル毎の基本信号y1_ori~24_oriを生成する。これは、後述する数式(5)の演算に相当する。
【0082】
ここで、チャンネル番号kの基本信号をyk_ori、チャンネル番号i,kの劣化音をそれぞれx’i,x’k、チャンネル番号i,kの頭部インパルス応答をそれぞれHRIRi,HRIRk、チャンネル番号kの原音をxkとすると、基本信号をyk_oriは、以下の数式にて表される。
【数5】
【0083】
尚、劣化音のチャンネル数N>1の場合、前記数式(5)の右辺の第2項は、チャンネル数N分の劣化音x’について畳み込み演算が行われ、それぞれの演算結果が減算される。また、前記数式(5)の右辺の第3項は、チャンネル数N分の原音xについて畳み込み演算が行われ、それぞれの演算結果が加算される。
【0084】
信号処理部11は、ステップS602にて生成した被測定信号y_sig、及びステップS603にて生成した基本信号y1_ori~24_oriをPEAQ評価部12に出力する(ステップS604)。
【0085】
このように、被測定信号y_sigは、全てのチャンネルの劣化音x’1~24を用いた畳み込み処理にて生成される。また、基本信号y1_ori~24_oriは、チャンネル毎に、当該チャンネル以外のチャンネル数23の劣化音x’、及び当該チャンネルのチャンネル数1の原音xを用いた畳み込み処理にて生成される。
【0086】
つまり、所定チャンネル(チャンネル番号kのチャンネル)のバイノーラル信号yk_ori,yk_sigは、全てのチャンネルの劣化音x’1~24に基づいた被測定信号y_sigと、全てのチャンネルの原音x1~24のうち当該チャンネルの原音xkに基づいた基本信号yk_oriとにより構成される。この場合、基本信号yk_oriが基本の信号となり、被測定信号y_sigが、所定チャンネルの音源の音質劣化が反映された信号となる。このため、基本信号y1_ori~24_oriは、個別の音源の音質劣化に着目して評価する主観評価を考慮したバイノーラル信号となる。
【0087】
尚、図5及び図6は、劣化音x’のチャンネル数N=1の例であるが、N>1の場合も同様に適用できる。N>1の場合、信号処理部11は、チャンネル番号kのチャンネルの基本信号yk_oriを生成する際に、チャンネル数N>1の原音xを選択する必要がある。
【0088】
信号処理部11は、チャンネル番号kのチャンネルについて、例えば、当該チャンネルの原音xkに加え、当該チャンネルに隣接する所定数のチャンネルの原音xを選択する。所定数は1以上の整数である。
【0089】
具体的には、チャンネル番号kのチャンネルに隣接するチャンネルが複数の場合、信号処理部11は、チャンネル番号kのチャンネルとこれに隣接するチャンネルとの間の正規化相関係数ρfg(前記数式(1))を、隣接する複数のチャンネルのそれぞれについて算出する。信号処理部11は、隣接する複数のチャンネルを、正規化相関係数ρfgが大きい順に並べる。信号処理部11は、チャンネル番号kのチャンネルの原音xkに加え、正規化相関係数ρfgの大きい所定数のチャンネルの原音xを選択する。チャンネル番号kのチャンネルに隣接する複数のチャンネルは、再生位置情報Pから予め設定されるものとする。
【0090】
この場合、信号処理部11は、チャンネル番号kのチャンネルに隣接しないチャンネルの原音xを選択するようにしてもよい。具体的には、信号処理部11は、隣接する複数のチャンネル以外のチャンネル(隣接しないチャンネル)について、チャンネル番号kのチャンネルと隣接しないチャンネルとの間の正規化相関係数ρfgを算出する。そして、信号処理部11は、その正規化相関係数ρfgが隣接するチャンネルよりも大きい場合、隣接するチャンネルに代えて、隣接しないチャンネルの原音xを選択する。
【0091】
(PEAQ評価部12)
図1に戻って、PEAQ評価部12は、信号処理部11からチャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを入力する。そして、PEAQ評価部12は、チャンネル毎に、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法であるPEAQ客観音質測定法により客観評価値z1~24を求める。PEAQ評価部12は、チャンネル毎の客観評価値z1~24をマルチチャンネル評価部13に出力する。
【0092】
PEAQ評価部12は、PEAQ評価手段20-1、PEAQ評価手段20-2、・・・及びPEAQ評価手段20-24を備えている。PEAQ評価手段20-kは、信号処理部11からチャンネル番号kのバイノーラル信号yk_ori,yk_sigを入力し、PEAQ客観音質測定法のアルゴリズムを用いて客観評価値zkを求め、客観評価値zkをマルチチャンネル評価部13に出力する。kは、前述のとおり1から24までの整数である。
【0093】
具体的には、PEAQ評価手段20-kは、基本信号yk_ori及び被測定信号yk_sigから構成されるバイノーラル信号yk_ori,yk_sigを入力する。そして、PEAQ評価手段20-kは、人間の耳の知覚特性を反映した聴覚モデルを用いて、基本信号yk_oriについての聴覚モデル出力信号、及び被測定信号yk_sigについての聴覚モデル出力信号を生成する。
【0094】
この聴覚モデルは、外耳、中耳及び内耳の各機能を模擬したアルゴルズムにより、入力信号にFFT(Fast Fourier Transform:高速フーリエ変換)を施して周波数成分の信号を生成し、周波数成分の信号を、内耳の機能を反映したグループに分類し、周波数成分の信号に血流等の生理的雑音を加算し、周波数軸上及び時間軸上の広がりを考慮して神経興奮パターンを計算することにより、聴覚モデル出力信号を生成する。
【0095】
PEAQ評価手段20-kは、基本信号yk_ori及び被測定信号yk_sigについてのそれぞれの聴覚モデル出力信号に基づいて、聴覚歪み特性を計算し、音響的な信号劣化の程度を表すモデル出力値を求める。そして、PEAQ評価手段20-kは、ニューラルネットワーク構造を有する認識モデルを用いて、モデル出力値に基づき客観評価値zkを求める。
【0096】
尚、PEAQ客観音質測定法のアルゴリズムを用いて客観評価値zkを求める方法は既知であり、詳細については、例えば前述の非特許文献2または以下の文献を参照されたい。
渡辺馨、“オーディオ信号の劣化の評価法”、日本音響学会誌、63巻11号(2007)、pp.686-692
【0097】
(マルチチャンネル評価部13)
マルチチャンネル評価部13は、PEAQ評価部12からチャンネル毎の客観評価値z1~24を入力し、客観評価値z1~24に基づいてマルチチャンネルの客観評価値zを求め、マルチチャンネルの客観評価値zを出力する。
【0098】
図7は、マルチチャンネル評価部13の第1処理例を示すフローチャートである。第1処理例は、PEAQ客観音質測定法にて求めたチャンネル毎の客観評価値z1~24のうち、最低値zLをマルチチャンネルの客観評価値zとする例である。
【0099】
マルチチャンネル評価部13は、PEAQ評価部12からチャンネル毎の客観評価値z1~24を入力し(ステップS701)、チャンネル毎の客観評価値z1~24のうち、最低値zLを検出する(ステップS702)。
【0100】
マルチチャンネル評価部13は、ステップS702にて検出した最低値zLをマルチチャンネルの客観評価値zに設定し(z=zL)、マルチチャンネルの客観評価値zを出力する(ステップS703)。
【0101】
このように、マルチチャンネル評価部13は、PEAQ客観音質測定法にて求めたチャンネル毎の客観評価値z1~24のうち、最低値zLをマルチチャンネルの客観評価値zとして出力するようにした。これにより、人間がマルチチャンネル音響において特定のチャンネルに着目したときの最も評価の低いチャンネルについて、当該チャンネルの客観評価値が、マルチチャンネルの客観評価値zとして出力される。つまり、マルチチャンネルの客観評価値zは、個別の音源の音質劣化に着目して評価される主観評価値に近い値となる。
【0102】
図8は、マルチチャンネル評価部13の第2処理例を示すフローチャートである。第2処理例は、PEAQ客観音質測定法にて求めたチャンネル毎の客観評価値z1~24に重み付け係数W1~24を乗算し、全てのチャンネルの乗算結果を加算することでマルチチャンネルの客観評価値zを求める例である。
【0103】
マルチチャンネル評価部13は、PEAQ評価部12からチャンネル毎の客観評価値z1~24を入力し(ステップS801)、チャンネル毎の客観評価値z1~24に、所定の重み付け係数W1~24をそれぞれ乗算し、チャンネル毎の乗算結果を求める(ステップS802)。重み付け係数W1~24の合計値は1である。
【0104】
マルチチャンネル評価部13は、ステップS802にて求めた全てのチャンネルの乗算結果を加算し(ステップS803)、加算結果をマルチチャンネルの客観評価値zに設定し、マルチチャンネルの客観評価値zを出力する(ステップS804)。
【0105】
ここで、図8に示した第2処理例は、以下の数式にて表される。
【数6】
【0106】
所定の重み付け係数W1~24としては、チャンネル毎に、客観評価値z1~24が大きいほど(劣化が小さいほど)小さい値が用いられ、客観評価値z1~24が小さいほど(劣化が大きいほど)大きい値が用いられる。所定の重み付け係数W1~24は、ユーザにより予め設定されるようにしてもよいし、所定の処理により自動的に設定されるようにしてもよい。
【0107】
以下、所定の処理にて重み付け係数W1~24を設定する例について説明する。図9は、マルチチャンネル評価部13による重み付け係数W1~24の設定処理例を示すフローチャートである。マルチチャンネル評価部13は、チャンネル番号i(i=1~24)を順番に設定し(ステップS901)、客観評価値ziが所定値よりも大きいか否かを判定する(ステップS902)。
【0108】
PEAQ評価部12により求めた客観評価値ziにおいて、0が「劣化音を検知できない」、-1が「劣化音を検知できるが気にならない」、-2が「劣化音がやや気になる」、-3が「劣化音が気になる」、-4が「劣化音が非常に気になる」を示す場合、ステップS902にて用いる所定値は、例えば-1である。
【0109】
マルチチャンネル評価部13は、ステップS902において、客観評価値ziが所定値よりも大きいと判定した場合(ステップS902:Y)、チャンネル番号iのチャンネルの音響信号について、劣化が小さいと判断し、重み付け係数Wi=0に設定する(ステップS903)。
【0110】
一方、マルチチャンネル評価部13は、ステップS902において、客観評価値ziが所定値よりも大きくないと判定した場合(ステップS902:N)、当該音響信号のラウドネスレベルに基づいて、重み付け係数Wiを設定する(ステップS904)。
【0111】
具体的には、マルチチャンネル評価部13は、図1には図示しないラウドネス測定部から、チャンネル番号iのチャンネルの音響信号についてのラウドネスレベルを入力する。そして、マルチチャンネル評価部13は、ラウドネスレベルが所定値よりも大きくないと判断したチャンネルが複数ある場合、ラウドネスレベルが大きいほど重み付け係数Wiが大きくなり(1に近くなり)、ラウドネスレベルが小さいほど重み付け係数Wiが小さくなるように(0に近くなるように)、音響信号のラウドネスレベルに基づいた重み付け係数Wiを設定する。これにより、音響信号のラウドネスレベルに対応した重み付け係数Wiが得られる。尚、重み付け係数W1~24の合計値は、1であるとする。
【0112】
この場合、図示しないラウドネス測定部は、例えば以下の文献の手法を用いて、チャンネル毎にラウドネス(音の大きさ)を測定する。
Rec. ITU-R BS.1770-4,“Algorithms to measure audio programme loudness and true-peak audio level”
ラウドネス測定部は、複数あるチャンネル毎のラウドネスレベルをマルチチャンネル評価部13に出力する。マルチチャンネル評価部13では、チャンネル毎のラウドネスレベルに応じた重み付け係数Wiを設定する。
【0113】
尚、マルチチャンネル評価部13は、チャンネルの正規化相関係数ρfgに対応した重み付け係数Wiを設定するようにしてもよい。具体的には、マルチチャンネル評価部13は、図1には図示しない相関係数算出部から、チャンネル番号iのチャンネルにおける正規化相関係数ρfgを入力する。マルチチャンネル評価部13は、正規化相関係数ρfgが大きいほど重み付け係数Wiが大きくなり(1に近くなり)、正規化相関係数ρfgが小さいほど重み付け係数Wiが小さくなるように(0に近くなるように)、重み付け係数Wiを設定する。これにより、チャンネルの正規化相関係数ρfgに対応した重み付け係数Wiが得られる。
【0114】
この場合、図示しない相関係数算出部は、チャンネル番号iのチャンネルと当該チャンネル以外のチャンネルとの間の正規化相関係数ρfgを、前記数式(1)を用いてそれぞれ算出する。そして、相関係数算出部は、これを、チャンネル番号iのチャンネルにおける正規化相関係数ρfgとしてマルチチャンネル評価部13に出力する。
【0115】
また、マルチチャンネル評価部13は、チャンネル毎の客観評価値ziのうち最低値zLを検出し、その最低値zLを有するチャンネルに隣接する複数のチャンネルについて、客観評価値ziが所定値以下の場合、重み付け係数Wiの合計値が1を超えるように、重み付け係数Wiを設定するようにしてもよい。ただし、重み付け係数Wiの合計値は2を超えないものとする。また、PEAQ評価部12により求めた客観評価値ziが、前述のとおり0~-4で表される場合、客観評価値ziと比較される所定値は、例えば-1である。
【0116】
このように、マルチチャンネル評価部13は、PEAQ客観音質測定法にて求めたチャンネル毎の客観評価値z1~24に所定の重み付け係数W1~24を乗算し、全ての乗算結果を加算することで、マルチチャンネルの客観評価値zを生成して出力するようにした。これにより、人間が特定のチャンネルに着目したときのPEAQ客観音質測定法にて求めたチャンネル毎の客観評価値z1~24に対し、その着目度合いに応じた重み付け係数W1~24が用いられることで、チャンネル毎に異なる着目度合いが反映されたマルチチャンネルの客観評価値zが生成され出力される。つまり、マルチチャンネルの客観評価値zは、個別の音源の音質劣化に着目して評価される主観評価値に近い値となる。
【0117】
〔実験結果〕
次に、コンピュータシミュレーションによる実験結果について説明する。この実験結果は、マルチチャンネル客観評価装置1により出力されたマルチチャンネルの客観評価値zが、前述の非特許文献1のITU-R勧告BS.1116-3に定めた主観評価法により求めた主観評価値に近いことを示すものである。
【0118】
図10は、実験結果を示す図であり、実際に収音した22.2chのマルチチャンネル音響信号の環境音を評価した結果を示す。(a)は、前述の非特許文献1のITU-R勧告BS.1116-3に定めた主観評価法により求めた主観評価結果を示し、(b)は、本発明の実施形態による客観評価結果(劣化音x’のチャンネル数N=1の場合)を示す。
【0119】
また、(c)は、前述の非特許文献4の方法に、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法を組み込んだ従来技術(前述の想定手法)による客観評価結果を示す。具体的には、(c)の客観評価結果は、前述のとおり、マルチチャンネル音響信号に頭部インパルス応答HRIRを畳み込んで2チャンネル信号を生成し、前述の非特許文献2の客観評価法により求めた結果である。
【0120】
(a)(b)及び(c)の横軸は、音響信号のビットレート[kbit/s]を示す。ビットレートが高いほど圧縮率は低く、ビットレートが低いほど圧縮率は高い関係にある。(a)の縦軸は主観評価値(Diff Grade)を示し、(b)及び(c)の縦軸は客観評価値(Diff Grade)を示す。(b)の客観評価値は、図1に示したマルチチャンネル客観評価装置1のマルチチャンネル評価部13により出力されたマルチチャンネルの客観評価値zである。
【0121】
前述と同様に、主観評価値及び客観評価値の0は「劣化音を検知できない」、-1は「劣化音を検知できるが気にならない」、-2は「劣化音がやや気になる」、-3は「劣化音が気になる」、-4は「劣化音が非常に気になる」を示す。
【0122】
(a)(b)及び(c)から、(b)に示す本発明の実施形態の客観評価結果は、(c)に示す従来技術の客観評価結果よりも、(a)に示す主観評価結果に近いことがわかる。
【0123】
このように、本発明の実施形態のマルチチャンネル客観評価装置1を用いることにより、前述の非特許文献1のITU-R勧告BS.1116-3に定めた主観評価法により求めた主観評価値に近いマルチチャンネルの客観評価値zを求めることができる。
【0124】
以上のように、本発明の実施形態のマルチチャンネル客観評価装置1によれば、畳み込み信号出力部10は、予め設定されたDBを用いて、24チャンネルの音響信号の再生位置情報Pに基づき、チャンネル毎の頭部インパルス応答HRIR1~24を特定して出力する。
【0125】
信号処理部11は、マルチチャンネル音響信号の原音x1~24、劣化音x’1~24及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成する。具体的には、信号処理部11は、チャンネル毎に、例えば全ての原音x1~24、当該チャンネルのみの劣化音x’、及び頭部インパルス応答HRIR1~24に基づいて畳み込み処理を行い、バイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成する。
【0126】
PEAQ評価部12は、チャンネル毎に、バイノーラル信号y1_ori~24_ori,y1_sig~24_sigに基づいて、前述の非特許文献2のITU-R勧告BS.1387-1に定めた客観評価法であるPEAQ客観音質測定法により客観評価値z1~24を求める。
【0127】
マルチチャンネル評価部13は、チャンネル毎の客観評価値z1~24に基づいて、マルチチャンネルの客観評価値zを求める。
【0128】
ここで、PEAQ評価部12が用いる客観評価対象のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigは、信号処理部11において個別の音源の音質劣化に着目して生成される主観評価を考慮した信号である。これにより、マルチチャンネル評価部13が求めるマルチチャンネルの客観評価値zは、バイノーラル信号y1_ori~24_ori,y1_sig~24_sigの客観評価値z1~24から生成されるから、主観評価値に近い値となる。したがって、2チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。
【0129】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。前記実施形態では、マルチチャンネル客観評価装置1は、22.2chのマルチチャンネル音響信号を評価対象として、マルチャンネルの客観評価値zを求めるようにした。本発明は、評価対象を22.2chのマルチチャンネル音響信号に限定するものではなく、11.1ch、7.1ch、5.1ch等の他の音響方式のマルチチャンネル音響信号にも適用がある。
【0130】
また、本発明は、スピーカー配置がプリセットされた22.2ch等の音響方式のマルチチャンネル音響信号だけでなく、スピーカー配置がプリセットされていない、2以上のスピーカーが任意に配置されたマルチチャンネル音響信号にも適用がある。
【0131】
また、前記実施形態では、マルチチャンネル客観評価装置1は、畳み込み信号として、頭部インパルス応答HRIR1~24を用いるようにした。本発明は、畳み込み信号を頭部インパルス応答HRIR1~24に限定するものではなく、他のインパルス応答、例えばバイノーラル室内インパルス応答BRIR(Binaural Room Impulse Response)1~24を用いるようにしてもよい。
【0132】
この場合、図4を参照して、畳み込み信号出力部10に備えたDBには、頭部インパルス応答HRIR1~24の代わりに、バイノーラル室内インパルス応答BRIR1~24が格納されている。畳み込み信号出力部10は、DBから、再生位置情報Pに対応するチャンネル毎の伝搬特性を表すバイノーラル室内インパルス応答BRIR1~24を読み出す。そして、信号処理部11は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24、並びにバイノーラル室内インパルス応答BRIR1~24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成する。
【0133】
また、前記実施形態では、マルチチャンネル客観評価装置1は、マルチチャンネル音響信号の原音x1~24及び劣化音x’1~24にバイノーラル室内インパルス応答BRIR1~24を畳み込み、チャンネル毎のバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成するようにした。本発明は、この畳み込み処理を時間領域での演算に限定するものではなく、周波数領域に変換した原音x1~24及び劣化音x’1~24と、頭部伝達関数HRTF(Head Related Transfer Function)1~24の積を演算し、時間領域に変換してバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成するようにしてもよい。また、本発明は、原音x1~24及び劣化音x’1~24の周波数成分とバイノーラル室内伝達関数BRTF(Binaural Room Transfer Function)1~24の積を演算し、時間領域に変換してバイノーラル信号y1_ori~24_ori,y1_sig~24_sigを生成するようにしてもよい。
【0134】
尚、本発明の実施形態によるマルチチャンネル客観評価装置1のハードウェア構成としては、通常のコンピュータを使用することができる。マルチチャンネル客観評価装置1は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
【0135】
マルチチャンネル客観評価装置1に備えた畳み込み信号出力部10、信号処理部11、PEAQ評価部12及びマルチチャンネル評価部13の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0136】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
【符号の説明】
【0137】
1 マルチチャンネル客観評価装置
10 畳み込み信号出力部
11 信号処理部
12 PEAQ評価部
13 マルチチャンネル評価部
20-1~24 PEAQ評価手段
1~24 マルチチャンネル音響信号の原音
x’1~24 マルチチャンネル音響信号の劣化音
P 再生位置情報
HRIR1~24 頭部インパルス応答
M マルチチャンネル音響信号のチャンネル数
N 劣化音x’のチャンネル数N
BRIR1~24 バイノーラル室内インパルス応答
HRTF1~24 頭部伝達関数
BRTF1~24 バイノーラル室内伝達関数
1_ori~24_ori 基本信号(バイノーラル信号)
1_sig~24_sig 被測定信号(バイノーラル信号)
_ori 共通の基本信号
_sig 共通の被測定信号
1~24 チャンネル毎の客観評価値
z マルチチャンネルの客観評価値
ρfg 正規化相関係数
1~24 重み付け係数
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10