特許6998823 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許6998823マルチチャンネル客観評価装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2021-12-23

(45)【発行日】2022-02-04

(54)【発明の名称】マルチチャンネル客観評価装置及びプログラム

(51)【国際特許分類】

G10L 25/60 20130101AFI20220128BHJP

【ＦＩ】

G10L25/60

【請求項の数】 6

(21)【出願番号】P 2018078019

(22)【出願日】2018-04-13

(65)【公開番号】P2019184933

(43)【公開日】2019-10-24

【審査請求日】2021-02-26

(73)【特許権者】

【識別番号】000004352

【氏名又は名称】日本放送協会

(74)【代理人】

【識別番号】100121119

【弁理士】

【氏名又は名称】花村泰伸

(72)【発明者】

【氏名】小倉知美

(72)【発明者】

【氏名】小森智康

(72)【発明者】

【氏名】杉本岳大

【審査官】中村天真

(56)【参考文献】

【文献】米国特許出願公開第２００９／０１７１６７１（ＵＳ，Ａ１）

【文献】特表２０１６－５２１５３２（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１９／００－２５／９３

Ｈ０４Ｓ３／００－３／０２

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

２チャンネルを超えるマルチチャンネル音響信号を客観評価するマルチチャンネル客観評価装置において、
前記マルチチャンネル音響信号を構成するそれぞれの音響信号のチャンネルに対応して、チャンネル毎の伝搬特性を表す頭部インパルス応答（ＨＲＩＲ）またはバイノーラル室内インパルス応答（ＢＲＩＲ）を畳み込み信号として出力する畳み込み信号出力部と、
前記マルチチャンネル音響信号の原音及び劣化音を入力すると共に、前記畳み込み信号出力部により出力されたチャンネル毎の前記畳み込み信号を入力し、
チャンネル毎の前記原音に前記畳み込み信号を畳み込み、全てのチャンネルの畳み込み結果に基づいて、全てのチャンネルに共通の基本信号を生成すると共に、
チャンネル毎に、当該チャンネルを含む１または複数のチャンネルの前記劣化音に前記畳み込み信号を畳み込み、第１の畳み込み結果を生成し、全てのチャンネルのうち前記１または複数のチャンネル以外のチャンネルの前記原音に前記畳み込み信号を畳み込み、第２の畳み込み結果を生成し、前記第１の畳み込み結果及び前記第２の畳み込み結果に基づいて被測定信号を生成し、
チャンネル毎に、前記基本信号及び前記被測定信号からなるバイノーラル信号を生成する信号処理部と、
前記信号処理部により生成されたチャンネル毎の前記バイノーラル信号を入力し、チャンネル毎に、当該チャンネルの前記バイノーラル信号に基づき、所定のＰＥＡＱ（Perceptual Evaluation of Audio Quality）客観音質測定法を用いて、客観評価結果を生成する評価部と、
前記評価部により生成されたチャンネル毎の前記客観評価結果に基づいて、前記マルチチャンネル音響信号の客観評価結果をマルチチャンネル客観評価結果として生成するマルチチャンネル評価部と、
を備えたことを特徴とするマルチチャンネル客観評価装置。

【請求項2】

請求項１に記載のマルチチャンネル客観評価装置において、
前記畳み込み信号出力部は、
前記マルチチャンネル音響信号のチャンネルの数及び配置を定める音響方式の情報を入力し、予め設定されたデータベースから、前記音響方式に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、
前記データベースには、前記音響方式のチャンネル、及び当該チャンネルに対応する前記畳み込み信号が格納されている、ことを特徴とするマルチチャンネル客観評価装置。

【請求項3】

請求項１に記載のマルチチャンネル客観評価装置において、
前記畳み込み信号出力部は、
前記マルチチャンネル音響信号を構成するそれぞれの音響信号についての再生位置を定めるチャンネル毎の角度の情報を入力し、予め設定されたデータベースから、チャンネル毎の前記角度に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、
前記データベースには、前記角度、及び当該角度に対応する前記畳み込み信号が格納されている、ことを特徴とするマルチチャンネル客観評価装置。

【請求項4】

請求項１から３までのいずれか一項に記載のマルチチャンネル客観評価装置において、
前記マルチチャンネル評価部は、
前記評価部により生成されたチャンネル毎の前記客観評価結果のうち最低値を検出し、当該最低値を前記マルチチャンネル客観評価結果として生成する、ことを特徴とするマルチチャンネル客観評価装置。

【請求項5】

請求項１から３までのいずれか一項に記載のマルチチャンネル客観評価装置において、
前記マルチチャンネル評価部は、
前記評価部により生成されたチャンネル毎の前記客観評価結果に対し、所定のチャンネル毎の重み付け係数をそれぞれ乗算し、チャンネル毎の乗算結果を加算し、加算結果を前記マルチチャンネル客観評価結果として生成する、ことを特徴とするマルチチャンネル客観評価装置。

【請求項6】

コンピュータを、請求項１から５までのいずれか一項に記載のマルチチャンネル客観評価装置として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、２チャンネルを超えるマルチチャンネル音響システムに用いるマルチチャンネル音響信号の品質を客観評価するマルチチャンネル客観評価装置及びプログラムに関する。

【背景技術】

【0002】

従来、マルチチャンネル音響システムにおいて、音響信号の品質を評価する方法が知られている。例えば、音響信号の品質を主観的に評価する方法として、マルチチャンネル音響システムを含む劣化の少ない音響システムの主観評価法がＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定められている（例えば、非特許文献１を参照）。

【0003】

一方、ＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に則して行った主観評価に対応した音質を客観的に測定する客観評価法がＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定められている（例えば、非特許文献２を参照）。このＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法は、ＰＥＡＱ（Perceptual Evaluation of Audio Quality）客観音質測定法と呼ばれている。

【0004】

ＰＥＡＱ客観音質測定法は、音響信号の品質を客観的に測定するための標準化アルゴリズムにて実現され、人間の耳の知覚特性を反映した聴覚モデル、及びニューラルネットワーク構造を有する認識モデルを用いて、客観評価値を求めるものである。詳細については後述する。

【0005】

一般に、信頼性の高い主観評価を行うには、多くの被験者、多大な時間及び労力を必要とするため、全ての音源に対して主観評価を行うのは現実的でない。このため、予め客観評価を行うことにより、主観評価に使用するパラメータを選定するようにしている。

【0006】

しかしながら、前述のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法は、１チャンネルまたは２チャンネルの音響システムに適用した方法である。このため、この客観評価法は、２２．２ｃｈ（チャンネル）等の２チャンネルを超えるマルチチャンネル音響システム（例えば、非特許文献３を参照）に対して用いることができない。

【0007】

そこで、２チャンネルを超えるマルチチャンネル音響システムにおいて、マルチチャンネル音響信号の品質を客観的に評価する方法が提案されている（例えば、非特許文献４を参照）。この方法は、マルチチャンネル音響信号の原音及び劣化音に頭部インパルス応答ＨＲＩＲ（Head Related Impulse Response）をそれぞれ畳み込んで２チャンネル信号に変換し、客観評価を行うものである。

【先行技術文献】

【非特許文献】

【0008】

【文献】Rec. ITU-R BS.1116-3,“Methods for the subjective assessment of small impairments in audio systems”,2015

【文献】Rec. ITU-R BS.1387-1,“Method for objective measurements of perceived audio quality”,2001

【文献】Rec. ITU-R BS.2051，“Advanced sound system for programme production”,2014

【文献】J.LIEBETRAU etc,“Standardization of PEAQ-MC:Extension of ITU-R BS.1387-1 to multichannel audio”,J. Audio Eng. Soc. 40th International Conference,2010

【発明の概要】

【発明が解決しようとする課題】

【0009】

しかしながら、前述の非特許文献４は、２チャンネルを超えるマルチチャンネル音響システムに用いるマルチチャンネル音響信号の品質を客観的に評価する場合に、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法とは異なり、両耳間時間差、両耳間レベル差等も用いた認識モデルを用いている。また、非特許文献４により求められる客観評価結果は、前述の非特許文献１のＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定めた主観評価法により求められる主観評価結果を十分に反映した値ではない。このため、ＩＴＵ－Ｒ（国際電気通信連合の無線通信部門）は、前述の非特許文献４の方法を用いて標準化を試みたが、承認されずに現在に至っている。

【0010】

ところで、２チャンネルを超えるマルチチャンネル音響システムにおいて、符号化等により劣化した音響信号を主観評価する場合、人間は、全ての方向の音響信号を集中して聞き比べることが苦手である。このため、音響信号のチャンネル数が多い場合、主観評価値が上がる傾向がある。

【0011】

また、音像が動くコンテンツについても、人間は、全ての方向の音響信号を頭で記憶しながら集中して聞き比べることが苦手である。このため、チャンネル数が多い場合には、同様に主観評価値が上がる傾向がある。

【0012】

マルチチャンネル音響信号は人間へ提示されるものであるから、客観評価値は、このような主観評価値の傾向が反映された値となることが望ましい。つまり、２チャンネルを超えるマルチチャンネル音響信号の品質を客観的に評価する方法は、主観評価値への影響を考慮した客観評価法であることが望ましい。

【0013】

前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法は、主観評価値への影響を考慮した客観評価法であるが、２チャンネルの音響信号に適用する方法であり、２チャンネルを超えるマルチチャンネル音響信号に適用する方法ではない。

【0014】

ここで、前述の非特許文献４の方法に、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法を組み込んだ新たな手法を想定することができる。この想定手法は、マルチチャンネル音響信号の原音及び劣化音に頭部インパルス応答ＨＲＩＲをそれぞれ畳み込み、原音及び劣化音の畳み込み結果をそれぞれ加算して２チャンネル信号を生成し、この２チャンネル信号を用いて、ＰＥＡＱ客観音質測定法により客観評価値を求めるものである。

【0015】

この想定手法は、主観評価に対応した音質を客観的に測定するＰＥＡＱ客観音質測定法を用いるものであるが、後述する図１０の実験結果に示すように、その客観評価結果は、主観評価結果に近い値にならない。

【0016】

主観評価結果と客観評価結果が異なる要因として、加算された音響信号にはそれぞれのチャンネルの劣化も加算されているが、評価者がその全てに対してステレオ信号と同様の精度で評価することが難しいということが推察される。

【0017】

そこで、本発明は前記課題を解決するためになされたものであり、その目的は、２チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能なマルチチャンネル客観評価装置及びプログラムを提供することにある。

【課題を解決するための手段】

【0018】

前記課題を解決するために、請求項１のマルチチャンネル客観評価装置は、２チャンネルを超えるマルチチャンネル音響信号を客観評価するマルチチャンネル客観評価装置において、前記マルチチャンネル音響信号を構成するそれぞれの音響信号のチャンネルに対応して、チャンネル毎の伝搬特性を表す頭部インパルス応答（ＨＲＩＲ）またはバイノーラル室内インパルス応答（ＢＲＩＲ）を畳み込み信号として出力する畳み込み信号出力部と、前記マルチチャンネル音響信号の原音及び劣化音を入力すると共に、前記畳み込み信号出力部により出力されたチャンネル毎の前記畳み込み信号を入力し、チャンネル毎の前記原音に前記畳み込み信号を畳み込み、全てのチャンネルの畳み込み結果に基づいて、全てのチャンネルに共通の基本信号を生成すると共に、チャンネル毎に、当該チャンネルを含む１または複数のチャンネルの前記劣化音に前記畳み込み信号を畳み込み、第１の畳み込み結果を生成し、全てのチャンネルのうち前記１または複数のチャンネル以外のチャンネルの前記原音に前記畳み込み信号を畳み込み、第２の畳み込み結果を生成し、前記第１の畳み込み結果及び前記第２の畳み込み結果に基づいて被測定信号を生成し、チャンネル毎に、前記基本信号及び前記被測定信号からなるバイノーラル信号を生成する信号処理部と、前記信号処理部により生成されたチャンネル毎の前記バイノーラル信号を入力し、チャンネル毎に、当該チャンネルの前記バイノーラル信号に基づき、所定のＰＥＡＱ（Perceptual Evaluation of Audio Quality）客観音質測定法を用いて、客観評価結果を生成する評価部と、前記評価部により生成されたチャンネル毎の前記客観評価結果に基づいて、前記マルチチャンネル音響信号の客観評価結果をマルチチャンネル客観評価結果として生成するマルチチャンネル評価部と、を備えたことを特徴とする。

【0019】

また、請求項２のマルチチャンネル客観評価装置は、請求項１に記載のマルチチャンネル客観評価装置において、前記畳み込み信号出力部が、前記マルチチャンネル音響信号のチャンネルの数及び配置を定める音響方式の情報を入力し、予め設定されたデータベースから、前記音響方式に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、前記データベースには、前記音響方式のチャンネル、及び当該チャンネルに対応する前記畳み込み信号が格納されている、ことを特徴とする。

【0020】

また、請求項３のマルチチャンネル客観評価装置は、請求項１に記載のマルチチャンネル客観評価装置において、前記畳み込み信号出力部が、前記マルチチャンネル音響信号を構成するそれぞれの音響信号についての再生位置を定めるチャンネル毎の角度の情報を入力し、予め設定されたデータベースから、チャンネル毎の前記角度に対応するチャンネル毎の前記畳み込み信号を読み出して出力し、前記データベースには、前記角度、及び当該角度に対応する前記畳み込み信号が格納されている、ことを特徴とする。

【0021】

また、請求項４のマルチチャンネル客観評価装置は、請求項１から３までのいずれか一項に記載のマルチチャンネル客観評価装置において、前記マルチチャンネル評価部が、前記評価部により生成されたチャンネル毎の前記客観評価結果のうち最低値を検出し、当該最低値を前記マルチチャンネル客観評価結果として生成する、ことを特徴とする。

【0022】

また、請求項５のマルチチャンネル客観評価装置は、請求項１から３までのいずれか一項に記載のマルチチャンネル客観評価装置において、前記マルチチャンネル評価部が、前記評価部により生成されたチャンネル毎の前記客観評価結果に対し、所定のチャンネル毎の重み付け係数をそれぞれ乗算し、チャンネル毎の乗算結果を加算し、加算結果を前記マルチチャンネル客観評価結果として生成する、ことを特徴とする。

【0023】

また、請求項６のプログラムは、コンピュータを、請求項１から５までのいずれか一項に記載のマルチチャンネル客観評価装置として機能させることを特徴とする。

【発明の効果】

【0024】

以上のように、本発明によれば、２チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。

【図面の簡単な説明】

【0025】

【図1】本発明の実施形態によるマルチチャンネル客観評価装置の構成例を示すブロック図である。

【図2】マルチチャンネル客観評価装置の処理例を示すフローチャートである。

【図3】畳み込み信号出力部の処理例を示すフローチャートである。

【図4】ＤＢのデータ構成例を示す図である。

【図5】信号処理部の第１処理例を示すフローチャートである。

【図6】信号処理部の第２処理例を示すフローチャートである。

【図7】マルチチャンネル評価部の第１処理例を示すフローチャートである。

【図8】マルチチャンネル評価部の第２処理例を示すフローチャートである。

【図9】マルチチャンネル評価部による重み付け係数Ｗ_1～24の設定処理例を示すフローチャートである。

【図10】実験結果を示す図である。

【発明を実施するための形態】

【0026】

以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔発明の概要〕
符号化等により劣化した音響信号（以下、「劣化音」という。）を主観評価する場合、人間は、個別の音源の音質劣化に着目して評価する傾向がある。また、マルチチャンネル音響システムにおいて、マルチチャンネル音響信号を再生する際の音源は、あるチャンネル（例えば正面方向のチャンネル、またはペアとなるチャンネル）について最も大きなレベルでミキシングされる。

【0027】

このような状況を鑑み、本発明の実施形態のマルチチャンネル客観評価装置は、あるチャンネルの音質劣化の度合いを主観評価と近似させるために、所定のチャンネルのみを劣化音とし、その他のチャンネルを原音として扱う。そして、マルチチャンネル客観評価装置は、これらの劣化音及び原音を用いてバイノーラル信号を生成し、このバイノーラル信号を客観評価対象の入力信号とし、客観評価を行う。

【0028】

具体的には、マルチチャンネル客観評価装置は、２チャンネルを超えるマルチチャンネル音響信号を構成するそれぞれの音響信号の原音及び劣化音を入力する。そして、マルチチャンネル客観評価装置は、チャンネル毎に、例えば全ての原音及び当該チャンネルのみの劣化音を用いた畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号を生成する。

【0029】

マルチチャンネル客観評価装置は、バイノーラル信号を客観評価対象の入力信号として、チャンネル毎に、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法により客観評価値を求める。そして、マルチチャンネル客観評価装置は、チャンネル毎の客観評価値に基づいて、マルチチャンネルの客観評価値を求める。

【0030】

これにより、客観評価対象のバイノーラル信号は、個別の音源の音質劣化に着目して生成される主観評価を考慮した信号であるから、バイノーラル信号の客観評価値から生成されるマルチチャンネルの客観評価値は、主観評価値に近い値となる。したがって、２チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。

【0031】

〔マルチチャンネル客観評価装置〕
まず、本発明の実施形態によるマルチチャンネル客観評価装置の構成及び処理について説明する。図１は、本発明の実施形態によるマルチチャンネル客観評価装置の構成例を示すブロック図である。

【0032】

このマルチチャンネル客観評価装置１は、２チャンネルを超えるマルチチャンネル音響信号を客観的に評価する装置であり、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法を活用し、前述の非特許文献１のＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定めた主観評価法により求められる主観評価値に近いマルチチャンネルの客観評価値ｚ（マルチチャンネル客観評価結果）を求める。マルチチャンネル客観評価装置１は、畳み込み信号出力部１０、信号処理部１１、ＰＥＡＱ評価部１２及びマルチチャンネル評価部１３を備えている。

【0033】

マルチチャンネル客観評価装置１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24を入力すると共に、再生位置情報Ｐを入力し、再生位置情報Ｐに基づいて、チャンネル毎の畳み込み信号を特定する。そして、マルチチャンネル客観評価装置１は、主観評価を考慮したチャンネル毎のバイノーラル信号を生成し、バイノーラル信号をＰＥＡＱ評価し、その結果に基づいて、主観評価を考慮したマルチチャンネルの客観評価値ｚを算出する。

【0034】

以下、マルチチャンネル音響信号の例として、音響方式が２２．２ｃｈの場合の音響信号を挙げて具体的に説明する。２２．２ｃｈのマルチチャンネル音響信号は、２４チャンネルの音響信号により構成される。

【0035】

再生位置情報Ｐは、マルチチャンネル音響システムにおけるそれぞれの音響信号の再生位置に関する情報であり、例えば、マルチチャンネル音響信号の音響方式の情報、または再生位置に関する角度の情報である。本例の場合、再生位置情報Ｐとして、２２．２ｃｈの音響方式の情報が入力される。音響方式により、チャンネルの数及び配置が一義的に決定される。または、再生位置情報Ｐとして、２２．２ｃｈのマルチチャンネル音響信号を構成するそれぞれの音響信号についての（それぞれのチャンネルについての）仰角及び方位角（水平面の角度及び垂直面の角度）からなる角度の情報が入力される。

【0036】

図２は、マルチチャンネル客観評価装置１の処理例を示すフローチャートである。マルチチャンネル客観評価装置１は、マルチチャンネル音響信号を構成するそれぞれの音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24を入力すると共に、再生位置情報Ｐを入力する（ステップＳ２０１）。マルチチャンネル客観評価装置１により、マルチチャンネル音響信号の原音ｘ_1～24を基準として劣化音ｘ’_1～24が客観的に評価される。

【0037】

マルチチャンネル客観評価装置１は、再生位置情報Ｐに基づき、チャンネル毎の畳み込み信号として、例えばチャンネル毎の伝搬特性を表す頭部インパルス応答ＨＲＩＲ_1～24を特定する（ステップＳ２０２）。

【0038】

マルチチャンネル客観評価装置１は、チャンネル毎の原音ｘ_1～24、劣化音ｘ’_1～24及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて、主観評価を考慮した畳み込み処理を行い、チャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成する（ステップＳ２０３）。

【0039】

マルチチャンネル客観評価装置１は、チャンネル毎に、当該チャンネルのバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}に基づいて、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法によるＰＥＡＱ評価を行う（ステップＳ２０４）。そして、マルチチャンネル客観評価装置１は、チャンネル毎の客観評価値ｚ_1～24を求める。

【0040】

マルチチャンネル客観評価装置１は、チャンネル毎の客観評価値ｚ_1～24に基づいて、マルチチャンネルの客観評価値ｚを算出して出力する（ステップＳ２０５）。

【0041】

（畳み込み信号出力部１０）
図１を参照して、畳み込み信号出力部１０は、予め設定されたデータベース（ＤＢ、図示せず）を備えている。畳み込み信号出力部１０は、２４チャンネルの音響信号の再生位置情報Ｐを入力し、ＤＢから、再生位置情報Ｐに対応するチャンネル毎の畳み込み信号、例えばチャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を読み出す。そして、畳み込み信号出力部１０は、チャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を信号処理部１１に出力する。

【0042】

図３は、畳み込み信号出力部１０の処理例を示すフローチャートである。畳み込み信号出力部１０は、再生位置情報Ｐを入力し（ステップＳ３０１）、再生位置情報Ｐに音響方式の情報が含まれるか、または角度の情報が含まれるかを判定する（ステップＳ３０２）。

【0043】

再生位置情報Ｐには、音響方式及び角度のうちいずれか一方の情報が含まれるものとする。２２．２ｃｈ、１１．１ｃｈ、７．１ｃｈ、５．１ｃｈ等のように、スピーカー配置が非特許文献３のように標準化された音響方式の場合、再生位置は固定であるため、プリセットを登録しておく。この場合、再生位置情報Ｐには、２２．２ｃｈ等を識別するための音響方式の情報が含まれる。一方、固定の音響方式を用いない場合、再生位置情報Ｐには、チャンネル毎に再生位置を特定するための角度の情報が含まれる。

【0044】

畳み込み信号出力部１０は、ステップＳ３０２において、再生位置情報Ｐに音響方式の情報が含まれると判定した場合（ステップＳ３０２：音響方式）、ＤＢから、再生位置情報Ｐに含まれる音響方式に対応する頭部インパルス応答ＨＲＩＲ_1～24を読み出す（ステップＳ３０３）。

【0045】

一方、畳み込み信号出力部１０は、ステップＳ３０２において、再生位置情報Ｐに角度の情報が含まれると判定した場合（ステップＳ３０２：角度）、ＤＢから、再生位置情報Ｐに含まれる角度に対応する頭部インパルス応答ＨＲＩＲ_1～24を読み出す（ステップＳ３０４）。

【0046】

畳み込み信号出力部１０は、ステップＳ３０３またはステップＳ３０４から移行して、チャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を信号処理部１１に出力する（ステップＳ３０５）。

【0047】

図４は、ＤＢのデータ構成例を示す図である。このＤＢは、音響方式、チャンネル番号（ラベル）、仰角、方位角、及びこれらの情報に対応する畳み込み信号である頭部インパルス応答ＨＲＩＲ（スピーカー位置と人間の耳の位置との間の伝達関数に対応するインパルス応答）のデータから構成される。

【0048】

音響方式は、２２．２ｃｈ、１１．１ｃｈ、７．１ｃｈ、５．１ｃｈ等であり、チャンネル番号は、音響方式の各音響信号に対応した番号である。仰角は、スピーカー位置と人間の耳の位置との間の線が水平面となす角度であり、方位角は、スピーカー位置と人間の耳の位置との間の線が垂直面となす角度である。一般的に正面方向を仰角０度、方位角０度とする。

【0049】

図４に示すＤＢには、音響方式が２２．２ｃｈの場合において、チャンネル番号３（ラベルがＦＣ（フロントセンター））、仰角０°、方位角０°、及びこれらの情報に対応する頭部インパルス応答ＨＲＩＲ₃等が格納されている。また、ＤＢには、２２．２ｃｈ以外の５．１ｃｈ等の音響方式のデータも格納されており、音響方式が５．１ｃｈの場合において、チャンネル番号３（ラベルがＣ（センター））、仰角０°、方位角０°、及びこれらの情報に対応する頭部インパルス応答ＨＲＩＲ₃等が格納されている。

【0050】

畳み込み信号出力部１０は、２２．２ｃｈの音響方式の情報を含む再生位置情報Ｐを入力した場合、ステップＳ３０３において、２２．２ｃｈの音響方式をキーとして図４のＤＢを検索する。そして、畳み込み信号出力部１０は、ＤＢから、２２．２ｃｈの音響方式のチャンネル番号１～２４に対応する頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ読み出す。

【0051】

これにより、畳み込み信号出力部１０は、２２．２ｃｈの音響方式に対応するチャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を、各チャンネルの角度を意識することなく特定することができる。この場合のＤＢには、音響方式、チャンネル番号（ラベル）、及びこれらの情報に対応する頭部インパルス応答ＨＲＩＲが格納されていればよい。

【0052】

また、畳み込み信号出力部１０は、チャンネル毎の仰角及び方位角の情報を含む再生位置情報Ｐを入力した場合、ステップＳ３０４において、チャンネル毎の仰角及び方位角をキーとして図４のＤＢを検索する。そして、畳み込み信号出力部１０は、ＤＢから、チャンネル毎の仰角及び方位角に対応する頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ読み出す。

【0053】

これにより、畳み込み信号出力部１０は、スピーカー配置がプリセットされていない、２以上のスピーカーが任意に配置されたマルチチャンネルシステムについて、チャンネル毎の角度に対応するチャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を特定することができる。この場合のＤＢには、仰角、方位角、及びこれらの情報に対応する頭部インパルス応答ＨＲＩＲが格納されていればよい。

【0054】

（信号処理部１１）
図１に戻って、信号処理部１１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24を入力すると共に、畳み込み信号出力部１０から頭部インパルス応答ＨＲＩＲ_1～24を入力する。

【0055】

信号処理部１１は、原音ｘ_1～24、劣化音ｘ’_1～24及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成する。具体的には、信号処理部１１は、チャンネル毎に、例えば全ての原音ｘ_1～24、当該チャンネルを含む所定のチャンネルのみの劣化音ｘ’（当該チャンネルのみの１つの劣化音ｘ’、または当該チャンネルを含む複数チャンネルの劣化音ｘ’）、及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行う。信号処理部１１は、チャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}をＰＥＡＱ評価部１２に出力する。

【0056】

ここで、マルチチャンネル音響信号のチャンネル数をＭ（本例ではＭ＝２４）とすると、チャンネル毎の（Ｍ個の）バイノーラル信号ｙ_{1_ori～M_ori}またはｙ_{1_sig～M_sig}を生成する際に、チャンネル毎にチャンネル数Ｎ（＜Ｍ）の劣化音ｘ’または原音ｘが用いられる。Ｍは２より大きい正の整数であり、劣化音ｘ’または原音ｘのチャンネル数Ｎは、１以上かつマルチチャンネル音響信号のチャンネル数Ｍよりも小さい整数である（１≦Ｎ＜Ｍ）。

【0057】

劣化音ｘ’または原音ｘのチャンネル数Ｎは、チャンネル番号ｋ（ｋ＝１～Ｍ）のチャンネルのバイノーラル信号ｙ_{k_ori}，ｙ_{k_sig}を生成する際の、そのチャンネル（チャンネル番号ｋのチャンネル）を含む１または２以上のチャンネルの数である。チャンネル番号ｋのチャンネルに加え、そのチャンネルに対して隣接するチャンネルを含むようにしてもよいし、チャンネル間相関を算出し、正規化相関係数が大きいチャンネルから選択するようにしてもよい。ここで、チャンネル番号ｋの信号をｆ（ｔ）、隣接するチャンネルの信号をｇ（ｔ）とすると、正規化相関関数σ_fgは、以下の数式（１）にて算出される。σ_f，σ_gは信号ｆ（ｔ），ｇ（ｔ）の標準偏差である。

【数1】

【0058】

バイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}は、原音ｘ_1～24に対応する基本信号ｙ_{1_ori～24_ori}、及び劣化音ｘ’_1～24に対応する被測定信号ｙ_{1_sig～24_sig}により構成される。基本信号ｙ_{1_ori～24_ori}及び被測定信号ｙ_{1_sig～24_sig}は、信号処理部１１により、後述する図５または図６に示す処理例にて生成される。

【0059】

図５は、信号処理部１１の第１処理例を示すフローチャートである。この第１処理例は、チャンネル毎に、全ての原音ｘ_1～24、当該チャンネルのみの劣化音ｘ’、及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行い、バイノーラル信号ｙ_{_ori}，ｙ_{1_sig～24_sig}を生成する例である。マルチチャンネル音響信号のチャンネル数Ｍ＝２４、劣化音ｘ’のチャンネル数Ｎ＝１とする。

【0060】

信号処理部１１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24を入力すると共に、畳み込み信号出力部１０から頭部インパルス応答ＨＲＩＲ_1～24を入力する（ステップＳ５０１）。

【0061】

信号処理部１１は、全ての原音ｘ_1～24及び頭部インパルス応答ＨＲＩＲ_1～24を用いて畳み込み処理を行い、共通の基本信号ｙ_{_ori}を生成する（ステップＳ５０２）。

【0062】

具体的には、信号処理部１１は、以下の数式（２）に示すように、チャンネル毎の原音ｘ_1～24にチャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、加算結果を、共通の基本信号ｙ_{_ori}として生成する。

【数2】

【0063】

ここで、チャンネル番号ｋの基本信号をｙ_{k_ori}、チャンネル番号ｉの原音をｘ_i、チャンネル番号ｉの頭部インパルス応答をＨＲＩＲ_iとすると、基本信号ｙ_{k_ori}は、ｙ_{_ori}と同じになる。ｋ，ｉは、それぞれ１から２４までの整数であり、＊は畳み込み演算を示す。

【0064】

信号処理部１１は、チャンネル毎に、チャンネル数２３（＝Ｍ－Ｎ＝２４－１）の原音ｘ及びチャンネル数１（＝Ｎ）の劣化音ｘ’、並びに全てのチャンネルの頭部インパルス応答ＨＲＩＲ_1～24を用いて畳み込み処理を行い、チャンネル毎の被測定信号ｙ_{1_sig～24_sig}を生成する（ステップＳ５０３）。

【0065】

具体的には、信号処理部１１は、チャンネル毎に、当該チャンネル（チャンネル番号ｋとする。）以外のチャンネル数２３の原音ｘに頭部インパルス応答ＨＲＩＲをそれぞれ畳み込み、チャンネル数２３の畳み込み結果を加算し、チャンネル数２３の原音ｘの加算結果を得る。そして、信号処理部１１は、当該チャンネルにおけるチャンネル数１の劣化音ｘ’に頭部インパルス応答ＨＲＩＲを畳み込み、チャンネル数１の劣化音ｘ’の畳み込み結果を得る。

【0066】

信号処理部１１は、チャンネル数２３の原音ｘの加算結果に、チャンネル数１（チャンネル番号ｋとする。）の劣化音ｘ’の畳み込み結果を加算し、当該加算結果を、当該チャンネルの被測定信号ｙ_{k_sig}とし、チャンネル毎の被測定信号ｙ_{1_sig～24_sig}を生成する。

【0067】

尚、信号処理部１１は、原音ｘ_1～24に頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、当該チャンネルの原音ｘに頭部インパルス応答ＨＲＩＲを畳み込み、前者の加算結果から後者の畳み込み結果を減算することで、チャンネル数２３の原音ｘの加算結果を得るようにしてもよい。そして、信号処理部１１は、チャンネル数２３の原音ｘの加算結果に、チャンネル数１の劣化音ｘ’の畳み込み結果を加算し、チャンネル毎の被測定信号ｙ_{1_sig～24_sig}を生成する。これは、後述する数式（３）の演算に相当する。

【0068】

ここで、チャンネル番号ｋの被測定信号をｙ_{k_sig}、チャンネル番号ｉ，ｋの原音をそれぞれｘ_i，ｘ_k、チャンネル番号ｉ，ｋの頭部インパルス応答をそれぞれＨＲＩＲ_i，ＨＲＩＲ_k、チャンネル番号ｋの劣化音をｘ’_kとすると、被測定信号ｙ_{k_sig}は、以下の数式にて表される。

【数3】

【0069】

尚、前記数式（３）は、劣化音ｘ’のチャンネル数Ｎ＝１の式であり、人間が１つのチャンネルに注目して主観評価することを想定したものである。しかし、実際は、音源の種類によっては人間が２以上のチャンネルに着目して主観評価することもあり得る。この場合、劣化音ｘ’のチャンネル数Ｎ＞１としたときの被測定信号ｙ_{k_sig}が算出される。劣化音ｘ’のチャンネル数Ｎ＞１の場合、前記数式（３）の右辺の第２項は、チャンネル数Ｎ分の原音ｘについて畳み込み演算が行われ、それぞれの演算結果が減算される。また、前記数式（３）の右辺の第３項は、チャンネル数Ｎ分の劣化音ｘ’について畳み込み演算が行われ、それぞれの演算結果が加算される。

【0070】

信号処理部１１は、ステップＳ５０２にて生成した基本信号ｙ_{_ori}、及びステップＳ５０３にて生成した被測定信号ｙ_{1_sig～24_sig}をＰＥＡＱ評価部１２に出力する（ステップＳ５０４）。

【0071】

このように、基本信号ｙ_{_ori}は、全てのチャンネルの原音ｘ_1～24を用いた畳み込み処理にて生成される。また、被測定信号ｙ_{1_sig～24_sig}は、チャンネル毎に、当該チャンネル以外のチャンネル数２３の原音ｘ、及び当該チャンネルのチャンネル数１の劣化音ｘ’を用いた畳み込み処理にて生成される。

【0072】

つまり、所定チャンネル（チャンネル番号ｋのチャンネル）のバイノーラル信号ｙ_{k_ori}，ｙ_{k_sig}は、全てのチャンネルの原音ｘ_1～24に基づいた基本信号ｙ_{_ori}と、全てのチャンネルの劣化音ｘ’_1～24のうち当該チャンネルの劣化音ｘ’_kに基づいた被測定信号ｙ_{k_sig}とにより構成される。このため、被測定信号ｙ_{1_sig～24_sig}は、マルチチャンネル音響において、個別の音源の音質劣化に着目して評価する主観評価を考慮したバイノーラル信号となる。

【0073】

図６は、信号処理部１１の第２処理例を示すフローチャートである。この第２処理例は、チャンネル毎に、全ての劣化音ｘ’_1～24、当該チャンネルのみの原音ｘ、及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行い、バイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{_sig}を生成する例である。マルチチャンネル音響信号のチャンネル数Ｍ＝２４、劣化音ｘ’のチャンネル数Ｎ＝１とする。

【0074】

信号処理部１１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24を入力すると共に、畳み込み信号出力部１０から頭部インパルス応答ＨＲＩＲ_1～24を入力する（ステップＳ６０１）。

【0075】

信号処理部１１は、全ての劣化音ｘ’_1～24及び頭部インパルス応答ＨＲＩＲ_1～24を用いて畳み込み処理を行い、共通の被測定信号ｙ_{_sig}を生成する（ステップＳ６０２）。

【0076】

具体的には、信号処理部１１は、以下の数式（４）に示すように、チャンネル毎の劣化音ｘ’_1～24にチャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、加算結果を、共通の被測定信号ｙ_{_sig}として生成する。

【数4】

【0077】

ここで、チャンネル番号ｋの被測定信号をｙ_{k_sig}、チャンネル番号ｉの劣化音をｘ’_i、チャンネル番号ｉの頭部インパルス応答をＨＲＩＲ_iとすると、被測定信号をｙ_{k_sig}は、ｙ_{_sig}と同じになる。

【0078】

信号処理部１１は、チャンネル毎に、チャンネル数２３の劣化音ｘ’及びチャンネル数１の原音ｘ、並びに全てのチャンネルの頭部インパルス応答ＨＲＩＲ_1～24を用いて畳み込み処理を行い、チャンネル毎の基本信号ｙ_{1_ori～24_ori}を生成する（ステップＳ６０３）。

【0079】

具体的には、信号処理部１１は、チャンネル毎に、当該チャンネル以外のチャンネル数２３の劣化音ｘ’に頭部インパルス応答ＨＲＩＲをそれぞれ畳み込み、チャンネル数２３の畳み込み結果を加算し、チャンネル数２３の劣化音ｘ’の加算結果を得る。そして、信号処理部１１は、当該チャンネルにおけるチャンネル数１の原音ｘに頭部インパルス応答ＨＲＩＲを畳み込み、チャンネル数１の原音ｘの畳み込み結果を得る。

【0080】

信号処理部１１は、チャンネル数２３の劣化音ｘ’の加算結果に、チャンネル数１（チャンネル番号ｋとする。）の原音ｘの畳み込み結果を加算し、当該加算結果を、当該チャンネルの基本信号ｙ_{k_ori}とし、チャンネル毎の基本信号ｙ_{1_ori～24_ori}を生成する。

【0081】

尚、信号処理部１１は、劣化音ｘ’_1～24に頭部インパルス応答ＨＲＩＲ_1～24をそれぞれ畳み込み、全てのチャンネルの畳み込み結果を加算し、当該チャンネルの劣化音ｘ’に頭部インパルス応答ＨＲＩＲを畳み込み、前者の加算結果から後者の畳み込み結果を減算することで、チャンネル数２３の劣化音ｘ’の加算結果を得るようにしてもよい。そして、信号処理部１１は、チャンネル数２３の劣化音ｘ’の加算結果に、チャンネル数１の原音ｘの畳み込み結果を加算し、チャンネル毎の基本信号ｙ_{1_ori～24_ori}を生成する。これは、後述する数式（５）の演算に相当する。

【0082】

ここで、チャンネル番号ｋの基本信号をｙ_{k_ori}、チャンネル番号ｉ，ｋの劣化音をそれぞれｘ’_i，ｘ’_k、チャンネル番号ｉ，ｋの頭部インパルス応答をそれぞれＨＲＩＲ_i，ＨＲＩＲ_k、チャンネル番号ｋの原音をｘ_kとすると、基本信号をｙ_{k_ori}は、以下の数式にて表される。

【数5】

【0083】

尚、劣化音のチャンネル数Ｎ＞１の場合、前記数式（５）の右辺の第２項は、チャンネル数Ｎ分の劣化音ｘ’について畳み込み演算が行われ、それぞれの演算結果が減算される。また、前記数式（５）の右辺の第３項は、チャンネル数Ｎ分の原音ｘについて畳み込み演算が行われ、それぞれの演算結果が加算される。

【0084】

信号処理部１１は、ステップＳ６０２にて生成した被測定信号ｙ_{_sig}、及びステップＳ６０３にて生成した基本信号ｙ_{1_ori～24_ori}をＰＥＡＱ評価部１２に出力する（ステップＳ６０４）。

【0085】

このように、被測定信号ｙ_{_sig}は、全てのチャンネルの劣化音ｘ’_1～24を用いた畳み込み処理にて生成される。また、基本信号ｙ_{1_ori～24_ori}は、チャンネル毎に、当該チャンネル以外のチャンネル数２３の劣化音ｘ’、及び当該チャンネルのチャンネル数１の原音ｘを用いた畳み込み処理にて生成される。

【0086】

つまり、所定チャンネル（チャンネル番号ｋのチャンネル）のバイノーラル信号ｙ_{k_ori}，ｙ_{k_sig}は、全てのチャンネルの劣化音ｘ’_1～24に基づいた被測定信号ｙ_{_sig}と、全てのチャンネルの原音ｘ_1～24のうち当該チャンネルの原音ｘ_kに基づいた基本信号ｙ_{k_ori}とにより構成される。この場合、基本信号ｙ_{k_ori}が基本の信号となり、被測定信号ｙ_{_sig}が、所定チャンネルの音源の音質劣化が反映された信号となる。このため、基本信号ｙ_{1_ori～24_ori}は、個別の音源の音質劣化に着目して評価する主観評価を考慮したバイノーラル信号となる。

【0087】

尚、図５及び図６は、劣化音ｘ’のチャンネル数Ｎ＝１の例であるが、Ｎ＞１の場合も同様に適用できる。Ｎ＞１の場合、信号処理部１１は、チャンネル番号ｋのチャンネルの基本信号ｙ_{k_ori}を生成する際に、チャンネル数Ｎ＞１の原音ｘを選択する必要がある。

【0088】

信号処理部１１は、チャンネル番号ｋのチャンネルについて、例えば、当該チャンネルの原音ｘ_kに加え、当該チャンネルに隣接する所定数のチャンネルの原音ｘを選択する。所定数は１以上の整数である。

【0089】

具体的には、チャンネル番号ｋのチャンネルに隣接するチャンネルが複数の場合、信号処理部１１は、チャンネル番号ｋのチャンネルとこれに隣接するチャンネルとの間の正規化相関係数ρ_fg（前記数式（１））を、隣接する複数のチャンネルのそれぞれについて算出する。信号処理部１１は、隣接する複数のチャンネルを、正規化相関係数ρ_fgが大きい順に並べる。信号処理部１１は、チャンネル番号ｋのチャンネルの原音ｘ_kに加え、正規化相関係数ρ_fgの大きい所定数のチャンネルの原音ｘを選択する。チャンネル番号ｋのチャンネルに隣接する複数のチャンネルは、再生位置情報Ｐから予め設定されるものとする。

【0090】

この場合、信号処理部１１は、チャンネル番号ｋのチャンネルに隣接しないチャンネルの原音ｘを選択するようにしてもよい。具体的には、信号処理部１１は、隣接する複数のチャンネル以外のチャンネル（隣接しないチャンネル）について、チャンネル番号ｋのチャンネルと隣接しないチャンネルとの間の正規化相関係数ρ_fgを算出する。そして、信号処理部１１は、その正規化相関係数ρ_fgが隣接するチャンネルよりも大きい場合、隣接するチャンネルに代えて、隣接しないチャンネルの原音ｘを選択する。

【0091】

（ＰＥＡＱ評価部１２）
図１に戻って、ＰＥＡＱ評価部１２は、信号処理部１１からチャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を入力する。そして、ＰＥＡＱ評価部１２は、チャンネル毎に、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法であるＰＥＡＱ客観音質測定法により客観評価値ｚ_1～24を求める。ＰＥＡＱ評価部１２は、チャンネル毎の客観評価値ｚ_1～24をマルチチャンネル評価部１３に出力する。

【0092】

ＰＥＡＱ評価部１２は、ＰＥＡＱ評価手段２０－１、ＰＥＡＱ評価手段２０－２、・・・及びＰＥＡＱ評価手段２０－２４を備えている。ＰＥＡＱ評価手段２０－ｋは、信号処理部１１からチャンネル番号ｋのバイノーラル信号ｙ_{k_ori}，ｙ_{k_sig}を入力し、ＰＥＡＱ客観音質測定法のアルゴリズムを用いて客観評価値ｚ_kを求め、客観評価値ｚ_kをマルチチャンネル評価部１３に出力する。ｋは、前述のとおり１から２４までの整数である。

【0093】

具体的には、ＰＥＡＱ評価手段２０－ｋは、基本信号ｙ_{k_ori}及び被測定信号ｙ_{k_sig}から構成されるバイノーラル信号ｙ_{k_ori}，ｙ_{k_sig}を入力する。そして、ＰＥＡＱ評価手段２０－ｋは、人間の耳の知覚特性を反映した聴覚モデルを用いて、基本信号ｙ_{k_ori}についての聴覚モデル出力信号、及び被測定信号ｙ_{k_sig}についての聴覚モデル出力信号を生成する。

【0094】

この聴覚モデルは、外耳、中耳及び内耳の各機能を模擬したアルゴルズムにより、入力信号にＦＦＴ（Fast Fourier Transform：高速フーリエ変換）を施して周波数成分の信号を生成し、周波数成分の信号を、内耳の機能を反映したグループに分類し、周波数成分の信号に血流等の生理的雑音を加算し、周波数軸上及び時間軸上の広がりを考慮して神経興奮パターンを計算することにより、聴覚モデル出力信号を生成する。

【0095】

ＰＥＡＱ評価手段２０－ｋは、基本信号ｙ_{k_ori}及び被測定信号ｙ_{k_sig}についてのそれぞれの聴覚モデル出力信号に基づいて、聴覚歪み特性を計算し、音響的な信号劣化の程度を表すモデル出力値を求める。そして、ＰＥＡＱ評価手段２０－ｋは、ニューラルネットワーク構造を有する認識モデルを用いて、モデル出力値に基づき客観評価値ｚ_kを求める。

【0096】

尚、ＰＥＡＱ客観音質測定法のアルゴリズムを用いて客観評価値ｚ_kを求める方法は既知であり、詳細については、例えば前述の非特許文献２または以下の文献を参照されたい。
渡辺馨、“オーディオ信号の劣化の評価法”、日本音響学会誌、63巻11号（2007）、pp.686-692

【0097】

（マルチチャンネル評価部１３）
マルチチャンネル評価部１３は、ＰＥＡＱ評価部１２からチャンネル毎の客観評価値ｚ_1～24を入力し、客観評価値ｚ_1～24に基づいてマルチチャンネルの客観評価値ｚを求め、マルチチャンネルの客観評価値ｚを出力する。

【0098】

図７は、マルチチャンネル評価部１３の第１処理例を示すフローチャートである。第１処理例は、ＰＥＡＱ客観音質測定法にて求めたチャンネル毎の客観評価値ｚ_1～24のうち、最低値ｚ_Lをマルチチャンネルの客観評価値ｚとする例である。

【0099】

マルチチャンネル評価部１３は、ＰＥＡＱ評価部１２からチャンネル毎の客観評価値ｚ_1～24を入力し（ステップＳ７０１）、チャンネル毎の客観評価値ｚ_1～24のうち、最低値ｚ_Lを検出する（ステップＳ７０２）。

【0100】

マルチチャンネル評価部１３は、ステップＳ７０２にて検出した最低値ｚ_Lをマルチチャンネルの客観評価値ｚに設定し（ｚ＝ｚ_L）、マルチチャンネルの客観評価値ｚを出力する（ステップＳ７０３）。

【0101】

このように、マルチチャンネル評価部１３は、ＰＥＡＱ客観音質測定法にて求めたチャンネル毎の客観評価値ｚ_1～24のうち、最低値ｚ_Lをマルチチャンネルの客観評価値ｚとして出力するようにした。これにより、人間がマルチチャンネル音響において特定のチャンネルに着目したときの最も評価の低いチャンネルについて、当該チャンネルの客観評価値が、マルチチャンネルの客観評価値ｚとして出力される。つまり、マルチチャンネルの客観評価値ｚは、個別の音源の音質劣化に着目して評価される主観評価値に近い値となる。

【0102】

図８は、マルチチャンネル評価部１３の第２処理例を示すフローチャートである。第２処理例は、ＰＥＡＱ客観音質測定法にて求めたチャンネル毎の客観評価値ｚ_1～24に重み付け係数Ｗ_1～24を乗算し、全てのチャンネルの乗算結果を加算することでマルチチャンネルの客観評価値ｚを求める例である。

【0103】

マルチチャンネル評価部１３は、ＰＥＡＱ評価部１２からチャンネル毎の客観評価値ｚ_1～24を入力し（ステップＳ８０１）、チャンネル毎の客観評価値ｚ_1～24に、所定の重み付け係数Ｗ_1～24をそれぞれ乗算し、チャンネル毎の乗算結果を求める（ステップＳ８０２）。重み付け係数Ｗ_1～24の合計値は１である。

【0104】

マルチチャンネル評価部１３は、ステップＳ８０２にて求めた全てのチャンネルの乗算結果を加算し（ステップＳ８０３）、加算結果をマルチチャンネルの客観評価値ｚに設定し、マルチチャンネルの客観評価値ｚを出力する（ステップＳ８０４）。

【0105】

ここで、図８に示した第２処理例は、以下の数式にて表される。

【数6】

【0106】

所定の重み付け係数Ｗ_1～24としては、チャンネル毎に、客観評価値ｚ_1～24が大きいほど（劣化が小さいほど）小さい値が用いられ、客観評価値ｚ_1～24が小さいほど（劣化が大きいほど）大きい値が用いられる。所定の重み付け係数Ｗ_1～24は、ユーザにより予め設定されるようにしてもよいし、所定の処理により自動的に設定されるようにしてもよい。

【0107】

以下、所定の処理にて重み付け係数Ｗ_1～24を設定する例について説明する。図９は、マルチチャンネル評価部１３による重み付け係数Ｗ_1～24の設定処理例を示すフローチャートである。マルチチャンネル評価部１３は、チャンネル番号ｉ（ｉ＝１～２４）を順番に設定し（ステップＳ９０１）、客観評価値ｚ_iが所定値よりも大きいか否かを判定する（ステップＳ９０２）。

【0108】

ＰＥＡＱ評価部１２により求めた客観評価値ｚ_iにおいて、０が「劣化音を検知できない」、－１が「劣化音を検知できるが気にならない」、－２が「劣化音がやや気になる」、－３が「劣化音が気になる」、－４が「劣化音が非常に気になる」を示す場合、ステップＳ９０２にて用いる所定値は、例えば－１である。

【0109】

マルチチャンネル評価部１３は、ステップＳ９０２において、客観評価値ｚ_iが所定値よりも大きいと判定した場合（ステップＳ９０２：Ｙ）、チャンネル番号ｉのチャンネルの音響信号について、劣化が小さいと判断し、重み付け係数Ｗ_i＝０に設定する（ステップＳ９０３）。

【0110】

一方、マルチチャンネル評価部１３は、ステップＳ９０２において、客観評価値ｚ_iが所定値よりも大きくないと判定した場合（ステップＳ９０２：Ｎ）、当該音響信号のラウドネスレベルに基づいて、重み付け係数Ｗ_iを設定する（ステップＳ９０４）。

【0111】

具体的には、マルチチャンネル評価部１３は、図１には図示しないラウドネス測定部から、チャンネル番号ｉのチャンネルの音響信号についてのラウドネスレベルを入力する。そして、マルチチャンネル評価部１３は、ラウドネスレベルが所定値よりも大きくないと判断したチャンネルが複数ある場合、ラウドネスレベルが大きいほど重み付け係数Ｗ_iが大きくなり（１に近くなり）、ラウドネスレベルが小さいほど重み付け係数Ｗ_iが小さくなるように（０に近くなるように）、音響信号のラウドネスレベルに基づいた重み付け係数Ｗ_iを設定する。これにより、音響信号のラウドネスレベルに対応した重み付け係数Ｗ_iが得られる。尚、重み付け係数Ｗ_1～24の合計値は、１であるとする。

【0112】

この場合、図示しないラウドネス測定部は、例えば以下の文献の手法を用いて、チャンネル毎にラウドネス（音の大きさ）を測定する。
Rec. ITU-R BS.1770-4,“Algorithms to measure audio programme loudness and true-peak audio level”
ラウドネス測定部は、複数あるチャンネル毎のラウドネスレベルをマルチチャンネル評価部１３に出力する。マルチチャンネル評価部１３では、チャンネル毎のラウドネスレベルに応じた重み付け係数Ｗ_iを設定する。

【0113】

尚、マルチチャンネル評価部１３は、チャンネルの正規化相関係数ρ_fgに対応した重み付け係数Ｗ_iを設定するようにしてもよい。具体的には、マルチチャンネル評価部１３は、図１には図示しない相関係数算出部から、チャンネル番号ｉのチャンネルにおける正規化相関係数ρ_fgを入力する。マルチチャンネル評価部１３は、正規化相関係数ρ_fgが大きいほど重み付け係数Ｗ_iが大きくなり（１に近くなり）、正規化相関係数ρ_fgが小さいほど重み付け係数Ｗ_iが小さくなるように（０に近くなるように）、重み付け係数Ｗ_iを設定する。これにより、チャンネルの正規化相関係数ρ_fgに対応した重み付け係数Ｗ_iが得られる。

【0114】

この場合、図示しない相関係数算出部は、チャンネル番号ｉのチャンネルと当該チャンネル以外のチャンネルとの間の正規化相関係数ρ_fgを、前記数式（１）を用いてそれぞれ算出する。そして、相関係数算出部は、これを、チャンネル番号ｉのチャンネルにおける正規化相関係数ρ_fgとしてマルチチャンネル評価部１３に出力する。

【0115】

また、マルチチャンネル評価部１３は、チャンネル毎の客観評価値ｚ_iのうち最低値ｚ_Lを検出し、その最低値ｚ_Lを有するチャンネルに隣接する複数のチャンネルについて、客観評価値ｚ_iが所定値以下の場合、重み付け係数Ｗ_iの合計値が１を超えるように、重み付け係数Ｗ_iを設定するようにしてもよい。ただし、重み付け係数Ｗ_iの合計値は２を超えないものとする。また、ＰＥＡＱ評価部１２により求めた客観評価値ｚ_iが、前述のとおり０～－４で表される場合、客観評価値ｚ_iと比較される所定値は、例えば－１である。

【0116】

このように、マルチチャンネル評価部１３は、ＰＥＡＱ客観音質測定法にて求めたチャンネル毎の客観評価値ｚ_1～24に所定の重み付け係数Ｗ_1～24を乗算し、全ての乗算結果を加算することで、マルチチャンネルの客観評価値ｚを生成して出力するようにした。これにより、人間が特定のチャンネルに着目したときのＰＥＡＱ客観音質測定法にて求めたチャンネル毎の客観評価値ｚ_1～24に対し、その着目度合いに応じた重み付け係数Ｗ_1～24が用いられることで、チャンネル毎に異なる着目度合いが反映されたマルチチャンネルの客観評価値ｚが生成され出力される。つまり、マルチチャンネルの客観評価値ｚは、個別の音源の音質劣化に着目して評価される主観評価値に近い値となる。

【0117】

〔実験結果〕
次に、コンピュータシミュレーションによる実験結果について説明する。この実験結果は、マルチチャンネル客観評価装置１により出力されたマルチチャンネルの客観評価値ｚが、前述の非特許文献１のＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定めた主観評価法により求めた主観評価値に近いことを示すものである。

【0118】

図１０は、実験結果を示す図であり、実際に収音した２２．２ｃｈのマルチチャンネル音響信号の環境音を評価した結果を示す。（ａ）は、前述の非特許文献１のＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定めた主観評価法により求めた主観評価結果を示し、（ｂ）は、本発明の実施形態による客観評価結果（劣化音ｘ’のチャンネル数Ｎ＝１の場合）を示す。

【0119】

また、（ｃ）は、前述の非特許文献４の方法に、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法を組み込んだ従来技術（前述の想定手法）による客観評価結果を示す。具体的には、（ｃ）の客観評価結果は、前述のとおり、マルチチャンネル音響信号に頭部インパルス応答ＨＲＩＲを畳み込んで２チャンネル信号を生成し、前述の非特許文献２の客観評価法により求めた結果である。

【0120】

（ａ）（ｂ）及び（ｃ）の横軸は、音響信号のビットレート［kbit/s］を示す。ビットレートが高いほど圧縮率は低く、ビットレートが低いほど圧縮率は高い関係にある。（ａ）の縦軸は主観評価値（Diff Grade）を示し、（ｂ）及び（ｃ）の縦軸は客観評価値（Diff Grade）を示す。（ｂ）の客観評価値は、図１に示したマルチチャンネル客観評価装置１のマルチチャンネル評価部１３により出力されたマルチチャンネルの客観評価値ｚである。

【0121】

前述と同様に、主観評価値及び客観評価値の０は「劣化音を検知できない」、－１は「劣化音を検知できるが気にならない」、－２は「劣化音がやや気になる」、－３は「劣化音が気になる」、－４は「劣化音が非常に気になる」を示す。

【0122】

（ａ）（ｂ）及び（ｃ）から、（ｂ）に示す本発明の実施形態の客観評価結果は、（ｃ）に示す従来技術の客観評価結果よりも、（ａ）に示す主観評価結果に近いことがわかる。

【0123】

このように、本発明の実施形態のマルチチャンネル客観評価装置１を用いることにより、前述の非特許文献１のＩＴＵ－Ｒ勧告ＢＳ．１１１６－３に定めた主観評価法により求めた主観評価値に近いマルチチャンネルの客観評価値ｚを求めることができる。

【0124】

以上のように、本発明の実施形態のマルチチャンネル客観評価装置１によれば、畳み込み信号出力部１０は、予め設定されたＤＢを用いて、２４チャンネルの音響信号の再生位置情報Ｐに基づき、チャンネル毎の頭部インパルス応答ＨＲＩＲ_1～24を特定して出力する。

【0125】

信号処理部１１は、マルチチャンネル音響信号の原音ｘ_1～24、劣化音ｘ’_1～24及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成する。具体的には、信号処理部１１は、チャンネル毎に、例えば全ての原音ｘ_1～24、当該チャンネルのみの劣化音ｘ’、及び頭部インパルス応答ＨＲＩＲ_1～24に基づいて畳み込み処理を行い、バイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成する。

【0126】

ＰＥＡＱ評価部１２は、チャンネル毎に、バイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}に基づいて、前述の非特許文献２のＩＴＵ－Ｒ勧告ＢＳ．１３８７－１に定めた客観評価法であるＰＥＡＱ客観音質測定法により客観評価値ｚ_1～24を求める。

【0127】

マルチチャンネル評価部１３は、チャンネル毎の客観評価値ｚ_1～24に基づいて、マルチチャンネルの客観評価値ｚを求める。

【0128】

ここで、ＰＥＡＱ評価部１２が用いる客観評価対象のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}は、信号処理部１１において個別の音源の音質劣化に着目して生成される主観評価を考慮した信号である。これにより、マルチチャンネル評価部１３が求めるマルチチャンネルの客観評価値ｚは、バイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}の客観評価値ｚ_1～24から生成されるから、主観評価値に近い値となる。したがって、２チャンネルを超えるマルチチャンネル音響信号の品質について、主観評価結果に近い客観評価結果を得ることが可能となる。

【0129】

以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。前記実施形態では、マルチチャンネル客観評価装置１は、２２．２ｃｈのマルチチャンネル音響信号を評価対象として、マルチャンネルの客観評価値ｚを求めるようにした。本発明は、評価対象を２２．２ｃｈのマルチチャンネル音響信号に限定するものではなく、１１．１ｃｈ、７．１ｃｈ、５．１ｃｈ等の他の音響方式のマルチチャンネル音響信号にも適用がある。

【0130】

また、本発明は、スピーカー配置がプリセットされた２２．２ｃｈ等の音響方式のマルチチャンネル音響信号だけでなく、スピーカー配置がプリセットされていない、２以上のスピーカーが任意に配置されたマルチチャンネル音響信号にも適用がある。

【0131】

また、前記実施形態では、マルチチャンネル客観評価装置１は、畳み込み信号として、頭部インパルス応答ＨＲＩＲ_1～24を用いるようにした。本発明は、畳み込み信号を頭部インパルス応答ＨＲＩＲ_1～24に限定するものではなく、他のインパルス応答、例えばバイノーラル室内インパルス応答ＢＲＩＲ（Binaural Room Impulse Response）_1～24を用いるようにしてもよい。

【0132】

この場合、図４を参照して、畳み込み信号出力部１０に備えたＤＢには、頭部インパルス応答ＨＲＩＲ_1～24の代わりに、バイノーラル室内インパルス応答ＢＲＩＲ_1～24が格納されている。畳み込み信号出力部１０は、ＤＢから、再生位置情報Ｐに対応するチャンネル毎の伝搬特性を表すバイノーラル室内インパルス応答ＢＲＩＲ_1～24を読み出す。そして、信号処理部１１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24、並びにバイノーラル室内インパルス応答ＢＲＩＲ_1～24に基づいて畳み込み処理を行い、主観評価を考慮したチャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成する。

【0133】

また、前記実施形態では、マルチチャンネル客観評価装置１は、マルチチャンネル音響信号の原音ｘ_1～24及び劣化音ｘ’_1～24にバイノーラル室内インパルス応答ＢＲＩＲ_1～24を畳み込み、チャンネル毎のバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成するようにした。本発明は、この畳み込み処理を時間領域での演算に限定するものではなく、周波数領域に変換した原音ｘ_1～24及び劣化音ｘ’_1～24と、頭部伝達関数ＨＲＴＦ（Head Related Transfer Function）_1～24の積を演算し、時間領域に変換してバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成するようにしてもよい。また、本発明は、原音ｘ_1～24及び劣化音ｘ’_1～24の周波数成分とバイノーラル室内伝達関数ＢＲＴＦ（Binaural Room Transfer Function）_1～24の積を演算し、時間領域に変換してバイノーラル信号ｙ_{1_ori～24_ori}，ｙ_{1_sig～24_sig}を生成するようにしてもよい。

【0134】

尚、本発明の実施形態によるマルチチャンネル客観評価装置１のハードウェア構成としては、通常のコンピュータを使用することができる。マルチチャンネル客観評価装置１は、ＣＰＵ、ＲＡＭ等の揮発性の記憶媒体、ＲＯＭ等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。

【0135】

マルチチャンネル客観評価装置１に備えた畳み込み信号出力部１０、信号処理部１１、ＰＥＡＱ評価部１２及びマルチチャンネル評価部１３の各機能は、これらの機能を記述したプログラムをＣＰＵに実行させることによりそれぞれ実現される。

【0136】

これらのプログラムは、前記記憶媒体に格納されており、ＣＰＵに読み出されて実行される。また、これらのプログラムは、磁気ディスク（フロッピー（登録商標）ディスク、ハードディスク等）、光ディスク（ＣＤ－ＲＯＭ、ＤＶＤ等）、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。

【符号の説明】

【0137】

１マルチチャンネル客観評価装置
１０畳み込み信号出力部
１１信号処理部
１２ＰＥＡＱ評価部
１３マルチチャンネル評価部
２０－１～２４ＰＥＡＱ評価手段
ｘ_1～24 マルチチャンネル音響信号の原音
ｘ’_1～24 マルチチャンネル音響信号の劣化音
Ｐ再生位置情報
ＨＲＩＲ_1～24 頭部インパルス応答
Ｍマルチチャンネル音響信号のチャンネル数
Ｎ劣化音ｘ’のチャンネル数Ｎ
ＢＲＩＲ_1～24 バイノーラル室内インパルス応答
ＨＲＴＦ_1～24 頭部伝達関数
ＢＲＴＦ_1～24 バイノーラル室内伝達関数
ｙ_{1_ori～24_ori} 基本信号（バイノーラル信号）
ｙ_{1_sig～24_sig} 被測定信号（バイノーラル信号）
ｙ_{_ori} 共通の基本信号
ｙ_{_sig} 共通の被測定信号
ｚ_1～24 チャンネル毎の客観評価値
ｚマルチチャンネルの客観評価値
ρ_fg 正規化相関係数
Ｗ_1～24 重み付け係数

【図1】