(58)【調査した分野】(Int.Cl.,DB名)
マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成する変換部と、
前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成する第1符号化部と、
前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
を具備する音声音響信号符号化装置。
少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、
前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、
前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
を具備する音声音響信号符号化装置。
音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成される、逆多重化部と、
前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得る第1復号部と、
前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得る第2復号部と、
前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する逆変換部と、
を具備する音声音響信号復号装置。
音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、
前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得て、
前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得て、
前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する、
音声音響信号復号方法。
【発明を実施するための形態】
【0016】
以下、本開示の各実施の形態について、図面を参照して詳細に説明する。
【0017】
(実施の形態1)
[システム構成]
図1は、本実施の形態に係るシステムの構成例を示す。
図1に示すシステム1は、少なくとも、音声音響信号の符号化を行う符号化装置10(マルチチャネルエンコーダ)及び音声音響信号の復号を行う復号装置20(マルチチャネルデコーダ)を備える。
【0018】
符号化装置10には、マルチチャネルデジタル音響信号の各チャネル信号が入力される。例えば、マルチチャネルデジタル音響信号は、マイクロホンアレーユニット(図示せず)が取得したアナログ音響信号に対してデジタル変換を施すことにより得られる。なお、
図1では、4個のチャネル信号(ch1〜ch4)が入力される場合について示すが、マルチチャネルデジタル音響信号のチャネル数は4個に限定されない。
【0019】
[符号化装置の構成]
符号化装置10は、変換器11(変換部に相当する)及びエンコーダ12を含む構成を採る。
【0020】
変換器11は、入力信号である各チャネル信号(ch1〜ch4)に対して重み付け加算処理を施し、各チャネル信号(ch1〜ch4)をマルチチャネルデジタル信号(S、X、Y、Z)に変換する。
【0021】
図2は、変換器11の内部構成の一例を示す。
図2において、加算器111−1、111−2、111−3は、複数のチャネル信号ch1〜ch4を全て加算して加算信号S(=ch1+ch2+ch3+ch4)を生成する。
【0022】
また、
図2に示す減算器112−1、112−2、112−3は、複数のチャネル信号ch1〜ch4のチャネル間の差分信号を生成する。例えば、
図2では、減算器112−1は隣接するチャネル信号ch1とチャネル信号ch2との差分信号X(=ch1−ch2)を生成し、減算器112−2は隣接するチャネル信号ch2とチャネル信号ch3との差分信号Y(=ch2−ch3)を生成し、減算器112−3は隣接するチャネル信号ch3とチャネル信号ch4との差分信号Z(=ch3−ch4)を生成する。
【0023】
変換器11は、加算信号S及び差分信号X、Y、Zを含むマルチチャネルデジタル信号をエンコーダ12に出力する。
【0024】
エンコーダ12は、EVSコーデックを用いて、変換器11から出力されるマルチチャネルデジタル信号をそれぞれ符号化してモノラル符号化データを生成し、モノラル符号化データを多重化してマルチチャネル符号化データとして出力する。
【0025】
図3は、エンコーダ12の内部構成の一例を示す。
図3に示すエンコーダ12は、モノラルマルチモードエンコーダ121、122、123、124及び多重化部125を含む構成を採る。
【0026】
モノラルマルチモードエンコーダ121(第1符号化部に相当する)は、変換器11から入力される加算信号Sを符号化してモノラル符号化データ(第1符号化データに相当する)を生成する。モノラルマルチモードエンコーダ121は、モノラル符号化データを多重化部125へ出力する。
【0027】
なお、モノラルマルチモードエンコーダ121は、符号化の際、入力される加算信号Sの特徴(例えば、音声、非音声などの種類)に応じて符号化モードを判定し、判定した符号化モードを用いて加算信号Sの符号化を行う。モノラルマルチモードエンコーダ121は、加算信号Sの符号化に用いられた符号化モードを示すモード情報を、モノラルマルチモードエンコーダ122〜124へ出力する。また、モノラルマルチモードエンコーダ121は、モード情報を符号化し、モノラル符号化データに含めて、多重化部125へ出力する。
【0028】
つまり、モノラルマルチモードエンコーダ121〜124は、加算信号Sの符号化に用いられた符号化モードを共有する。
【0029】
モノラルマルチモードエンコーダ122〜124(第2符号化部に相当する)は、モノラルマルチモードエンコーダ121から入力されるモード情報に示される符号化モードを用いて、変換器11から入力される差分信号X、Y、Zをそれぞれ符号化してモノラル符号化データ(第2符号化データに相当する)を生成する。モノラルマルチモードエンコーダ122〜124は、モノラル符号化データを多重化部125へ出力する。
【0030】
多重化部125は、マルチモードエンコーダ121〜124から入力される各符号化データを多重して、マルチチャネル符号化データとして伝送路へ出力する。
【0031】
[復号装置の構成]
復号装置20は、デコーダ21及び逆変換器22(逆変換部に相当する)を含む構成を採る。
【0032】
デコーダ21は、受信したマルチチャネル符号化データを、複数のモノラル符号化データに分離し、複数のモノラル符号化データを復号して、復号マルチチャネルデジタル信号(S’、X’、Y’、Z’)を得る。
【0033】
図4は、デコーダ21の内部構成の一例を示す。
図4に示すデコーダ21は、逆多重化部211及びモノラルマルチモードデコーダ212〜215を含む構成を採る。
【0034】
逆多重化部211は、伝送路を介して符号化装置10から受け取ったマルチチャネル符号化データを、加算信号に対応するモノラル符号化データと各差分信号に対応するモノラル符号化データとに分離する。逆多重化部211は、加算信号に対応するモノラル符号化データをモノラルマルチモードデコーダ212(第1復号部に相当する)に出力し、各差分信号に対応するモノラル符号化データをモノラルマルチモードデコーダ213〜215(第2復号部に相当する)にそれぞれ出力する。なお、加算信号に対応するモノラル符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれている。
【0035】
モノラルマルチモードデコーダ212は、逆多重化部211から入力されるモード情報を復号して、符号化装置10で用いられた符号化モードを特定する。モノラルマルチモードデコーダ212は、特定した符号化モードに基づいて、加算信号Sに対応するモノラル符号化データを復号し、得られる復号信号S’を逆変換器22へ出力する。また、モノラルマルチモードデコーダ212は、符号化モードを示すモード情報をモノラルマルチモードデコーダ213〜215へ出力する。
【0036】
つまり、モノラルマルチモードデコーダ212〜215は、符号化装置10において加算信号Sの符号化に用いられた符号化モードを共有する。
【0037】
モノラルマルチモードデコーダ213〜215は、モノラルマルチモードデコーダ212から入力されるモード情報に示される符号化モードに従って、逆多重化部211から入力される、差分信号X、Y、Zにそれぞれ対応するモノラル符号化データを復号し、得られる復号信号X’、Y’、Z’を逆変換器22へ出力する。
【0038】
逆変換器22は、デコーダ21から入力される各復号信号S’,X’,Y’,Z’に対して重み付け加算を施し、復号信号S’,X’,Y’,Z’を復号マルチチャネルデジタル音響信号(ch1’〜ch4’)に変換する。
【0039】
図5は、逆変換器22の内部構成の一例を示す。
図5において、増幅器221−1〜221−7には、各復号信号S’,X’,Y’,Z’に対する重み付け係数が設定されている。加算器222−1〜222−4は、各増幅器221−1〜221−7から出力される信号を加算して、マルチチャネルデジタル音響信号の各復号チャネル信号を生成する。
【0040】
例えば、増幅器221−1〜221−7及び加算器222−1〜222−4は、以下のようにして各復号チャネル信号ch1’〜ch4’を生成する。
ch1’=0.25×(S’+3X’+2Y’+ Z)
ch2’=0.25×(S’− X’+2Y’+ Z)
ch3’=0.25×(S’− X’−2Y’+ Z)
ch4’=0.25×(S’− X’−2Y’−3Z)
【0041】
[効果]
以上のように、本実施の形態では、符号化装置10は、マルチチャネル信号を、全てのチャネルの加算信号と、チャネル間の差分信号とにミキシングして符号化する。この際、符号化装置10は、加算信号の符号化において判定された符号化モードを、差分信号の符号化にも用いる。また、復号装置20は、加算信号及び差分信号の各々に対応するモノラル符号化データを、符号化装置10で用いた符号化モードに従って復号する。
【0042】
このように加算信号の符号化復号を行い、復号加算信号を用いて各チャネル信号を再合成することによって,各チャネル信号に加わる符号化誤差を共通化することができる。さらに、加算信号及び差分信号の符号化モードを共通とすることにより、各チャネル信号に加わる符号化誤差の特性を揃えることができる。これにより、チャネル信号間の相関関係の崩れを抑えることができる。よって、復号装置20では、復号チャネル信号間の位相歪みを低減できる。換言すると、符号化/復号に用いる符号化モードが全てのチャネルで同じになり、また、全てのチャネルの信号が全チャネルの平均信号の復号信号を用いて表現される。このため、復号装置20では、同一時間において異なる符号化モードが使用されたり、各チャネルで符号化誤差を共有しなかったりすることによって生じる、復号信号の歪特性がチャネル間で異なるというマルチチャネル信号の品質劣化を回避することができる。
【0043】
これにより、例えば、復号装置20の後段において、各チャネル信号の位相関係を利用するビームフォーミング処理への符号化誤差の影響を低減させることができる。つまり、本実施の形態によれば、EVSコーデックによって符号化されたマルチチャネル信号を用いてビームフォーミング処理を行う場合に、ビームフォーミング性能の劣化を抑えることができる。
【0044】
また、符号化装置10の各モノラルマルチモードエンコーダ及び復号装置20の各モノラルマルチモードデコーダでは符号化モードが共有されるので、符号化装置10は、全てのモノラルマルチモードエンコーダ121〜124に対するモード情報を符号化する必要はなく、1つのモード情報のみを復号装置20へ送信すればよい。
【0045】
また、符号化装置10は、全チャネルの加算信号Sに基づいて符号化モードを判定するので、マルチチャネル全体として最適な符号化モードを選択することができる。これは、加算信号Sにはマルチチャネル音響信号における音の平均的な特徴が含まれているのに対して、差分信号X,Y,Zは加算信号Sに対して信号のレベルが小さく、音の特徴を捉えにくいためである。
【0046】
また、本実施の形態によれば、隣接チャネルの信号位相を補正してから差分信号を算出する場合でも、差分信号の符号化歪を少なくする、という効果が得られる。
【0047】
なお、本実施の形態では、複数の符号化モード(マルチモード)を有する符号化装置について説明したが、1つの符号化モードのみを有し、モード切替を行わない符号化装置についても適用可能である。例えば、変換器において、少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する。エンコーダにおいて、第1符号化部では、変換器から出力された1チャネルの加算信号を符号化して第1符号化データを生成し、第2符号化部では、少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する。そして、多重化部において、第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成し、出力する。
【0048】
このような構成においても、本実施形態のマルチモードと同様に、エンコーダにおいて復号加算信号を用いて各チャネル信号を再合成することによって、各チャネル信号に加わる符号化誤差を共通化することができるため、各チャネル信号の位相関係を利用するビームフォーミング処理への符号化誤差の影響を低減させることができる。
【0049】
また、デコーダについても、本実施の形態では、符号化装置から出力された、符号化モード情報に示される符号化モードに従って逆多重化をする復号装置について説明したが、符号化モード情報が入力されない場合についても適用可能である。
【0050】
(実施の形態2)
本実施の形態では、マルチチャネル音響信号に対してビームフォーミング処理(収音処理)を行う収音システムについて説明する。
【0051】
図6は、本実施の形態に係る収音システムの構成例を示す。
図6に示す収音システム1aは、マイクロホンアレーユニット30と収音処理部40と、実施の形態1で説明した符号化装置10及び復号装置20と、を含む構成を採る。
【0052】
マイクロホンアレーユニット30は、音響信号をアナログ電気信号に変換する複数のマイクロホン(
図6では4個のマイクロホン)と、アナログ電気信号をデジタル音響信号に変換するA/D変換器とを含む。マイクロホンアレーユニット30は、各マイクロホンに対応するデジタル音響信号(チャネル信号ch1〜ch4)から構成されるマルチチャネルデジタル音響信号を符号化装置10に出力する。
【0053】
実施の形態1で説明したように、符号化装置10はマルチチャネルデジタル音響信号を符号化し、復号装置20は符号化装置10から受け取るマルチチャネル符号化データを復号し、各復号チャネル信号(ch1’〜ch4’)から構成される復号マルチチャネル音響信号を収音処理部40へ出力する。
【0054】
収音処理部40は、復号装置20から入力される復号マルチチャネル音響信号に対してビームフォーミング処理を行って、収音対象の信号(目標信号)のみを抽出して出力する。
【0055】
具体的には、収音処理部40は、位相補正部41と、加算部42と、減算部43と、サイドローブキャンセラ44と、サイドローブサプレッサ45とを含む構成を採る。
【0056】
位相補正部41は、目標信号の到来方向に応じて、復号マルチチャネル音響信号の各復号チャネル信号の位相を補正して、位相補正後の復号チャネル信号を加算部42及び減算部43に出力する。
【0057】
加算部42は、位相補正後の全ての復号チャネル信号を加算する。加算信号では、目標信号の成分が強調される。加算部42は、加算信号をサイドローブキャンセラ44に出力する。
【0058】
減算部43は、位相補正後の復号チャネル信号に対して、隣接チャネル間の差分信号を生成する。隣接チャネル間の差分信号では、目標信号の成分が相殺され、雑音成分が強調される。減算部43は、差分信号をサイドローブキャンセラ44及びサイドローブサプレッサ45に出力する。
【0059】
サイドローブサプレッサ44及びサイドローブサプレッサ45は、加算部42から入力される加算信号と減算部43から入力される差分信号とを用いて、目標信号の成分を強調するとともに目標信号以外の成分を抑圧する抑圧部として機能する。
【0060】
具体的には、サイドローブキャンセラ44は、加算部42から入力される加算信号から、減算部43から入力される差分信号に対応する成分を取り除くことにより、目標信号以外の信号成分(雑音成分など)を抑圧して、目標信号を強調させる。
【0061】
サイドローブサプレッサ45は、サイドローブキャンセラ44から入力される信号、及び、減算部43から入力される差分信号を用いて、目標信号以外の信号成分を周波数領域(スペクトル領域)において更に抑圧して、目標信号を強調させる。
【0062】
サイドローブサプレッサ45の出力信号は、ビームフォーム処理の最終出力信号として出力される。
【0063】
例えば、収音システム1aにおいて、収音処理部40の処理は、クラウドサーバが行ってもよい。すなわち、復号装置20は、復号マルチチャネル音響信号を、インターネットなどのネットワークを介して接続されるクラウドサーバに送信し、クラウドサーバが収音処理を行ってもよい。
【0064】
このようにして、本実施の形態によれば、収音処理(ビームフォーミング処理)の性能劣化を抑えたマルチチャネル音響信号の伝送が可能となる。
【0065】
以上、本開示各実施の形態について説明した。
【0066】
なお、
図5では、復号装置20の逆変換器22において重み付け係数を設定する場合について説明したが、変換器11及び逆変換器22の重み付け係数は任意に変更可能である。例えば、符号化装置10の変換器11において重み付け係数を設定してもよい。この場合、変換器11は、以下のように加算信号S及び差分信号X,Y,Zを生成する。
S=0.25×(ch1+ch2+ch3+ch4)
X=0.25×(ch1−ch2)
Y=0.25×(ch2−ch3)
Z=0.25×(ch3−ch4)
【0067】
また、この場合、逆変換器22は、以下のように各復号チャネル信号ch1’〜ch4’を生成する。
ch1’=S’+3X’+2Y’+ Z
ch2’=S’− X’+2Y’+ Z
ch3’=S’− X’−2Y’+ Z
ch4’=S’− X’−2Y’−3Z
【0068】
また、例えば、収音システム1aにおいて、変換器11及び逆変換器22の重み付け加算の内容は、収音処理における加算部42の加算処理及び減算部43の減算処理の内容が本実施の形態と異なる場合には、それに合わせてもよい。
【0069】
また、本開示の一態様は、上記各実施の形態に限定されず、種々変更して実施することが可能である。
【0070】
例えば、X,Y,Zは以下のようなチャネル間差分信号とすることも可能である。
X=(ch1+ch2)−(ch3+ch4)
Y=(ch1+ch3)−(ch2+ch4)
Z=(ch1+ch4)−(ch2+ch3)
これに対応するための各復号チャネル信号ch1’〜ch4’も導出可能である。
【0071】
また、上記各実施の形態では、本開示の一態様をハードウェアで構成する場合を例にとって説明したが、本開示はハードウェアとの連携においてソフトウェアでも実現することも可能である。
【0072】
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。集積回路は、上記実施の形態の説明に用いた各機能ブロックを制御し、入力端子と出力端子を備えてもよい。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
【0073】
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)または、LSI内部の回路セルの接続若しくは設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
【0074】
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
【0075】
本開示の音声音響信号符号化装置は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を生成する変換部と、加算信号の特徴に応じた符号化モードで加算信号を符号化して第1符号化データを生成する第1符号化部と、加算信号の符号化に用いられた符号化モードで差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、第1符号化データと第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
【0076】
本開示の音声音響信号符号化装置は、少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
【0077】
本開示の音声音響信号符号化装置において、音声音響入力信号は、マイクロホンアレーユニットから出力される信号である。
【0078】
本開示の音声音響信号符号化装置において、差分信号は、複数のチャネル信号の隣接チャネル間の差分信号である。
【0079】
本開示の音声音響信号符号化装置において、第1符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる。
【0080】
本開示の音声音響信号復号装置は、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、第1符号化データは、音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、加算信号の特徴に応じた符号化モードで符号化して生成され、第2符号化データは、音声音響信号符号化装置において、複数のチャネル信号のチャネル間の差分信号を加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成される、逆多重化部と、加算信号の符号化に用いられた符号化モードで第1符号化データを復号して復号加算信号を得る第1復号部と、加算信号の符号化に用いられた符号化モードで第2符号化データを復号して復号差分信号を得る第2復号部と、復号加算信号及び復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する逆変換部と、を具備する構成を採る。
【0081】
本開示の音声音響信号復号装置において、差分信号は、複数のチャネル信号の隣接チャネル間の差分信号である。
【0082】
本開示の音声音響信号復号装置において、第1符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる。
【0083】
本開示の収音システムは、復号装置から出力される復号音声音響信号に対してビームフォーミング処理を行い、目標信号を抽出する収音処理部を具備し、収音処理部は、復号音声音響信号の各復号チャネル信号の位相を補正する位相補正部と、位相補正された復号チャネル信号の全てを加算して加算信号を生成する加算部と、位相補正された復号チャネル信号の隣接チャネル間の差分信号を生成する減算部と、加算信号と差分信号とを用いて、目標信号の成分を強調するとともに目標信号以外の成分を抑圧する抑圧部と、を具備する。
【0084】
本開示の音声音響信号符号化方法は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を生成し、加算信号の特徴に応じた符号化モードで加算信号を符号化して第1符号化データを生成し、加算信号の符号化に用いられた符号化モードで差分信号をそれぞれ符号化して第2符号化データを生成し、第1符号化データと第2符号化データとを多重化して、マルチチャネル符号化データを生成する。
【0085】
本開示の音声音響信号復号方法は、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、第1符号化データは、音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、加算信号の特徴に応じた符号化モードで符号化して生成され、第2符号化データは、音声音響信号符号化装置において、複数のチャネル信号のチャネル間の差分信号を加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、加算信号の符号化に用いられた符号化モードで第1符号化データを復号して復号加算信号を得て、加算信号の符号化に用いられた符号化モードで第2符号化データを復号して復号差分信号を得て、復号加算信号及び復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する。