(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】信号処理装置および方法、並びにプログラム
(51)【国際特許分類】
H04S 3/00 20060101AFI20240806BHJP
H04R 3/00 20060101ALI20240806BHJP
H04R 1/02 20060101ALI20240806BHJP
G10L 19/00 20130101ALI20240806BHJP
G10L 19/008 20130101ALI20240806BHJP
H04S 7/00 20060101ALI20240806BHJP
H04R 7/04 20060101ALI20240806BHJP
H04R 1/40 20060101ALI20240806BHJP
【FI】
H04S3/00 600
H04R3/00 310
H04R1/02 102Z
G10L19/00 330B
G10L19/008 200
H04S7/00 300
H04R7/04
H04R1/40 310
(21)【出願番号】P 2021533909
(86)(22)【出願日】2020-07-03
(86)【国際出願番号】 JP2020026170
(87)【国際公開番号】W WO2021014933
(87)【国際公開日】2021-01-28
【審査請求日】2023-05-12
(31)【優先権主張番号】P 2019133695
(32)【優先日】2019-07-19
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100121131
【氏名又は名称】西川 孝
(74)【代理人】
【氏名又は名称】稲本 義雄
(74)【代理人】
【識別番号】100168686
【氏名又は名称】三浦 勇介
(72)【発明者】
【氏名】戸栗 康裕
(72)【発明者】
【氏名】及川 芳明
【審査官】金子 秀彦
(56)【参考文献】
【文献】国際公開第2018/123310(WO,A1)
【文献】米国特許出願公開第2019/0191240(US,A1)
【文献】国際公開第2018/154302(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 3/00
H04R 3/00
H04R 1/02
G10L 19/00
G10L 19/008
H04S 7/00
H04R 7/04
H04R 1/40
(57)【特許請求の範囲】
【請求項1】
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出する非多重化部と、
前記符号化音声信号を復号する復号部と、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する調整部と
を備える信号処理装置。
【請求項2】
前記調整部は、前記復号により得られた所定の前記音声信号の出力先として定められている出力先パネルスピーカで過振幅が生じる場合、前記出力先パネルスピーカと、過振幅が生じない他のパネルスピーカとを前記所定の前記音声信号の出力先として決定する
請求項1に記載の信号処理装置。
【請求項3】
前記調整部は、前記音声信号に基づいて、前記所定の前記音声信号を前記他のパネルスピーカに出力するときの配分ゲインを計算する
請求項2に記載の信号処理装置。
【請求項4】
前記他のパネルスピーカは、前記出力先パネルスピーカに隣接して配置された前記パネルスピーカである
請求項2に記載の信号処理装置。
【請求項5】
前記他のパネルスピーカは、サブウーハである
請求項2に記載の信号処理装置。
【請求項6】
前記音声信号はマルチチャンネル信号であり、前記複数の前記パネルスピーカごとに、出力されるチャンネルの前記音声信号が定められている
請求項1に記載の信号処理装置。
【請求項7】
前記音声信号はオーディオオブジェクトのオブジェクト信号である
請求項2に記載の信号処理装置。
【請求項8】
前記所定の前記音声信号の出力先とする前記他のパネルスピーカは、前記所定の前記音声信号に対応する前記オーディオオブジェクトの動きの有無に基づいて決定される
請求項7に記載の信号処理装置。
【請求項9】
前記オーディオオブジェクトが静止している場合、前記オーディオオブジェクトの位置から最も近い位置に配置されている前記パネルスピーカが前記他のパネルスピーカとされる
請求項8に記載の信号処理装置。
【請求項10】
前記オーディオオブジェクトが移動している場合、前記オーディオオブジェクトの移動方向に基づいて前記他のパネルスピーカが決定される
請求項8に記載の信号処理装置。
【請求項11】
前記符号化データには、前記所定の前記音声信号を前記他のパネルスピーカに出力するときの配分ゲインが含まれており、
前記調整部は、前記過振幅フラグと、前記復号により得られた音声信号と、前記配分ゲインとに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
請求項2に記載の信号処理装置。
【請求項12】
前記符号化データには、複数の前記パネルスピーカからなる、互いに異なる複数のパネル構成ごとに、前記パネルスピーカの前記過振幅フラグが含まれている
請求項1に記載の信号処理装置。
【請求項13】
信号処理装置が、
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出し、
前記符号化音声信号を復号し、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
信号処理方法。
【請求項14】
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出し、
前記符号化音声信号を復号し、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
ステップを含む処理をコンピュータに実行させるプログラム。
【請求項15】
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出し、その検出結果を示す過振幅フラグを生成する過振幅検出部と、
前記音声信号を符号化する符号化部と、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する多重化部と
を備える信号処理装置。
【請求項16】
前記音声信号はマルチチャンネル信号であり、前記複数の前記パネルスピーカごとに、出力されるチャンネルの前記音声信号が定められている
請求項15に記載の信号処理装置。
【請求項17】
所定の前記音声信号の出力先として定められている出力先パネルスピーカでの過振幅が検出された場合、前記音声信号に基づいて、前記所定の前記音声信号を前記出力先パネルスピーカと他のパネルスピーカとに出力するときの配分ゲインを計算する配分ゲイン計算部をさらに備え、
前記多重化部は、前記過振幅フラグと、前記符号化音声信号と、前記配分ゲインとを多重化して前記符号化データを生成する
請求項15に記載の信号処理装置。
【請求項18】
前記過振幅検出部は、複数の前記パネルスピーカからなる、互いに異なる複数のパネル構成ごとに、前記パネルスピーカの前記過振幅フラグを生成する
請求項15に記載の信号処理装置。
【請求項19】
信号処理装置が、
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出して、その検出結果を示す過振幅フラグを生成し、
前記音声信号を符号化し、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する
信号処理方法。
【請求項20】
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出して、その検出結果を示す過振幅フラグを生成し、
前記音声信号を符号化し、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する
ステップを含む処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、信号処理装置および方法、並びにプログラムに関し、特に少ない処理負荷で高品位な音を再生することができるようにした信号処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
近年、テレビなどの映像を表示するパネルをアクチュエータで加振して音を再生する、いわゆるパネルスピーカシステムが普及してきている。
【0003】
このようなパネルスピーカシステムでは、スピーカとして機能するパネルの過振幅によってパネルの位置にずれが生じたり、パネルに表示される映像に揺れや歪みが生じたりすることがある。そのため、パネルを一定以上振動させないように、つまり過振幅が生じないようにする必要がある。
【0004】
特に映像が暗い部分では、パネルが振動すると、そのパネルで反射した光が揺れて見えるため、映像の揺れが目立ちやすい。
【0005】
そこで、コンテンツの再生側の装置において、音声の信号レベルからパネルの振動を予測し、所定以上の振動を検出した場合には信号レベルを抑制したり、信号の一部の帯域をカットしたりすることでパネルの過振幅を防止することが行われている。
【0006】
また、例えばフラットパネルを加振器により振動させて音を出力するフラットパネルスピーカにおいて、音声周波数全体で最も振動しやすい箇所を避けるように加振器を配置することで、大きな定在波の発生を抑制する技術も提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上述した技術ではパネル状の振動板を有するパネルスピーカで音を再生させる場合に、再生側の処理負荷を抑えつつ高品位な音を再生することは困難であった。
【0009】
例えば、再生側の装置で過振幅を検出しながら音声再生を行うには、再生側で演算リソースが必要であり、また、突発的な過振幅を検出しようとするとバッファリングなどの処理遅延も発生してしまう。
【0010】
さらに、再生側の装置において過振幅を検出した場合に、単純に信号レベルを抑制してしまうと、所望の音圧レベルを得ることができずに音の品質が低下してしまうこともある。
【0011】
本技術は、このような状況に鑑みてなされたものであり、少ない処理負荷で高品位な音を再生することができるようにするものである。
【課題を解決するための手段】
【0012】
本技術の第1の側面の信号処理装置は、符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出する非多重化部と、前記符号化音声信号を復号する復号部と、前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する調整部とを備える。
【0013】
本技術の第1の側面の信号処理方法またはプログラムは、符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出し、前記符号化音声信号を復号し、前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整するステップを含む。
【0014】
本技術の第1の側面においては、符号化データが非多重化されて、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとが抽出され、前記符号化音声信号が復号され、前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号が調整される。
【0015】
本技術の第2の側面の信号処理装置は、複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出し、その検出結果を示す過振幅フラグを生成する過振幅検出部と、前記音声信号を符号化する符号化部と、前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する多重化部とを備える。
【0016】
本技術の第2の側面の信号処理方法またはプログラムは、複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出して、その検出結果を示す過振幅フラグを生成し、前記音声信号を符号化し、前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成するステップを含む。
【0017】
本技術の第2の側面においては、複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかが検出されて、その検出結果を示す過振幅フラグが生成され、前記音声信号が符号化され、前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とが多重化されて符号化データが生成される。
【図面の簡単な説明】
【0018】
【
図1】一般的なパネル構成について説明する図である。
【
図3】符号化データのフォーマット例を示す図である。
【
図4】符号化処理を説明するフローチャートである。
【
図6】隣接するパネルスピーカへの配分例について説明する図である。
【
図7】隣接するパネルスピーカへの配分例について説明する図である。
【
図10】符号化データのフォーマット例を示す図である。
【
図11】隣接パネルスピーカの相対的な位置について説明する図である。
【
図12】符号化処理を説明するフローチャートである。
【
図14】復号処理を説明するフローチャートである。
【
図16】配分先パネルスピーカの調整について説明する図である。
【
図17】符号化音声データのフォーマット例を示す図である。
【
図18】符号化OAMのフォーマット例を示す図である。
【
図19】符号化処理を説明するフローチャートである。
【
図20】配分ゲイン計算処理を説明するフローチャートである。
【
図22】復号処理を説明するフローチャートである。
【
図23】ストリーミング配信システムの構成例を示す図である。
【
図24】再生処理および配信処理を説明するフローチャートである。
【
図25】プリレンダリングレベルについて説明する図である。
【発明を実施するための形態】
【0019】
以下、図面を参照して、本技術を適用した実施の形態について説明する。
【0020】
〈第1の実施の形態〉
〈パネルスピーカシステムについて〉
本技術は、パネル状(板状)の振動板を振動させて音を出力するパネルスピーカを複数組み合わせてなるパネルスピーカシステムに関するものである。
【0021】
特に、本技術では、コンテンツの符号化側においてパネルスピーカの過振幅の発生の有無を検出することで、復号側(再生側)の処理負荷を低減させることができるようにした。
【0022】
また、本技術では、復号側において、過振幅の発生が検出されたパネルスピーカの一部の出力を、そのパネルスピーカに隣接する他のパネルスピーカに配分することで所望の音圧レベルを確保し、高品位な音を再生することができるようにした。
【0023】
それでは、以下、本技術について、より具体的に説明する。
【0024】
図1は、一般的なパネルスピーカシステムにおけるパネル構成の例を示している。
【0025】
パネル構成は、複数のパネルスピーカを並べて配置することにより1つの大きなパネルを形成する場合における、パネルスピーカの個数、つまりパネル枚数、各パネルスピーカの配置位置(配置パターン)、および各パネルスピーカのパネルの大きさや形状などである。
【0026】
図1の矢印Q11に示す例では、3個のパネルスピーカP0、パネルスピーカP1、およびパネルスピーカP2が図中、横方向に隣接して並べられている。
【0027】
また、パネルスピーカP0乃至パネルスピーカP2の各パネル部分により1つのパネルが形成されており、例えばこのパネルが映像を表示する表示パネルとしても機能する。
【0028】
換言すれば、表示パネル全体が縦方向に長い領域に3分割されており、それらの各領域がパネルスピーカP0乃至パネルスピーカP2となっている。
【0029】
特に、この例ではパネルスピーカP0乃至パネルスピーカP2のそれぞれは、左チャンネル、センターチャンネル、および右チャンネルに対応している。したがって、例えばパネルスピーカP0は、左チャンネルの音声信号に基づいて振動し、音を出力する。
【0030】
また、矢印Q12に示す例では、表示パネルが6分割されており、それらの分割された各領域のパネルがパネルスピーカP0乃至パネルスピーカP5とされている。
【0031】
特に、ここではパネルスピーカP0とパネルスピーカP1が左チャンネルに対応し、パネルスピーカP2とパネルスピーカP3がセンターチャンネルに対応し、パネルスピーカP4とパネルスピーカP5が右チャンネルに対応している。
【0032】
さらに、矢印Q13に示す例では、表示パネルが9分割されており、それらの分割された各領域のパネルがパネルスピーカP0乃至パネルスピーカP8とされている。
【0033】
特に、ここではパネルスピーカP0乃至パネルスピーカP2が左チャンネルに対応し、パネルスピーカP3乃至パネルスピーカP5がセンターチャンネルに対応し、パネルスピーカP6乃至パネルスピーカP8が右チャンネルに対応している。
【0034】
なお、
図1で示したパネル構成や、各パネル構成におけるパネルスピーカに対するチャンネルの割り当てはあくまで一例であって、パネル構成やチャンネルの割り当ては、どのようなものであってもよい。
【0035】
このように、パネルスピーカシステムでは、様々なパネル構成が可能であるが、テレビの受信装置の仕様および規格はARIB(Association of Radio Industries and Businesses:電波産業会)の標準規格で規定されていることから、パネルスピーカシステムを搭載したテレビのパネル構成も標準規格で規定される可能性がある。
【0036】
したがって、ここでは何種類かのパネル構成と、各パネル構成でのチャンネルの割り当て方法が予め規定されているものとして説明を行う。
【0037】
〈符号化側の信号処理装置の構成例〉
図2は、本技術を適用した符号化側の信号処理装置の構成例を示す図である。
【0038】
図2に示す信号処理装置11は、例えば映像と音声からなるコンテンツなど、少なくとも音声を含むコンテンツの音声信号を符号化し、その結果得られた符号化データを送信(出力)する符号化装置として機能する。
【0039】
信号処理装置11は、パネル過振幅検出部21、コア信号符号化部22、および多重化部23を有している。
【0040】
パネル過振幅検出部21およびコア信号符号化部22には、コンテンツの音声信号として、マルチチャンネル信号を構成する各チャンネルのチャンネル音声信号が供給される。各チャンネルのチャンネル音声信号は、それらの各チャンネルの音を再生するための音声信号である。
【0041】
パネル過振幅検出部21は、供給された各チャンネル音声信号に基づいて、予め規定された互いに異なる複数のパネル構成ごとに、各パネルスピーカで過振幅が生じるかを検出し、その検出結果を示す過振幅フラグを多重化部23に供給する。
【0042】
すなわち、パネル構成ごとに各チャンネルのチャンネル音声信号の出力先となるパネルスピーカが予め定められて(規定されて)いる。
【0043】
パネル過振幅検出部21では、チャンネル音声信号に基づいてパネルスピーカを駆動したとき、つまりパネルスピーカでチャンネル音声信号に基づく音を再生したときの過振幅の発生の有無が検出される。
【0044】
例えば過振幅フラグの値が「1」である場合、パネルスピーカで過振幅が発生することを示しており、過振幅フラグの値が「0」である場合、パネルスピーカで過振幅は発生しないことを示している。
【0045】
コア信号符号化部22は、供給された各チャンネル音声信号を所定の音声符号化方式で符号化し、その結果得られた符号化音声信号を多重化部23に供給する。
【0046】
例えばチャンネル音声信号の音声符号化方式は、標準規格であるARIB STD-B32で規定された音声符号化方式などとされる。
【0047】
なお、コア信号符号化部22で得られた符号化音声信号を復号し、その結果得られた復号後のチャンネル音声信号をパネル過振幅検出部21の入力として過振幅の発生の有無を検出するようにしてもよい。そうすれば、より高精度に過振幅を検出することができる。
【0048】
多重化部23は、パネル過振幅検出部21から供給された過振幅フラグと、コア信号符号化部22から供給された符号化音声信号とを所定のフォーマットで多重化し、その結果得られた符号化データを、復号側の装置に送信する。
【0049】
〈符号化データのフォーマット例〉
ここで、多重化部23で得られる符号化データのフォーマット例について説明する。符号化データは、例えば
図3に示すフォーマットで多重化される。
【0050】
図3の例では、文字「audio_encoded_data()」は、所定のオーディオフレームの符号化データを示しており、文字「encoded_channel_data()」は、所定の音声符号化方式で符号化された、1オーディオフレーム分の符号化音声信号を示している。
【0051】
また、文字「Number_of_PanelConfig」は、予め規定されているパネル構成のパターン数を示しており、文字「Num_of_SubPanels[i]」は、i番目のパネル構成パターンにおける構成パネルの枚数、つまりパネルスピーカ数を示している。
【0052】
さらに文字「Panel_Control_Flag[i][k]」は、i番目のパネル構成パターンにおけるk番目のパネルスピーカの過振幅フラグを示しており、過振幅フラグは1ビットで表現される。
【0053】
このように信号処理装置11では、オーディオフレーム(以下、単にフレームと称する)ごとに符号化音声信号と過振幅フラグが多重化されて符号化データとされ、復号側の装置へと伝送される。
【0054】
また、各フレームでは予め規定された複数のパネル構成ごとに、それらのパネル構成の各パネルスピーカでチャネル音声信号に基づく音を再生したときに、過振幅が発生するか否かを示す過振幅フラグが各パネルスピーカについて生成される。
【0055】
〈符号化処理の説明〉
続いて、信号処理装置11の動作について説明する。
【0056】
すなわち、以下、
図4のフローチャートを参照して、信号処理装置11により行われる符号化処理について説明する。この符号化処理は、信号処理装置11に1フレーム分のチャンネル音声信号が供給されると開始される。
【0057】
ステップS11においてパネル過振幅検出部21は、供給された各チャンネル音声信号に基づいて、予め規定されたパネル構成ごとに、各パネルスピーカにおいて過振幅が生じるかを検出する。
【0058】
例えば上述したように、予め複数のパネル構成が定められており、各パネル構成において、どのパネルスピーカにどのチャンネルが割り当てられるか、つまりどのパネルスピーカにどのチャンネルのチャンネル音声信号が供給されるかも予め定められている。
【0059】
ここで、所定のパネル構成のときの1つのパネルスピーカに注目すると、そのパネルスピーカに供給されるチャンネル音声信号の信号レベルが同じであっても、パネルスピーカの共振周波数付近ではパネルスピーカのパネル(振動板)は、より大きく振動する。
【0060】
そこでパネル過振幅検出部21では、予め規定されたパネル構成ごとに用意された、そのパネル構成での各パネルスピーカの振幅特性が用いられて、チャンネル音声信号からパネルスピーカの振幅が予測(推定)される。
【0061】
具体的には、例えばパネル過振幅検出部21は、パネル構成ごとに、各パネルスピーカの振幅特性を近似した振幅予測フィルタを予め保持している。
【0062】
パネル過振幅検出部21は、保持している振幅予測フィルタにより、パネルスピーカに供給されるチャンネル音声信号に対してフィルタリング処理を行うことで、そのパネルスピーカでチャンネル音声信号に基づく音を再生したときのパネルスピーカの振幅値を予測する。
【0063】
そして、パネル過振幅検出部21は、予測により得られたパネルスピーカの振幅値(以下、予測振幅値とも称する)が所定の上限値を超えた場合、つまり予測振幅値が上限値よりも大きい場合、過振幅が発生すると判定し、値が「1」である過振幅フラグを生成する。
【0064】
これに対してパネル過振幅検出部21は、パネルスピーカの予測振幅値が上述の上限値以下である場合、過振幅は発生しないとして、値が「0」である過振幅フラグを生成する。
【0065】
パネル過振幅検出部21は、このようにしてパネル構成ごとに、各パネルスピーカについて過振幅フラグを生成すると、それらの過振幅フラグを多重化部23に供給する。
【0066】
なお、パネルスピーカの振幅値が同じであっても、そのパネルスピーカを構成する、振動板としても表示部としても機能するパネルに表示される映像が暗いと、その映像の揺れや歪みがより目立つことになる。
【0067】
そこで、例えばパネルスピーカのパネル部分に表示される映像(画像)の輝度値と、パネルスピーカの振幅特性(例えば、振幅の最大値)とに基づいて、パネルスピーカの振幅の上限値を動的に定めるようにしてもよい。
【0068】
ステップS12においてコア信号符号化部22は、供給された各チャンネル音声信号を所定の音声符号化方式で符号化し、その結果得られた符号化音声信号を多重化部23に供給する。
【0069】
ステップS13において多重化部23は、パネル過振幅検出部21から供給された過振幅フラグと、コア信号符号化部22から供給された符号化音声信号とを所定のフォーマットで多重化する。これにより、例えば
図3に示した符号化データが得られる。
【0070】
ステップS14において多重化部23は、ステップS13の処理で得られた符号化データを復号側の装置に送信し、符号化処理は終了する。
【0071】
なお、符号化データは、有線または無線により復号側の装置に送信される他、例えばリムーバブル記録媒体等に出力されて記録されたり、所定のコンテンツ配信サーバ等に供給されたりしてもよい。
【0072】
以上のようにして信号処理装置11は、パネル構成ごとに各パネルスピーカでの過振幅の発生の有無を検出し、その検出結果を示す過振幅フラグを生成する。そして、信号処理装置11は、過振幅フラグと符号化音声信号とを多重化し、符号化データとする。
【0073】
このように符号化側である信号処理装置11で過振幅の検出を行うことで、復号側の装置における処理負荷を低減させることができる。
【0074】
また、生成した過振幅フラグを符号化音声信号とともに復号側の装置に送信することで、復号側においてはどのパネルスピーカで過振幅が発生するかを把握することができる。
【0075】
したがって、復号側では、過振幅が発生するパネルスピーカに供給される音声信号の一部、すなわち音声信号に基づく音の音圧レベルの一部を隣接する他のパネルスピーカに配分することで十分な音圧レベルを確保し、高品位な音を再生することができるようになる。
【0076】
〈復号側の信号処理装置の構成例〉
続いて、符号化側の信号処理装置11から送信された符号化データを受信して復号する、復号側の信号処理装置について説明する。
【0077】
そのような復号側の信号処理装置は、例えば
図5に示すように構成される。
【0078】
図5に示す信号処理装置51は、信号処理装置11から送信された符号化データを受信して復号する復号装置として機能するとともに、パネルスピーカ52-1乃至パネルスピーカ52-Nとサブウーハ53に対して出力信号を供給して音を出力させる再生制御装置としても機能する。
【0079】
パネルスピーカ52-1乃至パネルスピーカ52-Nおよびサブウーハ53は、パネルスピーカシステムを構成し、例えばテレビなど、映像と音声を再生する再生装置に設けられている。
【0080】
例えばパネルスピーカ52-1乃至パネルスピーカ52-Nを構成する各パネルは、スピーカの振動板としても機能するとともに、コンテンツの映像を表示する表示パネルとしても機能する。
【0081】
この場合、パネルスピーカ52-1乃至パネルスピーカ52-Nの各パネルは、タイル状に並べられて1つの大きな表示パネルとして機能する。パネルスピーカ52-1乃至パネルスピーカ52-Nの各パネルの大きさや配置、パネル枚数などは、予め定められた複数のパネル構成のうちの何れかのパネル構成のものと同じとなっている。
【0082】
なお、以下、パネルスピーカ52-1乃至パネルスピーカ52-Nを特に区別する必要のない場合、単にパネルスピーカ52とも称する。
【0083】
サブウーハ53は、パネルスピーカ52で出力される音よりも低い周波数帯域の音を再生するスピーカであり、信号処理装置51から供給された出力信号に基づいて音を出力する。
【0084】
なお、ここでは信号処理装置51と、パネルスピーカ52およびサブウーハ53からなるパネルスピーカシステムとが異なる装置である例について説明する。しかし、これらの信号処理装置51、パネルスピーカ52、およびサブウーハ53は、テレビなどの1つの再生装置に設けられていてもよい。
【0085】
信号処理装置51は、非多重化部61、コア信号復号部62、およびパネル出力調整部63を有している。
【0086】
非多重化部61は、信号処理装置11の多重化部23により送信された符号化データを受信するとともに、受信した符号化データを非多重化し、符号化データから過振幅フラグおよび符号化音声信号を抽出する。
【0087】
非多重化部61は、非多重化により得られた各パネル構成の過振幅フラグのうち、パネルスピーカ52のパネル構成の過振幅フラグをパネル出力調整部63に供給するとともに、非多重化により得られた符号化音声信号をコア信号復号部62に供給する。
【0088】
コア信号復号部62は、非多重化部61から供給された、マルチチャンネル信号の各チャンネルの符号化音声信号を、コア信号符号化部22での音声符号化方式に対応する復号方式で復号し、その結果得られたチャンネル音声信号をパネル出力調整部63に供給する。
【0089】
パネル出力調整部63は、非多重化部61から供給された過振幅フラグと、コア信号復号部62から供給されたチャンネル音声信号に基づいて、各パネルスピーカ52およびサブウーハ53に供給する、パネルスピーカ52のパネル構成に応じた出力信号を調整する。
【0090】
パネル出力調整部63は、配分ゲイン計算部71およびパネル出力制御部72を有している。
【0091】
配分ゲイン計算部71は、非多重化部61から供給された過振幅フラグと、コア信号復号部62から供給されたチャンネル音声信号とに基づいて、過振幅が生じるパネルスピーカ52に供給されるチャンネル音声信号の一部を他のパネルスピーカ52やサブウーハ53へと配分するときの配分ゲインを示す配分ゲイン情報を生成する。
【0092】
換言すれば、配分ゲイン計算部71は、過振幅が生じるチャンネルのチャンネル音声信号の配分先のパネルスピーカ52やサブウーハ53と、その配分時の配分ゲインとを決定し、その結果を示す配分ゲイン情報を生成する。
【0093】
配分ゲイン計算部71は、生成した配分ゲイン情報とともに過振幅フラグをパネル出力制御部72へと供給する。
【0094】
なお、以下、過振幅が発生するパネルスピーカ、つまりチャンネル音声信号の配分元となるパネルスピーカを配分元パネルスピーカとも称し、チャンネル音声信号の配分先のパネルスピーカを配分先パネルスピーカとも称することとする。
【0095】
また、以下、配分元パネルスピーカに隣接して設けられたパネルスピーカを、隣接パネルスピーカとも称することとする。
【0096】
パネル出力制御部72は、コア信号復号部62から供給されたチャンネル音声信号と、配分ゲイン計算部71から供給された過振幅フラグおよび配分ゲイン情報とに基づいて、各パネルスピーカ52およびサブウーハ53に供給する音声信号である出力信号を生成する。
【0097】
パネル出力制御部72は、パネルスピーカ52やサブウーハ53ごとに出力信号を生成すると、生成したそれらの出力信号をパネルスピーカ52およびサブウーハ53に供給し、コンテンツの音を再生させる。
【0098】
〈配分先と配分ゲインの決定について〉
ここで、配分ゲイン計算部71とパネル出力制御部72で行われる処理、すなわち配分先のパネルスピーカ52やサブウーハ53の決定と、配分ゲインの計算、出力信号の生成について説明する。
【0099】
例えば、所定のチャンネルCH1に対応するパネルスピーカ52の過振幅フラグの値が「0」である場合、つまり過振幅が発生しない場合、予め規定された方法に従って、そのチャンネルCH1のチャンネル音声信号が、対応するパネルスピーカ52にそのまま振り分けられる。
【0100】
この場合、チャンネルCH1のチャンネル音声信号が、そのままチャンネルCH1に対応するパネルスピーカ52に供給される出力信号とされる。
【0101】
換言すれば、チャンネルCH1のチャンネル音声信号は、そのチャンネルCH1に対応するパネルスピーカ52に隣接する他のパネルスピーカ52やサブウーハ53には配分されない。したがって、この場合、チャンネルCH1のチャンネル音声信号の配分ゲインの計算は行われない。
【0102】
これに対して、所定のチャンネルCH1に対応するパネルスピーカ52の過振幅フラグの値が「1」であり、過振幅が発生する場合には、そのチャンネルCH1のチャンネル音声信号の音圧レベルの一部が、チャンネルCH1に対応するパネルスピーカ52に隣接する他のパネルスピーカ52やサブウーハ53に配分される。
【0103】
そして、配分先のパネルスピーカ52やサブウーハ53へのチャンネルCH1のチャンネル音声信号(音圧レベル)の配分量を示す配分ゲインが計算される。
【0104】
この場合、チャンネルCH1に対応するパネルスピーカ52と、配分先とされたパネルスピーカ52やサブウーハ53とがチャンネルCH1のチャンネル音声信号の出力先として決定されたことになる。
【0105】
配分ゲインは、配分先とされたパネルスピーカ52やサブウーハ53にチャンネルCH1のチャンネル音声信号を出力(配分)するときの、そのチャンネルCH1のチャンネル音声信号のゲインである。
【0106】
例えば
図6に示すように、9個のパネルスピーカ52が設けられているとする。
【0107】
図6では、文字「P0」乃至「P8」が記された図中の各四角形が1つのパネルスピーカ52を表している。以下では、文字「Pi」(但し、i=0,1,…,8)が記された四角形により表されるパネルスピーカ52をパネルスピーカPiとも称することとする。
【0108】
いま、パネルスピーカP0の過振幅フラグが「1」であり、パネルスピーカP0で過振幅が発生するとする。
【0109】
この場合、もともとパネルスピーカP0に供給されるチャンネル音声信号の音圧レベルの一部が、そのパネルスピーカP0に隣接するパネルスピーカP1、パネルスピーカP3、パネルスピーカP4や、サブウーハ53に配分される。
【0110】
基本的には、配分元パネルスピーカのチャンネル音声信号の音圧レベルの一部が配分される場合、隣接パネルスピーカのうち、過振幅フラグが「0」である隣接パネルスピーカが配分先として決定(選択)される。
【0111】
しかし、例えば過振幅フラグが「0」である隣接パネルスピーカのうち、配分元パネルスピーカのチャンネルと同じチャンネルの隣接パネルスピーカに対して優先的に音圧レベルの配分が行われるようにしてもよい。
【0112】
また、この例では音圧レベルの一部が隣接パネルスピーカに対して配分される。そのため、あるチャンネルでは、配分元のパネルスピーカだけでなく、配分先のパネルスピーカからもそのチャンネルの音が出力されることになるので、音像の定位位置に微小なずれが生じてしまう。
【0113】
しかし、この例では再生対象となる音声信号は、各チャンネルのチャンネル音声信号であるため、そのような音像定位位置の微小なずれは聴取者に知覚されることはないので、コンテンツの音の音像感を損ねることはない。
【0114】
ここで、配分先パネルスピーカにチャンネル音声信号の音圧レベルの一部を配分する具体的な方法の例について説明する。
【0115】
例えば、対応するチャンネルのチャンネル音声信号に基づいて駆動したときの、つまりチャンネル音声信号に基づいて音を出力したときのパネルスピーカ52の振幅が
図7に示すようになっているとする。
【0116】
なお、
図7において横軸には各パネルスピーカ52が示されており、縦軸はパネルスピーカ52の振幅値、より詳細には予測振幅値を示している。
【0117】
この例では、パネルスピーカP0乃至パネルスピーカP4の予測振幅値は、それぞれy0乃至y4となっており、振幅値の上限値がyTとされている。
【0118】
したがって、パネルスピーカP0では予測振幅値y0が上限値yTを超えているので過振幅が発生するが、他のパネルスピーカP1、パネルスピーカP3、およびパネルスピーカP4では、予測振幅値y1、予測振幅値y3、および予測振幅値y4は上限値yT以下であるので過振幅は発生しない。
【0119】
ここでは、パネルスピーカP0において過振幅が発生するので、予測振幅値y0における上限値yTを超える分の出力レベル(音圧レベル)が、隣接するパネルスピーカP1、パネルスピーカP3、およびパネルスピーカP4に配分される。
【0120】
隣接パネルスピーカへの音圧レベルの配分にあたっては、図中の矢印により表されるように、例えば配分先パネルスピーカにおける振幅値の上限値までの余裕(余剰)、すなわち上限値yTと予測振幅値との差分に比例して出力レベルが配分される。
【0121】
また、その際、配分先のパネルスピーカ52において過振幅が生じないように、つまり配分後の最終的な予測振幅値が上限値yTを超えないように配分が行われる。
【0122】
さらに、隣接するパネルスピーカ52へとチャンネル音声信号の音圧レベルを配分するときに、配分元のパネルスピーカ52と配分先のパネルスピーカ52でのゲイン(配分ゲイン)の和が1となるようにされる。換言すれば、各チャンネルの音圧レベルが変化しないようになされる。
【0123】
しかし、配分先パネルスピーカ52で過振幅が生じないようにすると、配分ゲインの和が1となるようにすることができない、つまり1未満となることがある。そのようなときには、残りの音圧レベルはサブウーハ53に配分される。
【0124】
以上で説明した音圧レベルの配分の具体的な計算例を以下に示す。
【0125】
ここでは、パネルスピーカP0において過振幅が発生するものとする。
【0126】
いま、例えばパネルスピーカP0に供給されるチャンネル音声信号をx0とし、次式(1)に示すように、チャンネル音声信号x0に所定のゲインg0を乗算してゲイン補正を行うことで得られる信号がパネルスピーカP0の出力信号x0’とされることとする。
【0127】
【0128】
なお、以下では、ゲインg0のように、配分元のパネルスピーカ52に供給される出力信号を生成するためのゲインも配分ゲインと称することとする。
【0129】
式(1)で示されるパネルスピーカP0の配分ゲインg0は、例えば次式(2)に示すように、上限値yTとパネルスピーカP0の予測振幅値y0との比を計算することで、求めることができる。このように配分ゲインg0を定めることで、パネルスピーカP0の振幅値は上限値yTとなる。
【0130】
【0131】
また、パネルスピーカP0についての音圧レベルの配分先パネルスピーカPi(但し、i=1,3,4)の音圧レベル配分前の出力信号、つまり配分先パネルスピーカPiに対応するチャンネルのチャンネル音声信号をxiとし、配分先パネルスピーカPiへの配分ゲインをαiとする。この場合、配分先パネルスピーカPiに供給される、音圧レベル配分後の最終的な出力信号xi’は次式(3)に示すようになる。
【0132】
【0133】
なお、式(3)において、Sは音圧レベルを配分可能な隣接パネルスピーカの集合を表しており、隣接パネルスピーカのうちの過振幅フラグが「1」であるものは集合Sから除外されている。
【0134】
式(3)では、過振幅が生じるパネルスピーカP0のチャンネル音声信号x0に、配分先パネルスピーカPiの配分ゲインαiを乗算して得られる信号、つまりチャンネル音声信号x0を配分ゲインαiによりゲイン補正して得られる信号αix0が、配分先パネルスピーカPiへと配分された分の信号となっている。
【0135】
そして、その信号αix0とチャンネル音声信号xiとの和が、最終的な配分先パネルスピーカPiの出力信号xi’とされる。
【0136】
例えば、チャンネル音声信号x0が所定のチャンネルCH0の音を再生するための信号であり、チャンネル音声信号xiがチャンネルCH1の音を再生するための信号であるとする。
【0137】
このとき、パネルスピーカPiが出力信号xi’に基づいて音を出力すると、パネルスピーカPiからは、チャンネルCH1の音と、配分ゲインαiの分だけのチャンネルCH0の音とが出力されることになる。
【0138】
つまり、もともとはパネルスピーカP0のみにより再生されることになっていたチャンネルCH0の音が、そのパネルスピーカP0と配分先パネルスピーカPiによって再生されることになる。なお、パネル構成によっては、チャンネル音声信号x0とチャンネル音声信号xiが同じチャンネルの信号であることもある。
【0139】
このようにすることで、パネルスピーカP0での過振幅の発生を防止しつつ十分な音圧レベルを確保し、高品位な音声再生を実現することができる。
【0140】
配分ゲイン計算部71では、このような配分ゲインg0と配分ゲインαiを求める計算が行われるが、その際に配分先パネルスピーカで振幅値が上限値yTを超えないように、配分ゲインαiの最大値αi
MAXが以下の式(4)に示すようにして定められる。
【0141】
【0142】
式(4)においてyiは配分先パネルスピーカPiのもともとの予測振幅値を示している。したがって、この例では配分先パネルスピーカPiの予測振幅値yiと、配分元のパネルスピーカP0の予測振幅値y0と、上限値yTとに基づいて最大値αi
MAXが定められる。
【0143】
なお、上述した式(1)や式(4)では、各予測振幅値は、実際のチャンネル音声信号から、振幅予測フィルタなどを用いて求めればよい。
【0144】
このようにして各配分先パネルスピーカPiの配分ゲインαiの最大値αi
MAXが求められると、各配分先パネルスピーカPiの最大値αi
MAXと配分ゲインg0とに基づいて、次式(5)の計算により各配分先パネルスピーカPiの配分ゲインαiが求められる。
【0145】
【0146】
このようにして配分ゲインαiを求めることは、各配分先パネルスピーカPiにおける振幅の余裕(余剰)、すなわち予測振幅値yiと上限値yTとの差分の大きさに比例して、各配分先パネルスピーカPiに音圧レベルを配分することを意味している。
【0147】
また、次式(6)に示すように全配分ゲインの和が1となるように、つまり次式(6)が満たされるようにされる。
【0148】
【0149】
但し、配分ゲインαiが最大値αi
MAXを超えてしまう場合には、その配分ゲインαiは、次式(7)に示すように最大値αi
MAXとされ、さらにその最大値αi
MAXを超えてしまう分の音圧レベルがサブウーハ53へと配分される。すなわち、以下の式(8)に示すβがサブウーハ53の配分ゲインとして求められる。
【0150】
【0151】
【0152】
このように適宜、サブウーハ53へと音圧レベルを配分すると、全配分ゲインの和は1となる。このように全配分ゲインの和が1となるようにすることで、配分前と同じ音圧レベルを確保することができる。すなわち、音圧レベルが低下してしまうことはない。
【0153】
なお、サブウーハ53に配分ゲインβでチャンネル音声信号x0の音圧レベルが配分された場合、サブウーハ53の最終的な出力信号xSW
’は次式(9)に示すようになる。
【0154】
【0155】
式(9)においてxSWは、もともとサブウーハ53に割り当てられたチャンネル音声信号、つまりサブウーハ53に対応するチャンネルのチャンネル音声信号を示している。
【0156】
なお、隣接パネルスピーカのなかに、過振幅フラグが「0」であるものがない場合には、配分元パネルスピーカのチャンネル音声信号の配分先はサブウーハ53のみとなる。
【0157】
以上のように過振幅フラグとチャンネル音声信号に基づいて音圧レベルを配分する処理は、各チャンネル音声信号について過振幅の発生の有無を検出し、その検出結果に応じて過振幅が発生しないように振幅制御を行う処理と比較すると、少ない処理負荷(処理量)で実現することが可能である。特に、チャンネル数が多くなるほど、その処理負荷の差は多くなる。
【0158】
また、符号化側である信号処理装置11で過振幅フラグを生成するようにしたので、復号側である信号処理装置51では、過振幅を検出するためのバッファリング等を行う必要がなくなるので、バッファリング等による再生遅延も生じることがない。
【0159】
〈復号処理の説明〉
続いて、信号処理装置51の動作について説明する。
【0160】
すなわち、以下、
図8のフローチャートを参照して、信号処理装置51により行われる復号処理について説明する。この復号処理は、信号処理装置51の非多重化部61により1フレーム分の符号化データが受信されると開始される。
【0161】
ステップS41において非多重化部61は、受信した符号化データを非多重化し、得られた過振幅フラグを配分ゲイン計算部71に供給するとともに、得られた符号化音声信号をコア信号復号部62に供給する。
【0162】
ステップS42においてコア信号復号部62は、非多重化部61から供給された符号化音声信号をコア信号符号化部22での音声符号化方式に対応する復号方式で復号し、得られたチャンネル音声信号を配分ゲイン計算部71およびパネル出力制御部72に供給する。
【0163】
ステップS43において配分ゲイン計算部71は、非多重化部61から供給された過振幅フラグと、コア信号復号部62から供給されたチャンネル音声信号とに基づいて、過振幅が生じるパネルスピーカ52についての配分ゲインを計算する。
【0164】
例えば配分ゲイン計算部71は、過振幅フラグの値が「1」であるパネルスピーカ52について、上述した式(2)と同様の計算を行い、そのパネルスピーカ52の配分ゲインg0を算出する。
【0165】
また、配分ゲイン計算部71は、配分元となるパネルスピーカ52に隣接する、過振幅フラグの値が「0」である隣接パネルスピーカ52について上述した式(5)を計算することで、配分先パネルスピーカ52の配分ゲインαiを算出する。
【0166】
なお、このとき配分ゲインαiが最大値αi
MAXを超えてしまうものについては、配分ゲイン計算部71は、式(7)に示すように最大値αi
MAXを最終的な配分ゲインαiの値とする。
【0167】
さらに、配分ゲイン計算部71は上述の式(6)が満たされない場合には、サブウーハ53も配分先として決定し、式(8)を計算してサブウーハ53の配分ゲインβを求める。
【0168】
このようにして配分ゲインを求めると、配分ゲイン計算部71は、求めた配分ゲインを示す配分ゲイン情報と、過振幅フラグとをパネル出力制御部72に供給する。
【0169】
ステップS44においてパネル出力制御部72は、コア信号復号部62から供給されたチャンネル音声信号と、配分ゲイン計算部71から供給された過振幅フラグおよび配分ゲイン情報とに基づいて、パネルスピーカ52およびサブウーハ53の出力信号を生成する。
【0170】
例えばパネル出力制御部72は、過振幅フラグが「1」であるパネルスピーカ52については、上述した式(1)と同様の計算を行うことで、そのパネルスピーカ52に供給する出力信号を生成する。
【0171】
また、例えばパネル出力制御部72は、過振幅フラグが「0」であり、かつチャンネル音声信号の配分先となっているパネルスピーカ52については、式(3)と同様の計算を行うことで、そのパネルスピーカ52に供給する出力信号を生成する。
【0172】
一方、パネル出力制御部72は、過振幅フラグが「0」であり、かつチャンネル音声信号の配分先となっていないパネルスピーカ52については、対応するチャンネルのチャンネル音声信号をそのままパネルスピーカ52に供給する出力信号とする。
【0173】
さらに、パネル出力制御部72は、サブウーハ53がチャンネル音声信号の配分先となっている場合には、上述の式(9)と同様の計算を行って出力信号を生成し、サブウーハ53がチャンネル音声信号の配分先となっていない場合には、対応するチャンネルのチャンネル音声信号をそのままサブウーハ53に供給する出力信号とする。
【0174】
パネル出力制御部72は、全てのパネルスピーカ52およびサブウーハ53について出力信号が得られると、得られた各出力信号をパネルスピーカ52およびサブウーハ53に供給し、各チャンネルの音声、すなわちコンテンツの音を再生させる。
【0175】
このようにしてコンテンツの音が再生されると、復号処理は終了する。
【0176】
以上のようにして信号処理装置51は、過振幅フラグとチャンネル音声信号に基づいて配分ゲインを求め、各パネルスピーカ52やサブウーハ53の最終的な出力信号を生成する。換言すれば、過振幅フラグやチャンネル音声信号に基づいて、各パネルスピーカ52やサブウーハ53に供給する出力信号を調整(決定)する。このようにすることで、少ない処理負荷で高品位な音を再生することができる。
【0177】
〈第2の実施の形態〉
〈符号化側の信号処理装置の構成例〉
ところで、以上においては符号化側において過振幅フラグを生成し、復号側において、その過振幅フラグに基づいて配分ゲインを計算していたが、配分ゲインの計算も符号化側で行うようにしてもよい。そうすることで、復号側における処理負荷と再生時の遅延をさらに低減させることができるようになる。
【0178】
符号化側で配分ゲインを計算する場合、符号化側の信号処理装置11は、例えば
図9に示すように構成される。なお、
図9において
図2における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0179】
図9に示す信号処理装置11は、パネル過振幅検出部21、コア信号符号化部22、コア信号復号部101、配分ゲイン計算部102、および多重化部23を有している。
【0180】
図9に示す信号処理装置11の構成は、新たにコア信号復号部101および配分ゲイン計算部102が設けられた点で
図2の信号処理装置11の構成と異なり、その他の点では
図2の信号処理装置11と同様の構成となっている。
【0181】
コア信号復号部101および配分ゲイン計算部102は、信号処理装置51のコア信号復号部62および配分ゲイン計算部71に対応している。
【0182】
コア信号復号部101は、コア信号符号化部22から供給された符号化音声信号を、コア信号符号化部22での音声符号化方式に対応する復号方式で復号し、その結果得られた復号音声信号をパネル過振幅検出部21および配分ゲイン計算部102に供給する。コア信号復号部101では、いわゆる局所復号(ローカルデコード)が行われる。
【0183】
パネル過振幅検出部21は、コア信号復号部101から供給された各チャンネルの復号音声信号に基づいて過振幅フラグを生成し、配分ゲイン計算部102および多重化部23に供給する。
【0184】
配分ゲイン計算部102は、コア信号復号部101から供給された復号音声信号と、パネル過振幅検出部21から供給された過振幅フラグとに基づいて配分ゲイン情報を生成し、多重化部23に供給する。
【0185】
多重化部23は、コア信号符号化部22からの符号化音声信号、パネル過振幅検出部21からの過振幅フラグ、および配分ゲイン計算部102からの配分ゲイン情報を多重化し、符号化データを生成する。
【0186】
〈符号化データのフォーマット例〉
符号化データに配分ゲイン情報、すなわち配分ゲインが含まれる場合、符号化データは、例えば
図10に示すフォーマットで多重化される。
【0187】
図10に示す例では、文字「audio_encoded_data()」は、所定フレームの符号化データを示しており、文字「encoded_channel_data()」は、所定の音声符号化方式で符号化された、1フレーム分の符号化音声信号を示している。
【0188】
また、文字「Number_of_PanelConfig」は、予め規定されているパネル構成のパターン数を示しており、文字「Num_of_SubPanels[i]」は、i番目のパネル構成パターンにおける構成パネルの枚数(パネルスピーカ数)を示している。
【0189】
さらに文字「Panel_Control_Flag[i][k]」は、i番目のパネル構成パターンにおけるk番目のパネルスピーカの過振幅フラグを示しており、過振幅フラグは1ビットで表現される。
【0190】
また、過振幅フラグ「Panel_Control_Flag[i][k]」の値が「1」である場合には、文字「Panel_Gain[p]」により示される配分先パネルスピーカの配分ゲインと、文字「Panel_Gain_SubWf」により示されるサブウーハの配分ゲインとが格納されている。ここでは、各配分ゲインは3ビットで量子化されて表現される。なお、この例では、実際には配分先パネルスピーカとなっていないパネルスピーカの配分ゲインも格納されており、その配分ゲインは「0」とされるが、実際に配分先パネルスピーカとされたパネルスピーカについてのみ配分ゲインが格納されるようにしてもよい。
【0191】
配分先パネルスピーカの配分ゲイン「Panel_Gain[p]」において、pは隣接パネルスピーカ、すなわち配分先パネルスピーカを特定するためのインデックス(番号)となっている。
【0192】
隣接パネルスピーカの数は、配分元パネルスピーカから見て上下左右の各方向に隣接するものと、斜め方向に隣接するものとを含めて最大で8個となるので、インデックスpは0から7までの値となっている。
【0193】
各インデックスpにより示される隣接パネルスピーカと、配分元パネルスピーカとの相対的な位置関係は、例えば
図11に示すように予め定められている。
【0194】
図11の例では、各四角形は1つのパネルスピーカを表している。特に図中、中央に配置されている四角形が配分元のパネルスピーカを表しており、その周囲に配置された四角形内の数値はインデックスpの値を示している。
【0195】
したがって、例えばインデックスp=6により示される隣接パネルスピーカは、配分元パネルスピーカの図中、下側に配置されたパネルスピーカであり、インデックスp=4により示される隣接パネルスピーカは、配分元パネルスピーカの図中、右側に配置されたパネルスピーカである。また、例えばインデックスp=7により示される隣接パネルスピーカは、配分元パネルスピーカの図中、右斜め下に配置されたパネルスピーカである。
【0196】
〈符号化処理の説明〉
続いて、
図9に示した信号処理装置11の動作について説明する。
【0197】
すなわち、以下、
図12のフローチャートを参照して、
図9の信号処理装置11により行われる符号化処理について説明する。
【0198】
なお、ステップS71の処理は、
図4のステップS12の処理と同様であるので、その説明は省略する。但し、ステップS71では、符号化により得られた符号化音声信号が、コア信号符号化部22から多重化部23およびコア信号復号部101に供給される。
【0199】
ステップS72においてコア信号復号部101は、コア信号符号化部22から供給された符号化音声信号を復号し、その結果得られた復号音声信号をパネル過振幅検出部21および配分ゲイン計算部102に供給する。
【0200】
ステップS73においてパネル過振幅検出部21は、コア信号復号部101から供給された各チャンネルの復号音声信号に基づいて過振幅が生じるかを検出して過振幅フラグを生成し、配分ゲイン計算部102および多重化部23に供給する。なお、ステップS73では、
図4のステップS11と同様の処理が行われる。
【0201】
ステップS74において配分ゲイン計算部102は、コア信号復号部101から供給された復号音声信号と、パネル過振幅検出部21から供給された過振幅フラグとに基づいて配分ゲインを計算し、その計算結果を示す配分ゲイン情報を多重化部23に供給する。
【0202】
ステップS74では、
図8のステップS43と同様の処理が行われて、予め規定されたパネル構成ごとに、過振幅フラグが「1」である各パネルスピーカについて配分先パネルスピーカやサブウーハの配分ゲインが計算される。
【0203】
ステップS75において多重化部23は、コア信号符号化部22からの符号化音声信号、パネル過振幅検出部21からの過振幅フラグ、および配分ゲイン計算部102からの配分ゲイン情報を多重化し、符号化データを生成する。例えばステップS75では、
図10に示したフォーマットの符号化データが生成される。
【0204】
符号化データが生成されると、ステップS76において多重化部23は、符号化データを復号側の信号処理装置51に送信し、符号化処理は終了する。
【0205】
以上のようにして信号処理装置11は、過振幅フラグおよび配分ゲイン情報を生成し、それらの過振幅フラグおよび配分ゲイン情報と、符号化音声信号とを多重化して符号化データを生成する。このようにすることで、復号側の処理負荷を低減させつつ高品位な音を再生することができるようになる。
【0206】
〈復号側の信号処理装置の構成例〉
また、
図9に示した符号化側の信号処理装置11から送信された符号化データを受信して復号する、復号側の信号処理装置は、例えば
図13に示すように構成される。
【0207】
なお、
図13において
図5における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0208】
信号処理装置51は、非多重化部61、コア信号復号部62、およびパネル出力調整部63を有しており、また、パネル出力調整部63はパネル出力制御部72を有している。
【0209】
図13に示す信号処理装置51の構成は、配分ゲイン計算部71が設けられていない点で
図5に示した信号処理装置51の構成と異なっており、その他の点では
図5の信号処理装置51と同じ構成となっている。
【0210】
図13の例では、非多重化部61は、非多重化により符号化データから抽出された過振幅フラグおよび配分ゲイン情報をパネル出力制御部72に供給する。
【0211】
パネル出力制御部72は、非多重化部61から供給された過振幅フラグおよび配分ゲイン情報と、コア信号復号部62から供給されたチャンネル音声信号とに基づいて、各パネルスピーカ52およびサブウーハ53に供給する出力信号を調整する。
【0212】
換言すれば、パネル出力制御部72は、過振幅フラグ、配分ゲイン情報、およびチャンネル音声信号に基づいて、各パネルスピーカ52やサブウーハ53に供給する出力信号を生成する。
【0213】
〈復号処理の説明〉
続いて、信号処理装置51の動作について説明する。
【0214】
すなわち、以下、
図14のフローチャートを参照して、
図13の信号処理装置51により行われる復号処理について説明する。
【0215】
ステップS101において非多重化部61は、受信した符号化データを非多重化し、得られた過振幅フラグおよび配分ゲイン情報をパネル出力制御部72に供給するとともに、得られた符号化音声信号をコア信号復号部62に供給する。
【0216】
ステップS102においてコア信号復号部62は、非多重化部61から供給された符号化音声信号を復号し、得られたチャンネル音声信号をパネル出力制御部72に供給する。
【0217】
ステップS103においてパネル出力制御部72は、非多重化部61から供給された過振幅フラグおよび配分ゲイン情報と、コア信号復号部62から供給されたチャンネル音声信号とに基づいて出力信号を生成する。
【0218】
なお、ステップS103では、
図8のステップS44と同様の処理が行われ、各パネルスピーカ52およびサブウーハ53に供給する出力信号が生成される。
【0219】
このようにして出力信号が生成されると、パネル出力制御部72は、各出力信号をパネルスピーカ52およびサブウーハ53に供給してコンテンツの音を再生させ、復号処理は終了する。
【0220】
以上のようにして信号処理装置51は、過振幅フラグや配分ゲイン情報に基づいて各パネルスピーカ52やサブウーハ53に供給する出力信号を生成する。このようにすることで、少ない処理負荷で高品位な音を再生することができる。
【0221】
以上のような第1の実施の形態、および第2の実施の形態によれば、パネルスピーカシステムにおいて、通常通りの再生ではパネルスピーカの過振幅が発生してしまう場合でも、隣接パネルスピーカに出力の一部を配分することで、音圧レベルを下げることなく、また、音像感を損ねることなく、高品位な音を再生することができる。
【0222】
しかも、復号側(再生側)の端末装置である信号処理装置51におけるリソースの負荷(処理負荷)や処理遅延を増加させることなく、パネル構成に応じて隣接パネルスピーカにチャンネル音声信号の配分を行うことができる。これにより、少ない処理量(処理負荷)と処理遅延で、高品位な音声再生を実現することができる。
【0223】
〈第3の実施の形態〉
〈符号化側の信号処理装置の構成例〉
ところで、近年、MPEG(Moving Picture Experts Group)-H 3D Audio (ISO/IEC 23008-3)など、オブジェクト音源、すなわちオーディオオブジェクト(以下、単にオブジェクトと称する)を用いた、いわゆるオブジェクトオーディオの符号化方法やレンダリング方法などが開発されている。
【0224】
オブジェクト音源の復元情報はOAM(Object Audio Metadata)と呼ばれるメタデータとして伝送され、再生時にOAM中に記載されたオブジェクトの位置情報などに基づいてオブジェクトがレンダリングされて音が再生される。
【0225】
ところが、オブジェクトオーディオをパネルスピーカシステムで再生する場合、パネルスピーカで過振幅が発生すると、そのパネルスピーカのパネル内に位置するオブジェクトの音像感が損なわれてしまう。
【0226】
特に、オブジェクトが移動している場合には、過振幅するパネルスピーカ上にオブジェクトがあると、過振幅のタイミングでそのオブジェクトの音が再生されなかったり、オブジェクトの音の音像位置がずれたりして再生品質が大きく損なわれてしまうことがある。
【0227】
そこで、例えば第1の実施の形態や第2の実施の形態における場合と同様にして、オブジェクトの音を再生するためのオブジェクト信号の一部を隣接パネルスピーカに配分すれば、少ない処理負荷で音像感の低下を抑制し、高品質な音声再生を行うことができる。
【0228】
さらに、これに加えてオブジェクトの移動の有無や移動方向を考慮してオブジェクト信号の配分を行えば、音像感の低下をさらに抑制することができる。
【0229】
以下では、オブジェクトオーディオの再生に本技術を適用した実施の形態について説明する。
【0230】
図15は、本技術を適用した符号化側の信号処理装置の構成例を示す図である。なお、
図15において
図2における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0231】
図15に示す信号処理装置131は、例えばコンテンツの音のデータとして、オブジェクトの音を再生するためのオブジェクト信号と、各チャンネルのチャンネル音声信号とが入力され、それらのオブジェクト信号やチャンネル音声信号を符号化する符号化装置として機能する。
【0232】
信号処理装置131は、プリレンダラ/ミキサ部141、オブジェクトレンダラ142、パネル過振幅検出部21、オブジェクト用配分ゲイン計算部143、OAM符号化部144、コア信号符号化部22、および多重化部23を有している。
【0233】
プリレンダラ/ミキサ部141には、各オブジェクトのオブジェクト信号とOAM(オブジェクト音源メタデータ)、各チャンネルのチャンネル音声信号、およびプリレンダリングレベルが供給される。
【0234】
OAMは、オブジェクトのメタデータであり、OAMには、少なくともオブジェクトの3次元空間内の配置位置を示す位置情報、およびオブジェクトの優先度を示す優先度情報が含まれている。
【0235】
プリレンダリングレベルは、符号化側においてプリレンダリングを行うオブジェクト数を示す情報であり、例えばプリレンダリングレベルとしてLev-1、Lev-2、およびLev-3の何れかが指定される。
【0236】
ここでは、プリレンダリングされるオブジェクトの数が多い順に、Lev-1、Lev-2、およびLev-3となっている。すなわち、プリレンダリングレベルがLev-1である場合、プリレンダリングされるオブジェクトの数は最も多くなる。なお、プリレンダリングレベルは、これに限らず、どのように指定されるようにしてもよい。
【0237】
コンテンツを構成するオブジェクトの数が多い場合、復号側(再生側)において全てのオブジェクトをレンダリングしようとすると、復号側での処理量が多くなってしまう。
【0238】
そこで、プリレンダラ/ミキサ部141は、コンテンツを構成するオブジェクトのうち、優先度の低いオブジェクトについては符号化側でレンダリング(プリレンダリング)を行う。
【0239】
すなわち、プリレンダラ/ミキサ部141は、優先度の低いオブジェクトのOAMに基づいて、それらの優先度の低いオブジェクトのオブジェクト信号を各チャンネルのチャンネル音声信号にマッピングし、プリレンダリング済みのチャンネル音声信号を生成する。
【0240】
このようなプリレンダリングにより得られる各チャンネルのプリレンダリング済みのチャンネル音声信号は、各チャンネルの音と、プリレンダリングされた各オブジェクトの音とを再生するための音声信号である。
【0241】
特にプリレンダリング済みのチャンネル音声信号に基づいて音声を再生した場合、各オブジェクトの音の音像は、それらの各オブジェクトのOAMに含まれている位置情報により示される位置に定位する。
【0242】
なお、プリレンダラ/ミキサ部141では、複数のオブジェクトのうち、優先度情報により示される優先度が低いものから順番に、プリレンダリングレベルに対して定まる個数のオブジェクトが選択されていき、それらの選択されたオブジェクトがプリレンダリング対象のオブジェクトとされる。また、複数のオブジェクトのうち、プリレンダリング対象とされなかったオブジェクト、つまり残りの全てのオブジェクトがプリレンダリングの対象外のオブジェクトとされる。
【0243】
以下では、プリレンダリングの対象外とされたオブジェクトを対象外オブジェクトとも称し、プリレンダリング対象とされたオブジェクトを対象オブジェクトとも称することとする。
【0244】
プリレンダラ/ミキサ部141は、プリレンダリングレベルとOAMに基づいて、対象オブジェクトを選択すると、それらの対象オブジェクトのOAMとオブジェクト信号、および各チャンネルのチャンネル音声信号に基づいてプリレンダリングを行い、プリレンダリング済みのチャンネル音声信号を生成する。ここでは、例えばプリレンダリングとして、VBAP(Vector Based Amplitude Panning)などが行われる。
【0245】
プリレンダラ/ミキサ部141は、プリレンダリング済みのチャンネル音声信号と、対象外オブジェクトのオブジェクト信号およびOAMとをオブジェクトレンダラ142に供給する。
【0246】
また、プリレンダラ/ミキサ部141は、対象外オブジェクトのOAMをオブジェクト用配分ゲイン計算部143およびOAM符号化部144に供給する。
【0247】
さらに、プリレンダラ/ミキサ部141は、プリレンダリングにより得られたプリレンダリング済みのチャンネル音声信号、および対象外オブジェクトのオブジェクト信号をコア信号符号化部22に供給する。
【0248】
オブジェクトレンダラ142は、プリレンダラ/ミキサ部141から供給されたプリレンダリング済みのチャンネル音声信号と、対象外オブジェクトのオブジェクト信号およびOAMとに基づいて、対象外オブジェクトのレンダリングを行う。
【0249】
すなわち、オブジェクトレンダラ142は、OAMに基づいて対象外オブジェクトのオブジェクト信号をプリレンダリング済みのチャンネル音声信号にマッピングすることで、各チャンネルの合成チャンネル信号を生成する。
【0250】
例えばオブジェクトレンダラ142では、レンダリングの処理としてVBAPなどが行われ、プリレンダリング済みのチャンネル音声信号と同じチャンネル構成であり、各対象外オブジェクトの音を再生するための信号が生成される。さらに、それらの各対象外オブジェクトの音を再生するための信号と、プリレンダリング済みのチャンネル音声信号との同じチャンネルの信号が加算されて合成チャンネル信号とされる。
【0251】
各チャンネルの合成チャンネル信号に基づいて音を再生すると、チャンネル音声信号に基づく音と、対象オブジェクトの音と、対象外オブジェクトの音とが再生される。
【0252】
特に、合成チャンネル信号に基づいて音を再生した場合、各対象外オブジェクトの音の音像は、それらの対象外オブジェクトのOAMに含まれている位置情報により示される位置に定位する。
【0253】
オブジェクトレンダラ142は、レンダリングにより得られた各チャンネルの合成チャンネル信号を、パネル過振幅検出部21およびオブジェクト用配分ゲイン計算部143に供給する。
【0254】
パネル過振幅検出部21は、オブジェクトレンダラ142から供給された合成チャンネル信号に基づいて、パネル構成ごとに各パネルスピーカについて過振幅フラグを生成し、オブジェクト用配分ゲイン計算部143および多重化部23に供給する。
【0255】
オブジェクト用配分ゲイン計算部143は、プリレンダラ/ミキサ部141から供給されたOAM、オブジェクトレンダラ142から供給された合成チャンネル信号、およびパネル過振幅検出部21から供給された過振幅フラグに基づいて配分ゲイン情報を生成し、多重化部23に供給する。
【0256】
OAM符号化部144は、プリレンダラ/ミキサ部141から供給された対象外オブジェクトのOAMを所定の符号化方式により符号化し、その結果得られた符号化OAMを多重化部23に供給する。
【0257】
コア信号符号化部22は、プリレンダラ/ミキサ部141から供給された、対象外オブジェクトのオブジェクト信号と、プリレンダリング済みのチャンネル音声信号とを所定の音声符号化方式で符号化し、その結果得られた符号化音声信号を多重化部23に供給する。
【0258】
多重化部23は、パネル過振幅検出部21から供給された過振幅フラグ、オブジェクト用配分ゲイン計算部143から供給された配分ゲイン情報、OAM符号化部144から供給された符号化OAM、およびコア信号符号化部22から供給された符号化音声信号を所定のフォーマットで多重化し、得られた符号化データを復号側の装置に送信する。
【0259】
〈配分ゲインの計算について〉
ここで、オブジェクト用配分ゲイン計算部143における配分ゲインの計算方法の具体的な例について説明する。
【0260】
オブジェクト用配分ゲイン計算部143には、時間的に連続する各フレームについて、オブジェクト(対象外オブジェクト)のOAMが供給される。
【0261】
したがって、オブジェクト用配分ゲイン計算部143は、各時刻、すなわち各フレームのOAMに含まれる位置情報から、オブジェクトが各パネル構成のパネルスピーカのパネル上に位置しているか否かや、オブジェクトの動きの有無を特定することができる。
【0262】
例えば、あるパネル構成では
図16に示すように、パネルスピーカP0乃至パネルスピーカP8の合計9個のパネルスピーカにより1つの表示パネルが形成されているものとする。なお、
図16において各四角形は1つのパネルスピーカを表している。
【0263】
このとき、矢印Q31に示すように、オブジェクトOB11がパネルスピーカP0のパネル内に位置しており、オブジェクトOB11が矢印A11に示す方向、すなわちパネルスピーカP4の方向に移動しているとする。
【0264】
なお、オブジェクトOB11の移動方向は、そのオブジェクトOB11の現在のフレームと過去のフレームのOAMを参照することで推定することができる。また、データの先読みが可能であれば、オブジェクトOB11の未来のフレームのOAMを参照することで、オブジェクトOB11の動きをより正確に特定することが可能である。
【0265】
このような状態において、パネルスピーカP0で過振幅が生じるときに、オブジェクトOB11の音を含む、パネルスピーカP0に供給される合成チャンネル信号の一部を隣接パネルスピーカに配分することを考える。パネルスピーカP0に供給される合成チャンネル信号にオブジェクトOB11の音が含まれているか否かは、そのオブジェクトOB11のOAM、特にOAMに含まれる位置情報により特定することができる。
【0266】
このような場合、例えばパネルスピーカP0に隣接する、パネルスピーカP3やパネルスピーカP4、パネルスピーカP1など、複数の隣接パネルスピーカを配分先として選択すると、オブジェクトOB11の音像が複数位置に分かれてしまい、音像が広がってしまう。すなわち、音像の定位感(音像感)がぼやけてしまう。
【0267】
そこで、例えばオブジェクトOB11が移動している場合には、そのオブジェクトOB11の移動先であるパネルスピーカP4にのみ合成チャンネル信号を配分するようにすればよい。すなわち、オブジェクトOB11の移動方向に基づいて、パネルスピーカP4が配分先として決定される。
【0268】
なお、この場合、パネルスピーカP4の配分ゲインは、例えば式(5)と同様の計算により求めることができる。
【0269】
但し、この場合には、配分可能なパネルスピーカが1つである、つまり集合Sに属する隣接パネルスピーカがパネルスピーカP4のみであるという条件で式(5)の計算を行えばよい。
【0270】
さらに、式(5)と同様の計算により求めたパネルスピーカP4の配分ゲインαiが最大値αi
MAXを超えてしまう場合には、その配分ゲインαiは、次式(7)に示すように最大値αi
MAXとされ、その最大値αi
MAXを超えてしまう分の音圧レベルがサブウーハ53へと配分される。
【0271】
これに対して、例えば矢印Q32に示すように、オブジェクトOB11がパネルスピーカP0のパネル内に位置しており、オブジェクトOB11が静止しているとする。
【0272】
このような状態において、パネルスピーカP0で過振幅が生じる場合、例えば過振幅フラグが「0」である隣接パネルスピーカのうち、オブジェクトOB11の位置から最も近い位置に配置されているパネルスピーカのみが配分先パネルスピーカとされる。
【0273】
したがって、この例ではオブジェクトOB11から最も近い位置にあるパネルスピーカP3が配分先パネルスピーカとして決定(選択)される。
【0274】
なお、過振幅が生じるパネルスピーカのパネル内に位置するオブジェクトが複数ある場合には、それらの複数のオブジェクトのうちの優先度が最も高いオブジェクトの位置や移動方向に基づいて配分先パネルスピーカを決定すればよい。
【0275】
〈符号化データのフォーマット例〉
また、信号処理装置131の多重化部23で得られる符号化データは、例えば
図17に示す符号化音声データと、
図18に示す符号化OAMとからなる。
【0276】
例えば
図17では、文字「audio_encoded_data()」は符号化音声データを示しており、この符号化音声データはフレームごとに復号側に伝送される。
【0277】
また、この例では符号化音声データ「audio_encoded_data()」は、符号化音声信号、過振幅フラグ、配分ゲイン情報を多重化するフォーマットとなっており、このフォーマットは
図10に示した例と略同じフォーマットとなっている。
【0278】
すなわち、
図17では文字「encoded_channel_data()」は1フレーム分の符号化音声信号を示しており、文字「Number_of_PanelConfig」は、予め規定されているパネル構成のパターン数を示している。
【0279】
また、文字「Num_of_SubPanels[i]」は、i番目のパネル構成パターンにおける構成パネルの枚数(パネルスピーカ数)を示しており、文字「Panel_Control_Flag[i][k]」は、i番目のパネル構成パターンにおけるk番目のパネルスピーカの過振幅フラグを示している。
【0280】
さらに、この例ではオブジェクトが配分元パネルスピーカのパネル内に位置している場合には、単一の配分先パネルスピーカの相対的な位置を示す情報と、その配分先パネルスピーカの配分ゲインとが伝送されるようになっており、配分ゲイン情報の伝送が効率化されている。
【0281】
具体的には、文字「object_exist」は、i番目のパネル構成パターンにおけるk番目のパネルスピーカのパネル内におけるオブジェクトの有無を示すオブジェクト存在フラグを示している。
【0282】
オブジェクト存在フラグ「object_exist」は、過振幅フラグ「Panel_Control_Flag[i][k]」が「1」である場合、つまり対象となるパネルスピーカが配分元パネルスピーカである場合に格納されている。
【0283】
また、オブジェクト存在フラグ「object_exist」の値が「1」である場合、つまり配分元パネルスピーカのパネル内にオブジェクトが存在している場合には、さらに文字「Panel_relative_id」により示される配分先パネルスピーカの相対的な位置を示す番号(インデックス)と、文字「Panel_Gain」により示される配分ゲインとが含まれている。
【0284】
ここで、相対的な位置を示す番号「Panel_relative_id」は、例えば上述したインデックスpであり、3ビットで表現される。また、配分ゲイン「Panel_Gain」も3ビットで量子化されて表現されている。
【0285】
これに対して、オブジェクト存在フラグ「object_exist」の値が「0」である場合、すなわち配分元パネルスピーカのパネル内にオブジェクトが存在していない場合には、
図10における場合と同様に、文字「Panel_Gain[p]」により示される配分先パネルスピーカの配分ゲインが格納されている。
【0286】
また、過振幅フラグ「Panel_Control_Flag[i][k]」が「1」である場合、必要に応じて文字「Panel_Gain_SubWf」により示されるサブウーハの配分ゲインも格納されている。
【0287】
一方、
図18に示す符号化OAMは、例えば1フレームごとや数フレームごとなど、所定のオブジェクト処理時間ごとに伝送される。
【0288】
図18の例では、文字「object_matadata()」は、符号化データ中における、1フレームなどの所定の時間区間におけるオブジェクト音源メタデータ、すなわち符号化OAMを示している。
【0289】
また、符号化OAMには、文字「object_index」により示される、オブジェクトを識別するためのインデックスが含まれている。
【0290】
さらに符号化OAMには、文字「position_azimuth」により示されるオブジェクトの位置を示す方位角、文字「position_elevation」により示されるオブジェクトの位置を示す仰角、および文字「position_radius」により示されるオブジェクトの位置を示す半径が含まれている。
【0291】
その他、符号化OAMには、文字「gain_factor」により示されるオブジェクトのゲイン補正のためのゲイン、および文字「dynamic_object_prority」により示されるオブジェクトのレンダリング時の優先度を示す優先度情報なども含まれている。
【0292】
〈符号化処理の説明〉
続いて、信号処理装置131の動作について説明する。
【0293】
すなわち、以下、
図19のフローチャートを参照して、信号処理装置131により行われる符号化処理について説明する。
【0294】
ステップS131においてプリレンダラ/ミキサ部141は、プリレンダリングを行う。
【0295】
すなわち、プリレンダラ/ミキサ部141は、供給されたプリレンダリングレベルと各オブジェクトのOAMとに基づいて、プリレンダリングの対象オブジェクトを選択する。
【0296】
そして、プリレンダラ/ミキサ部141は、供給された対象オブジェクトのオブジェクト信号およびOAMと、供給された各チャンネルのチャンネル音声信号とに基づいてVBAP等を行うことで、各チャンネルのプリレンダリング済みのチャンネル音声信号を生成する。
【0297】
プリレンダラ/ミキサ部141は、供給された対象外オブジェクトのオブジェクト信号およびOAMと、各チャンネルのプリレンダリング済みのチャンネル音声信号とをオブジェクトレンダラ142に供給する。
【0298】
また、プリレンダラ/ミキサ部141は、対象外オブジェクトのOAMをオブジェクト用配分ゲイン計算部143およびOAM符号化部144に供給するとともに、プリレンダリング済みのチャンネル音声信号、および対象外オブジェクトのオブジェクト信号をコア信号符号化部22に供給する。
【0299】
ステップS132においてオブジェクトレンダラ142は、プリレンダラ/ミキサ部141から供給された各チャンネルのプリレンダリング済みのチャンネル音声信号と、対象外オブジェクトのオブジェクト信号およびOAMとに基づいて対象外オブジェクトのレンダリングを行う。例えばステップS132では、レンダリングの処理としてVBAPなどが行われ、各チャンネルの合成チャンネル信号が生成される。
【0300】
オブジェクトレンダラ142は、レンダリングにより得られた各チャンネルの合成チャンネル信号を、パネル過振幅検出部21およびオブジェクト用配分ゲイン計算部143に供給する。
【0301】
ステップS133においてパネル過振幅検出部21は、オブジェクトレンダラ142から供給された合成チャンネル信号に基づいて、パネル構成ごとに各パネルスピーカについて過振幅フラグを生成し、オブジェクト用配分ゲイン計算部143および多重化部23に供給する。例えばステップS133では、上述した
図4のステップS11と同様の処理が行われて過振幅が検出され、過振幅フラグが生成される。
【0302】
ステップS134においてオブジェクト用配分ゲイン計算部143は、プリレンダラ/ミキサ部141から供給されたOAM、オブジェクトレンダラ142から供給された合成チャンネル信号、およびパネル過振幅検出部21から供給された過振幅フラグに基づいて配分ゲイン計算処理を行う。
【0303】
なお、配分ゲイン計算処理の詳細は後述するが、この配分ゲイン計算処理では、パネル構成ごとに配分ゲインが計算され、配分ゲイン情報が生成される。
【0304】
オブジェクト用配分ゲイン計算部143は、配分ゲイン計算処理により得られた配分ゲイン情報を多重化部23に供給する。
【0305】
ステップS135においてOAM符号化部144は、プリレンダラ/ミキサ部141から供給された対象外オブジェクトのOAMを符号化し、その結果得られた符号化OAMを多重化部23に供給する。
【0306】
ステップS136においてコア信号符号化部22は、プリレンダラ/ミキサ部141から供給された、対象外オブジェクトのオブジェクト信号と、プリレンダリング済みのチャンネル音声信号とを符号化し、得られた符号化音声信号を多重化部23に供給する。
【0307】
ステップS137において多重化部23は、パネル過振幅検出部21から供給された過振幅フラグ、オブジェクト用配分ゲイン計算部143から供給された配分ゲイン情報、OAM符号化部144から供給された符号化OAM、およびコア信号符号化部22から供給された符号化音声信号を多重化し、符号化データを生成する。ここでは、例えば
図17および
図18に示したフォーマットで符号化データが生成される。
【0308】
ステップS138において多重化部23は、符号化データを復号側の装置に送信し、符号化処理は終了する。
【0309】
以上のようにして信号処理装置131は、過振幅フラグおよび配分ゲイン情報を生成し、それらの過振幅フラグおよび配分ゲイン情報や符号化音声信号を多重化して符号化データを生成する。このようにすることで、復号側の処理負荷を低減させつつ高品位な音を再生することができるようになる。
【0310】
〈配分ゲイン計算処理の説明〉
ここで、
図20のフローチャートを参照して、
図19のステップS134に対応し、信号処理装置131により行われる配分ゲイン計算処理について説明する。なお、この配分ゲイン計算処理は、予め規定されたパネル構成ごとに行われる。
【0311】
ステップS171においてオブジェクト用配分ゲイン計算部143は、処理対象となっているパネル構成において、そのパネル構成での複数のパネルスピーカのなかから、処理対象とする1つのパネルスピーカを対象パネルスピーカとして選択する。
【0312】
ステップS172においてオブジェクト用配分ゲイン計算部143は、パネル過振幅検出部21から供給された、対象パネルスピーカの過振幅フラグに基づいて、対象パネルスピーカで過振幅が生じるか否かを判定する。
【0313】
ステップS172において過振幅が生じないと判定された場合、すなわち、過振幅フラグが「0」である場合、対象パネルスピーカについての出力の配分は不要であるので、処理はステップS180へと進む。
【0314】
これに対して、ステップS172において過振幅が生じると判定された場合、すなわち、過振幅フラグが「1」である場合、ステップS173においてオブジェクト用配分ゲイン計算部143は、対象パネルスピーカのパネル内にオブジェクトがあるか否かを判定する。
【0315】
例えばオブジェクト用配分ゲイン計算部143は、プリレンダラ/ミキサ部141から供給された各対象外オブジェクトのOAMに基づいて、それらの対象外オブジェクトの位置が対象パネルスピーカのパネル内に位置しているかを特定することにより判定の処理を行う。
【0316】
ステップS173においてオブジェクトがないと判定された場合、その後、処理はステップS174へと進む。
【0317】
ステップS174においてオブジェクト用配分ゲイン計算部143は、対象パネルスピーカに隣接する隣接パネルスピーカの過振幅フラグに基づいて、それらの隣接パネルスピーカのうち、過振幅が生じない、つまり過振幅フラグが「0」である隣接パネルスピーカを、配分先のパネルスピーカとして選択する。
【0318】
この場合、配分ゲインの計算時、すなわち後述するステップS179では、過振幅が生じない1または複数の隣接パネルスピーカに対して、それらの隣接パネルスピーカの振幅値の上限値までの余裕に比例して音圧レベルが配分されることになる。
【0319】
このようにして配分先パネルスピーカが選択(決定)されると、その後、処理はステップS179へと進む。
【0320】
これに対して、ステップS173において対象パネルスピーカのパネル内にオブジェクトがあると判定された場合、その後、処理はステップS175へと進む。
【0321】
ステップS175においてオブジェクト用配分ゲイン計算部143は、プリレンダラ/ミキサ部141から供給された各対象外オブジェクトのOAMに基づいて、対象パネルスピーカのパネル内に位置する対象外オブジェクトのなかから、最も優先度の高い対象外オブジェクトを選択する。ここでは、例えば
図18に示した優先度情報「dynamic_object_prority」に基づいて選択が行われる。
【0322】
なお、以下、ステップS175で選択された、最も優先度の高い対象外オブジェクトを特に選択オブジェクトとも称することとする。
【0323】
ステップS176においてオブジェクト用配分ゲイン計算部143は、選択オブジェクトのOAMに基づいて、その選択オブジェクトが移動しているか否かを判定する。
【0324】
ここでは、例えば選択オブジェクトの現フレームと過去のフレームなど、複数のフレームのOAMに基づいて、選択オブジェクトの移動(動き)の有無や移動方向が特定され、選択オブジェクトが移動しているか否かが判定される。
【0325】
例えば選択オブジェクトの移動の有無や移動方向は、互いに異なる時刻(フレーム)における選択オブジェクトの位置の差分に基づいて特定可能である。また、信号処理装置131において処理遅延が許容できるのであれば、現フレームの次のフレームなど、時間的に未来のフレームのOAMも用いられて移動の有無や移動方向が特定されてもよい。
【0326】
ステップS176において選択オブジェクトが移動していると判定された場合、その後、処理はステップS177へと進む。
【0327】
ステップS177においてオブジェクト用配分ゲイン計算部143は、選択オブジェクトの移動方向に基づいて、その選択オブジェクトの移動先にある隣接パネルスピーカを配分先のパネルスピーカとして選択する。ステップS177の処理が行われると、その後、処理はステップS179へと進む。
【0328】
一方、ステップS176において選択オブジェクトが移動していない、つまり選択オブジェクトが静止していると判定された場合、その後、処理はステップS178へと進む。
【0329】
ステップS178においてオブジェクト用配分ゲイン計算部143は、選択オブジェクトの位置に基づいて、対象パネルスピーカに隣接する隣接パネルスピーカのうち、選択オブジェクトから最も近い位置にある隣接パネルスピーカを配分先のパネルスピーカとして選択する。ステップS178の処理が行われると、その後、処理はステップS179へと進む。
【0330】
ステップS174、ステップS177、またはステップS178の処理が行われると、ステップS179の処理が行われる。
【0331】
ステップS179においてオブジェクト用配分ゲイン計算部143は、配分先として選択した配分先パネルスピーカの配分ゲインを計算する。
【0332】
例えばステップS179では、
図8のステップS43と同様の処理が行われて配分先スピーカの配分ゲインだけでなく、配分元パネルスピーカの配分ゲインも計算され、さらにサブウーハにも配分が行われるときには、そのサブウーハの配分ゲインも計算される。
【0333】
なお、例えばステップS177やステップS178が行われた場合には、配分先パネルスピーカは1つとなるが、そのような場合においても集合Sに属する隣接パネルスピーカが1つであるという条件で式(5)や式(8)と同様の計算を行うことで、配分ゲインを得ることができる。
【0334】
ステップS179の処理が行われたか、またはステップS172において過振幅が生じないと判定された場合、ステップS180においてオブジェクト用配分ゲイン計算部143は、全てのパネルスピーカについて処理を行ったか否かを判定する。
【0335】
例えばステップS180では、全てのパネルスピーカが対象パネルスピーカとされて、ステップS172乃至ステップS179の処理が行われた場合、全てのパネルスピーカについて処理が行われたと判定される。
【0336】
ステップS180において、まだ全てのパネルスピーカについて処理を行っていないと判定された場合、処理はステップS171に戻り、上述した処理が繰り返し行われる。
【0337】
これに対して、ステップS180において全てのパネルスピーカについて処理を行ったと判定された場合、オブジェクト用配分ゲイン計算部143は、ステップS171乃至ステップS180の処理で得られた配分ゲインを示す配分ゲイン情報を多重化部23に供給し、配分ゲイン計算処理は終了する。
【0338】
配分ゲイン計算処理が終了すると、
図19のステップS134が行われたことになるので、その後、処理は
図19のステップS135へと進む。
【0339】
以上のようにして信号処理装置131は、対象パネルスピーカのパネル内でのオブジェクトの有無や、オブジェクトの移動の有無、オブジェクトの移動方向に基づいて配分先パネルスピーカを選択し、配分ゲインを計算する。
【0340】
このようにすることで、より適切な隣接パネルスピーカに音圧レベルを配分することができ、より高い音像感で音を再生することができるようになる。すなわち、より高品位な音を再生することができるようになる。
【0341】
なお、以上において説明した配分ゲイン計算処理を行ってもパネルスピーカで過振幅が生じる場合には、例えば優先度が2番目に高いオブジェクトを選択オブジェクトとして、さらにステップS176乃至ステップS179の処理を行うようにしてもよい。そのようにすることで、複数の配分先パネルスピーカへと配分を行い、過振幅の発生を防止することができる。
【0342】
〈復号側の信号処理装置の構成例〉
続いて、符号化側の信号処理装置131から送信された符号化データを受信して復号する、復号側の信号処理装置について説明する。
【0343】
そのような復号側の信号処理装置は、例えば
図21に示すように構成される。なお、
図21において
図5における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0344】
図21に示す信号処理装置171は、非多重化部61、OAM復号部181、オブジェクトレンダラ182、コア信号復号部62、チャンネル変換部183、ミキサ部184、およびパネル出力調整部63を有している。また、パネル出力調整部63はパネル出力制御部72を有している。
【0345】
非多重化部61は、信号処理装置131の多重化部23から送信された符号化データを受信して非多重化することで、符号化データから過振幅フラグ、配分ゲイン情報、符号化OAM、および符号化音声信号を抽出する。
【0346】
非多重化部61は、過振幅フラグおよび配分ゲイン情報をパネル出力制御部72に供給し、符号化OAMをOAM復号部181に供給し、符号化音声信号をコア信号復号部62に供給する。
【0347】
OAM復号部181は、非多重化部61から供給された符号化OAMを復号し、その結果得られたOAMをオブジェクトレンダラ182に供給する。
【0348】
コア信号復号部62は、非多重化部61から供給された符号化音声信号を復号し、その結果得られたオブジェクト信号をオブジェクトレンダラ182に供給するとともに、復号により得られたプリレンダリング済みのチャンネル音声信号をチャンネル変換部183に供給する。
【0349】
オブジェクトレンダラ182は、OAM復号部181から供給されたOAMと、コア信号復号部62から供給されたオブジェクト信号とに基づいてVBAP等のレンダリングを行い、その結果得られたレンダリングオブジェクト信号をミキサ部184に供給する。
【0350】
例えばオブジェクトレンダラ182では、
図15の信号処理装置131のオブジェクトレンダラ142において行われるレンダリングと同様の処理が行われ、各チャンネルのレンダリングオブジェクト信号が生成される。
【0351】
チャンネル変換部183は、コア信号復号部62から供給されたプリレンダリング済みのチャンネル音声信号を、そのチャンネル音声信号のチャンネル構成とは異なる他のチャンネル構成の各チャンネルの変換チャンネル信号に変換する変換処理を行う。
【0352】
すなわち、チャンネル変換部183では、所定チャンネル構成のチャンネル音声信号が、復号側、つまりパネルスピーカ52およびサブウーハ53で再生可能なチャンネル構成(チャンネル数)の変換チャンネル信号に変換される。
【0353】
例えばチャンネル変換部183では、プリレンダリング済みのチャンネル音声信号に対して、変換処理としてダウンミックスまたはアップミックスが行われて、パネルスピーカ52およびサブウーハ53に対応するチャンネル構成の変換チャンネル信号が生成される。チャンネル変換部183は、変換処理により得られた変換チャンネル信号をミキサ部184に供給する。
【0354】
なお、変換処理は必要に応じて行われればよく、プリレンダリング済みのチャンネル音声信号のチャンネル構成のままでよい場合には、そのプリレンダリング済みのチャンネル音声信号がそのまま変換チャンネル信号として出力される。
【0355】
ミキサ部184は、オブジェクトレンダラ182から供給されたレンダリングオブジェクト信号と、チャンネル変換部183から供給された変換チャンネル信号とを合成し、その結果得られた各チャンネルの再生信号をパネル出力制御部72に供給する。
【0356】
すなわち、ミキサ部184ではレンダリングオブジェクト信号と変換チャンネル信号の同じチャンネルの信号が加算(ミキシング)され、各チャンネルの再生信号が生成される。
【0357】
パネル出力制御部72は、非多重化部61から供給された過振幅フラグおよび配分ゲイン情報と、ミキサ部184から供給された再生信号とに基づいて、各パネルスピーカ52およびサブウーハ53に供給する出力信号を決定する。
【0358】
すなわち、パネル出力制御部72は、過振幅フラグ、配分ゲイン情報、および再生信号に基づいて、各パネルスピーカ52やサブウーハ53に供給する出力信号を生成する。この出力信号は、オブジェクト信号やチャンネル音声信号から生成された信号であるから、パネル出力制御部72では、オブジェクト信号やチャンネル音声信号の出力先となるパネルスピーカ52やサブウーハ53が調整(決定)されるともいうことができる。
【0359】
〈復号処理の説明〉
次に、信号処理装置171の動作について説明する。
【0360】
すなわち、以下、
図22のフローチャートを参照して、信号処理装置171により行われる復号処理について説明する。
【0361】
ステップS211において非多重化部61は、受信した符号化データを非多重化し、過振幅フラグ、配分ゲイン情報、符号化OAM、および符号化音声信号を抽出する。
【0362】
非多重化部61は、過振幅フラグおよび配分ゲイン情報をパネル出力制御部72に供給し、符号化OAMをOAM復号部181に供給し、符号化音声信号をコア信号復号部62に供給する。
【0363】
ステップS212においてOAM復号部181は、非多重化部61から供給された符号化OAMを復号し、得られたOAMをオブジェクトレンダラ182に供給する。
【0364】
ステップS213においてコア信号復号部62は、非多重化部61から供給された符号化音声信号を復号し、得られたオブジェクト信号をオブジェクトレンダラ182に供給するとともに、復号により得られたプリレンダリング済みのチャンネル音声信号をチャンネル変換部183に供給する。
【0365】
ステップS214においてオブジェクトレンダラ182は、OAM復号部181から供給されたOAMと、コア信号復号部62から供給されたオブジェクト信号とに基づいてレンダリングを行い、得られたレンダリングオブジェクト信号をミキサ部184に供給する。
【0366】
ステップS215においてチャンネル変換部183は、コア信号復号部62から供給されたプリレンダリング済みのチャンネル音声信号に対して変換処理を行い、その結果得られた変換チャンネル信号をミキサ部184に供給する。
【0367】
ステップS216においてミキサ部184は、オブジェクトレンダラ182から供給されたレンダリングオブジェクト信号と、チャンネル変換部183から供給された変換チャンネル信号とを合成して各チャンネルの再生信号を生成する。ミキサ部184は、得られた再生信号をパネル出力制御部72に供給する。
【0368】
ステップS217においてパネル出力制御部72は、非多重化部61から供給された過振幅フラグおよび配分ゲイン情報と、ミキサ部184から供給された再生信号とに基づいて、各パネルスピーカ52およびサブウーハ53に供給する出力信号を生成する。例えばステップS217では、
図8のステップS44と同様の処理が行われ、各パネルスピーカ52およびサブウーハ53に供給する出力信号が生成される。
【0369】
このようにして出力信号が生成されると、パネル出力制御部72は、各出力信号をパネルスピーカ52およびサブウーハ53に供給してコンテンツの音を再生させ、復号処理は終了する。
【0370】
以上のようにして信号処理装置171は、過振幅フラグと配分ゲイン情報に基づいて各パネルスピーカ52やサブウーハ53に供給する出力信号を生成する。このようにすることで、少ない処理負荷で高品位な音を再生することができる。
【0371】
以上において説明した第3の実施の形態では、特にパネルスピーカシステムでオブジェクトオーディオを再生するときにパネルスピーカで過振幅が生じる場合には、オブジェクトに近い位置にあるパネルスピーカや、オブジェクトの移動先のパネルスピーカに再生信号の一部が配分される。したがって、オブジェクトの音像感や移動感を損ねることなく過振幅を抑制し、高品位な音を再生することができる。
【0372】
〈第4の実施の形態〉
〈ストリーミング配信システムの構成例〉
ところで、オブジェクトオーディオのストリーミング配信システムでは、再生側の端末装置のパネル構成に関わらずオブジェクトオーディオ、すなわちオブジェクトオーディオのコンテンツが配信される。
【0373】
そのため、再生側のパネルスピーカの数、すなわちパネル枚数が少ない場合でも多数のオブジェクトの処理が必要であったり、逆にパネル枚数が十分多い場合でも少数のオブジェクトしか伝送されなかったりして、オブジェクトオーディオを効果的に再生できない。
【0374】
そこで、再生側のパネル構成を示すパネル構成情報と、再生側の演算リソースに基づいて求められる、再生側で処理が可能な最大のオブジェクト数を示す最大オブジェクト数情報とを配信側に伝送することで、コンテンツの適切な配信および再生を行うことができるようにしてもよい。
【0375】
そのような場合、配信側ではパネル構成情報と最大オブジェクト数情報とに基づいて、再生側のパネル構成やリソース環境に応じた適切なプリレンダリングや、過振幅に応じた再生信号の配分などを行うことができる。
【0376】
このようなストリーミング配信システムは、例えば
図23に示すように構成される。
【0377】
図23に示すストリーミング配信システムは、再生側の端末装置である再生装置201と、オブジェクトオーディオのコンテンツの配信側のサーバである配信装置202を有している。
【0378】
これらの再生装置201と配信装置202とは、インターネットなどのネットワークを介して接続されており、配信装置202は、再生装置201に対してオブジェクトオーディオ形式でコンテンツを配信する。
【0379】
再生装置201は、端末情報送信部211、オブジェクトオーディオ復号部212、およびパネルスピーカシステム213を有している。
【0380】
また、配信装置202は、プリレンダリング制御部221およびオブジェクトオーディオ符号化部222を有している。
【0381】
再生装置201の端末情報送信部211は、ネットワークを介して、パネル構成情報および最大オブジェクト数情報を配信装置202に送信する。
【0382】
オブジェクトオーディオ復号部212は、
図21に示した信号処理装置171と同じ構成となっており、配信装置202から伝送(送信)されてきたコンテンツの符号化データを受信し、復号処理を行う。
【0383】
パネルスピーカシステム213は、例えば
図21に示したパネルスピーカ52およびサブウーハ53からなるスピーカシステムであり、オブジェクトオーディオ復号部212から供給された出力信号に基づいてコンテンツの音を再生する。
【0384】
また、配信装置202のプリレンダリング制御部221は、端末情報送信部211から受信したパネル構成情報および最大オブジェクト数情報に基づいてプリレンダリングレベルを決定し、オブジェクトオーディオ符号化部222に供給する。
【0385】
オブジェクトオーディオ符号化部222は、プリレンダリング制御部221から供給されたプリレンダリングレベルと、供給されたOAM、オブジェクト信号、およびチャンネル音声信号とに基づいて符号化データを生成し、再生装置201に送信する。このオブジェクトオーディオ符号化部222は、
図15に示した信号処理装置131と同じ構成となっている。
【0386】
〈再生処理および配信処理の説明〉
続いて、再生装置201と配信装置202の動作について説明する。
【0387】
すなわち、以下、
図24のフローチャートを参照して、再生装置201による再生処理と、配信装置202による配信処理について説明する。
【0388】
まず、再生装置201による再生処理が開始され、再生装置201が配信装置202に対してコンテンツのストリーミング配信を要求する初期処理として、最大オブジェクト数を求める処理が行われる。
【0389】
すなわち、再生装置201の端末情報送信部211は、再生装置201の演算リソースに基づいて、オブジェクトオーディオ復号部212が処理可能なオブジェクト数の最大値である最大オブジェクト数を求め、最大オブジェクト数情報を生成する。
【0390】
また、端末情報送信部211は、図示せぬメモリ等から、パネルスピーカシステム213のパネル構成を示すパネル構成情報を読み出す。
【0391】
すると、ステップS241において端末情報送信部211は、最大オブジェクト数情報およびパネル構成情報を、ネットワークを介して配信装置202に送信する。
【0392】
これにより、再生装置201から配信装置202に対して、コンテンツのストリーミング配信が要求されたことになる。なお、コンテンツの再生中に演算リソースが変化した場合や、パネルスピーカシステム213が切り替えられてパネル構成が変化した場合などにおいては、コンテンツの再生中に最大オブジェクト数情報およびパネル構成情報が送信されるようにしてもよい。
【0393】
また、配信装置202では、ステップS261においてプリレンダリング制御部221は、端末情報送信部211から送信されてきた最大オブジェクト数情報およびパネル構成情報を受信する。
【0394】
ステップS262においてプリレンダリング制御部221は、受信した最大オブジェクト数情報およびパネル構成情報に基づいて、コンテンツのストリーミング配信時のプリレンダリングレベルを決定する。
【0395】
例えばパネルスピーカシステム213を構成するパネルスピーカ数(パネル枚数)が少ない場合、多数のオブジェクトのオブジェクト信号を再生装置201に伝送しても、動的にオブジェクトをレンダリングする効果は少ない。
【0396】
したがって、例えばパネル構成情報により示されるパネル枚数、つまりパネルスピーカ52の数が少ない場合には、効率的に処理を行うようにするため、プリレンダリングされるオブジェクト、すなわち上述の対象オブジェクトの数は多くなるようにされる。
【0397】
また、再生装置201側においてレンダリングされるオブジェクト、つまり対象外オブジェクトの数が、最大オブジェクト数を超える場合、再生装置201では、最大オブジェクト数を超えた分の対象外オブジェクトは破棄される。このとき、優先度が低いものから順番に破棄される対象外オブジェクトが選択される。
【0398】
したがって、最大オブジェクト数が少ない場合には、プリレンダリングされるオブジェクト、つまり対象オブジェクトが多くなるようになされる。
【0399】
ここで、最大オブジェクト数情報により示される最大オブジェクト数、パネル構成情報により示されるパネル枚数に対して定められるプリレンダリングレベルの具体的な例を
図25に示す。
【0400】
図25の例では、プリレンダリングレベルは、上述したLev-1、Lev-2、およびLev-3の何れかとされる。
【0401】
特に、プリレンダリングレベルがLev-1とされた場合、最も対象オブジェクトの数は多く、プリレンダリングレベルがLev-3とされた場合、最も対象オブジェクトの数は少ない。
【0402】
図25では、最大オブジェクト数が多くなるほど、またパネル枚数が多くなるほど、対象オブジェクトの数は少なくなるように、すなわち再生装置201側でレンダリングされる対象外オブジェクトの数が多くなるようになっている。
【0403】
例えばパネル枚数が1乃至2枚と少なく、最大オブジェクト数も1乃至15個と少ない場合には、プリレンダリングレベルはLev-1とされる。
【0404】
このようにしてプリレンダリングレベルが決定されると、プリレンダリング制御部221は、決定したプリレンダリングレベルをオブジェクトオーディオ符号化部222に供給する。
【0405】
図24のフローチャートの説明に戻り、ステップS263においてオブジェクトオーディオ符号化部222は、プリレンダリング制御部221から供給されたプリレンダリングレベルと、供給されたOAM、オブジェクト信号、およびチャンネル音声信号とに基づいて符号化処理を行う。
【0406】
ステップS263では、
図19を参照して説明した符号化処理が行われる。すなわち、符号化データが生成され、得られた符号化データがオブジェクトオーディオ符号化部222により再生装置201へと送信される。
【0407】
このようにして符号化処理が行われると、配信装置202による配信処理は終了する。
【0408】
また、符号化処理が行われると、再生装置201では、ステップS242においてオブジェクトオーディオ復号部212は、配信装置202から送信されてきた符号化データを受信する。
【0409】
ステップS243においてオブジェクトオーディオ復号部212は、受信した符号化データに基づいて復号処理を行い、パネルスピーカシステム213に供給する出力信号を生成する。
【0410】
ステップS243では、
図22を参照して説明した復号処理が行われ、パネルスピーカシステム213を構成する各パネルスピーカ52およびサブウーハ53に供給する出力信号が生成される。
【0411】
オブジェクトオーディオ復号部212は、このようにして生成された出力信号をパネルスピーカシステム213に供給する。
【0412】
ステップS245においてパネルスピーカシステム213は、オブジェクトオーディオ復号部212から供給された出力信号に基づいて、コンテンツの音を再生し、再生処理は終了する。
【0413】
以上のようにして再生装置201は、最大オブジェクト数情報とパネル構成情報を配信装置202に送信する。また、配信装置202は、再生装置201から受信した最大オブジェクト数情報とパネル構成情報に基づいてプリレンダリングレベルを決定し、符号化データを生成する。
【0414】
このようにすることで、少ない処理負荷で高品位な音を再生することができるだけでなく、再生装置201側の演算リソースやパネル構成に応じて、より効率的にコンテンツの配信および再生を行うことができる。
【0415】
〈コンピュータの構成例〉
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
【0416】
図26は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0417】
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
【0418】
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
【0419】
入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。
【0420】
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
【0421】
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
【0422】
コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
【0423】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0424】
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0425】
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
【0426】
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0427】
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0428】
さらに、本技術は、以下の構成とすることも可能である。
【0429】
(1)
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出する非多重化部と、
前記符号化音声信号を復号する復号部と、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する調整部と
を備える信号処理装置。
(2)
前記調整部は、前記復号により得られた所定の前記音声信号の出力先として定められている出力先パネルスピーカで過振幅が生じる場合、前記出力先パネルスピーカと、過振幅が生じない他のパネルスピーカとを前記所定の前記音声信号の出力先として決定する
(1)に記載の信号処理装置。
(3)
前記調整部は、前記音声信号に基づいて、前記所定の前記音声信号を前記他のパネルスピーカに出力するときの配分ゲインを計算する
(2)に記載の信号処理装置。
(4)
前記他のパネルスピーカは、前記出力先パネルスピーカに隣接して配置された前記パネルスピーカである
(2)または(3)に記載の信号処理装置。
(5)
前記他のパネルスピーカは、サブウーハである
(2)乃至(4)の何れか一項に記載の信号処理装置。
(6)
前記音声信号はマルチチャンネル信号であり、前記複数の前記パネルスピーカごとに、出力されるチャンネルの前記音声信号が定められている
(1)乃至(5)の何れか一項に記載の信号処理装置。
(7)
前記音声信号はオーディオオブジェクトのオブジェクト信号である
(2)に記載の信号処理装置。
(8)
前記所定の前記音声信号の出力先とする前記他のパネルスピーカは、前記所定の前記音声信号に対応する前記オーディオオブジェクトの動きの有無に基づいて決定される
(7)に記載の信号処理装置。
(9)
前記オーディオオブジェクトが静止している場合、前記オーディオオブジェクトの位置から最も近い位置に配置されている前記パネルスピーカが前記他のパネルスピーカとされる
(8)に記載の信号処理装置。
(10)
前記オーディオオブジェクトが移動している場合、前記オーディオオブジェクトの移動方向に基づいて前記他のパネルスピーカが決定される
(8)に記載の信号処理装置。
(11)
前記符号化データには、前記所定の前記音声信号を前記他のパネルスピーカに出力するときの配分ゲインが含まれており、
前記調整部は、前記過振幅フラグと、前記復号により得られた音声信号と、前記配分ゲインとに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
(2)に記載の信号処理装置。
(12)
前記符号化データには、複数の前記パネルスピーカからなる、互いに異なる複数のパネル構成ごとに、前記パネルスピーカの前記過振幅フラグが含まれている
(1)乃至(11)の何れか一項に記載の信号処理装置。
(13)
信号処理装置が、
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出し、
前記符号化音声信号を復号し、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
信号処理方法。
(14)
符号化データを非多重化して、符号化音声信号と、複数の各パネルスピーカについて生成された、前記パネルスピーカにおいて過振幅が生じるかを示す過振幅フラグとを抽出し、
前記符号化音声信号を復号し、
前記過振幅フラグと、前記復号により得られた音声信号とに基づいて、前記複数の各前記パネルスピーカの音声信号を調整する
ステップを含む処理をコンピュータに実行させるプログラム。
(15)
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出し、その検出結果を示す過振幅フラグを生成する過振幅検出部と、
前記音声信号を符号化する符号化部と、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する多重化部と
を備える信号処理装置。
(16)
前記音声信号はマルチチャンネル信号であり、前記複数の前記パネルスピーカごとに、出力されるチャンネルの前記音声信号が定められている
(15)に記載の信号処理装置。
(17)
所定の前記音声信号の出力先として定められている出力先パネルスピーカでの過振幅が検出された場合、前記音声信号に基づいて、前記所定の前記音声信号を前記出力先パネルスピーカと他のパネルスピーカとに出力するときの配分ゲインを計算する配分ゲイン計算部をさらに備え、
前記多重化部は、前記過振幅フラグと、前記符号化音声信号と、前記配分ゲインとを多重化して前記符号化データを生成する
(15)または(16)に記載の信号処理装置。
(18)
前記過振幅検出部は、複数の前記パネルスピーカからなる、互いに異なる複数のパネル構成ごとに、前記パネルスピーカの前記過振幅フラグを生成する
(15)乃至(17)の何れか一項に記載の信号処理装置。
(19)
信号処理装置が、
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出して、その検出結果を示す過振幅フラグを生成し、
前記音声信号を符号化し、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する
信号処理方法。
(20)
複数の各パネルスピーカについて、前記パネルスピーカにおいて音声信号に基づく音を再生したときに過振幅が生じるかを検出して、その検出結果を示す過振幅フラグを生成し、
前記音声信号を符号化し、
前記複数の前記パネルスピーカの前記過振幅フラグと、前記符号化により得られた符号化音声信号とを多重化して符号化データを生成する
ステップを含む処理をコンピュータに実行させるプログラム。
【符号の説明】
【0430】
11 信号処理装置, 21 パネル過振幅検出部, 22 コア信号符号化部, 23 多重化部, 51 信号処理装置, 52-1乃至52-N,52 パネルスピーカ, 53 サブウーハ, 61 非多重化部, 62 コア信号復号部, 63 パネル出力調整部, 71 配分ゲイン計算部, 72 パネル出力制御部