(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0035】
以下では、図面を参照し、本発明についてさらに詳細に説明する。
図1は、本発明の一実施形態によるオーディオ提供装置100の構成を示すブロック図である。
図1に図示されているように、オーディオ提供装置100は、入力部110、分離部120、オブジェクト・レンダリング部130、チャネル・レンダリング部140、ミキシング部150及び出力部160を含む。
【0036】
入力部110は、多様なソースからオーディオ信号を受信することができる。このとき、オーディオソースは、チャネルオーディオ信号及びオブジェクトオーディオ信号を含んでもよい。ここで、チャネルオーディオ信号は、当該フレームの背景音を含むオーディオ信号であり、第1チャネル数(例えば、5.1チャネル、7.1チャネルなど)を有することができる。また、オブジェクトオーディオ信号は、モーションを有するオブジェクトであるか、あるいは当該フレームで重要なオブジェクトのオーディオ信号でもある。オブジェクトオーディオ信号の一例として、人の声、銃声などを含んでもよい。オブジェクトオーディオ信号には、オブジェクトオーディオ信号の軌道情報が含まれてもよい。
【0037】
分離部120は、入力されたオーディオ信号を、チャネルオーディオ信号と、オブジェクトオーディオ信号とに分離する。そして、分離部120は、分離されたオブジェクトオーディオ信号及びチャネルオーディオ信号を、それぞれオブジェクト・レンダリング部130及びチャネル・レンダリング部140に出力することができる。
【0038】
オブジェクト・レンダリング部130は、入力されたオブジェクトオーディオ信号の軌道情報を基に、入力されたオブジェクトオーディオ信号をレンダリングする。このとき、オブジェクト・レンダリング部130は、オーディオ提供装置100のスピーカレイアウトによって入力されたオブジェクトオーディオ信号をレンダリングすることができる。例えば、オーディオ提供装置100のスピーカレイアウトが同一高度を有する二次元である場合、オブジェクト・レンダリング部130は、入力されたオブジェクトオーディオ信号を二次元にレンダリングすることができる。また、オーディオ提供装置100のスピーカレイアウトが複数の高度を有する三次元である場合、オブジェクト・レンダリング部130は、入力されたオブジェクトオーディオ信号を三次元にレンダリングすることができる。また、オーディオ提供装置100のスピーカレイアウトが同一高度を有する二次元であるとしても、オブジェクト・レンダリング部130は、入力されたオブジェクトオーディオ信号に仮想高度情報を付与し、三次元にレンダリングすることができる。オブジェクト・レンダリング部130は、
図2ないし
図7Bを参照して詳細に説明する。
【0039】
図2は、本発明の一実施形態によるオブジェクト・レンダリング部130の構成を示すブロック図である。
図2に図示されているように、オブジェクト・レンダリング部130は、軌道情報分析部131、距離制御部132、デプス制御部133、定位部134及びレンダリング部135を含む。
【0040】
軌道情報分析部131は、オブジェクトオーディオ信号の軌道情報を入力されて分析する。具体的には、軌道情報分析部131は、オブジェクトオーディオ信号の軌道情報を、レンダリングに必要な三次元座標情報に変換することができる。例えば、軌道情報分析部131は、
図3に図示されているように、入力されたオブジェクトオーディオ信号Oを(r,θ,φ)の座標情報に分析することができる。このとき、rは、原点とオブジェクトオーディオ信号との距離であり、θは、音像の水平面上の角度であり、φは、音像の高度角度である。
【0041】
距離制御部132は、変換された三次元座標情報を基に、距離制御情報を生成する。具体的には、距離制御部132は、軌道情報分析部131を介して分析された三次元上の距離rを基に、オブジェクトオーディオ信号の距離ゲインを算出する。このとき、距離制御部132は、三次元上の距離rに反比例して距離ゲインを算出することができる。すなわち、距離制御部132は、オブジェクトオーディオ信号の距離が遠いほど、オブジェクトオーディオ信号の距離ゲインを減少させ、オブジェクトオーディオ信号の距離が近いほど、オブジェクトオーディオ信号の距離ゲインを増大させることができる。また、距離制御部132は、原点に近くなる場合、距離ゲインが発散しないように、純粋反比例ではない上限ゲイン値を設定することができる。例えば、距離制御部132は、下記数式(1)のように、距離ゲインd
gを算出することができる。
【0042】
【数1】
すなわち、距離制御部132は、前述の数式を基に、
図4に図示されているように、距離ゲイン値d
gが1以上3.3以下になるように設定することができる。
【0043】
デプス制御部133は、変換された三次元座標情報を基に、デプス制御情報を生成する。このとき、デプス制御部133は、原点と、オブジェクトオーディオ信号の水平面投影距離dとを基に、デプスゲインを獲得することができる。
【0044】
このとき、デプス制御部133は、ネガティブベクトル及びポジティブベクトルの和でもってデプスゲインを表現することができる。具体的には、オブジェクトオーディオ信号の三次元座標において、r<1である場合、すなわち、オブジェクトオーディオ信号がオーディオ提供装置100に含まれたスピーカで構成された区間内に存在する場合、ポジティブベクトルは、(r,θ,φ)と定義され、ネガティブベクトルは、(r,θ+180,φ)と定義される。デプス制御部133は、オブジェクトオーディオ信号を定位するために、オブジェクトオーディオ信号の軌道ベクトル(trajectory vector)をポジティブベクトルとネガティブベクトルとの和で表現するためのポジティブベクトルのデプスゲインv
p、及びネガティブバックトのデプスゲインv
nを計算することができる。このとき、ポジティブベクトルのデプスゲインv
p、及びネガティブバックトのデプスゲインv
nは、下記数式(2)のように計算される。
【0045】
【数2】
すなわち、デプス制御部133は、水平面投影距離dが0から1までであるポジティブベクトルのデプスゲイン、及びネガティブベクトルのデプスゲインを
図5Aに図示されているように算出することができる。
【0046】
また、デプス制御部133は、ポジティブベクトル及びヌルベクトルの和でもってデプスゲインを表現することができる。具体的には、全てのチャネルのパニングゲインと位置との積の和が0に収斂される方向がない場合のパニングゲインを、ヌルベクトル(null vector)と定義することができる。特に、デプス制御部133は、水平面投影距離dが0に近くなれば、ヌルベクトルのデプスゲインは、1にマッピングされ、水平面投影距離dが1に近くなれば、ポジティブベクトルのデプスゲインが、1にマッピングされるように、ポジティブベクトルのデプスゲインv
p、及びヌルベクトルのデプスゲインv
nllを計算することができる。このとき、ポジティブベクトルのデプスゲインv
p、及びヌルベクトルのデプスゲインv
nllは、下記数式(3)のように計算される。
【0047】
【数3】
すなわち、デプス制御部133は、水平面投影距離dが0から1までであるポジティブベクトルのデプスゲイン、及びヌルベクトルのデプスゲインを
図5Bに図示されているように算出することができる。
【0048】
一方、デプス制御部133によってデプス制御を行えば、水平面投影距離dが0に近くなる場合、全てのスピーカに音が出力される。これにより、パニング境界(panning boundary)に発生する不連続性が低減する。
【0049】
定位部134は、変換された三次元座標情報を基に、オブジェクトオーディオ信号を定位させるための定位情報を生成する。特に、定位部134は、オーディオ提供装置100のスピーカレイアウトによって、オブジェクトオーディオ信号を定位させるためのパニングゲインを算出することができる。具体的には、定位部134は、オブジェクトオーディオ信号の軌道と同一方向のポジティブベクトルを定位させるためのトリプレット(triplet)スピーカを選択し、ポジティブベクトルのトリプレットスピーカに係わる三次元パニング係数g
pを計算することができる。そして、デプス制御部133が、ポジティブベクトル及びネガティブベクトルでデプスゲインを表現する場合、定位部134は、オブジェクトオーディオ信号の軌道と反対方向のネガティブベクトルを定位させるためのトリプレットスピーカを選択し、ネガティブベクトルのトリプレットスピーカに係わる三次元パニング係数g
nを計算することができる。
【0050】
レンダリング部135は、距離制御情報、デプス制御情報及び定位情報を基に、オブジェクトオーディオ信号をレンダリングする。特に、レンダリング部135は、距離制御部132から距離ゲインd
gを受信し、デプス制御部133からデプスゲインvを受信し、定位部134からパニングゲインgを受信し、距離ゲインd
g、デプスゲインv、パニングゲインgをオブジェクトオーディオ信号に適用させ、マルチチャネルのオブジェクトオーディオ信号を生成することができる。特に、オブジェクトオーディオ信号のデプスゲインが、ポジティブベクトルとネガティブベクトルとの和によって表現される場合、レンダリング部135は、m番目チャネルの最終ゲインG
mを、下記数式(4)のように算出することができる。
【0051】
【数4】
このとき、g
p,mは、ポジティブベクトルを定位した場合、mチャネルに適用されるパニング係数であり、
gn,mは、ネガティブベクトルを定位した場合、mチャネルに適用されるパニング係数でもある。
【0052】
また、オブジェクトオーディオ信号のデプスゲインが、ポジティブベクトルとヌルベクトルとの和によって表現される場合、レンダリング部135は、m番目チャネルの最終ゲインG
mを、下記数式(5)のように算出することができる。
【0053】
【数5】
このとき、g
p,mは、ポジティブベクトルを定位した場合、mチャネルに適用されるパニング係数であり、g
nll,mは、ネガティブベクトルを定位した場合、mチャネルに適用されるパニング係数でもある。一方、Σg
nll,mは、0にもなる。
【0054】
そして、レンダリング部135は、オブジェクトオーディオ信号であるxに適用させ、m番目チャネルのオブジェクトオーディオ信号の最終出力Y
mを、下記数式(6)のように算出することができる。
【0055】
【数6】
前述のように算出されたオブジェクトオーディオ信号の最終出力Y
mは、ミキシング部150に出力される。
【0056】
また、オブジェクトオーディオ信号が複数個存在する場合、オブジェクト・レンダリング部130は、複数のオブジェクトオーディオ信号間の位相差を算出し、複数のオブジェクトオーディオ信号のうち一つを、算出された位相差ほど移動させ、複数のオブジェクトオーディオ信号を合成することができる。
【0057】
具体的には、複数のオブジェクトオーディオ信号が入力される間、複数のオブジェクトオーディオ信号それぞれが、同一信号であるか、あるいは位相が互いに反対である場合、複数のオブジェクトオーディオ信号をそのまま合成すれば、複数のオブジェクトオーディオ信号の重畳によるオーディオ信号の歪曲が発生する。従って、オブジェクト・レンダリング部130は、複数のオブジェクトオーディオ信号間の相関度(correlation)を算出し、相関度が既設定値以上である場合、複数のオブジェクトオーディオ信号間の位相差を算出し、複数のオブジェクトオーディオ信号のうち一つを、算出された位置差ほど移動させ、複数のオブジェクトオーディオ信号を合成することができる。それにより、類似した複数のオブジェクトオーディオ信号が入力される場合、複数のオブジェクトオーディオ信号の合成による歪曲を防止することができる。
【0058】
一方、前述の実施形態では、オーディオ提供装置100のスピーカレイアウトが異なる高度感を有する三次元であるが、それは、一実施形態に過ぎず、オーディオ提供装置100のスピーカレイアウトが同一高度感を有する二次元でもある。特に、オーディオ提供装置100のスピーカレイアウトが、同一高度感を有する二次元である場合、オブジェクト・レンダリング部130は、前述のオブジェクトオーディオ信号の軌道情報のうち、φ値を0に設定する。
【0059】
また、オーディオ提供装置100のスピーカレイアウトが、同一高度感を有する二次元でもあるが、オーディオ提供装置100は、二次元のスピーカレイアウトを介して、仮想で三次元のオブジェクトオーディオ信号を提供することができる。
【0060】
以下では、仮想の三次元オブジェクトオーディオ信号を提供する実施形態について、
図6及び
図7を参照して説明する。
【0061】
図6は、本発明の他の実施形態による、仮想三次元オブジェクトオーディオ信号を提供するためのオブジェクト・レンダリング部130’の構成を示すブロック図である。
図6に図示されているように、オブジェクト・レンダリング部130’は、仮想フィルタ部136、三次元レンダリング部137、仮想レンダリング部138及びミキシング部139を含む。
【0062】
三次元レンダリング部137は、
図2ないし
図5Bに図示されているような方法を利用して、オブジェクトオーディオ信号をレンダリングすることができる。このとき、三次元レンダリング部137は、オーディオ提供装置100の物理的なスピーカに出力することができるオブジェクトオーディオ信号をミキシング部139に出力し、異なる高度感を提供する仮想スピーカの仮想パニングゲインg
m,topを仮想レンダリング部137に出力することができる。
【0063】
仮想フィルタ部136は、オブジェクトオーディオ信号の音色を補正させるブロックであり、心理音響を基に、入力されたオブジェクトオーディオ信号のスペクトル特性(spectral characteristics)を補正し、仮想スピーカの位置に音像を提供する。このとき、仮想フィルタ部136は、HRTF(head related transfer function)、BRIR(binaural room impulse response)のような多様な形態のフィルタによって具現される。
【0064】
また、仮想フィルタ部136の長さがフレーム長より短い場合、仮想フィルタ部136を、ブロックコンボルーション(block convolution)を介して適用させることができる。
【0065】
また、FFT(fast Fourier transform)、MDCT(modified discrete cosine transform)、QMF(quadrature mirror filter)のような周波数ドメインでレンダリングを行う場合、仮想フィルタ部136は、乗算によって適用される。
【0066】
複数の仮想トップレイヤスピーカ(virtual top layer speaker)の場合、仮想フィルタ部136は、1つの高度フィルタ(elevation filter)及び物理的なスピーカの配分式を介して、複数の仮想トップレイヤスピーカを生成することができる。
【0067】
また、複数の仮想トップレイヤスピーカ及び仮想バックスピーカ(virtual back speaker)の場合、仮想フィルタ部136は、それぞれ異なる位置で、スペクトル相関(spectral coloration)を適用させるための複数の仮想フィルタ及び物理的なスピーカの配分式を介して、複数の仮想トップレイヤスピーカ及び仮想バックスピーカを生成することができる。
【0068】
また、仮想フィルタ部136は、H1,H2,…,HNのようなN個の異なるスペクトル相関を使用する場合、演算量を減らすために、ツリー構造で設計が可能である。具体的には、仮想フィルタ部136は、
図7Aに図示されているように、高さ(height)を認知するのに共通して使用するnotch/peakをH0と設計し、H1ないしHNからH0の特性を差し引いた残りの成分であるK1ないしKNを、HOとカスケード(cascade)形態で連結することができる。また、仮想フィルタ部136は、共通成分とスペクトル相関とによって、
図7Bに図示されているような複数の段階で構成されたツリー構造をなすことができる。
【0069】
仮想レンダリング部138は、仮想チャネルを物理的なチャネルで表現するためのレンダリングブロックである。特に、仮想レンダリング部138は、仮想フィルタ部136から出力された仮想チャネル配分式によって、仮想スピーカに出力されたオブジェクトオーディオ信号を生成し、生成された仮想スピーカのオブジェクトオーディオ信号に、仮想パニングゲインg
m,topを乗じ、出力信号を合成することができる。このとき、複数の物理的な平面スピーカに配分する程度によって、仮想スピーカの位置が異なり、この配分の程度を仮想チャネル配分式と定義する。
【0070】
ミキシング部139は、物理的なチャネルのオブジェクトオーディオ信号と、仮想チャネルのオブジェクトオーディオ信号とをミキシングする。
【0071】
これにより、二次元のスピーカレイアウトを有するオーディオ提供装置100を介して、オブジェクトオーディオ信号が三次元上に位置するように表現することができる。
【0072】
再び
図1について説明すれば、チャネル・レンダリング部120は、第1チャネル数を有するチャネルオーディオ信号を、第2チャネル数を有するオーディオ信号にレンダリングすることができる。このとき、チャネル・レンダリング部120は、スピーカレイアウトによって入力された第1チャネル数を有するチャネルオーディオ信号を、第2チャネル数を有するオーディオ信号に変更することができる。
【0073】
具体的には、チャネルオーディオ信号のレイアウトと、オーディオ提供装置100のスピーカレイアウトとが同一である場合、チャネル・レンダリング部120は、チャネルオーディオ信号を、チャネルの変化なしに、レンダリングすることができる。
【0074】
また、チャネルオーディオ信号のチャネル数が、オーディオ提供装置100のスピーカレイアウトのチャネル数より多い場合、チャネル・レンダリング部120は、チャネルオーディオ信号をダウンミックスし、レンダリングを行うことができる。例えば、チャネルオーディオ信号のチャネルが7.1チャネルであり、オーディオ提供装置100のスピーカレイアウトが5.1チャネルである場合、チャネル・レンダリング部120は、7.1チャネルのチャネルオーディオ信号を、5.1チャネルにダウンミックスする。
【0075】
特に、チャネルオーディオ信号のダウンミックスを行う場合、チャネル・レンダリング部120は、入力されたチャネルオーディオ信号の軌道が一定に停止しているオブジェクトであると判断し、ダウンミックスを行うことができる。また、三次元のチャネルオーディオ信号を二次元ダウンミックスする場合、チャネル・レンダリング部120は、チャネルオーディオ信号の高度成分を除去して二次元ダウンミックスするか、あるいは
図6で説明したような仮想の高度感を有するように、仮想三次元にダウンミックスすることができる。また、チャネル・レンダリング部120は、正面のオーディオ信号を形成するフロントレフトチャネル、フロントライトチャネル、センターチャネルを除いた全ての信号をダウンミックスし、ライトサラウンドチャネル及びレフトサラウンドチャネルとして具現することができる。また、チャネル・レンダリング部120は、マルチチャネル・ダウンミックス方程式を利用して、ダウンミックスを行うことができる。
【0076】
また、チャネルオーディオ信号のチャネル数が、オーディオ提供装置100のスピーカレイアウトのチャネル数より少ない場合、チャネル・レンダリング部120は、チャネルオーディオ信号をアップミックスし、レンダリングを行うことができる。例えば、チャネルオーディオ信号のチャネルが7.1チャネルであり、オーディオ提供装置100のスピーカレイアウトが9.1チャネルである場合、チャネル・レンダリング部120は、7.1チャネルのチャネルオーディオ信号を、9.1チャネルにアップミックスすることができる。
【0077】
特に、二次元のチャネルオーディオ信号を三次元にアップミックスする場合、チャネル・レンダリング部120は、フロントチャネル及びサラウンドチャネル間の相関度(correlation)を基に、高度成分を有するトップレイヤを生成し、アップミックスを行うか、あるいはチャネル間の分析を介してセンター及びアンビエンス(ambience)に分けてアップミックスを行うことができる。
【0078】
また、チャネル・レンダリング部140は、第1チャネル数を有するオーディオ信号を、第2チャネル数を有するオーディオ信号にレンダリングする過程において、相関度を有するオーディオ信号間の位相差を算出し、複数のオーディオ信号のうち一つを、算出された位相差ほど移動させ、複数のオーディオ信号を合成することができる。
【0079】
一方、オブジェクトオーディオ信号、及び第1チャネル数を有するチャネルオーディオ信号のうち少なくとも一つは、特定フレームに対して、仮想三次元レンダリングを行うか、あるいは二次元レンダリングを行うかということを決定するガイド情報を含んでもよい。従って、オブジェクト・レンダリング部130及びチャネル・レンダリング部140それぞれは、オブジェクトオーディオ信号及びチャネルオーディオ信号に含まれたガイド情報を基に、レンダリングを行うことができる。例えば、第1フレームにおいて、オブジェクトオーディオ信号に対して、仮想三次元レンダリングを遂行せよというガイド情報が含まれた場合、オブジェクト・レンダリング部130及びチャネル・レンダリング部140は、第1フレームにおいて、オブジェクトオーディオ信号及びチャネルオーディオ信号に対して、仮想三次元レンダリングを行うことができる。また、第2フレームにおいて、オブジェクトオーディオ信号を二次元レンダリングせよというガイド情報が含まれた場合、オブジェクト・レンダリング部130及びチャネル・レンダリング部140は、第2フレームにおいて、オブジェクトオーディオ信号及びチャネルオーディオ信号に対して、二次元レンダリングを行うことができる。
【0080】
ミキシング部150は、オブジェクト・レンダリング部130から出力されたオブジェクトオーディオ信号と、チャネル・レンダリング部140から出力された第2チャネル数を有するチャネルオーディオ信号とをミキシングすることができる。
【0081】
一方、ミキシング部150は、レンダリングされたオブジェクトオーディオ信号と、第2チャネル数を有するオーディオ信号とをミキシングする間、相関度を有するオーディオ信号間の位相差を算出し、複数のオーディオ信号のうち一つを、前記算出された位相差ほど移動させ、複数のオーディオ信号を合成することができる。
【0082】
出力部160は、ミキシング部150から出力されたオーディオ信号を出力する。このとき、出力部160は、複数のスピーカを含んでもよい。例えば、出力部160は、5.1チャネル、7.1チャネル、9.1チャネル、22.2チャネルのようなスピーカによって具現される。
【0083】
以下では、
図8Aないし
図8Gを参照し、本発明の多様な実施形態について説明する。
【0084】
図8Aは、本発明の第1実施形態による、オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0085】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。このとき、9.1チャネルのチャネルオーディオ信号は、フロントレフトチャネル(FL:front left channel)、フロントライトチャネル(FR:front right channel)、フロントセンターチャネル(FC:front center channel)、サブウーファーチャネル(LFe:subwoofer channel)、サラウンドレフトチャネル(SL:surround left channel)、サラウンドライトチャネル(SR:surround right channel)、トップフロントレフトチャネル(TL:top front left channel)、トップフロントライトチャネル(TR:top front right channel)、バックレフトチャネル(BL:back left channel)、バックライトチャネル(BR:back right channel)を含む。
【0086】
一方、オーディオ提供装置100は、5.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル(FRL、フロントレフトチャネル(FL)、フロントセンターチャネル(FC)、サブウーファーチャネル(LFe)、サラウンドレフトチャネル(SL)及びサラウンドライトチャネル(SR)それぞれに対応するスピーカを具備することができる。
【0087】
オーディオ提供装置100は、入力されたチャネルオーディオ信号のうち、トップフロントレフトチャネル、トップフロントライトチャネル、バックレフトチャネル、バックライトチャネルのそれぞれに対応する信号に仮想フィルタリング(virtual filtering)を行い、レンダリングすることができる。
【0088】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する仮想三次元レンダリング(virtual 3D rendering)を行うことができる。
【0089】
オーディオ提供装置100は、フロントレフトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、てフロントレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントセンターチャネル及びサブウーファーチャネルそれぞれのチャネルオーディオ信号を、そのままフロントセンターチャネル及びサブウーファーチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドレフトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドライトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドライトチャネルに対応するスピーカに出力することができる。
【0090】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、5.1チャネルのスピーカを利用して、9.1チャネルの仮想三次元オーディオ環境を構築することができる。
【0091】
図8Bは、本発明の第2実施形態による、オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0092】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0093】
一方、オーディオ提供装置100は、7.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル及びバックライトチャネルそれぞれに対応するスピーカを具備することができる。
【0094】
オーディオ提供装置100は、入力されたチャネルオーディオ信号のうち、トップフロントレフトチャネル、トップフロントライトチャネルそれぞれに対応する信号に仮想フィルタリングを行ってレンダリングすることができる。
【0095】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する仮想三次元レンダリングを行うことができる。
【0096】
オーディオ提供装置100は、フロントレフトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントセンターチャネル及びサブウーファーチャネルそれぞれのチャネルオーディオ信号を、そのままフロントセンターチャネル及びサブウーファーチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドレフトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドライトチャネルのチャネルオーディオ信号、仮想レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、バックレフトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、バックレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、バックライトチャネルのチャネルオーディオ信号、仮想レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、バックライトチャネルに対応するスピーカに出力することができる。
【0097】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、7.1チャネルのスピーカを利用して、9.1チャネルの仮想三次元オーディオ環境を構築することができる。
【0098】
図8Cは、本発明の第3実施形態によるオブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0099】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0100】
一方、オーディオ提供装置100は、9.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル、バックライトチャネル、トップフロントレフトチャネル及びトップフロントライトチャネルそれぞれに対応するスピーカを具備することができる。
【0101】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する三次元レンダリング(3D rendering)を行うことができる。
【0102】
オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル、バックライトチャネル、トップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号それぞれに、三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、対応するスピーカに出力することができる。
【0103】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、9.1チャネルのスピーカを利用して、9.1チャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を出力することができる。
【0104】
図8Dは、本発明の第4実施形態による、オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0105】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0106】
一方、オーディオ提供装置100は、11.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル、バックライトチャネル、トップフロントレフトチャネル、トップフロントライトチャネル、トップサラウンドレフトチャネル、トップサラウンドライトチャネル、トップバックレフトチャネル及びトップバックライトチャネルそれぞれに対応するスピーカを具備することができる。
【0107】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する三次元レンダリングを行うことができる。
【0108】
オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル、バックライトチャネル、トップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号それぞれに、三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、対応するスピーカに出力することができる。
【0109】
そして、オーディオ提供装置100は、三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2それぞれを,トップサラウンドレフトチャネル、トップサラウンドライトチャネル、トップバックレフトチャネル及びトップバックライトチャネルそれぞれに対応するスピーカに出力することができる。
【0110】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、11.1チャネルのスピーカを利用して、9.1チャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を出力することができる。
【0111】
図8Eは、本発明の第5実施形態による,オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0112】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0113】
一方、オーディオ提供装置100は、5.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル及びサラウンドライトチャネルそれぞれに対応するスピーカを具備することができる。
【0114】
オーディオ提供装置100は、入力されたチャネルオーディオ信号のうち、トップフロントレフトチャネル、トップフロントライトチャネル、バックレフトチャネル、バックライトチャネルそれぞれに対応する信号に、二次元レンダリングを行う。
【0115】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する二次元レンダリングを行うことができる。
【0116】
オーディオ提供装置100は、フロントレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントセンターチャネル及びサブウーファーチャネルそれぞれのチャネルオーディオ信号を、そのままフロントセンターチャネル及びサブウーファーチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドライトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドライトチャネルに対応するスピーカに出力することができる。
【0117】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、5.1チャネルのスピーカを利用して、9.1チャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を出力することができる。すなわち、
図8Aに比べ、本実施形態は、仮想三次元オーディオ信号にレンダリングするのではなく、二次元オーディオ信号にレンダリングすることができる。
【0118】
図8Fは、本発明の第6実施形態による、オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0119】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0120】
一方、オーディオ提供装置100は、7.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル、サラウンドライトチャネル、バックレフトチャネル及びバックライトチャネルそれぞれに対応するスピーカを具備することができる。
【0121】
オーディオ提供装置100は、入力されたチャネルオーディオ信号のうち、トップフロントレフトチャネル、トップフロントライトチャネルそれぞれに対応する信号に、二次元レンダリングを行うことができる。
【0122】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する二次元レンダリングを行うことができる。
【0123】
オーディオ提供装置100は、フロントレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントセンターチャネル及びサブウーファーチャネルそれぞれのチャネルオーディオ信号を、そのままフロントセンターチャネル及びサブウーファーチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドライトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、バックレフトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、バックレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、バックライトチャネルのチャネルオーディオ信号、二次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、バックライトチャネルに対応するスピーカに出力することができる。
【0124】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、7.1チャネルのスピーカを利用して、9.1チャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を出力することができる。すなわち、
図8Bに比べ、本実施形態は、仮想三次元オーディオ信号にレンダリングするのではなく、二次元オーディオ信号にレンダリングすることができる。
【0125】
図8Gは、本発明の第7実施形態による、オブジェクトオーディオ信号及びチャネルオーディオ信号のレンダリングについて説明するための図面である。
【0126】
まず、オーディオ提供装置100は、9.1チャネルのチャネルオーディオ信号、及び2個のオブジェクトオーディオ信号O1,O2を受信する。
【0127】
一方、オーディオ提供装置100は、5.1チャネルのスピーカレイアウトで構成される。すなわち、オーディオ提供装置100は、フロントライトチャネル、フロントレフトチャネル、フロントセンターチャネル、サブウーファーチャネル、サラウンドレフトチャネル及びサラウンドライトチャネルそれぞれに対応するスピーカを具備することができる。
【0128】
オーディオ提供装置100は、入力されたチャネルオーディオ信号のうち、トップフロントレフトチャネル、トップフロントライトチャネル、バックレフトチャネル、バックライトチャネルそれぞれに対応する信号に、二次元ダウンミックス(2D down mixing)してレンダリングを行う。
【0129】
そして、オーディオ提供装置100は、第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2に対する仮想三次元レンダリングを行うことができる。
【0130】
オーディオ提供装置100は、フロントレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、フロントライトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、フロントセンターチャネル及びサブウーファーチャネルそれぞれのチャネルオーディオ信号を、そのままフロントセンターチャネル及びサブウーファーチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドレフトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドレフトチャネルに対応するスピーカに出力することができる。また、オーディオ提供装置100は、サラウンドライトチャネルのチャネルオーディオ信号、二次元レンダリングされたトップフロントレフトチャネル及びトップフロントライトチャネルのチャネルオーディオ信号、二次元レンダリングされたバックレフトチャネル及びバックライトチャネルのチャネルオーディオ信号、仮想三次元レンダリングされた第1オブジェクトオーディオ信号O1及び第2オブジェクトオーディオ信号O2をミキシングし、サラウンドライトチャネルに対応するスピーカに出力することができる。
【0131】
前述のようなチャネル・レンダリング及びオブジェクトレンダリングを介して、オーディオ提供装置100は、5.1チャネルのスピーカを利用して、9.1チャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を出力することができる。すなわち、
図8Aと比べ、チャネルオーディオ信号の音像よりは音質が重要であると判断された場合、オーディオ提供装置100は、チャネルオーディオ信号のみを二次元ダウンミックスし、オブジェクトオーディオ信号を仮想三次元にレンダリングすることができる。
【0132】
図9は、本発明の一実施形態によるオーディオ信号提供方法について説明するための流れ図である。
【0133】
まず、オーディオ提供装置100は、オーディオ信号を入力される(S910)。このとき、オーディオ信号は、第1チャネル数を有するチャネルオーディオ信号及びオブジェクトオーディオ信号を含んでもよい。
【0134】
そして、オーディオ提供装置100は、入力されたオーディオ信号を分離する(S920)。具体的には、オーディオ提供装置100は、入力されたオーディオ信号を、チャネルオーディオ信号及びオブジェクトオーディオ信号に分離することができる。
【0135】
そして、オーディオ提供装置100は、オブジェクトオーディオ信号をレンダリングする(S930)。具体的には、オーディオ提供装置100は、
図2ないし
図5Bで説明したように、オブジェクトオーディオ信号を、二次元または三次元にレンダリングすることができる。また、オーディオ提供装置100は、
図6ないし
図7Bで説明したように、オブジェクトオーディオ信号を、仮想の三次元オーディオ信号にレンダリングすることができる。
【0136】
そして、オーディオ提供装置100は、第1チャネル数を有するチャネルオーディオ信号を第2チャネル数にレンダリングする(S940)。このとき、オーディオ提供装置100は、入力されたチャネルオーディオ信号をダウンミックスするか、あるいはアップミックスし、レンダリングを行うことができる。また、オーディオ提供装置100は、入力されたチャネルオーディオ信号のチャネル数を維持し、レンダリングを行うことができる。
【0137】
そして、オーディオ提供装置100は、レンダリングされたオブジェクトオーディオ信号と、第2チャネル数を有するチャネルオーディオ信号とをミキシングする(S950)。具体的には、オーディオ提供装置100は、
図8Aないし
図8Gで説明したように、レンダリングされたオブジェクトオーディオ信号及びチャネルオーディオ信号をミキシングすることができる。
【0138】
そして、オーディオ提供装置100は、ミキシングされたオーディオ信号を出力する(S960)。
【0139】
前述のようなオーディオ提供方法によって、オーディオ提供装置100は、多様なフォーマットを有するオーディオ信号を、オーディオシステム空間に最適化されるように再生することができる。
【0140】
以下では、
図10を参照し、本発明の他の実施形態について説明する。
図10は、本発明の他の実施形態によるオーディオ提供装置1000の構成を示すブロック図である。
図10に図示されているように、オーディオ提供装置1000は、入力部1010、分離部1020、オーディオ信号デコーディング部1030、付加情報デコーディング部1040、レンダリング部1050、ユーザ入力部1060、インターフェース部1070及び出力部1080を含む。
【0141】
入力部1010は、圧縮されたオーディオ信号を入力される。このとき、圧縮されたオーディオ信号には、チャネルオーディオ信号と、オブジェクトオーディオ信号とが含まれた圧縮された形態のオーディオ信号だけではなく、付加情報を含んでもよい。
【0142】
分離部1020は、圧縮されたオーディオ信号を、オーディオ信号と付加情報とに分離し、オーディオ信号をオーディオ信号デコーディング部1030に出力し、付加情報を付加情報デコーディング部1040に出力する。
【0143】
オーディオ信号デコーディング部1030は、圧縮された形態のオーディオ信号を解除し、レンダリング部1050に出力する。一方、オーディオ信号は、マルチチャネルのチャネルオーディオ信号及びオブジェクトオーディオ信号を含む。このとき、マルチチャネルのチャネルオーディオ信号は、背景音及び背景音楽のようなオーディオ信号でもあり、オブジェクトオーディオ信号は、人の声、銃声のような特定物体に係わるオーディオ信号でもある。
【0144】
付加情報デコーディング部1040は、入力されたオーディオ信号の付加情報をデコーディングする。このとき、入力されたオーディオ信号の付加情報には、入力されたオーディオ信号のチャネル数、長さ、ゲイン値、パニングゲイン、位置、角度のような多様な情報が含まれてもよい。
【0145】
レンダリング部1050は、入力された付加情報及びオーディオ信号を基に、レンダリングを行うことができる。このとき、レンダリング部1050は、ユーザ入力部1060に入力されたユーザ命令により、
図2ないし
図8Gで説明したような多様な方法を利用して、レンダリングを行うことができる。例えば、入力されたオーディオ信号が7.1チャネルのオーディオ信号であり、オーディオ提供装置1000のスピーカレイアウトが5.1チャネルである場合、レンダリング部1050は、ユーザ入力部1060を介して入力されたユーザ命令により、7.1チャネルのオーディオ信号を、二次元の5.1チャネルオーディオ信号にダウンミックスすることができ、7.1チャネルのオーディオ信号を、仮想三次元5.1チャネルオーディオ信号にダウンミックスすることができる。また、レンダリング部1050は、ユーザ入力部1060を介して入力されたユーザ命令により、チャネルオーディオ信号を二次元にレンダリングし、オブジェクトオーディオ信号を、仮想三次元にレンダリングすることができる。
【0146】
また、レンダリング部1050は、ユーザ命令及びスピーカレイアウトによって、レンダリングされたオーディオ信号を、出力部1080を介して即座に出力することができるが、オーディオ信号及び付加情報を、インターフェース部1070を介して、外部機器1090に伝送することができる。特に、7.1チャネルを超えるスピーカレイアウトを有するオーディオ提供装置1000の場合、レンダリング部1050は、オーディオ信号及び付加情報のうち少なくとも一部を、インターフェース部1070を介して、外部機器1090に伝送することができる。このとき、インターフェース部1070は、HDMI(登録商標)インターフェースのようなデジタルインターフェースによって具現される。外部機器1090は、入力されたオーディオ信号及び付加情報を利用して、レンダリングを行った後、レンダリングされたオーディオ信号を出力することができる。
【0147】
しかし、前述のように、レンダリング部1050がオーディオ信号及び付加情報を外部機器1090に伝送することは、一実施形態に過ぎず、レンダリング部1050がオーディオ信号及び付加情報を利用して、オーディオ信号をレンダリングした後、レンダリングされたオーディオ信号を出力することができる。
【0148】
一方、本発明の一実施形態によるオブジェクトオーディオ信号には、ID(identification)、類型情報または優先順位情報などが含まれたメタデータが含まれてもよい。例えば、オブジェクトオーディオ信号の類型が、対話(dialog)であるか、あるいはコメンタリー(commentary)であるかということを示す情報が含まれてもよい。また、オーディオ信号が放送オーディオ信号である場合、オブジェクトオーディオ信号の類型が第1アンカーであるか、第2アンカーであるか、第1キャスターであるか、第2キャスターであるか、あるいは背景音であるかということを示す情報が含まれてもよい。また、オーディオ信号が音楽オーディオ信号である場合、オブジェクトオーディオ信号の類型が第1ボーカルであるか、第2ボーカルであるか、第1楽器音であるか、あるいは第2楽器音であるかということを示す情報が含まれてもよい。また、オーディオ信号がゲームオーディオ信号である場合、オブジェクトオーディオ信号の類型が、第1効果音であるか、あるいは第2効果音であるかということを示す情報が含まれてもよい。
【0149】
レンダリング部1050は、前述のようなオブジェクトオーディオ信号に含まれたメタデータを分析し、オブジェクトオーディオ信号の優先順位によって、オブジェクトオーディオ信号をレンダリングすることができる。
【0150】
また、レンダリング部1050は、ユーザ選択によって、特定オブジェクトオーディオ信号を除去することができる。例えば、オーディオ信号が運動競技に係わるオーディオ信号である場合、オーディオ提供装置1000は、ユーザに現在入力されるオブジェクトオーディオ信号の類型を案内するUI(user interface)をディスプレイすることができる。このとき、オブジェクトオーディオ信号には、キャスターの声、解説の声、喊声のようなオブジェクトオーディオ信号が含まれてもよい。ユーザ入力部1060を介して、複数のオブジェクトオーディオ信号のうちキャスターの声を除去するユーザ命令が入力された場合、レンダリング部1050は、入力されたオブジェクトオーディオ信号のうちキャスターの声を除去し、残りのオブジェクトオーディオ信号を利用して、レンダリングを行うことができる。
【0151】
また、出力部1080は、ユーザ選択によって、特定オブジェクトオーディオ信号に係わるボリュームを増大させるか、あるいは低減させることができる。例えば、オーディオ信号が、映画コンテンツに含まれたオーディオ信号である場合、オーディオ提供装置1000は、ユーザに現在入力されるオブジェクトオーディオ信号の類型を案内するUIをディスプレイすることができる。このとき、オブジェクトオーディオ信号には、第1主人公の声、第2主人公の声、砲弾音、飛行機音などが含まれてもよい。ユーザ入力部1060を介して、複数のオブジェクトオーディオ信号のうち、第1主人公の声、第2主人公の声のボリュームを増大させ、砲弾音、飛行機音のボリュームを低減させるユーザ命令が入力された場合、出力部1080は、第1主人公の声及び第2主人公の声のボリュームを増大させ、砲弾音、飛行機音のボリュームを低減させることができる。
【0152】
前述のような実施形態によって、ユーザは、自らが所望するオーディオ信号を操作することができ、ユーザに適するオーディオ環境を構築することができる。
【0153】
一方、前述の多様な実施形態によるオーディオ提供方法は、プログラムで具現され、ディスプレイ装置または入力装置に提供される。特に、ディスプレイ装置の制御方法を含むプログラムは、非一時的可読媒体(non-transitory computer readable medium)に保存されて提供される。
【0154】
非一時的可読媒体とは、レジスタ、キャッシュ、メモリのように短い瞬間の間にデータを保存する媒体ではなく、半永久的にデータを保存し、機器によって判読(reading)が可能な媒体を意味する。具体的には、前述の多様なアプリケーションまたはプログラムは、CD(compact disc)、DVD(digital versatile disc)、ハードディスク、ブルーレイディスク、USB(universal serial bus)、メモリカード、ROM(read only memory)のような非一時的可読媒体に保存されて提供される。
【0155】
また、以上では、本発明の望ましい実施形態について図示して説明したが、本発明は、前述の特定の実施形態に限定されるものではなく、特許請求の範囲で請求する本発明の要旨を外れることなしに、当該発明が属する技術分野において、当業者によって多様な変形実施が可能であるということは言うまでもなく、そのような変形実施は、本発明の技術的思想や展望から個別的に理解されることがあってはならない。
【0156】
上記の実施形態につき以下の付記を残しておく。
(付記1)
オブジェクトオーディオ信号の軌道情報を利用して、前記オブジェクトオーディオ信号をレンダリングするオブジェクト・レンダリング部と、
第1チャネル数を有するオーディオ信号を、第2チャネル数を有するオーディオ信号にレンダリングするチャネル・レンダリング部と、
前記レンダリングされたオブジェクトオーディオ信号、及び前記第2チャネル数を有するオーディオ信号をミキシングするミキシング部と、を含むオーディオ提供装置。
(付記2)
前記オブジェクト・レンダリング部は、
前記オブジェクトオーディオ信号の軌道情報を三次元座標情報に変換する軌道情報分析部と、
前記変換された三次元座標情報を基に、距離制御情報を生成する距離制御部と、
前記変換された三次元座標情報を基に、デプス制御情報を生成するデプス制御部と、
前記変換された三次元座標情報を基に、オブジェクトオーディオ信号を定位させるための定位情報を生成する定位部と、
前記距離制御情報、デプス制御情報及び定位情報を基に、前記オブジェクトオーディオ信号をレンダリングするレンダリング部と、を含むことを特徴とする付記1に記載のオーディオ提供装置。
(付記3)
前記距離制御部は、
前記オブジェクトオーディオ信号の距離ゲインを算出し、前記オブジェクトオーディオ信号の距離が遠いほど、前記オブジェクトオーディオ信号の距離ゲインを減少させ、前記オブジェクトオーディオ信号の距離が近いほど、前記オブジェクトオーディオ信号の距離ゲインを増大させることを特徴とする付記2に記載のオーディオ提供装置。
(付記4)
前記デプス制御部は、
前記オブジェクトオーディオ信号の水平面上の投影距離を基に、デプスゲインを獲得し、
前記デプスゲインは、
ネガティブベクトル及びポジティブベクトルの和によって表現されるか、あるいはポジティブベクトル及びヌルベクトルの和によって表現されることを特徴とする付記3に記載のオーディオ提供装置。
(付記5)
前記定位部は、
前記オーディオ提供装置のスピーカレイアウトによって、前記オブジェクトオーディオ信号を定位させるためのパニングゲインを算出することを特徴とする付記4に記載のオーディオ提供装置。
(付記6)
前記レンダリング部は、
前記オブジェクト信号の距離ゲイン、デプスゲイン及びパニングゲインを基に、前記オブジェクトオーディオ信号をマルチチャネルにレンダリングすることを特徴とする付記5に記載のオーディオ提供装置。
(付記7)
前記オブジェクト・レンダリング部は、
前記オブジェクトオーディオ信号が複数個存在する場合、前記複数のオブジェクトオーディオ信号のうち相関度を有するオブジェクト間の位相差を算出し、前記複数のオブジェクトオーディオ信号のうち一つを、前記算出された位相差ほど移動させ、前記複数のオブジェクトオーディオ信号を合成することを特徴とする付記2に記載のオーディオ提供装置。
(付記8)
前記オーディオ提供装置が同一高度を有する複数のスピーカを利用して、オーディオを再生する場合、
前記オブジェクト・レンダリング部は、
前記オブジェクトオーディオ信号のスペクトル特性を補正し、前記オブジェクトオーディオ信号に仮想高度情報を提供する仮想フィルタ部と、
前記仮想フィルタ部によって提供された仮想高度情報を基に、前記オブジェクトオーディオ信号をレンダリングする仮想レンダリング部と、を含むことを特徴とする付記1に記載のオーディオ提供装置。
(付記9)
前記仮想フィルタ部は、
複数の段階で構成されたツリー構造をなすことを特徴とする付記8に記載のオーディオ提供装置。
(付記10)
前記チャネル・レンダリング部は、
前記第1チャネル数を有するオーディオ信号のレイアウトが二次元である場合、前記第1チャネル数を有するオーディオ信号を、前記第1チャネル数より多い前記第2チャネル数を有するオーディオ信号にアップミキシングし、
前記第2チャネル数を有するオーディオ信号のレイアウトは、前記第1チャネル数を有するオーディオ信号と異なる高度情報を有する三次元であることを特徴とする付記1に記載のオーディオ提供装置。
(付記11)
前記チャネル・レンダリング部は、
前記第1チャネル数を有するオーディオ信号のレイアウトが三次元である場合、前記第1チャネル数を有するオーディオ信号を、前記第1チャネル数より少ない前記第2チャネル数を有するオーディオ信号にダウンミキシングし、
前記第2チャネル数を有するオーディオ信号のレイアウトは、複数のチャネルが同一高度成分を有する二次元であることを特徴とする付記1に記載のオーディオ提供装置。
(付記12)
前記オブジェクトオーディオ信号、及び前記第1チャネル数を有するオーディオ信号のうち少なくとも一つは、特定フレームに対して仮想三次元レンダリングを行うか否かということを決定する情報を含むことを特徴とする付記1に記載のオーディオ提供装置。
(付記13)
前記チャネル・レンダリング部は、
前記第1チャネル数を有するオーディオ信号を、前記第2チャネル数を有するオーディオ信号にレンダリングする過程において、相関度を有するオーディオ信号間の位相差を算出し、前記複数のオーディオ信号のうち一つを、前記算出された位相差ほど移動させ、前記複数のオーディオ信号を合成することを特徴とする付記1に記載のオーディオ提供装置。
(付記14)
前記ミキシング部は、
前記レンダリングされたオブジェクトオーディオ信号と、前記第2チャネル数を有するオーディオ信号とをミキシングする間、相関度を有するオーディオ信号間の位相差を算出し、前記複数のオーディオ信号のうち一つを、前記算出された位相差ほど移動させ、前記複数のオーディオ信号を合成することを特徴とする付記1に記載のオーディオ提供装置。
(付記15)
前記オブジェクトオーディオ信号は、
ユーザにオブジェクトオーディオ信号の選択のためのオブジェクトオーディオ信号のID及び類型情報のうち少なくとも一つを保存することを特徴とする付記1に記載のオーディオ提供装置。
(付記16)
オブジェクトオーディオ信号の軌道情報を利用して、前記オブジェクトオーディオ信号をレンダリングする段階と、
第1チャネル数を有するオーディオ信号を、第2チャネル数を有するオーディオ信号にレンダリングする段階と、
前記レンダリングされたオブジェクトオーディオ信号、及び前記第2チャネル数を有するオーディオ信号をミキシングする段階と、を含むオーディオ提供方法。
(付記17)
前記オブジェクトオーディオ信号をレンダリングする段階は、
前記オブジェクトオーディオ信号の軌道情報を三次元座標情報に変換する段階と、
前記変換された三次元座標情報を基に、距離制御情報を生成する段階と、
前記変換された三次元座標情報を基に、デプス制御情報を生成する段階と、
前記変換された三次元座標情報を基に、オブジェクトオーディオ信号を定位させるための定位情報を生成する段階と、
前記距離制御情報、デプス制御情報及び定位情報を基に、前記オブジェクトオーディオ信号をレンダリングする段階と、を含むことを特徴とする付記16に記載のオーディオ提供方法。
(付記18)
前記距離制御情報を生成する段階は、
前記オブジェクトオーディオ信号の距離ゲインを算出し、前記オブジェクトオーディオ信号の距離が遠いほど、前記オブジェクトオーディオ信号の距離ゲインを減少させ、前記オブジェクトオーディオ信号の距離が近いほど、前記オブジェクトオーディオ信号の距離ゲインを増大させることを特徴とする付記17に記載のオーディオ提供方法。
(付記19)
前記デプス制御情報を生成する段階は、
前記オブジェクトオーディオ信号の水平面上の投影距離を基に、デプスゲインを獲得し、
前記デプスゲインは、
ネガティブベクトル及びポジティブベクトルの和によって表現されるか、あるいはポジティブベクトル及びヌルベクトルの和によって表現されることを特徴とする付記18に記載のオーディオ提供方法。
(付記20)
前記定位情報を生成する段階は、
前記オーディオ提供装置のスピーカレイアウトによって、前記オブジェクトオーディオ信号を定位させるためのパニングゲインを算出することを特徴とする付記19に記載のオーディオ提供方法。
(付記21)
前記レンダリングする段階は、
前記オブジェクト信号の距離ゲイン、デプスゲイン及びパニングゲインを基に、前記オブジェクトオーディオ信号をマルチチャネルにレンダリングすることを特徴とする付記20に記載のオーディオ提供方法。
(付記22)
前記オブジェクトオーディオ信号をレンダリングする段階は、
前記オブジェクトオーディオ信号が複数個存在する場合、前記複数のオブジェクトオーディオ信号のうち相関度を有するオブジェクト間の位相差を算出し、前記複数のオブジェクトオーディオ信号のうち一つを、前記算出された位相差ほど移動させ、前記複数のオブジェクトオーディオ信号を合成することを特徴とする付記17に記載のオーディオ提供段階。
(付記23)
前記オーディオ提供装置が同一高度を有する複数のスピーカを利用して、オーディオを再生する場合、
前記オブジェクトオーディオ信号をレンダリングする段階は、
前記オブジェクトオーディオ信号のスペクトル特性を補正し、前記オブジェクトオーディオ信号に仮想高度情報を算出する段階と、
前記仮想フィルタ部によって提供された仮想高度情報を基に、前記オブジェクトオーディオ信号をレンダリングする段階と、を含むことを特徴とする付記16に記載のオーディオ提供方法。
(付記24)
前記算出する段階は、
複数の段階で構成されたツリー構造をなす仮想フィルタを利用して、前記オブジェクトオーディオ信号の仮想高度情報を算出することを特徴とする付記23に記載のオーディオ提供方法。
(付記25)
前記第2チャネル数を有するオーディオ信号にレンダリングする段階は、
前記第1チャネル数を有するオーディオ信号のレイアウトが二次元である場合、前記第1チャネル数を有するオーディオ信号を、前記第1チャネル数より多い前記第2チャネル数を有するオーディオ信号にアップミキシングし、
前記第2チャネル数を有するオーディオ信号のレイアウトは、前記第1チャネル数を有するオーディオ信号と異なる高度情報を有する三次元であることを特徴とする付記16に記載のオーディオ提供方法。
(付記26)
前記第2チャネル数を有するオーディオ信号にレンダリングする段階は、
前記第1チャネル数を有するオーディオ信号のレイアウトが三次元である場合、前記第1チャネル数を有するオーディオ信号を、前記第1チャネル数より少ない前記第2チャネル数を有するオーディオ信号にダウンミキシングし、
前記第2チャネル数を有するオーディオ信号のレイアウトは、複数のチャネルが同一高度成分を有する二次元であることを特徴とする付記16に記載のオーディオ提供方法。
(付記27)
前記オブジェクトオーディオ信号、及び前記第1チャネル数を有するオーディオ信号のうち少なくとも一つは、特定フレームに対して仮想三次元レンダリングを行うか否かということを決定する情報を含むことを特徴とする付記16に記載のオーディオ提供方法。