(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0012】
以下、添付の図面を参照しつつ本発明の好適な実施例について詳細に説明する。
【0013】
本発明の実施例は、当該技術分野における通常の知識を持つ者に本発明をより完全に説明するために提供されるもので、下記実施例は、様々な他の形態に変形されることができ、本発明の範囲が下記の実施例に限定されるものではない。むしろ、それら実施例は本開示をより充実で完全にし、当業者に本発明の思想を完全に伝達するために提供されるものである。
【0014】
図1は、本発明の一実施例によるオーディオ信号のデコーディング装置1000を示すブロック図であり、
図3は、本発明の他の実施例によるオーディオ信号のデコーディング装置2000を示すブロック図である。
【0015】
オーディオ信号のデコーディング装置1000,2000の2つの実施例は、オーディオ信号デコーディング装置1000がマルチチャネルデコーディング部1300を有するのに対し、オーディオ信号デコーディング装置2000はマルチチャネルデコーディング部1300を有しないという点で異なる。情報生成部1100,2100及びダウンミックス信号処理部1200,2200のような他の構成要素は、
図1及び
図3のオーディオ信号デコーディング装置1000,2000において同一である。
【0016】
図1を参照すると、オーディオ信号のデコーディング装置1000は、情報生成部1100、ダウンミックス信号処理部1200及びマルチチャネルデコーディング部1300を含む。情報生成部1100は、ユーザ入力またはビットストリームからオブジェクト情報(object information)及びミックス情報(mix information)を受信し、これを用いてダウンミックス信号処理情報(downmix processing information)を生成する。
【0017】
ここで、オブジェクト情報は、オブジェクトレベル情報(object level information)、オブジェクト相関情報(object correlation information)及びオブジェクトゲイン情報(object gain information)を含む。オブジェクトレベル情報を、オブジェクトのレベルの一つである基準情報を用いて各オブジェクトに対応するオブジェクトレベルを標準化することによって生成することができる。オブジェクト相関情報を、二つの選択されたオブジェクトの組合せから提供することができる。オブジェクトゲイン情報は、オブジェクトゲイン値情報(object gain value information)及び/またはオブジェクトゲイン比情報(object gain ratio information)を含む。また、ダウンミックス信号処理情報は、オブジェクトゲイン及びパニングを調節するためのパラメータを含み、これはダウンミックス信号処理部1200に入力される。
【0018】
ダウンミックス信号処理部1200は、ダウンミックス信号と情報生成部1100からのダウンミックス信号処理情報を受信する。ダウンミックス信号処理部1200は、ダウンミックス信号処理情報を用いてダウンミックス信号を処理でき、これにより、処理されたダウンミックス信号(processed downmix signal)を生成する。例えば、ダウンミックス信号処理部1200は、ダウンミックス信号処理情報をダウンミックス信号に適用して、ダウンミックス信号を変化させることができ、その結果、処理されたダウンミックス信号を生成することができる。
【0019】
処理されたダウンミックス信号はマルチチャネルデコーディング部1300に入力されてアップミキシングされ、スピーカーのような出力装置から出力することができる。情報生成部から出力されたマルチチャネル情報(multi-channel information)もマルチチャネルデコーディング部1300に入力することができる。本発明の一部実施例において、マルチチャネルデコーディング部1300は、MPEGサラウンドシステム(MPEG surround system)のデコーディング部と同一なユニットとすることができる。
【0020】
選択的に、処理されたダウンミックス信号を、
図3のデコーディング装置2000のように、出力装置に直接伝送して出力することもできる。処理されたダウンミックス信号をスピーカーから直接出力するために、ダウンミックス信号処理部2200は、合成フィルタバンク(synthesis filter bank)の役割を果たし、PCMデータを出力することができる。また、上記処理されたダウンミックス信号を直接PCM信号として出力するか、マルチチャネルデコーディング部に入力するかは、ユーザ選択によって決定することができる。
【0021】
図2は、
図1を参照した本発明の一実施例によるオーディオ信号のデコーディング方法を示すフローチャートである。まず、ダウンミックス信号、オブジェクト情報及びミックス情報を受信する(S110)。オブジェクト情報及びミックス情報を用いてダウンミックス信号処理情報を生成する(S120)。以降、処理されたダウンミックス信号は、ダウンミックス信号処理情報を用いてダウンミックス信号を処理することによって生成される(S130)。
【0022】
以下、情報生成部1100の構成を、
図4〜
図6を参照してより詳細に説明する。
【0024】
1.1 基準情報及びオブジェクトレベル情報
【0025】
図4は、本発明の一実施例によるオーディオ信号処理装置の情報生成部の構成を例示するブロック図である。
図4を参照すると、情報生成部1100は、オブジェクト情報を受信し、該オブジェクト情報を用いてダウンミックス信号処理情報を生成する。
【0026】
情報生成部1100は、オブジェクトレベル情報デコーディング部1110a、オブジェクトゲイン情報生成部1120a及びオブジェクト相関情報生成部1130aを含む。
【0027】
オブジェクトレベル情報は、基準情報(reference information)を用いてオブジェクトレベルを標準化することによって生成される。この基準情報は、オブジェクトレベルのうちの一つとすることができ、より詳細には、全てのオブジェクトレベルのうち最も大きいオブジェクトレベルとすることができる。
【数1】
【数2】
【0028】
しかし、もし、それぞれのオブジェクトに対応するオブジェクトレベル情報がその値のまま伝送されるとすれば、該オブジェクトのオブジェクトレベルが大きい範囲内で変動するので、量子化が難しくなりうる。
【0029】
したがって、オブジェクトレベル情報を、全てのオブジェクトエネルギーのうち最も大きいオブジェクトレベルエネルギーである基準情報を用いて標準化することができる。もし、この基準情報がr_1である場合、オブジェクトレベル情報を、下記式1のように推定することができる。
【数3】
【0030】
全てのオブジェクトレベル情報は、1以下の範囲に含まれる。したがって、変動範囲を、オーディオ信号がエンコーディングされうるような範囲に圧縮することができる。
【0031】
また、オブジェクトレベル情報は、他の信号処理に利用するために、デフォルト情報、原オブジェクトレベルなどを含むことができる。このオブジェクトレベル情報はそれぞれのオブジェクトに対応し、オブジェクトレベル情報の個数は、ダウンミックス信号に含まれるオブジェクトの個数と同一である。
【0033】
オブジェクト情報は、オブジェクトゲイン値情報及びオブジェクトゲイン比情報のうち少なくとも一つを含むオブジェクトゲイン情報を含む。
図5は、本発明の一実施例によるオーディオ信号処理装置を示すブロック図で、より詳細には、情報生成部1100のオブジェクトゲイン情報デコーディング部を例示するブロック図である。
【0034】
オブジェクトゲイン情報生成部1120aは、オブジェクトゲイン値情報生成部1121及びオブジェクトゲイン比情報生成部1122を含む。オブジェクトゲイン情報は、オブジェクトがダウンミックスチャンネルそれぞれに含まれる程度を変更してダウンミックス信号を変更することと関連する。
【0035】
1.2.1 オブジェクトゲイン値情報
【0036】
オブジェクトゲイン値情報は、オブジェクトがダウンミックスチャンネルそれぞれに含まれる程度を変更してダウンミックス信号を変更するオブジェクトのゲイン値を含んでいる。
本発明の一部実施例では、オブジェクトゲインは、処理されたダウンミックス信号の生成以前にそれぞれのオブジェクトに適用される。
【0037】
例えば、ダウンミックス信号が複数個のオブジェクトを含む場合、下記式2のように、オブジェクトに対応するオブジェクトゲイン値情報をオブジェクトレベルに乗算することで、ゲインの適用されたオブジェクトを生成し、ゲインの適用された全てのオブジェクトは、処理されたダウンミックス信号を生成するために合算される。
【0040】
1.2.2 オブジェクトゲイン比情報
【0041】
オブジェクトゲイン情報は、オブジェクトゲイン値情報の他に、オブジェクトゲイン比情報をさらに含むことができる。このオブジェクトゲイン比情報は、処理されたダウンミックス信号の各チャネルに寄与する一つのオブジェクトのゲイン間の比の値を含む。
【0042】
オブジェクトゲイン比情報を、ダウンミックス信号処理部1200によってダウンミックスを処理するために利用することができ、これにより、モノまたはステレオチャネルで伝送される処理されたダウンミックス信号を獲得することができる。ステレオ信号である場合、処理されたダウンミックス信号を式3から獲得することができる。
【0043】
【数6】
【数7】
【数8】
【数9】
【0049】
各チャネルを通じて伝送される処理されたダウンミックス信号を獲得するために、新しい方法では、下記式6を利用することができる。
【0054】
図4を参照すると、情報生成部1100は、オブジェクト相関情報(object correlation information)を受信する。このオブジェクト相関情報は、二つのオブジェクト間に推定され、両オブジェクト間の相関度または一貫性を表す。
【0056】
第一に、オブジェクトがステレオオブジェクトであれば、このステレオオブジェクトはダウンミキシングされてモノオブジェクトを生成し、ステレオオブジェクトのチャネル間の関係を表す子孫オブジェクト情報(descendant object information)を生成することができる。本明細書では、この第一の方法を“モノ方式(mono method)”という。この場合、モノオブジェクトのオブジェクトレベルを用いてオブジェクトレベル情報を生成することができる。
【0057】
第二に、ステレオオブジェクトを二つの別個のモノオブジェクトとして認知する方法がある。この場合、二つの別個のモノオブジェクトのレベルを用いてオブジェクトレベル情報が生成される。本明細書では、この第二の方法を“ステレオ方式(stereo method)”と呼ぶ。この第二の方法を用いて伝送される情報の量は、第一の方法を利用する場合に比べて大きくなる。
【0061】
オブジェクト相関情報は代表値としてチャネル信号のパワー値のうちの一つを含む。例えば、チャネル信号のパワー値は、ステレオオブジェクトの左側チャネル及び下記式7のように代表値を用いて標準化したパワー値でありうる。
【0063】
このオブジェクト相関情報はオブジェクト間の関係を表し、これらのオブジェクトが同一のステレオまたはマルチチャネルオブジェクトの両側チャネルであるか否かを表すことができる。換言すると、それぞれのオブジェクトは、同一起源(origin)のオブジェクトであって、異なるダウンミックスチャネルに含まれるものでありうる。
【0064】
オブジェクト情報の伝送ビットを減少させるには、オブジェクト差情報をさらに利用することが効率的である。例えば、オブジェクト情報は、ステレオオブジェクトの左側チャネルのオブジェクトレベルと下記式8で表すオブジェクト差情報を含むことができる。左側チャネルと右側チャネルとのレベル差が大きいと仮定できるので、右側チャネルのオブジェクトレベルをエンコーディングする方よりもオブジェクト差情報をエンコーディングする方がより効率的なわけである。
【0066】
選択として、オブジェクト情報は、各チャネルのオブジェクトレベル情報を含むよりは下記式9のようなオブジェクト和情報及びオブジェクト差情報を含むことができる。
【数24】
【0067】
このオブジェクト和情報(Ps_M)とオブジェクト差情報(Ps_S)を利用すると、伝送効率を向上させ、かつ、量子化誤差(error)を容易に修正することができる。
【0068】
オブジェクト情報のビット率を減少させるために、オブジェクト相関情報の数を、同一のオブジェクトによって様々に採択することができる。オブジェクトがステレオまたはマルチチャネルオブジェクトの一部であるか否かを表す相関フラグ情報(correlation_flag)を、オブジェクト情報から受信することができる。この相関フラグ情報を、オブジェクト情報に含めて情報生成部1100で受信することができる。
【0069】
相関フラグ情報の意味は、下記表1の通りである。
【0071】
相関フラグ情報が0の場合、オブジェクト相関情報は、オブジェクト相関情報デコーディング部1130aに伝送されない。もし、相関フラグ情報がデコーディング装置1000,2000に伝送されない場合には、ダウンミックス信号の処理のために設定値を利用することができる。
【0072】
一方、相関フラグ情報が1の場合は、選択された二つのオブジェクトの類似性を表すオブジェクト相関情報が、オブジェクト相関情報デコーディング部1130aに伝送される。
【0073】
また、オブジェクト情報は別途に基準情報をさらに含むことができる。基準情報が存在する場合、この基準情報はマルチポイント制御ユニット結合部(MCU combiner)のための識別子でありうる。
【0074】
本発明によるオーディオ信号のエンコーディング方法は、マルチオブジェクトオーディオ信号を受信する段階と、ダウンミックス信号及びオブジェクト情報を生成する段階と、を含み、このオブジェクト情報は、オブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報を含む。オブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報は、前述した方法で生成される。この方法に本発明によるオーディオ信号のエンコーディング方法が限定されるわけではない。
【0075】
また、本発明によるオーディオ信号のエンコーディング装置は、マルチオブジェクトオーディオ信号からダウンミックス信号を生成するダウンミキシング部と、マルチオブジェクトオーディオ信号からオブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報を含むオブジェクト情報を抽出するオブジェクト情報生成部と、を含む。同様に、この装置に本発明によるオーディオ信号のエンコーディング装置が限定されるわけではない。
【0076】
2. マルチポイント制御ユニット結合部(MCU combiner)
【0077】
オーディオ信号は、MCUで用いられて調節され、遠隔のコンファレンス装置に出力することができ、この場合、マルチチャネルオーディオ信号は、ボーカル信号、背景音楽(BGM)及びナレーション(narration)音を含むことができる。この場合、必要に応じて、聴取者がボーカル信号及びナレーション音無しで背景音楽のみを利用したり聞いたりしようとする時、または、テレコンファレンス(teleconference)を用いて対話しようとする時、特定オブジェクトのみを削除したり制御したりすることはできない。このような場合、マルチオブジェクト信号を含むオーディオ信号を用いることで上記問題点を解決することができる。
【0078】
オーディオ信号がマルチオブジェクトを含む時、オーディオ信号のオブジェクト情報を利用すると、各オブジェクトの特徴に応じてオブジェクトのゲイン及びパニングを効率的に調節することが可能になる。また、オブジェクト情報を利用する本発明のデコーディング方法は、改善されたカラオケシステム(an enhanced karaoke system)で利用されることができる。
【0079】
図6は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図である。
図6を参照すると、オーディオ信号の処理装置は、第1エンコーダ3100、第2エンコーダ4100、そしてマルチポイント制御ユニット結合部5100及びダウンミキシング部5200を含む結合部5000を含む。第1エンコーダ3100及び第2エンコーダ4100はそれぞれ第1オーディオ信号及び第2オーディオ信号を受信することができ、第1エンコーダ3100では第1ダウンミックス信号及び第1オブジェクト情報を生成し、第2エンコーダ4100では第2ダウンミックス信号及び第2オブジェクト情報を生成することができる。
【0080】
結合部5000は、第1エンコーダ3100から第1ダウンミックス信号及び第1オブジェクト情報を受信し、第2エンコーダ4100からは第2ダウンミックス信号及び第2オブジェクト情報を受信して、結合ダウンミックス信号及び結合オブジェクト情報を生成する。
【0081】
結合部5000の出力信号である結合ダウンミックス信号を、一般のダウンミキシング部を用いて生成することができる。したがって、ダウンミキシング部5200についての詳細な説明は省略する。
【0083】
図7は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図であり、より詳細には、マルチポイント制御ユニット結合部5100を例示するブロック図である。
図7を参照すると、マルチポイント制御ユニット結合部5100を、第1オブジェクト情報、第2オブジェクト情報及び制御情報を用いて結合オブジェクト情報を生成するように構成することができる。この結合オブジェクト情報は、第1エンコーダ3100から出力された第1ダウンミックス信号と第2エンコーダ4100から出力された第2ダウンミックス信号に対応する全ての情報を含む。
【0084】
マルチポイント制御ユニット結合部5100は、オブジェクト情報デコーディング部5110及び結合オブジェクト情報エンコーディング部5120を含む。オブジェクト情報デコーディング部5110は、第1エンコーダ3100からの第1オブジェクト情報及び第2エンコーダ4100からの第2オブジェクト情報を受信し、第1基準値、第1オブジェクトレベル情報、第1オブジェクトゲイン情報、第2基準値、第2オブジェクトレベル情報及び第2オブジェクトゲイン情報を生成するように構成することができる。ここで、基準値、オブジェクトレベル情報及びオブジェクトゲイン情報は、
図1〜
図6における説明と同一である。したがって、このような情報を生成する方法についての詳細は省略する。
【0085】
また、マルチポイント制御ユニット結合部5100は、入力信号の制限無しに複数のエンコーダから少なくとも二つのオブジェクト情報を受信して、結合ダウンミックス信号に対応する複数の情報を含む結合オブジェクト情報を生成することができる。
【0087】
図8は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図であり、より詳細には、結合オブジェクト情報エンコーディング部5120を例示するブロック図である。
図8を参照すると、結合オブジェクト情報エンコーディング部5120は、上記の情報(第1オブジェクト情報及び第2オブジェクト情報)及びユーザ制御から制御情報(control information)を受信して、デコーダ(図示せず)に入力される結合オブジェクト情報を生成するように構成することができる。
【0088】
この結合されたオブジェクト情報を、少なくとも二つのオブジェクト情報の組合せによって生成することができる。例えば、結合オブジェクト情報エンコーディング部5120で制御情報を参照して第1オブジェクト情報及び第2オブジェクト情報を選択することができる。
【0089】
制御情報は、オブジェクト制御情報とゲイン制御情報を含み、該ゲイン制御情報は宛先情報を含むことができる。これらオブジェクト制御情報、ゲイン制御情報及び宛先情報をそれぞれ、以下で説明する。
【0091】
オブジェクト制御情報は、結合オブジェクト情報に含まれるオブジェクト集合(an object subset)を決定することができる。このオブジェクト制御情報は、第1オブジェクト情報または第2オブジェクト情報に対応するオブジェクトの必要な集合を決定することができる。
【0092】
オブジェクト制御情報は、オブジェクトレベル情報エンコーディング部5122でオブジェクトレベル情報に適用されて、結合オブジェクトレベル情報を生成でき、この結合オブジェクトレベル情報は、オブジェクト制御情報によって決定される一部のオブジェクトに対する情報を含むことができ、様々な目的に応じて利用することができる。
【0093】
例えば、第1オブジェクト情報は、ボーカル、ピアノ、ギターオブジェクトを含む音楽信号を含むことができる。この音楽信号からピアノ、ギター、バイオリンオブジェクトを含むオーディオ信号を生成するために、オブジェクト制御情報及びユーザ制御を用いてボーカルオブジェクトのない結合オブジェクト情報を獲得することができる。
【0095】
オブジェクトゲイン情報エンコーディング部5123を、第1オブジェクト情報からの第1ゲイン情報、第2オブジェクト情報からの第2ゲイン情報、ゲイン制御情報及び宛先情報を受信して、結合オブジェクトゲイン情報を生成するように構成することができる。
【0096】
ゲイン制御情報を、マルチポイント制御ユニット結合部でオブジェクトゲインを調節するために用いることができる。オブジェクトレベル情報エンコーディング部5122で結合オブジェクトレベル情報に利用されるオブジェクトを選択するオブジェクト制御情報とは違い、ゲイン制御情報を、オブジェクトゲイン情報エンコーディング部5123で利用することができる。このゲイン制御情報を0〜1の範囲内の値にすることができる。
【0098】
上記のゲイン制御情報の範囲内で、オブジェクトに対応するゲイン制御情報が0であれば、このオブジェクトに対するオブジェクト情報は結合オブジェクト情報に含まれない。ゲイン制御情報が0または1の場合、このゲイン制御情報を宛先情報(destination information)とみなすことができる。この宛先情報は、0または1の値を持つ特定ゲイン制御情報を含み、結合されたダウンミックス信号が出力される宛先を表す識別子を含む。
【0099】
宛先情報を、例えば、ささやき声モード(whisper mode)、秘密会議(secret meeting)のような特別なモードのために利用することができ、オブジェクトの使用を制御するために利用することができる。
【0100】
図8を参照すると、宛先情報を、オブジェクトゲイン情報エンコーディング部5123に入力することができ、結合オブジェクト情報のオブジェクトゲインを調節するために第1オブジェクトゲイン情報及び第2オブジェクトゲイン情報に適用することができる。
【0101】
上記のゲイン制御情報及び宛先情報を、オブジェクトゲイン情報エンコーディング部5123に同時にまたは個別に入力することができる。
【0102】
2.3 結合オブジェクト情報を生成する方法
【0103】
図8は、結合オブジェクト情報エンコーディング部5120を例示するブロック図である。
図8を参照すると、結合オブジェクト情報エンコーディング部5120は、第1基準値(reference value_1)、第2基準値(reference value_2)、第1オブジェクトレベル情報、第2オブジェクトレベル情報、第1オブジェクトゲイン情報、第2オブジェクトゲイン情報、オブジェクト制御情報、ゲイン制御情報及び宛先情報を受信し、これらの情報を用いて結合オブジェクト情報を生成する。
【0105】
図8を再び参照すると、結合オブジェクト情報エンコーディング部5120は、基準値生成部5121、オブジェクトレベル情報エンコーディング部5122及びオブジェクトゲイン情報エンコーディング部5123を含む。
【0106】
結合オブジェクト情報を生成するために、まず、結合オブジェクト情報の基準情報を推定しなければならない。それぞれのオブジェクト情報は、各オブジェクトのレベルを標準化し、オブジェクトレベル情報を生成するための基準情報を含むことができる。しかし、結合オブジェクト情報を生成するために少なくとも二つのオブジェクト情報が結合する場合、結合オブジェクト情報は、結合オブジェクトレベル情報を構成するオブジェクトレベルを標準化するための基準情報を決定する。
【0107】
この結合オブジェクト情報の基準情報を、様々な方法によって決定することができる。例えば、この基準情報は、(第1オブジェクト情報に含まれた)第1基準情報であるか、それぞれのオブジェクト情報の基準情報のうち最も大きい値でありうる。
【0108】
この基準情報を変更する代わりに、結合オブジェクト情報は、それぞれのオブジェクト情報のオブジェクトレベル情報を利用することができる。
【0109】
2.3.2 結合オブジェクト情報のオブジェクトレベル情報
【0110】
基準情報生成部5121は、上記のような方法で結合オブジェクト情報の基準情報を推定する。結合オブジェクト情報の基準情報が変更される前には、オブジェクトレベル情報_iは基準情報_iで標準化される。
【0111】
オブジェクト情報_1のオブジェクトレベル情報を下記式10のように仮定し、結合オブジェクト情報のオブジェクトレベル情報を下記式11のように仮定する。
【0113】
2.3.3 結合オブジェクトゲイン情報
【0114】
オブジェクトゲイン情報エンコーディング部5123は、第1オブジェクトゲイン情報、第2オブジェクトゲイン情報、ゲイン調節情報及び宛先情報を受信し、ゲイン調節情報及び宛先情報を用いて結合オブジェクトゲイン情報を生成する。ゲイン制御情報によって結合オブジェクト情報に含まれるようにオブジェクトレベル情報を制御することができる。特に、ダウンミックス信号の方向を調節するゲイン制御情報を‘宛先情報’と称する。この宛先情報がオブジェクト情報のオン/オフを表す場合、すなわち、宛先情報が0または1の場合、i番目のオブジェクト情報のオブジェクトゲイン情報が0または1でありうる。
【0115】
宛先情報を、オブジェクト情報に含ませたりユーザ制御より入力することができる。ゲイン調節情報が含まれまたは入力される場合、該ゲイン調節情報によって第1オブジェクトゲイン情報及び第2オブジェクトゲイン情報を修正することができる。
【0116】
2.3.4 結合オブジェクト相関情報
【0117】
オブジェクト相関情報は、ステレオオブジェクトまたはマルチチャネルオブジェクトのチャネル間の類似度/非類似度を表す。したがって、オブジェクト相関情報は、マルチポイント制御ユニット結合部5100でオブジェクト情報が結合されることによって影響されうる。
【0118】
したがって、種々の方法により結合オブジェクト相関情報を決定することができる。最も簡単な方法として、i番目のオブジェクト情報のオブジェクト相関情報をそのまま利用することができる。
【0119】
以上説明してきた本発明は、前述した実施例及び添付の図面に限定されず、本発明の技術的思想を逸脱しない範囲内で様々な置換、変形及び変更が可能であるということは、本発明の属する技術分野における通常の知識を持つ者にとっては明白である。