【実施例】
【0051】
〈II.例示的実施形態〉
図1は、本発明の例示的実施形態に基づくデコード・システム100をブロック図の形で示している。オーディオ・デコーダ110はビットストリームPを受領し、それから、一つまたは複数の処理段階において、丸囲みの文字Aによって表わされる、nチャネル・オーディオ信号を表わす入力信号を生成する。一例として、ドルビー・デジタル・プラス・フォーマット(または向上AC-3)を、それに適応したオーディオ・デコーダ110とともに使ってもよい。オーディオ・デコーダ110の内部動作についてはのちにより詳細に述べる。入力信号Aは、オーディオ信号の時間セグメントに対応する時間フレームにセグメント分割される。好ましくは、相続く時間フレームは連続しており、重なり合わない。入力信号Aは、所与の時間フレームにおいて、オーディオ信号を、(b)パラメトリック符号化によってまたは(a)n個の離散的にエンコードされたチャネルWとして、表現する。パラメトリック符号化データは、オーディオ信号をダウンミックスすることによって得られるダウンミックス信号Xに対応するmチャネル・コア信号を含む。入力信号Aにおいて受領されるパラメトリック符号化データは、まとめてαによって表わされる、ダウンミックス信号Xに関連付けられている一つまたは複数の混合パラメータをも含んでいてもよい。あるいはまた、ダウンミックス信号Xに関連付けられた前記少なくとも一つの混合パラメータαは、同じビットストリームP内の前記入力信号とは別個の信号を通じてまたは異なるビットストリームを通じて受領されてもよい。入力信号の現在の符号化方式(すなわち、パラメトリック符号化または離散的符号化)についての情報は、ビットストリームPにおいて、あるいは別個の信号として受領されてもよい。
図1に示されるデコード・システムでは、オーディオ信号は六つのチャネルをもち、コア信号は二つのチャネルをもつ。すなわち、m=2、n=6である。本開示のいくつかの節では、いくつかの接続線がマルチチャネル信号を伝送するよう適応されていることを明示的に示すために、これらの線は、それぞれのチャネル数の隣に横断線を与えられている。入力信号Aは、離散的符号化方式においては、チャネルL(左)、R(右)およびC(中央)、Lfe(低域効果)、Ls(左サラウンド)、Rs(右サラウンド)をもつ5.1サラウンドとしてのオーディオ信号の表現であってもよい。しかしながら、パラメトリック符号化方式では、LおよびRチャネルは2.0ステレオにおいてコア信号チャネルL0(コア左)およびR0(コア右)を伝送するために使われる。
【0052】
デコード・システム100は、デコード・システム100がn個の離散的にエンコードされたチャネルWからオーディオ信号を導出する離散モードで動作可能である。デコード・システム100はまた、デコード・システム100が、空間的合成を含むアップミックス動作を実行することによって、コア信号からオーディオ信号を再構成する、パラメトリック・モードでも動作可能である。
【0053】
ダウンミックス段140は、入力信号を受領し、ダウンミックス指定に従って入力信号のダウンミックスを実行し、mチャネル・ダウンミックス信号Xを出力する。本実施形態では、ダウンミックス段140は、入力信号をnチャネル信号として扱う。すなわち、入力信号がmチャネル・コア信号のみを含む場合、入力信号は空/0であるn−m個の追加的チャネルをもつと考えられる。実際上、これは、占有されていないチャネルを0のシーケンスのような中立的な値によってパディングすることに相当しうる。ダウンミックス段140は、n個の入力チャネルのmチャネル線形結合を形成し、それをダウンミックス信号Xとして出力する。ダウンミックス指定はこの線形結合の利得を指定するものであり、入力信号の符号化とは独立である。すなわち、ダウンミックス段140がアクティブであるとき、ダウンミックス段140は入力信号の符号化とは独立に動作する。
【0054】
本実施形態において、オーディオ信号がパラメトリック符号化されているとき、ダウンミックス段140はmチャネル・コア信号をn−m個の空のチャネルとともに受領する。ダウンミックス指定によって指定される線形結合の利得は、オーディオ信号がパラメトリック符号化されるとき、ダウンミックス信号Xがコア信号と同じになるよう、すなわち、線形結合がコア信号を素通しにするよう、選択される。ダウンミックス段は、次のようにモデル化されうる。
【0055】
【数1】
ここで、それぞれの*記号は任意のエントリーを表わす。
【0056】
この例示的実施形態では、空間的合成段150はダウンミックス信号Xを受領する。パラメトリック・モードでは、空間的合成段150は、前記少なくとも一つの混合パラメータαを使ってダウンミックス信号Xに対してアップミックス動作を実行し、オーディオ信号のnチャネル表現Yを出力する。
【0057】
空間的合成段150は、mチャネル・ダウンミックス信号Xの時間領域表現を受領してそれに基づいてダウンミックス信号Xの周波数領域表現X
fを出力する第一の変換段151を有する。ダウンミックス信号Xの周波数領域表現X
fおよび前記少なくとも一つの混合パラメータを、アップミックス段155が受領する。アップミックス段155は、アップミックス動作を実行して、オーディオ信号のnチャネル表現の周波数領域表現Y
fを出力する。オーディオ信号のnチャネル表現Yの周波数領域表現Y
fを第二の変換段152が受領し、それに基づいて、オーディオ信号のnチャネル表現の時間領域表現Yを、空間的合成段150の出力として、出力する。
【0058】
デコード・システム100は、入力信号を受領して入力信号の遅延されたバージョンを出力する第一の遅延線120を有する。第一の遅延線120によって受ける遅延の量は、ダウンミックス段140および空間的合成段150に関連する全通過時間に対応する。
【0059】
デコード・システム100はさらに、空間的合成150段および第一の遅延線120に通信上接続されている混合器130を有する。パラメトリック・モードでは、混合器は、空間的合成段150からのオーディオ信号のnチャネル表現Yおよび第一の遅延線120からの入力信号の遅延されたバージョンを受領する。混合器130は次いでオーディオ信号のnチャネル表現Yを出力する。離散モードでは、混合器130は遅延線120からのn個の離散的にエンコードされたチャネルWの遅延されたバージョンを受領し、これを出力する。入力信号のエンコードがパラメトリック符号化とn個の離散的にエンコードされたチャネルとの間で変わるとき、混合器130は、空間的合成段出力と遅延線出力との間の遷移を出力する。
【0060】
いくつかの実施形態では、デコード・システム100はさらに、混合器130からの出力を受領し、その遅延されたバージョンを出力する第二の遅延線160を有していてもよい。第一の遅延線120および第二の遅延線160によって受ける遅延の和は、一つの時間フレームまたは時間フレーム複数個の長さに対応してもよい。
【0061】
任意的に、デコード・システム100はさらに、空間的合成段150および混合器130を、デコード・システム100によって受領されるオーディオ信号の符号化方式に基づいて、ただしメモリ内容、バッファまたは他の記憶されている情報には基づかずに制御する(有限状態機械として実装されてもよい)コントローラ170を有していてもよい。コントローラ170(または有限状態機械)は空間的合成段150および混合器130を、現在フレームにおけるオーディオ信号の符号化方式および直前のフレーム(すなわち、現在フレームのすぐ前のフレーム)における符号化に基づいて、ただしフレームの中の信号値には基づかずに、制御する。コントローラ170は、さらに、前記直前の時間フレームの(直)前の時間フレームに基づいて、空間的合成段150および混合器130を制御してもよい。コントローラ170は任意的に、ダウンミックス段140をも制御してもよい。この任意的な機能を用いて、ダウンミックス段140は、必要とされない時、たとえば、縮小パラメトリック符号化において、空間的合成段150に適合するフォーマットのコア信号が入力信号から直接的な仕方で導出できる、またさらにはコピーされることができるときには、非アクティブ化されてもよい。種々の例示的実施形態に基づくコントローラ170の動作が、表1および表2ならびに
図6および
図8を参照してさらに後述される。
【0062】
図4を参照するに、アップミックス段155は、ダウンミックス修正プロセッサ410を有していてもよい。これは、アップミックス段155のアクティブ状態において、ダウンミックス信号Xの周波数領域表現X
fを受領し、修正されたダウンミックス信号Dを出力する。修正されたダウンミックス信号Dは、ダウンミックス信号Xの周波数領域表現X
fの非線形処理によって得られてもよい。たとえば、修正されたダウンミックス信号Dは、まずダウンミックス信号Xの周波数領域表現X
fのチャネルの線形結合として新たな諸チャネルを形成し、それら新たなチャネルに諸脱相関器を通過させ、最後に脱相関されたチャネルをアーチファクト減衰にかけてから、その結果を修正されたダウンミックス信号Dとして出力することによって得られてもよい。アップミックス段155はさらに、ダウンミックス信号Xの周波数領域表現X
fおよび修正されたダウンミックス信号Dを受領し、受領されたダウンミックス信号チャネルおよび修正されたダウンミックス信号チャネルのみのnチャネル線形結合を形成し、これをオーディオ信号のnチャネル表現Yの周波数領域表現Y
fとして出力する混合行列420を有していてもよい。混合行列420は、混合行列420によって形成される線形結合の利得のうちの少なくとも一つを制御する少なくとも一つの混合パラメータαを受け容れてもよい。任意的に、ダウンミックス修正プロセッサ410は、ダウンミックス修正プロセッサ410の動作を制御しうる前記少なくとも一つの混合パラメータαを受け容れてもよい。
【0063】
図2は、本発明のある例示的実施形態に基づくエンコード・システム200をブロック図の形で示している。エンコード・システム200は、nチャネル・オーディオ信号のnチャネル表現Wを受領し、オーディオ信号をエンコードする出力信号Pを生成する。
【0064】
エンコード・システム200は、所与の時間フレームについて、オーディオ信号を、パラメトリック符号化によってまたはn個の離散的にエンコードされるチャネルによってエンコードするかどうかを決定するよう適応されている選択器230を有する。離散的符号化は典型的には、より多くの帯域幅占有を代償として、より高い知覚される聴取品質を達成することを考えると、選択器230はその符号化モードの選択を、出力信号Pの伝送のために利用可能な下流の帯域幅の瞬間的な量に基づかせるよう構成されていてもよい。
【0065】
エンコード・システム200は、オーディオ信号のnチャネル表現Wを受領し、選択器230に通信上接続されているダウンミックス段240を有する。選択器230が、オーディオ信号がパラメトリック符号化によって符号化されるべきであると決定するとき、ダウンミックス段240はダウンミックス指定に従ってダウンミックス動作を実行し、少なくとも一つの混合パラメータαを計算し、mチャネル・ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを出力する。
【0066】
エンコード・システム200はオーディオ・エンコーダ260を有する。選択器230は、スイッチ250(任意のハードウェアまたはソフトウェアによって実装される信号選択手段を象徴している)を使って、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいはダウンミックス信号X(mチャネル・ダウンミックス信号Xおよびn−m個の空/中立チャネルを含むnチャネル信号)を受領するかを制御する。あるいはまた、エンコード・システム200はさらに、ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを受領し、これらに基づいて、パラメトリック符号化によってオーディオ信号を表わす組み合わされた信号を出力する組み合わせユニット(図示せず)を有する。その場合、選択器230は、スイッチを使って、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいは前記組み合わされた信号を受領するかを制御する。組み合わせユニットはたとえばマルチプレクサであってもよい。
【0067】
オーディオ・エンコーダ260は、受領されたチャネルを個々にエンコードし、その結果を出力信号Pとして出力する。出力信号Pはたとえばビットストリームであってもよい。
【0068】
図2に示されるエンコード・システム200のある代替的な実施形態では、選択器230は、所与の時間フレームについて、オーディオ信号を、縮小パラメトリック符号化(すなわち、mチャネルのダウンミックス信号を使い、パラメトリック符号化においてアペンドされている追加のn−m個の中立チャネルは使わない)によってまたはn個の離散的にエンコードされるチャネルによってエンコードするかどうかを決定するよう適応されている。選択器230は、スイッチ250によって、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいは(いかなる追加的な中立チャネルもない)mチャネル・ダウンミックス信号Xを受領するかを選択するよう適応されている。
【0069】
図9は、本発明のある例示的実施形態に基づくエンコード・システムをブロック図の形で示している。本実施形態では、n=6、m=2である。本エンコード・システムは、それをデコード・システム100に接続する通信ネットワーク999と一緒に示されている。
【0070】
エンコード・システムは、nチャネル・オーディオ信号のnチャネル表現Wを受領し、オーディオ信号をエンコードする出力信号Pを出力する。エンコード・システムは、オーディオ信号のnチャネル表現Wを受領するダウンミックス段240を有する。ダウンミックス段240は、ダウンミックス指定に従ってダウンミックス動作を実行し、さらに、少なくとも一つの混合パラメータαを計算し、mチャネル・ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを出力する。
【0071】
エンコード・システムは、前記ダウンミックス信号および中立的な値970をもつn−m個の空のチャネルを受領する第一のオーディオ・エンコーダ261を有する。該空のチャネルは、すなわちフォーマットにおいて存在するがオーディオ信号を表現するためには使われない四つのチャネルである。これらのチャネルは中立的な値を割り当てられてもよい。第一のエンコーダ261は、受領されたチャネルを個々にエンコードし、その結果を、nチャネル中間信号として出力する。エンコード・システムはさらに、前記中間信号および前記少なくとも一つの混合パラメータαを受領し、これらに基づいて、パラメトリック符号化によってオーディオ信号を表わす組み合わされた信号を出力する組み合わせユニット980を有する。組み合わせユニットは、たとえばマルチプレクサであってもよい。
【0072】
エンコード・システムは、nチャネル・オーディオ信号のnチャネル表現Wを受領し、n個の離散的にエンコードされたチャネルを出力する第二のオーディオ・エンコーダ262を有する。
【0073】
エンコード・システムはさらに、通信ネットワーク999に通信上接続されている選択器230を有する。出力信号Pは、デコード・システム100に到達する前に該通信ネットワーク999を通じて伝送される。ネットワーク999の現在の条件(たとえば瞬間的な負荷、利用可能な帯域幅など)に基づいて、選択器230は、スイッチ950(任意のハードウェアまたはソフトウェアによって実装される信号選択手段を象徴している)を使って、エンコード・システムが、所与の時間フレームにおいて、前記組み合わされた信号または前記n個の離散的にエンコードされたチャネルのどちらを出力信号Pとして出力するかを制御する。出力信号Pはたとえばビットストリームであってもよい。
【0074】
本実施形態では、
図2との関係で述べた実施形態と比べ、ダウンミックス段240が、選択器230の決定とは独立に、アクティブであってもよい。実のところ、
図9のエンコード・システムの上および下の部分は、オーディオ信号のパラメトリック表現および離散的表現を与える。それらはこのように、出力信号Pとして使うためにどちらを選ぶかの決定に関わりなく、各所与の時間フレームにおいて形成されうるのである。
【0075】
図9に示されるエンコード・システムのあるさらなる発展では、第一のオーディオ・エンコーダ261が、n−m個の空のチャネルを含めるまたは該空のチャネルを破棄するよう動作できる。第一のオーディオ・エンコーダ261が、それらのチャネルを破棄するモードにある場合、mチャネル信号を出力する。組み合わせユニット980は先の記述と同様に機能する。すなわち、mチャネル・フォーマットのコア信号および前記少なくとも一つの混合パラメータαを含む組み合わされた信号(たとえばビットストリーム)を形成する。選択器230は、n−m個の空のチャネルを含めるか含めないかに関する限り、第一のオーディオ・エンコーダ261を制御するよう構成されていてもよい。よって、スイッチ950のアクションを考慮に入れると、このさらなる発展に基づく
図9のエンコード・システムは、三つの異なる型のビットストリームPを出力しうる。該三つの型は、上述したような離散的、パラメトリックおよび縮小パラメトリック符号化方式のそれぞれに対応する。
【0076】
図3を参照するに、エンコード・システム200内に位置されるダウンミックス段240は、オーディオ信号のnチャネル信号表現Wを受領し、(選択器230によってアクティブ化されているとき)ダウンミックス指定に従ってmチャネル・ダウンミックス信号Xを出力する。(ダウンミックス段240は、
図2を参照して先述したように混合パラメータをも出力してもよいことを注意しておくべきである。)デコード・システム100内に位置されるダウンミックス段140もmチャネル・ダウンミック信号Xを、同一のダウンミックス指定に従って出力する。しかしながら、このダウンミックス段140への入力は、オーディオ信号を、n個の離散的にエンコードされたチャネルWとして、またはパラメトリック符号化によって表現しうる。ビットストリームPがパラメトリック符号化によってオーディオ信号を表現するとき、ビットストリームPは、ダウンミックス段140を不変のまま通過し、ダウンミックス信号Xとなるコア信号を含む。パラメトリック符号化では、コア信号はnチャネル・フォーマットにおいて表現される(存在するが使われないn−m個のチャネルがある)。一方、ダウンミックス信号はmチャネル信号である。縮小パラメトリック符号化では、コア信号およびダウンミックス信号の両方がmチャネル・フォーマットであり、そのため、フォーマット変化が必要とされない。その代わり、ダウンミックス段140は非アクティブ化されてもよく、信号はダウンミックス段140と並列に配置された線を通じて空間的合成段150に供給されてもよい。
【0077】
ここで
図5を参照するに、
図1の空間的合成段150は、上流から下流の順に挙げる、以下のユニットを有していてもよい:第一の変換ユニット501、第一の変換修正器502、アップミックス段155、第二の変換修正器503および第二の変換ユニット504。
【0078】
第一の変換ユニット501は、mチャネル・ダウンミックス信号Xの時間領域表現を受領し、それを実数値の周波数領域表現に変換する。変換ユニット501は、たとえば、実数値のQMF分解バンクを利用してもよい。第一の変換修正器502は、たとえば処理が臨界サンプリングされている変換信号に対して実行される場合に現われることがあるエイリアシング効果を低減することによってデコード・システムのパフォーマンスを改善するために、この実数値の周波数領域表現を部分的に複素の周波数領域表現に変換する。ダウンミックス信号Xの複素周波数領域表現はアップミックス段155に供給される。アップミックス段155は少なくとも一つの混合パラメータαを受領し、オーディオ信号のnチャネル表現Yの周波数領域表現を出力する。混合パラメータαは、コア信号と一緒にビットストリームに含まれてもよい。第二の変換修正器503は、たとえばエイリアシングを低減するよう虚スペクトル・データに基づいて実スペクトル・データを更新することにより、この信号を修正してオーディオ信号のnチャネル表現Yの実数値の周波数領域表現にする。第二の変換ユニット504は、オーディオ信号のnチャネル表現Yの時間領域表現を、空間的合成段150の出力として出力する。
【0079】
この例示的実施形態では、各時間フレームは1536時間領域サンプルからなる。すべての処理段階が一時に一つの時間領域サンプルに対して実行されることはできないので、空間的合成段における諸ユニットは、
図5における時間軸510上で示される異なる(アルゴリズム)遅延に関連付けられていてもよい。その際受ける遅延は、第一の変換ユニット501については320サンプル、第一の変換修正器502については320サンプル、アップミックス段155については0サンプル、第二の変換修正器503については320サンプル、第二の変換ユニット504については257サンプルであってもよい。
図1を参照して先述したように、空間的合成段150のさらに下流で、デコード・システム100における両方の処理経路を遅延させる位置において、第二の遅延線160が導入されてもよい。第二の遅延線160によって受ける遅延は319サンプルと選ばれてもよい。それにより、空間的合成段150および第二の遅延線160の組み合わされた遅延は1536サンプル、すなわち時間フレーム一つぶんの長さとなる。
【0080】
表1は、デコード・システム100の(第一の型の)ある例示的実施形態の種々の部分または側面の種々の動作モードの組み合わせで、ある時間フレームにおいて生じうるものを挙げている。
図1を参照するに、入力信号がパラメトリック符号化によってオーディオ信号をエンコードしているとき、少なくとも一つの混合パラメータαが空間的合成段155によって受領される。空間的合成段150における混合パラメータの使用は側面1と称される。空間的合成段150の動作は側面2と称される。デコード・システム100全体としてのモードは側面3と称される。この例のために時間フレームはそれぞれ64サンプルからなる24個のQMFスロットに分割されているとすると、混合パラメータが使用されるそのようなスロットの数は側面4として示される。
【0081】
【表1】
この表およびのちには
図6および
図8において、R(リセット)は、空間的合成段150における重複加算(overlap-add)バッファを空にすることをいう;E(外挿)は一定の値による後方への外挿をいう;K(保持)は一定の値による前方への外挿をいう;N(通常)は相続くフレームのそれぞれの対における(最初でない)参照点について定義されている明示的な値を使ってのフレーム間補間をいう。
【0082】
エンコード・システム100によって受領される入力信号におけるオーディオ信号の符号化に依存して、表1に挙げられる諸側面は、挙げられているように動作する。本実施形態では、動作モードは、表2に挙げられるように、現在の時間フレームおよび直前の時間フレームにおける符号化方式のみに依存する。ここで、Nは現在の時間フレーム、N−1は直前の時間フレームを表わす。
【0083】
【表2】
表2によって記述されるデコード・システムの挙動は、空間的合成段150および混合器130に通信上接続され、これを制御するコントローラ170によって制御されてもよい。
【0084】
図6は、デコード・システム100が例示的な入力信号を受領するときに例示的なデコード・システム100において生じるデータ信号および制御信号を示している。
図6は、七つの時間フレーム601ないし607に分割されている。それらの時間フレームについて、符号化方式は各参照符号の下に示されている(表2の上部と同様、離散的:D;パラメトリック:P)。記号Param1、Param2、Param3は明示的な混合パラメータ値およびそのそれぞれのアンカー点を指す。アンカー点はこの例示的実施形態では時間フレームの右端の点である。
【0085】
データ信号は、
図1における丸囲みの文字AないしEによって示される位置に由来する。入力信号Aは、離散的符号化方式においては、上の部分におけるチャネルL(左)、R(右)および下の部分におけるC(中央)、Lfe(低域効果)、Ls(左サラウンド)、Rs(右サラウンド)をもつ5.1サラウンドとしてのオーディオ信号の表現であってもよい。しかしながら、パラメトリック符号化方式では、LおよびRチャネルはコア信号チャネルL0(コア左)およびR0(コア右)を伝送するために使われる。チャネルC、Lfe、LsおよびRsは存在するが、パラメトリック符号化方式において占有されておらず、よって信号は形式的には5.1フォーマットである。信号Aはオーディオ・デコーダ110によって供給されてもよい。信号Bはコア信号の周波数領域表現であり、パラメトリック・モードにおいては第一の変換段151によって出力されるが、好ましくは離散モードでは処理資源を節約するために、生成されない。信号C(信号Aにおける中央チャネルと混同しないこと)は、パラメトリック・モードにおいて空間的合成段150から受領されるアップミックスされた信号である。信号Dは入力信号Aの遅延されたバージョンである。ここで、チャネルは信号Aについてのようにグループ化されており、遅延は
図1における、空間的合成段150を含む上の処理経路における通過時間に一致する。信号Eは混合器130出力の遅延されたバージョンである。さらに、
図6は、混合器130によって信号Cに加えられる利得CxGおよび混合器130によって信号Dに加えられるDxGに関係する制御信号の時間値を半図式的に示している。明らかに、利得は区間[0,1]内の値を取り、フレーム603の間におよびフレーム606から、クロス混合遷移がある。
図6は、信号型(または信号方式)を示しつつ、信号値、主としてデータ信号の値を黙示または単に示唆するに留めている点で、抽象的である。
【0086】
図6は、左側の曲線矢印の形で、信号を隔てる遅延を注釈付けしてある。
【0087】
表1および表2に挙げた種々の動作モードについてこれから
図6を参照して述べる。
【0088】
入力信号が現在の時間フレーム602および前の時間フレーム601において離散的に符号化されているとき(表2の第一列)、デコード・システム100は離散モードになる(側面3:DM)。空間的合成段150および混合パラメータは必要とされない(側面1および2:該当せず)。混合パラメータは、今の時間フレーム602のいかなる部分でも使用されない(側面4:0)。
図6に示されるように、入力信号Aは5.1サラウンド・サウンドとしてのオーディオ信号の表現である。混合器130は、入力信号の遅延されたバージョンDを受領し、これをデコード・システム100の出力Eとして、可能性としては
図1を参照して先述したようにさらに下流の第二の遅延線160によって遅延させて、出力する。
【0089】
入力信号が現在の時間フレーム606において離散的に符号化されており、前の時間フレーム605においてパラメトリック符号化されているとき(表2の第二列)、デコード・システム100はパラメトリック・モードから離散モードに遷移する(側面3:PM→DM)。ここでもまた、ダウンミックス指定によって制御可能なダウンミックス段140の属性のおかげで、パラメトリックから離散へのモード遷移にわたるすべての時点において、安定したコア信号を得ることが可能であり、モード遷移はほぼ気づかれない仕方で実行できる。空間的合成段150は前の時間フレームに関連付けられた混合パラメータを受け取っている。これらは現在の時間フレームの間保持される(側面1:K)。フレーム間補間のための第二の参照値のはたらきをすることができる、受領される新たな混合パラメータがないことがありうるからである。空間的合成段150は、入力信号Aとしてエンコード・システム100によって受領されたパラメトリック符号化された信号のコア信号であることから、離散的に符号化された入力信号Aのダウンミックス信号であることに遷移する信号を受領する。空間的合成段は150は前の時間フレーム605からの通常動作を現在の時間フレーム606の間、続ける(側面2:N)。混合パラメータは時間フレーム全体の間、使用される(側面4:24)。現在の時間フレーム606の間、混合器130は、空間的分解段150から受領されるアップミックスされた信号Cを出力することから、入力信号の遅延されたバージョンDを出力することに遷移する。結果として、デコード・システム100の出力Eは(第二の遅延線160によって受ける319サンプルの遅延のため次の時間フレーム607の間に)、ダウンミックスされた信号をパラメトリックにアップミックスすることによって生成される、オーディオ信号の再構成されたバージョンから、n個の離散的にエンコードされたチャネルによってオーディオ信号を表わす真のマルチチャネル信号に遷移する。
【0090】
入力信号が現在の時間フレーム603においてパラメトリック符号化されており、前の時間フレーム602において離散的に符号化されているとき(表2の第三列)、デコード・システム100は離散モードからパラメトリック・モードに遷移する(側面3:DM→PM)。この時間フレーム603が示すように、たとえ原理的にはコア信号と離散的に符号化されたチャネルとの共存がないとしても、入力信号における(パラメトリック符号化と離散的符号化の間の)方式変化に関連したいかなる不連続も緩和されるか完全に回避される。システムは、遷移を通じて安定したコア信号へのアクセスをもつからである。空間的合成段150は、フレームの終わりに現在の時間フレーム603に関連する混合パラメータを受領する。前の時間フレーム602のために利用可能な混合パラメータがないので、新しいパラメータは後ろ向きに時間フレーム603全体に外挿され(側面1;E)、空間的合成段150によって使用される。空間的合成段150は前の時間フレーム602ではアクティブではなかったので、空間的合成段150は現在の時間フレーム603を、リセットによって始める(側面2:R)。混合パラメータは、時間フレーム全体の間、使用される(側面4:24)。信号Cの「DC」(don't care[どうでもよい])と記される部分は、利得CxGが0なので、出力には寄与しない;「外挿」と記される部分は、外挿された混合パラメータ値を使って空間的合成段150において生成される;「OK」と記される部分は通常の仕方で、明示的な値の間のフレーム間補間によって得られた瞬間的な混合パラメータを使って生成される;部分「Keep1」は、(最新のパラメトリック符号化された時間フレーム605からの)最新の明示的な混合パラメータ値を維持し、それに空間的合成段150の定量的属性を制御させることによって生成される。時間フレーム603は、そのような外挿が行なわれるほんの一例である。よって、現在の時間フレーム603の間に、混合器130は入力信号の遅延されたバージョンCの出力から、空間的分解段150から受領されたアップミックス信号Cを出力することに遷移する。結果として、デコード・システム100の出力Eは(第二の遅延線160によって受ける319サンプルの遅延のため次の時間フレーム604の間に)、n個の離散的にエンコードされたチャネルによってオーディオ信号を表わす真のマルチチャネル信号から、ダウンミックスされた信号をアップミックスすることによって生成される、オーディオ信号の再構成されたバージョンに遷移する。
【0091】
入力信号が現在の時間フレーム605および前の時間フレーム604においてパラメトリック符号化されているとき(表2の第四列)、デコード・システム100はパラメトリック・モードにある(側面3:PM)。空間的合成段150は、混合パラメータの、前の時間フレームに関連付けられた値を受領しており、混合パラメータの、現在の時間フレームに関連付けられた値も受領し、通常のフレームごとの補間を可能にする。該補間は、アップミックスの際に適用される利得などを制御する瞬間的な混合パラメータ値を与える。これで
図5、
図6、表1および表2に関係した議論を終わる。
【0092】
ここで、
図7を参照するに、あるさらなる例示的実施形態に基づく、ハイブリッド・フィルタバンクを有するデコード・システム100の詳細が示されている。いくつかのアプリケーションでは、ハイブリッド・フィルタバンクの向上した分解能が有益であることがある。
図7によれば、空間的合成段150における第一の変換段151は、(QWFフィルタバンクのような)時間から周波数への変換ユニット701を有し、それに実から複素への変換ユニット702およびハイブリッド分解ユニット705が続く。第一の変換段151の下流には、アップミックス段155があり、それに第二の変換段152が続く。第二の変換段152は、ハイブリッド合成ユニット706、実から複素への変換ユニット703および周波数から時間への変換ユニット704がこの順で配列されて続く。それぞれの通過時間(サンプル単位)は破線710の下に示されている。通過時間0というのは、アルゴリズム遅延が0であるサンプルごとの処理として理解される。実際の通過時間は十分な計算パワーを割り当てることによって任意に小さくできる。ハイブリッド分解および合成段705、706の存在は、上記の例示的実施形態との関係で、有意な相違をなす。本実施形態では、分解能はより高いが、遅延はより長くなり、コントローラ170(または有限状態機械)は、エンコード・システム100を制御する場合に、(下記で表4に示されるような)より複雑な状態構造を扱う必要がある。表3が示すように、これらのユニットの利用可能な動作モードは上記の場合と同様である。
【0093】
【表3】
さらなる説明については、表1およびその後の議論が参照される。(側面4における)新しいフラッシュ(flush)・モードは、パラメトリックnチャネル出力から離散的nチャネル出力への時間領域のクロスフェードを可能にする。
【0094】
下記の表4に示されるように、本例示的実施形態に基づくデコード・システム100は、コントローラ170(または有限状態機械)によって制御可能である。該コントローラ170(または有限状態機械)の状態は、現在の時間フレームの前に受領された二つの時間フレームにおける符号化方式(離散的またはパラメトリック)の組み合わせによって決定される。表2と同じ記法を使って、コントローラ(または有限状態機械)は次のようにプログラムされうる。
【0095】
【表4】
表4のプログラミング・スキームの適用は
図8に例解されている。
図8は、
図1の丸囲みの文字AないしDによって示される位置で観察されるデータ信号AないしDを、七つの相続く時間フレーム801ないし807にわたる時間の関数として視覚化するものである。
【0096】
図6における離散的復号モード、パラメトリック復号モードおよび離散からパラメトリックへの遷移に関係する上記の議論は、適宜調整して、
図8に示される状況にも当てはまる。一つの注目すべき相違は、本実施形態におけるパラメトリック復号計算におけるより大きなアルゴリズム遅延(1217サンプルでなく1536サンプル)に起因する。1536サンプルより多くのアルゴリズム遅延をもつデコード・システムでは、パラメトリックから離散への遷移は、一つの追加的な時間フレームを占有する。よって、さらなる時間フレーム(の一部)についての信号Cを提供するためには、クロスフェードが行なわれうるよう、最新の受領された明示的な混合パラメータ値が、「Keep1」「Keep2」によって示されるように、二つの時間フレームにわたって前方に外挿される必要があることがある。結論として、引き続きアルゴリズム遅延が1536サンプルまたはフレーム全体を超えるデコード・システムを参照するに、パラメトリックから離散的復号モードへの遷移は、パラメトリック・エピソードから離散エピソードへの入力信号における符号化方式変化によってトリガーされる。ここで、最新の明示的な混合パラメータ値が、関連付けられた時間フレーム後の二つのフレームの末尾まで前方に外挿される(保持される)。ここで、デコード・システムは、第一の受領された離散的に符号化された時間フレーム後の第二の時間フレームにおいて離散モードにはいる。
【0097】
ここで、
図5のような一般的構造をもつ空間的合成段をもつ(よって
図6に示されるのと同じアルゴリズム遅延値をもつ)が、縮小パラメトリック方式にある入力信号を処理する能力をもつデコード・システムについて述べる。縮小パラメトリック符号化方式の属性は、パラメトリックおよび離散的符号化方式に対する差を含めて上記で概説した。
【0098】
ここで考えられるデコード・システムでは、ダウンミックス段140の動作を制御する追加的な責務をもつコントローラ170が提供される。
図1では、このことは、コントローラ170からダウンミックス段140への破線矢印によって示唆されている。本デコード・システムは、
図11に示される機能的構造に従って編成されると言われてもよい。ここで、システムへの入力信号はオーディオ・デコーダ110およびコントローラ170の両方に供給される。コントローラ170は、入力信号の検出された符号化方式に基づいて、混合器130およびパラメトリック・マルチチャネル・デコーダ1100のそれぞれを制御するよう構成される。該パラメトリック・マルチチャネル・デコーダ1100内に、ダウンミックス段(
図11には示さず)および空間的合成段(
図11には示さず)が含まれる。混合器130は、パラメトリック・マルチチャネル・デコーダ1100からおよび第一の遅延線120から入力を受け取る。パラメトリック・マルチチャネル・デコーダ1100および第一の遅延線120のそれぞれは、その処理を、入力信号からオーディオ・デコーダ110によって抽出されたデータに基づかせる。デコード・システムが縮小パラメトリック符号化方式から裨益するために、コントローラ170は、パラメトリック・マルチチャネル・デコーダ1100におけるダウンミックス段を非アクティブ化するために動作可能である。好ましくは、ダウンミックス段は、入力信号が、空間的合成段に供給されるべきコア信号が(通常のパラメトリック・モードにおけるようなnチャネル・フォーマットでなく)mチャネル・フォーマットで表わされる縮小パラメトリック方式にあるときには、非アクティブ化される。たとえ前記のようにコア信号を表わすnチャネル・フォーマットのそれらの信号がダウンミックス段を不変のまま通過するとしても、コア信号が、nチャネル・フォーマットとmチャネル・フォーマットの間の変換の必要なしに空間的合成段に直接供給されることができるという事実は、計算資源の潜在的な節約を含意する。
【0099】
コントローラ170は、ダウンミックス段140を制御するようにも適応されるので、デコード・システムにおける利用可能なモードの表は、上記の表1に対して拡張される。
【0100】
【表5】
側面2におけるR(リセット)およびN(通常)は先に定義されている。新しいNDB(通常、ダウンミックスはバイパスされる)モードでは、ダウンミックス段140が非アクティブ化され、コア信号は、チャネル数の変更を伴うフォーマット変換なしに、空間的合成段150に供給される
コントローラ170の状態は、相変わらず、現在および直前の時間フレームにおける符号化方式の組み合わせによって一意的に決定される。この新しい符号化方式の存在は、表2に比べ、FSMプログラミング表のサイズを増大させる。
【0101】
【表6】
表6は、二つの場合(D,rP)および(rP,D)は扱っていない。これらは、この例示的実施形態に基づくシステムの障害状態以外では起こらないと期待される。いくつかの実装はさらに、第四列で言及されている場合(P,P)も除外してもよい。入力信号をできるだけ早くrP方式に切り換えさせることがより経済的でありうるからである。しかしながら、エンコーダが非常に高速な切り換えのために構成されている場合、二つの離散的に符号化されたエピソードが、非常に少数の、他の符号化方式に属する時間フレームによって隔てられることがあり、(P,P)を通常の場合として受け容れることが必要になることがある。異なる言い方をすれば、非常に短いパラメトリック・エピソードは、なめらかな切り換えを達成するために必要な部分によって占められることがあり、エンコード・システムが縮小パラメトリック符号化モードにはいるために時間がないほどであることがある。
【0102】
図10を参照するに、デコード・システムは、時間フレーム1001においては表6の第一または第二列に対応するモードにあり;時間フレーム1002では第一列に対応するモードにあり;時間フレーム1003では第三列に対応するモードにあり;時間フレーム1004では第七列に対応するモードにあり;時間フレーム1005では第五列に対応するモードにあり;時間フレーム1006では第二列に対応するモードにあり;時間フレーム1007では第一列に対応するモードにある。この例においては、時間フレーム1004は、受領される入力信号が縮小パラメトリック方式にある唯一の時間フレームであるが、より現実的な例では、縮小パラメトリック符号化方式にある時間フレームのエピソードは典型的にはもっと長く、その端点における、比較的より少数のパラメトリック符号化された時間フレームよりも多数の時間フレームを占める。この型のより現実的な例は、表6の第六列に対応する二つの相続くrP,rP符号化された時間フレームの受領に応答してデコード・システムがはいるモードを示すことになろう。だが、その表における第六列および第七列は、側面1〜4に関する限り、違いはないので、当業者は、
図10および上記の議論を研究することによって、そのような時間フレームにおけるデコード・システムの望ましい挙動を理解し、実装することができるであろうと考えられる。
【0103】
締めくくりとして、表5〜表6および
図10は、表3〜表4および
図7〜
図8を出発点として用いても同じくらいよく導出できたはずであることを注意しておく。実際、そこに示されるデコード・システムはより大きなアルゴリズム遅延に関わるものの、縮小パラメトリック符号化方式において入力信号を受領し、処理する能力は、実質的には、上記と同じ仕方で実装されうる。しかしながら、アルゴリズム遅延が一時間フレームを超える場合には、デコード・システムにおけるコントローラ170の状態は、現在の時間フレームおよび二つの前の時間フレームにおける符号化方式によって決定されることになる。可能なコントローラ状態の総数は3
3=27であるが、これらのうちのかなりの数((rP,D)または(D,rP)を含む任意の三フレームのシーケンスを含む)は、エンコード側の障害の結果として出現するだけであろうから、考慮から除外されてもよい。この最後の陳述は、主として上記の例示的実施形態に当てはまるのであって、本発明のそのような本質的な限定に関するものではないことを強調しておく。実際、縮小パラメトリックおよび離散的(および可能性としてはパラメトリック)時間フレームの任意のシーケンスに基づくオーディオ信号を再構成できる実施形態が、
図12の記述のあとで、下記で論じられる。
【0104】
図12は、
図1のデコード・システム100または同様のデコード・システムの一部をなすオーディオ・デコーダ110の可能な実装を示している。オーディオ・デコーダ110は、入来ビットストリームPに基づいて入力信号W、Xの時間領域表現を出力するよう適応されている。この目的のため、デマルチプレクサ111はビットストリームPから、入力信号W、Xにおける各チャネルに関連付けられているチャネル・サブストリーム(そのそれぞれは入力信号におけるあるチャネルの周波数領域表現と見なされてもよい)を抽出する。それぞれのチャネル・サブストリームは、可能性としては追加的な処理のあとに、複数のチャネル・デコーダ113に供給される。チャネル・デコーダは、入力信号のチャネルL、R、……のそれぞれを与える。チャネル・デコーダ113のそれぞれは好ましくは、現在の時点において重なる少なくとも二つの窓からの寄与を合計することによって、関連付けられたチャネルの時間値を与える。これは、多くのフーリエ関係の変換、特にMDCTについて成り立つ。たとえば、一つの変換窓は、512サンプルと等価であってもよい。チャネル・デコーダ113の内部の動作は、図の下部に示されている。これは、逆変換部115を有し、それに重複加算部116が続く。いくつかの実装では、逆変換部115は、逆MDCTを実行するよう構成されていてもよい。N−1、NおよびN+1とラベル付けされた三つのプロットは、三つの相続く変換窓についての逆変換部115からの出力信号を視覚化している。(N−1)番目およびN番目の変換窓が重なる時間期間では、重複加算部116は、(N−1)番目およびN番目の変換窓内の逆変換された値を加算することによって、当該チャネルの時間値を形成する。その後の時間期間においては、同様に、N番目および(N+1)番目の変換窓に関する逆変換された値を加算することによって、当該チャネル信号の時間値が得られる。明らかに、(N−1)番目およびN番目の変換窓は、時間フレーム境界近傍の入力信号の異なる時間フレームに由来する。
図12の主たる部分に戻ると、チャネル・デコーダ113の下流に位置する組み合わせユニット114は、諸チャネルを、その後の処理に好適な仕方で、たとえば各時間フレームがその時間フレーム内のすべてのチャネルを再構成するための必要なデータを含むよう時間フレームを形成することによって、組み合わせる。
【0105】
先述したように、オーディオ信号は、(b)パラメトリック符号化によってまたは(a)n個の離散的にエンコードされたチャネルWとして(n>m)、表現されうる。パラメトリック符号化では、オーディオ信号を表わすためにm個の信号が使われるが、nチャネル・フォーマットが使われる。そのため、上記で説明したように、n−m個の信号は情報を担持しないまたは中立的な値を割り当てられてもよい。例示的実装では、これは、前記チャネル・サブストリームのうちn−m個が中立的な信号値を表わすことを含意しうる。不使用チャネルにおいて中立的な信号値が受領されるという事実は、パラメトリック符号化から離散的符号化へのまたはその逆の符号化方式変化との関連で有益である。そのような符号化方式変化の近傍では、異なる符号化方式をもつフレームに属する二つの変換窓が重なり合い、当該チャネルの時間表現に寄与する。しかしながら、中立的な値の存在のおかげにより、それらの寄与を合計する動作は相変わらずよく定義されていることになる。
【0106】
いくつかの例示的実施形態では、デコード・システム100はさらに、(c)縮小パラメトリック符号化されている入力信号の時間フレームを受領するよう適応される。ここで、入力信号はmチャネル・フォーマットにある。これは、パラメトリック符号化方式において中立的な値を担持するn−m個のチャネルが完全に不在であることを意味する。符号化方式変化を横断してもチャネル・デコーダ113のなめらかな機能を保証するために、前記チャネル・デコーダ113のうち少なくともn−m個のチャネル・デコーダには、
図12の下部に詳細に示される前処理器112が先行する。前処理器112は、中立的な値(「0」と表わされている)をエンコードするチャネル・サブストリームを生成するよう動作可能である。前処理器は、素通しモードと中立的な値が出力されるモードとの間で切り替え可能な選択器によって記号的に示されている。入力信号W、Xの対応するチャネルは、符号化方式変化の少なくとも一方の側において中立的な値を含むことになる。
【0107】
前処理器112は、デコード・システム100内のコントローラ170によって制御可能であってもよい。たとえば、前処理器112は、(b)離散的符号化と(c)縮小パラメトリック符号化との間の、中間のパラメトリック符号化された時間フレームがないそのような方式変化においてアクティブ化されてもよい。入力信号W、Xは、離散的エピソードに隣接する時間フレームにおいてダウンミックス段140に供給されるので、そのような状況では、入力信号が十分に安定していることが必要である。これを達成するために、コントローラ170は、前処理器112およびダウンミックス段140をアクティブ化することによってこの型の検出される方式変化に応答する。これらの前処理器112の集団的なアクションは、入力信号にn−m個のチャネルをアペンドすることである。抽象的な観点からは、これらの前処理器112は、mチャネル・フォーマットからnチャネル・フォーマットへの(たとえば、ドルビー・デジタル・プラスの枠組みではacmod2からacmod7への)フォーマット変換を達成する。
【0108】
図12を参照して上述したオーディオ・デコーダ110は、縮小パラメトリック符号化から離散的符号化へのおよびその逆の方式変化をまたいでも安定した入力信号を――よって安定したダウンミックス信号を――供給することを可能にする。実際、
図5および
図7に詳細を描いたデコード・システムは、上記の特性をもつオーディオ・デコーダを備えてもよい。すると、これらのシステムは、それぞれ
図6および
図8に従って動作することにより、
D D D rP rP … rP D D D
の型の時間フレーム・シーケンスを扱うことができるようになる。
【0109】
特に
図6に目を転じると、時間フレーム603、604および605の符号化領域が縮小パラメトリック(rP)になる。時間フレーム603では、信号をnチャネル・フォーマットにフォーマットし直してダウンミックス段140が方式変化(L、RからL0、R0)を横断して中断なく動作するようにするために、オーディオ・デコーダ110における前記少なくとも一つの前処理器112がアクティブ化される。好ましくは、前処理器は、時間フレーム603の、異なる符号化方式に属する変換窓が重なると期待される時間区間に対応する初期部分の間のみアクティブである。時間フレーム604では、フォーマットし直すことは必要ではないが、入力信号Aが空間的合成段151の入力側に直接回送されてもよく、ダウンミックス段140は一時的に非アクティブ化されることができる。しかしながら、時間フレーム605は、縮小パラメトリック・エピソードにおける最後のものであり、その第二の端点を次のフレーム内にもつ少なくとも一つの変換窓を含んでいるので、オーディオ・デコーダ110は、フォーマットし直すモード(前処理器112がアクティブ)に設定される。すると、時間フレーム606では、ダウンミックス段140がアクティブ化されており、この時間フレーム606の先頭における入力信号Aのコンテンツの変化は、ダウンミックス段140にとって気づかれなくなる。ダウンミックス段140は代わりに、コンテンツ変化を横断した不連続なダウンミックス信号Xを与えることになる。ここでもまた、前処理器112は時間フレーム605の最後の部分の間にのみアクティブであることが十分であり、実際それが好ましい。該最後の部分は、第一の離散的に符号化された時間フレーム606の第一の変換窓と重なる変換窓の先頭が位置している部分である。
【0110】
時間フレーム803、804および805において縮小パラメトリック符号化されたデータ(rP)が受領される
図8の同様の変形も可能である。好適には、前段および他所で述べた理由により、オーディオ・デコーダ110のフォーマット変換機能は時間フレーム803(の始まり)および時間フレーム805(の終わり)においてアクティブであり、それによりデコーダは、二つの方式変化をまたいですべての時点においてダウンミックス段140に均質で安定した信号を供給しうる。この例示的な実施形態はハイブリッド・フィルタバンクを有することが想起されるが、この事実はオーディオ・デコーダ110の動作には格別な意義はない。たとえば混合パラメータαが外挿される必要がある期間とは異なり、信号コンテンツの変化から生じる潜在的な信号不連続の継続時間は、システムにおけるアルゴリズム遅延とは独立であり、システムを通る途上、時間的に局在化されたままである。換言すれば、
図6に比べて
図8に示される例示的実施形態においてより長い時間期間にわたって前処理器112を動作させる必要はない。
【0111】
〈III.等価物、拡張、代替その他〉
上記の記述を研究したあとでは、当業者には本発明のさらなる実施形態が明白となるであろう。本稿および図面が実施形態および例を開示しているとはいえ、本発明はそうした個別的な例に制約されるものではない。付属の請求項によって定義される本発明の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
【0112】
上記に開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述において言及される機能ユニット間のタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働していくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたは全部のコンポーネントがデジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてもしくは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアはコンピュータ可読媒体上で配信されてもよい。コンピュータ可読媒体は、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含みうる。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータといった情報の記憶のための任意の方法または技術で実装された、揮発性および不揮発性、リムーバブルおよび非リムーバブルな媒体をいずれも含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは所望される情報を記憶するために使用できコンピュータによってアクセスされることができる他の任意の媒体を含むがそれに限られない。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現するものであり、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
nチャネル・オーディオ信号を再構成するデコード・システムであって、当該デコード・システムは、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
a)少なくとも一つの混合パラメータを使うパラメトリック符号化;および
b)n個の別々にエンコードされるチャネルを使う離散的符号化
を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領するよう適応されており、
当該デコード・システムは、前記n個の別々にエンコードされるチャネルに基づいてまたは空間的合成によって前記オーディオ信号を導出するよう動作可能であり、
当該デコード・システムは:
ダウンミックス指定に従って、前記入力信号に基づいてmチャネル・ダウンミックス信号を出力するよう動作可能なダウンミックス段であって、n>m≧1である、ダウンミックス段と;
前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有しており、
前記ダウンミックス段は、離散的符号化された時間フレームの各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいてアクティブである、
デコード・システム。
〔態様2〕
前記ビットストリームに基づいて前記入力信号を出力するよう適応されたオーディオ・デコーダをさらに有しており、前記オーディオ・デコーダは、重複変換窓を使う時間から周波数への変換を実行するよう適応されている、態様1記載のデコード・システム。
〔態様3〕
前記時間フレームのそれぞれが前記変換窓のうちの少なくとも一つの長さの半分と等価である、態様2記載のデコード・システム。
〔態様4〕
前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてアクティブであるよう適応されている、態様1ないし3のうちいずれか一項記載のデコード・システム。
〔態様5〕
当該デコード・システムが、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなmチャネル・コア信号を、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて含む入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし4のうちいずれか一項記載のデコード・システム。
〔態様6〕
前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて、前記オーディオ信号のパラメトリック符号化表現の前記コア信号を前記ダウンミックス信号として再生することによって前記ダウンミックス信号を生成するよう適応されている、態様5記載のデコード・システム。
〔態様7〕
当該デコード・システムが、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてnチャネル信号である入力信号をエンコードするビットストリームを受領するよう適応されており、前記nチャネル信号においてn−m個のチャネルは前記オーディオ信号を表現するために使われない、態様1ないし6のうちいずれか一項記載のデコード・システム。
〔態様8〕
前記入力信号を受領するよう適応された第一の遅延線;および
前記空間的合成段および前記第一の遅延線に通信上接続された混合器をさらに有する、態様1ないし7のうちいずれか一項記載のデコード・システムであって、
前記混合器は、当該システムのパラメトリック・モードでは、前記空間的合成段の出力またはそれから導出される信号を出力し;
当該システムの離散モードでは、前記第一の遅延線の出力を出力し;
前記入力信号において生起するパラメトリック符号化と離散的符号化との間の変化に応答して、前記空間的合成段の出力と前記第一の遅延線の出力との間の混合遷移を出力するよう適応されている、
デコード・システム。
〔態様9〕
前記第一の遅延線が、前記ダウンミックス段および前記空間的合成段に付随する全通過時間に対応する遅延を受けるよう動作可能である、態様8記載のデコード・システム。
〔態様10〕
前記混合器の出力を受領するよう適応された第二の遅延線(160)をさらに有し、前記第一および第二の遅延線によって受ける全遅延が一つの時間フレームの長さの倍数に対応する、態様9記載のデコード・システム。
〔態様11〕
前記空間的合成段は、パラメトリック符号化または該当するなら縮小パラメトリック符号化における前記入力信号が、当該時間フレームにおける最初でない点についての明示的な混合パラメータ値を定義しているような相続く時間フレームどうしの間の補間によって得られる混合パラメータ値を適用するよう適応されている、態様1ないし10のうちいずれか一項記載のデコード・システム。
〔態様12〕
前記空間的合成段は、現在時間フレームが、各時間フレームがパラメトリック符号化されているまたは該当するなら縮小パラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も早い明示的な混合パラメータ値を現在の時間フレームの先頭まで後ろ向きに外挿することを含む離散からパラメトリックへの遷移を開始するよう適応されている、態様11記載のデコード・システム。
〔態様13〕
前記空間的合成段は、現在時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も遅い明示的な混合パラメータ値を少なくとも現在の時間フレームの終わりまで前向きに外挿することを含むパラメトリックから離散への遷移を開始するよう適応されている、態様11または12記載のデコード・システム。
〔態様14〕
前記空間的合成段が:
前記mチャネル・ダウンミックス信号の時間領域表現を受領してそれに基づいて前記ダウンミックス信号の周波数領域表現を出力するよう適応された第一の変換段と;
前記ダウンミックス信号の前記周波数領域表現および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号の前記nチャネル表現の周波数領域表現を出力するよう適応されているアップミックス段と;
前記オーディオ信号の前記nチャネル表現の前記周波数領域表現を受領し、それに基づいて、前記オーディオ信号の前記nチャネル表現の時間領域表現を、前記空間的合成段の出力として出力するよう適応されている、第二の変換段とを有する、
態様1ないし13のうちいずれか一項記載のデコード・システム。
〔態様15〕
前記アップミックス段が、前記ダウンミックス信号の前記mチャネル周波数領域表現におけるチャネルを含む線形結合を形成し、これを前記オーディオ信号の前記nチャネル表現の前記周波数領域表現として出力するよう適応されており、前記少なくとも一つの混合パラメータは、前記線形結合における前記ダウンミックス信号の前記mチャネル周波数領域表現における少なくとも一つのチャネルに関係する少なくとも一つの利得を制御する、態様14記載のデコード・システム。
〔態様16〕
前記ダウンミックス段が、前記入力信号の時間領域表現のチャネルの線形結合を形成するよう適応されている、態様1ないし15のうちいずれか一項記載のデコード・システム。
〔態様17〕
前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび前の時間フレームの符号化方式に基づいて制御するコントローラをさらに有する、態様1ないし16のうちいずれか一項記載のデコード・システム。
〔態様18〕
前記コントローラが、前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび二つの前の時間フレームの符号化方式に基づいて制御する、態様17記載のデコード・システム。
〔態様19〕
符号化方式の前記群がさらに、
c)縮小パラメトリック符号化
を含み、当該デコード・システムは、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなものであるmチャネル・コア信号の形を、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてもつ入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし18のうちいずれか一項記載のデコード・システム。
〔態様20〕
前記空間的合成段が、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号および前記少なくとも一つの混合パラメータに基づいて前記オーディオ信号の前記nチャネル表現を出力するよう動作可能である、態様19記載のデコード・システム。
〔態様21〕
前記入力信号のパラメトリック符号化された時間フレームの直後の前記入力信号の各時間フレームが縮小パラメトリック符号化または離散的符号化によって符号化されるフォーマットにおいて前記ビットストリームを受領するよう適応されている、態様19または20記載のデコード・システム。
〔態様22〕
前記入力信号の離散的符号化された時間フレームの直前の前記入力信号の各時間フレームが離散的符号化またはパラメトリック符号化によって符号化され、前記入力信号の離散的符号化された時間フレームの直後の前記入力信号の各時間フレームが離散的符号化またはパラメトリック符号化によって符号化されるフォーマットにおいて前記ビットストリームを受領するよう適応されている、態様1ないし21のうちいずれか一項記載のデコード・システム。
〔態様23〕
nチャネル・オーディオ信号を再構成する方法であって、当該方法は、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
a)少なくとも一つの混合パラメータを使うパラメトリック符号化;および
b)n個の別々にエンコードされるチャネルを使う離散的符号化
を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領する段階と;
現在の時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることまたは現在の時間フレームが、離散的符号化された時間フレームのエピソード後の最初の時間フレームであることに応答して、ダウンミックス指定に従って、前記入力信号に基づいてmチャネル・ダウンミックス信号を生成する段階であって、n>m≧1である、段階と;
前記入力信号が現在および二つの前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および二つの前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
方法。
〔態様24〕
前記入力信号が現在および前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
態様23記載の方法。
〔態様25〕
パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、
現在時間フレームが、パラメトリック符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、前記少なくとも一つの混合パラメータの受領された値を現在の時間フレームの先頭まで後ろ向きに外挿する段階をさらに含む、
態様23または24記載の方法。
〔態様26〕
前記入力信号が現在の時間フレームにおいて離散的符号化されており、前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記ダウンミックス信号に基づきかつ前記少なくとも一つの混合パラメータの、前記前の時間フレームに関連付けられている少なくとも一つの値に基づき、前記オーディオ信号のnチャネル表現を生成し、現在の時間フレームの間に、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出することに遷移する段階をさらに含む、態様23ないし25のうちいずれか一項記載の方法。
〔態様27〕
時間フレームにセグメント分割されたnチャネル・オーディオ信号をエンコードするエンコード・システムであって、当該エンコード・システムは、
a)パラメトリック符号化および
b)n個の別々にエンコードされるチャネルを使う離散的符号化
を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、前記オーディオ信号を表わすビットストリーム(P)を出力するよう適応されており、
当該エンコード・システムは:
所与の時間フレームについて、どのエンコード方式が前記オーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;
前記オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なパラメトリック分解段とを有しており、前記mチャネル・コア信号および少なくとも一つの混合パラメータは、パラメトリック符号化方式における前記出力ビットストリームによってエンコードされ、n>m≧1である、
エンコード・システム。
〔態様28〕
符号化方式の前記群がさらに、
c)縮小パラメトリック符号化
を含み、前記パラメトリック符号化方式および前記離散的符号化方式においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化方式においてはmチャネル信号フォーマットが使われる、
態様27記載のエンコード・システム。
〔態様29〕
前記選択器が、パラメトリック符号化された時間フレームが直前にある時間フレームにおいて、縮小パラメトリック符号化または離散的符号化によって前記オーディオ信号を表現するよう選択するよう適応されている、態様28記載のエンコード・システム。
〔態様30〕
前記選択器が:
離散的符号化された時間フレームが直前にある時間フレームにおいて、離散的符号化によってまたはパラメトリック符号化によって前記オーディオ信号を表現するよう選択し:
離散的符号化された時間フレームの直後の時間フレームにおいて、離散的符号化によってまたはパラメトリック符号化によって前記オーディオ信号を表現するよう選択するよう適応されている、
態様27ないし29のうちいずれか一項記載のエンコード・システム。
〔態様31〕
態様27ないし30のうちいずれか一項記載のエンコード・システムおよび態様1ないし22のうちいずれか一項記載のデコード・システムを有するオーディオ配信システムであって、前記エンコード・システムおよび前記デコード・システムは通信上接続されており、前記エンコード・システムおよび前記デコード・システムのそれぞれのダウンミックス指定は等価である、オーディオ配信システム。
〔態様32〕
nチャネル・オーディオ信号をビットストリームとしてエンコードする方法であって:
前記オーディオ信号のnチャネル表現を受領する段階と;
a)パラメトリック符号化および
b)n個の別々にエンコードされるチャネルを使う離散的符号化
を含む群から、所与の時間フレームにおいて、どの符号化方式を前記オーディオ信号を表現するために使うかを選択する段階と;
パラメトリック符号化によって前記オーディオ信号をエンコードするとの決定に応答して、前記オーディオ信号の前記nチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成する段階であって、n>m≧1である、段階と;
離散的符号化によって前記オーディオ信号をエンコードするとの決定に応答して、n個の別々にエンコードされる信号によって前記オーディオ信号をエンコードするビットストリームを出力する段階とを含む、
方法。
〔態様33〕
態様23ないし26および32のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様34〕
n=6かつm=2である、態様1ないし33のうちいずれか一項記載の装置または方法。