特許第6321181号(P6321181)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧 ▶ ドルビー・インターナショナル・アーベーの特許一覧

<>
  • 特許6321181-オーディオ・コーデックのシステム側面 図000035
  • 特許6321181-オーディオ・コーデックのシステム側面 図000036
  • 特許6321181-オーディオ・コーデックのシステム側面 図000037
  • 特許6321181-オーディオ・コーデックのシステム側面 図000038
  • 特許6321181-オーディオ・コーデックのシステム側面 図000039
  • 特許6321181-オーディオ・コーデックのシステム側面 図000040
  • 特許6321181-オーディオ・コーデックのシステム側面 図000041
  • 特許6321181-オーディオ・コーデックのシステム側面 図000042
  • 特許6321181-オーディオ・コーデックのシステム側面 図000043
  • 特許6321181-オーディオ・コーデックのシステム側面 図000044
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6321181
(24)【登録日】2018年4月13日
(45)【発行日】2018年5月9日
(54)【発明の名称】オーディオ・コーデックのシステム側面
(51)【国際特許分類】
   G10L 19/00 20130101AFI20180423BHJP
【FI】
   G10L19/00 400Z
【請求項の数】15
【全頁数】63
(21)【出願番号】特願2016-542054(P2016-542054)
(86)(22)【出願日】2014年9月10日
(65)【公表番号】特表2016-536649(P2016-536649A)
(43)【公表日】2016年11月24日
(86)【国際出願番号】US2014054899
(87)【国際公開番号】WO2015038578
(87)【国際公開日】20150319
【審査請求日】2016年3月9日
(31)【優先権主張番号】61/877,155
(32)【優先日】2013年9月12日
(33)【優先権主張国】US
(31)【優先権主張番号】61/985,879
(32)【優先日】2014年4月29日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(73)【特許権者】
【識別番号】510185767
【氏名又は名称】ドルビー・インターナショナル・アーベー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】グロエシェル,アレクサンダー
(72)【発明者】
【氏名】ポップ,イェンス
(72)【発明者】
【氏名】ヴォルタース,マルティン
(72)【発明者】
【氏名】リードミラー,ジェフリー
(72)【発明者】
【氏名】ワード,マイケル
(72)【発明者】
【氏名】ローエデン,カール ヨナス
(72)【発明者】
【氏名】ホーリッヒ,ホルガー
(72)【発明者】
【氏名】リンツマイアー,カルステン
(72)【発明者】
【氏名】フリードリッヒ,トビアス
【審査官】 上田 雄
(56)【参考文献】
【文献】 特開昭52−040012(JP,A)
【文献】 特開平08−046484(JP,A)
【文献】 特開2003−298397(JP,A)
【文献】 国際公開第2007/029633(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
入力オーディオ信号を再サンプリングして出力オーディオ信号にするシステムであって、
・前記出力オーディオ信号のイメージングおよび/またはエイリアシングを低減するよう構成されているフィルタからのフィルタ係数の現在の部分集合を使って、前記入力オーディオ信号の一つまたは複数の入力サンプルから前記出力オーディオ信号の現在の出力サンプルを決定するよう構成されている処理ユニットであって、フィルタ係数の前記現在の部分集合は、前記フィルタのポリフェーズ構造のあるフェーズ(121)に対応する、処理ユニットと;
・異なる出力サンプルを決定するために使われる、前記フィルタの前記ポリフェーズ構造の異なるフェーズのフェーズ・インデックス(202)と、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間のマッピングを与えるフェーズ・ルックアップテーブルと;
フェーズ・インデックスと前記フィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを与えるフィルタ・ルックアップテーブルとを有しており、
前記処理ユニットは、前記フェーズ・ルックアップテーブルを使って、前記現在の出力サンプルの直前の前記前の出力サンプルについての前記前のフェーズ・インデックスに基づいて、前記現在のフェーズ・インデックスを決定するよう構成されており、前記処理ユニットは、前記フィルタ・ルックアップテーブルを使って、前記現在のフェーズ・インデックスに基づいてフィルタ係数の前記現在の部分集合を決定するよう構成されている、
システム。
【請求項2】
・当該システムは、Lが1より大きいとして、アップサンプリング因子Lに従って前記入力オーディオ信号を再サンプリングするよう構成されており、
・前記ポリフェーズ構造はL個のフェーズを有し、
・前記フェーズ・ルックアップテーブルは、前記L個のフェーズについてのL個のフェーズ・インデックスのそれぞれについて、直前のフェーズについてのフェーズ・インデックスへのマッピングを与える、
請求項記載のシステム。
【請求項3】
当該システムは、Mが1より大きいとして、ダウンサンプリング因子Mに従って前記入力オーディオ信号を再サンプリングするよう構成されている、請求項1または2記載のシステム。
【請求項4】
・前記フィルタが、N個のフィルタ係数の全集合を有し、
・前記フィルタからのフィルタ係数の前記部分集合がそれぞれN/L個のフィルタ係数を有する、
請求項または記載のシステム。
【請求項5】
前記フェーズ・ルックアップテーブルは、前記出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスを示す、請求項ないしのうちいずれか一項記載のシステム。
【請求項6】
当該システムは、Mが1より大きいとして、ダウンサンプリング因子Mに従って前記入力オーディオ信号を再サンプリングするよう構成されており、前記フェーズ・ルックアップテーブルは、前記出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスを示し、フェーズ・インデックスの前記シーケンスは、前記アップサンプリング因子Lおよび/または前記ダウンサンプリング因子Mに依存する、請求項記載のシステム。
【請求項7】
前記処理ユニットは、前記アップサンプリング因子Lおよび/または前記ダウンサンプリング因子Mに基づきフェーズ・インデックスの前記シーケンスおよび/または前記フェーズ・ルックアップテーブルを決定するよう構成されている、請求項記載のシステム。
【請求項8】
前記処理ユニットは、
・1からLまでの増大する整数のシーケンスを含む基本ベクトルを決定し;
・前記基本ベクトルをM回連結することにより、前記基本ベクトルから連結ベクトルを決定し;
・前記連結ベクトルからM番目毎の項目を選択することによってフェーズ・インデックスの前記シーケンスを決定するよう構成されている、
請求項記載のシステム。
【請求項9】
前記処理ユニットは、
・フェーズ・インデックスの前記シーケンスから第一のフェーズ・インデックスを選択し;
・前記第一のフェーズ・インデックスを、LまたはLの倍数だけ増大させることを、増大させられた第一のフェーズ・インデックスがM以下となる限り、行ない;
・フェーズ・インデックスの前記シーケンスにおいて前記第一のフェーズ・インデックスの直後の第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスに基づいて決定するよう構成されている、
請求項記載のシステム。
【請求項10】
前記処理ユニットは、前記第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスMからMを引いて中間フェーズ・インデックスを与えることによって決定するよう構成されている、請求項記載のシステム。
【請求項11】
前記処理ユニットが、前記第二のフェーズ・インデックスを、L+1から前記中間フェーズ・インデックスを引くことによって決定するよう構成されている、請求項10記載のシステム。
【請求項12】
前記処理ユニットは、隣り合うフェーズ・インデックスの一つまたは複数の対について、フェーズ・インデックスの前記シーケンスからの隣り合うフェーズ・インデックスの間の差をΔ=[M MOD L]として決定することによって、フェーズ・インデックスの前記シーケンスを決定するよう構成されている、請求項記載のシステム。
【請求項13】
・当該システムは、種々のアップサンプリング因子Lに従っておよび/または種々のダウンサンプリング因子Mに従って再サンプリングを実行するよう構成されており、
・前記フェーズ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフェーズ・インデックスへのマッピングを有しており、
・前記フィルタ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフィルタ係数の部分集合へのマッピングを有している、
請求項ないし12のうちいずれか一項記載のシステム。
【請求項14】
前記ポリフェーズ構造の異なるフェーズについてのフィルタ係数の部分集合は互いに背反である、請求項1ないし13のうちいずれか一項記載のシステム。
【請求項15】
入力オーディオ信号の入力サンプルのシーケンスから再サンプリングされたオーディオ信号の出力サンプルのシーケンスを決定するために使われる再サンプリング・フィルタのポリフェーズ構造のフェーズの対応するシーケンスを同定するフェーズ・インデックスのシーケンスを決定する方法であって、
・1からアップサンプリング因子Lまでの増大する整数のシーケンスを含む基本ベクトルを決定し;
・前記基本ベクトルをM回連結することにより、前記基本ベクトルから連結ベクトルを決定し、ここで、Mはダウンサンプリング因子であり、
・フェーズ・インデックスの前記シーケンスを、前記連結ベクトルからM番目毎の項目を選択することによって決定することを含む、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は2013年9月12日に出願された米国仮特許出願第61/877,155号および2014年4月29日に出願された米国仮特許出願第61/985,879号の優先権の利益を主張するものである。各出願はここに参照によってその全体において組み込まれる。
【0002】
発明の技術分野
本稿は、有理再サンプリング因子を使う再サンプリング器のためのアンチエイリアシングおよび/またはアンチイメージング・フィルタの設計に関する。特に、本稿は、低減した計算上の複雑さでそのようなアンチエイリアシングおよび/またはアンチイメージング・フィルタを実装するための方法に関する。さらに、本稿は、マルチチャネル・オーディオ信号のチャネル間の位相関係および/またはエンコードされたオーディオ信号の構造のような、オーディオ・エンコードおよびデコード・システムのさらなる側面に関する。さらに、本稿は、エンコードされたオーディオ信号のビットストリームのフレームレートの修正に関する。
【背景技術】
【0003】
異なるオーディオ・フォーマットは異なるサンプリング・レート(たとえば、32kHz、44.1kHzまたは48kHz)を要求することがある。第一のサンプリング・レート(たとえば32kHz)のオーディオ信号を第二のサンプリング・レート(たとえば48kHz)のオーディオ信号に転換するためには、有理再サンプリング器が使用されてもよい。有理数の因子によるオーディオの再サンプリングは典型的には再サンプリングされたオーディオ信号中にイメージング/エイリアシング・アーチファクトを導入する。オーディオ信号の望まれないイメージおよび/またはエイリアスを抑制するために、アンチイメージング/アンチエイリアシング・フィルタが使われてもよい。本稿は、有理再サンプリング器において使われるアンチイメージング/アンチエイリアシングを記述する。特に、本稿は計算効率のよい仕方でそのようなアンチイメージング/アンチエイリアシング・フィルタを実装する方法を記述する。
【0004】
さらに、エンコードされたオーディオ信号のフレームレートが、たとえば関連するビデオ信号のフレームレートの修正との関連で、修正されることがある。そのようなフレームレートは有理数であってもよい。本稿は、低減した可聴アーチファクトで(たとえば可聴アーチファクトなしで)エンコードされたオーディオ信号のフレームレートの修正を可能にするよう構成された方法およびシステムを記述する。
【発明の概要】
【課題を解決するための手段】
【0005】
ある側面によれば、入力オーディオ信号を再サンプリングして出力オーディオ信号にするシステムが記述される。システムは再サンプリング器と称されてもよい。システムは、有理再サンプリング比に従って再サンプリングを実行するよう構成されていてもよい。再サンプリング比L/Mはアップサンプリング因子L(たとえばLは1以上の整数)およびダウンサンプリング因子M(たとえばMは1以上の整数)によって定義されてもよい。よって、再サンプリング器は、入力サンプリング・レートの入力オーディオ信号を再サンプリングして出力サンプリング・レートの出力オーディオ信号にするよう構成されていてもよい。ここで、出力サンプリング・レートは入力サンプリング・レートのL/M倍に対応する。
【0006】
本システムは、出力オーディオ信号のイメージングおよび/またはエイリアシングを低減するよう構成されているフィルタからのフィルタ係数の現在の部分集合を使って、入力オーディオ信号の一つまたは複数の入力サンプルから出力オーディオ信号の現在の出力サンプルを決定するよう構成されている処理ユニットを有していてもよい。フィルタは、アンチイメージング/アンチエイリアシング・フィルタと称されてもよい。フィルタは、所定数N個のフィルタ係数を有するデジタル・フィルタ(たとえば、有限インパルス応答(FIR)フィルタ)として実装されてもよい。現在の出力サンプルを決定するためのフィルタ係数の現在の部分集合は、アンチイメージング/アンチエイリアシング・フィルタの所定数N個のフィルタ係数から選択されてもよい。特に、フィルタ係数の現在の部分集合は、アンチイメージング/アンチエイリアシング・フィルタのポリフェーズ構造のあるフェーズに対応してもよい。
【0007】
上記のように、アンチイメージング/アンチエイリアシング・フィルタは、N個のフィルタ係数の全集合を有していてもよい。フィルタ係数のこの全集合は、ポリフェーズ構造の複数のフェーズに細分されてもよい。ここで、各フェーズは、フィルタ係数の全集合からのフィルタ係数の部分集合を含む。特に、ポリフェーズ構造はL個のフェーズ、すなわちアップサンプリング因子Lに対応する数のフェーズを含んでいてもよい。すると、異なるフェーズについてのフィルタ係数の部分集合はそれぞれN/L個のフィルタ係数を含んでいてもよい。典型的には、ポリフェーズ構造の異なるフェーズについてのフィルタ係数の部分集合は互いに背反である。換言すれば、典型的には、フィルタ係数の全集合からの各フィルタ係数は、単一のフェーズについての単一の部分集合内に含まれるだけである。さらに、異なるフェーズについてのフィルタ係数の部分集合の和集合は典型的にはフィルタ係数の全集合に対応する。
【0008】
本システムは、異なる出力サンプルを決定するために使われる、フィルタのポリフェーズ構造の異なるフェーズのフェーズ・インデックスと、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間のマッピングを与え、フェーズ・インデックスとフィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを与える、一つまたは複数のルックアップテーブルを有していてもよい。
【0009】
特に、本システムは、異なる出力サンプルを決定するために使われる、アンチイメージング/アンチエイリアシング・フィルタのポリフェーズ構造の異なるフェーズのフェーズ・インデックスと、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間のマッピングを与えるフェーズ・ルックアップテーブルを有していてもよい。換言すれば、フェーズ・ルックアップテーブルは、アンチイメージング/アンチエイリアシング・フィルタのポリフェーズ構造のフェーズのシーケンスを示していてもよく、該フェーズのシーケンスは、出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われる。よって、フェーズ・ルックアップテーブルは、ポリフェーズ構造の各フェーズについて、ポリフェーズ構造の直後のフェーズを示してもよい。
【0010】
さらに、本システムは、フェーズ・インデックスと、アンチイメージング/アンチエイリアシング・フィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを提供するフィルタ・ルックアップテーブルを有していてもよい。換言すれば、フィルタ・ルックアップテーブルは、ポリフェーズ構造の異なるフェーズについてのフィルタ係数の諸部分集合(諸サブフィルタをなす)を示していてもよい。
【0011】
あるいはまた、本システムは、フェーズ・インデックスおよびフィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを与える組み合わされたフェーズ/フィルタ・ルックアップテーブルを有していてもよい。組み合わされたフェーズ/フィルタ・ルックアップテーブルのフェーズ・インデックスは、出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスに従って順序付けられてもよい。例として、組み合わされたフェーズ/フィルタ・ルックアップテーブルは、異なるフェーズ・インデックスについてフィルタ係数の異なる部分集合を示す複数の行(または列)を有していてもよく、それらの行は出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスに従って順序付けられてもよい。よって、組み合わされたフェーズ/フィルタ・ルックアップテーブルの行(または列)の順序付けは、異なる出力サンプルを決定するために使われる、フィルタのポリフェーズ構造の異なるフェーズのフェーズ・インデックスと、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間のマッピングを与える。
【0012】
組み合わされたフェーズ/フィルタ・ルックアップテーブルを使う結果として、現在の出力サンプルについてのフィルタ係数の現在の部分集合は、モジュロLポインタに基づくルックアップ動作を使って決定されうる。
【0013】
処理ユニットは、前記一つまたは複数のルックアップテーブルを使って、現在の出力サンプルの直前の前の出力サンプルについての前のフェーズ・インデックスに基づいて、フィルタ係数の現在の部分集合を決定するよう構成されていてもよい。
【0014】
特に、処理ユニットは、フェーズ・ルックアップテーブルを使って、(現在の出力サンプルの直前の前の出力サンプルを決定するために使われたフェーズを同定する)前のフェーズ・インデックスに基づいて、(現在の出力サンプルを決定するための使われるべき現在のフェーズを同定する)現在のフェーズ・インデックスを決定するよう構成されていてもよい。よって、現在のフェーズ・インデックスの決定は、(よって現在のフェーズの決定は)ルックアップ動作を使って計算効率のよい仕方で実行されうる。同様に、処理ユニットは、フィルタ・ルックアップテーブルを使って、現在のフェーズ・インデックスに基づいてフィルタ係数の現在の部分集合を決定するよう構成されていてもよい。よって、処理ユニットは、計算効率のよいルックアップ動作を使って現在の出力サンプルを決定するために使われるフィルタ係数を決定するよう構成されていてもよい。
【0015】
あるいはまた、処理ユニットは、組み合わされたフェーズ/フィルタ・ルックアップテーブルへのモジュロLポインタを使って、現在の出力サンプルの直前の前の出力サンプルについての前のフェーズ・インデックスに基づいて、フィルタ係数の現在の部分集合を決定するよう構成されていてもよい。
【0016】
上記のように、本システムは、Lが1より大きいとして、アップサンプリング因子Lに従って入力オーディオ信号を再サンプリングするよう構成されていてもよい。その際、アンチイメージング/アンチエイリアシング・フィルタのポリフェーズ構造はL個のフェーズを有していてもよい。さらに、その際、フェーズ・ルックアップテーブルは、L個のフェーズについてのL個のフェーズ・インデックスのそれぞれについて、直前のフェーズについてのフェーズ・インデックスへのマッピングを提供してもよい。換言すれば、フェーズ・ルックアップテーブルは、現在および前のフェーズ・インデックスのマッピングする対をもつL個のエントリーを有していてもよい。フェーズ・ルックアップテーブルは、出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズのフェーズ・インデックスのシーケンスを示してもよい。フェーズ・インデックスのシーケンス(すなわち、使用されるべきフェーズのシーケンス)は、典型的には、アップサンプリング因子Lおよび/またはダウンサンプリング因子Mに依存する。処理ユニットは、アップサンプリング因子Lに基づきおよび/またはダウンサンプリング因子Mに基づきフェーズ・インデックスのシーケンスおよび/またはフェーズ・ルックアップテーブルを決定するよう構成されていてもよい。さらに、処理ユニットは、フィルタ係数の部分集合および/またはフィルタ・ルックアップテーブルを決定するよう構成されていてもよい。これらの決定は、再サンプリング器の初期化の際に実行されてもよい。すると、入力オーディオ信号のその後の処理は、あらかじめ決定されたフェーズ・インデックスのシーケンスおよび/またはフェーズ・ルックアップテーブルならびにフィルタ係数のあらかじめ決定された諸部分集合および/またはあらかじめ決定されたフィルタ・ルックアップテーブルを使って実行されてもよい。
【0017】
処理ユニットは、1からLまで増える整数のシーケンスを含む基本ベクトルを決定することによってフェーズ・インデックスのシーケンスおよび/またはフェーズ・ルックアップテーブルを決定するよう構成されていてもよい。さらに、該基本ベクトルをM回連結することにより、基本ベクトルから連結ベクトルが決定されてもよい。フェーズ・インデックスのシーケンスは、連結ベクトルからM番目毎の項目を選択することによって決定されてもよい。すると、フェーズ・ルックアップテーブルは、フェーズ・インデックスのシーケンスに基づいて決定されてもよい。フェーズ・インデックスのシーケンスを決定するこの方法は、乗算または除算のような計算上わずらわしいタスクを含まないので、有益である。
【0018】
しかしながら、フェーズ・インデックスのシーケンスを決定するための上述した方法は、L×M個の項目を含む連結ベクトルの決定および記憶に関わる。以下では、フェーズ・インデックスのシーケンスを決定する代替的な方法が記述される。これはメモリ資源に関する改善された効率を提供する。フェーズ・インデックスのシーケンスを決定するために、処理ユニットは、フェーズ・インデックスのシーケンスから第一のフェーズ・インデックスを選択するよう構成されていてもよい。第一のフェーズ・インデックスは、LまたはLの倍数だけ増大させられてもよい。ただし、増大させられた第一のフェーズ・インデックスはM以下とする。その結果、結果として得られる増大させられた第一のフェーズ・インデックスは値Mを超える。フェーズ・インデックスのシーケンスにおいて第一のフェーズ・インデックスの直後の第二のフェーズ・インデックスが、増大させられた第一のフェーズ・インデックスに基づいて決定されてもよい。特に、第二のフェーズ・インデックスは、増大させられた第一のフェーズ・インデックスMからMを引いて中間フェーズ・インデックスを与えることによって決定されてもよい。その際、第二のフェーズ・インデックスは、L+1から中間フェーズ・インデックスを引くことによって決定されてもよい。上述したプロセスは、(現在の反復工程の第一のフェーズ・インデックスを、直前の反復工程の第二のフェーズ・インデックスで置き換えることにより)逐次反復的な仕方で繰り返されて、フェーズ・インデックスの完全なシーケンスを決定してもよい。
【0019】
さらに、処理ユニットは、隣り合うフェーズ・インデックスの一つまたは複数の対についてフェーズ・インデックスのシーケンスからの隣り合うフェーズ・インデックスの間の差をΔ=[M MOD L]に設定することによって、フェーズ・インデックスのシーケンスを決定するよう構成されていてもよい。
【0020】
本システムは、種々の再サンプリング比のために設計されうる。換言すれば、本システムは、種々のアップサンプリング因子Lに従っておよび/または種々のダウンサンプリング因子Mに従って再サンプリングを実行するよう構成されうる。この目的のために、フェーズ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフェーズ・インデックスへのマッピングを有していてもよい。さらに、フィルタ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフィルタ係数の部分集合へのマッピングを有していてもよい。その際、処理ユニットは、適用可能な再サンプリング比についての適切なマッピングを選択するよう構成されていてもよい。
【0021】
あるさらなる側面によれば、フェーズ・インデックスのシーケンスを決定する方法が記述される。フェーズ・インデックスのシーケンスは、入力オーディオ信号の入力サンプルのシーケンスから再サンプリングされたオーディオ信号の出力サンプルのシーケンスを決定するために使われる再サンプリング・フィルタのポリフェーズ構造のフェーズの対応するシーケンスを同定してもよい。本方法は、フェーズ・インデックスのシーケンスから第一のフェーズ・インデックスを選択することを含んでいてもよい。第一のフェーズ・インデックスは、アップサンプリング因子LまたはLの倍数だけ増大させられてもよい。ただし、増大させられた第一のフェーズ・インデックスはダウンサンプリング因子M以下とする。フェーズ・インデックスのシーケンスにおいて第一のフェーズ・インデックスの直後の第二のフェーズ・インデックスが、増大させられた第一のフェーズ・インデックスに基づいて決定されてもよい。本方法はさらに、第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスMからMを引いて中間フェーズ・インデックスを与えることによって決定することを含んでいてもよい。さらに、本方法は、第二のフェーズ・インデックスを、L+1から中間フェーズ・インデックスを引くことによって決定することを含んでいてもよい。
【0022】
もう一つの側面によれば、フェーズ・インデックスのシーケンスを決定する方法が記述される。フェーズ・インデックスのシーケンスは、再サンプリング・フィルタのポリフェーズ構造のフェーズの対応するシーケンスを同定してもよい。ここで、フェーズ・インデックスのシーケンスは、入力オーディオ信号の入力サンプルのシーケンスから再サンプリングされたオーディオ信号の出力サンプルのシーケンスを決定するために使われるものである。本方法は、1からアップサンプリング因子Lまで増える整数のシーケンスを含む基本ベクトルを決定することを含んでいてもよい。さらに、本方法は、該基本ベクトルをM回連結することにより、基本ベクトルから連結ベクトルが決定することを含んでいてもよい。ここで、Mはダウンサンプリング因子である。フェーズ・インデックスのシーケンスは、連結ベクトルからM番目毎の項目を選択することによって決定されてもよい。
【0023】
もう一つの側面によれば、複数の異なるチャネルを含むマルチチャネル・オーディオ信号についてのオーディオ・デコード・システムが記述される。前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含んでいてもよい。本オーディオ・デコード・システムは、マルチチャネル・オーディオ信号を示すビットストリームを受領するよう構成されていてもよい。ビットストリームは、マルチチャネル・オーディオ信号を提供するためにデコードされてもよい。さらに、オーディオ・デコード・システムは、第一の条件および第二の条件が満たされているかどうかを判定するよう構成されていてもよい。第一の条件は、マルチチャネル・オーディオ信号が低減された数のチャネルにダウンミックスされるべきであることを含んでいてもよく、あるいは示していてもよい。このダウンミックスは、ビットストリームのデコードのコンテキストにおいてまたはビットストリームのデコード後に実行されうる。よって、第一の条件は、オーディオ・デコード・システムがマルチチャネル・オーディオ信号の予定されているダウンミックスを認識していることに向けられてもよい。
【0024】
第二の条件は、前記一つまたは複数のサラウンド・チャネルがすでに前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているかどうかを含んでいてもよく、あるいは示していてもよい。換言すれば、本オーディオ・デコード・システムは、前記マルチチャネル・オーディオ信号の前記一つまたは複数のサラウンド・チャネルがすでに位相シフトされているかどうかを検証するよう構成されていてもよい。位相シフトは、前記マルチチャネル・オーディオ信号の他のチャネルに対して90度の位相シフトに対応していてもよい。第二の条件は、受領されたビットストリーム内に含まれる情報(たとえばフラグ)に基づいて検証されてもよい。よって、第二の条件は、ビットストリーム内に含まれる指示(たとえばフラグ)に基づいて判定されてもよい。代替的または追加的に、本オーディオ・デコード・システムは、(本稿で概説されるように)前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定するために、前記マルチチャネル・オーディオ信号を解析するよう構成されていてもよい。
【0025】
本オーディオ・デコード・システムは、前記第一の条件が満たされる場合(すなわち、マルチチャネル・オーディオ信号がダウンミックスされることになっている場合)かつ前記第二の条件が満たされない場合(すなわち、オーディオ・デコード・システムが前記一つまたは複数のサラウンド・チャネルがすでに位相シフトされていることを確認できない場合)、前記一つまたは複数のサラウンド・チャネルに位相シフトを適用して一つまたは複数の位相シフトされたサラウンド・チャネルを与えるよう構成されていてもよい。前記一つまたは複数のサラウンド・チャネルへの位相シフトは、前記第一の条件が満たされ、かつ前記第二の条件が満たされない場合にのみ適用されうる。それ以外の場合には、前記一つまたは複数のサラウンド・チャネルの位相は不変のままにされてもよい。本オーディオ・デコード・システムは、前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して前記一つまたは複数のサラウンド・チャネルに90度の位相シフトを適用するよう構成されていてもよい。
【0026】
よって、本オーディオ・デコード・システムは、前記一つまたは複数のサラウンド・チャネルの一貫した位相シフトを保証するよう構成されうる。そのような一貫した位相シフトは、典型的には、行列エンコード(すなわちダウンミックス)および行列でコード(すなわちアップミックス)のコンテキストにおけるチャネル分離のために有益である。さらに、信号を打ち消す位相シフトの発生が防止または低減できる。そのような信号打ち消しは、前記一つまたは複数のサラウンド・チャネルに位相シフトを複数回適用することに起因して生じうる。
【0027】
本オーディオ・デコード・システムはさらに、行列エンコードを使って、前記マルチチャネル・オーディオ信号からダウンミックスされたオーディオ信号を決定するよう構成されていてもよい。ダウンミックスされたオーディオ信号は典型的には前記マルチチャネル・オーディオ信号より少ないチャネルを含む。行列エンコードの一部として、本オーディオ・デコード・システムは、前記一つまたは複数の(位相シフトされた)サラウンド・チャネルを減衰させて、一つまたは複数の減衰されたサラウンド・チャネルを与え、前記一つまたは複数の減衰されたサラウンド・チャネルを前記複数の異なるチャネルのうちの他のチャネルの一つまたは複数と組み合わせて、ダウンミックスされたオーディオ信号の一つまたは複数のチャネルを与えるよう構成されていてもよい。
【0028】
もう一つの側面によれば、マルチチャネル・オーディオ信号をビットストリームにエンコードするためのオーディオ・エンコード・システムが記述される。前記マルチチャネル・オーディオ信号は複数の異なるチャネルを含む。前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含む。本オーディオ・エンコード・システムは、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定するよう構成されていてもよい。該確率の決定は、前記複数の異なるチャネルのオーディオ・コンテンツを解析することを含んでいてもよい。特に、前記複数の異なるチャネルのオーディオ・コンテンツのスペクトルが解析されてもよい。さらに、前記複数の異なるチャネルのスペクトルのフェーズが比較されてもよい。
【0029】
代替的または追加的に、確率は、前記マルチチャネル・オーディオ信号の履歴に基づいて決定されてもよい。例として、本オーディオ・エンコード・システムは、前記マルチチャネル・オーディオ信号の起源および/または前の処理を認識していてもよい。特に、本オーディオ・エンコード・システムは、前記マルチチャネル・オーディオ信号の(前記オーディオ信号の記録から始まる)処理の(完全な)チェーンを認識していてもよい。この知識は、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定するために使われてもよい。特に、この知識は、前記一つまたは複数のサラウンド・チャネルが位相シフトされているという事実を排除する(確率=0%)または確認する(確率=100%)ために使われてもよい。
【0030】
さらに、本オーディオ・エンコード・システムは、決定された確率が所定の確率閾値を超える場合に、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の指示をビットストリーム中に挿入するよう構成されていてもよい。この指示は、ビットストリームの所定のビットまたはフラグを含んでいてもよい。
【0031】
あるさらなる側面によれば、複数の異なるチャネルを含むマルチチャネル・オーディオ信号をデコードする方法が記述される。前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含んでいてもよい。本方法は、マルチチャネル・オーディオ信号を示すビットストリームを受領することを含んでいてもよい。さらに、本方法は、第一の条件および第二の条件が満たされているかどうかを判定することを含んでいてもよい。第一の条件は、マルチチャネル・オーディオ信号が低減された数のチャネルにダウンミックスされるべきであることの検証を含んでいてもよい。第二の条件は、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているかどうかの検証を含む。これは、ビットストリーム内に含まれる指示(たとえばフラグ)に基づいて検証されてもよい。代替的または追加的に、これは、前記マルチチャネル・オーディオ信号自身に基づいて、および/または前記マルチチャネル・オーディオ信号の処理チェーンに関する知識に基づいて決定されてもよい。本方法はさらに、前記第一の条件が満たされ、かつ前記第二の条件が満たされない場合に、前記一つまたは複数のサラウンド・チャネルに位相シフトを適用して一つまたは複数の位相シフトされたサラウンド・チャネルを与えることを含んでいてもよい。
【0032】
もう一つの側面によれば、マルチチャネル・オーディオ信号をビットストリームにエンコードする方法が記述される。前記マルチチャネル・オーディオ信号は複数の異なるチャネルを含んでいてもよい。前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含んでいてもよい。本方法は、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定することを含んでいてもよい。さらに、本方法は、決定された確率が所定の確率閾値を超える場合に、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の指示をビットストリーム中に挿入することを含んでいてもよい。
【0033】
あるさらなる側面によれば、オーディオ・フレームのシーケンスを含むオーディオ信号を、ビットストリーム・フレームの対応するシーケンスを含むビットストリームにエンコードするオーディオ・エンコード・システムが記述される。本オーディオ・エンコード・システムは、オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第一のシーケンスを提供するよう構成されていてもよい。サブストリーム・フレームの前記第一のシーケンスは、オーディオ・フレームの前記シーケンスの第一の表現を含んでいてもよい。表現は、オーディオ信号を表わすいくつかのチャネル(たとえば2チャネルまたは5.1チャネル)を含んでいてもよい。代替的または追加的に、表現は、ビットレートの指示を含んでいてもよく、あるいは表現はサブストリーム・フレームのシーケンスのビットレートに関連付けられていてもよい。本オーディオ・エンコード・システムはさらに、オーディオ・フレームの対応するシーケンスについてのサブストリーム・フレームの第二のシーケンスを提供するよう構成されていてもよい。第一および第二のシーケンスは、オーディオ・フレームの同じシーケンスの異なる表現を含んでいてもよい。
【0034】
さらに、オーディオ・エンコード・システムは、ビットストリーム・フレームのシーケンスを決定するよう構成されていてもよい。その際、ビットストリーム・フレームは、該ビットストリーム・フレーム内の異なる位置において前記第一および第二のシーケンスからの対応するサブストリーム・フレームを含む。特に、ビットストリーム・フレームのシーケンスは、各ビットストリーム・フレームが、前記第一および第二のシーケンスからの対応するサブストリーム・フレームを含むよう決定されてもよい。よって、ビットストリームは、同じオーディオ信号の複数の表現を含みうる。該複数の表現は、たとえばチャネル数に関しておよび/またはビットレートに関して異なりうる。代替的または追加的に、ビットストリームは、異なるオーディオ信号からのオーディオ・フレームの対応するシーケンスについてのサブストリーム・フレームの異なるシーケンスを含んでいてもよい。
【0035】
オーディオ・エンコード・システムは、ビットストリーム・フレームのシーケンスのビットストリーム・フレーム中に制御情報を挿入するよう構成されていてもよい。ここで、前記制御情報は、ビットストリーム・フレーム内に含まれるサブストリーム・フレームの位置および/または表現を示す。そのような制御情報は、ビットストリーム・フレームのシーケンスの各ビットストリーム・フレーム中に挿入されてもよい。制御情報は、オーディオ処理システムが、ビットストリーム・フレームの完全なシーケンスをデコードする必要なしに、ビットストリームからのサブストリーム・フレームのシーケンスのうちの一つまたは複数のシーケンスを同定できるようにする。
【0036】
制御情報は、前記第一および第二のシーケンスについて第一および第二の制御情報を含んでいてもよい。特に、ビットストリーム・フレームのそれぞれが、ビットストリーム・フレーム内に含まれる第一および第二のシーケンスのサブストリーム・フレームを同定するために第一および第二の制御情報を含んでいてもよい。オーディオ・エンコード・システムは、異なる長さの符号語を使って第一および第二の制御情報をエンコードするよう構成されていてもよい。換言すれば、オーディオ・エンコード・システムは、制御情報をエンコードするために可変長エンコードを使うよう構成されていてもよい。
【0037】
第一および第二の制御情報をエンコードするためにそれぞれ使われる符号語の長さは、それぞれ第一および第二のシーケンスのビットレートに依存してもよい。特に、第一のシーケンスのビットレートが第二のシーケンスのビットレートより高い場合には、第一の制御情報をエンコードするために使われる一つまたは複数の符号語の長さは、第二の制御情報をエンコードするために使われる一つまたは複数の符号語の長さより大きくてもよい。および/またはその逆。
【0038】
よって、本オーディオ・エンコード・システムは、可変長符号を使って第一および第二の制御情報をエンコードするよう構成されていてもよい。それにより、もし――平均で――サブストリーム・フレームの第一のシーケンスがサブストリーム・フレームの第二のシーケンスより多くのビットを含む場合には、――平均で――第一の制御情報は第二の制御情報より多くのビットを含んでいてもよい。逆も成り立つ。換言すれば、オーディオ・エンコード・システムは、第一および第二の制御情報に起因するサブストリーム・フレームの第一および第二のシーケンスの相対的なオーバーヘッドの間の相違が減らされるように、可変長符号を使って第一および第二の制御情報をエンコードするよう構成されうる。
【0039】
あるさらなる側面によれば、ビットストリーム・フレームの対応するシーケンスを含む入力ビットストリームを受領し、処理するよう構成されたオーディオ処理システムが記述される。ビットストリーム・フレームのシーケンスからのビットストリーム・フレームは、ビットストリーム・フレーム内に、サブストリーム・フレームの第一および第二のシーケンスから対応するサブストリーム・フレームを含む。第一および第二のシーケンスは、オーディオ・フレームの同じシーケンスの異なる表現を含んでいてもよい。さらに、ビットストリーム・フレームのシーケンスのビットストリーム・フレームは、ビットストリーム・フレーム内に含まれる第一および第二のシーケンスからのサブストリーム・フレームの位置および/または表現を示す制御情報を含んでいてもよい。オーディオ処理システムは、制御情報を使って、ビットストリーム・フレームのシーケンスからサブストリーム・フレームの第一および/または第二のシーケンスを抽出するよう構成されていてもよい。特に、オーディオ処理システムは、サブストリーム・フレームの第一のシーケンスをデコードする必要なしに、および/またはサブストリーム・フレームの第二のシーケンスをデコードする必要なしに、ビットストリーム・フレームのシーケンスからサブストリーム・フレームの第一および/または第二のシーケンスを抽出するよう構成されていてもよい。よって、オーディオ処理システムは、計算効率のよい仕方でサブストリーム・フレームのシーケンスの一つまたは複数を同定するよう構成されていてもよい。
【0040】
さらに、オーディオ処理システムは、第一のシーケンスのサブストリーム・フレームを、出力ビットストリームのビットストリーム・フレームの対応するシーケンスに挿入するよう構成されていてもよい。さらに、オーディオ処理システムは、出力ビットストリームのビットストリーム・フレーム中に制御情報を挿入するよう構成されていてもよい。制御情報は、出力ビットストリームのビットストリーム・フレーム内の第一のシーケンスからのサブストリーム・フレームの位置および/または表現を示していてもよい。よって、オーディオ処理システムは、計算効率のよい仕方で、入力ビットストリーム内に含まれているサブストリーム・フレームの諸シーケンスのセレクションを含む出力ビットストリームを生成するよう構成されてもよい。
【0041】
あるさらなる側面によれば、オーディオ・フレームのシーケンスを含むオーディオ信号を、ビットストリーム・フレームの対応するシーケンスを含むビットストリームにエンコードする方法が記述される。本方法は、オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第一のシーケンスを提供する段階と、オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第二のシーケンスを提供する段階とを含んでいてもよい。第一および第二のシーケンスは、典型的にはオーディオ・フレームの同じシーケンスの異なる表現を含む。本方法はさらに、ビットストリーム・フレームのシーケンスを決定することを含んでいてもよい。その際、ビットストリーム・フレームは、該ビットストリーム・フレーム内の異なる位置において前記第一および第二のシーケンスからの対応するサブストリーム・フレームを含む。加えて、本方法は、ビットストリーム・フレームのシーケンスのビットストリーム・フレーム中に制御情報を挿入することを含んでいてもよい。前記制御情報は、ビットストリーム・フレーム内に含まれるサブストリーム・フレームの位置および/または表現を示してもよい。
【0042】
もう一つの側面によれば、オーディオ・フレームのシーケンスを含むオーディオ信号を示すビットストリームを処理する方法が記述される。本方法は、ビットストリーム・フレームの対応するシーケンスを含む入力ビットストリームを受領することを含む。ビットストリーム・フレームは、ビットストリーム・フレーム内の異なる位置またはポジションに、サブストリーム・フレームの第一および第二のシーケンスからの対応するサブストリーム・フレームを含む。第一および第二のシーケンスは、オーディオ・フレームの同じシーケンスの異なる表現を含んでいてもよい。ビットストリーム・フレームのシーケンスのビットストリーム・フレームは、ビットストリーム・フレーム内に含まれるサブストリーム・フレームの位置/ポジションおよび/または表現を示す制御情報を含んでいてもよい。さらに、本方法は、制御情報を使って、ビットストリーム・フレームのシーケンスからサブストリーム・フレームの第一のシーケンスを抽出することを含んでいてもよい。
【0043】
あるさらなる側面によれば、ビットストリーム・フレームの対応するシーケンスを含むビットストリームを処理するオーディオ処理システムが記述される。ビットストリーム・フレームのシーケンスはオーディオ信号のオーディオ・フレームの対応するシーケンスを示してもよい。オーディオ処理システムは、ビットストリーム・フレームのシーケンスについてのカウンタ値のシーケンスを生成するよう構成されていてもよい。カウンタ値のシーケンスは、逐次的に順序付けされたカウンタ値(たとえば昇順または降順のカウンタ値)を含んでいてもよい。さらに、それらのカウンタ値は、最小値および最大値を含んでいてもよい。カウンタ値のシーケンス内で最大値の次に最小値がきてもよく、あるいは逆でもよい。換言すれば、カウンタ値は最小値と最大値との間で周期的に巡回してもよい。
【0044】
オーディオ処理システムは、カウンタ値のシーケンスからのカウンタ値を、ビットストリーム・フレームのシーケンスからのビットストリーム・フレーム中に挿入するよう構成されていてもよい。カウンタ値は制御情報としてビットストリーム・フレーム中に挿入されてもよい。カウンタ値の挿入の結果として、ビットストリーム・フレームの制御情報(すなわちカウンタ値)は、ビットストリーム・フレームのシーケンス内のビットストリーム・フレームの逐次順を示してもよい。これは、ビットストリーム・フレームの異なるシーケンスの連結を含むビットストリーム内の接合点を検出するために有益でありうる。接合点は、カウンタ値に基づいて検出されてもよい。特に、接合点は、カウンタ値の特定の値に基づいておよび/または直接相続くビットストリーム・フレームのカウンタ値の不連続性に基づいて検出されてもよい。
【0045】
ビットストリーム・フレームは典型的には、オーディオ信号の対応するオーディオ・フレームを示すペイロード・データを含む。カウンタ値および/または制御情報は、諸ビットストリーム・フレームの端に(たとえば先頭にまたは末尾に)位置されてもよい。換言すれば、カウンタ値および/または制御情報は、諸ビットストリーム・フレーム内の所定のポジション/位置に位置決めされてもよい。特に、カウンタ値および/または制御情報は、ペイロード/データの上流または下流に位置決めされてもよい。例として、ビットストリーム・フレームは、まず制御情報(たとえば、フレーム同期語および/またはビットストリーム・バージョン情報)を含み、それに所定の位置にあるカウンタ値が続いてもよい。ビットストリームの露出したおよび/またはあらかじめ決定された位置におけるカウンタ値および/または制御情報の位置決めは、カウンタ値および/または制御情報の同定を簡略化し、それにより、ビットストリームの処理および接合点の検出を簡略化しうる。
【0046】
もう一つの側面によれば、接合されたビットストリームを生成するオーディオ処理システムが記述される。接合されたビットストリームは、ビットストリーム・フレームの対応する第一のシーケンスを含む第一のビットストリームからおよびビットストリーム・フレームの対応する第二のシーケンスを含む第二のビットストリームから生成されてもよい。ビットストリーム・フレームの第一のシーケンスは、第一のオーディオ信号のオーディオ・フレームの対応する第一のシーケンスを示していてもよく、ビットストリーム・フレームの第二のシーケンスは、第二のオーディオ信号のオーディオ・フレームの対応する第二のシーケンスを示していてもよい。第二のオーディオ信号は第一のオーディオ信号とは異なっていてもよい。
【0047】
ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。同様に、ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。よって、第一および第二のビットストリームはそれぞれ第一および第二のカウンタ値を含む。
【0048】
オーディオ処理システムは、ビットストリーム・フレームの第一のシーケンスからの特定のビットストリーム・フレームにおいて第一のビットストリームを打ち切り、それにより打ち切られたビットストリームを提供するよう構成されていてもよい。さらに、オーディオ処理システムは、打ち切られたビットストリームをビットストリーム・フレームの第二のシーケンスと連結して、それにより接合されたビットストリームを提供するよう構成されていてもよい。連結の結果としておよびカウンタ値を提供する結果として、接合されたビットストリームの第一の部分内に含まれる第一のカウンタ値および接合されたビットストリームの第二の部分内に含まれる第二のカウンタ値が、第一および第二のビットストリームの間の接合点を示していてもよい。特に、特定のビットストリーム・フレームの第一のカウンタ値および接合されたビットストリーム内で該特定のビットストリーム・フレームに続くビットストリーム・フレームの第二のカウンタ値は、第一および第二のビットストリームの間の接合点を示してもよい。より具体的には、特定のビットストリーム・フレームの第一のカウンタ値と、接合されたビットストリーム内で該特定のビットストリーム・フレームの次のビットストリーム・フレームの第二のカウンタ値との間の不連続が、第一および第二のビットストリームの間の接合点を示してもよい。
【0049】
本オーディオ処理システムはさらに、前記特定のビットストリーム・フレームの第一のカウンタ値を所定のカウンタ値に設定するおよび/または接合されたビットストリーム内で該特定のビットストリーム・フレームに続くビットストリーム・フレームの第二のカウンタ値を前記所定のカウンタ値に設定するよう構成されていてもよい。よって、前記特定のビットストリーム・フレームのカウンタ値(第一のカウンタ値と称される)は、接合点の直前のビットストリーム・フレームを示してもよく、および/または前記特定のビットストリーム・フレームの直後のビットストリーム・フレームのカウンタ値(第二のカウンタ値と称される)は接合点の直後のビットストリーム・フレームを示してもよい。典型的には、(接合点の直前または直後のビットストリーム・フレームの)これらのカウンタ値の一方のみを前記所定のカウンタ値に割り当てることが十分である。特に、接合点の直後のビットストリーム・フレームのカウンタ値を所定のカウンタ値に設定する(だけ)ことがリアルタイム処理のために有益でありうる。
【0050】
前記所定のカウンタ値は、前記カウンタ値の最小値および最大値によって与えられるカウンタ値のカウンタ値範囲の外側にあってもよい。換言すれば、第一および/または第二のカウンタ値は、最小値と最大値の間のカウンタ値範囲からの値を取ってもよい。前記所定のカウンタ値は該カウンタ値範囲の外にあってもよい。例として、カウンタ値の最小値は「1」であってもよく、前記所定のカウンタ値は「0」であってもよい。所定の値に設定されているカウンタ値の検出は、特定のビットストリーム・フレームと接合されたビットストリーム内の前記特定のビットストリーム・フレーム後のビットストリーム・フレームとの間の接合点の存在を示しうる。
【0051】
もう一つの側面によれば、ビットストリームの接合の検出を可能にする方法が記述される。ビットストリームは、ビットストリーム・フレームのシーケンスを含む。ビットストリーム・フレームの前記シーケンスは、オーディオ信号のオーディオ・フレームの対応するシーケンスを示す。本方法は、それぞれビットストリーム・フレームのシーケンスについてのカウンタ値のシーケンスを生成することを含む。さらに、本方法は、カウンタ値のシーケンスからのカウンタ値を、ビットストリーム・フレームのシーケンスからのビットストリーム・フレーム中に、たとえば制御情報として、挿入することを含む。その際、ビットストリーム・フレームの制御情報は、ビットストリーム・フレームのシーケンス内のビットストリーム・フレームの逐次順を示す。
【0052】
あるさらなる側面によれば、接合点を示す接合されたビットストリームを生成する方法が記述される。本方法は、ビットストリーム・フレームの第一のシーケンスからの特定のビットストリーム・フレームにおいて第一のビットストリームを打ち切り、打ち切られたビットストリームを提供することを含む。ビットストリーム・フレームの第一のシーケンスは、第一のオーディオ信号のオーディオ・フレームの対応する第一のシーケンスを示す。ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。さらに、本方法は、打ち切られたビットストリームをビットストリーム・フレームの第二のシーケンスを含む第二のビットストリームと連結することを含む。ビットストリーム・フレームの第二のシーケンスは、第二のオーディオ信号のオーディオ・フレームの対応する第二のシーケンスを示す。ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。前記特定のビットストリーム・フレームの第一のカウンタ値および/または接合されたビットストリーム内で該特定のビットストリーム・フレームに続くビットストリーム・フレームの第二のカウンタ値は、第一および第二のビットストリームの間の接合点を示してもよい。
【0053】
あるさらなる側面によれば、接合されたビットストリームをデコードするオーディオ・デコード・システムが記述される。接合されたビットストリームは、ビットストリーム・フレームの第一および第二のシーケンスの連結を含む。第一および第二のシーケンスはそれぞれ第一および第二のオーディオ信号を示す。ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。
【0054】
オーディオ・デコード・システムは、第一および第二のカウンタ値に基づいて第一および第二の連結されたシーケンスの間の接合点を検出するよう構成されていてもよい。接合点は、(本稿で概説されるように)隣り合うビットストリーム・フレームのカウンタ値の不連続性に基づいて、および/または所定のカウンタ値をもつカウンタ値に基づいて検出されてもよい。
【0055】
さらに、オーディオ・デコード・システムは、接合点後の接合されたビットストリームのビットストリーム・フレームを正しくデコードするために必要なデータが利用可能であるかどうかを判定するよう構成されていてもよい。ビットストリーム・フレームを正しくデコードするために必要なデータは、ビットストリーム・フレームの前記第二のシーケンスをデコードするために使われるデコード方式の設定を含む。さらに、ビットストリーム・フレームが(接合のため当該接合されたビットストリームには含まれていない)前のビットストリーム・フレームに依存しないことを保証される必要があることがありうる。換言すれば、当該ビットストリーム・フレームがデコードのために必要なエンコードされたオーディオ・データすべてを含んでいる独立(すなわちI)フレームであることを保証される必要があることがある。
【0056】
さらに、オーディオ・デコード・システムは、前記データが利用可能でない場合には、接合点後の接合されたビットストリームのビットストリーム・フレームのデコードをサスペンドするよう構成されていてもよい。特に、オーディオ・デコード・システムは、正しいデコードのために必要なデータ(すべて)が利用可能になる接合されたビットストリームのビットストリーム・フレームまで、接合点後のビットストリーム・フレーム(すべて)のデコードをサスペンドするよう構成されていてもよい。代替的または追加的に、オーディオ・デコード・システムは、デコードがサスペンドされたビットストリーム・フレームについて、無音を示すオーディオ・フレームを提供するよう構成されていてもよい。よって、オーディオ・デコード・システムは、正しいデコードのために必要なデータすべてが利用可能である時点まで(すなわちそのようなビットストリーム・フレームまで)接合点後に「無音」をレンダリングするよう構成されていてもよい。こうすることにより、可聴アーチファクトの出力が軽減できる。
【0057】
もう一つの側面によれば、ビットストリーム・フレームの第一および第二のシーケンスの連結を含む接合されたビットストリームをデコードする方法が記述される。第一および第二のシーケンスはそれぞれ第一および第二のオーディオ信号を示してもよい。ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。本方法は、第一および第二のカウンタ値に基づいて第一および第二のシーケンスの間の接合点を検出することを含んでいてもよい。さらに、本方法は、接合点後の接合されたビットストリームのビットストリーム・フレームを正しくデコードするために必要な(すべての)データが利用可能であるかどうかを判定することを含む。加えて、本方法は、前記データが利用可能でない場合には、接合点後の接合されたビットストリームのビットストリーム・フレームのデコードをサスペンドするおよび/または該ビットストリーム・フレームについて無音を出力することを含んでいてもよい。
【0058】
あるさらなる側面によれば、ビットストリームを処理するオーディオ処理システムが記述される。前記オーディオ処理システムは、たとえばオーディオ・デコード・システムまたはサンプル・レート変換システムまたはオーディオ・エンコード・システムを有していてもよいまたはそれであってもよい。ビットストリームは、ビットストリーム・フレームの第一および第二のシーケンスの連結を含んでいてもよく、第一および第二のシーケンスは一つまたは複数のオーディオ信号を示す。前記一つまたは複数のオーディオ信号は、オーディオ信号の集合と称されてもよい。接合されたビットストリームの場合、第一のシーケンスは、第一のオーディオ信号(またはオーディオ信号の第一の集合)を示してもよく、第二のシーケンスは、第二のオーディオ信号(またはオーディオ信号の第二の集合)を示してもよい。しかしながら、第一および第二のシーケンスはいずれも、長さおよび/または時間的な位置のような異なる時間的属性をもつ、同じオーディオ信号の抜粋を示していてもよい。
【0059】
ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。さらに、第一のシーケンスは、あらかじめ決定された組のフレーム長をもつビットストリーム・フレームの第一のサブシーケンスを含む。第一のサブシーケンスのフレーム長の組は、第一のサブシーケンスのビットストリーム・フレームが第一の所定の平均フレーム長Nを示すようなものである。
【0060】
ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。さらに、第二のシーケンスは、もう一つの(可能性としては異なる)あらかじめ決定された組のフレーム長をもつビットストリーム・フレームの第二のサブシーケンスを含んでいてもよい(ここで、フレーム長はたとえばサンプル数の単位で測られてもよい)。第二のサブシーケンスのフレーム長の組は、第二のサブシーケンスのビットストリーム・フレームが第二の所定の平均フレーム長Kを示すようなものである。
【0061】
オーディオ処理システムは、第一および第二のシーケンスの間の遷移点を検出するよう構成される。遷移点は、(ビットストリーム内の任意の位置における)異なるオーディオ信号の間の任意の接合点(スプライス点とも称される)であってもよい。代替的または追加的に、遷移点は、ビットストリームのフレームレートが変わるビットストリーム内の点に対応していてもよい。
【0062】
オーディオ処理システムはさらに、ビットストリーム・フレームの第一のシーケンスから第一のビットストリーム・フレームを決定するよう構成される。ここで、第一のビットストリーム・フレームは、遷移点の直前である。加えて、オーディオ処理システムは、第一のビットストリーム・フレームのシーケンス・インデックス値i1を、第一のビットストリーム・フレームの第一のカウンタ値q1に基づいて決定するよう構成される。シーケンス・インデックス値i1は、第一のサブシーケンス内での第一のビットストリーム・フレームの位置および/またはフレーム長を示してもよい。特に、シーケンス・インデックス値i1は、第一のサブシーケンスの所定のフレーム長の組内での第一のビットストリーム・フレームのフレーム長を示してもよい。
【0063】
加えて、オーディオ処理システムは、ビットストリーム・フレームの第二のシーケンスから第二のビットストリーム・フレームを決定するよう構成される。ここで、第二のビットストリーム・フレームは、遷移点の直後である。オーディオ処理システムは、その際、第二のビットストリーム・フレームのシーケンス・インデックス値i2を、第一のビットストリーム・フレームのシーケンス・インデックス値i1に基づいて決定してもよい。第一のシーケンス・インデックス値i1と同様に、シーケンス・インデックス値i2は、第二のサブシーケンス内での第二のビットストリーム・フレームの位置および/またはフレーム長を示してもよい。特に、シーケンス・インデックス値i2は、第二のサブシーケンスの所定のフレーム長の組内での第二のビットストリーム・フレームのフレーム長を示してもよい。
【0064】
第一のビットストリーム・フレームのシーケンス・インデックス値i1に基づいて第二のビットストリーム・フレームのシーケンス・インデックス値i2を決定することによって、接合点であってもおよび/またはフレームレート変化を受けたとしても、ビットストリーム610の「フェーズ」が維持されるまたはロックされることが保証されることができる。この結果として、デコードされたビットストリームのオーディオ品質が改善されうる。
【0065】
第一のビットストリーム・フレームのシーケンス・インデックス値i1はi1=q1 mod Zとして決定されてもよい。ここで、Zは第一のサブシーケンス内のビットストリーム・フレームの数である。これは第二のビットストリーム・フレームにも適用可能でありうる。
【0066】
第一のビットストリーム・フレームのシーケンス・インデックス値i1は第一の剰余値r1に関連付けられてもよい。ここで、第一の剰余値r1は、第一のビットストリーム・フレームまでの第一のサブシーケンスのビットストリーム・フレームについての中間的な平均フレーム長と、第一の所定の平均フレーム長との間の差を示していてもよい。オーディオ処理システムは、第一の剰余値r1に基づき、かつ第二の所定の平均フレーム長に基づき、第一の擬似シーケンス・インデックス値(^付きのi1)を決定するよう構成されていてもよい。特に、ビットストリーム・フレームの第一のシーケンスが(第一の所定の平均フレーム長ではなく)第二の所定の平均フレーム長を示す場合、第一の剰余値r1がどのシーケンス・インデックス(^付きのi1)に関連付けられるかが決定されてもよい。次いで、擬似シーケンス・インデックス値(^付きのi1)に基づいて第二のビットストリーム・フレームのシーケンス・インデックス値i2が決定されてもよい。特に、第二のビットストリーム・フレームのシーケンス・インデックス値i2
【数1】
として決定されてもよい。ここで、Zは(フレームレートが不変のままである場合の)第二のサブシーケンスのビットストリーム・フレームの数である。
【0067】
上記のように、遷移点は接合点であってもよい。そのような場合、遷移点は、第一および/または第二のカウンタ値に基づいて検出されてもよい。特に、遷移点は、第二のビットストリーム・フレームの第二のカウンタ値に基づいて、たとえば、所定のカウンタ値をもつ第二のビットストリーム・フレームの第二のカウンタ値に基づいて、検出されてもよい。よって、ビットストリームの「フェーズ」ロックが、指示される接合点にも、すなわち所定のカウンタ値によって指示される接合点にも、適用可能でありうる。
【0068】
第一の所定の平均フレーム長は、整数ではなく、有理数であってもよい。他方、第一のサブシーケンスのビットストリーム・フレームの前記所定の組のフレーム長は整数であってもよい。よって、第一のサブシーケンスは、整数フレーム長の組を使って分数平均フレーム長を提供するために使われてもよい。フレーム長の組は繰り返されて前記第一のシーケンスをなしてもよい。同様に、第二の所定の平均フレーム長は、整数ではなく、有理数であってもよく、第二のサブシーケンスのビットストリーム・フレームの前記所定の組のフレーム長は整数であってもよい。
【0069】
第一の所定の平均フレーム長は、第二の所定の平均フレーム長とは異なっていてもよい。特に、比K/Nまたは比N/Kは1より大きな整数であってもよい。このように、「フェーズ」ロックはフレームレート変化にも適用可能でありうる。
【0070】
もう一つの側面によれば、ビットストリームを処理するためのオーディオ処理システムが記述される。前記オーディオ処理システムは、たとえばオーディオ・デコード・システムまたはサンプル・レート変換システムまたはオーディオ・エンコード・システムを有していてもよいまたはそれであってもよい。ビットストリームは、ビットストリーム・フレームの第一および第二のシーケンスの連結を含んでいてもよく、第一および第二のシーケンスは、たとえばオーディオ信号の集合のうちの、一つまたは複数のオーディオ信号を示す。接合されたビットストリームの場合、第一のシーケンスは、(たとえばオーディオ信号の第一の集合の)第一のオーディオ信号を示してもよく、第二のシーケンスは、(たとえばオーディオ信号の第二の集合の)第二のオーディオ信号を示してもよい。しかしながら、第一および第二のシーケンスはいずれも、長さおよび/または時間的な位置のような異なる時間的属性をもつ、同じオーディオ信号の異なる抜粋を示していてもよい。
【0071】
ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。さらに、第一のシーケンスは、第一の平均フレーム長を示す。ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。さらに、第二のシーケンスは、第二の平均フレーム長を示す。第一および第二の平均フレーム長は異なっていてもよい。
【0072】
オーディオ処理システムは、第一および第二のシーケンスの間の遷移点を検出するよう構成される。さらに、オーディオ処理システムは、遷移点の直前のビットストリーム・フレームの第一のシーケンスから第一のビットストリーム・フレームを決定し、第一のビットストリーム・フレームの第一のカウンタ値q1を決定するよう構成される。加えて、オーディオ処理システムは、遷移点の直後または遷移点にすぐ続くビットストリーム・フレームの第二のシーケンスから第二のビットストリーム・フレームを決定し、第二のビットストリーム・フレームの第二のカウンタ値q2を決定するよう構成される。
【0073】
さらに、オーディオ処理システムは、遷移点が接合点であるかどうかを、第一のカウンタ値q1、第二のカウンタ値q1、第一の平均フレーム長および第二の平均フレーム長に基づいて決定するよう構成されていてもよい。よって、接合点の存在は、(フレームレート変化の場合であっても)信頼できる仕方で決定されうる。この結果として、デコードされるビットストリームの知覚的な品質が改善されうる。
【0074】
特に、オーディオ処理システムは、第二のビットストリーム・フレームについての目標カウンタ値kを、第一のカウンタ値q1に基づき、第一の平均フレーム長に基づき、かつ第二の平均フレーム長に基づいて決定するよう構成されていてもよい。第二のビットストリーム・フレームについての目標カウンタ値kは、第一のカウンタ値の最大値Qmaxおよび/または最小値Qminに基づいても決定されてもよい。さらに、オーディオ処理システムは、遷移点が接合点であるかどうかを判定するために、目標カウンタ値kを第二のカウンタ値q2と比較するよう構成されていてもよい。より具体的には、オーディオ処理システムは、目標カウンタ値kが第二のカウンタ値q2と異なる場合に(のみ)遷移点が接合点であると判定するよう構成されていてもよい。
【0075】
Nは平均フレーム長であってもよく、Kは第二の平均フレーム長であってもよい。比K/Nは1より大きな整数であってもよい。すなわち、フレームレートが遷移点において増大してもよい。その場合、目標カウンタ値kは
【数2】
として決定されてもよい。あるいはまた、比N/Kが1より大きな整数であってもよい。すなわち、フレームレートが遷移点において減少してもよい。その場合、目標カウンタ値kは
【数3】
として決定されてもよい。
【0076】
あるさらなる側面によれば、ビットストリーム・フレームの第一および第二のシーケンスの連結を含むビットストリームを処理する方法が記述される。第一および第二のシーケンスは一つまたは複数のオーディオ信号を示す。ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。第一のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第一のサブシーケンスを含み、第一のサブシーケンスのビットストリーム・フレームは第一の平均フレーム長を示す。ビットストリーム・フレームの第二シーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。第二のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第二のサブシーケンスを含み、第二のサブシーケンスのビットストリーム・フレームは第二の所定の平均フレーム長を示す。
【0077】
本方法は、第一および第二のシーケンスの間の遷移点を検出し、遷移点の直前のビットストリーム・フレームの第一のシーケンスから第一のビットストリーム・フレームを決定することを含む。さらに、本方法は、第一のビットストリーム・フレームのシーケンス・インデックス値i1を第一のビットストリーム・フレームの第一のカウンタ値q1に基づいて決定することを含む。シーケンス・インデックス値i1は、第一のサブシーケンス内での第一のビットストリーム・フレームの位置を示す。加えて、本方法は、遷移点の直後のビットストリーム・フレームの第二のシーケンスから第二のビットストリーム・フレームを決定することを含む。本方法はさらに、第二のビットストリーム・フレームのシーケンス・インデックス値i2を、第一のビットストリーム・フレームのシーケンス・インデックス値i1に基づいて決定することを含む。シーケンス・インデックス値i2は、第二のサブシーケンス内での第二のビットストリーム・フレームの位置を示す。
【0078】
もう一つの側面によれば、ビットストリーム・フレームの第一および第二のシーケンスの連結を含むビットストリームを処理する方法が記述される。第一および第二のシーケンスは、一つまたは複数のオーディオ信号を示す。ビットストリーム・フレームの第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む。第一のシーケンスは、第一の平均フレーム長を示す。ビットストリーム・フレームの第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含む。第二のシーケンスは、第二の平均フレーム長を示す。
【0079】
本方法は、第一および第二のシーケンスの間の遷移点を検出し、遷移点の直前のビットストリーム・フレームの第一のシーケンスから第一のビットストリーム・フレームを決定することを含む。加えて、本方法は、第一のビットストリーム・フレームの第一のカウンタ値q1を決定することを含む。さらに、本方法は、遷移点の直後のビットストリーム・フレームの第二のシーケンスから第二のビットストリーム・フレームを決定し、第二のビットストリーム・フレームの第二のカウンタ値q2を決定することを含む。本方法はさらに、遷移点が接合点であるかどうかを、第一のカウンタ値q1、第二のカウンタ値q1、第一の平均フレーム長および第二の平均フレーム長に基づいて決定することを含む。
【0080】
あるさらなる側面によれば、ソフトウェア・プログラムが記述される。ソフトウェア・プログラムは、プロセッサ上での実行のために、かつ該プロセッサ上で実行されたときに本稿において概説される方法段階を実行するために適応されていてもよい。
【0081】
もう一つの側面によれば、記憶媒体が記述される。記憶媒体は、プロセッサ上での実行のために、かつ該プロセッサ上で実行されたときに本稿において概説される方法段階を実行するために適応されたソフトウェア・プログラムを有していてもよい。
【0082】
もう一つの側面によれば、コンピュータ・プログラム・プロダクトが記述される。コンピュータ・プログラムは、コンピュータ上で実行されたときに本稿において概説される方法段階を実行するための実行可能命令を含んでいてもよい。
【0083】
本特許出願において概説される好ましい実施形態を含む方法およびシステムは、単独で、あるいは本稿に開示される他の方法およびシステムとの組み合わせで使われてもよいことを注意しておくべきである。さらに、本特許出願において概説される方法およびシステムのすべての側面は、任意に組み合わされうる。特に、請求項の特徴は、任意の仕方で互いに組み合わされうる。
【図面の簡単な説明】
【0084】
本発明は、付属の図面を参照して例示的な仕方で下記に説明される。
図1a】例示的な再サンプリング器の概念図である。
図1b】再サンプリング器のポリフェーズ実装の例示的な構造を示す図である。
図2】再サンプリング器の入力サンプルと出力サンプルとの間の例示的な関係を示すテーブルである。
図3】例示的な再サンプリング・システムのブロック図である。
図4】フェーズ・インデックスのシーケンスを決定するための例示的な方法のフローチャートである。
図5】aは例示的なダウンミックス・システムのブロック図であり、bは例示的なアップミックス・システムのブロック図であり、cはもう一つの例示的なダウンミックス・システムのブロック図である。
図6】aは複数のアクセス単位を有する例示的なオーディオ・ビットストリームの構造を示す図であり、bは複数のアクセス単位を有するもう一つの例示的なオーディオ・ビットストリームの構造を示す図である。
【発明を実施するための形態】
【0085】
図1aは、例示的な有理再サンプリング器100の概念を示している。有理再サンプリング器100は、入力オーディオ信号110のサンプルをアップサンプリングされたオーディオ信号111のL個のサンプルに変換するL倍アップサンプリング器101を有する。これは、入力オーディオ信号110の二つのサンプルの間にL−1個の0を挿入することによって達成されてもよい。その後、アップサンプリングされたオーディオ信号は、伝達関数H(z)をもつアンチエイリアシング/アンチイメージング・フィルタ102によってフィルタリングされる。これは、フィルタリングされたオーディオ信号112を与える。最後に、フィルタリングされたオーディオ信号112はM分の1間引き器またはダウンサンプリング器103に渡され、該M分の1間引き器はフィルタリングされるオーディオ信号112のM番目毎のサンプルのみを保持して、それにより再サンプリングされた(または出力の)オーディオ信号113を与える。32kHzのサンプリング・レートの入力オーディオ信号110の48kHzのサンプリング・レートの出力オーディオ信号113への再サンプリングの場合、Lは3、Mは2である。44.1kHzのサンプリング・レートの入力オーディオ信号110の48kHzのサンプリング・レートの出力オーディオ信号113への再サンプリングの場合、Lは160、Mは147である。
【0086】
フィルタ102は、入力サンプリング・レートのL倍または出力サンプリング・レートのM倍の中間周波数(IF)で動作することを注意しておくべきである(たとえば、上述した場合についてはIF=M×48kHz)。これは、アンチエイリアシング・フィルタ102は典型的には高いサンプリング・レートで動作するということを意味し、そのため計算的なフィルタ演算の数の低減が望ましい。換言すれば、有理再サンプリング器100の全体的な計算的な複雑さを低減するために、アンチエイリアシング・フィルタ102の必要とされる係数の数を減らすことが望ましい。
【0087】
フィルタは、図1bに示されるようなポリフェーズFIR(有限インパルス応答)実装として実現されてもよい。そのような実装は、フィルタ102によってフィルタリングされるアップサンプリングされたオーディオ信号111は入力オーディオ信号110のサンプルの間にL−1個の0を含むという事実を活用する。結果として、「0」の乗算および加算は省略できる。さらに、ポリフェーズ実装は、その後のM分の1間引き器103のため、フィルタリングされるオーディオ信号112のM番目毎のサンプルしか決定される必要はないという事実を活用する。フィルタ実装の間にこの情報を活用することにより、乗算および/または加算演算の数が著しく低減されることができ、それにより有理再サンプリング器100の計算上の複雑さが軽減される。にもかかわらず、再サンプリング器100の計算上の複雑さをさらに低減することが望ましい。
【0088】
図1bは、ポリフェーズ・フィルタ102を有する例示的な再サンプリング器120を示している。ポリフェーズ・フィルタ102は複数のフェーズ121を有する。ここで、各フェーズ121は全体的な伝達関数H(z)をもつフィルタ102のサブフィルタ123を有する。Nがフィルタ係数hnの総数であり、n=0,…,N−1であるとして、
【数4】
の場合、全伝達関数は、
【数5】
により、L個のフェーズ121のL個のサブフィルタ123についてのL個のサブ伝達関数に細分されてもよい。l=1,…,Lであるとして、サブ伝達関数(チルダ付きのHl(z))は、次式によって与えられてもよい。
【0089】
【数6】
図1bは、伝達関数
【数7】
の、遅延ユニット122(z-l+1を実装するため)、フィルタ123(Hl(z)を実装するため)および加算ユニット124(〔数7〕の総和を実装するため)を用いたポリフェーズ実装を示している。
【0090】
上記の公式から、L倍アップサンプリング器101は、n=0,…,N/L−1の遅延z-Lnを遅延z-nによって置換することによってポリフェーズ・フィルタに含まれることができることが見て取れる。さらに、M分の1ダウンサンプリング器103は、単にポリフェーズ・フィルタのM番目毎の出力サンプルを決定することによって取り入れられることができる。
【0091】
図2は、出力オーディオ信号113のサンプル203が、再サンプリング器120のポリフェーズ実装を使って、入力オーディオ信号110のサンプル204からどのように決定されるかを示している。図2は、再サンプリング比3/2、すなわちL=3およびM=2についての場合を示している。フィルタ102はN=9個の係数hn(参照符号201)を有する。n=0,…,N−1である。係数201は図2ではそれぞれ係数a,b,c,…,Iと記されている。ポリフェーズ実装は、図2ではフェーズ・インデックス202によって記されるL=3個のフェーズ121を含む。
【0092】
入力サンプル204(すなわち入力オーディオ信号110のサンプル)は、図2の表の第一列(左側の列)に示されており、数1,2,3,…によって同定されている。入力オーディオ信号110が因子L=3によりアップサンプリングされているため、図2の表の第一列では、入力サンプル204の間に二つの0の値が挿入されている。図2の表の右側の列は、数1,2,3,…によって同定されている出力サンプル203(出力オーディオ信号113のサンプル)を示している。該信号はM=2の因子によりダウンサンプリングされるので、出力サンプルの間に一つの0の値が挿入されている(それにより、表のこの行の出力が無視されることを示している)。(図2の表の左側の)入力サンプル204と(図2の表の右側の)出力サンプル203との間の値はフィルタ遅延線を表わす。該遅延線は、各入力サンプル204が各時間ステップにおいて一つ右に(表のあるラインから次のラインに)シフトされることを保証する。よって、図2の表の各ラインは、アップサンプリングされたサンプリング・レート(すなわち、入力オーディオ信号101のサンプリング・レートにサンプリング因子Lを乗算したもの)のある時点における再サンプリング器120の状態のスナップショットを表わす。時間の流れは図2の表の上から下である。あるいは、換言すれば、時間は図2の表の上から下へと増大する。
【0093】
(0でない図2の表の右側の列の数に対応する)出力サンプル203のシーケンス全体を決定するためには、一つおきの時間ステップ(すなわち表の一つおきのライン)が考慮され、次の計算(ここで、「0」の乗算は省略できる)が実行されることが見て取れる。出力サンプル#1ないし出力サンプル#3は解析されない。これらの出力サンプル203は再サンプリング器120の初期化フェーズに対応するからである。にもかかわらず、本稿の知見は、これらの出力サンプル203にも当てはまる。出力サンプル#4は3×a+2×d+1×gによって決定され(ここで、数字は入力サンプル204を表わす)、出力サンプル#5は3×c+2×f+1×iによって決定され(ここで、数字は入力サンプル204を表わす)、出力サンプル#6は4×b+3×e+2×hによって決定される(ここで、数字は入力サンプル204を表わす)。その後の出力サンプル203は、再帰的な仕方で決定される。すなわち、出力サンプル#7は出力サンプル#4と同じ係数を使って決定され、出力サンプル#8は出力サンプル#5と同じ係数を使って決定され、出力サンプル#9は出力サンプル#6と同じ係数を使って決定される、などとなる。
【0094】
図2の例から、出力サンプル203を生成するためにある時点においてはフィルタ係数の部分集合しか使われていないことが見て取れる。すなわち、出力サンプル#4については、フィルタ係数a、d、g、すなわち第一のサブフィルタ123(すなわち、H1(z))のフィルタ係数が使われ、出力サンプル#5については、フィルタ係数c、f、i、すなわち第三のサブフィルタ123(すなわち、H3(z))のフィルタ係数が使われ、出力サンプル#6については、フィルタ係数b、e、h、すなわち第二のサブフィルタ123(すなわち、H2(z))のフィルタ係数が使われ、以下再帰的な仕方で同様。
【0095】
上記で概説したように、フィルタ係数の各部分集合、すなわち各サブフィルタ123は、フィルタ・フェーズまたはフェーズ121と称されることがある。図2は、フェーズ・インデックスl 202を示している。ここで、係数の各部分集合(すなわち各サブフィルタ123)はフェーズ・インデックス202に関係している。フェーズ・インデックスl=1をもつフェーズ121のサブフィルタ123はフィルタ係数a、d、gを有し、フェーズ・インデックスl=2をもつフェーズ121のサブフィルタ123はフィルタ係数b、e、hを有し、フェーズ・インデックスl=3をもつフェーズ121のサブフィルタ123はフィルタ係数c、f、iを有する。これは、上述した公式
【数8】
によっても示される。ここで、l=1,…,Lである。
【0096】
上記の分析から、各出力サンプル203から次の出力サンプル203にかけて、フェーズ・インデックスが変わることが見て取れる。再サンプリング比3/2の例について、フェーズ・インデックス202のシーケンスはl=1,3,2,1,3,2,…である。一般的に、以下のことが観察される。
【0097】
・各出力サンプル203は、単一のサブフィルタ123(Hl(z))を使って決定される。換言すれば、出力オーディオ信号113の各出力サンプル203は、フィルタ102のポリフェーズ実装の単一フェーズ121を使って決定される。
【0098】
・出力サンプル203を決定するために使われるサブフィルタ123は特定のフェーズ・インデックス202(l)によって同定される。
【0099】
・出力オーディオ信号103の出力サンプル203を決定するために使われるフェーズ・インデックス202の数は有限である(典型的にはフェーズ・インデックス202の数はアップサンプリング因子Lに対応する)。
【0100】
・出力サンプル203のシーケンスについてのフェーズ・インデックス202のシーケンスは、反復的または周期的である。すなわち、フェーズ・インデックス202のシーケンスは、繰り返される諸サブシーケンスを含む(上述した例では、サブシーケンス1,3,2が反復されている)。
【0101】
・(周期的に繰り返される)各サブシーケンスは全フィルタ102のすべてのフェーズ121またはすべてのフェーズ・インデックスl=1,…,Lを含む。
【0102】
・諸フェーズ・インデックス202は、必ずしも昇順または逐次順で互いに続かない。特に、フェーズ・インデックスのシーケンスのフェーズ・インデックス202は、より高いフェーズ・インデックスからより低いインデックスにジャンプし、より高いフェーズ・インデックスに再び戻ることがある。このことは、3/2再サンプリング器の例に見られる。ここでは、出力サンプル203のシーケンスを決定するためのフェーズ・インデックスのシーケンスはl=1,2,3ではなく、l=1,3,2である。
【0103】
図2から、(隣り合うフェーズ・インデックスの一つまたは複数の対について)フェーズ・インデックスのシーケンスの二つの隣り合うフェーズ・インデックスの間の差はM MOD Lに対応することが規定されてもよい。特に、フェーズ・インデックスのシーケンスの、第一のフェーズ・インデックスと直後のフェーズ・インデックスとの間の差は、直後のフェーズ・インデックスが第一のフェーズ・インデックスより大きく、かつ最大フェーズ・インデックスL以下である場合には、M MOD Lに対応してもよい。他方、第一のフェーズ・インデックスとM MOD Lの和が最大フェーズ・インデックスLより大きい場合には、フェーズ・インデックスは、最大フェーズ・インデックスLから、最小フェーズ・インデックス1と最大フェーズ・インデックスLとの範囲内のより小さなフェーズ・インデックスにラッピングされてもよい。
【0104】
異なる変換比、たとえば11/13(すなわちL=11、M=13)を考えるときは、出力サンプルのシーケンスを決定するためのフェーズ・インデックスのサブシーケンスがl=1,3,5,7,9,11,2,4,6,8,10と与えられることが見て取れる。フェーズ・インデックスのこのサブシーケンスが繰り返されてフェーズ・インデックスの全シーケンスをなす。
【0105】
組み込みシステムでは、フィルタ計算を開始する前に前もってフェーズ・インデックスのシーケンスを知っておくことが望ましい。すなわち、初期化の時点においてフェーズ・インデックスのシーケンスを知るまたは決定することが望ましい。初期化時にフェーズ・インデックスのシーケンスを計算し、該シーケンスを配列に記憶することは、各出力サンプルのための計算を節約するという利点を提供する。特定の出力サンプル203のためにフェーズ・インデックス202を計算する代わりに、特定の出力サンプル203についてのフェーズ・インデックス202は事前計算された配列から読まれることができ、対応するサブフィルタ123へのポインタが設定されることができる。そのようなルックアップ動作は、ランタイムの間のフェーズ・インデックス202の計算および/またはサブフィルタ123の同定より、実質的に効率的である。
【0106】
図3は、例示的な再サンプリング・システム300のブロック図である。システム300は、(入力オーディオ信号110の)入力サンプル204のシーケンスから(出力オーディオ信号113の)出力サンプル203のシーケンスを決定するよう構成されている。システム300は、たとえばオーディオ・エンコーダまたはオーディオ・デコーダ・システムに組み込まれた、組み込みシステムであってもよい。システム300は、処理ユニット301、たとえばデジタル信号プロセッサ(DSP)を有していてもよい。処理ユニット301は、入力サンプル204および出力サンプル203のリアルタイム処理を実行するよう構成されていてもよい。特に、処理ユニット301は、入力オーディオ信号110の一つまたは複数の入力サンプル204から出力オーディオ信号113の一つまたは複数の出力サンプル203を(リアルタイムで)決定するよう構成されていてもよい。pは(出力オーディオ信号113のサンプリング・レートに応じた)サンプル・インデックスであるとして、出力サンプル203はy[p]と記されてもよい。処理ユニット301は、現在の出力サンプルy[p]を決定するための現在のフェーズ・インデックスlpを選択するよう構成されていてもよい。現在のフェーズ・インデックスlpは、現在の出力サンプルy[p]の直前の直前出力サンプルx[p−1]のために使われた直前のフェーズ・インデックスlp-1に基づいて決定されてもよい。現在のフェーズ・インデックスlpを決定するために、処理ユニット301は、(システム300のメモリ・ユニットに記憶されている)所定のフェーズ・ルックアップテーブル302を参照してもよい。所定のフェーズ・ルックアップテーブル302は、直前のフェーズ・インデックスlp-1に基づいて(たとえばその関数として)現在のフェーズ・インデックスlpを提供してもよい。
【0107】
あらかじめ決定されたフェーズ・ルックアップテーブル302は、特定の再サンプリング比L/Mについてのフェーズ・インデックスのシーケンスを反映してもよい。例として、再サンプリング比3/2について、フェーズ・ルックアップテーブル302は表1の形を有していてもよい。表1から見て取れるように、再サンプリング比L/Mについてのあらかじめ決定されたフェーズ・ルックアップテーブル302はL個の項目を含む。よって、あらかじめ決定されたフェーズ・ルックアップテーブル302は、出力サンプル203のシーケンスを決定するための(すなわち、出力オーディオ信号113を決定するための)フェーズ・インデックスのシーケンスをなすよう繰り返されるフェーズ・インデックスのサブシーケンスを示してもよい。
【0108】
【表1】
システム300は、複数の異なる再サンプリング比L/Mについての複数のフェーズ・ルックアップテーブル302を有していてもよい。再サンプリング比L/Mは、構成設定データ311として、処理ユニット301に提供されてもよい。構成設定データ311はアップサンプリング因子Lおよび/またはダウンサンプリング因子Mを示していてもよい。処理ユニット301は次いで、構成設定データ311によって与えられる再サンプリング比L/Mについて使用されるべきインデックス・フェーズ202の(サブ)シーケンスを示すフェーズ・ルックアップテーブル302を選択するよう構成されていてもよい。
【0109】
システム300は、現在の出力サンプルy[p]を決定するために使われるべきサブフィルタ123を提供するフィルタ・ルックアップテーブル303をさらに有していてもよい。換言すれば、フィルタ・ルックアップテーブル303は、現在の出力サンプルy[p]を決定するために、一つまたは複数の対応する入力サンプル204にそれぞれ適用されるべき前記一つまたは複数のフィルタ係数201を提供してもよい。さらに言い換えれば、フィルタ・ルックアップテーブル303は、種々のフェーズ・インデックスl 202についてサブフィルタ123のフィルタ係数201を提供してもよい。異なるフェーズ・インデックスlについてフィルタ係数201の異なる集合が提供されてもよい。よって、フィルタ・ルックアップテーブル303は、現在のフェーズ・インデックスlpに基づいて、(現在の出力サンプルy[p]を決定するために使われるべき)フィルタ係数の現在集合を提供してもよい。例として、再サンプリング比3/2について、全部でN=9個のフィルタ係数201を有するアンチエイリアシング/アンチイメージング・フィルタ102について、フィルタ・ルックアップテーブル303は表2の形を有していてもよい。
【0110】
【表2】
フェーズ・ルックアップテーブル302と同様に、システム300は、異なるアップサンプリング因子Lについて、異なるダウンサンプリング因子Mについておよび/または異なるフィルタ係数201の数Nについて、複数のフィルタ・ルックアップテーブル303を有していてもよい。上記のように、構成設定データ311がアップサンプリング因子Lおよび/またはダウンサンプリング因子Mを示していてもよい。代替的または追加的に、構成設定データ311は、使用されるべきフィルタ係数の数Nを示していてもよい。
【0111】
フェーズ・ルックアップテーブル302を使ってインデックス・フェーズ202の(サブ)シーケンスを決定し、次いでフィルタ・ルックアップテーブル303を使って現在のフェーズについて使われるべき前記一つまたは複数のフィルタ係数201を決定する代わりに、組み合わされたフェーズ/フィルタ・ルックアップテーブルが定義されてもよいことを注意しておくべきである。組み合わされたフェーズ/フィルタ・ルックアップテーブルは、(フィルタ・ルックアップテーブル303と同様に)異なるフェーズ・インデックスl 202についてのサブフィルタ123のフィルタ係数201を提供してもよく、ここで、異なるフェーズ・インデックスl 202は(たとえばフェーズ・ルックアップテーブル302によって与えられるような)インデックス・フェーズ202の(サブ)シーケンスに従って順序付けられる。表3は、再サンプリング比3/2について、全部でN=9個のフィルタ係数201を有するアンチエイリアシング/アンチイメージング・フィルタ102について、組み合わされたフェーズ/フィルタ・ルックアップテーブルを示している。
【0112】
【表3】
フェーズ・インデックスの(サブ)シーケンスに従って順序付けされた組み合わされたフェーズ/フィルタ・ルックアップテーブルを使う結果、モジュロLポインタは、現在の出力サンプルy[p]を計算したあと、次の出力サンプルy[p+1]を計算するために使われるべきフィルタ係数を見出すためにインクリメントされうる。よって、出力サンプルy[p]を決定するためのフィルタ係数が単一のルックアップ動作のみを使って決定されうる。
【0113】
よって、システム300は、計算効率のよいルックアップ動作を使って、たとえばフェーズ・ルックアップテーブル302および/またはフィルタ・ルックアップテーブル303および/または組み合わされたフェーズ/フィルタ・ルックアップテーブルを使って、現在の出力サンプルy[p]を決定するために使われるべきフィルタ係数の集合を決定するよう構成されうる。フィルタ係数の集合は、R個のフィルタ係数を含んでいてもよい。ここでRは典型的には比N/L(またはそれに最も近い整数値)に等しい。フィルタ係数の集合は、フィルタの式
【数9】
を使ってR個の入力サンプルx[q]から現在の出力サンプルy[p]を決定するために使われるサブフィルタを定義する。ここで、フィルタ係数(r=0,…,R−1として、^付きのhr)は現在のサブフィルタ123についてのフィルタ係数の集合をなす。フィルタ係数(r=0,…,R−1として、^付きのhr)は全体的なフィルタ102のフィルタ係数hn(n=0,…,N−1)の部分集合に対応する。典型的には、フェーズ・インデックスlをもつフェーズ121についてのフィルタ係数(^付きのhr)の集合は
【数10】
に対応する。
【0114】
出力オーディオ信号113のサンプル・インデックスpと入力オーディオ信号110のサンプル・インデックスqとの間の関係は典型的には再サンプリング比L/Mに依存する。出力サンプルy[p]を決定するために使われる前記一つまたは複数の入力サンプル204 x[q−r](r=0,…,R−1)は典型的には、関係式p=(L/M)qに基づいて決定されてもよい。
【0115】
システム300、特に処理ユニット301は、アップサンプリング因子Lに基づき、かつダウンサンプリング因子Mに基づいて、フェーズ・ルックアップテーブル302および/またはフェーズ・インデックスの繰り返されるサブシーケンスを決定するよう構成されていてもよい。この目的のために、システム300および/または処理ユニット301は、力づくのアプローチを使ってもよい。フェーズ・インデックスの周期的なサブシーケンスを決定する方法は、順序付けられた数を含む基本ベクトル[1;L]、たとえばL=3については[1 2 3]を生成することを含んでいてもよい。この基本ベクトルはM回連結されて、連結ベクトル[[1;L][1;L]…]、たとえばL=3、M=2については連結ベクトル[[1 2 3][1 2 3]]を与えてもよい。さらに、本方法は、連結ベクトルのM番目毎の項目を除去する段階を含んでいてもよい。L=3、M=2の場合、項目2,1,3(左から右)が連結ベクトル[[1 2 3][1 2 3]]から除去され、間引きされたベクトル[1 3 2]を与える。間引きされたベクトルは、フェーズ・インデックスのサブシーケンスに対応し、これは出力サンプルのシーケンスを決定するために繰り返される。
【0116】
フェーズ・インデックスの繰り返されるべきサブシーケンスを決定する上述した方法が、L×M個の項目を含む連結ベクトルの決定を含むことを注意しておくべきである。この数はきわめて大きいことがある。たとえば、48000Hzから44100Hzへのサンプリング・レート変換はL=147、M=160の比に対応し、これについては、連結ベクトルは23530個の項目を含む。よって、フェーズ・インデックスのサブシーケンスおよび/またはフェーズ・ルックアップテーブル302の決定は、実質的なメモリ資源を利用することがある。これに鑑み、フェーズ・インデックスのサブシーケンスを決定するおよび/またはフェーズ・ルックアップテーブル302を決定するためのさらなる方法であって、メモリ資源に関してより効率的であるものが記述される。
【0117】
後述する方法は、システム300のメモリに記憶される必要のある連結ベクトルを利用しない。この方法は、表4の擬似コードの仕方で記述される。
【0118】
【表4】
図4は、フェーズ・インデックス・ベクトルphase_array[i](i=1,…,L)を決定するための例示的な方法400フローチャートを示している。例示的な方法400は、表4に示される方法に対応する。方法400は、フェーズ・インデックス「1」をフェーズ・インデックス・ベクトルの最初の項目として選択する段階401を含む。さらに、方法400は、補助変数itmpおよびベクトル変数iを初期化する段階402を含む。段階403では、ベクトル変数iがL以下であるかどうか(すなわち、フェーズ・インデックス・ベクトルがすでに完全に決定されているかどうか)が検証される。段階404では、補助変数itmpがダウンサンプリング因子Mを超えるまで、補助変数itmpがきざみLで増される。次いで、段階405では、補助変数itmpはMだけ減らされる。結果として得られる補助変数itmpはフェーズ・インデックス・ベクトルにおけるi番目の項目についてのフェーズ・インデックス、すなわちphase_array[i]を決定するために使われてもよい(段階406および407)。段階403ないし407は次いで、次のベクトル項目のために繰り返される。これをL番目のベクトル項目まで行なう。
【0119】
(フェーズ・インデックスのサブシーケンスを示す)フェーズ・インデックス・ベクトルを決定するための方法400は、必要とされるメモリに関して特に効率的である。さらに、この方法は、たとえば除算や乗算を必要とせずに加算および減算を利用するだけなので計算効率もよい。これは、組み込みシステムにとって特に有益である。
【0120】
フェーズ・インデックスのサブシーケンスを決定するためのさらなる手法は次の公式によって与えられる。i=1,2,…,Lについて、
P(i)=1+[M*(i−1) MOD L]
ここで、P(i)がフェーズ・インデックスのサブシーケンスのi番目のフェーズ・インデックスに対応する。上記の公式から、フェーズ・インデックスLには再びフェーズ・インデックス1が続くことを考慮に入れつつ(すなわち、最大フェーズ・インデックスLにおけるフェーズ・インデックスのラップアラウンドを考慮に入れることにより)、二つの隣り合うフェーズ・インデックスの間の差がΔ=[M MOD L]でありうることが見て取れる。特に、フェーズ・インデックスが最大フェーズ・インデックスLからより低いフェーズ・インデックスにラップする場合のほかは、二つの隣り合うフェーズ・インデックスの間の差はΔ=[M MOD L]となりうる。
【0121】
フェーズ・インデックスのサブシーケンスを決定するための再帰的な公式が次式によって与えられてもよい。i=1,2,…,L−1について、
P(i+1)=1+[P(i)−1+(M MOD L)] MOD L
ここで、P(i)がフェーズ・インデックスのサブシーケンスのi番目のフェーズ・インデックスに対応し、たとえばP(1)=1である。
【0122】
フェーズ・インデックスのサブシーケンスを決定するためおよび/またはフェーズ・ルックアップテーブル302を決定するための上述した諸方法は、アップサンプリング(L>M)およびダウンサンプリング(L<M)に適用可能であることを注意しておくべきである。
【0123】
よって、本稿は、計算効率がよくメモリ効率がよい仕方で入力オーディオ信号110を再サンプリングするよう構成されている再サンプリング・システム300を記述する。システム300は、資源効率のよい仕方でフェーズ・インデックスのシーケンス(たとえばフェーズ・ルックアップテーブル302)を決定するよう構成されていてもよい。さらに、システム300は、一つまたは複数のフェーズ・ルックアップテーブル302および/または一つまたは複数のフィルタ・ルックアップテーブル303を利用して、出力オーディオ信号113の現在のサンプルy[p]を決定するために使用されるべきフィルタ係数(^付きのhr;r=0,…,R−1)の現在の集合を決定してもよい。そのようなルックアップ動作の結果として、再サンプリング器300の計算上の複雑さが軽減されうる。
【0124】
以下では、オーディオ・エンコードおよびデコード・システムの諸側面が記述される。これらの側面は、マルチチャネル・オーディオ信号の異なるチャネルの間のフェーズ関係に向けられる。さらに、これらの側面は、オーディオ・ビットストリームの設計に向けられる。
【0125】
マルチチャネル(たとえば5.1)オーディオ信号が五つの離散的なオーディオ・スピーカーを通じて再生されないのが典型的な使用事例である。その代わりに、マルチチャネル・オーディオ信号は、再生または伝送のために、低減した数のチャネルに、たとえば二つ(L/R)または三つ(L/C/R)のチャネルにダウンミックスされることがある。ダウンミックスはデジタル領域で実行されてもよい。あるいはまた、マルチチャネル・オーディオ信号はいわゆるヘッドフォン仮想化器(バイノーラライザーとも称される)に入力されてもよく、該ヘッドフォン仮想化器はマルチチャネル・オーディオ信号をヘッドフォンを通じて仮想部屋環境においてレンダリングするよう構成されている。
【0126】
ダウンミックスは、セットトップボックス(STB)内に配置されていてもよいオーディオ・デコーダによって(デコーダ処理の一環として)実行されてもよい。ダウンミックス・プロセスはいわゆる行列エンコードを利用してもよい。次いで、オーディオ・デコーダ(たとえばSTB)はダウンミックスされたオーディオ信号を実際の再生装置(たとえば、オーディオ/ビデオ・レシーバーAVR)に与えてもよい。ここで、オーディオ・デコーダと実際の再生装置との間のリンクは低減された数のチャネルに限定されてもよい。(たとえばオーディオ・デコーダにおける)ダウンミックスの時点では、実際の再生構成についての詳細な情報は利用可能でないことがあることを注意しておくべきである。
【0127】
実際の再生装置が、完全なマルチチャネル・オーディオ信号をレンダリングするために十分なスピーカーを有するまたは十分なチャネル入力をもつヘッドフォン仮想化器を含むということがありうる。この場合、実際の再生装置は、ダウンミックスされたオーディオ信号からマルチチャネル・オーディオ信号への行列アップミックス・プロセス(行列デコード・プロセスとも称される)を実行してもよい。そのようなアップミックス方式の例はドルビー・サラウンド、ドルビー・プロロジックまたはドルビー・プロロジックIIアップミックス方式である。
【0128】
図5のaは、四つのもとの源オーディオ信号(マルチチャネル・オーディオ信号のチャネルとも称される)を二チャネル・オーディオ信号にダウンミックスする例示的なダウンミックス・システム500を示している。もとのオーディオ信号は左(L)チャネル501、右(R)チャネル503、中央(C)チャネル502およびサラウンド(S)チャネル504を含む。ダウンミックスされたオーディオ信号は左総合(Lt)チャネル511および右総合(Rt)チャネル513を有する。用語「総合」(total)は、ダウンミックスされたオーディオ信号のチャネルが(それぞれ左および/または右チャネルからだけでなく)一つまたは複数の他のチャネルからの情報をも含むことを示す。
【0129】
図5のaの場合、四つの「主要」入力信号または入力チャネル:左501、中央502、右503およびサラウンド504がある(L,C,R,S)。LおよびR入力は修正なしにそれぞれLtおよびRtダウンミックス出力に直接与えられる。C入力は、ダウンミックス信号において一定の音響パワーを維持するために、(もとの入力信号に比べて)たとえば3dBのレベル低減をもってLtおよびRtダウンミックス出力に等分される。S入力も3dBだけ低減されてもよいが、LtおよびRtダウンミックス出力の間で等分される前に、該信号は(位相シフト・ユニット505を使って)L、CおよびRに対して90度の位相シフトを適用されてもよい。これは、ダウンミックス・チャネルLt、Rt 511、512内でのサラウンド・チャネルの識別のために有益でありうる。さらに、S信号504はLt/Rtチャネルにおいてそれぞれ逆極性で担持されてもよい。これは、Lt出力をフィードする加算段において「−」符号によって実装される。
【0130】
図5のbは、ダウンミックス・チャネル511、512から左(L)チャネル521および右(R)チャネル523のほかにサラウンド(S)チャネル524を生成するよう構成されている例示的なアップミックス・システム520を示している。この目的のために、アップミックス・システム520は、減算ユニット555を使ってLt信号511からRt信号513を減算するよう構成される。図5のbの例では、左(L)チャネル521および右(R)チャネル523はそれぞれLtチャネル511およびRtチャネル513に対応する。
【0131】
S信号504のみ(C信号502なし、L、R信号501、503なし)がダウンミックス・システム500において存在する場合には、LtおよびRtにおける信号は同一だが逆極性であることが見て取れる。これらの信号がアップミックス・システム520において減算されるとき、信号511、513は所望に応じて(90度の位相シフトをもつがもとのサラウンド信号504と同一である)サラウンド出力信号524を生成する。さらに、C信号502のみ(S信号504なし、L、R信号501、503なし)がダウンミックス・システム500において存在する場合には、LtおよびRtにおけるC成分は同一である。アップミックス・システム520において減算されるとき、これらのC成分は互いに完全に打ち消し合い、S出力には無音のみを残す。これはやはり所望される結果である。このことは、CおよびSチャネルの間の高いチャネル分離が達成されうることを示している。しかしながら、LtおよびRt信号がランダムである(そして純粋にCまたはS信号を含むのでない)場合、アップミックス・システム520の減算ユニット525はS出力524において差信号を生成する。結果として、もとの諸チャネルがもはや完璧な仕方で分離されることができない。前方とサラウンドとの間のチャネル分離は3dBの小ささでありうる。
【0132】
マルチチャネル・オーディオ信号のもとのチャネルの不完全な分離は、部分的には、好適な行列エンコード(またはダウンミックス)プロセス(たとえばドルビー・サラウンド・エンコード)によって克服できる。図5のaのコンテキストにおいて示されるように、ダウンミックス、たとえば3/2から2/0へのまたは3/1から2/0へのダウンミックスは典型的には、行列エンコード(またはダウンミックス)・プロセスの前に(またはその間に)サラウンド・チャネル504に対して90度の位相シフト505を含む。
【0133】
上記のインフラストラクチャー制約条件を与えられ、5.1素材のマスタリング段(すなわち、オーディオ・データをたとえばDVDまたはブルーレイ上への記憶のためまたは放送送信のためにエンコードするとき)を見るとき、マルチチャネル・オーディオ信号が十分な数のスピーカーを通じて「ネイティブに」再生されるかどうか、あるいはマルチチャネル・オーディオ信号が(たとえば図5のbに示されるような)行列デコード・プロセスが後続してもよい(たとえば図5のaに示されるような)行列エンコード・プロセスを使ってダウンミックスされるかどうかは通例、既知ではない。
【0134】
チャネル分離のための90度の位相シフト505の恩恵のため、マルチチャネル・オーディオ信号をエンコードする前のマスタリング段においてすでに90度の位相シフトを適用することによる行列エンコード・システム500の上述した90度の位相シフト505を予期することが一般的となっている。結果として、符号化された離散的なマルチチャネル・オーディオ信号はすでに前記一つまたは複数のサラウンド・チャネル504において90度の位相シフトを担持している。結果として、90度位相シフトが二度適用されるのを避けるために、行列エンコード・システムは位相シフト・ユニット505を有するべきではない。そのような行列エンコードまたはダウンミックス・システム530は図5のcに示されている。行列エンコード・システム530が、図5のaのシステム500によって受領されたサラウンド(S)チャネル504に関して90度位相シフトされている修正されたサラウンド(S'')チャネル534を受領することが見て取れる。
【0135】
すでに一つまたは複数の90度位相シフトされたサラウンド・チャネルを有しているマルチチャネル・オーディオ信号を提供する手法は、フル・マルチチャネル・セットアップにおいてはオーディオ信号の再生を最小限に劣化させるだけであることが判明している。一方、同時に、行列エンコードおよびデコードの場合のチャネル分離を改善する。しかしながら、そのような位相シフトされたマルチチャネル・オーディオ信号を提供する手法は、行列エンコード段500がすでにシフトされたサラウンド・チャネル504を認識しない場合にはエンコード段500がさらなる90度位相シフトを前記一つまたは複数のサラウンド・チャネル504に適用するかもしれないというリスクを帯びている。前方チャネル501、503からのコンテンツと同相であるサラウンド・チャネル504の内容については、これは、(合計180度の位相シフトのため)望ましくない信号打ち消しが生じうることを意味する。そのような信号打ち消しは、マルチチャネル信号が行列エンコードされないがやはり前記一つまたは複数のサラウンド・チャネル504に90度位相シフトを適用するエンコーダを使って離散的な仕方で再エンコードされる場合にも起こりうる。さらに、ヘッドフォン仮想化器における位相シフトされたサラウンド・チャネルを使うことの効果が活用されず、最適でないバイノーラル化結果につながりうる。
【0136】
上述した欠点に対処するために、(位相シフトされない)マルチチャネル・オーディオ信号を提供するよう、オーディオ・エンコーダにおいては(すなわち、マルチチャネル・オーディオ信号を生成するときには)90度の位相シフトを常に省略することが提案される。代わりに、90度位相シフトは対応するオーディオ・デコーダにおいて実行されるべきである。90度位相シフトの適用は、充足される(すなわち真である)べき一つまたは複数の条件のもとで実行されるべきである。これらの条件は、次のことを含んでいてもよい:
・オーディオ・デコーダがオーディオ信号のデコード後に(または該デコード中に)行列ダウンミックス・プロセスを実行することを指示する第一の条件;および/または
・マルチチャネル信号が以前に(たとえばマルチチャネル・オーディオ信号のエンコードの間に)位相シフトされていると信号伝達されていない(同定されない)ことを示す第二の条件。
【0137】
換言すれば、以下のことが提案される。
・オーディオ・エンコーダ内では(マルチチャネル・オーディオ信号を生成するときに)90度の位相処理を省略する。
・マルチチャネル・オーディオ信号の前記一つまたは複数のサラウンド・チャネルがすでに90度位相シフトされている場合には、オーディオ・エンコーダが、位相シフトに関する情報を、対応するオーディオ・デコーダに、ビットストリーム内で伝達できるようにする。
・オーディオ・エンコーダがマルチチャネル・オーディオ信号のサラウンド・チャネルの可能な位相シフトに関する先験的情報をもたない場合には、オーディオ・エンコーダは、マルチチャネル・オーディオ信号の信号解析を実行して、マルチチャネル・オーディオ信号が一つまたは複数の90度位相シフトされたサラウンド・チャネルを含んでいるか否かの確率を導出するよう構成されていてもよい。
・上述した諸条件が満たされる場合には、オーディオ・デコーダが90度位相シフトを実行するよう構成されてもよい。
【0138】
上記のように、本稿は、オーディオ・エンコーダから対応するオーディオ・デコーダに伝送されるビットストリームに関するさまざまな側面にも取り組む。ビットストリームは典型的には、レンダリングされるべきオーディオ信号を示すオーディオ・データを含む。さらに、ビットストリームは典型的には、オーディオ信号がどのようにレンダリングされるべきかについてオーディオ・デコーダに情報を提供するメタデータを有する。
【0139】
ビットストリームは典型的にはフレームのシーケンス(アクセス単位のシーケンスとも称される)に構造化される。オーディオ符号化システムのビットストリーム構造は好ましくは、(好ましくはオーディオ・データをデコードする必要なしに)ビットストリームのレベルで直接ビットストリーム内に含まれるデータの操作を容易にする仕方で設計される。一般に、ビットストリームのフレームは、種々のサブストリームの多重化を含んでいてもよい。該種々のサブストリームは、たとえば、オーディオ・プログラムの異なる言語に(たとえば、ビデオのための異なる言語での異なるオーディオ・トラックに)関係していてもよい。代替的または追加的に、該種々のサブストリームは、異なるビットレートにおける同じオーディオ・データに関係していてもよい。全体的なビットストリームの種々のサブストリームが比較的高いレベルにおいて(サブストリームをデコードする必要なしに)同定され、むき出しにされ、あるいは全体的なビットストリームにマージされることができることが望ましい。サブストリームを同定し、抽出し、および/または全体的なビットストリーム中に挿入するための手段を提供することは、オーディオ・コンテンツの複数の異なるビットレート表現のうちの特定のものが、潜在的には一つの多重化において記憶されうる複数のビットレート表現の多重化から動的に選択される適応的なストリーミングのような用途を容易にする。
【0140】
本稿では、ビットストリーム内に含まれる種々のサブストリームについての情報をビットストリームに提供することが提案される。上記のように、ビットストリーム構造は、オーディオ・コンテンツの異なる表現を一つの多重化されたビットストリーム内に格納することを、各ビットストリーム・フレームが同じ信号を(時間的に)数回含む仕方で許容する。ここで、同じ信号は異なるチャネル・モードおよび/または異なるビットレートでエンコードされる。例として、同じコンテンツは2チャネルおよび5.1チャネルの表現として提供されてもよく、および/または同じコンテンツは異なるオーディオ品質に対応する異なるビットレートで提供されてもよい。
【0141】
図6のaは、フレーム(またはアクセス単位)のシーケンスを含む例示的ビットストリーム600を示している。各フレーム601は、同じオーディオ・コンテンツの異なる表現を含んでいてもよい複数のサブストリーム・フレーム603を含む。異なる表現はたとえば異なるチャネル構成に(たとえば2チャネル構成および/または5.1チャネル構成に)関係してもよい。さらに、フレーム601は、多重化されたフレーム601内に含まれる複数のサブストリーム・フレーム603の目録を提供する制御情報602を含んでいてもよい。制御情報602は、種々の表現を記述する情報および/またはフレーム601内のサブストリーム・フレーム603の位置を同定する情報を含んでいてもよい。
【0142】
図6のaに示されるビットストリーム構造を使って、適応的ストリーミング・サーバーは、前記複数の表現のうちの特定のものを、たとえば特定の時点におけるストリーミング・チャネルを通じた伝送のために好適な特定の表現を、リアルタイムで(すなわちオンザフライで)多重分離することを可能にされてもよい。ストリーミング・チャネルのストリーミング帯域幅が時間的に大きく変わりうるので、これは有益でありうる。制御情報602が、サブストリーム・フレーム603をデコードする必要なしにオーディオ・コンテンツの適切な表現を同定する(すなわち、適切なサブストリーム・フレーム603を識別する)ために十分な情報を含むという事実に鑑み、該特定のサブストリームの多重分離は比較的低い計算コストで実行できる。
【0143】
よって、同じオーディオ・コンテンツの異なる表現のための複数の異なるサブストリームを含むビットストリームに、多重化されたフレーム601内に含まれるサブストリーム・フレーム603の一部または全部のチャネル・モードおよび/またはビットレートについての情報を保持するビットストリーム目録602を提供することが提案される。そのようなビットストリーム目録602の提供は、ストリーミング・クライアントによる要求に応じてどの表現を選び、ストリーム出力するかについての動的な決定を可能にする。適切な符号化フォーマットを使って、制御情報602は、限られた信号伝達オーバーヘッドしか必要としないように設計されることができる。
【0144】
ビットストリーム600のレベルでの可能な操作は、複数のサブストリームを含む多重化されたビットストリーム600を集めることおよびばらすことを含む。特に、該操作は、既存のビットストリーム600へ/からサブストリームを追加および除去することを含む。制御情報603の提供は、サブストリームのそのような追加および/または除去を簡略化する。
【0145】
そのような操作は、たとえば、同じオーディオ・コンテンツの種々の品質を含む多重化されたビットストリームがサーバー上に記憶されるまたは放送施設に組織内で伝送される放送状況において望ましい。再生の時点では、多重化されたビットストリーム600内に含まれるオーディオ・コンテンツのどのバージョンが一つまたは複数の配送リンク(たとえば、デジタル地上波テレビ、衛星、インターネット・ストリーミング)のために使われるかが決定されることができる。異なる配送リンクは異なるビットレート制約条件を有することがあり、よってオーディオ・コンテンツの異なる表現の使用(すなわち多重化されたビットストリーム600の異なるサブストリームの使用)を必要とすることがある。
【0146】
制御情報602の提供は、種々のサブストリームの資源効率のよい同定とともに、多重化されたビットストリーム600からの一つまたはいくつかの所望されるサブストリームの抽出を許容する。サブストリームの抽出後、抽出されたサブストリームは、新たな有効なビットストリーム600に変換されてもよい。ここで、新たな有効なビットストリーム600は、オーディオ・コンテンツの前記種々の表現の部分集合(たとえば一つまたは複数)を含む。
【0147】
制御情報602が生成され、読まれおよび/または一組の規則を使って解釈されてもよい。制御情報602は、多重化されたフレーム601内に含まれるサブストリーム・フレーム603の目次(ToC)を提供してもよい。多重化されたビットストリーム600からサブストリームを抽出するおよび抽出されたサブストリームを別個の新たなビットストリーム中に再挿入する例示的な方法は:
・多重化されたビットストリーム600の各フレーム601について、制御情報602を読む段階と;
・制御情報602から、フレーム601のどの部分603が抽出されるべきサブストリームに対応するかを識別する段階と;
・フレーム601の識別された部分603を出て行くビットストリーム中にコピーするまたは抽出する段階と;
・識別する段階およびコピーする段階を、抽出されるべきサブストリームのサブストリーム・フレーム603を含むビットストリーム600のすべてのフレーム601について、繰り返す段階と;
・出て行くビットストリームのために制御情報602を生成する段階であって、制御情報602は抽出されたビットストリーム部分のみについてである、段階と;
・生成された制御情報602を抽出されたビットストリーム部分603と連結して、出て行くビットストリームのフレーム601を形成する段階とを含む。
【0148】
制御情報またはToC 602は、(チャネル数および/またはビットレートのような)オーディオ・コンテンツの表現に関する情報を含んでいてもよい。代替的または追加的に、制御情報602は、オーディオ・コンテンツの言語についておよび/またはメイン/付随オーディオ関係についての情報を含んでいてもよい。例として、多重化されたビットストリーム600は、メイン・オーディオ信号および付随オーディオ信号に関係する一対のサブストリームを含んでいてもよい。付随するオーディオ信号はたとえば、監督のコメントまたは盲目の/視覚障害のある視聴者のためのテレビ番組についてのシーン記述を含んでいてもよい。消費者が、メイン・トラックのみを聴きたいかどうかまたはメイン信号および付随信号の混合を聴きたいかどうかを選んでもよい。信号がメイン信号であるという識別および/または信号が付随信号であるという識別および/または付随信号が資する目的および/または付随信号がどのメイン信号についてであるかが、ToC 602の一部であってもよい。
【0149】
上記のように、ビットストリーム600は典型的には、エンコードされたオーディオ・データに加えてメタデータおよび/または制御情報を含む。このデータはサイド情報とも称されることがある。そのようなサイド情報(たとえば制御情報602)は典型的には、符号化効率またはビットレート効率を増すために、可変レート・エンコーダを使ってエンコードされる。そのような可変レート符号化に向けた典型的なアプローチは、データの冗長性および統計を解析して、頻繁に出現するデータ語をより短い符号語で符号化し、それほど頻繁に現われないデータ語をより長い符号語で符号化し、それによりデータ損失なしに平均的により短いデータの表現を提供するというものである。そのような符号化技法の例はハフマン符号である。
【0150】
上記とは対照的に、本稿では、付随サブストリームの期待される全体的なビットレートがより小さい場合には、サイド情報をエンコードするためにより短い符号語を使うことが提案される。換言すれば、サイド情報の可変レート符号化は、サイド情報が関連付けられているオーディオ・データのビットレートに依存してもよい。特に、多重化されたビットストリーム600のフレーム601の制御情報602は、可変長符号を使ってエンコードされてもよい。ここで、ここで、種々のサブストリームのために制御情報602をエンコードするために使われる符号語の長さは異なるサブストリームのビットレートに依存する。典型的には符号語の長さはサブストリームのビットレートとともに増大する。
【0151】
例として、多重化されたビットストリーム600の種々のサブストリームのチャネル構成を符号化するために、下記の符号語表(表5)が使われてもよい。
【0152】
【表5】
表5の例では、四つの異なるチャネル構成(またはチャネル・モード)が可能であり、2ビットを使って識別できる。本稿では、関連するサブストリームの全体的なビットレートが比較的低いモノの場合については、モノの場合よりも関連するサブストリームの全体的なビットレートが高い5.1マルチチャネルの場合より短い符号語(たとえば1ビットの符号語)を使うことが提案される。5.1マルチチャネルの場合については、チャネル構成は3ビット符号語で符号化される。5.1マルチチャネル・サブストリームの(モノ・サブストリームに比べて)増大したビットレートのため、制御情報602のために使われる相対的なオーバーヘッドは、モノ・サブストリームについてよりも高くないことがありうる。全体的に、関連するオーディオ・データのビットレートに基づく制御情報602の可変長符号化は、全体的なビットレートに対する要求される制御情報オーバーヘッドのより十分な使用を達成することを許容する。換言すれば、本稿に記載される可変長エンコード方式は、前記複数の異なるサブストリームについて相対的な制御情報オーバーヘッド(関連するオーディオ・データのビットレートに対して相対的)を等化することを許容する。
【0153】
オーディオ・ビットストリームの放送のコンテキストにおいて遭遇するさらなる問題は、ビットストリームの接合である。異なるビットストリームの接合は、たとえば、進行中のビットストリーム内でのプログラム変化の結果として、広告によるプログラムの中断(「広告挿入」)の結果として、および/または異なるプログラムへのユーザー切り換えの結果として、生じることがある。
【0154】
異なるプログラムまたはオーディオ信号の間の接合点は、ビットストリーム内で高レベルで(たとえばMPEG-2トランスポート・ストリームのプログラム・マップ・テーブル(PMT: Program Map Tables)において)信号伝達されうる。しかしながら、ビットストリーム内の接合点に関する情報は、デコード装置(テレビジョンTVおよび/またはセットトップボックスSTB)のコア・オーディオ・デコーダにとっては利用可能でないことがある。たとえ接合点に関する情報がデコード装置において利用可能であったとしても、接合点に関する情報を特定の接合フレームの精度でデコード装置に伝達することは可能でないことがある。さらに、接合点に関する情報は、放送ヘッドエンドにおいて常に正しく設定されるとは限らない。
【0155】
結果として、オーディオ・デコーダは、受領されたビットストリームのデコードされるべきフレームが、受領されたビットストリームの、前に受領されたフレームと同じオーディオ・データのストリームに対応しない状況を認識しないことがありうる。換言すれば、オーディオ・デコーダは、前に受領されたフレームと現在(デコードされるべき)フレームとの間のビットストリーム内の不連続を認識しないことがある。そのような不連続は、オーディオ・データの真正なデコードのために必要とされるパラメータの喪失につながりうる。
【0156】
多くのオーディオ符号化アルゴリズム(高効率先進オーディオ符号化HE-AACおよび統合音声音響符号化USACなど)は、通例、エンコードされたフレームをデコードするためのすべての必要な情報を個々の各エンコードされたフレーム内では伝送しない。ビットレート効率のために、一部の情報は時折(たとえば周期的に)伝送されるだけであってもよい。フレーム・ヘッダ情報は典型的にはフレームごとに変化するものではなく、エンコーダは所与のビットレートについておよび/または所与のチャネル構成について、ヘッダ情報を一定であるよう設定してもよい。結果として、不連続があると、オーディオ・デコーダは、デコードされるべきフレームを正しくデコードするために必要とされるヘッダ情報を認識しないことがある。
【0157】
あるさらなる側面は、デコード・プロセス内で過去の情報に明示的に依拠するエンコード技法の使用である。これらのエンコード技法は、隣り合うフレームにおける共通性を活用することによって、ビットレート節約を提供することに向けられる。そのようなエンコード技法の例は、パラメータのフレーム横断デルタ(cross-frame-delta)エンコードおよびフレーム間予測(inter-frame prediction)技法の使用である。
【0158】
そのような相互依存の結果として、オーディオ・デコーダが接合されたビットストリームを受領するとき、接合点においてパラメータがすでに変わっていたかもしれないという事実が気づかれないままとなりうる。結果として、オーディオ・デコーダは、未定義の条件に駆動されることがあり、および/または可聴なオーディオ・アーチファクトを生成することがありうる。これは、少なくともいくつかの高レベルのビットストリーム・パラメータ(たとえばチャネル数またはオーディオ・サンプリング周波数)が接合点の前後で不変のままでありながら、他の(より特定的な)パラメータが変化するときに特にそうである。
【0159】
本稿では、ビットストリームの一部としてフレーム毎のシーケンス・カウンタを導入することが提案される。通常動作では、相続くオーディオ・フレームが増大するシーケンス・カウンタ数を与えられる。カウンタの分解能が尽くされたときにはラップアラウンド(たとえば1へのリセット)が適用されてもよい。シーケンス・カウンタは、オーディオ・デコーダが、二つの相続くフレームにおいてシーケンス・カウンタが1だけ(または所定の量だけ)増加しているのではないことを検出できるようにする。シーケンス・カウンタの不連続性はオーディオ・デコーダによって、(たとえば接合点によって引き起こされる)ビットストリームの不連続性として解釈されてもよい。結果として、オーディオ・デコーダは、シーケンス・カウンタを使ってビットストリーム内の接合点を検出するよう構成されていてもよい。
【0160】
特に、オーディオ・デコーダは、(検出された接合点の前の)一つまたは複数のデコードされたフレームに基づいて(検出された接合点の後の)デコードされるべきフレームのデコードを抑制するよう構成されていてもよい。さらに、オーディオ・デコーダは、検出された接合点の前の一つまたは複数のフレームに関連付けられているヘッダ情報に依拠するデコードされるべきフレームのデコードを抑制するよう構成されていてもよい。例として、オーディオ・デコーダは、正しいヘッダ情報の受領に際しておよび/または独立してエンコードされたフレームの(たとえば、いわゆるIフレームの)受領に際して、(検出された接合点後の)デコードを再開するだけであるよう構成されていてもよい。こうすることにより、気づかれなかった接合点によって引き起こされる可聴アーチファクトの発生が低減できる。
【0161】
上記のように、シーケンス・カウンタは典型的には限られた分解能をもち、よってある確率で「偽陽性」(すなわち、接合点の誤った検出)が起こりうる。しかしながら、「偽陽性」の確率は、シーケンス・カウンタの長さまたは分解能によって制御されうる。
【0162】
シーケンス・カウンタの特定の値、たとえば値「0」が特定の目的のために予約されてもよい。この特定の値は、接合マーカーの機能を帯びてもよい。この特定のシーケンス・カウンタ値を有するフレームの意味は次のようなものであってもよい:
・(その特定のシーケンス・カウンタ値を有する)現在フレームと直前のフレームとの間に接合点があることを示す。
・その特定のシーケンス・カウンタ値を有するシーケンス・カウンタと直後のシーケンス・カウンタとの間の不連続があったとしても無視されるべきであることを示す。換言すれば、たとえ次のシーケンス・カウンタが(不連続に起因して)接合点を示すとしても、接合点のこの指示は無視されるべきである。
【0163】
スプライサー・マーカーの定義は、放送ヘッドエンドにおける接合装置が、シーケンス・カウンタの比較的単純な修正により、すなわちシーケンス・カウンタを前記特定の値に設定することにより、オンザフライで接合点をマークすることを許容する。このマーク付けプロセスは、シーケンス・カウンタが識別しやすい位置に、好ましくはフレームの先頭近くに格納されているときに特によく機能する。
【0164】
図6のbは、フレーム611、612のシーケンスを有する例示的なビットストリーム610を示している。さらに、オーディオ・フレーム611、621はそれぞれのシーケンス・カウンタ612、622を有する。直接相続くフレーム611、621内の直接相続くシーケンス・カウンタ612、622はオーディオ・デコーダに対して、直接相続くフレーム611、621が連続的なオーディオ・データに関係していることを示してもよい。他方、相続くシーケンス・カウンタ611、622の不連続性は、(たとえば接合点によって引き起こされる)オーディオ・データの不連続性を示してもよい。代替的または追加的に、シーケンス・カウンタ622の特定の値(たとえば値「0」)がフレーム611と621の間の接合点を示してもよい。
【0165】
上記のように、シーケンス・カウンタ612、622は、接合点の存在を識別するために使用されてもよい。シーケンス・カウンタ612、622は、最小値Qminと最大値Qmaxとの間で(増加するまたは減少する逐次順で)周期的に巡回してもよい。最小値についての例示的な値はQmin=1であり、最大値についての例示的な値はQmax=1020である。現在フレーム611のシーケンス・カウンタ612の値q1=nがビットストリーム610内の直後のフレーム621のシーケンス・カウンタ622の値q2の直前のものであり、たとえばq2=n+1またはq2=n mod Qmax+Qminであれば、シーケンス・カウンタ612および622の値q1およびq2は、ビットストリーム610内に接合点がないことを示す。他方、フレーム621のシーケンス・カウンタ622の値q2がフレーム611のシーケンス・カウンタ612の値q1の直後のものでなく、たとえばq2≠n+1またはq2≠n mod Qmax+Qminであれば、現在フレーム6116と直後のフレーム621との間にビットストリーム610内の接合点の存在の指標を与えうる。
【0166】
他方、ビットストリーム610内のフレーム611、621のフレームレートの変化が起こることがある。例として、ユーザーは、たとえばオーディオ信号の品質を改善するためおよび/または伝送媒体の利用可能な帯域幅にビットストリーム610を適合させるために、同じオーディオ信号を異なるフレームレートで要求することがありうる。例として、ビットストリーム610は、第一のフレームレートNでのフレーム611の第一のシーケンスおよび第二のフレームレートKでのフレーム621の第二のシーケンスを含むことがある。第一および第二のフレームレートの比K/Nは整数または有理数でありうる。特に、第一および第二のフレームレートの比はK/N=1/4、1/2、2または4であってもよい。換言すれば、第一および第二のフレームレートは基本フレームレートの整数倍であってもよい。
【0167】
上記のように、連続するフレーム611、621のシーケンス・カウンタの値q1、q2も連続的であるべきである。値q1、q2が連続的でなければ、これは接合点(スプライス点とも称される)の指標でありうる。特に、ビットストリーム・デコード・システムは、シーケンス・カウンタの値を評価し、カウンタ値がジャンプするまたは所定の値(たとえば0)を示すときは接合検出メッセージを送るよう構成されてもよい。該送出は、フレーム622の名目上の先頭にタイミングを合わされてもよい。典型的には、0から他の任意の数へのシーケンス・カウンタのジャンプは接合を示すのではない。0から0へのジャンプはさらなる接合点を示しうる。
【0168】
しかしながら、フレームレートの修正は、フレームのシーケンス・カウンタの値qの変化につながりうる。特に、フレームレートが因子1/4、1/2、2、4により変化する場合、直接相続くフレーム611、621のカウンタ値の不連続は必ずしもビットストリーム610の接合に起因するのではないことがある。シーケンス・カウンタの値qのそのような変化は、カウント速度、すなわちシーケンス・カウンタが修正される速度がフレームレートに依存しうるという事実のためであることがありうる。例として、基本フレームレートの場合、シーケンス・カウンタは四番目のフレームについて値4をもつことがある。他方、基本フレームレートの二倍のフレームレートの場合、シーケンス・カウンタは、基本フレームレートでの四番目のフレームと同じオーディオ信号の時間的抜粋に対応するフレームについて、すでに値8をもちうる。よって、フレームレートの変化は、シーケンス・カウンタの値の不連続につながりうる。
【0169】
表6aは、(フレームレートNでの)フレーム611のシーケンス・カウンタ612のシーケンス・カウンタ値q1=nに基づいて(第二のフレームレートKを取る)フレーム611のシーケンス・カウンタ612についての目標シーケンス・カウンタ値(チルダ付きのk)を決定する公式を与えている。公式は、表6aでは、Qmax=1020の場合について示されている。
【0170】
表6bは、Qmaxの任意の値についてより一般的な形で公式を与えている。
【0171】
【表6a】
【表6b】
フレーム621のシーケンス・カウンタ622の実際の値q2がシーケンス・カウンタ622の目標シーケンス・カウンタ値
【数11】
に等しい場合、具体的には
【数12】
の場合、ビットストリーム610はフレーム611と621の間の接合点を含まない(フレームレートの変化を含むだけ)。この場合、デコード・システムは、(たとえシーケンス・カウンタ612、622の値の不連続が検出されたとしても)接合検出メッセージを提供しないよう構成されてもよい。他方、フレーム621のシーケンス・カウンタ622の実際の値q2がシーケンス・カウンタ622についての目標シーケンス・カウンタ値
【数13】
またはより正確には
【数14】
と異なる場合、すなわち、
【数15】
である場合、ビットストリーム610は(フレームレートの変化に加えて)フレーム611と621の間の接合点を含む。そのような場合、接合検出メッセージが提供されてもよい。
【0172】
代替的または追加的に、フレーム621のシーケンス・カウンタ622の目標シーケンス・カウンタ値k(たとえば
【数16】
による)が、上記および/または請求項において概説されるようにフレーム611のシーケンス・カウンタ612の値q1から直接計算されてもよい。そのような場合、第一および第二のシーケンスの間の遷移点が接合点であるか否かを判定するために、フレーム621のシーケンス・カウンタ622の目標シーケンス・カウンタ値kは、フレーム621のシーケンス・カウンタ622の実際の値q2と直接比較されてもよい。
【0173】
よって、デコード・システムは、フレームレートの変化の結果として、フレームのシーケンス・カウンタ612、622が第二および第一のフレームレートの比K/Nに対応する(または依存する)因子だけ異なりうるという事実を考慮に入れるよう構成されてもよい。こうすることにより、(接合点の偽検出に起因するオーディオ品質の劣化なしに)フレームレートのシームレスな切り換えが提供されうる。
【0174】
ビットストリーム610内のフレームのシーケンスのフレームレートは有理数であってもよい。代替的または追加的に、ビットストリーム610のフレームの平均長さは半端な数であってもよく、有理数であってもよい。そのような半端なフレームレートおよび/またはフレーム長を実装するためにフレームの長さはビットストリーム610内で変化してもよい。
【0175】
例として、フレームレート29.97、59.94および119.88fps(フレーム毎秒)は、それぞれ1601.6、800.8および400.4サンプルの半端な外部フレーム長につながりうる。サンプル・レート変換器は、サブシーケンス内においてより長いフレームおよびより短いフレームを提供し、平均では半端な外部フレーム長が提供されるようにすることによって、そのような半端なフレームを提供しうる。所定数Z個のフレーム後(たとえばZ=5)、サブシーケンスは繰り返されてもよい。換言すれば、サンプル・レート変換器またはエンコード・システムは、サブシーケンス内でZ個の異なるフレーム長を経過するよう構成されていてもよい。ビットストリーム内のデコードの開始とは独立な、ビットストリーム610から、たとえばAC-4ストリームからの同じサンプル出力を生成するために、サンプル・レート変換器のフェーズはビットストリーム610に束縛されてもよい。
【0176】
上記および表7に示すように、半端な平均フレーム長をもつフレームのシーケンスを提供するために、エンコード・システムおよび/またはサンプル・レート変換システムは、種々のフレーム長をもつフレームを生成しうる。フレーム長のあるパターンまたは組が(サブシーケンスとして)繰り返されてもよい。ここで、前記フレーム長の組のフレーム長の平均が、前記半端な平均フレーム長に対応する。前記フレーム長の組内の位置は、ビットストリーム610のフェーズと称されてもよい。エンコード・システムおよび/またはレート変換システムは、たとえ接合点および/またはレート変換点においてであっても、ビットストリーム610のフェーズを「ロック」するよう構成されていてもよい。特に、これは、サンプル・レート変換器またはエンコード装置のフェーズをいわゆるシーケンス・インデックスにロックすることによって達成されてもよい。
【0177】
シーケンス・インデックスはシーケンス・カウンタに基づいて計算されてもよい。特に、シーケンス・インデックスは公式:
sequence_index=sequence_counter mod Z
を使って計算されてもよい。ここで、sequence_indexは特定のフレームのシーケンス・インデックスの値であり(そのフレームのフェーズを示す)、sequence_counterはその特定のフレームのシーケンス・カウンタの値である。
【0178】
フェーズの数Zは、内部的なフレーム長とその対応する外部フレーム長との間の関係に依存してもよい。すなわち、フェーズの数Zは、再サンプリング比に依存してもよい。代替的または追加的に、フェーズの数Zは、前記種々のフレームレートに、すなわち内部的なフレーム長およびそれらに対応する外部フレーム長のサイズに依存してもよい。
【0179】
典型的には、オーディオ信号のサンプリング・レートは、あらかじめ決定された外部サンプリング・レート(たとえば48kHz)に固定されている。半端な外部フレーム長またはフレームレートを許容するために、所定の内部的なフレーム長を満足させるようオーディオ信号を適応させるための(本稿で概説した)サンプル・レート変換が必要とされることがある。内部的なフレーム長は典型的には固定されている。さらに、内部的なフレーム長は実行される信号処理に依存してもよい。例として、信号処理は、QMF(Quadrature Mirror Filterbank[直交ミラーフィルタバンク])分解/合成、たとえば64サブバンドQMF分解/合成を有していてもよい。内部的なフレーム長は、そのような信号処理制約条件に依存してもよい。たとえば、内部的なフレーム長は64の倍数であってもよい(表7に示される例についてそうであるように)。オーディオ信号を外部フレーム長(これは可変であってもよい)から内部的なフレーム長(これは典型的には固定である)に変換するために、たとえば(外部フレーム長1601.6および内部的なフレーム長1536の場合)48kHzから46.33kHzへのサンプル・レート変換が実行されてもよい。
【0180】
表7は、例示的な外部および内部フレーム長ならびにそれらの関係をシーケンス・インデックスとともに示す。
【0181】
【表7】
表7から、1601.6サンプルの端数のフレーム長が、個々のフレーム長1601、1602、1601、1602および1602の組をもつZ=5フレームのサブシーケンスを使って実装できることが見て取れる。フレーム長の該サブシーケンスは、端数フレーム長1601.6を示すビットストリーム610を提供するために、ビットストリーム610内で繰り返されてもよい。
【0182】
デコード・システムは、特に接合点において、デコードのためにシーケンス・インデックスの値を考慮に入れるよう構成されてもよい。特に、デコード・システムは、フレームの第一のシーケンスからの、接合点の直前のフレーム611のシーケンス・インデックスの値を、フレーム611のシーケンス・カウンタ612の値q1に基づいて決定するよう構成されていてもよい。フレーム611のシーケンス・インデックスの値i1は上述した公式、すなわちi1=q1 mod Zを使って決定されてもよい。フレームの第一のシーケンスのフレーム611のシーケンス・インデックスの値i1は、接合点の前のビットストリーム610のフェーズを示してもよい。
【0183】
ビットストリーム610全体について所定の端数フレーム長を保証するために、デコード・システムは、接合点におけるビットストリーム610のフェーズにロックされてもよい。特に、デコード・システムは、フレームの第二のシーケンスの、接合点の直後のフレーム612のシーケンス・インデックスの値i2を、i2=(i1+1) mod Zに設定するよう構成されてもよい。より一般的な言い方では、接合点後のフレーム612のシーケンス・インデックスの値i2は、直前のフレーム611のシーケンス・インデックスの値i1に基づいて決定されてもよい。
【0184】
表7で見て取れるように、フレーム611のシーケンス・インデックスの値に依存して、特定の剰余がある。ここで、フレーム611の剰余は、フレーム611のデコード(またはエンコード)の後にデコード(またはエンコード)されたサンプルの数と、半端な平均フレーム長に鑑みてデコード(またはエンコード)されるべきであったサンプルの数との間の差に対応する。よって、フレーム611のシーケンス・インデックスの値i1はそのような剰余を示す。フレーム612のシーケンス・インデックスの値i2は、フレーム611のシーケンス・インデックスの値i1に関連付けられている該剰余に基づいて決定されてもよい。
【0185】
やはり表2から見て取れるように、シーケンス・インデックスの値は異なるフレームレートについては異なる剰余値に関連付けられる。換言すれば、異なるフレームレートについての剰余値は異なる仕方で順序付けられる。フレーム611と612の間でのフレームレート変化の場合には特に、フレーム612のシーケンス・インデックスの値i2は、
・(第一のフレームレートでの)フレーム611のシーケンス・インデックスの値i1に関連付けられている剰余の値r1を決定し;
・第二のフレームレートでの前記剰余の値r1に対応するシーケンス・インデックスの擬似値(^付きのi1)を決定し;
・フレーム612のシーケンス・インデックスの値i2を、
【数17】
として決定することによって決定されてもよい。
【0186】
こうすることにより、ビットストリーム310のフェーズは、接合点においておよび/またはフレームレートの変化の場合に維持されうる。表8は、例示的なフレームレート比の場合のシーケンス・インデックスの値を示している。フレームレート変化は、「前」のフレーム611と「次」のフレーム621との間で起こる。
【0187】
【表8】
フェーズのロックは、接合点の存在を示すために所定のカウンタ値(たとえばカウンタ値「0」)が使われる場合にも適用可能である。シーケンス・カウンタ値「0」は、いわゆる指示された接合を表わしてもよい。これは、デコード・システムに接合が起こったことを信号伝達するために使われる。関連付けられたスライスは、制御されたまたは制御されないスプライスであってもよく、よってシームレスであってもよい。値「0」のシーケンス・カウンタをもつフレーム621のシーケンス・インデックスの値は前のフレームから導出されてもよい。
【0188】
フレームレートが接合点において不変のままである場合、シーケンス・インデックスの値は継続されてもよい。すなわち、i2=(i1+1) mod Zである。フレームレートが変わる場合には、フレーム621のシーケンス・インデックスの値は上記で概説したように、たとえば公式
【数18】
を使っておよび/または表8を使って決定されてもよい。
【0189】
シーケンス・カウンタ値0をもつフレームがデコード・システムにおける最初のフレームである場合には、シーケンス・カウンタ値はQmaxであると想定されてもよい。あるいは――換言すれば――シーケンス・インデックスの値は0であると想定されてもよい。
【0190】
一般に、フレームnのシーケンス・カウンタ値は
【数19】
として決定されてもよい。
【0191】
本稿で記載される方法およびシステムは、ソフトウェア、ファームウェアおよび/またはハードウェアとして実装されてもよい。ある種のコンポーネントは、たとえばデジタル信号プロセッサまたはマイクロプロセッサ上で走るソフトウェアとして実装されてもよい。他のコンポーネントはたとえば、ハードウェアおよびまたは特定用途向け集積回路として実装されてもよい。記載される方法およびシステムにおいて遭遇される信号は、ランダム・アクセス・メモリまたは光学式記憶媒体のような媒体上に記憶されてもよい。そうした信号は、電波ネットワーク、衛星ネットワーク、無線ネットワークもしくは有線ネットワーク、たとえばインターネットのようなネットワークを介して転送されてもよい。本稿で記載される方法およびシステムを利用する典型的な装置は、オーディオ信号を記憶および/またはレンダリングするために使用されるポータブル電子装置または他の消費者装置である。
いくつかの付番実施例を記載しておく。
〔付番実施例1〕
入力オーディオ信号を再サンプリングして出力オーディオ信号にするシステムが記述でって、
・前記出力オーディオ信号のイメージングおよび/またはエイリアシングを低減するよう構成されているフィルタからのフィルタ係数の現在の部分集合を使って、前記入力オーディオ信号の一つまたは複数の入力サンプルから前記出力オーディオ信号の現在の出力サンプルを決定するよう構成されている処理ユニットであって、フィルタ係数の前記現在の部分集合は、前記フィルタのポリフェーズ構造のあるフェーズ(121)に対応する、処理ユニットと;
・異なる出力サンプルを決定するために使われる、前記フィルタの前記ポリフェーズ構造の異なるフェーズのフェーズ・インデックス(202)と、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間のマッピングを与え、フェーズ・インデックスと前記フィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを与える、一つまたは複数のルックアップテーブルを有しており、
前記処理ユニットは、前記一つまたは複数のルックアップテーブルを使って、前記現在の出力サンプルの直前の前の出力サンプルについての前のフェーズ・インデックスに基づいて、フィルタ係数の前記現在の部分集合を決定するよう構成されている、
システム。
〔付番実施例2〕
・当該システムは、異なる出力サンプルを決定するために使われる、前記フィルタの前記ポリフェーズ構造の異なるフェーズのフェーズ・インデックスと、それぞれ直前の出力サンプルを決定するために使われる直前のフェーズのフェーズ・インデックスとの間の前記マッピングを与えるフェーズ・ルックアップテーブルを有しており、
・当該システムは、フェーズ・インデックスと、前記フィルタからのフィルタ係数のそれぞれの部分集合との間の前記マッピングを与えるフィルタ・ルックアップテーブルとを有しており、
・前記処理ユニットは、前記フェーズ・ルックアップテーブルを使って、前記現在の出力サンプルの直前の前記前の出力サンプルについての前記前のフェーズ・インデックスに基づいて、前記現在のフェーズ・インデックスを決定するよう構成されており、
・前記処理ユニットは、前記フィルタ・ルックアップテーブルを使って、前記現在のフェーズ・インデックスに基づいてフィルタ係数の前記現在の部分集合を決定するよう構成されている、
付番実施例1記載のシステム。
〔付番実施例3〕
・当該システムは、Lが1より大きいとして、アップサンプリング因子Lに従って前記入力オーディオ信号を再サンプリングするよう構成されており、
・前記ポリフェーズ構造はL個のフェーズを有し、
・前記フェーズ・ルックアップテーブルは、前記L個のフェーズについてのL個のフェーズ・インデックスのそれぞれについて、直前のフェーズについてのフェーズ・インデックスへのマッピングを与える、
付番実施例2記載のシステム。
〔付番実施例4〕
当該システムは、Mが1より大きいとして、ダウンサンプリング因子Mに従って前記入力オーディオ信号を再サンプリングするよう構成されている、付番実施例1ないし3のうちいずれか一項記載のシステム。
〔付番実施例5〕
・前記フィルタが、N個のフィルタ係数の全集合を有し、
・前記フィルタからのフィルタ係数の前記部分集合がそれぞれN/L個のフィルタ係数を有する、
付番実施例3または4記載のシステム。
〔付番実施例6〕
前記フェーズ・ルックアップテーブルは、前記出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスを示す、付番実施例2ないし5のうちいずれか一項記載のシステム。
〔付番実施例7〕
フェーズ・インデックスの前記シーケンスは、前記アップサンプリング因子Lおよび/または前記ダウンサンプリング因子Mに依存する、付番実施例3および4を引用する場合の付番実施例6記載のシステム。
〔付番実施例8〕
前記処理ユニットは、前記アップサンプリング因子Lおよび/または前記ダウンサンプリング因子Mに基づきフェーズ・インデックスの前記シーケンスおよび/または前記フェーズ・ルックアップテーブルを決定するよう構成されている、付番実施例7記載のシステム。
〔付番実施例9〕
前記処理ユニットは、
・1からLまでの増大する整数のシーケンスを含む基本ベクトルを決定し;
・前記基本ベクトルをM回連結することにより、前記基本ベクトルから連結ベクトルを決定し;
・前記連結ベクトルからM番目毎の項目を選択することによってフェーズ・インデックスの前記シーケンスを決定するよう構成されている、
付番実施例8記載のシステム。
〔付番実施例10〕
前記処理ユニットは、
・フェーズ・インデックスの前記シーケンスから第一のフェーズ・インデックスを選択し;
・前記第一のフェーズ・インデックスを、LまたはLの倍数だけ増大させることを、増大させられた第一のフェーズ・インデックスがM以下となる限り、行ない;
・フェーズ・インデックスの前記シーケンスにおいて前記第一のフェーズ・インデックスの直後の第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスに基づいて決定するよう構成されている、
付番実施例9記載のシステム。
〔付番実施例11〕
前記処理ユニットは、前記第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスMからMを引いて中間フェーズ・インデックスを与えることによって決定するよう構成されている、付番実施例10記載のシステム。
〔付番実施例12〕
前記処理ユニットが、前記第二のフェーズ・インデックスを、L+1から前記中間フェーズ・インデックスを引くことによって決定するよう構成されている、付番実施例11記載のシステム。
〔付番実施例13〕
前記処理ユニットは、隣り合うフェーズ・インデックスの一つまたは複数の対について、フェーズ・インデックスの前記シーケンスからの隣り合うフェーズ・インデックスの間の差をΔ=[M MOD L]として決定することによって、フェーズ・インデックスの前記シーケンスを決定するよう構成されている、付番実施例8記載のシステム。
〔付番実施例14〕
・当該システムは、種々のアップサンプリング因子Lに従っておよび/または種々のダウンサンプリング因子Mに従って再サンプリングを実行するよう構成されており、
・前記フェーズ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフェーズ・インデックスへのマッピングを有しており、
・前記フィルタ・ルックアップテーブルは、それぞれ複数の異なる再サンプリング比L/Mについて複数のフェーズ・インデックスからフィルタ係数の部分集合へのマッピングを有している、
付番実施例2ないし13のうちいずれか一項記載のシステム。
〔付番実施例15〕
前記ポリフェーズ構造の異なるフェーズについてのフィルタ係数の部分集合は互いに背反である、付番実施例1ないし14のうちいずれか一項記載のシステム。
〔付番実施例16〕
・当該システムは、フェーズ・インデックスと前記フィルタからのフィルタ係数のそれぞれの部分集合との間のマッピングを与える組み合わされたフェーズ/フィルタ・ルックアップテーブルを有しており、
・前記組み合わされたフェーズ/フィルタ・ルックアップテーブルのフェーズ・インデックスは、前記出力オーディオ信号の出力サンプルの対応するシーケンスを決定するために使われるフェーズ・インデックスのシーケンスに従って順序付けられる、
付番実施例1記載のシステム。
〔付番実施例17〕
・当該システムが、Lが1より大きいとして、アップサンプリング因子Lに従って前記入力オーディオ信号を再サンプリングするよう構成されており、
・前記処理ユニットは、前記組み合わされたフェーズ/フィルタ・ルックアップテーブルへのモジュロLポインタを使って、前記現在の出力サンプルの直前の前記前の出力サンプルについての前記前のフェーズ・インデックスに基づいて、フィルタ係数の前記現在の部分集合を決定するよう構成されている、
付番実施例16記載のシステム。
〔付番実施例18〕
入力オーディオ信号の入力サンプルのシーケンスから再サンプリングされたオーディオ信号の出力サンプルのシーケンスを決定するために使われる再サンプリング・フィルタのポリフェーズ構造のフェーズの対応するシーケンスを同定するフェーズ・インデックスのシーケンスを決定する方法であって、
・フェーズ・インデックスの前記シーケンスから第一のフェーズ・インデックスを選択し;
・前記第一のフェーズ・インデックスを、アップサンプリング因子LまたはLの倍数だけ増大させることを、増大させられた第一のフェーズ・インデックスがダウンサンプリング因子M以下である限り、行ない;
・フェーズ・インデックスの前記シーケンスにおいて前記第一のフェーズ・インデックスの直後の第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスに基づいて決定することを含む、
方法。
〔付番実施例19〕
前記第二のフェーズ・インデックスを、増大させられた第一のフェーズ・インデックスMからMを引いて中間フェーズ・インデックスを与えることによって決定することをさらに含む、付番実施例18記載の方法。
〔付番実施例20〕
前記第二のフェーズ・インデックスを、L+1から前記中間フェーズ・インデックスを引くことによって決定することをさらに含む、付番実施例19記載の方法。
〔付番実施例21〕
入力オーディオ信号の入力サンプルのシーケンスから再サンプリングされたオーディオ信号の出力サンプルのシーケンスを決定するために使われる再サンプリング・フィルタのポリフェーズ構造のフェーズの対応するシーケンスを同定するフェーズ・インデックスのシーケンスを決定する方法であって、
・1からアップサンプリング因子Lまでの増大する整数のシーケンスを含む基本ベクトルを決定し;
・前記基本ベクトルをM回連結することにより、前記基本ベクトルから連結ベクトルを決定し、ここで、Mはダウンサンプリング因子であり、
・フェーズ・インデックスの前記シーケンスを、前記連結ベクトルからM番目毎の項目を選択することによって決定することを含む、
方法。
〔付番実施例22〕
複数の異なるチャネルを含むマルチチャネル・オーディオ信号をデコードするオーディオ・デコード・システム(500)であって、前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含み、当該オーディオ・デコード・システムは、
・前記マルチチャネル・オーディオ信号を示すビットストリームを受領する段階と;
・第一の条件および第二の条件が満たされているかどうかを判定する段階であって、前記第一の条件は、前記マルチチャネル・オーディオ信号が低減された数のチャネルにダウンミックスされるべきであることを含み、前記第二の条件は、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされていると判定されることを含む、段階と;
・前記第一の条件が満たされる場合かつ前記第二の条件が満たされない場合に、前記一つまたは複数のサラウンド・チャネルに位相シフトを適用して一つまたは複数の位相シフトされたサラウンド・チャネルを与える段階とを含む、
方法。
〔付番実施例23〕
当該オーディオ・デコード・システムは、前記複数の異なるチャネルのうちの他のチャネルのうちの前記他のチャネルのうちの一つまたは複数に対して、前記一つまたは複数のサラウンド・チャネルに90度の位相シフトを適用するよう構成されている、付番実施例22記載のオーディオ・デコード・システム。
〔付番実施例24〕
当該オーディオ・デコード・システムは、
・前記一つまたは複数のサラウンド・チャネルへの前記位相シフトを、前記第一の条件が満たされ、かつ前記第二の条件が満たされない場合にのみ適用し;
・それ以外の場合には、前記一つまたは複数のサラウンド・チャネルの位相を不変のままにするよう構成されている、
付番実施例22または23記載のオーディオ・デコード・システム。
〔付番実施例25〕
前記ビットストリームの一部または全部をデコードして前記マルチチャネル・オーディオ信号を提供するようさらに構成されている、付番実施例22ないし24のうちいずれか一項記載のオーディオ・デコード・システム。
〔付番実施例26〕
行列エンコードを使って、前記マルチチャネル・オーディオ信号からダウンミックスされたオーディオ信号を決定するようさらに構成されており、前記ダウンミックスされたオーディオ信号は前記マルチチャネル・オーディオ信号より少ないチャネルを含む、付番実施例22ないし25のうちいずれか一項記載のオーディオ・デコード・システム。
〔付番実施例27〕
・前記一つまたは複数の位相シフトされたサラウンド・チャネルを減衰させて、一つまたは複数の減衰されたサラウンド・チャネルを与え、
・前記一つまたは複数の減衰されたサラウンド・チャネルを前記複数の異なるチャネルのうちの前記他のチャネルの一つまたは複数と組み合わせて、前記ダウンミックスされたオーディオ信号の一つまたは複数のチャネルを与えるよう構成されている、
付番実施例26記載のオーディオ・デコード・システム。
〔付番実施例28〕
複数の異なるチャネルを含むマルチチャネル・オーディオ信号をビットストリームにエンコードするためのオーディオ・エンコード・システムであって、前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含lみ、当該オーディオ・エンコード・システムは、
・前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定し;
・決定された確率が所定の確率閾値を超える場合に、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の指示を前記ビットストリーム中に挿入するよう構成されている、
オーディオ・エンコード・システム。
〔付番実施例29〕
前記確率の決定は、前記複数の異なるチャネルのオーディオ・コンテンツを解析することを含む、付番実施例28記載のオーディオ・エンコード・システム。
〔付番実施例30〕
前記確率の決定は、前記複数の異なるチャネルのオーディオ・コンテンツのスペクトルを解析し、異なるチャネルの間でスペクトルの位相を比較することを含む、付番実施例29記載のオーディオ・エンコード・システム。
〔付番実施例31〕
前記指示は、前記ビットストリームのあらかじめ決定されたビットまたはフラグを含む、付番実施例28ないし30のうちいずれか一項記載のオーディオ・エンコード・システム。
〔付番実施例32〕
複数の異なるチャネルを含むマルチチャネル・オーディオ信号をデコードする方法であって、前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含み、当該方法は、
・前記マルチチャネル・オーディオ信号を示すビットストリームを受領する段階と;
・第一の条件および第二の条件が満たされているかどうかを判定する段階であって、前記第一の条件は、前記マルチチャネル・オーディオ信号が低減された数のチャネルにダウンミックスされるべきであることを含み、前記第二の条件は、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされていることを含む、段階と;
・前記第一の条件が満たされ、かつ前記第二の条件が満たされない場合に、前記一つまたは複数のサラウンド・チャネルに位相シフトを適用して一つまたは複数の位相シフトされたサラウンド・チャネルを与える段階とを含む、
方法。
〔付番実施例33〕
複数の異なるチャネルを含むマルチチャネル・オーディオ信号をビットストリームにエンコードする方法であって、前記複数の異なるチャネルは一つまたは複数のサラウンド・チャネルを含み、当該方法は、
・前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の確率を決定する段階と;
・決定された確率が所定の確率閾値を超える場合に、前記一つまたは複数のサラウンド・チャネルが前記複数の異なるチャネルのうちの他のチャネルのうちの一つまたは複数に対して位相シフトされているという事実の指示をビットストリーム中に挿入する段階とを含む、
方法。
〔付番実施例34〕
オーディオ・フレームのシーケンスを含むオーディオ信号を、ビットストリーム・フレームの対応するシーケンスを含むビットストリーム(600)にエンコードするオーディオ・エンコード・システムであって、当該オーディオ・エンコード・システムは、
・オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第一のシーケンスを提供し;
・オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第二のシーケンスを提供し;
・ビットストリーム・フレームが該ビットストリーム・フレーム内の種々の位置において前記第一および第二のシーケンスからの対応するサブストリーム・フレームを含むよう、ビットストリーム・フレームの前記シーケンスを決定し;
・ビットストリーム・フレームの前記シーケンスのビットストリーム・フレーム中に制御情報を挿入するよう構成されており、前記制御情報は、前記ビットストリーム・フレーム内に含まれる前記サブストリーム・フレームの位置および/または表現を示す、
オーディオ・エンコード・システム。
〔付番実施例35〕
前記第一および第二のシーケンスは、オーディオ・フレームの同じシーケンスの異なる表現を含む、付番実施例34記載のオーディオ・エンコード・システム。
〔付番実施例36〕
表現は、
・前記オーディオ信号を表わすチャネルの数;および/または
・サブストリーム・フレームの前記シーケンスのビットレート
を含む、付番実施例35記載のオーディオ・エンコード・システム。
〔付番実施例37〕
前記制御情報は、前記第一および第二のシーケンスについて第一および第二の制御情報を含む、付番実施例34ないし36のうちいずれか一項記載のオーディオ・エンコード・システム。
〔付番実施例38〕
異なる長さの符号語を使って前記第一および第二の制御情報をエンコードするようさらに構成されており、前記第一および第二の制御情報をエンコードするためにそれぞれ使われる符号語の長さは、それぞれ前記第一および第二のシーケンスのビットレートに依存する、付番実施例37記載のオーディオ・エンコード・システム。
〔付番実施例39〕
前記第一のシーケンスのビットレートが前記第二のシーケンスのビットレートより高い場合には、前記第一の制御情報をエンコードするために使われる一つまたは複数の符号語の長さは、前記第二の制御情報をエンコードするために使われる一つまたは複数の符号語の長さより大きい、および/または前記第一のシーケンスのビットレートが前記第二のシーケンスのビットレートより低い場合には、前記第一の制御情報をエンコードするために使われる一つまたは複数の符号語の長さは、前記第二の制御情報をエンコードするために使われる一つまたは複数の符号語の長さより短い、付番実施例38記載のオーディオ・エンコード・システム。
〔付番実施例40〕
前記オーディオ・エンコード・システムは、可変長符号を使って前記第一および第二の制御情報をエンコードするよう構成されており、もし平均でサブストリーム・フレームの前記第一のシーケンスがサブストリーム・フレームの前記第二のシーケンスより多くのビットを含む場合には、平均で前記第一の制御情報は前記第二の制御情報より多くのビットを含み、もし平均でサブストリーム・フレームの前記第一のシーケンスがサブストリーム・フレームの前記第二のシーケンスより少ないビットを含む場合には、平均で前記第一の制御情報は前記第二の制御情報より少ないビットを含む、付番実施例38または39記載のオーディオ・エンコード・システム。
〔付番実施例41〕
当該オーディオ・エンコード・システムは、それぞれ前記第一および第二の制御情報に起因するサブストリーム・フレームの前記第一および第二のシーケンスの相対的なオーバーヘッドの間の相違が減らされるように、可変長符号を使って前記第一および第二の制御情報をエンコードするよう構成されている、付番実施例38ないし40のうちいずれか一項記載のオーディオ・エンコード・システム。
〔付番実施例42〕
・ビットストリーム・フレームの対応するシーケンスを含む入力ビットストリームを受領する段階であって、ビットストリーム・フレームは、該ビットストリーム・フレーム内の種々の位置に、サブストリーム・フレームの第一および第二のシーケンスからの対応するサブストリーム・フレームを含み、ビットストリーム・フレームの前記シーケンスのビットストリーム・フレームは、前記ビットストリーム・フレーム内に含まれる前記サブストリーム・フレームの位置および/または表現を示す制御情報を含む、段階と;
・前記制御情報を使って、ビットストリーム・フレームの前記シーケンスからサブストリーム・フレームの前記第一および/または第二のシーケンスを抽出する段階とを実行するよう構成されている、
オーディオ処理システム。
〔付番実施例43〕
サブストリーム・フレームの前記第一のシーケンスをデコードする必要なしに、および/またはサブストリーム・フレームの前記第二のシーケンスをデコードする必要なしに、ビットストリーム・フレームの前記シーケンスからサブストリーム・フレームの前記第一のシーケンスを抽出するようさらに構成されている、付番実施例42記載のオーディオ処理システム。
〔付番実施例44〕
・前記第一のシーケンスのサブストリーム・フレームを、出力ビットストリームのビットストリーム・フレームの対応するシーケンスに挿入し;
・前記出力ビットストリームの前記ビットストリーム・フレーム中に制御情報を挿入するようさらに構成されている、
付番実施例42または43記載のオーディオ処理システム。
〔付番実施例45〕
前記第一および第二のシーケンスは、オーディオ・フレームの同じシーケンスの異なる表現を含む、付番実施例42ないし44のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例46〕
オーディオ・フレームのシーケンスを含むオーディオ信号を、ビットストリーム・フレームの対応するシーケンスを含むビットストリームにエンコードする方法であって、
・オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第一のシーケンスを提供する段階と;
・オーディオ・フレームの前記対応するシーケンスについてのサブストリーム・フレームの第二のシーケンスを提供する段階と;
・ビットストリーム・フレームが該ビットストリーム・フレーム内の種々の位置において前記第一および第二のシーケンスからの対応するサブストリーム・フレームを含むよう、ビットストリーム・フレームの前記シーケンスを決定する段階と;
・ビットストリーム・フレームの前記シーケンスのビットストリーム・フレーム中に制御情報を挿入する段階であって、前記制御情報は、前記ビットストリーム・フレーム内に含まれる前記サブストリーム・フレームの位置および/または表現を示す、段階とを含む、
方法。
〔付番実施例47〕
オーディオ・フレームのシーケンスを含むオーディオ信号を示すビットストリームを処理する方法であって、
・ビットストリーム・フレームの対応するシーケンスを含む入力ビットストリームを受領する段階であって、ビットストリーム・フレームは、該ビットストリーム・フレーム内の種々の位置において、サブストリーム・フレームの第一および第二のシーケンスからの対応するサブストリーム・フレームを含み、ビットストリーム・フレームの前記シーケンスのビットストリーム・フレームは、該ビットストリーム・フレーム内に含まれる前記サブストリーム・フレームの位置および/または表現を示す制御情報を含む、段階と;
・前記制御情報を使って、ビットストリーム・フレームの前記シーケンスからサブストリーム・フレームの前記第一および/または第二のシーケンスを抽出する段階とを含む、
方法。
〔付番実施例48〕
ビットストリーム・フレームの対応するシーケンスを含むビットストリームを処理するオーディオ処理システムであって、ビットストリーム・フレームの前記シーケンスはオーディオ信号のオーディオ・フレームの対応するシーケンスを示し、当該オーディオ処理システムは、
・ビットストリーム・フレームの前記シーケンスについてのカウンタ値のシーケンスを生成する段階と;
・カウンタ値の前記シーケンスからの前記カウンタ値を、ビットストリーム・フレームの前記シーケンスからのビットストリーム・フレーム中に挿入する段階であって、前記ビットストリーム・フレームの前記カウンタ値は、ビットストリーム・フレームの前記シーケンス内のビットストリーム・フレームの逐次順を示す、段階とを実行するよう構成されている、
オーディオ処理システム。
〔付番実施例49〕
前記ビットストリーム・フレームがさらに、前記オーディオ信号の対応するオーディオ・フレームを示すペイロード・データを含む、付番実施例48記載のオーディオ処理システム。
〔付番実施例50〕
前記カウンタ値は、前記ビットストリーム・フレーム内の所定の位置に位置決めされる、付番実施例48または49記載のオーディオ処理システム。
〔付番実施例51〕
カウンタ値の前記シーケンスは、逐次的に順序付けされたカウンタ値を含む、付番実施例48ないし50のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例52〕
・前記カウンタ値は、最小値および最大値を含み;
・カウンタ値の前記シーケンス内で前記最大値に前記最小値が続くまたはカウンタ値の前記シーケンス内で前記最小値に前記最大値が続く、
付番実施例48ないし51のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例53〕
ビットストリーム・フレームの対応する第一のシーケンスを含む第一のビットストリームおよびビットストリーム・フレームの対応する第二のシーケンスを含む第二のビットストリームから、接合されたビットストリームを生成するオーディオ処理システムであって、ビットストリーム・フレームの前記第一のシーケンスは、第一のオーディオ信号のオーディオ・フレームの対応する第一のシーケンスを示し、ビットストリーム・フレームの前記第二のシーケンスは、第二のオーディオ信号のオーディオ・フレームの対応する第二のシーケンスを示し、前記第二のオーディオ信号は前記第一のオーディオ信号とは異なり、ビットストリーム・フレームの前記第一のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み、ビットストリーム・フレームの前記第二のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、当該オーディオ処理システムは、
・ビットストリーム・フレームの前記第一のシーケンスからの特定のビットストリーム・フレームにおいて前記第一のビットストリームを打ち切り、打ち切られたビットストリームを提供し、
・打ち切られたビットストリームをビットストリーム・フレームの前記第二のシーケンスと連結して、前記接合されたビットストリームを提供するよう構成されており、
前記特定のビットストリーム・フレームの前記第一のカウンタ値および/または前記接合されたビットストリーム内で前記特定のビットストリーム・フレームに続くビットストリーム・フレームの前記第二のカウンタ値は、前記第一および第二のビットストリームの間の接合点を示す、
オーディオ処理システム。
〔付番実施例54〕
前記特定のビットストリーム・フレームの前記第一のカウンタ値と、前記接合されたビットストリーム内で前記特定のビットストリーム・フレームに続くビットストリーム・フレームの前記第二のカウンタ値との間の不連続が、前記第一および第二のビットストリームの間の接合点を示す、付番実施例53記載のオーディオ処理システム。
〔付番実施例55〕
・前記接合されたビットストリーム内で前記特定のビットストリーム・フレームに続くビットストリーム・フレームの前記第二のカウンタ値を前記所定のカウンタ値に設定するようさらに構成されている、付番実施例53記載のオーディオ処理システム。
〔付番実施例56〕
・前記第一および/または第二のカウンタ値は、ある最小値とある最大値の間のカウンタ値範囲からの値を取り、
・前記所定のカウンタ値は該カウンタ値範囲の外にある、
付番実施例55記載のオーディオ処理システム。
〔付番実施例57〕
・前記最小値は「1」であり、
・前記所定のカウンタ値は「0」である、
付番実施例56記載のオーディオ処理システム。
〔付番実施例58〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含む接合されたビットストリームをデコードするオーディオ・デコード・システムであって、前記第一および第二のシーケンスはそれぞれ第一および第二のオーディオ信号を示し、ビットストリーム・フレームの前記第一のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み、ビットストリーム・フレームの前記第二のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、当該オーディオ・デコード・システムは、
・前記第一および第二のカウンタ値に基づいて前記第一および第二のシーケンスの間の接合点を検出し;
・前記接合点後の前記接合されたビットストリームのビットストリーム・フレームを正しくデコードするために必要なデータが利用可能であるかどうかを判定し;
・前記データが利用可能でない場合には、前記接合点後の前記接合されたビットストリームの前記ビットストリーム・フレームのデコードをサスペンドするよう構成されている、
オーディオ・デコード・システム。
〔付番実施例59〕
前記接合点を、隣り合うビットストリーム・フレームの前記カウンタ値の不連続性に基づいて、および/または所定のカウンタ値をもつカウンタ値に基づいて検出するようさらに構成されている、付番実施例58記載のオーディオ・デコード・システム。
〔付番実施例60〕
ビットストリーム・フレームを正しくデコードするために必要な前記データは、ビットストリーム・フレームの前記第二のシーケンスをデコードするために使われるデコード方式の設定を含む、付番実施例58または59記載のオーディオ・デコード・システム。
〔付番実施例61〕
当該オーディオ・デコード・システムは、正しいデコードのために必要な前記データが利用可能になる前記接合されたビットストリームのビットストリーム・フレームまで、前記接合点後のビットストリーム・フレームのデコードをサスペンドするよう構成されている、付番実施例58ないし60のうちいずれか一項記載のオーディオ・デコード・システム。
〔付番実施例62〕
当該オーディオ・デコード・システムは、デコードがサスペンドされたビットストリーム・フレームについて、無音を示すオーディオ・フレームを提供するよう構成されている、付番実施例58ないし61のうちいずれか一項記載のオーディオ・デコード・システム。
〔付番実施例63〕
ビットストリーム・フレームのシーケンスを含むビットストリームの接合の検出を可能にする方法であって、ビットストリーム・フレームの前記シーケンスは、オーディオ信号のオーディオ・フレームの対応するシーケンスを示し、当該方法は、
・それぞれビットストリーム・フレームの前記シーケンスについてのカウンタ値のシーケンスを生成する段階と;
・カウンタ値の前記シーケンスからの前記カウンタ値を、ビットストリーム・フレームの前記シーケンスからのビットストリーム・フレーム中に制御情報として挿入する段階であって、前記ビットストリーム・フレームの前記制御情報は、ビットストリーム・フレームの前記シーケンス内のビットストリーム・フレームの逐次順を示す、段階とを含む、
方法。
〔付番実施例64〕
接合点を示す接合されたビットストリームを生成する方法であって、
・ビットストリーム・フレームの第一のシーケンスからの特定のビットストリーム・フレームにおいて第一のビットストリームを打ち切り、打ち切られたビットストリームを提供する段階であって、ビットストリーム・フレームの前記第一のシーケンスは、第一のオーディオ信号のオーディオ・フレームの対応する第一のシーケンスを示し、ビットストリーム・フレームの前記第一のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第一のカウンタ値を含む、段階と;
・打ち切られたビットストリームをビットストリーム・フレームの第二のシーケンスを含む第二のビットストリームと連結して、前記接合されたビットストリームを提供する段階であって、ビットストリーム・フレームの前記第二のシーケンスは、第二のオーディオ信号のオーディオ・フレームの対応する第二のシーケンスを示し、前記第二のオーディオ信号は前記第一のオーディオ信号とは異なり、ビットストリーム・フレームの前記第二のシーケンスの前記ビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内の前記ビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、前記特定のビットストリーム・フレームの前記第一のカウンタ値および/または前記接合されたビットストリーム内で前記特定のビットストリーム・フレームに続くビットストリーム・フレームの前記第二のカウンタ値は、前記第一および第二のビットストリームの間の前記接合点を示す、段階とを含む、
方法。
〔付番実施例65〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含む接合されたビットストリームをデコードする方法であって、前記第一および第二のシーケンスはそれぞれ第一および第二のオーディオ信号を示し、ビットストリーム・フレームの前記第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み、ビットストリーム・フレームの前記第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、当該方法は、
・第一および第二のカウンタ値に基づいて前記第一および第二のシーケンスの間の接合点を検出し;
・前記接合点後の前記接合されたビットストリームのビットストリーム・フレームを正しくデコードするために必要なデータが利用可能であるかどうかを判定し;
・前記データが利用可能でない場合には、前記接合点後の前記接合されたビットストリームのビットストリーム・フレームのデコードをサスペンドすることを含む、
方法。
〔付番実施例66〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含む接合されたビットストリームを処理するオーディオ処理システムであって、前記第一および第二のシーケンスは一つまたは複数のオーディオ信号を示し、ビットストリーム・フレームの前記第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み、前記第一のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第一のサブシーケンスを含み、前記第一のサブシーケンスのビットストリーム・フレームは第一の所定の平均フレーム長を示し、ビットストリーム・フレームの前記第二シーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、前記第二のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第二のサブシーケンスを含み、前記第二のサブシーケンスのビットストリーム・フレームは第二の所定の平均フレーム長を示し、当該オーディオ処理システムは、
・前記第一および第二のシーケンスの間の遷移点を検出する段階と、
・前記遷移点の直前のビットストリーム・フレームの前記第一のシーケンスから第一のビットストリーム・フレームを決定する段階と、
・前記第一のビットストリーム・フレームのシーケンス・インデックス値i1を前記第一のビットストリーム・フレームの前記第一のカウンタ値q1に基づいて決定する段階であって、前記シーケンス・インデックス値i1は、前記第一のサブシーケンス内での前記第一のビットストリーム・フレームの位置を示す、段階と、
・前記遷移点の直後のビットストリーム・フレームの前記第二のシーケンスから第二のビットストリーム・フレームを決定する段階と、
・前記第二のビットストリーム・フレームのシーケンス・インデックス値i2を、前記第一のビットストリーム・フレームの前記シーケンス・インデックス値i1に基づいて決定する段階であって、前記シーケンス・インデックス値i2は、前記第二のサブシーケンス内での前記第二のビットストリーム・フレームの位置を示す、段階とを実行するよう構成されている、
オーディオ処理システム。
〔付番実施例67〕
・前記第一のビットストリーム・フレームの前記シーケンス・インデックス値i1はi1=q1 mod Zとして決定され、
・Zは前記第一のサブシーケンス内のビットストリーム・フレームの数である、
付番実施例66記載のオーディオ処理システム。
〔付番実施例68〕
前記遷移点が接合点であり;
前記遷移点が前記第一および/または第二のカウンタ値に基づいて検出される、
付番実施例66または67記載のオーディオ処理システム。
〔付番実施例69〕
前記遷移点が前記第二のビットストリーム・フレームの前記第二のカウンタ値に基づいて検出される、付番実施例68記載のオーディオ処理システム。
〔付番実施例70〕
前記遷移点が、前記第二のビットストリーム・フレームの前記第二のカウンタ値が所定のカウンタ値をもつことに基づいて検出される、付番実施例69記載のオーディオ処理システム。
〔付番実施例71〕
・前記第一の所定の平均フレーム長が、整数ではなく、有理数であり、
・前記第一のサブシーケンスのビットストリーム・フレームの前記所定の組のフレーム長は整数であり、
・前記第二の所定の平均フレーム長は、整数ではなく、有理数であり、
・前記第二のサブシーケンスのビットストリーム・フレームの前記所定の組のフレーム長は整数である、
付番実施例66ないし70のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例72〕
前記第一の所定の平均フレーム長は、前記第二の所定の平均フレーム長とは異なる、付番実施例66ないし71のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例73〕
・前記第一のビットストリーム・フレームの前記シーケンス・インデックス値i1は第一の剰余値r1に関連付けられており、
・前記第一の剰余値r1は、前記第一のビットストリーム・フレームまでの前記第一のサブシーケンスのビットストリーム・フレームについての中間的な平均フレーム長と、前記第一の所定の平均フレーム長との間の差を示し、
・当該オーディオ処理システムは、前記第一の剰余値r1に基づき、かつ前記第二の所定の平均フレーム長に基づき、第一の擬似シーケンス・インデックス値
【数1】
を決定するよう構成されており、
・前記第二のビットストリーム・フレームの前記シーケンス・インデックス値i2は前記擬似シーケンス・インデックス値
【数2】
に基づいて決定される、
付番実施例66ないし72のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例74〕
・前記第二のビットストリーム・フレームの前記シーケンス・インデックス値i2
【数3】
として決定され、
・Zは前記第二のサブシーケンスのビットストリーム・フレームの数である、
付番実施例73記載のオーディオ処理システム。
〔付番実施例75〕
・Nは前記第一の所定の平均フレーム長であり、
・Kは前記第二の所定の平均フレーム長であり、
・比K/Nまたは比N/Kは1より大きな整数である、
付番実施例66ないし74のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例76〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含むビットストリームを処理するためのオーディオ処理システムであって、前記第一および第二のシーケンスは、一つまたは複数のオーディオ信号を示し;ビットストリーム・フレームの前記第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み;前記第一のシーケンスは、第一の平均フレーム長を示し;ビットストリーム・フレームの前記第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み;前記第二のシーケンスは、第二の平均フレーム長を示し、当該オーディオ処理システムは、
・前記第一および第二のシーケンスの間の遷移点を検出し;
・前記遷移点の直前のビットストリーム・フレームの前記第一のシーケンスから第一のビットストリーム・フレームを決定し、
・前記第一のビットストリーム・フレームの前記第一のカウンタ値q1を決定し、
・前記遷移点の直後のビットストリーム・フレームの前記第二のシーケンスから第二のビットストリーム・フレームを決定し、
・前記第二のビットストリーム・フレームの前記第二のカウンタ値q2を決定し、
・前記遷移点が接合点であるかどうかを、前記第一のカウンタ値q1、前記第二のカウンタ値q1、前記第一の平均フレーム長および前記第二の平均フレーム長に基づいて判定するよう構成されている、
オーディオ処理システム。
〔付番実施例77〕
当該オーディオ処理システムは、
・前記第二のビットストリーム・フレームについての目標カウンタ値kを、前記第一のカウンタ値q1、前記第一の平均フレーム長および前記第二の平均フレーム長に基づいて決定し、
・前記遷移点が接合点であるかどうかを判定するために、前記目標カウンタ値kを前記第二のカウンタ値q2と比較するよう構成されている、
付番実施例76記載のオーディオ処理システム。
〔付番実施例78〕
当該オーディオ処理システムは、前記第二のビットストリーム・フレームについての前記目標カウンタ値kを、前記第一のカウンタ値の最大値Qmaxおよび/または最小値Qminにも基づいても決定するよう構成されている、付番実施例77記載のオーディオ処理システム。
〔付番実施例79〕
・Nは前記第一の平均フレーム長であり、
・Kは前記第二の平均フレーム長であり、
・比K/Nは1より大きな整数であり、
・前記目標カウンタ値kは
【数4】
として決定される、付番実施例78記載のオーディオ処理システム。
〔付番実施例80〕
・Nは前記第一の平均フレーム長であり、
・Kは前記第二の平均フレーム長であり、
・比N/Kは1より大きな整数であり、
・前記目標カウンタ値kは
【数5】
として決定される、付番実施例78記載のオーディオ処理システム。
〔付番実施例81〕
当該オーディオ処理システムは、前記目標カウンタ値kが第二のカウンタ値q2と異なる場合に前記遷移点が接合点であると判定するよう構成されている、付番実施例77ないし80のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例82〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含むビットストリームを処理する方法であって、前記第一および第二のシーケンスは、一つまたは複数のオーディオ信号を示し、ビットストリーム・フレームの前記第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み、前記第一のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第一のサブシーケンスを含み、前記第一のサブシーケンスのビットストリーム・フレームは第一の所定の平均フレーム長を示し、ビットストリーム・フレームの前記第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み、前記第二のシーケンスは、所定の組のフレーム長をもつビットストリーム・フレームの第二のサブシーケンスを含み、前記第二のサブシーケンスのビットストリーム・フレームは第二の所定の平均フレーム長を示し、t当該方法は、
・前記第一および第二のシーケンスの間の遷移点を検出し、
・前記遷移点の直前のビットストリーム・フレームの前記第一のシーケンスから第一のビットストリーム・フレームを決定し、
・前記第一のビットストリーム・フレームの第一のカウンタ値q1に基づいて前記第一のビットストリーム・フレームのシーケンス・インデックス値i1を決定し、前記シーケンス・インデックス値i1は前記第一のサブシーケンス内での前記第一のビットストリーム・フレームの位置を示し、
・前記遷移点の直後のビットストリーム・フレームの前記第二のシーケンスから第二のビットストリーム・フレームを決定し、
・前記第二のビットストリーム・フレームのシーケンス・インデックス値i2を、前記第一のビットストリーム・フレームの前記シーケンス・インデックス値i1に基づいて決定することを含み、前記シーケンス・インデックス値i2は前記第二のサブシーケンス内の前記第二のビットストリーム・フレームの位置を示す、
方法。
〔付番実施例83〕
ビットストリーム・フレームの第一および第二のシーケンスの連結を含むビットストリームを処理する方法であって、前記第一および第二のシーケンスは、一つまたは複数のオーディオ信号を示し;ビットストリーム・フレームの前記第一のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第一のシーケンス内のビットストリーム・フレームの逐次順を示す第一のカウンタ値を含み;前記第一のシーケンスは、第一の平均フレーム長を示し;ビットストリーム・フレームの前記第二のシーケンスのビットストリーム・フレームは、ビットストリーム・フレームの前記第二のシーケンス内のビットストリーム・フレームの逐次順を示す第二のカウンタ値を含み;前記第二のシーケンスは、第二の平均フレーム長を示し、当該方法は、
・前記第一および第二のシーケンスの間の遷移点を検出し;
・前記遷移点の直前のビットストリーム・フレームの前記第一のシーケンスから第一のビットストリーム・フレームを決定し、
・前記第一のビットストリーム・フレームの前記第一のカウンタ値q1を決定し、
・前記遷移点の直後のビットストリーム・フレームの前記第二のシーケンスから第二のビットストリーム・フレームを決定し、
・前記第二のビットストリーム・フレームの前記第二のカウンタ値q2を決定し、
・前記遷移点が接合点であるかどうかを、前記第一のカウンタ値q1、前記第二のカウンタ値q1、前記第一の平均フレーム長および前記第二の平均フレーム長に基づいて判定することを含む、
方法。
図1a
図1b
図2
図3
図4
図5a
図5b
図5c
図6a
図6b