(58)【調査した分野】(Int.Cl.,DB名)
現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲の上限との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、請求項1記載の方法。
第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の現在フレームの変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを要求し、
ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
請求項1ないし3のうちいずれか一項記載の方法。
前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、
請求項4記載の方法。
第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
請求項1ないし5のうちいずれか一項記載の方法。
前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、および/または
前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、
請求項6記載の方法。
前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、請求項7記載の方法。
前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号の前記フレームに位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、請求項6ないし8のうちいずれか一項記載の方法。
第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、請求項1ないし9のうちいずれか一項記載の方法。
前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲の上限はさらに該パラメータに基づいて同定される、請求項1ないし10のうちいずれか一項記載の方法。
前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、請求項1ないし12のうちいずれか一項記載の方法。
【発明を実施するための形態】
【0007】
上記に鑑み、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に効率的かつ適応的に変換する方法およびオーディオ・デコーダを提供することが目的である。
【0008】
〈I.概観〉
第一の側面によれば、この目的は、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元することを含む、
方法によって達成される。
【0009】
この構成では、フレームごとに、ナイキスト周波数が下げられるべきか否かについて判断がされる。各フレームについて、フレームにおけるデジタル・オーディオ信号の周波数範囲に基づいて判断がされる。周波数範囲が、ある閾値量より大きくナイキスト周波数を下回る場合には、すなわちデジタル・オーディオ信号がそのフレームにおいて帯域制限されていることが見出される場合には、ナイキスト周波数を下げる決定がされる。このようにして、本方法は、デジタル・オーディオ信号の各フレームにおける周波数内容に適応しうる。
【0010】
あるフレームにおいてナイキスト周波数を下げる決定がされたら、そのフレームに関して同定された周波数範囲より上のスペクトル帯域を除去することによって、ナイキスト周波数はそのもとの値から低下した値に下げられる。結果として、第一の周波数領域から第二の周波数領域に中間的時間領域を介してデジタル・オーディオ信号を変換するプロセスにおいて、除去されるスペクトル帯域が省略されるので、計算量が低減される。換言すれば、変換のサイズがサブサンプリング因子だけ低下し、それにより変換がそれほど計算要求的でなくなる。さらに、周波数範囲はフレームからフレームへと変わることがあり、ナイキスト周波数の低下した値は周波数範囲に依存するので、本方法は、異なるフレームにおけるナイキスト周波数の異なる低下した値を許容する。このようにして、本方法はさらに、フレーム間での周波数内容における変動に適応しうる。
【0011】
周波数領域におけるナイキスト周波数の低減は、時間領域におけるデジタル・オーディオ信号のサブサンプリングに対応する。ナイキスト周波数の低減はこのように、時間領域に変換されたときにデジタル・オーディオ信号がサブサンプリングされるという効果をもつ。具体的には、デジタル・オーディオ信号が時間領域でサブサンプリングされる因子は、ナイキスト周波数のもとの値とナイキスト周波数の低下した値との間の比によって与えられる。第一の周波数領域は一般には、第一の時間‐周波数変換に関連していてもよい。第二の周波数領域は一般に第二の時間‐周波数変換に関連していてもよい。第一の周波数変換は第一のフィルタバンクに関連していてもよく、第二の周波数領域は第二のフィルタバンクに関連していてもよい。
【0012】
デジタル・オーディオ信号はサンプリング・レートに関連する。ナイキスト周波数は、デジタル・オーディオ信号のサンプリング・レートの半分である。これは、デジタル・バージョンにおいて表現されうる、もとのオーディオ信号の最高周波数である。ナイキスト周波数は、このように、第一の周波数領域におけるデジタル・オーディオ信号の表現についての周波数スケールでの最高周波数である。
【0013】
デジタル・オーディオ信号は、フレームの形でデコーダにおいて受領されてもよい。デジタル・オーディオ信号のフレームは、デジタル・オーディオ信号のあらかじめ定義された継続時間の時間的部分を表わす。
【0014】
周波数範囲とは、典型的には、デジタル・オーディオ信号の0でないスペクトル内容をもつ帯域幅または最高周波数を意味する。
【0015】
スペクトル内容とは、一般に、デジタル・オーディオ信号の周波数領域表現における種々のスペクトル帯域についてのデジタル・オーディオ信号の値もしくは係数を意味する。
【0016】
スペクトル帯域とは、デジタル・オーディオ信号の周波数領域表現における周波数区間を意味する。
【0017】
周波数領域表現とは、典型的には、時間‐周波数領域変換またはフィルタバンクの出力をなす係数もしくはサブバンド・サンプルを意味する。変換またはフィルタバンクという用語は本開示では交換可能に使われる。
【0018】
上記で論じたように、ナイキスト周波数の低下した値は、フレーム間で変わりうる。これは、本方法が、あるフレームから次のフレームに移るときに、ナイキスト周波数のある低下した値からナイキスト周波数の別の低下した値に切り換えうることを意味する。具体的には、現在フレームのナイキスト周波数の低下した値は、現在フレームの周波数範囲との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定されてもよい。たとえば、現在フレームの周波数範囲が前のフレームにおけるナイキスト周波数の低下した値より上か下かに依存して、ナイキスト周波数の低下した値はそれぞれ増大または減少させられてもよい。これは、ナイキスト周波数の低下した値をどのように調整するかについての決定が、逐次的な仕方でなされることを許容する。
【0019】
例示的実施形態によれば、現在フレームの周波数範囲がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される(すなわち、ナイキスト周波数が増大させられる)。これらの状況においてナイキスト周波数の低下した値を増大させることが好ましいのは、エイリアシングおよび帯域幅打ち切りのようなアーチファクトを防ぐためである。典型的には、閾値量は0に設定され、帯域幅が前のフレームからのナイキスト周波数の低下した値を超えて増大する場合にはナイキスト周波数の低下した値は常に増大させられる。周波数範囲がナイキスト周波数の低下した値を超えるとは、その周波数範囲内の最高周波数がナイキスト周波数の低下した値を超えることを意味する。
【0020】
現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と同様である場合もありうる。その場合、本方法は、前のフレームからのナイキスト周波数の低下した値を保持することを決めてもよい。ナイキスト周波数の低下した値を調整することによって、アーチファクトが全く(またはほとんど)導入されないおよび/または計算量の点でほとんど得るものがないからである。(実のところ、ナイキスト周波数の別の低下した値への切り換えはこの状況では、最悪の場合には、計算量の増大につながることがある。のちにさらに説明するように、時間領域におけるデジタル・オーディオ信号の再サンプリングが必要となるからである。)より詳細には、現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される。
【0021】
現在フレームの周波数範囲が前のフレームのナイキスト周波数の低下した値より(閾値量によって定義されるところにより)著しく低い場合には、計算量の理由により、前のフレームから現在フレームに移るときにナイキスト周波数の低下した値を減少させることが有益でありうる(すなわち、ナイキスト周波数がさらに減少させられる)。具体的には、現在フレームの周波数範囲が前のフレームのナイキスト周波数の低下した値より、ある閾値量より大きく下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。閾値量はたとえば、前のフレームのナイキスト周波数の低下した値の20%に対応してもよい。
【0022】
しかしながら、ナイキスト周波数の低下した値がフレーム間であまりに頻繁に変化するのは望ましくないことがありうる。下記のサブサンプリングの個々の実装に依存して、これは、望ましくないほど高い計算量および/または可聴アーチファクトにつながることがある。好ましくは、本方法は、次のフレームの周波数範囲が前のフレームのナイキスト周波数の低下した値を、閾値量より大きく超える場合には、前のフレームから現在フレームにかけてナイキスト周波数の低下した値を常に増大させる。これは、スペクトル内容を制限するなど、可聴アーチファクトを避けるという理由のためである。
【0023】
しかしながら、前のフレームから現在フレームにかけてナイキスト周波数の低下した値を減少させるときは、あらかじめ定義される数の前のフレームの周波数範囲を考慮に入れてもよい。この目的のために、現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲に依存して設定されてもよい。このようにして、ナイキスト周波数の低下した値が一つ一つのフレームにおいて不必要に調整される状況を回避しうる。
【0024】
たとえば、周波数範囲がいくつかのフレームを通じて本質的に同じままであったという要件があってもよい。こうして、さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。
【0025】
代替的または追加的に、いくつかの前のフレームの周波数範囲が、現在フレームの直前のフレームのナイキスト周波数の低下した値より低いままであったという要件があってもよい。より詳細には、さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲が直前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、直前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。
【0026】
このように、これらの要件は、フレーム間でのナイキスト周波数の低下した値の、よりなめらかな遷移につながりうる。
【0027】
上記で言及した閾値量は、みな異なっていてもよく、典型的にはデコーダにおいてあらかじめ定義されている。
【0028】
フレームごとにナイキスト周波数の低下した値を(そしてそれによりサブサンプリング比を)適応させることは、先行する諸フレームからの時間領域サンプルに頼る変換に困難を呈する。第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域へのデジタル・オーディオ信号の変換が、現在フレームからのデジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからのデジタル・オーディオ信号の中間的時間領域のサンプルを要求する場合に特にそうである。
【0029】
変換サイズの変化は、現在フレームからデコードされる中間的時間領域のサンプルのサンプリング・レートの変化につながる。これらは、システムにいまだ記憶されている、前の諸フレームからの中間的時間領域のサンプルのサンプリング・レートに一致しない。前の諸フレームからの中間的時間領域のサンプルは、さらなる合同処理のために、現在フレームの中間的時間領域のサンプルと組み合わされる必要がある。例示的実施形態によれば、この問題は、前のフレーム(単数または複数)からの時間領域サンプルを再サンプリングすることによって解決される。具体的には、本方法は、ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおけるデジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含んでいてもよい。
【0030】
再サンプリングが行なわれるのは、遷移フレーム(単数または複数)においてのみ、すなわちナイキスト周波数の異なる低下した値(すなわち、異なるサブサンプリング比)に関連する隣接フレームについてのみである。ナイキスト周波数の新たな低下した値への切り換えが完了したら、再サンプリングはもはや必要ない。
【0031】
変換のサブサンプリングされた動作は、システムにおける時間的遅延を導入することがある。より詳細には、(ナイキスト周波数が下げられたときの)サブサンプリングされた動作におけるデコーダの出力信号は、もとのサンプリング・レートで動作するときのデコーダの出力信号に対して遅れることがある。これは望ましくない。というのも、最適には、デコーダの出力信号は、変換がもとのサンプリング・レートまたは低下したサンプリング・レートのどちらで動作するかに関わりなく(すなわち、ナイキスト周波数がそのもとの値をもつか低下した値をもつかに関わりなく)同じであることが望まれるからである。さもなければ可聴アーチファクトがあることがある。時間的遅延は、デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われる第一のフィルタのバンクのフィルタ(本稿では時に窓と称される)と、デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われる第二のフィルタのバンクのフィルタとの時間的な整列不良に起因する。たとえば、偶対称な逆MDCT窓と奇対称なQMF窓の整列不良があるであろう。前のフレームの中間的時間領域のサンプルの再サンプリングは、この時間的遅延を補償することを含んでいてもよい。そのような補償が実行されないと、デコーダのオーディオ出力において可聴アーチファクトがあることがある。
【0032】
一般に、時間的遅延は、前のフレームの時間領域サンプルを、再サンプリングするときにある遅延値だけ時間的にシフトすることによって補償されうる。前のフレームの中間的時間領域のサンプルの再サンプリングにおいて補償される時間的遅延は値d
fract,1によって与えられ、これは
d
fract,1=(q
1−1)/2
に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q
1に依存する。
【0033】
前のフレーム(単数または複数)の中間的時間領域のサンプルの再サンプリングは、種々の仕方で実行されうる。高品質の再サンプリングが所望される場合、補間および有限インパルス応答(FIR)フィルタリングおよびそれに続く間引きが使われてもよい。代替は、線形補間または三次スプライン補間のような補間を使って、前のフレームの中間的時間領域のサンプルを再サンプリングすることである。これは、より低品質の結果につながるが、非常に低い計算量である。この文脈での品質とは、変換のサブサンプリングされた動作でのデコーダの出力信号が、もとのサンプリング・レートで変換が動作するときのデコーダの出力信号と同様であることを意味する。
【0034】
一般に、第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連していてもよく、第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連していてもよい。第一のフィルタバンクは、第一のフィルタバンクにおけるフィルタの数に等しい第一の変換サイズに関連しており、第一のフィルタバンクにおけるフィルタの数は対応する変換の周波数帯域またはチャネルの数に対応する。同様に、第二のフィルタバンクは、第二のフィルタバンクにおけるフィルタの数に等しい第二の変換サイズに関連しており、第二のフィルタバンクにおけるフィルタの数は対応する変換の周波数帯域またはチャネルの数に対応する。第一のフィルタバンクおよび第二のフィルタバンクは、もとのサンプリング・レートで動作することが意図されている。すなわち、第一および第二のフィルタバンクは、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換するよう設計される。ここで、中間的時間領域におけるサンプリング・レートはもとのサンプリング・レートである。これらのフィルタの変換サイズおよびあらかじめ決定された長さはこのように、デジタル・オーディオ信号のもとのサンプリング・レート(およびナイキスト周波数のもとの値)に関連している。しかしながら、ナイキスト周波数が下げられるので、サンプリング・レートはサブサンプリング因子だけ下げられる。結果として、低下したサンプリング・レートで動作する変換またはフィルタバンクが必要になる。もとのサンプリング周波数に関連する第一および第二のフィルタバンクが、低下したサンプリング・レートで動作する変換またはフィルタバンクを提供するための出発点として採用されてもよい。
【0035】
まず始めに、スペクトル帯域の除去によるナイキスト周波数の低下は、第一および第二のフィルタバンクのサイズ、すなわちスペクトル帯域もしくは周波数チャネルの数がサブサンプリング因子により低減されうることを含意する。これが可能なのは、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換するプロセスにおいて、除去されたスペクトル帯域が省略されうるからである。
【0036】
さらに、ナイキスト周波数の低下はサンプリング・レートの低下につながるので、第一および第二のフィルタバンクにおけるフィルタの長さが、低下したサンプリング・レートにマッチするよう短縮されてもよい。したがって、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:第一のバンクの合成フィルタの長さをサブサンプリング因子により短縮し、デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するときに短縮された長さの合成フィルタを使うことおよび/または第二のバンクの分解フィルタの長さをサブサンプリング因子により短縮し、デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに短縮された長さの分解フィルタを使うことを含んでいてもよい。このようにして、第一および第二のバンクのそれぞれ合成フィルタおよび分解フィルタは、ナイキスト周波数の低下した値に対応する低下したサンプリング・レートに適応されうる。
【0037】
第一および第二のバンクは変調された(modulated)フィルタバンクであってもよい。その場合、第一のフィルタバンクは、第一のプロトタイプ・フィルタに関連していてもよく、該第一のプロトタイプ・フィルタから第一のバンクの合成フィルタが導出されうる。さらに、第二のフィルタバンクは、第二のプロトタイプ・フィルタに関連していてもよく、該第二のプロトタイプ・フィルタから第二のバンクの分解フィルタが導出されうる。変調されたフィルタバンクの場合、合成フィルタおよび分解フィルタの長さは、まずそれぞれのプロトタイプ・フィルタの長さを短縮し、次いで短縮された長さのプロトタイプ・フィルタから合成および分解フィルタを導出することによって、短縮されうる。
【0038】
第一および第二のバンクのそれぞれ合成フィルタおよび分解フィルタの長さを短縮する種々の方法がある。たとえば、閉じた形の表式が利用可能であれば、それを使って、短縮された長さをもつフィルタを再計算してもよい。代替的に、あるいは閉じた形の表式が利用可能でない場合には、フィルタはその長さを短縮するためにダウンサンプリングされてもよい。具体的には、第一のバンクの合成フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮されうる。さらに、第二のバンクの分解フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮されうる。
【0039】
変調されたフィルタバンクの場合、プロトタイプ・フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは閉じた形の表式からの再計算することによって短縮されてもよい。
【0040】
可聴アーチファクトを避けるために、第一のバンクの合成フィルタおよび/または第二のバンクの分解フィルタのダウンサンプリングは、上記のように、第一のバンクの合成フィルタおよび第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含んでいてもよい。この時間的な整列不良は、補償されるべき、もとのサンプリング格子に対する第一および第二のバンクのサブサンプリングされた格子の間の不一致につながる。一般に、時間的遅延は、ダウンサンプリングするときに適宜合成または分解フィルタ(またはそのプロトタイプ)をある遅延値だけ時間的にシフトさせることによって補償されうる。
【0041】
フィルタをダウンサンプリングするときに時間的遅延を補償することの代替として、時間的遅延は、デジタル・オーディオ信号を第二の周波数領域に変換した後に補償されてもよい。より詳細には、本方法は、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、デジタル・オーディオ信号に位相シフトを適用することを含んでいてもよい。ここで、位相シフトは、第一のバンクの合成フィルタおよび第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する。この遅延補償は、デコーダのオーディオ出力において、小さいが可聴でない位相誤差を導入する。
【0042】
第一のバンクの合成フィルタおよび/または第二のバンクの分解フィルタのダウンサンプリングのときまたは第二の周波数領域のデジタル・オーディオ信号に位相シフトを加えるときに補償される時間的遅延は値d
fract,2によって与えられ、これは
d
fract,2=(q
2−1)/2
に従ってサブサンプリング因子に依存する。ここで、q
2は(当該フレームの)サブサンプリング因子である。
【0043】
計算量を節約する理由で、第一のバンクにおける合成フィルタおよび/または第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされてもよい。
【0044】
例示的実施形態によれば、第一の周波数領域は修正離散コサイン変換(MDCT)領域であってもよく、第二の周波数領域は直交ミラーフィルタ(QMF)領域であってもよい。
【0045】
デジタル・オーディオ信号の周波数範囲(あるいはむしろその上限値)、すなわち帯域幅は、典型的には、第一の周波数領域において表現されたデジタル・オーディオ信号のスペクトルにおける0でないスペクトル内容をもつ帯域幅または最高周波数として決定される。しかしながら、例示的実施形態によれば、本方法はさらに、デジタル・オーディオ信号に関係するパラメータを受領することを含んでいてもよく、前記周波数範囲はさらに該パラメータに基づいて同定される。たとえば、パラメータは周波数閾値に関係していてもよく、該周波数閾値より上ではデジタル・オーディオ信号のスペクトル内容は、該周波数閾値より下のスペクトル内容に基づいて再構成される(たとえば、スペクトル帯域複製のような高周波数再構成技法を使って)。その場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は、該周波数閾値に設定されてもよい。
【0046】
ナイキスト周波数の低下した値は、同定された周波数範囲の最高周波数に等しくなるよう選択されてもよい。そのような実施形態では、デジタル・オーディオ信号のナイキスト周波数をそのもとの値から低下した値に下げる段階は、同定された周波数範囲より上のデジタル・オーディオ信号のすべてのスペクトル帯域を除去することを含む。
【0047】
しかしながら、効率的な実装のために、サブサンプリング因子の限られた集合のみが(よってナイキスト周波数の低下した値の限られた集合のみが)サポートされてもよい。サブサンプリング因子のこの限られた集合は典型的には、それらのサブサンプリング因子が、効率的に実装されることができる変換サイズ(たとえば2の冪のサイズのFFT)につながるよう設計される。好ましくは、前記集合内のサブサンプリング因子に対応する事前にプログラムされた変換またはフィルタバンクがある。このようにして、ナイキスト周波数のある低下した値から別の低下した値に切り換える際、フィルタをダウンサンプリングするまたは再計算する必要を回避しうる。
【0048】
詳細には、デジタル・オーディオ信号のナイキスト周波数を下げる段階は、よって:ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、同定された周波数範囲より上である前記あらかじめ定義された集合内の最低の値として選択し、ナイキスト周波数の選択された低下した値より上のデジタル・オーディオ信号のスペクトル帯域を除去することを含む。
【0049】
デジタル・オーディオ信号がマルチチャネル信号である、すなわち複数のオーディオ・チャネルを含む場合には、ナイキスト周波数を下げるかどうかおよびどのように下げるかについての決定は、チャネルごとになされる。具体的には、デジタル・オーディオ信号の周波数範囲を同定し、ナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する。
【0050】
第二の側面によれば、処理機能をもつ装置によって実行されるときに上記の請求項のうちいずれか一項記載の方法を実行するためのコンピュータ・コード命令が記憶されている(非一時的な)コンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトが提供される。
【0051】
第三の側面によれば、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダが提供される。当該オーディオ・デコーダは:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元するよう構成されている。
【0052】
第二および第三の側面は一般に第一の側面と同じ特徴および利点をもちうる。
【0053】
〈II.例示的実施形態〉
図1は、オーディオ・デコーダ100を概略的に示している。オーディオ・デコーダ100は受領コンポーネント110と、第一の変換コンポーネント120と、信号処理コンポーネント130と、第二の変換コンポーネント140とを有する。
【0054】
使用時には、受領コンポーネントは(エンコードされた)デジタル・オーディオ信号102を受領する。デジタル・オーディオ信号102は時間的に一連のフレームにおいて受領される。受領コンポーネント110において受領されるデジタル・オーディオ信号102は、ここでもとのサンプリング・レートと称されるサンプリング・レートに関連している。もとのサンプリング・レートは、デジタル・オーディオ信号102の相続く時間的サンプルの間の時間的距離の逆数である。
【0055】
デジタル・オーディオ信号102は種々のオーディオ・チャネルを有していてもよい。本稿に記載される方法は、デジタル・オーディオ信号102のオーディオ・チャネルのそれぞれに対して別個に、あるいは任意の組み合わせにおいて適用されうることは理解されるものとする。たとえば、いくつかのオーディオ・チャネルがパラメトリックに符号化されて、第二の周波数領域で動作するパラメトリック・ツールによって、より高い周波数にスペクトル内容が追加されるのでもよい。そのようなパラメトリック・ツールが使われるときは、第一の周波数領域で表現されているオーディオ・チャネルの帯域幅は典型的にはナイキスト周波数の半分以下に制限され、そのことは変換サイズを二倍以上削減することを許容する。もう一つの例として、低域効果(LFE: low frequency effect)オーディオ・チャネルは定義により数百Hzに帯域制限されており、因子8、あるいはさらには16による一層積極的なサブサンプリングを許容する。このように、異なるオーディオ・チャネルは異なる帯域幅特性を有していてもよい。計算量の最大限の削減を達成するために、オーディオ・チャネルを別個に扱うことによって、異なるオーディオ・チャネルは、異なる因子によるサブサンプリングを受けることができる。
【0056】
デコーダ100において受領されるデジタル・オーディオ信号102は典型的には時間領域ではなく、周波数領域で表現されている。たとえば、エンコーダからデコーダへの効率的な伝送のため、デジタル・オーディオ信号102はエンコーダにおいて、MDCTまたは当該目的のために好適であると見出される別のフィルタバンクのような分解フィルタのフィルタバンクの適用によって、第一の周波数領域に変換されていることがありうる。こうして、受領時に、デジタル・オーディオ信号102は、第一の周波数領域において、すなわち種々の周波数帯域についてのデジタル・オーディオ信号102のスペクトル内容を記述する周波数領域サンプルの集まりとして表現されている。基本的なデジタル信号処理によれば、第一の周波数領域におけるデジタル・オーディオ信号102の表現の最大周波数は、デジタル・オーディオ信号102のもとのサンプリング・レートの半分であるナイキスト周波数によって与えられる。
【0057】
次いで、デジタル・オーディオ信号102は、デジタル・オーディオ信号102を第一の周波数領域表現から第二の周波数領域表現に変換するよう構成された第一の変換コンポーネント120に渡される。ある周波数領域から別の周波数領域に変換する理由は、異なる周波数領域表現には異なる利点が伴うことがあるからである。たとえば、第一の周波数領域表現はデジタル・オーディオ信号102の波形をエンコードしてエンコーダからデコーダ100に送るために好ましいことがあり、一方、第二の周波数領域表現は、デコーダ100におけるデジタル・オーディオ信号102の処理および合成のために、たとえばパラメトリック再構成のために好ましいことがありうる。第二の周波数領域はQMF領域であってもよい。
【0058】
次いで、デジタル・オーディオ信号102は第一の変換コンポーネント120から信号処理コンポーネント130に渡され、そこでデジタル・オーディオ信号102のさまざまな処理が第二の周波数領域において実行される。たとえば、信号処理コンポーネント130は、当技術分野で既知の高周波数再構成を含むパラメトリック再構成を実行してもよい。
【0059】
信号処理コンポーネント130からの結果として得られる信号は、次いで、第二の変換コンポーネント140によって第二の周波数領域から時間領域に変換される。その後の再生のための出力信号104を生成するためである。
【0060】
オーディオ・デコーダ100の概括的な構造は従来技術のデコーダのものと同様であるが、オーディオ・デコーダ100は第一の変換コンポーネント120の機能において従来技術のデコーダと異なっている。計算量を減らすために、第一の変換コンポーネント120は、(第一の周波数領域から時間領域への、および時間領域から第二の周波数領域への)変換のサイズが適応的に、すなわちフレームごとに変わることを許容する方法を実装する。これは、各フレームにおけるナイキスト周波数を、フレーム内のデジタル・オーディオ信号102の帯域幅に適応させることによって達成される。これは、帯域幅より上のデジタル・オーディオ信号102の(典型的には空の)スペクトル帯域を省略することによる。時間領域の観点からは、これはデジタル・オーディオ信号102および変換をフレームごとにサブサンプリングすることに対応する。
【0061】
第一の変換コンポーネント120の動作は、
図1および
図3ならびに
図2のフローチャートを参照して、下記でより詳細に記述される。
【0062】
図2の段階S02では、変換コンポーネント120は、デコーダ100の受領コンポーネント110から、第一の周波数領域で表現されたデジタル・オーディオ信号102のフレームを受領する。例示的実施形態によれば、第一のデジタル・オーディオ信号102はMDCTスペクトルの形で与えられる。受領コンポーネント110は、デジタル・オーディオ信号102の該フレームを、エンコーダから受領している。
【0063】
段階S04では、変換コンポーネント120はデジタル・オーディオ信号102の周波数範囲を同定する。周波数範囲は、デジタル・オーディオ信号102のスペクトル内容を解析することによって識別される。これは
図3のaにさらに示されている。この図は、第一の周波数領域において表現されたデジタル・オーディオ信号102のフレームを示している。斜線付きのビンは、0でないスペクトル内容をもつスペクトル帯域に対応する。表現されている最高周波数がナイキスト周波数f
Nであり、これはデジタル・オーディオ信号102のもとのサンプリング・レートf
Sの半分である。すなわち、f
N=f
S/2である。変換コンポーネント120は典型的には、周波数範囲を、デジタル・オーディオ信号102の帯域幅Bとして、すなわちスペクトルにおいて0でないスペクトル内容をもつ最高周波数として決定してもよい。しかしながら、周波数範囲が、デジタル・オーディオ信号102に関係する受領されたパラメータにさらに基づいて決定される例示的実施形態がある。たとえば、それらのパラメータは周波数閾値に関係していて、該周波数閾値より上ではデジタル・オーディオ信号のスペクトル内容が該周波数閾値より下のスペクトル内容に基づいて信号処理コンポーネント130によって(たとえばスペクトル帯域複製のような高周波数再構成技法を使って)再構成されるのでもよい。そのような場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は該周波数閾値に設定されてもよい。もう一つの例によれば、パラメータは周波数閾値に関係していて、該周波数閾値より上ではデジタル・オーディオ信号102のあるオーディオ・チャネルのスペクトル内容が信号処理コンポーネント130によって、デジタル・オーディオ信号の別のオーディオ・チャネルからのスペクトル内容に基づいて再構成されるのでもよい。そのような場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は、その周波数閾値に設定されてもよい。
【0064】
次に、段階S06において、変換コンポーネント120は、周波数範囲があらかじめ定義された量より大きくナイキスト周波数f
Nを下回るかどうかを検査する。
【0065】
もしそうでなければ、帯域幅を制限するまたはエイリアシング・アーチファクトを導入することなくデジタル・オーディオ信号102をサブサンプリングすることは可能ではないと見出される。よって、変換コンポーネント120は段階S14において、ナイキスト周波数を下げることなくデジタル・オーディオ信号102を変換することに進む。換言すれば、変換コンポーネント120は従来技術のシステムのように、すなわちもとのサンプリング・レートで動作する。そうするためには、変換コンポーネント120はまず、逆MDCTフィルタバンクのような合成フィルタの第一のバンクを使って、オーディオ信号102を第一の周波数領域表現から中間的時間領域表現に変換してもよい。第一のフィルタバンクは、バンク内のフィルタの数(これは、変換の周波数サブバンドまたはチャネルの数である)に対応する第一の(あらかじめ決定された)変換サイズに関連している。さらに、第一のバンクのフィルタ(時に窓と称される)はあらかじめ決定された長さをもつ。第一のフィルタバンクを使った変換後、デジタル・オーディオ信号102は中間的時間領域で表現されており、そのもとのサンプリング・レートをもつ。
【0066】
次いで、QMFフィルタバンクのような分解フィルタの第二のバンクを使って、オーディオ信号102を中間的時間領域表現から第二の周波数領域表現に変換する。第二のフィルタバンクは、バンク内のフィルタの数(これは、変換の周波数サブバンドまたはチャネルの数である)に対応する第二の(あらかじめ決定された)変換サイズに関連している。さらに、第二のバンクのフィルタ(時に窓と称される)はあらかじめ決定された長さをもつ。第一および第二のフィルタバンクおよびその中のフィルタは、このように、もとのサンプリング周波数で動作することが意図されている。たとえば、第一のバンクはフィルタ長4096をもつサイズ2048のMDCT変換に対応してもよく、第二のバンクはフィルタ長640をもつサイズ64のQMFバンクに対応してもよい。
【0067】
好ましくは、第一および第二のフィルタバンクは変調されたフィルタバンクである。変調されたフィルタバンクは、プロトタイプ・フィルタをもち、該プロトタイプ・フィルタからフィルタバンク内のフィルタが導出されうる。
【0068】
段階S14を完了した後、変換コンポーネント120は段階S02に戻り、そこでデジタル・オーディオ信号のその後のフレームが受領される。
【0069】
段階S06において上記の代わりに、周波数範囲があらかじめ定義された量だけナイキスト周波数f
Nより低いことが見出される場合には、変換コンポーネントは段階S08に進む。
【0070】
段階S08では、変換コンポーネント120は、ナイキスト周波数の低下した値f
N,redを設定する。エイリアシングや帯域幅減少を避けるために、ナイキスト周波数の低下した値は、前記周波数範囲における最高周波数以上であるべきである。たとえば、ナイキスト周波数の低下した値は、同定された周波数範囲の最高周波数(これは
図3のaの例では帯域幅Bである)に等しいように選択されてもよい。
【0071】
しかしながら、効率的な実装のために、ナイキスト周波数の低下した値の限定された集合のみがサポートされてもよい。ここで、該限定された集合の低下した値はたとえば、もとのナイキスト周波数をある集合のサブサンプリング因子で割ることで与えられる。たとえば、サブサンプリング因子の集合はサブサンプリング因子1、4/3、2、4、8および16を含んでいてもよい。よって、変換コンポーネント120は、サブサンプリング因子のこの集合のうちから、デジタル・オーディオ信号102の同定された周波数範囲より上であるがまだナイキスト周波数の低下した値を与える最大の可能なサブサンプリング因子を選択してもよい。あるいはまた、変換コンポーネント120は、ナイキスト周波数の低下した値の限定された集合のうち、デジタル・オーディオ信号102の同定された周波数範囲を超える最低の値を選択してもよい。
【0072】
一般に、変換コンポーネント120は、同定された周波数範囲より上のデジタル・オーディオ信号102のスペクトル帯域を除去することによって、ナイキスト周波数の値をそのもとの値f
Nから低下した値f
N,redに下げてもよい。これは
図3のbにおいてさらに示されている。この図では、前記周波数範囲より上のスペクトル帯域が除去されて、スペクトルにおける最高周波数がナイキスト周波数の低下した値f
N,redになっている。時間領域の観点からは、これはデジタル・オーディオ信号102をサブサンプリング因子によって、すなわちf
N/f
N,redによってサブサンプリングすることに対応する。
【0073】
ナイキスト周波数を低下した値に下げたら、変換は、デジタル・オーディオ信号102を第一の周波数領域(これはたとえばMDCT領域)から第二の周波数領域(これはたとえばQMF領域)に中間的時間領域を介して変換することに進む。これはさらに
図3のcにおいて示されている。この図は、第二の(サブサンプリングされた)周波数領域において表現されたデジタル・オーディオ信号102を示している。ナイキスト周波数が下げられているので、変換コンポーネント120は、低下した変換サイズで機能しうる。具体的には、変換サイズは、もとのサンプリング・レートに比べて、サブサンプリング因子だけ低下していてもよい。このようにして、計算量が削減される。こうして、もとのサンプル・レートで動作する第一および第二のフィルタバンクを使う代わりに、段階S14との関連で上記したように、変換コンポーネント120は、低下した変換サイズの第一のフィルタバンクを第一の周波数領域から中間的時間領域への変換のために、低下した変換サイズの第二のフィルタバンクを中間的時間領域から第二の周波数領域への変換のために、使ってもよい。
【0074】
この目的のために、変換コンポーネント120は、複数の異なるサンプリング・レートで、すなわちサブサンプリング因子の複数の異なる値で動作するよう意図されたフィルタバンクを計算し、記憶していてもよい。これらのフィルタバンクは該異なるサブサンプリング因子が選択されるたびに再利用されうる。このようにして、計算量が削減されうる。好ましくは、変換コンポーネント120は、サブサンプリング因子の限定された集合をサポートするだけであってもよい。このようにして、フィルタ係数または窓を不揮発性メモリに事前に記憶しておくことにより、異なるサイズのフィルタまたは変換窓を計算するための計算努力が最小化されるまたは完全になくされる。
【0075】
特定のサブサンプリング因子に対応する低下した変換サイズの第一および第二のフィルタバンクを計算するために、変換コンポーネント120は、もとのサンプリング・レートで動作する第一および第二のフィルタバンクを出発点として採用してもよい。
【0076】
第一に、変換サイズが低減される必要がある。つまり、フルサイズの第一のフィルタバンクにおける合成フィルタの数が前記サブサンプリング因子によって減らされ、フルサイズの第二のフィルタバンクにおける分解フィルタの数が前記サブサンプリング因子によって減らされる。変換サイズ削減は、段階S08においてデジタル・オーディオ信号102から除去されたスペクトル帯域に対応する第一および第二のフィルタバンクからのフィルタを除去することによって達成される。
【0077】
第二に、第一および第二のバンクにおけるフィルタの長さが、低下したサンプリング・レートに鑑みて調整される必要がある。よって、変換コンポーネント120は、第一のバンクの合成フィルタの長さおよび第二のバンクの分解フィルタの長さを、前記サブサンプリング因子によって短縮してもよい。
【0078】
これは、種々の仕方でなされうる。第一のバンクの合成フィルタを記述する閉じた形の表式および/または第二のバンクの分解フィルタを記述する閉じた形の表式がある場合には、これらの閉じた形の表式が、短縮された長さのフィルタを計算し直すために使われてもよい。
【0079】
代替的に、あるいは閉じた形の表式が利用可能でない場合には、フィルタの長さは、サブサンプリング因子によってダウンサンプリングすることによって短縮されてもよい。たとえば、フィルタは、線形補間または三次スプライン補間のような補間を使ってダウンサンプリングされてもよい。
【0080】
サブサンプリング因子に対応する第一および第二のフィルタバンクの計算は、変調されたフィルタバンクが使われる場合には容易にされる。その場合、それぞれフルサイズの第一および第二のフィルタバンクのプロトタイプ・フィルタが、修正後に、サブサンプリングされた動作のための対応する第一および第二のフィルタバンクを導出するために使われてもよい。この目的のために、変換コンポーネント120はまず、フルサイズの第一のフィルタバンクの合成プロトタイプ・フィルタの長さをサブサンプリング因子により短縮してもよい。これは、上記のようにサブサンプリング因子によってダウンサンプリングすることによりまたは閉じた形の表式から短縮された長さの合成プロトタイプ・フィルタを再計算することによる。次いで、短縮された長さの合成プロトタイプ・フィルタが、サブサンプリング因子に対応する低減された変換サイズの第一のフィルタバンクを導出するために使われてもよい。同じことは、低減された変換サイズの第二のフィルタバンクを導出することとの関連で第二のフィルタバンクの分解プロトタイプ・フィルタにも当てはまる。
【0081】
どの周波数表現が使われるかに依存して、変換のサブサンプリングされた動作(すなわち、上記のダウンサンプリングされたフィルタのような低減されたサイズの変換の使用)は、時間的遅延を導入しうる。たとえば、第一の周波数領域表現がMDCTであり、第二の周波数領域表現がQMFである場合、偶対称の逆MDCT窓および奇対称のQMF窓の整列不良があることがある。このことは
図4にさらに示されている。より具体的には、信号チェーンの他の諸分枝との同期を維持するために、補償されるべきサブサンプリングされた領域におけるサンプルの半端な数の遅延の差がある。その理由は、MDCTのサンプル点は窓の中心に対してシフトされた格子上に位置されており、一方、QMFバンクについてはそうではないことがあるからである。このことは、q
2=2の場合について
図4に示されている。
【0082】
図4のaは、もとのサンプリング・レートにおけるMDCT窓に対するサンプル点の位置を示している。
図4のbは、QMF窓についての対応する状況を示している。連続的な時間軸上では、これは、MDCT合成およびそれに続くQMF分解のフルバンド適用についての相対的なタイミング・シナリオの例を表わしている。サブサンプリングされた動作は同じ相対的なタイミングに従うことが望ましい。しかしながら、
図4のcは、(サブサンプリング因子2によって下げられた)低下したサンプリング・レートでのMDCT窓に対するサンプル点の位置を示している。QMF分解窓の最適な連続時間位置は不変であり、
図4のdで破線の窓の形によって描かれている。だが、利用可能なダウンスケーリングされたQMF分解は窓の中心のサンプル点を想定するので、離散的時間分解窓の可能な最良の位置は
図4のdの実線の窓形状によって描かれるようになる。これは、低いサンプリング・レートでのサンプルの四分の一の追加的遅延を導入する。一般的な場合には、本稿で時間的遅延と称される結果として生じるタイミング誤差は、もとのサンプリング・レートにおけるd
fract,2=(q
2−1)/2サンプルとなる。幸い、QMF窓の典型的な様相のため、誤差は、下記のツールのうちの一つまたは組み合わせによっておおむね補償されることができる。
【0083】
●QMF分解に続く周波数変動位相利得因子。たとえば、QMFサブバンド・サンプルに対して位相シフトがexp(−i*π/La*d
fract,2*(k+0.5))として適用されてもよい。ここで、Laは分解QMFバンクの現在のサイズであり、k=0……La−1である。この種の遅延補償は、QMF再構成における小さいが可聴でない位相誤差を導入する。
【0084】
●時間的遅延を考慮に入れるダウンサンプリングされたQMF分解窓。これは
図4のdの破線の窓を使うことに対応する。QMF窓をMDCT窓と同一の時間格子に整列させる素直な方法は、フィルタを非対称にするためのQMFプロトタイプ・フィルタの線形ダウンサンプリングである。これは
g(n)=(u−m)・f(m+1)+(1+m−u)・f(m)、 n=0,……,(N/q
2)−1
に従ってなされてもよい。ここで、Nはもとのプロトタイプ・フィルタfの長さであり、q
2はサブサンプリング因子であり、u=n・q
2+d
fract,2は有理数であり、m=└n・q
2+d
fract,2┘は整数である(└・┘は床演算子、すなわち下に丸められた最大の整数)。補間されたプロトタイプ・フィルタgは今や一般化されたフィルタ次数o
g=(o
f/q
2)+(1/q
2)−1をもつ。ここで、o
fはもとのフィルタfのフィルタ次数である。QMF分解/合成チェーンの再構成精度はこの演算によって維持される。ダウンサンプリングの結果は、プロトタイプ・フィルタ次数の(整数値o
fから有理数o
gへの)変化である。これは、変換コアにおいて反映されなければならないが、変換領域において周波数依存の利得1の位相因子を適用することによって補償されることもできる。
【0085】
低下したナイキスト周波数(あるいは等価だがサブサンプリング比)のフレームごとの適応は、前の諸フレームからの時間領域サンプルに頼る変換に困難を呈する。これは、それぞれ第一および第二の周波数領域における周波数領域表現として使用されうるMDCT変換およびQMFバンクについていえる。ナイキスト周波数の低減は、現在のフレームからデコードされる中間的時間領域サンプルの異なるサンプリング・レートを与える。これらは、システムにいまだ記憶されている、前の諸フレームからの中間的時間領域のサンプルのサンプリング・レートに一致しない。前の諸フレームからの中間的時間領域のサンプルは、さらなる合同処理のために、現在フレームの中間的時間領域のサンプルと組み合わされる必要がある。
【0086】
このような場合、変換コンポーネント120は、前のフレーム(単数または複数)からの時間領域サンプルを再サンプリングしてもよい。より詳細には、変換コンポーネント120は、各フレームにおいて使われるナイキスト周波数の、可能性としては低減されている値を追跡記録してもよい。具体的には、変換コンポーネント120は、現在フレームおよび前のフレームのナイキスト周波数の値(当該フレームにおいて低減が行なわれたかどうかに依存してナイキスト周波数の低下した値またはもとの値)が異なるかどうかを検査してもよい。このようにして、変換コンポーネント120は、現在フレームおよび直前のフレームが異なるサンプリング・レートをもつかどうかを識別しうる。変換が複数の前のフレームからの時間領域サンプルを要求する場合には、変換コンポーネント120は、同様に、現在フレームと該複数の前のフレームのいずれかとにおいて、ナイキスト周波数の値が異なるかどうかを検査してもよい。
【0087】
変換コンポーネント120が現在フレームと直前のフレーム(または複数の前のフレームのいずれか)とがナイキスト周波数の異なる値をもつことを見出す場合、直前のフレーム(または前のフレームのうちナイキスト周波数の異なる値をもつもの)の中間的時間領域のサンプルを再サンプリングすることに進んでもよい。この再サンプリングは、現在フレームおよび前のフレーム(単数または複数)の中間的時間領域のサインプルが同じサンプリング・レートをもつよう実行される。
【0088】
この再サンプリングは種々の仕方で達成されうる。たとえば、高品質の再サンプリングをもつために、補間およびそれに続く有限インパルス応答(FIR)フィルタによる低域通過フィルタリングならびにそれに続く間引きを使う伝統的な再サンプリングが使われてもよい。これは、再サンプリングが有理数の因子による再サンプリングに関わる限り(システムのサブサンプリング因子が上記で例示したような整数または有理数の限られた集合に制約される場合にはこれは通例成り立つ)、可能である。因子I/Jによるサブサンプリングが要求される場合、変換コンポーネント120はまず因子Jによって補間し、その後、FIRフィルタリングを行ない、次いで因子Iによって間引くことができる。
【0089】
代替として、その後のフィルタリングのない線形補間または三次スプライン補間が使われてもよい。これは、より低品質の結果を与えることがある(たとえばエイリアシングの問題があることがある)が、非常に低い計算量という利点をもつ。前のフレーム(単数または複数)の中間的時間領域のサンプルに対して現在フレームの中間的時間領域のサンプルの間に導入される相対的な時間的遅延があることがある。これは、第一のフィルタバンクの窓(すなわちフィルタ)と第二のフィルタバンクの窓(すなわちフィルタ)との間の整列不良のためでありうる。第一のフィルタバンクがMDCTフィルタバンクであり、第二のフィルタバンクが奇対称なプロトタイプ・フィルタを使うQMFバンクである場合、前のフレーム(単数または複数)の中間的時間領域のサンプルに対して現在フレームの中間的時間領域のサンプルの間の時間的遅延は、現在フレームと前のフレームとのサブサンプリング因子の間の比q
1に関係している。より詳細には、相対的な時間的遅延はd
fract,1=(q
1−1)/2によって与えられる。より一般には、これは、
図4のaおよびbに示されるように第一のフィルタバンクが半サンプル対称性をもち、第二のフィルタバンクが整数サンプル対称性をもつ場合に成り立つ。
【0090】
前のフレーム(単数または複数)を再サンプリングするときの相対的な時間的遅延を補償することが好ましい。これはたとえば、前のフレームの中間的時間領域サンプルを、時間的遅延に対応する量だけ時間的にシフトさせることによる。
【0091】
デジタル・オーディオ信号102を第一の周波数領域から第二の周波数領域に変換したら、変換コンポーネント120は段階S12において、当該フレームにおいてナイキスト周波数をその低下した値からもとの値に復元することに進む。これは、ナイキスト周波数の低下した値f
N,redより上の第二の周波数領域においてデジタル・オーディオ信号に(空の)スペクトル帯域を付加することによって達成されうる。これは
図3のdにさらに示されている。ここでは、第二の周波数領域においてデジタル・オーディオ信号102の周波数表現に空のスペクトル帯域が追加されており、表現される最高周波数は再びナイキスト周波数のもとの値f
Nによって与えられる。
【0092】
図2のフローチャートを参照して記述した方法はこのように、異なるフレームがナイキスト周波数の異なる低下した値をもつことを許容し、それによりナイキスト周波数を各フレームのスペクトル内容に適応させる。換言すれば、変換コンポーネント120は、前のフレームから現在フレームに移るときに低下したナイキスト周波数の値を切り換える決定をしてもよい。この決定は、現在フレームのスペクトル内容のみに基づいてなされてもよい。しかしながら、それはナイキスト周波数の低下した値のジャンプ挙動につながることがある。すなわち、値を非常に頻繁に変化させる傾向があることがある。ナイキスト周波数の低下した値における切り換えは、フィルタのダウンサンプリングおよび/または中間的時間領域サンプルの再サンプリングを必要とすることになるので、ナイキスト周波数の低下した値の遷移はもっと疎であることが望ましいことがありうる。
【0093】
この理由により、変換コンポーネント120は、段階S08において現在フレームのナイキスト周波数の低下した値を設定するとき、現在フレームの周波数範囲との関係で前のフレームのナイキスト周波数の低下した値をも考慮に入れてもよい。これは
図5および
図6においてさらに示されている。
【0094】
図5は、七つの連続するフレーム501a、501b、501c、501d、501e、501f、501gを示している。各フレーム501a〜gは周波数範囲502a〜gをもつ(周波数スケールの斜線パターンは0でないスペクトル帯域を示す)。フレーム501aはナイキスト周波数の低下した値503a(f
N,redとラベル付けされている)に関連付けられている。変換コンポーネント120が次のフレーム501bを受け取るとき、フレーム501bの周波数範囲502bは、前のフレーム501aのナイキスト周波数の低下した値f
N,redと比較される。この場合、周波数範囲502bは、閾値量T
1より大きく、前のフレーム501aのナイキスト周波数の低下した値503aを超えている。エイリアシング問題および打ち切られる帯域幅を避けるために、フレーム501bのナイキスト周波数の低下した値503bは、フレーム501aのナイキスト周波数の低下した値503aより大きいように設定される。具体的には、ナイキスト周波数の低下した値503bは、フレーム501bの周波数範囲502bより上の値に設定される。
【0095】
変換コンポーネント102は、その後のフレーム501cを受け取るとき、フレーム501cの周波数範囲502cを、フレーム501bのナイキスト周波数の低下した値503bと比較する。この例では、周波数範囲502cは、閾値量T
2より大きくナイキスト周波数の低下した値503bと異なりはしないことが見出される。したがって、フレーム501bのナイキスト周波数の低下した値503bをフレーム501cでも保持することを決定する。閾値量T
2は典型的には閾値量T
1より大きい。つまり、変換コンポーネント120は、ナイキスト周波数の低下した値を減少させる(これは計算量を削減するためには有益でありうる)よりも、ナイキスト周波数の低下した値を増加させやすい(エイリアシングおよび打ち切られた帯域幅を避けるため)。
【0096】
次のフレーム501dを受け取ると、変換コンポーネント102は、周波数範囲502dを、ナイキスト周波数の低下した値503bと比較する。すると、周波数範囲502dが、閾値量T
2より大きくナイキスト周波数の低下した値503bを下回ることが見出される。これは、ナイキスト周波数の、より低い低下した値に切り換えることが有益でありうることを意味する。
【0097】
いくつかの実施形態によれば、よって、変換コンポーネント120は、フレーム501dでは、ナイキスト周波数の、より低い低下した値に切り換える。しかしながら、図示した実施形態では、変換コンポーネント120は、フレーム501dにおけるナイキスト周波数の低下した値を設定するときに、いくつかの前のフレームの周波数範囲をも考慮に入れる。図示した例では、変換コンポーネント120は、ナイキスト周波数の低下した値を設定するときに、三つの前のフレームの周波数範囲を考慮に入れる。一般に、前のフレームの数は、事前に定義されていてもよく、あるいはシステムに入力されてもよいパラメータである。前のフレームの数は典型的には2〜6フレームの範囲内でありうる。換言すれば、変換コンポーネント120は、前のフレーム501c、501b、501aの周波数範囲502c、502b、502aのそれぞれが、閾値量T
2より大きくナイキスト周波数の低下した値503bを下回るかどうかを検査する。今の例ではこれは満たされないので、変換コンポーネント120は、フレーム501dにおいても、ナイキスト周波数の低下した値503bを保持することを決定する。
【0098】
次いで、変換コンポーネント120は、この手順をフレーム501eおよび501fについて繰り返し、フレーム501dについてと同じ結果になり、ナイキスト周波数の低下した値503bがフレーム501eおよび501fにおいても保持される。
【0099】
しかしながら、フレーム501gを処理するときは、変換コンポーネント102は異なる結論に至る。より詳細には、変換コンポーネント120は、フレーム501gの周波数範囲502gが閾値量T
2より大きくナイキスト周波数の低下した値503bを下回ること、さらに三つの前のフレーム501f、501e、501dの周波数範囲502f、502e、502dのそれぞれも閾値量T
2より大きくナイキスト周波数の低下した値503bを下回ることを見出す。結果として、変換コンポーネント120は、ナイキスト周波数の、新たな、より低い低下した値503cに切り換えることを決定する。このようにして、ナイキスト周波数の低下した値のあまりに頻繁な切り換えを回避しうる。たとえば、このやり方でなければナイキスト周波数の低下した値はまずフレーム501dにおいて減少させられ、次いで後続のフレーム501eにおいて再び増大させられていたであろう。
【0100】
図6は、
図5の実施形態への代替または追加として使用されうる変形を示している。
図6の実施形態は、ナイキスト周波数の、より低い低下した値に切り換えるときに変換コンポーネント120が別の判断基準を使うという点で
図5の実施形態と異なっている。よって、
図5および
図6の実施形態におけるフレーム501a、501b、501cの処理は同じである。しかしながら、フレーム501d、501e、501f、501gについてはそうではない。
【0101】
フレーム501dを受け取ると、変換コンポーネントは、周波数範囲502dが閾値量T
2より大きく前のフレームのナイキスト周波数の低下した値503bを下回ることが見出す。しかしながら、ナイキスト周波数の別の、より低い低下した値に切り換えることを決定する前に、変換コンポーネントはいくつかの前のフレーム(この場合は三つの前のフレーム)の周波数範囲を見る。具体的には、変換コンポーネント120は三つの前のフレームの周波数範囲502c、502b、502aのそれぞれが、閾値量T
3(これは典型的にはT
2より小さい)より大きく現在フレーム501dの周波数範囲502dと異なっていないかどうかを検査する。図示した例では、これは成り立っておらず、よって変換コンポーネント120は、前のフレーム501cのナイキスト周波数の低下した値503bを保持することを決定する。
【0102】
変換コンポーネント120はこれらの検査をその後のフレーム501e、501fについても繰り返して同じ結果になる。つまり、ナイキスト周波数の低下した値503bがフレーム501eおよび501fにおいても保持される。しかしながら、フレーム501gを処理するときは、変換コンポーネント102は別の結論に至る。第一に、周波数範囲502gが閾値量T
2より大きくナイキスト周波数の低下した値503bを下回ることを見出す。第二に、三つの前のフレーム501f、501e、501dの周波数範囲502f、502e、502dのそれぞれが閾値量T
3より大きく現在フレーム501gの周波数範囲502gと異なっていないことを見出す。結果として、変換コンポーネント120は、ナイキスト周波数の、新たな、より低い低下した値503cに切り換える決定をする。
【0103】
変換コンポーネント120がどのように動作するかの実際的な例をこれから
図7との関連で開示する。
図7は、サブサンプリング因子1(サブサンプリングなし)から因子4、次いで4/3によるサブサンプリングに切り換えるときのタイミングおよびバッファの図を示している。図の下部にあるバーの高さはサブサンプリングの量を、よってサブサンプリングされたシステムの帯域幅を示す。この例は、もとの帯域幅を復元するために現在のナイキスト周波数より上で追加の(空の)QMF帯域を付加する段階は含んでいないことを注意しておく。窓および時間領域(PCM)バッファのダウンサンプリングは、点線によって表わされる(より小さな「ドットピッチ」がより高い度合いのサブサンプリングを表わす)。これらはみな、同じ絶対的な継続時間を表わしており、サンプル・レート、よって帯域幅のみが異なっている。
【0104】
フレームn−1およびnにおいては、フルサイズの変換が使われる。IMDCTフレームnからの時間領域出力はPCMラインに供給され、PCMフレームが分解QMFバンク(実線で描かれている)に供給される。この配位では、四つのQMFブロックが処理される(四つの実線の窓h(n))。フル帯域幅QMF出力は図の下部に四つの実線のバーとして示されている。フレームn+1では、信号の帯域幅はずっと低く、よって1/4サイズの変換が、アーチファクトや打ち切られた帯域幅なしにMDCT係数を変換するために十分である。フレームnからの時間領域データをフレームn+1のサブサンプリングされたデータに適応させるために、フレームnの実線のバッファ・ブロックは再サンプリングされる必要がある。よって、QFMの履歴バッファqmfBuffer(N−L個のサンプル)およびIMDCT重複加算バッファmdctBufferが因子4によってダウンサンプリングされる。結果は、破線のブロックに格納され、フレームn+1においてIMDCT重複加算プロセスおよび分解QMF(M/4個のチャネル)によって使用される。再サンプリング後、変換は、該新たなサブサンプリングされたレートで実行されてもよいが、フレームn+4において帯域幅を増す必要が生じる。その時点で、フレームn+3からの時間領域バッファ(右側の破線ブロック)が因子3によりアップサンプリングされる。結果は点線のブロックに格納され、フレームn+4においてIMDCT重複加算プロセスおよび3/4サイズのフィルタバンクを使う分解QMFにおいて使用される。ここでもまた、結果として得られるQMFサンプルは、図の下部に点線のバーとして示されている。
【0105】
バッファ、すなわち分解QMFバンクの履歴バッファおよび逆MDCTの重複加算バッファの再サンプリングは、連続的なので一つの段階で行なわれることができる。高品質の再サンプリングは、補間およびFIRフィルタリングならびにそれに続く間引きに関わる伝統的な再サンプリングによってできる。代替は、線形補間または高次補間を使うことである。これは再サンプリングの品質は低くなるが、非常に低い計算量をもつ。例として、バッファは線形補間を使って再サンプリングされる。第一に、両バッファは
【数1】
として連結される。ここで、NはQMFプロトタイプ・フィルタの現在の長さであり、LはQMFチャネルの現在の数であり、frameLengthは現在のフレーム長(およびMDCTサイズ)である。連結されたバッファhはその後、
【数2】
として補間される。ここで、W=N−L+frameLengthであり、q
1は相対的なサブサンプリング因子であり、u=n・q
1+d
fract,1は有理数であり、m=└n・q
1+d
fract,1┘は整数である(└・┘は床演算子、すなわち下に丸められた最大の整数)。d
fract,1はd
fract,1=(q
1−1)/2によって与えられる遅延である。この文脈におけるq
1は、現在のサブサンプリング量に対するサブサンプリング因子、すなわち現在フレームと前のフレームのサブサンプリング因子の比を意味し、よって1より小さな値をもちうることを注意しておく。補間された値は次いで、
【数3】
としてそれぞれのバッファにフィードバックされる。
【0106】
〈等価物、拡張、代替その他〉
上記の記述を吟味したのちには本開示のさらなる実施形態が当業者には明白となるであろう。本記述および図面は実施形態および例を開示しているが、本開示はそうした特定の例に制約されるものではない。数多くの修正および変形が、付属の請求項によってのみ定義される本開示の範囲から外れることなく、なされることができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
【0107】
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する際に、当業者によって、開示される実施形態への変形が理解され、実施されることができる。請求項において、単語「有する/含む」は、他の要素やステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項において記載されているというだけの事実が、それらの施策の組み合わせが有利に使用できないことを示すものではない。
【0108】
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。一般に、本稿で言及される「コンポーネント」は回路として実装されてもよい。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、当業者には、通信媒体が典型的には、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことはよく知られている。
【0109】
本発明のさまざまな側面は、以下の箇条書き実施例(EEE: enumerated example embodiment)から理解されうる。
【0110】
〔EEE1〕
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行することを含む、
方法。
〔EEE2〕
現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、EEE1記載の方法。
〔EEE3〕
現在フレームの周波数範囲がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される、EEE2記載の方法。
〔EEE4〕
現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される、EEE2または3記載の方法。
〔EEE5〕
現在フレームの周波数範囲が、ある閾値量より大きく前のフレームのナイキスト周波数の低下した値を下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE2ないし4のうちいずれか一項記載の方法。
〔EEE6〕
現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲に依存して設定される、EEE2ないし5のうちいずれか一項記載の方法。
〔EEE7〕
さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE8〕
さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲が前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE9〕
第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを必要とし、
ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
EEE1ないし8のうちいずれか一項記載の方法。
〔EEE10〕
前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE9記載の方法。
〔EEE11〕
前記時間的遅延は、d
fract,1=(q
1−1)/2に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q
1に依存する値d
fract,1によって与えられる、EEE10記載の方法。
〔EEE12〕
前のフレームの中間的時間領域のサンプルが、線形補間または三次スプライン補間のような補間を使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE13〕
前のフレームの中間的時間領域のサンプルが、補間およびFIRフィルタリングおよびそれに続く間引きを使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE14〕
第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、
第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
EEE1ないし13のうちいずれか一項記載の方法。
〔EEE15〕
前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、EEE14記載の方法。
〔EEE16〕
前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、EEE14または15記載の方法。
〔EEE17〕
前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE15または16記載の方法。
〔EEE18〕
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号に位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、EEE14ないし16のうちいずれか一項記載の方法。
〔EEE19〕
前記時間的遅延は、d
fract,2=(q
2−1)/2に従って前記サブサンプリング因子に依存する値d
fract,2によって与えられ、q
2は前記サブサンプリング因子である、EEE17または18記載の方法。
〔EEE20〕
前記第一のバンクにおける合成フィルタおよび/または前記第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされる、EEE15ないし19のうちいずれか一項記載の方法。
〔EEE21〕
第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、EEE1ないし20のうちいずれか一項記載の方法。
〔EEE22〕
前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲はさらに該パラメータに基づいて同定される、EEE1ないし21のうちいずれか一項記載の方法。
〔EEE23〕
前記デジタル・オーディオ信号のナイキスト周波数を下げる段階はさらに:
ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、同定された周波数範囲より上である前記あらかじめ定義された集合内の最低の値として選択し、
ナイキスト周波数の選択された低下した値より上の前記デジタル・オーディオ信号のスペクトル帯域を除去することを含む、
EEE1ないし22のうちいずれか一項記載の方法。
〔EEE24〕
前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の周波数範囲を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、EEE1ないし23のうちいずれか一項記載の方法。
〔EEE25〕
処理機能をもつ装置によって実行されたときにEEE1ないし24のうちいずれか一項記載の方法を実行するためのコンピュータ・コード命令を記憶しているコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔EEE26〕
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダであって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行するよう構成されている、
オーディオ・デコーダ。