特許第6099602号(P6099602)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6099602
(24)【登録日】2017年3月3日
(45)【発行日】2017年3月22日
(54)【発明の名称】重複変換を使用した情報信号変換装置
(51)【国際特許分類】
   G10L 19/022 20130101AFI20170313BHJP
【FI】
   G10L19/022
【請求項の数】6
【全頁数】22
(21)【出願番号】特願2014-158475(P2014-158475)
(22)【出願日】2014年8月4日
(62)【分割の表示】特願2013-519117(P2013-519117)の分割
【原出願日】2012年2月14日
(65)【公開番号】特開2014-240973(P2014-240973A)
(43)【公開日】2014年12月25日
【審査請求日】2014年8月4日
(31)【優先権主張番号】61/442,632
(32)【優先日】2011年2月14日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】110001553
【氏名又は名称】アセンド特許業務法人
(74)【代理人】
【識別番号】110001449
【氏名又は名称】特許業務法人プロフィック特許事務所
(72)【発明者】
【氏名】シュネール、マルクス
(72)【発明者】
【氏名】ガイガー、ラルフ
(72)【発明者】
【氏名】ラヴェリ、エマニュエル
(72)【発明者】
【氏名】フォトポウロー、エレニ
【審査官】 冨澤 直樹
(56)【参考文献】
【文献】 特表2010−532883(JP,A)
【文献】 特表2010−538314(JP,A)
【文献】 特開2003−195881(JP,A)
【文献】 特開平08−181619(JP,A)
【文献】 国際公開第2006/137425(WO,A1)
【文献】 特開平10−105193(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成するよう構成された情報信号変換装置であり、
一連のサンプルという形態で情報信号を受け取る入力部(105)と、
情報信号の連続重複領域を取得するよう構成された取込み器(106)と、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うよう構成されたリサンプラー(107)と、
情報信号の連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部(108)と、
ウィンドウ処理された領域に対して個々に変換を行うよう構成された変換器(109)を含み、
取込み器(106)は、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行うよう構成されている。
【請求項2】
請求項1に記載の情報信号変換装置であり、取込み器(106)は、情報信号の連続重複領域が時間的に一定のオフセットを有するように、情報信号の連続重複領域の取り込みを行うよう構成されている。
【請求項3】
請求項またはに記載の情報信号変換装置であり、
一連のサンプルは、所定の瞬間(113)に第1のサンプリングレートから第2のサンプリングレートに変わる変動サンプリングレートを有し、
リサンプラー(107)は、連続重複領域の一定のサンプリングレートは第1のサンプリングレートから第2のサンプリングレートへ一度だけ変化するように、所定の瞬間に重複している連続重複領域(114b,c)に対してリサンプリングを行うよう構成されている。
【請求項4】
請求項に記載の情報信号変換装置であり、変換器は、ウィンドウ処理された各領域の変換形の変換長を、ウィンドウ処理されたそれぞれの領域のサンプル数に適合させるよう構成されている。
【請求項5】
エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成する方法であり、
一連のサンプルという形態で情報信号を受け取ることと、
情報信号の連続重複領域を取得することと、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うことと、
情報信号の連続重複領域に対してウィンドウ処理を行うことと、
ウィンドウ処理された領域に対して個々に変換を行うことを含み、
連続重複領域の取得では、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行う。
【請求項6】
コンピュータ上で起動された際、請求項に記載の方法をコンピュータに実行させるためのプログラムコードを有するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は重複変換を使用した情報信号変換装置に関し、詳しくは、例えばオーディオ圧縮技術で使用されるようなエイリアシング解消を必要とする情報信号の重複変換を使用した情報信号変換装置に関する。
【背景技術】
【0002】
ほとんどの圧縮技術は、特定の種類の情報信号や、最大許容遅延や可能な送信ビットレートというような圧縮データストリームの特定の条件に合うように設計されている。例えば高いビットレートでスピーチではなく音楽を符号化する場合には、オーディオ圧縮に関して、AACのような変換に基づくコーデックの方が、ACELPのような線形予測に基づく時間領域コーデックよりも優れた性能を示す傾向がある。例えばUSACは、様々なオーディオコーディング原理を一つのコーデックに統合することにより、非常に多様な応用場面に対応しようとするものである。しかし、その利点を利用して、例えばより高いコーディング効率を達成するためには、送信ビットレートの変更というような様々なコーディング条件への適応性をさらに上げることが好ましい。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】3GPP「オーディオコーデック処理機能、拡張適応マルチレート−広帯域(AMR−WB)コーデック、トランスコーディング機能」2009年、3GPP TS26.290
【非特許文献2】USACコーデック(音声合成コーデック)、ISO/IEC CD 23003−3、2010年9月24日
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、本発明の目標は、重複変換表記を実際の要求に適合させることが可能となるように、エイリアシング解消を必要とする重複変換による情報信号の表記を可能にする情報信号変換装置を提示することにより、このような概念を提供することであり、これにより、より高いコーディング効率を達成することができるであろう。
【課題を解決するための手段】
【0005】
この目標は独立請求項の内容によって達成される。
【0006】
本発明につながる主な思想は以下のようなものである。例えばレートと歪みの比の点で情報信号を効率的に符号化する際にプリステートを形成するために、情報信号の重複変換表記がしばしば使用される。このようなコーデックの例はAACやTCX等である。しかし重複変換表記はまた、変換と再変換を様々なスペクトル分解能で連結させることによりリサンプリングを実行するのに使用され得る。一般的に、情報信号の連続する時間領域のウィンドウバージョンの変換形の個々の再変換形の重複部分でエイリアシングが生じる重複変換表記は、重複変換表記をするために符号化されるべき変換係数レベルの個数が少なくなるという点で有利である。極端な状態では、重複変換は「じっくりとサンプリング」されている。つまり、情報信号の時間サンプルの個数に比較して、重複変換表記の係数の個数は増加しない。重複変換表記の一例は、MDCT(修正離散余弦変換)またはQMF(直交ミラーフィルター)フィルターバンクである。従って、情報信号を効率的に符号化する際に、このような重複変換表記をプリステートとして使用することが好ましい場合がしばしばある。しかし、情報信号が重複変換表記される際のサンプリングレートが、例えば可能な送信ビットレートまたは他の環境条件に適合するように時間変動可能であれば、これもまた好ましい。可能送信ビットレートが変動的であると仮定すると、例えば可能送信ビットレートが所定の閾値よりも下がった場合は常にサンプリングレートを下げることが好ましく、可能送信レートが再び上がった場合には、情報信号を重複変換表記するサンプリングレートが上昇可能であることが好ましい。悪いことに、重複変換表記の再変換の重複エイリアシング部分が、このようなサンプリングレート変更に対して障害を設けており、サンプリングレート変更の場合に重複変換表記を完全に遮断することによってのみ、この障害を打開することが可能であるように思われる。しかし、本発明の発明者たちは上述の問題に対する解決を実現し、これにより、エイリアシングと懸案のサンプリングレート変更を伴う重複変換表記の効率的な使用が可能となる。特に、補間によって、情報信号の先行領域及び/または後続領域が、これらの領域の境界でのサンプリングレート変更に従い、エイリアシング解消部分でリサンプリングされる。そして、結合装置は、エイリアシング解消部分でのリサンプリングにより得られるような先行領域の再変換と後続領域の再変換との境界で、エイリアシング解消を行うことができる。この方法により、サンプリングレート変更/推移時点での重複変換信号の中断を引き起こすことなく、サンプリングレート変更に対して効率的に対処することができる。重複変換を適切に生成するために、変換側での同様の方法も可能である。
【発明の効果】
【0007】
上述の考えを用いて、オーディオ圧縮技術のような情報信号圧縮技術を提供することが可能であり、これらの技術は、符号化の環境条件の広範囲にわたって、例えば可能転送帯域幅全体にわたって、サンプリングレート変更そのものによる不利益を全く被ることなく、与えられたサンプリングレートをこれらの条件に適合させることにより、高い符号化効率を得ることができるものである。
【0008】
本発明の利点は、従属請求項に記載の内容である。さらに、本発明の好ましい実施形態を、添付図面を参照し以下に説明する。
【図面の簡単な説明】
【0009】
図1A】本発明の実施形態が適用可能である情報信号エンコーダのブロック図を示す。
図1B】本発明の実施形態が適用可能である情報信号デコーダのブロック図を示す。
図2A図1Aのコアエンコーダの可能な内部構成のブロック図を示す。
図2B図1Bのコアデコーダの可能な内部構成のブロック図を示す。
図3A図1Aのリサンプラーの可能な実施例のブロック図を示す。
図3B図1Bのリサンプラーの可能な内部構成のブロック図を示す。
図4A】本発明の実施形態が適用された情報信号エンコーダのブロック図を示す。
図4B】本発明の実施形態が適用された情報信号デコーダのブロック図を示す。
図5】本発明の一実施形態に係る情報信号再構築装置のブロック図を示す。
図6】本発明の一実施形態に係る情報信号変換装置のブロック図を示す。
図7A図5の情報信号再構築装置が使用された別の実施形態に係る情報信号エンコーダのブロック図を示す。
図7B図5の情報信号再構築装置が使用された別の実施形態に係る情報信号デコーダのブロック図を示す。
図8】本発明の一実施形態に係る図6の情報信号エンコーダ及びデコーダで発生するサンプリングレート変更を示す概略図である。
【発明を実施するための形態】
【0010】
以下に説明する本発明の実施形態の動機付けために、前もって、本願の実施形態が使用でき、以下で述べるような本発明と本願の実施形態の利点を明らかにする実施形態について議論する。
【0011】
図1A,1Bは、例えば、以下に説明する実施形態を有利に使用し得る一対のエンコーダとデコーダを示している。図1Aはエンコーダを示し、図1Bはデコーダを示す。図1Aの情報信号エンコーダ10は、情報信号が入力される入力部12と、リサンプラー14と、コアエンコーダ16とを含み、リサンプラー14とコアエンコーダ16は、エンコーダ10の入力部12と出力部18との間で連続的に接続されている。出力部18で、エンコーダ10は入力部12の情報信号を表すデータストリームを出力する。同様に、参照符号20で示された図1Bのデコーダは、コアデコーダ22とリサンプラー24とを含み、コアデコーダ22とリサンプラー24は、図1Bに示されているように、デコーダ20の入力部26と出力部28との間で連続的に接続されている。
【0012】
出力部18で出力されたデータストリームをデコーダ20の入力部26に送る際に可能な転送ビットレートが高い場合には、データストリーム内で高サンプリングレートで情報信号12を表すことが符号化効率の点で好ましく、これにより、情報信号のスペクトルの広スペクトル帯域をカバーすることができる。つまり、レート/歪み比尺度のような符号化効率尺度によると、情報信号の低サンプリングレートでの圧縮と比較して、コアエンコーダ16がそれよりも高いサンプリングレートで入力信号12を圧縮する場合には、符号化効率が高くなることが示されている。一方、可能転送ビットレートのうちの低い方のビットレートでは、情報信号12を低サンプリングレートで符号化する際に符号化効率尺度はより高くなり得る。この点に関して、歪みは心理音響的に動機づけられた方法で、つまり、知覚的にあまり関係のない周波数領域(それに対する人間の耳の感度が低い周波数領域)内の歪みよりも、知覚的により関連のある周波数領域内の歪みを集中的に考慮して測定してもよいことに留意すべきである。一般的に、低周波領域は高周波領域よりも知覚的に関連深い傾向があり、従って、低サンプリングレート符号化では、入力部12での信号のナイキスト周波数よりも高い周波数成分は符号化の対象から除外される。しかし、その結果ビットレートの節約を得ることができるので、レート/歪み比の点で、この低サンプリングレート符号化は高サンプリングレート符号化よりも好ましいものとなり得る。低周波部分と高周波部分との間の歪みの重要性に関するこれに類似の矛盾は、測定信号などのような他の情報信号内にも存在する。
【0013】
従って、リサンプラー14は情報信号12をサンプリングする際のサンプリングレートを変更するためのものである。とりわけ出力部18と入力部26との間の可能転送ビットレートにより規定されるような外部転送条件に応じてサンプリングレートを適切に制御することにより、外部転送条件が時間と共に変化するにもかかわらず、エンコーダ10は符号化効率を向上させることができる。そして、デコーダ20はデータストリームを展開するコアデコーダ22を含み、また、リサンプラー24は、出力部28で出力される再構築情報信号が再び一定のサンプリングレートを有するように処理する。
【0014】
しかし、図1A,1Bのエンコーダ/デコーダ対で重複変換が使用される場合には必ず問題が発生する。再変換の重複領域でエイリアシングが発生する重複変換表記は、効率的な符号化ツールではあるが、時間的エイリアシング解消を必要とするので、サンプリングレート変更の際に問題が発生する。例えば図2A,2Bを参照して下さい。図2A,2Bは、変換符号化タイプのものであると仮定した場合のコアエンコーダ16とコアデコーダ22の可能な実施例を示す。従って、コアエンコーダ16は変換装置30を含み、この後に圧縮装置32が設けられている。図2Bのコアデコーダは展開装置34を含み、この後に今度は再変換装置36が設けられている。図2A,2Bに関して、コアエンコーダ16とコアデコーダ22内には、他に何のモジュールも存在し得ないというように理解すべきではない。例えば、変換装置30の前にフィルターがあってもよく、この場合、変換装置30はリサンプラー14によって与えられたリサンプル情報信号そのままではなく、事前にフィルタリングされた形のものを変換することになる。同様に、再変換装置36の後に、逆変換関数を有するフィルターがあってもよく、この場合、再変換信号は続いて逆フィルタリングされることになる。
【0015】
圧縮装置32は、変換装置30によって出力された重複変換表記を、ハフマン符号化または算術符号化のような例を含むエントロピーコーディングのようなロスレスコーディングを使用して圧縮し、展開装置34は、再変換装置36へ送られるべき重複変換表記を得るために、例えばハフマン復号または算術復号のようなエントロピーデコーディングにより、まさに逆の処理つまり展開を行う。
【0016】
図2A,2Bに示した変換符号化環境において、リサンプラー14がサンプリングレートを変更するたびに問題が発生する。この問題は、情報信号12が存在する符号化側においてはあまり深刻ではない。従って、変換装置30には、サンプリングレート変更の瞬間を跨いでも、それぞれの領域のウィンドウバージョンを使用したそれぞれの変換のために継続的にサンプリングされた領域が与えられる。変換装置30の可能な実施形態を、図6を参照して以下に説明する。一般的に、変換装置30には情報信号の先行領域のウィンドウバージョンが現在のサンプリングレートで与えられ、その後、リサンプラー14によって、情報信号の次の部分的重複領域が変換装置30に与えられ、そして、情報信号のウィンドウバージョンの変換形が変換装置30によって生成される。必要な時間的エイリアシング解消処理は変換装置30よりもむしろ再変換装置36において行われなければならないので、さらに追加の問題は起こらない。しかし再変換装置36においては、前述のすぐ後に続く領域の再変換形は様々な異なるサンプリングレートに関連するので、再変換装置36は時間的エイリアシング解消を実行することができないという点で、サンプリングレートの変更が問題を発生させる。以下に説明する実施形態はこれらの問題を解決するものである。これらの実施形態によると、再変換装置36は、以下に記載のような情報信号再構築装置に置き代えられてもよい。
【0017】
しかし図1A,1Bに関して説明した環境においては、コアエンコーダ16とコアデコーダ22が変換符号化タイプのものである場合にのみ、問題が発生する。より正確には、リサンプラー14と24をそれぞれ形成する重複変換に基づくフィルターバンクを使用した場合にも問題は発生する。例えば図3A,3Bを参照して下さい。図3A,3Bは、リサンプラー14,24を実現するための具体的な一実施形態を示している。図3A,3Bの実施形態によると、どちらのリサンプラーも、解析フィルターバンク38,40とその後に配置された合成フィルターバンク42,44とをそれぞれ連結することにより形成されている。図3A,3Bに示されているように、解析及び合成フィルターバンク38〜44は、QMFフィルターバンク、つまり情報信号を事前に分解し、そして再び信号を結合するためのQMFを使用したMDCTに基づくフィルターバンクとして実施してもよい。このQMFは、10個のブロック重複している(10個は単に一例である)マルチチャンネル変調フィルターバンクを意味するMPEG HE−AACまたはAAC−ELDのSBR部分で使用されているQMFと同様に実施されてもよい。このように、重複変換表記は解析フィルターバンク38,40によって生成され、合成フィルターバンク42,44で、リサンプリングされた信号がこの重複変換表記から再構築される。サンプリングレート変更を可能にするために、合成フィルターバンク42と解析フィルターバンク40は様々な変換長で動作するよう構成されていてもよい。しかし、フィルターバンクまたはQMFのレート、つまり、一方では解析フィルターバンク38,40それぞれによって連続的な変換形が生成され、他方では合成フィルターバンク42,44それぞれによって再変換が行われるレートは一定であり、全ての素子38〜40に関して同じである。変換長の変更は、しかし、サンプリングレートの変更をもたらす。例えば、解析フィルターバンク38と合成フィルターバンク42の対を考えてみる。解析フィルターバンク38は、一定の変換長と一定のフィルターバンクまたは変換レートを使用して動作するものと仮定する。この場合、解析フィルターバンク38によって出力される入力信号の重複変換表記は、入力信号の、連続重複し、一定のサンプル長さを有する領域のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含み、これらの変換形も一定長さを有する。換言すれば、解析フィルターバンク38は一定の時間/周波数分解能のスペクトログラムを合成フィルターバンク42へ送る。しかし、合成フィルターバンクの変換長は変動する。例えば、解析フィルターバンク38の入力部での入力サンプリングレートと合成フィルターバンク42の出力部での信号出力サンプリングレートとの間で、第1のダウンサンプリングレートから第2のダウンサンプリングレートに下げる場合を考える。第1のダウンサンプリングレートが有効である限り、解析フィルターバンク38によって出力された重複変換表記またはスペクトログラムは単に部分的に使用され、合成フィルターバンク42内で再変換をもたらす。合成フィルターバンク42の再変換は、解析フィルターバンク38のスペクトログラム内で連続する変換形の低周波部分に単純に適用される。合成フィルターバンク42の再変換に使用される変換長が短いために、合成フィルターバンク42の再変換形内のサンプル数もまた、それまでフィルターバンク38での変換の対象となっていた重複時間部分でのサンプル数よりも少なく、これにより、解析フィルターバンク38の入力部に入力された情報信号のオリジナルのサンプリングレートに比べて低いサンプリングレートとなる。ダウンサンプリングレートが一定に保たれる限り、合成フィルターバンク42が、連続する再変換形の間の重複部分と、フィルターバンク42の出力部での出力信号の連続重複領域とで、時間的エイリアシング解消を実行することに何の問題もないままなので、何も問題は起こらないだろう。
【0018】
ダウンサンプリングレートが第1のダウンサンプリングレートからそれよりも高い第2のダウンサンプリングレートに変更される場合には、常に問題が発生する。この場合、合成フィルターバンク42内の再変換で使用される変換長はさらに縮小され、それにより、このサンプリングレート変更時点よりも後のそれぞれの領域に関しては、さらに低いサンプリングレートとなる。このサンプリングレート変更時点の直前の領域に関する再変換と、このサンプリングレート変更時点の直後にリサンプリングされた領域に関する再変換との間での時間的エイリアシング解消が妨げられるので、ここでも、合成フィルターバンク42にとって問題が発生する。従って、変換長可変の解析フィルターバンク40が変換長一定の合成フィルターバンク44の前に備えられている場合には、デコーディングの側でこのような問題は起こらないという考えは、あまり助けにはならない。ここで、合成フィルターバンク44は、様々な異なる周波数分解能ではない一定のQMF/変換レートのスペクトログラムに、つまり、解析フィルターバンク40から合成フィルターバンク44へ異なるまたは時間変動の変換長ではなく、一定のレートで送られた連続する変換形に適合し、全体変換長の高周波部分を0にして、合成フィルターバンク44の全体変換長の低周波部分を保つ。合成フィルターバンク44の出力部で出力される再構築信号のサンプリングレートは一定のサンプリングレートであるので、合成フィルターバンク44によって出力された連続する再変換形の間の時間的エイリアシング解消は問題ではない。
【0019】
このように、ここでも、図1A,1Bに関して上述したようなサンプリングレートの変更/適合を実行しようとする際に問題があるが、これらの問題は、情報信号の再構築装置のための以下に説明する実施形態に従い図3Aの逆フィルターバンクまたは合成フィルターバンク42を実施することにより、克服できる。
【0020】
サンプリングレートの適合/変更に関する上記の考えは、符号化されるべき情報信号の高周波部分がそれに従うパラメトリック手法で(例えば、その信号の低周波部分が変換符号化及び/または予測符号化などを使用して符号化されるスペクトル帯域複製(SBR)を使用して)符号化されるコーディング概念を考慮すると、より興味深くなる。例えば情報信号エンコーダと情報信号デコーダの対を示す図4A,4Bを参照して下さい。エンコーディング側では、コアエンコーダ16が、図3Aに示すように実施されるリサンプラー、つまり解析フィルターバンク38と変換長可変の合成フィルターバンク42の連結によって実施されるリサンプラーの後に続く。上述のように、解析フィルターバンク38の入力と合成フィルターバンク42の出力との間の時間変動ダウンサンプリングレートを達成するために、合成フィルターバンク42は一定領域のスペクトルの一部(合成フィルターバンク42の変換長の時間変動長を有する部分)に対して再変換、つまり、解析フィルターバンク38によって出力された一定長と一定変換レート46の変換を行う。時間変動は両矢印によって示されている。解析フィルターバンク38と合成フィルターバンク42の連結によってリサンプリングされた低周波部分50はコアエンコーダ16によって符号化されるが、残りの部分、つまりスペクトル46の残りの周波数部分である高周波部分52は、パラメトリックエンベロープコーダー54でのエンベロープのパラメトリック符号化の対象とされてもよい。このように、コアデータストリーム56は、パラメトリックエンベロープコーダー54によって出力されたパラメトリック符号化データストリーム58を伴う。
【0021】
デコーディング側では、デコーダも同様にコアデコーダ22を含み、この後に、図3Bに示されているようなリサンプラー、つまり、解析フィルターバンク40とそれに続く合成フィルターバンク44から成り、解析フィルターバンク40は、エンコーディング側での合成フィルターバンク42の変換長の時間変動に同期した時間変動変換長を有するリサンプラーが続く。コアデコーダ22はコアデータストリーム56を受信しそれを復号するが、パラメトリックデータストリーム58を受信し、そこから高周波部分52’を導き出し、可変変換長の低周波部分50、つまりエンコーディング側で合成フィルターバンク42によって使用された変換長の時間変動に同期し、コアデコーダ22によって出力されたサンプリングレートの変動に同期した変換長の低周波部分50を完全なものとするために、パラメトリックエンベロープデコーダ60が設置されている。
【0022】
図4Aのエンコーダの場合、解析フィルターバンク38が存在していることが利点であり、これにより、リサンプラーの形成のためには単に合成フィルターバンク42を追加するだけでよい。サンプリングレートの切り換えにより、スペクトル46の低周波部分(低周波部分は、単にパラメトリックエンベロープコーディングの対象となる高周波部分と比較して、より正確なコアエンコーディングの対象となる)の割合を適合させることが可能である。特に、この割合は、データストリーム全体を送信するための可能送信帯域幅などのような外部条件に応じて、効率的に制御してもよい。エンコーディング側で制御される時間変動は、例えばそれぞれのサイド情報データによって、デコーディング側に簡単に信号伝達できる。
【0023】
このように、図1A〜4Bは、時間的エイリアシング解消が必要となる重複変換表記を使用しているにもかかわらず、サンプリングレートの変更を事実上可能にする概念を持っていることが好ましいということを示している。図5は、合成フィルターバンク42または図2Bの再変換装置36を実施するために使用される場合には、上述のような問題を克服し、既に述べたようにサンプリングレート変更などの利点を活用することができる情報信号再構築装置の一実施形態を示す。
【0024】
図5に示された情報信号再構築装置は再変換装置70とリサンプラー72と結合装置74を含み、これらは、この順番に、情報信号再変換装置80の入力部76と出力部78との間に連続的に接続されている。
【0025】
図5に示された情報信号再構築装置は、エイリアシング解消を使用して、入力部76で入力された情報信号の重複変換表記から情報信号を再構築するためのものである。つまり、情報信号再構築装置は、入力部76で入力された情報信号の重複変換表記を使用して、出力部78で、時間変動サンプリングレートで情報信号を出力するためのものである。情報信号の重複変換表記は、情報信号のうちの連続する重複時間領域(または時間間隔)のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含む。以下により詳細に説明するように、情報信号再構築装置80は、情報信号90の先行領域84と後続領域86の境界部82で変化するサンプリングレートで情報信号を再構築するよう構成されている。
【0026】
情報信号再構築装置80の個々のモジュール70〜74の機能性を説明するために、入力部76で入力された情報信号の重複変換表記は一定の時間/周波数分解能を有する、つまり時間と周波数に関して分解能は一定であると予め仮定する。以降、別の状況について説明する。
【0027】
この仮定によると、重複変換表記は図5の92であると考えられる。そこに示されているように、重複変換表記は、ある変換レートΔtで時間的に連続する一連の変換形を含む。各変換形94は、情報信号のそれぞれの時間領域iのウィンドウバージョンの変換形を表す。特に、表記92のための周波数分解能は時間に関して一定であるので、各変換形94は一定個数の変換係数Nkを含む。これは、表記92は、図5に示されているようにス
ペクトル軸kに沿って厳密に並べられていてもよいNk個のスペクトル成分またはサブバ
ンドを含む情報信号のスペクトログラムであることを、事実上示している。それぞれのスペクトル成分またはサブバンドにおいて、スペクトログラム内の変換係数は変換レートΔtで発生する。
【0028】
このような一定の時間/周波数分解能を有する重複変換表記92は、例えば、図3Aに示されているようなQMF解析フィルターバンクによって出力される。この場合、各変換係数は複素数値となる。つまり、各変換係数は例えば実部と虚部を有することになる。しかし、重複変換表記92の変換係数は、必ずしも複素数値である必要はなく、純粋なMDCTの場合のように、もっぱら実数値であってもよい。これ以外にも、図5の実施形態はまた、時間領域の重複部分でエイリアシングが発生する他の重複変換表記(その変換形94が重複変換表記92内に連続的に配列されるもの)にも適用可能であることに留意すべきである。
【0029】
再変換装置70は、各変換形94に関して、連続時間領域84,86に対して各時間エンベロープ96によって示される再変換形を得るために、変換形94に対して再変換を行うよう構成されている。時間エンベロープは、一連の変換形94を生成するために情報信号の前述のような時間領域に適用されるウィンドウに大体相当するものである。先行する時間領域84に関して、図5では、再変換装置70は、重複変換表記92内の領域84に関連する変換形94全体に対して再変換を行ったと仮定している。領域84の再変換形96は、時間領域84全体の時間的長さΔt・a(aは連続する時間領域間の重複部を決定する係数)をサンプリングした例えばNk個のサンプルまたはNkの二倍の個数のサンプルを含む(表記92の変換形94はΔt・aを単位として生成された)。つまり、いずれの場合も、各変換形94を得る元となったウィンドウバージョンを作り上げたのと同じ個数のサンプルを含む。ここで、時間領域84内の時間サンプルの個数と同一の個数(または二倍の個数)と、その時間領域84に属する変換形94内の変換係数の個数は、単に説明のために選択されたものであり、別の実施形態においては、同一(または二倍)は、使用される重複変換の詳細に応じて、両方の数値間の別の一定比に置き代えられてもよい。
【0030】
ここで、情報信号再構築装置は時間領域84と時間領域86の間で情報信号のサンプリングレートを変更しようとしていることを前提としている。そうすることの動機は外部信号98から生じる。例えば、情報信号再構築装置80が図3A図4Aの合成フィルターバンク42を実施するために使用される場合、データストリームの転送条件の変更の場合のように、サンプリングレートの変更がより効率的なコーディングを約束する場合には必ず信号98が与えられ得る。
【0031】
本件の場合、情報信号再構築装置80が時間領域84と86の間でサンプリングレートを下げようとしている前提は、説明のためである。従って、再変換装置70はまた、後続領域86の再変換形100を得るために、この後続領域86のウィンドウバージョンの変換形に対して再変換を行うが、この時、再変換装置70はこの再変換を行うのに短い方の変換長を使用する。より正確には、再変換装置70は、後続領域86の変換に関してだけ、変換係数1…Nk’のうちの最も低い値Nk’への再変換を実行し、これにより得られた再変換形100はより低いサンプリングレートを有することになる。つまり、再変換形100は、Nk(またはNkに相当する割合)の代わりに単にNk’でサンプリングされるこ
とになる。
【0032】
図5に示されているように、再変換形96と100の間に以下のような問題が起こる。先行領域84の再変換形96と後続領域86の再変換形100は、これらの先行領域84と後続領域86との間の境界部82でのエイリアシング解消部分102で重なる。エイリアシング解消部分の時間的な長さは例えば(a−1)・Δtであるが、このエイリアシング解消部分102内の再変換形96のサンプルの個数は、同じエイリアシング解消部分102内の再変換形100のサンプルの個数とは異なる(この例では、再変換形100のサンプルの個数よりも高くなる)。従って、この時間間隔102で両方の再変換形96と100を重複加算することによる時間的エイリアシング解消は、単純なことではない。
【0033】
従って、リサンプラー72は再構築装置70と結合装置74の間に接続され、結合装置74は時間的エイリアシング解消を実行する。特に、リサンプラー72は、エイリアシング解消部分102における先行領域84の再変換形96及び/または後続領域86の再変換形100を、境界部82でのサンプリングレート変更に従い、補間により、リサンプリングするよう構成されている。再変換形96が再変換形100よりも早くリサンプラー72の入力部に到達するので、リサンプラー72は先行領域84の再変換形96に対するリサンプリングを行うことが好ましい。つまり、補間104により、エイリアシング解消部分102に含まれている再変換形96の部分が、同じエイリアシング解消部分102内の再変換形100のサンプリング条件またはサンプル位置に相当するように、リサンプリングされる。そして、その時間間隔102内で新しいサンプリングレートでの再構築信号90を得るために、結合装置74は、再変換形96のリサンプルバージョンと再変換形100の同一場所のサンプルを単純に加算するだけでもよい。この場合、出力再構築信号は、時間領域86の最初の部分で前のサンプリングレートから新しいサンプリングレートに変換されたものとなる。しかし、再構築信号90におけるサンプリングレート変更に間に合う別のポイント82を得るために、補間はまた、時間間隔102の前半と後半とで違う方法で行われてもよい。このように、瞬間82は図5では領域84と86の重複部分の中間に示されているが、それは単に説明のためであり、他の実施形態においては、この同じ時間的ポイントは、領域86の最初の部分と領域84の最後の部分との間のどちらも含む部分のどこかにあればよい。
【0034】
従って、結合装置74は、エイリアシング解消部分102でのリサンプリングによって得られた先行領域84と後続領域86それぞれの再変換形96と100の間でのエイリアシング解消を実行することができる。より正確には、エイリアシング解消部分102でエイリアシングを解消するために、結合装置74は、リサンプラー72によって得られたリサンプルバージョンを使用して、部分102内の再変換形96と100の重複加算処理を行う。情報信号90のサンプリングレートが時間ポイント82で高いサンプリングレートから低いサンプリングレートに変化しても、この重複加算処理により、変換形94を生成するためのウィンドウ処理に沿って、境界部82を渡っても、エイリアシングフリーで連続的に再構築された情報信号90を出力部78で出力することができる。
【0035】
このように、図5に関する上述の説明から分かるように、先行時間領域84のウィンドウバージョンの変換形94に対して行われた再変換の変換長の、その先行領域84の時間的長さに対する比は、後続時間領域86のウィンドウバージョンに対して行われた再変換の変換長の、その後続領域86の時間的長さに対する比とは、これらの領域84と86との間の境界部82でのサンプリングレート変更に相当する係数分だけ異なっている。上述した例では、この比の変化は外部信号98によって引き起こされたものである。先行領域84と後続領域86の時間的長さは互いに同じであり、再変換装置70は、後続領域86のウィンドウバージョンの変換形94に対する再変換の適用を、例えばNk’番目の変換
係数までの低周波部分に制限するよう構成されたものであるという前提で、説明してきた。もちろん、このような処理は、先行領域84のウィンドウバージョンの変更結果94に対しても可能である。さらに、上述の説明とは対照的に、境界部82でのサンプリングレート変更は逆方向でも可能であり、従って、後続領域86に関しては何の取得も行われず、先行領域84のウィンドウバージョンの変換形94に関してだけ処理が行われてもよい。
【0036】
より正確には、ここまで、情報信号の領域のウィンドウバージョンの変換形94の変換長と情報信号の領域の時間的長さが一定である場合、つまり、重複変換表記92は一定の時間/周波数分解能を有するスペクトログラムである場合に対する図5の情報信号再構築装置の動作モードを説明してきた。境界部82の位置設定の際に、情報信号再構築装置80は、一例として制御信号98に反応するものとして説明した。
【0037】
従って、この構成において、図5の情報信号再構築装置80は図3Aのリサンプラー14の一部となり得る。換言すれば、図3Aのリサンプラー14は、情報信号の重複変換表記を出力するフィルターバンク38と、今まで説明してきたような情報信号の重複変換表記からエイリアシング解消を使用して情報信号を再構築するよう構成された情報信号再構築装置80を含む逆フィルターバンクとの連結から成る。従って、例えば、図5の再変換装置70はQMF合成フィルターバンクとして構成することができ、フィルターバンク38はQMF解析フィルターバンクとして実施することができる。
【0038】
図1A〜4Aの説明から明らかなように、情報信号エンコーダは、コアエンコーダ16または集隗コアエンコーダ16のような圧縮ステージとパラメトリックエンベロープコーダー54に加えて、このようなリサンプラーを含み得る。圧縮ステージは再構築情報信号を圧縮するよう構成されている。図1A〜4Aに示されているように、このような情報信号エンコーダは、例えば可能転送ビットレートに関する外部情報に応じて制御信号98を制御するよう構成されたサンプリングレートコントローラをさらに含み得る。
【0039】
しかし別の例では、図5の情報信号再構築装置は、重複変換表記内で情報信号の領域のウィンドウバージョンの変換長の変化を検出することにより、領域82の位置を特定するよう構成可能である。この可能な実施例をより明確にするために、入力された重複変換表記の一例が示されている図5の92’を参照して下さい。それによると、表記92’内の連続する変換形94は一定の変換レートΔtで再変換装置70に到着するが、それぞれの変換形の変換長は変化している。図5において、例えば、先行時間領域84のウィンドウバージョンの変換形の変換長(Nk)は、後続領域86のウィンドウバージョンの変換形
の変換長(Nk’)よりも大きいと仮定する。ともかく、再変換装置70は入力データストリームから重複変換表記92’に関する情報をパースし、それに従い、再変換装置70は、情報信号の連続領域のウィンドウバージョンの変換形に対して行われる再変換の変換長を、重複変換表記92’の連続する変換形の変換長に適合させてもよい。従って、再変換装置70は先行時間領域84のウィンドウバージョンの変換形94の再変換のために変換長Nkを使用し、後続時間領域86のウィンドウバージョンの変換形の再変換のために
変換長Nk’を使用してもよい。これにより、前述し、図5の上部中央に示されているよ
うな再変換形の間のサンプリングレートの違いが生じる。従って、図5の情報信号再構築装置80の動作モードに関して、この動作モードは、再変換の変換長を重複変換表記92’内の変換形の変換長に適合させる際の今述べたような違いに加えて、上記説明と一致する。
【0040】
このように、後者の機能性に従えば、情報信号再構築装置は外部制御信号98に反応する必要はない。むしろ、サンプリングレート変更時点に関する情報を情報信号再構築装置に通知するには、入力されてくる重複変換表記92’で十分である。
【0041】
今説明したように動作する情報信号再構築装置80は、図2Bの再変換装置36を形成するために使用できる。つまり、情報信号デコーダは、データストリームから情報信号の重複変換表記92’を再構築するよう構成された展開装置34を含んでいてもよい。前述したように、この再構築はエントロピーデコーディングを伴う。変換形94の時間変動変換長は、展開装置34に入力されるデータストリーム内で適切な方法で信号伝達できる。図5に示されているような情報信号再構築装置は再構築装置36として使用できる。図5の情報信号再構築装置は、展開装置によって与えられたような重複変換表記から、エイリアシング解消を使用して情報信号を再構築するよう構成できる。後者の場合、再変換装置70は、再変換を実行するために、例えばIMDCTを使用することもでき、変換形94は複素数値係数よりもむしろ実数値係数によって表される。
【0042】
このように、上記の実施形態によると多くの利点が達成できる。例えば毎秒8kbから毎秒128kbに渡るような広い範囲の様々なビットレートで動作するオーディオコーデックに関して、最適なサンプリングレートは、図4A,4Bに関して上述したように、ビットレートに依存する場合もある。低いビットレートでは、低周波だけが、例えばACELPや変換コーディングのような、より正確なコーディング方法で符号化されるべきであり、高周波はパラメトリック方法で符号化されるべきである。高いビットレートでは、スペクトル域全体が例えば正確な方法で符号化される。これは、例えば、これらの正確な方法は常に最適な表記で信号を符号化すべきであることを意味している。これらの信号のサンプリングレートは、ナイキスト原理に準じた最も関連性のある信号周波数成分の変換が可能となるよう、最適化されるべきである。ここで示されているサンプリングレートコントローラ120は、情報信号がコアエンコーダ16に送られる際のサンプリングビットレートを、可能転送ビットレートに応じて制御するよう構成され得る。これは、解析フィルターバンクのスペクトルの低周波部分だけをコアエンコーダ16に送ることを意味している。残りの高周波部分はパラメトリックエンベロープコーダー54に送られる。上述したように、サンプリングレートの時間変動と転送ビットレートは問題ではない。
【0043】
図5の説明は、サンプリングレート変更時に時間的エイリアシング解消の問題に対処するために使用できる情報信号再構築装置に関するものである。また、図1A図4Bに関して前述したように、変換器が重複変換表記を生成し、そして図5の情報信号再構築装置にそれを送る図1A〜4Bの装置内で、連続するモジュール間のインターフェースで何らかの対策が行われなければならない。
【0044】
図6は情報信号変換装置のこのような一実施形態を示す。図6の情報信号変換装置は、一連のサンプルという形態で情報信号を受け取る入力部105と、情報信号の連続重複領域を取得するよう構成された取込み器106と、各連続重複領域が一定のサンプリングレートを有するように(しかし連続重複領域の間ではサンプリングレートは異なっている)、連続重複領域の少なくとも一部に対してリサンプリングを行うよう構成されたリサンプラー107と、連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部108と、図6の情報信号変換器の出力部110で出力される重複変換表記92’を構成する一連の変換形94を得るために、ウィンドウ処理された部分に対して個々に変換を行うよう構成された変換器を含む。ウィンドウ処理部108はハフマンウィンドウ等を使用してもよい。
【0045】
取込み器106は、情報信号の連続重複領域が同じ時間的長さを有するように、例えばそれぞれ20msとなるように、取込みを行う。
【0046】
取込み器106は一連の情報信号部分をリサンプラー107に送る。入力情報信号が所定の瞬間に第1のサンプリングレートから第2のサンプリングレートに変わる時間変動サンプリングレートであると仮定すると、例えば、リサンプラー107は、図6の111で示されているように、サンプリングレートが第1のサンプリングレートから第2のサンプリングレートに一度変化するように時間的に所定の時点を含む入力されてくる情報信号部分を補間によってリサンプルするよう構成されていてもよい。これをより明確にするために、図6は、サンプリングレートが瞬間113で変わる一連のサンプル112を説明的に示しており、一例として、一定の時間的長さを有する領域114a〜114dが一定の領域オフセット115Δtで取り込まれる。この領域オフセット115Δtは、一定の領域時間的長さと共に、連続領域114a〜114dの間の所定の重複部分を例えば連続する二つの領域ごとに50%の重複となるように規定する。しかし、これは単に一例にすぎない。この瞬間113より前の第1のサンプリングレートはδt1で示され、この瞬間11
3より後のサンプリングレートはδt2で示されている。111で示されているように、リサンプラー107は、例えば、領域114bを一定のサンプリングレートδt1を有するようリサンプリングするが、時間的後続領域114cに対しては、一定のサンプリングレートδt2を有するようにリサンプリングするよう構成されていてもよい。原則的に、リサンプラー107が、時間的に瞬間113を含むそれぞれの領域114b,114cの一部分を補間によってリサンプリングすれば十分であり、それがまだ目標サンプリングレートでなくても構わない。例えば領域114bの場合、リサンプラー107が、領域114bの時間的に瞬間113より後の部分をリサンプリングし、114cの場合には、瞬間113より前の部分だけをリサンプリングすれば十分である。その場合、取り込まれた領域114a〜114dは一定の時間的長さであるので、リサンプリングされた各領域は、それぞれの一定サンプリングレートδt1,δt2に対応した個数の時間サンプルN1,N2を有する。ウィンドウ処理部108は、そのウィンドウまたはウィンドウ長さを各入力部でのこのサンプルの個数に適合させてもよい。同じことが変換器109にも当てはまり、変換器109もその変換長または変換を同じように適合させてもよい。つまり、図6の111で示されている例では、出力部110での重複変換表記は一連の変換形から成り、変換形の長さはそれぞれ異なり、連続領域のサンプルの個数に対して一次従属的に、つまりそれぞれの領域に対して行ったリサンプリングの際のサンプリングレートに対して一次従属的に増加減少する。
【0047】
リサンプラー107は、それぞれの連続領域114a〜114d内のリサンプリングされるべきサンプル個数が最小となるように、これらの連続領域114a〜114dの間のサンプリングレート変更を記録するよう構成されていてもよい。あるいは、リサンプラー107はこれとは異なるように構成されていてもよい。例えば、リサンプラー107はダウンサンプリングよりもアップサンプリングを選択するまたはその逆であるように構成されていてもよく、つまり、瞬間113と重なる全ての領域が第1のサンプリングレートδt1または第2のサンプリングレートδt2でリサンプリングされるように、リサンプリングを実行するよう構成されていてもよい。
【0048】
図6の情報信号変換装置は、例えば図2Aの変換装置30を実施するのに使用してもよい。その場合、例えば変換器109はMDCTを実行するよう構成されていてもよい。
【0049】
これに関して、変換器109によって行われる変換の変換長は、リサンプリングされたサンプルの個数で測定した領域114cのサイズよりも大きくてもよいことに留意すべきである。その場合、ウィンドウ処理部108から出力されたウィンドウ領域を超える変換長の部分は、変換器109による変換を行う前に0にセットされてもよい。
【0050】
図5の補間104と図6のリサンプラー107内での補間を実現するための可能な実施例を詳細に説明する前に、図1A,1Bのエンコーダとデコーダの可能な実施形態を示す図7A,7Bを参照して下さい。特に、リサンプラー14,24は図3A,3Bに示されているように実施されているが、コアエンコーダ16とコアデコーダ22は、それぞれ、MDCTに基づく変換コーディングとACELPコーディングのようなCELPコーディングとの間で切り換え可能なコーデックとして実施されている。MDCTに基づくコーディング/デコーディングブランチ122,124は、それぞれ、例えばTCXエンコーダとTCXデコーダであってもよい。あるいは、AACコーダー/デコーダ対が使用されてもよい。CELPコーディングのために、ACELPエンコーダ126がコアエンコーダ16の他方のコーディングブランチとなり、ACELPデコーダ128がコアデコーダ22の他方のデコーディングブランチとなっていてもよい。これら両方のコーディングブランチ間での切り換えは、これらのコーディングモジュールの詳細についてその標準テキストに記載しているUSAC[2]またはAMR−WB+[1]の場合のように、フレーム毎に行われ得る。
【0051】
図7A,7Bのエンコーダとデコーダをさらに詳しい具体例として考え、コーディングブランチ122,126への入力とデコーディングブランチ124,128による再構築のために内部サンプリングレートの切り換えを可能にするスキームを、以下に詳細に説明する。特に、入力部12での入力信号の入力は、例えば32kHzという一定のサンプリングレートであってもよい。この信号は、上述のような方法でQMF解析/合成フィルターバンク対38,42を使用して、すなわち、帯域数に関して1.25または2.5というような適切な解析及び合成比でリサンプリングされてもよく、これは、例えば25.6kHzまたは12.8kHzの専用サンプリングレートを有するコアデコーダ16に入力してくる内部時間信号となる。そして、ダウンサンプリングされた信号は、コーディングブランチのうちのコーディングモードに応じたものを使用して符号化される。コーディングブランチ122では、MDCT表記及び標準的な変換コーディングスキームを使用して符号化され、または、コーディングブランチ126ではACELPを使用して時間領域で符号化される。コアエンコーダ16のコーディングブランチ126,122によってこのように生成されたデータストリームは出力され、デコーディング側に送られ、そこで再構築される。
【0052】
内部サンプリングレートを切り換えるために、フィルターバンク38,44は、コアエンコーダ16とコアデコーダ22が動作するであろう内部サンプリングレートに従い、フレーム毎に適合されなければならない。図8は考えられるいくつかの切り換え場面を示しているが、ここでは、単にエンコーダとデコーダのMDCTコーディングの道筋を示しているだけである。
【0053】
特に、図8は、32kHzであると想定されている入力サンプリングレートが25.6kHz、12.8kHz、8kHzのいずれかにダウンサンプリングされるか、その入力サンプリングレートが維持される可能性があることを示している。入力サンプリングレートと内部サンプリングレートとの間の選択されたサンプリングレート比に応じて、フィルターバンク解析とフィルターバンク合成との間の変換長の比が決まる。これらの比は図8の影付きの部分(フィルターバンク38,44では、選択された内部サンプリングレートとは関係なく、それぞれ40個のサブバンド、フィルターバンク42,40では、選択された内部サンプリングレートに応じて、それぞれ40個、32個、16個または10個のサブバンド)から導き出すことができる。コアエンコーダ内で使用されるMDCTの変換長はこのように決定された内部サンプリングレートに適合され、結果的に変換レートまたは変換ピッチ時間間隔が一定または選択された内部サンプリングレートとは無関係となるように適合される。これは例えば常に20msであってもよく、その結果、選択された内部サンプリングレートに応じて、それぞれ640、512、256、160の変換長となる。
【0054】
上述のような原理を使用して、フィルターバンク切り換えに関する以下の規制に従い、内部サンプリングレートを切り換えることができる。
−切り換えの間にいかなる遅延も追加されない。
−この切り換えつまりサンプリングレート変更は瞬時に行われる。
−切り換えアーチファクトは最低限に抑えられるかまたは少なくとも低減される。
−計算量が小さい。
【0055】
基本的に、フィルターバンク38〜44とコアコーダー内のMDCTは、フィルターバンクにおいて、コアエンコーダとデコーダのMDCTと比較して、ウィンドウ領域の重複度が高くてもよい重複変換である。例えば、フィルターバンクにおいて10回の重複が適用されてもよく、MDCT122,124において2回の重複が適用されてもよい。重複変換のために、ステートバッファが、解析フィルターバンクとMDCTのための解析ウィンドウバッファとして、また合成フィルターバンクとIMDCTのための重複加算バッファとして説明できる。レート切り換えの際に、これらのステートバッファは、図5,6に関して上述したような方法で、サンプリングレートの切り換えに応じて調整されるべきである。以下に、図5に関して説明した合成側よりもむしろ、図6に関して説明した解析側でも実行され得る補間に関して、以下に詳細に説明する。重複変換のプロトタイプまたはウィンドウが適合されてもよい。切り換えアーチファクトを低減するには、重複変換部のエイリアシング解消特性を保持するためにステートバッファ内の信号成分を保存すべきである。
【0056】
以下に、リサンプラー72内での補間104の実行方法について詳細に説明する。
【0057】
以下のように2種類の場合に区分できる。
1)スイッチアップは、先行時間部分84から後続時間部分86へサンプリングレートが増加される処理である。
2)スイッチダウンは、先行時間部分84から後続時間部分86へサンプリングレートが減少される処理である。
【0058】
例えば12.8kHz(20msごとに256個のサンプル)から32kHz(20msごとに640個のサンプル)へのようなスイッチアップを想定すると、図5に参照符号130で示されているようなリサンプラー72のステートバッファまたはその容量は、サンプリングレート変更に相当する係数(上述の例では2.5)分だけ拡張される必要がある。追加遅延を発生させない拡張のための可能な方法は、例えば、線形補間またはスプライン補間である。つまり、リサンプラー72は、先行時間領域84に関する再変換形96の後部の(時間間隔102に存在するような)サンプルを、ステートバッファ130内ですぐに補間してもよい。ステートバッファは、図5に示されているように、先入れ先出しバッファとして機能してもよい。当然、完全なエイリアシング解消のために必要な全ての周波数成分がこの処理によって得られるわけではないが、例えば0〜6.4kHzのような少なくとも低周波域が何の歪みもなく生成可能であり、これらの周波数は心理音響的な点で最も関連深いものである。
【0059】
低いサンプリングレートへのスイッチダウンの場合には、線形またはスプライン補間は、また、追加遅延を発生させずにステートバッファを縮小するためにも使用できる。つまり、リサンプラー72は補間によりサンプリングレートを減少させてもよい。しかし、大きい縮小係数でのサンプリングレートへのスイッチダウン、例えば32kHz(20msごとに640個のサンプル)から12.8kHz(20msごとに256個のサンプル)への切り換え(この場合、縮小係数は2.5)は、高周波成分が除去されなければエイリアシング解消をひどく妨害する可能性がある。合成フィルタリングがこの現象に対処してもよく、この合成フィルタリングでは、フィルターバンクまたは再変換装置を「フラッシュ」することにより、高周波成分を除去することができる。これは、切り換えの瞬間にフィルターバンクが少ない周波数成分を合成し、従って、重複加算バッファから高スペクトル成分を取り除いてきれいにすることを意味している。より正確には、先行時間領域84のための第1のサンプリングレートから後続時間領域86のための第2のサンプリングレートへのスイッチダウンを想像して下さい。上記説明から離れて、再変換装置70は、先行時間領域84のウィンドウバージョンの変換形94の周波数成分の全てを再変換の対象とするわけではなく、そうすることによりスイッチダウンに備えるよう構成されている。むしろ、再変換装置70は、変換形94のあまり関係のない高周波成分を例えば0にセットすることにより、あるいは、これらの高周波成分を次第に減衰させるなどしてそれらの再変換に対する影響を減じることで、高周波成分を再変換から除外してもよい。例えば、この処理の対象となる高周波成分は、周波数成分Nk’よりも高いものであってもよい。
従って、結果的に生じた情報信号内では、時間領域84は、意図的に入力部76で入力された重複変換表記で入手可能であった帯域幅よりも低いスペクトル帯域で再構築されたものとなる。しかし、補間処理104にもかかわらず、高周波部分を気付かずに結合装置74内でのエイリアシング解消処理に導入した場合に重複加算処理で起こるであろうエイリアシング問題を避けることができる。
【0060】
別の例として、高サンプリングレート表記からの切り換えのために適当なステートバッファ内で使用できるように、さらに低サンプリングレート表記も同時に生成可能である。これにより、デシメーション係数(デシメーションが必要な場合)が常に比較的低く(つまり2より小さく)保たれ、妨害となるようなアーチファクトがエイリアシングから起こることはない。前述したように、これが全ての周波数成分を維持するわけではないが、少なくとも、心理音響的に関連のある低周波を維持することになる。
【0061】
従って、特定の実施形態によれば、USACの低遅延型を得るために、以下の方法でUSACコーデックを修正することができる。最初に、TCXコーディングモードとACELPコーディングモードのみが許可される。AACモードは回避できる。20msのフレーミングを得るために、そのフレーム長を選択できる。そして、動作モード(超広帯域(SWB)、広帯域(WB)、狭帯域(NB)または全帯域幅)とビットレートに応じて、以下のようなシステムパラメータが選択可能である。システムパラメータの概略を以下の表1に示す。
【0062】
【表1】
【0063】
狭帯域(NB)モードに関して、サンプリングレートの増加を避けることができ、内部サンプリングレートを入力サンプリングレートと等しくなるように、つまり8kHzにセットし、それに応じたフレーム長つまりサンプル数160のフレーム長を選択することにより、元に戻すことができる。同様に、広帯域(WB)動作モードの場合には、16kHzを選択し、TCXのためのMDCTのフレーム長を、サンプル数256ではなく、320とすることができる。
【0064】
特に、動作ポイントのリスト全体を通して、つまりサポートされているサンプリングレート、ビットレート及び帯域幅を通して変更動作を支えることができる。以下の表2に、USACコーデックの予想低遅延型の内部サンプリングレートに関する様々な構成を示す。
【0065】
【表2】
【0066】
サイド情報として、図2A,2Bのリサンプラーを使用する必要はないことに留意すべきである。入力サンプリングレートから専用のコアサンプリング周波数へのリサンプリング機能を負うために、代わりにIIRフィルターセットを設けることができる。これらのIIRフィルター遅延は0.5ms未満であるが、入力周波数と出力周波数との間の比が半端なものであるので、その複雑さは相当なものである。全てのIIRフィルターに関して遅延が同じであると仮定すると、違うサンプリングレート間での変更が可能となる。
【0067】
従って、図2A,2Bのリサンプラーの実施例を使用することが好ましい。パラメトリックエンベロープモジュール(つまりSBR)のQMFフィルターバンクが、上述したようなリサンプリング機能を実現するための共同作業に加わってもよい。SWBの場合、このことは、SBRエンコーダモジュールにより既に解析ステージが実現されている一方で、合成フィルターバンクステージをエンコーダに付加することになる。デコーダ側では、SBRが使用可能である場合にQMFがアップサンプリング機能を既に負っている。このスキームは他の全ての帯域幅モードにおいても使用可能である。以下の表3に、必要なQMF構成の概略を示す。
【0068】
【表3】
【0069】
入力サンプリング周波数が一定であると仮定すると、QMF合成プロトタイプを変えることにより、内部サンプリングレート間での変更が可能となる。デコーダ側には逆の動作が適用できる。QMF帯域の帯域幅は動作ポイントの全域を通して同じであることに留意すべきである。
【0070】
本発明のいくつかの態様を装置に関して説明してきたが、これらの態様はまたこれらに相当する方法の説明でもあり、ブロックや装置は方法ステップや方法ステップの特徴に対応する。同様に、方法ステップに関して説明した態様はまた、これらに相当するブロックやアイテムまたはこれらに相当する装置の特徴の説明でもある。これらの方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサ、プログラム制御可能なコンピュータや電子回路のようなハードウェア装置により(またはそれを使用して)実施してもよい。いくつかの実施形態において、最も重要な方法ステップのうちの一つまたはそれ以上のものが、このような装置によって実行されてもよい。
【0071】
実施条件に応じて、本発明の実施形態はハードウェアまたはソフトウェアで実現可能である。これは、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMやFLASHメモリーなどの、電子読み取り制御可能な信号が中に保存されたデジタル記憶媒体を使用して実施することができ、これらの電子読み取り制御可能な信号は、それぞれの方法が実行できるように、プログラム可能なコンピュータシステムと協働する(または協働可能である)。従って、このようなデジタル記憶媒体はコンピュータ読み取り可能なものであってもよい。
【0072】
本発明のいくつかの実施形態は、電子読み取り制御可能な信号を有するデータキャリアを含み、これらの電子読み取り制御可能な信号は、ここで説明した方法のうちの一つを実行できるように、プログラム可能なコンピュータシステムと協働可能である。
【0073】
一般的に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実施でき、このプログラム製品がコンピュータで動作した際、このプログラムコードは前述の方法のうちの一つを実行するためのものである。このようなプログラムコードは、例えば機械読み取り可能なキャリアに保存されていてもよい。
【0074】
他の実施形態は、ここで説明した方法のうちの一つを実行するためのものであり、機械読み取り可能なキャリアに保存されているコンピュータプログラムを含む。
【0075】
換言すれば、本発明の方法の一実施形態は、従って、コンピュータで動作した際、前述の方法のうちの一つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0076】
本発明の方法の別の実施形態は、従って、前述の方法のうちの一つを実行するためのコンピュータプログラムを格納しているデータキャリア(またはデジタル媒体またはコンピュータ読み取り可能な媒体)である。
【0077】
本発明の方法の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えばインターネットのようなデータ通信接続を介して送信されるように構成されていてもよい。
【0078】
さらに別の実施形態は、ここで説明した方法のうちの一つを実行するように構成された、例えばコンピュータやプログラム可能な論理装置のような処理手段を含む。
【0079】
本発明のさらに別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
【0080】
本発明の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを受信機に転送する(例えば電子的にまたは光学的に)よう構成された装置またはシステムを含む。
【0081】
いくつかの実施形態において、ここで説明した方法の機能性のうちのいくつかまたは全てを実行するために、プログラム可能な論理装置(例えばフィールドプログラマブルゲートアレイ)を使用してもよい。いくつかの実施形態において、ここで説明した方法のうちの一つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働してもよい。一般的に、これらの方法は何らかのハードウェア装置によって実行されることが好ましい。
【0082】
上述の実施形態は単に本発明の原理を説明しているにすぎない。ここで説明した配置や詳細に関して様々な修正や変更が当業者には明らかであろう。従って、本発明は以下の特許請求項の範囲によってのみ制限され、上述の実施形態で示された詳細によっては制限されない。
図1A
図1B
図2A
図2B
図3A
図3B
図4A
図4B
図5
図6
図7A
図7B
図8