特許第6568850号(P6568850)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オランジュの特許一覧

特許6568850変換コード化/復号から予測コード化/復号への遷移
<>
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000006
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000007
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000008
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000009
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000010
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000011
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000012
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000013
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000014
  • 特許6568850-変換コード化/復号から予測コード化/復号への遷移 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6568850
(24)【登録日】2019年8月9日
(45)【発行日】2019年8月28日
(54)【発明の名称】変換コード化/復号から予測コード化/復号への遷移
(51)【国際特許分類】
   G10L 19/20 20130101AFI20190819BHJP
   G10L 19/02 20130101ALI20190819BHJP
【FI】
   G10L19/20
   G10L19/02 150
【請求項の数】16
【全頁数】23
(21)【出願番号】特願2016-529922(P2016-529922)
(86)(22)【出願日】2014年11月14日
(65)【公表番号】特表2017-501432(P2017-501432A)
(43)【公表日】2017年1月12日
(86)【国際出願番号】FR2014052923
(87)【国際公開番号】WO2015071613
(87)【国際公開日】20150521
【審査請求日】2017年11月7日
(31)【優先権主張番号】1361243
(32)【優先日】2013年11月15日
(33)【優先権主張国】FR
(73)【特許権者】
【識別番号】591034154
【氏名又は名称】オランジュ
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ジュリアン・フォール
(72)【発明者】
【氏名】ステファーヌ・ラゴ
【審査官】 千本 潤介
(56)【参考文献】
【文献】 特開2010−210680(JP,A)
【文献】 特表2011−527444(JP,A)
【文献】 国際公開第2011/158485(WO,A2)
【文献】 特表2011−527459(JP,A)
【文献】 特開平09−120298(JP,A)
【文献】 特開2002−221999(JP,A)
【文献】 特開平07−210199(JP,A)
【文献】 米国特許出願公開第2013/0173259(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
デジタル音声信号を復号するための方法であって、
− 受信されて、変換コード化に従ってコード化された前記デジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップ(E602)と、
− 受信されて、予測コード化に従ってコード化された前記デジタル信号のサンプルの現フレームを予測復号に従って復号するステップ(E608)と
を含む方法において、前記現フレームの前記予測復号が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であることと、
− 前記予測復号の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップ(E606)と、
− 前記現フレームの予測復号によって合成された信号セグメントと、前記前のフレームの前記復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップ(E609)と
をさらに含むこととを特徴とする、方法。
【請求項2】
前記逆変換復号が、前記予測復号の処理遅延より小さい処理遅延を有することと、前記予測復号によって復号された前記現フレームの第1のセグメントが、前記前のフレームの前記逆変換復号から生じたセグメントと置き換えられ、前記前のフレームの前記逆変換復号から生じた前記セグメントのサイズが、前記予測復号と前記逆変換復号との間の遅延シフトに対応し、前記前のフレームの前記逆変換復号から生じた前記セグメントが、前記前のフレームの前記復号の間にメモリにおいて記憶されることとを特徴とする、請求項1に記載の復号方法。
【請求項3】
逆変換復号によって合成された前記信号セグメントが、以前に前記セグメントに適用されたウィンドウイングを補償する逆ウィンドウの適用によって、前記重畳加算ステップの前に補正されることを特徴とする、請求項1または2に記載の復号方法。
【請求項4】
逆変換復号によって合成された前記信号セグメントが、前記現フレームの前記復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされることを特徴とする、請求項1〜3のいずれか一項に記載の復号方法。
【請求項5】
前記予測復号の状態が、以下の状態のリスト:
− 前記予測復号の内部周波数でのリサンプリングのためのフィルタに対する状態メモリ、
− プリエンファシス/デエンファシスフィルタに対する状態メモリ、
− 線形予測フィルタの係数、
− 合成フィルタの状態メモリ、
− 前記適応辞書のメモリ、
− 低周波ポストフィルタの状態メモリ、
− 固定辞書利得に対する量子化メモリ
の中にあることを特徴とする、請求項1に記載の復号方法。
【請求項6】
前記現フレームに対する前記線形予測フィルタの前記係数の計算が、固有のフィルタの係数の復号によって、かつフレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに同一の係数を割り振ることによって実行されることを特徴とする、請求項5に記載の復号方法。
【請求項7】
前記現フレームに対する前記線形予測フィルタの前記係数の計算が、以下のステップ:
− フレーム終了時のフィルタの係数の復号済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数の復号済み値を決定するステップと、 − 前記フレーム開始時のフィルタの前記係数の復号済み値を前記フレーム半ばのフィルタの前記係数の前記復号済み値に置き換えるステップと、
− 前記フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの前記係数の前記このように復号された値を使用することによって、前記現フレームに対する前記線形予測フィルタの前記係数を決定するステップと
を含むことを特徴とする、請求項5に記載の復号方法。
【請求項8】
フレーム開始時の線形予測フィルタの係数が、長期予測フィルタ係数の平均値に相当する既定の値に再初期化されることと、前記現フレームに対する前記線形予測係数が、前記このように事前に決定された値およびフレーム終了時のフィルタの係数の復号済み値を使用することによって決定されることとを特徴とする、請求項5に記載の復号方法。
【請求項9】
デジタル音声信号をコード化するための方法であって、
− 変換コード化に従って前記デジタル信号のサンプルの前のフレームをコード化するステップ(E302)と、
− 予測コード化に従ってコード化すべき前記デジタル信号のサンプルの現フレームを受信するステップ(E308)と
を含む方法において、前記現フレームの前記予測コード化が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であることと、
− 前記予測コード化の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップ(E306)
をさらに含むこととを特徴とする、方法。
【請求項10】
線形予測フィルタの係数が、前記予測コード化の少なくとも1つの状態の一部を形成することと、前記現フレームに対する前記線形予測フィルタの前記係数の計算が、フレーム半ばまたはフレーム終了時のいずれかの単一の予測フィルタの係数のコード化済み値を決定することによって、かつフレーム開始時およびフレーム終了時またはフレーム半ばの予測フィルタの係数に対する同一のコード化済み値の割り振りを決定することによって実行されることとを特徴とする、請求項9に記載のコード化方法。
【請求項11】
前記予測コード化の少なくとも1つの状態が、直接的な方法でコード化されることを特徴とする、請求項10に記載のコード化方法。
【請求項12】
線形予測フィルタの係数が、前記予測コード化の少なくとも1つの状態の一部を形成することと、前記現フレームに対する前記線形予測フィルタの前記係数の計算が、以下のステップ:
− フレーム終了時のフィルタの係数のコード化済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数のコード化済み値を決定するステップと、
− 前記フレーム開始時のフィルタの前記係数のコード化済み値を前記フレーム半ばのフィルタの前記係数の前記コード化済み値に置き換えるステップと、
− 前記フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの前記係数の前記このようにコード化された値を使用することによって、前記現フレームに対する前記線形予測フィルタの前記係数を決定するステップと
を含むこととを特徴とする、請求項9に記載のコード化方法。
【請求項13】
線形予測フィルタの係数が、前記予測コード化の少なくとも1つの状態の一部を形成することと、フレーム開始時の線形予測フィルタの係数が、長期予測フィルタ係数の平均値に相当する既定の値に再初期化されることと、前記現フレームに対する前記線形予測係数が、前記このように事前に決定された値およびフレーム終了時のフィルタの係数のコード化済み値を使用することによって決定されることとを特徴とする、請求項9に記載のコード化方法。
【請求項14】
デジタル音声信号デコーダであって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを復号することができる逆変換復号エンティティ(602)と、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを復号することができる予測復号エンティティ(608)と
を備えるデコーダにおいて、前記現フレームの前記予測復号が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であることと、
− 前記予測復号の少なくとも1つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール(606)と、
− 前記現フレームの予測復号によって合成された信号セグメントと、前記前のフレームの前記復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を実行することができる処理モジュール(609)と
をさらに備えることとを特徴とする、デコーダ。
【請求項15】
デジタル音声信号コーダであって、
− デジタル信号のサンプルの前のフレームをコード化することができる変換コード化エンティティ(302)と、
− 前記デジタル信号のサンプルの現フレームをコード化することができる予測コード化エンティティ(308)と
を備えるコーダにおいて、前記現フレームの前記予測コード化が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であることと、
− 前記予測コード化の少なくとも1つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール(306)
をさらに備えることとを特徴とする、コーダ。
【請求項16】
請求項1〜8のいずれか一項に記載の復号方法および/または請求項9〜13のいずれか一項に記載のコード化方法のステップを実行するための命令を含むコンピュータプログラムを格納する、プロセッサによって読み取り可能な格納手段。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル信号のコード化の分野に関する。
【背景技術】
【0002】
本発明によるコード化は、特に、可聴周波数信号(語音、音楽または他のもの)などのデジタル音声信号の伝送および/または格納に適応している。
【0003】
本発明は、有利には、少なくとも2つのモードのコード化を交互に行い、そのアルゴリズム遅延が対話型アプリケーション(通常、≦40ms)に適応しているマルチモード技法による語音、音楽および混合コンテンツ信号の統合コード化に適用される。
【0004】
語音を効果的にコード化するため、CELP(「符号励振線形予測」)タイプまたはその変形形態のACELP(「代数符号励振線形予測」)の技法が提言され、BV16、BV32、iLBCまたはSILKコーダなどのCELPコード化の代替形態も、ここ最近提案されている。他方では、楽音を効果的にコード化するために、変換コード化技法が提言されている。
【0005】
線形予測コーダ、およびより具体的には、CELPタイプのものは、予測コーダである。それらの目的は、次の要素、すなわち、声道をモデル化するための短期線形予測、有声時間帯の声帯の振動をモデル化するための長期予測、および、予測ではモデル化が可能ではなかった「イノベーション」を表すための一般的には固定辞書と呼ばれるベクトル量子化辞書から導き出される励振(白色雑音、代数励振)の少なくともいくつかの部分に基づいて語音の生成をモデル化することである。
【0006】
最もよく使用される変換コーダ(例えば、MPEG AACまたはITU−T G.722.1 Annex Cコーダ)は、変換された領域において信号を圧縮するためにMDCT(「修正離散変換」)タイプの臨界サンプリング変換を使用する。「臨界サンプリング変換」は、変換された領域における係数の数が分析された時間サンプルの数に等しい変換を指す。
【0007】
これらの2つのタイプのコンテンツを含む信号を効果的にコード化するためのソリューションは、最も良い技法を経時的に(フレーム単位で)選択することにある。このソリューションは、特に、AMR WB+(または拡張AMR−WB)という名称の技法を通じて、またここ最近では、MPEG−H USAC(「統合語音音声コード化」)コーデックによって、3GPP(「第3世代パートナーシッププロジェクト」)標準化団体によって提言されている。AMR−WB+およびUSACによって構想されるアプリケーションは、対話型ではないが、アルゴリズム遅延に対する厳しい制約のない放送および格納サービスに相当する。
【0008】
USAC規格は、(非特許文献1)で公開されている。
【0009】
例示として、RM0(参照モデル0)と呼ばれるUSACコーデックの初期のバージョンについては、(非特許文献2)による論文で説明されている。このコーデックは、以下の少なくとも2つのモードのコード化を交互に行う。
・ 語音タイプの信号の場合:ACELP技法を使用するLPD(「線形予測領域」)モード
・ 音楽タイプの信号の場合:MDCT(「修正離散変換」)技法を使用するFD(「周波数領域」)モード
【0010】
ACELPおよびMDCTコード化の原理は、以下の通りである。
【0011】
一方では、CELPコード化(そのACELP変形形態を含む)は、ソースフィルタモデルに基づく予測コード化である。一般に、フィルタは、線形予測(線形予測コード化に対するLPC)によって得られる伝達関数1/A(z)を有する全極フィルタに相当する。実際には、合成は、フィルタ1/A(z)の量子化バージョン
【数1】
を使用する。ソース、すなわち、予測線形フィルタ
【数2】
の励振は、一般に、声帯の振動をモデル化する長期予測によって得られる励振と、雑音辞書などの代数コード(ACELP)の形態で説明される確率励振(またはイノベーション)との組合せである。「最適な」励振の検索は、
W(z)=A(z/γ1)/A(z/γ2)の形態の、線形予測フィルタA(z)から一般に導き出される伝達関数W(z)を有するフィルタによって重み付けされた信号の領域における二次誤差評価規範の最小化によって行われる。CELPモデルの多くの変形形態が提案され、ここでは、UIT−T G.718規格のCELPコード化(有声、無声、過渡音などに適応しているモードで、2つのLPCフィルタがフレームごとに量子化され、LPC励振が分類の関数としてコード化される)の例が記憶されることに留意されたい。その上、CELPコード化の代替形態もまた、依然として線形予測に基づくBV16、BV32、iLBCまたはSILKコーダを含めて、提案されている。一般に、予測コード化(CELPコード化を含む)は、歴史および他の理由(広帯域線形予測限界、高周波に対するアルゴリズムの複雑性など)のために、制限されたサンプリング周波数(≦16kHz)で動作し、従って、通常の16〜48kHzの周波数で動作するため、リサンプリング操作(FIRフィルタ、フィルタバンクまたはIIRフィルタによる)も使用され、任意選択により、パラメトリック帯域拡張であり得る高帯域に対する別個のコード化も使用される。これらのリサンプリングおよび高帯域コード化操作については、ここでは再検討しない。
【0012】
他方では、MDCT変換コード化は、コーダにおいて、以下の3つのステップ間で分割される。
1.2つのブロックに相当する長さにわたる「MDCTウィンドウ」とここでは呼ばれるウィンドウによる信号の重み付け
2.低減されたブロック(長さを2で除する)を形成するための時間エイリアシング(または「時間領域エイリアシング」)
3.低減されたブロックのDCT−IV(「離散コサイン変換」)変換
【0013】
DCT変換の代わりに、例えば、フーリエ変換(FFT)を使用することができるTDAC変換タイプの計算の変形形態に留意されたい。
【0014】
MDCTウィンドウは、一般に、「クオータ」と呼ばれる等しい長さの4つの隣接部分に分割される。
【0015】
信号には分析ウィンドウが乗じられ、次いで、エイリアシングが実行される。第1のクオータ(窓関数を掛け合わせた)は第2のクオータにエイリアシングされ(すなわち、時間反転させ、重畳する)、第4のクオータは第3のクオータにエイリアシングされる。
【0016】
より正確には、あるクオータの別のクオータへのエイリアシングは、次の方法で実行される。第1のクオータの第1のサンプルが第2のクオータの最後のサンプルに加えられ(または第2のクオータの最後のサンプルから減じられ)、第1のクオータの第2のサンプルが第2のクオータの最後のサンプルの1つ前のサンプルに加えられ(または第2のクオータの最後のサンプルの1つ前のサンプルから減じられ)、第1のクオータの最後のサンプルが第2のクオータの第1のサンプルに加えられる(または第2のクオータの第1のサンプルから減じられる)まで、同じように続く。
【0017】
従って、4つのクオータから2つのエイリアシング済みクオータが得られ、各サンプルは、コード化すべき信号の2つのサンプルの線形結合の結果である。この線形結合は、時間エイリアシングと呼ばれる。時間エイリアシングは、2つの時間セグメントを混合させることに相当し、各「エイリアシング済みクオータ」における2つの時間セグメントの相対レベルは分析/合成ウィンドウに依存することに留意されたい。
【0018】
これらの2つのエイリアシング済みクオータは、その後、DCT変換後に一緒にコード化される。次のフレームでは、ウィンドウ半分のシフトがあり(すなわち、50%が重畳する)、前のフレームの第3および第4のクオータは、現フレームの第1および第2のクオータになる。エイリアシング後、前のフレームと同様に、同じ対のサンプルの第2の線形結合が送り出されるが、異なる重みが用いられる。
【0019】
従って、デコーダでは、逆DCT変換後、これらのエイリアシング済み信号の復号バージョンが得られる。2つの連続フレームは、2つの同じクオータの2つの異なるエイリアシングの結果を含み、すなわち、各対のサンプルに対して、異なるが既知の重みを有する2つの線形結合の結果を有する。従って、入力信号の復号バージョンを得るために方程式系が解かれ、従って、2つの連続の復号済みフレームを使用して時間エイリアシングを省略することができる。
【0020】
言及される方程式系は、一般に、デエイリアシング、慎重に選ばれた合成ウィンドウの乗算、次いで、共通部分の重畳加算によって解かれる。この重畳加算により、同時に、2つの連続の復号済みフレーム間の緩やかな遷移(量子化誤差による不連続性のない)が保証され、この操作は、実際に、クロスフェードのように作用する。各サンプルに対して第1のクオータまたは第4のクオータのウィンドウがゼロにある場合には、ウィンドウのこの部分における時間エイリアシングがないMDCT変換が挙げられる。この事例では、MDCT変換による緩やかな遷移は保証されず、例えば、外部のクロスフェードなどの他の手段によって行わなければならない。
【0021】
変換コード化(MDCTタイプのコード化を含む)は、理論上、G.722.1コード化を含むG.722.1 annex Cの組み合わされた実装形態によって示されるように、様々な入力および出力サンプリング周波数に容易に適応させることができるが、リサンプリング(FIRフィルタ、フィルタバンクまたはIIRフィルタによる)による前/後処理操作を有する変換コード化を使用することも可能であり、任意選択により、パラメトリック帯域拡張であり得る高帯域の別個のコード化を使用することも可能である。これらのリサンプリングおよび高帯域コード化操作については、ここでは再検討しないが、3GPP e−AAC+コーダがそのような組合せの例示的な実施形態(リサンプリング、低帯域変換コード化および帯域拡張)を与える。
【0022】
様々なモードによってコード化された音響帯域(線形予測に基づく時間LPD、変換に基づく周波数FD)は、選択されるモードおよびビットレートに応じて異なり得ることに留意すべきである。その上、モード決定は、各フレームに対して開ループで行うことができる(すなわち、決定は、データおよび利用可能な観察の関数として行うことができる)か、または、AMR−WB+コード化にあるような閉ループで優先される。
【0023】
少なくとも2つのモードのコード化を使用するコーデックでは、LPDモードとFDモードとの間の遷移は、FDモードとLPDモードとが異なる種類のものであることを知った上で(一方は、信号の周波数領域の変換コード化に依存し、他方は、各フレームで更新されるフィルタメモリを有する(時間)予測線形コード化を使用する)、スイッチング欠陥のない十分な質を保証する際に重要である。USAC RM0コーデックに相当するモード間スイッチングを管理する例については、(非特許文献3)による論文で詳述されている。この論文で説明されるように、主な問題は、LPDモードからFDモードへ(逆もまた同様)の間の遷移にある。
【0024】
FDタイプのコアとLPDタイプのコアとの間の遷移の問題に対処するため、(特許文献1)の下で公開された特許出願(図1に示される)は、フレームmをコード化するFDタイプ(140)のコーダおよびデコーダの合成を使用することによって(メモリの更新は、FDタイプのフレームのコード化の間のみ必要である)、フレームm+1をコード化するLPDタイプ(130)のコーデックのフィルタのメモリを更新することを提案している。従って、LPD技法でフレームをコード化する場合、CELP(LPD)コーダのメモリ(または状態)はフレームmの再構築信号
【数3】
に基づいてジェネレータ160によって既に更新されているため、この技法は、110でのコード化のモードの選択の間およびFDタイプからLPDタイプへのコード化のトグリング(150での)の間、遷移欠陥(アーチファクト)なしでそうすることを可能にする。2つのコア(FDおよびLDP)が同じサンプリング周波数で動作しない事例では、(特許文献1)の特許出願で説明される技法は、FDタイプのコーダのメモリをリサンプリングするステップを提案している。
【先行技術文献】
【特許文献】
【0025】
【特許文献1】国際公開第2013/016262号パンフレット
【非特許文献】
【0026】
【非特許文献1】ISO/IEC document 23003−3:2012,Information technology−−MPEG audio technologies−−Part 3:Unified speech and audio coding
【非特許文献2】M.Neuendorf et al.,A Novel Scheme for Low Bitrate Unified Speech and Audio Coding−MPEG RM0,7−10 May 2009,126th AES Convention
【非特許文献3】J.Lecomte et al.,“Efficient cross−fade windows for transitions between LPC−based and non−LPC based audio coding”,7−10 May 2009,126th AES Convention
【0027】
この技法の欠点は、一方では、コーダにおいて復号済み信号にアクセスを有せざるを得ないことであり、従って、コーダでの局所合成が強要されることである。他方では、FDタイプのコード化および復号の間のフィルタのメモリを更新する操作(恐らくは、リサンプリングステップを含む)ならびにFDタイプの前のフレームにおけるCELPタイプの分析/コード化の実行に達する一連の操作を行わざるを得ないことである。これらの操作は、複雑であり、LPDタイプの遷移フレームにおけるコード化/復号の従来の操作と重畳し、それにより、「マルチモード」コード化複雑性スパイクを起こす。
【発明の概要】
【発明が解決しようとする課題】
【0028】
従って、語音および音楽の入れ替わりを呈する音声コード化の対話型アプリケーションのために提供されるコーダまたはデコーダの複雑性の増大を必要としない、変換コード化または復号と予測コード化または復号との間の効果的な遷移を得る必要性が存在する。
【課題を解決するための手段】
【0029】
本発明はこの状況を改善する。
【0030】
この目的のために、デジタル音声信号を復号するための方法であって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップと、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを予測復号に従って復号するステップと
を含む方法を提案する。方法は、現フレームの予測復号が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であり、および
− 予測復号の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップと、
− 現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップと
をさらに含むようなものである。
【0031】
従って、状態の再初期化は、前のフレームの復号済み信号の必要性なしで実行され、既定のまたはゼロの定数値を通じて非常に簡単な方法で実行される。従って、デコーダの複雑性は、分析または他の計算を必要とする状態メモリを更新するための技法に関して減少する。次いで、遷移アーチファクトは、前のフレームとのリンクをつなげることを可能にする重畳加算ステップの実装によって回避される。
【0032】
遷移予測復号を用いることで、適応辞書のメモリは使用されないため、この現フレームに対して適応辞書のメモリを再初期化する必要はなくなる。これにより、遷移の実装がさらに簡素化される。
【0033】
特定の実施形態では、逆変換復号は、予測復号の処理遅延より小さい処理遅延を有し、および予測復号によって復号された現フレームの第1のセグメントは、前のフレームの復号の間のメモリにおける遅延シフトおよび配置に相当する前のフレームの復号から生じたセグメントと置き換えられる。
【0034】
これにより、有利には、遷移の質を改善するためにこの遅延シフトを使用することが可能になる。
【0035】
特定の実施形態では、逆変換復号によって合成された信号セグメントは、以前にセグメントに適用されたウィンドウイングを補償する逆ウィンドウの適用によって、重畳加算ステップの前に補正される。
【0036】
従って、復号済み現フレームは、オリジナル信号のものに近いエネルギーを有する。
【0037】
異なる実施形態では、逆変換復号によって合成された信号セグメントは、現フレームの復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされる。
【0038】
これにより、変換復号のサンプリング周波数が予測復号のものと異なる事例において、欠陥なしで遷移を実行することが可能になる。
【0039】
本発明の一実施形態では、予測復号の状態は、以下の状態のリスト:
− 予測復号の内部周波数でのリサンプリングのためのフィルタに対する状態メモリ、
− プリエンファシス/デエンファシスフィルタに対する状態メモリ、
− 線形予測フィルタの係数、
− 合成フィルタの状態メモリ(事前増強された領域における)、
− 適応辞書のメモリ(過去の励振)、
− 低周波ポストフィルタ(LPF)の状態メモリ、
− 固定辞書利得に対する量子化メモリ
の中にある。
【0040】
これらの状態は、予測復号を実装するために使用される。これらの状態のほとんどは、ゼロの値または既定の定数値に再初期化され、それにより、このステップの実装がさらに簡素化される。しかし、このリストは網羅的ではなく、この再初期化ステップにおいて他の状態を考慮できることが非常に明らかである。
【0041】
本発明の特定の実施形態では、現フレームに対する線形予測フィルタの係数の計算は、固有のフィルタの係数の復号によって、かつフレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに同一の係数を割り振ることによって実行される。
【0042】
実際に、線形予測フィルタの係数が再初期化されているため、フレーム開始時の係数は知られていない。次いで、復号済み値を使用して、完全なフレームに対する線形予測フィルタの係数が得られる。従って、これは、復号済み音声信号に著しい劣化をもたらすことなく、いまだ簡単な方法で実行される。
【0043】
異なる実施形態では、現フレームに対する線形予測フィルタの係数の計算は、以下のステップ:
− フレーム終了時のフィルタの係数の復号済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数の復号済み値を決定するステップと、
− フレーム開始時のフィルタの係数の復号済み値をフレーム半ばのフィルタの係数の復号済み値に置き換えるステップと、
− フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの係数のこのように復号された値を使用することによって、現フレームに対する線形予測フィルタの係数を決定するステップと
を含む。
【0044】
従って、フレーム半ばのフィルタに相当する係数は、より低い誤差で復号される。
【0045】
別の異なる実施形態では、フレーム開始時の線形予測フィルタの係数は、長期予測フィルタ係数の平均値に相当する既定の値に再初期化され、および現フレームに対する線形予測係数は、このように事前に決定された値およびフレーム終了時のフィルタの係数の復号済み値を使用することによって決定される。
【0046】
従って、フレーム開始時の係数は、既定の値で知られていると考えられる。これにより、より正確な方法で完全なフレームの係数を回収することと、より急速に予測復号を安定させることとが可能になる。
【0047】
可能な実施形態では、事前に決定されたデフォルト値は、復号すべきフレームのタイプに依存する。
【0048】
従って、復号は、復号すべき信号によく適応している。
【0049】
また、本発明は、デジタル音声信号をコード化するための方法であって、
− 変換コード化に従ってデジタル信号のサンプルの前のフレームをコード化するステップと、
− 予測コード化に従ってコード化すべきデジタル信号のサンプルの現フレームを受信するステップと
を含む方法にも関する。方法は、現フレームの予測コード化が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であり、および
− 予測コード化の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップ
をさらに含むようなものである。
【0050】
従って、状態の再初期化は、前のフレームの信号の再構築ひいては局所復号の必要性なしで実行される。状態の再初期化は、既定のまたはゼロの定数値を通じて非常に簡単な方法で実行される。従って、コード化の複雑性は、分析または他の計算を必要とする状態メモリを更新するための技法に関して減少する。
【0051】
遷移予測コード化を用いることで、適応辞書のメモリは使用されないため、この現フレームに対して適応辞書のメモリを再初期化する必要はなくなる。これにより、遷移の実装がさらに簡素化される。
【0052】
特定の実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも1つの状態の一部を形成し、および現フレームに対する線形予測フィルタの係数の計算は、フレーム半ばまたはフレーム終了時の単一の予測フィルタの係数のコード化済み値を決定することによって、かつフレーム開始時およびフレーム終了時またはフレーム半ばの予測フィルタの係数に対する同一のコード化済み値の割り振りを決定することによって実行される。
【0053】
実際に、線形予測フィルタの係数が再初期化されているため、フレーム開始時の係数は知られていない。次いで、コード化済み値を使用して、完全なフレームに対する線形予測フィルタの係数が得られる。従って、これは、コード化済み音声信号に著しい劣化をもたらすことなく、いまだ簡単な方法で実行される。
【0054】
従って、有利には、予測コード化の少なくとも1つの状態は、直接的な方法でコード化される。
【0055】
実際に、フレーム半ばまたはフレーム開始時のフィルタの一連の係数のコード化のために通常保存されるビットは、例えば、デエンファシスフィルタのメモリなど、例えば、予測コード化の少なくとも1つの状態を直接的な方法でコード化するために使用される。
【0056】
異なる実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも1つの状態の一部を形成し、および現フレームに対する線形予測フィルタの係数の計算は、以下のステップ:
− フレーム終了時のフィルタの係数のコード化済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数のコード化済み値を決定するステップと、
− フレーム開始時のフィルタの係数のコード化済み値をフレーム半ばのフィルタの係数のコード化済み値に置き換えるステップと、
− フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの係数のこのようにコード化された値を使用することによって、現フレームに対する線形予測フィルタの係数を決定するステップと
を含む。
【0057】
従って、フレーム半ばのフィルタに相当する係数は、より小さいパーセンテージ誤差でコード化される。
【0058】
異なる実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも1つの状態の一部を形成し、およびフレーム開始時の線形予測フィルタの係数は、長期予測フィルタ係数の平均値に相当する既定の値に再初期化され、および現フレームに対する線形予測係数は、このように事前に決定された値およびフレーム終了時のフィルタの係数のコード化済み値を使用することによって決定される。
【0059】
従って、フレーム開始時の係数は、既定の値で知られていると考えられる。これにより、完全なフレームの予測係数を計算するために、追加の分析なしで、前のフレームの予測係数の良い推定を得ることが可能になる。
【0060】
可能な実施形態では、事前に決定されたデフォルト値は、コード化すべきフレームのタイプに依存する。
【0061】
また、本発明は、デジタル音声信号デコーダであって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを復号することができる逆変換復号エンティティと、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを復号することができる予測復号エンティティと
を備えるデコーダにも関する。デコーダは、現フレームの予測復号が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であり、および
− 予測復号の少なくとも1つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュールと、
− 現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を実行することができる処理モジュールと
をさらに備えるようなものである。
【0062】
同様に、本発明は、デジタル音声信号コーダであって、
− デジタル信号のサンプルの前のフレームをコード化することができる変換コード化エンティティと、
− デジタル信号のサンプルの現フレームをコード化することができる予測コード化エンティティと
を備えるコーダにも関する。コーダは、現フレームの予測コード化が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であり、および
− 予測コード化の少なくとも1つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール
をさらに備えるようなものである。
【0063】
デコーダおよびコーダは、それぞれが実装する復号およびコード化方法と同じ利点をもたらす。
【0064】
最後に、本発明は、これらの命令がプロセッサによって実行される際に、上記に説明されるものなどの復号方法および/または上記に説明されるものなどのコード化方法のステップを実装するためのコード命令を含むコンピュータプログラムに関する。
【0065】
また、本発明は、上記に説明されるものなどの復号方法および/またはコード化方法を実装するコンピュータプログラムを格納する、プロセッサによって読み取り可能であり、デコーダまたはコーダに組み込むことができ、任意選択により取り外し可能な格納手段にも関する。
【0066】
本発明の他の特性および利点は、以下で詳述する説明および添付の図を調査することで明らかになるであろう。
【図面の簡単な説明】
【0067】
図1】最先端のおよび上記に説明される変換コード化と予測コード化との間の遷移のプロセスを示す。
図2】本発明の実装形態による、変換コード化に従ってコード化されたフレームと予測コード化に従ってコード化されたフレームとの間のコーダにおける遷移を示す。
図3】本発明による、コード化方法およびコーダの実施形態を示す。
図4】現フレームの予測コード化の間に線形予測フィルタの係数を決定するために、特定の実施形態でステップが実装されるフローチャートの形態を示し、前のフレームは変換コード化に従ってコード化されている。
図5】本発明の実装形態による、逆変換復号に従って復号されたフレームと予測復号に従って復号されたフレームとの間のデコーダにおける遷移を示す。
図6】本発明による、復号方法およびデコーダの実施形態を示す。
図7】現フレームの予測復号の間に線形予測フィルタの係数を決定するために、本発明の実施形態でステップが実装されるフローチャートの形態を示し、前のフレームは逆変換復号に従って復号されている。
図8】本発明の実施形態による、復号の間に実装される重畳加算ステップを示す。
図9】異なる遅延を有する場合の変換復号と予測復号との間の遷移の実装形態の特定のモードを示す。
図10】本発明による、コーダまたはデコーダのハードウェア実施形態を示す。
【発明を実施するための形態】
【0068】
図2は、本発明による、変換コード化と予測コード化との間の遷移間のコード化の原理を概略的に示す。
【0069】
ここでは、例えば、MDCTタイプの変換コーダ(FD)で、または、例えば、ACELPタイプの予測コーダ(LPD)でコード化すべき音声フレームの連続が考慮されている。本発明に影響を及ぼすことなく、追加のコード化モードが可能であることに留意されたい。この例では、変換コーダ(FD)は、「テューキー」タイプの小さい遅延を有するウィンドウを使用し(本発明は、使用されるウィンドウのタイプとは無関係である)、その全長は、図で表されるように、2つのフレーム(ゼロの値を含む)に等しい。
【0070】
コード化の間、FDコーダのウィンドウは、ウィンドウの最後のゼロではない部分(右側)が入力信号の新しいフレーム終了時と一致するように同期化される。図2に示されるようなフレームへの分裂は、「ルックアヘッド」(または将来の信号)を含み、従って、実際にコード化されたフレームは、図5に関連してさらに説明されるように、通常、時間がシフト(遅延)されることに留意されたい。遷移がない場合、コーダは、エイリアシングおよびDCT変換手順(最先端(MDCT)において説明されるものなど)を実行する。LPDタイプのコーダによってコード化すべきフレームの到着時、ウィンドウは適用されず、LPDコーダのフィルタに相当する状態またはメモリが既定の値に再初期化される。
【0071】
ここでは、LPDコーダは、CELPコード化が12.8kHzの内部周波数で動作するUIT−T G.718コーダから導き出されると考えられる。本発明によるLPDコーダは、ビットレートに従って、2つの内部周波数12.8kHzまたは16kHzで動作することができる。
【0072】
予測コード化(LPD)の状態は、少なくとも以下の状態を含意する。
・ CELPコード化の内部周波数(12.8または16kHz)での入力周波数fsに対するリサンプリングフィルタの状態メモリ。ここでは、FIRタイプの実施形態が過去の入力信号に相当する状態メモリの使用を簡素化すると知った上で、リサンプリングは、FIRフィルタ、フィルタバンクまたはIIRフィルタによる入力周波数および内部周波数の関数として実行することができると考えられる。
・ プリエンファシスフィルタ(1−αz−1、一般に、α=0.68)およびデエンファシスフィルタ(1/(1−αz−1))の状態メモリ。
・ 前のフレーム終了時の線形予測フィルタの係数、または、LSF(「線スペクトル周波数」)もしくはISF(「イミタンススペクトル周波数」)領域などの領域におけるそれらの等しいバージョン。
・ 通常の16次のLPC合成フィルタの状態メモリ(事前増強された領域における)。
・ 適応辞書のメモリ(過去のCELP励振)。
・ 規格UIT−G.718で定義されるような低周波ポストフィルタ(LPF)の状態メモリ(規格UIT−T G.718の条項7.14.1.1を参照)。
・ 固定辞書利得に対する量子化メモリ(この量子化がメモリで実行される場合)。
【0073】
図3は、本発明による、コーダおよびコード化方法の実施形態を示す。
【0074】
特定の実施形態は、MDCTを使用するFD変換コーデックとACELPタイプの予測コーデックとの間の遷移のフレームワーク内に存在する。
【0075】
モジュール301によるフレームへの配置の第1の従来のステップ(E301)の後、決定モジュール(dec.)は、処理すべきフレームをACELP予測コード化によってコード化すべきかまたはFD変換コード化によってコード化すべきかを判断する。
【0076】
変換コード化の事例では、MDCT変換の完全なステップ(E302)は、変換コード化エンティティ302によって実行される。このステップは、とりわけ、図2に示されるように位置合わせされた低ラグウィンドウで窓関数を掛け合わせるステップ、エイリアシングのステップ、および、DCT領域における変換のステップを含む。その後、フレームFDは、ステップ(E303)において、量子化モジュール303によって量子化され、次いで、このように符号化されたデータは、E305において、ビットストリーム構築モジュール305によってビットストリームで記載される。
【0077】
予測コード化から変換コード化への遷移の事例は、本発明の対象物を形成しないため、この例では取り扱わない。
【0078】
決定ステップ(dec.)がACELP予測コード化を選んだ場合は、
・ 前のフレーム(最後のACELP)もまたACELPコード化エンティティ304によって符号化されていれば、予測コード化のメモリまたは状態を更新する間、ACELPコード化(E304)が続行される。ここでは、CELPコード化の内部サンプリング周波数のスイッチング(12.8から16kHzへ、逆もまた同様)の問題に対処しない。コード化および量子化された情報は、ステップE305において、ビットストリームで記載される。
・ あるいは、前のフレーム(最後のMDCT)がE302において変換コード化エンティティ302によって符号化されていれば、この場合、ACELP予測コード化のメモリまたは状態は、ステップ(E306)において、予め事前に決定されたデフォルト値(必ずしもゼロであるとは限らない)に再初期化される。この再初期化ステップは、再初期化モジュール306によって、予測コード化の少なくとも1つの状態に対して実装される。次いで、E308において、予測コード化エンティティ308によって現フレームに対する予測コード化のステップが実装される。コード化および量子化された情報は、ステップE305において、ビットストリームで記載される。
【0079】
この予測コード化E308は、特定の実施形態では、規格UIT−T G.718で「TCモード」という名称で定義されるものなどの遷移コード化であり得、この遷移コード化では、励振のコード化は、直接的なものであり、前のフレームから生じたいかなる適応辞書も使用しない。次いで、励振のコード化(前のフレームとは無関係である)が行われる。この実施形態により、LPDタイプの予測コーダをはるかに急速に安定させることが可能になる(ゼロに設定される適応辞書を使用するであろう従来のCELPコード化に関して)。これは、本発明による遷移の実装形態をさらに簡素化する。
【0080】
本発明の変形形態では、励振のコード化を遷移モードにしないが、G.718と同様の方法でCELPコード化を使用し、恐らくは、適応辞書を使用するか(分類を強要することも制限することもなく)、または、適応および固定辞書を有する従来のCELPコード化を使用することが可能となる。しかし、適応辞書が再計算もゼロへの設定もされておらず、コード化は準最適であるため、この変形形態はあまり有利ではない。
【0081】
別の変形形態では、TCモードによる遷移フレームにおけるCELPコード化は、例えば、iLBCタイプのコード化モデルを使用することによって、前のフレームとは無関係の他のタイプのコード化と置き換えることができる。
【0082】
特定の実施形態では、現フレームに対する線形予測フィルタの係数を計算するステップE307は、計算モジュール307によって実行される。
【0083】
線形予測フィルタの係数の計算のいくつかのモードが現フレームに対して可能である。ここでは、予測コード化(ブロック304)は、規格G.718にあるように、フレーム終了時(NEW)に得られるISF(または等しい方法でのLSF)という形態のLPC係数のコード化およびフレーム半ば(MID)で得られたLPC係数の非常に低減されたビットレートコード化で、前のフレーム終了時(OLD)のLPC係数と現フレーム(MIDおよびNEW)のものとの間のサブフレームによる補間で、フレームごとに2回の線形予測分析を実行すると考えられる。
【0084】
第1の実施形態では、FDコーダではLPC係数はコード化されないため、FDタイプの前のフレーム(OLD)における予測係数は知られていない。次いで、フレーム半ば(MID)またはフレーム終了時(NEW)に相当する線形予測フィルタの単一の係数セットをコード化することを選択する。この選択は、例えば、コード化すべき信号の分類に従って行うことができる。安定した信号の場合、フレーム半ばのフィルタを選択することが可能となる。また、任意の選択を行うこともできる。選択がフレーム半ばのLPC係数に関する事例では、変形形態において、LPC係数の補間(ISP(「イミタンススペクトルペア」)領域またはLSP(「線スペクトルペア」)領域における)は、遷移LPDフレームに続く第2のLPDフレームにおいて修正することができる。得られたこれらのコード化済み値に基づいて、同一のコード化済み値は、行った選択に従って、フレーム開始時(OLD)の予測フィルタの係数およびフレーム終了時またはフレーム半ばの予測フィルタ係数に割り振られる。実際に、前のフレーム(OLD)のLPC係数は知られていないため、G.718にあるように、フレーム半ば(MID)のLPC係数をコード化することは可能ではない。この変形形態では、これらの係数は使用されないため、LPC係数(OLD)の再初期化が絶対に必要とは限らないことに留意されたい。この事例では、各サブフレームにおいて使用される係数は、フレームにおいてコード化された値と同一の方法で固定される。
【0085】
有利には、一連のフレーム半ば(MID)またはフレーム開始時のLPC係数のコード化のために保存できるビットは、例えば、予測コード化の少なくとも1つの状態(例えば、デエンファシスフィルタのメモリ)を直接的な方法でコード化するために使用される。
【0086】
第2の可能な実施形態では、図4に示されるステップが実装される。第1のステップE401は、例えば、LSP係数に対する先験的な学習ベースにわたる長期平均値に応じた、すなわち、既定の値への、予測フィルタの係数および図3のステップE306の実装形態によるISFまたはLSF表現の均等物の初期化である。ステップE402は、フレーム終了時のフィルタの係数(LSP NEW)をコード化し、E403において、フレーム半ばの予測フィルタの係数(LSP MID)をコード化するために、得られたコード化済み値(LEP NEW Q)およびフレーム開始時のフィルタの係数(LSP OLD)の既定の再初期設定値が使用される。フレーム開始時の係数(LSP OLD)の値をフレーム半ばの係数のコード化済み値(LSP MID Q)に置き換えるステップE404が実行される。ステップE405は、このようにコード化されたこれらの値(LSP OLD、LSP MID Q、LSP NEW Q)に基づいて現フレームに対する線形予測フィルタの係数を決定することを可能にする。
【0087】
第3の可能な実施形態では、前のフレームに対する線形予測フィルタの係数(LSP OLD)は、LPCタイプのスペクトルエンベロープを使用するFDコーダ変形形態において既に「無償で」利用可能な値に初期化される。この事例では、G.718で使用されるものなどの「通常の」コード化を使用することが可能となり、サブフレームベースの線形予測係数は、予測フィルタ(OLD、MIDおよびNEW)の値間の補間として計算され、従って、この操作により、LPDコーダは、追加の分析なしで、前のフレームのLPC係数の良い推定が得られるようになる。
【0088】
本発明の他の変形形態では、LPDのコード化は、デフォルトでは、一連のLPC係数(NEW)のみをコード化することができ、上記の異なる実施形態は、単に、フレーム半ば(MID)では一連の係数が利用不可能であることを考慮するように適応される。
【0089】
本発明の異なる実施形態では、予測コード化の状態の初期化は、例えば、符号化すべき様々なタイプのフレームに相当し得る、予め事前に決定されたデフォルト値で実行することができる(例えば、初期設定値は、フレームが有声または無声タイプの信号を含む場合は異なり得る)。
【0090】
図5は、本発明による、本発明による、変換復号と予測復号との間の遷移間の復号の原理を概略的に示す。
【0091】
ここでは、例えば、MDCTタイプの変換デコーダ(FD)で、または、例えば、ACELPタイプの予測デコーダ(LPD)で復号すべき音声フレームの連続が考慮されている。この例では、変換デコーダ(FD)は、「テューキー」タイプの小さい遅延の合成ウィンドウを使用し(本発明は、使用されるウィンドウのタイプとは無関係である)、その全長は、図で表されるように、2つのフレーム(ゼロの値を含む)に等しい。
【0092】
本発明の意味の範囲内では、FDコーダでコード化されたフレームの復号後、逆DCT変換が復号済みフレームに適用される。後者は、デエイリアシングされ、次いで、合成ウィンドウがデエイリアシング済み信号に適用される。FDコーダの合成ウィンドウは、ウィンドウのゼロではない部分(左側)が新しいフレームと一致するように同期化される。従って、フレームは、ポイントAまで復号することができるが、その理由は、このポイントの前は、信号はいかなる時間エイリアシングも有さないためである。
【0093】
LPDフレームの到着の瞬間には、コーダにおける場合と同じように、予測復号の状態またはメモリが既定の値に再初期化される。
【0094】
予測復号(LPD)の状態は、少なくとも以下の状態を含意する。
・ 出力周波数fsでのCELP復号の内部周波数(12.8または16kHz)に対するリサンプリングフィルタの状態メモリ。ここでは、FIRタイプの実施形態が過去の入力信号に相当する状態メモリの使用を簡素化すると知った上で、リサンプリングは、FIRフィルタ、フィルタバンクまたはIIRフィルタによる入力周波数および内部周波数の関数として実行することができると考えられる。
・ デエンファシスフィルタ(1/(1−αz−1))の状態メモリ。
・ 前のフレーム終了時の線形予測フィルタの係数、または、LSF(「線スペクトル周波数」)もしくはISF(「イミタンススペクトル周波数」)領域などの領域におけるそれらの等しいバージョン。
・ 通常の16次のLPC合成フィルタの状態メモリ(事前増強された領域における)。
・ 適応辞書のメモリ(過去の励振)。
・ 規格UIT−G.718で定義されるような低周波ポストフィルタ(LPF)の状態メモリ(規格UIT−T G.718の条項7.14.1.1を参照)。
・ 固定辞書利得に対する量子化メモリ(この量子化がメモリで実行される場合)。
【0095】
図6は、本発明による、デコーダおよび復号方法の実施形態を示す。
【0096】
特定の実施形態は、MDCTを使用するFD変換コーデックとACELPタイプの予測コーデックとの間の遷移のフレームワーク内に存在する。
【0097】
モジュール601によるバイナリトレインにおける読み取りの第1の従来のステップ(E601)の後、決定モジュール(dec.)は、処理すべきフレームをACELP予測復号によって復号すべきかまたはFD変換復号によって復号すべきかを判断する。
【0098】
MDCT変換復号の事例では、変換復号エンティティ602による復号のステップE602は、変換された領域におけるフレームを得ることを可能にする。また、ステップは、ACELPデコーダのサンプリング周波数でのリサンプリングのステップも含み得る。このステップの後には、逆DCT変換、時間デエイリアシングおよび合成ウィンドウの適用を含む逆MDCT変換E603が続き、図8を参照して後に説明されるような前のフレームとの重畳加算ステップが続く。
【0099】
時間エイリアシングがキャンセルされた部分は、ステップE605において、フレーム配置モジュール605によってフレームに配置される。時間エイリアシングを含む部分は、次のフレームがあればそれをFDコアによって復号した状態で処理モジュール609によってE609における重畳加算ステップを行うためにメモリ(MDCT Mem.)に保持される。変形形態では、重畳加算ステップで使用されるMDCT復号の格納された部分は、例えば、十分に著しい時間シフトがMDCT復号とCELP復号との間に存在する事例では、いかなる時間エイリアシングも含まない。
【0100】
このステップは、図8に示されている。この図では、時間的な不連続性がFDから生じた復号とLPDから生じた復号との間に存在することが見られる。ステップE609は、上記で説明されるものなどの変換コーダのメモリ(MDCT Mem.)、すなわち、ポイントA以降に復号されるが、エイリアシングを含む信号(示される事例における)を使用する。
【0101】
優先的には、信号は、変換のエイリアシングのポイントであるポイントBまで使用される。特定の実施形態では、この信号は、セグメントABにわたって以前に適用されたウィンドウを逆にすることによって事前に補償される。従って、重畳加算ステップの前に、セグメントABは、セグメントに以前に適用されたウィンドウイングを補償する逆ウィンドウの適用によって補正される。従って、セグメントは、もはや「窓関数を掛け合わせる」ことなく、そのエネルギーは、オリジナル信号のものに近い。
【0102】
変換復号から生じたものおよび予測復号から生じたものである2つのセグメントABは、その後、最終的な信号ABを得るために、重み付けされ、総和される。重み関数は、優先的には、1に等しい総和を有する(例えば、二次正弦または線形タイプ)。従って、重畳加算ステップは、現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する。
【0103】
別の特定の実施形態では、リサンプリングが未だ実行されていない事例(例えば、E602)では、FDタイプの逆変換復号によって合成された信号セグメントは、LPDタイプの現フレームの復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされる。MDCTメモリのこのリサンプリングは、FIRタイプのフィルタ、フィルタバンクもしくはIIRフィルタによってまたは実際に「スプライン」を使用することによって、従来の技法を用いて、遅延ありまたは遅延なしで行うことができる。
【0104】
逆の事例では、FDおよびLPDコード化モードが異なる内部サンプリング周波数で動作する場合は、代替形態では、CELPコード化の合成をリサンプリングすること(任意選択により、特に、推定されたまたはコード化された高帯域を加えて後処理される)、および本発明を適用することが可能となる。LPDコーダの合成のこのリサンプリングは、FIRタイプのフィルタ、フィルタバンクもしくはIIRフィルタによってまたは実際に「スプライン」を使用することによって、従来の技法を用いて、遅延ありまたは遅延なしで行うことができる。
【0105】
これにより、変換復号のサンプリング周波数が予測復号のものと異なる事例において、欠陥なしで遷移を実行することが可能になる。
【0106】
特定の実施形態では、FDデコーダがCELP(LPD)デコーダより少ないラグを有する場合は、2つのデコーダを時間的に位置合わせするために、中間的な遅延ステップ(E604)を適用することが可能である。次いで、そのサイズが2つのデコーダ間のラグに相当する信号部分がメモリ(Mem.delay)に格納される。
【0107】
図9は、この例示的な事例について描写する。ここでは、実施形態は、LPD予測復号から生じた第1のセグメントDをFD変換復号から生じたものと置き換え、上記に説明されるものなど、セグメントAB上での重畳加算ステップ(E609)に着手するために、このラグDの違いを有利に活用することを提案する。従って、逆変換復号が予測復号の処理遅延より小さい処理遅延を有する場合、予測復号によって復号された現フレームの第1のセグメントは、前のフレームの復号の間のメモリにおける遅延シフトおよび配置に相当する前のフレームの復号から生じたセグメントと置き換えられる。
【0108】
図6において、ACELP予測復号をする必要があることを決定(dec.)が示す場合は、
・ 最後に復号されたフレーム、すなわち、前のフレーム(最後のACELP)もまたACELP復号エンティティ603によってACELP予測復号に従って復号されていれば、ステップ(E603)において、予測復号が続行され、E605において、音声フレームが生成される。
・ あるいは、前のフレーム(最後のMDCT)がE602において変換復号エンティティ602によって復号されていれば、この場合、ACELP予測復号の状態の再初期化ステップ(E606)が適用される。この再初期化ステップは、再初期化モジュール606によって、予測復号の少なくとも1つの状態に対して実装される。再初期設定値は、予め事前に決定されたデフォルト値(必ずしもゼロであるとは限らない)である。LPD復号の状態の初期化は、例えば、符号化の間に行われたものの関数として復号すべき様々なタイプのフレームに相当し得る、予め事前に決定されたデフォルト値で行うことができる。
【0109】
次いで、上記に説明される重畳加算ステップ(E609)の前に、E608において、現フレームに対する予測復号のステップは、予測復号エンティティ608によって実装される。また、ステップは、MDCTデコーダのサンプリング周波数でリサンプリングするステップも含み得る。
【0110】
この予測コード化E608は、特定の実施形態では、エンコーダにおいてこのソリューションが選択された場合は、遷移予測復号であり得、この遷移予測復号では、励振の復号は、直接的なものであり、いかなる適応辞書も使用しない。この事例では、適応辞書のメモリは、再初期化する必要はない。
【0111】
次いで、励振の非予測復号が行われる。この実施形態により、この事例では、以前に再初期化されている適応辞書のメモリを使用しないため、LPDタイプの予測デコーダをはるかに急速に安定させることが可能になる。これは、本発明による遷移の実装形態をさらに簡素化する。現フレームを復号する場合、長期励振の予測復号は、励振の非予測復号と置き換えられる。
【0112】
特定の実施形態では、現フレームに対する線形予測フィルタの係数を計算するステップE607は、計算モジュール607によって実行される。
【0113】
現フレームに対して、線形予測フィルタの係数の計算のいくつかのモードが可能である。
【0114】
第1の実施形態では、FDコーダではLPC係数はコード化されず、値は0に再初期化されているため、FDタイプの前のフレーム(OLD)における予測係数は知られていない。次いで、固有の線形予測フィルタ(すなわち、フレーム終了時の予測フィルタ(NEW)に相当するかまたはフレーム半ばの予測フィルタ(MID)に相当する)の係数を復号することを選択する。その後、同一の係数は、フレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに割り振られる。
【0115】
第2の可能な実施形態では、図7に示されるステップが実装される。第1のステップE701は、図6のステップE606の実装形態による予測フィルタの係数(LSP OLD)の初期化である。ステップE702は、フレーム終了時のフィルタの係数(LSP NEW)を復号し、E703において、フレーム半ばの予測フィルタの係数(LSP MID)を復号するために、得られた復号済み値(LSP NEW)およびフレーム開始時のフィルタの係数(LSP OLD)の既定の再初期設定値が一緒に使用される。フレーム開始時の係数(LSP OLD)の値をフレーム半ばの係数(LSP MID)の復号済み値に置き換えるステップE704が実行される。ステップE705は、このように復号されたこれらの値(LSP OLD、LSP MID、LSP NEW)に基づいて現フレームに対する線形予測フィルタの係数を決定することを可能にする。
【0116】
第3の可能な実施形態では、前のフレームに対する線形予測フィルタの係数(LSP OLD)は、例えば、LSP係数の長期平均値に応じて、既定の値に初期化される。この事例では、G.718で使用されるものなどの「通常の」復号を使用することが可能となり、サブフレームベースの線形予測係数は、予測フィルタ(OLD、MIDおよびNEW)の値間の補間として計算される。従って、この操作により、LPDコーダをより急速に安定させることが可能になる。
【0117】
図10を参照すると、本発明の実施形態によるコーダまたはデコーダを具体化するように適応させたハードウェアデバイスについて説明している。
【0118】
このコーダまたはデコーダは、通信端末、通信ゲートウェイまたは任意のタイプの機器(セットトップボックスタイプのデコーダまたはオーディオストリームリーダなど)に組み込むことができる。
【0119】
このデバイスDISPは、デジタル信号を受信するための入力を備え、入力は、コーダの場合は入力信号x(n)であり、デコーダの場合はバイナリトレインbstである。
【0120】
また、デバイスは、特に、入力Eを発生源とする信号上のコード化/復号操作の実行に適応しているデジタル信号プロセッサPROCも備える。
【0121】
このプロセッサは、コード化/復号に関するデバイスの駆動に必要な情報の格納に適応している1つまたは複数のメモリユニットMEMとリンクされる。例えば、これらのメモリユニットは、上記で説明される復号方法の実装のための命令を含み、特に、受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップと、受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを予測復号に従って復号するステップと、予測復号の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップと、現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップとを実装するための命令を含む。
【0122】
デバイスがコーダタイプのものである場合、これらのメモリユニットは、上記で説明されるコード化方法の実装のための命令を含み、特に、変換コード化に従ってデジタル信号のサンプルの前のフレームをコード化するステップと、予測コード化に従ってコード化すべきデジタル信号のサンプルの現フレームを受信するステップと、予測コード化の少なくとも1つの状態を事前に決定されたデフォルト値に再初期化するステップとを実装するための命令を含む。
【0123】
また、これらのメモリユニットは、計算パラメータまたは他の情報も含み得る。
【0124】
より一般には、プロセッサによって読み取り可能である、コーダまたはデコーダに組み込むことができる、任意選択により取り外し可能な格納手段は、本発明による復号方法および/またはコード化方法を実装するコンピュータプログラムを格納する。図3および6は、例えば、そのようなコンピュータプログラムのアルゴリズムを示す。
【0125】
また、プロセッサは、これらのメモリユニットへの結果の格納にも適応している。最後に、デバイスは、出力信号を提供するためにプロセッサにリンクされた出力Sを備え、出力信号は、コーダの場合はバイナリトレインbstの形態の信号であり、デコーダの場合は出力信号
【数4】
である。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10