特許6568850 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オランジュの特許一覧

特許6568850変換コード化／復号から予測コード化／復号への遷移

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6568850

(24)【登録日】2019年8月9日

(45)【発行日】2019年8月28日

(54)【発明の名称】変換コード化／復号から予測コード化／復号への遷移

(51)【国際特許分類】

G10L 19/20 20130101AFI20190819BHJP

G10L 19/02 20130101ALI20190819BHJP

【ＦＩ】

G10L19/20

G10L19/02 150

【請求項の数】16

【全頁数】23

(21)【出願番号】特願2016-529922(P2016-529922)

(86)(22)【出願日】2014年11月14日

(65)【公表番号】特表2017-501432(P2017-501432A)

(43)【公表日】2017年1月12日

(86)【国際出願番号】FR2014052923

(87)【国際公開番号】WO2015071613

(87)【国際公開日】20150521

【審査請求日】2017年11月7日

(31)【優先権主張番号】1361243

(32)【優先日】2013年11月15日

(33)【優先権主張国】FR

(73)【特許権者】

【識別番号】591034154

【氏名又は名称】オランジュ

(74)【代理人】

【識別番号】100108453

【弁理士】

【氏名又は名称】村山靖彦

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(74)【代理人】

【識別番号】100133400

【弁理士】

【氏名又は名称】阿部達彦

(72)【発明者】

【氏名】ジュリアン・フォール

(72)【発明者】

【氏名】ステファーヌ・ラゴ

【審査官】千本潤介

(56)【参考文献】

【文献】特開２０１０−２１０６８０（ＪＰ，Ａ）

【文献】特表２０１１−５２７４４４（ＪＰ，Ａ）

【文献】国際公開第２０１１／１５８４８５（ＷＯ，Ａ２）

【文献】特表２０１１−５２７４５９（ＪＰ，Ａ）

【文献】特開平０９−１２０２９８（ＪＰ，Ａ）

【文献】特開２００２−２２１９９９（ＪＰ，Ａ）

【文献】特開平０７−２１０１９９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１３／０１７３２５９（ＵＳ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／００−１９／２６

(57)【特許請求の範囲】

【請求項1】

デジタル音声信号を復号するための方法であって、
− 受信されて、変換コード化に従ってコード化された前記デジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップ（Ｅ６０２）と、
− 受信されて、予測コード化に従ってコード化された前記デジタル信号のサンプルの現フレームを予測復号に従って復号するステップ（Ｅ６０８）と
を含む方法において、前記現フレームの前記予測復号が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であることと、
− 前記予測復号の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップ（Ｅ６０６）と、
− 前記現フレームの予測復号によって合成された信号セグメントと、前記前のフレームの前記復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップ（Ｅ６０９）と
をさらに含むこととを特徴とする、方法。

【請求項2】

前記逆変換復号が、前記予測復号の処理遅延より小さい処理遅延を有することと、前記予測復号によって復号された前記現フレームの第１のセグメントが、前記前のフレームの前記逆変換復号から生じたセグメントと置き換えられ、前記前のフレームの前記逆変換復号から生じた前記セグメントのサイズが、前記予測復号と前記逆変換復号との間の遅延シフトに対応し、前記前のフレームの前記逆変換復号から生じた前記セグメントが、前記前のフレームの前記復号の間にメモリにおいて記憶されることとを特徴とする、請求項１に記載の復号方法。

【請求項3】

逆変換復号によって合成された前記信号セグメントが、以前に前記セグメントに適用されたウィンドウイングを補償する逆ウィンドウの適用によって、前記重畳加算ステップの前に補正されることを特徴とする、請求項１または２に記載の復号方法。

【請求項4】

逆変換復号によって合成された前記信号セグメントが、前記現フレームの前記復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされることを特徴とする、請求項１〜３のいずれか一項に記載の復号方法。

【請求項5】

前記予測復号の状態が、以下の状態のリスト：
− 前記予測復号の内部周波数でのリサンプリングのためのフィルタに対する状態メモリ、
− プリエンファシス／デエンファシスフィルタに対する状態メモリ、
− 線形予測フィルタの係数、
− 合成フィルタの状態メモリ、
− 前記適応辞書のメモリ、
− 低周波ポストフィルタの状態メモリ、
− 固定辞書利得に対する量子化メモリ
の中にあることを特徴とする、請求項１に記載の復号方法。

【請求項6】

前記現フレームに対する前記線形予測フィルタの前記係数の計算が、固有のフィルタの係数の復号によって、かつフレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに同一の係数を割り振ることによって実行されることを特徴とする、請求項５に記載の復号方法。

【請求項7】

前記現フレームに対する前記線形予測フィルタの前記係数の計算が、以下のステップ：
− フレーム終了時のフィルタの係数の復号済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数の復号済み値を決定するステップと、 − 前記フレーム開始時のフィルタの前記係数の復号済み値を前記フレーム半ばのフィルタの前記係数の前記復号済み値に置き換えるステップと、
− 前記フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの前記係数の前記このように復号された値を使用することによって、前記現フレームに対する前記線形予測フィルタの前記係数を決定するステップと
を含むことを特徴とする、請求項５に記載の復号方法。

【請求項8】

フレーム開始時の線形予測フィルタの係数が、長期予測フィルタ係数の平均値に相当する既定の値に再初期化されることと、前記現フレームに対する前記線形予測係数が、前記このように事前に決定された値およびフレーム終了時のフィルタの係数の復号済み値を使用することによって決定されることとを特徴とする、請求項５に記載の復号方法。

【請求項9】

デジタル音声信号をコード化するための方法であって、
− 変換コード化に従って前記デジタル信号のサンプルの前のフレームをコード化するステップ（Ｅ３０２）と、
− 予測コード化に従ってコード化すべき前記デジタル信号のサンプルの現フレームを受信するステップ（Ｅ３０８）と
を含む方法において、前記現フレームの前記予測コード化が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であることと、
− 前記予測コード化の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップ（Ｅ３０６）
をさらに含むこととを特徴とする、方法。

【請求項10】

線形予測フィルタの係数が、前記予測コード化の少なくとも１つの状態の一部を形成することと、前記現フレームに対する前記線形予測フィルタの前記係数の計算が、フレーム半ばまたはフレーム終了時のいずれかの単一の予測フィルタの係数のコード化済み値を決定することによって、かつフレーム開始時およびフレーム終了時またはフレーム半ばの予測フィルタの係数に対する同一のコード化済み値の割り振りを決定することによって実行されることとを特徴とする、請求項９に記載のコード化方法。

【請求項11】

前記予測コード化の少なくとも１つの状態が、直接的な方法でコード化されることを特徴とする、請求項１０に記載のコード化方法。

【請求項12】

線形予測フィルタの係数が、前記予測コード化の少なくとも１つの状態の一部を形成することと、前記現フレームに対する前記線形予測フィルタの前記係数の計算が、以下のステップ：
− フレーム終了時のフィルタの係数のコード化済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数のコード化済み値を決定するステップと、
− 前記フレーム開始時のフィルタの前記係数のコード化済み値を前記フレーム半ばのフィルタの前記係数の前記コード化済み値に置き換えるステップと、
− 前記フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの前記係数の前記このようにコード化された値を使用することによって、前記現フレームに対する前記線形予測フィルタの前記係数を決定するステップと
を含むこととを特徴とする、請求項９に記載のコード化方法。

【請求項13】

線形予測フィルタの係数が、前記予測コード化の少なくとも１つの状態の一部を形成することと、フレーム開始時の線形予測フィルタの係数が、長期予測フィルタ係数の平均値に相当する既定の値に再初期化されることと、前記現フレームに対する前記線形予測係数が、前記このように事前に決定された値およびフレーム終了時のフィルタの係数のコード化済み値を使用することによって決定されることとを特徴とする、請求項９に記載のコード化方法。

【請求項14】

デジタル音声信号デコーダであって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを復号することができる逆変換復号エンティティ（６０２）と、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを復号することができる予測復号エンティティ（６０８）と
を備えるデコーダにおいて、前記現フレームの前記予測復号が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であることと、
− 前記予測復号の少なくとも１つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール（６０６）と、
− 前記現フレームの予測復号によって合成された信号セグメントと、前記前のフレームの前記復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を実行することができる処理モジュール（６０９）と
をさらに備えることとを特徴とする、デコーダ。

【請求項15】

デジタル音声信号コーダであって、
− デジタル信号のサンプルの前のフレームをコード化することができる変換コード化エンティティ（３０２）と、
− 前記デジタル信号のサンプルの現フレームをコード化することができる予測コード化エンティティ（３０８）と
を備えるコーダにおいて、前記現フレームの前記予測コード化が、前記前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であることと、
− 前記予測コード化の少なくとも１つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール（３０６）
をさらに備えることとを特徴とする、コーダ。

【請求項16】

請求項１〜８のいずれか一項に記載の復号方法および／または請求項９〜１３のいずれか一項に記載のコード化方法のステップを実行するための命令を含むコンピュータプログラムを格納する、プロセッサによって読み取り可能な格納手段。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、デジタル信号のコード化の分野に関する。

【背景技術】

【0002】

本発明によるコード化は、特に、可聴周波数信号（語音、音楽または他のもの）などのデジタル音声信号の伝送および／または格納に適応している。

【0003】

本発明は、有利には、少なくとも２つのモードのコード化を交互に行い、そのアルゴリズム遅延が対話型アプリケーション（通常、≦４０ｍｓ）に適応しているマルチモード技法による語音、音楽および混合コンテンツ信号の統合コード化に適用される。

【0004】

語音を効果的にコード化するため、ＣＥＬＰ（「符号励振線形予測」）タイプまたはその変形形態のＡＣＥＬＰ（「代数符号励振線形予測」）の技法が提言され、ＢＶ１６、ＢＶ３２、ｉＬＢＣまたはＳＩＬＫコーダなどのＣＥＬＰコード化の代替形態も、ここ最近提案されている。他方では、楽音を効果的にコード化するために、変換コード化技法が提言されている。

【0005】

線形予測コーダ、およびより具体的には、ＣＥＬＰタイプのものは、予測コーダである。それらの目的は、次の要素、すなわち、声道をモデル化するための短期線形予測、有声時間帯の声帯の振動をモデル化するための長期予測、および、予測ではモデル化が可能ではなかった「イノベーション」を表すための一般的には固定辞書と呼ばれるベクトル量子化辞書から導き出される励振（白色雑音、代数励振）の少なくともいくつかの部分に基づいて語音の生成をモデル化することである。

【0006】

最もよく使用される変換コーダ（例えば、ＭＰＥＧＡＡＣまたはＩＴＵ−ＴＧ．７２２．１ＡｎｎｅｘＣコーダ）は、変換された領域において信号を圧縮するためにＭＤＣＴ（「修正離散変換」）タイプの臨界サンプリング変換を使用する。「臨界サンプリング変換」は、変換された領域における係数の数が分析された時間サンプルの数に等しい変換を指す。

【0007】

これらの２つのタイプのコンテンツを含む信号を効果的にコード化するためのソリューションは、最も良い技法を経時的に（フレーム単位で）選択することにある。このソリューションは、特に、ＡＭＲＷＢ＋（または拡張ＡＭＲ−ＷＢ）という名称の技法を通じて、またここ最近では、ＭＰＥＧ−ＨＵＳＡＣ（「統合語音音声コード化」）コーデックによって、３ＧＰＰ（「第３世代パートナーシッププロジェクト」）標準化団体によって提言されている。ＡＭＲ−ＷＢ＋およびＵＳＡＣによって構想されるアプリケーションは、対話型ではないが、アルゴリズム遅延に対する厳しい制約のない放送および格納サービスに相当する。

【0008】

ＵＳＡＣ規格は、（非特許文献１）で公開されている。

【0009】

例示として、ＲＭ０（参照モデル０）と呼ばれるＵＳＡＣコーデックの初期のバージョンについては、（非特許文献２）による論文で説明されている。このコーデックは、以下の少なくとも２つのモードのコード化を交互に行う。
・語音タイプの信号の場合：ＡＣＥＬＰ技法を使用するＬＰＤ（「線形予測領域」）モード
・音楽タイプの信号の場合：ＭＤＣＴ（「修正離散変換」）技法を使用するＦＤ（「周波数領域」）モード

【0010】

ＡＣＥＬＰおよびＭＤＣＴコード化の原理は、以下の通りである。

【0011】

一方では、ＣＥＬＰコード化（そのＡＣＥＬＰ変形形態を含む）は、ソースフィルタモデルに基づく予測コード化である。一般に、フィルタは、線形予測（線形予測コード化に対するＬＰＣ）によって得られる伝達関数１／Ａ（ｚ）を有する全極フィルタに相当する。実際には、合成は、フィルタ１／Ａ（ｚ）の量子化バージョン

【数1】

を使用する。ソース、すなわち、予測線形フィルタ

【数2】

の励振は、一般に、声帯の振動をモデル化する長期予測によって得られる励振と、雑音辞書などの代数コード（ＡＣＥＬＰ）の形態で説明される確率励振（またはイノベーション）との組合せである。「最適な」励振の検索は、
Ｗ（ｚ）＝Ａ（ｚ／γ１）／Ａ（ｚ／γ２）の形態の、線形予測フィルタＡ（ｚ）から一般に導き出される伝達関数Ｗ（ｚ）を有するフィルタによって重み付けされた信号の領域における二次誤差評価規範の最小化によって行われる。ＣＥＬＰモデルの多くの変形形態が提案され、ここでは、ＵＩＴ−ＴＧ．７１８規格のＣＥＬＰコード化（有声、無声、過渡音などに適応しているモードで、２つのＬＰＣフィルタがフレームごとに量子化され、ＬＰＣ励振が分類の関数としてコード化される）の例が記憶されることに留意されたい。その上、ＣＥＬＰコード化の代替形態もまた、依然として線形予測に基づくＢＶ１６、ＢＶ３２、ｉＬＢＣまたはＳＩＬＫコーダを含めて、提案されている。一般に、予測コード化（ＣＥＬＰコード化を含む）は、歴史および他の理由（広帯域線形予測限界、高周波に対するアルゴリズムの複雑性など）のために、制限されたサンプリング周波数（≦１６ｋＨｚ）で動作し、従って、通常の１６〜４８ｋＨｚの周波数で動作するため、リサンプリング操作（ＦＩＲフィルタ、フィルタバンクまたはＩＩＲフィルタによる）も使用され、任意選択により、パラメトリック帯域拡張であり得る高帯域に対する別個のコード化も使用される。これらのリサンプリングおよび高帯域コード化操作については、ここでは再検討しない。

【0012】

他方では、ＭＤＣＴ変換コード化は、コーダにおいて、以下の３つのステップ間で分割される。
１．２つのブロックに相当する長さにわたる「ＭＤＣＴウィンドウ」とここでは呼ばれるウィンドウによる信号の重み付け
２．低減されたブロック（長さを２で除する）を形成するための時間エイリアシング（または「時間領域エイリアシング」）
３．低減されたブロックのＤＣＴ−ＩＶ（「離散コサイン変換」）変換

【0013】

ＤＣＴ変換の代わりに、例えば、フーリエ変換（ＦＦＴ）を使用することができるＴＤＡＣ変換タイプの計算の変形形態に留意されたい。

【0014】

ＭＤＣＴウィンドウは、一般に、「クオータ」と呼ばれる等しい長さの４つの隣接部分に分割される。

【0015】

信号には分析ウィンドウが乗じられ、次いで、エイリアシングが実行される。第１のクオータ（窓関数を掛け合わせた）は第２のクオータにエイリアシングされ（すなわち、時間反転させ、重畳する）、第４のクオータは第３のクオータにエイリアシングされる。

【0016】

より正確には、あるクオータの別のクオータへのエイリアシングは、次の方法で実行される。第１のクオータの第１のサンプルが第２のクオータの最後のサンプルに加えられ（または第２のクオータの最後のサンプルから減じられ）、第１のクオータの第２のサンプルが第２のクオータの最後のサンプルの１つ前のサンプルに加えられ（または第２のクオータの最後のサンプルの１つ前のサンプルから減じられ）、第１のクオータの最後のサンプルが第２のクオータの第１のサンプルに加えられる（または第２のクオータの第１のサンプルから減じられる）まで、同じように続く。

【0017】

従って、４つのクオータから２つのエイリアシング済みクオータが得られ、各サンプルは、コード化すべき信号の２つのサンプルの線形結合の結果である。この線形結合は、時間エイリアシングと呼ばれる。時間エイリアシングは、２つの時間セグメントを混合させることに相当し、各「エイリアシング済みクオータ」における２つの時間セグメントの相対レベルは分析／合成ウィンドウに依存することに留意されたい。

【0018】

これらの２つのエイリアシング済みクオータは、その後、ＤＣＴ変換後に一緒にコード化される。次のフレームでは、ウィンドウ半分のシフトがあり（すなわち、５０％が重畳する）、前のフレームの第３および第４のクオータは、現フレームの第１および第２のクオータになる。エイリアシング後、前のフレームと同様に、同じ対のサンプルの第２の線形結合が送り出されるが、異なる重みが用いられる。

【0019】

従って、デコーダでは、逆ＤＣＴ変換後、これらのエイリアシング済み信号の復号バージョンが得られる。２つの連続フレームは、２つの同じクオータの２つの異なるエイリアシングの結果を含み、すなわち、各対のサンプルに対して、異なるが既知の重みを有する２つの線形結合の結果を有する。従って、入力信号の復号バージョンを得るために方程式系が解かれ、従って、２つの連続の復号済みフレームを使用して時間エイリアシングを省略することができる。

【0020】

言及される方程式系は、一般に、デエイリアシング、慎重に選ばれた合成ウィンドウの乗算、次いで、共通部分の重畳加算によって解かれる。この重畳加算により、同時に、２つの連続の復号済みフレーム間の緩やかな遷移（量子化誤差による不連続性のない）が保証され、この操作は、実際に、クロスフェードのように作用する。各サンプルに対して第１のクオータまたは第４のクオータのウィンドウがゼロにある場合には、ウィンドウのこの部分における時間エイリアシングがないＭＤＣＴ変換が挙げられる。この事例では、ＭＤＣＴ変換による緩やかな遷移は保証されず、例えば、外部のクロスフェードなどの他の手段によって行わなければならない。

【0021】

変換コード化（ＭＤＣＴタイプのコード化を含む）は、理論上、Ｇ．７２２．１コード化を含むＧ．７２２．１ａｎｎｅｘＣの組み合わされた実装形態によって示されるように、様々な入力および出力サンプリング周波数に容易に適応させることができるが、リサンプリング（ＦＩＲフィルタ、フィルタバンクまたはＩＩＲフィルタによる）による前／後処理操作を有する変換コード化を使用することも可能であり、任意選択により、パラメトリック帯域拡張であり得る高帯域の別個のコード化を使用することも可能である。これらのリサンプリングおよび高帯域コード化操作については、ここでは再検討しないが、３ＧＰＰｅ−ＡＡＣ＋コーダがそのような組合せの例示的な実施形態（リサンプリング、低帯域変換コード化および帯域拡張）を与える。

【0022】

様々なモードによってコード化された音響帯域（線形予測に基づく時間ＬＰＤ、変換に基づく周波数ＦＤ）は、選択されるモードおよびビットレートに応じて異なり得ることに留意すべきである。その上、モード決定は、各フレームに対して開ループで行うことができる（すなわち、決定は、データおよび利用可能な観察の関数として行うことができる）か、または、ＡＭＲ−ＷＢ＋コード化にあるような閉ループで優先される。

【0023】

少なくとも２つのモードのコード化を使用するコーデックでは、ＬＰＤモードとＦＤモードとの間の遷移は、ＦＤモードとＬＰＤモードとが異なる種類のものであることを知った上で（一方は、信号の周波数領域の変換コード化に依存し、他方は、各フレームで更新されるフィルタメモリを有する（時間）予測線形コード化を使用する）、スイッチング欠陥のない十分な質を保証する際に重要である。ＵＳＡＣＲＭ０コーデックに相当するモード間スイッチングを管理する例については、（非特許文献３）による論文で詳述されている。この論文で説明されるように、主な問題は、ＬＰＤモードからＦＤモードへ（逆もまた同様）の間の遷移にある。

【0024】

ＦＤタイプのコアとＬＰＤタイプのコアとの間の遷移の問題に対処するため、（特許文献１）の下で公開された特許出願（図１に示される）は、フレームｍをコード化するＦＤタイプ（１４０）のコーダおよびデコーダの合成を使用することによって（メモリの更新は、ＦＤタイプのフレームのコード化の間のみ必要である）、フレームｍ＋１をコード化するＬＰＤタイプ（１３０）のコーデックのフィルタのメモリを更新することを提案している。従って、ＬＰＤ技法でフレームをコード化する場合、ＣＥＬＰ（ＬＰＤ）コーダのメモリ（または状態）はフレームｍの再構築信号

【数3】

に基づいてジェネレータ１６０によって既に更新されているため、この技法は、１１０でのコード化のモードの選択の間およびＦＤタイプからＬＰＤタイプへのコード化のトグリング（１５０での）の間、遷移欠陥（アーチファクト）なしでそうすることを可能にする。２つのコア（ＦＤおよびＬＤＰ）が同じサンプリング周波数で動作しない事例では、（特許文献１）の特許出願で説明される技法は、ＦＤタイプのコーダのメモリをリサンプリングするステップを提案している。

【先行技術文献】

【特許文献】

【0025】

【特許文献1】国際公開第２０１３／０１６２６２号パンフレット

【非特許文献】

【0026】

【非特許文献1】ＩＳＯ／ＩＥＣｄｏｃｕｍｅｎｔ２３００３−３：２０１２，Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ−−ＭＰＥＧａｕｄｉｏｔｅｃｈｎｏｌｏｇｉｅｓ−−Ｐａｒｔ３：Ｕｎｉｆｉｅｄｓｐｅｅｃｈａｎｄａｕｄｉｏｃｏｄｉｎｇ

【非特許文献2】Ｍ．Ｎｅｕｅｎｄｏｒｆｅｔａｌ．，ＡＮｏｖｅｌＳｃｈｅｍｅｆｏｒＬｏｗＢｉｔｒａｔｅＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｉｎｇ−ＭＰＥＧＲＭ０，７−１０Ｍａｙ２００９，１２６ｔｈＡＥＳＣｏｎｖｅｎｔｉｏｎ

【非特許文献3】Ｊ．Ｌｅｃｏｍｔｅｅｔａｌ．，“Ｅｆｆｉｃｉｅｎｔｃｒｏｓｓ−ｆａｄｅｗｉｎｄｏｗｓｆｏｒｔｒａｎｓｉｔｉｏｎｓｂｅｔｗｅｅｎＬＰＣ−ｂａｓｅｄａｎｄｎｏｎ−ＬＰＣｂａｓｅｄａｕｄｉｏｃｏｄｉｎｇ”，７−１０Ｍａｙ２００９，１２６ｔｈＡＥＳＣｏｎｖｅｎｔｉｏｎ

【0027】

この技法の欠点は、一方では、コーダにおいて復号済み信号にアクセスを有せざるを得ないことであり、従って、コーダでの局所合成が強要されることである。他方では、ＦＤタイプのコード化および復号の間のフィルタのメモリを更新する操作（恐らくは、リサンプリングステップを含む）ならびにＦＤタイプの前のフレームにおけるＣＥＬＰタイプの分析／コード化の実行に達する一連の操作を行わざるを得ないことである。これらの操作は、複雑であり、ＬＰＤタイプの遷移フレームにおけるコード化／復号の従来の操作と重畳し、それにより、「マルチモード」コード化複雑性スパイクを起こす。

【発明の概要】

【発明が解決しようとする課題】

【0028】

従って、語音および音楽の入れ替わりを呈する音声コード化の対話型アプリケーションのために提供されるコーダまたはデコーダの複雑性の増大を必要としない、変換コード化または復号と予測コード化または復号との間の効果的な遷移を得る必要性が存在する。

【課題を解決するための手段】

【0029】

本発明はこの状況を改善する。

【0030】

この目的のために、デジタル音声信号を復号するための方法であって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップと、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを予測復号に従って復号するステップと
を含む方法を提案する。方法は、現フレームの予測復号が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であり、および
− 予測復号の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップと、
− 現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップと
をさらに含むようなものである。

【0031】

従って、状態の再初期化は、前のフレームの復号済み信号の必要性なしで実行され、既定のまたはゼロの定数値を通じて非常に簡単な方法で実行される。従って、デコーダの複雑性は、分析または他の計算を必要とする状態メモリを更新するための技法に関して減少する。次いで、遷移アーチファクトは、前のフレームとのリンクをつなげることを可能にする重畳加算ステップの実装によって回避される。

【0032】

遷移予測復号を用いることで、適応辞書のメモリは使用されないため、この現フレームに対して適応辞書のメモリを再初期化する必要はなくなる。これにより、遷移の実装がさらに簡素化される。

【0033】

特定の実施形態では、逆変換復号は、予測復号の処理遅延より小さい処理遅延を有し、および予測復号によって復号された現フレームの第１のセグメントは、前のフレームの復号の間のメモリにおける遅延シフトおよび配置に相当する前のフレームの復号から生じたセグメントと置き換えられる。

【0034】

これにより、有利には、遷移の質を改善するためにこの遅延シフトを使用することが可能になる。

【0035】

特定の実施形態では、逆変換復号によって合成された信号セグメントは、以前にセグメントに適用されたウィンドウイングを補償する逆ウィンドウの適用によって、重畳加算ステップの前に補正される。

【0036】

従って、復号済み現フレームは、オリジナル信号のものに近いエネルギーを有する。

【0037】

異なる実施形態では、逆変換復号によって合成された信号セグメントは、現フレームの復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされる。

【0038】

これにより、変換復号のサンプリング周波数が予測復号のものと異なる事例において、欠陥なしで遷移を実行することが可能になる。

【0039】

本発明の一実施形態では、予測復号の状態は、以下の状態のリスト：
− 予測復号の内部周波数でのリサンプリングのためのフィルタに対する状態メモリ、
− プリエンファシス／デエンファシスフィルタに対する状態メモリ、
− 線形予測フィルタの係数、
− 合成フィルタの状態メモリ（事前増強された領域における）、
− 適応辞書のメモリ（過去の励振）、
− 低周波ポストフィルタ（ＬＰＦ）の状態メモリ、
− 固定辞書利得に対する量子化メモリ
の中にある。

【0040】

これらの状態は、予測復号を実装するために使用される。これらの状態のほとんどは、ゼロの値または既定の定数値に再初期化され、それにより、このステップの実装がさらに簡素化される。しかし、このリストは網羅的ではなく、この再初期化ステップにおいて他の状態を考慮できることが非常に明らかである。

【0041】

本発明の特定の実施形態では、現フレームに対する線形予測フィルタの係数の計算は、固有のフィルタの係数の復号によって、かつフレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに同一の係数を割り振ることによって実行される。

【0042】

実際に、線形予測フィルタの係数が再初期化されているため、フレーム開始時の係数は知られていない。次いで、復号済み値を使用して、完全なフレームに対する線形予測フィルタの係数が得られる。従って、これは、復号済み音声信号に著しい劣化をもたらすことなく、いまだ簡単な方法で実行される。

【0043】

異なる実施形態では、現フレームに対する線形予測フィルタの係数の計算は、以下のステップ：
− フレーム終了時のフィルタの係数の復号済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数の復号済み値を決定するステップと、
− フレーム開始時のフィルタの係数の復号済み値をフレーム半ばのフィルタの係数の復号済み値に置き換えるステップと、
− フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの係数のこのように復号された値を使用することによって、現フレームに対する線形予測フィルタの係数を決定するステップと
を含む。

【0044】

従って、フレーム半ばのフィルタに相当する係数は、より低い誤差で復号される。

【0045】

別の異なる実施形態では、フレーム開始時の線形予測フィルタの係数は、長期予測フィルタ係数の平均値に相当する既定の値に再初期化され、および現フレームに対する線形予測係数は、このように事前に決定された値およびフレーム終了時のフィルタの係数の復号済み値を使用することによって決定される。

【0046】

従って、フレーム開始時の係数は、既定の値で知られていると考えられる。これにより、より正確な方法で完全なフレームの係数を回収することと、より急速に予測復号を安定させることとが可能になる。

【0047】

可能な実施形態では、事前に決定されたデフォルト値は、復号すべきフレームのタイプに依存する。

【0048】

従って、復号は、復号すべき信号によく適応している。

【0049】

また、本発明は、デジタル音声信号をコード化するための方法であって、
− 変換コード化に従ってデジタル信号のサンプルの前のフレームをコード化するステップと、
− 予測コード化に従ってコード化すべきデジタル信号のサンプルの現フレームを受信するステップと
を含む方法にも関する。方法は、現フレームの予測コード化が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であり、および
− 予測コード化の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップ
をさらに含むようなものである。

【0050】

従って、状態の再初期化は、前のフレームの信号の再構築ひいては局所復号の必要性なしで実行される。状態の再初期化は、既定のまたはゼロの定数値を通じて非常に簡単な方法で実行される。従って、コード化の複雑性は、分析または他の計算を必要とする状態メモリを更新するための技法に関して減少する。

【0051】

遷移予測コード化を用いることで、適応辞書のメモリは使用されないため、この現フレームに対して適応辞書のメモリを再初期化する必要はなくなる。これにより、遷移の実装がさらに簡素化される。

【0052】

特定の実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも１つの状態の一部を形成し、および現フレームに対する線形予測フィルタの係数の計算は、フレーム半ばまたはフレーム終了時の単一の予測フィルタの係数のコード化済み値を決定することによって、かつフレーム開始時およびフレーム終了時またはフレーム半ばの予測フィルタの係数に対する同一のコード化済み値の割り振りを決定することによって実行される。

【0053】

実際に、線形予測フィルタの係数が再初期化されているため、フレーム開始時の係数は知られていない。次いで、コード化済み値を使用して、完全なフレームに対する線形予測フィルタの係数が得られる。従って、これは、コード化済み音声信号に著しい劣化をもたらすことなく、いまだ簡単な方法で実行される。

【0054】

従って、有利には、予測コード化の少なくとも１つの状態は、直接的な方法でコード化される。

【0055】

実際に、フレーム半ばまたはフレーム開始時のフィルタの一連の係数のコード化のために通常保存されるビットは、例えば、デエンファシスフィルタのメモリなど、例えば、予測コード化の少なくとも１つの状態を直接的な方法でコード化するために使用される。

【0056】

異なる実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも１つの状態の一部を形成し、および現フレームに対する線形予測フィルタの係数の計算は、以下のステップ：
− フレーム終了時のフィルタの係数のコード化済み値およびフレーム開始時のフィルタの係数の既定の再初期設定値を使用することによって、フレーム半ばのフィルタの係数のコード化済み値を決定するステップと、
− フレーム開始時のフィルタの係数のコード化済み値をフレーム半ばのフィルタの係数のコード化済み値に置き換えるステップと、
− フレーム終了時、フレーム半ば、およびフレーム開始時のフィルタの係数のこのようにコード化された値を使用することによって、現フレームに対する線形予測フィルタの係数を決定するステップと
を含む。

【0057】

従って、フレーム半ばのフィルタに相当する係数は、より小さいパーセンテージ誤差でコード化される。

【0058】

異なる実施形態では、線形予測フィルタの係数は、予測コード化の少なくとも１つの状態の一部を形成し、およびフレーム開始時の線形予測フィルタの係数は、長期予測フィルタ係数の平均値に相当する既定の値に再初期化され、および現フレームに対する線形予測係数は、このように事前に決定された値およびフレーム終了時のフィルタの係数のコード化済み値を使用することによって決定される。

【0059】

従って、フレーム開始時の係数は、既定の値で知られていると考えられる。これにより、完全なフレームの予測係数を計算するために、追加の分析なしで、前のフレームの予測係数の良い推定を得ることが可能になる。

【0060】

可能な実施形態では、事前に決定されたデフォルト値は、コード化すべきフレームのタイプに依存する。

【0061】

また、本発明は、デジタル音声信号デコーダであって、
− 受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを復号することができる逆変換復号エンティティと、
− 受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを復号することができる予測復号エンティティと
を備えるデコーダにも関する。デコーダは、現フレームの予測復号が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測復号であり、および
− 予測復号の少なくとも１つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュールと、
− 現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を実行することができる処理モジュールと
をさらに備えるようなものである。

【0062】

同様に、本発明は、デジタル音声信号コーダであって、
− デジタル信号のサンプルの前のフレームをコード化することができる変換コード化エンティティと、
− デジタル信号のサンプルの現フレームをコード化することができる予測コード化エンティティと
を備えるコーダにも関する。コーダは、現フレームの予測コード化が、前のフレームから生じたいかなる適応辞書も使用しない遷移予測コード化であり、および
− 予測コード化の少なくとも１つの状態を事前に決定されたデフォルト値によって再初期化することができる再初期化モジュール
をさらに備えるようなものである。

【0063】

デコーダおよびコーダは、それぞれが実装する復号およびコード化方法と同じ利点をもたらす。

【0064】

最後に、本発明は、これらの命令がプロセッサによって実行される際に、上記に説明されるものなどの復号方法および／または上記に説明されるものなどのコード化方法のステップを実装するためのコード命令を含むコンピュータプログラムに関する。

【0065】

また、本発明は、上記に説明されるものなどの復号方法および／またはコード化方法を実装するコンピュータプログラムを格納する、プロセッサによって読み取り可能であり、デコーダまたはコーダに組み込むことができ、任意選択により取り外し可能な格納手段にも関する。

【0066】

本発明の他の特性および利点は、以下で詳述する説明および添付の図を調査することで明らかになるであろう。

【図面の簡単な説明】

【0067】

【図1】最先端のおよび上記に説明される変換コード化と予測コード化との間の遷移のプロセスを示す。

【図2】本発明の実装形態による、変換コード化に従ってコード化されたフレームと予測コード化に従ってコード化されたフレームとの間のコーダにおける遷移を示す。

【図3】本発明による、コード化方法およびコーダの実施形態を示す。

【図4】現フレームの予測コード化の間に線形予測フィルタの係数を決定するために、特定の実施形態でステップが実装されるフローチャートの形態を示し、前のフレームは変換コード化に従ってコード化されている。

【図5】本発明の実装形態による、逆変換復号に従って復号されたフレームと予測復号に従って復号されたフレームとの間のデコーダにおける遷移を示す。

【図6】本発明による、復号方法およびデコーダの実施形態を示す。

【図7】現フレームの予測復号の間に線形予測フィルタの係数を決定するために、本発明の実施形態でステップが実装されるフローチャートの形態を示し、前のフレームは逆変換復号に従って復号されている。

【図8】本発明の実施形態による、復号の間に実装される重畳加算ステップを示す。

【図9】異なる遅延を有する場合の変換復号と予測復号との間の遷移の実装形態の特定のモードを示す。

【図10】本発明による、コーダまたはデコーダのハードウェア実施形態を示す。

【発明を実施するための形態】

【0068】

図２は、本発明による、変換コード化と予測コード化との間の遷移間のコード化の原理を概略的に示す。

【0069】

ここでは、例えば、ＭＤＣＴタイプの変換コーダ（ＦＤ）で、または、例えば、ＡＣＥＬＰタイプの予測コーダ（ＬＰＤ）でコード化すべき音声フレームの連続が考慮されている。本発明に影響を及ぼすことなく、追加のコード化モードが可能であることに留意されたい。この例では、変換コーダ（ＦＤ）は、「テューキー」タイプの小さい遅延を有するウィンドウを使用し（本発明は、使用されるウィンドウのタイプとは無関係である）、その全長は、図で表されるように、２つのフレーム（ゼロの値を含む）に等しい。

【0070】

コード化の間、ＦＤコーダのウィンドウは、ウィンドウの最後のゼロではない部分（右側）が入力信号の新しいフレーム終了時と一致するように同期化される。図２に示されるようなフレームへの分裂は、「ルックアヘッド」（または将来の信号）を含み、従って、実際にコード化されたフレームは、図５に関連してさらに説明されるように、通常、時間がシフト（遅延）されることに留意されたい。遷移がない場合、コーダは、エイリアシングおよびＤＣＴ変換手順（最先端（ＭＤＣＴ）において説明されるものなど）を実行する。ＬＰＤタイプのコーダによってコード化すべきフレームの到着時、ウィンドウは適用されず、ＬＰＤコーダのフィルタに相当する状態またはメモリが既定の値に再初期化される。

【0071】

ここでは、ＬＰＤコーダは、ＣＥＬＰコード化が１２．８ｋＨｚの内部周波数で動作するＵＩＴ−ＴＧ．７１８コーダから導き出されると考えられる。本発明によるＬＰＤコーダは、ビットレートに従って、２つの内部周波数１２．８ｋＨｚまたは１６ｋＨｚで動作することができる。

【0072】

予測コード化（ＬＰＤ）の状態は、少なくとも以下の状態を含意する。
・ＣＥＬＰコード化の内部周波数（１２．８または１６ｋＨｚ）での入力周波数ｆｓに対するリサンプリングフィルタの状態メモリ。ここでは、ＦＩＲタイプの実施形態が過去の入力信号に相当する状態メモリの使用を簡素化すると知った上で、リサンプリングは、ＦＩＲフィルタ、フィルタバンクまたはＩＩＲフィルタによる入力周波数および内部周波数の関数として実行することができると考えられる。
・プリエンファシスフィルタ（１−αｚ^−１、一般に、α＝０．６８）およびデエンファシスフィルタ（１／（１−αｚ^−１））の状態メモリ。
・前のフレーム終了時の線形予測フィルタの係数、または、ＬＳＦ（「線スペクトル周波数」）もしくはＩＳＦ（「イミタンススペクトル周波数」）領域などの領域におけるそれらの等しいバージョン。
・通常の１６次のＬＰＣ合成フィルタの状態メモリ（事前増強された領域における）。
・適応辞書のメモリ（過去のＣＥＬＰ励振）。
・規格ＵＩＴ−Ｇ．７１８で定義されるような低周波ポストフィルタ（ＬＰＦ）の状態メモリ（規格ＵＩＴ−ＴＧ．７１８の条項７．１４．１．１を参照）。
・固定辞書利得に対する量子化メモリ（この量子化がメモリで実行される場合）。

【0073】

図３は、本発明による、コーダおよびコード化方法の実施形態を示す。

【0074】

特定の実施形態は、ＭＤＣＴを使用するＦＤ変換コーデックとＡＣＥＬＰタイプの予測コーデックとの間の遷移のフレームワーク内に存在する。

【0075】

モジュール３０１によるフレームへの配置の第１の従来のステップ（Ｅ３０１）の後、決定モジュール（ｄｅｃ．）は、処理すべきフレームをＡＣＥＬＰ予測コード化によってコード化すべきかまたはＦＤ変換コード化によってコード化すべきかを判断する。

【0076】

変換コード化の事例では、ＭＤＣＴ変換の完全なステップ（Ｅ３０２）は、変換コード化エンティティ３０２によって実行される。このステップは、とりわけ、図２に示されるように位置合わせされた低ラグウィンドウで窓関数を掛け合わせるステップ、エイリアシングのステップ、および、ＤＣＴ領域における変換のステップを含む。その後、フレームＦＤは、ステップ（Ｅ３０３）において、量子化モジュール３０３によって量子化され、次いで、このように符号化されたデータは、Ｅ３０５において、ビットストリーム構築モジュール３０５によってビットストリームで記載される。

【0077】

予測コード化から変換コード化への遷移の事例は、本発明の対象物を形成しないため、この例では取り扱わない。

【0078】

決定ステップ（ｄｅｃ．）がＡＣＥＬＰ予測コード化を選んだ場合は、
・前のフレーム（最後のＡＣＥＬＰ）もまたＡＣＥＬＰコード化エンティティ３０４によって符号化されていれば、予測コード化のメモリまたは状態を更新する間、ＡＣＥＬＰコード化（Ｅ３０４）が続行される。ここでは、ＣＥＬＰコード化の内部サンプリング周波数のスイッチング（１２．８から１６ｋＨｚへ、逆もまた同様）の問題に対処しない。コード化および量子化された情報は、ステップＥ３０５において、ビットストリームで記載される。
・あるいは、前のフレーム（最後のＭＤＣＴ）がＥ３０２において変換コード化エンティティ３０２によって符号化されていれば、この場合、ＡＣＥＬＰ予測コード化のメモリまたは状態は、ステップ（Ｅ３０６）において、予め事前に決定されたデフォルト値（必ずしもゼロであるとは限らない）に再初期化される。この再初期化ステップは、再初期化モジュール３０６によって、予測コード化の少なくとも１つの状態に対して実装される。次いで、Ｅ３０８において、予測コード化エンティティ３０８によって現フレームに対する予測コード化のステップが実装される。コード化および量子化された情報は、ステップＥ３０５において、ビットストリームで記載される。

【0079】

この予測コード化Ｅ３０８は、特定の実施形態では、規格ＵＩＴ−ＴＧ．７１８で「ＴＣモード」という名称で定義されるものなどの遷移コード化であり得、この遷移コード化では、励振のコード化は、直接的なものであり、前のフレームから生じたいかなる適応辞書も使用しない。次いで、励振のコード化（前のフレームとは無関係である）が行われる。この実施形態により、ＬＰＤタイプの予測コーダをはるかに急速に安定させることが可能になる（ゼロに設定される適応辞書を使用するであろう従来のＣＥＬＰコード化に関して）。これは、本発明による遷移の実装形態をさらに簡素化する。

【0080】

本発明の変形形態では、励振のコード化を遷移モードにしないが、Ｇ．７１８と同様の方法でＣＥＬＰコード化を使用し、恐らくは、適応辞書を使用するか（分類を強要することも制限することもなく）、または、適応および固定辞書を有する従来のＣＥＬＰコード化を使用することが可能となる。しかし、適応辞書が再計算もゼロへの設定もされておらず、コード化は準最適であるため、この変形形態はあまり有利ではない。

【0081】

別の変形形態では、ＴＣモードによる遷移フレームにおけるＣＥＬＰコード化は、例えば、ｉＬＢＣタイプのコード化モデルを使用することによって、前のフレームとは無関係の他のタイプのコード化と置き換えることができる。

【0082】

特定の実施形態では、現フレームに対する線形予測フィルタの係数を計算するステップＥ３０７は、計算モジュール３０７によって実行される。

【0083】

線形予測フィルタの係数の計算のいくつかのモードが現フレームに対して可能である。ここでは、予測コード化（ブロック３０４）は、規格Ｇ．７１８にあるように、フレーム終了時（ＮＥＷ）に得られるＩＳＦ（または等しい方法でのＬＳＦ）という形態のＬＰＣ係数のコード化およびフレーム半ば（ＭＩＤ）で得られたＬＰＣ係数の非常に低減されたビットレートコード化で、前のフレーム終了時（ＯＬＤ）のＬＰＣ係数と現フレーム（ＭＩＤおよびＮＥＷ）のものとの間のサブフレームによる補間で、フレームごとに２回の線形予測分析を実行すると考えられる。

【0084】

第１の実施形態では、ＦＤコーダではＬＰＣ係数はコード化されないため、ＦＤタイプの前のフレーム（ＯＬＤ）における予測係数は知られていない。次いで、フレーム半ば（ＭＩＤ）またはフレーム終了時（ＮＥＷ）に相当する線形予測フィルタの単一の係数セットをコード化することを選択する。この選択は、例えば、コード化すべき信号の分類に従って行うことができる。安定した信号の場合、フレーム半ばのフィルタを選択することが可能となる。また、任意の選択を行うこともできる。選択がフレーム半ばのＬＰＣ係数に関する事例では、変形形態において、ＬＰＣ係数の補間（ＩＳＰ（「イミタンススペクトルペア」）領域またはＬＳＰ（「線スペクトルペア」）領域における）は、遷移ＬＰＤフレームに続く第２のＬＰＤフレームにおいて修正することができる。得られたこれらのコード化済み値に基づいて、同一のコード化済み値は、行った選択に従って、フレーム開始時（ＯＬＤ）の予測フィルタの係数およびフレーム終了時またはフレーム半ばの予測フィルタ係数に割り振られる。実際に、前のフレーム（ＯＬＤ）のＬＰＣ係数は知られていないため、Ｇ．７１８にあるように、フレーム半ば（ＭＩＤ）のＬＰＣ係数をコード化することは可能ではない。この変形形態では、これらの係数は使用されないため、ＬＰＣ係数（ＯＬＤ）の再初期化が絶対に必要とは限らないことに留意されたい。この事例では、各サブフレームにおいて使用される係数は、フレームにおいてコード化された値と同一の方法で固定される。

【0085】

有利には、一連のフレーム半ば（ＭＩＤ）またはフレーム開始時のＬＰＣ係数のコード化のために保存できるビットは、例えば、予測コード化の少なくとも１つの状態（例えば、デエンファシスフィルタのメモリ）を直接的な方法でコード化するために使用される。

【0086】

第２の可能な実施形態では、図４に示されるステップが実装される。第１のステップＥ４０１は、例えば、ＬＳＰ係数に対する先験的な学習ベースにわたる長期平均値に応じた、すなわち、既定の値への、予測フィルタの係数および図３のステップＥ３０６の実装形態によるＩＳＦまたはＬＳＦ表現の均等物の初期化である。ステップＥ４０２は、フレーム終了時のフィルタの係数（ＬＳＰＮＥＷ）をコード化し、Ｅ４０３において、フレーム半ばの予測フィルタの係数（ＬＳＰＭＩＤ）をコード化するために、得られたコード化済み値（ＬＥＰＮＥＷＱ）およびフレーム開始時のフィルタの係数（ＬＳＰＯＬＤ）の既定の再初期設定値が使用される。フレーム開始時の係数（ＬＳＰＯＬＤ）の値をフレーム半ばの係数のコード化済み値（ＬＳＰＭＩＤＱ）に置き換えるステップＥ４０４が実行される。ステップＥ４０５は、このようにコード化されたこれらの値（ＬＳＰＯＬＤ、ＬＳＰＭＩＤＱ、ＬＳＰＮＥＷＱ）に基づいて現フレームに対する線形予測フィルタの係数を決定することを可能にする。

【0087】

第３の可能な実施形態では、前のフレームに対する線形予測フィルタの係数（ＬＳＰＯＬＤ）は、ＬＰＣタイプのスペクトルエンベロープを使用するＦＤコーダ変形形態において既に「無償で」利用可能な値に初期化される。この事例では、Ｇ．７１８で使用されるものなどの「通常の」コード化を使用することが可能となり、サブフレームベースの線形予測係数は、予測フィルタ（ＯＬＤ、ＭＩＤおよびＮＥＷ）の値間の補間として計算され、従って、この操作により、ＬＰＤコーダは、追加の分析なしで、前のフレームのＬＰＣ係数の良い推定が得られるようになる。

【0088】

本発明の他の変形形態では、ＬＰＤのコード化は、デフォルトでは、一連のＬＰＣ係数（ＮＥＷ）のみをコード化することができ、上記の異なる実施形態は、単に、フレーム半ば（ＭＩＤ）では一連の係数が利用不可能であることを考慮するように適応される。

【0089】

本発明の異なる実施形態では、予測コード化の状態の初期化は、例えば、符号化すべき様々なタイプのフレームに相当し得る、予め事前に決定されたデフォルト値で実行することができる（例えば、初期設定値は、フレームが有声または無声タイプの信号を含む場合は異なり得る）。

【0090】

図５は、本発明による、本発明による、変換復号と予測復号との間の遷移間の復号の原理を概略的に示す。

【0091】

ここでは、例えば、ＭＤＣＴタイプの変換デコーダ（ＦＤ）で、または、例えば、ＡＣＥＬＰタイプの予測デコーダ（ＬＰＤ）で復号すべき音声フレームの連続が考慮されている。この例では、変換デコーダ（ＦＤ）は、「テューキー」タイプの小さい遅延の合成ウィンドウを使用し（本発明は、使用されるウィンドウのタイプとは無関係である）、その全長は、図で表されるように、２つのフレーム（ゼロの値を含む）に等しい。

【0092】

本発明の意味の範囲内では、ＦＤコーダでコード化されたフレームの復号後、逆ＤＣＴ変換が復号済みフレームに適用される。後者は、デエイリアシングされ、次いで、合成ウィンドウがデエイリアシング済み信号に適用される。ＦＤコーダの合成ウィンドウは、ウィンドウのゼロではない部分（左側）が新しいフレームと一致するように同期化される。従って、フレームは、ポイントＡまで復号することができるが、その理由は、このポイントの前は、信号はいかなる時間エイリアシングも有さないためである。

【0093】

ＬＰＤフレームの到着の瞬間には、コーダにおける場合と同じように、予測復号の状態またはメモリが既定の値に再初期化される。

【0094】

予測復号（ＬＰＤ）の状態は、少なくとも以下の状態を含意する。
・出力周波数ｆｓでのＣＥＬＰ復号の内部周波数（１２．８または１６ｋＨｚ）に対するリサンプリングフィルタの状態メモリ。ここでは、ＦＩＲタイプの実施形態が過去の入力信号に相当する状態メモリの使用を簡素化すると知った上で、リサンプリングは、ＦＩＲフィルタ、フィルタバンクまたはＩＩＲフィルタによる入力周波数および内部周波数の関数として実行することができると考えられる。
・デエンファシスフィルタ（１／（１−αｚ^−１））の状態メモリ。
・前のフレーム終了時の線形予測フィルタの係数、または、ＬＳＦ（「線スペクトル周波数」）もしくはＩＳＦ（「イミタンススペクトル周波数」）領域などの領域におけるそれらの等しいバージョン。
・通常の１６次のＬＰＣ合成フィルタの状態メモリ（事前増強された領域における）。
・適応辞書のメモリ（過去の励振）。
・規格ＵＩＴ−Ｇ．７１８で定義されるような低周波ポストフィルタ（ＬＰＦ）の状態メモリ（規格ＵＩＴ−ＴＧ．７１８の条項７．１４．１．１を参照）。
・固定辞書利得に対する量子化メモリ（この量子化がメモリで実行される場合）。

【0095】

図６は、本発明による、デコーダおよび復号方法の実施形態を示す。

【0096】

特定の実施形態は、ＭＤＣＴを使用するＦＤ変換コーデックとＡＣＥＬＰタイプの予測コーデックとの間の遷移のフレームワーク内に存在する。

【0097】

モジュール６０１によるバイナリトレインにおける読み取りの第１の従来のステップ（Ｅ６０１）の後、決定モジュール（ｄｅｃ．）は、処理すべきフレームをＡＣＥＬＰ予測復号によって復号すべきかまたはＦＤ変換復号によって復号すべきかを判断する。

【0098】

ＭＤＣＴ変換復号の事例では、変換復号エンティティ６０２による復号のステップＥ６０２は、変換された領域におけるフレームを得ることを可能にする。また、ステップは、ＡＣＥＬＰデコーダのサンプリング周波数でのリサンプリングのステップも含み得る。このステップの後には、逆ＤＣＴ変換、時間デエイリアシングおよび合成ウィンドウの適用を含む逆ＭＤＣＴ変換Ｅ６０３が続き、図８を参照して後に説明されるような前のフレームとの重畳加算ステップが続く。

【0099】

時間エイリアシングがキャンセルされた部分は、ステップＥ６０５において、フレーム配置モジュール６０５によってフレームに配置される。時間エイリアシングを含む部分は、次のフレームがあればそれをＦＤコアによって復号した状態で処理モジュール６０９によってＥ６０９における重畳加算ステップを行うためにメモリ（ＭＤＣＴＭｅｍ．）に保持される。変形形態では、重畳加算ステップで使用されるＭＤＣＴ復号の格納された部分は、例えば、十分に著しい時間シフトがＭＤＣＴ復号とＣＥＬＰ復号との間に存在する事例では、いかなる時間エイリアシングも含まない。

【0100】

このステップは、図８に示されている。この図では、時間的な不連続性がＦＤから生じた復号とＬＰＤから生じた復号との間に存在することが見られる。ステップＥ６０９は、上記で説明されるものなどの変換コーダのメモリ（ＭＤＣＴＭｅｍ．）、すなわち、ポイントＡ以降に復号されるが、エイリアシングを含む信号（示される事例における）を使用する。

【0101】

優先的には、信号は、変換のエイリアシングのポイントであるポイントＢまで使用される。特定の実施形態では、この信号は、セグメントＡＢにわたって以前に適用されたウィンドウを逆にすることによって事前に補償される。従って、重畳加算ステップの前に、セグメントＡＢは、セグメントに以前に適用されたウィンドウイングを補償する逆ウィンドウの適用によって補正される。従って、セグメントは、もはや「窓関数を掛け合わせる」ことなく、そのエネルギーは、オリジナル信号のものに近い。

【0102】

変換復号から生じたものおよび予測復号から生じたものである２つのセグメントＡＢは、その後、最終的な信号ＡＢを得るために、重み付けされ、総和される。重み関数は、優先的には、１に等しい総和を有する（例えば、二次正弦または線形タイプ）。従って、重畳加算ステップは、現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する。

【0103】

別の特定の実施形態では、リサンプリングが未だ実行されていない事例（例えば、Ｅ６０２）では、ＦＤタイプの逆変換復号によって合成された信号セグメントは、ＬＰＤタイプの現フレームの復号済み信号セグメントに相当するサンプリング周波数で事前にリサンプリングされる。ＭＤＣＴメモリのこのリサンプリングは、ＦＩＲタイプのフィルタ、フィルタバンクもしくはＩＩＲフィルタによってまたは実際に「スプライン」を使用することによって、従来の技法を用いて、遅延ありまたは遅延なしで行うことができる。

【0104】

逆の事例では、ＦＤおよびＬＰＤコード化モードが異なる内部サンプリング周波数で動作する場合は、代替形態では、ＣＥＬＰコード化の合成をリサンプリングすること（任意選択により、特に、推定されたまたはコード化された高帯域を加えて後処理される）、および本発明を適用することが可能となる。ＬＰＤコーダの合成のこのリサンプリングは、ＦＩＲタイプのフィルタ、フィルタバンクもしくはＩＩＲフィルタによってまたは実際に「スプライン」を使用することによって、従来の技法を用いて、遅延ありまたは遅延なしで行うことができる。

【0105】

これにより、変換復号のサンプリング周波数が予測復号のものと異なる事例において、欠陥なしで遷移を実行することが可能になる。

【0106】

特定の実施形態では、ＦＤデコーダがＣＥＬＰ（ＬＰＤ）デコーダより少ないラグを有する場合は、２つのデコーダを時間的に位置合わせするために、中間的な遅延ステップ（Ｅ６０４）を適用することが可能である。次いで、そのサイズが２つのデコーダ間のラグに相当する信号部分がメモリ（Ｍｅｍ．ｄｅｌａｙ）に格納される。

【0107】

図９は、この例示的な事例について描写する。ここでは、実施形態は、ＬＰＤ予測復号から生じた第１のセグメントＤをＦＤ変換復号から生じたものと置き換え、上記に説明されるものなど、セグメントＡＢ上での重畳加算ステップ（Ｅ６０９）に着手するために、このラグＤの違いを有利に活用することを提案する。従って、逆変換復号が予測復号の処理遅延より小さい処理遅延を有する場合、予測復号によって復号された現フレームの第１のセグメントは、前のフレームの復号の間のメモリにおける遅延シフトおよび配置に相当する前のフレームの復号から生じたセグメントと置き換えられる。

【0108】

図６において、ＡＣＥＬＰ予測復号をする必要があることを決定（ｄｅｃ．）が示す場合は、
・最後に復号されたフレーム、すなわち、前のフレーム（最後のＡＣＥＬＰ）もまたＡＣＥＬＰ復号エンティティ６０３によってＡＣＥＬＰ予測復号に従って復号されていれば、ステップ（Ｅ６０３）において、予測復号が続行され、Ｅ６０５において、音声フレームが生成される。
・あるいは、前のフレーム（最後のＭＤＣＴ）がＥ６０２において変換復号エンティティ６０２によって復号されていれば、この場合、ＡＣＥＬＰ予測復号の状態の再初期化ステップ（Ｅ６０６）が適用される。この再初期化ステップは、再初期化モジュール６０６によって、予測復号の少なくとも１つの状態に対して実装される。再初期設定値は、予め事前に決定されたデフォルト値（必ずしもゼロであるとは限らない）である。ＬＰＤ復号の状態の初期化は、例えば、符号化の間に行われたものの関数として復号すべき様々なタイプのフレームに相当し得る、予め事前に決定されたデフォルト値で行うことができる。

【0109】

次いで、上記に説明される重畳加算ステップ（Ｅ６０９）の前に、Ｅ６０８において、現フレームに対する予測復号のステップは、予測復号エンティティ６０８によって実装される。また、ステップは、ＭＤＣＴデコーダのサンプリング周波数でリサンプリングするステップも含み得る。

【0110】

この予測コード化Ｅ６０８は、特定の実施形態では、エンコーダにおいてこのソリューションが選択された場合は、遷移予測復号であり得、この遷移予測復号では、励振の復号は、直接的なものであり、いかなる適応辞書も使用しない。この事例では、適応辞書のメモリは、再初期化する必要はない。

【0111】

次いで、励振の非予測復号が行われる。この実施形態により、この事例では、以前に再初期化されている適応辞書のメモリを使用しないため、ＬＰＤタイプの予測デコーダをはるかに急速に安定させることが可能になる。これは、本発明による遷移の実装形態をさらに簡素化する。現フレームを復号する場合、長期励振の予測復号は、励振の非予測復号と置き換えられる。

【0112】

特定の実施形態では、現フレームに対する線形予測フィルタの係数を計算するステップＥ６０７は、計算モジュール６０７によって実行される。

【0113】

現フレームに対して、線形予測フィルタの係数の計算のいくつかのモードが可能である。

【0114】

第１の実施形態では、ＦＤコーダではＬＰＣ係数はコード化されず、値は０に再初期化されているため、ＦＤタイプの前のフレーム（ＯＬＤ）における予測係数は知られていない。次いで、固有の線形予測フィルタ（すなわち、フレーム終了時の予測フィルタ（ＮＥＷ）に相当するかまたはフレーム半ばの予測フィルタ（ＭＩＤ）に相当する）の係数を復号することを選択する。その後、同一の係数は、フレーム終了時、フレーム半ば、およびフレーム開始時の線形予測フィルタに割り振られる。

【0115】

第２の可能な実施形態では、図７に示されるステップが実装される。第１のステップＥ７０１は、図６のステップＥ６０６の実装形態による予測フィルタの係数（ＬＳＰＯＬＤ）の初期化である。ステップＥ７０２は、フレーム終了時のフィルタの係数（ＬＳＰＮＥＷ）を復号し、Ｅ７０３において、フレーム半ばの予測フィルタの係数（ＬＳＰＭＩＤ）を復号するために、得られた復号済み値（ＬＳＰＮＥＷ）およびフレーム開始時のフィルタの係数（ＬＳＰＯＬＤ）の既定の再初期設定値が一緒に使用される。フレーム開始時の係数（ＬＳＰＯＬＤ）の値をフレーム半ばの係数（ＬＳＰＭＩＤ）の復号済み値に置き換えるステップＥ７０４が実行される。ステップＥ７０５は、このように復号されたこれらの値（ＬＳＰＯＬＤ、ＬＳＰＭＩＤ、ＬＳＰＮＥＷ）に基づいて現フレームに対する線形予測フィルタの係数を決定することを可能にする。

【0116】

第３の可能な実施形態では、前のフレームに対する線形予測フィルタの係数（ＬＳＰＯＬＤ）は、例えば、ＬＳＰ係数の長期平均値に応じて、既定の値に初期化される。この事例では、Ｇ．７１８で使用されるものなどの「通常の」復号を使用することが可能となり、サブフレームベースの線形予測係数は、予測フィルタ（ＯＬＤ、ＭＩＤおよびＮＥＷ）の値間の補間として計算される。従って、この操作により、ＬＰＤコーダをより急速に安定させることが可能になる。

【0117】

図１０を参照すると、本発明の実施形態によるコーダまたはデコーダを具体化するように適応させたハードウェアデバイスについて説明している。

【0118】

このコーダまたはデコーダは、通信端末、通信ゲートウェイまたは任意のタイプの機器（セットトップボックスタイプのデコーダまたはオーディオストリームリーダなど）に組み込むことができる。

【0119】

このデバイスＤＩＳＰは、デジタル信号を受信するための入力を備え、入力は、コーダの場合は入力信号ｘ（ｎ）であり、デコーダの場合はバイナリトレインｂｓｔである。

【0120】

また、デバイスは、特に、入力Ｅを発生源とする信号上のコード化／復号操作の実行に適応しているデジタル信号プロセッサＰＲＯＣも備える。

【0121】

このプロセッサは、コード化／復号に関するデバイスの駆動に必要な情報の格納に適応している１つまたは複数のメモリユニットＭＥＭとリンクされる。例えば、これらのメモリユニットは、上記で説明される復号方法の実装のための命令を含み、特に、受信されて、変換コード化に従ってコード化されたデジタル信号のサンプルの前のフレームを逆変換復号に従って復号するステップと、受信されて、予測コード化に従ってコード化されたデジタル信号のサンプルの現フレームを予測復号に従って復号するステップと、予測復号の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップと、現フレームの予測復号によって合成された信号セグメントと、前のフレームの復号の格納されたセグメントに相当する、逆変換復号によって合成された信号セグメントとを結合する重畳加算を行うステップとを実装するための命令を含む。

【0122】

デバイスがコーダタイプのものである場合、これらのメモリユニットは、上記で説明されるコード化方法の実装のための命令を含み、特に、変換コード化に従ってデジタル信号のサンプルの前のフレームをコード化するステップと、予測コード化に従ってコード化すべきデジタル信号のサンプルの現フレームを受信するステップと、予測コード化の少なくとも１つの状態を事前に決定されたデフォルト値に再初期化するステップとを実装するための命令を含む。

【0123】

また、これらのメモリユニットは、計算パラメータまたは他の情報も含み得る。

【0124】

より一般には、プロセッサによって読み取り可能である、コーダまたはデコーダに組み込むことができる、任意選択により取り外し可能な格納手段は、本発明による復号方法および／またはコード化方法を実装するコンピュータプログラムを格納する。図３および６は、例えば、そのようなコンピュータプログラムのアルゴリズムを示す。

【0125】

また、プロセッサは、これらのメモリユニットへの結果の格納にも適応している。最後に、デバイスは、出力信号を提供するためにプロセッサにリンクされた出力Ｓを備え、出力信号は、コーダの場合はバイナリトレインｂｓｔの形態の信号であり、デコーダの場合は出力信号

【数4】

である。