特許第6772233号(P6772233)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧
<>
  • 特許6772233-情報符号化のコンセプト 図000006
  • 特許6772233-情報符号化のコンセプト 図000007
  • 特許6772233-情報符号化のコンセプト 図000008
  • 特許6772233-情報符号化のコンセプト 図000009
  • 特許6772233-情報符号化のコンセプト 図000010
  • 特許6772233-情報符号化のコンセプト 図000011
  • 特許6772233-情報符号化のコンセプト 図000012
  • 特許6772233-情報符号化のコンセプト 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6772233
(24)【登録日】2020年10月2日
(45)【発行日】2020年10月21日
(54)【発明の名称】情報符号化のコンセプト
(51)【国際特許分類】
   G10L 19/07 20130101AFI20201012BHJP
   G10L 19/16 20130101ALI20201012BHJP
   H03M 7/30 20060101ALI20201012BHJP
【FI】
   G10L19/07
   G10L19/16 200Z
   H03M7/30 A
   H03M7/30 B
【請求項の数】19
【全頁数】28
(21)【出願番号】特願2018-192262(P2018-192262)
(22)【出願日】2018年10月11日
(62)【分割の表示】特願2016-555956(P2016-555956)の分割
【原出願日】2015年2月9日
(65)【公開番号】特開2019-49729(P2019-49729A)
(43)【公開日】2019年3月28日
【審査請求日】2018年11月12日
(31)【優先権主張番号】14158396.3
(32)【優先日】2014年3月7日
(33)【優先権主張国】EP
(31)【優先権主張番号】14178789.5
(32)【優先日】2014年7月28日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100205981
【弁理士】
【氏名又は名称】野口 大輔
(72)【発明者】
【氏名】トム・ヴェックストローム
(72)【発明者】
【氏名】クリスティアン・フィッシャー ペデルセン
(72)【発明者】
【氏名】ヨハネス・フィッシャー
(72)【発明者】
【氏名】マティアス・ヒュッテンベルガー
(72)【発明者】
【氏名】アルフォンソ・ピノ
【審査官】 岩田 淳
(56)【参考文献】
【文献】 特表2005−533272(JP,A)
【文献】 特開平09−212198(JP,A)
【文献】 特開平06−230797(JP,A)
【文献】 米国特許第07711556(US,B1)
【文献】 欧州特許第00774750(EP,B1)
【文献】 Satya Sudhakar Yedlapalli,Transforming Real Linear Prediction Coefficients to Line Spectral Representations With a Real FFT,IEEE Transactions on Speech and Audio Processing,IEEE,2005年 9月,Vol. 13, No. 5,Pages 733-740
【文献】 Frank K. Soong, et al.,LINE SPECTRUM PAIR (LSP) AND SPEECH DATA COMPRESSION,IEEE International Conference on Acoustics, Speech, and Signal Processing,IEEE,1984年 3月21日,Pages 1.10.1-1.10.4
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
H03M 7/30
(57)【特許請求の範囲】
【請求項1】
情報信号(IS)を符号化するための情報エンコーダであって、前記情報エンコーダ(1)は、
予測多項式A(z)の線形予測係数を得るために前記情報信号(IS)を分析するアナライザ(2)と、
前記予測多項式A(z)の前記線形予測係数を前記予測多項式A(z)のスペクトル周波数表現の周波数値f...fへ変換するコンバータ(3)であって、
P(z)=A(z)+z−m−lA(z−1)、及び、
Q(z)=A(z)−z−m−lA(z−1)、
mは前記予測多項式A(z)の次数、lはゼロ以上、
として定義される多項式対P(z)及びQ(z)を分析することにより前記周波数値f...fを決定するように構成され、P(z)から導出される厳密な実数スペクトル(RES)とQ(z)からの厳密な虚数スペクトル(IES)を確立することによって、及びP(z)から導出される前記厳密な実数スペクトル(RES)とQ(z)から導出される前記厳密な虚数スペクトル(IES)のゼロを識別することによって、前記周波数値(f...f)を得るように構成されており、前記多項式対P(z)とQ(z)又は前記多項式対P(z)とQ(z)から導出される1又は複数の多項式を、P(z)から導出される前記スペクトル(RES)が厳密に実数であるように、かつQ(z)から導出される前記スペクトル(IES)が厳密に虚数であるように、ハーフサンプルを用いて周波数領域へフーリエ変換するフーリエ変換デバイス(14)を備えているコンバータ(3)と、
前記周波数値(f...f)から量子化された周波数値(fq1...fqn)を取得する量子化器(4)と、
前記量子化された周波数値(fq1...fqn)を含むビットストリームを生成するビットストリーム生成器(5)と、を備えている情報エンコーダ。
【請求項2】
前記コンバータ(3)は、前記予測多項式A(z)から前記多項式P(z)及びQ(z)を決定する決定デバイス(6)を備えている請求項1に記載の情報エンコーダ。
【請求項3】
前記コンバータ(3)は、P(z)から導出される前記厳密な実数スペクトル(RES)及びQ(z)から導出される前記厳密な虚数スペクトル(IES)の前記ゼロを識別するためのゼロ識別子(9)を備えている請求項1又は請求項2に記載の情報エンコーダ。
【請求項4】
前記ゼロ識別子(9)は、
a)前記実数スペクトル(RES)からヌル(null)周波数で開始すること、
b)前記実数スペクトル(RES)において符号変化が発見されるまで周波数を増大すること、
c)前記虚数スペクトル(IES)においてさらなる符号変化が発見されるまで周波数を増大すること、及び
d)全てのゼロが発見されるまでステップb)とステップc)を反復すること、によって前記ゼロを識別するように構成されている請求項3に記載の情報エンコーダ。
【請求項5】
前記ゼロ識別子は、前記ゼロを補間(interpolation)によって識別するように構成されている請求項3又は請求項4に記載の情報エンコーダ。
【請求項6】
前記コンバータ(3)は、長くされた多項式対P(z)及びQ(z)を生成するように、前記多項式P(z)及びQ(z)に対して値「0」を有する1又は複数の係数を加えるゼロパディング・デバイス(10)を備えている請求項1から5のいずれか一項に記載の情報エンコーダ。
【請求項7】
前記コンバータ(3)は、前記線形予測係数を前記予測多項式A(z)の前記スペクトル周波数表現(RES、IES)の周波数値(f...f)に変換する間に、前記長くされた多項式P(z)及びQ(z)の前記値「0」を有することが知られている係数を用いる演算の少なくとも一部が省略されるように構成されている請求項6に記載の情報エンコーダ。
【請求項8】
前記コンバータ(3)は、前記長くされた多項式P(z)及びQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマ(13)を備えている請求項6又は7のいずれか一項に記載の情報エンコーダ。
【請求項9】
前記コンバータ(3)は、P(z)から導出される前記厳密な実数スペクトル(RES)及びQ(z)からの前記厳密な虚数スペクトル(IES)が、前記合成多項式C(P(z),Q(z))を変換することによって、単一のフーリエ変換により、確立されるように構成されている請求項8に記載の情報エンコーダ。
【請求項10】
前記コンバータ(3)は、前記多項式対P(z)とQ(z)又は前記多項式対P(z)とQ(z)から導出される1又は複数の多項式を周波数領域へフーリエ変換するフーリエ変換デバイス(8)と、P(z)から導出される前記スペクトル(RES)の位相をそれが厳密に実数であるように調整するとともに、Q(z)から導出される前記スペクトル(IES)の位相をそれが厳密に虚数であるように調整する調整デバイス(7、12)と、を備えている請求項1から9のいずれか一項に記載の情報エンコーダ。
【請求項11】
前記調整デバイス(7、12)は、前記多項式対P(z)とQ(z)又は前記多項式対P(z)とQ(z)から導出される前記1若しくは複数の多項式の係数を循環シフトする係数シフタ(7)として構成されている請求項10に記載の情報エンコーダ。
【請求項12】
前記係数シフタ(7)は、係数列の原初の中間点が前記数列の第1のポジションへシフトされるような方法で係数を循環シフトするように構成されている請求項11に記載の情報エンコーダ。
【請求項13】
前記調整デバイス(7、12)は、前記フーリエ変換デバイス(8)の出力の位相をシフトする位相シフタ(12)として構成されている請求項10に記載の情報エンコーダ。
【請求項14】
前記位相シフタ(12)は、k番目の周波数ビンにexp(i2πkh/N)を乗算することによって、前記フーリエ変換デバイス(8)の前記出力の前記位相をシフトするように構成されており、Nは、サンプルの長さであり、h=(m+l)/2である請求項13に記載の情報エンコーダ。
【請求項15】
前記コンバータ(3)は、前記多項式P(z)とQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマ(13)を備えている請求項1から14のいずれか一項に記載の情報エンコーダ。
【請求項16】
前記コンバータ(3)は、P(z)から導出される前記厳密な実数スペクトル(RES)とQ(z)からの前記厳密な虚数スペクトル(IES)が、前記合成多項式C(P(z),Q(z))を変換することによって単一のフーリエ変換により確立されるように構成されている請求項15に記載の情報エンコーダ。
【請求項17】
前記コンバータ(3)は、前記長くされた多項式P(z)及びQ(z)又は前記長くされた多項式P(z)及びQ(z)から導出される1つ若しくは複数の多項式の前記スペクトル(RES、IES)の数値範囲を、前記長くされた多項式P(z)及びQ(z)にフィルタ多項式B(z)を乗算することによって制限するための制限デバイス(11)を備え、前記フィルタ多項式B(z)は対称性でありかつ単位円上に根を持たない請求項6から16のいずれか一項に記載の情報エンコーダ。
【請求項18】
情報信号(IS)を符号化するための情報エンコーダ(1)を作動するための方法であって、
予測多項式A(z)の線形予測係数を求めるために前記情報信号(IS)を分析するステップと、
前記予測多項式A(z)の前記線形予測係数を前記予測多項式A(z)のスペクトル周波数表現(RES、IES)の周波数値(f...f)へ変換するステップであって、
P(z)=A(z)+z−m−lA(z−1)、及び、
Q(z)=A(z)−z−m−lA(z−1
mは前記予測多項式A(z)の次数、lはゼロ以上、
として定義される多項式対P(z)及びQ(z)を分析することによって、前記周波数値(f...f)を決定し、P(z)から導出される厳密な実数スペクトル(RES)及びQ(z)からの厳密な虚数スペクトル(IES)を確立しかつP(z)から導出される前記厳密な実数スペクトル(RES)及びQ(z)から導出される前記厳密な虚数スペクトル(IES)のゼロを識別することによって、前記周波数値(f...f)を得るステップと、
前記多項式対P(z)とQ(z)又は前記多項式対P(z)とQ(z)から導出される1又は複数の多項式を、P(z)から導出される前記スペクトル(RES)が厳密に実数であるように、かつQ(z)から導出される前記スペクトル(IES)が厳密に虚数であるように、ハーフサンプルを用いて周波数領域へフーリエ変換するステップと、
前記周波数値(f...f)から量子化された周波数値(fq1...fqn)を求めるステップと、
前記量子化された周波数値(fq1...fqn)を含むビットストリーム(BS)を生成するステップと、を含む方法。
【請求項19】
プロセッサ上で実行されることにより請求項18に記載の方法を実行するコンピュータプログラム。
【発明の詳細な説明】
【背景技術】
【0001】
音声符号化において最も頻繁に使用されるパラダイムは、代数符号励振線形予測(ACELP)であり、これはAMR−ファミリ、G.718やMPEG USAC[1−3]等のような規格に使用されている。これは、ソースモデルを用いる音声モデリングを基礎としている。そのようなソースモデルは、スペクトル包絡線をモデリングするための線形予測子(LP)、基本周波数をモデリングするための長時間予測子(LTP)及び残余(residual)のための代数コードブックにより構成されている。
【0002】
線形予測モデルの係数は、量子化に対する感受性が極めて高く、よって通常これらは、量子化に先立って、まず線スペクトル周波数(LSF)又はイミッタンススペクトル周波数(ISF)に変換される。LSF/ISF領域は、量子化誤差に対して堅牢(robust)であり、これらの領域では、予測子の安定性を容易に保全することができ、よって、量子化のための適切な領域が提供される[4]。
【0003】
以下、周波数値と称するLSF/ISFは、次のように、次数mの線形予測多項式A(z)から求めることができる。線スペクトル対の多項式は、
P(z)=A(z)+z−m−lA(z−1
Q(z)=A(z)−z−m−lA(z−1) (1)
と定義される。ここで、線スペクトル対表現ではl=1であり、かつイミッタンススペクトル対表現ではl=0であるが、原則的には、任意のl≧0が有効である。したがって、以後、単にl≧0であるものと仮定する。
【0004】
元の予測子は、A(z)=1/2[P(z)+Q(z)]を用いていつでも復元できることに留意されたい。したがって、多項式P(z)及びQ(z)は、A(z)の全情報を包含する。
【0005】
LSP/ISP多項式の中心的性質は、A(z)がその全ての根を単位円内に有する場合に限り、P(z)及びQ(z)の根が単位円上でインタレースされる、というものである。P(z)及びQ(z)の根が単位円上に存在するため、それらを角度のみで表現することができる。これらの角度は、周波数に対応し、またP(z)及びQ(z)のスペクトルは、根に対応する周波数においてその対数振幅スペクトルにおける垂線を有することから、これらの根を周波数値と称する。
【0006】
周波数値は、結果的に、予測子A(z)の全情報を符号化することになる。さらに、周波数値のうちの1つにおける僅かな誤差がもたらす、対応する周波数の近くにスペクトルが位置決めされる復元された予測子のスペクトル誤差が小さくなるように、周波数値は、量子化誤差に対して堅牢(robust)であることが分かっている。これらの好ましい性質に起因して、LSF又はISF領域における量子化は、全てのメインストリーム音声コーデックにおいて使用されている[1−3]。
【0007】
しかしながら、周波数値を用いる場合の課題の1つは、多項式P(z)及びQ(z)の係数からその位置を効率的に求めることにある。結局のところ、多項式の根を求めることは、古典的かつ困難な課題である。このタスクに関してこれまでに提案されている方法は、下記の手法を含んでいる:
・ 初期の手法のうちの1つは、ゼロが単位円上に存在し、よって、これが振幅スペクトルにおいてゼロとして現出する、ということを用いている[5]。したがって、P(z)とQ(z)の係数の離散型フーリエ変換を利用することにより、振幅スペクトルの谷を探索することができる。各谷は、根の位置を示し、スペクトルが充分にアップサンプリングされていれば、全ての根を求めることができる。しかしながら、この方法では、谷の位置からの正確なポジションの決定が困難であるため、近似ポジションしか得られない。
・ 最も高頻度で使用される手法は、チェビシェフ多項式を基礎とするものであり、[6]に提示されている。これは、多項式P(z)及びQ(z)はそれぞれが対称かつ逆対称であり、それによって多くの冗長な情報を含む、という認識に依存する。z=±1における自明な零点を除去することにより、かつ置換x=z+z−1(チェビシェフ変換として知られる)を用いれば、多項式を代替表現FP(x)及びFQ(x)へ変換することができる。これらの多項式の次数は、P(z)とQ(z)の半分であり、よってこれらは、−2から+2までの範囲にのみ実根を有する。多項式FP(x)及びFQ(x)は、xが実数のとき実数値であることに留意されたい。さらに、これらの根は、単根であることから、FP(x)とFQ(x)は、その各根において零交差を有する。
【0008】
AMR−WB等の音声コーデックにおいて、この手法は、実軸上の固定格子上で多項式FP(x)及びFQ(x)を評価して全ての零交差を求めるように適用される。根位置は、零交差の周囲での線形補間によってさらに精緻化される。この手法の優位点は、冗長係数の省略により複雑さが低減されることにある。
【0009】
上述の方法は、既存のコーデックにおいて充分に機能するが、幾つかの問題点もある。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】[1] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Jaervinen, “The adaptive multirate wideband speech codec (AMR-WB)”, Speech and Audio Processing, IEEE Transac- tions on, vol. 10, no. 8, pp. 620-636, 2002.
【非特許文献2】[2] ITU-T G.718, “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”, 2008.
【非特許文献3】[3] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, and B. Grill, “Unified speech and audio coding scheme for high quality at low bitrates”, in Acoustics, Speech and Signal Processing. ICASSP 2009. IEEE Int Conf, 2009, pp. 1-4.
【非特許文献4】[4] T. Baeckstroem and C. Magi, “Properties of line spectrum pair polynomials - a review”, Signal Processing, vol. 86, no. 11, pp. 3286-3298, November 2006.
【非特許文献5】[5] G. Kang and L. Fransen, “Application of line-spectrum pairs to low-bit- rate speech encoders”, in Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP’85., vol. 10. IEEE, 1985, pp. 244-247.
【非特許文献6】[6] P. Kabal and R. P. Ramachandran, “The computation of line spectral frequencies using Chebyshev polynomials”, Acoustics, Speech and Signal Processing, IEEE Transactions on, vol. 34, no. 6, pp. 1419-1426, 1986.
【非特許文献7】[7] 3GPP TS 26.190 V7.0.0, “Adaptive multi-rate (AMR-WB) speech codec”, 2007.
【非特許文献8】[8] T. Baeckstroem, C. Magi, and P. Alku, “Minimum separation of line spec- tral frequencies”, IEEE Signal Process. Lett., vol. 14, no. 2, pp. 145-147, February 2007.
【非特許文献9】[9] T. Baeckstroem, “Vandermonde factorization of Toeplitz matrices and applications in filtering and warping,” IEEE Trans. Signal Process., vol. 61, no. 24, pp. 6257-6263, 2013.
【非特許文献10】[10] V. F. Pisarenko, “The retrieval of harmonics from a covariance function”, Geophysical Journal of the Royal Astronomical Society, vol. 33, no. 3, pp. 347-366, 1973.
【非特許文献11】[11] E. Durand, Solutions Numeriques des Equations Algebriques. Paris: Masson, 1960.
【非特許文献12】[12] I. Kerner, “Ein Gesamtschrittverfahren zur Berechnung der Nullstellen von Polynomen”, Numerische Mathematik, vol. 8, no. 3, pp. 290-294, May 1966.
【非特許文献13】[13] O. Aberth, “Iteration methods for finding all zeros of a polynomial simultaneously”, Mathematics of Computation, vol. 27, no. 122, pp. 339-344, April 1973.
【非特許文献14】[14] L. Ehrlich, “A modified newton method for polynomials”, Communications of the ACM, vol. 10, no. 2, pp. 107-108, February 1967.
【非特許文献15】[15] D. Starer and A. Nehorai, “Polynomial factorization algorithms for adaptive root estimation”, in Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2. Glasgow, UK: IEEE, May 1989, pp. 1158-1161.
【非特許文献16】[16] --, “Adaptive polynomial factorization by coefficient matching”, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 527-530, February 1991.
【非特許文献17】[17] G. H. Golub and C. F. van Loan, Matrix Computations, 3rd ed. John Hopkins University Press, 1996.
【非特許文献18】[18] T. Saramaeki, “Finite impulse response filter design”, Handbook for Digital Signal Processing, pp. 155-277, 1993.
【発明の概要】
【発明が解決しようとする課題】
【0011】
解決すべき課題は、情報を符号化するための改良された概念を提供することである。
【課題を解決するための手段】
【0012】
第1の態様において、この課題は、情報信号を符号化するための情報エンコーダによって解決される。情報エンコーダは、
予測多項式A(z)の線形予測係数を得るために情報信号を分析するアナライザと、
予測多項式A(z)の線形予測係数を予測多項式A(z)のスペクトル周波数表現の周波数値へ変換するコンバータであって、
P(z)=A(z)+z−m−lA(z−1)、及び、
Q(z)=A(z)−z−m−lA(z−1)、
mは予測多項式A(z)の次数、lはゼロ以上、
として定義される多項式対P(z)及びQ(z)を分析することにより前記周波数値を決定するように構成され、P(z)から導出される厳密な実数スペクトルとQ(z)からの厳密な虚数スペクトルを確立することによって、及びP(z)から導出される厳密な実数スペクトルとQ(z)から導出される厳密な虚数スペクトルのゼロを識別することによって、前記周波数値を得るように構成されたコンバータと、
前記周波数値から量子化された周波数値を取得する量子化器と、
前記量子化された周波数値を含むビットストリームを生成するビットストリーム生成器と、を備える。
【0013】
本発明による情報エンコーダは零交差探索を用いるのに対し、従来技術による根を求めるためのスペクトル手法は、振幅スペクトル中の谷の検知に依存する。しかしながら、谷を探索する場合の確度は、零交差を探索する場合より劣る。例えば、数列[4,2,1,2,3]を考察されたい。明らかに、最小値は第3の要素であり、よって、ゼロは、第2の要素と第4の要素との間のどこかに存在することになる。言い替えれば、ゼロが第3の要素の右側に存在するか、左側に存在するかを決定することはできない。しかしながら、数列[4,2,1,−2,−3]について考察する場合は、直ちに、零交差が第3の要素と第4の要素との間に存在することが分かり、よって、許容誤差が半減する。振幅スペクトル手法の場合、零交差探索の場合と同じ確度を達成するには、分析点の数を2倍にする必要があることになる。
【0014】
振幅│P(z)│と│Q(z)│の評価を比較すれば、零交差手法は、確度において著しい優位点を有する。例えば、数列3,2,−1,−2を考察されたい。零交差手法では、ゼロは、2と−1との間に存在することが明らかである。しかしながら、対応する振幅列3,2,1,2を考察する場合、ゼロは、第2の要素と最後の要素との間のどこかに存在する、としか結論することができない。言い替えれば、零交差手法の場合の確度は、振幅ベースの手法の2倍である。
【0015】
さらに、本発明による情報エンコーダは、m=128等の長い予測子を用いてもよい。これに対して、チェビシェフ変換は、A(z)の長さが比較的短い、例えばm≦20である場合にしか十分に機能しない。長い予測子の場合、チェビシェフ変換は、数値的に不安定であり、よって、アルゴリズムの実用的実装は不可能である。
【0016】
したがって、提案する情報エンコーダの主要な特性は、零交差が探索されることに起因して、そして時間領域から周波数領域への変換が行われ、それによって極めて低い計算複雑性によりゼロを発見し得ることに起因して、チェビシェフベースの方法のように高い確度、又はより優れた確度を達成し得ることである。
【0017】
結果的に、本発明による情報エンコーダは、ゼロ(根)をより正確に決定するだけでなく、低い計算複雑性で決定する。
【0018】
本発明による情報エンコーダは、数列の線スペクトルを決定する必要があるあらゆる信号処理アプリケーションにおいて使用可能である。本明細書では、例示的に、情報エンコーダを音声符号化の側面で論じる。本発明は、音声信号又は汎用オーディオ信号等の入力信号から線スペクトルを決定するための方法を必要とし、かつ入力信号がデジタルフィルタ又は他の数列として表現される、スペクトル振幅包絡線、知覚周波数マスキングしきい値、時間振幅包絡線、知覚時間マスキングしきい値、又は他の包絡線形状、若しくは線スペクトルを用いて包絡線情報を表現する、符号化、分析又は処理のための自己相関信号等の包絡線形状と等価の他の表現、をモデリングするための線形予測子を使用する、音声、オーディオ及び/又はビデオ符号化デバイス又はアプリケーションにおいて適用可能である。
【0019】
情報信号は、例えば、オーディオ信号又はビデオ信号であってもよい。周波数値は、線スペクトル周波数であっても、イミッタンススペクトル周波数であってもよい。ビットストリーム内で伝送される量子化された周波数値は、オーディオ信号又はビデオ信号を再現するために、デコーダがビットストリームを復号できるようにする。
【0020】
本発明の好適な一実施形態によれば、コンバータは、予測多項式A(z)から多項式P(z)とQ(z)を決定するための決定デバイスを備えている。
【0021】
本発明の好適な実施形態によれば、コンバータは、P(z)から導出される厳密な実数スペクトルとQ(z)から導出される厳密な虚数スペクトルのゼロを識別するためのゼロ識別子を備えている。
【0022】
本発明の好適な一実施形態によれば、ゼロ識別子は、
a)実数スペクトルをヌル周波数において開始することと、
b)実数スペクトルにおいて符号変化が発見されるまで周波数を増大することと、
c)虚数スペクトルにおいてさらなる符号変化が発見されるまで周波数を増大することと、
d)全てのゼロが発見されるまでステップb)及びステップc)を反復すること、によってゼロを識別するように構成されている。
【0023】
Q(z)ひいてはスペクトルの虚数部は、ヌル周波数において常にゼロを有することに留意されたい。根は重なり合うことから、P(z)ひいてはスペクトルの実数部は、ヌル周波数において常に非ゼロになる。したがって、ヌル周波数における実数部から開始して、最初の零交差ひいては最初の周波数値を示す最初の符号変化が発見されるまで、周波数を増大させることができる。
【0024】
根はインタレースされるので、Q(z)のスペクトルは次の符号変化を有することとなる。したがって、Q(z)のスペクトルの符号変化が発見されるまで、周波数を増大させることができる。次に、このプロセスは、全ての周波数値が発見されるまで、P(z)及びQ(z)のスペクトル間で交互に反復されてもよい。したがって、スペクトルにおける零交差の位置決めに使用される手法は、チェビシェフ領域において適用される手法に類似する[6、7]。
【0025】
P(z)及びQ(z)のゼロはインタレースされることから、1パスで全てのゼロを発見するように実数部及び複素数部上のゼロの探索を交互に行い、よって、複雑性を完全探索の半分に減らすことができる。
【0026】
本発明の好適な一実施形態によれば、ゼロ識別子は、ゼロを補間によって識別するように構成される。
【0027】
零交差手法に加えて、ゼロのポジションを、例えば[7]のような従来方法において行われるようなより高い確度で推定できるように、補間を容易に適用することができる。
【0028】
本発明の好適な一実施形態によれば、コンバータは、長くされた多項式対P(z)及びQ(z)を生成するための多項式P(z)及びQ(z)へ値「0」を有する1つ又は複数の係数を加えるゼロパディング・デバイスを備えている。確度は、評価されるスペクトルの長さを拡大することによってさらに向上させることができる。システムに関する情報を基礎として、事例によっては、実質上、周波数値間の最小距離を決定し、ひいては、全ての周波数値をそれにより発見することができるスペクトルの最小長さを決定することが可能である[8]。
【0029】
本発明の好適な一実施形態によれば、コンバータは、線形予測係数を予測多項式A(z)のスペクトル周波数表現の周波数値へ変換する間に、長くされた多項式P(z)及びQ(z)の値「0」を有することが知られている係数を用いる演算の少なくとも一部が省略されるように構成される。
【0030】
しかしながら、スペクトルの長さが増せば、計算複雑性も増大する。複雑性の最大の誘因は、A(z)の係数の、時間領域から周波数領域への高速フーリエ変換などの変換である。しかしながら、これは、係数ベクトルが所望される長さにゼロパディングされていることから、極めて疎である。複雑性の低減には、この事実を容易に使用することができる。これは、どの係数がゼロであるかが正確に分かり、よって、高速フーリエ変換の各反復において単純にゼロを包含する演算を省くことができるという意味において、どちらかといえば単純な問題である。このように疎な高速フーリエ変換の適用は、単純であり、よって当業者たるプログラマは誰でもこれを実装することができる。このような実装の複雑性は、O(Nlog(1+m+l))であり、ここで、Nは、スペクトルの長さであり、m及びlは、先に定義した通りである。
【0031】
本発明の好適な一実施形態によれば、コンバータは、長くされた多項式P(z)及びQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマを備えている。
【0032】
本発明の好適な一実施形態によれば、コンバータは、P(z)から導出される厳密な実数スペクトル及びQ(z)からの厳密な虚数スペクトルが、合成多項式C(P(z),Q(z))を変換することによって単一のフーリエ変換により、確立されるように構成される。
【0033】
本発明の好適な一実施形態によれば、コンバータは、多項式対P(z)とQ(z)又は多項式対P(z)とQ(z)から導出される1つ又は複数の多項式を周波数領域へフーリエ変換するフーリエ変換デバイスと、P(z)から導出されるスペクトルの位相を、それが厳密に実数であるように調整するとともに、Q(z)から導出されるスペクトルの位相を、それが厳密に虚数であるように調整する調整デバイスと、を備えている。フーリエ変換デバイスは、高速フーリエ変換を基礎とするものであっても、離散型フーリエ変換を基礎とするものであってもよい。
【0034】
本発明の好適な一実施形態によれば、調整デバイスは、多項式対P(z)とQ(z)又は多項式対P(z)とQ(z)から導出される1つ又は複数の多項式の係数を循環シフトする係数シフタとして構成されている。
【0035】
本発明の好適な一実施形態によれば、係数シフタは、係数列の原初の中間点がその数列の第1のポジションへシフトされるような方法で、係数を循環シフトするように構成されている。
【0036】
理論的には、対称数列のフーリエ変換が実数値をとり、かつ逆対称の数列が純虚数フーリエスペクトルを有することは周知である。本事例における入力数列は、長さm+lの多項式P(z)又はQ(z)の係数であるが、これより遙かに長い長さN>>(m+l)の離散型フーリエ変換を有する方が好まれると思われる。より長いフーリエスペクトルを生成する従来的手法は、入力信号のゼロパディングである。しかしながら、数列のゼロパディングは、対称性が保たれるように慎重に実装されなければならない。
【0037】
まず、係数、
[p,p,p,p,p
を有する多項式P(z)について考察する。
【0038】
通常、FFTアルゴリズムを適用する方法は、対称点が第1の要素であることを要求し、よって、例えば、MATLABに適用する場合、
fft([p,p,p,p,p])
のように書いて実数値の出力を求めることができる。具体的には、循環シフトが適用されてもよく、よって、中間点要素に対応する対称点、即ち係数pは、第1のポジションになるように左へシフトされる。次に、pの左側にあった係数は、数列の終わりに付加される。
【0039】
ゼロパディングされた数列、
[p,p,p,p,p,0,0...0]
の場合も、同じプロセスを適用することができる。よって、数列、
[p,p,p,0,0...0,p,p
が実数値の離散型フーリエ変換を有する。ここで、入力数列におけるゼロの数は、スペクトルの所望される長さをNとすれば、N−m−lである。
【0040】
同様に、多項式Q(z)に対応する係数、
[q,q,0,−q,−q
について考察されたい。前述の中間点が第1のポジションにくるように循環シフトを適用すれば、
[0,−q,−q,q,q
が得られ、これは、純虚数の離散型フーリエ変換を有する。次には、この数列にゼロパディング変換を行なうことができる。
[0,−q,−q,0,0...0,q,q
【0041】
上記は、数列の長さが奇数である事例にのみ当てはまり、よって、m+lは偶数であることに留意されたい。m+lが奇数である事例に関しては、2つのオプションがある。即ち、周波数領域において循環シフトを実装することができ、あるいは、ハーフサンプルでDFTを適用することができる(下記参照)。
【0042】
本発明の好適な一実施形態によれば、調整デバイスは、フーリエ変換デバイスの出力の位相をシフトするための位相シフタとして構成される。
【0043】
本発明の好適な一実施形態によれば、位相シフタは、フーリエ変換デバイスの出力の位相を、k番目の周波数ビンにexp(i2πkh/N)を乗算することによってシフトするように構成される。ここで、Nは、サンプルの長さであり、かつh=(m+l)/2である。
【0044】
時間領域における循環シフトが周波数領域における位相回転と同一であることはよく知られている。具体的には、時間領域におけるh=(m+l)/2ステップのシフトは、k番目の周波数ビンとexp(−i2πkh/N)との乗算に一致する。ここで、Nはスペクトルの長さである。したがって、循環シフトの代わりに、周波数領域における乗算を適用すれば、全く同じ結果を得ることができる。ただし、この手法では、複雑性が僅かに増す。h=(m+l)/2は、m+lが偶数であるときにのみ整数であることに留意されたい。m+lが奇数のとき、循環シフトは、有理数のステップ分の遅延を必要とすることになり、これを直に実装することは困難である。代わりに、上述の相回転によって、周波数領域における対応するシフトを適用することができる。
【0045】
本発明の好適な実施形態によれば、コンバータは、多項式対P(z)とQ(z)又は多項式対P(z)とQ(z)から導出される1つ又は複数の多項式を、P(z)から導出されるスペクトルが厳密に実数であるように、かつQ(z)から導出されるスペクトルが厳密に虚数であるように、ハーフサンプルを用いて周波数領域へフーリエ変換するフーリエ変換デバイスを備えている。
【0046】
ある代替例は、ハーフサンプルを有するDFTを実装するものである。具体的には、従来のDFTを、
で定義できるのに対して、ハーフサンプルDFTは、次式のように定義することができる。
【0047】
この公式化に対しては、FFTのような高速実装を容易に考案することができる。
【0048】
この公式化の利点は、いまや対称点が通常のn=1ではなく、n=1/2に存在することにある。よって、このハーフサンプルDFTを用いれば、数列、
[2,1,0,0,1,2]
で、実数値のフーリエスペクトルが得られる。
【0049】
よって、m+lが奇数である場合、係数p,p,p,p,p,pを有する多項式P(z)に関して、ハーフサンプルDFT及びゼロパディングを用いれば、入力数列が、
[p,p,p,0,0...0,p,p,p
のとき、実数値のスペクトルを求めることができる。
【0050】
同様に、多項式Q(z)の場合、数列、
[−q,−q,−q,0,0...0,q,q,q
にハーフサンプルDFTを適用して、純虚数スペクトルを求めることができる。
【0051】
これらの方法により、mとlの如何なる組合せに対しても、多項式P(z)の実数値スペクトルと任意のQ(z)の純虚数スペクトルを求めることができる。実際には、P(z)とQ(z)のスペクトルが各々純実数と純虚数であることから、これらを単一の複素スペクトルに格納することができ、よって、これは、P(z)+Q(z)=2A(z)のスペクトルに一致する。係数2によるスケーリングでは、根の位置に変化がなく、よってこれを無視することができる。したがって、単一のFFTを用いてA(z)のスペクトルのみを評価すれば、P(z)とQ(z)のスペクトルを求めることができる。先に説明したように、A(z)の係数に循環シフトを適用するだけでよい。
【0052】
例えば、m=4でありl=0である場合、A(z)の係数は、
[a,a,a,a,a
であり、これは、ゼロパディングによって、次のように任意の長さNにすることができる。
[a,a,a,a,a,0,0...0]
【0053】
次に、(m+l)/2=2ステップの循環シフトを適用すれば、次のようになる。
[a,a,a,0,0...0,a,a
【0054】
この数列のDFTを採用すれば、スペクトルの実数部及び複素数部にP(z)とQ(z)のスペクトルが存在する。
【0055】
本発明の好適な一実施形態によれば、コンバータは、多項式P(z)とQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマを備えている。
【0056】
本発明の好適な一実施形態によれば、コンバータは、P(z)から導出される厳密な実数スペクトルとQ(z)からの厳密な虚数スペクトルが、例えば高速フーリエ変換(FFT)により合成多項式C(P(z),Q(z))を変換することによって、単一のフーリエ変換により確立されるように構成されている。
【0057】
多項式P(z)とQ(z)は、各々、z−(m+l)/2における対称軸と対称でありかつ逆対称である。よって、単位円z=exp(iθ)上で評価されるz−(m+l)/2P(z)とz−(m+l)/2Q(z)のスペクトルは、各々、実数値及び複素数値ということになる。ゼロは、単位円上に存在することから、零交差を探索すれば、ゼロを発見することができる。さらに、単位円上の評価は、単純に高速フーリエ変換によって実装することができる。
【0058】
−(m+l)/2P(z)とz−(m+l)/2Q(z)に対応するスペクトルは、各々実数及び複素数であることから、これらを単一の高速フーリエ変換によって実装することができる。具体的には、和z−(m+l)/2(P(z)+Q(z))を求めれば、スペクトルの実数部と複素数部は、各々、z−(m+l)/2P(z)とz−(m+l)/2Q(z)に対応する。さらに、
−(m+l)/2(P(z)+Q(z))=2z−(m+l)/2A(z) (4)
であることから、P(z)とQ(z)を明示的に決定することなく、2z−(m+l)/2A(z)のFFTを直に取り込んでz−(m+l)/2P(z)とz−(m+l)/2Q(z)に対応するスペクトルを求めることができる。知りたいものはゼロの位置だけであるため、スカラ2による乗算を省略し、代わりにFFTによるz−(m+l)/2A(z)を評価することができる。A(z)は、m+1個の非ゼロ係数しか持たないことから、FFT枝刈りを用いて複雑性を低減できることを観察されたい[11]。全ての根が発見されることを保証するためには、2つのゼロ毎にその間の少なくとも1つの周波数上でスペクトルが評価されるに足る長い長さNのFFTを用いなければならない。
【0059】
本発明の好適な一実施形態によれば、コンバータは、多項式P(z)とQ(z)のスペクトルの数値範囲を、多項式P(z)とQ(z)又は多項式P(z)とQ(z)から導出される1つ又は複数の多項式にフィルタ多項式B(z)を乗算することによって制限する制限デバイスを備えている。ここで、フィルタ多項式B(z)は、対称性であって、単位円上に根を持たない。
【0060】
音声コーデックは、限定リソースを有するモバイルデバイス上で実装されることが多く、よって、数値演算は、固定小数点表示によって実装されなければならない。したがって、実装されるアルゴリズムは、その範囲が限定される数値表現を用いて動作することが極めて重要である。しかしながら、一般的な音声スペクトル包絡線の場合、フーリエスペクトルの数値範囲があまりに大きく、よって、零交差位置の保持を保証するためには、FFTの32ビット実装が必要である。
【0061】
一方で、16ビットのFFTは、より低い複雑性で実装可能である場合が多く、よって、この16ビット範囲内に適合するようにスペクトル値の範囲を限定することが有益であると考えられる。方程式|P(eiθ)|≦2|A(eiθ)|と|Q(eiθ)|≦2|A(eiθ)|から、B(z)A(z)の数値範囲を限定することによってB(z)P(z)とB(z)Q(z)の数値範囲も限定されることが分かる。B(z)が単位円上にゼロを持たなければ、B(z)P(z)及びB(z)Q(z)は、単位円上にP(z)及びQ(z)と同じ零交差を有する。さらに、B(z)は、z−(m+l+n)/2P(z)B(z)及びz−(m+l+n)/2Q(z)B(z)がそれぞれ対称性と逆対称を保ち、かつそのスペクトルが純実数及び純虚数であるように、対称性でなければならない。したがって、z(n+l)/2A(z)のスペクトルを評価する代わりに、z(n+l+n)/2A(z)B(z)を評価することができる。ここで、B(z)は、単位円上に根を持たない次数nの対称多項式である。言い替えれば、先に述べたものと同じ手法を適用することができるが、まずは、A(z)をフィルタB(z)で乗算し、次に修正した位相シフトz−(m+l+n)/2を適用する。
【0062】
残りのタスクは、A(z)B(z)の数値範囲が、B(z)は必ず対称性でありかつ単位円上に根を持たないという制約によって限定されるように、フィルタB(z)を設計することである。この要件を満たす最も単純なフィルタは、次数2の線形位相フィルタ、
(z)=β+β−1+β−2 (5)
である。ここで、β∈Rはパラメータであり、かつ│β│>2│β│である。βを調整すれば、スペクトル傾斜を修正することができ、積A(z)B(z)の数値範囲を縮小することができる。計算上極めて効率的な手法は、βを、0周波数及びナイキストにおける振幅が等しくなるように、即ち│A(1)B(1)│=│A(−1)B(−1)│であるように選択することであり、例えば、次式を選ぶことができる。
β=A(1)−A(−1)、
β=2(A(1)+A(−1)) (6)
【0063】
この手法は、略平坦なスペクトルを提供する。
【0064】
A(z)が高域通過特性を有するのに対して、B(z)は低域通過であり(図5も参照されたい)、積A(z)B(z)は、予期されるように、0周波数及びナイキスト周波数において同じ振幅を有し、かつこれは、多かれ少なかれ平坦である。B(z)は1自由度しか持たないので、積が完全に平坦になると予期できないことは明らかである。さらに、B(z)A(z)の最高ピークと最低の谷との比は、A(z)のそれより遙かに小さいものであり得ることを観察されたい。これは、B(z)A(z)の数値範囲がA(z)のそれより遙かに小さいという望ましい効果が達成されていることを意味する。
【0065】
第2の、僅かに複雑性の高い方法は、A(0.5z)のインパルス応答の自己相関rを計算するものである。ここでは、0.5を乗算することによってA(z)のゼロが原点方向へ移動し、それによってスペクトル振幅が約半分に縮小される。自己相関rにレビンソン−ダービンを適用すれば、最小位相である次数nのフィルタH(z)が得られる。次に、B(z)=z−nH(z)H(z−1)を定義して、略一定である│B(z)A(z)│を求めることができる。│B2(z)A(z)│の範囲が│B(z)A(z)│のそれより小さいことに留意され得る。B(z)を設計するためのさらなる手法は、FIR設計に関する古典的文献[18]において容易に見出すことができる。
【0066】
本発明の好適な一実施形態によれば、コンバータは、長くされた多項式P(z)とQ(z)又は長くされた多項式P(z)とQ(z)から導出される1つ又は複数の多項式のスペクトルの数値範囲を、長くされた多項式P(z)とQ(z)にフィルタ多項式B(z)を乗算することによって制限する制限デバイスを備えている。ここで、フィルタ多項式B(z)は、対称性であって、単位円上に根を持たない。B(z)は、先に説明した通りに求めることができる。
【0067】
さらなる態様では、この課題は、情報信号を符号化するための情報エンコーダを作動するための方法によって解決される。本方法は、
予測多項式A(z)の線形予測係数を求めるべく情報信号を分析するステップと、
予測多項式A(z)の線形予測係数を予測多項式A(z)のスペクトル周波数表現の周波数値f...fへ変換するステップであって、
P(z)=A(z)+z−m−lA(z−1)、及び、
Q(z)=A(z)−z−m−lA(z−1
mは予測多項式A(z)の次数、lはゼロ以上、
のように定義される多項式対P(z)及びQ(z)を分析することによって前記周波数値f...fを決定し、、P(z)から導出される厳密な実数スペクトル及びQ(z)からの厳密な虚数スペクトルを確立しかつP(z)から導出される厳密な実数スペクトル及びQ(z)から導出される厳密な虚数スペクトルのゼロを識別することによって、前記周波数値f...fを得るステップと、
前記周波数値f...fから量子化された周波数値fq1...fqnを得るステップと、
前記量子化された周波数値fq1...fqnを含むビットストリームを生成するステップと、を含む。
【0068】
さらに、本プログラムは、プロセッサ上で実行されることにより本発明による方法を実行するコンピュータプログラムによっても注目される。
【図面の簡単な説明】
【0069】
図1図1は、本発明による情報エンコーダの一実施形態を示す略図である。
図2図2は、A(z)、P(z)及びQ(z)の例示的な関係を示す。
図3図3は、本発明による情報エンコーダのコンバータの第1の実施形態を示す略図である。
図4図4は、本発明による情報エンコーダのコンバータの第2の実施形態を示す略図である。
図5図5は、予測子A(z)、対応する平坦化フィルタB(z)及びB(z)及び積A(z)B(z)及びA(z)B(z)の例示的な振幅スペクトルを示す。
図6図6は、本発明による情報エンコーダのコンバータの第3の実施形態を示す略図である。
図7図7は、本発明による情報エンコーダのコンバータの第4の実施形態を示す略図である。
図8図8は、本発明による情報エンコーダのコンバータの第5の実施形態を示す略図である。
【発明を実施するための形態】
【0070】
続いて、添付の図面を参照し、本発明の好適な実施形態について論じる。
【0071】
図1は、本発明による情報エンコーダ1の一実施形態を示す略図である。
【0072】
情報信号ISを符号化するための情報エンコーダ1は、
予測多項式A(z)の線形予測係数を求めるべく情報信号ISを分析するアナライザ2と、
予測多項式A(z)の線形予測係数を予測多項式A(z)のスペクトル周波数表現RES、IESの周波数値f...fへ変換するコンバータ3であって、
P(z)=A(z)+z−m−lA(z−1)、及び、
Q(z)=A(z)−z−m−lA(z−1)、
mは予測多項式A(z)の次数、lはゼロ以上、
のように定義される多項式対P(z)及びQ(z)を分析することにより、前記周波数値f...fを決定するように構成され、前記コンバータ3は、P(z)から導出される厳密な実数スペクトルRES及びQ(z)からの厳密な虚数スペクトルIESを確立しかつP(z)から導出される厳密な実数スペクトルRES及びQ(z)から導出される厳密な虚数スペクトルIESのゼロを識別することによって、前記周波数値f...fを得るように構成されたコンバータ3と、
前記周波数値f...fから量子化された周波数値fq1...fqnを得る量子化器4と、
前記量子化された周波数値fq1...fqnを含むビットストリームBSを生成するビットストリーム生成器5と、を備えている。
【0073】
本発明による情報エンコーダ1は、零交差探索を用いるのに対して、従来技術による根を求めるためのスペクトル手法は、振幅スペクトルにおける谷の発見に依存する。しかしながら、谷を探索する場合の確度は、零交差を探索する場合より劣る。例えば、数列[4,2,1,2,3]を考察されたい。明らかに、最小値は、第3の要素であり、ゼロは、第2の要素と第4の要素との間のどこかに存在することになる。言い替えれば、ゼロが第3の要素の右側に存在するか、左側に存在するかを決定することはできない。しかしながら、数列[4,2,1,−2,−3]について考察すれば、直ちに、零交差が第3の要素と第4の要素との間に存在することが分かり、許容誤差が半減する。振幅スペクトル手法の場合、零交差探索の場合と同じ確度を達成するには、分析点の数を2倍にする必要があることになる。
【0074】
振幅│P(z)│と│Q(z)│の評価を比較すると、零交差手法は、確度において著しい優位点を有する。例えば、数列3,2,−1,−2を考察されたい。零交差手法では、ゼロは、2と−1との間に存在することが明らかである。しかしながら、対応する振幅列3,2,1,2を考察する場合、ゼロは、第2の要素と最後の要素との間のどこかに存在する、としか結論することができない。言い替えれば、零交差手法の場合の確度は、振幅ベースの手法の2倍である。
【0075】
さらに、本発明による情報エンコーダは、m=128等の長い予測子を用いてもよい。これに対して、チェビシェフ変換は、A(z)の長さが比較的短い、例えばm≦20である場合にしか十分に機能しない。長い予測子の場合、チェビシェフ変換は、数値的に不安定であり、アルゴリズムの実用的実装は不可能である。
【0076】
したがって、提案する情報エンコーダ1の主要な特性は、零交差が探索されることに起因するとともに、時間領域から周波数領域への変換が行われ、極めて低い計算複雑性によりゼロを発見し得ることに起因して、チェビシェフベースの方法と同じく高い確度、又はより優れた確度を達成し得ることにある。
【0077】
結果的に、本発明による情報エンコーダ1は、ゼロ(根)をより正確に決定するだけでなく、低い計算複雑性で決定する。
【0078】
本発明による情報エンコーダ1は、数列の線スペクトルを決定する必要があるあらゆる信号処理アプリケーションにおいて使用可能である。本明細書では、例示的に、情報エンコーダ1を音声符号化の側面で論じる。本発明は、音声信号又は汎用オーディオ信号等の入力信号から線スペクトルを決定するための方法を必要とし、かつ入力信号がデジタルフィルタ又は他の数列として表現される、スペクトル振幅包絡線、知覚周波数マスキングしきい値、時間振幅包絡線、知覚時間マスキングしきい値、又は他の包絡線形状、又は線スペクトルを用いて包絡線情報を表現する、符号化、分析又は処理のための自己相関信号等の包絡線形状と等価の他の表現、をモデリングするための線形予測子を使用する、音声、オーディオ及び/又はビデオ符号化デバイス又はアプリケーションにおいて適用可能である。
【0079】
情報信号ISは、例えば、オーディオ信号又はビデオ信号であってもよい。
【0080】
図2は、A(z)、P(z)及びQ(z)の例示的な関係を示す。垂直な点線は、周波数値f...fを描いている。零交差が常に見えるように、振幅は、デシベルスケールではなく直線軸上に表されていることに留意されたい。線スペクトル周波数は、P(z)とQ(z)の零交差において発生することが分かる。さらに、P(z)及びQ(z)の振幅は、どこにおいても2│A(z)│以下、即ち、|P(eiθ)|≦2|A(eiθ)|及び|Q(eiθ)|≦2|A(eiθ)|である。
【0081】
図3は、本発明による情報エンコーダのコンバータの第1の実施形態を示す略図である。
【0082】
本発明の好適な一実施形態によれば、コンバータ3は、予測多項式A(z)から多項式P(z)とQ(z)を決定する決定デバイス6を備えている。
【0083】
本発明の好適な一実施形態によれば、コンバータは、多項式対P(z)とQ(z)又は多項式対P(z)とQ(z)から導出される1つ又は複数の多項式を周波数領域へフーリエ変換するフーリエ変換デバイス8と、P(z)から導出されるスペクトルRESの位相をそれが厳密に実数であるように調整するとともに、Q(z)から導出されるスペクトルIESの位相をそれが厳密に虚数であるように調整する調整デバイス7と、を備えている。フーリエ変換デバイス8は高速フーリエ変換を基礎とするものであってもよいし、離散型フーリエ変換を基礎とするものであってもよい。
【0084】
本発明の好適な一実施形態によれば、調整デバイス7は、多項式対P(z)とQ(z)又は多項式対P(z)とQ(z)から導出される1つ又は複数の多項式の係数を循環シフトする係数シフタ7として構成されている。
【0085】
本発明の好適な一実施形態によれば、係数シフタ7は、係数列の原初の中間点がその数列の第1のポジションへシフトされるような方法で、係数を循環シフトするように構成されている。
【0086】
理論的に、対称数列のフーリエ変換が実数値をとり、かつ逆対称の数列が純虚数フーリエスペクトルを有することが知られている。本事例における入力数列は、長さm+lの多項式P(z)又はQ(z)の係数であるが、これより遙かに長い長さN>>(m+l)の離散型フーリエ変換を有する方が好まれると考えられる。より長いフーリエスペクトルを生成する従来的手法は、入力信号のゼロパディングである。しかし、数列のゼロパディングは、対称性が保たれるように慎重に実装されなければならない。
【0087】
まず、係数、
[p,p,p,p,p
を有する多項式P(z)について考察する。
【0088】
高速フーリエ変換アルゴリズムが通常適用される方法では、対称点が第1の要素であるということが要求され、それによって、例えばMATLABに適用する場合、実数値の出力を求めるために
fft([p,p,p,p,p])
のように書くことができる。具体的には、循環シフトが適用されてもよく、中間点要素に対応する対称点、すなわち係数pは、第1のポジションになるように左へシフトされる。次に、pの左側にあった係数は、数列の終わりに付加される。
【0089】
ゼロパディングされた数列、
[p,p,p,p,p,0,0...0]
の場合も、同じプロセスを適用することができる。よって、数列、
[p,p,p,0,0...0,p,p
が実数値の離散型フーリエ変換を有する。ここで、入力数列におけるゼロの数は、スペクトルの所望される長さをNとすれば、N−m−lである。
【0090】
同様に、多項式Q(z)に対応する係数、
[q,q,0,−q,−q
について考察されたい。前述の中間点が第1のポジションにくるように循環シフトを適用すれば、
[0,−q,−q,q,q
が得られ、これは、純虚数の離散型フーリエ変換を有する。次には、この数列にゼロパディング変換を行なうことができる。
[0,−q,−q,0,0...0,q,q
【0091】
上記は、数列の長さが奇数である事例にのみ当てはまり、よって、m+lは偶数であることに留意されたい。m+lが奇数である事例に関しては、2つのオプションがある。すなわち、周波数領域において循環シフトを実装することができ、あるいは、ハーフサンプルでDFTを適用することができる。
【0092】
本発明の好適な実施形態によれば、コンバータ3は、P(z)から導出される厳密な実数スペクトルRESとQ(z)から導出される厳密な虚数スペクトルIESのゼロを識別するためのゼロ識別子9を備えている。
【0093】
本発明の好適な一実施形態によれば、ゼロ識別子9は、
a)実数スペクトルRESをヌル周波数において開始することと、
b)実数スペクトルRESにおいて符号変化が発見されるまで周波数を増大することと、
c)虚数スペクトルIESにおいてさらなる符号変化が発見されるまで周波数を増大することと、
d)全てのゼロが発見されるまでステップb)及びステップc)を反復すること、によってゼロを識別するように構成されている。
【0094】
Q(z)、ひいてはスペクトルの虚数部IESは、ヌル周波数において常にゼロを有することに留意されたい。根は重なり合うことから、P(z)、ひいてはスペクトルの実数部RESは、ヌル周波数において常に非ゼロになる。したがって、ヌル周波数における実数部から開始して、最初の零交差、ひいては最初の周波数値fを示す最初の符号変化が発見されるまで、周波数を増大させることができる。
【0095】
根はインタレースされることから、Q(z)のスペクトルIESは、次の符号変化を有する。したがって、Q(z)のスペクトルIESの符号変化が発見されるまで、周波数を増大させることができる。次に、このプロセスは、全ての周波数値f...fが発見されるまで、P(z)とQ(z)のスペクトル間で交互に反復されてもよい。したがって、スペクトルRESとIESにおける零交差の位置決めに使用される手法は、チェビシェフ領域において適用される手法に類似する[6、7]。
【0096】
P(z)とQ(z)のゼロはインタレースされることから、1パスで全てのゼロを発見するように実数部RESと複素数部IES上のゼロの探索を交互に行い、複雑性を完全探索の半分に減らすことができる。
【0097】
本発明の好適な一実施形態によれば、ゼロ識別子9は補間によってゼロを識別するように構成されている。
【0098】
零交差手法に加えて、ゼロのポジションを、例えば[7]のような従来方法において行われるようなより高い確度で推定できるように、補間を容易に適用することができる。
【0099】
図4は、本発明による情報エンコーダ1のコンバータ3の第2の実施形態を示す略図である。
【0100】
本発明の好適な一実施形態によれば、コンバータ3は、長くされた多項式対P(z)とQ(z)を生成するために多項式P(z)とQ(z)に対して値「0」を有する1つ又は複数の係数を加えるゼロパディング・デバイス10を備えている。確度は、評価されるスペクトルRES、IESの長さを拡大することによってさらに向上させることができる。システムに関する情報を基礎として、事例によっては、実質上、周波数値f...f間の最小距離を決定し、ひいては、全ての周波数値f...fをそれで発見することができるスペクトルRES、IESの最小長さを決定することが可能である[8]。
【0101】
本発明の好適な一実施形態によれば、コンバータ3は、線形予測係数を予測多項式A(z)のスペクトル周波数表現RES、IESの周波数値f...fへ変換する間に、長くされた多項式P(z)とQ(z)の値「0」を有することが知られている係数を用いる演算の少なくとも一部が省略されるように構成される。
【0102】
しかしながら、スペクトルの長さが増せば、計算複雑性も増大する。複雑性の最大の誘因は、A(z)の係数の、高速フーリエ変換等の時間領域から周波数領域への変換である。しかしながら、これは、係数ベクトルが所望される長さにゼロパディングされていることから、極めて疎である。複雑性を低減するためにこの事実を容易に使用することができる。これは、どの係数がゼロであるかが正確に分かり、高速フーリエ変換の各反復において単純にゼロを包含する演算を省くことができるという意味において、どちらかといえば単純な問題である。このように疎な高速フーリエ変換の適用は単純であり、当業者であるプログラマは誰でもこれを実装することができる。このような実装の複雑性は、O(Nlog(1+m+l))である。ここで、Nはスペクトルの長さ、m及びlは先に定義した通りである。
【0103】
本発明の好適な一実施形態によれば、コンバータは、長くされた多項式P(z)及びQ(z)又は長くされた多項式P(z)及びQ(z)から導出される1つ又は複数の多項式のスペクトルの数値範囲を、長くされた多項式P(z)及びQ(z)にフィルタ多項式B(z)を乗算することによって制限する制限デバイス11を備えている。ここで、フィルタ多項式B(z)は対称性であって単位円上に根を持たない。B(z)は、先に説明した通りに求めることができる。
【0104】
図5は、予測子A(z)、対応する平坦化フィルタB(z)とB(z)及び積A(z)B(z)とA(z)B(z)の例示的な振幅スペクトルを示す。水平の点線は、0周波数とナイキスト周波数におけるA(z)B(z)のレベルを示す。
【0105】
本発明の好適な一実施形態(不図示)によれば、コンバータ3は、多項式P(z)及びQ(z)のスペクトルRES、IESの数値範囲を、多項式P(z)及びQ(z)又は多項式P(z)及びQ(z)から導出される1つ又は複数の多項式にフィルタ多項式B(z)を乗算することによって制限する制限デバイス11を備えている。ここで、フィルタ多項式B(z)は対称性であって、単位円上に根を持たない。
【0106】
音声コーデックは、限定リソースを有するモバイルデバイス上で実装されることが多く、数値演算は固定小数点表示によって実装されなければならない。したがって、実装されるアルゴリズムは、範囲が限定される数値表現を用いて動作することが極めて重要である。しかしながら、一般的な音声スペクトル包絡線の場合、フーリエスペクトルの数値範囲があまりに大きく、零交差位置の保持を保証するためには、FFTの32ビット実装が必要である。
【0107】
一方で、16ビットのFFTはより低い複雑性で実装可能である場合が多く、この16ビット範囲内に適合するようにスペクトル値の範囲を限定することが有益であると考えられる。方程式|P(eiθ)|≦2|A(eiθ)|及び|Q(eiθ)|≦2|A(eiθ)|からは、B(z)A(z)の数値範囲を限定することにより、B(z)P(z)及びB(z)Q(z)の数値範囲も限定されることが分かる。B(z)が単位円上にゼロを持たなければ、B(z)P(z)及びB(z)Q(z)は、単位円上にP(z)及びQ(z)と同じ零交差を有する。さらに、B(z)は、z−(m+l+n)/2P(z)B(z)及びz−(m+l+n)/2Q(z)B(z)が各々対称性及び逆対称を保ちかつそのスペクトルが純実数及び純虚数であるように、対称でなければならない。したがって、z(n+l)/2A(z)のスペクトルを評価する代わりに、z(n+l+n)/2A(z)B(z)を評価することができる。ここで、B(z)は、単位円上に根を持たない次数nの対称多項式である。言い替えれば、先に述べたものと同じ手法を適用することができるが、まずは、A(z)をフィルタB(z)で乗算し、次に修正した位相シフトz−(m+l+n)/2を適用する。
【0108】
残りのタスクは、A(z)B(z)の数値範囲が、B(z)は必ず対称性でありかつ単位円上に根を持たないという制約によって限定されるように、フィルタB(z)を設計することである。この要件を満たす最も単純なフィルタは、次数2の線形位相フィルタ、B(z)=β+β−1+β−2である。ここで、β∈Rはパラメータであり、かつ│β│>2│β│である。βを調整すればスペクトル傾斜を修正することができ、積A(z)B(z)の数値範囲を縮小することができる。計算上極めて効率的な手法は、βを0周波数及びナイキストにおける振幅が等しくなるように、すなわち│A(1)B(1)│=│A(−1)B(−1)│であるように選択することであり、例えば、β=A(1)−A(−1)及びβ=2(A(1)+A(−1))を選ぶことができる。
【0109】
この手法は、略平坦なスペクトルを提供する。
【0110】
A(z)が高域通過特性を有するのに対して、B(z)は低域通過であり、積A(z)B(z)は、予期されるように、0周波数及びナイキスト周波数において同じ振幅を有し、かつこれは多かれ少なかれ平坦であるということが図5から観察される。B(z)は1自由度しか持たないので、積が完全に平坦になると予期できないことは明らかである。さらに、B(z)A(z)の最高ピークと最低の谷との比は、A(z)のそれより遙かに小さいものであり得ることを観察されたい。これは、B(z)A(z)の数値範囲がA(z)のそれより遙かに小さいという望ましい効果が達成されていることを意味する。
【0111】
僅かに複雑性の高い、第2の方法は、A(0.5z)のインパルス応答の自己相関rを計算するものである。ここでは、0.5を乗算することによってA(z)のゼロが原点方向へ移動し、それによってスペクトル振幅が約半分に縮小される。自己相関rにレビンソン−ダービンを適用すれば、最小位相である次数nのフィルタH(z)が得られる。次には、B(z)=z−nH(z)H(z−1)を定義して、略一定である│B(z)A(z)│を求めることができる。│B2(z)A(z)│の範囲は、│B(z)A(z)│のそれより小さいことが留意されるであろう。B(z)を設計するためのさらなる手法は、FIR設計に関する古典的文献[18]において容易に見出すことができる。
【0112】
図6は、本発明による情報エンコーダ1のコンバータ3の第3の実施形態を示す略図である。
【0113】
本発明の好適な一実施形態によれば、調整デバイス12は、フーリエ変換デバイス8の出力の位相をシフトするための位相シフタ12として構成されている。
【0114】
本発明の好適な一実施形態によれば、位相シフタ12は、フーリエ変換デバイス8の出力の位相を、k番目の周波数ビンにexp(i2πkh/N)を乗算することによってシフトするように構成されている。ここで、Nはサンプルの長さであり、かつh=(m+l)/2である。
【0115】
時間領域における循環シフトが周波数領域における位相回転と同一であることはよく知られている。具体的には、時間領域におけるh=(m+l)/2ステップのシフトは、k番目の周波数ビンとexp(−i2πkh/N)との乗算に一致する。ただし、Nはスペクトルの長さである。したがって、循環シフトの代わりに周波数領域における乗算を適用すれば、全く同じ結果を得ることができる。ただし、この手法では、複雑性が僅かに増す。h=(m+l)/2は、m+lが偶数であるときにのみ整数であることに留意されたい。m+lが奇数のとき、循環シフトは有理数のステップ分の遅延を必要とすることになり、これを直に実装ことは困難である。代わりに、上述の相回転によって、周波数領域における対応するシフトを適用することができる。
【0116】
図7は、本発明による情報エンコーダ1のコンバータ3の第4の実施形態を示す略図である。
【0117】
本発明の好適な一実施形態によれば、コンバータ3は、多項式P(z)及びQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマ13を備えている。
【0118】
本発明の好適な一実施形態によれば、コンバータ3は、P(z)から導出される厳密な実数スペクトルとQ(z)からの厳密な虚数スペクトルが、単一のフーリエ変換により、例えば高速フーリエ変換(FFT)により合成多項式C(P(z),Q(z))を変換することによって確立されるように構成されている。
【0119】
多項式P(z)及びQ(z)は、各々、z−(m+l)/2における対称軸と対称であり逆対称である。よって、単位円z=exp(iθ)上で評価されるz−(m+l)/2P(z)及びz−(m+l)/2Q(z)のスペクトルは、各々、実数値及び複素数値ということになる。ゼロは単位円上に存在することから、零交差を探索すればゼロを発見することができる。さらに、単位円上の評価は、単純に高速フーリエ変換によって実行することができる。
【0120】
−(m+l)/2P(z)及びz−(m+l)/2Q(z)に対応するスペクトルは、各々実数と複素数であることから、これらを単一の高速フーリエ変換によって実行することができる。具体的には、和z−(m+l)/2(P(z)+Q(z))を求めれば、スペクトルの実数部と複素数部は、各々、z−(m+l)/2P(z)及びz−(m+l)/2Q(z)に対応する。さらに、z−(m+l)/2(P(z)+Q(z))=2z−(m+l)/2A(z)であることから、P(z)及びQ(z)を明示的に決定することなく、2z−(m+l)/2A(z)のFFTを直に取り込んでz−(m+l)/2P(z)及びz−(m+l)/2Q(z)に対応するスペクトルを求めることができる。知りたいものはゼロの位置のみであることから、スカラ2による乗算を省略して、代わりにFFTによるz−(m+l)/2A(z)を評価することができる。A(z)は、m+1個の非ゼロ係数しか持たないことから、FFT枝刈り(FFT pruning)を用いて複雑性を低減できることを観察されたい[11]。全ての根が発見されることを保証するためには、2つのゼロ毎にその間の少なくとも1つの周波数上でスペクトルが評価されるに足る長い長さNのFFTを用いなければならない。
【0121】
本発明の好適な一実施形態(不図示)によれば、コンバータ3は、長くされた多項式P(z)及びQ(z)から合成多項式C(P(z),Q(z))を確立するように構成された合成多項式フォーマを備えている。
【0122】
本発明の好適な一実施形態(不図示)によれば、コンバータは、P(z)から導出される厳密な実数スペクトル及びQ(z)からの厳密な虚数スペクトルが、合成多項式C(P(z),Q(z))を変換することによって単一のフーリエ変換により確立されるように構成されている。
【0123】
図8は、本発明による情報エンコーダ1のコンバータ3の第5の実施形態を示す略図である。
【0124】
本発明の好適な実施形態によれば、コンバータ3は、多項式対P(z)及びQ(z)又は多項式対P(z)及びQ(z)から導出される1つ又は複数の多項式を、P(z)から導出されるスペクトルが厳密に実数であり、かつQ(z)から導出されるスペクトルが厳密に虚数であるように、ハーフサンプルを用いて周波数領域へフーリエ変換するフーリエ変換デバイス14を備えている。
【0125】
ある代替例は、ハーフサンプルを有するDFTを設けたものである。具体的には、従来のDFTが、
と定義されるのに対して、ハーフサンプルDFTは、次式のように定義することができる。
【0126】
この公式化に対しては、FFTのような高速実装を容易に考案することができる。
【0127】
この公式化の利点は、対称点が通常のn=1ではなく、n=1/2に存在することにある。よって、このハーフサンプルDFTを用いれば、数列、
[2,1,0,0,1,2]
で、実数値のフーリエスペクトルRESが得られる。
【0128】
よって、m+lが奇数である場合、係数p,p,p,p,p,pを有する多項式P(z)に関して、ハーフサンプルDFT及びゼロパディングを用いれば、次のような入力数列の場合に実数値スペクトルRESを求めることができる。
[p,p,p,0,0...0,p,p,p
【0129】
同様に、多項式Q(z)の場合、数列、
[−q,−q,−q,0,0...0,q,q,q
にハーフサンプルDFTを適用して、純虚数スペクトルIESを求めることができる。
【0130】
これらの方法により、m及びlの如何なる組合せに対しても、多項式P(z)の実数値スペクトル及び任意のQ(z)の純虚数スペクトルを求めることができる。実際には、P(z)及びQ(z)のスペクトルが各々純実数と純虚数であることから、これらを単一の複素スペクトルに記憶することができ、これは、P(z)+Q(z)=2A(z)のスペクトルに一致する。係数2によるスケーリングでは、根の位置に変化がなく、よってこれを無視することができる。したがって、単一のFFTを用いてA(z)のスペクトルのみを評価すれば、P(z)及びQ(z)のスペクトルを求めることができる。先に説明したように、A(z)の係数に循環シフトを適用するだけでよい。
【0131】
例えば、m=4であり、l=0である場合、A(z)の係数は、
[a,a,a,a,a
であり、これは、ゼロパディングによって、次のように任意の長さNにすることができる。
[a,a,a,a,a,0,0...0]
【0132】
次に、(m+l)/2=2ステップの循環シフトを適用すれば、次のようになる。
[a,a,a,0,0...0,a,a
【0133】
この数列のDFTを採用すれば、スペクトルの実数部RESと複素数部IESにP(z)とQ(z)のスペクトルが存在する。
【0134】
m+lが偶数の事例における全体的アルゴリズムは、次のように述べることができる。aで示されるA(z)の係数は、長さNのバッファ内に存在するものとする。
【0135】
1.左へ(m+l)/2ステップのaに循環シフトを適用する。
【0136】
2.数列aの高速フーリエ変換を計算し、これをAで示す。
【0137】
3.全ての周波数値が発見されるまで、k=0を起点とし、次の(a)、(b)を交互に行う。
(a)符号(実数(A))=符号(実数(A+1))である間に、k:=k+1を増大する。零交差が発見されれば、kを周波数値のリストに記憶する。
(b)符号(虚数(A))=符号(虚数(A+1))である間に、k:=k+1を増大する。零交差が発見されれば、kを周波数値のリストに記憶する。
【0138】
4.各周波数値について、AとA+1との間を補間し、正確なポジションを決定する。
【0139】
ここで、関数符号(x)、実数(x)及び虚数(x)は、各々、xの符号、xの実数部及びxの虚数部を指す。
【0140】
m+lが奇数の事例では、循環シフトが僅かに左へ(m+l−1)/2ステップ低減され、通常の高速フーリエ変換がハーフサンプル高速フーリエ変換によって置換される。
【0141】
あるいは、循環シフトと第1のフーリエ変換との組合せを、常に、高速フーリエ変換及び周波数領域における位相シフトと置換することもできる。
【0142】
より正確な根位置を求めるためには、上述の提案方法を用いて最初の推定を行い、次に、根軌跡を精緻化(refine)する第2のステップを適用することが可能である。精緻化(refinement)のためには、デュラン−ケルナー法、アバース−エールリッヒ法、ラゲールのガウス−ニュートン法又はその他等[11−17]のあらゆる古典的な多項式根探索方法を適用することができる。
【0143】
ある公式化において、提示の本方法は、次のようなステップより成る。
【0144】
(a)長さNまでゼロパディングされた長さm+l+1の数列、ただしm+lは偶数、に対して、バッファ長さがNとなって出力スペクトルの所望される長さに一致するように、左へ(m+l)/2ステップの循環シフトを適用する、又は、
長さNまでゼロパディングされた長さm+l+1の数列、ただしm+lは奇数、に対して、バッファ長さがNとなって出力スペクトルの所望される長さに一致するように、左へ(m+l−1)/2ステップの循環シフトを適用する。
【0145】
(b)m+lが偶数であれば、数列に通常のDFTを適用する。m+lが奇数であれば、方程式3又は等価の表現が記述しているように、数列にハーフサンプルDFTを適用する。
【0146】
(c)入力信号が対称又は逆対称であれば、周波数領域表現の零交差を探索し、その位置をリストに記憶する。
【0147】
入力信号が合成列B(z)=P(z)+Q(z)であれば、周波数領域表現の実数部と虚数部の双方において零交差を探索し、その位置をリストに記憶する。入力信号が、合成列B(z)=P(z)+Q(z)であり、かつP(z)とQ(z)の根が交互するか、又はそれと同様の構造を有する場合には、周波数領域表現の実数部と虚数部を交互して零交差を探索し、その位置をリストに記憶する。
【0148】
別の公式化では、本提示方法は、次のようなステップより成る。
【0149】
(a)形式が先行点と同じである入力信号に対して、入力数列にDFTを適用する。
【0150】
(b)周波数領域値に相回転を適用する。これは、入力数列の左へ(m+l)/2ステップによる循環シフトに等しい。
【0151】
(c)先行点で行われたような零交差探索を適用する。
【0152】
以下は、記述した実施形態によるエンコーダ1及び方法に関連する言及である。
【0153】
幾つかの態様は、装置のコンテキストにおいて記述されているが、これらの態様が、対応する方法の説明をも表現し、ブロック又はデバイスが方法ステップ又は方法ステップの特徴に対応していることは明らかである。同様に、方法ステップのコンテキストにおいて記述されている態様は、対応する装置の対応するブロック又はアイテム又は特徴の説明をも表現している。
【0154】
所定の実装要件によっては、本発明の実施形態は、ハードウェアにおいてもソフトウェアにおいても実装することができる。その実装は、個々の方法が実行されるようにプログラム可能コンピュータシステムと共働する(又は、共働することができる)電子読取り可能制御信号を格納しているデジタル記憶媒体、例えばフロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROM又はフラッシュメモリを用いて実行することができる。
【0155】
本発明による幾つかの実施形態は、本明細書に記述している方法のうちの1つが実行されるようにプログラム可能コンピュータシステムと共働することができる電子読取り可能制御信号を有するデータキャリアを備える。
【0156】
概して、本発明の実施形態は、プログラムコードを有するコンピュータ・プログラム・プロダクトとしての実装が可能であり、プログラムコードは、コンピュータ上でコンピュータ・プログラム・プロダクトが実行されると本発明方法のうちの1つを実行するように作動する。プログラムコードは、例えば、機械読取り可能キャリア上に記憶されてもよい。
【0157】
他の実施形態は、機械読取り可能キャリア、又は非一時的記憶媒体上に記憶される、本明細書に記述している方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0158】
したがって、言い替えれば、本発明方法の一実施形態は、コンピュータ上でコンピュータプログラムが実行されると本明細書に記述している方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0159】
したがって、本発明方法のさらなる実施形態は、本明細書に記述している方法のうちの1つを実行するためのコンピュータプログラムを記憶して備えるデータキャリア(又はデジタル記憶媒体、若しくはコンピュータ読取り可能媒体)である。
【0160】
したがって、本発明方法のさらなる実施形態は、本明細書に記述している方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリーム又は信号シーケンスである。データストリーム又は信号シーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して伝送されるように構成されてもよい。
【0161】
さらなる実施形態は、本明細書に記述している方法のうちの1つを実行するように構成され、又は実行するように調整される処理手段、例えばコンピュータ、又はプログラマブル論理デバイス、を含む。
【0162】
さらなる実施形態は、本明細書に記述している方法のうちの1つを実行するためのコンピュータプログラムをインストールしているコンピュータを含む。
【0163】
実施形態によっては、プログラム可能な論理デバイス(例えば、フィールド・プログラマブル・ゲート・アレイ)は、本明細書に記述している方法の機能のうちの一部又は全てを実行するために使用されてもよい。実施形態によっては、フィールド・プログラマブル・ゲート・アレイは、本明細書に記述している方法のうちの1つを実行するために、マイクロプロセッサと共働してもよい。概して、本方法は、効果的には、あらゆるハードウェア装置によって実行される。
【0164】
本発明を、幾つかの実施形態に関連して記述してきたが、本発明の範囲に含まれる変更、置換及び均等物が存在する。本発明の方法及び組成を実装する方法には、多くの代替方法が存在することも留意されるべきである。したがって、添付した以下のクレームの意図は、このような変更、置換及び均等物を本発明の精神及び範囲に包含されるものとして解釈することにある。
【符号の説明】
【0165】
1 情報エンコーダ
2 アナライザ
3 コンバータ
4 量子化器
5 ビットストリーム生成器
6 決定デバイス
7 係数シフタ
8 フーリエ変換デバイス
9 ゼロ識別子
10 ゼロパディング・デバイス
11 制限デバイス
12 位相シフタ
13 合成多項式フォーマ
14 ハーフサンプル・フーリエ変換デバイス
IS 情報信号
RES 実数スペクトル
IES 虚数スペクトル
...f 周波数値
q1...fqn 量子化された周波数値
BS ビットストリーム

図1
図2
図3
図4
図5
図6
図7
図8