IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオの特許一覧

特開2024-138295オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ
<>
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図1
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図2
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図3
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図4
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図5
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図6
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図7
  • 特開-オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024138295
(43)【公開日】2024-10-08
(54)【発明の名称】オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ
(51)【国際特許分類】
   G10L 21/0208 20130101AFI20241001BHJP
   G10L 19/08 20130101ALI20241001BHJP
【FI】
G10L21/0208 100B
G10L19/08 Z
【審査請求】有
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024099693
(22)【出願日】2024-06-20
(62)【分割の表示】P 2022196100の分割
【原出願日】2015-07-03
(31)【優先権主張番号】14178821.6
(32)【優先日】2014-07-28
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】110003915
【氏名又は名称】弁理士法人岡田特許事務所
(72)【発明者】
【氏名】ラベリ エマニュエル
(72)【発明者】
【氏名】ジャンダー マヌエル
(72)【発明者】
【氏名】ピェトルズィク グジェゴジュ
(72)【発明者】
【氏名】ディーツ マルティーン
(72)【発明者】
【氏名】ゲイヤー マルク
(57)【要約】      (修正有)
【課題】フィルタされたオーディオ信号におけるいかなる潜在的な歪みを作り出すことなく、フィルタされたオーディオフレームの中の不連続点を除去する方法及び装置を提供する。
【解決手段】方法は、オーディオ信号の現フレームを受信することS100と、オーディオ信号の現フレームをフィルタ処理することS102と、既定の信号を線形予測符号化(LPC)フィルタ処理することによって得られた信号の過去フレームと、フィルタ処理された現フレームとの間の不連続点を、線形予測フィルタ処理を使用して除去することS104と、を含む。
【選択図】図4
【特許請求の範囲】
【請求項1】
オーディオ信号(100)を処理する方法であって、前記方法は、
線形予測フィルタ処理を使用して前記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点(106a,106b)を除去するステップ(S102,S104,S300-S308,S400-S402)を含む、方法。
【請求項2】
前記オーディオ信号の前記現フレームをフィルタ処理するステップと、前記線形予測フィルタの初期状態が、前記過去フレームの最後の部分に基づいて定義される、既定の信号を線形予測フィルタ処理することによって得られた信号で、フィルタ処理された前記現フレームの最初の部分を修正することによって前記不連続点を除去するステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記線形予測フィルタの前記初期状態は、前記現フレームをフィルタ処理するためのフィルタパラメータの前記セットを用いてフィルタ処理された、フィルタ処理されていない前記過去フレームの最後の部分に基づいて定義される、請求項2に記載の方法。
【請求項4】
前記フィルタ処理されたまたはフィルタ処理されていない前記オーディオ信号(100)に対する前記線形予測フィルタを推定するステップをさらに含む、請求項1ないし請求項3のいずれかに記載の方法。
【請求項5】
前記線形予測フィルタを推定するステップは、レビンソン-ダービン・アルゴリズムを用いて、前記オーディオ信号(100)の前記過去および/または現フレームに基づいて、または、前記オーディオ信号(100)のフィルタ処理された前記過去フレームに基づいて、前記線形予測フィルタを推定するステップを含む、請求項4に記載の方法。
【請求項6】
前記線形予測フィルタは、オーディオ・コーデックの線形予測フィルタを含む、請求項1ないし請求項3のいずれかに記載の方法。
【請求項7】
前記不連続点を除去するステップは、フィルタ処理された前記現フレームの前記最初の部分を処理するステップを含み、前記現フレームの前記最初の部分は、前記現フレーム内のサンプルの合計数以下である既定の数のサンプルを有し、そして、前記現フレームの前記最初の部分を処理するステップは、フィルタ処理された前記現フレームの前記最初の部分からゼロ入力応答(ZIR)の最初の部分を取り去るステップ(S304,S402)を含む、請求項1ないし請求項6のいずれかに記載の方法。
【請求項8】
フィルタ処理された前記現フレームを作り出すために、FIRフィルタのような非再帰フィルタを用いて、前記オーディオ信号の前記現フレームをフィルタ処理するステップ(S400)を含む、請求項7に記載の方法。
【請求項9】
IIRフィルタのような再帰フィルタを用いてサンプルごとに前記オーディオ信号のフィルタ処理されていない前記現フレームを処理するステップを含み、ここで、前記現フレームの前記最初の部分のサンプルを処理するステップは、
フィルタ処理されたサンプルを作り出すために、前記現フレームの前記フィルタパラメータを用いて前記再帰フィルタにより前記サンプルをフィルタ処理するステップ(S302)と、
フィルタ処理された前記現フレームの前記対応するサンプルを作り出すために、前記フィルタ処理されたサンプルから対応するZIRサンプルを取り去るステップ(S304)と、
を含む、請求項7に記載の方法。
【請求項10】
フィルタ処理するステップ(S302)および取り去るステップ(S304)は、前記現フレームの前記最初の部分内の前記最後のサンプルが処理されるまで繰り返され、そして、前記方法は、前記現フレームの前記フィルタパラメータを用いて、前記再帰フィルタにより前記現フレーム内の前記残りのサンプルをフィルタ処理するステップ(S306)をさらに含む、請求項9に記載の方法。
【請求項11】
前記ZIRを生成するステップを含み、
前記ZIRを生成するステップは、
フィルタ処理された信号の第1部分を作り出すために、前記フィルタおよび前記現フレームをフィルタ処理するために使用される前記フィルタパラメータを用いて、フィルタ処理されていない前記過去フレームのM個の前記最後のサンプルをフィルタ処理するステップ(S200)であって、Mは、前記線形予測フィルタの次数である、フィルタ処理するステップと、
フィルタ処理された信号の第2部分を生成するために、前記過去フレームの前記フィルタパラメータを用いてフィルタ処理された、フィルタ処理された前記過去フレームの前記M個の最後のサンプルを、フィルタ処理された信号の前記第1部分から取り去るステップ(S202)と、
前記線形予測フィルタおよびフィルタ処理された信号の前記第2部分に等しい初期状態を用いてゼロサンプルのフレームをフィルタ処理することによって、線形予測フィルタのZIRを生成するステップ(S204)と、
を含む、請求項7ないし請求項10のいずれかに記載の方法。
【請求項12】
その振幅が急速にゼロに減少するようなZIRのウィンドウ処理を含む、請求項11に記載の方法。
【請求項13】
コンピュータ上で実行される場合、請求項1ないし請求項12のいずれかに記載の方法を実行する命令を格納しているコンピュータ可読媒体を含む、非一時的コンピュータ・プログラム製品。
【請求項14】
オーディオ信号(100)を処理するための装置であって、前記装置は、
線形予測フィルタ処理を使用して前記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点を除去するためのプロセッサ(102,110,112)を含む、装置。
【請求項15】
オーディオ信号(100)を処理するための装置であって、前記装置は、請求項1ないし請求項12のうちの1つの前記方法に従って作動するように構成される、装置。
【請求項16】
請求項14または請求項15の装置を含む、オーディオデコーダ(250)。
【請求項17】
請求項14または請求項15の装置を含む、オーディオエンコーダ(200)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の分野に関し、より具体的には、複数のオーディオフレームを含むオーディオ信号を処理するための方法に関し、連続的なフィルタ処理されたオーディオフレームの間の不連続点が低減されるか、または除かれる。
【背景技術】
【0002】
オーディオ信号処理の分野において、オーディオ信号は、さまざまな理由、たとえば、長期予測フィルタが、オーディオ信号におけるハーモニックスのセットを完全に減衰するか、または、さらに抑制するために、オーディオ信号エンコーダで用いられうるために、フィルタ処理されうる。
【0003】
オーディオ信号は、複数のオーディオフレームを含み、フレームは、長期予測フィルタを用いてフィルタ処理される。オーディオ信号の2つの連続フレームを考慮する場合、過去フレームおよび現フレーム、パラメータcのセットを有する線形フィルタH(z)が、オーディオ信号をフィルタ処理するために使用される。より具体的には、過去フレームは、いわゆるフィルタ処理された過去フレームを作り出すパラメータc0の最初のセットを使用して、フィルタH(z)を用いてフィルタ処理される。現フレームは、フィルタ処理された現フレームを作り出すパラメータc1のセットを使用して、フィルタH(z)を用いてフィルタ処理される。図1は、周知の方法に従ってオーディオ信号の連続フレームを処理するためのブロック図である。複数のオーディオフレームを含むオーディオ信号100が供給される。オーディオ信号100は、フィルタブロック102に供給され、そして、オーディオ信号100の現フレームnがフィルタ処理される。オーディオ信号100の側のフィルタブロックは、オーディオ信号の現フレームのためのフィルタパラメータcnのセットを受信する。フィルタブロック102は、オーディオ信号の現フレームnをフィルタ処理し、そして、連続的にフィルタ処理されたフレームを含むフィルタ処理されたオーディオ信号104を出力する。図1において、フィルタ処理された現フレームn、フィルタ処理された過去フレームn-1およびフィルタ処理された最後から2番目のフレームn-2が概略的に表現される。フィルタ処理されたフレームは、フィルタ処理されたフレームの間のフィルタ処理によって取り込まれうる不連続点106a,106bを概略的に示すために、その間のそれぞれのギャップを用いて、図1において、概略的に表現される。フィルタブロック102は、過去フレームn-1および現フレームnのためのそれぞれのフィルタパラメータc0およびc1を用いて、オーディオ信号のフレームのフィルタ処理をもたらす。一般に、フィルタブロック102は、線形フィルタH(z)でありえ、この種の線形フィルタH(z)の1つの例は、上述した長期予測フィルタ

H(z)=1-g・z-T

である。ここで、フィルタパラメータは、ゲイン「g」およびピッチラグ「T」である。より一般的な形において、長期予測フィルタは、以下のように記載されうる。

H(z)=1-g・A(z)・z-T

ここで、A(z)はFIRフィルタである。長期予測フィルタは、オーディオ信号においてハーモニックスのセットを完全に減衰するか、または、さらに抑制するために、使用されうる。しかしながら、この種の長期予測フィルタを使用する場合、そして、過去フレームのフィルタパラメータc0が、現フレームのフィルタパラメータc1と異なる場合、フィルタ処理された過去フレームn-1とフィルタ処理された現フレームnとの間において、不連続点106a,106b(図1を参照)を取り入れる高い確率がある。この不連続点は、フィルタ処理されたオーディオ信号104において、たとえば、「クリック」において、アーティファクトを作り出しうる。
【0004】
それゆえに、今回は、望まれていないアーティファクトを作り出しうる不連続点を結果として得る連続フレームのフィルタ処理の有する上記した課題からみて、可能な不連続点を除去する技術が必要である。オーディオ信号のフィルタ処理されたフレームの不連続点の除去を取り扱っているいくつかの技術方法は、公知技術である。
【0005】
線形フィルタH(z)がFIRフィルタである場合において、現フレームは、フィルタ処理された現フレームを作り出すために現フレームのフィルタパラメータc1を用いてフィルタ処理される。加えて、現フレームの最初の部分は、フィルタ処理されたフレーム部分を作り出すために過去フレームのフィルタパラメータc0を用いてフィルタ処理され、そうすると、重畳加算またはクロスフェード演算がフィルタ処理された現フレームおよびフィルタ処理されたフレーム部分の最初の部分を通じて実行される。図2は、不連続点を除去するために連続的なオーディオフレームを処理するためのこの種の従来の方法のブロック図を示す。図1と比較したとき、フィルタブロック102は、重畳加算またはクロスフェード演算を実行するためのさらなる処理ブロック108を含む。フィルタ処理されたオーディオ信号104において、図1のギャップのない連続的なフィルタ処理されたフレームn,n-1,およびn-2を示している図2において概略的に示されるように、連続的なフィルタされたフレームの間の不連続点がないか、低減されうる。
【0006】
他の従来技術の方法において、フィルタH(z)は、再帰的要素を有するフィルタ、たとえば、IIRフィルタでありうる。この種の場合において、図2に関して上記のとおりの方法は、サンプルごとに適用される。第1のステップにおいて、処理は、第1のフィルタ処理されたサンプルを得ている過去フレームn-1のフィルタパラメータc0を用いてフィルタ処理された現フレームnの最初の部分の第1のサンプルから始める。サンプルは、第2のフィルタ処理されたサンプルを作り出す現フレームnのフィルタパラメータc1でフィルタ処理される。それから、重畳加算またはクロスフェード演算が、フィルタ処理された現フレームnのサンプルに対応して得る第1および第2のフィルタ処理されたサンプルに基づいて実行される。それから、次のサンプルが処理され、そして、現フレームnの最初の部分の最後のサンプルが処理されるまで、上記ステップは繰り返される。現フレームnの残りのサンプルは、現フレームnのフィルタパラメータc1を用いて処理される。
【0007】
連続的なフィルタ処理されたフレームから不連続点を除去するための上述の周知の方法のための例は、たとえば、変換コーダに関連して米国特許第5012517号(特許文献1)において、スピーチ帯域拡大に関連して欧州特許第0732687号(特許文献2)において、変換オーディオコーダに関連して米国特許第5999899号(特許文献3)において、または、復号化されたスピーチポストフィルタに関連して米国特許第7353168号(特許文献4)において記載されている。
【0008】
上記の方法は、望まれていない信号の不連続点を除去するために効率的である一方、これらの方法は、効果的であるための現フレーム(最初の部分)の特定部分を動作するので、フレーム部分の長さが、十分に長く、たとえば、20msのフレーム長さの場合、フレーム部分または最初の部分の長さは、5msの長さと同じくらいでありうる。特定の場合、これは、あまりに長く、特に、状況において、過去フレームのフィルタパラメータc0が現フレームに当てはまらず、これは、付加的なアーティファクトを結果として得る。1つの例は、急速に変化するピッチを有するハーモニックオーディオ信号であり、そして、長期予測フィルタは、ハーモニックスの振幅を低減するように設計される。その場合において、ピッチラグは、あるフレームから次のフレームまで異なる。現フレームにおける推定されたピッチを有する長期予測フィルタは、現フレームにおけるハーモニックスの振幅を効果的に低減するが、しかし、オーディオ信号のピッチが異なる他のフレーム(たとえば、次のフレームの最初の部分)において使用される場合、それは、ハーモニックスの振幅を低減しないだろう。信号における非調和に関連した要素の振幅を低減することによって、信号における歪みを取り込むように、事態を悪化さえさせうる。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許第5012517号明細書
【特許文献2】欧州特許第0732687号明細書
【特許文献3】米国特許第5999899号明細書
【特許文献4】米国特許第7353168号明細書
【発明の概要】
【発明が解決しようとする課題】
【0010】
フィルタされたオーディオ信号におけるいかなる潜在的な歪みを作り出すことなく、フィルタされたオーディオフレームの中の不連続点を除去するための改良された方法を提供することが本発明の基本的な目的である。
【0011】
この目的は、独立クレームに記載の方法および装置によって達成される。
【0012】
本発明は、オーディオ信号を処理する方法を提供し、方法は、線形予測フィルタ処理を使用してオーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点を除去するステップを含む。
【0013】
線形予測フィルタは、
として定義され、Mはフィルタの次数であり、amは、フィルタ係数(a0=1を有する)である。この種のフィルタは、線形予測符号化(Linear Predictive Coding;LPC)としても公知である。
【0014】
実施態様によれば、方法は、オーディオ信号の現フレームをフィルタ処理するステップと、線形予測フィルタの初期状態が、過去フレームの最後の部分に基づいて定義される、既定の信号を線形予測フィルタ処理することによって得られる信号で、フィルタ処理された現フレームの最初の部分を修正することによって不連続点を除去するステップと、を含む。
【0015】
実施形態によれば、線形予測フィルタの初期状態は、現フレームをフィルタ処理するためのフィルタパラメータのセットを用いてフィルタ処理された、フィルタ処理されていない過去フレームの最後の部分に基づいて定義される。
【0016】
実施形態によれば、方法は、フィルタ処理されたまたはフィルタ処理されていないオーディオ信号における線形予測フィルタを推定するステップを含む。
【0017】
実施形態によれば、線形予測フィルタを推定するステップは、レビンソン-ダービン・アルゴリズムを用いて、オーディオ信号の過去または現フレーム基づくか、または、オーディオ信号のフィルタ処理された過去のフレームに基づくフィルタを推定するステップを含む。
【0018】
実施形態によれば、線形予測フィルタは、オーディオ・コーデックの線形予測フィルタを含む。
【0019】
実施形態によれば、不連続点を除去するステップは、フィルタ処理された現フレームの最初の部分を処理するステップを含み、現フレームの最初の部分は、現フレームにおけるサンプルの合計以下である既定の数のサンプルを有し、そして、現フレームの最初の部分を処理するステップは、フィルタ処理された現フレームの最初の部分からゼロ入力応答(zero-input-response;ZIR)の最初の部分を取り去るステップを含む。
【0020】
実施形態によれば、方法は、フィルタ処理された現フレームを作り出すために、FIRフィルタのような非再帰フィルタを用いて、オーディオ信号の現フレームをフィルタ処理するステップを含む。
【0021】
実施形態によれば、方法は、IIRフィルタのような再帰フィルタを用いてサンプルごとにオーディオ信号のフィルタ処理されていない現フレームを処理するステップを含み、そして、現フレームの最初の部分のサンプルを処理するステップは、
フィルタ処理されたサンプルを作り出すために、現フレームのフィルタパラメータを用いて再帰フィルタによりサンプルをフィルタ処理するステップと、
フィルタ処理された現フレームの対応するサンプルを作り出すために、フィルタ処理されたサンプルから対応するZIRサンプルを取り去るステップと、を含む。
【0022】
実施形態によれば、フィルタ処理するステップおよび取り去るステップは、現フレームの最初の部分内の最後のサンプルが処理されるまで、繰り返され、方法は、現フレームのフィルタパラメータを用いて、再帰フィルタにより現フレーム内の残りのサンプルをフィルタ処理するステップをさらに含む。
【0023】
実施形態によれば、方法は、ZIRを生成するステップを含み、ZIRを生成するステップは、
フィルタ処理された信号の第1部分を作り出すために、フィルタおよび現フレームをフィルタ処理するために使用されるフィルタパラメータを用いて、フィルタ処理されていない過去フレームのM個の最後のサンプルをフィルタ処理するステップであって、Mは、線形予測フィルタの次数である、フィルタ処理するステップと、
フィルタ処理された信号の第2部分を生成するために、過去フレームのフィルタパラメータを用いてフィルタ処理された、フィルタ処理された過去フレームのM個の最後のサンプルを、フィルタ処理された信号の第1部分から取り去るステップと、
線形予測フィルタおよびフィルタ処理された信号の第2部分に等しい初期状態を用いてゼロサンプルのフレームをフィルタ処理することによって、線形予測フィルタのZIRを生成するステップと、を含む。
【0024】
実施形態によれば、方法は、その振幅が急速にゼロに減少するようなZIRのウィンドウ処理を含む。
【0025】
本発明は、前述の追加の不必要な歪みを結果として得る信号の不連続点を除去するための従来の方法において認識された問題が、主に、過去フレームのためのフィルタパラメータに基づいて現フレームまたは少なくともその部分の処理に起因するといった発明者の知見に基づく。本発明の方法によれば、これは回避される。すなわち、本発明の方法は、過去フレームのフィルタパラメータを用いて現フレームの部分をフィルタ処理せず、前述の課題を回避する。実施形態によれば、不連続点を除去するために、LPC(linear predictive filter)フィルタ(線形予測フィルタ)が不連続点を除去するために使用される。LPCフィルタは、オーディオ信号において推定され、したがって、LPCフィルタを用いた場合、オーディオ信号のスペクトル形状が不連続点をマスキングするために、オーディオ信号のスペクトル形状の良好なモデルである。実施形態において、LPCフィルタは、フィルタ処理されていないオーディオ信号に基づくか、または、前述の線形フィルタH(z)によってフィルタ処理されたオーディオ信号に基づいて、推定されうる。実施形態によれば、LPCフィルタは、オーディオ信号、たとえば、現フレームおよび/または過去フレーム、ならびにレビンソン-ダービン・アルゴリズムを用いることによって推定されうる。それは、レビンソン-ダービン・アルゴリズムを用いて、フィルタ処理された過去のフレーム信号のみに基づいて、計算されることもできる。
【0026】
さらに、他の実施形態において、オーディオ信号を処理するためのオーディオ・コーデックは、線形フィルタH(z)を使用し、そして、変換ベースのオーディオ・コーデックにおける量子化ノイズを形づくるために、たとえば、量子化されるか、または、されない、LPCフィルタを使用することもできる。この種の実施形態において、この既存のLPCフィルタが、新規なLPCフィルタを推定するために必要な付加的な複雑さのない不連続点を平滑化するために、直接使用されうる。
【0027】
以下に、本発明の実施形態は、添付の図面を参照して説明される。
【図面の簡単な説明】
【0028】
図1図1は、従来の方法に従うオーディオ信号の連続フレームを処理するためのブロック図を示す。
図2図2は、不連続点を除去するための連続オーディオフレームを処理するのための他の従来の方法のブロック図を示す。
図3図3は、エンコーダ側および/またはデコーダ側でのオーディオ信号の連続フレームの間の不連続点を除去するための本発明の方法を実施しているオーディオ信号を送信するためのシステムの簡略化したブロック図を示す。
図4図4は、実施形態によるオーディオ信号の連続フレームの間の不連続点を除去するための本発明の方法を表現しているフロー図を示す。
図5図5は、不連続点の除去にもかかわらず、出力信号において望まれていない歪みを回避している本発明の実施形態による現オーディオフレームを処理するための概略ブロック図を示す。
図6図6は、ZIRを生成するための図5のブロックの機能を表しているフロー図を示す。
図7図7は、フィルタブロックが、IIRフィルタのような再帰フィルタを含む場合におけるフィルタ処理された現フレームの最初の部分を処理するための図5におけるブロックの機能を表しているフロー図を示す。
図8図8は、フィルタブロックが、FIRフィルタのような非再帰フィルタを含む場合におけるフィルタ処理された現フレームの最初の部分を処理するための図5におけるブロックの機能を表しているフロー図を示す。
【発明を実施するための形態】
【0029】
以下において、発明の方法の実施形態は、より詳細に説明される。そして、なお、添付の図面において、同じまたは類似の機能を有する要素は、同じ参照番号によって表示される。
【0030】
図3は、エンコーダ側および/またはデコーダ側での発明の方法を実施しているオーディオ信号を送信するためのシステムの簡略化したブロック図を示す。図3のシステムは、オーディオ信号204を入力装置202において受信しているエンコーダ200を含む。エンコーダは、オーディオ信号204を受信している符号化プロセッサ206を含み、エンコーダの出力装置208で供給される符号化オーディオ信号を生成する。符号化プロセッサは、不連続点を回避するために受信されるオーディオ信号の連続オーディオフレームを処理するための発明の方法を実施するためにプログラムされるか、または構築されうる。他の実施形態において、エンコーダは、送信システムの一部であることを必要としないが、符号化されたオーディオ信号を生成することは独立型装置であるか、または、オーディオ信号送信器の一部でありうる。実施形態によれば、エンコーダ200は、212で示されるように、オーディオ信号の無線通信を許容するためのアンテナ210を含みうる。他の実施形態において、エンコーダ200は、たとえば、参照符合214で示されるように、有線の接続線を用いて、出力装置208で供給される符号化オーディオ信号を出力しうる。
【0031】
図3のシステムは、たとえば、有線214またはアンテナ254を介して、エンコーダ250によって処理される符号化オーディオ信号を受信する入力装置252を有するデコーダ250をさらに含む。エンコーダ250は、符号化信号において作動し、出力装置260で復号化オーディオ信号258を供給している復号化プロセッサ256を含む。復号化プロセッサ256は、不連続点が回避されるというような方法で、フィルタ処理される連続フレームにおける発明の方法に従って作動するために実施されうる。他の実施形態において、デコーダは、送信システムの一部である必要はなく、むしろ、符号化オーディオ信号を復号化するための独立型装置でもよく、あるいは、オーディオ信号受信器の一部でもよい。
【0032】
以下において、符号化プロセッサ206および復号化プロセッサ256のうちの少なくとも1つにおいて実施されうる本発明の方法の実施形態が、さらに詳細に記載される。図4は、本発明の方法の実施形態に従うオーディオ信号の現フレームを処理するためのフロー図を示す。現フレームの処理が記載され、そして、過去フレームが後述する同じ技術を用いて既に処理されると仮定される。本発明によれば、ステップS100において、オーディオ信号の現フレームが受信される。現フレームは、たとえば、図1および図2(フィルタブロック102を参照)に関して上記のとおりの方法において、ステップS102において、フィルタ処理される。本発明の方法によれば、フィルタ処理された過去フレームn-1とフィルタ処理された現フレームnとの間の不連続点(図1または図2を参照)は、ステップS104で示されるように線形予測フィルタ処理を用いて除去される。実施形態によれば、線形予測フィルタは、
として定義され、Mはフィルタの次数であり、amは、フィルタ係数(a0=1を有する)である。この種のフィルタは、線形予測符号化(Linear Predictive Coding;LPC)としても公知である。実施形態によれば、フィルタ処理された現フレームは、フィルタ処理された現フレームの少なくとも一部に線形予測フィルタ処理を適用することによって処理される。不連続点は、線形予測符号化フィルタの初期状態が、過去フレームの最後の部分に基づいて定義される、既定の信号を線形予測フィルタ処理することによって得られる信号で、フィルタ処理された現フレームの最初の部分を修正することによって除去されうる。線形予測符号化フィルタの初期状態は、現フレームのためのフィルタパラメータのセットを用いてフィルタ処理された過去フレームの最後の部分に基づいて定義されうる。本発明の方法は、過去フレームのために使用されるフィルタ係数を用いてオーディオ信号の現フレームをフィルタ処理する必要はなく、それによって、それらが、図2に関して上記の従来技術の方法において経験があるように、現フレームおよび過去フレームのためのフィルタパラメータの不適当な組み合わせのために起こる課題を回避するとして、有利である。
【0033】
図5は、不連続点を除去するにもかかわらず、出力信号において望まれていない歪みを回避する本発明の実施形態によるオーディオ信号の現オーディオフレームを処理するための概略ブロック図を示す。図5において、図1および図2におけるように同じ参照符合が使用される。オーディオ信号100の現フレームnが受信され、そして、オーディオ信号100の各フレームは、複数のサンプルを有する。オーディオ信号100の現フレームnは、フィルタブロック102によって処理される。図1および図2の従来技術の方法と比較した場合、図5に関して記載されるように実施形態によれば、フィルタ処理された現フレームは、ブロック110によって概略的に示されるようにZIRサンプルに基づいてさらに処理される。過去フレームn-1に基づいて、そして、LPCフィルタに基づく、本実施形態によれば、ZIRサンプルは、ブロック112によって概略的に示されるように、作り出される。
【0034】
処理ブロック110および112の機能は、これから、より詳細に記載される。図6は、ZIRサンプルを生成するための処理ブロック112の機能を表しているフロー図を示す。前述のように、オーディオ信号100のフレームは、それぞれのフレームのために選択され、あるいは決定されたフィルタパラメータcを用いて線形フィルタH(z)によりフィルタ処理される。フィルタH(z)は、たとえば、IIRフィルタである再帰フィルタであり、または、たとえば、FIRフィルタである非再帰フィルタでありうる。処理ブロック112において、量子化されるか、あるいは量子化されないLPCフィルタが用いられる。LPCフィルタは、次数Mであり、そして、フィルタ処理されたあるいはフィルタ処理されていないオーディオ信号に推定されるか、またはオーディオ・コーデックにおいて使用されもしたLPCフィルタでありうる。ステップS200において、過去フレームn-1のM(M=LPCフィルタの次数)個の最後のサンプルは、また、現フレームnのフィルタパラメータまたは係数c1を用いて、フィルタH(z)によりフィルタ処理される。ステップS200は、このことにより、フィルタ処理された信号の第1部分を作り出す。ステップS202において、フィルタ処理された過去フレームn-1(過去フレームn-1のフィルタパラメータまたは係数c0を用いてフィルタ処理された過去フレームのM個の最後のサンプル)のM個の最後のサンプルは、ステップS200によって供給されたフィルタ処理された信号の第1部分から取り去られ、それによって、フィルタ処理された信号の第2部分が作り出される。ステップS204において、次数Mを有するLPCフィルタが、適用され、より詳しくは、LPCフィルタのゼロ入力応答(ZIR)が、ゼロサンプルのフレームをフィルタ処理することによって、ステップS204において生成される。ここで、フィルタの初期状態は、フィルタ処理された信号の第2部分に等しく、それによって、ZIRを生成する。実施形態によれば、ZIRは、その振幅が急速にゼロに減少するようなウィンドウ処理をしうる。
【0035】
図5に関して上記されるように、ZIRは、処理ブロック110において適用され、その機能は、線形フィルタH(z)として、IIRフィルタのような再帰フィルタを用いた場合のために、図7のフロー図に関して記載される。図5に関して記載される実施形態によれば、望まれていない歪みを回避するとともに、現フレームおよび過去フレームの間の不連続点を除去するために、現フレームnのフィルタ処理ステップは、サンプルごとに現フレームnを処理(フィルタ処理)するステップを含む。ここで、最初の部分のサンプルは、本発明の方法により処理される。さらに具体的には、現フレームnの最初の部分のM個のサンプルが処理され、最初のステップS300において、変数mが0にセットされる。次のステップS302において、現フレームnのサンプルmは、フィルタH(z)および現フレームnのためのフィルタ係数またはパラメータc1を用いてフィルタ処理される。このように、従来の方法の他に、本発明の方法によれば、現フレームは、過去フレームから係数を使用してフィルタ処理されず、結果として、現フレームからのみの係数が、不連続点が除去される事実にもかかわらず、従来の方法において存在する望まれていない歪みを回避する。ステップS302は、フィルタ処理されたサンプルmを得て、そして、ステップS304において、サンプルmに対応するZIRサンプルは、フィルタ処理された現フレームnの対応するサンプルを得ているフィルタ処理されたサンプルmから取り去られる。ステップS306において、現フレームnの最初の部分の最後のサンプルMが処理されるかどうかが決定される。最初の部分のすべてのM個のサンプルが処理されたわけではない場合、変数mは増加し、そして、方法ステップS302からS306が現フレームnの次のサンプルに対して繰り返される。一旦、最初の部分の全てのM個のサンプルが処理されると、ステップS308において、現フレームnの残っているサンプルが、現フレームのフィルタパラメータc1を用いてフィルタ処理され、それにより、連続フレームの間の不連続点の除去することに望まれていない歪みを回避している発明の方法に従って、処理されるフィルタ処理された現フレームnを供給する。
【0036】
他の実施形態によれば、線形フィルタH(z)は、FIRフィルタのような非再帰フィルタであり、そして、ZIRは、図5に関して上述のとおり、処理ブロック110において適用される。この実施形態の機能は、図8のフロー図に関して記載される。ステップS400において、現フレームnは、現フレームのためのフィルタ係数またはパラメータc1を用いてフィルタH(z)によりフィルタ処理される。このように、従来の方法の他に、本発明の実施形態によれば、現フレームは、過去フレームからの係数を用いてフィルタ処理されず、結果として、現フレームからの係数のみで、不連続点を除去するという事実にもかかわらず、従来の方法において存在する望まれていない歪みを回避する。ステップS402において、ZIRの最初の部分は、フィルタ処理された現フレームの対応する最初の部分から取り去られ、それによって、本発明の方法に従ってフィルタ処理され/処理される最初の部分を有するフィルタ処理された現フレームnを供給し、そして、現フレームのためのフィルタ係数またはパラメータc1を用いてフィルタ処理された部分のみを残し、それによって、連続フレームの間の不連続点の除去に応じて望まれていない歪みを回避する。
【0037】
本発明の方法は、オーディオ信号がフィルタ処理された場合に、上述のとおりのような状況において適用されうる。実施形態によれば、本発明の方法は、たとえば、信号ハーモニックスの間の符号化ノイズのレベルを低減するためのオーディオ・コーデックポストフィルタを用いる場合、デコーダ側でも適用されうる。デコーダ側でオーディオフレームを処理するために、実施形態によれば、ポストフィルタは、以下の式でありえ、

H(z)=(1-B(z))/(1-A(z)・Z-T

ここで、B(z)およびA(z)は2つのFIRフィルタであり、そして、H(z)フィルタパラメータは、FIRフィルタB(z)およびA(z)の係数であり、そして、Tはピッチラグを示す。この種の筋書きにおいて、たとえば、過去のフィルタのフレームパラメータc0が現フレームのフィルタパラメータc1と異なる場合、フィルタは、2つのフィルタ処理されたフレームの間の不連続点を取り込むこともでき、そして、この種の不連続点は、たとえば、「クリック」のようなフィルタ処理されたオーディオ信号104におけるアーティファクトを作り出しうる。この不連続点は、詳細に上述したように、フィルタ処理された現フレームを処理することによって除去される。
【0038】
記載された概念のいくつかの態様が、装置との関連で記載されるが、これらの態様も、対応する方法の説明を表わすことは明らかであり、ブロックあるいはデバイスは、方法のステップ、または方法のステップの特徴に対応する。類似して、方法のステップとの関連で記載される態様は、装置に対応する、ブロック、アイテムまたは特徴の説明を表す。
【0039】
特定の実現要求に応じて、本発明の実施の形態は、ハードウェアにおいて、または、ソフトウェアにおいて、実行されうる。その実現態様は、それぞれの方法が実行されるように、プログラミング可能なコンピュータ・システムと協働するか、(または、協働することができる、)そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、たとえば、フロッピー(登録商標)ディスク、DVD、ブルーレイディスク、CD、ROM、PROM、EPROM、EEPROM、またはFLASHメモリを使用して実行されうる。従って、デジタル記憶媒体は、コンピュータ読み込み可能でもよい。
【0040】
本発明による若干の実施の形態は、本願明細書において記載される方法のうちの1つが実行されるように、プログラミング可能なコンピュータ・システムと協働することができる電子的に読み込み可能な信号を有するデータキャリアを含む。
【0041】
通常、本発明の実施の形態は、プログラムコードを有するコンピュータ・プログラム製品として実施され、コンピュータ・プログラム製品がコンピュータ上で実行する場合、プログラムコードは、方法のうちの1つを実行するために作動される。プログラムコードは、機械可読キャリアに、たとえば、格納されうる。
【0042】
他の実施の形態は、機械可読キャリアに格納され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを含む。
【0043】
換言すれば、従って、コンピュータ・プログラムがコンピュータ上で実行する場合、本発明の方法の実施の形態は、本願明細書において記載される方法のうちの1つを実行するためのプログラムコードを含むコンピュータ・プログラムである。
【0044】
従って、本発明の方法の更なる実施の形態は、その上に記録され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを含むデータキャリア(または、デジタル記憶媒体、またはコンピュータ可読媒体)である。
【0045】
従って、本発明の方法の更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを表しているデータストリームまたは一連の信号である。たとえば、データストリームまたは一連の信号は、データ通信接続、たとえば、インターネットを介して転送されるように構成されうる。
【0046】
更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するために構成され、または適応される処理手段、たとえば、コンピュータ、またはプログラミング可能な論理回路を含む。
【0047】
更なる実施の形態は、その上にインストールされ、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを有するコンピュータを含む。
【0048】
いくつかの実施の形態において、プログラミング可能な論理回路(たとえば、現場でプログラム可能なゲートアレイ(FPGA:Field Programmable Gate Array))が、本願明細書において記載されるいくつかまたは全ての機能を実行するために使用されうる。いくつかの実施の形態において、現場でプログラム可能なゲートアレイは、本願明細書において記載される方法の1つを実行するために、マイクロプロセッサと協働しうる。一般に、方法は、いくつかのハードウェア装置によって、好ましくは実行される。
【0049】
上述した実施の形態は、本発明の原則の例を表すだけである。本願明細書において記載される装置の修正および変更は、他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許請求の範囲だけによってのみ制限され、ならびに、本願発明の記述および説明によって表された明細書の詳細な記載によっては、制限されないことが真意である。
図1
図2
図3
図4
図5
図6
図7
図8
【手続補正書】
【提出日】2024-07-22
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
オーディオ信号(100)を処理する方法であって、前記方法は、
H(z)=(1-B(z))/(1-A(z)z -T
によって定義されるフィルタによって前記オーディオ信号をフィルタ処理するステップであって、ここで、B(z)およびA(z)は2つのFIRフィルタであり、フィルタパラメータH(z)はFIRフィルタB(z)およびA(z)の係数であり、Tはピッチラグを示す、フィルタ処理するステップと、
記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点(106a,106b)を除去する(S102,S104,S300-S308,S400-S402)ために線形予測フィルタ処理を使用するステップを含
前記方法は、前記オーディオ信号の前記現フレームをフィルタ処理するステップと、既定の信号を線形予測フィルタ処理することによって得られた信号であって、
前記線形予測フィルタの初期状態は、フィルタ処理されていない前記過去フレームの最後の部分を、前記現フレームをフィルタ処理するためのフィルタパラメータのセットを使用してフィルタ処理したものに基づいて定義される信号によって、前記フィルタ処理された現フレームの最初の部分を修正することによって前記不連続点を除去するステップと、
を含む、方法。
【請求項2】
前記フィルタ処理されたまたはフィルタ処理されていない前記オーディオ信号(100)に対する前記線形予測フィルタを推定するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記線形予測フィルタを推定するステップは、レビンソン-ダービン・アルゴリズムを用いて、前記オーディオ信号(100)の前記過去および/または現フレームに基づいて、または、前記オーディオ信号(100)のフィルタ処理された前記過去フレームに基づいて、前記線形予測フィルタを推定するステップを含む、請求項2に記載の方法。
【請求項4】
前記線形予測フィルタは、オーディオ・コーデックの線形予測フィルタを含む、請求項1に記載の方法。
【請求項5】
前記不連続点を除去するステップは、フィルタ処理された前記現フレームの前記最初の部分を処理するステップを含み、前記現フレームの前記最初の部分は、前記現フレーム内のサンプルの合計数以下である既定の数のサンプルを有し、そして、前記現フレームの前記最初の部分を処理するステップは、フィルタ処理された前記現フレームの前記最初の部分からゼロ入力応答(ZIR)の最初の部分を取り去るステップ(S304,S402)を含む、請求項1ないし請求項4のいずれかに記載の方法。
【請求項6】
フィルタ処理された前記現フレームを作り出すために、FIRフィルタのような非再帰フィルタを用いて、前記オーディオ信号の前記現フレームをフィルタ処理するステップ(S400)を含む、請求項5に記載の方法。
【請求項7】
IIRフィルタのような再帰フィルタを用いて前記オーディオ信号のフィルタ処理されていない前記現フレームをサンプルごとに処理するステップを含み、ここで、前記現フレームの前記最初の部分のサンプルを処理するステップは、
フィルタ処理されたサンプルを作り出すために、前記現フレームの前記フィルタパラメータを用いて前記再帰フィルタにより前記サンプルをフィルタ処理するステップ(S302)と、
フィルタ処理された前記現フレームの前記対応するサンプルを作り出すために、前記フィルタ処理されたサンプルから対応するZIRサンプルを取り去るステップ(S304)と、
を含む、請求項5に記載の方法。
【請求項8】
フィルタ処理するステップ(S302)および取り去るステップ(S304)は、前記現フレームの前記最初の部分内の最後の前記サンプルが処理されるまで繰り返され、そして、前記方法は、前記現フレームの前記フィルタパラメータを用いて、前記再帰フィルタにより前記現フレーム内の前記残りのサンプルをフィルタ処理するステップ(S306)をさらに含む、請求項7に記載の方法。
【請求項9】
前記ZIRを生成するステップを含み、
前記ZIRを生成するステップは、
フィルタ処理された信号の第1部分を作り出すために、前記フィルタおよび前記現フレームをフィルタ処理するために使用される前記フィルタパラメータを用いて、フィルタ処理されていない前記過去フレームのM個の前記最後のサンプルをフィルタ処理するステップ(S200)であって、Mは、前記線形予測フィルタの次数である、フィルタ処理するステップと、
フィルタ処理された信号の第2部分を生成するために、前記過去フレームの前記フィルタパラメータを用いてフィルタ処理された、フィルタ処理された前記過去フレームのM個の前記最後のサンプルを、フィルタ処理された信号の前記第1部分から取り去るステップ(S202)と、
前記線形予測フィルタおよびフィルタ処理された信号の前記第2部分に等しい初期状態を用いてゼロサンプルのフレームをフィルタ処理することによって、線形予測フィルタのZIRを生成するステップ(S204)と、
を含む、請求項5ないし請求項8のいずれかに記載の方法。
【請求項10】
その振幅が急速にゼロに減少するようなZIRのウィンドウ処理を含む、請求項9に記載の方法。
【請求項11】
コンピュータ上で実行される場合、請求項1ないし請求項10のいずれかに記載の方法を実行する命令を格納しているコンピュータ可読媒体を含む、非一時的コンピュータ・プログラム製品
【請求項12】
オーディオ信号(100)を処理するための装置であって、前記装置は、
H(z)=(1-B(z))/(1-A(z)z -T
によって定義されるフィルタによって前記オーディオ信号をフィルタ処理するステップであって、ここで、B(z)およびA(z)は2つのFIRフィルタであり、フィルタパラメータH(z)はFIRフィルタB(z)およびA(z)の係数であり、Tはピッチラグを示す、フィルタ処理し、
線形予測フィルタ処理を使用して前記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点を除去するためのプロセッサ(102,110,112)を含み、
前記プロセッサ(102,110,112)は、前記オーディオ信号の前記現フレームをフィルタ処理して、既定の信号を線形予測フィルタ処理することによって得られた信号であって、前記線形予測フィルタの初期状態は、フィルタ処理されていない過去フレームの最後の部分を、前記現フレームをフィルタ処理するためのフィルタパラメータのセットを使用してフィルタ処理したものに基いて定義される信号によって、前記フィルタ処理された現フレームの最初の部分を修正することによって前記不連続点を除去するように構成される、装置。
【請求項13】
請求項12の装置を含む、オーディオデコーダ(250)
【請求項14】
請求項12の装置を含む、オーディオエンコーダ(200)
【外国語明細書】