IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テレフオンアクチーボラゲット エル エム エリクソン(パブル)の特許一覧

特許7471375位相ECU F0補間スプリットのための方法および関係するコントローラ
<>
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図1
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図2
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図3
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図4
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図5
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図6
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図7
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図8
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図9
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図10
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図11
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図12
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図13
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図14
  • 特許-位相ECU  F0補間スプリットのための方法および関係するコントローラ 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-11
(45)【発行日】2024-04-19
(54)【発明の名称】位相ECU F0補間スプリットのための方法および関係するコントローラ
(51)【国際特許分類】
   G10L 19/005 20130101AFI20240412BHJP
【FI】
G10L19/005
【請求項の数】 16
【外国語出願】
(21)【出願番号】P 2022181549
(22)【出願日】2022-11-14
(62)【分割の表示】P 2021547687の分割
【原出願日】2020-02-20
(65)【公開番号】P2023029834
(43)【公開日】2023-03-07
【審査請求日】2023-02-20
(31)【優先権主張番号】62/808,610
(32)【優先日】2019-02-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/808,587
(32)【優先日】2019-02-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/808,600
(32)【優先日】2019-02-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】598036300
【氏名又は名称】テレフオンアクチーボラゲット エルエム エリクソン(パブル)
(74)【代理人】
【識別番号】100109726
【弁理士】
【氏名又は名称】園田 吉隆
(74)【代理人】
【識別番号】100150670
【弁理士】
【氏名又は名称】小梶 晴美
(74)【代理人】
【識別番号】100194294
【弁理士】
【氏名又は名称】石岡 利康
(72)【発明者】
【氏名】セールステッド, マルティン
【審査官】渡部 幸和
(56)【参考文献】
【文献】特表2016-510432(JP,A)
【文献】国際公開第2014/123469(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00
(57)【特許請求の範囲】
【請求項1】
受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための方法であって、
少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得すること(1200、1312)であって、前記少なくとも1つのビンベクトルが、前記少なくとも1つのトーンについての3つの連続するビン値を含む、少なくとも1つのビンベクトルを取得すること(1200、1312)と、
前記3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定すること(1202、1314)と、
前記決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、前記少なくとも1つのトーンの周波数を推定するために前記3つの連続するビン値を処理すること(1204、1316)と
前記少なくとも1つのトーンについての前記3つの連続するビン値の各々が複素数値を有すると決定したことに応答して、
前記3つの連続するビン値の各々についての複素数値係数を抽出することと、
前記3つの連続するビン値の各々の前記複素数値係数に基づいて、前記少なくとも1つのトーンについてのフラクショナルビンオフセットを計算すること(1204、1314)と、
前記フラクショナルビンオフセットに基づいて、前記少なくとも1つのトーンについてのビン周波数を計算すること(1204、1314)と、
前記3つの連続するビン値のうちの少なくとも1つが実数値を有すると決定したことに応答して、
前記3つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、
前記3つの連続するビン値の各々についての前記マグニチュードポイントに基づいて、前記少なくとも1つのトーンについてのフラクショナルビンオフセットを計算することと、
前記フラクショナルビンオフセットに基づいて、前記少なくとも1つのトーンについてのビン周波数を計算することと、
を含む、方法。
【請求項2】
前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することが、前記少なくとも1つのトーンについての前記3つの連続するビン値の各々を含んでいる周波数スペクトルについての、スケーリング係数、前記スペクトル表現のために使用される窓関数、および変換長に基づいて、前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項に記載の方法。
【請求項3】
前記スケーリング係数が窓関数のタイプに依存する、請求項に記載の方法。
【請求項4】
前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することが、前記3つの連続するビン値の各々を含んでいる周波数スペクトルについての、窓関数および変換長に基づいて、前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項からのいずれか一項に記載の方法。
【請求項5】
前記フラクショナルビンオフセットを計算することが、
=(k+δ)C
に従って前記フラクショナルビンオフセットを計算することを含み、fが、ピークロケーションkについての前記フラクショナルビンオフセットであり、δが補間値であり、Cが、Hz/ビン単位の粗い分解能である、請求項に記載の方法。
【請求項6】
δが、

に従って決定され、ここで、Kjacobがスケーリング係数であり、Xk-1、X、およびXk+1が、kにおける前記少なくとも1つのトーンについての複素数値係数である、請求項に記載の方法。
【請求項7】
決定することおよび処理することが、前記スペクトル表現の前記少なくとも1つのトーンの各々について実施される、請求項1からのいずれか一項に記載の方法。
【請求項8】
受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための装置(1304)であって、
少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得すること(1200、1312)であって、前記少なくとも1つのビンベクトルが、前記少なくとも1つのトーンについての3つの連続するビン値を含む、少なくとも1つのビンベクトルを取得すること(1200、1312)と、
前記3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定すること(1202、1314)と、
前記決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、前記少なくとも1つのトーンの周波数を推定するために前記3つの連続するビン値を処理すること(1204、1316)と
前記少なくとも1つのトーンについての前記3つの連続するビン値の各々が複素数値を有すると決定したことに応答して、
前記3つの連続するビン値の各々についての複素数値係数を抽出することと、
前記3つの連続するビン値の各々の前記複素数値係数に基づいて、前記少なくとも1つのトーンについてのフラクショナルビンオフセットを計算すること(1204、1314)と、
前記フラクショナルビンオフセットに基づいて、前記少なくとも1つのトーンについてのビン周波数を計算すること(1204、1314)と、
前記3つの連続するビン値のうちの少なくとも1つが実数値を有すると決定したことに応答して、
前記3つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、
前記3つの連続するビン値の各々についての前記マグニチュードポイントに基づいて、前記少なくとも1つのトーンについてのフラクショナルビンオフセットを計算することと、
前記フラクショナルビンオフセットに基づいて、前記少なくとも1つのトーンについてのビン周波数を計算することと、
を含む動作を実施する、装置(1304)。
【請求項9】
前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することが、前記少なくとも1つのトーンについての前記3つの連続するビン値の各々を含んでいる周波数スペクトルについての、スケーリング係数、前記スペクトル表現のために使用される窓関数、および変換長に基づいて、前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項に記載の装置。
【請求項10】
前記スケーリング係数が窓関数のタイプに依存する、請求項に記載の装置。
【請求項11】
前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することが、前記3つの連続するビン値の各々を含んでいる周波数スペクトルについての、窓関数および変換長に基づいて、前記少なくとも1つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項から10のいずれか一項に記載の装置。
【請求項12】
前記フラクショナルビンオフセットを計算することが、
=(k+δ)C
に従って前記フラクショナルビンオフセットを計算することを含み、fが、ピークロケーションkについての前記フラクショナルビンオフセットであり、δが補間値であり、Cが、Hz/ビン単位の粗い分解能である、請求項11に記載の装置。
【請求項13】
δが、

に従って決定され、ここで、Kjacobがスケーリング係数であり、Xk-1、X、およびXk+1が、における前記少なくとも1つのトーンについての複素数値係数である、請求項12に記載の装置。
【請求項14】
決定することおよび処理することが、前記スペクトル表現の前記少なくとも1つのトーンの各々について実施される、請求項から13のいずれか一項に記載の装置。
【請求項15】
受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるべきプログラムコードを備えるコンピュータプログラムであって、前記プログラムコードの実行は、前記デコーダ(1300)に、請求項1からのいずれか一項に記載の方法を実施させる、コンピュータプログラム。
【請求項16】
請求項15に記載のコンピュータプログラムを含む非一時的記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、損失したオーディオフレームについての隠蔽方法を制御するための方法に関する。本開示はまた、受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するように設定されたコントローラに関する。
【背景技術】
【0002】
現代の通信チャネル/ネットワークを介した音声/オーディオの送信は、主に、音声/オーディオコーデックを使用してデジタルドメインにおいて行われる。これは、デジタルサンプルを取得するために、アナログ信号をとり、サンプリングおよびアナログデジタル変換器(ADC)を使用してそのアナログ信号をデジタル化することを伴い得る。これらのデジタルサンプルは、さらに、適用例に応じて10ms~40msの連続する期間からのサンプルを含んでいるフレームにグループ化され得る。これらのフレームは、次いで、送信される必要があるビット数を低減し、依然として、できるだけ高い品質を達成し得る、圧縮アルゴリズムを使用して処理され得る。次いで、符号化されたビットストリームが、データパケットとして、デジタルネットワークを介して受信機に送信される。受信機では、プロセスが逆にされる。データパケットは、最初に、復号されて、デジタルサンプルをもつフレームが再作成され得、そのフレームは、次いで、デジタルアナログ変換器(DAC)に入力されて、受信機において入力アナログ信号の近似が再作成され得る。図1は、上記で説明された手法を使用する、デジタルネットワークなどのネットワークを介した、オーディオエンコーダおよびデコーダを使用するオーディオ転送のブロック図の一例を提供する。
【0003】
データパケットがネットワーク上で送信されるとき、トラフィック負荷によりネットワークによってドロップされるか、または、ビット誤りの結果としてドロップされるかのいずれかであり得る、データパケットがあり、復号についてデジタルデータを無効にし得る。これらのイベントが起こるとき、デコーダは、実際の復号を行うことが不可能である期間中に、出力信号を置き換える必要がある。この置換プロセスは、一般に、フレーム/パケット損失隠蔽(PLC:packet loss concealment)と呼ばれる。図2は、パケット損失隠蔽を含むデコーダ200のブロック図を示す。不良フレームインジケータ(BFI)が、損失したまたは破損したフレームを示すとき、PLC202が、紛失した/破損したフレームを置き換えるための信号を作成し得る。他の場合、すなわち、BFIが、損失したまたは破損したフレームを示さないとき、受信された信号は、ストリームデコーダ204によって復号される。現在フレームについての不良フレームインジケータ変数を、アクティブ、すなわち、BFI=1にセットすることによって、フレーム消去がデコーダにシグナリングされ得る。復号または隠蔽されたフレームは、次いで、DAC206に入力されて、アナログ信号が出力される。フレーム/パケット損失隠蔽は、誤り隠蔽ユニット(ECU:error concealment unit)と呼ばれることもある。
【0004】
デコーダにおいてパケット損失隠蔽を行う多数のやり方がある。いくつかの例は、損失したフレームを無音(silence)と置き換えること、および最後のフレームを繰り返すこと(または、最後のフレームパラメータの復号)である。他の手法は、フレームを、オーディオ信号の最も可能性がある継続(continuation)と置き換えることを試みることである。雑音のような信号の場合、1つの手法は、同様のスペクトル構造をもつ雑音を生成し得る。音の信号の場合、最初に、今のトーンの特性(周波数、振幅、および位相)を推定し、これらのパラメータを使用して、損失したフレームの対応する時間ロケーションにおいてトーンの継続を生成し得る。
【0005】
ECUのための別の手法は、3GPP TS26.477 V15.0.0節5.4.3.5およびWO2014/123471A1において説明される、位相ECUであり、デコーダは、通常復号中に、復号された信号のプロトタイプを継続的に保存し得る。このプロトタイプは、損失したフレームの場合に使用され得る。プロトタイプはスペクトル的に分析され、雑音および音のECU機能が、スペクトルドメインにおいて組み合わせられる。位相ECUは、スペクトル中のトーンを識別し、関係するスペクトルビンのスペクトル時間置換を計算する。他のビン(非音)は、雑音としてハンドリングされ得、これらのスペクトル領域における音のアーティファクトを回避するためにスクランブルされる。得られた再作成されたスペクトルは、時間ドメインに逆FFT(高速フーリエ変換)変換され、信号は、損失したフレームの置換を作成するために処理される。オーディオコーデックが修正離散コサイン変換(MDCT)に基づくとき、置換の作成は、すでに復号された信号の統合された継続を作成するための重複MDCTに関係する、窓処理、TDA(時間ドメインエイリアシング)およびITDA(逆TDA)を含む。この方法は、MDCTメモリの継続的使用と、通常復号が再開されるべきであるときに使用されるべきであるMDCTメモリの作成とを保証し得る。PLCから通常動作への遷移における最初の正しく復号されたフレームは、最初の良好なフレームとしても知られる。図3は、PLCプロトタイプからの信号の位相ECUおよび再作成の時間整合および信号図を示す。図3は、エンコーダ(エンコーダ入力の後の一番上のもの)と、デコーダ中の最初の損失したフレームのポイントにおけるデコーダ中(デコーダ合成の後の第2の線)との間のタイミング関係をも示す。図3はまた、位相ECU時間進行再作成信号(Phase ECU time advanced recreated signal)が、消失したフレームセグメントおよび変換メモリを再作成するために、窓処理TDA、ITDAおよび合成窓処理を使用し続けるために、どのように位置決めされ、使用されるかを示す。
【発明の概要】
【0006】
PLCプロトタイプバッファに対するスペクトル分析を使用して、2つの動作においてトーン位置特定が行われ得る。窓処理およびFFTの後に、第1の動作は、ビンの位置を特定することであり得、マグニチュードスペクトルを使用してトーンの位置が特定され得る。第2の動作は、補間によってこれらの推定値を改良することであり得、それにより、フラクショナル(fractional)オフセット値の形態の精度増加を得ることであり得る。周波数推定の分解能は、2つのことに依存する。第1に、変換の長さ - より長い変換が、より高い分解能を与え得る。第2に、異なる補間方法が異なる精度を有し得る。たとえば、国際特許出願公開第WO2014/123469号において説明される動作では、より短いフレーム(10ms)の場合、精度が十分に良好ではないことがある。より高品質の誤り隠蔽のために、高い精度が周波数推定のために必要とされ得る。ただバッファ長を増加させることが1つのソリューションであり得るが、複雑さがあまりにも増加することになる。最も敏感であるのは、クリーン正弦トーン(sinus tone)であり、補間誤差が、明らかに可聴である、フレームごとの不連続性をもたらし、再構築された信号の品質を劣化させる。より長いバーストの場合、小さい誤差でさえ、復号されたコンテンツへの遷移中に、可聴の不連続性を生じ得る。
【0007】
発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのコントローラを動作させるための方法が提供される。そのような方法では、コントローラは、少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得し得、少なくとも1つのビンベクトルは、少なくとも1つのトーンについての3つの連続するビン値を含む。コントローラは、3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定し得る。決定に応答して、コントローラは、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理し得る。
【0008】
取得され得る1つの利点は、フレーム境界におけるクリーントーンにおけるクリックの低減が行われ得ることである。誤りバーストの後の復号されたコンテンツへの遷移も改善し得、マグニチュード近似からの複雑さの低減があり得る。
【0009】
発明概念のいくつかの実施形態によれば、少なくとも1つのトーンについての3つの連続するビン値の各々が複素数値を有すると決定したことに応答して、コントローラは、3つの連続するビン値の各々についての複素数値係数(complex value coefficient)を抽出することと、3つの連続するビン値の各々の複素数値係数(complex valued coefficient)に基づいて、1つのトーンについてのフラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、1つのトーンについてのビン周波数を計算することとを行い得る。3つの連続するビン値のうちの少なくとも1つが実数値を有すると決定したことに応答して、コントローラは、3つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、3つの連続するビン値の各々のマグニチュードポイントに基づいて、少なくとも1つのトーンについてのフラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、少なくとも1つのトーンについてのビン周波数を計算することとを行い得る。
【0010】
発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための装置が提供される。本装置は、少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得することであって、少なくとも1つのビンベクトルが、少なくとも1つのトーンについての3つの連続するビン値を含む、少なくとも1つのビンベクトルを取得することを含む動作を実施する。本装置は、3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施する。本装置は、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理することを含むさらなる動作を実施する。
【0011】
発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダの少なくとも1つのプロセッサによって実行されるべきプログラムコードを備えるコンピュータプログラムが提供される。プログラムコードの実行は、デコーダに、少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得することであって、少なくとも1つのビンベクトルが、少なくとも1つのトーンについての3つの連続するビン値を含む、少なくとも1つのビンベクトルを取得することを含む動作を実施させる。プログラムコードの実行は、デコーダに、3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施させる。プログラムコードの実行は、デコーダに、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理することを含むさらなる動作を実施させる。
【0012】
発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダの少なくとも1つのプロセッサによって実行されるべきプログラムコードを含む非一時的記憶媒体を備えるコンピュータプログラム製品。プログラムコードの実行は、デコーダに、少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得することであって、少なくとも1つのビンベクトルが、少なくとも1つのトーンについての3つの連続するビン値を含む、少なくとも1つのビンベクトルを取得することを含む動作を実施させる。プログラムコードの実行は、デコーダに、3つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施させる。プログラムコードの実行は、デコーダに、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理することを含むさらなる動作を実施させる。
【0013】
本開示のさらなる理解を提供するために含まれ、本出願に組み込まれ、本出願の一部をなす、添付の図面は、発明概念のいくつかの非限定的な実施形態を示す。
【図面の簡単な説明】
【0014】
図1】ネットワークを介したオーディオエンコーダおよびオーディオデコーダを使用するブロック図である。
図2】パケット損失隠蔽を含むデコーダのブロック図である。
図3】PLCプロトタイプからの信号の位相ECUおよび再作成の時間整合および信号図である。
図4】サンプリングマグニチュードスペクトルを示す図である。
図5】マグニチュードスペクトルの平方根なしの線形近似(square root free linear approximation)のフローチャートである。
図6】フラクショナル周波数補間のためのフローチャートである。
図7】発明概念のいくつかの実施形態による、フラクショナル周波数補間のためのフローチャートである。
図8】発明概念のいくつかの実施形態による、フェード長さ24をもつ128サンプルHammRectフィルタのフェードイン(fadein)のハム(Hamm)を示す図である。
図9】発明概念のいくつかの実施形態による、フェード長さ24サンプルをもつ128サンプルHammRectフィルタのハムフェードアウト(fadeout)を示す図である。
図10】発明概念のいくつかの実施形態による、コピー部分の長さがサンプリング周波数に依存することを示す図である。
図11】発明概念のいくつかの実施形態による、ハミング部分の長さがサンプル周波数に依存することを示す図である。
図12】発明概念のいくつかの実施形態による、コントローラ動作を示すフローチャートである。
図13】発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。
図14】発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。
図15】発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。
【発明を実施するための形態】
【0015】
次に、発明概念の実施形態の例が示されている添付の図面を参照しながら、発明概念が以下でより十分に説明される。しかしながら、発明概念は、多くの異なる形態で具現され得、本明細書に記載される実施形態に限定されるものとして解釈されるべきではない。むしろ、これらの実施形態は、本開示が徹底的かつ完全であり、本発明概念の範囲を当業者に十分に伝達するように提供される。これらの実施形態は相互排他的でないことにも留意されたい。一実施形態からの構成要素が、別の実施形態において存在する/使用されると暗に仮定され得る。
【0016】
以下の説明は、開示される主題の様々な実施形態を提示する。これらの実施形態は、教示例として提示され、開示される主題の範囲を限定するものと解釈されるべきではない。たとえば、説明される実施形態のいくらかの詳細は、説明される主題の範囲から逸脱することなく、修正、省略、または拡大され得る。
【0017】
様々な実施形態が、図13図15に示されているデコーダ中のコントローラに適用される。図13は、いくつかの実施形態による、デコーダの概略ブロック図である。デコーダ1300は、符号化されたオーディオ信号を受信するように設定された入力ユニット1302を備える。図13は、論理フレーム損失隠蔽ユニット1304によるフレーム損失隠蔽を示し、これは、デコーダが、本明細書で説明される様々な実施形態による、損失したオーディオフレームの隠蔽のためのコントローラを実装するように設定されることを示す。さらに、デコーダ1300は、本明細書で説明される様々な実施形態を実装するための(本明細書ではプロセッサまたはプロセッサ回路とも呼ばれる)コントローラ1306を備える。コントローラ1306は、入力(IN)と、プロセッサ1306に結合された(本明細書ではメモリ回路とも呼ばれる)メモリ1308とに結合される。プロセッサ1306から取得された、復号されたおよび再構築されたオーディオ信号は、出力(OUT)から出力される。メモリ1308は、プロセッサ1306によって実行されたとき、プロセッサに、本明細書で開示される実施形態による動作を実施させる、コンピュータ可読プログラムコード1310を含み得る。他の実施形態によれば、プロセッサ1306は、別個のメモリが必要とされないようなメモリを含むように規定され得る。
【0018】
フレーム損失隠蔽動作を実施するための正弦波モデルの適用例は、以下のように説明され得る。
【0019】
対応する符号化された情報が利用可能でないので、すなわち、フレームが損失したので、コード化された信号の所与のセグメントがデコーダによって再構築され得ない場合、このセグメントより前の信号の利用可能な部分がプロトタイプフレームとして使用され得、ここで、プロトタイプフレームは、単一のフレームよりも長くなり得る。n=0...N-1であるy(n)が、置換フレームz(n)が生成されなければならない利用不可能なセグメントであり、n<0であるy(n)が、利用可能な、前に復号された信号である場合、長さLおよび開始インデックスn-1の利用可能な信号のプロトタイプフレームが、窓関数w(n)を用いて抽出され、たとえば、DFTによって周波数ドメインに変換される。
【0020】
様々な実施形態では、復号された信号の端部がプロトタイプフレームとして使用される。そのような状況では、y(n)は、n=L...N-1であるy(n)になる。上記の等式は、
になる。窓関数は、正弦波分析における、以下でより詳細に説明される窓関数のうちの1つであり得る。たとえば、以下で説明されるように、窓関数は、矩形窓をハム窓に基づくテーパリングと組み合わせ得る。好ましくは、数値複雑さを保存するために、周波数ドメイン変換されたフレームは、正弦波分析中に使用されたものと同等であるべきであり、これは、分析フレームとプロトタイプフレームとが同等であり、同様に、それらのそれぞれの周波数ドメイン変換が同等であることを意味する。
【0021】
次のステップにおいて、正弦波モデル仮定が適用される。正弦波モデル仮定によれば、プロトタイプフレームのDFTは、以下のように書かれ得る。
【0022】
次に、使用される窓関数のスペクトルが、0に近い周波数範囲においてのみ著しい寄与を有することが了解される。窓関数のマグニチュードスペクトルは、(サンプリング周波数の半分に対応する、-πからπまでの正規化された周波数範囲内で)0に近い周波数の場合は大きく、他の場合は小さい。したがって、近似として、窓スペクトルW(m)は、区間M=[-mmin,mmax]についてのみ非0であり、mminおよびmmaxは小さい正数であると仮定される。特に、各kについて、上記の式におけるシフトされた窓スペクトルの寄与が厳密に重複しないように、窓関数スペクトルの近似が使用される。したがって、上記の等式では、各周波数インデックスについて、常に、最大で、1つの被加数からの、すなわち、1つのシフトされた窓スペクトルからの寄与があるにすぎない。これは、上記の式が、非負m∈Mについておよび各kについて、以下の近似式になることを意味する。
ここでは、Mは整数区間
を示し、ここで、mmin,kおよびmmax,kは、区間が重複しないように、上記で説明された制約を満たす。mmin,kおよびmmax,kのための好適な選定は、mmin,kおよびmmax,kを小さい整数値δ、たとえば、δ=3にセットすることである。しかしながら、2つの近隣する正弦波周波数fおよびfk+1に関係するDFTインデックスが2δよりも小さい場合、δは、区間が重複しないことが保証されるように、
にセットされる。関数floor(・)は、関数引数よりも小さいかまたはそれに等しい、関数引数に最も近い整数である。
【0023】
次に、正弦波モデルは、上記の式に従って、および時間的にそのK個のシヌソイド(sinusoid)を展開するために適用される。プロトタイプフレームの時間インデックスと比較した、消去されたセグメントの時間インデックスが、n-1個のサンプルだけ異なるという仮定は、シヌソイドの位相が
だけ進行することを意味し、ここで、timeoffs=tadv+N(burstlen-1)である
ここで、timeoffsは時間オフセットであり、tadvは時間進行であり、N(burstlen-1)は連続する誤りの数に基づくタイミング調節である。再作成されたフレームは、消失したフレームにわたってセンタリングされる(したがって、再作成されたフレームをセンタリングするためのt_advの使用)。連続する誤りの場合、デコーダは、いくつのフレームが損失したかを追跡し、それに応じてオフセットを調節する必要がある(したがって、N(burstlen-1)の使用)。したがって、展開される正弦波モデルのDFTスペクトルは、以下によって与えられる。
【0024】
シフトされた窓関数スペクトルがそれに従って重複しない、近似を再び適用することが、非負m∈Mについておよび各kについて、以下を与える。
【0025】
各m∈Mについて、近似を使用することによって、展開される正弦波モデルY(m)のDFTとプロトタイプフレームY-1(m)のDFTを比較すると、マグニチュードスペクトルは不変のままであるが、位相は
だけシフトされることがわかる。
【0026】
したがって、置換フレームは、非負m∈Mについておよび各kについて、以下の式によって計算され得る。
z(n)=IDFT{Z(m)}、
【0027】
信号調性に応答した区間Mのサイズが適応され得る。コントローラ1306は、少なくとも1つのトーンについてのスペクトル表現の複数のビンベクトルを受信し得る。各ビンベクトルは、1つのトーンについての3つの連続するビン値を含む。コントローラ1306は、3つの連続するビンの各々が複素数値を有するのか実数値を有するのかを決定し得る。決定に応答して、コントローラ1306は、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理し得る。図15に示されているように、受信することは、受信ユニット1312によって実施され得、決定することは、決定ユニット1314によって実施され得、処理することは、処理ユニット1316によって実施され得る。図15に示されているように、受信ユニット1312と、決定ユニット1314と、処理ユニット1316とを含む、プロセッサ1306によって処理されるべき信号が、メモリ1308から提供され得る。
【0028】
プロセッサ1306をもつデコーダは、ハードウェアで実装され得る。デコーダのユニットの機能を達成するために使用され、組み合わせられ得る、回路エレメントの多数の変形態がある。そのような変形態は、様々な実施形態によって包含される。デコーダのハードウェア実装の特定の例は、汎用電子回路と特定用途向け回路の両方を含む、デジタル信号プロセッサ(DSP)ハードウェアおよび集積回路技術における実装である。
【0029】
PLCプロトタイプバッファに対するスペクトル分析を使用して、2つの動作においてトーン位置特定が行われ得る。窓処理およびFFTの後に、第1の動作は、ビンの位置を特定することであり得、マグニチュードスペクトルを使用してトーンの位置が特定され得る。第2の動作は、補間によってこれらの推定値を改良することであり得、それにより、フラクショナルオフセット値の形態の精度増加を得ることであり得る。周波数推定の分解能は、2つのことに依存する。第1に、変換の長さ- より長い変換が、より高い分解能を与え得る。第2に、異なる補間方法が異なる精度を有し得る。たとえば、国際特許出願公開第WO2014/123469号において説明される動作では、より短いフレーム(10ms)の場合、精度が十分に良好ではないことがある。より高品質の誤り隠蔽のために、高い精度が周波数推定のために必要とされ得る。ただバッファ長を増加させることが1つのソリューションであり得るが、複雑さが増加することになる。最も敏感であるのは、クリーン正弦トーンであり、補間誤差が、明らかに可聴である、フレームごとの不連続性をもたらし、再構築された信号の品質を劣化させる。より長いバーストの場合、小さい誤差でさえ、復号されたコンテンツへの遷移中に、可聴の不連続性を生じ得る。
【0030】
さらに、トーンロケータと現在の補間器の両方についてのマグニチュードスペクトルの使用は、複雑な関数である、平方根関数を使用する。複雑さを低減するために、代わりにマグニチュード近似関数を使用することが、より良好であり得る。
【0031】
発明概念の本開示のいくつかの実施形態は、利用可能なFFT係数に従って異なる補間方法を使用することを可能にし得る、補間方法コントローラを使用し得、これは、複雑さの増加を限定しながら、精度を増加させ得る。いくつかの実施形態は、トーンロケータのためのマグニチュードスペクトルを計算することの複雑さを低下させるマグニチュード近似をも使用し得、放物線補間によっても使用され得る。
【0032】
複雑さ低減のために、複雑さがより低いマグニチュード近似ユニットが使用され得る。周波数分解能の損失なしの、同様の複雑さがより低いマグニチュード近似ユニットについての動作が、M AllieおよびR Lyons、「A Root of Less Evil」、IEEE Signal Processing Magazine、93~96ページ、2005年3月(「Allie」)において説明される。
【0033】
本発明の実施形態の本開示のいくつかの実施形態は、補間精度を改善し得、位相ECUからの再作成された信号の品質を増加させ得る。さらに、品質の改善とともに、より短いPLCバッファが使用され、品質を維持し得、これは、複雑さの低減のために使用され得、たとえば、FFTおよびIFFTは、大きい算出であり得、長いバッファについてコストがかかるようになり得る。
【0034】
増加された周波数分解能のための装置が、2つの追加のユニットを含み得る。第1のユニットは、周波数補間のためにどの方法が使用され得るかを制御し得、すなわち、ビンデータの絶対値を使用する補間ユニット(たとえば、国際特許公開第WO2014/123469A1号において説明される同様の動作を参照)が使用され得るか、または複素ビン値を使用して周波数補間が行われる第2のユニットが使用され得るかのいずれかである。
【0035】
FFT個のサンプルの窓処理およびFFTを使用するプロトタイプバッファの周波数分析が、
個の値をもつスペクトル表現、
についてW(n)、を作り出す。ここで、n=0はDCを表し、
はサンプリング周波数(fs)の半分を表す。これらのうち、2つ以外のすべてが複素数値であり、エンドポイント(DCおよびfs/2)のみが実数である。したがって、利用可能な複素数係数を利用する別の補間方法が使用され得る場合、精度が増加され得る。
【0036】
国際特許公開第WO2014/123469A1号において説明される補間方法は、識別されたトーンロケーション上の各側の1つのビンを使用する。また、エンドポイントにおいて、国際特許公開第WO2014/123469A1号において説明される補間方法は、依然として、3つのビンを使用し、追加のフラグが、識別されたピークが中間ロケーションにないことを示すためにセットされる。発明概念のいくつかの実施形態では、追加の制御ユニットが、すべての3つのビンが複素数値を有するピークについて、その制御ユニットが、改善された周波数推定のために、ビンデータの絶対値を使用する補間ユニットの代わりに新しい補間ユニットを呼び出すことを保証し得る。ビンデータの絶対値を使用する補間ユニットは、ビン0または
個のビンが3つのポイントの補間データ中に含まれる場合、使用され得、ここでも、ピークが中間ビンに位置しない場合、追加のフラグがセットされる。
【0037】
補間ユニットによる処理の後に、見つけられたトーンロケーションに従ってビン値が更新され得(トーンおよび周囲のビンの位相調節)、非トーンロケーションのスクランブリングが続けられる。たとえば、国際特許公開第WO2014/123469A1号において説明される同様の動作を参照されたい。
【0038】
発明概念のいくつかの実施形態では、MDCTが、10ms進行で20ms窓にわたってとられ得る。良好なフレームの後に保存されたPLCプロトタイプフレームは、長さが16msである。関係する過渡検出器が、PLCプロトタイプフレームの1/4である長さ4msをもつ2つの短いFFTを使用する。これらのアイテムの実際の長さは、使用されるサンプリング周波数に依存し、8kHzから48kHzまでであり得る。これらの長さは、各変換におけるスペクトルビンの数に影響を及ぼす。
【0039】
スペクトル分析および初期トーン位置特定が、国際特許公開第WO2014/123469A1号において説明される動作と同様の動作を使用して行われる。発明概念のいくつかの実施形態は、より低い複雑さのためにマグニチュード近似を使用する。国際特許公開第WO2014/123469A1号において説明される複雑なスペクトル推定のマグニチュードスペクトルの計算は、平方根関数の使用を伴う。たとえば、国際特許公開第WO2014/123469A1号では、複素数x=a+ibであり、xのマグニチュードが、次のように計算され得る。
【0040】
発明概念のいくつかの実施形態では、線形近似を使用する、複雑さがより低い近似が使用される。複雑さがより低い近似のための同様の動作が、M.AllieおよびR.Lyons、「A Root of Less Evil」、IEEE Signal Processing Magazine、93~96ページ、2005年3月(Allie)において説明される。図5を参照すると、FFT W(n)からのスペクトルエステートにおける第1のビン(0)および最後のビン
は、実数であるが、近似は、ブロック501においてそれら2つの絶対値をとる。(ビン)n = 1 …
についてのものである、W(n)=a+ibという形式を有する複素スペクトル係数の場合、ブロック503において、実数部および虚数部の絶対が最初に見つけられる必要がある。
abs=abs(a)
abs=abs(b) (2)
【0041】
次に、ブロック505において、より大きい絶対値とより小さい絶対値とが識別され得る。
MAXab=max(aabs,babs
MINab=min(aabs,babs) (3)
【0042】
より大きい値とより小さい値とが知られているとき、ブロック507および509において、マグニチュード近似が、それら2つの線形結合として計算され得る。
【0043】
図5は、複素入力X(n)=a+ibをもつ、マグニチュードスペクトルの平方根なしの線形近似のフローチャートであり、この線形近似は、各スペクトルビンについて1回実施され得る。
【0044】
国際特許公開第WO2014/123469A1号において説明される周波数推定のための動作では、粗い周波数推定は、トーンの位置が特定されるビンである。たとえば、1つのトーンの場合、それは、エンドポイントにおける特殊な処置を除いて、ビンkに位置する。図6を参照すると、スペクトル推定値は、ビンk-1、k、k+1を使用し得、それらのスペクトルマグニチュードが、ブロック601において抽出され、補間ユニットに入力され得、補間ユニットは、ブロック603において補間δを計算し得、ブロック605におけるフラクショナルビンオフセットは、通常、入力に基づいて、範囲δ=[-0.5,0.5]内にある。図6は、トーンロケータによって見つけられる各トーンについて1回実施され得る、フラクショナル周波数補間のための上記の動作のためのそのようなプロセスのフローチャートである。
【0045】
発明概念のいくつかの実施形態では、周波数補間は、位置を特定された各トーンのためにどの方法が使用されるべきであるかを選択するために、制御ユニットを使用し得る。図7は、発明概念の実施形態による、トーンロケータによって見つけられる各トーンについて1回実施され得る、フラクショナル周波数補間のためのフローチャートである。図7は、以下のようにより詳細に説明される。
【0046】
ブロック701において、補間がDCビンまたはfs/2ビンのいずれかを使用することになるような、トーンの位置が特定された場合、補間制御ユニットは、ビンデータの絶対値を使用する方法を使用する(ブロック707、709、711)。たとえば、国際特許公開第WO2014/123469A1号において説明される同様の動作を参照されたい。ここで、kにおけるトーンについて、ブロック707において抽出された3つの連続するスペクトル推定値は、実数マグニチュードスペクトル係数|X(n)|、n=k-1、k、k+1であり、|Xk-1|、|X|、および|Xk+1|として補間現在ユニットに入力される。ブロック709において、国際特許公開第WO2014/123469A1号において説明される動作と同様のフラクショナルオフセットの計算が行われる。
【0047】
DCまたはFS/2において位置が特定されたトーンの特殊なハンドリングの場合、それは、トーンロケータが、位置が特定されたトーンが、提供されたデータポイントの中心にないことがあることを示し得るときである。
【0048】
発明概念のいくつかの実施形態では、補間がDCビンまたはfs/2ビンのいずれをも使用しないような、トーンの位置が特定された場合、補間制御ユニットは、使用される窓関数およびFFT長さに適合された方法を使用し(ブロック703、705、711)、
について、FFT係数X(n)が、推定されたスペクトルである。同様の動作が、E JacobsenおよびP Kootsooks、「Fast Accurate Frequency Estimation」、IEEE Signal Processing Magazine、123~125ページ、2007年5月(Jacobsen)において説明される。ビンデータの絶対値を使用する補間は、マグニチュードスペクトルを使用するが、複素スペクトルは、依然として保存され、再構築のために使用され得、したがって、複雑さまたはメモリペナルティがない。補間は、中心ビンが、見つけられたトーンロケーションである、3つの連続するFFTビン上の複素数係数を使用して行われ得る。
【0049】
スペクトルの複素数表現が使用されるので、トーンロケータのためのマグニチュードスペクトルを計算する際にマグニチュード近似を使用することによる精度ペナルティがないことがある。エンドポイントのみが、それらの近似を使用することになる。
【0050】
kにおけるトーンの場合、複素数値係数X(n)、n=k-1、k、k+1は、Xk-1、X、およびXk+1として補間ユニットに入力され得る。補間は、以下の等式に基づいて、通常、範囲δ=[-0.5,0.5]において、ブロック711において、フラクショナルビンオフセットを計算し得る。
ここで、Kjacobは、使用される窓のタイプとサンプリング周波数に関するFFTのサイズとに依存するスケーリング係数である。一方、式RE{}は、括弧内の式の実数部のみが結果として使用されること、すなわち、入力のために使用されるスペクトル係数が複素数であるにもかかわらず、δが依然として実数値であることになることを意味する。より少ない複雑さのために、RE{}内の式の実数部のみが計算され得る。
【0051】
どちらの場合も、推定された周波数を得るために、このフラクショナルオフセットは、ピークロケーションkの粗い分解能および補間値δと組み合わせられ得る。
=(k+δ)C (7)
ここで、Cは、(Hz/ビン単位の)粗い分解能であり、FFTの長さおよびサンプリング周波数fsに依存する。Hz/ビンである粗い分解能は、ちょうどC=fs/NFFTである。
【0052】
Jacobsenは、いくつかの窓タイプについての(JacobsenにおいてQと称する)Kjacob値について説明するが、Jacobsenは、国際特許公開第WO2014/123469A1号において使用される窓を含まない。いくつかの実施形態では、その窓についての係数を導出するために、トーンが2つのビン間の中間にある場合が使用され得る、すなわち、どのピークが選定されるかに応じて、δ=±0.5である。たとえば、図4を参照されたい。図4は、2つのスペクトルビン間の中間において位置が特定された1つのトーンをもつ例示的なマグニチュードスペクトルを示す。トーン位置特定が、粗いトーン推定値をkであると報告するのか、kであると報告するのかは、ランダムイベントである。いずれの場合も、フラクショナル補間は、推定された同じ周波数を指すべきであり、これにより、それについて、δ≒+0.5となり、一方δ≒-0.5となる。kおよびkのためのマグニチュードが等しく高いので、それらを異ならせるのは、トーンの位相、雑音、またはFFT精度のみであり得、トーン位置特定は、等しく、それらのいずれかをトーンについてのビンとして選択する可能性がある。したがって、これは、最良の最小2乗誤差を提供しないが、δ=±0.5における補間不連続性を回避し得る。
【0053】
国際特許公開第WO2014/123469A1号におけるスペクトル分析のために使用される窓は、それが、矩形窓をハム窓に基づくテーパリングと組み合わせるので、「HammRect窓」と呼ばれる。国際特許公開第WO2014/123469A1号において説明されるすべてのサンプリング周波数について、矩形とテーパリングとの比は同じであり得る。いくつかの実施形態では、窓は、3msフェードインテーパリング、10ms矩形、および3msフェードアウトとして規定される。fs=8kHzについてのフェードインテーパリングおよびフェードアウトテーパリングが、それぞれ、図8および図9において見られ得、矩形部分は、その2つの間に位置することになり、1.000の80個のサンプルがあることになる。図10および図11は、異なるサンプリング周波数に応じたフェージングおよび矩形長さを示す。図10は、発明概念のいくつかの実施形態による、コピー部分の長さがサンプリング周波数に依存することを示す。図11は、発明概念のいくつかの実施形態による、ハミング部分の長さがサンプル周波数に依存することを示す。
【0054】
このタイプの窓の場合、Kjacob=1.1429の値は、すべてのサンプリング周波数について同じであることになる。テーパリングのために対称ハム窓を使用する場合、異なるサンプリング周波数のために異なる値を使用する必要があり、その差は小さい。いくつかの例は、以下の通りである。FFTサイズ128->1.1476、256->1.1452、512->1.1440、および768->1.1436。1つの固定係数および周期的ハム窓を使用することが、これを回避し得る。周期的ハム窓のための規定は、以下の通りである。
テーパリングセクションを生成するために、その窓は、L=2Lfadeを用いて評価され、評価の後に、この窓の前半はフェードイン部分であり、後半はフェードアウト部分である。
【0055】
ハム窓が対称であるのか周期的であるのかを知るための1つの手法は、窓における最初および最後のサンプルが0.08である場合、それが対称であることである。0.08が周期的窓へのサンプルに追加される場合、それは対称になるが、長さL+1をもつ。記憶の観点から、周期的規定は、サブサンプリングを可能にし、すなわち、32kHz窓から、それをサブサンプリングして、16kHzおよび8kHz窓を得ることができる。
【0056】
国際特許公開第WO2014/123469A1号において説明される放物線補間の場合、定数がなく、その放物線補間は、対称または周期的ハム関数に依存しない。
【0057】
次に、発明概念のいくつかの実施形態による、図12のフローチャートを参照しながら、デコーダ1300の動作が説明される。たとえば、モジュールは、図13図15のメモリ1308に記憶され得、これらのモジュールは、モジュールの命令がプロセッサ1306によって実行されたとき、プロセッサ1306がそれぞれのフローチャートのそれぞれの動作を実施するような命令を提供し得る。
【0058】
図12は、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ1300のコントローラ1306の動作を示す。
【0059】
図12のブロック1200において、デコーダ1300のプロセッサ1306は、少なくとも1つのトーンについてのスペクトル表現の少なくとも1つのビンベクトルを取得し、少なくとも1つのビンベクトルは、少なくとも1つのトーンについての3つの連続するビン値を含む。ブロック1202において、デコーダ1300のプロセッサ1306は、3つの連続するビンベクトルの各々が複素数値を有するのか実数値を有するのかを決定する。ブロック1204において、デコーダ1300のプロセッサ1306は、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理し得る。
【0060】
略語
【0061】
以下の略語のうちの少なくともいくつかが本開示で使用され得る。略語間の不整合がある場合、その略語が上記でどのように使用されるかが選好されるべきである。以下で複数回リストされる場合、最初のリスティングが(1つまたは複数の)後続のリスティングよりも選好されるべきである。
略語 説明
ADC アナログデジタル変換器
BFI 不良フレームインジケータ
DAC デジタルアナログ変換器
FFT 高速フーリエ変換
IFFT 逆高速フーリエ変換
ITDA 逆時間ドメインエイリアシング
LA_ZEROS ルックアヘッドゼロ
MDCT 修正離散コサイン変換
OLA オーバーラップ加算
TDA 時間ドメインエイリアシング
参考文献
[1]
国際特許公開第WO2014/123469A1号
[2]
M AllieおよびR Lyons、「A Root of Less Evil」、IEEE Signal Processing Magazine、93~96ページ、2005年3月
[3]
E JacobsenおよびP Kootsooks、「Fast Accurate Frequency Estimation」、IEEE Signal Processing Magazine、123~125ページ、2007年5月
[4]
国際特許公開第WO2014/123471A1号
【0062】
発明概念のさらなる説明が、文献国際特許出願公開第WO2014/123469A1号において提供される。
【0063】
発明概念の例示的な実施形態のリスティング:
例示的な実施形態が以下で説明される。参照番号/文字は、例示的な実施形態を、参照番号/文字によって示される特定のエレメントに限定することなしに、例/例示として丸括弧中に提供される。
1. 受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するための方法であって、方法は、
少なくとも1つのトーンについてのスペクトル表現の複数のビンベクトルを受信すること(1200、1312)であって、複数のビンベクトルが、少なくとも1つのトーンについての3つの連続するビンベクトルを含む、複数のビンベクトルを受信すること(1200、1312)と、
3つの連続するビンベクトルの各々が複素数値を有するのか実数値を有するのかを決定すること(1202、1314)と、
決定に応答して、少なくとも1つのトーンの周波数を推定するために3つの連続するビン値を処理すること(1204、1316)と
を含む、方法。
2. 決定することは、少なくとも1つのトーンについての3つの連続するビンベクトルの各々が複素数値を有すると決定することを含み、処理することは、3つの連続するビンベクトルの各々についての複素数値係数を抽出することと、3つの連続するビンベクトルの各々についての複素数値係数に基づいて、少なくとも1つのトーンについてのフラクショナルビンオフセットを計算すること(1204、1314)と、フラクショナルビンオフセットに基づいて、少なくとも1つのトーンについてのビン周波数を計算すること(1204、1314)とを含む、実施形態1に記載の方法。
3. 少なくとも1つのトーンについてのフラクショナルビンオフセットを計算することが、少なくとも1つのトーンについての3つの連続するビンベクトルの各々を含んでいる周波数スペクトルについての、スケーリング係数、スペクトル表現のために使用される窓関数、および変換長を含む、実施形態1または2に記載の方法。
4. スケーリング係数が窓関数のタイプに依存する、実施形態1から3のいずれか1つに記載の方法。
5. 少なくとも1つのトーンについてのフラクショナルビンオフセットを計算することが、3つの連続するビンベクトルの各々を含んでいる周波数スペクトルについての、窓関数および変換長を含む、実施形態1から4のいずれか1つに記載の方法。
6. 窓関数が、ハム窓に基づくテーパリングとの組み合わせられた矩形窓を含む、実施形態1から5のいずれか1つに記載の方法。
7. 矩形窓が矩形長さを含み、ハム窓がフェージング長さを含む、実施形態1から6のいずれか1つに記載の方法。
8. 矩形長さおよびフェージング長さの各々が、少なくとも1つのサンプリング周波数に依存する、実施形態1から7のいずれか1つに記載の方法。
9. スケーリング係数は、窓関数が、ハム窓に基づくテーパリングとの組み合わせられた矩形窓を含むとき、定数を含む、実施形態1から18のいずれか1つに記載の方法。
10. 窓関数が周期的ハム窓を含む、実施形態1から9のいずれか1つに記載の方法。
11. スケーリング係数は、窓関数が、周期的ハム窓を含むとき、定数を含む、実施形態1から10のいずれか1つに記載の方法。
12. 少なくとも1つのトーンについてのビン周波数を計算することが、少なくとも1つのトーンについてのフラクショナルビンオフセットと、3つの連続するビンのうちの第1のビンにおける少なくとも1つのトーンのロケーションと、Hz/ビン単位の粗い分解能とを含む、実施形態1から11のいずれか1つに記載の方法。
13. 粗い分解能が、周波数スペクトルについての変換長、およびサンプリング周波数に依存する、実施形態1から12のいずれか1つに記載の方法。
14. 決定することおよび処理することが、スペクトル表現の少なくとも1つのトーンの各々について実施される、実施形態1から13のいずれか1つに記載の方法。
15. 決定することは、3つの連続するビンベクトルのうちの少なくとも1つが実数値を有すると決定することを含み、処理することが、3つの連続するビンベクトルの各々についてのマグニチュードポイントを抽出することと、3つの連続するビンベクトルの各々についてのマグニチュードポイントに基づいて、フラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、少なくとも1つのトーンについてのビン周波数を計算することとを含む、実施形態1に記載の方法。
16. 受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ(1300)であって、デコーダが、
プロセッサ(1306)と、
プロセッサに結合されたメモリ(1308)と
を備え、メモリが、プロセッサによって実行されたとき、デコーダに、実施形態1から15のいずれか1つに記載の動作を実施させる命令を含む、デコーダ(1300)。
17. 受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ(1300)であって、デコーダが、実施形態1から15のいずれか1つに従って実施するように適合された、デコーダ(1300)。
18. 受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるべきプログラムコードを備えるコンピュータプログラムであって、プログラムコードの実行が、デコーダ(1300)に、実施形態1から15のいずれか1つに記載の動作を実施させる、コンピュータプログラム。
19. 受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるべきプログラムコードを含む非一時的記憶媒体を備えるコンピュータプログラム製品であって、プログラムコードの実行が、デコーダ(1300)に、実施形態1から15のいずれか1つに記載の動作を実施させる、コンピュータプログラム製品。
【0064】
追加の説明
【0065】
概して、本明細書で使用されるすべての用語は、異なる意味が、明確に与えられ、および/またはその用語が使用される文脈から暗示されない限り、関連する技術分野における、それらの用語の通常の意味に従って解釈されるべきである。1つの(a/an)/その(the)エレメント、装置、構成要素、手段、ステップなどへのすべての言及は、別段明示的に述べられていない限り、そのエレメント、装置、構成要素、手段、ステップなどの少なくとも1つの事例に言及しているものとしてオープンに解釈されるべきである。本明細書で開示されるいずれの方法のステップも、ステップが、別のステップに後続するかまたは先行するものとして明示的に説明されない限り、および/あるいはステップが別のステップに後続するかまたは先行しなければならないことが暗黙的である場合、開示される厳密な順序で実施される必要はない。本明細書で開示される実施形態のいずれかの任意の特徴は、適切であればいかなる場合も、任意の他の実施形態に適用され得る。同じように、実施形態のいずれかの任意の利点は、任意の他の実施形態に適用され得、その逆も同様である。同封の実施形態の他の目的、特徴、および利点は、以下の説明から明らかになる。
【0066】
本明細書で開示される任意の適切なステップ、方法、特徴、機能、または利益は、1つまたは複数の仮想装置の1つまたは複数の機能ユニットまたはモジュールを通して実施され得る。各仮想装置は、いくつかのこれらの機能ユニットを備え得る。これらの機能ユニットは、1つまたは複数のマイクロプロセッサまたはマイクロコントローラを含み得る、処理回路、ならびに、デジタル信号プロセッサ(DSP)、専用デジタル論理などを含み得る、他のデジタルハードウェアを介して実装され得る。処理回路は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、キャッシュメモリ、フラッシュメモリデバイス、光記憶デバイスなど、1つまたはいくつかのタイプのメモリを含み得る、メモリに記憶されたプログラムコードを実行するように設定され得る。メモリに記憶されたプログラムコードは、1つまたは複数の通信および/またはデータ通信プロトコルを実行するためのプログラム命令、ならびに本明細書で説明される技法のうちの1つまたは複数を行うための命令を含む。いくつかの実装形態では、処理回路は、それぞれの機能ユニットに、本開示の1つまたは複数の実施形態による、対応する機能を実施させるために使用され得る。
【0067】
ユニットという用語は、エレクトロニクス、電気デバイス、および/または電子デバイスの分野での通常の意味を有し得、たとえば、本明細書で説明されるものなど、それぞれのタスク、プロシージャ、算出、出力、および/または表示機能を行うための、電気および/または電子回路、デバイス、モジュール、プロセッサ、メモリ、論理固体および/または個別デバイス、コンピュータプログラムまたは命令などを含み得る。
【0068】
本発明概念の様々な実施形態の上記の説明では、本明細書で使用される専門用語は、具体的な実施形態を説明するためのものにすぎず、本発明概念を限定するものではないことを理解されたい。別段に規定されていない限り、本明細書で使用される(技術用語および科学用語を含む)すべての用語は、本発明概念が属する技術の当業者によって通常理解されるものと同じ意味を有する。通常使用される辞書において規定される用語など、用語は、本明細書および関連技術の文脈におけるそれらの用語の意味に従う意味を有するものとして解釈されるべきであり、明確にそのように本明細書で規定されない限り、理想的なまたは過度に形式的な意味において解釈されないことをさらに理解されよう。
【0069】
エレメントが、別のエレメントに「接続された」、「結合された」、「応答する」、またはそれらの変形態であると呼ばれるとき、そのエレメントは、別のエレメントに直接、接続され、結合され、または応答し得、あるいは介在するエレメントが存在し得る。対照的に、エレメントが、別のエレメントに「直接接続された」、「直接結合された」、「直接応答する」、またはそれらの変形態であると呼ばれるとき、介在するエレメントが存在しない。同様の番号は、全体を通して同様のエレメントを指す。さらに、本明細書で使用される、「結合された」、「接続された」、「応答する」、またはそれらの変形態は、無線で結合された、無線で接続された、または無線で応答する、を含み得る。本明細書で使用される単数形「a」、「an」および「the」は、文脈が別段に明確に示すのでなければ、複数形をも含むものとする。簡潔および/または明快のために、よく知られている機能または構築が詳細に説明されないことがある。「および/または」という用語は、関連するリストされた項目のうちの1つまたは複数の任意のおよび全部の組合せを含む。
【0070】
様々なエレメント/動作を説明するために、第1の、第2の、第3の、などの用語が本明細書で使用され得るが、これらのエレメント/動作は、これらの用語によって限定されるべきでないことを理解されよう。これらの用語は、あるエレメント/動作を別のエレメント/動作と区別するために使用されるにすぎない。したがって、本発明概念の教示から逸脱することなしに、いくつかの実施形態における第1のエレメント/動作が、他の実施形態において第2のエレメント/動作と呼ばれることがある。同じ参照番号または同じ参照符号は、本明細書全体にわたって同じまたは同様のエレメントを示す。
【0071】
本明細書で使用される、「備える、含む(comprise)」、「備える、含む(comprising)」、「備える、含む(comprises)」、「含む(include)」、「含む(including)」、「含む(includes)」、「有する(have)」、「有する(has)」、「有する(having)」という用語、またはそれらの変形態は、オープンエンドであり、1つまたは複数の述べられた特徴、完全体、エレメント、ステップ、構成要素または機能を含むが、1つまたは複数の他の特徴、完全体、エレメント、ステップ、構成要素、機能またはそれらのグループの存在または追加を排除しない。さらに、本明細書で使用される、「たとえば(exempli gratia)」というラテン語句に由来する「たとえば(e.g.)」という通例の略語は、前述の項目の一般的な1つまたは複数の例を紹介するかまたは具体的に挙げるために使用され得、そのような項目を限定するものではない。「すなわち(id est)」というラテン語句に由来する「すなわち(i.e.)」という通例の略語は、より一般的な具陳から特定の項目を具体的に挙げるために使用され得る。
【0072】
例示的な実施形態が、コンピュータ実装方法、装置(システムおよび/またはデバイス)および/またはコンピュータプログラム製品のブロック図および/またはフローチャート例示を参照しながら本明細書で説明される。ブロック図および/またはフローチャート例示のブロック、ならびにブロック図および/またはフローチャート例示中のブロックの組合せが、1つまたは複数のコンピュータ回路によって実施されるコンピュータプログラム命令によって実装され得ることを理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ回路、専用コンピュータ回路、および/またはマシンを作り出すための他のプログラマブルデータ処理回路のプロセッサ回路に提供され得、したがって、コンピュータおよび/または他のプログラマブルデータ処理装置のプロセッサを介して実行する命令は、ブロック図および/またはフローチャートの1つまたは複数のブロックにおいて指定された機能/行為を実装するために、およびそれにより、ブロック図および/またはフローチャートの(1つまたは複数の)ブロックにおいて指定された機能/行為を実装するための手段(機能)および/または構造を作成するために、トランジスタ、メモリロケーションに記憶された値、およびそのような回路内の他のハードウェア構成要素を変換および制御する。
【0073】
これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラマブルデータ処理装置に特定の様式で機能するように指示することができる、有形コンピュータ可読媒体に記憶され得、したがって、コンピュータ可読媒体に記憶された命令は、ブロック図および/またはフローチャートの1つまたは複数のブロックにおいて指定された機能/行為を実装する命令を含む製造品を作り出す。したがって、本発明概念の実施形態は、ハードウェアで、および/または「回路」、「モジュール」またはそれらの変形態と総称して呼ばれることがある、デジタル信号プロセッサなどのプロセッサ上で稼働する(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェアで具現され得る。
【0074】
また、いくつかの代替実装形態では、ブロック中で言及される機能/行為は、フローチャート中で言及される順序から外れて行われ得ることに留意されたい。たとえば、関与する機能/行為に応じて、連続して示されている2つのブロックが、事実上、実質的にコンカレントに実行され得るか、またはブロックが、時々、逆の順序で実行され得る。その上、フローチャートおよび/またはブロック図の所与のブロックの機能が、複数のブロックに分離され得、ならびに/あるいはフローチャートおよび/またはブロック図の2つまたはそれ以上のブロックの機能が、少なくとも部分的に統合され得る。最後に、他のブロックが、示されているブロック間に追加/挿入され得、および/または発明概念の範囲から逸脱することなく、ブロック/動作が省略され得る。その上、図のうちのいくつかが、通信の主要な方向を示すために通信経路上に矢印を含むが、通信が、図示された矢印と反対方向に行われ得ることを理解されたい。
【0075】
本発明概念の原理から実質的に逸脱することなしに、実施形態に対して多くの変形および修正が行われ得る。すべてのそのような変形および修正は、本発明概念の範囲内で本明細書に含まれるものとする。したがって、上記で開示された主題は、例示であり、限定するものではないと見なされるべきであり、実施形態の例は、本発明概念の趣旨および範囲内に入る、すべてのそのような修正、拡張、および他の実施形態をカバーするものとする。したがって、法によって最大限に許容される限りにおいて、本発明概念の範囲は、実施形態およびそれらの等価物の例を含む、本開示の最も広い許容可能な解釈によって決定されるべきであり、上記の詳細な説明によって制限または限定されるべきでない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15