【文献】
Bruno Bessette,UNIVERSAL SPEECH/AUDIO CODING USING HYBRID ACELP/TCX TECHNIQUES,Proceeding of IEEE International Conferecnce on Acoustics, Speech, and Signal Processing, 2005,2005年 1月,p. 301-304
(58)【調査した分野】(Int.Cl.,DB名)
前記利得形状回路は、前記ハイバンドオーディオ信号に基づいて前記フレームの特定のエネルギー値を決定することと、前記特定のエネルギー値を表すために必要とされるビットの数に基づいて、前記特定のエネルギー値が飽和状態であるかどうかを決定することとを行うようにさらに構成される、請求項1に記載のデバイス。
前記合成ハイバンドオーディオ信号に基づいて、また前記利得形状パラメータに基づいて、補償済み合成ハイバンドオーディオ信号を生成するように構成された利得形状補償器をさらに備え、前記利得フレーム回路が、前記補償済み合成ハイバンドオーディオ信号にさらに基づいて前記利得フレームパラメータを生成するように構成される、請求項1に記載のデバイス。
入力オーディオ信号を受信することと、前記利得フレームパラメータを示すデータに基づいて出力信号を生成することとを行うように構成されたエンコーダと、前記エンコーダが前記利得形状回路と前記利得フレーム回路とを含む、
前記入力オーディオ信号に基づいて前記ハイバンドオーディオ信号を生成するように構成されたフィルタと
をさらに備える、請求項1に記載のデバイス。
エンコーダをさらに備え、前記利得形状回路、前記利得フレーム回路、および前記エンコーダがモバイル通信デバイスまたは基地局の中に一体化される、請求項1に記載のデバイス。
前記利得フレームパラメータを示す前記データは、前記ハイバンドオーディオ信号に対応する再構成されたハイバンドオーディオ信号を生成するために前記別のデバイスのデコーダによって利用されるように構成される、請求項12に記載のデバイス。
前記複数のサブフレームのうちの特定のサブフレームが飽和状態であると決定することは、前記エンコーダにおいて、前記特定のサブフレームに関連するエネルギー値を表すために必要とされるビットの数が前記エンコーダの固定小数点幅を上回ると決定することを備える、請求項14に記載の方法。
前記特定のエネルギー値を表すために必要とされるビットの前記数が、前記特定のエネルギー値を記憶するために利用可能な前記エンコーダのビットの総数よりも大きいときに、前記特定のエネルギー値は飽和状態である、請求項16に記載の方法。
非飽和状態であると決定された前記複数のサブフレームの各サブフレームに関して、前記第1のエネルギー値と合成ハイバンドオーディオ信号の対応するサブフレームの第2のエネルギー値との比に基づいて、前記サブフレームの前記推定利得形状値を決定することをさらに備える、請求項23に記載の方法。
前記利得フレームパラメータは、前記利得形状補償済み信号および前記ハイバンドオーディオ信号のスケーリングされたバージョンに基づいてさらに決定され、前記ハイバンドオーディオ信号の前記スケーリングされたバージョンが、前記ハイバンドオーディオ信号に基づいて、また飽和状態であるサブフレームの前記数に基づいて生成される、請求項28に記載の方法。
前記ハイバンドオーディオ信号における飽和状態であるサブフレームの前記数がゼロよりも大きいとの決定に応答して、前記ハイバンドオーディオ信号をスケーリングすることをさらに備える、請求項30に記載の方法。
受信するための前記手段はフィルタバンクを備え、サブフレームの前記数を決定するための前記手段は利得形状回路を備え、前記利得フレームパラメータを決定するための前記手段は利得フレーム回路を備える、請求項34に記載の装置。
前記ハイバンドオーディオ信号を受信するための前記手段、サブフレームの前記数を決定するための前記手段、および前記利得フレームパラメータを決定するための前記手段は、エンコーダ、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、娯楽ユニット、ナビゲーションデバイス、モバイル通信デバイス、携帯情報端末(PDA)、またはコンピュータのうちの少なくとも1つの中に一体化される、請求項34に記載の装置。
前記ハイバンドオーディオ信号を受信するための前記手段、サブフレームの前記数を決定するための前記手段、および前記利得フレームパラメータを決定するための前記手段は、基地局の中に一体化される、請求項34に記載の装置。
前記ハイバンドオーディオ信号はハイバンドスピーチ信号を備え、前記複数のサブフレームは4つのサブフレームを備える、請求項40に記載のコンピュータ可読記憶デバイス。
前記利得パラメータは、利得形状パラメータ、利得フレームパラメータ、または両方を備え、別のデバイスに前記利得パラメータを示すデータを送信することをさらに備える、請求項43に記載の方法。
前記ハイバンドオーディオ信号をスケーリングすることは、前記スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号を反復的にスケーリングすることを備える、請求項43に記載の方法。
前記スケーリングされたハイバンドオーディオ信号は、前記ハイバンドオーディオ信号の第1のエネルギー値が飽和状態であると決定したことに応答して生成され、前記方法は、前記スケーリングされたハイバンドオーディオ信号が生成された後に、
前記スケーリングされたハイバンドオーディオ信号の第2のエネルギー値を決定することと、
前記第2のエネルギー値に基づいて、前記スケーリングされたハイバンドオーディオ信号が飽和状態であるかどうかを決定することと
をさらに備える、請求項43に記載の方法。
【発明を実施するための形態】
【0013】
[0021]本開示の特定の態様が、図面を参照しながら以下で説明される。説明では、共通の特徴は、共通の参照番号によって指定される。本明細書で使用される様々な用語は、特定の実装形態を記述するために使用されるにすぎず、制限するものではない。たとえば、単数形「a」、「an」および「the」は、文脈が別段に明確に示すのでなければ、複数形をも含むものとする。さらに、「備える」および「備えている」という用語が、「含む」または「含んでいる」と互換的に使用され得ることが理解され得る。さらに、「ここにおいて」という用語が、「ここで」と互換的に使用され得ることが理解されよう。本明細書で使用される、構造、構成要素、動作などの要素を修正するために使用される順序を示す用語(たとえば、「第1の」、「第2の」、「第3の」など)は、それ自体、別の要素に関する要素の優先順位または順序を示しておらず、要素を、(順序を示す用語の使用を別にすれば)同じ名前を有する別の要素から区別しているだけである。本明細書で使用される「セット」という用語は、1つまたは複数の要素のグループ化を指し、「複数」という用語は、複数の要素を指す。
【0014】
[0022]本開示では、ハイバンド信号がスケーリングされてよく、スケーリングされたハイバンド信号は、1つまたは複数の利得パラメータを決定するために使用され得る。1つまたは複数の利得パラメータは、例示的な非限定的な例として、利得形状パラメータ、利得フレームパラメータ、またはそれらの組合せを含み得る。1つまたは複数の利得パラメータを決定するためにエネルギー計算を実行する前に、または実行することの一部として、ハイバンド信号がスケーリングされ得る。利得形状パラメータは、サブフレームごとに決定されてよく、ハイバンド信号と合成ハイバンド信号(たとえば、ハイバンド信号の合成バージョン)との電力比に関連付けられ得る。利得フレームパラメータは、フレームごとに決定されてよく、ハイバンド信号と合成ハイバンド信号との電力比に関連付けられ得る。
【0015】
[0023]例示すると、ハイバンド信号は、複数のサブフレームを有するフレームを含み得る。複数のサブフレームの各々に関して、推定利得形状が決定され得る。各サブフレームに関する利得形状パラメータを決定するにあたり、サブフレームが飽和状態であるかどうかを決定するために(スケーリングされていない)ハイバンド信号のエネルギー値が生成され得る。特定のサブフレームが飽和状態である場合、サブフレームに対応するハイバンド信号が、第1のスケーリングされたハイバンド信号を生成するために第1の所定の値(たとえば、第1のスケーリング係数)によってスケーリングされ得る。たとえば、特定のサブフレームは、例示的な非限定的な例として、係数2によってスケールダウンされ得る。飽和状態であると識別された各サブフレームに関して、サブフレームに関する第1のスケーリングされたハイバンド信号を使用して、利得形状パラメータが決定され得る。
【0016】
[0024]フレームに関する利得フレームパラメータを決定するにあたり、ハイバンド信号は、第2のハイバンド信号を生成するためにスケーリングされ得る。一例では、ハイバンドは、利得形状推定中に飽和状態であると識別されたフレームのサブフレームの数に基づいてスケーリングされ得る。例示すると、飽和状態であると識別されたサブフレームの数は、ハイバンド信号に適用されるスケーリング係数を決定するために使用され得る。別の例では、ハイバンド信号は、例示的な非限定的な例として、係数2または係数8などの第2の所定の値(たとえば、第2のスケーリング係数)によってスケーリングされ得る。別の例として、ハイバンド信号は、その対応するエネルギー値が飽和状態でなくなるまで、反復的にスケーリングされ得る。利得フレームパラメータは、第2のスケーリングされたハイバンド信号を使用して決定され得る。
【0017】
[0025]開示される態様のうちの少なくとも1つによって提供される1つの特定の利点は、エネルギー計算を実行する前にハイバンド信号がスケーリングされ得ることである。ハイバンドエネルギー信号をスケーリングすることは、ハイバンド信号の飽和状態を回避することができ、減衰によって生じる(ハイバンド信号に関連する)オーディオ品質の劣化を減らすことができる。たとえば、係数2(または4、8など)によってスケールダウンすることは、フレームまたはサブフレームのエネルギー値を、エンコーダにおける計算済みエネルギー値を記憶するために使用される利用可能な数のビットを使用して提示され得る量に低減することができる。
【0018】
[0026]
図1を参照すると、1つまたは複数の利得パラメータを生成するように動作可能なシステムの特定の例示的な態様が開示され、全体が100で指定される。システム100は、入力オーディオ信号110を受信するように構成されたエンコーダ104を含み得る。いくつかの実装形態では、エンコーダ104は、例示的な非限定的な例として、第3世代パートナーシッププロジェクト(3GPP(登録商標))強化音声サービス(EVS:enhanced voice service)プロトコル/規格に従う(または準拠する)などして、1つまたは複数のプロトコル/規格に従って動作するように構成され得る。
【0019】
[0027]エンコーダ104は、入力オーディオ信号110(たとえば、スピーチデータ)を符号化するように構成され得る。たとえば、エンコーダ104は、1つまたは複数のパラメータを抽出するために入力オーディオ信号110を分析するように構成されてよく、パラメータをバイナリ表現に、たとえば、ビットのセットまたはバイナリデータパケットに量子化し得る。いくつかの実装形態では、エンコーダ104は、超広帯域(SWB)高調波帯域幅拡張モデルベースのハイバンドエンコーダなどのモデルベースのハイバンドエンコーダを含み得る。特定の実装形態では、超広帯域は、0ヘルツ(Hz)〜16キロヘルツ(kHz)の周波数範囲に対応し得る。別の特定の実装形態では、超広帯域は、0ヘルツ(Hz)〜14.4kHzの周波数範囲に対応し得る。いくつかの実装形態では、エンコーダ104は、例示的な非限定的な例として、広帯域エンコーダまたは全帯域エンコーダを含み得る。特定の実装形態では、広帯域エンコーダは、0ヘルツ(Hz)〜8kHzの周波数範囲に対応することができ、全帯域エンコーダは、0ヘルツ(Hz)〜20kHzの周波数範囲に対応することができる。エンコーダは、1つまたは複数の利得パラメータ170を推定し、量子化し、送信するように構成され得る。たとえば、1つまたは複数の利得パラメータ170は、「利得形状」パラメータと呼ばれる1つもしくは複数のサブフレーム利得、「利得フレーム」パラメータと呼ばれる1つもしくは複数の全体的フレーム利得、またはそれらの組合せを含み得る。1つまたは複数の利得形状パラメータは、入力オーディオ信号110に関連するフレームごとのサブフレームの数に基づく分解能で合成ハイバンドスピーチ信号のエネルギー(たとえば、電力)の時間的変動を制御するために、エンコーダ104によって生成され、使用され得る。
【0020】
[0028]例示すると、エンコーダ104は、スピーチ信号を圧縮するように、フレームを生成するために時間のブロックに分割するように、またはそれらの組合せを行うように構成され得る。いくつかの実装形態では、エンコーダ104は、フレームごとにスピーチ信号を受信するように構成され得る。時間(または「フレーム」)の各ブロックの持続時間は、一般に、信号のスペクトルエンベロープが比較的定常のままであることが予想され得るほど十分に短くなるように選択され得る。いくつかの実装形態では、システム100は、スピーチコンテンツを符号化するように構成された第1のエンコーダおよび音楽コンテンツなどの非スピーチコンテンツを符号化するように構成された第2のエンコーダなどの複数のエンコーダを含み得る。
【0021】
[0029]エンコーダ104は、フィルタバンク120と、合成器122(たとえば、合成モジュール)と、利得パラメータ回路102(たとえば、利得パラメータ論理または利得パラメータモジュール)とを含み得る。フィルタバンク120は、1つまたは複数のフィルタを含み得る。フィルタバンク120は、入力オーディオ信号110を受信するように構成され得る。フィルタバンク120は、周波数に基づいて、入力オーディオ信号110をフィルタリングして複数の部分を生成することができる。たとえば、フィルタバンク120は、ローバンドオーディオ信号(図示されず)とハイバンドオーディオ信号(S
HB)140とを生成することができる。一例では、入力オーディオ信号110が超広帯域である場合、ローバンドオーディオ信号は0〜8kHzに対応することができ、ハイバンドオーディオ信号(S
HB)140は8〜16kHzに対応することができる。別の例では、ローバンドオーディオ信号は0〜6.4kHzに対応することができ、ハイバンドオーディオ信号(S
HB)140は6.4〜14.4kHzに対応することができる。ハイバンドオーディオ信号(S
HB)140はハイバンドスピーチ信号に関連付けられ得る。ハイバンドオーディオ信号(S
HB)140は、例示的な非限定的な例として、4つのサブフレームなどの複数のサブフレームを有するフレームを含み得る。いくつかの実装形態では、フィルタバンク120は、3つ以上の出力を生成することができる。
【0022】
[0030]合成器122は、ハイバンドオーディオ信号(S
HB)140(またはそれの処理されたバージョン)を受信するように、またハイバンドオーディオ信号(S
HB)140に少なくとも部分的に基づいて合成ハイバンドオーディオ信号(
【0024】
)150(たとえば、合成信号)を生成するように構成され得る。合成ハイバンドオーディオ信号(
【0026】
)150の生成は、
図3を参照しながらさらに説明される。いくつかの実装形態では、合成ハイバンドオーディオ信号(
【0028】
)150は、スケーリングされた合成ハイバンドオーディオ信号を生成するためにスケーリング係数(たとえば、例示的な非限定的な例として、スケーリング係数2)によってスケーリングされ得る。スケーリングされた合成ハイバンドオーディオ信号は、利得パラメータ回路102に提供され得る。
【0029】
[0031]利得パラメータ回路102は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0031】
)150とを受信するように、また1つまたは複数の利得パラメータ170を生成するように構成され得る。1つまたは複数の利得パラメータ170は、利得形状パラメータ、利得フレームパラメータ、またはそれらの組合せを含み得る。利得形状パラメータはサブフレームごとに決定されてよく、利得フレームパラメータはフレームごとに決定されてよい。利得形状パラメータおよび利得フレームパラメータの生成は、
図2を参照しながらさらに説明される。
【0032】
[0032]利得パラメータ回路102は、スケーリング回路124(たとえば、スケーリング論理またはスケーリングモジュール)とパラメータ決定回路126(たとえば、パラメータ決定またはパラメータ決定モジュール)とを含み得る。スケーリング回路124は、スケーリングされたハイバンドオーディオ信号160を生成するためにハイバンドオーディオ信号(S
HB)140をスケーリングするように構成され得る。たとえば、ハイバンドオーディオ信号(S
HB)140は、例示的な非限定的な例として、2、4または8のスケーリング値などのスケーリング値によってスケールダウンされ得る。スケーリング値は2の累乗(たとえば、2
1、2
2、2
3など)として説明されているが、他の例では、スケーリング値は任意の数であり得る。いくつかの実装形態では、スケーリング回路124は、スケーリングされた合成ハイバンドオーディオ信号を生成するために合成ハイバンドオーディオ信号(
【0034】
)150をスケーリングするように構成され得る。
【0035】
[0033]パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140と、合成ハイバンドオーディオ信号(
【0037】
)150と、スケーリングされたハイバンドオーディオ信号160とを受信するように構成され得る。いくつかの実装形態では、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140、合成ハイバンドオーディオ信号(
【0039】
)150、およびスケーリングされたハイバンドオーディオ信号160のうちの1つまたは複数を受信しないことがある。
【0040】
[0034]パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140、合成ハイバンドオーディオ信号(
【0042】
)150、およびスケーリングされたハイバンドオーディオ信号160のうちの1つまたは複数に基づいて、1つまたは複数の利得パラメータ170を生成するように構成され得る。1つまたは複数の利得パラメータ170は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0044】
)150とに関連付けられるエネルギー比(たとえば、電力比)などの比に基づいて決定され得る。たとえば、パラメータ決定回路126は、本明細書でさらに説明されるように、フレームのサブフレームの各々に関する利得形状を決定することができ、フレーム全体に関する利得フレームを決定することができる。
【0045】
[0035]いくつかの実装形態では、パラメータ決定回路126は、1つもしくは複数の利得パラメータ170または1つもしくは複数の利得パラメータ170を決定することに関連する中間値など、1つまたは複数の値をスケーリング回路124に提供するように構成され得る。スケーリング回路124は、ハイバンドオーディオ信号(S
HB)140をスケーリングするために1つまたは複数の値を使用することができる。追加または代替として、スケーリング回路124は、
図2を参照しながら説明されるように、合成ハイバンドオーディオ信号(
【0047】
)150をスケーリングするために1つまたは複数の値を使用することができる。
【0048】
[0036]動作中、エンコーダ104は入力オーディオ信号110を受信することができ、フィルタバンク120はハイバンドオーディオ信号(S
HB)140を生成することができる。ハイバンドオーディオ信号(S
HB)140は、合成器122に、また利得パラメータ回路102に提供され得る。合成器122は、ハイバンドオーディオ信号(S
HB)140に基づいて合成ハイバンドオーディオ信号(
【0050】
)150を生成することができ、利得パラメータ回路102に合成ハイバンドオーディオ信号(
【0052】
)150を提供することができる。利得パラメータ回路102は、ハイバンドオーディオ信号(S
HB)140、合成ハイバンドオーディオ信号(
【0054】
)150、スケーリングされたハイバンドオーディオ信号160、またはそれらの組合せに基づいて、1つまたは複数の利得パラメータ170を生成することができる。
【0055】
[0037]特定の態様では、ハイバンドオーディオ信号(S
HB)140のフレームに関する利得形状を決定するために、パラメータ決定回路126は、フレームの各サブフレームに関して、サブフレームの第1のエネルギー値が飽和状態であるかどうかを決定するように構成され得る。例示すると、固定小数点プログラミングでは、32ビットの変数が、2
31−1=2147483647の最大正値を保持することができる。特定のエネルギー値が2
31−1以上である場合、特定のエネルギー値、ひいては対応するサブフレームまたはフレームは、飽和状態と考えられる。
【0056】
[0038]サブフレームが非飽和状態であると決定された場合、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0058】
)150とに関連する比に基づく特定のサブフレームに関する対応するサブフレーム利得形状パラメータを決定することができる。サブフレームが飽和状態であると決定された場合、パラメータ決定回路126は、スケーリングされたハイバンドオーディオ信号160と合成ハイバンドオーディオ信号(
【0060】
)150との比に基づく特定のサブフレームに関する対応するサブフレーム利得形状パラメータを決定することができる。特定のサブフレーム利得形状パラメータを決定するために使用されるスケーリングされたハイバンドオーディオ信号160は、例示的な非限定的な例として、(実際にハイバンド信号振幅を有し得る)スケーリング係数2などの所定のスケーリング係数を使用してハイバンドオーディオ信号(S
HB)140をスケーリングすることによって生成され得る。したがって、パラメータ決定回路126は、フレームの各サブフレームに関する利得形状を出力することができる。いくつかの実装形態では、パラメータ決定回路126は、飽和状態であると決定されたフレームのサブフレームの数をカウントすることができ、サブフレームの数を示す信号(たとえば、データ)をスケーリング回路124に提供することができる。利得形状の計算は、
図2〜
図4を参照しながらさらに説明される。
【0061】
[0039]パラメータ決定回路126はまた、スケーリングされたハイバンドオーディオ信号160を使用して、ハイバンドオーディオ信号(S
HB)140のフレームに関する利得フレームパラメータを決定するように構成され得る。たとえば、パラメータ決定回路126は、スケーリングされたハイバンドオーディオ信号160と合成ハイバンドオーディオ信号(
【0063】
)150とに関連する比に基づいて、フレームに関する利得フレームパラメータを計算することができる。いくつかの実装形態では、フレームに関する利得フレームパラメータは、スケーリングされたハイバンドオーディオ信号160と合成ハイバンドオーディオ信号(
【0065】
)150のスケーリングされたバージョンとの比に基づいて決定され得る。たとえば、スケーリング回路124は、合成ハイバンドオーディオ信号(
【0067】
)150のスケーリングされたバージョンを生成するために利得形状パラメータ(または利得形状パラメータの量子化されたバージョン)を使用することができる。
【0068】
[0040]利得フレームパラメータは、1つまたは複数の技法を使用して生成され得る。第1の技法では、利得フレームパラメータを決定するために使用されるスケーリングされたハイバンドオーディオ信号160が、スケーリング回路124によって、利得形状推定中に識別されたフレームのうちの飽和状態のサブフレームの数に基づいて生成され得る。たとえば、スケーリング回路124は、飽和状態のサブフレームの数に基づくスケーリング係数を決定することができる。例示すると、スケーリング係数は、スケーリング係数(SF)=2
1+N/2として決定され、ここで、Nは飽和状態のサブフレームの数である。いくつかの実装形態では、天井関数または床関数が(N/2)の値に適用され得る。スケーリング回路124は、スケーリングされたハイバンドオーディオ信号160を生成するためにハイバンドオーディオ信号(S
HB)140にスケーリング係数(SF)を適用することができる。
【0069】
[0041]第2の技法では、利得フレームパラメータを決定するために使用されるスケーリングされたハイバンドオーディオ信号160が、スケーリング回路124によって、所定のスケーリング係数に基づいて生成され得る。たとえば、所定のスケーリング係数は、例示的な非限定的な例として、スケーリング係数2、4または8であり得る。スケーリング係数は、エンコーダ104に結合されたメモリ(図示されず)など、スケーリング回路124に結合されたメモリに記憶され得る。いくつかの実装形態では、スケーリング係数は、スケーリング回路124にとってアクセス可能であるレジスタへのメモリを提供され得る。スケーリング回路124は、スケーリングされたハイバンドオーディオ信号160を生成するためにハイバンドオーディオ信号(S
HB)140に所定のスケーリング係数を適用することができる。
【0070】
[0042]第3の技法では、スケーリング回路124は、利得フレームパラメータを決定するために使用されるスケーリングされたハイバンドオーディオ信号160を生成するための反復的プロセスを使用することができる。たとえば、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140のフレームのエネルギーが飽和状態であるかどうかを決定することができる。フレームのエネルギーが非飽和状態である場合、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140のフレームと合成ハイバンドオーディオ信号(
【0072】
)150(または合成ハイバンドオーディオ信号(
【0074】
)150のスケーリングされたバージョン)とのエネルギー値の比に基づいて利得フレームパラメータを決定することができる。代替的に、フレームのエネルギーが飽和状態である場合、スケーリング回路124は、第1のスケーリングされたハイバンドオーディオ信号を生成するために第1のスケーリング係数(たとえば、例示的な非限定的な例として、スケーリング係数2、4または8)を適用することができる。
【0075】
[0043]第4の技法では、スケーリング回路124は、利得フレームパラメータを決定するために使用されるスケーリングされたハイバンドオーディオ信号160を生成するためのプロセスを使用することができる。例示すると、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140のフレームのエネルギーが飽和状態であるかどうかを決定することができる。フレームのエネルギーが非飽和状態である場合、パラメータ決定回路126は、ハイバンドオーディオ信号(S
HB)140のフレームのエネルギー値と合成ハイバンドオーディオ信号(
【0077】
)150(または合成ハイバンドオーディオ信号(
【0079】
)150のスケーリングされたバージョン)のエネルギー値との比に基づいて利得フレームパラメータを決定することができる。代替的に、フレームのエネルギーが飽和状態である場合、スケーリング回路124は、(フレームのうちの)飽和状態のサブフレームの数に基づいて第1のスケール係数を決定することができる。例示すると、第1のスケーリング係数は、スケーリング係数(SF)=2
1+N/2として決定され、ここで、Nは飽和状態のサブフレームの数である。飽和状態のサブフレームの数に基づいてスケーリング係数を生成するための代替実装形態が使用されてよいことに留意されたい。スケーリング回路124は、スケーリングされたハイバンドオーディオ信号160など、第1のスケーリングされたハイバンドオーディオ信号を生成するために第1のスケーリング係数を適用することができる。パラメータ決定回路126は、第1のスケーリングされたハイバンドオーディオ信号(S
HB)160のエネルギー値と合成ハイバンドオーディオ信号の(
【0081】
)150(または合成ハイバンドオーディオ信号(
【0083】
)150のスケーリングされたバージョンの)エネルギーとの比に基づいて利得フレームパラメータを決定することができる。
【0084】
[0044]別の技法では、パラメータ決定回路126は、第1のスケーリングされたハイバンドオーディオ信号に対応するエネルギーが飽和状態であるかどうかを随意に決定することができる。第1のスケーリングされたハイバンドオーディオ信号のエネルギーが非飽和状態である場合、パラメータ決定回路126は、第1のスケーリングされたハイバンドオーディオ信号を使用して利得フレームパラメータを決定することができる。代替的に、フレームのエネルギーが飽和状態である場合、スケーリング回路124は、第1のスケーリングされたハイバンドオーディオ信号を生成するために第2のスケーリング係数(たとえば、例示的な非限定的な例として、スケーリング係数4または8)を適用することができる。第2のスケーリング係数は第1のスケーリング係数よりも大きくてもよい。スケーリング回路124は、飽和状態ではない特定のスケーリングされたハイバンドオーディオ信号をパラメータ決定回路126が識別するまで、より大きいスケーリング係数を使用して、スケーリングされたハイバンドオーディオ信号を生成することを継続し得る。他の実装形態では、スケーリング回路124は、所定の数の反復を実行することができ、非飽和状態のスケーリングされたハイバンドオーディオ信号をパラメータ決定回路126が識別しなかった場合、パラメータ決定回路126は、利得フレームパラメータを決定するためにハイバンドオーディオ信号(S
HB)140または(スケーリング回路124によって生成された)特定のスケーリングされたハイバンドオーディオ信号を使用することができる。
【0085】
[0045]いくつかの実装形態では、利得フレームパラメータを生成するために複数の技法の組合せが使用され得る。たとえば、スケーリング回路124は、第1のスケーリングされたハイバンドオーディオ信号(たとえば、スケーリングされたハイバンドオーディオ信号160)を生成するために、飽和状態のサブフレームの数を使用することができる。パラメータ決定回路126は、スケーリングされたハイバンドオーディオ信号160のエネルギーが飽和状態であるかどうかを決定することができる。エネルギー値が非飽和状態である場合、パラメータ決定回路126は、利得フレームパラメータを決定するために、第1のスケーリングされたハイバンドオーディオ信号(たとえば、スケーリングされたハイバンドオーディオ信号160)を使用することができる。代替的に、エネルギー値が飽和状態である場合、スケーリング回路124は、第1のスケーリングされたハイバンドオーディオ信号(たとえば、スケーリングされたハイバンドオーディオ信号160)を生成するために使用されたスケーリング係数よりも大きい特定のスケーリング係数を使用して、第2のスケーリングされたハイバンドオーディオ信号を生成することができる。
【0086】
[0046]
図1のシステム100(たとえば、エンコーダ104)は、1つまたは複数の利得パラメータ170を決定するために使用されるべきハイバンドオーディオ信号(S
HB)140のスケーリングされたバージョンを生成することができる。ハイバンドオーディオ信号(S
HB)140をスケーリングすることは、ハイバンドオーディオ信号(S
HB)140(たとえば、ハイバンドオーディオ信号(S
HB)140のエネルギー値)の飽和状態を回避することができる。1つまたは複数の利得パラメータ170を決定するために非飽和状態のエネルギー値を使用することは、合成ハイバンド信号(
【0088】
)150に対して適用されるべき利得(たとえば、利得形状)の計算の不正確性を軽減することができ、これは実際には、(ハイバンドに関連する)オーディオ品質の劣化を軽減する。
【0089】
[0047]
図2を参照すると、1つまたは複数の利得パラメータを生成するように動作可能なシステムの特定の例示的な態様が開示され、全体が200で指定される。システム200は、
図1のシステム100に対応する(たとえば、これを参照しながら説明された構成要素を含む)ことができる。
【0090】
[0048]システム200は、エンコーダ204を含み得る。エンコーダ204は、
図1のエンコーダ104を含むこと、またはこれに対応することができる。エンコーダ204は、入力オーディオ信号110を受信するように、また利得形状パラメータ264、利得フレームパラメータ268、またはそれらの組合せなどの1つまたは複数の利得パラメータ170を生成するように構成され得る。エンコーダ204は、フィルタバンク120と、合成器122と、利得形状回路230と、利得形状補償器232と、利得フレーム回路236とを含み得る。利得形状回路230、利得形状補償器232、利得フレーム回路236、またはそれらの組合せは、利得パラメータ回路102またはそれらの構成要素に対応し得る。たとえば、利得形状回路230、利得形状補償器232、利得フレーム回路236、またはそれらの組合せは、
図1のスケーリング回路124を参照しながら説明されたような1つもしくは複数の動作、1つもしくは複数の機能、
図1のパラメータ決定回路126を参照しながら説明されたような1つもしくは複数の機能、またはそれらの組合せを実行することができる。
【0091】
[0049]利得形状回路230(たとえば、利得形状論理または利得形状モジュール)は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0093】
)150とに関連付けられる第1の比に基づいて、推定利得形状値などの利得形状パラメータ264を決定するように構成され得る。利得形状パラメータ264は、サブフレームごとに決定され得る。たとえば、特定のフレームの利得形状パラメータ264は、特定のフレームの各サブフレームに関する値(たとえば、利得形状値)を含むアレイ(たとえば、ベクトルまたは他のデータ構造)を含み得る。利得形状パラメータ264は、利得形状回路230によって出力される前に利得形状回路230によって量子化され得ることに留意されたい。
【0094】
[0050]例示すると、特定のサブフレームに関して、利得形状回路230は、特定のサブフレーム(たとえば、特定のサブフレームのエネルギー)が飽和状態であるかどうかを決定することができる。特定のサブフレームが飽和状態ではない場合、特定のサブフレームの利得形状値が、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0096】
)150とを使用して決定され得る。代替的に、特定のサブフレームが飽和状態である場合、利得形状回路は、スケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号(S
HB)140をスケーリングすることができ、特定のサブフレームの利得形状値は、スケーリングされたハイバンドオーディオ信号と合成ハイバンドオーディオ信号(
【0098】
)150とを使用して決定され得る。特定のフレームに関して、利得形状回路230は、特定のフレームの(複数のサブフレームのうちの)飽和状態のサブフレームの数262を決定し(たとえば、カウントし)、飽和状態のサブフレームの数262を示す信号(またはデータ)を出力するように構成され得る。
【0099】
[0051]利得形状回路230は、図示のように利得形状補償器232に利得形状パラメータ264(たとえば、推定利得形状パラメータ)を提供するようにさらに構成され得る。利得形状補償器232(たとえば、利得形状補償回路)は、合成ハイバンドオーディオ信号(
【0101】
)150と利得形状パラメータ264とを受信するように構成され得る。利得形状補償器232は、利得形状補償済み合成ハイバンドオーディオ信号261を生成するために(サブフレームごとに)合成ハイバンドオーディオ信号(
【0103】
)150をスケーリングすることができる。利得形状補償済み合成ハイバンドオーディオ信号261の生成は、利得形状補償と呼ばれ得る。
【0104】
[0052]利得フレーム回路236(たとえば、利得フレーム論理または利得フレームモジュール)は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0106】
)150とに関連付けられる第2の比に基づいて、推定利得フレーム値などの利得フレームパラメータ268を決定するように構成され得る。利得フレーム回路236は、フレームごとに利得フレームパラメータを決定することができる。たとえば、利得フレーム回路236は、ハイバンドオーディオ信号(S
HB)140と合成ハイバンドオーディオ信号(
【0108】
)150とに関連付けられる第2の比に基づいて利得フレームパラメータ268を決定することができる。
【0109】
[0053]例示すると、特定のフレームに関する利得フレームパラメータ268を計算するために、利得フレーム回路236は、利得形状回路230によって決定された飽和状態のサブフレームの数262に基づいてハイバンドオーディオ信号(S
HB)140をスケーリングすることができる。たとえば、利得フレーム回路236は、飽和状態のサブフレームの数262に基づいてスケーリング係数を決定する(たとえば、テーブルを参照する、または計算する)ことができる。代替実装形態では、このスケーリングは利得フレーム回路236内で実行される必要がなく、利得フレーム回路236の上流にある(たとえば、信号処理チェーンにおいて利得フレーム回路236の前にある)エンコーダ204の別の構成要素において実行されてよいことに留意されたい。利得フレーム回路236は、第2のスケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号(S
HB)140にスケーリング係数を適用することができる。利得フレーム回路236は、第2のスケーリングされたハイバンドオーディオ信号および利得形状補償済み合成ハイバンドオーディオ信号261に基づいて、利得フレームパラメータ268を生成することができる。たとえば、利得フレームパラメータ268は、第2のスケーリングされたハイバンドオーディオ信号のエネルギー値と利得形状補償済み合成ハイバンドオーディオ信号261のエネルギー値との比に基づいて決定され得る。いくつかの実装形態では、利得フレームパラメータ268は、利得フレーム回路236によって出力される前に利得フレーム回路236によって量子化され得る。
【0110】
[0054]特定のフレームに関する利得フレームパラメータ268を計算するための別の代替実装形態を例示すると、利得フレーム回路236は、ハイバンドオーディオ信号(S
HB)140に関連する第1のエネルギー値を推定することができる。第1のエネルギー値が飽和状態ではない場合、利得フレーム回路236は、第1のエネルギーパラメータと第2のエネルギーパラメータとの比に基づいて利得フレームを推定することができる。第2のエネルギーパラメータは、利得形状補償済み合成ハイバンドオーディオ信号261の推定されたエネルギーに基づき得る。第1のエネルギー値が飽和状態であることがわかった場合、利得フレーム回路236は、利得形状回路230によって決定された飽和状態のサブフレームの数262に基づいて決定される(たとえば、テーブルの参照を使用して識別される、または計算される)スケーリング係数を推定することができる。利得フレーム回路236は、第1のスケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号(S
HB)140にスケーリング係数を適用することができる。利得フレーム回路236は、第1のスケーリングされたハイバンドオーディオ信号に関連する第3のエネルギー値を再推定することができる。利得フレーム回路236は、第1のスケーリングされたハイバンドオーディオ信号および利得形状補償済み合成ハイバンドオーディオ信号261に基づいて、利得フレームパラメータ268を生成することができる。たとえば、利得フレームパラメータ268は、第1のスケーリングされたハイバンドオーディオ信号に対応する第3のエネルギー値と利得形状補償済み合成ハイバンドオーディオ信号261に対応する第2のエネルギー値との比に基づいて決定され得る。
【0111】
[0055]動作中、入力オーディオ信号110の特定のフレームに関して、利得形状回路230は、第1のスケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号(S
HB)140をスケーリングすることができる。利得形状回路230は、第1のスケーリングされたハイバンドオーディオ信号を使用して、フレームの各サブフレームに関する利得形状パラメータ264を決定することができる。さらに、利得形状回路230は、フレームの飽和状態のサブフレームの数262を決定することができる。利得フレーム回路236は、第2のスケーリングされたハイバンドオーディオ信号を生成するために、飽和状態のサブフレームの数262に基づいてハイバンドオーディオ信号(S
HB)140をスケーリングすることができ、第2のスケーリングされたハイバンドオーディオ信号に基づいて利得フレームパラメータ268を決定することができる。
【0112】
[0056]エンコーダ204(たとえば、利得形状回路230、利得フレーム回路236、またはそれらの組合せ)は、1つまたは複数の利得パラメータ170を生成するために使用される1つまたは複数のエネルギー値の飽和状態を低減するように構成され得る。たとえば、iが非負整数である複数のサブフレーム(i)を含む、mが非負整数であり得、フレーム番号を表し得るフレーム(m)の場合、飽和状態は、利得形状パラメータ264(たとえば、利得形状パラメータ264の値)を決定するために使用され得るサブフレームエネルギー(
【0114】
)を計算するためのハイバンドオーディオ信号(S
HB)140の第1のエネルギー計算の間に発生し得る。追加または代替として、飽和状態は、利得フレームパラメータ268(たとえば、利得フレームパラメータ268の値)を決定するために使用され得るフレームエネルギー(
【0116】
)を計算するためのハイバンドオーディオ信号(S
HB)140の第2のエネルギー計算の間に発生し得る。本明細書で使用される上付き文字「fr」は、フレームエネルギーなどのパラメータがフレーム全体に対応し、特定のサブフレーム(i)に固有のものではないことを示す。
【0117】
[0057]いくつかの実装形態では、利得形状回路230は、フレームの各サブフレームに関する利得形状値を推定するように構成され得る。たとえば、例示的な非限定的な例として、特定のフレーム(m)はm=1の値を有することができ、(i)は値i=[1,2,3,4]のセットを含む。他の例では、特定のフレーム(m)は別の値を有することができ、(i)は値の異なるセットを含むことができる。利得形状パラメータ264(たとえば、GainShape[i])は、ハイバンドオーディオ信号(S
HB)140合成ハイバンドオーディオ信号(
【0119】
)150の各サブフレーム(i)に関する電力比として決定され得る。
【0120】
[0058]以下の例では、第1のフレーム(m)は、320個のオーディオサンプルを含み、これらのサンプルは、それぞれ80個のオーディオサンプルからなる4つのサブフレームに分割され得る。第1のフレーム(m)の各サブフレーム(i)に関する利得形状値を計算するために、利得形状回路230は、ハイバンドオーディオ信号(S
HB)140のそのサブフレームに関するサブフレームエネルギー値
【0122】
を計算することができる。サブフレームエネルギー値
【0126】
ここで、wは重複ウィンドウである。たとえば、かもしれない重複ウィンドウは、第1のサブフレーム(i)からの80個のサンプルと先行サブフレーム(i−1)からの(平滑化重複に対応する)20個のサンプルとを含む100個のサンプルの長さを有し得る。i−1がゼロである場合、先行サブフレーム(i−1)は、第1のフレーム(m)よりも順序が前になる先行フレーム(m−1)の最後のサブフレームであり得る。重複ウィンドウの例は、
図4を参照しながら説明される。ウィンドウおよび重複のサイズは、説明のためのものであり、限定的と見なされるべきではない。
【0127】
[0059]各サブフレーム(i)に関する利得形状値を計算するために、利得形状回路230は、合成ハイバンドオーディオ信号(
【0129】
)150(または合成ハイバンドオーディオ信号
【0131】
150のスケーリングされたバージョン)のその対応するサブフレームに関するサブフレームエネルギー値
【0133】
を計算することができる。サブフレームエネルギー値
【0137】
[0060]飽和状態が検出されなかった場合、サブフレームエネルギー値
【0139】
は、サブフレーム(i)に関する利得形状値(たとえば、GainShape[i])を決定するために使用されてよく、利得形状値は次のように計算され得る。
【0143】
はハイバンドオーディオ信号(S
HB)140のエネルギーであり、
【0147】
)150(または合成ハイバンドオーディオ信号(
【0149】
)150のスケーリングされたバージョン)のサブフレームエネルギー値である。サブフレーム(i)に関する利得形状値は、利得形状パラメータ264中に含まれ得る。
【0150】
[0061]代替的に、サブフレームエネルギー値
【0152】
が飽和状態であることが検出された場合、利得形状回路230は、サブフレームエネルギー
【0154】
を計算するために、例示的な非限定的な例として、係数2によってハイバンドオーディオ信号(S
HB)140をスケーリングすることができる。
【0156】
[0062]スケーリングされたハイバンドオーディオ信号(S
HB)を使用して計算されたこの
【0160】
の1/4である。係数2によってスケールダウンすることは、スケーリング係数が2乗されるので、4で割る演算となり得、飽和状態の可能性を低下させることができる。飽和状態を回避するために係数2によってスケールダウンすることが説明されているが、他の係数が使用されてもよい。エネルギーを1/4にスケールダウンすることは、GainShape計算において、最後のGainShape(i)を係数2によってスケールアップすることによって反映され(accounted for)得る。
【0162】
[0063]したがって、ハイバンドオーディオ信号(S
HB)140にスケーリング係数を適用することによって、サブフレームエネルギー値
【0165】
[0064]いくつかの実装形態では、利得形状回路230は、スケーリングされた合成信号を生成するために合成ハイバンドオーディオ信号(
【0167】
)150をスケーリングすることができる。たとえば、利得形状回路230は、スケーリングされた合成信号を生成するために、合成ハイバンドオーディオ信号(
【0169】
)150に合成スケーリング係数を適用することができる。利得形状回路230は、利得形状パラメータ264(たとえば、GainShape)を計算するために、スケーリングされた合成信号を使用することができる。たとえば、利得形状パラメータ264(たとえば、GainShape)を計算するために、利得形状回路230は、合成スケーリング係数を反映させることができる。例示すると、合成スケーリング係数が2であり、スケーリング係数がハイバンドオーディオ信号(S
HB)140に適用されない場合、利得形状パラメータ264は次のように計算され得る。
【0171】
[0065]別の例として、合成スケーリング係数が2であり、スケーリング係数がハイバンドオーディオ信号(S
HB)140に適用される、2である場合、利得形状パラメータ264は次のように計算され得る。
【0173】
[0066]GainShapeがフレームに関して推定されると、GainShapeは、GainShape[i]を取得するために量子化され得る。合成ハイバンドオーディオ信号(
【0175】
)150は、利得形状補償済み合成ハイバンドオーディオ信号261を生成するために、量子化されたGainShape[i]とともにサブフレームごとに利得形状補償器232によってスケーリングされ得る。利得形状補償済み合成ハイバンドオーディオ信号261を生成することは、GainShape補償と呼ばれ得る。
【0176】
[0067]GainShape補償が完了した後、利得フレーム回路236は、利得フレームパラメータ268を推定することができる。利得フレームパラメータ268(たとえば、GainFrame)を決定するために、利得フレーム回路236は、重複ウィンドウw
frを使用してフレームのフレームエネルギー値
【0178】
を計算することができる。いくつかの実装形態では、フレームエネルギー値
【0182】
[0068]重複ウィンドウは、第1のフレーム(m)の320個のサンプルおよび第1のフレーム(m)よりも順序が前になる先行フレーム(m−1)からの(重複に対応する)20個のサンプルなど、340個のサンプルを含み得る。利得フレームパラメータ268を決定するために使用される重複ウィンドウw
frの一例は、
図4を参照しながら説明される。ウィンドウおよび重複のサイズは、説明のためのものであり、限定的と見なされるべきではない。いくつかの実装形態では、ウィンドウはまったく重複しないことがある。
【0185】
計算が、(GainShape(i)を計算するために使用される
【0187】
の場合の100個のサンプルとは異なり)340個のサンプルに対して行われるので、より多くのサンプルエネルギー値が蓄積されており、
【0190】
[0070]利得フレーム回路236は、フレームエネルギー値
【0192】
の飽和状態が発生したかどうかを決定することができる。飽和状態が発生していない場合、利得フレームパラメータ268は次のように計算され得る。
【0196】
の飽和状態が利得フレーム回路236によって検出された場合、飽和状態を回避するためにハイバンドオーディオ信号(S
HB)140にスケーリング係数が適用され得る。飽和状態が検出されたとき、スケーリング係数は、例示的な非限定的な例として、2から8までのいずれかであり得る。例示すると、実現されるいかなる飽和状態もないフレームエネルギー値
【0198】
の真値が2
34である場合、係数2によってハイバンドオーディオ信号(S
HB)140をスケーリングすることは、1/4に低減された計算済みフレームエネルギー値
【0200】
を生成することになり(たとえば、4=2
32(>2
(31-1)))、飽和状態が依然として検出されることになる。一方、ハイバンドオーディオ信号(S
HB)140が係数4によってスケーリングされた場合、フレームエネルギー値
【0202】
は、実際に1/16に低減され、(2
34/16=2
30(≦2
(31-1)))となり、実際にいかなる飽和状態も回避する。
【0203】
[0072]いくつかの実装形態では、スケーリングが適用されない場合にフレームエネルギー値
【0205】
が飽和状態である可能性が高いので、フレームエネルギー値
【0207】
を計算するためにハイバンドオーディオ信号(S
HB)140にスケーリングが自動的に適用され得る。他の実装形態では、スケーリングなしに計算されたフレームエネルギー値
【0209】
が飽和状態であるとの決定の後に、スケーリングが適用され得る。
【0210】
[0073]第1の技法では、利得形状パラメータ264(たとえば、GainShape)を含んだサブフレームエネルギー
【0212】
の計算中に飽和状態であることが検出されたフレームのサブフレーム(i)の数に基づいて、スケーリング係数が推定され得る。たとえば、
【0214】
の場合、2つのサブフレームがあり、2
31-1よりも大きく、これは、2つのサブフレームが利得形状回路230によって飽和状態であることがわかったことを意味する。フレームエネルギー値
【0216】
が飽和状態になり、下記のようになる可能性が高い(たとえば、非常に高い)ことがある。
【0222】
以下であっても、フレームエネルギー値
【0226】
に実質的に近くなる可能性が高い(たとえば、非常に高い)ことがあり得る。
【0233】
は、2
33程度であると近似され得る。したがって、ハイバンドオーディオ信号(S
HB)140が2によってスケーリングされた場合、フレームエネルギー
【0235】
は1/4に低減され得る。利得フレーム回路236は、スケーリング係数を使用してフレームエネルギー値
【0237】
を再計算することができ、再計算された
【0239】
は、2
31程度であり得、飽和状態が回避され得る。
【0240】
[0075]この例を一般化すると、利得フレーム回路236は、フレームエネルギー値
【0242】
計算での飽和状態を回避するためにハイバンドオーディオ信号(S
HB)140に対して適用されるべきスケール係数を決定することができる。たとえば、スケール係数は、飽和状態となるサブフレームエネルギー
【0244】
の数(たとえば、飽和状態のサブフレームの数262)に基づき得る。例示すると、ハイバンドオーディオ信号(S
HB)140に関するスケール係数は、
【0246】
と決定され得、ここで、Nは、飽和状態のサブフレームの数である(たとえば、ここで、Nは、飽和状態のサブフレームの数262である)。いくつかの実装形態では、N/2の値は、天井関数または床関数を使用して計算され得る。スケーリング係数を使用して、フレームエネルギー値
【0250】
と計算され得、利得フレームパラメータ268は次のように計算され得る。
【0252】
[0076]利得フレームパラメータ268(たとえば、GainFrame)が飽和状態のフレームエネルギー値
【0254】
を使用して計算されており、係数が適用されていない場合(たとえば、係数=1)、利得フレームパラメータ268の推定値は利得フレームの真値よりも低く、ハイバンドオーディオ信号の減衰が発生し得る。
【0255】
[0077]第2の技法では、利得フレーム回路236によってハイバンドオーディオ信号(S
HB)140に適用されるスケーリング係数は、所定のスケーリング係数であり得る。たとえば、所定のスケーリング係数は、例示的な非限定的な例として、スケーリング係数2、4または8であり得る。
【0256】
[0078]追加または代替として、利得フレーム回路236は、ハイバンドオーディオ信号(S
HB)140に適用されるスケーリング係数を利得フレーム回路236が反復的に増加させ得る第3の技法を使用することができる。たとえば、フレームエネルギー値
【0258】
の飽和状態が利得フレーム回路236によって、スケーリングを使用することなく検出された場合、スケーリングが利得フレーム回路236によって反復的に実行され得る。たとえば、第1の反復では、利得フレーム回路236は、係数2によってハイバンドオーディオ信号(S
HB)140をスケーリングし、フレームエネルギー値
【0260】
を再計算することができる。再計算されたフレームエネルギー値
【0262】
が飽和状態である場合、利得フレーム回路236は、第2の反復において、係数4によってハイバンドオーディオ信号(S
HB)140をスケーリングし、フレームエネルギー値
【0264】
を再計算することができる。利得フレーム回路236は、非飽和状態が、検出されたフレームエネルギー値
【0266】
であるまで、反復を実行し続けることができる。他の実装形態では、利得フレーム回路236は、最大でしきい値数の反復を実行することができる。
【0267】
[0079]この提案されている解決策では、フレームエネルギー値
【0269】
が飽和状態であることがわかったとき、上述の式を使用して計算されたスケールダウン係数により、フレームエネルギー値
【0271】
の再計算が一度だけ行われるので、複雑性を軽減する。
【0272】
[0080]いくつかの実装形態では、第2の技法、第3の技法、またはそれらの組合せは、第1の技法と組み合わせられ得る。たとえば、第2の技法は、利得フレーム回路236によって適用されてよく、計算されたフレームエネルギー値
【0274】
が飽和状態である場合、第2または第3の技法が実施されてよく、ここで、第2または第3の技法中に使用される第1のスケーリング係数が第1の技法中に使用されるスケーリング係数よりも大きい。
【0275】
[0081]
図2のシステム200(たとえば、エンコーダ204)は、1つまたは複数の利得パラメータ170を決定するために使用されるべきハイバンドオーディオ信号(S
HB)140のスケーリングされたバージョンを生成することができる。ハイバンドオーディオ信号(S
HB)140をスケーリングすることは、ハイバンドオーディオ信号(S
HB)140(たとえば、ハイバンドオーディオ信号(S
HB)140のエネルギー値)の飽和状態を回避することができる。非飽和状態のエネルギー値を使用することは、飽和状態によって影響されない値または1つもしくは複数の利得パラメータ170を決定することを可能にし得、したがって、(ハイバンドオーディオ信号(S
HB)140に関連する)オーディオ品質がハイバンドオーディオ信号(S
HB)140の減衰によって劣化しないことがある。
【0276】
[0082]
図3を参照すると、1つまたは複数の利得パラメータを生成するように動作可能なシステムの特定の例示的な態様が開示され、全体が300で指定される。システム300は、
図1のシステム100または
図2のシステム200に対応する(たとえば、これらを参照しながら説明された構成要素を含む)ことができる。
【0277】
[0083]エンコーダ204は、線形予測(LP)分析および量子化回路312と、線スペクトル周波数(LSF)−線形予測係数(LPC)回路318と、高調波拡張回路314と、ランダム雑音生成器316と、雑音整形回路317と、第1の増幅器332と、第2の増幅器336と、結合器334とを含み得る。エンコーダ204は、合成器122と、利得形状補償器232と、利得形状回路230と、利得フレーム回路236とをさらに含む。エンコーダ204は、ハイバンドオーディオ信号(S
HB)140とローバンド励振信号310とを受信するように構成され得る。エンコーダ204は、ハイバンドLSFパラメータ342と、利得形状パラメータ264と、利得フレームパラメータ268とを出力するように構成され得る。量子化された利得フレームパラメータ340は、利得フレーム回路236によって出力され得、エンコーダ204によって処分され得る。
【0278】
[0084]LP分析および量子化回路312は、ハイバンドオーディオ信号(S
HB)140の線スペクトル周波数(たとえば、ハイバンドLSFパラメータ342)を決定するように構成され得る。いくつかの実装形態では、ハイバンドLSFパラメータ342は、量子化されたハイバンドLSFパラメータとしてLP分析および量子化回路312によって出力され得る。LP分析および量子化回路312は、量子化されたハイバンドLSFを生成するためにハイバンドLSFパラメータ342を量子化することができる。LSF−LPC回路318は、量子化されたハイバンドLSFを、合成器122に提供される1つまたは複数のLPCに変換することができる。
【0279】
[0085]ローバンド励振信号310は、代数符号励振線形予測(ACELP)エンコーダなどのスピーチエンコーダによって生成され得る。ローバンド励振信号310は高調波拡張回路314によって受信され得る。高調波拡張回路314は、ローバンド励振信号310のスペクトルを拡張することによってハイバンド励振信号を生成するように構成され得る。高調波拡張回路314の出力は、第1の利得値(Gain1)を有する第1の増幅器332(たとえば、スケーリング回路)を介して結合器334に提供され得る。高調波拡張回路314の出力はまた、雑音整形回路317に提供され得る。
【0280】
[0086]ランダム雑音生成器316は、雑音整形回路317にランダム雑音信号を提供するように構成され得る。雑音整形回路317は、第2の利得値(Gain2)を有する第2の増幅器336(たとえば、スケーリングモジュール)を介して結合器334に出力信号を提供するために、高調波拡張回路314の出力とランダム雑音信号とを処理することができる。
【0281】
[0087]結合器334は、合成器122に提供されるハイバンド励振信号を生成するように構成され得る。合成器122は、合成ハイバンドオーディオ信号(
【0283】
)150を生成することができる。たとえば、合成器122は、LSF−LPC回路318から受信されたLPCに従って構成され得る。構成された合成器122は、結合器334から受信されたハイバンド励振信号に基づいて合成ハイバンドオーディオ信号(
【0285】
)150を出力することができる。150は、
図2を参照しながら説明されたように、エネルギー値飽和状態に対処するために、また利得形状パラメータ264、利得フレームパラメータ268、またはそれらの組合せを生成するために、利得形状回路230、利得フレーム回路236、利得形状補償器232、またはそれらの組合せによって処理され得る。
【0286】
[0088]合成器122はLP分析および量子化回路312、LSF−LPC回路318、高調波拡張回路314、ランダム雑音生成器316、雑音整形回路317、第1の増幅器332、第2の増幅器336、および結合器334とは別個のものとして説明されているが、他の実装形態では、合成器122は、LP分析および量子化回路312、LSF−LPC回路318、高調波拡張回路314、ランダム雑音生成器316、雑音整形回路317、第1の増幅器332、第2の増幅器336、および結合器334のうちの1つまたは複数を含み得る。
【0287】
[0089]
図4は、オーディオ信号に関連するエネルギー値を決定することを示すグラフを示す。オーディオ信号は、
図1のハイバンドオーディオ信号(S
HB)140に対応し得る。エネルギー値は、
図1の利得パラメータ回路102(たとえば、パラメータ決定回路126)、
図2の利得形状回路230または利得フレーム回路236によって決定され得る。
【0288】
[0090]第1のグラフ400は、飽和状態のチェックであり、1つまたは複数のサブフレームエネルギー値が飽和状態であると決定されたときにスケーリングされ得る、第1のフレーム(m)のサブフレームエネルギー値
【0290】
を決定するために使用される重複ウィンドウ(w)を示す。第1のフレーム(m)は、第1のサブフレーム(i)、第2のサブフレーム(i+1)、第3のサブフレーム(i+2)、および第4のサブフレーム(i+3)など、4つのサブフレームを含み得る。第1のフレーム(m)は4つのサブフレームを含むものとして示されているが、他の実装形態では、第1のフレーム(m)は、4つよりも多いか、または少ないサブフレームを含む場合がある。特定のサブフレームのサブフレームエネルギー値
【0292】
を計算するために使用されるウィンドウ(w)は、100個のサンプルの長さを含み得る。100個のサンプルは、特定のサブフレームからの80個のサンプルと先行フレーム(m−1)の先行サブフレーム(i−1)からの20個のサンプルとを含み得る。いくつかの実装形態では、先行サブフレーム(i−1)からの20個のサンプルは、
図1のエンコーダ104または
図2のエンコーダ204に結合されたメモリに記憶され得る。
【0293】
[0091]第2のグラフ450は、飽和状態のチェックに使用され、フレームエネルギー値が飽和状態であると決定されたときにスケーリングされ得る、第1のフレーム(m)のフレームエネルギー値
【0295】
を決定するために使用される重複ウィンドウ(w
fr)を示す。第1のフレーム(m)のウィンドウ(w
fr)は340個のサンプルを含み得る。340個のサンプルは、第1のフレーム(m)の320個のサンプルと先行フレーム(m−1)の20個のサンプルとを含み得る。いくつかの実装形態では、先行フレーム(m−1)からの20個のサンプルは、
図1のエンコーダ104または
図2のエンコーダ204に結合されたメモリに記憶され得る。
【0296】
[0092]
図5は、オーディオ信号の例を示すグラフを示す。グラフは、
図1のハイバンドオーディオ信号(S
HB)140に関連付けられ得る。第1のグラフ500は、フィルタバンク120によって出力されたハイバンドオーディオ信号(S
HB)140の表現を示す。グラフ530は、ハイバンドオーディオ信号(S
HB)140が
図1のエンコーダ104またはサブフレームエネルギー値
【0300】
などの
図2ベースの1つもしくは複数の飽和状態のエネルギー値のエンコーダ204によって符号化され、デコーダによって復号された後の出力ハイバンドオーディオ信号(S
HB)140の表現を示す。エネルギー値の飽和状態から生じる情報損失に起因して、第1のグラフ500に示されるハイバンドオーディオ信号(S
HB)140の表現と比較して、1:25:14においてより低いエネルギーが見られることに留意されたい。第3のグラフ550は、サブフレームエネルギー値
【0304】
などの1つまたは複数の飽和状態のエネルギー値が
図1のエンコーダ104または
図2のエンコーダ204によって修正された後にデコーダによって出力された出力ハイバンドオーディオ信号(S
HB)140の表現を示す。たとえば、1つまたは複数の飽和状態のエネルギー値は、ハイバンドオーディオ信号(S
HB)140をスケーリングすることによって修正されていることがある。1:25:14におけるエネルギーが、第1のグラフ500に示される元のオーディオ信号のエネルギーと同様の大きさを有することに留意されたい。
【0305】
[0093]
図6を参照すると、エンコーダを動作させる方法の特定の例示的な例のフローチャートが開示され、全体が600で指定される。エンコーダは、
図1のエンコーダ104(たとえば、利得パラメータ回路102、スケーリング回路124、パラメータ決定回路126)または
図2のエンコーダ204(たとえば、利得形状回路230、利得フレーム回路236、もしくはそれらの組合せ)を含むこと、あるいはこれらに対応することができる。
【0306】
[0094]方法600は、602において、エンコーダにおいて、フレームを含むハイバンドオーディオ信号を受信することを含み、フレームが複数のサブフレームを含む。ハイバンドオーディオ信号は、
図1のハイバンドオーディオ信号(S
HB)140に対応し得る。ハイバンドオーディオ信号は、ハイバンドスピーチ信号を含み得る。いくつかの実装形態では、複数のサブフレームは4つのサブフレームを含み得る。
【0307】
[0095]方法600はまた、604において、飽和状態である複数のサブフレームのうちのサブフレームの数を決定することを含む。たとえば、飽和状態であるサブフレームの数は、
図1の飽和状態のサブフレームの数262に対応し得る。複数のサブフレームのうちの特定のサブフレームが飽和状態であると決定することは、特定のサブフレームに関連するエネルギー値を表すために必要とされるか、または使用されるビットの数がエンコーダにおける固定小数点幅を上回ると決定することを含み得る。
【0308】
[0096]方法600はさらに、606において、飽和状態であるサブフレームの数に基づいて、フレームに対応する利得フレームパラメータを決定することを含む。利得フレームパラメータは、
図1の1つもしくは複数の利得パラメータ170または
図2の利得フレームパラメータ268に対応し得る。利得フレームパラメータは、ハイバンドオーディオ信号と
図1の合成ハイバンドオーディオ信号(
【0310】
)150などの合成ハイバンドオーディオ信号とに基づく比に関連付けられ得る。
【0311】
[0097]いくつかの実装形態では、利得フレームパラメータを決定する前に、方法600は、ハイバンドオーディオ信号に基づいてフレームの特定のエネルギー値を決定することができる。特定のエネルギー値はフレームエネルギー値
【0313】
に対応し得る。特定のエネルギー値が飽和状態であるかどうかの決定が行われ得る。特定のエネルギー値が非飽和状態である場合、特定のエネルギー値は、利得フレームパラメータを計算するために使用され得る。代替的に、特定のエネルギー値が飽和状態であると決定された場合、飽和状態であるサブフレームの数に基づくスケーリング係数が決定され得、ハイバンドオーディオ信号は、スケーリングされたハイバンドオーディオ信号を生成するためにスケーリング係数に基づいてスケーリングされ得る。スケーリングされたハイバンドオーディオ信号が生成された後、スケーリングされたハイバンドオーディオ信号に基づいて、フレームの第2のエネルギー値が決定され得る。
【0314】
[0098]利得フレームパラメータを決定するために、合成ハイバンドオーディオ信号に基づいて第3のエネルギー値が決定され得る。第2のエネルギー値と第3のエネルギー値との比に基づいて、特定の値が決定され得る。いくつかの実装形態では、特定の値は、第2のエネルギー値と第3のエネルギー値との比の平方根に等しくなり得る。特定の値は、利得フレームパラメータを生成するためにスケーリング係数によって乗算され得る。
【0315】
[0099]いくつかの実装形態では、方法600は、フレームに対応する利得形状パラメータを決定することを含み得る。たとえば、利得形状パラメータは、
図1の1つもしくは複数の利得パラメータ170または
図2の利得形状パラメータ264に対応し得る。利得形状パラメータは、複数のサブフレームの各サブフレームに関する推定値を含むベクトルを含み得る。各サブフレームに関して、推定値は、ハイバンドオーディオ信号と合成ハイバンドオーディオ信号とに基づく比に関連付けられ得る。
【0316】
[0100]いくつかの実装形態では、複数のサブフレームの各サブフレームに関して、ハイバンドオーディオ信号に基づいて、サブフレームの第1のエネルギー値が決定され得、サブフレームの第1のエネルギー値が飽和状態であるかどうかの決定が行われ得る。非飽和状態であると決定された複数のサブフレームの各サブフレームに関して、サブフレームの推定利得形状値が、第1のエネルギー値と合成ハイバンドオーディオ信号の対応するサブフレームの第2のエネルギー値との比に基づいて決定され得る。代替的に、飽和状態であると決定された複数のサブフレームの各サブフレームに関して、サブフレームに対応するハイバンドオーディオ信号の一部分がスケーリングされ得、ハイバンドオーディオ信号のスケーリングされた部分に基づくサブフレームの第2のエネルギー値が決定され得る。第2のエネルギー値は、サブフレームの推定値として設定され得る。例示すると、ハイバンドオーディオ信号の一部分は、スケーリング係数を使用してスケーリングされ得る。スケーリング係数は、例示的な非限定的な例として、係数2に対応し得る。
【0317】
[0101]利得形状パラメータ264などの決定された利得形状パラメータは、量子化され得る。
図1の利得形状パラメータ264などの利得形状パラメータは、量子化された利得形状パラメータおよび合成ハイバンド信号に基づいて利得形状補償済み信号を生成するために使用され得る。利得形状補償済み信号は、
図2の利得形状補償済み合成ハイバンドオーディオ信号261に対応し得る。利得フレームパラメータは、利得形状補償済み信号およびハイバンドオーディオ信号のスケーリングされたバージョンに基づいて決定され得る。ハイバンドオーディオ信号のスケーリングされたバージョンは、ハイバンドオーディオ信号に基づいて、また飽和状態であるサブフレームの数に基づいて生成され得る。ハイバンドオーディオ信号のスケーリングされたバージョンは、
図1のスケーリングされたハイバンドオーディオ信号160に対応し得る。
【0318】
[0102]いくつかの実装形態では、飽和状態であるサブフレームの数に基づいてハイバンドオーディオ信号をスケーリングするかどうかの決定が行われ得る。ハイバンドオーディオ信号をスケーリングするとの決定に応答して、ハイバンドオーディオ信号は、
図1のスケーリングされたハイバンドオーディオ信号160など、第2のスケーリングされたハイバンドオーディオ信号を生成するためにスケーリング係数に従ってスケーリングされ得る。たとえば、第2のスケーリングされたハイバンドオーディオ信号は、飽和状態であるサブフレームの数がゼロよりも大きいとの決定に応答して生成され得る。いくつかの実装形態では、スケーリング係数は、飽和状態であるサブフレームの数に基づいて決定され得る。
【0319】
[0103]いくつかの実装形態では、方法600は、スケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号をスケーリングすることを含み得る。たとえば、
図1のスケーリング回路124、
図2もしくは
図3の利得形状回路230、または
図2もしくは
図3の利得フレーム回路236は、
図1のハイバンドオーディオ信号(S
HB)140をスケーリングすることができる。方法600はまた、スケーリングされたハイバンドオーディオ信号に基づいて利得形状パラメータを決定することを含み得る。たとえば、
図2または
図3の利得形状回路230は、利得形状パラメータ264を決定することができる。
【0320】
[0104]したがって、方法600は、エネルギー計算を実行する前にハイバンド信号がスケーリングされ得ることを可能にし得る。ハイバンドエネルギー信号をスケーリングすることは、ハイバンド信号の飽和状態を回避することができ、減衰によって生じる(ハイバンド信号に関連する)オーディオ品質の劣化を減らすことができる。たとえば、係数2(または4、8など)によってスケールダウンすることは、フレームまたはサブフレームのエネルギー値を、エンコーダにおける利用可能な数のビットを使用して提示され得る量に低減することができる。
【0321】
[0105]
図7を参照すると、エンコーダを動作させる方法の特定の例示的な例のフローチャートが開示され、全体が700で指定される。エンコーダは、
図1のエンコーダ104(たとえば、利得パラメータ回路102、スケーリング回路124、パラメータ決定回路126)または
図2のエンコーダ204(たとえば、利得形状回路230、利得フレーム回路236、もしくはそれらの組合せ)を含むこと、あるいはこれらに対応することができる。
【0322】
[0106]方法700は、702において、エンコーダにおいて、ハイバンドオーディオ信号を受信することを含む。たとえば、ハイバンドオーディオ信号は、
図1のハイバンドオーディオ信号(S
HB)140に対応し得る。ハイバンドオーディオ信号は、ハイバンドスピーチ信号を含み得る。
【0323】
[0107]方法700は、704において、スケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号をスケーリングすることを含む。スケーリングされたハイバンドオーディオ信号は、
図1のスケーリングされたハイバンドオーディオ信号160に対応し得る。
【0324】
[0108]方法700はまた、706において、スケーリングされたハイバンドオーディオ信号に基づいて利得パラメータを決定することを含む。たとえば、利得パラメータは、
図1の1つもしくは複数の利得パラメータ170、
図2の利得形状パラメータ264、
図2の利得フレームパラメータ268、またはそれらの組合せに対応し得る。
【0325】
[0109]いくつかの実装形態では、ハイバンドオーディオ信号は、複数のサブフレームを有するフレームを含む。ハイバンドオーディオ信号をスケーリングすることは、
図2の飽和状態のサブフレームの数262など、フレームの飽和状態のサブフレームの数に基づいてスケーリング係数を決定することを含み得る。スケーリング係数は、ハイバンドオーディオ信号をスケーリングするために使用され得る。
【0326】
[0110]いくつかの実装形態では、ハイバンドオーディオ信号は、スケーリングされたハイバンドオーディオ信号を生成するために所定の値を使用してスケーリングされ得る。所定の値は、例示的な非限定的な例として、係数2または係数8に対応し得る。追加または代替として、ハイバンドオーディオ信号をスケーリングすることは、スケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号を反復的にスケーリングすることを含み得る。
【0327】
[0111]いくつかの実装形態では、スケーリングされたハイバンドオーディオ信号は、ハイバンドオーディオ信号の第1のエネルギー値が飽和状態であると決定したことに応答して生成され得る。スケーリングされたハイバンドオーディオ信号が生成された後、スケーリングされたハイバンドオーディオ信号の第2のエネルギー値が生成され得、第2のエネルギー値に基づいて、スケーリングされたハイバンドオーディオ信号が飽和状態であるかどうかの決定が行われ得る。
【0328】
[0112]したがって、方法700は、エンコーダが、エネルギー計算を実行する前にハイバンド信号をスケーリングすることを可能にし得る。ハイバンドエネルギー信号をスケーリングすることによって、ハイバンド信号の飽和状態が回避され得、減衰によって生じる(ハイバンド信号に関連する)オーディオ品質の劣化が減らされ得る。さらに、ハイバンドエネルギー信号をスケーリングすることによって、フレームまたはサブフレームのエネルギー値は、エンコーダにおける利用可能な数のビットを使用して提示され得る量に低減され得る。
【0329】
[0113]特定の態様では、
図6〜
図7の方法は、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、中央処理装置(CPU)などの処理ユニット、デジタル信号プロセッサ(DSP)、コントローラ、別のハードウェアデバイス、ファームウェアデバイス、またはそれらの任意の組合せによって実装され得る。一例として、
図6〜
図7の方法のうちの1つまたは複数は、個別に、または組み合わせて、
図8および
図9に関して説明されるように、命令を実行するプロセッサによって実行され得る。例示すると、
図6の方法600は、
図7の方法700の第2の部分と組み合わせられ得る。加えて、
図6〜
図7を参照しながら説明された1つまたは複数のステップは任意選択であること、少なくとも部分的に同時に実行されること、示される順序もしくは説明される順序とは異なる順序で実行されること、またはそれらの組合せがあり得る。
【0330】
[0114]
図8を参照すると、デバイス(たとえば、ワイヤレス通信デバイス)の特定の例示的な例のブロック図が示され、全体が800で指定される。様々な実装形態では、デバイス800は、
図8に示されたよりも多いか、または少ない構成要素を有する場合がある。例示的な例では、デバイス800は、
図1のエンコーダ104または
図2のエンコーダ204を含み得る。例示的な例では、デバイス800は、
図6〜
図7の方法のうちの1つまたは複数に従って動作し得る。
【0331】
[0115]特定の実装形態では、デバイス800はプロセッサ806(たとえば、CPU)を含む。デバイス800は、1つまたは複数のさらなるプロセッサ810(たとえば、1つまたは複数のDSP)を含み得る。プロセッサ810は、スピーチおよび音楽コーダデコーダ(コーデック)808と、エコーキャンセラ812とを含み得る。たとえば、プロセッサ810は、スピーチおよび音楽コーデック808の動作を実行するように構成された1つまたは複数の構成要素(たとえば、回路)を含み得る。別の例として、プロセッサ810は、スピーチおよび音楽コーデック808の動作を実行するための1つまたは複数のコンピュータ可読命令を実行するように構成され得る。スピーチおよび音楽コーデック808はプロセッサ810の構成要素として示されているが、他の例では、スピーチおよび音楽コーデック808の1つまたは複数の構成要素が、プロセッサ806、コーデック834、別の処理構成要素、またはそれらの組合せの中に含まれ得る。スピーチおよび音楽コーデック808は、ボコーダエンコーダなどのエンコーダ892を含み得る。たとえば、エンコーダ892は、
図1のエンコーダ104または
図2のエンコーダ204に対応し得る。
【0332】
[0116]特定の態様では、エンコーダ892は、1つまたは複数の利得フレームパラメータを決定するようにそれぞれ構成された利得形状回路894と利得フレーム回路895とを含み得る。たとえば、利得形状回路894は、
図1の利得パラメータ回路102または
図1の利得形状回路230に対応し得る。利得フレーム回路895は、
図1の利得パラメータ回路102または
図2の利得フレーム回路236に対応し得る。
【0333】
[0117]デバイス800は、メモリ832とコーデック834とを含み得る。コーデック834は、デジタルアナログ変換器(DAC)802とアナログデジタル変換器(ADC)804とを含み得る。スピーカー836、マイクロフォン838、または両方がコーデック834に結合され得る。コーデック834は、マイクロフォン838からアナログ信号を受信し、アナログデジタル変換器804を使用してそのアナログ信号をデジタル信号に変換し、スピーチおよび音楽コーデック808にそのデジタル信号を与え得る。スピーチおよび音楽コーデック808はデジタル信号を処理し得る。いくつかの実装形態では、スピーチおよび音楽コーデック808は、コーデック834にデジタル信号を与え得る。コーデック834は、デジタルアナログ変換器802を使用してデジタル信号をアナログ信号に変換し得、そのアナログ信号をスピーカー836に与え得る。
【0334】
[0118]デバイス800は、トランシーバ850(たとえば、送信機、受信機、またはそれらの組合せ)を介してアンテナ842に結合されたワイヤレスコントローラ840を含み得る。デバイス800は、コンピュータ可読記憶デバイスなどのメモリ832を含み得る。メモリ832は、
図6〜
図7の方法のうちの1つまたは複数を実行するための、プロセッサ806、プロセッサ810、またはそれらの組合せによって実行可能である1つまたは複数の命令などの命令860を含み得る。
【0335】
[0119]例示的な例として、メモリ832は、プロセッサ806、プロセッサ810、またはそれらの組合せによって実行されたとき、プロセッサ806、プロセッサ810、またはそれらの組合せに、飽和状態である複数のサブフレームのうちのサブフレームの数を決定することを含む動作を実行させる命令を記憶し得る。複数のサブフレームは、ハイバンドオーディオ信号のフレーム中に含まれ得る。動作はさらに、飽和状態であるサブフレームの数に基づいて、フレームに対応する利得フレームパラメータを決定することを含み得る。
【0336】
[0120]いくつかの実装形態では、メモリ832は、プロセッサ806、プロセッサ810、またはそれらの組合せに、
図1のエンコーダ104もしくは
図2のエンコーダ204を参照しながら説明された機能を実行させるための、方法
図6〜
図7のうちの1つもしくは複数の少なくとも一部分を実行させるための、またはそれらの組合せを実行させるための、プロセッサ806、プロセッサ810、またはそれらの組合せによって実行され得るコード(たとえば、解釈されたか、またはコンパイルされたプログラム命令)を含み得る。さらに例示すると、例1は、コンパイルされ、メモリ832に記憶され得る例示的な擬似コード(たとえば、浮動小数点での簡略化されたCコード)を示す。擬似コードは、
図1〜
図7に関して説明された態様の可能な実装形態を示す。擬似コードは、実行可能コードの一部ではないコメントを含む。擬似コードでは、コメントの開始が、フォワードスラッシュおよびアスタリスク(たとえば、「/*」)によって示され、コメントの終了が、アスタリスクおよびフォワードスラッシュ(たとえば、「*/」)によって示される。例示すると、コメント「COMMENT」は、擬似コードでは「/*COMMENT*/」と表示され得る。
【0337】
[0121]提供された例では、「=」演算子は、「A=B」が、Aの値がBの値に等しいときにTRUEの値を有し、そうでないときにFALSEの値を有するような、等値比較を示す。「&&」演算子は、論理AND演算を示す。「||」演算子は、論理OR演算を示す。「>」(超)演算子は「超」を表し、「≧」演算子は「以上」を表し、「<」演算子は「未満」を示す。数字の後の記号fは、浮動小数点(たとえば、10進数)の数のフォーマットを示す。
【0338】
[0122]提供された例では、「*」は乗算演算を表すことができ、「+」または「sum」は加算演算を表すことができ、「−」は減算演算を示すことができ、「/」は除算演算を表すことができる。「=」演算子は割当てを表す(たとえば、「a=1」は、変数「a」に1の値を割り当てる)。他の実装形態は、例1の条件のセットの追加または代替として1つまたは複数の条件を含み得る。
【0340】
[0123]メモリ832は、
図6〜
図7の方法のうちの1つまたは複数など、本明細書で開示される方法とプロセスとを実行するための、プロセッサ806、プロセッサ810、コーデック834、デバイス800の別の処理ユニット、またはそれらの組合せによって実行可能な命令860を含み得る。
図1のシステム100、
図2のシステム200、または
図3のシステム300の1つまたは複数の構成要素は、専用ハードウェア(たとえば、回路)を介して、1つもしくは複数のタスクを実行するための命令(たとえば、命令860)を実行するプロセッサによって、またはそれらの組合せで実装され得る。一例として、メモリ832、またはプロセッサ806、プロセッサ810、コーデック834もしくはそれらの組合せの1つもしくは複数の構成要素は、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、電気的消去可能プログラマブル読出し専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読出し専用メモリ(CD−ROM)などのメモリデバイスであり得る。メモリデバイスは、コンピュータ(たとえば、コーデック834内のプロセッサ、プロセッサ806、プロセッサ810またはそれらの組合せ)によって実行されたとき、コンピュータに
図6〜
図7の方法のうちの1つまたは複数の方法の少なくとも一部分を実行させ得る命令(たとえば命令860)を含み得る。一例として、メモリ832またはプロセッサ806、プロセッサ810、コーデック834の1つもしくは複数の構成要素は、コンピュータ(たとえば、コーデック834中のプロセッサ、プロセッサ806、プロセッサ810またはそれらの組合せ)によって実行されたとき、コンピュータに方法
図6〜
図7のうちの1つまたは複数の方法の少なくとも一部分を実行させる命令(たとえば、命令860)を含む非一時的コンピュータ可読媒体であり得る。
【0341】
[0124]特定の実装形態では、デバイス800は、システムインパッケージまたはシステムオンチップデバイス822中に含まれ得る。いくつかの実装形態では、メモリ832、プロセッサ806、プロセッサ810、ディスプレイコントローラ826、コーデック834、ワイヤレスコントローラ840、およびトランシーバ850は、システムインパッケージまたはシステムオンチップデバイス822中に含まれる。いくつかの実装形態では、入力デバイス830および電源844は、システムオンチップデバイス822に結合される。さらに、特定の実装形態では、
図8に示されるように、ディスプレイ828、入力デバイス830、スピーカー836、マイクロフォン838、アンテナ842、および電源844は、システムオンチップデバイス822の外部にある。他の実装形態では、ディスプレイ828、入力デバイス830、スピーカー836、マイクロフォン838、アンテナ842、および電源844の各々は、システムオンチップデバイス822のインターフェースまたはコントローラなどの、システムオンチップデバイス822の構成要素に結合され得る。例示的な例では、デバイス800は、通信デバイス、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、セットトップボックス、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、デジタルビデオディスク(DVD)プレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、エンコーダシステム、基地局、車両、またはそれらの任意の組合せに対応する。
【0342】
[0125]例示的な例では、プロセッサ810は、
図1〜
図7を参照しながら説明された方法または動作の全部または一部分を実行するように動作可能であり得る。たとえば、マイクロフォン838は、ユーザスピーチ信号に対応するオーディオ信号をキャプチャし得る。ADC804は、キャプチャされたオーディオ信号を、アナログ波形から、デジタルオーディオサンプルからなるデジタル波形に変換し得る。プロセッサ810は、デジタルオーディオサンプルを処理し得る。エコーキャンセラ812は、スピーカー836の出力がマイクロフォン838に入ることによって作成されていることがあるエコーを低減し得る。
【0343】
[0126]スピーチおよび音楽コーデック808のエンコーダ892(たとえば、ボコーダエンコーダ)は、処理されたスピーチ信号に対応するデジタルオーディオサンプルを圧縮し得、パケットのシーケンス(たとえば、デジタルオーディオサンプルの圧縮されたビットの表現)を形成し得る。パケットのシーケンスはメモリ832に記憶され得る。トランシーバ850は、シーケンスの各パケットを変調し得、アンテナ842を介して、その変調されたデータを送信し得る。
【0344】
[0127]さらなる例として、アンテナ842は、ネットワークを介して別のデバイスによって送られたパケットのシーケンスに対応する着信パケットを受信し得る。着信パケットは、オーディオフレーム(たとえば、符号化されたオーディオフレーム)を含み得る。デコーダは、(たとえば、合成オーディオ信号に対応する)再構成されたオーディオサンプルを生成するために、受信パケットを復元し、復号し得る。エコーキャンセラ812は、再構成されたオーディオサンプルからエコーを除去し得る。DAC802は、デコーダの出力をデジタル波形からアナログ波形に変換し得、その変換された波形を出力のためにスピーカー836に与え得る。
【0345】
[0128]
図9を参照すると、基地局900の特定の例示的な例のブロック図が示されている。様々な実装形態では、基地局900は、
図9に示されたよりも多い構成要素または少ない構成要素を有する場合がある。例示的な例では、基地局900は、
図1のデバイス102を含み得る。例示的な例では、基地局900は、
図5〜
図6の方法のうちの1つもしくは複数、例1〜例5のうちの1つもしくは複数、またはそれらの組合せに従って動作し得る。
【0346】
[0129]基地局900は、ワイヤレス通信システムの一部であり得る。ワイヤレス通信システムは、複数の基地局と複数のワイヤレス通信デバイスとを含み得る。ワイヤレス通信システムは、ロングタームエボリューション(LTE(登録商標))システム、符号分割多元接続(CDMA)システム、モバイル通信用グローバルシステム(GSM(登録商標):Global System for Mobile Communications)システム、ワイヤレスローカルエリアネットワーク(WLAN)システム、または何らかの他のワイヤレスシステムであり得る。CDMAシステムは、広帯域CDMA(WCDMA(登録商標))、CDMA 1X、エボリューションデータオプティマイズド(EVDO:Evolution-Data Optimized)、時分割同期CDMA(TD−SCDMA:Time Division Synchronous CDMA)、またはCDMAの何らかの他のバージョンを実装し得る。
【0347】
[0130]ワイヤレスデバイスは、ユーザ機器(UE)、移動局、端末、アクセス端末、加入者ユニット、局などと呼ばれることもある。ワイヤレスデバイスは、セルラーフォン、スマートフォン、タブレット、ワイヤレスモデム、携帯情報端末(PDA)、ハンドヘルドデバイス、ラップトップコンピュータ、スマートブック、ネットブック、タブレット、コードレスフォン、ワイヤレスローカルループ(WLL)局、Bluetooth(登録商標)デバイスなどを含み得る。ワイヤレスデバイスは、
図8のデバイス800を含むこと、またはこれに対応することができる。
【0348】
[0131]様々な機能は、メッセージとデータ(たとえば、オーディオデータ)とを送り、受信することなど、基地局900の1つまたは複数の構成要素によって(および/あるいは図示されていない他の構成要素において)実行され得る。特定の例では、基地局900はプロセッサ906(たとえば、CPU)を含む。基地局900はトランスコーダ910を含み得る。トランスコーダ910はスピーチおよび音楽908を含み得る。たとえば、トランスコーダ910は、スピーチおよび音楽コーデック908の動作を実行するように構成された1つまたは複数の構成要素(たとえば、回路)を含み得る。別の例として、トランスコーダ910は、スピーチおよび音楽コーデック908の動作を実行するための1つまたは複数のコンピュータ可読命令を実行するように構成され得る。スピーチおよび音楽コーデック908はトランスコーダ910の構成要素として示されているが、他の例では、スピーチおよび音楽コーデック908の1つまたは複数の構成要素が、プロセッサ906、別の処理構成要素、またはそれらの組合せの中に含まれ得る。たとえば、デコーダ938(たとえば、ボコーダデコーダ)は、受信機データプロセッサ964中に含まれ得る。別の例として、エンコーダ936(たとえば、ボコーダエンコーダ)は、送信データプロセッサ966中に含まれ得る。
【0349】
[0132]トランスコーダ910は、2つ以上のネットワークの間のメッセージとデータとをトランスコードするように機能し得る。トランスコーダ910は、メッセージとオーディオデータとを第1のフォーマット(たとえば、デジタルフォーマット)から第2のフォーマットに変換するように構成され得る。例示すると、デコーダ938は、第1のフォーマットを有する符号化された信号を復号することができ、エンコーダ936は、復号された信号を、第2のフォーマットを有する符号化された信号に符号化することができる。追加または代替として、トランスコーダ910は、データレート適応を実行するように構成され得る。たとえば、トランスコーダ910は、フォーマットオーディオデータを変更することなく、データレートをダウンコンバートすること、またはデータレートをアップコンバートすることができる。例示すると、トランスコーダ910は、64kbit/s信号を16kbit/s信号にダウンコンバートすることができる。
【0350】
[0133]スピーチおよび音楽コーデック908は、エンコーダ936とデコーダ938とを含み得る。エンコーダ936は、
図8を参照しながら説明されたように、利得形状回路と利得フレーム回路とを含み得る。デコーダ938は、利得形状回路と利得フレーム回路とを含み得る。
【0351】
[0134]基地局900はメモリ932を含み得る。コンピュータ可読記憶デバイスなどのメモリ932は、命令を含み得る。命令は、
図5〜
図6の方法、例1〜例5のうちの1つもしくは複数、またはそれらの組合せを実行するための、プロセッサ906、トランスコーダ910、またはそれらの組合せによって実行可能である1つまたは複数の命令を含み得る。基地局900は、アンテナのアレイに結合された、第1のトランシーバ952および第2のトランシーバ954など、複数の送信機および受信機(たとえば、トランシーバ)を含み得る。アンテナのアレイは、第1のアンテナ942と第2のアンテナ944とを含み得る。アンテナのアレイは、
図8のデバイス800など、1つまたは複数のワイヤレスデバイスとワイヤレス通信するように構成され得る。たとえば、第2のアンテナ944は、ワイヤレスデバイスからデータストリーム914(たとえば、ビットストリーム)を受信することができる。データストリーム914は、メッセージ、データ(たとえば、符号化されたスピーチデータ)、またはそれらの組合せを含み得る。
【0352】
[0135]基地局900は、バックホール接続などのネットワーク接続960を含み得る。ネットワーク接続960は、コアネットワークまたはワイヤレス通信ネットワークの1つもしくは複数の基地局と通信するように構成され得る。たとえば、基地局900は、ネットワーク接続960を介してコアネットワークから第2のデータストリーム(たとえば、メッセージまたはオーディオデータ)を受信することができる。基地局900は、メッセージまたはオーディオデータを生成するために第2のデータストリームを処理し、アンテナのアレイのうちの1つもしくは複数のアンテナを介して1つもしくは複数のワイヤレスデバイスに、またはネットワーク接続960を介して別の基地局にメッセージまたはオーディオデータを提供することができる。特定の実装形態では、ネットワーク接続960は、例示的な非限定的な例として、ワイドエリアネットワーク(WAN)接続であり得る。
【0353】
[0136]基地局900は、トランシーバ952、954と、受信機データプロセッサ964と、プロセッサ906とに結合された復調器962を含むことができ、受信機データプロセッサ964は、プロセッサ906に結合され得る。復調器962は、トランシーバ952、954から受信された変調信号を復調するように、また受信機データプロセッサ964に復調データを提供するように構成され得る。受信機データプロセッサ964は、復調データからメッセージまたはオーディオデータを抽出し、プロセッサ906にメッセージまたはオーディオデータを送るように構成され得る。
【0354】
[0137]基地局900は、送信データプロセッサ966と送信多入力多出力(MIMO)プロセッサ968とを含み得る。送信データプロセッサ966は、プロセッサ906と送信MIMOプロセッサ968とに結合され得る。送信MIMOプロセッサ968は、トランシーバ952、954とプロセッサ906とに結合され得る。送信データプロセッサ966は、プロセッサ906からメッセージまたはオーディオデータを受信するように、また例示的な非限定的な例として、CDMAまたは直交周波数分割多重(OFDM)などのコーディング方式に基づいてメッセージまたはオーディオデータをコーディングするように構成され得る。送信データプロセッサ966は、コーディングされたデータを送信MIMOプロセッサ968に提供することができる。
【0355】
[0138]コーディングされたデータは、多重化データを生成するために、CDMAまたはOFDM技法を使用して、パイロットデータなどの他のデータと多重化され得る。多重化データは、次いで、変調シンボルを生成するために特定の変調方式(たとえば、2位相シフトキーイング(「BPSK」)、4位相シフトキーイング(「QSPK」)、多値位相シフトキーイング(「M−PSK」)、多値直交振幅変調(「M−QAM:M-ary Quadrature amplitude modulation」)など)に基づいて送信データプロセッサ966によって変調され(すなわち、シンボルマッピングされ)得る。特定の実装形態では、コーディングされたデータおよび他のデータは、異なる変調方式を使用して変調され得る。各データストリームに関するデータレート、コーディング、および変調は、プロセッサ906によって実行される命令によって決定され得る。
【0356】
[0139]送信MIMOプロセッサ968は、送信データプロセッサ966から変調シンボルを受信するように構成され得、さらに、変調シンボルを処理することができ、データに対してビームフォーミングを実行することができる。たとえば、送信MIMOプロセッサ968は、変調シンボルにビームフォーミング重みを適用することができる。ビームフォーミング重みは、変調シンボルが送信されるアンテナのアレイのうちの1つまたは複数のアンテナに対応し得る。
【0357】
[0140]動作中、基地局900の第2のアンテナ944は、データストリーム914を受信することができる。第2のトランシーバ954は、第2のアンテナ944からデータストリーム914を受信することができ、復調器962にデータストリーム914を提供することができる。復調器962は、データストリーム914の変調信号を復調し、受信機データプロセッサ964に復調データを提供することができる。受信機データプロセッサ964は、復調データからオーディオデータを抽出し、抽出されたオーディオデータをプロセッサ906に提供することができる。
【0358】
[0141]プロセッサ906はオーディオデータを、トランスコーディングのためにトランスコーダ910に提供することができる。トランスコーダ910のデコーダ938は、第1のフォーマットからのオーディオデータを復号されたオーディオデータに復号することができ、エンコーダ936は、復号されたオーディオデータを第2のフォーマットに符号化することができる。いくつかの実装形態では、エンコーダ936はオーディオデータを、ワイヤレスデバイスから受信された場合よりも高いデータレート(たとえば、アップコンバート)または低いデータレート(たとえば、ダウンコンバート)を使用して符号化することができる。他の実装形態では、オーディオデータはトランスコーディングされないことがある。トランスコーディング(たとえば、復号および符号化)はトランスコーダ910によって実行されるものとして示されているが、トランスコーディング動作(たとえば、復号および符号化)は基地局900の複数の構成要素によって実行されてよい。たとえば、復号は受信機データプロセッサ964によって実行され得、符号化は送信データプロセッサ966によって実行され得る。
【0359】
[0142]デコーダ938およびエンコーダ936は、フレームごとに、フレームに対応する利得形状パラメータ、フレームに対応する利得フレームパラメータ、または両方を決定することができる。利得形状パラメータ、利得フレームパラメータ、または両方は、合成ハイバンド信号を生成するために使用され得る。トランスコーディングされたデータなど、エンコーダ936において生成された符号化されたオーディオデータは、プロセッサ906を介して送信データプロセッサ966またはネットワーク接続960に提供され得る。
【0360】
[0143]トランスコーダ810からのトランスコーディングされたオーディオデータは、変調シンボルを生成するために、OFDMなどの変調方式に従ってコーディングするために送信データプロセッサ966に提供され得る。送信データプロセッサ966は変調シンボルを、さらなる処理およびビームフォーミングのために送信MIMOプロセッサ968に提供することができる。送信MIMOプロセッサ968は、ビームフォーミング重みを適用することができ、第1のトランシーバ952を介して第1アンテナ942などのアンテナのアレイのうちの1つまたは複数のアンテナに変調シンボルを提供することができる。したがって、基地局900は、ワイヤレスデバイスから受信されたデータストリーム914に対応するトランスコーディングされたデータストリーム916を、別のワイヤレスデバイスに提供することができる。トランスコーディングされたデータストリーム916は、データストリーム914とは異なる符号化フォーマット、データレートまたは両方を有し得る。他の実装形態では、トランスコーディングされたデータストリーム916は、別の基地局またはコアネットワークへの送信のためにネットワーク接続960に提供され得る。
【0361】
[0144]したがって、基地局900は、プロセッサ(たとえば、プロセッサ906またはトランスコーダ910)によって実行されたとき、プロセッサに、飽和状態である複数のサブフレームのうちのサブフレームの数を決定することを含む動作を実行させる命令を記憶するコンピュータ可読記憶デバイス(たとえば、メモリ932)を含み得る。複数のサブフレームは、ハイバンドオーディオ信号のフレーム中に含まれ得る。動作はさらに、飽和状態であるサブフレームの数に基づいて、フレームに対応する利得フレームパラメータを決定することを含み得る。
【0362】
[0145]説明された態様とともに、装置が、フレームを含むハイバンドオーディオ信号を受信するための手段を含むことができ、フレームが複数のサブフレームを含む。たとえば、ハイバンドオーディオ信号を受信するための手段は、
図1のエンコーダ104、フィルタバンク120、合成器122、利得パラメータ回路、スケーリング回路124、パラメータ決定回路126、
図2のエンコーダ204、利得形状回路230、利得フレーム回路236、
図3のLP分析および量子化回路312、
図8のアンテナ842、トランシーバ850、ワイヤレスコントローラ840、スピーチおよび音楽コーデック808、エンコーダ892、利得形状回路894、利得フレーム回路895、コーデック834、マイクロフォン838、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、ハイバンドオーディオ信号を受信するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0363】
[0146]本装置はまた、飽和状態である複数のサブフレームのうちのサブフレームの数を決定するための手段を含み得る。たとえば、サブフレームの数を決定するための手段は、
図1のエンコーダ104、利得パラメータ回路102、スケーリング回路124、パラメータ決定回路126、
図2のエンコーダ204、利得形状回路230、利得フレーム回路236、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、カウンタ、
図9のプロセッサ906もしくはトランスコーダ910、サブフレームの数を決定するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0364】
[0147]本装置はまた、フレームに対応する利得フレームパラメータを決定するための手段を含み得る。利得フレームパラメータは、飽和状態であるサブフレームの数に基づいて決定され得る。たとえば、利得フレームパラメータを決定するための手段は、
図1のエンコーダ104、利得パラメータ回路102、パラメータ決定回路126、
図2のエンコーダ204、利得形状回路230、利得フレーム回路236、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、第2の復号されたスピーチを出力するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0365】
[0148]本装置はまた、ハイバンドオーディオ信号に基づいて合成信号を生成するための手段を含み得る。たとえば、合成信号を生成するための手段は、
図1のエンコーダ104、合成器122、
図2のエンコーダ204、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、合成信号を生成するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0366】
[0149]本装置はまた、スケーリングされたハイバンドオーディオ信号を生成するためにハイバンドオーディオ信号を反復的にスケーリングするための手段を含み得る。たとえば、ハイバンドオーディオ信号を反復的にスケーリングするための手段は、
図1のエンコーダ104、利得パラメータ回路102、パラメータ決定回路126、
図2のエンコーダ204、利得形状回路230、利得フレーム回路236、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、ハイバンドオーディオ信号を反復的にスケーリングするための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0367】
[0150]本装置はまた、第1のスケーリングされた合成信号を生成するための手段を含み得る。たとえば、第1のスケーリングされた合成信号を生成するための手段は、
図1のエンコーダ104、利得パラメータ回路102、パラメータ決定回路126、
図2のエンコーダ204、利得フレーム回路236、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、スケーリングされた合成信号を生成するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0368】
[0151]本装置はまた、第1のスケーリングされた合成信号に基づいて利得形状パラメータを決定するための手段を含み得る。たとえば、第1のスケーリングされた合成信号に基づいて利得形状パラメータを決定するための手段は、
図1のエンコーダ104、利得パラメータ回路102、パラメータ決定回路126、
図2のエンコーダ204、利得形状回路230、利得フレーム回路236、
図8のスピーチおよび音楽コーデック808、コーデック834、エンコーダ892、命令860を実行するようにプログラムされたプロセッサ810、806の一方もしくは両方、
図9のプロセッサ906もしくはトランスコーダ910、スケーリングされた合成信号に基づいて利得形状パラメータを決定するための1つもしくは複数の他の構造、デバイス、回路、モジュール、もしくは命令、またはそれらの組合せを含むこと、あるいはこれらに対応することができる。
【0369】
[0152]いくつかの実装形態では、受信するための手段はフィルタバンクを備え、サブフレームの数を決定するための手段は利得形状回路を備え、利得フレームを決定するための手段は利得フレーム回路を備える。
【0370】
[0153]いくつかの実装形態では、ハイバンドオーディオ信号を受信するための手段、サブフレームの数を決定するための手段、および利得フレームパラメータを決定するための手段はそれぞれ、プロセッサと、プロセッサによって実行可能である命令を記憶するメモリとを備える。追加または代替として、ハイバンドオーディオ信号を受信するための手段、サブフレームの数を決定するための手段、および利得フレームパラメータを決定するための手段は、エンコーダ、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、娯楽ユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、コンピュータ、またはそれらの組合せの中に一体化される。
【0371】
[0154]上述の説明の態様では、実行される様々な機能は、
図1のシステム100、
図2のシステム200、
図3のシステム300、
図8のデバイス800、
図9の基地局900またはそれらの組合せの回路または構成要素など、ある回路または構成要素によって実行されるものとして説明されている。しかし、この回路および構成要素という区分は、説明のためにすぎない。代替例では、特定の回路または構成要素によって実行される機能は、代わりに、複数の回路または構成要素の間で分割され得る。その上、他の代替例では、
図1〜
図3の2つ以上の回路または構成要素が単一の回路または構成要素に統合され得る。
図1〜
図3、
図8および
図9に示された各回路または構成要素は、ハードウェア(たとえば、ASIC、DSP、コントローラ、FPGAデバイスなど)、ソフトウェア(たとえば、プロセッサによって実行可能な論理、モジュール、命令など)、またはそれらの任意の組合せを使用して実装され得る。
【0372】
[0155]さらに、本明細書で開示された態様に関して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、プロセッサによって実行されるコンピュータソフトウェア、または両方の組合せとして実装され得ることを、当業者は理解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップについて、上記では概してそれらの機能性に関して説明された。そのような機能性がハードウェアとして実装されるか、プロセッサ実行可能命令として実装されるかは、特定の適用例および全体的なシステムに課された設計制約に依存する。当業者は、説明された機能を、特定の適用例ごとに様々な方法で実装することができ、そのような実装の決定は、本開示の範囲からの逸脱を引き起こすと解釈されるべきではない。
【0373】
[0156]本明細書で開示された態様に関して説明された方法またはアルゴリズムのステップは、ハードウェア中に直接的に含まれ、プロセッサによって実行されるソフトウェアモジュール中に含まれ、またはその2つの組合せであり得る。ソフトウェアモジュールは、RAM、フラッシュメモリ、ROM、PROM、EPROM、EEPROM、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、または当技術分野で知られている任意の他の形態の非一時的記憶媒体中に存在し得る。特定の記憶媒体は、プロセッサがその記憶媒体から情報を読み取り、その記憶媒体に情報を書き込むことができるようにプロセッサに結合され得る。代替的に、記憶媒体はプロセッサと一体化され得る。プロセッサおよび記憶媒体は、ASIC中に存在し得る。ASICはコンピューティングデバイスまたはユーザ端末中に存在し得る。代替的に、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別の構成要素として存在し得る。
【0374】
[0157]上記の説明は、開示された態様を当業者が製作または使用することを可能にするために与えられる。これらの態様への様々な修正は当業者には容易に明らかになり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の態様に適用され得る。したがって、本開示は、本明細書に示された態様に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴と一致する、可能な最も広い範囲を与えられるべきである。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
飽和状態である複数のサブフレームのうちのサブフレームの数を決定するように構成された利得形状回路と、前記複数のサブフレームがハイバンドオーディオ信号のフレーム中に含まれる、
飽和状態であるサブフレームの前記数に基づいて、前記フレームに対応する利得フレームパラメータを決定するように構成された利得フレーム回路と
を備えるデバイス。
[C2]
前記ハイバンドオーディオ信号に基づいて合成ハイバンドオーディオ信号を生成するように構成された合成器
をさらに備え、
前記利得形状回路は、前記ハイバンドオーディオ信号と前記合成ハイバンドオーディオ信号とに関連付けられる第1の比に基づいて利得形状パラメータを決定するようにさらに構成され、
前記利得フレーム回路は、前記ハイバンドオーディオ信号と前記合成ハイバンドオーディオ信号とに関連付けられる第2の比に基づいて前記利得フレームパラメータを決定するようにさらに構成される、C1に記載のデバイス。
[C3]
合成ハイバンドオーディオ信号に基づいて、また利得形状パラメータに基づいて、補償済み合成ハイバンドオーディオ信号を生成するように構成された利得形状補償器をさらに備え、前記利得フレーム回路が、前記補償済み合成ハイバンドオーディオ信号にさらに基づいて前記利得フレームパラメータを生成するように構成される、C1に記載のデバイス。
[C4]
入力オーディオ信号を受信するように構成されたエンコーダと、
前記入力オーディオ信号に基づいて前記ハイバンドオーディオ信号を生成するように構成されたフィルタと
をさらに備える、C1に記載のデバイス。
[C5]
前記利得形状回路、前記利得フレーム回路、または両方は、前記ハイバンドオーディオ信号に基づいて、スケーリングされたハイバンドオーディオ信号を生成するようにさらに構成される、C1に記載のデバイス。
[C6]
前記利得フレーム回路は、スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号を反復的にスケーリングするようにさらに構成される、C1に記載のデバイス。
[C7]
スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号を反復的にスケーリングするように構成されたスケーリング回路をさらに備える、C1に記載のデバイス。
[C8]
エンコーダをさらに備え、前記利得形状回路、前記利得フレーム回路、および前記エンコーダがモバイル通信デバイスまたは基地局の中に一体化される、C1に記載のデバイス。
[C9]
前記フレームを含む前記ハイバンドオーディオ信号を受信するように構成された受信機と、
前記受信機に結合された復調器と、前記復調器が、前記ハイバンドオーディオ信号を復調するように構成される、
前記復調器に結合されたプロセッサと、
デコーダと
をさらに備える、C1に記載のデバイス。
[C10]
前記受信機、前記復調器、前記プロセッサ、および前記デコーダは、モバイル通信デバイスの中に一体化される、C9に記載のデバイス。
[C11]
前記受信機、前記復調器、前記プロセッサ、および前記デコーダは、基地局の中に一体化される、C9に記載のデバイス。
[C12]
エンコーダを動作させる方法であって、
前記エンコーダにおいて、フレームを含むハイバンドオーディオ信号を受信することと、前記フレームが複数のサブフレームを含む、
飽和状態である前記複数のサブフレームのうちのサブフレームの数を決定することと、
飽和状態であるサブフレームの前記数に基づいて、前記フレームに対応する利得フレームパラメータを決定することと
を備える方法。
[C13]
前記複数のサブフレームのうちの特定のサブフレームが飽和状態であると決定することは、前記エンコーダにおいて、前記特定のサブフレームに関連するエネルギー値を表すために必要とされるビットの数が前記エンコーダの固定小数点幅を上回ると決定することを備える、C12に記載の方法。
[C14]
前記利得フレームパラメータを決定する前に、
前記ハイバンドオーディオ信号に基づいて前記フレームの特定のエネルギー値を決定することと、
前記特定のエネルギー値を表すために必要とされるビットの数に基づいて、前記特定のエネルギー値が飽和状態であるかどうかを決定することと
をさらに備える、C12に記載の方法。
[C15]
前記特定のエネルギー値を表すために必要とされるビットの前記数が、前記特定のエネルギー値を記憶するために利用可能な前記エンコーダのビットの総数よりも大きいときに、前記特定のエネルギー値は飽和状態である、C14に記載の方法。
[C16]
前記特定のエネルギー値が飽和状態であると決定したことに応答して、
飽和状態であるサブフレームの前記数に基づいてスケーリング係数を決定することと、
スケーリングされたハイバンドオーディオ信号を生成するために、前記スケーリング係数に基づいて前記ハイバンドオーディオ信号をスケーリングすることと、
前記スケーリングされたハイバンドオーディオ信号に基づいて前記フレームの第2のエネルギー値を決定することと
をさらに備える、C14に記載の方法。
[C17]
前記利得フレームパラメータを決定することは、
合成ハイバンドオーディオ信号に基づいて前記フレームの第3のエネルギー値を決定することと、
前記第2のエネルギー値と前記第3のエネルギー値との比に基づいて特定の値を決定することと、
前記利得フレームパラメータを生成するために前記スケーリング係数によって前記特定の値を乗算することと
を備える、C16に記載の方法。
[C18]
前記利得フレームパラメータは、前記ハイバンドオーディオ信号と合成ハイバンドオーディオ信号とに基づく比に関連付けられ、前記ハイバンドオーディオ信号は、ハイバンドスピーチ信号を備える、C12に記載の方法。
[C19]
スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号をスケーリングすることと、
前記スケーリングされたハイバンドオーディオ信号に基づいて利得形状パラメータを決定することと
をさらに備える、C12に記載の方法。
[C20]
前記フレームに対応する利得形状パラメータを決定することをさらに備え、前記利得形状パラメータが、前記複数のサブフレームの各サブフレームに関する推定利得形状値を含むベクトルを備える、C12に記載の方法。
[C21]
前記複数のサブフレームの各サブフレームに関して、前記推定利得形状値は、前記ハイバンドオーディオ信号と合成ハイバンドオーディオ信号とに基づく比に関連付けられる、C20に記載の方法。
[C22]
前記複数のサブフレームの各サブフレームに関して、
前記ハイバンドオーディオ信号に基づいて前記サブフレームの第1のエネルギー値を決定することと、
前記サブフレームの前記第1のエネルギー値が飽和状態であるかどうかを決定することと
をさらに備える、C20に記載の方法。
[C23]
非飽和状態であると決定された前記複数のサブフレームの各サブフレームに関して、前記第1のエネルギー値と合成ハイバンドオーディオ信号の対応するサブフレームの第2のエネルギー値との比に基づいて、前記サブフレームの前記推定利得形状値を決定することをさらに備える、C22に記載の方法。
[C24]
飽和状態であると決定された前記複数のサブフレームの各サブフレームに関して、
スケーリング係数によって、前記サブフレームに対応する前記ハイバンドオーディオ信号の一部分をスケーリングすることと、
前記ハイバンドオーディオ信号の前記スケーリングされた部分に基づいて、前記サブフレームの第2のエネルギー値を決定することと、
合成ハイバンドオーディオ信号の対応するサブフレームの第3のエネルギー値を決定することと、
前記第2のエネルギー値と前記第3のエネルギー値との比に基づいて特定の値を決定することと、
前記サブフレームに関する前記推定利得形状値を生成するために、前記スケーリング係数によって前記特定の値を乗算することと
をさらに備える、C22に記載の方法。
[C25]
メモリから前記スケーリング係数を受信することをさらに備え、前記スケーリング係数が係数2に対応する、C24に記載の方法。
[C26]
前記利得形状パラメータを量子化することと、
前記ハイバンドオーディオ信号に基づいて合成ハイバンドオーディオ信号を生成することと、
前記量子化された利得形状パラメータおよび前記合成ハイバンドオーディオ信号に基づいて利得形状補償済み信号を生成することと
をさらに備える、C20に記載の方法。
[C27]
前記利得フレームパラメータは、前記利得形状補償済み信号および前記ハイバンドオーディオ信号のスケーリングされたバージョンに基づいて決定され、前記ハイバンドオーディオ信号の前記スケーリングされたバージョンが、前記ハイバンドオーディオ信号に基づいて、また飽和状態であるサブフレームの前記数に基づいて生成される、C26に記載の方法。
[C28]
飽和状態であるサブフレームの前記数に基づいて前記ハイバンドオーディオ信号をスケーリングするかどうかを決定することをさらに備える、C12に記載の方法。
[C29]
前記ハイバンドオーディオ信号における飽和状態であるサブフレームの前記数がゼロよりも大きいとの決定に応答して、前記ハイバンドオーディオ信号をスケーリングすることをさらに備える、C28に記載の方法。
[C30]
飽和状態であるサブフレームの前記数に基づいてスケーリング係数を決定することと、
スケーリングされたハイバンドオーディオ信号を生成するために、前記スケーリング係数に基づいて前記ハイバンドオーディオ信号をスケーリングすることと
をさらに備える、C12に記載の方法。
[C31]
前記エンコーダは、モバイル通信デバイスまたは基地局を備えるデバイス中に含まれる、C12に記載の方法。
[C32]
フレームを含むハイバンドオーディオ信号を受信するための手段と、前記フレームが複数のサブフレームを含む、
飽和状態である前記複数のサブフレームのうちのサブフレームの数を決定するための手段と、
飽和状態であるサブフレームの前記数に基づいて、前記フレームに対応する利得フレームパラメータを決定するための手段と
を備える装置。
[C33]
前記ハイバンドオーディオ信号に基づいて合成信号を生成するための手段と、
前記合成信号に基づいて第1のスケーリングされた合成信号を生成するための手段と、
前記第1のスケーリングされた合成信号に基づいて利得形状パラメータを決定するための手段と
をさらに備える、C32に記載の装置。
[C34]
受信するための前記手段はフィルタバンクを備え、サブフレームの前記数を決定するための前記手段は利得形状回路を備え、前記利得フレームパラメータを決定するための前記手段は利得フレーム回路を備える、C32に記載の装置。
[C35]
スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号を反復的にスケーリングするための手段をさらに備え、前記利得フレームパラメータが前記スケーリングされたハイバンドオーディオ信号にさらに基づく、C32に記載の装置。
[C36]
前記ハイバンドオーディオ信号を受信するための前記手段、サブフレームの前記数を決定するための前記手段、および前記利得フレームパラメータを決定するための前記手段は、エンコーダ、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、娯楽ユニット、ナビゲーションデバイス、モバイル通信デバイス、携帯情報端末(PDA)、またはコンピュータのうちの少なくとも1つの中に一体化される、C32に記載の装置。
[C37]
前記ハイバンドオーディオ信号を受信するための前記手段、サブフレームの前記数を決定するための前記手段、および前記利得フレームパラメータを決定するための前記手段は、基地局の中に一体化される、C32に記載の装置。
[C38]
プロセッサによって実行されたとき、前記プロセッサに、
飽和状態である複数のサブフレームのうちのサブフレームの数を決定することと、前記複数のサブフレームがハイバンドオーディオ信号のフレーム中に含まれる、
飽和状態であるサブフレームの前記数に基づいて、前記フレームに対応する利得フレームパラメータを決定することと
を備える動作を実行させる命令を記憶するコンピュータ可読記憶デバイス。
[C39]
前記ハイバンドオーディオ信号はハイバンドスピーチ信号を備え、前記複数のサブフレームは4つのサブフレームを備える、C38に記載のコンピュータ可読記憶デバイス。
[C40]
前記動作は、
前記ハイバンドオーディオ信号に基づいて合成信号を生成することと、
前記合成信号に基づいて第1のスケーリングされた合成信号を生成することと、
前記第1のスケーリングされた合成信号に基づいて利得形状パラメータを決定することと
をさらに備える、C38に記載のコンピュータ可読記憶デバイス。
[C41]
エンコーダを動作させる方法であって、
エンコーダにおいて、ハイバンドオーディオ信号を受信することと、
スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号をスケーリングすることと、
前記スケーリングされたハイバンドオーディオ信号に基づいて利得パラメータを決定することと
を備える方法。
[C42]
前記利得パラメータは、利得形状パラメータ、利得フレームパラメータ、または両方を備える、C41に記載の方法。
[C43]
前記ハイバンドオーディオ信号はフレームを含み、前記フレームが複数のサブフレームを含み、前記ハイバンドオーディオ信号は、前記スケーリングされたハイバンドオーディオ信号を生成するために、記憶された値を使用してスケーリングされる、C41に記載の方法。
[C44]
前記ハイバンドオーディオ信号をスケーリングすることは、前記フレームの飽和状態のサブフレームの数に基づいてスケーリング係数を決定することを備え、前記ハイバンドオーディオ信号は、前記スケーリング係数を使用してスケーリングされる、C43に記載の方法。
[C45]
前記ハイバンドオーディオ信号をスケーリングすることは、前記スケーリングされたハイバンドオーディオ信号を生成するために前記ハイバンドオーディオ信号を反復的にスケーリングすることを備える、C41に記載の方法。
[C46]
前記スケーリングされたハイバンドオーディオ信号は、前記ハイバンドオーディオ信号の第1のエネルギー値が飽和状態であると決定したことに応答して生成され、前記方法は、前記スケーリングされたハイバンドオーディオ信号が生成された後に、
前記スケーリングされたハイバンドオーディオ信号の第2のエネルギー値を決定することと、
前記第2のエネルギー値に基づいて、前記スケーリングされたハイバンドオーディオ信号が飽和状態であるかどうかを決定することと
をさらに備える、C41に記載の方法。
[C47]
前記エンコーダは、モバイル通信デバイスまたは基地局を備えるデバイス中に含まれる、C41に記載の方法。