(58)【調査した分野】(Int.Cl.,DB名)
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項1に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、または、
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされる、請求項3に記載の方法。
前記第1の利得条件は、平均LSP間隔が第6の閾値未満であることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、または、
前記第2の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号の前記フレームに先行する、請求項8に記載の方法。
前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、または、前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、または、
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することとを含む、または、
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項10に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、請求項11に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートに対応する、請求項12に記載の方法。
【発明を実施するための形態】
【0014】
[0019]
図1を参照すると、利得制御を行うように動作可能なシステムの特定の実施形態が示され、全体が100と表記されている。特定の実施形態では、システム100は符号化システムまたは装置(たとえばワイヤレス電話または符号化器/復号器(CODEC)に組み込むことができる。
【0015】
[0020]なお、以下の説明では、
図1のシステム100によって実行される様々な機能について、特定のコンポーネントまたはモジュールによって実行されるものとして説明する。しかし、このコンポーネントおよびモジュールという区分は、例示のためにすぎない。代替実施形態では、特定のコンポーネントまたはモジュールによって実行される機能を複数のコンポーネントまたはモジュールに分担させてよい。また、代替実施形態では、
図1の2つ以上のコンポーネントまたはモジュールを単一のコンポーネントまたはモジュールに統合してよい。
図1に示す各コンポーネントまたはモジュールは、ハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、コントローラなど)、ソフトウェア(たとえばプロセッサによって実行可能な命令)、またはこれらの任意の組合せを使用して実装可能である。
【0016】
[0021]システム100は、入力音声信号102を受信するように構成された解析フィルタバンク110を含む。たとえば、入力音声信号102はマイクロフォンまたは他の入力装置によって供給され得る。特定の実施形態では、入力音声信号102は発話を含み得る。入力音声信号は、約50ヘルツ(Hz)〜約16キロヘルツ(kHz)までの周波数範囲のデータを含む超広帯域(SWB)信号であってよい。解析フィルタバンク110は、周波数に基づいて入力音声信号102をフィルタリングして複数の部分に分割することができる。たとえば、解析フィルタバンク110は低帯域信号122と高帯域信号124とを生成し得る。低帯域信号122と高帯域信号124とは、等しい帯域幅または異なる帯域幅を有してよく、重なり合っていても重なり合っていなくてもよい。代替実施形態では、解析フィルタバンク110は3つ以上の出力を生成してよい。
【0017】
[0022]
図1の例では、低帯域信号122と高帯域信号124とは重なり合わない周波数帯域を占有する。たとえば、低帯域信号122と高帯域信号124とは、50Hz〜7kHzと7kHz〜16kHzの重なり合わない周波数帯域を占有してよい。代替態様では、低帯域信号122と高帯域信号124とは、50Hz〜8kHzと8kHz〜16kHzの重なり合わない周波数帯域を占有してよい。別の実施形態では、低帯域信号122と高帯域信号124とは重なり合ってよく(たとえば50Hz〜8kHzと7kHz〜16kHz)、これによって解析フィルタバンク110のローパスフィルタとハイパスフィルタとが平滑なロールオフを有し得るようにすることができ、それによってローパスフィルタとハイパスフィルタの設計を簡略化し、コストを削減することができる。低帯域信号122と高帯域信号124とを重なり合わせることによって、受信器において低帯域信号と高帯域信号との平滑な混合も可能にすることができ、その結果、可聴アーティファクトが少なくなる。
【0018】
[0023]なお、
図1の例はSWB信号の処理を示しているが、これは例示のために過ぎないことに留意されたい。代替実施形態では、入力音声信号102は、約50Hz〜約8kHzまでの周波数範囲を有する広帯域(WB)信号であってよい。そのような実施形態では、低帯域信号122は、約50Hz〜約6.4kHzの周波数範囲に対応し、高帯域信号124は約6.4kHz〜約8kHzまでの周波数範囲に対応し得る。なお、本明細書における様々なシステムおよび方法は、高帯域雑音を検出し、高帯域雑音に応答して様々な動作を行うものとして説明することにも留意されたいしかし、これは例示のために過ぎない。
図1〜
図6を参照しながら示す技術は、低帯域雑音の場合にも実行可能である。
【0019】
[0024]システム100は、低帯域信号122を受信するように構成された低帯域解析モジュール130を含み得る。特定の実施形態では、低帯域解析モジュール130は、符号励振線形予測(Code Excited Linear prediction(CELP))符号化器に相当し得る。低帯域解析モジュール130は、線形予測(LP)解析および符号化モジュール132と、線形予測係数(LPC)−線スペクトル対(LSP)変換モジュール134と、量子化器136とを含み得る。LSPは、線スペクトル周波数(LSF)とも呼ばれることがあり、本明細書ではこの2つの用語は交換可能に使用する場合がある。LP解析および符号化モジュール132は、低帯域信号122のスペクトル包絡線をLPCのセットとして符号化することができる。LPCは、音声(たとえば、16kHzのサンプリングレートで320サンプルに対応する20ミリ秒(ms)の音声)の各フレーム、音声の各サブフレーム(たとえば5msの音声)またはこれらの各組合せについて生成することができる。各フレームまたは各サブフレームについて生成されるLPCの数は、実行されるLP解析の「次数」によって決定され得る。特定の実施形態では、LP解析および符号化モジュール132は、10次LP解析に対応する11個のLPCからなるセットを生成することができる。
【0020】
[0025]LPC−LSP変換モジュール134は、LP解析/符号化モジュール132によって生成されたLPCのセットを(たとえば一対一変換によって)対応するLSPのセットに変換することができる。あるいは、LPCのセットは、パーコール係数、ログ面積比値、イミタンススペクトル対(ISP)、またはイミタンススペクトル周波数(ISF)の対応するセットに一対一に変換され得る。LPCのセットとLSPのセットとの間の変換は、誤差なしに可逆であり得る。
【0021】
[0026]量子化器136は、変換モジュール134によって生成されたLSPのセットを量子化することができる。たとえば、量子化器136は、複数の項目(たとえばベクトル)を含む複数のコードブックを含み得るかまたはそのようなコードブックに結合され得る。LSPのセットを量子化するために、量子化器136はそのLSPのセットに(たとえば最小二乗または平均二乗誤差などの歪み測度に基づいて)「最も近い」コードブック項目を特定することができる。量子化器136は、コードブック内の特定された項目の位置に対応する指標値または一連の指標値を出力することができる。したがって量子化器136の出力は、低帯域ビットストリーム142に含まれる低帯域フィルタパラメータを表し得る。
【0022】
[0027]低帯域解析モジュール130は、低帯域励起信号144を生成することもできる。たとえば、低帯域励起信号144は、低帯域解析モジュール130によって実行されたLP処理時に生成されるLP残留信号を量子化することによって生成される符号化信号であってよい。LP残留信号は予測誤差を表し得る。
【0023】
[0028]システム100は、解析フィルタバンク110からの高帯域信号124と低帯域解析モジュール130からの低帯域励起信号144とを受信するように構成された高帯域解析モジュール150をさらに含むことができる。高帯域解析モジュール150は、高帯域信号124と低帯域励起信号144とに基づいて高帯域サイド情報172を生成し得る。たとえば、本明細書で詳述するように、高帯域サイド情報172は(たとえば少なくとも高帯域エネルギーと低帯域エネルギーとの比に基づく)高帯域LSPおよび/または利得情報を含み得る。
【0024】
[0029]高帯域解析モジュール150は、高帯域励起発生器160を含み得る。高帯域励起発生器160は、低帯域励起信号144のスペクトルを高帯域周波数範囲(たとえば7kHz〜16kHz)に拡張することによって高帯域励起信号を生成することができる。例として、高帯域励起発生器160は、低帯域励起信号への変換(たとえば、絶対値または二乗演算などの非線形変換)を適用してよく、変換された低帯域励起信号を雑音信号(たとえば低帯域励起信号144に対応する包絡線に従って変調されたホワイトノイズ)と混合して高帯域励起信号を生成してよい。高帯域励起信号は、高帯域サイド情報172に含まれる1つまたは複数の高帯域利得パラメータを決定するために使用され得る。
【0025】
[0030]高帯域解析モジュール150は、LP解析および符号化モジュール152と、LPC−LSP変換モジュール154と、量子化器156も含み得る。LP解析および符号化モジュール152と、変換モジュール154と、量子化器156とはそれぞれ、低帯域解析モジュール130の対応するコンポーネントを参照しながら上述したように機能するが、分解能は比較的に低い(たとえば各係数、LSPなどにより少ないビット数を使用する)。別の例示の実施形態では、高帯域LSP量子化器156は、事前定義されたビット数を使用してLSP係数のサブセットが個別に量子化されるスカラー量子化を使用することができる。たとえば、LP解析および符号化モジュール152と、変換モジュール154と、量子化器156とは、高帯域サイド情報172に含まれる高帯域フィルタ情報(たとえば高帯域LSP)を決定するために高帯域信号124を使用してよい。特定の実施形態では、高帯域サイド情報172は高帯域LSPのほか、高帯域利得パラメータを含み得る。特定の種類の雑音が存在する場合、本明細書で詳述するように利得減衰および平滑化モジュール162によって実行される利得減衰および/または利得平滑化の結果として高帯域利得パラメータが生成され得る。
【0026】
[0031]低帯域ビットストリーム142と高帯域サイド情報172とは、出力ビットストリーム192を生成するためにマルチプレクサ(MUX)180によって多重化されてよい。出力ビットストリーム192は、入力音声信号102に対応する符号化音声信号を表し得る。たとえば、出力ビットストリーム192は(有線、ワイヤレス、または光チャネルを介して)送信および/または記憶され得る。受信器において、音声信号(たとえばスピーカまたは他の出力装置に供給される入力音声信号102が再構成されたバージョン)を生成するように、デマルチプレクサ(DEMUX)と、低帯域復号器と、高帯域復号器と、フィルタバンクとによって逆の動作が行われ得る。低帯域ビットストリーム142を表すために使用されるビット数は、高帯域サイド情報172を表すために使用されるビット数よりも大幅に大きくてよい。したがって、出力ビットストリーム192内のビットの大部分が低帯域データを表す。高帯域サイド情報172は、受信器において信号モデルに従って低帯域データから高帯域信号を再生するために使用することができる。たとえば、信号モデルは、低帯域データ(たとえば低帯域信号122)と高帯域データ(たとえば高帯域信号124)との間の期待される関係または相関のセットを表すことができる。したがって、異なる種類の音声データ(たとえば発話、音楽など)に異なる信号モデルが使用可能であり、符号化音声データの通信の前に、使用する特定の信号モデルが送信器と受信器とによってネゴシエートされてよい(または業界標準で定義されてよい)。信号モデルを使用すれば、送信器における高帯域解析モジュール150は、受信器における対応する高帯域解析モジュールが信号モデルを使用して出力ビットストリーム192から高帯域信号124を再構成することができるように高帯域サイド情報172を生成することができるはずである。
【0027】
[0032]しかし、背景雑音がある場合、低帯域と高帯域との間の相関が不十分であることによって、基となる信号モデルが信頼性のある信号再構成という点で最適ではない仕方で機能する可能性があるので、受信器における高帯域合成の結果として顕著なアーティファクトが生じる場合がある。たとえば、信号モデルは高帯域における雑音成分を誤って発話と解釈する可能性があり、それによって受信器において雑音を不正確に再現しようとする利得パラメータが生成される可能性があり、その結果、顕著なアーティファクトが生じる。そのようなアーティファクト生成条件の例としては、自動車のクラクションやかん高いブレーキ音などの高周波雑音があるが、これらには限らない。例として、
図2の第1のスペクトログラム210に、比較的大きな信号エネルギーを有する高帯域雑音として示されているアーティファクト生成条件に対応する2つの成分を有する音声信号を示す。第2のスペクトログラム220は、高帯域利得パラメータの過大推定による再構成信号における結果のアーティファクトを示す。
【0028】
[0033]このようなアーティファクトを低減するために、高帯域解析モジュール150は高帯域利得制御を行うことができる。たとえば、高帯域解析モジュール150は、再生時に可聴アーティファクトを生じさせる可能性のある信号成分(たとえば
図2の第1のスペクトログラム210に示すアーティファクト生成条件)を検出するように構成された、アーティファクト誘起成分検出モジュール158を含んでよい。そのような成分がある場合、高帯域解析モジュール150は、そのようなアーティファクトの可聴作用を少なくとも部分的に低減する符号化信号の生成を可能にする。たとえば、利得減衰および平滑化モジュール162は利得減衰および/または利得平滑化を行って、高帯域サイド情報172に含まれる利得情報またはパラメータを修正してよい。
【0029】
[0034]利得減衰は、具体例として、指数演算または線形演算の適用によりモデル化利得値を低減することを含み得る。利得平滑化は、現在のフレーム/サブフレームのモデル化利得と1つまたは複数の前のフレーム/サブフレームのモデル化利得との加重和を計算することを含み得る。この修正利得情報の結果、
図2の第2のスペクトログラム220に示されるアーティファクトがない(または低減されたレベルを有する)
図2の第3のスペクトログラム230による再構成信号を生じさせることができる。
【0030】
[0035]音声信号がアーティファクト生成条件を含むか否かを評価するために1つまたは複数の試験を行うことができる。たとえば、第1の試験は、LSP(たとえば音声信号の特定のフレームのLSP)のセット内で検出される最小LSP間隔を第1の閾値と比較することを含み得る。LSP間の小さな間隔は、比較的狭い周波数範囲での比較的強い信号に対応する。特定の実施形態では、高帯域信号124が第1の閾値未満の最小LSP間隔を有するフレームを生じさせると決定される場合、音声信号内にアーティファクト生成条件が存在すると決定され、そのフレームに対して利得減衰が有効にされてよい。
【0031】
[0036]別の例として、第2の試験は、連続した複数のフレームの平均最小LSP間隔を第2の閾値と比較することを含み得る。たとえば、音声信号の特定のフレームが、第1の閾値より大きいが第2の閾値より小さい最小LSP間隔を有する場合、複数のフレームの平均最小LSP間隔(たとえばその特定のフレームを含む最近の4個のフレームの最小LSP間隔の加重平均)が第3の閾値よりも小さければ、アーティファクト生成条件が存在すると決定してよい。その結果、その特定のフレームに対して利得減衰が有効にされてよい。
【0032】
[0037]別の例として、第3の試験は、音声信号の利得減衰済みフレームの後に特定のフレームが続くか否かを決定することを含み得る。利得減衰済みフレームの後にその特定のフレームが続く場合、その特定のフレームの最小LSP間隔が第2の閾値未満であることに基づいて、その特定のフレームに対して利得減衰が有効にされてよい。
【0033】
[0038]例示のために3種類の試験について説明されている。これらの試験のうちの任意の1つまたは複数の試験(またはこれらの試験の組合せ)が満たされていることに応答して、または1つまたは複数の他の試験または条件が満たされていることに応答して、フレームの利得減衰が有効にされてよい。たとえば、特定の実施形態は、第2の試験と第3の試験のいずれも適用せずに、上述の第1の試験などの単一の試験に基づいて利得減衰を有効にするか否かを決定することを含み得る。代替実施形態は、第1の試験と第3の試験のいずれも適用せずに第2の試験に基づいて、または第1の試験と第2の試験のいずれも適用せずに第3の試験に基づいて、利得減衰を有効にするか否かを決定することを含み得る。別の例として、特定の実施形態は、第3の試験を適用せずに、第1の試験と第2の試験などの2種類の試験に基づいて、利得減衰を有効にするか否かを決定することを含み得る。代替実施形態は、第3の試験を適用せずに第1の試験と第3の試験とに基づいて、または第1の試験を適用せずに第2の試験と第3の試験とに基づいて、利得減衰を有効にするか否かを決定することを含み得る。
【0034】
[0039]特定のフレームについて利得減衰が有効にされた場合、その特定のフレームについて利得平滑化も有効にしてよい。たとえば、その特定のフレームの利得値と音声信号の先行フレームの利得値との平均(たとえば加重平均)を決定することによって利得平滑化が行われ得る。決定された平均はその特定のフレームの利得値として使用されてよく、それによって音声信号の連続フレーム間の利得値の変化量が低減される。
【0035】
[0040]特定のフレームのLSP値がLSP値の「低速」変化推定値から第4の閾値未満だけ逸脱しており、LSP値の「高速」変化推定値から第5の閾値未満だけ逸脱していると決定することに応答して、特定のフレームについて利得平滑化を有効にしてよい。低速変化推定値からの逸脱の量は、低速LSP変化レートと呼ばれる場合がある。高速変化推定値からの逸脱の量は、高速LSP変化レートと呼ばれる場合があり、低速LSP変化レートよりも速い適応レートに対応し得る。
【0036】
[0041]低速LSP変化レートは、1つまたは複数の前のフレームのLSP値に現在のフレームのLSP値よりも重い重み付けをする、複数の連続フレームのLSP値の加重平均からの逸脱に基づいてよい。比較的大きな値を有する低速LSP変化レートは、LSP値がアーティファクト生成条件を示していないレートで変化していることを示す。しかし、比較的小さい値(たとえば第4の閾値未満)を有する低速LSP変化レートは、複数のフレームにわたるLSPの低速の動きに対応し、これは進行中のアーティファクト生成条件を示している可能性がある。
【0037】
[0042]高速LSP変化レートは、現在のフレームのLSP値に低速LSP変化レートの加重平均よりも重く重み付けをする、複数の連続フレームのLSP値の加重平均からの逸脱に基づいてよい。比較的大きな値を有する高速LSP変化レートは、LSP値がアーティファクト生成条件を示していない率で変化していることを示している可能性があり、比較的小さい値(たとえば第5の閾値未満)を有する高速LSP変化レートは、複数のフレームにわたるLSPの比較的小さい変化に対応している可能性があり、これはアーティファクト生成条件を示している可能性がある。
【0038】
[0043]低速LSP変化レートは複数フレームアーティファクト生成条件が開始した時を示すために使用され得るが、低速LSP変化レートは複数フレームアーティファクト生成条件が終了した時の検出に遅延を生じさせる可能性がある。同様に、高速LSP変化レートは複数フレームアーティファクト生成条件が開始した時を検出するのに低速LSP変化レートよりも信頼性が低い可能性があるが、高速LSP変化レートは、複数フレームアーティファクト生成条件が終了した時をより正確に検出するために使用され得る。低速LSP変化レートが第4の閾値未満であり、高速LSP変化レートが第5の閾値未満である間は、複数フレームアーティファクト生成事象が進行中であると決定され得る。その結果、アーティファクト生成事象の進行中に、利得平滑化が有効にされてフレーム利得値の急上昇またはスプリアス上昇を防止することができる。
【0039】
[0044]特定の実施形態では、アーティファクト誘起成分検出モジュール158は、音声信号が可聴アーティファクトを生じさせる成分を含むか否かを決定するために、最小LSP間隔と、低速LSP変化レートと、高速LSP変化レートと、平均最小LSP変化レートとの4つのパラメータを音声信号から決定することができる。たとえば、10次LPプロセスは、10個のLSPに変換される11個のLPCからなるセットを生成することができる。アーティファクト誘起成分検出モジュール158は、音声の特定のフレームについて、10個のLSPのうちの任意の2つのLSPの間の最小(たとえば最も小さい)間隔を決定することができる。典型的には、自動車のクラクションやかん高いブレーキ音などの鋭い突然の雑音の結果として、間隔の狭いLSPが生じる(たとえば、第1のスペクトログラム210における「強い」13kHzの雑音成分は12.95kHzと13.05kHzのLSPによって近接して囲まれ得る)。アーティファクト誘起成分検出モジュール158は、アーティファクト誘起成分検出モジュール158により実行または実装され得る以下のC++式擬似コードに示すようにして、低速LSP変化レートと高速変化レートとを決定することもできる。
【数1】
【数2】
【0040】
[0045]アーティファクト誘起成分検出モジュール158は、以下の擬似コードに従って加重平均最小LSP間隔をさらに決定してよい。以下の擬似コードは、モード遷移に応答してLSP間隔をリセットすることも含む。そのようなモード遷移は、音楽および/または発話の複数の符号化モードに対応するデバイスにおいて発生することがある。たとえば、デバイスは発話には代数CELP(ACEP)モードを使用し、音楽型信号には音声符号化モード、すなわち汎用信号符号化(GSC)を使用することができる。あるいは、特定の低速事例では、デバイスは特徴パラメータ(たとえば調性、ピッチドリフト、発声など)に基づいて、ACELP/GSC/変形離散コサイン変換(MDCT)モードが使用可能であると決定してよい。
【数3】
【数4】
【数5】
【0041】
[0046]最小LSP間隔と、LSP変化レートと、平均最小LSP間隔とを決定した後、アーティファクト誘起成分検出モジュール158は、音声のフレーム内にアーティファクト誘起雑音が存在するか否かを決定するために、決定した各値を以下の擬似コードに従って1つまたは複数の閾値と比較することができる。アーティファクト誘起雑音が存在する場合、アーティファクト誘起成分検出モジュール158は、利得減衰および平滑化モジュール162が適宜、利得減衰および/または利得平滑化を行うことができるようにしてよい。
【数6】
【数7】
【0042】
[0047]特定の実施形態では、利得減衰および平滑化モジュール162は、以下の擬似コードに従って利得減衰および/または平滑化を選択的に行ってよい。
【数8】
【数9】
【数10】
【0043】
[0048]このように、
図1のシステム100は、入力信号中の雑音による可聴アーティファクトを低減または防止するために利得制御(たとえば利得減衰および/または利得平滑化)を行うことができる。したがって、
図1のシステム100は、発話符号化信号モデルによっては説明されない雑音が存在する場合に音声信号(たとえば発話信号)のより正確な再生を可能にすることができる。
【0044】
[0049]
図3を参照すると、利得制御を行う方法の特定の実施形態を示すフローチャートが示されており、全体が300と表記されている。例示的な一実施形態では、方法300は、
図1のシステム100において実施され得る。
【0045】
[0050]方法300は、(発話符号化信号モデルを介して)符号化される音声信号を302で受信することを含み得る。特定の実施形態では、音声信号は約50Hz〜約16kHzの帯域幅を有することができ、発話を含み得る。たとえば、
図1においては、解析フィルタバンク110が、受信器で再生されるように符号化される入力音声信号102を受信してよい。
【0046】
[0051]方法300は、304で、音声信号に対応するスペクトル情報(たとえばLSP間隔、LSP変化レート)に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定してよい。特定の実施形態では、アーティファクト誘起成分は、
図2の第1のスペクトログラム210に示される高周波雑音などの雑音であり得る。たとえば、
図1では、アーティファクト誘起成分検出モジュール158がスペクトル情報に基づいて、音声信号102の高帯域部分がそのような雑音を含むと決定することができる。
【0047】
[0052]音声信号が当該成分を含むと決定することは、音声信号のフレームに関連付けられたLSP間隔を決定することを含み得る。LSP間隔は、音声信号のフレームの高帯域部分の線形予測符号化(LPC)時に生成された複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔であってよい。たとえば、音声信号は、LSP間隔が第1の閾値未満であることに応答して、当該成分を含むと決定され得る。別の例として、音声信号は、LSP間隔が第2の閾値未満であり、複数のフレームの平均LSP間隔が第3の閾値未満であることに応答して、当該成分を含むと決定され得る。
図5を参照しながら詳述するように、音声信号は、(1)LSP間隔が第2の閾値未満であり、(2)平均LSP間隔が第3の閾値であるか、または音声信号の別のフレームに対応する利得減衰が有効にされており、その別のフレームは音声信号の当該フレームに先行する、のうちの少なくとも一方に応答して、当該成分を含むと決定され得る。音声信号が当該成分を含むか否かを決定するための条件が(1)および(2)と標識付けされているが、そのような標識は参照のために過ぎず、動作の順序を規定するものではない。そうではなく、条件(1)と(2)とは、互いを基準として任意の順序で決定され得るかまたは(時間的に少なくとも部分的に重なり合って)同時に決定され得る。
【0048】
[0053]方法300は、音声信号が当該成分を含むという決定に応答して、306において音声信号に対応する利得パラメータを調整することをさらに含み得る。たとえば
図1において、利得減衰および平滑化モジュール162は、高帯域サイド情報172に含められる利得情報を修正してよく、その結果、符号化出力ビットストリーム192は信号モデルから逸脱することになる。方法300は308で終了することができる。
【0049】
[0054]利得パラメータを調整することは、利得平滑化を有効にして音声信号のフレームに対応する利得値を低減することを含み得る。特定の実施形態では、利得平滑化は、当該利得値と音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む。利得平滑化は、フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされ得る。第1のLSP変化レート(たとえば「低速」LSP変化レート)は、第2のLSP変化レート(たとえば「高速」LSP変化レート)より低速の適応レートに対応し得る。
【0050】
[0055]利得パラメータを調整することは、音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含み得る。特定の実施形態では、利得減衰は、利得値に指数演算を適用すること、または利得値に線形演算を適用することを含む。たとえば、第1の利得条件(たとえばフレームが第6の閾値未満の平均LSP間隔を含む)が満たされることに応答して、利得値に指数演算を適用してよい。第2の利得条件(たとえば音声信号の別のフレームに対応する利得減衰が有効にされ、その別のフレームは音声信号の当該フレームに先行する)が満たされることに応答して、利得値に線形演算を適応してよい。特定の実施形態では、
図3の方法300は、中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)またはコントローラなどの処理ユニットのハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)など)によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、
図3の方法300は、
図6を参照して説明するように命令を実行するプロセッサによって実行され得る。
【0051】
[0056]
図4を参照すると、利得制御を行う方法の特定の実施形態を示すフローチャートが示されており、全体が400と表記されている。例示的な一実施形態では、方法400は、
図1のシステム100において実施され得る。
【0052】
[0057]402において、音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔が少なくとも1つの閾値と比較され、404において、比較の結果に少なくとも部分的に基づいて音声信号に対応する利得パラメータが調整される。LSP間隔を少なくとも1つの閾値と比較することは音声信号中のアーティファクト生成成分の存在を示し得るが、この比較はアーティファクト生成成分が実際に存在することを示す必要はない。たとえば、音声信号中にアーティファクト生成成分が存在するときに利得制御が実行される可能性を高くすると同時に音声信号中にアーティファクト生成成分が存在しない状態で利得制御が実行される(たとえば「フォールスポジティブ」)可能性も高くするように、比較に使用される1つまたは複数の閾値が設定され得る。したがって、方法400は、音声信号中にアーティファクト生成成分が存在するか否かを決定せずに利得制御を行ってよい。
【0053】
[0058]特定の実施形態では、LSP間隔は、音声信号のフレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である。利得パラメータを調整することは、LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含み得る。これに代えてまたはこれに加えて、利得パラメータを調整することは、LSP間隔が第2の閾値未満であり、平均LSP間隔が第3の閾値未満であることに応答して利得減衰を有効にすることを含み、ここで平均LSP間隔は、当該フレームに関連付けられたLSP間隔と音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく。
【0054】
[0059]利得減衰が有効にされている場合、利得パラメータを調整することは、第1の利得条件が満たされることに応答して利得パラメータの値に指数演算を適用することと、第2の利得条件が満たされることに応答して利得パラメータの値に線形演算を適用することとを含み得る。
【0055】
[0060]利得パラメータを調整することは、音声信号のフレームに対応する利得値を低減するように利得平滑化を有効にすることを含み得る。利得平滑化は、フレームに関連付けられた利得値と音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含み得る。利得平滑化は、フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされ得る。第1のLSP変化レートは、第2のLSP変化レートよりも低速の適応レートに対応する。
【0056】
[0061]特定の実施形態では、
図4の方法400は、中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)またはコントローラなどの処理ユニットのハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)など)によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、
図4の方法400は、
図6を参照して説明するように命令を実行するプロセッサによって実行され得る。
【0057】
[0062]
図5を参照すると、利得制御を行う方法の別の実施形態を示すフローチャートが示されており、全体が500と表記されている。例示的な一実施形態では、方法500は、
図1のシステム100において実施され得る。
【0058】
[0063]方法500は、502において、音声信号のフレームに関連付けられたLSP間隔を決定することを含み得る。LSP間隔は、フレームの線形予測符号化時に生成される複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔であってよい。たとえば、LSP間隔は、
図1に対応する擬似コードにおける「lsp_spacing」変数を参照して例示されるように決定され得る。
【0059】
[0064]方法500は、504において、フレームに関連付けられた第1の(たとえば低速)LSP変化レートを決定し、506において、フレームに関連付けられた第2の(たとえば高速)LSP変化レートを決定することも含み得る。たとえば、LSP変化レートは、
図1に対応する擬似コードにおける「lsp_slow_evol_rate」変数と「lsp_fast_evol_rate」変数とを参照して例示するように決定され得る。
【0060】
[0065]方法500は、508において、フレームに関連付けられたLSP間隔と音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づいて、平均LSP間隔を決定することを含み得る。たとえば、平均LSP間隔は、
図1に対応する擬似コードにおける「Average_lsp_shb_spacing」変数を参照して例示するように決定され得る。
【0061】
[0066]方法500は、510において、LSP間隔が第1の閾値未満であるか否かを決定することを含み得る。たとえば、
図1の擬似コードにおいて、第1の閾値は「THR2」=0.0032であってよい。LSP間隔が第1の閾値未満の場合、方法500は514において利得減衰を有効にすることを含み得る。
【0062】
[0067]LSP間隔が第1の閾値未満でない場合、方法500は、512においてLSP間隔が第2の閾値未満であるか否かを決定することを含み得る。たとえば、
図1の擬似コードにおいて、第2の閾値は「THR1」=0.008であってよい。LSP間隔が第2の閾値未満でない場合、方法500は522で終了し得る。LSP間隔が第2の閾値未満である場合、方法500は、516で、平均LSP間隔が第3の閾値未満であるか否か、フレームがモード遷移を表しているか(または他の方法でモード遷移に関連付けられているか)否か、および/または前のフレームで利得減衰が有効にされていたか否かを決定することを含み得る。たとえば、
図1の擬似コードにおいて、第3の閾値は「THR3」=0.005であってよい。平均LSP間隔が第3の閾値未満である場合、またはフレームがモード遷移を表している場合、または変数prevGainAttenuate=TRUEの場合、方法500は514で利得減衰を有効にすることを含み得る。平均LSP間隔が第3の閾値未満でなく、フレームがモード遷移を表しておらず、変数prevGainAttenuate=FALSEである場合、方法500は522で終了し得る。
【0063】
[0068]514で利得減衰が有効にされる場合、方法500は518に進んでよく、518において、第1の変化レートが第4の閾値未満であり、第2の変化レートが第5の閾値未満であるか否かを決定してよい。たとえば、
図1の擬似コードにおいて、第4の閾値は「THR4」=0.001であってよく、第5の閾値は「THR5」=0.001であってよい。第1の変化レートが第4の閾値未満であって、第2の変化レートが第5の閾値未満である場合、方法500は520において利得平滑化を有効にすることを含み得、その後に方法500は522で終了してよい。第1の変化レートが第4の閾値未満でないか、または第2の変化レートが第5の閾値未満でない場合、方法500は522で終了してよい。
【0064】
[0069]特定の実施形態では、
図5の方法500は、中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)またはコントローラなどの処理ユニットのハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)など)によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、
図5の方法500は、
図6を参照して説明するように命令を実行するプロセッサによって実行され得る。
【0065】
[0070]以上のように、
図1〜
図5は、雑音によるアーティファクトを低減するために(たとえば
図1の利得減衰および平滑化モジュール162において)利得制御を実行するか否かを決定するシステムおよび方法を示している
[0071]
図6を参照すると、ワイヤレス通信デバイスの特定の例示の実施形態を示すブロック図が示されており、全体が600と表記されている。このデバイス600は、メモリ632に結合されたプロセッサ610(たとえば中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)など)を含む。メモリ632は、
図3〜
図5の方法など、本明細書で開示されている方法および処理を実行するためにプロセッサ610および/または符号化器/復号器(CODEC)634によって実行可能な命令660を含み得る。
【0066】
[0072]CODEC634は利得制御システム672を含み得る。特定の実施形態では、利得制御システム672は、
図1のシステム100の1つまたは複数のコンポーネントを含み得る。利得制御システム672は、専用ハードウェア(たとえば回路)により、または1つまたは複数のタスクを実行するための命令を実行するプロセッサによって、またはこれらの組合せによって実装され得る。一例として、メモリ632、またはCODEC634内のメモリは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピン注入MRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラム読取り専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、取外し式ディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイスであってよい。メモリデバイスは、コンピュータ(たとえばCODEC634内のプロセッサおよび/またはプロセッサ610)によって実行されるとコンピュータに、音声信号に対応するスペクトル情報に基づいて音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、音声信号がその成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整させる命令(たとえば命令660)を含むことができる。一例として、メモリ632、またはCODEC634内のメモリは、コンピュータ(たとえばCODEC634内のプロセッサおよび/またはプロセッサ610)によって実行されるとコンピュータに音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔を少なくとも1つの閾値と比較させ、比較の結果に少なくとも部分的に基づいて音声信号に対応する音声符号化利得パラメータを調整させる命令(たとえば命令660)を含む、非一時的コンピュータ可読媒体であってよい。
【0067】
[0073]
図6は、プロセッサ610とディスプレイ628とに結合されたディスプレイコントローラ626も示す。CODEC634は、図のように、プロセッサ610に結合され得る。CODEC634にはスピーカ636とマイクロフォン638とが結合され得る。たとえば、マイクロフォン638は、
図1の入力音声信号102を生成することができ、CODEC634は、入力音声信号102に基づいて受信器に送信するための出力ビットストリーム192を生成することができる。別の例として、スピーカ636は、
図1の出力ビットストリーム192からCODEC634によって再構成された信号を出力するために使用することができ、この場合、出力ビットストリーム192は送信器から受信される。
図6は、ワイヤレスコントローラ640をプロセッサ610とワイヤレスアンテナ642とに結合することができることも示している。
【0068】
[0074]特定の実施形態では、プロセッサ610と、ディスプレイコントローラ626と、メモリ632と、CODEC634と、ワイヤレスコントローラ640とは、システムインパッケージまたはシステムオンチップデバイス(たとえば移動局モデム(MSM))622内に含まれる。特定の実施形態では、タッチスクリーンおよび/またはキーパッドなどの入力デバイス630と、電源644がシステムオンチップデバイス622に結合されている。さらに、特定の実施形態では、
図6に示すように、ディスプレイ628と、入力デバイス630と、スピーカ636と、マイクロフォン638と、ワイヤレスアンテナ642と、電源644とは、システムオンチップデバイス622の外部にある。しかし、ディスプレイ628と、入力デバイス630と、スピーカ636と、マイクロフォン638と、ワイヤレスアンテナ642と、電源644とのそれぞれは、インターフェースまたはコントローラなどの、システムオンチップデバイス622のコンポーネントに結合され得る。
【0069】
[0075]記載の実施形態に関連して、音声信号に対応するスペクトル情報に基づいて音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段を含む装置が開示される。たとえば、決定するための手段は、
図1のアーティファクト誘起成分検出モジュール158、
図6の利得制御システム672またはこれらの組合せ、音声信号がそのような成分を含むと決定するように構成された1つまたは複数のデバイス(たとえば非一時的コンピュータ可読媒体における命令を実行するプロセッサ)、またはこれらの任意の組合せを含み得る。
【0070】
[0076]装置は、音声信号が当該成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整するための手段も含み得る。たとえば、調整するための手段は、
図1の利得減衰および平滑化モジュール162、
図6の利得制御システム672またはそのコンポーネント、符号化信号を生成するように構成された1つまたは複数のデバイス(たとえば非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)またはこれらの任意の組合せを含み得る。
【0071】
[0077]本明細書に開示の実施形態に関連して記載されている様々な例示の論理ブロック、構成、モジュール、回路およびアルゴリズムステップが、電子ハードウェア、またはハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両者の組合せとして実装され得ることが、当業者ならさらにわかるであろう。上記では、様々な例示のコンポーネント、ブロック、構成、モジュール、回路、およびステップについて、それらの機能の観点から一般的に説明した。そのような機能をハードウェアとして実装するか、実行可能ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
【0072】
[0078]本明細書に開示の実施形態に関連して説明した方法またはアルゴリズムのステップは、直接にハードウェアの形態、プロセッサによって実行されるソフトウェアモジュールの形態、またはこの2つの組合せの形態で実施され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピン注入MRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM)、レジスタ、ハードディスク、取外し式ディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイスに存在し得る。例示のメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替実施形態では、メモリデバイスはプロセッサに内蔵され得る。プロセッサと記憶媒体とは、特定用途向け集積回路(ASIC)内に存在し得る。ASICは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として常駐し得る。
【0073】
[0079]開示した実施形態の上記の説明は、開示した実施形態を当業者が作成または使用することができるように行ったものである。当業者にはこれらの実施形態に対する様々な修正が容易にわかるであろうし、本明細書で定義されている原理は本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示されている実施形態に限定されることが意図されたものではなく、以下の特許請求の範囲によって定義される原理および新規な特徴と合致する最大限の範囲が与えられることが意図されている。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定することと、
前記音声信号が前記成分を含むと決定することに応答して、前記音声信号に対応する利得パラメータを調整することと、を備える方法。
[C2]
前記LSP間隔は、前記音声信号のフレームに関連付けられている、C1に記載の方法。
[C3]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C2に記載の方法。
[C4]
前記音声信号は、前記LSP間隔が第1の閾値未満であることに応答して前記成分を含むと決定される、C2に記載の方法。
[C5]
前記音声信号は、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して前記成分を含むと決定され、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C2に記載の方法。
[C6]
前記音声信号は、
1)前記LSP間隔が第2の閾値未満であることと、
2)平均LSP間隔が第3の閾値未満であること、または
前記音声信号の別のフレームに対応する利得減衰が有効化されていることのうちの少なくとも1つにと応答して、前記成分を含むと決定され、前記別のフレームは前記音声信号の前記フレームに先行する、C2に記載の方法。
[C7]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C1に記載の方法。
[C8]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値との加重平均を決定すること、を含むC7に記載の方法。
[C9]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされる、C7に記載の方法。
[C10]
前記第1のLSP変化レートは、前記第2のLSP変化レートよりも低速の適応レートに対応する、C9に記載の方法。
[C11]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含む、C1に記載の方法。
[C12]
前記利得減衰は、前記利得値に指数演算を適用することを含む、C11に記載の方法。
[C13]
前記利得減衰は、前記利得値に線形演算を適用することを含む、C11に記載の方法。
[C14]
前記利得減衰は、
第1の利得条件が満たされていることに応答して前記利得値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して前記利得値に線形演算を適用することとを含む、C11に記載の方法。
[C15]
前記第1の利得条件は、平均LSP間隔が第6の閾値未満であることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C14に記載の方法。
[C16]
前記第2の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号に先行する、C14に記載の方法。
[C17]
前記アーティファクト生成条件は、高帯域雑音に対応する、C1に記載の方法。
[C18]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔を少なくとも1つの閾値と比較することと、
前記比較の結果に少なくとも部分的に基づいて前記音声信号に対応する音声符号化利得パラメータを調整することと、を備える方法。
[C19]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C18に記載の方法。
[C20]
前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、C18に記載の方法。
[C21]
前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C18に記載の方法。
[C22]
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むC18に記載の方法。
[C23]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C18に記載の方法。
[C24]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、C23に記載の方法。
[C25]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、C24に記載の方法。
[C26]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路と、
前記雑音検出回路に応答し、前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路と、を備える装置。
[C27]
前記音声信号を受信し、前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するように構成された解析フィルタバンクと、
前記低帯域部分に基づいて低帯域ビットストリームを生成するように構成された低帯域解析回路と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するように構成された高帯域解析回路と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するように構成されたマルチプレクサと、をさらに備えるC26に記載の装置。
[C28]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段と、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するための手段と、を備える装置。
[C29]
前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するための手段と、
前記低帯域部分に基づいて低帯域ビットストリームを生成するための手段と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するための手段と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するための手段と、を備えるC28に記載の装置。
[C30]
コンピュータによって実行されると、前記コンピュータに、
音声信号に対応する音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整させる命令、を備える非一時的コンピュータ可読媒体。
[C31]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C30に記載のコンピュータ可読媒体。
[C32]
前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、C30に記載のコンピュータ可読媒体。
[C33]
前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C30に記載のコンピュータ可読媒体。
[C34]
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むC30に記載のコンピュータ可読媒体。
[C35]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C30に記載のコンピュータ可読媒体。
[C36]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、C35に記載のコンピュータ可読媒体。
[C37]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、C36に記載のコンピュータ可読媒体。