(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-06
(54)【発明の名称】オーディオ相関除去器、オーディオ信号を相関除去するための処理システムおよび方法
(51)【国際特許分類】
G10L 21/0232 20130101AFI20240228BHJP
【FI】
G10L21/0232
【審査請求】有
【予備審査請求】有
(21)【出願番号】P 2023555211
(86)(22)【出願日】2022-03-09
(85)【翻訳文提出日】2023-11-06
(86)【国際出願番号】 EP2022055983
(87)【国際公開番号】W WO2022189481
(87)【国際公開日】2022-09-15
(32)【優先日】2021-03-11
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-10-20
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100134119
【氏名又は名称】奥町 哲行
(72)【発明者】
【氏名】ディッシュ・ザシャ
(72)【発明者】
【氏名】アネミュラー・カルロッタ
(72)【発明者】
【氏名】ヘレ・ユルゲン
(57)【要約】
相関除去器は、複数の遅延ユニットを備え、各遅延ユニットは、オーディオ信号に基づく周波数表現の部分を受信するように構成され、各遅延ユニットは、受信された部分を遅延させて遅延部分を提供するように構成される。相関除去器は、周波数表現の遅延部分に基づく信号を受信および結合するように構成された包絡線整形器を備える。包絡線整形器は、オーディオ信号の周波数表現を受信し、オーディオ信号の周波数表現に関して遅延部分のエネルギーを調整するように構成される。包絡線整形器は、合成整形された周波数表現を提供するように構成される。過渡現象信号部分は、相関除去器の適応動作によって処理される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
相関除去器であって、
複数の遅延ユニット(12)であって、各遅延ユニット(12)が、オーディオ信号(22)に基づく周波数表現の部分(14
1~14
n)を受信するように構成され、各遅延ユニット(12)が、前記受信部分(14
1~14
n)を遅延させて遅延部分(14’
1~14’
n)を提供するように構成された、複数の遅延ユニットと、
前記周波数表現の前記遅延部分(14’
1~14’
n)に基づく信号を受信および結合するように、前記オーディオ信号(22)の前記周波数表現を受信するように、前記オーディオ信号(22)の前記周波数表現に関して前記遅延部分(14’
1~14’
n)のエネルギーを調整するように、合成整形された周波数表現を提供するように構成された包絡線整形器(16)と、を備える、相関除去器。
【請求項2】
前記周波数表現の異なる部分(14
1~14
n)が、同じまたは異なる数の周波数ビンを含む、請求項1に記載の相関除去器。
【請求項3】
前記オーディオ信号(22)の前記周波数表現(14)を位相シフトするように、または、位相シフトされたオーディオ信号(22)を得るために時間領域において前記オーディオ信号(22)を位相シフトするように構成された位相シフタ(26)をさらに備える、請求項1または2に記載の相関除去器。
【請求項4】
前記位相シフタ(26)が、前記オーディオ信号(22)の前記周波数表現を位相シフトするように構成され、複数のオールパスフィルタを備え、各オールパスフィルタ(28)が、前記オーディオ信号(22)の前記周波数表現の関連部分(14
1~14
n)を位相シフトするように構成される、請求項3に記載の相関除去器。
【請求項5】
前記複数のオールパスフィルタのうちのオールパスフィルタ(28)が、互いに直列に接続されたシュレーダーIIRフィルタなどのオールパスフィルタ構造(40;50)のセットを備え、前記オールパスフィルタ構造(40;50)が、異なる時間遅延を提供するように適合され、または
前記オールパスフィルタ構造(40;50)が、入れ子状のオールパスフィルタ構造を備える、請求項4に記載の相関除去器。
【請求項6】
オールパスフィルタ構造(40;50)の数および/または前記オールパスフィルタ構造の回路が、異なるオールパスフィルタ(28)間で等しいかまたは異なる、請求項5に記載の相関除去器。
【請求項7】
前記異なる時間遅延が、前記オーディオ信号(22)の前記周波数表現を取得するために使用されるローカルサンプリングレートの素数倍に基づく、請求項5または6に記載の相関除去器。
【請求項8】
前記オールパスフィルタ構造(40;50)のセットが、4個のオールパスフィルタ構造(40;50)を備え、それぞれ、1、2、3および5または1、3、5および7の遅延を提供するように適合される、請求項5から7のいずれか一項に記載の相関除去器。
【請求項9】
前記オールパスフィルタ(28)のゲイン係数が、例えば20%の許容範囲内の0.7の大きさを有する値に適合される、請求項4から8のいずれか一項に記載の相関除去器。
【請求項10】
前記位相シフタ(26)が、時間領域において前記オーディオ信号(22)を位相シフトするように構成され、前記位相シフタ(26)が、互いに直列に接続されたシュレーダーIIRフィルタなどのオールパスフィルタ構造(40;50)のセットを備え、前記オールパスフィルタ構造(40;50)が、異なる時間遅延を提供するように適合され、または
前記オールパスフィルタ構造(40;50)が、入れ子状のオールパスフィルタ構造を備える、請求項3に記載の相関除去器。
【請求項11】
前記異なるオールパス時間遅延が、前記オーディオ信号(22)の前記周波数表現を取得するために使用されるサンプリングレートの逆数の素数倍に基づく、請求項10に記載の相関除去器。
【請求項12】
前記異なる時間遅延が、最小素数のセット、例えば1、2、3および5、または、1、3、5および7のそれぞれを、中間結果を取得するために前記オーディオ信号(22)の前記周波数表現の部分(14
1~14
n)を生成するために、および前記中間結果に対して次の素数、例えば131、257、383、641または131、383、641、907を使用するために使用されるダウンサンプリング係数と乗算することによって得られる素数に基づく、請求項10または11に記載の相関除去器。
【請求項13】
前記包絡線整形器(16)の前記オーディオ信号(22)から前記オーディオ信号(22)の前記周波数表現を取得するための第1の変換ユニット(24)を備え、前記残響オーディオ信号(22)から周波数表現を取得するための第2の変換ユニット(34)を備え、前記周波数表現の前記部分(14
1~14
n)が、前記残響オーディオ信号(22)からの前記周波数表現の部分(14
1~14
n)を形成する、請求項10から12のいずれか一項に記載の相関除去器。
【請求項14】
前記周波数表現の前記部分(14
1~14
n)が、等しい数または異なる数の周波数ビンを含む、請求項1から13のいずれか一項に記載の相関除去器。
【請求項15】
前記周波数表現の16個の部分(14
1~14
n)を取得するように適合される、請求項1から14のいずれか一項に記載の相関除去器。
【請求項16】
128個または129個の周波数ビンを有する前記周波数表現を取得するように適合される、請求項1から15のいずれか一項に記載の相関除去器。
【請求項17】
前記相関除去器が、前記周波数表現のサブセットまたは全ての部分(14
1~14
n)に対して同じ所定の遅延をさらに実装するように適合される、請求項1から16のいずれか一項に記載の相関除去器。
【請求項18】
前記複数の遅延ユニット(12)のうちのスペクトル部分(14
1~14
n)に関連付けられた前記遅延ユニット(12)が、他のスペクトル部分(14
1~14
n)に関連付けられた遅延ユニット(12)と比較した場合に、前記周波数表現の前記関連部分(14
1~14
n)を異なって遅延させるように構成される、請求項1から17のいずれか一項に記載の相関除去器。
【請求項19】
前記複数の遅延ユニット(12)が、より高い周波数を含む前記周波数表現の部分(14
1~14
n)と比較した場合に、より高い時間遅延を有するより低い周波数を含む前記周波数表現の部分(14
1~14
n)を遅延させるように構成される、請求項1から18のいずれか一項に記載の相関除去器。
【請求項20】
異なる時間遅延間の関係が、線形、対数、および/またはサブバンドサンプルの丸めに基づくもののうちの1つである、請求項19に記載の相関除去器。
【請求項21】
時間ブロックごとの離散フーリエ変換、DFT、または短時間フーリエ変換、STFTを実行することによって、前記オーディオ信号(22)または前記オーディオ信号(22)の残響バージョンを受信して前記部分(14
1~14
n)に変換するための変換ユニット(24)を備え、前記変換ユニット(24)が、許容範囲内の50%のオーバーラップを有するブロックを変換するように構成される、請求項1から20のいずれか一項に記載の相関除去器。
【請求項22】
時間ブロックごとの離散フーリエ変換、DFT、または短時間フーリエ変換、STFTを実行することによって、前記オーディオ信号(22)または前記オーディオ信号(22)の残響バージョンを受信して前記部分(14
1~14
n)に変換するための変換ユニット(24)を備え、ブロックが、256サンプルのブロック長を含む、請求項1から21のいずれか一項に記載の相関除去器。
【請求項23】
前記周波数表現(14)の前記部分の処理済みバージョンを受信し、オーバーラップ加算手順に基づいて前記処理済みバージョンから合成信号を合成するための逆変換ユニット(34)を備える、請求項1から22のいずれか一項に記載の相関除去器。
【請求項24】
前記包絡線整形器(16)が、サブバンド領域において4ms未満の時間分解能で動作するように構成される、請求項1から23のいずれか一項に記載の相関除去器。
【請求項25】
前記合成整形された周波数表現に基づいて信号(36)を提供するためのインターフェース(38)を備える、請求項1から24のいずれか一項に記載の相関除去器。
【請求項26】
前記包絡線整形器(16)が、例えば、相互依存または少なくともグループごとの共通整形処理を実装することによって、スペクトルビンを時間的におよび/または周波数的に個別にまたはグループとして整形するためのものである、請求項1から25のいずれか一項に記載の相関除去器。
【請求項27】
前記合成整形された周波数表現に基づく信号をモノラル信号として受信し、前記モノラル信号を少なくともステレオ信号に処理するように構成された信号処理段(66)を備える、請求項1から26のいずれか一項に記載の相関除去器。
【請求項28】
前記合成整形された周波数表現を少なくともステレオオーディオ信号に処理するように、例えば周波数領域における、少なくともステレオ信号に基づくソース拡張モデリングのために構成された信号処理段(66)を備える、請求項1から27のいずれか一項に記載の相関除去器。
【請求項29】
処理システムであって、
請求項1から28のいずれか一項に記載の相関除去器と、
中央/側分解信号を左/右分解信号に変換する処理段(66)と、を備える、処理システム。
【請求項30】
前記中央/側分解信号の一方の部分(74
1)が、前記相関除去器によって提供され、他方の部分(74
2)が、前記相関除去器と並列に接続され且つ前記処理段(66)と接続される遅延補償ユニット(78)によって提供される、請求項29に記載の処理システム。
【請求項31】
前記相関除去器の入力において前記オーディオ信号(22)またはその周波数表現(14)における過渡現象を検出するように構成された過渡現象抑制器(82)を備え、
前記過渡現象抑制器(82)が、前記処理段におけるエコーを抑制するために前記相関除去器によって提供される前記部分(74
1)を一時的にミュートするように構成される、請求項30に記載の処理システム。
【請求項32】
前記過渡現象抑制器(82)が、前記相関除去器の前記部分をミュートすることに対応する前記遅延補償ユニットの前記部分を増幅するように構成される、請求項31に記載の処理システム。
【請求項33】
前記過渡現象抑制器(82)が、前記相関除去器のミュートされていない部分と比較した場合に、前記遅延補償ユニットの前記部分を、
の率によって増幅するように構成される、請求項32に記載の処理システム。
【請求項34】
前記過渡現象抑制器(82)が、検出された過渡現象を抑制し、所定の阻害時間よりも早くない後続の過渡現象を抑制するように構成される、請求項31から33のいずれか一項に記載の処理システム。
【請求項35】
前記阻害時間が第1の阻害時間であり、前記過渡現象抑制器(82)が、前記第1の阻害時間の間に過渡現象が発生した場合に、前記第1の阻害時間よりも長い第2の阻害時間として前記阻害時間を再開するように構成される、請求項31から34のいずれか一項に記載の処理システム。
【請求項36】
前記過渡現象抑制器(82)が、前記周波数領域において動作するように構成される、請求項31から35のいずれか一項に記載の処理システム。
【請求項37】
前記過渡現象抑制器(82)が、前記相関除去器の事前遅延と比較した場合に、より長い時間にわたって前記相関除去器の前記部分をミュートするように構成される、請求項31から36のいずれか一項に記載の処理システム。
【請求項38】
前記相関除去器が、前記中央/側分解信号の一部として前記合成整形された周波数表現を前記処理段に提供し、前記処理段が、前記合成整形された周波数表現およびオーディオ信号(22)の遅延バージョンを、周波数領域において左/右分解信号に変換するためのものである、請求項29から37のいずれか一項に記載の処理システム。
【請求項39】
方法であって、
オーディオ信号に基づく周波数表現の複数の部分を受信すること(1010)と、
複数の遅延部分を提供するために、前記受信した部分のそれぞれを遅延させること(1020)と、
前記周波数表現の前記遅延部分に基づく信号を受信して(1030)結合することと、
前記オーディオ信号の前記周波数表現を受信すること(1040)と、
前記オーディオ信号の前記周波数表現に関して前記遅延部分のエネルギーを調整すること(1050)と、
合成整形された周波数表現を提供すること(1060)と、を含む、方法。
【請求項40】
前記オーディオ信号(22)またはその前記周波数表現(14)における過渡現象を検出することと、
処理段におけるエコーを抑制するために、相関除去器によって提供される部分(74
1)を一時的にミュートすることと、
をさらに含む、請求項39に記載の方法。
【請求項41】
コンピュータまたはプロセッサ上で実行されると、請求項39または40に記載の方法を実行するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号のための相関除去器、そのような相関除去器を有する処理システム、相関除去方法、およびコンピュータプログラム製品に関する。本発明は、特に、オーディオ信号相関除去器に関する。
【背景技術】
【0002】
知覚オーディオコーディングにおいて、相関除去器は、パラメトリック空間オーディオコーディングの重要な構成要素である。既知の解決策は、パラメトリックステレオまたはMPEGサラウンドのようなパラメトリック空間オーディオコーディングから知られる相関除去器に関する。[1]または[2]に記載されているような相関除去器は、長いインパルス応答を有する計算コストの高い時間領域残響(リバーブ)フィルタを使用する。[3]または[4]に記載されているような相関除去器は、かなりの処理遅延および計算コストの高い格子フィルタを有する直交ミラーフィルタバンク(QMF)の使用を必要とする。
【0003】
したがって、低処理遅延および/または低計算複雑度相関除去を可能にするオーディオ信号の部分を相関除去するための相関除去器、そのような相関除去器を有する処理システム、および方法が必要とされている。
【発明の概要】
【0004】
本発明の目的は、特に過渡現象を含む信号を処理する際に、低処理遅延および/または低複雑度および高知覚品質で相関除去を可能にする相関除去器、処理システム、および相関除去方法を提供することである。
この目的は、独立請求項に定義される主題によって達成される。
【0005】
本発明の発見は、周波数表現を複数の部分に分割し、処理、すなわち、各部分を別々の遅延ユニットによって遅延させることにより、異なる部分の計算が並列に実行され得るため、低い処理遅延を可能にすることである。同時に、そのような周波数領域動作は、低い計算複雑度を必要とする。
【0006】
実施形態によれば、相関除去器は、複数の遅延ユニットを備え、各遅延ユニットは、オーディオ信号に基づく周波数表現の部分を受信するように構成され、各遅延ユニットは、受信された部分を遅延させて遅延部分を提供するように構成される。相関除去器は、周波数表現の遅延部分に基づく合成信号を受信し、オーディオ信号の周波数表現を受信し、オーディオ信号の周波数表現に関して遅延部分のエネルギーを調整し、合成形状周波数表現を提供するように構成された包絡線整形器を備える。
【0007】
実施形態によれば、周波数表現の異なる部分は、同じまたは異なる数の周波数ビンを含む。同じ数の周波数ビンは、同じ処理時間を可能にし得て、異なる数の周波数ビンは、アプリケーション要件への適応を可能にし得る。
【0008】
実施形態によれば、相関除去器は、オーディオ信号の周波数表現を位相シフトするように、または位相シフトされたオーディオ信号を取得するために時間領域においてオーディオ信号を位相シフトするように構成された位相シフタを備える。位相シフトは、知覚される残響、したがって高いオーディオ品質を可能にし得る。
【0009】
実施形態によれば、位相シフタは、オーディオ信号の周波数表現を位相シフトするように構成され、複数のオールパスフィルタを備え、各オールパスフィルタは、オーディオ信号の周波数表現の関連部分を位相シフトするように構成される。すなわち、オールパスフィルタは、高い全体的なオーディオ品質を可能にし得るオーディオ信号のそれぞれの部分に関連付けられて適合され得る。
【0010】
実施形態によれば、複数のオールパスフィルタのうちの1つのオールパスフィルタは、互いに直列に接続された、すなわちシュレーダーIIRフィルタを使用したオールパスフィルタ構造のセットを備える。オールパスフィルタ構造は、異なる時間遅延を提供するように適合される。代替的または追加的に、オールパスフィルタ構造は、入れ子状のオールパスフィルタ構造を備える。
【0011】
実施形態によれば、オールパスフィルタ構造の数および/またはオールパスフィルタ構造の回路は、異なるオールパスフィルタ間で同等であるかまたは異なる。これは、相関除去器の高い柔軟性を可能にする。
【0012】
実施形態によれば、異なる時間遅延は、オーディオ信号の周波数表現を取得するために使用されるローカルサンプリングレートの素数倍に基づく。これは、高い知覚オーディオ品質を可能にする。
【0013】
実施形態によれば、オールパスフィルタ構造のセットは、いくつかの4つのオールパスフィルタ構造を備え、1、2、3、および5時間単位の遅延を提供するように適合される。そのような時間単位は、周波数領域への変換のブロックサイズに基づき得る。例えば、50%のオーバーラップを有する256のブロックサイズを使用すると、時間単位は、48kHz=2.7msで128サンプルをもたらし得る。合理的な他の時間単位は、例えば、32または64サンプルまたは他の値であり得る。時間単位は、後続の時間/周波数包絡線整形において十分な時間分解能を可能にするのに十分短いことが好ましい。代替的な解決策では、4つのオールパスフィルタ構造によって1、3、5、および7の遅延が提供される。これは、時間領域におけるオーバーラップを回避することを可能にする。
【0014】
実施形態によれば、オールパスフィルタのゲイン係数は、許容範囲内の0.7の大きさ、すなわち正または負の値を有する値に適合される。許容範囲は、例えば、20%、10%または5%である。
【0015】
実施形態によれば、位相シフタは、時間領域においてオーディオ信号を位相シフトするように構成され、位相シフタは、互いに直列に接続されたオールパスフィルタ構造のセットを備え、オールパスフィルタ構造は、異なる時間遅延を提供するように適合される。代替的または追加的に、オールパスフィルタ構造は、入れ子状のオールパスフィルタ構造を備える。
【0016】
実施形態によれば、異なるオールパス時間遅延は、オーディオ信号の周波数表現を取得するために使用されるサンプリングレートの逆数の素数倍に基づく。周波数領域と同様に、時間領域においても対応する利点が得られ得る。時間領域では、異なる時間遅延は、最小素数のセット、例えば、1つの例示的なセットとしての1、2、3および5、または別の例示的なセットとしての1、3、5および7のそれぞれに、中間結果を取得するためにオーディオ信号の周波数表現の部分を生成し、中間結果に対して次の素数を使用するために使用されるダウンサンプリング係数を乗算することによって得られる素数に基づき得る。次の素数として、例えば、次の大きいまたは次の小さい素数値を得るために、最も近い距離が理解され得る。所与の例では、値131、257、383および641は、第1のセットに対して取得されてもよく、131、383、641および907は、第2の例のセットに対して取得されてもよい。ここで、1つの時間単位は、1サンプルであり得る。サンプルは、例えば48kHzであるサンプリング周波数に関連し得る。他の実施形態では、サンプリング周波数は、44.1kHzまたは32kHzまたは他の値であってもよい。
【0017】
実施形態によれば、相関除去器は、包絡線整形器のオーディオ信号からオーディオ信号の周波数表現を取得するための第1の変換ユニットを備え、残響オーディオ信号から周波数表現を取得するための第2の変換ユニットを備え、周波数表現の部分は、残響オーディオ信号から周波数表現の部分を形成する。これは、相関除去器において直接形成される使用済み信号を生成することを可能にする。
【0018】
実施形態によれば、相関除去器は、周波数表現のサブセットまたは全ての部分に対して同じ所定の遅延をさらに実装するように適合される。すなわち、それぞれの部分または遅延線に等しい遅延はまた、関連部分のそれぞれの遅延線の単純な遅延ユニットを可能にする共通の遅延モジュールに共通に適用され得る。
【0019】
実施形態によれば、複数の遅延ユニットのうちのスペクトル部分に関連付けられた遅延ユニットは、他のスペクトル部分に関連付けられた遅延ユニットと比較して異なるように周波数表現の関連部分を遅延させるように構成される。これは、異なる周波数部分を異なるように扱うことによって高い知覚品質を可能にする。
【0020】
実施形態によれば、遅延ユニットは、より高い周波数を含む周波数表現の部分と比較した場合に、より低い周波数を含む周波数表現の部分をより高い時間遅延によって遅延させるように構成される。
【0021】
実施形態によれば、異なる時間遅延間の関係は、線形、対数、および/またはサブバンドサンプルの丸めに基づく。これは、高い知覚品質を可能にする。
【0022】
実施形態によれば、相関除去器は、時間ブロックごとの離散フーリエ変換、DFT、または短時間フーリエ変換、STFTを実行することによってオーディオ信号またはオーディオ信号の残響バージョンを部分に変換することを受信するための変換ユニットを備え、変換ユニットは、許容範囲内で50%のオーバーラップを有するブロックを変換するように構成される。そのようなブロックごとの変換は、得られるそれぞれの部分の短い遅延、および異なる部分の並列処理を可能にする。
【0023】
実施形態によれば、包絡線整形器は、サブバンド領域において4ミリ秒未満の時間分解能で動作するように構成される。
【0024】
実施形態によれば、相関除去器は、合成整形された周波数表現に基づく信号を、例えばモノラル信号として受信し、モノラル信号を少なくともステレオ信号に処理するように構成された信号処理段を備える。これは、聴取者の向上した知覚を可能にする。
【0025】
実施形態によれば、相関除去器は、合成整形された周波数表現を少なくともステレオ信号に処理し、例えば周波数領域において、少なくともステレオ信号に基づいてソース拡張モデリングするように構成された信号処理段を備える。
【0026】
実施形態によれば、処理システムは、本明細書に記載の相関除去器と、中央/側分解信号を左/右分解信号に変換するための処理段とを備える。
【0027】
実施形態によれば、処理システムは、エコー、例えば、過渡現象によって引き起こされるプレエコーおよび/またはポストエコーを抑制するために過渡現象抑制を実行し得る。そのような過渡現象処理は、相関除去器の出力をミュートすることと、それに対応して、左/右分解信号の一部を提供し、相関除去器と並列であり、処理段と接続されている遅延補償ユニットの出力を増幅することと、を含み得る。
【0028】
実施形態によれば、本方法は、オーディオ信号に基づく周波数表現の複数の部分を受信することと、複数の遅延部分を提供するために受信部分のそれぞれを遅延させることと、周波数表現の遅延部分に基づく信号を受信および合成することと、を含む。本方法は、オーディオ信号の周波数表現を受信することと、オーディオ信号の周波数表現に関して遅延部分のエネルギーを調整することと、を含む。合成整形された周波数表現が提供される。
【0029】
実施形態によれば、コンピュータ上で実行されると、そのような方法を実行するために、それぞれの命令を実行するための命令を記憶したコンピュータプログラムもしくはコンピュータプログラム製品または非一時的記憶媒体が提供される。
【0030】
さらなる有利な実施形態は、従属請求項に定義されている。
添付の図面を参照しながら、有利な実施形態をより詳細に説明する。
【図面の簡単な説明】
【0031】
【
図1】実施形態にかかる相関除去器の概略ブロック図を示している。
【
図2】実施形態にかかる時間領域信号の周波数表現を生成するための変換ユニットを備える相関除去器の概略ブロック図を示している。
【
図3】実施形態にかかる事前遅延をさらに含む相関除去の概略ブロック図を示している。
【
図4】実施形態にかかるオールパスフィルタの概略ブロック図を示ししている。
【
図5】実施形態にかかる入れ子状のオールパスフィルタ構造の概略ブロック図を示している。
【
図6】実施形態にかかる時間領域において動作するように構成された位相シフタを備える相関除去器の概略ブロック図を示している。
【
図7】実施形態にかかるソース拡張モデリングに接続されている相関除去器の概略ブロック図を示している。
【
図8】実施形態にかかる処理システムの概略ブロック図を示している。
【
図9】実施形態にかかる過渡現象処理のために構成された処理システムの概略ブロック図を示している。
【
図10】実施形態にかかる方法の概略ブロック図を示している。
【発明を実施するための形態】
【0032】
等しいまたは同等の要素または同等または均等の機能を有する要素は、異なる図で発生する場合であっても、同等または均等の参照符号によって以下の説明で示されている。
【0033】
以下の説明では、本発明の実施形態のより完全な説明を提供するために、複数の詳細が示されている。しかしながら、本発明の実施形態がこれらの特定の詳細なしで実施され得ることは当業者にとって明らかであろう。他の例では、本発明の実施形態を曖昧にすることを回避するために、周知の構造および装置が詳細ではなくブロック図の形態で示されている。さらに、以下に説明する異なる実施形態の特徴は、特に明記しない限り、互いに組み合わせられ得る。
【0034】
図1は、実施形態にかかる相関除去器10の概略ブロック図を示している。相関除去器10は、n>1である少なくとも2個の遅延ユニット12
1から12
nを備える。
図1は、2つの遅延ユニット12の数を示しているが、その数は、より多いことが好ましく、例えば、4、8、16、または2の累乗で得られる他の値であり、実施形態は、そのような数に限定されない。すなわち、実施形態はまた、3、5、7または9個の遅延ユニット12を備えてもよい。各遅延ユニットは、オーディオ信号に基づく周波数表現14の関連部分14
1から14
nを受信するように構成される。例えば、周波数表現14は、離散フーリエ変換、DFT、または短期フーリエ変換、STFTなどのフーリエ変換によって得られるスペクトルであってもよく、またはそれを含んでもよい。部分14
1から14
nは、例えば、スペクトルのサブバンド、すなわち周波数領域表現の部分として得られ得る。例えば、そのような部分14
1から14
nは、適切な窓を使用することによって得られ得る。
【0035】
各遅延ユニット121から12nは、遅延部分14’1から14’nを提供するように、すなわち時間領域において遅延を有するように、受信部分141から14nを遅延させるように構成される。
【0036】
相関除去器10は、遅延部分14’1から14’nに基づく信号を受信するように構成された包絡線整形器16をさらに備える。そのような信号は、遅延部分14’1から14’n自体またはその処理された変形であってもよい。包絡線整形器16は、受信信号を合成するように構成される。さらに、包絡線整形器は、オーディオ信号の周波数表現14を受信するように構成される。包絡線整形器16は、オーディオ信号の周波数表現14に関して遅延部分14’1から14’nのエネルギーを調整するように構成される。包絡線整形器16は、合成整形された周波数表現18を提供するように構成される。合成整形された周波数表現18において、それぞれの部分141から14n、それぞれその結果生じる信号は、互いに関しておよび/または周波数表現14に関して相関除去され得る。
【0037】
包絡線整形器16は、合成周波数表現14を受信するように示されているが、代替として、包絡線整形器16は、遅延されない可能性があるか、または一般的に処理される部分141から14nを受信することによってそれぞれの情報を受信してもよい。
【0038】
図2は、実施形態にかかる相関除去器20の概略ブロック図を示している。相関除去器20は、オーディオ信号22を受信するように構成される。相関除去器20は、
図1に示す周波数表現14を生成するように構成された変換ユニット24を備え得る。変換ユニット24は、例示的なSTFTによって得られる部分14
1から14
16を提供し得る。例えば、周波数表現は、合計129個の周波数ビンを含み得る。あるいは、128個のビンが使用されてもよい。例えば、いわゆる「偶数積み重ね」および「奇数積み重ね」の2種類のデジタルフーリエ変換(DFT)が使用され得る。例えば、「標準」DFTとして、偶数積み重ねバージョンは、提供される例では129バンド(127複素数、1つの実数および1つの虚数)を有すると見なされ得る。奇数積み重ねは、128個の(複素数)バンドを含み得る。本明細書に記載の実施形態では、両方の変換が使用されることができる。部分14
1から14
16は、部分的にまたは完全に、同じまたは異なる数のビンを含み得る。例えば、部分14
1は、第1から第9のビン、例えば9つのビンを含んでもよい。部分14
2は、例えば、ビン10から19、したがって10個のビンを含む。ビンの数に関する適合または選択は、図示の例では48kHzであるサンプリング周波数、例えば50%であるオーバーラップ、および/または生成される部分14
1から14
16の数に基づき得る。部分14
1から14
16は、いくつかまたは全ての部分14
1から14
16が同じ数の周波数ビンを含むように生成され得るように、等しい数または異なる数の周波数ビンを含み得る。
【0039】
相関除去器20は、遅延線121から1216を有する遅延セクション25をさらに備え、各遅延線121から1216は、特定の部分141から1416に関連付けられ、前記部分、その処理済みバージョンをそれぞれ受信するように構成される。遅延ユニット121から1216は、それぞれのスペクトル部分141から1416に関連付けられてもよい。そのような遅延ユニット121から1216は、他のスペクトル部分に関連する遅延ユニットと比較した場合に、周波数表現14の関連部分を異なって遅延させるように構成され得る。代替的または追加的に、異なる時間遅延間の関係は、線形、対数、および/またはスーパーバンドサンプルの丸めに基づくもののうちの1つであってもよい。
【0040】
相関除去器20は、遅延セクション25に結合されている位相シフタ26をさらに備え、位相シフタ26は、遅延部分14’1から14’16を受信するように構成される。位相シフタ26を使用する位相シフトは、信号部分における残響を可能にし得る。しかしながら、実施形態によれば、遅延セクション25および残響セクション26のシーケンスはまた、それぞれの部分141から1416が最初に残響フィルタの対象となり、その後遅延されるように変更されてもよい。
【0041】
位相シフタ26は、オーディオ信号の処理された、例えば遅延されたバージョンの周波数表現14を位相シフトするように構成されてもよい。位相シフトはまた、オーディオ信号22を周波数領域に変換する前に実行されてもよく、対応する位相シフタは、位相シフトされたオーディオ信号を得るために時間領域においてオーディオ信号22を位相シフトするように構成されてもよい。位相シフタ26がオーディオ信号14の周波数表現、その遅延バージョンをそれぞれ位相シフトするように構成されている短い構成では、位相シフタは、複数のオールパスフィルタ281から2816を備え得る。図示の例では、オールパスフィルタ281から2816は、遅延部分14’1から14’16を受信するように構成される。オールパスフィルタという用語は、通過される周波数範囲がそれぞれの部分141から1416の周波数範囲に対応すると理解されるべきである。ここで、これは、オールパスフィルタ281から2816のそれぞれが周波数表現で提供される完全な周波数範囲を通過する例を含んでもよく、異なるオールパスフィルタ281から2816の通過バンドはまた、それぞれの部分141から1416に含まれる異なる周波数ビンに基づいて互いに異なってもよい。
【0042】
オールパスフィルタ281から2816のそれぞれは、オーディオ信号の周波数表現の関連部分を位相シフトするように構成される。
【0043】
すなわち、オールパスフィルタ構造の数および/またはオールパスフィルタ構造の回路は、同じであってもよく、すなわち、等しいかまたは同等であってもよく、あるいは、異なるオールパスフィルタ281から2816の間で異なってもよい。
【0044】
遅延線12
1から12
16によって提供される時間遅延は、異なる部分14
1から14
16に対して同じであっても異なってもよい。
図2に示すように、より低い周波数を含む周波数表現の部分は、より高い周波数を含む周波数表現の部分と比較して、より高い時間遅延で遅延され得る。ビン1からより高いビンまで、表される周波数は増加し得る。z領域において表されるように、時間遅延は、周波数の増加とともに減少し得る。
【0045】
信号321から3216は、例えばオールパスフィルタ281から2816の出力として、遅延および位相シフトの結果を含み得る。
【0046】
包絡線整形器16は、信号321から3216およびそのフィルタ処理されておらず遅延されていないバージョン、すなわち部分141から1416、すなわちオーディオ信号22の周波数表現を受信するように構成され得る。部分141から1416は、サブバンドとして理解され得る。包絡線整形器16は、サブバンド領域で動作するように構成されてもよい。例えば、包絡線整形器16の時間分解能は、せいぜい4ミリ秒以下、例えば、4ミリ秒、3.5ミリ秒、3ミリ秒以下であってもよい。
【0047】
相関除去器20は、変換ユニット24と比較した場合に逆演算を提供し得る別の変換ユニット35を備えてもよい。例えば、変換レート34は、逆短期フーリエ変換iSTFTを行ってもよい。合成形状周波数表現18は、合成形状周波数表現18が変換ユニット24の出力に対応して処理され得るように、ビンのそれぞれに存在する周波数領域に関する情報を含み得る。すなわち、変換ユニット34は、周波数表現14の部分141から1416の処理済みバージョンを受信し、例えばオーバーラップ加算手順に基づいて処理済みバージョン14’1から14’16から合成信号36を合成し得る。信号36は、例えば、相関除去器20のインターフェース38において提供されてもよい。
【0048】
包絡線整形器16は、時間および/または周波数においてスペクトルビンを整形するように構成されてもよい。整形は、個々のビンおよび/またはビンのグループに対して、例えば相互依存または少なくともグループごとの共通の整形処理を実装することによって、包絡線整形器26によって実行され得る。
【0049】
変換ユニット24を再び参照すると、オーディオ信号22またはその残響バージョンを受信して部分141から1416に変換するように構成されてもよく、16個は例にすぎない。オーディオ信号22の残響バージョンは、位相シフタ26が時間領域において動作する場合の入力であってもよく、したがって変換ユニット24の上流に配置されてもよい。変換ユニット24は、時間ブロックごとの離散フーリエ変換、DFT、または短時間フーリエ変換、STFTを実行し得る。変換ユニットは、例えば公差範囲内で50%のオーバーラップを有するブロックを変換するように構成されてもよい。例えば、許容範囲は、可能な限り0%、最大5%、最大10%、最大15%またはそれ以上であってもよい。
【0050】
ブロックは、例えば、128サンプル、256サンプル、または512サンプルのブロック長を含んでもよく、256の値が好ましい場合がある。
【0051】
図3は、相関除去30の概略ブロック図を示している。相関除去器20と比較すると、相関除去器30は、事前遅延42をさらに含み得て、事前遅延という用語は、任意の特定のブロックの直前または直後に実装される遅延を制限しない。事前遅延42は、包絡線整形器16の前の任意の段階、好ましくは変換ユニット24の後の周波数領域において動作するときに配置されてもよい。すなわち、例えば、残響または位相シフタ26のオールパスフィルタと事前遅延42との間のシーケンスは、
図3の図と比較した場合に入れ替えられてもよい。事前遅延42または遅延ブロック42は、周波数表現の部分14
1から14
16のサブセットまたは全てに対して同じ所定の遅延をさらに実装するように構成され得る。これは、この段階で処理を組み合わせるために各部分14
1から14
16またはそのグループに対する同じ遅延の実装を可能にし得て、ブロック42において実装された共通遅延とは異なるようにおそらく個別の遅延を追加するために遅延線12
1から12
16を使用し得る。一例では、事前遅延42は、全てのスペクトルバンドに対して一定の事前遅延を可能にするように構成される。
【0052】
図4は、相関除去器20および/または30のフィルタ28
1から28
16のうちの1つの少なくとも一部として動作され得る実施形態にかかるオールパスフィルタ40の概略ブロック図を示している。オールパス40は、例えば、シュレーダーIIRフィルタの構造を含み得て、オールパスフィルタ40の入力信号44に基づくそれぞれの出力信号54を提供するために、遅延ブロック52と組み合わせた逆方向分岐48と組み合わせた順方向分岐46を含み得る。相関除去器20および/または30のオールパスフィルタ28は、互いに直列に接続されたそのようなオールパスフィルタ40のうちの1つまたは複数を含み得る。異なるオールパスフィルタ28
1から28
16に異なる時間遅延を提供するために、異なる数のオールパスフィルタ構造14が直列に接続され得る。
換言すれば、
図4は、オールパスフィルタ段を示している。
【0053】
図5は、入れ子状のオールパスフィルタ構造であるオールパスフィルタ構造50の概略ブロック図を示している。代替的に、またはオールパスフィルタ構造40に加えて、1つまたは複数のオールパスフィルタ構造50は、相関除去器20および/または30のオールパスフィルタ28
1から28
16の少なくとも一部を形成し得る。2つの遅延ブロック52
1および52
2を示しているが、異なる、特により多数の遅延ブロック52が存在してもよく、その結果、場合によっては、順方向分岐46および/または逆方向分岐48の数が増加する。さらに、ゲインg
1/-g
1および/またはg
2/-g
2が採用されてもよい。
【0054】
例えば、遅延ブロック52を1つ以上のオールパスフィルタ構造40および/または1つ以上のオールパスフィルタ構造50に直列に接続することを考慮すると、異なるオールパスフィルタ281から2816は、他のオールパスフィルタと比較して異なる時間遅延を含むように実装されてもよい。例えば、異なるオールパスフィルタ構造および/またはオールパスフィルタ構造の回路の異なる遅延は、オーディオ信号22の周波数表現14を取得するために使用されるローカルサンプリングレートの素数倍、例えば48kHzに基づき得る。例えば、オールパスフィルタの少なくとも一部を形成するオールパスフィルタ構造のセットは、4個のオールパスフィルタ構造、例えばオールパスフィルタ構造40を備え得る。その中の異なる遅延ブロックは、1、2、3、および5の遅延を提供するように適合され得る。別の例によれば、4つのオールパスフィルタ構造の数は、z領域において1、3、5、および7単位の遅延を提供し得る。これらの値は、素数値のセットを形成してもよく、すなわち、2、3、4、5またはそれ以上の数の素数値がグループ化されてもよい。
【0055】
この実施形態、素数値のセットを時間領域におけるオールパスフィルタの可能な動作にそれぞれ転送するとき、時間遅延は、実施形態においてオーディオ信号の周波数表現を取得するために使用されるサンプリングレートの逆数の素数倍に基づく。例えば、異なる時間遅延は、上述した素数のセット、例えば1、2、3および5または1、3、5および7のそれぞれに、中間結果を得るためにオーディオ信号の周波数表現の部分を生成するために使用されるダウンサンプリング係数を乗算することによって得られる素数に基づき得る。中間結果の代わりに、中間結果に対する次の素数が使用されてもよい。例えば、128のダウンサンプリング係数を参照し、上記の素数のセットを考慮すると、そのような結果は、一方では131、257、383および641、他方では131、383、641および907の遅延であり得て、各遅延は、48kHzのサンプリングレートの場合、約20.8μsであるサンプリングレートにおける1サンプルとの乗算に関連し得る。他の素数のセットが制限なく可能である。
【0056】
例えば、
図4を参照すると、オールパスフィルタのゲイン係数gは、例えば、±20%、±10%または±5%の許容範囲内で0.7の値に適合され得る。しかしながら、ゲイン値は、上述した許容範囲内で、例えば-0.7の負の値を有してもよい。すなわち、ゲイン係数は、許容範囲内の0.7の大きさの値に適合され得る。
【0057】
換言すれば、
図4のシリアルアウトパス構成に加えて、外側のシュレーダーオールパスの遅延素子を他の内側のオールパス構成に置き換えた入れ子構成や、両者の組み合わせが実装されてもよい。
図5は、単純な入れ子状のオールパスフィルタ段を示している。
【0058】
図6は、実施形態にかかる相関除去器60の概略ブロック図を示している。相関除去器60は、時間領域において動作するように構成された位相シフタ26を備える。オールパスフィルタ構造28’は、相関除去器20および/または30に関連して説明したように、素数のセットと比較した場合にそれぞれの次の素数を使用するように構成され得る。相関除去器60の正確な動作を保証するために、変換ユニット24
1および24
2を備え得る。変換ユニット24
1は、オーディオ信号の周波数表現を提供し得るが、変換ユニット24
2は、位相シフタ28’によって提供される残響オーディオ信号または位相シフトオーディオ信号22’を受信し得る。得られた部分14’’
1から14’’
16は、時間領域ベースの残響を可能にしながら、相関除去器20および/または30と比較した場合に包絡線整形器16の同等の入力に到達する遅延ユニット12
1から12
16によって遅延され得る。すなわち、周波数表現の部分は、残響オーディオ信号22’から周波数表現の部分を形成し得る。
【0059】
実施形態によれば、本明細書に記載されるような相関除去器は、さらなる機能と組み合わされてもよく、すなわち、出力信号は、さらに処理されてもよい。
換言すれば、
図6は、
図2に関する相関除去器の代替的な実装を示している。
【0060】
さらに、本発明の相関除去器は、過渡現象処理プロセスと組み合わせられてもよい。過渡現象は、エコー後または望ましくないパンニング効果などの相関除去ステレオ信号にアーチファクトを引き起こすことがある。これを緩和するために、過渡現象処理が本明細書に記載の相関除去器と組み合わせられることができる。過渡現象処理は、直接開始波形を保存し、事前遅延によって引き起こされるエコー後を抑制するために、相関除去器出力をミュートし得る。
【0061】
図7は、実施形態にかかる相関除去器70の概略ブロック図を示している。相関除去器70は、相関除去器10の少なくとも一部を備え、代替的または追加的に、相関除去器20、30および/または60の少なくとも一部が配置されてもよい。相関除去器70は、合成整形された周波数表現18またはそれに基づく信号を処理するように構成された信号処理段56を備え得る。合成整形された周波数表現18は、モノラル信号と考えられ得て、すなわち、単一のチャネルを表し得る。受信されたモノラル信号から、処理段は、少なくともステレオ信号を表す信号58
1および58
2を提供し得る。
【0062】
点音源のモノラル信号およびその相関除去バージョンから空間的に拡張された音源の知覚効果をモデル化するソース拡張器58が相関除去器70に結合されてもよい。ソース拡張器58は、信号58
1および58
2を有するステレオ信号に基づいてソース拡張モデリングを可能にするフィルタ64
1から64
2を備え得る。ソース拡張モデリングは、例えば、周波数領域において実行され得て、ステレオ出力信号64
1、例えば、左チャネルおよび64
2、例えば、右チャネルをもたらし得る。ソース拡張器58はまた、相関除去器70の一部を形成してもよいことに留意されたい。
換言すれば、
図7は、ソース拡張処理の概略ブロック図を示している。
【0063】
図8は、実施形態にかかる処理システム80の概略ブロック図を示している。処理システム80は、相関除去器10を備え得る。代替的または追加的に、相関除去器20、30、60および/または70が配置されてもよい。処理システム80は、中央/側分解信号68を左/右分解信号72に変換するように構成された処理段66を備える。すなわち、中央/側分解信号68は、例えば中央/中間または側部分の一方を表す少なくとも第1の信号74
1と、他方を表す第2の信号74
2とを含み得る。処理段66は、信号74
1から74
2および場合によっては追加の信号を、少なくとも左チャネルおよび右チャネルを表す信号76
1から76
2に変換するように構成され得る。1つのチャネル、例えば左チャネルLは、例えば中間成分Mと側成分M+Sとを加えることによって得られ得る。他方、例えば右チャネルは、一方の成分を他方の成分から減算すること、例えばM-Sによって得られ得る。異なる手法によれば、両方のチャネルは、その50%または0.5倍、すなわち0.5(M+S)および0.5(M-S)を使用することによって得られ得る。他の係数および/または決定規則も可能である。
【0064】
実施形態によれば、信号741は、処理システム80の相関除去器によって提供される。他の信号742は、相関除去器10に並列に接続され、オーディオ信号22も受信するように構成された遅延補償ユニット78によって提供されてもよい。したがって、遅延補償ユニット78は、処理段66に接続される。遅延補償ユニット78は、相関除去器に匹敵する時間遅延を提供するように構成されてもよい。好ましくは、周波数領域の実施形態では、遅延は、相関除去器のSTFT分析/合成によって導入される処理遅延に等しい。しかしながら、相関除去器10は、信号742が信号741と比較した場合に同様の遅延を含み得るように、相関除去につながる追加の信号処理を提供し得る。実施形態によれば、信号742は、時間遅延を除いて未処理であり得る。
【0065】
処理システム80内の相関除去器10は、中央/側分解信号の少なくとも一部として合成整形された周波数表現を処理段66に提供し得る。処理段66は、合成整形された周波数表現を遅延信号742とともに周波数領域において左/右分解信号に変換し得る。処理段66の出力は、L/R信号72であってもよい。相関除去器10自体は、モノラル信号S(側面、成分18)を生成してもよく、その点において、それはその一部にすぎない。過渡現象処理では、信号Sがミュートされ、増幅されたM信号(信号74’2)によって「置き換えられる」ため、直接部分M(742;74’2)と相関除去器出力S(信号18)とが密接に結合され得る。結果として、両方のユニット、相関除去器および「アップミキシングユニット」66は、密接に結合され、したがって、処理段66は、最終的に相関除去ステレオ信号を提供する。例えば、処理段66なしで、相関除去器がモノラル出力で独立して動作される場合、遅延補償された直接信号は、いかなるスケーリングもなしでモノラル出力に直接追加されて、ミュートされたギャップを満たし、「完全な」信号を提供する必要がある。
【0066】
換言すれば、
図8は、モノ(中間信号)入力の遅延補償を伴うM/SからL/Rへのセットアップにおける相関除去器を示している。
【0067】
図9は、実施形態にかかる処理システム90の概略ブロック図を示している。処理システム80と比較すると、処理システム90は、相関除去器の入力においてオーディオ信号22またはその周波数表現14における過渡現象を検出するように構成された過渡現象抑制器82を備える。過渡現象抑制器は、オーディオ信号22またはその周波数表現を受信するように構成された過渡現象検出ユニット84を備え得る。過渡現象検出ユニット84は、例えば、オーディオ信号22を処理することによって、オーディオ信号の過渡現象を検出し得る。過渡現象抑制器82は、合成整形された周波数表現18を受信し、制御信号に基づいてこれをミュートするように構成されたミュートユニット86をさらに備え得る。しかしながら、相関除去器10または相関除去器の出力をミュートするように処理システム90に含まれる相関除去器を制御する場合にも、同じまたは同等の効果が得られ得ることに留意されたい。すなわち、ミュートユニット86はまた、相関除去器の一部を構成していてもよい。しかしながら、処理段66の入力を形成する信号74
1は、オーディオ信号22において検出された過渡現象に基づいてミュートされてもよい。過渡現象抑制器82は、処理段66においてエコーを抑制するために、相関除去器によって提供される部分を一時的にミュートするように構成されてもよく、エコーは、プレエコーおよび/またはポストエコーに関連してもよい。時間領域において動作する場合、ミュートによって引き起こされる追加の過渡現象を回避するために、ソフトミュートのための窓が使用され得る。周波数領域において行われる場合、相関除去器20、30、および60に関連して説明されているSTFT窓処理は、自動的に、すなわち相乗的に、そのような効果を提供し得る。
【0068】
処理段66に関して、相関除去器10の出力をミュートすることは、信号処理段66の入力エネルギーの望ましくないシフトをもたらすことがある。悪影響を回避するために、遅延補償ユニット78と信号処理段66との間に増幅器82が接続されて、信号742を一時的に増幅して増幅信号74’2を得てもよい。信号742の増幅は、相関除去器10の出力をミュートすることを条件としてもよい。すなわち、過渡現象抑制器82は、相関除去器の部分をミュートすることに対応する遅延補償ユニット78の部分を増幅するように構成されてもよい。
【0069】
増幅のレベルは、固定されてもよく、または制御されてもよい。一例によれば、適用される場合、増幅器82の増幅率は、相関除去器のミュートされていない部分と比較した場合に、
の率であり得る。すなわち、相関除去器の出力をミュートするとき、増幅器88は、
によって信号74
2を増幅し得るが、ミュートがオフである時間、すなわち、g=1の間は信号74
2を増幅しない。
【0070】
任意に、且つ過渡現象抑制中の望ましくない影響を回避するために、過渡現象抑制器82は、オーディオ信号内の検出された過渡現象を抑制し、所定の抑制時間よりも早くない後続の過渡現象を抑制するように構成されてもよい。例えば、過渡現象抑制器82は、保持時間、ヒステリシス、および/または抑制時間を制御および/または適用するように構成された制御ユニット92を備えてもよい。例えば、保持時間は、阻害時間に比べて短くてもよい。保持時間は、検出された過渡現象、すなわち過渡現象検出ユニット84によって決定された特性に応答して、相関除去器10の出力がミュートされる時間に関連し得る。阻害時間は、望ましくない影響を回避するために、保持時間と比較してより長くてもよい。例えば、ホールドカウンタ、すなわちミュートのための時間は、1、2、4、6、7または8ブロックであってもよいが、阻害時間は、その時間の少なくとも2倍、例えば、少なくとも14、少なくとも20、少なくとも30または56ブロック、または他の任意の持続時間であってもよい。
【0071】
例によれば、制御ユニット92はまた、低レートパルス列のようなオーディオ信号の過渡現象抑制のオン/オフトグルを緩和するためのヒステリシスを提供し得る。すなわち、制御ユニット92によって提供される阻害時間は、第1の阻害時間であってもよい。過渡現象抑制器82は、第1の阻害時間の間に過渡現象が発生した場合に、第1の阻害時間よりも長い第2の阻害時間として阻害時間を再開するように構成されてもよい。すなわち、保持時間は経過したが、阻害時間はまだ経過しておらず、新たな過渡現象が判定された場合(保持時間が経過したか否かにかかわらず)、阻害タイマが再開され得る。任意に、再開された阻害タイマは、キャンセルされた阻害タイマと比較してより長くてもよい。換言すれば、非常に最初の過渡現象が検出されると、保持カウンタおよび阻害カウンタの両方が開始される。過渡現象は、ホールドカウンタがその停止カウント、例えば8ブロックに到達するまでミュートされ得る。そして、ホールドカウンタがリセットされ、ミュートが停止され得る。阻害カウンタは、時間的にかなり遅れて、例えば56ブロックでその停止カウント/リセットに到達し得る。前記進行中の阻害カウントプロセス中に新たな過渡現象が検出された場合、阻害カウンタのみが再開されるが、停止カウント値はより高く、例えば64ブロックである。このように、ヒステリシスは、条件付きスイッチングおよび停止カウント修正によって実装される。すなわち、阻害カウンタ実行中に、過渡現象抑制またはミュートの新たなトリガが無効にされ得る。
【0072】
過渡現象抑制器82は、周波数領域において動作するように構成されてもよい。代替的または追加的に、過渡現象抑制器82は、相関除去器の事前遅延と比較して、より長い時間、相関除去器の部分をミュートするように構成されてもよい。すなわち、オーディオ信号22において過渡現象が検出された場合、過渡現象が相関除去器の出力に到達したときにミュートは依然として有効であるべきである。
【0073】
換言すれば、実施形態にかかる相関除去器は、短い持続時間を有するオーバーラップする変換ブロック上で短時間フーリエ変換(STFT)領域において動作する。これは、48kHzのサンプルレートで13.3ミリ秒の遅延時間に到達し得る[2]または[3]に記載されたPS/MDS相関除去器の高い遅延とは対照的に、数ミリ秒、例えば256および48kHzのサンプルレートの変換サイズを想定した2.7ミリ秒の小さい処理遅延を可能にする。さらに、記載された相関除去器は、非常に低い計算オールパスフィルタを使用して実装されることができ、したがって、[1]または[2]に記載された時間領域相関除去よりも計算上はるかに効率的であり得る。さらなる下流スペクトル処理、例えばソース拡張モデリングが必要であるかまたは望まれる場合、記載された相関除去器は、低い計算複雑度を達成するためにSTFT領域内のこの処理段に直接インターフェース接続され得る。
【0074】
したがって、本明細書に記載の相関除去器は、短い処理遅延および中程度の計算複雑度を提供し得る。相関除去器は、空間次元を有するオーディオオブジェクトをモデル化するための追加の下流処理、いわゆる「音源拡張」の知覚特性を有する空間拡張音源(SESS)と組み合わせられることができる。
【0075】
換言すれば、
図2および
図9は、本発明の好ましい実施形態を示している。最初に、入力信号またはオーディオ信号(例えば、点音源の音)は、例えば256サンプルブロック長および例えば50%オーバーラップを有する時間ブロックごとのDFTを含む相関除去器20に供給され得る。次に、DFTのスペクトルビンは、周波数依存持続時間にわたって時間遅延され、低周波数は、より高い遅延を有し得て、高周波数は、より低い遅延を有し得る。例えば、遅延は、低周波数では16個のサブバンドサンプル(48kHzで42.7ミリ秒)であり得て、最高ビン、すなわちz
-1では1個のサブバンドサンプルまで減少し得る。経時的な遅延の減少は、線形、対数、またはさもなければサブバンドサンプルの整数への丸めであり得る。次に、各ビンは、好ましくは単純なオールパスフィルタのチェーンまたは入れ子状のオールパスフィルタ構造を備える、オールパスフィルタを介して送られる。オールパスフィルタの例が
図4に示されている。異なる構造が
図5に示されている。
図4に関して、1つの可能なチェーンは、4つのそのようなオールパスフィルタを含むかまたはそれからなり得る。パラメータgは、例えば0.7であるように選択されてもよく、遅延M
iは、素数であってもよい。
図4は、チェーンのまさに最初の部分、すなわちM
1を示すことに留意されたい。これらのフィルタは、ダウンサンプリングされたスペクトルバンド、例えばダウンサンプリング係数128で動作し得るため、遅延は非常に低く、例えば素数1、2、3および5、または別の例として、1、3、5および7であり得る。続いて、時間/周波数包絡線整形が適用され得る。包絡線整形への入力信号は、直接DFTビンおよびそれらの遅延およびフィルタリングされたバージョンであってもよい。最後に、オーバーラップ加算を伴うIDFTは、出力信号を合成し得る。出力信号は、
図8に示されるような構成において、モノラル入力信号から左/右ステレオ信号を得るために時間領域においてさらに処理されてもよい。あるいは、左/右ステレオ信号は、DFT周波数領域において組み立てられ、全体的な計算効率に有益であれば、例えば、高速畳み込みによるソース拡張/SESSモデリングのために、周波数領域においてさらに処理されることができる。ソース拡張モデリングの構成が
図7に示されている。他の実施形態とは対照的に、遅延M
iを有する代替的な実施形態は、サブバンド領域において選択されたものよりも約128倍大きい素数、例えば、131、257、383および641(素数値1、2、3および5のセットについて)または131、383、641および907(素数値1、3、5および7のセットについて)として選択されてもよい。異なる数の素数および/または異なる素数を有する素数値の異なるセットについて、対応する値が選択されてもよい。さらに、代替的な実施形態は、時間/周波数包絡線整形器に入力される直接信号を取得するために追加のSTFTを必要としてもよい。
【0076】
図9は、過渡現象処理を伴うM/SからL/Rへのセットアップにおける例示的な相関除去器を示している。これらの実施形態の態様は、以下の通りである:
・過渡現象検出は、孤立した過渡現象の存在を検出する。
【0077】
・過渡現象が検出された場合、相関除去された音は、「保持時間」の間ミュートされ、遅延補償された直接信号は、それに応じて増幅される。コヒーレント加算の効果を補償するために、2/sqrt(2)の係数が適用されて直接信号を増幅し、そこで相関除去信号を置き換える。
【0078】
・トーンとして知覚される高速パルス列のトリガを回避するために、阻害は、特定の「阻害時間」の間の次の過渡現象によるトリガを防止する。「保持時間」の間は、新たな過渡現象検出ごとに阻害時間が再開される。
【0079】
・ヒステリシスは、(例えば、再誘発された阻害の場合に「阻害時間」を増加させることによって)過渡現象検出のトグルを防止する。
【0080】
・過渡現象検出、ミュート、直接音増幅、検出阻害、およびヒステリシスは、以下のようにSTFT領域において有利に実装されてもよい:
○STFTブロックのオーバーラップは、滑らかなクロスフェードを提供する
○ミュート時間が相関除去器の事前遅延よりも長い
○相関除去信号をミュートし、直接信号を増幅するためのミュートブロックカウンタ
○過渡現象検出を阻害するための阻害ブロックカウンタ
○過渡現象検出におけるトグルを回避するためのヒステリシス
【0081】
本発明の実施形態は、以下に関する。
オーディオ信号の相関除去のための装置/方法であって、
・相関除去器であって、
○DFT/IDFTペア(周波数領域においてSESS処理と直接インターフェースされている場合は任意)と、
○サブバンド領域の遅延であって、好ましくは、低周波数がより高い遅延を有し、高周波数がより低い遅延を有し、周波数に沿った遅延分布:線形、対数などである、サブバンド領域の遅延と、
○サブバンド領域におけるオールパスフィルタであって、任意に、低周波数がより高い遅延/次数を有することができ、高周波数がより低い遅延/次数を有することができ、高次オールパスフィルタが、低次オールパスフィルタの段によって実現され得る、オールパスフィルタと、を含む、相関除去器と、
・周波数可変遅延と組み合わせて小さい整数の遅延素数を使用する(ダウンサンプリングされた)DFTサブバンド領域におけるショートシュレーダーIIRフィルタであって、
○高時間分解能(<4ms)のT/F包絡線調整器がサブバンド領域において動作し、遅延/オールパス処理前後のエネルギーを測定し、サブバンド信号のエネルギーを(可能な限り)元のサブバンド信号のエネルギーと一致するように調整する、ショートシュレーダーIIRフィルタと、
・「ソース拡張」モデリング/処理の一部としての低遅延相関除去器(MPEGサラウンド相関除去器とは対照的)と、
・計算効率のための時間またはDFT周波数領域におけるダウンストリームソース拡張処理へのインターフェースと、
・代替的な実装:遅延前のオールパスフィルタ(「遅延後」)と、を備える、装置/方法。
【0082】
図10は、例えば、本明細書に記載の相関除去器によって実装され得る実施形態にかかる方法1000の概略ブロック図を示している。方法1000は、オーディオ信号に基づく複数の部分が受信されるステップ1010を含む。1020において、複数の遅延部分を提供するために、各受信部分が遅延される。1030は、周波数表現の遅延部分に基づく信号を受信および結合することを含む。1040は、オーディオ信号の周波数表現を受信することを含む。1050は、オーディオ信号の周波数表現に関して遅延部分のエネルギーを調整することを含む。1060は、例えば包絡線整形器16を使用して、合成整形された周波数表現を提供することを含む。
【0083】
いくつかの態様が装置の文脈で説明されたが、これらの態様は、対応する方法の説明も表すことは明らかであり、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたは項目または機能の説明も表す。
【0084】
本発明の符号化された音声信号は、デジタル記憶媒体に記憶されることができるか、または無線伝送媒体などの伝送媒体またはインターネットなどの有線伝送媒体上で送信されることができる。
【0085】
特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装されることができる。実装は、電子的に読み取り可能な制御信号が記憶され、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)、例えば、フロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリなどのデジタル記憶媒体を使用して行うことができる。
【0086】
本発明にかかるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協調することができる電子的に読み取り可能な制御信号を有するデータキャリアを備える。
【0087】
一般に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実装されることができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の1つを実行するために動作する。プログラムコードは、例えば、機械可読キャリアに記憶されてもよい。
【0088】
他の実施形態は、機械可読キャリアに記憶された、本明細書に記載された方法の1つを実行するためのコンピュータプログラムを備える。
【0089】
換言すれば、本発明の方法の実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行されると、本明細書に記載された方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0090】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムをその上に記録したデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。
【0091】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、インターネットなどのデータ通信接続を介して転送されるように構成されてもよい。
【0092】
さらなる実施形態は、本明細書に記載された方法の1つを実行するように構成または適合された処理手段、例えば、コンピュータ、またはプログラマブルロジックデバイスを備える。
【0093】
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを備える。
【0094】
いくつかの実施形態では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)が使用されて、本明細書に記載の方法の機能のいくつかまたは全てを実行し得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載された方法の1つを実行するためにマイクロプロセッサと協調し得る。一般に、本方法は、好ましくは、任意のハードウェア装置によって実行される。
【0095】
上述した実施形態は、本発明の原理を単に例示するものである。本明細書に記載された構成および詳細の変更および変形は、当業者にとって明らかであろうことが理解される。したがって、本明細書の実施形態の説明および説明として提示された特定の詳細によってではなく、差し迫った特許請求の範囲によってのみ限定されることが意図されている。
【先行技術文献】
【非特許文献】
【0096】
【非特許文献1】[1] W. Oomen, E. Schuijers, B. den Brinker, and J. Breebaart, "Advances in Parametric Coding for High-Quality Audio," Paper 5852, (2003 March.)
【0097】
【非特許文献2】[2] J. Breebaart, S. van de Par, A. Kohlrausch, and E. Schuijers, "High-quality Parametric Spatial Audio Coding at Low Bitrates," Paper 6072, (2004 May.)
【0098】
【非特許文献3】QMF domain PS: [3] H. Purnhagen, J. Engdegard, J. Roden, and L. Liljeryd, "Synthetic Ambience in Parametric Stereo Coding," Paper 6074, (2004 May.)
【0099】
【非特許文献4】[4] J. Herre, K. Kjoerling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. Roeden, W. Oomen, K. Linzmeier, and KO. SE. Chong, "MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding," J. Audio Eng. Soc., vol. 56, no. 11, pp. 932-955, (2008 November.)
【国際調査報告】