IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 新唐科技股▲ふん▼有限公司の特許一覧

特許7371065オーディオ処理装置、およびオーディオ処理方法
<>
  • 特許-オーディオ処理装置、およびオーディオ処理方法 図1
  • 特許-オーディオ処理装置、およびオーディオ処理方法 図2A
  • 特許-オーディオ処理装置、およびオーディオ処理方法 図2B
  • 特許-オーディオ処理装置、およびオーディオ処理方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-20
(45)【発行日】2023-10-30
(54)【発明の名称】オーディオ処理装置、およびオーディオ処理方法
(51)【国際特許分類】
   H03G 3/30 20060101AFI20231023BHJP
   H03G 3/20 20060101ALI20231023BHJP
   H04R 3/00 20060101ALI20231023BHJP
【FI】
H03G3/30 C
H03G3/20 A
H04R3/00 310
【請求項の数】 15
(21)【出願番号】P 2021125916
(22)【出願日】2021-07-30
(65)【公開番号】P2022029438
(43)【公開日】2022-02-17
【審査請求日】2021-07-30
(31)【優先権主張番号】16/984,560
(32)【優先日】2020-08-04
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】508197206
【氏名又は名称】新唐科技股▲ふん▼有限公司
(74)【代理人】
【識別番号】110000291
【氏名又は名称】弁理士法人コスモス国際特許商標事務所
(72)【発明者】
【氏名】バーカイ,イッタイ
【審査官】工藤 一光
(56)【参考文献】
【文献】特開平9-102719(JP,A)
【文献】国際公開第2008/126496(WO,A1)
【文献】特開2008-187624(JP,A)
【文献】特表2005-503093(JP,A)
【文献】特表2012-509607(JP,A)
【文献】米国特許出願公開第2009/0080675(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H03G3/00-5/28
H03G9/00-9/30
H04R3/00-3/14
(57)【特許請求の範囲】
【請求項1】
入力オーディオ信号を受信し、線形処理ステージのユーザ提供の設定に基づいて前記入力オーディオ信号を線形処理して、線形ステージ出力オーディオ信号を生成するように構成される線形処理ステージ、
(i)前記線形処理ステージの前記ユーザ提供の設定、および(ii)メモリに保存される所定の信号品質保持基準を前記メモリからアップロードし、制御信号を生成し、且つ
前記所定の信号品質保持基準に準拠して、前記制御信号及び前記線形ステージ出力オーディオ信号とを乗算して、制御されたオーディオ信号を生成するように構成される制御信号回路(CSC)を含むオーディオ処理装置。
【請求項2】
前記制御されたオーディオ信号を受信し、前記所定の信号品質保持基準に準拠して前記制御されたオーディオ信号を処理するように構成された非線形処理ステージをさらに含み、前記所定の信号品質保持基準は、前記非線形処理ステージで適合される線形性を指定する請求項1に記載のオーディオ処理装置。
【請求項3】
前記線形処理ステージは、デジタルイコライザを含み、前記線形処理ステージの前記ユーザ提供の設定は、前記デジタルイコライザにおける各チャネルのユーザダイヤルのゲインセットすることを含み、前記CSCは、前記ユーザダイヤルのゲイン間の最大ゲインを識別するように構成され、前記最大ゲインが所定のしきい値を超える場合、前記デジタルイコライザのゲインを前記最大ゲインの関数である値でスケールダウンさせる請求項1に記載のオーディオ処理装置。
【請求項4】
前記デジタルイコライザは、2極2ゼロ(two-pole-two-zero)フィルタとバイクアッド(bi-quadratic)フィルタのうちの一つを含む請求項3に記載のオーディオ処理装置。
【請求項5】
前記所定の信号品質保持基準は、決定テーブルとして表される請求項1に記載のオーディオ処理装置。
【請求項6】
前記線形処理ステージはデジタルフィルタを含み、前記線形処理ステージの前記ユーザ提供の設定は、前記デジタルフィルタのゲインの設定を含む請求項1に記載のオーディオ処理装置。
【請求項7】
前記所定の信号品質保持基準は、超えてはならないゲインのしきい値を指定する請求項1に記載のオーディオ処理装置。
【請求項8】
前記CSCは、前記線形ステージ出力オーディオ信号に前記制御信号を乗算することにより、前記制御信号で前記線形ステージ出力オーディオ信号を制御するように構成される請求項1に記載のオーディオ処理装置。
【請求項9】
線形処理ステージのユーザ提供の設定に基づいて、前記線形処理ステージによって入力オーディオ信号を線形処理して、線形ステージ出力オーディオ信号を生成するステップ、
(i)前記線形処理ステージの前記ユーザ提供の設定、および(ii)メモリに保存される所定の信号品質保持基準を前記メモリからアップロードし、制御信号を生成するステップ、および
前記所定の信号品質保持基準に準拠して、前記制御信号及び前記線形ステージ出力オーディオ信号とを乗算して、制御されたオーディオ信号を生成するステップを含むオーディオ処理方法。
【請求項10】
非線形処理ステージで前記制御されたオーディオ信号を受信するステップを含み、前記所定の信号品質保持基準に準拠して、前記非線形処理ステージにより前記制御されたオーディオ信号を処理し、前記所定の信号品質保持基準は、前記非線形処理ステージで適合される線形性を指定する請求項に記載のオーディオ処理方法。
【請求項11】
前記線形処理ステージは、デジタルイコライザを含み、前記線形処理ステージの前記ユーザ提供の設定は、前記デジタルイコライザにおける各チャネルのユーザダイヤルのゲインセットすることを含み、前記線形ステージ出力オーディオ信号を制御するステップは、前記ユーザダイヤルのゲイン間の最大ゲインを識別するステップを含み、前記最大ゲインが所定のしきい値を超える場合、前記デジタルイコライザのゲインを前記最大ゲインの関数である値でスケールダウンさせる請求項に記載のオーディオ処理方法。
【請求項12】
前記所定の信号品質保持基準を保存するステップは、決定テーブルを保存するステップを含む請求項に記載のオーディオ処理方法。
【請求項13】
前記線形処理ステージはデジタルフィルタを含み、前記線形処理ステージの前記ユーザ提供の設定は、前記デジタルフィルタのゲインの設定を含む請求項に記載のオーディオ処理方法。
【請求項14】
前記所定の信号品質保持基準は、超えてはならないゲインのしきい値を指定する請求項に記載のオーディオ処理方法。
【請求項15】
前記制御信号で前記線形ステージ出力オーディオ信号を制御するステップは、前記線形ステージ出力オーディオ信号に前記制御信号を乗算するステップを含む請求項に記載のオーディオ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の処理に関するものであり、特に、オーディオ信号の歪みを補正する方法、システム、およびソフトウェアに関するものである。
【背景技術】
【0002】
オーディオ信号の自動調整の技術は、以前から特許文献で提案されている。例えば、送信信号の振幅が不明であるときに、入力信号の伝送損失を補償する伝送振幅とは独立したアダプティブイコライザを記載している(特許文献1参照)。イコライザコア、可変利得増幅器、および可変利得増幅器制御ループを有する実施形態を含む、いくつかの実施形態が提供される。
【0003】
もう1つの実施形態として、折りたたみ式アダプティブイコライザを記載している(特許文献2参照)。イコライザは、イコライザコアおよび自動ゲイン制御ループを含む。イコライザコアのイコライジング伝達関数は、自動ゲイン制御ループで生成された1つ以上のゲイン制御信号と、自動ゲイン制御ループで生成された折り返し信号によって変調される。折り返し信号に応じて、イコライザは、イコライザコアの伝達関数の高帯域幅ゲインまたは低帯域幅ゲインのいずれかを増加させることにより、高周波ゲインを増加させる。
【先行技術文献】
【特許文献】
【0004】
【文献】米国特許第7,415,064号
【文献】米国特許第8,351,493号
【発明の概要】
【発明が解決しようとする課題】
【0005】
オーディオ信号の歪みを補正する方法、システム、およびソフトウェアを提供する。
【課題を解決するための手段】
【0006】
以下に説明する本発明の一実施形態は、線形処理ステージおよび制御信号回路(CSC)を含むオーディオ処理装置を提供する。線形処理ステージは、入力オーディオ信号を受信し、線形処理ステージのユーザ提供の設定に基づいて入力オーディオ信号を線形処理して、線形ステージ出力オーディオ信号を生成するように構成される。制御信号回路(CSC)は、(a)(i)線形ステージのユーザ提供の設定、および(ii)所定の信号品質保持基準に基づいて制御信号を生成し、(b)信号品質保持基準に準拠して、制御信号で線形ステージ出力オーディオ信号を制御し、制御されたオーディオ信号を生成するように構成される。
【0007】
いくつかの実施形態では、制御されたオーディオ信号を受信し、信号品質保持基準に準拠して制御されたオーディオ信号を処理するように構成された非線形処理ステージをさらに含み、信号品質保持基準は、非線形処理ステージで適合される線形性を指定する。
【0008】
いくつかの実施形態では、線形処理ステージは、デジタルイコライザを含み、線形ステージのユーザ提供の設定は、デジタルイコライザの各チャネルのユーザダイヤルのゲインのセットを含み、CSCは、ユーザダイヤルのゲイン間の最大ゲインを識別するように構成され、最大ゲインが所定のしきい値を超える場合、デジタルイコライザのゲインを最大ゲインの関数である値でスケールダウン(scale down)させる。
【0009】
一実施形態では、デジタルイコライザは、2極2ゼロ(two-pole-two-zero)フィルタとバイクアッド(bi-quadratic)フィルタのうちの一つを含む。
【0010】
いくつかの実施形態では、装置は、メモリをさらに含み、所定の信号品質保持基準は、メモリに保存され、CSCは、所定の信号品質保持基準をメモリからアップロードするように構成される。
【0011】
一実施形態では、所定の信号品質保持基準は、決定テーブルとして表される。
【0012】
他の実施形態では、線形処理ステージはデジタルフィルタを含み、線形処理ステージのユーザ提供の設定は、フィルタのゲインの設定を含む。
【0013】
いくつかの実施形態では、信号品質保持基準は、超えてはならないゲインを指定する。
【0014】
いくつかの実施形態では、CSCは、線形ステージ出力オーディオ信号に制御信号を乗算することにより、制御信号で線形ステージ出力オーディオ信号を制御するように構成される。
【0015】
本発明の他の実施形態によれば、線形処理ステージのユーザ提供の設定に基づいて、線形処理ステージによって入力オーディオ信号を線形処理して、線形ステージ出力オーディオ信号を生成するステップを含む方法がさらに提供される。制御信号は、(i)線形ステージのユーザ提供の設定、および(ii)所定の信号品質保持基準に基づいて生成される。信号品質保持基準に準拠して、線形ステージ出力オーディオ信号は、制御信号で制御され、制御されたオーディオ信号を生成する。
【0016】
添付の図面とともに以下の詳細な説明及び実施例を検討することで、本発明をより完全に理解できる。
【図面の簡単な説明】
【0017】
図1図1は、本発明の一実施形態による、線形処理ステージ、非線形処理ステージ、および制御信号回路(CSC)を含むオーディオ処理装置を概略的に示すブロック図である。
図2A図2Aは、本発明の一実施形態による、図1のオーディオ処理装置のフィルタ出力信号および補正された信号のそれぞれのグラフである。
図2B図2Bは、本発明の一実施形態による、図1のオーディオ処理装置のフィルタ出力信号および補正された信号のそれぞれのグラフである。
図3図3は、本発明の一実施形態による、図1のオーディオ処理装置を用いてオーディオゲイン設定を補正する方法を概略的に示すフローチャートである。
【発明を実施するための形態】
【0018】
消費者向け製品級(consumer-grade)のオーディオシステムのメーカー、特にモバイルデバイスに搭載されているオーディオシステムのメーカーは、オーディオ品質とコストのバランスを取るという課題に直面している。このようなデジタルオーディオシステムの多くは、デジタル信号処理(DSP)技術を用いて、デバイスの物理的な制限を補正し(例えば、小型のプラスチック製の筐体のために生じる歪みを克服する)、エンジニアリング製品のコストおよび/またはサイズを改善している。特に、メーカーは通常、線形アルゴリズム(例えば、フィルタ、ボリュームノブ)と非線形アルゴリズム(例えば、ダイナミックレンジコンプレッサー、ダイナミックレンジリミッター)を組み合わせたDSPソリューションを用いている。従って、入力信号に対するこのようなオーディオシステムの全体的な応答は非線形である可能性がある(例えば、閾値に応じて決まる)。
【0019】
DSPソリューションは、非線形で実行することで、オーディオパフォーマンスにメリットをもたらす可能性があるが(例えば、許容可能なレベルの歪みでスピーカー出力を最大化することにより)、信号の純度が非常に重要である多くの商用アプリケーションがあるため、信号の歪みは回避される必要がある。例としては、アクティブノイズキャンセレーション、音響エコーキャンセレーションなどのオーディオアプリケーション、および音声認識などの音声検出を含む。このため、これらのアプリケーションでは、オーディオ処理の線形性を保持することが重要である。
【0020】
一般に、線形入力信号は、その振幅が所定の線形ダイナミックレンジに制限されていることを特徴とする。例えば、入力信号が信号振幅[-96,0][dBFS]の所定の16ビットのレンジ内で線形であるシナリオを考えてみる。ここでは、FSはフルスケールを示している。この例では、一般性を失うことなく、信号振幅を[-96,0][dBFS]のレンジに保持することで、信号が非線形ステージを含むDSPソリューションによって線形に処理され、処理された信号の純度を保持することができるようになる。例として、線形性保持基準は、信号振幅が0[dB]の非線形閾値以下になるように(線形的に)制限することを含むことができる。
【0021】
さらに、システムが非線形ステージを含むかどうかに関係なく、人間のユーザ((例えば、ホーム、スタジオ、またはライブ(field)でのミュージシャンおよびミキシング/マスタリングエンジニア))は、「不要な(unwanted)」周波数ゾーン(frequency zones)を減衰させるのではなく、「必要な(wanted)」周波数ゾーンを強調することによって音を均等化する傾向がある。上述の理由(歪みと非線形性を回避する)により、不要な周波数ゾーンを減衰させる方法は、通常、必要な周波数ゾーンをブーストするよりも優れている。しかしながら、多くのユーザは、使いやすさという単純な理由から、不要なゾーンを減衰させるのではなく、必要なゾーンをブーストさせていることに気づいている。人間のユーザにとっては、特定の周波数ゾーンに「焦点を合わせ(focus)」、単一のパラメータ(またはノブ)をダイヤルイン(dial-in)するのは、他の全てのゾーンを「ダイヤルアウト(dial-out)」するより簡単である。このため、多くの音響エンジニアは、理論的には「不要な周波数」の減衰が好ましい方法であることを知っていても、この方法論を実践できていない。ここで説明する技術は、この問題を自動的に補正する。ユーザは同じ1つのダイヤルを用いて「必要な」ゾーンを「ブースト」し、他のゾーンは自動的に「減衰」されることができる。
【0022】
上述のように、オーディオ装置からの相反する要件(例えば、非線形ステージを有する、および有さない)は、信号が意図せず歪むことになる可能性がある。例えば、オーディオエンジニアまたは他のユーザは、これが線形応答を得られると誤った予期をして、イコライザに正のゲインを提供(例えばダイヤル)することがある。上述のように、このシナリオは信号の純度が低いとき、メーカーがユーザが気付かない非線形ステージをいくつかのオーディオシステムに組み込むことがよくあるため、一般的である。しかしながら、開示された技術は、上述のように、独立した線形装置の信号品質を確保するようにも適用可能である。
【0023】
以下に説明される本発明の実施形態は、信号品質を自動的に保持する方法および装置を提供する。このため、開示された技術は、所与の線形ダイナミックレンジ内(例えば、[-96,0][dBFS]内)で任意の入力信号に対して制御された応答を保持する装置の所与の線形処理ステージのオーディオ処理パラメータのユーザ選択(例えば、ダイヤル)を自動的に補正する。一実施形態では、オーディオ処理装置は、(a)入力オーディオ信号を受信するように構成され、線形処理ステージのユーザ提供の設定に基づいて入力オーディオ信号を線形処理し、線形ステージ出力オーディオ信号を生成する線形処理ステージ、および(b)(i)線形ステージのユーザ提供の設定と、(ii)所定の信号品質保持基準(例えば、出力信号強度がゼロ[dB]を超えない)とに基づいて制御信号を生成するように構成された制御信号回路(CSC)を含む。CSCは、信号品質保持基準に準拠して、制御信号で線形ステージ出力オーディオ信号を制御し、制御されたオーディオ信号を生成する。
【0024】
いくつかの実施形態では、装置が非線形処理ステージを含む非線形ステージを組み込んでいるとき、このような非線形ステージは、制御されたオーディオ信号を受信し、信号品質保持基準に準拠して制御されたオーディオ信号を処理するように構成される。信号品質保持基準は、非線形処理ステージで適合される線形性を指定する。
【0025】
例えば、用いられるDSP技術が線形ソリューションであるとした場合、ユーザは、システムを非線形応答に駆動する正のゲインを設定することができる。例えば、振幅がゼロ[dB]よりも小さく、-G[dB]よりも大きい入力信号を受信するイコライザチャネルで正のゲインGをダイヤルすると、後続の非線形リミッタステージでその信号をゼロ[dB]に制限することになる。 このヒューマンエラーはさまざまなケースで発生する可能性がある。例えば:
・その設計サイクルにおいて消費者向け製品級(consumer-grade)のオーディオ製品(例えば、PC、携帯電話、テレビ、サウンドバーにおいて)を調整するケース。
・ライブショーのフロントオブハウスシステムを調整するケース。
・人間の言語を伝えるようにパブリックアナウンス(Public announcement; PA)システムを調整するケース。
・スタジオでのレコーディングまたはマスタリングをするケース。
・消費者向け製品級の機器(例えば、携帯電話)のEQまたは低音ブーストの設定するケース。
【0026】
従って、本発明のいくつかの実施形態は、所与の線形ダイナミックレンジ内(例えば、[-96,0][dBFS]内)で任意の入力信号に対して線形応答を自動的に保持する方法および装置を提供する。開示された技術は、その後、非線形処理ステージで信号を歪ませる可能性がある装置の所与の線形処理ステージのオーディオ処理パラメータのユーザ選択(例えば、ダイヤル)を自動的に補正する。説明された解決策は、複雑性が低く、計算量と電気エネルギーの必要量が低いため、消費者向け製品級の携帯機器に非常に適している。
【0027】
いくつかの実施形態では、線形処理ステージおよび非線形処理ステージを含むオーディオ処理装置が提供される。線形ステージは、入力オーディオ信号を受信し、ユーザ提供の設定に基づいて、入力オーディオ信号を線形処理して、線形ステージ出力オーディオ信号を生成するように構成される。オーディオ処理装置は、(a)ユーザ提供の設定を受信する(例えば、メモリから決定テーブルをアップロードし、決定テーブルは、ユーザ提供(例えば、ユーザ選択)の設定用の信号線形性保持基準を含む)、(b)(i)線形ステージのユーザ提供の設定と、(ii)所定の信号線形性保持基準とに基づいて制御信号を生成する、および(c)制御信号で線形ステージ出力オーディオ信号を制御し、制御されたオーディオ信号を生成するように構成された制御信号回路(CSC)をさらに含む。オーディオ処理装置の非線形処理ステージは、制御された(例えば、補正された)オーディオ信号を受信し、信号線形性保持基準に準拠して、制御されたオーディオ信号を線形に処理するように構成される。
【0028】
本発明のいくつかの実施形態では、CSCは、線形ステージの設定の変更(例えば、イコライザのフィルタのセットのダイヤルの変更)の指示を受信し、その変更が後続の非線形ステージにつながり、信号を歪ませるかどうかをチェックする。この場合、CSCは、このような非線形効果を防止する補正措置を実行して、信号の純度を保持する。
【0029】
いくつかの実施形態では、例えば、CSCは、1つ以上のフィルタのゲイン設定の変化の指示を受信し、フィルタリングされた信号に制御信号を乗算する乗算器に制御信号を出力することにより、変更された設定に従ってシステム応答を変更し、信号振幅を0[dB]以下に保持するようにする。一実施形態では、プロセッサは、決定テーブルから読み出された信号線形性保持基準を用いて、フィルタの最大ゲインをチェックする。いずれかのフィルタが所定のしきい値を超える値に設定された場合(例えば、正のゲインに設定された場合)、CSCは全体の出力ゲイン(即ち、全てのフィルタの)を少なくとも同じ設定量低減させる。それ以外の場合は、CSCはゲインを低減させない。
【0030】
この制御信号(即ち、dB単位のゲイン低減量)は乗算器に出力される。そのため、結果として得られる信号は、例えば、ゲインが既に負であるフィルタチャネルを含む、オーディオスペクトル全体で均等に減衰される。従って、チャネル間の元の相対ゲインを保持し、望ましくない歪みを防止しながら、全体的な信号電力(ボリュームなど)が低減される。このようにして、非線形処理の可能性を知らないエンジニアまたはユーザは、任意のゲインをダイヤルすることができ、開示された技術は、システムを非線形ゾーンから常に影響を受けないように保つことができる。
【0031】
他の実施形態では、線形処理ステージは、デジタルイコライザを含み、線形ステージのユーザ提供の設定は、デジタルイコライザの各チャネルのユーザダイヤルのゲインのセットを含む。CSCは、ユーザダイヤルのゲイン間の最大ゲインを識別するように構成され、最大ゲインが所定のしきい値を超える場合、ユーザダイヤルのゲインの全てを最大ゲインの関数である値でスケールダウンさせる。
【0032】
自動オーディオ入力制御システムおよび方法を提供して、自動的に(例えば、ユーザが気付くことなく)オーディオ信号の歪みを防止することにより、開示された技術は、消費者向け製品級の機器が計算量と電気エネルギーの必要量が低く、低い複雑性を保持しながら、高い信号純度を必要とするアプリケーションを実行することを可能にする。
【0033】
装置の説明(APPARATUS DESCRIPTION)
上述のように、いくつかの消費者向け製品級の装置では、入力オーディオ信号が非線形DSPにより歪んだ出力を生成する可能性があり、これは、多くの場合、例えば出力音量の最適化を目的とした所望のアーティファクトである可能性がある。
【0034】
しかしながら、いくつかのアプリケーション(機械音声認識など)では、信号の純度(例えば、線形性)が重要である。このような場合の歪みを防止するために、本発明の開示された実施形態がない場合、非実用的なレベルに対するユーザの認識、または高いエネルギー消費を必要とする複雑でコストのかかる解決策のいずれかを必要とする機能が必要となる。
【0035】
図1は、本発明の一実施形態による、線形処理ステージ10、非線形処理ステージ30、および制御信号回路(CSC)20を含むオーディオ処理装置100を概略的に示すブロック図である。処理装置100は、いくつかの可能なもののみを挙げると、オーディオ信号を出力する任意の適切なシステムまたは装置、例えば、携帯電話、コンピュータ、ゲーム機、またはステレオシステムで用いられることができる。特に、装置100は、音声認識アプリケーションで用いられることができる。
【0036】
処理装置100は、線形処理ステージ10が線形オーディオ信号101を受信し、線形ステージ出力信号103を生成するフィードフォワードトポロジーを有する。線形処理ステージ10は、非限定的な例として、例えば、線形デジタルフィルタ(LDF)のセット、通常2極2ゼロ(two pole two zeros; 2p2z)フィルタを含むことができる。通常、このようなフィルタのセットは、イコライザユニット(図示せず)に含まれている。従って、出力信号103は、イコライザ出力信号であり得る。いくつかのケースでは、線形処理ステージ10は、2極と2ゼロを含む2次再帰線形フィルタである1つ以上のデジタルバイクアッドフィルタ(digital biquad filters)を含み得る。「バイクアッド(Biquad)」は「バイクアッド(biquadratic)」の略語であり、このようなフィルタの伝達関数が2つの2次関数の比率であるということを指している。
【0037】
線形ステージ設定102(例えば、ダイヤルのフィルタゲインのセット)は、CSC20に入力され、CSC20は、それらを所定の信号線形性保持基準と比較することによってそれらを応答的に分析する。続いて、CSC20は、CSC20が出力信号103で制御する(例えば、乗算する)制御信号104を計算、生成、および出力する。例えば乗数25を用いる制御信号104のアプリケーションは、それ自体が同じ信号線形性保持基準に準拠(例えば、[dB]単位の正の振幅を有する信号を許容しない)するように構成された後続の非線形処理ステージ30によって非線形に影響されない制御されたオーディオ信号105を生成する。例えば、図2に示されるように、CSCは、制御されたオーディオ信号105が任意の周波数で0dBを超えることを防止し、これにより非線形ステージ30のリミッタタイプは、0dBを超える信号を無効にすることで信号を歪ませることがなくなる(即ち、歪んだ出力信号106を生成する)。
【0038】
より詳細には、CSC20は、信号線形性保持基準を含む決定テーブル22が保存されたメモリ23を含む(または、他の実施形態では、CSC20の一部ではないメモリへのアクセスを有する)。CSC20は、プロセッサ24をさらに含む(または、他の実施形態では、CSC20の一部ではないプロセッサへのアクセスを有する)。プロセッサは、受信したフィルタゲイン設定102に応答して、プロセッサ24によって読み出された決定テーブル22に組み込まれたフィルタゲインの信号線形性保持基準に基づいて、補正ゲイン係数104(CSC20の出力)を計算する。CSC20は、ゲイン係数104を用いて、信号103を均一に減衰させる。従って、補正信号(制御されたオーディオ信号)105は、図2に記載されているように、リミッタである非線形ステージによってその後歪められることはない。
【0039】
図1の実施形態は、明確にするために、例として、簡略化された方法で示されている。例えば、他のタイプのデジタルフィルタ、例えば、単極フィルタ、3極または他の任意の数の極フィルタ、ローパスフィルタフィルタ(LPF)、任意の次数のバンドパスフィルタ(BPF)、有限インパルス応答(FIR)フィルタなどが開示された技術によって用いられてもよい。イコライザユニットの他の構成要素、およびオーディオ増幅ステージなどの装置100の追加の構成要素は、提示を明確にするために説明されない。
【0040】
さまざまな実施形態では、図1に示されたオーディオ処理装置のさまざまな部品は、1つ以上のディスクリート部品(discrete component)、1つ以上の特定用途向け集積回路(ASIC)、および/または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)などの適切なハードウェアを用いて実装されることができる。開示されたCSC20のいくつかの機能は、本明細書に記載された機能を実行するソフトウェアにプログラムされた1つ以上の汎用プロセッサに実装されることができる。ソフトウェアは、例えば、ネットワークを介して、またはホストから、電子形式でプロセッサにダウンロードされる、あるいは、磁気、光学、または電子メモリなどの非一時的な有形媒体に代替的または追加的に提供および/または保存されてもよい。
【0041】
元の入力信号の歪みを防止するイコライザ自動ゲイン応答(EQUALIZER AUTO GAIN RESPONSE FOR PREVENTING DISTORTION OF ORIGINAL INPUT SIGNAL)
例として、線形処理ステージ10をNチャネルイコライザとすると、ユーザは、イコライザのノブDF1~DFNを用いることにより、NチャネルイコライザのN個の異なるフィルタのフィルタゲインをダイヤルすることができる。
【0042】
ダイヤルされたゲインの少なくとも1つが最も高く、以下、HighestGainと呼ぶ。上記のように、共通のダイナミックレンジ[-96,0][dBFS]と仮定すると、HighestGainが正でない数の場合、CSC20はイコライザ出力信号に影響を与えない(例えば、CSCは制御信号104、OutGain、OutGain=0[dB]を出力する)。一方、ユーザダイヤルのHighestGainが正、即ち、
式1 HighestGain>0,
の場合、装置100のCSC20は、イコライザのNチャネルゲインの全てを補正する。
【0043】
この例では、CSCは、最も高いダイヤルゲインの関数である重複(duplicative)制御信号、OutGainを計算、生成、および出力する。例えば、
式2 OutGain=-(HighestGain)-Δ,
は、ここでは、Δ≧0は所定の許容値、例えば、1(one)dBである。
【0044】
上述の例は、図2Aおよび図2Bでより詳細に説明されており、これらは、本発明の実施形態による、図1のオーディオ処理装置100のフィルタ出力信号1030および補正信号1050のそれぞれのグラフである。
【0045】
図示された実施形態では、ユーザは、ノブDF1~DF8を用いて、8チャネルイコライザのN=8個の異なるフィルタのフィルタゲインをダイヤル(1020)する。ダイヤルされたゲインの1つ(DF5)は最も高く、正であるため、開示された技術を用いて実行される自動補正を呼び出す。
【0046】
図2Aでは、ユーザは、フラット(flat)なゼロ[dB]信号(200)を、125Hz(DF2の中心周波数)で-10dB増幅し、その中にディップ(dip)202を有させ、1500Hz(DF5の中心周波数)で+10dB増幅し、その中にピーク(peak)204を有させる。式1によると、このようなユーザゲイン設定1020は、HighestGain=10[dB]を意味する。
【0047】
図2Bに示されるように、CSC20が信号1030を均等に10[dB]減衰させた後、全ての周波数における補正信号1050の振幅は、ゼロ[dB]以下である。装置100は、式2に従って、CSC20が出力信号1030を均等(即ち、線形)に減衰させる、-10[dB]の乗法係数(Δ=0を用いて)を出力することにより、ユーザダイヤルのゲインを自動的に補正(例えば、補償)することでこれを実現する。具体的には、フラット信号400の振幅は-10 [dB]であり、125Hzでのディップ402の振幅は-20[dB]、且つ1500Hzでのピーク404の振幅はゼロ[dB]である。
【0048】
結果として、補正信号1050のどの部分も、例えば、正の信号をゼロ[dB]にクリップするように構成されたリミッタによって非線形処理されない。
【0049】
上述の例では、しきい値がゼロ[dBFS]の一般的な例として挙げられており、これは、クリッピングや歪みのない、システムの「低ダイナミックレンジ」部分で可能な最大レベルである。
【0050】
これが最も一般的なケースであるが、必ずしもそれだけではない。システムの入力と出力の両方が特定のダイナミックレンジとワード長に制限されていると仮定すると、一般的な例では、ワード長は16ビットである(ダイナミックレンジが約96dBのシステムを表しており、「CD品質」と呼ばれることがよくある)。デジタルサウンドプロセッサは通常、より高いダイナミックレンジとより長いワード長を用いる。このような最新のDSPでは、32ビット浮動小数点コアDSPアーキテクチャ(floating point core DSP architecture)を使用するのが一般的である。
【0051】
このケースでは、DSPは16ビット表示に制限された信号を「受信」する。これはゼロ[dBFS](フルスケール(Full Scale)のdB)と見なされ、「FS」はシステム全体の入力と出力(低ダイナミックレンジ)ゾーンを指している。DSP内では、信号を「強化(beefed up)」され、その0[dBFS]のしきい値を超えることができるため、システムのより高いダイナミックレンジの部分では実際には「フルスケール」ではない。これは一般に「ゼロdB」と呼ばれる。
【0052】
上述の一般的なケースは、限定的な例ではない。他のケースでは、しきい値(それを超えると非線形アルゴリズムが信号を変更する)は、他の値に設定されることができ、即ち、必ずしもゼロ[dBFS]に設定される必要はない。他のシステムでは、入力と出力が同じダイナミックレンジタイプではない可能性があるため、しきい値(出力クリッピングから保護するために設定された)は前述の「ゼロ」[dBFS](入力から受信した最大値)ではない可能性がある。
【0053】
従って、「ゼロ」dBの幅広いケースの例は、非限定的な例として挙げられており、厳密なルールとしてではないことに留意することが重要である。
【0054】
このようなシステムは、「固定小数点」の入出力と「浮動小数点」の処理が用いられる可能性があり、コア処理は入力/出力よりもはるかに高いレンジである可能性があることに留意されたい。アプリケーションは特定のアーキテクチャタイプ(固定小数点、浮動小数点、16ビット、24ビット、32ビットなど)または実装に限定されるものではなく、ソフトウェア実装(PCなど)とハードウェア(DSP、ASICなど)の両方をカバーする必要がある。このようなさまざまなケースは、特定のしきい値(ゼロdB)に限定されず、他のしきい値に限定されることもある。
【0055】
従って、本項では、信号の線形ダイナミックレンジは[A、B][dBFS]に一般化され、AとBは実数であり、それらの値は、A=-96[dBFS]およびB=0[dBFS]の近くにある、またはない可能性があり、開示された発明が非標準のダイナミックレンジ内の線形信号をどのように処理することができるかも示している。
【0056】
開示された装置の柔軟性を説明するために、開示された装置が、[A、B]の信号の非標準ダイナミックレンジ、例えば、[A、B]=[-90、+6][dB]の16ビットのレンジ、または[A、B]=[-120、+24][dB]の24ビットのレンジに対して、信号の線形性を保持するもう一つの実装が提供される。この場合、式1はHighestGain>Cとなり、係数CはBの関数、例えばC=-Bである。同時に、式2はそのままであり、信号を信号振幅の共通線形ダイナミックレンジ[-96,0][dBFS]にすることができる。あるいは、例えば、後続の非線形ステージが非標準のダイナミックレンジで動作することがわかっている場合、式2は、その純度を保持するために、係数Cを構成して、補正された信号を非標準の線形レンジ内に保持することができる。
【0057】
マルチプロセッサ全体のゲインの共同応答(JOINT RESPONSE FOR MULTI PROCESSORS OVERALL GAIN)
図2では、任意のフィルタのうちの1つ、またはより一般的にはアルゴリズムにダイヤルされた最大ゲインは、システムを補正ゲインの低減にトリガーする。
【0058】
しかしながら、実際のケースは、任意の単一プロセッサのゲインの最大ゲインよりも高い累積ゲインを有するいくつかのデジタルサウンドプロセッサの動作を含む可能性がある。非限定的な例として、システム100の線形処理ステージ10は、+3dBのゲインを含むゲイン設定102を提供することができるが、信号の周波数幅と比較して極めて僅かに異なる周波数である(例えば、f1=1000Hz、f2=1100Hzと2つの信号のFWHM=1400Hz。
【0059】
このケースでは、~1000Hzの入力周波数の全体のゲインは約累積+6dBになることが容易にわかる。
【0060】
上述の2つの帯域の最大値を選択すると、システムを3dB減衰させる必要があり、実際に必要な約6dBではない。本明細書で用いられる、任意の数値または範囲の「約(about)」または「おおよそ(approximtely)」という用語は、構成要素の一部または集合が本明細書に記載の意図された目的のために機能することを可能にする適切な寸法公差を示している。より具体的には、「約」または「おおよそ」は、記載された値の±20%の値の範囲を指すことができ、例えば、「約90%」は、71%から99%の値の範囲を指すことができる。
【0061】
従って、実際のケースを正確に説明するには、システムは、全てのアルゴリズムからの累積ゲイン設定が存在する場合、それをCSC20の入力として、考慮する必要がある。設定102を一般の全体の設定と置き換えるように用いられることができる累積ゲインを計算する方法は、通常、各線形ステージのゼロと極に基づく計算によって、各線形ステージの線形伝達関数の大きさを抽出することに基づいている。これらの技術はよく知られており、本願の範囲外である。
【0062】
選択的自動ゲイン応答(Selective AUTO GAIN RESPONSE)
いくつかの実施形態では、設計者は、CSC20ユニットが、全てのアルゴリズムの最も高いゲイン設定(例えば、異なる周波数での線形ステージの全てのゲイン設定)によって無条件にトリガーされないことを確実にしたいといる。例として、低音ブーストアルゴリズムが最も高いゲイン設定を有すると仮定する。しかしながら、この最大値は、「決定テーブル」に保存されている基準の使用をトリガーしないか、または少なくとも他のEQバンドと同程度ではない可能性がある。CSC20は、例えば、低音でない周波数のみに基づいてゲイン低減を計算するように構成されてもよい。この業界では、低周波の音の場合、通常人間の脳に受け入れられ、さらには好まれている、ある程度の歪みを提供する低音ブーストアルゴリズムは非常に受け入れられている。このような歪みは、中音域(音声)の周波数では受け入れられない可能性がある。そのため、システムは低音ブーストが決定テーブルに保存されている基準の使用をトリガーしないように設計されることができ(リミッタの動作によるわずかな歪みに全システムを送り)、もう一つのアルゴリズム(EQバンドなど)は、「決定テーブル」に保存されている基準の使用をトリガーして、リミッタをトリガーしないように強制するが、強制しない場合、出力ボリュームを下げて、高純度のサウンドを維持する。
【0063】
異なるアルゴリズムの決定要素と重みの任意の組み合わせは、依然としてこの特許でカバーされるものと見なされる。
【0064】
元の入力信号の歪みを防止する自動ゲイン応答の方法(METHOD OF AUTO GAIN RESPONSE FOR PREVENTING DISTORTION OF ORIGINAL INPUT SIGNAL)
図3は、本発明の一実施形態による、図1のオーディオ処理装置100を用いてオーディオゲイン設定(例えば、ダイヤリング)を補正する方法を概略的に示すフローチャートである。本実施形態によるアルゴリズムは、信号線形処理ステップ60において、ユーザがフィルタ設定102(例えば、ゲイン値)を装置100の線形処理ステージ10にダイヤルして、入力信号を線形処理し(例えば、デジタルフィルタリング)、線形処理された出力信号103を生成するようにすることから始まるプロセスを実行する。
【0065】
次に、ダイヤルされた設定102を受信するCSC20は、制御信号生成ステップ62において、所定の信号線形性保持基準に従って制御信号104を計算および生成する。
【0066】
信号補正ステップ64では、CSC20は、制御信号および線形処理された出力信号103を制御(例えば、乗算)して、所定の信号線形性保持基準に適合する補正信号(制御されたオーディオ信号)105を生成する。
【0067】
補正信号出力ステップ66において、CSC20は、所定の信号線形性保持基準(即ち、線形)に準拠して信号を処理する、ダイナミックレンジプロセッサ(例えば、リミッタ)タイプの非線形処理ステージ30に受信される補正信号(制御されたオーディオ信号)105を出力する。最後に、信号出力ステップ68において、ステージ30は線形出力信号106を出力する。
【0068】
本明細書に記載の実施形態は、主に消費者向け製品級の装置のオーディオ処理に対応しているが、本明細書に記載の方法およびシステムは、オーディオエンジニアリングなどの他のアプリケーションでも用いられることができる。
【0069】
上述の実施形態は、例として引用されており、以下の特許請求の範囲は、上述に具体的に開示および記載された内容に限定されないことに留意されたい。むしろ、この範囲は、上述の様々な特徴のコンビネーションおよびサブコンビネーションの両方、ならびに前述の説明を読んで当業者が知るであろう、先行技術に開示されていないその変形および修正を含む。参照することにより本特許出願に組み込まれた文書は、組み込まれた文書の用語の定義が本明細書で明示的または暗黙的になされた定義と矛盾する場合を除いて、本出願の不可欠な部分と見なされ、本明細書の定義のみが考慮されるべきである。
【符号の説明】
【0070】
10 線形処理ステージ
20 制御信号回路(CSC)
22 決定テーブル
23 メモリ
24 プロセッサ
30 非線形処理ステージ
60、62、64、66、68 ステップ
100 オーディオ処理装置
101 線形オーディオ信号
102 線形ステージ設定
103 線形ステージ出力信号
104 ゲイン係数
105 制御されたオーディオ信号
106 線形出力信号
200 フラット(flat)なゼロ[dB]信号
202、402 ディップ(dip)
204、404 ピーク(peak)
400 フラット信号
1020 ユーザゲイン設定
1030 フィルタ出力信号
1050 補正信号
DF1~DF8 イコライザのノブ
図1
図2A
図2B
図3