特許第6833062号(P6833062)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧
特許6833062入力音響信号を処理する装置および対応する方法
<>
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000015
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000016
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000017
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000018
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000019
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000020
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000021
  • 特許6833062-入力音響信号を処理する装置および対応する方法 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6833062
(24)【登録日】2021年2月4日
(45)【発行日】2021年2月24日
(54)【発明の名称】入力音響信号を処理する装置および対応する方法
(51)【国際特許分類】
   H03G 3/20 20060101AFI20210215BHJP
   H04R 3/00 20060101ALI20210215BHJP
【FI】
   H03G3/20 Z
   H04R3/00 310
【請求項の数】15
【全頁数】22
(21)【出願番号】特願2019-555777(P2019-555777)
(86)(22)【出願日】2018年4月10日
(65)【公表番号】特表2020-517179(P2020-517179A)
(43)【公表日】2020年6月11日
(86)【国際出願番号】EP2018025106
(87)【国際公開番号】WO2018188812
(87)【国際公開日】20181018
【審査請求日】2019年12月3日
(31)【優先権主張番号】17166448.5
(32)【優先日】2017年4月13日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100085660
【弁理士】
【氏名又は名称】鈴木 均
(72)【発明者】
【氏名】マバンデ,エドウィン
(72)【発明者】
【氏名】ケッヒ,ファビアン
(72)【発明者】
【氏名】クラツシュマー,ミハエル
(72)【発明者】
【氏名】マイヤー,ミハエル
(72)【発明者】
【氏名】ノイゲバウアー,ベルンハルト
【審査官】 竹内 亨
(56)【参考文献】
【文献】 特表2008−518565(JP,A)
【文献】 特開2014−003647(JP,A)
【文献】 特開2011−135218(JP,A)
【文献】 特開2010−087811(JP,A)
【文献】 特開2005−143090(JP,A)
【文献】 特表2008−503169(JP,A)
【文献】 特開平10−173457(JP,A)
【文献】 特開平7−66647(JP,A)
【文献】 特開2008−225056(JP,A)
【文献】 特開平11−88090(JP,A)
【文献】 特表2010−507330(JP,A)
【文献】 特開2006−173839(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H03G 3/00−3/34
H04R 3/00
(57)【特許請求の範囲】
【請求項1】
入力音響信号(100)を処理する装置(1)であって、
評価器(10)と、計算機(11)と、調整器(12)と、を備え、
前記評価器(10)は、前記入力音響信号(100)の音量を評価して、音量範囲(LRAin)および実際の音量値を決定するように構成されており、
前記計算機(11)は、前記決定された音量範囲(LRAin)と、目標音量範囲(LRAdes)と、前記決定された実際の音量値とに基づいて、圧縮機伝達関数を決定するように構成されており、
前記計算機(11)は、前記決定された圧縮機伝達関数に基づいて少なくとも1つの音量範囲制御ゲインを決定するように構成されており、
前記調整器(12)は、前記入力音響信号(100)および少なくとも1つの前記決定された音量範囲制御ゲインに基づいて出力音響信号(101)を提供するように構成されており、
前記計算機(11)は、前記出力音響信号(101)の平均音量(μout)と前記入力音響信号(100)の平均音量(μin)との差が最小になるように、前記圧縮機伝達関数を決定するように構成されている、
装置(1)。
【請求項2】
前記評価器(10)は、前記入力音響信号(100)の前記音量を評価して前記音量値の統計モーメントを決定するように構成されており、
前記計算機(11)は、前記決定された音量範囲(LRAin)と、前記目標音量範囲(LRAdes)と、前記決定された実際の音量値と前記音量値の前記決定された統計モーメントとの差とに基づいて、前記圧縮機伝達関数を決定するように構成されている、
請求項1に記載の装置(1)。
【請求項3】
前記計算機(11)は、曲線およびシフトに基づいて前記圧縮機伝達関数を決定するように構成されており、
前記計算機(11)は、前記決定された音量範囲(LRAin)および前記目標音量範囲(LRAdes)に基づいて前記曲線を決定するように構成されており、
前記計算機(11)は、前記音量値の前記決定された統計モーメントに基づいて前記シフトを決定するように構成されている、
請求項2に記載の装置(1)。
【請求項4】
前記計算機(11)は、勾配およびシフトに基づいて前記圧縮機伝達関数を決定するように構成されており、
前記計算機(11)は、前記決定された音量範囲(LRAin)と前記目標音量範囲(LRAdes)とに基づいて前記勾配を決定するように構成されており、
前記計算機(11)は、前記音量値の前記決定された統計モーメントに基づいて前記シフトを決定するように構成されている、
請求項2または3に記載の装置(1)。
【請求項5】
前記決定された圧縮機伝達関数は、前記入力音響信号(100)全体に対して有効である、
請求項4に記載の装置(1)。
【請求項6】
前記評価器(10)は、前記入力音響信号(100)全体の前記音量を評価するように構成されている、
請求項1〜5のいずれか一項に記載の装置(1)。
【請求項7】
前記評価器(10)は、前記入力音響信号(100)の少なくともある期間の前記音量を評価するように構成されている、
請求項1〜5のいずれか一項に記載の装置(1)。
【請求項8】
前記評価器(10)は、前記実際の音量値として瞬間的または短期的な音量値を決定するように構成されている、
請求項1〜7のいずれか一項に記載の装置(1)。
【請求項9】
前記評価器(10)が、前記音量値の前記統計モーメントとして平均音量を決定するように構成されている、
または
前記評価器(10)が、統合されたゲート音量を前記音量値の前記統計モーメントとして決定するように構成されている、
請求項2、3、4のいずれか一項に記載の装置(1)。
【請求項10】
前記計算機(11)は、前記出力音響信号(101)の前記平均音量(μout)と前記入力音響信号(100)の前記平均音量(μin)とが等しくなるように前記圧縮機伝達関数を決定するように構成されている、
請求項1〜9のいずれか一項に記載の装置(1)。
【請求項11】
前記計算機(11)は、前記決定された圧縮機伝達関数および最大ゲイン値(Gmax)に基づいて、決定された前記音量範囲制御ゲインが前記最大ゲイン値(Gmax)以下になるように前記音量範囲制御ゲインを決定するように構成されている、
請求項1〜10のいずれか一項に記載の装置(1)。
【請求項12】
前記最大ゲイン値(Gmax)がユーザ入力によって設定され、
または
前記最大ゲイン値(Gmax)が、前記入力音響信号(100)の前記目標音量範囲(LRAdes)と前記決定された音量範囲(LRAin)との差に依存する、
請求項11に記載の装置(1)。
【請求項13】
入力インターフェース(13)をさらに備え、
前記入力インターフェース(13)は、前記目標音量範囲(LRAdes)の値を受信するように構成されている、
請求項1〜12のいずれか一項に記載の装置(1)。
【請求項14】
入力音響信号(100)を処理する方法であって、
前記入力音響信号(100)の音量を評価して、音量範囲(LRAin)と実際の音量値とを決定することと、
前記決定された音量範囲(LRAin)と、目標音量範囲(LRAdes)と、前記音量値の決定された統計モーメントとに基づいて、圧縮機伝達関数を決定することと、
前記決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定することと、
前記入力音響信号(100)と少なくとも1つの前記決定された音量範囲制御ゲインとに基づいて出力音響信号(101)を提供することと、を含み、
前記圧縮機伝達関数は、前記出力音響信号(101)の平均音量(μout)と前記入力音響信号(100)の平均音量(μin)との差が最小になるように決定される、
方法。
【請求項15】
コンピュータまたはプロセッサで動作するときに請求項14に記載の方法を実行するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力音響信号を処理する装置に関する。本発明はまた、対応する方法およびコンピュータプログラムにも関する。
【0002】
本発明は、音響信号を処理する分野に関し、より具体的には、音響信号の音量範囲を制御する、すなわち、所望の目標音量範囲に一致するように音響信号の音量範囲を調整するアプローチに関する。
【背景技術】
【0003】
音量範囲[1]は、音響信号の強弱の尺度である。[1]に記載されているように、本出願の意味において、音量範囲は、時間変化する音量測定値の変動を定量化する。したがって、音量範囲は、測定された瞬間音量値の統計的分布を表す。
【0004】
音量範囲を制御することは、幅広いシナリオ、例えば、
・音響再生システムの機能に制約がある装置での再生、
・深夜モードなどの特別な表示モードでの再生、
・周囲ノイズが高い環境での再生、
・リアルタイムの音量正規化のための前処理、
の場合に望ましい。
【0005】
音響信号の音量範囲を制御して目標音量範囲を達成できる方法は、ここでは音量範囲制御(Loudness Range Control:LRAC)法と呼ばれる。文献では、大部分の方法が音響信号のダイナミックレンジの制御、つまりダイナミック・レンジ・コントロール(Dynamic Range Control:DRC)を求めている。音量範囲の定義は標準化されている[1]が、ダイナミックレンジの定義は時々異なる。もちろん、ダイナミックレンジの制御は、音量範囲の制御に関連している。したがって、簡単にするために、両方をLRAC法として扱うことができる。
【0006】
自動ゲイン制御(Automatic gain control:AGC)は、音響信号の全体的なレベルの制御に関連する方法を表す。ゲインは通常、時間変化するという事実により、これは通常、ダイナミックレンジの変更につながり、つまり、ダイナミックレンジは通常減少する。ただし、ダイナミックレンジの変化量は予測できず、つまり、出力信号のダイナミックレンジは不明であり、望ましい方法で制御することはできない。
【0007】
もちろん、予め選択された固定の伝達関数(プロファイルとも呼ばれる)を備えた圧縮機を適用する目的は、音響信号の音量範囲を変更することである。伝達関数の選択は、表示モードなどの予め定義された基準に基づいている。ただし、予め定義された圧縮機伝達関数を適用しても、出力において目標音量範囲が達成されることを保証することはできない。
【0008】
所望の目標音量範囲を達成するために、特定の音響信号に固有の伝達関数が決定される。次に、伝達関数が音響信号に適用され、音量範囲が制御された音響が生成される。さらに、伝達関数は、音響信号品質の低下を最小限に抑えながら、所望の目標音量範囲を達成するように設計する必要がある。
【0009】
最新技術では、さまざまな方法が知られている。
【0010】
予め定義された/固定の伝達関数:
伝達関数は予め定義されており、映画、ニュース、音楽などの予想される再生コンテンツに基づいて、または深夜モードなどのリスニングモードに基づいて選択される。
【0011】
基準信号ベースの伝達関数:
他の方法[2]は、測定された基準信号、例えば、リスニング環境のバックグラウンドノイズのレベルと、再生装置の音量制御設定の組み合わせを使用することを提案している。
【0012】
パラメータベースの伝達関数:
ここでは、伝達関数はユーザ定義の入力パラメータのみに基づいて設計されている。
【0013】
[3]で提案されている方法では、入力音響信号の平均レベルとダイナミックレンジとが決定される。平均レベルとユーザの希望するダイナミックレンジの設定とに基づいて、伝達関数が計算され、入力音響信号に適用される。
【0014】
図1は、スライダベースの望ましいダイナミックレンジの許容範囲と対応する伝達関数とを示している。図のx軸には[dB]の入力音量が、y軸には[dB]の出力音量が表示される。左側の例のスライダでは、伝達関数の形式に影響を与える「ダイナミックレンジの許容範囲」を設定できる。入力音量の低い領域は、ノイズフロアの上限に達する。この後に、一定の出力音量を持つセクションが続く。この場合、ダイナミックレンジの許容範囲は、所望のダイナミックレンジに対応する。伝達関数の線形部分は、時間に依存し、出力音量が一定のもう一つ続くセクションが平均信号レベル(水平シフト)に配置される。
【0015】
測定されたダイナミックレンジは伝達関数の計算には使用されず、つまり、入力音響信号のダイナミックレンジまたは音量範囲の専用制御は不可能である。
【0016】
[4]では、平均音量からの平均絶対偏差である動的拡散が制御される。図2(出力音量対入力音量)に示すように、2つの線分を持つ特定の圧縮機が使用される。推定される2つのパラメータは、圧縮機のしきい値(黒い点で示されている)と勾配(つまり、破線で示された線形曲線からの偏差)である。しきい値はユーザによってパーセンタイルとして指定され、ダイナミクスプロファイル[dB vs パーセンタイル]を使用してdBに変換される。勾配は、動的拡散の変化と勾配の変化との間に線形関係があるという仮定に基づいて計算される。


(1)
ここで、SdesおよびDdesはそれぞれ所望の勾配および動的拡散であり、Dinは測定された動的拡散である。
【0017】
通常、Smin=Dmin=0、Smax=1、およびDmax=Dinであり、したがって、
(2)
【0018】
伝達関数は、反復プロセスを介して適応される。
【0019】
最初に、伝達関数は、達成された動的拡散を決定するために、音響データの入力ヒストグラムまたは音響データに適用される。次に、伝達関数の勾配が調整され、所望の動的拡散が達成されるまで手順が繰り返される。
【0020】
ダイナミック・レンジ・コントロールに対するこのアプローチには、2つの欠点がある。
【0021】
1)伝達関数の勾配のみが決定され、原点に対する位置、つまり入力/出力レベルが広がる平面のシフトは決定されない。したがって、結果のゲインの範囲は予測できない。
【0022】
2)最初の伝達関数から最終的な伝達関数を取得するための反復プロセスは計算上非常に複雑であり、ユーザ定義のしきい値を使用して初期伝達関数を選択すると、見込まれる最終伝達関数の特性が制限されるため、必ずしも最良の結果にならない場合がある。
【0023】
メイクアップゲインは、最終伝達関数を入力ヒストグラムに適用し、続いて入力ヒストグラムから出力音量を近似することによって計算される。
【発明の概要】
【発明が解決しようとする課題】
【0024】
本発明の目的は、特に最新技術の欠点を被らない出力信号の音量に関する入力音響信号を処理するための装置および方法を提供することである。
【課題を解決するための手段】
【0025】
この目的は、評価器、計算機、および調整器を含む、入力音響信号を処理するための装置によって達成される。評価器は、入力音響信号の音量を評価して、音量範囲と実際の音量値とを決定するように構成されている。音量範囲は、一実施形態では、入力音響信号全体に対して決定され、別の実施形態では、入力音響信号の所与の期間(例えば時間枠)に対して決定される。実際の音量値は、例えば入力音響信号の瞬間的または短期的な音量値[6]である。前述の実際の音量測定値の代わりに、入力音響信号の少なくとも一定期間のレベルまたは出力、例えば平均出力の適切な測定値を示すまたは提供する任意の測定値を使用できることは明らかである。計算機は、決定された音量範囲、目標音量範囲、および決定された実際の音量値に基づいて、圧縮機の伝達関数を決定するように構成されている。いくつかの実施形態では、圧縮機伝達関数はさらに、音量値の決定された統計モーメントに基づいている。統計モーメントは、例えばITU−R BS.1770 [5]に準拠した音響入力の音量値または統合されたゲート音量の平均である。計算機は、決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定するように構成されている。調整器は、入力音響信号と少なくとも1つの決定された音量範囲制御ゲインとに基づいて出力音響信号を提供するように構成されている。別の実施形態では、計算機は、出力音響信号を提供するために、調整器に音量範囲制御ゲインを提供する。
【0026】
一実施形態では、評価器は、入力音響信号の音量を評価して、音量値の統計モーメントを決定するように構成される。さらに、計算機は、決定された音量範囲、目標音量範囲、および決定された実際の音量値と決定された音量値の統計モーメントとの差に基づいて、圧縮機伝達関数を決定するように構成される。
【0027】
別の実施形態では、計算機は、曲線およびシフトに基づいて圧縮機伝達関数を決定するように構成され、計算機は、決定された音量範囲および目標音量範囲に基づいて曲線を決定するように構成され、計算機は、音量値の決定された統計モーメントに基づいてシフトを決定するように構成される。
【0028】
一実施形態によれば、計算機は、勾配およびシフトに基づいて圧縮機伝達関数を決定するように構成され、計算機は、決定された音量範囲および目標音量範囲に基づいて勾配を決定するように構成され、計算機は、音量値の決定された統計モーメントに基づいてシフトを決定するように構成される。
【0029】
一実施形態では、決定された圧縮機伝達関数は、入力音響信号全体に対して有効である。
【0030】
一実施形態によれば、評価器は、入力音響信号全体の音量を評価するように構成される。
【0031】
一実施形態では、評価器は、入力音響信号の少なくともある期間の音量を評価するように構成される。
【0032】
一実施形態によれば、評価器は、瞬間的または短期的な音量値を実際の音量値として決定するように構成される。
【0033】
一実施形態では、評価器は、音量値の統計モーメントとして平均音量を決定するように構成される。
【0034】
別の実施形態では、評価器は、統合されたゲート音量を音量値の統計モーメントとして決定するように構成される。
【0035】
一実施形態によれば、計算機は、出力音響信号の平均音量と決定された入力音響信号の平均音量とが等しくなるように、圧縮機伝達関数を決定するように構成される。
【0036】
一実施形態では、計算機は、決定された音量範囲制御ゲインを調整器に提供するように構成される。
【0037】
一実施形態では、計算機は、計算された音量範囲制御ゲインが最大ゲイン値以下である場合にのみ、決定された音量範囲制御ゲインを調整器に提供するように構成される。一実施形態によれば、決定された音量範囲制御ゲインが最大ゲイン値よりも大きい場合、計算機は、調整器に最大ゲイン値を提供するように構成される。代替実施形態では、決定された音量範囲制御ゲインが最大ゲイン値よりも大きい場合、計算機は調整器にゲインを提供せず、調整器は最大ゲイン値を仮定するか、そのような状況のために保存されたゲインを使用する。
【0038】
さらなる実施形態において、計算機は、決定された圧縮機伝達関数および最大ゲイン値に基づいて音量範囲制御ゲインを決定し、決定された音量範囲制御ゲインが最大ゲイン値以下になるように構成される。したがって、計算機は、例えば、実際に決定されたゲイン値の最小値と最大ゲイン値とを計算することにより、決定された音量範囲制御ゲインを調整器に送るよう決定する。
【0039】
一実施形態によれば、最大ゲイン値は、ユーザ入力によって設定される。代替実施形態では、最大ゲイン値は、入力音響信号の目標音量範囲と決定された音量範囲との差に依存する。
【0040】
一実施形態によれば、装置は、目標音量範囲の値を受信するように構成された入力インターフェースをさらに備える。したがって、ユーザは入力インターフェースを介して、所望の目標音量範囲を入力する。
【0041】
装置およびそれに応じた方法のいくつかのさらなる実施形態は以下のとおりである。
【0042】
一実施形態では、評価器は、入力音響信号の音量を評価して、音量範囲および平均音量を決定するように構成される。計算機は、入力音響信号の目標音量範囲と決定された音量範囲との間の比に比例する勾配値を計算するように構成される。計算機は、入力音響信号の決定された平均音量に依存するシフト値を計算するように構成される(一実施形態では、シフトは、決定された平均音量に1と勾配の差を掛けたものに依存する)。計算機は、計算されたシフト値と計算された勾配値に依存する線形伝達関数に基づいて音量範囲制御データを計算するように構成されている。最後に、調整器は、入力音響信号と音量範囲制御データとに基づいて出力音響信号を提供するように構成されている。
【0043】
一実施形態では、線形伝達関数は、入力音響信号全体に対して有効である。この実施形態では、1つの線形伝達関数が入力音響信号全体、すなわちすべての音量値に使用される。一実施形態では、線形伝達関数は、非常に高いおよび/または低い音量値を除いて、入力音響信号全体に対して有効である。
【0044】
一実施形態によれば、評価器は、入力音響信号全体の音量範囲および平均音量を決定するように構成される。この実施形態は、入力音響信号のオフライン処理に特に関連している。
【0045】
一実施形態では、評価器は、入力音響信号の少なくとも一部の音量範囲および平均音量を決定するように構成される。
【0046】
一実施形態によれば、計算機は、比例定数と入力音響信号の目標音量範囲と決定された音量範囲との間の比との積として勾配値を計算するように構成される。目標音量範囲はユーザによって入力され、出力音響信号の音量範囲を指し、決定された音量範囲は入力音響信号によって与えられる。
【0047】
一実施形態では、比例定数は1に設定される。したがって、勾配値は、目標音量範囲と決定された音量範囲との比によって与えられる。
【0048】
一実施形態によれば、計算機は、出力音響信号の平均音量と入力音響信号の決定された平均音量とが等しくなるようにシフト値を計算するように構成される。
【0049】
一実施形態では、計算機は、以下の式を使用してシフト値を計算するように構成される:a=μin*(1−b)。シフト値はaで与えられ、入力音響信号の決定された平均音量はμinで示され、bは計算された勾配値である。
【0050】
一実施形態によれば、計算機は、音量範囲制御ゲインを提供するように構成され、調整器は、音量範囲制御ゲインを入力音響信号に適用するように構成される。
【0051】
一実施形態では、評価器は、短期持続時間を有する入力音響信号のフレームの入力音量値を決定するように構成される。計算機は、入力音響信号のフレームに対応する出力音響信号のフレームの出力音量値を提供するように構成されている。さらに、計算機は、次の式を使用して出力音量値を計算するように構成されている:Nout(k)=a+b*Nin(k)。ここで、Nout(k)は出力音量値、aはシフト値、bは勾配値、Nin(k)は入力音響信号の対応するフレームの決定された入力音量値、kはフレームの指標である。したがって、フレームは音量範囲および/または平均音量が決定される入力信号の一部である。
【0052】
一実施形態によれば、計算機は、出力音響信号のフレームの計算された音量値と入力音響信号の対応するフレームの決定された音量値との差として音量範囲制御ゲインを提供するように構成される。
【0053】
一実施形態では、計算機は、以下の式を使用して音量範囲制御ゲインを提供するように構成されている:G(k)=a+(b−1)*Nin(k)。G(k)は音量範囲制御ゲイン、aは計算されたシフト値、bは計算された勾配値、Nin(k)は入力音響信号のフレームの決定された入力音量値、kはフレームの指標である。したがって、音量範囲制御ゲインは、調整器によって使用される音量範囲制御データの例である。
【0054】
一実施形態によれば、調整器は、音量範囲制御ゲインを入力音響信号に適用して出力音響信号を提供するように構成される。
【0055】
一実施形態では、計算機は、調整器に計算された音量範囲制御ゲインを提供するように構成される。一実施形態によれば、提供される計算された音量範囲制御ゲインは、最大ゲイン値以下である。
【0056】
一実施形態によれば、最大ゲイン値は、ユーザ入力によって設定される。
【0057】
一実施形態では、最大ゲイン値は、目標音量範囲と入力音響信号の決定された音量範囲との差に依存する。
【0058】
一実施形態によれば、計算機は、調整器に計算された音量範囲制御ゲインを提供するように構成される。提供される計算された音量範囲制御ゲインは、一実施形態では、最小ゲイン値以上である。
【0059】
一実施形態では、評価器は、入力音響信号の統合音量を決定するように構成される。さらに、計算機は、入力音響信号の決定された統合音量および出力信号の目標統合音量に基づいてメイクアップゲイン値を計算するように構成される。最後に、調整器は、メイクアップゲイン値を適用することにより、出力音響信号の音量を変更するように構成されている。
【0060】
一実施形態によれば、評価器は、入力音響信号の統合音量を決定するように構成される。計算機は、シフト値、勾配値、および決定された統合音量に基づいてメイクアップゲイン値を計算するように構成されている。調整器は、メイクアップゲイン値を適用することにより、出力音響信号の音量を変更するように構成されている。
【0061】
一実施形態では、計算機は、次の式を使用してメイクアップゲイン値を計算するように構成される:Gmu=a+(b−1)Iin
muはメイクアップゲイン値、aはシフト値、bは勾配値、Iinは、入力音響信号の決定された統合音量である。
【0062】
この目的は、入力音響信号を処理する方法によっても達成される。表現入力音響信号は、発話信号と同様に音響信号を含む。
【0063】
入力音響信号を処理する方法は、少なくとも、
・入力音響信号の音量を評価して、音量範囲と実際の音量値を決定するステップと、
・決定された音量範囲、目標音量範囲、決定された実際の音量値、および決定された音量値の統計モーメントに基づいて、圧縮機伝達関数を決定するステップと、
・決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定するステップと、
・入力音響信号および少なくとも1つの決定された音量範囲制御ゲインに基づいて出力音響信号を提供するステップと、
を備えている。
【0064】
別の実施形態では、
・入力音響信号の音量を評価して、音量範囲と平均音量とを決定するステップと、
・目標音量範囲と決定された音量範囲との比に比例する勾配値を計算するステップと、
・決定された平均音量に依存するシフト値を計算するステップと、
・計算されたシフト値と計算された勾配値に依存する線形伝達関数とに基づいて音量範囲制御データを計算ステップと、
・入力音響信号および音量範囲制御データに基づいて出力音響信号を提供するステップと、
が実行される。
【0065】
上記の装置の実施形態は、この方法にも有効である。
【0066】
本発明はまた、コンピュータまたはプロセッサで動作しているときに、入力音響信号を処理する方法を実行するためのコンピュータプログラムに関する。
【0067】
本発明は、添付の図面および添付の図面に示される実施形態に関して以下に説明される。
【図面の簡単な説明】
【0068】
図1】最先端のLRACの伝達関数を示す。
図2】は、最先端のLRACの異なる伝達関数を示す。
図3】入力音響信号を処理するための装置のブロック図を示す。
図4】入力音響信号を処理する方法のステップの異なるブロック図を示している。
図5】勾配(図5a)と勾配およびシフト(図5b)の伝達関数を示す。
図6】(上図)映画の1時間の音響セグメントの短期音量ヒストグラムと(下図)2つの異なる伝達関数とを示す。
図7】例示的なヒストグラム、最新技術による異なる伝達関数、および本発明による伝達関数を示す。
【発明を実施するための形態】
【0069】
図1および図2は、最新技術による伝達関数を示す。
【0070】
図3は、入力音響信号100を処理し、出力音響信号101を提供する装置1の例示的な実施形態を示す。評価器10は、この示された実施形態において、入力音響信号100の音量範囲LRAinおよび平均音量μinを決定するために、入力音響信号100の音量を評価する。この示された実施形態では、評価器10は、入力音響信号100の統合音量Iinおよび入力音響信号100の異なるフレームkの入力音量値Nin(k)も決定する。
【0071】
決定された値は計算機11に送信され、計算機11は、入力インターフェース13を介してユーザによって入力された所望の目標音量範囲LRAdesも参照する。
【0072】
計算機11は、調整器12、すなわち音量の調整器、によって使用される音量範囲制御データを計算し、入力音響信号100に作用し、出力音響信号101を提供する。さらに、計算機11は、音量範囲制御ゲインGの形で音量範囲制御データを提供し、ここでも、メイクアップゲインGmuを提供する。これは、圧縮機伝達関数を決定した結果である。
【0073】
本実施形態では、本発明のLRACは、出力音響信号101の音量範囲制御を達成するために、入力音響信号100に線形変換を適用する。
【0074】
本発明のLRACのさらなる実施形態のブロック図が図4に示されている。
【0075】
この実施形態では、ステップは次のとおりである。
・音響を取得、つまり、入力音響信号を取得する。これは、次のxで示される。
・瞬間音量を計算する。
・計算された瞬間音量は、ユーザが設定した目標音量に依存するメイクアップゲインを計算するステップに使用される。
・計算された瞬間音量は、短期音量を計算するステップと、それに続く、ユーザが設定した目標音量範囲に依存する伝達関数を決定するステップにも使用される。
・決定された伝達関数は、上記のメイクアップゲインを計算するステップと、LRACゲインを計算する次のステップに送信される。
・LRACゲインおよびメイクアップゲインは、音響、つまり入力音響信号の次のステップで適用される。
・ここでyと名付けられた出力音響信号を出力する。
【0076】
出力音響信号yは次のように取得される。
y=g(LRAin,LRAdes,Nin)x (3)
ここで、gは、音量範囲を制御するために入力音響信号xに適用されるゲインである。ゲインgは、入力音響LRAinの音量範囲、所望の目標音量範囲LRAdes、および期間Ninにわたる音量測定値、例えば短期または瞬間音量に基づいて取得される。これは、評価器または入力音響信号の音量を評価するステップによって決定される実際の音量値とも呼ばれる。音量測定値Ninは、通常、時間変化する。一実施形態では、ゲインは、音量値の決定された統計モーメントに基づいてさらに取得される。統計モーメントは、例えば、ITU−R BS.1770[5]による音響入力の音量値または統合されたゲート音量の平均である。
【0077】
dB単位のゲインは
G(LRAin,LRAdes,Nin)=10log10(g(LRAin,LRAdes,Nin)) (4)
である。
【0078】
一実施形態では、ゲインGは、入力音響LRAinの音量範囲、所望の目標音量範囲LRAdes、および音量測定値の統計モーメントと音量測定値との差ΔNに基づくマッピング関数Qから得られる。
G(LRAin,LRAdes,Nin)=Q(LRAin,LRAdes,△N) (5)
【0079】
一実施形態では、ΔNの実現は、音響入力μinの平均音量(または代替として、ITU−R BS.1770[5]による音響入力の統合ゲート音量)と期間Ninの音量測定値との差、つまり次の式によって与えられる。
ΔN=μin−Nin
【0080】
期間Ninの音量測定値は、入力音響信号の期間またはフレームの実際の音量値のそのような例である。
【0081】
以下では、μinは入力音響信号の平均音量の一例である。別の実施形態では、μinは、ITU−R BS.1770[5]または長期の音量測定値を決定するための同様の規則による統合されたゲート音量を指す。一般に、μinは入力音響信号の音量値の統計モーメントである。
【0082】
あるいは、Gは、曲線KとシフトKshiftとの重ね合わせで構成される以下のマッピング関数に基づいて取得される。曲線はLRAinとLRAdesに依存し、シフトはμinに依存する。
G(LRAin,LRAdes,Nin)=K(LRAin,LRAdes,Nin)+Kshift(μin) (6)
【0083】
曲線Kの適切な選択は、例えば、シグモイド関数である。式(6)は、曲線Kが勾配Sで指定されている場合にさらに制限できる。
G(LRAin,LRAdes,Nin)=S(LRAin,LRAdes)Nin+Kshift(μin) (7)
【0084】
ご覧のように、マッピング関数は勾配SとシフトKshiftによって決定される。
【0085】
音量値が低い信号の過剰な増幅を回避するために、ゲインGは、最終的なゲインを取得するようにその後、制限される。
G(LRAin,LRAdes,Nin)=min(G(LRAin,LRAdes,Nin),Gmax) (8)
【0086】
ここで、Gmaxは最大許容ゲインである。この最大ゲインは、例えばユーザによって事前に定義するか、または入力音響信号に基づいて決定することができる。
【0087】
以下では、オフラインおよびオンラインLRACの実施形態について説明する。
【0088】
オフライン版では、入力音響信号全体が利用可能である。ここで、本発明のLRACは、音量範囲制御を達成するために、フレームごとに音響信号に線形変換を適用することに基づいている。この場合、曲線は決定された勾配を持つ線である。
【0089】
いくつかの理論的な考慮事項について説明する。
【0090】
標準偏差σおよび平均μの正規分布確率変数wが与えられた場合、勾配bおよびシフトaを持つ線形伝達関数の適用により、正規分布確率変数が得られる。
z=a+bw、(9)
確率変数zの標準偏差はσ=bσであり、平均μ=a+bμである。
【0091】
2つの仮定が行われる。
【0092】
1)音量測定値Nin(つまり、入力音響信号の決定された実際の音量値)は、正規分布確率変数である。
【0093】
2)入力標準偏差と出力標準偏差の比率は、入力LRAと出力LRAの比率に比例する。
(10)

ここで、ξは比例定数で、モデルへの音響信号の偏差を補正するために使用できる。通常、LRAは減少するため、LRA<LRAである。
【0094】
LRACゲインを決定する手順は次のとおりである。
最初に、時間依存音量測定値Nin(k)(kは音響フレームインデックス)、音量の平均μin、および入力音量範囲(LRA)LRAinは、入力音響信号から計算される。
選択される:
一実施形態では、ξ=1が設定される。
【0095】
ゲインは、次の2つの例示的な方法を使用して計算できる。
【0096】
〈方法1〉
式(5)を考慮すると、関数Qは次のように定義される。
(11)
および
△N(k)=μin−Nin(k) (12)
【0097】
一実施形態では、正規化項β(k)は時間変化する。一実施形態では、以下によって実現される。

ここで、γ>0は実数値であり、パラメータGmaxは、一実施形態では、例えばユーザによって、事前に定義されるか、または入力音響信号に基づいて決定される。例えば、
max=|LRAdes−LRAin| (13)
【0098】
したがって、この場合、ゲインは次のように決定できる。

(14)

別の実施形態では、正規化パラメータは省略される、すなわち、β(k)=1である。
【0099】
〈方法2〉
式(7)を考慮すると、関数SとKshiftは次のように定義できる。
S(LRAin,LRAdes)=b−1 (15)
および
shift(μin)=a (16)
ここで、式(16)のaは、次のように決定できる。
a=(1−b)μin
これにより、μout=μin、つまり、音量処理の前と後での統合音量の差が最小化される。
【0100】
したがって、この場合、ゲインは次のように決定できる。

G(LRAin,LRAdes,Nin(k))=(b−1)Nin(k)+a (17)
【0101】
a=(1−b)μinおよびb=LRAdes/LRAinを選択すると、上記の式は代わりに次のように表せる。
G(LRAin,LRAdes,Nin(k))=(1−b)△N(k) (18)
【0102】
これは、入力LRAと出力LRAの比率、および入力音響信号の平均音量μinと実際の音量値(例えば、短期または瞬間音量測定値)の差ΔN(k)に依存するマッピング関数に対応する。
【0103】
次に、決定されたゲインの値は、望ましい最大値に制限される。
G(LRAin,LRAdes,Nin(k))=min(G(LRAin,LRAdes,Nin(k)),Gmax) (19)
【0104】
〈決定された音量範囲制御ゲインの適用〉
フレームごとの出力信号は次の式で与えられる。
y(k)=g(LRAin,LRAdes,Nin(k))x(k) (20)
ここで、式(20)のgは、以下の式(21)で表される。
(21)
【0105】
LRAC処理による統合音量の変化をさらに低減するために、一実施形態では、例えば次のように入力統合音量Iinに直接変換を適用することにより、メイクアップゲインが計算される。
mu=(b−1)Iin+a (22)
【0106】
次に、ゲイン


が音響信号yに適用される。このメイクアップゲインを適用すると、通常、2LU未満の統合音量偏差が得られる。
【0107】
さらなる実施形態では、変換を適用すると、出力短期音量は次の式で与えられ、
out(k)=a+bNin(k)
ここで、kはフレームインデックスである。
【0108】
上記に基づいて、LRACゲインが計算される。
【0109】
dB単位のLRACゲインは次のように計算される。
G(k)=Nout(k)−Nin(k)=a+(b−1)Nin(k)
【0110】
短期間の音量値が低い信号の過剰な増幅を避けるため、一実施形態では、ゲインはその後、次のように制限される。
G(k)=min(G(k),Gmax
【0111】
ここで、Gmaxは最大許容ゲインである。この最大ゲインは、実施形態に応じて、推測的に定義されるか、音響信号に基づいて決定される。
max=|LRAdes−LRAin
【0112】
LRAC処理による統合音量の変化をさらに低減するために、一実施形態では、次のように入力統合音量Iinに直接変換を適用することにより、メイクアップゲインが計算される。
mu=a+(b−1)Iin
このメイクアップゲインGmuは、音響信号に適用される。
【0113】
オフライン処理のいくつかの側面は次のとおりである。
【0114】
線形伝達関数は、図5に示すように、音響信号の統計分析から決定された勾配bとシフトaで計算される。音量範囲制御(LRAC)ゲインは、この伝達関数に基づいて計算される。
【0115】
線形伝達関数の勾配bは、入力LRAとユーザが設定した所望の目標LRAの関数である。図5a)に示すように、入力音響信号に対する勾配のみに依存する伝達関数に基づいてLRACゲインを計算し入力音響信号に適用すると、LRAを制御するという望ましい効果が得られる。ただし、これにより、入力音量と出力音量との間に大きな違いが生じる。さらに、低音量レベルのセグメントの非常に高い増幅と、処理された入力音響信号のクリッピングまたは望ましくない変調アーチファクトにつながる可能性のある高音量レベルのセグメントの増幅につながる。
【0116】
勾配bとシフトaとの組み合わせにより、図5bに示す伝達関数が得られる。最終的なLRACゲインは、この伝達関数から決定される。シフトaにより、音量分布の平均が維持されるため、結果として生じる入力音量と出力音量との差は小さくなる。さらに、これにより、低音量レベルのセグメントに適用されるゲインが自動的に減少し、高音量レベルのセグメントの増幅が回避されるため、クリッピングおよび変調が回避される。
【0117】
いくつかの実施形態における決定されたLRACゲインのその後の制約は、バックグラウンドノイズなどの低レベル音響が過度に増幅されないことを保証する後処理ステップである。シフトaにより、得られたゲインは最初から妥当な範囲に留まり、適切な最大ゲインを推測的に定義できる。
【0118】
映画の音響抜粋の短期音量値の例示的なヒストグラムと、異なる所望のLRAに対応するゲイン関数とを図6に示す。示されているのは、LRAが22.8LUの映画の1時間の音響セグメントの短期音量ヒストグラムである(一番上の行)。また、それぞれ10LUと15LUの2つの所望のLRAの伝達関数も示している(下段)。
【0119】
一実施形態では、音量正規化ゲインが計算される。
【0120】
本発明のLRAC方法の適用は、音響の統合音量の変化をもたらし得る。ゲインを計算して、所望の目標の統合音量を達成できる。
【0121】
所望の目標音量が入力音量と等しくなるように選択された場合、測定された入力統合音量Iinと測定または推定された出力統合音量との差を計算することにより、正規化ゲインを得ることができる。出力統合音量は、入力瞬時音量値に変換を適用して得られる出力瞬時音量値を使用して推定できる。そうでない場合、正規化ゲインは、推定または測定された出力統合音量と所望の目標統合音量との差から計算される。
【0122】
オンラインLRACは、オフライン版から派生できる。オンライン版は、入力LRAの音響信号の時間セグメントと、音響信号全体ではなく平均音量評価を考慮する。この場合、パラメータは時間依存になる。つまり、a(k)=(1−b(k))μin(k)で、入力音量の統計モーメントが対応する出力音量の統計モーメントに等しくなるようにする。例えば平均音量値:μout(k)=μin(k)。さらに、b(k)=ξLRAdes/LRAin(k)である。
【0123】
したがって、2つのオンライン方法は次のとおりである。
【0124】
〈方法1〉
関数は次のように定義される。
(23)
および

△N(k)=μin(k)−Nin(k) (24)
および

ここで、γ>0は実数値であり、パラメータGmax(k)は、一実施形態では、時間に依存しないユーザが定義したパラメータGmax(k)=Gmaxとして定義されるか、信号依存パラメータGmax(k)=|LRAdes−LRAin(k)|である。
【0125】
したがって、この場合、ゲインは次のように決定できる。

(25)
【0126】
〈方法2〉
関数SとKshift(μin(k))は次のように定義される
S(LRAdes,LRAin(k))=b(k)−1 (26)
そして
shift(μin(k))=a(k) (27)
【0127】
LRACゲインは次のように計算される。
G(LRAdes,LRAin(k),Nin(k))=(b(k)−1)Nin(k)+a(k) (28)
【0128】
過度の増幅を避けるため、その後ゲインは次のように制限される。
G(LRAdes,LRAin(k),Nin(k))=min(G(LRAdes,LRAin(k),Nin(k)),Gmax(k)) (29)
【0129】
さらなる実施形態では、変換パラメータは次のように計算される。


そして
a(k)=(1−b(k))μin(k)、これにより、μout(k)=μin(k)が保証される。
【0130】
変換を適用すると、出力の短期音量は次のようになる。
out(k)=a(k)+b(k)Nin(k)
【0131】
次にLRACゲインは次のように計算される。
G(k)=Nout(k)−Nin(k)=a(k)+(b(k)−1)Nin(k)
【0132】
短期間の音量値が低い信号の過剰な増幅を避けるため、一実施形態では、ゲインはその後次のように制限される。
G(k)=min(G(k)、Gmax(k))
【0133】
ここで、Gmax(k)は一実施形態であり、時間に依存しない固定のユーザが定義したパラメータGmax(k)=Gmaxであり、別の実施形態では信号依存パラメータGmax(k)=|LRAdes−LRAin(k)|である。したがって、オンラインLRACは、入力音響信号の期間全体ではなく、入力音響信号の時間的セグメントを考慮する。
【0134】
本発明の方法の一実施形態は、以下のステップを含む。
【0135】
1)入力音響信号を受信するステップ。
【0136】
2)音響フレームのシーケンスについて、実際の音量値の例として、瞬間的または短期的な音量値を計算するステップ。
【0137】
3)計算された瞬間的または短期的な音量値の集合から入力音量範囲(LRA)を決定するステップ。
【0138】
4)勾配bとシフトaとに基づいて圧縮機伝達関数を決定するステップ。入力LRAと所望の目標LRAとから勾配bを決定し、音量値の統計モーメントからシフトaを決定する。
または、入力LRA、所望のLRA、および瞬間的または短期的な音量値と音量値の統計モーメントとの差に基づいて、圧縮機伝達関数を決定する。
または、曲線とシフトとに基づいて圧縮機伝達関数を決定する。入力LRAと所望のLRAとから曲線を決定し、音量値の統計モーメントからのシフトを決定する。
【0139】
5)決定された圧縮機伝達関数に基づいて、時間変化するLRACゲインを計算するステップ。
【0140】
6)入力音響信号の音響サンプルにLRACゲインを適用して、出力音響信号を決定するステップ。
【0141】
一実施形態では、勾配およびシフトに基づいて圧縮機伝達関数を決定するステップ、および入力LRAと所望のLRAとから勾配を決定し、計算された瞬間的または短期の音量値からシフトを決定するステップを含む。
【0142】
一実施形態は、以下のステップを含む。それより下では、伝達関数が、入力および所望の出力LRAから決定される勾配とは異なる勾配を有する、圧縮機伝達関数の閾値点を決定する。これは、最小圧縮機ゲインに制約をかけることに対応する。
【0143】
さらなる実施形態は、計算されたLRACゲインに適用される最大ゲイン制約を(発見的に)決定または定義するステップを含む。
【0144】
別の実施形態では、以下のステップが含まれる。瞬間的な音量値およびLRACゲインに基づいて、出力信号の所望の目標音量を得るために音量制御ゲインを計算する。入力音響信号の音響サンプルにLRACゲインと音量制御ゲイン(または両方の組み合わせ)とを適用して、出力音響信号を決定する。
【0145】
図7では、例示的なヒストグラムが上の図に示されている。中央の図は、最新の[4]動的拡散制御方法の伝達関数を示している。下図は、本発明による伝達関数を示している。伝達関数は、x軸に入力音量、y軸に出力音量を持つ図に示されている。3つの図すべてにマークされているのは平均音量である。
【0146】
[4]で提案されている方法には、2つのパラメータ、つまり、しきい値ポイントと勾配が必要である。しきい値ポイント(点と矢印でマーク)は、音量分布のパーセンタイルとして選択されるユーザ定義のパラメータである。これは、入力音響の種類ごとにしきい値がdB単位で変化することを意味する。ただし、選択したしきい値ポイントが平均値に近い場合、伝達関数の非線形部分により、音響にアーチファクトが生じる可能性がある。さらに、高いしきい値を選択した場合、望ましい動的拡散を実現するには、より大きな勾配が必要になる。ただし、勾配は入力と所望の動的拡散に基づいて計算され、選択したしきい値ポイントに依存しない。上記の考慮事項は、選択したしきい値によってはこれでは不十分な場合があることを示している。そのため、勾配の反復計算が必要である。
【0147】
提案された発明は、適切な伝達関数を決定するためにユーザまたは反復処理を必要としない。必要なパラメータはすべて、入力信号と所望のLRAから自動的に決定される。
【0148】
いくつかの態様を装置の文脈で説明したが、これらの態様は対応する方法の説明も表し、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応することは明らかである。同様に、方法ステップの文脈で説明される態様は、対応するブロックまたはアイテムまたは対応する装置の機能の説明も表す。方法ステップの一部またはすべては、例えばマイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(または使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちのいくつかの1つ以上が、そのような装置によって実行され得る。
【0149】
本発明の送信または符号化された信号は、デジタル記憶媒体に格納することができ、または無線伝送媒体またはインターネットなどの有線伝送媒体などの伝送媒体で送信することができる。
【0150】
特定の実行要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実行することができる。電子的に読み取り可能な制御信号が保存されたデジタル記憶媒体、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行できる。その上で、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協力する(または協力することができる)。したがって、デジタル記憶媒体はコンピュータで読み取り可能であってもよい。
【0151】
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0152】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の1つを実行するように動作する。プログラムコードは、例えば、機械読み取り可能なキャリアに保存されてもよい。
【0153】
他の実施形態は、機械読み取り可能なキャリアに格納された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
【0154】
言い換えれば、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0155】
したがって、本発明の方法のさらなる実施形態は、本書に記載されている方法のうちの1つを実行するためのコンピュータプログラムを記録したデータキャリア(またはデジタル記憶媒体などの非一時的記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は通常、有形および/または非一時的である。
【0156】
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号シーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
【0157】
さらなる実施形態は、本明細書に記載の方法の1つを実行するように構成または適合された処理手段、例えばコンピュータまたはプログラム可能な論理デバイスを含む。
【0158】
さらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。
【0159】
本発明によるさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的または光学的に)転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
【0160】
いくつかの実施形態では、プログラマブル・ロジック・デバイス(例えば、フィールド・プログラマブル・ゲート・アレイ)を使用して、本明細書に記載の方法の機能性の一部またはすべてを実行することができる。いくつかの実施形態では、フィールド・プログラマブル・ゲート・アレイは、本明細書に記載の方法の1つを実行するためにマイクロプロセッサと協働してもよい。一般に、これらの方法は、任意のハードウェア装置によって実行されることが好ましい。
【0161】
上述の実施形態は、本発明の原理の単なる実例である。本明細書に記載の配置および詳細の修正および変更は、当業者には明らかであることを理解されたい。したがって、本明細書の実施形態の説明および説明として提示される特定の詳細によってではなく、差し迫った特許請求の範囲によってのみ制限されることが意図されている。
【先行技術文献】
【非特許文献】
【0162】
[1]EBU Tech Doc 3342 Loudness Range:A Descriptor to supplement Loudness Normalization in accordance with EBU R 128(2016)
[5]ITU−R、勧告ITU−R BS.1770−3.音響プログラムの音量とトゥルーピーク音響レベルを測定するアルゴリズム、2012年8月(Algorithm to measure audio programme loudness and true−peak audio level,08/2012.)。
[6]EBU Tech Doc 3341音量メータリング:EBU R 128に従って音量の正規化を補完する「EBUモード」メータリング
【特許文献】
【0163】
[2]米国特許第8229125号明細書
[3]米国特許出願公開第2014/0369527号明細書
[4]米国特許第7848531号明細書
図1
図2
図3
図4
図5a
図5b
図6
図7