(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0019】
以下、図面を参照して本発明を実施するための形態について詳細に説明する。
【0020】
図3は、本発明の実施形態によるラウドネス調整装置の機能的な構成を示すブロック図である。
【0021】
図3を参照すると、このラウドネス調整装置は、デコーダ101、入力側モーメンタリラウドネス計算部103、可変ゲイン増幅器105、第1のK特性フィルタ107、ブースタ109、第2のK特性フィルタ111、リミッタ/コンプレッサ113、エンコーダ115、第3のK特性フィルタ117、内部モーメンタリラウドネス計算部119、内部ショートタームラウドネス計算部121、選択スイッチ123及び制御部125を含む。
【0022】
デコーダ101は、入力データ1をデコードして、音声データ2と付加情報(音声モード情報、切替情報、ラウドネス運用情報等)12を抽出する。音声データ2は、音声信号を表すものである。
【0023】
入力側モーメンタリラウドネス計算部103は、音声データ2により表される音声信号の入力側モーメンタリラウドネスを計算する。ここで、モーメンタリラウドネスは、ITU-R B.1771で定義されているものである。
【0024】
可変ゲイン増幅器105は、音声データ2に対してラウドネス調整を行う。ラウドネス調整における調整ゲインは、ゲイン制御データ11により指定される。また、調整ゲイン(dB)は、マイナスからプラスの範囲に亘る。つまり、可変ゲイン増幅器105は、調整ゲインに応じて、入力音声信号を増幅し、又は、減衰させる。また、調整ゲイン(dB)が時間的に減少傾向にあるときには、アタック処理がされているといい、調整ゲイン(dB)が時間的に増加傾向にあるときには、リリース処理がされているという。
【0025】
第1のK特性フィルタ107は、可変ゲイン増幅器105によるラウドネス調整をされた後の音声信号である第1の中間音声信号3に対してフィルタ処理を行う。第1のK特性フィルタ107は、ARIB TR−B32の「3.2 K特性フィルタ」で定義されているフィルタであり、それぞれ所定の周波数特性を有する2次のIIRフィルタを2段接続することにより構成されている。第1段目のIIRフィルタは、頭部形状の音響効果に相当する周波数応答特性を有し、第2段目のIIRフィルタは、RLB特性を有する。
【0026】
ブースタ109は、基本的には、第1のK特性フィルタ107によりフィルタ処理された後の音声信号4のレベルに応じて、
図4(a)に示すゲイン特性に従って、第1の中間音声信号3に対してブースト処理を行う。
図4(a)に示すように、ブースタ109は、音声信号4のレベルがゲート閾値以上でありブースト閾値以下の範囲にある場合には、第1の中間音声信号3をブーストし、音声信号4のレベルがその範囲にない場合には、第1の中間音声信号3をブーストしない。なお、
図4(a)に示すように、ブーストする場合のブーストゲインは、基本的には一定であるが、ブースト後のレベルがブースト閾値以上にならないように調整される。また、ブーストゲインは、本発明に従って、更に、調整されるが、これに関しては後述する。ブースタ109は、
図4(a)に示すゲイン特性以外の特性を有していてもよい。
【0027】
第2のK特性フィルタ111は、ブースタ109によるブースト処理をされた後の音声信号である第2の中間音声信号5に対してフィルタ処理を行う。第2のK特性フィルタ111の特性は、第1のK特性フィルタ107の特性と同一である。
【0028】
リミッタ/コンプレッサ113は、第2のK特性フィルタ111によりフィルタ処理された後の音声信号6のレベルに応じて、
図4(b)に示すゲイン特性に従って、第2の中間音声信号5に対して超過振幅抑圧処理を行い、この処理の結果を出力音声信号7として出力する。
図4(b)に示すように、リミッタ/コンプレッサ113は、音声信号5のレベルが上限閾値以上である場合には、第2の中間音声信号5を抑圧する。リミッタ/コンプレッサ113は、
図4(b)に示すゲイン特性以外の特性を有していてもよい。また、入力音声信号によっては、リミッタ/コンプレッサ113に入力される第2の中間音声信号5のレベルは上限閾値を全く超えないことがあり、このような場合には、実質的には、リミッタ/コンプレッサ113が削除され、ブースタ109が出力する第2の中間音声信号5が、エンコーダ115及び第3のK特性フィルタ117に直接供給される構成と同様となる。
【0029】
エンコーダ115は、出力音声信号7に対して所定のエンコーダ処理を行い、この処理の結果を出力音声データ16として出力する。
【0030】
第3のK特性フィルタ117は、出力音声信号7に対してフィルタ処理を行う。第3のK特性フィルタ111の特性は、第1のK特性フィルタ107の特性と同一である。
【0031】
内部モーメンタリラウドネス計算部119は、第3のK特性フィルタ117により処理された出力音声信号7である音声信号8に基づいて、内部モーメンタリラウドネス9を生成するための処理を行う。ここで、モーメンタリラウドネスは、ITU-R B.1771で定義されているものである。
【0032】
内部ショートラウドネス計算部121は、第3のK特性フィルタ117により処理された出力音声信号7である音声信号8に基づいて、内部ショートタームラウドネス10を生成するための処理を行う。ここで、ショートタームラウドネスは、ITU-R B.1771で定義されているものである。
【0033】
モーメンタリラウドネスは、400ミリ秒の時定数を有し、ショートタームラウドネスは、3秒の時定数を有するので、モーメンタリラウドネスよりもショートタームラウドネスは、より平滑化されたものとなる。
【0034】
選択スイッチ123は、デコーダ101から入力した付加情報12及び外部から入力した制御情報13のうちの何れかを選択して、セレクタ出力信号15として出力する。
【0035】
制御部125は、内部モーメンタリラウドネス9、内部ショートタームラウドネス10、ターゲットラウドネス14、許容ラウドネス初期値20及びセレクタ出力信号15に基づいて、ゲイン制御データ11を生成する。ここで、ターゲットラウドネス14は、ARIB TR−B32などの所定の規定で定められたものである。許容ラウドネス初期値20は、ターゲットラウドネス14よりもレベルが上回る。
【0036】
ゲイン制御データ11に関連する制御は、アタック処理に関連する制御と、リリース処理に関連する制御を含む。
【0037】
図5を参照して、制御部125により行われるアタック処理に関連する制御を説明する。
【0038】
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、アタック処理が実行中でなく(ステップS203でNO)、且つ、内部ショートタームラウドネス10が増加傾向である(ステップS205でYES)時には、前記アタック処理を開始するべきであるとする判断する(ステップS207)。ゲイン制御データは、その判断に応じて変更される。なお、後述するように、許容ラウドネスとは、許容ラウドネス初期値20により初期化されるが、条件に応じて変動する変数である。
【0039】
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、アタック処理が実行中であり(ステップS203でYES)、且つ、内部ショートタームラウドネス10が増加傾向である(ステップS209でYES)時には、アタック処理を継続するべきであるとする(ステップS207)。
【0040】
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、前記アタック処理が実行中であり(ステップS203でYES)、且つ、内部ショートタームラウドネスが増加傾向でない(ステップS209でNO)時には、アタック処理を中断するべきであるとする(ステップS211)。ゲイン制御データは、その判断に応じて変更される。
【0041】
アタック処理に関連する制御における動作例を
図6を参照して説明する。なお、許容ラウドネスは、この例においては、変化しないこととしているが、本実施形態では、後述するように変化する。
【0042】
図6を参照すると、時刻T1から時刻T2までの期間、時刻T3から時刻T4までの期間、時刻T5から時刻T6までの期間、時刻T7から時刻T8までの期間、及び、時刻T9から時刻T10までの期間においては、内部モーメンタリラウドネスは、許容ラウドネスより大きく、それ以外の期間では、内部モーメンタリラウドネスは、許容ラウドネス以下である。
【0043】
また、時刻L1から時刻L2の期間、時刻L3から時刻L4の期間、及び、時刻L5から時刻L6の期間においては、内部ショートタームラウドネスは、増加傾向であり、それ以外の期間では、内部ショートタームラウドネスは、減少傾向である。
【0044】
時刻T1から時刻T2の期間においては、内部モーメンタリラウドネスが許容ラウドネスより大きく、内部ショートタームラウドネスが増加傾向であるので、ステップS201、S203、S205、S207又はステップS201、S203、S209、S207により、アタック処理が行われる。
【0045】
時刻T2から時刻T3の期間においては、内部モーメンタリラウドネスは許容ラウドネス以下であるので、ステップS201のみ実行されアタック処理中断が行われず、そのままアタック処理が継続される(アタック処理が継続するとは、アタック処理による減衰量が増加することを意味する)。
【0046】
時刻L2からは、アタック処理が継続中であり、内部モーメンタリラウドネスが許容ラウドネス以上であり、また、それまで増加傾向であった内部ショートタームラウドネスが減少傾向に変化するので、ステップS201、S203、S209、S211により、アタック中断処理が行われ、それからアタック処理は中断される。しかし、モーメンタリラウドネスがリリース閾値以上であるため、リリース処理は行われない。従って、アタック処理は中断され処理継続中のゲイン量が継続的に維持される。
【0047】
時刻T5においては、それまで許容ラウドネス未満であった内部モーメンタリが許容ラウドネス以上となるが、アタック処理はOFFであり、内部ショートタームラウドネスが減少傾向であるので、ステップS201、S203、S205のみ実行され、アタック処理はOFFのままである。
【0048】
時刻L3においては、内部モーメンタリラウドネスが許容ラウドネス以上であり、アタック処理はOFFであり、それまで減少傾向であった内部ショートタームラウドネスが増加傾向に変化するので、ステップS201、S203、S205、S207が実行され、アタック処理が再開される。時刻L3からは同様な判断がされて、アタック処理による減衰量が増加していく。
【0049】
時刻L4においては、内部モーメンタリラウドネスが許容ラウドネス以上であり、アタック処理が継続中であり、それまで増加傾向であった内部ショートタームラウドネスが減少傾向になるので、ステップS201、S203、S209、S211が実行され、アタック処理が中断される。
【0050】
時刻T7においては、それまで許容ラウドネス未満であった内部モーメンタリラウドネスが許容ラウドネス以上となるが、現在アタック処理が中断されていて、内部ショートタームラウドネスが減少傾向であるので、ステップS201、S203、S205が実行され、アタック処理は中断されたままとなる。
【0051】
時刻L5においては、それまで減少傾向であった内部ショートタームラウドネスが増加傾向となるが、内部モーメンタリラウドネスが許容ラウドネス未満であるので、ステップS201のみが実行され、アタック処理は中断されたままとなる。
【0052】
時刻T9においては、それまで許容ラウドネス未満であった内部モーメンタリラウドネスが許容ラウドネス以上となり、それまではアタック処理は中断されたままであり、内部ショートタームラウドネスは増加傾向であるので、ステップS201、S203、S205、S207が実行され、アタック処理が再開される。
【0053】
このようにアタック処理のON/OFFが制御されるため、
図7に示すような出力音声信号を得ることができる。
【0054】
リリース処理に関しては、時刻M1と時刻M2との間の期間において、内部モーメンタリラウドネスがリリース閾値を下回るので、この期間においては、リリース処理がONになる。
【0055】
従って、可変ゲイン増幅105のゲインは、時刻T1から時刻L2までの期間では、徐々に減少し、時刻L2から時刻L3の期間では、時刻L2における値のまま不変で、時刻L3から時刻L4までの期間では、再度、徐々に減少し、時刻L4から時刻M1までの期間では、時刻L4における値のまま不変である。更に、可変ゲイン増幅器105のゲインは、時刻M1から時刻M2までの期間では、徐々に増加し、時刻M2から時刻T9までの期間では、時刻M2の値のまま不変で、時刻T9以降に再度徐々に減少する。
【0056】
特許文献1に記載されている装置においては、ステップS203で内部モーメンタリラウドネス119と比較される相手は、ターゲットラウドネスであるが、本実施形態においては、ステップS203で内部モーメンタリラウドネス119と比較される相手は、ターゲットラウドネスよりも数dB(例えば、2〜4dB)レベルが高い許容ラウドネスである。従って、本実施形態は、特許文献1に記載されている装置と比較すると、アタック処理が開始されたり、アタック処理が継続されるための内部モーメンタリラウドネス119のレベルが高くなり、従って、可変ゲイン増幅器105により必要以上に入力音声信号2が抑圧されてしまうことを防止することができる。従って、音質劣化の原因となる抑圧処理を適用しなくて済むコンテンツを増やすことができる。特に、コンテンツ製作者により意図的に音声レベルにある程度の抑揚を付けることにより効果を出しているコンテンツを扱う場合であっても、抑圧処理を適用しなくて済み、コンテンツ製作者の意図をそのまま活かすことできる可能性が大きくなる。
【0057】
ここで、
図5を参照して説明したアタック処理に関連する制御を行うと、コンテンツ全体に亘る平均ラウドネスがターゲットラウドネスを上回ってしまう場合が生じる。そこで、
図8の一部を参照して説明するように許容ラウドネスを減少させる。内部ショートタームラウドネス10が許容ラウドネス14よりも高い(ステップS221でYES)時には、許容ラウドネスを減少させる(ステップS223)。こうすることにより、内部ショートタームラウドネス10がターゲットラウドネス14よりも高い状態が継続する場合には、徐々に許容ラウドネスを下げることができるので、これにより上述したアタック処理を開始したり、アタック処理を継続するための内部モーメンタリラウドネス9を下げることができるようになり、第1中間音声信号3のレベルを徐々に下げていくことができ、従って、出力音声信号7のレベルも徐々に下げていくことができる。また、出力音声信号7のレベルが徐々に下がるようにすることにより、聴覚上の違和感をなくすことができる。
【0058】
許容ラウドネスは、ステップS223の処理を継続すると、ターゲットラウドネス14よりも低くなる。しかし、基本的には、許容ラウドネスをターゲットラウドネス14よりも高くしておく必要がある。そこで、
図8の他の部分を参照して説明するように許容ラウドネスを増加させる。内部ショートタームラウドネス10が許容ラウドネス14以下であり(ステップS221でNO)、且つ、許容ラウドネスが許容ラウドネス初期値20よりも小さい(ステップS225でYES)時には、許容ラウドネスを増加させる(ステップS227)。増加率は適宜調整する。また、増加後に許容ラウドネス初期値20を上回らないようにする。こうすることにより、内部ショートタームラウドネス10がターゲットラウドネス14よりも低くなってから、徐々に許容ラウドネスを許容ラウドネス初期値20に戻すことができる。
【0059】
また、
図9(a)に示すように、通常技術を用いた場合、元々、平均ラウドネスが、最終的にはターゲットラウドネスと同一レベルになるようにコンテンツ制作時に調整されていても、入力側ショートタームラウドネスがターゲットラウドネスを上回る期間がある程度続くと、ラウドネスコントロールされた平均ラウドネスが、最終的にはターゲットラウドネスを下回るレベルになってしまう。
【0060】
これに対して、
図9(b)に示すように、本実施形態では、入力側ショートタームラウドネスがターゲットラウドネスを上回る期間がある程度続いても、その期間において入力側ショートタームラウドネスが許容ラウドネスを下回っていれば、ラウドネスコントロールされた平均ラウドネスは、最終的にはターゲットラウドネスと同一レベルになる。
【0061】
また、
図9(c)に示すように、入力側ショートタームラウドネスがターゲットラウドネスのみならず許容ラウドネスも上回ってしまう期間がある程度続くと、平均ラウドネスがターゲットラウドネスを上回ってしまうことがあることを防止するために、
図9を参照して説明した方法により許容ラウドネスのレベルを制御しているので、平均ラウドネスは、最終的にはターゲットラウドネスと同一レベルになる。
図9(c)の例では、入力側ショートタームラウドネスのレベルが一定であっても、制御により許容ラウドネスが徐々に減少して、それに伴い、ラウドネスコントロールされた内部ショートタームラウドネスも減少していくこととも示している。
【0062】
図10を参照して、制御部125により行われるリリース処理に関連する制御を説明する。
【0063】
音声モードに変化がなく(ステップS241でNO)、且つ、内部モーメンタリラウドネス9がリリーススタート閾値以下である(ステップS243でYES)時には、通常リリース処理をするべきであると判断する(ステップS245)。ゲイン制御データは、その判断に応じて変更される。
【0064】
また、音声モードに変化がある(ステップS241でYES)時には、高速リリース処理をするべきであると判断する(ステップS247)。ゲイン制御データは、その判断に応じて変更される。
【0065】
次に、可変ゲイン増幅器105で行われるラウドネス調整における調整ゲインと、ブースタ109で行われるブースト処理におけるブーストゲインとの双方を、制御部125により制御する方法について
図11及び
図12を参照して説明する。この方法においては、現在の調整ゲインと現在のブーストゲインに基づいて、これらを修正する。現在の調整ゲインは、制御部125で保持されており、現在のブーストゲインは、ブースタ109から制御部18に入力される信号18により示され、修正後の調整ゲインは、ゲイン制御データ11により示され、修正後のブーストゲイン17は制御部125からブースタ109に出力される信号17により示される。
【0066】
図11(a)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)を超えている(ステップS263でYES)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されていて、その減衰量以上にブーストされている状態を示している。このような状態である時には、現在のブーストゲイン(dB)にラウドネス調整ゲインを加算することにより得た値を修正後のブーストゲイン(dB)とし(ステップS265)、更に、ゼロ(dB)を修正後のラウドネス調整ゲインとする(ステップS267)。こうすることにより、可変ゲイン増幅器105により入力音声信号2が減衰されることがなくなり、また、ブースタ109によるブーストゲインを最小限にすることができる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のラウドネス調整ゲインがゼロ(dB)を超え、現在のラウドネス調整ゲイン未満として、修正前後のラウドネス調整ゲインの差分を現在のブーストゲインから差し引くことにより修正後のブーストゲインを得るようにしても)、一定の効果を得ることができる。
【0067】
図11(b)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)未満である(ステップS263でNO、ステップS269でYES)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されても、その減衰量のうちの一部を相殺するようにブーストされている状態を示している。このような状態である時には、ゼロ(dB)を修正後のブーストゲインとし(ステップS271)、更に、現在のブーストゲイン(dB)にラウドネス調整ゲインを加算することにより得た値を修正後のラウドネス調整ゲイン(dB)とする(ステップS273)。こうすることにより、可変ゲイン増幅器105による減衰量を減らすことができ、また、ブースタ109により第1中間音声信号3がブーストされることがなくなる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のブーストゲインがゼロ(dB)を超え、現在のブーストゲイン未満として、修正前後のブーストゲインの差分を現在のラウドネス調整ゲインから差し引くことにより修正後のラウドネスゲインを得るようにしても)、一定の効果を得ることができる。
【0068】
図11(c)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)である(ステップS263でNO、ステップS269でNO)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されても、その減衰量の全部をキャンセルするようにブーストされている状態を示している。このような状態である時には、ゼロ(dB)を修正後のブーストゲインとし(ステップS275)、更に、ゼロ(dB)を修正後のラウドネス調整ゲイン(dB)とする(ステップS277)。こうすることにより、可変ゲイン増幅器105により入力音声信号2が減衰されることがなくなり、また、ブースタ109により第1中間音声信号3がブーストされることがなくなる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のラウドネス調整ゲインと修正後のブーストゲインとが残るようにしても)、一定の効果を得ることができる。
【0069】
従って、
図11(a)、(b)、(c)の処理がされることにより、ブーストゲイン(dB)がゼロ(dB)を超え、且つ、調整ゲイン(dB)がゼロ(dB)未満である場合には、ブーストゲイン(dB)を減少させ、又は、ブースタ109によるブーストを中断し、ブーストゲイン(dB)と調整ゲイン(dB)の和を維持するように調整ゲインが修正されることとなる。
【0070】
図11(a)、(b)、(c)及び
図12を参照して説明した処理を行うことにより、
図1を参照して説明した通常技術の問題を解決することができる。従って、出力音声信号は最初から
図5(c)に示すように、音声信号が低レベルから高レベルに立ち上がった直後のオーバーシュートと音声信号が高レベルから低レベルに立ち下がった直後のアンダーシュートが発生していないものとなる。また、この状態において、可変ゲイン増幅器105は音声信号を必要以上に減衰させず、ブースタ109は低レベル側の音声信号を必要以上にブーストしない。
【0071】
次に、ブースタ109において、更に、ブーストゲインを制御する方法について
図13を参照して説明する。
【0072】
入力側モーメンタリラウドネス計算部103で計算された入力側モーメンタリラウドネスがブーストゲート閾値を超える(ステップS291でYES)時には、ブースタ109におけるブーストゲインを0(dB)にする。すなわち、ブースタ109によるブーストを解放する。ブーストゲート閾値は、例えば、
図4に示すブースト閾値を僅かに上回る値に設定するが、この限りではない。こうすることにより
図2を参照して説明した通常技術の問題を解決することができる。すなわち、
図2に示すような音声信号を入力した場合、ブーストゲート閾値以上の音声信号のブーストをしないことにより、不要なラウドネス制御をなくすことができる。
【0073】
図11及び
図12を参照して説明した機能と
図13を参照して説明した機能により、可変ゲイン増幅器105における乗算とブースタ109における乗算の双方を行うことによる演算誤差の多重発生を極力避けることができ、これにより出力音声信号の品質を向上させることができる。また、街頭での演説などの放送の場合のように、レベルが比較的高いベースノイズ(背景ノイズ)と間欠音声信号が重畳された音声信号を入力した場合には、ベースノイズによる必要以上のブーストゲインを抑制することができ、従って、自然な音質を維持することができる。
【0074】
なお、上記のラウドネス調整装置は、ハードウェア、ソフトウェア又はこれらの組合わせにより実現することができる。また、上記のラウドネス調整装置により行なわれるラウドネス調整方法も、ハードウェア、ソフトウェア又はこれらに組合わせにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
【0075】
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0076】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0077】
(付記1)
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、
を備えることを特徴とするラウドネス調整装置。
【0078】
(付記2)
付記1に記載のラウドネス調整装置であって、
前記制御手段は、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整装置。
【0079】
(付記3)
付記2に記載のラウドネス調整装置であって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整装置。
【0080】
(付記4)
付記2又は3に記載のラウドネス調整装置であって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブースト手段によるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整装置。
【0081】
(付記5)
付記1乃至4の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブースト手段によるブースト処理を解放することを特徴とするラウドネス調整装置。
【0082】
(付記6)
付記1乃至5の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、
前記可変ゲイン増幅手段によりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整装置。
【0083】
(付記7)
付記6に記載のラウドネス調整装置であって、
前記制御手段は、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整装置。
【0084】
(付記8)
付記6又は7に記載のラウドネス調整装置であって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整装置。
【0085】
(付記9)
付記5乃至7の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅手段によるリリース処理を制御することを特徴とするラウドネス調整装置。
【0086】
(付記10)
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅ステップと、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブーストステップと、
前記ブースト処理後の前記第1中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記ラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御ステップと、
を有することを特徴とするラウドネス調整方法。
【0087】
(付記11)
付記10に記載のラウドネス調整方法であって、
前記制御ステップは、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整方法。
【0088】
(付記12)
付記11に記載のラウドネス調整方法であって、
前記制御ステップは、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整方法。
【0089】
(付記13)
付記11又は12に記載のラウドネス調整方法であって、
前記制御ステップは、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブーストステップによるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整方法。
【0090】
(付記14)
付記10乃至13の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブーストステップによるブースト処理を解放することを特徴とするラウドネス調整方法。
【0091】
(付記15)
付記10乃至14の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、
前記可変ゲイン増幅ステップによりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整方法。
【0092】
(付記16)
付記15に記載のラウドネス調整方法であって、
前記制御ステップは、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整方法。
【0093】
(付記17)
付記15又は16に記載のラウドネス調整方法であって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整方法。
【0094】
(付記18)
付記14乃至16の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅ステップによるリリース処理を制御することを特徴とするラウドネス調整方法。
【0095】
(付記19)
コンピュータをラウドネス調整装置として機能させるためのラウドネス調整用プログラムであって、
前記コンピュータを、
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
前記ブースト処理後の前記第1中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、
として機能させることを特徴とするラウドネス調整用プログラム。
【0096】
(付記20)
付記19に記載のラウドネス調整用プログラムであって、
前記制御手段は、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整用プログラム。
【0097】
(付記21)
付記20に記載のラウドネス調整用プログラムであって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整用プログラム。
【0098】
(付記22)
付記20又は21に記載のラウドネス調整用プログラムであって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブースト手段によるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整用プログラム。
【0099】
(付記23)
付記19乃至22の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブースト手段によるブースト処理を解放することを特徴とするラウドネス調整用プログラム。
【0100】
(付記24)
付記19乃至23の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、
前記可変ゲイン増幅手段によりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整用プログラム。
【0101】
(付記25)
付記24に記載のラウドネス調整用プログラムであって、
前記制御手段は、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整用プログラム。
【0102】
(付記26)
付記24又は25に記載のラウドネス調整用プログラムであって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整用プログラム。
【0103】
(付記27)
付記23乃至25の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅手段によるリリース処理を制御することを特徴とするラウドネス調整用プログラム。
【0104】
(付記28)
付記1乃至9の何れか1に記載のラウドネス調整装置であって、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧手段を更に備え、
前記制御手段は、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて動作することを特徴とするラウドネス調整装置。
【0105】
(付記29)
付記10乃至18の何れか1に記載のラウドネス調整方法であって、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧ステップを更に有し、
前記制御ステップは、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて行われることを特徴とするラウドネス調整装置。
【0106】
(付記30)
付記19乃至27の何れか1に記載のラウドネス調整用プログラムであって、
前記コンピュータを、更に、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧手段として機能させ、
前記制御手段は、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて動作することを特徴とするラウドネス調整用プログラム。