(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、マルチトラックレコーダにおいては、通常、歪まない程度にできるだけ大きなレベルでミックスダウンを行い、その後、マスタリング処理を行うことで録音を完了させる。マスタリング処理は、音質補正(イコライザ処理)や音圧を上げる処理(圧縮処理)、指定したレベルに合わせ込む処理(ノーマライズ)を実行することであるが、ある程度の知識や経験がないと所望の結果を得るのが難しい。特に、音圧を上げる圧縮処理は、閾値(スレッシュホールド)や比率(レシオ)の調整が比較的困難であるため、例えば曲の種類毎にいくつかプリセットを用意しておき、ユーザがこれらのプリセットの中から所望のプリセットを選択できるような構成が提案されているが、適正な録音レベルでミックスダウンされていなければプリセットも効果がない問題がある。
【0006】
図5A及び
図5Bに、マスタリング処理における圧縮処理(コンプレッサ)を模式的に示す。
図5Aは、ミックスダウンが適正なレベルで行われている場合の圧縮処理である。図において、0dBFSは、基準となる目標レベルであり、THは、圧縮処理における閾値である。圧縮処理は、閾値を超えるレベルを所定の比率で圧縮し、閾値以下のレベルをそのまま維持する処理である。従って、
図5Aに示すように、ミックスダウンが適正なレベルで行われ、そのレベルが閾値THに達する場合には圧縮処理が意味を持つ。
【0007】
他方、
図5Bは、ミックスダウンが適正なレベルで行われていない場合、つまり、レベルが小さすぎる場合の圧縮処理である。オーバレベルによる歪みを考慮すると、ミックスダウンのレベルを小さくすることが有効であるが、レベルが小さすぎると閾値THに達しないこととなり、圧縮が全く行われないため意味がなくなってしまう。これは、複数のプリセットを用意しても同様であり、選択されたプリセットの閾値THとの比較においてミックスダウンのレベルが小さければ、圧縮処理は実質的に機能しないことになる。
【0008】
本発明の目的は、ミックスダウンして得られるステレオ音声信号等の音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行できる録音装置を提供することにある。
【課題を解決するための手段】
【0009】
本発明は、音声信号を記録する録音装置であって、音声信号の第1ピーク値を検出するピーク値検出手段と、検出された第1ピーク値を用いて圧縮処理の閾値を調整する閾値調整手段と、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮するとともに、圧縮後の音声信号の第2ピーク値を検出する圧縮手段とを備えることを特徴とする。
【0010】
本発明の1つの実施形態では、さらに、複数トラックの各トラックに割り当てられた音声信号からステレオ音声信号を生成するミックスダウン手段を備え、前記ミックスダウン手段が、前記ピーク値検出手段として音声信号の第1ピーク値を検出することを特徴とする。
【0011】
本発明の他の実施形態では、さらに、検出された前記第2ピーク値を用いて前記圧縮手段で処理された音声信号のレベルを目標の基準レベルまで増幅するノーマライズ手段を備えることを特徴とする。
【0012】
本発明のさらに他の実施形態では、前記圧縮手段は、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮すると同時に、圧縮処理された音声信号のレベルを、前記第2ピーク値を用いて目標の基準レベルまで増幅することを特徴とする。
【0013】
本発明のさらに他の実施形態では、前記ピーク値検出手段は、音声信号の所定下限周波数以下及び所定上限周波数以上をカットする手段と、所定下限周波数以下及び所定上限周波数以上がカットされた音声信号のエンベロープを検出する手段とを備え、前記エンベロープのピーク値を前記第1ピーク値として検出することを特徴とする。
【発明の効果】
【0014】
本発明によれば、音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行することができる。本発明によれば、音声信号のレベルが小さい場合でも、確実に圧縮処理を実行できるので、ユーザはマスタリング処理の有効性を実感し得る。
【発明を実施するための形態】
【0016】
以下、図面に基づき本発明の実施形態について、録音装置としてマルチトラックレコーダを例にとり説明する。
【0017】
図1に、本実施形態におけるマルチトラックレコーダ1の構成ブロック図を示す。音声信号入力回路10は、複数の入力ポートを備え、複数の音源(ソース)からの音声信号を入力する。複数の音声信号を例示すると、ギター、ボーカル、ドラム等である。音声信号入力回路10は、内蔵マイク及び/又は入力ポートを備え、音声信号を入力する。内蔵マイクと入力ポートの双方を備える場合、内蔵マイクと入力ポートは相互に切替可能である。音声信号入力回路10から入力された音声信号は、バス16を介してDSP(デジタルシグナルプロセッサ)14に供給される。
【0018】
DSP14は、CPU32の制御の下で、音声信号入力回路10から供給された複数チャンネルの音声信号に対して、所定のデジタル処理、具体的には、ミックスダウン処理やマスタリング処理等を施し、バス18を介してレコーダ34に記録する。レコーダ34の記録媒体は、CD−R/RW、DVD−R/RW等の光ディスクやハードディスク、フラッシュメモリ媒体等である。DSP14の処理には、操作子20の操作に応じて各音声信号のパン(PAN)や音量レベルを調整する処理も含まれる。
【0019】
操作子20は、マルチトラックレコーダ1の操作面に設けられる。操作子20は、各種のキースイッチや選択ボタン、メニューボタン、決定ボタン、パン(PAN)つまみ、レベルつまみ等から構成される。ユーザは、操作子20を操作することで、各音声信号を、複数トラックの少なくとも1つのトラックに割り当てる。操作子20の操作状態は検出回路22で検出される。検出回路22は、バス18を介して操作子20の操作状態検出信号をCPU32に供給する。
【0020】
CPU32は、マルチトラックレコーダの全体を統括制御する。CPU32は、フラッシュROM28に記憶されたプログラムに従い、ワーキングメモリとしてのRAM30を用いて各種処理を実行する。具体的には、検出回路22からの操作状態検出信号に基づいて、複数チャンネルの各音声信号を複数トラックの少なくとのいずれかのトラックに割り当てる。例えば、トラックがトラック1〜トラック8まで存在する場合に、チャンネルAをトラック1に割り当て、チャンネルBをトラック2に割り当て、チャンネルCをトラック8に割り当てる等である。また、CPU32は、各種の情報を表示回路26に供給する。表示回路26は、各種情報を表示部24に表示する。
【0021】
CPU32は、ユーザによる操作子20の操作に応じて各種メニュー画面や設定画面を表示すべく表示回路26に指令し、表示回路26は、CPU32からの情報に応じてメニュー画面や設定画面を表示部24に表示する。
【0022】
また、CPU32は、各トラック毎に割り当てられた音声信号のレベルを、例えば棒グラフ形式(レベルメータ)で表示すべく表示回路26に指令し、表示回路26は、CPU32からの情報に応じてレベルメータ画像を表示部24に表示する。
【0023】
さらに、CPU32は、検出回路22からの操作状態検出信号に応じ、レコーダ34に記録された音声信号を読み出してDSP14に供給し、DSP14はバス及び音声信号出力回路12を介して音声信号を外部に出力する。音声出力回路12は、アナログ出力ポートやデジタル出力ポート等の各種出力ポートを有する。
【0024】
本実施形態におけるDSP14は、上記のように、ミックスダウン処理及びマスタリング処理を行うので、ミックスダウン処理部及びマスタリング処理部として機能する。これらの各処理は、予めプログラムメモリに記憶されたプログラムを順次読み出し、DSP14がプログラムを逐次実行することで実現される。もちろん、DSP14の代わりに、ミックスダウン処理を行うハードウェア、マスタリング処理を行うハードウェアを設けることもできる。要するに、ミックスダウン処理、マスタリング処理は、ハードウェアあるいはソフトウェアのいずれで実行してもよい。
【0025】
ミックスダウン処理は、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成する処理である。ミックスダウン処理は、各トラックのレベルつまみを用いてレベルとバランスを調節し、かつ、全体のレベルを調節しながら行われる。また、トラックのPANつまみを用いてLチャンネル及びRチャンネルのステレオの定位を設定する。Lチャンネル及びRチャンネルのレベル(ステレオメータ)は表示部24に表示され、ユーザは表示されるレベルを視認しつつ調節する。
【0026】
図2に、ミックスダウン処理の機能ブロック図を示す。トラック1〜トラック8の8個のトラックにそれぞれ音声信号が割り当てられている。各トラックは、できるだけフルスケール(0dBFS)に近いレベルで録音される。各トラックの音声信号のレベルは、チャンネル毎に設けられたチャンネルフェーダ20aで調整され、さらにPANつまみ20bでL,R左右のレベルを調整しつつ定位される。マスタフェーダ20cは、0dBに設定され、全体のレベルが調整されてマスタトラック(ステレオトラック)にミックスダウンされる。ユーザは、ステレオメータを視認しつつ、レベルがオーバしない程度にできるだけフルスケールに近いレベルでミックスダウンを行う。
【0027】
また、マスタリング処理は、イコライザ処理(イコライジング)、圧縮処理、ノーマライズ処理を含む処理であり、ユーザがマスタリングすべき音声信号の開始点と終了点を設定し、「マスタ録音」のボタンを操作あるいはメニューを選択することで開始される。マスタリングにおける圧縮処理の閾値及び比率は予め複数セット(複数のプリセット)が用意されており、ユーザが所望のプリセットを選択できるように構成される。しかしながら、ミックスダウン処理した結果の音声信号のレベルが適当でなく、小さすぎる場合には、音声信号のレベルが圧縮処理における閾値以下となり、圧縮処理の効果がなくなってしまう。
【0028】
そこで、本実施形態では、マスタリング処理において、音声信号のレベルのピーク値を検出し、このピーク値に応じて適応的に圧縮処理の閾値を自動的に調整して圧縮処理を行うようにしている。音声信号のレベルが小さいため、そのピーク値もこれに応じて小さくなるが、ピーク値を検出し、ピーク値が小さければこれに応じて圧縮処理に用いる閾値を自動的に小さく調整することで、音声信号のうち閾値を超える部分が生じることとなり、圧縮処理の実効性を担保できる。
【0029】
図3に、マスタリング処理のフローチャートを示す。DSP14で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成するミックスダウン処理を行う(S101)。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値(第1ピーク値)を検出する。ピーク値は、公知の方法で検出することができるが、不必要な周波数におけるピーク値を除外する、あるいは突発的なピーク値を除外して検出することが望ましい。この点についてはさらに後述する。ミックスダウン処理され、かつ、ピーク値が検出されたLチャンネル及びRチャンネルのステレオ音声信号は、RAM30あるいはレコーダ34に記憶される。ピーク値は、RAM30に記憶される。
【0030】
次に、ユーザから「マスタ録音」が指示されると、DSP14は、必要に応じてイコライザ処理(イコライジング)を行った上で、圧縮処理に用いる閾値(ユーザが選択したプリセットの閾値)を、検出したピーク値(第1ピーク値)に応じて自動調整する(S102)。この処理は、ステレオ音声信号のピーク値が小さすぎる場合に、これに応じて圧縮処理の閾値も小さく調整する処理である。具体的には、DSP14は、S101で検出され、RAM30に記憶されたピーク値を読み出し、圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、上記のように、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるので、ピーク値に応じて閾値を小さく調整する。調整前の閾値をTH、調整後の閾値をTHn、ピーク値をPとすると、
TH≧P>THn
を満たすように調整する。一例として、ピーク値Pに対して所定量Δ(設計や仕様によって決定される任意の値)だけ減じたレベルをTHnとする等である。なお、ピーク値が閾値以上であれば、閾値を調整する必要はないが、ピーク値と閾値との差分が所定の値(設計や仕様によって決定される任意の値)より小さく、ピーク値と閾値がほとんど変わらないのであれば、たとえピーク値が閾値以上であっても閾値を調整してもよい。
【0031】
ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う(S103)。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。比率は、例えば10:1等である。圧縮処理では、閾値を超えたレベルは圧縮されて相対的に小さくなるものの、元の音声信号の波形は残っている。
【0032】
また、圧縮処理を行うと同時に、ミックスダウン処理と同様に、圧縮処理された音声信号レベルのピーク値(第2ピーク値)を検出する。検出されたピーク値は、RAM30に記憶される。
【0033】
次に、圧縮処理を行った音声信号に対し、ノーマライズを行う(S104)。圧縮処理された音声信号のピーク値(第2ピーク値)を、目標の基準レベル(例えば0dBFS)となるように増幅する。通常、ノーマライズでは、まず音声信号のピーク値を検出する処理が行われるが、本実施形態では、ノーマライズに先立つ圧縮処理において同時にピーク検出が行われ、このピーク値をノーマライズで用いるため、ノーマライズにおいて別途ピーク値検出を行う必要がなく、ノーマライズを高速化できる。
【0034】
以上のようにして処理された音声信号は、マスタデータとしてレコーダ34に記録される。マスタデータは、ユーザからの再生指示に応じて読み出され、音声信号出力回路12から出力される。なお、マスタデータをWAV形式等に変換し、外部のパーソナルコンピュータに出力してもよい。
【0035】
本実施形態では、ミックスダウン処理時にピーク値(第1ピーク値)を検出し、このピーク値に応じて閾値を自動調整して圧縮処理するので、たとえミックスダウン処理された音声信号のレベルが小さすぎる場合であっても、圧縮処理を効果的に実行し、音声信号の音圧を向上させることができる。しかも、圧縮処理時においてもピーク値(第2ピーク値)を検出し、このピーク値を用いてノーマライズを行うため、全体の処理を効率化・高速化できる。
【0036】
ミックスダウン処理時に検出されるピーク値(第1ピーク値)と、圧縮処理時に検出されるピーク値(第2ピーク値)は、必ずしも同一ではなく、この意味で、本実施形態ではそれぞれのピーク値を第1ピーク値と第2ピーク値と称して区別している。もちろん、結果的に第1ピーク値と第2ピーク値が同一となることを排除するものではない。
【0037】
図4Aに、調整前の閾値とミックスダウンして得られた音声信号との関係を示す。音声信号のレベルが小さく、閾値THに達していないため、このままでは圧縮処理しても圧縮されず、ユーザはマスタリング処理の効果を実感できない。
【0038】
他方、
図4Bに、調整後の閾値とミックスダウンして得られた音声信号との関係を示す。閾値がTHからTHnに下方調整され、音声信号のレベルが閾値THnに達していることが分かる。この場合、音声信号のうち、閾値THnを超える部分については所定の比率で圧縮されるため、ユーザはマスタリング処理の効果、すなわち音圧向上を実感し得る。
【0039】
次に、本実施形態における、ミックスダウン処理時におけるピーク値検出処理と、圧縮処理時におけるピーク値検出処理について説明する。本実施形態において、両ピーク値検出処理は互いに異なる処理である。
【0040】
図6に、ミックスダウンにより得られたステレオ音声信号のレベルと検出ピークの関係を示す。単に、音声信号レベルのピーク値P0を検出すると、図に示すように突発的なピークをピーク値P0として検出してしまう場合があり得る。また、本来不必要な周波数帯、例えば20Hz以下や12kHz以上の周波数におけるピークをピーク値P0として検出してしまう場合があり得る(本来不必要な周波数帯は、適用する装置の仕様や特性により異なるが、本実施形態では20Hz以下や12kHz以上として説明する)。このようなピーク値に基づいて閾値を自動調整したのでは、効果的な圧縮処理ができない。そこで、突発的なピークでなく、かつ、不必要な周波数帯におけるピークでないピークをピーク値P1として検出することが望ましい。
【0041】
このため、
図7に示すように、ミックスダウンして得られた音声信号のエンベロープを検出し、このエンベロープにおけるピークをピーク値P1として検出することで、真のピーク値P1を確実に検出することができる。なお、音声信号のエンベロープは、音声信号をローパスフィルタに通過させることで取得でき、ローパスフィルタに通過させる前に、20Hz以下の周波数、及び12kHz以上の周波数をそれぞれカットするフィルタで不必要な周波数帯をカットすればよい。
【0042】
図8Aに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンド(周波数帯毎に分けない場合)で行う場合の処理である。
【0043】
ステレオバス18からのステレオ音声信号は、ステレオトラックとしてレコーダ34に記録されるとともに、ステレオ音声信号は、低域カットフィルタ(LCF)で20Hz以下の低域成分がカットされ、さらに高域カットフィルタ(HCF)で12kHz以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、絶対値検出器(ABS)で絶対値が検出され、ローパスフィルタ(LPF)でエンベロープが検出され、最大値検出器(MAX)でその最大値が検出されてピーク値が検出される。これらのLCF、HCF、ABS、LPF、MAXは、DSP14で構成されるが、DSP14とは別個の部材で構成してもよい。検出されたピーク値は、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの閾値と大小比較され、大小比較の結果に応じて閾値が自動調整される。
【0044】
図8Bに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド(複数の周波数帯に分ける場合)で行う場合の処理である。
【0045】
ステレオバス18からのステレオ音声信号は、ステレオトラックとしてレコーダ34に記録されるとともに、ステレオ音声信号は、低域カットフィルタ(LCF)で20Hz以下の低域成分がカットされ、さらに高域カットフィルタ(HCF)で12kHz以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、クロスオーバフィルタで3つの周波数帯に分割される。分割される3つの周波数帯を、相対的に低域周波数帯、中域周波数帯、高域周波数帯と称する。それぞれの周波数帯において、絶対値検出器(ABS)で絶対値が検出され、ローパスフィルタ(LPF)でエンベロープが検出され、最大値検出器(MAX)でその最大値が検出されてピーク値が検出される。低域周波数帯におけるピーク値をピーク値L、中域周波数帯におけるピーク値をピーク値M、高域周波数帯におけるピーク値をピーク値Hとすると、これらのピーク値はいずれもRAM30に記憶され、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの低域閾値、中域閾値、高域閾値とそれぞれ大小比較され、大小比較の結果に応じてこれら3つの閾値が自動調整される。
【0046】
このように、ミックスダウン処理して得られたステレオ音声信号の不要な周波数帯をカットし、そのエンベロープを検出してピーク値を検出して圧縮処理の閾値を自動調整することで、突発的なピークに影響されず、かつ、不要な周波数帯におけるピークに影響されずに適当な閾値に調整することができる。
【0047】
図9Aに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンドで行う場合の処理である。
【0048】
レコーダ34のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ(EQ)でイコライジング処理した後、ミックスダウン処理時に検出されたピーク値に応じて調整された閾値を用いて圧縮処理を行う。圧縮処理されたステレオ音声信号は、レコーダ34のステレオトラックに記録される。また、圧縮処理されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、RAM30に記憶され、ノーマライズ処理に用いられる。圧縮処理時に検出されるピーク値は、ノーマライズ処理に用いられるため、ミックスダウン時におけるピーク値検出のようにエンベロープから検出する必要はない。
【0049】
図9Bに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド(例えば3バンド)で行う場合の処理である。
【0050】
レコーダ34のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ(EQ)でイコライジング処理した後、クロスオーバフィルタで相対的に低域周波数帯、中域周波数帯、高域周波数帯の3つの周波数帯に分割し、それぞれの周波数帯において、ミックスダウン処理時に検出されたそれぞれの周波数帯におけるピーク値L,M,Hに応じて調整された閾値を用いて圧縮処理を行う。
【0051】
ここで、それぞれの周波数帯における閾値は、それぞれの周波数帯におけるピーク値に応じて個別に調整されるため、全ての周波数帯において閾値が調整される他、ある周波数帯においては閾値が調整されるものの、他の周波数帯においては閾値が調整されない場合もあり得る。例えば、低域周波数帯におけるプリセットされた閾値をTHLとし、高域周波数帯におけるプリセットされた閾値をTHHとすると、THL≧ピーク値Lであれば閾値THLは下方調整されるが、ピーク値H≧THHであれば、閾値THHはそのまま維持されて圧縮処理に用いられる。
【0052】
3つの周波数帯毎に圧縮処理されたステレオ音声信号は、合成されてレコーダ34のステレオトラックに記録される。また、圧縮処理され合成されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、RAM30に記憶され、ノーマライズ処理に用いられる。ピーク値の検出は、シングルバンドの場合と同様である。
【0053】
本実施形態では、
図3に示すように、S103で圧縮処理及びピーク値検出を行い、S104でノーマライズ処理を行っており、ノーマライズ処理をオフライン、すなわちノーマライズ処理のみを実行してレコーダ34に記録し、その後にノーマライズ処理された音声信号の再生を可能としているが、これをオンライン処理、すなわちユーザが視聴しながら処理を行うことも可能であり、この場合、圧縮処理及びピーク値検出処理を行うと同時にノーマライズ処理を演算により実行し、演算により得られた音声信号を再生してユーザが視聴できるようにする。
【0054】
図10に、他の実施形態の処理フローチャートを示す。DSP14で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成するミックスダウン処理を行う(S201)。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値を検出する。ミックスダウン処理され、かつ、ピーク値が検出されたLチャンネル及びRチャンネルのステレオ音声信号は、RAM30あるいはレコーダ34に記憶される。ピーク値は、RAM30に記憶される。
【0055】
次に、ユーザから「マスタ録音」が指示されると、DSP14は、必要に応じてイコライザ処理(イコライジング)を行った上で、圧縮処理に用いる閾値を検出したピーク値に応じて自動調整する(S202)。具体的には、DSP14は、S201で検出され、RAM30に記憶されたピーク値を読み出し、予め設定されている圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるため、ピーク値に応じて閾値を小さく調整する。調整前の閾値をTH、調整後の閾値をTHn、ピーク値をPとすると、TH≧P>THnを満たすように調整する。
【0056】
ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う(S203)。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。また、圧縮処理を行うと同時に、圧縮処理された音声信号レベルのピーク値を検出する。検出されたピーク値は、RAM30に記憶される。
【0057】
さらに、圧縮処理を行う際に、圧縮処理後の出力レベルを演算して推定し、推定したレベルに対し、そのピーク値が目標の基準レベル(例えば0dBFS)となるように圧縮及び増幅する。より具体的に説明すると、ステレオ音声信号のうち、閾値THを超えた部分については所定の比率(これをrとする)で圧縮するが、所定の比率で圧縮した場合に得られるであろう音声信号のレベルを演算により算出し、そのレベルのピーク値を算出し、算出したピーク値を目標の基準レベルに合わせ込むための増幅率βを算出する。そして、ミックスダウンして得られたステレオ音声信号のうち、閾値以下の部分については比率βで増幅し、閾値THを超える部分については比率β・rで圧縮及び増幅を行う。言い換えれば、閾値以下の部分は比率βで圧縮し、閾値を超える部分については比率β・rで圧縮を行うといえる。
【0058】
このように、圧縮処理において、同時にノーマライズを実行することで、圧縮処理を行った後に再度ノーマライズ処理を行う必要がなくなり、マスタリング処理に要する時間を短縮できる。演算により得られた音声信号は、必要に応じて再生してユーザが視聴し、圧縮処理及びノーマライズ処理された音声信号の状態を視聴して確認することができる。
【0059】
以上、本発明の実施形態について、マルチトラックレコーダを例にとり説明したが、本発明はこれに限定されず、音声信号に対して圧縮処理を行って記録媒体に記録する任意の録音装置に適用することができる。