特許第6816277号(P6816277)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パイオニア株式会社の特許一覧

特許6816277信号処理装置、制御方法、プログラム及び記憶媒体
<>
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000002
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000003
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000004
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000005
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000006
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000007
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000008
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000009
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000010
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000011
  • 特許6816277-信号処理装置、制御方法、プログラム及び記憶媒体 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6816277
(24)【登録日】2020年12月25日
(45)【発行日】2021年1月20日
(54)【発明の名称】信号処理装置、制御方法、プログラム及び記憶媒体
(51)【国際特許分類】
   H03H 17/02 20060101AFI20210107BHJP
   H03M 1/08 20060101ALI20210107BHJP
【FI】
   H03H17/02 601G
   H03M1/08 A
【請求項の数】10
【全頁数】15
(21)【出願番号】特願2019-527673(P2019-527673)
(86)(22)【出願日】2018年6月29日
(86)【国際出願番号】JP2018024840
(87)【国際公開番号】WO2019009204
(87)【国際公開日】20190110
【審査請求日】2019年12月26日
(31)【優先権主張番号】特願2017-130504(P2017-130504)
(32)【優先日】2017年7月3日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(72)【発明者】
【氏名】長谷川 真
(72)【発明者】
【氏名】佐藤 弥生
【審査官】 志津木 康
(56)【参考文献】
【文献】 特開平07−193502(JP,A)
【文献】 特開平11−073726(JP,A)
【文献】 特開平10−013244(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H03M1/00−H03M1/88
H03M3/00−H03M9/00
H03H17/00−H03H17/08
(57)【特許請求の範囲】
【請求項1】
量子化が行われた音データを取得する取得手段と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段と、
を備え、
前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する信号処理装置。
【請求項2】
前記量子化ノイズ制御手段は、前記音量が小さいほど、前記最大減衰量を大きくする請求項に記載の信号処理装置。
【請求項3】
前記量子化ノイズ制御手段は、前記音量と前記音データの周波数とに基づいて、前記最大減衰量を決定する請求項1または2に記載の信号処理装置。
【請求項4】
前記量子化ノイズ制御手段は、前記周波数が低いほど、前記最大減衰量を大きくする請求項に記載の信号処理装置。
【請求項5】
前記音データの時間波形を周波数領域へ変換する変換手段をさらに備え、
前記量子化ノイズ制御手段は、前記周波数領域の振幅を調整することで減衰を行う請求項1〜のいずれか一項に記載の信号処理装置。
【請求項6】
前記変換手段は、所定時間間隔により切り出した前記音データの時間波形を周波数領域へ変換する請求項に記載の信号処理装置。
【請求項7】
前記量子化ノイズ制御手段により減衰された前記音データの倍音生成を行う倍音生成手段と、
前記倍音生成が行われた音データを出力する出力手段と、
をさらに備えることを特徴とする請求項1〜のいずれか一項に記載の信号処理装置。
【請求項8】
信号処理装置が実行する制御方法であって、
量子化が行われた音データを取得する取得工程と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御工程と、
を有し、
前記量子化ノイズ制御工程は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する制御方法。
【請求項9】
コンピュータが実行するプログラムであって、
量子化が行われた音データを取得する取得手段と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段
として前記コンピュータを機能させ、
前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定するプログラム。
【請求項10】
請求項に記載のプログラムを記憶した記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、量子化ノイズを制御する技術に関する。
【背景技術】
【0002】
従来から、ビット数の少ない量子化ビットによりデジタル化されたデータの量子化ノイズを除去する技術が知られている。例えば、特許文献1には、低ビット数により量子化されたデジタルデータをスペクトル変換し、所定レベル以下のスペクトルを除去した後、逆フーリエ変換したデータを出力する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平7−193502号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、聴感上気にならない量子化ノイズについても一様に除去することにより、量子化ノイズと共に、元々存在する音成分も除去してしまうという問題があった。
【0005】
本発明が解決しようとする課題は上記のようなものが例として挙げられる。本発明は、量子化ノイズを好適に減衰させることが可能な信号処理装置を提供することを主な目的とする。
【課題を解決するための手段】
【0006】
請求項に記載の発明は、信号処理装置であって、量子化が行われた音データを取得する取得手段と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段と、を備え、前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する
【0007】
また、請求項に記載の発明は、信号処理装置が実行する制御方法であって、量子化が行われた音データを取得する取得工程と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御工程と、を有し、前記量子化ノイズ制御工程は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する
【0008】
また、請求項に記載の発明は、コンピュータが実行するプログラムであって、量子化が行われた音データを取得する取得手段と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段として前記コンピュータを機能させ、前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する
【図面の簡単な説明】
【0009】
図1】実施例に係る音出力システムの構成を示す。
図2】変換装置の機能的なブロック構成図を示す。
図3】最大減衰量を規定するグラフ、及び、周波数領域での減衰処理の具体例を示す。
図4】ハイレゾ規格及びCD規格のそれぞれにより正弦波信号の量子化を行った場合の時間領域及び周波数領域での信号波形を示す。
図5】CD規格において発生する量子化ノイズの聴感を定量的に表したグラフを示す。
図6】(A)は、入力レベルが比較的大きい入力信号の周波数特性を示し、(B)は、当該周波数特性を有する入力信号に対して窓関数を適用してフーリエ変換を行った算出結果を示す波形である。
図7】(A)は、図6(B)の波形に対して量子化ノイズ減衰処理を行うことで得られた波形を示し、(B)は、出力信号の周波数特性を示す。
図8】(A)は、入力レベルが比較的小さい入力信号の周波数特性を示し、(B)は、当該周波数特性を有する入力信号に対して窓関数を適用してフーリエ変換を行った算出結果を示す波形である。
図9】(A)は、図8(B)の波形に対して量子化ノイズ減衰処理を行うことで得られた波形を示し、(B)は、出力信号の周波数特性を示す。
図10】変形例に係る変換装置のブロック構成図を示す。
図11】複数の周波数帯域に対してそれぞれ最大減衰量を決定する場合の周波数帯域の分割例を示した図である。
【発明を実施するための形態】
【0010】
本発明の好適な実施形態では、信号処理装置は、量子化が行われた音データを取得する取得手段と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御手段と、を備える。この態様では、信号処理装置は、取得した音データの音量に応じて量子化ノイズに対する聴感が異なることに着目し、音データの音量に基づいて量子化ノイズを制御する制御量を決定する。これにより、信号処理装置は、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。
【0011】
上記信号処理装置の一態様では、前記制御量は、所定の周波数帯域において前記音データの信号レベルを減衰させる減衰量であり、前記量子化ノイズ制御手段は、前記音量に基づいて、前記減衰量を変化させる。この態様により、量子化ノイズ制御手段は、量子化ノイズを減衰させつつ、元々存在する音成分を不要に除去するのを好適に抑制することができる。
【0012】
上記信号処理装置の他の一態様では、前記量子化ノイズ制御手段は、前記音量が小さいほど、前記減衰量を大きくする。出願人は、実施例において後述するように、音データの音量が小さい場合ほど、量子化ノイズが聴こえ易くなり、かつ、量子化ノイズの減衰処理によるノイズでない音成分への影響が小さくなるという知見を得た。従って、この態様により、信号処理装置は、元々存在する音成分への影響を回避しつつ量子化ノイズを好適に減衰させることができる。
【0013】
上記信号処理装置の他の一態様では、前記量子化ノイズ制御手段は、前記音量と、前記音データの周波数とに基づいて、前記減衰量を決定する。出願人は、実施例において後述するように、入力信号の周波数が比較的低い場合には、量子化ノイズが聴こえ易い傾向があるという知見を得た。よって、この態様により、信号処理装置は、元々存在する音成分への影響を回避しつつ、量子化ノイズをより効果的に減衰させることができる。好適には、前記量子化ノイズ制御手段は、前記周波数が低いほど、前記減衰量を大きくするとよい。
【0014】
上記信号処理装置の他の一態様では、信号処理装置は、前記音データの時間波形を周波数領域へ変換する変換手段をさらに備え、前記量子化ノイズ制御手段は、前記周波数領域の振幅が所定レベル未満の周波数について、前記制御量に基づいて減衰を行う。この態様により、信号処理装置は、量子化ノイズの影響がある周波数の振幅を減衰させて量子化ノイズを好適に低減させることができる。
【0015】
上記信号処理装置の他の一態様では、前記変換手段は、所定時間間隔により切り出した前記音データの時間波形を周波数領域へ変換する。このように音データを切り出した場合には、切出しの影響により周波数領域での波形の裾野が広がり、音データの音量によっては量子化ノイズと元々の音成分とが特定の周波数帯域において混じり合う。この場合であっても、信号処理装置は、音量に基づいて制御量を決定することで、ユーザが聴こえる範囲の量子化ノイズを好適に減衰させつつ、元々存在する音成分への影響を好適に低減させることができる。
【0016】
上記信号処理装置の他の一態様では、信号処理装置は、前記音データを複数の周波数帯域に分割する分割手段をさらに備え、前記量子化ノイズ制御手段は、前記複数の周波数帯域各々に対して前記量子化ノイズに対する前記制御量を決定する。これにより、信号処理装置は、周波数帯ごとに制御量を適切に定めることができる。好適な例では、信号処理装置は、前記量子化ノイズの制御が行われた音データの倍音生成を行う倍音生成手段と、前記倍音生成が行われた音データを出力する出力手段と、をさらに備える。この態様により、信号処理装置は、より高品質となる規格へのアップコンバートを好適に実行することができる。
【0017】
本発明の他の実施形態では、信号処理装置が実行する制御方法であって、量子化が行われた音データを取得する取得工程と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御工程と、を有する。信号処理装置は、この制御方法を実行することで、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。
【0018】
本発明のさらに別の実施形態では、コンピュータが実行するプログラムであって、量子化が行われた音データを取得する取得手段と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御手段として前記コンピュータを機能させる。コンピュータは、このプログラムを実行することで、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。好適には、上記プログラムは、記憶媒体に記憶される。
【実施例】
【0019】
以下、図面を参照して本発明の好適な実施例について説明する。以後において、「ハイレゾ」とは、サンプリング周波数:96kHz、ビット長24bitを上回る情報量を有する音源を指すものとする。
【0020】
[音出力システムの構成]
図1は、本実施例に係る音出力システム100の構成を示す。音出力システム100は、CD規格の音データをハイレゾ規格にアップコンバートして再生するシステムであって、図1に示すように、入力装置1と、変換装置2と、出力装置3とを備える。
【0021】
入力装置1は、CD音源のデジタルデータである入力信号S1を変換装置2へ入力する。入力装置1は、例えば、CDなどの記録媒体から音データを読み取るインタフェース装置であってもよく、有線又は無線により他の装置から送信される音データを受信する通信装置であってもよく、入力信号S1を記憶する記憶装置であってもよい。
【0022】
変換装置2は、入力装置1から入力される入力信号S1をアップコンバートすることで、ハイレゾ規格のデジタルデータである出力信号S2を出力装置3に出力する。この場合、後述するように、変換装置2は、まず、所定のハイレゾフォーマットにサンプリング周波数、ビット長をアップコンバートする。フォーマットはアップコンバートされているが、この時点では、量子化ノイズを含み、かつ、高域補間もされていない信号である為、CDスペックの品質の信号である。次に、入力信号S1に含まれる量子化ノイズを減衰させる処理(量子化ノイズ減衰処理)及び倍音生成処理などを行うことで、CDスペックを上回る品質の音データである出力信号S2を生成する。変換装置2は、本発明における「信号処理装置」の一例である。
【0023】
出力装置3は、例えばスピーカなどであり、変換装置2から出力された出力信号S2に基づき音を出力する。なお、入力装置1又は出力装置3の少なくとも一方は、変換装置2と一体化して構成されてもよい。また、入力装置1と出力装置3とが一体化して構成されていてもよい。
【0024】
[変換装置のブロック構成]
図2は、変換装置2の機能的なブロック構成図を示す。変換装置2は、CPU、ROM、RAMなどのハードウェア構成を有し、機能的には、時間窓切出しブロック21と、FFT(Fast Fourier Transform)ブロック22と、減衰量制限ブロック23と、量子化ノイズ減衰ブロック24と、倍音生成ブロック25と、IFFT(Inverse Fast Fourier Transform)ブロック26と、時間窓再合成ブロック27とを有する。
【0025】
時間窓切出しブロック21は、ハニング窓などの種々の窓関数に基づき、入力信号S1が示す音データの時間波形を所定時間長の窓幅ごとに(フレームごとに)オーバーラップさせながら切出す。そして、時間窓切出しブロック21は、フレームごとの音データを、FFTブロック22及び減衰量制限ブロック23にそれぞれ供給する。
【0026】
FFTブロック22は、時間窓切出しブロック21が出力する所定時間長の音データに対して高速フーリエ変換を行い、周波数ごとの振幅及び位相を出力する。この場合、振幅に関する情報は、量子化ノイズ減衰ブロック24に供給され、位相に関する情報は、倍音生成ブロック25に供給される。
【0027】
減衰量制限ブロック23は、時間窓切出しブロック21から供給される音データの信号レベルの大きさに基づいて、量子化ノイズ減衰ブロック24において減衰させる周波数領域での振幅に対する最大減衰量を決定する。減衰量制限ブロック23は、RMS値算出ブロック31と、最大減衰量算出ブロック32とを有する。RMS値算出ブロック31は、時間窓切出しブロック21から供給される音データのフレームごとのRMS(Root Mean Square)値を算出する。この場合、RMS値算出ブロック31により算出されるRMS値は、フレームごとの音データの平均的な信号レベルの大きさに相当する。最大減衰量算出ブロック32は、RMS値算出ブロック31が算出したRMS値に基づき、量子化ノイズ減衰ブロック24での周波数領域での振幅に対する減衰量の上限に相当する最大減衰量を算出する。最大減衰量の算出方法の詳細については図3(A)を参照して後述する。
【0028】
なお、RMS値算出ブロック31は、音データの信号レベルを示す値であれば、RMS値以外の計算値であってもよい。
【0029】
量子化ノイズ減衰ブロック24は、減衰量制限ブロック23が決定した最大減衰量に基づき、対象となるフレームの周波数領域での振幅を調整することで、量子化ノイズを減衰させる。本実施例では、量子化ノイズ減衰ブロック24は、CD規格において再現できる最小音量である−90.3dB未満の音量については量子化ノイズに起因して発生したものと推定し、−90.3dB未満の音量となる周波数の信号レベルを減衰させる。このとき、量子化ノイズ減衰ブロック24は、減衰量制限ブロック23が決定した最大減衰量を超えないように、−90.3dB未満の音量となる周波数の信号レベルを調整する。この調整処理の具体例については図3(B)を参照して後述する。なお、−90.3dBは、本発明における「所定レベル」の一例である。また、−90.3dB未満の音量となる周波数は、本発明における「所定の周波数帯域」の一例である。
【0030】
倍音生成ブロック25は、量子化ノイズ減衰ブロック24が出力する周波数ごとの振幅の情報と、FFTブロック22が出力した位相の情報とに基づき、倍音を生成し高域補間する倍音生成処理を行う。これにより、倍音生成ブロック25は、CD音源の疑似的なアップサンプリングを行う。この倍音生成処理では、公知となっている任意の倍音生成手法を適用してもよい。
【0031】
IFFTブロック26は、倍音生成処理が行われた周波数領域の音データに対して逆フーリエ高速変換を行うことで、フレームごとの音データを周波数領域から時間領域に変換する。時間窓再合成ブロック27は、IFFTブロック26が出力した各フレームの音データをオーバーラップ加算することで滑らかに接続させた出力信号S2を生成する。そして、時間窓再合成ブロック27は、生成した出力信号S2を出力装置3へ供給する。
【0032】
なお、図2に示される構成において、時間窓切出しブロック21は、本発明における「取得手段」の一例であり、FFTブロック22は、本発明における「変換手段」の一例である。また、減衰量制限ブロック23及び量子化ノイズ減衰ブロック24は、本発明における「量子化ノイズ制御手段」の一例であり、倍音生成ブロック25は、本発明における「倍音生成手段」の一例であり、時間窓再合成ブロック27は、本発明における「出力手段」の一例である。また、各ブロックを構成する変換装置2のCPUなどは、本発明におけるプログラムを実行する「コンピュータ」の一例である。
【0033】
ここで、最大減衰量算出ブロック32による最大減衰量の設定方法について具体的に説明する。
【0034】
図3(A)は、RMS値算出ブロック31が算出したRMS値をdB値に変換した値と最大減衰量算出ブロック32が決定する最大減衰量との関係を概略的に示すグラフである。図3(A)の例では、0dBから約−90dBまでの音量域において、最大減衰量が定められている。なお、約−90dBは、CD規格において再現できる音量の最小値に相当する。
【0035】
図3(A)に示すように、最大減衰量算出ブロック32は、−90dBに近付くほど、即ち、音量が小さくなるほど、最大減衰量を大きくする。この場合、例えば、最大減衰量算出ブロック32は、予め記憶された図3(A)に相当する式又はテーブル等を参照し、RMS値算出ブロック31が算出したRMS値又は当該RMS値をdB値に変換した値から最大減衰量を決定する。これにより、入力信号S1の入力レベルが小さいほど減衰量を大きくし、本来必要な入力信号の減衰を好適に低減しつつ、量子化ノイズを効果的に減衰させることができる。この効果については、[効果]のセクションで詳しく説明する。
【0036】
なお、最大減衰量と音量との関係は、図3(A)に示すグラフに示される関係に限定されず、音量が小さいほど最大減衰量が大きくなる関係であればよく、例えば直線グラフにより示される関係であってもよい。
【0037】
次に、量子化ノイズ減衰ブロック24による量子化ノイズ減衰処理の具体例について説明する。
【0038】
図3(B)は、時間窓切出しブロック21により切り出された音データの周波数領域での波形を示す。図3(B)において、実線は量子化ノイズ減衰ブロック24による量子化ノイズ減衰処理前の波形を示し、破線は量子化ノイズ減衰処理後の波形を示す。
【0039】
図3(B)に示すように、量子化ノイズ減衰ブロック24は、CD規格において再現できる最小音量である−90.3dB未満の音量となる周波数の信号レベルを、減衰量制限ブロック23が決定した最大減衰量を超えないように減衰させている。ここでは、一例として、量子化ノイズ減衰ブロック24は、対象の周波数帯域において、−90.3dBと波形の信号レベルとの差分を減衰量として算出し、かつ、算出した減衰量が最大減衰量を超える場合には最大減衰量を適用すべき減衰量とする。これにより、量子化ノイズ減衰ブロック24は、波形が不連続になるのを防ぎつつ、好適に量子化ノイズを減衰させることができる。
【0040】
[効果]
次に、本実施例による効果について、図4図9を参照して補足説明する。
【0041】
図4(A)は、ハイレゾ規格(24ビットの量子化ビット)により正弦波の音データを量子化した信号波形を示し、図4(B)は、CD規格(16ビットの量子化ビット)により正弦波の音データを量子化した信号波形を示す。また、図4(C)は、図4(A)の音データの周波数特性を示し、図4(D)は、図4(B)の音データの周波数特性を示す。
【0042】
図4(B)に示すように、CD規格の場合には、小さい音などが階段状の信号となっている。これにより、図4(D)に示すように、CD規格の場合には、20kHz以下の可聴周波数帯域においても、ハイレゾ規格(ここでは24ビット)での量子化では殆ど現れない量子化ノイズが多く発生している。一方、ハイレゾ規格の場合、量子化ビット数が高いことにより滑らかな信号波形となっており(図4(A)参照)、量子化ノイズが殆ど発生していない(図4(C)参照)。
【0043】
図5は、正弦波である元の音データの周波数及び音量の組合せを変化させた場合に、CD規格において発生する量子化ノイズの聴感を定量的に表したグラフである。図5では、正弦波である元の音データの周波数及び音量の任意の各組合せに対して発生する量子化ノイズを算出し、当該量子化ノイズにラウドネス曲線などから導出される聴感特性を乗じることで、量子化ノイズの聴感を定量的に求めて可視化している。図5では、色が濃い領域ほど量子化ノイズが聴こえ易い(即ちハイレゾ規格とCD規格との違いが分かりやすい)領域であることを示す。なお、出願人は、聴感実験を行ったところ、図5のグラフの傾向と同様の聴感結果を得ている。
【0044】
図5のグラフによれば、入力信号の音量及び周波数が小さいほど、量子化ノイズが聴き取りやすくなる傾向があり、特に約−70dB以下の音量領域であって約1kHz以下の低周波数帯域において量子化ノイズを聴き取りやすいことが把握される。従って、CD規格の場合には、低音量領域かつ低周波数帯域において、量子化ノイズに起因して音質が劣化していると推定される。このことから、入力信号S1の入力レベルが低いほど、または、入力信号S1の周波数が低いほど、量子化ノイズを減衰させる必要性が高いと考えられる。さらには、入力信号S1の入力レベルと入力信号S1の周波数の双方が低いほど、減衰させる必要性が高いと考えられる。
【0045】
ここで、量子化ノイズの減衰処理において、最大減衰量を設けず、入力信号S1の入力レベルの大小によらず一様に振幅を減衰させたときの影響について説明する。
【0046】
図6(A)は、入力レベルが比較的大きい入力信号S1の周波数特性を示し、図6(B)は、図6(A)に示す周波数特性を有する入力信号S1に対して窓関数を適用してフーリエ変換を行った後(即ち量子化ノイズ減衰処理前)の波形である。また、図7(A)は、図6(B)の波形に対して−90.3dB未満となる周波数を一様に減衰させる量子化ノイズ減衰処理を行った後の波形を示し、図7(B)は、図7(A)に示す波形から生成される出力信号S2の周波数特性の波形を示す。
【0047】
図6(A)、(B)に示すように、入力信号S1の入力レベルが比較的大きいときには、窓関数を適用することにより、ピークとなる波形部分の裾野が広がることになる。そして、図7(A)に示すように、−90.3dB未満となる周波数を入力信号S1の入力レベルによらずに一様に減衰させる量子化ノイズ減衰処理を行った場合には、上述の裾野部分についても量子化ノイズと共に減衰してしまう。この裾野部分については、IFFTブロック26及び時間窓再合成ブロック27において入力信号に含まれていた量子化ノイズ以外の主信号を出力信号S2として正しく元に戻すために本来必要な情報であるため、図7(B)に示すように、出力信号S2には、上述の裾野部分の減衰に起因したノイズが発生することになる。
【0048】
このように、入力信号S1の入力レベルが比較的大きいときに最大減衰量を設けることなく量子化ノイズ減衰処理を行った場合、当該量子化ノイズ減衰処理により本来必要な信号についても減衰させてしまい、結果として音質が劣化する可能性がある。
【0049】
図8(A)は、入力レベルが比較的小さい入力信号S1の周波数特性を示し、図8(B)は、図8(A)に示す周波数特性を有する入力信号S1に対して窓関数を適用してフーリエ変換を行った後(即ち量子化ノイズ減衰処理前)の波形である。また、図9(A)は、図8(B)の波形に対して−90.3dB未満となる周波数を一様に減衰させる量子化ノイズ減衰処理を行った後の波形を示し、図9(B)は、図9(A)に示す波形から生成される出力信号S2の周波数特性を示す。
【0050】
図8(A)、(B)に示すように、入力信号S1の入力レベルが比較的小さいときには、窓関数を適用してフーリエ変換を行った場合であっても、ピークとなる波形部分の裾野は、低音量の領域まで広く生じない。従って、この場合、図9(A)に示すように、−90.3dB未満となる周波数を減衰させる量子化ノイズ減衰処理を行った場合であっても、上述した裾野部分の減衰範囲が少ない。従って、この場合、図9(B)に示すように、出力信号S2には量子化ノイズ減衰処理によるノイズが殆ど発生していない。
【0051】
このように、入力信号S1の入力レベルが比較的小さいときに量子化ノイズ減衰処理を行った場合には、本来必要な入力信号を減衰させることなく好適に量子化ノイズを減衰させることができる。また、図5を参照して説明したように、入力信号S1の入力レベルが小さいほど、量子化ノイズが聴き取りやすいため、量子化ノイズを減衰させる必要性が高い。以上を勘案し、本実施例では、変換装置2は、入力信号S1の入力レベルが小さいほど最大減衰量を大きく設定する。これにより、変換装置2は、本来必要な入力信号の減衰を好適に低減しつつ、量子化ノイズを効果的に減衰させることができる。
【0052】
以上説明したように、変換装置2の時間窓切出しブロック21は、量子化が行われた音データである入力信号S1を取得し、所定時間間隔ごとに音データの切出しを行う。そして、減衰量制限ブロック23は、切り出されたフレームごとの音データの音量に基づいて最大減衰量を決定し、量子化ノイズ減衰ブロック24は、減衰量制限ブロック23が決定した最大減衰量に基づき、入力信号S1の周波数領域での振幅に対する減衰量(即ち量子化ノイズに対する制御量)を決定する。これにより、変換装置2は、本来必要な入力信号の減衰を好適に低減しつつ、可聴域にある量子化ノイズを効果的に減衰させることができる。
【0053】
[変形例]
次に、本実施例に好適な変形例について説明する。以下の変形例は、任意に組み合わせて上述の実施例に適用してもよい。
【0054】
(変形例1)
上述の実施例では、一例として、最大減衰量算出ブロック32は、フレームごとの平均的な入力レベルに相当するRMS値に基づき各フレームに対する最大減衰量を決定した。他の例として、最大減衰量算出ブロック32は、上述のRMS値に加えて、フレームごとの周波数をさらに勘案して各フレームの最大減衰量を決定してもよい。
【0055】
図10は、本変形例に係る変換装置2のブロック構成を示す。図10に示すように、変換装置2の減衰量制限ブロック23は、RMS値算出ブロック31及び最大減衰量算出ブロック32に加えて、周波数重心算出ブロック33を有する。ここで、周波数重心算出ブロック33は、時間窓切出しブロック21によってフレームごとに切出された入力信号S1をFFTブロック22がフーリエ変換を行うことで得られた周波数スペクトルに基づき周波数の重心(即ちスペクトル重心)を算出する。そして、周波数重心算出ブロック33は、算出したスペクトル重心の情報を最大減衰量算出ブロック32へ供給する。
【0056】
最大減衰量算出ブロック32は、RMS値算出ブロック31から得られるRMS値と、周波数重心算出ブロック33から得られるスペクトル重心とに基づき、最大減衰量を決定する。この場合、例えば、最大減衰量算出ブロック32は、予め変換装置2のメモリに記憶されたテーブル又は式を参照し、RMS値が低いほど最大減衰量を高く設定し、かつ、スペクトル重心が低い周波数であるほど最大減衰量を高く設定する。
【0057】
図5を参照して説明したように、量子化ノイズは、周波数が低い入力信号ほど聴こえ易い傾向がある。よって、本変形例によれば、変換装置2は、スペクトル重心が低い周波数であるほど最大減衰量を高く設定することで、聴こえ易い量子化ノイズを効果的に減衰させ、音質を好適に向上させることができる。なお、上記の変形例ではスペクトルの中心をフレームごとに算出したが、所定の時間長でよく、例えば楽曲一曲分の重心を算出しても良い。
【0058】
(変形例2)
実施例では、CD規格の入力信号S1をハイレゾ規格の出力信号S2にアップコンバートする例を示したが、本発明が適用可能な例はこれに限定されない。
【0059】
例えば、変換装置2は、MP3等の音源の入力信号S1をCD規格又はハイレゾ規格並みのスペックを有する出力信号S2に変換するものであってもよい。この場合、変換装置2は、入力信号S1のデコードを行った後、図2等に示される各処理ブロックの処理を実行することで、量子化ノイズの減衰及び倍音生成などを行う。この場合、変換装置2の量子化ノイズ減衰ブロック24は、入力信号S1が採用する規格において再現できる最小音量(実施例では−90.3dB)未満の音量については量子化ノイズに起因して発生したものと推定し、最小音量以下の音量となる周波数の信号レベルを減衰させる。このように、本発明は、量子化ビット数が高い規格にアップコンバートする種々の処理に好適に適用される。
【0060】
(変形例3)
実施例では、量子化ノイズを判別する音量を−90.3dBに設定する例を示したが、本発明が適用可能な例はこれに限らず、時間窓や周波数変換の条件に応じて量子化ノイズを判別する音量を調整してもよい。
【0061】
(変形例4)
実施例では、図2の減衰量制限ブロック23の説明において、時間窓切出しブロック21から供給される音データの全周波数帯域の信号レベルの大きさに基づいて、量子化ノイズ減衰ブロック24において減衰させる周波数領域での振幅に対する最大減衰量を決定する例を示したが、最大減衰量の決定方法はこれに限定されない。
【0062】
例えば、最大減衰量算出ブロック32が量子化ノイズ減衰処理を行なう際に、時間窓切出しブロック21から供給される音データを、ある周波数より大きい帯域と当該周波数以下の帯域とに分割し、それぞれの帯域におけるRMS値又は当該RMS値をdB値に変換した値から、分割したそれぞれの帯域において適用すべき最大減衰量を決定することも可能である。
【0063】
具体的には、図11(A)に示すような波形を示す信号において、破線41で囲われた周波数帯域と、そうでない周波数帯域とに分割する。本例では、周波数が2000Hzより大きい帯域と、2000Hz以下の帯域とに分割している。この際、2000Hzより大きい帯域におけるRMS値は、2000Hz以下の帯域におけるRMS値より小さくなる。したがって、2000Hzより大きい帯域における最大減衰量は、2000Hz以下の帯域における最大減衰量より大きくなる。
【0064】
本実施例では、2000Hzを基準として周波数帯域を2つに分割したが、本発明はこれに限定されるものではない。図11(B)に示すように、周波数帯域は1000Hzと10000Hzを基準として3つ(破線42で囲われた周波数帯域、一点鎖線43で囲われた周波数帯域、それ以外の周波数帯域)に分割されてもよいし、3以上の帯域に分割されてもよい。このように、周波数帯域を分ける基準となる周波数の値や分割後の帯域数は、適宜変更可能なものである。そして、いずれの場合においても、最大減衰量算出ブロック32は、分割したそれぞれの帯域におけるRMS値又は当該RMS値をdB値に変換した値から、分割したそれぞれの帯域において適用すべき最大減衰量を決定する。
【符号の説明】
【0065】
1 入力装置
2 変換装置
3 出力装置
100 音出力システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11