特許第5649934号(P5649934)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三星電子株式会社の特許一覧

<>
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000015
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000016
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000017
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000018
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000019
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000020
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000021
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000022
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000023
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000024
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000025
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000026
  • 特許5649934-サウンドエンハンスメント装置及び方法 図000027
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5649934
(24)【登録日】2014年11月21日
(45)【発行日】2015年1月7日
(54)【発明の名称】サウンドエンハンスメント装置及び方法
(51)【国際特許分類】
   H03G 3/30 20060101AFI20141211BHJP
   H04R 3/04 20060101ALI20141211BHJP
   G10L 21/038 20130101ALI20141211BHJP
   H03G 3/20 20060101ALI20141211BHJP
   H03G 5/16 20060101ALI20141211BHJP
【FI】
   H03G3/30 C
   H04R3/04
   G10L21/038
   H03G3/20 B
   H03G5/16 C
【請求項の数】31
【全頁数】23
(21)【出願番号】特願2010-268165(P2010-268165)
(22)【出願日】2010年12月1日
(65)【公開番号】特開2011-125004(P2011-125004A)
(43)【公開日】2011年6月23日
【審査請求日】2013年12月2日
(31)【優先権主張番号】10-2009-0121895
(32)【優先日】2009年12月9日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】390019839
【氏名又は名称】三星電子株式会社
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(72)【発明者】
【氏名】崔 ▲じょん▼ 宇
(72)【発明者】
【氏名】金 晶 ▲ほ▼
(72)【発明者】
【氏名】金 榮 泰
(72)【発明者】
【氏名】高 ▲祥▼ 鐵
【審査官】 緒方 寿彦
(56)【参考文献】
【文献】 特開2001−177891(JP,A)
【文献】 特開2001−343998(JP,A)
【文献】 特開2006−222670(JP,A)
【文献】 米国特許出願公開第2010/0086148(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H03G 3/20
H03G 3/30
H03G 5/16
G10L 21/038
H04R 3/04
(57)【特許請求の範囲】
【請求項1】
原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、前記低周波信号により発生される歪みの程度に関する予測情報を取得する処理部と、
前記低周波信号の高調波信号を、前記低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成するBSE信号生成部と、前記高調波信号の次数は、前記歪みの程度に関する予測情報に基づいて調整され、
前記歪みの程度に関する予測情報に基づいて、前記低周波信号と前記BSE信号との合成比率を適応的に調節する利得制御部と、
を含むことを特徴とするサウンドエンハンスメント装置。
【請求項2】
前記処理部は、
前記低周波信号を複数のサブバンドに従って分類し、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する、
ことを特徴とする請求項1記載のサウンドエンハンスメント装置。
【請求項3】
前記歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む、
ことを特徴とする請求項2記載のサウンドエンハンスメント装置。
【請求項4】
前記BSE信号生成部は、
前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、前記調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する、
ことを特徴とする請求項3記載のサウンドエンハンスメント装置。
【請求項5】
前記BSE信号生成部は、
前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調節して前記正規化された信号を生成する第1調整部と、
前記正規化された信号を前記調性情報と乗算する第2調整部と、
前記調性情報により乗算された信号の前記BSE信号として高調波信号を生成する非線形デバイスと、
を含むことを特徴とする請求項4記載のサウンドエレメント装置。
【請求項6】
前記第2調整部から出力される信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行うスペクトル先鋭化部を更に含み、
前記非線形デバイスは、スペクトルの先鋭化が行われた信号について高調波信号を生成する、
ことを特徴とする請求項5記載のサウンドエンハンスメント装置。
【請求項7】
前記低周波信号が、前記調性情報に基づいて低い調性を有すると判定された場合、前記利得制御部は、前記低周波信号の一部が前記BSE信号の一部よりも大きいように、前記低周波信号の前記BSE信号に対する合成比率を調節して、利得が調節された信号を生成する、
ことを特徴とする請求項3記載のサウンドエンハンスメント装置。
【請求項8】
前記利得制御部は、前記BSE信号の音の強さが前記高周波信号によってマスクされないように、前記高周波信号のマスキングレベルを超えるように前記BSE信号の音圧を増幅する、
ことを特徴とする請求項7記載のサウンドエンハンスメント装置。
【請求項9】
前記高周波信号及び前記利得が調節された信号を合成する後処理部を更に含む、
ことを特徴とする請求項1記載のサウンドエンハンスメント装置。
【請求項10】
前記後処理部は、
前記合成された信号が出力される時、放射パターンを形成するために前記合成された信号を処理するビーム成形部と、
前記処理された合成された信号を出力するアレイスピーカーと、
を含むことを特徴とする請求項9記載のサウンドエンハンスメント装置。
【請求項11】
原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、前記低周波信号により発生される歪みの程度に関する予測情報を生成する段階と、
前記低周波信号の高調波信号を、前記低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成する段階と、前記高調波信号の次数は、前記歪みの程度に関する予測情報に基づいて調整され、
前記歪みの程度に関する予測情報に基づいて、前記低周波信号と前記BSE信号との合成比率を適応的に調節する段階と、
を含むことを特徴とするサウンドエンハンスメント方法。
【請求項12】
前記歪みの程度に関する予測情報を生成する段階は、
前記低周波信号を複数のサブバンドに従って分類する段階と、
各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する段階と、
を含むことを特徴とする請求項11記載のサウンドエンハンスメント方法。
【請求項13】
前記歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む、
ことを特徴とする請求項12記載のサウンドエンハンスメント方法。
【請求項14】
前記高調波信号を生成する段階は、
前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、前記調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する段階と、
を含むことを特徴とする請求項13記載のサウンドエンハンスメント方法。
【請求項15】
前記調性情報に基づいて適応的に前記正規化された信号の高調波信号を生成する段階は、
前記正規化された信号を前記調性情報と乗算する段階と、
前記調性情報で乗算された信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行う段階と、
スペクトルの先鋭化が行われた信号について高調波信号を前記BSE信号として生成する段階と、
を含むことを特徴とする請求項14記載のサウンドエンハンスメント方法。
【請求項16】
前記低周波信号の前記BSE信号に対する合成比率を適応的に調節する段階は、
前記低周波信号が、前記調性情報に基づいて低い調性を有すると判定された場合、前記低周波信号の一部が前記BSE信号の一部よりも大きいように、前記低周波信号の前記BSE信号に対する合成比率を調節して、利得が調節された信号を生成する段階を含む、
ことを特徴とする請求項13記載のサウンドエンハンスメント方法。
【請求項17】
前記低周波信号の前記BSE信号に対する合成比率を適応的に調節する段階は、
前記BSE信号の音の強さが前記高周波信号によってマスクされないように、前記高周波信号のマスキングレベルを超えるように前記BSE信号の音圧を増幅する段階を更に含む、
ことを特徴とする請求項16記載のサウンドエンハンスメント方法。
【請求項18】
前記高周波信号及び前記利得が調節された信号を合成する段階を更に含む、
ことを特徴とする請求項11記載のサウンドエンハンスメント方法。
【請求項19】
前記合成する段階は、
前記合成された信号が出力される時、予め決定された放射パターンを形成するために前記合成された信号を処理する段階を更に含む、
ことを特徴とする請求項18記載のサウンドエンハンスメント方法。
【請求項20】
原信号を高周波信号及び低周波信号に分離し、前記低周波信号により発生される歪みの予測される程度を含む予測情報を取得する処理部と、
前記低周波信号の前記予測される程度に基づいて、前記低周波信号の一部を代替する高調波信号を生成する適応的高調波信号生成部と、
前記低周波信号の一部の前記高調波信号への変換比率を適応的に調整して、不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部と、
を含むことを特徴とする音声処理装置。
【請求項21】
前記処理部は、低域フィルター、マルチバンドスプリッタ、及び歪み予測情報の抽出部を含む、
ことを特徴とする請求項20記載の音声処理装置。
【請求項22】
前記マルチバンドスプリッタは、前記低周波信号を複数のサブバンドに分離し、
前記歪み予測情報の抽出部は、各サブバンドの信号について歪み予測情報を生成する、
ことを特徴とする請求項21記載の音声処理装置。
【請求項23】
前記歪み予測情報の抽出部は、各サブバンドについて調性情報及び包絡線情報を取得する、
ことを特徴とする請求項21記載の音声処理装置。
【請求項24】
前記適応的高調波信号生成部は、前記低周波信号の歪みの予測される程度に基づいて、前記高調波信号の次数を調整することで前記高調波信号を生成する、
ことを特徴とする請求項20記載の音声処理装置。
【請求項25】
前記利得制御部は、前記低周波信号の歪みの予測される程度に基づいて、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する、
ことを特徴とする請求項20記載の音声処理装置。
【請求項26】
前記利得制御部は、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する利得処理部を更に含む、
ことを特徴とする請求項20記載の音声処理装置。
【請求項27】
前記利得処理部は、前記調性情報に基づいて、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する、
ことを特徴とする請求項26記載の音声処理装置。
【請求項28】
前記利得制御部は、前記高周波信号の特性に基づいて前記高調波信号の利得を調整する、
ことを特徴とする請求項26記載の音声処理装置。
【請求項29】
前記低周波信号と前記生成された高調波信号とが合成された信号と共に、前記高周波信号を出力する更なる処理部を更に含む、
ことを特徴とする請求項20記載の音声処理装置。
【請求項30】
前記更なる処理部は、
前記合成された信号が出力される時、放射パターンを形成するために前記合成された信号を処理するビーム成形部と、
前記処理された信号を出力するアレイスピーカーと、
を含むことを特徴とする請求項29記載の音声処理装置。
【請求項31】
原信号を高周波信号及び低周波信号に分類し、前記低周波信号を複数の低周波のサブバンドに分割し、各低周波のサブバンドに対して行われた非線形処理に基づいて、各低周波のサブバンドによって発生される歪みの予測される程度を含む予測情報を取得する処理部と、
前記低周波信号の歪みの予測される程度に基づいて、各低周波のサブバンドを代替する高調波信号を生成する適応的高調波信号生成部と、
前記低周波信号及び前記高調波信号の合成比率を適応的に調整して不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部と、
を含むことを特徴とする音声処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号処理に係り、より詳細には、心理音響効果を用いて自然な聴覚環境を提供する装置及び方法に関する。
【背景技術】
【0002】
最近、TV、ホームシアターなどの装備やモバイルフォンなどで、より小型化、薄型化される機器の特性上、小型ラウドスピーカーに対する要求が高まりつつある。ラウドスピーカの特性上、その容積が小型化されるにつれて、音を発生可能な周波数範囲が制限され、特に、中低周波帯域の音響が低下する問題を有している。
【0003】
また、最近、周辺他人に騷音公害を誘発せず、イヤホンやヘッドセットなしに特定聴取者にのみ音を伝達することができるパーソナルサウンドゾーン技術に対する関心が高まりつつある。パーソナルサウンドゾーンを形成するために、多数のスピーカーを駆動した時、発生する音の指向性を利用する方法が利用される。音の指向性を生成するために、多数個のスピーカーの入力信号に時間遅延や特定フィルターを付与して出力されるサウンドビームを生成することによって、特定方向及び特定位置に音を集中させる。多数のラウドスピーカーで構成された機器の特性上、個別スピーカーが小型化されて、発生可能な周波数帯域が制限されうる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明が解決しようとする課題は、広帯域信号に対しても、低い混変調歪み成分を有し、聴感上で自然な心理音響的なベースエンハンスメント(BSE)技法を利用した音声処理装置及び方法を提供することである。
【課題を解決するための手段】
【0005】
一態様によるサウンドエンハンスメント(Sound Enhancement)装置は、処理部と、BSE信号生成部と、利得制御部とを含む。処理部は、原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、低周波信号により発生される歪みの程度に関する予測情報を取得する。心理音響的なベースエンハンスメント(BSE)信号生成部は、低周波信号の高調波信号を、低周波信号に代わるBSE信号として生成する。高調波信号の次数は、歪みの程度に関する予測情報に基づいて調整される。利得制御部は、歪みの程度に関する予測情報に基づいて、低周波信号とBSE信号との合成比率を適応的に調節する。
【0006】
記処理部は、低周波信号を複数のサブバンドに従って分類し、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する。歪みの程度に関する予測情報は、調性(トーナリティー)情報及び包絡線(エンベロープ)情報を含む。
【0007】
BSE信号生成部は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する。
【0008】
BSE信号生成部は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調節して正規化された信号を生成する第1調整部と、正規化された信号を調性情報と乗算する第2調整部と、調性情報により乗算された信号のBSE信号として高調波信号を生成する非線形デバイスとを含む。
【0009】
サウンドエンハンスメント装置は、第2調整部から出力される信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化(シャープニング)を行うスペクトル先鋭化部を更に含み、非線形デバイスは、スペクトルの先鋭化が行われた信号について高調波信号を生成する。
【0010】
低周波信号が、調性情報に基づいて低い調性を有すると判定された場合、利得制御部は、低周波信号の一部がBSE信号の一部よりも大きいように、低周波信号のBSE信号に対する合成比率を調節して、利得が調節された信号を生成する。
【0011】
利得制御部は、BSE信号の音の強さが高周波信号によってマスクされないように、高周波信号のマスキングレベルを超えるようにBSE信号の音圧を増幅する。
【0012】
サウンドエンハンスメント装置は、高周波信号及び前記利得が調節された信号を合成する後処理部を更に含む。後処理部は、合成された信号が出力される時、放射パターンを形成するために合成された信号を処理するビーム成形部と、処理された合成された信号を出力するアレイスピーカーとを含む。
【0013】
他の態様によるサウンドエンハンスメント方法は、原信号を高周波信号及び低周波信号に分離し、低周波信号を分析して、低周波信号により発生される歪みの程度に関する予測情報を生成する段階と、低周波信号の高調波信号を、低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成する段階と、高調波信号の次数は、歪みの程度に関する予測情報に基づいて調整され、歪みの程度に関する予測情報に基づいて、低周波信号とBSE信号との合成比率を適応的に調節する段階とを含む。
【0014】
他の態様によるサウンドエンハンスメント方法で、歪みの程度に関する予測情報を生成する段階は、低周波信号を複数のサブバンドに従って分類する段階と、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する段階とを含む。歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む。
【0015】
高調波信号を生成する段階は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、調性情報に基づいて正規化された信号のBSE信号として高調波信号を適応的に生成する段階とを含む。
【0016】
調性情報に基づいて適応的に正規化された信号の高調波信号を生成する段階は、正規化された信号を調性情報と乗算する段階と、調性情報で乗算された信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行う段階と、スペクトルの先鋭化が行われた信号について高調波信号をBSE信号として生成する段階とを含む。
【0017】
低周波信号のBSE信号に対する合成比率を適応的に調節する段階は、低周波信号が、調性情報に基づいて低い調性を有すると判定された場合、低周波信号の一部がBSE信号の一部よりも大きいように、低周波信号のBSE信号に対する合成比率を調節して、利得が調節された信号を生成する段階を含む。
【0018】
低周波信号のBSE信号に対する合成比率を適応的に調節する段階は、BSE信号の音の強さが高周波信号によってマスクされないように、高周波信号のマスキングレベルを超えるようにBSE信号の音圧を増幅する段階を更に含む。
【0019】
他の態様によるサウンドエンハンスメント方法は、高周波信号及び利得が調節された信号を合成する段階を更に含む。合成する段階は、合成された信号が出力される時、予め決定された放射パターンを形成するために合成された信号を処理する段階を更に含む。
【0020】
また、他の態様による音声処理装置は、原信号を高周波信号及び低周波信号に分離し、低周波信号により発生される歪みの予測される程度を含む予測情報を取得する処理部と、低周波信号の前記予測される程度に基づいて、低周波信号の一部を代替する高調波信号を生成する適応的高調波信号生成部と、低周波信号の一部の高調波信号への変換比率を適応的に調整して、不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部とを含む。
【0021】
また他の態様による音声処理装置の処理部は、低域フィルタ、マルチバンドスプリッタ、及び歪み予測情報抽出部を含む。
【0022】
マルチバンドスプリッタは、低周波信号を複数のサブバンドに分離し、歪み予測情報の抽出部は、各サブバンドの信号について歪み予測情報を生成する。マルチバンドスプリッタは、低周波帯域の信号を複数個のサブバンド別に分離し、各サブバンドの信号に対して歪曲発生量の予測情報を生成することができる。歪み予測情報抽出部は、各サブバンドについて調性情報及び包絡線情報を取得する。
【0023】
適応的高調波信号生成部は、低周波信号の歪みの予測される程度に基づいて、高調波信号の次数を調整することで高調波信号を生成する。
【0024】
利得制御部は、低周波信号の歪みの予測される程度に基づいて、低周波信号及び生成された高調波信号の合成比率を適応的に調節する。
【0025】
利得制御部は、低周波信号及び生成された高調波信号の合成比率を適応的に調節する利得処理部を更に含む。
【0026】
利得処理部は、調性情報に基づいて、低周波信号及び生成された高調波信号の合成比率を適応的に調節する。
【0027】
利得制御部は、高周波信号の特性に基づいて高調波信号の利得を調整する。
【0028】
また、他の態様による音声処理装置は、 低周波信号と生成された高調波信号とが合成された信号と共に、高周波信号を出力する更なる処理部を更に含む。更なる処理部は、合成された信号が出力される時、放射パターンを形成するために合成された信号を処理するビーム成形部と、処理された信号を出力するアレイスピーカーとを含む。
【0029】
また、他の態様による音声処理装置は、原信号を高周波信号及び低周波信号に分類し、低周波信号を複数の低周波のサブバンドに分割し、各低周波のサブバンドに対して行われた非線形処理に基づいて、各低周波のサブバンドによって発生される歪みの予測される程度を含む予測情報を取得する処理部と、低周波信号の歪みの予測される程度に基づいて、各低周波のサブバンドを代替する高調波信号を生成する適応的高調波信号生成部と、低周波信号及び高調波信号の合成比率を適応的に調整して不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部とを含む。
【図面の簡単な説明】
【0030】
図1】サウンドエンハンスメントの全体構成の一例を示す図である。
図2図1の処理部の構成の一例を示す図である。
図3図2の歪み予測情報抽出部の構成の一例を示す図である。
図4図1のBSE信号生成部の構成の一例を示す図である。
図5A】エンベロープの大きさの変化による高調波発生比率の変化を示す図である。
図5B】エンベロープの大きさの変化による高調波発生比率の変化を示す図である。
図6A】調性(トナル)成分とフラットなスペクトルとが混在された信号に対するBSE処理結果を示す図である。
図6B】スペクトルの先鋭化が行われた信号に対するBSE処理結果を示す図である。
図7図1の利得制御部の構成の一例を示す図である。
図8A図1の後処理部の構成の一例を示す図である。
図8B図1の後処理部の構成の一例を示す図である。
図8C図1の後処理部の構成の一例を示す図である。
図9】サウンドエンハンスメント方法の動作順序の一例を示すフローチャートである。
【発明を実施するための形態】
【0031】
以下、添付した図面を参照して、本発明の一実施形態を詳しく説明する。本発明を説明するに当たって、関連した公知機能または構成についての具体的な説明が、本発明の要旨を不明にする恐れがあると判断される場合には、その詳細な説明を省略する。また、後述する用語は、本発明での機能を考慮して定義された用語であって、これは、ユーザ、運用者の意図または慣例などによって変わりうる。したがって、その定義は、本明細書全般に亘った内容に基づいて下さなければならない。
【0032】
高調波を用いて、低音を認知させる現象を心理音響では、仮想ピッチ(virtual pitch)又は失われた基底音(missing fundamental)と称する。さらに詳しくは、基本周波数ωを有する音と、その高調波(2ω、3ω、4ω、...)のみで構成された音が類似したピッチを有する現象を言う。このような現象を用いて実際に低音を発生させずとも、低音の聴感を提供する技法をBSE(Psychoacoustic Bass Enhancement)(以下、BSEと略称する)と言う。
【0033】
通常、高調波信号の生成に非線形デバイス(non−linear device)が利用される。このような非線形デバイスは、高調波信号を発生させる時、高調波成分の以外の他の周波数成分が発生する。このような高調波ではない(non−harmonic)成分による音声信号の歪みを混変調歪み(inter−modulation distortion;以下、IMDと略称する)と言う。このようなIMDは、その大きさが原音より小さくなくて、低音補強技法を使用時に音質劣化の主要原因となる。
【0034】
BSEによって処理しようとする帯域の周波数が広い場合には、多様なスペクトルの音成分が存在するので、IMDが問題となる。また、このような、IMDは、原音成分に対してさらに高次の高調波信号を発生させるほど大きく発生する傾向があるので、仮想ピッチをより増加させるために、より高次の高調波信号を使うほど音質が低下する。
【0035】
図1は、サウンドエンハンスメント装置の全体構成の一例を示す図である。
【0036】
音声指向パターン生成装置100は、処理部110、BSE信号生成部120、利得制御部130、後処理部140及びアレイスピーカ150を含みうる。
【0037】
処理部110は、高周波帯域の信号及び低周波帯域の信号に分離し、低周波帯域の信号を分析して、歪み発生量の予測情報を生成する。ここで、低周波帯域は、一実施形態によって、BSEが適用されない高周波帯域を除いた周波数帯域であって、実際に入力される音源の中間周波数帯域を含みうる。すなわち、低周波帯域は、一般的にサブウーファーが処理する低周波帯域より広い範囲の帯域を意味する。
【0038】
例えば、周波数範囲は、仮想ピッチ(ピッチ強度)に基づくことができる。予測されたピッチ強度がさらに強いほど原音のピッチは、その高調波として強く認識される。例えば、250Hz以下の周波数成分は強いピッチ強度を有するものであって、すなわち、低周波帯域の信号として決定されうる。しかし、このようなピッチ強度は、単に例示的なものであり、サウンドエンハンスメント装置は、これに限定されるものではない。説明したように、強いピッチ強度を有する周波数成分は、高調波に代替されうる。
【0039】
処理部110は、低周波帯域の信号を予め決定されたサブバンドに分離し、各サブバンドの信号から、フレーム単位で歪み発生量の予測情報としてトーナリティー情報及び/又はエンベロープ情報を抽出することができる。トーナリティー情報及び/又はエンベロープ情報は、各サブバンドに対して非線形処理が行われた後に、各サブバンドの信号から生成される歪み発生量の予測に利用されうる。エンベロープ情報は、例えば、信号のエネルギー、信号の音の強さ(ラウドネス)などを含みうる。
【0040】
BSE信号生成部120は、歪み発生量の予測情報によって低周波帯域の信号に対して高調波信号の次数を調整して、高調波信号を生成する。例えば、BSE信号生成部120は、各サブバンドのトーナリティー情報及びエンベロープ情報に基づいて、適応的な高調波信号を生成することができる。サブバンドによって発生する予測された歪み発生量に基づいて、BSE信号生成部120は、サブバンドを代替する高調波信号の次数を調整することができる。
【0041】
BSE信号生成部120は、分割された音声信号を入力され、音声信号が非線形処理を経れば、低周波帯域の信号の歪み発生量を分析し、予測することができる。該予測された歪み発生量に基づいて、BSE信号生成部120は、各サブバンドの利得を適応的に制御することができて、歪みが発生する機会が少ないサブバンドがさらに高い次数の高調波を生成することができる。各サブバンドの相異なる利得制御は、周波数帯域に亙って高調波の発生量を均等ではないようにできる。これを補償するために、生成された高調波と元のサブバンド信号との合成比率が変更されうる。
【0042】
仮想ピッチをさらに増加させるのに利用される高調波信号の次数がさらに高いほど、音質の劣化はさらに大きくなる。したがって、さらに高い歪み発生量を起こすと予測されるサブバンドは、さらに低いエンベロープ及びさらに低い次数を有する高調波信号に調整され、さらに低い歪み発生量を起こすと予測されるサブバンドはさらに高いエンベロープ及びさらに高い次数を有する高調波信号に調整されうる。これにより、BSE信号生成部120は、歪みを起こすサブバンドを回避することができる。
【0043】
生成された高調波信号は、元の低周波帯域の信号を代替する信号であって、以下では、BSE信号と称する。BSE信号生成部120は、歪み発生量の予測情報のうち、音源のスペクトルによるトーナリティー情報によって適応的に高調波の発生量を調節することができる。また、BSE信号生成部120は、低周波帯域の信号に対してスペクトルの先鋭化技法を行ってIMDをさらに低減させることができる。
【0044】
利得制御部130は、歪み発生量の予測情報によって低周波帯域の信号とBSE信号との合成比率を利得調節によって適応的に調節して、出力される低周波帯域の信号を生成する。例えば、利得制御部130は、所望の生成される高調波信号の量に基づいて、低周波帯域信号のBSE信号への変換比率を適応的に調整することができる。各サブバンドの相異なる利得制御は、周波数帯域に亙って高調波の量を均一ではないようにできる。これを補償するために、生成された高調波及び元のサブバンド信号の合成の比率が適応的に調整されて不均一な高調波量を防止するか、減少させることができる。
【0045】
後処理部140は、高周波帯域の信号及び利得制御部130によって利得が調節された低周波帯域の信号を合成する。後処理部140は、合成された信号が出力される時、既定の放射パターンを形成するように合成された信号を処理し、該処理された信号を出力することができる。例えば、処理された信号は、スピーカーに出力される。
【0046】
IMD成分の発生量を予測して適応的に高調波信号の次数及びその増幅比を調節することによって、音質劣化を最小化させながら、可能な限り多くの低周波成分を高周波帯域に置き換えうる。このように処理された信号が、小型ラウドスピーカーシステムに適用される場合、広帯域の低周波帯域の信号に対して低いIMD成分を有し、聴感上で自然なBSE信号を発生させることができる。
【0047】
図2は、図1の処理部110の構成の一例を示す図である。
【0048】
前処理部110は、低域フィルタ210、マルチバンドスプリッタ220、歪み予測情報抽出部230及び高域フィルタ240を含みうる。
【0049】
低域フィルタ210は、入力信号のうち、BSE信号を発生させる低周波帯域(又は中低周波帯域)の信号を分離する。
【0050】
マルチバンドスプリッタ220は、低域フィルタ210によって分離された低周波帯域の信号に対するIMDを低減させるために、低周波帯域の信号を複数のサブバンドに分離する。これは、式(1)で表わすことができる。ここで、サブバンド信号は、1オクターブ又は1/3オクターブフィルタなど聴感特性によって多様な形態で提供されることがある。
【0051】
【数1】
ここで、ORG(t)は、低域フィルタ210によって分離された低周波帯域の原音信号を表わし、ORG (m)(t)は、各サブバンドに対する原音信号を表わす。
【0052】
このように、低周波帯域を複数のサブバンドに分割し、該分割されたサブバンド成分に対して歪み予測情報を抽出し、今後複数のサブバンドに対する信号にそれぞれ低音補強処理BSEを行うことによって、IMDを低減させることができる。詳細には、複数のサブバンドに対する信号にそれぞれ低音補強処理BSEを行えば、相異なる周波数帯域間の混変調は発生せず、帯域内の周波数成分の間でのみ混変調が発生するので、全体信号にBSEを適用する場合に比べて混変調を低減させることができる。
【0053】
歪み予測情報抽出部230は、マルチバンド信号のそれぞれに対してエンベロープ情報及びトーナリティーパラメータを歪み発生量の予測情報として抽出する。
【0054】
エンベロープ情報は、BSE信号生成部120のBSE処理で高調波発生量の調節に使われる。トーナリティー情報は、各スペクトルが平坦な程度を表わすパラメータであり、IMDの発生量の調節に使われる。
【0055】
BSEは、原音成分にピッチが強い成分に対して適用が必要であり、原音にピッチが存在しない場合や、IMDが過度に発生する場合には、BSEを適用する必要がない。例えば、ノイズのような音声信号や、インパルシブサウンド(implusive sound)の場合には、平坦なスペクトルを有するので、ピッチを表わさず、またあらゆる周波数成分が同等の大きさを有するので、歪みが過度に発生する。
【0056】
したがって、原音成分によってBSE信号の発生量を調節し、ピッチ強度が低いか、歪みが過度に発生する場合、BSE信号に比べて原音の比重を高めて自然な処理結果が得られる。平坦なスペクトルとピッチ成分を有するスペクトルとを区別するために、複数のサブバンドの各周波数バンド毎にスペクトルのトーナリティーを計算することができる。
【0057】
高域フィルタ240は、入力信号のうち、高周波帯域の信号を分離する。高周波帯域の信号に対しては、BSE信号処理が行われない。
【0058】
歪み予測情報抽出部230は、図3に示されたように構成することができる。
【0059】
図3は、図2の歪み予測情報抽出部230の概略的構成の一例を示す図である。
【0060】
歪み予測情報抽出部230は、トーナリティー検出部232及びエンベロープ検出部234を含みうる。
【0061】
トーナリティー検出部232は、m個のマルチバンド信号ORG(1)(t)、...、ORG(m)(t)のそれぞれに対してトーナリティーSFM(1)(t)、...、SFM(m)(t)を検出する。先立って各分離された、各周波数帯域の信号のうち、m番目のバンドの信号のn番目のタイムフレーム区間をORG(m,n)(t)と言う。ここで、タイムフレームは、信号の特定視覚で一定の長さの区間を抽出したものであって、各タイムフレームは、時間に対して互いに部分重畳されるものであり得る。
【0062】
前述したように、平坦なスペクトルとピッチ成分を有するスペクトルとを区別するために、各周波数バンドのタイムフレーム別に、スペクトルのトーナリティーを計算することができる。トーナリティーは、信号がどれほど純音に近いかを表わすものであって、多様な方法で定義されることができるが、一般的に、次のような定義(spectral flatness measure;SFM)が多く使われる。
【0063】
【数2】
ここで、AM(m,n)(f)は、ORG(m,n)(t)の周波数スペクトルを表わす。AM(m,n)(f)は、離散フーリエ変換を通じて離散化された周波数f=lΔfに対するスペクトルが得られる。ここで、lは0より大きい整数である。GMは、スペクトルA(m,n)(f)の幾何平均(geometricmean)を表わし、AMは、算術平均(arithmetic mean)を表わす。このように定義されたトーナリティーは、純音成分である場合、1の値を表わし、完壁に平坦なスペクトルの場合、0の値を表わす。
【0064】
トーナリティー検出部232は、各タイムフレームで得られたトーナリティー測定値SFM(m、n)に補間処理を行い、該補間の結果生成された値を時間軸で連続した値に変換する。このような方法で、トーナリティー検出部232は、最終的に各周波数帯域別に連続した信号SFM(m)(t)を獲得することができる。該取得されたトーナリティー測定値は、原音のピッチ強度及びIMD発生量を代表する。トーナリティー値が高いほどピッチ強度が高く、歪み発生量が少ない信号として扱われる。
【0065】
エンベロープ検出部234は、m個の各マルチバンド信号ORG(1)(t)、...、ORG(m)(t)のそれぞれに対してエンベロープ情報ENV(1)(t)、...、ENV(m)(t)を検出する。
【0066】
図3には、m番目のバンド信号ORG(m)(t)に対するエンベロープ情報及びトーナリティー情報を抽出する構成に対して示している。歪み予測情報抽出部230のトーナリティー検出部232及びエンベロープ検出部234は、各サブバンド信号を処理するために、サブバンドの個数に対応する個数のトーナリティー検出部及びエンベロープ検出部を含んで構成することができる。
【0067】
図4は、図1のBSE信号生成部120の概略的構成の一例を示す図である。
【0068】
BSE信号生成部120は、歪み予測情報抽出部230から抽出されたトーナリティー情報及びエンベロープ情報を用いて適応的に高調波信号を生成する。適応的に生成された高調波信号をBSE信号と言う。BSE信号生成部120は、エンベロープ情報適用部410、第1乗算部420、第2乗算部430、スペクトル先鋭化部440及び非線形デバイス450を含みうる。
【0069】
図4は、m番目の帯域の信号ORG(m)(t)に対するBSEを行うためのブロック図であって、BSE信号生成部120は、他のそれぞれの帯域の信号に対しても、並列的にBSEを行うための機能ブロックをさらに含む。
【0070】
入力の大きさ変動によるBSE効果の変化、すなわち、動的範囲の変化による高調波発生量の変化を防止するために、BSE演算を行う前に入力信号のピークエンベロープを一様にする処理が行われる。
【0071】
エンベロープ情報適用部410は、入力信号のピークエンベロープ(x)を入力信号を均一化するための値(1/x)に変換する。第1乗算部420は、値(1/x)と信号ORG(m)(t)とを乗算することによって、信号ORG(m)(t)のエンベロープを均一化する。
【0072】
m番目のサブバンドの音源信号をORG(m)(t)とし、抽出されたエンベロープ情報をENV(m)(t)とすれば、エンベロープ情報適用部410及び第1乗算部420は、ORG(m)(t)をENV(m)(t)で割て単位エンベロープを有する信号に変換させて均一化された信号nORG(m)(t)を生成することができる。これは、式(3)のように表わすことができる。
【0073】
【数3】
一実施形態では、抽出された信号エンベロープに測定されたトーナリティーを乗算して、トナル成分の場合、より高い次数の高調波信号を生成し、平坦なスペクトルに対しては、その高調波の大きさを幾何級数的に減少させる。これは、式(4)で表わすことができる。
【0074】
【数4】
この方法を使えば、IMD発生量が少なく、ピッチが強い信号の場合には、高次の高調波が発生し、IMDが容易に発生する信号の場合には、高次の高調波の発生量が多くないように、低次の高調波のみ発生する効果が得られる。
【0075】
そのために、第2乗算部430は、均一化された信号nORG(m)(t)に抽出されたトーナリティーSFM(m)(t)を乗算するように構成することができる。エンベロープ情報適用部410、第1乗算部420及び第2乗算部430は、機能的にエンベロープ情報を用いて、各サブバンドの信号の大きさを均一化する第1調整部及び正規化された信号にトーナリティー情報を乗算する第2調整部で構成することができる。
【0076】
非線形デバイス450は、入力される信号に対して高調波を生成する。非線形デバイス450としては、乗算器、クリッパなどが使われる。
【0077】
非線形デバイス450は、均一化された信号nORG(m)(t)にトーナリティー情報SFM(m)(t)を乗算した信号に対する高調波を生成することによって、IMD発生量が高いと予測される信号に対しては、低いエンベロープを有するようにできる。したがって、IMD発生量が高いと予測される信号に対しては、低次の高調波のみを生成することによって、高次の高調波の生成時に発生する高い歪みを防止することができる。
【0078】
このように、トーナリティーによって他のBSEを行う理由について、図5A及び図5Bを参照して説明する。図5A及び図5Bは、エンベロープの大きさの変化による高調波の発生比率の変化を示す図である。
【0079】
多くの非線形デバイスであるBSEプロセッサは、非線形特性と同時に不均一な特性を有する。ここで、不均一とは、入力信号が増幅された時、BSEプロセッサの出力の大きさが線形的に比例して増加しない特性を言う。
【0080】
図5Aで、非線形デバイス510が、乗算器であると仮定する。乗算器510として使って高調波を発生させる時、その入力の大きさをc倍ほど増幅させるならば、j番の乗算演算を経た信号の大きさは、式(5)のように表わすことができる。
【0081】
【数5】
図5Aに示されたように、増幅比cが1であれば、非線形デバイス510に入力された信号に対して、次数に無関係に一定の大きさの高調波信号が出力される。
【0082】
しかし、図5Bに示されたように、c<1である増幅比を使えば、乗算器510を経た高調波の次数が高くなるほどその大きさが幾何級数的に減少する。すなわち、高次の高調波が低次の高調波に比べて非常に小さな信号を得るようになる。
【0083】
このような効果を利用すれば、非線形デバイス510で発生する高調波の大きさを容易に変化させることができ、結果的に、高調波の次数が調節される。
【0084】
IMD発生量によって高調波の次数を調節する方法の以外にも、よりIMDを減衰するために、BSE信号生成部120にスペクトル先鋭化部440がさらに含まれうる。スペクトル先鋭化部440は、第2乗算部430から出力される信号にトーナリティー情報を用いてスペクトル先鋭化を行うことができる。
【0085】
図6Aは、トナル成分と平坦なスペクトルとが混在された信号に対するBSE処理の結果を表わし、図6Bは、スペクトルの先鋭化が行われた信号に対するBSE処理の結果を示す図である。
【0086】
図6Aに示されたように、グラフ610のように一つの帯域内に平坦なスペクトルとトナル成分とが混在されている信号に対して高調波を生成すれば、グラフ620のように平坦なスペクトルとトナル成分との間のIMDは、広い帯域に亙って発生する。このような、現象を低減するために、スペクトルの領域でピーク成分のみが維持され、ノイズのようなスペクトルは低減するように、スペクトルを拡張するスペクトルの先鋭化を行う。平坦なスペクトルとトナル成分とが混在されている信号をスペクトルの先鋭化によって処理すれば、スペクトルでピーク成分のみが維持されうる。図6Bを参照すると、スペクトルの先鋭化が行われた信号630に対してBSEを適用すれば、グラフ640に示されたように、広い帯域に亙って発生するIMDを低減することができる。
【0087】
再び図4を参照すると、スペクトルの先鋭化部440の動作は、式(6)で表わすことができる。
【0088】
【数6】
ここで、αは、スペクトルの先鋭化の量を調節するチューニングパラメータであり、トーナリティー測定と連動されて変更されうる。例えば、スペクトルの先鋭化のための情報として式(7)に表われたように、トーナリティー情報を利用することができる。
【0089】
【数7】
ここで、ηは、トーナリティーを反映する程度を表わし、ユーザによって調節される。
【0090】
スペクトルの先鋭化部440は、トーナリティーが高い信号に対してのみ、部分的にスペクトルの先鋭化を使って音質の変化を最小化することができる。言い換えれば、スペクトルの先鋭化部440は、周波数領域でピーク成分を除いた残りのスペクトル成分を除去して、広帯域信号とトーナリティー成分との間の歪みを抑制する。
【0091】
非線形デバイス450は、スペクトルが先鋭化された信号に対する高調波信号を生成する。点線矢印で表わしたように、非線形デバイス450は、BSE信号発生後に、原音信号のエンベロープ情報によってBSE信号が対応する元の低周波信号のエンベロープを有するように、BSE信号のエンベロープを復元することができる。
【0092】
図7は、図1の利得制御部130の構成の一例を示す図である。
【0093】
利得制御部130は、IMD発生量によってBSE信号と原音との合成比率を調節する部分702、704、706、708、710と、高周波帯域の信号の特性によって再びBSE信号の利得を調節する部分712、714、716、718、720、722とで構成することができる。図7は、m番目の帯域の原音信号ORG(m)(t)、m番目の帯域のBSE信号BSE(m)(t)に対する合成のために、それぞれの利得を調整するためのブロック図を中心に表わしたものであって、利得制御部130は、他のサブバンドの原音信号及びBSE信号に対して、それぞれ並列的に利得を調節するための機能ブロックをさらに含む。
【0094】
まず、IMD発生量によってBSE信号と原音との比率を調節する部分702、704、706、708、710の動作について説明する。
【0095】
原音の低周波帯域の音を最大限維持するためには、生成されたBSE信号と原音とのラウドネスを一致させることが重要である。BSE利得処理部706は、測定されたトーナリティー情報によって処理されていない低周波帯域信号とBSE信号との比率を適応的に調整する。これを通じて、BSEを適用しない信号フレームに対しては、原音の比率を高めて、歪みが少なくより自然な音を具現することができる。
【0096】
第1エネルギー検出部702は、原音低周波成分ORG(m)(t)のラウドネス
【0097】
【数8】
を検出する。第2エネルギー検出部704は、BSE信号BSE(m)(t)のラウドネス
【0098】
【数9】
を検出する。ラウドネスは、信号のRMS(Root−Mean−Square)の大きさを基準に算出され、またはラウドネスメーターを用いて正確に算出される。
【0099】
BSE利得処理部706は、原音低周波成分ORG(m)(t)のラウドネス
【0100】
【数10】
及びBSE信号BSE(m)(t)のラウドネス
【0101】
【数11】
を用いて、それぞれの利得調節値g(m)(t)及びg(m)(t)を生成する。BSE利得処理部706は、歪み予測情報抽出部230で抽出されたトーナリティーSFMを用いて利得調節値g(m)(t)及びg(m)(t)を生成する。
【0102】
BSE利得処理部706は、BSE信号BSE(m)(t)の利得調節値g(m)(t)はトーナリティーに比例する値で設定し、原音低周波成分ORG(m)(t)の利得調節値g(m)(t)は、トーナリティーに反比例するように設定することができる。これによれば、原音は、信号のトーナリティーに反比例して、その量が縮小され、該縮小された量ほどのエネルギーがBSE信号に置き換えられる。したがって、トーナリティーが高い場合、BSE信号をより多く添加して性能を高め、トーナリティーが低い場合、原音の比率を高めてIMDを最小化することができる。
【0103】
第1乗算部708は、BSE信号BSE(m)(t)に利得調節値g(m)(t)を乗算する。このように、BSE信号に利得調節値g(m)(t)が乗算されて生成されたwBSE(weighted BSE)信号wBSE(m)(t)は、各サブバンドに対して計算される。
【0104】
第2乗算部710は、原音低周波成分ORG(m)(t)の利得調節値g(m)(t)を乗算する。第2乗算部710によって生成された信号wORG(m)(t)は、後処理部140の低周波ビーム処理部610に伝達される。
【0105】
前述したように、原音低周波成分ORG(m)(t)及びBSE信号BSE(m)(t)に対する処理過程は、式(8)のように表わすことができる。
【0106】
【数12】
次いで、高周波帯域の信号の特性によって、再びBSE信号の利得を調節する部分712、714、716、718、720、722について説明する。
【0107】
合算部712は、各サブバンドのwBSE信号を合算して、合算信号tBSE(t)を生成する。合算された信号tBSE(t)と高周波成分は、同じ周波数帯域に位置するので、相互マスキング効果によって合算信号tBSE(t)が聞こえないこともある。マスキング効果とは、人間の音の知覚特性のうち一つであって、一つの音に対して周辺の周波数成分の音が影響を受けることを意味する。すなわち、マスキングサウンドの妨害によって最小可聴値が増加する現象を意味し、ある音がまた他の音を聞くことができる能力を減少させる現象を意味する。
【0108】
合算信号tBSE(t)の増幅比g(t)を算出するために、合算信号tBSE(t)及び高周波信号HP(m)(t)信号のそれぞれのラウドネスが分析されなければならない。
【0109】
このために、ラウドネス検出部714は、合算された信号tBSE(t)に対するラウドネスgtbse(t)を検出する。また、マスキングレベル検出部716は、高周波信号HP(m)(t)の音量を分析して、そのマスキングレベルgmsk(t)を算出する。
【0110】
制御利得処理部718は、マスキング効果によってBSE信号が聞こえない現象を防止するために、合算信号tBSE(t)のレベルが、高周波信号HP(m)(t)のマスキングレベルより高いように増幅比gを算出する。増幅比gは、式(9)で表わすことができる。
【0111】
【数13】
合算部722は、増幅されたBSE信号と原音の高周波成分とを合算して、最終的な高周波帯域信号を生成する。
【0112】
図8A乃至図8Cは、図1の後処理部140の構成の一例を示す図である。
【0113】
後処理部140は、生成されたマルチバンド低周波数信号と高周波数信号とをラウドスピーカーに出力して音波を発生させる。後処理部140は、図8A乃至図8Cの後処理部810、820、830で示されたように、多様な形態で構成され、これに限定されるものではない。
【0114】
図8Aを参照すると、後処理部810は、合算部812及び単一スピーカー814を含みうる。合算部812は、低周波帯域のマルチバンド信号及び高周波帯域の信号を結合し、該結合された信号は、スピーカー814を通じて出力される。
【0115】
図8Bを参照すると、後処理部820は、合算部822、ビーム処理部824及びアレイスピーカー816を含みうる。合算部822は、低周波帯域のマルチバンド信号及び高周波帯域の信号を結合する。ビーム処理部824は、結合された信号が出力される時、予め決定された放射パターンを形成するように合成された信号を処理する。アレイスピーカー816は、合成された信号を出力して、サウンドビームを発生させる。
【0116】
図8Cを参照すると、後処理部830は、低周波数帯域ビーム処理部831、高周波数帯域ビーム処理部832、複数個の合算器833、834、835及びアレイスピーカー836を含みうる。低周波数帯域ビーム処理部831は、各サブバンド別信号が、各サブバンド毎に設けられたビーム処理部を経るようにする。各サブバンド毎のビーム処理部を通過して生成されたマルチチャンネル信号を低周波数帯域の全周波数帯域に対して合算して出力する。低周波数帯域ビーム処理部831に含まれ、低周波数帯域の全周波数帯域に対する信号を合算するための複数の合算器の個数は、アレイスピーカー836の出力チャンネルの個数に対応する。
【0117】
高周波数帯域ビーム処理部832は、高周波帯域の信号に対してビーム成形技法を適用して処理する。複数の合算器833、834、835は、低周波数帯域ビーム処理部831から出力されたマルチチャンネル信号と高周波帯域の信号とをそれぞれ合算する。複数の合算器833、834、835の個数は、アレイスピーカー836の出力チャンネルの個数に対応する。
【0118】
図9は、サウンドエンハンスメント方法の動作順序の一例を示すフローチャートである。
【0119】
サウンドエンハンスメント装置100は、原音信号を高周波帯域の信号及び低周波帯域の信号に分離する(910)。サウンドエンハンスメント装置100は、低周波帯域の信号を複数のサブバンドに分離し、各サブバンドの信号に対してフレーム単位で歪み発生量の予測情報を生成することができる。
【0120】
サウンドエンハンスメント装置100は、低周波帯域の信号を分析して、歪み発生量の予測情報を生成する(920)。歪み発生量の予測情報は、トーナリティー情報及びエンベロープ情報を含みうる。
【0121】
サウンドエンハンスメント装置100は、歪み発生量の予測情報によって低周波帯域の信号に対して高調波信号の次数を調整して高調波信号を生成することによって、低周波帯域の信号を代替するBSE信号を生成する(930)。このために、サウンドエンハンスメント装置100は、まずエンベロープ情報を用いて、各サブバンドの信号の大きさを均一化し、該均一化された信号に対してトーナリティー情報によって適応的に高調波信号を生成することができる。また、IMDをさらに低減させるために、サウンドエンハンスメント装置100は、高調波生成以前に、トーナリティー成分が高い信号に対してスペクトルの先鋭化を行い、該スペクトルの先鋭化が行われた信号に対して高調波信号を生成することができる。
【0122】
サウンドエンハンスメント装置100は、歪み発生量の予測情報によって低周波帯域の信号とBSE信号との合成比率を適応的に調節する(940)。このために、サウンドエンハンスメント装置100は、トーナリティー情報によってトーナリティー情報が低い信号に対しては、低周波帯域の信号の比率がBSE信号に比べて相対的に高いように低周波帯域の信号及びBSEの合成比率を調節して、利得が調節された信号を生成することができる。また、サウンドエンハンスメント装置100は、BSE信号のラウドネスが高周波帯域の信号によってマスクされないように、高周波数帯域の信号のマスキングレベルを超えてBSE信号の音圧を増幅することができる。
【0123】
高周波帯域の信号及び利得が調節された信号は、合成されて出力され、合成された信号が出力される時、予め決定された放射パターンを形成するように出力される。
【0124】
一実施形態によれば、IMDを低減しながら広い低周波帯域に対する低音補強処理BSEを行うことができるので、通常的なサブウーファーより広帯域の低音成分を高周波信号に代替することができる。より広い帯域の信号をBSE信号に代替して、狭い周波数帯域のみが使用可能な多様なラウドスピーカーシステムで低音知覚を提供することができる。また、より広い帯域の信号をBSE信号で代替することができるので、より小型化、薄型化されたラウドスピーカーでも十分な低音知覚特性を提供することができる。
【0125】
BSE信号処理で発生する混変調歪みの発生量によって原音の低音成分とBSE処理された信号との比率を適応的に調節することによって、音質の劣化を最小化しながら信号フレーム毎にBSE効果を極大化することができる。混変調歪み発生量の予測によってBSE信号処理で発生させる高調波の次数を適応的に調整して、音源特性によってより自然な低周波帯域の信号に対する知覚特性を提供することができる。また、マルチバンド処理とスペクトルの先鋭化技法とを通じて、より混変調歪みが低減したBSE信号が得られる。このように処理された信号に対するビーム成形処理時には、ビーム幅が低い低周波帯域の音をビーム幅が狭い高周波帯域の音に変換されることによって、アレイのサイズの増加なしに全周波数帯域で室内に適用するのに十分な音圧差を確保することができる。
【0126】
これに説明された端末装置は、携帯電話、パーソナル・デジタル・アシスタント(PDA)、デジタルカメラ、ポータブルゲームコンソール、MP3プレーヤー、携帯/個人用マルチメディアプレーヤー(PMP)、ハンドヘルド電子ブック、携帯用ラップトップ及び/またはタブレットパーソナルコンピュータ(PC)、グローバル・ポジショニング・システム(GPS)ナビゲーション、デスクトップPC、高画質テレビ(HDTV)、光ディスクプレーヤー、セットトップボックスなどのように、無線通信又はネットワーク通信ができるデバイスであり得る。
【0127】
コンピュータシステム又はコンピュータは、バス、ユーザインターフェース及びメモリコントローラと電気的に連結されるマイクロプロセッサとを含みうる。コンピュータシステム又はコンピュータは、またフラッシュメモリ装置を更に含みうる。フラッシュメモリは、メモリコントローラを通じてNビットデータを保存することができる。Nビットデータは、マイクロプロセッサによって処理されるか、処理され、ここで、Nは、1又は1以上の整数であり得る。コンピュータシステム又はコンピュータが移動装置である時、コンピュータシステム又はコンピュータに電源を供給するために、バッテリーが付加的に提供されることがある。
【0128】
コンピュータシステム又はコンピュータが、アプリケーションチップセット、CIS(camera image processor)、DRAM(dynamic random access memory)などを更に含みうるということは当業者には明白である。メモリコントローラ及びフラッシュメモリ装置は、データを保存するのに不揮発性メモリを利用するSSD(solid state driver/disk)を構成することができる。
【0129】
本発明の一態様は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現しうる。前記のプログラムを具現するコード及びコードセグメントは、当該分野のコンピュータプログラマによって容易に推論されうる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取れるデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光ディスクなどを含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークで連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして保存されて実行可能である。
【0130】
以上の説明は、本発明の一実施形態に過ぎず、当業者は、本発明の本質的特性から外れない範囲で変形された形態で具現することができる。したがって、本発明の範囲は、前述した実施形態に限定されず、特許請求の範囲に記載の内容と同等な範囲内にある多様な実施形態が含まれるように解析されなければならない。
【産業上の利用可能性】
【0131】
本発明は、サウンドエンハンスメント装置及び方法関連の技術分野に適用可能である。
【符号の説明】
【0132】
110:処理部
120:BSE信号生成部
130:利得制御部
140:後処理部
図1
図2
図3
図4
図5A
図5B
図6A
図6B
図7
図8A
図8B
図8C
図9