特許第6531418号(P6531418)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

<>
  • 特許6531418-信号処理装置 図000010
  • 特許6531418-信号処理装置 図000011
  • 特許6531418-信号処理装置 図000012
  • 特許6531418-信号処理装置 図000013
  • 特許6531418-信号処理装置 図000014
  • 特許6531418-信号処理装置 図000015
  • 特許6531418-信号処理装置 図000016
  • 特許6531418-信号処理装置 図000017
  • 特許6531418-信号処理装置 図000018
  • 特許6531418-信号処理装置 図000019
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6531418
(24)【登録日】2019年5月31日
(45)【発行日】2019年6月19日
(54)【発明の名称】信号処理装置
(51)【国際特許分類】
   G10K 15/04 20060101AFI20190610BHJP
   H03G 5/16 20060101ALI20190610BHJP
   H03G 7/00 20060101ALI20190610BHJP
   H03G 9/00 20060101ALI20190610BHJP
   H04R 3/00 20060101ALI20190610BHJP
   H04S 1/00 20060101ALI20190610BHJP
   G10K 15/08 20060101ALI20190610BHJP
   G10L 21/034 20130101ALI20190610BHJP
【FI】
   G10K15/04 302D
   H03G5/16
   H03G7/00
   H03G9/00
   H04R3/00 310
   H04S1/00 200
   G10K15/08
   G10L21/034
【請求項の数】9
【全頁数】17
(21)【出願番号】特願2015-26824(P2015-26824)
(22)【出願日】2015年2月13日
(65)【公開番号】特開2016-148818(P2016-148818A)
(43)【公開日】2016年8月18日
【審査請求日】2017年12月22日
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】100111763
【弁理士】
【氏名又は名称】松本 隆
(72)【発明者】
【氏名】浦谷 佳孝
【審査官】 堀 洋介
(56)【参考文献】
【文献】 特開平08−033091(JP,A)
【文献】 特開2011−113044(JP,A)
【文献】 特開2009−111519(JP,A)
【文献】 特開2015−025839(JP,A)
【文献】 特開平10−336795(JP,A)
【文献】 特開平06−335093(JP,A)
【文献】 特開平06−335094(JP,A)
【文献】 特開2013−167828(JP,A)
【文献】 国際公開第2008/111143(WO,A1)
【文献】 特開昭61−289576(JP,A)
【文献】 特開2012−119728(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/04
G10K 15/08
G10L 21/034
H03G 5/16
H03G 7/00
H03G 9/00
H04R 3/00
H04S 1/00
(57)【特許請求の範囲】
【請求項1】
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出する相互相関検出部と、
前記相互相関検出部において算出される前記相関値の増加に応じて、前記信号処理における前記メイン音響信号の増幅率を小さくするパラメータ算出部と、
前記メイン音響信号と前記1又は複数のサブ音響信号の少なくとも一方の可聴域に重み付けを施して前記相互相関検出部に与える重み付け部と、
を有することを特徴とする信号処理装置。
【請求項2】
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出する相互相関検出部と、
前記相互相関検出部において算出される前記相関値に基づいて、前記信号処理において前記メイン音響信号に混合する残響信号の混合比を制御するパラメータ算出部と、
を有することを特徴とする信号処理装置。
【請求項3】
前記メイン音響信号と前記1又は複数のサブ音響信号の少なくとも一方の可聴域に重み付けを施して前記相互相関検出部に与える重み付け部を有することを特徴とする請求項2に記載の信号処理装置。
【請求項4】
前記相互相関検出部は、前記メイン音響信号と、当該メイン音響信号と時間が異なる前記1又は複数のサブ音響信号との相関値を複数算出し、それら複数の相関値から1つの相関値を求めることを特徴とする請求項1〜3のいずれか1の請求項に記載の信号処理装置。
【請求項5】
前記メイン音響信号と前記1又は複数のサブ音響信号とに帯域分割を施す帯域分割部を有し、
前記相互相関検出部は、前記帯域分割部により分割された帯域の信号を用いて前記相関値を算出する
ことを特徴とする請求項1〜4のいずれか1の請求項に記載の信号処理装置。
【請求項6】
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出し、
前記相関値の増加に応じて、前記信号処理における前記メイン音響信号の増幅率を小さくし、
前記メイン音響信号と前記1又は複数のサブ音響信号の少なくとも一方の可聴域に重み付けを施して前記相関値の算出の対象とすることを特徴とする信号処理方法。
【請求項7】
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出し、
前記相関値に基づいて、前記信号処理において前記メイン音響信号に混合する残響信号の混合比を制御することを特徴とする信号処理方法。
【請求項8】
コンピュータを、
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出する相互相関検出部と、
前記相互相関検出部において算出される前記相関値の増加に応じて、前記信号処理における前記メイン音響信号の増幅率を小さくするパラメータ算出部と、
前記メイン音響信号と前記1又は複数のサブ音響信号の少なくとも一方の可聴域に重み付けを施して前記相互相関検出部に与える重み付け部と、
して機能させることを特徴とするプログラム。
【請求項9】
コンピュータを、
音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の間の相関値を算出する相互相関検出部と、
前記相互相関検出部において算出される前記相関値に基づいて、前記信号処理において前記メイン音響信号に混合する残響信号の混合比を制御するパラメータ算出部と、
して機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号処理装置に関する。
【背景技術】
【0002】
近年では、カーステレオや家庭用カラオケ装置などの様々な種類のオーディオシステムが一般に普及している。この種のオーディオシステムで再生される音の音量が小さく聴き取り難い場合、単純に音量を大きくするだけでは音が割れる、すなわち音に歪みが生じてしまうことがある。特に音の信号レベルの大小の差(すなわち、ダイナミックレンジ)が広い場合には、音の歪みの発生が顕著である。そのため、音量を大きくしても音の歪みが発生しないように、音量調整に先立ってダイナミックレンジを圧縮する信号処理技術が一般的となっている。このような技術は、例えば特許文献1および特許文献2や非特許文献1に開示されている。
【0003】
これらの技術では、音響信号を一定時間長ずつ区切って得られるフレーム毎にダイナミックレンジの圧縮が行われる。音量調整に先立ってこのようなダイナミックレンジの圧縮を行うことで、時間経過に伴いフレーム間でダイナミックレンジが緩やかに変化する場合は、聴感上自然な音を聞くことができる。しかし、フレーム間でダイナミックレンジが急変すると聴感上不自然な音に聞こえてしまう。そのため、例えば特許文献3に開示の信号処理技術では、音の信号レベルのダイナミックレンジが急変する場合には、音響信号をフレームに区切る時間間隔を短くすることで、聴感上自然な音を聞くことができるようにしている。
【0004】
さらに特許文献4には、車内でカーステレオから音が放音されている場合に、予め音響信号を記憶しておいたサイレン音を車の周囲で検出すると、カーステレオの音の音量を下げるという信号処理技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第3123052号公報
【特許文献2】特許第2966846号公報
【特許文献3】特開2002−232247号公報
【特許文献4】特開平11−136059号公報
【非特許文献】
【0006】
【非特許文献1】Dynamic Range Control оf Digital Audio Signals/G.W.Mcnally、インターネット<URL:http://www.cs.tut.fi/〜sgn14006/PDF/L05−dynamics.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1および特許文献2や非特許文献1に開示された信号処理技術をカラオケ装置に適用すると不具合が生じる場合がある。その理由は以下の通りである。カラオケ装置にはボーカル音を表す音響信号と当該音響信号と時間軸を共有する音響信号(すなわち、ボーカル音と同期再生される音を表す音響信号、例えば、伴奏音を表す音響信号)とが入力され、カラオケ装置はこれらの音響信号を加算して放音する。カラオケ装置に特許文献1等に開示の信号処理技術を適用し、ボーカル音と伴奏音の音響信号に対してダイナミックレンジの圧縮を別個独立に行うと、例えばボーカル音の音響信号の信号レベルがピークとなっているにも関わらず伴奏音の音響信号の信号レベルが下がり切らないなど、ボーカル音と伴奏音から構成される曲全体のバランスが崩れてしまう場合がある。
【0008】
また、特許文献3に開示の信号処理をカラオケ装置のボーカル音と伴奏音の音響信号に対して施すと、ボーカル音或いは伴奏音の音響信号の信号レベルのダイナミックレンジが急変しても、自然な聴感を維持することができる。しかし、カラオケ装置にこの信号処理技術を適用しても、ボーカル音と伴奏音から構成される曲全体のバランスを保ち続けることはできない。
【0009】
特許文献4の信号処理技術をカラオケ装置に適用しても、同様に、ボーカル音と伴奏音から構成される曲全体のバランスを保ち続けることはできない。そもそも特許文献4の信号処理技術は、音楽の聴感を考慮した技術ではない。なお、カラオケ装置から放音される音のボーカル音と伴奏音のバランスが崩れてしまうのは、ボーカル音と伴奏音の音響信号に対してダイナミックレンジを圧縮する信号処理を行う場合だけでなく、リバーブ効果を付与する信号処理を行う場合も同様である。
【0010】
本発明は以上に説明した課題に鑑みて為されたものであり、信号処理装置に入力される音響信号が複数ある場合に、この複数ある音響信号により放音される音全体のバランスを保ちつつ、音響信号のダイナミックレンジの圧縮や音響信号へのリバーブ効果の付与を行うことができるようにする技術を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記課題を解決するために本発明は、音響効果を与える信号処理の対象となるメイン音響信号と、1又は複数のサブ音響信号と、の中の複数の信号間の相関値を算出する相互相関検出部と、前記相互相関検出部において算出された前記相関値に応じて前記音響効果の強度を決定する信号処理部と、を有することを特徴とする信号処理装置を提供する。
【0012】
本発明によれば、メイン音響信号と1又は複数のサブ音響信号との中の複数の信号間の相関値に応じて音響効果の強度が決定され、メイン音響信号に信号処理が施される。このため、当該メイン音響信号と1又は複数のサブ音響信号にその後ダイナミックレンジの圧縮処理が施され加算されたとしても、放音される音におけるメイン音響信号と1又は複数のサブ音響信号のバランスが崩れることはない。
【0013】
より好ましい態様においては、前記複数の信号のうちの少なくとも1つの信号の可聴域に重み付けを施して前記相互相関検出部に与える重み付け部を有する。このような重み付けにより、メイン音響信号と1又は複数のサブ音響信号との相関値に対するメイン音響信号と1又は複数のサブ音響信号との少なくとも一方の可聴域成分の寄与が大きくなる。このため、可聴域におけるメイン音響信号と1又は複数のサブ音響信号との相関が高いにも関わらず、他の帯域における相関の低さに起因して両信号の相関が低くなっているような場合であっても、聴感上の両信号のバランスを崩すことなく、ダイナミックレンジの圧縮処理等を行うことが可能となる。
【0014】
より好ましい態様においては、前記相互相関検出部は、前記複数の信号の中の1つの信号と、当該信号と時間が異なる前記複数の信号の中の1又は複数の信号との相関値を複数算出し、それら複数の相関値から1つの相関値を求める。複数の信号の中の1つの信号と、当該複数の信号の中の1又は複数の信号との時間が異なっていても、各信号の相関値を求める際に、各信号の時間が異なることによる影響が緩和されるので、放音される音のメイン音響信号と1又は複数のサブ音響信号とのバランスが崩れることがない。
【0015】
より好ましい態様においては、前記メイン音響信号と前記1又は複数のサブ音響信号とのうちの少なくとも1つの信号に帯域分割を施す帯域分割部を有し、前記相互相関検出部は、前記帯域分割部により分割された帯域の信号のうちの少なくとも1つを用いて前記相関値を算出する。このような態様によれば、メイン音響信号に対して、サブ音響信号との相関に応じた信号処理を周波数帯域毎に細やかに施すことが可能になる。
【0016】
より好ましい態様においては、前記メイン音響信号は、前記1又は複数のサブ音響信号の少なくとも1つを含んだ合成信号である。このような態様によれば、メイン音響信号からサブ音響信号を分離する音源分離を施して上記信号処理を施す場合と類似の効果を得ることができる。
【図面の簡単な説明】
【0017】
図1】この発明の第1実施形態である信号処理装置101のブロック図である。
図2】同信号処理装置101のノーマイズ値xと乗数yの関係を示すグラフである。
図3】この発明の第2実施形態である信号処理装置102のブロック図である。
図4】同信号処理装置102の重み付け部50が参照するラウドネスカーブを示すグラフである。
図5】この発明の第3実施形態である信号処理装置103のブロック図である。
図6】この発明の第4実施形態である信号処理装置104のブロック図である。
図7】同実施形態におけるノーマライズ値xとリバーブのミックス値gmixの関係を示すグラフである。
図8】この発明の第6実施形態である信号処理装置106のブロック図である。
図9】この発明の第8実施形態である信号処理装置108のブロック図である。
図10】この発明の第10実施形態である信号処理装置110のブロック図である。
【発明を実施するための形態】
【0018】
以下、図面を参照しつつ本発明の実施の形態について説明する。
<第1実施形態>
図1は、この発明の第1実施形態である信号処理装置101のブロック図である。信号処理装置101は、DSP(Digital Signal Processor)であり、2種類の音響信号の入力を受ける。これら2種類の音響信号の各々は、何れも音の時間波形を表すデジタル信号である。本実施形態では、信号処理装置101に入力されるデジタル信号のうち、信号処理装置101が処理を施す信号をメイン音響信号と呼び、メイン音響信号と時間軸を共有するが信号処理装置101が処理を施さない信号をサブ音響信号と呼ぶ(以下、他の実施形態も同様に処理対象の信号をメイン音響信号と呼ぶ)。信号処理装置101は、メイン音響信号とサブ音響信号の相関を算出し、その算出結果を基にメイン音響信号の信号レベルの増幅処理を行い、出力信号として出力する。出力された出力信号に対してダイナミックレンジの圧縮や音量の増幅等の信号処理が施されるが、これらの信号処理は周知の信号処理技術を用いればよい。そのため本実施形態では、これらの信号処理の図示や説明を省略する。
【0019】
信号処理装置101は、時間周波数変換部10、相互相関検出部20、パラメータ算出部30および乗算部40を有する。時間周波数変換部10等は、信号処理装置101が実行するマイクロプログラムにより実現される機能の一部である。なお、信号処理装置101としてDSPを用いず、時間周波数変換部10等を電子回路で構成し、これらの電子回路を組み合わせて信号処理装置101を実現してもよい。
【0020】
時間周波数変換部10は、メイン音響信号とサブ音響信号の2種類のデジタル信号の入力を受け、各信号を一定時間長のフレームに区切って(例えばT個のフレームに区切って)、フレーム毎に時間周波数変換、すなわちフーリエ変換を行う。時間周波数変換部10は、フーリエ変換によって算出したフーリエ変換データを相互相関検出部20に出力する。
【0021】
相互相関検出部20は、時間周波数変換部10から入力されたメイン音響信号とサブ音響信号の相関関係を検出する。具体的には、相互相関検出部20は、次式(1)に示す相互相関関数を用い、メイン音響信号とサブ音響信号のフーリエ変換データに基づいて各信号の相関値Rmsを算出する。
【数1】
なお、Cmsは次式(2)を用いて算出される。
【数2】
mmとCssは、メイン音響信号とサブ音響信号の自己相関を各々示し、次式(3)〜(4)を用いて算出される。
【数3】
【数4】
nは各フレームを一意に示すフレーム番号であり、1≦n≦Tである。f(n)とf(n)は、メイン音響信号とサブ音響信号のn番目のフレームのフーリエ変換データである。相関値Rmsは−1≦Rms≦1を満たし、相関値Rmsが1の時にはメイン音響信号とサブ音響信号は完全相関であり、相関値Rmsが小さくなるほどメイン音響信号とサブ音響信号の相関は低下する。相互相関検出部20は、相関値Rmsをパラメータ算出部30に出力する。
【0022】
パラメータ算出部30は、相互相関検出部20から入力された相関値Rmsに基づいて、増幅率yを算出し、乗算部40に出力する。増幅率yとは、メイン音響信号の信号レベルに対して施す増幅処理の強さを示す値である。より詳細に説明すると、パラメータ算出部30は、まず次式(5)を用いてノーマライズ値xを算出する。
【数5】
相関値Rmsは、−1≦Rms≦1を満たすので、ノーマライズ値xは、0≦x≦1となる。図2は、ノーマライズ値xと増幅率yの関係を示すグラフである。図2のthは閾値である。ノーマライズ値xが閾値thよりも小さければ、パラメータ算出部30は増幅率yを0dBとし、ノーマライズ値xが閾値thよりも大きければ、パラメータ算出部30はノーマライズ値xが1に近づくにつれて増幅率yを線形に小さくする。図2では、ノーマライズ値xが1の時に増幅率yは−10dBとなるが、この増幅率yの値は−10dBに限られるものではなく、実験により好適な値を定めればよい。さらに、図2では、ノーマライズ値xが閾値thよりも大きくなると増幅率yが線形に小さくなる場合について例示されているが、ノーマライズ値xと増幅率yの関数関係は非線形でもよく、実験により好適な態様を取ればよい。
【0023】
乗算部40は、パラメータ算出部30から入力された増幅率yに基づいて、メイン音響信号の信号レベルを増幅し、増幅したメイン音響信号を出力信号として出力する。つまり乗算部40は、メイン音響信号に増幅処理を施す信号処理部として機能する。
【0024】
メイン音響信号とサブ音響信号が完全相関、すなわち相関値Rmsが1であると、式(5)よりノーマライズ値xは1となる。この場合、図2より増幅率yは−10dBとなり、信号処理装置101は、入力された時よりも信号レベルが低くなったメイン音響信号を出力信号として出力する。メイン音響信号とサブ音響信号が完全相関であるので、信号処理装置101から出力されたメイン音響信号にダイナミックレンジの圧縮等の信号処理が施され、サブ音響信号と加算されると、メイン音響信号の信号レベルの低下分はサブ音響信号により補完される。そのため、信号処理装置101からメイン音響信号が出力された後、メイン音響信号とサブ音響信号が加算され、最終的に放音されても、メイン音響信号とサブ音響信号のバランスが崩れることがない。
【0025】
メイン音響信号とサブ音響信号の相関が低くなる、すなわち相関値Rmsが−1に近づくと、式(5)よりノーマライズ値xは0に近くなる。この場合、図2より増幅率yは0であり、信号処理装置101は、入力されたメイン音響信号の信号レベルを増幅せずに出力信号として出力する。メイン音響信号とサブ音響信号の相関は低いので、メイン音響信号のピーク(或いはディップ)とサブ音響信号のピーク(或いはディップ)がぶつかり合うことはない。そのため、信号処理装置101から出力されたメイン音響信号にダイナミックレンジの圧縮等の信号処理が施され、サブ音響信号と加算され、最終的に放音されても、メイン音響信号とサブ音響信号のバランスが崩れることがない。
【0026】
このように信号処理装置101を用いることで、メイン音響信号とサブ音響信号を単純に加算することによって生じるメイン音響信号とサブ音響信号のバランスの崩れを防止することができる。
【0027】
例えば、信号処理装置101のカラオケ装置への適用を想定する。カラオケ装置にはボーカル音を表す音響信号と伴奏音を表す音響信号が入力される。以下では伴奏音の中でもドラム音について考え、中域(200〜1000Hz)に周波数が集中しているボーカル音の音響信号をメイン音響信号とし、高域(1000Hz以上)に周波数が集中しているドラム音の音響信号をサブ音響信号とする。従来技術では、ボーカル音とドラム音との相関を考慮しないので、ボーカル音の音響信号と伴奏音の音響信号の各々にダイナミックレンジの圧縮等の処理を施し加算すると、ボーカル音とドラム音の音響信号のピーク(或いはディップ)がぶつかり合い、最終的に放音される音においてボーカル音とドラム音のバランスが崩れてしまう場合があった。これに対して信号処理装置101を用いると、ボーカル音とドラム音の相関が高いと、ボーカル音の信号レベルを低下させた後にダイナミックレンジの圧縮が行われ、同じくダイナミックレンジの圧縮が行われたドラム音との加算が行われる。そのため、最終的に放音される音においてボーカル音とドラム音のバランスが崩れることがない。
【0028】
最終的に放音される音においてメイン音響信号とサブ音響信号のバランスが崩れないようにするために、メイン音響信号のピーク(或いはディップ)とサブ音響信号のピーク(或いはディップ)がぶつかり合う周波数帯域の信号をメイン音響信号から減算して、その後メイン音響信号にダイナミックレンジの圧縮等の信号処理を施してサブ音響信号と加算して放音するという方法が考えられる。しかし、この方法では、メイン音響信号とサブ音響信号がぶつかり合う周波数帯域の信号をメイン音響信号から減算するスペクトル減算の時に人工的ノイズが生じ、最終的に放音される音にノイズが発生することがある。信号処理装置101では、スペクトル減算を用いることがないため、人工的ノイズが生じ、最終的に放音される音にノイズが発生することがない。
【0029】
<第2実施形態>
図3は、この発明の第2実施形態である信号処理装置102のブロック図である。図3では、図1におけるものと同一の構成要素には同一の符号が付されている。図1図3を比較すれば明らかなように、信号処理装置102の信号処理装置101との違いは、時間周波数変換部10と相互相関検出部20との間に重み付け部50を設けた点である。以下では、第1実施形態との相違点である重み付け部50を中心に説明する。
【0030】
重み付け部50は、時間周波数変換部10から入力されたメイン音響信号とサブ音響信号のフーリエ変換データに対し、ラウドネスカーブに基づく重み付けを行う。具体的には、重み付け部50には、図4に示すラウドネスカーブの40phоnの曲線を表すデータが予め記憶されている。重み付け部50は、このデータの中でも人間が聴き取り易い周波数帯域(以下、可聴域)である周波数20Hz〜10kHzのデータを参照し、参照したデータの波形の最大音圧を1、最低音圧を0として正規化した重み付け乗算をメイン音響信号とサブ音響信号のフーリエ変換データに行う。この重み付け乗算により、可聴域に含まれる音のフーリエ変換データがより大きくなり、聴き取り難い周波数帯域に含まれる音のフーリエ変換データがより小さくなる。重み付け部50は、重み付け乗算を行ったメイン音響信号とサブ音響信号のフーリエ変換データを相互相関検出部20に出力する。
【0031】
相互相関検出部20は、重み付け部50から入力されたメイン音響信号とサブ音響信号のフーリエ変換データから式(1)〜(4)に基づいて相関値Rmsを算出し、その相関値Rmsをパラメータ算出部30に出力する。その後は第1実施形態と同様であるので説明を省略する。
【0032】
信号処理装置102では、重み付け部50においてラウドネスカーブに基づく重み付けが行われているため、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることがない上にさらに、相関値Rmsに対する可聴域の音の寄与が大きくなる。例えば、信号処理装置102をカラオケ装置へ適用し、メイン音響信号がボーカル音の音響信号であり、サブ音響信号がドラム音の音響信号であるとする。この場合、ボーカル音とドラム音の全周波数にわたる相関は低いものの、可聴域における両信号の相関が高い場合であっても、最終的に放音される音のボーカル音とドラム音のバランスが崩れることはない。もちろん、メイン音響信号或いはサブ音響信号のいずれか一方のみに重み付け部50を用いる態様であってもよい。
【0033】
<第3実施形態>
図5は、この発明の第3実施形態である信号処理装置103のブロック図である。図5では、図1におけるものと同一の構成要素には同一の符号が付されている。図5図1を比較すれば明らかなように、信号処理装置103と信号処理装置101の違いは、相互相関検出部20に換えて、相互相関検出部21と平均算出部90を設けた点である。以下では、第1実施形態との相違点である相互相関検出部21と平均算出部90を中心に説明する。
【0034】
相互相関検出部21は、次式(6)に基づいて、時間周波数変換部10から入力されたメイン音響信号とメイン音響信号以外の他の信号であるサブ音響信号とのフーリエ変換データから相関値Rms(τ)を算出する。なお相関値Rms(τ)は、メイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号との相関を表す値である。
【数6】
τは整数値であり、Cms(τ)は次式(7)を用いて算出される。
【数7】
nはフレーム番号であり、1≦n≦Tである。すなわち、f(n)はメイン音響信号のn番目のフレームのフーリエ変換データであり、f(n+τ)はサブ音響信号のn+τ番目のフレームのフーリエ変換データである。相関値Rms(τ)は−1≦Rms(τ)≦1を満たし、相関値Rms(τ)が1の時にはメイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号とは完全相関であり、相関値Rms(τ)が小さくなるほどメイン音響信号とサブ音響信号の相関は低下する。相互相関検出部21は、τ=0、1、2の場合の相関値Rms(τ)を平均算出部90に出力する。なお、時間周波数変換部10と相互相関検出部21の間に遅延器を設け、遅延器は、時間周波数変換部10からメイン音響信号とサブ音響信号のフーリエ変換データを入力され、相互相関検出部にメイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号とのフーリエ変換データを出力する態様であってもよい。この態様では、相互相関検出部21は、遅延器から入力されたメイン音響信号とサブ音響信号から相関値Rms(τ)を算出し平均算出部90に出力するだけで、サブ音響信号をメイン音響信号からτだけ遅れたようにする処理は行わない。
【0035】
平均算出部90は、相互相関検出部21から入力された相関値Rms(0)、Rms(1)、Rms(2)の相加平均を算出し、平均相関値Rmsとしてパラメータ算出部30に出力する。
【0036】
パラメータ算出部30は、平均算出部90から入力された平均相関値Rmsから第1実施形態と同様に増幅率yを算出する。その後は第1実施形態と同様であるので説明を省略する。
【0037】
本実施形態では、f(n)とf(n+τ)を用いて算出したRms(τ)の相加平均に応じた増幅率でメイン音響信号が増幅されるので、メイン音響信号とサブ音響信号の時間のずれを救うことができる。より詳細に説明すると、例えばカラオケ装置に第1実施形態の信号処理装置101を適用した場合、本来はボーカル音と伴奏音の相関は高いにも関わらず、伴奏音とボーカル音に時間のずれがあると、両者の相関は低いと判断されてしまう。そのため、最終的に放音される音のボーカル音と伴奏音のバランスが崩れてしまう恐れがある。一方、カラオケ装置に本実施形態の信号処理装置103を適用すると、伴奏音とボーカル音の時間のずれの影響が緩和され、最終的に放音される音のボーカル音と伴奏音のバランスが崩れることがない。つまり本実施形態によれば、メイン音響信号とサブ音響信号に時間のずれがあっても、そのずれによる影響を緩和しつつ、メイン音響信号に対する信号処理を行うことが可能となる。
【0038】
本実施形態では、τを0、1、2とした相関値Rms(0)、Rms(1)、Rms(2)の3つの値の相加平均から平均相関値Rmsを算出していたが、τは0、1、2に限られず、例えばτを0、3、6のように他の整数値にして平均相関値Rmsを算出してもよい。さらに、平均相関値Rmsの算出に用いる相関値Rms(τ)は3つの値に限られることはなく、相関値Rms(τ)の数を増やしてもよい。例えば、τを0、1、2、3とした相関値Rms(0)、Rms(1)、Rms(2)、Rms(3)の4つの値の相加平均から平均相関値Rmsを算出してもよい。その上、本実施形態では、平均算出部90が平均相関値Rmsの算出に相関値Rms(τ)の相加平均を用いたが、一番大きい値を平均相関値Rmsとしてもよい。例えば、τを0、1、2とした相関値Rms(0)、Rms(1)、Rms(2)の中でRms(1)の値が一番大きいと、Rms(1)を平均相関値Rmsとして算出してもよい。もちろん平均相関値Rmsの算出方法はこれら以外でもよく、例えば相乗平均や重み付け平均でもよい。信号処理装置103に求められる精度に応じて平均相関値Rmsの好適な算出方法を決定すればよい。
【0039】
<第4実施形態>
図6は、この発明の第4実施形態である信号処理装置104のブロック図である。図6では、図1におけるものと同一の構成要素には同一の符号が付されている。図6図1を比較すれば明らかなように、信号処理装置104と信号処理装置101との違いは、パラメータ算出部30と乗算部40に換えて、パラメータ算出部31と、乗算部41と、残響信号生成部60と、加算部70とを設けた点である。以下では、第1実施形態との相違点であるパラメータ算出部31と、乗算部41と、残響信号生成部60と、加算部70とを中心に説明する。乗算部41、残響信号生成部60および加算部70は、メイン音響信号にリバーブ効果を付与する信号処理部として機能する。
【0040】
第1実施形態では、信号処理装置101に入力されたメイン音響信号は時間周波数変換部10と乗算部40に入力されたが、本実施形態の信号処理装置104では、メイン音響信号は時間周波数変換部10、残響信号生成部60および加算部70に入力される。本実施形態では、残響信号生成部60に入力されるメイン音響信号をWet信号と呼び、加算部70に入力されるメイン音響信号をDry信号と呼ぶ。
【0041】
残響信号生成部60は、Wet信号に基づいて残響信号を生成して乗算部41に出力する。残響信号生成部60の残響信号生成アルゴリズムについては既存のものを用いればよい。Dry信号に残響信号を加算する、すなわちリバーブ効果を付与することにより、加算後の信号は聴感上奥行き感のある音を示す音響信号となる。
【0042】
パラメータ算出部31は、相互相関検出部20から入力された相関値Rmsから式(3)に基づいてノーマライズ値xを算出して乗算部41に出力する。0≦x≦1となるのは上記で説明した通りである。パラメータ算出部31は次式(8)に基づいて、ミックス値gmixを算出する。なおミックス値gmixとは、残響信号の信号レベルに対して施す増幅処理の強さを示す値であり、Dry信号に対する残響信号の混合比に対応する。
【数8】
は閾値であり、図7は、式(8)をグラフ化した図である。ノーマライズ値xがxよりも小さいとミックス値gmixはax+bとなり、ノーマライズ値が増加するに連れてミックス値gmixは線形に大きくなる。ノーマライズ値xがx以上であるとミックス値gmixは一定値c(c=ax+b)となる。なお、ミックス値gmixがノーマライズ値が増加するにつれて非線形に大きくなってもよく、実験により好適な態様を取ればよい。
【0043】
乗算部41は、残響信号生成部60から残響信号の入力を受け、さらにパラメータ算出部31からミックス値gmixの入力を受ける。乗算部41は、ミックス値gmixに基づいて残響信号の信号レベルを増幅し、加算部70に出力する。
【0044】
加算部70は、Dry信号と乗算部41による増幅を受けた残響信号とを加算して出力信号として出力する。
【0045】
メイン音響信号とサブ音響信号の相関が高い場合、メイン音響信号に付与するリバーブ効果を強くし過ぎると残響音が目立ってしまい、メイン音響信号とサブ音響信号により最終的に放音される音のバランスが崩れてしまう。信号処理装置104であれば、閾値xよりもノーマライズ値xが大きい場合はミックス値gmixが一定値であるcとなる。このcの値を残響音が目立たない程度の値に実験等により定めておけば、メイン音響信号とサブ音響信号の相関が高くても、残響音が目立つほどのリバーブ効果の付与がメイン音響信号に施されることなく、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはない。
【0046】
<第5実施形態>
本実施形態の信号処理装置105は、信号処理装置103と信号処理装置104を組み合わせたものである。詳しく説明すると、信号処理装置105は、信号処理装置104に対して、信号処理装置104の相互相関検出部20の換わりに信号処理装置103の相互相関検出部21と平均算出部90を設けたものに相当する。
【0047】
信号処理装置105では、相互相関検出部21と平均算出部90が、τ=0、1、2の場合の相関値Rms(τ)の相加平均から平均相関値Rmsを算出して、リバーブ効果の付与の強弱を決定している。そのため、信号処理装置105を用いると、メイン音響信号とメイン音響信号以外の他の信号であるサブ音響信号とに時間のずれがあっても、最終的に放音される音にはメイン音響信号とサブ音響信号のまじりの良いリバーブ効果が付与され、リバーブ効果によってメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはない。
【0048】
本実施形態においても第3実施形態と同様に、τは0、1、2に限られるものではなく、また平均相関値Rmsを算出するのに用いるτの数は3つに限られない。さらに、複数の相関値Rms(τ)から平均相関値Rmsを算出する方法として相加平均を用いるだけでなく、他の算出方法を用いてもよい。要は、最終的に放音される音にメイン音響信号とサブ音響信号のまじりの良いリバーブ効果を付与できれば平均相関値Rmsの算出方法は何でもよく、実験により好適な算出方法を決定すればよい。
【0049】
<第6実施形態>
図8は、この発明の第6実施形態である信号処理装置106のブロック図である。図8では、図1におけるものと同一の構成要素には同一の符号が付されている。図8図1を比較すれば明らかなように、信号処理装置106と信号処理装置101との違いは、時間周波数変換部10の前段にハイパスフィルタ(以下、HPF)81、バンドパスフィルタ(以下、BPF)82、ローパスフィルタ(以下、LPF)83を設けた点と、乗算部40の後段に加算部71を設けた点である。以下では第1実施形態との相違点である、HPF81、BPF82、LPF83と加算部71を中心に説明する。
【0050】
HPF81は入力された信号の周波数fHL以上の高周波数周波数帯域のみを出力するフィルタであり、BPF82は周波数fBLから周波数fBHの中間周波数帯域のみを出力するフィルタであり(周波数fBL<周波数fBH)、LPF83は周波数fLH以下の低周波数帯域のみを出力するフィルタである。本実施形態では、周波数fHL=周波数fBHであり、周波数fBL=周波数fLHであるが、各周波数は等しくなくてもよい。各周波数の値と各周波数間の関係は、実験により適宜決定すればよい。HPF81、BPF82、LPF83は、メイン音響信号やサブ音響信号に帯域分割処理を施す帯域分割部として機能する。
【0051】
メイン音響信号とサブ音響信号は、信号処理装置106に入力されると、まずHPF81、BPF82、LPF83に入力される。メイン音響信号については、HPF81、BPF82、LPF83が、各フィルタに対応した周波数帯域のみの信号を時間周波数変換部10と乗算部40に出力する。サブ音響信号については、HPF81、BPF82、LPF83が、各フィルタに対応した周波数帯域のみの信号を時間周波数変換部10に出力する。
【0052】
HPF81、BPF82、LPF83がメイン音響信号とサブ音響信号を時間周波数変換部10に出力し、メイン音響信号を乗算部40に出力してからは、高周波帯域、中間周波数帯域、低周波数帯域ごとに第1実施形態と同様の処理が行わるため説明を省略する。乗算部40は、高周波数帯域、中間周波数帯域、低周波数帯域の周波数帯域毎に信号レベルを増幅したメイン音響信号を加算部71に出力する。
【0053】
加算部71は、周波数帯域毎に信号レベルを増幅したメイン音響信号を加算して出力信号として出力する。
【0054】
このように信号処理装置106は、HPF81、BPF82、LPF83を用いて、メイン音響信号およびサブ音響信号に帯域分割処理を施し、周波数帯域毎にメイン音響信号とサブ音響信号の相関値Rmsを算出し、相関値Rmsに基づいて周波数帯域毎にメイン音響信号の信号レベルを増幅して最後に加算する。信号処理装置106によれば、周波数帯域毎のサブ音響信号との相関に応じてメイン音響信号の増幅制御を周波数帯域毎に細やかに行うことができる。
【0055】
<第7実施形態>
本実施形態の信号処理装置107と信号処理装置101との違いは、時間周波数変換部10の前段にHPF81とBPF82を設けた点である。信号処理装置107では、メイン音響信号はBPF82を介して時間周波数変換部10に入力されるとともに乗算部40に入力され、サブ音響信号はHPF81を介して時間周波数変換部10に入力される。
【0056】
本実施形態では、HPF81やBPF82により帯域分割された音響信号に対してフーリエ変換や相関値Rmsの算出が行われるため、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはなく、さらに信号処理装置106に比べて装置の処理負荷を減らすことができる。
【0057】
信号処理装置107では、メイン音響信号に対してBPF82を用い、サブ音響信号に対してHPF81を用いた。しかし、信号処理装置107にHPF81、BPF82、LPF83を設けておき、信号処理装置107に入力されるメイン音響信号とサブ音響信号の集中している周波数帯域に応じて、HPF81、BPF82、LPF83の中から異なるフィルタを選択してもよい。もちろん、メイン音響信号或いはサブ音響信号のいずれか一方のみに対して、HPF81、BPF82、LPF83のいずれかを用いる態様であってもよい。
【0058】
<第8実施形態>
図9は、この発明の第8実施形態である信号処理装置108のブロック図である。信号処理装置108は例えばカラオケ装置に適用される。図9では、図1におけるものと同一の構成要素には同一の符号が付されている。図9図1を比較すれば明らかなように、信号処理装置108と信号処理装置101との違いは、時間周波数変換部10にサブ音響信号としてボーカル音の音響信号と伴奏音の音響信号が入力され、乗算部40にメイン音響信号としてボーカル音と伴奏音の音響信号の合成信号(以下、合成信号)が入力される点である。
【0059】
信号処理装置108では、ボーカル音と伴奏音の音響信号の相関値Rmsに基づいて、パラメータ算出部30が増幅率yを算出する。乗算部40は、この増幅率yに基づいて、合成信号に増幅処理を施す。
【0060】
本実施形態のように、ボーカル音の音響信号に対してではなく、合成信号に対して直接増幅処理を施すことで、合成信号からボーカル音の音響信号を音源分離して増幅する場合と類似の効果を期待できる。すなわち、本実施形態の出力信号は、合成信号をボーカル音の音響信号と伴奏音の音響信号に音源分離して、分離したボーカル音の音響信号と伴奏音の音響信号の相関値Rmsを算出して、ボーカル音の音響信号に増幅を施して出力する出力信号に類似する。音源分離を用いた方法では、音源分離の際に人工的なノイズが発生することがあり、音源分離後の音質が問題となることが多い。本実施形態では、信号処理装置108に入力されるボーカル音の音響信号と伴奏音の音響信号が合成信号に音源分離を施すことにより生成されたものであったとしても、増幅処理の対象となる合成信号は音源分離により生成されたものではないため、ボーカル音と伴奏音のバランスが崩れることがなく、音源分離の性能に出力信号の音質が依存しづらくなるという利点が生じる。
【0061】
信号処理装置108では、合成信号はサブ音響信号として入力された音響信号のみから構成されていたが、この態様に限られるわけではなく、合成信号がサブ音響信号として入力された音響信号の中の少なくとも1つの音響信号と他の音響信号とから構成された態様であってもよい。この態様では、例えば、サブ音響信号がボーカル音の音響信号とドラム音の音響信号であり、メイン音響信号がドラム音とギター音の音響信号の合成信号である。さらに、サブ音響信号として3種類以上の音響信号が入力される場合には、相互相関検出部20が音響信号の中から相関値Rmsを算出する音響信号を選択する態様であってもよい。この態様では、例えばサブ音響信号としてボーカル音、ドラム音およびギター音の音響信号が各々入力されると、相互相関検出部20は、入力された音響信号からボーカル音の音響信号とドラム音の音響信号を選択し、両信号の相関値Rmsを算出する。さらに、この選択をユーザの指示に応じて切り換えるようにしてもよい。この場合のメイン音響信号は、ボーカル音とドラム音の音響信号の合成信号であってもよいし、ドラム音とギター音の音響信号の合成信号であってもよい。もちろん、メイン音響信号がボーカル音、ドラム音およびギター音の音響信号の合成信号であってもよい。
【0062】
<第9実施形態>
本実施形態の信号処理装置109も例えばカラオケ装置に適用される。信号処理装置109と信号処理装置101との違いは、メイン音響信号としてボーカル音と伴奏音の合成音の時間波形を表す合成信号が時間周波数変換部10と乗算部40に入力され、サブ音響信号として伴奏音の音響信号が時間周波数変換部10に入力されることである。
【0063】
信号制御装置109では、伴奏音の音響信号と合成信号との相関値Rmsに基づいて増幅率yが算出され、その増幅率yに基づいて、合成信号に増幅処理が施されている。
【0064】
本実施形態では、ボーカル音の音響信号の入力がなくても伴奏音の音響信号と合成信号との入力があれば、ボーカル音と伴奏音のバランスを崩すことなく、合成信号に増幅処理を施すことができる。
【0065】
<第10実施形態>
図10は、この第10実施形態である信号処理装置110のブロック図である。信号処理装置110も例えばカラオケ装置に適用される。図10では、図1におけるものと同一の構成要素には同一の符号が付されている。図10図1を比較すれば明らかなように、信号処理装置110と信号処理装置101との違いは、時間周波数変換部10に複数種類のサブ音響信号が入力される点と平均算出部90が設けられた点である。本実施形態では、時間周波数変換部10に入力されたサブ音響信号の種類はN種類(N≧2)である。N種類のサブ音響信号の具体例としては、ドラム音、ギター音、キーボード音といった伴奏楽器毎の伴奏音の音響信号が挙げられる。
【0066】
時間周波数変換部10は、メイン音響信号とN種類のサブ音響信号のフーリエ変換データを相互相関検出部20に出力する。相互相関検出部20は、時間周波数変換部10から入力されたメイン音響信号とN種類のサブ音響信号との各々の相関を検出する。より詳細に説明すると、相互相関検出部20は、式(1)と式(2)に基づいて、メイン音響信号とサブ音響信号1の相関値Rms1を算出し、メイン音響信号とサブ音響信号2の相関値Rms2を算出する。以下同様に、相互相関検出部20は、メイン音響信号とサブ音響信号Nの相関値RmsNまで算出する。相互相関検出部20は算出した相関値Rms1〜RmsNを平均算出部90に出力する。平均算出部90は、入力された相関値Rms1〜RmsNの相加平均を平均相関値Rmsとして算出する。平均算出部90は、算出した平均相関値Rmsをパラメータ算出部30に出力し、乗算部40は、パラメータ算出部30により算出された増幅率yに基づいてメイン音響信号に増幅処理を施し、出力信号として出力する。
【0067】
信号処理装置110では、全てのサブ音響信号とメイン音響信号との平均相関値Rmsが算出され、この平均相関値Rmsに応じた増幅率でメイン音響信号の増幅が行われる。このため、最終的に放音される音におけるメイン音響信号と複数のサブ音響信号のバランスが崩れることはない。
【0068】
<変形例>
(1)上記実施形態を各々組み合わせた態様をとってもよい。例えば、第7実施形態と第10実施形態を組み合わせても良い。この場合、入力されるサブ音響信号が複数あっても、最終的に放音される音におけるメイン音響信号と複数のサブ音響信号により放音される各音のバランスが崩れることなく、メイン音響信号に増幅処理を施すことができる。さらにこの場合、サブ音響信号が1つしかない、すなわち第1実施形態の装置の処理負荷にサブ音響信号の数を乗じた処理負荷よりも処理負荷を減らすことができる。
【0069】
(2)上記各実施形態では、メイン音響信号に増幅処理或いはリバーブ効果を付与する処理を施していたが、メイン音響信号に施す信号処理はこれらの処理に限られることはなく、他の音響効果を与える処理をメイン音響信号に施してもよい。
【0070】
(3)上記各実施形態では、時間周波数変換部10が、入力を受けたメイン音響信号とサブ音響信号の2種類のデジタル信号を一定時間長のフレームに区切ってフーリエ変換を行い、フーリエ変換によって算出したフーリエ変換データを相互相関検出部20に出力していたが、この時間周波数変換部10が存在しない態様をとってもよい。この態様では、入力されたメイン音響信号とサブ音響信号が相互相関検出部20に直接入力され、相互相関検出部20は、式(1)或いは式(6)を用い、メイン音響信号とサブ音響信号に基づいて相関値Rms或いは相関値Rms(τ)を算出する。この場合、τは音響信号を構成する各サンプルを示すインデックスである。この態様によっても、メイン音響信号とサブ音響信号により放音される音全体のバランスを保ちつつ、音響信号のダイナミックレンジの圧縮や音響信号へのリバーブ効果の付与を行うことができる。
【0071】
(4)上記各実施形態では、メイン音響信号とサブ音響信号の両者がデジタル信号であったが、一方(或いは両方)がアナログ信号であってもよい。各実施形態の信号処理装置にアナログ信号が入力される場合には、信号処理装置の前段にA/D変換器を設けておけばよい。
【0072】
(5)上記各実施形態では、本発明の信号処理装置特有の機能をプログラム(DSPのマイクロプログラム)により実現したが、このプログラム単体で提供してもよい。例えば、カラオケ装置の既存のプログラムに上記各実施形態のいずれかのプログラムを追加することで、最終的に放音される音のボーカル音と伴奏音のバランスを崩すことなく、ボーカル音の音響信号にダイナミックレンジの圧縮やリバーブ効果の付与を行うことができる。
【0073】
(6)上記各実施形態による増幅処理或いはリバーブ効果の付与をASP(アプリケーションサービスプロバイダ)形式の通信サービスで提供してもよい。例えば、第1実施形態の増幅処理をASP形式で提供する場合は、信号処理装置101を通信回線に接続しておく。そして、信号処理装置101にメイン音響信号とサブ音響信号が通信回線経由で入力され、信号処理装置101は、メイン音響信号とサブ音響信号の相関に基づいて増幅処理を施したメイン音響信号を出力信号として出力し、その出力信号を通信回線経由で返信する。
【符号の説明】
【0074】
101,102,103,104,105,106,107,108,109,110……信号処理装置、10……時間周波数変換部、20,21……相互相関検出部、30,31……パラメータ算出部、40,41……乗算部、50……重み付け部、60……残響信号生成部、70,71……加算部、81……HPF、82……BPF、83……LPF、90……平均算出部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10