(58)【調査した分野】(Int.Cl.,DB名)
前記相互相関検出部は、前記メイン音響信号と、当該メイン音響信号と時間が異なる前記1又は複数のサブ音響信号との相関値を複数算出し、それら複数の相関値から1つの相関値を求めることを特徴とする請求項1〜3のいずれか1の請求項に記載の信号処理装置。
【発明を実施するための形態】
【0018】
以下、図面を参照しつつ本発明の実施の形態について説明する。
<第1実施形態>
図1は、この発明の第1実施形態である信号処理装置101のブロック図である。信号処理装置101は、DSP(Digital Signal Processor)であり、2種類の音響信号の入力を受ける。これら2種類の音響信号の各々は、何れも音の時間波形を表すデジタル信号である。本実施形態では、信号処理装置101に入力されるデジタル信号のうち、信号処理装置101が処理を施す信号をメイン音響信号と呼び、メイン音響信号と時間軸を共有するが信号処理装置101が処理を施さない信号をサブ音響信号と呼ぶ(以下、他の実施形態も同様に処理対象の信号をメイン音響信号と呼ぶ)。信号処理装置101は、メイン音響信号とサブ音響信号の相関を算出し、その算出結果を基にメイン音響信号の信号レベルの増幅処理を行い、出力信号として出力する。出力された出力信号に対してダイナミックレンジの圧縮や音量の増幅等の信号処理が施されるが、これらの信号処理は周知の信号処理技術を用いればよい。そのため本実施形態では、これらの信号処理の図示や説明を省略する。
【0019】
信号処理装置101は、時間周波数変換部10、相互相関検出部20、パラメータ算出部30および乗算部40を有する。時間周波数変換部10等は、信号処理装置101が実行するマイクロプログラムにより実現される機能の一部である。なお、信号処理装置101としてDSPを用いず、時間周波数変換部10等を電子回路で構成し、これらの電子回路を組み合わせて信号処理装置101を実現してもよい。
【0020】
時間周波数変換部10は、メイン音響信号とサブ音響信号の2種類のデジタル信号の入力を受け、各信号を一定時間長のフレームに区切って(例えばT個のフレームに区切って)、フレーム毎に時間周波数変換、すなわちフーリエ変換を行う。時間周波数変換部10は、フーリエ変換によって算出したフーリエ変換データを相互相関検出部20に出力する。
【0021】
相互相関検出部20は、時間周波数変換部10から入力されたメイン音響信号とサブ音響信号の相関関係を検出する。具体的には、相互相関検出部20は、次式(1)に示す相互相関関数を用い、メイン音響信号とサブ音響信号のフーリエ変換データに基づいて各信号の相関値R
msを算出する。
【数1】
なお、C
msは次式(2)を用いて算出される。
【数2】
C
mmとC
ssは、メイン音響信号とサブ音響信号の自己相関を各々示し、次式(3)〜(4)を用いて算出される。
【数3】
【数4】
nは各フレームを一意に示すフレーム番号であり、1≦n≦Tである。f
m(n)とf
s(n)は、メイン音響信号とサブ音響信号のn番目のフレームのフーリエ変換データである。相関値R
msは−1≦R
ms≦1を満たし、相関値R
msが1の時にはメイン音響信号とサブ音響信号は完全相関であり、相関値R
msが小さくなるほどメイン音響信号とサブ音響信号の相関は低下する。相互相関検出部20は、相関値R
msをパラメータ算出部30に出力する。
【0022】
パラメータ算出部30は、相互相関検出部20から入力された相関値R
msに基づいて、増幅率yを算出し、乗算部40に出力する。増幅率yとは、メイン音響信号の信号レベルに対して施す増幅処理の強さを示す値である。より詳細に説明すると、パラメータ算出部30は、まず次式(5)を用いてノーマライズ値xを算出する。
【数5】
相関値R
msは、−1≦R
ms≦1を満たすので、ノーマライズ値xは、0≦x≦1となる。
図2は、ノーマライズ値xと増幅率yの関係を示すグラフである。
図2のthは閾値である。ノーマライズ値xが閾値thよりも小さければ、パラメータ算出部30は増幅率yを0dBとし、ノーマライズ値xが閾値thよりも大きければ、パラメータ算出部30はノーマライズ値xが1に近づくにつれて増幅率yを線形に小さくする。
図2では、ノーマライズ値xが1の時に増幅率yは−10dBとなるが、この増幅率yの値は−10dBに限られるものではなく、実験により好適な値を定めればよい。さらに、
図2では、ノーマライズ値xが閾値thよりも大きくなると増幅率yが線形に小さくなる場合について例示されているが、ノーマライズ値xと増幅率yの関数関係は非線形でもよく、実験により好適な態様を取ればよい。
【0023】
乗算部40は、パラメータ算出部30から入力された増幅率yに基づいて、メイン音響信号の信号レベルを増幅し、増幅したメイン音響信号を出力信号として出力する。つまり乗算部40は、メイン音響信号に増幅処理を施す信号処理部として機能する。
【0024】
メイン音響信号とサブ音響信号が完全相関、すなわち相関値R
msが1であると、式(5)よりノーマライズ値xは1となる。この場合、
図2より増幅率yは−10dBとなり、信号処理装置101は、入力された時よりも信号レベルが低くなったメイン音響信号を出力信号として出力する。メイン音響信号とサブ音響信号が完全相関であるので、信号処理装置101から出力されたメイン音響信号にダイナミックレンジの圧縮等の信号処理が施され、サブ音響信号と加算されると、メイン音響信号の信号レベルの低下分はサブ音響信号により補完される。そのため、信号処理装置101からメイン音響信号が出力された後、メイン音響信号とサブ音響信号が加算され、最終的に放音されても、メイン音響信号とサブ音響信号のバランスが崩れることがない。
【0025】
メイン音響信号とサブ音響信号の相関が低くなる、すなわち相関値R
msが−1に近づくと、式(5)よりノーマライズ値xは0に近くなる。この場合、
図2より増幅率yは0であり、信号処理装置101は、入力されたメイン音響信号の信号レベルを増幅せずに出力信号として出力する。メイン音響信号とサブ音響信号の相関は低いので、メイン音響信号のピーク(或いはディップ)とサブ音響信号のピーク(或いはディップ)がぶつかり合うことはない。そのため、信号処理装置101から出力されたメイン音響信号にダイナミックレンジの圧縮等の信号処理が施され、サブ音響信号と加算され、最終的に放音されても、メイン音響信号とサブ音響信号のバランスが崩れることがない。
【0026】
このように信号処理装置101を用いることで、メイン音響信号とサブ音響信号を単純に加算することによって生じるメイン音響信号とサブ音響信号のバランスの崩れを防止することができる。
【0027】
例えば、信号処理装置101のカラオケ装置への適用を想定する。カラオケ装置にはボーカル音を表す音響信号と伴奏音を表す音響信号が入力される。以下では伴奏音の中でもドラム音について考え、中域(200〜1000Hz)に周波数が集中しているボーカル音の音響信号をメイン音響信号とし、高域(1000Hz以上)に周波数が集中しているドラム音の音響信号をサブ音響信号とする。従来技術では、ボーカル音とドラム音との相関を考慮しないので、ボーカル音の音響信号と伴奏音の音響信号の各々にダイナミックレンジの圧縮等の処理を施し加算すると、ボーカル音とドラム音の音響信号のピーク(或いはディップ)がぶつかり合い、最終的に放音される音においてボーカル音とドラム音のバランスが崩れてしまう場合があった。これに対して信号処理装置101を用いると、ボーカル音とドラム音の相関が高いと、ボーカル音の信号レベルを低下させた後にダイナミックレンジの圧縮が行われ、同じくダイナミックレンジの圧縮が行われたドラム音との加算が行われる。そのため、最終的に放音される音においてボーカル音とドラム音のバランスが崩れることがない。
【0028】
最終的に放音される音においてメイン音響信号とサブ音響信号のバランスが崩れないようにするために、メイン音響信号のピーク(或いはディップ)とサブ音響信号のピーク(或いはディップ)がぶつかり合う周波数帯域の信号をメイン音響信号から減算して、その後メイン音響信号にダイナミックレンジの圧縮等の信号処理を施してサブ音響信号と加算して放音するという方法が考えられる。しかし、この方法では、メイン音響信号とサブ音響信号がぶつかり合う周波数帯域の信号をメイン音響信号から減算するスペクトル減算の時に人工的ノイズが生じ、最終的に放音される音にノイズが発生することがある。信号処理装置101では、スペクトル減算を用いることがないため、人工的ノイズが生じ、最終的に放音される音にノイズが発生することがない。
【0029】
<第2実施形態>
図3は、この発明の第2実施形態である信号処理装置102のブロック図である。
図3では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図1と
図3を比較すれば明らかなように、信号処理装置102の信号処理装置101との違いは、時間周波数変換部10と相互相関検出部20との間に重み付け部50を設けた点である。以下では、第1実施形態との相違点である重み付け部50を中心に説明する。
【0030】
重み付け部50は、時間周波数変換部10から入力されたメイン音響信号とサブ音響信号のフーリエ変換データに対し、ラウドネスカーブに基づく重み付けを行う。具体的には、重み付け部50には、
図4に示すラウドネスカーブの40phоnの曲線を表すデータが予め記憶されている。重み付け部50は、このデータの中でも人間が聴き取り易い周波数帯域(以下、可聴域)である周波数20Hz〜10kHzのデータを参照し、参照したデータの波形の最大音圧を1、最低音圧を0として正規化した重み付け乗算をメイン音響信号とサブ音響信号のフーリエ変換データに行う。この重み付け乗算により、可聴域に含まれる音のフーリエ変換データがより大きくなり、聴き取り難い周波数帯域に含まれる音のフーリエ変換データがより小さくなる。重み付け部50は、重み付け乗算を行ったメイン音響信号とサブ音響信号のフーリエ変換データを相互相関検出部20に出力する。
【0031】
相互相関検出部20は、重み付け部50から入力されたメイン音響信号とサブ音響信号のフーリエ変換データから式(1)〜(4)に基づいて相関値R
msを算出し、その相関値R
msをパラメータ算出部30に出力する。その後は第1実施形態と同様であるので説明を省略する。
【0032】
信号処理装置102では、重み付け部50においてラウドネスカーブに基づく重み付けが行われているため、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることがない上にさらに、相関値R
msに対する可聴域の音の寄与が大きくなる。例えば、信号処理装置102をカラオケ装置へ適用し、メイン音響信号がボーカル音の音響信号であり、サブ音響信号がドラム音の音響信号であるとする。この場合、ボーカル音とドラム音の全周波数にわたる相関は低いものの、可聴域における両信号の相関が高い場合であっても、最終的に放音される音のボーカル音とドラム音のバランスが崩れることはない。もちろん、メイン音響信号或いはサブ音響信号のいずれか一方のみに重み付け部50を用いる態様であってもよい。
【0033】
<第3実施形態>
図5は、この発明の第3実施形態である信号処理装置103のブロック図である。
図5では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図5と
図1を比較すれば明らかなように、信号処理装置103と信号処理装置101の違いは、相互相関検出部20に換えて、相互相関検出部21と平均算出部90を設けた点である。以下では、第1実施形態との相違点である相互相関検出部21と平均算出部90を中心に説明する。
【0034】
相互相関検出部21は、次式(6)に基づいて、時間周波数変換部10から入力されたメイン音響信号とメイン音響信号以外の他の信号であるサブ音響信号とのフーリエ変換データから相関値R
ms(τ)を算出する。なお相関値R
ms(τ)は、メイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号との相関を表す値である。
【数6】
τは整数値であり、C
ms(τ)は次式(7)を用いて算出される。
【数7】
nはフレーム番号であり、1≦n≦Tである。すなわち、f
m(n)はメイン音響信号のn番目のフレームのフーリエ変換データであり、f
s(n+τ)はサブ音響信号のn+τ番目のフレームのフーリエ変換データである。相関値R
ms(τ)は−1≦R
ms(τ)≦1を満たし、相関値R
ms(τ)が1の時にはメイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号とは完全相関であり、相関値R
ms(τ)が小さくなるほどメイン音響信号とサブ音響信号の相関は低下する。相互相関検出部21は、τ=0、1、2の場合の相関値R
ms(τ)を平均算出部90に出力する。なお、時間周波数変換部10と相互相関検出部21の間に遅延器を設け、遅延器は、時間周波数変換部10からメイン音響信号とサブ音響信号のフーリエ変換データを入力され、相互相関検出部にメイン音響信号とメイン音響信号からτだけ遅れたサブ音響信号とのフーリエ変換データを出力する態様であってもよい。この態様では、相互相関検出部21は、遅延器から入力されたメイン音響信号とサブ音響信号から相関値R
ms(τ)を算出し平均算出部90に出力するだけで、サブ音響信号をメイン音響信号からτだけ遅れたようにする処理は行わない。
【0035】
平均算出部90は、相互相関検出部21から入力された相関値R
ms(0)、R
ms(1)、R
ms(2)の相加平均を算出し、平均相関値R
msとしてパラメータ算出部30に出力する。
【0036】
パラメータ算出部30は、平均算出部90から入力された平均相関値R
msから第1実施形態と同様に増幅率yを算出する。その後は第1実施形態と同様であるので説明を省略する。
【0037】
本実施形態では、f
m(n)とf
s(n+τ)を用いて算出したR
ms(τ)の相加平均に応じた増幅率でメイン音響信号が増幅されるので、メイン音響信号とサブ音響信号の時間のずれを救うことができる。より詳細に説明すると、例えばカラオケ装置に第1実施形態の信号処理装置101を適用した場合、本来はボーカル音と伴奏音の相関は高いにも関わらず、伴奏音とボーカル音に時間のずれがあると、両者の相関は低いと判断されてしまう。そのため、最終的に放音される音のボーカル音と伴奏音のバランスが崩れてしまう恐れがある。一方、カラオケ装置に本実施形態の信号処理装置103を適用すると、伴奏音とボーカル音の時間のずれの影響が緩和され、最終的に放音される音のボーカル音と伴奏音のバランスが崩れることがない。つまり本実施形態によれば、メイン音響信号とサブ音響信号に時間のずれがあっても、そのずれによる影響を緩和しつつ、メイン音響信号に対する信号処理を行うことが可能となる。
【0038】
本実施形態では、τを0、1、2とした相関値R
ms(0)、R
ms(1)、R
ms(2)の3つの値の相加平均から平均相関値R
msを算出していたが、τは0、1、2に限られず、例えばτを0、3、6のように他の整数値にして平均相関値R
msを算出してもよい。さらに、平均相関値R
msの算出に用いる相関値R
ms(τ)は3つの値に限られることはなく、相関値R
ms(τ)の数を増やしてもよい。例えば、τを0、1、2、3とした相関値R
ms(0)、R
ms(1)、R
ms(2)、R
ms(3)の4つの値の相加平均から平均相関値R
msを算出してもよい。その上、本実施形態では、平均算出部90が平均相関値R
msの算出に相関値R
ms(τ)の相加平均を用いたが、一番大きい値を平均相関値R
msとしてもよい。例えば、τを0、1、2とした相関値R
ms(0)、R
ms(1)、R
ms(2)の中でR
ms(1)の値が一番大きいと、R
ms(1)を平均相関値R
msとして算出してもよい。もちろん平均相関値R
msの算出方法はこれら以外でもよく、例えば相乗平均や重み付け平均でもよい。信号処理装置103に求められる精度に応じて平均相関値R
msの好適な算出方法を決定すればよい。
【0039】
<第4実施形態>
図6は、この発明の第4実施形態である信号処理装置104のブロック図である。
図6では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図6と
図1を比較すれば明らかなように、信号処理装置104と信号処理装置101との違いは、パラメータ算出部30と乗算部40に換えて、パラメータ算出部31と、乗算部41と、残響信号生成部60と、加算部70とを設けた点である。以下では、第1実施形態との相違点であるパラメータ算出部31と、乗算部41と、残響信号生成部60と、加算部70とを中心に説明する。乗算部41、残響信号生成部60および加算部70は、メイン音響信号にリバーブ効果を付与する信号処理部として機能する。
【0040】
第1実施形態では、信号処理装置101に入力されたメイン音響信号は時間周波数変換部10と乗算部40に入力されたが、本実施形態の信号処理装置104では、メイン音響信号は時間周波数変換部10、残響信号生成部60および加算部70に入力される。本実施形態では、残響信号生成部60に入力されるメイン音響信号をWet信号と呼び、加算部70に入力されるメイン音響信号をDry信号と呼ぶ。
【0041】
残響信号生成部60は、Wet信号に基づいて残響信号を生成して乗算部41に出力する。残響信号生成部60の残響信号生成アルゴリズムについては既存のものを用いればよい。Dry信号に残響信号を加算する、すなわちリバーブ効果を付与することにより、加算後の信号は聴感上奥行き感のある音を示す音響信号となる。
【0042】
パラメータ算出部31は、相互相関検出部20から入力された相関値R
msから式(3)に基づいてノーマライズ値xを算出して乗算部41に出力する。0≦x≦1となるのは上記で説明した通りである。パラメータ算出部31は次式(8)に基づいて、ミックス値g
mixを算出する。なおミックス値g
mixとは、残響信号の信号レベルに対して施す増幅処理の強さを示す値であり、Dry信号に対する残響信号の混合比に対応する。
【数8】
x
0は閾値であり、
図7は、式(8)をグラフ化した図である。ノーマライズ値xがx
0よりも小さいとミックス値g
mixはax+bとなり、ノーマライズ値が増加するに連れてミックス値g
mixは線形に大きくなる。ノーマライズ値xがx
0以上であるとミックス値g
mixは一定値c(c=ax
0+b)となる。なお、ミックス値g
mixがノーマライズ値が増加するにつれて非線形に大きくなってもよく、実験により好適な態様を取ればよい。
【0043】
乗算部41は、残響信号生成部60から残響信号の入力を受け、さらにパラメータ算出部31からミックス値g
mixの入力を受ける。乗算部41は、ミックス値g
mixに基づいて残響信号の信号レベルを増幅し、加算部70に出力する。
【0044】
加算部70は、Dry信号と乗算部41による増幅を受けた残響信号とを加算して出力信号として出力する。
【0045】
メイン音響信号とサブ音響信号の相関が高い場合、メイン音響信号に付与するリバーブ効果を強くし過ぎると残響音が目立ってしまい、メイン音響信号とサブ音響信号により最終的に放音される音のバランスが崩れてしまう。信号処理装置104であれば、閾値x
0よりもノーマライズ値xが大きい場合はミックス値g
mixが一定値であるcとなる。このcの値を残響音が目立たない程度の値に実験等により定めておけば、メイン音響信号とサブ音響信号の相関が高くても、残響音が目立つほどのリバーブ効果の付与がメイン音響信号に施されることなく、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはない。
【0046】
<第5実施形態>
本実施形態の信号処理装置105は、信号処理装置103と信号処理装置104を組み合わせたものである。詳しく説明すると、信号処理装置105は、信号処理装置104に対して、信号処理装置104の相互相関検出部20の換わりに信号処理装置103の相互相関検出部21と平均算出部90を設けたものに相当する。
【0047】
信号処理装置105では、相互相関検出部21と平均算出部90が、τ=0、1、2の場合の相関値R
ms(τ)の相加平均から平均相関値R
msを算出して、リバーブ効果の付与の強弱を決定している。そのため、信号処理装置105を用いると、メイン音響信号とメイン音響信号以外の他の信号であるサブ音響信号とに時間のずれがあっても、最終的に放音される音にはメイン音響信号とサブ音響信号のまじりの良いリバーブ効果が付与され、リバーブ効果によってメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはない。
【0048】
本実施形態においても第3実施形態と同様に、τは0、1、2に限られるものではなく、また平均相関値R
msを算出するのに用いるτの数は3つに限られない。さらに、複数の相関値R
ms(τ)から平均相関値R
msを算出する方法として相加平均を用いるだけでなく、他の算出方法を用いてもよい。要は、最終的に放音される音にメイン音響信号とサブ音響信号のまじりの良いリバーブ効果を付与できれば平均相関値R
msの算出方法は何でもよく、実験により好適な算出方法を決定すればよい。
【0049】
<第6実施形態>
図8は、この発明の第6実施形態である信号処理装置106のブロック図である。
図8では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図8と
図1を比較すれば明らかなように、信号処理装置106と信号処理装置101との違いは、時間周波数変換部10の前段にハイパスフィルタ(以下、HPF)81、バンドパスフィルタ(以下、BPF)82、ローパスフィルタ(以下、LPF)83を設けた点と、乗算部40の後段に加算部71を設けた点である。以下では第1実施形態との相違点である、HPF81、BPF82、LPF83と加算部71を中心に説明する。
【0050】
HPF81は入力された信号の周波数f
HL以上の高周波数周波数帯域のみを出力するフィルタであり、BPF82は周波数f
BLから周波数f
BHの中間周波数帯域のみを出力するフィルタであり(周波数f
BL<周波数f
BH)、LPF83は周波数f
LH以下の低周波数帯域のみを出力するフィルタである。本実施形態では、周波数f
HL=周波数f
BHであり、周波数f
BL=周波数f
LHであるが、各周波数は等しくなくてもよい。各周波数の値と各周波数間の関係は、実験により適宜決定すればよい。HPF81、BPF82、LPF83は、メイン音響信号やサブ音響信号に帯域分割処理を施す帯域分割部として機能する。
【0051】
メイン音響信号とサブ音響信号は、信号処理装置106に入力されると、まずHPF81、BPF82、LPF83に入力される。メイン音響信号については、HPF81、BPF82、LPF83が、各フィルタに対応した周波数帯域のみの信号を時間周波数変換部10と乗算部40に出力する。サブ音響信号については、HPF81、BPF82、LPF83が、各フィルタに対応した周波数帯域のみの信号を時間周波数変換部10に出力する。
【0052】
HPF81、BPF82、LPF83がメイン音響信号とサブ音響信号を時間周波数変換部10に出力し、メイン音響信号を乗算部40に出力してからは、高周波帯域、中間周波数帯域、低周波数帯域ごとに第1実施形態と同様の処理が行わるため説明を省略する。乗算部40は、高周波数帯域、中間周波数帯域、低周波数帯域の周波数帯域毎に信号レベルを増幅したメイン音響信号を加算部71に出力する。
【0053】
加算部71は、周波数帯域毎に信号レベルを増幅したメイン音響信号を加算して出力信号として出力する。
【0054】
このように信号処理装置106は、HPF81、BPF82、LPF83を用いて、メイン音響信号およびサブ音響信号に帯域分割処理を施し、周波数帯域毎にメイン音響信号とサブ音響信号の相関値R
msを算出し、相関値R
msに基づいて周波数帯域毎にメイン音響信号の信号レベルを増幅して最後に加算する。信号処理装置106によれば、周波数帯域毎のサブ音響信号との相関に応じてメイン音響信号の増幅制御を周波数帯域毎に細やかに行うことができる。
【0055】
<第7実施形態>
本実施形態の信号処理装置107と信号処理装置101との違いは、時間周波数変換部10の前段にHPF81とBPF82を設けた点である。信号処理装置107では、メイン音響信号はBPF82を介して時間周波数変換部10に入力されるとともに乗算部40に入力され、サブ音響信号はHPF81を介して時間周波数変換部10に入力される。
【0056】
本実施形態では、HPF81やBPF82により帯域分割された音響信号に対してフーリエ変換や相関値R
msの算出が行われるため、最終的に放音される音におけるメイン音響信号とサブ音響信号により放音される各音のバランスが崩れることはなく、さらに信号処理装置106に比べて装置の処理負荷を減らすことができる。
【0057】
信号処理装置107では、メイン音響信号に対してBPF82を用い、サブ音響信号に対してHPF81を用いた。しかし、信号処理装置107にHPF81、BPF82、LPF83を設けておき、信号処理装置107に入力されるメイン音響信号とサブ音響信号の集中している周波数帯域に応じて、HPF81、BPF82、LPF83の中から異なるフィルタを選択してもよい。もちろん、メイン音響信号或いはサブ音響信号のいずれか一方のみに対して、HPF81、BPF82、LPF83のいずれかを用いる態様であってもよい。
【0058】
<第8実施形態>
図9は、この発明の第8実施形態である信号処理装置108のブロック図である。信号処理装置108は例えばカラオケ装置に適用される。
図9では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図9と
図1を比較すれば明らかなように、信号処理装置108と信号処理装置101との違いは、時間周波数変換部10にサブ音響信号としてボーカル音の音響信号と伴奏音の音響信号が入力され、乗算部40にメイン音響信号としてボーカル音と伴奏音の音響信号の合成信号(以下、合成信号)が入力される点である。
【0059】
信号処理装置108では、ボーカル音と伴奏音の音響信号の相関値R
msに基づいて、パラメータ算出部30が増幅率yを算出する。乗算部40は、この増幅率yに基づいて、合成信号に増幅処理を施す。
【0060】
本実施形態のように、ボーカル音の音響信号に対してではなく、合成信号に対して直接増幅処理を施すことで、合成信号からボーカル音の音響信号を音源分離して増幅する場合と類似の効果を期待できる。すなわち、本実施形態の出力信号は、合成信号をボーカル音の音響信号と伴奏音の音響信号に音源分離して、分離したボーカル音の音響信号と伴奏音の音響信号の相関値R
msを算出して、ボーカル音の音響信号に増幅を施して出力する出力信号に類似する。音源分離を用いた方法では、音源分離の際に人工的なノイズが発生することがあり、音源分離後の音質が問題となることが多い。本実施形態では、信号処理装置108に入力されるボーカル音の音響信号と伴奏音の音響信号が合成信号に音源分離を施すことにより生成されたものであったとしても、増幅処理の対象となる合成信号は音源分離により生成されたものではないため、ボーカル音と伴奏音のバランスが崩れることがなく、音源分離の性能に出力信号の音質が依存しづらくなるという利点が生じる。
【0061】
信号処理装置108では、合成信号はサブ音響信号として入力された音響信号のみから構成されていたが、この態様に限られるわけではなく、合成信号がサブ音響信号として入力された音響信号の中の少なくとも1つの音響信号と他の音響信号とから構成された態様であってもよい。この態様では、例えば、サブ音響信号がボーカル音の音響信号とドラム音の音響信号であり、メイン音響信号がドラム音とギター音の音響信号の合成信号である。さらに、サブ音響信号として3種類以上の音響信号が入力される場合には、相互相関検出部20が音響信号の中から相関値R
msを算出する音響信号を選択する態様であってもよい。この態様では、例えばサブ音響信号としてボーカル音、ドラム音およびギター音の音響信号が各々入力されると、相互相関検出部20は、入力された音響信号からボーカル音の音響信号とドラム音の音響信号を選択し、両信号の相関値R
msを算出する。さらに、この選択をユーザの指示に応じて切り換えるようにしてもよい。この場合のメイン音響信号は、ボーカル音とドラム音の音響信号の合成信号であってもよいし、ドラム音とギター音の音響信号の合成信号であってもよい。もちろん、メイン音響信号がボーカル音、ドラム音およびギター音の音響信号の合成信号であってもよい。
【0062】
<第9実施形態>
本実施形態の信号処理装置109も例えばカラオケ装置に適用される。信号処理装置109と信号処理装置101との違いは、メイン音響信号としてボーカル音と伴奏音の合成音の時間波形を表す合成信号が時間周波数変換部10と乗算部40に入力され、サブ音響信号として伴奏音の音響信号が時間周波数変換部10に入力されることである。
【0063】
信号制御装置109では、伴奏音の音響信号と合成信号との相関値R
msに基づいて増幅率yが算出され、その増幅率yに基づいて、合成信号に増幅処理が施されている。
【0064】
本実施形態では、ボーカル音の音響信号の入力がなくても伴奏音の音響信号と合成信号との入力があれば、ボーカル音と伴奏音のバランスを崩すことなく、合成信号に増幅処理を施すことができる。
【0065】
<第10実施形態>
図10は、この第10実施形態である信号処理装置110のブロック図である。信号処理装置110も例えばカラオケ装置に適用される。
図10では、
図1におけるものと同一の構成要素には同一の符号が付されている。
図10と
図1を比較すれば明らかなように、信号処理装置110と信号処理装置101との違いは、時間周波数変換部10に複数種類のサブ音響信号が入力される点と平均算出部90が設けられた点である。本実施形態では、時間周波数変換部10に入力されたサブ音響信号の種類はN種類(N≧2)である。N種類のサブ音響信号の具体例としては、ドラム音、ギター音、キーボード音といった伴奏楽器毎の伴奏音の音響信号が挙げられる。
【0066】
時間周波数変換部10は、メイン音響信号とN種類のサブ音響信号のフーリエ変換データを相互相関検出部20に出力する。相互相関検出部20は、時間周波数変換部10から入力されたメイン音響信号とN種類のサブ音響信号との各々の相関を検出する。より詳細に説明すると、相互相関検出部20は、式(1)と式(2)に基づいて、メイン音響信号とサブ音響信号1の相関値R
ms1を算出し、メイン音響信号とサブ音響信号2の相関値R
ms2を算出する。以下同様に、相互相関検出部20は、メイン音響信号とサブ音響信号Nの相関値R
msNまで算出する。相互相関検出部20は算出した相関値R
ms1〜R
msNを平均算出部90に出力する。平均算出部90は、入力された相関値R
ms1〜R
msNの相加平均を平均相関値R
msとして算出する。平均算出部90は、算出した平均相関値R
msをパラメータ算出部30に出力し、乗算部40は、パラメータ算出部30により算出された増幅率yに基づいてメイン音響信号に増幅処理を施し、出力信号として出力する。
【0067】
信号処理装置110では、全てのサブ音響信号とメイン音響信号との平均相関値R
msが算出され、この平均相関値R
msに応じた増幅率でメイン音響信号の増幅が行われる。このため、最終的に放音される音におけるメイン音響信号と複数のサブ音響信号のバランスが崩れることはない。
【0068】
<変形例>
(1)上記実施形態を各々組み合わせた態様をとってもよい。例えば、第7実施形態と第10実施形態を組み合わせても良い。この場合、入力されるサブ音響信号が複数あっても、最終的に放音される音におけるメイン音響信号と複数のサブ音響信号により放音される各音のバランスが崩れることなく、メイン音響信号に増幅処理を施すことができる。さらにこの場合、サブ音響信号が1つしかない、すなわち第1実施形態の装置の処理負荷にサブ音響信号の数を乗じた処理負荷よりも処理負荷を減らすことができる。
【0069】
(2)上記各実施形態では、メイン音響信号に増幅処理或いはリバーブ効果を付与する処理を施していたが、メイン音響信号に施す信号処理はこれらの処理に限られることはなく、他の音響効果を与える処理をメイン音響信号に施してもよい。
【0070】
(3)上記各実施形態では、時間周波数変換部10が、入力を受けたメイン音響信号とサブ音響信号の2種類のデジタル信号を一定時間長のフレームに区切ってフーリエ変換を行い、フーリエ変換によって算出したフーリエ変換データを相互相関検出部20に出力していたが、この時間周波数変換部10が存在しない態様をとってもよい。この態様では、入力されたメイン音響信号とサブ音響信号が相互相関検出部20に直接入力され、相互相関検出部20は、式(1)或いは式(6)を用い、メイン音響信号とサブ音響信号に基づいて相関値R
ms或いは相関値R
ms(τ)を算出する。この場合、τは音響信号を構成する各サンプルを示すインデックスである。この態様によっても、メイン音響信号とサブ音響信号により放音される音全体のバランスを保ちつつ、音響信号のダイナミックレンジの圧縮や音響信号へのリバーブ効果の付与を行うことができる。
【0071】
(4)上記各実施形態では、メイン音響信号とサブ音響信号の両者がデジタル信号であったが、一方(或いは両方)がアナログ信号であってもよい。各実施形態の信号処理装置にアナログ信号が入力される場合には、信号処理装置の前段にA/D変換器を設けておけばよい。
【0072】
(5)上記各実施形態では、本発明の信号処理装置特有の機能をプログラム(DSPのマイクロプログラム)により実現したが、このプログラム単体で提供してもよい。例えば、カラオケ装置の既存のプログラムに上記各実施形態のいずれかのプログラムを追加することで、最終的に放音される音のボーカル音と伴奏音のバランスを崩すことなく、ボーカル音の音響信号にダイナミックレンジの圧縮やリバーブ効果の付与を行うことができる。
【0073】
(6)上記各実施形態による増幅処理或いはリバーブ効果の付与をASP(アプリケーションサービスプロバイダ)形式の通信サービスで提供してもよい。例えば、第1実施形態の増幅処理をASP形式で提供する場合は、信号処理装置101を通信回線に接続しておく。そして、信号処理装置101にメイン音響信号とサブ音響信号が通信回線経由で入力され、信号処理装置101は、メイン音響信号とサブ音響信号の相関に基づいて増幅処理を施したメイン音響信号を出力信号として出力し、その出力信号を通信回線経由で返信する。