(58)【調査した分野】(Int.Cl.,DB名)
前記加算部は、前記倍音生成部によって生成した前記整数次倍音を、前記抽出部によって抽出した前記音声信号の信号レベルに応じて増幅した後、入力された前記音声信号に加算することを特徴とする請求項1に記載の音声信号処理装置。
前記加算部は、前記アタック検出部によって検出した前記アタック期間の前記アタック終了位置を開始位置とする期間において、生成した前記整数次倍音を、入力された前記音声信号に加算することを特徴とする請求項3に記載の音声信号処理装置。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の構成では、低周波数帯域成分の音声信号全体について、一律に倍音を生成しこれを付加する構成である。そのため、ベース音等の、元から倍音を含んだ楽器音についても、バスドラム音等の、倍音を含まない楽器音と同様に、倍音を生成/付加してしまう。その結果、元から倍音を含んだ楽器音について、当該楽器音の音色が変化してしまい、または歪感が生じてしまうという問題が生じた。
【0005】
本発明は、バスドラム音等の、倍音を含まない特定の楽器音のみに対し、倍音を効果的に付加することができる音声信号処理装置、音声信号処理装置の制御方法およびプログラムを提供することを課題としている。
【課題を解決するための手段】
【0006】
本発明の音声信号処理装置は、入力された音声信号の低周波数帯域成分を抽出する抽出部と、抽出した音声信号のアタック位置を検出するアタック検出部と、抽出した音声信号の整数次倍音を生成する倍音生成部と、検出したアタック位置に基づく期間において、生成した整数次倍音を、入力された音声信号に加算する加算部と、を備え
、アタック検出部は、第1の時定数の第1のローパスフィルタと、第1の時定数とは異なる第2の時定数の第2のローパスフィルタとのそれぞれによって生成される振幅エンベロープにおいて、第1のローパスフィルタの出力値が第2のローパスフィルタの出力値以上となる時間位置をアタック開始位置として検出し、第1のローパスフィルタの出力値が第2のローパスフィルタの出力値未満となる時間位置をアタック終了位置として検出することを特徴とする。ここにいう「アタック位置」とは、アタック音の時間位置を指し、「アタック音」は、楽器の鳴り始めの突発的・衝撃的な音を指す。なお、アタック位置に基づく期間は、アタック終了位置から100ms〜200ms程度の期間であることが好ましい。すなわち、アタック位置に基づく期間の継続時間は、想定されるバスドラム音の継続時間に合わせて設定されることが好ましい。
【0007】
本発明の音声信号処理装置の制御方法は、入力された音声信号の低周波数帯域成分を抽出する抽出ステップと、抽出した音声信号のアタック位置を検出するアタック検出ステップと、抽出した音声信号の整数次倍音を生成する倍音生成ステップと、検出したアタック位置に基づく期間において、生成した整数次倍音を、入力された音声信号に加算する加算ステップと、を備え
、アタック検出ステップでは、第1の時定数の第1のローパスフィルタと、第1の時定数とは異なる第2の時定数の第2のローパスフィルタとのそれぞれによって生成される振幅エンベロープにおいて、第1のローパスフィルタの出力値が第2のローパスフィルタの出力値以上となる時間位置をアタック開始位置として検出し、第1のローパスフィルタの出力値が第2のローパスフィルタの出力値未満となる時間位置をアタック終了位置として検出することを特徴とする。
【0008】
上記の音声信号処理装置において、加算部は、倍音生成部によって生成した整数次倍音を、抽出部によって抽出した前記音声信号の信号レベルに応じて増幅した後、入力された音声信号に加算することが好ましい。
【0009】
また、
音声信号処理装置は、アタック開始位置およびアタック終了位置から成るアタック期間
において、入力された音声信号の中高周波数帯域成分を増幅する増幅部を、更に備えたことが好ましい。ここにいう「アタック期間」とは、いわゆるアタックタイムである。
【0010】
この場合、加算部は、アタック検出部によって検出したアタック期間のアタック終了位置を開始位置とする期間において、生成した整数次倍音を、入力された音声信号に加算することが好ましい。
【0011】
一方、倍音生成部は、奇数次倍音および偶数次倍音のうち、奇数次倍音のみを生成する構成であっても良い。
【0012】
本発明のプログラムは、コンピューターに、上記の音声信号処理装置の制御方法における各ステップを実行させることを特徴とする。
【発明を実施するための形態】
【0014】
以下、添付の図面を参照しながら、本発明の一実施形態に係る音声信号処理装置、音声信号処理装置の制御方法およびプログラムについて説明する。本実施形態では、本発明の音声信号処理装置を適用した音声信号処理部、およびこれを備えた再生システムを例示する。特に、本再生システムは、バスドラム音の共鳴音部分に整数次倍音を付加することで、バスドラム音を効果的に強調すると共に、当該共鳴音部分について、ミッシングファンダメンタル効果を実現したものである。
【0015】
図1に示すように、再生システムSYは、音源1、音声信号処理部2、パワーアンプ3およびスピーカー4から成る。
【0016】
音源1は、音声信号処理部2に対して音声信号を供給するものであり、各種記憶媒体(CD、SDカード、USBメモリ等)、各種電子機器(オーディオプレーヤー、パーソナルコンピューター、タブレット端末、携帯電話等)、各種サーバー(Web上のサーバー、LANネットワーク上のサーバー等)に相当する。
【0017】
音声信号処理部2は、音源1から供給された音声信号に対し、各種音声処理を行う。特に本実施形態では、バスドラム音の強調処理を行うことにより、ビートの効いた楽曲再生を実現する。なお、音声信号処理部2は、DSP(Digital Signal Processor)などによってソフトウェアで実現しても良いし、アナログ機器で実現しても良い。
【0018】
パワーアンプ3は、音声信号処理部2による処理後の音声信号を増幅し、スピーカー4を駆動する。また、スピーカー4は、パワーアンプ3の駆動により、音声信号を出力する。なお、パワーアンプ3は、スピーカー4に内蔵しても良い。また、スピーカー4に代えて、ヘッドフォンやイヤフォンを用いても良い。
【0019】
また、本実施形態の再生システムSYは、バスドラム音の強調ニーズの高いDJスピーカー、DJミキサー、DJプレーヤー等のDJ機器に好適であるが、他の再生システム(ミニコンポ、ヘッドフォンアンプ等)にも適用可能である。
【0020】
次に
図2ないし
図7を参照して、音声信号処理部2の構成について説明する。音声信号処理部2は、バスドラム音のアタック音を強調するアタック音強調機能と、バスドラム音のアタック音以外の音(ディケイ音、サスティン音およびリリース音)(以下、共鳴音と呼称)を強調する共鳴音強調機能と、を有している。ここにいう「アタック音」とは、バスドラムのマレットが打面に当たった瞬間の音を指す。音声信号処理部2は、アタック音が鳴るアタック期間において、中高周波数帯域成分を強調すると共に、共鳴音が鳴る共鳴音期間において、整数次倍音を付加する。これらによって、バスドラム音を良好に強調する。なお、共鳴音期間は、アタック期間の終了位置を開始位置とする期間となっている。
【0021】
図2は、音声信号処理部2の回路構成図である。同図に示すように、音声信号処理部2は、アタック期間検出部(アタック検出部)11と、共鳴音期間検出部12と、アタック音強調成分生成部13と、アタック音強調成分増幅器14と、共鳴音強調成分生成部(倍音生成部)15と、共鳴音強調成分増幅器16と、第1加算器17および第2加算器18とを備えている。音声信号処理部2では、入力された音声信号が4系統に分岐されている。第1系統には、第1加算器17が配設されている。第2系統には、アタック音強調成分生成部13、アタック音強調成分増幅器14および第2加算器18が配設されており、出力端が第1加算器17に接続されている。第3系統には、共鳴音強調成分生成部15および共鳴音強調成分増幅器16が配設されており、出力端が第2加算器18に接続されている。第4系統には、アタック期間検出部11および共鳴音期間検出部12が配設されており、アタック期間検出部11の出力端がアタック音強調成分増幅器14に、共鳴音期間検出部12の出力端が共鳴音強調成分増幅器16に、それぞれ接続されている。詳細は後述するが、音声信号処理部2では、第2系統および第3系統で生成されたアタック音強調成分および共鳴音強調成分を、第1加算器17および第2加算器18により、第1系統の音声信号(原音)に加算することで、音声信号処理部2に入力された音声信号に対し強調処理を行う。
【0022】
次に
図3を参照して、アタック期間検出部11および共鳴音期間検出部12について説明する。
図3に示すように、アタック期間検出部11は、第1ローパスフィルター(以下、LPF)21と、第1絶対値演算回路(以下、ABS)22と、時定数1の第2LPF23と、時定数2の第3LPF24と、減算器25と、リミッター26と、振幅エンベロープ増幅器27と、を有している。
【0023】
アタック期間検出部11では、まず第1LPF21(カットオフ周波数240Hz)により、入力された音声信号の低周波数帯域成分を抽出する(抽出ステップ)。そして、第1LPF21により抽出した音声信号(低周波数帯域成分)に対し、第1ABS22により絶対値を取り、時定数の異なる2種類のLPF23、24をかけることで、当該音声信号に対する2種類の振幅エンベロープを生成する。
【0024】
第2LPF23の時定数1は、第3LPF24の時定数2よりも小さいことを条件とする。この場合、バスドラム音が鳴った瞬間のような急峻な立ち上がりの部分において、時定数が大きい第3LPF24側の振幅エンベロープよりも、時定数が小さい第2LPF23の振幅エンベロープの方が早く立ち上がる。その後、バスドラム音の余韻が小さくなっていくにしたがって、いずれの振幅エンベロープも下りに転じるが、この立ち下がりの部分においても、時定数が大きい第3LPF24の振幅エンベロープより、時定数が小さい第2LPF23の振幅エンベロープの方が早く小さくなっていく。このように、時定数の違いにより、第2LPF23の振幅エンベロープが第3LPF24の振幅エンベロープより大きくなる期間が発生する。
【0025】
図3に示すように、第2LPF23および第3LPF24により、2種類のエンベロープを生成したら、減算器25により、第2LPF23の振幅エンベロープから、第3LPF24の振幅エンベロープを減算(デジベル換算)し、リミッター26により、減算器25の出力値x1が0以下となったとき、0にリミッティングする。これによって、アタック開始位置およびアタック終了位置(アタック期間)を検出する(アタック検出ステップ)。すなわち、上記したように、第2LPF23の振幅エンベロープが第3LPF24の振幅エンベロープより大きくなる期間が発生するが、第2LPF23の出力値が第3LPF24の出力値以上となる時間位置が、アタック開始位置(アタック音の開始位置)に対応しており、その後第2LPF23の出力値が第3LPF24の出力値未満となる時間位置がアタック終了位置(アタック音の終了位置)に対応している。そのため、第2LPF23の振幅エンベロープから、第3LPF24の振幅エンベロープを減算し、0以下を0にリミッティングすることで、当該各位置を示す検出信号が生成される。すなわち、アタック開始位置およびアタック終了位置を検出した検出信号、つまりアタック期間の検出信号を得ることができる。ここで生成したアタック期間の検出信号を、
図4の符号L1で示す。なお、
図4は、バスドラム音の音声信号と、アタック期間の検出信号と、後述の共鳴音期間の検出信号とを重畳した波形図である。ここで生成したアタック期間の検出信号は、共鳴音期間検出部12に出力されると共に、アタック音強調成分増幅器14に出力される。
【0026】
一方、第2LPF23側で生成された振幅エンベロープは、振幅エンベロープ増幅器27により、0.5倍に減衰した後、共鳴音期間検出部12に出力される。このように、アタック期間検出部11から、低周波数帯域成分の振幅エンベロープ(x2)と、アタック期間の検出信号(x3)とが、共鳴音期間検出部12に出力される。
【0027】
共鳴音期間検出部12は、共鳴音期間検出回路31と、時定数3の第4LPF32と、を有している。
図5は、共鳴音期間検出回路31での処理を示したフローチャートである。
図5に示すように、共鳴音期間検出回路31の処理では、アタック期間検出部11から得られた低周波数帯域成分の振幅エンベロープ(x2)およびアタック期間の検出信号(x3)を入力値としている。これらの入力に対し、まず、アタック期間の検出信号が0でないか否かを判定する(S1)。アタック期間の検出信号が0でない場合(S1:Yes)には、タイムカウンターをリセットする(S2)。すなわち、アタック期間内では、タイムカウンターをリセットし続けることになる。一方、アタック期間の検出信号が0である場合(S1:No)には、タイムカウンターをインクリメント(カウントアップ)する(S3)。すなわち、アタック期間が終了して検出信号の値が0になったら、タイムカウントを行う。よって、このタイムカウンターの値が、前回のアタック期間終了からの経過時間を示している。
【0028】
次にタイムカウンターの値が0であるか否かを判定する(S4)。上記したように、アタック期間内では、タイムカウンターがリセットされ続けるため、アタック期間内では、タイムカウンターの値が0であると判定される。タイムカウンターの値が0である判定された場合(S4:Yes)、共鳴音期間検出回路31の出力値x4を0にして(S5)、共鳴音期間検出回路31の処理を終了する。
【0029】
一方、タイムカウンターの値が0でないと判定された場合には、タイムカウンターの値が限度値(例えば1msec)を超えているか否かを判定する(S6)。タイムカウンターの値が限度値を超えている場合(S6:Yes)、すなわち、アタック期間の終了から一定時間以上経過している場合には、共鳴音期間検出回路31の出力値x4を0にして(S7)、共鳴音期間検出回路31の処理を終了する。
【0030】
一方、タイムカウンターの値が限度値を超えていない場合(S6:No)、入力された振幅エンベロープの値x2を、共鳴音期間検出回路31の出力値x4にして(S8)、共鳴音期間検出回路31の処理を終了する。
【0031】
このような処理によって、入力された振幅エンベロープが、アタック期間後からの信号に制限されるため、アタック終了位置、すなわち共鳴音の開始位置を示す信号となる。一方、振幅エンベロープで値が0となる時間位置は、共鳴音の終了位置に対応している。よって、共鳴音期間検出回路31により、振幅エンベロープをアタック期間後の信号に制限することで、共鳴音の開始位置および終了位置を示す検出信号が生成される。すなわち、共鳴音の開始位置および終了位置を検出した検出信号、つまり共鳴音期間の検出信号を得ることができる。ここで生成した共鳴音期間の検出信号を、
図4の符号L2で示す。なお、ここで入力される振幅エンベロープ(第2LPF23側で生成される振幅エンベロープ)は、共鳴音期間の継続時間が、100ms〜200ms程度になるように生成される。すなわち、この共鳴音期間の継続時間は、想定されるバスドラム音における共鳴音の継続時間に合わせて調整されている。
【0032】
図3に示すように、共鳴音期間検出回路31により、共鳴音期間の検出信号を生成したら、当該信号に時定数3の第4LPF32をかける。その後、当該検出信号が共鳴音強調成分増幅器16に出力される。
【0033】
次に
図6を参照して、アタック音強調成分生成部13、アタック音強調成分増幅器14、共鳴音強調成分生成部15および共鳴音強調成分増幅器16について説明する。
図6に示すように、アタック音強調成分生成部13は、第5LPF41と、第1ハイパスフィルター(以下HPF)42と、を有している。
【0034】
アタック音強調成分生成部13では、入力された音声信号に対し、第5LPF41および第1HPF42をかけて、当該音声信号の中高周波数帯域成分を抽出することで、アタック音強調成分を生成する。すなわち、抽出した中高周波数帯域成分をアタック音強調成分としている。
【0035】
一方、アタック音強調成分増幅器14は、アタック音強調成分生成部13により生成したアタック音強調成分を増幅する。アタック音強調成分増幅器14は、可変増幅器であり、アタック期間検出部11から入力されたアタック期間の検出信号の信号レベルで、アタック音強調成分を増幅する。これによって、アタック音強調成分が、アタック期間内の信号に制限される。また、アタック期間の検出信号は、2種類の振幅エンベロープの差異によって生成されているため、アタック音強調成分が、当該差異のレベルに応じて増幅される。アタック期間内の信号に制限され且つ増幅されたアタック音強調成分を
図7(b)に示す。当該アタック音強調成分は、第2加算器18を経て、第1加算器17に出力される。これによって、アタック音強調成分が、第1系統の音声信号(原音)に加算される。
【0036】
共鳴音強調成分生成部15は、第6LPF51と、偶数次倍音生成部52と、奇数次倍音生成部53と、倍音加算器54と、第2HPF55と、第7LPF56と、を有している。
【0037】
共鳴音強調成分生成部15では、第6LPF51(カットオフ周波数100Hz)により、入力された音声信号の低周波帯域成分を抽出する。そして、偶数次倍音生成部52および奇数次倍音生成部53により、抽出した音声信号の偶数次倍音および奇数次倍音をそれぞれ生成する。
【0038】
偶数次倍音生成部52は、第2ABS61により構成されている。偶数次倍音生成部52では、第2ABS61により、抽出した音声信号を絶対値化することで、当該音声信号の偶数次倍音を生成する(倍音生成ステップ)。
【0039】
奇数次倍音生成部53は、第3ABS62と、時定数4の第8LPF63と、第1可変増幅器64と、スライス回路65と、第2可変増幅器66とにより構成されている。奇数次倍音生成部53では、まず、抽出した音声信号に対し、第3ABS62により絶対値を取り、時定数4の第8LPF63にかけることで、抽出した音声信号の振幅エンベロープx5を生成する。そして、第1可変増幅器64により、抽出した音声信号に対し(1/x5×1.1)を乗算することで、抽出した音声信号を正規化し、且つ1.1倍する。その後、スライス回路65により、閾値±1のレベルでリミッティングして、奇数次倍音を発生させる。
更に、第2可変増幅器66により、(x5/1.1)を乗算することにより、1.1倍されていたレベルを元に戻す。このように、抽出した音声信号を正規化して1.1倍し、スライスし、1.1倍の係数の逆数を掛けることで、当該音声信号の奇数次倍音を生成する(倍音生成ステップ)。
【0040】
偶数次倍音生成部52および奇数次倍音生成部53により、偶数次倍音および奇数次倍音を生成したら、これらを倍音加算器54により合算し、合算した倍音を第2HPF55(カットオン周波数10Hz)および第7LPF56(カットオフ周波数700Hz)にかけることで、共鳴音強調成分が生成される。
【0041】
一方、共鳴音強調成分増幅器16は、共鳴音強調成分生成部15により生成した共鳴音強調成分を増幅する。共鳴音強調成分増幅器16は、可変増幅器であり、共鳴音期間検出部12から入力された共鳴音期間の検出信号の信号レベルで、共鳴音強調成分を増幅する。これによって、共鳴音強調成分が、共鳴音期間内の信号に制限される。また、共鳴音強調成分が、共鳴音期間の検出信号のレベルに応じて増幅される。共鳴音期間内の信号に制限され且つ増幅された共鳴音強調成分を
図7(c)に示す。当該共鳴音強調成分は、第2加算器18に出力され、第1加算器17により、アタック音強調成分と共に、第1系統の音声信号(原音)に加算される(加算ステップ)。
【0042】
アタック音強調成分および共鳴音強調成分が、第1系統の音声信号(原音)に加算されることで、
図7(d)に示すように、音声信号処理部2に入力された音声信号に対し、バスドラム音のアタック期間において、中高周波数帯域成分が増幅されると共に、バスドラム音の共鳴音期間において、整数次倍音が付加(加算)される。これによって、音声信号処理部2に入力された音声信号に、強調処理が施される。
【0043】
なお、請求項にいう「抽出部」は、第1LPF21および第6LPF51により構成されている。また、請求項にいう「加算部」は、共鳴音強調成分増幅部16、第1加算器17および第2加算器18により構成されている。さらに、請求項にいう「増幅部」は、アタック音強調成分生成部13、アタック音強調成分増幅部14、第1加算器17および第2加算器18により構成されている。
【0044】
以上のような構成によれば、アタック期間を検出し、検出したアタック期間に基づく期間(共鳴音期間)において整数次倍音を付加することで、バスドラム音等の、倍音を含まない特定の楽器音のみに対し、倍音を効果的に付加することができる。すなわち、継続時間が比較的短いバスドラム音に合わせて、倍音付加期間の継続時間を設定することができるため、倍音付加によるベース音等への影響を抑制しつつ、倍音付加によるバスドラム音への強調効果を維持することができる。よって、ベース等の元から倍音構成を持つ楽器の音色を変えてしまうのを抑制することができ、または歪み感を生じさせるのを抑制することができる。一方で、バスドラム音に対しミッシングファンダメンタル効果を良質に実現されることができ、スピーカー4の出力限界以下の低音を、聴取者に認識(知覚)させることができる。また、バスドラム音の倍音自体を聞かせることもでき、リズムを聞き取りやすくすることができる。例えば街中でのランニング時のペースメーカーとしてのオーディオ使用時においても周囲の雑音に紛れることなく、バスドラム音をはっきり聞かせることができる。すなわち、バスドラム音の再生帯域を広げることができ、且つ帯域別に見てS/N比を向上させることができる。
【0045】
また、共鳴音強調成分増幅器16により、生成した整数次倍音を、低周波数帯域成分の振幅エンベロープに応じて増幅することで、バスドラム音の強弱に合わせた強調量で、バスドラム音を強調することができる。よって、不要なタイミングでバスドラム音が強調されることを防ぐことができる。
【0046】
さらに、アタック音強調機能により、アタック期間において、入力された音声信号の中高周波数帯域成分を増幅することで、バスドラム音を効果的に強調することができる。
【0047】
なお、上記実施形態においては、奇数次倍音および偶数次倍音の両方を生成し、この両方を付加(加算)する構成であったが、奇数次倍音および偶数次倍音のうち、奇数次倍音のみを生成し付加(加算)する構成であっても良い。かかる構成によれば、エッジの効いたバスドラム音を出力することができる。
【0048】
また、上記実施形態においては、アタック期間においては、中高周波数帯域成分を増幅して強調を行い、共鳴音期間においては、倍音を付加して強調を行う構成であったが、アタック期間においても、倍音を付加して強調を行う構成であっても良い。また、中高周波数帯域成分の増幅期間と倍音付加期間とをオーバーラップされて強調処理を行う構成であっても良い。
【0049】
なお、上記実施形態に示した再生システムSY(特に、音声信号処理部2)の各構成要素および各処理工程をプログラムとして提供することが可能である。また、そのプログラムを各種記憶媒体(CD−ROM、フラッシュメモリ等)に格納して提供することも可能である。すなわち、再生システムSYの各構成要素または各処理工程(各ステップ)を実現するためのプログラム、およびそれを記録した記憶媒体も、本発明の権利範囲に含まれる。
【0050】
また、上記実施形態では、音声信号処理部2(請求項における「音声信号処理装置」)を、再生システムSYに適用した場合を例示したが、再生専用装置に限らず、パーソナルコンピューター、タブレット端末、携帯電話またはカーナビゲーション装置など、他の電子機器に適用しても良い。また、音声信号処理部2をWeb上のサーバーやLANネットワーク上のサーバーで実現するなど、クラウドコンピューティングに適用しても良い。その他、本発明の要旨を逸脱しない範囲で、適宜変更が可能である。