(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0012】
実施の形態1
以下、図面を参照して本発明の実施の形態について説明する。実施の形態1にかかる雑音低減装置1は、入力信号に突発音が周期的に混入した場合に、入力信号から周期性雑音を抑圧した出力信号を出力する。ここで、周期的に混入する突発音は、例えば、消防士が火災現場で活動する時に担ぐ酸素ボンベには、酸素ボンベのタンク内容量が所定値以下となった場合、装着者へ警告を発するために動作する警告バイブレーション音のような持続性、周期性のある突発音を発生させる機能により生じる。また、周期的な突発音としては、工事現場の地盤圧縮機により生じる。
【0013】
図1に実施の形態1にかかる雑音低減装置1のブロック図を示す。
図1に示すように、実施の形態1にかかる雑音低減装置1は、音声入力部10、フレーム構成部11、音声判定部12、突発音検出部13、突発音更新判定部14、突発音情報記憶部15、相関値算出部16、位相差算出部17、加算信号生成部18、突発音抑制部19を有する。
【0014】
なお、雑音低減装置1は、音声入力部10、及び、各種情報を記憶する記憶部がハードウェアにより構成される。また、雑音低減装置1では、フレーム構成部11、音声判定部12、突発音検出部13、突発音更新判定部14、相関値算出部16、位相差算出部17、加算信号生成部18及び突発音抑制部19で行われる情報或いは信号に対して行われる処理を、CPU(Central Processing Unit)又はDSP(Digital Signal Processor)等の演算部により実行されるプログラム(例えば、雑音低減プログラム)により実現することができる。この場合、雑音低減プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、CPUを含むコンピュータに供給できる。また、プログラムにより実現される各構成要素は、ハードウェアによって構成されてもよい。
【0015】
音声入力部10は、例えば、マイクロフォン等のセンサであって、外部から音声信号を取得する。この音声入力部10で取得される入力信号Ainはアナログ信号である。フレーム構成部11は、入力信号Ainをデジタル値に変換すると共に、予め設定されたサンプル数に従った単位で入力信号をフレーム化して入力信号Dinを出力する。なお、アナログ信号からデジタル値への変換は、音声入力部10とフレーム構成部11のいずれのブロックで行っても良い。フレーム構成部11が出力する入力信号Dinは、後段のブロックに伝達されて、突発音の低減処理が行われる。
【0016】
音声判定部12は、抑制対象外の成分である音声が現入力信号に含まれているか否かを判定する。そして、音声判定部12は、音声成分が現入力信号に含まれていないと判断した場合に音声判定信号をイネーブル状態とする。
【0017】
突発音検出部13は、現入力信号に抑制対象の突発音が含まれていることを検出する。そして、突発音検出部13は、突発音が現入力信号に含まれていると判断した場合、突発音検出信号をイネーブル状態とする。
【0018】
突発音情報記憶部15は、現入力信号の前に入力された入力信号のうち音声が予め設定した閾値以下、かつ、抑制対象の突発音を含む入力信号を突発音情報として記憶する。この突発音情報は、入力信号の突発音を打ち消すものであり、参照信号として記憶されるものである。突発音更新判定部14は、音声判定部において音声が現入力信号に含まれておらず、かつ、突発音検出部13において突発音が検出されたことに応じて、突発音情報記憶部15に記憶されている突発音情報を現入力信号により更新する。具体的には、突発音更新判定部14は、音声判定信号及び突発音検出信号が共にイネーブル状態となったことに応じて、突発音情報記憶部15に記憶している突発音情報の更新を指示する。ここで、突発音更新判定部14は、突発音情報を更新する場合、突発音が存在する突発音区間情報を突発音検出部13から得て、当該突発音区間情報に応じた区間の現入力信号を更新後の突発音情報とすることを突発音情報記憶部15に指示する。
【0019】
なお、突発音情報記憶部15は、突発音更新判定部14において現入力信号に突発音と音声信号とが含まれている、或いは、現入力信号に突発音が含まれていないと判断された場合、記憶している突発音情報を維持する。
【0020】
相関値算出部16は、突発音情報記憶部15に記憶されている突発音情報と、現入力信号と、の相関値を算出する。より具体的には、突発音検出部13で現入力信号に突発音が含まれていると判断された場合に、突発音情報と現入力信号との相関値を算出し、算出した相関値を位相差算出部17に出力する。
【0021】
ここで、相関値は、例えば(1)式に基づき算出される。
【数1】
(1)式において、m、nは自然数であり、mは入力信号列から自己相関値を計算する範囲(時間幅)を示すものであって現入力信号と前入力信号に含まれる入力信号との位相差に当たる値であり、Nは定数であって最大位相差(探索範囲)であり、nは自己相関値を計算する入力信号列のサンプル数であり、xはフレーム化された入力信号であり、A[m]は位相差mにおける自己相関値である。
【0022】
位相差算出部17は、相関値算出部16で算出された相関値の最大値に基づき突発音情報と現入力信号中の突発音との位相差を算出する。位相差算出部17は、算出した位相差情報を加算信号生成部18に出力する。
【0023】
加算信号生成部18は、加算信号生成部18が出力する位相差情報に基づき突発音情報の位相をシフトさせて雑音相殺信号を生成する。加算信号生成部18では、この雑音相殺信号として突発音情報を反転させた信号を生成する。また、雑音相殺信号は、現入力信号に加算される信号として扱われるため、以下の説明では、加算信号と称す。
【0024】
突発音抑制部19は、加算信号と現入力信号とを加算して現入力信号中の突発音を抑制して出力信号Soを出力する。実施の形態1では、突発音抑制部19として加算器を用いる。
【0025】
続いて、実施の形態1にかかる雑音低減装置1の動作について詳細に説明する。実施の形態1にかかる雑音低減装置1では、突発音抑制処理と、突発音情報更新処理と、を入力信号Dinが入力される毎に行う。突発音抑制処理では、過去に入力された入力信号に基づき取得した突発音情報を用いて突発音を抑制する。突発音情報更新処理では、抑制対象ではない音声成分が閾値以下となる非音声区間に入力された入力信号により突発音情報を更新する。
【0026】
そこで、
図2に実施の形態1にかかる雑音低減装置1の動作を示すフローチャートを示す。
図2において、ステップS1〜S9、S15が突発音抑制処理であり、ステップS10〜S14が突発音情報更新処理に該当する。ここで、実施の形態1にかかる雑音低減装置1における突発音抑制処理を具体的に説明するために、
図3に実施の形態1にかかる雑音低減装置に入力される入力信号の一例を示す。
図3に示すように、実施の形態1にかかる雑音低減装置1では、入力信号Dinが入力される。また、入力信号Dinには突発音が含まれる。そして、実施の形態1にかかる雑音低減装置1では、過去の解析フレームに含まれる突発音aを突発音情報として雑音低減装置1に記憶し、この突発音情報を用いて現在の解析対象フレームの突発音bを低減する。
【0027】
図2に示すように、実施の形態1にかかる雑音低減装置1では、処理を開始すると、まず、入力信号Ainを取得する(ステップS1)。そして、雑音低減装置1は、フレーム構成部11により、入力信号Ainをフレーム化して、入力信号Dinを生成する(ステップS2)。
【0028】
ここで、ステップS2のフレーム化処理における1フレームの時間について説明する。本実施の形態では検出対象の突発音として、消防士が用いる酸素ボンベに搭載された酸素残量が少なくなった際にマスク(レギュレーター)が振動し発生する周期的な打撃音を例に考える。この打撃性の突発音は最も音圧レベルが高いピーク位置を頂点とする立ち上がりから立ち下がりまで、約0.01secの時間幅を有する。この突発音の存在を検出するには、突発音の前後に突発音によるものではない音響信号分析区間を確保し、例えば振幅変化量やエネルギー変化量の推移を観察する必要がある。従って、0.01secの数倍分の時間幅、例えば0.03〜0.05secあれば、検出対象の突発音の存在を把握できることになる。そのため、1フレームの時間として規定する分析幅はこれらの値が望ましい。
【0029】
なお、フレームの区間は上記数値に限らず、システムに合わせて変更しても良い。物体と物体とが衝突して発する打撃音は、衝突する物体によって定まる限られた持続時間に集約され、ある範囲内に収まると考えられる。よって短期時間分析による分析幅(フレーム内サンプル数)は衝突によって発する突発音の持続時間の数倍分を確保すれば良い。
【0030】
続いて、実施の形態1にかかる雑音低減装置1は、突発音検出部13において入力信号Dinに突発音が含まれているか否かを判定する(ステップS3)。このステップS3の突発音検出処理における突発音検出方法は、様々な方法を用いることができるが、周期性の伴った突発音検出精度向上を図った本発明者による特願2013−145548に記載されたフレーム内の信号振幅のピーク位置及びピークの継続時間について現入力信号と過去の入力信号とで相関値を求める方法の採用が望ましい。
【0031】
このステップS3において、入力信号Dinに突発音が含まれていれば(ステップS4のYの枝)、突発音情報記憶部15に突発音情報があるか否かを判断する(ステップS5)。一方、ステップS3において、入力信号Dinに突発音がないと判断された場合(ステップS4のNの枝)、雑音低減装置1は、入力信号Dinをそのまま出力信号Soとして出力する(ステップS15)。
【0032】
ステップS5において、突発音情報記憶部15に突発音情報がない場合(ステップS5のNの枝)、雑音低減装置1は突発音情報更新処理を行う。加えて、突発音情報がない場合は、抑制に必要な加算信号を用意できないため、雑音低減装置1は、入力信号Dinをそのまま出力信号Soとして出力する(ステップS15)。一方、ステップS5において、突発音情報記憶部15に突発音情報がすでに記憶されている場合(ステップS5のYの枝)、雑音低減装置1はステップS6〜S9の処理を行う。
【0033】
ステップS6では、相関値算出部16により、突発音情報記憶部15に格納されている突発音情報と、現在の解析対象フレームである入力信号Dinとの相関値を算出する。この相関値は、例えば、上記(1)式に基づき算出する。
【0034】
ステップS7では、ステップS6の相関値算出処理で算出された相関値に基づき突発音情報記憶部15に記憶されている突発音情報と現入力信号Din中の突発音との位相差を算出して位相差情報を生成する。
【0035】
ここで、
図4に実施の形態1にかかる雑音低減装置における突発音情報と相関値との関係を説明する図を示し、位相差情報についてより詳細に説明する。雑音低減装置1では、まず、相関値算出部16が、解析対象フレーム(現入力信号Din)に対して、相関値算出開始位置から相関値算出終了位置まで、記憶している突発音情報をシフトさせながら相関値を求める。このとき、現入力信号Dinに突発音が含まれている場合、
図4の相関値算出結果に示すように、突発音情報と現入力信号Din中の突発音とが重なる位置で相関値が大きくなる。つまり、相関値のピーク位置が最も高くなる位置まで突発音情報を位相差分シフトした後に符号反転して加算処理を行う場合が、突発音の信号成分を最も効率よく抑制できる。そこで、位相差算出部17は、相関値のピークまでの距離(例えば、サンプル数)を算出し、これを位相差情報として加算信号生成部18に出力する。
【0036】
なお、解析対象フレームの突発音と突発音情報の位相合わせが不十分な場合、逆に振幅が増加してしまい雑音レベルが増加、または新しい雑音が付加されてしまう可能性がある。そのため、この位相差情報の精度は突発音抑制能力に大きく関わる。
【0037】
続いて、ステップS8では、加算信号生成部18による加算信号生成処理を行う。この加算信号生成処理の一例を詳細に説明する。そこで、まず、
図4を参照する。
図4に示すように、現入力信号Din中の突発音を最も効率良く抑制するためには、突発音情報を位相差情報に基づきずらした位置にシフトさせる必要がある。そこで、加算信号生成部18では、(2)式に基づき突発音情報の位相をシフトさせる。
【数2】
(2)式において、Bは加算信号であり、xは記憶している突発音情報であり、iは1フレーム中のサンプル番号であり、sは位相差情報であり、tは突発音情報中のサンプル総数である。つまり、加算信号生成部18は、位相差情報により示される位置まで突発音情報をシフトさせ、かつ、突発音情報を反転することで加算信号を生成する。なお、実施の形態1にかかる雑音低減装置の突発音情報と突発音情報を反転させた加算信号との関係を説明する図を
図5に示す。
図5では、上段に突発音情報を示し、下段に加算信号を示した。
図5に示すように、突発音信号と加算信号は互いに反転する関係を有する。
【0038】
なお、加算信号生成部18は、位相差情報に基づいたシフト量から指定される解析対象フレーム内の入力信号の該当箇所に対し、記憶した突発音情報の符号反転信号、すなわち加算信号を加算してもよい。
【0039】
ステップS9では、突発音抑制部19によって、入力信号と加算信号の加算処理、つまり、突発音抑制処理が行われる。これにより、現入力信号Dinに含まれている突発音が抑制された出力信号が生成されるが、雑音低減装置1では、このステップS9に続いて突発音情報の更新処理が行われる。
【0040】
突発音情報の更新処理では、まず、音声判定部12により音声区間判定処理を行う(ステップS10)。ステップS10の音声区間判定処理の方法は、様々な方法が利用可能であるが、発明者らがすでに出願している特開2012−128411号公報に記載されている入力信号のスペクトル成分に基づく音声信号成分の判定方法等を利用することができる。このステップS10では、現入力信号Dinに音声が含まれていれば、音声判定部12が音声区間と判断して音声判定信号をディスイネーブル状態とする(ステップS11のNの枝)。音声判定信号がディスイネーブル状態である場合、突発音更新判定部14は、突発音情報記憶部15に記憶されている突発音情報を維持する。
【0041】
一方、ステップS10において、現入力信号Dinに予め設定した閾値以上の振幅の音声が含まれていなければ、音声判定部12が雑音区間と判断して音声判定信号をイネーブル状態とする(ステップS11のYの枝)。これにより、音声判定信号と突発音検出信号とが共にイネーブル状態となるため、突発音更新判定部14は、突発音更新判定処理において、突発音を更新すると判定する(ステップS13のYの枝)。
【0042】
ここで、突発音情報として記憶する情報について詳細に説明する。
図6に実施の形態1にかかる雑音低減装置の突発音情報として記憶する入力信号の範囲を説明する図を示す。実施の形態1にかかる雑音低減装置1では、突発音のみを低減するために、
図6に示す突発音のリファレンス記憶区間のみを記憶する。
図6に示すように、突発音は、突発的に振幅が増幅し、時間と共に減衰していき、リファレンス記憶区間を過ぎると通常の信号レベルに戻るという特徴を有する。よって、リファレンス記憶区間は、突発音のピーク位置(最大値)を検出し、そのピーク位置を基準とした数サンプル前方、及び、後方から突発音の所定区間分のサンプルを設定すればよい。
【0043】
そして、突発音更新処理では、突発音更新判定部14が、突発音情報記憶部15に現入力信号Dinにより、突発音情報を更新することを指示して、突発音情報記憶部15は記憶している情報を現入力信号Dinにより更新する。そして、ステップS14までの処理が終了したことに応じて、雑音低減装置1は、出力信号Soを出力する(ステップS15)。
【0044】
ここで、上記ステップS12の突発音更新判定処理における誤判定を回避する方法について説明する。音響信号を収音する使用環境によっては、音声と突発音以外にも様々な背景雑音が混入される。そのため、ステップS10の音声区間判定処理において音声が含まれているにも関わらず、当該音声が雑音であると誤判定を起こす可能性がある。誤判定を起こした状態で参照信号が更新された場合、突発音情報に音声が混入してしまうため、弊害が生じる。また、一般的に発話による音声信号の先頭部分及び終わりの部分は音声として認識することが困難であり、誤判定を起こす可能性が高い。入力信号Dinを所定の解析時間を有するフレームに区切って生成することで、発話による音声信号がフレーム間で分断されることは頻繁に起きることが予想される。そこで、以上のような音声区間の誤判定の影響を回避するための方法を説明する。
【0045】
実施の形態1における突発音情報を記憶する方法を、
図7を参照して説明する。
図7は、実施の形態1にかかる雑音低減装置における突発音情報の更新処理を説明する図である。
図7の上図は音声及び突発音が含まれた音響信号であり、
図7の下図は音声区間判定結果を表示した図である。音声区間判定の結果は1が音声区間を示し、0が雑音区間を示している。実施の形態1では、突発音情報記憶部15に記憶する突発音情報に音声が混入しないようにするため、雑音(突発音)区間が数フレーム継続した場合に参照信号を更新する。雑音区間aは所定フレーム数継続しているため、突発音情報を更新する。一方、音声区間aでは音声の立ち上がりを音声として認識できていないため、音声区間a直前の突発音を記憶すると音声が混入してしまう可能性がある。そこで、音声区間aの直前ではなく、所定フレーム前の入力信号Dinを突発音情報aとして記憶又は更新する。続いて、音声区間aでは音声が混入されてしまうため、記憶又は更新を行わない。雑音区間bでは雑音区間が短く、突発音のみである信頼性が低いため、記憶又は更新を行わない。音声区間bでは音声が混入されてしまうため、記憶又は更新を行わない。雑音区間cでは雑音(突発音)区間が所定フレーム数継続しているため、音声区間cの数フレーム前の入力信号Dinを突発音信号bとして記憶する。音声区間cでは音声が混入されてしまうため、記憶又は更新を行わない。
【0046】
以上のように、実施の形態1では、
図7に示すように、突発音情報に音声が混入しないようにする為、雑音区間が所定フレーム継続した場合に、音声信号の立ち上がり又は立ち下がり部分を除く位置にある突発音を突発音情報として記憶する。
【0047】
また、実施の形態1では、突発音情報記憶部15に記憶する突発音情報を随時更新していく。解析対象フレームと比較して古い突発音を参照信号として使用すると、周囲の環境変化により相関性が十分に確保されない懸念があり、例え相関値のピーク位置を検出し解析対象フレームの突発音との位相ずれを吸収したとしても、生成された突発音低減用の加算信号が効果的に解析対象の突発音を抑制できない場合がある。よって、突発音情報は、音声信号が含まれる可能性が極めて低いと判定された場合に随時更新し、時間的に新しい参照音を確保する。
【0048】
上記説明より、実施の形態1にかかる雑音低減装置1では、突発音情報記憶部15に現入力信号の前に入力された入力信号のうち音声が予め設定した閾値以下、かつ、抑制対象の突発音を含む入力信号を突発音情報として記憶する。そして、雑音低減装置1は、この突発音情報に基づき現入力信号Dinに含まれる突発音を抑制する。これにより、実施の形態1にかかる雑音低減装置1は、音声の劣化を防止しながら、突発音を抑制することができる。
【0049】
より具体的には、実施の形態1にかかる雑音低減装置1では、過去の入力信号のうち音声を含まない入力信号から突発音情報を生成し、この突発音情報を反転した加算信号を現入力信号Dinに加算することで突発音を抑制する。そのため、雑音低減装置1では、音声信号が抑圧されることがなく、音声の明瞭度を維持しながら突発音のみを抑制することができる。
【0050】
また、雑音低減処理の代表的手法として、適応フィルタを用いた適応雑音低減処理が広く知られている。この適応フィルタは、フィルタの特性を逐次修正しながら環境変化に合わせて変化させる適応性があるため、環境に応じた最適性を常に保持できるという特徴を持つ。適応フィルタを用いた雑音低減処理では、この特徴を利用してその場所、その時間によって変化する雑音成分だけをカットするように、その場に応じたフィルタ係数を、フィルタを動作させながら逐次変化、適応させて周辺雑音を低減することができる。しかしながら、周期的な突発音などを低減する際に上述した適応フィルタによる雑音低減処理を行うと、適応雑音低減処理を周期的な突発性雑音に対しても、適応信号処理回路(適応フィルタ回路)を常時動作させることになるため、適応信号処理回路のタップ数が多くなり、適応信号処理回路の回路規模が大きくなる問題がある。
【0051】
一方、実施の形態1にかかる雑音低減装置1では、抑制対象の突発音と、この突発音に近い突発音情報の反転信号とを加算するのみであるため、適応フィルタを用いた手法に比べて大幅に回路規模を小さくすることができる。
【0052】
実施の形態2
実施の形態2では、実施の形態1にかかる雑音低減装置1の別の形態となる雑音低減装置2について説明する。まず、実施の形態2にかかる雑音低減装置2で扱う突発音について説明する。そこで、
図8に実施の形態2にかかる雑音低減装置2で扱う入力信号を説明する図を示す。
図8に示すように、実施の形態2にかかる雑音低減装置2では、フレームを跨がって突発音が存在する。実施の形態2にかかる雑音低減装置2では、
図8に示すようなフレーム間を跨がって位置する突発音を抑制する。そこで、実施の形態2にかかる雑音低減装置2のブロック図を
図9に示す。なお、実施の形態2の説明では、実施の形態1で説明した構成と同じ構成については、実施の形態1と同じ符号を付して説明を省略する。
【0053】
図9に示すように、実施の形態2にかかる雑音低減装置2は、実施の形態1にかかる雑音低減装置1に突発音位置判定部20を追加し、突発音抑制部19を加算制御部21に置き換えたものである。加算制御部21は、突発音抑制部に相当するものである。
【0054】
突発音位置判定部20は、突発音が、現入力信号の1つ前の処理サイクルで入力される前入力信号との間に跨がって位置するか否かを判定する。加算制御部21は、突発音が現入力信号と前入力信号とに跨がって位置することが突発音位置判定部20により検出された場合、前入力信号及び現入力信号に対して加算信号を適用した突発音の抑制処理を施して前入力信号に対応する出力信号Soを出力する。また、加算制御部21は、突発音が現入力信号と前入力信号とに跨がって位置することが突発音位置判定部20により検出された場合、現入力信号が抑制処理済みであることを示す抑制処理済みフラグを有効状態とする。
【0055】
なお、実施の形態2にかかる雑音低減装置2では、フレーム間を跨ぐ位置にある突発音を含めて抑制対象とするため、フレーム構成部11は、時間的に前後する2つのフレームを1つのデータとして出力する。そこで、実施の形態2で扱う処理対象フレームを説明する図を
図10に示す。実施の形態2にかかるフレーム構成部11では、フレーム1、2を1つの解析対象フレームaとして出力し、その後、フレーム3を生成したことに応じてフレーム2、3を1つの解析対象フレームbとして出力する。なお、解析対象フレームbに続く解析対象フレームcにはフレーム3、4が含まれる。また、以下の説明では、
図9の解析対象フレームaを例とすると、時間的に前に入力されるフレーム1(前半フレーム)を前入力信号、フレーム1の1つ後に入力されるフレーム2(後半フレーム)を現入力信号と表現する。
【0056】
また、音声判定部12は、入力された2フレームの信号を用いて音声の有無を判定する。突発音検出部13は、入力された2フレームを1つの入力信号として突発音を検出する。
【0057】
突発音更新判定部14は、突発音がフレームを跨がずに存在する場合は、入力信号の前半フレームの音声判定信号に応じて突発音情報の更新の可否を判定する。一方、突発音更新判定部14は、突発音がフレームを跨いで存在する場合は、解析対象フレームaの処理の時点では突発音情報の更新を保留し、解析対象フレームbが入力されたことに応じて解析対象フレームaの後半フレームの音声信号の有無が判定された後に突発音情報の更新の可否を判定する。つまり、実施の形態2では、突発音更新判定部14は、突発音位置判定部20により現入力信号と前入力信号との間に跨がって突発音が存在すると判定され、かつ、現入力信号と前入力信号のいずれにも音声が含まれていないと判断された場合に、現入力信号と前入力信号により突発音情報を更新する。一方、突発音更新判定部14は、突発音位置判定部20により現入力信号と前入力信号との間に跨がらずに前入力信号に突発音が存在すると判定され、前入力信号に音声が含まれていないと判断された場合、突発音情報を前入力信号により更新する。
【0058】
また、相関値算出部16、位相差算出部17、及び、加算信号生成部18は、突発音が現入力信号と前入力信号とに跨がって位置することが突発音位置判定部20により検出された場合、現入力信号と前入力信号とを1つの入力信号として加算信号を生成する。
【0059】
続いて、実施の形態2にかかる雑音低減装置2の動作について説明する。そこで、まず、実施の形態2にかかる雑音低減装置2が特に有効な突発音に対する抑制処理を説明する図を
図11に示す。
図11に示すように、実施の形態2にかかる雑音低減装置2では、フレーム間に跨がって位置する突発音を有効に抑制する。そのための処理を説明するために、
図12に実施の形態2にかかる雑音低減装置の動作を示すフローチャートを示す。なお、実施の形態2においても
図12に示した処理は、解析対象フレームが入力される毎に行われる。また、本フレームチャートでは2フレーム処理による抑制処理方法の説明を明確にするため、
図9に相当する音声判定部の処理を省略した内容にて記載した。音声が混入する場合は、
図2のフレームチャート同様の処理を
図12に追加すれば良い。
【0060】
図12に示すように、実施の形態2にかかる雑音低減装置2は、まず、入力信号Ainを取得する(ステップS20)。そして、雑音低減装置2は、フレーム構成部11により、入力信号Ainをフレーム化して、入力信号Dinを生成する(ステップS21)。このステップS21では、2つのフレームが含まれる長さの入力信号Dinを生成する。
【0061】
そして、雑音低減装置2は、加算制御部21の抑制処理済みフラグが有効であるか無効であるかを判断する(ステップS22)。このステップS22において、抑制処理済みフラグが有効と判断された場合(ステップS22のNの枝)、加算制御部22で保存している1つ前の処理で処理した解析対象フレームの後半フレーム(現解析対象フレームでは前半フレームに相当)の保存データを出力する(ステップS26)。このステップS26の後は、抑制処理済みのフレームは存在しないため、抑制処理済フラグを無効とする(ステップS27)。
【0062】
一方、ステップS22において、抑制処理済みフラグが無効と判断された場合(ステップS22のYの枝)、突発音検出処理を行う(ステップS23)。このステップS23の処理では、解析対象フレームの全体に対して突発音の検出を行う。そして、ステップS23において、前半フレームに突発音がないと判断された場合(ステップS24のNの枝)、現在の解析対象フレームの前半フレームに相当する前入力信号を出力する(ステップS28)。そして、ステップS28の後では、処理対象フレームの後半フレーム(現入力信号)については突発音抑制処理が完了していないため、加算制御部21の抑制処理済みフラグを無効にする(ステップS29)。
【0063】
ステップS23において、前半フレームに突発音があると判断された場合(ステップS24のYの枝)、現在の解析対象フレームに含まれる2つのフレームに跨がって突発音が存在しているかを突発音位置判定部20により判断する(ステップS25)。このステップS25では、検出した突発音のピークの位置と突発音を形成する前後の立ち上がり及び立ち下り区間とフレーム化する単位であるフレーム長とから、跨って存在するか否かを判断する。
【0064】
そして、ステップS25において、フレームを跨いで突発音が存在すると判断された場合(ステップS25のYの枝)、フレーム間突発音抑制処理を行う(ステップS30)。一方、ステップS25において、フレームを跨いで存在する突発音がないと判断された場合(ステップS25のNの枝)、解析対象フレームの前半フレーム(前入力信号)に対して前半フレーム突発音抑制処理を行う(ステップS31)。
【0065】
ここで、ステップS30のフレーム間突発音処理についてより詳細に説明を行う。そこで、
図13に実施の形態2にかかる雑音低減装置のフレーム間突発音抑制処理の動作を示すフローチャートを示す。
【0066】
図13に示すように、雑音低減装置2は、フレーム間突発音抑制処理を開始するに当たって、まず、突発音位置判定部20により相関値算出部16の抑制対象処理ブロックを2フレームに設定する(ステップS40)。続いて、2フレームを1つの処理対象フレームとして、
図2のステップS6〜ステップS9に対応する処理として、相関値算出処理(ステップS41)、位相差算出処理(ステップS42)、加算信号生成処理(ステップS43)、突発音抑制処理(ステップS44)を行う。
【0067】
続いて、フレーム間突発音抑制処理では、処理対象フレームの後半フレーム(現入力信号)についても突発音抑制処理が完了するため、加算制御部21の抑制処理済みフラグを有効にする(ステップS45)。そして、雑音低減装置2は、処理対象フレームの前半フレーム(前入力信号)を出力信号Soとして出力し、後半フレームについては保存する(ステップS46)。
【0068】
続いて、ステップS31の前半フレーム突発音処理についてより詳細に説明を行う。そこで、
図14に実施の形態2にかかる雑音低減装置の前半フレーム突発音抑制処理の動作を示すフローチャートを示す。
【0069】
図14に示すように、雑音低減装置2は、前半フレーム突発音抑制処理を開始するに当たって、まず、突発音位置判定部20により相関値算出部16の抑制対象処理ブロックを前半フレームに設定する(ステップS50)。続いて、前半フレームを1つの処理対象フレームとして、
図2のステップS6〜ステップS9に対応する処理に相当する、相関値算出処理(ステップS51)、位相差算出処理(ステップS52)、加算信号生成処理(ステップS53)、突発音抑制処理(ステップS54)を行う。
【0070】
続いて、前半フレーム突発音抑制処理では、処理対象フレームの後半フレーム(現入力信号)については突発音抑制処理が完了していないため、加算制御部21の抑制処理済みフラグを無効にする(ステップS55)。そして、雑音低減装置2は、処理対象フレームの前半フレーム(前入力信号)を出力信号Soとして出力する(ステップS56)。
【0071】
なお、音声成分の影響を加味するため、音声判定部を追加する場合は、処理するフレーム長と一致する入力信号にて音声区間判定処理を実施する。具体的には、
図13のフレーム間突発音抑制処理の場合は、前半フレーム及び後半フレームを対象とする音声区間判定を行う。また、
図14の前半フレーム突発音抑制処理の場合は、前半フレームを対象とする音声区間判定を行う。この結果、解析対象フレームにおける音声成分の有無に基づき、使用する突発音情報を的確に選択及び更新することが可能である。
【0072】
上記説明より、実施の形態2にかかる雑音低減装置2では、フレーム間に跨がって突発音が存在する場合においても、時間的に連続する2つのフレームを処理対象フレームとすることで、突発音の抑制を行うことができる。
【0073】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。