(58)【調査した分野】(Int.Cl.,DB名)
所定の前記参照信号と、前記第1の信号に含まれる前記突発音と、の位相差を算出する位相差調整部を備えることを特徴とする請求項1から請求項3のいずれか1項に記載の雑音低減装置。
前記位相差に基づいて前記参照信号の位相を調整し、前記第1の信号に加算すべき加算信号を生成する加算信号作成部を備えることを特徴とする請求項4に記載の雑音低減装置。
【背景技術】
【0002】
従来、携帯電話や無線機等をはじめとする移動体通信機器等を使用して音声通信を行う際、本来の目的音である音声に、周りの環境から生ずる周辺雑音が混入し、受話側で音声が聞き取り難くなってしまうという問題があった。そこで、音声の明りょう性を確保するための手法として、雑音低減処理が広く利用されている。雑音低減処理の代表的手法としては、適応フィルタを用いた適応雑音低減処理がある。適応フィルタは、雑音を低減するためのフィルタの特性を、環境変化に合わせて逐次変化させる、すなわち環境に対する適応性を有するという特徴を持つ。つまり、場所や時間によって変化する雑音成分だけをカットするように、フィルタを動作させながら、その場所や時間に応じてフィルタ係数を逐次変化させることで、環境に適応させて、周辺雑音を低減している。
【0003】
周辺雑音には様々な種類が存在する。例えば、消防士が火災現場で活動する時に担ぐ酸素ボンベには、タンク内容量が所定値以下となった場合、バイブレーション音により装着者へ警告を発する機能がある。また、工事現場では、地盤圧縮機の動作音が発生する。このようなバイブレーション音や動作音は、いずれも持続性、周期性のある突発音である。かかる突発音が発生している状態で無線機等を使用すると、突発音が音声と共に無線機等に入り込んでしまい、受話側では音声が非常に聞き取り難くなってしまう。
【0004】
このような持続的、周期的な突発音を低減するために上述の適応雑音低減処理を用いようとすると、適応信号処理回路(適応フィルタ回路)を常時動作させる必要が生じ、当該回路のタップ数が多くなり、回路規模が大きくなってしまう。
【0005】
この点、特許文献1は、カメラ一体型VTRのレンズ可動部から発生する雑音、ヘッドが磁気テープに対して接したり離れたりする時の雑音、銀塩フィルムカメラ機能を持ったカメラ一体型VTRでの光学シャッターの音、回転型記憶媒体に記録する際に発生するヘッドシーク時などの突発音を減少させる手法を開示している。具体的には、当該手法は、突発音の発生区間のみ信号を遮断し、遮断区間の欠落した情報を前後少なくとも一方の音声信号に基づいて補間するものである。
【0006】
特許文献2記載の手法は、突発性雑音の含まれた信号の包絡線を算出し、突発性雑音の信号成分を抽出して、突発性雑音の含まれた信号から突発性雑音の信号成分のみを低減するものである。
【発明を実施するための形態】
【0017】
以下に図面を参照しながら、本発明の好適な実施形態を説明する。かかる実施形態に示す具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0018】
まず、実施の形態1にかかる雑音低減装置1000の構成について、
図1を用いて説明する。なお、本実施の形態では、低減の対象となる雑音として、持続性及び周期性のある突発音を想定する(
図4参照)。突発音の例としては、酸素ボンベのタンク内容量が所定値以下となった場合に装着者への警告のために作動するバイブレーション音等がある。
【0019】
雑音低減装置1000は、主に音声を収音する信号入力マイクロフォン100、主に突発音を収音する信号入力マイクロフォン200、突発音検出部300、突発音更新部400、突発音情報記憶部500、相関値算出部600、位相差調整部700、加算信号作成部800、及び加算器900を含む。
【0020】
雑音低減装置1000は、例えば携帯電話や無線機等の移動体通信機器である。雑音低減装置1000は、中央演算処理装置(CPU)、記憶装置、入出力装置及び通信装置等を含み、CPUが記憶装置からプログラムを読み出して実行することにより、後述の様々な構成要素を論理的に実現する。
【0021】
信号入力マイクロフォン100は、主に音声を収音するマイクロフォンである。信号入力マイクロフォン100は、入力された信号S1を突発音検出部300に出力する。
【0022】
信号入力マイクロフォン200は、主に突発音を収音するマイクロフォンである。信号入力マイクロフォン200は、入力された信号S2を突発音検出部300に出力する。
【0023】
ここで、2つのマイクロフォンの配置に関して
図2を用いて説明する。
図2左図は雑音低減装置1000としての無線機を正面から見た図である。
図2右図は当該無線機を上面から見た図である。無線機の表面には、音声を収音するための信号入力マイクロフォン100を配置し、信号入力マイクロフォン100の反対位置である無線機の裏面に、音声以外の音を収音するための信号入力マイクロフォン200を配置する。かかる構成により、信号入力マイクロフォン200から入力される信号について、音声の影響を抑制することができる。なお、本発明は
図2の構成に限定されるものでなく、信号入力マイクロフォン200から出力される信号への音声の影響が低減できれば、信号入力マイクロフォン100及び信号入力マイクロフォン200はいかなる位置に配置されても良い。
【0024】
突発音検出部300は、信号S1及びS2から、検出対象である周期性を伴った突発音を検出し、当該突発音の有無情報と、当該突発音の位置情報と、を突発音更新部400に出力する。また、突発音検出部300は、信号S2から検出した突発音の位置情報を、相関値算出部600にも出力する。
【0025】
突発音更新部400は、突発音検出部300から入力された信号S1及びS2の突発音の有無情報と、突発音の位置情報とから参照信号の検出を試行し、参照信号を記憶すべきか否かを判定する。参照信号とは、信号S1及びS2から検出される突発音であって、信号S1に含まれる突発音を低減する為に用いられる信号をいう。突発音更新部400は、参照信号を記憶すべきか否かの判定結果を基に、参照信号を突発音情報記憶部500に送信する。
【0026】
突発音情報記憶部500は、突発音更新部400から参照信号を受信する。突発音情報記憶部500は、参照信号を新たに記憶、または既に記憶している参照信号を更新する。参照信号として記憶する突発音は複数個記憶し、記憶数が所定数を上回る場合には、古い参照信号から順に破棄して新たな参照信号を記憶することが好ましい。参照信号を記憶しない場合は、既に記憶している参照信号をそのまま保持する。突発音情報記憶部500は、記憶している参照信号を、相関値算出部600、位相差調整部700、加算信号作成部800に出力する。
【0027】
相関値算出部600は、突発音検出部300から入力された突発音の位置情報に基づいて、突発音情報記憶部500から入力された参照信号と、信号S1から検出された突発音と、の相関値を求める。相関値は、突発音情報記憶部500に記憶されている参照信号それぞれについて、すなわち参照信号の数だけ求め、最も相関が高い参照信号とその相関値とを位相差調整部700に出力する。
【0028】
位相差調整部700は、相関値算出部600から入力された最も相関が高い参照信号、及び相関値に基づいて、信号S1の突発音と、最も相関が高い参照信号と、の位相差を算出し、加算信号作成部800に出力する。
【0029】
加算信号作成部800は、位相差調整部700から入力された位相差情報を基に、突発音情報記憶部500から入力された参照信号と、信号S1の突発音と、の位相を合わせる処理を行い、信号S1から突発音を除去する為の加算信号を作成して、加算器900に出力する。
【0030】
加算器900は、加算信号作成部800から入力された加算信号を信号S1の突発音に足し合わせることで突発音を除去する。加算器900は、加算器を通じ、信号S1から突発音を除去した信号を出力する。
【0031】
上記構成により、雑音低減装置1000は、入力信号から周期性のある突発音を検出、除去する。これにより、音声信号の劣化を防ぎつつ突発音による聞き取り難さを改善することが可能となる。
【0032】
次に、
図3のフローチャートを用いて、雑音低減装置1000の動作について説明する。
【0033】
St1:
信号入力マイクロフォン100及び信号入力マイクロフォン200が、信号S1及び信号S2を収音し、突発音検出部300に出力する。
【0034】
St2:
突発音検出部300は、信号入力マイクロフォン100及び信号入力マイクロフォン200から信号S1及びS2をそれぞれ受信する。突発音検出部300は、信号S1及びS2それぞれを対象として、周期性を伴った突発音の検出を行う。周期性を伴った突発音の検出手法は任意の公知の手法を採用し得るが、例えば特開2015−018113に記載の手法が好ましい。この手法を採用した場合、突発音検出部300は、入力された信号S1又は信号S2を所定時間幅のフレームに区切り、フレーム毎に突発音の検出および検出された突発音の周期性を判定することにより周期性を伴った突発音を検出する。突発音検出部300は、突発音を、信号S1又は信号S2の波形信号のピークにおける継続時間およびピークの変化量を用いて検出する。突発音検出部300は、突発音の周期性を、概形モデル化した突発音の波形における自己相関値および波形の時間幅の等間隔性により判定する。突発音検出部300は、周期性を伴った突発音の検出結果として、突発音の有無情報と、突発音の位置情報とを突発音更新部400に出力する。
【0035】
St3:
St2において信号S2に周期性を伴った突発音が検出された場合は、St4に進む。信号S2に周期性を伴った突発音が検出されなかった場合は、信号S1から突発音を除去する必要性がなく、参照信号として記憶すべき情報もないため、St12に進む。この判定は、例えば突発音更新部400が実施できる。
【0036】
ここで、
図4を用いて、信号S2にかかる突発音の検出結果を用いて上記判定を実施する意義について説明する。
図4に、信号S1の振幅と突発音検出位置の対応関係、及び信号S2の振幅と突発音検出位置の対応関係を示す。信号S1では、突発音よりも音声信号のほうが強い音声区間が存在するため、突発音の位置が明確に検出できず、検出位置がずれている個所や、検出できていない箇所が見受けられる。これは、信号S1に対して特開2015−018113記載の突発音の検出手法を適用しても、音声が重なる区間では振幅値継続時間の判定における突発音の条件に当てはまらない場合や、適切な相関が取得できない場合があり、正確に突発音の位置を特定できないためである。これに対し、信号S2では、音声区間においても音声信号が突発音よりも弱いため、突発音を明確に認識でき、突発音の位置を正確に検出できる。よって、信号S2にかかる突発音の検出結果を用いることで、音声信号が入力されている場合でも正確な判定が可能となるのである。
【0037】
St4:
突発音更新部400が、突発音情報記憶部500に参照信号が既に記憶されているかどうかを判定する。記憶されている場合はSt5に進む。記憶されていない場合は、信号S1から突発音を除去する処理を実施することができないので、St9に進む。
【0038】
この判定の意義について説明する。本実施の形態にかかる雑音低減装置1000は、St2で検出した突発音を参照信号として記憶しておき、この参照信号を利用して、将来発生する突発音を除去する処理を行う。換言すれば、過去に検出した突発音を参照信号として記憶されている場合に、その参照信号を利用して、現在の信号S1に含まれている突発音を除去する処理を行う(
図5)。そのため、参照信号の存在の有無に応じて、信号S1から突発音を除去する処理の実行可否を判断している。なお、参照信号となる突発音を記憶する処理については後述する。
【0039】
St5:
相関値算出部600が、St2において信号S1から検出された突発音と、突発音情報記憶部500に既に記憶されている参照信号と、の相関値を式1により求める。
ここで、A:相関値、y:解析対象フレーム信号、x:記憶している参照信号、t:解析区間(参照信号のサンプル数)、m:シフト量(位相差成分)である。
【0040】
相関値算出部600は、突発音情報記憶部500が記憶している参照信号が複数個ある場合は、参照信号の個数分の相関値を算出し、最も相関の良い(値の大きい)相関値と、その参照信号と、を位相差調整部700に出力する。なお、突発音情報記憶部500に含まれる参照信号の数は限定されず、任意に決定し得る。
【0041】
ここで、参照信号を複数個記憶する意義について説明する。無線機などの移動体通信機器で音声通信を行う場合、音声帯域や処理量削減の点から、サンプリングレートをなるべく抑制することが一般的である。更に、無線機に入力される突発音も、突発音を発生させるマスクの劣化や無線機使用者の手ブレなどの影響で、常に一定であるとは限らない。そのため、参照信号となる過去の1つの突発音と、現在の入力信号に含まれる突発音との間には位相のずれが生じる可能性が大きい。そこで、本実施の形態では参照信号を複数保持し、複数の参照信号のうち、解析対象の突発音との間で最も相関の高い参照信号を1つ選択することとした。これにより、低サンプリングレートの場合や突発音が一定でない場合でも両者の位相ずれが生じにくく、突発音を安定して除去することができる。
【0042】
St6:
位相差調整部700は、現在の突発音、すなわち信号S1に含まれる突発音と、St5で出力された参照信号と、の位相差を算出する。
【0043】
この処理の意義について説明する。本実施の形態にかかる雑音低減装置1000は、現在の突発音、すなわち信号S1に含まれる突発音に対して、突発音情報記憶部500が記憶している参照信号の逆位相信号を加算することで、信号S1に含まれる突発音を除去する。よって、信号S1に含まれる突発音と、参照信号と、の位相合わせが不十分な場合、信号S1に含まれる突発音と、参照信号の逆位相信号と、を加算すると振幅が増加し、雑音レベルの増加や新たな雑音の付加等の事象が発生する可能性がある。かかる事象を防ぐため、それぞれの信号の相互相関値を利用して最も相関の高い位置を把握し、位相合わせを実施する。
【0044】
図6に、現在の突発音(信号S1に含まれる突発音)と、突発音情報記憶部500が記憶している参照信号と、相関値の関係性を示す。現在の突発音に対して、相関値算出開始位置から相関値算出終了位置まで、記憶している突発音の参照信号をシフトさせながら相関値を求めた結果が相関値算出結果である。相関値算出開始位置は現在の突発音検出位置の数サンプル前からで良いがこれに限らない。相関値算出終了位置に関しても突発音検出位置の数サンプル後ろまでで良いがこれに限らない。
【0045】
相関値算出結果によれば、解析対象フレーム(信号S1)の突発音と、参照信号と、が重なる時に相関値のピークが立っていることがわかる。このピークにおける位置が最も相関が高く、位相が合致する位置である。位相差調整部700は、time=0における位置からピークにおける位置までの距離(サンプル数)を算出し、これを位相差を示す位相差情報として加算信号作成部800に出力する。後述の処理において、加算信号作成部800が参照信号を上記位相差分シフトした後に符号反転し、信号S1の突発音に加算することで、信号S1の突発音成分を抑えることができる。
【0046】
St7:
加算信号作成部800は、信号S1の突発音を除去するための加算信号を作成する。加算信号作成部800は、位相差調整部700からから入力された位相差情報に基づいて、参照信号を位相差分シフトさせる。これにより、信号S1の突発音と、参照信号と、の位相が合致する(
図6)。
【0047】
具体的には、加算信号作成部800は、式2を用いることにより、参照信号の位相を反転させて加算信号を作成できる。
B[i] = −(x[i]) (i = 0 〜 t) ・・・(2)
ここで、B:加算信号、x:参照信号、i:サンプル数、t:参照信号サンプル数である。
【0048】
St8:
加算器900が、加算信号作成部800から入力された加算信号と、信号S1の突発音とを加算する。これにより、信号S1から突発音が除去される。
【0049】
なお、本実施の形態では、参照信号の位相を反転した信号を加算することで信号S1の突発音を除去する例を示した、本発明はこれに限定されるものでない。例えば、状況に応じて突発音の除去量を調整するように、参照信号又は加算信号に重み付けを行っても良い。あるいは、参照信号の位相の反転を行わずに、解析対象フレームの突発音から参照信号を減算することで突発音を除去しても良い。これにより、位相反転処理にかかる計算量を削減することが可能である。
【0050】
St9:
突発音更新部400は、St2において信号S1及びS2から検出した突発音を、参照信号として突発音情報記憶部500に記憶するか否を判定する。
【0051】
この判定処理の意義について説明する。雑音低減装置1000は、予め記憶した参照信号を用いて、信号S1に含まれる突発音を除去することで、音声を明瞭化する。もし参照信号に音声が混入していると、信号S1から音声も一緒に除去したり、除去後の信号にエコー感が残ったりすることで、聞き難い音声が生成されてしまうことがある。したがって、参照信号には音声が混入していないことが望ましい。
【0052】
St3において説明したように、信号S1を用いて突発音の検出を行うと、音声区間については正確に突発音を検出することができない。しかし、音声区間でない区間では正確に突発音の検出を行うことできる。また、信号S2を用いて突発音の検出を行うと、音声区間の影響を受けにくく全区間で正確に突発音を検出することができる(
図4)。したがって、信号S2で検出した突発音の位置と、信号S1で検出した突発音の位置と、が一致していた場合は、高い信憑性で突発音であると判断できる。本実施の形態では、突発音更新部400が、信号S1と信号S2とで突発音の位置が一致した否かを判断し、一致した場合、つまり突発音であると判断した場合に、突発音更新部400は、信号S1の突発音を、参照信号として突発音情報記憶部500に記憶させる。これにより、突発音情報記憶部500は正確な突発音を参照信号として記憶することができる。
【0053】
また、本実施の形態では、突発音更新部400は参照信号を突発音情報記憶部500に対して随時更新させていく。これは、現在の信号S1に含まれる突発音、すなわち除去したい突発音に対し、比較的古い突発音を参照信号として使用すると、周囲の環境変化により両者の相関性が十分に確保されない懸念があるためである。例えば、現在の突発音と参照信号との位相ずれを補正してもなお、生成された加算信号が効果的に現在の突発音を抑制できない場合が生じうる。よって、突発音更新部400は、参照信号を随時更新させることで、突発音情報記憶部500はより新しい参照信号を確保する。
【0054】
St10:
St9において参照信号を記憶すると判定された場合、St11に進む。参照信号を記憶しないと判定された場合は、参照信号の記憶を行わずSt12に進む。この分岐制御は、突発音更新部400が実施できる。
【0055】
St11:
参照信号を記憶する場合、突発音更新部400は、信号S1から検出された突発音を、突発音情報記憶部500に記憶させる。突発音情報記憶部500は、所定数の参照信号を記憶できる。突発音更新部400は、突発音情報記憶部500が既に所定数の参照信号を記憶している場合には、最も古い参照信号を破棄し、信号S1から検出された最新の参照信号を新たに記憶させる。例えば、突発音情報記憶部500が2個分の参照信号を記憶でき、既に2個の参照信号を記憶している場合、突発音更新部400は、記憶されている参照信号のうち古いほうを、信号S1から抽出した最新の参照信号で上書きするなお、突発音情報記憶部500が所定数以下の参照信号しか記憶していない場合には、信号S1から検出された最新の参照信号を単に追加する。
【0056】
ここで、
図7を用いて、突発音情報記憶部500に参照信号として記憶させる突発音について説明する。
図7は、突発音を含む信号S1を示す。参照信号は突発音のみを除去することを目的としてする信号であるので、ここでは信号S1のうち突発音にあたるリファレンス記憶区間のみを参照信号として抽出、記憶する。突発音は、通常の信号レベルから突発的に振幅が増加し、時間と共に減衰していき、リファレンス記憶区間を過ぎて通常の信号レベルに戻るという特徴がある。よって、突発音更新部400は、まず信号S1から突発音のピーク(最大値)を検出し、そのピークにおける位置を基準として、所定区間分(通常は数サンプル)前方、及び所定区間分だけ後方にわたるサンプルを、リファレンス記憶区間として抽出し、参照信号として突発音情報記憶部500に記憶させれば良い。
【0057】
また、変形例として、突発音情報記憶部500は、突発音情報記憶部500に記憶させた参照信号と、上記により突発音更新部400が判断した突発音との相関を判定する。相関の判定は、突発音情報記憶部500に記憶させた参照信号と突発音更新部400が判断した突発音との相関値を算出し、所定の閾値以上であるか否かにより、相関があるか否かを判定する。相関がないと判定した場合に、突発音情報記憶部500は、突発音更新部400が判断した突発音を参照信号として、突発音情報記憶部500に既に記憶されている参照信号を更新するようにしてもよい。このようにすることで、突発音を除去するために適切な参照信号を記憶させることができる。
【0058】
St12:
St3において突発音が存在すると判定された場合、加算器900は、突発音が除去された信号S1を出力する。一方、St3において突発音が存在しないと判定された場合は、加算器900は、突発音検出部300に入力された信号S1をそのまま出力する。なお、信号S1の突発音の除去は上述した通りであるが、突発音情報記憶部500に、所定数の参照信号が記憶されている場合、最新の参照信号を用いて、加算信号を作成すればよい。
【0059】
本実施の形態によれば、雑音低減装置1000は、入力信号S1及びS2に含まれる持続的また周期的な突発音の有無を判断し、参照信号を記憶し、記憶した参照信号を用いて、入力信号から突発音のみを除去する。これにより、従来の雑音低減処理によって生じる音声信号の劣化を最小限に抑えることができ、通話品質の向上が期待できる。さらに、適応フィルタなどで雑音を低減する方法よりも処理量が少なく、負荷を低減させることができる。
【0060】
特に、本実施の形態によれば、雑音低減装置1000は、音声が混入されていない過去の突発音を参照信号として記憶するので、入力信号において音声と突発音とが重なっている場合でも、突発音のみを効果的に低減することができる。よって、移動体通信機器を用いた音声情報伝達において、音声の明瞭性を向上させることができる。
【0061】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述の実施の形態では、突発音除去処理St8の後に、参照信号の記憶にかかる処理St9乃至St11を実施し、その後信号出力処理St12を行う例を示した。しかしながら、これらの処理の順序は、本発明の趣旨を損なわない限りにおいて任意に入れ替えて構わない。例えば、参照信号の記憶にかかる処理St9乃至St11と、信号出力処理St12とは、逆の順序で行っても良く、あるいは並行処理しても良い。
【0062】
また、上述の実施の形態では、本発明を主にハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。