(58)【調査した分野】(Int.Cl.,DB名)
前記第2ピーク抽出部は、前記隣接するピークスペクトルに対して400Hz以上の周波数間隔を保持するピークスペクトルを、前記独立性を有するピークスペクトルとして抽出することを特徴とする、
請求項1に記載の雑音信号抑制装置。
前記第1ピーク抽出部は、前記収音部で収音された音声信号の音圧レベルが80dB以上であり、かつ全周波数スペクトルの平均信号レベルに対するレベル差が音圧レベルとして12dB以上のスペクトルを前記ピークスペクトルとして抽出することを特徴とする、
請求項1に記載の雑音信号抑制装置。
【発明を実施するための形態】
【0021】
本発明の実施の形態について以下に図面を参照して説明する。以下の説明は、本発明の好適な実施の形態を示すものであって、本発明の範囲が以下の実施の形態に限定されるものではない。以下の説明において、同一の符号が付されたものは実質的に同様の内容を示している。
【0022】
(実施の形態1)
以下、図面を参照して本発明の実施の形態について説明する。
図1は、本実施の形態1に係る特殊信号検出装置の構成を示すブロック図である。特殊信号検出装置100は、収音部101と、時間/周波数変換部102と、ピーク抽出部103と、ピーク独立性判定部104と、特殊信号検出部105と、を具備する。
【0023】
収音部101は、音声や雑音を収音する。収音部101は、具体的に装置100に設置されたマイクロホンである。収音部101で収音された目的音を含む周囲の音声は、時間領域の音声信号として時間/周波数変換部102に送られる。
【0024】
時間/周波数変換部102は、収音部101にて取得された音声信号を時間領域から周波数領域の周波数信号へ変換する処理を行う。
【0025】
ピーク抽出部103は、時間/周波数変換部102にて周波数領域に変換された周波数信号の中からエネルギー成分が極めて高いスペクトルを抽出する。具体的には、ピーク抽出部103は、変換された周波数信号の内、周囲の周波数信号に対し高いエネルギーを有するピーク特性を持つピークスペクトルを抽出する。
【0026】
ピーク独立性判定部104は、ピーク抽出部103でピークスペクトルが抽出されているかを判定する。また、ピーク独立性判定部104は、ピーク抽出部103にて抽出されたピークスペクトル同士が所定値以上の周波数間隔を保持しているかを判定する。ピーク独立性判定部104は、これらの判定結果を特殊信号検出部105に出力する。
【0027】
特殊信号検出部105は、ピーク独立性判定部104において所定値以上の周波数間隔を保持していると判定されたピークスペクトルを特殊信号として検出する。すなわち、特殊信号検出部105は、ピーク抽出部103で抽出されたピークスペクトルの中に、所定値以上の周波数間隔が離れたピークスペクトルがある場合に、当該ピークスペクトルを特殊信号として検出する。
【0028】
次に、特殊信号検出装置100の動作について説明する。
図2は、特殊信号検出装置100の動作の流れを示すフローチャート図である。
【0029】
収音部101は、周囲の音声を収音し、収音した音声を時間領域の音声信号として時間/周波数変換部102に出力する(ステップS1001)。
【0030】
時間/周波数変換部102は、入力信号に対して時間/周波数変換処理を行うことで、周波数領域の信号である周波数信号に変換し、変換後の周波数信号をピーク抽出部103に出力する(ステップS1002)。
【0031】
ピーク抽出部103は、入力した周波数信号に対するスペクトル分析を行い、ピークスペクトルを抽出する(ステップS1003)。具体的に、ピーク抽出部103は、スペクトル全体のエネルギー平均値と各ポイントのスペクトルのエネルギーとを比較することでピーク特性を備えているかを判断してピークスペクトルを抽出する。
【0032】
ピーク独立性判定部104は、ステップS1003においてピークスペクトルが抽出されているかを判定する(ステップS1004)。ピークスペクトルが抽出されていない場合、特殊信号検出部105は、特殊信号は検出されていないと判断する(ステップS1007)。
【0033】
一方、ステップS1003において、ピークスペクトルが抽出されている場合、当該抽出されたピークスペクトルの独立性を判定する(ステップS1005)。具体的には、ステップS1003で抽出されたピークスペクトル同士が所定値以上の周波数間隔を保持しているかを判定する。
【0034】
ステップS1005において、独立性を有するピークスペクトルが無いと判定された場合、特殊信号検出部105は、特殊信号は検出されていないと判断する(ステップS1007)。一方、ステップS1005において、独立性を有するピークスペクトルがあると判定された場合、特殊信号検出部105は、当該ピークスペクトルを特殊信号によるものとみなすことで特殊信号を検出する(ステップS1006)。
【0035】
以上のように、本実施の形態1に係る特殊信号検出装置は、ピークスペクトルを抽出し、更に独立性の判定を加えることで特殊信号を検出する。当該構成とすることで、少ないメモリ量と演算量で、短時間に特殊信号の有無を検出することができる。
【0036】
ここで、ピーク抽出部103とピーク独立性判定部104は、一つで独立性を有するピークスペクトルを抽出する処理を行っているため、以下の説明では、これら2つを合せて独立ピークスペクトル抽出部190と呼ぶことがある。特殊信号検出部105は、当該独立ピークスペクトル抽出部190で抽出される独立性を有するピークスペクトルに基づいて特殊信号を検出することになる。
【0037】
上記特殊信号検出装置は、様々な用途に応用することが可能となる。例えば、上記特殊信号検出装置を用いて警報音等の特殊信号を検出し、特殊信号が検出された場合に、警報音が鳴っていることを別の場所に待機するオペレータに通知する通知装置に応用することができる。また、上記特殊信号検出装置を道路脇に設置し、車のエンジン音等の特殊信号を検出し、検出結果を時系列でメモリに記録していくことで、車の交通量を測定する測定装置に応用することも可能である。
【0038】
また、上記特殊信号検出装置で検出された特殊信号を特殊性の雑音として捉え、収音した音声の中から当該特殊性雑音を取り除いた上で音声を送信する雑音信号抑制装置として応用することも可能である。
【0039】
図3は、当該特殊信号検出方法を利用した本実施の形態1に係る雑音信号抑制装置200の構成を示すブロック図である。
【0040】
雑音信号抑制装置200は、収音部201と、時間/周波数変換部202と、ピーク抽出部203と、ピーク独立性判定部204と、ピークスペクトル決定部205と、雑音信号抑制部206と、周波数/時間変換部207と、出力部208と、を備える。
【0041】
ここで、雑音信号抑制装置200が備える収音部201、時間/周波数変換部202、ピーク抽出部203、及びピーク独立性判定部204は、それぞれ上述した特殊信号検出装置100が備える収音部101、時間/周波数変換部102、ピーク抽出部103、及びピーク独立性判定部104に相互に対応している。
【0042】
収音部201は、音声や雑音を収音する。収音部201は、具体的に装置200に設置されたマイクロホンである。収音部201で収音された目的音を含む周囲の音声は、時間領域の音声信号として時間/周波数変換部202に送られる。
【0043】
時間/周波数変換部202は、収音部201にて取得された音声信号を時間領域から周波数領域の周波数信号へ変換する処理を行う。
【0044】
ピーク抽出部203は、時間/周波数変換部202にて周波数領域に変換された周波数信号の中からエネルギー成分が極めて高いスペクトルを抽出する。
【0045】
ピーク独立性判定部204は、ピーク抽出部203にて抽出されたピークスペクトル同士が所定の周波数間隔を保持しているかを判定する。
【0046】
ピークスペクトル決定部205は、ピーク独立性判定部204より独立性を保持するスペクトルを特殊性雑音信号として抽出する。
【0047】
雑音信号抑制部206は、時間/周波数変換部202より出力される周波数領域の周波数信号からピークスペクトル決定部205で特殊性雑音信号として抽出されたピークスペクトルを取り除く。雑音信号抑制部206は、雑音抑制を行った後の周波数信号を周波数/時間変換部207に出力する。
【0048】
周波数/時間変換部207は、雑音信号抑制部206より入力する周波数信号を時間領域の音声信号に変換する。周波数/時間変換部207は、変換後の音声信号を出力部208に出力する。
【0049】
出力部208は、周波数/時間変換部207から入力した音声信号に必要に応じて音声符号化を行い、外部に出力する。出力部208は、上記入力した音声信号を外部に無線送信する無線送信手段であっても良い。
【0050】
ここで、ピーク抽出部203とピーク独立性判定部204とピークスペクトル決定部205は、一つで周波数変換された周波数信号の中から独立性を有するピークスペクトルを抽出する機能を有する。従って、以下の説明では、これら3つを一纏めとして、独立ピークスペクトル抽出部290と呼ぶことがある。独立ピークスペクトル抽出部290は、変換された周波数信号の中から独立性を有するピークスペクトルを抽出する機能を有する。ここで、独立性を有するとは、隣接ピークスペクトルに対して所定値以上の周波数間隔を保持している場合に独立性を有するものとする。ここで、上記所定値としては、音声が100Hz〜400Hzに基本周波数を有することを鑑み、400Hz程度を採用することが好ましい。
【0051】
また、独立ピークスペクトル抽出部290において、ピーク抽出部203は、全スペクトルの中から独立性を無視して第1段階目のピーク抽出を行うのに対し、ピーク独立性判定部204及びピークスペクトル決定部205は、第1段階目で抽出されたピークスペクトルの中から独立性を考慮した第2段階目のピークスペクトルを抽出する。従って、以下の説明では、当該ピーク独立性判定部204及びピークスペクトル決定部205を一纏めにして第2ピーク抽出部250と称することがある。同時にピーク抽出部203を特に第1ピーク抽出部203と称することがある。
【0052】
第1ピーク抽出部203は、収音部201で収音された音声信号の音圧レベルが第1基準値(例えば80dB)以上であり、かつ全周波数スペクトルの平均信号レベルに対するレベル差が音圧レベルで第2基準値(例えば12dB)以上のスペクトルをピークスペクトルとして抽出すると、適切な特殊性雑音のピークを拾うことができるため好ましい。
【0053】
続いて雑音信号抑制装置200の動作について説明する。
図4は、雑音信号抑制装置200の動作の流れを示すフローチャート図である。
【0054】
収音部201は、周囲の音声を収音し、収音した音声を時間領域の音声信号として時間/周波数変換部202に出力する(ステップS2001)。
【0055】
時間/周波数変換部202は、入力信号に対して時間/周波数変換処理を行うことで、周波数領域の信号である周波数信号に変換する(ステップS2002)。
【0056】
ここで、時間/周波数変換部202は、所定の時間幅で形成されたサンプル群を単位として時間/周波数変換処理を行う。当該変換処理における周波数分解能は、収音部201から入力する音声信号のサンプリングレートと時間/周波数変換部202のサンプル数によって決定され、以下の式(1)で求めることができる。
一例として、サンプリングレートが32000[Hz]、時間/周波数変換部202のサンプル数が512[Sample]の場合、(式1)に従い、周波数分解能は、31.25[Hz]となる。この場合の周波数変換にかかる時間幅は、
の(式2)で求めることができる。上記の例では、周波数変換時間幅は0.016[Sec]となる。よって雑音信号抑制装置200における時間/周波数変換処理は、512サンプルを単位として、0.016[Sec]周期で繰り返し行われる。
【0057】
次に、ピーク抽出部203は、時間/周波数変換部202で変換された周波数信号の内、周囲の周波数信号に対し高いエネルギーを有するピーク特性を持つピークスペクトルを抽出する(ステップS2003)。
【0058】
具体的には、ピーク抽出部203は、スペクトル全体のエネルギーの平均値を算出し、求めたスペクトル全体の平均値と個々のスペクトルのエネルギーとを比較していく。なお、スペクトル全体の平均エネルギーは周波数変換に係るサンプル数をnとすると、以下の(式3)で求めることができる。
【0059】
ピーク抽出部203は、注目するスペクトルが周囲のスペクトルのエネルギー(平均的なスペクトルのエネルギー)に対して高いエネルギー比率を有しているか、すなわちピーク特性を備えているかを見ることでスペクトルのピークを抽出することができる。
【0060】
通常、音声信号を伝達するために必要な明瞭度は音声対雑音のエネルギー比(SNR)で少なくとも12dB以上(振幅値で換算すると雑音信号に対し音声信号は4倍以上)が目安とされる。サイレン音のような警告音は周波数領域における集中度は極めて高く(トーン性雑音、つまりサイン波の集まり)、音声符号化過程でその過大な周波数成分により音声信号に必要な符号化情報量を警告音の符号化に費やしてしまう。結果として、音声信号の品質劣化を招く。
【0061】
通常の音声符号化処理では、音声信号の基本周波数成分が警告音の主要周波数成分のエネルギーを上回れば優先的に音声信号へと情報が割り当てられ、反対に音声信号の基本周波数成分が警告音の主要周波数成分のエネルギーを下回れば、トーン性の高い警告音を音声成分とみなし、優先的に警告音へと情報が割り当てられる傾向がある。
【0062】
この特性から、上記の必要なSNRである12dBを基準とし、警告音としてエネルギー成分が過大であるかを判定する指標は、平均エネルギーに対し12dB以上エネルギーが高いスペクトルをピークスペクトルとして抽出することが好ましい。
【0063】
また、本例では全スペクトルの平均エネルギーを比較対象としたが、周囲雑音の様々な周波数分布も鑑みる場合は、全周波数帯域を細分化した所定の帯域幅による帯域分割後の平均エネルギーを用いて判定しても良い。
【0064】
上記ステップS2003におけるピーク抽出処理について、
図5を参照して詳しく説明する。
図5は、ピーク抽出部203におけるピーク抽出処理の流れを示すフローチャート図である。
【0065】
ピーク抽出部203は、入力されたスペクトル信号の全体平均値を算出する(ステップS3001)。次に、ピーク抽出部203は、ステップS3001で計算したスペクトル信号の全体平均値に上記SNRの基準である+12dBを加算した値を超えるスペクトルであるかを個々のスペクトルを1つずつ比較する(ステップS3002)。比較の結果、スペクトル全体平均値に+12dB加算した値より、比較したスペクトル信号の値が強い場合はステップS3003へ進み、それ以外の場合にはステップS3004へ進む。
【0066】
ピーク抽出部203は、ステップS3002における比較の結果、スペクトル全体平均値に+12dB加算した値より大きいと判定された個々のスペクトルを参照用ピークスペクトルとして記録する(ステップS3003)。
【0067】
ピーク抽出部203は、個々のスペクトルの比較処理において全てのスペクトルを比較した場合にはステップS3005へ進み、全てのスペクトルの比較をしていない場合には次のスペクトルを比較するためステップS3002へ進む(ステップS3004)。
【0068】
次に、ピーク抽出部203は、ステップS3003で仮抽出した参照用ピークスペクトルの中からエネルギー量の高い上位のピークスペクトルを所定数抽出し、それらをピークスペクトルとする(ステップS3005)。
【0069】
後述するように、ピークスペクトルの登録処理では、ピークの周波数間隔が400Hz以上のものを最終的にピークとして登録をしている。音声信号をデジタル信号に変換し、その周波数範囲を一般的な100〜3500Hzとして扱う場合、400Hz以上の倍音構成を持つ信号を抽出するならば、約8ポイント程度となる。よって、抽出するべきピークの数はこの程度でよい。複数の混合音、また音声信号の混合音の影響を加味して、10〜20本程度のピークスペクトルを抽出すれば十分である。仮抽出した参照用ピークスペクトルの中から必要数のピークスペクトルを選択することで、後続の処理負荷を軽減することができる。
【0070】
以上のように、ピーク抽出部203がステップS3001〜ステップS3005の処理フローに従い、周囲の周波数信号に対し高いエネルギーを有するピーク特性を持つピークスペクトルを抽出する。
【0071】
続いて、
図4のフローに戻り、ピーク独立性判定処理の説明を行う。まず、ピーク独立性判定部204は、ピーク抽出部203におけるピーク抽出処理に従い、全周波数スペクトルの中からピーク特性を持つピークスペクトルが抽出されたかを判定する(ステップS2004)。ピーク抽出部203においてピークスペクトルが抽出されていない場合は、警告音等の特殊性雑音が存在しないか、又は存在してもエネルギー成分が十分低いものとして、後述の雑音信号抑制部206における雑音抑制処理は行われず、ステップS2012へ進む。
【0072】
一方、ステップS2004における判定の結果、ピークスペクトルが抽出されていると判定した場合は、ピーク独立性判定部204は、当該抽出されているピークスペクトルが警告音等の特殊性雑音であるかの判定処理に移行する。抽出されたピークスペクトルの中には、音声信号が混入している可能性があるため、直ちに抽出されたピークスペクトルをもって特殊性雑音であると決定することができないためである。
【0073】
そこで、音声の特徴である倍音成分が密度高く分布している状態に着目し、ピーク独立性判定部204は、ピーク独立性判定を行うことで、抽出されたピークスペクトルが、音声信号によるピークスペクトルであるか、特殊性雑音であるかを判定する(ステップS2005)。すなわち、ピーク独立性判定部204は、ピーク信号自身の独立性、言い換えると他の抽出されたピーク信号との周波数の距離に基づいて音声信号と特殊性雑音との分離を試みる。
【0074】
ここで、サイレン音のような警告音、レーシングカーのような甲高いエンジン音も、基本周波数を基にした倍音成分が重なり合って形成されている点では、音声と共通の特徴を有する。ただし、上記警告音等の特殊性雑音と人間の音声との大きな違いはその基本周波数の高さにある。音声はおおよそ100〜400Hzに基本周波数が存在するのに対し、上記特殊性雑音はその多くは400Hz以上(エンジン音で低域成分が強いものは除く)である。
【0075】
このような特徴を鑑み、ピーク独立性判定部204は、例えば、ステップS2005において、基準となる周波数間隔を400Hzに設定し、検出されたピークスペクトル同士の周波数の距離が400Hz以上であるかを判定する。
【0076】
ここで、最小単位で400Hzの帯域幅内に他のピークスペクトルを検出するには、400Hzの帯域幅の両側をピーク(山)とすると、中間の200Hz付近にピーク(山)、そしてその両側(山と山の間)に低い音圧レベル(谷)が観察できるような周波数分解能が必要である。よってピークスペクトルの距離が400Hz以上であるかを正確に観察するためには、時間/周波数変換部202が、最低1個分の他のピーク(山)が観察できる100Hzの周波数分解能を有することが好ましい。
【0077】
ピーク独立性判定部204は、隣接するピークスペクトルの周波数間隔が400Hz未満であれば音声のスペクトル信号であるとみなし、400Hz以上であれば特殊性雑音信号のスペクトルとみなす。
【0078】
ピークスペクトル決定部205は、ピーク独立性判定部204が行うステップS2005の判定の結果、周波数間隔が400Hz以上離れていると判定されたピークスペクトルを登録する(ステップS2006)。一方、ピークスペクトル決定部205は、ステップS2005の判定の結果、周波数間隔が400Hz未満であると判定されたピークスペクトルを排除する(ステップS2007)。
【0079】
なお、音声と特殊性雑音信号が同時に入力された場合は、特殊性雑音信号の低域部分のスペクトルが音声信号の分布と重なりあう。従って、上記ピークの独立性に基づいて音声と特殊性雑音とを分離する方法では、ピーク独立性判定の結果、低域部分の特殊性雑音成分が音声と共に排除されることになり、完全な特殊性雑音の分離はできない。しかしながら、特殊性雑音信号の中高域のピークスペクトルを抑制できれば、上記のように音声符号化時に音声信号の品質劣化へ与える影響を緩和することができる。
【0080】
このように、ステップS2005において、ピーク独立性判定部204は、隣り合うピークスペクトルの間隔が、予め設定されている所定の周波数間隔(ここでは400Hz)以上離れているか否かを判定する。当該判定の結果、ピークスペクトルの周波数間隔が400Hz以上離れている場合は、近隣に他のピークスペクトルが存在しないため「独立性あり」となる。そこで、ピークスペクトル決定部205は、ステップS2006において該当するスペクトル情報を正式なピークスペクトルとして登録する。その逆に、スペクトルの周波数間隔が400Hz未満である場合は、近隣に他のピークスペクトルが存在するため「独立性なし」となる。この場合、ピークスペクトル決定部205は、ステップS2007において該当するスペクトル情報を特殊性ノイズのスペクトル候補から除外する。
【0081】
ピーク独立性判定部204は、全てのピークスペクトルについて独立性有無の判断処理が終了したか否かを判定する(ステップS2008)。当該判定の結果、処理途中であれば次のピークスペクトルの判定のためステップS2005へ戻る。一方、全てのピークスペクトルについて処理が終了していれば、ステップS2009の登録されたピークスペクトルがあるか否かの判定へ進む。
【0082】
ピークスペクトル決定部205は、全ピーク判定が終了した段階で、ステップS2006において独立性の有するピークスペクトルが登録されているかを判定する(ステップS2009)。当該判定の結果、独立性の有するピークスペクトルが登録されていない場合は、ピークスペクトル決定部205は、ステップS2004で抽出されたピークスペクトルはすべて音声に係るピークスペクトルであり、特殊性雑音信号は存在しないものとみなしてステップS2012へ進む。
【0083】
一方、独立性の有するピークスペクトルが登録されている場合は、ピークスペクトル決定部205は、当該ピークスペクトルに関する情報を雑音信号抑制部206に送る(ステップS2010)。
【0084】
雑音信号抑制部206は、時間/周波数変換部202で既に抽出してあるピークスペクトルに対し、特殊性雑音信号として抑制すべきピークスペクトルに関する情報を用いて雑音抑制処理を行う(ステップS2011)。当該雑音抑制処理は、従来のノイズ低減処理と同様に所定のレベル低減量を与える。雑音信号抑制部206が行う抑制処理における抑制量は、前段で検出した周波数変換処理単位における平均スペクトルエネルギーとピークスペクトルとの差分でも良いし、ピークスペクトルして抽出するための基準であった12dBを超える抑制量でも良い。
【0085】
周波数/時間変換部207は、ピークスペクトルに対し抑制処理が行われた周波数信号に対して、再び周波数/時間変換を行い、時間領域の音声出力信号を取得して出力部208へ出力する(ステップS2012)。
【0086】
なお、ピークスペクトルが検出されていない場合は、ピークスペクトル決定部205よりピークスペクトル情報が雑音信号抑制部206に伝えられない。この場合は、雑音信号抑制部206は、雑音抑制処理を行うことなく時間/周波数変換部202から入力する周波数信号をそのまま周波数/時間変換部207へ送ることになる。
【0087】
次に、ピーク抽出部203、ピーク独立性判定部204、及びピークスペクトル決定部205の機能について更に詳しく説明する。
【0088】
図6は、周囲の雑音レベルが低く音圧レベルが高いサイレン音が収音部201で収音された場合の時間/周波数変換後の周波数分布図である。横軸は0〜4kHzの範囲の周波数を示し、縦軸は音圧レベルを示している。
【0089】
この例では最も高い音圧レベルを有するスペクトルは100dBを超え、平均的な音圧レベルより12dB以上のピークを持つピークスペクトルが3本(○印)検出される。当該検出されたピークスペクトルをP1、P2、P3と呼ぶことにする。ピーク抽出部203によって当該P1〜P3のピークスペクトルが抽出される。また、P1〜P3のピークスペクトル同士は400Hz以上の周波数間隔を保持しているため、独立性が保たれている。従って、ピーク独立性判定部204は、P1〜P3のピークスペクトルは独立していると判定する。従って、ピークスペクトル決定部205は、P1〜P3のピークスペクトルは特殊性雑音によるものとみなし、当該ピークスペクトルに関する情報が雑音信号抑制部206に送られる。従って、雑音信号抑制部206において、P1〜P3の3か所のピークスペクトルに対して抑制処理が行われる。
【0090】
一方、
図7は周囲の雑音レベルは低いものの音圧レベルが高いサイレン音と、同時に発せられた音声信号とが収音部201で収音された場合の時間/周波数変換後の周波数分布図である。
図6で観察できるサイレン音に加え、音声のスペクトルが観察でき、サイレン音の最低域のスペクトルと重なり合っているのがわかる。検出されたピークは同様に○印で示す。
図7のように、この場合は、ピーク抽出部203によって当該Q1〜Q7の7本のピークスペクトルが抽出される。ここで、低域側のピークスペクトルであるQ1〜Q6は、お互い400Hz以上の周波数間隔を有しておらず独立性が保たれていない。従って、ピークスペクトル決定部205にてQ1〜Q6のピークは除外され、Q7のピークのみピークスペクトルとして登録される。ピークスペクトル決定部205は、当該Q7をピークスペクトルは特殊性雑音によるものとみなし、当該ピークスペクトルに関する情報が雑音信号抑制部206に送られる。従って、雑音信号抑制部206において、一番高域側に独立して存在しているQ7の1か所のピークスペクトルに対して抑制処理が行われる。一方、Q1〜Q6は、音声によるピークスペクトルであるとして抑制処理が行われることは無い。
【0091】
実際は、Q1〜Q6の中には、サイレン音によるピークスペクトルが混在しているが、当該低周波数範囲のサイレン音ピークスペクトルは除外しない。当該構成でも、Q7のピークスペクトルを抑制できるため、短時間でかつ少ない処理量で、音声改善効果を実現することができるためである。
【0092】
なお、上記説明した本実施の形態1に係る雑音信号抑制装置では、特殊性雑音信号の抑制処理についてのみ説明したが、従来の周波数差し引き法に代表されるような周波数領域上における雑音信号抑制処理を合せて行っても良い。また、本実施の形態1の特殊性雑音信号の抑制処理技術を、従来の周波数差し引き法に代表されるような周波数領域上における装置へ追加で導入することも可能である。この組み合わせにより、従来の雑音信号抑制効果を加えた特殊性雑音信号抑制装置が実現でき、サイレン音のような警告音と共に周囲雑音をも軽減可能な雑音抑制装置を提供できる。
【0093】
なお、上述した具体的に示した数値は本発明の効果が得られる最適な数値であるが、音圧レベルは周囲の雑音環境、周波数分解能(分解能が低い場合は周囲の周波数成分と平均化され低下傾向にある)に応じて最適値も変化する。従って、本発明は上述した具体的数値に限定されるものではない。例えば、ピーク独立性判定部204は、400Hzを独立性判定の基準とするのではなく、300Hzや500Hzを基準値として採用しても良い。
【0094】
また、特殊信号検出装置100及び雑音信号抑制装置200において、収音部101で収音された音声信号の音圧レベルを測定する音圧レベル測定手段を更に備えていても良い。音圧レベル測定手段において測定された音圧レベルが所定の基準値を超えている場合に、特殊信号検出処理や特殊性雑音抑制処理を行っても良い。
【0095】
また、上記説明では雑音信号抑制部206は、時間/周波数変換部202で変換された周波数信号から独立ピークスペクトル抽出部290で抽出される独立性を有するピークスペクトルを雑音信号として抑制する場合について説明したがこれに限定されるものではない。雑音信号抑制部206は、収音部201で収音された時間領域の音声信号から、当該抽出される独立性を有するピークスペクトルを周波数/時間変換部207によって時間領域の信号に変換したものを差し引くことで雑音抑制を行っても良い。
【0096】
また、言うまでもなく、上記雑音信号抑制装置200について説明した特殊性雑音の具体的検出方法を
図1の特殊信号検出装置100に利用することができる。
(実施の形態2)
【0097】
実施の形態1の特殊信号検出装置では、独立性のあるピークスペクトルが検出された場合にサイレン音や警報音等の特殊信号として検出している。しかしながら、突発的なパルス雑音が収音部で収音された場合に、当該雑音を特殊信号として検出してしまう。そこで、本実施の形態2に係る特殊信号検出装置は、より適切に特殊信号を検出できることを特徴としている。以下図面を参照して詳細に説明する。但し、実施の形態1で既に説明した部分については、発明の明確化のため一部説明を省略する。
【0098】
図8は、本実施の形態2に係る特殊信号検出装置300の構成を示すブロック図である。特殊信号検出装置300は、収音部101と、時間/周波数変換部102と、ピーク抽出部103と、ピーク独立性判定部104と、特殊信号検出部305と、ピークスペクトル決定部306と、持続性判定部307と、を備える。
【0099】
ピークスペクトル決定部306は、ピーク独立性判定部104で独立性を保持していると判定されたピークスペクトルを特殊信号に起因するピークスペクトル候補として決定する。
【0100】
持続性判定部307は、ピークスペクトル決定部306で特殊信号に起因するピークスペクトル候補として決定されたピークスペクトルの持続性を判定する。すなわち、持続性判定部307は、ピークスペクトル決定部306で特殊信号に起因するピークスペクトル候補として決定されたピークスペクトルが所定の期間立ち続けているかを判定する。
【0101】
特殊信号検出部305は、持続性判定部307においてピークスペクトルが所定期間持続性を保持している場合に当該ピークスペクトルは特殊信号によるピークスペクトルとみなすことで特殊信号を検出する。
【0102】
なお、ピーク抽出部103とピーク独立性判定部104とピークスペクトル決定部305とを合せて、独立ピークスペクトル抽出部390と称する。独立ピークスペクトル抽出部390は、周波数変換された周波数信号の中から独立性を有するピークスペクトルを抽出する。
【0103】
また、ピーク独立性判定部104及びピークスペクトル決定部305を一纏めにして第2ピーク抽出部350と称することがある。同時にピーク抽出部103を特に第1ピーク抽出部103と称することがある。第2ピーク抽出部350は、第1ピーク抽出部103で抽出されたピークスペクトルの中から隣接するピークスペクトルに対して所定値以上の周波数間隔を保持するピークスペクトルを、独立性を有するピークスペクトルとして抽出する。
【0104】
次に特殊信号検出装置300の動作について説明する。
図9は、特殊信号検出装置300の動作の流れを示すフローチャート図である。但し、ステップS4001〜ステップS4005及びステップS4008〜ステップS4009は、
図2で説明したステップS1001〜ステップS1005及びステップS1006〜ステップS1007と略同一であるため説明を省略し、ステップS4006〜ステップS4007について詳しく説明する。
【0105】
ピークスペクトル決定部306は、ステップS4005で独立性があるピークスペクトルであると判定された場合、当該ピークスペクトルを特殊信号に起因するピークスペクトル候補と決定し、当該ピークスペクトルをメモリに登録する(ステップS4006)。
【0106】
次に、持続性判定部307は、ステップS4006で登録されたピークスペクトルが所定期間以上持続しているかを判定する(ステップS4007)。当該持続性判定の結果、所定期間以上持続している場合、特殊信号検出部305は、当該持続しているピークスペクトルは特殊信号によるものと判断する(ステップS4008)。一方、当該持続性判定の結果、所定期間以上持続していない場合、特殊信号検出部305は、特殊信号は未だ検出されていないものと判断する(ステップS4009)。
【0107】
以上のように、本実施の形態2に係る特殊信号検出装置300は、所定値以上の周波数間隔を保持していると判定されたピークスペクトルが所定期間以上持続しているかを判定した上で、ピークスペクトルが特殊信号によるものかどうかの判断を行い、特殊信号を検出する。従って、突発的な雑音を特殊信号として誤検出することを防ぐことができる。
【0108】
次に、上記説明した持続性判定機能を更に備える雑音信号抑制装置について説明する。
図10は、本実施の形態2に係る雑音信号抑制装置400の構成を示すブロック図である。
【0109】
雑音信号抑制装置400は、収音部201と、時間/周波数変換部202と、ピーク抽出部203と、ピーク独立性判定部204と、ピークスペクトル決定部205と、雑音信号抑制部206と、周波数/時間変換部207と、出力部208と、持続性判定部409と、動作モード決定部410と、を備える。
【0110】
持続性判定部409は、ピークスペクトル決定部205で抽出されたピークスペクトルの持続性を判定する。すなわち、持続性判定部409は、ピークスペクトル決定部205で独立性を有するピークスペクトルとして登録されたピークスペクトルが所定の期間継続的に立ち続けているかを判定する。持続性判定部409は、当該判定結果を動作モード決定部410に出力する。
【0111】
動作モード決定部410は、持続性判定部409から入力する判定結果に基づいて特殊性雑音の抑制に関する動作モードを決定する。動作モード決定部410は、特殊性雑音の抑制を行う抑制モードと特殊性雑音の抑制を行わない通常モードとの2つの動作モードを有し、持続性判定部409から入力する判定結果に基づいて判定結果を切り替える。雑音信号抑制部206は、当該動作モード決定部410における動作モードに従って特殊性雑音の抑制処理を行うことになる。
【0112】
なお、ピーク抽出部203とピーク独立性判定部204とピークスペクトル決定部205とを合せて、独立ピークスペクトル抽出部490と称する。独立ピークスペクトル抽出部490は、周波数変換された周波数信号の中から独立性を有するピークスペクトルを抽出する。
【0113】
また、ピーク独立性判定部204及びピークスペクトル決定部205を一纏めにして第2ピーク抽出部450と称することがある。同時にピーク抽出部203を特に第1ピーク抽出部203と称することがある。第2ピーク抽出部450は、第1ピーク抽出部203で抽出されたピークスペクトルの中から隣接するピークスペクトルに対して所定値以上の周波数間隔を保持するピークスペクトルを、独立性を有するピークスペクトルとして抽出する。
【0114】
次に、雑音信号抑制装置400の動作について説明する。
図11は、雑音信号抑制装置400の動作の流れを示すフローチャートである。なお、ステップS5001〜ステップS5009は、
図4のステップS2001〜ステップS2009と略同一であるため説明を省略し、ステップS5010からの処理について詳しく説明する。
【0115】
ピークスペクトル決定部205は、ピーク独立性判定部204で独立していると判定されたピークスペクトルを持続性観測用のピークスペクトルとして登録する(ステップS5010)。
【0116】
次に、持続性判定部409は、ステップS5010で登録されたピークスペクトルについて所定の期間以上持続しているかを判定する(ステップS5011)。ステップS5011の判定結果は、動作モード決定部410に送られる。
【0117】
動作モード決定部410は、ステップS5011の判定結果、観測用ピークスペクトルが所定の期間以上持続していない場合は、動作モードを特殊性雑音の抑制を行わない通常モードに設定する(ステップS5012)。一方、ステップS5011の判定結果、観測用ピークスペクトルが所定の期間以上持続している場合は、動作モード決定部410は、動作モードを特殊性雑音の抑制を行う抑制モードに移行する(ステップS5013)。
動作モード決定部410は、抑制モードの場合は、ステップS5006で登録された独立性を有するピークスペクトルに関する情報を雑音信号抑制部206に送る(ステップS5014)。
【0118】
雑音信号抑制部206は、時間/周波数変換部202で既に抽出してあるピークスペクトルに対し、動作モード決定部410より送られてくる特殊性雑音信号として抑制すべきピークスペクトルに関する情報を用いて雑音抑制処理を行う(ステップS5015)。
【0119】
抑制モードに従って雑音抑制処理が行われた周波数信号又は通常モードに従い雑音抑制処理が行われなかった周波数信号は、周波数/時間変換部207で時間領域の音声信号に再変換される(ステップS5016)。
【0120】
図12は、人間の音声とサイレン音とが同時に収音された場合における(a)入力信号の振幅レベルの時間波形図と、(b)入力信号のスペクトログラム波形とを並べて示している。
図12(b)において、縦軸が周波数で、濃淡がスペクトルの強さを示し、横軸は時間推移を示している。
【0121】
図12(b)から分かるように時間t0〜t9の区間において倍音構造を有するサイレン音が観測される。また、t1〜t4、t5〜t8の区間において音声が観測される。
図12において点線楕円で囲まれた部分は、ピーク独立性判定部204で独立なピークスペクトルとして判定されるピークスペクトル領域を示している。
【0122】
図12で示される状態における持続性判定部409の動作と動作モード決定部410の動作について
図13を参照して説明する。
図13は、ピークスペクトルの持続性と動作モードの切り替わりを説明する図を更に並べて示している。
【0123】
t0〜t1の区間は、独立したピークスペクトルが持続して観測され続ける。ここで、時刻T1になった時、所定期間以上ピークスペクトルが持続しているとして、持続性判定部409より動作モード決定部410に動作モード切り替え指示が出される。当該動作モード切り替え指示を受け取った動作モード決定部410は、動作モードを通常モードから抑制モードに切り替える。
【0124】
音声が収音されたt1のタイミング以降、ピーク抽出部203でピーク抽出は行われるものの、t2のタイミングまで各ピークスペクトルは独立していないとピーク独立性判定部204において判定される。持続性判定部409は、t1のタイミングでピークスペクトルの持続性が維持されなくなったと判断し、動作モード決定部410に通常モードに戻るよう動作モード切り替え指示を出す。動作モード決定部410は、当該動作モード切り替え指示に基づいて動作モードを抑制モードから通常モードに戻す。
【0125】
このような処理により、t2〜t6、t7〜t9の区間は独立したピークスペクトルが抽出され、持続性判定部409において各ピークスペクトルが持続していると判定される。T1のタイミングと同様、閾値を超えるT2とT3のタイミングで持続性判定部409から動作モード決定部410へ動作モードを通常モードから抑制モードへ移行させるための動作モード切り替え指示が出され、通常モードから抑制モードへの移行が行われる。また、t6とt9のタイミングでは、持続性判定部409から動作モード決定部410へ動作モードを抑制モードから通常モードへ移行させるための動作モード切り替え指示が出され、抑制モードから通常モードへの移行が行われる。
【0126】
以上のように、本実施の形態2に係る雑音信号抑制装置400は、所定値以上の周波数間隔を保持していると判定されたピークスペクトルが所定期間以上持続しているかを判定した上で、ピークスペクトルが特殊信号によるものかどうかの判断を行う。独立性の有するピークスペクトルが所定期間以上持続している場合に、当該ピークスペクトル成分を抑制する処理を行う。当該構成とすることで、サイレン音等の特殊性雑音ではない突発的な音声を誤って抑制することを防ぐことができる。
【0127】
なお、上記説明では、ピークスペクトル決定部205は、ピーク独立性判定部204で所定周波数以上離れていることにより独立していると判定されたピークスペクトルを持続性測定用に用いるピークスペクトルとして登録する場合について説明したがこれに限るものではない。ピークスペクトル決定部205は、ピーク独立性判定部204で複数のピークスペクトルが独立していると判定されている場合は、その中から一部のピークスペクトルを持続性測定用ピークスペクトルとして登録しても良い。
【0128】
図14は、独立性を有するとして判定されるピークスペクトルの内、最低周波数を有する1つのピークスペクトルを持続性測定用ピークスペクトルとして持続性判定を行う場合におけるピークスペクトルの持続性と動作モードの切り替わりを説明する図である。
【0129】
図14(b)において、点線楕円で囲まれた部分のピークスペクトルが持続性測定用ピークスペクトルとしてピークスペクトル決定部205にて抽出される。
図14に示す持続性判定では、1つのピークスペクトルに着目するため、
図13の場合と比較して動作モードを切り替える閾値、すなわち抑制モードへ切り替わるまでの時間間隔が短めに設定されている。
【0130】
図14(b)、(c)からわかるように、t0〜t1、t2〜t6、t7〜t9の区間では独立性を有するピークスペクトルが検出されている。しかしt3、t4、t5、t8のタイミングにおいて着目するピークスペクトルが変更されるため、持続性判定部409において持続性のカウントがリセットされる。従って、
図14の場合において、動作モード決定部410が動作モードを抑制モードにセットし、雑音信号抑制部206で特殊性雑音の抑制処理が行われる区間は、T1〜t1、T2〜t3、T3〜t5、T4〜t6、T5〜t8、T6〜t9の区間となる。
【0131】
図14の処理方法によれば、
図13の処理方法と比較して特殊性雑音を検出して抑制する区間が短くなってしまう一方で、1つのピークスペクトルに着目して持続性を判断できるため、少ない処理量で特殊性雑音の検出及び抑制処理を行うことができる。
【0132】
なお、言うまでもなく、上記雑音信号抑制装置400について説明した中で具体的に使用した検出方法を特殊信号検出装置300に応用できる。
【0134】
上記
図13で説明した特殊性雑音抑制方法では、複数のピークスペクトルを対象として持続性判定処理を行うため、装置に対する処理負荷が増大してしまうもののより適切に特殊性雑音の存在を検出して雑音抑制処理を行うことができる。一方、上記
図14で説明した特殊性雑音抑制方法では、1つのピークスペクトルに着目して持続性判定を行うため、処理負荷を軽減できる一方で、特殊性雑音信号の抑制処理ができない区間が増えてしまう場合がある。
【0135】
そこで、本実施の形態3に係る雑音信号抑制装置では、処理負荷を抑えつつ、適切に特殊性雑音信号の存在を検出して雑音抑制処理を行うことができる装置を提供することを目的としている。以下、図面を参照して詳細に説明する。但し、実施の形態1、2で既に説明した部分については発明の明確化のため一部説明を省略する。
【0136】
図15は、本実施の形態3に係る雑音信号抑制装置500の構成を示すブロック図である。雑音信号抑制装置500は、収音部201と、時間/周波数変換部202と、ピーク抽出部203と、ピーク独立性判定部204と、雑音信号抑制部206と、周波数/時間変換部207と、出力部208と、ピークスペクトル決定部505と、持続性判定部509と、動作モード決定部510と、エネルギー算出部511と、を備える。
【0137】
エネルギー算出部511は、時間/周波数変換部202より入力する周波数信号について処理単位である複数のサンプルで形成されたサンプル群のエネルギー量(音圧レベル)を算出する。また、エネルギー算出部511は、算出したエネルギー量が所定の基準エネルギー量を超えているかを判定する。当該判定結果は、持続性判定部509に出力される。
【0138】
ピークスペクトル決定部505は、ピーク独立性判定部204で独立していると判定された複数のピークスペクトルの中から最低周波数のピークスペクトルを持続性測定用のピークスペクトルとして決定する。ピークスペクトル決定部505は、決定したピークスペクトルを持続性判定部509に送る。
【0139】
持続性判定部509は、エネルギー算出部511におけるエネルギー算出結果(エネルギー測定結果)や、ピークスペクトル決定部505より送られる測定用ピークスペクトルの持続判定に基づいて、ピークスペクトルが持続しているかの判定を行う。
【0140】
具体的には、持続性判定部509は、エネルギー算出部511からのエネルギー算出結果や、ピークスペクトル決定部505からの測定用ピークスペクトルの持続判定に基づいて内部カウンタで保持する持続性ポイントという値の増減を行う。ここで、持続性ポイントとは、特殊性雑音成分の抑制処理を行うか行わないかを決める持続性判断に関する設定値である。持続性判定部509が計測・管理する持続性ポイントの値は動作モード決定部510に送られる。
【0141】
動作モード決定部510は、持続性判定部509より入力する持続性ポイントの値と基準となるポイント閾値とを比較して特殊信号抑制モードと通常モードとを切り替える。すなわち、動作モード決定部510は、持続性ポイントの値が閾値を上回っている場合は、動作モードを特殊信号抑制モードに設定し、ピーク独立性判定部204で独立したピークスペクトルと判定されて抽出されているピークスペクトルに関する情報を雑音信号抑制部206へ出力する。雑音信号抑制部206は、動作モード決定部510より指定された抑制動作モードに応じ、対象のピークスペクトル信号を入力したピークスペクトルに関する情報に基づいて抑圧する特殊性雑音抑制処理を行う。
【0142】
なお、ピーク抽出部203とピーク独立性判定部204とピークスペクトル決定部505とを合せて、独立ピークスペクトル抽出部590と称する。独立ピークスペクトル抽出部590は、周波数変換された周波数信号の中から独立性を有するピークスペクトルを抽出する。
【0143】
また、ピーク独立性判定部204及びピークスペクトル決定部505を一纏めにして第2ピーク抽出部550と称することがある。同時にピーク抽出部203を特に第1ピーク抽出部203と称することがある。第2ピーク抽出部550は、第1ピーク抽出部203で抽出されたピークスペクトルの中から隣接するピークスペクトルに対して所定値以上の周波数間隔を保持するピークスペクトルを、独立性を有するピークスペクトルとして抽出する。
【0144】
また、持続性判定部509は、独立ピークスペクトル抽出部590で抽出される独立性を有するピークスペクトルが持続する場合に加算され、持続しない場合に減算される設定値を管理する。従って、当該持続性判定部509を設定値管理部509と称することがある。設定値管理部509は、独立ピークスペクトル抽出部590で抽出される独立性を有するピークスペクトルが持続する場合に設定値を加算し、持続しない場合に設定値を減算する。動作モード決定部510は、設定値管理部509で管理される設定値の値が所定の閾値を超えているか超えていないかに基づいて、雑音信号抑制部206が雑音信号を抑制するかしないかを決定する。
【0145】
次に、雑音信号抑制装置500の動作について説明する。
図16は、雑音信号抑制装置500の動作の流れを示すフローチャート図である。ここで、ステップS6001〜S6002、S6006〜S6009、S6017〜S6021は、それぞれ
図11のステップS5001〜S5002、S5005〜S5008、S5012〜S5014と略同一であるため説明を省略する。
【0146】
まず、ステップS6003〜S6005について説明する。エネルギー算出部511は、時間/周波数変換部202より入力する周波数信号について処理単位である複数のサンプルで形成されたサンプル群のエネルギー量(音圧レベル)を求め、所定のエネルギー量を超えているかを判定する(ステップS6003)。当該ステップS6003は、目的とする音声符号化過程における音声信号が雑音の影響を受けるかどうかを入力信号のエネルギーから判断するために行われる。当該判定結果は、持続性判定部509に送られ、持続性判定部509は、ステップS6003の判定結果において入力信号のエネルギー量が基準値を下回っている場合は、持続性ポイントにマイナス値を付与する(ステップS6012)。
【0147】
入力信号に含まれる特殊性雑音、すなわち警告音等の雑音信号は、音圧レベルが低い場合は音声符号化時の音声信号に与える影響は軽微であり、十分な音声品質が保たれる。よって、過大な警告音が存在する場合に限り抑制処理を行えば良い。本実施の形態では、エネルギー算出部511は、入力信号の音圧レベルが80dB以上であるかを判定する。80dB以上であれば、特殊性雑音信号の抑制処理(結果的に処理しない場合もある)を行い、80dB未満であれば、特殊性雑音成分の抑制処理を行うか行わないかを決める持続性判断に関する設定値に対しマイナスの値を付与する。なお、エネルギー算出部511が行うエネルギー量の算出は周波数変換前でも後でも良い。ここで、基準値として設定される音圧レベル80dBとは電車の高架下や工場の騒音などに相当し、音声符号化時に雑音抑制処理が必要なレベルである。
【0148】
次に、ピーク抽出部203は、入力した周波数信号の中からピーク特性を有するピークを抽出する(ステップS6004)。具体的な抽出方法は、既に説明済みであるため説明を省略する。
【0149】
ピーク独立性判定部204は、ピーク抽出部203でピークスペクトルが抽出されているかを判定し、判定結果を持続性判定部509へ送る(ステップS6005)。ピーク独立性判定部204における判定の結果、ピークとなるスペクトルが存在しない、つまり警告音が存在しないまたは存在してもエネルギー成分が低いと判定されている場合は、持続性判定部509は、持続性ポイントに対しマイナスの値を付与する(ステップS6012)。
【0150】
次にステップS6010〜S6016について説明する。ピークスペクトル決定部505は、ピーク独立性判定部204におけるピーク判定に基づいて独立性の有するピークスペクトルが抽出されて登録されているかを判定する(ステップS6010)。判定の結果、独立性の有するピークスペクトルが登録されていない場合、持続性判定部509は、持続性ポイントに対してマイナス値を付与する(ステップS6012)。
【0151】
一方、ステップS6010の判定の結果、独立性の有するピークスペクトルが登録されている場合は、ピークスペクトル決定部505は、当該登録されているピークスペクトルの中から持続性測定用のピークスペクトルを選び出して登録する(ステップS6011)。ここで、ピークスペクトル決定部505は、独立性を有する複数のピークスペクトルが抽出されている場合、その中から最低域ピークスペクトルを選び出し、持続性測定用ピークスペクトルとして登録する。
【0152】
例えば、
図6に示す状態であれば、ピーク独立性判定部204で独立していると判定されるP1〜P3のピークスペクトルのうち、ピークスペクトル決定部505は、最低周波数を有するP1を持続性測定用ピークスペクトルとして決定する。また、
図7に示す状態であれば、ピーク独立性判定部204で独立していると判定されるQ7のピークスペクトルがそのまま持続性測定用ピークスペクトルとして決定される。
【0153】
次に、持続性判定部509は、ステップS6011で選択された測定用ピークスペクトルが持続しているかを判定する(ステップS6013)。すなわち、最低域ピークスペクトルとして選択されたピークスペクトルが時間経過と共に継続して最低域ピークスペクトルに選択されているかを判定する。
【0154】
具体的には、持続性判定部509は、持続性測定用として登録された最低域ピークスペクトルと前回登録済みの最低域ピークスペクトルを用いて、時間的な持続性があるか否かを2つの時間的に隣り合った周波数変換処理にて得られたピークスペクトル情報から判定することで特殊性雑音の時間的な持続性を観察する。
【0155】
多くのサイレン音や、甲高いエンジン音は、その周波数成分が時間と共に変化しても、
極めて短時間であれば周波数変移幅も限定される。特に周波数変換時間幅は上記のように数10msecから数100msecであるため、時間分解能が高ければ高いほど周波数変移は少ない。よって持続性判定部509は、最低域ピークスペクトルに周波数変換時間幅に応じた所定の許容周波数範囲を与え、その範囲内に次の最低域ピークスペクトルが収まっているかを判定することで持続性を判定する。許容範囲は、例えば選択した周波数変換によって得られたスペクトルの前後のスペクトルを含む帯域幅を与える。
【0156】
持続性判定部509は、ステップS6013における判定の結果、持続していると判定した場合は、持続性ポイントにプラス値を付与し(ステップS6014)、持続していないと判定した場合は、持続性ポイントにマイナス値を付与する(ステップS6015)。当該持続性ポイントは、更新される毎に動作モード決定部510に送られる。
【0157】
具体的に、持続性判定部509は、前回登録の最低域ピークスペクトルの前後のスペクトルを含めた帯域に現在登録された最低域ピークスペクトルが存在するか否かを判定する。当該判定の結果、前回登録の最低域ピークスペクトルと今回登録の最低域ピークスペクトルの周波数差が指定の範囲内である場合には持続性があるものと判断し、持続性があることを示すプラスの値を持続性ポイントへ付与する。一方、持続性判定部509は、今回の最低域ピークスペクトルが所定の範囲に収まらない場合には、持続性がないのと判断し、持続性がないことを示すマイナスの値を持続性ポイントへ付与する。この持続性判断によって、突発的な雑音成分によって誤って検出されたピークスペクトルの影響を排除できる。
【0158】
動作モード決定部510は、送られてくる現在の持続性ポイントの値と動作モード切り替えの閾値となる値との比較を行うことで、持続性ポイントが所定数以上であるかを判定する(ステップS6016)。動作モード決定部510は、当該判定結果に基づいて動作モードを抑制モード又は通常モードにセットする。
【0159】
次に、雑音信号抑制装置500における時間経過による持続性ポイントの変化の様子を、
図17に示すピークスペクトルの持続性と動作モードの切り替わりを説明する図と
図16のフローチャート図とを参照して説明する。
図17(c)は、抑制動作モードの移行を決定する持続性ポイント値を示している。
【0160】
図17から分かるように、t0〜t1、t2〜t6、t7〜t9は、ステップS6014に従って持続性ポイントにプラス値が付与される区間である。一方、持続性測定用ピークスペクトルが存在しないt1〜t2、t6〜t7、及びt9以降は、ステップS6012に従って持続性ポイントにマイナス値が付与される区間である。但し、t3、t4、t5、t8のタイミングは、持続性測定用のピークスペクトルが変更されるタイミングであるため、ステップS6015に従って一時的にマイナス値が付与される。
【0161】
なお、
図17からわかるように、持続性ポイントには上限値が設定されており、持続性判定部509は、当該上限値以上に持続性ポイントをプラスしない。すなわち、持続性判定部509は、ステップS6014でプラス値を付与する場合に、既に持続性ポイントが上限値であるかどうかのサブ判定を行い、上限値である場合にはプラス値を付与しない。同様に、持続性判定部509は、ステップS6015でマイナス値を付与する場合に、既に持続性ポイントが下限値0であるかどうかのサブ判定を行い、下限値の0である場合にマイナス値を付与しないとすることができる。
【0162】
このように持続性ポイント値には上限値と下限値を設けることで、動作モードの移行に対し所定の保持時間を働かせることができる。これは動作モードの安定化によって出力信号の急激な変化から生じる違和感を抑える上で効果的である。このような上限値を設定しておくことで、特殊信号が存在しなくなってから通常モードに戻るまでに時間を適正化することができる。
【0163】
図17からわかるように、持続性判定処理は、1つのピークスペクトルをターゲットとして処理を行うため処理負荷が少ないという利点を有しつつ、特殊信号が存在する区間においては適切に特殊信号抑制モードが維持され、雑音信号抑制部206で当該特殊信号に起因する特殊性雑音の抑制処理が行われる。従って、
図13で説明した処理と
図14で説明した処理の両方の利点を備えた雑音信号抑制処理を実現することができる。
【0164】
図18(a)は、音声が含まれるサイレン音の区間に対して特殊性雑音抑制処理を施さない状態で音声符号化復号化装置に入力し、得られた出力信号をスペクトログラムで示した例である。
図18(b)は、音声が含まれるサイレン音の区間に対して特殊性雑音抑制処理を施した信号を音声符号化復号化装置に入力し、出力信号をスペクトログラムで示した例である。入力した音声信号に対して音声符号化等を行う当該音声符号化復号化装置は、出力部208内に設けられても良いし、出力部208の出力先に配置されていても良い。当該音声符号化復号化装置(音声符号化復号化部)において行われる音声符号化における音声符号化方式は、例えば携帯電話で採用されるCELP(Code-Excited Linear Prediction)や無線機などに採用されるVocoder等を用いることができる。
【0165】
図18(a)(b)の対比から明らかなように、特殊性雑音抑制処理を行わない場合は、サイレン音成分(太い横縞)の影響により音声波形の明瞭性が低下しているのがわかる。一方、特殊性雑音抑制処理を行うことで音声波形の縞模様が明確に観察できる。これは音声符号化復号化の過程で音声信号成分の復元作用が働くからである。
【0166】
以上のように本実施の形態3に係る雑音信号抑制装置は、特殊性雑音成分の抑制処理を行うか行わないかを決める持続性判断に関する設定値を増減させて切り替えることを特徴としている。
【0167】
当該雑音信号抑制装置において、独立性を有するピークスペクトルがある場合は、持続性判定部509は、時間的な持続性を観察するための周波数範囲を決定する基準とするため最低域ピークスペクトルを登録した上で持続性判定処理を行う。この時に、持続性判定部509は、前回登録した最低域ピークスペクトル情報を前登録最低域ピークスペクトル情報として別途記録する。そして持続性判定部509は、当該前登録最低域ピークスペクトル情報と今回登録した最低域ピークスペクトル情報とが所定の周波数範囲内であるかどうかを判定することで持続性の判定を行い、判定結果に応じて持続性ポイントにプラス値又はマイナス値が付与される。また、前段の独立性判定により最終的にピークスペクトルが登録されなかった場合は、特殊性雑音が存在しなかったものとみなし、特殊性雑音成分の抑制処理を行うか行わないかを決める持続性判断に関する設定値である持続性ポイントに対しマイナスの値を付与する。
【0168】
上記持続性ポイントに対するプラスの値またはマイナスの値が付与は周波数変換毎に行われる。この持続性ポイントが所定数に達した場合、動作モード決定部410は、特殊性雑音の特徴である持続性が認められたと判断し、特殊性雑音信号の抑制を行う特殊信号抑制モードに移行する。所定数未満であれば、特殊性雑音信号の抑制は行わない通常モードとして処理される。
【0169】
このように、持続性を観察する指標に持続性ポイントを導入することで、警告音の検出にかかる時間及び警告音が止み警告音の非検出にかかる時間を、時間軸上の信号波形によるパターン分析と比較して短縮することができ、すばやく警告音を抑制可能である。また、同時に、警告音が止んだことも(非検出)すばやく判断し、余分な信号成分の抑制をせずに済むため音声信号の品質も保たれる。
【0170】
通常の会話は文節で見れば長い場合もあるが、一つ一つの単語は短時間であり、数100msec程度の時間幅を持っている。一つの単語の時間幅が500msecを超えることはほとんどない。倍音構造を持ち高い音圧レベルのピークスペクトルからなる信号成分を持つ音声信号とサイレンやエンジン音のような特殊性雑音信号との差は、上述の倍音成分の周波数間隔に加えて、一つ一つの音における持続性も重要な要素となる。ある範囲に限定した周波数変移を許容した上で、その特徴的な周波数成分(最低域ピークスペクトル)の推移を一定時間に渡り観察することにより、より正確に特殊性雑音信号の存在を把握できる。一定時間は上記観点から1秒程度で十分である。これは長い周期性サイレン音(5〜10秒)に対して極めて短時間であり、時間信号1周期分によるパターン分析法と比べて、すばやくサイレン音の存在を検出可能であり、雑音成分に対する対策を講じることができる。
【0171】
特殊性雑音信号に混入した音声信号の影響により、最低域ピークスペクトルはその都度抽出されるスペクトルが変更されて安定しない場合もあるが、本実施の形態における雑音信号抑制装置は、持続性の判定を持続性ポイントとして長期タームで観察するため、特殊性雑音信号を抑制する特殊信号抑制モードが維持される。従って、過度なピークスペクトルを抑制することができ、結果として音声符号化過程における音声品質は維持される。
【0172】
なお、上記説明では、持続性ポイントに付与されるプラス値やマイナス値が一定であり、線形的に推移する場合について説明したがこれに限定されるものではない。例えば、
図16において、ステップS6003、ステップS6005、ステップS6010、及びステップS6013における判定結果に基づいて付与されるマイナス値の値を異なるように設定しても良い。例えば、ステップS6003で所定のエネルギー量以上のピークスペクトルが観測されない場合は、特殊信号が存在しなくなったとして、大きいマイナス値を付与するよう構成しても良い。当該構成とすることで、
図17に示すt9以降の通常モードへの抜けを早めることができる。
【0173】
また、言うまでもなく、上記説明した雑音信号抑制装置で用いた特殊性雑音検出機能を取り出して特殊信号検出装置として他の用途に応用することが可能である。
【0174】
(実施の形態4)
火災現場等で消防士が用いる生命維持装置の機能が低下する場合や消防士自身の生体反応が低下する際に発せられる報知音として、高域に極めて強いスペクトルを有する報知音が用いられる。
図19は、このような緊急性を要する生命維持装置等の報知音のスペクトログラム図を示している。
図19から分かるように、高域に強いエネルギーを持ったスペクトル群の存在が見て取れる。この強い成分の影響で、サイレン音のような警報音と同様、通信装置に用いられる音声符号化方式の処理過程で音声情報に費やされる情報量が低下し、音声信号が正しく伝達されず、また、高域の強い周波数成分が耳障りな音となり聞き取れないといった状況が発生する。
【0175】
そこで、本実施の形態4に係る雑音信号抑制装置は、特殊な特徴を有する報知音を適切に検出して抑制することを特徴とする。以下図面を参照して詳細に説明する。
【0176】
図20は、本実施の形態4に係る雑音信号抑制装置600の構成を示すブロック図である。雑音信号抑制装置600は、収音部601と、時間/周波数変換部602と、ピーク抽出部603と、最低域ピーク周波数分析部604と、持続性判定部605と、動作モード決定部606と、雑音信号抑制部607と、周波数/時間変換部608と、出力部609と、を備える。
【0177】
収音部601は、音声や雑音を収音する。収音部601で収音された目的音を含む周囲の音声は、時間領域の音声信号として時間/周波数変換部602に送られる。
【0178】
時間/周波数変換部602は、収音部601にて取得された音声信号を時間領域から周波数領域の周波数信号へ変換する処理を行う。なお、時間/周波数変換部602は、報知音を検出できればよいので100Hz以上の周波数分解能であってもよい。
【0179】
ピーク抽出部603は、時間/周波数変換部602にて周波数領域信号に変換されたスペクトル信号の中からエネルギー成分が極めて高いスペクトルを抽出する。
【0180】
最低域ピーク周波数分析部604は、ピーク抽出部603で抽出されたピークスペクトルのうち、最低域のピークスペクトルが所定の周波数以上であるかを判定する。具体的には、最低域ピーク周波数分析部604は、最低域のピークスペクトルが2kHz以上であるかを判定する。
【0181】
持続性判定部605は、最低域ピーク周波数分析部604で所定の周波数以上と判定された最低域のピークスペクトルが持続しているかを判定する。すなわち、抽出されたピークスペクトルの最低域周波数が2kHz以上であるかを時間経過と共に継続して抽出されたかを判定する。
【0182】
動作モード決定部606は、持続性判定部605における判定結果に基づいて雑音信号を抑制するかしないかを決定する。具体的に、動作モード決定部606は、自身が有する通常モードと特殊信号抑制モードのいずれかのモードに、持続性判定結果に基づいて切り替える。
【0183】
雑音信号抑制部607は、動作モード決定部606において特殊信号抑制モードとして雑音信号を抑制すると決定されている場合は、時間/周波数変換部602より出力される周波数領域の周波数信号から特殊性雑音信号を取り除く。雑音信号抑制部607は、雑音抑制を行った後の周波数信号を周波数/時間変換部608に出力する。
【0184】
周波数/時間変換部608は、雑音信号抑制部607より入力する周波数信号を時間領域の音声信号に変換する。周波数/時間変換部608は、変換後の音声信号を出力部609に出力する。
【0185】
出力部208は、周波数/時間変換部207から入力した音声信号に必要に応じて音声符号化を行い、外部に出力する。出力部208は、上記入力した音声信号を外部に無線送信する無線送信手段であっても良い。
【0186】
次に、雑音信号抑制装置600の動作について説明する。
図21は、雑音信号抑制装置600の動作の流れを示すフローチャート図である。
【0187】
収音部601で収音される音声は時間領域の音声信号として時間/周波数変換部602へ送られる(ステップS7001)。次に、時間/周波数変換部602は入力した時間領域の音声信号を周波数領域の周波数信号に変換する(ステップS7002)。周波数変換及び逆周波数変換は所定の時間幅で形成されたサンプル群を単位として処理される。そして入力信号のサンプリングレートと周波数変換部のサンプル数によって周波数分解能が決定される。
【0188】
続いて、ピーク抽出部603は、時間/周波数変換部602より入力したスペクトル全体の平均値を算出する。求めたスペクトル全体の平均値と個々のスペクトルのエネルギーを比較し、注目するスペクトルが周囲のスペクトルのエネルギー(平均的なスペクトルのエネルギー)に対し、高いエネルギー比率を有しているか、すなわちピーク特性を備えているかを見て、スペクトルのピークを抽出する。(ステップS7003)ピーク特性の有無の判定基準は前述のように平均エネルギーに対し12dB以上の差を持ったスペクトルとすることができる。
【0189】
続いて、最低域ピーク周波数分析部604は、全周波数スペクトルの内、ピーク特性を持つスペクトルが抽出されたかを判定する(ステップS7004)。判定の結果、抽出ピークが存在しない、つまり報知音が存在しないか、または、存在してもエネルギー成分が低い場合は、報知音は無いものとして処理を終了する。一方、抽出ピークがある場合は、最低域ピーク周波数分析部604は、抽出されたピークスペクトルのうち最低域のピークスペクトルが基準値である2kHz以上であるかを判定する(ステップS7005)。
【0190】
報知音は人工的な信号であり、かつ高域に分布し、デジタル信号の帯域が一般的な音声処理で用いられる0〜4000Hzの帯域であれば、倍音成分を含まない2kHz以上の帯域に分布する。更に
図19に示すように、周波数が一定ではなく、早い周波数変化を伴った帯状の周波数分布であるという特徴を有している。
【0191】
従って、これら特有の報知音を検出するには低域に基本周波数となる成分を持たず、高域に継続してピーク特性を持った周波数成分の存在を観察すれば良い。このような観点により、最低域ピーク周波数分析部604は、報知音の検出に当たり、最低域のピークスペクトルが2kHz以上であるかを判定する。
【0192】
ステップS7005における判定の結果、2kHz以上の周波数を有する最低域ピークスペクトルが存在する場合、当該最低域ピークスペクトルが持続しているかを判定する(ステップS7006)。具体的には、持続性判定部605は、最低域のピークスペクトルを中心とする所定の帯域幅内に、次の周波数変換処理で得られた最低域のピークスペクトルが存在している場合に、持続して存在していると判定する。このように、持続性判定部605は、倍音成分を持たない2kHz以上のピークスペクトルが継続的に抽出されたかを前周波数変換処理にて取得したピークスペクトル情報と比較することで行うことができる。
【0193】
次に、動作モード決定部606は、前記最低域ピーク周波数分析部604で所定の周波数以上と判定された最低域のピークスペクトルが所定期間以上持続しているかを判定する(ステップS7007)。当該判定の結果、持続していると判定した場合は、動作モード決定部606は、雑音信号抑制部607において雑音信号の抑制を行うと決定し、当該動作モード決定部606における前記決定に基づいて前記雑音信号が抑制される(ステップS7008)。その後、周波数/時間変換部608で逆変換されて音声信号が取得される(ステップS7009)。当該取得された音声信号は出力部609より出力される。
【0194】
当該構成とすることで、強力なパワーを有する報知音を適切に特殊性雑音信号として抑制することができる。なお、上記説明では、特殊性雑音信号の抑制処理についてのみ説明したが、従来の周波数差し引き法に代表されるような周波数領域上にて雑音信号を抑制する装置に、特殊性雑音信号の抑制装置を導入することも可能である。この組み合わせにより、従来の雑音信号抑制効果を加えた特殊性雑音信号抑制装置が実現でき、報知音と共に周囲雑音をも軽減可能な雑音抑制装置を提供できる。報知音抑制装置に関しては、本例のようにFFTやDCTに代表される周波数変換方法を用いても良いし、FIRやIIRのような多段フィルタ構成による周波数分割法を用いても良い。
【0195】
また、当該説明では、雑音信号抑制部607は、これまでの実施の形態と同様、ピーク抽出部603で抽出されたピークスペクトル信号を用いて抑制処理を行う場合について説明したが、これに限定されるものではない。
図22に示すように、新たにピークスペクトル決定部610を設けても良い。
【0196】
図22において、ピークスペクトル決定部610は、ピーク抽出部603で抽出されたピークスペクトルの最低域周波数と最高域周波数とを登録する。より正確には、ピークスペクトル決定部610は、最低域ピーク周波数分析部604で2kHz以上と判定された最低域のピークスペクトルの周波数を最低域周波数として登録し、最高域のピークスペクトルの周波数を最高域周波数として登録する。
【0197】
ここで、雑音信号抑制部607は、動作モード決定部606からの決定に従って、雑音抑制を行う場合に、上記ピークスペクトル決定部610で登録された最低域周波数と最高域周波数との間に挟まれた帯域全てのスペクトルを雑音信号として抑制する。
【0198】
図19のスペクトログラム図からも解かるように、対象となる報知音は周波数変化量が早いため、スペクトル単位で抑制するより、広帯域で抑制処理を施す方が効果的である。音声信号の成分の多くは2kHz未満に存在するため、音声の重要な要素に対する影響は限定される。よって抑制対象とする帯域はピークスペクトル抽出結果から最低域ピークスペクトルと最高域ピークスペクトルで挟まれた帯域全てのスペクトルを指定する。このように強いスペクトルが存在する帯域に限定することで音声に与える影響を最小限に抑えることができる。例えば
図19のような報知音であれば、2kHz全体を抑制するのではなく、濃い縞模様の下限及び上限に挟まれた帯域を対象として抑制効果が働くため、特に音声信号の中でも子音のように高域にエネルギー成分が偏る単語でも、部分的な損傷で済み、音声品質は維持される可能性が高い。
【0199】
最低域ピーク周波数が2kHzということはそれ自体が倍音構造を成していない音(人工的な報知音)であることが推定できる。このような人工的な強い高周波成分が継続して存在する状態を検知して、高周波成分全体を抑制することができる。
【0200】
なお、上記説明では雑音信号抑制装置について説明したが、同様の原理を利用した報知音検出装置とすることも可能である。
図23は、当該報知音検出装置700の構成を示すブロック図である。報知音検出装置700は、収音部701と、時間/周波数変換部702と、ピーク抽出部703と、最低域ピーク周波数分析部704と、持続性判定部705と、報知音検出部706と、を具備する。ここで、収音部701〜持続性判定部705は、
図20に示す収音部601〜持続性判定部605と略同一であるため一部説明を省略する。
【0201】
最低域ピーク周波数分析部704は、ピーク抽出部703で抽出されたピークスペクトルのうち、最低域のピークスペクトルが所定の周波数以上であるかを判定する。ここで、当該所定の周波数は、2kHzか、又はその付近の値に設定することが好ましい。
【0202】
持続性判定部705は、最低域ピーク周波数分析部704で所定の周波数以上と判定された前記の最低域のピークスペクトルが持続しているかを判定する。ここで、持続性判定部705は、最低域ピーク周波数分析部704で所定の周波数(ここでは2kHzとする)以上と判定された前記の最低域のピークスペクトルを中心とする所定の帯域幅内に、次の周波数変換処理で得られた前記の最低域のピークスペクトルが存在している場合に、最低域のピークスペクトルが持続していると判定することができる。
【0203】
なお、持続性判定部705は、最低域ピーク周波数分析部704で所定の周波数以上と判定された最低域のピークスペクトルを中心とする所定の帯域幅内に、次の周波数変換処理で得られた前記の最低域のピークスペクトルが存在している場合に、最低域のピークスペクトルが持続していると判定するのではなく、次の周波数変換処理で得られた前記の最低域のピークスペクトルが、所定の周波数以上に存在する場合に、最低域のピークスペクトルが持続していると判定してもよい。
【0204】
報知音検出部706は、最低域ピーク周波数分析部704で所定の周波数以上と判定された最低域のピークスペクトルが所定期間以上持続している場合に、最低域のピークスペクトルは報知音によるものであるとみなして報知音を検出する。報知音検出部706は、報知音を検出した場合に、報知音を検出したことを示す報知音検出情報を送信部708に出力する。
【0205】
なお、報知音検出装置700は、更にID記憶部707と送信部708とを具備している。ID記憶部707は、装置又はユーザを識別する識別IDを記憶する。送信部708は、前記報知音検出部706で報知音が検出された場合に、当該IDと報知音が検出されたことを示す報知音検出情報とを外部に送信する。
【0206】
図24は、当該報知音検出装置700の動作の流れを示すフローチャート図である。ここでステップS8001〜ステップS8006は、
図21で説明したステップS7001〜ステップS7006と略同一であるため説明を省略する。
【0207】
報知音検出部706は、持続性判定部705によるステップS8006の判定結果に基づき、最低域ピーク周波数分析部704で所定の周波数以上と判定された最低域のピークスペクトルが所定期間以上持続しているかを判定する(ステップS8007)。所定期間以上持続している場合は、報知音検出部706は、報知音が鳴っていると判断し、ID言記憶部より端末(装置)又はユーザを一意に識別する識別情報であるIDを読み出す(ステップS8008)。
【0208】
続いて送信部708は、当該読み出されたIDと対応付けて報知音を検出していることを示す報知音検出情報を外部に送信する(ステップS8009)。
【0209】
なお、外部に送信するIDは音声送信時に音声情報にIDが付加され、音声情報と共に報知音検出情報を送信する場合は、改めてIDを読み込まなくともよい。この場合は、ステップS8008をスキップし、ステップS8007において所定期間以上持続していると判定された場合に、ステップS8009に進む構成であっても良い。また、例えば音声送信の相手先に送信する場合、IDを付けなくともよい場合もある。また、IDとしては通信機器に割り当てられた識別番号などが考えられる。
【0210】
また、報知音検出部706は、検出した報知音の種類を判定する構成であっても良い。送信部706は、報知音検出部706で判定された上記報知音の種類とIDとを関連付けて送信しても良い。
【0211】
報知音検出部706で検出される2k以上のスペクトルによる報知音は、生命維持装置などに用いられる。従って、報知音検出装置700は、生命維持装置が作動していると判定し、通信相手に、端末に対応付けられたIDと共に送信する構成とすることで、第3者が適切な対応を取ることが可能となる。なお、報知音検出情報は、予め定めた送信先に送信しても良い。
【0212】
(実施の形態5)
本実施の形態5に係る雑音信号抑制装置は、実施の形態3の雑音信号抑制装置と同様、持続性ポイントの増減を行うことで動作モードを切り替えることを特徴とする。なお、本実施の形態5に係る雑音信号抑制装置及び報知音検出装置のブロック図は、それぞれ
図22と
図23とを流用して説明する。
【0213】
本実施の形態5に係る雑音信号抑制装置及び報知音検出装置において、持続性判定部605、持続性判定部705は、それぞれ最低域のピークスペクトルが持続していると判定した場合に加算し、前記最低域のピークスペクトルが持続していないと判定した場合に減算する設定値を更に管理する。雑音信号抑制装置600にあっては、当該設定値が所定の閾値を超えているか否かに基づいて動作モードが切り替えられる。
【0214】
また報知音検出装置700にあっては、報知音検出部706は、前記設定値が所定の閾値を超えている場合に報知音を検出する。ここで、ピーク抽出部703においてピークスペクトルが検出されない場合、及び、最低域ピーク周波数分析部704において最低域のピークスペクトルが所定の周波数以上では無いと判定される場合、持続性判定部705は、前記設定値を減算する。
【0215】
図25は、本実施の形態5に係る雑音信号抑制装置の動作の流れを示すフローチャート図である。収音部601は、音声を収音して時間領域の音声信号を出力する(ステップS9001)。時間/周波数変換部602は、入力した音声信号を周波数領域の周波数信号へ変換する(ステップS9002)。
【0216】
次に、ピーク抽出部603は、処理単位である複数のサンプルで形成されたサンプル群のエネルギー量(音圧レベル)を求め、所定のエネルギー量を超えているかを判定する(ステップS9003)。当該判定は、目的とする音声符号化過程における音声信号が雑音の影響を受けるかどうかを入力信号のエネルギーから判断するために行われる。入力信号に含まれる特殊性雑音、すなわち、報知音の雑音信号は、音圧レベルが低い場合は音声符号化時の音声信号に与える影響は軽微であり、十分な音声品質が保たれる。よって、過大な報知音が存在する場合に限り抑制処理を行えば良い。従って、ピーク抽出部603は、入力信号の音圧レベルが80dB以上であるかを判定する。80dB以上であれば、特殊性雑音信号の抑制処理(結果的に処理しない場合もある)を行い、80dB未満であれば、特殊性雑音成分の抑制処理を行うか行わないかを決める持続性判断に関する設定値である持続性ポイントに対しマイナスの値を付与する(ステップS9009)。エネルギー量の算出は周波数変換前でも後でも良い。
【0217】
続いて、ピーク抽出部603はピークスペクトルを抽出する(ステップS9004)。次に、ピーク抽出部603は、ステップS9004において抽出したピークスペクトルがあるかを判定する(ステップS9005)。抽出ピークが無い場合は(ステップS9005のNo)、持続性ポイントにマイナス値を付与する(ステップS9009)。一方、抽出ピークがある場合(ステップS9005のYes)、最低域ピーク周波数分析部704は、抽出されたピークスペクトルのうち最低域のピークスペクトルが基準値である2kHz以上であるかを判定する(ステップS9006)。判定の結果、2kHz以下である場合は、持続性ポイントに対しマイナスの値を付与する(ステップS9009)。一方、2kHz以上であれば、最低域ピークスペクトルの新旧比較を行い、当該ピークスペクトルが持続しているかを判定する(ステップS9007)。持続していない場合、持続性ポイントに対しマイナスの値を付与する(ステップS9009)。持続している場合、持続性ポイントに対しプラスの値を付与する(ステップS9008)。動作モード決定部606は、持続性ポイントが所定の閾値以上であるかを判定する(ステップS9010)。閾値以下である場合は、雑音抑制処理を行わない通常モードへ移行する(ステップS9011)。一方、閾値以上である場合は、報知音が鳴っているとして、第1にID記憶部よりIDを読み込み(ステップS9012)、当該IDと対応付けて、報知音を検出していることを示す報知音情報を外部に送信する(ステップS9013)。続いて、動作モード決定部606は、特殊信号抑制モードへ移行し(ステップS9014)、ピークスペクトル決定部610で登録された最低域周波数と最高域周波数との間のスペクトルに関するスペクトル情報が雑音信号抑制部607に伝送され(ステップS9015)、当該範囲を指定スペクトルとして、雑音信号抑制部607は、雑音抑制処理を行う(ステップS9016)。最後に周波数/時間変換処理が行われて音声信号が出力される(ステップS9017)。このように報知音を抑制し、音声品質の改善を図る一方、音声信号を受信する側に報知音の存在を知らせることができるため、必要な情報である音声信号と緊急情報(報知音の存在)の送信を両立することが可能である。
【0218】
続いて、上述した最低域ピークに基づく判定処理と独立性に基づく判定処理を組み合わせた雑音信号抑制装置について説明する。当該装置では3つの動作モードを切り替えて雑音信号抑制を行う。ここで、最低域ピークに基づく判定処理は、報知音を検出するために、また、独立性に基づく判定処理は、主に警告音を検出するためにそれぞれ行われる。
【0219】
ここで、報知音とは、高周波成分からなる報知音(パスアラーム:Personal Alert Safety System Alarms)、生命維持診断、酸素ボンベ残量等の報知に用いるパスアラームなどである。一方、警告音とは、サイレン音、甲高いエンジン音などの倍音成分からなるトーン性の人工的な信号であり、共に長期的周期性雑音である。
【0220】
第1に、抽出ピークがあるかの判定処理が行われる(ステップS11)。ピークが抽出されていない場合は、通常モードに設定される(ステップS16)。一方ピークが抽出されている場合、抽出されたピークのうち最低域ピークスペクトルが2kHz以上であるかを判定する(ステップS12)。2kHz以上である場合は報知音検出モードに移行する(ステップS14)。一方、2kHz以下である場合は独立性ピークスペクトルがあるかを判定する(ステップS13)。独立性ピークスペクトルがある場合は、警報音検出モードに移行する(ステップS15)。一方、独立性ピークスペクトルが無い場合は通常モードへ移行する(ステップS16)。
【0221】
上記判定処理でいずれかの動作モードにセットされた後、動作モードが現フレームと同一かどうかを判定することで動作モードの持続性を判定する(ステップS17)。各動作モードが持続していない場合は、持続性ポイントにマイナス値が付与される(ステップS20)。一方、動作モードが持続している場合は、動作モード別にピークスペクトルの持続性を判定する(ステップS18)。各動作モード内でピークスペクトルが持続している場合は、持続性ポイントにプラス値が付与され(ステップS19)、持続していない場合はマイナス値が付与される(ステップS20)。
【0222】
続いて、持続性ポイントが所定数以上であるかを判定する(ステップS21)。判定の結果、所定値以下であれば通常モードに移行し(ステップS23)、所定値以上であれば、直前の処理ブロックで使用していた検出モードである前動作モードを継続する(ステップS22)。
【0223】
このように、報知音と警告音の両方を検出する報知音検出装置(特殊信号検出装置)にあっては、最低域ピーク周波数分析部の後段にピーク独立性判定部が配置されることになる。このピーク独立性判定部は、最低域ピーク周波数分析部において、ピーク抽出部で抽出されたピークスペクトルのうち、最低域のピークスペクトルが所定の周波数以上ではないと判定された場合、前記抽出されたピークスペクトルが隣接する前記ピークスペクトルに対して所定値以上の周波数間隔を保持しているかを判定する。ここで持続性判定部は、当該ピーク独立性判定部において隣接するピークスペクトルに対して所定値以上の周波数間隔を保持していると判定された前記ピークスペクトルが持続しているかに関する第2の判定を行う。報知音検出部は、持続性判定部における前記第2の判定の結果に基づいて警告音を検出する。当該構成とすることで、報知音検出装置は、報知音を優先的に検出しながらも、報知音と比べて低周波数領域にピークスペクトルを有する警告音も合わせて検出することができる。
【0224】
以上各実施の形態で説明したように、本発明は、例えば、移動体通信にて要求される雑音低減処理には、低遅延信号分析、即時応答特性(雑音低減効果の即時実効性)、周囲雑音も含む雑音低減性能、低消費電力、などの要素が求められる点に着目し、これらの要求を満たす解決手段を提供している。すなわち、従来の特殊な信号であるサイレン音のような警告音を検出及び抑制する方法では、特殊性雑音信号を検出するために警告音の基本周波数を導く上で調和解析や参照バッファを備えたパターン分析等を必要とし、分析するための処理時間が必要であった。また、調和解析、倍音判定、パターン分析は複雑な信号処理が必要であり、利便性や回路規模の増大などの課題があった。また、対象である警告音以外の成分、例えば音声や周囲の雑音信号による影響も加味しなければならない。このような課題に対し、適切な対処を行っている。
【0225】
音声信号は符号化する際に、非常に高い音圧レベルのサイレン音や報知音、エンジン音等が混入すると、音声信号の符号化品質が著しく低下する。これは音声の特徴である声道の振動をモデル化することによって高効率な符号化を成しえていることに起因し、トーン性を有する信号と音声信号との区別が困難なことにある。音声信号と雑音信号の区別がつかないため、雑音信号に情報量が配分され音声品質が低下する。上記の特殊な信号の検出には、これまで数秒間の分析時間や調和解析、参照バッファを備えたパターン分析等の複雑な信号処理が必要であり、利便性に課題があった。また、音声信号との区別が困難なため、音声信号が混入する際には特殊性信号の検出性能の低下、更には音声信号を誤って判定したことによる音声信号の欠落(音声を間違って抑制してしまう)を招いていた。
【0226】
音声符号化方式の特徴として、主成分である基本周波数付近の周波数要素を保護することにより、符号化復号化の過程にて高域成分が復元される可能性があり、非主成分である中高域(約400Hz以上)に存在する強い雑音スペクトルを、幾つかでも抑制することで音声符号化品質を著しく改善することができる。従って完全に特殊性雑音(サイレン等)を抑制せずとも簡易な方法である程度抑制できれば、用途によって(低レートの音声符号化方式を用いる通信装置など)は十分効果が発揮される。
【0227】
本発明の一態様では、音声入力信号を周波数領域信号に変換後、全体の音量及び近傍周波数帯のスペクトルとの比較により極めて高いエネルギーを持つ独立性を有するスペクトルを抽出することで、音声信号スペクトルが誤って削減対象であるピークスペクトルとして抽出される可能性を排除している。音声の基本周波数である100〜400Hzのスペクトル信号を独立性(ピークスペクトル同士の接近度)の観点から排除することで、音声信号と特殊信号(約400Hz以上のトーン性の信号)との区別が可能となる。倍音判定、パターン判定は必要なく、ある程度の特殊性スペクトル(高域成分)を抽出できる。(多少残っていても、音声符号化に与える深刻な影響は低減される)。
【0228】
また、本発明の一態様では、特殊性ノイズ信号として着目するスペクトルをピークスペクトルの内、最低域のピークスペクトルに限定し、持続性を判定するための持続性の判定処理負荷を軽減している。着目する周波数は1箇所で良い。例え何らかの要因(音声が混入したときなど)によって最低域ピークスペクトルが移動したとしても、持続性計測数に所定の閾値を設け、持続性を長期タームで観察するため、特殊性ノイズ信号の混入は短時間で済むか、又は検出されないスペクトルは低域に限定される(高域のスペクトルは特殊性ノイズと判断され検出及び低減される)。
【0229】
また、本発明の一態様では、音声信号を含まないピークスペクトル信号の持続性を観察することで、長い周期性を有する特殊信号の調和構造やパターン分析を実施しなくとも(通常5秒程度は必要、少なくともサイレン音であれば1パターン分の時間)、一定時間の持続性(1秒以内で十分)を検出することで音声符号化の妨げとなる特定の過大信号を抑制する抑制動作モードにすばやく移行する。持続性は最低域ピークスペクトルの持続性が検出された場合プラスに、非検出の際はマイナスの数値を付与し、音声信号による影響(音声信号と明確に区別がつかない非独立性を持つピークスペクトルを排除)を回避しながら持続性を観察する。また最低域ピークスペクトルを中心とする所定の帯域幅へと観察範囲(50〜100Hz程度:周波数分解時間幅による)を拡張することで、周波数が変化する特殊性ノイズに対しても追従できる。
【0230】
また、本発明の一態様では、音声信号のデジタル化にて一般的に用いられる8kHzサンプリング(有効帯域0〜4kHz)において、2kHzを超える帯域に強い周波数成分が存在し、その存在が持続することにより人工的な報知音が入力されている可能性が高いことを検知し抑制動作に移行する。2kHz以上にピークがあるということは、検出されたピークは倍音に相当するピークではなく、ある特殊な信号(人工的な報知音)の基本周波数であることが推測できる。このような2kHzにピークが存在し更に持続性を観察することで、調和解析、パターン分析、倍音判定をせずとも報知音の有無を判定できる。音声符号化に妨げとなる強い高域成分の分布を抽出されたピークの下限上限から推定し下限から上限までの周波数全体を抑制する。高域成分の広範囲な抑制により音質変化は伴うが意思疎通を図る上で音声の重要な要素である中低域部分の保全が図られる効果は大きい。
【0231】
なお、上記説明では最低域ピークスペクトルを検出する閾値として2kHzである場合について説明したが、これに限定されるものではない。報知音より低い周波数であって、音声よりも高い周波数を閾値として設定しても良い。最低域ピーク周波数分析部は、前段のピーク抽出部で抽出された複数のピークスペクトルの中で最低域のピークスペクトルが上記閾値よりも高い周波数を有するかを判定することになる。
【0232】
なお、言うまでもなく、上記各実施の形態1〜5をお互い組み合わせることが可能である。また、本発明の報知音検出装置、雑音信号抑制装置、報知音検出方法、雑音信号抑制方法は、例えば、通信機器または、通信機器の外部マイクロホンなどに適用する。
【0233】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上記の処理は、メインプロセッサのROM等に格納されたコンピュータプログラムによって実行可能である。上述の例において、各処理をコンピュータ(プロセッサ)に行わせるための命令群を含むプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。