(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022011893
(43)【公開日】2022-01-17
(54)【発明の名称】ノイズ抑圧回路
(51)【国際特許分類】
G10L 21/0208 20130101AFI20220107BHJP
G10L 25/78 20130101ALI20220107BHJP
G10L 21/0232 20130101ALI20220107BHJP
【FI】
G10L21/0208 100Z
G10L25/78
G10L21/0232
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2020113301
(22)【出願日】2020-06-30
(71)【出願人】
【識別番号】000004330
【氏名又は名称】日本無線株式会社
(74)【代理人】
【識別番号】100126561
【弁理士】
【氏名又は名称】原嶋 成時郎
(74)【代理人】
【識別番号】100141678
【弁理士】
【氏名又は名称】佐藤 和彦
(72)【発明者】
【氏名】今里 康二郎
(57)【要約】 (修正有)
【課題】入力される信号から、本来受信したい目的信号への影響を最小限に抑えつつ、雑音成分を適切に減算する。
【解決手段】ノイズ抑圧回路7は、処理対象のフレームが音声の始まりに該当するフレームであるか否かを判定するとともに音声の始まりに該当するフレームに後続するフレームを音声開始後続フレームとして特定するフレーム属性決定部71と、処理対象のフレームの振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための抑圧係数Gi(f)を算出する抑圧係数算出部72と、抑圧係数Gi(f)と振幅スペクトルに該当する信号Yi(f)とを乗じて減算処理後の振幅スペクトルSi(f)を算出する抑圧部73とを有する。音声開始後続フレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αの値が、その他のフレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αの値よりも小さい値に設定される。
【選択図】
図2
【特許請求の範囲】
【請求項1】
処理対象のフレームが音声の始まりに該当するフレームであるか否かを判定するとともに前記音声の始まりに該当するフレームに後続するフレームを音声開始後続フレームとして特定するフレーム属性決定部と、
前記処理対象のフレームの振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための抑圧係数を算出する抑圧係数算出部と、
前記抑圧係数と前記振幅スペクトルに該当する信号とを乗じて減算処理後の振幅スペクトルを算出する抑圧部と、を有し、
前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値が、その他のフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値よりも小さい値に設定される、
ことを特徴とするノイズ抑圧回路。
【請求項2】
前記音声の始まりに該当するフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値も、前記その他のフレームについての前記抑圧係数を算出する際に用いられる前記忘却係数の値よりも小さい値に設定される、
ことを特徴とする請求項1に記載のノイズ抑圧回路。
【請求項3】
前記音声の始まりに該当するフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値と、前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値とが異なる、
ことを特徴とする請求項2に記載のノイズ抑圧回路。
【請求項4】
前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値が、前記音声開始後続フレームによって変化する、
ことを特徴とする請求項1から3のうちのいずれか1項に記載のノイズ抑圧回路。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ノイズ抑圧回路に関し、例えば、高周波信号を送受信する無線機に組み込まれるノイズリダクション回路に用いられ得るノイズ抑圧回路に関する。
【背景技術】
【0002】
音声信号に含まれる雑音成分を抑圧する手法としてスペクトル減算法(Spectral Subtraction)が知られている(例えば、特許文献1、非特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【非特許文献1】P.Scalart and J.Vieira Filho「Speech Enhancement Based on a Priori Signal to Noise Estimation」,IEEE International Conference on.Acoustics,Speech,Signal Processing,Atlanta,GA,USA,vol.2,pp.629-632,1996年
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、スペクトル減算法を適切に適用するためには、入力される信号から、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、雑音成分を適切に減算することが重要である。
【0006】
そこでこの発明は、入力される信号から、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、雑音成分を適切に減算することが可能な、ノイズ抑圧回路を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、請求項1に記載の発明は、処理対象のフレームが音声の始まりに該当するフレームであるか否かを判定するとともに前記音声の始まりに該当するフレームに後続するフレームを音声開始後続フレームとして特定するフレーム属性決定部と、前記処理対象のフレームの振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための抑圧係数を算出する抑圧係数算出部と、前記抑圧係数と前記振幅スペクトルに該当する信号とを乗じて減算処理後の振幅スペクトルを算出する抑圧部と、を有し、前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値が、その他のフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値よりも小さい値に設定される、ことを特徴とするノイズ抑圧回路である。
【0008】
請求項2に記載の発明は、請求項1に記載のノイズ抑圧回路において、前記音声の始まりに該当するフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値も、前記その他のフレームについての前記抑圧係数を算出する際に用いられる前記忘却係数の値よりも小さい値に設定される、ことを特徴とする。
【0009】
請求項3に記載の発明は、請求項2に記載のノイズ抑圧回路において、前記音声の始まりに該当するフレームについての前記抑圧係数を算出する際に用いられる忘却係数の値と、前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値とが異なる、ことを特徴とする。
【0010】
請求項4に記載の発明は、請求項1から3に記載のノイズ抑圧回路において、前記音声開始後続フレームについての前記抑圧係数を算出する際に用いられる忘却係数の値が、前記音声開始後続フレームによって変化する、ことを特徴とする。
【発明の効果】
【0011】
請求項1に記載の発明によれば、非音声(具体的には、ノイズ)から音声へと変わる際の忘却係数を非音声または音声が連続する定常状態の忘却係数と比べて小さくすることにより、入力される信号から、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、雑音成分を適切に減算することが可能となる。具体的には、処理対象の信号に含まれる雑音成分を抑圧するための抑圧係数の算出に使用される忘却係数によって雑音成分の抑圧レベルが過去のデータに影響を受けるところ、非音声(具体的には、ノイズ)から音声へと変わる際には、抑圧係数が大きく変化することになるため、忘却係数が大きいと声の抑揚が抑えられてしまい、一方で、忘却係数が小さいと非音声または音声が連続する定常状態での雑音成分の抑圧量が低下してしまう。そして、スペクトル減算法を実現する従来の回路では、忘却係数として固定値を使用するようにしているため、声の抑揚が極端に抑えられてしまったり雑音成分の抑圧量が極端に低下してしまったりする、という問題がある。これに対して、請求項1に記載の発明では、非音声から音声へと変わる際の忘却係数を非音声または音声が連続する定常状態の忘却係数と比べて小さくするようにしているので、非音声または音声が連続する定常状態と非音声から音声へと変わる際とのそれぞれの忘却係数を適切に制御して、雑音成分の抑圧による声の抑揚の制限を最小化しつつ雑音成分の抑圧量を確保することができ、延いては、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、入力される信号から雑音成分を適切に減算することが可能となる。
【0012】
請求項2ないし請求項4に記載の発明によれば、環境によっては請求項1に記載の発明よりも良好に、雑音成分の抑圧による声の抑揚の制限を最小化しつつ雑音成分の抑圧量を確保することができ、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、入力される信号から雑音成分を適切に減算することが可能となる。
【図面の簡単な説明】
【0013】
【
図1】この発明の実施の形態に係るノイズ抑圧回路を含むノイズリダクション回路の概略構成を示す機能ブロック図である。
【
図2】実施の形態に係るノイズ抑圧回路の概略構成を示す機能ブロック図である。
【
図3】音声信号の時間波形におけるフレーム属性の特定の例を示す図である。
【
図4】(A)は、忘却係数として固定値を使用した場合の、ディエンファシス回路から出力される音声信号の時間波形を示す図である。(B)は、
図2のノイズ抑圧回路の作用効果の検証例を示す図であり、忘却係数を変化させた場合の、ディエンファシス回路から出力される音声信号の時間波形を示す図である。
【発明を実施するための形態】
【0014】
以下、この発明を図示の実施の形態に基づいて説明する。
【0015】
図1は、この発明の実施の形態に係るノイズ抑圧回路7を含むノイズリダクション回路1の概略構成を示す機能ブロック図である。
図2は、実施の形態に係るノイズ抑圧回路7の概略構成を示す機能ブロック図である。
【0016】
ノイズリダクション回路1は、例えば、高周波信号を送受信する無線機に組み込まれて、音声信号に含まれる雑音成分を抑圧する手法であるスペクトル減算法(Spectral Subtraction)を実現する回路であり、主として、プリエンファシス回路2と、窓処理部3と、時間周波数変換部4と、変換結果出力部5と、音声区間検出・ノイズ更新部6と、ノイズ抑圧回路7と、合成部8と、周波数時間変換部9と、ディエンファシス回路10と、を有する。
【0017】
プリエンファシス(Pre-Emphasis:PE)回路2は、アンテナから受信した高周波信号を復調した音声信号に対して高周波成分の相対強度を予め増幅する高域強調処理を施して、高域強調処理後の信号を出力する。
【0018】
窓処理部3は、プリエンファシス回路2から出力される高域強調処理後の信号の入力を受け、入力された前記信号から所定の時間長さのフレームを抽出する(例えば、12.5msごとに25ms分の時間波形を抽出する)とともに、各フレームに対して例えばハニング窓などの窓関数を乗じて窓処理を施す。窓処理部3は、各フレームに対して窓処理を施すたびに、窓処理後のフレームを出力する。
【0019】
時間周波数変換部4は、窓処理部3から出力される窓処理後のフレームの入力を受け、前記フレームの入力を受けるたびに、前記フレームに対して時間領域の信号から周波数領域の信号への変換処理を施し、複数の周波数それぞれについての振幅成分と位相成分とを含む周波数スペクトルを計算して、実数と虚数との周波数スペクトルの信号を出力する。時間周波数変換部4は、例えば離散フーリエ変換(Discrete Fourier Transform)や高速フーリエ変換(Fast Fourier Transform)により、時間周波数変換を実行して周波数スペクトルを計算する。
【0020】
変換結果出力部5は、時間周波数変換部4から出力されるフレームごとの(例えば、12.5ms程度の間隔で)周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルのうちの各周波数の振幅成分を含む振幅スペクトルに該当する信号をノイズ抑圧回路7に対して出力するとともに、入力された前記周波数スペクトルのうちの各周波数の位相成分を含む位相スペクトルに該当する信号を合成部8に対して出力する。
【0021】
音声区間検出・ノイズ更新部6は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数ごとの雑音成分を表すノイズスペクトルを更新する。
【0022】
音声区間検出・ノイズ更新部6は、まず、入力された前記振幅スペクトルに該当する信号について、フレームごとに、ノイズ成分のみのフレームであるのか、音声成分を含むフレームであるのか、の判定を行う。
【0023】
音声区間検出・ノイズ更新部6における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。
【0024】
音声区間検出・ノイズ更新部6における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法として、例えば、音声の非恒常性に着目して、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が直近のフレームにおいて複数回(例えば、3~5回程度)連続して所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記以外のときは処理対象のフレームには音声成分があると判定する手法や、あるいは、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記平均や分散の値が前記閾値以上であるときは処理対象のフレームには音声成分があると判定する手法などが用いられ得る。
【0025】
音声区間検出・ノイズ更新部6は、処理対象のフレームはノイズ成分のみであると判定した場合にはノイズ抑圧回路7に対してノイズフレーム信号を出力し、また、処理対象のフレームには音声成分があると判定した場合にはノイズ抑圧回路7に対して音声フレーム信号を出力する。音声区間検出・ノイズ更新部6は、フレームごとに、音声区間検出結果としてノイズフレーム信号または音声フレーム信号をノイズ抑圧回路7に対して出力する。
【0026】
音声区間検出・ノイズ更新部6は、続いて、過去に計算された周波数ごとの雑音成分を表すノイズスペクトルに、現フレーム(別言すると、処理対象のフレーム、最新のフレーム)の振幅スペクトル、すなわち、入力された前記振幅スペクトルに該当する信号を加味することにより、最新のノイズスペクトルへの更新を行う。
【0027】
音声区間検出・ノイズ更新部6における、周波数ごとの雑音成分を表すノイズスペクトルの更新の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。
【0028】
音声区間検出・ノイズ更新部6における、周波数ごとの雑音成分を表すノイズスペクトルの更新の仕法として、例えば、入力された前記振幅スペクトルに該当する信号を用いて、更新後のノイズスペクトルNi(f)を、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかに応じて下記の数式1または数式2に従って算出する手法が用いられ得る。なお、以降の数式における添字iは、時系列の順序を表す順序数であり、すべての数式に共通して適用される順序を表す。また、以降の数式におけるfは、入力された前記振幅スペクトルにおける周波数を表す。
【0029】
具体的には、処理対象のフレームがノイズ成分のみである場合には、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIR(Infinite Impulse Response の略;無限インパルス応答)フィルタである以下の数式1に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。数式1や数式2におけるNi-1(f)は、更新の1フレーム前のノイズスペクトルを表す。
【数1】
【0030】
数式1におけるKは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)がノイズ成分のみのフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数である。定数Kは、0以上の整数であれば特定の値に限定されるものではなく、具体的には例えば、IIRフィルタの時定数の0.06~0.20秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてK=5~16程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数の0.1秒程度に相当する値(例えば、フレーム間隔12.5msにおいてK=8程度)に設定されることが考えられる。
【0031】
また、処理対象のフレームが音声成分を含む場合には、以下の数式2に従って周波数fごとに更新後のノイズスペクトルNi(f)を決定する。
【数2】
【0032】
音声区間検出・ノイズ更新部6は、各フレームについて、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号をノイズ抑圧回路7に対して出力する。
【0033】
ノイズ抑圧回路7は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出・ノイズ更新部6から出力されるフレームごとの音声区間検出結果および更新後のノイズスペクトルに該当する信号の入力を受け、各フレームについて、入力された前記振幅スペクトルに該当する信号から、周波数ごとに(別言すると、スペクトルごとに)、入力された前記更新後のノイズスペクトルに該当する信号を減算する。
【0034】
合成部8は、変換結果出力部5から出力されるフレームごとの位相スペクトルに該当する信号の入力を受けるとともに、ノイズ抑圧回路7から出力されるフレームごとの減算処理後の振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記位相スペクトルに該当する信号と前記振幅スペクトルに該当する信号とを合成して周波数スペクトルを生成して、実数と虚数との周波数スペクトルの信号を出力する。
【0035】
周波数時間変換部9は、合成部8から出力されるフレームごとの周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルの信号に対して周波数領域の信号から時間領域の信号への変換処理、すなわち時間周波数変換部4における変換処理の逆変換処理を施して、音声信号を出力する。周波数時間変換部9は、例えば逆離散フーリエ変換や逆高速フーリエ変換により、周波数時間変換を実行して音声信号を生成する。
【0036】
ディエンファシス(De-Emphasis:DE)回路10は、周波数時間変換部9から出力される音声信号の入力を受け、入力された前記音声信号に対して高周波成分の相対強度を減衰させる高域減衰処理、すなわちプリエンファシス回路2の逆フィルタによる減衰処理を施して、高域減衰処理後の音声信号を出力する。
【0037】
そして、実施の形態に係るノイズ抑圧回路7は、処理対象のフレームが音声の始まりに該当するフレームであるか否かを判定するとともに音声の始まりに該当するフレームに後続するフレームを音声開始後続フレームとして特定するフレーム属性決定部71と、処理対象のフレームの振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための抑圧係数Gi(f)を算出する抑圧係数算出部72と、抑圧係数Gi(f)と振幅スペクトルに該当する信号Yi(f)とを乗じて減算処理後の振幅スペクトルSi(f)を算出する抑圧部73と、を有し、音声開始後続フレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αの値が、その他のフレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αの値よりも小さい値に設定される、ようにしている。
【0038】
ノイズ抑圧回路7は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号から、音声区間検出・ノイズ更新部6から出力されるフレームごとの音声区間検出結果を踏まえながら、前記音声区間検出・ノイズ更新部6から出力されるフレームごとの更新後のノイズスペクトルに該当する信号を減算するものであり、フレーム属性決定部71と、抑圧係数算出部72と、抑圧部73と、を有する。
【0039】
フレーム属性決定部71は、まず、処理対象のフレームの直前のフレームについての音声区間検出結果と前記処理対象のフレームについての音声区間検出結果との組み合わせに基づいて、前記処理対象のフレームが音声の始まりに該当するフレームであるか否かを判定する。
【0040】
フレーム属性決定部71は、具体的には、処理対象のフレームの直前のフレームについての音声区間検出結果がノイズフレーム信号であり、且つ、前記処理対象のフレームについての音声区間検出結果が音声フレーム信号である場合に、処理対象のフレームの直前のフレームがノイズ成分のみのフレームであり且つ前記処理対象のフレームが音声成分を含むフレームであるので、前記処理対象のフレームは音声の始まりに該当するフレームであると判定する。フレーム属性決定部71は、すなわち、直前の音声区間検出結果がノイズフレーム信号であり且つ最新の音声区間検出結果が音声フレーム信号である場合に、最新のフレーム(別言すると、処理対象のフレーム、現フレーム)は音声の始まりに該当するフレームであると判定する。
【0041】
音声の始まりに該当するフレームの判定の例を
図3に示す。なお、
図3中の〈フレーム番号〉は、同図に示す範囲における各フレームを個別に特定するための、時系列の順序を表す順序数であり、説明の便宜のためのものであって処理上の特別の意味はない。
【0042】
図3では、〈音声区間検出結果〉として、音声区間検出・ノイズ更新部6から出力されるフレームごとの音声区間検出結果が、ノイズフレーム信号であるフレームには[N]を対応させて表記し、音声フレーム信号であるフレームには[S]を対応させて表記している。
【0043】
そして、
図3に示す例では、フレーム番号3のフレームについての音声区間検出結果がノイズフレーム信号[N]であり、フレーム番号4のフレームについての音声区間検出結果が音声フレーム信号[S]であるので、フレーム番号4のフレームが音声の始まりに該当するフレームであると判定される。
【0044】
フレーム属性決定部71は、続いて、フレーム属性として、音声の始まりに該当するフレームを音声開始フレームとして特定するとともに、前記音声開始フレームに時系列において後続する、音声成分を含むフレームを音声開始後続フレームとして特定する。
【0045】
図3に示す例では、フレーム属性として、フレーム番号4のフレーム[S]が音声開始フレームとして特定され([S0]を対応させて表記)、また、前記音声開始フレーム[S0]に時系列において後続する、音声成分を含むフレームであるフレーム番号5のフレーム[S]が音声開始後続フレームとして特定される([S1]を対応させて表記)とともにフレーム番号6のフレーム[S]が音声開始後続フレームとして特定される([S2]を対応させて表記)。
【0046】
音声開始後続フレームとして特定されるフレームの個数は、特定の個数に限定されるものではなく、フレームの時間間隔が考慮されるなどしたうえで、適当な個数(尚、複数個でも1個でもよい)に適宜設定される。音声開始後続フレームとして特定されるフレームの個数は、例えば、連続するフレームの全体での時間長さが10msから1秒程度に相当する個数に設定されることが考えられる。
【0047】
抑圧係数算出部72における処理の一例として、以下の数式3を使用することにより、周波数fごとに抑圧係数Gi(f)を算出することができる。
【数3】
【0048】
数式3におけるXi(f)は、事前SNR(Signal to Noise Ratio)であり、以下の数式4に従って算出される。
【数4】
【0049】
数式4における変数はそれぞれ以下のとおりである。
Gi-1(f):時系列において現在の(別言すると、最新の)抑圧係数Gi(f)の更新の1フレーム前の抑圧係数である。なお、抑圧係数Gi(f)の初期値は例えば1に設定される。
Γi(f):事後SNRであり、下記の数式5に従って算出される。
Γi-1(f):時系列において現在の(別言すると、最新の)事後SNR Γi(f)の更新の1フレーム前の事後SNRである。
max[ ]:[ ]内の複数の数値のうちの最大値を選択する演算子である。
【0050】
【0051】
数式5における変数はそれぞれ以下のとおりである。
Yi(f):入力信号スペクトルとしての、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号である。
λDi(f):音声区間検出・ノイズ更新部6からフレームごとに出力される更新後のノイズスペクトルNi(f)の周波数ごとの分散(即ち、周波数方向の分散ではなく、時間方向/フレーム方向の分散)である。
【0052】
ここで、数式4におけるαは、忘却係数と呼ばれ、0≦α<1である。抑圧係数算出部72は、フレーム属性決定部71によって特定されるフレーム属性に応じて、忘却係数αの値を選択/制御しながら事前SNR Xi(f)を算出して抑圧係数Gi(f)を算出する。
【0053】
抑圧係数算出部72は、具体的には、音声開始後続フレームについての事前SNR Xi(f)を算出する(延いては、抑圧係数Gi(f)を算出する)際の忘却係数α(「音声開始忘却係数αs」と呼ぶ)の値として、音声開始後続フレーム以外のフレーム(即ち、音声成分を含むフレームが連続している定常状態やノイズ成分のみのフレームが連続している定常状態)についての事前SNR Xi(f)を算出する(延いては、抑圧係数Gi(f)を算出する)際の忘却係数α(「定常状態忘却係数αr」と呼ぶ)の値よりも小さい値を用いて事前SNR Xi(f)を算出して抑圧係数Gi(f)を算出する。
【0054】
音声開始忘却係数αsおよび定常状態忘却係数αrは、αs<αrであればそれぞれ特定の値には限定されない。例えば、音声開始忘却係数αsが0.0~0.999程度の範囲のうちのいずれかの値に設定されるとともに定常状態忘却係数αrが0.9~0.9999程度の範囲のうちのいずれかの値に設定される(但し、αs<αr)ことが考えられ、特に、音声開始忘却係数αsが0.99に設定されるとともに定常状態忘却係数αrが0.999に設定されることが考えられる。
【0055】
図3に示す例では、フレーム番号5の音声開始後続フレーム[S1]およびフレーム番号6の音声開始後続フレーム[S2]について音声開始忘却係数αs=0.99に設定され、その他のフレームについて定常状態忘却係数αr=0.999に設定されるようにしている。
【0056】
なお、音声開始フレームについての事前SNR Xi(f)を算出する際にも、忘却係数αとして音声開始忘却係数αsを用いるようにしてもよい。
図3に示す例の場合には、フレーム番号4の音声開始フレーム[S0]についての事前SNR Xi(f)を算出する際にも音声開始忘却係数αsを用いるようにしてもよい。
【0057】
また、音声開始忘却係数αsの値は、フレーム属性決定部71によって特定された音声開始後続フレームのすべてについて同じ/一定であるようにしてもよく、あるいは、フレーム属性決定部71によって特定された音声開始後続フレームによって異なる/変化する(具体的には例えば、次第に増加する)ようにしてもよい(但し、αs<αr である)。例えば、音声開始忘却係数αsが下記の〈例1〉ないし〈例3〉のように設定されるようにしてもよい(
図3も参照;尚、
図3ではフレーム番号7は音声開始後続フレームとして特定されている表記はないが、下記ではフレーム番号7も音声開始後続フレームとして特定されたと想定する)。
〈例1〉音声開始忘却係数αsが音声開始後続フレームによって変化する
(フレーム番号4)音声開始フレーム[S0] :定常状態忘却係数αr=0.999
(フレーム番号5)音声開始後続フレーム[S1]:音声開始忘却係数αs=0.99
(フレーム番号6)音声開始後続フレーム[S2]:音声開始忘却係数αs=0.995
(フレーム番号7)音声開始後続フレーム[S3]:音声開始忘却係数αs=0.997
(フレーム番号8)音声フレーム信号[S] :定常状態忘却係数αr=0.999
〈例2〉音声開始忘却係数αsが音声開始フレームと音声開始後続フレームとで異なる
(フレーム番号4)音声開始フレーム[S0] :音声開始忘却係数αs=0.99
(フレーム番号5)音声開始後続フレーム[S1]:音声開始忘却係数αs=0.995
(フレーム番号6)音声開始後続フレーム[S2]:音声開始忘却係数αs=0.995
(フレーム番号7)音声開始後続フレーム[S3]:音声開始忘却係数αs=0.995
(フレーム番号8)音声フレーム信号[S] :定常状態忘却係数αr=0.999
〈例3〉音声開始忘却係数αsが音声開始フレームと音声開始後続フレームとで異なり
且つ音声開始後続フレームによって変化する
(フレーム番号4)音声開始フレーム[S0] :音声開始忘却係数αs=0.99
(フレーム番号5)音声開始後続フレーム[S1]:音声開始忘却係数αs=0.993
(フレーム番号6)音声開始後続フレーム[S2]:音声開始忘却係数αs=0.995
(フレーム番号7)音声開始後続フレーム[S3]:音声開始忘却係数αs=0.997
(フレーム番号8)音声フレーム信号[S] :定常状態忘却係数αr=0.999
【0058】
抑圧係数算出部72は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、周波数fごとの抑圧係数Gi(f)を算出する。
【0059】
抑圧部73は、ノイズ抑圧回路7へと入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、抑圧係数算出部72によって算出される周波数fごとの抑圧係数Gi(f)を用いて、以下の数式6に従って周波数fごとに減算処理後の振幅スペクトルSi(f)を算出する。
【数6】
【0060】
ノイズ抑圧回路7は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、減算処理後の、周波数fごとの振幅スペクトルSi(f)に該当する信号を出力する。
【0061】
上記のようなノイズ抑圧回路7の作用効果の検証例を
図4に示す。
【0062】
図4(A)は、忘却係数として固定値を使用した場合の、ディエンファシス回路10から出力される音声信号の時間波形を示す図である。同図(B)は、忘却係数を変化させた場合の、ディエンファシス回路10から出力される音声信号の時間波形を示す図である。
図4に示す例は、同図(A)はフレーム属性によらず忘却係数α=0.999に設定した場合の結果であり、同図(B)は、
図3に示す例に倣って表記すると、音声開始フレーム[S0]に続く音声成分を含むフレームである音声開始後続フレーム[S1]および[S2]について音声開始忘却係数αs=0.5に設定するとともにその他のフレーム[S0],[S],および[N]について定常状態忘却係数αr=0.999に設定した場合の結果である。
図4(A)と(B)とを比較すると、同図(B)の方が、すなわち忘却係数を変化させた方が、音声の立ち上がりがシャープになっていることが確認され、これによって声の抑揚が改善される。
【0063】
上記のようなノイズ抑圧回路7によれば、非音声(具体的には、ノイズ)から音声へと変わる際の忘却係数αsを非音声または音声が連続する定常状態の忘却係数αrと比べて小さくすることにより、入力される信号から、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、雑音成分を適切に減算することが可能となる。具体的には、処理対象の信号に含まれる雑音成分を抑圧するための抑圧係数Gi(f)の算出に使用される忘却係数αによって雑音成分の抑圧レベルが過去のデータに影響を受けるところ、非音声(具体的には、ノイズ)から音声へと変わる際には、抑圧係数Gi(f)が大きく変化することになるため、忘却係数αが大きいと声の抑揚が抑えられてしまい、一方で、忘却係数αが小さいと非音声または音声が連続する定常状態での雑音成分の抑圧量が低下してしまう。そして、スペクトル減算法を実現する従来の回路では、忘却係数αとして固定値を使用するようにしているため、声の抑揚が極端に抑えられてしまったり雑音成分の抑圧量が極端に低下してしまったりする、という問題がある。これに対して、上記のようなノイズ抑圧回路7では、非音声から音声へと変わる際の忘却係数α(即ち、音声開始忘却係数αs)を非音声または音声が連続する定常状態の忘却係数α(即ち、定常状態忘却係数αr)と比べて小さくするようにしているので、非音声または音声が連続する定常状態と非音声から音声へと変わる際とのそれぞれの忘却係数αを適切に制御して、雑音成分の抑圧による声の抑揚の制限を最小化しつつ雑音成分の抑圧量を確保することができ、延いては、本来受信したい目的信号(例えば、音声)への影響を最小限に抑えつつ、入力される信号から雑音成分を適切に減算することが可能となる。
【0064】
以上、この発明の実施の形態について説明したが、具体的な構成は、上記の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。例えば、上記の実施の形態では
図1に概略構成を示すノイズリダクション回路1に対してこの発明に係るノイズ抑圧回路7が適用される場合を例に挙げて説明しているが、この発明が適用され得るノイズリダクション回路の構成は
図1に示す例には限定されない。さらに言えば、この発明が適用され得る回路は、ノイズリダクション回路には限定されない。すなわち、この発明は、雑音成分を抑圧することが必要とされる種々の回路に対して適用され得る。
【0065】
また、この発明の要点は音声開始後続フレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αsの値が、その他のフレームについての抑圧係数Gi(f)を算出する際に用いられる忘却係数αrの値よりも小さい値に設定されるようにする点であり、抑圧係数の算出の仕法は、上記の実施の形態における手順・手法に限定されるものではなく、忘却係数αを使用して抑圧係数が算出される手順や手法であればどのようなものであってもよい。
【符号の説明】
【0066】
1 ノイズリダクション回路
2 プリエンファシス回路
3 窓処理部
4 時間周波数変換部
5 変換結果出力部
6 音声区間検出・ノイズ更新部
7 ノイズ抑圧回路
71 フレーム属性決定部
72 抑圧係数算出部
73 抑圧部
8 合成部
9 周波数時間変換部
10 ディエンファシス回路