(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022011890
(43)【公開日】2022-01-17
(54)【発明の名称】ノイズ更新回路
(51)【国際特許分類】
G10L 21/0232 20130101AFI20220107BHJP
【FI】
G10L21/0232
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2020113298
(22)【出願日】2020-06-30
(71)【出願人】
【識別番号】000004330
【氏名又は名称】日本無線株式会社
(74)【代理人】
【識別番号】100126561
【弁理士】
【氏名又は名称】原嶋 成時郎
(74)【代理人】
【識別番号】100141678
【弁理士】
【氏名又は名称】佐藤 和彦
(72)【発明者】
【氏名】今里 康二郎
(57)【要約】 (修正有)
【課題】ノイズ成分を的確に推定する、ノイズリダクション回路に用いられるノイズ更新回路を提供する。
【解決手段】ノイズ更新回路において、処理対象のフレームがノイズ成分のみのフレームである場合に更新後のノイズスペクトルを算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に更新後のノイズスペクトルを算出する第2の更新部112と、を有する。
【効果】処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間が、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。
【請求項2】
処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。
【請求項3】
処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。
【請求項4】
処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。
【請求項5】
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の前記平均化時間が、1~10秒の範囲のうちのいずれかの値である、
ことを特徴とする請求項1から4のうちのいずれか1項に記載のノイズ更新回路。
【請求項6】
処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIRフィルタである以下の数式1もしくはFIRフィルタである以下の数式2に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する第1の更新部と(但し、Ni-1(f):更新の1フレーム前のノイズスペクトル、Yi-j(f):更新のjフレーム前の入力信号スペクトル、Kn:処理対象のフレームがノイズ成分のみのフレームである場合のYi(f)に対するNi-1(f)の重みづけを決定づける定数、i:時系列の順序を表す順序数、j:時系列における順序数iとの隔たりの程度を表す0以上の整数)、
【数1】
【数2】
前記処理対象のフレームが音声成分を含むフレームである場合に、IIRフィルタである以下の数式3もしくはFIRフィルタである以下の数式4に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する第2の更新部と(但し、Ks:処理対象のフレームが音声成分を含むフレームである場合のYi(f)に対するNi-1(f)の重みづけを決定づける定数、Kn<Ks)、
【数3】
【数4】
を有する、ことを特徴とするノイズ更新回路。
【請求項7】
前記定数Ksが、IIRフィルタの時定数もしくはFIRフィルタの平均区間の1~10秒に相当する範囲のうちのいずれかの値に設定される、
ことを特徴とする請求項6に記載のノイズ更新回路。
【請求項8】
前記入力信号スペクトルYi(f)について、以下の数式5に従って平均スペクトルレベルMを算出する平均値算出部と(但し、f1:振幅スペクトルにおける最小の周波数、f2:振幅スペクトルにおける最大の周波数、Fn:最小の周波数f1から最大の周波数f2までの範囲における周波数の個数)、
【数5】
前記入力信号スペクトルYi(f)と前記平均スペクトルレベルMとに関して Yi(f)≧Te×M である周波数fについて、以下の数式6に従って更新後のノイズスペクトルNi(f)を決定する第3の更新部と(但し、Te:係数、Ni-1(f):更新の1フレーム前のノイズスペクトル)、
【数6】
をさらに有する、ことを特徴とする請求項1から7のうちのいずれか1項に記載のノイズ更新回路。
【請求項9】
前記係数Teが、1~100の範囲のうちのいずれかの値に設定される、
ことを特徴とする請求項8に記載のノイズ更新回路。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ノイズ更新回路に関し、例えば、高周波信号を送受信する無線機に組み込まれるノイズリダクション回路に用いられ得るノイズ更新回路に関する。
【背景技術】
【0002】
音声信号に含まれる雑音成分を抑圧する手法としてスペクトル減算法(Spectral Subtraction)が知られている(例えば、特許文献1、非特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【非特許文献1】P.Scalart and J.Vieira Filho「Speech Enhancement Based on a Priori Signal to Noise Estimation」,IEEE International Conference on.Acoustics,Speech,Signal Processing,Atlanta,GA,USA,vol.2,pp.629-632,1996年
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、スペクトル減算法を適切に適用するためには、ノイズ成分を的確に推定して入力される音声信号から減算することが重要である。
【0006】
そこでこの発明は、ノイズ成分を的確に推定することが可能な、ノイズ更新回路を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、請求項1に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間が、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。
【0008】
請求項2に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。
【0009】
請求項3に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。
【0010】
請求項4に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。
【0011】
請求項5に記載の発明は、請求項1から4のうちのいずれか1項に記載のノイズ更新回路おいて、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の前記平均化時間が、1~10秒の範囲のうちのいずれかの値である、ことを特徴とする。
【0012】
請求項6に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIRフィルタである以下の数式1もしくはFIRフィルタである以下の数式2に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する第1の更新部と(但し、Ni-1(f):更新の1フレーム前のノイズスペクトル、Yi-j(f):更新のjフレーム前の入力信号スペクトル、Kn:処理対象のフレームがノイズ成分のみのフレームである場合のYi(f)に対するNi-1(f)の重みづけを決定づける定数、i:時系列の順序を表す順序数、j:時系列における順序数iとの隔たりの程度を表す0以上の整数)、
【数1】
【数2】
前記処理対象のフレームが音声成分を含むフレームである場合に、IIRフィルタである以下の数式3もしくはFIRフィルタである以下の数式4に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する第2の更新部と(但し、Ks:処理対象のフレームが音声成分を含むフレームである場合のYi(f)に対するNi-1(f)の重みづけを決定づける定数、Kn<Ks)、
【数3】
【数4】
を有する、ことを特徴とするノイズ更新回路である。
【0013】
請求項7に記載の発明は、請求項6に記載のノイズ更新回路において、前記定数Ksが、IIRフィルタの時定数もしくはFIRフィルタの平均区間の1~10秒に相当する範囲のうちのいずれかの値に設定される、ことを特徴とする。
【0014】
請求項8に記載の発明は、請求項1から7のうちのいずれか1項に記載のノイズ更新回路において、前記入力信号スペクトルYi(f)について、以下の数式5に従って平均スペクトルレベルMを算出する平均値算出部と(但し、f1:振幅スペクトルにおける最小の周波数、f2:振幅スペクトルにおける最大の周波数、Fn:最小の周波数f1から最大の周波数f2までの範囲における周波数の個数)、
【数5】
前記入力信号スペクトルYi(f)と前記平均スペクトルレベルMとに関して Yi(f)≧Te×M である周波数fについて、以下の数式6に従って更新後のノイズスペクトルNi(f)を決定する第3の更新部と(但し、Te:係数、Ni-1(f):更新の1フレーム前のノイズスペクトル)、
【数6】
をさらに有する、ことを特徴とする。
【0015】
請求項9に記載の発明は、請求項8に記載のノイズ更新回路において、前記係数Teが、1~100の範囲のうちのいずれかの値に設定される、ことを特徴とする。
【発明の効果】
【0016】
請求項1ないし請求項4に記載の発明によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、請求項1ないし請求項4に記載の発明では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
【0017】
請求項5に記載の発明によれば、処理対象のフレームが音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の平均化時間が適切な値に設定されるので、処理対象のフレームとして音声成分を含むフレームが続いた場合におけるノイズの変動に一層確実に追従することができ、ノイズ成分を一層確実に的確に推定することが可能となる。
【0018】
請求項6に記載の発明によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、請求項6に記載の発明では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
【0019】
請求項7に記載の発明によれば、処理対象のフレームが音声成分を含むフレームである場合の入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数Ksが適切な値に設定されるので、処理対象のフレームとして音声成分を含むフレームが続いた場合におけるノイズの変動に一層確実に追従することができ、ノイズ成分を一層確実に的確に推定することが可能となる。
【0020】
請求項8に記載の発明によれば、トーン信号を抑圧しないようすることが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、周波数スペクトルにおいて定常的に存在する成分をノイズと判断して抑圧するようにしているので、トーン信号も定常性があるためにノイズと判断されて抑圧の対象になり、ユーザにとって必要なトーン信号(例えば、モールス信号)も抑圧されてしまう、という問題がある。これに対して、請求項8に記載の発明では、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するようにしているので、トーン信号を抑圧しないようにすることが可能となる。
【0021】
請求項9に記載の発明によれば、係数Teが適切な値に設定されるので、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から一層確実に除外することができ、トーン信号を一層確実に抑圧しないようすることが可能となる。
【図面の簡単な説明】
【0022】
【
図1】この発明の実施の形態に係るノイズ更新回路を含むノイズリダクション回路の概略構成を示す機能ブロック図である。
【
図2】実施の形態1に係るノイズ更新回路の概略構成を示す機能ブロック図である。
【
図3】実施の形態2に係るノイズ更新回路の概略構成を示す機能ブロック図である。
【発明を実施するための形態】
【0023】
以下、この発明を図示の実施の形態に基づいて説明する。
【0024】
(実施の形態1)
図1は、この発明の実施の形態に係るノイズ更新回路11を含むノイズリダクション回路1の概略構成を示す機能ブロック図である。
図2は、実施の形態1に係るノイズ更新回路11の概略構成を示す機能ブロック図である。
【0025】
ノイズリダクション回路1は、例えば、高周波信号を送受信する無線機に組み込まれて、音声信号に含まれる雑音成分を抑圧する手法であるスペクトル減算法(Spectral Subtraction)を実現する回路であり、主として、プリエンファシス回路2と、窓処理部3と、時間周波数変換部4と、変換結果出力部5と、減算部6と、合成部7と、周波数時間変換部8と、ディエンファシス回路9と、音声区間検出部10と、ノイズ更新回路11と、を有する。
【0026】
プリエンファシス(Pre-Emphasis:PE)回路2は、アンテナから受信した高周波信号を復調した音声信号に対して高周波成分の相対強度を予め増幅する高域強調処理を施して、高域強調処理後の信号を出力する。
【0027】
窓処理部3は、プリエンファシス回路2から出力される高域強調処理後の信号の入力を受け、入力された前記信号から所定の時間長さのフレームを抽出する(例えば、12.5msごとに25ms分の時間波形を抽出する)とともに、各フレームに対して例えばハニング窓などの窓関数を乗じて窓処理を施す。窓処理部3は、各フレームに対して窓処理を施すたびに、窓処理後のフレームを出力する。
【0028】
時間周波数変換部4は、窓処理部3から出力される窓処理後のフレームの入力を受け、前記フレームの入力を受けるたびに、前記フレームに対して時間領域の信号から周波数領域の信号への変換処理を施し、複数の周波数それぞれについての振幅成分と位相成分とを含む周波数スペクトルを計算して、実数と虚数との周波数スペクトルの信号を出力する。時間周波数変換部4は、例えば離散フーリエ変換(Discrete Fourier Transform)や高速フーリエ変換(Fast Fourier Transform)により、時間周波数変換を実行して周波数スペクトルを計算する。
【0029】
変換結果出力部5は、時間周波数変換部4から出力されるフレームごとの(例えば、12.5ms程度の間隔で)周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルのうちの各周波数の振幅成分を含む振幅スペクトルに該当する信号を減算部6に対して出力するとともに、入力された前記周波数スペクトルのうちの各周波数の位相成分を含む位相スペクトルに該当する信号を合成部7に対して出力する。
【0030】
減算部6は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、ノイズ更新回路11から出力されるフレームごとの更新後のノイズスペクトルに該当する信号の入力を受け、各フレームについて、入力された前記振幅スペクトルに該当する信号から、周波数ごとに(別言すると、スペクトルごとに)、入力された前記更新後のノイズスペクトルに該当する信号を減算する。これにより、音声信号に含まれる雑音成分が抑圧される。減算部6は、変換結果出力部5から出力されるフレームごとに、減算処理後の振幅スペクトルに該当する信号を出力する。
【0031】
合成部7は、変換結果出力部5から出力されるフレームごとの位相スペクトルに該当する信号の入力を受けるとともに、減算部6から出力されるフレームごとの減算処理後の振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記位相スペクトルに該当する信号と前記振幅スペクトルに該当する信号とを合成して周波数スペクトルを生成して、実数と虚数との周波数スペクトルの信号を出力する。
【0032】
周波数時間変換部8は、合成部7から出力されるフレームごとの周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルの信号に対して周波数領域の信号から時間領域の信号への変換処理、すなわち時間周波数変換部4における変換処理の逆変換処理を施して、音声信号を出力する。周波数時間変換部8は、例えば逆離散フーリエ変換や逆高速フーリエ変換により、周波数時間変換を実行して音声信号を生成する。
【0033】
ディエンファシス(De-Emphasis:DE)回路9は、周波数時間変換部8から出力される音声信号の入力を受け、入力された前記音声信号に対して高周波成分の相対強度を減衰させる高域減衰処理、すなわちプリエンファシス回路2の逆フィルタによる減衰処理を施して、高域減衰処理後の音声信号を出力する。
【0034】
音声区間検出部10は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記振幅スペクトルに該当する信号について、ノイズ成分のみのフレームであるのか、音声成分を含むフレームであるのか、の判定を行う。
【0035】
音声区間検出部10における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。
【0036】
音声区間検出部10における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法として、例えば、音声の非恒常性に着目して、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が直近のフレームにおいて複数回(例えば、3~5回程度)連続して所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記以外のときは処理対象のフレームには音声成分があると判定する手法、あるいは、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記平均や分散の値が前記閾値以上であるときは処理対象のフレームには音声成分があると判定する手法などが用いられ得る。
【0037】
音声区間検出部10は、処理対象のフレームはノイズ成分のみであると判定した場合にはノイズフレーム信号を出力し、また、処理対象のフレームには音声成分があると判定した場合には音声フレーム信号を出力する。音声区間検出部10は、フレームごとに、音声区間検出結果としてノイズフレーム信号または音声フレーム信号を出力する。
【0038】
そして、実施の形態に係るノイズ更新回路11は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)の平均化時間よりも長い、ようにしている。
【0039】
ノイズ更新回路11は、過去に計算された周波数ごとの雑音成分を表すノイズスペクトルに、現フレーム(別言すると、処理対象のフレーム、最新のフレーム)の振幅スペクトルを加味することにより、最新のノイズスペクトルに更新するものであり、第1の更新部111と、第2の更新部112と、を有する。
【0040】
ノイズ更新回路11は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出部10から出力されるフレームごとの音声区間検出結果の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数fごとに、更新の1フレーム前のノイズスペクトルNi-1(f)を更新するものとして、更新後のノイズスペクトルNi(f)を、入力された前記音声区間検出結果の内容に応じて下記の数式7もしくは数式8または数式9もしくは数式10に従って算出する。なお、以降の数式における添字iは、時系列の順序を表す順序数であり、すべての数式に共通して適用される順序を表す。また、以降の数式における添字jは、時系列における順序数iとの隔たりの程度を表す変数であり、0以上の整数である。
【0041】
ノイズ更新回路11へと入力された前記音声区間検出結果がノイズフレーム信号である場合には、第1の更新部111が、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIR(Infinite Impulse Response の略;無限インパルス応答)フィルタである以下の数式7もしくはFIR(Finite Impulse Response の略;有限インパルス応答)フィルタである以下の数式8に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。なお、以降の数式における、Ni-1(f)は更新の1フレーム前のノイズスペクトルを表し、Yi-j(f)は更新のjフレーム前の入力信号スペクトルを表す。
【数7】
【数8】
【0042】
数式7や数式8におけるKnは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)がノイズ成分のみのフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数であり、「ノイズ時更新前重み定数Kn」と呼ぶ。
【0043】
ノイズ時更新前重み定数Knは、0以上の整数であれば特定の値には限定されない。ノイズ時更新前重み定数Knは、具体的には例えば、IIRフィルタの時定数もしくはFIRフィルタの平均区間の0.06~0.20秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKn=5~16程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数もしくはFIRフィルタの平均区間の0.1秒程度に相当する値(例えば、フレーム間隔12.5msにおいてKn=8程度)に設定されることが考えられる。なお、IIRフィルタの時定数もしくはFIRフィルタの平均区間を例えば0.1秒としたとき、数式7における定数Knの具体的な値と数式8における定数Knの具体的な値とは異なる。
【0044】
ノイズ更新回路11へと入力された前記音声区間検出結果が音声フレーム信号である場合には、第2の更新部112が、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIRフィルタである以下の数式9もしくはFIRフィルタである以下の数式10に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。
【数9】
【数10】
【0045】
数式9や数式10におけるKsは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)が音声成分を含むフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数であり、「音声時更新前重み定数Ks」と呼ぶ。
【0046】
音声時更新前重み定数Ksは、ノイズ時更新前重み定数Knよりも大きく、好ましくは十分に大きい整数であれば、特定の値には限定されない。音声時更新前重み定数Ksは、具体的には例えば、IIRフィルタの時定数もしくはFIRフィルタの平均区間の1~10秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKs=80~800程度の範囲)のうちのいずれかの値、さらに特定するとIIRフィルタの時定数もしくはFIRフィルタの平均区間の1~6秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKs=80~500程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数もしくはFIRフィルタの平均区間の3.7秒程度に相当する値(例えば、フレーム間隔12.5msにおいてKs=295程度)に設定されることが考えられる。なお、IIRフィルタの時定数もしくはFIRフィルタの平均区間を例えば3.7秒としたとき、数式9における定数Ksの具体的な値と数式10における定数Ksの具体的な値とは異なる。
【0047】
音声時更新前重み定数Ksが十分に大きい値に設定されることにより、音声には非恒常性があるため、ノイズスペクトルの更新において音声成分が大きく反映されることが回避され、したがって、音声成分が雑音成分として抑圧されることがない。
【0048】
なお、更新後のノイズスペクトルNi(f)を算出するための平均化処理として、IIRフィルタ(一般形は Ni(f)=ΣAjYi-j(f)+ΣBkNi-k(f);但し、A,Bは係数、iは時系列の順序を表す順序数、jは時系列における順序数iとの隔たりの程度を表す0以上の整数、kは時系列における順序数iとの隔たりの程度を表す1以上の整数)を用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
【0049】
また、上記のIIRフィルタの一般形についてj≧1においてAj=0としたIIRフィルタを用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
【0050】
なお、上記のIIRフィルタの一般形についてj≧1においてAj=0としたうえで、A0=1/(1+Kn),B1=Kn/(1+Kn),且つBk=0(k≧2)である場合が上記の数式7に該当し、A0=1/(1+Ks),B1=Ks/(1+Ks),且つBk=0(k≧2)である場合が上記の数式9に該当する。
【0051】
さらに、更新後のノイズスペクトルNi(f)を算出するための平均化処理として、FIRフィルタ(一般形は Ni(f)=ΣAjYi-j(f);但し、Aは係数、iは時系列の順序を表す順序数、jは時系列における順序数iとの隔たりの程度を表す0以上の整数;即ち、上記のIIRフィルタの一般形についてBk=0としたもの)を用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
【0052】
なお、上記のFIRフィルタの一般形について、Aj=1/Knである場合が上記の数式8に該当し、Aj=1/Ksである場合が上記の数式10に該当する。
【0053】
ノイズ更新回路11は、フレームごとの振幅スペクトルに該当する信号および音声区間検出結果の入力を受けるたびに、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号を減算部6に対して出力する。減算部6は、フレームごとに、ノイズ更新回路11から出力される前記更新後のノイズスペクトルNi(f)に該当する信号を用いて、変換結果出力部5から出力される振幅スペクトルに該当する信号から前記更新後のノイズスペクトルNi(f)に該当する信号を減算する処理を行う。
【0054】
上記のようなノイズ更新回路11によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、上記のようなノイズ更新回路11では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
【0055】
(実施の形態2)
図3は、この発明の実施の形態2に係るノイズ更新回路11の概略構成を示す機能ブロック図である。
【0056】
この実施の形態ではノイズ更新回路11が上記の実施の形態1の構成と比べて追加の構成を有する点で実施の形態1と異なる一方で、共通する構成や処理の内容もあり、実施の形態1と同等の構成や処理の内容については同一符号を付することでその説明を省略する。
【0057】
この実施の形態に係るノイズ更新回路11は、入力信号スペクトルYi(f)について平均スペクトルレベルMを算出する平均値算出部113と、入力信号スペクトルYi(f)と平均スペクトルレベルMとに関して Yi(f)≧Te×M である周波数fについて更新後のノイズスペクトルNi(f)を決定する第3の更新部114と、をさらに有する、ようにしている。
【0058】
ノイズ更新回路11は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出部10から出力されるフレームごとの音声区間検出結果の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数fごとに、更新の1フレーム前のノイズスペクトルNi-1(f)を更新するものとして、更新後のノイズスペクトルNi(f)を、入力された前記音声区間検出結果の内容などに応じて上記の数式7もしくは数式8、数式9もしくは数式10、ならびに数式12のうちのいずれかに従って算出する。
【0059】
平均値算出部113は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、以下の数式11に従って平均スペクトルレベルMを算出する。平均スペクトルレベルMは、すなわち、振幅スペクトルの周波数軸方向における平均値である。
【数11】
【0060】
数式11における、fは振幅スペクトルにおける周波数を表し、f1は振幅スペクトルにおける最小の周波数であり、f2は振幅スペクトルにおける最大の周波数であり、さらに、Fnは最小の周波数f1から最大の周波数f2までの範囲における周波数の個数を表す。周波数の個数Fnは、すなわち、時間周波数変換部4での時間周波数変換において1フレームに含まれるサンプル点数をnとすると、n/2+1である。
【0061】
平均値算出部113は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、平均スペクトルレベルMを算出する。
【0062】
そのうえで、ノイズ更新回路11へと入力された音声区間検出結果がノイズフレーム信号である場合には、入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに、前記入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係に応じて下記の〈ア〉または〈イ〉の処理が行われる。
【0063】
〈ア〉Yi(f)<Te×M である周波数fについて
第1の更新部111が、上記の数式7もしくは数式8に従って更新後のノイズスペクトルNi(f)を算出する。
【0064】
入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係におけるTeは、平均スペクトルレベルMよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するための係数である。係数Teは、特定の値に限定されるものではなく、例えばトーン信号に相当する周波数成分がノイズスペクトルの更新から除外されるようにしてトーン信号が減算部6で減算されず雑音成分として抑圧されないようにすることが考慮されるなどしたうえで、適当な値に適宜設定される。係数Teは、具体的には、1~100程度の範囲のうちのいずれかの値に設定されることが考えられ、特に10程度に設定されることが考えられる。
【0065】
〈イ〉Yi(f)≧Te×M である周波数fについて
第3の更新部114が、以下の数式12に従って更新後のノイズスペクトルNi(f)を決定する。
【数12】
【0066】
数式12におけるNi-1(f)は、更新の1フレーム前のノイズスペクトルを表す。
【0067】
また、ノイズ更新回路11へと入力された音声区間検出結果が音声フレーム信号である場合には、入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに、前記入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係に応じて下記の〈ウ〉または〈エ〉の処理が行われる。
【0068】
〈ウ〉Yi(f)<Te×M である周波数fについて
第2の更新部112が、上記の数式9もしくは数式10に従って更新後のノイズスペクトルNi(f)を算出する。
【0069】
〈エ〉Yi(f)≧Te×M である周波数fについて
第3の更新部114が、上記の数式12に従って更新後のノイズスペクトルNi(f)を決定する。
【0070】
上記の処理では、すなわち、Yi(f)≧Te×M であって平均スペクトルレベルMよりも振幅スペクトルが著しく大きい周波数成分については、当該の更新の後のノイズスペクトルNi(f)を更新の1フレーム前のノイズスペクトルNi-1(f)のままとして更新から除外する。
【0071】
ノイズ更新回路11は、フレームごとの振幅スペクトルに該当する信号および音声区間検出結果の入力を受けるたびに、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号を減算部6に対して出力する。減算部6は、フレームごとに、ノイズ更新回路11から出力される前記更新後のノイズスペクトルNi(f)に該当する信号を用いて、変換結果出力部5から出力される振幅スペクトルに該当する信号から前記更新後のノイズスペクトルNi(f)に該当する信号を減算する処理を行う。
【0072】
上記のようなノイズ更新回路11によれば、トーン信号を抑圧しないようすることが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、周波数スペクトルにおいて定常的に存在する成分をノイズと判断して抑圧するようにしているので、トーン信号も定常性があるためにノイズと判断されて抑圧の対象になり、ユーザにとって必要なトーン信号(例えば、モールス信号)も抑圧されてしまう、という問題がある。これに対して、上記のようなノイズ更新回路11では、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するようにしているので、トーン信号を抑圧しないようにすることが可能となる。
【0073】
なお、実施の形態2に係るノイズ更新回路11については、その時々の運用に応じてユーザが平均値算出部113および第3の更新部114を機能させるか否かを選択するというモードの選択に合わせてノイズスペクトルの更新の仕方が調整されて雑音成分の抑圧の仕方が調整されるようにしてもよい。例えば、ユーザが、雑音成分を抑圧しながら主に音声信号を送受信する場合には平均値算出部113および第3の更新部114を機能させないモードを選択してトーン信号を抑圧し、一方、モールス信号を送受信する場合には平均値算出部113および第3の更新部114を機能させるモードを選択してトーン信号を抑圧しないようすることが考えられる。
【0074】
以上、この発明の実施の形態について説明したが、具体的な構成は、上記の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。例えば、上記の実施の形態では
図1に概略構成を示すノイズリダクション回路1に対してこの発明に係るノイズ更新回路11が適用される場合を例に挙げて説明しているが、この発明が適用され得るノイズリダクション回路の構成は
図1に示す例には限定されない。さらに言えば、この発明が適用され得る回路は、ノイズリダクション回路には限定されない。すなわち、この発明は、ノイズスペクトルを時系列で更新することが必要とされる種々の回路に対して適用され得る。
【0075】
また、更新後のノイズスペクトルNi(f)を算出するための平均化を含む処理は、上記の実施の形態におけるノイズ時更新前重み定数Knおよび音声時更新前重み定数Ksに相当する係数を用いる方法であればどのような方法であってもよい。すなわち、更新後のノイズスペクトルNi(f)の算出式は、上記の実施の形態における数式7ないし数式10には限定されない。
【符号の説明】
【0076】
1 ノイズリダクション回路
2 プリエンファシス回路
3 窓処理部
4 時間周波数変換部
5 変換結果出力部
6 減算部
7 合成部
8 周波数時間変換部
9 ディエンファシス回路
10 音声区間検出部
11 ノイズ更新回路
111 第1の更新部
112 第2の更新部
113 平均値算出部(実施の形態2)
114 第3の更新部(実施の形態2)