特許第6221463号(P6221463)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

<>
  • 特許6221463-音声信号処理装置及びプログラム 図000007
  • 特許6221463-音声信号処理装置及びプログラム 図000008
  • 特許6221463-音声信号処理装置及びプログラム 図000009
  • 特許6221463-音声信号処理装置及びプログラム 図000010
  • 特許6221463-音声信号処理装置及びプログラム 図000011
  • 特許6221463-音声信号処理装置及びプログラム 図000012
  • 特許6221463-音声信号処理装置及びプログラム 図000013
  • 特許6221463-音声信号処理装置及びプログラム 図000014
  • 特許6221463-音声信号処理装置及びプログラム 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6221463
(24)【登録日】2017年10月13日
(45)【発行日】2017年11月1日
(54)【発明の名称】音声信号処理装置及びプログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20171023BHJP
   G10L 21/0208 20130101ALI20171023BHJP
【FI】
   H04R3/00 320
   G10L21/0208 100A
   G10L21/0208 100B
【請求項の数】9
【全頁数】16
(21)【出願番号】特願2013-154825(P2013-154825)
(22)【出願日】2013年7月25日
(65)【公開番号】特開2015-26956(P2015-26956A)
(43)【公開日】2015年2月5日
【審査請求日】2016年5月17日
(73)【特許権者】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100090620
【弁理士】
【氏名又は名称】工藤 宣幸
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(72)【発明者】
【氏名】高橋 克之
【審査官】 堀 洋介
(56)【参考文献】
【文献】 特開2010−217773(JP,A)
【文献】 特開2013−061421(JP,A)
【文献】 特開2011−113044(JP,A)
【文献】 特開2013−068919(JP,A)
【文献】 特開2010−220087(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00
G10L 21/0208
(57)【特許請求の範囲】
【請求項1】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、
上記妨害音声到来方位指標値取得手段は、指標値として、コヒーレンスフィルタ係数の全周波数での算術平均値であるコヒーレンスを算出する
こと特徴とする音声信号処理装置。
【請求項2】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、
上記妨害音声到来方位指標値取得手段は、指標値として、上記入力音声信号のSN比を算出する
ことを特徴とする音声信号処理装置。
【請求項3】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、
上記フロアリング閾値決定手段は、周波数が高いコヒーレンスフィルタ係数用のフロアリング閾値が、周波数が低いコヒーレンスフィルタ係数用のフロアリング閾値より大きくなる単純増加関数に従って、フロアリング閾値を決定する
ことを特徴する音声信号処理装置。
【請求項4】
上記単純増加関数は階段状関数であることを特徴する請求項に記載の音声信号処理装置。
【請求項5】
上記単純増加関数は高い周波数側の方が傾斜が大きい折れ線状関数であることを特徴する請求項に記載の音声信号処理装置。
【請求項6】
上記単純増加関数は複数の曲線状関数を繋ぎ合せた関数であることを特徴する請求項に記載の音声信号処理装置。
【請求項7】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段と
して機能させ、
上記妨害音声到来方位指標値取得手段は、指標値として、コヒーレンスフィルタ係数の全周波数での算術平均値であるコヒーレンスを算出する
ことを特徴とする音声信号処理プログラム。
【請求項8】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段と
して機能させ、
上記妨害音声到来方位指標値取得手段は、指標値として、上記入力音声信号のSN比を算出する
ことを特徴とする音声信号処理プログラム。
【請求項9】
入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、
コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、
取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、
算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段と
して機能させ、
上記フロアリング閾値決定手段は、周波数が高いコヒーレンスフィルタ係数用のフロアリング閾値が、周波数が低いコヒーレンスフィルタ係数用のフロアリング閾値より大きくなる単純増加関数に従って、フロアリング閾値を決定する
ことを特徴とする音声信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号処理装置及びプログラムに関し、例えば、電話機やテレビ会議装置などの音声信号(この明細書では、音声信号や音響信号等の音信号を「音声信号」と呼んでいる)を扱う通信機や通信ソフトウェアに適用し得るものである。
【背景技術】
【0002】
取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、コヒーレンスフィルタ法が挙げられる。コヒーレンスフィルタ法は、特許文献1に記載されているように、左右に死角を有する信号の相互相関を周波数ごとに乗算することで、到来方位に偏りが大きい雑音成分を抑圧する手法である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2013−061421号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
コヒーレンスフィルタ処理に限らず、雑音抑圧処理は音に歪みを生じさせ、不自然な音質にしてしまうことがある。歪みの原因の一つは、雑音特性の誤推定による過剰な雑音抑圧処理である。そこで、過剰な抑圧を防止するために、「雑音状況などに応じて制御される雑音抑圧係数を所定の閾値と比較し、雑音抑圧係数が閾値より小さい場合には、その雑音抑圧係数を用いずに閾値を雑音抑圧係数にする」というフロアリング処理を用いることがある。フロアリング処理用の閾値(以下、フロアリング閾値と呼ぶ)は大き過ぎると抑圧性能が不足し、小さ過ぎると音の歪みが増す。
【0005】
そのため、雑音抑圧性能と音質のバランスがとれるようなフロアリング処理を実行できる音声信号処理装置及びプログラムが望まれている。
【課題を解決するための手段】
【0006】
第1の本発明は、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(3)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(4)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、(5)上記妨害音声到来方位指標値取得手段は、指標値として、コヒーレンスフィルタ係数の全周波数での算術平均値であるコヒーレンスを算出すること特徴とする。
第2の本発明は、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(3)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(4)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、(5)上記妨害音声到来方位指標値取得手段は、指標値として、上記入力音声信号のSN比を算出することを特徴とする。
第3の本発明は、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(3)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(4)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段とを有し、(5)上記フロアリング閾値決定手段は、周波数が高いコヒーレンスフィルタ係数用のフロアリング閾値が、周波数が低いコヒーレンスフィルタ係数用のフロアリング閾値より大きくなる単純増加関数に従って、フロアリング閾値を決定することを特徴する。
【0007】
の本発明の音声信号処理プログラムは、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(3)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(4)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段として機能させ、(5)上記妨害音声到来方位指標値取得手段は、指標値として、コヒーレンスフィルタ係数の全周波数での算術平均値であるコヒーレンスを算出することを特徴とする。
第5の本発明の音声信号処理プログラムは、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(3)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(4)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段として機能させ、(5)上記妨害音声到来方位指標値取得手段は、指標値として、上記入力音声信号のSN比を算出することを特徴とする。
第6の本発明の音声信号処理プログラムは、(1)入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置に搭載されたコンピュータを、(2)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(3)上記入力音声信号に含まれている妨害音声の到来方位を表す指標値を得る妨害音声到来方位指標値取得手段と、(4)取得した指標値に応じ、妨害音声の到来方位が目的音声の到来方位に近いほど大きな値をとるようにフロアリング閾値を決定するフロアリング閾値決定手段と、(5)算出された各周波数のコヒーレンスフィルタ係数に対し、決定されたフロアリング閾値を適用してフロアリングを行うフロアリング処理手段として機能させ、(6)上記フロアリング閾値決定手段は、周波数が高いコヒーレンスフィルタ係数用のフロアリング閾値が、周波数が低いコヒーレンスフィルタ係数用のフロアリング閾値より大きくなる単純増加関数に従って、フロアリング閾値を決定することを特徴とする。
【発明の効果】
【0008】
本発明の音声信号処理装置及びプログラムによれば、妨害音声の到来方位に応じて適用するフロアリング閾値を切り替えるようにしたので、雑音抑圧性能と音質のバランスがとれるフロアリング処理を実行させることができる。
【図面の簡単な説明】
【0009】
図1】第1の実施形態の音声信号処理装置の全体構成を示すブロック図である。
図2】第1の実施形態におけるコヒーレンスフィルタ処理部の詳細構成を示すブロック図である。
図3】第1の実施形態における指向性形成部からの指向性信号の性質を示す説明図である。
図4】第1の実施形態における指向性形成部による2つの指向性の特性を示す説明図である。
図5】方位ごとのコヒーレンスの挙動を示す説明図である。
図6】第1の実施形態におけるフロアリング閾値決定部が内蔵するコヒーレンスとフロアリング閾値との対応(変換テーブル)を示す説明図である。
図7】第1の実施形態におけるフロアリング閾値決定部が変換関数の演算を実行してフロアリング閾値を決定するとした場合に適用する変換関数の一例を示す説明図である。
図8】第1の実施形態におけるフロアリング処理部が実行するフロアリング処理を示すフローチャートである。
図9】第2の実施形態において生成される雑音信号の指向性を示す説明図である。
【発明を実施するための形態】
【0010】
(A)第1の実施形態
以下、本発明による音声信号処理装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
【0011】
第1の実施形態に係る音声信号処理装置及びプログラムは、コヒーレンスフィルタ法を適用している。
【0012】
一般に、コヒーレンスフィルタ係数は、雑音、とりわけ話者以外の人間の音声(妨害音声)の到来方位によって値が大きく変動する。そのため、フロアリング処理を行う場合には、フロアリング用の閾値を到来方位によって制御しなければ、所望するフロアリング効果が得られない。
【0013】
コヒーレンスフィルタ係数は、妨害音声の到来方位によって次のような挙動をすることを本願発明者は認識した。
【0014】
(a)妨害音声の到来方位が正面(目的音声の音源の方向)に近付くほど値が大きくなり、横にそれるほど値が小さくなる。(b)妨害音声の到来方位が正面に近い場合には、高域のコヒーレンスフィルタ係数値は特に増大する。これらの挙動を整理して述べれば、妨害音声の到来方位が正面に近付くほど、コヒーレンスフィルタによる抑圧性能は低下し、特に高域の妨害音声成分の抑圧効果は低下する。
【0015】
第1の実施形態は、上述した挙動の認識に基づいて、フロアリング閾値を妨害音声の到来方位に応じて制御するようにしたものである。
【0016】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。ここで、一対のマイクロホンm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
【0017】
図1において、第1の実施形態に係る音声信号処理装置10は、一対のマイクロホンm1、m2、FFT(高速フーリエ変換)部11、コヒーレンスフィルタ処理部12及びIFFT(逆高速フーリエ変換)部13を有する。
【0018】
一対のマイクロホンm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクロホンm1、m2は、無指向のもの(若しくは、正面方向にごくごく緩やかな指向性を有するもの)である。各マイクロホンm1、m2で捕捉された音声信号(入力信号)は、図示しない対応するA/D変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
【0019】
FFT部11は、マイクロホンm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
【数1】
【0020】
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
【0021】
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、コヒーレンスフィルタ処理部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複数の周波数f1〜fmのスペクトル成分から構成されるものである。さらに、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
【0022】
X1(f,K)={X1(f1,K),X1(f2,K),…,X1(fm,K)} …(2)
後述するコヒーレンスフィルタ処理部12においては、周波数領域信号X1(f,K)及びX2(f,K)のうち、周波数領域信号X1(f,K)をメインとし、周波数領域信号X2(f,K)をサブとして処理を行うが、周波数領域信号X2(f,K)をメインとし、周波数領域信号X1(f,K)をサブとして処理を行っても良い(後述する(8)式参照)。
【0023】
コヒーレンスフィルタ処理部12は、後述する図2に示す詳細構成を有し、コヒーレンスフィルタ処理を実行し、雑音成分が抑圧された信号Y(f,K)を得て、IFFT部13に与えるものである。
【0024】
IFFT部13は、雑音抑圧後信号Y(f,K)に対して、逆高速フーリエ変換を施して時間領域信号である出力信号y(n)を得るものである。
【0025】
図2は、コヒーレンスフィルタ処理部12の詳細構成を示すブロック図である。
【0026】
図2において、コヒーレンスフィルタ処理部12は、入力信号受信部21、指向性形成部22、フィルタ係数計算部23、到来方位推定部24、フロアリング閾値決定部25、フロアリング処理部26、フィルタ処理部27及びフィルタ処理後信号送信部28を有する。
【0027】
入力信号受信部21は、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)を受け取るものである。
【0028】
指向性形成部22は、特定方向に指向性が強い2種類の指向性信号(第1及び第2の指向性信号)B1(f,K)、B2(f,K)を形成するものである。指向性信号B1(f,K)、B2(f,K)を形成する方法は、既存の方法を適用することができ、例えば、(3)式及び(4)式に従った演算により求める方法を適用することができる。
【数2】
【0029】
以下、第1及び第2の指向性信号B1(f,K)及びB2(f,K)の算出式の意味を、(3)式を例に、図3及び図4を用いて説明する。図3(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクロホンm1及びm2で捕捉されたとする。このとき、音波が一対のマイクロホンm1及びm2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(5)式で与えられる。
【0030】
τ=l×sinθ/c …(5)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、一対のマイクロホン(マイクロホンアレー)m1及びm2は図3(B)のような指向特性を持つようになる。
【0031】
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(3)式及び(4)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性信号B1(f)は、図4(A)に示すように右方向に強い指向性を有し、第2の指向性信号B2(f)は、図4(B)に示すように左方向に強い指向性を有する。なお、以降では、θ=±90度であることを想定して説明するが、θは±90度に限定されるものではない。
【0032】
フィルタ係数計算部23は、第1及び第2の指向性信号B1(f,K)及びB2(f,K)に基づいて、(6)式に従ってコヒーレンスフィルタ係数coef(f,K)を計算するものである。
【数3】
【0033】
到来方位推定部24は、雑音の到来方位を推定し得る指標値を得てフロアリング閾値決定部25に与えるものである。ここで、到来方位推定部24は、雑音の到来方位の推定し得る指標値としてコヒーレンスCOH(K)を算出する。コヒーレンスCOH(K)は、(7)式に示すように、コヒーレンスフィルタ係数coef(f、K)を全周波数で算術平均した値である。
【数4】
【0034】
図5は、コヒーレンスの挙動を示した説明図である。図5に示すように、雑音の到来方位に応じてコヒーレンスの値がとるレンジが変化することが分かる。この性質を用いることで、雑音の到来方位を推定することができる。
【0035】
フロアリング閾値決定部25は、到来方位推定部24が算出したコヒーレンスCOH(K)に基づいてフロアリング閾値を決定するものである。フロアリング閾値決定部25は、雑音の到来方位が正面に近付く(コヒーレンスCOH(K)が大きくなる)ほど、大きくなるフロアリング閾値を決定するものであり、また、高域用のフロアリング閾値をそれより低域のフロアリング閾値より大きくなるようにフロアリング閾値を決定するものである。フロアリング閾値決定部25は、このようなフロアリング閾値を決定することができるのであれば、その具体的な構成は問われない。例えば、フロアリング閾値決定部25は、変換テーブルを利用してフロアリング閾値を決定するものであっても良く、変換関数の演算を実行してフロアリング閾値を決定するものであっても良い。
【0036】
図6は、前者の決定方法で利用される、コヒーレンスCOH(K)と、帯域Θ、Ψ、Φ別のフロアリング閾値との対応(変換テーブル)を示す説明図である。
【0037】
フロアリング閾値は、帯域Θ、Ψ、Φごとに異なる値が設定されている。例えば、音声信号s1(n)、s2(n)のサンプリング周波数が8000Hzであれば、0〜2000Hzまでのコヒーレンスフィルタ係数用のフロアリング閾値Θ、2000〜3000Hzまでのコヒーレンスフィルタ係数用のフロアリング閾値Ψ、3000〜4000Hzまでのコヒーレンスフィルタ係数に用いるフロアリング閾値Φという3つの閾値が設定されている。そして、到来方位が正面に近付く(コヒーレンスCOH(K)が大きくなる)ほど、フロアリング閾値Θ、Ψ、Φは大きな値になるよう設定されている。
【0038】
フロアリング閾値決定部25は、与えられたコヒーレンスCOH(K)が変換テーブルのどの範囲A以上B未満、B以上C未満、C以上D未満、…(但し、A<B<C<D<…)に属するかを判定し、属する範囲に対応付けられている帯域Θ、Ψ、Φ別のフロアリング閾値の組を読み出してフロアリング処理部26に与える。
【0039】
図6の例では、コヒーレンスCOH(K)がA≦COH(K)<Bの範囲に属する場合には、フロアリング閾値の組として、Θ=α、Ψ=δ、Φ=ζが取り出され、コヒーレンスCOH(K)がB≦COH(K)<Cの範囲に属する場合には、フロアリング閾値の組として、Θ=β、Ψ=ε、Φ=ξが取り出され、コヒーレンスCOH(K)がC≦COH(K)<Dの範囲に属する場合には、フロアリング閾値の組として、Θ=γ、Ψ=η、Φ=ωが取り出される。なお、上述した通り、到来方位が正面に近付くほど、高域のコヒーレンスフィルタ係数が特に大きく増加するので、これに対応して帯域別のフロアリング閾値の大小関係がΘ<Ψ<Φという関係を満たすように、フロアリング閾値の具体的な値α、β、γ、δ、ε、η、ζ、ξ、ωが設定されている。
【0040】
図7は、フロアリング閾値決定部25が、変換関数の演算を実行してフロアリング閾値を決定する際に用いる変換関数の一例を示している。変換関数は、コヒーレンスCOH(K)の値毎に(若しくは、値が属する範囲毎に)設定されているものである。
【0041】
変換関数において、高周波数ほどフロアリング閾値の値を大きくすることを要するので、傾きは周波数が高い帯域ほど大きくなるよう設定しておく。また、帯域ごとに傾きが異なる直線をフロアリング閾値とする場合、雑音の到来方位が正面に近付くほど、フロアリング閾値直線の傾きは大きくなるようにする。直線に限定せず、周波数帯域ごとに異なる曲率の曲線を用いるなど、任意の曲線を、フロアリング閾値を決定する関数とするようにして良い。
【0042】
以下の各部の機能説明や動作の項の説明では、図6の変換テーブルを適用した場合について説明する。
【0043】
フロアリング処理部26は、コヒーレンスフィルタ係数coef(f,K)に対し、フロアリング閾値決定部25が決定したフロアリング閾値を適用してフロアリング処理を行うものである。例えば、周波数fiが最も低い帯域Θに属する場合、そのコヒーレンスフィルタ係数coef(fi,K)のフロアリング処理には、フロアリング処理部26は、帯域Θについて決定されたフロアリング閾値α、β又はγ(図6参照)を適用する。また例えば、周波数fiが低い方から2番目の帯域Ψに属する場合、そのコヒーレンスフィルタ係数coef(fi,K)のフロアリング処理には、フロアリング処理部26は、帯域Ψについて決定されたフロアリング閾値δ、ε又はη(図6参照)を適用する。さらに例えば、周波数fiが最も高い帯域Φに属する場合、そのコヒーレンスフィルタ係数coef(fi,K)のフロアリング処理には、フロアリング処理部26は、帯域Φについて決定されたフロアリング閾値ζ、ξ又はω(図6参照)を適用する。
【0044】
フィルタ処理部27は、フロアリング処理後のコヒーレンスフィルタ係数flcoef(f、K)を適用して、(8)式に示すように、メインの周波数領域信号X1(f,K)に対するコヒーレンスフィルタ処理を行い、雑音抑圧後信号(フィルタ処理後信号)Y(f、K)を得るものである。なお、(8)式は、各周波数のそれぞれの演算(乗算処理)を表している。
【0045】
Y(f、K)=X1(f、K)×flcoef(f、K) …(8)
ここで、コヒーレンスフィルタ処理の物理的な意味を補足しておく。コヒーレンスフィルタ係数coef(f、K)(フロアリング処理後コヒーレンスフィルタ係数flcoef(f、K)も同様)は、左右に死角を有する信号成分の相互相関であるので、相関が大きい場合には到来方位には偏りがない正面から到来する音声成分であり、相関が小さい場合には到来方位が右か左に偏った成分である、というように入力音声の到来方位とも対応付けられる。従って、コヒーレンスフィルタ係数coef(f、K)を乗算することは横から到来する雑音成分を抑圧する処理であるということができる。
【0046】
フィルタ処理後信号送信部28は、雑音抑圧後信号Y(f,K)を後段のIFFT部13に与えるものである。また、フィルタ処理後信号送信部28は、Kを1だけ増加させて次のフレームの処理を起動させるものである。
【0047】
(A−2)第1の実施形態の動作
次に、第1の実施形態の音声信号処理装置10の動作を、図面を参照しながら、全体動作、コヒーレンスフィルタ処理部12における詳細動作の順に説明する。
【0048】
一対のマイクロホンm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、コヒーレンスフィルタ処理部12に与えられる。これにより、コヒーレンスフィルタ処理部12において、コヒーレンスフィルタ処理が実行され、得られた雑音抑圧後信号Y(f,K)がIFFT部13に与えられる。IFFT部13においては、周波数領域信号である雑音抑圧後信号Y(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
【0049】
次に、コヒーレンスフィルタ処理部12における詳細動作を説明する。以下では、あるフレームの処理を説明するが、このようなフレーム単位の処理が、フレームごとに繰り返される。
【0050】
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)がFFT部11から与えられると、指向性形成部22によって、(3)式及び(4)式に従って、第1及び第2の指向性信号B1(f,K)及びB2(f,K)が計算され、さらに、これらの指向性信号B1(f,K)及びB2(f,K)に基づき、フィルタ係数計算部23によって、(6)式に従って、コヒーレンスフィルタ係数coef(f,K)が計算される。
【0051】
計算されたコヒーレンスフィルタ係数coef(f,K)に基づいて、到来方位推定部24によって、雑音の到来方位を推定し得る指標値として、(7)式に従って、コヒーレンスCOH(K)が算出される。フロアリング閾値決定部25によって、算出されたコヒーレンスCOH(K)が、変換テーブルのどの範囲A以上B未満、B以上C未満、C以上D未満、…に属するかが判定され、属する範囲に対応付けられている帯域Θ、Ψ、Φ別のフロアリング閾値の組が変換テーブルから読み出される。これにより、フロアリング処理部26によって、コヒーレンスフィルタ係数coef(f,K)に対し、読み出されたフロアリング閾値が適用されてフロアリング処理が実行される。
【0052】
図8は、フロアリング処理部26が実行するフロアリング処理を示すフローチャートである。
【0053】
フロアリング処理部26は、ある周波数fiのコヒーレンスフィルタ係数coef(fi,K)が、当該周波数fiが属する帯域Θ、Ψ又はΦについて読み出されたフロアリング閾値TH(K)(=α、β、γ、δ、ε、η、ζ、ξ又はω)より小さいか否かを判定し(ステップS1)、コヒーレンスフィルタ係数coef(fi,K)がフロアリング閾値TH(K)より小さい場合には、フロアリング閾値TH(K)をフロアリング処理後のコヒーレンスフィルタ係数flcoef(fi,K)に設定し(ステップS2)、コヒーレンスフィルタ係数coef(fi,K)がフロアリング閾値TH(K)以上の場合には、コヒーレンスフィルタ係数coef(fi,K)をそのままフロアリング処理後のコヒーレンスフィルタ係数flcoef(fi,K)に設定する(ステップS3)。
【0054】
フロアリング処理後のコヒーレンスフィルタ係数flcoef(f、K)を適用して、フィルタ処理部27によって、(8)式に示すような、メインの周波数領域信号X1(f,K)に対するコヒーレンスフィルタ処理が実行され、得られた雑音抑圧後信号(フィルタ処理後信号)Y(f、K)が、フィルタ処理後信号送信部28によってIFFT部13に与えられると共に、フレーム変数Kが1だけ増加されて、次のフレームの処理に移行される。
【0055】
(A−3)第1の実施形態の効果
第1の実施形態によれば、妨害音声の到来方位に応じて決定したフロアリング閾値を適用して、コヒーレンスフィルタ係数にフロアリング処理を施すようにしたので、雑音抑圧性能と音質のバランスがとれるようなフロアリング処理を実行でき、フロアリング処理による所望した効果を得ることができる。
【0056】
ここで、到来方位が正面に近付くほど高域のコヒーレンスフィルタ係数が増大するという独特の挙動に基づいて高域のフロアリング閾値を設定しているので、上記効果を一段と発揮させることができる。
【0057】
これにより、第1の実施形態の音声信号処理装置若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
【0058】
(B)第2の実施形態
次に、本発明による音声信号処理装置及びプログラムの第2の実施形態を説明する。
【0059】
第1の実施形態は、妨害音声の到来方位を表す指標値としてコヒーレンスCOHを適用したものであった。この第2の実施形態は、妨害音声の到来方位を表す指標値としてコヒーレンスCOH(K)に代えて、SN比SNR(K)を適用することとしたものである。
【0060】
第2の実施形態の音声信号処理装置も、その全体構成は、第1の実施形態の説明で用いた図1で表すことができる。また、第2の実施形態のコヒーレンスフィルタ処理部の詳細構成も、第1の実施形態の説明で用いた図2で表すことができる。
【0061】
但し、上述したように、到来方位推定部24は、第1の実施形態と異なり、コヒーレンスCOH(K)ではなくSN比SNR(K)を算出するものである。フロアリング閾値決定部25は、算出されたSN比SNR(K)に基づいて、帯域別のフロアリング閾値を決定するものである。
【0062】
以下、第2の実施形態の到来方位推定部24が実行する、SN比SNR(K)の算出方法を説明する。
【0063】
到来方位推定部24は、周波数領域信号X1(f,K)、X2(f,K)に基づいて、(9)式に従って、雑音信号N(f,K)を算出する。(9)式の演算は、図9に示すように、正面に死角を有する指向性を形成する処理に相当する。従って、左右から到来する成分のみを得ることができる。今、目的方向を正面方向に想定しているので(例えば、目的話者が正面にいることを想定している)、横から到来する成分は雑音であるということができる。
【0064】
N(f,K)=X1(f,K)−X2(f,K) …(9)
次に、到来方位推定部24は、メインの周波数領域信号X1(f,K)と雑音信号N(f,K)とに基づいて、(10)式に従って、現フレームKにおけるSN比SNR(K)を計算する。(10)式の分母は、雑音信号のレベルであり、分子は、目的音信号のレベルである。目的音は正面から到来し、雑音は横(左右)から到来することを前提しているので、(10)式によってSN比を推定することができる。(10)式におけるηは、0より大きく1より小さいパラメータである。
【数5】
【0065】
以上のように算出されたSN比SNR(K)を、妨害音声の到来方位を表す指標値として適用し、上述した第1の実施形態と同様にして、妨害音声の到来方位に応じたフロアリング閾値を決定する。
【0066】
第2の実施形態によっても、妨害音声の到来方位に応じて決定したフロアリング閾値を適用して、コヒーレンスフィルタ係数にフロアリング処理を施すようにしたので、第1の実施形態と同様な効果を奏することができる。
【0067】
(C)他の実施形態
上記各実施形態の説明においても、種々変形実施形態について言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
【0068】
上記第1の実施形態では、コヒーレンスCOH(K)を妨害音声の到来方位を表す指標値として適用し、上記第2の実施形態ではSN比SNR(K)を妨害音声の到来方位を表す指標値として適用したものを示したが、妨害音声の到来方位を表すものであれば、他の指標値を適用しても良く、また、複数の指標値を同時に適用するようにしても良い。例えば、コヒーレンスCOH(K)が属する範囲とSN比SNR(K)が属する範囲との組み合わせに応じて、フロアリング閾値TH(K)を定めるようにしても良い。
【0069】
上記各実施形態では、フロアリング閾値(若しくはフロアリング閾値の算出関数)を切り替える帯域の数が3帯域のものを示したが、帯域数は2帯域以上であれば良い。
【0070】
上記各実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良く、逆に、時間領域の信号で処理していた処理を、可能ならば周波数領域の信号で処理するようにしても良い。
【0071】
上記各実施形態では、雑音抑制技術として、コヒーレンスフィルタ法を単独で適用したものを示したが、他の雑音抑制技術(特許文献1参照)、例えば、ボイススイッチ法、ウィーナーフィルタ法、周波数減算法と併用するようにしても良い。
【0072】
上記各実施形態では、一対のマイクロホンが捕捉した信号を直ちに処理する音声信号処理装置やプログラムを示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。
【符号の説明】
【0073】
10…音声信号処理装置、11…FFT部、12…コヒーレンスフィルタ処理部、13…IFFT部、m1、m2…マイクロホン、21…入力信号受信部、22…指向性形成部、23…フィルタ係数計算部、24…到来方位推定部、25…フロアリング閾値決定部、26…フロアリング処理部、27…フィルタ処理部、28…フィルタ処理後信号送信部。
図1
図2
図3
図4
図5
図6
図7
図8
図9