特許5927887 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特許5927887非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5927887

(24)【登録日】2016年5月13日

(45)【発行日】2016年6月1日

(54)【発明の名称】非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム

(51)【国際特許分類】

H04R 3/00 20060101AFI20160519BHJP

G10L 21/0224 20130101ALI20160519BHJP

G10L 21/0264 20130101ALI20160519BHJP

【ＦＩ】

H04R3/00 320

G10L21/0224

G10L21/0264

【請求項の数】13

【全頁数】28

(21)【出願番号】特願2011-272618(P2011-272618)

(22)【出願日】2011年12月13日

(65)【公開番号】特開2013-126026(P2013-126026A)

(43)【公開日】2013年6月24日

【審査請求日】2014年8月15日

(73)【特許権者】

【識別番号】000000295

【氏名又は名称】沖電気工業株式会社

(74)【代理人】

【識別番号】100180275

【弁理士】

【氏名又は名称】吉田倫太郎

(74)【代理人】

【識別番号】100090620

【弁理士】

【氏名又は名称】工藤宣幸

(74)【代理人】

【識別番号】100161861

【弁理士】

【氏名又は名称】若林裕介

(72)【発明者】

【氏名】高橋克之

【審査官】菊池充

(56)【参考文献】

【文献】特開２００６−０８４９７４（ＪＰ，Ａ）

【文献】特開２００９−１３５５９３（ＪＰ，Ａ）

【文献】特開２０１０−１８７３６３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１０／０１８５３０８（ＵＳ，Ａ１）

【文献】国際公開第２０１１／１４６９０３（ＷＯ，Ａ１）

【文献】特開２０１０−２３２７１７（ＪＰ，Ａ）

【文献】特開２０１１−１２４８７２（ＪＰ，Ａ）

【文献】国際公開第２０１０／０９２５６８（ＷＯ，Ａ１）

【文献】特開２０１１−１６６４８４（ＪＰ，Ａ）

【文献】特開２０１０−０１１２７２（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０４Ｒ３／００− ３／１４

Ｇ１０Ｌ１９／００−２１／１８

(57)【特許請求の範囲】

【請求項1】

入力信号を時間領域から周波数領域に変換する周波数解析手段と、
上記周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成手段と、
上記周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成部とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成手段と、
上記第１の指向性を持つ信号及び上記第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算手段と、
上記コヒーレンス計算手段から取得したコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視手段と、
上記コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、上記コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出手段と、
上記目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御手段と、
上記利得制御手段により得られた上記利得を、上記入力信号に乗算する利得乗算手段と
を備えることを特徴とする非目的音抑制装置。

【請求項2】

上記コヒーレンス変動監視手段が、
少なくとも、前の区間のコヒーレンス値を記憶する記憶部と、
前の区間のコヒーレンス値と現在の区間のコヒーレンス値との大小比較、又は、前の区間のコヒーレンス勾配とコヒーレンス勾配判定閾値との大小比較を行うコヒーレンス増減判定部と、
前の区間より現在のコヒーレンス値が小さいか、又は、前の区間のコヒーレンス勾配が所定のコヒーレンス勾配判定閾値より小さい、という判定条件を満たす場合は、コヒーレンス値が減少を始めた区間のコヒーレンス値を初期値として、上記初期値と現在のコヒーレンス値と比較することでコヒーレンス勾配を求め、上記判定条件を満たさなかった場合には、コヒーレンス勾配を所定の初期化値で初期化することで、コヒーレンス勾配を求めるコヒーレンス勾配計算部と
を有し、
上記目的音区間検出手段が、
コヒーレンス値が目的音区間判定閾値より大きいか、又は、コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合を目的音区間と判定し、それ以外の場合を非目的音区間と判定する、目的音区間判定部を有し、
上記利得制御手段が、目的音区間判定部の結果に応じて上記利得を設定するものである
ことを特徴とする請求項１に記載の非目的音抑制装置。

【請求項3】

上記コヒーレンス計算手段からのコヒーレンス値に基づいて、コヒーレンス値が連続して目的音判定閾値を下回った区間の長さである小コヒーレンス区間長を観測する小コヒーレンス区間長監視手段を備え、
上記コヒーレンス変動監視手段が、上記小コヒーレンス区間長が所定の小コヒーレンス判定閾値より大きくなった場合は、当該区間が非目的音区間となるように、当該コヒーレンス勾配を初期化することを特徴とする請求項１又は２に記載の非目的音抑制装置。

【請求項4】

上記小コヒーレンス区間長監視手段が、
上記コヒーレンス計算手段からのコヒーレンス値が所定の目的音区間判定閾値より小さいか否かを判定する小コヒーレンス判定部と、
上記コヒーレンス値が上記目的音区間判定閾値より小さい場合、上記小コヒーレンス区間長を所定の値だけ増加させ、上記コヒーレンス値が上記目的音区間判定閾値以上の場合、上記小コヒーレンス区間長を所定の値に初期化する小コヒーレンス区間長計算部と
を有し、
コヒーレンス変動監視手段が、
上記小コヒーレンス区間長が所定の区間長判定閾値以上の場合、上記コヒーレンス勾配を初期化し、上記小コヒーレンス区間長が上記区間長判定閾値より小さい場合、コヒーレンス勾配演算処理を行うように制御する、コヒーレンス勾配計算制御部を有することを特徴とする請求項３に記載の非目的音抑制装置。

【請求項5】

上記コヒーレンス変動監視手段からの上記コヒーレンス勾配を補正するコヒーレンス勾配補正手段を更に備え、
上記目的音区間検出手段が、補正後のコヒーレンス勾配に基づいて、目的音区間、非目的音区間を判定するものである
ことを特徴とする請求項１〜４のいずれかに記載の非目的音抑制装置。

【請求項6】

上記コヒーレンス勾配補正手段が、上記コヒーレンス計算手段から取得したコヒーレンス値と、上記コヒーレンス変動監視手段から取得した上記コヒーレンス勾配とを乗算して、補正後のコヒーレンス勾配を求めるものであることを特徴とする請求項５に記載の非目的音抑制装置。

【請求項7】

コヒーレンス勾配補正手段が、上記コヒーレンス値に長期平均処理を施した長期平均コヒーレンス値と、上記コヒーレンス勾配とを乗算して、補正後コヒーレンス勾配を求めるものであることを特徴とする請求項５に記載の非目的音抑制装置。

【請求項8】

コヒーレンス勾配補正手段が、上記コヒーレンス値を２乗した２乗コヒーレンス値と、上記コヒーレンス勾配とを乗算して、補正後のコヒーレンス勾配を求めるものであることを特徴とする請求項５に記載の非目的音抑制装置。

【請求項9】

上記目的音区間検出手段が、補正後のコヒーレンスに長期平均化処理を行い、その長期平均コヒーレンス勾配が、所定の目的音区間判定閾値以上、又は、長期平均コヒーレンス勾配が所定のコヒーレンス勾配判定閾値より小さい場合は目的音区間と判定し、そうでない場合は非目的音区間と判定するものであり、
上記利得制御手段が、上記目的音区間検出手段の判定結果に応じて上記利得を設定するものである
ことを特徴とする請求項５〜８のいずれかに記載の非目的音抑制装置。

【請求項10】

周波数減算手段、コヒーレンスフィルター演算手段、ウィーナーフィルター演算手段のうち、いずれか１つ若しくは２つ若しくは全部を備えることを特徴とする請求項１〜９のいずれかに記載の非目的音抑制装置。

【請求項11】

上記目的音区間検出手段が、上記コヒーレンス勾配に代えて、上記コヒーレンス値の分散によって目的音声区間か否かを検出することを特徴とする請求項１〜１０のいずれかに記載の非目的音抑制装置。

【請求項12】

周波数解析手段が、入力信号を時間領域から周波数領域に変換する周波数解析工程と、
第１の指向性形成手段が、上記周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成工程と、
第２の指向性形成手段が、上記周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成工程とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成工程と、
コヒーレンス計算手段が、上記第１の指向性を持つ信号及び上記第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算工程と、
コヒーレンス変動監視手段が、上記コヒーレンス計算手段から取得したコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視工程と、
目的音区間検出手段が、上記コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、上記コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出工程と、
利得制御手段が、上記目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御工程と、
利得乗算手段が、上記利得制御手段により得られた上記利得を、上記入力信号に乗算する利得乗算工程と
を有することを特徴とする非目的音抑制方法。

【請求項13】

コンピュータを、
入力信号を時間領域から周波数領域に変換する周波数解析手段、
上記周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成手段、
上記周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成手段とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成手段、
上記第１の指向性を持つ信号及び上記第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算手段、
上記コヒーレンス計算手段から取得したコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視手段、
上記コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、上記コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出手段、
上記目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御手段、
上記利得制御手段により得られた上記利得を、上記入力信号に乗算する利得乗算手段
として機能させることを特徴とする非目的音抑制プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラムに関し、例えば、電話やテレビ会議等の音声の通信装置や通信ソフトウェアで用いる音響信号処理装置に適用し得るものである。

【背景技術】

【0002】

雑音抑制技術の１つにボイススイッチと呼ばれる技術がある（特許文献１参照）。これは、目的音声区間検出機能を用いて入力信号から話者が話している区間（目的音声区間）を検出し、目的音声区間の場合は無処理で出力し、非目的音声区間の場合は振幅を減衰する、という処理のことである。

【0003】

図２は、ボイススイッチ処理を示すフローチャートである。図２において、入力信号ｉｎｐｕｔが受信されると（Ｓ９０１）、目的音声区間検出部が目的音声区間か否かを判定する（Ｓ９０２）。

【0004】

このとき、ｉｎｐｕｔが目的音声区間であれば、ボイススイッチゲインであるＶＳ＿ＧＡＩＮは「１．０」と設定され（Ｓ９０３）、ｉｎｐｕｔが非目的音声区間であれば、ＶＳ＿ＧＡＩＮは「α」（α：０．０≦α＜１．０の任意の値）として設定する（Ｓ９０４）。そして、ＶＳ＿ＧＡＩＮがｉｎｐｕｔに乗算され、その出力信号ｏｕｔｐｕｔが得られる（Ｓ９０５）。

【0005】

このボイススイッチ処理は、例えば、テレビ会議装置、携帯電話機等の音声通信機器等に適用することができ、このボイススイッチ処理を行うことで、非目的音声区間（雑音）を抑制し、通話音質を高めることができる。

【0006】

ところで、非目的音声は、話者以外の人間の声である「妨害音声」と、オフィスノイズや道路ノイズなどのような「背景雑音」とに分けられる。

【0007】

非目的音声区間が背景雑音のみの場合、目的音声区間検出部は、目的音声区間か否かを正確に判定することができるのに対し、非目的音声区間に妨害音声が重畳されている場合には、目的音声区間検出部は、妨害音声も目的音声とみなしてしまうため、誤判定が生じ得る。この結果、ボイススイッチが妨害音声を抑制できず、十分な通話音質を提供することができない。

【0008】

この課題に対して、目的音声区間検出部で参照する特徴量として、これまで用いてきた入力信号レベルの変動から、コヒーレンスに変更することで改善される。

【0009】

ここで、コヒーレンスとは、簡単に述べれば、入力信号の到来方向を意味する特徴量である。例えば携帯電話などの利用を想定した場合、話者の声（目的音声）は正面から到来し、妨害音声は正面以外から到来する傾向が強いので、到来方向に着目することで、従来は不可能だった目的音声と妨害音声との区別が可能となる。

【0010】

図３は、目的音声検出機能にコヒーレンスを用いる場合のボイススイッチ９０の機能構成を示すブロック図である。

【0011】

図３において、マイクｍ１及びｍ２のそれぞれから図示しないＡＤ変換器を介して、入力信号ｓ１（ｔ）及びｓ２（ｔ）がＦＦＴ部９１に与えられる。なお、ｔはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中ではｔが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。

【0012】

ＦＦＴ部９１は、マイクｍ１及びマイクｍ２から入力信号系列ｓ１及びｓ２を受け取り、その入力信号ｓ１及びｓ２に高速フーリエ変換（あるいは離散フーリエ変換）を行うものである。これにより、入力信号ｓ１及びｓ２を周波数領域で表現することができる。なお、高速フーリエ変換を実施するに当たり、入力信号ｓ１（ｔ）及びｓ２（ｔ）から所定のN個のサンプルから成る、分析フレームFRAME１（K）及びFRAME2（K）を構成する。入力信号s1からFRAME1を構成する例を以下に記載する。

【0013】

FRAME1（1）＝｛s1（1）、s1（2）、・・、s1（i）、・・s1（N）｝
・
・
FRAME1（K）＝｛s1（N×K+1）、s1（N×K＋2）、・・、s1（N×K＋i）、・・s1（N×K＋N）｝
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中ではKが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の動作説明において、特に但し書きが無い限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。

【0014】

ＦＦＴ部９１では、分析フレームごとに高速フーリエ変換処理を施すことで、入力信号ｓ１から構成した分析フレームFRAME1（K）にフーリエ変換して得た周波数領域信号Ｘ１（ｆ、K）、及び入力信号ｓ２から構成した分析フレームFRAME2（K）をフーリエ変換して得た周波数領域信号Ｘ２（ｆ、K）を、第１の指向性形成部９２及び第２の指向性形成部９３に与えるものである。なおfは周波数を表すインデックスである。またX１（ｆ、K）は単一の値ではなく、
X1（f、K）=｛X1（f1、K）、X1（f2、K）、・・X1（fi、K）・・、X1（fm、K）｝
というように複数の周波数f1〜fmのスペクトル成分から構成されるものであることを補足しておく。これはX2（f、K）及び、後段の指向性形成部で現れるB1（f、K）,B2（f、K）も同様である。

【0015】

第１の指向性形成部９２は、式（１）に従って演算を行い、後述するように音源方向の特定方向（右方向）に強い指向性を持つ信号Ｂ１（ｆ、K）を求める。また、第２の指向性形成部９３は、式（２）に従って演算を行い、後述するように音源方向の特定方向（左方向）に強い指向性を持つ信号Ｂ２（ｆ、K）をそれぞれ計算する（フレームインデックスKは演算には関与しないので、計算式には記載しない）。

【数1】

【0016】

式（１）及び式（２）の意味を、図４及び図５を用いて説明する。図４（Ａ）において、マイクｍ１とマイクｍ２とは距離ｌだけ隔てて設置されているものとする。マイクｍ１とマイクｍ２には音波が到来する。この音波は、マイクｍ１及びマイクｍ２を通る面の正面方向に対して角度θの方向から到来するものとする。

【0017】

このとき、音波がマイクｍ１とマイクｍ２に到達するまでには、時間差が生じる。この到達時間差τは、音の経路差をｄとすると、ｄ＝ｌ×ｓｉｎθなので、式（２−１）のようにして与えられる。

【0018】

τ＝ｌ×ｓｉｎθ／ｃ（ｃ：音速） …（２−１）
ところで、入力信号ｓ１（ｔ）に到達時間差τだけ遅延を与えた信号ｓ１（ｔ−τ）は、ｓ２（ｔ）と同一の信号であるといえる。

【0019】

したがって、両者の差をとった信号ｙ（ｔ）＝ｓ２（ｔ）−ｓ１（ｔ−τ）は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーは図４（Ｂ）のような指向特性を持つようになる。

【0020】

なお、上記の説明では時間領域での演算を記したが、周波数領域で行っても同様な効果が得られる。式（１）及び式（２）は、周波数領域とする場合の演算式の例である。

【0021】

ここで、今、到来方向θ＝９０度とした場合には、図５（Ａ）及び図５（Ｂ）のような指向特性となる。なお、指向特性について、図５に示すように前方向、後方向、右方向及び左方向と定義する。図５（Ａ）に示すように、第１の指向性形成部９２に形成された指向性は左方向に強いものとなり、図５（Ｂ）に示すように、第２の指向性形成部９３に形成された指向性は右方向に強いものとなる。

【0022】

なお、以降の説明では、説明便宜上、θ＝９０度であることを想定して動作説明を行うが、本発明の実施の際はこの設定に限定されるものではない。

【0023】

以上のようにして得られた信号Ｂ１（ｆ、K）及びＢ２（ｆ、K）は、コヒーレンス計算部９４に与えられる。コヒーレンス計算部９４は、以下の式（３）及び式（４）に従って演算を行うことで、コヒーレンスＣＯＨを得る。（フレームインデックスKは演算には関与しないので、計算式には記載しない）

【数2】

【0024】

次に、目的音声区間検出及びゲイン制御部９５は、コヒーレンスＣＯＨ（K）を目的音声区間判定閾値Θと比較し、コヒーレンスＣＯＨ（K）が目的音声区間判定閾値Θより大きければ目的音声区間とみなしてゲインＶＳ＿ＧＡＩＮを１．０に設定し、コヒーレンスＣＯＨが目的音声区間判定閾値Θより小さければ非目的音声区間（妨害音声、背景雑音）とみなしてＶＳ＿ＧＡＩＮを１．０未満の任意の正の数値αに設定する。

【0025】

ここで、コヒーレンスの大小で目的音声区間を検出する背景を簡単に述べておく。コヒーレンスの概念は、右方向から到来する信号と左方向から到来する信号の相関と言い換えられる。

【0026】

よって、コヒーレンスＣＯＨが小さい場合とは、信号Ｂ１と信号Ｂ２との相関が小さい場合であり、反対にコヒーレンスＣＯＨが大きい場合とは信号Ｂ１とＢ２との相関が大きい場合と言い換えることができる。

【0027】

そして、相関が小さい場合の入力信号は、入力到来方向が右方向又は左方向のいずれかに大きく偏った場合か、偏りがなくても雑音のような明確な規則性の少ない信号の場合である。

【0028】

そのために、コヒーレンスＣＯＨが小さい区間は妨害音声区間あるいは背景雑音区間（非目的音声区間）であるといえる。

【0029】

一方、コヒーレンスＣＯＨの値が大きい場合は、到来方向の偏りが無いため、入力信号が正面から到来する場合であるといえる。今、目的音声は正面から到来すると仮定しているので、コヒーレンスＣＯＨが大きい場合は目的音声区間といえる。

【0030】

以上のようにして得たＶＳ＿ＧＡＩＮはボイススイッチゲイン乗算部９６で信号ｓ１（ｔ）と乗算され、出力信号ｙ（ｔ）が得られる。

【先行技術文献】

【特許文献】

【0031】

【特許文献1】特開２００６−１９７５５２号公報

【特許文献2】特表２０１０−５３２８７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0032】

しかしながら、上述した従来のボイススイッチ処理の構成では、音声の立ち上がり部のような振幅の小さい小振幅区間の場合、たとえ目的音声であっても明確なピッチ性がなく相関が出にくいため、コヒーレンスＣＯＨの値が小さくなる。その結果、妨害音声と誤判定されてボイススイッチで信号が減衰されるので、ところどころ途切れたような音声が出力され、音質が不自然になるという課題がある。

【0033】

そのため、小振幅区間の成分も含めて、正確に目的音声を検出し、音質の劣化を防止することができる非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラムが求められている。

【課題を解決するための手段】

【0034】

かかる課題を解決するために、第１の本発明は、（１）入力信号を時間領域から周波数領域に変換する周波数解析手段と、（２）周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成手段と、（３）周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成手段とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成手段と、（４）第１の指向性を持つ信号及び第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算手段と、（４）コヒーレンス計算手段からのコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視手段と、（５）コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出手段と、（６）目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御手段と、（７）利得制御手段により得られた利得を、入力信号に乗算する利得乗算手段とを備えることを特徴とする非目的音抑制装置である。

【0035】

第２の本発明は、（１）周波数解析手段が、入力信号を時間領域から周波数領域に変換する周波数解析工程と、（２）第１の指向性形成手段が、周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成工程と、（３）第２の指向性形成手段が、周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成工程とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成工程と、（４）コヒーレンス計算手段が、第１の指向性を持つ信号及び第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算工程と、（５）コヒーレンス変動監視手段が、コヒーレンス計算手段からのコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視工程と、（６）目的音区間検出手段が、コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出工程と、（７）利得制御手段が、目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御工程と、（８）利得乗算手段が、利得制御手段により得られた利得を、入力信号に乗算する利得乗算工程とを有することを特徴とする非目的音抑制方法である。

【0036】

第３の本発明は、コンピュータを、（１）入力信号を時間領域から周波数領域に変換する周波数解析手段、（２）周波数解析手段から得られた信号に遅延減算処理を行い、所定の方位に死角を有する第１の指向性を持つ信号を形成する第１の指向性形成手段、（３）周波数解析手段から得られた信号に遅延減算処理を行い、第１の指向性形成手段とは異なる所定の方位に死角を有する第２の指向性を持つ信号を形成する第２の指向性形成手段、（４）第１の指向性を持つ信号及び第２の指向性を持つ信号に基づいて、コヒーレンス値を求めるコヒーレンス計算手段、（５）コヒーレンス計算手段からのコヒーレンス値に基づいて、コヒーレンス勾配を求めるコヒーレンス変動監視手段、（６）コヒーレンス値が所定の目的音区間判定閾値より大きいか、又は、コヒーレンス勾配がコヒーレンス勾配判定閾値より小さい場合、目的音区間と判定し、そうでない場合は非目的音区間と判定する目的音区間検出手段、（７）目的音区間検出手段の判定結果に応じて、入力信号の振幅を抑制する利得を設定する利得制御手段、（８）利得制御手段により得られた利得を、入力信号に乗算する利得乗算手段として機能させることを特徴とする非目的音抑制プログラムである。

【発明の効果】

【0037】

本発明によれば、小振幅区間の成分も含めて、正確に目的音声を検出し、音質の劣化を防止することができる。

【図面の簡単な説明】

【0038】

【図1】第１の実施形態の非目的音抑制装置の機能構成を示す機能ブロック図である。

【図2】従来のボイススイッチ処理を示すフローチャートである。

【図3】目的音声検出機能にコヒーレンスを用いる場合のボイススイッチの機能構成を示すブロック図である。

【図4】第１の指向性形成部及び第２の指向性形成部の指向性を説明する説明図である。

【図5】第１の指向性形成部及び第２の指向性形成部の指向性を説明する説明図である。

【図6】第１の実施形態のコヒーレンス変動監視部の内部構成を示す機能ブロック図である。

【図7】第１の実施形態の目的音声区間検出及びゲイン制御部の内部構成を示す機能ブロック図である。

【図8】第１の実施形態のコヒーレンス変動監視部における動作を示すフローチャートである。

【図9】第１の実施形態の目的音声区間検出及びゲイン制御部における動作を示すフローチャートである。

【図10】第２の実施形態の非目的音抑制装置の機能構成を示す機能ブロック図である。

【図11】第２の実施形態の小コヒーレンス区間監視部の内部構成を示す機能ブロック図である。

【図12】第２の実施形態のコヒーレンス変動監視部の内部構成を示す機能ブロック図である。

【図13】第２の実施形態の小コヒーレンス区間監視部における動作を示すフローチャートである。

【図14】第２の実施形態のコヒーレンス変動監視部における動作を示すフローチャートである。

【図15】第３の実施形態の非目的音抑制装置の機能構成を示す機能ブロック図である。

【図16】第３の実施形態のコヒーレンス変動補正部の内部構成を示す機能ブロック図である。

【図17】第３の実施形態の変形実施形態の非目的音抑制装置の機能構成を示す機能ブロック図である。

【図18】第３の実施形態の変形実施形態のコヒーレンス長期平均計算部を設けたときの目的音声区間検出及びゲイン制御部における動作を示すフローチャートである。

【図19】変形実施形態の第１の実施形態と周波数減算の構成とを併用した場合の構成を示す構成図である。

【図20】変形実施形態における第３の指向性形成部で形成される指向性を説明する図である。

【図21】変形実施形態の第１の実施形態とコヒーレンスフィルターの構成とを併用した場合の構成を示す構成図である。

【図22】変形実施形態の第１の実施形態とウィーナーフィルターの構成とを併用した場合の構成を示す構成図である。

【発明を実施するための形態】

【0039】

（Ａ）第１の実施形態
以下では、本発明の非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラムの第１の実施形態を、図面を参照しながら詳細に説明する。

【0040】

目的音声区間では、コヒーレンスの値は、全般的に大きく、目的音声の大振幅での値と小振幅区間での値は大きく変動する。一方、非目的音声区間では、コヒーレンスの値は全般的に小さいうえに変動も小さい。

【0041】

そこで、第１の実施形態では、以上のような「目的音声区間の小振幅区間に変わった場合のみ、コヒーレンス値は大きく変動する」というコヒーレンスに特有の挙動を利用して目的音声の小振幅成分を目的音声区間と判定されるようにすることで、目的音声成分の欠落による音質劣化を防止する。

【0042】

（Ａ−１）第１の実施形態の構成
（Ａ−１−１）非目的音抑制装置の全体構成
図１は、第１の実施形態の非目的音抑制装置の機能構成を示す機能ブロック図である。なお、非目的音抑制装置１０は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ、ＥＥＰＲＯＭ、入出力インタフェース等を有する装置において、ＣＰＵが、ＲＯＭに格納される非目的音抑制プログラム等を実行することにより実現されるものである。なお、非目的音抑制プログラムは、ネットワークを通じたインストールされるものであっても良く、その場合でも図１に示す構成要素を構成する。

【0043】

図１において、第１の実施形態の非目的音抑制装置１０は、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６、ボイススイッチゲイン乗算部１７を有する。

【0044】

ＦＦＴ部１１は、マイクｍ１及びｍ２から入力された入力信号ｓ１（ｔ）及びｓ２（ｔ）を取り込み、その入力信号系列ｓ１及びｓ２に対して高速フーリエ変換を行うものである。これにより、入力信号ｓ１及びｓ２を周波数領域で表現することができる。また、ＦＦＴ部１１は、入力信号系列ｓ１を周波数領域に変換した周波数領域信号Ｘ１（ｆ、K）及び入力信号系列ｓ２を周波数領域に変換した周波数領域信号Ｘ２（ｆ、K）を、第１の指向性形成部１２及び第２の指向性形成部１３に与えるものである。

【0045】

第１の指向性形成部１２は、ＦＦＴ部１１から周波数領域信号Ｘ１（ｆ、K）及びＸ２（ｆ、K）を受け取り、特定の方向に強い指向特性を有する信号Ｂ１（ｆ、K）を形成し、その信号Ｂ１（ｆ、K）をコヒーレンス計算部１４に与えるものである。

【0046】

また、第２の指向性形成部１２は、ＦＦＴ部１１から周波数領域信号Ｘ１（ｆ、K）及びＸ２（ｆ、K）を受け取り、第１の指向性形成部１２とは異なる特定の方向に強い指向特性を有する信号Ｂ２（ｆ、K）を形成し、その信号Ｂ２（ｆ、K）をコヒーレンス計算部１４に与えるものである。

【0047】

ここで、第１の指向性形成部１２及び第２の指向性形成部１３による特定方向に指向性の強い信号を形成する方法は、既存の技術の方法を適用することができ、例えば式（１）及び式（２）に従った演算により求める方法を適用することができる。

【0048】

コヒーレンス計算部１４は、第１の指向性形成部１２からの信号Ｂ１（ｆ、K）と、第２の指向性形成部１３からの信号Ｂ２（ｆ、K）とに基づいてコヒーレンスを求めるものである。また、コヒーレンス計算部１４は、求めたコヒーレンスの値ＣＯＨ（K）を、コヒーレンス変動監視部１５と、目的音声区間検出及びゲイン制御部１６に与えるものである。

【0049】

コヒーレンス計算部１４のコヒーレンスの計算方法は、既存の方法を適用することができ、例えば式（３）及び式（４）を用いて求める方法を適用する。

【0050】

コヒーレンス変動監視部１５は、コヒーレンス計算部１４からのコヒーレンスの値ＣＯＨの変動を監視するものである。

【0051】

例えば、コヒーレンス変動監視部１５は、コヒーレンス計算部１４からのコヒーレンスの値ＣＯＨを一時的に格納する。そして、コヒーレンス変動監視部１５は、今回受け取ったコヒーレンスの値ＣＯＨ（K）と前回のコヒーレンスの値ＣＯＨ（K−１）とを比較し、今回のコヒーレンスの値と前回のコヒーレンスの値との勾配ｇｒａｄ（K）を求める。

【0052】

また、コヒーレンス変動監視部１５は、コヒーレンスの勾配ｇｒａｄ（K）を、目的音声区間検出及びゲイン制御部１６に与える。

【0053】

目的音声区間検出及びゲイン制御部１６は、コヒーレンス計算部１４から得たコヒーレンス値ＣＯＨ（K）と、コヒーレンス変動監視部１５から得たコヒーレンスの勾配ｇｒａｄ（K）とに基づいて、目的音声区間か否かを判定し、その結果に基づいてゲインＶＳ＿ＧＡＩＮを設定するものである。また、目的音声区間検出及びゲイン制御部１６は、設定したゲインＶＳ＿ＧＡＩＮをボイススイッチゲイン乗算部１７に与える。

【0054】

ボイススイッチゲイン乗算部１７は、目的音声区間検出及びゲイン制御部１６からのゲインＶＳ＿ＧＡＩＮを入力信号ｓ１（ｔ）に乗算して出力信号ｙ（ｔ）を生成し、これを出力するものである。

【0055】

（Ａ−１−２）コヒーレンス変動監視部１５の内部構成
図６は、コヒーレンス変動監視部１５の内部構成を示す機能ブロック図である。図６において、コヒーレンス変動監視部１５は、コヒーレンス入力部１５１、コヒーレンス増減判定部１５２、記憶部１５３、コヒーレンス勾配計算部１５４、コヒーレンス勾配出力部１５５を有する。

【0056】

コヒーレンス入力部１５１は、コヒーレンス計算部１４からコヒーレンスの値ＣＯＨを受け取り、コヒーレンス増減判定部１５２に与えるものである。

【0057】

コヒーレンス増減判定部１５２は、コヒーレンス入力部１５１から得るコヒーレンスの値ＣＯＨ（K）と、記憶部１５３に記憶されている直前のコヒーレンスの値ＣＯＨ（K−１）とを比較してコヒーレンスの値の増減を判定するものである。これにより、コヒーレンス値ＣＯＨの減少を検出する。

【0058】

記憶部１５３は、コヒーレンス増減判定部１５２を介して、入力されたコヒーレンスの値ＣＯＨ（K）を一時的に記憶するものである。

【0059】

コヒーレンス勾配計算部１５４は、現在区間のコヒーレンス値と、過去区間のコヒーレンス値とに基づいて、コヒーレンスの勾配ｇｒａｄ（K）を求めるものである。コヒーレンス勾配計算部１５４は、コヒーレンス値の勾配を求めることができる。

【0060】

コヒーレンス勾配出力部１５５は、コヒーレンス勾配計算部１５４により求められたコヒーレンスの勾配ｇｒａｄ（K）を、目的音声区間検出及びゲイン制御部１６に与えるものである。

【0061】

（Ａ−１−３）目的音声区間検出及びゲイン制御部１６の内部構成
図７は、目的音声区間検出及びゲイン制御部１６の内部構成を示す機能ブロック図である。

【0062】

図７において、目的音声区間検出及びゲイン制御部１６は、コヒーレンス及びコヒーレンス勾配入力部１６１、目的音区間判定部１６２、ゲイン制御部１６３、ゲイン出力部１６４を有する。

【0063】

コヒーレンス及びコヒーレンス勾配入力部１６１は、コヒーレンス計算部１４からのコヒーレンスの値ＣＯＨ（K）を入力する共に、コヒーレンス変動監視部１５からコヒーレンスの勾配ｇｒａｄ（K）を入力するものである。

【0064】

目的音区間判定部１６２は、コヒーレンス及びコヒーレンス勾配入力部１６１からのコヒーレンス値ＣＯＨ（K）とコヒーレンス勾配ｇｒａｄ（K）に基づいて目的音声区間を判定するものである。また、目的音区間判定部１６２は、その判定結果をゲイン制御部１６３に与えるものである。

【0065】

ゲイン制御部１６３は、目的音区間判定部１６２からの判定結果に基づいて、ゲインＶＳ＿ＧＡＩＮの値を設定するものである。

【0066】

ゲイン出力部１６４は、ゲイン制御部１６３により設定されたゲインＶＳ＿ＧＡＩＮをボイススイッチゲイン乗算部１７に与えるものである。

【0067】

（Ａ−２）第１の実施形態の動作
次に、第１の実施形態の非目的音抑制装置１０における動作について、図面を参照しながら説明する。

【0068】

図１において、マイクｍ１及びｍ２に入力された入力信号ｓ１（ｔ）及びｓ２（ｔ）は、ＦＦＴ部１１に与えられる。ＦＦＴ部１１は、入力信号系列ｓ１及びｓ２に高速フーリエ変換処理を施し、入力信号ｓ１及びｓ２を、周波数領域信号Ｘ１（ｆ、K）及びＸ２（ｆ、K）を求める。

【0069】

第１の指向性形成部１２及び第２の指向性形成部１３は、式（１）及び式（２）に従って、ＦＦＴ部１１からの周波数領域信号Ｘ１（ｆ、K）及びｘ２（ｆ、K）に基づいて、特定方向に強い指向性を有する信号Ｂ１（ｆ、K）及びＢ２（ｆ、K）を生成する。

【0070】

コヒーレンス計算部１４は、第１の指向性形成部１２により形成された信号Ｂ１（ｆ、K）と、第２の指向性形成部１３により形成された信号Ｂ２（ｆ、K）とに基づいて、式（３）及び式（４）に従って、コヒーレンス値ＣＯＨ（K）を求める。

【0071】

次に、コヒーレンス変動監視部１５は、コヒーレンス計算部１４からのコヒーレンス値ＣＯＨ（K）を用いて、目的音声区間の小振幅区間を検出するための特徴量として、コヒーレンス勾配ｇｒａｄ（K）を計算する。このｇｒａｄ（K）を用いて目的音声区間の小振幅区間に移行したときに特有なコヒーレンスの大幅な減少を検出することができる。

【0072】

図８は、コヒーレンス変動監視部１５における動作を示すフローチャートである。

【0073】

まず、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）がコヒーレンス入力部１５１に与えられる。コヒーレンスＣＯＨ（K）が入力されると、コヒーレンス増減判定部１５２は、記憶部１５３に記憶されている直前フレームのコヒーレンスＣＯＨ（K−１）と、現フレームのコヒーレンスＣＯＨ（K）との大小比較を行う（Ｓ１０１）。

【0074】

このとき、コヒーレンスＣＯＨ（K）がＣＯＨ（K−１）より大きい場合、目的音声区間の小振幅区間ではないと判断し、処理はＳ１０５に移行する。

【0075】

Ｓ１０５では、コヒーレンス勾配計算部１５４が、ｇｒａｄ（K）にΩ（Ω：任意の正の数）を代入し、コヒーレンス勾配送信部がｇｒａｄ（K）を出力する。また、このとき、コヒーレンス変動監視部１５は、ｃｏｕｎｔｅｒを初期化（ｃｏｕｎｔｅｒ＝０）する（Ｓ１０５）。

【0076】

一方、Ｓ１０１において、コヒーレンスＣＯＨ（K）がＣＯＨ（K−１）より小さい場合、コヒーレンスの減少区間であると判定し、処理はＳ１０２に移行する。

【0077】

Ｓ１０２では、減少区間長であるｃｏｕｎｔｅｒが０か否かを判定し、０である場合にはＳ１０３に移行する。またｃｏｕｎｔｅｒが０ではない場合には、何もせずＳ１０４に移行する。

【0078】

次に、コヒーレンス勾配計算部１５４は、コヒーレンスの勾配を求めるために、ＣＯＨ（K−１）を減少開始の基点ＧＲＡＤ＿ＩＮＩとする。具体的には、コヒーレンス勾配計算部１５４は、初期値ＧＲＡＤ＿ＩＮＩ＝ＣＯＨ（K−１）とする（Ｓ１０３）。

【0079】

そして、コヒーレンス変動監視部１５は、ｃｏｕｎｔｅｒをインクリメントし（Ｓ１０４）、コヒーレンス勾配計算部１５４は、式（５）に従って、コヒーレンス勾配ｇｒａｄ（K）を求める（Ｓ１０４）。

【0080】

grad（K）＝−｛ GRAD＿INI−COH（K））／counter …（５）
そして、コヒーレンス変動監視部１５は、時間をインクリメントして、次のフレームのコヒーレンスＣＯＨ（K）を取得する（Ｓ１０６）。

【0081】

ここで、Ｓ１０１では、現フレームのコヒーレンスＣＯＨ（K）と直前フレームのコヒーレンスＣＯＨ（K−１）との比較だけではなく、直前フレームのｇｒａｄ（K−１）と、コヒーレンス勾配判定閾値Ψ（Ψ＜０．０）との比較を行う背景を説明する。

【0082】

目的音声区間の小振幅部において、コヒーレンス値を数フレーム単位の長い期間で観測すると、全体としては大きく減少する傾向であるものの、１フレーム毎に細かく観測すると、瞬時変動により前フレームよりコヒーレンス値が大きくなる場合もある。このような場合は、判定条件が「ＣＯＨ（K）＜ＣＯＨ（K−１）」のみでは、コヒーレンス値の瞬時増加によって減少区間におけるｇｒａｄがリセットされてしまい、長期的なコヒーレンスの勾配を得られなくなってしまう。

【0083】

そこで、ｇｒａｄ（K−１）＜Ψも判定条件に追加することにより、コヒーレンス減少期間中であることを検出してｇｒａｄの中途リセットを防ぐようにする。これにより「コヒーレンス値は全体としては減少しているものの、瞬間的に増加してしまった場合」であっても、長期的な傾きを算出することが可能となる。なお、コヒーレンスが全体として増加傾向にある区間においては、上記判定条件を満たさないように、Ｓ１０５で任意の正の定数Ωをｇｒａｄ（K）に代入していることも補足しておく。また、本非目的音声抑制処理の開始直後でもｇｒａｄをΩで初期化してよい。

【0084】

コヒーレンス変動監視部１５は、以上の演算を行い、コヒーレンスの減少区間ではｇｒａｄを更新しながら、そのｇｒａｄ（K）を目的音声区間検出及びゲイン制御部１６に与える。

【0085】

図９は、目的音声区間検出及びゲイン制御部１６における動作を示すフローチャートである。

【0086】

まず、目的音声区間検出及びゲイン制御部１６において、コヒーレンス計算部１４からのコヒーレンスＣＯＨ（K）と、コヒーレンス変動監視部１５からのｇｒａｄ（K）とが入力される（Ｓ２０１）。

【0087】

目的音区間判定部１６２は、コヒーレンスＣＯＨ（K）と目的音声区間判定閾値Θとの比較と、ｇｒａｄ（K）とコヒーレンス勾配判定閾値Ψ（Ψ＜０．０の値）との比較を行なう（Ｓ２０２）。

【0088】

そして、コヒーレンスＣＯＨ（K）が目的音声区間判定閾値Θ以上のとき、又は、ｇｒａｄ（K）がコヒーレンス勾配判定閾値Ψより小さいときのいずれかの場合、目的音区間判定部１６２は目的音声区間であると判定して、処理をＳ２０３に移行する。

【0089】

一方、そうでない場合、目的音区間判定部１６２は非目的音声区間と判定し、処理をＳ２０４に移行する。

【0090】

このように、従来の判定条件に「ｇｒａｄ（K）＜Ψ」という条件を追加することで目的音声区間の小振幅成分も目的音声と判定されるように改良されている。

【0091】

そして、ゲイン制御部１６３は、目的音声区間である場合、ボイススイッチのゲインＶＳ＿ＧＡＩＮに１．０を代入し（Ｓ２０３）、一方、非目的音声区間である場合、ゲインＶＳ＿ＧＡＩＮにα（０．０≦α＜１．０の任意の値）を代入する（Ｓ２０４）。

【0092】

こうして得られたＶＳ＿ＧＡＩＮは、ゲイン出力部１６４からボイススイッチゲイン乗算部１７に与えられる（Ｓ２０５）。

【0093】

ボイススイッチゲイン乗算部１７は、入力信号ｓ１（ｔ）に、ＶＳ＿ＧＡＩＮを乗算することで出力信号ｙ（ｔ）が求め、その出力信号ｙ（ｔ）を出力する。

【0094】

（Ａ−３）第１の実施形態の効果
以上のように、第１の実施形態によれば、コヒーレンスの大小だけでなく、コヒーレンスの変動に基づいて目的音声の小振幅成分も含めて、正確に検出することができる。これにより、従来のような目的音声区間の誤判定によって生じる目的音声の欠落を防止できるので、音質劣化が解消される。

【0095】

これにより、本発明をテレビ会議システムや携帯電話などの通信装置に適用することで、通話音質の向上が期待できる。

【0096】

（Ｂ）第２の実施形態
次に、本発明の非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラムの第２の実施形態を、図面を参照しながら詳細に説明する。

【0097】

第１の実施形態で説明した目的音声区間検出方法は、コヒーレンス勾配ｇｒａｄが所定の判定閾値より小さい場合を目的音声区間とみなす。しかしこの方法には、例えば、通話中に話者が沈黙した場合のような、目的音声区間から非目的音声区間に定常的に切り替わった場合も、非目的音声区間を目的音声区間と誤判定してしまう場合がある。

【0098】

そのため、第１の実施形態の場合、非目的音声区間であるにも係らず目的音声区間と誤判定されてしまい、その区間での雑音抑制性能が不十分になるという課題がある。

【0099】

第２の実施形態では、上記課題を解決するために、コヒーレンスＣＯＨが目的音声区間判定閾値Θより小さい区間数を観測し、その区間が長時間継続した場合、ｇｒａｄを初期化することで、正確に非目的音声区間であると判定されるようにする。

【0100】

（Ｂ−１）第２の実施形態の構成
図１０は、第２の実施形態の非目的音抑制装置２０の内部構成を示す機能ブロック図である。

【0101】

図１０において、第２の実施形態の非目的音抑制装置２０は、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、目的音声区間検出及びゲイン制御部１６、ボイススイッチゲイン乗算部１７、小コヒーレンス区間長監視部２１、コヒーレンス変動監視部２２を有する。

【0102】

第２の実施形態が、第１の実施形態と異なる点は、小コヒーレンス区間長監視部２１を追加すること、また小コヒーレンス区間長監視部２１の追加によるコヒーレンス変動監視部２２の処理である。

【0103】

そこで、第２の実施形態では、第１の実施形態で既に説明した事項については省略し、小コヒーレンス区間長監視部２１及びコヒーレンス変動監視部２２の構成を中心に詳細に説明する。

【0104】

小コヒーレンス区間長監視部２１は、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）を受け取り、コヒーレンスＣＯＨ（K）と目的音声区間判定閾値Θとに基づいて、コヒーレンスＣＯＨ（K）が目的音声区間判定閾値Θを下回った区間数ｌｅｎｇｔｈ（K）を観測し、そのｌｅｎｇｔｈ（K）をコヒーレンス変動監視部２２に与えるものである。

【0105】

すなわち、小コヒーレンス区間監視部２１は、目的音声区間判定閾値ΘよりもコヒーレンスＣＯＨ（K）が小さい小コヒーレンス区間の連続出現数を観測するものである。

【0106】

図１１は、小コヒーレンス区間長監視部２１の内部構成を示す機能ブロック図である。図１１において、小コヒーレンス区間長監視部２１は、コヒーレンス入力部２１１、小コヒーレンス判定部２１２、小コヒーレンス区間長計算部２１３、小コヒーレンス区間長出力部２１４を有する。

【0107】

コヒーレンス区間入力部２１１は、コヒーレンス計算部１４からコヒーレンスＣＯＨを受け取り、小コヒーレンス判定部２１２に与えるものである。

【0108】

小コヒーレンス判定部２１２は、入力されたコヒーレンスＣＯＨ（K）と目的音声区間判定閾値Θとを比較して、小コヒーレンス区間を判定するものである。

【0109】

小コヒーレンス区間長計算部２１３は、小コヒーレンス判定部２１２の判定結果に基づいて、小コヒーレンス区間の連続区間長を求めるものである。例えば、小コヒーレンス区間長計算部２１３は、小コヒーレンス区間の連続区間長を示すｌｅｎｇｔｈ（K）を用いて、小コヒーレンス区間の連続区間長を求める。

【0110】

小コヒーレンス区間長出力部２１４は、小コヒーレンス区間長計算部２１３が求めたｌｅｎｇｔｈ（K）をコヒーレンス変動監視部２２に与えるものである。

【0111】

コヒーレンス変動監視部２２は、小コヒーレンス区間監視部２１からｌｅｎｇｔｈ（K）を受け取り、そのｌｅｎｇｔｈ（K）に基づいて現区間が目的音声区間にあるか又は非目的音声区間にあるかを判定し、その判定結果に応じてｇｒａｄ（K）を初期化するものである。

【0112】

また、コヒーレンス変動監視部２２は、第１の実施形態と同様に、コヒーレンスＣＯＨ（K）に基づいて算出したコヒーレンスの勾配ｇｒａｄ（K）を観測するものである。

【0113】

図１２は、コヒーレンス変動監視部２２の内部構成を示す機能ブロック図である。図１２において、コヒーレンス変動監視部２２は、コヒーレンス及び小コヒーレンス区間長入力部２２１、コヒーレンス勾配計算制御部２２２、コヒーレンス増減判定部１５２、記憶部１５３、コヒーレンス勾配計算部１５４、コヒーレンス勾配出力部１５５を有する。

【0114】

コヒーレンス及び小コヒーレンス区間長入力部２２１は、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）を受け取り、コヒーレンス勾配計算制御部２２２に与えるものである。また、コヒーレンス及び小コヒーレンス区間長入力部２２１は、小コヒーレンス区間長監視部２１からｌｅｎｇｔｈ（K）を受け取り、コヒーレンス勾配計算制御部２２２に与えるものである。

【0115】

コヒーレンス勾配計算制御部２２２は、受け取ったｌｅｎｇｔｈ（K）と区間長判定閾値Ｔ（Ｔ：任意の値、Ｔ＞０）とを比較し、ｌｅｎｇｔｈ（K）＜Ｔの場合、非目的音声区間に移行していないと判定し、図１４のＳ１０１〜Ｓ１０６の処理を行い、ｇｒａｄ（K）を算出する。

【0116】

一方、ｌｅｎｇｔｈ（K）≧Ｔのとき、コヒーレンス勾配計算制御部２２２は、非目的音声区間に移行したと判定し、Ｓ１０５の処理を実行して、ｇｒａｄ（K）を初期値Ωにすると同時に、ｇｒａｄ（K）の算出に用いるｃｏｕｎｔｅｒも０に初期化する。

【0117】

（Ｂ−２）第２の実施形態の動作
次に、第２の実施形態の非目的音抑制装置２０における動作について、図面を参照しながら説明する。

【0118】

第２の実施形態では、小コヒーレンス区間長監視部２１及びコヒーレンス変動監視部２２における動作を中心に説明する。

【0119】

図１３は、小コヒーレンス区間長監視部２１における動作を示すフローチャートである。

【0120】

第１の実施形態と同様にして、コヒーレンス計算部１４がコヒーレンスＣＯＨ（K）を求め、求められたコヒーレンスＣＯＨ（K）が、小コヒーレンス区間長監視部２１及びコヒーレンス変動監視部２２に与えられる。

【0121】

小コヒーレンス区間長監視部２１では、小コヒーレンス判定部２１２が、コヒーレンスＣＯＨ（K）と目的音声区間判定閾値Θとを比較する（Ｓ３０１）。そして、コヒーレンスＣＯＨ（K）＜Θのとき、処理はＳ３０２に移行し、そうでないとき、処理はＳ３０３に移行する。

【0122】

コヒーレンスＣＯＨ（K）＜Θの場合に、小コヒーレンス区間長計算部２１３はｌｅｎｇｔｈをインクリメントする（Ｓ３０２）。一方、コヒーレンスＣＯＨ（K）＜Θでない場合、小コヒーレンス区間長計算部２１３はｌｅｎｇｔｈ（K）を初期化（すなわち、ｌｅｎｇｔｈ（K）＝０）する（Ｓ３０３）。

【0123】

小コヒーレンス区間長出力部２１４は、ｌｅｎｇｔｈ（K）をコヒーレンス変動監視部２２に与え、その後、時刻を更新する。

【0124】

図１４は、コヒーレンス変動監視部２２における動作を示すフローチャートである。

【0125】

まず、コヒーレンス及び小コヒーレンス区間長入力部２２１が、コヒーレンスＣＯＨ（K）及びｌｅｎｇｔｈ（K）を入力する。

【0126】

コヒーレンス勾配計算制御部２２２は、入力されたｌｅｎｇｔｈ（K）と区間長判定閾値Ｔ（＞０）との大小比較を行い（Ｓ４０１）、ｌｅｎｇｔｈ（K）＜Ｔであれば、非目的音声区間に移行していないと判定し、第１の実施形態と同様な処理でコヒーレンス勾配ｇｒａｄ（K）を計算する。すなわち、ｌｅｎｇｔｈ（K）＜Ｔの場合、Ｓ１０１に移行し、その後コヒーレンス勾配ｇｒａｄ（K）が求められる。

【0127】

一方、ｌｅｎｇｔｈ（K）＜Ｔでない場合、非目的音声区間に移行したと判定し、ｇｒａｄには初期値Ωを、ｃｏｕｎｔｅｒには０を、それぞれ設定する（Ｓ１０５）。

【0128】

ここで、閾値Ｔは、例えば「２０」等の正の整数を設定することができるが、特に限定されるものではない。

【0129】

ここで、第２の実施形態では、目的音声区間と非目的音声区間とで、次のような特性の違いがあることを利用する。

【0130】

目的音声区間の場合、小振幅区間でのみ一時的にコヒーレンスＣＯＨが小さくなるが、全体的にはコヒーレンスＣＯＨは大きい。つまり、コヒーレンスＣＯＨが連続して目的音声区間判定閾値Θを下回る期間は短い。

【0131】

一方、非目的音声区間の場合、コヒーレンスＣＯＨが目的音声区間判定閾値Θより小さい区間が長期間に亘って継続される。つまり、コヒーレンスＣＯＨが音声区間判定閾値Θを下回る区間が長くなる傾向がある。

【0132】

このような差異を用い、コヒーレンス変動監視部２２は、コヒーレンスＣＯＨが目的音声区間判定閾値Θを連続して下回った回数によって非目的音声区間か否かを判定する。

【0133】

次に、コヒーレンス勾配出力部１５５が、目的音声区間検出及びゲイン制御部１６に、ｇｒａｄ（K）を与える。そして、目的音声区間検出及びゲイン制御部１６が、コヒーレンスＣＯＨ（K）とｇｒａｄ（K）に応じたゲインＶＳ＿ＧＡＩＮが設定する。

【0134】

そして、ボイススイッチゲイン乗算部１７が、入力信号ｓ１（ｔ）とＶＳ＿ＧＡＩＮを乗算して信号ｙ（ｔ）を求め、この信号ｙ（ｔ）を出力する。

【0135】

（Ｂ−３）第２の実施形態の効果
以上のように、第２の実施形態によれば、小コヒーレンス区間長監視部によって、目的音声区間から非目的音声区間に切り替わった場合の誤判定を解消することができるので、非目的音声区間での雑音抑圧性能を維持できる。

【0136】

従って、本発明をテレビ会議システムや携帯電話などの通信装置に適用することで、通話音質の向上が期待できる。

【0137】

（Ｃ）第３の実施形態
次に、本発明の非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラムの第３の実施形態を、図面を参照しながら詳細に説明する。

【0138】

第１の実施形態では、コヒーレンス勾配ｇｒａｄに基づいて、目的音声区間の小振幅区間の誤判定を抑制した。

【0139】

しかし、妨害音の到来方向、妨害音の強度などの条件によっては、ｇｒａｄは目的音区間と妨害音区間とで大きな差が発生せず、目的音声小振幅区間の誤判定を抑制できない場合がある。

【0140】

そこで、第３の実施形態では、目的音声区間でのｇｒａｄが妨害音声区間でのｇｒａｄよりも際立つように補正を施すものである。

【0141】

（Ｃ−１）第３の実施形態の構成及び動作
図１５は、第３の実施形態の非目的音抑制装置３０の内部構成を示す機能ブロック図である。

【0142】

図１５において、第３の実施形態の非目的音抑制装置３０は、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部３２、ボイススイッチゲイン乗算部１７、コヒーレンス変動補正部３１を有する。

【0143】

第３の実施形態が、第１の実施形態の構成と異なる点は、コヒーレンス変動補正部３１を有する点である。

【0144】

そこで、第３の実施形態は、コヒーレンス変動補正部３１及び目的音声区間検出及びゲイン制御部３２の処理機能を中心に詳細に説明する。

【0145】

コヒーレンス変動補正部３１は、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）を受け取り、又コヒーレンス変動監視部１５からコヒーレンス勾配ｇｒａｄを受け取り、コヒーレンス勾配を補正して、その補正したコヒーレンス勾配ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）を目的音声区間検出及びゲイン制御部１６に与えるものである。

【0146】

図１６は、コヒーレンス変動補正部３１の内部構成を示す機能ブロック図である。

【0147】

図１６において、コヒーレンス変動補正部３１は、コヒーレンス及びコヒーレンス勾配入力部３１１、コヒーレンス勾配補正処理部３１２、補正後コヒーレンス勾配出力部３１３を有する。

【0148】

コヒーレンス及びコヒーレンス勾配入力部３１１は、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）を受け取り、コヒーレンス勾配補正処理部３１２に与えるものである。また、コヒーレンス及びコヒーレンス勾配入力部３１１は、コヒーレンス変動監視部１５からコヒーレンス勾配ｇｒａｄ（K）を受け取り、コヒーレンス勾配補正処理部３１２に与えるものである。

【0149】

コヒーレンス勾配補正処理部３１２は、コヒーレンスＣＯＨ（K）と、コヒーレンス勾配ｇｒａｄ（K）とに基づいて、コヒーレンス勾配を補正するものである。

【0150】

補正後コヒーレンス勾配出力部３１３は、コヒーレンス勾配補正処理部３１２により補正された補正後のコヒーレンス勾配ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）を、目的音声区間検出及びゲイン制御部３２に与えるものである。

【0151】

目的音声区間検出及びゲイン制御部３２は、コヒーレンス計算部１４から得るコヒーレンスＣＯＨ（K）と、補正後のコヒーレンス勾配ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）とに基づいて、ゲインＶＳ＿ＧＡＩＮを定めて、ボイススイッチゲイン乗算部１７に与えるものである。

【0152】

ここで、コヒーレンス勾配補正処理部３１２によるコヒーレンス勾配の補正処理を詳細に説明する。

【0153】

コヒーレンス勾配補正部３１は、コヒーレンス計算部１４からコヒーレンスＣＯＨ（K）と、コヒーレンス変動監視部１５からコヒーレンス勾配ｇｒａｄ（K）とをそれぞれ受け取る。

【0154】

そして、コヒーレンス勾配補正処理部３１２は、目的音声区間におけるｇｒａｄが、非目的音声区間のｇｒａｄ（K）よりも大きくなるように、ｇｒａｄ（K）を補正する。

【0155】

この補正方法は、種々の方法を用いることができるが、例えば、コヒーレンス勾配補正処理部３１２は、式（６）のような演算を行なうものとする。

【0156】

ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）＝ｇｒａｄ（K） × ＣＯＨ（K） …（６）
式（６）の目的は、目的音声区間と非目的音声区間とでｒｅｖｉｓｅｄ＿ｇｒａｄの値の差を大きくすることである。目的音声区間では、コヒーレンスＣＯＨは大きな値をとり、非目的音声区間では、コヒーレンスＣＯＨは小さい値をとる。この特性を利用して、式（６）のように、コヒーレンス勾配ｇｒａｄにコヒーレンスＣＯＨを乗算することで、乗算前と比較して、目的音声区間でのｒｅｖｉｓｅｄ＿ｇｒａｄは、非目的音声区間よりもさらに大きな値を得ることができる。

【0157】

よって、コヒーレンス勾配補正処理部３１２が、式（６）に従ってコヒーレンス勾配ｇｒａｄの補正処理を行うことにより、目的音声区間のときには、補正後のｒｅｖｉｓｅｄ＿ｇｒａｄは、際立って大きな値を持つことができる。

【0158】

また、目的音声区間検出及びゲイン制御部３２は、第１の実施形態の場合には、コヒーレンス勾配ｇｒａｄ（K）を用いていたが、このｇｒａｄ（K）に代えて、補正後のコヒーレンス勾配ｒｅｖｉｓｅｄｅ＿ｇｒａｄ（K）を用いて、目的音声区間か否かを判定する。

【0159】

つまり、目的音声区間検出及びゲイン制御部３２は、「コヒーレンスＣＯＨ（K）が所定の閾値Θより大きい、または、ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）が所定の閾値Φ（＜０）より小さい」という条件を満たせば目的音声区間と判定し、そうでない場合は非目的音声区間と判定し、その結果に応じてＶＳ＿ＧＡＩＮを制御する。

【0160】

（Ｃ−２）第３の実施形態の効果
以上のように、第３の実施形態によれば、コヒーレンス勾配補正部を追加し、目的音声区間と非目的音声区間とのｇｒａｄにより明確な差を生じさせることで、目的音声小振幅区間の誤判定を防止することができるようになる。したがってボイススイッチ処理による目的音声の誤消去を防止でき、音質がより改善される。

【0161】

（Ｄ）他の実施形態
（Ｄ−１）第１〜第３の実施形態では、コヒーレンス勾配を用いて、目的音声区間の小振幅区間を検出する場合を例示した。しかし、コヒーレンス勾配ではなく、コヒーレンスの分散の大小によって、目的音声区間の小振幅区間を検出するようにしてもよい。

【0162】

（Ｄ−２）コヒーレンス勾配の補正処理の変形実施形態
（Ｄ−２−１）第３の実施形態では、式（６）を用いて、コヒーレンス勾配の補正を行なった場合を例示した。しかし、コヒーレンス勾配の補正方法は、第３の実施形態で説明した方法に限定されるものではなく、変形形態として他の補正処理の例を以下に記載する。

【0163】

図１７は、第３の実施形態の変形実施形態の非目的音抑制装置４０の内部構成を示す機能ブロック図である。

【0164】

図１７の非目的音抑制装置４０は、第３の実施形態の非目的音抑制装置３０の構成に、コヒーレンス長期平均計算部４３を追加する点が異なり、このコヒーレンス長期平均計算部４３を設けることで、コヒーレンス変動補正部４２、目的音声区間検出及びゲイン制御部４４の処理が第３の実施形態と異なるものになる。

【0165】

コヒーレンス長期平均計算部４３は、コヒーレンス計算部１４からのコヒーレンスＣＯＨ（K）を受け取り、所定の期間のコヒーレンスＣＯＨ（K）の長期平均化処理を行うものである。この長期平均化処理は、既存の技術を広く適用することができる。

【0166】

コヒーレンス変動監視部４２は、コヒーレンス長期平均計算部４３から長期平均化処理がなされたＡＶＥ＿ＣＯＨ（K）を受け取り、式（７）に従って、コヒーレンス勾配の補正を行なう。

【0167】

ｒｅｖｉｓｅ＿ｇｒａｄ（K）＝ｇｒａｄ（K） × ＡＶＥ＿ＣＯＨ（K） …（７）
このように、ＡＶＥ＿ＣＯＨを用いることで、コヒーレンスＣＯＨの瞬時変動を抑制できるので、目的音声区間の小振幅区間でのコヒーレンスＣＯＨの瞬時変動の影響を抑制できる。また、コヒーレンスが平均化されることで、目的音声区間と非自的音声区間との差異がより際立つため、補正効果が増し、検出精度をさらに向上させることができる。

【0168】

なお、図１８は、図１７に示すように、コヒーレンス長期平均計算部４３を設けたときの、目的音声区間検出及びゲイン制御部４４における動作を示すフローチャートである。ここでは、図１８を用いて、目的音声区間検出及びゲイン制御部４４における動作を簡単に説明する。

【0169】

目的音声区間検出及びゲイン制御部４４は、長期平均化処理がなされたＡＶＥ＿ＣＯＨ（K）と補正後コヒーレンス勾配ｒｅｖｉｓｅ＿ｇｒａｄ（K）を受け取ると（Ｓ５０１）、ＡＶＥ＿ＣＯＨ（K）を目的音声区間判定閾値Θと、ｒｅｖｉｓｅ＿ｇｒａｄ（K）をコヒーレンス勾配判定閾値Φと、それぞれ比較する（Ｓ５０２）。

【0170】

そして、ＡＶＥ＿ＣＯＨ（K）≧Θ又はｒｅｖｉｓｅ＿ｇｒａｄ（K）＜Φの場合、目的音声区間と判定し、ＶＳ＿ＧＡＩＮに１．０を設定する（Ｓ５０３）。一方、前記条件を満たさない場合、非目的音声区間と判定し、ＶＳ＿ＧＡＩＮにα（０．０≦α＜１．０）を設定する（Ｓ５０５）。

【0171】

目的音声区間検出及びゲイン制御部４４は、設定されたＶＳ＿ＧＡＩＮを、ボイススイッチゲイン乗算部１７に与える（Ｓ５０４）。

【0172】

（Ｄ−２−２）また、別の補正方法の例として、次のようにしてもよい。

【0173】

第３の実施形態のコヒーレンス勾配補正部が、式（８）のようにＣＯＨの二乗を用いて補正してもよい
ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）＝ｇｒａｄ（K） × ＣＯＨ（K） × ＣＯＨ（K） …（８）
先述の通り、ＣＯＨの変域は０＜ＣＯＨ＜１なので、２乗することでＣＯＨが小さい場合と大きい場合との差はさらに広がる。よって、目的音声区間と非目的音声区間との差異をより大きくする効果があり、検出精度をさらに向上させることができる。

【0174】

また、第３の実施形態の目的音声区間検出及びゲイン制御部は、ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）を、所定の閾値Φ（＜０）と比較することで、目的音声区間か否かを判定しているが、ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）ではなく、ｒｅｖｉｓｅｄ＿ｇｒａｄ（K）に長期平均処理を施した変数を用いてもよい。

【0175】

（Ｄ−３）本発明は、公知の周波数減算、コヒーレンスフィルター、ウィーナーフィルターのいずれか１つ、あるいはいずれか２つ、あるいは全てと併用してもよい。これによりさらに高い雑音抑圧性能を実現できる。

【0176】

（Ｄ−３−１）以下では、第１の実施形態の構成と、周波数減算、コヒーレンスフィルター、ウィーナーフィルターのそれぞれとを併用する場合の構成と動作説明を簡単に説明する。勿論、第１の実施形態の構成に代えて、第２、第３の実施形態の構成と併用するようにしてもよい。

【0177】

図１９は、第１の実施形態の構成と周波数減算の構成を併用する場合の構成を示す。

【0178】

図１９のように、この変形実施形態の構成は、マイクｍ１、マイクｍ２、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６、第３の指向性形成部５１、減算部５２、ＩＦＦＴ部５３、ゲイン乗算部５４を有する。なお、周波数減算部５０は、第３の指向性形成部５１、減算部５２、ＩＦＦＴ部５３を有する。

【0179】

ここで、周波数減算とは入力信号から非目的音声信号成分を減算することで雑音抑制を行う手法である。今回は非目的音声信号成分を取得するために、図２０のような正面に死角を有する指向性を形成する第３の指向性形成部５１を追加した。ただし、第３の指向性形成部で形成する指向性の形状は設計者が自由に設定してよく、図２０の特性に限定されるものではない。

【0180】

ここでは、第３の指向性形成部５１は、例えば式（９）の演算により、周波数領域信号Ｘ１（ｆ、K）とＸ２（ｆ、K）に基づいて、正面に死角を有する信号Ｂ３（ｆ、K）を取得する。

【0181】

Ｂ３（ｆ、K）＝Ｘ１（ｆ、K）− Ｘ２（ｆ、K） …（９）
次に、減算部５２は、例えば、式（１０）に従って、周波数領域信号Ｘ１（ｆ、K）と信号Ｂ３（ｆ、K）に基づいて、雑音除去後信号Ｄ（ｆ、K）を得る。

【0182】

Ｄ（ｆ、K）＝Ｘ１（ｆ、K）− Ｂ３（ｆ、K） …（１０）
そして、ＩＦＦＴ部５３は、雑音除去後信号Ｄ（ｆ、K）を時間領域信号ｑ（ｔ）に変換し、最後に、乗算部５４が、時間領域信号ｑ（ｔ）にＶＳ＿ＧＡＩＮを乗算することで、出力信号ｙ（ｔ）を得る。なお、ＶＳ＿ＧＡＩＮを得る第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声検出及びゲイン制御部１６は第１の実施形態と同様なので説明は省略する。

【0183】

（Ｄ−３−２）図２１は、第１の実施形態とコヒーレンスフィルターとを併用する場合の構成を示す構成図である。

【0184】

図２１のように、この変形実施形態は、マイクｍ１、マイクｍ２、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６、コヒーレンスフィルター係数乗算部６１、ＩＦＦＴ部６２、ゲイン乗算部６３を有する。なお、コヒーレンスフィルター演算部６０は、コヒーレンスフィルター係数乗算部６１、ＩＦＦＴ部６２を有する。

【0185】

コヒーレンスフィルターとは、式（３）で得られたｃｏｅｆ（ｆ、K）を周波数ごとに入力信号に乗算することで到来方向に偏りを有する信号成分を抑制する、雑音除去技術のことである。

【0186】

この変形実施形態では、コヒーレンス計算部１４の演算の過程で得られるｃｏｅｆ（ｆ、K）を、コヒーレンスフィルター係数乗算部６１でＸ１（ｆ）に乗算することで、コヒーレンスフィルター処理が実現できる。

【0187】

まず、コヒーレンスフィルター係数乗算部６１は、例えば式（１１）の演算を施すことで雑音抑制後信号Ｄ（ｆ、K）を得る。

【0188】

Ｄ（ｆ、K）＝Ｘ１（ｆ、K）× ｃｏｅｆ（ｆ、K） …（１１）
ＩＦＦＴ部６２は、雑音抑圧後信号Ｄ（ｆ）を時間領域信号ｑ（ｔ）に変換し、ゲイン乗算部６３が、信号ｑ（ｔ）にＶＳ＿ＧＡＩＮを乗算すると、出力信号ｙ（ｔ）が得られる。なお、ＶＳ＿ＧＡＩＮを得る第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６は第１の実施形態と同様なので説明は省略する。

【0189】

（Ｄ−３−３）図２２は、第１の実施形態の構成とウィーナーフィルターとを併用する場合の構成を示す構成図である。

【0190】

図２２のように、この変形実施形態は、マイクｍ１、マイクｍ２、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６、ウィーナーフィルター係数計算部７１、ウィーナーフィルター係数乗算部７２、ＩＦＦＴ部７３、ゲイン乗算部７４を有する。なお、ウィーナーフィルター演算部７０は、ウィーナーフィルター係数計算部７１、ウィーナーフィルター係数乗算部７２、ＩＦＦＴ部７３を有する。

【0191】

ウィーナーフィルターとは、特許文献２にも記載されているが、雑音区間の信号から周波数ごとに雑音特性を推定して得た係数を乗算することで雑音を除去する技術である。

【0192】

この変形実施形態では、当該処理を実現するために、ウィーナーフィルター係数計算部７１とウィーナーフィルター係数乗算部７２を追加する。

【0193】

ウィーナーフィルター係数計算部７１は、目的音声区間検出及びゲイン制御部１６の目的音声区間検出結果を参照し、非目的音声区間であれば、例えば特許文献２の「数３」のような演算によって、ウィーナーフィルター係数の推定を行い、目的音声区間であれば推定を行わない、という動作をする。

【0194】

得られた係数ｗｆ＿ｃｏｅｆ（ｆ、K）は、ウィーナーフィルター係数乗算部７２が、式（１２）のような演算を施され、雑音抑圧後信号Ｄ（ｆ、K）を得る。

【0195】

Ｄ（ｆ、K）＝Ｘ１（ｆ、K）× ｗｆ＿ｃｏｅｆ（ｆ、K） …（１２）
そして、ＩＦＦＴ部７３が、雑音抑圧後信号Ｄ（ｆ、K）を時間領域信号ｑ（ｔ）に変換し、ゲイン乗算部７４が、信号ｑ（ｔ）にボイススイッチゲインを乗算すると出力信号ｙ（ｔ）を得る。なお、ＶＳ＿ＧＡＩＮを得る第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、コヒーレンス変動監視部１５、目的音声区間検出及びゲイン制御部１６は第１の実施形態と同様なので説明は省略する。

【0196】

（Ｄ−４）第１〜第３の実施形態及び上述した各変形実施形態では、入力される信号が音声の場合を想定して説明したが、音声に限定されるものではなく、例えば、音響信号等であってもよい。

【0197】

（Ｄ−５）また、第１〜第３の実施形態及び上述した各変形実施形態では、２個のマイクからの入力信号を想定したが、３個以上であってもよい。

【符号の説明】

【0198】

１０、２０、３０、４０…非目的音抑制装置、
１１…ＦＦＴ部、１２…第１の指向性形成部、１３…第２の指向性形成部、
１４…コヒーレンス計算部、１５、２２、３２…コヒーレンス変動監視部、
１６、４４…目的音声区間検出及びゲイン制御部、
１７…ゲイン乗算部、２１…小コヒーレンス区間長監視部、
３１、４２…コヒーレンス変動補正部、５０…周波数減算部、
６０…コヒーレンスフィルター演算部、７０…ウィーナーフィルター演算部
１５１…コヒーレンス入力部、１５２…コヒーレンス増減判定部、１５３…記憶部、１５４…コヒーレンス勾配計算部、１５５…コヒーレンス出力部、
１６１…コヒーレンス及びコヒーレンス勾配入力部、１６２…目的音区間判定部、１６３…ゲイン制御部、１６４…ゲイン出力部、
２１１…コヒーレンス入力部、２１２…小コヒーレンス判定部、２１３…小コヒーレンス区間長計算部、２１４…小コヒーレンス区間長出力部、
２２１…コヒーレンス及び小コヒーレンス区間長入力部、２２２…コヒーレンス勾配計算制御部、
３１１…コヒーレンス及びコヒーレンス勾配入力部、３１２…コヒーレンス勾配補正処理部、３１３…補正後コヒーレンス勾配出力部。

【図1】