(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-14
(45)【発行日】2022-11-22
(54)【発明の名称】音声信号処理装置、音声信号処理方法、および補聴器
(51)【国際特許分類】
H04R 25/00 20060101AFI20221115BHJP
【FI】
H04R25/00 L
(21)【出願番号】P 2018128685
(22)【出願日】2018-07-06
【審査請求日】2021-06-21
(73)【特許権者】
【識別番号】000001443
【氏名又は名称】カシオ計算機株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】出嶌 達也
【審査官】辻 勇貴
(56)【参考文献】
【文献】特開平10-294997(JP,A)
【文献】特開平10-290497(JP,A)
【文献】特表2014-500676(JP,A)
【文献】特開2014-122939(JP,A)
【文献】特開平10-145897(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
19/00-99/00
H04R 25/00-25/04
(57)【特許請求の範囲】
【請求項1】
音声信号の子音周波数帯域のエネルギを押し上げる
第1エクスパンドフィルタと、
前記音声信号の子音周波数帯域のエネルギを押し下げる第2エクスパンドフィルタとを組み合わせたエクスパンドフィルタと、
前記音声信号の周波数特性を検知するウオッチフィルタと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定し、当該特定の周波数帯域から始まる音声を判定している間は前記エクスパンドフィルタの特性を平坦化させる判定部と、
を備えることを特徴とする音声信号処理装置。
【請求項2】
前記ウオッチフィルタは、音声信号のうち前記特定の周波数帯域から始まる音声の周波数帯域を通過させ、
前記判定部は、前記ウオッチフィルタの出力信号が所定エネルギを超えたならば、前記特定の周波数帯域から始まる音声と判定する、
ことを特徴とする請求項1に記載の音声信号処理装置。
【請求項3】
前記ウオッチフィルタは、音声信号のうち前記特定の周波数帯域から始まる音声の周波数帯域を通過させる第1のフィルタ、および子音周波数帯域を通過させる第2のフィルタを含み、
前記判定部は、前記第1のフィルタの出力信号と前記第2のフィルタの出力信号のエネルギ比が所定値を超えたならば、特定の周波数帯域から始まる音声と判定する、
ことを特徴とする請求項1に記載の音声信号処理装置。
【請求項4】
音声信号の子音周波数帯域のエネルギを押し上げるエクスパンドフィルタと、
前記音声信号の周波数特性を検知するウオッチフィルタと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定し、当該特定の周波数帯域から始まる音声を判定している間は前記エクスパンドフィルタの特性を平坦化させる判定部と、
前記音声信号が所定値以下ならば、当該音声信号を通過させないゲート
と、
を備えることを特徴とする音声信号処理装置。
【請求項5】
請求項1ないし
4のうちいずれか1項に記載の音声信号処理装置と、
音声信号を収録するマイクと、
前記音声信号処理装置によって処理された音声信号を出力するスピーカと、
を備えることを特徴とする補聴器。
【請求項6】
エクスパンドフィルタにより音声信号の子音周波数帯域のエネルギを押し上げるステップと、
ウオッチフィルタにより前記音声信号の周波数特性を検知するステップと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定するステップと、
当該特定の周波数帯域から始まる音声を判定している間は、前記エクスパンドフィルタの特性を平坦化させるステップと、
を実行し、
前記エクスパンドフィルタは、音声信号の子音周波数帯域のエネルギを押し上げる第1エクスパンドフィルタと、前記音声信号の子音周波数帯域のエネルギを押し下げる第2エクスパンドフィルタの組み合わせである、
ことを特徴とする音声信号処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号処理装置、音声信号処理方法、および補聴器に関する。
【背景技術】
【0002】
従来の補聴器や集音器(以下総称して「補聴器」と称する)は、外部音をマイキングして取り込んだ音声信号について、その音量や音質を補正して、スピーカから耳内部へと届けるものが一般的である。その際に用いられる音質の補正は聴こえにくい周波数帯域を持ち上げるという方法が主流であった。
補正には静的なフィルタが用いられている。すなわち入力の音声が子音であるか否かに関わらず、常に一定のフィルタ特性が入力の音声に対して加えられる
【0003】
しかし実際に難聴者が聞こえにくいのは子音が主流であるといわれている。つまり、子音と母音の中で、静的フィルタを用いる方法では、子音には聴こえを改善する効果が良好な方向に働く。しかし、母音については、フィルタが必要ないにもかかわらず(ユーザには聴こえるにもかかわらず)フィルタの効果が付加されるために、より騒がしい音に聴こえヒステリックかつ疲れやすい音響特性となってしまう。これを解決するには、聞こえにくい子音だけの音声にフィルタをかけることができればよい。
【0004】
特許文献1の段落0046-0056,0065には、入力音声に対して複数の時間フレームでそれぞれフレーム信号を抽出し、各フレーム信号の平均パワーの差に基づいて子音領域を判定する発明が記載されている。また特許文献1の段落0056には、入力音声に対し、別経路の子音判定処理にかかる時間だけ遅延させることが記載されている。
【0005】
特許文献2の段落0015-0028には、音声信号を複数のバンドパスフィルタを通し、バンド幅毎に周波数エネルギ成分を求めて、その周波数エネルギ成分に基づいて子音強調処理をするか否かを判定する発明が記載されている。
【0006】
特許文献3の段落0010-0021には、入力信号を複数のBPFで分割し、それぞれのバンド毎に増幅率を変更可能に構成され、子音強調の場合は該当するバンドに対して増幅率をアップすることが記載されている。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2007-219188号公報
【文献】特開2014-155059号公報
【文献】特開平5-064297号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1-3に記載されている発明は、子音または所定範囲のゲインを瞬間的に変更しようとするものである。しかし、この方式であれば、子音もしくはそれに類すると判断するためには若干の時間を要するため、反応に遅延が生じる。
【0009】
そこで、本発明は、音声信号処理装置、音声信号処理方法、および補聴器について、遅延なく子音のフィルタ処理を行うことを課題とする。
【課題を解決するための手段】
【0010】
本発明は、上記目的を達成するため、
音声信号の子音周波数帯域のエネルギを押し上げる第1エクスパンドフィルタと、前記音声信号の子音周波数帯域のエネルギを押し下げる第2エクスパンドフィルタとを組み合わせたエクスパンドフィルタと、
前記音声信号の周波数特性を検知するウオッチフィルタと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定し、当該特定の周波数帯域から始まる音声を判定している間は前記エクスパンドフィルタの特性を平坦化させる判定部と、
を備えることを特徴とする音声信号処理装置である。
【発明の効果】
【0011】
本発明によれば、音声信号処理装置、音声信号処理方法、および補聴器について、遅延なく子音のフィルタ処理を行うことができる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施形態における補聴器の外観図である。
【
図6】補聴器の機能ブロックと各信号を示した図である。
【
図7】ウオッチフィルタのフィルタ特性を示すグラフである。
【
図8】波高値による母音の検出を示すタイムチャートである。
【
図9】子音に係る2つのエクスパンドフィルタと、これらを合成した周波数ゲインを示すグラフである。
【
図10】子音ブースタ処理のフローチャートである。
【
図12】第2の実施形態における補聴器の機能ブロックと各信号を示した図である。
【
図13】母音の周波数スペクトラムを示すグラフである。
【
図14】母音波高値と子音波高値の比による母音の検出を示すタイムチャートである。
【
図15】子音ブースタ処理のフローチャートである。
【発明を実施するための形態】
【0013】
以降、本発明を実施するための形態を、各図を参照して詳細に説明する。
本実施形態の補聴器(集音器)は、入力波形に特定の子音の周波数特性に応じたフィルタをかけ、このフィルタをかけた音声の包絡線信号を所定の閾値でウオッチする。このフィルタは、特定の子音を聴きやすくするための周波数特性を有しており、かつ外部制御信号によりダイナミックにゲインが変化できるフィルタである。このフィルタのことを、以下「エクスパンドフィルタ」と称する。補聴器は、ウオッチしていた包絡線信号が閾値を超えたら、その超えた値に応じてエクスパンドフィルタのゲインを平坦化する。具体的には、閾値を超えた量に応じてゲインが平坦化するようにしておく。これにより、例えば、[sa]という音がきたとき[s]の音が補強され、[a]の音は補強されなくなる。
【0014】
以下、
図1から
図11を参照して、第1の実施形態を説明する。更に
図12から
図16を参照して、第2の実施形態を説明する。
【0015】
《第1の実施形態》
図1は、第1の実施形態における補聴器1の外観図である。
補聴器1を耳に装着するときには、
図1の右側の平面部14が、外耳道の外に面して、左側の端部15が外耳道に挿入される。このように耳に装着されることで、マイク入力部2で集音された音は、この補聴器1によって補正処理され、スピーカ3から出力される。スピーカ3は利用者の外耳道に挿入されているので、利用者は、外部音を明瞭に聴くことができる。平面部14には、スピーカ3からの出力音量を調整するボリューム42と、電源ボタン41が配置されている。
【0016】
補聴器1は、耳穴式であるが、これに限らない。他にも耳かけ式や、首からさげる方式などが考えられる。あるいは、補聴器としての医療認可をうけていない「集音器」であってもよい。
【0017】
図2は、補聴器1のブロック図である。
補聴器1は、CPU(Central Processing Unit)11、メモリ12、操作部4、スピーカ3、DSP(Digital Signal Processor)5、マイク入力部2、A/D変換部21、サウンドシステム13を含んで構成される。操作部4は、スピーカ3からの出力音量を調整するボリューム42と、電源ボタン41を含んで構成される。
【0018】
CPU11は、メモリ12に記憶されるプログラム(不図示)を実行することで、この補聴器1を統括して制御する。CPU11は、例えばスイッチ処理(
図4参照)により操作部4に入力された操作情報を取得する。CPU11は、補聴器処理(
図5参照)により、DSP5に音声信号処理を行わせる。
【0019】
DSP5は、メモリ12に記憶されるプログラムを実行することで、音声信号処理を行う。DSP5は、マイク入力部2で集音し、A/D変換部21でデジタル化された音声信号に、子音ブースタ処理(
図10参照)やゲート処理(
図11参照)などを行うことで、この補聴器1を機能させる。サウンドシステム13は、DSP5と連携して、音声信号処理を行い、スピーカ3から出力される音声の品質を向上させる。
【0020】
メモリ12は、RAM(Random Access Memory)やフラッシュメモリから構成されており、各種プログラムやデータ(不図示)を記憶する。
【0021】
マイク入力部2は、補聴器1を装着した利用者の周辺の音を集音して、アナログ信号として出力する。A/D変換部21は、マイク入力部2が出力したアナログ信号をデジタル信号に変換して、DSP5に出力する。
スピーカ3は、不図示のD/A変換器が出力したアナログ信号を、音として利用者の耳に出力する。この補聴器1には、不図示の電源回路と二次電池が搭載される。
【0022】
図3は、メイン処理のフローチャートである。
最初、CPU11は、この補聴器1を初期化(イニシャライズ)する(S10)。その後、CPU11は、スイッチ処理(S11)を行い、ボリューム42と、電源ボタン41と、その他のスイッチの状態をスキャンする。これにより、利用者の操作情報を取得することができる。スイッチ処理の詳細は、後記する
図4で説明する。
【0023】
CPU11は、補聴器処理(S12)を行う。この補聴器処理は、ユーザの聴こえない周波数ポイントのゲインをあげて聴こえやすくしてあげるための処理であり、後記する
図5で説明する。
CPU11は、ハウリングキャンセル処理(S13)を行い、ステップS11の処理に戻る。このハウリングキャンセル処理は、ハウリングによる不快な聴こえを軽減する処理であり、詳細な説明は省略する。
【0024】
図4は、スイッチ処理のフローチャートである。
CPU11は、本体側スイッチ処理(S20)を行い、電源ボタン41やボリューム42の状態を検知する。その結果、CPU11は、各スイッチに対応した動作を行う。例えば、利用者が補聴器1の電源ボタン41を押下すると、CPU11は、集音処理を開始する。利用者が補聴器1のボリューム42を変更すると、CPU11は、DSP5に対し、このボリューム42に応じた音量で出力されるように指示する。
【0025】
CPU11は、その他のスイッチ処理(S21)を行ったのち、メイン処理に復帰する。その他のスイッチ処理とは、例えば不図示の充電器のスイッチに係る処理である。
【0026】
図5は、補聴器処理のフローチャートである。
CPU11は、マイク入力部2とA/D変換部21により音声が取り込まれると(S30)、DSP5に対して子音ブースタ処理(S31)を指示する。子音ブースタ処理の詳細は、後記する
図6から
図10で詳細に説明する。
【0027】
CPU11は、DSP5に対して高速フーリエ変換処理(S32)を指示する。DSP5は、音声信号を、20Hzから20KHzまで、各周波数チャンネルに分割して、高速フーリエ変換(S32)を行い、各周波数チャンネルの時間波形を生成させる(S33)。この時間波形は、分割された周波数領域のレベルの時間的変化より生成される。この技術については公知技術であり詳しい説明は割愛する。
【0028】
DSP5は、各周波数チャンネルの時間波形に対して、各チャンネルゲインの確認処理を行う(S34)。そしてDSP5は、各チャンネルの時間波形のレベルが、予め定めた閾値を超えたか否かを判定する(S35)。DSP5は、時間波形が閾値を超えたならば(Yes)、該当チャンネルの逆位相波形を生成して(S36)、メイン処理に復帰する。DSP5は、時間波形が閾値を超えていないならば(No)、メイン処理に復帰する。
ステップS32~S36の目的は、音声信号のハウリングが発生しているチャンネルを見つけ出すためである。ハウリングが発生している周波数チャンネルではピークが立つ。周波数チャンネルの時間波形のレベルと閾値とを比較してピークを検出することで、ハウリングを検出することができる。
【0029】
尚、このピークが立つチャンネルは一箇所とは限らない。複数箇所あれば、それらの箇所だけCPU11やDSP5は把握できる。このチャンネルも複数あり場合もありうる。全体のチャンネルをミックスする前にハウリングをキャンセルするようにしているが、これは、ハウリングのチャンネルだけを綺麗にキャンセルするためにこの方法を採用している。逆位相も含めて全体を一気に合成すると、他の周波数帯の波形を干渉が発生しやすく、ハウリングのキャンセルが綺麗に行えない可能性を回避するため、この方法を採用している。
【0030】
ここまでハウリングをキャンセルすることをメインに説明してきたが、それに限らず、例えば、特定ノイズが同様に所定レベルを超えても同様に働き、ユーザの聴き心地が悪化することを防ぐことができる。
【0031】
その後、補聴器1は、全ての周波数チャンネルの位相を継承させたうえで逆フーリエ変換し(合算)し、サウンドシステム13のスピーカより補聴信号(音声)として出力させる。位相の合わせ方は、公知の位相合わせ方法を利用する。
【0032】
以上のように、ハウリングが生じても、ハウリングが生じている周波数帯の帯域に限ってハウリングキャンセルが働き、他の周波数帯へは影響が及ばない。このため、ユーザは人の会話の音など必要な音は聞こえながらも、ハウリングあるいは大きな不快な音などについての音はキャンセルして聞くことができ、使用性は飛躍的に向上する。
【0033】
図6を参照し、第1の実施形態の子音プースタ処理の概念を説明する。
この図では「さかな」と入力されたときの子音のみが大きく増幅される例を示す。さかなという音声が入力された際、補聴器1の信号制御は、実線で示した音声信号が伝達されるラインと、破線で示す制御信号のラインによって構成される。
ハードウエアあるいはソフトウエアで処理してもよいブロックは、ノイズゲート52、ウオッチフィルタ54、閾値判定部55、エクスパンドフィルタ51,53である。
【0034】
音声信号は、エクスパンドフィルタ51により、フィルタ処理が行われる。これにより、子音の周波数領域の強調が行われる。エクスパンドフィルタ51は、音声信号の子音周波数帯域のエネルギを押し上げる第1エクスパンドフィルタである。
【0035】
次に音声信号は、ノイズゲート52によって、後段に通過するか否かのゲート処理が行われる。このゲート処理の詳細は、後記する
図11で説明する。
ノイズゲート52を通過した音声信号は、エクスパンドフィルタ53により、フィルタ処理が行われる。これにより、子音の周波数領域が押し下げられる。エクスパンドフィルタ53は、音声信号の子音周波数帯域のエネルギを押し下げる第2エクスパンドフィルタである。
エクスパンドフィルタ53の出力信号は、例えばハウリング処理などの他の音声信号処理が行われたのち、スピーカ3から音声として出力される。
【0036】
音声信号は、ウオッチフィルタ54に伝達されて特定の周波数帯域から始まる音声(母音)の周波数領域が取り出されたウオッチ信号となる。このウオッチ信号は、閾値判定部55により波高値が閾値を超えた程度が反映された制御信号となる。この制御信号は、エクスパンドフィルタ53に伝達されて、このフィルタ処理の制御に用いられる。
【0037】
図7は、ウオッチフィルタ54のフィルタ特性を示すグラフである。
グラフの縦軸は対数でゲインを示し、横軸は対数で周波数を示している。
ここで、ウオッチフィルタ54のフィルタ特性は、母音の周波数特性に対応した周波数特性カーブを有する。具体的にいうと、ウオッチフィルタ54は、周波数f1からf2に急峻なピークを有するフィルタである。周波数f1とf2の組合せは、例えば20Hz~500Hzであるが、母音の周波数特性に対応していればよく、限定されない。
【0038】
このフィルタに「さかな」という音声信号が入ると、「さ」「か」「な」の母音が入ってきたときだけ、フィルタによってその帯域成分が大幅に増幅される。ここで増幅された成分は、「さ」「か」「な」の母音のみに対応する成分となっている。この信号は、積分されて包絡線信号に変換される。この包絡線信号は、音声信号のうち母音周波数帯域のエネルギに対応する。この包絡線信号の波高値は、閾値判定部55の閾値と比較されて母音の検出に使用される。
【0039】
つまりウオッチフィルタ54は、音声信号の周波数特性を検知する。そして、ウオッチフィルタ54の出力信号のエネルギにより、母音を判定することができる。
【0040】
図8は、波高値による母音の検出を示すタイムチャートである。
グラフの縦軸は波高値を示し、横軸は時間を示している。この波高値は、時刻t1から時刻t2までの間で、閾値を超えている。よってDSP5は、時刻t1から時刻t2までの間、母音を検出する。つまり閾値判定部57は、ウオッチフィルタ54の出力信号のエネルギにより母音を判定する。
【0041】
図6に戻って説明を続ける。閾値判定部55では、包絡線信号の波高値が閾値を超えると、その超えた度合いを制御信号とする。この制御信号は、エクスパンドフィルタ53のゲインの制御信号として用いる。例えば、「さかな」の最初の母音の[a]が入力されると、ウオッチフィルタ54は、その母音の周波数成分をフイルタリングし、閾値判定部55は、波高値が閾値を超えることを検知する。閾値判定部55は、制御信号をエクスパンドフィルタ53に出力する。
【0042】
図9は、2つのエクスパンドフィルタと、これらを合成した周波数ゲインを示すグラフである。各グラフの縦軸は対数でゲインを示し、横軸は対数で周波数を示している。
第1のグラフは、エクスパンドフィルタ51のフィルタ特性を示している。エクスパンドフィルタ51は、子音の周波数帯域のゲインを増幅させるフィルタであり、周波数f3からf4に急峻なピークを有するフィルタである。周波数f3とf4の組合せは、例えば1KHz~10KHzであるが、子音の周波数特性に対応していればよく、限定されない。
【0043】
第2のグラフは、エクスパンドフィルタ53のフィルタ特性を示している。実線は、母音を検出したときにフィルタ特性を示している。このときエクスパンドフィルタ53は、子音の周波数帯域のゲインを減衰させており、エクスパンドフィルタ51の各周波数におけるゲインを負にしたものと等しい。これにより、制御信号に応じてエクスパンドフィルタ51の作用を打ち消すことができる。第2のグラフの破線は、母音を検出しなかったときのエクスパンドフィルタ53のフィルタ特性である。母音を検出しなかったとき、フィルタ特性は平坦である。
【0044】
第3のグラフは、エクスパンドフィルタ51,53を合成したフィルタ特性を示している。第3のグラフの実線は、母音を検出したときのフィルタ特性を示しており、平坦である。第3のグラフの破線は、母音を検出しなかったときのフィルタ特性を示しており、子音の周波数領域がブーストされている。つまりエクスパンドフィルタ51,53は、音声信号の子音周波数帯域のエネルギを押し上げる。更に閾値判定部57は、母音を判定している間はエクスパンドフィルタ51,53の特性を平坦化させる。
【0045】
図10は、子音ブースタ処理のフローチャートである。
DSP5は先ず、マイク入力部2からの音声を取り込む(S40)。次にDSP5は、ノイズゲート52によるゲート処理(S41)を行う。このゲート処理において、前段のエクスパンドフィルタ51によるゲインアップ処理が行われる。ゲート処理の詳細は、後記する
図11で説明する。
次にDSP5は、ウオッチフィルタ処理(S42)を行い、ウオッチフィルタ54の出力の包絡線信号を抽出する(S43)。DSP5は、その包絡線信号を元に、所定閾値以上の入力が有るか否かを判断し、よって母音が検出されたか否かを判定する(S44)。
【0046】
DSP5は、母音が検出された場合(Yes)、後段のエクスパンドフィルタ53によるゲインダウン処理を行い(S45)、フィルタ処理された音声を出力する(S46)。DSP5は、母音が検出されない場合(No)、そのまま前段のエクスパンドフィルタ51で処理された音声を出力する(S46)。その後、DSP5は、メイン処理に復帰する。
【0047】
図11は、ゲート処理のフローチャートである。
DSP5は、前段のエクスパンドフィルタ51により、子音の周波数領域のゲインを最大に設定する(S50)。そして、DSP5は、包絡線のレベルが閾値以上であるか否かを判定する(S51)。DSP5は、包絡線のレベルが閾値以上ならば(Yes)、ゲートを開放して(S52)、音声信号を後段の処理に引き渡す。DSP5は、包絡線のレベルが閾値未満ならば(No)、ゲートを閉塞して(S53)、音声をミュートさせる。これにより、閾値未満の音声信号の場合に、この補聴器1をミュートすることができる。
【0048】
《第1の実施形態の要点》
この補聴器1のCPU11は、入力音声の子音の周波数成分をウオッチし、その成分の多少によりエクスパンドフィルタ53を制御して、実際にユーザに聴こえる音声のうち子音成分のみ補強する。これにより、例えば、[sa]という音がきたとき[s]の部分だけの音が補強されることになる。
【0049】
《第1の実施形態の効果》
子音が聴きやすくなり、あらゆる子音において明瞭度を増すことができる。
以上より、本実施形態の補聴器1によれば、子音が原音にくらべて聞き取りやすく明瞭度が増す。また、子音波形のアタック部分から処理されるため、更に明瞭度が増す。
【0050】
《第2の実施形態》
第2の実施形態の補聴器1は、第1の実施形態と同様に構成されており、子音ブースタ処理とゲート処理とが異なる。以下、
図12から
図15を参照して子音ブースタ処理を説明し、
図16を参照してゲート処理を説明する。
【0051】
図12は、第2の実施形態の子音プースタ処理の概念を説明する図である。
この図では「さかな」と入力されたときの子音のみが大きく増幅される例を示す。さかなという音声が入力された際、補聴器1の信号制御は、実線で示した音声信号が最後まで使用されるラインと、破線で示す制御信号のラインによって構成される。
ハードウエアあるいはソフトウエアで処理してもよいブロックは、ノイズゲート56、子音ウオッチフィルタ54a、母音ウオッチフィルタ54b、閾値判定部57、エクスパンドフィルタ58である。
【0052】
音声信号は、子音ウオッチフィルタ54aと母音ウオッチフィルタ54bにより、並行してフィルタ処理が行われる。子音ウオッチフィルタ54aにより、子音の周波数領域の強調が行われて子音ウオッチ信号となる。母音ウオッチフィルタ54bにより、母音の周波数領域の強調が行われて母音ウオッチ信号となる。次に音声信号は、ノイズゲート56によって、後段に通過するか否かのゲート処理が行われる。ノイズゲート56を通過した音声信号は、エクスパンドフィルタ58により、フィルタ処理が行われる。これにより、子音の周波数領域の強調が行われる。
【0053】
母音ウオッチ信号と子音ウオッチ信号は、閾値判定部57により制御信号となる。この制御信号は、エクスパンドフィルタ58に伝達されて、このフィルタ処理の制御に用いられる。
【0054】
図13は、子音ウオッチフィルタ54aと母音ウオッチフィルタ54bのフィルタ特性を示すグラフである。
グラフの縦軸は対数でゲインを示し、横軸は対数で周波数を示している。
ここで、子音ウオッチフィルタ54aのフィルタ特性は、子音の周波数特性に対応した周波数特性カーブを有する。具体的にいうと、子音ウオッチフィルタ54aは、周波数f3からf4に急峻なピークを有するフィルタである。周波数f3とf4の組合せは、例えば1KHz~10KHzであるが、子音の周波数特性に対応していればよく、限定されない。
【0055】
母音ウオッチフィルタ54bのフィルタ特性は、母音の周波数特性に対応した周波数特性カーブを有する。具体的にいうと、母音ウオッチフィルタ54bは、周波数f1からf2に急峻なピークを有するフィルタである。周波数f1とf2の組合せは、例えば20Hz~500Hzであるが、母音の周波数特性に対応していればよく、限定されない。
【0056】
子音ウオッチフィルタ54aと母音ウオッチフィルタ54bに「さかな」という音声信号が入る場合を考える。[s][k]の子音の場合に、子音ウオッチフィルタ54aによって周波数f3~f4の帯域成分が大幅に増幅される。[a]の母音の場合に、母音ウオッチフィルタ54bによって周波数f1~f2の帯域成分が大幅に増幅される。これらの信号は、それぞれ積分されて包絡線信号に変換される。これら包絡線信号の波高値は、閾値判定部57に入力されて母音の検出に使用される。
【0057】
図14は、波高値の比による母音の検出を示すタイムチャートである。
第1グラフの縦軸は子音の波高値を示し、横軸は時間を示している。第2グラフの縦軸は母音の波高値を示し、横軸は時間を示している。第3グラフの縦軸は母音の波高値と子音の波高値の比を示し、横軸は時間を示している。
第3グラフの波高値の比は、時刻t3から時刻t4までの間で、閾値を超えている。よってDSP5は、時刻t3から時刻t4までの間、母音を検出する。
【0058】
図12に戻って説明を続ける。閾値判定部57では、包絡線信号の波高値の比が閾値を超えると、その超えた度合いを制御信号とする。この制御信号は、エクスパンドフィルタ58のゲインの制御信号として用いる。例えば、「さかな」の最初の母音の[a]が入力されると、閾値判定部57は、波高値の比が閾値を超えることを検知する。閾値判定部57は、制御信号をエクスパンドフィルタ58に送信する。これにより、エクスパンドフィルタ58は、子音の周波数領域の増幅を弱めて、より平坦な特性とする。
【0059】
図15は、子音ブースタ処理のフローチャートである。
DSP5は先ず、マイク入力部2からの音声を取り込む(S60)。
次にDSP5は、子音ウオッチフィルタ処理(S61)を行い、子音ウオッチフィルタ54aの出力の包絡線信号を抽出する(S62)。
これと並行してDSP5は、母音ウオッチフィルタ処理(S63)を行い、母音ウオッチフィルタ54bの出力の包絡線信号を抽出する(S64)。
【0060】
次にDSP5は、ノイズゲート56によるゲート処理(S65)を行う。ゲート処理の詳細は、後記する
図16で説明する。
DSP5は、その母音の包絡線信号と子音の包絡線信号の比を算出する(S66)。
DSP5は、この包絡線信号の比が所定閾値以上で有るか否かを判断し、よって母音が検出されたか否かを判定する(S67)。
【0061】
DSP5は、母音が検出された場合(Yes)、エクスパンドフィルタ58によるゲインダウン処理を行い(S68)、フィルタ処理された音声を出力する(S69)。DSP5は、母音が検出されない場合(No)、そのままフィルタ処理された音声を出力する(S69)。その後、DSP5は、メイン処理に復帰する。
【0062】
図16は、ゲート処理のフローチャートである。
DSP5は、
図15に示したステップS61により、子音の周波数領域の強調を行って子音ウオッチ信号を生成している。DSP5は、この子音ウオッチ信号から包絡線信号を取得する(S80)。そして、DSP5は、包絡線のレベルが閾値以上であるか否かを判定する(S81)。DSP5は、包絡線のレベルが閾値以上ならば(Yes)、ゲートを開放して(S82)、音声信号を後段の処理に引き渡す。DSP5は、包絡線のレベルが閾値未満ならば(No)、ゲートを閉塞して(S83)、音声をミュートさせる。これにより、閾値未満の音声信号の場合に、この補聴器1をミュートすることができる。
【0063】
《第2の実施形態の効果》
母音の包絡線と子音の包絡線との比により、母音を判定しているので、母音のみで検知するよりも早期に母音を検出できる。これにより子音が聴きやすくなると共に母音が聞きにくくなるという副作用を防止できる。
以上より、本実施形態の補聴器1によれば、子音が原音にくらべて聞き取りやすく明瞭度が増し、子音波形のアタック部分から処理されるため、更に明瞭度が増す。更に、母音が聞きにくくなるという副作用を防止できる。
【0064】
(変形例)
本発明は、上記実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で、変更実施が可能であり、例えば、次の(a)~(c)のようなものがある。
【0065】
(a) 制御信号を検出して、フィルタを制御するまでにわずかに時間がかかる。このため、入力波形をこのわずかな時間だけ遅らせてからエクスパンドフィルタを掛けることで、より明瞭な波形を作ることができる。また処理は数ミリ秒で行われるため、違和感はほとんどない。図示しないがが、具体的には、エクスパンドフィルタ51またはノイズゲート52が出力した音声信号に対して所定の遅延を挿入するとよい。所定の遅延とは、例えば、4ミリ秒程度である。
【0066】
(b) 子音にはいくつかのパターンがあり、3パターンほど周波数特性が異なるグループに分けられる。このため、エクスパンドフィルタの処理を並列に3ライン作成しておき、それぞれが得意な子音を処理することで、あらゆる子音において明瞭度を増すことができる。
(c) 各母音に応じた複数のウオッチフィルタを設けると共に、複数のエクスパンドフィルタを設けてもよい。これにより、母音の検出精度を向上させると共に、各子音の明瞭度を増すことができる。
【0067】
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
【0068】
〔付記〕
《請求項1》
音声信号の子音周波数帯域のエネルギを押し上げるエクスパンドフィルタと、
前記音声信号の周波数特性を検知するウオッチフィルタと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定し、当該特定の周波数帯域から始まる音声を判定している間は前記エクスパンドフィルタの特性を平坦化させる判定部と、
を備えることを特徴とする音声信号処理装置。
《請求項2》
前記エクスパンドフィルタは、
音声信号の子音周波数帯域のエネルギを押し上げる第1エクスパンドフィルタと、音声信号の子音周波数帯域のエネルギを押し下げる第2エクスパンドフィルタの組合せである、
ことを特徴とする請求項1に記載の音声信号処理装置。
《請求項3》
前記ウオッチフィルタは、音声信号のうち前記特定の周波数帯域から始まる音声の周波数帯域を通過させ、
前記判定部は、前記ウオッチフィルタの出力信号が所定エネルギを超えたならば、前記特定の周波数帯域から始まる音声と判定する、
ことを特徴とする請求項1に記載の音声信号処理装置。
《請求項4》
前記ウオッチフィルタは、音声信号のうち前記特定の周波数帯域から始まる音声の周波数帯域を通過させる第1のフィルタ、および子音周波数帯域を通過させる第2のフィルタを含み、
前記判定部は、前記第1のフィルタの出力信号と前記第2のフィルタの出力信号のエネルギ比が所定値を超えたならば、特定の周波数帯域から始まる音声と判定する、
ことを特徴とする請求項1に記載の音声信号処理装置。
《請求項5》
音声信号が所定値以下ならば、当該音声信号を通過させないゲートを更に有する、
ことを特徴とする請求項1に記載の音声信号処理装置。
《請求項6》
請求項1ないし5のうちいずれか1項に記載の音声信号処理装置と、
音声信号を収録するマイクと、
前記音声信号処理装置によって処理された音声信号を出力するスピーカと、
を備えることを特徴とする補聴器。
《請求項7》
エクスパンドフィルタにより音声信号の子音周波数帯域のエネルギを押し上げるステップと、
ウオッチフィルタにより前記音声信号の周波数特性を検知するステップと、
前記ウオッチフィルタの出力信号のエネルギにより特定の周波数帯域から始まる音声を判定するステップと、
当該特定の周波数帯域から始まる音声を判定している間は、前記エクスパンドフィルタの特性を平坦化させるステップと、
を実行することを特徴とする音声信号処理方法。
【符号の説明】
【0069】
1 補聴器
11 CPU
12 メモリ
13 サウンドシステム
14 平面部
15 端部
2 マイク入力部
21 A/D変換部
3 スピーカ
4 操作部
41 電源ボタン
42 ボリューム
5 DSP
51 エクスパンドフィルタ (第1エクスパンドフィルタ)
52 ノイズゲート
53 エクスパンドフィルタ (第2エクスパンドフィルタ)
54 ウオッチフィルタ
54a 子音ウオッチフィルタ
54b 母音ウオッチフィルタ
55,57 閾値判定部 (判定部)
56 ノイズゲート
57 閾値判定部
58 エクスパンドフィルタ