特表2015-501114(P2015-501114A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴェーデクス・アクティーセルスカプの特許一覧

<>
  • 特表2015501114-補聴器の動作方法および補聴器 図000013
  • 特表2015501114-補聴器の動作方法および補聴器 図000014
  • 特表2015501114-補聴器の動作方法および補聴器 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2015-501114(P2015-501114A)
(43)【公表日】2015年1月8日
(54)【発明の名称】補聴器の動作方法および補聴器
(51)【国際特許分類】
   H04R 25/00 20060101AFI20141205BHJP
【FI】
   H04R25/00 L
【審査請求】有
【予備審査請求】未請求
【全頁数】18
(21)【出願番号】特願2014-547723(P2014-547723)
(86)(22)【出願日】2011年12月22日
(85)【翻訳文提出日】2014年6月19日
(86)【国際出願番号】EP2011073746
(87)【国際公開番号】WO2013091702
(87)【国際公開日】20130627
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,MD,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IS,JP,KE,KG,KM,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LT,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US,UZ,VC,VN
(71)【出願人】
【識別番号】500011045
【氏名又は名称】ヴェーデクス・アクティーセルスカプ
(74)【代理人】
【識別番号】110001830
【氏名又は名称】東京UIT国際特許業務法人
(72)【発明者】
【氏名】アンデルセン・クリスティアン・ティム
(72)【発明者】
【氏名】メインッケ・メテ・ダール
(57)【要約】
補聴器(50)における信号処理方法であって,この方法は,複数の個々の周波数帯域に与えられる利得を含む利得ベクトルを決定し,利得ベクトルの関数としての音声明瞭尺度の勾配を決定し,上記勾配の値を修正し,上記勾配の修正値を用いて複数の個々の周波数帯域に与えられる利得についての最適値を決定することによって,音声明瞭度および聴取快適性の両方を最適化するものである。この発明は補聴器(50)も提供する。
【特許請求の範囲】
【請求項1】
マイクロフォンから入力信号を受信し,
上記入力信号を複数の周波数帯域に分割し,
補聴器ユーザの聴覚損失を緩和するために,対応する1組の周波数帯域に与えられるべき1組の第1利得値から構成される第1利得ベクトルを選択し,
1組の第2利得値を表す第2利得ベクトルの関数としての音声明瞭尺度の勾配を決定し,
1組の周波数帯域において利得を低減できるようにすることにより最適化聴取快適性を提供する1組の減失利得値を決定し,
1組の減失項を加えることによって1組の勾配要素を修正してこれにより修正勾配を提供し,
上記修正勾配に基づいて1組の上記第2利得値を反復的に変動し,これにより最適化音声明瞭度および聴取快適性を提供する1組の第2利得値を決定し,
決定された上記1組の第2利得値に基づいて上記第1利得ベクトルを修正し,
上記修正された第1利得ベクトルにしたがって上記入力信号を処理し,これによって出力トランスデューサを駆動する出力信号を提供する,
補聴器における信号処理方法。
【請求項2】
減失項が第2利得値と減失利得値との間の差に比例する,請求項1に記載の方法。
【請求項3】
上記減失項が比例定数を含み,上記定数の値が現在動作している補聴器プログラムに依存するものである,請求項2に記載の方法。
【請求項4】
上記減失項が比例定数を含み,上記定数の値が現在の音環境の分類に依存する,請求項2に記載の方法。
【請求項5】
上記1組の第2利得値が上記1組の第1利得値と置き換えられる,請求項1から4のいずれか一項に記載の方法。
【請求項6】
上記1組の第2利得値が,音声明瞭度最適化による上記1組の第1利得値からの逸脱を表するものであり,したがって上記1組の第1利得値に加えられる,請求項1から4のいずれか一項に記載の方法。
【請求項7】
減失利得値を決定するステップが,
音環境の雑音レベルを推定し,
上記音環境における音声のみのレベルを推定し,
上記推定雑音レベルと上記推定音声のみレベルを所定制限内で修正し,
修正された推定雑音レベルおよび推定音声のみレベルを乗算して,これにより上記減失利得値を提供する,
請求項1から6のいずれか一項に記載の方法。
【請求項8】
上記推定雑音レベルおよび上記推定音声のみレベルが,上記音環境のそれぞれのパーセンタイル値から導出される,請求項7に記載の方法。
【請求項9】
上記1組の減失利得値を決定するステップが,上記減失利得値を約−20dBから0dBの範囲に入れるものである,請求項1から8のいずれか一項に記載の方法。
【請求項10】
上記勾配が閉形式の数式を用いて決定される,請求項1から9のいずれか一項に記載の方法。
【請求項11】
入力トランスデューサ,処理装置,および音響出力トランスデューサを備える補聴器であって,上記処理装置が,減失利得値を導出する減失利得値手段と,音声および雑音を推定する推定手段と,上記補聴器のユーザの聴覚損失情報を保持する聴覚損失ベクトル手段と,少なくとも推定音声および推定雑音,聴覚損失,ならびに1組の減失利得値の関数としての音声明瞭尺度を改善するために,上記補聴器に与えられるべき1組の利得の修正値を提供する音声増強ユニットを備えており,上記減失利得値が聴取快適性を改善するものである,補聴器。
【請求項12】
上記音声増強ユニットが,1組の補聴器利得の関数としての音声明瞭尺度の勾配を決定する手段,減失利得値を用いて勾配要素を修正する手段,および修正された勾配要素を用いて上記1組の利得の修正値を導出する手段を備えている,請求項11に記載の補聴器。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は補聴器の動作方法に関する。より詳細にはこの発明は音声明瞭度(言語明瞭度)(speech intelligibility)および聴取快適性(聞いたときの心地よさ)(listening comfort)を最適化する補聴器の動作方法に関する。さらにこの発明は改善された音声明瞭度および聴取快適性を提供する補聴器に関する。
【背景技術】
【0002】
近年の補聴器は,一または複数のマイクロフォン,信号処理装置およびスピーカを備えている。
【0003】
使用に先立って,補聴器は個々のユーザに対してフィットさせる必要がある。フィッティング手順は,基本的にはユーザの聴覚障害および選択される特定の補聴器などの特定の状況にしたがって,ユーザの聴覚損失を最適に補償するレベルおよび周波数に応じた伝達関数を適合することを含む。上記伝達関数を制御するパラメータの選択される設定が補聴器中に記憶される。たとえば障害状況の変化を考慮に入れるために,上記設定はフィッティング手順の繰返しを通じて後日変更することができる。マルチ・プログラム補聴器の場合には,上記適合手順をプログラムごとに実行することができ,特定の音環境を考慮に入れるための専用設定が選択される。
【0004】
最新技術によれば,補聴器は,各帯域についての何らかの所定の入力/利得曲線にしたがって利得レベル(複数)を特定する機能を用いて複数の周波数帯域の音を処理する。
【0005】
レベル依存伝達関数(the level-dependent transfer function)は信号を圧縮して補聴器の出力のダイナミック・レンジを制御する。上記圧縮は,補聴器のユーザの聴取快適性を増進することを目的とする利得レベルの自動調整とみなすことができ,したがって上記圧縮は自動利得制御(Automatic Gain Control)(AGC)と表現することができる。上記AGCは,補聴器を使用する人物の聴覚損失(難聴)を緩和するために必要とされる利得値も提供する。国際出願WO−A1−9934642に記載のやり方で圧縮を実装することができる。
【0006】
最新の補聴器には,音響フィードバック不安定性を連続的に制御することを目的として,各周波数帯域において連続的に入力レベルおよび出力レベルを計測し,必要に応じて各帯域において信号をキャンセルしかつ設定利得を低めることによるアンチ・フィードバック・ルーチンをさらに備えるものもある。
【0007】
しかしながら,これらすべての「事前定義された」(predefined)利得調整法では,利得レベルは,一般的な状況の要件を反映するための補聴器のプログラミング/フィッティング中に事前に定義される関数(function)に応じて変更される。
【0008】
最近では,線形システムにおいても伝送後の音声の明瞭度を予測するモデルを使用することが提案されている。最もよく知られているこのようなモデルには,「明瞭度指数」(articulation index)(AI),音声明瞭度指数(speech intelligibility index)(SII)および音声伝達指数(speech transmission index)(STI)があり,他の指数も存在する。
【0009】
音声明瞭度の決定は電話回線における音声信号の品質を評価するために用いられてきた。たとえば,H. Fletcher および R. H. Gait 「The perception of speech and its relation to telephony」 J. Acoust. Soc. Am. 22, 89-151 (1950) を参照。
【0010】
ANSI S3.5-1969標準(1997年改正)は,音声明瞭度指数SIIの算出法を提供する。上記SIIは伝送される音声情報の明瞭度量(intelligible amount),すなわち線形伝送システムにおける音声明瞭度を予測可能にするものである。上記SIIは上記システムの伝達関数および音響入力の関数であり,すなわち上記システムの出力における音声スペクトルに間接的な関数である。さらに雑音マスキングの効果および補聴器ユーザの聴覚損失の効果の両方をSIIにおいて考慮に入れることができる。
【0011】
SIIは,0(音声が全く明瞭でない)と1(音声が完全に明瞭である)の間の数を常にとる。実際には上記SIIは,音声明瞭度を伝達するシステム能力の客観的な尺度(an objective measure of the system's ability)であり,好ましくは聴取者が何を言われているかを理解することができるようにするものである。
【0012】
補聴器における利得の増加は増幅音の音量増加を常に導くことになり,これが不快な大きな音レベルを導き,補聴器ユーザにとって快適でない音量となることがある。
【0013】
補聴器の出力の音量は,音量モデルたとえばB.C.J. MooreおよびB.R. Glasbergによる論文“A revision of Zwicker's loudness model”,Acta Acustica Vol. 82 (1996年) 335-345に記載のやり方にしたがって算出することができ,これは健聴者および難聴者における音量の算出モデルを提案する。上記モデルは定常状態音について設計されているが,モデル拡張によって短い過渡的音の音量の算出も可能である。等音量曲線(equal loudness contours)に関するISO標準226(ISO 1987)を参照されたい。
【0014】
欧州特許EP−B1−1522206は補聴器および補聴器の動作方法を開示するもので,音声明瞭度および音量のリアルタイムの決定に基づく周波数帯域利得調整に基づいて音声明瞭度が改善され,補聴器内の処理装置における実装に適している。
【0015】
このタイプの補聴器および動作方法は,現在の音状況に依存して,様々な帯域において独立に利得を増加するまたは減少する能力を必要とする。SIIを増強するためには,高い雑音レベルを持つ帯域についてはたとえば利得を低下することで有利となり,他方低い雑音レベルを持つ帯域については利得を増加することで有利となる。しかしながら,SIIは相互マスキング(mutual masking)といった帯域間相互作用(inter-band interactions)も考慮するので,このようなシンプルな方策が常に最適な解決策であるとは限らない。したがってSIIの正確な計算が必要である。
【0016】
このようなシステムは一般的には好適なものではあるが,音量モデルに基づく従来技術で容易に利用可能なもの以上に改良された聴取快適性を欲するユーザもいることが分かっている。
【0017】
さらに,聴取快適性を向上する手段は,補聴器ユーザの個々の好みに合わせて適合させることができるものであることが有利であることが分かっている。
【0018】
SIIと増幅利得における所与の変化との間の一般的な関係を分析的に計算することは不可能であるので,最大のSII値を与える特定の増幅利得を決定するためには,何らかの数値最適化ルーチンがこの関係を決定するためには必要とされる。しかしながら,補聴器における限られた処理資源を用いてリアルタイムで最適化された音声明瞭度を提供する最適なルーチンを導出するのは,単純ではない。
【0019】
したがってこの発明の特徴は,様々な音環境において,改善された聴取快適性がリアルタイムに最適化される音声明瞭度とともに提供される,補聴器の動作方法を提供することにある。
【0020】
この発明の他の特徴は,補聴器中の限られた処理資源を利用して,改善されたリアルタイムの最適化音声明瞭度が提供される補聴器の動作方法を提供することにある。
【0021】
この発明のさらなる特徴は,リアルタイムで聴取快適性を増強する手段および音声明瞭度を最適化する手段を備える補聴器を提供することである。
【発明の開示】
【0022】
第1の発明は,請求項1に記載の補聴器の動作方法を提供する。
【0023】
これにより,増強された音声明瞭度および聴取快適性を提供する補聴器の動作方法が提供される。
【0024】
第2の発明は,請求項11に記載の補聴器を提供する。
【0025】
さらなる有利な特徴は従属請求項から明らかである。
【0026】
この発明のさらに他の特徴は,この発明を詳細に説明する以下の記載から当業者に明らかにされよう。
【図面の簡単な説明】
【0027】
図1】この発明の一実施態様による補聴器をかなり概略的に示している。
図2】この発明の一実施態様による音声最適化アルゴリズムの簡単なフローチャートである。
図3】この発明の一実施態様による聴取快適性モデルのブロック図である。
【実施例】
【0028】
一例として,この発明の好ましい実施態様を示しかつ記載する。当然ではあるが,この発明は他の異なる実施態様が可能であり,そのいくつかの詳細は,この発明から逸脱することなく様々な明白なすべての観点において修正可能である。すなわち,図面および明細書は本質的に例示にすぎず限定するものではない。
【0029】
はじめに図1を参照して,図1はこの発明の一実施態様による補聴器50をかなり概略的に示している。
【0030】
図1の補聴器50はマイクロフォン1を備え,これがブロック分割手段2に接続され,これがさらにフィルタ・ブロック3に接続されている。上記ブロック分割手段2は,通常の任意の重付け窓関数(ordinary, optionally weighted windowing function)を適用可能なものであり,上記フィルタ・ブロック3は,好ましくは補聴器50における様々な周波数帯を規定するローパス,バンドパスおよびハイパス・フィルタの所定のセットを備えることができる。
【0031】
上記フィルタ・ブロック3からの全体出力が乗算点10に与えられ,かつフィルタ・ブロック3の別個の帯域1,2,...Mからの出力が音声および雑音推定器(speech and noise estimator)4の各入力端子に与えられる。別個のフィルタ帯域からの出力(複数)が図1では一本の太い信号線で示されている。音声レベルおよび雑音レベルの推定器は,たとえば国際出願US−A−5687241に開示されている種類のパーセンタイル推定器(percentile estimator)として実装することができる。
【0032】
乗算点10の出力は,ブロック・オーバーラップ手段11を通じてスピーカ12にさらに接続されている。上記音声および雑音推定器4は,音声(言語)最適化ユニット(speech optimization unit)8,自動利得コントロール(AGC)手段5,および推定信号Sおよび推定雑音Nをそれぞれ搬送する2つの多重帯域信号経路によって聴取快適性モデル(listening comfort model)7に接続されている。
【0033】
上記ブロック・オーバーラップ手段11は,再生に適する最適化信号を再生成(recreating)する帯域インターリービング関数(band interleaving function)および再生関数(regeneration function)として実装することができる。上記ブロック・オーバーラップ手段11は,最終的な音声最適化信号ブロック(final, speech-optimized signal block)を形成し,これを上記スピーカ12にもたらす。
【0034】
上記聴取快適性モデル7は,推定信号Sおよび推定雑音Nの信号部分を用いて,聴取快適性に関して最適化される,各周波数帯域についての減失利得値(ペナルティ利得値)(penalty gain value)Gpen,fを決定する。聴取快適性モデル7の多帯域出力,すなわち減失利得ベクトルGpenは音声最適化ユニット8に与えられる。上記聴取快適性モデルについては図3を参照して詳細に説明する。
【0035】
上記AGC手段5は加算点9の一の入力に接続されており,圧縮特性および補聴器ユーザの特定の聴覚損失に基づいて,各周波数帯域について,1組の第1利得値G0,f(first set of gain valus G0,f)をそこに与える。図1の実施態様の変形例では,1組の第1利得値G0,fは,雑音低減および/または音声(会話)増強の特徴を除く補聴器伝達関数を単に規定する。
【0036】
上記AGC手段5は,好ましくはたとえばWO−A1−2007/025569に記載された種類の多帯域圧縮器(multiband compressor)として実装される。
【0037】
聴覚損失モデル手段6は,好ましくは動作中の補聴器50にすでに記憶されている聴覚損失補償プロファイルの表現(representation of the hearing loss compensation profile)とすることができる。
【0038】
上記音声最適化ユニット8は,利得ベクトルG’を構成する各周波数帯域についての新たな1組の最適化利得値G’fを算出する手段を備え,利得ベクトルG’に上記AGCによって提供される利得値G0,fを含む利得ベクトルG0が加えられる。上記音声最適化ユニット8の出力G’は加算点9の入力の一つに与えられる。加算ポイント9の出力は乗算点10の入力に与えられる。
【0039】
上記加算ポイント9,聴取快適性モデル手段7,聴覚損失モデル手段6および音声最適化ユニット8が,この発明による補聴器の最適化部分を形成する。図1における補聴器50において,音声信号および雑音信号がマイクロフォン1によってピックアップされ,上記ブロック分割手段2によって複数の一時的ブロックないしフレーム(temporal blocks or frames) に分割される。上記一時的ブロックないしフレームのそれぞれは好ましくは約50秒の長さをもち,個別に処理される。すなわち各ブロックが上記フィルタ・ブロック3によって多数の別個の周波数帯域に分割される。
【0040】
周波数分割された信号ブロック(frequency-divided signal blocks)は次に2つの別個の信号経路に分岐され,一方は上記音声および雑音推定器4に進み,他方は乗算点10に進む。上記音声および雑音推定器4は2つの別個のベクトル,すなわちN(推定雑音)およびS(推定音声)を生成する。これらのベクトルは,推定雑音レベルと推定音声レベルとを区別するために上記聴取快適性モデル手段7および音声最適化ユニット8によって用いられる。
【0041】
上記音声および雑音推定器4はパーセンタイル推定器として実装することができる。定義によれば,パーセンタイルは累積分布がそのパーセンタイル以下である値である(A percentile is, by definition, the value for which the cumulative distribution is equal to or below that percentile)。上記パーセンタイル推定器からの出力値は,それぞれ信号レベルが推定される時間間隔の所定パーセント内に入る信号レベル未満のレベル値の推定に対応する(The output values from the percentile estimator each correspond to an estimate of a level value below which the signal level lies within a certain percentage of time during which the signal level is estimated)。上記ベクトルは好ましくは10%パーセンタイル(雑音N)および90%パーセンタイル(音声S)にそれぞれ対応するが,他のパーセンタイル値を用いることもできる。実際上は,上記雑音レベル・ベクトルNが,周波数帯信号レベルが上記時間の10%に入る信号レベルを含み,かつ上記音声レベル・ベクトルSが,周波数帯信号レベルが上記時間の90%に入る信号レベルであることを意味する。上記音声および雑音推定器4は,各ブロックについて,雑音の周波数帯域レベル(frequency band levels)および音声の周波数帯域レベルを推定するための非常に効率的なやり方を実行する。
【0042】
上記音声および雑音推定器4はまた上記AGC手段5への入力を提供し,そこから様々な周波数帯域における,補聴器ユーザの聴覚損失を緩和するのに必要な利得G0,fが決定される。
【0043】
上記AGC5からの利得値G0,fは次に加算点9において最適化利得値G’fと加算されて上記乗算点10に与えられる。さらに上記利得値G0,fは音声明瞭度値を算出するために音声最適化ユニット8に与えられる。
【0044】
上記聴取快適性モデル手段7は,聴取快適性および音声明瞭度の両方に関して最適化される利得値G’を見つけるために用いられる減失利得値Gpenを決定するためのアルゴリズムを含む。上記アルゴリムは図3を参照して以下で詳述する。
【0045】
音声明瞭度の最適化後,好ましくは図2の下側に示す反復アルゴリズムによって,上記音声最適化ユニット8は上記加算点9の入力に最適化利得値G’をもたらす。上記加算点9は最適化利得値G’を含むベクトルを上記AGC5からの利得値Go,fを含む入力ベクトルに加算し,上記乗算点10の入力に新たな修正された利得ベクトルを形成する。乗算点10は上記修正利得ベクトルからの適切な利得を上記フィルタ・ブロック3からの信号に乗算し,その結果,利得調整信号(gain adjusted signal)がブロック・オーバーラップ手段11の入力にもたらされる。これによって補聴器は所望の伝達関数を備えるものとなる。
【0046】
図1の実施例の変形例では,上記音声最適化ユニット8が上記フィルタ・ブロック3からの信号に与えられるべき利得値を直接に提供し,これにより上記加算点9を省略することができる。
【0047】
オンラインSII雑音低減アルゴリズム(online SII noise reduction algorithm)は,難聴者のための修正に沿って米国国家規格(the American National Standard)の音声明瞭度指数(Speech Intelligibility Index)(SII)の最大化を試みる。このアルゴリズムの出力は圧縮器利得に追加されるべきフィルタ・バンクにおける帯域に対応する15の利得値である。聴覚閾値ならびに推定雑音および推定音声が与えられることで上記方法は15の利得値の調整を試み,これにより上記SIIが最大化される。上記SII雑音低減の目的は,15次元の利得空間における最大値(the maximum in the 15 dimensional gain space)を見つけることにある。
【0048】
変形例では,明らかではあるが,上記SII雑音低減アルゴリズムはすべての多数の周波数帯域において利用することができる。
【0049】
他の変形例において,SII以外の他のモデル,たとえば明瞭度指数(Articulation Index)(AI),音声伝達指標(Speech Transmission Index)(SII),または論文「Maximizing effective audibility in hearing aid fitting」,Ching, Dillon外,「Ear & Hearing」, Vol. 22, No. 3, 2001年6月に記載されている改善バージョンのSIIを,音声明瞭度の予測に利用することができる,
【0050】
以下において,用語「音声明瞭尺度」(speech intelligibility measure)は,音声明瞭度の予測についての何らかの適切なモデルから導出することができるものとする。一般にSII尺度は非線形であって最大値に対する閉形式解(closed-form solution to the global maximum)は不可能である。代わりに勾配上昇法(gradient ascent method)を用いることができる。このアルゴリズムは勾配の方向に反復的に行うことで動作する(The algorithm works by iteratively taking steps in the direction of the gradient)。反復回数を制限しかつステップ・サイズ(step size)を一連の非増加長(a series of non-increasing lengths)として固定することによって,上記アルゴリズムは,所定数のサンプル後に停止し,最終的な利得が許容利得範囲内の極大SII値(local maximum SII)に近づくことが保証される。
【0051】
次に図2を参照して,図2はこの発明の一実施態様による音声最適化アルゴリズムのフローチャートである。
【0052】
上記フローチャートはスタート・ポイント・ブロック100を含み,これが後続のブロック101につながっている。ここで初期の周波数帯域ナンバf=1,初期の反復ナンバm=1,SII利得ベクトルG’および減失利得ベクトルGpenが設定される。利得ベクトルG’fおよびGpen,fの要素(elements)は,補聴器の周波数帯域fのそれぞれに対応する利得値を表す。上記減失利得値Gpen,fは,図3を参照して以下に記載するアルゴリズムにしたがって算出される。
【0053】
音声明瞭尺度の勾配および減失利得ベクトルGpenの算出に必要とされる,推定音声ベクトルS,推定雑音ベクトルNおよび利得値G0,fは,一旦初期化されてかつ上記SII利得ベクトルG’の最適化の間一定に保たれる。
【0054】
次のステップ102において,ポイントG’fにおける音声明瞭尺度の勾配(the gradient of the speech intelligibility measure in the point of G’f)が決定される。以下において,ポイントG’fにおける勾配を,勾配要素(gradient element)または勾配の偏微分(partial derivative of the gradient)とも言う。
【0055】
ステップ102の後,上記音声明瞭尺度の勾配が,ステップ103において,上記減失利得値Gpen,fと上記利得値G’fの差に比例定数Kを乗算した項(a term)を加えることによって,修正される。
【0056】
ステップ104において上記修正された勾配の符号(sign)が判定される。新たな修正勾配が正である場合にはアルゴリズムはステップ105に進み,現在の利得値G’fに利得値増分Gm,fを加えたものが,新たな利得値G’fとして設定される。他方,上記ルーチンがステップ106に進む場合には,新たな利得値G’fは現在の利得値G’fから上記利得値増分Gm,fを減算した値に設定される。上記利得値増分Gm,fは定数としてもよいし,または反復回数mおよび/または周波数帯域ナンバfの関数として変動させることもできる。
【0057】
次に上記アルゴリズムはステップ107に進み,周波数帯域ナンバfが周波数帯域の最高ナンバfmaxに達したかどうかが判断される。達していない場合にが,周波数帯ナンバfがステップ109において一つ増加されて,アルゴリズムはステップ102に進む。
【0058】
このアルゴリズムの変形例では,上記利得値増分Gmは反復回数mに依存し,これにより利得値増分の大きさは反復回数が増えるにつれて小さくされる。
【0059】
周波数帯域の最高ナンバfmaxに達すると上記アルゴリズムはステップ108に進み,反復ナンバmが反復回数の最高ナンバmmaxに達しているかどうかが判断される。達していなければ,ステップ110において上記反復ナンバmが一つ増加されて,上記周波数ナンバfがステップ110において1(one)にリセットされ,上記アルゴリズムはステップ102に進む。
【0060】
発明者は,反復回数の最高ナンバmmaxに達すると,さらなる最適化の必要性はもはや存在せずに,結果的に得られる音声最適化利得値ベクトルG’がステップ111において信号装置の伝達関数に転送され,上記最適化ルーチンが終了することを見いだした。
【0061】
本質的に,上記アルゴリズムは,fmax周波数帯域利得値のfmax次元ベクトル空間を反復的にトラバースして,音声明瞭度および聴取快適性の両方に関して各周波数帯について利得値G’fを最適化するものである。
【0062】
発明者は音声明瞭度の多次元最適面(the multi-dimensional optimization surface of the speech intelligibility)が一般的に比較的フラットな安定状態(a relatively flat plateau)を含み,そこで音声明瞭度値がその最大値(its global maximum)に近づくことを見いだしたことが評価されるべきである。この最適化空間の領域内では,これは達成される音声明瞭度を大幅に損なうことなく実行することができるので,聴取快適性が向上されるという利点がある。この領域は比較的フラットであるので,上記音声明瞭度値の勾配はこれに相応して低くなり,上記減失利得Gpenを含む一般的に比較的制限された大きさの項は,したがってこの領域において音声明瞭度を大幅に損なうことなく,改善された聴取快適性を持つ領域に上記勾配を向かわせるのに十分になる。上記減失利得Gpen,fを含む項の大きさは,音声明瞭度がその最大値から大きく乖離しているときには,音声明瞭尺度の勾配の大きさに比べて一般に無視することができる。これによって上記アルゴリズムは最適化された音声明瞭度に向けた高速な収束をもたらす。
【0063】
発明者は上記SII指数の勾配を効率的なやり方で算出することができ,この算出を補聴器においてリアルタイムに実行することができる方法を発見したことがさらに評価されるべきである。これは,十分に正確な結果を提供することが証明された近似値を注意深く選択することによって達成され,補聴器帯域のそれぞれの利得に関して算出される勾配を,上記SII指数を最適化するために用いることができる。米国国家規格協会(ANSI)の「Methods for calculation of the speech intelligibility index」, ANSI S3.5-1997によると,上記音声明瞭度指数(SII)は個々の周波数帯域からの寄与分の合計として以下のように算出される。
【0064】
【数1】
【0065】
I(j)は帯域重要性関数(band importance function)を示し,A(j)は帯域可聴関数(band audibility function)を示す。これらの関数に関するさらなる詳細はANSI S3.5-1997に見ることができる。
【0066】
論文「Maximizing effective audibility in hearing aid fitting」, Ching, Dillon外著,「Ear & Hearing」, Vol. 22, No. 3, 2001年6月によると,音声明瞭度指数はやや修正された方法で以下のように算出される(上記論文の式(2)を参照)。
【0067】
【数2】
【0068】
L(j)はレベル歪み要素を示し,K(j)は減感聴能(desensitized audibility)を示し,以下によって定義される(上記論文の式(4)を参照)。
【0069】
【数3】
【0070】
2つのパラメータmjおよびpjはj番目の周波数帯域および難聴に依存するもので,それぞれ上述した論文における式(5)および(6)において定義されるものであり,1組のvパラメータが用いられ,その値は上記論文における表1から得られる。ここで補聴器周波数帯域の中央周波数に対応するvパラメータは線形補間を用いて見つけられる。
【0071】
関数SL(j)は,j番目の周波数帯域における信号の最大レベルと聴覚閾値レベルとの間の差を表す。SL(j)についての閉形式表現(closed form expression)はK(j)を考慮することで導出され,上記論文によると,一時変数Kiに等しく,ANSI標準の式(12)によって与えられ,mjが1に等しくかつpjが大きい場合に次のようになる。
【0072】
【数4】
【0073】
ここでE(j)は等価音声スペクトル・レベル(equivalent speech spectrum level)であり,DIS(j)は以下で与えられる等価外乱スペクトル・レベル(equivalent disturbance spectrum level)である。
【0074】
【数5】
【0075】
ここでZ(j)は等価マスキング・スペクトル・レベル(equivalent masking spectrum level)を表し,X(j)は等価内部雑音スペクトル・レベル(equivalent internal noise spectrum level)である。E(j),DIS(j),Z(j)およびX(j)についてのさらなる詳細はANSI S3.5- 1997に見ることができる。
【0076】
補聴器利得ベクトルに関する等価マスキング・スペクトル・レベルZ(j)の勾配の算出は,補聴器内においてリアルタイムに実行するにはかなりの処理装置の能力(パワー)を必要とする非常に複雑な数式(very complex expression)をもたらす。エネルギー総和近似(energy summation approximation)を用いることで,上記算出は補聴器内で実現可能になり,同時に十分に精度の高い算出が提供されることが分かっている。
【0077】
発明者はさらに,K(j)が,以下の電力関数(パワー関数)によって効果的に近似されることを見いだした。
【0078】
【数6】
【0079】
補聴器利得G(j)に関するK(j)の偏微分(partial derivative)は,さらなる近似を通じて次のように表現することができる。
【0080】
【数7】
【0081】
ここで,Pdiff(j)は以下のように与えられる。
【0082】
【数8】
【0083】
パラメータCjはパラメータmjおよびpjから導出されかつカーブフィット(curve fit)を用いて決定され,パラメータxjは以下によって与えられる。
【0084】
【数9】
【0085】
最終的に,i番目の周波数帯域における補聴器利得G(i)に関するSIIの偏微分は以下の式にしたがって近似することができる。
【0086】
【数10】
【0087】
変数B(i)およびC(i)は,それぞれANSI S3.5−1997のセクション4.3.2.2および4.3.2.3に定義されている。N(i)は等価雑音スペクトル・レベルであり,Fjはj番目の周波数帯域についての中心周波数であり,hiはi番目の周波数帯域についての最高周波数帯域制限(higher frequency band limit)である。これらの後者の変数に関するさらなる詳細は同様にANSI S3.5−1997に見ることができる。
【0088】
補聴器利得の関数としてSII尺度の上記勾配(すなわち偏微分)を算出する方法の変形例では,上記勾配についての式をなんらかのSII尺度から導出することができる。すなわち,ANSI標準において採用されている式を用いるだけとすることもできるし,これに代えてChingによる論文で用いられている式を組込むこともできる。
【0089】
図2による実施態様の変形例では,音声明瞭尺度の勾配だけを用いて利得ベクトルを最適化する方法は,一般に適切な聴取快適性を保証する何らかの方法,たとえば従来の音量モデルに基づく方法と組み合わせることができる。
【0090】
従来の音量モデルは一般に聴取快適性を保証するために有利であるが,補聴器ユーザの中には良好な聴取快適性と考えられるものに関して強い個々人の好みがあることがあり,したがって従来の音量モデルが最適な解決策とならないこともある。
【0091】
図2の実施態様によると,比例定数Kの値が0.5に設定され,利得増分値Gm,fがm=1について1dBに設定され,m=mmaxについて0.25dBとなるように次第に減少する。図2の実施態様の変形例では利得値増分Gm,fも周波数帯域fに依存する。
【0092】
上記アルゴリズムが進行して上記勾配の方向に1ステップ進む(takes a step)とき,1ステップが長すぎて最大値をオーバーシュートする,または上記ステップが不連続に交差すると,少しだけ悪いSIIで終わることができる(it can only end up with a worse SII)。ステップサイズが1dB以下の増加しないシリーズとして(as a non-increasing series with 1dB or less)選択される場合,連続するステップおよび最終ステップの間の差はほんの0.25dBであり,上記オーバーシュート問題は無視される。ほとんどの最適化法にとって不連続性は問題となるが,発明者は上記SII最適面が連続しており(the SII optimization surface is continuous),したがって考慮しなければならない不連続をなんら含まないことを見いだした。
【0093】
図2の実施態様の変形例では,比例定数Kに割り当てられる値が補聴器において現在動作している補聴器プログラムに依存する。このやり方では,音声明瞭度が重要である聴取状況(および対応する補聴器プログラム)においてはKの値を比較的大きくすることができ,聴取快適性が一番の関心事である状況においては比較的小さくすることができる。図2の実施態様のさらなる変形例では,上記比例定数Kに割り当てられる値が音環境分類器(sound environment classifier)によって制御され,これにより比例定数Kの自動的かつよりスムーズな変動を実現することができる。さらに他の変形例では,上記比例定数Kに割り当てられる値が補聴器ユーザの個々の好みに合わせられる。
【0094】
図2の実施例のさらに他の変形例では,上記勾配が,補聴器周波数帯域の選択されたナンバにおいてだけ修正される。
【0095】
このアルゴリズムは高速に収束し,SII利得ベクトルG 'の初期化をすべてのベクトル要素G’fをゼロに単に設定することによって実行できることが見いだされた。これは,音声最適化が有効でない状況と比較して,上記音声最適化ユニット8によって改善された音声明瞭度値が提供されることを常に認識することができるという,さらなる利点を有する。
【0096】
次に図3を参照して,図3は,聴取快適性を改善するために,音声最適化アルゴリズムにおいて用いられる減失利得ベクトルGpenを決定するために用いられる聴取快適性モデルのブロック図である。
【0097】
上記アルゴリズムに対する入力は,雑音の推定(推定雑音)201(estimate of the noise 200)および音声および雑音の結合の推定(推定結合音声および雑音)(estimate of the combined speech and noise)202 を含む。第1の加算点203 において,上記推定雑音201 の値が上記推定結合音声および雑音202の値から減算され,これにより音声のみの内容の推定が提供される。第2の加算点204において,音声のみの内容の推定の値が,スケルチ限界(squelch limit)を表すスケルチ定数(squelch constant)205から減算される。これによって上記会話のみ内容の推定の値が上記スケルチ限界を超えるときに,減失利得(すなわち負の利得)が適用されないこと(no penalty gain (i.e. a negative gain) will be applied)が保証される。上記第2の加算点204からの出力はMAXブロック206に与えられて,そこでゼロの値と比較されて,これにより上記MAXブロック206からの出力が正であることが保証される。上記MAXブロックから出力は次に第1の乗算点207の第1入力に与えられる。
【0098】
上記乗算点207への第2入力は,修正推定雑音(modified noise estimate)を表すアルゴリズムの第2分岐によって提供される。第3の加算点208 において,上記推定雑音201の値がオフセット限界(offset limit)を表すオフセット定数209から減算される。これにより上記推定雑音の値が上記オフセット限界未満のときに減失利得(すなわち負の利得)が適用されないことが保証される。上記第3の加算点208 からの出力が第2の乗算点210に与えられ,そこで第3の加算点208からの出力が調整定数値(constant conditioning value)211の乗算を通して調整される。その後調整された推定雑音がMINブロック212に与えられそこでゼロの値と比較され,これにより上記MINブロック212からの出力が負であることが保証される。上記MINブロック212からの出力は次に第1の乗算点207の第2入力に与えられる。
【0099】
上述したように,第1の乗算点207への2つの入力は常に反対の符号を持ち,したがって第1の乗算点207からの出力はゼロ以下となる。第1の乗算点207からの出力は第2のMAXブロック213に与えられ,そこで上記減失利得値215が取りうる最大の負の値(the largest negative value)を表す最小利得値214と比較される。上記第2のMAXブロック213からの出力が,図2を参照して説明した音声最適化アルゴリズムにおいて用いられる上記減失利得値215を表す。
【0100】
図3に記載のアルゴリズムによると,減失利得値は,常にゼロと上記最小利得値214によって与えられる負の値の間の範囲にある。推定雑音201が大きいほど上記減失利得値215がより負になる(more negative)ことが上記アルゴリズムから直接に導かれる。これによって,比較的高い雑音レベルを持つ周波数帯域はその全体の利得が低減され,これによりこの発明による音声最適化アルゴリズムを有する補聴器のユーザにとっての聴取快適性が促進する。さらに,上記アルゴリズムからは,上記推定雑音201の値と推定結合音声および雑音202の間の差が小さければ小さいほど上記減失利得値215がより負になることが導かれ,これにより比較的小さい音声内容だけを含む周波数帯域は,その全体の利得が低減され,これによってユーザにとっての聴取快適性がさらに改善する。
【0101】
図3の実施態様によるとすべての値がdBで与えられる。上記推定雑音201の値は10%パーセンタイルとして決定され,上記推定結合音声および雑音202の値は90%パーセンタイルとして決定される。上記スケルチ定数205およびオフ定数209の値はいずれも40dBに設定される。最小利得値214は−18dBに設定される。
【0102】
図3の実施態様の変形例では,上記雑音および音声の推定は,パーセンタイル以外の何らかの適切な推定手段によって決定することができ,上記パーセンタイルについての他の値を用いることができる。明白であるが,上記減失利得を決定するために用いられる定数もたとえば特定のユーザの好みに合うように変更することができる。
図1
図2
図3
【国際調査報告】