(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5864441
(24)【登録日】2016年1月8日
(45)【発行日】2016年2月17日
(54)【発明の名称】勾配周波数非線形振動子ネットワークにおける学習及び聴覚情景解析
(51)【国際特許分類】
G06N 3/04 20060101AFI20160204BHJP
G10L 15/16 20060101ALI20160204BHJP
【FI】
G06N3/04 190
G10L15/16
【請求項の数】13
【全頁数】13
(21)【出願番号】特願2012-551347(P2012-551347)
(86)(22)【出願日】2011年1月28日
(65)【公表番号】特表2013-518355(P2013-518355A)
(43)【公表日】2013年5月20日
(86)【国際出願番号】US2011023020
(87)【国際公開番号】WO2011094611
(87)【国際公開日】20110804
【審査請求日】2014年1月27日
(31)【優先権主張番号】61/299,768
(32)【優先日】2010年1月29日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】512197825
【氏名又は名称】サーキュラー ロジック リミテッド ライアビリティ カンパニー
(73)【特許権者】
【識別番号】512197836
【氏名又は名称】フロリダ アトランティック ユニバーシティ リサーチ コーポレイション
(74)【代理人】
【識別番号】100092093
【弁理士】
【氏名又は名称】辻居 幸一
(74)【代理人】
【識別番号】100082005
【弁理士】
【氏名又は名称】熊倉 禎男
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【弁理士】
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100109335
【弁理士】
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【弁理士】
【氏名又は名称】近藤 直樹
(72)【発明者】
【氏名】ラージ エドワード ダブリュ
【審査官】
多胡 滋
(56)【参考文献】
【文献】
米国特許第07376562(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00−3/08
G10L 15/16
(57)【特許請求の範囲】
【請求項1】
ニューラルネットワークにおける非線形振動子間の接続を学習するための方法であって、
共通の入力に応答して互いに周波数が別個のそれぞれの振動をそれぞれが生成する、複数の非線形振動子を準備するステップと、
前記複数の非線形振動子の少なくとも第1の振動子において入力を受信するステップと、
前記複数の非線形振動子の少なくとも第2の振動子において入力を受信するステップと、
ある時点における前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動とを比較するステップと、
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間に複数周波数位相コヒーレンシーがあるかどうか判定するステップと、
前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅及び位相のうちの少なくとも一方を、前記の少なくとも第2の振動子の振動と前記の少なくとも第1の振動子との間の前記複数周波数位相コヒーレンシーの関数として変更するステップと、
を含むことを特徴とする方法。
【請求項2】
前記接続が
【数1】
として表わされ、ここで、c
ijは任意の2つの非線形振動子間の接続の大きさ及び位相であり、δ及びkは接続の変化の速度を表わすパラメータであり、zは前記2つの接続された振動子の複素数値の状態変数であることを特徴とする請求項1に記載の方法。
【請求項3】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子との間にコヒーレンシーがある場合に、前記の少なくとも第1の振動子と前記第2の振動子との間の進行中の位相関係を反映するように前記接続の位相を調整するステップをさらに含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間にコヒーレンシーがない場合に、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を低減させるステップをさらに含むことを特徴とする請求項1に記載の方法。
【請求項5】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間にコヒーレンシーがある場合に、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を増大させるステップをさらに含むことを特徴とする請求項1に記載の方法。
【請求項6】
ニューラルネットワークにおける非線形振動子間の接続を学習するための方法であって、
共通の入力に応答して互いに周波数が別個のそれぞれの振動をそれぞれが生成する、複数の非線形振動子を準備するステップと、
前記複数の非線形振動子の少なくとも第1の振動子において入力を受信するステップと、
前記複数の非線形振動子の少なくとも第2の振動子において入力を受信するステップと、
ある時点における前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動とを比較するステップと、
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間に複数周波数位相コヒーレンシーがあるかどうか判定するステップと、
前記の少なくとも第1の振動子の振動が、前記の少なくとも第2の振動子の前記周波数の振動と実質的に複数周波数位相コヒーレントである場合、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を増大させるステップと、
を含むことを特徴とする方法。
【請求項7】
前記接続が
【数2】
として表わされ、ここで、c
ijは任意の2つの非線形振動子間の接続の大きさ及び位相であり、δ及びkは接続の変化の速度を表わすパラメータであり、zは前記2つの接続された振動子の複素数値の状態変数であることを特徴とする請求項6に記載の方法。
【請求項8】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子との間にコヒーレンシーがある場合に、前記の少なくとも第1の振動子と前記の第2の振動子との間の進行中の位相関係を反映するように前記接続の位相を調整するステップをさらに含むことを特徴とする請求項1に記載の方法。
【請求項9】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間にコヒーレンシーがない場合に、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を減少させるステップをさらに含むことを特徴とする請求項に記載の方法。
【請求項10】
聴覚情景解析を行うための方法であって、
共通の入力に応答して互いに別個のそれぞれの振動をそれぞれが生成する、複数の非線形振動子を準備するステップと、
前記複数の非線形振動子の少なくとも第1の振動子において入力を受信するステップと、
前記複数の非線形振動子の少なくとも第2の振動子において入力を受信するステップと、
ある時点における前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動とを比較するステップと、
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間に複数周波数位相コヒーレンシーがあるかどうか判定するステップと、
前記の少なくとも第1の振動子の振動が前記の少なくとも第2の振動子の振動と複数周波数位相コヒーレントである場合に、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を増大させるステップと、
を含むことを特徴とする方法。
【請求項11】
前記接続が
【数3】
として表わされ、ここで、c
ijは任意の2つの非線形振動子間の接続の大きさ及び位相であり、δ及びkは接続の変化の速度を表わすパラメータであり、zは前記2つの接続された振動子の複素数値の状態変数であることを特徴とする請求項10に記載の方法。
【請求項12】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子との間にコヒーレンシーがある場合に、前記の少なくとも第1の振動子と前記の第2の振動子との間の進行中の位相関係を反映するように前記接続の位相を調整するステップをさらに含むことを特徴とする請求項10に記載の方法。
【請求項13】
前記の少なくとも第1の振動子の振動と前記の少なくとも第2の振動子の振動との間にコヒーレンシーがない場合に、前記の少なくとも第1の振動子と前記の少なくとも第2の振動子との間の接続の振幅を低減させるステップをさらに含むことを特徴とする請求項10に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号入力の知覚及び認識に向けられ、より具体的には、人間の耳及び脳の働きをより忠実に模倣する方式で、構造化された音声信号の非線形周波数解析を提供するための信号処理方法及び装置に向けられる。
(連邦政府後援による研究又は開発)
米国政府は、空軍科学研究局とCircular Logic,LCCとの間の契約番号FA9550−07−C0095、及び、空軍科学研究局とCircular Logic,LCCとの間の契約番号FA9550−07−C−0017に従って、本発明における権利を有する。
(関連出願の相互参照)
本出願は、2010年1月29日に出願された米国特許仮出願第61/229,768号全体に基づく優先権を主張する。
【背景技術】
【0002】
入力音声信号を処理するために非線形振動子のアレイを用いることは、Edward W.Largeに交付された特許文献1(Large)から当該技術分野において公知である。
【0003】
人間の耳は、異なる周波数に同調された複数の振動子としてモデル化されてきた。脳は、必要に応じて振動子の対を接続することによって振動子からのこれらの入力を処理して、音の入力を解釈する。世界中で自然に発生する音声の音は複合信号であるので、その結果として、発達した人間の耳は、振動子間のこれらの接続を利用する複雑なプロセッサである。性質上、振動子間の接続は変化し続けており、接続パターンは、繰り返される入力に対する学習された応答である。この結果、シナプス前細胞とシナプス後細胞との間のシナプス効率が増大する。2つの振動子間の接続は、強度(振幅)及び自然位相の両方を有することも、従来技術のモデル化から公知である。
【0004】
非線形振動子のネットワークを用いて信号を処理することは、一般に、Largeから公知である。非線形共振は、線形共振においては観察されない多様な挙動をもたらす(例えば、神経振動)。さらに、性質上、振動子は、複雑なネットワークに接続することができる。
図1は、音響信号を処理するために用いられる典型的なアーキテクチャを示す。これは、勾配・周波数非線形振動子ネットワーク(GFNN)と呼ばれる、非線形振動子の一次元アレイの層のネットワーク100からなる。
図1において、GFNNは、層1(入力層)における蝸牛(102)、層2における背側蝸牛神経核(DCN)(104)、及び層3における下丘(106)(ICC)による聴覚処理をシミュレートするように、処理層に配置される。生理学的観点からは、非線形共振は、蝸牛における外有毛細胞の非線形性、並びに、DCN及びICC上での位相が固定された神経応答をモデル化する。信号処理の観点からは、多重GFNN層による処理は冗長ではなく、情報は、非線形性により各層において付加される。
【0005】
より具体的には、
図2に示されるように、例示的な非線形振動子システムは、非線形振動子405
1、405
2、405
3...405
Nのネットワーク402から構成される。入力刺激層401は、刺激接続の集合403を通して、入力信号をネットワーク402に伝達することができる。この点について、入力刺激層401は、1つ又はそれ以上の入力チャネル406
1、406
2、406
3...406
cを含むことができる。入力チャネルは、従来の周波数解析により与えられるように、多周波入力の単一チャネル、多周波入力の2つ又はそれ以上のチャネル、又は、単一周波入力の多重チャネルを含むことができる。従来の周波数解析は、線形方式(当該技術分野で周知の方法である、フーリエ変換、ウェーブレット変換、又は線形フィルタバンク)、又は、同じタイプの別のネットワークのような、別の非線形ネットワークを含むことができる。
【0006】
図2に示されるようにC個の入力チャネルを想定すると、Largeから公知であるように、チャネル406
C上での時間tにおける刺激はx
c(t)と表され、刺激接続403の行列は、特定の共振について、入力チャネル406cから振動子405
Nへの接続の強度として解析することができる。特に、接続行列は、これらの刺激接続の1つ又はそれ以上の強度がゼロと等しくなるように選択することができる。
【0007】
再び
図2を参照すると、内部ネットワーク接続404は、ネットワーク402内の各振動子405
Nが他の振動子405
Nとどのように接続されているかを定める。Largeから公知であるように、これらの内部接続は、次に説明するように、各々が特定の共振についての1つの振動子405
Mから別の振動子405
Nへの接続の強度を記述する、複素数値パラメータの行列として表すことができる。
【0008】
Largeから公知であるように、非線形振動子のネットワークによる信号処理を行って、耳の応答を広範に模倣することができる。これは、線形フィルタのバンクによる信号処理と同様であるが、重要な違いは、処理ユニットが、線形ではなく、非線形の振動子であるということである。本節において、この手法を、線形の時間・周波数解析と比較することによって説明する。
【0009】
一般的な信号処理操作は、例えばフーリエ変換による、複合入力信号の周波数分解である。しばしば、この操作は、入力信号x(t)を処理する線形帯域通過フィルタのバンクを介して達成される。例えば、広範に用いられている蝸牛のモデルは、ガンマトーン・フィルタバンク(Pattersonら、1992年)である。本発明者らのモデルとの比較のために、一般化は、微分方程式
【数1】
として記述することができ、ここで、上のドットは時間に関する微分(例えば、dz/dt)を表し、zは複素数値の状態変数であり、ωは角振動数であり(ω=2πf、fはHzで表される)であり、α<0は、線形減衰パラメータである。x(t)の項は、時間と共に変化する外部信号による線形フォーシング(forcing)を示す。zはあらゆる時間tにおいて複素数であるので、振幅r及び位相φに関するシステムの挙動を明らかにする極座標で書き直すことができる。線形システムにおける共振は、そのシステムが刺激の周波数で振動し、振幅及び位相はシステムのパラメータによって決まることを意味する。刺激の周波数ω
0が振動子の周波数ωに近づくにつれて、振動子の振幅rが大きくなり、帯域通過フィルタリング挙動がもたらされる。
【0010】
近年、外有毛細胞の非線形応答をシミュレートする蝸牛の非線形モデルが提案されている。外有毛細胞は、蝸牛の、静かな音に対する極度の感度、優れた周波数選択性、及び振幅圧縮に関与すると考えられていることに留意することが重要である(例えば、Eguiluz、Ospeck、Choe、Hudspeth、及びMagnasco、2000年)。これらの性質を説明する非線形共振モデルは、非線形振動についてのHopfの正規形に基づいたものであり、通則的(generic)である。正規形(切捨て)モデルは、
【数2】
の形を有する。
【0011】
この形と方程式1の線形振動子との間の表面的な類似性に留意されたい。ここでもまた、ωは角振動数であり、αはやはり線形減衰パラメータである。しかしながら、この非線形定式化では、αは、正及び負の両方の値、並びにα=0となり得る、分岐パラメータとなる。値α=0は、分岐点と呼ばれる。β<0は、α>0のときに振幅が突然大きくなるblowing up)ことを防ぐ非線形減衰パラメータである。ここでもまたx(t)は、外部信号による線形フォーシングを表す。h.o.t.の項は、正規形モデルにおいて切り捨てられた(すなわち、無視された)、非線形展開の高次項を表す。線形振動子と同様に、非線形振動子は、聴覚刺激の周波数との共振に達し、その結果として、それ自体の周波数に近い刺激に対して最大に応答するという点で、ある種のフィルタリング挙動をもたらす。しかしながら、非線形モデルは、弱い信号に対する極度の感度、振幅圧縮及び高い周波数選択性のような、線形モデルが対処しない挙動に対処するという重要な違いがある。圧縮ガンマチャープ・フィルタバンクは、方程式2と同様の非線形挙動を示すが、信号処理のフレームワーク内で定式化される(Irino及びPatterson、2006年)。
【0012】
Largeは、異なる周波数の振動子間の結合を可能にするために、方程式2の高次項を展開することを教示する。これは、非線形振動子の勾配周波数ネットワークの効率的な計算を可能にし、テクノロジーに対する改善をもたらす。出願人の同時係属中の特許出願番号__から知られるように、正準(canonical)モデル(方程式3)は、正規形(方程式2、例えば、Hoppensteadt及びIzhikevich、1997年を参照)に関連するが、根底にある、より現実的な振動子モデルが、切り捨てられるのではなく、完全に展開されるので、Hopfの正規形モデルが及ばない特性を有する。高次項の完全な展開は、以下の形のモデルを生成する。
【数3】
【0013】
方程式3は、n個の非線形振動子のネットワークを記述する。ここでもまた、以前のモデルとの表面的な類似性が存在する。パラメータω、α及びβ
1は、切捨てモデルのパラメータに対応する。β
2は、付加的な振幅圧縮パラメータであり、cは、外部刺激に対する結合の強度を表わす。2つの周波数離調パラメータδ
1及びδ
2は、この定式化における新たなものであり、振動子の周波数を振幅に依存させる(
図3C参照)。パラメータεは、システムにおける非線形性の量を制御する。最も重要なことは、刺激に対する結合が非線形であり、受動部Ρ(ε,x(t))及び能動部
【数4】
を有し、非線形共振を生成することである。
【0014】
上記方程式3は、一般に、時間と共に変化する入力信号x(t)に関して記述される。ここで、x(t)は、入力音源信号とすることもでき、又は、同じネットワーク内の他の振動子若しくは他のネットワーク内の振動子からの入力とすることもできる。後者の幾つかの例が
図1に示されており、「内部結合」、「求心性結合」、及び「遠心性結合」と表示されている。このような場合、x(t)は、接続値の行列に振動子の状態変数のベクトルを乗算することにより得られ、勾配周波数ニューラルネットワークを表わす。方程式3は、これらの異なる入力を考慮に入れるが、説明を簡単にするために、単一の汎用の入力源x(t)を含むものとする。このシステム、特に非線形結合式の構築は、同時係属中の特許出願番号__に詳細に記載されている。
【先行技術文献】
【特許文献】
【0015】
【特許文献1】米国特許第7,376,562号明細書
【発明の概要】
【発明が解決しようとする課題】
【0016】
非線形振動子のネットワークの挙動についてのLargeの方法及びシステムは、複合音声信号に対する耳の応答の複雑さを、従来技術の線形モデルよりも忠実に模倣する。しかしながら、聴覚系とは異なり、振動子対間の接続を学習することはできないので、振動子の中でどの接続が最も重要であるかを判断するためには、入力音声信号についての情報を前もって知らなければならない。Largeは、
図1に示すように、勾配周波数非線形振動子ネットワーク内及びネットワーク間の振動子の接続を可能にする。しかしながら、これは、所望のネットワーク挙動をもたらすために、手動で接続を設計することを必要とする。要するに、Largeのシステムは、その接続パターンが動的ではなく静的である。
【課題を解決するための手段】
【0017】
異なる振動子アレイの非線形振動子内及び非線形振動子間の接続が、音声入力信号に対する受動露出を通じて学習される方法が、提供される。入力に応答して互いに別個の振動をそれぞれが生成する複数の非線形振動子が、準備される。各振動子は、少なくとも1つの他の振動子に接続することが可能である。少なくとも第1の振動子において入力が検出される。少なくとも第2の振動子において入力が検出される。ある時点における少なくとも第1の振動子の振動と少なくとも第2の振動子の振動とが比較される。第1の振動子の振動と第2の振動子の振動とがコヒーレントである場合、少なくとも第1の振動子と少なくとも第2の振動子との間の接続の振幅を増大させ、これら2つの間の進行中の位相関係を反映するように位相が調整される。少なくとも第1の振動子の振動と少なくとも第2の振動子の振動とがコヒーレントではない場合、これら2つの間の接続の振幅を低減させ、位相を調整することができる。
【0018】
本発明のその他の目的、特徴、及び利点は、記載された説明及び図面から明らかとなろう。
【図面の簡単な説明】
【0019】
【
図1】非線形ニューラルネットワークの基本構造を示す図である。
【
図1A】非線形振動子についての類似のニューロン振動子応答の概略図である。
【
図2】本発明による非線形ネットワークの基本構造及び入力信号に対するその関係を示す、さらに別の図である。
【
図3A】本発明による複合音調及び振動子ネットワークの応答のグラフ図である。
【
図3B】本発明による複合音調及び振動子ネットワークの応答のグラフ図である。
【
図4A】本発明による学習プロセスの出力のグラフ図である。
【
図4B】本発明による学習プロセスの出力のグラフ図である。
【
図4C】本発明による学習プロセスの出力のグラフ図である。
【
図4D】本発明による学習プロセスの出力のグラフ図である。
【
図5】本発明による非線形振動子のネットワークを動作させるための学習アルゴリズムのフローチャートである。
【発明を実施するための形態】
【0020】
本発明は、信号に対する受動露出を通して、ネットワーク内及び異なるネットワーク間の振動子間の接続を自動的に学習することができる方法を提供する。
【0021】
脳において、ニューロン間の接続は、Hebbの学習により改変することができ(Hoppensteadt及びIzhikevich、1996年b)、シナプス前ニューロン及びシナプス後ニューロンの繰り返される持続的な同時活性化が、それらの間のシナプス効力を増大させるシナプス可塑性の機構を提供する。神経系における学習についての従前の解析は、2つの振動子間の接続が強度及び自然位相の両方を有することを明らかにしている(Hoppensteadt及びIzhikevich、1996年a、1997年)。Hebbの学習則は、神経振動子に対して提案され、単周波の事例がある程度詳しく研究されている。近共振(near−resonant)関係がそれらの自然周波数間に存在する場合には、接続の強度及び位相の両方をHebbの機構により学習することができる(Hoppensteadt及びIzhikevich、1996年b)。しかしながら、現行のアルゴリズムは、自然周波数の比が1:1に近い振動子間の接続のみを学習する。1:1の場合には、Hebbの学習則の正準バージョンは、以下のように記述することができる(Hoppensteadt及びIzhikevich、1996年b)。
【数5】
【0022】
ここで、c
ijは複素数であり、ある時点における任意の2つの振動子間の接続の大きさ及び位相を表わし、δ
ij及びk
ijは、接続の変化の速度を表わすパラメータである。変数z
i及びz
iは、上記から既知であるように、c
ijにより接続された2つの振動子の複素数値の状態変数である。
【0023】
上記モデルは、本実施形態における例として、周波数比が1:1に近い2つの振動子についての振幅(強度)及び位相情報の両方を学習することができる。異なる周波数の振動子が通信する本発明については、異なる周波数の振動子間の接続を学習するための方法を特定することが必要とされる。
【0024】
本特許は、異なる周波数の振動子間の接続を学習することができるHebbの学習機構を説明する。学習アルゴリズムの改変により、聴覚情景解析を可能にする多周波位相コヒーレンスの尺度を提供する。
【0025】
多周波ネットワークは、高次共振を呈示し、本発明者らのアルゴリズムはこれに基づくものである。以下の学習則は、本発明者らの正準ネットワークにおける高次共振関係の学習を可能にし、
【数6】
ここで、無限級数を合計すると
【数7】
に到達し得る。
【0026】
学習アルゴリズムの挙動を例証するために、
図3Aに示される2つの複合定常状態音調からなる刺激を生成した。音調1は、周波数500Hz、1000Hz、1500Hz、2000Hz、及び2500Hzからなる高調波複合体とした。音調2は、非限定的な例として、周波数600Hz、1200Hz、1800Hz、2400Hz、及び3000Hzからなる高調波複合体とした。非線形振動子の3層のネットワークが、この音の混合体を処理した。振動子のネットワークの層1及び層2は、臨界パラメータ体制(すなわち、α=0)で動作し、層3は、アクティブ・パラメータ体制(すなわち、α>0)で動作した。パラメータβ
1は、層1についてはβ
1=−100、層2についてはβ
1=−10、層3についてはβ
1=−1と設定した。非限定的な例として、その他のパラメータは、対照として、β
2=−1、δ
1=δ
2=0、ε=1とした。この刺激に対する層3のネットワークの応答(時間の関数としての振動子振幅|z|)を
図3Bに示す。
【0027】
ここで、学習プロセスのフローチャートが提示される
図5を参照する。第1のステップ502において、各々が互いに別個の振動を生成する複数の非線形振動子が準備される(例としてネットワーク400に示されるように)。各振動子405
1−406
cは、それ自身の層401、402、又はその次に高次の隣接層のどちらかの中の任意の他の振動子との接続を形成することが可能である。しかしながら、説明を簡単にするために、本明細書において用いられるネットワークは、もっぱらアレイ102又は402のような振動子の個々の線形アレイに対応する。
【0028】
ステップ504で、複数の非線形振動子402のうちの少なくとも1つの振動子405
Mにおいて、振動子405
Mにおける振動を生じさせる入力が検出される。ステップ506で、複数の振動子402の第2の振動子、例として405
Nにおいて、第2の振動子405
Nの振動を生じさせる入力が検出される。入力及び/又は振動の値はゼロであってもよく、又は、それぞれの振動子の自然振動周波数であってもよいことを理解されたい。ステップ508で、ある時点において、振動子405
Mの振動が第2の振動子405
Nの振動と比較される。比較は、振動周波数の比較とすることができる。ステップ510において、振動子405
Mの振動と第2の振動子405
Nの振動とがコヒーレントであるかどうかが判定される。
【0029】
振動がコヒーレントである場合、ステップ512において、少なくとも1つの振動子と第2の振動子との間の接続の振幅を増大させ、2つの振動子405
M、405
N間の進行中の位相関係を反映するように位相が調整される。ステップ510において、振動子405
Mと振動子405
Nの振動がコヒーレントではないと判定された場合には、その接続をゼロに向かって駆動させるように接続の振幅を低減させ、位相を調整することができる。システム400に対する入力がある限り、プロセスは、ステップ516において反復され、ステップ504に戻る。
【0030】
図5に関連して上で論じた学習アルゴリズムを非同期的に(すなわち、ネットワークを走らせた後で)実装し、非限定的な例として、振動子のPCNアレイによって生成されるネットワーク神経層の出力の最後の10ミリ秒を処理した。学習の結果を
図4に示す。パネルAは、最後の10ミリ秒にわたって平均した、振動子ネットワークの振幅応答を示す。反時計回りに読むと、パネルB及びCは、接続行列の振幅及び位相を示す。振幅行列(パネルB)において、500Hz及び600Hzの振動子に対応する行におけるピークが異なる。これらのピークは、関連した時間スケールにわたって、その活動度が、注目する振動子(500Hz及び600Hz)と位相コヒーレントである振動子を識別する。パネルDは、振幅行列(パネルB)の2つの行に注目し、振幅を周波数の関数として示す。500Hz振動子に関連付けられた振動子(500、1000、1500、2000及び2500に近い周波数を有する振動子)は、600Hz振動子に関連付けられた振動子(600、1200、1800、2400及び3000に近い周波数を有する振動子)とは異なる。パネルDの上部及び下部は、2つの異なる源、音調1及び音調2の成分を明らかにする。従って、この学習方法は、2つの異なる源が同時に存在する場合でも、妥当な結果を生成する。
【0031】
聴覚情景解析は、脳が、音を知覚的に意味のある要素に編成するプロセスである。聴覚情景解析は、学習アルゴリズムと根本的には同じであるが、異なる時間スケールで動作するアルゴリズムに基づくものとすることができる。学習アルゴリズムは、ゆっくりと動作し、時間、日又はさらにそれより長い時間スケールにわたって振動子間の接続性を調整する。聴覚情景解析アルゴリズムは、数十ミリ秒から数秒の時間スケールにわたってすばやく動作する。時間スケールは、方程式5及び6のパラメータδ
ij及びk
ijを調整することによって調整される。
【0032】
図4は、聴覚情景解析プロセスの結果として解釈することもできる。既に述べたように、パネルAは、最後の12.5ミリ秒にわたって平均された、振動子ネットワークの振幅応答を示す。だが、この解釈の下では、パネルB及びCは、聴覚情景解析行列の振幅及び位相を示す。振幅行列(パネルB)において、500Hz振動子及び600Hz振動子に対応する行におけるピークが異なる。これらのピークは、関連した時間スケールにわたって、その活動度が、注目する振動子(500Hz及び600Hz)と位相コヒーレントである振動子を識別する。パネルDは、振幅行列(パネルB)の2つの行に注目し、振幅を周波数の関数として示す。500Hz振動子に関連付けられた振動子(500、1000、1500、2000及び2500に近い周波数を有する振動子)は、600Hz振動子に関連付けられた振動子(600、1200、1800、2400及び3000に近い周波数を有する振動子)とは異なる。パネルDは、2つの異なる源、音調1(黒)及び音調2(灰色)の成分を明らかにする。従って、多周波コヒーレンスを検出することにより聴覚情景解析行列を計算するこの方法は、周波数成分を異なる源に分離する。この方法は、源に従って音成分を分離し、音成分のコヒーレント・パターンを認識することが可能である。
【0033】
上で論じたように挙動する非線形振動子のネットワークを提供することにより、人間の耳及び脳の働きをより忠実に模倣する方式の信号解析が可能になる。当業者により、記載された本発明の好ましい実施形態に対して詳細の改変、変形及び変更を行うことができることが理解されよう。従って、上記の説明及び添付の図面に示されるすべての事項は、例示的なものとして解釈されるべきであり、限定的な意味で解釈されるべきではないことが意図される。それゆえ、本発明の範囲は、添付の特許請求の範囲により定められる。
【符号の説明】
【0034】
100、400:システム(ネットワーク)
401:入力刺激層
402:振動子アレイ(ネットワーク)
403:刺激接続
404:内部ネットワーク接続
405:非線形振動子
406:入力チャネル