【文献】
雨森賢一,他1名,短い時間のずれによってコードされた時系列の教師なし学習,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1998年 7月27日,第98巻,第219号,pp.93-100
【文献】
加藤秀行,他1名,STDP学習則により形成されるニューラルネットワークの構造解析,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2007年 4月18日,第107巻,第21号,pp.13-18
【文献】
前田正浩,階層的人工ニューラルネットワークシミュレータ“Sphincs”の開発,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2004年 1月19日,第103巻,第601号,pp.25-29
(58)【調査した分野】(Int.Cl.,DB名)
前記第2の興奮性スパイキング電子ニューロンおよび前記第1の抑制性スパイキング電子ニューロンが、イベント間の因果律に従う関連付けを検出して前記記憶した時空パターンを検索するために、側方抑制およびスパイク駆動学習則によって勝者総取りプロセスを実行する、請求項3に記載の方法。
前記学習則に基づいて、第1の興奮性スパイキング電子ニューロンが前記入力データ・ストリームによって活性化されることに応じて、接続された第2の興奮性スパイキング電子ニューロンをトリガし、前記第1の興奮性スパイキング電子ニューロンと前記第2の興奮性スパイキング電子ニューロンとの間の接続のコンダクタンスを強化するステップを更に含む、請求項4に記載の方法。
前記学習則に基づいて、第2の興奮性スパイキング電子ニューロンが1つ以上の第1の興奮性スパイキング電子ニューロンによってトリガされることに応じて、接続された第1の抑制性スパイキング電子ニューロンをトリガし、前記第2の興奮性スパイキング電子ニューロンに抑制信号を返信し、ある時間期間だけ前記第2の興奮性スパイキング電子ニューロンによる更に別のアクティビティを抑制するステップを更に含む、請求項5に記載の方法。
前記学習則に基づいて、最近トリガされた第2の興奮性スパイキング電子ニューロンのアクティビティの後に接続された第1の興奮性スパイキング電子ニューロンのアクティビティが発生することに応じて、前記第1および第2の接続された興奮性スパイキング電子ニューロン間の前記接続のコンダクタンスを弱くするステップを更に含む、請求項6に記載の方法。
前記学習則に基づいて、接続された第1の興奮性スパイキング電子ニューロンの短期間後に第2の興奮性スパイキング電子ニューロンが発火することに応じて、前記第1および第2の接続された興奮性スパイキング電子ニューロン間の前記接続のコンダクタンスを強化するステップを更に含む、請求項5に記載の方法。
【発明を実施するための形態】
【0011】
本発明の実施形態は、時空パターンを記憶し検索するように構成された連想メモリのためのカノニカル・スパイキング回路を含むニューラル・システムを提供する。
【0012】
本明細書において用いる場合、「電子ニューロン」という言葉は、生物学的ニューロンをシミュレーションするように構成されたアーキテクチャを表す。電子ニューロンは、生物学的な脳のニューロンと概ね機能的に同等である処理要素間の接続を生成する。このため、本発明の実施形態に従った電子ニューロンを含むニューラル・システムは、生物学的ニューロン上をモデル化した様々な電子回路を含むことができる。更に、本発明の実施形態に従った電子ニューロンを含むニューラル・システムは、生物学的ニューロンをモデル化した様々な処理要素(コンピュータ・シミュレーションを含む)を含むことができる。電子回路を含む電子ニューロンを用いて、本発明のいくつかの例示的な実施形態を以下で説明するが、本発明は電子回路に限定されない。本発明の実施形態に従ったニューラル・システムは、アナログまたはデジタル回路を含む神経形態アーキテクチャとして、更にコンピュータ・シミュレーションとして実施することができる。実際、本発明の実施形態は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態、またはハードウェアおよびソフトウェアの要素の双方を含む実施形態の形をとることができる。
【0013】
本発明に従ったカノニカル・スパイキング・ニューロン・システムの一例のアーキテクチャは、複数層のニューロンを含み、更に、それらの間のシナプス接続および学習則を含む。かかるシステムは、従来のコンピュータ・システム上でのシミュレーション、または様々な異なるハードウェア・スキームによる実施等の異なる方法で実施することができ、その1つは、スパイク・タイミング依存可塑性(一例として以下で更に説明する)を提供するシナプス・クロスバー・アレイを含む。
【0014】
本発明の一実施形態は、連想メモリ・タイプの教師なしパターン認識システムを実施するスパイキング電子ニューロン超小型回路を含む。連想メモリはデータ記憶デバイスを意味し、明示されたアドレスでなく情報内容に基づいて記憶したメモリを識別する。(明示されたアドレスとは対照的に)メモリ内容に対して直列または並列にアクセスすることによって連想メモリからデータを検索することができ、この場合、所望の1つ以上の一致のセットが見つかるまでメモリの情報内容を照会と比較する。
【0015】
本発明の一実施形態によれば、パターン認識システムは、時空パターンを記憶し連想的に想起するように構成されたメモリ超小型回路においてスパイキング電子ニューロンを相互作用させるアセンブリを含む。学習則は、記憶されるパターンの関数として、電子ニューロン間のシナプス相互接続の強度を提供(記述)する。例えば、学習則は、記憶されるパターンの関数として、電子ニューロン間のシナプス相互接続のコンダクタンスのレベルを提供する。
【0016】
本発明の一実施形態によれば、教師なしパターン認識システムは、明示的な外部命令機構なしでパターン認識タスクを実行する。このシステムは、パターンの明示的な記述を必要としない。このため、パターンが明確な時空構造および統計データを有する限り、パターンの意味内容は重要でない。時空パターンを含む入力データ・ストリームが与えられると、システムは、パターンの存在を検出すること、パターンを抽出および記憶することを学習するが、検出するパターンに関する情報を前もって与える必要はない。システムは、記憶したパターンの断片的なバージョンまたはノイズの多いバージョンあるいはその両方が提示された場合にメモリから適切な一致パターンを検索することができるように、パターンを記憶する。
【0017】
時空パターンに加えて、入力データ・ストリームは一般的にあるレベルのノイズを含む場合がある。パターン認識システムは、リアルタイムでまたはオンラインでパターン認識を実行し、入来情報を処理するための別個の
手段を必要としない。システムにデータ・ストリームが供給されると、システムはリアルタイムで入来情報を処理する。本発明の一実施形態において、システム・アーキテクチャはモジュール式でスケーラブルであり、単一の簡素化されたアーキテクチャを用いながら、多数の空間的および時間的規模で組み合わされた性質の問題に適している。
【0018】
ここで
図1を参照すると、本発明の一実施形態に従ったニューラル・システム10のネットワーク・アーキテクチャの図が示されている。システム10は、興奮性スパイキング電子ニューロンの2つのレイヤE1およびE2と、抑制性スパイキング電子ニューロンのレイヤI2と、を含む。E1レイヤは入力レイヤとして機能し、E2レイヤは処理レイヤとして機能する。レイヤI2は、
図3に関連付けて以下で更に記載するような勝者総取り(WTA:winner−take−all)機構を実施する。
【0019】
一般に、興奮性スパイキング電子ニューロンは、そのターゲット・ニューロンを発火しやすくし、抑制性スパイキング電子ニューロンは、そのターゲットを発火しにくくする。スパイキング電子ニューロンの様々な実施を利用することができる。一般に、かかるニューロンはカウンタを含み、これは、ソースの興奮性ニューロンからの入力が受信されると値が上昇し、ソースの抑制性ニューロンからの入力が受信されると値が低下する。上昇または低下の量は、ソース・ニューロンからターゲット・ニューロンへの接続(例えば可変抵抗器によってモデル化されたシナプス接続)の強度に依存する。カウンタがある閾値に達すると、ニューロンはそれ自身のスパイクを発生し(すなわち発火し)、カウンタは基準値にリセットされる。以降、スパイキング電子ニューロンという言葉を「電子ニューロン」とする。
【0020】
電子ニューロンは以下のように相互接続される。
図2は、ニューラル・システム10の更に詳細な図を示す。レイヤE1における電子ニューロン12(すなわちNE1)のポピュレーションがレイヤE2における電子ニューロン14(すなわちNE2)に接続され、電子ニューロン14が電子ニューロン14に接続されて示されている。更に、レイヤE2における電子ニューロン14はレイヤI2における電子ニューロン16(すなわちNI2)に接続され、電子ニューロン16は電子ニューロン14に接続されている。ニューロン接続モデルは一般的なものであり、望ましい連想データ記憶/検索機能に従って調整することができる。典型的には、多数のニューロンに対して接続を行い、E1およびE2レイヤは多数のニューロンを含む。
【0021】
時空パターンおよびノイズの多い入力を含む入力ストリームは、E1レイヤに供給され、ここでE1レイヤにおける電子ニューロン12のスパイキング・アクティビティをトリガする。このスパイキング・アクティビティはE2レイヤの電子ニューロン14へと順方向に伝播する。従って、入力データ・ストリームにおける時空パターンの存在は、レイヤE1の電子ニューロン12において対応する時空スパイキング・アクティビティ画像を生成する。E1レイヤから接続されているため、インプリントされた時空スパイキング画像の影響の領域内にあるE2レイヤのあらゆる電子ニューロン14が、一定の興奮性信号レベルを受信する。
【0022】
図3は、本発明のこの実施形態に従った、
図1および
図2に示したニューラル・システム10の動作の方法20を示すフローチャートである。
図3のプロセス・ステップは純粋に線形ではなく、E1レイヤ電子ニューロンは常に入力を受信しており、E2およびI2レイヤ電子ニューロンはその入力に応じていかなる時点でも発火する可能性がある。
図3を参照すると、ステップ21において、1つ以上のE1レイヤ電子ニューロン12が入力ストリームによって活性化される。ステップ22において、かかるアクティビティはE2レイヤ電子ニューロン14をトリガすることができる。E2レイヤにおけるニューロン・アクティビティが、E1レイヤにおけるニューロン・アクティビティ後の短期間(例えば約50ms)内に起こった場合、ステップ23において、かかる電子ニューロン12および14間の接続は自動的に強化される(すなわちニューロン12および14間のシナプス接続のコンダクタンスが上昇する)。
【0023】
いったんE2レイヤ電子ニューロン14が(1つ以上のE1レイヤ電子ニューロン12によって)トリガされたら、ステップ24において、トリガされたE2レイヤ電子ニューロン14は1つ以上のI2レイヤ電子ニューロン16のアクティビティをトリガする。ステップ25において、これはE2レイヤに強い抑制性信号を返信し、これによってステップ26において、短期間(例えば約10ms)、E2レイヤのアクティビティを抑制する。
【0024】
最近トリガされたE2レイヤ電子ニューロン14のアクティビティ後の短期間(例えば約50ms)内に、電子ニューロン14が接続するE1レイヤ電子ニューロン12のアクティビティが起こった場合、電子ニューロン12および14間の接続は自動的に弱くなる(すなわちニューロン12および14間のシナプス接続のコンダクタンスが低下する)。
【0025】
しかしながら、E2レイヤ電子ニューロン14が、この電子ニューロン14が接続するE1レイヤ電子ニューロン12のすぐ後に(例えば約50ms内に)発火(すなわちトリガまたはスパイク)した場合、システム10は電子ニューロン12および14間の接続を強化する。
【0026】
従って、所与のE2レイヤ電子ニューロン14から所与のE1レイヤ電子ニューロン12までの接続は、最初に電子ニューロン14をトリガする際に電子ニューロン12が関与した可能性がある場合はいつでも、強化される。前述の構成の結果として、システムは、因果律に従うイベント間の関連付けを強化すると共に因果律に従わないイベントを抑制するための機能を作り出す。
【0027】
本発明の一実施形態において、システム10の全体的な安定性およびノイズ耐性は、強度の正規化を実施することによって促進される。強度の正規化は、電子ニューロン接続間の強度を調節することによって達成される。システム10は、ある接続の強度を高くした場合はいつでもシステム内の他の接続が弱くなることを犠牲にするように構成されている。これによって、電子ニューロンはその影響を最も有効な箇所に集中させることができ、ノイズによる効果がやがて弱くなることを保証する。接続の正規化を達成するには、あるニューロンが受信した全ての興奮性シナプス(接続)の強度を、一定値にとどまるように調節する。従って、あるニューロンに対する1つの接続の強度が上昇すると、そのニューロンに対する他の接続の強度はこれに比例して低下して、そのニューロンに対する全入力強度を一定に維持する。これについては、以下で更に説明する関係(6)によって説明する。
【0028】
図4は、本発明の別の実施形態に従ったニューラル・システム30の図を示す。システム30は、興奮性電子ニューロンの2つのレイヤE1およびE2を含むことを含む。システム10は更に、抑制性電子ニューロンの2つのレイヤI1およびI2を含む。
図5を参照すると、本発明の一実施形態においてシステム30は、方向性接続性(フィードフォワードおよびフィードバック)を有するレイヤ・アーキテクチャ35を含み、因果律に従ったイベント間の関連付けを選択するように機能する側方抑制およびスパイク駆動学習則による勝者総取り(WTA)プロセスの相互作用を実施する。
【0029】
一例において、WTAプロセスは一般に、複数の興奮性ニューロンおよび単一の抑制性ニューロンのニューラル・ネットをモデル化する。アクティブな興奮性ニューロンは抑制性ニューロンを興奮させる。抑制性ニューロンは興奮性ニューロンを抑制する。ほとんどの興奮性ニューロンが抑制されるまで、抑制性ニューロンのアクティビティは増大する。
【0030】
アーキテクチャ35は、興奮性電子ニューロンの前記2つのレイヤE1およびE2と、抑制性電子ニューロンの前記2つのレイヤI1およびI2と、を含み、STDPおよびシナプス可塑性(軸策/樹状突起)のフィードフォワード(FF)経路ならびに反STDPおよびシナプス可塑性(軸策/樹状突起)のフィードバック経路(FB)を提供する。具体的には、アーキテクチャ35は、ニューロン間の方向性接続性(フィードフォワードおよびフィードバック)を提供し、因果律に従ったイベント間の関連付けを選択するように機能する側方抑制およびスパイク駆動学習則によるWTAを実施する。E1レイヤは空間−時間入力(例えば外観が時間で変動する円形または方形の画像)を受信し、E1レイヤに提示される入力パターンはE2レイヤ上に圧縮表現されることになる。
【0031】
以前に遭遇したパターンの部分的なバージョンまたは破損したバージョンにより、完全なバージョンのエラーなしの検索が行われる。フィードバック経路(FB)接続は、反STDP(すなわちaSTDP)を示す。E1レイヤにおいて破損または不完全な入力があった場合、正しいE2レイヤ・ニューロンが発火するはずである。そのE2ニューロンの発火に基づいて、完全なE1入力を再現することができる。E2レイヤ・ニューロンの前にE1レイヤ・ニューロンが発火すると、シナプスが弱くなってスプリアス・アクティビティを排除する。E1レイヤ・ニューロンの前にE2レイヤ・ニューロンが発火すると、以前に見られた入力からの接続を強化することによってパターン完成のためにシナプスが強化される。
【0032】
スパイク信号は、シナプス接続(要素)間の電圧バイアスを生成し、この結果として電流が下流のニューロンに流れる。この電流の大きさは、対応するシナプス接続のコンダクタンスによって重み付けされるようになっている。一例においては、ランダムな重み分布を利用して、スパイクのために各E2ニューロンがE1ニューロンの10%からの入力を必要とするようになっている。フィードフォワード(FF)接続はSTDPを示し、入力がE1レイヤのニューロン・アクティビティにおける著しい時空相関性を生じることで、一定のE2レイヤ・ニューロンが発火する。I2レイヤは、E2レイヤにおけるアクティビティが極めて少数に限定されることを保証する。E2レイヤ・ニューロンの前にE1レイヤが発火すると、これはシナプスを強化して関連付けを形成する。E1レイヤ・ニューロンの前にE2レイヤが発火すると、これはシナプスを弱くしてノイズを除去する。
【0033】
図6は、ニューラル・システム30の更に詳細な図を示し、E1およびE2レイヤがそれぞれ興奮性電子ニューロン12および14(すなわちNE1およびNE2)のポピュレーションを含むことを示す。更に、I1およびI2レイヤはそれぞれ、抑制性電子ニューロン16および18(すなわちNI1およびNI2)のポピュレーション(グリッド)を含む。E1レイヤ電子ニューロンは入力ニューロンとして機能し、E2電子ニューロンはもっと高いレベルの処理をサポートする。
図7に、異なるレイヤにおけるニューロン間の接続11を更に詳細に示す。レイヤ間の接続は、ソース・レイヤSにおける各ニューロン(An)から、ソース・レイヤにおけるソースAnの位置と地形的に対応するターゲット・レイヤTにおけるポイントのターゲット・ニューロンBnまで行われる。ソース・ニューロンAnは、ターゲット・ニューロンBnの一定の半径(0から∞まで)内にあるターゲット・レイヤの全ニューロンに接続される。
【0034】
図8は、システム30(
図6)において用いられるスパイク・タイミング依存可塑性学習則を示し、例えばS.Song、K.D.Miller、およびL.F.Abbott、「Competitive Hebbian learning through spike−timing−dependent synaptic plasticity」、nature Neuroscience、vol.3、2000年9月、919〜926ページに記載されている。水平軸(x軸)は、シナプス後ニューロン・スパイクの時間からシナプス前ニューロン・スパイクの時間を減算したものを表す。垂直軸(y軸)は、異なるタイミングの前−後対から得られるシナプス重みの変化ΔWを表す。曲線13は以下の式から導出される。
tpre<tpostの場合、
【数1】
その他の場合、
【数2】
【0035】
ここで、A+およびA−は正または負の数とすることができ、所与のタイミング差についての重み変化の大きさを決定し、τは時定数(以下で更に詳細に説明する)である。
【0036】
電子ニューロンは以下のように相互接続される。各電子ニューロンは、他の電子ニューロンとの固定数Mの出立接続を形成する。各E1レイヤ電子ニューロンは、I1レイヤおよびE2レイヤの電子ニューロンに接続する。各I1レイヤ電子ニューロンは、E1レイヤ電子ニューロンにのみ接続する。同様に、各E2電子ニューロンはI2レイヤおよびE1レイヤの電子ニューロンに接続する。各I2レイヤ電子ニューロンはE2レイヤ電子ニューロンにのみ接続する。また、いずれかのニューロン対を接続する各経路には、伝導遅延が割り当てられる。接続及び遅延は、意図する用途に応じて、ランダムに(例えば分布から導かれる)または所定の地形的な方法で割り当てることができる。ポピュレーションは、それ自体に戻って接続することはできない。
【0037】
一般に、システム構成は、用いられるスパイク発生機構の詳細とは無関係である。完全さのため、式(1)によってその脱分極変数Vの観点で各スパイキング・ニューロンのダイナミクスを決定するIzhikevich/Brette−Gerstnerモデルの変形を用いることができる。
【0039】
変数μはニューロンの適応/回復変数を示し、bおよびτμは一定のパラメータである。Fは典型的に、式(1)に対する解V(t)の存在を保証するように選択した凸関数であり、所与の時間間隔内で充分に大きい入力Iが受信されると急速に「無限大になる」。これらの「爆発的な」イベントをスパイクと解釈する。いったんスパイクが記録されると、変数Vは休止状態にリセットされ、適応変数を適宜調節して回復期の開始を引き起こす。動作において、スパイクを捕獲するには、V(t)>Vthrの場合に時間tにおいてニューロンが発火したと言われるような閾値Vthrを導入する。各スパイクは、以下の関係(2)によって2進値アクティビティ変数ξ(t)の観点で表される。
【0041】
この構成における全てのニューロンは式(1)によって支配され、このため同一の入力が受信された場合に同一の挙動を示す。従って、動的挙動のあらゆる変動は、入力I(t)の変動からのみ生じる。ポピュレーションE1、E2、I1、およびI2は、かかる入力項により相互作用する。説明の明確さのため、ニューロンのポピュレーションを、それらの入力の点で区別する。E1およびI1ニューロンは、シーケンス{j、k、...}からの指数を用いて標示する。E2およびI2ニューロンは、シーケンス{α、β、...}からの指数を用いて標示する。E1ニューロンに対する入力は3つのソースから開始する。上述のように、外部刺激を(感覚経路を介して)受信することに加えて、E1ニューロンは、I1およびE2ニューロンの双方からの入力も受信する。これらのソースは集合的に、以下の関係(3)における形態の式(1)の入力項I(t)を与える。
【0043】
ここで、Ijextは外部刺激を指し、WjaおよびWjkは、それぞれ
【数6】
のシナプスの強度を示す負でない量であり、Δjaは、ソースαとターゲット・ニューロンjとの間の(軸策)伝導遅延を示す。
【0044】
E2ニューロンに対する入力は関係(3)と同一の形態をとるが、明らかな表記の変更として、関係(3)の右側において、E1指数にE2指数を代入し、I2指数にI1指数を代入する。E2ニューロンは外部刺激を受信しないので、Iext=0に設定する。また、I1およびI2ニューロンの双方に対する入力も関係(3)の形態をとるが、Iext=0に設定することに加えて、抑制性入力を省略する。これは、上述のようにI1およびI2ニューロンは興奮性ニューロンとのみ相互作用するからである。
【0045】
【数7】
のシナプスの強度は時間依存である(すなわち可塑性である)が、他の全てのシナプス重みは時間的に固定されたままである。この構成は2つの形態の可塑性機構を与える。すなわち、
【数8】
の重みは従来のSTDP則のもとで発生し、
【数9】
のものは反STDPのもとで発生する。典型的な規則の形態では、tpreおよびtpostにおける全ての記録されたシナプス前およびシナプス後のスパイク・イベント対は、所与のニューロン対(ここではpreおよびpostによって標示する)間のシナプス強度の変化ΔWpre,postを誘発する。この変化は以下の関係(4)の形態をとる。
【0047】
ここで、A+、A−、およびτは正の定数である。本発明に従った構成において用いられる反STDP則は、以下の関係(5)の形態をとる。
【0049】
これは正の定数B+、B−、およびτを有する。
【0050】
重みの「正規化」バージョンを用いて、ダイナミクスの競合の態様を実施する。t+が、シミュレーションの過程におけるいずれかの基本更新時間tの直後の時間を示すとする。例えばαのような、いずれかの所与のニューロンに関連付けた重みを、以下によって制約する。
【0052】
これによって、全てのtおよびαについてΣkWak(t+)が一定のままであることを保証する。この制約は、命令により、全ての指数α、j、および所定の定数Wmaxについて確実に0≦Waj≦Wmaxとする厳しい規則によって補足される。競合ダイナミクスは、入力における対照的な強化のためのプロセスを導入することで更に容易になる。これは、関係(3)におけるIj(t)を以下の関係(7)によって置換することを含む。
【0054】
指数を適宜取り替えることで、E2、I1、およびI2に対する入力について同様の数式が得られる。
【0055】
以下に、入力の提示のためのプロトコルについて概説する。このプロトコルは、任意に、入力電子ニューロン・アレイE1を、各々がほぼ同一数の入力ニューロンを含むP個のクラスタ(μ=1、...、Pによって示される)に分割することを含む。この例では、特定の入力パターンの提示は、主として特定のクラスタに限定された、固定時間間隔にわたるアクティビティの動揺として現れる。この限定は厳密である必要はなく、部分的な重複も可能であると共に、ニューロン・アレイ上のどこででも散発的なイベントの可能性がある。これによって、特定の「時間的入力パターン」を特定の入力クラスタに関連付けることが可能となる。
【0056】
以下の一例としての状況では、パターンは、長さTの間隔にわたって一度に1つずつE1に提示され、各提示の後に長さTSの無音期がある。時間の基本単位としてΔtを用い、T,TS>>Δtとし、
に設定し、更に、Ttrain>>T,TSを、「訓練」期の持続時間とする。入力(刺激)の提示のためのプロトコルは、以下の表1の通りである。
【0058】
以下の表2は、上の入力提示プロトコルのオンライン実施を示す。ルーチン「選択(n、E1μ)」によって、トリガされるn個のE1ニューロンのリストを戻す。
【0060】
本発明の実施形態による結果に影響を及ぼすことなく、異なるレベルの複雑度の刺激(入力)プロトコルの変形が可能である。例示的な変形は、刺激(入力)においてノイズのレベルを導入すること、および、例えばE1μのアクティビティが部分的にE1vのものと一致することができる(μ≠vの場合)等、重複パターンを可能とすることを含む。
【0061】
上述の入力/刺激提示プロトコルに従って、訓練期の間、以下の時間間隔においてn回パターンE1μをニューラル・システム(ネットワーク)に提示する。
【0063】
各時間ステップt∈T(n、μ)における活性化のためにパターンμにおけるE1単位の特定のサブセットを選択する。この場合、selectE1(t)はかかるサブセットを示し、firedE1(t)は時間tにおいて発火したことが観察されたE1ニューロンのセットを示し、
【数15】
は全てのt<0に用いられる。ここで、
【数16】
を定義する。
【0064】
このため、E1'(n、μ)は、繰り返される(フィードバック)アクティビティによって発火することができただけのE1ニューロンのセットを含む。このため、各nおよびμについて、関係(9)は以下の尺度を提供する。
【0065】
【数17】
ここで、||S||はセットSの濃度を示し、0≦R(n、μ)、P(n、μ)≦1であり、E1'(n、μ)はE1に記録された入力(フィードフォワード)アクティビティの返信画像であるので、R(n、μ)は「実際の入力との返信画像の一致」の量を測定するようになっている。すなわち、R(n、μ)は、返信画像と実際の入力と間の一致が高レベルであると大きく、そうでなければ小さい。このため、R(n、μ)は「想起」の尺度であり、時空パターンのあるバージョンが提示されると、システムは記憶した時空パターンを検索するようになっている。同様に、P(n、μ)は、実際のアクティビティと誘発されたアクティビティとの間の関連付けを行う「精度」を測定する。
【0066】
前記尺度の平均バージョンは以下の通りである。
【数18】
【0067】
表3は、本発明に従った一例のシミュレーションを示し、標記
【数19】
は、構造
【数20】
によるオブジェクトを示し、指数E1、E2、I2、およびI2はポピュレーションE1、E2、I1、およびI2における量を標示する多重指数として機能する。更に、ME1,E2は、E1における行指数およびE2における列指数を有する行列Mを指す。いずれかの2つの行列MおよびΔが与えられると、演算子*は、以下のように設定することによって定義される。
【0068】
【数21】
ここで、以下のように、適切な単位にスケーリングした基本時間ステップを利用する。
【0070】
本発明の一実施形態において、入力パターンの時間期間は、ランダムおよび可変であるが、約10msと約100msとの間等の所与の下限および上限内に収まる。しかしながら、入力パターンにノイズが連続的に存在すると想定される。パターンは、相当に長い時間間隔にわたって繰り返し発生する。一例では、空間スケールによって、特定の一連の時空イベントがパターンを構築するか否かを判定する。
【0071】
本発明の一実施形態に従った神経方法およびシステムは、ニューロンのスパイキング、スパイク時間駆動学習則およびニューロン間の反復接続を含む大脳皮質ネットワークのフィーチャを実施する。このシステムでは、教師なし訓練セッションの後に、入力パターン識別およびその後のパターン想起を行うために、ニューロン当たり単一のスパイクだけが必要である。このシステムは、もっと大きいシステムの中間処理段として機能することができ、この場合、神経生物学的実験によって提案されたものと同様の時間制約のもとで、機能的に著しい量の処理を行うことができる。
【0072】
本発明の一実施形態によれば、ニューラル・システムは、競合ダイナミクスおよび教師なし学習によってニューロンのスパイキングに対応するように構成されたアーキテクチャを実施する。ニューラル・システムは、検索の実行が成功し、いったんパターンが非活性化されると消失するアクティビティにより一時的なニューロン・アセンブリを実施する。かかる一時的なアセンブリによって、メモリの効率的かつ迅速な連続活性化および検索を可能とする。ニューラル・システムは、パターン完成のための専用のニューラル回路を含み、注目しその後分析する必要があるイベントを特定することができる。ニューラル・システムは、モジュール式フレームワークへの組み込みに容易に適用することができ、各モジュールは本明細書に開示した基本的な2レイヤ電子ニューロン実施を有する。
【0073】
一例として、モジュール式フレームワーク構成は、基本的な2レイヤ・モジュールを階層的に積層することを含み、階層における各レベルが様々な抽象レベルのフィーチャを表す。基本的な2レイヤ・システムに追加のニューロン・レイヤ(例えばE2a、E2b等)を追加することも可能であり、各ニューロン・レイヤが並列に同一入力ストリーム内の異なるパターン・フィーチャに応答する。これは、各ニューロン・レイヤ・シートについて異なる受信フィールド・プロファイルを用いることで達成可能である。あるいは、システムが多数のE1レイヤを含み、別個の入力ストリームが全て単一のE2レイヤに供給されることも可能である。システムは、これらの代替案の様々な置換および組み合わせを行うことによって、以前に学習したパターンを複雑な組成に統合することができる。
【0074】
本発明の実施形態は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態、またはハードウェアおよびソフトウェアの双方の要素を含む実施形態の形態をとることができる。上述したような本発明に従ったカノニカル・スパイキング・ニューロン・システムの一例のアーキテクチャは、レイヤE1、E2、I1、およびI2におけるニューロンを含み、更に、それらの間の接続および学習則を含む。かかるシステムは、従来のコンピュータ・システム上でのシミュレーションによって、または様々な異なるハードウェア・スキームによって(その1つは超高密度シナプス・クロスバー・アレイを含み、スパイク・タイミング依存可塑性を提供する)実施する等、異なる方法で実施することができる。
【0075】
本明細書において用いる場合、「超高密度クロスバー・アレイ」という言葉は、約0.1nmから10μmの範囲のピッチを有することができるクロスバー・アレイを指す。
図9は、複数のニューロン15、17、19、および21を有するクロスバー・アレイ100を含む一例のニューラル・システムを示す。これらのニューロンは、本明細書において「電子ニューロン」とも称する。ニューロン15および17は軸策ニューロンであり、ニューロン19および21は樹状突起ニューロンである。軸策ニューロン15および17は、出力22および24がそれぞれ軸策26および28に接続されて示されている。樹状突起ニューロン19および21は、入力30および32がそれぞれ樹状突起34および36に接続されて示されている。また、軸策ニューロン15および17は、入力を含み、樹状突起に沿って信号を受信するが、これらの入力および樹状突起は例示の簡略さのため図示しない。このため、軸策ニューロン15および17は、樹状突起接続に沿って入力を受信する場合に樹状突起ニューロンとして機能する。同様に、樹状突起ニューロン19および21は、それらの軸策接続に沿って信号を送信する場合に軸策ニューロンとして機能する。ニューロン15、17、19および21のいずれかが発火すると、それらは軸策および樹状突起接続に対してパルスを送出する。
【0076】
軸策26、28および樹状突起34、36間の各接続は、可変状態抵抗器38、40、42、および44を介して行われる。可変状態抵抗器が位置する接合部を、本明細書においては「クロスポイント接合部」と称することができる。「可変状態抵抗器」という言葉は、電気的パルス(電圧または電流のいずれか)の印加によってデバイスの電気的コンダクタンス特性が変化するデバイスのクラスを指す。クロスバー・アレイ・ニューラル・システムの一般的な考察では、かかるクロスバー・アレイにおいて用いるような可変状態抵抗器に関して、K.Likharev「Hybrid COS/Nanoelectronic Circuits: Opportunities and Challenges」、J.Nanoelectronics and Optoelectronics,2008(Vol.3、203〜230ページ、2008年)を参照する。本発明の一実施形態では、可変状態抵抗器は相変化メモリ(PCM)を含むことができる。PCMデバイスの他に、本発明の実施形態において使用可能な他の可変状態抵抗器デバイスは、金属酸化物、硫化物、酸化シリコン、およびアモルファス・シリコン、磁気トンネル接合、浮動ゲートFETトランジスタ、および有機薄膜層デバイスを用いて形成したデバイスを含む。これらについては上述のK.Likharevの記事に更に詳細に記載されている。また、可変状態抵抗器は、スタティック・ランダム・アクセス・メモリ・デバイスを用いて構築することも可能である。また、可変状態抵抗器にはアクセス・デバイス39が接続されており、これはPNダイオード、ダイオードとして配線されたFET、または非線形電圧−電流応答を有する他の何らかの要素を含むことができる。
【0077】
ニューロン15、17、19、および21は各々、一対のRC回路48を含む。一般に、本発明の一実施形態によれば、軸策ニューロン15および17は、樹状突起入力接続(図示せず)から受信した入力が閾値を超えた場合に「発火する」(パルスを送信する)。軸策ニューロン15および17が発火した場合、それらはA−STDP変数を維持する。この変数は、そのRC回路48の一方の抵抗器およびコンデンサの値によって決定する比較的長い所定の時定数により減衰する。例えば一実施形態において、この時定数は50msとすることができる。A−STDP変数は、電流ミラーを用いたコンデンサまたは等価回路間の電圧を求めることによってサンプリングすることができる。この変数を用いて、関連するニューロンの最後の発火後の時間を符号化することによって、軸策STDPを達成する。軸策STDPを用いて「増強(potentiation)」を制御する。これは、この文脈において、シナプス・コンダクタンスの上昇として定義される。
【0078】
樹状突起ニューロン19、21が発火すると、それらはD−STDP変数を維持する。この変数は、そのRC回路48の一方における抵抗器およびコンデンサの値に基づいて比較的長い所定の時定数で減衰する。例えば一実施形態では、この時定数は約50msとすることができる。他の実施形態では、この変数は時間の関数として減衰する場合がある。例えばこの変数は、一次、多項、または二次関数に従って減衰する場合がある。本発明の別の実施形態では、変数は、経時的に低下するのでなく上昇する場合がある。いずれにせよ、この変数を用いて、関連するニューロンの最後の発火後の時間を符号化することによって、樹状突起STDPを達成することができる。樹状突起STDPを用いて「抑圧(depression)」を制御することができる。これは、この文脈において、シナプス・コンダクタンスの低下として定義される。
【0079】
本発明の実施形態は、コンピュータ、処理デバイス、またはいずれかの命令実行システムによってまたはそれと接続して用いるためのプログラム・コードを提供するコンピュータ使用可能またはコンピュータ読み取り可能媒体からアクセス可能なコンピュータ・シミュレーションまたはプログラムの形態をとることができる。当業者には認められるであろうが、本発明の態様は、システム、方法、またはコンピュータ・プログラムとして具現化することができる。従って、本発明の態様は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)、または、ソフトウェアおよびハードウェアの態様を組み合わせた実施形態という形をとることができ、それらは全て本明細書において、「回路」、「モジュール」、または「システム」と一般的に称することができる。更に、本発明の態様は、具現化されたコンピュータ読み取り可能プログラム・コードを有する1つ以上のコンピュータ読み取り可能媒体(複数の媒体)において具現化されたコンピュータ・プログラムの形態をとることも可能である。
【0080】
1つ以上のコンピュータ読み取り可能媒体(複数の媒体)のあらゆる組み合わせを利用することができる。コンピュータ読み取り可能媒体は、コンピュータ読み取り可能信号媒体またはコンピュータ読み取り可能記憶媒体とすることができる。コンピュータ読み取り可能記憶媒体は例えば、限定ではないが、電子、磁気、光、電磁、赤外線、または半導体のシステム、装置、デバイス、または前述のもののいずれかの適切な組み合わせとすることができる。コンピュータ読み取り可能記憶媒体の更に具体的な例(非網羅的な列挙)は、以下を含む。すなわち、1本以上のワイヤを含む電気的接続、携帯型コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、光ファイバ、携帯型コンパクト・ディスク読み取り専用メモリ(CD−ROM)、光記憶デバイス、磁気記憶デバイス、または前述のもののいずれかの適切な組み合わせである。この文書の文脈において、コンピュータ読み取り可能記憶媒体は、命令実行システム、装置、またはデバイスによってまたはそれと接続して用いるためにプログラムを含有または記憶することが可能ないずれかのタンジブルな媒体とすることができる。
【0081】
コンピュータ読み取り可能信号媒体は、例えばベースバンドにおいてまたは搬送波の一部として、具現化されたコンピュータ読み取り可能プログラム・コードを有する伝播データ信号を含むことができる。かかる伝播信号は様々な形態のいずれかをとることができ、それらは限定ではないが、電磁、光、またはそれらのいずれかの適切な組み合わせを含む。コンピュータ読み取り可能信号媒体は、コンピュータ読み取り可能記憶媒体でないが、命令実行システム、装置、またはデバイスによってまたはそれと接続して用いるためにプログラムを伝達、伝播、または転送することが可能ないずれかのコンピュータ読み取り可能媒体とすることができる。
【0082】
コンピュータ読み取り可能媒体上で具現化されるプログラム・コードは、限定ではないが、無線、有線、光ファイバ・ケーブル、RF等、または前述のもののいずれかの適切な組み合わせを含むいずれかの適切な媒体を用いて伝送することができる。本発明の態様の動作を実行するためのコンピュータ・プログラム・コードは、Java、Smalltalk、C++等のオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語等の従来の手順プログラミング言語を含む1つ以上のプログラミング言語のいずれかの組み合わせにおいて記述することができる。プログラム・コードは、全体的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアロンのソフトウェア・パッケージとして、部分的にユーザのコンピュータ上でおよび部分的に遠隔コンピュータ上で、または全体的に遠隔コンピュータもしくはサーバ上で、実行することができる。後者の場合、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含むいずれかのタイプのネットワークを介してユーザのコンピュータに接続することができ、または、接続は、(例えばインターネット・サービス・プロバイダを用いてインターネットを介して)外部コンピュータに対して行うことができる。
【0083】
本発明の実施形態に従った方法、装置(システム)、およびコンピュータ・プログラムのフローチャート図またはブロック図あるいはその両方を参照して、本発明の態様について以下に記載する。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組み合わせは、コンピュータ・プログラム命令によって実施可能であることは理解されよう。 これらのコンピュータ・プログラム命令は、汎用コンピュータ、特殊目的コンピュータ、または他のプログラマブル・データ処理装置のプロセッサに提供されて機械を生成することができ、これによって、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサによって実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックまたは複数のブロックに規定された機能/行為を実施するための手段を生成するようになっている。
【0084】
また、これらのコンピュータ・プログラム命令はコンピュータ読み取り可能媒体に記憶することができ、これによって、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスに特定の方法で機能するように指示することができ、これにより、コンピュータ読み取り可能媒体に記憶された命令が、フローチャートまたはブロック図あるいはその両方のブロックまたは複数のブロックに規定された機能/行為を実施する命令を含む製造品を生成するようになっている。
【0085】
また、コンピュータ・プログラム命令を、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードして、そのコンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させてコンピュータ実施プロセスを生成することができ、これによって、コンピュータまたは他のプログラマブル装置上で実行する命令が、フローチャートまたはブロック図あるいはその両方のブロックまたは複数のブロックに規定された機能/行為を実施するためのプロセスを提供するようになっている。
【0086】
図10は、本発明の一実施形態を実施するために有用な情報処理システムを示す高レベルのブロック図である。コンピュータ・システムは、プロセッサ102等の1つ以上のプロセッサを含む。プロセッサ102は、通信インフラストラクチャ104(例えば通信バス、クロスオーバー・バス、またはネットワーク)に接続されている。
【0087】
コンピュータ・システムは、ディスプレイ・インタフェース106を含むことができ、これはディスプレイ・ユニット108上で標示するために、通信インフラストラクチャからの(または図示しないフレーム・バッファからの)グラフィック、テキスト、および他のデータを転送する。また、コンピュータ・システムは、好ましくはランダム・アクセス・メモリ(ROM)であるメイン・メモリ110を含み、更に二次メモリ112を含むことができる。二次メモリは、例えばハード・ディスク・ドライブ114または着脱可能記憶デバイス116あるいはその両方を含むことができ、これは例えば、フレキシブル・ディスク・ドライブ、磁気テープ・ドライブ、または光ディスク・ドライブを表す。着脱可能記憶ドライブ116は、当業者に周知の方法で、着脱可能記憶ユニット118からの読み取りまたはこれへの書き込みあるいはその両方を行う。着脱可能記憶ユニット118は、例えばフレキシブル・ディスク、コンパクト・ディスク、磁気テープ、または光ディスク等を表し、これは着脱可能記憶ドライブ116によって読み取りおよび書き込みを行う。認められるように、着脱可能記憶ユニット118は、コンピュータ・ソフトウェアまたはデータあるいはその両方を記憶しているコンピュータ読み取り可能媒体を含む。
【0088】
代替的な実施形態では、二次メモリ112は、コンピュータ・システムにコンピュータ・プログラムまたは他の命令をロードすることを可能とするための他の同様の手段を含むことができる。かかる手段は、例えば着脱可能記憶ユニット120およびインタフェース122を含むことができる。かかる手段の例は、プログラム・パッケージおよびパッケージ・インタフェース(ビデオ・ゲーム・デバイスにおいて見られるもの等)、着脱可能メモリ・チップ(EPROMまたはPROM等)および関連するソケット、ならびに他の着脱可能記憶ユニット120および122であって、この着脱可能記憶ユニット120からコンピュータ・システムにソフトウェアおよびデータを転送可能とするものを含むことができる。
【0089】
また、コンピュータ・システムは通信インタフェース124を含むことができる。通信インタフェース124によって、コンピュータ・システムと外部デバイスとの間でソフトウェアおよびデータを転送することができる。通信インタフェース124の例は、モデム、ネットワーク・インタフェース(イーサネット・カード等)、通信ポート、またはPCMCIAスロットおよびカード等を含むことができる。通信インタフェース124を介して転送されるソフトウェアおよびデータは、例えば、電子、電磁、光、または通信インタフェース124によって受信可能な他の信号とすることができる信号の形態である。これらの信号は、通信経路(すなわちチャネル)126を介して通信インタフェース124に供給される。この通信経路126は、信号を搬送し、ワイヤまたはケーブル、光ファイバ、電話線、携帯電話リンク、無線周波数(RF)リンク、または他の通信チャネルあるいはそれら全てを用いて実施することができる。
【0090】
この文書において、「コンピュータ・プログラム媒体」、「コンピュータ使用可能媒体」、および「コンピュータ読み取り可能媒体」という言葉は、メイン・メモリ110および二次メモリ112、着脱可能記憶ドライブ116、およびハード・ディスク・ドライブ114にインストールされたハード・ディスク等の媒体を一般的に指すために用いられる。
【0091】
メイン・メモリ110または二次メモリ112あるいはその両方に、コンピュータ・プログラム(コンピュータ制御論理とも呼ばれる)が記憶されている。また、通信インタフェース124を介してコンピュータ・プログラムを受信することも可能である。かかるコンピュータ・プログラムは、実行されると、本明細書において論じたような本発明のフィーチャをコンピュータ・システムが実行することを可能とする。特に、コンピュータ・プログラムは、実行されると、コンピュータ・システムのフィーチャをプロセッサ102が実行することを可能とする。従って、かかるコンピュータ・プログラムは、コンピュータ・システムのコントローラを表す。
【0092】
図面におけるフローチャートおよびブロック図は、本発明の様々な実施形態に従ったシステム、方法、およびコンピュータ・プログラムの可能な実施のアーキテクチャ、機能性、および動作を例示する。この点で、フローチャートまたはブロック図における各ブロックは、規定された論理機能(複数の機能)を実施するための1つ以上の実行可能命令を含むコードのモジュール、セグメント、または一部を表すことができる。また、いくつかの代替的な実施において、ブロックに明記した機能は、図面に明記した順序どおりでなく発生する場合があることに留意すべきである。例えば、関与する機能性に応じて、連続して示した2つのブロックは実際には実質的に同時に実行されることがあり、またはブロックは時に逆の順序で実行される場合がある。また、ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組み合わせは、規定された機能もしくは行為を実行する特殊目的ハードウェア・ベースのシステム、または特殊目的ハードウェアおよびコンピュータ命令の組み合わせによって実施可能であることに留意すべきである。
【0093】
また、本明細書において以下が開示される。
1.方向性シナプス接続性を有するレイヤ・ニューラル・ネット関係を有する複数の電子ニューロンであって、
1つ以上の第1の興奮性スパイキング電子ニューロンを含む第1の興奮性スパイキング電子ニューロン・レイヤと、
1つ以上の第2の興奮性スパイキング電子ニューロンを含む第2の興奮性スパイキング電子ニューロン・レイヤと、
1つ以上の第1の抑制性スパイキング電子ニューロンを含む第1の抑制性スパイキング電子ニューロン・レイヤと、
を含む、複数の電子ニューロンを含み、
第1の興奮性スパイキング電子ニューロン・レイヤが入力データ・ストリームを受信し、第1および第2の興奮性スパイキング電子ニューロン・レイヤおよび第1の抑制性スパイキング電子ニューロン・レイヤが組み合って、学習則に基づいて受信した入力を処理し、学習則が、入力データ・ストリームにおける時空パターンの関数として電子ニューロン間のシナプス相互接続のコンダクタンスのレベルを与える、ニューラル・システム。
2.各第1の興奮性スパイキング電子ニューロンが第2の興奮性スパイキング電子ニューロンに接続され、
各第2の興奮性スパイキング電子ニューロンが第1の興奮性スパイキング電子ニューロンおよび第1の抑制性スパイキング電子ニューロンに接続され、
各第1の抑制性スパイキング電子ニューロンが第2の興奮性スパイキング電子ニューロンに接続され、
各第1の抑制性スパイキング電子ニューロンが側方抑制により勝者総取りプロセスを提供する、上述の条項1に記載のシステム。
3.学習則に基づいて、第1の興奮性スパイキング電子ニューロンが入力データ・ストリームによって活性化されると、第1の興奮性スパイキング電子ニューロンは接続された第2の興奮性スパイキング電子ニューロンをトリガし、第1の興奮性スパイキング電子ニューロンと第2の興奮性スパイキング電子ニューロンとの間の接続のコンダクタンスが強化される、上述の条項2に記載のシステム。
4.学習則に基づいて、第2の興奮性スパイキング電子ニューロンが1つ以上の第1の興奮性スパイキング電子ニューロンによってトリガされると、第2の興奮性スパイキング電子ニューロンは接続された第1の抑制性スパイキング電子ニューロンをトリガし、第2の興奮性スパイキング電子ニューロンに抑制信号が返信され、これによって、ある時間期間だけ第2の興奮性スパイキング電子ニューロンによる更に別のアクティビティを抑制する、上述の条項3に記載のシステム。
5.学習則に基づいて、最近トリガされた第2の興奮性スパイキング電子ニューロンのアクティビティの後に接続された第1の興奮性スパイキング電子ニューロンのアクティビティが発生すると、第1および第2の接続された興奮性スパイキング電子ニューロン間の接続のコンダクタンスが弱くなる、上述の条項4に記載のシステム。
6.学習則に基づいて、接続された第1の興奮性スパイキング電子ニューロンの短期間後に第2の興奮性スパイキング電子ニューロンが発火すると、第1および第2の接続された興奮性スパイキング電子ニューロン間の接続のコンダクタンスが強化される、上述の条項5に記載のシステム。
7.複数の電子ニューロンが、
リアルタイム入力データ・ストリームにおいて時空パターンの存在を検出し、
時空パターンを抽出し、
学習則に基づいて、複数の電子ニューロンに時空パターンを記憶し、時空パターンのあるバージョンが提示されると、記憶した時空パターンを検索し、学習則が、時空パターンの関数として電子ニューロン間のシナプス相互接続のコンダクタンスのレベルを与える、上述の条項6に記載のシステム。