(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-21
(45)【発行日】2024-10-29
(54)【発明の名称】リザバーコンピューティング装置
(51)【国際特許分類】
G06N 3/067 20060101AFI20241022BHJP
G06N 3/044 20230101ALI20241022BHJP
【FI】
G06N3/067
G06N3/044 100
(21)【出願番号】P 2022046350
(22)【出願日】2022-03-23
【審査請求日】2024-02-01
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】石村 昇太
【審査官】宮司 卓佳
(56)【参考文献】
【文献】国際公開第2021/033277(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/067
G06N 3/04
(57)【特許請求の範囲】
【請求項1】
第1周波数から第J周波数(Jは2以上の整数)のJ個の異なる周波数の連続光を生成する生成手段と、
第j周波数(jは1からJまでの整数)の第j連続光を第jデータで変調することで第j変調光を生成する第j変調手段と、
第1変調光から第J変調光を波長多重することで波長多重光を生成し、前記波長多重光を非線形媒体に出力する多重手段と、
前記非線形媒体を介して前記多重手段から受信した波長多重光を波長分離することで、前記第j周波数を含む第j受信光を出力する分離手段と、
前記第j受信光を復調して第j出力データを出力する第j出力手段と、
第1入力データから第N入力データ(NはJ以上の整数)を含む入力データセットの第k入力データ(kは1~Nまでの整数)に第k係数を乗じることでN個のマスキングデータを生成し、前記N個のマスキングデータをJ個に分割することで、第1マスキングデータセットから第Jマスキングデータセットを生成し、第jマスキングデータセットに含まれるN
j個のマスキングデータを順に前記第j変調手段に出力するマスキング手段と、
を備え、
前記第jデータは、前記第j出力データに、前記第jマスキングデータセットに含まれるマスキングデータを加算したものであり、
前記第1マスキングデータセットから前記第Jマスキングデータセットそれぞれに含まれるマスキングデータの数であるN
1からN
Jの値は互いに異なる、リザバーコンピューティング装置。
【請求項2】
前記N
1から前記N
Jの値は互いに素である、請求項1に記載のリザバーコンピューティング装置。
【請求項3】
前記マスキング手段は、前記第jマスキングデータセットに含まれるマスキングデータを所定の時間間隔毎に前記第j変調手段に出力し、
前記第j変調手段から前記多重手段、前記分離手段及び前記第j出力手段を介して前記第j変調手段に至る経路の遅延は、前記所定の時間間隔のM倍(Mは2以上の整数)であり、
Mの値は、前記N
1から前記N
Jの値それぞれとは異なる、請求項1に記載のリザバーコンピューティング装置。
【請求項4】
前記M及び前記N
1から前記N
Jの値は互いに素である、請求項3に記載のリザバーコンピューティング装置。
【請求項5】
前記N
1から前記N
Jの値の合計はNである、請求項1から4のいずれか1項に記載のリザバーコンピューティング装置。
【請求項6】
前記マスキング手段は、前記N
1から前記N
Jの値を周期的に変更する、請求項1から5のいずれか1項に記載のリザバーコンピューティング装置。
【請求項7】
前記非線形媒体は、光ファイバである、請求項1から6のいずれか1項に記載のリザバーコンピューティング装置。
【請求項8】
前記非線形媒体は、光半導体増幅器である、請求項1から6のいずれか1項に記載のリザバーコンピューティング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リザバーコンピューティング技術に関する。
【背景技術】
【0002】
回帰型ニューラルネットワーク(RNN)は、入力層と、リカレント層(リザバー層)と、出力層と、で構成される。一般的に、RNNの学習においては、入力層、リカレント層及び出力層それぞれの重み(係数)を更新する。リザバーコンピューティングとは、RNNの一種であるが、学習の際には出力層の重みのみを更新し、入力層及びリカレント層の重みを更新しないRNNである。リザバーコンピューティングにおいて、入力層及びリカレント層の重みは、例えば、ランダムに生成した固定値に設定される。出力層の重みしか更新しない代わりに、リザバーコンピューティングにおいては、リカレント層におけるニューロン数を膨大にする。
【0003】
このリザバーコンピューティングのリカレント層をハードウェア的に実現したものは、"物理リザバーコンピューティング"と呼ばれる。非特許文献1及び非特許文献2は、ニューロンを時間軸上に展開する物理リザバーコンピューティングを開示している。例えば、リカレント層への入力が、N個の入力データを1組とし(以下、N個の入力データを含む1組の入力を"入力データセット"と表記する。)、この入力データセットがリカレント層に連続的に入力されるものとする。この場合、例えば、リカレント層のランダムな重みを表現するために、入力データセット内のN個の入力データに対して所定の振幅変動を与える。この操作はマスキングと呼ばれる。
図1は、マスキング処理の説明図である。
図1において、D#p-qは、p番目の入力データセット内のN個の入力データの内のq番目の入力データを示している。マスキング係数セットは、N個のマスキング係数F#1~F#Nで構成される。入力データD#p-qには、マスキング係数F#qが乗じられる。
【0004】
マスキングされた入力データ(以下、マスキングデータ)は、フィードバック機構に入力される。フィードバック機構は、あるマスキングデータがM個後のマスキングデータと干渉する様に設定される。言い換えると、フィードバック機構は、その内部にM個のマスキングデータが同時に存在できる様に構成される。以下の説明において、この数Mを、"ループ内のニューロン数"とも表記する。
図2は、N=6、かつ、M=5の例を示している。
図2においては、データD#p-qをマスキング係数F#qで処理したマスキングデータをM#p-qと表記している。
図2に示す様に、マスキング係数F#6で処理されたマスキングデータM#1-6は、先に入力され、マスキング係数#1で処理されたマスキングデータM#1-1と干渉(結合)する。さらに、マスキング係数#5で処理されたマスキングデータM#2-5は、マスキングデータ#1-1とマスキングデータ#6-6との干渉により生成されたデータ(
図2では、M#ZZZと表記。)と干渉する。
【0005】
これは、リカレント層のあるニューロンにおいて、入力データD#1-1をマスキング係数F#1で重み付けした値と、入力データD#1-6をマスキング係数F#6で重み付けした値と、入力データD#2-5をマスキング係数F#5で重み付けした値の和を求めることに対応する。この様に、異なるマスキング係数で処理されたデータを回帰的に結合(干渉)させることで、多数のニューロンが回帰的に結合するRNNのリカレント層をハードウェア的に実現することができる。なお、例えば、NとMを同じ値とすると、同じマスキング係数で処理された、入力データセット内の順番が同じ入力データ同士の干渉しか生じない。このため、例えば、N及びMは異なる値に設定される。
【先行技術文献】
【非特許文献】
【0006】
【文献】Nakajima,M.,Tanaka,K.&Hashimoto,T."Scalable reservoir computing on coherent linear photonic processor"Commun Phys4,20,2021年
【文献】Satoshi Sunada and Atsushi Uchida,"Photonic neural field on a silicon chip: large-scale,high-speed neuro-inspired computing and sensing", Optica 8,1388-1396,2021年
【発明の概要】
【発明が解決しようとする課題】
【0007】
リザバーコンピューティングにおいては、リカレント層におけるニューロン数を膨大にし、各ニューロン間の結合の複雑度を増加させることが好ましい。
【0008】
本発明は、ニューロン間の結合の複雑度を増加させることができるリザバーコンピューティング装置を提供するものである。
【課題を解決するための手段】
【0009】
本発明の一態様によると、リザバーコンピューティング装置は、第1周波数から第J周波数(Jは2以上の整数)のJ個の異なる周波数の連続光を生成する生成手段と、第j周波数(jは1からJまでの整数)の第j連続光を第jデータで変調することで第j変調光を生成する第j変調手段と、第1変調光から第J変調光を波長多重することで波長多重光を生成し、前記波長多重光を非線形媒体に出力する多重手段と、前記非線形媒体を介して前記多重手段から受信した波長多重光を波長分離することで、前記第j周波数を含む第j受信光を出力する分離手段と、前記第j受信光を復調して第j出力データを出力する第j出力手段と、第1入力データから第N入力データ(NはJ以上の整数)を含む入力データセットの第k入力データ(kは1~Nまでの整数)に第k係数を乗じることでN個のマスキングデータを生成し、前記N個のマスキングデータをJ個に分割することで、第1マスキングデータセットから第Jマスキングデータセットを生成し、第jマスキングデータセットに含まれるNj個のマスキングデータを順に前記第j変調手段に出力するマスキング手段と、を備え、前記第jデータは、前記第j出力データに、前記第jマスキングデータセットに含まれるマスキングデータを加算したものであり、前記第1マスキングデータセットから前記第Jマスキングデータセットそれぞれに含まれるマスキングデータの数であるN1からNJの値は互いに異なる。
【発明の効果】
【0010】
本発明によると、ニューロン間の結合の複雑度を増加させることができる。
【図面の簡単な説明】
【0011】
【
図1】ニューロンを時間軸上に展開する物理リザバーコンピューティングの説明図。
【
図2】ニューロンを時間軸上に展開する物理リザバーコンピューティングの説明図。
【
図3】一実施形態によるリザバーコンピューティング装置の構成図。
【
図4】一実施形態によるリザバーコンピューティング装置における処理の説明図。
【
図5】一実施形態によるリザバーコンピューティング装置における処理の説明図。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうちの二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
【0013】
図3は、本実施形態によるリザバーコンピューティング装置のリカレント層の構成図である。本実施形態のリザバーコンピューティング装置は、ニューロンを時間軸及び周波数軸の両方の軸上に展開する。本実施形態においては、周波数の数Jを3とするが例示であり、周波数の数Jは2以上の任意の数とし得る。また、本実施形態においては、入力データセット内の入力データの数Nを12とするが例示であり、入力データセット内の入力データの数NはJ以上の適切な数であり得る。入力データセット内の入力データの数Nが12であるため、マスキング係数は、F#1~F#12の12個になる。
【0014】
マスキング部7は、入力層からの入力データセット内のN個の入力データのマスキング処理を行ってN個のマスキングデータを生成する。続いて、マスキング部7は、N個のマスキングデータを、周波数の数Jと同じ3つに分割してマスキングデータセット#1~#3を生成する。本実施形態では、1つのマスキングデータセット#1に含まれるマスキングデータの数N1を3とし、1つのマスキングデータセット#2に含まれるマスキングデータの数N2を4とし、1つのマスキングデータセット#3に含まれるマスキングデータの数N3を5とする。マスキング部7は、マスキングデータセット#1のマスキングデータを順に変調器21に出力し、マスキングデータセット#2のマスキングデータを順に変調器22に出力し、マスキングデータセット#3のマスキングデータを順に変調器23に出力する。
【0015】
図4は、この様子を示している。なお、
図4の各四角形はマスキングデータに対応し、四角形内のF#k(kは1~12までの整数)は、当該四角形に対応するマスキングデータを生成するために使用したマスキング係数を示している。また、
図4の四角形の網掛の形状が同じものは、同じ入力データセット内の入力データに基づくマスキングデータであることを示している。例えば、
図4の3つのF#1は、異なる入力データセットの1番目の入力データをマスキング係数F#1でマスキングしたものである。
図4に示す様に、マスキング部7は、マスキング係数F#1~F#3で処理された3つのマスキングデータをマスキングデータセット#1とし、マスキングデータセット#1のマスキングデータを順に変調器21に出力している。また、マスキング部7は、マスキング係数F#4~F#7で処理された4つのマスキングデータをマスキングデータセット#2とし、マスキングデータセット#2のマスキングデータを順に変調器22に出力している。さらに、マスキング部7は、マスキング係数F#8~F#12で処理された5つのマスキングデータをマスキングデータセット#3とし、マスキングデータセット#3のマスキングデータを順に変調器23に出力している。
【0016】
図3に戻り、光源11~13は、それぞれ、第1周波数から第3周波数の連続光を生成して変調器21~23に出力する。なお、第1周波数から第3周波数は互いに異なる周波数である。本実施形態ではJ=3であるため、3つの異なる周波数の連続光を生成している。変調器21は、マスキングデータセット#1のマスキングデータと出力データ#1との合成データにより光源11が出力する連続光を変調することで第1変調光を出力する。同様に、変調器22は、マスキングデータセット#2のマスキングデータと出力データ#2との合成データにより光源12が出力する連続光を変調することで第2変調光を出力し、変調器23は、マスキングデータ#3と出力データ#3との合成データにより光源13が出力する連続光を変調することで第3変調光を生成して出力する。
【0017】
多重部3は、第1変調光~第3変調光を波長多重して波長多重光を出力する。非線形媒体4は、例えば、光ファイバであり得る。非線形媒体4は、光ファイバの非線形光学効果を用いることで、第1変調光~第3変調光を干渉(結合)させる。非線形光学効果としては、例えば、カー効果の一種である、相互位相変調や4光波混合を利用できる。また、非線形媒体4は、例えば、半導体光増幅器であり得る。半導体光増幅器の相互利得変調により、第1変調光~第3変調光を干渉させることができる。分離部5は、非線形媒体4からの波長多重光を波長分離し、第1変調光~第3変調光それぞれと同じ周波数及び帯域幅の第1受信光~第3受信光をフォートダイオード(PD)61~63に出力する。PD61~PD63は、それぞれ、第1受信光~第3受信光を復調して、出力データ#1~出力#データ3を生成する。出力データ#1~出力データ#3は、図示しない出力層に出力されると共に、変調器21~変調器23にフィードバックされる。
【0018】
なお、マスキング部7は、時間間隔T毎に1つのマスキングデータを変調器21~変調器23に出力する。また、変調器21~変調器23から多重部3、非線形媒体4、分離部5及びPD61~63を介して変調器21~変調器23に至るループ経路の遅延をM×T(Mは2以上の整数)とする。Mは、上述したループ内のニューロン数に対応する。
【0019】
図3の構成において、非線形媒体4が無いものとする。この場合、変調器21からPD61を介して変調器21に至る経路と、変調器22からPD62を介して変調器22に至る経路と、変調器23からPD63を介して変調器23に至る経路と、の合計3つの経路は、それぞれ、上述したニューロンを時間軸上に展開する物理リザバーコンピューティングと同様の構成になる。つまり、非線形媒体4が無い場合、
図3の構成は、時間軸上に展開する3つの物理リザバーコンピューティングを独立して設けたものとなる。時間軸上におけるニューロンの結合を複雑化するため、ループ内のニューロン数Mは、マスキングデータセット#1~#3内のマスキングデータの数N
1=3、N
2=4、N
3=5のいずれとも異なる値となる様に、例えば、互いに素の関係となる様に設定される。例えば、本例においてはM=7に設定され得る。
【0020】
本実施形態では、非線形媒体4により、異なる3つの周波数のマスキングデータ間の結合を生じさせる。例えば、
図4から明らかな様に、1番目の入力データセット内の1番目の入力データと、4番目の入力データと、8番目の入力データが非線形媒体4において結合する。なお、これら3つの入力データは、異なるマスキング係数によりマスキングされている。時間軸上と同様に、N
1とN
2とN
3が同じ値であると、干渉するマスキングデータのマスキングに使用されたマスキング係数が同じとなる。このため、N
1、N
2及びN
3についても互いに異なる値、例えば、互いに素となる様に設定する。より詳細には、M、N
1、N
2及びN
3についても互いに異なる値、例えば、互いに素となる様に設定する。
【0021】
この様に、ニューロンを時間軸上のみならず周波数軸上でも結合させることによりニューロン間の結合の複雑度を増加させることができる。
【0022】
なお、
図4から明らかな様に、同じ入力データセット内の入力データから生成したマスキングデータをマスキング部7が出力するタイミングのズレは、時間の経過により大きくなる。例えば、
図4において、3番目の入力データセット内の9番目の入力データに基づくマスキングデータが出力されるタイミングは、3番目の入力データセット内の1番目の入力データに基づくマスキングデータが出力されるタイミングより、5Tだけ遅くなっている。なお、Tは、上述した様に、マスキング部7がマスキングデータを出力する時間間隔である。
図4には示していないが、3番目の入力データセット内の12番目の入力データに基づくマスキングデータが出力されるタイミングは、3番目の入力データセット内の1番目の入力データに基づくマスキングデータが出力されるタイミングより、8Tだけ遅くなる。
【0023】
このため、マッピング部4は、
図5(A)及び
図5(B)に示す様に、マスキングデータセット#1~#3内のマスキングデータの数N
1~N
3の値を周期的に入れ替える。
図5(A)及び
図5(B)においては、3番目の入力データセット内の入力データに基づくマスキングデータからN
1を3から5にし、N
3を5から3にしている。
図5(A)及び
図5(B)より、3番目の入力データセット内の入力データに基づくマスキングデータが出力されるタイミングの差の最大値は6Tとなっている。マスキングデータ#1~マスキングデータ#3に含めるマスキングデータは、
図5(A)及び
図5(B)のどちらであっても良く、さらに、
図5(A)及び
図5(B)とは異なるパターンであっても良い。
【0024】
以上の構成により、ニューロン間の結合の複雑度を増加させることができる。したがって、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
【符号の説明】
【0025】
11~13:光源、21~23:変調器、3:多重部、4:非線形媒体、5:分離部、61~63:PD、7:マスキング部