(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023140496
(43)【公開日】2023-10-05
(54)【発明の名称】リザバーコンピューティング装置
(51)【国際特許分類】
G06N 3/067 20060101AFI20230928BHJP
G06N 3/04 20230101ALI20230928BHJP
【FI】
G06N3/067
G06N3/04
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022046362
(22)【出願日】2022-03-23
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】石村 昇太
(72)【発明者】
【氏名】田中 英明
(57)【要約】
【課題】ニューロン間の結合の複雑度を増加させる。
【解決手段】装置は、第1~第J連続光を第1~第Jデータで変調することで第1~第J変調光を生成する手段と、J個の変調光を波長多重してJ個に分岐し、それぞれをフィルタして第1~第J受信光を出力するJ個のフィルタ手段と、第1~第J受信光を光電変換して第1~第J出力データを出力する手段と、N個の入力データに係数を乗じることでN個のマスキングデータを生成し、N個のマスキングデータをJ個に分割することで、J個のデータセットを生成する手段と、を備え、第1~第Jデータは、第1~第J出力データに、各データセットに含まれるマスキングデータを加算したものであり、各データセットに含まれるマスキングデータの数は互いに異なり、各フィルタ手段の通過帯域はそれぞれ異なる。
【選択図】
図3
【特許請求の範囲】
【請求項1】
第1周波数から第J周波数(Jは3以上の整数)のJ個の異なる周波数の連続光を生成する生成手段と、
第j周波数(jは1からJまでの整数)の第j連続光を第jデータで変調することで第j変調光を生成する第j変調手段と、
第1変調光から第J変調光を波長多重することで信号光を生成する多重手段と、
前記信号光をJ個に分岐して出力する分岐手段と、
前記分岐手段が出力するJ個の前記信号光の内のj番目の前記信号光をフィルタして第j受信光を出力する第jフィルタ手段と、
前記第j受信光を光電変換して第j出力データを出力する第j出力手段と、
第1入力データから第N入力データ(NはJ以上の整数)を含む入力データセットの第k入力データ(kは1~Nまでの整数)に第k係数を乗じることでN個のマスキングデータを生成し、前記N個のマスキングデータをJ個に分割することで、第1マスキングデータセットから第Jマスキングデータセットを生成し、第jマスキングデータセットに含まれるNj個のマスキングデータを順に前記第j変調手段に出力するマスキング手段と、
を備え、
前記第jデータは、前記第j出力データに、前記第jマスキングデータセットに含まれるマスキングデータを加算したものであり、
前記第1マスキングデータセットから前記第Jマスキングデータセットそれぞれに含まれるマスキングデータの数であるN1からNJの値は互いに異なり、
第1フィルタ手段から第Jフィルタ手段の通過帯域はそれぞれ異なる、リザバーコンピューティング装置。
【請求項2】
前記N1から前記NJの値は互いに素である、請求項1に記載のリザバーコンピューティング装置。
【請求項3】
前記マスキング手段は、前記第jマスキングデータセットに含まれるマスキングデータを所定の時間間隔毎に前記第j変調手段に出力し、
前記第j変調手段から前記多重手段、前記分岐手段、前記第jフィルタ手段及び前記第j出力手段を介して前記第j変調手段に至る経路の遅延は、前記所定の時間間隔のM倍(Mは2以上の整数)であり、
Mの値は、前記N1から前記NJの値それぞれとは異なる、請求項1に記載のリザバーコンピューティング装置。
【請求項4】
前記M及び前記N1から前記NJの値は互いに素である、請求項3に記載のリザバーコンピューティング装置。
【請求項5】
前記N1から前記NJの値の合計はNである、請求項1から4のいずれか1項に記載のリザバーコンピューティング装置。
【請求項6】
前記マスキング手段は、前記N1から前記NJの値を周期的に変更する、請求項1から5のいずれか1項に記載のリザバーコンピューティング装置。
【請求項7】
前記第jフィルタ手段は、前記信号光に含まれる前記第1変調光から前記第J変調光の内の少なくとも1つを減衰させ、かつ、前記第1変調光から前記第J変調光の内の少なくとも2つの変調光を含む前記第j受信光を出力する、請求項1から6のいずれか1項に記載のリザバーコンピューティング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リザバーコンピューティング技術に関する。
【背景技術】
【0002】
回帰型ニューラルネットワーク(RNN)は、入力層と、リカレント層(リザバー層)と、出力層と、で構成される。一般的に、RNNの学習においては、入力層、リカレント層及び出力層それぞれの重み(係数)を更新する。リザバーコンピューティングとは、RNNの一種であるが、学習の際には出力層の重みのみを更新し、入力層及びリカレント層の重みを更新しないRNNである。リザバーコンピューティングにおいて、入力層及びリカレント層の重みは、例えば、ランダムに生成した固定値に設定される。出力層の重みしか更新しない代わりに、リザバーコンピューティングにおいては、リカレント層におけるニューロン数を膨大にする。
【0003】
このリザバーコンピューティングのリカレント層をハードウェア的に実現したものは、"物理リザバーコンピューティング"と呼ばれる。非特許文献1及び非特許文献2は、ニューロンを時間軸上に展開する物理リザバーコンピューティングを開示している。例えば、リカレント層への入力が、N個の入力データを1組とし(以下、N個の入力データを含む1組の入力を"入力データセット"と表記する。)、この入力データセットがリカレント層に連続的に入力されるものとする。この場合、例えば、リカレント層のランダムな重みを表現するために、入力データセット内のN個の入力データに対して所定の振幅変動を与える。この操作はマスキングと呼ばれる。
図1は、マスキング処理の説明図である。
図1において、D#p-qは、p番目の入力データセット内のN個の入力データの内のq番目の入力データを示している。マスキング係数セットは、N個のマスキング係数F#1~F#Nで構成される。入力データD#p-qには、マスキング係数F#qが乗じられる。
【0004】
マスキングされた入力データ(以下、マスキングデータ)は、フィードバック機構に入力される。フィードバック機構は、あるマスキングデータがM個後のマスキングデータと干渉する様に設定される。言い換えると、フィードバック機構は、その内部にM個のマスキングデータが同時に存在できる様に構成される。以下の説明において、この数Mを、"ループ内のニューロン数"とも表記する。
図2は、N=6、かつ、M=5の例を示している。
図2においては、データD#p-qをマスキング係数F#qで処理したマスキングデータをM#p-qと表記している。
図2に示す様に、マスキング係数F#6で処理されたマスキングデータM#1-6は、先に入力され、マスキング係数#1で処理されたマスキングデータM#1-1と干渉(結合)する。さらに、マスキング係数#5で処理されたマスキングデータM#2-5は、マスキングデータ#1-1とマスキングデータ#6-6との干渉により生成されたデータ(
図2では、M#ZZZと表記。)と干渉する。
【0005】
これは、リカレント層のあるニューロンにおいて、入力データD#1-1をマスキング係数F#1で重み付けした値と、入力データD#1-6をマスキング係数F#6で重み付けした値と、入力データD#2-5をマスキング係数F#5で重み付けした値の和を求めることに対応する。この様に、異なるマスキング係数で処理されたデータを回帰的に結合(干渉)させることで、多数のニューロンが回帰的に結合するRNNのリカレント層をハードウェア的に実現することができる。なお、例えば、NとMを同じ値とすると、同じマスキング係数で処理された、入力データセット内の順番が同じ入力データ同士の干渉しか生じない。このため、例えば、N及びMは異なる値に設定される。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Nakajima,M.,Tanaka,K.&Hashimoto,T."Scalable reservoir computing on coherent linear photonic processor"Commun Phys4,20,2021年
【非特許文献2】Satoshi Sunada and Atsushi Uchida,"Photonic neural field on a silicon chip: large-scale,high-speed neuro-inspired computing and sensing", Optica 8,1388-1396,2021年
【発明の概要】
【発明が解決しようとする課題】
【0007】
リザバーコンピューティングにおいては、リカレント層におけるニューロン数を膨大にし、各ニューロン間の結合の複雑度を増加させることが好ましい。
【0008】
本発明は、ニューロン間の結合の複雑度を増加させることができるリザバーコンピューティング装置を提供するものである。
【課題を解決するための手段】
【0009】
本発明の一態様によると、リザバーコンピューティング装置は、第1周波数から第J周波数(Jは3以上の整数)のJ個の異なる周波数の連続光を生成する生成手段と、第j周波数(jは1からJまでの整数)の第j連続光を第jデータで変調することで第j変調光を生成する第j変調手段と、第1変調光から第J変調光を波長多重することで信号光を生成する多重手段と、前記信号光をJ個に分岐して出力する分岐手段と、前記分岐手段が出力するJ個の前記信号光の内のj番目の前記信号光をフィルタして第j受信光を出力する第jフィルタ手段と、前記第j受信光を光電変換して第j出力データを出力する第j出力手段と、第1入力データから第N入力データ(NはJ以上の整数)を含む入力データセットの第k入力データ(kは1~Nまでの整数)に第k係数を乗じることでN個のマスキングデータを生成し、前記N個のマスキングデータをJ個に分割することで、第1マスキングデータセットから第Jマスキングデータセットを生成し、第jマスキングデータセットに含まれるNj個のマスキングデータを順に前記第j変調手段に出力するマスキング手段と、を備え、前記第jデータは、前記第j出力データに、前記第jマスキングデータセットに含まれるマスキングデータを加算したものであり、前記第1マスキングデータセットから前記第Jマスキングデータセットそれぞれに含まれるマスキングデータの数であるN1からNJの値は互いに異なり、第1フィルタ手段から第Jフィルタ手段の通過帯域はそれぞれ異なる。
【発明の効果】
【0010】
本発明によると、ニューロン間の結合の複雑度を増加させることができる。
【図面の簡単な説明】
【0011】
【
図1】ニューロンを時間軸上に展開する物理リザバーコンピューティングの説明図。
【
図2】ニューロンを時間軸上に展開する物理リザバーコンピューティングの説明図。
【
図3】一実施形態によるリザバーコンピューティング装置の構成図。
【
図4】一実施形態によるリザバーコンピューティング装置における処理の説明図。
【
図5】一実施形態による各フィルタの通過帯域の説明図。
【
図6】一実施形態によるリザバーコンピューティング装置における処理の説明図。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうちの二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
【0013】
図3は、本実施形態によるリザバーコンピューティング装置のリカレント層の構成図である。本実施形態のリザバーコンピューティング装置は、ニューロンを時間軸及び周波数軸の両方の軸上に展開する。本実施形態においては、周波数の数Jを3とするが例示であり、周波数の数Jは3以上の任意の数とし得る。また、本実施形態においては、入力データセット内の入力データの数Nを12とするが例示であり、入力データセット内の入力データの数NはJ以上の適切な数であり得る。入力データセット内の入力データの数Nが12であるため、マスキング係数は、F#1~F#12の12個になる。
【0014】
マスキング部7は、入力層からの入力データセット内のN個の入力データのマスキング処理を行ってN個のマスキングデータを生成する。続いて、マスキング部7は、N個のマスキングデータを、周波数の数Jと同じ3つに分割してマスキングデータセット#1~#3を生成する。本実施形態では、1つのマスキングデータセット#1に含まれるマスキングデータの数N1を3とし、1つのマスキングデータセット#2に含まれるマスキングデータの数N2を4とし、1つのマスキングデータセット#3に含まれるマスキングデータの数N3を5とする。マスキング部7は、マスキングデータセット#1のマスキングデータを順に変調器21に出力し、マスキングデータセット#2のマスキングデータを順に変調器22に出力し、マスキングデータセット#3のマスキングデータを順に変調器23に出力する。
【0015】
図4は、この様子を示している。なお、
図4の各四角形はマスキングデータに対応し、四角形内のF#k(kは1~12までの整数)は、当該四角形に対応するマスキングデータを生成するために使用したマスキング係数を示している。また、
図4の四角形の網掛の形状が同じものは、同じ入力データセット内の入力データに基づくマスキングデータであることを示している。例えば、
図4の3つのF#1は、異なる入力データセットの1番目の入力データをマスキング係数F#1でマスキングしたものである。
図4に示す様に、マスキング部7は、マスキング係数F#1~F#3で処理された3つのマスキングデータをマスキングデータセット#1とし、マスキングデータセット#1のマスキングデータを順に変調器21に出力している。また、マスキング部7は、マスキング係数F#4~F#7で処理された4つのマスキングデータをマスキングデータセット#2とし、マスキングデータセット#2のマスキングデータを順に変調器22に出力している。さらに、マスキング部7は、マスキング係数F#8~F#12で処理された5つのマスキングデータをマスキングデータセット#3とし、マスキングデータセット#3のマスキングデータを順に変調器23に出力している。
【0016】
図3に戻り、光源11~13は、それぞれ、第1周波数から第3周波数の連続光を生成して変調器21~23に出力する。なお、第1周波数から第3周波数は互いに異なる周波数である。本実施形態ではJ=3であるため、3つの異なる周波数の連続光を生成している。変調器21は、マスキングデータセット#1のマスキングデータと出力データ#1との合成データにより光源11が出力する連続光を変調することで第1変調光を出力する。同様に、変調器22は、マスキングデータセット#2のマスキングデータと出力データ#2との合成データにより光源12が出力する連続光を変調することで第2変調光を出力し、変調器23は、マスキングデータ#3と出力データ#3との合成データにより光源13が出力する連続光を変調することで第3変調光を生成して出力する。
【0017】
多重部3は、第1変調光~第3変調光を波長多重した信号光を出力する。
図5(A)は、信号光の周波数成分を示している。信号光は、第1変調光91と、第2変調光92と、第3変調光93と、を含む。カップラ5は、信号光を周波数の数Jと同じ3つに分岐して、各信号光をフィルタ81~フィルタ83に出力する。フィルタ81~フィルタ83それぞれは、通過帯域が異なる。
図5(B)~
図5(D)は、それぞれ、フィルタ81~フィルタ83を通過した後の信号光の周波数成分を示している。フィルタ81は、第2変調光92を減衰させ、フィルタ82は、第3変調光93を減衰させ、フィルタ83は、第1変調光91を減衰させている。以下、フィルタ81を通過した信号光を第1受信光と表記し、フィルタ82を通過した信号光を第2受信光と表記し、フィルタ83を通過した信号光を第3受信光と表記する。フォートダイオード(PD)61~63は、それぞれ、第1受信光~第3受信光の光電変換を行って、出力データ#1~出力#データ3を生成する。出力データ#1~出力データ#3は、図示しない出力層に出力されると共に、変調器21~変調器23にフィードバックされる。
【0018】
なお、マスキング部7は、時間間隔T毎に1つのマスキングデータを変調器21~変調器23に出力する。また、変調器21~変調器23から多重部3、カップラ5、フィルタ81~83及びPD61~63を介して変調器21~変調器23に至るループ経路の遅延をM×T(Mは2以上の整数)とする。Mは、上述したループ内のニューロン数に対応する。
【0019】
図3の構成において、カップラ5の代わりに波長分離部を設け、かつ、フィルタ81~83を削除し、波長分離部が出力する第1変調光をPD61に出力し、波長分離部が出力する第2変調光をPD62に出力し、波長分離部が出力する第3変調光をPD63に出力する様にしたものとする。この場合、変調器21からPD61を介して変調器21に至る経路と、変調器22からPD62を介して変調器22に至る経路と、変調器23からPD63を介して変調器23に至る経路と、の合計3つの経路は、それぞれ、上述したニューロンを時間軸上に展開する物理リザバーコンピューティングと同様の構成になる。つまり、その様な構成は、時間軸上に展開する3つの物理リザバーコンピューティングを独立して設けたものとなる。時間軸上におけるニューロンの結合を複雑化するため、ループ内のニューロン数Mは、マスキングデータセット#1~#3内のマスキングデータの数N
1=3、N
2=4、N
3=5のいずれとも異なる値となる様に、例えば、互いに素の関係となる様に設定される。例えば、本例においてはM=7に設定され得る。
【0020】
本実施形態では、カップラ5と、フィルタ81~83と、PD61~63と、により、異なる周波数のマスキングデータ間の結合を生じさせる。例えば、
図5(B)に示す様に、PD61が出力する出力データ#1は、第1変調光91と、第3変調光93と、に基づくものである。これは、
図4の1番目の入力データセット内の1番目の入力データと、8番目の入力データをPD61において結合させることに対応する。PD62が出力する出力データ#2は、第1変調光91と、第2変調光92と、に基づくものである。これは、
図4の1番目の入力データセット内の1番目の入力データと、4番目の入力データをPD62において結合させることに対応する。PD63が出力する出力データ#3は、第2変調光92と、第3変調光93と、に基づくものである。これは、
図4の1番目の入力データセット内の1番目の入力データと、8番目の入力データをPD63において結合させることに対応する。なお、これら3つの入力データは、異なるマスキング係数によりマスキングされている。時間軸上と同様に、N
1とN
2とN
3が同じ値であると、干渉するマスキングデータのマスキングに使用されたマスキング係数が同じとなる。このため、N
1、N
2及びN
3についても互いに異なる値、例えば、互いに素となる様に設定する。より詳細には、M、N
1、N
2及びN
3についても互いに異なる値、例えば、互いに素となる様に設定する。
【0021】
この様に、ニューロンを時間軸上のみならず周波数軸上でも結合させることによりニューロン間の結合の複雑度を増加させることができる。なお、周波数の数J(Jは3以上の整数)の場合、J個のフィルタが設けられ、かつ、J個のフィルタそれぞれの通過帯域は異なる。また、J個のフィルタは、信号光に含まれるJ個の変調光の内の少なくとも1つを阻止/又は減衰させ、かつ、少なくとも2つの変調光を含む受信光をPDに出力する。
【0022】
なお、
図4から明らかな様に、同じ入力データセット内の入力データから生成したマスキングデータをマスキング部7が出力するタイミングのズレは、時間の経過により大きくなる。例えば、
図4において、3番目の入力データセット内の9番目の入力データに基づくマスキングデータが出力されるタイミングは、3番目の入力データセット内の1番目の入力データに基づくマスキングデータが出力されるタイミングより、5Tだけ遅くなっている。なお、Tは、上述した様に、マスキング部7がマスキングデータを出力する時間間隔である。
図4には示していないが、3番目の入力データセット内の12番目の入力データに基づくマスキングデータが出力されるタイミングは、3番目の入力データセット内の1番目の入力データに基づくマスキングデータが出力されるタイミングより、8Tだけ遅くなる。
【0023】
このため、マッピング部4は、
図6(A)及び
図6(B)に示す様に、マスキングデータセット#1~#3内のマスキングデータの数N
1~N
3の値を周期的に入れ替える。
図6(A)及び
図6(B)においては、3番目の入力データセット内の入力データに基づくマスキングデータからN
1を3から5にし、N
3を5から3にしている。
図6(A)及び
図6(B)より、3番目の入力データセット内の入力データに基づくマスキングデータが出力されるタイミングの差の最大値は6Tとなっている。マスキングデータ#1~マスキングデータ#3に含めるマスキングデータは、
図6(A)及び
図6(B)のどちらであっても良く、さらに、
図6(A)及び
図6(B)とは異なるパターンであっても良い。
【0024】
以上の構成により、ニューロン間の結合の複雑度を増加させることができる。したがって、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
【符号の説明】
【0025】
11~13:光源、21~23:変調器、3:多重部、5:カップラ、61~63:PD、7:マスキング部、81~83:フィルタ