IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニバーシティ オブ セントラル フロリダ リサーチ ファウンデーション,インコーポレイテッドの特許一覧

特許7497063人工神経ネットワークのための光子テンソルアクセラレータ
<>
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図1
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図2
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図3
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図4A
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図4B
  • 特許-人工神経ネットワークのための光子テンソルアクセラレータ 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-31
(45)【発行日】2024-06-10
(54)【発明の名称】人工神経ネットワークのための光子テンソルアクセラレータ
(51)【国際特許分類】
   G06E 3/00 20060101AFI20240603BHJP
   G02F 3/00 20060101ALI20240603BHJP
   G02F 1/21 20060101ALI20240603BHJP
   G06N 3/067 20060101ALI20240603BHJP
【FI】
G06E3/00
G02F3/00
G02F1/21
G06N3/067
【請求項の数】 32
(21)【出願番号】P 2021543463
(86)(22)【出願日】2019-10-15
(65)【公表番号】
(43)【公表日】2022-06-27
(86)【国際出願番号】 US2019056239
(87)【国際公開番号】W WO2020180351
(87)【国際公開日】2020-09-10
【審査請求日】2022-10-07
(31)【優先権主張番号】62/842,771
(32)【優先日】2019-05-03
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】510170730
【氏名又は名称】ユニバーシティ オブ セントラル フロリダ リサーチ ファウンデーション,インコーポレイテッド
(74)【代理人】
【識別番号】110001601
【氏名又は名称】弁理士法人英和特許事務所
(72)【発明者】
【氏名】リ グイファン
(72)【発明者】
【氏名】パン ショーン
(72)【発明者】
【氏名】ウェン ヒー
【審査官】佐賀野 秀一
(56)【参考文献】
【文献】特開平09-211513(JP,A)
【文献】米国特許第08027587(US,B1)
【文献】国際公開第2017/210550(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06E 3/00
G02F 3/00
G02F 1/21
G06N 3/067
(57)【特許請求の範囲】
【請求項1】
ベクトル乗算のための光子ユニットであって、
第1のベクトルを表す第1の光信号を受信する第1の光マルチプレクサであって、該第1のベクトル内の各要素が、第1の多重化光信号を生成するために第1の光自由度及び/又は次元上で符号化され、かつ1回の乗算サイクル中に非一時的である前記第1の光マルチプレクサと、
前記第1の光信号とコヒーレントであって第2のベクトルを表す第2の光信号を受信する第2の光マルチプレクサであって、該第2のベクトル内の各要素が、第2の多重化光信号を生成するために前記第1のベクトルと同一の要素から直交の光自由度及び/又は次元マッピングを用いて符号化される前記第2の光マルチプレクサと、
前記第1の光マルチプレクサから前記第1の多重化光信号及び前記第2の光マルチプレクサから第2の多重化光信号を受信し、それらを組み合わせて全体干渉強度での前記第1のベクトルと前記第2のベクトルの乗算結果を含有する該第1の光信号及び第2の光信号間の干渉を生成するビーム結合器と、
を含むことを特徴とする光子ユニット。
【請求項2】
符号化するのに使用される前記第1の自由度及び/又は次元は、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも1つであることを特徴とする請求項1に記載の光子ユニット。
【請求項3】
符号化するのに使用される前記第1の光自由度及び/又は次元は、2又は3以上の光自由度及び/又は次元の組合せで構成される超次元であることを特徴とする請求項1に記載の光子ユニット。
【請求項4】
前記空間モードは、
エルミート-ガウスモード、
ラゲール-ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも1つである、
ことを特徴とする請求項2に記載の光子ユニット。
【請求項5】
干渉信号が、非線形光学要素に入ることを特徴とする請求項2に記載の光子ユニット。
【請求項6】
前記全体干渉強度は、電気信号に変換されることを特徴とする請求項2に記載の光子ユニット。
【請求項7】
前記電気信号は、非線形電気要素に入ることを特徴とする請求項6に記載の光子ユニット。
【請求項8】
M×1ベクトルとのN×Mマトリクス乗算のための光子ユニットであって、
M個の要素を有する少なくともM×1ベクトルを表す少なくとも第1の光信号を受信する第1の光マルチプレクサであって、該M×1ベクトル内の各要素が、第1の多重化光信号を生成するために第1の直交光自由度及び/又は次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、Mが、1よりも大きいか又はそれに等しい正の整数である前記第1の光マルチプレクサと、
前記M×1ベクトルを表す少なくとも前記第1の光信号を第2の直交光自由度及び/又は次元でのN個の追加の光信号内で複数のN個のコピーの中に複製するための光複製器であって、Nが、1よりも大きいか又はそれに等しい正の整数である前記光複製器と、
前記光複製器と同一であり、各々がM個の追加の光信号を受信する前記第2の直交光自由度及び/又は次元でのN個の光マルチプレクサであって、該M個の追加の光信号の各々が、前記第1の光信号とコヒーレントであり、前記N個の追加の光信号の各々が、M×Nマトリクスの独立行を表し、該M×Nマトリクスの行内の各要素が、N個の追加の多重化光信号を生成するために前記M×1ベクトルを表す該第1の光信号と同一の要素から直交の光自由度及び/又は次元マッピングを用いて符号化される前記N個の光マルチプレクサと、
前記第1の光マルチプレクサから前記第1の多重化光信号のN個のコピー及び前記N個の光マルチプレクサから前記N個の追加の多重化光信号を受信し、それらを組み合わせてN個の全体干渉強度での前記M×Nマトリクスと前記M×1ベクトルの乗算結果を含有する該第1の光信号と該N個の追加の光信号の各々との間の干渉のN回の発生を生成する少なくとも1つのビーム結合器と、
を含むことを特徴とする光子ユニット。
【請求項9】
符号化又は複製のために使用される前記第1及び前記第2の直交光自由度及び/又は次元のうちの少なくとも一方が、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも1つであることを特徴とする請求項8に記載の光子ユニット。
【請求項10】
符号化又は複製のために使用される前記第1及び前記第2の直交光自由度及び/又は次元のうちの少なくとも一方が、2又は3以上の光自由度及び/又は次元の組合せで構成される超次元であることを特徴とする請求項8に記載の光子ユニット。
【請求項11】
符号化又は複製のために使用される前記第1及び前記第2の直交光自由度及び/又は次元は、光の次元又は超次元の非重複部分集合であることを特徴とする請求項8に記載の光子ユニット。
【請求項12】
空間モードが、
エルミート-ガウスモード、
ラゲール-ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも1つである、
ことを特徴とする請求項8に記載の光子ユニット。
【請求項13】
少なくとも1つの干渉信号が、非線形光学要素に入ることを特徴とする請求項8に記載の光子ユニット。
【請求項14】
少なくとも1つの全体干渉強度が、電気信号に変換されることを特徴とする請求項8に記載の光子ユニット。
【請求項15】
前記電気信号は、非線形電気要素に入ることを特徴とする請求項14に記載の光子ユニット。
【請求項16】
M×WマトリクスとのN×Mマトリクス乗算のための光子ユニットであって、
N×MマトリクスのM個の要素を有する独立行を各々が表すN個の光信号を受信する第1の直交光自由度及び/又は次元でのN個の光マルチプレクサの第1のセットであって、該N×Mマトリクスの各独立行内の各要素が、N個の多重化光信号を生成するために第2の直交光自由度及び/又は次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、M及びNの各々が、1よりも大きいか又はそれに等しい正の整数である前記N個の光マルチプレクサの第1のセットと、
N×Mマトリクスの独立行を表す前記N個の多重化光信号の各々を第3の直交光自由度及び/又は次元での複数のW個のコピーの中に複製するための第1の光複製器であって、Wが、1よりも大きいか又はそれに等しい正の整数である前記第1の光複製器と、
W個の追加の光信号を受信する前記第1の光複製器と同一である前記第3の直交光自由度及び/又は次元でのW個の光マルチプレクサの第2のセットであって、該W個の追加の光信号の各々が、前記N個の光信号とコヒーレントであり、該W個の追加の光信号の各々が、前記M×WマトリクスのM個の要素を有する独立列を表し、該M×Wマトリクスの各独立列内の各要素が、W個の追加の多重化光信号を生成するために前記N×Mマトリクスの各独立行内の各要素と同一の要素から直交の光自由度及び/又は次元マッピングを用いて符号化される前記W個の光マルチプレクサの第2のセットと、
前記M×Wマトリクスの独立列を表す前記W個の追加の多重化信号の各々を前記N個の光マルチプレクサの第1のセットと同一である前記第1の直交光自由度及び/又は次元での複数のN個のコピーの中に複製するための第2の光複製器と、
前記N×Mマトリクス及び前記M×Wマトリクスのうちの各々の適切に複製された行又は列を表すN×W個の多重化光信号の2つのセットを受信し、それらを組み合わせてN×W個の全体干渉強度での乗算結果を含有する該N×Mマトリクスの行の各々と該M×Wマトリクスの該列との間の干渉のN×W回の発生を生成する少なくとも1つのビーム結合器と、
を含むことを特徴とする光子ユニット。
【請求項17】
符号化又は複製のために使用される前記第1、前記第2、前記第3、及び第4の直交光自由度及び/又は次元のうちの少なくとも1つが、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも1つであることを特徴とする請求項16に記載の光子ユニット。
【請求項18】
符号化又は複製のために使用される前記第1、前記第2、及び前記第3の直交自由度及び/又は次元のうちの少なくとも1つが、2又は3以上の光自由度及び/又は次元の組合せで構成される超次元であることを特徴とする請求項16に記載の光子ユニット。
【請求項19】
符号化又は複製のために使用される前記第1、前記第2、及び前記第3の直交光自由度及び/又は次元のうちの少なくとも2つが、光の次元又は超次元の非重複部分集合であることを特徴とする請求項16に記載の光子ユニット。
【請求項20】
空間モードが、
エルミート-ガウスモード、
ラゲール-ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも1つである、
ことを特徴とする請求項16に記載の光子ユニット。
【請求項21】
少なくとも1つの干渉信号が、非線形光学要素に入ることを特徴とする請求項16に記載の光子ユニット。
【請求項22】
少なくとも1つの全体干渉強度が、電気信号に変換されることを特徴とする請求項16に記載の光子ユニット。
【請求項23】
前記電気信号は、非線形電気要素に入ることを特徴とする請求項22に記載の光子ユニット。
【請求項24】
B個のN×MマトリクスにM×Wマトリクスを乗じるバッチを加算するための光子ユニットであって、
第1のM×NマトリクスのM個の要素を各々が有する独立行を各々が表すN個の光信号を受信する第1の直交光自由度及び/又は次元でのN個の光マルチプレクサの第1のセットであって、該第1のM×Nマトリクスの各独立行内の各要素が、N個の多重化光信号を生成するために第2の直交光自由度及び/又は次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、M及びNの各々が、1よりも大きいか又はそれに等しい正の整数である前記N個の光マルチプレクサの第1のセットと、
第1のN×Mマトリクスの独立行を表す前記N個の多重化光信号の各々をN×Mマトリクスの第3の直交光自由度及び/又は次元での複数のW個のコピーの中に複製するための第1の光複製器であって、Wが、1よりも大きいか又はそれに等しい正の整数である前記第1の光複製器と、
B個のN×Mマトリクスのうちの1つの独立行を表す前記N個の多重化光信号の第3の直交自由度及び/又は次元でのW個のコピーを各々が含有するB個の光信号を受信する第4の直交光自由度及び/又は次元での第2のマルチプレクサであって、Bが、1よりも大きいか又はそれに等しい正の整数である前記第2のマルチプレクサと、
W個の追加の光信号を受信する前記第1の光複製器によって使用されるものと同一である前記第3の直交光自由度及び/又は次元でのW個の光マルチプレクサの第3のセットであって、該W個の追加の光信号の各々が、前記N個の光信号とコヒーレントであり、該W個の追加の光信号の各々が、前記M×Wマトリクスのうちの各々のM個の要素を有する独立列を表し、該M×Wマトリクスの各独立列内の各要素が、W個の追加の多重化光信号を生成するために前記N×Mマトリクスのうちの各々の各独立行内の各要素と同一の要素から直交の光自由度及び/又は次元マッピングを用いて符号化される前記W個の光マルチプレクサの第3のセットと、
前記M×Wマトリクスの独立列を表す前記W個の追加の多重化光信号の各々を前記N個の光マルチプレクサの第1のセットと同一である前記第1の直交光自由度及び/又は次元での複数のN個のコピーの中に複製するための第2の光複製器と、
前記M×Wマトリクスのうちの各々の独立列を表す前記W個の追加の多重化信号の前記第1の直交自由度及び/又は次元でのN個のコピーを各々が含有するB個の同一光信号を生成する前記第4の直交光自由度及び/又は次元での第3の光複製器と、
前記第2のマルチプレクサ及び前記第3の光複製器からB×N×W個の多重化光信号の2つのセットを受信し、それらを組み合わせてN×W個の全体干渉強度でのB個の個別のN×Mマトリクスに同じM×Wマトリクスを乗じた乗算の総和を含有する干渉のN×W回の発生を生成する少なくとも1つのビーム結合器であって、前記第1の直交光自由度及び/又は次元、前記第2の直交光自由度及び/又は次元、前記第3の直交光自由度及び/又は次元、及び前記第4の直交光自由度及び/又は次元が異なる前記少なくとも1つのビーム結合器と、
を含むことを特徴とする光子ユニット。
【請求項25】
符号化又は複製のために使用される前記第1、前記第2、前記第3、及び前記第4の直交光自由度及び/又は次元のうちの少なくとも1つが、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも1つであることを特徴とする請求項24に記載の光子ユニット。
【請求項26】
符号化又は複製のために使用される前記第1、前記第2、前記第3、及び前記第4の直交光自由度及び/又は次元のうちの少なくとも1つが、2又は3以上の光自由度及び/又は次元の組合せで構成される超次元であることを特徴とする請求項24に記載の光子ユニット。
【請求項27】
符号化又は複製のために使用される前記第1、前記第2、前記第3、及び前記第4の直交光自由度及び/又は次元のうちの少なくとも2つが、光の次元又は超次元の非重複部分集合であることを特徴とする請求項24に記載の光子ユニット。
【請求項28】
空間モードが、
エルミート-ガウスモード、
ラゲール-ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも1つである、
ことを特徴とする請求項24に記載の光子ユニット。
【請求項29】
少なくとも1つの干渉信号が、非線形光学要素に入ることを特徴とする請求項24に記載の光子ユニット。
【請求項30】
少なくとも1つの全体干渉強度が、電気信号に変換されることを特徴とする請求項24に記載の光子ユニット。
【請求項31】
前記電気信号は、非線形電気要素に入ることを特徴とする請求項30に記載の光子ユニット。
【請求項32】
各々が2よりも高い階数を有する2つのテンソルの乗算のための光子ユニットであって、
階数pを有する第1のテンソルを表す第1の光信号を受信する第1の光マルチプレクサであって、該第1のテンソルの形状が、[N,N,...,Np-1,M]である前記第1の光マルチプレクサと、
前記第1のテンソルの各要素を1番目の階数からp番目の階数までに沿ってそれぞれ1番目からp番目までの直交自由度及び/又は次元に対して符号化するための第1の符号器と、
階数qを有する第2のテンソルを表し、前記第1の光信号とコヒーレントである第2の光信号を受信する第2の光マルチプレクサであって、該第2のテンソルの形状が、[M,W,...,Wq-1].N,N,...,Np-1,M,W,...,Wq-1であり、p及びqの各々が、1よりも大きいか又はそれに等しい正の整数である前記第2の光マルチプレクサと、
前記テンソルを表す多重化光信号を(p+1)番目から(p+q)番目までの直交光自由度及び/又は次元での複数のW×W×...×Wq-1個のコピーの中に複製するための光複製器の第1のセットと、
前記第2のテンソルの各要素を前記第1のテンソルの(p+1)番目から(p+q)番目までの直交自由度及び/又は次元の複製物と同一の要素から直交の光自由度及び/又は次元マッピングを用いて1番目の階数からq番目の階数までに沿ってそれぞれ(p)番目から(p+q-1)番目までの直交自由度及び/又は次元の上に符号化するための第2の符号器と、
前記第2のテンソルを表す前記多重化信号を前記第1のテンソルの1番目から(p-1)番目までの直交自由度及び/又は次元のように前記要素から直交の光自由度及び/又は次元マッピングと同一である1番目から(p-1)番目までの直交光自由度及び/又は次元での複数のN1×N2×...×Np-1個のコピーの中に複製するための光複製器の第2のセットと、
光複製器の前記第1のセット及び前記第2のセットの2つのセットから[N1,N2,...,Np-1,M,W1,...,Wq-1]個の多重化光信号の2つのセットを受信し、それらを組み合わせて干渉強度でのN1×N2×...×Np-1×W1×...×Wq-1個の個別のM-要素ベクトル-ベクトル乗算の総和を含有する干渉の[N1,N2,...,Np-1,W1,...,Wq-1]回の発生を生成する少なくとも1つのビーム結合器と、
を含むことを特徴とする光子ユニット。
【発明の詳細な説明】
【技術分野】
【0001】
〔関連出願への相互参照〕
この出願は、この出願と同じ出願人に譲渡されて引用によって本明細書にその教示が全体的に組み込まれている代理人整理番号UCF34129PROVで2019年5月3日に出願された「人工神経ネットワークのための光子テンソルアクセラレータ(Photonic Tensor Accelerators for Artificial Neural Networks)」という名称の米国仮特許出願第62/842,771号に関連し、かつそれに対する優先権を主張するものである。
【背景技術】
【0002】
本出願は、一般的に光コンピューティング、より具体的には、ベクトル-ベクトル、マトリクス-ベクトル、マトリクス-マトリクス、バッチマトリクス-マトリクス、及びテンソル-テンソル乗算のための光子アクセラレータに関する。
【0003】
この出願は、番号を有するカギ括弧、例えば、xを番号として[x]で表示する引用文献を含む。引用文献のこの番号リストは、この出願の最後に見出される。更に、これらの引用文献は、本出願と共に提出する情報公開陳述書(IDS)に列記している。列記したこれらの引用文献の各々の教示は、これによりその全体が引用によって本明細書に組み込まれる。
【0004】
エレクトロニクス及びフォトニクスは、多かれ少なかれ、今日まで情報社会でのそれらのそれぞれの技術的役割を切り開いてきた。電子のフェルミ粒子性に起因して、エレクトロニクスは、情報の発生及び処理のための技術を支配してきた。同様に、光子のボース粒子性に起因して、フォトニクスは、エレクトロニクスもレーザ及び光ファイバの発明の前では通信技術を支配してきたが、最近数十年での情報伝達に関する技術を支配している。長らく予想されてきたように、電子集積回路(IC)の処理パワーは、遅かれ早かれ、ムーアの法則による成長はしなくなることになる。この予想は、過去半世紀にわたって光及び光子情報処理を探求するように光学及びフォトニクス社会を断続的に刺激している。これらの努力は、光トランジスタ[1]、[2]及び汎用光コンピューティングのための論理ゲート[3]、[4]、並びに専用情報処理のためのフーリエ光学[5]を含む。しかし、1980年代の終わりまでに、コンピューティングでの光学の役割及び機能を実際以上に評価するという間違いは、この分野を既に何度か後退させ、続く二十年でこの分野を殆ど休眠状態にした[6]。
【0005】
近年では、ICは、クロック速度を高めるのに必要とされる小さいデバイス特徴部に関連付けられた高密度電力消費からの熱を放散させる難しさに主として起因して、実際にムーアの法則による指数関数的な成長を持続させることができなくなっている。従って、コンピューティングパワーでのICの拡張性に対する制限因子は、全電力ではなく電力密度である。ムーアの法則後の時代では、拡張性問題に対する業界のソリューションは、単一CPUを有するノイマンアーキテクチャとは対照的に、グラフィック処理ユニット(GPU)及びテンソル処理ユニット(TPU)のような並列コンピュータ構造及び特定のコンピューティング目的のための最適化されたローカルメモリを有するハードウエアアクセラレータ[7]、[8]を構成することである。これらのハードウエアアクセラレータからの利益を受けて、人工神経ネットワーク(ANN)を用いて実施される人工知能(AI)/機械学習(ML)に基づく新しい用途は、生のIC処理パワーの停滞にも関わらず、学界、産業界、及び一般社会の事実上あらゆる隅々に拡散した。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明は、ベクトル-ベクトル乗算、マトリクス-ベクトル乗算、マトリクス-マトリクス乗算、バッチマトリクス-マトリクス乗算、及びテンソル-テンソル乗算のための光子ユニットである。ベクトル-ベクトル乗算の場合に、光子デバイスは、第1のベクトルを表す第1の光信号を受信する第1の光マルチプレクサを含み、第1のベクトルベクトル内の各要素は、第1の多重化光信号を生成するために光の第1の自由度(DOF)/次元上で符号化され、かつ1回の乗算サイクル中に非一時的である。光子ユニットは、第1の光信号とコヒーレントであって第2のベクトルを表す第2の光信号を受信する光マルチプレクサを含み、第2のベクトル内の各要素は、第2の多重化光信号を生成するために第1のベクトルと同一の要素から直交の光自由度(DOF)/次元マッピングを用いて符号化される。光子ユニットはまた、第1の光マルチプレクサから第1の多重化光信号及び第2の光マルチプレクサから第2の多重化光信号を受信し、それらを組み合わせて全体干渉強度での第1のベクトルと第2のベクトルの乗算結果を含有する第1の光信号と第2の光信号の間の干渉を生成するビーム結合器を含む。この累算は、DOF全体を必要とせず、むしろ符号化に使用されなかったDOF内の特定の点又はパラメータを必要とする。
【0007】
M×1ベクトルとのN×Mマトリクス乗算の場合に、光子ユニットは、M個の要素を有する少なくともM×1のベクトルを表す少なくとも第1の光信号を受信する第1の光マルチプレクサを含み、M×1ベクトル内の各要素は、第1の多重化光信号を生成するために第1の直交光自由度(DOF)/次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、Mは、1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、第2の直交光自由度(DOF)/次元でのN個の追加の光信号内でM×1ベクトルを表す少なくとも第1の光信号を複数のN個のコピーの中に複製するための光複製器を含み、Nは、1よりも大きいか又はそれに等しい正の整数である。光子ユニットはまた、光複製器と同一であってM個の追加の光信号を各々が受信する第2の直交光自由度(DOF)/次元でのN個の光マルチプレクサを含み、M個の追加の光信号の各々は、第1の光信号とコヒーレントであり、N個の追加の光信号の各々は、M×Nマトリクスの独立行を表し、M×Nマトリクスの行内の各要素は、N個の追加の多重化光信号を生成するために、M×1ベクトルを表す第1の光信号と同一の要素から直交の光自由度(DOF)/次元マッピングを用いて符号化される。光子ユニットはまた、第1の光マルチプレクサから第1の多重化光信号のN個のコピー及びN個の光マルチプレクサからN個の追加の多重化光信号を受信し、それらを組み合わせてN個の全体干渉強度でのM×NマトリクスとM×1ベクトルとの乗算結果を含有する第1の光信号とN個の追加の光信号の各々との間の干渉のN回の発生を生成する少なくとも1つのビーム結合器を含む。
【0008】
M×WマトリクスとのN×Mマトリクス乗算の場合に、光子ユニットは、N個の光信号の各々がN×MマトリクスのM個の要素を有する独立行を表すN個の光信号を受信する第1の直交光自由度(DOF)/次元でのN個の光マルチプレクサの第1のセットを含み、N×Mマトリクスの各独立行内の各要素は、N個の多重化光信号を生成するために、第2の直交光自由度(DOF)/次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、M及びNは、各々が1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、N×Mマトリクスの独立行を表すN個の多重化光信号の各々を第3の直交光自由度(DOF)/次元での複数のW個のコピーの中に複製するための第1の光複製器を含み、Wは、1よりも大きいか又はそれに等しい正の整数である。光子ユニットはまた、W個の追加の光信号を受信する第3の直交光自由度(DOF)/次元での第1の光複製器と同一であるW個の光マルチプレクサの第2のセットを含み、W個の追加の光信号の各々は、N個の光信号とコヒーレントであり、W個の追加の光信号の各々は、M×WマトリクスのM個の要素を有する独立列を表し、M×Wマトリクスの各独立列内の各要素は、W個の追加の多重化光信号を生成するために、N×Mマトリクスの各独立行内の各要素と同一の要素から直交の光自由度(DOF)/次元マッピングを用いて符号化される。光子ユニットは、M×Wマトリクスの独立列を表すW個の多重化光信号の各々を第1の直交光自由度(DOF)/次元での複数のN個のコピーの中に複製するためのN個の光マルチプレクサの第1のセットと同一である第2の光複製器を含む。光子ユニットはまた、N×Mマトリクス及びM×Wマトリクスのうちの各々の適切に複製された行又は列を表すN×W個の多重化光信号の2つのセットを受信し、それらを組み合わせてN×W個の全体干渉強度での乗算結果を含有するN×Mマトリクスの行の各々とM×Wマトリクスの列との間の干渉のN×W回の発生を生成する少なくとも1つのビーム結合器を含む。
【0009】
B個のN×MマトリクスにM×Wマトリクスを乗じるバッチの場合に、光子ユニットは、第1のM×NマトリクスのM個の要素を各々が有する独立行をN個の光信号の各々が表すN個の光信号を受信する第1の直交光自由度(DOF)/次元でのN個の光マルチプレクサの第1のセットを含み、第1のM×Nマトリクスの各独立行内の各要素は、N個の多重化光信号を生成するために、第2の直交光自由度(DOF)/次元上で符号化され、かつ1回の乗算サイクル中に非一時的であり、M及びNは、各々が1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、第1のN×Mマトリクスの独立行を表すN個の多重化光信号の各々をN×Mマトリクスの第3の直交光自由度(DOF)/次元での複数のW個のコピーの中に複製するための第1の光複製器を含み、Wは、1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、B個のN×Mマトリクスのうちの1つの独立行を表すN個の多重化光信号の第3の直交自由度(DOF)/次元でのW個のコピーを各々が含有するB個の光信号を受信する第4の直交光自由度(DOF)/次元での第2のマルチプレクサを含み、Bは、1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、W個の追加の光信号を受信する第1の光複製器によって使用されるものと同一である第3の直交光自由度(DOF)/次元でのW個の光マルチプレクサの第3のセットを含み、W個の追加の光信号の各々は、N個の光信号とコヒーレントであり、W個の追加の光信号の各々は、M×Wマトリクスのうちの各々のM個の要素を有する独立列を表し、M×Wマトリクスの各独立列内の各要素は、W個の追加の多重化光信号を生成するために、N×Mマトリクスのうちの各々の各独立行内の各要素と同一の要素から直交の光自由度(DOF)/次元マッピングを用いて符号化される。光子ユニットは、M×Wマトリクスの独立列を表すW個の多重化信号の各々を第1の直交光自由度(DOF)/次元での複数のN個のコピーの中に複製するためのN個の光マルチプレクサの第1のセットと同一である第2の光複製器を含む。光子ユニットは、M×Wマトリクスのうちの各々の独立列を表すW個の多重化信号の第1の直交自由度(DOF)/次元でのN個のコピーを各々が含有するB個の同一光信号を生成する第4の直交光自由度(DOF)/次元での第3の光複製器を含む。光子ユニットは、B×N×W個の多重化光信号の2つのセットを第2のマルチプレクサ及び第3の光複製器から受信し、それらを組み合わせてN×W個の全体干渉強度でのB個の個別のN×Mマトリクスに同じM×Wマトリクスを乗じた乗算の総和を含有する干渉のN×W回の発生を生成する少なくとも1つのビーム結合器を含む。
【0010】
第1のテンソルが階数pを有し、第2のテンソルが階数qを有する2つのテンソルの乗算の場合に、第1のテンソルの形状は、[N,N,...,Np-1,M]であり、第2のテンソルの形状は、[M,W,...,Wq-1]である。N,N,...,Np-1,M,W,...,Wq-1は、各々が1よりも大きいか又はそれに等しい正の整数である。光子ユニットは、1番目の階数からp番目の階数までに沿って第1のテンソルの要素をそれぞれ1番目からp番目の直交自由度(DOF)/次元に対して符号化する。光子ユニットは、テンソルを表す多重化光信号を(p+1)番目から(p+q)番目までの直交光自由度(DOF)/次元での複数のW×W×...×Wq-1個のコピーの中に複製するための光複製器の第1のセットを含む。光子ユニットはまた、第1のテンソルの(p+1)番目から(p+q)番目までの直交自由度(DOF)/次元の複製物と同一の要素から直交の光自由度(DOF)/次元マッピングを用いて、1番目の階数からq番目の階数までに沿って第2のテンソルの要素をそれぞれ(p)番目から(p+q-1)番目までの直交自由度(DOF)/次元の上に符号化する。光子ユニットは、第2のテンソルを表す多重化信号を第1のテンソルの第1から第(p-1)までの直交自由度(DOF)/次元と同一の要素から直交の光自由度(DOF)/次元マッピングである第1から第(p-1)までの直交光自由度(DOF)/次元での複数のN×N×...×Np-1個のコピーの中に複製するための光複製器の第2のセットを含む。光子ユニットは、[N,N,...,Np-1,M,W,...,Wq-1]個の多重化光信号の2つのセットを光複製器の2つのセットから受信し、それらを組み合わせて干渉強度でのN×N×...×Np-1×W×...×Wq-1個の個別のM-要素ベクトル-ベクトル乗算の乗算の総和を含有する干渉の[N,N,...,Np-1,W,...,Wq-1]回の発生を生成する少なくとも1つのビーム結合器を含む。
【0011】
ベクトル-ベクトル、マトリクス-ベクトル、マトリクス-マトリクス、バッチマトリクス-マトリクス、及びテンソル-テンソル乗算のうちのいずれかに対する上述の干渉信号は、典型的には、非線形光学要素に入るか、又は全体干渉強度が電気信号に変換されてそれが非線形電気要素に入るかのいずれかである。
【0012】
一例では、符号化又は複製は、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも1つを使用する。空間モードは、エルミート-ガウスモード、ラゲール-ガウスモード、又は空間正規直交基底を形成する離散空間サンプルのうちの1つとすることができる。
【0013】
別の例では、符号化又は複製は、2又は3以上の光自由度(DOF)/次元の組合せで構成される超次元を使用する。
【0014】
別の例では、符号化又は複製に関して、少なくとも2つの直交光自由度(DOF)/次元は、光の次元又は超次元の非重複部分集合である。
【0015】
本発明、並びにその好ましい使用モード、更に別の目的、及び利点は、添付図面と共に読む時に例示的実施形態の以下の詳細説明を参照して最も良く理解されるであろう。
【図面の簡単な説明】
【0016】
図1】畳み込み隠れ層と完全接続外層とを有する人工神経ネットワークの図、及び人工神経ネットワークの実施での本発明、すなわち、光子テンソルアクセラレータの機能を示す図である。
図2】(a)はマトリクス乗算の図、(b)は乗累算演算に還元されてCPUを用いて実施される図2(a)のマトリクス乗算を示す図、(c)は乗累算演算に還元されてGPUを用いて実施される図2(a)のマトリクス乗算を示す図、(d)は乗累算演算に還元されてTPUを用いて実施され、メモリアクセスでの高い並列化と改善されたエネルギ効率とを有する図2(a)のマトリクス乗算を示す図である。
図3】電子アクセラレータと光子アクセラレータの間の性能比較の表である。
図4A】波長符号化光子マトリクスアクセラレータに基づくノード層の概略図である。
図4B】モード符号化光子マトリクスアクセラレータに基づくノード層の概略図である。
図5】マトリクス-マトリクス乗算のためのマッピングスキームの概略図である。
【発明を実施するための形態】
【0017】
非限定的定義
「ビーム結合器」という用語は、コヒーレントビームが互いに干渉し合うことを可能にするデバイスである。ビーム結合器は、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。
【0018】
「ビームスプリッタ」という用語は、伝播する光を2又は3以上の経路に分割することができるデバイスである。ビームスプリッタは、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。
【0019】
「要素から直交の光自由度(DOF)/次元マッピング」という用語は、マトリクス要素又はベクトル要素から波長、空間モード、偏光、直角位相、及び波数ベクトル成分を含む光の独立パラメータの間の対応である。
【0020】
「超次元」という用語は、2又は3以上の光自由度(DOF)/次元の組合せで構成されることを意味する。
【0021】
「次元又は超次元の部分集合」という用語は、1光自由度(DOF)/次元又は1光超次元での独立パラメータの部分集合を意味する。
【0022】
「光」という用語は、光スペクトルの可視部分と不可視部分の両方を含む電磁放射線である。
【0023】
「乗算サイクル」という用語は、単一計算サイクル中に含まれる数学的乗算演算を意味する。
【0024】
「ビーム複製器」という用語は、波長、空間モード、偏光、直角位相、及び波数ベクトルを含む入射光と同じ1又は2以上の指定パラメータを有する入射光の2又は3以上のコピーを生成するデバイスである。ビーム複製器は、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。
【0025】
背景
電子ハードウエアアクセラレータ(TPU及びGPU)が演じる重要な役割は、ANNでの将来の開発がソフトウエアとハードウエアの両方の進歩に依存することを明確に示している。しかし、現在、電子ハードウエアアクセラレータは、拡張性に関して既にその限界まで押しやられている。こうした経緯を踏まえて、光相互接続を益々短くなる長さスケールまで押し進めること、並びに光ニューロモルフィックコンピュータ[18]~[23]及び光リザーバコンピュータ[24]~[30]
【0026】
のような新しいコンピュータパラダイムを明らかにすることを含むコンピュータでの光学の役割を探求する新たな努力があった[17]。ANN及びDNNのための主な基礎的要素は、以下の通りである。
1.相互接続、
2.マトリクス-ベクトル乗算及びマトリクス-マトリクス乗算、及び
3.非線形性
【0027】
光学及びフォトニクスは、エレクトロニクスよりも優れているとは言わないまでも同程度には最初の2つの機能を実施することができ、論理レベルではなくニューロン毎のレベルの光非線形性が実際に非常に実用的であるので、今こそANN及びDNNでの光学及びフォトニクスの役割を探求する好期である。本発明者は、GPU及びTPUよりも数桁高いコンピューティングパワーを有し、更に1クロックサイクルでのマトリクス-ベクトル乗算、マトリクス-マトリクス乗算、バッチマトリクス乗算、すなわち、3Dデータキューブ(例えば、画像バッチ)に重みマトリクスを乗算すること、並びにテンソル-テンソル乗算の機能を有する光子テンソルアクセラレータ(PTA)を開示する。本節の残余では、最初に電子ANNの基礎を概説し、それに光ANNでの関連の研究の簡単な説明を続ける。
【0028】
人工神経ネットワーク
3つの一般的なANNモデル[31]、すなわち、(a)各ニューロンの出力が直前層からの全てのニューロンの線形結合の非線形応答である完全接続(FC)ネットワークとしても公知の多層パーセプトロン、(b)各ニューロンの出力が直前層からのニューロンの部分集合の指定線形結合(すなわち、カーネルとこの部分集合との畳み込み)の非線形応答である畳み込み神経ネットワーク(CNN)、及び(c)各ニューロンの出力が直前層からのニューロンと同じ層からのものであるが前回のものであるニューロンとの両方の線形結合の非線形応答である回帰型神経ネットワーク(RNN)がある。図1は、畳み込み隠れ層と完全接続出力層とを有するANNを示している。
【0029】
畳み込みと線形結合の両方は、重みマトリクス:
と入力ベクトルのバッチ:
の間のマトリクス乗算に数学的に還元することができる。神経ネットワークにおいてマトリクス計算速度を改善するために、データ変換とスレッド並列化スキームとがCPU及びGPUに実施される[32]、[33]。処理並列化及びクロック速度を押し進めることはできるが、マイクロプロセッサの性能は、最終的にオンチップ電力散逸によって制限される。電力効率を評価するための重要なメトリックは、マトリクス乗算に対して不可欠な演算である乗累算演算(MAC)毎のエネルギ消費である。図2(a)は、乗累算演算に還元されて図2(b)に示すCPU、図2(c)に示すGPU、及び図2(d)に示す高い並列化とメモリアクセスの改善されたエネルギ効率とを有するTPUを用いて実施されるマトリクス乗算の図である。図2Bに示すように、各MACは、3回のメモリ読取(フィルタ重み、ニューロン入力、及び部分和に関する)と1回のメモリ書込(更新された部分和)とを必要とする。
【0030】
最新のマイクロプロセッサでは、メモリアクセスが処理エネルギのうちの大部分を消費する。動的ランダムアクセスメモリ(DRAM)は、データアクセス毎に小さいオンチップメモリよりも2桁高いエネルギを消費する。従って、ローカルメモリ上に格納されたデータの再利用性を最適化することにより、全エネルギ消費を有意に低減することができる。しかし、問題は、DRAM(数十ギガバイト)と比較してローカルメモリの容量が限られる(数キロバイト)ことである。メモリアクセスでのこの問題に対処するために、図2(c)及び図2(d)に示す特定用途向け集積回路(ASIC)は、計算の加速のための新しい空間アーキテクチャを探求する。例えば、データストレージが論理ユニットの近くのレジスタに配置されたGoogleのTPUは、市販のGPUと比較して20倍の低減である~1pJ/MACのエネルギ効率を明らかにした。しかし、メモリアクセス時の電力散逸は、依然として論理演算時に費やされるものの3倍である。
【0031】
光人工神経ネットワーク
光人工神経ネットワークは、1980年代から研究題材であり続けている。この分野での代表的な研究を振り返る。明らかなように、ANNの分野は、比較的長い活動休止期間の後に復活を享受している。
【0032】
ホログラフィに基づく全光ANN
1980年代には、パターン認識のための全光ANNを実現することを目指した一連の研究があった。全ての機能(神経ネットワークトレーニングとパターン認識の両方)及び全ての基礎的要素が光学系を用いて達成されたので、光屈折(PR)体積ホログラム及び非線形ファブリ-ペロー(FP)共振器を用いた顔認識に関する代表的な研究[34]、[35]は、現在までのところ唯一の完全な全光ANNに留まっている。この従来技術は、光学系がANNに基づいてパターン認識を実施することができることを明らかにしたが、
・非線形FP共振器を起動するのに必要とされる高い電力消費、
・光屈折ホログラムのダイナミックレンジに起因して限られる拡張性、及び
・ミリ秒程度のPR搬送波搬送寿命によって限られる低速のトレーニング速度、
という欠点を有し、この技術が有意な実用的応用になることが阻まれた。
【0033】
回折光学系に基づく機械学習
従来技術[36]では、パターン認識を特にデジタル分類子として実行するために多平面光回折ネットワークが使用される。ネットワーク内の位相スクリーンは、機械学習技術を用いて設計される。MNIST(改変国立標準技術研究所)手書きデジタルデータセットからの10,000枚の画像に対する数値試験が行われた[11]。3D印刷された位相スクリーンを用いた実験結果は、シミュレーションと実験の間の88%の一致を示している。この分類子では、相互接続を構成するために自由空間光回折が使用され、同時に相互接続を多様化すること、及び各回折層に対する重みマトリクスを確立することの両方の目的で位相マスクが使用される。
【0034】
全光デジタル分類は、ANNに似た構造を用いて達成された。しかし、分類システムは完全に線形である。その結果、直交する入力しか分類することができない。非線形性を導入することにより、このシステムは、真の神経ネットワークとして機能することになると考えられる。
【0035】
コヒーレントナノフォトニクスに基づく深層学習全光ANN
この研究では、マトリクス-ベクトル乗算は、再構成可能シリコン光子集積回路(PIC)を通してコヒーレント入力光信号アレイを伝播させることによって実施された。その結果、出力光信号は、PIC伝達マトリクスと入力信号の積になる。
【0036】
シリコンPICの伝達マトリクスは、いずれかの指定重みマトリクスに設定することができることが見出されている。これは、U及びVがm×m及びn×nのユニタリマトリクスであり、Σがm×n真値矩形対角マトリクスである時に、あらゆる真値m×nマトリクスTは、特異値分解(SVD)により、
として分解することができることに起因する。同様に、光ビームスプリッタ及び位相調整器を用いてあらゆるユニタリ変換を実施することができることも示された[37]。
【0037】
[38]では、ビームスプリッタ及び位相調整器は、シリコン導波管マッハ-ツェンダー(MZ)干渉計で実現された。全光ANNを実現するために、非線形活性化関数も光ドメイン内に実施しなければならない。[38]では、光非線形活性化関数を設けるために可飽和吸収器が提案されている。実際の実験的実施では、非線形活性化は、依然として電気ドメイン内で実施される。
【0038】
PICは、伝達マトリクスが重みマトリクスであるように設定されたコヒーレントな多入力多出力(MIMO)システムである。この手法の美しさは、集積PICが、いずれの電力も能動的に消費することなくマトリクス-ベクトル乗算に向けて乗算と累算の両方を実施する点である。[38]では、PICは、約1.2cm×0.5cmの面積を占有する54個のMZを有する。従って、12’’ウェーハは、約60,500個のMZ又は約250×250個のMZを支持することができる。その結果、典型的な用途が100,000個のニューロンを必要とするのに対して、「方向カプラ及び位相モジュレータのフットプリントは、多数(N>1000)のニューロンにスケーリングすることを非常に困難にする[39]」。
【0039】
TDM及びコヒーレント混合に基づく深層学習光電子ANN
これは、MAC演算が光ドメイン内で実行され、非線形活性化が電気ドメイン内で実行される混成手法である[39]。デジタル分類は、数値シミュレーションを用いて明らかにされる。最先端電子系よりも低いエネルギ消費毎MACが予想された。
【0040】
ベクトル-ベクトル乗算は、時分割多重化(TDM)信号とTDMローカル発振器(LO)の間の要素毎のコヒーレント光混合によって実行され、累算は、積分と同等なローパスフィルタリングによって光検出信号に対して実施された。次いで、マトリクス-ベクトル乗算は、自由空間の並列性を利用することによって達成された。
【0041】
重みマトリクスは時間変調によって発生されるので、この構成は、超高速ANNトレーニングを可能にする。エネルギ消費毎MACを電子系よりもかなり低くすることができることも示されている。しかし、一般的に、ANN重みマトリクスは、低速で更新することができ、最終的に定常状態に留まる。それでもこの構成では、累算が時間積分によって実施されるので、重みマトリクスは、静的重みに対してさえも高電力消費高速変調を常に必要とする。更に、この構造は、その拡張性への直接的な関わりを有する。MACに関する積分時間は、電子非線形活性化に関する1GHzのクロック速度に対応する1nsであると仮定する。500GHzの最高変調速度を仮定すると、列毎の重みの個数は、TPUとそれほど変わらない500に制限される。それほど関心を抱かせないことは、この構造が全光ANNに適合しないことである。
【0042】
要約
図3の表には、光子アクセラレータの性能及び最先端電子系との比較が要約されている。上述のように、拡張性が最も重要なメトリックである。乗算が受動的であることに起因して光学技術の全てがエネルギ効率に対する潜在性を有するが、エネルギ効率は厳密で系統的な計算を必要とするので、この表にはエネルギ効率を列挙していない。光学技術の各々は、手本とすることができる重要な革新技術を実現する。以下に示すように、これらの革新技術及び本明細書に開示する本発明者の多次元手法を組み込むことにより、光子テンソルアクセラレータ(PTA)が拡張性に関して最終的に電子系を追い越すことを可能にするはずである。
【0043】
開示する本発明は、1)電子系に優る数桁高い拡張性及び速度を提供し、2)高速であり、プログラム可能であり、トレーニング並びに推論に理想的に適合し、かつ3)少なくともある一定の部類のAI機能に関して純電子系対応物に優る競争力を有するANNを可能にするように電力消費密度を低減する光学及び光子方法を使用する。注目に値するのは、
・ANNが、汎用コンピュータではなく特に光子アクセラレータに適する特殊演算/計算(例えば、MAC)しか必要とせず、
・ANNが、データのダイナミックレンジ内の変動性及び非線形活性化に対してロバストであるので[40]、アナログ光子アクセラレータが、そのデジタル論理対応物と同等の性能を実現することができる、
ということである。
【0044】
本発明の実施例
波長符号化及びモード符号化マトリクス-ベクトル乗算アクセラレータ
図4A及び図4Bのマトリクス-ベクトル乗算は、乗算がコヒーレント混合及び二乗則検出によって実施される点で[39]への単一類似性を有する。本発明者の手法と[39]の間には大きい相違点があり、[39]での累算は時間ドメイン内を用いて実施されるが、本発明者の手法での累算は、光の波長、空間、及び他の全ての非時間ドメイン/自由度/次元を用いて実施される。図4A及び図4Bでは、入力ベクトル及び重みベクトルは、特異波長又は空間モード[例えば、エルミート-ガウス(HG)モード]上に要素毎に投影される。波長符号化又はモード符号化された入力ベクトルは、所望数のコピーに展開され、重みマトリクスを構成する重みベクトルを含有する対応する波長符号化又はモード符号化されたLOと混合される。波長又は空間モード間の直交性[41]に起因して、1対の信号とLO[図4A]又は[図4B]のストリームの間のコヒーレント混合は、ベクトル-ベクトル乗算を生成し、2D空間並列化は、全体的にマトリクス-ベクトル乗算を生成する。
【0045】
図4A及び図4Bを精査すると、(a)波長符号化及び(b)モード符号化の光子マトリクスアクセラレータに基づくノード層が示されている。光子アクセラレータは、マトリクス-ベクトル乗算をノード層からの(a)光検出後の電子非線形活性化とb)可飽和吸収器を用いた光非線形活性化と共に実施するために2D(x,z)平面内で並列化される。電子非線形活性化と光非線形活性化の両方は、波長符号化、又はモード符号化、又は波長符号化/モード符号化を組み合わせたもののいずれかに適合する。ここで、入力データは、波長次元又はモード次元で表され、重みマトリクスは、2D(波長又はモードz)次元で表され、出力ポートはx次元にある。累算は、波長次元(a)又はモード次元(b)それぞれでのものである。
【0046】
図4Aに示すように、波長符号化及びモード符号化光子マトリクスアクセラレータの出力は、平衡検出によって電気信号に変換することができ、電子非線形活性化に対する入力として機能する。これに代えて、出力は、図4Bに示すように可飽和吸収器(SA)のような光非線形活性化ユニットの中に直接に入力し、それに対するポンプとして機能することができる[プローブ波は、より長い波長又は直交偏光にある]。その結果、波長符号化及び/又はモード符号化マトリクスアクセラレータは、全光ANN又は混成光電子ANNのいずれにも適合する。
【0047】
カスケード式有向カプラ[42]、[43]と、光子ランタン[44]~[46]と、多平面光コンバータ(MPLC)[47]~[49]とを含むモード(デ)マルチプレクサを実現するためのいくつかの手法がある。
【0048】
波長符号化及び/又はモード符号化マトリクスアクセラレータ、並びに光子テンソルアクセラレータ(PTA)の主な利点は、その拡張性である。モード符号化を単独で利用することにより、本発明者のマトリクスアクセラレータは、少なくとも300×300までスケーリングすることができる。MPLCモードマルチプレクサは、広い作動波長範囲を有し、従って、波長符号化である。波長符号化とモード符号化とを組み合わせることにより、ベクトルの長さが波長の個数とモードの個数との積になるように波長とモードとを1つの超次元に組み合わせることによって潜在的にマトリクス-ベクトル乗算を先例のないサイズまでスケーリングすることができる。現在の技術では、C帯域内で10GHzのチャネル間隔を有する300個よりも大きい波長と300個のモードとを難なく用いて90,000というベクトル長さを実現することができる。これは、波長符号化及びモード符号化された信号とLOストリームとの干渉(乗算)を単一検出器上に累算することができることに起因する。マトリクスのサイズは、90,000×[2D(x,z)空間並列化の程度]であり、後者は、容易に100を超えることができ、この波長符号化及びモード符号化アクセラレータの全MAC数を2D空間並列化によって少なくとも9,000,000にする。
【0049】
偏光符号化及び直角位相符号化の各々は、マトリクス-ベクトル乗算のスケールを2倍にすることができる。本発明者は、偏光次元とモード次元とを以下でベクトルモードと呼ぶ単一次元として互いに組み合わせる。
【0050】
マトリクス-マトリクス乗算アクセラレータ
本発明は、更にy方向の中への3D空間並列化によって先例のないサイズのマトリクス-マトリクス乗算を可能にする。この場合に、図5に指定しているように、入力マトリクスは、(波長及び/又はモード、y)次元で表され、重みマトリクスは、(波長及び/又はモード、z)次元にあり、y方向に繰り返され、出力マトリクスは、(x,y)内に含有される。
【0051】
一般テンソル乗算アクセラレータ
全体的に、光子アクセラレータを構成するのに自由に使用することができる光の多くの次元(波長、ベクトルモード、直角位相、及び空間の三(3)次元)が存在する。自由空間実施では、3つの空間次元を使用することが自然であり、IC又はPICに対しては2つの空間次元が自然である。マトリクス-ベクトル(マトリクス-マトリクス)乗算のための光子アクセラレータを構成するには、いずれかの2つ(3つ)の次元を使用することができる。拡張性を高めるために、複数の次元(例えば、上述した波長-モード)を超次元に組み合わせることができる。ベクトルモードは、空間モードと偏光モードとの組合せである。同様に、バッチマトリクス乗算演算のための光子テンソルアクセラレータ(PTA)を構成するにも各次元を独立に使用することができる。例えば、画像のバッチ(3Dデータキューブ)を表すために波長-モード次元を使用することができ、更にそれに重みマトリクスを1回のクロックサイクル内で全て一度に乗算し、すなわち、互いに加速することができる。これに代えて、独立/直交自由度の個数を実質的に増大するために、多数のパラメータを有する各次元を相互直交部分集合に分割することができる。例えば、波長は、2つのパラメータのみを有する偏光よりも遥かに多くのパラメータを有する。空間は、相互直交部分集合に分割するための非常に多数のパラメータを有する別の自由度である。空間は、テンソル-テンソル乗算を実施するのに取りわけ有利である。
【0052】
非限定的実施例
本発明の特定の実施形態を議論したが、当業者は、本発明の範囲から逸脱することなく特定の実施形態に変更を加えることができることを理解するであろう。従って、本発明の範囲を特定の実施形態に限定すべきではなく、特許請求の範囲は、いずれかの及び全てのそのような応用、修正、及び実施形態を本発明内に網羅するように意図している。
【0053】
本発明の一部の特徴は、本発明の他の特徴を用いずに本発明の一実施形態に使用することができることに注意しなければならない。従って、以上の説明は、本発明の原理、教示、実施例、及び例示的実施形態の限定ではなく、単にこれらを例示するものと考えるべきである。
【0054】
同じく、これらの実施形態は、本明細書での革新的な教示の多くの有利な使用例に過ぎない。一般的に、この出願の本明細書で行う陳述は、主張する様々な発明のいずれかを必ずしも限定するわけではない。更に、一部の陳述は、一部の本発明の特徴に適用されるが、他の特徴には当て嵌まらない場合がある。
【0055】
本発明の説明を例示及び説明目的で提示したが、この説明が包括的であること又は開示した形態にある本発明に限定するように意図していない。説明した実施形態の範囲及び精神から逸脱することのない多くの修正及び変更は、当業者に明らかであろう。上述の実施形態は、本発明の原理、実用的な応用を最も明快に説明し、当業者が想定する特定の使用に適するように様々な修正を加えた様々な実施形態に関して本発明を理解することを可能にするように選択して説明したものである。本明細書に用いた用語法は、これらの実施形態の原理、実用的な応用、又は市場で見られる技術に優る技術的改善を最も明快に説明するように、又は当業者が本明細書に開示する実施形態を理解することを可能にするように選択したものである。
【符号の説明】
【0056】
1、2 光子テンソルアクセラレータ
1、2 非線形性
f 活性化関数
ReLU 漏出
図1
図2
図3
図4A
図4B
図5