7554541 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

7554541ＷＤＭ重みブロードキャストを介した光ニューラルネットワークによる低消費電力エッジコンピューティング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-11

(45)【発行日】2024-09-20

(54)【発明の名称】ＷＤＭ重みブロードキャストを介した光ニューラルネットワークによる低消費電力エッジコンピューティング

(51)【国際特許分類】

G06N 3/067 20060101AFI20240912BHJP

G02F 3/00 20060101ALI20240912BHJP

【ＦＩ】

G06N3/067

G02F3/00 501

【請求項の数】 20

(21)【出願番号】P 2023519686

(86)(22)【出願日】2021-07-29

(65)【公表番号】

(43)【公表日】2023-10-20

(86)【国際出願番号】 US2021043593

(87)【国際公開番号】W WO2022086615

(87)【国際公開日】2022-04-28

【審査請求日】2023-06-01

(31)【優先権主張番号】63/084,600

(32)【優先日】2020-09-29

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】596060697

【氏名又は名称】マサチューセッツインスティテュートオブテクノロジー

(73)【特許権者】

【識別番号】523112138

【氏名又は名称】エヌティーティーリサーチインコーポレイテッド

(74)【代理人】

【識別番号】100107984

【弁理士】

【氏名又は名称】廣田雅紀

(74)【代理人】

【識別番号】100182305

【弁理士】

【氏名又は名称】廣田鉄平

(74)【代理人】

【識別番号】100096482

【弁理士】

【氏名又は名称】東海裕作

(74)【代理人】

【識別番号】100131093

【弁理士】

【氏名又は名称】堀内真

(74)【代理人】

【識別番号】100150902

【弁理士】

【氏名又は名称】山内正子

(74)【代理人】

【識別番号】100141391

【弁理士】

【氏名又は名称】園元修一

(74)【代理人】

【識別番号】100221958

【弁理士】

【氏名又は名称】篠田真希恵

(74)【代理人】

【識別番号】100192441

【弁理士】

【氏名又は名称】渡辺仁

(72)【発明者】

【氏名】ハマーリーライアン

(72)【発明者】

【氏名】エングルンドダークロバート

【審査官】福西章人

(56)【参考文献】

【文献】特表２０１９－５２３９３２（ＪＰ，Ａ）

【文献】特開平０６－０４３９５７（ＪＰ，Ａ）

【文献】特開平０２－２０１４２７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０２Ｆ３／００

(57)【特許請求の範囲】

【請求項1】

サーバーにおいて、深層ニューラルネットワーク（ＤＮＮ）用のスペクトル多重化された重みのセットで変調された光キャリアを含む重み信号を生成すること、
前記サーバーから光リンクを介してクライアントに前記重み信号を送信すること、および
前記クライアントにおいて、（ｉ）前記光キャリア上に変調された前記スペクトル多重化された重みのセット、および（ｉｉ）前記ＤＮＮの層への入力の、行列ベクトル積を計算することを含む、方法。

【請求項2】

前記重み信号を生成することが、前記サーバーのメモリーから前記スペクトル多重化された重みのセットを取得することを含む、請求項１に記載の方法。

【請求項3】

前記重み信号を生成することが、複数の時間ステップの各々で、前記ＤＮＮの重み行列の列のそれぞれのエントリーで、前記光キャリアの波長分割多重化（ＷＤＭ）チャネルを変調することを含む、請求項１に記載の方法。

【請求項4】

前記行列ベクトル積を計算することが、
前記ＤＮＮの前記層への前記入力で前記重み信号を変調すること、
前記ＤＮＮの前記層への前記入力で変調された前記重み信号の前記ＷＤＭチャネルを多重分離すること、および
前記ＤＮＮの前記層への前記入力で変調された前記重み信号の前記それぞれのＷＤＭチャネルの電力を感知することを含む、請求項３に記載の方法。

【請求項5】

前記ＤＮＮの前記層への前記入力で前記重み信号を変調することが、
前記ＤＮＮの前記層への前記入力の振幅でＭａｃｈ－Ｚｅｈｎｄｅｒ変調器への入力を強度変調すること、および
前記Ｍａｃｈ－Ｚｅｈｎｄｅｒ変調器を用いて、前記ＤＮＮの前記層への前記入力の符号をエンコードすることを含む、請求項４に記載の方法。

【請求項6】

前記重み信号を生成することが、
前記光キャリアをリング共振器のセットに結合する前に、前記スペクトル多重化された重みのセットの振幅で前記光キャリアの強度を変調すること、および
前記リング共振器を使用して、前記光キャリアを、前記スペクトル多重化された重みのセットの符号で変調することを含む、請求項１に記載の方法。

【請求項7】

前記重み信号を生成することが、前記スペクトル多重化された重みのセットを前記光キャリアの複素振幅にエンコードすることを含み、および
前記行列ベクトル積を計算することが、前記重み信号の前記ＤＮＮの前記層への前記入力で変調された局所振動子との干渉を検出することを含む、請求項１に記載の方法。

【請求項8】

前記スペクトル多重化された重みが、重み行列を形成し、ならびに（ｉ）前記光キャリア上に変調された前記スペクトル多重化された重みのセットおよび（ｉｉ）前記ＤＮＮの前記層への入力の、前記行列ベクトル積を計算することが、
前記ＤＮＮの前記層への前記入力で前記重み行列の列を重み付けして、スペクトル多重化積を生成すること、
前記スペクトル多重化積を多重分離すること、および
前記スペクトル多重化積を、それぞれの光検出器で検出することを含む、請求項１に記載の方法。

【請求項9】

前記ＤＮＮの前記層への前記入力で前記重み行列の前記列を重み付けすることが、複数の波長チャネルを同時に変調することを含む、請求項８に記載の方法。

【請求項10】

前記スペクトル多重化された重みが、重み行列を形成し、ならびに（ｉ）前記光キャリア上に変調された前記スペクトル多重化された重みのセットおよび（ｉｉ）前記ＤＮＮの前記層への入力の、前記行列ベクトル積を計算することが、
前記重み行列の行を前記ＤＮＮの前記層への前記入力で重み付けして、時間的に多重化積を生成すること、および
前記時間的に多重化積を、少なくとも一つの光検出器で検出することを含む、請求項１に記載の方法。

【請求項11】

前記重み行列の前記行を前記ＤＮＮの前記層への前記入力で重み付けすることが、複数の波長チャネルの各々を独立して変調することを含む、請求項１０に記載の方法。

【請求項12】

深層ニューラルネットワーク（ＤＮＮ）の重みを格納する第一のメモリーと、
光キャリアを生成するためのレーザー源と、
前記光キャリアの波長分割多重化（ＷＤＭ）チャネル上に変調された前記重みを含む重み信号を生成するために、前記第一のメモリーおよび前記レーザー源に動作可能に結合された第一の変調器と
を有する、サーバーと、
光リンクを介して前記サーバーに動作可能に結合されたクライアントであって、
前記ＤＮＮの層に対するアクティベーションを格納する第二のメモリーと、
前記第二のメモリーに動作可能に結合され、前記アクティベーションを前記重み信号上に変調し、それによって前記重みおよび前記アクティベーションの行列ベクトル積を生成する、第二の変調器と、
前記変調器に動作可能に結合され、前記行列ベクトル積の前記ＷＤＭチャネルを検出する、周波数選択検出器とを有するクライアントと
を備えた、システム。

【請求項13】

前記第一の変調器が、それぞれの時間ステップにわたって、前記ＤＮＮの重み行列の列のそれぞれのエントリーで、前記光キャリアの前記ＷＤＭチャネルを変調するように構成される、請求項１２に記載のシステム。

【請求項14】

前記第一の変調器が、ＷＤＭチャネルを変調するように構成されるマイクロリング共振器を備える、請求項１２に記載のシステム。

【請求項15】

前記周波数選択検出器が、
前記ＷＤＭチャネルのそれぞれに対して一対のリング共振器と、
リング共振器の対ごとに一つのバランス検出器と
を備えた、請求項１２に記載のシステム。

【請求項16】

前記第一の変調器が、前記重みの符号を前記光キャリア上に変調するように構成され、
前記第一の変調器に動作可能に結合され、前記重みの振幅を前記光キャリア上に変調する、強度変調器をさらに備えた、請求項１２に記載のシステム。

【請求項17】

前記第二の変調器が、前記アクティベーションの符号を前記重み信号上に変調するように構成され、
前記第二の変調器に動作可能に結合され、前記アクティベーションの振幅を前記重み信号上に変調する、少なくとも一つの強度変調器をさらに備えた、請求項１２に記載のシステム。

【請求項18】

深層ニューラルネットワーク（ＤＮＮ）の重みを格納する第一のメモリーと、
周波数コームを生成するためのレーザー源と、
前記周波数コームの波長分割多重化（ＷＤＭ）チャネル上に変調された前記重みを含む重み信号を生成するために、前記第一のメモリーおよび前記レーザー源に動作可能に結合された周波数選択変調器と
を有するサーバーと、
光リンクを介して前記サーバーに動作可能に結合されたクライアントであって、
前記ＤＮＮの層に対するアクティベーションを格納する第二のメモリーと、
前記周波数コームに位相ロックされたＬＯ周波数コームを生成する局所振動子（ＬＯ）、
前記第二のメモリーおよび前記ＬＯに動作可能に結合され、前記ＬＯ周波数コーム上に前記アクティベーションを変調する変調器と、
前記変調器に動作可能に結合され、前記重み信号および前記ＬＯ周波数コームの干渉を検出し、それによって前記重み信号および前記アクティベーションの行列ベクトル積を生成する、周波数選択検出器と
を有するクライアントと
を備えた、システム。

【請求項19】

前記周波数選択変調器が、
Ｍａｃｈ－Ｚｅｈｎｄｅｒ干渉計の異なるアーム上に配置される前記ＷＤＭチャネルのそれぞれに対して、一対のリング共振器を備えた、請求項１８に記載のシステム。

【請求項20】

前記周波数選択検出器が、
前記ＷＤＭチャネルのそれぞれに対して一対のリング共振器と、
リング共振器の対ごとに一つのバランス検出器と
を備えた、請求項１８に記載のシステム。

【発明の詳細な説明】

【背景技術】

【0001】

関連出願の相互参照
本出願は、米国特許法第１１９条（ｅ）に基づき、２０２０年９月２９日に出願された米国特許出願第６３／０８４，６００号の優先権を主張し、当該出願の全ての内容はここに引用することにより組み込まれる。

【0002】

政府の支援
本発明は、米国科学財団（ＮＳＦ）により授与された助成金番号ＥＣＣＳ１３４４００５、および陸軍研究局（ＡＲＯ）により授与された助成金番号Ｗ９１１ＮＦ－１８－２－００４８に基づく政府の支援により行われた。政府は、本発明において特定の権利を有する。

【0003】

機械学習は、エッジコンピューティングアプリケーションで広く普及し始めているが、低電力スマートセンサーの大規模なネットワークがデータをリモートで前処理してから、中央サーバーに中継している。この前処理の多くは、深層ニューラルネットワーク（ＤＮＮ）に依存しているため、エッジでのＤＮＮ推論のためのサイズ、重み、および電力（ＳＷａＰ）制約のあるハードウェアおよび効率的なモデルの開発には、多大な努力が費やされる。しかしながら、多くの最新鋭のＤＮＮは、非常に大きく、モデルサイズがＳＷａＰ制約のあるエッジプロセッサーのメモリーを超えるため、データセンターでしか実行することができない。このようなＤＮＮはエッジ上で実行することができないため、センサーは分析のためにそのデータをサーバーに送信しなければならず、重大な帯域幅のボトルネックにつながる。

【発明の概要】

【0004】

ＤＮＮ推論をエッジで実行する際のこれらの問題に対処するために、我々は、ＳＮＮサイズに対する制限を回避し、任意サイズのＤＮＮをＳＷａＰ制約のあるエッジデバイス上で実行することを可能にする、光ニューラルネットワークアーキテクチャーであるＮｅｔＣａｓｔを導入する。ＮｅｔＣａｓｔは、波長分割多重化（ＷＤＭ）、差異検出および積分、光重み伝送、ならびに光リンクの極めて広い帯域幅を利用するサーバークライアントプロトコルおよびアーキテクチャーを使用して、エッジデバイスのＳＷａＰ制約にとらわれない任意のサイズのネットワークに対して、エッジでの低電力ＤＮＮ推論を可能にする。これにより、これまでデータセンターに限定されていた、全く新しいクラスのニューラルネットワークをエッジで導入できるようになる。

【0005】

より広くは、ＮｅｔＣａｓｔは、ＳＷａＰ制約のあるエッジデバイスにおいてＤＮＮ推論を行うためのサーバークライアントアーキテクチャーを提供する。中央サーバーから光学的にシナプスの重みをブロードキャストすることで、このアーキテクチャーはエッジデバイスのメモリーと電力要件を大幅に低減し、今日では不可能な低消費電力プラットフォーム上でデータセンター規模の深層学習を可能にする。

【0006】

中央サーバーは、マトリックス（ＤＮＮ重み）を光パルス列にエンコードする。それは、エンコードされた光パルス列をリンク（例えば、光ファンアウトを有する可能性のある、自由空間またはファイバーリンク）上におよび一つまたは複数のクライアント（エッジデバイス）に伝送する。各クライアントは、光変調、波長多重化、および光検出の組み合わせを使用して、（リンクを介して受信された）重みと、クライアント上に格納されるアクティベーションとも呼ばれるＤＮＮ層入力との間の行列ベクトル積Σ_ｎｗ_ｍｎｘ_ｎを計算する。多くの層が順次実行され、各クライアントが、重みをメモリーに格納することなく、任意のサイズおよび深さのＤＮＮについて推論を行うことを可能にする。

【0007】

このクライアントサーバーアーキテクチャーには、既存のアプリケーションよりもいくつかの利点がある。現在、エッジデバイス上で深層学習を行うためには、それぞれに独自の欠点がある限定されたオプションがある。これらのオプションは、以下を含む。（１）データをアップロードし、帯域幅、遅延、プライバシーの問題を犠牲にしてクラウドでＤＮＮを実行する。（２）エッジデバイス上で全てのＤＮＮを実行する。ただし、多くの場合、メモリーおよび電力要件がデバイスのＳＷａＰ制約を超えることに注意する。または（３）より低い電力およびメモリーで実行できるように（多くの場合不可能）、ＤＮＮを圧縮し、およびＤＮＮの性能（分類精度など）を低下させる。対照的に、本技術は、ローカルデータストレージ、ＳＷａＰ制約充足、および高性能（非圧縮）ＤＮＮを同時に提供することができる。

【0008】

ＮｅｔＣａｓｔクライアントサーバープロトコルおよびアーキテクチャーのアプリケーションには、高性能の深層学習を、モノのインターネットの軽量エッジまたはフォグデバイスにもたらすことが含まれる。先進の機械（航空機、自動車、船、衛星など）上で低電力のファイバー結合（coupled）式スマートセンサーを可能にし、ＤＮＮを大型の自由空間センサーネットワーク（例えば、環境監視、災害救援、鉱業、石油／ガス探査、地理空間インテリジェンス、またはセキュリティ）に分配する。利用度の高いＤＮＮについては、データセンターがアーキテクチャーを使用して、ＤＮＮ推論のエネルギー消費量を低減することもできる。

【0009】

ＮｅｔＣａｓｔは以下のように実装できる。サーバーは、ＤＮＮに対してスペクトル多重化された重みのセットで変調された光キャリアを含む重み信号を生成し、その後、光リンクを介して、その重み信号をクライアントに送信する。クライアントは、重み信号を受信し、（ｉ）光キャリア上に変調されたスペクトル多重化された重みのセットと、（ｉｉ）ＤＮＮの層への入力との行列ベクトル積を計算する。サーバーは、スペクトル多重化された重みのセットをその（ローカル）メモリーに格納し、スペクトル多重化された重みのセットをその（ローカル）メモリーから取得することができる。

【0010】

サーバーは、複数の時間ステップの各々で、光キャリアのＷＤＭチャネルを、ＤＮＮの重み行列の列のそれぞれのエントリー（entries）で変調することによって、重み信号を生成できる。この場合、クライアントは、重み信号をＤＮＮの層への入力で変調すること、ＤＮＮの層への入力で変調された重み信号のＷＤＭチャネルを多重分離すること、およびＤＮＮの層への入力で変調された重み信号のそれぞれのＷＤＭチャネルの電力を感知することによって、行列ベクトル積を計算することができる。クライアントは、ＤＮＮの層への入力の振幅でＭａｃｈ－Ｚｅｈｎｄｅｒ変調器への入力を強度変調し、Ｍａｃｈ－Ｚｅｈｎｄｅｒ変調器を用いて、ＤＮＮの層への入力の符号をエンコードすることによって、ＤＮＮの層への入力で重み信号を変調することができる。

【0011】

サーバーはまた、光キャリアをリング共振器のセットに結合（coupling）する前に、スペクトル多重化された重みのセットの振幅で光キャリアの強度を変調することによって、およびリング共振器を使用してスペクトル多重化された重みのセットの符号で光キャリアを変調することによって、重み信号を生成することができる。または、サーバーは、スペクトル多重化された重みのセットを光キャリアの複素振幅（complex amplitude）にエンコードすることによって、重み信号を生成することができ、その場合、クライアントは、重み信号のＤＮＮの層への入力で変調された局所振動子との干渉を検出することによって、部分的に行列ベクトル積を計算する。

【0012】

スペクトル多重化された重みは、重み行列を形成してもよく、その場合、クライアントは、スペクトル多重化積を生成するために重み行列の列をＤＮＮの層への入力で重み付けすること、スペクトル多重化積を多重分離すること、およびスペクトル多重化積をそれぞれの光検出器で検出することによって、行列ベクトル積を計算することができる。この場合、重み行列の列をＤＮＮの層への入力で重み付けすることは、複数の波長チャネルを同時に変調することを含み得る。別の方法として、クライアントは、重み行列の行をＤＮＮの層への入力で重み付けして、時間的に多重化積を生成し、少なくとも一つの（およびおそらくは一つのみの）光検出器で時間的に多重化積を検出することができる。この場合、重み行列の行をＤＮＮの層への入力で重み付けすることは、複数の波長チャネルの各々を独立して変調することを含み得る。

【0013】

ＮｅｔＣａｓｔシステムは、サーバーおよび一つまたは複数のクライアントの両方を含み得る。サーバーは、第一のメモリー、（レーザー）ソース、ならびに第一のメモリーおよびソースに動作可能に結合された第一の変調器を含み得る。動作中、第一のメモリーは、ＤＮＮの重み（重み行列）を記憶する。ソースは、光キャリア（例えば、周波数コーム）を放射する。そして、第一の変調器は、光キャリアの波長分割多重化（ＷＤＭ）チャネル上に変調された重みを含む重み信号を生成する。クライアントは、光リンクを介してサーバーに動作可能に結合され、第二のメモリー、第二の変調器、および周波数選択検出器を含む。動作中、第二のメモリーは、ＤＮＮの層に対するアクティベーションを記憶する。第二のメモリーに動作可能に結合される第二の変調器は、アクティベーションを重み信号上に変調し、それによって重みおよびアクティベーションの行列ベクトル積を生成する。変調器に動作可能に結合される周波数選択検出器は、行列ベクトル積のＷＤＭチャネルを検出する。

【0014】

第一の変調器は、それぞれの時間ステップにわたって、ＤＮＮの重み行列の列のそれぞれのエントリーで、光キャリアのＷＤＭチャネルを変調することができる。それはＷＤＭチャネルを変調するように構成されるマイクロリング共振器を含み得る。周波数選択検出器は、各ＷＤＭチャネルに対して一対のリング共振器、およびリング共振器の各対に対して一つのバランス検出器を含み得る。

【0015】

一部の事例では、第一の変調器は、重みの符号を光キャリア上に変調することができ、その場合、クライアントは、第一の変調器に動作可能に結合された強度変調器をさらに含み、重みの振幅を光キャリア上に変調する。同様に、第二の変調器は、アクティベーションの符号を重み信号上に変調することができ、その場合、クライアントは、第二の変調器に動作可能に結合された少なくとも一つの強度変調器を含み、アクティベーションの振幅を重み信号上に変調する。

【0016】

コヒーレントＮｅｔＣａｓｔシステムには、サーバーおよび少なくとも一つのクライアントも含まれる。コヒーレントＮｅｔＣａｓｔサーバーは、ＤＮＮの重みを格納する第一のメモリー、周波数コームを生成するレーザー源、および第一のメモリーおよびレーザー源に動作可能に結合された周波数選択変調器を含み、周波数コームのＷＤＭチャネル上に変調された重みを含む重み信号を生成する。クライアントは、光リンクを介してサーバーに動作可能に結合され、第二のメモリー、局所振動子（ＬＯ）、変調器、および周波数選択検出器を含む。第二のメモリーは、ＤＮＮの層に対するアクティベーションを記憶する。ＬＯは、周波数コームに位相ロックされたＬＯ周波数コームを生成する。変調器は、第二のメモリーおよびＬＯに動作可能に結合され、ＬＯ周波数コーム上にアクティベーションを変調する。また、周波数選択検出器は、変調器に動作可能に結合され、重み信号およびＬＯ周波数コームの干渉を検出し、それによって、重み信号およびアクティベーションの行列ベクトル積を生成する。

【0017】

周波数選択変調器は、Ｍａｃｈ－Ｚｅｈｎｄｅｒ干渉計の異なるアーム上に配置されるＷＤＭチャネルのそれぞれに対して、一対のリング共振器を含み得る。周波数選択検出器は、ＷＤＭチャネルのそれぞれに対して一対のリング共振器、およびリング共振器の各対に対して一つのバランス検出器を含み得る。

【0018】

前述の概念および以下でより詳細に論じる追加的概念の全ての組み合わせは（このような概念は相互に矛盾していないという前提で）、本明細書に開示される本発明の主題の一部であると考えられる。特に、本開示の最後に現れる、特許請求の範囲に記載する主題の全ての組み合わせは、本明細書に開示する発明主題の一部であると考えられる。参照により本明細書に組み込まれる、あらゆる開示においても明示的に用いられる用語は、本明細書に開示される特定の概念と最も一致する意味を与える必要がある。

【図面の簡単な説明】

【0019】

当業者であれば、図面が主として例示的な目的で提示されていて、本明細書に記載の本発明の主題の範囲を制限することを意図していないことを理解するであろう。図面は、必ずしも、正確な縮尺ではない。いくつかの事例では、本明細書に開示される本発明の主題の種々の側面は、異なる特徴の理解を促進するために、図面中で誇張または拡大されて示され得る。図面では、同様の参照文字は一般に、同様の特徴（例えば、機能的に類似したおよび／または構造的に類似した要素）を意味する。

【0020】

【図1】図１は、波長分割多重化（ＷＤＭ）された重みブロードキャストを介した光ニューラルネットワーク（ＯＮＮ）を用いた低電力エッジコンピューティングのためのＮｅｔＣａｓｔと呼ばれるアーキテクチャーシステムを示す。ＮｅｔＣａｓｔシステムは、ＷＤＭトランスミッタアレイ（左）を有する重みサーバーと、光リンク（中央）と、差異検出および積分（右）を有するＷＤＭレシーバーアレイに結合された変調器を有するクライアントとを含む。具体的には、図１は、マイクロリングアレイで実装されたＷＤＭトランスミッターおよびレシーバーを示す。ただし、これらはＭａｃｈ－Ｚｅｈｎｄｅｒ変調器および／または他のコンポーネントでも実装できる。

【0021】

【図2】図２は、図１のＮｅｔＣａｓｔＯＮＮにおけるデータフローを示す。行列ベクトル積は、Ｍ波長チャネルで、Ｎ時間ステップで実施される。各時間ステップｎでは、重みｗ_ｍｎは、ＷＤＭトランスミッタアレイ内の変調器への電気入力を調整することによってエンコードされる（この場合には、リング共振器の離調Δ_ｍｎ）。スルーポート出力とドロップポート出力

【数1】

（式（２））はクライアントに送信され、Ｍａｃｈ－Ｚｅｈｎｄｅｒ変調器（ＭＺＭ）がそれらを混合して出力

【数2】

（式（２））を生成する。各波長チャネルの差電流は、積ｗ_ｍｎｘ_ｎを与える。時間積分後、積ｙ_ｍ＝Σ_ｎｗ_ｍｎｘ_ｎは読み出される。

【0022】

【図3】図３は、ＮｅｔＣａｓｔの一貫した実装を示す。周波数コームの線は、ＷＤＭ－ＭＺＭ（ここではリングアレイ支援ＭＺＭ）を使用して、ＤＮＮ重みで独立して変調される。クライアント側では、信号は局所振動子（ＬＯ）に対してビートされ、別のＭＺＭによってＤＮＮ層入力で変調され、波長チャネルはＷＤＭホモダイン検出器で別々に読み出される。主な追加の複雑さは、ＬＯコームの相、周波数、および線間隔を安定化させることに由来する。

【0023】

【図4】図４Ａは、ＮｅｔＣａｓｔに対する時間積分／周波数分離（ＴＩＦＳ）と周波数積分／時間分離（ＦＩＴＳ）積分スキームの違いを示す。

【0024】

図４Ｂは、ＴＩＦＳ（左クライアント列）またはＦＩＴＳ（右クライアント列）によるインコヒーレント検出のための、単純な（上行）および低ノイズ（下行）のサーバーおよびクライアント概略図を示す。

【0025】

図４Ｃは、ＴＩＦＳ（左クライアント列）またはＦＩＴＳ（右クライアント列）によるコヒーレント検出のためのサーバーおよびクライアント概略図を示す。

【0026】

【図5】図５Ａは、小さなニューラルネットワーク（ＮＮ）に対する式（１４）のノイズ振幅σの関数としてのＭＮＩＳＴＤＮＮ分類誤差のプロットである。

【0027】

図５Ｂは、大きなＮＮに対する式（１４）のノイズ振幅σの関数としてのＭＮＩＳＴＤＮＮ分類誤差のプロットである。

【0028】

【図6】図６Ａは、波長多重化対数深さスイッチングツリーに基づく、ウエハースケールのＮｅｔＣａｓｔ重みサーバーの概略図である。

【0029】

図６Ｂは、ＮｅｔＣａｓｔアーキテクチャーで中央サーバーに連結されるスマートセンサーを備えた航空機を示す。

【0030】

図６Ｃは、ＮｅｔＣａｓｔアーキテクチャーの自由空間光リンクを介して中央サーバーに結合された別個のエッジデバイス（例えば、ドローン）を示す。

【0031】

図６Ｄは、ＮｅｔＣａｓｔアーキテクチャー内のファイバーリンクを介して中央サーバーに連結されるエッジデバイスを備えたデータセンターを示す。

【0032】

【図7】図７Ａは、単一のＤＮＮ層を通した推論（実線矢印）およびトレーニング（破線矢印）のデータフローを示す。

【0033】

図７Ｂは、ｗ_ｍｎのエンコードに類似した、時間周波数空間における重み更新δ_ｍｎのエンコードを示す。

【0034】

図７Ｃは、ＤＮＮをトレーニングするための、インコヒーレントサーバーおよび単純（上行）および低ノイズ（下行）のクライアント設計を示す。

【0035】

図７Ｄは、ＤＮＮをトレーニングするためのコヒーレントサーバーおよびクライアント設計を示す。

【0036】

【図8】図８Ａは、スプリアス干渉を抑制するために、インコヒーレントスキームに対して時間インターリーブを使用して複数のクライアントからの重み更新を組み合わせることと、コヒーレントスキームに対して単純に組み合わせることとを示す。

【0037】

図８Ｂは、インコヒーレント結合ハードウェア、すなわち、ＭＺＩ分割ツリー（上）または時間遅延を伴う受動接合部（下、未熟な人のインターリーバ）を示す。

【0038】

図８Ｃは、コヒーレントスキームで結合される受動信号を示す。

【発明を実施するための形態】

【0039】

図１は、光リンク１２０によって接続される重みサーバー１１０および一つまたは複数のクライアント１３０を含む、ＮｅｔＣａｓｔ光ニューラルネットワーク１００を示す。（明確にするために、図１は一つのクライアント１３０のみを示す。）重みサーバー１１０は、周波数コームの形態で光キャリアを生成するモードロックされたレーザー１１１として図１に図示した光源を含む（ただし、周波数チャネル間の一貫性は、インコヒーレントなＮｅｔＣａｓｔには必要ない）。他の適切な光源は、異なる周波数で放射するレーザーのアレイを含む。重みサーバー１１０はまた、可変可能な波長分割多重化（ＷＤＭ）変調器（マイクロリングアレイとして表される）１１２のセットとして図示された広帯域変調器を含み、その入力は光源１１１に光学的に連結され、その出力はバス導波路を介して偏光ビームスプリッター（ＰＢＳ）１１３の入力ポートに結合される。この例では、四つのマイクロリング変調器１１２があり、それぞれがω_１からω_４まで異なる周波数に調整される。マイクロリング変調器１１２は、ＲＡＭ１１３からのデジタル信号を、マイクロリング変調器１１２を駆動するのに好適なアナログ信号に変換するマルチチャネルデジタル－アナログ変換器（ＤＡＣ）１１４によって、第一のメモリー、すなわちＤＮＮの重み行列を格納するランダムアクセスメモリー（ＲＡＭ）１１３に格納される重みで駆動される。

【0040】

ビームスプリッター１１３の出力ポートは、ファイバーリンク１２１（例えば、出力で偏光制御を有する偏光維持ファイバー（ＰＭＦ）またはシングルモードファイバー（ＳＭＦ））、自由空間リンク１２２、または複数のクライアント１３０に接続するためのファンアウト１２３を有する光リンクであり得る、光リンク１２０に結合される。サーバー１１０が複数のクライアント１１０に接続される場合、それは、異なる（タイプの）光リンク１２０を介して各クライアント１１０に接続することができる。さらに、所与の光リンク１２０は、アンプまたはリピータによって接続される複数のファイバーまたは自由空間セグメントを含む、複数のセグメントを含み得る。

【0041】

各クライアント１３０は、一つのＰＢＳ出力から対応するＭＺＭ入力への経路に相変調器１３２を有するＭａｃｈ－Ｚｅｈｎｄｅｒ変調器（ＭＺＭ）１３３のそれぞれの入力ポートに結合される、二つの出力ポートを有するＰＢＳ１３１を含む。ＭＺＭ１３３の出力は、波長チャネルごとに一つずつ、差検出器１３５のアレイ内に多重分離される。多重分離することは、アレイド導波路格子、不平衡Ｍａｃｈ－Ｚｅｈｎｄｅｒツリー、およびリングフィルターアレイ（ここに表示）を含む、さまざまな受動光学部品を用いて達成することができる。リングベースの実装では、光は、ＷＤＭリング共振器１３４のバンクでフィルターリングされる。各バンクのリング共振器１３４は、クライアント１１０のマイクロリング変調器１１２と同じ共振周波数ω_１からω_４に調整される。各共振器１３４は、同じ共振周波数に調整された他方のバンクの対応する共振器とペアリングされる。これらの共振器１３４の対は、それぞれの微分検出器１３５にエバネセント的に連結され、その結果、各微分検出器１３５は、同じ周波数（例えば、ω_１）で共鳴する共振器１３４の対に結合される。この配置では、共振器１３４の対は、ＭＺＭ１３３からそれぞれの微分検出器１３５に特定の周波数で光を結合する通過帯域フィルターとして機能する。

【0042】

微分検出器１３５は、微分検出器１３５からのアナログ信号を、ＲＡＭ１３７に格納できるデジタル信号に変換する、アナログ／デジタル変換器（ＡＤＣ）１３６に結合される。ＲＡＭ１３７はまた、入力をＤＮＮの一つまたは複数の層に格納する。ＲＡＭ１３６は、ＤＡＣ１３８に結合され、これは次にＭＺＭ１３３に結合される。ＤＡＣ１３８は、以下に説明するように、ＲＡＭ１３７に格納されるＤＮＮ層入力でＭＺＭ１３３を駆動する。

【0043】

ＮｅｔＣａｓｔ光ニューラルネットワーク１００は、以下のように機能する。データは、時間多重化およびＷＤＭの組み合わせを使用してエンコードされ、サーバー１１０およびクライアント１３０は、Ｍ波長チャネルにわたってＮ時間ステップでＭ×Ｎ行列ベクトル積を実行する。各時間ステップ（ｎによってインデックス付けされる）で、サーバー１１０は、光リンク１２０を介して、重み行列の列ｗ_：,ｎをクライアント１３０にブロードキャストする。サーバー１１０は、ＲＡＭ１１３に格納される重み行列要素を、周波数コーム上に変調して、広帯域変調器（例えば、マイクロリング共振器１１２）を使用して重み信号を生成する。次に、サーバー１１０は、光リンク１２０を介してこの重み信号をクライアント１３０に送信する。クライアント１３０のＭＺＭ１３３は、クライアントＲＡＭ１３７に格納される対応するＤＮＮ層への入力で、重み信号を乗算する。クライアント１３０内の一対ＭのＷＤＭ（例えば、Ｍリング共振器１３４）と、Ｍ差光検出器１３５（波長当たり１セット）との対は、ＭＺＭ１３３の出力を多重分離する。これらの出力は、クライアントのＲＡＭ１３７に格納される入力ベクトルを有する重みの積、ｗ_ｍｎｘ_ｎである。全Ｎ時間ステップを積分して、各差検出器１３５上に蓄積された総電荷は、
ｙ_ｍ＝Σ_ｎｗ_ｍｎｘ_ｎ（１）
であり、所望の行列ベクトル積を実行する。

【0044】

図２は、図１の光ニューラルネットワーク１００のより詳細な、ＮｅｔＣａｓｔプロトコルを示す。再び、サーバー１１０は、光周波数コームなどの複数のチャネルを有する光キャリアを放射し、マイクロリング（またはディスク）変調器１１２の重みバンクに連結される、広帯域ＷＤＭソース１１１を含む。各マイクロリング変調器１１２は、単一のＷＤＭチャネルに結合され、その入力電力の一部を、ＰＢＳ１１５の上部ポートに結合される導波管に結合されるスルーポートに送信する。各マイクロリング変調器１１２は、残りの入力電力をＰＢＳ１１５の下部ポートに結合される導波管に結合される、ドロップポートに反映する。マイクロリング変調器１１２によって伝送され、反射される電力の間の差は、重みをエンコードし、その各々は正または負の値であり得る。これは、透過係数および反射係数、すなわち、

【数3】

を用いてモデル化することができる。マイクロリング変調器１１２が上部導波管／上部ポート（κ_１＝κ_１＋κ_ａｂｓ）に臨界的に結合される場合、これらの係数は、

【数4】

式中、Δ_ｍｎは、時間ステップｎで、（ω_ｍに連結する）ｍ^ｔｈリング変調器１１２のキャビティの離調である。

【0045】

ＰＢＳ１１５は、リング変調器１１２のスルーポート出力およびドロップポート出力を、組み合わせられたスルーポート出力およびドロップポート出力を重み信号としてクライアント１３０に送信する、偏光維持出力ファイバー（ＰＭＦ）光ファイバーリンク１２１の直交偏光に組み合わせる。スルービームとドロップビームが同じ偏光（例えば、横方向電気（ＴＥ））を有する場合、ＰＢＳ１１５の一つの入力ポートに結合された偏光回転子が存在して、ＰＢＳ１１５への一つの入力の偏光を回転させ（例えば、ＴＥから横方向磁気（ＴＭ）へ）、その結果、入力が直交モード（例えば、ＴＥおよびＴＭモードが、同じ１２１の導波路を伝播する）として、ＰＢＳ１１５の同じ出力ポートに結合され得る。光リンク１２０は、ファイバーまたは空き空間上にあってもよく、上述のように、複数のクライアントへの光ファンアウトを含んでもよい。リンク損失またはファンアウト比が大きい場合、サーバー出力は、エルビウムドープファイバーアンプ（ＥＤＦＡ）または別の適切な光アンプ（図示せず）によって事前に増幅され得る。

【0046】

リンク１２０の終了時に、重み信号はクライアント１３０に入り、第二のＰＢＳ１３１は偏光を分離し、位相シフター１３２（図１）はリンク１２０に生じた偏光モード分散による任意の相対位相シフトを補正する。これらの入力

【数5】

は、広帯域移動波ＭＺＭ１３３を使用して混合され、その電圧は、図２に示すように、電流アクティベーションｘ_ｎをエンコードする。ＭＺＭ１３３の出力は：

【数6】

【0047】

最後に、ＷＤＭチャネルは、リング共振器１３４を使用して多重分離され、各チャネル内の電力は、対応する光検出器１３５上で読み出される。この場合、リングベースのＷＤＭトランスミッターでは、ＭＺＭ出力間の差電流は、

【数7】

【0048】

式（４）における第一の項は、ＤＮＮ重み（｜ｔ_ｍｎ｜^２－｜ｒ_ｍｎ｜^２）としてエンコードされる）とアクティベーション（ｃｏｓ（２θ_ｎ）としてエンコードされる）との間の積である。第二の項Ｒｅ［ｔ^＊ _ｍｎｒ_ｍｎ］ｓｉｎ（２θ_ｎ）は望まれない。これは、ＭＺＭ１３３のスルーポート出力とドロップポート出力の間の干渉に起因する。この干渉は、フィールドが±π／２位相がずれること（臨界結合のケース式（２）で真）を確保すること、それらを時間遅延で相殺すること（ただし、これはスループットを２分の１に減少させる）、または一つではなく二つのＭＺＭを使用すること（余分な複雑さのコストで）によって抑制または除去することができる。

【0049】

ＮｅｔＣａｓｔは、時間多重化を使用し、行列ベクトル積は、複数の時間ステップにわたって積分することによって導出される。明確にするために、波長チャネルにはインデックスｍを、時間ステップにはインデックスｎを付ける。時間ステップｎごとに、重みサーバー１１０は、この行列の列ｗ_：，ｎを出力し、重みが、変調器透過係数（およびそれゆえに、離調）に関連し、アクティベーションｘ_ｎが、ＭＺＭ相でエンコードされる。

【数8】

損失なし変調器（κ_１＝κ_２＝κ／２）については、アクセス可能な重みの範囲はｗ_ｍｎ∈［－１，＋１］であり、損失あり変調器については、下限はより厳格であるｗ_ｍｎ∈［－１，＋１］；ｗ_ｍｎ∈［－１＋２κ_ａｂｓ／κ，＋１］。全範囲ｘ_ｎ∈［－１，１］の全てのアクティベーションに到達するには、変調はθ∈［－π／２，π／２］の全ての点にヒットする。この状態は、Ｖ_ｐｐ＝Ｖ_πを有するドライバーを使用して達成することができる。

【0050】

時間ステップにわたる式（４）を積分した後、検出器ペアｍの差分電荷は：
ｙ_ｍ＝Σ_ｎΔＩ_ｍｎ＝Σ_ｎｗ_ｍｎｘ_ｎ（７）
これは所望の行列ベクトル積である。

【0051】

高レベルでは、ＮｅｔＣａｓｔアーキテクチャーは、ニューラルネットワーク（重み）を光パルスにエンコードし、それを処理のために軽量クライアント１３０にブロードキャストし、そのため、ＮｅｔＣａｓｔという名称になる。

【0052】

ＮｅｔＣａｓｔアーキテクチャーバリアント
ＮｅｔＣａｓｔの概念は非常に柔軟である。例えば、安定した局所振動子がある場合、差分電力検出ではなくホモダイン検出を使用して、コヒーレントバージョンを作成できる。ＮｅｔＣａｓｔはコヒーレント検出や干渉に依存しないが、コヒーレント検出はパフォーマンスを向上させることができる。さらに、高速ＭＺＭをスローリング変調器の配列で置き換えて、時間ではなく周波数にわたって信号を積分することができる（ｗｘの代わりにｘ^Ｔｗを計算）。最後に、信号の多くが小さい場合、差分検出で発生するノイズを低減する方法がいくつかある。

【0053】

コヒーレントＮｅｔＣａｓｔ
図３は、例示的なコヒーレントＮｅｔＣａｓｔアーキテクチャー３００の概略図を示す。図１のインコヒーレントアーキテクチャー１００と同様に、図３のコヒーレントアーキテクチャー３００は、それぞれの光リンク３２０を介して一つまたは複数のクライアント３３０に結合された重みサーバー３１０を含む（簡略化のために、図３は、一つの光リンク３２０と一つのクライアント３３０のみを示す）。重みサーバー３１０は、ＷＤＭ－ＭＺＭ３１２に光学的に結合されたモードロックされたレーザーなどの周波数コーム源３１１を含む。ＷＤＭ－ＭＺＭは、各周波数チャネルの振幅を独立して変調する。具体的には、図３は、各ＷＤＭチャネルに対して一対のリング共振器を含むリングベースの実装を示し、各リング共振器ペアの半片が、ＭＺＭの一方のアームにエバネセント的に連結され、他方の半片が、他方のアームにエバネセント的に連結される。ＷＤＭ－ＭＺＭ３１２のリング共振器は、ＲＡＭ３１３または他のメモリーに格納される重みに基づき、ＤＡＣ３１４で調整することができる。

【0054】

このアーキテクチャー３００は、重みデータがコヒーレント振幅でエンコードされ、クライアント３３０が局所振動子（ＬＯ）３４０を使用してコヒーレントホモダイン検出を行うため、コヒーレントアーキテクチャーと呼ばれる。タップカプラー（例えば、９０：１０ビームスプリッター）３４１は、ＬＯ３４０の出力の小さな部分を、微分検出器３４２の一つのポートに結合し、残りの部分をＭＺＭ３３３の入力に連結する。同様に、微分検出器３４２の他方のポートは、別のタップカプラー３３２を介して、サーバー３１０から重み信号の一部を受信する。微分検出器３４２の出力は、位相ロックされたループ（ＰＬＬ）内のＬＯ３４０のキャリア周波数および繰返し速度を安定化する位相ロック回路３４３を駆動する。第二のタップカプラー３３２は、残りの重み信号を、その他の入力ポートがＭＺＭ３３３の出力に連結される５０：５０ビームスプリッター３４４に連結する。この５０：５０ビームスプリッター３４４の出力ポートは、ＷＤＭホモダイン検出器３３４のそれぞれの入力ポートに供給される。

【0055】

具体的には、図３は、図１のクライアント１１０のように、それぞれの微分検出器に結合されたリング共振器対を有する、リングドロップフィルターに基づく実装を示す。ＷＤＭホモダイン検出器３３４の各リング共振器ペアは、各微分検出器が、対応する重み信号とＬＯＷＤＭチャネルとの間のホモダイン干渉を送信するように、異なるＷＤＭチャネルに調整される。ＡＤＣ３３６は、ＲＡＭ３３７に格納するためのＷＤＭホモダイン検出器３３４の出力をデジタル化し、これはまた、ＭＺＭ３３３を駆動するためのＤＮＮ層入力にも格納する。ＤＡＣ３３８は、ＲＡＭ３３７からのデジタルＤＮＮ層入力を、ＭＺＭ３３３を駆動するためのアナログ信号に変換する。

【0056】

図１に示すように、重みｗ_ｍｎは、周波数コームの線を変調し、得られた重み信号を、光リンク３２０を介してクライアント３３０にブロードキャストすることによって、時間周波数ベースでサーバー３１０において生成される。図３のコヒーレントクライアント３３０は、その電力ではなく、フィールドの複素振幅でデータをエンコードし、単一の偏光を使用する。クライアント３３０のＬＯ３４０からの同一の周波数コームは、この複素振幅を測定するためのＬＯ信号として機能する。ＬＯ信号パワーの一部は、ＬＯコームをサーバーのコームにロックするために、微分検出器３４２によって検出され、位相ロック回路３４３によって使用されるビートノートを生成するために、重み信号と混合される。ＬＯコームの残りの部分は、ＭＺＭ３３３で振幅変調され、アクティベーションｘ_ｎによってＬＯコームの振幅をスケールする。波長多重分離ホモダイン検出器３３４は、積ｗ_ｍｎｘ_ｎを蓄積し、この積が統合されて、インコヒーレントな場合と同様に行列ベクトル積を得る。

【0057】

クライアント３３０でのコヒーレント検出の一つの利点は、データ速度の増加である。図３に示され、上述のコヒーレントスキームは、単一の直交および偏光でデータエンコードする。両方直角位相および両方偏光のデータをエンコードすることによって、図３に示されるコヒーレントスキームは、図１および２に示されるインコヒーレントスキームの容量の四倍を提供する。

【0058】

コヒーレントスキームの別の利点は、特に低信号電力での、信号対ノイズ比（ＳＮＲ）の増加である。これは、伝送効率が非常に低い長距離の自由空間リンクに特に関連する。十分に強力なＬＯを有するホモダイン検出により、この信号が、ジョンソンノイズに圧倒されるのではなく、量子限界まで測定される。

【0059】

入力と重みが、範囲ｘ_ｎ，ｗ_ｍｎ∈［－１，１］内にあるようにスケールされると仮定する。光子数に正規化されたホモダイン検出器に入力されるコームライン振幅は、

【数9】

である。微弱信号の制限ａ_ｗ＜＜ａ_ｘでは、時間ステップごとに各光検出器上に蓄積される電荷の差は、

【数10】

従って、出力信号の平均および標準偏差は、

【数11】

予想通り、ＳＮＲは、重みパルス当たりのエネルギー（変調前）｜ａ_ｗ｜^２に反比例する。ＳＮＲが低すぎると、ＯＮＮの性能が損なわれる可能性がある。これにより、ＯＮＮ標準量子限界値に類似した、光受信電力に対する下限が設定される。

【0060】

重みデータがＲＦリンクを介して送信される場合、同じプロトコルも機能し得る。この場合、光ホモダイン検出器の代わりにミキサーが使用される。光リンクを使用する利点は、１０^４－１０^５×より高いキャリア周波数によって駆動される、はるかに高いデータ容量である。

【0061】

追加のＮｅｔＣａｓｔバリアント
ＮｅｔＣａｓｔは非常に拡張可能である。それは、コヒーレントまたはインコヒーレントに検出し、周波数または時間にわたって統合し、インコヒーレント検出の場合、追加の複雑さによってレシーバーのノイズを低減することができる。

【0062】

図４Ａ～４Ｃは、ＮｅｔＣａｓｔの異なるバリアントを示す。これらのバリアントの全ては、時間周波数空間における重み行列をエンコードし、ここで、ｗ_ｍｎは時間ステップｔ_ｎでの波長バンドの振幅ω_ｍである。図４Ａは、二つの可能な行列ベクトル乗算スキームを示す：高速ＭＺＭおよびＷＤＭ光検出器（ＰＤ）を使用した時間積分／周波数分離（ＴＩＦＳ；上）による右乗算ｙ＝ｗｘ、またはクライアントの高速光検出器（ＰＤ）と重みバンク（ＷＢ）を使用した時間積分／周波数分離（ＦＩＴＳ；下）による左乗算ｙ^ｔ＝ｘ^Ｔｗ。重みバンクは、周波数チャネルの電力を独立して重み付けする役目をし、一つの可能な実装には、図２に示すように、共振器の離調でエンコードされたアクティベーションｘ_ｍで周波数にわたって積分する、リング共振器のアレイが含まれる。ＦＩＴＳは、多くの低速検出器が使用されるＴＩＦＳ方式とは異なり、単一の高速検出器ペアを使用する。

【0063】

図４Ｂは、シンプルインコヒーレント検出（上行）および低ノイズインコヒーレント検出（下行）のための、重みサーバー（左列）、ＴＩＦＳクライアント（中列）、ＦＩＴＳクライアント（右列）を示す。単純なインコヒーレント検出は、図１および図２からの重みサーバー１００およびＴＩＦＳクライアント１３０を実施することができる。また、追加ポートとドロップポートが、異なる入力の微分検出器１３５′に結合された、リング共振器１３４′の重みバンクを使用するＦＩＴＳクライアント１３０′を用いて実施することができる。

【0064】

ＴＩＦＳクライアント１３０では、光信号は、全波長チャネルを同時に変調する広帯域ＭＺＭ１３３によって変調される。これは、アクティベーションｘ_ｎによって重み行列ｗ_ｍｎの列を重み付けする。結果として生じる波長チャネルは、多重分離され１３４′、積は、時間積分後、差検出器１３５′で検出される（重み行列の行の総和、Σ_ｎｗ_ｍｎｘ_ｎ）。

【0065】

ＦＩＴＳクライアント１３０′では、光信号は、各波長チャネルを独立して変調する重みバンク１３４を介して送信される。これは、アクティベーションｘ_ｍによって重み行列の行ｗ_ｍｎを重み付けする。得られた信号は、差検出器上で検出され、時間ステップｎで、差電流は、全ての寄与波長チャネルの総和（重み行列、の行の総和、Σ_ｍｗ_ｍｎｘ_ｍ）である。

【0066】

図４の一番下の行に示されている低ノイズのインコヒーレントサーバー４１０とクライアント４３０および４３０′は、インコヒーレントサーバー１１０およびクライアント１３０および１３０′よりも低いノイズで動作する（ただし、コヒーレントサーバー３１０およびクライアント３３０および３３０′ほど低くはない）、およびＬＯを要求しない。単純なインコヒーレント重みサーバー１１０と比較して、低ノイズインコヒーレント重みサーバー４１０は、マイクロリング変調器４１２のアレイの前に、追加の波長選択強度変調器（ＩＭ）４４１を有する。この波長選択強度変調器４４１は、図４Ｂに示すようにリングのアレイで実施することができる。強度変調器４４１は、重み振幅｜ｗ_ｍｎ｜を光キャリア上にエンコードし、マイクロリング変調器４１２はバイナリモードで機能して、重みの符号を光キャリア上にエンコードする。同様に、ＴＩＦＳクライアント４３０では、図４Ｂに示されるように、ＭＺＭ４３３の入力に結合された追加の強度変調器４４２の対が使用される。強度変調器４４２は、ＤＮＮ入力振幅｜ｘ_ｎ｜に従って電力を減衰させ、一方、ＭＺＭ４３３は、バイナリモードで機能して、ＤＮＮ入力の符号をエンコードする。リング共振器１３４は、上述のように、バランスの取れた光検出器４３５による検出のために各ＷＤＭチャネルをフィルターリングする。ＦＩＴＳクライアント４３０′はまた、リング共振器４３４′に結合された強度変調器４４２′を含み、その追加ポートおよびドロップポートは、微分検出器４３５′の異なる入力に結合される。

【0067】

図４Ｃは、コヒーレント検出を使用して動作する重みサーバー３１０、ＴＩＦＳクライアント３３０、およびＦＩＴＳクライアント３３０′を示す。重みサーバー３１０およびＴＩＦＳクライアント３３０は、図３について上記に記述される。ＦＩＴＳクライアント３３０′は、高速ホモダイン検出器３３４′を使用して、重み信号と、コームラインが重み信号を生成するサーバー３１０のＷＤＭ－ＭＺＭ３１２のようなＷＤＭ－ＭＺＭ３３３′で変調されたＬＯコームとの間の干渉を検出する。ホモダイン方式の一つの利点は、低ノイズであり、これによって、ＯＮＮが低受信光パワーで動作することを可能にするが、ＬＯはクライアント３３０′に非常に複雑なものを加える。

【0068】

望ましいニューラルネットワークの性能およびシステムの複雑さに応じて、単純で低ノイズインコヒーレントサーバーおよびクライアントを混合し、一致させることができる。低ノイズ構成の利点を示すために、Ｓ／Ｓ、Ｓ／ＬＮ、ＬＮ／Ｓ、ＬＮ／ＬＮ（シンプルなサーバー／シンプルなクライアント、シンプルなサーバー／低ノイズクライアントなど）という四つのケースを検討する。いずれの場合も、振幅ａ_ｗを有する非重み付け周波数コームから開始し、ここで、Ｎ_ｗｔ＝｜ａ_ｗ｜^２は、（ソースでの）重み当たりの光子の数であり、ｗ,ｘ∈［－１，１］であるように、変数を正規化する。
１．Ｓ／Ｓ：重みバンク（ＷＢ）は、ｗ_ｍｎをＰＢＳで多重化された二つのチャネルの差分電力にエンコードする。これらは、

【数12】

である。クライアントでは、これらのチャネルをＭＺＭ（干渉回避）と再混合して、

【数13】

を与える。従って、差分電荷は、

【数14】

であり、一方ショットノイズを設定する総吸収電荷は、

【数15】

である。
２．Ｓ／ＬＮ：入力はＳ／Ｓと同じであるが、クライアントは、図４Ｂに示すように、ＭＺＭの前に、強度変調器（ＩＭ）の追加対を有する。ＩＭは振幅｜ｘ_ｎ｜に従って電力を減衰し、一方でＭＺＭはバイナリモードで機能して、符号（θ_ｎ＝ａｒｇ（ｘ_ｎ）∈｛０，π／２｝）をエンコードする。従って、光検出器（ＰＤ）入力は、ｘ_ｎ＞０に対する

【数16】

またはｘ_ｎ＜０に対する

【数17】

のいずれかである。Ｑ_ｄｅｔは、同じであるが、Ｑ_ｔｏｔは、｜ｘ_ｎ｜分の１に減少する。
３．ＬＮ／Ｓ：この場合、標準クライアントが使用されるが、重みサーバーはＷＢの前に追加のＩＭを有する。これは波長選択性であり、図４Ｂに示すように、リングのアレイで達成することができる。Ｓ／ＬＮの場合と同様に、ＩＭは振幅｜ｗ_ｍｎ｜をエンコードする、一方でＷＢはバイナリモードで機能し、符号をエンコードする。従って、単一の偏光は、電力を運ぶ：ｗ_ｍｎ＞０の場合、ａ_＋＝｜ｗ_ｍｎ｜Ｎ_ｗｔ、およびｗ_ｍｎ＜０の場合ａ_-＝｜ｗ_ｍｎ｜Ｎ_ｗｔである。ＰＤ入力は

【数18】

であり、これは同じＱ_ｄｅｔを与えるが、Ｑ_ｔｏｔは、Ｓ／Ｓケースと比較して｜ｗ_ｍｎ｜分の１に減少する。
４．ＬＮ／ＬＮ：サーバーとクライアントの両方が低ノイズ設計を使用している場合、ＷＢとＭＺＭは常にＢＡＲモードまたはＣＲＯＳＳモードになっているため、全ての電力は、検出器の一つに投入される：ｗ_ｍｎｘ_ｎ＞０に対して

【数19】

またはｗ_ｍｎｘ_ｎ＜０に対して

【数20】

のいずれか。従ってＱ_ｔｏｔは、｜ｗ_ｍｎｘ_ｎ｜分の１に減少される。

【表1】

【0069】

これらのケースを表１に列挙する。それらが同じ差分電荷Ｑ_ｄｅｔ＝ｗ_ｍｎｘ_ｎＮ_ｗｔを収集する間、ショットノイズ制限を設定する総ＰＤ電荷は、多くの入力または重みが小さい（またはゼロ）場合、かなり変化する。これは一般的に、真実であり、特に、メモリーを節約するためにしばしば切詰められるＤＮＮ重みに対してそうである。

【0070】

ＰＤ電荷から、論理出力ｙ_ｍ上のショットノイズを計算することができる。一般的に、我々は以下を得る。

【数21】

【0071】

表１の右列は、四つのインコヒーレントスキーム（ならびにコヒーレントスキーム、式（９））のノイズ振幅σ_ｍを比較する。予想通り、低ノイズおよびコヒーレントスキームは、単純なスキームよりも低いノイズ振幅を有する。また、

【数22】

であるので（Ｈｏｌｄｅｒの不等式の適用）、コヒーレントスキームはＳ／ＬＮよりも優れている。しかし、ＬＮ／ＬＮまたはコヒーレントが最良かどうかは、重みに依存し得る。

【0072】

時間および周波数はフーリエコンジュゲートであるため、ノイズ解析は、ＦＩＴＳおよびＴＩＦＳ積分スキームで、置換ｗ→ｗ^ＴおよびＮ→Ｍ（周波数チャネルを備えたスワップ時間ビン）で同じである。さらに、低ノイズ方式のサイドメリットは、位相誤差に対する頑健性である。ＭＺＭは常にＢＡＲまたはＣＲＯＳＳ構成であるため、ａ_＋とａ_－の間の干渉はなく、相対位相はもはや重要ではない。

【0073】

性能
スループット
クライアントが、例えば、図１および図２に示すように、マトリクスベクトル乗数として実行される場合、それは、受信した重み当たり一つのＭＡＣを実行する。従って、クライアントのスループットは、光リンクによって制限される。ＮｅｔＣａｓｔシステムは、ＰＢＳ１１５の後（図１）、オンチップファンアウトを備えたマトリックス－マトリックスクライアントを有し得る。これにより、最大スループットが、複雑さを犠牲にして（クライアントはκ回超複製される）一定のファクタ（重みあたりκＭＡＣ）だけ増加する。ただし、この場合、リンク帯域幅は依然としてスループットに限界を置く。

【0074】

基本的に、サーバーとクライアント間の光リンクのチャネル容量は通常、クロストークによって制限される。このアーキテクチャーでは、クロストークは、（１）時間的クロストークと（２）周波数クロストークの二つの形態を取る。時間的クロストークは、リング変調器の有限光子寿命およびその有限ＲＣ時定数から発生する。これらをひとまとめにすると、およその変調器応答時間

【数23】

が得られる。効率的な変調器については

【数24】

であり、故に

【数25】

時間的クロストークは、形態Ｘ_ｔ＝ｅ^－Ｔ／ｔを有してもよく、ここで、Ｔは重み間の時間である。これにより、変調器のシンボルレートＲ＝１／Ｔの上限が設定される。

【数26】

ここでｆ_０は、は光キャリア周波数であり、およびＱは、リングの品質ファクタである。

【0075】

周波数クロストークは、ＷＤＭレシーバーのチャネル間で発生する（完全なＷＤＭであっても、トランスミッターリングは周波数クロストークを有する）。これは、Ｌｏｒｅｎｔｚ型線形Ｘ_ω＝（１／２κ）^２／（Δω^２＋（１／２κ）^２）によって設定され、ここでΔωは、隣接するＷＤＭチャネル間の間隔である。低クロストークの場合Δω＞＞κ、これは最小チャネル間隔を与える：

【数27】

【0076】

アナログクロストークは、ＤＮＮが機能するには十分に低い必要がある。

【数28】

のアナログクロストークは通常十分である。空間的クロストークが類似の閾値（Ｘ_ｔ＝Ｘ_ω＝Ｘ）を有すると仮定すると、チャネル容量は、以下によって制限される。

【数29】

ここで、Ｂは、帯域幅（Ｈｚ単位）であり、およびＣ_０は、正規化されたシンボルレート（単位は１／Ｈｚ－ｓ）である。

【0077】

表２は、クロストークの関数としての容量を示す。これらの値は、ハイエンドＧＰＵのＨＢＭメモリー帯域幅と同じボールパーク内にある（例えば、６～１２Ｔｂｐｓ）。１ＭＡＣ／ｗｔの行列ベクトルの場合、ＧＰＵまたはＴＰＵレベルの算術性能（＞５０ＴＭＡＣ／ｓ）に到達できない可能性がある。これには、重みを再利用する（上述の通り、ＧＰＵおよびＴＰＵはいずれにしてもこれを行う）、またはＣバンドを超えて動作するために、クライアント内の光学ファンアウトを伴い得る。

【0078】

また、ＭＺＭ、長いファイバーリンク、ＰＢＳ、または自由空間光学部品の分散によって設定される実用的な帯域幅制限があり得る。これらの帯域幅制限の多くは、適切なエンジニアリングによって回避できる。

【表2】

【0079】

レーザー出力／ＳＱＬ
サーバーは、検出器で妥当なＳＮＲを維持するのに十分なレーザー出力を放射する必要がある。ノイズは、各ＤＮＮ層の行列ベクトル積においてガウス項としてモデル化することができる。式（１０）の後、以下を得る。

【数30】

【0080】

ここで、σ_Ｊおよびσ_Ｓは、それぞれジョンソンおよびショットノイズ寄与である。ジョンソンノイズは、キャパシタの電荷に対していわゆるｋＴＣノイズ変動を生じさせる。これらの変動は

【数31】

としてスケールし、大きな静電容量を有するリードアウト回路（検出器およびトランスインピーダンスアンプ（ＴＩＡ））に対して、優勢となる。光の光子への量子化によるショットノイズは、高い光パワーまたはコヒーレント検出（強いＬＯで）の場合に優勢であり得る。

【0081】

レーザー出力のベンチマーク基準を定義するには、少なくとも二つの方法がある。第一に、基準は、ＷＤＭ－ＭＺＭの前に、重みサーバーで周波数コーム内のソース電力に基づき定義することができる。これをＮ_ｓｒｃとして示す。これは、本明細書の他の場所で使用されたＮ_ｗｔと同じである。第二に、ベースは、Ｎ_ｔｒで示される重みサーバーの出力における送信電力（平均）に基づき定義することができる。多くの重みがゼロであり、低ノイズまたはコヒーレント検出スキームが使用される場合、これは、Ｎ_ｓｒｃよりもはるかに低くあり得る。受信電力（クライアントで）は、リンク効率のほんのＮ_ｔｒ倍である。ソース電力は、実用的なアンプなしでは便利な基礎であるが、あまりにも多くの分散、非線形性、またはクロストークなしに効率的に信号を増幅することが可能である限り、送信された電力がより便利な基礎であり得る。さらに、送信電力を使用すると、多くの場合、より有利な結果につながる。

【0082】

ＯＮＮのノイズによって負わされるエネルギー束を計算するには、ニューラルネットワークを、各層に加法ガウスノイズ（式（１４））を用いて実行し、ノイズ限界、最大の許容ノイズ振幅σ_ｍａｘを計算することを検討する。これは、ＤＮＮおよび誤差に対する許容誤差に依存する。

【0083】

図５Ａおよび５Ｂは、小および大ＮＮに対して、ＭＮＩＳＴパーセプトロンのσの関数としてエラー率をそれぞれ示す。ノイズが、１．５×以下、誤差をより大きくするのなら、小さなＮＮ（１００－ニューロン隠れ層）に対してσ_ｍａｘ＝０．２７および大きなＮＮ（１０００－ニューロン隠れ層）に対して０．９５である。

【0084】

【数32】

が光エネルギーに依存するため、最大の耐ノイズ振幅σ_ｍａｘは、エネルギー測定基準（Ｎ_ｓｒｃまたはＮ_ｔｒのいずれか）の保守的な推定値を得るために使用できる。第一に、ジョンソンノイズは、Ｎ_ｓｒｃで反比例的にスケールされ、それに下限を設定する。

【数33】

表３は、ｋＴＣノイズ、ＭＡＣＥ_ｍｉｎ当たりの対応する最小エネルギー、および最小電力（１ＴＭＡＣ／ｓのレートで）を列挙する。

【表3】

【表4】

【0085】

ショットノイズの項σ_ｓは、電力の平方根と反比例する。これは、コヒーレント状態における基本的な量子変動（十分に小さな静電容量で、または検出器の前にアバランチングもしくはオンチップゲインを使用して回避できる熱変動ではない）から生じるため、標準量子制限（ＳＱＬ）と呼ばれる光パワーに下限を設定する。ＳＱＬは、二つの理由から、ここで関連し得る。（１）光パワーバジェットは、レーザー効率、自由キャリア効果、および非線形効果により、はるかに低い。チップは１００Ｗの加熱に耐えることができるが、ほとんどのシリコンオン絶縁体（ＳＯＩ）導波路は最大で１００ｍＷかかる。および（２）リンクは、多くのアプリケーション（例えば、長距離の自由空間）において非常に低い効率であり得る。そのため、ＨＤ－ＯＮＮとは異なり、ＮｅｔＣａｓｔシステムはＳＱＬの近くで動作し得る。

【0086】

以下による、係数Ｆ_ｓｒｃおよびＦ_ｔｒ係数の定義：

【数34】

ショットノイズによって設定された電力制限は、

【数35】

【0087】

従って、エネルギー制限は、係数Ｆ_ｓｒｃ、Ｆ_ｔｒに密接に関連する。これらの係数は、σの形態（表１）によって得ることができる。表４は、各スキームの係数を列挙する。上述のように、スパースまたはほぼスパースの重みまたはアクティベーション

【数36】

の場合にノイズを低減することによって、低ノイズ設計は、必要なレーザー出力を大きなファクタだけ低減することができる。表５に示すこれらの要因Ｆ_ｓｒｃおよびはＦ_ｔｒ、同じＭＮＩＳＴニューラルネットワークについて、「シンプル」設計と比較して光電力消費量の１０^３×低減を可能にする。

【0088】

一見すると、単純な設計であっても、ノイズ制限された電力はＥ_ｍｉｎ＝１．４ｆＪ／ＭＡＣであり、オンチップ電子機器、例えばＤＡＣ、ＡＤＣ、およびメモリーが支配する可能性が高いほど十分に低いため、このような減少は重要ではないと思われる。しかし、このノイズ制限された電力は、１ＴＭＡＣ／ｓという控えめなスループットであっても、レシーバーで１．４ｍＷの光パワーがあることを意味する。レーザーとＥＤＦＡが最大で１０～１００ｍＷでサポートされることを考えると、これは、リンク損失や目の安全を言うまでもなく、許容される光ファンアウトに制限をかけることになる。特に損失の多いリンク（例えば、空きスペース上で長距離で接続されるドローン）については、たとえそれがクライアント側の電力予算に影響を与えていなくても、可能な限りＥ_ｍｉｎを削減する強い動機がある。

【0089】

幸いなことに、コヒーレントスキームとＬＮ／ＬＮインコヒーレントスキームは、数光子／ＭＡＣの非常に低い透過エネルギーで動作可能であり、１ＴＭＡＣ／秒でさえもＰ_ｍｉｎ＜１ｕｍＷを実現することができる。このようなクライアントでは、１０ｍＷのソースは、最大１０^４のリンク損失（またはファンアウト比）に耐えることができる。あるいは、低損失リンクは、１００ＴＭＡＣ／秒の計算に十分な電力を供給でき、サブｍＷ（光）電力バジェットでＴＰＵをビートすることができる。

【0090】

低ノイズインコヒーレントスキームでは、ショットノイズの制限が非常に低いため、ジョンソンノイズがショットノイズを支配し得る。ジョンソンノイズを抑制するために、信号の増幅前（例えば、ＥＤＦＡまたは半導体光アンプを用いて）またはアバランチ検出器を使用し得る。

【表5】

【0091】

クライアント電力消費量
クライアントでの電力消費量は、（１）クライアントメモリーからアクティベーションをフェッチすること（ＤＮＮ層への入力）、（２）ＭＺＭを駆動すること、および（３）検出器出力を読み取り、デジタル化することに依存する。

【0092】

サーバーからクライアントに重みをブロードキャストすることで、ＮｅｔＣａｓｔはクライアントメモリーから重みを取得する必要性を排除する。一般的に、ＤＮＮの重みは、アクティベーションよりもはるかに多くのメモリーを占有する。完全に接続される層では、重みはＯ（Ｎ^２）メモリーを使う一方で、アクティベーションはＯ（Ｎ）を使うのみである。（バッチ処理はこれを少し均等化するが、ミニバッチのサイズは通常、Ｎよりも小さくなる）。さらに、重みとは異なり、その全てはどこかに記憶されるべきであり、推定中、現在の層のアクティベーションのみがいつでも記憶される必要がある（分岐点および残差層を除く）。従って、アクティベーションに対する重みの比率は、ネットワークの深さおよびその層のサイズとともに増加する。

【0093】

重みがなければ、クライアントは、オンチップメモリー内にＤＮＮの全状態を保存することができ、クライアント側で動的ランダムアクセスメモリー（ＤＲＡＭ）リードを排除することができる。さらに、オンチップメモリーから読み取る場合でも、図１に示されるように、ＭＺＭにおける波長多重化からのＭのデータ再利用係数がある。従って、クライアントによるメモリー関連のエネルギー消費は非常に低い。

【0094】

クライアントでＭＺＭを運転しても、電力はあまり消費されない。自由なキャリアベースのユニトラベルキャリア（ＵＴＣ）ＭＺＭトランスミッターは、Ｏ（１）ｐＪ／ｂｉｔを使用する。メモリー読み取りと同様に、ＷＤＭはＭチャネル全体のドライバーコストを償却するため、ＭＡＣ当たりのエネルギーはＯ（１／Ｍ）ｐＪとなる。多くのチャネルでは、駆動コストは、数十フェムトジュール／ＭＡＣを下回って駆動することができる。（これは、ＭＺＭが帯域幅全体にわたってＵＴＣであり、分散を無視していることを前提としている）。より外来の変調器（例えば、ＬｉＮｂＯ_３、有機ポリマー、ＢａＴｉＯ_３、またはフォトニック結晶に基づく）は、変調コストをフェムトジュールに低減することができ、これは再びＷＤＭから１／Ｍに償却される。しかし、今日、ファウンドリで利用可能な変調器では、少ないｆＪ／ＭＡＣ性能がすでに可能である。

【0095】

クライアントでの検出器出力の読み取りおよびデジタル化はまた、少量の電力を消費する。読み出しおよびデジタイズ時の消費電力は通常、８ビットの精度でＯ（１）ｐＪ／サンプルであるアナログ－デジタル変換（ＡＤＣ）によって支配される。性能を損なうことなく、１または２ビットを犠牲にすることによって、ＡＤＣエネルギーを１００ｆＪ以下にスケールダウンすることができる。いずれにしても、Ｎ＞１００で割った後、ＡＤＣのコストは、最大数十フェムトジュール／ＭＡＣである。

【0096】

クライアントは、フィルターとして使用されるリング共振器のチューニングおよび制御を含む、他の動作のために電力を消費し得る。サーマルリングチューニングによって、リング変調器のシステムレベルの電力消費量をｆＪ／ｂｉｔからｐＪ／ｂｉｔに上げることができる。レシーバーＷＤＭ（図１に示すようにリングアレイで設計される）が熱的に安定しない場合、それは熱的に調整され得る。サーマルリングチューニングの消費電力は、ＭＥＭＳまたはキャリアチューニングを使用することで削減できる。

【0097】

サーバーの電力消費量
最も高い電力消費シナリオでは、重みサーバーはその重み全てをＤＲＡＭに記憶し、ローカルデータ再利用ゼロを達成し、故に電力バジェットはＤＲＡＭ読み取り（８ビット精度で約２０ｐＪ／ｗｔ）で支配される。目標帯域幅１Ｔｗｔ／ｓでは、これはおよそ２０Ｗである。トランスミッターは、数ワット（前と同じＯ（１）ｐＪ／ｗｔと仮定）を加算してもよく、その後、以前に考慮した光パワーがある。

【0098】

ＮｅｔＣａｓｔサーバークライアントアーキテクチャーは、サーバーが計算およびメモリー書き込みのタスクから解放されるため、全く新しいデータフローにつながることができる。例えば、重みサーバーは、重みを静的ランダムアクセスメモリー（ＳＲＡＭ）に格納するウエハースケールの重みサーバーとして構築され得る。それに見合った変調器の改善により、エネルギー消費量は桁違いに減少する。ウエハースケールのサーバーでは、オフチップおよびオンチップの両方の相互接続コストを回避するために、ローカルにデータを格納する必要がある。

【0099】

図６Ａは、重みサーバー用の低電力光バックボーンを形成する層間チップ６００を示す。重みは、ウエハースケール（またはマルチチップセット）プロセッサー上のＳＲＡＭブロック６１３の規則的な配列に格納される。各ＳＲＡＭブロック６１３は、対応するＤＡＣ６１４を介して独自のＷＤＭ変調器アレイ６１２に結合され、少数の時間ステップ（例えば、１００時間ステップ）をステップスルーするのに十分なメモリーを有する。サーバーは、各交差点でスイッチング論理６１９によって制御されるＭＺＭ６１８を有する対数深さ光スイッチングツリーを使用して、オンデマンドでＳＲＡＭブロック６１３を選択することができる。スイッチングツリーアーキテクチャーは高度にモジュール化されており、モデルが単一のサーバーに対して大きすぎる場合に、複数のウエハースケールサーバーを結合することが可能となる。柔軟なフォトニックバックボーン（低速だが低損失のコンポーネント、例えばサーモ光学またはＭＥＭＳコンポーネントで構築可能）があれば、サーバーは異なるモデルに独立して対応したり、リソースをプールしたりして、全てをルール化する一つのサーバーを構築したりできる。

【0100】

一見すると、ツリー上の各リーフに一つの重みがありスイッチがクロックサイクルごとに切り替えられる場合、スイッチングツリーはエネルギー集約的であるように思われる。しかし、このケースでは、各リーフは多くの重みを含んでもよく、切り替え前に多くのクロックサイクルを待つことができる。これにより、スイッチングネットワークの負荷が大幅に軽減される。ただし、重みがＤＲＡＭに格納される場合でさえ、ＮｅｔＣａｓｔは既存の技術で妥当な電力で稼働する必要がある。

【0101】

ＮｅｔＣａｓｔのアプリケーション
スマートセンサーが、サーバーへの直通の視線または光ファイバー接続を有するが、電力が不足する、多くのエッジコンピューティングシナリオがある。例えば、航空機などの複雑な機械は、図６Ｂに示すように、航空機内部のファイバーを通してリンクされ得る、何百ものセンサーを含む一方で、それらを配線で接続することが、煩雑または危険であり得または信号を電磁妨害の影響を受けやすい状態にし得る。これは、チップをつなぐ長いワイヤが、太陽嵐の間に静電放電を起こしやすい宇宙空間で特に当てはまる。

【0102】

図６Ｃは、深層学習が、環境モニターリング、探査、および資源探索などのタスクを支援するために、ソーラーまたはバッテリー駆動のカメラ、ドローン、およびその他のモノのインターネット（ＩｏＴ）デバイスのネットワークにもたらされる、測量および現場作業に使用されるＮｅｔＣａｓｔを示す。この場合、光ファイバーは、基地局の視線内の全ての装置にＤＮＮ重みをブロードキャストするスマート光のペンシルビームによって置き換えられる。サーバーに結合された自由空間トランスミッターは、クライアントデバイスのポインティング、取得、および追跡のためにブロードバンド信号のために機能する、複数のビームに対して潜在的に正確なビームステアリング装置を使用し得る。

【0103】

図６Ｄは、単一のＤＮＮサーバーが複数のラックを光学的に提供し、その各々がクライアントを保持する、データセンター内に展開されたＮｅｔＣａｓｔを示す。同じニューラルネットワークが多数のユーザーで並行して実行される場合、これにより、大量のエネルギーコスト（重み回収）をラック数に対して償却することができる。ＮｅｔＣａｓｔは、他の光学式重みサーバーよりも堅牢である。その理由は、（１）ＮｅｔＣａｓｔのインコヒーレントバージョンは、コヒーレント干渉に依存せず、（２）自由空間リンクであっても、整列する単一モードがあるためである。

【0104】

ＮｅｔＣａｓｔは、ＤＮＮを用いたエッジ処理の他のスキームよりもいくつかの利点を提供する。まず、アナログドメイン内の光パワーを統合し、最後に読み取る。従って、エネルギー消費はデジタル光ニューラルネットワークよりもＯ（１／Ｎ）に小さくなる。今日の集積回路では不可能な大きなＤＮＮ（例えば、１０^８重みを超えるもの）の実装に使用することができる。それは、位相の一貫性なく動作できるため、サーバーとクライアントを接続するリンクの安定性に関する要件を緩和する。さらに、リンクは画像化リンクではない。それらは、光ファイバーリンク、またはシンプルなガウス光学部品を備えたシングルモードの自由空間リンクである。最後に、Ｏ（ＭＮ）、またはＯ（Ｎ^２）ではなく、チップエリアはＯ（Ｍ）として、スケール化される。なぜなら、ＮｅｔＣａｓｔは、重み固定のスキームとは異なり、出力固定であるためである。

【0105】

分散トレーニング
もう一つのエキサイティングな可能性は、サーバーとクライアント間の双方向の光リンクを使用して、分散トレーニングを実施することである。トレーニングにより、サーバーはクライアント上で処理されるデータからリアルタイムで重みを更新することができる。以下のトレーニング方法は、ＮｅｔＣａｓｔと互換性があり類似のハードウェア上で実行される。

【0106】

ＤＮＮトレーニングは２ステップのプロセスである。第一に、アクティベーションＸ_ｎ＝∂Ｊ／∂ｘ_ｎ，ψ_ｍ＝∂Ｊ／∂ｙ_ｍに対する損失関数Ｊの勾配は、逆行性伝播によって計算される。各層内で、逆行性伝播関係は、

【数37】

層の間では、

【数38】

ベクトル化された形態では、式（１８）を行列積Ｘ＝ｗ^Ｔψとして記述することができ、式（１９）はベクトル要素ψ＝ｇ^’（ｘ）Ｘの要素ごとの重み付けである。

【0107】

第二に、重み更新δ_ｍｎ＝∂J／∂ｗ_ｍｎ、すなわち、重みに対するＪの勾配を計算する。

【数39】

これは、ベクトル外積δ＝ψｘ^Ｔに過ぎない。これらの関係を表６に要約し、図７Ａに示す。

【表6】

【0108】

逆行性伝播は、行列ベクトル積に依存する。光学部品に関しては、ＮｅｔＣａｓｔで実行するのは簡単である。単にｗ^Ｔに対しｗをスワップを行うだけで、全てが推論と同じように進行する。重み更新については、アクティベーションｘおよび勾配ψを仮定して、外積δ＝ψｘ^Ｔを計算し、結果を（互換フォーマットで光学的にエンコードして）サーバーに送信する。

【0109】

重み更新は行列なので、図７Ｂに示されるように、重み行列と同じ時間周波数フォーマットでエンコードすることができる。内積を得るために、行列の行はψによってスケールされ、列はｘによってスケールされる。これは、低速波長選択変調器（異なる共振周波数に同調されたリング共振器の重みバンク（ＷＢ）として図７Ｂに表される）のアレイを通して、次に、高速ブロードバンドＭＺＭを通して、周波数コームを送ることによって行うことができる。光信号がサーバーに到達すると、それは多重分離され、各波長チャネルが高速検出器のアレイ上で読み出される。

【0110】

図７Ｃと７Ｄは、図４Ｂおよび４Ｃに関して上述した、シンプル、低ノイズおよびコヒーレント推論に類似しているハードウェアでこれを実行する三つの方法を示す。図７Ｃは、サーバー７１０ａでのインコヒーレント検出を使用するための（右上）、シンプルなクライアント７３０ａおよび／または低ノイズクライアント７３０ａ’に光リンク７２０を介して接続されるサーバー７１０ａ（左）を示す。図７Ｄは、光リンク７２０を介して別のクライアント７３０ｂからのトレーニング信号のコヒーレント検出のために構成されるサーバー７１０ｂを示す。

【0111】

図７Ｃのシンプルなクライアント７３０ａにおいて、モードロックされたレーザー７３１は、マイクロリング変調器７３２ａの重みバンク（ＷＢ）によって変調され、ＭＺＭ７３３に供給される、周波数コームを生成する。ＷＢの変調器７３２ａは、一部Ｔ＝１／２（１＋ψ_ｍ）を送信し、残りの部分Ｒ＝１／２（１－ψ_ｍ）を反映するように設定される。ＭＺＭ７３３は、θ_ｎ＝１／２ｃｏｓ^－１（ｘ_ｎ）に設定され、これらの入力を混合するが、それらが、±π／２位相ずれている場合、干渉は発生せず、各出力ポートで電力は

【数40】

によって供給される。これらのポートは、ＰＢＳ７３４上で組み合わされ、今や(now)
、重みのレシーバーとして機能する、サーバー７１０ａに送信される。サーバー７３０ａ内のＷＤＭ－ＰＤレシーバー７１２ａは、受動ＷＤＭで波長を分離し、各時間ステップで、重み勾配と等しい差電流を計算する。

【数41】

【0112】

アクティベーションまたは重みの多くが非常に小さい場合、大きなショットノイズのため、信号Ｑ_ｄｅｔを解決することが困難であり得る。図７Ｃの低ノイズクライアント７３０ａ’は、図４Ｂの低ノイズクライアント４３０と同様に、この問題を解決する。ここで、ψ_ｍの符号および振幅は、それぞれマイクロリング変調器７３２ａおよび波長選択強度変調器（ＩＭ）７４１によって、ソース７３１からの周波数コーム上にエンコードされる。同様に、ｘ_ｍの符号および振幅は、ＭＺＭ７３３および強度変調器ペア７４２にエンコードされる。結果として、偏光のうち一つのみが電力を伝送し（ψ_ｍｘ_ｎの符号に応じて）、電力は｜ψ_ｍｘ_ｎ｜である。検出された差分電荷は、式（２１）によって与えられるが、総電荷は、ショットノイズとともに大幅に減少される。

【0113】

コヒーレントサーバー７１０ｂおよびクライアント７３０ｂは、共通のＬＯを共有するため、重みをコヒーレントにエンコードすることができる。これは、コーム源７３１から低速ＷＤＭ－ＭＺＭ７３２ｂを通してクライアント側の高速ブロードバンドＭＺＭ７３３に周波数コームをカスケードし、サーバー７１０ｂでＷＤＭホモダイン検出器７１２ｂのＬＯ７１１からＬＯコームに対して、結果として生じるトレーニング信号をビートすることを伴う。この場合、信号フィールド（電力ではなく）はψ_ｍｘ_ｎのようにスケールされる。ＬＯ振幅αでは、各検出器の電荷は

【数42】

であり、差分電荷はψ_ｍｘ_ｎとしてスケールされる。

【表7】

【0114】

推定と同様、ＮｅｔＣａｓｔにおけるトレーニングの精度は、光パワーの関数である検出器ノイズによって制限される。大信号の限界では、このノイズは、計算された外積のガウス項につながる。

【数43】

【0115】

σ_ｍｎは、多くの場合、特定の行列要素に依存するが、平均

【数44】

を見ることがより便利であり得る。このノイズ分散は、ジョンソンとショットノイズの項

【数45】

の総和であり、

【数46】

としてスケールされる。表７は、図７Ｃおよび７Ｄの三つのトレーニングスキームのノイズ振幅を比較する。推定に関する上記の議論と一致して、ほとんどの｜ｘ_ｎ｜（または｜ψ_ｍ｜）がゼロに近い場合、ノイズは大幅に低減される。表５は、訓練されたＤＮＮについて、〈｜ｘ_ｎ｜〉＜０．１を示す。これがトレーニングで真実（True）であり、ψ_ｍが、同様に少ない場合、低ノイズ設計は、単純な設計と比較して、ノイズを１０^３～１０^４分の１に低減する（または固定ノイズで電力を低減する）ことができる。コヒーレント設計のノイズ低減（または省エネルギー）も有意であり得る。

【0116】

トレーニングが本当に分散している場合、サーバーは複数のクライアントから重み更新を受信し得る。重み伝送に対するクライアント側の電力バジェットは、かなり低いが（Ｍ×Ｎマトリックスに対してＯ（Ｍ）＋Ｏ（Ｎ））、サーバー側では、全ての重みがメモリーに読み取られるため、それは、Ｏ（ＭＮ）である。サーバーがクライアントの重み更新を独立して処理する場合、重大な帯域幅およびエネルギーのボトルネックが発生し得る。従って、サーバーがそれらを読み取る前に、これらの更新を光学的に組み合わせることが非常に有利であり得る。

【0117】

図８Ａは、サーバーでの読み取り前の、光学部品における重み更新の組み合わせを示す。インコヒーレントなケースでは、更新は、（ノイズとして現れる可能性がある）未定義の位相のオーバーラップする光信号間のスプリアス干渉項を回避するために、時間内にインターリーブされる。これは、図８Ｂの上半分のようにインターリーブを実行するために、高速ＭＺＭスイッチ８０１ａおよび８０１ｂを含む対数深さスイッチングツリーを用いて効率的に行うことができる。あるいは、時間遅延を伴う受動コンバイナー８０２をＫ倍の犠牲を払って、未熟な人のインターリーバとして使用でき、ここで、Ｋは図８Ｂの下半分に示すようにクライアントの数である。

【0118】

対照的に、図８Ｃは、信号がコヒーレントスキームですでに位相に入っているため、それらが通常の受動光学素子を使用していかなるインターリーブもせずに組み合わせることができることを示す。これにはＫ倍の損失を伴なうが、結合中に関連情報（全てのクライアントフィールドの合計）が保存されるため、ＳＮＲには影響しない。フィールドａ_ｋ，ｋ∈｛１，...，Ｋ｝上のＫ個の別々のホモダイン測定値の結果を比較し、

【数47】

最初に光学的にフィールドを組み合わせ（ａ＝Ｋ^－１／２Σ_κａ_κ）、その後、ホモダイン検出を行うことによりわかる。

【数48】

【0119】

式（２３）および（２４）の結果は、スケーリング係数によって異なり、ＳＮＲが同じである。従って、コヒーレントスキームでは、重み更新は、シグナルを失うことなく組み合わせることができる。これ以外に、コヒーレントスキームの別の利点は、速度である。インターリーブなしで、それは、多くのクライアントの場合、速度がはるかに速い。インコヒーレントな場合、インターリーブは、重み更新速度を上記で導き出された制限に制限することができる。対照的に、コヒーレント光学部品では、これらの重み更新は光学的にバッチされ、限界はもはや適用されない。これは、多くのクライアントを有し、（光学的）スループットが制限されるシステムにおいて、大きな利点となり得る。

【0120】

結び
本発明の種々の実施形態が、本明細書に説明および図示されたが、当業者は、本明細書に説明される機能を行い、および／または結果および／または利点のうちの一つまたはそれを上回るものを得るための種々の他の手段および／または構造を容易に想起し、そのような変形例および／または修正はそれぞれ、本明細書に説明される本発明の実施形態の範囲内にあるとみなされる。さらに通常、本明細書に記載する全てのパラメーター、寸法、材料、および構成が例であることを意味し、実際のパラメーター、寸法、材料、および／または構成は、本発明の教示が使用される、特定の一つのまたは複数の適用に依存するであろうことを、当業者は容易に理解するだろう。当業者は、通常の実験法を使用するのみで、本明細書に記載する特定の発明の実施形態の多くの同等物を認識し、または解明できるだろう。従って、前述の実施形態は、一例として提示されるにすぎず、添付の請求項およびその均等物の範囲内において、本発明の実施形態は、具体的に説明および請求されるものと別様に実践され得ることを理解されたい。本開示の発明に関する実施形態は、本明細書に記載する個々の特徴、システム、物品、材料、キット、および／または方法を対象とする。加えて、二つ以上のこうした特徴、システム、物品、材料、キット、および／または方法の任意の組み合わせは、こうした特徴、システム、物品、材料、キット、および／または方法が相互に矛盾しない場合、本開示の発明の範囲内に含まれる。

【0121】

また、種々の本発明の概念が、一つまたはそれを上回る方法として具現化され得、その実施例が提供されている。方法の一部として行われる作用は、任意の好適な方法で順序付けられてもよい。従って、実施形態は、例示と異なる順序で行為が実施されるように構築されてもよく、これには、例示の実施形態で連続した行為として示しているにもかかわらず、一部の行為を同時に実施することが含まれ得る。

【0122】

本明細書で定義および使用する全ての定義は、辞書定義、参照により組み込まれる文書の定義、および／または定義された用語の通常の意味を統制するものと理解されるべきである。

【0123】

明細書および請求項において、本明細書で使用されるような不定冠詞「ａ」および「ａｎ」は、これと異なることが明確に示されない限り、「少なくとも一つ」を意味すると理解されるべきである。

【0124】

明細書および請求項において、本明細書で使用されるような「および／または」という語句は、そのように結合された要素の「いずれか一方または両方」、すなわち、ある場合には接合的に存在し、他の場合においては離接的に存在する要素を意味すると理解されるべきである。「および／または」で記載される複数の要素は、同じように、すなわち、そのように結合された要素のうちの「一つまたはそれを上回る」と解釈されるべきである。「および／または」節によって具体的に識別される要素以外に、具体的に識別される要素に関係しようと、無関係であろうと、他の要素が随意的に存在し得る。従って、非限定的な例として、「Ａおよび／またはＢ」とは、「含む」などのオープンエンドの言語と組み合わせて使用される場合、一実施形態ではＡのみ（場合によりＢ以外の要素を含む）、別の実施形態ではＢのみ（場合によりＡ以外の要素を含む）、さらに別の実施形態では、ＡおよびＢの両方（場合により他の要素を含む）、等を指すことができる。

【0125】

本明細書および特許請求の範囲で使用する場合、「または」は、上記で定義された「および／または」と同じ意味を有すると理解されるべきである。例えば、リスト内の項目を区切る場合、「または」または「および／または」は包括的である、すなわち、いくつかのまたはリストされた要素の、および場合によって別のリストされていないアイテムのうちの少なくとも一つを含むが、それらのうちの複数も含むと解釈されるものとする。それとは反対であると明確に指示される用語、例えば「のうちの一つのみ」もしくは「のうちのまさに一つ」、または特許請求の範囲において使用する時の「から成る」などの用語のみ、多数のまたは列挙された要素のうちのまさに一つの要素を包含することを指す。一般に、本明細書で使用する場合、「または」という用語は、「いずれか」、「のうちの一つ」、「のうちの一つのみ」、または「のうちのまさに一つ」など、排他的な用語が先行するときには、排他的な選択肢（すなわち「両方ではなく一方または他方」）を示すとのみ解釈されるものとする。「本質的に～から成る」は、請求項で使用されるとき、特許法の分野で使用されるようなその通常の意味を有するものとする。

【0126】

本明細書および特許請求の範囲で使用する場合、一つまたは複数の要素のリストに関連する「少なくとも一つ」という語句は、要素のリストの中の要素のいずれか一つまたは複数から選択される、少なくとも一つの要素を意味するが、要素のリスト内で具体的に列挙したありとあらゆる要素のうちの、少なくとも一つを必ずしも含むわけではなく、要素のリストのいかなる要素の組み合せも除外するものではないと理解されるべきである。この定義はまた、具体的に識別される要素に関係しようと、無関係であろうと、「少なくとも一つ」という語句が指す、要素のリスト内で具体的に識別される要素以外に、要素が随意で存在し得ることを許容する。非限定的な実施例従って、非限定的な例として、「ＡおよびＢのうちの少なくとも一つ」（または同等に「ＡまたはＢのうちの少なくとも一つ」、または同等に「Ａおよび／またはＢのうちの少なくとも一つ」）は、一実施形態では、少なくとも一つの、必要に応じて二つ以上のＡを含み、Ｂが存在しない（および必要に応じてＢ以外の要素を含む）ことを指し、別の実施形態では、少なくとも一つの、必要に応じて二つ以上のＢを含み、Ａが存在しない（および必要に応じてＡ以外の要素を含む）ことを指し、さらに別の実施形態では、少なくとも一つの、必要に応じて二つ以上のＡを含み、ならびに少なくとも一つの、必要に応じて二つ以上のＢを含む（および必要に応じて他の要素を含む）、等を指すことができる。

【0127】

本明細書および特許請求の範囲において本明細書で使用される場合、数値範囲が、用語「間」によって接続される二つの値の観点から表される場合、範囲は、範囲の一部として二つの値を含むことが理解されるべきである。

【0128】

特許請求の範囲、ならびに上記の明細書で、全ての移行句、例えば、「備える（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「持つ（ｃａｒｒｙｉｎｇ）」、「有する（ｈａｖｉｎｇ）」、「包含する（ｃｏｎｔａｉｎｉｎｇ）」、「伴う（ｉｎｖｏｌｖｉｎｇ）」、「保つ（ｈｏｌｄｉｎｇ）」、「から構成される（ｃｏｍｐｏｓｅｄｏｆ）」、および類似のものは制限がないと理解され、すなわち、含むがそれに限定はされないということを意味する。「から成る（ｃｏｎｓｉｓｔｉｎｇｏｆ）」および「から本質的に成る（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」という移行句のみが、米国特許局の特許審査手続便覧、セクション２１１１．０３に規定の通り、それぞれ閉鎖的または半閉鎖的な移行句であるものとする。

【図1】