(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-06
(54)【発明の名称】光学ネットワークを使用して畳み込みを実行する方法及びシステム
(51)【国際特許分類】
G06F 17/14 20060101AFI20241029BHJP
G06F 17/10 20060101ALI20241029BHJP
【FI】
G06F17/14 510
G06F17/10 A
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024530409
(86)(22)【出願日】2022-11-21
(85)【翻訳文提出日】2024-05-22
(86)【国際出願番号】 US2022050619
(87)【国際公開番号】W WO2023096871
(87)【国際公開日】2023-06-01
(32)【優先日】2021-11-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】524059674
【氏名又は名称】レイセオン カンパニー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】クオ,ピン ピウ
【テーマコード(参考)】
5B056
【Fターム(参考)】
5B056BB12
5B056BB17
5B056BB26
(57)【要約】
装置は、少なくとも1つの第1の周波数間隔を有する第1のキャリア信号(505)を生成するように構成された周波数コーム(505a)を含む。装置はまた、第1のキャリア信号の振幅の1つを変調し、変調されたキャリア信号を生成するように構成された複数の変調器(345)を含む。装置は更に、変調されたキャリア信号を使用して、第1の方向において一次元離散フーリエ変換を実行するように構成された光学カプラ(330)の二次元アレイを含む。装置はまた、コヒーレント検出器(625a~625n)のアレイと、光学カプラのアレイの出力に、及びコヒーレント検出器に光学的に結合された第1のデマルチプレクサ(605)とを含む。装置は更に、少なくとも1つの第1の周波数間隔とは異なる少なくとも1つの第2の周波数間隔を有する第2のキャリア信号(515)を生成するように構成されたローカル発振器(LO)バンクまたはアレイ(515a)を含む。加えて、装置は、LOバンクまたはアレイの出力に、及びコヒーレント検出器に光学的に結合された第2のデマルチプレクサ(615)を含む。
【選択図】
図5A
【特許請求の範囲】
【請求項1】
装置であって、
少なくとも1つの第1の周波数間隔を有する複数の第1のキャリア信号を生成するように構成された周波数コームと、
前記第1のキャリア信号を変調するように構成された複数の変調器であって、各々の変調器は、行列の対応する部分からの値の時間系列に基づいて前記第1のキャリア信号のうちの対応するものを変調するように構成されている、複数の変調器と、
前記変調された第1のキャリア信号を使用して前記行列の部分の一次元(1D)離散フーリエ変換を実行するように構成された光学カプラのアレイであって、前記光学カプラのアレイは、前記行列の対応する部分からの値各々の時間系列についての1Dフーリエ係数の時間系列を出力するように構成されている、光学カプラのアレイと、
を備えた、装置。
【請求項2】
前記光学カプラのアレイは、前記第1のキャリア信号の異なる周波数に基づいて、1Dフーリエ係数の各々の時間系列を複数のスペクトル的に区別できるコピーに複製するように構成されている、請求項1に記載の装置。
【請求項3】
第2のキャリア信号に基づいて、前記1Dフーリエ係数の時間系列をサンプリングするように構成されたコヒーレント検出器を更に備え、前記第2のキャリア信号は、前記少なくとも1つの第1の周波数間隔よりも大きい少なくとも1つの第2の周波数間隔を有し、
前記コヒーレント検出器は、前記1Dフーリエ係数の時間系列の短時間フーリエ変換係数を出力するように構成され、前記短時間フーリエ変換係数は、前記行列の二次元(2D)離散フーリエ変換を表す、
請求項1に記載の装置。
【請求項4】
前記光学カプラのアレイから1Dフーリエ係数の各々の時間系列に対し、前記1Dフーリエ係数の時間系列の複数のスペクトル的に区別できるコピーを分離し、前記スペクトル的に区別できるコピーのうちの異なるものを、前記コヒーレント検出器のうちの異なるものに提供するように構成された第1のデマルチプレクサを更に備えた、請求項3に記載の装置。
【請求項5】
前記第2のキャリア信号を生成するように構成されたローカル発振器(LO)バンクまたはアレイと、
前記光学カプラのアレイからの1Dフーリエ係数の各々の時間系列に対し、前記第2のキャリア信号を分離し、前記第2のキャリア信号の異なるものを前記コヒーレント検出器のうちの異なるものに提供するように構成された第2のデマルチプレクサと、
を更に備えた、請求項4に記載の装置。
【請求項6】
異なる重みに基づいて前記第2のキャリア信号を調節し、調節された第2のキャリア信号を前記コヒーレント検出器に提供するように構成された重み付け要素を更に備えた、請求項5に記載の装置。
【請求項7】
前記行列は、入力特徴マップを含み、
前記重みは、重みマップからのものである、
請求項6に記載の装置。
【請求項8】
前記行列の対応する部分からの値の時間系列は、前記行列からの列方向ベクトルに対応し、
コヒーレント検出器によってサンプリングされる前記光学カプラのアレイからの前記1Dフーリエ係数の時間系列は、行方向ベクトルを含む、
請求項1に記載の装置。
【請求項9】
装置であって、
少なくとも1つの第1の周波数間隔を有する第1のキャリア信号を生成するように構成された周波数コームと、
前記第1のキャリア信号の1つの振幅を変調し、変調されたキャリア信号を生成するように構成された複数の変調器と、
前記変調されたキャリア信号を使用して、第1の方向において一次元(1D)離散フーリエ変換を実行するように構成された光学カプラの二次元(2D)アレイと、
コヒーレント検出器のアレイと、
前記光学カプラのアレイの出力に、及び前記コヒーレント検出器に光学的に結合された第1のデマルチプレクサと、
前記少なくとも1つの第1の周波数間隔とは異なる少なくとも1つの第2の周波数間隔を有する第2のキャリア信号を生成するように構成されたローカル発振器(LO)バンクまたはアレイと、
前記LOバンクまたはアレイの出力に、及び前記コヒーレント検出器に光学的に結合された第2のデマルチプレクサと、
を備えた、前記装置。
【請求項10】
各々のコヒーレント検出器は、前記第1のデマルチプレクサの出力及び前記第2のデマルチプレクサの1つの出力を受信し、フーリエ係数を生成するように構成され、
前記コヒーレント検出器のアレイは、前記装置の入力に対して2D離散フーリエ変換を完了させるように、第2の方向において第2の一次元(1D)離散フーリエ変換を出力するように構成されている、
請求項9に記載の装置。
【請求項11】
前記光学カプラは、50/50光学カプラを含む、請求項9に記載の装置。
【請求項12】
前記第1のキャリア信号の数、前記第2のキャリア信号の数、及び前記コヒーレント検出器のアレイにおけるコヒーレント検出器の数は等しい、請求項9に記載の装置。
【請求項13】
重み行列に従って前記第2のキャリア信号を変調するように構成された重み付け要素を更に備えた、請求項9に記載の装置。
【請求項14】
前記重み行列のフーリエ等価重み行列は、事前に計算され、及び前記装置に記憶される、請求項13に記載の装置。
【請求項15】
入力特徴マップを取得することと、
光学ネットワークを使用して、入力特徴マップの二次元(2D)離散フーリエ変換を生成し、フーリエ-空間入力特徴マップを生成することと、
重みマップに基づいて、フーリエ-空間重みマップを取得することと、
前記フーリエ-空間入力特徴マップ及び前記フーリエ-空間重みマップのアダマール乗算を実行することと、
を含む、方法。
【請求項16】
第2の光学ネットワークを使用して、前記アダマール乗算の出力の2D逆離散フーリエ変換を生成することを更に含む、請求項15に記載の方法。
【請求項17】
前記2D逆離散フーリエ変換の出力は、前記入力特徴マップ及び前記重みマップの畳み込みを含む、請求項16に記載の方法。
【請求項18】
前記光学ネットワークを使用して、前記フーリエ-空間重みマップを生み出すように、前記重みマップの2D離散フーリエ変換を生成することと、
前記フーリエ-空間重みマップの係数を記憶することと、
を更に含む、請求項17に記載の方法。
【請求項19】
入力マップをゼロパディングし、前記入力特徴マップ及び重み付けマップを生成して、前記重みマップを提供することを更に含む、請求項15に記載の方法。
【請求項20】
前記フーリエ-空間重みマップを受信することと、
前記フーリエ-空間重みマップを記憶することと、
記憶装置から前記フーリエ-空間重みマップを取り出すことと、
前記フーリエ-空間重みマップを利用してローカル発振器(LO)キャリア信号を重み付けることと、
を更に含む、請求項15に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は概して、光学システムに向けられる。より具体的に、本開示は、光学ネットワークを使用して畳み込みを実行する方法及びシステムに向けられる。
【背景技術】
【0002】
畳み込みニューラルネットワーク(CNN)は、様々な撮像、レコメンデーション、言語処理、及び他のシステムにおける用途を有する。多くの畳み込みニューラルネットワークは、ハードウェア設計を簡易化するために、行列形式畳み込みを採用する。それらのアプローチでは、畳み込みカーネル(重みマップ)及び入力特徴マップは、テプリッツ(Toeplitz)行列及びベクトルに変換され得、テプリッツ行列及びベクトルの乗算は、所望の畳み込み合計を得る。しかしながら、それらの行列形式畳み込み技術は全体的に、データサイズの観点で十分でない。例えば、サイズN×Nの同一の重みマップ及び入力特徴マップについて、テプリッツ行列を記憶する必要があるメモリは、2N2からN4まで拡大する場合がある。テプリッツ行列のサイズを削減することは、高リフレッシュレートにおける大規模入力データブロックの複製及び分散に起因して電力消費の増大を結果としてもたらし得る。
【発明の概要】
【0003】
本開示は、光学ネットワークを使用して畳み込みを実行する方法及びシステムに関する。
【0004】
第1の実施形態では、装置は、少なくとも1つの第1の周波数間隔を有する複数の第1のキャリア信号を生成するように構成された周波数コーム(frequency comb)(櫛歯状の周波数信号を生成する手段)を含む。装置はまた、第1のキャリア信号を変調するように構成された複数の変調器を含み、各々の変調器は、行列の対応する部分からの値の時間系列に基づいて第1のキャリア信号の対応する1つを変調するように構成される。加えて、装置は、変調された第1のキャリア信号を使用して行列の部分の一次元(1D)離散的フーリエ変換を実行するように構成された光学カプラのアレイを含み、光学カプラのアレイは、行列の対応する部分からの値各々の時間系列についての1Dフーリエ係数の時間系列を出力するように構成される。
【0005】
第2の実施形態では、装置は、少なくとも1つの第1の周波数間隔を有する第1のキャリア信号を生成するように構成された周波数コームを含む。装置はまた、第1のキャリア信号の振幅の1つを変調し、変調されたキャリア信号を生成するように構成された複数の変調器を含む。装置は更に、変調されたキャリア信号を使用して、第1の方向において一次元離散的フーリエ変換を実行するように構成された光学カプラの二次元(2D)アレイを含む。装置はまた、コヒーレント検出器のアレイと、光学カプラのアレイの出力に、及びコヒーレント検出器に光学的に結合された第1のデマルチプレクサとを含む。装置は更に、少なくとも1つの第1の周波数間隔とは異なる少なくとも1つの第2の周波数間隔を有する第2のキャリア信号を生成するように構成されたローカル発振器(LO)バンクまたはアレイを含む。加えて、装置は、LOバンクまたはアレイの出力に、及びコヒーレント検出器に光学的に結合された第2のデマルチプレクサを含む。
【0006】
第3の実施形態では、方法は、入力特徴マップを取得することと、光学ネットワークを使用して、フーリエ-空間入力特徴マップを生み出すように、入力特徴マップの2D離散的フーリエ変換を生成することとを含む。方法はまた、重みマップに基づいて、フーリエ-空間重みマップを取得することと、フーリエ-空間入力特徴マップ及びフーリエ-空間重みマップのアダマール乗算を実行することとを含む。
【0007】
他の技術的特徴は、以下の図面、説明、及び特許請求の範囲から、当業者にとって容易に明らかであり得る。
【0008】
本開示のより完全な理解のために、添付図面と併用して、以下の説明への参照がここで行われる。
【図面の簡単な説明】
【0009】
【
図1】フーリエドメイン内で畳み込みを実行する実施例の処理を例示する。
【
図2】本開示に係る、ハイブリッド二次元離散的フーリエ変換を実行する実施例の処理を例示する。
【
図3A】本開示に係る、一次元離散的フーリエ変換を計算するための実施例の数学的構造を例示する。
【
図3B】本開示に係る、一次元離散的フーリエ変換を実装する実施例の光学システムを例示する。
【
図4A】本開示に係る、光学システムを使用した実施例の二次元離散的フーリエ変換計算を例示する。
【
図4B】本開示に係る、二次元離散的フーリエ変換と関連付けられた実施例の周波数スペクトルを例示する。
【
図5A】本開示に係る、光学システムを使用した別の実施例の二次元離散的フーリエ変換計算を例示する。
【
図5B】本開示に係る、二次元離散的フーリエ変換と関連付けられた実施例の周波数スペクトルを例示する。
【
図5C】本開示に係る、二次元離散的フーリエ変換と関連付けられた実施例の周波数スペクトルを例示する。
【
図5D】本開示に係る、二次元離散的フーリエ変換と関連付けられた実施例の周波数スペクトルを例示する。
【
図5E】本開示に係る、二次元離散的フーリエ変換と関連付けられた実施例の周波数スペクトルを例示する。
【
図6】本開示に係る、列離散フーリエ変換ブロックの実施例の実装態様を例示する。
【
図7】本開示に係る、重み付けを組み込んだ列離散フーリエ変換ブロックの実装態様を例示する。
【
図8】本開示に係る、光学ネットワークを使用して畳み込みを実行する実施例の方法を例示する。
【発明を実施するための形態】
【0010】
以下で説明される
図1A乃至8、及び本開示の原理を説明するために使用される様々な実施形態は、例示であるにすぎず、本開示の範囲を限定すると解釈されるべきではない。当業者は、本開示の原理がいずれかのタイプの適切に配列されたデバイスまたはシステムにおいて実装され得ることを理解するであろう。
【0011】
上記説明されたように、畳み込みニューラルネットワーク(CNN)は、様々な撮像、レコメンデーション、言語処理、及び他のシステムにおける用途を有する。多くの畳み込みニューラルネットワークは、ハードウェア設計を簡易化するために、行列形式畳み込みを採用する。それらのアプローチでは、畳み込みカーネル(重みマップ)及び入力特徴マップは、テプリッツ行列及びベクトルに変換され得、テプリッツ行列及びベクトルの乗算は、所望の畳み込み合計を得る。しかしながら、それらの行列形式畳み込み技術は全体的に、データサイズの観点で十分でない。例えば、サイズN×Nの同一の重みマップ及び入力特徴マップについて、テプリッツ行列を記憶する必要があるメモリは、2N2からN4まで拡大する場合がある。テプリッツ行列のサイズを削減することは、高リフレッシュレートにおける大規模入力データブロックの複製及び分散に起因して電力消費の増大を結果としてもたらし得る。
【0012】
本開示は、行列の畳み込みを伴う信号処理他の演算を実行する様々な方法及びシステムを提供する。以下で更に詳細に説明されるように、それらの方法及びシステムは、2つの行列の畳み込みの決定を有効にする。実施例として、本開示の実施形態は、光学ネットワークを使用して畳み込みを実行する方法及びシステムを提供する。ここで説明される方法及びシステムは、画像処理、パターン分析、シグネチャ認識、レコメンデーション、及び言語処理などにおいて有益なシステムを含む、様々な計算システムに適用される。以前のアプローチと比較して、本開示において説明される方法及びシステムを使用して、様々な利点または有利な点が達成されることができる。例えば、本開示の実施形態は、光学ドメイン内でフーリエ変換を実行するために光学システムを使用することによって、計算的負荷及びメモリ要件を著しく削減して、行列の畳み込みを計算することができる。本開示の様々な実施形態の追加の特徴、利点、及び有利な点が以下で更に詳細に説明される。
【0013】
光学システムが畳み込みニューラルネットワークに対して畳み込みを実行するために使用されることがいかの議論において想定されることが多い場合があると共に、これは例示及び説明のためのものであるにすぎないことに留意されよう。本開示において説明される方法及びシステムは、いずれかの適切な目的のために行列のいずれかの所望の畳み込みを実行するために使用され得る。結果として、本開示において説明される方法及びシステムは、畳み込みニューラルネットワークに対して行列の畳み込みを実行するために使用され得ると共に、本開示において説明される方法及びシステムは、いずれかの他の適切な用途において使用され得る。
【0014】
図1は、フーリエドメイン内で畳み込みを実行する実施例の処理100を例示する。言い換えると、
図1の処理100は、周波数ドメイン内で畳み込みを実行するために使用される。
図1に示されるように、畳み込みを実行する処理100は全体的に、入力特徴マップ105及び重みマップ110を使用して演算する。入力特徴マップ105は全体的に、1つ以上の画像、音声サンプル、または他の入力データの特徴など、処理される入力データと関連付けられた特徴の集合を表す。入力特徴マップ105は、特徴エクストラクタを使用して生成されることが多く、特徴エクストラクタは、特定のタスクに対して関連すると決定される特徴を抽出するように訓練された機械学習モデルの少なくとも一部を表し得る。重みマップ110は全体的に、入力特徴マップ105に適用されることになる重みの集合を表す。重みマップ110の重みは、重みが機械学習モデルの訓練の間に決定されるときなど、いずれかの適切な方式において決定され得る。
【0015】
図1において見られることができるように、入力特徴マップ105は、ゼロパディングされた入力特徴マップ115を形成するようにゼロパディングされ得、重みマップ110は、ゼロパディングされた重みマップ120を形成するようにゼロパディングされ得る。ゼロパディング演算は、入力特徴マップ105及び重みマップ110のエントリの周りに「ゼロ」値を包含する追加のエントリを追加することを伴うことができる。とりわけ、入力特徴マップ105及び重みマップ110が周期的であると推定されないので、ゼロパディングは、フーリエ変換処理の結果として生じるエイリアシングに対処するために使用されることができる。ゼロパディングは、元の入力特徴マップ105及び重みマップ110に対して、ゼロパディングされた入力特徴マップ115及びゼロパディングされた重みマップ120のデータサイズを増大させる場合がある。しかしながら、影響は全体的に、小さい重みマップ110に対して小さく(テプリッツ行列及び行列乗算を使用する慣習的な畳み込み方法と比較して)、境界が無視される場合に実装され得ない。
【0016】
ゼロパディングされた入力特徴マップ115及びゼロパディングされた重みマップ120は、第1の二次元(2D)離散的フーリエ変換(DFT)ユニット125及び第2の2D離散的フーリエ変換ユニット130のそれぞれにフィードされ得る。離散的フーリエ変換ユニット125及び130はそれぞれ、ゼロパディングされた入力特徴マップ115及びゼロパディングされた重みマップ120をフーリエドメイン(周波数ドメイン)に変換するように演算する。いくつかのケースでは、重みマップ110または120に対して実行される2D離散的フーリエ変換は、デジタル的に実行され得、メモリに記憶され得ることに留意されよう。これは、多くの用途のために、重み行列が異なる入力特徴マップ105に対して同一であることを理由とする。それらの実施形態では、重みマップ110または120に対して実行される2D離散的フーリエ変換の結果は、追加の入力特徴マップ105が取得及び処理されるときはいつでも、メモリから取り出され得、及び使用され得る。
【0017】
ゼロパディングされた入力特徴マップ115及びゼロパディングされた重みマップ120がフーリエドメインに変換されると、それらのマップ(ここでは周波数ドメインにある)は、アダマール(Hadamard)乗算子135にフィードされ得る。アダマール乗算子135は全体的に、2つの周波数ドメインマップの要素ごとの乗算を実行するように演算する。アダマール乗算子135によって生成される結果を空間ドメインに変換し戻すために、アダマール乗算子135の出力は、2D逆離散的フーリエ変換(IDFT)ユニット140にフィードされ得る。逆離散的フーリエ変換ユニット140は、アダマール乗算子135によって生成される結果を空間ドメインに変換する。逆離散的フーリエ変換ユニット140の出力は、入力特徴マップ105及び重みマップ110の畳み込みを表す出力行列145である。
【0018】
このようにして、
図1に示される処理100は、フーリエドメイン内での畳み込みを実装するために使用されることができる。フーリエ(周波数)ドメイン内で畳み込みを実行することは、従来の行列乗算アプローチと比較して、畳み込みの複雑度を低減させることに役立つことができる。例えば、フーリエドメイン内で畳み込みを実行することによって、畳み込みにおける循環シフト乗算加算演算は、フーリエドメイン内でのアダマール乗算(要素ごとの乗算)演算になる。しかしながら、離散的フーリエ変換ユニット125及び130を使用して2D離散的フーリエ変換を実行すると共に、逆離散的フーリエ変換ユニット140を使用して2D逆離散的フーリエ変換を実行することは、従来の技術を使用して計算的に高価である。典型的には特定用途向け集積回路(ASIC)を使用して実装され得る、グラフィックプロセシングユニット(GPU)を使用するアプローチでさえ、高い計算的負荷からの影響を受け得る。より効果的な方式においてフーリエドメイン畳み込みを実装するために、
図1に例示される処理100の要素は、1つ以上の光学システムを使用して実行されることができ、1つ以上の光学システムは、計算的支出及びメモリリソースにおける削減をもたらす。
【0019】
図2は、本開示に係る、ハイブリッド2D離散的フーリエ変換を実行する実施例の処理200を例示する。
図2に示されるように、2D離散的フーリエ変換は、2つのカスケード一次元(1D)離散的フーリエ変換を使用して実装され得る。この実施例では、入力特徴マップ205(上記説明された入力特徴マップ105またはゼロパディングされた入力特徴マップ115を表し得る)は、M×Nのサイズを有する行列であり、それは、入力特徴マップ205が行列要素のM行及びN列を有することを意味する。ここでの入力特徴マップ205は、列方向ベクトル210のセットに分解され得る。すなわち、入力特徴マップ205の各々の列は、列方向ベクトル210のセットにおいて別個のベクトル210を形成するために使用されることができる。
【0020】
1D離散的フーリエ変換(Mポイント1D離散的フーリエ変換など)は、第1の1D離散的フーリエ変換が列方向ベクトル210のセットにおける各々のベクトル210に対して実行されるときなど、入力特徴マップ205の一次元にわたって実行され得る。したがって、第1の1D離散的フーリエ変換は、
図2では「MポイントDFT
1D」として表される。ここで、所与の列の全ての行における値が離散的フーリエ変換において使用されるので、所与の列における値は、「行DFT」とも称され得る、Mポイント離散的フーリエ変換を実行するために使用される。第1の1D離散的フーリエ変換の出力は、行方向ベクトル215のセットとして配列され得る。例えば、第1の1D離散的フーリエ変換の出力として取得される列ベクトルの各々における第1の要素は、第1の行方向ベクトル215であるとグループ化され得、後続の行方向ベクトル215は、第1の1D離散的フーリエ変換の出力として取得される列ベクトルの各々におけるn番目の要素をグループ化することによって取得され得る。
【0021】
第2の1D離散的フーリエ変換(Nポイント1D離散的フーリエ変換など)は、第2の1D離散的フーリエ変換が行方向ベクトル215のセットにおける各々のベクトル215に対して実行されるときなど、行方向ベクトル215のセットの二次元にわたって実行され得る。したがって、第2の1D離散的フーリエ変換は、
図2では「NポイントDFT
1D」として表され、所与の行における値は、Nポイント離散的フーリエ変換を実行するために使用される。これは、入力特徴マップ205の2D離散的フーリエ変換の生成を完了させる。
【0022】
図2に例示される処理200に基づいて、光学ドメイン内でハイブリッド2D離散的フーリエ変換を実行することが可能である。以下でより完全に議論されるように、入力特徴マップ205のN列に対して1D離散的フーリエ変換と共に、入力特徴マップ205のM行に対して1D離散的フーリエ変換を実行するために、1つ以上の光学システムが使用されることができる。このタイプのアプローチは、処理及びメモリリソースの観点ではるかに効率的に行列畳み込みの決定を行うことに役立つことができる。
【0023】
図3A及び3Bは、本開示に係る、1D離散的フーリエ変換を計算する実施例の数学的構造300及び1D離散的フーリエ変換を実装する実施例の光学システム320を例示する。
図3Aに示されるように、数学的構造300は、入力ベクトル305を使用して実行される1D離散的フーリエ変換を表す。いくつかのケースでは、入力ベクトル305は、処理される入力特徴マップ205と関連付けられた列方向ベクトル210を表し得る。合計でM個のポイントを使用した1D離散的フーリエ変換は、サイズM×Mのユニタリ行列310(ユニタリ変換とも称され得る)として表現されることができる。したがって、ユニタリ行列310のサイズは、入力ベクトル305の要素と関連付けられた値によって定義されるのとは反対に、入力ベクトル305の長さMによって定義され得る。入力ベクトル305に適用される1D離散的フーリエ変換の出力である、出力ベクトル315を生成するために、ユニタリ行列310は、入力ベクトル305に適用され得る。いくつかのケースでは、出力ベクトル315は、行方向ベクトル215を表し得る。ここで、出力ベクトル315は、入力ベクトル305のフーリエドメイン表現である。
【0024】
図3Bに例示されるように、ユニタリ行列310は、光学システム320にマッピングされ得る。
図3Bに示されるように、光学システム320は、
図3Aに例示された1D離散的フーリエ変換を実装するように構成される。光学システム320は、パッシブ光学ネットワークであり得、パッシブ光学ネットワークは、複数の入力ポート325と、複数の入力ポート325に結合された複数の光学カプラ330と、複数の光学カプラ330に結合された複数の出力ポート335とを含む。いくつかの例では、光学システム320は、「結合ネットワーク」と称され得る。光学システム320は、複数の光学カプラ330から成る予め定められたまたは他に規定された数の光学カプラ330を含む。ここでの光学カプラ330は、光学カプラ330の2Dアレイを形成するように配列される。ユニタリ行列310のサイズは、入力ベクトル305の長さMによって定義されると共に、光学システム320における光学ネットワークのサイズは、異なる値を有する要素を有する異なる入力ベクトル305に対して同一であり得る。いくつかの実施形態では、光学システム320における光学カプラ330の数は、(M-1)/2×Mに等しい。また、いくつかの実施形態では、光学カプラ330は、エバネッセント波結合またはマルチモード干渉などを利用する50/50光学カプラである。
【0025】
本開示の実施形態は、DFT行列のサイズをダウンサイジングすることによってなど、パッシブ光学ネットワークによって利用される入力サイズを変更するためのいくつかのオプションを提供する。実施例として、
図1に例示されたようなゼロパディングは、入力行列の入力サイズを変更するために利用されることができる。別の実施例として、複数の光学カプラ330における光学カプラ330の間の結合比率は、より小さいサイズの入力行列をもたらすように再構成されることができる。いくつかのケースでは、再構成は、結合比率をゼロまで低減させることを含むことができる。当業者は、多くの変形例、修正例、及び代替例を認識するであろう。
【0026】
光学システム320は、光源340から光学信号を受信し得、光源340は、対応する導波管を使用して複数の入力ポート325に光学的に結合される。いくつかの実施形態では、光源340は、少なくとも1つのレーザ、発光ダイオード(LED)、またはパルス化光源などを表す。複数の入力ポート325において入力ベクトル305の要素の値をロードするために、入力ベクトル305の要素の値(x[0,0]、x[1,0]、x[2,0]、…、x[M-1,0])は、対応する変調器345を制御するために使用される。対応する要素値(x[0,0]、x[1,0]、x[2,0]、…、x[M-1,0])によって制御される各々の変調器345は、対応する導波管から複数の光学カプラ330を通る光学強度(キャリア信号を表す)を変調する。例えば、各々の変調器345は、変調器345に提供される光学強度(キャリア信号)の振幅及び位相を変調するために使用され得る。よって、入力ベクトル305に対応する電気信号は、光源340によって提供される光学信号を変調するために使用されることができる。いくつかの実施形態では、入力ベクトル305に対応する電気信号は、サンプル間干渉を防止するためにパルス化され得、電気信号のパルス持続時間は、電気信号のサンプル期間よりも短い。また、いくつかの実施形態では、光源340は、サンプル間干渉を防止するためにパルス化され得、光学強度のパルス幅は、電気信号のサンプル期間よりも短い。以下でより完全に説明されるように、複数の光学カプラ330の各々の出力は、デマルチプレクサに提供される光学信号である。いくつかの実施形態では、電気出力は、コヒーレント受信機のアレイによって提供され、電気入力及び電気出力を有するシステムを結果としてもたらす。
【0027】
いくつかのケースでは、入力ポート325は、光源340から固定され及び等しい光学強度を受信することができる。特定の実施例として、複数の入力ポート325の各々に1ミリワットを提供するために、光源340として使用され得る105ミリワットレーザまたはLEDが使用される。この特定の実施例では、各々の変調器345に入射する光学強度の変調は、その特定の変調器345と関連付けられた入力ベクトル305の要素の値に応じて、0ミリワットから1ミリワットまで変動する各々の変調器345からの出力を結果としてもたらし得る。変調器345の各々を出射する光学強度は、その特定の変調器345と関連付けられた入力ベクトル305の要素の値に対応する。したがって、入力ベクトル305の要素の値は、1D離散的フーリエ変換を実行する、光学システム320の光学ネットワークにロードされる。
【0028】
複数の光学カプラ330を出射する光学信号は、出力値X0[0]、X1[0]、X2[0]、…、XM-1[0]によって表される。それらの値は、フーリエドメインへの変換の後の入力ベクトル305の値を表す。結果として、複数の出力ポート335に存在する光学信号は、出力ベクトル315を取り出すようにアクセスされ得、出力ベクトル315は、入力ベクトル305のフーリエ変換である。
【0029】
図2に示される第1の1D離散的フーリエ変換は、
図2に例示される第1の列方向ベクトル210の要素の値を、列方向ベクトル210の対応する要素と関連付けられた変調器345にロードすることによって、光学システム320を使用して計算されることができる。残りの列方向ベクトル210の1D離散的フーリエ変換を計算するために、各々の残りの列方向ベクトル210の要素の値は、各々の残りの列方向ベクトル210の対応する要素と関連付けられた変調器345にロードされる。よって、
図2に示されたM×Nの入力特徴マップ205についてのNサイクルの後、
図2におけるMポイントDFT
1Dによって表される1D離散的フーリエ変換が実行される。同様に、
図2に示された第2の1D離散的フーリエ変換は、
図2に例示された第1の行方向ベクトル215の要素の値を、行方向ベクトル215の対応する要素と関連付けられた変調器345にロードすることによって、光学システム320を使用して計算されることができる。残りの行方向ベクトル215の1D離散的フーリエ変換を計算するために、各々の残りの行方向ベクトル215の要素の値は、各々の残りの行方向ベクトル215の対応する要素と関連付けられた変調器345にロードされる。
【0030】
このようにして、光学システム320を使用して、複数の光学カプラ330に結合された変調器345を使用して同期してロードされる値離散的フーリエ変換を光学システム320が計算する1D離散的フーリエ変換の物理的実装態様が提供される。光が複数の光学カプラ330を通じて伝播するにつれて、複素(実部及び虚部)離散的フーリエ変換係数(X0[0]、X1[0]、X2[0]など)のアレイは、複数の出力ポート335に存在する光学信号の形式において計算される。上述したように、本開示の実施形態は、入力ベクトル305の要素の値とは独立して静的のままである物理ネットワーク(複数の光学カプラ330など)を利用する。よって、重みが変化するにつれて、変調器345の光学信号出力の強度が変化するが、複数の光学カプラ330のサイズ及びレイアウトが変化しないままである。入力特徴マップの列または行を光学システム320にロードすることによって、入力特徴マップに対して1D離散的フーリエ変換が計算される。
【0031】
図4A及び4Bは、本開示に係る、光学システム400を使用した実施例の2D離散的フーリエ変換計算及び2D離散的フーリエ変換と関連付けられた実施例の周波数スペクトル420を例示する。
図4Aに示されるように、入力特徴マップ(入力特徴マップ205など)の列内の要素の値(列方向ベクトル210など)は、
図3Bを参照して上記議論されたような同一または類似の方式において生じ得る、変調器345を使用して直列にロードされることができる。結果として、時間系列セット405内の要素値の時間系列が各々の変調器345に提供されることができる。入力特徴マップの列内の要素の値は、時間T
0における時間系列セット405の第1の列内のM値、時間T
1における時間系列セット405の第2の列内のM値、よって、最大で時間T
N-1における時間系列セット405のN番目の列内のM値によって例示される。
【0032】
図4Aにおいて見られることができるように、2D入力特徴マップ(
図1の入力特徴マップ105またはゼロパディングされた入力特徴マップ115など)の行にわたって離散的フーリエ変換を計算するために、入力特徴マップの各々の列内の行についてのサンプルは、時間系列セット405を生み出すように、サンプリング期間T
Sなどにより、時間的に直列化される。時間系列セット405における値は、行DFTブロック410の複数の入力ポートにフィードされる。ここでの行DFTブロック410は、
図3Bに示され及び上記説明された様々な光学カプラ330によって形成される光学ネットワークを表す。各々の期間T
Sの後、入力特徴マップの各々の列に沿った1D離散的フーリエ変換係数が生成される。これは、時間系列セット415における列ごとの1Dフーリエ係数の時間系列を生み出す。時間系列セット405内の1Dフーリエ係数の時間系列は、時間T
0、T
1、T
2、…、T
N-1と関連付けられるとして例示される。
【0033】
1Dフーリエ係数の時間系列セット415における1Dフーリエ係数の各々の時間系列が関数y
0(t)として考えられる場合、時間系列のフーリエ変換は、周波数スペクトルY
0(ω)420を有する。周波数スペクトル420は、
図4Bに例示される。よって、時間系列セット415における各々の時間系列周波数スペクトル420は、二次元に沿ったフーリエ変換(入力特徴マップの行など)を表す。したがって、時間系列の短時間フーリエ変換を計算することによって、入力特徴マップの2D離散的フーリエ変換が計算される。
【0034】
図3B及び4Aでは、単一の光源340が例示され、単一の光源340は、いくつかのケースでは、単一の波長にある入力光または単一の狭波長範囲内の入力光を提供し得ることに留意されよう。しかしながら、以下で説明されるように、時間系列の短時間フーリエ変換を実行するために、多波長源も利用されることができる。
【0035】
図5A乃至5Eは、本開示に係る、光学システム500を使用した別の実施例の2D離散的フーリエ変換計算及び2D離散的フーリエ変換と関連付けられた周波数スペクトル520a~520mを例示する。
図5Aに示されるように、短時間フーリエ変換をデジタル的に計算する(電力消費を増大させ得る)のではなく、周波数スペクトルY
0(ω)への関数y
0(t)によって表される1Dフーリエ係数の第2の1D離散的フーリエ変換は、位相コヒーレントキャリアアレイを使用して、コヒーレント検出を介して物理フーリエ分解によって実行されることができる。この実施例では、M×Nの入力特徴マップ(入力特徴マップ105またはゼロパディングされた入力特徴マップ115など)について、Nトーンキャリアアレイ505が使用され、Nトーンキャリアアレイ505は、いくつかのケースでは、Δに等しいキャリア周波数間隔により周波数コーム505aによってもたらされ得る。すなわち、周波数コーム505aは、Δによって等しく間隔を空けられる周波数を有するNの光学信号を生成し得る(コームが異なる周波数間隔を有することが可能である)。ここでのキャリアアレイ505/周波数コーム505aは、上記議論された光源340の代わりに入力光源として使用され得る。Nトーンキャリアアレイ505における各々のキャリア信号は、同一の入力値(入力特徴マップの列方向ベクトル210の同一の要素など)を変調するために使用され得、それによって、行DFTブロック410において計算される離散的フーリエ変換係数を、Nのスペクトル的に区別できるコピーに複製する。
図5Bに示されるように、例えば、周波数スペクトル420の6個のコピー(N個のコピーの)は、周波数ドメインシグネチャ(周波数スペクトル520a)として例示される。この実施例では、6個のコピーの各々の隣接するペアの間の間隔は、キャリア周波数間隔Δに等しい。
【0036】
入力ベクトルについてのM値が同期して入力されることを理由に、時間系列セット415における各々の時間系列をもたらすように計算される離散的フーリエ変換係数が同期して生み出される。よって、
図5C乃至5Eに示されるようにX
1(nT
s)に対応する周波数スペクトルの6個のコピーは、周波数ドメインシグネチャ(周波数スペクトル520b)に包含され、X
2(nT
s)に対応する周波数スペクトルの6個のコピーは、周波数ドメインシグネチャ(周波数スペクトル520c)に包含され、X
M-1(nT
s)に対応する周波数スペクトルの6個のコピーは、周波数ドメインシグネチャ(周波数スペクトル520m)に包含される。ここで、離散的フーリエ変換係数の各々の時間系列についての周波数スペクトルのNのスペクトル的に区別できるコピーは、Mの周波数ドメインシグネチャ520a~520mのセットにおいて提供される。
【0037】
再度
図5Aを参照して、列DFTブロック510は、N/T
Sの帯域幅を有するコヒーレント検出器アレイ(低速コヒーレント検出器アレイなど)を実装するために使用されることができる。ローカル発振器(LO)アレイまたはバンク515aからのδ=N/T
Sのオフセット周波数間隔を有する位相コヒーレントキャリアアレイ515と共に列DFTブロック510が使用される。よって、位相コヒーレントキャリアアレイ515における光学信号は、Δ+δによって等しく間隔を空けられる周波数を有する(それらの光学信号が異なる周波数間隔を有することが可能であるが)。この配列では、各々のコヒーレント検出器セットの出力は、離散的フーリエ変換時間系列の短時間フーリエ変換係数を表し、それによって、第2の1D離散的フーリエ変換の計算を結果としてもたらし、入力特徴マップの2D離散的フーリエ変換を出力としてもたらす。
【0038】
この実施例として、
図5Bに示されるように、LOアレイまたはバンク515aから位相コヒーレントキャリアアレイ515において提供される第1の周波数525は、第1の周波数ドメインシグネチャに存在する周波数スペクトル(スペクトル520a)のNのスペクトル的に区別できるコピーの第1の周波数スペクトル530をサンプリングするために使用されることができ、第2の周波数535は、第1の周波数ドメインシグネチャに存在する周波数スペクトル(スペクトル520a)のNのスペクトル的に区別できるコピーの第2の周波数スペクトル540をサンプリングするために使用されることができる、などである。したがって、LOアレイまたはバンク515aによって提供されるキャリアの間のキャリア周波数間隔がΔ+δに等しいので、LOアレイまたはバンク515aによって提供される周波数は、周波数スペクトルの幅にわたって周波数スペクトルをサンプリングするために使用されることができる。よって、列離散フーリエ変換ブロック510の出力は、フーリエ係数のサンプリングされたセットである。したがって、LOアレイまたはバンク515aを使用してサンプリングされたフーリエ係数は、所望の短時間フーリエ変換係数である。
【0039】
図4A及び4Bに示される実施例では、第1の周波数ドメインシグネチャのサンプリングされた出力は、周波数スペクトルY
0(ω)に対応する。全てのM列が同期してロードされることを理由に、M列の各々と関連付けられた周波数スペクトルは、
図5Aにおいて同期して生成され、出力として入力特徴マップの2D離散的フーリエ変換を結果としてもたらす。列DFTブロック510がここでの行DFTブロック410に続くと共に、DFTブロック410及び510の位置が逆にされ、行DFT及び列DFTのオーダを有効に交換することに留意されよう。結果として、演算のオーダが修正されることができ、
図5Aに例示される特定の実装態様は、1つの可能な実施例の実装態様にすぎない。
【0040】
図6は、本開示に係る、列DFTブロック510の実施例の実装態様を例示する。
図5Aに関連して上記議論されたように、第2の1D離散的フーリエ変換を実行するために(または、DFTブロック410及び510が逆にされる場合は第1の1D離散的フーリエ変換)、列DFTブロック510が使用される。
図6に示されるように、時間系列600(時間系列セット415における時間系列の1つを表し得る)は、Nのスペクトル的に区別できるコピー(
図5Bに示された周波数スペクトル520aに含まれるNのスペクトル的に区別できるコピーなど)に分割されるために、デマルチプレクサ(DMUX)605にフィードされ得る。よって、
図5Bにおいて第1の周波数スペクトル530及び第2の周波数スペクトル540によって例示されたスペクトル的に区別できるコピーの各々は、周波数スペクトルの別個のコピーを提供するように逆多重化される。
【0041】
デマルチプレクサ605の出力(周波数スペクトル420のスペクトル的に区別できるコピー)は、コヒーレント検出器アレイ620に入力として提供される。
図6に例示されるように、コヒーレント検出器アレイ620は、コヒーレント受信機とも称され得る、複数のコヒーレント検出器625a~625nを含む。LOアレイまたはバンク515aからの信号610(位相コヒーレントキャリアアレイ515など)は、デマルチプレクサ615にフィードされ得、デマルチプレクサ615は、LOアレイまたはバンク515aによって提供される第1の周波数を第1のコヒーレント検出器625aに、LOアレイまたはバンク515aによって提供される第2の周波数を第2のコヒーレント検出器625bに、LOアレイまたはバンク515aによって提供されるN番目の周波数をN番目のコヒーレント検出器625nなどにフィードし得る。よって、
図5Bにおいて第1の周波数525及び第2の周波数535によって例示される周波数の各々は、位相コヒーレントキャリアアレイ515に存在する周波数を提供するように逆多重化されることができる。いくつかのケースでは、Nトーンキャリアアレイ505におけるキャリア信号の数、位相コヒーレントキャリアアレイ515におけるキャリア信号の数、及びコヒーレント検出器アレイ620におけるコヒーレント検出器625a~625nの数は等しい。
【0042】
コヒーレント検出器アレイ620におけるコヒーレント検出器625a~625nの各々は、デマルチプレクサ605によって出力される周波数スペクトルをデマルチプレクサ615によって出力される周波数と乗算することができる。コヒーレント検出器625a~625nが帯域制限された受信機であるので、この乗算は、デマルチプレクサ615によって出力される特定の周波数と関連付けられた狭周波数範囲にわたる周波数スペクトルの効果的な積分である。したがって、周波数スペクトル630a及び周波数635a、周波数スペクトル630b及び周波数635b、並びに周波数スペクトル630n及び周波数635nによって例示されるように、LOアレイまたはバンク515aによって提供される周波数は、周波数スペクトル420の幅にわたって周波数スペクトル420をサンプリングし、短時間フーリエ変換係数を生成するために使用されることができる。
図5Aに示されるように、行DFTブロック410から列DFTブロック510へとある合計でMの時間系列が存在するように、
図6における処理は、M×Nの入力特徴マップの2D離散的フーリエ変換を完了させるようにM回繰り返されることができる。いくつかの実施形態では、
図6における構造は、M回複製されることができ、その結果、時間系列セット415におけるMの時間系列が同期して処理されることができる。それらの実施形態では、デマルチプレクサ605のアレイ、デマルチプレクサ615のアレイ、及び複数のコヒーレント検出器アレイ620が存在することができる。
【0043】
図7は、本開示に係る、重み付けを組み込んだ列DFTブロック510の実施例の実装態様を例示する。
図6に関連して議論される列DFTブロック510の拡張として、重み行列(
図1に例示される重みマップ110またはゼロパディングされた重みマップ120など)の事前に計算されまたはそうでなければ規定されたフーリエ等価性により、LOアレイまたはバンク515aによって提供される各々の周波数を変調することによって、列DFTブロック510のコヒーレント検出器アレイ620内で2D畳み込みが更に計算されることができる。
【0044】
図7に示されるように、デマルチプレクサ615によって出力される周波数は、対応する重み係数と乗算され、それによって、各々の2D離散的フーリエ変換係数を対応する重み係数と乗算する。いくつかの実施形態では、重み係数は、フーリエ空間重みである。
図7に示される実施例では、LOアレイまたはバンク515aによって提供される第1の周波数は、第1のコヒーレント検出器625aへの配送の前に第1の重み付け要素710aを使用して第1の重みW
0,0によって重み付けられ、LOアレイまたはバンク515aによって提供される第2の周波数は、第2のコヒーレント検出器625bへの配送の前に第2の重み付け要素710bを使用して第2の重みW
0,1によって重み付けられ、LOアレイまたはバンク515aによって提供されるN番目の周波数は、N番目のコヒーレント検出器625nへの配送の前にN番目の重み付け要素710nを使用してN番目の重みW
0,N-1によって重み付けられる。いくつかの実施形態では、重み付け要素710a~710nは、同調可能光学減衰機もしくは位相シフタなどを使用して、またはデマルチプレクサ615によって出力される周波数の位相及び/または振幅を修正する要素として実装されることができる。このようにして、LOアレイまたはバンク515aによって提供される周波数は、周波数スペクトル420の幅にわたって周波数スペクトル420をサンプリングすると共に、対応する重みを使用してサンプリングを重み付けるために使用されることができ、それによって、W
0,0×X
0,0、W
0,1×X
0,1、...、W
0,N-1×X
0,N-1に等しいNの出力を結果としてもたらす。再度、いくつかの実施形態では、
図7に示される構造は、M回複製されることができ、その結果、時間系列セット415におけるMの時間系列は、同期して処理されることができる。それらの実施形態では、デマルチプレクサ605のアレイ、デマルチプレクサ615のアレイ、複数のコヒーレント検出器アレイ620、及び重み付け要素710a~710nの複数の集合が存在することができる。よって、例えば、重みW
1,0-W
1,N-1は、時間系列X
1,0-X
1,N-1により使用され、重みW
N-1,0-W
N-1,N-1は、時間系列X
N-1,0-X
N-1,N-1により使用される。
【0045】
重みが相対的に不変であり得るので、いくつかの実施形態では、重みの2D離散的フーリエ変換が1回実行され得、結果は、ここで説明されるシステムの様々な実施形態における後の使用のために記憶されることができる。したがって、行DFTブロック410及び列DFTブロック510がフーリエ空間重みマップを生成するために利用されることができ、フーリエ空間重みマップの係数が後の使用のために記憶されることができる。代わりに、重みが相対的に不変であるので、従来のシステムがフーリエ空間重みマップを計算するために利用され、フーリエ空間重みマップは、メモリに記憶されることができる。
図7では、例示される重みW
0,0、W
0,1、...、W
0,N-1は、
図1に例示された第2の2D離散的フーリエ変換ユニット130の出力に存在するフーリエ空間重みマップに対応する。よって、コヒーレント検出器アレイ620によって提供される出力は、
図1に例示されたアダマール乗算子135の出力に対応する。
【0046】
コヒーレント検出器アレイ620によって提供される結果として生じる畳み込み積は、コヒーレント検出器アレイ620の出力を第2の光学システム640に通すことによってなど、フーリエ空間から実空間に変換され得る。第2の光学システム640は、重み付け行列を有さない
図5Aの複合光学システム等、
図5A及び6において説明される1つと同様であることができる。第2の光学システム640は、それに従ってその入力を回転させることによってなど、逆二次元離散的フーリエ変換を実行することができる。当業者は、多くの変形例、修正例、及び代替例を認識するであろう。
【0047】
説明されるアプローチの1つの特定の実施例の使用ケースとして、本開示の実施形態を使用して、ビデオストリームが受信及び処理されることができる。急速に変化しているデータを含むビデオストリームは、1つ以上の入力特徴マップ105として受信されることができる。急速に変化していないデータを含み得る、画像処理のために適切な重みマップは、重みマップ110として受信されることができる。本開示の実施形態を使用して、上記説明された光学システムを使用して、高速に且つ低い計算複雑度でビデオストリームが処理されることができる。画像処理用途に加えて、ニューラルネットワーク、畳み込みネットワーク、または他の畳み込み(ボイス分析及びシグネチャ分析などをサポートするシステム等)を利用する他の用途は、上記説明された実施形態の様々な実装態様を使用し得ることに留意されよう。
【0048】
本開示の実施形態は、従来の光学行列乗算子と比較して、システムサイズ及び複雑度などに関連して、著しい利点及び有利な点をもたらすことができる。例えば、64×64の入力特徴マップ及び3×3の重みマップについて、光学行列乗算子は、4,356×4,356のU行列(9,485,190の同調可能光学カプラに対応する)、4,096×4,096のV行列(8,386,560の同調可能光学カプラに対応する)、及び64×64のD行列(64の可変光学減衰機に対応する)を利用し得る。バンプピッチによって制限される15μm×15μmの光学カプラサイズ及び50μm×105μmの検出器サイズを想定して、光学行列乗算子の合計サイズは、約4,122mm2のオーダであり得る。
【0049】
いくつかの実装態様では、同一の機能性を提供する本開示の実施形態は、離散的フーリエ変換及び逆離散的フーリエ変換のそれぞれを実行するように、2つの66×66の離散的フーリエ変換行列を実装し得る。これは、4,290の固定された光学カプラ、17,424のリングフィルタに対応する4つの66×66のチャネル波長分割多重(WDM)アレイ(離散的フーリエ変換ごとに2つ及び逆離散的フーリエ変換ごとに2つ)、並びに4,356の複合(I/Qなど)変調器に対応する66×66の重み行列に対応する。バンプピッチによって制限される15μm×15μmの光学カプラサイズ、30μm×10μmのリングフィルタサイズ、及び105μm×105μmのコヒーレント検出器サイズを想定して、この実装態様の合計サイズは、約93.3mm2のオーダである。著しいサイズ節約に加えて、本開示の実施形態における構成要素の多くがパッシブであるので、本開示の実施形態の電力消費は、光学行列乗算子と関連付けられた電力消費よりもはるかに低い。
【0050】
図1乃至7は、離散的フーリエ変換、離散的フーリエ変換を実装する光学システム、信号スペクトル、及び関係した詳細の実施例を例示するが、様々な変更が
図1A乃至7に行われ得る。例えば、入力特徴マップ105、115、205及び重みマップ110、120の各々は、いずれかの適切な次元を有し得る。また、光学システムは、図に示されるいずれかの適切な数の各々の構成要素を含み得る。加えて、例示される各々の光学システムでは、特定の必要性によって、様々な構成要素が組み合わされ得、更に細分化され得、複製され得、省略され得、または再配列され得、追加の構成要素が追加され得る。
【0051】
図8は、本開示に係る、光学ネットワークを使用して畳み込みを実行する実施例の方法800を例示する。説明を容易にするために、方法800は、上記説明された光学システムのいずれかを使用して実行され得る。しかしながら、方法800は、本開示によって設計されるいずれかの他の適切な光学システムを使用して実行され得る。
【0052】
図8に示されるように、ステップ810において、入力特徴マップが取得され、ステップ815において、重みマップが取得される。これは、例えば、処理される入力データと関連付けられた入力特徴マップ105を受信、生成、または取得することと、処理される入力データに適用されることになる重みマップ110を受信、生成、または取得することとを含み得る。ステップ820において、フーリエ-空間入力特徴マップを生み出すように、入力特徴マップの二次元離散的フーリエ変換が生成される。これは、例えば、入力特徴マップ105、205(または、ゼロパディングされた入力特徴マップ115)をフーリエ-空間入力特徴マップに変換するために、上記説明された光学ネットワークのいずれかを使用することを含み得る。ステップ825において、フーリエ-空間重みマップを生み出すように、重みマップの二次元フーリエ変換が生成される。これは、例えば、重みマップ110(または、ゼロパディングされた重みマップ120)をフーリエ-空間重みマップに変換するために、上記説明された光学ネットワークのいずれかを使用することを含み得る。ステップ830において、フーリエ-空間入力特徴マップ及びフーリエ-空間重みマップのアダマール乗算が実行される。これは、例えば、光学ネットワークが、入力特徴マップの2D離散的フーリエ変換を表す光学信号を出力することを含み得る。
【0053】
いくつかの実施形態では、ステップ835において、アダマール乗算によって生み出される出力の二次元逆離散的フーリエ変換を実行するために、第2の光学ネットワークが使用され得る。例えば、2D IDFT処理を実行するために、光学システム640が使用され得る。2D逆離散的フーリエ変換の出力は、入力特徴マップ105及び重みマップ110の畳み込みをもたらすことができる。また、いくつかの実施形態では、入力特徴マップを生成するために、入力マップをゼロパディングすることが行われ得、重みマップを生成するために、重み付けマップをゼロパディングすることが行われ得る(ステップ810及び815の前または間に行われることができる)。加えて、いくつかの実施形態では、ステップ825において、フーリエ-空間重みマップが生成され得、及びメモリに記憶され得、フーリエ-空間重みマップがメモリから取り出され得、ローカル発振器キャリアを重み付けるために利用され得る。
【0054】
図8は、光学ネットワークを使用して畳み込みを実行する方法800の1つの実施例を例示するが、様々な変更が
図8に行われ得る。例えば、一連のステップとして示されると共に、
図8における様々なステップは、重複し得、並列して行われ得、異なる順序において行われ得、またはいずれかの回数で行われ得る。その上、
図8における個々のステップは、個々のステップに適切であるとして、様々なシーケンスにおいて実行され得る複数のサブステップを含み得る。加えて、特定の用途に応じて、様々なステップが方法800に追加され得、または方法800から取り除かれ得る。当業者は、多くの変形例、修正例、及び代替例を認識するであろう。
【0055】
以下は、光学ネットワークを使用して畳み込みを実行する方法及びシステムを実装しまたはそれに関連する本開示の実施例の実施形態を説明する。しかしながら、本開示の教示に従って他の実施形態が使用され得る。
【0056】
第1の実施形態では、装置は、少なくとも1つの第1の周波数間隔を有する複数の第1のキャリア信号を生成するように構成された周波数コームを含む。装置はまた、第1のキャリア信号を変調するように構成された複数の変調器を含み、各々の変調器は、行列の対応する部分からの値の時間系列に基づいて第1のキャリア信号の対応する1つを変調するように構成される。加えて、装置は、変調された第1のキャリア信号を使用して行列の部分の一次元(1D)離散的フーリエ変換を実行するように構成された光学カプラのアレイを含み、光学カプラのアレイは、行列の対応する部分からの値各々の時間系列についての1Dフーリエ係数の時間系列を出力するように構成される。
【0057】
以下の特徴のいずれかの単一の1つまたはいずれかの適切な組み合わせは、第1の実施形態と共に使用され得る。光学カプラのアレイは、第1のキャリア信号の異なる周波数に基づいて、1Dフーリエ係数の各々の時間系列を複数のスペクトル的に区別できるコピーに複製するように構成され得る。装置はまた、第2のキャリア信号に基づいて、1Dフーリエ係数の時間系列をサンプリングするように構成されたコヒーレント検出器を含み得、第2のキャリア信号は、少なくとも1つの第1の周波数間隔よりも大きい少なくとも1つの第2の周波数間隔を有し得る。コヒーレント検出器は、1Dフーリエ係数の時間系列の短時間フーリエ変換係数を出力するように構成され得、短時間フーリエ変換係数は、行列の2D離散的フーリエ変換を表し得る。装置はまた、光学カプラのアレイから1Dフーリエ係数の各々の時間系列に対し、1Dフーリエ係数の時間系列の複数のスペクトル的に区別できるコピーを分離し、コヒーレント検出器の異なる1つに、スペクトル的に区別できるコピーの異なる1つを提供するように構成された第1のデマルチプレクサを含み得る。装置はまた、第2のキャリア信号を生成するように構成されたローカル発振器(LO)バンクまたはアレイと、光学カプラのアレイからの1Dフーリエ係数の各々の時間系列に対し、第2のキャリア信号を分離し、コヒーレント検出器の異なる1つに、第2のキャリア信号の異なる1つを提供するように構成された第2のデマルチプレクサと、を含み得る。装置はまた、異なる重みに基づいて第2のキャリア信号を調節し、コヒーレント検出器に、調節された第2のキャリア信号を提供するように構成された重み付け要素を含み得る。行列は、入力特徴マップを含み得、重みは、重みマップからであり得る。行列の対応する部分からの値の時間系列は、行列からの列方向ベクトルに対応し得、コヒーレント検出器によってサンプリングされる光学カプラのアレイからの1Dフーリエ係数の時間系列は、行方向ベクトルを含み得る。
【0058】
第2の実施形態では、装置は、少なくとも1つの第1の周波数間隔を有する第1のキャリア信号を生成するように構成された周波数コームを含む。装置はまた、第1のキャリア信号の振幅の1つを変調し、変調されたキャリア信号を生成するように構成された複数の変調器を含む。装置は更に、変調されたキャリア信号を使用して、第1の方向において一次元離散的フーリエ変換を実行するように構成された光学カプラの二次元(2D)アレイを含む。装置はまた、コヒーレント検出器のアレイと、光学カプラのアレイの出力に、及びコヒーレント検出器に光学的に結合された第1のデマルチプレクサとを含む。装置は更に、少なくとも1つの第1の周波数間隔とは異なる少なくとも1つの第2の周波数間隔を有する第2のキャリア信号を生成するように構成されたローカル発振器(LO)バンクまたはアレイを含む。加えて、装置は、LOバンクまたはアレイの出力に、及びコヒーレント検出器に光学的に結合された第2のデマルチプレクサを含む。
【0059】
以下の特徴のいずれかの単一の1つまたはいずれかの適切な組み合わせは、第2の実施形態と共に使用され得る。各々のコヒーレント検出器は、第1のデマルチプレクサの出力及び第2のデマルチプレクサの1つの出力を受信し、フーリエ係数を生成するように構成され得る。コヒーレント検出器のアレイは、装置の入力に対して2D離散的フーリエ変換を完了させるように、第2の方向において第2の1D離散的フーリエ変換を出力するように構成され得る。光学カプラは、50/50光学カプラを含み得る。第1のキャリア信号の数、第2のキャリア信号の数、及びコヒーレント検出器のアレイにおけるコヒーレント検出器の数は等しくなり得る。装置はまた、重み行列に従って第2のキャリア信号を変調するように構成された重み付け要素を含み得る。重み行列のフーリエ等価重み行列は、事前に計算され得、及び装置に記憶され得る。
【0060】
第3の実施形態では、方法は、入力特徴マップを取得することと、光学ネットワークを使用して、フーリエ-空間入力特徴マップを生み出すように、入力特徴マップの2D離散的フーリエ変換を生成することとを含む。方法はまた、重みマップに基づいて、フーリエ-空間重みマップを取得することと、フーリエ-空間入力特徴マップ及びフーリエ-空間重みマップのアダマール乗算を実行することとを含む。
【0061】
以下の特徴のいずれかの単一の1つまたはいずれかの適切な組み合わせは、第3の実施形態と共に使用され得る。方法はまた、第2の光学ネットワークを使用して、アダマール乗算の出力の2D逆離散的フーリエ変換を生成することを含み得る。2D逆離散的フーリエ変換の出力は、入力特徴マップ及び重みマップの畳み込みを含み得る。方法はまた、光学ネットワークを使用して、フーリエ-空間重みマップを生み出すように、重みマップの2D離散的フーリエ変換を生成することと、フーリエ-空間重みマップの係数を記憶することとを含み得る。方法はまた、入力特徴マップ及び重み付けマップを生み出して、重みマップを提供するように、入力マップをゼロパディングすることを含み得る。方法はまた、フーリエ-空間重みマップを受信することと、フーリエ-空間重みマップを記憶することと、記憶装置からフーリエ-空間重みマップを取り出すことと、LOキャリア信号を重み付けるために、フーリエ-空間重みマップを利用することとを含み得る。
【0062】
いくつかの実施形態では、本特許文書に記載されている種々の機能は、コンピュータ可読プログラムコードから形成されており、コンピュータ可読媒体に具現化されているコンピュータプログラムによって実装される、またはサポートされる。フレーズ「コンピュータ可読プログラムコード」は、ソースコード、オブジェクトコード、及び実行可能なコードを含む、いずれかのタイプのコンピュータコードを含む。フレーズ「コンピュータ可読媒体」は、コンピュータがアクセスすることができるいずれかのタイプの媒体、例えば、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、ハードディスクドライブ(HDD)、コンパクトディスク(CD)、デジタルビデオディスク(DVD)、または任意の他のタイプのメモリを含む。「非一時的」なコンピュータ可読媒体は、一時的な電気または他の信号を伝送する有線、無線、光、または他の通信リンクを除外する。非一時的なコンピュータ可読媒体は、データが永続的に格納されることができる媒体、及びデータが格納され、後で上書きされることができる媒体、例えば、再書き込み可能な光ディスク、または消去可能なストレージデバイスを含む。
【0063】
本特許文書全体を通して使用される特定の単語及び語句の定義を記載しておくと有利な場合がある。用語「アプリケーション」及び「プログラム」は、適切なコンピュータコード(ソースコード、オブジェクトコード、または実行可能なコードを含む)での実装に適合された、1つ以上のコンピュータプログラム、ソフトウェアコンポーネント、命令セット、プロシージャ、機能、オブジェクト、クラス、インスタンス、関連データ、またはそれらの一部を指す。「通信する」という用語及びその派生語は、直接的な通信も間接的な通信も包含する。「を含む」及び「を備える」という用語、ならびにそれらの派生語は、制限なく含むことを意味する。「または」という用語は、包括的であり、及び/またはを意味する。「に関連する(associated with)」という語句、及びその派生語は、含む、その内に含まれる、それと相互接続する、収容する、その内に収容される、それにまたはそれと接続する、それにまたはそれと結合する、それと通信可能である、それと連携する、インターリーブする、並列する、それに最も近い、それにまたはそれとバインドされる、有する、そのプロパティを有する、それにまたはそれと関係するなどを意味することがある。「のうちの少なくとも1つ」という語句は、項目のリストと共に使用される場合、リストに挙げられた項目のうちの1つまたは複数の異なる組み合わせを使用してもよく、リスト内の1つの項目のみを必要とする場合があることを意味する。例えば、「A、B、及びCのうちの少なくとも1つ」は、次の組み合わせ、A、B、C、A及びB、A及びC、B及びC、ならびにA及びB及びCのいずれかを含む。本開示における説明は、いずれかの特定の要素、ステップ、または機能が特許請求の範囲内に含まれなければならない必須のまたは重要な要素であることを黙示するものとして読まれるべきではない。特許主題の範囲は、許可された特許請求の範囲によってのみ定義される。更に、「のための手段(means for)」または「のためのステップ(step for)」という正確な語句が特定の請求項において明示的に使用され、その後に機能を特定する分詞句が続かない限り、いずれの請求項も、添付の特許請求の範囲または請求項の要素のいずれに関しても、米国特許法第112条(f)を行使しない。請求項内の「メカニズム」、「モジュール」、「デバイス」、「ユニット」、「コンポーネント」、「要素」、「部材」、「装置」、「マシン」、「システム」、「プロセッサ」、または「コントローラ」のような用語の使用は(限定ではないが)、請求項自体の特徴によって更に修正されるまたは強化される、当業者に知られている構造体を指すことが理解され、それを指すことを意図したものであり、米国特許法第112条(f)を行使することを意図したものではない。
【0064】
本開示が特定の実施形態及び一般的に関連する方法を説明してきたが、これらの実施形態及び方法の代替形態及び置換形態は、当業者には明らかであろう。したがって、例示的な実施形態の上記の説明は、本開示を定義または制約するものではない。以下の特許請求の範囲によって定義されるような、本開示の趣旨及び範囲から逸脱することなく、他の変更、置換、及び代替も可能である。
【国際調査報告】