IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌイーシー ラボラトリーズ アメリカ インクの特許一覧

特許7181303ニューラルネットワークを用いた光ファイバ非線形性補償
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-21
(45)【発行日】2022-11-30
(54)【発明の名称】ニューラルネットワークを用いた光ファイバ非線形性補償
(51)【国際特許分類】
   H04B 10/2543 20130101AFI20221122BHJP
   G06N 3/08 20060101ALI20221122BHJP
【FI】
H04B10/2543
G06N3/08
【請求項の数】 10
(21)【出願番号】P 2020541984
(86)(22)【出願日】2019-06-24
(65)【公表番号】
(43)【公表日】2021-05-20
(86)【国際出願番号】 US2019038638
(87)【国際公開番号】W WO2019246605
(87)【国際公開日】2019-12-26
【審査請求日】2020-07-31
(31)【優先権主張番号】62/688,465
(32)【優先日】2018-06-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/449,319
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】504080663
【氏名又は名称】エヌイーシー ラボラトリーズ アメリカ インク
【氏名又は名称原語表記】NEC Laboratories America, Inc.
(74)【代理人】
【識別番号】100123788
【弁理士】
【氏名又は名称】宮崎 昭夫
(74)【代理人】
【識別番号】100127454
【弁理士】
【氏名又は名称】緒方 雅昭
(72)【発明者】
【氏名】ジャン、 シャオリァン
(72)【発明者】
【氏名】ヤマン、 ファティ
(72)【発明者】
【氏名】ロドリゲス、 エディアルド マテオ
(72)【発明者】
【氏名】中村 康平
(72)【発明者】
【氏名】稲田 喜久
(72)【発明者】
【氏名】井上 貴則
【審査官】対馬 英明
(56)【参考文献】
【文献】特開平10-239214(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04B 10/00-10/90
G06N 3/08
(57)【特許請求の範囲】
【請求項1】
ニューラルネットワークを使用する光伝送ネットワークのための非線形性補償(NLC)方法(NN-NLC)であって、
前記NN-NLCは、伝送リンクパラメータの知識なしに実行され、
チャネル内相互位相変調(IXPM)およびチャネル内4波混合(IFWM)トリプレットの選択を以下の条件式に基づいて行い、
【数1】
ここで、ρはエッジにおけるトリプレットの幅を決定するためのスケーリング係数であり(
【数2】
)、Lはシンボル窓長、
【数3】
および
【数4】
は、最も近い整数および絶対演算に向かって上方に丸めることを表し、mはx偏光に関するシンボル列の関心シンボルに対するシンボル指標、nはy偏光に関するシンボル列の関心シンボルに対するシンボル指標を表すことを特徴とする、NN-NLC方法。
【請求項2】
未知のリンクパラメータが、光分散、ファイバ非線形性、およびスパン長からなる群から選択されるものであることを特徴とする、請求項1に記載のNN-NLC方法。
【請求項3】
前記光伝送ネットワークは、ソフトウェアで定義されたメッシュネットワークであることを特徴とする、請求項2に記載のNN-NLC方法。
【請求項4】
前記NN-NLCは、訓練段階と実行段階の両方を含むことを特徴とする、請求項3に記載のNN-NLC方法。
【請求項5】
前記NN-NLC実行段階は、送信リンクの送信側でのみ実行されることを特徴とする、請求項4に記載のNN-NLC方法。
【請求項6】
前記NN-NLC訓練段階は、受信機のデジタル信号処理装置(DSP)におけるキャリア位相回復から得られたソフトデータ上で動作することを特徴とする、請求項5に記載のNN-NLC方法。
【請求項7】
前記NN-NLC訓練段階は、学習モデルを生成するために、交差検証(CV)データセットに対してニューラルネットワークモデルの性能を確認することを特徴とする、請求項6に記載のNN-NLC方法。
【請求項8】
前記学習されたモデルは、前記実行段階における全てのチャネル電力のデータに適用されることを特徴とする、請求項7に記載のNN-NLC方法。
【請求項9】
訓練段階および実行段階を備えたニューラルネットワークを使用する光ネットワークのための非線形性補償方法であって:
前記訓練段階中に、受信機デジタル信号プロセッサにおける搬送波位相回復からのソフトデータに基づいて動作することによってニューラルネットワークモデルを生成し;
学習されたモデルを生成するために交差検証データセットを用いて前記モデルの性能を評価し;
既知であるがランダムに生成されたパターンを送信し、
【数5】
で与えられる、送信されたシンボルと受信されたシンボルとの間の平均二乗誤差(MSE)を最小にする最良のノードテンソルパラメータを探索することによって、前記学習されたモデルを訓練し、
ここで、
【数6】
および
【数7】
はそれぞれ、前記受信されたシンボルおよび偏波H(pol-H)の推定非線形性であり、
【数8】
は前記送信されたシンボルであり、
【数9】
は絶対演算であり、Bはバッチサイズであり
伝送リンクパラメータの事前の知識なしに、チャネル内相互位相変調(IXPM)およびチャネル内4波混合(IFWM)トリプレットを前記ニューラルネットワークに適用して、非線形性を推定することを含み、
前記IXPM及びIFWMトリプレットの選択を以下の条件式に基づいて行い、
【数10】
ここで、ρはエッジにおけるトリプレットの幅を決定するためのスケーリング係数であり(
【数11】
)、Lはシンボル窓長、
【数12】
および
【数13】
は、最も近い整数および絶対演算に向かって上方に丸めることを表し、mはx偏光に関するシンボル列の関心シンボルに対するシンボル指標、nはy偏光に関するシンボル列の関心シンボルに対するシンボル指標を表すことを特徴とする、光ネットワークのための非線形性補償方法。
【請求項10】
前記訓練されたニューラルネットワークモデルは、送信機および受信機の一方に適用される、請求項9に記載の非線形性補償方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年6月22日出願の米国仮特許出願第62/688,456号及び2019年6月21日出願の米国実用新案出願第16/449,319号の優先権を主張するものであり、それらの全内容は、本書で詳細に記載されているかのように参照により組み込まれる。
【0002】
本開示は、一般に、光通信システム、方法、および構造に関する。より詳細には、ニューラルネットワーク(NN)を使用する光ファイバ非線形性補償(NLC)方法を記載する。
【背景技術】
【0003】
光通信分野で知られているように、光ファイバの非線形性は、光ファイバ通信の重大な障害として作用し、光ファイバに投入される最大光パワーを制限する。これに対して、この技術分野では、スパンごとにいくつかのデジタル逆伝搬法(DBP)ステップでファイバリンクに沿った信号伝送をエミュレートすることにより、ファイバカー(Kerr)非線形性を緩和するDBPおよびアルゴリズムが開発されている。DBPの計算量を単純化するために、当技術分野は、いくつかのスパンにわたる信号逆伝搬が単一のDBPステップにまとめられる方式を開発した。より最近では、より少ないDBPステップ/スパンを可能にするようにDBPアルゴリズムのステップ数を最適化することを試みる深層学習アプローチが、当技術分野で説明されている。そのような開発にもかかわらず、DBPアルゴリズムおよびその上に構築された方法は、分散、ファイバ非線形性、およびスパン長などの伝送リンクパラメータの正確な知識を必要とし、ソフトウェア定義メッシュネットワークでは容易に利用できないことがある。
【発明の概要】
【0004】
非線形性補償(NLC)のための改善された方法を対象とする、本開示の態様に従って、当技術分野における進歩がなされる。従来技術と比較して、本開示によるそのような方法は、有利には、リンクパラメータとは無関係に、システム-アグノスティックモデルを有利に提供する、本発明者らの機械学習アルゴリズムを採用した、より低複雑性、非線形性補償を提供し、しかも、従来技術と比較して、より低い複雑性で、同等以上の性能を達成する。
【0005】
さらに、本開示の態様によるシステム、方法、および構造は、リンクパラメータの事前知識なしに、受信信号非線形性を予測するためにニューラルネットワーク(NN)を使用するデータ駆動モデルを含む。
【0006】
動作上、NNは、基礎となる非線形相互作用へのより直接的な経路を有利に提供する、チャネル内相互位相変調(IXPM)およびチャネル内4波混合(IFWM)トリプレットを備える。
【0007】
さらに、当技術分野とは対照的に、ニューロンおよび多数の隠れ層における非線形活性化機能のために、本開示によるNNアーキテクチャは、有利には、トリプレットの相関を探索することができ、したがって、等価な6次および/または9次の相関を有するようにトリプレット間のより良好な相互作用を構築することができる。
【0008】
最後に、オンラインでトリプレットを計算することなく、本開示による低複雑性ニューラルネットワーク非線形性補償(NN‐NLC)が、2800kmの分散-非管理伝送にわたり単一チャネル32Gbaud二重偏波(DP)16QAMを用いて、>0.5dBのQ改善を提供できるルックアップテーブル(LUT)を用いることにより、送信機で実現できることを実証する。フィルタ処理されたDBPと同様の受信機側での複雑さで、確率的形状(PS)64直交振幅変調(64QAM)を用いた11,000kmフィールドファイバ伝送後のみ、NN‐NLCがCDCよりも0.15b/s/2偏波一般化相互情報(GMI)改善を達成することを更に実験的に示す。
【図面の簡単な説明】
【0009】
本開示のより完全な理解は、添付の図面を参照することによって実現され得る。
【0010】
図1(A)】図1(A)は、本開示の態様による受信機におけるデジタル信号処理(DSP)ステップを示す概略フロー図である。
【0011】
図1(B)】図1(B)は、本開示の態様による送信機におけるデジタル信号処理(DSP)ステップを示す概略フロー図である。
【0012】
図1(C)】図1(C)は、本開示の態様による送信機および送信ループのシステムセットアップを示す概略図である。
【0013】
図2(A)】図2(A)は、2800kM以降のSNR-l8.4dBにおける訓練データセットのノイズ除去平均を図示したプロットであって、2800の後の最適値よりも約2dB高いチャネル電力で受信された訓練データセットのQファクタおよびコンステレーションの取得された波形の数の影響を示す、QファクタとSNRにおける訓練データセットの平均化の数との対比のプロットである。
図2(B)】図2(B)は、2800kM以降のSNR-l8.4dBにおける訓練データセットのノイズ除去平均を図示したプロットであって、飽和曲線である。
図2(C)】図2(C)は、2800kM以降のSNR-l8.4dBにおける訓練データセットのノイズ除去平均を図示したプロットであって、本開示の態様による、よりクリーンなコンステレーションを示す飽和曲線である。
【0014】
図3(A)】図3(A)は、初期Nt-l929におけるニューラルネットワークモデルの入力層重みの密度プロットを示し、Nt=6l5である。
図3(B)】図3(B)は、初期Nt-l929におけるニューラルネットワークモデルの入力層重みの密度プロットを示し、反復トリミング(k=-22dB)後である。
図3(C)】図3(C)は、初期Nt-l929におけるニューラルネットワークモデルの入力層重みの密度プロットを示し、2つの隠れ層を有する最適化されたNNアーキテクチャを示す。
図3(D)】図3(D)は、初期Nt-l929におけるニューラルネットワークモデルの入力層重みの密度プロットを示し、本開示の態様によるpol-HのみのためのNN-NLCのブロック図である。
【0015】
図4(A)】図4(A)はプロットであって、2800km送信後の受信機側におけるNN-NLCに対するトリミング閾値kの影響を示すプロットである。
図4(B)】図4(B)はプロットであって、送信機側および受信機側におけるNN-NLCと、ステップ当たりの異なるスパンにおけるフィルタ処理されたDBPとの間の性能比較である。
図4(C)】図4(C)はプロットであって、受信機側において回復されたコンステレーションを示すプロットである。
図4(D)】図4(D)はプロットであって、本開示の態様による送信機側NN-NLC受信SNR=18.4dB@2800km送信を伴う。
図4(E)】図4(E)はプロットであって、本開示の態様による送信機側NN-NLC受信SNR=18.4dB@2800km送信を伴わない。
【0016】
図5図5は、本開示の態様による、シンボル当たりのデルタ-Q(dB)と実数乗算を示すプロットである。
【0017】
図6(A)】図6(A)はプロットであって、送信機および受信機のスペクトルである。
図6(B)】図6(B)はプロットであって、受信したPS64QAMコンステレーションである。
図6(C)】図6(C)はプロットであって、計算の複雑さの関数としてのみCDCに関するNN-NLCおよびフィルタ処理されたDBPの性能を比較する。
図6(D)】図6(D)はプロットであって、本開示の態様による240個のトリプレットを用いた訓練後の重みを有する入力層ノードの密度マップである。
【0018】
例示的な実施形態は、図面および詳細な説明によってより完全に説明される。しかしながら、本開示による実施形態は、様々な形態で具現化されてもよく、図面および詳細な説明に記載された特定のまたは例示的な実施形態に限定されない。
【発明を実施するための形態】
【0019】
以下は、単に本開示の原理を例示するものである。したがって、当業者は、本明細書では明示的に説明または図示されていないが、本開示の原理を具体化し、その精神および範囲内に含まれる様々な構成を考案することができることが理解されよう。
【0020】
さらに、本明細書に列挙されたすべての実施例および条件付き言語は、読者が本開示の原理および本技術を促進するために本発明者によって寄与された概念を理解するのを助けるための教育目的のためだけのものであることが意図され、そのような具体的に列挙された実施例および条件に限定されないものとして解釈されるべきである。
【0021】
さらに、本開示の原理、態様、および実施形態、ならびにその特定の例を列挙する本明細書のすべてのステートメントは、その構造的および機能的同等物の両方を包含することが意図される。さらに、そのような均等物は、現在知られている均等物と、将来開発される均等物、すなわち、構造にかかわらず、同じ機能を実行する開発された任意の要素との両方を含むことが意図される。
【0022】
したがって、たとえば、本明細書の任意のブロック図が、本開示の原理を実施する例示的な回路の概念図を表すことが、当業者には理解されよう。
【0023】
本明細書で特に明記しない限り、図面を構成する図面は、一定の縮尺で描かれていない。
【0024】
いくつかの追加的な背景技術として、深層学習アルゴリズムの進歩は、人工知能(AI)における圧倒的な関心を活性化し、任意の数の異なる分野における実用的かつ革新的なアプリケーションの創出に注目することから始める。特に興味深いことに、多くの研究者が、既製の機械学習(ML)モデルを、ネットワーク化、特に光伝送非線形性補償(NLC)、光ネットワーク性能監視、および光ネットワーク計画に直接適用してきた。
【0025】
当業者によって知られているように、ファイバカー(Kerr)非線形性は、任意の光ファイバ伝送システムの達成可能な最大情報レートに対する最も基本的な制限であり、非線形シュレーディンガー方程式(NLSE)によって特徴付けられることがよく知られている。そのようなものとして、スパン毎にいくつかのDBPステップで概念的な光ファイバリンクに沿った光信号伝送をエミュレートすることにより、ファイバカー(Kerr)非線形性を緩和するためのデジタル逆伝搬(DBP)アルゴリズムが開示されている。さらに知られているように、DBPの計算の複雑さを著しく単純化するために、いくつかのスパンにわたる信号の逆伝播は、信号の強度のローパスフィルタリングのために、フィルタ処理されたDBPスキームにおいて単一のDBPステップにまとめられる。
【0026】
最近、DBPアルゴリズムのステップ数を最適化し、スパンあたりのDBPステップ数をより少なくできるようにする試みにおいてシミュレーションの技術分野によって深層学習アルゴリズムが導入されている。しかし、残念ながら、DBPアルゴリズムおよびその変形は、分散、ファイバ非線形性、およびスパン長などの伝送リンクパラメータの正確な知識を必要とし、これは、現代のソフトウェア定義メッシュネットワークでは利用できない可能性がある。
【0027】
この背景を適所に置いて、本開示の態様によるMLアルゴリズムを使用する光学的非線形性補償のためのシステム、方法、および構造を本明細書に開示する。以下に示すように、既存のDBP方法を使用する代わりにNLCのためにMLアルゴリズムを使用することの特定の利点は、リンクパラメータから独立したシステムに依存しないモデルを有利に提供することができ、より低い複雑さで同等以上の性能を達成することができることである。
【0028】
説明するように、本開示は、リンクパラメータの事前の知識なしに、受信信号の非線形性を予測するためにニューラルネットワーク(NN)を使用するデータ駆動モデルを含む。NNには、基礎となる非線形相互作用へのより直接的な経路を有利に提供することができる、チャネル内相互位相変調(IXPM)およびチャネル内4波混合(IFWM)トリプレットが供給される。
【0029】
更に、各トリプレットに関連した係数を解析的に計算するために、特定のリンク条件と信号整形/ボーレートを依然として必要とする時間領域摂動プリ/ポストディストーション(PPD)アルゴリズムで使用するために、IXPMとIFWMトリプレットが最初に提案されたことに留意する。
【0030】
対照的に、ニューロンおよび多数の隠れ層における非線形活性化機能のために、本明細書に開示される本発明者らのNNアーキテクチャは、有利には、トリプレットの相関を探索することができ、したがって、等価な6次および/または9次の相関を有するように、これらのトリプレット間のより良好な相互作用を構築することができる。
【0031】
オンラインでトリプレットを計算することなく、2800kmの分散管理されていない伝送にわたる単一チャネル32Gbaud二重偏波(DP)16QAMを使用して、>0.5dBのQ改善を提供することができるルックアップテーブル(LUT)を使用することによって、低複雑性NN-NLCが送信機で実装され得ることを再び実証することに留意する。フィルタ付きDBPと同様の受信機側での複雑さで、確率的形状(PS)64直交振幅変調(64QAM)を用いた11,000kmフィールドファイバ伝送後のみ、NN‐NLCがCDC上で0.15b/s/2偏波一般化相互情報(GMI)改善を達成することを更に実験的に示した。
【0032】
基本理念
当業者には理解されるように、ファイバに沿った光学場の展開は、NLSE:
【数1】
によって特徴付けることができる。ここで、
【数2】
は、それぞれx偏光およびy偏光の光学場であり、β2は群速度分散であり、γは非線形係数である。
【0033】
一次摂動理論では、式(1)の解は、線形
【数3】
および非線形摂動
【数4】
の両方の項を含む。シンボル持続時間よりもはるかに大きな累積分散を仮定すると、t=0におけるシンボルに対する非線形摂動項は次のように近似できる。
【数5】
【0034】
ここで、P0、HmとVm、およびCm,nはそれぞれ、発射電力、x-偏光およびy-偏光に対するシンボル列、および非線形乱数係数であり、mおよびnは、H0およびV0の関心シンボルに対するシンボル指標である。当業者には理解されるように、非線形摂動係数Cm,nは、リンクパラメータおよびシグナルパルス持続時間/整形係数が与えられると、解析的に計算することができる。
【0035】
これらのIXPMおよびIFWMトリプレットは、ファイバ内を伝播するシンボル間の基礎となる非線形相互作用として働く。その結果、これらをNNモデルに適用して、受信信号における全非線形性を予測する。このデータ前処理は、ファイバ非線形性の成功予測に重要であることが分かった。
【0036】
以下に示すように、本開示に従った発明者らのNN-NLCアルゴリズムは、訓練段階と実行段階の2段階に分けられる。図1(A)は、本開示の態様による受信機におけるデジタル信号処理(DSP)ステップを示す概略フロー図である。図1(B)は、本開示の態様による送信機におけるデジタル信号処理(DSP)ステップを示す概略フロー図である。
【0037】
これらの図を参照すると、受信機の動作には、アナログ-デジタル変換、続いての同期および再サンプリング、続いての色分散補償、続いての偏波分離、搬送波位相回復、ニューラルネットワークが生成した非線形性補償、最後に順方向誤り訂正(FEC)復号が含まれることが観察され得る。
【0038】
訓練段階
訓練データのセットアップ
【0039】
ファイバ非線形性を特性化するために、受信した訓練データにおいて信号非線形性を観測しなければならない。したがって、発射電力P0は、ASE雑音よりも非線形性雑音が支配的であることを可能にするために、最適チャネル電力を超えて設定することができる。加えて、付加的ガウシアンASE雑音から生じるデータ依存非線形性を分離するために固定訓練データパターンに対して雑音除去平均化を実行できる。この動作段階では、NN-NLCブロックは、図1(A)の受信機のDSPフローチャートに示されている搬送波位相回復ブロックからのソフトデータ上で動作する。実行段階の後半で、NN-NLCは送信機側でも、受信機側でも実行可能である。
【0040】
実験データでNN-ALCアルゴリズムを更に精緻化するために、図1(C)に示すようなRRC0.01パルス整形による単一チャネル32Gbaud DP-16QAMを、64Gs/s DACを用いて生成し、0.2dB/km損失とl7ps/nm/km分散を示す80km SMFの5スパンを有するループテストベッド上を伝送させる。20GHzのアナログ帯域幅で50GSa/sで動作するデジタルコヒーレント受信機は、図1(A)に概説したようにオフラインのDSP用の光波形をダウンサンプリングし、送信されたシンボルを回復する。さらに、ファイバ非線形性耐性を強化するために、送信機で50%色分散補償(CDC)を適用した。
【0041】
訓練、クロスバリデーション(CV)およびテストのために、それぞれ~115kのシンボルを有する3つの無相関データセットが生成される。その訓練、CVおよびテストのデータセットで使用されるデータパターンは、データの独立性を保証するために最大0.6%の正規化相互相関を有するように測定される。
【0042】
複数の波形取得が処理され、キャリア位相回復後に復元されたソフトシンボルが整列され、加法性ノイズが平均化される。図2は、2800km伝送後の最適値よりも~2dB高いチャネル電力で受信された訓練データセットのQファクタおよびコンステレーションに対する取得波形数の影響を示すプロットである。当業者には大いに理解されるように、約1.6dBのQファクタの改善は、5つの取得された波形にわたる平均化のみの後に観察される。飽和曲線は、図2(C)において得られるよりクリーンなコンステレーションが、図2(B)に示されるものよりも非線形雑音をより正確に表すことを示す。
【0043】
トリプレット選択
【0044】
受信した訓練データセット内のASEノイズをクリーンアップした後、これらのデータは、式(2)に記載されるように、IXPMおよびIFWMトリプレットを計算するために使用される準備ができている。以前の研究では、リンクパラメータと信号ボーレートに基づいて、非線形摂動係数Cm,nが最初に解析的に計算され、あるしきい値を超える係数を持つトリプレットのみが保持される、すなわち、
【数6】
であることに注意する。当技術分野で計算された係数は、NNモデルに供給するためのトリプレットを選択するためにのみ使用されることに留意されたい。
【0045】
部分的には、与えられたmにおいて、非線形摂動係数Cm,nの双曲線特性のために、ここでは、以下の基準に基づいてこれらの三つ組のみを選択する。
【0046】
【数7】
【0047】
ここで、ρはエッジにおけるトリプレットの幅を決定するためのスケーリング係数であり(
【数8】
)、Lはシンボル窓長、
【数9】
および
【数10】
は、最も近い整数および絶対演算に向かって上方に丸めることを表す。
【0048】
ρ=1, L=151及びNt=1929のノイズ除去された訓練データを使用して、NN訓練後の入力層でのテンソル重みWm,nの密度マップが図3(A)にプロットされている。図からわかるように、式(3)のトリプレットの選択基準は、発明者らの深層学習アルゴリズムに、すべてのL2トリプレットを探索するのではなく、重要なトリプレットを効率的に突き止めることを可能にし、したがって、計算量および訓練時間を大幅に低減する。
【0049】
モデル選択
【0050】
当業者には容易に理解され、真価が認められるように、単純な線形回帰から、あらゆる種類の問題を解決するように設計された高度な深層学習モデルまで、様々なMLモデルが存在する。線形回帰、畳み込みニューラルネットワーク、反復ニューロンネットワーク、および完全接続ニューロンネットワークなどのいくつかのモデルは、TensorFlowを使用して実装され、それらの性能は、本明細書で開発された本発明者らのシミュレーションデータを使用して迅速にチェックされる。ここで開示するように、完全接続ニューラルネットワークは、他のすべてのモデルよりも性能が優れている。
【0051】
本開示による最適化されたフィードフォワードNNモデルは、図3(C)に概略的に示されている。この図から分かるように、それは、2*Nt個のトリプレットノードを備えた入力層と、それぞれ2個および10個のノードからなる2つの隠れ層と、推定された非線形性の実数および虚数に対応する2つの出力ノードとから構成される。トリプレットは、NNモデルに供給される前に実数と虚数に分離されることに留意されたい。
【0052】
活性化関数SELU()は、両方の隠れ層のノードに適用される。0.5の確率のドロップアウト層が、オーバーフィットを避けるためにのみ、訓練中に第2の隠れ層の後に配置される。0.001の学習レートおよびB=100のバッチサイズを有するAdam学習アルゴリズムを適用すると、ネットワークは、既知であるがランダムに生成されたパターンを送信し、NN-NLC後の送信シンボルと受信シンボルとの間の平均二乗誤差(MSE)、すなわち、
【数11】
を最小にする最良のノードテンソルパラメータを探索することによって学習される。ここで、
【数12】
および
【数13】
はそれぞれ、pol-Hについての受信シンボルおよび推定非線形性である。モデルはpol-Hデータを使用して訓練されるが、pol-Vについても同様の性能改善が観察される。訓練は、深層学習アルゴリズムが適切なNNモデルを探し出し、実行段階の前に最適テンソル重みを計算することを可能にするために、データレートよりもはるかに遅いペースで行うことができることに留意されたい。
【0053】
実行段階
【0054】
訓練段階の間、モデルの性能は、NNモデルパラメータを最適化するためにのみ、CVデータセットに対してチェックされる。その後、学習されたモデルは、実行段階における全てのチャネル電力について、無相関のテストデータセットに適用される。本開示によるNN-NLCのブロック図を図3(D)に示す。
【0055】
関心のあるシンボル
【数14】
がシンボル長Lの中央を中心とすると仮定し、図3(C)のNNモデルに入力するためにIXPMとIFWMの項を計算し、非線形性を推定する。推定された
【数15】
は、モデルを導出するために使用される訓練データの基準チャネル電力(Pref)に関してテストデータセットのチャネル電力(PCh)によって、すなわち、
【数16】
によって最初にスケーリングされる。
【0056】
図1(A)に概略的に示されるように、FEC復号化のような次のDSPブロックのために送信される前に、関心のあるオリジナルシンボルが推定された
【数17】
によって減算されることに留意されたい。
【0057】
ソフトシンボルを用いたトリプレットの計算は受信機側ではかなり高価になる可能性があるため、NN-NLCブロックを送信機側に移動し、それぞれの変調フォーマットに対する限定アルファベットサイズMを利用することが望ましい。そのため、ルックアップテーブル(LUT)を作成して、M3のすべてのトリプレットを格納することができる。特に、LUTは16QAMに対して163=4096エントリだけを必要とする。受信機のシンボルを用いて訓練段階で開発した同じNNモデルは、受信機側で依然として有効であることを実証した。図1(B)は、送信機側のNN-ALCのDSPブロック図を示す。
【0058】
複雑性と性能
【0059】
実数乗算の複雑さは、加算演算の4倍であり得るので、NLCアルゴリズムの複雑さを比較するときには、実数乗算のみが考慮される。図3(C)に示される本開示によるNNモデルは、3つの交差層テンソル相互作用のため
【数18】
の実数乗算を必要とする。隠れノードの活性化関数SELU()とIXPM/IFWMトリプレット計算はLUTで実行されると仮定されることに留意する。
【0060】
推定された非線形項をスケーリングした後、図3(D)に示される本開示の態様によるNN-ALCのシンボル当たりの実数乗算の数は、次のように要約される。
【数19】
【0061】
したがって、トリプレットNtの数を減らすことは、本発明者らのモデルにおけるNN-ALCアルゴリズムの複雑さを減らすための最も効果的な方法である。
【0062】
図3(A)に示すように、最初のNt=1929個のトリプレットでは、訓練モデルにおける入力テンソル重みWm,nのいくつかは、中心のものよりもはるかに小さい寄与を示す。その結果、これらの重みをしきい値Kより大きく保つだけで、すなわち
【数20】
で、トリプレットNtの数をさらに減らすことができる。
【0063】
図4(A)に示すk=-22dB未満の重みWm,nをトリミングした後、残りの615個のトリプレットは、NNモデルにおいて再訓練され、入力テンソル重みWm,nの新しい密度プロットを図3(B)に示す。
【0064】
図4(A)は、2800km送電後に受信SNRの関数としてのNN-NLCの性能向上に対するトリミング閾値kの影響をプロットしたものである。最適受信SNRでは、トリミング閾値k<-l5dBでのNN-NLCアルゴリズムは、CDCよりも、>0.5dBのQ向上を達成する。最高受信SNRにおけるより多くのQ改善は、本発明者らのNNモデルが信号非線形性を正確に予測することをさらに確認した。トリミング閾値kを-35dBから-15dBに調整することにより、図4(A)のズーム挿入図に示されるように、16.6dBおよび18.4dBの受信SN比において、それぞれ、~0.2dBおよび~0.4dBのQ変動内の性能トレードオフが観察され得る。
【0065】
本開示による方法に関して既に開示されているように、送信機側NN-NLCは、LUTを用いたトリプレットの計算を回避し、それによって複雑さを軽減するという利点がある。さらに、本発明者らのNNモデルは、クリーンな送信シンボル上で動作するので、CDCに対するNN-NLCのQ改善は、受信機側におけるQ改善よりも高い。最後に、追加の利点は、受信機DSPアルゴリズムがより少ない非線形性で信号に働き、それによってサイクルスリップ率を低減することである。
【0066】
これらのことを念頭に置いて、受信機側でトリミング閾値k=-22dBで導出されたNNモデルをテストデータセット中のオリジナルの16QAMシンボルに適用した場合の、事前に歪んだシンボルコンステレーションが図4(C)にプロットされている。興味深いことに、図3(B)に示す左平面と右平面との間の非対称非線形相互作用のために、予め歪んだ記号はガウス型ではない。図4(E)に示されるNN-NLCアルゴリズムを使用しない復元されたコンステレーションと比べると、送信機側NN-NLCは、図4(D)にプロットされたようなコンステレーション品質を著しく改善することができる。トリミング閾値k=-22dBにおけるRx側NN-NLCに比べて、図4(B)に、歪みのない送信機シンボルのおかげで送信機側にNN-NLCを移動する際の~0.1dBのQ改善を示す。
【0067】
ここで、フィルタ処理されたDBPは、性能と計算の複雑さとの間のトレードオフのバランスをとるために、従来技術文献に開示されている周知の技術であることに留意されたい。各DBP工程で複数のスパンがエミュレートされるので、強度波形は、非回転信号位相のために使用される前に、ガウス低域フィルタ(LPF)によってフィルタ処理されなければならない。その最適帯域幅は、1ステップあたり1,5,7および35のスパン(SpS)に対して、5GHz,lGHz,lGHzおよび0.5GHzであることが分かった。信号の位相をディローテーションするために使用される最適なスケーリング係数ξは、すべての場合において約0.7である。
【0068】
本開示の単一ステップNN-NLCと比較して、単一ステップフィルタ処理されたDBP(35SpS)は、>0.6dBのパフォーマンスを示した。測定結果から、フィルタ処理されたDBPは、k=-22dBでRx側NN-NLCの性能を達成するために、少なくとも7ステップ、すなわち5SpSを必要とする。
【0069】
CDCに対するQ性能の改善は、図5にプロットされているが、フィルタ処理されたDBPとTx/Rx側NN-NLCアルゴリズムの両方とのシンボルあたりの実乗数である。フィルタ処理されたDBPは同時にCDCとNLCを実行するので、公平な比較のために、Rx側CDCブロック(図1(a)参照)に必要なシンボル当たりの実数乗算をNN-NLCアルゴリズムに含めなければならず、すなわち、
【数21】
で与えられ、ここで、nはFFTサイズであり、ncdは累積CDを補償するために必要なCDCイコライザの最小数である。CDCは、FFTサイズn=4086で周波数領域で実行されると仮定する。受信機側の50%の残存CDを補うために、式(7)で与えられたNN-NLCの複雑さの上に、シンボルごとに追加的な~115の実数乗数が加算される。
【0070】
一般に、本開示によるNN-NLCのRx側は、計算の複雑さがシンボル当たり~1000の実数乗算未満である場合にのみ、フィルタ処理されたDBPよりも良好に実行する。NN-NLCアルゴリズムを送信機側に移動する場合、それはフィルタ処理されたDBPよりも低い複雑さで性能の優位性を発揮しながら、シンボル当たり1000よりも高い複雑さでフィルタ処理されたDBPの性能と等しいか、またはそれを上回る。本発明者らが観察したように、Tx側NN-NLCは、追跡信号の非線形性が欠如しているために複雑性が低すぎると、Rx側よりも性能上の優位性を失う。
【0071】
図5の挿入図は、Nt=29個のトリプレットのみを有する事前に歪んだシンボルを示し、これは、615個のトリプレットを使用して図4(C)に示されるものとは著しく異なる。
【0072】
NN-NLCの性能を、ライブトラフィックと共に11,017kmの商用FASTER海底ケーブル上でさらに実証した。50GHzのWDM構成におけるプローブ信号として、全300Gb/sビットレートを搬送する50MHz保護帯域を持つRRC0.01でのデジタル副搬送波変調(DSM)4×l2.25Gbaud PS-64QAMを用いた。送信機および受信機のスペクトルを図6(A)にプロットする。雑音除去平均アプローチを適用した後、2dBチャネルプリエンファシスでの受信PS-64QAMコンステレーションを図6(B)に示す。PS-64QAM形式のNN-NLCのゲインを正確に測定するために、一般化相互情報(GMI)が使用されている。
【0073】
図6(C)は、NN-NLCおよびフィルタ処理されたDBPの性能を、計算の複雑さの関数としてのみCDCに関して比較する。参照は、CDCのみを有するGMIである。同様の傾向は、NN-NLCが、複雑さがシンボル当たり730個の実数乗算未満である場合に、フィルタ処理されたDBPよりも良好に機能することが見出される。Tx側NN-NLCは、パフォーマンスゲインをさらに向上させる可能性が高いと期待される。図6(D)は、240個のトリプレットを用いた訓練後の入力層ノード重みの密度マップをプロットしている。
【0074】
当業者には認められ、理解されるように、本開示の態様による発明者らのNN-NLCは、分散、ファイバ非線形性およびファイバ長などの伝送リンクパラメータの事前知識なしに、システム非依存性能を示すために、ラボテストベッドおよびフィールドケーブルの両方において実験的に実証される。
【0075】
この時点で、いくつかの特定の例を使用して本開示を提示したが、当業者は、本教示がそのように限定されないことを認識するであろう。したがって、本開示は、添付の特許請求の範囲によってのみ制限されるべきである。
図1(A)】
図1(B)】
図1(C)】
図2(A)】
図2(B)】
図2(C)】
図3(A)】
図3(B)】
図3(C)】
図3(D)】
図4(A)】
図4(B)】
図4(C)】
図4(D)】
図4(E)】
図5
図6(A)】
図6(B)】
図6(C)】
図6(D)】