IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ロックポート ネットワークス インコーポレイテッドの特許一覧

<>
  • 特開-直接相互接続ゲートウェイ 図1
  • 特開-直接相互接続ゲートウェイ 図2
  • 特開-直接相互接続ゲートウェイ 図2b
  • 特開-直接相互接続ゲートウェイ 図2c
  • 特開-直接相互接続ゲートウェイ 図2d
  • 特開-直接相互接続ゲートウェイ 図2e
  • 特開-直接相互接続ゲートウェイ 図2f
  • 特開-直接相互接続ゲートウェイ 図3
  • 特開-直接相互接続ゲートウェイ 図4
  • 特開-直接相互接続ゲートウェイ 図4b
  • 特開-直接相互接続ゲートウェイ 図5
  • 特開-直接相互接続ゲートウェイ 図6
  • 特開-直接相互接続ゲートウェイ 図7
  • 特開-直接相互接続ゲートウェイ 図8
  • 特開-直接相互接続ゲートウェイ 図8b
  • 特開-直接相互接続ゲートウェイ 図9
  • 特開-直接相互接続ゲートウェイ 図10
  • 特開-直接相互接続ゲートウェイ 図11
  • 特開-直接相互接続ゲートウェイ 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022132603
(43)【公開日】2022-09-08
(54)【発明の名称】直接相互接続ゲートウェイ
(51)【国際特許分類】
   H04L 12/46 20060101AFI20220901BHJP
   H04L 12/66 20060101ALI20220901BHJP
   H04L 49/111 20220101ALI20220901BHJP
【FI】
H04L12/46 100C
H04L12/66
H04L49/111
【審査請求】有
【請求項の数】21
【出願形態】OL
(21)【出願番号】P 2022117013
(22)【出願日】2022-07-22
(62)【分割の表示】P 2020520634の分割
【原出願日】2018-10-12
(31)【優先権主張番号】2982147
(32)【優先日】2017-10-12
(33)【優先権主張国・地域又は機関】CA
(71)【出願人】
【識別番号】516245081
【氏名又は名称】ロックポート ネットワークス インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【弁理士】
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【弁理士】
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【弁理士】
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【弁理士】
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100176418
【弁理士】
【氏名又は名称】工藤 嘉晃
(72)【発明者】
【氏名】ウィリアムズ マシュー ロバート
(57)【要約】
【課題】直接相互接続ゲートウェイを提供する。
【解決手段】従来型ネットワークと直接相互接続ネットワークとの間のブリッジング、スイッチング、又はルーティングが可能な専用ゲートウェイデバイスが提供され、一般にSFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの1又は2以上を含むポート毎に単一のリンクを有する1又は2以上の従来型ネットワークポートの第1のセットであって、かかるポートが従来型ネットワークを形成するスイッチ又はデバイスに接続される1又は2以上の従来型ネットワークポートの第1のセットと、一般にMXCコネクタ、MTPコネクタ及びMTOコネクタのうちの1又は2以上を含むポート毎に多数のリンク(2又は3以上)を有する1又は2以上の直接相互接続ポートの第2のセットであって、かかるポートが直接相互接続ネットワークに接続される1又は2以上の直接相互接続ポートの第2のセットとを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイス(50)であって、
ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポート(100)の第1のセットと、
ポート毎に少なくとも2つのリンクを有する少なくとも1つの直接相互接続ポート(102)の第2のセットと、
を備え、
前記従来型ネットワークポート(100)の第1のセットは、従来型ネットワークを形成するスイッチ又はデバイスのうちの1つに接続され、前記少なくとも1つの直接相互接続ポート(102)の第2のセットは、前記直接相互接続ネットワークに接続される、デバイス(50)。
【請求項2】
前記従来型ネットワークポート(100)の第1のセットは、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの少なくとも1つを備える、請求項1に記載のデバイス(50)。
【請求項3】
前記少なくとも1つの直接相互接続ポート(102)の第2のセットは、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの少なくとも1つを備える、請求項1に記載のデバイス(50)。
【請求項4】
前記従来型ネットワークポート(100)は、前記従来型ネットワーク内のスイッチポート及びルータポートのうちの少なくとも1つに接続される、請求項1に記載のデバイス(50)。
【請求項5】
前記直接相互接続ポート(102)の第2のセットは、前記直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブ(60)に接続される、請求項1に記載のデバイス(50)。
【請求項6】
前記直接相互接続ポート(102)の第2のセットは各々、固有の専用の直接相互接続の特定用途向け集積回路(ASIC104)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及び直接相互接続ネットワーク内のノードとして機能を果たすことができるデバイスのうちの少なくとも1つに接続される、請求項1に記載のデバイス(50)。
【請求項7】
前記直接相互接続ポート(102)の第2のセットは各々、共有された直接相互接続の特定用途向け集積回路(ASIC104)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及び直接相互接続ネットワーク内のノードとして機能を果たすことができるデバイスのうちの少なくとも1つに接続される、請求項1に記載のデバイス(50)。
【請求項8】
ブリッジング機能、スイッチング機能及びルーティング機能のうちの少なくとも1つは、ネットワークスイッチASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送を実行できるデバイスのうちの少なくとも1つによって実行される、請求項1に記載のデバイス(50)。
【請求項9】
ブリッジング機能、スイッチング機能及びルーティング機能のうちの少なくとも1つは、ネットワークコントローラASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送を実行できるデバイスのうちの少なくとも1つによって実行される、請求項1に記載のデバイス(50)。
【請求項10】
前記ASIC、前記FPGA、前記汎用プロセッサ、及びノードのうちの少なくとも1つは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースラインを通じて送られる直接相互接続ノードとして機能することができる、請求項9に記載のデバイス(50)。
【請求項11】
前記直接相互接続ポートは、前記直接相互接続ネットワーク内のデバイスの代わりになる、請求項1に記載のデバイス(50)。
【請求項12】
前記直接相互接続ポートの第2のセットは、複数の直接相互接続ネットワークに接続される、請求項1に記載のデバイス(50)。
【請求項13】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングのうちの少なくとも1つが可能である専用ネットワークゲートウェイデバイス(50)であって、
直接相互接続ネットワークに接続されるように構成された直接相互接続ポートである第1のポートと、
従来型ネットワークを形成するスイッチ及びデバイスのうちの少なくとも1つに接続されるように構成された標準のネットワークポートである第2のポートと、
を備える、デバイス(50)。
【請求項14】
前記第1のポートは、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの少なくとも1つを備える、請求項13に記載のデバイス(50)。
【請求項15】
前記第2のポートは、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの少なくとも1つを備える、請求項13に記載のデバイス(50)。
【請求項16】
前記第1のポートは、前記直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブに接続される、請求項13に記載のデバイス(50)。
【請求項17】
前記第2のポートは、前記従来型ネットワーク内におけるスイッチポート又はルータポートのうちの少なくとも1つに接続される、請求項13に記載のデバイス(50)。
【請求項18】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング及びルーティングのうちの少なくとも1つのための専用ネットワークゲートウェイデバイス(50)であって、
従来型ネットワークを形成するエンドデバイスに接続され、ポート毎に単一のリンクを有する従来型ネットワークポート(100)の第1のセットと、
前記直接相互接続ネットワークに接続され、ポート毎に2又は3以上のリンクを有する直接相互接続ポート(102)の第2のセットと、
を備え、前記直接相互接続ネットワークは、ネットワークトラフィックが前記専用ネットワークゲートウェイデバイス(50)から別の専用ネットワークゲートウェイデバイス(50)にルーティングすることを可能にするバックボーンとして機能し、前記別の専用ネットワークゲートウェイデバイスは、
第2の従来型ネットワークを形成するエンドデバイスに接続され、ポート毎に単一のリンクを有する従来型ネットワークポート(100)の第1のセットと、
前記直接相互接続ネットワークに接続され、ポート毎に2又は3以上のリンクを有する直接相互接続ポート(102)の第2のセットと、
を備える、ことを特徴とするデバイス(50)。
【請求項19】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングのうちの少なくとも1つのための専用ネットワークゲートウェイデバイス(50)であって、
従来型ネットワークを形成するスイッチ及びデバイスのうちの少なくとも1つに接続され、ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポート(100)の第1のセットと、
直接相互接続ネットワークに接続され、ポート毎に1又は2以上のリンクを有する少なくとも1つの直接相互接続ポート(102)の第2のセットと、
単一の直接相互接続ノードとして機能するように論理的に関連付けられた複数の直接相互接続ポートと、
を備える、デバイス(50)。
【請求項20】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングのうちの少なくとも1つを行うコンピュータ実装方法であって、
前記直接相互接続ネットワーク内の1又は2以上のノードとして機能する請求項1に記載の前記専用ゲートウェイデバイス(50)を前記従来型ネットワーク及び前記直接相互接続ネットワークに接続するステップと、
前記ゲートウェイデバイス(50)を用いて、前記ネットワークトラフィックのヘッダ又はコンテンツに基づいて前記従来型ネットワークと前記直接相互接続ネットワークとの間で前記ネットワークトラフィックを転送するステップと、
を含む、コンピュータ実装方法。
【請求項21】
2以上のゲートウェイデバイス(50)によって、従来型ネットワークに位置するリソースがアクセス可能である場合に、どのゲートウェイデバイス(50)が前記リソースにアクセスできるようにする能力を有するかを調整するコンピュータ実装方法であって、
ARP、ブロードキャスト、マルチキャスト、又はエニーキャストトラフィックを直接相互接続ポートで受信するステップであって、前記トラフィックが、前記従来型ネットワークに位置する前記リソースへのアクセスを要求し、前記直接相互接続ポートが、1又は2以上のホップを介して前記2以上のゲートウェイデバイスにリンクされ、前記ゲートウェイデバイスの各々が前記リソースへのアクセスを可能にすることができるステップと、
前記2以上のゲートウェイデバイスから、前記リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップと、
前記トラフィックと、前記直接相互接続ノードと、前記計算された最適ゲートウェイデバイスポートとの間の関連付け情報を生成するステップと、
前記関連付け情報を前記2以上のゲートウェイデバイスの各々に伝達して、前記計算された最適ゲートウェイデバイスポートが前記リソースにアクセスできるように確保するステップと、
を含む、コンピュータ実装方法。
【請求項22】
前記リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップは、前記2以上のゲートウェイデバイスポートのうちのどれが、前記直接相互接続ポートに最も近いかを判定するステップを含む、請求項21に記載のコンピュータ実装方法。
【請求項23】
前記リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップは、合意アルゴリズムを使用して前記トラフィックの整合性を保証するステップを含む、請求項21に記載のコンピュータ実装方法。
【請求項24】
前記関連付け情報を伝達するステップは、専用又は共有された調整バスによって処理される、請求項21に記載のコンピュータ実装方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータネットワーク内のI/O(入力/出力)トラフィックに関する。より具体的には、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のデータのブリッジング、スイッチング、又はルーティングを行う専用デバイスに関する。
【背景技術】
【0002】
コンピュータネットワークは、多数のノードが、互いにデータをルーティング又は他の方法で交換することを可能にする。その結果、コンピュータネットワークは、ストレージサーバの共有使用、ワールドワイドウェブへのアクセス、電子メールの使用などの膨大な数のアプリケーション及びサービスをサポートすることができる。
【0003】
ノードは、それ自体、多くの場合、これらのノードが実行する特殊なタスクに基づいて3つのタイプ、すなわち、計算を実行する(しかしながら、一般に、皆無かそれに近いローカルディスクスペースを有する)CPUを有するサービスなどの計算ノードと、システムの二次ストレージを含み並列ファイルシステムサービスを提供するI/Oノードと、外部データサーバ及び大容量記憶システムへの接続を提供するゲートウェイノードと、に特徴付けることができる。一部のノードは、例えばI/O機能及びゲートウェイ機能の両方を処理することなどの2以上の機能を提供することさえ可能である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2015/027320号
【特許文献2】国際公開第2015/120539号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、並列システム及び分散システムのI/Oは、コンピュータシステムのユーザ及び設計者の両方にとって非常に大きな関心事になっている。この点で、CPUの速度は、事実上、毎年、指数関数的速度で増加しているが、残念なことに、I/Oデバイスの速度は、それより遅い速度で増加しており、このことは、多くの場合、この速度が機械構成要素の速度によって更に制限される場合があるという事実に起因する。従って、ノード間のI/Oデータトラフィックの尺度であるI/O性能は、ネットワーク性能における制限因子であることが多い。実際には、CPUとI/Oとの間の速度の不一致は、並列及び分散コンピュータシステムにおいて顕著であり、I/Oは、スケーラビリティを大幅に制限する可能性があるボトルネックの状態のままである。このことは、ネットワークがマルチメディア及び科学的モデリングを伴う商用アプリケーションに関連している場合に特に当てはまり、例えば、これらのアプリケーションの各々は、非常に大きなI/O要件を有する。
【0006】
国際公開第2015/027320号(並列コンピュータシステムにおいてネットワークノードをメッシュ状に接続するための新規性のあるトーラス又は高基数相互接続トポロジを説明している)に開示されているものなどの直接相互接続ネットワークは、一般に、トラフィックを直接相互接続の一部分であるノードに制限する。国際公開第2015/027320号に開示されている新規性のあるシステム及びアーキテクチャは、特に、データセンタ及びクラウドデータセンタでの商用展開に有用で実用的であるが、残念なことに、現在運用中のほとんどのデータセンタは、依然として、とりわけ、従来型レガシー3層アーキテクチャ、ファットツリー型アーキテクチャ、又はDCellサーバセントリックアーキテクチャに基づいている。データセンタがこれらのアーキテクチャに基づく場合には、残念なことに、これらのデータセンタが直接相互接続に参加することは、望ましくないか又は不可能であり、従って、データセンタは、このようなネットワークトポロジの利点を活用することができない。いくつかの従来技術の直接相互接続アーキテクチャは、各ノード又はノードのサブセット(すなわち、ゲートウェイノード)が、直接相互接続ネットワーク及び従来型ネットワークの両方への二重接続性を有するシステムを提供しているが、これらのノードは、これら2つのネットワーク間でブリッジング又はルーティングを行うため、かかるノードがデバイスのリソースを管理及びロードすることは困難である。
【0007】
従って、直接相互接続デバイス及び非直接相互接続デバイスが通信することを可能にするように設計及び可能にされた直接相互接続ゲートウェイを有することが望ましい。更に、I/Oトラフィックに関して上述した欠点のうちの幾つかを克服することを支援できるゲートウェイを有することが有用である。
【課題を解決するための手段】
【0008】
1つの態様では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のブリッジング、スイッチング、又はルーティングが可能な専用デバイス、すなわち、ゲートウェイデバイスを提供する。
【0009】
別の態様では、本発明は、ネットワーク管理システムによって管理できる非常に管理しやすいゲートウェイデバイスを提供する。
【0010】
更に別の態様では、本発明は、MACテーブル、並びに複数の直接相互接続ポート間でのARP、ブロードキャスト、マルチキャスト及びエニーキャスト応答の協調を可能にするゲートウェイデバイスを提供する。
【0011】
1つの実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する1又は2以上の従来型ネットワークポートの第1のセットを備え、かかるポートは、従来型ネットワークを形成するスイッチ又はデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する1又は2以上の直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続される。従来型ネットワークポートは、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの1又は2以上を備え、従来型ネットワーク内におけるスイッチポート又はルータポートに接続でき、その一方、直接相互接続ポートは、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの1又は2以上を備え、直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブに接続することができる。代替的に、直接相互接続ポートは各々、これらのポート自体の専用の直接相互接続の特定用途向け集積回路(ASIC)に接続すること、又は直接相互接続ポートは各々、1又は2以上の共有された特定用途向け集積回路(ASIC)に接続することができる。ブリッジング、スイッチング、又はルーティング機能は、ネットワークスイッチASIC又はネットワークコントローラASICによって実行することができる。これらのASICは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースラインを通じて送られる直接相互接続ノードとして機能することができる。それに加えて、他の実施形態では、直接相互接続ポートは、直接相互接続ネットワーク内のデバイスの代わりになることができ、直接相互接続ポートは、複数の直接相互接続ネットワークに接続されることさえ可能である。
【0012】
別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、2つのポート、すなわち、直接相互接続ネットワークに接続できる直接相互接続ポートである第1のポートと、従来型ネットワークを形成するスイッチ又はデバイスに接続できる標準ネットワークポートである第2のポートとを備える。第1のポートは、MXCコネクタ、MTコネクタP、又はMTOコネクタのうちの1つを備えることができ、直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブに接続することができる。第2のポートは、SFP+コネクタ、QSFPコネクタ、又はQSFP+コネクタのうちの1つを備え、従来型ネットワーク内におけるスイッチポート又はルータポートに接続することができる。
【0013】
更に別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する従来型ネットワークポートの第1のセットを備え、かかるポートは、第1の従来型ネットワークを形成するエンドデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続され、該直接相互接続ネットワークは、ネットワークトラフィックが、専用ネットワークゲートウェイデバイスから別の専用ネットワークゲートウェイデバイスにルーティングされることを可能にするバックボーンとして機能し、該別の専用ネットワークゲートウェイデバイスは、ポート毎に単一のリンクを有する従来型ネットワークポートの第1のセットを備え、かかるポートは、第2の従来型ネットワークを形成するエンドデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続される。
【0014】
更に別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する1又は2以上の従来型ネットワークポートの第1のセットを備え、かかるポートは、従来型ネットワークを形成するスイッチ又はデバイスに接続され、本デバイスは更に、ポート毎に1又は2以上のリンクを有する1又は2以上の直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続され、本デバイスは更に、単一の直接相互接続ノードとして機能するように論理的に関連付けられた複数の直接相互接続ポートを備える。
【0015】
別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングを行うコンピュータ実装方法を提供し、該方法は、直接相互接続ネットワーク内の1又は2以上のノードとして機能する専用ゲートウェイデバイスを従来型ネットワーク及び直接相互接続ネットワークに接続するステップと、該ゲートウェイデバイスを用いて、ネットワークトラフィックのヘッダ又はコンテンツに基づいて従来型ネットワークと直接相互接続ネットワークとの間で該ネットワークトラフィックを転送するステップと、を含む。
【0016】
更に別の実施形態では、本発明は、2以上のゲートウェイデバイスによって、従来型ネットワークに位置するリソースがアクセス可能である場合に、どのゲートウェイデバイスがリソースへのアクセスできるようにすべきかを調整するコンピュータ実装方法を提供し、本方法は、(i)従来型ネットワークに位置するリソースへのアクセスを要求するARP、ブロードキャスト、マルチキャスト、又はエニーキャストトラフィックを、各々が該リソースへのアクセスを提供できる2以上のゲートウェイデバイスに1又は2以上のホップを介してリンクされた直接相互接続ポートで受信するステップと、(ii)リソースへのアクセスを可能にすべき2以上のゲートウェイデバイスから最適なゲートウェイデバイスポートを計算するステップと、(iii)トラフィックと、直接相互接続ノードと、該計算された最適ゲートウェイデバイスポートとの間の関連付け情報を生成するステップと、(iv)該関連付け情報を2以上のゲートウェイデバイスの各々に伝達して、計算された最適ゲートウェイデバイスポートがリソースにアクセスできるようにすることを保証するステップと、を含む。リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップは、2以上のゲートウェイデバイスポートのうちのどれが、直接相互接続ポートに最も近いかを判定するステップを含むこと、又は合意アルゴリズムを使用してトラフィックの整合性を保証するステップを含むことができる。関連付け情報を伝達するステップは、専用の又は共有された調整バスによって処理することができる。
【0017】
次に、本発明の実施形態について添付図面を参照して例として説明する。
【図面の簡単な説明】
【0018】
図1】本発明の1つの実施形態によるゲートウェイデバイスの高水準概要である。
図2】いくつかのポートが従来型ネットワークコネクタに接続され、他のポートが、それ自体の専用直接相互接続ASICに接続された状態で従来型ネットワークスイッチASICを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図2b】各直接相互接続ASICが、2以上の直接相互接続ポートに接続され、2以上の従来型ネットワークスイッチASICポートに接続できる場合の本発明の1つの実施形態によるゲートウェイデバイス(図2に示されているものに関連)の概要である。
図2c】従来型ネットワークスイッチASICの機能と1又は2以上の直接相互接続ASICの機能とを組み合わせた単一のスイッチ及び直接相互接続ASICを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図2d】従来型ネットワークポート及び直接相互接続ポートを含むホストインタフェースカードを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図2e】直接相互接続ASIC及び従来型ネットワークコントローラASICの機能が、単一の直接相互接続及び従来型ASICに組み合わされたホストインタフェースカードを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図2f】直接相互接続ポートが、ポート毎に1又は2以上のリンクを含み、ゲートウェイデバイスによってグループに組み合わされて、各グループが、直接相互接続ネットワーク内の単一のノードとして機能するように、ゲートウェイデバイスによって論理的に関連付けられるようになる場合の、本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図3】直接相互接続ポートが受動パッチパネル/ハブに接続された場合の本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図4】直接相互接続ポートが直接相互接続トポロジ内のサーバに取って代わる場合の本発明の1つの実施形態によるゲートウェイデバイスの概要である。
図4b】直接相互接続ポートのリンクが異なるノードに接続される場合の、図4に示されている実施形態を示す。
図5】ゲートウェイ上の直接相互接続ポートが異なる直接相互接続ネットワークにリンクされて、複数の直接相互接続ネットワーク間のブリッジング、スイッチング、又はルーティングが可能になる場合の、本発明の1つの実施形態の概要である。
図6】直接相互接続ネットワーク内のノードの全部又は大部分が、ゲートウェイポートで構成され、他のデバイスの全部又は大部分が、1又は2以上のゲートウェイに直接接続された場合の本発明の1つの実施形態の概要である。
図7】直接相互接続ネットワークにおいて各デバイスから最も近いゲートウェイポートまでの平均距離(ホップでの)をどのようにして最小にするかについての例を提示する。
図8】どの直接相互接続ポートが、同じ直接相互接続ネットワーク内の2以上のポートで受信されたARP要求に応答すべきかを、ゲートウェイがどのようにして調整できるかについての例を提示する。
図8b】調整機能が、直接相互接続ASICにわたって分散され、各直接相互接続ASICが、調整情報及び決定情報を伝達するのに使用される調整バスに接続された場合の調整機構(図8による)の一実施形態の例を提示する。
図9】2以上のゲートウェイが、同じトーラスに接続されている場合に、ゲートウェイが、トーラスのトポロジについてのゲートウェイの情報、並びにARP、ブロードキャスト、マルチキャスト、及びエニーキャストトラフィックへの応答をどのようにして調整できるかを説明する論理ツリーの1つの実施形態を提示する。
図10】中間ゲートウェイノードが、パケットを別のゲートウェイノードにルーティングするのではなく、どのようにしてパケットを処理できるかについての例を提示する。
図11】直接相互接続ASICの好ましい実施形態の動作を説明する。
図12】直接相互接続ASICの好ましい実施形態の動作を説明する。
【発明を実施するための形態】
【0019】
本発明は、従来型ネットワークと直接相互接続ネットワークとの間のブリッジング、スイッチング、又はルーティングが可能な専用デバイス、すなわち、ゲートウェイデバイスを提供する。かかる専用デバイスを使用することにより、直接相互接続ノード上のリソースは、直接相互接続ネットワークと従来型ネットワークとの間のブリッジング、スイッチング、又はルーティングによって負担を受ける必要がなくなり、それによって、I/O性能への影響が最小になる。それに加えて、本ゲートウェイデバイスは、従来技術のゲートウェイノード使用とは対照的に、ネットワーク管理システムによって管理可能な非常に管理しやすいデバイスである。更に、本発明のゲートウェイデバイスは、MACテーブル、並びに複数の直接相互接続ポート間でのARP、ブロードキャスト、マルチキャスト及びエニーキャスト応答の協調を可能にする。
【0020】
図1は、ポートの2つのセットを含む、本発明の1つの実施形態によるゲートウェイデバイス50の高水準概要を示している。ポートの第1のセット(この例では、左端の12個のポート)は、ポート毎に単一のリンク(例えば、SFP+、QSFP、QSFP+コネクタ)を有する標準の従来型ネットワークポート100であり、これらのポートは、従来型ネットワークを形成する既存のスイッチ及び/又はデバイスに接続される。例えば、Closトポロジ(多段回路交換ネットワーク)では、これらのポート100は、スパイン(spine)ポート又はスーパースパインポートに接続される可能性が最も高い。ポートの第2のセット(右端の12個のポート)は、ポート毎に多数(2又は3以上)のリンク(例えば、MXC/MTP/MTOコネクタ)を有する直接相互接続ポート102である。例えば、PCT特許出願公開第WO 2015/027320 A1号において開示されているものと同様の受動パッチパネル/ハブ60が、直接相互接続トポロジをサポートするのに使用される場合には、直接相互接続ポート102は、受動パッチパネル/ハブ60に接続される(図3を参照)。ゲートウェイデバイス50は、1ラックユニット(RU)ラックマウント型デバイス、又は更に、ラックスペースが効率的に節約される1/2RU(又は、それ以外の場合には、必要に応じて)の形態のものであり得る。図2は、従来型ネットワークスイッチ特定用途向け集積回路(ASIC)106からなる実施形態を示しており、従来型ネットワークポート100の第1のセットは各々、従来型ネットワークコネクタに接続され、直接相互接続ポート102の第2のセットは各々、それ自体の専用直接相互接続ASIC104に接続される。これらの専用直接相互接続ASIC104は、好ましくは各々、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースライン(例えば、100Gbpsイーサネット)を通じて送られる直接相互接続ノードとして機能することができる。スイッチASIC106のポートと直接相互接続ASIC104のポートとの間の接続は、100GBase-KR4、100GBase-KP4、40GBase-KR4、25GBase-KR、10GBase-KR、又は任意の他の同様の規格などの任意の標準コンポーネント相互接続を使用して実装することができる。
【0021】
従来型ネットワークスイッチASIC106は、そのポートを介して到達可能なデバイスの学習と、適切な出口ポートを介した受信トラフィックの送信と、ネットワークフィルタリングと、トラフィック検査と、典型的にレイヤ2、レイヤ3及びレイヤ4、並びに上記のネットワークスイッチ、ルータ及びブリッジに見つけられる他の機能とを含む標準のネットワークトラフィック転送機能を含む。転送の決定は、限定されるものではないが、送信元及び送信先レイヤ2(MAC)アドレス、送信元ポートと、送信元及び送信先レイヤ3(IPv4、IPv6など)アドレスと、送信元及び送信先レイヤ4ポートと、レイヤ5及び上記のヘッダ及びデータペイロードとを含む1又は2以上の因子に基づくことができる。
【0022】
スイッチASIC106の標準ポートを介して到達可能な最終送信先を有し、直接相互接続ネットワークから直接相互接続ASIC104で受信されるネットワークトラフィックは、直接相互接続ASIC104からスイッチASIC106に送られ、このスイッチASIC106において、スイッチASIC106標準トラフィック転送機能が、適切な標準ポートを介してトラフィックを送信する。
【0023】
同様に、直接相互接続ASIC104を介して到達可能な最終送信先を有し、標準ポートからスイッチASIC106で受信されるネットワークトラフィックは、スイッチASIC106によって直接相互接続ASIC104に転送される。
【0024】
別の実施形態(図示せず)では、あらゆる可能性のある実施形態に適用可能なものとして、スイッチASIC106(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行できる任意の他のデバイスに置き換えることができることが理解されるであろう。
【0025】
別の実施形態(図示せず)において、あらゆる可能性のある実施形態に適用可能なものとして、直接相互接続ASIC104(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
【0026】
図2bは、各直接相互接続ASIC104が、1又は2以上の直接相互接続ポート102に接続され、1又は2以上の従来型ネットワークスイッチASIC106ポートに接続できる場合の別の実施形態を示している。
【0027】
図2cは、単一のスイッチ及び直接相互接続ASIC105が、従来型ネットワークスイッチASIC106の機能と1又は2以上の直接相互接続ASIC104の機能とを組み合わせる場合の別の実施形態を示している。前と同様に、単一のスイッチ及び直接相互接続ASIC105(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行すること、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
【0028】
図2dは、従来型ネットワークポート及び直接相互接続ポートを含むホストインタフェースカード110の形態でのゲートウェイデバイスの別の実施形態を示している。ホストインタフェースカード110は、PCIe、Gen-Z、又はCCIXなどの通信バス経由でホストデバイスに接続されるように設計される。ホストデバイスは、サーバ、コンピュータ、ハードドライブ、ソリッドステートドライブ、ドライブキャビネット、又はデータを送受信できる任意の他のデバイスとすることができる。従来型ネットワークポートは、標準のネットワークコントローラASIC108(或いは、同様に、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行できる任意の他のデバイスなど)に接続され、直接相互接続ポートは、直接相互接続ASIC104に接続される。また、直接相互接続ASIC104は、ネットワークコントローラASIC108にも接続される。この形態では、ネットワークコントローラSIC108は、ホストによる介入なしに従来型ネットワークと直接相互接続ネットワークとの間でトラフィックを切り替えることができることになる。
【0029】
図2eは、直接相互接続ASIC104及びネットワーク制御ASIC108の機能が、単一の直接相互接続及び従来型ASIC107に組み合わされた別のホストインタフェースカード111の実施形態を示している。前と同様に、単一の直接相互接続及び従来型ASIC107(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行すること、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
【0030】
図2fは、直接相互接続ポート102が、ポート毎に1又は2以上のリンクを含み、ゲートウェイデバイス50によってグループ55に組み合わされた場合の別の実施形態を示している。各グループ55は、直接相互接続ネットワーク内の単一のノードとして機能するように、ゲートウェイデバイス50によって論理的に関連付けられる。
【0031】
図4に示されているように、直接相互接続ポート102及びグループ55は各々、直接相互接続トポロジ内のデバイスの代わりになる。
【0032】
更に別の実施形態では、受動パッチパネル/ハブ60が、直接相互接続で利用されない場合に、各ゲートウェイポート(すなわち、直接相互接続ポート102)の個々のリンクは、直接相互接続の一部分であるデバイスに接続することができる。この点において、図4bは、直接相互接続ポート102のうちの1つのリンクが、直接相互接続ネットワーク内の隣接ノードに個別に接続される場合の実施形態を示している。図4bでは、直接相互接続は、2次元トーラスの形を取り、直接相互接続ポート102を構成する4つのリンクは、1、2、3、及び4と番号付けされている。2次元トーラスが形成されるように、リンク1はデバイスAに接続され、リンク2はデバイスBに接続され、リンク3はデバイスCに接続され、リンク4はデバイスDに接続される。同様に、他のトポロジの場合、直接相互接続ポート102の各リンクは、そのトポロジに必要とされる適切な隣接デバイスに接続される必要がある。
【0033】
図5に示されている更に別の実施形態では、ゲートウェイデバイス50はまた、複数の直接相互接続ネットワーク間のブリッジング、スイッチング、又はルーティングを行うことに使用することもできる。この場合、ゲートウェイデバイス50上の直接相互接続ポート102は、異なる直接相互接続ネットワーク(図5にA及びBとして図示)の間で分割されることになる。直接相互接続ネットワークA内のデバイスの全部が、直接相互接続ネットワークAからゲートウェイデバイス50を介して到達可能であり、逆の場合も同様である。提供される例では、直接相互接続ネットワークA内のデバイスから直接相互接続ネットワークB内のデバイス宛てのトラフィックは、最初に、直接相互接続ネットワークAを通過して、ゲートウェイデバイス50上のA4として示されている直接相互接続ポート102に向かう。次に、ゲートウェイデバイス50は、このトラフィックを、B2として示されている直接相互接続ポート102を介して転送し、次に、このトラフィックは、直接相互接続ネットワークBを介して送信先ノードに転送される。
【0034】
本発明の更に別の実施形態では、ゲートウェイは、アクセススイッチとして使用でき、直接相互接続ネットワークは、バックボーンを形成する(図6を参照)。この場合、直接相互接続ネットワークのノードの全部又は大部分が、ゲートウェイポートから構成され、他のデバイスの全部又は大部分は、ゲートウェイデバイス50の従来型ネットワークポート100に直接接続されることになる。図6に提供される例では、デバイスグループAからデバイスグループB宛てのトラフィックは、最初に、ゲートウェイデバイス50Aに転送される。ゲートウェイ50Aの転送機能は、送信先デバイスが直接相互接続ネットワークを介して到達可能であることを認識して、ゲートウェイデバイス50Aの直接相互接続ポート102のうちの1つを介してトラフィックを転送する。次に、直接相互接続ネットワークが、ゲートウェイデバイス50Bの直接相互接続ポートのうちの1つにトラフィックを転送する。ゲートウェイ50Bの転送機能は、送信先デバイスが、その標準ネットワークポートのうちの1つを介して到達可能であることを認識して、トラフィックを適切に転送する。
【0035】
図7は、単一の直接相互接続展開において、I/Oトラフィック効率が最大になるように、直接相互接続ネットワークにおいて各ゲートウェイデバイス50から最も近いゲートウェイポートまでの平均距離(ホップ数)を最小にするために直接相互接続ポートをどのようにして選択できるかについての例を提示する。図7のように番号付けされたノードを有する4×4 2Dトーラスでは、ゲートウェイをノード1、6、11、及び16として機能させることは、直接相互接続ネットワーク内の他のノードまでの距離を最小にする。しかしながら、当業者であれば、ノードのサブセットが、平均よりも大量のI/Oを生成する傾向がある場合に、ゲートウェイノードの展開はまた、これらのより大量のI/Oノードに近づくように偏る場合があることが理解されるであろう。これらのI/Oノードに最適な位置を決定するのに使用できる複数のアルゴリズムが知られている(例えば、Bae、M.、Bose、B.による、ロスアラミトス(1996年)、Proc. IEEE International Parallel Processing Symposium(IEEE並列処理国際シンポジウム会議記録)、327頁から331頁、IEEE Computer Society Press(IEEEコンピュータソサエティプレス)における「Resource Placement in Torus-Based Networks(トーラスベースのネットワーク内のリソース配置)」と、DiSiow、David A他による、米国、AK、Fairbanks(フェアバンクス)、N.p.、2011.Print.Proceedings of the Cray User Group conference(クレイユーザグループ会議の2011年出版会議記録)(CUG 2011)における「I/O Congestion Avoidance via Routing and Objeoi Placement(ルーティング及びオブジェクト配置によるI/O輻輳回避)」と、Almohammad、B.、Bose、 B.による、ワシントンDC(1998年)、IEEE Computer Society(IEEEコンピュータソサエティ)、Proc. IPPS 1998 Proceedings of the 12th International Parallel Processing Symposium on International Parallel Processing Symposium(IPPS 1998年並列処理国際シンポジウムでの第12回並列処理国際シンポジウムの会議記録)、431頁における「Resource Placements in 2D Tori(2Dトーラスにおけるリソース配置)」と、Dillow、David A.他による、2011年 IEEE 30th International(第30回IEEE国際会議)、Conference Proceedings of the IEEE International Performance, Computing, and Communications Conference(IEEE性能、計算及び通信国際会議(IPCCC)の会議議事録における「Enhancing I/O Throughput via Efficient Routing and Placement for Large-scale Parallel File Systems(大規模並列ファイルシステム用の効率的ルーティング及び配置によるI/Oスループット向上)」と、Ezell、M.他による、2014年5月、Proceedings of the Cray User Group Conference(クレイユーザグループ(CUG)会議の会議記録)における「I/O Router Placement and Fine-Grained Routing on Titan to Support Spider II(Spider IIをサポートするためのTitan上のI/Oルータ配置及びきめの細かいルーティング)」と、Babatunde、A他による、2006年1月、Texas A&M University(テキサスA&M大学)、Department of Computer Science(コンピュータサイエンスの学科)における「I/O Node Placement for Performance and Reliability in Torus Networks(トーラスネットワークにおける性能及び信頼性を高めるI/Oノード配置)」と、を参照)。
【0036】
好ましい実施形態では、直接相互接続ポート102は、標準の直接相互接続ポートとして機能し、直接相互接続ネットワークに残っているトラフィックを自律的に転送する(すなわち、FLIT(フリット)を転送する)。また、直接相互接続ポートは、直接相互接続ネットワークにないデバイス宛てのトラフィックのネットワークパケットにFLITを再結合する(分散直接相互接続ネットワークにおいてパケットをルーティングする最適な方法についてPCT特許出願公開第WO 2015/120539 A1号を参照)。また、ゲートウェイデバイス50は、好ましくは、従来型ネットワークポート100及び直接相互接続ポート102の各々との間でネットワークパケットを送受信する能力を有し、更に、レイヤ2、3に基づいて又は上記のようにこのトラフィックを解釈してそれを転送することができる必要がある。
【0037】
好ましい実施形態では、ネットワーク管理システムがゲートウェイデバイス50を管理することを可能にするための標準のノースバンドネットワーク管理インタフェース(例えば、CLI、OpenFlow、SNMP、RESTなど)が公開される。
【0038】
1つの実施形態では、複数のゲートウェイポートが同じ直接相互接続に接続される場合には、所与のフローからの全てのパケットは、好ましくは、順序どおりのパケット配信を保証することが助長されるように同じゲートウェイポートから出るべきである。
【0039】
ゲートウェイデバイス50は、好ましくは、同じ直接相互接続ネットワークに接続された直接相互接続ポート102間のMAC転送テーブルを集約するように構成される必要がある(すなわち、直接相互接続ポートが、VLAN/MACアドレス/node_idタプルを認識する場合に、このタプルは、好ましくは、同じ直接相互接続ネットワークに接続された他の直接相互接続ポート102と共有される必要がある)。
【0040】
好ましい実施形態では、ARP要求が、同じ直接相互接続ネットワークに接続された直接相互接続ポート102のうちの1又は2以上で受信された場合に、単一の応答のみが送信されることが保証されるように、ゲートウェイ50は、どの直接相互接続ポートが応答すべきかについての決定を調整すべきである(例えば、図8を参照)。このことは、例えば、ARP要求の送信元に最も近い直接相互接続ポートを選択することにより、ARPを受信する最初の直接相互接続ポートを選択することにより、ラウンドロビン選択機構により、ARP要求の一部分(IPアドレス、送信元MACなど)のハッシュにより、又は当業者に公知の別のアルゴリズムにより行うことができる。図8bは、調整機能が、直接相互接続ASIC104にわたって分散され、各直接相互接続ASIC104が、調整情報及び決定情報を伝達するのに使用される調整バス112に接続されたこの調整機構の1つの実施形態を示している。別の実施形態では、この調整機能は、専用調整ASICに集中することができ、各直接相互接続ASIC104は、専用の又は共有された調整バス112を介して調整ASICに接続される。
【0041】
2以上のゲートウェイが、同じトーラスに接続されている場合には、これらのゲートウェイデバイス50は、好ましくは、前述の単一のゲートウェイの場合と同様の方法でトーラスのトポロジについてのゲートウェイデバイスの情報及びARP要求への応答を調整すべきである(このような調整に関する論理ツリーについては図9を参照されたい)。1つの実施形態では、ゲートウェイは、ブロードキャストプロトコルを介して互いに発見することができる。別の実施形態では、ゲートウェイは、他のゲートウェイの位置を認識するように構成することができる。更に別の実施形態では、Raft(ラフト)などの合意アルゴリズムが、ゲートウェイの調整、及びトラフィックとゲートウェイ/ポートとの関連付けの整合性を保証するのに使用することができる(例えば、Ongaro、D.、Ousterhout、J.による、2014年6月19日、PA、Philadelphia(フィラデルフィア)、2014 USENIX Annual Technical Conference(2014 USENIX年次技術会議)における「In Search of an Understandable Consensus Algorithm(Extended Version)(理解可能な合意アルゴリズム(拡張版)の検索において)」と、Woos、D.他による、2016年1月、日本、Certified Programs and Proofs(認証されたプログラム及び証明:CPP)における「Planning for Change in a Formal Verification of the Raft Consensus Protocol(Raft合意プロトコルの形式検証における変化計画)」と、を参照)。
【0042】
一般に、トーラスノードが、1又は2以上のゲートウェイデバイス50を介してアクセス可能なリソースと通信することを望む場合には常に、ゲートウェイは、好ましくは、このリソースにアクセスできるようにするのにどのゲートウェイポートを選択するかを上述したARPの例と同様の方法で調整すべきである。これについての例は、エニーキャスト、ブロードキャスト及びマルチキャストトラフィックと、ノード及びサービス探索プロトコルと、IPv6近隣探索とを含む。
【0043】
更なる考慮事項として、多くの場合、非最小ルーティングが直接相互接続ネットワーク内で使用されることに留意することが重要である。直接相互接続ネットワーク内のゲートウェイは、トポロジ内の複数の位置にゲートウェイポートを有するので、1つのゲートウェイポート宛てのトラフィックが、最初に他のゲートウェイポートのうちの1つを通過する可能性がある。従って、トラフィックがより離れたゲートウェイポートに通過することを可能にするのではなく、単一の最初のゲートウェイポートにトラフィックを処理させることによって効率を高めることが望ましい。このことについての例が、図10に提示されており、この図において、ノード5が、ノード1にトラフィックを送るが、非最小ルーティングにより、パケットは、ノード6を通過することになる。1つの実施形態では、効率を高めるために、ノード6に位置するポートを有するゲートウェイは、パケットが別のゲートウェイポート宛てであることを認識して、ノード2経由で直接相互接続ネットワークを介してパケットを転送するのではなく、このパケットが、あたかもノード6宛てであるようにパケットを処理する。
【0044】
上述のように、直接相互接続ASIC104は、スイッチASIC106と直接相互接続ネットワークとの間の接続性を提供する。当業者が本発明のネットワークゲートウェイデバイスを作製してそれを動作させることができることを保証するために、図11及び図12は、直接相互接続ASIC104の好ましい実施形態の動作を説明する。この動作はまた、必要に応じて任意の修正を加えて、必要に応じて、ASIC105、107、及び108を含む本発明の範囲内の他のASICにも適用可能である。
【0045】
当該技術分野で公知のように、スイッチASIC106は、イーサネットフレームを送受信する。図11は、スイッチASIC106によって生成されたイーサネットフレーム200が、直接相互接続ASIC104によってどのようにして処理されるかを示している。MACアドレスデータベース201は、イーサネットMACアドレスのリストと、各イーサネットMACアドレスに関連する直接相互接続ノードとを含む。スイッチASIC106から受信したイーサネットフレーム200が検査されて、送信元及び送信先MACアドレスが、このフレームのヘッダから取り出される。これらのMACアドレスは、MACアドレスデータベース201に対するインデックスとして使用される。イーサネットフレーム301の送信元MACアドレスは、現在のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース201において生成又は更新される。
【0046】
イーサネットフレーム200の送信先MACアドレスが、MACアドレスデータベース201に存在する場合には、このMACアドレスに関連するノード番号202が、MACアドレスデータベース201から取り出される。次に、ノード番号202は、ソースルートデータベース206へのインデックスとして使用され、ノード番号202に関連するソースルート203が、ソースルートデータベース206から取り出される。当技術分野で公知のように、ソースルートデータベースは、ネットワーク送信先のリストと、ネットワークを通って各送信先に到達するまでの1又は2以上の経路とを含む。ソースルートデータベースは、手動で投入すること、又は公知の自動トポロジ探索及び経路計算アルゴリズムに依拠することができる。次に、イーサネットフレーム200が、FLIT204に変換される。FLITは、直接相互接続ネットワークで使用される特殊なフレームタイプであり、固定サイズ又は可変サイズのいずれかのものとすることができる。好ましい実施形態では、FLITは、固定サイズのものである。別の実施形態では、FLITは、最小サイズ及び最大サイズ内の可変サイズのものである。更に別の実施形態では、FLITは、イーサネットフレーム200がFLITペイロードに正確に適合するようにサイズ設定される。
【0047】
イーサネットフレーム200が、単一のFLITのペイロードよりも大きい場合には、複数のFLIT204が生成されることになる。イーサネットフレーム200が、単一のFLITのペイロードに収まる場合には、単一のFLITが生成されることになる。次に、ソースルート203が、現在のノードのノード番号とともに、FLIT204の最初のもののヘッダに挿入される。次に、FLIT204は、ソースルート203で指定された出口ポート205から送信される。
【0048】
イーサネットフレーム200の送信先MACアドレスが、MACアドレスデータベース201に存在しない場合、又はイーサネットフレーム200の送信先MACアドレスが、このイーサネットフレームがブロードキャストイーサネットパケットであることを示す場合には、イーサネットフレーム200は、上述の場合のようにFLIT204に変換されるが、ソースルートは含まれない。FLIT204が生成されると、最初のFLITのヘッダ内のフラグは、これらのFLITが直接相互接続ネットワーク内のあらゆるノードにブロードキャストされる必要があるであることを示すように設定される。また、生存時間(TTL)値が、最初のFLITのヘッダ内に設定される。TTLは、直接相互接続ネットワークを通ってブロードキャストFLITを転送できる最大回数を定める。1つの実施形態では、エニーキャスト及びマルチキャストイーサネットフレームは、上記のように、これらのフレームがあたかもブロードキャストフレームであるかのように処理される。
【0049】
図12は、直接相互接続ASIC104の好ましい実施形態において、直接相互接続ASIC104が、どのようにFLIT204を処理するかを説明している。直接相互接続ASIC104は、直接相互接続ネットワーク301からFLIT204を受信し、これらのFLITのうちの最初のもののヘッダが検査されて、ブロードキャストフラグが設定されているか否かが調べられる。ブロードキャストフラグが設定されていない場合には、ソースルート203が、最初のFLITから取り出され、このソースルートが、現在のノードがFLIT204の送信先ノードであることを示すか否かが判定される。別の実施形態では、FLITは、送信先ノードのノード番号を含み、このノード番号は、現在のノードがFLIT204の送信先ノードであるか否かを判定するのに使用されるノード番号である。現在のノードが、FLIT204の送信先ノードである場合には、FLIT204は、組み合わされてイーサネットフレーム301が形成される。イーサネットフレーム301の送信元MACアドレスは、最初のFLITのヘッダ内のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース201において生成又は更新される。次に、イーサネットフレーム301は、スイッチASIC106に送信される。
【0050】
ノードが送信先ノードでないと判定された場合には、ソースルートが、FLIT204に対する出口ポート302を決定するのに使用される。次に、FLIT204が出口ポート302から送信される。
【0051】
ブロードキャストフラグが、最初のFLITのヘッダ内に設定されている場合には、FLIT204が組み合わされて、イーサネットフレーム301が形成される。イーサネットフレーム301の送信元MACアドレスは、最初のFLITのヘッダ内のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース301において生成又は更新される。次に、イーサネットフレーム301は、スイッチASIC106に送信される。
【0052】
次に、最初のFLITのヘッダ内のTTLが1だけデクリメントされる。ここで、TTLがゼロに等しい場合には、FLIT204は破棄される。TTLがゼロより大きい場合には、FLIT204は、最初にこのFLIT204を受信した入口ポートを除く全ての出口ポートから送信される。
【0053】
直接相互接続ASIC104の他の実施形態では、ソースルーティングが使用されない場合がある。1つの実施形態では、各ノードは、イーサネットフレーム200の送信先MACアドレスを使用して、ローカルのネクストホップルートルックアップを実行する。別の実施形態では、各ノードは、FLITヘッダ内の送信先ノード情報を使用して、ローカルのネクストホップルートルックアップを実行する。
【0054】
当業者であれば、直接相互接続104及びスイッチASIC106の他の実施形態が、イーサネット以外のプロトコルを用いて動作するように設計できることは明らかであろう。1つの実施形態では、これらの要素は、Gen Zを用いて動作するように設計される。この場合、直接相互接続104は、イーサネットフレームの代わりにGen Z Core64パケットを受信することを予期する。Gen Z GCID(グローバルコンポーネントID)が、イーサネットMACアドレスの代わりに使用され、直接相互接続ノード番号に関連付けられる。
【0055】
本発明の特定の実施形態について説明したが、特許請求の範囲内で実施形態の変更及び修正を行うことができることは当業者には明らかであろう。
【符号の説明】
【0056】
100 従来型ネットワークポート
102 直接相互接続ポート
50A デバイスグループA
50B デバイスグループB
図1
図2
図2b
図2c
図2d
図2e
図2f
図3
図4
図4b
図5
図6
図7
図8
図8b
図9
図10
図11
図12
【手続補正書】
【提出日】2022-07-22
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングの少なくとも1つが可能な専用ネットワークゲートウェイデバイスであって、
ホストインタフェースカードであって
前記直接相互接続ネットワークに接続されるように構成された直接相互接続ポートである第1のポートと、
前記従来型ネットワークを形成するスイッチ及びデバイスの少なくとも1つに接続されるように構成された従来型ネットワークポートである第2のポートと、
前記第1のポート及び前記第2のポートの少なくとも1つに内部接続された少なくとも1つの計算デバイスと、
を備えたホストインタフェースを含み、
前記専用ネットワークゲートウェイデバイスは、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックをブリッジング、スイッチング又はルーティングすることが可能であり、
前記ホストインタフェースカードは、通信バスを介してホストデバイスに接続されるように適合され、
前記少なくとも1つの計算デバイスは、前記ホストデバイスによる介入なしに、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックを切り替えることが可能である、専用ネットワークゲートウェイデバイス。
【請求項2】
前記少なくとも1つの計算デバイスは、
前記第1のポートに内部接続された直接相互接続デバイスと、
前記第2のポートに内部接続され、前記直接相互接続デバイスに内部接続されるネットワークコントローラデバイスと、
を備え、
前記直接相互接続デバイスは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうちの少なくとも1つを含み、
前記ネットワークコントローラデバイスは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうちの少なくとも1つを含み、
前記ネットワークコントローラデバイスは、前記ホストデバイスによる介入なしに、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックを切り替えることが可能である、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項3】
前記少なくとも1つの計算デバイスは、前記第1のポート及び前記第2のポートの各々に内部接続された直接相互接続及び従来型デバイスを含み、
前記直接相互接続及び従来型デバイスは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうちの少なくとも1つを含み、
前記直接相互接続及び従来型デバイスは、前記ホストデバイスの介入なしに、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックを切り替えることが可能である、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項4】
前記第2のポートは、前記従来型ネットワーク内のスイッチポート及びルータポートのうちの少なくとも1つに接続される、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項5】
前記第2のポートは、従来型ネットワークスイッチ特定用途向け集積回路ASIC、ネットワークコントローラASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記従来型ネットワークに接続される、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項6】
前記第1のポートは、専用の相互接続特定集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、受動パッチパネル/ハブ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記直接相互接続ネットワークに接続される、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項7】
前記ネットワークトラフィック転送デバイスは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースを通じて送られる、直接相互接続ノードとして機能することができる、請求項6に記載の専用ネットワークゲートウェイデバイス。
【請求項8】
前記第1のポートは、前記直接相互接続ネットワーク内のデバイスの代わりになる、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項9】
前記第1のポートは、前記直接相互接続ネットワーク内の各々の複数のノード/デバイスに接続される複数のリンクをさらに備える、請求項1に記載の専用ネットワークゲートウェイデバイス。
【請求項10】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングの少なくとも1つが可能な専用ネットワークゲートウェイデバイスであって、
ホストインタフェースカードであって、
前記直接相互接続ネットワークに接続されるように構成された直接相互接続ポートである第1のポートと、
前記第1のポートに内部接続された直接相互接続特定用途向け集積回路(ASIC)と、
前記従来型ネットワークを形成するスイッチ及びデバイスの少なくとも1つに接続されるように構成された従来型ネットワークポートである第2のポートと、
前記第2のポートに内部接続され、前記直接相互接続ASICに内部接続されたネットワークコントローラ特定用途向け集積回路(ASIC)と、
を備えたホストインタフェースを含み、
前記専用ネットワークゲートウェイデバイスは、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックをブリッジング、スイッチング又はルーティングすることが可能であり、
前記ホストインタフェースカードは、通信バスを介してホストデバイスに接続されるように適合され、
前記ネットワークコントローラASICは、前記ホストデバイスによる介入なしに、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックを切り替えるように動作可能である、専用ネットワークゲートウェイデバイス。
【請求項11】
前記第2のポートは、前記従来型ネットワークのスイッチ及びルータポートの少なくとも1つに接続される、請求項10に記載の専用ネットワークゲートウェイデバイス。
【請求項12】
前記第2のポートは、従来型ネットワークスイッチ特定用途向け集積回路(ASIC)、ネットワークコントローラASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記従来型ネットワークに接続される、請求項10に記載の専用ネットワークゲートウェイデバイス。
【請求項13】
前記第1のポートは、専用の相互接続特定集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、受動パッチパネル/ハブ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記直接相互接続ネットワークに接続される、請求項10に記載の専用ネットワークゲートウェイデバイス。
【請求項14】
前記ネットワークトラフィック転送デバイスは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースを通じて送られる、直接相互接続ノードとして機能することができる、請求項13に記載の専用ネットワークゲートウェイデバイス。
【請求項15】
前記第1のポートは、前記直接相互接続ネットワーク内の各々の複数のノード/デバイスに接続される複数のリンクをさらに備える、請求項10に記載の専用ネットワークゲートウェイ装置。
【請求項16】
従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングの少なくとも1つが可能な専用ネットワークゲートウェイデバイスであって、
ホストインタフェースカードであって
前記直接相互接続ネットワークに接続されるように構成された直接相互接続ポートである第1のポートと、
前記従来型ネットワークを形成するスイッチ及びデバイスの少なくとも1つに接続されるように構成された従来型ネットワークポートである第2のポートと、
を備えたホストインタフェースを含み、
前記第1のポート及び前記第2のポートは、直接相互接続及び従来型特定用途向け集積回路(ASIC)に内部接続され、
前記専用ネットワークゲートウェイデバイスは、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックをブリッジング、スイッチング又はルーティングすることが可能であり、
前記ホストインタフェースカードは、通信バスを介してホストデバイスに接続されるように適合され、
前記直接相互接続及び従来型ASICは、前記ホストデバイスによる介入なしに、前記従来型ネットワークと前記直接相互接続ネットワークとの間でネットワークトラフィックを切り替えるように動作可能である、専用ネットワークゲートウェイデバイス。
【請求項17】
前記第2のポートは、前記従来型ネットワーク内のスイッチポート及びルータポートのうちの少なくとも1つに接続される、請求項16に記載の専用ネットワークゲートウェイデバイス。
【請求項18】
前記第2のポートは、従来型ネットワークスイッチ特定用途向け集積回路ASIC、ネットワークコントローラASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記従来型ネットワークに接続される、請求項16に記載の専用ネットワークゲートウェイデバイス。
【請求項19】
前記第1のポートは、専用の相互接続特定集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、受動パッチパネル/ハブ、及びネットワークトラフィック転送デバイスのうち少なくとも1つを介して前記直接相互接続ネットワークに接続される、請求項16に記載の専用ネットワークゲートウェイデバイス。
【請求項20】
前記ネットワークトラフィック転送デバイスは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースを通じて送られる、直接相互接続ノードとして機能することができる、請求項19に記載の専用ネットワークゲートウェイデバイス。
【請求項21】
前記第1のポートは、前記直接相互接続ネットワーク内のデバイスの代わりになる、請求項16に記載の専用ネットワークゲートウェイデバイス。