(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024084781
(43)【公開日】2024-06-25
(54)【発明の名称】決定的ホスト学習及びローカライズされた統合ルーティング及びブリッジングを有するホストルーテッドオーバーレイ
(51)【国際特許分類】
H04L 45/76 20220101AFI20240618BHJP
H04L 45/64 20220101ALI20240618BHJP
【FI】
H04L45/76
H04L45/64
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2024058927
(22)【出願日】2024-04-01
(62)【分割の表示】P 2021533403の分割
【原出願日】2019-08-23
(31)【優先権主張番号】62/722,003
(32)【優先日】2018-08-23
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
(71)【出願人】
【識別番号】521076948
【氏名又は名称】アルカス インコーポレイテッド
(74)【代理人】
【識別番号】100067736
【弁理士】
【氏名又は名称】小池 晃
(74)【代理人】
【識別番号】100192212
【弁理士】
【氏名又は名称】河野 貴明
(74)【代理人】
【識別番号】100200001
【弁理士】
【氏名又は名称】北原 明彦
(72)【発明者】
【氏名】マルホトラ,ニーラジ
(72)【発明者】
【氏名】パテル,ケユル
(72)【発明者】
【氏名】ブッシュ,ランドール
(72)【発明者】
【氏名】ケセイ,シャバ
(72)【発明者】
【氏名】オースティン,ロバート
(72)【発明者】
【氏名】コブル,ハーシャ バルダーン
(57)【要約】 (修正有)
【課題】ネットワークコンピューティング環境における改善されたルーティングアーキテクチャのためのシステム、方法及びデバイスを提供する。
【解決手段】アーキテクチャ400は、仮想顧客エッジルータ(仮想CEルータ)と、複数のホスト仮想マシン(VM)を含むホストルーテッドオーバーレイと、仮想顧客エッジルータから、リーフ/スパインネットワークトポロジ内の1以上のリーフノードL1~L4の1以上へのルーテッドアップリンクと、を含み、仮想顧客エッジルータが、ホストルーテッドオーバーレイの複数のベアメタルサーバに対して、ローカライズされた統合ルーティング及びブリッジング(IRB)サービスを提供する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
仮想顧客エッジルータ、複数のホスト仮想マシン、及びハイパーバイザをそれぞれが実行する複数のベアメタルサーバと、
前記複数のベアメタルサーバの1以上にそれぞれが物理的に接続され、レイヤ3ルータリンクにより前記複数のベアメタルサーバのそれぞれのベアメタルサーバの前記仮想顧客エッジルータに接続された複数のリーフノードと、
を備えるシステムであって、
前記複数のベアメタルサーバのそれぞれのベアメタルサーバの前記仮想顧客エッジルータは、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンのレイヤ2ルートを終端するように構成されることを特徴とするシステム。
【請求項2】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバの前記ハイパーバイザは、レベル3ディスカバリ及びライブネス(L3DL)経由で、前記複数のホスト仮想マシンのローカル仮想マシン(VM)インターネットプロトコル(IP)ホストルートを前記複数のリーフノードにリレーするように構成されることを特徴とする請求項1に記載のシステム。
【請求項3】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバの前記仮想顧客エッジルータは、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンのインターネットプロトコル(IP)アドレス及び媒体アクセスコード(MAC)アドレスを学習するように構成されることを特徴とする請求項1に記載のシステム。
【請求項4】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバの前記仮想顧客エッジルータは、前記それぞれのベアメタルサーバのブートアップ時に、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンのインターネットプロトコル(IP)アドレス及び媒体アクセスコード(MAC)アドレスを学習するように構成されることを特徴とする請求項1に記載のシステム。
【請求項5】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、同じエニキャストゲートウェイインターネットプロトコル(IP)アドレス及び媒体アクセスコード(MAC)アドレスにより構成されることを特徴とする請求項1に記載のシステム。
【請求項6】
前記複数のベアメタルサーバの複数の前記仮想顧客エッジルータは、前記複数のリーフノードでサブネット内フロー及びサブネット間フローの両方のルーティングを実行するように構成されることを特徴とする請求項1に記載のシステム。
【請求項7】
前記複数のリーフノードは、サブネット内フローをルーティングすることにより、サブネット拡張を実行するように構成されることを特徴とする請求項1に記載のシステム。
【請求項8】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンの為のアドレス解決プロトコル(ARP)プロキシとして構成されることを特徴とする請求項1に記載のシステム。
【請求項9】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記それぞれのベアメタルサーバの前記ハイパーバイザ内に存在することを特徴とする請求項1に記載のシステム。
【請求項10】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンの為のデフォルトゲートウェイとして提供されることを特徴とする請求項1に記載のシステム。
【請求項11】
前記複数のリーフノードのそれぞれのリーフノードは、
前記複数のベアメタルサーバの複数の前記仮想顧客エッジルータからルートを学習し、
前記ルートをイーサネット仮想プライベートネットワーク(EVPN)オーバーレイ上でアドバタイズする、
ように構成されることを特徴とする請求項1に記載のシステム。
【請求項12】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、レイヤ2スイッチングを実行するように構成されることを特徴とする請求項1に記載のシステム。
【請求項13】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、統合ルーティング及びブリッジング(IRB)を実行するように構成されることを特徴とする請求項1に記載のシステム。
【請求項14】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記複数のリーフノードのマルチリーフノード上のレイヤ3インターフェースに対して、前記複数のリーフノードの前記マルチリーフノードにマルチホームされることを特徴とする請求項1に記載のシステム。
【請求項15】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、デフォルトルートが前記マルチリーフノードを指すように構成されることを特徴とする請求項14に記載のシステム。
【請求項16】
前記複数のリーフノードのレイヤ3サブネットアドレスは、前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータ上にローカルにスコープされることを特徴とする請求項14に記載のシステム。
【請求項17】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記複数のリーフノードへのデフォルト等コストマルチパス(ECMP)ルートを記憶するように構成されることを特徴とする請求項1に記載のシステム。
【請求項18】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、前記ECMPルートを使用して、前記それぞれのベアメタルサーバの前記複数のホスト仮想マシンから前記複数のリーフノードへ、全てのアウトバウンドサブネット間及びサブネット内トラフィックをルーティングするように構成されることを特徴とする請求項17に記載のシステム。
【請求項19】
前記ECMPルートはレベル3ECMPリンクの為のルートであることを特徴とする請求項18に記載のシステム。
【請求項20】
前記複数のベアメタルサーバのそれぞれのベアメタルサーバのそれぞれの仮想顧客エッジルータは、2つのサブネットを実装し、前記2つのサブネットの1つは、エニキャストゲートウェイを含むことを特徴とする請求項1に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2018年8月23日に出願された米国仮特許出願第62/722,003号「DATABASE SYSTEMS METHODS AND DEVICES」に対する優先権を主張するものであり、この文献は、次の例外を除き、これに限定されるものではないが、以下に具体的に記載される部分を含む全体が参照により本明細書に援用される。前記出願の何れかの部分が本出願と矛盾する場合、本出願の内容が前記出願に優先される。
【0002】
本開示は、コンピューティングネットワークに関し、特にネットワークルーティングプロトコルに関する。
【背景技術】
【0003】
ネットワークコンピューティングとは、複数のコンピュータ又はノードが連携し、ネットワークを介して相互に通信するための手段である。これには、ワイドエリアネットワーク(wide area network:WAN)とローカルエリアネットワーク(local area network:LAN)とがある。ローカルエリアネットワークは、通常、家庭、ビジネス、学校等、より小規模でローカライズされたネットワークに使用される。ワイドエリアネットワークは、都市等の広域をカバーし、異なる国のコンピュータを接続することもできる。通常、ローカルエリアネットワークは、ワイドエリアネットワークよりも高速で安全であるが、ワイドエリアネットワークを使用すると広範囲の接続が可能になる。通常、ローカルエリアネットワークは、展開されている組織内で所有、制御、及び管理され、一方、ワイドエリアネットワークでは、通常、パブリックインターネット経由又は電気通信プロバイダによって確立されたプライベート接続を介して、構成要素である2以上のローカルエリアネットワークを接続する必要がある。
【0004】
ローカルエリアネットワークとワイドエリアネットワークによって、コンピュータを相互に接続し、データやその他の情報を転送できる。ローカルエリアネットワーク及びワイドエリアネットワークの何れにおいても、ある演算インスタンスから別の演算インスタンスにデータを渡すパスを判定する手段が必要である。これは、ルーティングとも呼ばれる。ルーティングとは、ネットワーク内で、複数のネットワーク間で、又は複数のネットワークに亘って、トラフィックのパスを選択するプロセスである。ルーティングプロセスは、通常、様々なネットワーク宛先へのルートの記録を保持するルーティングテーブルに基づいて、転送を指示する。ルーティングテーブルは、管理者が指定してもよく、ネットワークトラフィックを監視して学習してもよく、ルーティングプロトコルの支援を受けて構築してもよい。
【0005】
ネットワークアーキテクチャの1つとして、マルチテナントデータセンタ(multi-tenant datacenter)がある。マルチテナントデータセンタは、パブリッククラウドベース又はプライベートクラウドベースのモデルでのサービス展開に適したエンドトゥエンドシステムを定義する。マルチテナントデータセンタには、ワイドエリアネットワーク、複数のプロバイダデータセンタ、及びテナントリソースが含まれる場合がある。マルチテナントデータセンタは、マルチレイヤ階層ネットワークモデルを含むことができる。マルチレイヤ階層は、コアレイヤ、アグリゲーションレイヤ、及びアクセスレイヤを含むことができる。複数のレイヤは、L2/L3境界があるレイヤ2オーバーレイ及びレイヤ3オーバーレイを含むことができる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
データセンタのオーバーレイルーティングアーキテクチャの1つは、集中型ゲートウェイ(centralized gateway)アーキテクチャである。他のデータセンタオーバーレイルーティングアーキテクチャは、分散型エニキャストゲートウェイ(distributed anycast gateway)アーキテクチャである。これらのアーキテクチャは、後に更に説明するように、多くの欠点がある。
【課題を解決するための手段】
【0007】
以上の観点から、ここでは、改善されたルーティングアーキテクチャのためのシステム、方法、及びデバイスを開示する。
【0008】
本開示の非限定的及び非包括的な実施形態は、以下の図を参照して説明され、これらの図において、同一の参照符号は、特段の指定がない限り、全ての図を通して同一の部分を指す。以下の説明及び添付の図面を参照することにより、本開示の利点がより明瞭に理解される。
【図面の簡単な説明】
【0009】
【
図1】インターネットを介して通信するネットワーク化されたデバイスのシステムの概略図である。
【
図2】従来技術で知られている集中型ゲートウェイデータセンタオーバーレイルーティングアーキテクチャ(centralized gateway datacenter overlay routing architecture)を有するリーフ/スパインネットワークトポロジの概略図である。
【
図3】従来技術で知られている分散型エニキャストゲートウェイデータセンタオーバーレイルーティングアーキテクチャ(distributed anycast gateway datacenter overlay routing architecture)を有するリーフ/スパインネットワークトポロジの概略図である。
【
図4】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図である。
【
図5】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、ブートアップ時のホスト学習を示す図である。
【
図6】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、ローカル転送状態を示す図である。
【
図7】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、リモート転送状態を示す図である。
【
図8A】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、サブネット内サーバローカルフローを示す図である。
【
図8B】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、サブネット間サーバローカルフローを示す図である。
【
図9A】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、アドレス12.1.1.4からアドレス12.1.1.2へのサブネット内オーバーレイフローフォームを示す図である。
【
図9B】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、アドレス12.1.1.4からアドレス10.1.1.2へのサブネット間オーバーレイフローを示す図である。
【
図10】ベアメタルサーバ上の仮想顧客エッジ(CE)ルータゲートウェイにプッシュされる、L2-L3境界におけるオーバーレイルーティングを有するデータセンタファブリックアーキテクチャの概略図であり、サーバリンク障害を示す図である。
【
図11】例示的な演算デバイスの構成要素を示す概略図である。
【発明を実施するための形態】
【0010】
ここでは、ホストマシン上でローカライズされた統合ルーティング及びブリッジング(integrated routing and bridging:IRB)を使用する、インターネットプロトコル(IP)サブネットストレッチのためのルーテッドオーバーレイソリューション(routed overlay solution)のためのシステム、方法、及びデバイスを開示する。ここに開示するシステム、方法、及びデバイスは、ベアメタルサーバ上の仮想顧客エッジ(customer edge:CE)ルータ上に仮想第1ホップゲートウェイ(virtual first hop gateway)を提供する。仮想CEルータは、ローカルホストのためのローカライズされた水平統合(East-West integrated)ルーティング及びブリッジング(IRB)サービスを提供する。一実施形態では、デフォルトのルーテッド等コストマルチパス(ECMP)が、垂直(North-South)及び水平(East-West)接続のために仮想CEルータからリーフノードへのアップリンクを実現する。
【0011】
ここに開示するシステム、方法及びデバイスは、多数のネットワーク化の利点を実現にする。システムは、ルートのアドレス解決プロトコル(address resolution protocol:ARP)ベース学習を必要とせず、決定的ホスト学習(deterministic host learning)を可能にする。ここに説明する改善されたシステムは、エイジアウト(age-out)、プローブ、及び同期を排除し、リーフノード上の媒体アクセス制御(media access control:MAC)エントリを必要としない。改善されたシステムは、更に、リーフノードでの複雑なマルチシャーシリンクアグリゲーション(multi-chassis link aggregation:MLAG)ブリッジング機能を不要にする。更に、ここで説明する仮想CEルータは、リーフノードへのデフォルトECMPルートと共に、ローカルインターネットプロトコル(IP)アドレス及び媒体アクセス制御(MAC)アドレスを格納する。更に、ここで説明する改善されたシステムは、ストレッチされたサブネットのためのリーフノードにおけるホストルーティングを提供し、ホストモビリティを可能にする。
【0012】
イーサネット仮想プライベートネットワーク(Ethernet virtual private network:EVPN)対応のマルチテナントデータセンタオーバーレイ(multiple tenant data center overlay)では、リーフノード上に分散型エニキャストレイヤ3(L3)ゲートウェイ(distributed anycast layer-3 (L3) gateway)を有するアーキテクチャによって、ワークロード用の第1ホップゲートウェイ機能(first hop gateway function)が提供される。これにより、サービスレイヤL2-L3境界(レイヤ2とレイヤ3の境界)がリーフノードまで押し下げられる。換言すれば、ワークロードホスト仮想マシンからの全てのサブネット間仮想プライベートネットワーク(VPN)トラフィックは、リーフノード上でルーティングされる。仮想マシンのモビリティと柔軟なワークロード配置は、ルーテッドネットワークファブリックに亘ってレイヤ2オーバーレイをストレッチすることによって実現される。ストレッチされたレイヤ2ドメインに亘るサブネット内トラフィックは、リーフノード上でオーバーレイブリッジ(overlay bridged)される。リーフノードは、直接接続されたホスト仮想マシンのためのEVPN-IRBサービスを提供する。これにより、全てのオーバーレイサブネット間VPNトラフィックがルーティングされ、ルーテッドファブリックアンダーレイを介して全てのオーバーレイサブネット内VPNトラフィックがブリッジされる。
【0013】
ここで説明する実施形態は、リーフノード上でのオーバーレイブリッジ機能のサポートを不要にする。更に、ここで説明する実施形態は、リーフノードとホストとの間のレイヤ2MLAG接続及び関連する複雑な手順を不要にする。更に、ここで説明する実施形態は、リーフノード上でのデータプレーン及びARPベースのホスト学習を不要にする。ここに開示する実施形態は、これらの利点を実現すると共に、IPユニキャストのサブネット間及びサブネット内VPN接続性、仮想マシンモビリティ、及びストレッチされたIPサブネットに亘る柔軟なワークロード配置を提供する。
【0014】
本開示の実施形態は、ローカルレイヤ2スイッチング及びIRB機能をリーフノードから分離し、ベアメタルサーバ上の小さな仮想CEルータにローカライズする。これは、ベアメタルサーバ上で小さな仮想ルータVMを実行することで実現され、この仮想ルータVMは、ホスト仮想マシンのための第1ホップゲートウェイとして機能し、ベアメタルサーバに対してローカルな仮想マシン間に亘るローカルIRBスイッチングを提供する。この仮想ルータは、リーフノード上のレイヤ3ルーテッドインターフェースを介して複数のリーフノードにマルチホームできる従来型のCEルータとして動作する。ファブリック内のリーフノードは、いかなるレイヤ2ブリッジング又はIRB機能も持たない純粋なレイヤ3VPNPEルータとして機能する。最適なルーティングを提供しながら、DCオーバーレイに亘るレイヤ3エンドポイントの柔軟な配置とモビリティを可能にするために、トラフィックをサブネットルーティングではなくリーフノード上でホストルーティングできる。これは、EVPN-IRBの場合も同様である。
【0015】
ここで説明する改善されたルーティングアーキテクチャ(
図4~
図10参照)は、完全なルーテッドネットワークファブリック(completely routed network fabric)の利点を提供できる。但し、EVPNオーバーレイは、リーフノード上でルーティング機能とブリッジング機能の両方を提供する必要がある。リーフノードからホストへの接続は、レイヤ2ポート経由で行われ、リーフノードは、ローカルレイヤ2スイッチングを提供する必要がある。リーフノードは、2以上のリーフノードに亘るマルチホームホストを可能にするために、専用のMLAG機能又はEVPN-LAG機能をサポートする必要がある。更に、ホスト学習をブートストラップするために、最初に、オーバーレイに亘ってARP要求をフラッディングする必要がある。
【0016】
マルチシャーシリンクアグリゲーション(multi-chassis link aggregation:MLAG)及びイーサネット仮想プライベートネットワークリンクアグリゲーション(ethernet virtual private network link aggregation:EVPN-LAG)ベースのマルチホーミングにより、リーフノード上で複雑なレイヤ2機能をサポートする必要が生じる。ホストMACは、何れかのリーフノードのデータプレーンで学習され、全ての冗長リーフノードに亘って同期される必要がある。ホストARPバインディングは、何れかのリーフノードでARPフラッディングを介して学習され、全ての冗長リーフノードに亘って同期される必要がある。更に、冗長リーフノードに亘るスプリットホライズンフィルタリング(split horizon filtering)メカニズムを介したブロードキャスト、アンノウンユニキャスト(broadcast, unknown-unicast:BUM)トラフィックについて、MLAGトポロジから生じる物理ループを防止する必要がある。更に、BUMパケットが重複してマルチホームホストに転送されることを防ぐために、リーフノード上で指定フォワーダ選択メカニズムをサポートする必要がある。上記のそれぞれに対してEVPN手順が規定されているが、EVPN-IRBベースのソリューションの全体的な実装及び運用の複雑性が全てのユースケースについて望ましいとは限らない。
【0017】
本開示の理解を深めるために、多数のネットワーキング演算デバイス及びプロトコルの幾つかを説明する。
【0018】
コンピュータネットワーク環境では、スイッチ又はルータ等のネットワーキングデバイスを使用して、1つの宛先から最終的な宛先に情報を送信できる。一実施形態では、データパッケージ及びメッセージは、個人の自宅内のコンピュータ等の第1の場所で生成してもよい。データパッケージ及びメッセージは、個人がウェブブラウザとインタラクトし、インターネットを介してアクセス可能なリモートサーバに情報を要求し又は情報を提供することによって生成できる。例えば、データパッケージ及びメッセージは、インターネットに接続されたウェブページ上でアクセス可能なフォームに個人が入力した情報であってもよい。データパッケージ及びメッセージは、個人のコンピュータから地理的に非常に離れた場所にあるリモートサーバに送信する必要がある場合がある。個人の自宅のルータとリモートサーバの間では、直接通信が行われていない可能性が高い。したがって、データパッケージ及びメッセージは、リモートサーバの最終的な宛先に到達するまでに、異なるネットワーキングデバイスを「ホッピング」して移動する必要がある。個人の自宅のルータは、インターネットに接続された複数の異なるデバイスを介してデータパッケージ及びメッセージを送信し、データパッケージ及びメッセージがリモートサーバの最終宛先に到達するまでのルートを判定する必要がある。
【0019】
スイッチ(スイッチングハブ、ブリッジングハブ、又はMACブリッジとも呼ばれる。)は、ネットワークを作成する。殆どの内部ネットワークは、建物又はキャンパス内のコンピュータ、プリンタ、電話機、カメラ、照明、及びサーバを接続するためにスイッチを使用する。スイッチは、ネットワークに接続されたデバイスが相互に効率的に通信できるようにするコントローラとして機能する。スイッチは、パケットスイッチングを使用してコンピュータネットワーク上のデバイスを接続し、これによりデータが受信され、処理され、宛先デバイスに転送される。ネットワークスイッチは、ハードウェアアドレスを使用して、開放型システム間相互接続(Open Systems Interconnection:OSI)モデルのデータリンクレイヤ(レイヤ2)でデータを処理及び転送するマルチポートネットワークブリッジである。一部のスイッチは、ルーティング機能を追加で組み込むことにより、ネットワークレイヤ(レイヤ3)でデータを処理することもできる。このようなスイッチは、一般にレイヤ3スイッチ又はマルチレイヤスイッチと呼ばれている。
【0020】
ルータは、ネットワークを接続する。スイッチ及びルータは、類似する機能を実行するが、ネットワーク上で実行する機能はそれぞれ異なる。ルータは、コンピュータネットワーク間でデータパケットを転送するネットワークデバイスである。ルータは、インターネット上でトラフィックダイレクティング機能(traffic directing function)を実行する。ウェブページ、電子メール、又はその他の形式の情報等、インターネットを介して送信されるデータは、データパケットの形式で送信される。パケットは、通常、インターネットワーク(例えばインターネット)を構成するネットワークを介してあるルータから別のルータに転送されて、最終的に宛先ノードに到達する。ルータは、異なるネットワークからの複数のデータラインに接続されている。データパケットがラインの1つに到着すると、ルータは、パケット内のネットワークアドレス情報を読み取り、最終的な宛先を判定する。次に、ルータは、ルータのルーティングテーブル又はルーティングポリシの情報を使用して、行程上の次のネットワークにパケットを送信する。BGPスピーカは、ボーダゲートウェイプロトコル(Border Gateway Protocol:BGP)がイネーブルにされているルータである。
【0021】
顧客エッジルータ(customer edge router:CEルータ)は、顧客のLANとプロバイダのコアネットワークとの間のインターフェースを提供する、顧客の敷地内にあるルータである。CEルータ、プロバイダルータ、及びプロバイダエッジルータは、マルチプロトコルラベルスイッチングアーキテクチャのコンポーネントである。プロバイダルータは、プロバイダ又はキャリアのネットワークのコアに配置される。プロバイダエッジルータは、ネットワークのエッジに配置される。顧客エッジルータは、プロバイダエッジルータに接続し、プロバイダエッジルータは、プロバイダルータを介して他のプロバイダエッジルータに接続する。
【0022】
ルーティングテーブル又はルーティング情報ベース(RIB)は、ルータ又はネットワークコンピュータに格納されているデータテーブルであり、特定のネットワーク宛先へのルートをリストするものである。ルーティングテーブルには、距離、重み等のルートのメトリックが含まれる場合がある。ルーティングテーブルには、それが格納されているルータの直近のネットワークのトポロジに関する情報が含まれる。ルーティングテーブルの構築は、ルーティングプロトコルの主要な目的である。スタティックルートは、非自動手段によってルーティングテーブルに作成されるエントリであり、何らかのネットワークトポロジディスカバリ手順の結果ではなく、固定されている。ルーティングテーブルは、ネットワークID、メトリック、及びネクストホップのフィールドを含む、少なくとも3つの情報フィールドを含むことができる。ネットワークIDは、宛先サブネットである。メトリックは、パケットが送信されるパスのルーティングメトリックである。ルートは、メトリックが最小のゲートウェイの方向に進む。ネクストホップとは、パケットが最終宛先に送信されるまでの過程における次のステーションのアドレスである。ルーティングテーブルは、更に、ルートに関連付けられたサービス品質、ルートに関連付けられたフィルタリング基準リストへのリンク、イーサネットカードのインターフェース等を含むことができる。
【0023】
ホップバイホップ(hop-by-hop)ルーティングの場合、各ルーティングテーブルには、全ての到達可能な宛先について、その宛先へのパスに沿った次のデバイスのアドレス、すなわち、ネクストホップがリストされる。ルーティングテーブルが一貫していると仮定すれば、パケットを宛先のネクストホップにリレーするアルゴリズムは、ネットワーク内の任意の場所にデータを配信するのに十分である。ホップバイホップは、IPインターネットワークレイヤ及び開放型システム間相互接続(OSI)モデルの特徴の一つである。
【0024】
一部のネットワーク通信システムは、数千の処理ノードを有する大規模な企業レベルのネットワークである。数千もの処理ノードが複数のインターネットサービスプロバイダ(Internet Service Provider:ISP)からの帯域幅を共有し、大量のインターネットトラフィックを処理できる。このようなシステムは、非常に複雑になる可能性があり、許容できるインターネットパフォーマンスを得るために適切に構成する必要がある。システムが最適なデータ伝送のために適切に構成されていないと、インターネットアクセスの速度が低下し、システムの帯域幅消費及びトラフィックが増大する可能性がある。この問題に対し、一連のサービスを実装することによって、これらの懸念を排除又は軽減できる。この一連のサービスは、ルーティング制御とも呼ばれる。
【0025】
ルーティング制御メカニズムの一実施形態は、ハードウェアとソフトウェアとから構成される。ルーティング制御メカニズムは、インターネットサービスプロバイダ(ISP)との接続を介して全ての発信トラフィック(outgoing traffic)を監視する。ルーティング制御メカニズムは、データの効率的な伝送のための最適パスの選択を支援する。ルーティング制御メカニズムは、全てのISPの性能及び効率を計算し、適用可能な領域において最適に動作したISPのみを選択できる。ルート制御デバイスは、コスト、パフォーマンス、及び帯域幅に関する定義済みのパラメータに従って構成できる。
【0026】
等コストマルチパス(equal cost multipath:ECMP)ルーティングは、単一の宛先へのネクストホップパケット転送が複数の「最適パス」に亘って発生する可能性があるルーティング方式である。複数の最適パスは、ルーティングメトリックの計算に基づいて同等である。ルーティングは、単一のルータに限定されたホップ毎の判定であるため、マルチパスルーティングを多数のルーティングプロトコルと共に使用できる。マルチパスルーティングでは、複数のパスに亘ってトラフィックを負荷分散することにより、帯域幅を大幅に増やすことができる。しかしながら、ストラテジを実際に展開する際、ECMPルーティングには、多くの問題が知られている。ここでは、改善されたECMPルーティングのためのシステム、方法、及びデバイスを開示する。
【0027】
本開示に基づく原理の理解を深めるために、以下では、図示の実施形態を参照し、特定の表現を用いてこれを説明する。但し、これは、本開示の範囲を限定することを意図するものではない。ここに例示する本開示の特徴の任意の変更及び更なる修正、並びにここに例示する本開示の原理の任意の追加的な適用は、当業者が本開示に基づいて容易に想到できるものであり、特許請求の範囲に含まれる。
【0028】
ネットワークコンピューティング環境におけるオブジェクトのライフサイクルを追跡するための構造、システム、及び方法を開示及び説明する前に、本開示は、ここに開示される特定の構造、構成、プロセスステップ、及び材料に限定されず、そのような構造、構成、プロセスステップ、及び材料を変更してもよいことを明記する。また、本開示の範囲は、特許請求の範囲及びその均等物によってのみ制限されるものであるため、ここで使用される用語は、特定の実施形態を説明する目的でのみ使用され、限定を意図しないことは当然である。
【0029】
本開示の主題を記述し特許請求する際には、以下に記載する定義に従って、以下の用語を使用する。
【0030】
本明細書及び特許請求の範囲において使用する、単数形(冠詞「a」、「an」、及び「the」)は、文脈における特段の指定がない限り、複数の指示対象を含む。
【0031】
ここで使用する語句「備える」、「有する」、「含む」、「特徴とする」、及びこれらの文法的等価物は、記載されていない追加的な要素又は方法工程を除外しない非排他的又はオープンな用語である。
【0032】
ここで使用する語句「~からなる」及びその文法的等価物は、請求項に記載されていない任意の要素又は工程を除外する。
【0033】
ここで使用される語句「実質的に~からなる」及びその文法的等価物は、特許請求の範囲を、特定された材料又は工程、並びに特許請求された開示の基本的かつ新規な特性又は特徴に実質的に影響しない材料又は工程に限定する。
【0034】
以下の説明は、図面を参照し、
図1は、デバイスをインターネットに接続するためのシステム100の概略図である。システム100は、ここで説明する特定の概念を説明するための背景情報として提示される。システム100は、スイッチ106によって接続された複数のローカルエリアネットワーク110を含む。複数のローカルエリアネットワーク110のそれぞれは、ルータ112によって、公衆インターネットを介して互いに接続可能である。
図1に示す例示的なシステム100は、2つのローカルエリアネットワーク110を有する。但し、公衆インターネットを介して、より多くのローカルエリアネットワーク110を互いに接続してもよい。各ローカルエリアネットワーク110は、スイッチ106によって互いに接続された複数の演算デバイス108を含む。複数の演算デバイス108は、例えば、デスクトップコンピュータ、ラップトップ、プリンタ、サーバ等を含むことができる。ローカルエリアネットワーク110は、ルータ112によって、公衆インターネットを介して他のネットワークと通信できる。ルータ112は、複数のネットワークを互いに接続する。ルータ112は、インターネットサービスプロバイダ102に接続されている。インターネットサービスプロバイダ102は、1以上のネットワークサービスプロバイダ104に接続されている。ネットワークサービスプロバイダ104は、
図1に示すように、他のローカルネットワークサービスプロバイダ104と通信を行う。
【0035】
スイッチ106は、パケットスイッチング(packet switching)を使用してローカルエリアネットワーク110内のデバイスを接続し、これによりデータが受信され、処理され、宛先デバイスに転送される。スイッチ106は、例えば、プリンタを宛先として、コンピュータからデータを受信するように構成できる。スイッチ106は、データを受信し、データを処理し、データをプリンタに送信できる。スイッチ106は、レイヤ1スイッチ、レイヤ2スイッチ、レイヤ3スイッチ、レイヤ4スイッチ、レイヤ7スイッチ等であってもよい。レイヤ1ネットワークデバイスは、データを転送するが、デバイスを通過するトラフィックは管理しない。レイヤ1ネットワークデバイスの例は、イーサネットハブである。レイヤ2ネットワークデバイスは、ハードウェアアドレスを使用してデータリンクレイヤ(レイヤ2)でデータを処理及び転送するマルチポートデバイスである。レイヤ3スイッチは、通常ルータによって実行される機能の一部又は全てを実行できる。但し、一部のネットワークスイッチは、単一タイプの物理ネットワーク、通常は、イーサネットをサポートするように制限されており、一方、ルータは、異なるポート上の異なる種類の物理ネットワークをサポートする場合がある。
【0036】
ルータ112は、コンピュータネットワーク間でデータパケットを転送するネットワーキングデバイスである。
図1に示す例示的なシステム100において、ルータ112は、ローカルエリアネットワーク110間でデータパケットを転送する。但し、ルータ112は、必ずしもローカルエリアネットワーク110間のデータパケットの転送に適用される必要はなく、ワイドエリアネットワーク等の間のデータパケットの転送に使用してもよい。ルータ112は、インターネット上でトラフィックダイレクション機能(traffic direction function)を実行する。ルータ112は、銅ケーブル、光ファイバ、又は無線伝送等の異なるタイプの物理レイヤ接続のためのインターフェースを有してもよい。ルータ112は、異なるネットワークレイヤ伝送規格をサポートできる。各ネットワークインターフェースを使用することによって、データパケットをある伝送システムから別の伝送システムに転送できる。また、ルータ112は、それぞれが異なるネットワークプレフィックスを有する、サブネットと呼ばれるコンピュータデバイスの2以上の論理グループを接続するために使用してもよい。
図1に示すように、ルータ112は、企業内、企業とインターネットとの間、又はインターネットサービスプロバイダのネットワーク間の接続を提供できる。幾つかのルータ112は、様々なインターネットサービスプロバイダを相互接続するように構成してもよく、大規模な企業ネットワーク内で使用してもよい。より小さいルータ112は、一般に、ホームネットワーク及びオフィスネットワークのインターネットへの接続を提供する。
図1に示すルータ112は、エッジルータ、サブスクライバエッジルータ、プロバイダ間ボーダルータ、コアルータ、インターネットバックボーン、ポート転送、音声/データ/ファックス/ビデオ処理ルータ等のネットワーク伝送に適した任意のルータを表すことができる。
【0037】
インターネットサービスプロバイダ(ISP)102は、インターネットへのアクセス、利用、又は参加のためのサービスを提供する組織である。ISP102は、商用、コミュニティ所有、非営利、又は個人所有等の様々な形態で組織化できる。ISP102によって一般的に提供されるインターネットサービスは、インターネットアクセス、インターネット中継、ドメイン名登録、ウェブホスティング、ユースネットサービス、及びコロケーションを含む。
図1に示すISP102は、ホスティングISP、中継ISP、仮想ISP、無料ISP、無線ISP等の任意の適切なISPを表すことができる。
【0038】
ネットワークサービスプロバイダ(NSP)104は、インターネットサービスプロバイダへの直接のインターネットバックボーンアクセスを提供することによって、帯域幅又はネットワークアクセスを提供する組織である。ネットワークサービスプロバイダは、ネットワークアクセスポイント(network access point:NAP)へのアクセスを提供できる。ネットワークサービスプロバイダ104は、バックボーンプロバイダ又はインターネットプロバイダとも呼ばれる。ネットワークサービスプロバイダ104は、電気通信業者、データキャリア、無線通信プロバイダ、インターネットサービスプロバイダ、及び高速インターネットアクセスを提供するケーブルテレビ運営業者を含むことができる。また、ネットワークサービスプロバイダ104は、情報技術業者を含むこともできる。
【0039】
図1に示すシステム100は、単なる例示であり、ネットワークと演算デバイスとの間でデータを伝送するために多くの異なる構成及びシステムを構築できる。ネットワーク形成は、カスタマイズ可能性(customizability)が高いため、コンピュータ間又はネットワーク間でデータを伝送するための最良のルートを判定する際にも、カスタマイズ可能性をより高めることが望まれている。以上の観点から、ここでは、コンピュータ又は特定の企業の特定のグループ化に良好に適合する最適パスアルゴリズムを判定する際に、カスタマイズ可能性をより高めるために、最適パス計算を外部デバイスにオフロードするためのシステム、方法、及びデバイスを開示する。
【0040】
図2は、従来技術で知られている集中型ゲートウェイを有するアーキテクチャ200の概略図である。アーキテクチャ200は、リーフ/スパインネットワークトポロジ内のスパインノード及びリーフノードを含む。サブネット間ルーティングは、スパインノード又はアグリゲーションレイヤで実行される。リーフノードは、複数の仮想マシンに接続される。集中型ゲートウェイアーキテクチャ200は、スパインレイヤ、リーフレイヤ、及びアクセスレイヤを含むことができる。アグリゲーションレイヤにL2-L3境界(L2-L3 boundary)があってもよく、コアレイヤにデータセンタ限界(datacenter perimeter)があってもよい。
図2に示すアーキテクチャでは、スパインS1及びスパインS2を含むスパインレイヤがコアレイヤとして機能してもよい。リーフ(アグリゲーション)レイヤ上には、イーサネット仮想プライベートネットワーク(EVPN)を介するレイヤ2拡張がある。
【0041】
集中型ゲートウェイアーキテクチャ200には、多くの欠点がある。スパインレイヤにL2-L3境界があり、スケールボトルネックが発生する可能性がある。これは、更に、アーキテクチャ200に単一点障害を引き起こす。更に、集中型ゲートウェイアーキテクチャ200のリーフノードでは、多数の動作上の複雑性が存在する。複雑性の1つは、アーキテクチャ200が、MAC及びARPエイジアウト、プローブ、サイレントホスト、及び移動の予測不能な性質に対処しなければならないことである。更に、アーキテクチャ200は、オーバーレイARPをフラッディングし、オーバーレイブリッジに亘って、全てのホストのIP及びMAC転送エントリの両方を移入するように構成する必要がある。更に、アーキテクチャ200は、MLAGについてMACアドレスとARPを同期させ、MLAGについてフィルタリング及び選択を実行するように構成する必要がある。
【0042】
図3は、従来技術で知られている分散型エニキャストルータ上に分散型エニキャストL3ゲートウェイを有するアーキテクチャ300の概略図である。アーキテクチャ300は、ワークロードのための第1ホップゲートウェイ機能を提供する。その結果、L2-L3境界上のサービスレイヤは、リーフノード上の分散型エニキャストルータによってサービスされる。換言すれば、ワークロードホスト仮想マシンからの全てのサブネット間VPN情報トラフィックは、分散型エニキャストルータにおいてルーティングされる。仮想マシンのモビリティと柔軟なワークロード配置は、ルーテッドネットワークファブリックに亘ってレイヤ2オーバーレイをストレッチすることによって実現される。ストレッチされたレイヤ2ドメインに亘るサブネット内トラフィックは、リーフノード上でオーバーレイブリッジ(overlay bridged)される。分散型エニキャストルータは、直接接続されたホスト仮想マシンのためのEVPN-IRBサービスを提供し、全てのオーバーレイサブネット間VPNトラフィックをルーティングし、ルーテッドファブリックアンダーレイに亘って、全てのオーバーレイサブネット内VPNトラフィックをブリッジングしてもよい。
【0043】
アーキテクチャ300は、更に、完全なルーテッドネットワークファブリックを提供するための例示的なアーキテクチャを示している。しかしながら、
図3に示すアーキテクチャ300には、幾つかの欠点がある。例えば、この場合も、EVPNオーバーレイが、分散型エニキャストルータ上でルーティング機能とブリッジング機能の両方を提供する必要がある。更に、分散型エニキャストルータからホストへの接続は、レイヤ2ポート経由で行われ、リーフノードは、ローカルレイヤ2スイッチングを提供する必要がある。リーフノードは、2以上の分散型エニキャストルータに亘るマルチホームホストを可能にするために、専用のMLAG機能又はEVPN-LAG機能をサポートする必要がある。更に、ホスト学習をブートストラップするために、最初に、オーバーレイに亘ってARP要求をフラッディングする必要がある。
【0044】
特に、MLAG又はEVPN-LAGベースのマルチホーミングのために、分散型エニキャストルータで複雑なレイヤ2機能をサポートすることが必要になる。例えば、ホストMACは、何れかのリーフノードのデータプレーンで学習され、全ての冗長分散型エニキャストルータに亘って同期される必要がある。同様に、ホストARPバインディングは、何れかの分散型エニキャストルータでARPフラッディングを介して学習され、全ての冗長分散型エニキャストルータに亘って同期される必要がある。冗長分散型エニキャストルータに亘るスプリットホライズンフィルタリングメカニズムを介したBUMトラフィックについて、MLAGトポロジから生じる物理ループを防止する必要がある。更に、BUMパケットが重複してマルチホームホストに転送されることを防ぐために、分散型エニキャストルータ上で指定フォワーダ選択メカニズムをサポートする必要がある。
【0045】
上記のそれぞれに対してEVPN手順が規定されているが、EVPN-IRBベースのソリューションの全体的な実装及び運用の複雑性が全てのユースケースについて望ましいとは限らない。したがって、ここでは、代替のソリューションを提供及び説明する。例えば、分散型エニキャストルータでオーバーレイブリッジング機能をサポートする必要がなくなる。同様に、このアーキテクチャは、分散型エニキャストルータとホスト間のレイヤ2MLAG接続及び関連する複雑な手順を不要にし、また、分散型エニキャストルータ上のデータプレーン及びARPベースのホスト学習を不要にしながら、IPユニキャストのサブネット間及びサブネット内VPN接続、VMモビリティ、及びストレッチされたIPサブネットに亘る柔軟なワークロード配置を提供する。
【0046】
図4は、決定的ホスト学習及びホストマシン上のローカライズされた統合ルーティング及びブリッジングを有するホストルーテッドオーバーレイのためのアーキテクチャ400の概略図である。アーキテクチャ400は、レイヤ3インターフェースとして機能するリーフノードリンクを有する仮想顧客エッジ(CE)ルータを含む。レイヤ2PE-CEは存在しない。仮想CEルータ上のリーフノードのレイヤ3サブネットアドレスは、ローカルにスコープされ、ボーダゲートウェイプロトコル(BGP)ルーティングにおいて再配布されない。図示のように、仮想CEルータは、ベアメタルサーバ上に配置され、同じくベアメタルサーバ上に配置された1以上の仮想マシンと通信する。一実施形態では、仮想CEルータ及び1以上の仮想マシンは、同じ物理ベアメタルサーバ上に配置される。仮想CEルータは、同じベアメタルサーバ上にある1以上の仮想マシンと通信する。仮想CEルータは、リーフ/スパインネットワークトポロジ内の1以上のリーフノードと通信する。仮想CEルータと通信する各リーフノードは、
図4~
図10に示すように、仮想CEルータへの専用通信回線を有する。レイヤ2とレイヤ3の境界(L2/L3境界)は、仮想CEルータに存在する。
【0047】
図4に示す例では、2つのベアメタルサーバのそれぞれに1つの仮想CEルータがある。ベアメタルサーバは、更に、複数の仮想マシンを含む。一方の仮想CEルータには、エニキャストゲートウェイMAC(Anycast gateway MAC:AGM)10.1.1.1/24及び12.1.1.1/24を含む2個のサブネットがある。エニキャストゲートウェイMAC(AGM)ボックスは、仮想CEルータの内部にある。ベアメタルサーバ上の仮想CEルータと1以上の仮想マシン間のインターフェースは、Linuxハイパーバイザで作成できる。仮想CEルータは、リーフノードへの物理接続を含む。
図4に示す例では、1つの仮想CEルータは、リーフノードL1及びL2への物理接続を含む。これは、アドレス15.1.1.1を有するリーフL1との間の物理接続が、アドレス15.1.1.2を有する仮想CEルータで終端していることによって示されている。これは、更に、アドレス14.1.1.1を有するリーフL2との間の物理接続が、アドレス14.1.1.2を有する仮想CEルータで終端していることによって示されている。これは、更に、アドレス15.1.1.1を有するリーフL3との間の物理接続が、アドレス15.1.1.2を有する仮想CEルータで終端していることによって示されている。これは、更に、アドレス14.1.1.1を有するリーフL4との間の物理接続が、アドレス14.1.1.2を有する仮想CEルータで終端していることによって示されている。
【0048】
図4~
図10に示すアーキテクチャは、
図2及び
図3に示すアーキテクチャを含む従来技術において知られているアーキテクチャよりも多くの利点を有する。従来、レイヤ2リンクは、サーバとリーフノードの間に作成される。このレイヤ2リンクは、従来技術で知られているアーキテクチャにおいて多くの問題を引き起こす。
図4~
図10に示すアーキテクチャは、L2-L3境界を仮想CEルータに移動させ、
図2及び
図3に示すアーキテクチャに存在することが知られている多くの問題を回避する。例えば、仮想CEルータと仮想マシンを同一のサーバボックス上に置くことにより、機能がローカライズされ、従来技術で知られているサーバからリーフノードへのレイヤ2リンクを排除できる。
図4~
図10に示すアーキテクチャは、ベアメタルサーバから複数のリーフノードのそれぞれへのレイヤ3ルータリンクを導入する。これにより、リーフノードの機能が単純化され、各リーフノードでレイヤ2終端を行うことなく同じ機能が実現される。
【0049】
アーキテクチャ400は、リーフノードL1、L2、L3、L4と通信するスパインノードS1、S2を含む。リーフノードL1のアドレスは、15.1.1.1、リーフノードL2のアドレスは、14.1.1.1、リーフノードL3のアドレスは、15.1.1.1、リーフノードL4のアドレスは、14.1.1.1である。ノードL1及びL2は、仮想顧客エッジ(CE)ルータと通信する。仮想CEルータは、仮想マシンと共にベアメタルサーバ上に配置される。ノードL3及びL4は、仮想顧客エッジ(CE)ルータと通信する。L2-L3境界は、仮想CEルータレベルに存在する。仮想CEルータは、図に示すように、VM-a、VM-b、VM-c、VM-d、VM-e、VM-f、VM-g、及びVM-hを含む複数の仮想マシンと通信する。
【0050】
ホスト仮想マシンのIP-MACバインディングは、従来、ARPを介して第1ホップゲートウェイ上で学習される。但し、ストレッチされたサブネットのシナリオでは、ARPベースの学習のために、ARP要求をオーバーレイに亘ってフラッディングして、ローカル仮想CEルータでホスト学習をブートストラップすることが必要になる。これには、レイヤ2オーバーレイフラッドドメインが必要である。リーフノードに亘るレイヤ2オーバーレイ及びARPベースのホスト学習への依存を回避するために、仮想マシン外部インターフェース上に構成されたホスト仮想マシンIP及びMACバインディングは、ハイパーバイザに晒されることによってサーバ上のL3DLによって受動的に学習される必要がある。これにより、直接接続されたホスト仮想マシンのバインディングが常に事前に認識される。また、これにより、収集処理(glean processing)とフラッディングが不要になる。ローカルVM IPホストルート(オーバーレイホストルート)は、L3DLによってハイパーバイザからリーフノードにリレーされる。
【0051】
アーキテクチャ400は、ホストからのレイヤ2を終端する小さな仮想CEルータをサーバ上に導入する。仮想CEルータは、ローカルホスト仮想マシンのためのIRBサービスを提供する。仮想CEルータは、デフォルトルートを介するリーフノードへのECMPレイヤ3リンクを介して、外部ホスト仮想マシンに全てのトラフィックをルーティングする。仮想CEルータは、ホストの起動時にホスト仮想マシンインターフェースのIPアドレスとMACアドレスを学習する。ローカルVM IPホストルート(オーバーレイホストルート)は、L3DLによってハイパーバイザからリーフノードにリレーされる。リーフノードは、ボーダゲートウェイプロトコル(BGP)を介してリモートリーフノードにローカルホストルートをアドバタイズする。
【0052】
一実施形態では、リーフノードにおけるサブネット内フロー及びサブネット間フローの両方のホストルーティングを介してサブネットストレッチが可能になる。仮想CEルータは、リーフノードを介してサブネット内フローをホストルーティングするプロキシARPとして構成される。仮想CEルータは、全ての場所で同じエニキャストゲートウェイIPアドレス及びMACアドレスを使用して構成できる。アーキテクチャ400は、リーフノードにおいて適用されるEVPNホストモビリティ手順を提供する。アーキテクチャ400は、ストレッチされたサブネットに亘る柔軟なワークロード配置及び仮想マシンモビリティを可能にする。
【0053】
アーキテクチャ400では、起動時にエンドツーエンドのホストルーティングが設定される。サブネット間トラフィックフロー及びサブネット内トラフィックフローは、エンドツーエンドのホストルーティングを介して、ストレッチされたサブネットに亘ってイネーブルになる。これは、非決定的なデータプレーン及びARPベースの学習に依存しない。
【0054】
アーキテクチャ400は、L3DLを介して仮想顧客エッジルータ(仮想CEルータ)にローカルホスト学習を提供する。EVPNホストルーティングは、オーバーレイに亘って実行される。EVPNは、レイヤ3ホストモビリティ及びレイヤ3マスウィズドロウ(layer-3 mass withdraw)を有する。アーキテクチャ400は、ボーダゲートウェイプロトコル(BGP)に再配布されないプライベートサブネットを提供する。アーキテクチャ400では、第1ホップエニキャストゲートウェイがローカルIRBサービスを提供する。
【0055】
仮想CEルータは、直接接続された全てのホスト仮想マシンのARPプロキシとして構成でき、これにより、サブネット間トラフィックフロー及びサブネット内トラフィックフローをルーティングできる。仮想CEルータは、仮想CEルータがマルチホームされる一連のアップストリームリーフノードを指すデフォルトルートを使用して構成できる。全てのベアメタルサーバ上で同じエニキャストゲートウェイMACを使用して仮想CEルータを構成することにより、DCファブリックに亘ってホスト仮想マシンのモビリティを実現できる。仮想CEルータは、サーバ側接続サブネットをDC側ルーティングプロトコルに再配布しなくてもよく、これにより、サーバリンクのIPアドレス指定オーバーヘッドが回避される。仮想CEルータは、VLAN内のホスト仮想マシンのためのデフォルトゲートウェイとして提供されたハイパーバイザ内に存在できる。仮想CEルータを独立したルータ仮想マシンとし、ルータ仮想マシンがVLAN内のホスト仮想マシンのためのデフォルトゲートウェイとして提供されるようにしてもよい。
【0056】
一実施形態では、リーフノードは、ローカル接続された仮想CEルータから学習したホストルートを、EVPNオーバーレイに亘って、EVPN RT-5としてアドバタイズする必要がある。EVPNモビリティ手順をEVPN RT-5に拡張して、ホスト仮想マシンモビリティを実現してもよい。EVPNマスウィズドロウ(EVPN mass withdraw)手順をEVPN RT-5に拡張して、コンバージェンスを高速化してもよい。
【0057】
ここで説明する実施形態は、リーフノード上でのオーバーレイブリッジ機能のサポートを不要にする。更に、ここで説明する実施形態は、リーフノードとホストとの間のレイヤ2MLAG接続及び関連する複雑な手順を不要にする。更に、ここで説明する実施形態は、リーフノード上でのデータプレーン及びARPベースのホスト学習を不要にする。ここに開示する実施形態は、これらの利点を実現すると共に、IPユニキャストのサブネット間及びサブネット内VPN接続性、仮想マシンモビリティ、及びストレッチされたIPサブネットに亘る柔軟なワークロード配置を提供する。
【0058】
本開示の実施形態は、ローカルレイヤ2スイッチング及びIRB機能をリーフノードから分離し、ベアメタルサーバ上の小さな仮想CEルータにこれらをローカライズする。これは、ベアメタルサーバ上で小さな仮想ルータVMを実行することで実現され、この仮想ルータVMは、ホスト仮想マシンのための第1ホップゲートウェイとして機能し、ベアメタルサーバに対してローカルな仮想マシン間に亘るローカルIRBスイッチングを提供する。この仮想ルータは、リーフノード上のレイヤ3ルーテッドインターフェースを介して複数のリーフノードにマルチホームできる従来型のCEルータとして動作する。ファブリック内のリーフノードは、いかなるレイヤ2ブリッジング又はIRB機能も持たない純粋なレイヤ3VPNPEルータとして機能する。最適なルーティングを提供しながら、DCオーバーレイに亘るレイヤ3エンドポイントの柔軟な配置とモビリティを可能にするために、トラフィックをサブネットルーティングではなくリーフノード上でホストルーティングできる。これは、EVPN-IRBの場合である。
【0059】
図5は、ブートアップ時のホスト学習を示すアーキテクチャ400の概略図である。L3DLを介して学習されたホスト仮想マシンルートは、FIBにインストールされ、ネクストホップとして仮想CEルータを指す。マルチテナント機能がない場合(VPNなしの場合)、ホスト仮想マシンルートは、BGPグローバルルーティングを介してリモートリーフノードにアドバタイズされる。マルチテナント機能がある場合、ホスト仮想マシンルートは、VXLANやMPLS等のVPNカプセル化を使用して、BGP-EVPN RT-5を介してリモートリーフノードにアドバタイズされる。したがって、他の任意のルーティングプロトコルをオーバーレイルーティングプロトコルとして展開することもできる。
【0060】
一実施形態では、オーバーレイに亘るサブネット拡張は、サブネット内トラフィックを、仮想CEルータでルーティングし、次にリーフノードでルーティングすることによってイネーブルにされる。仮想CEルータでレイヤ2を終端するためには、仮想CEルータをホスト仮想マシンサブネットのためのARPプロキシとして構成し、サブネット内トラフィックとサブネット間トラフィックの両方を仮想CEルータ、次にリーフノードでルーティングできるようにする必要がある。
【0061】
一実施形態では、IPアドレス指定のオーバーヘッドを回避するために、サーバへのレイヤ3リンクに使用されるIPサブネットをローカルにスコープする必要がある。換言すれば、サーバ側接続サブネットがノースバウンドルーティング(northbound routing)プロトコルに再配布されないようにする必要がある。
【0062】
一実施形態では、マルチテナント機能を実現するために、仮想CEルータの第1ホップゲートウェイ上のオーバーレイレイヤ3VLAN/IRBインターフェースをテナントVRFに接続する必要がある。更に、仮想CEルータとリーフノードとの間でルーテッドVXLAN/VNIカプセル化を使用して複数のテナントトラフィックを分離する。更に、リーフノードに送信されたL3DLオーバーレイホストルートをリーフノード上の正しいVPN/VRFテーブルにインストールするには、L3DLオーバーレイホストにレイヤ3VNI IDも含める必要がある。このVNI IDは、ルートを識別して正しいVRFにインストールするためにリーフノードで使用される。
【0063】
図6は、PE分散型エニキャストルータのためのプロトコル600を示す。
図6は、更に、リーフノードL1及びL2の転送テーブルを示す。プロトコル600では、L3DLを介して学習されたホスト仮想マシンルートは、結果として生じるFIB状態における仮想CEルータネクストホップを指すFIBにインストールされる。マルチテナント機能がない場合(VPNなしの場合)、ホスト仮想マシンルートは、BGPグローバルルーティングを介してリモートの分散型エニキャストルータにアドバタイズされる。マルチテナント機能がある場合、ホスト仮想マシンルートは、VXLANやMPLS等のVPNカプセル化を使用して、BGP-EVPN RT-5を介してリモートの分散型エニキャストルータにアドバタイズされる。
【0064】
図7は、ARPプロキシとしての仮想CEルータのためのプロトコル700の概略図である。プロトコル700では、オーバーレイに亘るサブネット拡張は、サブネット内トラフィックを、仮想CEルータでルーティングし、次にリーフノードでルーティングすることによってイネーブルにされる。ハイパーバイザ仮想CEルータでレイヤ2を終端するには、仮想CEルータをホスト仮想マシンサブネットのためのARPプロキシとして構成し、サブネット内トラフィックとサブネット間トラフィックの両方を仮想CEルータ、次に分散型エニキャストルータでルーティングできるようにする必要がある。
【0065】
図8A及び
図8Bは、サーバローカルフローのプロトコルを示している。
図8Aは、サブネット内フローのためのプロトコルを示し、
図8Bは、サブネット間フローのためのプロトコルを示している。仮想CEルータは、マルチホームされている一連のアップストリームリーフノードを指すデフォルトルートを使用して構成される。
【0066】
図8Aに示すプロトコルでは、ホストからホストのフローは、ベアメタルサーバプロトコルに対してローカルであり、一旦仮想CEルータが全てのホストVM隣接関係を学習し、ARPプロキシとして構成されると、ベアメタルサーバに対してローカルなホストVMに亘るサブネット間及びサブネット内フローの両方が、仮想CEルータでレイヤ2終端され、ローカルの宛先ホストVMにルーティングされる。
図8Aにおいて、エニキャストゲートウェイ(AGW)を介して12.1.1.1にオブジェクトを送信するデフォルトゲートウェイ(GW)は、12.1.1.2→veth2、エニキャストゲートウェイ媒体アクセス制御(AGW_MAC)である。
【0067】
図8Bに示すサブネット間フロープロトコルでは、ホストからホストのフローは、ベアメタルサーバプロトコルに対してローカルであり、一旦仮想CEルータが全てのホストVM隣接関係を学習し、ARPプロキシとして構成されると、ベアメタルサーバに対してローカルなホストVMに亘るサブネット間及びサブネット内フローの両方が、仮想CEルータでレイヤ2終端され、ローカルの宛先ホストVMにルーティングされる。
【0068】
図9A及び
図9Bは、オーバーレイフローのためのプロトコルを示す。
図9Aは、12.1.1.4から12.1.1.2へのサブネット内オーバーレイフローのためのプロトコルを示している。
図9Bは、12.1.1.4から10.1.1.2へのサブネット間オーバーレイフローのためのプロトコルを示している。
【0069】
図9Bに示すプロトコルでは、ホストからホストへのオーバーレイサブネット間フローは、リーフノードを通過する。このプロトコルでは、仮想CEルータは、マルチホームされている一連のアップストリーム分散型エニキャストルータを指すデフォルトルートを使用して構成される。ホストVMからの全てのアウトバウンドサブネット間及びサブネット内トラフィックは、
図9A及び
図9Bに示すように、レイヤ2LAGを介してハッシュされる代わりに、この仮想CEによって、L3ECMPリンクを介してアップストリームリーフノードにルーティングされる。リーフノードは、レイヤ2ブリッジング又はIRB機能を全く使用しない純粋なレイヤ3ルータとして動作する。同じリーフノードに接続された複数のサーバに亘る水平(east-west)フローは、リーフノードによって宛先仮想CEネクストホップにローカルにルーティングされる。
【0070】
図9A及び
図9Bに示すプロトコルは、リーフノードを介するホストからホストへのオーバーレイフローを含むことができる。このプロトコルでは、異なる分散型エニキャストルータに接続された複数のサーバを介する水平フロー(サブネット間とサブネット内の両方)は、デフォルトルートを介して仮想CEルータからローカルリーフノードにルーティングされ、次に、リーフノードにおいて、EVPN RT-5を介して学習されたホストルートに基づいて、ルーテッドオーバーレイを介して、宛先/ネクストホップリーフノードにルーティングされる。リーフノードからリーフノードへのルーティングは、サブネットがオーバーレイに亘ってストレッチされていない場合に限り、ホストルートに代えて、集約されたルート又はサブネットルートに基づいて行われる。垂直フロー(DC外部の宛先)は、境界リーフ/DCI GWに向かうリーフノード上のVRF毎のデフォルトルートを介してルーティングできる。
【0071】
図10に示す別のプロトコルは、リーフノードサーバリンク障害を識別する。このプロトコルは、代替となる冗長メカニズムとして使用できる。ルーテッドバックアップリンクは、リーフノード間に設定され、サーバ側のオーバーレイホストルートのバックアップ障害パスとして事前にプログラムされる。リーフノードサーバリンク障害が発生すると、バックアップパスが、同じVLAN(VNI)カプセル化に関連付けられた所定のVRFについて、プレフィックスに依存しない形式でアクティブ化される。
【0072】
図10に示すプロトコルでは、ホストVMからのアウトバウンドトラフィックは、リンク障害に続いて、仮想CEルータが障害発生パスをデフォルトルートECMPパスセットから削除する結果としてコンバージェンスする。DCオーバーレイからのインバウンドトラフィックは、L3DLが学習したホストルートが削除され、影響を受けるリーフノードからウィズドロウされた結果としてコンバージェンスする。但し、このコンバージェンスは、ホストルートスケールに依存する。プレフィックスに依存しないコンバージェンスを実現するには、EVPNマスウィズドロウ(EVPN mass withdraw)メカニズムをIPホストルートに拡張する必要がある。ESI構成は、冗長グループ内の分散型エニキャストルータからのレイヤ3のセットに関連付けられる。ローカルESI到達可能性は、ESI毎のEAD RT-1を介してリモートの分散型エニキャストルータにアドバタイズされる。
図10に示すように、このルートを介して、リモートの分散型エニキャストルータで間接転送(forwarding indirection)が確立され、ESI障害の後、ローカルの分散型エニキャストルータからの単一RT-1ウィズドロウでの高速コンバージェンスが可能になる。
【0073】
図10に示すプロトコルは、サーバリンク障害の場合に実装してもよい。リンク障害に続いて、仮想CEルータが障害発生パスをデフォルトルートECMPパスセットから削除した結果として、ホスト仮想マシンからの発信トラフィックをコンバージェンスさせてもよい。DCオーバーレイからのインバウンドトラフィックは、L3DLが学習したホストルートが削除され、影響を受けるリーフノードからウィズドロウされた結果としてコンバージェンスする。但し、このコンバージェンスは、ホストルートスケールに依存する。プレフィックスに依存しないコンバージェンスを実現するには、EVPNマスウィズドロウメカニズムをIPホストルートに拡張する必要がある。ESI構成は、冗長グループ内のリーフノードからのレイヤ3リンクのセットに関連付けられる。ローカルESI到達可能性は、ESI毎のEAD RT-1を介してリモートリーフノードにアドバタイズされる。このルートを介して、リモートリーフノードで間接転送が確立され、ESI障害の後、ローカルリーフノードからの単一RT-1ウィズドロウでの高速コンバージェンスが可能になる。
【0074】
ホスト仮想マシンからの全てのアウトバウンドサブネット間及びサブネット内トラフィックは、レイヤ2LAGに亘ってハッシュされる代わりに、この仮想CEルータによって、レイヤ3ECMPリンクを介してアップストリームリーフノードにルーティングされる。リーフノードは、レイヤ2ブリッジング又はIRB機能を全く使用しない純粋なレイヤ3ルータとして動作する。同じリーフノードに接続された複数のサーバに亘る水平フローは、リーフノードによって宛先仮想CEルータネクストホップにローカルにルーティングされる。
【0075】
異なるリーフノードに接続された複数のサーバを介する水平フロー(サブネット間とサブネット内の両方)は、デフォルトルートを介して仮想CEルータからローカルリーフノードにルーティングされ、次に、リーフノードにおいて、ルーテッドオーバーレイを介して宛先にルーティングされる。ネクストホップリーフノードは、EVPN RT-5を介して学習されたホストルートに基づく。リーフノードからリーフノードへのルーティングは、サブネットがオーバーレイに亘ってストレッチされていない場合に限り、ホストルートに代えて、集約されたルート又はサブネットルートに基づいて行われる。
【0076】
DC外部の宛先への垂直フローは、リーフノード上のVRF毎のデフォルトルートを介して境界リーフに向けてルーティングしてもよい。
【0077】
別のプロトコルは、単純化及びスケーリング実施形態を提供する。この実施形態では、仮想CE上にローカライズされた第1ホップGWに応答して、リーフノードは、ホストMACルートをインストールせず、分散型エニキャストルータ上の転送リソースを節約する。更に、リーフノード上のデフォルトルーティングでは、仮想CEは、各ベアメタルサーバに対してローカルなホストVMへの隣接関係のみを維持する。これにより、全てのブリッジング及びMLAG機能がリーフノードから完全に削除され、操作が単純になり、信頼性が向上する。仮想CEと分散型エニキャストルータとの間の決定的プロトコルベースのホストルート学習を使用すると、分散型エニキャストルータ上では、EVPNエイリアシング手順が不要になり、仮想CEとリーフノードとの間の決定的プロトコルベースのホストルート学習を使用すると、オーバーレイに亘るARPフラッディングが不要になる。更に、仮想CEと分散型エニキャストルータとの間の決定的プロトコルベースのホストルート学習を使用することにより、未知のユニキャストフラッディングが不要になる。そして、仮想CEとリーフノードとの間のレイヤ3ECMPリンクにより、EVPN DF選定(EVPN DF election)及びスプリット水平フィルタリング手順が不要になる。
【0078】
図11は、例示的な演算デバイス1100のブロック図を示している。演算デバイス1100を使用して、ここで説明するような様々な手順を実行できる。一実施形態では、演算デバイス1100は、非同期オブジェクトマネージャの機能を実行するように機能でき、1以上のアプリケーションプログラムを実行できる。演算デバイス1100は、デスクトップコンピュータ、インダッシュコンピュータ、車両制御システム、ノートブックコンピュータ、サーバコンピュータ、ハンドヘルドコンピュータ、タブレットコンピュータ等の多種多様な演算デバイスの何れであってもよい。
【0079】
演算デバイス1100は、1以上のプロセッサ1102と、1以上のメモリデバイス1104と、1以上のインターフェース1106と、1以上の大容量ストレージデバイス1108と、1以上の入出力デバイス1110と、表示デバイス1130とを含み、これらは、全てバス1112に接続されている。プロセッサ1102は、メモリデバイス1104及び/又は大容量ストレージデバイス1108に格納された命令を実行する1以上のプロセッサ又はコントローラを含む。また、プロセッサ1102は、キャッシュメモリ等の種々のタイプのコンピュータ可読媒体を含むことができる。
【0080】
メモリデバイス1104は、揮発性メモリ(例えば、ランダムアクセスメモリ(random access memory:RAM)1114)及び/又は不揮発性メモリ(例えば、読出専用メモリ(read-only memory:ROM)1116)等の種々のコンピュータ可読媒体を含む。また、メモリデバイス1104は、フラッシュメモリ等の書換可能ROMを含むことができる。
【0081】
大容量ストレージデバイス1108は、磁気テープ、磁気ディスク、光ディスク、ソリッドステートメモリ(フラッシュメモリ等)等の種々のコンピュータ可読媒体を含む。
図11に示すように、具体的な大容量ストレージデバイスは、ハードディスクドライブ1124である。大容量ストレージデバイス1108には、種々のコンピュータ可読媒体からの読出及び/又は種々のコンピュータ可読媒体への書込を可能にするために、種々のドライブを含めることもできる。大容量ストレージデバイス1108は、リムーバブルメディア1126及び/又は非リムーバブルメディアを含む。
【0082】
入出力(I/O)デバイス1110は、データ及び/又は他の情報を演算デバイスに入力し又は演算デバイス1100から取り出すことを可能にする様々なデバイスを含む。I/Oデバイス1110には、カーソル制御デバイス、キーボード、キーパッド、マイクロホン、モニタ又は他の表示デバイス、スピーカ、プリンタ、ネットワークインターフェースカード、モデム等が含まれる。
【0083】
表示デバイス1130は、演算デバイス1100の1人以上のユーザに情報を表示できる任意のタイプのデバイスを含む。表示デバイス1130としては、例えば、モニタ、表示端末、映像投影デバイス等が挙げられる。
【0084】
インターフェース1106は、演算デバイス1100が他のシステム、デバイス、又はコンピューティング環境とインタラクションすることを可能にする様々なインターフェースを含む。インターフェース1106は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、無線ネットワーク、及びインターネットへのインターフェース等、任意の数の異なるネットワークインターフェース1120を含むことができる。他のインターフェースは、ユーザインターフェース1118及び周辺デバイスインターフェース1122を含む。また、インターフェース1106は、1以上のユーザインターフェース要素1118を含むことができる。更に、インターフェース1106は、プリンタ、ポインティングデバイス(マウス、トラックパッド、又は当業者に現在知られている任意の適切なユーザインターフェース、又は今後開発される任意の適切なユーザインターフェース)、キーボード等のためのインターフェース等、1以上の周辺インターフェースを含んでもよい。
【0085】
バス1112は、プロセッサ1102、メモリデバイス1104、インターフェース1106、大容量ストレージデバイス1108、及びI/Oデバイス1110が互いに、及びバス1112に接続された他のデバイス又はコンポーネントと通信することを可能にする。バス1112は、システムバス、PCIバス、IEEEバス、USBバス等の幾つかのタイプのバス構造のうちの1以上を表す。
【0086】
ここでは、説明のため、プログラム及び他の実行可能プログラム構成要素を個別のブロックとして示しているが、このようなプログラム及び構成要素は、演算デバイス1100の異なる記憶構成要素内に様々な時点で存在してもよく、プロセッサ1102によって実行される。これに代えて、ここに記載のシステム及び手順は、ハードウェアで実現してもよく、ハードウェア、ソフトウェア、及び/又はファームウェアの組み合わせで実現してもよい。例えば、ここに記載のシステム及び手順の1以上を実行するように1以上の特定用途向け集積回路(application specific integrated circuit:ASIC)をプログラムできる。
【0087】
上記の記述は、例示及び説明を目的としている。本開示は、ここに説明する詳細な形式に排他的に限定されない。
上記の教示を参照することにより、多くの変更及び変形が可能である。更に、前述の変形例の何れか又は全ては、任意に組み合わせることができ、本開示の更なる組み合わせ例を形成できる。
【0088】
更に、本開示の具体的な実施例を説明及び図示しているが、本開示は、そのように説明及び図示された部分の具体的な形態又は配置に限定されるものではない。本開示の範囲は、本願の特許請求の範囲によって定義され、あるいは、将来に提出される特許請求の範囲、本願に基づく別出願、及びこれらの均等物があれば、これらによって定義される。
【実施例0089】
以下の実施例は、更なる実施形態に関する。
【0090】
実施例1は、システムである。システムは、サーバ上の仮想顧客エッジルータと、複数のホスト仮想マシンを含むホストルーテッドオーバーレイ(host routed overlay)とを含む。システムは、仮想顧客エッジルータから複数のリーフノードの1以上へのルーテッドアップリンクを含む。システムは、仮想顧客エッジルータが、ホストルーテッドオーバーレイの複数のホスト仮想マシンに対して、ローカライズされた統合ルーティング及びブリッジング(integrated routing and bridging:IRB)サービスを提供するように構成されている。
【0091】
実施例2は、ホストルーテッドオーバーレイは、イーサネット仮想プライベートネットワーク(Ethernet virtual private network:EVPN)ホストである、実施例1におけるシステムである。
【0092】
実施例3は、ホストルーテッドオーバーレイは、EVPNレイヤ3モビリティを備える、実施例1~2の何れかに記載のシステムである。
【0093】
実施例4は、仮想顧客エッジルータは、複数のリーフノードの1以上のための第1ホップエニキャストゲートウェイである、実施例1~3の何れかに記載のシステムである。
【0094】
実施例5は、仮想顧客エッジルータは、リーフノードへの等コストマルチパス(equal-cost multipath:ECMP)ルーティングリンクを介して、外部リーフノードにトラフィックをルーティングする、実施例1~4の何れかに記載のシステムである。
【0095】
実施例6は、仮想顧客エッジルータは、ホストルーテッドオーバーレイにおいて、サブネット内フローをホストルーティングするプロキシアドレス解決プロトコル(address resolution protocol:ARP)として構成される、実施例1~5の何れかに記載のシステムである。
【0096】
実施例7は、仮想顧客エッジルータから複数のリーフノードの1以上へのルーテッドアップリンクは、レイヤ3インターフェースである、実施例1~6の何れかに記載のシステムである。
【0097】
実施例8は、仮想顧客エッジルータは、アドレスをローカルに保存し、ボーダゲートウェイプロトコル(Border Gateway Protocol:BGP)ルーティングにおいてアドレスを再配布しない、実施例1~7の何れかに記載のシステムである。
【0098】
実施例9は、仮想顧客エッジルータは、ホストルーテッドオーバーレイのローカルインターネットプロトコル(IP)エントリ、ホストルーテッドオーバーレイの媒体アクセス制御(MAC)エントリ、又はホストルーテッドオーバーレイへのデフォルトECMPルートの1以上を格納するメモリを備える、実施例1~8の何れかに記載のシステムである。
【0099】
実施例10は、ホストルーテッドオーバーレイは、ストレッチされたサブネットに対してホストルーテッドを実行するように構成される、実施例1~9の何れかに記載のシステムである。
【0100】
実施例11は、仮想顧客エッジルータは、単一テナント物理サーバに配置される、実施例1~10の何れかに記載のシステムである。
【0101】
実施例12は、仮想顧客エッジルータは、単一テナント物理サーバ上で実行される仮想ルータ仮想マシンであり、複数のリーフノードの1以上のための第1ホップゲートウェイとして動作するように構成される、実施例1~11の何れかに記載のシステムである。
【0102】
実施例13は、複数のホスト仮想マシンは、単一テナント物理サーバ上に配置される、実施例1~12の何れかに記載のシステムである。
【0103】
実施例14は、仮想顧客エッジルータは、分散型エニキャストルータ上のレイヤ3ルーテッドインターフェースを介して、複数の分散型エニキャストルータにマルチホームされる、実施例1~13の何れかに記載のシステムである。
【0104】
実施例15は、仮想顧客エッジルータは、収集処理及びARPベースの学習に依存せずにローカルホスト仮想マシンルートを学習するように構成される、実施例1~14の何れかに記載のシステムである。
【0105】
実施例16は、仮想顧客エッジルータは、更に、直接接続された分散型エニキャストルータにローカルホスト仮想マシンルートをアドバタイズするように構成される、実施例1~15の何れかに記載のシステムである。
【0106】
実施例17は、仮想顧客エッジルータは、複数のホスト仮想マシンの1以上のIPバインディング及びMACバインディングを、イーサネット上のリンク状態(link state over ethernet:LSoE)を介して学習するように構成される、実施例1~16の何れかに記載のシステムである。
【0107】
実施例18は、仮想顧客エッジルータは、メモリを備え、仮想顧客エッジルータが配置されている同一のベアメタルサーバに対してローカルな1以上のホスト仮想マシンの隣接関係をメモリに格納するように構成される、実施例1~17の何れかに記載のシステムである。
【0108】
実施例19は、分散型エニキャストルータを備え、仮想顧客エッジルータは、仮想顧客エッジルータと分散型エニキャストルータとの間で決定的プロトコルベースのホストルート学習を行うように構成される、実施例1~18の何れかに記載のシステムである。
【0109】
実施例20は、仮想顧客エッジルータから複数のホストマシンの1以上へのルーテッドアップリンクは、レイヤ3等コストマルチパス(ECMP)ルーティングリンクである、実施例1~19の何れかに記載のシステムである。
【0110】
実施例21は、複数のリーフノードの1以上は、仮想プライベートネットワーク-仮想ルーティング及び転送(virtual private network-virtual routing and forwarding:VPI-VRF)テーブルを含む、実施例1~20の何れかに記載のシステムである。
【0111】
実施例22は、複数のリーフノードの1以上は、更に、複数のリーフノードの1以上で使用され、正しい仮想ルーティング及び転送テーブルにルートをインストールするためのレイヤ3仮想ネットワーク識別子(virtual network identifier:VNI)を含む、実施例1~21の何れかに記載のシステムである。
【0112】
なお、上述の構成、実施例、及び実施形態の任意の特徴は、ここに開示する構成、実施例、及び実施形態の何れかから得られる特徴の組み合わせを含む単一の実施形態において組み合わせることができる。
【0113】
ここに開示する種々の特徴は、当技術分野における重要な利点及び進歩を提供する。以下の特許請求の範囲は、これらの特徴の幾つかの例示である。
【0114】
本開示の前述の詳細な説明では、開示を合理化する目的で、開示の様々な特徴を1つの実施形態にまとめている。この開示方法は、特許請求された開示が各請求項において明示的に記載されている特徴よりも多くの特徴を必要とするという意図を反映していると解釈されるべきではない。すなわち、本発明の態様の特徴は、先に開示した単一の実施形態の全ての特徴よりも少ない。
【0115】
上記の構成は、本開示の原理の適用の単なる例示である。当業者は、本開示の思想及び範囲から逸脱することなく、多くの変更及び代替の構成を想到でき、特許請求の範囲は、このような修正及び構成を網羅することを意図している。
【0116】
したがって、本開示を図面に示し、上に詳細に説明しているが、ここに記載されている原理及び概念から逸脱することなく、サイズ、材料、形状、形態、機能、動作、組み立て、及び使用のバリエーションを含むと共に、これらに限定されない多数の変更を想到できることは、当業者にとって明らかである。
【0117】
更に、ここに記載される機能は、適切な場合、ハードウェア、ソフトウェア、ファームウェア、デジタルコンポーネント、又はアナログコンポーネントのうちの1以上において実行できる。例えば、1以上の特定用途向け集積回路(application specific integrated circuit:ASIC)又はフィールドプログラマブルゲートアレイ(field programmable gate array:FPGA)をプログラムして、ここに記載のシステム及び手順の1以上を実行できる。説明及び特許請求の範囲を通して、特定のシステム構成要素を指すために、特定の用語を使用している。構成要素は、異なる名称で呼ぶことができることは、当業者にとって明らかである。本文書は、名称が異なるが機能が同じコンポーネントを区別することを意図していない。
【0118】
上記の記述は、例示及び説明を目的としている。本開示は、ここに説明する詳細な形式に排他的に限定されない。上記の教示を参照することにより、多くの変更及び変形が可能である。更に、前述の変形例の何れか又は全ては、任意に組み合わせることができ、本開示の更なる組み合わせ例を形成できる。
【0119】
更に、本開示の具体的な実施例を説明及び図示しているが、本開示は、そのように説明及び図示された部分の具体的な形態又は配置に限定されるものではない。本開示の範囲は、本願の特許請求の範囲によって定義され、あるいは、将来に提出される特許請求の範囲、本願に基づく別出願、及びこれらの均等物があれば、これらによって定義される。