【文献】
Wenzhi Cui et al.,DiFS: Distributed Flow Scheduling for Adaptive Routingin Hierarchical Data Center Networks,ANCS'14 Proceedings of the tench ACM/IEEE symposium on Architectures for networking and communication systems ,2014年10月21日,P.53-64
【文献】
Fulong Yan et al.,Novel Flat Data Center Network Architecture Based on Optical Switches With Fast Flow Control,IEEE Photonics Journal,2016年 4月,Volume 8, Number 2,P.1-10
(58)【調査した分野】(Int.Cl.,DB名)
複数のサブネットワークを含むサブネットワークグループを複数有するネットワークのための帯域幅要求を判定する方法であって、各サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、前記各サブネットワーク内の前記複数のサーバラックへのトラフィックフロー、および、前記各サブネットワーク内の前記複数のサーバラックからのトラフィックフローを制御するよう構成されている集合スイッチノードを含み、前記ネットワーク内の前記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して互いに光学的に連結され、複数の前記サブネットワークグループの各サブネットワークグループが、前記各サブネットワークグループ内の前記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、前記グループ制御装置は、互いに通信可能に連結され、前記方法は、
第1サブネットワークグループのグループ制御装置において、
前記第1サブネットワークグループの各サブネットワークが前記第1サブネットワークグループ内の他のサブネットワークと前記ネットワーク内の他のサブネットワークグループとに対して持つ帯域幅要求について、前記グループ制御装置が、前記第1サブネットワークグループ内の各サブネットワークの前記集合スイッチノードを監視する段階と、
前記グループ制御装置が、前記ネットワーク内の他のグループ制御装置の各々に前記第1サブネットワークグループの前記各サブネットワークの前記帯域幅要求を伝える段階と
を備える、方法。
他の各サブネットワークグループに対する前記第1サブネットワークグループの前記帯域幅要求と、他の各サブネットワークグループに対する前記第1サブネットワークグループの各サブネットワークの前記帯域幅要求とを類別する段階は、
前記第1サブネットワークグループ内の前記各サブネットワークからの前記帯域幅要求を集約する段階と、
集約された、他のサブネットワークグループに対する前記帯域幅要求をグループごとに判定する段階と
を含む、請求項2に記載の方法。
複数のサブネットワークを含むサブネットワークグループを複数有するネットワークのための帯域幅を割り振る方法であって、サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、前記各サブネットワーク内の前記複数のサーバラックへのトラフィックフロー、および、前記各サブネットワーク内の前記複数のサーバラックからのトラフィックフローを制御するよう構成されている集合スイッチノードを含み、前記ネットワーク内の前記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して、互いに光学的に連結され、複数の前記サブネットワークグループの各サブネットワークグループが、前記各サブネットワークグループ内の前記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、前記グループ制御装置は、互いに通信可能に連結され、前記方法は、
第1サブネットワークグループのグループ制御装置において、
他の各サブネットワークグループのグループ制御装置から、前記第1サブネットワークグループに対する他の各サブネットワークグループの帯域幅要求を受信する段階と、
受信された前記帯域幅要求に基づいて、前記第1サブネットワークグループと他のサブネットワークグループとの間で帯域幅容量を割り振る段階と、
前記第1サブネットワークグループと前記他のサブネットワークグループとの間で割り振られた前記帯域幅容量を他の各グループ制御装置に送信する段階と
を備える、方法。
前記第1サブネットワークグループの前記グループ制御装置が、別のサブネットワークグループに対して割り振られる帯域幅容量が減少していると判定すると、前記第1サブネットワークグループの前記グループ制御装置が、前記減少に適応すべく、前記第1サブネットワークグループの少なくとも1つのサブネットワークの少なくとも1つのインタフェースにおけるトラフィックを休止させる段階を更に備える、請求項5に記載の方法。
前記グループ制御装置が、前記第1サブネットワークグループと前記他のサブネットワークグループの各々との間で割り振られた前記帯域幅容量を前記スイッチ制御装置に送信する段階を更に備える、請求項5に記載の方法。
前記グループ制御装置が、前記第1サブネットワークグループと前記他のサブネットワークグループの各々との間で割り振られた前記帯域幅容量を前記スイッチ制御装置に送信する段階は、前記グループ制御装置が、前記第1サブネットワークグループおよび前記他のサブネットワークグループの各々に前に割り振られた帯域幅容量と、前記第1サブネットワークグループおよび前記他のサブネットワークグループの各々に現在割り振られている帯域幅容量との間における、前記割り振られる帯域幅容量の変化のインジケーションを、前記スイッチ制御装置に送信する段階を有する、請求項7に記載の方法。
前記スイッチ制御装置が、前記グループ制御装置の各々から受信された、前記サブネットワークグループの各々と前記他のサブネットワークグループの各々との間で割り振られる帯域幅容量に関する情報に基づいて、前記少なくとも1つのスイッチの前記帯域幅容量を調節する段階を更に備える、請求項8に記載の方法。
前記複数のサブネットワークグループの各々のための前記グループ制御装置は、高速光接続を用いて、環状または網目状に互いに通信可能に連結される、請求項10に記載のシステム。
所与のサブネットワークの前記集合スイッチノードは、低速光接続を用いて前記グループ制御装置を中心にして、環状接続または星形接続で前記それぞれのサブネットワークグループの前記グループ制御装置に通信可能に連結される、請求項10に記載のシステム。
前記スイッチ制御装置は、前記少なくとも1つのスイッチを集合的に制御する、互いに通信可能に連結されている複数のスイッチ制御装置である、請求項10から13の何れか一項に記載のシステム。
第1サブネットワークグループを制御するよう構成されているグループ制御装置であって、サブネットワークが、複数のサーバラックと定義され、前記グループ制御装置は、複数の集合スイッチノードと通信状態にあり、各集合スイッチノードは、それぞれのサブネットワーク内の複数のサーバラックへのトラフィックフロー、および、それぞれのサブネットワーク内の複数のサーバラックからのトラフィックフローを制御するよう構成され、前記グループ制御装置は、少なくとも1つの他のサブネットワークグループを制御するよう構成されている少なくとも1つの他のグループ制御装置と通信状態にあり、前記サブネットワークグループは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して互いに通信可能に連結され、前記グループ制御装置は、
プロセッサと、
プログラムと
を備え、前記プログラムは、前記プロセッサにより実行されると、前記グループ制御装置に、
前記第1サブネットワークグループ内の各サブネットワークの前記複数の集合スイッチノードを介して、前記第1サブネットワークグループの各サブネットワークが前記少なくとも1つの他のサブネットワークグループの1つまたは複数のサブネットワーク内のサーバラックに対して持つ帯域幅要求を監視することと、
前記少なくとも1つの他のグループ制御装置の各々に前記第1サブネットワークグループの前記サブネットワークの前記帯域幅要求を伝えることと
を行わせる、グループ制御装置。
低速光接続を用いて前記グループ制御装置を中心にして、環状接続または星形接続で前記第1サブネットワークグループ内の前記複数の集合スイッチノードに通信可能に連結される、請求項15から18の何れか一項に記載のグループ制御装置。
【発明を実施するための形態】
【0016】
本開示の1つまたは複数の実施形態の例示的な実装が以下に提供されるが、開示されているシステムおよび/または方法は、現在知られているか既存であるかに関わらず、任意の数の技術を用いて実装され得ることを最初に理解されたい。本開示は、本明細書において図示および説明されている典型的な設計および実装を含む、以下に示される例示的な実装、図面および技術に決して限定されるべきではないが、添付した請求項の範囲内で、均等物の全範囲と併せて修正され得る。
【0017】
複数のサーバネットワークのフォトニックスイッチングシステムを制御するためのアーキテクチャは、集中化および同期されていることが多い。しかしながら、通信ネットワークを介したコンテンツの伝送に対するユーザの要求、および、ペタビット/秒のトラフィックに適応するにまで成長したスイッチングシステムによって、アーキテクチャの変化も必要となる可能性が高い。データセンタで使用されているトップオブラック(TOR)、次世代トップオブラック(ng−TOR)またはエンドオブラック(EOR)のサーバアーキテクチャとインタフェースする256個のエッジスイッチ(または集合スイッチノード)と、(フォトニックファブリックとして)一組のフォトニックスイッチとを有するデータセンタについて考慮されたい。単一の制御装置(例えば、スイッチ制御装置)が、多数のサーバラックのサーバ同士を接続するフォトニックファブリックを通じてトラフィックをスケジューリングするのは困難である。係る配置では、単一の集中制御装置の使用を困難にする問題が2つ生じる。第1の問題は、ネットワーク内の集合スイッチとコアスイッチとの間の伝搬遅延に関連しており、第2の問題は、帯域幅の割り当てに必要な計算のためにサブマイクロ秒の時間枠を確保すべく単一の集中制御装置が利用すべき処理能力に関連する。スイッチ接続性の帯域幅を調節する頻度として、制御周期が定義される。特定の実装によると、制御周期はおよそ1ミリ秒であってよい。この周期は、集合帯域幅の変化があまり速くないことを前提として、帯域幅の変化が調節される時間間隔を表す。スイッチを通じて前の周期のトラフィックを流すこと、および、新たなスイッチ接続を確立することの両方を可能とすべく、当該1ミリ秒の時間枠のうち、およそ10マイクロ秒〜20マイクロ秒のトラフィックの休止があってよい。トラフィックの休止によって、トラフィックの損失を最小限にすること、または、理想的にはなくすことと、スイッチ接続性を変えることとが可能になる。
【0018】
本開示の態様は、大規模なシステムのスイッチング制御の計算複雑性および伝搬遅延の問題の両方に対処する分散型制御アーキテクチャを含む。本開示は、分散型制御アーキテクチャと協働して機能する分散型制御アルゴリズムを含んでもよい。本開示の態様は、以下の特徴、すなわち、大規模な、例えば、以下に限定されるわけではないが、ペタビット/秒の速度をサポートできるもののような高速のフォトニックスイッチシステムを制御するためのスケーラブルな解決手段、分散型処理による分散型制御、伝搬遅延と関連付けられる問題の解消のうちの1つまたは複数を提供してよく、同期フォトニックパケットシステムおよび非同期フォトニックパケットシステムの両方に適用可能であってよい。
【0019】
一般的なデータセンタのネットワーキング環境は、先ほど示した通り、最大で256個の集合スイッチノードを有してよい。各集合スイッチノードが複数のサーバラックに接続される。各集合スイッチノードが、その集合スイッチノードに連結されているサーバラックと、ネットワークの残りの部分にある他の集合スイッチノードに連結されているサーバラックとの間の通信を処理する。集合スイッチノードは、他のグループに伝送されているデータのキューの帯域幅要求状態について詳述したレポートを作成および更新する、集合スイッチノードが関連付けられるサーバラックのトラフィックフローを管理する制御装置と見なされ得る。幾つかの実施形態によると、ネットワーキング環境における集合スイッチノードとフォトニックコアスイッチ(フォトニックセグメント)との間の伝搬遅延は、サーバラックグループを複数組のサーバラックグループにグループ化すること、および、グループ制御装置をそれぞれの組の各々に割り当てることによって、分散型制御アーキテクチャを作成することにより減らすことができる。グループ制御装置は互いに通信し、自らのグループ内の集合スイッチノードと通信し、サーバラック同士を接続するスイッチを制御するスイッチ制御装置と通信する。
【0020】
処理時間は、分散型処理を用いることで減らすことができる。ここでは、各グループ制御装置が、自らのそれぞれのグループ内の一組の集合スイッチノードと通信する。幾つかの実施形態によると、グループ制御装置は、集合ノードの帯域幅要求を監視することと、その情報を集約することと、自らのメンバーが他のグループに対して持つ帯域幅要求を他のグループ制御装置に通知することとを担う。本開示の幾つかの実施形態によると、係る集約レポートを他のグループ制御装置から受信すると、グループ制御装置は、その集約レポートに基づいて自らのメンバーの帯域幅容量を他のグループに割り振ることを担う。本開示の幾つかの実施形態によると、他のグループ制御装置により他のグループに帯域幅容量が与えられると、グループ制御装置は、自らのメンバーに当該容量を割り振ることも担う。
【0021】
本開示の幾つかの実施形態によると、分散型制御アーキテクチャは、網目状または環状の配列を用いてグループ制御装置を互いに相互接続することを含む。集合スイッチノードとグループ制御装置との間の通信に低速光接続が使用され得る。低速光接続は、例えば、2.5Gbpsから10Gbpsであってよい。幾つかの実施形態によると、グループ制御装置は、グループ制御装置と集合スイッチノードとの間の伝搬遅延を減らすべく、自らが関連付けられるグループ内のサーバラックの集まりに近接して配置される。グループ制御装置間の通信に、より速い速度の光接続が使用され得る。より速い速度の光接続は、例えば、10GHzから100GHzであってよい。グループ制御装置は、星形または環状の配列を用いて、グループ制御装置と関連付けられるグループ内の集合スイッチノードに接続され得る。グループ制御装置は、集積回路カードまたはいわゆる「ピザボックス」サーバ機器の形で実装され得る。
【0022】
集合スイッチノードは、フォトニックスイッチに/からフォトニックフレームを送信および受信するための制御回路およびフォトニックフレーミング回路の両方を実装すべく、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)を用いた集積回路カードの形で実装され得る。
【0023】
図1は、分散型制御アーキテクチャの一部である単一の
サブネットワークグループ10の例を示している。グループ10は、複数のポッド20a、20b、20c、20dにそれぞれが連結されている、複数の光クロスコネクトスイッチ(OXC)15a、15b、15cを含む。ポッドという用語は、サーバラックグループを指すために使用されており、各サーバラックが複数のサーバをサポートすることができる。ポッドはデータセンタ環境におけるサーバラックグループに共通の用語であるが、より一般的に、本明細書におけるポッドはサブネットワークと呼ばれ得る。例えば、ポッド20dは、複数のサーバラック30a、30b、・・・、30cの各々に接続されている集合スイッチノード(AN)25dを含む。集合スイッチノード25dは、サーバラック30a、30b、・・・、30cからのトラフィックを集約することを担っており、光クロスコネクトスイッチ15a、15b、15cへのインタフェースである。ポッド20a、20bおよび20cはそれぞれ、それぞれの集合スイッチノード25a、25bおよび25cを含んでいるが、ポッド20a、20bおよび20cにはサーバラックが示されていない。グループ10は、グループ制御装置35も含む。グループ制御装置35は、後ほど更に詳しく説明する通り、グループ10内の集合スイッチノード25a、25b、25c、25d、並びに、他のグループのグループ制御装置、およびスイッチ制御装置(
図1には図示せず)と通信する。
【0024】
図2は、分散型制御アーキテクチャの一部である複数のグループ210、215の例を示している。グループ210、215の各々が、先ほど
図1に関して説明したのと同様の特徴を含んでいるため、これらのグループについては再び詳しく説明しない。
図2には集合スイッチノードの各々と光クロスコネクトスイッチとの間の接続が示されていないが、それらの要素間に接続性が存在するであろうことは解る。グループ210および215の光クロスコネクトスイッチは、光ネットワーク230を介して互いにインタフェースする。各グループ内の光クロスコネクトスイッチを制御するスイッチ制御装置212、217が、グループ210および215の各々にそれぞれ示されている。スイッチ制御装置212、217は、グループ制御装置と連携してスイッチをセットアップしてよい。スイッチ制御装置とグループ制御装置とは共に接続され、共に分散型アーキテクチャを形成する。グループ210および215はそれぞれスイッチ制御装置を含んでいるが、全ての
グループがスイッチ制御装置を有するわけではないことを理解されたい。1つまたは複数の近隣グループ内のスイッチを制御するために、1つのグループ内のスイッチ制御装置が使用され得る。ある実際の実装によると、先ほど説明した複数のポッドグループが集合的にデータセンタの一部と見なされ得る。これらのグループは、必ずしも同じ物理的場所に並べて配置されなくてもよいが、およそ2キロメートルの近さにある幾つかの物理的場所に配置され得る。本開示のある実際の実装によると、自らの関連付けられる集合スイッチノードをそれぞれが有する、多数、例えば、32個から256個、場合によってはそれより多くのサーバラックが考慮される。幾つかの実施形態によると、各集合スイッチノードが、所与のスイッチへのインタフェースを16個以上有することで、32倍速のインタフェース速度容量(内外)を実現する。
【0025】
ここで
図3を参照して、分散型制御アーキテクチャにおける様々な要素の接続性のブロック図について説明する。スイッチ制御装置310が、G個のグループ制御装置315a、315b、315c、315d、315e、315fの各々に星形接続で通信可能に連結された状態で示されている。ここで、スイッチ制御装置310は中心にある。グループ制御装置315a、・・・、315fは、グループ制御装置の各々が、隣接する2つのグループ制御装置に連結されるように、環状接続で互いに通信可能に連結される。例えば、グループ制御装置315aが、グループ制御装置315bおよびグループ制御装置315fに通信可能に連結される。各グループ制御装置が、N個の集合スイッチノードに通信可能に連結される。例えば、グループ制御装置315aが、集合スイッチノード320a、325a、330aおよび335aに通信可能に連結される。
【0026】
図3は制御接続性のみを示している。スイッチに対するスイッチ制御装置の接続性も、スイッチに対するグループ制御装置の接続性も、スイッチに対する集合スイッチノードの接続性も、関連付けられるサーバラックに対する集合スイッチノードの接続性も示されていない。
【0027】
それぞれのグループのグループ制御装置の各々が、そのグループに属する集合スイッチノード全てのための集中制御装置である。
図3は星形配列でグループ制御装置に接続されている集合スイッチノードの各々を示しているが、グループ制御装置は代わりに、例えば、環状配列で集合スイッチノードに接続され得る。
【0028】
図3は環状配列で互いに接続されているグループ制御装置を示しているが、グループ制御装置は代わりに、例えば、網目状配列で接続され得る。グループ制御装置は、伝搬遅延の影響を最小限にすべく互いに接続される。
【0029】
図3は単一のスイッチ制御装置に接続されているグループ制御装置を示しているが、1つより多くのスイッチ制御装置があってよい。更に、スイッチ制御装置は集中型であってもよいし、分散型であってもよい。一組のグループ制御装置および一組のスイッチ制御装置はどちらも、非限定的な例として、環状などの接続方式で接続され得る。
【0030】
図3におけるグループ制御装置の数Gおよび集合スイッチノードの数Nはそれぞれ、実装ごとに決まる。従って、本明細書において説明されている分散型アーキテクチャは、更なるサーバラックグループがネットワーキング環境に追加される際に更なるグループ制御装置が追加され得る「従量制(pay−as−you−grow)」機能を実現する。
【0031】
図4は、本開示の実施形態に従って使用され得る制御アルゴリズムの複数の機能について一般的に説明したフローチャート400である。フローチャート400内の機能は、グループ制御装置により実行される制御アーキテクチャの様々な態様について説明している。これらの様々な機能については、
図4の説明後に以下で更に詳しく説明する。
【0032】
グループ制御装置の各々がフローチャート400の機能を実行できることを理解されたい。これらの機能は、必ずしも全てが
図4のフローチャートで説明されている特定の順序で実行または形成されなくてよいことも理解されたい。故に、
図4は、フローチャートに示されているような一貫性のある逐次的なやり方で常に実行される段階の具体的な「開始から終了までの(start−to−finish)」リストとは対照的に、グループ制御装置の機能の総体的な説明と見なされ得る。
【0033】
段階410に示されている第1の機能は、ネットワーク内の全てのサーバラック間で帯域幅容量が均等に割り振られる均衡なシステムから開始すべく、最初に全てのグループ間で均等な接続性を割り当てる段階を含む。係る接続性の割り当ては、ネットワークがオンライン状態になる時に、または、動作中の他のタイミングで、例えば、サーバラックがより均衡な分配のために再編成される場合またはときに実行され得る。ネットワークの動作中、グループ間で割り当てられるおよび割り振られる帯域幅は、経時的に変化する。グループ間で割り当てられるおよび割り振られる帯域幅の均衡がひどく崩れた場合は、均衡性を向上させるべく、必要または所望に応じて、グループのメンバーが潜在的に再分散され得る。
【0034】
段階420では、グループ制御装置の各々が他のグループ制御装置に関連情報を伝送する機会を少なくとも一度は持つことを保証すべく、割り振り周期、ポーリング周期がセットアップされ得る。ポーリング周期内の割り振り時間に、ネットワーク内でアクティブであることが分かっている各グループ制御装置は、それぞれのアクティブなグループ制御装置が他のアクティブなグループ制御装置の帯域幅需要を認識するように、他のアクティブなグループ制御装置に関連情報を伝送するようスケジューリングされる。グループ制御装置が自らのグループの帯域幅需要を伝送していないか、または、他のグループの帯域幅需要を受信していない場合は、グループ制御装置が、後ほど更に詳しく説明される、帯域幅を監視する段階および割り振る段階を実行している可能性がある。場合によっては、グループ制御装置は、情報の伝送または他のグループ制御装置からの情報の受信と、以下の段階のうちの1つまたは複数の実行を同時に行うことができるかもしれない。
【0035】
フローチャート400の段階430は、要求に基づいてグループからグループへの帯域幅を監視する段階を含む。グループ制御装置は、グループの集合スイッチノードごとに、グループ内のサーバおよび他のグループ内のサーバに対する帯域幅要求を判定し、他のグループのグループ制御装置に他のグループに対する要求を転送する。
【0036】
フローチャート400の段階440は、他のグループから受信された帯域幅要求に基づいて、各グループ制御装置が、自らの帯域幅容量のうちの公平な相当分を他のグループに割り振る段階を含む。
【0037】
フローチャート400の段階450は、各グループ制御装置が、割り振られた帯域幅容量に基づいて、グループからグループへの接続性の変化、または、グループからグループへの接続のデルタ帯域幅を計算する段階を含む。各グループ制御装置が、グループからグループへの接続性のこのデルタ帯域幅をスイッチ制御装置に提供する。
【0038】
フローチャート400の段階460は、他のグループにより割り振られた帯域幅容量をグループ内で割り振る段階を含む。グループ制御装置は、グループの集合スイッチノードに対するグループからグループへの帯域幅の公平な分配を計算する。集合スイッチノードは、集合スイッチノードにより管理されるサーバに対して割り振られる帯域幅を制御する。
【0039】
フローチャート400の段階470では、スイッチ接続性が二段階で、すなわち、グループからグループへの大規模な変化、および、グループ内部における(グループ内で)変化という形で変化し得る。グループからグループへのスイッチ接続性は、スイッチ制御装置により調節される。グループ内の接続性は、
図5A、
図5Bおよび
図5Cに関して後ほど説明する通り、スイッチの入力における1×Nのスイッチング素子、および、出力におけるN×1のスイッチング素子により調節される。グループからグループへの変化については、1つのグループから帯域幅を取って、それを別のグループに与えるとき、インタフェース接続を失うグループ制御装置が、それが失われる前にトラフィックが当該インタフェース上にないことを確認する。
【0040】
グループ内の帯域幅、すなわち、メンバーからグループへの、または、グループからメンバーへの帯域幅の変化は、割り振られる期間ごとに大幅に変わる傾向があり得る。しかしながら、グループからグループへの変化は、グループ間の全帯域幅の変化であり、経時的にゆっくり変化するものと見なされる。割り振られる期間ごとのこうした変化は通常、大きな変化ではない。例えば、第1割り振り期間では、第1グループ内の3つのメンバーが第2グループ内の3つのメンバーへの伝送を望むかもしれず、第2割り振り期間では、第1グループ内の3つの異なるメンバーが第2グループ内の3つの異なるメンバーへの伝送を望むかもしれない。これら3つの通信により使用される全帯域幅が両方の割り振り期間において同じであるような状況では、トラフィックが依然として第1グループから第2グループにルーティングされているため、グループからグループへ割り振られる帯域幅が同じになる。しかしながら、異なるメンバーが帯域幅を利用しているために、各期間におけるメンバーからグループへの帯域幅の割り振りは異なる。
【0041】
帯域幅容量が割り振られた後のある時点で、集合ノードの各々が、段階420の機能に取り込まれている、グループを管理するグループ制御装置に送信され得る新たなレポートを作成してよい。
【0042】
図5Aは、4つのサーバラックポッドグループ510、520、530、540があるスイッチング構成の例である。ここでは、各グループが4つのサーバラックポッドを含んでおり、合計で16個のポッドとなる。
図5Aでは、各ポッドが自らの対応する集合スイッチノード510A、・・・、510D、520A、・・・、520D、530A、・・・、530D、540A、・・・、540Dで表されている。これらの集合スイッチノードは、4つの16入力16出力スイッチ550、552、554、556に連結される。
図5Aでは、各スイッチが、集合スイッチノードの1つ1つに結合する16個の入力を含むように示されている。従って、第1の4つの入力が第1グループ510内の集合スイッチノードに対応しており、次の4つの入力が第2グループ520内の集合スイッチノードに対応しており、次の4つの入力が第3グループ530内の集合スイッチノードに対応しており、最後の4つの入力が第4グループ540内の集合スイッチノードに対応している。スイッチの出力は、4つのグループ510、520、530、540の集合スイッチノードと同様に配置される。スイッチの入力と出力との間の接続は、グループごとに1つのプレーン、4つの別々のプレーン551A、551B、551C、551Dとして示されている。ここでは、各プレーンが4つの接続、すなわち、集合スイッチノードごとに1つの接続を有する。
【0043】
図5Aは、グループからグループへの均衡なトラフィックを表している。第1スイッチ550では、第1グループ510から受信される4つのスイッチ入力が、第1グループ510に出力される4つのスイッチ出力にルーティングされており、同様に、第2、第3および第4グループ520、530、540からの入力が、第2、第3および第4グループ520、530、540にそれぞれルーティングされている。第2スイッチ552では、第1グループ510から受信される4つのスイッチ入力が、第2グループ520に出力される4つのスイッチ出力にルーティングされており、同様に、第2、第3および第4グループ520、530、540からの入力が、第3、第4および第1グループ530、540、510にそれぞれルーティングされている。第3スイッチ554では、第1グループ510から受信される4つのスイッチ入力が、第3グループ530に出力される4つのスイッチ出力にルーティングされており、同様に、第2、第3および第4グループ520、530、540からの入力が、第4、第1および第2グループ540、510、520にそれぞれルーティングされている。第4スイッチ556では、第1グループ510から受信される4つのスイッチ入力が、第4グループ540に出力される4つのスイッチ出力にルーティングされており、同様に、第2、第3および第4グループ520、530、540からの入力が、第1、第2および第3グループ510、520、530にそれぞれルーティングされている。
【0044】
図5Aのスイッチ550は、入力に4つの4×1スイッチ550A、550B、550C、550D、出力に4つの1×4スイッチ550E、550F、550G、550Hを含む。スイッチの内側にある各プレーン上の4つの接続の間では、各4×1スイッチによって、グループの入力をメンバーからグループへルーティングすることが可能となる(各1×4スイッチによって、グループの出力をグループからメンバーへルーティングすることが可能となる)。他の3つのスイッチ552、554、556も同様に動作する。
【0045】
4×1スイッチおよび1×4スイッチがコアスイッチの一部であり、コアスイッチと並べて配置されてもよいし、これらのスイッチが、グループ化された集合ノードと並べて配置されてもよいことを理解されたい。
【0046】
図5Bは、
図5Aの配置と同様のアーキテクチャを有するスイッチング構成の例であるが、
図5Bでは、グループからグループへのトラフィックの均衡がとれていない。特に、第1グループ510のサーバラックのトラフィックは、他のグループ520、530、540の全てに対して均衡がとれているわけではない。第1グループ510のトラフィックは、第4グループ540の集合ノードにだけルーティングされている。第1スイッチ
550では、第1グループ510から受信される4つのスイッチ入力が、第4グループ540に出力される4つのスイッチ出力にルーティングされている。他の3つのスイッチ552、554、556も同様の接続性を示している。
図5Bには、グループからグループへのトラフィックの不均衡が経時的に起こり得るようなシナリオを示すことを意図して、他のグループ内の他の集合スイッチノードのルーティングが示されていない。グループからグループへの接続性は一般的に経時的にゆっくりと変化する。そのため、トラフィックが1つの割り振り期間から次の割り振り期間にかけて
図5Aに示されているような均衡な状態から
図5Bに示されているような不均衡な状態に変化する可能性は低い。しかしながら、係る変化は、十分に長い期間にわたって潜在的に起こり得る。不均衡なトラフィック構成が検出された場合は、グループ内のサーバラックを再分散して、より均衡であり得るトラフィック構成を取得するための機会としてよい。
【0047】
図5Cは、
図5Aの配置と同様のアーキテクチャを有するスイッチング構成の例であるが、
図5Cでは、グループからグループへのトラフィックの均衡がとれていない。特に、第1グループ510のサーバラックのトラフィックは、他のグループ520、530、540の全てに対して均衡がとれているわけではない。第1グループ510の集合スイッチノード(AN1)510Aのトラフィックは、第4グループ540の集合スイッチノード(AN16)540Dにだけルーティングされている。第1スイッチ550では、第1グループ510から受信されるAN1 510Aからの入力が1つの接続を介して第4グループ540内のAN16 540D用のスイッチ出力にルーティングされている。他の3つのスイッチ552、554、556も同様の接続性を示している。
図5Bに示されるように、
図5Cには他のグループ内の他の集合スイッチノードのルーティングが示されていない。
【0048】
図6Aは、集合スイッチノードをその一部とするグループのグループ制御装置に対して帯域幅要求情報を報告することに関する集合スイッチノードの動作の状態
図600の例である。610では、集合スイッチノードがレポートの送信またはレポートの更新を待っている。615では、集合スイッチノードが、レポートをプッシュすること、または、集合スイッチノードからのポーリングに応答することによりレポートを送達する。レポートが送信されると、状態は610に戻る。レポートのプッシュは幾つかのやり方で開始され得る。プッシ
ュは周期的なものであってもよいし、プッシュは、性能測定基準、例えば、以下に限定されるわけではないが、キューイングされたパケットのレイテンシまたは情報の緊急性に基づいたものであってもよい。620では、集合スイッチノードが、1)サーバからのデータの到着、または、フォトニックファブリックを通じた伝送を待っている、集合スイッチノード内にキューイングされたパケットのレイテンシ、または、2)任意のキューからフォトニックファブリックへのパケット伝送に基づいてレポートを更新した後、610に戻る。
【0049】
G個のサーバラックポッドグループがあり、各グループがN個のポッドを有しており、各ポッドが、関連付けられる集合スイッチノードを有しており、単一の種類のデータ伝送トラフィックがあるような実施形態では、各集合スイッチノードが、報告されるべきトラフィックのキューを合計でG×N個有しているものと見なされ得る。k種類のサービス品質(QoS)があるとすれば、キューの数は、k、グループの数G、および、集合スイッチノードの数Nの関数であってよく、すなわち、k(G.N)個のキューであってよい。
【0050】
図6Bには、グループ制御装置に伝送すべく集合スイッチノードにより生成されるレポート630の例が示されている。レポート630は、集合スイッチノードにより制御されているサーバが、同じ集合スイッチノードにより制御されている他のサーバ、自らのグループ内の集合スイッチノードにより制御されている他のサーバ、および、他のグループ内の集合スイッチノードにより制御されているサーバへのデータ伝送のために持つ帯域幅要求のインジケーションを提供する。レポート630の初めにおいて、キュー1レポート632は、集合スイッチノードにより制御されているサーバが、同じグループ内の同じ集合スイッチノードにより制御されている他のサーバへの伝送のために要求する帯域幅のインジケーションである。キュー2レポート634は、集合スイッチノードにより制御されているサーバが、同じグループ内の第2集合スイッチノードにより制御されているサーバへの伝送のために要求する帯域幅のインジケーションである。キューNレポート636は、集合スイッチノードにより制御されているサーバが、同じグループ内の第N集合スイッチノードにより制御されているサーバに関して要求する帯域幅のインジケーションである。これらの最初のN個のレポートは、同じ第1グループの帯域幅要求に対応する。係るグループがG個あるので、合計でG×N個のレポートがある。レポート630の終わりに近づくと、第Gグループにおいて、キュー(G−1)×N+1レポート640は、集合スイッチノードにより制御されているサーバが、第Gグループ内の第1集合スイッチノードにより制御されているサーバへの伝送のために要求する帯域幅のインジケーションであり、キューG×Nレポート644は、集合スイッチノードにより制御されているサーバが、第Gグループ内の第N集合スイッチノードにより制御されているサーバへの伝送のために要求する帯域幅のインジケーションである。
【0051】
図7Aは、
図4の段階430を実装するために実行され得る段階のより詳しいフローチャート700である。第1段階710では、グループ制御装置が、キューごとの帯域幅要求レポートという形で、グループ内のN個の集合スイッチノードの状態を受信する。
図7Bは、第1グループの第1集合スイッチノードから第N集合スイッチノードより受信されるレポートの例を示している。レポート750は、第1グループの第1集合スイッチノードからのレポートであり、レポート751は、第1グループの第(N−1)集合スイッチノードからのレポートであり、レポート752は、第1グループの第N集合スイッチノードからのレポートである。
図7Bに示されているそれぞれの集合スイッチノードからのレポートは、
図6Bで先ほど説明したものと実質的に同じである。
【0052】
図7Aを再び参照すると、グループ制御装置がレポートを受信し、段階720では、グループ制御装置が、グループ内の集合スイッチノードから受信されたレポートを集約する。段階730では、グループ制御装置がグループごとに集約レポートを分割する。
【0053】
図7Cは、レポートがいかにしてグループごとに集約および分割されるかの例を示している。所与のグループ、例えば、グループiに対する帯域幅要求を特定すべく、第1グループのグループ制御装置は、第1グループ内の各集合スイッチノードから受信される、グループiの各集合スイッチノードに伝送されるべき帯域幅要求、すなわち、レポート760、761、762を、帯域幅要求を合算することにより集約する。グループごとのこうした集約および分割によって、グループi内の各集合スイッチノードに伝送されるべき、第1グループの集合スイッチノード全てからの全帯域幅要求763が得られる。第1グループのグループ制御装置は、他の各グループについて同様の判定を実行し、他の各グループのグループ制御装置は、他の各グループについて同様の判定を実行するであろう。
【0054】
もう一度
図7Aを参照すると、段階740では、グループ制御装置が、集約レポート情報に基づいて、他の各グループ制御装置に帯域幅要求リクエストを送信する。
【0055】
図8は、グループ制御装置が他のグループの集約レポートを受信した結果の例を示している。ここでは、各集約レポートがグループの帯域幅の帯域幅要求である。
図8は、集約グループレポート810、811、812の集まりを示している。ここで、各レポートは、他のグループによるそのグループに対する帯域幅要求をグループ制御装置に通知すべく他の複数のグループのそれぞれのグループ制御装置により送信される集約レポートである。例えば、グループiが集約レポートを受信するグループである場合は、集約レポート810が、グループ1のグループ制御装置によりグループiのグループ制御装置に送信されるグループ1の帯域幅要求であり、集約レポート811が、グループ2のグループ制御装置によりグループiのグループ制御装置に送信されるグループ2の帯域幅要求であり、集約レポート812が、グループGのグループ制御装置によりグループiのグループ制御装置に送信されるグループGの帯域幅要求である。
【0056】
図8は、レポート820の形でグループiの各集合スイッチノードに対する全帯域幅要求(すなわち、1個からN個の集合スイッチノードの各々により管理されるサーバに対する帯域幅)をもたらす複数の集約レポート810、811、812の合計も示している。
【0057】
それぞれのグループのグループ制御装置が自らの帯域幅容量を割り振る、
図4の段階440を再び参照すると、ひとたびグループ制御装置が他のグループ制御装置から帯域幅要求を受信すると、グループ制御装置は他の各グループに帯域幅容量を割り振る。帯域幅は、インタフェースの数という観点から定義される粒度値を有するものと見なされ得る。例えば、集合スイッチノードが64個のインタフェースを有しており、その各々が100Gbpsで実行されるとすれば、集合ノードの全帯域幅は6.4Tbpsである。従って、帯域幅の変化は、100Gbpsまたは0.1Tbpsほどの小さなものであり得る。
【0058】
全ての他のグループから受信された要求がいかにしてグループiのグループ制御装置により割り振られ得るかを定義した1つの非限定的な例を以下に示す。グループiのグループ制御装置は、グループ内のN個の集合ノードを管理する。
【数1】
ここで、
【数2】
は、全ての他のグループ制御装置からこのノードへの全帯域幅要求を考慮して、要求
【数3】
に比例して割り振られる帯域幅である。
【0059】
特に、
【数4】
は、集合スイッチノードjに対する要求に関する、グループkからグループiまでの総合的な要求レポートを定義する。ここで、k=1、2、・・・、Gであり、I=1、2、・・・、Gであり、j=(i−1)*N+1、・・・・(i−1)*N+2、・・・i*Nである。
【数5】
は、グループkからグループIへの接続性のために割り振られる新たな容量を定義する。
【数6】
は、集合ノードjの全帯域幅(またはインタフェースの数)を定義する。
【数7】
は、グループkからグループiの集合ノードjへの接続性のために割り振られる新たな容量を定義する。ここで、
【数8】
である。
【0060】
この容量を割り振るためには、最大最小公平性(min−max fairness)などの他の公平性割り振り方式も使用され得る。
【0061】
グループkからグループiの集合ノードjへの帯域幅の変化
【数9】
は、
【数10】
と定義され得る。グループiからグループkへの
帯域幅の総合的な変化は、
【数11】
で求められる。なお、グループ内の帯域幅の変化は、
【数12】
から導出され得る。
【0062】
図4の段階450を再び参照すると、ひとたびグループ制御装置が他のグループに対する帯域幅容量の割り当てを判定すると、グループ制御装置は、現在の割り振り期間の帯域幅容量、および、判定された次の期間の帯域幅容量を把握することで、グループごとにデルタ帯域幅を判定することができる。グループ制御装置は、他のグループ制御装置にこのデルタ帯域幅を提供し、グループ制御装置は、他のグループ制御装置の各々から同様のデルタ帯域幅を受信する。グループ制御装置は、スイッチ制御装置にもこのデルタ帯域幅を提供する。スイッチ制御装置は同様に、他のグループ制御装置の各々から他のグループに関するデルタ帯域幅情報を受信する。これによって、段階470のスイッチ制御装置は、次の期間の割り振りを可能とするためにコアスイッチにおいて行われるべきグループからグループへのスイッチルーティングの変更を判定することが可能となる。
【0063】
図4の段階460を再び参照すると、ひとたびグループ制御装置が、グループが他のグループの各々に対して割り振られた帯域幅容量を認識し、自らのグループのメンバーが他のグループに対して持つ帯域幅要求を把握すると、グループ制御装置はグループのメンバーに帯域幅容量を割り振る。
【0064】
図4の段階470によれば、ひとたびスイッチ制御装置がグループ制御装置全てからデルタ帯域幅情報を受信すると、スイッチ制御装置は、当該情報を用いてコアスイッチにおけるグループからグループへの接続性を調節する。加えて、グループ内の接続性は、先ほど説明した
図4の段階460で行われた判定に基づいて調節され得る。
【0065】
幾つかの実施形態、また、段階470の一部によると、ひとたびグループ制御装置が、別のグループに対するグループ接続性の帯域幅が減少していると見なすと、グループ制御装置は、少なくとも1つのインタフェースのトラフィックを休止させることを決定する。あるグループに対する帯域幅が減少している場合は、インタフェースのうちの1つまたは複数をダウンさせることができるように、グループ制御装置がグループのメンバーと連携する。
【0066】
スイッチ制御装置は、最初のセットアップ遅延後にグループからグループへの接続性を調節する。このセットアップ遅延によって、接続が縮小されるとトラフィックを休止させることが可能となり、
拡大された接続を割り振る時間を取ることも可能となる。グループ制御装置は、縮小が適用されており、トラフィックが当該インタフェースを横切るべきではないというメッセージを、通信インフラストラクチャ上で送信する。スイッチ制御装置は、デルタ帯域幅の適用を認識し、グループからグループへの接続を設定する。グループからグループへの接続性の容量が増加すると、スイッチは同様に適切に構成される。
【0067】
図9は、グループ制御装置がプロセッサ910と命令920を記憶するためのコンピュータ可読メモリ915とを含むような、グループ制御装置900の例のブロック図である。命令920は、実行されると、グループ制御装置が様々な機能を実行することを可能にする。以下では、
図10、
図11および
図12を参照しながらこれらの様々な機能のうちの幾つかの例
について説明する。幾つかの実施形態によると、ソフトウェアの形をとったプロセッサおよび命令とは対照的に、グループ制御装置は、ハードウェアまたはハードウェアとソフトウェアとの組み合わせで実装され得る。
【0068】
図10を参照しながら、第1機能について説明する。当該第1機能は、
図4の段階430に実質的に対応しており、グループの帯域幅要求を判定する方法1000と見なされ得る。ネットワークのグループ制御装置の各々は同じ機能を実行しているかもしれないが、以下では、単一のグループ制御装置により実行されていることの観点から説明する。 第1段階1010は、第1サブネットワークグループのグループ制御装置が、第1サブネットワークグループの各サブネットワークが第1サブネットワークグループ内の他のサブネットワークとネットワーク内の他のサブネットワークグループとに対して持つ帯域幅要求について、第1グループ内の各サブネットワークの集合スイッチノードを監視する段階を含む。任意の第2段階1020は、グループ制御装置が、集合スイッチノードから帯域幅要求情報を受信する段階を含む。任意の第3段階
1030は、グループ制御装置が、他の各サブネットワークグループに対する第1サブネットワークグループの帯域幅要求と、他の各サブネットワークグループに対する第1サブネットワークグループの各サブネットワークの帯域幅要求とを類別する段階を含む。任意の第4段階
1040は、グループ制御装置が、第1サブネットワークグループ内のサブネットワーク全てからの帯域幅要求を集約する段階を含む。任意の第5段階
1050は、グループ制御装置が、他のポッドグループに対する集約された帯域幅要求をグループごとに判定する段階を含む。第6段階
1060は、グループ制御装置が、ネットワーク内の他のグループ制御装置の各々に第1グループのサブネットワークの帯域幅要求を伝える段階を含む。
【0069】
幾つかの実施形態によると、段階1020は、グループ制御装置が、それぞれのサブネットワーク内の集合スイッチノードから、サブネットワークの集合スイッチノードからプッシュされた帯域幅要求情報を受信する段階を含む。他の実施形態によると、段階1020は、グループ制御装置が、グループ制御装置からのポーリングに応答してそれぞれのサブネットワーク内の集合スイッチノードから帯域幅要求情報を受信する段階を含む。
【0070】
図11を参照しながら、第2機能について説明する。当該機能は、
図4の段階440に実質的に対応しており、帯域幅を割り振る方法1100と見なされ得る。ここでも、ネットワーク内のグループ制御装置の各々は同じ機能を実行しているかもしれないが、以下では、単一のグループ制御装置により実行されていることの観点から説明する。第1段階1110は、第1サブネットワークグループのグループ制御装置が、他の各サブネットワークグループのグループ制御装置から、第1サブネットワークグループに対する他の各サブネットワークグループの帯域幅要求を受信する段階を含む。更なる段階1120は、グループ制御装置が、受信された帯域幅要求に基づいて、第1サブネットワークグループと他のサブネットワークグループとの間で帯域幅容量を割り振る段階を含む。段階1130は、グループ制御装置が、第1サブネットワークグループと他のサブネットワークグループとの間で割り振られた帯域幅容量を他の各グループ制御装置に送信する段階を含む。任意の段階1140は、グループ制御装置が、第1グループと他のグループの各々との間で割り振られた帯域幅容量をスイッチ制御装置に送信する段階を含む。更なる任意の段階1150は、スイッチ制御装置が、グループ制御装置の各々から受信された、グループの各々
と他のグループの各々との間で割り振られる帯域幅容量に関する情報に基づいて、少なくとも1つのスイッチの帯域幅容量を調節する段階を含む。
(項目1)
複数のサブネットワークを含むサブネットワークグループを複数有するネットワークのための帯域幅要求を判定する方法であって、各サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、上記サブネットワーク内の上記複数のサーバラックへの上記トラフィックフロー、および、上記サブネットワーク内の上記複数のサーバラックからの上記トラフィックフローを制御するよう構成されている集合スイッチノードを含み、上記ネットワーク内の上記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して互いに光学的に連結され、複数の上記サブネットワークグループの各サブネットワークグループが、上記サブネットワークグループ内の上記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、上記グループ制御装置は、互いに通信可能に連結され、上記方法は、
第1サブネットワークグループのグループ制御装置において、
上記第1グループの各サブネットワークが上記第1サブネットワークグループ内の他のサブネットワークと上記ネットワーク内の他のサブネットワークグループとに対して持つ帯域幅要求について、上記グループ制御装置が、上記第1グループ内の各サブネットワークの上記集合スイッチノードを監視する段階と、
上記グループ制御装置が、上記ネットワーク内の他のグループ制御装置の各々に上記第1グループの上記各サブネットワークの上記帯域幅要求を伝える段階と
を備える、方法。
(項目2)
上記グループ制御装置が帯域幅要求を監視する段階は、
他の各サブネットワークグループに対する上記第1サブネットワークグループの上記帯域幅要求と、他の各サブネットワークグループに対する上記第1サブネットワークグループの各サブネットワークの上記帯域幅要求とを類別する段階を有する、項目1に記載の方法。
(項目3)
他の各サブネットワークグループに対する上記サブネットワークグループの上記帯域幅要求と、他の各サブネットワークグループに対する上記サブネットワークグループの各サブネットワークの上記帯域幅要求とを類別する段階は、
上記第1サブネットワークグループ内の上記サブネットワークの全てからの上記帯域幅要求を集約する段階と、
集約された、他のサブネットワークグループに対する上記帯域幅要求をグループごとに判定する段階と
を含む、項目2に記載の方法。
(項目4)
上記グループ制御装置が帯域幅要求を監視する段階は、
上記グループ制御装置が、それぞれのサブネットワークの上記集合スイッチノードからプッシュされた、上記それぞれのサブネットワーク内の上記サーバラックの帯域幅要求情報を受信する段階、または、
上記グループ制御装置が、上記グループ制御装置からのポーリングに応答して、それぞれのサブネットワークの上記集合スイッチノードから上記それぞれのサブネットワーク内の上記サーバラックの帯域幅要求情報を受信する段階
を有する、項目1に記載の方法。
(項目5)
複数のサブネットワークを含むサブネットワークグループを複数有するネットワークのための帯域幅を割り振る方法であって、サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、上記サブネットワーク内の上記複数のサーバラックへの上記トラフィックフロー、および、上記サブネットワーク内の上記複数のサーバラックからの上記トラフィックフローを制御するよう構成されている集合スイッチノードを含み、上記ネットワーク内の上記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して、互いに光学的に連結され、複数の上記サブネットワークグループの各サブネットワークグループが、上記サブネットワークグループ内の上記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、上記グループ制御装置は、互いに通信可能に連結され、上記方法は、
第1サブネットワークグループのグループ制御装置において、
他の各サブネットワークグループのグループ制御装置から、上記第1サブネットワークグループに対する他の各サブネットワークグループの上記帯域幅要求を受信する段階と、
受信された上記帯域幅要求に基づいて、上記第1サブネットワークグループと他のサブネットワークグループとの間で帯域幅容量を割り振る段階と、
上記第1サブネットワークグループと上記他のサブネットワークグループとの間で割り振られた上記帯域幅容量を他の各グループ制御装置に送信する段階と
を備える、方法。
(項目6)
上記第1グループの上記グループ制御装置が、別のグループに対して割り振られる帯域幅容量が減少していると判定すると、上記第1グループの上記グループ制御装置が、上記減少に適応すべく、上記第1グループの少なくとも1つのサブネットワークの少なくとも1つのインタフェースにおけるトラフィックを休止させる段階を更に備える、項目5に記載の方法。
(項目7)
上記グループ制御装置が、上記第1グループと上記他のグループの各々との間で割り振られた上記帯域幅容量を上記スイッチ制御装置に送信する段階を更に備える、項目5に記載の方法。
(項目8)
上記グループ制御装置が、上記第1グループと上記他のグループの各々との間で割り振られた上記帯域幅容量を上記スイッチ制御装置に送信する段階は、上記グループ制御装置が、上記第1グループおよび上記他のグループの各々に前に割り振られた帯域幅容量と、上記第1グループおよび上記他のグループの各々に現在割り振られている帯域幅容量との間における、上記割り振られる帯域幅容量の変化のインジケーションを、上記少なくとも1つのスイッチに送信する段階を有する、項目7に記載の方法。
(項目9)
上記スイッチ制御装置が、上記グループ制御装置の各々から受信された、上記サブネットワークグループの各々と上記他のサブネットワークグループの各々との間で割り振られる帯域幅容量に関する情報に基づいて、上記少なくとも1つのスイッチの上記帯域幅容量を調節する段階を更に備える、項目8に記載の方法。
(項目10)
複数のサブネットワークを含むサブネットワークグループを複数有するネットワークのための帯域幅を割り振る方法であって、サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、上記サブネットワーク内の上記複数のサーバラックへの上記トラフィックフロー、および、上記サブネットワーク内の上記複数のサーバラックからの上記トラフィックフローを制御するよう構成されている集合スイッチノードを含み、上記ネットワーク内の上記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して、互いに光学的に連結され、上記複数のサブネットワークグループの各サブネットワークグループが、上記サブネットワークグループ内の上記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、上記グループ制御装置は、互いに通信可能に連結され、上記方法は、
第1サブネットワークグループのグループ制御装置において、
他の各サブネットワークグループのグループ制御装置から、上記第1サブネットワークグループと他の各サブネットワークグループとの間で与えられる上記帯域幅容量の割り当てを受信する段階と、
受信された上記帯域幅容量の割り当てに基づいて、上記第1サブネットワークグループのサブネットワークの各々と上記他のサブネットワークグループとの間で帯域幅容量を割り振る段階と、
を備える、方法。
(項目11)
上記第1グループの上記グループ制御装置が、上記他のグループ制御装置のうちの少なくとも幾つかと通信状態にある上記スイッチ制御装置に、上記第1グループと上記他のグループとの間で割り振られた上記帯域幅容量を送信する段階を更に備える、項目10に記載の方法。
(項目12)
上記スイッチ制御装置が、上記グループ制御装置の上記各々から受信された、上記サブネットワークグループの各々と上記他のサブネットワークグループの各々との間で割り振られる帯域幅容量に関する情報に基づいて、上記グループに割り振られた上記少なくとも1つのスイッチの上記帯域幅容量を調節する段階を更に備える、項目11に記載の方法。
(項目13)
上記第1サブネットワークグループの上記サブネットワークの各々と上記他のサブネットワークグループとの間で帯域幅容量を割り振る段階は更に、上記第1サブネットワークグループ内の上記サブネットワークの帯域幅要求を考慮した公平な分配に基づいて行われる、項目10に記載の方法。
(項目14)
システムであって、
少なくとも1つのスイッチと、
上記少なくとも1つのスイッチを制御するよう構成されているスイッチ制御装置と、
複数のサブネットワークであって、1つのサブネットワークが、複数のサーバラックを有し、各サブネットワークが、上記サブネットワークへの上記トラフィックフロー、および、上記サブネットワークからの上記トラフィックフローを制御するよう構成されている集合スイッチノードを有し、上記サブネットワークは、上記少なくとも1つのスイッチを介して互いに通信可能に連結され、上記複数のサブネットワークは、サブネットワークグループに配置される、複数のサブネットワークと、
複数のグループ制御装置であって、サブネットワークグループごとに1つのグループ制御装置があり、上記複数のグループ制御装置の各々が上記グループ内の上記集合スイッチノードの各々と通信状態にあり、上記複数の上記グループ制御装置は、互いに通信可能に連結され、上記グループ制御装置の各々が、
上記それぞれのサブネットワークグループの各サブネットワークが上記サブネットワーク内のサーバラックと上記システム内の他のサブネットワークとに対して持つ帯域幅要求を監視し、上記システム内の他のグループ制御装置の各々に上記サブネットワークグループの上記帯域幅要求を伝えることと、
受信された上記帯域幅要求に基づいて、上記サブネットワークグループと他のサブネットワークグループとの間で帯域幅容量を割り振り、上記サブネットワークグループおよび上記他のサブネットワークグループに割り振られた上記帯域幅容量を上記他のグループ制御装置に送信することと、
上記他のグループ制御装置から、上記サブネットワークグループおよび上記他のサブネットワークグループに与えられる上記帯域幅容量の割り当てを受信し、受信された上記帯域幅容量の割り当てに基づいて、上記サブネットワークグループの各々と上記他のサブネットワークグループの上記サブネットワークとの間で帯域幅容量を割り振ることと
を行うよう構成される、複数のグループ制御装置と
を備えるシステム。
(項目15)
上記複数のサブネットワークグループの各々のための上記グループ制御装置は、高速光接続を用いて、環状または網目状に互いに通信可能に連結される、項目14に記載のシステム。
(項目16)
所与のサブネットワークの上記集合ノードは、低速光接続を用いて上記グループ制御装置を中心にして、環状接続または星形接続で上記サブネットワークグループの上記グループ制御装置に通信可能に連結される、項目14に記載のシステム。
(項目17)
上記複数のグループ制御装置は、上記スイッチ制御装置に通信可能に連結される、項目14に記載のシステム。
(項目18)
上記スイッチ制御装置は、上記少なくとも1つのスイッチを集合的に制御する、互いに通信可能に連結されている複数のスイッチ制御装置である、項目14に記載のシステム。
(項目19)
第1サブネットワークグループを制御するよう構成されているグループ制御装置であって、サブネットワークが、複数のサーバラックと定義され、上記グループ制御装置は、複数の集合スイッチノードと通信状態にあり、各集合スイッチノードは、それぞれのサブネットワーク内の複数のサーバラックへのトラフィックフロー、および、それぞれのサブネットワーク内の複数のサーバラックからのトラフィックフローを制御するよう構成され、上記グループ制御装置は、少なくとも1つの他のサブネットワークグループを制御するよう構成されている少なくとも1つの他のグループ制御装置と通信状態にあり、上記サブネットワークグループは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して互いに通信可能に連結され、上記グループ制御装置は、
プロセッサと、
自らにコンピュータ実行可能命令を記憶したコンピュータ可読媒体と
を備え、上記コンピュータ実行可能命令は、上記プロセッサにより実行されると、上記グループ制御装置に、
上記第1サブネットワークグループ内の各サブネットワークの上記集合スイッチノードを介して、上記第1サブネットワークグループの各サブネットワークが上記少なくとも1つの他のサブネットワークグループの上記1つまたは複数のサブネットワーク内のサーバラックに対して持つ帯域幅要求を監視することと、
上記少なくとも1つの他のグループ制御装置の各々に上記第1サブネットワークグループの上記サブネットワークの上記帯域幅要求を伝えることと
を行わせる、グループ制御装置。
(項目20)
上記コンピュータ実行可能命令は更に、上記プロセッサにより実行されると、上記グループ制御装置に、
上記少なくとも1つの他のグループ制御装置から、上記第1サブネットワークグループに対する他の各サブネットワークグループの上記帯域幅要求を受信することと、
受信された上記帯域幅要求に基づいて、上記第1サブネットワークグループと他の各サブネットワークグループとの間で帯域幅容量を割り振ることと、
上記第1サブネットワークグループと他のサブネットワークグループとの間で割り振られた上記帯域幅容量を他の各グループ制御装置に送信することと
を行わせる、項目19に記載の装置。
(項目21)
上記コンピュータ実行可能命令は更に、上記プロセッサにより実行されると、上記グループ制御装置に、
上記少なくとも1つの他のグループ制御装置から、上記少なくとも1つの他のグループ制御装置と関連付けられる上記サブネットワークグループにより上記サブネットワークグループに与えられる、割り振られた上記帯域幅容量を受信することと、
受信された上記帯域幅容量の割り当てに基づいて、上記第1サブネットワークグループの上記サブネットワークの各々と上記他のサブネットワークグループとの間で帯域幅容量を割り振ることと
を行わせる、項目20に記載の装置。
(項目22)
上記グループ制御装置は、高速光接続を用いて、環状または網目状に他のグループ制御装置に通信可能に連結される、項目19に記載の装置。
(項目23)
上記グループ制御装置は、低速光接続を用いて上記グループ制御装置を中心にして、環状接続または星形接続で上記サブネットワークグループ内の上記集合スイッチノードに通信可能に連結される、項目19に記載の装置。
(項目24)
上記グループ制御装置は、上記スイッチ制御装置に通信可能に連結される、項目19に記載の装置。
(項目25)
複数のサブネットワークグループを含むネットワークのための帯域幅要求を割り振る方法であって、サブネットワークが、複数のサーバラックを含み、サブネットワークグループ内の各サブネットワークが、上記サブネットワーク内の上記複数のサーバラックへの上記トラフィックフロー、および、上記サブネットワーク内の上記複数のサーバラックからの上記トラフィックフローを制御するよう構成されている集合ノードを含み、上記ネットワーク内の上記集合スイッチノードは、スイッチ制御装置により制御されている少なくとも1つのスイッチを介して互いに光学的に連結され、上記複数のサブネットワークグループの各サブネットワークグループが、上記サブネットワークグループ内の上記集合スイッチノードの各々と通信状態にあるグループ制御装置を含み、上記グループ制御装置は、互いに通信可能に連結され、上記方法は、
上記グループ制御装置が、上記それぞれのサブネットワークグループの各サブネットワークが上記サブネットワーク内のサーバラックと上記ネットワーク内の他のサブネットワークとに対して持つ帯域幅要求を監視し、上記ネットワーク内の上記他のグループ制御装置の各々に上記グループの上記帯域幅要求を伝える段階と、
上記グループ制御装置が、受信された上記帯域幅要求に基づいて、自らのサブネットワークグループと上記他のサブネットワークグループとの間で帯域幅容量を割り振り、各グループ制御装置が、上記サブネットワークグループおよび上記他のサブネットワークグループに割り振られた上記帯域幅容量を上記他のグループ制御装置に送信する段階と、
各グループ制御装置が、上記他のグループ制御装置から、上記サブネットワークグループおよび上記他のサブネットワークグループに与えられる上記帯域幅容量の割り当てを受信し、受信された上記帯域幅容量の割り当てに基づいて、上記サブネットワークグループの各々と上記他のサブネットワークグループの上記サブネットワークとの間で帯域幅容量を割り振る段階と
を備える、方法。
【0071】
幾つかの実施形態によると、第1サブネットワークグループのグループ制御装置が、別のグループに対して割り振られる帯域幅容量が減少していると判定すると、第1サブネットワークグループのグループ制御装置は、その減少に適応すべく、第1サブネットワークグループの少なくとも1つのサブネットワークの少なくとも1つのインタフェースにおけるトラフィックを休止させる。例えば、第1サブネットワークグループ内の少なくとも1つのサブネットワークが使用するための少なくとも1つのインタフェースがもはや割り振られない場合にデータを失わないように。幾つかの実施形態によると、これは、第1グループ制御装置が、第1グループおよび他のグループの各々から前に割り振られた帯域幅容量と、第1グループおよび他のグループの各々から現在割り振られている帯域幅容量との間における、割り振られる帯域幅容量の変化を、少なくとも1つのスイッチに送信する段階を含んでよい。
【0072】
図12を参照しながら、第3機能について説明する。当該機能は、
図4の段階460に実質的に対応しており、帯域幅を割り振る方法1200と見なされ得る。ここでも、ネットワーク内のグループ制御装置の各々は同じ機能を実行しているかもしれないが、以下では、単一のグループ制御装置により実行されていることの観点から説明する。第1段階1210は、第1サブネットワークグループのグループ制御装置が、他の各サブネットワークグループのグループ制御装置から、第1サブネットワークグループと他の各サブネットワークグループとの間で与えられる帯域幅容量の割り当てを受信する段階を含む。第2段階1220は、受信された帯域幅容量の割り当てに基づいて、第1サブネットワークグループのサブネットワークの各々と他のサブネットワークグループとの間で帯域幅容量を割り振る段階を含む。任意の第3段階1230は、第1グループのグループ制御装置が、第1サブネットワークグループと他のサブネットワークグループとの間で割り振られた帯域幅容量をスイッチ制御装置に送信する段階を含む。
【0073】
幾つかの実施形態によると、当該方法は更に、スイッチ制御装置が、グループ制御装置の各々から受信された、サーバラックグループの各々と他のサーバラックグループの各々との間で割り振られる帯域幅容量に関する情報に基づいて、グループに割り振られる少なくとも1つのスイッチの帯域幅容量を調節する段階を含んでよい。
【0074】
幾つかの実施形態によると、第1サーバラックグループおよび他の複数のサーバラックグループのサーバラックの各々の間で帯域幅容量を割り振る段階は更に、サーバラックグループ内のサーバラックの帯域幅要求を考慮した公平な分配に基づいて行われる。
【0075】
上記の教示を考慮すると、本開示の修正例および変形例が多数考えられる。従って、本開示は添付の請求項の範囲内で、本明細書において具体的に説明されているものとは違ったやり方で実施され得ることを理解されたい。