(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-20
(45)【発行日】2023-12-28
(54)【発明の名称】高性能コンピューティング環境における仮想ルータポートにわたるSMP接続性チェックのためのルータSMA抽象化をサポートするためのシステムおよび方法
(51)【国際特許分類】
H04L 41/122 20220101AFI20231221BHJP
G06F 13/14 20060101ALI20231221BHJP
【FI】
H04L41/122
G06F13/14 310H
【外国語出願】
(21)【出願番号】P 2021206026
(22)【出願日】2021-12-20
(62)【分割の表示】P 2018502700の分割
【原出願日】2017-01-25
【審査請求日】2022-01-07
(32)【優先日】2016-01-27
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-01-23
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ホレン,リネ
(72)【発明者】
【氏名】ヨンセン,ビョルン・ダグ
(72)【発明者】
【氏名】ボグダンスキー,バルトシュ
【審査官】羽岡 さやか
(56)【参考文献】
【文献】特表2015-517765(JP,A)
【文献】特表2014-517406(JP,A)
【文献】米国特許出願公開第2014/0269720(US,A1)
【文献】特表2014-514633(JP,A)
【文献】米国特許出願公開第2014/0177639(US,A1)
【文献】米国特許出願公開第2015/0338909(US,A1)
【文献】米国特許出願公開第2014/0269686(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04L 41/122
G06F 13/14
(57)【特許請求の範囲】
【請求項1】
高性能コンピューティング環境における仮想ルータポートにわたるSMPベースの接続性チェックをサポートするためのシステムであって、
1つ以上のマイクロプロセッサと、
第1のサブネットとを含み、前記第1のサブネットは、
前記第1のサブネットのスイッチを含み、前記第1のサブネットの前記スイッチは、前記第1のサブネットの複数のスイッチポートとサブネット管理エージェント(subnet management agent:SMA)とを含み、前記第1のサブネットの前記スイッチのスイッチポートは、前記第1のサブネットのルータポートとして構成され、前記第1のサブネットはさらに、
前記第1のサブネットの複数のホストチャネルアダプタを含み、各ホストチャネルアダプタは少なくとも1つのホストチャネルアダプタポートを含み、前記第1のサブネットはさらに、
前記第1のサブネットのサブネットマネージャを含み、前記システムはさらに、
第2のサブネットを含み、前記第2のサブネットは、
前記第2のサブネットのスイッチを含み、前記第2のサブネットの前記スイッチは複数のスイッチポートを含み、前記第2のサブネットの前記スイッチのスイッチポートは前記第2のサブネットのルータポートとして構成され、
前記第1のサブネットは、前記第1のサブネットの前記ルータポートを介して前記第2のサブネットと相互接続され、
前記第1のサブネットの前記サブネットマネージャは、第1のサブネット管理パケットを前記第1のサブネットの前記ルータポートに送信し、前記第1のサブネット管理パケットは、アドレス情報を含み、前記アドレス情報は、前記第1のサブネットの前記ルータポートと関連する宛先識別子を含み、前記アドレス情報は、前記第1のサブネットの外部のアドレス情報を含まず、前記第1のサブネット管理パケットは、前記第2のサブネットの接続情報を要求し、
前記第1のサブネットのSMAは、プロキシとして動作し、新しいサブネット管理パケットを作成し、前記新しいサブネット管理パケットを前記第2のサブネットに転送し、前記新しいサブネット管理パケットは、前記第2のサブネットの接続情報を要求し、
前記第1のサブネットの前記ルータポートは、前記第1のサブネットの仮想ルータに論理的に接続され、前記第1のサブネットの前記仮想ルータは、前記第1のサブネットの2つ以上の仮想ルータポートを含み、
前記第2のサブネットの前記ルータポートは、前記第2のサブネットの仮想ルータに論理的に接続され、前記第2のサブネットの前記仮想ルータは、前記第2のサブネットの2つ以上の仮想ルータポートを含
み、前記第1のサブネットの前記ルータポートは、前記第1のサブネットの第1の仮想ルータポートに論理的に接続され、前記第1のサブネットの第2の仮想ルータポートが前記第2のサブネットの第2の仮想ルータポートと相互接続される、システム。
【請求項2】
前記第1のサブネットの前記第2の仮想ルータポートおよび前記第2のサブネットの前記第2の仮想ルータポートはピアポートである、請求項
1に記載のシステム。
【請求項3】
前記新しいサブネット管理パケットは、前記第2のサブネットの前記第2の仮想ルータポートに対してアドレス指定される、請求項
2に記載のシステム。
【請求項4】
高性能コンピューティング環境における仮想ルータポートにわたるSMPベースの接続性チェックをサポートするための方法であって、
マイクロプロセッサを含む1つ以上のコンピュータを提供するステップと、
第1のサブネットを提供するステップとを含み、前記第1のサブネットは、
前記第1のサブネットのスイッチを含み、前記第1のサブネットの前記スイッチは、前記第1のサブネットの複数のスイッチポートとサブネット管理エージェント(SMA)とを含み、前記第1のサブネットの前記スイッチのスイッチポートは前記第1のサブネットのルータポートとして構成され、前記第1のサブネットはさらに、
前記第1のサブネットの複数のホストチャネルアダプタを含み、各々のホストチャネルアダプタは少なくとも1つのホストチャネルアダプタポートを含み、前記第1のサブネットはさらに、
前記第1のサブネットのサブネットマネージャを含み、前記方法はさらに、
第2のサブネットを提供するステップを含み、前記第2のサブネットは、
前記第2のサブネットのスイッチを含み、前記第2のサブネットの前記スイッチは複数のスイッチポートを含み、前記第2のサブネットの前記スイッチのスイッチポートは前記第2のサブネットのルータポートとして構成され、前記方法はさらに、
前記第1のサブネットの前記ルータポートを介して前記第1のサブネットを前記第2のサブネットと相互接続するステップと、
前記第1のサブネットの前記サブネットマネージャによって前記第1のサブネットの前記ルータポートに第1のサブネット管理パケットを送信するステップを含み、前記第1のサブネット管理パケットは、アドレス情報を含み、前記アドレス情報は、前記第1のサブネットの前記ルータポートと関連する宛先識別子を含み、前記アドレス情報は、前記第1のサブネットの外部のアドレス情報を含まず、前記第1のサブネット管理パケットは、前記第2のサブネットの接続情報を要求し、
前記方法は、さらに、
プロキシとして動作する前記第1のサブネットのSMAによって、新しいサブネット管理パケットを作成するステップと、
前記プロキシとして動作する前記第1のサブネットの前記SMAによって、前記新しいサブネット管理パケットを前記第2のサブネットに転送するステップとを含み、前記新しいサブネット管理パケットは、前記第2のサブネットの接続情報を要求し、
前記第1のサブネットの前記ルータポートは前記第1のサブネットの仮想ルータに論理的に接続され、前記第1のサブネットの前記仮想ルータは前記第1のサブネットの2つ以上の仮想ルータポートを含み、
前記第2のサブネットの前記ルータポートは前記第2のサブネットの仮想ルータに論理的に接続され、前記第2のサブネットの前記仮想ルータは前記第2のサブネットの2つ以上の仮想ルータポートを含
み、前記第1のサブネットの前記ルータポートは前記第1のサブネットの第1の仮想ルータポートに論理的に接続され、
前記第1のサブネットの第2の仮想ルータポートは前記第2のサブネットの第2の仮想ルータポートと相互接続される、方法。
【請求項5】
前記第1のサブネットの前記第2の仮想ルータポートおよび前記第2のサブネットの前記第2の仮想ルータポートはピアポートである、請求項
4に記載の方法。
【請求項6】
前記新しいサブネット管理パケットは、前記第2のサブネットの前記第2の仮想ルータポートに対してアドレス指定される、請求項
5に記載の方法。
【請求項7】
コンピュータに、請求項
4から
6のいずれか1項に記載の方法を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
著作権表示:
この特許文献の開示の一部は、著作権保護の対象となる資料を含む。この特許文献または特許開示は特許商標庁の特許ファイルまたは記録に記載されているため、著作権保有者は、何人によるその複写複製に対しても異議はないが、その他の場合には如何なるときもすべての著作権を保有する。
【0002】
発明の分野:
本発明は、概して、コンピュータシステムに関し、特に、高性能コンピューティング環境におけるデュアルポート仮想ルータポートにわたるSMP接続性チェックのためのSMA抽象化をサポートすることに関する。
【背景技術】
【0003】
背景:
導入されるクラウドコンピューティングアーキテクチャがより大規模になるのに応じて、従来のネットワークおよびストレージに関する性能および管理の障害が深刻な問題になってきている。クラウドコンピューティングファブリックのための基礎としてインフィニバンド(登録商標)(InfiniBand:IB)技術などの高性能無損失相互接続を用いることへの関心がますます高まってきている。これは、本発明の実施形態が対応するように意図された一般領域である。
【発明の概要】
【課題を解決するための手段】
【0004】
概要:
高性能コンピューティング環境における仮想ルータポートにわたるSMP接続性チェックをサポートするためのシステムおよび方法がここに記載される。例示的な方法は、1つ以上のマイクロプロセッサを含む1つ以上のコンピュータにおいて、第1のサブネットを提供し得る。第1のサブネットは、複数のスイッチを含み、複数のスイッチは少なくともリーフスイッチを含む。複数のスイッチの各々は複数のスイッチポートを含む。第1のサブネットは、複数のホストチャネルアダプタを含み、各々のホストチャネルアダプタは、少なくとも1つのホストチャネルアダプタポートを含む。第1のサブネットは、複数のエンドノードを含む。複数のエンドノードの各々は、複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられている。第1のサブネットはさらに、サブネットマネージャを含む。サブネットマネージャは、複数のスイッチおよび複数のホストチャネルアダプタのうちの1つの上で実行している。当該方法は、複数のスイッチのうち1スイッチ上において複数のスイッチポートのうち1スイッチポートをルータポートとして構成し得る。当該方法は、ルータポートとして構成されたスイッチポートを仮想ルータに論理的に接続し得る。仮想ルータは少なくとも2つの仮想ルータポートを含む。当該方法は、ルータポートにアドレス指定されたリクエストパケットを、サブネットマネージャによって、ルータポートとして構成された複数のスイッチのうち1スイッチ上における複数のスイッチポートのうち1スイッチポートに送信し得る。要求パケットは、ルータポートを越えて接続性情報を要求する。最後に、当該方法は、複数のスイッチのうち1スイッチ上に常駐するサブネット管理エージェントによって、要求パケットを変更し得る。
【0005】
一実施形態に従うと、(第1のサブネットまたは第2のサブネットの)複数のホストチ
ャネルアダプタのうち1つ以上は、少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含み得る。(第1のサブネットまたは第2のサブネットの)複数のエンドノードは、物理ホスト、仮想マシンまたは物理ホストと仮想マシンとの組合せを含み得る。仮想マシンは、少なくとも1つの仮想機能に関連付けられている。
【図面の簡単な説明】
【0006】
【
図1】一実施形態に従ったインフィニバンド環境の一例を示す図である。
【
図2】一実施形態に従った、パーティショニングされたクラスタ環境の一例を示す図である。
【
図3】一実施形態に従った、ネットワーク環境におけるツリートポロジーの一例を示す図である。
【
図4】一実施形態に従った例示的な共有ポートアーキテクチャを示す図である。
【
図5】一実施形態に従った例示的なvSwitchアーキテクチャを示す図である。
【
図6】一実施形態に従った、例示的なvPortアーキテクチャを示す図である。
【
図7】一実施形態に従った、LIDが予めポピュレートされた例示的なvSwitchアーキテクチャを示す図である。
【
図8】一実施形態に従った、動的LID割当てがなされた例示的なvSwitchアーキテクチャを示す図である。
【
図9】一実施形態に従った、動的LID割当てがなされかつLIDが予めポピュレートされているvSwitchを備えた例示的なvSwitchアーキテクチャを示す図である。
【
図10】一実施形態に従った、例示的なマルチサブネットインフィニバンドファブリックを示す図である。
【
図11】一実施形態に従った、高性能コンピューティング環境における2つのサブネット間の相互接続を示す図である。
【
図12】一実施形態に従った、高性能コンピューティング環境におけるデュアルポート仮想ルータ構成を介する2つのサブネット間の相互接続を示す図である。
【
図13】一実施形態に従った、高性能コンピューティング環境におけるデュアルポート仮想ルータをサポートするための方法を示すフローチャートである。
【
図14】一実施形態に従った、DRルーティングされたVSMPパケットを示すフローチャートである。
【
図15】一実施形態に従った、DRルーティングされたVSMPパケットに対する応答を示すフローチャートである。
【
図16】一実施形態に従った、LIDルーティングされたVSMPパケットを示すフローチャートである。
【
図17】一実施形態に従った、LIDルーティングされたVSMPパケットに対する応答を示すフローチャートである。
【発明を実施するための形態】
【0007】
詳細な説明:
本発明は、同様の参照番号が同様の要素を指している添付図面の図において、限定のためではなく例示のために説明されている。なお、この開示における「ある」または「1つの」または「いくつかの」実施形態への参照は必ずしも同じ実施形態に対するものではなく、そのような参照は少なくとも1つを意味する。特定の実現例が説明されるが、これらの特定の実現例が例示的な目的のためにのみ提供されることが理解される。当業者であれば、他の構成要素および構成が、この発明の範囲および精神から逸脱することなく使用され得ることを認識するであろう。
【0008】
図面および詳細な説明全体にわたって同様の要素を示すために、共通の参照番号が使用され得る。したがって、ある図で使用される参照番号は、要素が別のところで説明される場合、そのような図に特有の詳細な説明において参照される場合もあり、または参照されない場合もある。
【0009】
高性能コンピューティング環境における仮想ルータポートにわたるSMP接続性チェックをサポートするためのシステムおよび方法がこの明細書中に記載される。
【0010】
この発明の以下の説明は、高性能ネットワークについての一例として、インフィニバンド(IB)ネットワークを使用する。以下の記載全体にわたり、インフィニバンド(InfiniBandTM)規格(インフィニバンド規格、IB規格またはレガシーIB規格ともさまざまに称される)を参照することができる。このような参照は、全体がこの明細書中に引用により援用されている、http://www.inifinibandta.orgから入手可能な、2015年3月に公開されたインフィニバンドトレードアーキテクチャ規格;第1号;バージョン1.3を参照するものと理解される。他のタイプの高性能ネットワークが何ら限定されることなく使用され得ることが、当業者には明らかであるだろう。以下の説明ではまた、ファブリックトポロジーについての一例として、ファットツリートポロジーを使用する。他のタイプのファブリックトポロジーが何ら限定されることなく使用され得ることが当業者には明らかであるだろう。
【0011】
現代(たとえばExascale(エクサスケール)時代)におけるクラウドの要求を満たすために、仮想マシンがリモート・ダイレクト・メモリ・アクセス(Remote Direct Memory Access:RDMA)などの低オーバーヘッドネットワーク通信パラダイムを利用できるこ
とが望ましい。RDMAはOSスタックをバイパスし、ハードウェアと直接通信することで、シングルルートI/O仮想化(Single-Root I/O Virtualization:SR-IOV)ネットワークアダプタのようなパススルー技術が使用可能となる。一実施形態に従うと、高性能な無損失相互接続ネットワークにおける適用可能性のために、仮想スイッチ(virtual switch:vSwitch)SR-IOVアーキテクチャを提供することができる。ライブマイグレーションを実際に選択できるようにするためにネットワーク再構成時間が重要となるので、ネットワークアーキテクチャに加えて、スケーラブルであるとともにトポロジーに依存しない動的な再構成メカニズムを提供することができる。
【0012】
一実施形態に従うと、さらには、vSwitchを用いる仮想化された環境のためのルーティング戦略を提供することができ、ネットワークトポロジー(たとえばファットツリートポロジー)のための効率的なルーティングアルゴリズムを提供することができる。動的な再構成メカニズムは、ファットツリーにおいて課されるオーバーヘッドを最小限にするためにさらに調整することができる。
【0013】
本発明の一実施形態に従うと、仮想化は、クラウドコンピューティングにおける効率的なリソース利用および融通性のあるリソース割当てに有益であり得る。ライブマイグレーションは、アプリケーションにトランスペアレントな態様で物理サーバ間で仮想マシン(virtual machine:VM)を移動させることによってリソース使用を最適化することを可
能にする。このため、仮想化は、ライブマイグレーションによる統合、リソースのオン・デマンド・プロビジョニングおよび融通性を可能にし得る。
【0014】
インフィニバンド(登録商標)
インフィニバンド(IB)は、インフィニバンド・トレード・アソシエーション(InfiniBandTM Trade Association)によって開発されたオープン標準無損失ネットワーク技術である。この技術は、特に高性能コンピューティング(high-performance computing:HPC)アプリケーションおよびデータセンタを対象とする、高スループットおよび少ない
待ち時間の通信を提供するシリアルポイントツーポイント全二重相互接続(serial point-to-point full-duplex interconnect)に基づいている。
【0015】
インフィニバンド・アーキテクチャ(InfiniBand Architecture:IBA)は、2層ト
ポロジー分割をサポートする。低層では、IBネットワークはサブネットと呼ばれ、1つのサブネットは、スイッチおよびポイントツーポイントリンクを使用して相互接続される一組のホストを含み得る。より高いレベルでは、1つのIBファブリックは、ルータを使用して相互接続され得る1つ以上のサブネットを構成する。
【0016】
1つのサブネット内で、ホストは、スイッチおよびポイントツーポイントリンクを使用して接続され得る。加えて、サブネットにおける指定されたデバイス上に存在する、1つのマスター管理エンティティ、すなわちサブネットマネージャ(subnet manager:SM)があり得る。サブネットマネージャは、IBサブネットを構成し、起動し、維持する役割を果たす。加えて、サブネットマネージャ(SM)は、IBファブリックにおいてルーティングテーブル計算を行なう役割を果たし得る。ここで、たとえば、IBネットワークのルーティングは、ローカルサブネットにおけるすべての送信元と宛先とのペア間の適正な負荷バランシングを目標とする。
【0017】
サブネット管理インターフェイスを通して、サブネットマネージャは、サブネット管理パケット(subnet management packet:SMP)と呼ばれる制御パケットを、サブネット管理エージェント(subnet management agent:SMA)と交換する。サブネット管理エ
ージェントは、すべてのIBサブネットデバイス上に存在する。SMPを使用することにより、サブネットマネージャは、ファブリックを発見し、エンドノードおよびスイッチを構成し、SMAから通知を受信することができる。
【0018】
一実施形態によれば、IBネットワークにおけるサブネット内のルーティングは、スイッチに格納されたリニアフォワーディングテーブル(linear forwarding table:LFT
)に基づき得る。LFTは、使用中のルーティングメカニズムに従って、SMによって計算される。サブネットでは、エンドノード上のホストチャネルアダプタ(Host Channel Adapter:HCA)ポートおよびスイッチが、ローカル識別子(local identifier:LID)を使用してアドレス指定される。LFTにおける各エントリは、宛先LID(destination LID:DLID)と出力ポートとからなる。テーブルにおけるLIDごとに1つのエ
ントリのみがサポートされる。パケットがあるスイッチに到着すると、その出力ポートは、そのスイッチのフォワーディングテーブルにおいてDLIDを検索することによって判断される。所与の送信元-宛先ペア(LIDペア)間のネットワークにおいてパケットは同じ経路を通るため、ルーティングは決定論的である。
【0019】
一般に、マスターサブネットマネージャを除く他のすべてのサブネットマネージャは、耐故障性のために待機モードで作動する。しかしながら、マスターサブネットマネージャが故障した状況では、待機中のサブネットマネージャによって、新しいマスターサブネットマネージャが取り決められる。マスターサブネットマネージャはまた、サブネットの周期的なスイープ(sweep)を行なってあらゆるトポロジー変化を検出し、それに応じてネ
ットワークを再構成する。
【0020】
さらに、サブネット内のホストおよびスイッチは、ローカル識別子(LID)を用いてアドレス指定され得るとともに、単一のサブネットは49151個のユニキャストLIDに制限され得る。サブネット内で有効なローカルアドレスであるLIDの他に、各IBデバイスは、64ビットのグローバル一意識別子(global unique identifier:GUID)を有し得る。GUIDは、IBレイヤー3(L3)アドレスであるグローバル識別子(global identifier:GID)を形成するために使用され得る。
【0021】
SMは、ネットワーク初期化時間に、ルーティングテーブル(すなわち、サブネット内のノードの各ペア間の接続/ルート)を計算し得る。さらに、トポロジーが変化するたびに、ルーティングテーブルは、接続性および最適性能を確実にするために更新され得る。通常動作中、SMは、トポロジー変化をチェックするためにネットワークの周期的なライトスイープ(light sweep)を実行し得る。ライトスイープ中に変化が発見された場合、
または、ネットワーク変化を信号で伝えるメッセージ(トラップ)をSMが受信した場合、SMは、発見された変化に従ってネットワークを再構成し得る。
【0022】
たとえば、SMは、リンクがダウンした場合、デバイスが追加された場合、またはリンクが除去された場合など、ネットワークトポロジーが変化する場合に、ネットワークを再構成し得る。再構成ステップは、ネットワーク初期化中に行なわれるステップを含み得る。さらに、再構成は、ネットワーク変化が生じたサブネットに制限されるローカルスコープを有し得る。また、ルータを用いる大規模ファブリックのセグメント化は、再構成スコープを制限し得る。
【0023】
一実施形態に従ったインフィニバンド環境100の例を示す
図1に、インフィニバンドファブリックの一例を示す。
図1に示す例では、ノードA101~E105は、インフィニバンドファブリック120を使用して、それぞれのホストチャネルアダプタ111~115を介して通信する。一実施形態に従うと、さまざまなノード(たとえばノードA101~E105)はさまざまな物理デバイスによって表わすことができる。一実施形態に従うと、さまざまなノード(たとえばノードA101~E105)は仮想マシンなどのさまざまな仮想デバイスによって表わすことができる。
【0024】
インフィニバンドにおけるパーティショニング
一実施形態によれば、IBネットワークは、ネットワークファブリックを共有するシステムの論理グループの分離をもたらすためにセキュリティメカニズムとしてパーティショニングをサポートし得る。ファブリックにおけるノード上の各HCAポートは、1つ以上のパーティションのメンバであり得る。パーティションメンバーシップは、SMの一部であり得る集中型パーティションマネージャによって管理される。SMは、各ポートに関するパーティションメンバーシップ情報を、16ビットのパーティションキー(partition key:P_Key)のテーブルとして構成することができる。SMはまた、これらのポー
トを介してデータトラフィックを送信または受信するエンドノードに関連付けられたP_Key情報を含むパーティション実施テーブルを用いて、スイッチポートおよびルータポートを構成することができる。加えて、一般的な場合には、スイッチポートのパーティションメンバーシップは、(リンクに向かう)出口方向に向かってポートを介してルーティングされたLIDに間接的に関連付けられたすべてのメンバーシップの集合を表わし得る。
【0025】
一実施形態に従うと、パーティションは、1グループのメンバが単に同じ論理グループの他のメンバと通信することができるようなポートの論理グループである。ホストチャネルアダプタ(host channel adapter:HCA)およびスイッチにおいて、分離を実施するためにパーティションメンバーシップ情報を用いてパケットをフィルタリングすることができる。無効なパーティショニング情報を備えたパケットは、パケットが受信ポートに到達すると直ちに削除され得る。パーティショニングされたIBシステムにおいては、パーティションはテナントクラスタを作成するために用いることができる。パーティションが適所で実施されていれば、ノードは、異なるテナントクラスタに属する他のノードと通信することができない。このようにして、安全性が損なわれたテナントノードまたは悪意あるテナントノードが存在する場合であっても、システムのセキュリティを保証することができる。
【0026】
一実施形態に従うと、ノード間における通信のために、管理キュー対((Queue Pair:QP)QP0およびQP1)を除いて、キュー対(Queue Pair:QP)およびエンドツーエンドコンテキスト(End-to-End context:EEC)を特定のパーティションに割当てることができる。次いで、P_Key情報は、送信されたすべてのIBトランスポートパケットに追加することができる。パケットがHCAポートまたはスイッチに到達すると、そのP_Key値はSMによって構成されたテーブルと突き合わせて確認することができる。無効なP_Key値が発見された場合、パケットは直接廃棄される。このようにして、通信はパーティションを共有するポート間でのみ許可される。
【0027】
一実施形態に従った、パーティショニングされたクラスタ環境の一例を示すIBパーティションの例が
図2に示される。
図2に示される例において、ノードA101~E105は、インフィニバンドファブリック120を用いて、それぞれのホストチャネルアダプタ111~115を介して通信する。ノードA~Eは、複数のパーティション、すなわちパーティション1 130、パーティション2 140およびパーティション3 150に配置される。パーティション1はノードA101およびノードD104を含む。パーティション2はノードA101、ノードB102およびノードC103を含む。パーティション3はノードC103およびノードE105を含む。パーティションの配置のせいで、ノードD104およびノードE105は、これらのノードがパーティションを共有していないために通信することが許可されない。一方で、たとえば、ノードA101およびノードC103は、これらのノードがともにパーティション2 140のメンバであるので、通信することが許可される。
【0028】
インフィニバンドにおける仮想マシン
過去10年の間に、ハードウェア仮想化サポートによってCPUオーバーヘッドが実質的に排除され、メモリ管理ユニットを仮想化することによってメモリオーバーヘッドが著しく削減され、高速SANストレージまたは分散型ネットワークファイルシステムの利用によってストレージオーバーヘッドが削減され、シングルルートI/O仮想化(Single Root Input/Output Virtualization:SR-IOV)のようなデバイス・パススルー技術
を使用することによってネットワークI/Oオーバーヘッドが削減されてきたことに応じて、仮想化された高性能コンピューティング(High Performance Computing:HPC)環境の将来見通しが大幅に改善されてきた。現在では、クラウドが、高性能相互接続ソリューションを用いて仮想HPC(virtual HPC:vHPC)クラスタに対応し、必要な性能
を提供することができる。
【0029】
しかしながら、インフィニバンド(IB)などの無損失ネットワークと連結されたとき、仮想マシン(VM)のライブマイグレーションなどのいくつかのクラウド機能は、これらのソリューションにおいて用いられる複雑なアドレス指定およびルーティングスキームのせいで、依然として問題となる。IBは、高帯域および低レイテンシを提供する相互接続ネットワーク技術であり、このため、HPCおよび他の通信集約型の作業負荷に非常によく適している。
【0030】
IBデバイスをVMに接続するための従来のアプローチは直接割当てされたSR-IOVを利用することによるものである。しかしながら、SR-IOVを用いてIBホストチャネルアダプタ(HCA)に割当てられたVMのライブマイグレーションを実現することは難易度の高いものであることが判明した。各々のIBが接続されているノードは、3つの異なるアドレス(すなわちLID、GUIDおよびGID)を有する。ライブマイグレーションが発生すると、これらのアドレスのうち1つ以上が変化する。マイグレーション中のVM(VM-in-migration)と通信する他のノードは接続性を失う可能性がある。これ
が発生すると、IBサブネットマネージャ(Subnet Manager:SM)にサブネット管理(
Subnet Administration:SA)経路記録クエリを送信することによって、再接続すべき
仮想マシンの新しいアドレスを突きとめることにより、失われた接続を回復させるように試みることができる。
【0031】
IBは3つの異なるタイプのアドレスを用いる。第1のタイプのアドレスは16ビットのローカル識別子(LID)である。少なくとも1つの固有のLIDは、SMによって各々のHCAポートおよび各々のスイッチに割当てられる。LIDはサブネット内のトラフィックをルーティングするために用いられる。LIDが16ビット長であるので、65536個の固有のアドレス組合せを構成することができ、そのうち49151個(0×0001-0×BFFF)だけをユニキャストアドレスとして用いることができる。結果として、入手可能なユニキャストアドレスの数は、IBサブネットの最大サイズを定義することとなる。第2のタイプのアドレスは、製造業者によって各々のデバイス(たとえば、HCAおよびスイッチ)ならびに各々のHCAポートに割当てられた64ビットのグローバル一意識別子(GUID)である。SMは、HCAポートに追加のサブネット固有GUIDを割当ててもよく、これは、SR-IOVが用いられる場合に有用となる。第3のタイプのアドレスは128ビットのグローバル識別子(GID)である。GIDは有効なIPv6ユニキャストアドレスであり、少なくとも1つが各々のHCAポートに割当てられている。GIDは、ファブリックアドミニストレータによって割当てられたグローバルに固有の64ビットプレフィックスと各々のHCAポートのGUIDアドレスとを組合わせることによって形成される。
【0032】
ファットツリー(Fat Tree:FTree)トポロジーおよびルーティング
一実施形態によれば、IBベースのHPCシステムのいくつかは、ファットツリートポロジーを採用して、ファットツリーが提供する有用な特性を利用する。これらの特性は、各送信元宛先ペア間の複数経路の利用可能性に起因する、フルバイセクション帯域幅および固有の耐故障性を含む。ファットツリーの背後にある初期の概念は、ツリーがトポロジーのルート(root)に近づくにつれて、より利用可能な帯域幅を用いて、ノード間のより太いリンクを採用することであった。より太いリンクは、上位レベルのスイッチにおける輻輳を回避するのに役立てることができ、バイセクション帯域幅が維持される。
【0033】
図3は、一実施形態に従った、ネットワーク環境におけるツリートポロジーの例を示す。
図3に示すように、ネットワークファブリック200において、1つ以上のエンドノード201~204が接続され得る。ネットワークファブリック200は、複数のリーフスイッチ211~214と複数のスパインスイッチまたはルート(root)スイッチ231~234とを含むファットツリートポロジーに基づき得る。加えて、ネットワークファブリック200は、スイッチ221~224などの1つ以上の中間スイッチを含み得る。
【0034】
また、
図3に示すように、エンドノード201~204の各々は、マルチホームノード、すなわち、複数のポートを介してネットワークファブリック200のうち2つ以上の部分に接続される単一のノード、であり得る。たとえば、ノード201はポートH1およびH2を含み、ノード202はポートH3およびH4を含み、ノード203はポートH5およびH6を含み、ノード204はポートH7およびH8を含み得る。
【0035】
加えて、各スイッチは複数のスイッチポートを有し得る。たとえば、ルートスイッチ231はスイッチポート1~2を有し、ルートスイッチ232はスイッチポート3~4を有し、ルートスイッチ233はスイッチポート5~6を有し、ルートスイッチ234はスイッチポート7~8を有し得る。
【0036】
一実施形態によれば、ファットツリールーティングメカニズムは、IBベースのファットツリートポロジーに関して最も人気のあるルーティングアルゴリズムのうちの1つであ
る。ファットツリールーティングメカニズムはまた、OFED(Open Fabric Enterprise
Distribution:IBベースのアプリケーションを構築しデプロイするための標準ソフト
ウェアスタック)サブネットマネージャ、すなわちOpenSMにおいて実現される。
【0037】
ファットツリールーティングメカニズムの目的は、ネットワークファブリックにおけるリンクにわたって最短経路ルートを均一に広げるLFTを生成することである。このメカニズムは、索引付け順序でファブリックを横断し、エンドノードの目標LID、ひいては対応するルートを各スイッチポートに割当てる。同じリーフスイッチに接続されたエンドノードについては、索引付け順序は、エンドノードが接続されるスイッチポートに依存し得る(すなわち、ポートナンバリングシーケンス)。各ポートについては、メカニズムはポート使用カウンタを維持することができ、新しいルートが追加されるたびに、ポート使用カウンタを使用して使用頻度が最小のポートを選択することができる。
【0038】
一実施形態に従うと、パーティショニングされたサブネットでは、共通のパーティションのメンバではないノードは通信することを許可されない。実際には、これは、ファットツリールーティングアルゴリズムによって割当てられたルートのうちのいくつかがユーザトラフィックのために使用されないことを意味する。ファットツリールーティングメカニズムが、それらのルートについてのLFTを、他の機能的経路と同じやり方で生成する場合、問題が生じる。この動作は、リンク上でバランシングを劣化させるおそれがある。なぜなら、ノードが索引付けの順序でルーティングされているからである。パーティションに気づかずにルーティングが行なわれ得るため、ファットツリーでルーティングされたサブネットにより、概して、パーティション間の分離が不良なものとなる。
【0039】
一実施形態に従うと、ファットツリーは、利用可能なネットワークリソースでスケーリングすることができる階層ネットワークトポロジーである。さらに、ファットツリーは、さまざまなレベルの階層に配置された商品スイッチを用いて容易に構築される。さらに、k-ary-n-tree、拡張された一般化ファットツリー(Extended Generalized Fat-Tree:XGFT)、パラレルポート一般化ファットツリー(Parallel Ports Generalized Fat-Tree:PGFT)およびリアルライフファットツリー(Real Life Fat-Tree:RLFT)を含むファットツリーのさまざまな変形例が、一般に利用可能である。
【0040】
また、k-ary-n-treeは、nレベルのファットツリーであって、knエンドノードと、n・kn_1スイッチとを備え、各々が2kポートを備えている。各々のスイッチは、ツリーにおいて上下方向に同数の接続を有している。XGFTファットツリーは、スイッチのための異なる数の上下方向の接続と、ツリーにおける各レベルでの異なる数の接続とをともに可能にすることによって、k-ary-n-treeを拡張させる。PGFT定義はさらに、XGFTトポロジーを拡張して、スイッチ間の複数の接続を可能にする。多種多様なトポロジーはXGFTおよびPGFTを用いて定義することができる。しかしながら、実用化するために、現代のHPCクラスタにおいて一般に見出されるファットツリーを定義するために、PGFTの制限バージョンであるRLFTが導入されている。RLFTは、ファットツリーにおけるすべてのレベルに同じポートカウントスイッチを用いている。
【0041】
入出力(Input/Output:I/O)仮想化
一実施形態に従うと、I/O仮想化(I/O Virtualization:IOV)は、基礎をなす物理リソースに仮想マシン(VM)がアクセスすることを可能にすることによって、I/Oを利用可能にすることができる。ストレージトラフィックとサーバ間通信とを組合せると、シングルサーバのI/Oリソースにとって抗し難い高い負荷が課され、結果として、データの待機中に、バックログが発生し、プロセッサがアイドル状態になる可能性がある。I/O要求の数が増えるにつれて、IOVにより利用可能性をもたらすことができ、最新
のCPU仮想化において見られる性能レベルに匹敵するように、(仮想化された)I/Oリソースの性能、スケーラビリティおよび融通性を向上させることができる。
【0042】
一実施形態に従うと、I/Oリソースの共有を可能にして、VMからリソースへのアクセスが保護されることを可能にし得るようなIOVが所望される。IOVは、VMにエクスポーズされる論理装置を、その物理的な実装から分離する。現在、エミュレーション、準仮想化、直接的な割当て(direct assignment:DA)、およびシングルルートI/O
仮想化(SR-IOV)などのさまざまなタイプのIOV技術が存在し得る。
【0043】
一実施形態に従うと、あるタイプのIOV技術としてソフトウェアエミュレーションがある。ソフトウェアエミュレーションは分離されたフロントエンド/バックエンド・ソフトウェアアーキテクチャを可能にし得る。フロントエンドはVMに配置されたデバイスドライバであり得、I/Oアクセスをもたらすためにハイパーバイザによって実現されるバックエンドと通信し得る。物理デバイス共有比率は高く、VMのライブマイグレーションはネットワークダウンタイムのわずか数ミリ秒で実現可能である。しかしながら、ソフトウェアエミュレーションはさらなる不所望な計算上のオーバーヘッドをもたらしてしまう。
【0044】
一実施形態に従うと、別のタイプのIOV技術として直接的なデバイスの割当てがある。直接的なデバイスの割当てでは、I/OデバイスをVMに連結する必要があるが、デバイスはVM間では共有されない。直接的な割当てまたはデバイス・パススルーは、最小限のオーバーヘッドでほぼ固有の性能を提供する。物理デバイスはハイパーバイザをバイパスし、直接、VMに取付けられている。しかしながら、このような直接的なデバイスの割当ての欠点は、仮想マシン間で共有がなされないため、1枚の物理ネットワークカードが1つのVMと連結されるといったように、スケーラビリティが制限されてしまうことである。
【0045】
一実施形態に従うと、シングルルートIOV(Single Root IOV:SR-IOV)は、
ハードウェア仮想化によって、物理装置がその同じ装置の複数の独立した軽量のインスタンスとして現われることを可能にし得る。これらのインスタンスは、パススルー装置としてVMに割当てることができ、仮想機能(Virtual Function:VF)としてアクセスすることができる。ハイパーバイザは、(1つのデバイスごとに)固有の、十分な機能を有する物理機能(Physical Function:PF)によってデバイスにアクセスする。SR-IO
Vは、純粋に直接的に割当てする際のスケーラビリティの問題を軽減する。しかしながら、SR-IOVによって提示される問題は、それがVMマイグレーションを損なう可能性があることである。これらのIOV技術の中でも、SR-IOVは、ほぼ固有の性能を維持しながらも、複数のVMから単一の物理デバイスに直接アクセスすることを可能にする手段を用いてPCI Express(PCIe)規格を拡張することができる。これにより、SR-IOVは優れた性能およびスケーラビリティを提供することができる。
【0046】
SR-IOVは、PCIeデバイスが、各々のゲストに1つの仮想デバイスを割当てることによって複数のゲスト間で共有することができる複数の仮想デバイスをエクスポーズすることを可能にする。各々のSR-IOVデバイスは、少なくとも1つの物理機能(PF)と、1つ以上の関連付けられた仮想機能(VF)とを有する。PFは、仮想マシンモニタ(virtual machine monitor:VMM)またはハイパーバイザによって制御される通
常のPCIe機能であるのに対して、VFは軽量のPCIe機能である。各々のVFはそれ自体のベースアドレス(base address:BAR)を有しており、固有のリクエスタIDが割当てられている。固有のリクエスタIDは、I/Oメモリ管理ユニット(I/O memory
management unit:IOMMU)がさまざまなVFへの/からのトラフィックストリームを区別することを可能にする。IOMMUはまた、メモリを適用して、PFとVFとの間
の変換を中断する。
【0047】
しかし、残念ながら、直接的デバイス割当て技術は、仮想マシンのトランスペアレントなライブマイグレーションがデータセンタ最適化のために所望されるような状況においては、クラウドプロバイダにとって障壁となる。ライブマイグレーションの本質は、VMのメモリ内容がリモートハイパーバイザにコピーされるという点である。さらに、VMがソースハイパーバイザにおいて中断され、VMの動作が宛先において再開される。ソフトウェアエミュレーション方法を用いる場合、ネットワークインターフェイスは、それらの内部状態がメモリに記憶され、さらにコピーされるように仮想的である。このため、ダウンタイムは数ミリ秒にまで減らされ得る。
【0048】
しかしながら、SR-IOVなどの直接的デバイス割当て技術が用いられる場合、マイグレーションはより困難になる。このような状況においては、ネットワークインターフェイスの内部状態全体は、それがハードウェアに結び付けられているのでコピーすることができない。代わりに、VMに割当てられたSR-IOV VFが分離され、ライブマイグレーションが実行されることとなり、新しいVFが宛先において付与されることとなる。インフィニバンドおよびSR-IOVの場合、このプロセスがダウンタイムを数秒のオーダでもたらす可能性がある。さらに、SR-IOV共有型ポートモデルにおいては、VMのアドレスがマイグレーション後に変化することとなり、これにより、SMにオーバーヘッドが追加され、基礎をなすネットワークファブリックの性能に対して悪影響が及ぼされることとなる。
【0049】
インフィニバンドSR-IOVアーキテクチャ-共有ポート
さまざまなタイプのSR-IOVモデル(たとえば共有ポートモデル、仮想スイッチモデルおよび仮想ポートモデル)があり得る。
【0050】
図4は、一実施形態に従った例示的な共有ポートアーキテクチャを示す。図に示されるように、ホスト300(たとえばホストチャネルアダプタ)はハイパーバイザ310と対話し得る。ハイパーバイザ310は、さまざまな仮想機能330、340および350をいくつかの仮想マシンに割当て得る。同様に、物理機能はハイパーバイザ310によって処理することができる。
【0051】
一実施形態に従うと、
図4に示されるような共有ポートアーキテクチャを用いる場合、ホスト(たとえばHCA)は、物理機能320と仮想機能330、350、350との間において単一の共有LIDおよび共有キュー対(Queue Pair:QP)のスペースがあるネットワークにおいて単一のポートとして現われる。しかしながら、各々の機能(すなわち、物理機能および仮想機能)はそれら自体のGIDを有し得る。
【0052】
図4に示されるように、一実施形態に従うと、さまざまなGIDを仮想機能および物理機能に割当てることができ、特別のキュー対であるQP0およびQP1(すなわちインフィニバンド管理パケットのために用いられる専用のキュー対)が物理機能によって所有される。これらのQPはVFにも同様にエクスポーズされるが、VFはQP0を使用することが許可されておらず(VFからQP0に向かって入来するすべてのSMPが廃棄され)、QP1は、PFが所有する実際のQP1のプロキシとして機能し得る。
【0053】
一実施形態に従うと、共有ポートアーキテクチャは、(仮想機能に割当てられることによってネットワークに付随する)VMの数によって制限されることのない高度にスケーラブルなデータセンタを可能にし得る。なぜなら、ネットワークにおける物理的なマシンおよびスイッチによってLIDスペースが消費されるだけであるからである。
【0054】
しかしながら、共有ポートアーキテクチャの欠点は、トランスペアレントなライブマイグレーションを提供することができない点であり、これにより、フレキシブルなVM配置についての可能性が妨害されてしまう。各々のLIDが特定のハイパーバイザに関連付けられており、かつハイパーバイザ上に常駐するすべてのVM間で共有されているので、マイグレートしているVM(すなわち、宛先ハイパーバイザにマイグレートする仮想マシン)は、そのLIDを宛先ハイパーバイザのLIDに変更させなければならない。さらに、QP0アクセスが制限された結果、サブネットマネージャはVMの内部で実行させることができなくなる。
【0055】
インフィニバンドSR-IOVアーキテクチャモデル-仮想スイッチ(vSwitch)
図5は、一実施形態に従った例示的なvSwitchアーキテクチャを示す。図に示されるように、ホスト400(たとえばホストチャネルアダプタ)はハイパーバイザ410と対話することができ、当該ハイパーバイザ410は、さまざまな仮想機能430、440および450をいくつかの仮想マシンに割当てることができる。同様に、物理機能はハイパーバイザ410によって処理することができる。仮想スイッチ415もハイパーバイザ401によって処理することができる。
【0056】
一実施形態に従うと、vSwitchアーキテクチャにおいては、各々の仮想機能430、440、450は完全な仮想ホストチャネルアダプタ(virtual Host Channel Adapter:vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSMについては、HCA400は、仮想スイッチ415を介して追加のノードが接続されているスイッチのように見えている。ハイパーバイザ410はPF420を用いることができ、(仮想機能に付与された)VMはVFを用いる。
【0057】
一実施形態に従うと、vSwitchアーキテクチャは、トランスペアレントな仮想化を提供する。しかしながら、各々の仮想機能には固有のLIDが割当てられているので、利用可能な数のLIDが速やかに消費される。同様に、多くのLIDアドレスが(すなわち、各々の物理機能および各々の仮想機能ごとに1つずつ)使用されている場合、より多くの通信経路をSMによって演算しなければならず、それらのLFTを更新するために、より多くのサブネット管理パケット(SMP)をスイッチに送信しなければならない。たとえば、通信経路の演算は大規模ネットワークにおいては数分かかる可能性がある。LIDスペースが49151個のユニキャストLIDに制限されており、(VFを介する)各々のVMとして、物理ノードおよびスイッチがLIDを1つずつ占有するので、ネットワークにおける物理ノードおよびスイッチの数によってアクティブなVMの数が制限されてしまい、逆の場合も同様に制限される。
【0058】
インフィニバンドSR-IOVアーキテクチャモデル-仮想ポート(vPort)
図6は、一実施形態に従った例示的なvPortの概念を示す。図に示されるように、ホスト300(たとえばホストチャネルアダプタ)は、さまざまな仮想機能330、340および350をいくつかの仮想マシンに割当てることができるハイパーバイザ410と対話することができる。同様に、物理機能はハイパーバイザ310によって処理することができる。
【0059】
一実施形態に従うと、ベンダーに実装の自由を与えるためにvPort概念は緩やかに定義されており(たとえば、当該定義では、実装がSRIOV専用とすべきであるとは規定されていない)、vPortの目的は、VMがサブネットにおいて処理される方法を標準化することである。vPort概念であれば、空間ドメインおよび性能ドメインの両方
においてよりスケーラブルであり得る、SR-IOV共有ポートのようなアーキテクチャおよびvSwitchのようなアーキテクチャの両方、または、これらのアーキテクチャの組合せが規定され得る。また、vPortはオプションのLIDをサポートするとともに、共有ポートとは異なり、SMは、vPortが専用のLIDを用いていなくても、サブネットにおいて利用可能なすべてのvPortを認識する。
【0060】
インフィニバンドSR-IOVアーキテクチャモデル-LIDが予めポピュレートされたvSwitch
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
【0061】
図7は、一実施形態に従った、LIDが予めポピュレートされた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501~504は、ネットワーク切替環境600(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。さらに、ホストチャネルアダプタ510、520および530は、それぞれ、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550はハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当て、仮想マシン3
552を仮想機能3 516に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上で十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
【0062】
一実施形態に従うと、スイッチ501~504の各々はいくつかのポート(図示せず)を含み得る。いくつかのポートは、ネットワーク切替環境600内においてトラフィックを方向付けるためにリニアフォワーディングテーブルを設定するのに用いられる。
【0063】
一実施形態に従うと、仮想スイッチ512、522および532は、それぞれのハイパーバイザ511、521、531によって処理することができる。このようなvSwitchアーキテクチャにおいては、各々の仮想機能は完全な仮想ホストチャネルアダプタ(vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSM(図示せず)については、HCA510、520および530は、仮想スイッチを介して追加のノードが接続されているスイッチのように見えている。
【0064】
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
図7を参照すると、LIDは、さまざまな物理機能513、523および533に、さらには、仮想機能514~516、524~526、534~536(その時点でアクティブな仮想マシンに関連付けられていない仮想機能であっても)にも、予めポピュレートされている。たとえば、物理機能513はLID1が予めポピュレートされており、仮想機能1 534はLID10が予めポピュレートされている。ネットワークがブートされているとき、LIDはSR-IOV vSwitch対応のサブネットにおいて予めポピュレートされている。VFのすべてがネットワークにおけるVMによって占有されていない場合であっても、ポピュレ
ートされたVFには、
図7に示されるようにLIDが割当てられている。
【0065】
一実施形態に従うと、多くの同様の物理的なホストチャネルアダプタが2つ以上のポートを有することができ(冗長性のために2つのポートが共用となっている)、仮想HCAも2つのポートで表わされ、1つまたは2つ以上の仮想スイッチを介して外部IBサブネットに接続され得る。
【0066】
一実施形態に従うと、LIDが予めポピュレートされたvSwitchアーキテクチャにおいては、各々のハイパーバイザは、それ自体のための1つのLIDをPFを介して消費し、各々の追加のVFごとに1つ以上のLIDを消費することができる。IBサブネットにおけるすべてのハイパーバイザにおいて利用可能なすべてのVFを合計すると、サブネットにおいて実行することが可能なVMの最大量が得られる。たとえば、サブネット内の1ハイパーバイザごとに16個の仮想機能を備えたIBサブネットにおいては、各々のハイパーバイザは、サブネットにおいて17個のLID(16個の仮想機能ごとに1つのLIDと、物理機能のために1つのLID)を消費する。このようなIBサブネットにおいては、単一のサブネットについて理論上のハイパーバイザ限度は利用可能なユニキャストLIDの数によって規定されており、(49151個の利用可能なLIDをハイパーバイザごとに17個のLIDで割って得られる)2891であり、VMの総数(すなわち限度)は(ハイパーバイザごとに2891個のハイパーバイザに16のVFを掛けて得られる)46256である(実質的には、IBサブネットにおける各々のスイッチ、ルータまたは専用のSMノードが同様にLIDを消費するので、これらの数は実際にはより小さくなる)。なお、vSwitchが、LIDをPFと共有することができるので、付加的なLIDを占有する必要がないことに留意されたい。
【0067】
一実施形態に従うと、LIDが予めポピュレートされたvSwitchアーキテクチャにおいては、ネットワークが最初にブートされるときに、すべてのLIDについて通信経路が計算される。新しいVMを始動させる必要がある場合、システムは、サブネットにおいて新しいLIDを追加する必要はない。それ以外の場合、経路の再計算を含め、ネットワークを完全に再構成させ得る動作は、最も時間を消費する要素となる。代わりに、VMのための利用可能なポートはハイパーバイザのうちの1つに位置し(すなわち利用可能な仮想機能)、仮想マシンは利用可能な仮想機能に付与されている。
【0068】
一実施形態に従うと、LIDが予めポピュレートされたvSwitchアーキテクチャはまた、同じハイパーバイザによってホストされているさまざまなVMに達するために、さまざまな経路を計算して用いる能力を可能にする。本質的には、これは、LIDを連続的にすることを必要とするLMCの制約によって拘束されることなく、1つの物理的なマシンに向かう代替的な経路を設けるために、このようなサブネットおよびネットワークがLIDマスク制御ライク(LID-Mask-Control-like:LMCライク)な特徴を用いること
を可能にする。VMをマイグレートしてその関連するLIDを宛先に送達する必要がある場合、不連続なLIDを自由に使用できることは特に有用となる。
【0069】
一実施形態に従うと、LIDが予めポピュレートされたvSwitchアーキテクチャについての上述の利点と共に、いくつかの検討事項を考慮に入れることができる。たとえば、ネットワークがブートされているときに、SR-IOV vSwitch対応のサブネットにおいてLIDが予めポピュレートされているので、(たとえば起動時の)最初の経路演算はLIDが予めポピュレートされていなかった場合よりも時間が長くかかる可能性がある。
【0070】
インフィニバンドSR-IOVアーキテクチャモデル-動的LID割当てがなされたvSwitch
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
【0071】
図8は、一実施形態に従った、動的LID割当てがなされた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501~504は、ネットワーク切替環境700(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックは、ホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、さらに、ハイパーバイザ511、521および531とそれぞれ対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550はハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当て、仮想マシン3 552を仮想機能3 516に割当てることができる。ハイパーバイザ531はさらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
【0072】
一実施形態に従うと、スイッチ501~504の各々はいくつかのポート(図示せず)を含み得る。いくつかのポートは、ネットワーク切替環境700内においてトラフィックを方向付けるためにリニアフォワーディングテーブルを設定するのに用いられる。
【0073】
一実施形態に従うと、仮想スイッチ512、522および532は、それぞれのハイパーバイザ511、521および531によって処理することができる。このようなvSwitchアーキテクチャにおいては、各々の仮想機能は完全な仮想ホストチャネルアダプタ(vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSM(図示せず)については、HCA510、520および530は、仮想スイッチを介して、追加のノードが接続されているスイッチのように見えている。
【0074】
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
図8を参照すると、LIDには、さまざまな物理機能513、523および533が動的に割当てられており、物理機能513がLID1を受取り、物理機能523がLID2を受取り、物理機能533がLID3を受取る。アクティブな仮想マシンに関連付けられたそれらの仮想機能はまた、動的に割当てられたLIDを受取ることもできる。たとえば、仮想マシン1 550がアクティブであり、仮想機能1 514に関連付けられているので、仮想機能514にはLID5が割当てられ得る。同様に、仮想機能2 515、仮想機能3 516および仮想機能1 534は、各々、アクティブな仮想機能に関連付けられている。このため、これらの仮想機能にLIDが割当てられ、LID7が仮想機能2 515に割当てられ、LID11が仮想機能3 516に割当てられ、LID9が仮想機能1 534に割当てられている。LIDが予めポピュレートされたvSwitchとは異なり、アクティブな仮想マシンにその時点で関連付けられていない仮想機能はLIDの割当てを受けない。
【0075】
一実施形態に従うと、動的LID割当てがなされていれば、最初の経路演算を実質的に減らすことができる。ネットワークが初めてブートしており、VMが存在していない場合、比較的少数のLIDを最初の経路計算およびLFT分配のために用いることができる。
【0076】
一実施形態に従うと、多くの同様の物理的なホストチャネルアダプタが2つ以上のポートを有することができ(冗長性のために2つのポートが共用となっている)、仮想HCAも2つのポートで表わされ、1つまたは2つ以上の仮想スイッチを介して外部IBサブネットに接続され得る。
【0077】
一実施形態に従うと、動的LID割当てがなされたvSwitchを利用するシステムにおいて新しいVMが作成される場合、どのハイパーバイザ上で新しく追加されたVMをブートすべきであるかを決定するために、自由なVMスロットが発見され、固有の未使用のユニキャストLIDも同様に発見される。しかしながら、新しく追加されたLIDを処理するためのスイッチのLFTおよびネットワークに既知の経路が存在しない。新しく追加されたVMを処理するために新しいセットの経路を演算することは、いくつかのVMが毎分ごとにブートされ得る動的な環境においては望ましくない。大規模なIBサブネットにおいては、新しい1セットのルートの演算には数分かかる可能性があり、この手順は、新しいVMがブートされるたびに繰返されなければならないだろう。
【0078】
有利には、一実施形態に従うと、ハイパーバイザにおけるすべてのVFがPFと同じアップリンクを共有しているので、新しいセットのルートを演算する必要はない。ネットワークにおけるすべての物理スイッチのLFTを繰返し、(VMが作成されている)ハイパーバイザのPFに属するLIDエントリから新しく追加されたLIDにフォワーディングポートをコピーし、かつ、特定のスイッチの対応するLFTブロックを更新するために単一のSMPを送信するだけでよい。これにより、当該システムおよび方法では、新しいセットのルートを演算する必要がなくなる。
【0079】
一実施形態に従うと、動的LID割当てアーキテクチャを備えたvSwitchにおいて割当てられたLIDは連続的である必要はない。各々のハイパーバイザ上のVM上で割当てられたLIDをLIDが予めポピュレートされたvSwitchと動的LID割当てがなされたvSwitchとで比較すると、動的LID割当てアーキテクチャにおいて割当てられたLIDが不連続であり、そこに予めポピュレートされたLIDが本質的に連続的となっていることが分かるだろう。さらに、vSwitch動的LID割当てアーキテクチャにおいては、新しいVMが作成されると、次に利用可能なLIDが、VMの生存期間の間中ずっと用いられる。逆に、LIDが予めポピュレートされたvSwitchにおいては、各々のVMは、対応するVFに既に割当てられているLIDを引継ぎ、ライブマイグレーションのないネットワークにおいては、所与のVFに連続的に付与されたVMが同じLIDを得る。
【0080】
一実施形態に従うと、動的LID割当てアーキテクチャを備えたvSwitchは、いくらかの追加のネットワークおよびランタイムSMオーバーヘッドを犠牲にして、予めポピュレートされたLIDアーキテクチャモデルを備えたvSwitchの欠点を解決することができる。VMが作成されるたびに、作成されたVMに関連付けられた、新しく追加されたLIDで、サブネットにおける物理スイッチのLFTが更新される。この動作のために、1スイッチごとに1つのサブネット管理パケット(SMP)が送信される必要がある。各々のVMがそのホストハイパーバイザと同じ経路を用いているので、LMCのような機能も利用できなくなる。しかしながら、すべてのハイパーバイザに存在するVFの合計に対する制限はなく、VFの数は、ユニキャストLIDの限度を上回る可能性もある。このような場合、当然、アクティブなVM上でVFのすべてが必ずしも同時に付与されることが可能になるわけではなく、より多くの予備のハイパーバイザおよびVFを備えることにより、ユニキャストLID限度付近で動作する際に、断片化されたネットワークの障害を回復および最適化させるための融通性が追加される。
【0081】
インフィニバンドSR-IOVアーキテクチャモデル-動的LID割当てがなされかつLIDが予めポピュレートされたvSwitch
図9は、一実施形態に従った、動的LID割当てがなされてLIDが予めポピュレートされたvSwitchを備えた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501~504は、ネットワーク切替環境800(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、それぞれ、さらに、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550は、ハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2
551を仮想機能2 515に割当てることができる。ハイパーバイザ521は、仮想マシン3 552を仮想機能3 526に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能2 535に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
【0082】
一実施形態に従うと、スイッチ501~504の各々はいくつかのポート(図示せず)を含み得る。これらいくつかのポートは、ネットワーク切替環境800内においてトラフィックを方向付けるためにリニアフォワーディングテーブルを設定するのに用いられる。
【0083】
一実施形態に従うと、仮想スイッチ512、522および532は、それぞれのハイパーバイザ511、521、531によって処理することができる。このようなvSwitchアーキテクチャにおいては、各々の仮想機能は、完全な仮想ホストチャネルアダプタ(vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSM(図示せず)については、HCA510、520および530は、仮想スイッチを介して、追加のノードが接続されているスイッチのように見えている。
【0084】
一実施形態に従うと、本開示は、動的LID割当てがなされLIDが予めポピュレートされたハイブリッドvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
図9を参照すると、ハイパーバイザ511には、予めポピュレートされたLIDアーキテクチャを備えたvSwitchが配置され得るとともに、ハイパーバイザ521には、LIDが予めポピュレートされて動的LID割当てがなされたvSwitchが配置され得る。ハイパーバイザ531には、動的LID割当てがなされたvSwitchが配置され得る。このため、物理機能513および仮想機能514~516には、それらのLIDが予めポピュレートされている(すなわち、アクティブな仮想マシンに付与されていない仮想機能であってもLIDが割当てられている)。物理機能523および仮想機能1 524にはそれらのLIDが予めポピュレートされ得るとともに、仮想機能2 525および仮想機能3 526にはそれらのLIDが動的に割当てられている(すなわち、仮想機能2 525は動的LID割当てのために利用可能であり、仮想機能3 526は、仮想マシン3 552が付与されているので、11というLIDが動的に割当てられている)。最後に、ハイパーバイザ3 531に関連付けられた機能(物理機能および仮想機能)にはそれらのLIDを動的に割当てることができる。これにより、結果として、仮想機能1 534および仮想機能3 536が動的LID割当てのために利用可能と
なるとともに、仮想機能2 535には、仮想マシン4 553が付与されているので、9というLIDが動的に割当てられている。
【0085】
LIDが予めポピュレートされたvSwitchおよび動的LID割当てがなされたvSwitchがともに(いずれかの所与のハイパーバイザ内で独立して、または組合わされて)利用されている、
図9に示されるような一実施形態に従うと、ホストチャネルアダプタごとの予めポピュレートされたLIDの数はファブリックアドミニストレータによって定義することができ、(ホストチャネルアダプタごとに)0<=予めポピュレートされたVF<=総VFの範囲内になり得る。動的LID割当てのために利用可能なVFは、(ホストチャネルアダプタごとに)VFの総数から予めポピュレートされたVFの数を減じることによって見出すことができる。
【0086】
一実施形態に従うと、多くの同様の物理的なホストチャネルアダプタが2つ以上のポートを有することができ(冗長性のために2つのポートが共用となっている)、仮想HCAも2つのポートで表わされ、1つまたは2つ以上の仮想スイッチを介して外部IBサブネットに接続され得る。
【0087】
インフィニバンド-サブネット間通信(ファブリックマネージャ)
一実施形態に従うと、単一のサブネット内においてインフィニバンドファブリックを提供することに加えて、本開示の実施形態はまた、2つ以上のサブネットにわたるインフィニバンドファブリックを提供することができる。
【0088】
図10は、一実施形態に従った、例示的なマルチサブネットインフィニバンドファブリックを示す。図に示されるように、サブネットA1000内において、いくつかのスイッチ1001~1004は、インフィニバンドファブリックなどのファブリックのメンバ間でサブネットA 1000(たとえばIBサブネット)内における通信を提供することができる。ファブリックは、たとえばチャネルアダプタ1010などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ1010は、さらに、ハイパーバイザ1011と対話し得る。ハイパーバイザは、さらに、それが対話するホストチャネルアダプタと共に、いくつかの仮想機能1014を設定し得る。ハイパーバイザは、加えて、仮想機能1 1014に割当てられている仮想マシン1 1015などの仮想マシンを仮想機能の各々に割当て得る。ハイパーバイザは、ホストチャネルアダプタの各々の上で、物理機能1013などの十分な機能を有する物理機能によって、それらの関連付けられたホストチャネルアダプタにアクセスし得る。サブネットB1040内では、いくつかのスイッチ1021~1024は、インフィニバンドファブリックなどのファブリックのメンバ間でサブネットB1040(たとえばIBサブネット)内において通信を提供し得る。ファブリックは、たとえばチャネルアダプタ1030などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ1030は、さらに、ハイパーバイザ1031と対話し得る。ハイパーバイザは、さらに、それが対話するホストチャネルアダプタと共に、いくつかの仮想機能1034を設定し得る。ハイパーバイザは、加えて、仮想機能2 1034に割当てられている仮想マシン2 1035などの仮想マシンを仮想機能の各々に割当て得る。ハイパーバイザは、各々のホストチャネルアダプタ上で、物理機能1033などの十分な機能を有する物理機能によってそれらの関連付けられたホストチャネルアダプタにアクセスし得る。なお、1つのホストチャネルアダプタだけが各々のサブネット(すなわちサブネットAおよびサブネットB)内において図示されているが、複数のホストチャネルアダプタおよびそれらの対応するコンポーネントが各々のサブネット内に含まれ得ることが理解されるはずである。
【0089】
一実施形態に従うと、上述のとおり、ホストチャネルアダプタの各々は、加えて、仮想スイッチ1012および仮想スイッチ1032などの仮想スイッチに関連付けられ得ると
ともに、各々のHCAはさまざまなアーキテクチャモデルで設定され得る。
図10内における両方のサブネットは予めポピュレートされたLIDアーキテクチャモデルを備えたvSwitchを用いるものとして示されているが、これは、このようなすべてのサブネット構成が同様のアーキテクチャモデルに従うべきであることを示唆するよう意図したものではない。
【0090】
一実施形態に従うと、サブネットA1000内のスイッチ1002がルータ1005に関連付けられ、サブネットB1040内のスイッチ1021がルータ1006に関連付けられているなどのように、各々サブネット内の少なくとも1つのスイッチがルータに関連付けられ得る。
【0091】
一実施形態に従うと、少なくとも1つのデバイス(たとえばスイッチ、ノード…など)は、ファブリックマネージャ(図示せず)に関連付けられ得る。ファブリックマネージャを用いることにより、たとえば、サブネット間ファブリックトポロジーを発見し、ファブリックプロファイル(たとえば仮想マシンファブリックプロファイル)を作成し、仮想マシンファブリックプロファイルを構築するための基礎を形成する仮想マシン関連のデータベースオブジェクトを構築することができる。加えて、ファブリックマネージャは、どのサブネットが、どのルータポートを介して、どのパーティション番号を用いて通信することが許可されているかについて、法的なサブネット間接続性を定義し得る。
【0092】
一実施形態に従うと、サブネットA内における仮想マシン1などの送信元におけるトラフィックが、サブネットB内の仮想マシン2などの異なるサブネットにおける宛先にアドレス指定されると、トラフィックは、サブネットA内のルータ(すなわち、ルータ1005)にアドレス指定され得る、次いで、ルータ1005は、ルータ1006とのリンクを介してサブネットBにトラフィックを渡し得る。
【0093】
仮想デュアルポートルータ
一実施形態に従うと、デュアルポートルータの抽象化は、サブネットとサブネットとの間のルータ機能が、通常のLRHベースの切替えを実行することに加えて、グローバル・ルート・ヘッダ(global route header:GRH)とローカル・ルート・ヘッダ(local route header:LRH)との変換を実行する能力を有するスイッチハードウェア実装に基
づいて定義されることを可能にするための単純な方法を提供することができる。
【0094】
一実施形態に従うと、仮想デュアルポートルータは、対応するスイッチポートの外部に論理的に接続され得る。この仮想デュアルポートルータは、サブネットマネージャなどの標準的な管理エンティティにインフィニバンド規格対応の概念を提供することができる。
【0095】
一実施形態に従うと、デュアルポート・ルータモデルは、各々のサブネットが、サブネットに対する入口経路におけるアドレスマッピングおよびパケットの転送を十分に制御するような態様で、かつ、不正確に接続されたサブネットのいずれかの内部におけるルーティングおよび論理接続性に影響を及ぼすことなく、さまざまなサブネットが接続可能であることを示唆している。
【0096】
一実施形態に従うと、不正確に接続されたファブリックを伴う状況においては、仮想デュアルポートルータ抽象化を用いることにより、リモートサブネットに対して意図せず物理的に接続性している状態でサブネットマネージャおよびIB診断ソフトウェアなどの管理エンティティが正確に機能することをも可能にし得る。
【0097】
図11は、一実施形態に従った、高性能コンピューティング環境における2つのサブネット間の相互接続を示す。仮想デュアルポートルータを備えた構成に先だって、サブネッ
トA1101におけるスイッチ1120は、スイッチ1120のスイッチポート1121を通じて、物理的接続1110を介し、サブネットB1102におけるスイッチ1130に、スイッチ1130のスイッチポート1131を介して接続され得る。このような実施形態においては、各々のスイッチポート1121および1131は、スイッチポートおよびルータポートの両方の機能を果たし得る。
【0098】
一実施形態に従うと、この構成に関する問題は、インフィニバンドサブネットにおけるサブネットマネージャなどの管理エンティティが、スイッチポートおよびルータポートの両方である物理ポートを区別することができない点である。このような状況においては、SMは、スイッチポートを、そのスイッチポートに接続されたルータポートを有するものとして取扱うことができる。しかしながら、スイッチポートが、別のサブネットマネージャとともに、たとえば物理リンクを介して別のサブネットに接続される場合、サブネットマネージャは物理リンク上で発見メッセージを送出することができる。しかしながら、このような発見メッセージは他のサブネットにおいて許可することはできない。
【0099】
図12は、一実施形態に従った、高性能コンピューティング環境におけるデュアルポート仮想ルータ構成を介する2つのサブネット間の相互接続を示す。
【0100】
一実施形態に従うと、構成後、あるサブネットマネージャが担当しているサブネットの端部を表わしている適切なエンドノードを当該サブネットマネージャが認識するように、デュアルポート仮想ルータ構成が提供され得る。
【0101】
一実施形態に従うと、サブネットA1201におけるスイッチ1220において、スイッチポートは、仮想リンク1223を介して仮想ルータ1210におけるルータポート1211に接続(すなわち、論理的に接続)され得る。仮想ルータ1210(たとえばデュアルポート仮想ルータ)は、スイッチ1220の外部にあるものとして示されており、実施形態においては、スイッチ1220内に論理的に含まれ得るものであるが、第2のルータポート(ルータポートII1212)を含み得る。一実施形態に従うと、2つの端部を有し得る物理リンク1203は、ルータポートII1212と、サブネットB1202における仮想ルータ1230に含まれるルータポートII1232とを介して、物理リンクの第1の端部を介するサブネットA1201を、物理リンクの第2の端部を介するサブネットB1202と、接続することができる。仮想ルータ1230は、加えて、ルータポート1231を含み得る。ルータポート1231は、仮想リンク1233を介して、スイッチ1240上のスイッチポート1241に接続(すなわち、論理的に接続)され得る。
【0102】
一実施形態に従うと、サブネットA上のサブネットマネージャ(図示せず)は、サブネットマネージャが制御するサブネットのエンドポイントとして、仮想ルータ1210上においてルータポート1211を検出し得る。デュアルポート仮想ルータ抽象化は、サブネットA上のサブネットマネージャが、(たとえば、インフィニバンド規格に準拠して定義されるような)通常の態様でサブネットAを処理することを可能にし得る。サブネット管理エージェントレベルにおいて、SMが通常のスイッチポートを認識するように、デュアルポート仮想ルータ抽象化が提供され得るとともに、SMAレベルにおいては、スイッチポートに接続された別のポートが存在する抽象化が行なわれ、このポートはデュアルポート仮想ルータ上のルータポートとなる。ローカルSMにおいては、従来のファブリックトポロジーを使用し続けることができる(SMは当該ポートをトポロジーにおける標準スイッチポートとして認識する)。このため、SMはルータポートをエンドポートとして認識する。物理的接続は、2つの異なるサブネットにおけるルータポートとしても構築される2つのスイッチポート間において構成され得る。
【0103】
一実施形態に従うと、デュアルポート仮想ルータはまた、物理リンクが同じサブネット
における他の何らかのスイッチポートに、または、別のサブネットに接続されるよう意図されていなかったスイッチポートに、間違って接続され得るという問題を解決することもできる。したがって、この明細書中に記載される方法およびシステムはまた、サブネットの外部に存在するものも表わしている。
【0104】
一実施形態に従うと、サブネットAなどのサブネット内においては、ローカルSMがスイッチポートを決定し、次いで、そのスイッチポートに接続されるルータポート(たとえば、仮想リンク1223を介してスイッチポート1221に接続されるルータポート1211)を決定する。SMが、当該SMが管理しているサブネットの端部としてルータポート1211を認識するので、SMは、この点(たとえばルータポートII1212)を越えて発見メッセージおよび/または管理メッセージを送信することができない。
【0105】
一実施形態に従うと、上述のデュアルポート仮想ルータは、デュアルポート仮想ルータが属するサブネット内において、デュアルポート仮想ルータ抽象化が管理エンティティ(たとえばSMまたはSMA)によって完全に管理されるという利点を提供する。ローカル側でのみ管理を許可することにより、システムは、外部の独立した管理エンティティを提供する必要がなくなる。すなわち、サブネット接続に対するサブネットの両サイドが、それ自体のデュアルポート仮想ルータを構成する役割を果たし得る。
【0106】
一実施形態に従うと、離れた宛先(すなわち、ローカルサブネットの外側)にアドレス指定されているSMPなどのパケットが上述のデュアルポート仮想ルータとして構成されていないローカルターゲットポートに到達する状況においては、ローカルポートは、それがルータポートではないことを規定するメッセージを戻すことができる。
【0107】
本発明の多くの特徴は、ハードウェア、ソフトウェア、ファームウェアまたはそれらの組合せにおいて、それらを用いて、またはそれらの支援により、実行可能である。したがって、本発明の特徴は、(たとえば、1つ以上のプロセッサを含む)処理システムを用いて実現され得る。
【0108】
図13は、一実施形態に従った、高性能コンピューティング環境におけるデュアルポート仮想ルータをサポートするための方法を示す。ステップ1310において、当該方法は、1つ以上のマイクロプロセッサを含む1つ以上のコンピュータにおいて、第1のサブネットを提供し得る。第1のサブネットは複数のスイッチを含み、複数のスイッチは少なくともリーフスイッチを含む。複数のスイッチの各々は複数のスイッチポートを含む。第1のサブネットはさらに、複数のホストチャネルアダプタを含む。各々のホストチャネルアダプタは少なくとも1つのホストチャネルアダプタポートを含む。第1のサブネットはさらに、複数のエンドノードを含む。エンドノードの各々は、複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられている。第1のサブネットはさらに、複数のスイッチおよび複数のホストチャネルアダプタのうち1つの上で実行しているサブネットマネージャを含む。
【0109】
ステップ1320において、当該方法は、複数のスイッチのうち1スイッチ上において複数のスイッチポートのうち1スイッチポートをルータポートとして構成し得る。
【0110】
ステップ1330において、当該方法は、ルータポートとして構成されたスイッチポートを仮想ルータに論理的に接続し得る。仮想ルータは少なくとも2つの仮想ルータポートを含む。
【0111】
SMPベースの接続性チェックを可能にするためのルータSMA抽象化
一実施形態に従うと、サブネット管理パケット(Subnet Management Packet:SMP)
は、パケットがルータポートを越えて送信されるであろうことを示唆するアドレス指定情報を有することが許可されていない。しかしながら、(仮想)ルータポートの遠隔側での物理的接続性の発見(すなわち、遠隔接続性のローカルな発見)を可能にするために、SMA属性の新しいセットが定義され得る。この場合、このような各々の新しい属性は、標準的なSMA属性またはベンダー特有のSMA属性とともに「遠隔情報」を表わしている。
【0112】
一実施形態に従うと、ルータSMAが「遠隔」情報/属性を表わす属性を処理すると、次いで、対応するSMP要求は、元の要求の送信側に完全にトランスペアレントな態様で外部の物理リンク上で送信することができる。
【0113】
一実施形態に従うと、ローカルSMAは、受信要求とは無関係に遠隔からの発見を実行して関連情報をローカルにキャッシュすることを選択し得るか、または、単純なプロキシのように動作して、「遠隔」情報/属性を指定する要求を受取るたびに外部リンクに対する対応する要求を生成し得る。
【0114】
一実施形態に従うと、「遠隔」属性を要求するSMPがローカルサブネット側(すなわち、ローカルスイッチポートに論理的に接続されている仮想ルータポート)から、または外部リンク(すなわち、仮想ルータの遠隔側)から、受取られたかどうかを追跡することによって、SMA実装は、ローカルサブネットにおける元の要求を表現する観点、または、ピアルータポートからのプロキシ要求を表現する観点から、遠隔要求がどの程度まで有効であるかを追跡することができる。
【0115】
一実施形態に従うと、IB規格に準拠したSMの場合、ルータポートはサブネットにおけるエンドポートである。このため、(発見に用いられてサブネットを構成する)低レベルSMPはルータポートにわたって送信することができない。しかしながら、サブネット間トラフィックのためのルートを維持するために、ローカルSMまたはファブリックマネージャは、ローカルリソースのいずれかの構成を構築する前に、物理リンクの遠隔側での物理的接続性を観察可能である必要がある。しかしながら、遠隔接続性を認識したいとの要望に関して、SMは、物理リンクの遠隔側を構成することを許可することができない(すなわち、SMの構成はそれ自体のサブネット内に含まれていなければならない)。
【0116】
一実施形態に従うと、SMAモデル拡張は、ローカルルータポートにアドレス指定されているパケット(すなわちSMP)を送信する可能性を考慮に入れている。パケットがアドレス指定されているSMAは、パケットを受取り得るとともに、次いで、要求された情報が(たとえば、サブネットにわたる物理リンクによって接続されている)リモートノード上にあることを定義している新しい属性を適用し得る。
【0117】
一実施形態に従うと、SMAは、プロキシとして動作する(SMPを受取って別の要求を送信する)ことができるか、または、SMAは元のパケットを変更して、これをサブネット間パケットとして送信することができる。SMAは、パケットにおけるアドレス情報を更新することができる。これにより、SMPに対する1ホップ・ダイレクトルート経路の追加が更新される。次いで、リモートノード(ルータポート)によってSMPを受取ることができる。SMPは、リモートエンド上のノードが同じ態様で(たとえば仮想ルータとして)構成されているか、または、基本的なスイッチポート(たとえば、レガシースイッチ実装に対する物理的接続性)として構成されているかどうかとは無関係に、機能し得る。次いで、受信ノードが認識し得る要求パケットは基本的な要求となり、通常の態様で応答することとなる。実際には、サブネットを越えて発信された要求は受信ノードに対してトランスペアレント(不可視)である。
【0118】
一実施形態に従うと、これは、抽象化を利用することによって、ローカルサブネットによるリモートサブネットの発見を可能にする。提供されるSMA抽象化は、遠隔側で、ローカルな(すなわち、実行中のサブネット発見からは離れている)サブネットから問合わせされていたことを認識することなく、(たとえば物理リンクにわたって)リモートサブネットから情報を検索することを可能にする。
【0119】
アドレス指定スキーム
一実施形態に従うと、IB規格と準拠させたままにするために、SMPパケットは、サブネットの境界によって連結されている(すなわち、SMは、それが関連付けられているサブネットの外にある情報を「認識する」かまたは発見することが許可されていない)。しかしながら、仮想ルータポートのリモートエンドからの接続性情報などの情報(すなわち、サブネット境界を越えた1「ホップ」)を検索する必要性が依然として存在する。この情報は、ベンダー特有のSMP(vendor specific SMP:VSMP)と称され得る特別
なタイプのSMPに符号化することができる。
【0120】
一実施形態に従うと、VSMPは、概して、一般的なSMP(サブネット向けのSMP)と同様のアドレス指定方式を利用することができ、DR(Directed Routing(ダイレクティッドルーティング):この場合、SMPは、スイッチ間を移動しているときにどのポートから生じているかを明確に示すことができる)およびLIDの両方のルーティングを用いることができる。しかしながら、ルータポートのリモートエンドに適用され得る属性のために、属性修飾子におけるシングルビットを用いてローカルポート対リモートポートを示すことができる。属性のリモートビットが設定されている場合、付加的な処理がルータポートを表わすSMAにおいて生じ得る。
【0121】
一実施形態に従うと、アドレス指定方式の重要な局面は、システムの構成または配線が間違ってなされていたとしても、ルータポートのリモート・ピア・ポートが要求に応答することができるという点である。たとえば、仮想ルータが、リモートサブネットの汎用のスイッチポートにおいて、物理リンクを介して、たとえばリモートサブネットに、接続されている場合、リモートサブネットの汎用スイッチポートを処理するSMAは、リモート属性がサポートされていないことを示す状態値とともに要求に応答することができ、さらに、当該応答は要求しているSMに到達することができる。
【0122】
一実施形態に従うと、SMP(すなわち、VSMP)は、DR経路を用いることによって、またはルータポートのLIDを介して、ローカルルータポートに送信することができる。要求された情報がルータポートのリモート・ピア・ポートのためのものである場合、属性修飾子のリモートフラグ/ビットを設定することができる。SMAは、このようなVSMPを受取ると、パケットを変更し、リモートエンドをアドレス指定する付加的なDRステップを追加することができる。
【0123】
一実施形態に従うと、パケット属性の一部分(たとえば16ビット属性修飾子のビット)はVSMPがローカルであるかリモートであるかどうかを信号で伝えるために用いることができる。たとえば、この部分を1の値に設定することにより、リモート・ピア・ポートがVSMPのための最終宛先であることを示唆することができる。属性のこの部分はリモートフラグとも称され得る。
【0124】
一実施形態に従うと、リモートフラグに加えて、どの宛先インスタンスが、最終宛先への経路に沿ってVSMPを処理するべきかを示すことができる追加のフラグが存在し得る。パケット属性のうち2つの付加的部分(たとえば属性修飾子の2ビット)は、この目的のために用いることができる。第1の受取りフラグと称される第1の部分(たとえばビット20)は、(元の要求の宛先アドレスと一致するはずである)ローカルルータポートに
よって受取られたとき、パケットの処理が予想されることを示し得る。第1の受信側における予想される処理がすべて実行されると、パケット属性の第2の部分(たとえば属性修飾子のビット21)を設定して、パケットをリモートエンドに転送することができる。この第2の部分は第2の受取りフラグと称され得る。
【0125】
DRルーティングされたパケット
一実施形態に従うと、一例として、DRルーティングされたパケットは例示的なフローに追従し得る。ソースノードは、LID Aにおいて、ルータ1を宛先ノードとして指定する要求パケットを開始することができる。例示的なDRルーティングパケット構成は以下のとおりである。
【0126】
・MADHdr.Class = 0x81 (DRルーティングされたSMP)
・MADHdr.Method = 0x1 (取得)
・LRH.SLID = LRH.DLID = 0xffff (許可LID)
・MADHdr.DrSLID = MADHdr.DrDLID = 0xffff
・MADHdr.AttrID = <VSMP attrID>
・MADHdr.AttrMod.remote = 1
・MADHdr.AttrMod.first_receiver = 1
・MADHdr.InitPath = DR経路からRtr1 (LID B)
・MADHdr.HopCnt = N
・MADHdr.HopPtr = 0
要求パケットがルータ1に到達すると、当該要求パケットは、対応するSMAに渡され得るとともに、さらにこの対応するSMAが、要求が有効であることを確認し得る。要求の有効性を確認した後、SMAはパケットを変更し得る。この変更は、1つの余分なホップを用いてDR経路を拡張することと、第2の受取りフラグを設定することとを含み得る。このような例示的な構成変更を以下に示す。
【0127】
・MADHdr.HopCnt = N+1(1つの余分なホップを用いてDR経路を拡張)
・MADHdr.InitPath[N+1] = (仮想ルータ外部ポート番号(すなわち、2))
・MADHdr.AttrMod.second_receiver = 1
一実施形態に従うと、SMAのサブネット管理インターフェイス(subnet management interface:SMI)層は、SMAが物理リンク上でVSMPを転送する前に、余分なホ
ップを用いてDRを更新することができる。
【0128】
一実施形態に従うと、物理リンクの遠隔側でVSMPを受取るSMAのために、VSMPによって用いられるアドレス指定方式は、正常にIB規定されたパケットの方式のように見える場合もある。
【0129】
一実施形態に従うと、物理リンクの遠隔側でVSMPを受取るSMAがVSMPの最終宛先である場合、VSMPは受取られたSMAによって確認することができる。確認はフラグ設定に対して入力ポートをチェックすることを含み得る。リモートフラグならびに第1の受取りフラグおよび第2の受取りフラグが設定される場合、パケットは物理ポート上で(すなわち、仮想ルータで構成されたポートの外部リンク側から)受取ることができる。遠隔にある第1の受取りフラグだけが設定される場合、パケットは、仮想リンク上で(すなわち、仮想ルータポートの内部スイッチ側から)到達し得る。確認が失敗すれば、状態が適切なエラーメッセージに設定され得る。
【0130】
図14は、一実施形態に従った、DRルーティングされたVSMPパケットを示すフローチャートである。
【0131】
ステップ1401において、一実施形態に従うと、サブネットA内において、サブネットAのサブネットマネージャなどのエンティティは、DRルーティングされたVSMPを介して接続性情報を要求することができる。DRルーティングされたVSMPの宛先は、サブネットA内におけるルータ1などのルータであり得る。
【0132】
ステップ1402において、DRルーティングされたVSMPがルータ1に到達し得る。ルータ1は、一実施形態においては、上述のとおり、スイッチ1などのスイッチに含まれ得る。DRルーティングされたVSMPは、確認のためにスイッチ1のSMAに渡され得る。
【0133】
ステップ1403において、一実施形態に従うと、SMAはDRルーティングされたVSMPを変更し得る。この変更は、(第2のサブネットに対する物理リンクにわたるホップのための)ホップ・カウンタを拡張することと、第2の受取りフラグを設定することとを含み得る。
【0134】
ステップ1404において、一実施形態に従うと、SMI(SMIはスイッチ/ルータのSMAに関連付けられている)は、VSMPのホップポインタを更新し得る。
【0135】
ステップ1405において、一実施形態に従うと、SMIは、物理リンク上で、サブネットA1420とサブネットB1430との間のサブネット境界にわたってDR VSMPを転送することができる。この場合、物理リンクの第1の端部は、サブネットA内のルータに接続され得るとともに、物理リンクの第2の端部は、サブネットB内のルータに接続され得る。
【0136】
ステップ1406において、一実施形態に従うと、サブネットB1430内のルータ2のSMA′は物理リンクからVSMPを受取り得る。
【0137】
ステップ1407において、一実施形態に従うと、(SMA′に関連付けられた)SMI′がVSMP要求を確認し得る。
【0138】
一実施形態に従うと、応答エンティティ(たとえば、物理リンクの遠隔側のルータ)は、SMP応答を完了し、応答を示す方向属性を設定し得る。このような例示的な構成を以下に示す。
【0139】
・MADHdr.Method = 0x81 (GetResp)
・MADHdr.Direction = 1 (応答を示す)
一実施形態に従うと、SMI層は、ホップポインタをデクリメントし、物理リンク上で、ローカル側に応答を転送し得る。ローカルルータにおけるSMAは、要求に対してなされた変更を元に戻し得る。ローカル側ルータにおけるSMIは、ホップをデクリメントすることと、仮想リンク上で(すなわち、スイッチポートと仮想ルータポートとの間の内部仮想リンク上で)スイッチに応答を送出することとを含む通常の処理を実行し得る。次のホップのために、SMIが再びホップをデクリメントし、要求が本来到達していた物理スイッチポート上でパケットを送出し得る。
【0140】
図15は、一実施形態に従った、DRルーティングされたVSMPパケットに対する応答を示すフローチャートである。
【0141】
ステップ1501において、一実施形態に従うと、ルータ2のSMA′は、VSMPに応答情報(たとえば接続性情報)を記入し、応答を示すために方向性フラグを設定し得る。
【0142】
ステップ1502において、一実施形態に従うと、SMI′は、応答のホップポインタをデクリメントし得るとともに、たとえば、2つの端部を有する物理リンク上でサブネットB1530からサブネットA1520に応答を転送し返し得る。物理リンクの第1の端部は、サブネットA内のルータに接続され得るとともに、物理リンクの第2の端部は、サブネットB内のルータに接続され得る。
【0143】
ステップ1503において、一実施形態に従うと、ルータ1におけるSMAは応答を受取って、VSMP上でなされた変更を元に戻し得る。
【0144】
ステップ1504において、一実施形態に従うと、ルータ1におけるSMIは、VSMPに対する応答を処理し、物理スイッチに対してリンク(たとえば、仮想ルータ1と物理スイッチとの間の仮想リンク)上で応答を送信し得る。
【0145】
ステップ1505において、一実施形態に従うと、SMIは、ホップポインタをデクリメントし、VSMPが元々受取られていた物理スイッチポート上でパケットを送出し得る。
【0146】
LIDルーティングされたパケット
一実施形態に従うと、一例として、LIDルーティングされたパケットは例示的なフローに追従し得る。ソースノードは、LID Aにおいて、宛先ノードとしてルータ1を指定する要求パケットを開始させ得る。このような例示的なパケットは以下の構成を有し得る。
【0147】
・MADHdr.Class = 0x01 (LIDルーティングされたSMP)
・MADHdr.Method = 0x1(取得)
・LRH.SLID = LID A
・LRH.DLID = LID B
・MADHdr.AttrID = <VSMP attrID>
・MADHdr.AttrMod.remote = 1
・ADHdr.AttrMod.first_receiver = 1
一実施形態に従うと、要求パケットがルータ1に到達すると、当該要求パケットは、対応するSMAに渡され、当該対応するSMAは、要求が有効であることを確認し得る。要求の有効性を確認した後、SMAはパケットを変更し得る。この変更は、端部における単一のDR経路を追加することを含み得る。結果として、これは、アドレスの合計がLIDルーティングされたパケットとDRルーティングされたホップとの組合せになり得ることを意味する。例示的な構成は以下のとおりである。
【0148】
・MADHdr.Class = 0x81 (DRルーティングされたSMP)
・MADHdr.HopCnt = 1
・MADHdr.HopPtr = 0
・MADHdr.Direction = 0(アウトバウンド)
・MADHdr.InitPath[1] = (仮想ルータ外部ポート番号(すなわち、2))
・MADHdr.DrSLID = LRH.SLID (すなわち、LRH.SLIDは元のリクエスタからのLID
Aを含む)
・MADHdr.DrDLID = 0xffff
・MADHdr.AttrMod.second_receiver = 1
一実施形態に従うと、ルータにおけるSMI層は、アウトバウンドのパケットを正常に処理し、これを物理リンク上で送出し得る。例示的な構成は以下のとおりである。
【0149】
・LRH.SLID = LRH.DLID = 0xffff
・MADHdr.HopPtr = 1 (1ずつインクリメント)
一実施形態に従うと、宛先ルータにおける(物理リンクの他方の端部における)SMIは、それが要求についての宛先であると判断し、関連付けられたSMAに対してVSMPを渡し得る。
【0150】
図16は、一実施形態に従った、DRルーティングされたVSMPパケットを示すフローチャートである。
【0151】
ステップ1601において、一実施形態に従うと、サブネットA内において、サブネットAのサブネットマネージャなどのエンティティは、LIDルーティングされたVSMPを介して接続性情報を要求し得る。LIDルーティングされたVSMPの宛先は、ルータ1などの、サブネットA内のルータであり得る。
【0152】
ステップ1602において、LIDルーティングされたVSMPはルータ1に到達し得る。ルータ1は、一実施形態においては、上述のとおり、スイッチ1などのスイッチに含まれ得る。LIDルーティングされたVSMPは、確認のためにスイッチ1のSMAに渡され得る。
【0153】
ステップ1603において、一実施形態に従うと、SMAはDRルーティングされたVSMPを変更し得る。この変更は、単一のホップDRルーティングされた経路をアドレスの最後に追加することと、(第2のサブネットに対する物理リンクにわたるホップのために)ホップ・カウンタを拡張することと、第2の受取りフラグを設定することとを含み得る。
【0154】
ステップ1604において、一実施形態に従うと、SMI(SMIはスイッチ/ルータのSMAに関連付けられている)は、VSMPのホップポインタを更新し得る。
【0155】
ステップ1605において、一実施形態に従うと、SMIは、物理リンク上で、サブネットA1620とサブネットB1630との間におけるサブネット境界にわたって、元々LIDにルーティングされていたVSMPを転送し得る。この場合、物理リンクの第1の端部はサブネットA内のルータに接続され得るとともに、物理リンクの第2の端部は、サブネットB内のルータに接続され得る。
【0156】
ステップ1606において、一実施形態に従うと、サブネットB1630内のルータ2のSMA′は、このとき、DRルーティングされたVSMPを物理リンクから受取り得る。
【0157】
ステップ1607において、一実施形態に従うと、(SMA′に関連付けられた)SMI′はVSMP要求を確認し得る。
【0158】
一実施形態に従うと、応答フローのために、ルータ2におけるSMAがVSMPを確認し得る。この確認は、フラグ設定に対して入力ポートをチェックすることを含み得る。リモートフラグならびに第1の受取りフラグおよび第2の受取りフラグが設定される場合、パケットは物理ポート上で(すなわち、仮想ルータで構成されたポートの外部リンク側から)受取ることができる。遠隔側である第1の受取りフラグだけが設定される場合、パケットは、仮想リンク上で(すなわち、仮想ルータポートの内部スイッチ側から)到達し得る。確認が失敗すれば、状態が適切なエラーメッセージに設定され得る。
【0159】
一実施形態に従うと、ルータ2におけるSMA′は、SMP応答を完了し、応答を示す
方向属性を設定し得る。このような例示的な構成を以下に示す。
【0160】
・MADHdr.Method = 0x81 (GetResp)
・MADHdr.Direction = 1(応答を示す)
・LRH.SLID = 0xffff
・LRH.DLID = ReqMAD.MADHdr.SLID = 0xffff
ルータ2におけるSMI′は、ホップポインタをデクリメントし、物理リンク上で応答をルータ1に転送し返し得る。次いで、ルータ1におけるSMAは、応答を物理スイッチポートから送信元に転送し返す前に、元の要求上でなされた変更を元に戻し得る。このように元に戻した後の例示的な構成を以下に示す。
【0161】
・MADHdr.Class = 0x01
・LRH.DLID = MADHdr.DrSLID (すなわち、元のリクエスタからのLID Aを含む
)
・LRH.SLID = local LID = B
一実施形態に従うと、加えて、SMAがVSMPのDR特有のフィールドをクリアし得るため、応答は、当該応答が元のリクエスタに到達したときに元のVSMPと完全に一致しているように見えることとなる。
【0162】
一実施形態に従うと、応答が送信元に戻ってくると、送信元は、正常なルータLID応答を、それがルータ1において完全に処理されてしまっているかのように認識するだろう。
【0163】
図17は、一実施形態に従った、LIDルーティングされたVSMPパケットに対する応答を示すフローチャートである。
【0164】
ステップ1701において、一実施形態に従うと、ルータ2のSMA′は、VSMPに対する応答情報(たとえば接続性情報)を記入し得るとともに、応答を示すために方向性フラグを設定し得る。
【0165】
ステップ1702において、一実施形態に従うと、SMI′は、応答のホップポインタをデクリメントし、たとえば、2つの端部を有する物理リンク上で、サブネットB1730からサブネットA1720に応答を転送し返し得る。物理リンクの第1の端部は、サブネットA内のルータに接続され得るとともに、物理リンクの第2の端部は、サブネットB内のルータに接続され得る。
【0166】
ステップ1703において、一実施形態に従うと、ルータ1におけるSMAは、応答を受取り得るとともに、DRルーティングされたホップを取り除くことを含む、VSMP上でなされた変更を元に戻し得る。
【0167】
ステップ1704において、一実施形態に従うと、ルータ1におけるSMIは、VSMPに対する応答を処理し得るとともに、VSMPが元々受取られていた物理スイッチポート上でLIDルーティングされた応答を送出し得る。
【0168】
この発明の特徴は、ここに提示された特徴のうちのいずれかを行なうように処理システムをプログラミングするために使用可能な命令を格納した記憶媒体またはコンピュータ読取り可能媒体であるコンピュータプログラムプロダクトにおいて、それを使用して、またはその助けを借りて実現され得る。記憶媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD-ROM、マイクロドライブ、および光磁気ディスクを含む任意のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、
フラッシュメモリ装置、磁気カードもしくは光カード、ナノシステム(分子メモリICを含む)、または、命令および/もしくはデータを格納するのに好適な任意のタイプの媒体もしくは装置を含み得るものの、それらに限定されない。
【0169】
この発明の特徴は、機械読取り可能媒体のうちのいずれかに格納された状態で、処理システムのハードウェアを制御するために、および処理システムがこの発明の結果を利用する他の機構とやり取りすることを可能にするために、ソフトウェアおよび/またはファームウェアに取込まれ得る。そのようなソフトウェアまたはファームウェアは、アプリケーションコード、装置ドライバ、オペレーティングシステム、および実行環境/コンテナを含み得るものの、それらに限定されない。
【0170】
この発明の特徴はまた、たとえば、特定用途向け集積回路(application specific integrated circuit:ASIC)などのハードウェアコンポーネントを使用して、ハードウ
ェアにおいて実現されてもよい。ここに説明された機能を行なうようにハードウェアステートマシンを実現することは、関連技術の当業者には明らかであろう。
【0171】
加えて、この発明は、この開示の教示に従ってプログラミングされた1つ以上のプロセッサ、メモリおよび/またはコンピュータ読取り可能記憶媒体を含む、1つ以上の従来の汎用または特殊デジタルコンピュータ、コンピューティング装置、マシン、またはマイクロプロセッサを使用して都合よく実現され得る。ソフトウェア技術の当業者には明らかであるように、この開示の教示に基づいて、適切なソフトウェアコーディングが、熟練したプログラマによって容易に準備され得る。
【0172】
この発明のさまざまな実施形態が上述されてきたが、それらは限定のためではなく例示のために提示されたことが理解されるべきである。この発明の精神および範囲から逸脱することなく、形状および詳細のさまざまな変更を行なうことができることは、関連技術の当業者には明らかであろう。
【0173】
この発明は、特定された機能およびそれらの関係の実行を示す機能的構築ブロックの助けを借りて上述されてきた。説明の便宜上、これらの機能的構築ブロックの境界は、この明細書中ではしばしば任意に規定されてきた。特定された機能およびそれらの関係が適切に実行される限り、代替的な境界を規定することができる。このため、そのようないかなる代替的な境界も、この発明の範囲および精神に含まれる。
【0174】
この発明の前述の説明は、例示および説明のために提供されてきた。それは、網羅的であるよう、またはこの発明を開示された形態そのものに限定するよう意図されてはいない。この発明の幅および範囲は、上述の例示的な実施形態のいずれによっても限定されるべきでない。多くの変更および変形が、当業者には明らかになるだろう。これらの変更および変形は、開示された特徴の関連するあらゆる組合せを含む。実施形態は、この発明の原理およびその実用的応用を最良に説明するために選択され説明されたものであり、それにより、考えられる特定の使用に適したさまざまな実施形態についての、およびさまざまな変更例を有するこの発明を、当業者が理解できるようにする。この発明の範囲は、請求項およびそれらの同等例によって定義されるよう意図されている。