(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022094923
(43)【公開日】2022-06-27
(54)【発明の名称】マルチソケットプラットフォーム用のアプリケーション認識による優れた過電流保護
(51)【国際特許分類】
G06F 1/30 20060101AFI20220620BHJP
G06F 1/324 20190101ALI20220620BHJP
G06F 1/3287 20190101ALI20220620BHJP
【FI】
G06F1/30
G06F1/324
G06F1/3287
【審査請求】未請求
【請求項の数】26
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2021175197
(22)【出願日】2021-10-27
(31)【優先権主張番号】17/122,693
(32)【優先日】2020-12-15
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】591003943
【氏名又は名称】インテル・コーポレーション
(74)【代理人】
【識別番号】110000877
【氏名又は名称】龍華国際特許業務法人
(72)【発明者】
【氏名】ラジェシュ プーアナチャンドラン
(72)【発明者】
【氏名】ラジェンドラクマール チンナイヤン
(72)【発明者】
【氏名】ヴィンセント ジマー
(72)【発明者】
【氏名】ラヴィキラン チャッカ
【テーマコード(参考)】
5B011
【Fターム(参考)】
5B011EA02
5B011GG06
5B011JA12
5B011LL13
(57)【要約】 (修正有)
【課題】コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、設定可能な過電流保護ポリシーに基づいた保護措置を自動的に取ることと、を行う技術を供給するコンピューティングシステム、半導体装置、装置及びコンピュータ可読記憶媒体を提供する。
【解決手段】保護措置は、コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した電圧レギュレータと結合されているプロセッサの周波数のスロットル、1又は複数の追加のプロセッサから切り離したプロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行又はプロセッサから追加のプロセッサのうち少なくとも1つへのワークロード移行の開始のうち1又は複数を含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
コンピューティングシステムであって、
電圧レギュレータと、前記電圧レギュレータと結合されているプロセッサとを有する1又は複数の回路ボードと、
1又は複数の基板と結合されているロジックとを備え、
前記ロジックは、
前記電圧レギュレータと関連付けられた過電流状態を検出することと、
前記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、
前記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、
前記保護措置は、前記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した前記プロセッサの周波数スロットル、前記1又は複数の追加のプロセッサから切り離した前記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、前記プロセッサから前記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
コンピューティングシステム。
【請求項2】
前記1又は複数の基板と結合されている前記ロジックは、前記1又は複数の回路ボードの電源を切ることをバイパスする、請求項1に記載のコンピューティングシステム。
【請求項3】
前記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、請求項1又は2に記載のコンピューティングシステム。
【請求項4】
ベースボード管理コントローラ(BMC)をさらに備え、
前記1又は複数の基板と結合されている前記ロジックは、アウト・オブ・バンドチャネルを介して、前記対応するSMI処理能力を前記BMCに供給する、請求項3に記載のコンピューティングシステム。
【請求項5】
前記過電流状態と関連付けられたテレメトリ情報を収集するSMI転送モニタ(STM)をさらに備え、前記1又は複数の基板と結合されている前記ロジックは、前記1又は複数のテレメトリ閾値を前記STMに供給し、前記データセンタ・フリート・マネージャー通知は、前記テレメトリ情報を有し、前記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、請求項1から4のいずれか一項に記載のコンピューティングシステム。
【請求項6】
主回路ボードをさらに備え、前記主回路ボードは、ベースボード管理コントローラ(BMC)を有し、前記1又は複数の回路ボードは、副回路ボードを有し、前記保護措置は、前記BMCにより取られる、請求項1から5のいずれか一項に記載のコンピューティングシステム。
【請求項7】
1又は複数の基板と、
前記1又は複数の基板と結合されているロジックと
を備え、
前記ロジックは、設定可能なロジック又は機能固定型ハードウェアロジックのうち1又は複数に少なくとも部分的に実装され、前記1又は複数の基板と結合されている前記ロジックは、
コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、
前記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、
前記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、
前記保護措置は、前記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した前記電圧レギュレータと結合されているプロセッサの周波数スロットル、前記1又は複数の追加のプロセッサから切り離した前記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、前記プロセッサから前記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
半導体装置。
【請求項8】
前記1又は複数の基板と結合されている前記ロジックは、前記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする、請求項7に記載の半導体装置。
【請求項9】
前記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、請求項7又は8に記載の半導体装置。
【請求項10】
前記1又は複数の基板と結合されている前記ロジックは、アウト・オブ・バンドチャネルを介して、前記対応するSMI処理能力を、ベースボード管理コントローラに供給する、請求項9に記載の半導体装置。
【請求項11】
前記1又は複数の基板と結合されている前記ロジックは、前記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給し、前記STMは、前記過電流状態と関連付けられたテレメトリ情報を収集し、前記データセンタ・フリート・マネージャー通知は、前記テレメトリ情報を含み、前記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、請求項7から10のいずれか一項に記載の半導体装置。
【請求項12】
前記保護措置は、前記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、前記電圧レギュレータは、前記コンピューティングシステム内の副回路ボード上に存在する、請求項7から11のいずれか一項に記載の半導体装置。
【請求項13】
コンピューティングシステムに、
コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出する手順と、
前記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別する手順と、
前記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取る手順とを実行させるための、コンピュータプログラムであって、
前記保護措置は、前記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した前記電圧レギュレータと結合されているプロセッサの周波数のスロットル、前記1又は複数の追加のプロセッサから切り離した前記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、前記プロセッサから前記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
コンピュータプログラム。
【請求項14】
前記コンピューティングシステムに、前記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする手順をさらに実行させる、請求項13に記載のコンピュータプログラム。
【請求項15】
前記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、請求項13又は14に記載のコンピュータプログラム。
【請求項16】
前記コンピューティングシステムに、アウト・オブ・バンドチャネルを介して、前記対応するSMI処理能力をベースボード管理コントローラに供給する手順をさらに実行させる、請求項15に記載のコンピュータプログラム。
【請求項17】
前記コンピューティングシステムに、前記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給する手順をさらに実行させ、前記STMは、前記過電流状態と関連付けられたテレメトリ情報を収集し、前記データセンタ・フリート・マネージャー通知は、前記テレメトリ情報を含み、前記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、請求項13から16のいずれか一項に記載のコンピュータプログラム。
【請求項18】
前記保護措置は、前記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、前記電圧レギュレータは、前記コンピューティングシステム内の副回路ボード上に存在する、請求項13から17のいずれか一項に記載のコンピュータプログラム。
【請求項19】
コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出する段階と、
前記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別する段階と、
前記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取る段階とを備え、
前記保護措置は、前記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した前記電圧レギュレータと結合されているプロセッサの周波数のスロットル、前記1又は複数の追加のプロセッサから切り離した前記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、前記プロセッサから前記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
方法。
【請求項20】
前記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする段階をさらに備える請求項19に記載の方法。
【請求項21】
前記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、請求項19又は20に記載の方法。
【請求項22】
アウト・オブ・バンドチャネルを介して、前記対応するSMI処理能力をベースボード管理コントローラに供給する段階をさらに備える請求項21に記載の方法。
【請求項23】
前記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給する段階をさらに備え、前記STMは、前記過電流状態と関連付けられたテレメトリ情報を収集し、前記データセンタ・フリート・マネージャー通知は、前記テレメトリ情報を含み、前記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、請求項19から22のいずれか一項に記載の方法。
【請求項24】
前記保護措置は、前記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより取られ、前記電圧レギュレータは、前記コンピューティングシステム内の副回路ボードに存在する、請求項19から23のいずれか一項に記載の方法。
【請求項25】
請求項19から24のいずれか一項に記載の方法を実行するための手段を備える装置。
【請求項26】
請求項13から18のいずれか一項に記載のコンピュータプログラムを記憶したコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
実施形態は、概して、過電流保護に関する。特に、実施形態は、マルチソケットプラットフォーム用のアプリケーション認識による優れた過電流保護(AAGOCP)に関する。
【背景技術】
【0002】
サーバー製品は、過電流の流れが発生した場合、プラットフォームを(例えば、突然)シャットダウンする安全機能としての過電流保護(OCP)をサポートし得る。OCP安全機能は、ハードウェアコンポーネントを保護することを助けるが、突然のシャットダウンの結果として、低いサービスレベルアグリーメント(SLA)エクスペリエンス、システムの可用性の観点からいうと、「blast radius」(例えば、エラー伝達)、データ紛失等に対処することが生じ得る。OCD安全機能は、ハードウェアコンポーネントの保護に寄与するものの、突然のシャットダウンから、「blast radius(爆風半径)」(例えば、エラー伝播)、データ損失等を処理するといった、システム可用性の観点から見て低レベルのサービスレベルアグリーメント(SLA)体験が引き起こされる可能性がある。
【図面の簡単な説明】
【0003】
【
図1】一実施形態による、性能強化コンピューティングシステムの例のブロック図である。
【0004】
【
図2】一実施形態による、ソフトウェアアーキテクチャの例のブロック図である。
【0005】
【
図3】一実施形態による、性能強化コンピューティングシステムを操作する方法の例のフローチャートである。
【0006】
【
図4】一実施形態による、性能強化コンピューティングシステムにおける過電流保護を構成する方法の例のフローチャートである。
【0007】
【
図5】一実施形態による、コンピューティングシステムを操作する従来の方法と、コンピューティングシステムを操作する方法との比較例のフローチャートである。
【0008】
【
図6】一実施形態による、半導体パッケージ装置の例の図面である。
【0009】
【
図7】一実施形態による、プロセッサの例のブロック図である。
【0010】
【
図8】一実施形態による、マルチプロセッサベースのコンピューティングシステムの例のブロック図である。
【発明を実施するための形態】
【0011】
図1は、主回路ボード12(例えば、レガシ、マネージャ、マスタ)と、複数の副回路ボード14(14a~14c)と、グローバルコンプレックスプログラム可能ロジックデバイス(CPLD)16とを含む、性能が強化されているコンピューティングプラットフォーム/システム10を示す。図示される例において、複数の副回路ボード14のうち第1ボード14aは、複数の電圧レギュレータ(VR)18(18a~18f)と、VR18のうち少なくとも1つと結合されている第1中央演算処理装置(CPU、例えば第1ソケットに接続されている「CPU1」ホストプロセッサ)20、VR18のうち少なくとも1つと結合されている第2CPU22(第2ソケットに接続されている「CPU2」)と、ローカルCPLD24と、プラットフォーム・コントローラ・ハブ(PCH、例えば、入出力/IOモジュール)26と、ベースボード管理コントローラ(BMC)28とを含む。第2ボード14b及び第3ボード14cは、第1ボード14aと同様に構成され得る。
【0012】
1つの例において、主回路ボード12は、第1CPU30(第1ソケットに接続されている「CPU1」)と、第2CPU32(第2ソケットに接続されている「CPU2」)と、ローカルCPLD34、PCH36と、BMC38と、複数のVR40とを含む。それに応じて、示されたコンピューティングシステム10は、8ソケットシステムである。一実施形態において、コンピューティングシステム10は、データセンタのサーバーノードである。
【0013】
第1VR18aは、例えば、第1CPU20に電力を供給し得る。第1VR18aが、OCP障害(例えば、過電流状態)に直面した場合、第1VR18aは、OCP障害に応答して、パワーグッド信号42をディアサートし得る。ディアサートされたパワーグッド信号42を検出するとき、ローカルCPLD24は、スリープ信号44(例えば、Advanced Configuration and Power Interface/ACPI S4信号)を、グローバルCPLD16に送信し得、グローバルCPLD16は、転送された信号46を、主回路ボード12上のローカルCPLD34に発行する。一実施形態において、ローカルCPLD34は、上記第1VR18aと関連付けられた設定可能な過電流保護ポリシーを識別し、設定可能な過電流保護ポリシーに基づいて自動的に保護措置を取る。例えば、設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含み得る。より詳細に説明されるように、BMC38には、SMI処理能力が供給され得、SMI転送モニタ(STM、不図示))には、テレメトリ閾値が供給され得る。さらに、BMC38は、アウト・オブ・バンド(OOB)チャネル48を介して、リモート管理者(例えば、管理コンソール)と通信して、フリート管理及び/又はワークロード移行作業等のより高いレベルの動作をトリガ/開始し得る。
【0014】
したがって、回路ボード14、12のすべての電源を突然切るのではなく、主回路ボード12は、例えば、コンピューティングシステム10内の追加のプロセッサから切り離した(例えば、独立的)第1CPU20の周波数スロットリング、コンピューティングシステム10内の追加のプロセッサから切り離した第1CPU20を非アクティブ化、仮想マシンモニタ(VMM、例えば、ハイパーバイザー)通知の発行、データセンタ・フリート・マネージャー通知の発行、第1CPU20からコンピューティングシステム10内の追加のプロセッサのうち少なくとも1つへワークロードの移行の開始、クラウドソースのデータ分析のための(例えば、改善されたワークロードのオーケストレーションと、プラットフォームの信頼性、利用可能性、サービス性/RASとをサポートをするための)OCP障害のログ記録等のような、混乱が少ない動作をし得る。したがって、コンピューティングシステム10は、少なくとも、システム10内の他のプロセッサから切り離した第1CPU20の周波数スロットリング及び/又は非アクティブ化することが、SLAエクスペリエンス(例えば、システムの可用性の観点からいうと、blast radius及びデータ損失等に対処すること)を改善する程度においては、性能が強化されているとみなされる。
【0015】
図2は、システム管理モード(SMM)ドメインにおける、基本入出力システム(BIOS)62およびSTMと、非SMMドメインにおける残りのプラットフォーム66とを有するソフトウェアアーキテクチャ60を示す。図示される例において、BMC68は、以下の処理能力を有するAAGOCPコアロジックをホスティングするBMC OCPウォッチャーアプレット70を含む。
【0016】
-閾値/設定可能なポリシーは、OOB BMCリモートコンソール78を介して供給されることができ、あらゆる事前のスパイクに関するVRアサーションは、ワークロード構成と、PMU(電源管理ユニット、Punit)構成と共にログ記録をされ、デバッグ及び/又はレコード保持/根本原因分析を行うためにリモート管理者/オーケストレータに伝達され得る。
【0017】
-例えば、スパイクを緩和するために特定のコア/アンコア/ソケットをスロットリングすること、データ紛失を回避するためにワークロードを緩和すべく、プラットフォーム・オペレーティング・システム(OS、不図示)、VMM74、ゲストOS72、及び/又はリモートオーケストレータ76に警告すること、特定のコア/ソケットをPMUと連携してオフラインにすること等、ポリシーに基づく措置が取られ得る。
【0018】
図示されるBIO62は、SMM80を含む。ここで、BMC68は、SMM80内のハンドラ(例えば、SMM_OCP_Handler)により処理されるOCP_SMI#signal82(例えば、OCPBMC-BIOS)をアサートし得る。一実施形態において、STMは、潜在的に脆弱なVMM74から保護されているオパークロギング/テレメトリを提供するアプレットである、OCPテレメトリ84を含む。図示される例において、SMM80は、テレメトリ信号86(例えば、OCPTelemetry)を、STM64内のOCPテレメトリ84に発行し、BIO62は、STM64を介して、警告信号88(例えば、OCPVMM_Alert)をVMM74に発行する。さらに、ログデータは、リモートコンソール78(例えば、STM→BMCの通信を介して、データセンタ管理コンソール)にエクスポートされ得る。
【0019】
図3は、性能強化コンピューティングシステムのを操作する方法90を示す。既に説明されたように、方法90は、概して、例えば、主回路ボード12(
図1)等の主回路ボードに実装され得る。より具体的には、方法90は、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、プログラマブルROM(PROM)、ファームウェア、フラッシュメモリ等のようなマシン又はコンピュータ可読記憶媒体に格納されているロジック命令のセットして、例えば、プログラマブルロジックアレイ(PLA)、フィールドプログラマブルゲートアレイ(FPGA)、CPLD等の設定可能なロジックで、例えば、特定用途向け集積回路(ASIC)、相補的金属酸化膜半導体(CMOS)若しくはトランジスタ-トランジスタロジック(TTL)技術等の回路技術を用いる機能固定型ロジックハードウェア、又はそれらの任意の組み合わせで、1又は複数のモジュールに実装され得る。
【0020】
例えば、方法に示されるオペレーションを実行するコンピュータプログラムコードは、JAVA(登録商標)、SMALLTALK(登録商標)、C++、又は同様のもの等のオブジェクト指向プログラミング言語、及び、「C」プログラミング言語又は同様のプログラミング言語等の従来の手続き型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述され得る。さらに、ロジック命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、状態設定データ、集積回路用の設定データ、電子回路をパーソナライズする状態情報、及び/又は、ハードウェア固有の他の構造コンポーネント(例えば、ホストプロセッサ、中央演算処理装置/CPU、マイクロコントローラ等)を含み得る。
【0021】
図示される処理ブロック92は、1又は複数のテレメトリ閾値(例えば、過電流閾値)を、コンピューティングシステム内のSTMに供給することを規定する。ここで、ブロック94は、対応するSMI処理能力をコンピューティングシステム内のBMCに供給する。一実施形態において、ブロック94は、OOBチャネルを介して、対応するSMIをBMCに供給する。SMI処理能力は、例えば、BMCとBIOS SMMとの間の通信において使用される信号、設定及び/又はパラメータを含み得る。一実施形態において、テレメトリ閾値と、対応するSMI処理能力とは、マルチソケットプラットフォーム用の設定可能な過電流保護ポリシーを構成する。
【0022】
ブロック96は、コンピューティングシステムに内のVRと関連付けられた過電流状態を検出する。1つの例において、ブロック96は、パワーグッド信号が、VRによってディアサートされたことを判断することを含む。VRと関連付けられた設定可能な過電流保護ポリシーは、ブロック98にて識別され得る。示されるブロック100は、コンピューティングシステム内の複数の回路ボードの電源をシャットダウンすることをバイパスする。ここで、ブロック102は、設定可能な過電流保護ポリシーに基づいて、自動的に保護措置を取る。図示される例において、保護措置は、(例えば、コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した)VRと結合されているプロセッサの周波数のスロットル、(例えば、1又は複数の追加のプロセッサから切り離した)VRと結合されているプロセッサの非アクティブ化、VMM通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記追加のプロセッサのうち少なくとも1つへのワークロード移行の開始のうち1又は複数を含む。
【0023】
既に記載されたように、VMM及び/又はデータセンタ・フリート・マネージャーに、OCPイベントについて通知することは、アプリケーションにデータ損失を防止する機会を与え、又は、アプリケーショントレランスに基づいて、フリート・マネージャーは、ワークロードを別のマシンに移行し得る。実際に、データセンタ・フリート・マネージャー通知は、STMにより収集された(例えば、過電流状態と関連付けられた)テレメトリ情報を含み得る。かかる場合において、データセンタ・フリート・マネージャー通知は、超大規模データセンタ(例えば、それがサポートするエンティティにより所有及び運用される設備)のスケーラビリティコンポーネント(例えば、スケーラビリティマネージャ)に発行され得る。
【0024】
一実施形態において、保護措置は、コンピューティングシステム内の主回路ボード上のBMCにより行われ、VRは、コンピューティングシステム内の副回路ボード上にあるものである。したがって、方法90は、少なくとも、システム内の他のプロセッサから切り離したプロセッサの周波数スロットリング及び/又は非アクティブ化が、blast radius及び/又はデータ損失の対処等、システムの可用性の観点からすること SLAエクスペリエンスを改善する程度においては、性能を強化すると考えられる。
【0025】
図4は、性能強化コンピューティングシステムにおけるOCPを構成する方法110を示す。既に説明されたように、方法110は、概して、例えば、主回路ボード12(
図1)等の主回路ボードに実装され得る。より具体的には、方法110は、RAM、ROM、PROM、ファームウェア、フラッシュメモリ等のマシン又はコンピュータ可読記憶媒体に格納されているロジック命令のセットとして、例えば、PLA、FPGA、CPLD等の設定可能なロジックで、例えば、ASIC、CMOS若しくはTTL技術等の回路技術を用いる機能固定型ロジックハードウェア、又はそれらの任意の組み合わせで、1又は複数のモジュールに実装され得る。
【0026】
図示されるブロック112は、AAGOCPサポートが存在するか否かを判断する。存在する場合、ブロック114は、安全なストレージから、現在の構成のための適切なポリシーを読み込む。各STMインタフェースモジュール(例えば、信頼されたプラットフォームモジュール/TPM、BMC等)に対して、ブロック116は、リモートアテステーションを実行し得る。ブロック118において、リモートアテステーションが成功したと判断された場合、ブロック120は、適切なOCPテレメトリ閾値を用いて、STMを設定する。さらに、ブロック122は、ローカル又はリモートOCP閾値に基づき、状態転送インタフェース(例えば、REDFISH representational state transfer/RESTfulインタフェース)およびSMI処理能力でBMCを設定し得る。一実施形態において、ブロック124は、BMC及びSTMポリシーを適用し、方法110は終了する。ブロック118において、リモートアテステーションが成功しなかったと判断された場合、図示されるブロック126は、ポリシーに基づく動作を行い、方法110は終了する。ブロック112において、AAGOCPがサポートされていないと判断された場合、図示される方法110は終了する。
【0027】
図5は、コンピューティングシステムを操作する従来の方法130と、性能強化コンピューティングシステムを操作する強化された方法131との比較例を示す。既に説明されたように、方法131は、概して、例えば、コンピューティングシステム10(
図1)等のコンピューティングシステムに実装され得る。より具体的には、方法131は、RAM、ROM、PROM、ファームウェア、フラッシュメモリ等のマシン又はコンピュータ可読記憶媒体に格納されているロジック命令のセットとして、例えば、PLA、FPGA、CPLD等の設定可能なロジックで、例えば、ASIC、CMOS若しくはTTL技術等の回路技術を用いる機能固定型ロジックハードウェア、又はそれらの任意の組み合わせで、1又は複数のモジュールに実装され得る。
【0028】
図示されるブロック133は、非レガシボードが、VR OCP閾値に達したことを検出する。ここで、ブロック135は、流された電流レベルを、レガシボードに送信する。1つの例において、ブロック137において、グローバルCPLDは、流された電流レベルをレガシボードに伝達する。一実施形態において、ブロック139において、レガシボードのBMCは、それぞれのVR OCPポリシーを確認する。ブロック141において、システムが、シャットダウンされるべきか否かに関して判断がされ得る。シャットダウンされるべきでない場合、示されるブロック143は、影響を受けたプロセッサの周波数がスロットリングされるべきか否かを判断する。スロットリングされるべき場合、ブロック145において、レガシボードは、信号を、過電流状態に直面したVRに取り付けられたプロセッサに送信する。ここで、信号は、プロセッサの作動/実行周波数をスロットリングされるようにもたらす。さらに、ブロック147において、レガシボード上のBMCは、上記ポリシーに応じて構成された動作を行い、プラットフォームOS/VMMだけでなく、リモート管理者/オーケストレータにも過電流状態を警告し得る。
【0029】
ブロック143において、設定可能な過電流保護ポリシーが周波数のスロットリングを必要としないと判断された場合、図示されるブロック149は、プロセッサがオフラインにされる(例えば、非アクティブ化)されるべきか否かを判断する。オフラインにされるべきである場合、ブロック151において、レガシボードは、信号を、OCP VRを有する非レガシボードに送信して、(例えば、システム内の他のプロセッサから切り離した)単一のプロセッサをオフラインにする。その後、図示される方法131は、ブロック147に進む。ブロック141において、システムがシャットダウンされるべきと判断された場合、図示されるブロック153は、システム内のすべてのボードの電源を切り、方法131は、ブロック147に進む。したがって、図示される方法131は、方法130(例えば、常にプラットフォーム内のすべてのボードの電源を切り、ノードを突然オフラインにすること)をバイパスする。
【0030】
図6は、半導体装置160(例えば、チップ、ダイ及び/又はパッケージ)を示す。図示される装置160は、1又は複数の基板162(例えば、シリコン、サファイア、ガリウムヒ素)と、基板162と結合されているロジック164(例えば、トランジスタアレイ及び他の集積回路/ICコンポーネント)とを含む。一実施形態において、既に説明されたように、ロジック164は、方法90(
図3)、方法110(
図4)及び/又は方法131(
図5)のうち1又は複数の態様を実装する。したがって、ロジック164は、コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出し、電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別し、設定可能な過電流保護ポリシーに基づいた保護措置を自動的に取り得る。一実施形態において、保護措置は、コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した電圧レギュレータと結合されているプロセッサの周波数のスロットル、1又は複数の追加のプロセッサから切り離したプロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、プロセッサから追加のプロセッサのうち少なくとも1つへのワークロード移行の開始のうち1又は複数を含む。したがって、装置160は、少なくとも、システム内の他のプロセッサから切り離したプロセッサの周波数スロットリング及び/又は非アクティブ化することが、SLAエクスペリエンス、システムの可用性の観点からいうと、blast radius及び/又はデータ紛失に対処することを改善する程度においては、性能が強化されている。
【0031】
ロジック164は、設定可能なロジック又は機能固定型ハードウェアロジックで少なくとも部分的に実装され得る。1つの例において、ロジック164は、基板162内に配置される(例えば、埋め込まれる)トランジスタチャネル領域を含む。したがって、ロジック164と基板162との間のインタフェースは、階段接合でないことがあり得る。ロジック164はまた、基板162の初期のウェハ上に成長するエピタキシャル層を含むとみなされ得る。
【0032】
図7は、1つの実施形態による、プロセッサコア200を示す。プロセッサコア200は、マイクロプロセッサ、埋め込み型プロセッサ、デジタル信号プロセッサ(DSP)、ネットワークプロセッサ、又はコードを実行する他のデバイス等の任意のタイプのプロセッサのコアであってよい。1つのプロセッサコア200のみが
図7に示されているが、処理要素は、代替的に、
図7に示されるプロセッサコア200の1より多くのものを含み得る。プロセッサコア200は、シングルスレッドコアであってもよく、又は、少なくとも1つの実施形態について、プロセッサコア200は、それが、コアごとに2つ以上のハードウェアスレッドコンテキスト(若しくは「論理プロセッサ」)を含み得る、という点でマルチスレッドであってもよい。
【0033】
図7はまた、プロセッサコア200と結合されているメモリ270を示す。メモリ270は、当業者によって既知か、そうでなければ当業者に利用可能な(メモリ階層の様々な層を含む)多種多様なメモリのいずれかであり得る。メモリ270は、プロセッサコア200によって実行される1又は複数のコード213の命令を含み得る。ここで、既に説明されたように、コード213は、方法90(
図3)、方法110(
図4)、及び/又は、方法131(
図5)を実装し得る。プロセッサコア200は、コード213によって示される命令のプログラムシーケンスに従う。各命令は、フロントエンド部210に入り得、1又は複数のデコーダ220によって処理され得る。デコーダ220は、予め定義されたフォーマットの固定幅マイクロオペレーション等のマイクロオペレーションをその出力として生成してもよく、又は、元のコード命令を反映する他の命令、マイクロ命令、若しくは制御信号を生成してもよい。示されるフロントエンド部210はまた、レジスタリネーミングロジック225と、スケジューリングロジック230とを含み、それらは概して、リソースを割り当て、変換命令に対応する作業を実行のためにキューに入れる。
【0034】
プロセッサコア200は、255‐1から255‐Nまでの実行ユニットのセットを有する実行ロジック250を含むように示されている。いくつかの実施形態は、特定の機能又は機能のセット専用の複数の実行ユニットを含み得る。他の実施形態は、1つの実行ユニットのみ、又は、特定の機能を実行し得る1つの実行ユニットを含み得る。図示される実行ロジック250は、コード命令によって指定される作業を実行する。
【0035】
コード命令によって指定される作業の実行完了後、バックエンドロジック260は、コード213の命令をリタイアさせる。一実施形態において、プロセッサコア200は、アウトオブオーダの実行を可能にするが、命令のインオーダリタイアメントを要求する。リタイアメントロジック265は、当業者に既知の様々な形態をとり得る(例えば、リオーダバッファ又は同様のもの)。このように、プロセッサコア200は、少なくとも、デコーダによって生成される出力、レジスタリネーミングロジック225によって利用されるハードウェアレジスタ及びテーブル、並びに、実行ロジック250によって修正される任意のレジスタ(不図示)の観点から、コード213の実行中に変換される。
【0036】
図7に示されていないが、処理要素は、プロセッサコア200を有するチップ上に他の要素を含み得る。例えば、処理要素は、プロセッサコア200と共にメモリ制御ロジックを含み得る。処理要素は、I/O制御ロジックを含み得、及び/又は、メモリ制御ロジックと一体化されているI/O制御ロジックを含み得る。処理要素はまた、1又は複数のキャッシュを含み得る。
【0037】
ここで、
図8を参照すると、一実施形態に従うコンピューティングシステム1000の実施形態のブロック図が示される。
図8に示されるのは、第1の処理要素1070及び第2の処理要素1080を含むマルチプロセッサシステム1000である。2つの処理要素1070及び1080が示されているが、システム1000の一実施形態はまた、1つのそのような処理要素のみを含み得ることが理解される。
【0038】
システム1000は、ポイントツーポイントインターコネクトシステムとして示される。ここで、第1の処理要素1070及び第2の処理要素1080が、ポイントツーポイントインターコネクト1050を介して結合されている。
図8に示される任意の又はすべてのインターコネクトは、ポイントツーポイントインターコネクトではなくマルチドロップバスとして実装され得ることが理解されるべきである。
【0039】
図8に示されるように、処理要素1070及び1080のそれぞれは、第1のプロセッサコア及び第2のプロセッサコア(すなわち、プロセッサコア1074a及び1074b、並びに、プロセッサコア1084a及び1084b)を含むマルチコアプロセッサであり得る。そのようなコア1074a、1074b、1084a、1084bは、
図7に関連して上述したものと同様の態様で、命令コードを実行するように構成され得る。
【0040】
各処理要素1070、1080は、少なくとも1つの共有キャッシュ1896a、1896bを含み得る。共有キャッシュ1896a、1896bは、コア1074a、1074b及び1084a、1084b等のプロセッサの1又は複数のコンポーネントによって利用されるデータ(例えば、命令)をそれぞれ格納し得る。例えば、共有キャッシュ1896a、1896bは、プロセッサのコンポーネントによるより高速なアクセスのために、メモリ1032、1034に格納されたデータをローカルにキャッシュし得る。1又は複数の実施形態において、共有キャッシュ1896a、1896bは、レベル2(L2)、レベル3(L3)、レベル4(L4)若しくは他のレベルのキャッシュ等の1又は複数の中間レベルキャッシュ、ラストレベルキャッシュ(LLC)、及び/又はそれらの組み合わせを含み得る。
【0041】
2つの処理要素1070、1080のみが示されているが、実施形態の範囲がそのように限定されないことが理解されるべきである。他の実施形態において、1又は複数の追加の処理要素が所与のプロセッサに存在し得る。代替的には、処理要素1070、1080のうち1又は複数は、アクセラレータ又はフィールドプログラマブルゲートアレイ等のプロセッサ以外の要素であってよい。例えば、追加の処理要素は、第1のプロセッサ1070と同一の追加のプロセッサ、第1のプロセッサ1070と異種又は非対称である追加のプロセッサ、アクセラレータ(例えば、グラフィックスアクセラレータ又はデジタル信号処理(DSP)ユニット等)、フィールドプログラマブルゲートアレイ、又は任意の他の処理要素を含み得る。アーキテクチャ特性、マイクロアーキテクチャ特性、熱特性、電力消費特性、及び同様のものを含む、多種多様の価値基準の観点から、処理要素1070、1080間に様々な差異が存在し得る。これらの差異は、処理要素1070、1080の間の非対称性及び異種性として、自身を効果的に表し得る。少なくとも1つの実施形態について、様々な処理要素1070、1080は、同一のダイパッケージに存在し得る。
【0042】
第1の処理要素1070は、メモリコントローラロジック(MC)1072、並びに、ポイントツーポイント(P-P)インタフェース1076及び1078をさらに含み得る。同様に、第2の処理要素1080は、MC1082、並びに、P-Pインタフェース1086及び1088を含み得る。
図8に示されるように、MC1072及び1082は、プロセッサをそれぞれのメモリ、すなわち、メモリ1032及びメモリ1034と結合する。これらのメモリは、それぞれのプロセッサにローカルに取り付けられたメインメモリの一部であり得る。MC1072及び1082が処理要素1070、1080に統合されているものとして示されているが、代替の実施形態について、MCロジックは、それらに統合されているものではなく、処理要素1070、1080の外部の個別のロジックであり得る。
【0043】
第1の処理要素1070及び第2の処理要素1080は、それぞれ、P-Pインターコネクト1076、1086を介して、I/Oサブシステム1090と結合され得る。
図8に示されるように、I/Oサブシステム1090は、P-Pインタフェース1094及び1098を含む。さらに、I/Oサブシステム1090は、I/Oサブシステム1090を高性能グラフィックスエンジン1038と結合するインタフェース1092を含む。一実施形態において、バス1049は、グラフィックスエンジン1038をI/Oサブシステム1090と結合するために用いられ得る。代わりに、ポイントツーポイントインターコネクトは、これらのコンポーネントを結合し得る。
【0044】
次に、I/Oサブシステム1090は、インタフェース1096を介して、第1のバス1016と結合され得る。一実施形態において、第1のバス1016は、ペリフェラルコンポーネントインターコネクト(PCI)バス、又は、PCIエクスプレスバス、若しくは他の第3世代のI/Oインターコネクトバス等のバスであり得るが、実施形態の範囲がそれらに限定されない。
【0045】
図8に示されるように、様々なI/Oデバイス1014(例えば、生体スキャナ、スピーカ、カメラ、センサ)は、第1のバス1016を第2のバス1020と結合し得るバスブリッジ1018と共に、第1のバス1016と結合され得る。一実施形態において、第2のバス1020は、ローピンカウント(LPC)バスであり得る。一実施形態において、例えば、キーボード/マウス1012、通信デバイス1026、及び、コード1030を含み得るディスクドライブ又は他の大容量ストレージデバイス等のデータストレージユニット1019を含む様々なデバイスは、第2のバス1020と結合され得る。既に説明されたように、図示されるコード1030は、方法90(
図3)、方法110(
図4)、及び/又は、方法131(
図5)を実装し得、既に説明されたように、コード213(
図7)と類似し得る。さらに、オーディオI/O1024が第2のバス1020と結合され得、バッテリ1010がコンピューティングシステム1000に電力を供給し得る。
【0046】
他の実施形態が考えられることに留意されたい。例えば、
図8のポイントツーポイントアーキテクチャではなく、システムは、マルチドロップバス又は他のそのような通信トポロジーを実装し得る。また、
図8の要素は、代替的に、
図8に示されるものより多い又は少ない統合チップを使用して分割され得る。
【0047】
[追加の注記及び例]
【0048】
(例1) 電圧レギュレータと、上記電圧レギュレータと結合されているプロセッサとを有する1又は複数の回路ボードと、1又は複数の基板と結合されているロジックとを備え、上記ロジックは、上記電圧レギュレータと関連付けられた過電流状態を検出することと、上記電圧レギュレータと関連付けられた過電流状態を検出することと、上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記プロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、性能強化コンピューティングシステムを含む。
【0049】
(例2)上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数の回路ボードの電源を切ることをバイパスする、例1のコンピューティングシステムを含む。
【0050】
(例3)上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、例1のコンピューティングシステムを含む。
【0051】
(例4)ベースボード管理コントローラ(BMC)をさらに備え、上記1又は複数の基板と結合されている上記ロジックは、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力を上記BMCに供給する、例3のコンピューティングシステムを含む。
【0052】
(例5)上記過電流状態と関連付けられたテレメトリ情報を収集するSMI転送モニタ(STM)をさらに備え、上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数のテレメトリ閾値を上記STMに供給し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を有し、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントを発行する、例3のコンピューティングシステムを含む。
【0053】
(例6)主回路ボードをさらに備え、上記主回路ボードは、ベースボード管理コントローラ(BMC)を有し、上記1又は複数の回路ボードは、副回路ボードを有し、上記保護措置は、上記BMCにより行われる、例1から例5のうちいずれか1つのコンピューティングシステムを含む。
【0054】
(例7)1又は複数の基板と、上記1又は複数の基板と結合されているロジックとを備え、上記ロジックは、設定可能なロジック又は機能固定型ハードウェアロジックのうち1又は複数に少なくとも部分的に実装され、上記1又は複数の基板と結合されている上記ロジックは、コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、半導体装置を含む。
【0055】
(例8)上記1又は複数の基板と結合されている上記ロジックは、上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする、例7の半導体装置を含む。
【0056】
(例9)上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、例7の半導体装置を含む。
【0057】
(例10)上記1又は複数の基板と結合されている上記ロジックは、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給する、例9の半導体装置を含む。
【0058】
(例11)上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給し、上記STMは、上記過電流状態と関連しているテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、例9の記載の半導体装置を含む。
【0059】
(例12)上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボード上に存在する、例7から例11のいずれか1つの半導体装置を含む。
【0060】
(例13)上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数の基板内に位置しているトランジスタチャネル領域を含む、例7から例12までのいずれか1つの装置を含む。
【0061】
(例14)コンピューティングシステムによって実行されるとき、上記コンピューティングシステムに、コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを実行させる実行可能プログラム命令のセットを備え、上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、少なくとも1つのコンピュータ可読記憶媒体を含む。
【0062】
(例15)上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスすることをさらに実行させる、例14の少なくとも1つのコンピュータ可読記憶媒体を含む。
【0063】
(例16)上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、例14の少なくとも1つのコンピュータ可読記憶媒体を含む。
【0064】
(例17)上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給することをさらに実行させる、例16の少なくとも1つのコンピュータ可読記憶媒体を含む。
【0065】
(例18)上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給することをさらに実行させ、上記STMは、上記過電流状態と関連付けられたテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、例16の少なくとも1つのコンピュータ可読記憶媒体を含む。
【0066】
(例19)上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより取られ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボード上に存在する、例14から例18のいずれか1つの少なくとも1つのコンピュータ可読記憶媒体を含む。
【0067】
(例20)性能強化コンピューティングシステムを操作する方法であって、コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出する段階と、上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別する段階と、上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取る段階とを備え、上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、方法を含む。
【0068】
(例21)上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする段階をさらに含む例20の方法を含む。
【0069】
(例22)上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、例20の方法を含む。
【0070】
(例23)アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給する段階をさらに含む例22の方法を含む。
【0071】
(例24)上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給する段階をさらに含み、上記STMは、上記過電流状態と関連付けられたテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、例22の方法を含む。
【0072】
(例25)上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボードに存在する、例20から例24のいずれか1つの方法を含む。
【0073】
(例26) 例20から例25のいずれか1つの方法を実行するための手段を備える装置を含む。
【0074】
実施形態は、すべてのタイプの半導体集積回路(「IC」)チップでの使用に適用可能である。これらのICチップの例は、プロセッサ、コントローラ、チップセットコンポーネント、プログラマブルロジックアレイ(PLA)、メモリチップ、ネットワークチップ、システムオンチップ(SoC)、SSD/NANDコントローラASIC、及び同様のものを含むがこれらに限定されない。加えて、図面のいくつかにおいて、信号導線が線で表されている。この一部は、より多くの成分信号経路を示すために、他と異なっていてよく、複数の成分信号経路を示すために番号ラベルを有してよく、及び/又は、主要情報の流れ方向を示すべく1又は複数の端部に矢印を有していてよい。しかしながら、このことは限定的に解釈されるべきではない。むしろ、かかる追加の詳細は、1又は複数の例示的な実施形態に関連して使用され、回路の理解をより容易にし得るものである。追加の情報を有しているか否かにかかわらず、表わされる任意の信号線は、実際には、複数の方向に伝搬し得る1又は複数の信号を備え得、任意の好適なタイプの信号方式、例えば、差動ペアで実装されるデジタル線又はアナログ線、光ファイバ線、及び/又は、シングルエンド線、で実装され得る。
【0075】
例示的なサイズ/モデル/値/範囲が与えられている場合があるが、実施形態はそれに限定されるものではない。とき間とともに製造技術(例えば、フォトリソグラフィ)が成熟するにつれて、より小型のデバイスが製造され得ることが予期される。加えて、例示及び説明を簡潔にするために、且つ、実施形態の特定の態様を不明瞭にしないために、ICチップ及び他のコンポーネントへの周知の電源/グラウンド接続が、図面内に示されてもよく、図面内に示されていなくてもよい。さらに、実施形態を不明瞭にすることを回避すべく、構成がブロック図の形態で示され得、また、かかるブロック図の構成の実装に関する詳細は実施形態が実装されるコンピューティングシステムに大きく依存する、という事実を鑑みれば、すなわち、かかる詳細は、当業者の十分知見の範囲内であるべきである。例示的な実施形態を説明すべく具体的な詳細(例えば、回路)が記載される場合、これらの具体的な詳細なしで、又はこれらの具体的な詳細の変形例によって、実施形態が実施され得ることが、当業者には明らかであろう。したがって、説明は、限定的なものではなく、例示的なものとしてみなされる。
【0076】
「結合」という用語は、対象となっているコンポーネント間の任意のタイプの直接的又は間接的な関係を指すために本明細書で使用され得、電気的、機械的、流体的、光学的、電磁的、電子機械的、又は他の接続に適用され得る。加えて、「第1」、「第2」等の用語は、説明を容易にするためにのみ本明細書において使用されてよく、反対の記載がない限り、何ら特定のとき間的又はとき系列的な意味を含まない。
【0077】
本願及び特許請求の範囲で用いられるように、「のうち1又は複数」という用語によって結合される項目の列挙は、列挙された用語の任意の組み合わせを意味し得る。例えば、用語「A、B、又はCのうち1又は複数」は、A、B、C、A及びB、A及びC、B及びC、又はA、B及びCを意味し得る。
【0078】
当業者であれば、上述の説明から、実施形態の広範な技術が様々な形態で実装され得ることを理解するだろう。したがって、実施形態がそれらの特定の例に関連して説明されてきたが、実施形態の真の範囲は、このように限定されるべきでない。なぜなら、図面、明細書、及び以下の特許請求の範囲を検討すれば、他の修正が当業者には明らかになるからである。他の可能性のあるクレーム
[項目1]
コンピューティングシステムであって、
電圧レギュレータと、上記電圧レギュレータと結合されているプロセッサとを有する1又は複数の回路ボードと、
1又は複数の基板と結合されているロジックとを備え、
上記ロジックは、
上記電圧レギュレータと関連付けられた過電流状態を検出することと、
上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、
上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、
上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記プロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
コンピューティングシステム。
[項目2]
上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数の回路ボードの電源を切ることをバイパスする、項目1に記載のコンピューティングシステム。
[項目3]
上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、項目1に記載のコンピューティングシステム。
[項目4]
ベースボード管理コントローラ(BMC)をさらに備え、
上記1又は複数の基板と結合されている上記ロジックは、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力を上記BMCに供給する、項目3に記載のコンピューティングシステム。
[項目5]
上記過電流状態と関連付けられたテレメトリ情報を収集するSMI転送モニタ(STM)をさらに備え、上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数のテレメトリ閾値を上記STMに供給し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を有し、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントを発行する、項目3に記載のコンピューティングシステム。
[項目6]
主回路ボードをさらに備え、上記主回路ボードは、ベースボード管理コントローラ(BMC)を有し、上記1又は複数の回路ボードは、副回路ボードを有し、上記保護措置は、上記BMCにより取られる、項目1に記載のコンピューティングシステム。
[項目7]
1又は複数の基板と、上記1又は複数の基板と結合されているロジックとを備え、上記ロジックは、設定可能なロジック又は機能固定型ハードウェアロジックのうち1又は複数に少なくとも部分的に実装され、上記1又は複数の基板と結合されている上記ロジックは、コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを行い、上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、半導体装置。
[項目8]
上記1又は複数の基板と結合されている上記ロジックは、上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする、項目7に記載の半導体装置。
[項目9]
上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、項目7に記載の半導体装置。
[項目10]
上記1又は複数の基板と結合されている上記ロジックは、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給する、項目9に記載の半導体装置。
[項目11]
上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給し、上記STMは、上記過電流状態と関連付けられたテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、項目9に記載の半導体装置。
[項目12]
上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボード上に存在する、項目7に記載の半導体装置。
[項目13]
上記1又は複数の基板と結合されている上記ロジックは、上記1又は複数の基板内に位置しているトランジスタチャネル領域を含む、項目7に記載の装置。
[項目14]
コンピューティングシステムによって実行されるとき、上記コンピューティングシステムに、
コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出することと、
上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別することと、
上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に取ることとを実行させる実行可能プログラム命令のセットを備え、
上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
少なくとも1つのコンピュータ可読記憶媒体。
[項目15]
上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスすることをさらに実行させる、項目14に記載の少なくとも1つのコンピュータ可読記憶媒体。
[項目16]
上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、項目14に記載の少なくとも1つのコンピュータ可読記憶媒体。
[項目17]
上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給することをさらに実行させる、項目16に記載の少なくとも1つのコンピュータ可読記憶媒体。
[項目18]
上記実行可能プログラム命令は、実行されるとき、上記コンピューティングシステムに、上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給することをさらに実行させ、上記STMは、上記過電流状態と関連付けられたテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、項目16に記載の少なくとも1つのコンピュータ可読記憶媒体。
[項目19]
上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボード上に存在する、項目14に記載の少なくとも1つのコンピュータ可読記憶媒体。
[項目20]
コンピューティングシステム内の電圧レギュレータと関連付けられた過電流状態を検出する段階と、
上記電圧レギュレータと関連付けられた設定可能な過電流保護ポリシーを識別する段階と、
上記設定可能な過電流保護ポリシーに基づいて保護措置を自動的に行う段階とを備え、
上記保護措置は、上記コンピューティングシステム内の1又は複数の追加のプロセッサから切り離した上記電圧レギュレータと結合されているプロセッサの周波数のスロットル、上記1又は複数の追加のプロセッサから切り離した上記プロセッサの非アクティブ化、仮想マシンモニタ通知の発行、データセンタ・フリート・マネージャー通知の発行、又は、上記プロセッサから上記1又は複数の追加のプロセッサのうち少なくとも1つへのワークロードの移行の開始のうち1又は複数を含む、
方法。
[項目21]
上記コンピューティングシステム内の1又は複数の回路ボードの電源を切ることをバイパスする段階をさらに含む項目20に記載の方法。
[項目22]
上記設定可能な過電流保護ポリシーは、1又は複数のテレメトリ閾値と、対応するシステム管理割り込み(SMI)処理能力とを含む、項目20に記載の方法。
[項目23]
アウト・オブ・バンドチャネルを介して、上記対応するSMI処理能力をベースボード管理コントローラに供給する段階をさらに含む項目22に記載の方法。
[項目24]
上記1又は複数のテレメトリ閾値をSMI転送モニタ(STM)に供給する段階をさらに含み、上記STMは、上記過電流状態と関連付けられたテレメトリ情報を収集し、上記データセンタ・フリート・マネージャー通知は、上記テレメトリ情報を含み、上記データセンタ・フリート・マネージャー通知は、超大規模データセンタのスケーラビリティコンポーネントに発行される、項目22に記載の方法。[項目25]
上記保護措置は、上記コンピューティングシステム内の主回路ボード上のベースボード管理コントローラにより行われ、上記電圧レギュレータは、上記コンピューティングシステム内の副回路ボードに存在する、項目20に記載の方法。
【外国語明細書】