特許第6691981号(P6691981)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 廣逹電腦股▲ふん▼有限公司の特許一覧

特許6691981オペレーティングシステムを介した熱管理
<>
  • 特許6691981-オペレーティングシステムを介した熱管理 図000002
  • 特許6691981-オペレーティングシステムを介した熱管理 図000003
  • 特許6691981-オペレーティングシステムを介した熱管理 図000004
  • 特許6691981-オペレーティングシステムを介した熱管理 図000005
  • 特許6691981-オペレーティングシステムを介した熱管理 図000006
  • 特許6691981-オペレーティングシステムを介した熱管理 図000007
  • 特許6691981-オペレーティングシステムを介した熱管理 図000008
  • 特許6691981-オペレーティングシステムを介した熱管理 図000009
  • 特許6691981-オペレーティングシステムを介した熱管理 図000010
  • 特許6691981-オペレーティングシステムを介した熱管理 図000011
  • 特許6691981-オペレーティングシステムを介した熱管理 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6691981
(24)【登録日】2020年4月15日
(45)【発行日】2020年5月13日
(54)【発明の名称】オペレーティングシステムを介した熱管理
(51)【国際特許分類】
   G06F 11/30 20060101AFI20200427BHJP
【FI】
   G06F11/30 193
   G06F11/30 158
【請求項の数】8
【外国語出願】
【全頁数】12
(21)【出願番号】特願2019-2958(P2019-2958)
(22)【出願日】2019年1月10日
(65)【公開番号】特開2020-52996(P2020-52996A)
(43)【公開日】2020年4月2日
【審査請求日】2019年1月10日
(31)【優先権主張番号】16/138,292
(32)【優先日】2018年9月21日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】508018934
【氏名又は名称】廣達電腦股▲ふん▼有限公司
【氏名又は名称原語表記】Quanta Computer Inc.
(74)【代理人】
【識別番号】110001896
【氏名又は名称】特許業務法人朝日奈特許事務所
(72)【発明者】
【氏名】王 鈞弘
【審査官】 今城 朋彬
(56)【参考文献】
【文献】 米国特許出願公開第2008/0065912(US,A1)
【文献】 米国特許出願公開第2015/0355651(US,A1)
【文献】 特開2016−157296(JP,A)
【文献】 特開2013−231519(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/30
G06F 11/34
(57)【特許請求の範囲】
【請求項1】
マネジメントコントローラを用いた計算装置における熱管理の方法であって、
マネジメントコントローラに連結されていない計算装置の1つ以上の熱影響を受けやすい部品についての監視情報をオペレーティングシステム(OS)エージェントを介して取得する工程を備え、前記監視情報は、前記1つ以上の熱影響を受けやすい部品についての温度情報を含み、前記方法はさらに、
前記マネジメントコントローラのシステムインターフェイスを通じて前記マネジメントコントローラへ監視情報を前記OSを介して送信する工程と、
前記マネジメントコントローラに連結された前記計算装置の少なくとも1つの熱管理部品の動作を前記マネジメントコントローラを介して調整する工程とを備える、方法。
【請求項2】
前記1つ以上の熱影響を受けやすい部品の各々についての前記監視情報は、識別情報を含む、請求項1記載の方法。
【請求項3】
前記1つ以上の熱影響を受けやすい部品についての前記監視情報は、低速化温度、停止温度、および現在温度を含む、請求項1記載の方法。
【請求項4】
前記1つ以上の熱影響を受けやすい部品のうちの少なくとも1つは、グラフィックス処理ユニットを備える、請求項1記載の方法。
【請求項5】
マネジメントコントローラを用いた計算装置の熱管理のためのコンピュータシステムであって、
1つ以上の熱影響を受けやすい部品と、
マネジメントコントローラとを備え、前記マネジメントコントローラはシステムインターフェイスを備え、前記マネジメントコントローラは、1つ以上の熱影響を受けやすい部品に繋がっておらず、前記マネジメントコントローラは、受信した監視情報に基づいて熱管理部品の動作を調整するように構成され、前記コンピュータシステムはさらに、
前記マネジメントコントローラに連結された少なくとも1つの熱管理部品と、
前記1つ以上の熱影響を受けやすい部品の温度情報を含む、前記1つ以上の熱影響を受けやすい部品の監視情報を取得するとともに、前記マネジメントコントローラの前記システムインターフェイスを通じて前記マネジメントコントローラへ前記監視情報を送信するように構成されたオペレーティングシステム(OS)エージェントとを備える、コンピュータシステム。
【請求項6】
前記1つ以上の熱影響を受けやすい部品の各々についての前記監視情報は、識別情報を含む、請求項記載のコンピュータシステム。
【請求項7】
前記1つ以上の熱影響を受けやすい部品についての前記監視情報は、低速化温度、停止温度、および現在温度を含む、請求項記載のコンピュータシステム。
【請求項8】
前記1つ以上の熱影響を受けやすい部品のうちの少なくとも1つは、グラフィックス処理ユニットである、請求項記載のコンピュータシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、計算システムにおける温度管理に関する。
【背景技術】
【0002】
近代の計算システムは、GPU、CPU、およびRAM等の多数の電子部品を備える。電子部品が高速化および高性能化するにつれ(例えば、フォームファクタの縮小、およびGPUもしくはCPUの高速化)、より大きな熱が電子部品内に発生する。十分な冷却を行わなければ、過熱が起こり、部品に物理的な損傷が生じ得る。また、これによってシステム障害およびデータ損失が生じる場合もある。
【0003】
一部のコンピュータシステムにおいては、ベースボードマネジメントコントローラ(BMC)等のマネジメントコントローラが、電子部品とマネジメントコントローラとの間の直接的な電子接続を通じて電子部品の温度を監視する(例えば、特許文献1に記載のBMC)。例えば、マネジメントコントローラは、コンピュータバス上に設けられ、コンピュータバスと電子部品との間の集積回路間(I2C)接続を通じて温度情報を受信することができる。そして、コンピュータシステムは、冷却ファンを使用し、蓄積した熱気を積極的に排気することにより、過剰な熱を電子部品から除去することができる。これにより、電子部品内が適温に保たれる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第8,489,250号明細書
【発明の概要】
【0005】
一部のコンピュータシステムにおいて、マネジメントコントローラは、電子部品と通信することができない。例えば、特定の電子部品は、I2C接続もしくは他の直接的な電子接続によってコンピュータバスに対して接続されていない場合がある。このため、マネジメントコントローラは、電子部品の温度を検知することができず、ファン動作を調整して電子部品内の許容温度を保つことができない。
【0006】
このため、マネジメントコントローラへ温度情報を提供するための代替的なシステムおよび方法が求められている。
【0007】
本開示の様々な例は、マネジメントコントローラを用いた計算装置における熱管理の方法を対象としている。当該方法は、計算装置の1つ以上の熱影響を受けやすい部品についての監視情報を取得する工程を備え、部品は、マネジメントコントローラに連結されていない。監視情報は、1つ以上の熱影響を受けやすい部品についての温度情報を含み得る。次に、当該方法により、マネジメントコントローラのシステムインターフェイスを通じて、マネジメントコントローラへ監視情報をOSを介して送信することができる。最後に、当該方法により、マネジメントコントローラに連結された計算装置の少なくとも1つの熱管理部品の動作を、マネジメントコントローラを介して調整する。
【0008】
本開示の第2の実施形態は、マネジメントコントローラを用いた計算装置の熱管理のためのコンピュータシステムを対象としている。コンピュータシステムは、1つ以上の熱影響を受けやすい部品と、マネジメントコントローラと、少なくとも1つの熱管理部品と、オペレーティングシステムエージェントとを備え得る。マネジメントコントローラは、システムインターフェイスを備え得て、1つ以上の熱影響を受けやすい部品に連結されていないものであり得る。マネジメントコントローラは、受信した監視情報に基づいて熱管理部品の動作を調整するように構成され得る。少なくとも1つの熱管理部品は、マネジメントコントローラに連結され得る。オペレーティングシステムは、1つ以上の熱影響を受けやすい部品についての監視情報を取得するとともに、監視情報をマネジメントコントローラへ送信するように備えられ得る。送信は、マネジメントコントローラのシステムインターフェイスを通じて行われ得る。監視情報は、1つ以上の熱影響を受けやすい部品の温度情報を含み得る。
【0009】
本開示の第3の実施形態において、持続性コンピュータ読み取り可能媒体は、少なくとも1つのプロセッサによって実行可能な命令を記憶することができる。当該命令により、計算装置の1つ以上の熱影響を受けやすい部品についての監視情報が取得され得て、部品はマネジメントコントローラに連結されていないものであり得る。監視情報は、1つ以上の熱影響を受けやすい部品についての温度情報を含み得る。次に、当該命令により、マネジメントコントローラのシステムインターフェイスを通じて、マネジメントコントローラへ監視情報をOSを介して送信する。最後に、当該命令により、マネジメントコントローラに連結された計算装置の少なくとも1つの熱管理部品の動作を、マネジメントコントローラを介して調整する。
【0010】
様々な実施形態の一部の例において、1つ以上の熱影響を受けやすい部品の各々についての監視情報には、識別情報、低速化温度、停止温度、および現在温度を含む様々な情報が含まれ得る。
【0011】
様々な実施形態の一部の例において、1つ以上の熱影響を受けやすい部品のうちの少なくとも1つは、グラフィックス処理ユニットであり得る。
【0012】
様々な実施形態の一部の例において、システムインターフェイスは、キーボードコントローラスタイルのインターフェイスであり得る。
【0013】
様々な実施形態の一部の例において、マネジメントコントローラは、ベースボードマネジメントコントローラであり得る。
【0014】
「コンピュータシステム」、「計算システム」、および「サーバシステム」の用語は、すべて本開示において置き換え可能に使用され、データを記憶および処理するすべての電子計算システムとして同一に扱われる。このような電子計算システムは、パーソナルコンピュータ、ラップトップコンピュータ、タブレット、および商用もしくは個人サーバシステムを含み得るが、これらに限定されない。
【0015】
添付の図面は、本発明の実施形態を例示するものであり、本明細書の記載と合わせて、本発明の原理を説明および表現する役割を果たす。図面は、好適な実施形態の主たる特徴を図表により示すことを意図している。図面は、実際の実施形態のすべての特徴を描写すること、および描写された構成要素の相対的な寸法を表現することを意図しておらず、縮尺通りには描かれていない。
【図面の簡単な説明】
【0016】
図1】GPUがマネジメントコントローラに連結された従来のコンピュータシステムを概略的に示す従来技術の図である。
図2A】連結されたGPUの過熱に対して従来のコンピュータシステムがどのように対処するかを示す従来技術の図である。
図2B】連結されたGPUの過熱に対して従来のコンピュータシステムがどのように対処するかを示す従来技術の図である。
図3】GPUがマネジメントコントローラに連結されていない従来のコンピュータシステムを概略的に示す従来技術の図である。
図4A】連結されていないGPUの過熱に対して従来のコンピュータシステムがどのように対処するかを示す従来技術の図である。
図4B】連結されていないGPUの過熱に対して従来のコンピュータシステムがどのように対処するかを示す従来技術の図である。
図4C】連結されていないGPUの過熱に対して従来のコンピュータシステムがどのように対処するかを示す従来技術の図である。
図5】本開示の実施形態に係る例示的なコンピュータシステムを示す図である。
図6】本開示の実施形態に係る例示的なOSの動作構成を示す図である。
図7A】本開示の実施形態に係る、連結されていないGPUの過熱に対して例示的なコンピュータシステムがどのように対処するかを示す図である。
図7B】本開示の実施形態に係る、連結されていないGPUの過熱に対して例示的なコンピュータシステムがどのように対処するかを示す図である。
【発明を実施するための形態】
【0017】
添付の図面を参照し、本発明について説明する。類似もしくは同等の構成要素については、すべての図面において同様の符号を用いて示される。図面は、縮尺通りに描かれておらず、本発明を単に簡略的に示すものである。本発明のいくつかの局面は、適用例を参照して以下に説明する。なお、本発明の完全な理解のため、多くの具体的な詳細、関係、および方法が説明されることを理解すべきである。しかし、当該技術における当業者は、1つ以上の具体的な詳細なしに、または他の方法によって本発明が実施され得ることを容易に理解する。他の例においては、発明が不明瞭となることを避ける為に、周知の構成もしくは動作は詳細に示されない。本発明は、例示された行為もしくは事象の順序に限定されず、一部の行為は他の行為もしくは事象と異なる順序および/または同時に発生し得る。さらに、すべての例示された行為もしくは事象のすべてが本発明による方法を実施するのに必要となるわけではない。
【0018】
本開示は、コンピュータシステムにおけるオペレーティングシステムを使用し、マネジメントコントローラに連結されていないGPUからマネジメントコントローラへの温度情報の通信を可能とすることを対象とする。すなわち、マネジメントコントローラに対応づけられた管理バスにGPUが通信可能に連結されていない場合に温度情報の通信を可能とする。これにより、連結されていないGPUからの温度情報に基づき、マネジメントコントローラはコンピュータシステムにおいてファンを依然として制御することができる。これにより、管理バスを通じた接続がない場合であっても、効率的にGPUを利用することができる。特に、GPU温度情報は、オペレーティングシステム(OS)エージェントを介して取得することができる。OSは、マネジメントコントローラのシステムインターフェイスを介してマネジメントコントローラへ温度情報を送信することができる。そして、マネジメントコントローラは、連結されていないGPUの温度情報に基づいてファン速度比率を制御することができる。このため、本開示は、閉ループ制御システムを提供し、ファン速度比率を自動的に規制することにより、連結されていないGPUの適切な動作温度を人の介在なしに維持するものである。
【0019】
図1は、従来のコンピュータシステム100を概略的に示す図である。コンピュータシステム100は、中央処理装置(CPU)107を備える。CPU107は、コンピュータシステム100の動作に必要な算術演算および論理演算を行う標準的な中央処理装置である。CPU107は、グラフィックス処理ユニット(GPU)108に接続することができる。多くの電子部品のように、CPU107およびGPU108は動作中に熱を生じる。このようなことから、コンピュータシステム100は、コンピュータシステム100内の部品を冷却するためにファン106を備えることができる。ファン106は、CPU107およびGPU108に近接して配置され、空気流を発生させるとともに、CPU107およびGPU108によって生じた熱を運び出し得る。
【0020】
システム100において、ベースボードマネジメントコントローラ(BMC)104は、いつどのようにしてファン106を作動させてGPU108を冷却するかを判定する。GPU108は、コンピュータシステム100の管理バス130を介してBMC104と通信することができる。管理バス130は、I2Cバスである。このような通信時において、GPU108は、GPU108の正常性、動作、および性能の状態についての情報をBMC104に提供することができる。このような情報には、GPUの電圧および温度が含まれ得る。この情報は、管理バス130によってBMC104へ送信され得る。これに応答し、BMC104は、この情報およびBMC104が利用可能な他の情報に基づいて、ファン106をどのように動作させるかを判定することができる。例えば、管理バス130を介して、BMC104は、回転速度計、熱センサ、電圧計、電流計、デジタルセンサ、およびアナログセンサ等の他のセンサへアクセスしても良い。または、これらのセンサの一部もしくは全てが、BMC104、もしくはBMC104に接続されたコンピュータシステムの他の部品(図示せず)に組み込まれても良い。その後、BMC104は、管理バス130を介してファン106へ制御信号を送信することができる。
【0021】
図2Aおよび図2Bは、従来のGPU108、BMC104、およびファン106を概略的に表したものであり、BMC104がその内部温度センサおよびGPU108からの温度読み取り値の両方を使用してファン106を制御し、GPU108における負荷率を向上させる態様を示す。一部の例においては、本開示の目的のために、BMC104もしくはGPU108のいずれかは内部温度センサを有さない場合がある。各部品についての温度データは、各部品の近くに位置する温度センサから引き出すことができる。例えば、BMC104の温度データは、BMC104の最も近くにある、コンピュータシステム内の温度センサに基づいて判定することができる。
【0022】
まず図2Aを参照すると、初期状態が示されている。BMC104は摂氏32度の周囲温度を検知し、ファン106は60%程度の出力で動作し、GPU108の現在温度は摂氏84度であり、GPU108は97%の負荷率で動作している。この場合、GPU108が所定の低速化閾値温度である摂氏85度近くであることが検知されたことから、GPU108は、過熱を回避するために性能を調整した(すなわち、負荷率を97%に制限した)。また、GPU108は、摂氏89度などの所定の停止閾値温度を有するように構成することができ、当該停止閾値温度では、GPU108の部品への損傷を防止するために、GPU108が自動的に停止する。
【0023】
図2Bは、BMC104(図1に図示)にGPU108が通信可能に連結された場合における後続の状態を示す。コンピュータシステム100Aにおいて、BMC104は、より高い出力で動作するようにファン106を制御し、GPU負荷率を向上させることが可能である。すなわち、BMC104は、図2Aにおける初期状態に応じて、GPU108の温度を考慮してファン106への適切な出力を判定するように構成することができる。特に、図2Bは、80%の出力で動作するように再構成されることを示す。このファン106の速度比率の増加は、GPU108における摂氏82度への温度の低下、およびBMC104における摂氏30度への温度の低下に対応する。また、温度が低下したことから、GPU108は負荷率を増加させることができる。例えば、図2Bに示すように、負荷率は100%に増加している。
【0024】
図3は、従来のコンピュータシステム100Bを概略的に示す図であり、GPU108は、管理バス103を通じてBMC104と通信することができない。円で囲んだ領域に示されるように、GPU108は管理バス130を介してBMC104に接続されていない(すなわち、GPU108は連結されていない)。このため、BMC104は、GPU108の温度情報を受信することができない。例えば、コンピュータシステム100BにおけるGPU108は、I2Cバスを介して接続されていない場合がある。このため、ファン106の出力を制御する際にBMC104はGPU108の温度を考慮することができない。結果として、GPU108は、損傷を防止するために低速化もしくは停止し得る。
【0025】
図4Aから図4Cは、従来のGPU108、BMC104、およびファン106を概略的に表したものである。これらの図は、コンピュータシステム100BにおけるBMC104がファン106を制御する際にGPU108からの温度読み取り値を考慮できず、GPU108の負荷率が低減される態様を表している。
【0026】
まず図4Aを参照すると、初期状態が示されている。BMC104は摂氏32度の周囲温度を検知し、ファン106は60%程度の出力で動作し、GPU108の現在温度は摂氏84度であり、GPU108は97%の負荷率で動作している。この場合、GPU108が所定の低速化閾値温度である摂氏85度近くであることが検知されたことから、GPU108は、過熱を回避するために性能を調整した(すなわち、負荷率を97%に制限した)。また、GPU108は、摂氏89度などの所定の停止閾値温度を有するように構成することができ、当該停止閾値温度では、GPU108の部品への損傷を防止するために、GPU108が自動的に停止する。
【0027】
図4Bおよび図4Cは、GPU108がBMC104に通信可能に接続されていない場合(図1に図示)における後続の状態を示す。これらの場合において、BMC104は、より高い出力で動作するようにファン106を制御し、GPU負荷率を向上させることができない。すなわち、BMC104は、図4Aにおける初期状態に応じてGPU108からの温度情報を受信しないことから、GPU108の温度を考慮してファン106への適切な出力を判定することができない。BMC104は周囲温度のみを考慮し、ファンは60%の出力に維持される。図4Bは、結果としてBMC104の温度が摂氏33度へ上昇したことを示す。これはBMC104にとって許容可能であり得るが、GPU108の温度が摂氏85度へ上昇する結果となり得る。このため、GPU108の温度上昇により、GPU108が低速化閾値に到達し、負荷率が減少する。例えば、図4Bに示すように、負荷率は80%へ減少する。
【0028】
図4Cは、図4Bに示した状態からさらに後続の状態を示す。ファン106の出力がGPU108を冷却するのに十分でないと、GPU108の温度は上昇を続ける。一部の場合においては、この温度上昇により、GPU108の温度が停止閾値(摂氏89度)に到達し得る。その時点において、GPU108が停止することで負荷率は0%へ落ち、損傷が防止される。
【0029】
図5は、BMCとBMCに連結されていないGPUとの間で通信するように構成された好適なコンピュータシステム500を示す図である。コンピュータシステム500は、BMC104と、ファン106a、106b、106c、106d(まとめて「ファン106」という)と、CPU107と、GPU108a、108b、108c、108d(まとめて「GPU108」という)と、管理バス130とを含み得る。これらの部品は、図3のコンピュータシステムにおいて同じ符号が付された部品と同様に動作し得る。さらに、コンピュータシステム500は、OS110とシステムインターフェイス112とを含み得る。OS110は、GPU108から監視情報を取得し、システムインターフェイス112を通じてBMC104へ取得した監視情報を送信するように構成することができる。
【0030】
例えば、OS110は、現在温度と、所定の低速化閾値温度と、所定の停止閾値温度とを含む監視情報を各GPU108から収集することができる。一部の状況において、各GPU108の現在温度は異なり得る。図5は、GPU108aの現在温度が摂氏82度であり、GPU108bの温度が摂氏84度であり、GPU108cの温度が摂氏81度であり、GPU108dの温度が摂氏84度であることを示している。監視情報は、すべてのGPUのバスIDを含み得る。一部の例においては、OS110は、各GPU108の外部もしくは内部に設けられた温度センサを通じて各GPU108の現在温度を収集することができる。他の例においては、OS110は、近くに位置するGPU108を通じて現在温度を収集することができる。
【0031】
システムインターフェイス112は、OS110から取得した情報をBMC104の未処理データスペース104aに置くように構成することができる。このため、未処理データスペース104aは、バスID、現在温度、所定の低速化閾値温度、および所定の停止閾値温度についての情報を保持することができる。BMC104は、未処理データスペース104aに記憶された情報を引き出し、ファン106をどのように動作させるかについて指定するように構成することができる。例えば、GPU108の現在温度の読み取り値が高い場合、BMC104は、動作速度を上昇させるようにファン106に通知することができる。BMC104は、個々のファン106a、106b、106c、もしくは106dに対し、対応するGPU108a、108b、108c、もしくは108dにおける個別の過熱に応じてファン速度を上昇させるよう通知することができる。
【0032】
本開示の一部の目的のためにGPU108を参照したが、本開示はこれに限らない。計算装置において連結されていない熱影響を受けやすいすべての部品を、本明細書に記載の方法と実質的に同じ方法でOS110によって監視することができる。
【0033】
図6は、本開示の実施形態に係る好適な動作構成600を示す図である。動作構成600は、OS620と、システムインターフェイスツール622と、マネジメントコントローラにおける未処理データスペース624と、マネジメントコントローラのファン制御プロトコル626と、ドライバ通信インターフェイス628と、装置ドライバ630とを含み得る。
【0034】
OS620は、GPUからドライバ通信インターフェイス628へ監視情報の要求を送信することができる。ドライバ通信インターフェイス628は要求を装置ドライバ630へ渡すことができる。本開示によれば、装置ドライバ630は、監視情報をGPUから引き出すように構成される。装置ドライバ630が監視情報を取得した後、装置ドライバ630はドライバ通信インターフェイス628を通じてOS620に情報を渡すことができる。そして、OS620は、システムインターフェイスツール622を介して監視情報を送信することができる。システムインターフェイスツール622は、マネジメントコントローラの未処理データスペース624に監視情報を保存するように構成することができる。続いて、マネジメントコントローラは未処理データスペース624内の監視情報にアクセスすることができる。そして、マネジメントコントローラのファン制御プロトコル626は、その情報に基づいて動作することができる。例えば、ファン制御プロトコル626は、各GPUから提供される低速化温度、停止温度、および現在温度を読むことができる。そして、ファン制御プロトコル626は、各GPUについてファン106に要求される冷却の度合いを判定し、マネジメントコントローラがファンへ送信する適切なファン速度比率信号を判定することができる。
【0035】
特定の実施において、装置通信インターフェイス628をCUDA NVIDIA管理ライブラリ(NVML)等のローエンドAPIとし、ドライバ630をCUDAドライバとすることができる。NVMLは、様々な動作パラメータを監視および管理するための一連のコマンドと、コンピュータ部品からの現在温度を含む動作データとを含む。CUDA NVML APIは、CUDAドライバによってアクセスされるライブラリの部分のうちの1つからNVIDIA GPUのランタイム現在温度を読み込むことができる。オペレーティングシステムがCUDAドライバにインストールされている場合、NVMLはオペレーティングシステムに呼び出されても良い。例えば、オペレーティングシステムはCPU内で起動されるのみであることから、NVIDIA GPUは、CPUの命令を実行できないが、代わりにCUDAドライバ内の命令をスケジューリングしなければならない。このため、NVMLは、アセンブリコードを使用してGPU情報へアクセスすることによって、CUDAドライバとGPUとを繋ぐことができる。しかしながら、本開示は、NVIDIAハードウェアもしくはソフトウェア部品に限定されず、当該技術における当業者は、装置通信インターフェイス628はGPU情報を引き出すためにGPUとインターフェイス接続する方法であれば良いことを理解する。
【0036】
OS620は、ファン速度比率を変化させるために使用され得る生データとしてのインバンドデータを未処理データスペース624へ送信するシステムインターフェイスツール622として、IPMIツールを使用することができる。IPMIツールは、インテリジェントプラットフォームマネジメントインターフェイス(IPMI)が有効となっている装置を管理するためのコマンドを入力するために使用される、コマンドプロンプトインターフェイスである。
【0037】
図7Aおよび図7Bは、GPU108a、BMC104、およびファン106aを概略的に示す図である。これらの図は、OS620および装置通信インターフェイス628から提供された、GPU108からの内部温度センサおよび温度読み取り値の両方をどのようにBMC104が使用してファン106aを制御し、GPU108aにおける負荷率を向上させるのかについて示している。
【0038】
まず図7Aを参照すると、初期状態が示されている。BMC104は摂氏32度の周囲温度を検知し、ファン106aは60%程度の出力で動作し、GPU108aの現在温度は摂氏84度である。
【0039】
図7Bは、本開示に係る、OS620および装置通信インターフェイス628を通じて提供されるGPU108aからの温度読み取り値がBMC104と通信される場合の後続の状態を示している。すなわち、BMC104は、図7Aにおける初期状態に応じて、GPU108aからの温度情報を考慮してファン106aへの適切な出力を判定するように構成することができる。特に、図7Bは、80%の出力で動作するように再構成されることを示す。このファン106aの出力の増加は、GPU108aにおける摂氏82度への温度の低下、およびBMC104における摂氏30度への温度の低下に対応する。GPU108aにおいて温度が低下したことから、GPU108aは負荷率を増加させることができる。
【0040】
本発明の様々な例について説明したが、これらは例として示されたのみであり、限定するものではないことを理解すべきである。本発明の趣旨および範囲を逸脱しない範囲において、本明細書における開示に基づいて、開示された例に対して多くの変更を行うことができる。したがって、本発明の広さおよび範囲は、上記の例のいずれによっても限定されるものではない。なお、本発明の範囲は、以下の特許請求の範囲およびその均等物に基づいて定義すべきである。
【0041】
本発明は1つ以上の実施例に関して図示および説明がなされたが、本明細書および添付の図面を読んで理解することにより、当業者は同等の修正および変更を行うことができる。さらに、いくつかの実施例のうちの1つのみに関して本発明の特定的な特徴が開示され得るが、このような特徴は、必要に応じて、かつ所与もしくは特定の適用例において有利である場合には、他の実施例における1つ以上の他の特徴と組み合わされても良い。
【0042】
本明細書において使用されている用語は、特定の例を記載する目的のみに使用されるものであり、発明を限定することを意図していない。本明細書中において使用される、単数形の「a」、「an」、および「the」は、文中において特に明確な指定が無い限り、複数形を含むことを意図している。さらに、「including」、「includes」、「having」、「has」、「with」、またはこれらの変形である用語が発明の詳細な説明および/または請求項で使用される範囲において、これらの用語は、「comprising」の用語と同様に含まれることを意図している。
【0043】
特に定義されない限り、本明細書において使用されるすべての用語(技術用語および科学用語を含む)は、本発明が属する技術における当業者によって一般的に理解される意味と同じ意味を有する。さらに、一般的に使用されている辞書において定義される用語は、関連技術の文脈における意味に従った意味を有するものとして解釈すべきであり、本明細書において明示的に定義されない限り、理想的な意味合い、もしくは過度に形式的な意味合いで解釈されるものでは無い。
図1
図2A
図2B
図3
図4A
図4B
図4C
図5
図6
図7A
図7B