(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024137700
(43)【公開日】2024-10-07
(54)【発明の名称】サーバ熱管理
(51)【国際特許分類】
G11B 33/14 20060101AFI20240927BHJP
G11B 33/12 20060101ALI20240927BHJP
G11B 33/02 20060101ALI20240927BHJP
【FI】
G11B33/14 501A
G11B33/14 501D
G11B33/12 313C
G11B33/02 Z
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024002387
(22)【出願日】2024-01-11
(31)【優先権主張番号】63/491,772
(32)【優先日】2023-03-23
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】18/448,633
(32)【優先日】2023-08-11
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】504056130
【氏名又は名称】ウェスタン デジタル テクノロジーズ インコーポレーテッド
(74)【代理人】
【識別番号】100207837
【弁理士】
【氏名又は名称】小松原 寿美
(72)【発明者】
【氏名】テュー ウェイ ホン
(72)【発明者】
【氏名】チャン ツェー ピン
(72)【発明者】
【氏名】ラウ チュン ショーン
(57)【要約】 (修正有)
【課題】複数のデータ記憶デバイスを含むサーバの熱管理を実行するためのサーバ、方法及びコンピュータ可読媒体を提供する。
【解決手段】サーバによる方法は、機械学習モデルを適用して、高温ゾーンの外側に位置される複数のデータ記憶デバイス(例えばSSD)の第2の部分に対して高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を特定するコントローラを含む。コントローラは、複数のデータ記憶デバイスのそれぞれから受信される熱データに基づいて高温ゾーンを特定する。高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分の特定に基づいて、コントローラは、分散高温ゾーンを作成するべく複数のデータ記憶デバイスを論理的にシャッフルすることによって複数のデータ記憶デバイスの熱管理を実行する。
【選択図】
図6
【特許請求の範囲】
【請求項1】
機械学習モデルを記憶するように構成されるメモリと、
シャーシ内に配置される複数のデータ記憶デバイスと、
前記メモリに結合されたコントローラとを備える記憶システムであって、前記コントローラは、
前記複数のデータ記憶デバイスと関連付けられる熱データを受信し、
機械学習モデルを適用して、前記熱データに基づき、高温ゾーン内に位置される前記複数のデータ記憶デバイスの第1の部分を、前記高温ゾーンの外側に位置される前記複数のデータ記憶デバイスの第2の部分に対して特定し、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分の特定に基づき、前記複数のデータ記憶デバイスの熱管理を実行する、
ように構成され、前記熱管理を実行するために、前記コントローラは、前記複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成する、
サーバ。
【請求項2】
前記コントローラは、前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分を特定するために、
前記複数のデータ記憶デバイスのそれぞれの使用と関連付けられるパターンを決定し、
前記パターンに基づいて前記複数のデータ記憶デバイスを論理的にシャッフルする、
ように更に構成される、請求項1に記載のサーバ。
【請求項3】
前記パターンは、前記複数のデータ記憶デバイスの前記第1の部分が第1の期間中に前記複数のデータ記憶デバイスの前記第2の部分よりも頻繁に使用されるという決定を含む、請求項2に記載のサーバ。
【請求項4】
前記パターンは、前記複数のデータ記憶デバイスの前記第2の部分が前記第1の期間とは異なる第2の期間中に前記複数のデータ記憶デバイスの前記第1の部分よりも頻繁に使用されるという決定を含む、請求項3に記載のサーバ。
【請求項5】
前記シャーシが少なくとも1つの空気チャネルを含み、
前記複数のデータ記憶デバイスの前記第2の部分は、前記少なくとも1つの空気チャネルに直接隣接して配置される少なくとも1つのデータ記憶デバイスを含み、
前記複数のデータ記憶デバイスを論理的にシャッフルするために、前記コントローラは、前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分に含まれる少なくとも1つのデータ記憶デバイスのメモリ位置を、前記少なくとも1つの空気チャネルに直接隣接して配置される前記少なくとも1つのデータ記憶デバイスのメモリ位置と交換するように更に構成される、
請求項1に記載のサーバ。
【請求項6】
前記コントローラは、
前記複数のデータ記憶デバイスのヒートマップを生成するように更に構成され、前記ヒートマップは、ある期間にわたって前記複数のデータ記憶デバイスと関連付けられる熱データを含む、
請求項1に記載のサーバ。
【請求項7】
ユーザインタフェースを更に備え、前記コントローラは、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分を特定することに応じて、前記熱管理を実行する許可の要求を含む通知を前記ユーザインタフェースに提供し、
前記ユーザインタフェースを介して前記サーバのオペレータから許可を受けることに応じて前記熱管理を実行する、
ように更に構成される、請求項1に記載のサーバ。
【請求項8】
前記熱データは、前記複数のデータ記憶デバイスのそれぞれによって実行されるデータ操作の量を含み、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分によって実行されるデータ操作の量は、前記高温ゾーンの外側に位置される前記複数のデータ記憶デバイスの前記第2の部分によって実行されるデータ操作の量よりも多い、
請求項1に記載のサーバ。
【請求項9】
前記熱データは、前記複数のデータ記憶デバイスのそれぞれと関連付けられる温度測定値を含み、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分と関連付けられる温度は、前記複数のデータ記憶デバイスの前記第2の部分と関連付けられる温度よりも高い、
請求項1に記載のサーバ。
【請求項10】
サーバにおいて熱管理を実行するための方法であって、
複数のデータ記憶デバイスと関連付けられる熱データを受信することと、
熱データに基づいて、高温ゾーン内に位置される前記複数のデータ記憶デバイスの第1の部分を、前記高温ゾーンの外側に位置される前記複数のデータ記憶デバイスの第2の部分に対して特定することと、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分の特定に基づいて、前記複数のデータ記憶デバイスの熱管理を実行することであって、前記複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成することを含む、ことと、
を含む方法。
【請求項11】
前記複数のデータ記憶デバイスの前記第1の部分を特定することは、前記複数のデータ記憶デバイスのそれぞれの使用と関連付けられるパターンを決定することを含み、
前記方法は、前記パターンに基づいて前記複数のデータ記憶デバイスを論理的にシャッフルすることを含む、
請求項10に記載の方法。
【請求項12】
前記パターンは、前記複数のデータ記憶デバイスの前記第1の部分が第1の期間中に前記複数のデータ記憶デバイスの前記第2の部分よりも頻繁に使用されるという決定を含む、請求項11に記載の方法。
【請求項13】
前記パターンは、前記複数のデータ記憶デバイスの前記第2の部分が前記第1の期間とは異なる第2の期間中に前記複数のデータ記憶デバイスの前記第1の部分よりも頻繁に使用されるという決定を含む、請求項12に記載の方法。
【請求項14】
前記複数のデータ記憶デバイスが少なくとも1つの空気チャネルを有するシャーシ内に配置され、
前記複数のデータ記憶デバイスの前記第2の部分は、前記少なくとも1つの空気チャネルに直接隣接して配置される少なくとも1つのデータ記憶デバイスを含み、
前記複数のデータ記憶デバイスを論理的にシャッフルすることは、前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分に含まれる少なくとも1つのデータ記憶デバイスのメモリ位置を、前記少なくとも1つの空気チャネルに直接隣接して配置される前記少なくとも1つのデータ記憶デバイスのメモリ位置と交換することを含む、
請求項10に記載の方法。
【請求項15】
前記複数のデータ記憶デバイスのヒートマップを生成することであって、前記ヒートマップが、ある期間にわたって前記複数のデータ記憶デバイスと関連付けられる熱データを含む、ことと、
を更に含む、請求項10に記載の方法。
【請求項16】
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分を相対的に特定することに応じて、前記サーバのユーザインタフェースに、前記熱管理を実行する許可の要求を含む通知を提供することと、
前記ユーザインタフェースを介して前記サーバのオペレータから許可を受けることに応じて前記熱管理を実行することと、
を更に含む、請求項10に記載の方法。
【請求項17】
前記熱データは、前記複数のデータ記憶デバイスのそれぞれによって実行されるデータ操作の量を含み、
前記複数のデータ記憶デバイスの前記第1の部分によって実行されるデータ操作の量は、前記複数のデータ記憶デバイスの前記第2の部分によって実行されるデータ操作の量よりも多い、
請求項10に記載の方法。
【請求項18】
前記熱データは、前記複数のデータ記憶デバイスのそれぞれと関連付けられる温度測定値を含み、
前記複数のデータ記憶デバイスの前記第1の部分と関連付けられる温度は、前記複数のデータ記憶デバイスの前記第2の部分と関連付けられる温度よりも高い、
請求項10に記載の方法。
【請求項19】
コントローラによって実行されるときに前記コントローラに一連の動作を実行させる命令を記憶する非一時的コンピュータ可読媒体であって、前記動作が、
熱データに基づいて、高温ゾーン内に位置される複数のデータ記憶デバイスの第1の部分を、前記高温ゾーンの外側に位置される前記複数のデータ記憶デバイスの第2の部分に対して特定することと、
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分の特定に基づいて、前記複数のデータ記憶デバイスの熱管理を実行することであって、前記熱管理が、前記複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成することを含む、ことと、
を含む非一時的コンピュータ可読媒体。
【請求項20】
前記高温ゾーン内に位置される前記複数のデータ記憶デバイスの前記第1の部分を前記複数のデータ記憶デバイスの前記第2の部分に対して特定することは、
前記複数のデータ記憶デバイスのそれぞれの使用と関連付けられるパターンを決定することと、
前記パターンに基づいて前記複数のデータ記憶デバイスを論理的にシャッフルすることと、
を更に含む、請求項19に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
この出願は、2023年3月23日に出願された米国仮特許出願第63/491,772号の優先権及び利益を主張し、この仮特許出願の内容全体が参照により本願に組み入れられる。
【0002】
この出願は、一般に、サーバ熱管理に関し、より具体的には、本出願は、機械学習を使用するサーバ熱管理に関する。
【発明の概要】
【0003】
企業用の情報管理システム(「IMS」)又はサーバは、ソリッドステートドライブ(「SSD」)などのデータ記憶デバイスを受け入れるための複数のスロットを有するシャーシシステムを含むことができる。IMS及び/又はサーバ内のデータ記憶デバイスの密度が増大すると、シャーシ内の温度を調整するために使用される空気チャネルのサイズが減少する。サーバの特定の領域に集中した複数のデータ記憶デバイスが同時に動作している場合、データ記憶デバイスは熱エネルギーを生成し、この熱エネルギーがサーバ内に高温ゾーンを形成し得る。サーバ内の高温ゾーンは、データ記憶デバイスから外部環境への熱伝達の効率を低下させ、1つ以上の記憶デバイスのサーマルスロットリングを引き起こす可能性がある。
【0004】
したがって、本開示は、一実施形態では、機械学習モデルを記憶するように構成されるメモリと、シャーシ内に配置される複数のデータ記憶デバイスと、メモリに結合されるコントローラとを含むサーバを提供する。コントローラは、複数のデータ記憶デバイスに関連する熱データを受信し、熱データに基づいて、高温ゾーンの外側に位置される複数のデータ記憶デバイスの第2の部分に対して高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を特定するために機械学習モデルを適用し、高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分の特定に基づいて、複数のデータ記憶デバイスの熱管理を実行するように構成される。熱管理を実行するために、コントローラは、複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成するように更に構成される。
【0005】
また、本開示は、サーバにおいて熱管理を実行するための方法も提供する。方法は、複数のデータ記憶デバイスに関連する熱データを受信することと、熱データに基づいて、高温ゾーンの外側に位置される複数のデータ記憶デバイスの第2の部分に対して高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を特定することと、高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分の特定に基づいて、複数のデータ記憶デバイスの熱管理を実行することとを含む。熱管理を実行することは、複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成することを含む。
【0006】
また、本開示は、コントローラによって実行されるときにコントローラに一連の動作を実行させる命令を記憶する非一時的コンピュータ可読媒体も提供し、動作は、熱データに基づいて、高温ゾーンの外側に位置される複数のデータ記憶デバイスの第2の部分に対して高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を特定することと、高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分の特定に基づいて、複数のデータ記憶デバイスの熱管理を実行することとを含む。熱管理は、複数のデータ記憶デバイスを論理的にシャッフルして分散高温ゾーンを作成することを含む。
【0007】
本開示の様々な態様は、サーバ熱管理の改善を提供する。本開示は、ソフトウェア、ファームウェア、又はそれらの組み合わせによって制御されるハードウェア又は回路を含む様々な形態で具現化することができる。上述の概要は、本開示の様々な態様の一般的な概念を提供することのみを意図したものであり、いかなる方法でも本開示の範囲を限定するものではない。
【図面の簡単な説明】
【0008】
【
図1】本開示の様々な態様に係るサーバのブロック図を示す。
【
図2】本開示の様々な態様に係る、低温ゾーンに位置される複数のデータ記憶デバイスの第2の部分に対して高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を示す。
【
図3-1】本開示の様々な態様に係る、
図2の高温ゾーン及び低温ゾーンに関連するヒートマップを示す。
【
図3-2】本開示の様々な態様に係る、
図2の高温ゾーン及び低温ゾーンに関連するヒートマップを示す。
【
図4】本開示の様々な態様に係る、分散低温ゾーンに位置される複数のデータ記憶デバイスの第2の部分に対する分散高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を示す。
【
図5-1】本開示の様々な態様に係る、
図4の分散高温ゾーン及び分散低温ゾーンに関連するヒートマップを示す。
【
図5-2】本開示の様々な態様に係る、
図4の分散高温ゾーン及び分散低温ゾーンに関連するヒートマップを示す。
【
図6】本開示の様々な態様に係る、サーバにおいて熱管理を実行するための方法の第1の例を示す。
【
図7-1】本開示の様々な態様に係る、高温ゾーン及び低温ゾーンを有する複数のデータ記憶デバイスと関連付けられるヒートマップを示す。
【
図7-2】本開示の様々な態様に係る、高温ゾーン及び低温ゾーンを有する複数のデータ記憶デバイスと関連付けられるヒートマップを示す。
【
図8】本開示の様々な態様に係る、第1の期間中に低温ゾーンに位置される複数のデータ記憶デバイスの第2の部分に対する高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を示す。
【
図9】本開示の様々な態様に係る、第1の期間とは異なる第2の期間中に低温ゾーンに位置される複数のデータ記憶デバイスの第2の部分に対する高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を示す。
【
図10】本開示の様々な態様に係る、第1の期間中の分散高温ゾーン及び分散低温ゾーンを有する複数のデータ記憶デバイスを示す。
【
図11】本開示の様々な態様に係る、第1の期間とは異なる第2の期間中の分散高温ゾーン及び分散低温ゾーンを有する複数のデータ記憶デバイスを示す。
【
図12-1】本開示の様々な態様に係る、分散高温ゾーン及び分散低温ゾーンを有する複数のデータ記憶デバイスと関連付けられるヒートマップを示す。
【
図12-2】本開示の様々な態様に係る、分散高温ゾーン及び分散低温ゾーンを有する複数のデータ記憶デバイスと関連付けられるヒートマップを示す。
【
図13】本開示の様々な態様に係る、サーバにおいて熱管理を実行するための方法の第2の例を示す。
【
図14】本開示の様々な態様に係る、低温ゾーンに位置される複数のデータ記憶デバイスの第2の部分に対する高温ゾーンに位置される複数のデータ記憶デバイスの第1の部分を示す。
【
図15】本開示の様々な態様に係る、空気チャネルに隣接する分散高温ゾーンを有する複数のデータ記憶デバイスを示す。
【
図16】本開示の様々な態様に係る、サーバにおいて熱管理を実行するための方法の第3の例を示す。
【
図17】本開示の様々な態様に係る熱管理許可プロセスを示す。
【発明を実施するための形態】
【0009】
以下の説明では、本開示の1つ以上の態様の理解を与えるために、データ記憶デバイス構成などの多くの詳細が記載される。これらの具体的な詳細は単なる例示であり、本出願の範囲を限定することを意図するものではないことは、当業者には容易に明らかであろう。以下の説明は、本開示の様々な態様の一般的な概念を提供することのみを意図するものであり、いかなる方法でも本開示の範囲を限定するものではない。更に、本開示は、NANDフラッシュに言及するが、本明細書で考察する概念は、NOR、PCM(「相変化メモリ」)、ReRAMなどのような他のタイプの固体メモリに適用可能であることが、当業者には明らかであろう。
【0010】
図1は、幾つかの実施形態に係る、サーバシステム100のブロック図である。システム100はサーバシステムとして説明されるが、システム100が、IMSシステム、又は複数のデータ記憶デバイスを含む他のシステムタイプであってもよいことが理解される。
【0011】
サーバシステム100は、システムメモリ102と、1つ以上の電源104と、電子プロセッサ106と、ユーザインタフェース108と、複数のデータ記憶デバイス110と、サーバシステム100内の空気の流れを促進するための1つ以上の冷却ファン112と、通信インタフェース114とを含む。通信インタフェース114は、ネットワークインタフェースデバイスなどの1つ以上の通信デバイスを含むことができる。一例において、様々な情報は、通信インタフェース114を用いて、1つ以上のデータ記憶デバイス110に提供され、又は1つ以上のデータ記憶デバイス110から要求されてもよい。データ記憶デバイス110からのデータの取り出し及び/又はデータ記憶デバイス110へのデータの記憶の要求は、1つ以上のプロセッサ106によって処理されてもよい。一般に、サーバシステム100は、所与のアプリケーションに必要とされる一般的なサーバシステムとして機能する。
【0012】
複数のデータ記憶デバイス110は、サーバシステム100のシャーシ(例えば、
図2に示されるシャーシ200)内に配置される。一実施形態において、複数のデータ記憶デバイス110は、不揮発性NAND SSDなどのソリッドステートドライブ(「SSD」)である。しかしながら、他のSSDタイプも考えられる。更に、他の例において、複数のデータ記憶デバイス110は、ハードディスクドライブ(「HDD」)などの他のデータ記憶デバイスであってもよい。冷却ファン112は、空気を1つ以上のデータ記憶デバイス110に向けて方向付ける(例えば、押す)ように構成される。しかしながら、他の例において、冷却ファン112は、空気をデータ記憶デバイス110から遠ざける(例えば、引く)ように構成されてもよく、その結果、空気流がデータ記憶デバイス110を横切ってデータ記憶デバイス110から離れる方向に引っ張られる。
【0013】
メモリ102は、データ記憶デバイス110と関連付けられる熱データ116を記憶する。例えば、メモリ102は、複数のデータ記憶デバイス110のそれぞれから、データ記憶デバイスの内部温度に関する温度情報を周期的に受信してもよい。
【0014】
メモリ102は、熱データ116を分析し、熱分析に基づいてサーバシステム100内の是正措置を決定するための熱分析モジュール118を更に含む。場合によっては、熱データ116は、複数のデータ記憶デバイス110のそれぞれによって実行されるデータ操作の量を含み、電子プロセッサ106は、熱分析モジュール118と共に、複数のデータ記憶デバイス110のそれぞれによって実行されるデータ操作に基づいて複数のデータ記憶デバイス110の熱分析を実行する。電子プロセッサ106は、大量のデータ操作を実行するデータ記憶デバイスが、少量のデータ操作を実行するデータ記憶デバイスよりも高い内部温度を有すると決定することができる。
【0015】
電子プロセッサ106は、データ操作情報に基づいてエンドユーザの行動を特定する。次いで、電子プロセッサ106は、サーバ100における効率的な放熱を維持するために、エンドユーザの行動に基づいて制御応答を決定する。
【0016】
是正措置は、例えば、エンドユーザの行動にしたがって複数のデータ記憶デバイス110を論理的にシャッフルすることを含む。
図2は、低温ゾーン308に位置される複数のデータ記憶デバイスの第2の部分に対する高温ゾーン304に位置される複数のデータ記憶デバイス110の第1の部分を示す。
図3は、
図2の高温ゾーン304及び低温ゾーン308に関連するヒートマップ300aを示す。ヒートマップ300aは、熱分析モジュール118と共に電子プロセッサ106によって生成され、サーバ100内の各データ記憶デバイスのそれぞれの位置にしたがった複数のデータ記憶デバイス110のそれぞれの熱プロットを含む。例えば、「#1」のラベルが付されたデータ記憶デバイスは、「#2」のラベルが付されたデータ記憶デバイスに隣接している。同様に、「#2」のラベルが付されたデータ記憶デバイスも、「#3」のラベルが付されたデータ記憶デバイスに隣接している。
【0017】
図2及び
図3に示される例は44個のデータ記憶デバイスを含むが、サーバ100は別の適切な数のデータ記憶デバイスを含んでもよい。例えば、複数のデータ記憶デバイス110は、10個のデータ記憶デバイス、データ記憶デバイス、50個のデータ記憶デバイス、110個のデータ記憶デバイス、又は別の適切な数のデータ記憶デバイスを含むことができる。
【0018】
複数のデータ記憶デバイス110のそれぞれによって実行されるデータ操作の量は、各データ記憶デバイスのエンドユーザの行動に基づいて変化し得る。したがって、ヒートマップ300aは、複数のデータ記憶デバイス110のそれぞれについて経時的な熱データの比較を提供する。
【0019】
図示の例において、ヒートマップ300aは、午前8時から午後5時までのデータ操作情報を含むが、ヒートマップ300aは、任意の適切な期間の熱データを含むことができる。例えば、ヒートマップ300aは、24時間の期間にわたって収集された熱データを含むことができる。
図3に示される熱データは、テラバイト(TB)単位で測定されるデータ伝送量を含むが、これに代えて又はこれに加えて、複数のデータ記憶デバイス110からの温度測定情報を含んでもよい。
【0020】
図2及び
図3に示される例において、電子プロセッサ106は、データ記憶デバイス#1~#8が一般に第1の期間(例えば、8:00 AMから5:00 PMまでの時間)にわたってデータ記憶デバイス#9~#44よりもアクティブであると決定することができる。したがって、電子プロセッサ106は、データ記憶デバイス#1~#8が高温ゾーン304を画定し、データ記憶デバイス#9~#44が低温ゾーン308を画定すると決定することができる。場合によっては、電子プロセッサ106は、データ記憶デバイスが所定の期間にわたって平均データ操作閾値よりも多い平均的な量のデータ操作を実行したかどうかを決定することによって、データ記憶デバイスが高温ゾーン304内に含まれるかどうかを決定することができる。
【0021】
場合によっては、電子プロセッサ106は、熱分析モジュールに含まれる機械学習モデルに依存して高温ゾーンを特定する。電子プロセッサ106は、少なくとも2つの隣接するデータ記憶デバイスが熱閾値(例えば、平均温度閾値、平均データ操作閾値など)を超えると決定することによって、高温ゾーン304を特定することができる。場合によっては、電子プロセッサ106は、隣接するデータ記憶デバイスの別の所定の最小数が熱閾値を超えると決定することによって高温ゾーン304を特定する。場合によっては、電子プロセッサ106は、複数のデータ記憶デバイス110に含まれるデータ記憶デバイスの総数に対する少なくとも最小数の隣接するデータ記憶デバイスが熱閾値を超えると決定することによって、高温ゾーン304を特定する。
【0022】
高温ゾーン304は、ある期間にわたって発熱データ操作(例えば、大量のデータ読み出し及びデータ書き込み)を実行する隣接するデータ記憶デバイスのセットの結果として形成することができる。多くの高温データ記憶デバイスを含む高温ゾーンは、サーバにおいて非効率的な放熱を引き起こし、それにより、サーバの性能が低下する可能性がある。したがって、サーバ100内の高温ゾーン304の特定に応じて、電子プロセッサ106は、サーバ100内により均一な熱分布を作り出すための是正措置を実行する。是正措置は、例えば、発熱データ操作を実行するデータ記憶デバイスがサーバ100のシャーシ内に均等に分散されるように、複数のデータ記憶デバイス110を論理的にシャッフルすることを含む。電子プロセッサ106は、複数のデータ記憶デバイス110内のメモリ位置及びデータを交換することによって複数のデータ記憶デバイス110を論理的にシャッフルする。
【0023】
図4は、分散低温ゾーンに位置される複数のデータ記憶デバイス110の第2の部分に対する分散高温ゾーンに位置される複数のデータ記憶デバイス110の第1の部分を示す。
図5は、
図4の分散高温ゾーン及び分散低温ゾーンと関連付けられるヒートマップ300bを示す。
図4及び
図5に示される例において、電子プロセッサ106は、
図2及び
図3の例では高温ゾーン304を画定するドライブ位置に含まれるデータ記憶デバイス#1~#8を論理的にシャッフルし、それにより、これらのデータ記憶デバイスによって実行されるデータ操作は、ドライブ位置のデータ記憶デバイス#1、#8、#13、#19、#26、#32、#39、及び#44によってそれぞれ実行される。同様に、ドライブ位置のデータ記憶デバイス#1,#8,#13,#19,#26,#32,#39,#44によって既に実行されたデータ操作は、論理シャッフル後に、ドライブ位置のデータ記憶デバイス#1-#8によってそれぞれ実行される。電子プロセッサ106は、高温ゾーンを画定するデータ記憶デバイス位置が互いに最大許容距離までシャッフルされるように(例えば、それらのデータ記憶デバイス位置がサーバ100のシャーシ全体にわたって均等に分散されるように)論理シャッフルを実行することができる。
【0024】
図6は、サーバ100において熱管理を実行するための第1の例示的な方法600を示す。電子プロセッサ106は、サーバ100の他の構成要素(例えば、熱分析モジュール118)と共に方法600を実行する。
図6は特定の順序のステップを示すが、幾つかの実施形態では、方法600が異なる順序で実行されてもよい。更に、幾つかの実施形態において、方法600は、追加のステップ又はより少ないステップを含む。
【0025】
方法600は、電子プロセッサ106を用いて、複数のデータ記憶デバイス110のそれぞれに関連する熱データ(例えば、熱データ116)を受信することを含む(ブロック604において)。方法600は、複数のデータ記憶デバイス110のそれぞれから受信される熱データに基づいてヒートマップ(例えば、ヒートマップ300a及び300b)を生成及び/又は更新することを含む(ブロック608において)。
【0026】
ヒートマップを更新した後、電子プロセッサ106は、例えば熱分析モジュール118に含まれる機械学習モデルを使用して、ヒートマップの熱分析を実行する(ブロック610において)。ヒートマップの分析に基づいて、電子プロセッサ106は、(決定ブロック612において)複数のデータ記憶デバイス110に高温ゾーンが存在するかどうかを決定する。
【0027】
高温ゾーンが複数のデータ記憶デバイス110に存在すると電子プロセッサ106が決定する(決定ブロック612において「YES」)と、電子プロセッサ106は、複数のデータ記憶デバイス110を論理的にシャッフルして分散高温ゾーンを作成する(ブロック614において)。これに対し、高温ゾーンが複数のデータ記憶デバイスに存在しないと電子プロセッサ106が決定する(決定ブロック612で「NO」)と、電子プロセッサ106は、複数のデータ記憶デバイス110を論理的にシャッフルせず、新しいSSD熱データを受信して分析するのを待つ(ブロック604において)。
【0028】
図7~
図9は、電子プロセッサ106が是正措置を実行する前の複数のデータ記憶デバイス110の第2の例示的なユースケースを示す。例えば、
図7は、複数のデータ記憶デバイス110に対応するヒートマップ700aを示す。図示の例において、電子プロセッサ106は、ヒープマップ700aに基づいて、データ記憶デバイス#1-#8、#18-#20、#26-#31、及び#38-#42を含むデータ記憶デバイスの第1のセット708が一般に9:00 PM(UTC-5)から10:00 AM(UTC-5)の時間においてよりも10:00 AM(UTC-5)から9:00 PM(UTC-5)の時間においてアクティブであると決定することができる。これに対し、電子プロセッサ106は、データ記憶デバイス#10-#17、#21-#25、#32-#37、及び#43-#44を含むデータ記憶デバイスの第2のセット712が一般に10:00 AM(UTC-5)から9:00 PM(UTC-5)の時間においてよりも9:00 PM(UTC-5)から10:00 AM(UTC-5)の時間においてアクティブであると決定することができる。したがって、電子プロセッサ106は、データ記憶デバイスの第1のセット708が第1の時間帯に位置されるエンドユーザの作業時間中にデータ操作を実行すると決定すると共に、データ記憶デバイスの第2のセット712が第1の時間帯とは異なる第2の時間帯に位置されるユーザの作業時間中にデータ操作を実行すると決定することができる。
【0029】
ここで
図8を参照すると、電子プロセッサ106は、データ記憶デバイスの第1のセット708が10:00 AM(UTC-5)から9:00 PM(UTC-5)の時間中に高温ゾーンを画定し、データ記憶デバイスの第2のセット712が10:00 AM(UTC-5)から9:00 PM(UTC-5)の時間中に低温ゾーンを画定すると決定することができる。これに対し、
図9に示されるように、電子プロセッサ106は、データ記憶デバイスの第1のセットの708が9:00 PM(UTC-5)から10:00 AM(UTC-5 の時間中に低温ゾーンを画定し、データ記憶デバイスの第2のセット712が9:00 PM(UTC-5)から10:00 AM(UTC-5)の時間中に高温ゾーンを画定すると決定することができる。
【0030】
電子プロセッサ106は、決定されたパターンにしたがって複数のデータ記憶デバイス110を論理的にシャッフルすることができる。例えば、
図10~
図12は、電子プロセッサ106が是正措置を実行した後の複数のデータ記憶デバイス110の第2の例示的なユースケースを示す。
図10~
図11に示されて
図12の更新されたヒートマップ700bに反映されるように、電子プロセッサ106は、所定の期間(例えば、10:00 AM(UTC-5)から9:00 PM(UTC-5)までの時間)中に高温ゾーンを画定するデータ記憶デバイスのいずれも互いに直接隣接しないように、複数のデータ記憶デバイス110を論理的にシャッフルする。
【0031】
図13は、複数のデータ記憶デバイス110を論理的にシャッフルするための第2の例示的な方法1300を示す。電子プロセッサ106は、サーバ100の他の構成要素(例えば、熱分析モジュール118)と共に方法1300を実行する。
図13は特定の順序のステップを示すが、幾つかの実施形態では、方法1300が異なる順序で実行されてもよい。更に、幾つかの実施形態において、方法1300は、追加のステップ又はより少ないステップを含む。
【0032】
方法1300は、電子プロセッサ106を用いて、複数のデータ記憶デバイス110のそれぞれに関連する熱データ(例えば、熱データ116)を受信することを含む(ブロック1304において)。方法1300は、複数のデータ記憶デバイス110のそれぞれから受信される熱データに基づいてヒートマップ(例えば、ヒートマップ700a及び700b)を生成及び/又は更新することを含む(ブロック1306において)。
【0033】
ヒートマップを更新した後、電子プロセッサ106は、例えば熱分析モジュール118に含まれる機械学習モデルを使用して、ヒートマップの熱分析を実行する(ブロック1310において)。方法1300は、複数のデータ記憶デバイス110に関連する熱データ116に基づいて、複数のデータ記憶デバイス110の使用と関連付けられるパターンを特定することを含む(ブロック1312)。パターンは、特定の期間中に他よりも頻繁に使用されるデータ記憶デバイスの特定、特定の曜日(例えば、週末及び/又は平日)中により頻繁に使用されるデータ記憶デバイスの特定、及び/又は全ての期間中に他よりも頻繁に使用されるデータ記憶デバイスの特定を含むことができる。電子プロセッサ106は、複数のパターンを特定し、1日、週、月、年、又は他の期間を通して複数のデータ記憶デバイス110を複数回論理的にシャッフルすることができる。
【0034】
電子プロセッサ106がユーザパターンを特定した後、電子プロセッサ106は、ユーザパターンにしたがって複数のデータ記憶デバイス110を論理的にシャッフルする(ブロック1314において)。電子プロセッサ106は、データ記憶デバイスのセットによって実行される論理演算が互いに直接隣接するデータ記憶デバイスによって実行されないようにデータ記憶デバイスのセットが特定のユーザパターンと関連付けられるように、複数のデータ記憶デバイス110を論理的にシャッフルする。
【0035】
ここで
図14及び
図15を参照すると、場合によっては、複数のデータ記憶デバイス110は、1つ以上の空気チャネル1408を含むサーバ100のシャーシ1404内に配置される。空気チャネル1408は、複数のデータ記憶デバイス110、特に空気チャネル1408に隣接して配置されるデータ記憶デバイスにおける放熱を改善するように作用し得る。
図14に示されるように、電子プロセッサ106は、データ記憶デバイス#2-#4及び#17-#19を含む高温ゾーン1412を特定することができる。電子プロセッサ106は、空気チャネル1408がデータ記憶デバイス#6,#7間、データ記憶デバイス#10,#11間、及びデータ記憶デバイス#14,#15間に配置されると決定することができる(例えば、サーバ100の物理的構成に関連する記憶された情報に基づいて)。したがって、電子プロセッサ106は、高温ゾーン1412を画定するデータ記憶デバイスによって実行される論理演算が代わりに空気チャネル1408に隣接するデータ記憶デバイスによって実行されるように、複数のデータ記憶デバイス110を論理的にシャッフルすることができる。
【0036】
例えば、
図15は、空気チャネル1408に直接隣接する分散高温ゾーンを有する複数のデータ記憶デバイス110を示す。
図15に示されるように、電子プロセッサ106は、
図14の高温ゾーン1412を画定するドライブ位置に含まれるデータ記憶デバイス#2-#4及び#17-#19を論理的にシャッフルし、それにより、それらのデータ記憶デバイスによって実行されるデータ操作は、代わりに、ライブ位置のデータ記憶デバイス#6及び#7、#10及び#11、並びに#14及び#15によってそれぞれ実行される。同様に、データ記憶デバイス#6及び#7、#10及び#11、#14及び#15によって既に実行されたデータ操作は、論理シャッフル後に、ドライブ位置のデータ記憶デバイス#2-#4及び#17-#19によってそれぞれ実行される。
【0037】
図16は、複数のデータ記憶デバイス110を論理的にシャッフルするための第3の例示的な方法1600を示す。電子プロセッサ106は、サーバ100の他の構成要素(例えば、熱分析モジュール118)と共に方法1600を実行する。
図16は特定の順序のステップを示すが、幾つかの実施形態では、方法1600が異なる順序で実行されてもよい。更に、幾つかの実施形態において、方法1600は、追加のステップ又はより少ないステップを含む。
【0038】
方法1600は、電子プロセッサ106を用いて、複数のデータ記憶デバイス110のそれぞれに関連する熱データ(例えば、熱データ116)を受信することを含む(ブロック1604において)。方法1600は、複数のデータ記憶デバイス110のそれぞれから受信される熱データに基づいてヒートマップを生成及び/又は更新することを含む(ブロック1606において)。
【0039】
ヒートマップを更新した後、電子プロセッサ106は、例えば熱分析モジュール118に含まれる機械学習モデルを使用して、ヒートマップの熱分析を実行する(ブロック1608において)。ヒートマップの分析に基づいて、電子プロセッサ106は、複数のデータ記憶デバイス110のうちの他のものよりも頻繁に使用され、したがって高温ゾーンを画定する、1つ以上のデータ記憶デバイスを特定する(ブロック1610において)。
【0040】
電子プロセッサ106が高温ゾーンを特定した後、電子プロセッサ106は、高温ゾーンに含まれるデータ記憶デバイスによって実行されるデータ操作が空気チャネル(例えば、空気チャネル1408)に直接隣接して配置されるデータ記憶デバイスによって実行されるように、複数のデータ記憶デバイス110を論理的にシャッフルする(ブロック1612において)。
【0041】
図17は、サーバ100において実行される例示的な熱管理許可プロセス1700を示す。場合によっては、電子プロセッサ106は、複数のデータ記憶デバイス110内の高温ゾーンの特定に応じてサーバ100のユーザインタフェース108に通知(例えば、通知1704)を提供するように構成される(ブロック1708において)。
【0042】
通知1704は、サーバ100の熱管理のための是正措置を実行するためのサーバ100のオペレータ(例えば、オペレータ1714)による許可に関する、電子プロセッサ106によって生成される、要求を含むことができる。場合によっては、電子プロセッサ106は、複数のデータ記憶デバイス110の論理シャッフルが要求されるたびに通知1704をユーザインタフェース108に提供する。場合によっては、電子プロセッサ106は、複数のデータ記憶デバイス110の最初の論理シャッフルの前に一度だけ通知1704をユーザインタフェース108に提供する。場合によっては、通知1704は、例えば、提案されたドライブ位置の配置など、是正措置に関連する情報を含む。ユーザインタフェース108を用いてオペレータ1714から許可を受信することに応じて(ブロック1712において)、電子プロセッサ106は、複数のデータ記憶デバイス1716の論理シャッフルを実行する。
【0043】
上記の説明は例示を意図しており、限定を意図していないことを理解すべきである。提供する例以外の多くの実施形態及び用途は、上記の説明を読めば明らかになる。範囲は、上の説明を参照して決定されるべきではなく、その代わりに、添付の特許請求の範囲を参照して、係る特許請求の範囲が権利を与えられる等価物の全範囲と共に決定されるべきである。将来の開発が本明細書で考察される技術において生じ、開示されたシステム及び方法がそのような将来の実施形態に組み込まれることが予想及び意図されている。要約すると、用途は、修正及び変形が可能であることを理解されたい。
【0044】
特許請求の範囲で使用される全ての用語は、本明細書で反対の明示的な指示が行われない限り、本明細書に記載の技術に精通した者によって理解されるように、それらの最も広い合理的な構成及びそれらの通常の意味を与えられることが意図される。具体的には、「a」、「the」、「said」などのような単数形冠詞の使用は、請求項の反対の明示的な限定を列挙しない限り、示された要素のうちの1つ以上を列挙するために読み取られるべきである。
【0045】
要約書は、読者が技術的開示の性質を迅速に確認することができるように提供される。請求項の範囲又は意味を解釈又は限定するために使用されないことが理解されよう。加えて、上述の[発明を実施するための形態]において、様々な機能が、本開示を合理化する目的で様々な実施形態において一緒にグループ化されていることが分かり得る。本開示の方法は、請求される実施形態が各請求項に明示的に列挙されているよりも多くの機能を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映されるように、本発明の主題は、開示される単一の実施形態の全ての機能よりも少ないことにある。従って、以下の特許請求の範囲は、「発明を実施するための形態」に組み込まれ、各特許請求の範囲は、個別に請求される主題として独立している。
【外国語明細書】