(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024150338
(43)【公開日】2024-10-23
(54)【発明の名称】機械学習モデルの再学習方法、演算装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20241016BHJP
G06F 1/3209 20190101ALI20241016BHJP
G06F 1/3234 20190101ALI20241016BHJP
G06F 1/20 20060101ALI20241016BHJP
【FI】
G06N20/00
G06F1/3209
G06F1/3234
G06F1/20 D
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023063709
(22)【出願日】2023-04-10
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】河野 泰隆
【テーマコード(参考)】
5B011
【Fターム(参考)】
5B011DA01
5B011EA01
5B011EA02
5B011GG13
(57)【要約】
【課題】状況に応じて傾向の変化に追従しない再学習を可能とする。
【解決手段】機械学習モデルの再学習方法は、実際の物理量である実測値を取得する取得部、および物理量を推定する機械学習モデルを格納する記憶部を備える演算装置が実行する再学習方法であって、実測値の少なくとも一部である学習対象実測値を用いて機械学習モデルの再学習を行う学習処理と、実測値の傾向の変化を検知すると、傾向の変化に対する対策の要否を判断し、対策が不要と判断する場合には傾向が変化した期間における実測値も学習対象実測値に含めて学習処理を用いて再学習を行わせ、対策が必要であり対策が完了したと判断する場合には傾向が変化した期間における実測値を学習対象実測値に含めずに学習処理を用いて再学習を行わせる再学習判定処理と、を含む。
【選択図】
図3
【特許請求の範囲】
【請求項1】
実際の物理量である実測値を取得する取得部、および前記物理量を推定する機械学習モデルを格納する記憶部を備える演算装置が実行する機械学習モデルの再学習方法であって、
前記実測値の少なくとも一部である学習対象実測値を用いて前記機械学習モデルの再学習を行う学習処理と、
前記実測値の傾向の変化を検知すると、前記傾向の変化に対する対策の要否を判断し、前記対策が不要と判断する場合には前記傾向が変化した期間における前記実測値も前記学習対象実測値に含めて前記学習処理を用いて前記再学習を行わせ、前記対策が必要であり前記対策が完了したと判断する場合には前記傾向が変化した期間における前記実測値を前記学習対象実測値に含めずに前記学習処理を用いて前記再学習を行わせる再学習判定処理と、を含む、機械学習モデルの再学習方法。
【請求項2】
請求項1に記載の機械学習モデルの再学習方法において、
前記再学習判定処理では、予め定められた法則に基づき前記対策の要否を判断し、前記対策が必要と判断する場合には前記対策を実行する、機械学習モデルの再学習方法。
【請求項3】
請求項1に記載の機械学習モデルの再学習方法において、
前記再学習判定処理では、ユーザへの問い合わせ結果に基づき前記対策の要否を判断する、機械学習モデルの再学習方法。
【請求項4】
請求項1に記載の機械学習モデルの再学習方法において、
前記再学習判定処理は、前記対策が必要であり前記対策が完了していないと判断する場合には、前記学習処理による前記再学習を停止させる、機械学習モデルの再学習方法。
【請求項5】
請求項1に記載の機械学習モデルの再学習方法において、
前記物理量は計算機を冷却する冷却装置の消費電力であり、
前記記憶部には、前記計算機の消費電力を推定する第2機械学習モデルがさらに格納され、
前記取得部は、前記計算機の消費電力に関するデータである計算機実測値をさらに取得し、
前記再学習判定処理では、前記傾向が変化した際に、前記計算機実測値と前記第2機械学習モデルの推定値との差の増減傾向と、前記実測値と前記機械学習モデルの推定値との差の増減傾向が一致すると、前記対策の要否を判断することなく前記学習処理を用いて前記再学習を行わせる、機械学習モデルの再学習方法。
【請求項6】
請求項1に記載の機械学習モデルの再学習方法において、
前記実測値をグループ化し、グループごとに前記実測値の代表値であるベースライン値を決定するプロフィール作成処理と、
前記実測値の傾向の変化を検知すると、グループに属する前記実測値の数が最も多い最大グループと、傾向の変化後の前記実測値に最も近いベースライン値を持つ最近傍グループと、を特定し、前記最大グループのベースライン値と前記最近傍グループのベースライン値との差であるオフセット値を算出し、傾向の変化後の前記実測値と前記オフセット値との和を用いて前記学習処理に前記再学習を行わせる学習データ補正処理と、
前記最近傍グループのベースライン値と、前記最大グループのベースライン値との差である第2のオフセット値を算出し、前記第2のオフセット値と、前記機械学習モデルの推定値との和を用いて、前記推定値の補正を行う推論結果補正処理を、さらに含む機械学習モデルの再学習方法。
【請求項7】
請求項6に記載の機械学習モデルの再学習方法において、
前記実測値の傾向の変化を検知すると、前記傾向の変化が矩形的であるか否かを判断し、前記判断の結果に基づき、前記実測値から前記学習処理に前記再学習を行わせる学習データの範囲を決定する処理、をさらに含む機械学習モデルの再学習方法。
【請求項8】
対象装置の消費電力を推定する機械学習モデルを格納する記憶部と、
前記対象装置の実際の消費電力に関するデータである実測値を取得する取得部と、
前記実測値の少なくとも一部である学習対象実測値を用いて前記機械学習モデルの再学習を行う学習部と、
前記実測値の傾向の変化を検知すると、前記傾向の変化に対する対策の要否を判断し、前記対策が不要と判断する場合には前記傾向が変化した期間における前記実測値も前記学習対象実測値に含めて前記学習部を用いて前記再学習を行わせ、前記対策が必要であり前記対策が完了したと判断する場合には前記傾向が変化した期間における前記実測値を前記学習対象実測値に含めずに前記学習部を用いて前記再学習を行わせる再学習判定部と、を備える演算装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習(ML:Machine Learning)モデルの再学習方法、および演算装置に関する。
【背景技術】
【0002】
近年、地球環境保護のため温室効果ガスの削減に対する需要がますます高まっている。それに伴い、大規模な電力需要家の1つであるデータセンタの電力効率改善が求められている。データセンタの電力効率を表す指標としてPUE(Power Usage Effectiveness)が広く知られている。PUEはデータセンタ全体の消費電力に占めるIT機器の消費電力の割合を示す指標である。データセンタではIT機器の消費電力と空調など冷却設備の消費電力の割合が多く、PUEを向上するには冷却設備の電力効率を改善することが有効である。データセンタの冷却設備の消費電力にはIT機器の負荷や外気温の変動が影響を与えるが、その影響の程度はデータセンタ内のサーバルームごとに異なる。このような違いを踏まえて冷却設備の電力効率を改善するために機械学習を用いるアプローチがある。
【0003】
機械学習では推論する対象(目的変数)と、それに影響を与える要因(説明変数)との関係をデータから学習する。そのため機械学習モデルの振る舞いは学習に用いるデータによって決定される。消費電力のように時間変化を伴うデータ(時系列データ)を扱う機械学習モデルの場合、学習に用いたデータの特徴や傾向が時間経過に伴って変化することがある。このような変化は一般にコンセプトドリフトとして知られている。コンセプトドリフトの発生に対して機械学習モデルの推論精度を維持するためには継続した学習(再学習)が必要となる。特許文献1には、機械学習モデルのコンセプトドリフトが検出された際に、更新された学習データを用いてモデルを更新する構成が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許出願公開第2021/0390455号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
データセンタの各サーバルームにおけるIT機器の消費電力(IT消費電力)と冷却設備の消費電力(冷却消費電力)とを予測する機械学習モデルを考える。当該機械学習モデルにおいてコンセプトドリフトを発生させる原因には、サーバルーム内のIT機器の増減や変更、冷却設備の増減や変更、人手作業による冷却設備の設定変更などがある。人手作業による冷却設備の設定変更は必ずしも最適に行われるとは限らず、誤りを含んでいる可能性がある。また、冷却設備の機械的特性によっては、機械学習モデルの再学習では追随が困難なほど消費電力が急変化することがある。
【0006】
特許文献1に記載されている発明では、コンセプトドリフトの発生に対して上記を考慮した再学習要否を判断することなく機械学習モデルの再学習を行ってしまう。そのため、人手作業による冷却設備の誤った設定変更の結果として生じた消費電力の変動を学習することにより、その後の予測精度が劣化するおそれがある。また、機械学習モデルの再学習では追随が困難なほどの消費電力の急変化に対して再学習により追随しようとすることで、精度の低い予測結果が長期間に渡って出力され続けるおそれがある。
【0007】
本発明は、上記に鑑みてなされたものであり、機械学習モデルの再学習の要否を適切に判断することにより、状況に応じて傾向の変化に追従しない再学習を可能とすることを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の態様による再学習方法は、実際の物理量である実測値を取得する取得部、および前記物理量を推定する機械学習モデルを格納する記憶部を備える演算装置が実行する再学習方法であって、前記実測値の少なくとも一部である学習対象実測値を用いて前記機械学習モデルの再学習を行う学習処理と、前記実測値の傾向の変化を検知すると、前記傾向の変化に対する対策の要否を判断し、前記対策が不要と判断する場合には前記傾向が変化した期間における前記実測値も前記学習対象実測値に含めて前記学習処理を用いて前記再学習を行わせ、前記対策が必要であり前記対策が完了したと判断する場合には前記傾向が変化した期間における前記実測値を前記学習対象実測値に含めずに前記学習処理を用いて前記再学習を行わせる再学習判定処理と、を含む。
本発明の第2の態様による演算装置は、対象装置の消費電力を推定する機械学習モデルを格納する記憶部と、前記対象装置の実際の消費電力に関するデータである実測値を取得する取得部と、前記実測値の少なくとも一部である学習対象実測値を用いて前記機械学習モデルの再学習を行う学習部と、前記実測値の傾向の変化を検知すると、前記傾向の変化に対する対策の要否を判断し、前記対策が不要と判断する場合には前記傾向が変化した期間における前記実測値も前記学習対象実測値に含めて前記学習部を用いて前記再学習を行わせ、前記対策が必要であり前記対策が完了したと判断する場合には前記傾向が変化した期間における前記実測値を前記学習対象実測値に含めずに前記学習部を用いて前記再学習を行わせる再学習判定部と、を備える。
【発明の効果】
【0009】
本発明によれば、状況に応じて傾向の変化に追従しない再学習が可能となる。
【図面の簡単な説明】
【0010】
【
図2】演算システムの別形態である演算システムの全体構成図
【
図10】計算機モデル再学習判定処理を示すフローチャート
【
図11】冷却装置モデル再学習判定処理を示すフローチャート
【
図12】プロフィール生成処理を示すフローチャート
【
図13】学習データ・推論結果補正処理を示すフローチャート
【
図14】冷却装置モデル再学習判定プログラムの計算結果を示す画面出力図
【
図17】
図14~
図16とは異なる状況における、冷却装置モデル再学習判定プログラムの計算結果を示す画面出力図
【発明を実施するための形態】
【0011】
―第1の実施の形態―
以下、
図1~
図17を参照して、再学習方法および演算装置の第1の実施の形態を説明する。
【0012】
図1は、演算システム100の全体構成図である。演算システム100は、第1データセンタ1000Aと、第2データセンタ1000Bと、計算環境2000と、を含む。第1データセンタ1000Aと、第2データセンタ1000Bと、計算環境2000とは、広域ネットワーク9000により接続される。計算環境2000は、通信線8000により接続される管理計算機5000およびデータストア6000を含む。
【0013】
第1データセンタ1000Aは、通信線8000Aにより接続される計算機3000および冷却装置4000を含む。第2データセンタ1000Bは、通信線8000Bにより接続される計算機3000および冷却装置4000を含む。第1データセンタ1000Aおよび第2データセンタ1000Bに含まれる計算機3000および冷却装置4000は総称であり、本実施の形態では区別をしない。演算システム100に含まれるデータセンタの数は2に限定されず、1でもよいし3以上でもよい。計算機3000は、何らかの演算を行う装置であり演算内容は限定されない。計算機3000には、コンピュータ、データストレージ装置、およびネットワークスイッチなどを含む。
【0014】
冷却装置4000は電力を消費して、計算機3000が発する熱を冷却する装置である。具体的な構成は限定されないが、冷媒を用いる空調機でもよいし冷却水を用いるチラーでもよい。計算機3000は、単位時間当たりの演算量の増加により消費電力および発熱量が増加するので、室温を一定に保つためには冷却装置4000の消費電力も増加する傾向にある。すなわち、計算機3000の消費電力と冷却装置4000の消費電力は正の相関を有すると言える。
【0015】
管理計算機5000は、計算機3000および冷却装置4000を管理する。管理計算機5000は、計算機3000や冷却装置4000の消費電力に関するデータを収集し、データストア6000に格納する。計算機3000、管理計算機5000、およびデータストア6000はベアメタル、すなわち物理的な装置でもよいし仮想マシンでもよい。
【0016】
図2は、演算システム100の別形態である演算システム100Aの全体構成図である。
図2に示す演算システム100Aは、演算システム100と同様に計算機3000、冷却装置4000、管理計算機5000、およびデータストア6000を含むが、広域ネットワーク9000を介さずに接続される点が異なる。以下に説明する構成は、演算システム100および演算システム100Aのいずれにも適用できる。
【0017】
図3は、管理計算機5000の構成図である。管理計算機5000は、中央演算装置であるプロセッサ5100と、揮発性の記憶装置であるメモリ5200と、不揮発性の記憶装置である記憶装置5300と、通信インタフェース5400と、IOデバイス5500と、を含む。通信インタフェース5400は、たとえばネットワークインタフェースカードである。IOデバイス5500は、たとえばマウス、キーボード、および液晶ディスプレイである。IOデバイス5500は、管理計算機5000を使用する人間(以下、「ユーザ」と呼ぶ)への情報の提供、およびユーザからの入力の受付を行う。
【0018】
記憶装置5300には、学習データ5310と、機械学習モデル集5320と、推論結果データ5330と、が格納される。学習データ5310は、機械学習モデルが学習に用いるデータである。詳しくは後述する。
【0019】
機械学習モデル集5320は、複数の機械学習モデルの集合である。機械学習モデル集5320に含まれるそれぞれの機械学習モデルは、モデル管理テーブル5260に記載される。それぞれの機械学習モデルはあらかじめ学習が行われているが、本実施の形態においても再学習が行われる。ただし常に再学習が行われるわけではなく、再学習の要否判断に基づき再学習が行われる。なお再学習とは、機械学習モデルを構成するパラメータの更新である。
【0020】
なお本実施の形態では機械学習モデル以外のモデルについて言及しないので、機械学習モデルを単に「モデル」とも呼ぶ。機械学習モデル集5320に含まれるモデルは、計算機3000の消費電力を推定する計算機モデルと、冷却装置4000の消費電力を推定する冷却装置モデルの2種類に大別される。なお以下では、冷却装置モデルを単に「機械学習モデル」と呼び、計算機モデルを「第2機械学習モデル」と呼ぶこともある。各モデルへ入力されるデータは特に限定されない。推論結果データ5330は、機械学習モデル集5320を用いて推論を行った結果であり、具体的には計算機3000および冷却装置4000の時刻ごとの消費電力である。
【0021】
メモリ5200には、データ収集プログラム5210、学習プログラム5220、冷却装置制御プログラム5230、推論プログラム5225、モデル管理テーブル5260、プロフィールテーブル5270、計算機モデル再学習判定プログラム5251、冷却装置モデル再学習判定プログラム5252、プロフィール生成プログラム5290、および補正プログラム5280が格納される。
【0022】
データ収集プログラム5210は、計算機3000および冷却装置4000からデータを取得して、データストア6000が有する冷却装置管理テーブル6310および計算機管理テーブル6320に格納する。本実施の形態ではデータ収集プログラム5210は定期的に実行される。データ収集プログラム5210が収集するデータには、少なくとも冷却装置4000の消費電力量データと、計算機3000の消費電力量データとを含む。ただしデータ収集プログラム5210は他のデータをさらに収集してもよい。
【0023】
学習プログラム5220は、学習データ5310を用いて機械学習モデルを生成または更新する。学習に用いるアルゴリズムは公知のもの、たとえばRandom Forestなどを用いることができる。学習プログラム5220は、ユーザにより実行される場合もあるし、計算機モデル再学習判定プログラム5251または冷却装置モデル再学習判定プログラム5252によって実行される場合もある。
【0024】
推論プログラム5225は、機械学習モデル集5320を用いて単位時間ごとの計算機3000および冷却装置4000の消費電力を推定し、推論結果データ5330として記憶装置5300に格納する。推論プログラム5225の実行間隔が単位時間ごとであり、直後の単位時間における消費電力のみを推定してもよいし、複数の単位時間分の消費電力をまとめて推定してもよい。ただし機械学習モデル集5320が更新された場合には推論プログラム5225は更新後の冷却装置モデルを用いて改めて消費電力を推定する。本実施の形態では、単位時間を1時間とする。
【0025】
冷却装置制御プログラム5230は冷却装置4000の稼働を計画および制御する。たとえば冷却装置制御プログラム5230は、空調の温度や湿度の設定、ファンの回転数、水冷ポンプの流量などを制御する。冷却装置制御プログラム5230が採用する制御アルゴリズムは公知のものであり、動作フローは図示しない。
【0026】
計算機モデル再学習判定プログラム5251は、機械学習モデル集5320に含まれる計算機モデルのそれぞれについて再学習の要否を判定する。冷却装置モデル再学習判定プログラム5252は、機械学習モデル集5320に含まれる冷却装置モデルの再学習の要否を判定する。プロフィール生成プログラム5290は、後述するプロフィールを生成する。補正プログラム5280は、モデルが推定した消費電力の補正、およびモデルの学習において多くのデータが利用できるようにデータの補正を行う。計算機モデル再学習判定プログラム5251、冷却装置モデル再学習判定プログラム5252、プロフィール生成プログラム5290、および補正プログラム5280の動作は後に詳述する。
【0027】
図4は、データストア6000の構成図である。データストア6000は、中央演算装置であるプロセッサ6100と、揮発性の記憶装置でありデータ入出力プログラム6210を格納するメモリ6200と、不揮発性の記憶装置である記憶装置6300と、通信インタフェース6400と、を含む。通信インタフェース6400は、たとえばネットワークインタフェースカードである。
【0028】
データ入出力プログラム6210は、ネットワークを介して冷却装置管理テーブル631および計算機管理テーブル6320へのデータの入出力を行うためのプログラムである。データの入出力を行うための方法は公知のものであり、たとえばRESTやGraphQLなどのAPIを使う方法や、NFSやiSCSIやFTPなどのデータ送受信プロトコルを使う方法などがある。データ入出力プログラム6210の動作の詳細説明は省略する。
【0029】
図5は、モデル管理テーブル5260の一例を示す図である。モデル管理テーブル5260は複数のレコードから構成され各レコードは、モデルID5261、モデルバージョン5262、推論対象ID5265、再学習一時停止フラグ5266、および予測結果補正フラグ5267のフィールドを有する。
【0030】
モデルID5261は、モデルを識別するための識別子である。この例ではモデルID5261は、「M-」と、「Cooling」および「Server」のいずれかと、数字との組み合わせである。詳しくは後述するが、「M-」に続く「Cooling」および「Server」はモデルの種類を表している。モデルバージョン5262は、モデルのバージョンを表す。再学習が完了するとモデルバージョン5262の値が「1」だけ増加する。本実施例では、再学習は各モデルの最も新しいバージョンを対象に行われる。ただし各モデルの最も新しいバージョン以外を対象として再学習を行ってもよい。また本実施例では、消費電力の推定は各モデルの最も新しいバージョンを用いて行われる。ただし各モデルの最も新しいバージョン以外を用いて、または2つ以上の異なるバージョンのモデルを併用して推定を行ってもよい。
【0031】
推論対象ID5265は、モデルの推論対象を示す識別子である。推論対象ID5265に「Cooling」を含むものはいずれかの冷却装置4000である。推論対象ID5265に「Server」を含むものはいずれかの計算機3000である。なお、複数の冷却装置4000または複数の計算機3000をグルーピングしたものを推論対象としてもよい。たとえば複数の冷却装置4000をグルーピングしたものを仮想的に1台の冷却装置として、その識別子を推論対象ID5262に格納してもよい。このような方法は、たとえば冷却装置ごとの消費電力を計測できず、サーバルーム内の複数の冷却装置の消費電力の合計のみ計測できる場合などに有効である。再学習一時停止フラグ5266は、再学習を一時停止するか否かを示すフラグである。再学習一時停止フラグ5266は、「1」が一時停止を意味し、「0」が再学習の継続を意味する。本実施例において、再学習一時停止フラグ5266の初期値は「0」であるとする。推論結果補正フラグ5267は、モデルが出力した推論結果(消費電力の予測値)を補正するか否かを示すフラグである。推論結果補正フラグ5267は、「1」が補正要を意味し、「0」が補正不要を意味する。推論結果の補正方法の説明は
図13を用いて後述する。
【0032】
図6は、プロフィールテーブル5270の一例を示す図である。本実施例においてプロフィールとは、冷却装置の消費電力を似た特性のものでまとめたグループのことである。本実施例では特に、冷却装置の機械的特性によって消費電力が矩形的に変化しうることを鑑みて、矩形的な変化をする消費電力データを管理する目的でプロフィールテーブル5270を用いる。プロフィールテーブル5270は複数のレコードから構成され各レコードは、装置ID5271、プロフィールID5272、およびベースライン5275のフィールドを有する。装置ID5271は、冷却装置管理テーブル6310における冷却装置ID6311または計算機管理テーブル6320における計算機ID6321と同様に冷却装置または計算機を識別する識別子である。
【0033】
プロフィールID5272は、プロフィールの識別子であり、0以上の整数を用いている。ただしプロフィールが存在しない装置はプロフィールID5272が「-1」と記載される。本実施例では、消費電力が矩形的に変化しない冷却装置が、プロフィールが存在しない装置に該当する。なおプロフィールID5272が「0」のプロフィールを「基準プロフィール」とも呼ぶ。ベースライン5275は、各プロフィールに含まれる消費電力データの平均値である。ただしプロフィールが存在しない装置のレコードはベースライン5275に「-1」と記載される。
【0034】
図7は、冷却装置管理テーブル6310の一例を示す図である。冷却装置管理テーブル6310は複数のレコードから構成され各レコードは、冷却装置ID6311、プロフィールID6312、消費電力量6313、および無効フラグ6314のフィールドを有する。冷却装置ID6311は、冷却装置4000を識別する識別子であり、
図5における推論対象ID5265にも同じ値が用いられる。なお
図5の説明で述べたように、複数の冷却装置4000をグルーピングしたものを仮想的に1台の冷却装置として、その識別子を冷却装置ID6311および推論対象ID5262に格納してもよい。
【0035】
プロフィールID6312はプロフィールの識別子であり、プロフィールテーブル5270におけるプロフィールID5272と同一である。消費電力量6313は、日時と消費電力の組み合わせである。
図7に示す例では時刻は1時間刻みであるが、1分や1秒の単位でもよい。無効フラグ6314は、該当行の消費電力量6313を再学習に用いないことを示すフラグである。無効フラグ6314は、「1」がそのレコードの値を再学習に用いないことを意味し、「0」がそのレコードの値を再学習に用いることを意味する。
【0036】
図8は、計算機管理テーブル6320の一例を示す図である。計算機管理テーブル6320は複数のレコードから構成され各レコードは、計算機ID6321、プロフィールID6322、消費電力量6323、および無効フラグ6324のフィールドを有する。計算機ID6321は計算機3000を識別する識別子であり、
図5における推論対象ID5265にも同じ値が用いられる。複数の計算機3000をグルーピングしたものを仮想的に1台の計算機として、その識別子を計算機ID6321および推論対象ID5262に格納してもよい。プロフィールID6322、消費電力量6323、および無効フラグ6324は、
図7に示したプロフィールID6312、消費電力量6313、および無効フラグ6314と同一の意味なので説明を省略する。
【0037】
図9は、データ収集プログラム5210が実行するデータ収集処理を示すフローチャートである。データ収集プログラム5210は、まずステップS310においていずれかの管理対象からメトリクスデータを取得する。データ収集プログラム5210は、ステップS311において取得したメトリクスデータを冷却装置管理テーブル6310または計算機管理テーブル6320に格納する。具体的にはデータ収集プログラム5210は、ステップS310において冷却装置4000のメトリクスデータを取得した場合には冷却装置管理テーブル6310に格納し、ステップS310において計算機3000のメトリクスデータを取得した場合には計算機管理テーブル6320に格納する。
【0038】
続くステップS312ではデータ収集プログラム5210は、データ未取得の管理対象が存在するか否かを判断する。データ収集プログラム5210は、データ未取得の管理対象が存在すると判断する場合にはステップS310に戻り、データ未取得の管理対象が存在しないと判断する場合には
図9に示す処理を終了する。
【0039】
図10は、計算機モデル再学習判定プログラム5251が実行する計算機モデル再学習判定処理を示すフローチャートである。計算機モデル再学習判定プログラム5251は、モデル管理テーブル5260における「M-Server」で始まる各モデルを対象に
図10に示す処理を実行する。まずステップS320において計算機モデル再学習判定プログラム5251は、計算機3000の消費電力の予測値を推論結果データ5330から取得する。
【0040】
続くステップS321では計算機モデル再学習判定プログラム5251は、予測値に対応する時刻の実測値を計算機管理テーブル6320から取得する。続くステップS322では計算機モデル再学習判定プログラム5251は、公知の手法によりコンセプトドリフトの有無を判定する。たとえば計算機モデル再学習判定プログラム5251は予測値と実測値との差である予測誤差を算出し、予測誤差が所定の閾値以上の場合にコンセプトドリフトが発生したと判定してもよい。また実測値だけを用いて、機械学習モデルの学習に用いたデータと、最近のデータの統計量をそれぞれ算出し、両者の間に有意な差があればコンセプトドリフトが発生したと判定してもよい。
【0041】
続くステップS323では計算機モデル再学習判定プログラム5251は、ステップS322の判定結果がコンセプトドリフト有りであったか否かを判断し、コンセプトドリフト有りであったと判断する場合はステップS324に進み、コンセプトドリフト無しであったと判断する場合には
図10に示す処理を終了する。ステップS324では計算機モデル再学習判定プログラム5251は、再学習用のデータを決定し、学習プログラム5220を用いてモデルを再学習させる。具体的には計算機モデル再学習判定プログラム5251は、現在時刻から所定の範囲内であり、かつ無効フラグ6314が「0」であるデータを用いてモデルの再学習をさせる。
【0042】
図11は、冷却装置モデル再学習判定プログラム5252が実行する冷却装置モデル再学習判定処理を示すフローチャートである。本実施例では、冷却装置モデル再学習判定プログラム5252は冷却装置モデル再学習判定処理を定期的に実行する。冷却装置モデル再学習判定プログラム5252は、モデル管理テーブル5260における「M-Cooling」で始まる各モデルを対象に
図11に示す処理を実行する。以下では対象の機械学習モデルを「対象冷却モデル」と呼び、対象冷却モデルが推論の対象としている冷却装置4000を「対象冷却装置」と呼ぶ。
【0043】
ステップS330では冷却装置モデル再学習判定プログラム5252は、モデル管理テーブル5260における再学習一時停止フラグ5266を参照し、対象冷却モデルの再学習一時停止フラグ5266が「1」であるか否かを判断する。冷却装置モデル再学習判定プログラム5252は、再学習一時停止フラグ5266が「1」であると判断する場合はステップS3310に進み、再学習一時停止フラグ5266が「1」ではない、すなわち「0」であると判断する場合はステップS331に進む。
【0044】
ステップS331では冷却装置モデル再学習判定プログラム5252は、対象冷却モデルの推論対象ID5265に対応する冷却装置4000、すなわち対象冷却装置の消費電力の予測値を推論結果データ5330から取得する。続くステップS332では冷却装置モデル再学習判定プログラム5252は、ステップS331において取得した予測値に対応する時刻の実測値を冷却装置管理テーブル6310から取得する。続くステップS333では冷却装置モデル再学習判定プログラム5252は、コンセプトドリフトの有無を判断する。続くステップS334では冷却装置モデル再学習判定プログラム5252は、ステップS333の判断結果がコンセプトドリフト有りであったと判断する場合はステップS335に進み、コンセプトドリフト無しであったと判断する場合は
図11に示す処理を終了する。
【0045】
ステップS335では冷却装置モデル再学習判定プログラム5252は、対象冷却装置の予実差と、計算機3000の予実差の傾向が一致するか否かを判断する。たとえば対象冷却装置と計算機3000のそれぞれについて、予測値から実測値を引いた値を、おおよそゼロ、プラス、マイナスのいずれかに分類する。ただし「おおよそゼロ」の範囲はあらかじめ定めた範囲である。そして、対象冷却装置の予実差の分類と、計算機3000の予実差の分類が一致すればステップS335は肯定判断される。なお、一定の期間において上記の分類を行い、分類結果の最頻値同士が一致するか否かで判断してもよい。冷却装置モデル再学習判定プログラム5252は、ステップS335を肯定判断する場合にはステップS339に進み、ステップS335を否定判断する場合にはステップS336に進む。
【0046】
ステップS336では冷却装置モデル再学習判定プログラム5252は、モデル管理テーブル5260における対象冷却モデルの再学習一時停止フラグ5266に「1」を設定する。続くステップS337では冷却装置モデル再学習判定プログラム5252は、ユーザまたは冷却装置制御プログラム5230に予測に反する消費電力の変動の発生を通知してステップS3310に進む。本実施例では、ユーザはデータセンタの運用管理者である。
【0047】
ステップS338では冷却装置モデル再学習判定プログラム5252は、冷却装置モデル再学習判定プログラム5252における対象冷却モデルの再学習一時停止フラグ5266に「0」を設定してステップS3312に進む。ステップS3312では冷却装置モデル再学習判定プログラム5252は、プロフィール生成プログラム5290のプロフィール生成処理を呼び出してステップS339に進む。プロフィール生成処理の説明は
図12を用いて後述する。
【0048】
ステップS339では冷却装置モデル再学習判定プログラム5252は、冷却装置管理テーブル6310の無効フラグ6314が「0」のレコードから再学習用データを決定し、学習プログラム5220にモデルを再学習させる。たとえば冷却装置モデル再学習判定プログラム5252は、無効フラグ6314が「0」であり、かつ現在時刻から30日以内のデータを用いて再学習させる。続くステップS3313では冷却装置モデル再学習判定プログラム5252は、再学習により生成された冷却装置モデルの情報をモデル管理テーブル5260に登録する。このとき、推論結果補正フラグ5267には、ステップS3312で呼び出したプロフィール生成処理のステップS342の判断結果に応じた値を格納する。具体的には、プロフィール生成プログラム5290がプロフィール生成処理のステップS342にて「矩形的である」と判断した場合は推論結果補正フラグ5267に「1」を格納し、「矩形的でない」と判断した場合は「0」を格納する。
【0049】
ステップS3310では冷却装置モデル再学習判定プログラム5252は、発生した予測に反する消費電力の変動に対する対策が行われたか否かを判断する。具体的には、たとえば冷却装置の消費電力の実測値が予測値を超過した状況で、冷却装置の設定温度を上げる操作が行われ、その後の実測値が予測値に近い値に変化すれば、対策が行われたと判断する。本実施の形態では、IOデバイス5500を用いてユーザに問い合わせを行い、その回答に基づき本ステップの処理を決定する。なお、ステップS336にてコンセプトドリフトの発生を冷却装置制御プログラム5230に通知した場合は、冷却装置制御プログラム5230によって行われた制御の内容を冷却装置モデル再学習判定プログラム5252が受信し、その内容に基づき本ステップの処理を決定する。冷却装置モデル再学習判定プログラム5252は、対策の実行が完了したと判断する場合はステップS3311に進み、対策が不要と判断する場合はステップS338に進む。一定時間の間にユーザまたは冷却装置制御プログラム5230から対策の実施に関する回答が得られなかった場合は、ステップS3310の判断は「未定」となり、
図11に示す処理を終了する。この場合、冷却装置モデル再学習判定処理の次回実行時には、ステップS330で対象冷却モデルの再学習一時停止フラグ5266が「1」であると判断され、再びステップS3310が実行される。
【0050】
ステップS3311では冷却装置モデル再学習判定プログラム5252は、冷却装置管理テーブル6310における対象冷却装置のデータのうち、コンセプトドリフト発生期間中のデータの無効フラグ6314に「1」を設定してステップS338に進む。
【0051】
図12は、プロフィール生成プログラム5290によるプロフィール生成処理を示すフローチャートである。プロフィール生成プログラム5290は、まずステップS340において冷却装置管理テーブル6310から対象冷却装置の消費電力の実測値を取得する。続くステップS341ではプロフィール生成プログラム5290は、実測値の変動が矩形的であるか否かを判定する。たとえばプロフィール生成プログラム5290は、実測値の変化量(時間軸上での1つ前のデータ点との差)を算出し、当該変化量のデータ分布の尖度が予め定められた閾値を超過した場合に実測値の変動が矩形的であると判断する。あるいはプロフィール生成プログラム5290は、1時間ごとの実測値の変化幅を評価し、変化幅が小さい時間帯同士の間に変化幅が大きい時間帯が存在すると実測値の変動が矩形的であると判断してもよい。
【0052】
続くステップS342ではプロフィール生成プログラム5290は、ステップS341において矩形的であると判断する場合にはステップS343に進み、矩形的ではないと判断した場合にはステップS349に進む。ステップS343ではプロフィール生成プログラム5290は、再学習の対象とするデータ期間を最古から最新のデータとする。続くステップS344ではプロフィール生成プログラム5290は、冷却装置4000の消費電力の実測値を値の大きさによりグループ化する。このグループは「プロフィール」とも呼ばれる。消費電力の実測値をグループ化する方法には、たとえばk-means法などの公知のクラスタリング手法を用いる方法がある。
【0053】
続くステップS345ではプロフィール生成プログラム5290は、各グループに属するデータからそれぞれのベースラインを算出する。本実施例では、各グループに属するデータの平均値をベースラインとする。続くステップS346ではプロフィール生成プログラム5290は、データ数が最大のグループ(以下、「デフォルトグループ」と呼ぶ)のデータを再学習用のデータに選定する。続くステップS347ではプロフィール生成プログラム5290は、グループに属するデータと、ベースラインとの組み合わせに対してプロフィールIDを付与して、プロフィールテーブル5270を作成または更新する。続くステップS348ではプロフィール生成プログラム5290は、ステップS342で矩形的であると判断したデータについて、冷却装置管理テーブル6310のプロフィールID6312に、該当データが属するグループのプロフィールIDを設定し
図12に示す処理を終了する。
【0054】
ステップS349ではプロフィール生成プログラム5290は、再学習の対象とするデータ期間を現在時刻から所定の範囲内(たとえば30日以内など)とする。続くステップS350ではプロフィール生成プログラム5290は、ステップS342で矩形的でないと判断したデータについて、冷却装置管理テーブル6310のプロフィールID6312に「-1」を格納し
図12に示す処理を終了する。
【0055】
図13は、補正プログラム5280による学習データ・推論結果補正処理を示すフローチャートである。本実施例では、推論プログラム5225が機械学習モデルを用いた推論処理(消費電力の予測処理)を行った後に、推論プログラム5225によって本処理が呼び出される。補正プログラム5280は、まずステップS360において、冷却装置4000の消費電力の予測値を推論結果データ5330から取得する。続くステップS369では補正プログラム5280は、ステップS360において取得した予測値に対応する時刻の実測値を冷却装置管理テーブル6310から取得する。
【0056】
続くステップS361では補正プログラム5280は、コンセプトドリフトの有無を判定する。続くステップS362では補正プログラム5280は、ステップS361の判定結果がコンセプトドリフト有りで、かつ推論結果の補正が必要か否かを判断し、コンセプトドリフト有りでかつ推論結果の補正が必要と判断する場合はステップS363に進み、コンセプトドリフト無しまたは推論結果の補正が不要と判断する場合には
図13に示す処理を終了する。
【0057】
ステップS363では補正プログラム5280は、ステップS369で取得した冷却装置4000の消費電力の実測値に最も近いベースラインを持つグループ(以下では「最近傍グループ」と呼ぶ)を特定する。以下では、最近傍グループのベースラインの値を「b1」と呼ぶ。続くステップS364では補正プログラム5280は、最近傍グループがデータ数最大のグループであるか否かを判断する。補正プログラム5280は、最近傍グループがデータ数最大のグループであると判断する場合はステップS366に進み、最近傍グループがデータ数最大のグループではないと判断する場合はステップS365に進む。
【0058】
ステップS365では補正プログラム5280は、最大グループのベースラインの値である「b2」と、前述のb1の差である(b2-b1)を実測値に加算した値を再学習用のデータ候補に追加しステップS367に進む。ステップS366では補正プログラム5280は、実測値を再学習用のデータ候補に追加してステップS367に進む。ステップS367では補正プログラム5280は、前述のb1と最大グループのベースライン(b2)の差(b1-b2)をステップS360で取得した予測値に加算して
図13に示す処理を終了する。
【0059】
図14は、冷却装置モデル再学習判定プログラム5252の計算結果を示す画面出力図である。この画面出力では、再学習要否の判定結果、および判定の根拠が示される。出力画面5250Aの上部には、符号5250A1において、モデルの概要である管理対象、MLモデル、およびMLモデル再学習状態が記載されている。具体的には、対象とする機械学習モデルの識別子であるモデルID5261と、当該モデルのバージョン5262が「MLモデル」の欄に記載され、そのモデルが推論対象とする機器である推論対象ID5265が「管理対象」の欄に記載され、再学習一時停止フラグ5266に対応する状態が「MLモデル再学習状態」の欄に記載される。
【0060】
符号5250A2で示す時系列図では、
図11のS331で得られる推定値を点線で示し、S332で得られる実測値を実線で示している。途中までは両者が近い値であるため破線の表示を省略している。この時系列図では、ステップS334においてコンセプトドリフトがあると判断された場合を示している。
【0061】
符号5250A3および5250A4は、ステップS337における通知の内容を示している。具体的には、符号5250A3は冷却装置4000の運用管理の観点での通知であり、符号5250A4は機械学習モデルの運用管理の観点での通知である。なおここでは符号5250A2~5250A4に示すデータが画面に表示されたが、符号5250A2~5250A4に示すデータをログとして出力してもよい。
【0062】
図14の下部に示す、符号5250A5、5250A6、および5250A7のボタンはステップS3310における条件分岐に対応している。具体的には、符号5250A5で示す「対策完了」は「YES」に対応し、符号5250A6で示す「対策不要」は「NO」に対応し、符号5250A7で示す「後で対策」は「未完」に対応する。なお、
図11の説明で述べたように、ステップS336にてコンセプトドリフトの発生を冷却装置制御プログラム5230に通知した場合は、冷却装置制御プログラム5230によって行われた制御の内容を冷却装置モデル再学習判定プログラム5252が受信し、その内容に基づき本ステップの処理を決定する。この場合、符号5250A5、5250A6、および5250A7のボタンは表示しなくてもよい。
【0063】
図15は、
図14からの第1の遷移例を示す図である。具体的には
図15は、
図14に示す状態においてユーザが「Cooling-01」の設定を変更し、符号5250A5で示す「対策完了」のボタンを押した後の画面表示を示している。ユーザが「Cooling-01」の設定を変更したので実線で示す実測値が低下し、予測値に近い値となっている。ユーザが「対策完了」のボタンを押したので、
図11のステップS3310では「YES」に進み、ステップS3311、ステップS338、ステップS3312、ステップS339、およびステップS3313が実行される。ステップS3311の処理により、符号5250B4で示す欄に記載されているように、コンセプトドリフトの発生期間中のデータが学習から除かれる。また、ステップS338の処理により再学習一時停止フラグ5266が「0」に設定され、再学習が開始される。
【0064】
図16は、
図14からの第2の遷移例を示す図である。具体的には
図16は、
図14に示す状態においてユーザが対処不要と判断して冷却装置4000の設定を変更せず、符号5250A6で示す「対策不要」のボタンを押した後の画面表示を示している。この場合には、ユーザが「対策不要」のボタンを押したので、
図11のステップS3310では「不要」に進み、ステップS338、ステップS3312、ステップS339、およびステップS3313が実行される。ステップS338の処理により再学習一時停止フラグ5266が「0」に設定され、再学習が開始される。
【0065】
図17は、
図14~
図16とは異なる状況における、補正プログラム5280の計算結果を示す画面出力図である。符号5250D2で示す時系列図では、
図12のステップS340において取得した実測値、ステップS347において付与したプロフィールIDを示している。
図17では省略しているが、ステップS345において算出したベースラインを表示してもよい。また
図17に示す状況では、
図13のステップS362においてコンセプトドリフトあり、かつ推論結果補正要と判断されたものとする。また、プロフィールIDが「0」のグループが最もデータ数の多い最大グループであるとする。
【0066】
図17に示す状況では、実測値のプロフィールIDが「0」から「1」に変化し、ステップS363においてプロフィールIDが「1」のグループを実測値に最も近いベースラインを有するグループ(最近傍グループ)として特定する。さらに、ステップS367において、プロフィールIDが「1」の最近傍グループのベースライン(b1)と、プロフィールIDが「0」の最大グループのベースライン(b2)との差(b1-b2)を予測値に対して加えることで予測値を補正している。
【0067】
上述した第1の実施の形態によれば、次の作用効果が得られる。
(1)実際の物理量である実測値を取得する取得部とも呼べるデータ収集プログラム5210、および物理量を推定する機械学習モデルである冷却装置モデルを格納する記憶装置5300を備える管理計算機5000は以下の再学習方法を実行する。この再学習方法は、学習プログラム5220が実行する実測値の少なくとも一部である学習対象実測値を用いて機械学習モデルの再学習を行う学習処理と、
図11を参照して説明したように冷却装置モデル再学習判定プログラム5252が実行する冷却装置モデル再学習判定処理が含まれる。冷却装置モデル再学習判定は、実測値の傾向の変化であるコンセプトドリフトを検知すると(
図11のS334:YES)、傾向の変化に対する対策の要否を判断し(S3310)、対策が不要と判断する場合には傾向が変化した期間における実測値も学習対象実測値に含めて学習処理を用いて再学習を行わせ(S338、S3312、S339、S3313)、対策が必要であり対策が完了したと判断する場合には傾向が変化した期間における実測値を学習対象実測値に含めずに学習処理を用いて再学習を行わせる(S3311、S338、S3312、S339、S3313)。そのため、状況に応じて傾向の変化に追従しない再学習が可能となる。具体的には、
図11のS3311においてコンセプトドリフト発生期間中のデータの無効フラグに「1」を設定するので、当該期間のデータが学習に用いられない。そのためたとえば、コンセプトドリフトがデータセンタ運用者の操作ミスなどで発生した場合に、操作ミスの影響で変化した実測値を学習の対象としないので、次回以降の操作ミスによる実測値の変化を検出できる。
【0068】
(2)再学習判定処理では、ユーザへの問い合わせ結果に基づき対策の要否を判断する。そのため、対策の要否を確実に判断できる。
【0069】
(3)再学習判定処理は、対策が必要であり対策が完了していないと判断する場合には、学習処理による再学習を停止させる(S336)。そのため、対策が完了するまでモデルの更新を停止できる。
【0070】
(4)記憶装置5300には、計算機3000の消費電力を推定する計算機モデルがさらに格納される。データ収集プログラム5210は、計算機3000の消費電力に関するデータである計算機実測値をさらに取得する。再学習判定処理では、傾向が変化した際に、計算機実測値と第2機械学習モデルの推定値との差の増減傾向と、実測値と機械学習モデルの推定値との差の増減傾向が一致すると(
図11のS335:YES)、対策の要否を判断することなく学習処理を用いて再学習を行わせる(S339)。冷却装置モデルが出力する推定値が実測値と異なる場合であっても、計算機モデルの推定値と計算機3000の消費電力の差の傾向が同一であれば、計算機3000の急激な演算の増加または減少が冷却装置4000の消費電力の変化を生じさせたと推測できる。このような場合は問題がないと判断できるため、対策が不要な場合(S3310:不要、の場合)と同様に扱うことができる。
【0071】
(5)冷却装置4000の管理計算機5000が実行する再学習方法は、プロフィール生成プログラム5290が実行する、消費電力の実測値をグループ化し、グループごとに実測値の代表値であるベースライン値を決定するプロフィール作成処理(
図12)と、補正プログラム5280が実行する、実測値の最近傍グループのベースラインと最大グループのベースライン値との差との和を用いて推論結果を補正する推論結果補正処理(
図13のS367)と、を含む。そのため、機械学習モデルの再学習では追従困難なほどの消費電力の急変化(矩形的な変化)に対して、再学習により追随しようとすることを回避でき、精度の高い推論結果を出力することができる。また、冷却装置4000の管理計算機5000が実行する再学習方法は、プロフィール生成プログラム5290が実行する、実測値の変化が矩形的であると判断した場合に再学習データ期間を最古から最新のデータとする処理(
図12のS343)と、補正プログラム5280が実行する、最大グループのベースライン値と、実測値の最近傍グループのベースラインとの差との和を用いて学習処理に用いるデータを補正する学習データ補正処理(
図13のS365)と、を含む。そのため再学習に多くのデータを用いることができる。
【0072】
(6)冷却装置4000の管理計算機5000が実行する再学習方法は、プロフィール生成プログラム5290が実行するプロフィール作成処理(
図12)と、補正プログラム5280が実行する推論結果補正処理(
図13のS367)と、補正プログラム5280が実行する、学習データ補正処理(
図13のS365)と、を継続的に実行する(
図11のS3312)。そのため、実測値が矩形的に変化する状況から実測値が矩形的に変化しない状況への変化、またはその逆の変化が発生した場合でも、推論結果や学習データの補正が必要か否かを適切に判断することができる。
【0073】
(変形例1)
上述した実施の形態では、
図11のステップS3310においてユーザに対策の要否を問い合わせた。しかし管理計算機5000が対策の要否を判断し、対策が必要と判断する場合には冷却装置制御プログラム5230を用いて対策を実行してもよい。この場合は、冷却装置制御プログラム5230による対策が完了すると
図11のステップS3310において「YES」に進み、処理が継続する。
【0074】
管理計算機5000による対策の要否判断は公知の様々な手法を用いることができる。たとえば、あらかじめ収集した過去の実測値と予測値の差の時系列と、対策要否との関係を示すデータベースを参照してもよい。たとえば冷却装置の消費電力の実測値が予測値を一定以上超過し、かつ計算機の消費電力の実測値が予測値と同程度か、または実測値が予測値を一定以上下回る場合には、冷却設備の設定温度を上げるという対策が必要であるという関係を当該データベースに保持して利用してもよい。また、計算機3000および冷却装置4000の消費電力以外のデータを取得して所定の数式に基づき対策の要否を判断してもよい。たとえば外気温データを取得して、冷却装置の消費電力の実測値が予測値を一定以上超過し、かつ外気温が前年同期の値と同程度か、または前年同期の値を一定以上下回る場合には、冷却設備の設定温度を上げるという対策が必要であると判断してもよい。あるいは、たとえばサーバルーム内の複数箇所の室温データを取得して、冷却装置の消費電力の実測値が予測値を一定以上超過し、かつサーバルーム内の一部の箇所の室温データが、サーバルーム内の平均の室温データと、標準偏差と、から算出した標準範囲を下回っている場合には、当該一部の箇所に近い冷却装置の設定温度を上げるという対策が必要であると判断してもよい。
【0075】
この変形例1によれば、次の作用効果が得られる。
(6)再学習判定処理では、予め定められた法則に基づき対策の要否を判断し、対策が必要と判断する場合には対策を実行する。そのため、ユーザへの問い合わせなしに再学習の要否を判定できる。
【0076】
(変形例2)
管理計算機5000は、プロフィール生成プログラム5290および補正プログラム5280を備えなくてもよい。
【0077】
(変形例3)
管理計算機5000の記憶装置5300には、計算機モデルが格納されなくてもよい。この場合には計算機モデル再学習判定プログラム5251が不要であり、冷却装置モデル再学習判定プログラム5252は、
図11のステップS334において肯定判断するとステップS336に進むことになる。
【0078】
上述した各実施の形態および変形例において、機能ブロックの構成は一例に過ぎない。別々の機能ブロックとして示したいくつかの機能構成を一体に構成してもよいし、1つの機能ブロック図で表した構成を2以上の機能に分割してもよい。また各機能ブロックが有する機能の一部を他の機能ブロックが備える構成としてもよい。
【0079】
上述した各実施の形態および変形例において、管理計算機5000が不図示の入出力インタフェースを備え、必要なときに入出力インタフェースと管理計算機5000が利用可能な媒体を介して、他の装置からプログラムが読み込まれてもよい。ここで媒体とは、たとえば入出力インタフェースに着脱可能な記憶媒体、または通信媒体、すなわち有線、無線、光などのネットワーク、または当該ネットワークを伝搬する搬送波やディジタル信号、を指す。また、プログラムにより実現される機能の一部または全部がハードウエア回路やFPGAにより実現されてもよい。
【0080】
上述した各実施の形態および変形例は、それぞれ組み合わせてもよい。上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
【符号の説明】
【0081】
3000 :計算機
4000 :冷却装置
5000 :管理計算機
5210 :データ収集プログラム
5220 :学習プログラム
5225 :推論プログラム
5250 :再学習要否判定プログラム
5251 :計算機モデル再学習判定プログラム
5252 :冷却装置モデル再学習判定プログラム
5260 :モデル管理テーブル
5280 :学習データ・推論結果補正プログラム
5290 :プロフィール生成プログラム
5300 :記憶装置
5310 :学習データ
5320 :機械学習モデル集
5330 :推論結果データ
5500 :IOデバイス