IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

<>
  • 特許-監視装置、監視方法、及びプログラム 図1
  • 特許-監視装置、監視方法、及びプログラム 図2
  • 特許-監視装置、監視方法、及びプログラム 図3
  • 特許-監視装置、監視方法、及びプログラム 図4
  • 特許-監視装置、監視方法、及びプログラム 図5
  • 特許-監視装置、監視方法、及びプログラム 図6
  • 特許-監視装置、監視方法、及びプログラム 図7
  • 特許-監視装置、監視方法、及びプログラム 図8
  • 特許-監視装置、監視方法、及びプログラム 図9
  • 特許-監視装置、監視方法、及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】監視装置、監視方法、及びプログラム
(51)【国際特許分類】
   G06F 11/30 20060101AFI20241217BHJP
   G06F 11/07 20060101ALI20241217BHJP
【FI】
G06F11/30 189
G06F11/07 160
【請求項の数】 7
(21)【出願番号】P 2020199275
(22)【出願日】2020-12-01
(65)【公開番号】P2022087371
(43)【公開日】2022-06-13
【審査請求日】2023-11-15
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100109313
【弁理士】
【氏名又は名称】机 昌彦
(74)【代理人】
【識別番号】100149618
【弁理士】
【氏名又は名称】北嶋 啓至
(72)【発明者】
【氏名】深沢 理仁
【審査官】松平 英
(56)【参考文献】
【文献】特開平03-070069(JP,A)
【文献】特開2016-192016(JP,A)
【文献】特開2014-053027(JP,A)
【文献】OKITA, Hideki et al,DYNAMICALLY PRIORITIZED VIERTUAL-NETWORK MONITORING ACCORDING TO LIFECYCLE OF VIRTUAL MACHINES IN LARGE SCALE DATA CENTER,Proceedings of the 19th International Conference on WWW/Internet(ICWI 2020),米国,IEEE,2020年11月18日,pp. 123-131
【文献】沖田 英樹 他,仮想マシンの累計稼働時間に基づく仮想ネットワーク動的優先監視方式の検討,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2020年11月19日,Vol.120 No.259,pp.61-66,[ISSN]2432-6380
(58)【調査した分野】(Int.Cl.,DB名)
G06F11/07
11/28-11/36
(57)【特許請求の範囲】
【請求項1】
サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得する取得手段と、
前記個体故障率の増加に対応する監視間隔の減少傾向を示す関係モデルに基づき、前記サーバに対する監視間隔を前記サーバごとに決定する決定手段と、
を備える監視装置。
【請求項2】
前記取得手段は、前記サーバごとのハードウェア監視情報、稼働時間、及び、サーバラック内の前記サーバの動作環境温度に基づく前記個体故障率を取得する、
請求項1に記載の監視装置。
【請求項3】
前記サーバごとのハードウェア監視情報、稼働時間、及び、前記サーバの動作環境温度に基づいて、前記個体故障率を算出する算出手段をさらに備える、
請求項1または2に記載の監視装置。
【請求項4】
前記決定手段は、
前記個体故障率が所定の基準故障率より高い場合、前記サーバの監視間隔を第1の監視間隔に決定し、
前記個体故障率が前記基準故障率より低い場合、前記サーバの監視間隔を第1の監視間隔より長い第2の監視間隔に決定する、
請求項1乃至3のいずれか1項に記載の監視装置。
【請求項5】
前記決定手段は、さらに、前記監視間隔で監視する前記サーバの上限数に基づいて、前記監視間隔を決定する
請求項1乃至4のいずれか1項に記載の監視装置。
【請求項6】
監視装置が、
サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、
前記個体故障率の増加に対応する監視間隔の減少傾向を示す関係モデルに基づき、前記サーバに対する監視間隔を前記サーバごとに決定する、
監視方法。
【請求項7】
サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、
前記個体故障率の増加に対応する監視間隔の減少傾向を示す関係モデルに基づき、前記サーバに対する監視間隔を前記サーバごとに決定する、
処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、サーバの監視に関する。
【背景技術】
【0002】
インターネットで介した様々なサービスは、コンピュータにプログラムを導入したサーバを稼働させることで実現されている。しかしコンピュータは、常に安定して稼働しているわけではなく、思わぬ障害の発生によりサーバがダウンしたり動作が重くなることがある。サーバを常時監視して障害発生時に迅速な対応を取ることは安定したサービスを提供する上で重要となっている。
【0003】
電子機器の障害の発生を検知するために、ネットワークを通じた電子機器の監視が行われている。特許文献1には、パーソナルコンピュータやサーバなどの保守管理対象装置、または、監視装置が、保守管理対象装置における障害の発生を通知することが開示されている。特許文献2には、プリンタなどの管理対象機器を使用状況に応じて所定の監視間隔で監視することが開示されている。
【0004】
なお、本開示に関連する技術として、特許文献3には、機器の累積的な運転状況の情報と、各機器に固有のパラメータを考慮して機器の異常の有無を判断する運用・保守支援システムが開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2016-081374号公報
【文献】特開2014-053027号公報
【文献】特開2010-271905号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
電子機器は温度や湿度などの動作環境によって故障率が変化する。しかし、特許文献2において、機器の動作環境を考慮して電子機器の監視の制御を行っていない。
【0007】
本開示は、サーバの動作環境を考慮して監視を制御する監視装置等を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示に係る監視装置は、サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得する取得手段と、前記個体故障率に基づき、前記サーバに対する監視間隔を決定する決定手段と、を備える。
【0009】
本開示に係る監視方法は、サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、前記個体故障率に基づき、前記サーバに対する監視間隔を決定する。
【0010】
本開示に係るプログラムは、サーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、前記個体故障率に基づき、前記サーバに対する監視間隔を決定する処理をコンピュータに実行させる。
【発明の効果】
【0011】
本開示によれば、サーバの動作環境を考慮して監視を制御できる。
【図面の簡単な説明】
【0012】
図1】第1実施形態に係る保守管理システムの構成を示す概略図である。
図2】サーバ300のハードウェア概略図である。
図3】保守管理システムの動作例を示すシーケンス図である。
図4】関係モデルの例を示すグラフである。
図5】関係モデルの他の例を示すグラフである。
図6】第2実施形態に係る監視装置100の構成を示すブロック図である。
図7】算出装置120の配置例を示す概略図である。
図8】個体故障率と決定される監視間隔の関係の他の例を示すグラフである。
図9】第2実施形態に係る監視装置100の動作例を示すフローチャートである。
図10】コンピュータ500のハードウェア構成の例を示すブロック図である。
【発明を実施するための形態】
【0013】
本開示において、大規模システムを構成する複数の電子機器を保守管理のために監視する監視装置について説明する。被監視対象の電子機器の例として、サーバを監視する監視装置を例に、以下実施形態において図面を参照しながら説明する。ただし被監視対象には、サーバ以外の電子機器が含まれてもよい。
【0014】
[第1実施形態]
(構成)
図1は、第1実施形態に係る保守管理システムの構成を示す概略図である。保守管理システムは、監視装置100と被監視対象となる1以上のサーバラック200(200_1、・・・、200_y)を備える。各サーバラック200は、1以上のサーバ300(300_1、300_2、・・・、300_x)と温度センサ400を備える。監視装置100は、ネットワーク010によって各サーバ300及び温度センサ400と、通信可能に接続される。サーバラック200ごとのサーバ300の台数は任意に変更されうる。
【0015】
監視装置100は、サーバ300における障害の発生の有無を監視する。第1実施形態において、監視装置100は、取得部101、算出部102、及び決定部103を備える。
【0016】
取得部101は、サーバ300ごとのハードウェア監視情報、稼働情報、及び、動作環境に関する情報を取得する。ハードウェア監視情報は、サーバ300内部の各部品の異常傾向を判定するためのハードウェア監視データを示す。稼働情報は、例えば初期配置からの稼働時間、または使用年数など、サーバ300の稼働状況を示す。動作環境に関する情報は、例えばサーバラック200内の温度、または湿度、あるいはサーバ300の温度を示す情報である。さらに、取得部101は、算出部102が算出した、各サーバ300のハードウェア、稼働情報、及び、動作環境に基づく個体故障率を取得する。
【0017】
算出部102は、取得部101が取得したハードウェア監視情報、稼働情報、及び、動作環境に関する情報に基づいて、サーバ300ごとに個体故障率Pを算出する。個体故障率Pの算出については後述する。
【0018】
決定部103は、各サーバ300の個体故障率と監視間隔の関係モデルに基づいて、各サーバ300に対する監視間隔を決定する。監視間隔とは、監視装置100がサーバ300に対する障害の監視処理を実行した後、再度監視処理を実行するまでの時間間隔である。監視装置100は、監視処理として、例えば、サーバ300に対して入出力要求を送信し、入出力要求に対する応答時間が正常な範囲内であるか確認してもよい。あるいは、監視装置100は、監視処理として、サーバ300の各部品の監視データが正常な範囲内であるか確認してもよい。
【0019】
個体故障率と監視間隔の関係モデルは、個体故障率の増加に対応する監視間隔の減少傾向を示してもよい。関係モデルは、個体故障率と監視間隔の関係式によって表されてもよく、テーブルにより表されてもよい。関係モデルは、目的変数をネットワーク負荷とし、説明変数として例えば、故障率、監視間隔、サーバ台数、及びネットワーク帯域を用いた、機械学習によって得られてもよい。
【0020】
第1実施形態において、温度センサ400は、サーバラック200内の温度を測定する。温度センサ400は、測定温度をサーバラック200内のサーバ300_1、・・・、300_xの動作環境に関する情報として、監視装置100に送信する。
【0021】
動作環境に関する情報として、各サーバ300の温度を用いる場合、1台のサーバ300ごとに1つの温度センサ400が設置されてもよい。温度センサ400は各サーバの測定温度を監視装置100に送信する。
【0022】
サーバラック200内には、取得部101が取得する動作環境に関する情報の種類に応じて、他のセンサが設置されうる。動作環境に関する情報として湿度を用いる場合、以下の説明において温度センサ400に関する説明は湿度センサに置き換えることができる。
【0023】
図2は、サーバ300のハードウェア概略図である。CPU(Central Processing Unit)301、メモリ302、HDD(hard disk drive)303、イーサポート304、及び、BMC(Baseboard Management Controller)309を備える。BMC309は、サーバ300のハードウェア(サーバ300内部に構成する各部品、要素)からの監視データを取得し、ハードウェア監視情報として監視装置100に送信する。
【0024】
(動作)
図3は、保守管理システムの動作例を示すシーケンス図である。図3において、簡略化のためにサーバ300は1台だけ示されているが、各サーバ300は同様に動作する。
【0025】
<<ハードウェアに起因する故障率の算出>>
監視装置100の取得部101は、ネットワーク010とBMC309を介して、サーバ300からハードウェア監視情報を取得する。算出部102は、取得部101が取得した監視情報に基づいてハードウェアに起因する故障率Pを算出する(ステップS101)。
【0026】
ハードウェアに起因する故障率Pとは、個々の装置の故障の起こり得る確率である。故障率Pは、例えば0から1(あるいは0%から100%)の間で算出される。
【0027】
ハードウェア監視情報は、CPU301、メモリ302、HDD303、イーサポート304、電源など、複数の監視対象部品に対応するそれぞれの監視データを含む。CPU301に関する監視データは、例えば、CPUの使用率及び温度である。メモリ302に関する監視データとして、例えば、ECC(Error checking and correcting)におけるエラーの回数が用いられる。HDD303に関する監視データとして、例えばSMART(Self-Monitoring, Analysis and Reporting Technology)による検査値が用いられる。電源に関する監視データは、例えば電源の冗長化状態を示す。
【0028】
算出部102は、例えば、ハードウェアの故障対象部品ごとに取得された監視データの値に基づいて異常傾向の有無を判定する。算出部102は、監視データが所定の閾値を超えたとき、部品に異常傾向があると判定する。あるいは、算出部102は、部品の監視データの値に基づいて算出した部品の故障率が所定の閾値以上である場合に、該部品に異常傾向があると判定してもよい。監視情報が100個の部品に関する情報を含む場合、算出部102は、例えば、異常傾向のある部品の数だけ故障率Pを+0.01(あるいは+1%)増加させる。なお、監視情報に含まれる部品の重要度や計測されたデータの値に基づいて、増加させる故障率Pは部品ごとに調整されてもよい。
【0029】
<<動作環境に起因する故障率の算出>>
監視装置100の取得部101は、サーバ300の動作環境に関する情報として、サーバラック200に設置された温度センサ400の測定温度を取得する。算出部102は、取得部101が取得した温度に基づいて動作環境に起因する故障率Pを算出する(ステップS102)。
【0030】
動作環境に起因する故障率Pとは、サーバ300が設置される環境と安定稼働条件との差異に基づいて算出される故障の確率である。故障率Pは例えば0から1(0%から100%)の間で算出される。
【0031】
算出部102は、例えば、温度が稼働想定温度の中央値であれば0(あるいは0%)、温度上限値以上であれば1(あるいは100%)、温度下限値以下であれば1(あるいは100%)と算出する。算出部102は、動作環境温度の変化率、温度の継続時間、または、所定の上限値若しくは下限値を超えた回数を考慮し、故障率Pを算出してもよい。
【0032】
なお、取得部101は、外部装置からサーバ300が配置されたサーバルームの温度分布を取得してもよい。取得部101は、サーバルームの温度分布とサーバ300の配置に基づいて、各サーバ300の動作環境温度を取得してもよい。
【0033】
<<稼働時間に起因する故障率の算出>>
サーバ300は初期配置からの合計稼働時間(合計通電時間)を記録、蓄積する。取得部101は、サーバ300からサーバ300の稼働時間を稼働情報として取得する。算出部102は、稼働時間に基づいて故障率Pを算出する(ステップS103)。
【0034】
稼働時間に起因する故障率Pとは、合計稼働時間に起因するサーバ300の寿命特性を示す装置のバスタブ曲線に基づいて算出される故障の確率である。故障率Pは、未使用状態で0(0%)、稼働時間上限値を1(100%)とする。
【0035】
<<個体故障率Pの算出と取得>>
算出部102は、それぞれのサーバ300に対して算出されたハードウェアに起因する故障率P、動作環境に起因する故障率P、及び、稼働時間に起因する故障率Pを総合的に考慮して、個体故障率Pを算出する(ステップS104)。取得部101は、算出部102が算出した個体故障率Pを取得する(ステップS105)。
【0036】
ステップS101~103の順番は変更可能である。
【0037】
個体故障率Pの算出例1:算出部102は、3つの故障率P,P,Pに優先順位や重みづけをつけてもよい。個体故障率Pは例えば以下の式で表される。
P=W×P+W×P+W×P (重み付け定数W,W,W>0)
個体故障率Pの算出例2:算出部102は、故障率P及びPが所定値まで増加したとき、故障率Pの重みWを小さく設定してもよい。つまり、ハードウェアに起因する故障率Pと稼働時間に起因する故障率Pが高いサーバは、動作環境に起因する故障率Pが低くても、個体故障率Pを高く算出してもよい。これによりサーバは短い監視間隔で監視される。
【0038】
<<監視間隔の決定>>
決定部103は、サーバ300の個体故障率と監視間隔の関係モデルに基づいて、サーバ300に対する監視間隔を決定する(ステップS106)。図4は、関係モデルの例を示すグラフである。図4において、個体故障率Pと監視間隔Iの関係モデルは直線により表されているが、曲線であってもよい。また図4において、個体故障率の増加に伴い、監視間隔Iは連続した値が設定されているが、監視間隔Iは非連続(離散的)であってもよい。監視間隔Iは個体故障率Pの範囲によって、異なる関係式により表されてもよい。
【0039】
個体故障率Pが100に近いほど、監視間隔Iは一般的な監視装置の通常の監視間隔よりも短く定められてもよい。また、個体故障率Pが0に近いほど、監視間隔Iは一般的な監視装置の通常の監視間隔よりも長く定められてもよい。
【0040】
監視装置100は、サーバ300ごとに決定された監視間隔によりサーバ300を監視する。
【0041】
(効果)
第1実施形態によれば、サーバ300の動作環境を考慮して監視を制御できる。その理由は、監視装置100の取得部101がサーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、決定部103が個体故障率に基づきサーバ300に対する監視間隔を決定するためである。
【0042】
システムの保守管理において、1つの監視装置により多くの電子機器を監視することが行われている。システムの規模が大きくなればなるほど被監視対象の電子機器が増える。また、監視項目が一つ増えるたびに電子機器の台数分のアクセスが増えるためネットワーク負荷、及び、監視装置の負荷が増加する。そのため、大きなシステムでは監視間隔を一律に長くすることにより、ネットワーク負荷、監視装置の負荷を下げることが行われる。
【0043】
しかし、監視間隔が長いと、障害発生から監視装置が障害を検出するまでの時間が長くなる。即時に障害を検出できなければ、システム全体の稼働率を下げ、さらには、サービス品質の低下につながる。
【0044】
第1実施形態によれば、決定部103が、所定の故障率の基準より個体故障率Pが低いサーバ300の監視間隔を所定の監視間隔の基準より長く決定することで、多くのサーバを監視する際のネットワーク010の負荷を低減し、監視負荷を低減できる。
【0045】
さらに、第1実施形態によれば、決定部103が、所定の故障率の基準より個体故障率Pが高いサーバ300の監視間隔を所定の監視間隔の基準よりも短くすることで、実際の障害発生から監視装置100が障害を検知するまでの時間を短くし、障害の検知の遅延を防ぐことができる。
【0046】
(変形例)
図5は、関係モデルの他の例を示すグラフである。図5において、関係モデルは個体故障率Pが基準故障率Pより小さいか、基準故障率P以上であるかによって、異なる関係式により表されている。
【0047】
P≦Pのとき、I=I
0<P<Pのとき、I=I
図5の例において、例えば、監視間隔Iは2~3分、監視間隔Iは1時間と定められてもよい。決定部103は、例えば、所定期間における各サーバラック200の各サーバ300_1、300_2、・・・、300_xの個体故障率の平均値、あるいは中央値を基準故障率Pとしてもよい。また、決定部103は、基準故障率Pは上述の機械学習を用いて設定されてよい。
【0048】
[第2実施形態]
第1実施形態において、監視装置100が個体故障率Pを算出する算出部を備える場合について説明した。第2実施形態において、他の装置が第1実施形態に係る算出部102の機能を有し、監視装置100が、算出装置によって算出された個体故障率Pを取得する場合について説明する。第1実施形態と同様の説明は、第2実施形態の説明において省略する。
【0049】
(構成)
図6は、第2実施形態に係る監視装置100の構成を示すブロック図である。第2実施形態に係る監視装置100は、取得部121と決定部122を備える。第2実施形態に係る監視装置100は、図1における監視装置100と置き換えることができる。
【0050】
図7は、算出装置120の配置例を示す、第2実施形態に係る保守管理システムの概略図である。図7に示すように、1台の確率算出装置120が、監視装置100、各サーバラック200の各サーバ300及び温度センサ400と通信可能に接続されてもよい。算出装置120は、各サーバ300からハードウェア監視情報と、稼働情報を取得し、温度センサ400から動作環境に関する情報を取得する。
【0051】
監視装置100の取得部121は、外部の算出装置120から、各サーバ300のハードウェア、稼働情報、及び、動作環境に基づく個体故障率を取得する。
【0052】
決定部122は、各サーバ300の個体故障率に基づいて、サーバに対する監視間隔を決定する。
【0053】
決定部122は、個体故障率が所定の基準故障率より高い場合、サーバ300の監視間隔を第1の監視間隔に決定し、個体故障率が該基準故障率より低い場合、サーバ300の監視間隔を第1の監視間隔より長い第2の監視間隔に決定してもよい。個体故障率が基準故障率と等しい場合、決定部122は、監視間隔を第1の監視間隔以上であり第2の監視間隔以下の任意の時間に決定する。
【0054】
個体故障率と決定部122により決定される監視間隔の関係は、図4、または、図5のグラフにより示されてもよい。図8は、個体故障率と決定される監視間隔の関係の他の例を示すグラフである。図8において、基準故障率P~Pに対応して、監視間隔I~Iが決定される。基準故障率P~Pはそれぞれ、所定の基準故障率の一実施形態である。監視間隔I~Iはそれぞれ第1または第2の監視間隔の一実施形態である。
【0055】
監視装置100は、決定した監視間隔によりサーバ300を監視する。あるいは、監視装置100は、図示しない他の監視処理実行装置に決定した監視間隔を送信し、監視処理実行装置にサーバ300を監視させる。
【0056】
図7において、1台の算出装置120が配置されているが、算出装置120は1台のサーバラック200ごとに1台配置されてもよい。このとき、算出装置120はサーバラック200内の各サーバ300の個体故障率を算出する。あるいは、算出装置120の機能は、各サーバ300が備えてもよい。このとき、各サーバ300は温度センサ400から動作環境に関する情報を取得し、自装置の個体故障率を算出する。監視装置100は複数の算出装置120のそれぞれから各サーバ300の個体故障率を取得する。
【0057】
(動作)
図9は、第2実施形態に係る監視装置100の動作例を示すフローチャートである。取得部121は、サーバ300ごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得する(ステップS121)。決定部122は、各サーバ300の個体故障率に基づいて、サーバ300に対する監視間隔を決定する(ステップS122)。
【0058】
(効果)
第2実施形態によれば、サーバ300の動作環境を考慮して監視を制御できる。その理由は、監視装置100の取得部121がサーバごとのハードウェア、稼働時間、及び、動作環境に起因する個体故障率を取得し、決定部122が個体故障率に基づきサーバ300に対する監視間隔を決定するためである。
【0059】
(変形例)
決定部122は、個体故障率に加えて、さらに、監視間隔ごとのサーバ300の台数の割合、あるいは上限数に基づいて、サーバに対する監視間隔を決定してもよい。すなわち、決定部122は、例えば、第1の監視間隔で監視するサーバ300が所定の上限数に達した場合、残りのサーバ300はより長い第2の監視間隔で監視されるよう、基準故障率を決定する。
【0060】
本変形例によれば、多くのサーバを監視する際のネットワークの負荷を低減し、監視負荷を低減する要請と、実際の障害発生から監視装置100が障害を検知するまでの時間を短くし、障害の検知の遅延を防ぐ要請の両方に応えることができる。
【0061】
[ハードウェア構成]
上述した各実施形態において、監視装置100の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部又は全部は、コンピュータ500とプログラムとの任意の組み合わせにより実現されてもよい。
【0062】
図10は、コンピュータ500のハードウェア構成の例を示すブロック図である。図10を参照すると、コンピュータ500は、例えば、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503、プログラム504、記憶装置505、ドライブ装置507、通信インタフェース508、入力装置509、入出力インタフェース511、及び、バス512を含む。
【0063】
プログラム504は、各装置の各機能を実現するための命令(instruction)を含む。プログラム504は、予め、ROM502やRAM503、記憶装置505に格納される。CPU501は、プログラム504に含まれる命令を実行することにより、各装置の各機能を実現する。例えば、監視装置100のCPU501がプログラム504に含まれる命令を実行することにより、監視装置100の機能を実現する。また、RAM503は、各装置の各機能において処理されるデータを記憶してもよい。例えば、コンピュータ500のRAM503に、監視装置100の算出部102が用いるハードウェア監視情報、動作環境温度を記憶してもよい。
【0064】
ドライブ装置507は、記録媒体506の読み書きを行う。通信インタフェース508は、通信ネットワークとのインタフェースを提供する。入力装置509は、例えば、マウスやキーボード等であり、保守管理システムの管理者からの情報の入力を受け付ける。出力装置510は、例えば、ディスプレイであり、管理者へ情報を出力(表示)する。入出力インタフェース511は、周辺機器とのインタフェースを提供する。バス512は、これらハードウェアの各構成要素を接続する。なお、プログラム504は、通信ネットワークを介してCPU501に供給されてもよいし、予め、記録媒体506に格納され、ドライブ装置507により読み出され、CPU501に供給されてもよい。
【0065】
なお、図10に示されているハードウェア構成は例示であり、これら以外の構成要素が追加されていてもよく、一部の構成要素を含まなくてもよい。
【0066】
各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ異なるコンピュータとプログラムとの任意の組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つのコンピュータとプログラムとの任意の組み合わせにより実現されてもよい。
【0067】
また、各装置の各構成要素の一部又は全部は、プロセッサ等を含む汎用又は専用の回路(circuitry)や、これらの組み合わせによって実現されてもよい。これらの回路は、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
【0068】
また、各装置の各構成要素の一部又は全部が複数のコンピュータや回路等により実現される場合、複数のコンピュータや回路等は、集中配置されてもよいし、分散配置されてもよい。
【0069】
また、監視装置100の少なくとも一部がSaaS(Software as a Service)形式で提供されてよい。すなわち、監視装置100を実現するための機能の少なくとも一部が、ネットワーク経由で実行されるソフトウェアによって実行されてよい。
【0070】
以上、実施形態を参照して本開示を説明したが、本開示は上記実施形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。また、各実施形態における構成は、本開示のスコープを逸脱しない限りにおいて、互いに組み合わせることが可能である。
【符号の説明】
【0071】
100 監視装置
101、121 取得部
102 算出部
103、122 決定部
120 算出装置
200 サーバラック
300 サーバ
400 温度センサ
500 コンピュータ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10