(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0010】
以下、本発明の実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省く。
【0011】
[システムの全体構成]
まず、本発明の一実施形態に係る機器管理システムについて、
図1を参照しながら説明する。
図1は、一実施形態に係る機器管理システムの全体構成例を示す。本実施形態では、機器管理システム1はデータセンターに設けられている。本実施形態に係る機器管理システム1は、管理対象のビル10、ビル管理サーバ20及び計測データ管理サーバ30を有している。ビル管理サーバ20及び計測データ管理サーバ30は、ネットワークNWを介して接続されている。
図1では、計測データ管理サーバ30には、1つのビル管理サーバ20のみが接続されているが、計測データ管理サーバ30には、複数の管理サーバが接続されてもよい。
【0012】
なお、本実施形態に係る機器管理システム1は、計測データ監視システムの一例であり、計測データ監視システムはこれに限られない。計測データ監視システムは、機器の状態を判定するための計測データの欠測や異常を判定し、過去の計測データの推移の傾向に基づき、異常と判定された計測データを補正することが可能なシステムであれば、どんな構成を有してもよい。
【0013】
(管理対象機器)
ビル管理サーバ20は、データセンターの運用状態の監視において、データセンター内の各種設備の稼働状態信号とデータの計測とを行っている。ビル管理サーバ20は、計測されたデータ(以下、計測データともいう。)に基づき、ビル10内の機器を管理する。管理対象の機器としては、例えば、特高設備12、特高受電機器12a、12b、分電盤15a、15b、15c、15d、基幹中継機器やセンサ中継機器等を収納するラック17a、17b、17cが挙げられる。また、ビル管理サーバ20は、冷却設備16a、空調設備16b、照明機器18a、18b、18c、IT機器19a、19b、19cを管理対象の機器として管理する。
【0014】
以下、分電盤15a、15b、15c、15dは、総称して分電盤15と記載し、ラック17a、17b、17cは、総称してラック17と記載する。また、照明機器18a、18b、18cは、総称して照明機器18と記載し、IT機器19a、19b、19cは、総称してIT機器19と記載する。
【0015】
ビル10内には、商用電源11からの給電が途絶えたときにも安全に機器を管理し、運用するために、自家発電装置13や(無停電電源装置:Uninterruptible Power Supply、以下、総称してUPS14と記載する。)が設けられている。UPS14は、無停電で電力を供給する機器である。
図1では、自家発電装置13として発電装置a、b、cが図示され、UPS14としてUPS14a、14bが図示されているが、自家発電装置13及びUPS14の数はこれに限られない。
【0016】
ビル10内の機器には、自家発電機器13とUPS14とにより災害時にも電力が供給される。例えば、災害時に商用電源11からの給電が断たれてもUPS14が一時的に各機器に電力を供給することで、自家発電装置13から給電する運用に切り替える。これにより、災害等においてもビル10内の機器の連続的な運転が可能となる。
【0017】
以上のようにして、ビル管理サーバ20は、商用電源11からの給電が停止された場合でも、特高設備12a、12b、冷却設備16a、空調設備16b、IT機器19等のビル10内の運用に必要な設備の運転を継続させることができる。また、復電時には元の商用電源11から給電する運用に戻すことができる。商用電源11から自家発電装置13(予備電源)への切り替えは、災害等により停電が起こった場合だけでなく、数か月毎の定期的な点検(メンテナンス)、運用の切り替え試験及び訓練の際にも発生する。また、電力会社との契約電力量を超えた電力の使用にはペナルティが課せられるため、契約電力量が超えそうな場合においても商用電源11から自家発電装置13への切り替えが発生する。このように、ビル管理サーバ20の運用においては、数か月に1回程度の頻度で自家発電装置13が使用される。
【0018】
ビル10内の各機器には、計測機器S1〜S23(以下、総称して計測機器Sともいう。)が取り付けられている。例えば、特高受電機器12a、12bや分電盤15には、計測機器(メーター)S1〜S6が取り付けられている。計測機器S1〜S6は、各機器の電力消費を監視し、所定時間毎に電力量の積算値を計測データとして出力する。また、例えば、ラック17の床や壁には、計測機器の一例として温度センサ/風速センサS9、S10,S11が取り付けられている。温度センサ/風速センサS9、S10,S11は、30秒周期毎にラック17周辺の温度や風速を監視し、所定時間毎に温度や風速の値を計測データとして出力する。
【0019】
計測データ管理サーバ30は、データセンター内の各種設備のうち主にエネルギーに関する計測データをビル管理サーバ20から取得して、データセンター全体のエネルギーに関する省エネ運転の管理を行う。ビル管理サーバ20で管理する計測データの一例は、
図2に示されている。
【0020】
加えて、計測データ管理サーバ30は、一部の機器に対する計測を行う。計測データ管理サーバ30で管理する計測データの一例は、
図3に示されている。計測データ管理サーバ30は、
図2の特高受電機器12a、12b等の多数の計測データをビル管理サーバ20から取得する。また、計測データ管理サーバ30は、分電盤15やラック17等に取り付けられた計測機器Sを用いて温度や電力量等を計測する。このように、計測データ管理サーバ30は、所定時間毎に計測した計測データと所定時間毎に他の機器から取得した計測データを有する。計測データは、ビル管理サーバ20から取得した計測データに限られず、ネットワークNWに接続された図示しない他の機器から取得してもよい。
【0021】
データセンターでは、管理対象の機器が消費する電力などのエネルギーを低減させ、効率的に機器を稼働(以下、機器の省エネ運転ともいう。)させることを目的として機器の管理が行われる。そのため、データセンターでは、管理対象の機器の電力の最大運用能力(キャパシティ)が試算され、必要な運転能力が満たされるように設備導入が行われる。これは、キャパシティの限界前に設備の増設が順次行われるような設備導入方法である。このように、電力の最大運用能力に余裕を持たせずに限界近くに設定することは、機器の省エネ運転に寄与する。一方で、電力の最大運用能力が限られている環境下では、計測データ管理サーバ30は、各種機器の状態を示す電力量、温度、熱量等を常時計測し、機器の運転を細かく監視する必要がある。
【0022】
予備電源へ切り替えられた場合においても、データセンターの運用に不可欠な設備は、電力供給の優先順位が高いため、予備電源から電力供給が優先的に行われる。一方、冷媒ポンプや冷却棟ファン設備、温度センサ等の計測機器は、電力供給の優先度が低いため、データセンターの運用状態を維持及び監視するのに必要な計測機器を除いては、予備電源からの電力供給が行われない時間帯が発生する。
【0023】
このような背景から、予備電源へ切り替えられた場合、予備電源から給電されていない計測機器はダウンする。よって、設備が運用されているにも関わらず、ダウンした計測機器からの計測データに欠測が生じたり、計測データに異常が発生したりすることがある。また、データセンター内の各設備においては、データセンターの運用を継続させながら設備の点検や部品交換を行うため、点検や交換時に特定設備の計測データが異常値となることもある。
【0024】
このように、管理対象の機器の省エネ運転を実現するために、機器の計測データは必要である。一方で、機器の省エネ運転下においても設備全体を安全に運用することが優先されるため、上記のような運用中の計測データの欠測や異常値の発生は生じ得る。
【0025】
しかしながら、このような異常を含む計測データは、管理対象の機器の状態を正確に判定する妨げとなる。よって、異常な計測データは、例えば、システム運用者によって「手動で」補填や修正されることも行われている。その際、システム運用者は、計測データの前後関係や推移を見ながら妥当な値を算出して計測データの修正や補填を行う。計測データの異常が判定された場合、異常な計測データが自動的に妥当な値に修正又は補填されると、システム運用者の業務の負荷を低減することができる。
【0026】
機器管理システム1においては、計測データ管理サーバ30は、分電盤15やラック17等の計測データを収集し、計測データに基づく演算を行う。また、計測データ管理サーバ30は、データセンターの基幹設備(特高受電機器12a、12b、UPS14、冷却設備16a、空調設備16b等)のエネルギーに関係する計測データをビル管理サーバ20より取得し、省エネ運転の管理を行っている。
【0027】
しかし、この結果、予備電源の切り替え時や設備の保守点検時等にビル管理サーバ20が計測する計測データに欠測や異常が発生した場合、計測データ管理サーバ30は、ビル管理サーバ20から取得した計測データの欠測や異常にかかわらず、管理対象の機器の状態が異常かどうかの判定を行う必要がある。
【0028】
ところが、最新の計測データについての判定を行うにあたっては、下記のような課題があり、単純にビル管理サーバ20から受信したデータを検定するだけでは、計測データが妥当な値を有しているかの判断は難しい。特に、計測データの異常値の判定は、計測データの欠測の判定と比較して困難である。以下に、計測データのデータ検定に関する課題1〜3について説明する。
【0029】
(課題1:積算値のデータ検定に関する課題)
まず、積算値のデータ検定に関する課題1について説明する。
図4に示されるように、電力量や熱量のような値は、計測機器(例えば、メーター)の積算値から算出される。計測機器は、一時間単位で機器の計測を行い、0〜最大値(たとえば999999)の範囲の積算値が求められる。例えば、
図4の装置A(通常時)の場合、前回と今回の積算値の差分を電力量として算出する。
図4の装置Bでは、点線枠の部分で、積算値が最大値を超え、「0」にリセットされている。この場合、最大値と前回の積算値の差分に今回の積算値を加算した値が電力量として算出される。なお、積算値及び電力量は、いずれも計測データの一例である。
【0030】
停電による計測機器のダウン、計測機器の異常、計測対象の設備の保守作業等が発生すると、その時間帯の計測データは正しく算出できなくなる。具体的には、下記の場合、計測した計測データに異常が生じる。
【0031】
図5(a)に示されるように、停電が発生したため、2012/08/01 22:00の時点で計測機器がダウンし、欠測が生じた。この場合、2012/08/01 23:00の時点の計測において、前回の積算値が欠測しているため、今回の電力量は算出できない。
【0032】
図5(b)に示されるように、2012/08/01 22:00過ぎに、設備の保守により積算値が補正された。この場合、2012/08/01 23:00の時点の計測において、前回の積算値が補正されているため、今回の電力量に正しい値を算出できず、算出された計測データは、異常値となる。
【0033】
図5(c)に示されるように、2012/08/01 22:00過ぎに、停電や保守により設備が交換され、積算値がリセットされた。この場合、前回の積算値と今回の積算値の差分の計算によって、妥当でない巨大値が電力量として算出される。
【0034】
以上に説明した計測データを正しく算出できない場合のうち、計測データの欠測は、比較的容易に判定することができる。例えば、予め設定された計測データの正常範囲を示す閾値に基づき、計測データが閾値内に含まれるかの範囲検定を行ってもよい。これにより、計測データの欠測があるかの判定を容易に行うことができる。しかし、この範囲検定の結果、計測データが正常範囲内であった場合において、算出された計測データの異常の有無を判定することは難しい。
【0035】
(課題2:複合設備のデータ検定に関する課題)
次に、複合設備のデータ検定に関する課題2について説明する。
図6は、電力量の経時的な推移の一例を示す。
図6は、複合設備の一例として、ターボ冷凍機の1号機(
図6(a))、2号機(
図6(b))、3号機(
図6(c))の電力量の時間的推移を示す。1号機は、時刻t1〜時刻t2の間運転し、2号機は、時刻t2から運転し、3号機は、時刻t1まで運転している。このように、複合設備では、複数の機器がそれぞれ運転・停止を交代しながら稼働している。
【0036】
このような運転状態においては、
図6(a)〜
図6(c)に示した一の機器の計測データだけを参照すると、突然にデータ値が変動する。しかし、全体的には、ほぼ一定の運転状態が継続されている。これは、
図6(d)にターボ冷凍機の合計の電力量を示したように、ターボ冷凍機(1〜3号機)の複合設備がトータルで均一の稼働となるように制御されているからである。ところが、
図6(d)のターボ冷凍機の合計を参照して計測データの異常の有無を判定しても不十分な場合もある。例えば、ターボ冷凍機と他の冷却設備との複合設備においては、ターボ冷凍機以外の冷却設備が稼働されると、ターボ冷凍機の運転を停止することもある。この場合、ターボ冷凍機と冷却設備とを別々にして個々の設備のデータだけを参照し、一定時間帯の統計処理によって計測データの変動から計測データの異常を正確に判定することは難しい。この場合には、複数種類の設備の計測データを同時に見て計測データの異常を判定する必要がある。
【0037】
なお、データセンターの冷却装置としては、ターボ冷凍機の他にフリークーリング冷却装置、外気冷却装置等様々の設備があり、これらすべての装置のバランスを取りながら運転を行っている。このため、計測データの異常の有無を正しく判定するには、ターボ冷凍機のみならず、他の装置の稼働状況も合わせて検定する必要がある。
【0038】
(課題3:電力量の変化量に関する課題)
次に、電力量の変化量に関する課題3について、
図7を参照しながら説明する。
図7は、電力量の経時的な推移の他の例を示す。データセンターは、莫大な電力量を消費している。そのため、機器によっては、計測機器Sによって計測される積算値の1カウンタ当たりの電力量が大きくなる。例えば、特高受電機器12a、12bでは、計測機器Sの1カウンタ当たりの電力量は100kWhである。よって、1カウンタ当たりの電力量に満たない100kWh未満の電力量は切り捨てられ、次回の積算値に加算される。この場合、加算される電力量が大きいため、特高受電機器12a、12bが消費する毎回の電力量にさほどの変化がなくても、
図7に示されるように、前回の100kWh未満の切り捨てられた値が次回の電力量に加算される。この結果、特にP1やP2で示した所定時間毎の電力量にバラツキが生じ、電力量はギザギザした値となる。
【0039】
また、課題2の複合設備における稼働状況の変動も考慮すると、計測データの変動は、設備の稼働状況と計測機器Sの1カウンタあたりの電力量の大きさとの両方に影響される。このため、計測データの突然の変動からすぐにその計測データが異常であると判定すると、判定精度が低下する。このように、各種の計測データの動きだけを見ても、計測データの正常又は異常の判別が困難な場合がある。
【0040】
上記課題1〜3により説明したように、計測データを個々に見ていては、計測データの欠測や計測データの範囲異常は比較的容易に判定できるものの、計測データの異常の有無の判定は困難である。このような状況においては、計測データの異常を正確に判定しようとすると、計測データ管理サーバ30の処理の負荷が増大する。特に、課題2のような複合設備に関する計測データに関しては、頻繁に異常が発生してしまい、計測データ管理サーバ30の処理の負荷が増大することが懸念される。
【0041】
一方、
図8に示されるデータセンター全体及び一部の電力量の時間的推移の一例では、データセンター全体を総括して評価する指標PUE(PUE:Power Usage Effectiveness;
図8のA)は、ある程度緩やかに変化している状態であることがわかる。また、そのPUEの算出に必要な合計データ(総有効電力量B〜F)についても、
図7に示した課題3の電力量の1カウンタ値の影響はあるものの、ある程度緩やかに変化している状態であることがわかる。ここで、総有効電力量Bのうち、総有効電力量CはIT機器の総有効電力量、総有効電力量Dは空調機器の総有効電力量、総有効電力量Eは照明機器の総有効電力量、総有効電力量F総有効電力量Bから総有効電力量C〜Fを引いた残りの総有効電力量を示す。
【0042】
特に、総有効電力量C(IT機器)の電力量は滑らかに推移している。これは、総有効電力量C(IT機器)の電力量の1カウンタ値は、2〜3kWhと小さく計測の精度が高いためである。なお、特高受電機器12a、12bの計測時の1カウンタ値を小さくし、計測の精度を向上させることもできる。しかし、特高受電機器12a、12bの電力消費は大きい。このため、精度が高く、かつ大きな電力量を計測可能な計測機器を用意する必要があり、計測装置の値段が高くなるため現実的ではない。
【0043】
上記課題1〜3にて説明したように、計測データの変動に基づき、単純に計測データの異常を判定することはできない一方、計測データの変動が計測データの異常を示している場合もある。
【0044】
例えば、
図9(a)は、データセンター全体及び一部の電力量の時間的推移の他の例を示す。
図9(b)は、
図9(a)に示した時刻と同一の時刻における自家発電装置13の電力量の時間的推移を示す。
【0045】
時刻t3では、データセンター内での各種設備のメンテナンスが行われていた。時刻t4〜時刻t5の間は、頻繁に自家発電装置13の運用に切り替わり、その際に電力量の欠測や巨大値が多数発生した。
【0046】
時刻t4以降は、電源断後の初回の設備稼働時に、電力量のカウンタ値がリセットされ、巨大値が発生した。
【0047】
図8及び
図9の2つのグラフを比較すると、
図8に示したある期間の計測データは、各データ値が同じような推移をしている一方で、
図9に示した別の期間の計測データは、巨大値や他のデータの推移と異なるデータ値が存在しており、推移から逸脱した計測データが多数あることがわかる。
【0048】
以上から、メンテナンス時や緊急時における電源の切り替わり時等の影響や機器の不具合により発生した計測データの異常は、過去の計測データの推移の傾向から判定できる。特に、
図8に示したように、データセンター全体の消費電力量の変化がほぼ一定で緩やかに変化する場合、ある時点での最新の計測データが、その最新の計測データの直前の計測データの推移の傾向から外れているかにより、計測データの異常の有無を判定することができる。また、計測データの異常が判定された場合、異常と判定された計測データは、過去の計測データの推移の傾向に応じて自動補正される。以下、本実施形態に係る計測データ管理サーバ30の内部構成について、
図10を参照しながら以下に説明する。
【0049】
(計測データ管理サーバ)
図10は、計測データ管理サーバ30の内部構成例を示す。計測データ管理サーバ30は、計測部31、記憶部32、計測データを記憶するデータベース33、取得部34、判定部35及び補正部36を有する。
【0050】
計測部31は、機器に取り付けられた計測機器により機器が消費した電力値等を所定時間毎に計測する。記憶部32は、計測部31が計測した電力値等の計測データをデータベース33に記憶する。取得部34は、ビル管理サーバ20から基幹設備の計測データを所定時間毎に取得する。
【0051】
判定部35は、計測部31又は取得部34からの計測データのうち、最新の計測データを含まない複数の計測データの推移の傾向と、最新の計測データを含む複数の計測データの推移の傾向とに基づき、最新の計測データの異常の有無を判定する。
【0052】
補正部36は、最新の計測データに異常があると判定した場合、前記最新の計測データを含まない複数の計測データの推移の傾向に基づき、最新の計測データを補正する。
【0053】
例えば、データセンター内のどこかで計測データに異常が発生した場合、判定部35によりその発生時刻におけるセンター全体の消費電力量の検定が行われ、計測データの異常が判定される。計測データに異常があると判定された場合、補正部36により計測データが妥当なデータになるような計測データの自動修正又は計測データの欠測に対する補填が行われる。
【0054】
なお、本実施形態では、判定部35は、計測データ異常が発生したかを判定するための検定手法としてF検定を用いる。これによれば、閾値を使用しないで計測データの異常の判定を行うことができる。F検定は、2つの標本が、同じ母集団のものであるかどうかを検定する方法である。
【0055】
標本の検定には、t検定、F検定、χ2検定、U検定等がある。本実施形態で検定対象となる計測データは、計測点ごとに各々異なったバラツキがあり、計測データのバラツキの範囲や度合は、管理対象の機器毎に特徴がある。また、本実施形態で検定対象となる計測データは、正規分布に従うとは限らない。このため、判定部35は、計測データのこの2点の特徴に適合する検定手法としてF検定を使用する。
【0056】
F検定は、2つの標本が同様な推移の傾向を示していれば、同じ母集団に属するという検定手法である。本実施形態では、具体的には、所定時間毎に計測された計測データのうち、最新の計測データを含まない複数の計測データを第1の標本とし、最新の計測データを含む複数の計測データを第2の標本とする。F検定により、第1及び第2の標本が同じ推移の傾向を示していれば、第1及び第2の標本は同じ母集団に属すると判定する。本実施形態では、第1及び第2の標本が同じ母集団に属している場合には、最新の計測データは、いままでの計測データと同様な推移の傾向を示しているため、正常な計測データと判定される。
【0057】
なお、本実施形態の計測データは、正規分布に近似する分布になることは保証されないため、本実施形態に係る判定処理では、検定対象のデータが正規分布に近似する分布を示す場合に好適なt検定、χ2検定、U検定よりもF検定を行う方が好ましい。しかしながら、本実施形態では、F検定に替えて、t検定、χ2検定、U検定等の他の検定手法を使用することもできる。
【0058】
本実施形態では、検定対象となる計測データは6種類(N=6)であり、個々の計測データ1〜6は、以下の通りである。しかしながら、計測データの種類や個数はこれに限定されない。なお、いずれの種類の計測データも所定の時間間隔で計測されるデータである。
【0059】
計測データ1は、データセンター全体の電力量の総和を示す総有効電力量(例えば、
図8のB)である。計測データ2は、IT機器の電力量の総和を示す総有効電力量(例えば、
図8のC)である。計測データ3は、空調機器の電力量の総和を示す総有効電力量(例えば、
図8のD)である。計測データ4は、照明機器の電力量の総和を示す総有効電力量(例えば、
図8のE)である。計測データ5は、その他の雑電力量、すなわち、総有効電力量からIT機器、空調機器及び照明機器の総有効電力量を差し引いた残りの総有効電力量(例えば、
図8のF)である。計測データ6は、データセンターの運用効率指標を示すPUE(例えば、
図8のA)である。
【0060】
F検定で用いられる第1の標本の一例としては、上記6種類のそれぞれについて所定個数の過去の計測データ(例えば、連続して計測された最新の計測データの直前までの複数の計測データ(以下、過去T時刻分の計測データという。))を示す。第2の標本の一例としては、上記6種類のそれぞれについて過去T時刻分の計測データに最新の計測データを加えた計測データを示す。例えば、nは24〜28であってもよい。
【0061】
例えば、
図11では、時刻tbに計測された最新の計測データに対して、時刻ta以降に計測された計測データのうち、最新の計測データを含まない計測データ、つまり、時刻ta以降に計測された過去T時刻分の計測データが、第1の標本とされる。また、時刻ta〜時刻tbの間に計測された過去T時刻分の計測データに最新の計測データを加えた計測データが、第2の標本とされる。つまり、ここでは、第1の標本と第2の標本との違いは、第2の標本は第1の標本に最新の計測データが加えられた点のみである。
【0062】
ただし、第1の標本は、最新の計測データを含まない複数の計測データであれば、直前の計測データを含まなくてもよい。同様に、第2の標本は、最新の計測データを含む複数の計測データであれば、直前の計測データを含まなくてもよい。また、第1及び第2の標本に含まれる計測データは、最新の計測データが計測された時刻に近い時間帯に計測された計測データが好ましいが、これに限らない。また、第1の標本と第2の標本とに含まれる計測データには、同じ時刻に計測された計測データが含まれてもよいし、異なる時刻に計測された計測データのみであってもよい。ただし、第2の標本には、最新の計測データが含まれる必要がある。
【0063】
F検定では、2標本の分散が等分散であるという帰無仮説が棄却できるか否かの検定が行われる。F検定では、例えば、
図11に示されるように、第1の標本に含まれる計測データの分散1と、第2の標本に含まれる計測データの分散2とが計算される。分散1は、最新の計測データを含まない複数の計測データの推移の傾向を示す一例である。また、分散2は、最新の計測データを含む複数の計測データの推移の傾向を示す一例である。
【0064】
第1の標本に含まれる計測データの分散1は、式(1)で示される。
【0066】
第2の標本に含まれる計測データの分散2は、式(2)で示される。
【0068】
ここで、
【数3】
は、最新の計測データを含まない第1の標本の分散1を求める際に算出した第1の標本の
計測データの平均値である。また、nは予め定められた標本数(例えば、n=24)であ
る。
【0069】
求められた分散1と分散2から得られる分散比:FがF分布表のFp(pは棄却境界確率:5%程度)以下になる場合、帰無仮説が棄却されるため、最新の計測データは異常であると判定される。棄却域は、3%〜5%で設定されてもよい。棄却域が大きいほど計測データが異常と判定される確率が高くなり、厳しい検定条件となる。
【0070】
このようにして、F検定では、最新の計測データの有無のみが異なる近似した第1及び第2の標本に対して、2つの標本の分散が等分散であるという帰無仮説を棄却できなければ、2つの標本は同じ母集団のデータとみなすことができ、2つの標本は同様なデータ推移の傾向を示していると判断できる。よって、その場合には、判定部35は、最新の計測データの値は正常であると判定する。例えば、
図11(a)に模式的に示したように、分散1と分散2の差が小さく、F検定の結果が帰無仮説を棄却できない場合、最新の計測データの値は正常であると判定される。
【0071】
一方、
図11(b)に模式的に示したように、最新の計測データが、それ以前の計測データの推移の傾向と異なっている場合、最新の計測データを含まない複数の計測データの分散1と、最新の計測データを含む複数の計測データの分散2に大きく差があり、F検定の結果が帰無仮説を棄却できる可能性が高い。この図の場合、実際にF検定を行うと帰無仮説が棄却され、最新のデータの値は異常であると判定される。
【0072】
[判定/補正処理]
次に、以上のF検定を使用した本実施形態に係る計測データの判定及び補正処理について、
図12及び
図13を参照しながら説明する。
図12は、一実施形態に係る計測データの判定処理を示したフローチャートである。
図13は、一実施形態に係る計測データの補正処理を示したフローチャートである。
【0073】
(判定処理)
図12の処理が開始されると、まず、計測部31は、検定対象の数(種類)Nを特定する(ステップS10)。ここでは、検定対象の種類は6種類、すなわち、N=6と特定される。
【0074】
次に、計測部31は、検定対象nに1を代入し、検定異常数cに0を代入する(ステップS12)。これにより、例えば、検定対象の種類が計測データ1、つまり、総有効電力量(例えば、
図8のB)に設定される。また、この時点で検定により異常と判定された計測データの数は0である。
【0075】
次に、計測部31は、検定対象nの最新の計測データを計測(又は、ビル管理サーバ20から取得)する(ステップS14)。次に、判定部35は、データベース33から第1の標本と第2の標本の計測データを取得し、F検定を行う(ステップS16)。
【0076】
次に、判定部35は、F検定の結果、帰無仮説が棄却できるか否かを判定する(ステップS18)。帰無仮説が棄却できる場合、判定部35は、F検定の結果が異常(最新の計測データが異常)であると判定し、検定異常数cを1だけ加算し(ステップS20)、ステップS22に進む。一方、帰無仮説が棄却できない場合、判定部35は、F検定の結果が正常(最新の計測データが正常)であると判定し、そのままステップS22に進む。
【0077】
ステップS22では、検定対象nに1を加算する。ここでは、n=2である。よって、次のステップS24では、nはNより小さいと判定し、ステップS14に戻る。2種類目の計測データ(例えば、検定対象の種類が計測データ2、つまり、IT機器の電力量の総和を示す総有効電力量(例えば、
図8のC)についても、ステップS14〜S24の処理が実行される。ステップS18にてF検定の結果が異常であると判定された場合、判定部35は、検定異常数cを1だけ加算する。3〜6種類目の計測データについても、ステップS14〜S24の処理が実行され、F検定の結果が異常であると判定された場合には、検定異常数cが1だけ加算される。
【0078】
6種類目の計測データの検定後、ステップS24にて、判定部35は、nがNに等しいと判定し、ステップS26に進んで、検定異常数cが2以上であるかを判定する。検定異常数cが2以上の場合、判定部31は、最新の計測データを補正すると判定する(ステップS28)。検定異常数cが0又は1の場合には、直ちに本処理を終了する。
【0079】
以上に説明したように、本実施形態に係る判定処理によれば、F検定により、最新の計測データが、最新の計測データを含まない過去T時刻分の計測データの推移の傾向に逸脱していないかを判定できる。最新の計測データが、過去T時刻分の計測データの推移の傾向に逸脱していなければ、最新の計測データは正常と判定される。一方、最新の計測データが、過去T時刻分の計測データの推移の傾向に逸脱していれば、最新の計測データは異常であると判定される。
【0080】
また、本実施形態に係る判定処理によれば、F検定の結果、2種類以上の最新の計測データが異常であると判定されたとき、各種類の最新の計測データを補正すると判定され、次に説明する
図13に示した各種類の最新の計測データを補正する処理が実行される。つまり、1種類の最新の計測データが異常であると判定された場合には、異常とせず、各種類の最新の計測データは補正されない。
【0081】
2種類以上の計測データに関してF検定により最新の計測データが異常と判定された場合にデータ異常と判定する理由について説明する。
【0082】
図12にて使用する6種類の計測データの一例は、次の通りである。
総有効電力量(IT機器)=ラックの電力量の総和
総有効電力量(空調機器)=空調機器の電力量の総和
総有効電力量(照明機器)=照明機器の電力量の総和
総有効電力量(その他雑)=総有効電力量−総有効電力量(IT機器)−総有効電力量(空調機器)−総有効電力量(照明機器)
PUE=総有効電力量/総有効電力量(IT機器)
上記の各式より、以下の関係があることがわかる。
【0083】
総有効電力量(IT機器)は、総有効電力量(その他雑)とPUEとに影響する。
【0084】
総有効電力量(空調機器)は、総有効電力量(その他雑)に影響する。
【0085】
総有効電力量(照明機器)は、総有効電力量(その他雑)に影響する。
【0086】
総有効電力量(その他雑)は、総有効電力量、総有効電力量(IT機器)、総有効電力量(空調機器)、総有効電力量(照明機器)のいずれかに影響される。
【0087】
PUEは、いずれかの電力量に影響される。
【0088】
総有効電力量は、いずれかの電力量に影響される。
【0089】
つまり、6種類の計測データは、互いに影響しあうことから、単体でF検定異常となる場合は、計測データの推移に生じた偶発的なバラツキともいえる。よって、1種類の最新の計測データが単体で異常であると判定された場合には、そのバラツキ度合いが許容できるものと判断され、最新の計測データは補正されない。ただし、各々のデータの推移を厳密に継続したい場合は、1種類の最新の計測データが単体で異常であると判定された場合にも、各種類の最新の計測データを補正してもよい。また、データ異常の判定を緩和する場合、同時に発生したデータ異常数を2種類ではなく、3種類以上の最新の計測データが異常であると判定された場合に、各種類の最新の計測データを補正してもよい。
【0090】
(補正処理)
なお、上記では6種類のデータを例として説明したが、システム全体の傾向を示す代表データであれば、データ異常の判定対象のデータの種類数はいくつでも良い。ただし、判定対象のデータの種類数が多すぎると、データ異常の判定に要する処理負荷が増大し、反対に少なすぎるとデータ異常の判定精度が低下するため、処理負荷と判定精度のバランスを見ながら、適当な数のデータの種類数を決める必要がある。
【0091】
次に、本実施形態に係る計測データの補正処理について、
図13を参照しながら説明する。
図13の処理が開始されると、まず、判定部35は、最新の計測データを取得する(ステップS30)。次に、判定部35は、最新の計測データが欠測しているかを判定する(ステップS32)。最新の計測データが欠測していると判定された場合、補正部36は、所定個数の過去の計測データ、つまり、過去T時刻分の計測データを取得する(ステップS34)。ここで、過去T時刻分の計測データの個数は、複数であればいくつでもよい。
【0092】
補正部36は、積算データ以外の計測データの欠測に対して、計測データの異常の修正と同様に、分散と平均値とを用いた補正値を使用する(ステップS36)。
【0093】
本実施形態では、一種類の計測データについて異常や欠測が検出された場合、その時刻の各種設備の電力量やPUEには、単一あるいは複数の計測データに異常が存在する。このような計測データの性質を考慮し、各種類の計測データは、以下に説明するように補正される。なお、アナログ系のデータが計測データの場合、アナログ系のデータは基本的に計測機器でデータ検定されるため、有効であれば異常値ではないものとして扱う。
【0094】
電力量のような積算系データが計測データの場合、欠測した最新の計測データを補正するための補正値は、最新の計測データの計測時刻より前に計測された過去T時刻分の計測データの推移の傾向から判断される。
【0095】
補正値xは、式(1)及び式(2)を用いて算出される第1の標本の分散u12と第2の標本の分散u22とが等しくなることを前提として式(3)にて求められる値である。
【0097】
第1の標本の分散u12は、最新の計測データを含まない過去の計測データの推移の傾向を示し、第2の標本の分散u22は、最新の計測データを含まない過去の計測データの推移の傾向を示す。式(3)にて求められる補正値xは、過去の計測データの推移の傾向に追従した値となる。これにより、最新の計測データは、前値や平均値を用いるよりも、よりいままでの計測データの推移の傾向に追従したデータ値で補正される。
【0098】
次に、ステップS46に進み、補正部36は、算出した補正値xで欠測した最新の計測データを補填し、本処理を終了する。
【0099】
なお、計測データが積算データの場合については、2時刻分以上の計測データが欠測となっている。よって、補正部36は、復旧時刻においてカウンタ値をセットし、前回の有効データのカウンタ値と復旧時刻のカウンタ値との差分を求め、カウンタ値の差分に基づき求められる欠測した複数の時刻に対して、算出された補正値xを均等に按分する。
【0100】
このデータの推移の判断においても前記計測データの異常の検出に用いた第1及び第2の標本によるF検定が使用される。このF検定により異常となった場合、その時刻に計測されたデータは、過去の計測データの推移の傾向から逸脱した計測データであると判断される。その場合、第1の標本の分散と、分散を求める際に算出した第1の標本の計測データの平均値とを用いて、式(3)から算出された補正値xにより最新の計測データが補正される。
【0101】
次に、ステップS46に進み、補正部36は、算出した補正値で欠測した計測データを補填する。次いで、補正部36は、全計測機器の最新の計測データについて本処理を実行したかを判定する(ステップS48)。全ての判定が終了していない場合、補正部36は、ステップS30に戻り、ステップS30〜ステップS48の処理を繰り返す。全ての判定が終了した場合には、本処理が終了される。
【0102】
ステップS32にて、最新の計測データが欠測していないと判定された場合、判定部35は、検定対象の最新の計測データを取得し(ステップS38)、F検定を実行する(ステップS40)。次に、判定部35は、F検定の結果が異常であるかを判定する(ステップ42)。
【0103】
F検定の結果が異常であると判定された場合、補正部36は、ステップS40のF検定で算出された分散u12及び分散u22を用いて式(3)により補正値xを算出する(ステップS44)。次に、ステップS46に進み、補正部36は、算出した補正値で異常と判定された最新の計測データを補正する。次いで、補正部36は、全計測機器の最新の計測データについて本処理を実行したかを判定する(ステップS48)。全ての判定が終了していない場合、補正部36は、ステップS30に戻り、ステップS30〜ステップS48の処理を繰り返す。全ての判定が終了した場合には、本処理が終了される。
【0104】
以上に説明した本実施形態に係る補正処理によれば、計測データの推移の傾向に追従した補正値により最新の計測データの異常値が補正される。例えば、
図11(a)に示した計測データの場合、最新の計測データを含む第2の標本の計測データの分散2は、最新の計測データを含まない第1の標本の計測データの分散1と近似している。よって、本実施形態に係る判定処理では、第2の標本の計測データは、第1の標本の計測データと同じ推移の傾向を示すと判断される。よって、この場合には、最新の計測データは、正常と判定される。
【0105】
一方、
図11(b)に示した計測データの場合、最新の計測データを含む第2の標本の計測データの分散2は、最新の計測データを含まない第1の標本の計測データの分散1と近似していない。よって、本実施形態に係る判定処理では、第2の標本の計測データは、第1の標本の計測データと同じ推移の傾向を示していないと判断される。よって、この場合には、最新の計測データは、異常と判定される。そして、最新の計測データは、式(3)に過去の計測データの分散や平均値を代入することにより算出される補正値xに補正される。これにより、補正された最新の計測データは、過去の計測データの推移の傾向に追従した値に補正される。
【0106】
また、本実施形態に係る補正処理によれば、異常と判定された最新の計測データは、次の計測が行われる前にリアルタイムに自動補正される。よって、次の計測データ(その時点での最新の計測データ)の判定時には、その直前の計測データの異常や欠測は、既に補填や補正が完了している。よって、過去の計測データに含まれる異常による、計測データを用いた判定への影響を低下させることができる。
【0107】
(効果の例)
本実施形態に係る判定処理及び補正処理を行った結果の一例を
図14に示す。これによれば、メンテナンスや災害発生時に生じた電力量の欠損や異常が補填又は補正され、計測データのバラツキが顕著に低減されている。以上から、本実施形態に係る判定処理及び補正処理によれば、欠測又は異常な計測データを過去の計測データの推移の傾向に追従した値にリアルタイムに自動補正できる。これにより、たとえ計測データに異常や欠測が発生したとしても、システム全体のデータの推移の傾向を継続できることから、計測データに基づく管理対象の機器の状態把握の精度を高めることができる。また、データ異常の判定対象のデータを数種類に絞って検定を行うことから、計測データ管理サーバ30がデータの補正処理を実行する際の処理負荷を軽減させることができる。これにより、データセンター全体の信頼性を向上させることができる。
【0108】
以上に説明したように、本実施形態に係る機器管理システム1によれば、データセンターの機器管理システムにおいて、通常運用と停電運用の切り替えをきっかけとして発生する欠測やデータ異常の発生を検出することができる。
【0109】
また、本実施形態に係る判定処理によれば、特定の数点の計測データに基づき、最新の計測データの異常を判定することができる。これにより、判定処理及び補正処理による計測データ管理サーバ30の処理負荷を抑えることができる。
【0110】
また、本実施形態に係る判定処理及び補正処理によれば、計測データを収集するとともに判定や補正に必要な演算を行いながら、計測データの異常を判定できる。、また、異常と判定された計測データは、判定で用いられた分散等から導かれる補正値により、直ちに補正又は補填することができる。
【0111】
特に、本実施形態では、補正値や補填値が計測データの推移の傾向に追従した値となる。このため、異常な計測データを過去の計測データの推移の傾向に即した値に補正することができる。
【0112】
なお、以上の実施形態では、主に電力量等のデータを計測データの例に挙げて説明した。しかしながら、本実施形態を適用可能な計測データは、これに限られず、温度や水位等を計測したデータ等にも適用できる。また、本実施形態では、検定対象の計測データが正規分布しないデータであることを前提にF検定を行ったが、これに限られず、検定対象のデータが正規分布することを前提としてもよい。その場合には、特にF検定に替えてt検定、χ2検定、U検定等を用いることが好適である。
【0113】
また、本実施形態に係る機器管理システム1は、計測データの異常の有無の判定や、異常と判定された計測データの補正だけでなく、計測データの分析を行うこともできる。本実施形態に係る判定処理により、計測データに異常が発生したと判定された場合であって、その時点で停電もなく、メンテナンス中でもなかった場合、他に何が原因になっているかの分析に本実施形態の判定を使用することができる。
【0114】
(ハードウェア構成例)
最後に、本実施形態に係る計測データ管理サーバ30のハードウェア構成について、
図15を参照しながら簡単に説明する。
図15は、本実施形態にかかる計測データ管理サーバ30のハードウェア構成例を示す図である。
【0115】
図15に示すように、計測データ管理サーバ30は、入力装置101、表示装置102、外部I/F103、RAM(Random Access Memory)104、ROM(Read Only Memory)105、CPU(Central Processing Unit)106、通信I/F107及びHDD(Hard Disk Drive)108を備え、それぞれがバスBで相互に接続されている。
【0116】
入力装置101は、キーボードやマウスなどを含み、計測データ管理サーバ30に各操作を入力するのに用いられる。表示装置102は、ディスプレイなどを含み、デスクトップ画面等を表示する。
【0117】
通信I/F107は、計測データ管理サーバ30をネットワークNWに接続するインタフェースである。これにより、計測データ管理サーバ30は、通信I/F107を介して、ビル管理サーバ20と計測データ等を送受信する。
【0118】
HDD108は、プログラムやデータを格納している不揮発性の記憶装置である。格納されるプログラムやデータには、装置全体を制御する基本ソフトウェアであるOS(Operating System)、及びOS上において描画機能等の各種機能を提供するアプリケーションソフトウェアなどがある。また、HDD108は、上記各実施形態の判定処理や補正処理を行うためにCPU106により実行される計測データ監視プログラムを格納する。
【0119】
外部I/F103は、外部装置とのインタフェースである。外部装置には、記録媒体103aなどがある。計測データ管理サーバ30は、外部I/F103を介して、記録媒体103aの読み取り及び/又は書き込みを行うことができる。記録媒体103aとしては、CD(Compact Disk)、及びDVD(Digital Versatile Disk)、ならびに、SDメモリカード(SD Memory card)やUSBメモリ(Universal Serial Bus memory)等が挙げられる。
【0120】
ROM105は、不揮発性の半導体メモリ(記憶装置)であり、起動時に実行されるBIOS(Basic Input/Output System)、OS設定、及びネットワーク設定などのプログラムやデータが格納されている。RAM104は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。CPU106は、上記記憶装置(例えば「HDD」や「ROM」など)から、プログラムやデータをRAM上に読み出し、処理を実行することで、装置全体の制御や搭載機能を実現する演算装置である。
【0121】
計測データ管理サーバ30による計測部31、取得部34、判定部35、補正部36の各部は、HDD108にインストールされたプログラムがCPU106に実行させる処理により実現される。計測データを記憶する記憶部32は、例えば、RAM104、HDD108を用いてもよいし、計測データ管理サーバ30にネットワークNWを介して接続される記憶装置を用いて実現可能である。
【0122】
以上、計測データの補正方法、計測データ監視システム及び計測データ監視プログラムを実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能である。
【0123】
例えば、上記実施形態では、計測データの推移の傾向は、分散を用いて判断された。しかしながら、本発明に係る計測データの補正方法では、計測データの推移の傾向は、分散以外の指標を用いて判断することもできる。計測データの推移の傾向を示す指標としては、例えば、分散から得られる標準偏差を用いた母平均の推定範囲と標本平均から補正値を予測することも可能である。
【0124】
以上の説明に関し、更に以下の項を開示する。
(付記1)
所定時間毎に計測される計測データのうち、最新の計測データを含まない複数の計測データの推移の傾向と、前記最新の計測データを含む複数の計測データの推移の傾向とに基づき、前記最新の計測データの異常の有無を判定し、
前記最新の計測データに異常があると判定した場合、前記最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記最新の計測データを補正する、
処理をコンピュータが実行する計測データの補正方法。
(付記2)
前記判定の処理は、
前記補正された最新の計測データを、次に計測される計測データの異常の有無の判定に使用する、
処理をコンピュータが実行する付記1に記載の計測データの補正方法。
(付記3)
前記判定の処理は、
所定時間毎に計測された複数種類の前記計測データに対して各種類の前記最新の計測データの異常の有無をそれぞれ判定し、
前記補正の処理は、
2種類以上の前記最新の計測データに異常があると判定した場合、前記各種類の最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記各種類の最新の計測データをそれぞれ補正する、
処理をコンピュータが実行する付記1又は2に記載の計測データの補正方法。
(付記4)
所定時間毎に計測した計測データ又は所定時間毎に他の機器から取得した計測データのうち、最新の計測データを含まない複数の計測データの推移の傾向と、前記最新の計測データを含む複数の計測データの推移の傾向とに基づき、前記最新の計測データの異常の有無を判定する判定部と、
前記最新の計測データに異常があると判定した場合、前記最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記最新の計測データを補正する補正部と、
を有する計測データ監視システム。
(付記5)
前記判定部は、
前記補正された最新の計測データを、次に計測される計測データの異常の有無の判定に使用する、
付記4に記載の計測データ監視システム。
(付記6)
前記判定部は、
所定時間毎に計測された複数種類の前記計測データに対して各種類の前記最新の計測データの異常の有無をそれぞれ判定し、
前記補正部は、
2種類以上の前記最新の計測データに異常があると判定した場合、前記各種類の最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記各種類の最新の計測データをそれぞれ補正する、
付記4又は5に記載の計測データ監視システム。
(付記7)
所定時間毎に計測される計測データのうち、最新の計測データを含まない複数の計測データの推移の傾向と、前記最新の計測データを含む複数の計測データの推移の傾向とに基づき、前記最新の計測データの異常の有無を判定し、
前記最新の計測データに異常があると判定した場合、前記最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記最新の計測データを補正する、
処理をコンピュータに実行させる計測データ監視プログラム。
(付記8)
前記判定の処理は、
前記補正された最新の計測データを、次に計測される計測データの異常の有無の判定に使用する、
処理をコンピュータに実行させる付記7に記載の計測データ監視プログラム。
(付記9)
前記判定の処理は、
所定時間毎に計測された複数種類の前記計測データに対して各種類の前記最新の計測データの異常の有無をそれぞれ判定し、
前記補正の処理は、
2種類以上の前記最新の計測データに異常があると判定した場合、前記各種類の最新の計測データを含まない複数の計測データの推移の傾向に基づき、前記各種類の最新の計測データをそれぞれ補正する、
処理をコンピュータに実行させる付記7又は8に記載の計測データ監視プログラム。