(58)【調査した分野】(Int.Cl.,DB名)
状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から前記機器の状態の判定対象期間に含まれる情報を切り出して、前記判定対象期間における負荷変動を示す負荷データを生成する負荷データ生成手段と、
前記判定対象期間に対して前記機器が正常の状態の場合を示すモデルデータを取得するモデルデータ取得手段と、
前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合することで前記判定対象期間において前記機器の状態が正常であったか否かを判定するデータ照合手段と、
を有し、
前記データ照合手段は、
前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、前記機器に関わる事象が記録されたログ情報から前記判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、前記負荷データから前記外乱発生期間における負荷変動を消去する外乱消去部を含み、
前記外乱消去部により前記外乱発生期間における負荷変動が消去された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定する、
ことを特徴とする機器状態判定装置。
状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から前記機器の状態の判定対象期間に含まれる情報を切り出して、前記判定対象期間における負荷変動を示す負荷データを生成する負荷データ生成手段と、
前記判定対象期間に対して前記機器が正常の状態の場合を示すモデルデータを取得するモデルデータ取得手段と、
前記負荷データ生成手段により生成された負荷データと前記モデルデータとを照合することで前記判定対象期間において前記機器の状態が正常であったか否かを判定するデータ照合手段と、
を有し、
前記データ照合手段は、
前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、前記機器に関わる事象が記録されたログ情報から前記判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、前記負荷データから前記外乱発生期間部分のデータを切除する補正を行う補正部を含み、
前記補正部により補正された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定する、
ことを特徴とする機器状態判定装置。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、正常であるにもかかわらず、ユーザ操作やサーバ接続時のパケットの到着等により発生した負荷変動、すなわち外乱が負荷データに含まれていると、モデルデータと照合した結果、パターンが一致しないため異常と判断してしまうおそれがあった。
【0006】
発生しうる外乱を原因とする負荷変動パターンを予め特定しておき、そのパターンを負荷データから除去した後にモデルデータと照合することも考えられるが、発生しうる外乱の全てを推測して各外乱に対応した負荷変動パターンを予め用意しておくことは極めて困難である。
【0007】
本発明は、外乱に対応した負荷変動パターンを予め用意しておくことなく機器の状態を正確に判定することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る機器状態判定装置は、状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から前記機器の状態の判定対象期間に含まれる情報を切り出して、前記判定対象期間における負荷変動を示す負荷データを生成する負荷データ生成手段と、前記判定対象期間に対して前記機器が正常の状態の場合を示すモデルデータを取得するモデルデータ取得手段と、前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合することで前記判定対象期間において前記機器の状態が正常であったか否かを判定するデータ照合手段と、を有し、前記データ照合手段は、前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、前記機器に関わる事象が記録されたログ情報から前記判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、前記負荷データから前記外乱発生期間における負荷変動を消去する外乱消去部を含み、前記外乱消去部により前記外乱発生期間における負荷変動が消去された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定することを特徴とする。
【0009】
また、前記データ照合手段は、前記外乱消去部により前記外乱発生期間における負荷変動が消去された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、前記負荷データから前記外乱発生期間部分のデータを切除する補正を行う補正部を含み、前記補正部により補正された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定することを特徴とする。
【0010】
本発明に係る機器状態判定装置は、状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から前記機器の状態の判定対象期間に含まれる情報を切り出して、前記判定対象期間における負荷変動を示す負荷データを生成する負荷データ生成手段と、前記判定対象期間に対して前記機器が正常の状態の場合を示すモデルデータを取得するモデルデータ取得手段と、前記負荷データ生成手段により生成された負荷データと前記モデルデータとを照合することで前記判定対象期間において前記機器の状態が正常であったか否かを判定するデータ照合手段と、を有し、前記データ照合手段は、前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、
前記機器に関わる事象が記録されたログ情報から前記判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、前記負荷データから前記外乱発生期間部分のデータを切除する補正を行う補正部を含み、前記補正部により補正された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定することを特徴とする。
【0011】
本発明に係るプログラムは、コンピュータを、状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から前記機器の状態の判定対象期間に含まれる情報を切り出して、前記判定対象期間における負荷変動を示す負荷データを生成する負荷データ生成手段、前記判定対象期間に対して前記機器が正常の状態の場合を示すモデルデータを取得するモデルデータ取得手段、前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合することで前記判定対象期間において前記機器の状態が正常であったか否かを判定するデータ照合手段、として機能させ、前記データ照合手段は、前記負荷データ生成手段により生成された負荷データを前記モデルデータと照合した結果、一致しないと判定した場合、前記機器に関わる事象が記録されたログ情報から前記判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、前記負荷データから前記外乱発生期間における負荷変動を消去する外乱消去部を含み、前記外乱消去部により前記外乱発生期間における負荷変動が消去された負荷データを前記モデルデータと照合した結果、一致した場合、前記判定対象期間における前記機器の状態を正常と判定する。
【発明の効果】
【0012】
本発明によれば、外乱に対応した負荷変動パターンを予め用意しておくことなく機器の状態を正確に判定することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明に係る機器状態判定装置の一実施の形態を示したブロック構成図である。
【
図2】本実施の形態における機器状態判定装置を形成するコンピュータのハードウェア構成図である。
【
図3】本実施の形態における機器状態判定処理を示したフローチャートである。
【
図4】(a)は状態判定対象期間における負荷データを示す図であり、(b)は
図4(a)と同じ期間長の状態判定対象期間におけるモデルデータを示す図である。
【
図5】本実施の形態における外乱消去処理を示したフローチャートである。
【
図6】(a)は状態判定対象期間において外乱が発生した負荷データを示す図であり、(b)は
図6(a)と同じ期間長の状態判定対象期間におけるモデルデータを示す図である。
【
図7】本実施の形態における外乱消去処理により負荷変動を消去した後の負荷データを示す図である。
【
図8】本実施の形態におけるデータ補正処理を示したフローチャートである。
【
図9】(a)は状態判定対象期間においてデータ補正をした後の負荷データを示す図であり、(b)は
図6(a)と同じ期間長の状態判定対象期間におけるモデルデータを示す図である。
【発明を実施するための形態】
【0014】
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
【0015】
図1は、本発明に係る機器状態判定装置の一実施の形態を示したブロック構成図である。本実施の形態における機器状態判定装置10は、ビル等の建造物に設置され、コンピュータが搭載された機器を遠隔地から監視する監視センタに設置されている。監視センタは、図示しない1又は複数のデータ収集装置によって建造物に設置のビル管理システムから収集した負荷情報及びログ情報をそれぞれ蓄積する負荷情報蓄積部1及びログ情報蓄積部2を有している。また、機器状態判定装置10が実施する機器の状態が正常か否かの判定処理を実行する際に用いるモデルデータを格納するモデルデータ記憶部3を有している。なお、各記憶手段1〜3は、機器状態判定装置10の内部に設けてもよいし、監視センタ以外に設けられていてもよい。
【0016】
機器は、運用により所定の動作を行うが、ビル管理システムは、機器のハードウェア資源にかかる負荷を示す指標として、CPU使用率、メモリ使用量、I/Oアクセス数等の負荷を常時監視している。監視センタには、これらのデータがビル管理システムからリアルタイム又は定期的に送信されてくると、負荷情報として負荷情報蓄積部1に蓄積する。
【0017】
また、機器は、機器に関わる事象としてユーザ操作やネットワークアクセス等機器の動作が行われた日時及び動作内容を特定する情報を含むログ情報が、ビル管理システムが出力するシステムログやウェブサーバが出力するアクセスログ等に蓄積される。ログ情報蓄積部2には、これらの逐次蓄積されたログ情報がビル管理システムからリアルタイム又は定期的に送信され蓄積される。
【0018】
また、本実施の形態における機器状態判定装置10は、機器の動作に基づく負荷情報を、機器が正常の状態の場合を示すモデルデータと照合することで、当該機器の状態が正常か否かを判定する。モデルデータ記憶部3には、このモデルデータが格納されている。
【0019】
モデルデータは、周期毎機器毎に予め用意される。例えば、ビル管理システムにおいて、日報、週報及び月報を生成しているのであれば、これらの周期に合わせて1日分の長さ(稼動時間又は24時間の長さ)のモデルデータ、1週間の長さ、及び1月分の長さのモデルデータを予め用意しておく。具体的には、モデルデータを、負荷情報から正常に稼動していたときに収集された1日、1週間、1月等所定の判定対象期間単位で負荷情報を切り出して生成してもよいし、論理的に算出してもよい。基本的には、ビルに設置された機器毎にモデルデータを用意しておくのが望ましいが、機器の使用状況によっては複数の機器により共有してもよい。
【0020】
図2は、本実施の形態における機器状態判定装置10を形成するコンピュータのハードウェア構成図である。本実施の形態において機器状態判定装置10を形成するコンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、コンピュータは、
図2に示したようにCPU21、ROM22、RAM23、ハードディスクドライブ(HDD)24を接続したHDDコントローラ25、入力手段として設けられたマウス26とキーボード27、及び表示装置として設けられたディスプレイ28をそれぞれ接続する入出力コントローラ29、通信手段として設けられたネットワークコントローラ30を内部バス31に接続して構成される。
【0021】
図1に戻り、本実施の形態における機器状態判定装置10は、負荷データ生成部11、データ照合部12及び表示部13を有している。負荷データ生成部11は、負荷データ生成手段として設けられ、状態の判定対象とする機器にかかる負荷の状態を示す負荷情報から当該機器の状態の判定対象期間に含まれる情報を切り出して、その判定対象期間における負荷変動を示す負荷データを生成する。表示部13は、データ照合部12による機器が正常か否かの判定結果を表示する。
【0022】
データ照合部12は、データ照合手段として設けられ、負荷データ生成部11により生成された負荷データをモデルデータと照合することで判定対象期間において当該機器の状態が正常であったか否かを判定する。データ照合部12は、またモデルデータ取得手段として設けられており、負荷データと照合するモデルデータをモデルデータ記憶部3から取得する。データ照合部12は、外乱消去部121及び負荷データ補正部122を有している。外乱消去部121は、負荷データ生成部11により生成された負荷データをモデルデータと照合した結果、一致しないと判定した場合、ログ情報を参照することによって判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、負荷データからその外乱発生期間における負荷変動を消去する。負荷データ補正部122は、ログ情報を参照することによって判定対象期間において外乱の発生要因となる事象が行われていた外乱発生期間を特定し、負荷データからその外乱発生期間部分のデータを切除する補正を行う。
【0023】
機器状態判定装置10における各構成要素11〜13は、機器状態判定装置10を形成するコンピュータと、コンピュータに搭載されたCPU21で動作するプログラムとの協調動作により実現される。なお、各記憶手段1〜3が機器状態判定装置10に設けられている場合、各記憶手段1〜3は、機器状態判定装置10に搭載されたHDD24にて実現される。
【0024】
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやDVD−ROM等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPU21がプログラムを順次実行することで各種処理が実現される。
【0025】
次に、本実施の形態における機器状態判定処理について
図3に示したフローチャートを用いて説明する。機器状態判定処理は、機器状態判定処理プログラムを定周期的に実行することで定時処理として実行されてもよいし、管理者等のユーザにより機器状態判定処理プログラムが起動されることで実行されるようにしてもよい。また、状態の判定対象とする機器は、予め決められていてもよいし、ユーザによりその都度指定されてもよい。ここでは、1台の機器に着目して説明する。複数の機器に対して行う場合も、各機器に対して以下に説明する処理と同じ内容で処理すればよい。
【0026】
負荷データ生成部11は、負荷情報蓄積部1に蓄積されている負荷情報から、機器の状態の判定対象期間に含まれる情報を切り出して負荷データを生成する(ステップ110)。状態判定対象期間は、日、週、月などの一定期間長である。状態判定対象期間を特定するために必要な始期及び期間長は、ユーザにより指定される。もちろん、予め決められた状態判定対象期間の始期(0時、日曜日、1日等)及び長さ(1日、1週間、1月等)としてユーザに指定させなくてもよい。
【0027】
続いて、データ照合部12は、負荷データ生成部11により生成された負荷データと同じ状態判定対象期間長の当該機器のモデルデータをモデルデータ記憶部3から取り出し取得する(ステップ120)。そして、負荷データ生成部11により生成された負荷データを取得したモデルデータと照合する。
【0028】
ここで、照合した結果、負荷データがモデルデータと一致していれば(ステップ130でY)、データ照合部12は、当該状態判定対象期間において、機器は正常な状態で動作していたと判定する(ステップ190)。機器が正常と判定されたときの負荷データとモデルデータの関係を
図4に示す。
【0029】
図4(a)には状態判定対象期間における負荷データが、
図4(b)には
図4(a)と同じ期間長の状態判定対象期間におけるモデルデータが、それぞれ示されている。この例では、負荷情報としてメモリ使用量を用いている場合を例に示している。各データにおける負荷変動のパターンが同一の場合、負荷データとモデルデータは一致していると判定する。パターンが一致しているかどうかは、負荷パターンにより表される負荷変動、詳細には時間軸上で変化するメモリ使用量の値(負荷)の変動より形成される山の傾きや位置、負荷データとモデルデータの各値のずれ量(誤差)の許容範囲等を考慮して判断する。このパターンが一致しているかどうかの判定基準は、従前からある基準を用いればよい。後述する照合処理においても同様である。
【0030】
一方、照合した結果、負荷データがモデルデータと一致していない場合(ステップ130でN)、本実施の形態では、一致しなかった原因として外乱が発生したと仮定して、外乱消去処理を実行する(ステップ140)。
【0031】
図5は、本実施の形態における外乱消去処理を示したフローチャートであり、
図6(a)は、状態判定対象期間において範囲Dに外乱が発生した負荷データを示す図である。
図6(b)は、
図4(b)と同じ図であり、状態判定対象期間におけるモデルデータを示す図である。以下、外乱消去部121が実行する外乱消去処理について
図5及び
図6を用いて説明する。
【0032】
まず、外乱消去部121は、ログ情報蓄積部2から判定対象期間に含まれているログ情報を抽出し(ステップ141)、その抽出したログ情報の中から外乱に相当する事象の発生期間(外乱発生期間)を特定する(ステップ142)。機器をバッチ処理のみに利用するなど、つまり機器の動作に周期性や規則性がある場合、外乱としては、バッチ処理ではないユーザ操作やサーバ接続時のパケットの到着等が想定しうるが、抽出した判定対象期間内のログ情報を分析することによって外乱の発生期間を特定できる。例えば、ログ情報から外乱発生の原因としてユーザ操作が特定されると、そのユーザ操作に伴い発生した負荷変動の発生期間を外乱発生期間として特定する。ここでは、
図6(a)に例示したように、ログ情報を分析したことにより判定対象期間の始期から範囲Dの期間(外乱発生期間)で外乱が発生していることが特定されたとする。この場合、外乱消去部121は、負荷データ生成部11により生成された負荷データから外乱発生期間内の負荷変動を消去する(ステップ143)。この負荷変動を消去した後の負荷データを
図7に示す。
【0033】
以上のようにして、負荷データに現れた外乱による負荷変動を消去すると、データ照合部12は、負荷変動を消去した負荷データを、モデルデータと照合する。
【0034】
ここで、照合した結果、負荷データがモデルデータと一致していれば(ステップ150でY)、データ照合部12は、当該状態判定対象期間において、機器は正常な状態で動作していたと判定する(ステップ190)。なお、例えば、
図6(a)とは異なり、メモリ使用量の値がほぼ変化していない中盤から後半部分で外乱が発生していた場合、外乱消去部121により外乱を消去した後の負荷データは、モデルデータと一致するため、この時点で、機器は正常な状態で動作していたと判定されることになる。
【0035】
一方、照合した結果、負荷データがモデルデータと一致していない場合(ステップ150でN)、本実施の形態では、一致しなかった原因として外乱が発生したことにより負荷データに時間軸上のずれが発生していると仮定して、モデルデータと時間軸を合致させるためのデータ補正処理を実行する(ステップ160)。
【0036】
図8は、本実施の形態におけるデータ補正処理を示したフローチャートであり、
図9(a)は、この処理により補正した後の負荷データを示す図である。
図9(b)は、
図4(b)と同じ図であり、状態判定対象期間におけるモデルデータを示す図である。以下、負荷データ補正部122が実行するデータ補正処理について
図8及び
図9を用いて説明する。
【0037】
まず、負荷データ補正部122は、ログ情報蓄積部2から判定対象期間に含まれているログ情報を抽出し(ステップ161)、その抽出したログ情報の中から外乱に相当する事象の発生期間(外乱発生期間)を特定する(ステップ162)。この外乱発生期間を特定する処理(ステップ161,162)は、外乱消去処理における処理(ステップ141,142)と同じでよい。従って、外乱発生期間を特定する手段をデータ照合部12に別途設けて、外乱発生期間の特定処理を外乱消去部121及び負荷データ補正部122が共用できるようにソフトウェアを構成してもよい。
【0038】
続いて、負荷データ補正部122は、外乱消去部121により外乱が消去された負荷データからその外乱発生期間部分のデータを切除する補正を行う。具体的には、単に切除しただけでは、切除した外乱発生期間部分の負荷データは空白になってしまうので、モデルデータとの照合ができるように負荷データを補正して時間軸を合わせる。ここで、負荷データから外乱発生期間部分のデータを切除する補正というのは、次のことを意味する。
【0039】
外乱発生期間は、判定対象期間の先頭(始期から外乱発生期間長)に存在する場合と、途中に存在する場合と、最後(終期から外乱発生期間長)に存在する場合と、が考えられる。
【0040】
先頭に存在する場合、
図9(a)に示したように、先頭部分(外乱発生期間)の負荷データを切除すると共に、切除後の残された負荷データ全体を時間軸上、先頭方向にシフトすることで、モデルデータと負荷データの始期を合わせる。途中に存在する場合、外乱発生期間の負荷データを切除すると負荷データは分断されるので、負荷データの一部をシフトしてつなげればよい。すなわち、時間軸上、分断された右側の負荷データを左側にシフトして左側の負荷データと連結して1本の負荷パターンとする。最後に存在する場合、外乱発生期間の負荷データを単に切除すればよく、切除後の残された負荷データはシフト不要である。
【0041】
なお、複数の外乱が含まれることで、負荷データが3以上に分断される場合もあり得るが、前述したシフトを組み合わせて行うことで連続した負荷データに補正できる。なお、いずれの場合も、
図9(a)に表れているように、データ補正後の負荷データは、外乱発生期間の長さ分短くなる。従って、負荷データの終期近傍部分はモデルデータとの照合はできないので、その終期近傍部分は照合対象外とする。
【0042】
以上のようにして、負荷データを補正すると、データ照合部12は、負荷データ補正部122により外乱発生期間分切除した負荷データを、モデルデータと照合する。
【0043】
ここで、照合した結果、負荷データがモデルデータと一致していれば(ステップ170でY)、データ照合部12は、当該状態判定対象期間において、機器は正常な状態で動作していたと判定する(ステップ190)。
【0044】
一方、照合した結果、負荷データがモデルデータと一致していない場合(ステップ170でN)、データ照合部12は、当該状態判定対象期間において、機器は正常な状態で動作していないと判定する(ステップ180)。
【0045】
以上のようにして、機器の動作の状態を判定すると、表示部13は、ディスプレイ28に判定結果を表示する。あるいは、判定結果を、図示しないプリンタに印刷させたり、記憶手段にファイル形式にて保存させてもよい。
【0046】
本実施の形態では、負荷情報を判定対象期間で区切ることで生成された負荷データがモデルデータと一致しなかった場合、負荷データから外乱を消去したり、時間軸上、シフトするなどの補正をして、モデルデータと照合するようにした。このように、負荷データから外乱を消去するようにしたことで多種に及ぶ外乱に対応したモデルデータを数多く用意しておく必要がない。
【0047】
なお、本実施の形態では、外乱消去と負荷データのシフト補正の双方の処理を機器状態判定処理に含めるようにしたが、いずれか一方のみを含めるようにしてもよい。
【0048】
また、本実施の形態では、負荷情報としてメモリ使用量を用いた場合を例にしたが、CPU使用率等他の負荷情報を用いてもよい。また、単独の負荷情報ではなく、複数の負荷情報それぞれに基づき機器状態を判定し、それらの判定結果に基づき総合的に判定するようにしてもよい。更に、ある1日の機器の状態を判定する際に、その1日を判定対象期間として判定すると共に、その1日を含む1週間又は1月の少なくとも一方を判定対象期間として更に判定し、それらの判定結果に基づき総合的に判定するようにしてもよい。
【0049】
また、外乱発生期間の特定に用いる情報として、機器の動作に応じて発生するログ情報以外に、運用中の記録を利用するようにしてもよい。例えば、ビル管理システムでは、現地に出向いて行った作業を電子化して記録している。また、機器で実行するバッチ処理のスケジュール情報や実績情報も電子化されている。このように運用により得られたデータをログ情報の代わりに、あるいはログ情報と共に外乱発生期間の特定に用いるようにしてもよい。更に、外乱発生期間の特定に用いる情報として、機器を設置したシステムの信号情報を利用してもよい。例えば、エレベータ等の昇降機では、エレベータのかご内操作盤に対するユーザ操作により、戸開信号が変化するなどユーザ操作によって信号情報が変化する。この変化を外乱とみなすようにしてもよい。