特許第6095140号(P6095140)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECフィールディング株式会社の特許一覧

特許6095140遠隔監視システム、遠隔監視方法、及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6095140
(24)【登録日】2017年2月24日
(45)【発行日】2017年3月15日
(54)【発明の名称】遠隔監視システム、遠隔監視方法、及びプログラム
(51)【国際特許分類】
   G06F 11/07 20060101AFI20170306BHJP
   G06F 11/20 20060101ALI20170306BHJP
   G06F 13/00 20060101ALI20170306BHJP
【FI】
   G06F11/07 190
   G06F11/07 140A
   G06F11/20 620
   G06F13/00 351N
【請求項の数】9
【全頁数】29
(21)【出願番号】特願2015-536594(P2015-536594)
(86)(22)【出願日】2014年9月10日
(86)【国際出願番号】JP2014073887
(87)【国際公開番号】WO2015037603
(87)【国際公開日】20150319
【審査請求日】2016年3月10日
(31)【優先権主張番号】特願2013-188324(P2013-188324)
(32)【優先日】2013年9月11日
(33)【優先権主張国】JP
【前置審査】
(73)【特許権者】
【識別番号】000232140
【氏名又は名称】NECフィールディング株式会社
(74)【代理人】
【識別番号】100080816
【弁理士】
【氏名又は名称】加藤 朝道
(72)【発明者】
【氏名】落合 晋二
【審査官】 大塚 俊範
(56)【参考文献】
【文献】 特開2004−086719(JP,A)
【文献】 特開2003−242274(JP,A)
【文献】 特開2005−202597(JP,A)
【文献】 特開2004−118689(JP,A)
【文献】 橋向 博昭、他1名,リモート監視・保全技術の進展とネットワークセキュリティの視点,計装,日本,(有)工業技術社,2004年 7月 1日,第47巻,第7号,p.37-40
【文献】 福井 眞吾、他1名,分散並行オブジェクトを用いたネットワーク管理,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1994年11月24日,第94巻,第368号,p.83-90
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/07
G06F 11/30−11/36
G06F 11/20
G06F 13/00
(57)【特許請求の範囲】
【請求項1】
複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する障害監視装置と、
前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する障害解析装置と、
前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する障害管理装置と、
を備え、
前記障害監視装置、前記障害解析装置、及び前記障害管理装置の2以上が、互いに異なる前記監視対象装置に対する処理を並行して実行可能に構成され、
前記障害監視装置は、正系の障害監視装置及び副系の障害監視装置を含む2以上の障害監視装置で構成され、前記正系の障害監視装置及び前記副系の障害監視装置は、夫々前記障害検出情報を出力し、
前記障害解析装置は、前記正系の障害監視装置の異常を検出した場合に、前記正系の障害監視装置と前記副系の障害監視装置との間で、前記正系/副系の設定を切り替えるものとし、
前記障害解析装置は、前記正系の障害監視装置の異常を検出しない場合には、前記正系の障害監視装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の障害監視装置から送信された前記障害検出情報を使用しない遠隔監視システム。
【請求項2】
前記障害解析装置は、
複数の障害検出コマンドの実行結果に対応した障害対処方法を予め定めた障害情報データベースを備え、
前記障害監視装置から受信した障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して障害を復旧する障害対処方法を決定する、請求項1に記載の遠隔監視システム。
【請求項3】
前記障害情報データベースには各々の前記障害対処方法に対応した被疑部品情報がさらに定められており、
前記障害解析装置は前記障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して被疑部品情報を取得し、前記障害解析情報に前記被疑部品情報を付加し、
前記障害管理装置は前記受信された障害解析情報に含まれる被疑部品情報に基づいて被疑部品の手配の指示を送出する、請求項2に記載の遠隔監視システム。
【請求項4】
前記障害情報データベースには各々の前記障害対処方法に対応した保守員派遣要請情報がさらに定められており、
前記障害解析装置は前記障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して保守員派遣要請情報を取得し、前記障害解析情報に前記保守員派遣要請情報を付加し、
前記障害管理装置は前記受信された障害解析情報に含まれる保守員派遣要請情報に基づいて保守員の派遣を指示する通知を保守員端末に送信する、請求項2または3に記載の遠隔監視システム。
【請求項5】
前記障害管理装置は、
前記複数の監視対象装置の各々に対応した顧客端末のアドレスを記憶した顧客情報データベースを備え、
前記受信された障害解析情報に含まれる監視対象装置の情報を用いて前記顧客情報データベースを検索して前記監視対象装置に対応した顧客端末のアドレスを取得し、前記顧客端末のアドレスに前記監視対象装置の障害を通知する、請求項1乃至4のいずれか一に記載の遠隔監視システム。
【請求項6】
前記複数の障害監視装置は、夫々定期的に稼動通知情報を前記障害解析装置に送信するように設定され、
前記障害解析装置は、前記2以上の障害監視装置の各々から稼動通知情報を受信できるか否かを判定し、前記稼動通知情報を受信できない障害監視装置が異常であると検出する、請求項1乃至のいずれか一に記載の遠隔監視システム。
【請求項7】
前記障害監視装置は閉域IP(Internet Protocol)網を介して前記複数の監視対象装置からの障害検出コマンド実行結果を受信する、請求項1乃至のいずれか一に記載の遠隔監視システム。
【請求項8】
複数の監視対象装置にネットワークを介して障害検出コマンドを送信するステップと、
各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する判定ステップと、
前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する解析ステップと、
前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する管理ステップと、
を含み、
正系の装置及び副系の装置を含む2以上の装置が前記判定ステップを実行
前記正系の装置の異常が検出された場合に、前記正系の装置と前記副系の装置との間で、前記正系/副系の設定を切り替えるステップと、
前記正系の装置の異常が検出されない場合には、前記正系の装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の装置から送信された前記障害検出情報を使用しないステップと、
をさらに含み、
前記判定ステップ、前記解析ステップ、及び前記管理ステップの2以上が、並行して実行可能である遠隔監視方法。
【請求項9】
監視対象装置を監視する障害監視装置とネットワークを介して接続する、障害解析装置に実行させるプログラムであって、
障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び障害検出コマンドの実行結果を含む障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する解析処理、を前記障害解析装置に実行させ、
正系の前記障害監視装置及び副系の前記障害監視装置を含む2以上の前記障害監視装置が前記障害検出情報を出力
前記正系の前記障害監視装置の異常が検出された場合に、前記正系の前記障害監視装置と前記副系の前記障害監視装置との間で、前記正系/副系の設定を切り替える処理と、
前記正系の障害監視装置の異常が検出されない場合には、前記正系の障害監視装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の障害監視装置から送信された前記障害検出情報を使用しない処理とを、前記障害解析装置に実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願についての記載]
本発明は、日本国特許出願:特願2013−188324号(2013年9月11日出願)に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、遠隔監視システム、遠隔監視方法、及びプログラムに関する。特に、本発明は、監視対象装置における障害をネットワークを介して遠隔検出する技術に関する。
【背景技術】
【0002】
従来、顧客先に設置した情報処理装置等の障害を検出して保守管理するシステムにおいて、以下の2通りの方法が広く用いられている。第1の方法は、顧客の情報処理装置に監視モジュールを導入し、該監視モジュールが障害を検出し通知する方法である。第2の方法は、顧客ネットワーク内に障害監視装置を設置し、該障害監視装置が情報処理装置の障害を検出する方法である。
【0003】
しかしながら、第1の方法では、情報処理装置の外部から障害を検出することができないため、情報処理装置の異常停止等の障害を検出することができないという問題がある。また、第2の方法では、顧客ネットワーク内に障害監視装置を設置しなければならず、障害監視装置の導入費用が顧客の負担になるという問題がある。
【0004】
上記の問題を解消するため、例えば、特許文献1には、複数の顧客サイトに設置したコンピュータシステムを、ネットワークを介して保守管理センタの障害監視サーバにより障害を監視する保守管理システムが開示されている。該保守管理システムによれば、複数の顧客サイトから集められた障害情報を点数化し、点数の高低により障害の重要性や緊急度を定量評価して、保守部品の発送や保守員の手配に関する優先順位付けを一括して管理することが可能である。
【0005】
また、特許文献2には、複数の顧客システムとインターネットを介して接続された保守装置が開示されている。該保守装置は、各顧客システム内の装置の構成情報(型名、製造番号、版数等)の登録手段を有すると共に、その構成情報に基づいて遠隔診断を実行させることができる。また、該保守装置は診断結果に異常を検出した場合に、保守員を自動的に呼び出すこともできる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2003−241999号公報
【特許文献2】特開2003−345622号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記の特許文献の全開示内容は、本書に引用をもって繰り込み記載されているものとする。以下の分析は、本発明の観点から与えられる。
【0008】
特許文献1、2で開示された保守管理システムにおいて、特許文献2の図4のように複数の顧客システムに対する診断実行を互いに時間間隔を空けて実施する場合には、それぞれの障害検出、障害解析、及び障害対策を所望の処理能力で実行することが可能である。しかしながら、例えば地震等の緊急時には、複数の顧客システムに対して、障害検出、障害解析、及び障害対策を一斉に実行することが要求される。そのような場合に、特許文献1、2で開示された保守管理システムでは、処理能力が不足する虞がある。
【0009】
そこで、本発明は、複数の監視対象装置に対する障害検出、障害解析、及び障害対策の処理能力の向上に貢献しうる遠隔監視システムを提供することを目的とする。
【課題を解決するための手段】
【0010】
第1の視点による遠隔監視システムは、以下の障害監視装置、障害解析装置、及び障害管理装置を含む。該障害監視装置は、複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する。また、該障害解析装置は、前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する。また、該障害管理装置は、前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する。ここで、前記障害監視装置、前記障害解析装置、及び前記障害管理装置の2以上が、互いに異なる前記監視対象装置に対する処理を並行して実行可能に構成される。また、前記障害監視装置は、正系の障害監視装置及び副系の障害監視装置を含む2以上の障害監視装置で構成され、前記正系の障害監視装置及び前記副系の障害監視装置は、夫々前記障害検出情報を出力する。さらに、前記障害解析装置は、前記正系の障害監視装置の異常を検出した場合に、前記正系の障害監視装置と前記副系の障害監視装置との間で、前記正系/副系の設定を切り替える。さらに、前記障害解析装置は、前記正系の障害監視装置の異常を検出しない場合には、前記正系の障害監視装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の障害監視装置から送信された前記障害検出情報を使用しない。
【0011】
第2の視点による遠隔監視方法は、以下のステップを含む。即ち、該遠隔監視方法は、複数の監視対象装置にネットワークを介して障害検出コマンドを送信するステップを含む。また、該遠隔監視方法は、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する判定ステップを含む。また、該遠隔監視方法は、前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する解析ステップを含む。さらに、該遠隔監視方法は、前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する管理ステップを含む。さらに、正系の装置及び副系の装置を含む2以上の装置が前記判定ステップを実行する。さらに、該遠隔監視方法は、前記正系の装置の異常が検出された場合に、前記正系の装置と前記副系の装置との間で、前記正系/副系の設定を切り替えるステップをさらに含む。さらに、該遠隔監視方法は、前記正系の装置の異常が検出されない場合には、前記正系の装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の装置から送信された前記障害検出情報を使用しないステップを含む。ここで、前記判定ステップ、前記解析ステップ、及び前記管理ステップの2以上が、並行して実行可能である。
本方法は、障害を監視する障害監視装置、障害を解析する障害解析装置、及び障害を管理する障害管理装置という特定の機械に結び付けられている。
【0012】
第3の視点によるプログラムは、複数の監視対象装置の障害を検出するプログラムであって、以下の処理をコンピュータに実行させる。即ち、該プログラムは、複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を、前記障害検出情報を用いて障害を復旧する障害対処方法を決定する装置に出力する処理、をコンピュータに実行させる。
また、他の視点によるプログラムは、監視対象装置を監視する障害監視装置とネットワークを介して接続する、障害解析装置に実行させるプログラムであって、以下の処理を前記障害解析装置に実行させる。即ち、該プログラムは、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び障害検出コマンドの実行結果を含む障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する解析処理、を前記障害解析装置に実行させる。さらに、正系の前記障害監視装置及び副系の前記障害監視装置を含む2以上の前記障害監視装置が前記障害検出情報を出力する。さらに、該プログラムは、前記正系の前記障害監視装置の異常が検出された場合に、前記正系の前記障害監視装置と前記副系の前記障害監視装置との間で、前記正系/副系の設定を切り替える処理を、前記障害解析装置に実行させる。さらに、該プログラムは、前記正系の障害監視装置の異常が検出されない場合には、前記正系の障害監視装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の障害監視装置から送信された前記障害検出情報を使用しない処理を、前記障害解析装置に実行させる。
なお、これらのプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。これらの発明は、コンピュータプログラム製品として具現することも可能である。
【発明の効果】
【0013】
遠隔監視システムによれば、複数の監視対象装置に対する障害検出、障害解析、及び障害対策の処理能力の向上に貢献しうる遠隔監視システムを提供することができる。
【図面の簡単な説明】
【0014】
図1】一実施形態に係る遠隔監視システムを適用した場合の全体構成を示すブロック図である。
図2】一実施形態に係る遠隔監視システムの動作を示すシーケンスチャートである。
図3】第1の実施形態に係る遠隔監視システムを適用した場合の全体構成を示すブロック図である。
図4】第1の実施形態に係る遠隔監視システムにおける障害監視装置の機能構成を示す図である。
図5】第1の実施形態に係る遠隔監視システムにおける障害解析装置の機能構成を示す図である。
図6】第1の実施形態に係る遠隔監視システムにおける障害管理装置の機能構成を示す図である。
図7】第1の実施形態に係る遠隔監視システムにおける障害監視装置の動作を示すフローチャートである。
図8】第1の実施形態に係る遠隔監視システムにおける障害解析装置の動作を示すフローチャートである。
図9】第1の実施形態に係る遠隔監視システムにおける障害管理装置の動作を示すフローチャートである。
図10図9に続くフローチャートである。
図11】第1の実施形態において、障害監視装置の系切り替えが発生する場合の障害監視装置のフローチャートである。
図12】第1の実施形態において、障害監視装置の系切り替えが発生する場合の障害解析装置のフローチャートである。
図13】第1の実施形態に係る遠隔監視システムにおける障害監視装置の障害検出対象装置データベースの一例である。
図14】第1の実施形態に係る遠隔監視システムにおける障害監視装置の障害検出項目データベースの一例である。
図15】第1の実施形態に係る遠隔監視システムにおける障害監視装置のデータ転送先データベースの一例である。
図16】第1の実施形態に係る遠隔監視システムにおける障害解析装置の監視対象装置情報データベースの一例である。
図17】第1の実施形態に係る遠隔監視システムにおける障害解析装置の障害情報データベースの一例である。
図18】第1の実施形態に係る遠隔監視システムにおける障害解析装置の障害監視装置冗長構成情報データベースの一例である。
図19】第1の実施形態に係る遠隔監視システムにおける障害監視装置の障害管理データベースの一例である。
図20】第1の実施形態に係る遠隔監視システムにおける障害監視装置の顧客情報データベースの一例である。
図21】第1の実施形態に係る遠隔監視システムにおける障害監視装置の社員情報データベースの一例である。
図22】第1の実施形態に係る遠隔監視システムにおける障害監視装置の作業予定データベースの一例である。
図23】第2の実施形態に係る遠隔監視システムを適用した場合の全体構成を示すブロック図である。
図24】第2の実施形態に係る遠隔監視システムの動作を示すシーケンスチャートである。
図25】比較例1に係る遠隔監視システムを適用した場合の全体構成を示すブロック図である。
図26】比較例1に係る遠隔監視システムの動作を示すシーケンスチャートである。
【発明を実施するための形態】
【0015】
まず、一実施形態の概要について説明する。なお、実施形態の概要の説明において付記した図面参照符号は専ら理解を助けるための例示であり、図示の態様に限定することを意図するものではない。
【0016】
一実施形態における遠隔監視システム1は、図1に示すように、以下の障害監視装置100、障害解析装置200、及び障害管理装置300を含む。該障害監視装置100は、複数の監視対象装置10a〜bにネットワーク2を介して障害検出コマンド3a〜bを送信し、各々の監視対象装置で実行された障害検出コマンドの実行結果4a〜bを受信して各々の監視対象装置10a〜bの障害の有無を判定し、障害があると判定された監視対象装置に関して監視対象装置の情報(10aに対応するA0001;図1(B)参照)及び障害検出コマンドの実行結果4a〜bを含む障害検出情報5a〜bを出力する。また、該障害解析装置200は、障害検出情報5a〜bを受信し、受信された障害検出情報5a〜bに含まれる障害検出コマンドの実行結果4a〜bを解析して障害を復旧する障害対処方法を決定し、監視対象装置の情報及び障害対処方法(6aに含まれる7a;図1(C)参照)を含む障害解析情報6a〜bを出力する。また、該障害管理装置300は、障害解析情報6a〜bを受信し、受信された障害解析情報6a〜bに含まれる障害対処方法(6aに含まれる7a;図1(C)参照)の実行を管理する。ここで、図2に示すように、障害監視装置100、障害解析装置200、及び障害管理装置300の2以上が、互いに異なる監視対象装置10a〜bに対する処理を並行して実行可能に構成される(図2に示すように、期間TAにおいて障害監視装置100と障害解析装置200、期間TBにおいて障害解析装置200と障害管理装置300、が夫々並行して実行されている)。
【0017】
上記の構成により、複数の監視対象装置10a〜bに対して遠隔で障害検出、障害解析、及び障害対策を行う遠隔監視システム1において、遠隔監視システム1を構成する障害監視装置100、障害解析装置200、及び障害管理装置300の2以上が処理を並行して実行可能に構成される。従って、全体として処理能力が向上した遠隔監視システムを提供することが可能になる。
【0018】
上記の遠隔監視システムにおいて、障害解析装置200は、複数の障害検出コマンドの実行結果に対応した障害対処方法を予め定めた障害情報データベース(図5の205)を備えることが好ましい。そして、障害解析装置200は、障害監視装置100から受信した障害検出情報5a〜bに含まれる障害検出コマンドの実行結果4a〜bを用いて障害情報データベース(図5の205)を検索して障害を復旧する障害対処方法(図1(C)の7a等)を決定するようにしてもよい。
【0019】
上記の遠隔監視システムにおいて、障害情報データベース(図5図17の205)には各々の障害対処方法に対応した被疑部品情報9がさらに定められていることが好ましい。そして、障害解析装置200は障害検出情報5a〜bに含まれる障害検出コマンドの実行結果4a〜bを用いて障害情報データベース(図5の205)を検索して被疑部品情報9a〜bを取得し、障害解析情報6a〜bに被疑部品情報9a〜bを付加し、障害管理装置300は受信された障害解析情報6a〜bに含まれる被疑部品情報9a〜bに基づいて被疑部品の手配の指示を送出するようにしてもよい。
【0020】
上記の遠隔監視システムにおいて、障害情報データベース(図5図17の205)には各々の障害対処方法に対応した保守員派遣要請情報19がさらに定められていることが好ましい。そして、障害解析装置200は障害検出情報5a〜bに含まれる障害検出コマンドの実行結果4a〜bを用いて障害情報データベース(図5の205)を検索して保守員派遣要請情報19a〜bを取得し、障害解析情報6a〜bに保守員派遣要請情報19a〜bを付加し、障害管理装置300は受信された障害解析情報6a〜bに含まれる保守員派遣要請情報19a〜bに基づいて保守員の派遣を指示する通知を保守員端末22aに送信するようにしてもよい。
【0021】
上記の遠隔監視システムにおいて、障害管理装置300は、複数の監視対象装置10a〜bの各々に対応した顧客端末20a〜bのアドレスを記憶した顧客情報データベース(図6図20の208)を備えることが好ましい。そして、障害管理装置300は、受信された障害解析情報(例えば、6a)に含まれる監視対象装置の情報(図1(B)のA0001)を用いて顧客情報データベース(図6図20の208)を検索して監視対象装置10aに対応した顧客端末20aのアドレスを取得し、顧客端末20aのアドレスに監視対象装置10aの障害を通知するようにしてもよい。
【0022】
上記の遠隔監視システムにおいて、図3に示すように、障害監視装置は、正系の障害監視装置100m及び副系の障害監視装置100sを含む2以上の障害監視装置で構成されることが好ましい。ここで、障害解析装置200は、正系の障害監視装置100mの異常を検出した場合に、正系の障害監視装置100mと副系の障害監視装置100sとの間で、正系/副系の設定を切り替え、障害解析装置200は、正系の障害監視装置から送信された障害検出情報を使用して障害対処方法を決定し、副系の障害監視装置から送信された障害検出情報を使用しないことが好ましい。
【0023】
上記の遠隔監視システムにおいて、上記の複数の障害監視装置(100m、100s等)は、夫々定期的に稼動通知情報8a〜bを障害解析装置200に送信するように設定され、障害解析装置200は、2以上の障害監視装置(100m、100s等)の各々から稼動通知情報8a〜bを受信できるか否かを判定し、稼動通知情報を受信できない障害監視装置が異常であると検出するようにしてもよい。
【0024】
上記の遠隔監視システムにおいて、図3に示すように、障害監視装置(100m、100s)は閉域IP(Internet Protocol)網50を介して複数の監視対象装置(10a〜b)からの障害検出コマンド実行結果4a〜bを受信することが好ましい。
【0025】
一実施形態における遠隔監視方法は、図1図2のいずれかに示すように、以下のステップを含む。即ち、該遠隔監視方法は、複数の監視対象装置10a〜bにネットワーク2を介して障害検出コマンド3a〜bを送信するステップを含む。また、該遠隔監視方法は、各々の監視対象装置10a〜bで実行された障害検出コマンドの実行結果4a〜bを受信して各々の監視対象装置10a〜bの障害の有無を判定し、障害があると判定された監視対象装置に関して監視対象装置の情報及び障害検出コマンドの実行結果4a〜bを含む障害検出情報5a〜bを出力する判定ステップ(S100a、S100b)を含む。また、該遠隔監視方法は、障害検出情報5a〜bを受信し、受信された障害検出情報5a〜bに含まれる障害検出コマンドの実行結果4a〜bを解析して障害を復旧する障害対処方法を決定し、監視対象装置の情報及び障害対処方法を含む障害解析情報6a〜bを出力する解析ステップ(S101a、S101b)を含む。さらに、該遠隔監視方法は、障害解析情報6a〜bを受信し、受信された障害解析情報6a〜bに含まれる障害対処方法の実行を管理する管理ステップ(S102a、S102b)を含む。ここで、判定ステップ、解析ステップ、及び管理ステップの2以上が、並行して実行可能である(図2では、判定ステップS100bと解析ステップS101a、解析ステップS101bと管理ステップS102aが夫々並行して実行されている)。
【0026】
以下、各実施形態について、図面を参照して詳しく説明する。
【0027】
[第1の実施形態]
(第1の実施形態の構成)
第1の実施形態の構成について、図3図6を参照しながら詳細に説明する。図3は、第1の実施形態に係る遠隔監視システム11の全体構成を示すブロック図である。図3に示すように、遠隔監視システム11は、複数の顧客サイト(顧客サイトA、顧客サイトB等)に夫々設置された監視対象装置10a〜bを遠隔監視システム11が設置された監視センタから遠隔で監視する装置である。ここで、監視対象装置10a〜bは、例えば、サーバ、ネットワーク機器、PC(Personal Computer)等の情報処理装置である。
【0028】
ここで、各顧客サイトの顧客は、自社ネットワーク内に監視用設備の設置を望まずに、遠隔監視システム11を提供する業者に対して自社内の情報処理装置の保守管理を依頼している。監視センタの遠隔監視システム11は、図3に示すように、2つの障害監視装置100m、100s、障害解析装置200、及び障害管理装置300により構成される。上記4つの装置は、いずれも中央処理装置CPU(Central Processing Unit)が搭載されたサーバ機器である。以降、障害監視装置は、正系/副系の区別しない場合は単に「障害監視装置」という。
【0029】
障害監視装置(100m、100s)は、閉域IP網50を介して監視対象装置10a〜bの障害検出を行い、監視対象装置10a〜bから異常を検出した場合、障害検出情報5a〜bを障害解析装置200に通知する機能を有している。閉域IP網50としては、例えば、VPN(Virtual Private Network)等が適用可能である。尚、障害監視装置は、正系の障害監視装置100m及び副系の障害監視装置100sによる冗長構成になっている。
【0030】
障害解析装置200は、障害監視装置(100m、100s)から通知された障害検出情報5a〜bについて解析を行い、解析結果を障害解析情報6a〜bとして障害管理装置300に通知する機能を有している。ここで、障害検出情報5a及び障害解析情報6aは、監視対象装置10aに対応し、障害検出情報5b及び障害解析情報6bは、監視対象装置10bに対応している。
【0031】
障害監視装置(100m、100s)は、一方が正系、他方が副系の障害監視装置として機能する。図3では、障害監視装置100m、障害監視装置100sが夫々正系の障害監視装置、副系の障害監視装置として設定されている。障害解析装置200は、正系の障害監視装置100mから転送された障害検出情報5a〜bのみを解析の対象とする。但し、障害解析装置200が正系の障害監視装置100mの異常を検出した場合は、正系/副系を切り替える。即ち、副系の障害監視装置であった100sが正系に切り替わり、正系の障害監視装置であった100mが副系に切り替わる。
【0032】
障害管理装置300は、障害解析装置200から転送された障害解析情報6a〜bを基に、顧客端末20a〜bへ障害内容の通知、保守員への出動指示の通知、及び保守部品(被疑部品)の選定を行う機能を有している。
【0033】
(障害監視装置の構成)
次に、図4を参照しながら、障害監視装置(100m、100s)の構成について詳細に説明する。障害監視装置(100m、100s)は、システム障害検出部101、障害検出情報作成部102、稼動通知情報定期作成部103、及びデータ転送部104を備えている。上記の各部は、障害監視装置が備えたCPUにより実行されるソフトウェアモジュールである。また、障害監視装置(100m、100s)は、データベースとして障害検出対象装置DB201、障害検出項目DB202、及びデータ転送先DB203を備えている(ここで、DBはデータベースの略。以下、同じ)。上記のデータベースは、障害監視装置の記憶部(不図示)に格納される。
【0034】
システム障害検出部101は、障害検出対象装置DB(図13の201)を参照し、障害検出コマンド3a〜bを実行する監視対象装置10a〜bのIPアドレス、及び監視対象装置コード(監視対象装置を特定するための一意コード)を取得する。
【0035】
そして、システム障害検出部101は、障害検出対象装置DB201から取得した監視対象装置のIPアドレスに対して、閉域IP網50を介し、障害検出項目DB(図14の202)から取得した障害検出用コマンド3a〜bを送信する。そして、各監視対象装置10a〜bで実行された障害検出用コマンドの実行結果4a〜bを受信する。受信された障害検出用コマンドの実行結果4a〜bは、障害検出項目DB202の障害判定閾値と比較すること等により、正常か異常かの判定を行う。異常と判定した場合は、障害検出項目DB202の障害コードを取得する。
【0036】
次に、取得済みの各種情報(障害検出用コマンド実行日時、監視対象装置のIPアドレス、監視対象装置コード、障害検出用コマンドの実行結果4a〜b、障害コード)を引数として、障害検出情報作成部102を起動する。障害検出情報作成部102は、所定のディレクトリに障害検出情報5a〜bのファイルを作成する。
【0037】
稼動通知情報定期作成部103については、図11図12のフローチャートを説明するときに後述することとする。
【0038】
データ転送部104は、障害解析装置200に障害検出情報5a〜bを転送する機能を有している。データ転送部104は、所定のディレクトリに障害検出情報作成部102で作成された障害検出情報5a〜bのファイルが存在するか否かを判定し、存在する場合、データ転送先DB(図15の203)を参照し、転送先となる障害解析装置200のIPアドレスを取得する。そして、データ転送部104は、障害解析装置200のIPアドレスに対し、障害検出情報5a〜bの転送を実行する。転送された障害検出情報5a〜bは、障害解析装置200の所定のディレクトリに保存される。
【0039】
障害検出対象装置DB201は、図13に示すように、監視対象装置を管理するためのデータベースである。障害検出対象装置DB201は、監視対象装置(10a〜b等)のIPアドレス、監視対象装置コードを有している。障害検出対象装置DB201は、システム障害検出部101が閉域IP網50を介し、障害検出コマンド3a〜bを実行する装置を特定するために使用される。
【0040】
障害検出項目DB202は、図14に示すように、障害検出コマンド3a〜b及び障害検出コマンドの実行結果4a〜bの判定に使用する情報を管理するためのデータベースである。障害検出項目DB202は、監視対象装置コード、障害検出コマンド、障害判定閾値、障害コードを有している。障害検出項目DB202は、閉域IP網50を介して送信する障害検出コマンド3a〜bの取得、障害判定閾値の取得、及び障害コードを取得するために使用される。
【0041】
データ転送先DB203は、図15に示すように、作成された障害検出情報5a〜bの転送先を管理する。データ転送先DB203は、データ転送部104が障害検出情報5a〜bを障害解析装置200に転送する際に使用される。尚、データ転送先DB203は、稼動通知情報8a〜bを転送する際にも同様に使用される(詳細は後述する)。
【0042】
(障害解析装置の構成)
次に、図5を参照しながら、障害解析装置200の構成について詳細に説明する。障害解析装置200は、データ解析部105、稼動通知情報監視部106、障害監視装置系切り替え部107、及びデータ転送部108を備えている。上記の各部は、障害解析装置200が備えたCPUにより実行されるソフトウェアモジュールである。また、障害解析装置200は、データベースとして、監視対象装置情報DB204、障害情報DB205、及び障害監視装置冗長構成情報DB206を備えている。
【0043】
データ解析部105は、障害監視装置(100m等)から転送された障害検出情報5a〜bを解析し、障害が発生した装置情報の特定、障害対処方法の決定、現地作業の要否の判定、及び被疑部品の特定を行う機能を有している。データ解析部105は、所定のディレクトリに障害監視装置(100m等)から転送された障害検出情報5a〜bのファイルが存在するか否かを判定する。障害検出情報5a〜bのファイルが存在しない場合は終了し、存在する場合は障害検出情報5a〜bを参照し、障害検出情報5a〜bに記載された各種情報(障害検出用コマンド実行日時、監視対象装置のIPアドレス、監視対象装置コード、障害検出用コマンドの実行結果4a〜b、障害コード)を取得する。また、データ解析部105は障害検出情報5a〜bが正系の障害監視装置から送信されたものか、副系の障害監視装置から送信されたものかの判定を行う(詳細は後述)。
【0044】
データ解析部105は、障害検出情報5a〜bが正系から送信されたものであると判定した場合には、障害検出情報5a〜bから取得した監視対象装置コードをキーとして監視対象装置情報DB(図16の204)を検索し、監視対象装置の情報(装置型番、製品名)を取得する。
【0045】
続いて、データ解析部105は、所得した監視対象装置コードと、障害コードをキーとして障害情報DB(図17の205)を検索し、障害対処方法、現地作業の要否、及び被疑部品コード(被疑部品を特定するための一意のコード)を取得する。続いて、データ解析部105は、上記の取得した情報(障害検出用コマンド実行日時、監視対象装置のIPアドレス、監視対象装置コード、障害検出用コマンドの実行結果4a〜b、障害コード、監視対象装置の情報(装置型番、製品名)、障害対処方法、現地作業の要否、被疑部品コード)を基に、所定のディレクトリに障害管理装置300に転送する障害解析情報6a〜bのファイルを作成する。
【0046】
稼動通知情報監視部106及び障害監視装置系切り替え部107についての詳細は、図11図12のフローチャートを説明するときに後述する。
【0047】
次に、データ転送部108はデータ解析部105が作成した障害解析情報6a〜bのファイルを障害管理装置300に転送する機能を有している。データ転送部108は、所定のディレクトリ内に障害解析情報6a〜bのファイルの有無を判定する。障害解析情報6a〜bのファイルが存在しない場合は終了する。障害解析情報6a〜bのファイルが存在する場合、障害解析情報6a〜bのファイルを障害管理装置300に転送する。
【0048】
障害対象装置情報DB204は、図16に示すように、監視対象装置を特定するために使用するデータベースであり、監視対象装置コード、監視対象装置の型番及び製品名を管理する。障害対象装置情報DB204は、データ解析部105が障害検出情報5a〜bのファイルから取得した監視対象装置コードをキーとして監視対象装置に関する情報を取得する際に使用される。
【0049】
障害情報DB205は、図17に示すように、発生した障害の情報を管理するためのデータベースであり、監視対象装置コード、障害コード、障害対処方法、被疑部品コード(被疑部品情報)、及び現地作業の要否(保守員派遣要請情報)を管理する。障害情報DB205は、データ解析部105が障害検出情報5a〜bから取得した監視対象装置コード、障害コードをキーとして、障害対処方法、現地作業の要否、被疑部品コードを取得するために使用される。尚、障害監視装置冗長構成情報DB(図18の206)については、後述する。
【0050】
(障害管理装置の構成)
次に、図6を参照しながら、障害管理装置300の構成について詳細に説明する。障害管理装置300は、メール送信部109、保守員出動指示部110、保守部品手配部111を備えている。上記の各部は、障害管理装置300が備えたCPUにより実行されるソフトウェアモジュールである。また、障害管理装置300は、データベースとして、障害管理DB207、顧客情報DB208、社員情報DB209、及び作業予定DB210を備えている。
【0051】
メール送信部109は、遠隔監視システム11が検出した障害に関する情報を、インターネット60を介し、顧客端末20a〜bに送信する機能を有している。メール送信部109は定期的に障害管理DB(図19の207)を参照し、メール送信済みフラグ情報が未実施である障害情報の有無を判定する。そして、メール送信が未実施である障害情報が存在する場合は、障害管理DB207からメール送信が未実施である障害情報についての各種情報(障害検出用コマンド実行日時、監視対象装置のIPアドレス、監視対象装置コード、障害検出用コマンドの実行結果4a〜b、障害コード、監視対象装置の情報(装置型番、製品名)、障害対処方法、現地作業の要否、被疑部品コード)を取得し、取得した該情報に基づいて障害情報を通知するメールを作成する。
【0052】
続いて、メール送信部109は、監視対象装置コードをキーとして顧客情報DB(図20の208)を検索してメールの送信先アドレスを取得し、メール送信を行う。メール送信部109は、メール送信が終了した際に、障害管理DB(図19の207)内の当該障害情報に対応したメール送信済みフラグを「1」に設定する。
【0053】
保守員出動指示部110は、障害の対処として現地作業が必要となる場合、現地(顧客サイト)に派遣する保守員を自動的にアサインする機能である。保守員出動指示部110は、定期的に障害管理DB207を参照し、現地作業の要否が要であり(即ち、データが「1」の場合)、且つ、保守員要請済みフラグが未実施(即ち、データが「0」)である障害情報の有無を判定する。上記の条件に該当する障害情報の登録が存在しない場合は終了する。該当する障害情報が存在する場合、監視対象装置コードをキーとして顧客情報DB(図20の208)を検索して対応する顧客の情報(保守拠点コード、顧客名、顧客住所、顧客電話番号)を取得する。続いて、取得した保守拠点コードをキーとして社員情報DB(図21の209)を検索し、担当拠点に所属する社員の情報(社員コード、社員名、保守員メールアドレス)を取得する。
【0054】
続いて、保守員出動指示部110は、作業予定DB(図22の210)を参照し、作業予定が登録されていない社員に作業予定情報(監視対象装置コード、社員コード、社員名、作業開始日時)を登録し、作業予定を登録した社員のメールアドレスに上記作業予定情報をメールにて通知する。続いて、保守員出動指示部110は、障害管理DB(図19の207)内の該当する障害情報に保守員要請済みフラグを設定する(データを「1」にする)。
【0055】
次に、障害管理DB207において該当する障害情報に被疑部品コードの登録が存在する場合は、監視対象装置コード、装置型番、被疑部品コードを引数として保守部品手配部111を起動する。保守部品手配部111は、障害復旧のために必要となる被疑部品コードに対応した保守部品を顧客サイトに送付するための機能を有している。保守部品手配部111は、監視対象装置コードをキーとして顧客情報DB(図20の208)を検索し、部品送付先の顧客情報(顧客名、顧客住所、顧客電話番号)を取得する。そして、保守部品手配部111は、保守部品倉庫端末21に上記顧客住所に被疑部品コードに対応する保守部品を配送する指示を通知するメールを送信する。
【0056】
障害管理DB207は、図19に示すように、障害情報を管理するためのデータベースであり、監視対象装置コード、障害検出コマンド実行日時、装置型番、製品名、監視対象装置IPアドレス、障害検出コマンドの実行結果4a〜b、障害監視システムコード、障害コード、障害対処方法、現地作業要否、被疑部品コード、メール送信済みフラグ、保守員要請済みフラグを管理する。障害管理DB207は、メール送信部109が顧客端末20a〜bに対して送信するメールの作成時、保守員出動指示部110が保守員の予定登録を実施する時、及び保守部品手配部111が保守部品の登録を行う時に参照される。
【0057】
顧客情報DB208は、図20に示すように、顧客情報を管理するためのデータベースであり、監視対象装置コード、保守拠点コード、顧客名、顧客住所、顧客電話番号、顧客メールアドレスを管理する。顧客情報DB208は、保守員出動指示部110が保守員の出動先情報を取得する際、及び保守部品手配部111が保守部品送信先情報を取得する際に使用される。
【0058】
社員情報DB209は、図21に示すように、社員情報(保守員)を管理するためのデータベースであり、保守拠点コード、社員コード、社員名、保守員メールアドレスを管理する。社員情報DB209は、保守員出動指示部110が障害発生装置の保守拠点に属する保守員情報を取得する際に使用される。
【0059】
作業予定DB210は、図22に示すように、作業予定を管理するためのデータベースであり、監視対象装置コード、社員コード、社員名、作業開始日時を管理する。作業予定DB210は、保守員出動指示部110が現地作業指示を行う際に使用される。
【0060】
(第1の実施形態の動作)
次に、第1の実施形態の動作について、図2を参照しながら説明する。図2は、図3に示した第1の実施形態の動作を示すシーケンスチャートである(即ち、図2は、図1図3の構成に対する共通のシーケンスチャートである)。図2において、遠隔監視システム11は、2つの顧客サイトに設置した監視対象装置10a〜bの障害検出を一斉に実施する場合を想定している。尚、一斉に障害検出を開始する監視対象装置の数は、2に限定されず、任意数が適用可能である。また、正系の障害監視装置として、100mが設定されているものとする。
【0061】
図2において、障害監視装置100mから2つの障害対象装置10a〜bに対して、夫々障害検出コマンド3a〜bが連続して送信される。障害対象装置10a〜bは、夫々障害検出コマンド3a〜bを受けて、障害検出コマンド3a〜bに対応する診断処理を実行する。障害対象装置10aは、診断処理が終了すると障害検出コマンドの実行結果4aを障害監視装置100mに送信する。障害検出コマンドの実行結果4aは、診断処理におけるログ情報である。ここで、ログ情報は監視対象装置10aで収集した情報を全て含んでいてもよいし、障害解析に有効なものだけを抽出した情報であってもよい。或いは、障害検出コマンドの実行結果4aは、単に障害検出コマンド3a〜bの実行結果の正常/異常を表すものであってもよい。同様に、監視対象装置10bは診断処理が終了すると障害検出コマンドの実行結果4bを障害監視装置100mに送信する。
【0062】
障害監視装置100mは、障害検出コマンドの実行結果4aを受信すると、それに対応して障害検出コマンドの実行結果4aの判定(S100a)、及び障害検出情報5aの送信を行う。次に、障害解析装置200は、障害検出情報5aを受信し、障害検出情報5aの解析(S101a)、及び障害解析情報6aの送信を行う。次に、障害管理装置300は、障害解析情報6aを受信し、障害解析情報6aによる管理(S102a)を行う。同様に、障害検出コマンドの実行結果4bに対応して、障害監視装置100m、障害解析装置200、及び障害管理装置300は夫々、判定(S100b)、解析(S101b)、及び管理(S102b)の処理を行う。ここで、図2に示すように、遠隔監視システム11は、障害監視装置100m、障害解析装置200、及び障害管理装置300の3つの装置の夫々に判定、解析、管理の3つの処理を分担して実行させるように構成している。これにより、図2の期間TAでは、障害監視装置100mによる判定(S100b)と障害解析装置200による解析(S101a)とを並行して実行することが可能である。また、期間TBでは、障害解析装置200による解析(S101b)と障害管理装置300による管理(S102a)とを並行して実行することが可能である。このように、遠隔監視システム11内では、2以上の装置を並行動作させることにより全体の処理能力の向上を図っている。
【0063】
次に、図7を参照しながら、図2で示した障害監視装置100mの動作についてより詳細に説明する。図7は、第1の実施形態に係る遠隔監視システム11における障害監視装置100mの動作を示すフローチャートであり、監視対象装置10aのみに対する障害監視装置100mの動作を示している。尚、以下の動作説明において、前述した障害監視装置の構成で説明した内容と重複する説明を省略することがある。
【0064】
図7において、ステップA1〜A4は、システム障害検出部101を起動すると共に、監視対象装置10aに対して障害検出コマンド3aを送信している部分である。具体的には、障害検出対象装置DB(図13の201)を参照して、監視対象装置コードA0001、及びそのIPアドレス10.0.0.1を取得する。次に、監視対象装置コードA0001をキーとして障害検出項目DB(図14の202)を検索する。図14において監視対象装置コードA0001に対応する3つのコマンドTestCommand001_1、TestCommand001_2、TestCommand001_3を取得し、これらを障害検出コマンド3aとして監視対象装置10aに送信している。近年、情報処理装置が多機能化しテスト内容が多岐に亘るため、障害検出コマンド3aが複数のコマンドを含む傾向にある。
【0065】
次に、図7のステップA5〜A12は、図2の判定(S100a)に相当する部分である。ステップA5において、障害検出コマンドの実行結果4aを受信する。障害検出コマンドの実行結果4aは、例えば、上記した3つのコマンドTestCommand001_1、TestCommand001_2、TestCommand001_3の各々に対するログ情報である。ステップA6は、各ログ情報から障害検出コマンドの実行結果4aが正常であると判定した場合には処理を終了する。一方、障害検出コマンドの実行結果4aが異常であると判定した場合には、以下のステップA7〜A12を実行する。
【0066】
ここで、ステップA6において、上記した3つのコマンドの実行結果に対し、図14に示すように障害判定閾値val001_1、val001_2、val001_3が定められている場合には、各コマンドの実行結果と対応する障害判定閾値が比較され、各コマンドの実行結果の正常/異常が判定される。或いは、障害判定閾値に代わって各コマンドの実行結果の期待値が定められ、該期待値との一致/不一致によって各コマンドの実行結果の正常/異常が判定される場合もある。
【0067】
ステップA7〜A8によって生成される障害検出情報5aは、前述したように、障害検出用コマンド実行日時、監視対象装置のIPアドレス、監視対象装置コード、障害検出用コマンドの実行結果4a、障害コードを含んでいる。ここで、障害検出用コマンドの実行結果4aが大容量のログ情報を含む場合には、障害検出情報5aに書き込む障害検出用コマンドの実行結果4aは、ログ情報のファイル名のみを登録するようにし、該ログ情報のファイルを、別途、障害解析装置200に転送するようにしてもよい。また、障害検出情報5aの障害コードは、図14に示すように各コマンドに対応して定義される。例えば、TestCommand001_1、TestCommand001_2、TestCommand001_3の実行結果が異常の場合、夫々の障害コードとして、SG001_1、SG001_2、SG001_3が定義される。
【0068】
ステップA9〜A12は、生成された障害検出情報5aを障害解析装置200に転送する処理を行っている部分である。ここで、ステップA11では、データ転送先DB(図15の203)を参照して、障害解析装置200のIPアドレス192.168.0.1を取得している。
【0069】
次に、図8を参照しながら、図2で示した障害解析装置200の動作についてより詳細に説明する。図8は、第1の実施形態に係る遠隔監視システム11における障害解析装置200の動作を示すフローチャートであり、監視対象装置10aのみに対する障害監視装置200の動作を示しており、図2の解析(S101a)の処理に対応している。尚、以下の動作説明において、前述した障害解析装置の構成で説明した内容と重複する説明を省略することがある。
【0070】
図8において、ステップA13でデータ解析部105を起動した後、ステップA14〜A15で障害監視装置100mから転送された障害検出情報5aから情報取得を行っている。次に、ステップA16では、障害監視装置冗長構成情報DB(図18の206)を参照し、障害監視装置100m(障害監視装置コードは100)は正系であると判定する。よって、ステップA17では、障害検出情報5aが正系の障害監視装置からの情報であると判定する。次に、ステップA18では、監視対象装置10aの監視対象装置コードA0001をキーとして監視対象装置情報DB(図16の204)を検索することにより、製品名Express5800 XXXXXXXX、及び装置型番N12345を取得している。
【0071】
次に、ステップA19では、監視対象装置10aの監視対象装置コードA0001及び障害検出情報5aの障害コードSG001_1、SG001_2、SG001_3をキーとして障害情報DB(図17の205)を検索する。その結果、上記のキーに対して障害情報DB205がヒットし、障害対処方法7aとして「XXXの交換が必要」、被疑部品コード(被疑部品情報)9aとしてA001、現地作業の要否(保守員派遣要請情報)19aとして1(現地作業が要)の情報が取得される。尚、監視対象装置コード及び障害コードをキーとして障害情報DB205を検索した際にヒットしない場合には、例えば、障害検索コマンドの実行結果4aのログ情報を直接解析することにより、障害対処方法等を決定するようにしてもよい。
【0072】
次に、ステップA20〜A23は、障害解析結果に基づいて、障害解析情報6aを生成し、障害管理装置300へ送信する部分である。
【0073】
次に、図9図10を参照しながら、図2で示した障害管理装置300の動作についてより詳細に説明する。図9図10は、第1の実施形態に係る遠隔監視システム11における障害管理装置300の動作を示すフローチャートであり、監視対象装置10aのみに対する障害管理装置300の動作を示しており、図2の管理(S102a)の処理に対応している。尚、以下の動作説明において、前述した障害管理装置の構成で説明した内容と重複する説明を省略することがある。
【0074】
図9において、ステップA24は、障害解析装置200から障害解析情報6aを受信して、障害管理DB(図19の207)に出力している。図19を参照すると、障害管理DB207の1行目に障害解析情報6aに対応した情報が書き込まれていることが分かる。尚、メール送信済みフラグ及び保守員要請済みフラグは、未実施であることを示す「0」に初期設定される。また、コマンド実行結果として、ログファイル名が書き込まれている。
【0075】
次に、ステップA25〜A30は、顧客端末20aに障害連絡メールを送信する部分である。具体的には、ステップA26〜A27で障害管理DB(図19の207)の1行目を参照してメール送信済みフラグが0(即ち、メール送信が未実施)であると判定し、ステップA28で障害管理DB207の1行目のデータを情報取得する。続いて、ステップA29において、ステップA28で取得した監視対象装置コードA0001をキーとして顧客情報DB208を検索し、顧客メールアドレス「Asya@XXX.com」を取得する。そして、ステップA30で障害連絡メールを顧客端末20aのメールアドレスAsya@XXX.comに送信する。
【0076】
次に、ステップA31〜A37は、保守員端末22aに出動要請を行う部分である。具体的には、ステップA31で保守員出動指示部110を起動する。そして、ステップA32において、前述したステップA28と同様に、障害管理DB(図19の207)の1行目の情報を取得する。そして、ステップA33において、上記取得した情報において現地作業要否が「1」であることから、保守員出動が必要であると判定する。
【0077】
そして、ステップA34において、前述したステップA29と同様に、監視対象装置コードA0001をキーとして顧客情報DB(図20の208)を検索して顧客の保守拠点コード「HK001」を取得する。次に、ステップA35において、保守拠点コード「HK001」をキーとして社員情報DB(図21の209)を検索し、保守拠点コード「HK001」に対応した拠点の保守員の社員コード「1111111」、保守員メールアドレス「shainA@test.com」を取得する。次に、ステップA36において、社員コード「1111111」の作業予定DB(図22の210)の行に、作業予定を登録する(図22に示すように、作業開始時刻2013年1月15日9時が書き込まれる)。続いて、ステップA37において、保守員端末22aのメールアドレス「shainA@test.com」に、作業予定メールを送信する。該作業予定メールにより、出動先の顧客住所、障害情報、作業開始時刻などの情報が通知される。
【0078】
次に、図10のステップA38〜A41は、保守部品倉庫端末21に保守部品の手配を行う部分である。具体的には、ステップA38において、取得済みの障害管理DB207の1行目の情報のうち、被疑部品コードが登録されているか否かを判定する。図19の障害管理DB207の1行目の情報では、被疑部品コード「A001」が登録されているので、ステップA38では保守部品が必要と判定される。次に、ステップA39で保守部品手配部111を起動する。次に、ステップA40で、監視対象装置コードA0001をキーとして顧客情報DB208を検索し顧客名「A社」、顧客住所「東京都XXX」を取得する。そして、ステップA41において、保守部品倉庫端末21に部品配送指示メールを送信する。該部品配送指示メールは、顧客住所「東京都XXX」に、被疑部品コード「A001」に対応する保守部品を配送する指示を行うものである。
【0079】
次に、図11図12を参照しながら、障害監視装置の正系と副系の切り替え動作について説明する。図3に示すように、遠隔監視システム11の障害監視システムは正系と副系を有する冗長構成になっており、図3では、100m、100sが夫々正系の障害監視装置、副系の障害監視装置に設定されている状態になっている。
【0080】
図11は障害監視装置の系切り替えが発生する場合の障害監視装置のフローチャートである。遠隔監視システム11が備える2つの障害監視装置100m、100sのうち、図11は、障害監視装置100mの動作を示している(100sの動作も同様である)。図11において、ステップB1で稼動通知情報定期作成部103が定期的に起動する。定期的に起動する間隔は、予め所定の値に設定されている。ステップB2で稼動通知情報定期作成部103により稼動通知情報8aが生成される。稼動通知情報8aには、稼動通知情報定期作成部103の起動日時、及び障害監視装置コードの情報が書き込まれる。
【0081】
次に、ステップB3〜B6は、生成した稼動通知情報8aを障害解析装置200に転送する部分である。具体的には、ステップB3においてデータ転送部104を定期起動し、ステップB4で稼動通知情報8aのファイルの有無を判定する。ステップB4で稼動通知情報8aのファイルが有ると判定された場合は、ステップB5でデータ転送先DB203から障害解析装置200のIPアドレス「192.168.0.1」を取得する。そして、ステップB6で稼動通知情報8aを障害解析装置200のIPアドレスに送信する。
【0082】
次に、図12は障害監視装置の系切り替えが発生する場合の障害解析装置200のフローチャートである。障害解析装置200は、障害監視装置(100m、100s)の各々が生成した稼動通知情報8a、8bの受信を試みて、受信できた場合には送信側の障害監視装置が正常に稼動していると判断する。ここで、障害監視装置100m、100sの障害監視装置コードは、夫々100、200である。
【0083】
図12のステップB7〜B10は、上記した各障害監視装置の稼動の判断を行う部分である。具体的には、ステップB7において稼動通知情報監視部106を定期起動する。続いて、障害監視装置冗長構成情報DB206を参照し、障害監視装置コード100、200を検索して、障害監視装置コード100(即ち、障害監視装置100m)が、正系の障害監視装置であり、障害監視装置コード200(即ち、障害監視装置100s)が、副系の障害監視装置であるという情報を取得する。
【0084】
次に、ステップB9で稼動通知情報8a〜bの受信を試みる。ステップB10において、稼動通知情報8a〜bの未着がない場合(即ち、稼動通知情報8a〜bが共に受信できた場合)は、終了する。一方、正系の障害監視装置からの稼動通知情報8aが未着の場合(即ち、受信できない場合)、ステップB11において障害監視装置系切り替え部107を起動し、障害監視装置の正系と副系の切り替えを行う。そして、ステップB12において、障害監視装置冗長構成情報DB206の1行目において、正系の障害監視装置コードを200に、副系の障害監視装置コードを100に更新する。
【0085】
(比較例1)
次に、図25図26を参照しながら、比較例1について説明する。図25は、比較例1に係る遠隔監視システムの全体構成を示すブロック図である。図25図3と比較すると分かるように、図25図3の遠隔監視システム11を遠隔監視装置13に置き換えた構成になっている。比較例1では、第1の実施形態の障害監視装置100m、障害解析装置200、及び障害管理装置300の各機能を、1台の遠隔監視装置13で実行するように構成している。また、比較例1では、遠隔監視装置13と監視対象装置10a〜bとは、閉域IP網50ではなくインターネット60を介して接続される。
【0086】
図26は、比較例1の動作を示すシーケンスチャートである。図26において、遠隔監視装置13による判定(S300a)、解析(S301a)、管理(S302a)、判定(S300b)、解析(S301b)、及び管理(S302b)が順次処理される。ここで、各々の処理内容は、図2の判定(S100a)、解析(S101a)、管理(S102a)、判定(S100b)、解析(S101b)、及び管理(S102b)と同様である。
【0087】
(第1の実施形態と比較例1の比較)
次に、第1の実施形態と比較例1を対比することにより、第1の実施形態で得られる効果について説明する。図2(第1の実施形態)と図26(比較例1)を比較すると、図2の場合のほうが、期間TA、TBにおいて処理を並列に実行させることにより、全体の処理能力が向上し、全体の処理時間を短縮する効果があることが分かる。従って、緊急時に複数の監視対象装置に対して一斉に障害検出をさせる場合には、並列処理が可能な第1の実施形態のほうが、顧客に対する障害連絡メールを早く送ることができ、保守員に対して早く出動指示を出すことができ、保守部品の手配を早く行うことができる。尚、第1の実施形態では、監視対象装置が2つの場合について例示したが、監視対象装置の数が増えた場合、並列動作をさせる効果は顕著になる。
【0088】
また、比較例1の場合、遠隔監視装置13の不具合が発生すると遠隔監視ができない状態になってしまう虞がある。一方、第1の実施形態の場合には、障害監視装置を正系と副系の冗長構成とし、その切り替えを障害解析装置200で制御するようにしている。このように構成することで、正系の障害監視装置に何らかのトラブルが発生し動作不能の状態になったとしても、副系の障害監視装置が代わって障害監視を行うようにすることが可能になるという効果が得られる。
【0089】
また、比較例1では、遠隔監視装置13と複数の監視対象装置10a〜bとがインターネット60を介して障害検出コマンドの送受信及び障害検出コマンドの実行結果の送受信を行っているため、監視対象装置において診断処理と別の秘匿性の高い処理とが並行して実行されているような場合、障害検出コマンドの実行結果(例えば、ログ情報)に秘匿性の高いデータが含まれることが懸念される。一方、第1の実施形態では、遠隔監視システム11と複数の監視対象装置10a〜bとがVPN等の閉域IP網50を介して障害検出コマンドの送受信及び障害検出コマンドの実行結果の送受信を行っているため、障害検出コマンドの実行結果(例えば、ログ情報)に秘匿性の高いデータが含まれたとしても、外部からのアクセスされないようにセキュリティを確保することが可能であるという効果が得られる。
【0090】
[第2の実施形態]
次に、第2の実施形態について、図23図24を参照しながら説明する。図23は第2の実施形態に係る遠隔監視システム12を適用した場合の全体構成を示すブロック図である。第2の実施形態では、第1の実施形態の障害解析装置200及び障害管理装置300の機能を、障害解析管理装置400の1つの装置で動作させるように構成している。
【0091】
図24は、第2の実施形態の動作を示すシーケンスチャートである。図24において、判定(S200a)、解析(S201a)、管理(S202a)、判定(S200b)、解析(S201b)、及び管理(S202b)の各々の処理内容は、図2の判定(S100a)、解析(S101a)、管理(S102a)、判定(S100b)、解析(S101b)、及び管理(S102b)と同様である。図24では、期間TAにおいて、障害監視装置100による判定(S200b)と障害解析管理装置400による解析(S201a)とを並列動作させることができる。但し、図2(第1の実施形態)の期間TBの並列動作は得られない。
【0092】
以上のように、第2の実施形態によれば、第1の実施形態に比べて並列化できる動作が半減するものの、比較例1に比べると処理能力を向上させることができる。
【0093】
また、第2の実施形態の遠隔監視システム12は、少ない装置数で構成することができるので(第1の実施形態の4つに対し、第2の実施形態の遠隔監視システム12は3つ)、低コストの遠隔監視システムとすることができるという効果が得られる。
【0094】
尚、第1の実施形態において、障害監視装置(100m、100s)による処理(図7図11の各ステップ)は、障害監視装置の記憶部(不図示)にプログラムとして格納され、障害監視装置(100m、100s)が備えたCPUにより呼び出されて実行される。また、障害解析装置200による処理(図8図12の各ステップ)は、障害解析装置の記憶部(不図示)にプログラムとして格納され、障害解析装置200が備えたCPUにより呼び出されて実行される。また、障害管理装置300による処理(図9図10の各ステップ)は、障害管理装置の記憶部(不図示)にプログラムとして格納され、障害管理装置300が備えたCPUにより呼び出されて実行される。また、第2の実施形態の障害解析管理装置400による処理も、障害解析管理装置の記憶部(不図示)にプログラムとして格納され、障害解析管理装置400が備えたCPUにより呼び出されて実行される。また、上記した各プログラムは、ネットワークを介してダウンロードするか、或いは、プログラムを記憶した記憶媒体を用いて、更新することができる。
【0095】
上記の実施形態の一部又は全部は、以下の形態のようにも記載されうるが、以下には限られない。
【0096】
(形態1)複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する障害監視装置と、
前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する障害解析装置と、
前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する障害管理装置と、
を備え、
前記障害監視装置、前記障害解析装置、及び前記障害管理装置の2以上が、互いに異なる前記監視対象装置に対する処理を並行して実行可能に構成された、遠隔監視システム。
【0097】
(形態2)前記障害解析装置は、
複数の障害検出コマンドの実行結果に対応した障害対処方法を予め定めた障害情報データベースを備え、
前記障害監視装置から受信した障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して障害を復旧する障害対処方法を決定する、形態1に記載の遠隔監視システム。
【0098】
(形態3)前記障害情報データベースには各々の前記障害対処方法に対応した被疑部品情報がさらに定められており、
前記障害解析装置は前記障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して被疑部品情報を取得し、前記障害解析情報に前記被疑部品情報を付加し、
前記障害管理装置は前記受信された障害解析情報に含まれる被疑部品情報に基づいて被疑部品の手配の指示を送出する、形態2に記載の遠隔監視システム。
【0099】
(形態4)前記障害情報データベースには各々の前記障害対処方法に対応した保守員派遣要請情報がさらに定められており、
前記障害解析装置は前記障害検出情報に含まれる障害検出コマンドの実行結果を用いて前記障害情報データベースを検索して保守員派遣要請情報を取得し、前記障害解析情報に前記保守員派遣要請情報を付加し、
前記障害管理装置は前記受信された障害解析情報に含まれる保守員派遣要請情報に基づいて保守員の派遣を指示する通知を保守員端末に送信する、形態2または3に記載の遠隔監視システム。
【0100】
(形態5)前記障害管理装置は、
前記複数の監視対象装置の各々に対応した顧客端末のアドレスを記憶した顧客情報データベースを備え、
前記受信された障害解析情報に含まれる監視対象装置の情報を用いて前記顧客情報データベースを検索して前記監視対象装置に対応した顧客端末のアドレスを取得し、前記顧客端末のアドレスに前記監視対象装置の障害を通知する、形態1乃至4のいずれか一に記載の遠隔監視システム。
【0101】
(形態6)前記障害監視装置は、正系の障害監視装置及び副系の障害監視装置を含む2以上の障害監視装置で構成され、
前記障害解析装置は、前記正系の障害監視装置の異常を検出した場合に、前記正系の障害監視装置と前記副系の障害監視装置との間で、前記正系/副系の設定を切り替え、
前記障害解析装置は、前記正系の障害監視装置から送信された前記障害検出情報を使用して障害対処方法を決定し、前記副系の障害監視装置から送信された前記障害検出情報を使用しない、形態1乃至5のいずれか一に記載の遠隔監視システム。
【0102】
(形態7)前記複数の障害監視装置は、夫々定期的に稼動通知情報を前記障害解析装置に送信するように設定され、
前記障害解析装置は、前記2以上の障害監視装置の各々から稼動通知情報を受信できるか否かを判定し、前記稼動通知情報を受信できない障害監視装置が異常であると検出する、形態6に記載の遠隔監視システム。
【0103】
(形態8)複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する障害監視装置と、
前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定すると共に、前記障害対処方法の実行を管理する障害解析管理装置と、
を備え、
前記障害監視装置、及び前記障害解析管理装置が、異なる前記監視対象装置に対する処理を並行して実行可能に構成された、遠隔監視システム。
【0104】
(形態9)前記障害監視装置は閉域IP(Internet Protocol)網を介して前記複数の監視対象装置からの障害検出コマンド実行結果を受信する、形態1乃至8のいずれか一に記載の遠隔監視システム。
【0105】
(形態10)複数の監視対象装置にネットワークを介して障害検出コマンドを送信するステップと、
各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を出力する判定ステップと、
前記障害検出情報を受信し、前記受信された障害検出情報に含まれる障害検出コマンドの実行結果を解析して障害を復旧する障害対処方法を決定し、前記監視対象装置の情報及び前記障害対処方法を含む障害解析情報を出力する解析ステップと、
前記障害解析情報を受信し、前記受信された障害解析情報に含まれる障害対処方法の実行を管理する管理ステップと、
を含み、
前記判定ステップ、前記解析ステップ、及び前記管理ステップの2以上が、並行して実行可能である遠隔監視方法。
【0106】
(形態11)複数の監視対象装置の障害を検出するプログラムであって、
複数の監視対象装置にネットワークを介して障害検出コマンドを送信し、各々の前記監視対象装置で実行された前記障害検出コマンドの実行結果を受信して各々の前記監視対象装置の障害の有無を判定し、障害があると判定された前記監視対象装置に関して前記監視対象装置の情報及び前記障害検出コマンドの実行結果を含む障害検出情報を、前記障害検出情報を用いて障害を復旧する障害対処方法を決定する装置に出力する処理、をコンピュータに実行させるプログラム。
【産業上の利用可能性】
【0107】
本発明は、複数の監視対象装置(サーバ装置、ネットワーク機器、コンピュータ等の情報処理装置;空調システム等)の障害をネットワークを介して遠隔検出し、障害情報を解析して、被疑部品の配送や保守員の派遣などの対策を自動で行う遠隔監視システムに適用することができる。
【0108】
なお、本発明の全開示(請求の範囲及び図面を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素(各請求項の各要素、各実施形態の各要素、各図面の各要素等を含む)の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲及び図面を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。
【符号の説明】
【0109】
1、11:遠隔監視システム
2:ネットワーク
3a〜b:障害検出コマンド
4a〜b:障害検出コマンドの実行結果
5a〜b:障害検出情報
6a〜b:障害解析情報
7a:障害対処方法
8a〜b:稼動通知情報
9、9a〜b:被疑部品情報
10a〜b:監視対象装置
12:遠隔監視システム
13:遠隔監視装置
19、19a〜b:保守員派遣要請情報
20a〜b:顧客端末
21:保守部品倉庫端末
22a:保守員端末
50:閉域IP網
60:インターネット
100:障害監視装置
100m:(正系の)障害監視装置
100s:(副系の)障害監視装置
101:システム障害検出部
102:障害検出情報作成部
103:稼動通知情報定期作成部
104:データ転送部
105:データ解析部
106:稼動通知情報監視部
107:障害監視装置系切り替え部
108:データ転送部
109:メール送信部
110:保守員出動指示部
111:保守部品手配部
200:障害解析装置
201:障害検出対象装置データベース
202:障害検出項目データベース
203:データ転送先データベース
204:監視対象装置情報データベース
205:障害情報データベース
206:障害監視装置冗長構成情報データベース
207:障害管理データベース
208:顧客情報データベース
209:社員情報データベース
210:作業予定データベース
300:障害管理装置
400:障害解析管理装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26