(58)【調査した分野】(Int.Cl.,DB名)
複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムであって、
前記ネットワーク監視サーバが、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信するアラート受信部と、前記メッセージを事象ごとにグループ化するグループ化部と、前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、
前記グループ化されたメッセージに含まれずかつ前記パターン定義に含まれる内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる監視要求部と、
前記アラート受信部が前記メッセージを受信した際に、前記グループ化部による処理より先に前記メッセージに前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部と
を備えることを特徴とするネットワーク運用管理システム。
前記一次フィルタ抽出部が、前記一次フィルタに該当する内容のイベントが検出された場合に該一次フィルタの当該検出に係る項目を削除する機能を有することを特徴とする、請求項1に記載のネットワーク運用管理システム。
前記監視要求部から前記一次フィルタとして抽出されたイベントの発生を監視するよう依頼された前記監視対象装置が、前記イベントの発生を検出した場合にこれを示すメッセージを予め与えられた監視間隔に関わらず前記ネットワーク監視サーバに送信することを特徴とする、請求項1に記載のネットワーク運用管理システム。
複数の監視対象装置と相互に接続され、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバであって、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信するアラート受信部と、前記メッセージを事象ごとにグループ化するグループ化部と、前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、
前記グループ化されたメッセージに含まれずかつ前記パターン定義に含まれる内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる監視要求部と、
前記アラート受信部が前記メッセージを受信した際に、前記グループ化部による処理より先に前記メッセージに前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部と
を備えることを特徴とするネットワーク監視サーバ。
複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、
前記各監視対象装置から前記イベントの発生を示すメッセージを前記ネットワーク監視サーバのアラート受信部が受信し、
前記メッセージを前記ネットワーク監視サーバのグループ化部が事象ごとにグループ化し、
前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを前記ネットワーク監視サーバのパターン照合部が判断し、
前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を前記ネットワーク監視サーバの対策情報出力部が出力し、
前記グループ化されたメッセージに含まれずかつ前記パターン定義に含まれる内容のイベントを前記ネットワーク監視サーバの一次フィルタ抽出部が一次フィルタとして抽出し、
前記一次フィルタとして抽出されたイベントの発生を前記ネットワーク監視サーバの監視要求部が該当する前記監視対象装置に監視させ、
前記アラート受信部が改めて前記メッセージを受信した際に、当該メッセージに対して前記グループ化の処理より先に前記ネットワーク監視サーバの一次フィルタ部が前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する
ことを特徴とするネットワーク監視方法。
複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、
前記ネットワーク監視サーバが備えるコンピュータに、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信する手順、
前記メッセージを事象ごとにグループ化する手順、
前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断する手順、
前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する手順、
前記グループ化されたメッセージに含まれずかつ前記パターン定義に含まれる内容のイベントを一次フィルタとして抽出する手順、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる手順、
および改めて前記メッセージを受信した際に、当該メッセージに対して前記グループ化の処理より先に前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する手順
を実行させることを特徴とするネットワーク監視プログラム。
【発明の概要】
【発明が解決しようとする課題】
【0008】
前述のように、複数のイベントを過去において発生した不具合のパターンと照合して不具合の発生原因およびその対策を特定する技術は、特許文献1、3、4などに記載されている既存の技術である。
【0009】
しかしながら、これらの技術だと、たとえば2つのイベントが複合的に原因となった不具合が発生パターンとして登録されている場合だと、そのうちの一方のイベントが発生したらもう一方のイベントの発生待ちの状態となる。従って、この「もう一方のイベント」の報告が何らかの原因(たとえばネットワークの輻輳など)で遅れた場合、監視サーバはその「もう一方のイベント」の報告を単純に待ち続けてしまうので、当該監視サーバの他の動作も遅延させることとなる。
【0010】
また、それらの技術では、全ての監視対象装置から報告される全てのイベントを同一の発生パターンと比較する必要があるので、その点でも監視サーバに負荷をかけてしまうこととなる。
【0011】
これらの問題を解決しうる技術は、残る特許文献2および5にも記載されていない。特許文献2の技術は、コンピュータネットワークに対して適用可能な構成を備えていない。また、特許文献5の技術もコンピュータネットワークを対象とするものではなく、障害が発生するとすぐにその旨を出力するというものである。従って、特許文献1〜5の技術を全て組み合わせることがそもそも無理であり、上記の問題を解決することはできない。
【0012】
本発明の目的は、監視サーバに対する負荷を少なくして、複数のイベントが複合的に原因となる不具合の発生原因およびその対策を的確かつ迅速に特定することを可能とするネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0013】
上記目的を達成するため、本発明に係るネットワーク運用管理システムは、複数の監視対象装置と、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムであって、ネットワーク監視サーバが、各監視対象装置からイベントの発生を示すメッセージを受信するアラート受信部と、メッセージを事象ごとにグループ化するグループ化部と、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、グループ化されたメッセージに含まれ
ずかつパターン定義に含まれ
る内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、一次フィルタとして抽出されたイベントの発生を該当する監視対象装置に監視させる監視要求部と、
アラート受信部がメッセージを受信した際に、グループ化部による処理より先にメッセージに一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部とを備えることを特徴とする。
【0014】
上記目的を達成するため、本発明に係るネットワーク監視サーバは、複数の監視対象装置と相互に接続され、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバであって、各監視対象装置からイベントの発生を示すメッセージを受信するアラート受信部と、メッセージを事象ごとにグループ化するグループ化部と、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、グループ化されたメッセージに含まれ
ずかつパターン定義に含まれ
る内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、一次フィルタとして抽出されたイベントの発生を該当する監視対象装置に監視させる監視要求部と、
アラート受信部がメッセージを受信した際に、グループ化部による処理より先にメッセージに一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部とを備えることを特徴とする。
【0015】
上記目的を達成するため、本発明に係るネットワーク監視方法は、複数の監視対象装置と、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、各監視対象装置からイベントの発生を示すメッセージをネットワーク監視サーバのアラート受信部が受信し、メッセージをネットワーク監視サーバのグループ化部が事象ごとにグループ化し、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かをネットワーク監視サーバのパターン照合部が判断し、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報をネットワーク監視サーバの対策情報出力部が出力し、グループ化されたメッセージに含まれ
ずかつパターン定義に含まれ
る内容のイベントをネットワーク監視サーバの一次フィルタ抽出部が一次フィルタとして抽出し、一次フィルタとして抽出されたイベントの発生をネットワーク監視サーバの監視要求部が該当する監視対象装置に監視させ、
アラート受信部が改めてメッセージを受信した際に、当該メッセージに対してグループ化の処理より先にネットワーク監視サーバの一次フィルタ部が一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出することを特徴とする。
【0016】
上記目的を達成するため、本発明に係るネットワーク監視プログラムは、複数の監視対象装置と、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、ネットワーク監視サーバが備えるコンピュータに、各監視対象装置からイベントの発生を示すメッセージを受信する手順、メッセージを事象ごとにグループ化する手順、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断する手順、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する手順、グループ化されたメッセージに含まれ
ずかつパターン定義に含まれ
る内容のイベントを一次フィルタとして抽出する手順、一次フィルタとして抽出されたイベントの発生を該当する監視対象装置に監視させる手順、および
改めてメッセージを受信した際に、当該メッセージに対してグループ化の処理より先に一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する手順を実行させることを特徴とする。
【発明の効果】
【0017】
本発明は、上述したように、グループ化されたメッセージに含まれてかつパターン定義に含まれない内容のイベントを一次フィルタとして抽出し、受信したメッセージに最初に一次フィルタを適用して該当する内容のイベントを検出するように構成したので、フィルタリングにかかる処理を軽減することができる。
【0018】
これによって、監視サーバに対する負荷を少なくして、複数のイベントが複合的に原因となる不具合の発生原因およびその対策を的確かつ迅速に特定することが可能であるという、優れた特徴を持つネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラムを提供することができる。
【発明を実施するための形態】
【0020】
(実施形態)
以下、本発明の実施形態の構成について添付
図1〜2に基づいて説明する。
最初に、本実施形態の基本的な内容について説明し、その後でより具体的な内容について説明する。
本実施形態に係るネットワーク運用管理システム1は、複数の監視対象装置30と、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバ(監視サーバ10)とが相互に接続されて構成されるネットワーク運用管理システムである。監視サーバ10は、各監視対象装置からイベントの発生を示すメッセージを受信するアラート受信部111と、メッセージを事象ごとにグループ化するグループ化部116と、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部118と、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部119とを備えると共に、グループ化されたメッセージに含まれてかつパターン定義に含まれない内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部115と、一次フィルタとして抽出されたイベントの発生を該当する監視対象装置に監視させる監視要求部117と、グループ化部による処理より先にメッセージに一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部112とを備える。
【0021】
また、この監視サーバ10は、予め記憶されたフィルタ定義に基づいて各監視対象装置から受信したメッセージの内容に対応してメッセージの通知の要否を決定するフィルタ部113と、メッセージからイベントの内容を示す種類名を抽出するメッセージ正規化部114とを備えると共に、グループ化部116がメッセージから抽出された種類名を事象ごとにグループ化する。
【0022】
そして、一次フィルタ抽出部115が、一次フィルタに該当する内容のイベントが検出された場合に該一次フィルタの当該検出に係る項目を削除する機能を有する。そして、監視要求部117から一次フィルタとして抽出されたイベントの発生を監視するよう依頼された監視対象装置が、イベントの発生を検出した場合にこれを示すメッセージを予め与えられた監視間隔に関わらず監視サーバ10に送信する。
【0023】
以上の構成を備えることにより、本実施形態のネットワーク運用管理システム1は、監視サーバに対する負荷を少なくして、複数のイベントが複合的に原因となる不具合の発生原因およびその対策を的確かつ迅速に特定することが可能となる。
以下、これをより詳細に説明する。
【0024】
図2は、本発明の実施形態に係るネットワーク運用管理システム1の構成について示す説明図である。ネットワーク運用管理システム1は、監視サーバ10と、監視端末20と、複数の監視対象装置30がネットワーク40を介して相互に接続されて構成される。本実施形態では、ネットワークスイッチ31、データベースサーバ32、およびアプリケーションサーバ33を含む複数の装置を総称して監視対象装置30という。
【0025】
監視サーバ10は、ネットワーク40に接続された各々の機器(以後対象装置という)で行われた動作について示すデータであるイベントを受信し、このイベントから各対象装置で発生した不具合の原因を特定するコンピュータ装置である。監視端末20は、ネットワーク管理者が操作するコンピュータ装置であり、監視サーバ10が特定した不具合の原因についてネットワーク管理者に表示し、またネットワーク管理者から監視サーバ10への操作指示も監視端末20を介して行われる。
【0026】
監視対象装置30の中には、複数のネットワーク間でデータの交換を行うネットワークスイッチ31、他のコンピュータからの照会に応じてデータの検索や更新を行って得られたデータを返却するデータベースサーバ32、および他のコンピュータからの指令に応じてアプリケーションソフトを動作させてその処理結果を返却するアプリケーションサーバ33が含まれる。
【0027】
図1は、
図2で示した監視サーバ10のより詳しい構成について示す説明図である。監視サーバ10は、一般的なコンピュータとしての構成を備えている。即ち、監視サーバ10は、コンピュータプログラムとして記述された各種処理を実行する主体である主演算制御手段(CPU: Central Processing Unit)11と、主演算制御手段11によって処理されるデータを記憶する記憶手段12と、ネットワーク40に接続して他のコンピュータとの間でデータ通信を行う通信手段13とを備える。
【0028】
主演算制御手段11は、ネットワーク監視プログラムが動作することにより、アラート受信部111、一次フィルタ部112、フィルタ部113、メッセージ正規化部114、一次フィルタ抽出部115、グループ化部116、監視要求部117、パターン照合部118、および対策情報出力部119の各々として動作する。また、記憶手段12には、フィルタ定義121、メッセージ正規化ルール122、パターン定義123、関連情報124、対策情報125、および一次フィルタ定義126の各々が記憶されている。
【0029】
アラート受信部111は、各々の監視対象装置30において発生したイベントを示すメッセージを、通信手段13を介して受信する。一次フィルタ部112は、アラート受信部111で受信したメッセージに一次フィルタ定義126を適用し、この定義に当てはまるメッセージを受信した場合はメッセージ正規化部114にアラートを通知し、当てはまらないメッセージを受信した場合はフィルタ部113にアラートを通知する。
【0030】
フィルタ部113は、一次フィルタ部112から渡されたメッセージにフィルタ定義121を適用し、このメッセージのタイプおよび対象機器に対応する監視サーバ10の動作を決定する。メッセージ正規化部114は、メッセージにメッセージ正規化ルール122を適用して、そのメッセージの種類名114aを抽出する。
【0031】
一次フィルタ抽出部115は、フィルタ定義121の中から抽出しようとしている事象に関連するデータを一次フィルタ定義126として抽出する。グループ化部116は、メッセージ正規化部114で抽出されたメッセージの種類名114aを、事象ごとにグループ化する。
【0032】
監視要求部117は、一次フィルタ抽出部115で抽出された監視項目について、該監視項目に関連する監視対象装置30に対してその項目についての監視を依頼する。パターン照合部118は、グループ化部116でグループ化された種類名114aをパターン定義123と照合して不具合の原因を特定する。対策情報出力部119は、対策情報125を参照して、特定された不具合の原因に対応する対応策を監視端末20に出力する。
【0033】
図3は、
図1に示したフィルタ定義121、メッセージ正規化ルール122、パターン定義123、関連情報124および対策情報125の各々の初期状態でのデータ内容について示す説明図である。これらのデータでは、いわゆるワイルドカード(字数に関係のない任意の文字列)を「*」の記号で示している。
【0034】
フィルタ定義121は、メッセージの種類を示すタイプ121a、そのメッセージの発生しうる機器を示す対象機器名121b、メッセージの内容を示すメッセージ本文121c、およびそのメッセージを受信したことをシステム管理者に通知するか否かについて示す通知要否121dといった各データを含む。メッセージ正規化ルール122は、そのメッセージの種類を示すタイプ122a(121aに対応)と、そのメッセージ本文121cから種類名114aを抽出する際のルールを示す抽出条件122bといった各データを含む。
【0035】
図3に示した例では、タイプ121a(122a)が「ログ監視」の場合には通知要否121dは「通知する」、抽出条件122bは「:より左側の文字列を抽出」と定義されている。タイプ121a(122a)が「プロセス監視」の場合には通知要否121dは「通知しない」、抽出条件122bは「:より左側の文字列を抽出」と定義されている。タイプ121aが「ネットワーク監視」の場合には通知要否121dは「通知する」だが、抽出条件122bは定義されていない。
【0036】
パターン定義123は、種類名114aのグループであるパターングループ123bと、そのパターングループ123bに対応する事象123cとが、各パターンと事象の組に対して与えられるID123aに対応して記憶される。関連情報124は、種類名114aに対応する対象機器名124aおよびタイプ124b(121a,122aに対応)とが記憶されている。
【0037】
対策情報125は、パターン定義123のID123aで示される事象に対応する対処方法125aが示されている。ここまで、フィルタ定義121、メッセージ正規化ルール122、パターン定義123、関連情報124、対策情報125が予め与えられて記憶手段12に記憶されているデータである。
【0038】
図4は、
図1に示した監視サーバ10の動作について示すフローチャートである。アラート受信部111が監視対象装置30からのメッセージを受信すると(ステップS201)、一次フィルタ部112がこのメッセージに一次フィルタ定義126を適用して当てはまるか否かを判定する(ステップS202)。当てはまらない場合はステップS203に、当てはまる場合はステップS210に各々進む。
【0039】
ステップS202で、受信したメッセージが一次フィルタ定義126に当てはまらない場合(ステップS202がノー)、フィルタ部113がそのメッセージにフィルタ定義121を適用し、このメッセージのタイプおよび対象機器に対応する監視サーバ10がこのメッセージをシステム管理者に通知するか否かを決定して(ステップS203)ステップS204に進む。そして、引き続いてメッセージ正規化部114が、メッセージにメッセージ正規化ルール122を適用して、そのメッセージの種類名114aを抽出する(ステップS204)。抽出された種類名114aを、グループ化部116が事象ごとにグループ化する(ステップS205)。
【0040】
そして、グループ化された種類名114aを、パターン照合部118がパターン定義123と照合し、パターン定義123に該当するパターンが登録されているか否かを判断する(ステップS206)。登録されていれば、対策情報出力部119が該当するID123aに対応する対処方法125aを監視端末20に出力して(ステップS207)、ステップS201からの処理を繰り返す。
【0041】
ステップS205で、該当するパターンがパターン定義123に登録されていなければ、一次フィルタ抽出部115がそのグループ化された種類名114aでパターン定義123に含まれていない内容を一次フィルタ定義126として作成する(ステップS208)。そして、その一次フィルタ定義126に含まれる内容に関して、監視要求部117がそれに該当する監視対象装置30に対してその項目についての監視を依頼して(ステップS209)、ステップS201からの処理を繰り返す。この監視を依頼された監視対象装置30は、該当する項目について、所定の監視間隔に関わらず優先的に監視サーバ10に報告する。
【0042】
ステップS202で、受信したメッセージが一次フィルタ定義126に当てはまる場合(ステップS202がイエス)、一次フィルタ抽出部115が一次フィルタ定義126からその当てはまる内容を削除し(ステップS210)、ステップS204に進む。
【0043】
図5は、
図1に示したネットワーク運用管理システム1で、
図3に示した初期データの例に対して実際に観測されたメッセージ131および132の例を示す説明図である。メッセージには、発生日時、タイプ名(124b,121a,122aに対応)、メッセージ本文(121cに対応)の各データを含む。以後、メッセージ131に含まれる各データを発生日時131a、タイプ名131b、メッセージ本文131cといい、メッセージ131より後の時点で送信されたメッセージ132に含まれる各データを発生日時132a、タイプ名132b、メッセージ本文132cということにする。
【0044】
メッセージ131は、発生日時131a「西暦2011年4月11日0時1分0秒」に発生したタイプ名131b「ログ監視」、メッセージ本文131c「DBERROR1:データベースとの接続が切断しました」という内容のメッセージである。ここでいうデータベースとは、データベースサーバ32のことである。このメッセージ131は、アプリケーションサーバ33で発生したものである。
【0045】
監視サーバ10では、アラート受信部111がメッセージ131を受けて(ステップS201)、これに反応した一次フィルタ部112がメッセージ131に一次フィルタ定義126を適用して当てはまるか否かを判定する(ステップS202)が、この時点では一次フィルタ定義126が空欄であるので、当てはまらない場合のステップS203に処理が進む。
【0046】
これを受けたフィルタ部113がメッセージ131にフィルタ定義121を適用し、このメッセージのタイプおよび対象機器に対応する監視サーバ10がこのメッセージをシステム管理者に通知するか否かを決定する(ステップS203)。この場合はフィルタ定義121の1行目のタイプ121a「ログ監視」に該当するので、通知要否121dは「通知する」となる。
【0047】
引き続いて、ステップS204がメッセージ131にメッセージ正規化ルール122を適用して、そのメッセージの種類名114aを抽出する(ステップS204)。この場合はメッセージ正規化ルール122の1行目のタイプ122a「ログ監視」に該当するので、これに対応する抽出条件122bにある通り、メッセージ本文131cの「:より左側の文字列を抽出」して、種類名114aは「DBERROR1」となる。
【0048】
引き続いて、グループ化部116が種類名114a「DBERROR1」をグループ化する(ステップS205)。この場合は、「DBERROR1」だけをグループA141とする。
図6は、
図1に示したネットワーク運用管理システム1で、
図5に示したメッセージ131および132に対応してグループ化部116が作成したグループA141およびグループB142の内容について示す説明図である。グループB142の内容については後述する。
【0049】
そして、ステップS205で作成されたグループA141に対して、パターン照合部118がパターン定義123と照合し、パターン定義123に該当するパターンが登録されているか否かを判断する(ステップS206)。この場合は、パターン定義123に該当するパターンが登録されていないが、ID123a=「1」で示される対象機器123bのパターングループのうちの一方が「DBERROR1」である。もう一方が「SWERROR1」である。
【0050】
従って、ここではステップS208〜209に進み、ID123a=「1」で示される対象機器123bのパターングループに含まれていてグループA141に含まれていない内容である「SWERROR1」について一次フィルタ定義126を作成し(ステップS208)、その「SWERROR1」に該当するネットワークスイッチ31に、その内容を監視するよう要求する(ステップS209)。この監視を依頼されたネットワークスイッチ31は、「SWERROR1」に該当する項目について、所定の監視間隔に関わらず優先的に監視サーバ10に報告する。
【0051】
図7は、
図1に示したネットワーク運用管理システム1で、
図5に示したメッセージ131に対応して一次フィルタ抽出部115が作成した一次フィルタ定義126について示す説明図である。一次フィルタ定義126は、フィルタ定義121から一次フィルタ抽出部115が抽出して作成するデータであるので、データ項目はフィルタ定義121と同一である。換言すれば、一次フィルタ定義126は、フィルタ定義121と同一のデータ項目を、対象機器123bのパターングループに含まれていてグループA141に含まれていない内容について抽出したものである。「SWERROR1」は、ネットワークスイッチ31で発生したエラーである。
【0052】
図5に示したメッセージ132は、上記のステップS209の要求に対応して、ネットワークスイッチ31が送信したメッセージである。その内容は、発生日時132a「西暦2011年4月11日0時1分1秒」に発生したタイプ名132b「ネットワーク監視」、メッセージ本文131c「SWERROR1:ネットワークスイッチのポート1番が故障しました」というものである。
【0053】
この場合、ステップS202までは上記と同様に動作するが、ステップS202の判断で、メッセージ132の内容が一次フィルタ定義126に合致するので、ステップS210に進んで、一次フィルタ定義126の内容は削除される(ステップS210)。そして、ステップS204に進んで、メッセージの種類名114a「SWERROR1」が抽出され(ステップS204)、グループ化部116が種類名114a「DBERROR1」と「SWERROR1」とを含む新たなグループB142を作成する(ステップS205)。
【0054】
このグループB142は、ステップS206の判断で、パターン定義123のID123a=「1」で示されるパターングループ123bに該当する。そこでステップS206の判断で、ステップS207に進み、対策情報出力部119がID123a=「1」に該当する対処方法125a=「ネットワークスイッチを交換する」を検索し、監視端末20に出力して(ステップS207)、ステップS201からの処理を繰り返す。
【0055】
(第1の実施形態の全体的な動作)
次に、上記の実施形態の全体的な動作について説明する。本実施形態に係るネットワーク監視方法は、複数の監視対象装置と、各監視対象装置で行われた動作について示すデータであるイベントを受信して各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、各監視対象装置からイベントの発生を示すメッセージをネットワーク監視サーバのアラート受信部が受信し(
図4・ステップS201)、メッセージをネットワーク監視サーバのグループ化部が事象ごとにグループ化し(
図4・ステップS205)、グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かをネットワーク監視サーバのパターン照合部が判断し(
図4・ステップS206)、グループ化されたメッセージがパターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報をネットワーク監視サーバの対策情報出力部が出力し(
図4・ステップS207)、グループ化されたメッセージに含まれてかつパターン定義に含まれない内容のイベントをネットワーク監視サーバの一次フィルタ抽出部が一次フィルタとして抽出し(
図4・ステップS208)、一次フィルタとして抽出されたイベントの発生をネットワーク監視サーバの監視要求部が該当する監視対象装置に監視させ(
図4・ステップS209)、改めて受信されたメッセージに対してグループ化の処理より先にネットワーク監視サーバの一次フィルタ部が一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する(
図4・ステップS202)。
【0056】
ここで、上記各動作ステップについては、これをコンピュータで実行可能にプログラム化し、これらを前記各ステップを直接実行するコンピュータであるネットワーク監視サーバ10に実行させるようにしてもよい。本プログラムは、非一時的な記録媒体、例えば、DVD、CD、フラッシュメモリ等に記録されてもよい。その場合、本プログラムは、記録媒体からコンピュータによって読み出され、実行される。 この動作により、本実施形態は以下のような効果を奏する。
【0057】
本実施形態は、上記したように、複数のイベントが複合的に原因となる不具合について、その原因の一部となるイベントが発生したら、それ以外の該当するイベントを一次フィルタとして抽出して優先的に監視し、これに該当するイベントを該当する機器に監視させるように構成した。このことにより、該当するイベントが発生したら優先的に検出されるので、通常のフィルタ定義の中で検出するよりもフィルタリングにかかる処理の分量を軽減して、迅速かつ軽快に検出処理を行うことができる。
【0058】
これまで本発明について図面に示した特定の実施形態をもって説明してきたが、本発明は図面に示した実施形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができる。
【0059】
上述した実施形態について、その新規な技術内容の要点をまとめると、以下のようになる。なお、上記実施形態の一部または全部は、新規な技術として以下のようにまとめられるが、本発明は必ずしもこれに限定されるものではない。
【0060】
(付記1) 複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムであって、
前記ネットワーク監視サーバが、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信するアラート受信部と、前記メッセージを事象ごとにグループ化するグループ化部と、前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、
前記グループ化されたメッセージに含まれてかつ前記パターン定義に含まれない内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる監視要求部と、
前記グループ化部による処理より先に前記メッセージに前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部と
を備えることを特徴とするネットワーク運用管理システム。
【0061】
(付記2) 予め記憶されたフィルタ定義に基づいて前記各監視対象装置から受信した前記メッセージの内容に対応して前記メッセージの通知の要否を決定するフィルタ部と、
前記メッセージから前記イベントの内容を示す種類名を抽出するメッセージ正規化部とを備えると共に、
前記グループ化部が前記メッセージから抽出された種類名を事象ごとにグループ化することを特徴とする、付記1に記載のネットワーク運用管理システム。
【0062】
(付記3) 前記一次フィルタ抽出部が、前記一次フィルタに該当する内容のイベントが検出された場合に該一次フィルタの当該検出に係る項目を削除する機能を有することを特徴とする、付記1に記載のネットワーク運用管理システム。
【0063】
(付記4) 前記監視要求部から前記一次フィルタとして抽出されたイベントの発生を監視するよう依頼された前記監視対象装置が、前記イベントの発生を検出した場合にこれを示すメッセージを予め与えられた監視間隔に関わらず前記ネットワーク監視サーバに送信することを特徴とする、付記1に記載のネットワーク運用管理システム。
【0064】
(付記5) 複数の監視対象装置と相互に接続され、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバであって、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信するアラート受信部と、前記メッセージを事象ごとにグループ化するグループ化部と、前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断するパターン照合部と、前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する対策情報出力部とを備えると共に、
前記グループ化されたメッセージに含まれてかつ前記パターン定義に含まれない内容のイベントを一次フィルタとして抽出する一次フィルタ抽出部と、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる監視要求部と、
前記フィルタ部による処理より先に前記メッセージに前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する一次フィルタ部と
を備えることを特徴とするネットワーク監視サーバ。
【0065】
(付記6) 複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、
前記各監視対象装置から前記イベントの発生を示すメッセージを前記ネットワーク監視サーバのアラート受信部が受信し、
前記メッセージを前記ネットワーク監視サーバのグループ化部が事象ごとにグループ化し、
前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを前記ネットワーク監視サーバのパターン照合部が判断し、
前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を前記ネットワーク監視サーバの対策情報出力部が出力し、
前記グループ化されたメッセージに含まれてかつ前記パターン定義に含まれない内容のイベントを前記ネットワーク監視サーバの一次フィルタ抽出部が一次フィルタとして抽出し、
前記一次フィルタとして抽出されたイベントの発生を前記ネットワーク監視サーバの監視要求部が該当する前記監視対象装置に監視させ、
改めて受信された前記メッセージに対して前記グループ化の処理より先に前記ネットワーク監視サーバの一次フィルタ部が前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する
ことを特徴とするネットワーク監視方法。
【0066】
(付記7) 複数の監視対象装置と、前記各監視対象装置で行われた動作について示すデータであるイベントを受信して前記各監視対象装置で発生した不具合の原因を特定するネットワーク監視サーバとが相互に接続されて構成されるネットワーク運用管理システムにあって、
前記ネットワーク監視サーバが備えるコンピュータに、
前記各監視対象装置から前記イベントの発生を示すメッセージを受信する手順、
前記メッセージを事象ごとにグループ化する手順、
前記グループ化されたメッセージを予め記憶されたパターン定義と照合して当該パターン定義に該当するか否かを判断する手順、
前記グループ化されたメッセージが前記パターン定義に該当する場合にこのパターン定義に対応して予め記憶された対策情報を出力する手順、
前記グループ化されたメッセージに含まれてかつ前記パターン定義に含まれない内容のイベントを一次フィルタとして抽出する手順、
前記一次フィルタとして抽出されたイベントの発生を該当する前記監視対象装置に監視させる手順、
および改めて受信された前記メッセージに対して前記グループ化の処理より先に前記一次フィルタを適用して該一次フィルタに該当する内容のイベントが発生したか否かを検出する手順
を実行させることを特徴とするネットワーク監視プログラム。