特開2025-25833 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特開2025-25833ネットワーク障害分析装置およびネットワーク障害分析方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23A
23B

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025025833

(43)【公開日】2025-02-21

(54)【発明の名称】ネットワーク障害分析装置およびネットワーク障害分析方法

(51)【国際特許分類】

H04L 41/0631 20220101AFI20250214BHJP

【ＦＩ】

H04L41/0631

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023130990

(22)【出願日】2023-08-10

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＪＡＶＡＳＣＲＩＰＴ

(71)【出願人】

【識別番号】000233295

【氏名又は名称】株式会社日立情報通信エンジニアリング

(74)【代理人】

【識別番号】110001689

【氏名又は名称】青稜弁理士法人

(72)【発明者】

【氏名】田澤功

(72)【発明者】

【氏名】受田賢知

(72)【発明者】

【氏名】村中延之

(72)【発明者】

【氏名】飯島智之

(72)【発明者】

【氏名】金子拓朗

(72)【発明者】

【氏名】森久斗

(57)【要約】

【課題】ネットワークの運用サービスを提供するにあたり、ネットワークの不具合を事前に解決するか、あるいは、障害が起こったときに、対策のため時間を短縮し、迅速に対処できるようにする。
【解決手段】ネットワーク障害分析装置は、ネットワークを構成する機器のログと、ネットワークの監視データと、ネットワークの通信経路情報と、利用者からの問合せ情報とを保持し、利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化し、グループ化された問合せ情報に含まれる機器情報に基づいて、グループ化された各々の問合せ情報に関する通信の通信経路情報を求め、通信経路情報の通信経路のノードに対応する機器情報に基づいて、ネットワークの不具合が発生した時刻の前後に含まれるログと監視データを取得する。
【選択図】図２２

【特許請求の範囲】

【請求項1】

ネットワーク上の機器による監視データまたはネットワークを構成する機器のログを収集するネットワーク障害分析装置であって、
ネットワークを構成する機器のログと、
ネットワークの監視データと、
ネットワークの通信経路情報と、
利用者からの問合せ情報とを保持し、
前記利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化し、
前記グループ化された問合せ情報に含まれる機器情報に基づいて、グループ化された各々の問合せ情報に関する通信の通信経路情報を求め、
前記通信経路情報の通信経路のノードに対応する機器情報に基づいて、前記利用者からの問合せ情報に関連するログと監視データを取得することを特徴とするネットワーク障害分析装置。

【請求項2】

前記利用者からの問合せ情報は、問合せに関するネットワークの事象が発生した日時を含み、
前記利用者からの問合せ情報グループ化するためのパターン化されたルールにネットワーク事象が発生した時刻に関するルールが含まれることを特徴とする請求項１記載のネットワーク障害分析装置。

【請求項3】

取得する前記利用者からの問合せ情報に関連するログと監視データは、問合せに関するネットワークの事象が発生した日時の前後の所定の時間間隔に関するデータであることを特徴とする請求項２記載のネットワーク障害分析装置。

【請求項4】

前記利用者からの問合せ情報は、問合せに関するネットワークの事象の事象内容、利用サイト、通信した機器のアドレスを含み、
前記利用者からの問合せ情報グループ化するためのパターン化されたルールに問合せに関するネットワークの事象の事象内容、利用サイト、通信した機器のアドレスに関するルールが含まれることを特徴とする請求項２記載のネットワーク障害分析装置。

【請求項5】

ネットワークの事象の事象内容に関するルールは、文字列の類似度が一定のしきに値にあるときに、同一の事象内容とみなすというルールであること特徴とする請求項４記載のネットワーク障害分析装置。

【請求項6】

前記ネットワークの監視データは、機器の死活監視、機器のポート監視、機器の状態監視、トラフィックの監視、リソース管理であることを特徴とする請求項１記載のネットワーク障害分析装置。

【請求項7】

さらに、ネットワークに関する性能を計測して、ネットワークの性能に関する統計情報を格納するネットワーク性能指標情報を保持し、
前記利用者からの問合せ情報に含まれる機器のネットワーク性能を計測して、計測したネットワーク性能の計測値による統計情報と、前記問合せ情報に関する前記ネットワーク性能指標情報の値を比較し、ネットワーク性能に有意の差があるときに、前記利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化することを特徴とする請求項１記載のネットワーク障害分析装置。

【請求項8】

ネットワーク障害分析装置により、ネットワーク上の機器による監視データまたはネットワークを構成する機器のログを収集するネットワーク障害分析方法であって、
前記ネットワーク障害分析装置は、
ネットワークを構成する機器のログと、
ネットワークの監視データ
ネットワークの通信経路情報と、
利用者からの問合せ情報とを保持し、
前記利用者からの問合せ情報は、問合せに関するネットワークの事象が発生した日時、問合せに関するネットワークの事象の事象内容、利用サイト、通信した機器のアドレスを含み、
前記利用者からの問合せ情報グループ化するためのパターン化されたルールにネットワーク事象が発生した時刻、問合せに関するネットワークの事象の事象内容、利用サイト、通信した機器のアドレスに関するルールが含まれ、
前記利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化するステップと、
前記グループ化された問合せ情報に含まれる機器情報に基づいて、グループ化された各々の問合せ情報に関する通信の通信経路情報を求めるステップと、
前記通信経路情報の通信経路のノードに対応する機器情報に基づいて、前記利用者からの問合せ情報に関連するログと監視データを取得するステップとを有することを特徴とするネットワーク障害分析方法。

【請求項9】

取得する前記利用者からの問合せ情報に関連するログと監視データは、問合せに関するネットワークの事象が発生した日時の前後の所定の時間間隔に関するデータであることを特徴とする請求項８記載のネットワーク障害分析方法。

【請求項10】

さらに、ネットワーク障害分析装置は、ネットワークに関する性能を計測して、ネットワークの性能に関する統計情報を格納するネットワーク性能指標情報を保持し、
前記利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化するステップは、
前記利用者からの問合せ情報に含まれる機器のネットワーク性能を計測して、計測したネットワーク性能の計測値による統計情報と、前記問合せ情報に関する前記ネットワーク性能指標情報の値を比較し、ネットワーク性能に有意の差があるときに、実行されることを特徴とする請求項８記載のネットワーク障害分析方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ネットワーク障害分析装置およびネットワーク障害分析方法に係り、特に、ユーザの問い合わせに基づいて、ネットワークの障害に対して、迅速、かつ、的確に対処するのに好適なネットワーク障害対応に必要なデータを抽出する方法に関する。

【背景技術】

【0002】

近年、リモート業務への移行やモバイル端末の利用増加への対応、第５世代移動通信システムやＳＤＮ（Software Defined Network）といった技術の進展により、企業ネットワークの運用を代行するサービスや、ネットワークの運用機能を提供するサービスに対するニーズが増大している。

【0003】

このようなネットワークの運用サービスでは、複数の手段を組み合わせてネットワークの監視を行うことが多く、複数の監視手段によって得られる監視データや機器の動作ログを統合的に利用することにより、個々のネットワーク機器の障害やセキュリティインシデントに対応するだけではなく、ユーザ視点でネットワークの品質を維持することが重要となっている。そこでは、ネットワーク障害が個々の監視で検知できない場合でも、ユーザに影響を与えているネットワーク上の不具合を把握して、不具合への対応を迅速に行うことが重要となる。

【0004】

従来、このようなネットワークの運用監視を行う方法としては、例えば、特許文献１に開示がある。特許文献１では、業務アプリケーションの障害検知結果と通信経路情報を用いてネットワーク機器の障害を推定するネットワーク障害解析システムが記載されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０１４－２３９３１５号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

特許文献１に記載された技術によれば、複数の業務アプリケーションの障害検知結果と通信経路情報から、各業務アプリケーションの通信経路上の重複するネットワーク機器での障害発生を推定することにより、ネットワーク機器の監視で明らかに障害が検知できていなくてもネットワーク上の不具合への対応時間を短縮することが可能である。

【0007】

しかしながら、業務アプリケーションで明らかな障害が発生していない場合にはネットワーク上の不具合の把握が困難であり、不具合の発見から対応までの時間を短縮することはできない。また、従来技術では、ユーザからの問い合わせ情報を有効活用にして、ネットワーク障害を原因を分析する手段については示唆されていない。

【0008】

本発明の目的は、ネットワークの運用サービスを提供するにあたり、利用者からの問い合わせ情報を有効活用し、ネットワークの不具合を事前に解決するか、あるいは、障害が起こったときに、対策のため時間を短縮し、迅速に対処することを可能にするネットワーク障害分析装置およびネットワーク障害分析方法を提供することにある。

【課題を解決するための手段】

【0009】

本発明のネットワーク障害分析装置の構成は、好ましくは、ネットワーク上の機器による監視データまたはネットワークを構成する機器のログを収集するネットワーク障害分析装置であって、ネットワークを構成する機器のログと、ネットワークの監視データと、ネットワークの通信経路情報と、利用者からの問合せ情報とを保持し、利用者からの問合せ情報を、パターン化されたルールに基づいてグループ化し、グループ化された問合せ情報に含まれる機器情報に基づいて、グループ化された各々の問合せ情報に関する通信の通信経路情報を求め、通信経路情報の通信経路のノードに対応する機器情報に基づいて、利用者からの問合せ情報に関連するログと監視データを取得するようにしたものである。

【発明の効果】

【0010】

本発明によれば、ネットワークの運用サービスを提供するにあたり、利用者からの問い合わせ情報を有効活用し、ネットワークの不具合を事前に解決するか、あるいは、障害が起こったときに、対策のため時間を短縮し、迅速に対処することを可能にするネットワーク障害分析装置およびネットワーク障害分析方法を提供することができる。

【図面の簡単な説明】

【0011】

【図1】ネットワーク障害分析システムのシステム構成図である。

【図2】ネットワーク障害分析システムの各コンポーネントの機能構成図である。

【図3】ネットワーク障害分析システムの各コンポーネントのハードウェア・ソフトウェア構成図である。

【図4】機器監視情報テーブルの一例を示す図である。

【図5】ネットワーク監視情報ＤＢのログ管理テーブルの一例を示す図である。

【図6】セキュリティ監視情報ＤＢのログ管理テーブルの一例を示す図である。

【図7】サービス監視情報テーブルの一例を示す図である。

【図8】サービス監視情報ＤＢのログ管理テーブルの一例を示す図である。

【図9】インシデント管理テーブルの一例を示す図である。

【図10】構成管理テーブルの一例を示す図である。

【図11】モデル機器情報テーブルの一例を示す図である。

【図12】モデル業務情報テーブルの一例を示す図である。

【図13】ネットワーク性能情報テーブルの一例を示す図である。

【図14】ネットワーク性能指標テーブルの一例を示す図である。

【図15】通信経路情報テーブルの一例を示す図である。

【図16】図１５の通信経路情報テーブルのデータに従う通信経路を示す図である。

【図17】問合せグループ情報テーブルの一例を示す図である。

【図18】監視データグループ情報テーブルの一例を示す図である。

【図19】問合せ傾向分析部によるネットワーク性能分析の処理を示すフローチャートである。

【図20】問合せ傾向分析部による問合せ傾向分析処理を示すフローチャートである。

【図21】問合せのグループ化ルールを行うためのグループ化ルールテーブルの一例示す図である。

【図22】関連データ分析部による関連データ収集処理を示すフローチャートである。

【図23A】運用端末に表示されるネットワーク障害分析画面の一例を示す図である（その一）。

【図23B】運用端末に表示されるネットワーク障害分析画面の一例を示す図である（その二）

【発明を実施するための形態】

【0012】

以下、本発明に係る一実施形態を、図１ないし図２３Ｂを用いて説明する。

【0013】

本実施形態は、ネットワーク運用サービスを提供するにあたり、障害が疑われるユーザからの問合せ情報を使用して不具合の発生を推定し、その時刻情報、通信経路情報に基づいて、ネットワーク監視、セキュリティ監視のアラートやログの中から関連度の高い情報をまとめて運用者に提供することにより、ネットワーク上で明らかな障害が発生していない場合には、ネットワークシステムの運用者に対して、事前に対策することを可能とし、障害が起こったときには、対策のため時間を短縮し、迅速に対処することを可能にするネットワーク障害分析システムに関するものである。

【0014】

先ず、図１ないし図３を用いて一実施形態に係るネットワーク障害分析システムの構成について説明する。

【0015】

ネットワーク障害分析システム１は、運用対象ネットワーク機器群３、ネットワーク分析機器群２からなる。

【0016】

運用対象ネットワーク機器群３は、利用端末２０、ネットワーク機器２１、サーバ２２、サービス環境２４を有する。運用対象ネットワーク機器群３は、ネットワークＮＷ１により相互に接続されている。

【0017】

ネットワーク分析機器群２は、ネットワークの運用サービスを提供する機器群であり、運用端末４０、ネットワーク監視装置１００、セキュリティ監視装置２００、サービス監視装置３００、サービス管理装置４００、ネットワーク障害分析装置５００を有する。ネットワーク分析機器群２は、ネットワークＮＷ２により相互に接続されており、ネットワークＮＷ１とも相互に接続されている。

【0018】

ネットワークＮＷ１、ネットワークＮＷ２は、ＬＡＮ(Local Area Network)でもよいし、インターネットのようなグローバルネットワークでもよい。また、有線でもよいし、Ｗｉｆｉのような無線ネットワークであってもよい。

【0019】

ここで、利用者１０は、利用端末２０からサービス環境２４を利用して業務を行う者、また、サーバ２２の機能を利用する者を想定しており、利用者１０の人数は、一人でもよく、また二人以上でもよい。

【0020】

利用端末２０は、利用者１０がサービス利用のために使用する情報処理装置であり、例えば、スマートフォン、タブレット、ラップトップＰＣ、デスクトップＰＣなどである。

【0021】

ネットワーク機器２１は、スイッチングハブやルータなどのネットワーク通信に使用される機器である。

【0022】

サーバ２２は、利用端末２０をクライアントとして、ストレージサービス、アプリケーションソフトウェア実行サービス、データベースサービスなどのサービスや、ＤＮＳ（Domain Name System）サービス、プロキシサービスなどのサービスを提供する情報処理装置である。

【0023】

サービス環境２４は、ネットワークを介して、利用者１０にオンラインで、サービス提供ネットワーク２３を介して、ストレージサービス、アプリケーションソフトウェア実行サービス、データベースサービスなどのサービスを提供する環境、いわゆるクラウド環境である。サーバ２２の違いは、利用者１０がシステムの内部構成を意識することなく、ネットワーク経由でサービスを利用することである。

【0024】

運用者３０は、ネットワークの運用サービスを提供する者を想定しており、運用者３０の人数は、一人でもよく、また二人以上でもよい。運用者３０は、運用端末４０に表示される情報を参照して、ネットワーク障害の調査をおこなったり、ネットワークの障害対応にあたるなどの責務を有する。

【0025】

運用端末４０は、運用者３０が作業するにあたり使用する情報処理装置であり、例えば、スマートフォン、タブレット、ラップトップＰＣ、デスクトップＰＣなどである。運用端末４０には、運用者３０に対しての監視結果などが表示される。なお、運用端末４０の提供するユーザインターフェイスは、後に説明する。

【0026】

ネットワーク監視装置１００は、ネットワーク機器２１の死活監視や状態監視、ログ収集などのネットワーク監視を行う情報処理装置である。

【0027】

セキュリティ監視装置２００は、セキュリティインシデントの監視を行い、セキュリティインシデントに対して自動的に対応することを可能にする情報処理装置である。ここで、セキュリティインシデントとは、外部からの不正アクセスや外部へのデータ流出などである。

【0028】

サービス監視装置３００は、利用端末２０からサービス環境２４を利用したときのサービス環境２４のレスポンスタイムやスループットなどのパフォーマンスを監視する情報処理装置である。

【0029】

サービス管理装置４００は、利用者からの問合せや、ネットワーク監視装置２００やセキュリティ監視装置３００、サービス監視装置４００からの通知、監視対象の利用端末２０やネットワーク機器２１、サーバ２２のＩＰアドレスなどの情報を管理する情報処理装置である。

【0030】

ネットワーク障害分析装置５００は、説明してきたネットワーク上の種々のコンポーネントの監視情報、管理情報と、ネットワークに関する問い合わせ情報に基づき、ネットワークの障害を分析する装置である。

【0031】

ネットワーク障害分析装置５００の動作の概略を示すと以下のようになる。

【0032】

利用者１０が、サービス管理装置４００に対して、問合せを行って、その問合せが登録された際に、ネットワーク障害分析装置５００は、サービス管理装置４００の管理する問合せの中から同様の事象を抽出してグループ化する。そして、ネットワーク障害分析装置５００は、グループ化した問合せの事象が発生した時刻や、その問合せの事象に関係している通信経路の情報に基づいて、ネットワーク監視装置１００、セキュリティ監視装置２００、およびサービス監視装置３００の管理する監視データの中から関連度の高いデータを抽出して、運用端末４０を介して運用者３０に提供する。運用者３０は、提供された関連度の高いデータに基づいてネットワーク上の不具合の原因を調査することができる。

【0033】

次に、図２を用いて、ネットワーク障害分析システムの各コンポーネントの機能構成を説明する。

【0034】

なお、以下の図２による説明では、ネットワーク分析機器群２の機能構成を説明する。

【0035】

ネットワーク監視装置１００は、図２に示されるように、機能構成として、ネットワーク監視部１０１、記憶部１０２を有する。

【0036】

ネットワーク監視部１０１は、ネットワーク機器２１とサーバ２２の死活監視や状態監視、ログ収集を実行して、監視結果やログを管理する機能部である。死活監視は、例えば、ｐｉｎｇコマンドによる機器の応答の確認、状態監視は、例えば、ＳＮＭＰ（Simple Network Management Protocol）のコマンドによるＣＰＵやメモリの使用率等の確認を行うことにより実行する。

【0037】

記憶部１０２は、データを記憶する機能部である。記憶部１０２は、ネットワーク監視情報ＤＢ１１０を記憶している。ネットワーク監視情報ＤＢ１１０は、ネットワーク監視装置１００で管理している各種情報を格納するデータベースである。ネットワーク監視情報ＤＢ１１０には、機器監視情報テーブル１１１、ログ管理テーブル１１２が格納されている。なお、各テーブルの詳細は、後に説明する。

【0038】

セキュリティ監視装置２００は、図２に示されるように、機能構成として、セキュリティ監視部２０１、記憶部２０２を有する。

【0039】

セキュリティ監視部２０１は、セキュリティインシデントの監視やセキュリティインシデントへの自動対応を実行して、監視結果やログを管理する機能部である。

【0040】

記憶部２０２は、データを記憶する機能部である。記憶部２０２は、セキュリティ監視情報ＤＢ２１０を記憶している。セキュリティ監視情報ＤＢ２１０は、セキュリティ監視装置２００で管理している各種情報を格納するデータベースである。セキュリティ監視情報ＤＢ２１０には、ログ管理テーブル２１２が格納されている。なお、テーブルの詳細は、後に説明する。

【0041】

サービス監視装置３００は、図２に示されるように、機能構成として、サービス監視部３０１、記憶部３０２を有する。

【0042】

サービス監視部３０１は、利用端末２０から利用するサービス環境２４のパフォーマンス監視やログ収集を実行して、監視結果やログを管理する機能部である。

【0043】

記憶部３０２は、データを記憶する機能部である。記憶部３０２は、サービス監視情報ＤＢ３１０を記憶している。サービス監視情報ＤＢ３１０は、サービス監視装置３００で管理している各種情報を格納するデータベースである。サービス監視情報ＤＢ３１０には、サービス監視情報テーブル３１１、ログ管理テーブル３１２が格納されている。なお、各テーブルの詳細は、後に説明する。

【0044】

サービス管理装置４００は、図２に示されるように、機能構成として、サービス管理部４０１、記憶部４０２を有する。

【0045】

サービス管理部４０１は、利用者１０からの問合せや、ネットワーク監視装置１００、セキュリティ監視装置２００、サービス監視装置３００からの通知を受信して、それらの通知に関する情報を管理する機能部である。

【0046】

記憶部４０２は、データを記憶する機能部である。記憶部４０２は、サービス管理情報ＤＢ４１０を記憶している。サービス管理情報ＤＢ４１０は、サービス管理装置４００で管理している各種情報を格納するデータベースである。サービス管理情報ＤＢ４１０には、インシデント管理テーブル４１１、構成管理テーブル４１２が格納されている。なお、各テーブルの詳細は、後に説明する。

【0047】

ネットワーク障害分析装置５００は、図２に示されるように、機能構成として、問合せ傾向分析部５０１、関連データ収集部５０２、記憶部５０３を有する。

【0048】

問合せ傾向分析部５０１は、利用者１０からの問合せの中から類似の問合せを抽出してグループ化し管理する機能部である。

【0049】

関連データ収集部５０２は、グループ化した問合せに対して、その事象と関連度の高い監視データやログを抽出して管理する機能部である。

【0050】

記憶部５０３は、データを記憶する機能部である。記憶部５０３は、連携管理情報ＤＢ５１０を記憶している。連携管理情報ＤＢ５１０は、ネットワーク障害分析装置５００で管理している各種情報を格納するデータベースである。連携管理情報ＤＢ５１０には、モデル機器情報テーブル５１１、モデル業務情報テーブル５１２、ネットワーク性能情報テーブル５１３、ネットワーク性能指標テーブル５１４、通信経路情報テーブル５１５、問合せグループ情報テーブル５１６、監視データグループ情報テーブル５１７が格納されている。なお、各テーブルの詳細は、後に説明する。

【0051】

次に、図３を用いて、ネットワーク障害分析システムの各コンポーネントのハードウェア・ソフトウェア構成について説明する。なお、図３による説明では、ネットワーク分析機器群２の中で、ネットワーク監視装置１００、セキュリティ監視装置２００、サービス監視装置３００、サービス管理装置４００、ネットワーク障害分析装置５００について詳細に説明する。

【0052】

ネットワーク監視装置１００は、図３に示されるような一般的なサーバ装置などの情報処理装置で実現することができる。ネットワーク監視装置１００は、ハードウェアとして、ＣＰＵ（Central Processing Unit）１２１、主メモリ１２２、補助記憶装置１２３、通信Ｉ／Ｆ（Interface）１２４が、バス１２５により接続された形態である。

【0053】

ＣＰＵ１２１は、ネットワーク監視装置１００の各部を制御し、主メモリ１２２上にロードされたプログラムを実行するプロセッサである。

【0054】

主メモリ１２２は、ＲＡＭ（Random Access Memory）のような高速で動作する揮発性の半導体記憶装置であり、プログラムとワークデータを記憶する。補助記憶装置１２３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）などの大容量の磁気記憶装置や半導体記憶装置である。

【0055】

補助記憶装置１２３には、ネットワーク監視プログラム１０１ｐがインストールされている。ネットワーク監視プログラム１０１ｐは、ネットワーク監視部１０１の機能を実行するプログラムである。

【0056】

また、補助記憶装置１２３には、ネットワーク監視情報ＤＢ１１０が格納されている。

【0057】

通信Ｉ／Ｆ１２４は、ネットワークＮＷ１、ＮＷ２を介して運用対象ネットワーク機器群３、ネットワーク障害分析装置５００、運用端末４０とそれぞれネットワーク接続する装置である。

【0058】

セキュリティ監視装置２００は、図３に示されるような一般的なサーバ装置などの情報処理装置で実現することができる。セキュリティ監視装置２００は、ハードウェアとして、ＣＰＵ２２１、主メモリ２２２、補助記憶装置２２３、通信Ｉ／Ｆ２２４が、バス２２５により接続された形態である。

【0059】

ＣＰＵ２２１は、セキュリティ監視装置２００の各部を制御し、主メモリ２２２上にロードされたプログラムを実行するプロセッサである。

【0060】

主メモリ２２２は、ＲＡＭ（Random Access Memory）のような高速で動作する揮発性の半導体記憶装置であり、プログラムとワークデータを記憶する。補助記憶装置２２３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）などの大容量の磁気記憶装置や半導体記憶装置である。

【0061】

補助記憶装置２２３には、セキュリティ監視プログラム２０１ａがインストールされている。セキュリティ監視プログラム２０１ａは、セキュリティ監視部２０１の機能を実行するプログラムである。

【0062】

また、補助記憶装置２２３には、セキュリティ監視情報ＤＢ２１０が格納されている。

【0063】

通信Ｉ／Ｆ２２４は、ネットワークＮＷ１、ＮＷ２を介して運用対象ネットワーク機器群３、ネットワーク障害分析装置５００、運用端末４０とそれぞれネットワーク接続する装置である。

【0064】

サービス監視装置３００は、図３に示されるような一般的なサーバ装置などの情報処理装置で実現することができる。サービス監視装置３００は、ハードウェアとして、ＣＰＵ３２１、主メモリ３２２、補助記憶装置３２３、通信Ｉ／Ｆ３２４が、バス３２５により接続された形態である。

【0065】

ＣＰＵ３２１は、サービス監視装置３００の各部を制御し、主メモリ３２２上にロードされたプログラムを実行するプロセッサである。

【0066】

主メモリ３２２は、ＲＡＭのような高速で動作する揮発性の半導体記憶装置であり、プログラムとワークデータを記憶する。補助記憶装置３２３は、ＨＤＤ、ＳＳＤなどの大容量の磁気記憶装置や半導体記憶装置である。

【0067】

補助記憶装置３２３には、サービス監視プログラム３０１ｐがインストールされている。サービス監視プログラム３０１ａは、サービス監視部３０１の機能を実行するプログラムである。

【0068】

また、補助記憶装置３２３には、サービス監視情報ＤＢ３１０が格納されている。
通信Ｉ／Ｆ３２４は、ネットワークＮＷ１、ＮＷ２を介して運用対象ネットワーク機器群３、ネットワーク障害分析装置５００、運用端末４０とそれぞれネットワーク接続する装置である。

【0069】

サービス管理装置４００は、図３に示されるような一般的なサーバ装置などの情報処理装置で実現することができる。サービス管理装置４００は、ハードウェアとして、ＣＰＵ４２１、主メモリ４２２、補助記憶装置４２３、通信Ｉ／Ｆ４２４が、バス４２５により接続された形態である。

【0070】

ＣＰＵ４２１は、サービス管理装置４００の各部を制御し、主メモリ４２２上にロードされたプログラムを実行するプロセッサである。

【0071】

主メモリ４２２は、ＲＡＭのような高速で動作する揮発性の半導体記憶装置であり、プログラムとワークデータを記憶する。補助記憶装置４２３は、ＨＤＤ、ＳＳＤなどの大容量の磁気記憶装置や半導体記憶装置である。

【0072】

補助記憶装置４２３には、サービス管理プログラム４０１ｐがインストールされている。サービス管理プログラム４０１ａは、サービス管理部４０１の機能を実行するプログラムである。

【0073】

また、補助記憶装置４２３には、サービス管理情報ＤＢ４１０が格納されている。
通信Ｉ／Ｆ４２４は、ネットワークＮＷ１、ＮＷ２を介して運用対象ネットワーク機器群３、ネットワーク障害分析装置５００、運用端末４０とそれぞれネットワーク接続する装置である。

【0074】

ネットワーク障害分析装置５００は、図３に示されるような一般的なサーバ装置などの情報処理装置で実現することができる。ネットワーク障害分析装置５００は、ハードウェアとして、ＣＰＵ５２１、主メモリ５２２、補助記憶装置５２３、通信Ｉ／Ｆ５２４が、バス５２５により接続された形態である。

【0075】

ＣＰＵ５２１は、ネットワーク障害分析装置５００の各部を制御し、主メモリ５２２上にロードされたプログラムを実行するプロセッサである。

【0076】

主メモリ５２２は、ＲＡＭのような高速で動作する揮発性の半導体記憶装置であり、プログラムとワークデータを記憶する。補助記憶装置５２３は、ＨＤＤ、ＳＳＤなどの大容量の磁気記憶装置や半導体記憶装置である。

【0077】

補助記憶装置５２３には、問合せ傾向分析プログラム５０１ｐ、関連データ収集プログラム５０２ｐがインストールされている。問合せ傾向分析プログラム５０１Ｐは、問合せ傾向分析部５０１の機能を実行するプログラムである。関連データ収集プログラム５０２ｐは、関連データ収集部５０２の機能を実行するプログラムである。

【0078】

また、補助記憶装置５２３には、連携管理情報ＤＢ５１０が格納されている。

【0079】

通信Ｉ／Ｆ５２４は、ネットワークＮＷ２を介してネットワーク監視装置１００、セキュリティ監視装置２００、サービス監視装置３００、サービス管理装置４００、運用端末４０とそれぞれネットワーク接続する装置である。

【0080】

次に、図４ないし図１８を用いて、一実施形態に係るネットワーク障害分析システムで使用されるデータ構造について説明する。

【0081】

機器監視情報テーブル１１１は、ネットワーク監視結果の情報を格納するテーブルである機器監視情報テーブル１１１は、ネットワーク監視の項目に応じて、様々な形態のデータを格納しうるが、本実施形態では、死活監視に関する情報を格納するテーブルを例として説明する。

【0082】

機器監視情報テーブル１１１は、図４に示されるように、フィールドとして、日時１１１ａ、機器ＩＰアドレス１１１ｂ、送信パケット数１１１ｃ、受信パケット数１１１ｄ、パケット損失率１１１ｅを有する。

【0083】

日時１１１ａは、値として、監視データを取得した年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。機器ＩＰアドレス１１１ｂは、値として、監視対象機器のＩＰアドレスを記憶するフィールドである。送信パケット数１１１ｃは、値として、監視のために機器に送信するパケット数を記憶するフィールドである。受信パケット数１１１ｄは、値として、機器から返信されたパケット数を記憶するフィールドである。パケット損失率１１１ｅは、値として、送信したパケット数に対する返信されなかったパケット数の割合を記憶するフィールドである。

【0084】

ネットワーク監視情報ＤＢ１１０のログ管理テーブル１１２は、ネットワーク監視装置１００において、収集した機器のログを格納するテーブルである。

【0085】

ログ管理テーブル１１２は、図５に示されるように、フィールドとして、日時１１２ａ、送信元ＩＰアドレス１１２ｂ、送信元ポート１１２ｃ、送信先ＩＰアドレス１１２ｄ、送信先ポート１１２ｅ、プロトコル１１２ｄを有する。

【0086】

日時１１２ａは、値として、ログが出力された年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。送信元ＩＰアドレス１１２ｂは、ＩＰパケットを送信した機器のＩＰアドレス、例えば、サービス環境２４にリクエストを送信した利用端末２０のＩＰアドレスを記憶するフィールドである。送信元ポート１１２ｃは、送信側でＩＰパケット送信時に割り当てられるサービスのポート番号、例えば、リクエストを送信する際に使用した利用端末２０が利用するサービスのポート番号を記憶するフィールドである。送信先ＩＰアドレス１１２ｄは、ＩＰパケットの送信先のＩＰアドレス、例えば、利用端末２０からリクエストを送信したサービス環境２４のＩＰアドレスを記憶するフィールドである。送信先ポート１１２ｅは、ＩＰパケット送信先で実現されるサービスのポート番号、例えば、利用端末２０から送信したリクエストを受信するためのサービス環境２４のポート番号を記憶するフィールドである。プロトコル１１２ｆは、ＩＰ通信に用いられる規約、例えば、ＨＴＴＰ、ＰＯＰ、ＳＭＴＰを表す文字列または識別子を記憶するフィールドである。

【0087】

セキュリティ監視情報ＤＢ２１０のログ管理テーブル２１２は、セキュリティ監視で出力されたログを格納するテーブルであり、図６に示されるように、フィールドとして、日時２１２ａ、送信元ＩＰアドレス２１２ｂ、アクセス先サービス提供サーバＩＰアドレス２１２ｃ、クエリ２１２ｄ、セキュリティ対応２１２ｅを有する。

【0088】

日時２１２ａは、値として、ログが出力された年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。送信元ＩＰアドレス２１２ｂは、ＩＰパケットを送信した機器のＩＰアドレス、例えば、サービス環境２４にリクエストを送信した利用端末２０のＩＰアドレスを記憶するフィールドである。アクセス先サービス提供サーバＩＰアドレス２１２ｃは、サービスを提供するサーバのＩＰアドレス、例えば、利用端末２０からリクエストを送信したサービス環境２４のサーバのＩＰアドレスを記憶するフィールドである。クエリ２１２ｄは、サービス提供時のリクエストの内容、例えば、利用端末２０からサービス環境２４に送信されたリクエストの内容を記憶するフィールドである。セキュリティ対応２１２ｅは、サービス提供時にシステムがセキュリティ監視のために行った対応を表す文字列または識別子、例えば、利用端末２０からサービス環境２４に送信されたリクエストに対して、セキュリティ監視で実施した自動対応の内容を記憶するフィールドである。

【0089】

サービス監視情報テーブル３１１は、サービス提供時のシステムの性能諸元を格納するテーブルであり、図７に示されるように、フィールドとして、日時３１１ａ、サービス提供サーバＩＰアドレス３１１ｂ、レスポンスタイム３１１ｃ、スループット３１１ｄを有する。

【0090】

日時３１１ａは、値として、監視データを取得した年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。サービスアドレス提供サーバＩＰアドレス３１１ｂは、サービスを提供するサーバのＩＰアドレス、例えば、監視対象のサービス環境２４のサーバのＩＰアドレスを記憶するフィールドである。レスポンスタイム３１１ｃは、送信したＩＰパケットのレスポンスタイム、例えば、サービス環境２４にリクエストを送信してレスポンスが返ってくるまでの時間をミリ秒単位で記憶するフィールドである。スループット３１１ｄは、ＩＰパケットに関するスリープットに関する計量、例えば、サービス環境２４において単位時間当たりに処理したトランザクション数を記憶するフィールドである。

【0091】

サービス監視情報ＤＢ３１０のログ管理テーブル３１２は、サービスを提供するシステムのログを格納するテーブルあり、図８に示されるように、フィールドとして、日時３１２ａ、サービス提供サーバＩＰアドレス３１２ｂ、メッセージ３１２ｃを有する。

【0092】

日時３１２ａは、値として、ログが出力された年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。サービス提供サーバＩＰアドレス３１２ｂは、サービス提供時の監視対象となるサーバのＩＰアドレス、例えば、サービス環境２４のサーバのＩＰアドレスを記憶するフィールドである。メッセージ３１２ｃは、サービス提供時にシステムが出力したメッセージ、例えば、サービス環境２４が出力したメッセージをテキスト形式で記憶するフィールドである。

【0093】

インシデント管理テーブル４１１は、利用者１０からの問い合わせ情報に関するデータを格納するテーブルであり、図９に示されるように、フィールドとして、インシデントＩＤ４１１ａ、発生日時４１１ｂ、登録日時４１１ｃ、事象内容４１１ｄ、利用端末ＩＤ４１１ｅ、利用端末ＩＰアドレス４１１ｆ、利用サイト４１１ｇ、サービス環境名４１１ｈ、サービス環境提供サーバＩＰアドレス４１１ｉを有する。

【0094】

インシデントＩＤ４１１ａは、値として、問合せなどのインシデントを一意に特定する識別子（インシデントＩＤ）を記憶するフィールドである。発生日時４１１ｂは、値として、インシデントが発生した年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。発生日時４１１ｂの情報は、利用者１０からの問い合わせがあったときに利用者１０にアンケートすることにより得られる情報であり、ネットワークの不具合事象などのネットワークに関する事象が発生したと利用者１０が報告した日時である。登録日時４１１ｃは、値として、利用者１０からの問合せをインシデントとして登録した年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。事象内容４１１ｄは、利用者１０からの問合せの内容をテキスト形式で記憶するフィールドである。利用端末ＩＤ４１１ｅは、利用者１０が利用している利用端末２０を一意に特定する識別子（利用端末ＩＤ）を記憶するフィールドである。利用端末ＩＰアドレス４１１ｆは、利用者１０が利用している利用端末２０のＩＰアドレスを記憶するフィールドである。利用サイト４１１ｇは、利用者１０が利用端末２０を利用している場所の情報をテキスト形式で記憶するフィールドである。利用サイト４１１ｇの情報は、例えば、事業所の支店名などの情報である。サービス環境名４１１ｈは、利用者が利用端末２０から利用したサービスの名称をテキスト形式で記憶するフィールドである。サービス環境提供サーバＩＰアドレス４１１ｉは、利用者が利用端末２０から利用したサービスを提供するサーバのＩＰアドレスを記憶するフィールドである。

【0095】

なお、利用者からの問い合わせで、利用者が必要な情報を入力しなかったときなど、ネットワークの不具合事象の発生日時が不明なときには、デフォルトとして、発生日時４１１ｂの値を、登録日時４１１ｃの値と同一のものにして運用してもよい。

【0096】

構成管理テーブル４１２は、サービスを提供する利用端末２０、ネットワーク機器２１、サーバ２２などの機器のハードウェア構成、ネットワーク構成情報を格納するテーブルであり、図１０に示されるように、フィールドとして、機器ＩＤ４１２ａ、ＭＡＣアドレス４１２ｂ、ＩＰアドレス４１２ｃ、利用者４１２ｄ、利用サイト４１２ｅ、機器種別４１２ｆを有する。

【0097】

機器ＩＤ４１２ａは、値として、利用端末２０、ネットワーク機器２１、サーバ２２を一意に特定する識別子（機器ＩＤ）を記憶するフィールドである。ＭＡＣアドレス４１２ｂは、値として、利用端末２０、ネットワーク機器２１、サーバ２２のＭＡＣアドレスを記憶するフィールドである。ＩＰアドレス４１２ｃは、値として、機器のＩＰアドレスを記憶するフィールドである。利用者４１２ｄは、値として、機器の利用者または管理者の所属や氏名をテキスト形式で記憶するフィールドである。利用サイト４１２ｅは、値として、利用端末２０、ネットワーク機器２１、サーバ２２を利用している場所の情報をテキスト形式で記憶するフィールドである。機器種別４１２ｆは、値として、機器の種別をテキスト形式で記憶するフィールドである。

【0098】

モデル機器情報テーブル５１１は、ネットワーク性能を測定するモデルとなるモデル機器の情報を格納するテーブルであり、図１１に示されるように、フィールドとして、機器ＩＤ５１１ａ、ＭＡＣアドレス５１１ｂ、ＩＰアドレス５１１ｃ、利用サイト５１１ｄを有する。

【0099】

機器ＩＤ５１１ａは、値として、利用者１０が利用している利用端末２０を一意に特定する識別子（機器ＩＤ）を記憶するフィールドである。ＭＡＣアドレス５１１ｂは、値として、モデル機器のＭＡＣアドレスを記憶するフィールドである。ＩＰアドレス５１１ｃは、値として、モデル機器のＩＰアドレスを記憶するフィールドである。利用サイト１１０３は、値として、利用者１０が利用端末２０を利用している場所の情報をテキスト形式で記憶するフィールドである。

【0100】

モデル業務情報テーブル５１２は、ネットワーク性能を測定するモデルとなるモデル業務の情報を格納するテーブルであり、図１２に示されるように、フィールドとして、サービスＩＤ５１２ａと、サービス環境名５１２ｂと、サービス環境提供サーバＩＰアドレス５１２ｃを有する。

【0101】

サービスＩＤ５１２ａは、値として、利用者１０が利用しているモデル業務のサービス環境２４を一意に特定する識別子（サービスＩＤ）を記憶するフィールドである。サービス環境名５１２ｂは、値として、モデル業務のサービス環境２４の名称をテキスト形式で記憶するフィールドである。サービス環境提供サーバＩＰアドレス５１２ｃは、値として、モデル業務を提供するサービス環境２４のサーバのＩＰアドレスを記憶するフィールドである。

【0102】

ネットワーク性能情報テーブル５１３は、ネットワーク性能の計測結果を格納するテーブルであり、図１３に示されるように、フィールドとして、機器ＩＤ５１３ａ、サービスＩＤ５１３ｂ、計測日時５１３ｃ、計測値５１３ｄを有する。

【0103】

機器ＩＤ５１３ａは、値として、ネットワーク性能の計測時に使用した機器を一意に特定する識別子（機器ＩＤ）を記憶するフィールドである。サービスＩＤ５１３ｂは、値として、ネットワーク性能の計測時に使用したサービス環境２４を一意に特定する識別子（サービスＩＤ）を記憶するフィールドである。計測日時５１３ｃは、値として、ネットワーク性能を計測した年月日と時刻を、yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。計測値５１３ｄは、値として、計測したネットワーク性能値を記憶するフィールドである。計測値５１３ｄは、例えば、利用端末２０からサービス環境２４にリクエストを送信した際のミリ秒単位のレスポンスタイムである。

【0104】

ネットワーク性能指標テーブル５１４は、平常時のネットワーク性能に関する計測値の統計的情報を格納するテーブルであり、図１４に示されるように、フィールドとして、機器ＩＤ５１４ａ、サービスＩＤ５１４ｂ、計測値平均５１４ｃ、計測値標準偏差５１４ｄ、データ数５１４ｅ、計測期間５１４ｆを有する。

【0105】

機器ＩＤ５１４ａは、値として、ネットワーク性能の計測時に使用した機器を一意に特定する識別子（機器ＩＤ）を記憶するフィールドである。サービスＩＤ５１４ｂは、値として、ネットワーク性能の計測時に使用したサービス環境２４を一意に特定する識別子（サービスＩＤ）を記憶するフィールドである。計測値平均５１４ｃは、値として、計測値の平均値を記憶するフィールドである。計測値標準偏差５１４は、値として、計測したネットワーク性能値の標準偏差を記憶するフィールドである。データ数５１４ｅは、値として、計測値平均５１４ｃと計測値標準偏差５１４ｄを算定するために使用したデータ数を記憶するフィールドである。計測期間５１４ｆは、値として、計測値平均５１４ｃと計測値標準偏差５１４ｄを算定するために使用したデータの測定期間の開始と終了の年月日と時刻を、yyyy/mm/dd hh:mm:ss～yyyy/mm/dd hh:mm:ssの形式で記憶するフィールドである。

【0106】

通信経路情報テーブル５１５は、利用端末２０からサービス環境２４までの通信経路情報を格納するテーブルであり、図１５に示されるように、フィールドとして、経路ＩＤ５１５ａ、始点５１５ｂ、終点５１５ｃ、経由ノード５１５ｄ、通信元ノード５１５ｅ、通信先ノード５１５ｆを有する。

【0107】

経路ＩＤ５１５ａは、値として、利用端末２０からサービス環境２４までの通信経路を一意に特定する識別子（経路ＩＤ）を記憶するフィールドである。始点５１５ｂは、値として、経路の始点となる利用端末２０の機器ＩＤを記憶するフィールドである。終点５１５ｃは、値として、経路の終点となるサービス環境２４のサービスＩＤを記憶するフィールドである。経由ノード５１５ｄは、通信経路に含まれるノードを一意に特定する識別子であり、値として、利用端末２０、ネットワーク機器２１、サーバ２２、サービス環境２４のいずれかの機器ＩＤを記憶するフィールドである。通信元ノード５１５ｅは、経由ノード５１５ｄにパケットを送信するノードを一意に特定する識別子であり、値として、利用端末２０、ネットワーク機器２１、サーバ２２のいずれかの機器ＩＤを記憶するフィールドである。通信先ノード５１５ｅは、経由ノード５１５ｄからパケットを受信するノードを一意に特定する識別子であり、値として、ネットワーク機器２１、サーバ２２、サービス環境２４のいずれかの機器ＩＤもしくはサービス環境２４のサービスＩＤを記憶するフィールドである。

【0108】

なお、通信元ノード５１５ｅが、「Ｎｏｎｅ」のときには、経由ノード５１５ｄの値は、始点５１５ｂの値と一致させ、通信先ノード５１５ｆが、「Ｎｏｎｅ」のときには、経由ノード５１５ｄの値は、終点５１５ｃの値と一致させるものとする。

【0109】

図１５に格納された情報の通信路をグラフで示すと、図１６のようになる。

【0110】

問合せグループ情報テーブル５１６は、グループ化した問合せの情報を格納するテーブルであり、図１７に示されるように、フィールドとして、グループＩＤ５１６ａ、インシデントＩＤ５１６ｂ、ステータス５１６ｃを有する。

【0111】

グループＩＤ５１６ａは、値として、問合せのグループを一意に特定する識別子（グループＩＤ）を記憶するフィールドである。インシデントＩＤ５１６ｂは、値として、グループに属するインシデントを一意に特定する識別子（インシデントＩＤ）をリスト形式で記憶するフィールドである。ステータス５１６ｃは、値として、グループ化した問合せへの対応が完了したかのステータスをテキスト形式で記憶するフィールドである。

【0112】

監視データグループ情報テーブル５１７は、問合せのグループと関連度の高い監視データを関連付けて格納するテーブルであり、図１８に示されるように、ＪＳＯＮ（JavaScript Object Notation）形式で監視データを記憶する。ここで、ＪＳＯＮ形式は、{“key”:“value”}のように、キーと値をコロンで区切って記述する形式である。

【0113】

次に、図１９ないし図２２を用いて、ネットワーク障害分析装置の行う処理について説明する。

【0114】

先ず、図１９を用いて、問合せ傾向分析部によるネットワーク性能分析の処理について説明する。問合せ傾向分析部５０１によるネットワーク性能分析の処理は、平常時のネットワーク性能値の傾向を把握することを目的として定期的に行われる処理である。

【0115】

ネットワーク障害分析装置５００の問合せ傾向分析部５０１は、利用者１０が使用する利用端末２０の中からネットワーク性能値の計測対象とするモデル機器を選択する（Ｓ１０１）。具体的には、例えば、利用端末２０が接続されているネットワークや機器の利用場所を広く網羅するように、ランダムに機器を選択する。

【0116】

次に、問合せ傾向分析部５０１は、選択した利用端末２０で利用者１０が実施する業務の中からネットワーク性能値の計測対象とするモデル業務を選択する（Ｓ１０２）。具体的には、例えば、ＤＮＳ（ＤｏｍａｉｎＮａｍｅＳｙｓｔｅｍ）サーバのログを取得して、Ｓ１０１で選択したモデル機器から閲覧や操作などのリクエストを送信したサーバのＩＰアドレスを取得する。利用端末２０からリクエストを送信するサーバでは、利用者１０が業務で使用する機能やデータが提供されていると考えられる。その中からモデル機器全体でリクエスト数の平均値がしきい値Ｔｈ_Ｍｅａｎより大きいサーバと、各モデル機器でリクエスト数がしきい値Ｔｈ_Ｒｅｑより大きいサーバをモデル業務として選択する。ここで、Ｔｈ_Ｍｅａｎ、Ｔｈ_Ｒｅｑは事前に定められる値である。

【0117】

次に、問合せ傾向分析部５０１は、Ｓ１０１およびＳ１０２で選択したモデル機器およびモデル業務について、ネットワーク性能値を計測する（Ｓ１０３）。

【0118】

具体的には、例えば、各モデル機器でモデル業務のリクエストを送信した際のレスポンス時間を計測して、ネットワーク性能値としてネットワーク性能情報テーブル５１３に格納する。

【0119】

次に、問合せ傾向分析部５０１は、Ｓ１０３で計測して格納されたネットワーク性能値からネットワーク性能指標を計算する（Ｓ１０４）。具体的には、例えば、各モデル機器のモデル業務ごとに、過去Ｍ日分のネットワーク性能値の平均および標準偏差を算出して、ネットワーク性能指標としてネットワーク性能指標テーブル５１４に格納する。

【0120】

次に、図２０および図２１を用いて問合せ傾向分析部による問合せ傾向分析処理について説明する。

【0121】

問合せ傾向分析部による問合せ傾向分析処理は、利用者１０からの問合せがあった際に関連する問合せをグループ化することを目的として問合せが発生する度に行なわれる処理である。

【0122】

ネットワーク障害分析装置５００は、問合せ傾向分析部５０１は、サービス管理装置４００のサービス管理部４０１から新規にインシデント管理テーブル４１１に登録された問合せ情報を取得する（Ｓ２０１）。具体的には、例えば、メッセージング基盤やＷｅｂＡＰＩ（Application Programming Interface）を介して、サービス管理部４０１から新規に登録された問合せのインシデントＩＤ９０１を受信し、サービス管理部４０１が提供するインシデント情報取得用のＡＰＩにより、インシデントＩＤ９０１をパラメータとして指定して問合せ情報を取得する。

【0123】

次に、問合せ傾向分析部５０１は、問合せのあった機器および利用サービスについて、ネットワーク性能値を計測する（Ｓ２０２）。具体的には、例えば、問合せのあった機器で利用サービスのリクエストを送信した際のレスポンス時間を計測する。ここで、レスポンス時間の計測値をＴｒとする。

【0124】

次に、問合せ傾向分析部５０１は、計測したネットワーク性能値が平常時と比べて有意な差があるかを判定し（Ｓ２０３）、有意の差があるときには（Ｓ２０３:ＹＥＳ）、Ｓ２０４の処理に進み、それ以外の場合には（Ｓ２０３:ＮＯ）、問合せ傾向分析部５０１の処理は終了する。

【0125】

具体的には、例えば、問合せのあった機器の機器ＩＤ、利用サイト、利用サービスの情報をインシデント管理テーブル４１１から取得して、モデル機器情報テーブル５１１から機器ＩＤもしくは利用サイトが一致するモデル機器の機器ＩＤを取得する。そして、ネットワーク性能指標情報テーブル５１４からモデル機器ＩＤおよびサービスＩＤが一致するネットワーク性能指標（計測値平均５１４ｃおよび計測値標準偏差５１４ｄ）を取得する。ここで、取得した計測値の平均の値をμ、計測値の標準偏差の値をσとする。そして、Ｓ４０２で計測したネットワーク性能値Ｔｒと計測値平均μ、計測値標準偏差σについて、μ＋３σ＜Ｔｒの関係が成り立つ場合、すなわち、ネットワーク性能値が正規分布に従うと仮定したときに、そのばらつきの範囲から計測したネットワーク性能値Ｔｒが有意に逸脱した場合には（ネットワークが正常であり、かつ、Ｔｒがこの領域にある可能性は、理論的に０．１５％であると評価される）、Ｔｒが平常時と比べて異常値を示していると判定する。

【0126】

このように、問合せに関連するネットワークの性能を測定して、異常があったと認められるときに、初めてネットワークの障害分析を行うようにしているのは、利用者１０から問合せがあったインシデントについて、全てネットワークに異常があるとは限らないために、運用者３０のむだな作業が発生するのを防止するためである。

【0127】

次に、問合せ傾向分析部５０１は、Ｓ２０３の判定の結果、計測したネットワーク性能値が異常値を示していると判定された場合に、問合せ情報のグループ化ルールに基づいて問合せ情報をグループ化する（Ｓ２０４）。具体的には、例えば、インシデント管理テーブル４１１から新規の問合せの発生日時４１１ｂ、事象内容４１１ｄ、利用サイト４１１ｇ、サービス環境提供サーバＩＰアドレス４１１ｉを取得して、例えば、図２１のグループ化ルールテーブルで定義されたルールに従い問合せが属するグループを判定する。そして、グループ化された問合せのインシデントを、問合せグループ情報テーブル５１１に、それぞれのグループを一レコードとして格納する。

【0128】

図２１に示されグループ化ルールテーブルは、フィールドとして、ルールＩＤ５２０ａ、発生日時５２０ｂ、事象内容５２０ｃ、利用サイト５２０ｄ、サービス環境提供サーバＩＰアドレス５２０ｅ、判定グループ５２０ｆを有する。

【0129】

ルールＩＤ５２０ａは、ルールを一意的に識別する識別子を意味し、判定グループ５２０ｆは、発生日時５２０ｂ、事象内容５２０ｃ、利用サイト５２０ｄ、サービス環境提供サーバＩＰアドレス５２０ｅの値に従って、問い合わせのインシデントが属するグループを意味する。

【0130】

発生日時５２０ｂ、事象内容５２０ｃ、利用サイト５２０ｄ、サービス環境提供サーバＩＰアドレス５２０ｅの値として、「Ｓ」は異なる問合せインシデントの対応する項目（発生日時、事象内容、利用サイト、サービス環境提供サーバＩＰアドレスのいずれか）を比較して、その項目が同一であることを意味する。また、「Ｄ」は、異なる問合せの対応する項目を比較して、その項目が異なることを意味する。ただし、発生日時については、発生日時の差があらかじめ定めたしきい値以下であれば同一であるとする。

【0131】

図９の問合せのインシデントの例では、例えば、発生日時の差のしきい値を１時間とすると、インシデントＩＤ４１１ａ「ＩＮ０００１」とインシデントＩＤ４１１ａ「ＩＮ０００２」は、発生日時４１１ｂの差がしきい値（例えば、５分）以下であり、事象内容４１１ｄ、利用サイト４１１ｇ、サービス環境提供サーバＩＰアドレス４１１ｉが同一であるため、ルールＩＤ５２０ａ「ＲＬ０００１」に適合するため、同一のＡグループとする。また、インシデントＩＮ０００３については、インシデントＩＤ４１１ａ「ＩＮ０００１」とインシデントＩＤ４１１ａ「ＩＮ０００２」と発生日時４１１ｂの差がしきい値以下であり、事象内容４１１ｄ、サービス環境提供ＩＰアドレス４１１ｉは同一であるが、利用サイト４１１ｇ（「品川サイト」）が異なるため、同一のグループとしない。

【0132】

なお、図９の事象内容４１１ｄは、定型文字列「レスポンス遅延」のように記載されているが、利用者の問い合わせ内容を一定文字数内のフリーフォーマットとして記録し、規定のテンプレート文字列と文字列の類似度判定を行い、類似度が一定のしきい値内にあるときには、それらの文字列は、同一とみなして、図２１の「Ｓ」、「Ｄ」判定を行うようにしてもよい。なお、文字列の類似度判定は、コサイン類似度（Cosine Similarity）、レーベンシュタイン距離（Levenshtein Distance）、Jaccard係数（Jaccard Coefficient）、ロングテイル（Long Tail）類似度などの手法を用いることができる。

【0133】

次に、図２２を用いて関連データ収集部による関連データ収集処理について説明する。
図２２の関連データ収集処理は、ネットワーク上の不具合の調査に必要な各種監視データや機器などのログを収集する処理である。

【0134】

関連データ収集部５０２は、グループ化された問合せ情報を取得する（Ｓ３０１）。具体的には、例えば、問合せグループ情報テーブル５１６のグループＩＤ５１６ａを一つ選択して、インシデント管理テーブルからそのグループＩＤ５１６ａに属するインシデント情報を取得する。

【0135】

次に、関連データ収集部５０２は、問合せグループに含まれる機器からその利用サービスまでの経路情報を取得する（Ｓ３０２）。具体的には、例えば、ｔｒａｃｅｒｏｕｔｅといったコマンドで、機器のＩＰアドレスと利用サービスのＩＰアドレスを指定して、機器から利用サービスまでの通信経路上にあるネットワーク機器のＩＰアドレスを取得して、そのＩＰアドレスからサービス管理装置４００に問い合わせて、構成管理テーブル４１２に格納された機器ＩＤを求めて、それを通信経路情報テーブル５１５に格納する。

【0136】

次に、関連データ収集部５０２は、問合せの原因となるネットワーク上の不具合と監視データおよびログとの関連度を判定する（Ｓ３０３）。具体的には、例えば、以下のように関連度を判定する。利用端末ＩＤおよびサービス環境ＩＤに基づき、問合せの事象が発生している利用端末２０からサービス環境への通信経路（経路ＩＤ）を通信経路情報テーブル５１５から取得する。取得した経路ＩＤに含まれるノードのＩＤ（機器ＩＤ）に基づいて、構成管理テーブル４１２から、通信経路上にあるネットワーク機器やサーバのＩＰアドレスを取得する。取得したＩＰアドレスを持つネットワーク機器やサーバの監視データおよびログと、それらの通信を監視するセキュリティサービスのログの中で、次の（１）、（２）の条件を満足する監視データおよびログについては、不具合との関連度が高いと判定する。

【0137】

（１）以下のような監視データについては、問合せのあったインシデントの発生日時の前後Ｔｎ秒のデータは関連度が高いとみなす。ここで、Ｔｎは、システムの仕様やネットワーク管理の運用によって定められるしきい値である（例えば、Ｔｎ＝６００）。
－－機器の死活監視（Ｐｉｎｇ監視）
－－機器のポート監視（Ｓｙｓｌｏｇの監視）
－－機器の温度等の状態監視（ＳＮＭＰコマンドの定期実行による監視）
－－トラフィックの監視（ＳＮＭＰコマンドの定期実行による監視）
－－リソース管理（ＳＮＭＰコマンドの定期実行による監視）
（２）以下のようなログについては、問合せのあったインシデントの発生日時の前後Ｔｎ秒で、かつ、リクエストの送信先が同じログは関連度が高いとみなす。また、問合せのあった事象の発生時刻の前後Ｔｎ秒で、かつ、リクエストの送信元が同じログは関連度が高いとみなす。
－－ファイアウォールのログ
－－ＤＮＳ（Domain Name System）のログ
－－セキュリティ監視ログ

【0138】

このように、問合せのあったインシデントの発生日時の前後の監視データやログを収集の対象とするのは、そのような監視データやログがネットワークの不具合の発生を解明する資料となる可能性が高いからである。

【0139】

なお、監視データとログの取得する前後時間のしきい値は同じものとしたが、異なったものにしてもよい。また、上の説明では、関連度のある、なしの二種類であったが、時間区分により、関連度を例えば、５段階に分類してランク付けしてもよい。

【0140】

次に、関連データ収集部５０２は、関連度が高いと判定した監視データおよびログを取得して、監視データグループ情報テーブル５１７に格納する（Ｓ３０４）。

【0141】

具体的には、例えば、ネットワーク監視部１００、セキュリティ監視部２００、サービス監視部３００が提供するＡＰＩを利用し、日時の範囲、および利用端末、ネットワーク機器、サーバ、サービス環境のＩＰアドレスを指定して監視データおよびログを取得する。日時の範囲は、グループに含まれるすべての問合せの発生日時を含む範囲とし、最初の発生日時のＴｎ秒前から最後の発生日時のＴｎ秒後までの区間とする。利用端末２０のＩＰアドレスとしては、グループに含まれる問合せに関する利用端末ＩＰアドレス４１１ｆの値をインシデント管理テーブル４１１から取得する。ネットワーク機器２１、サーバ２２のＩＰアドレスは、Ｓ３０３で取得した機器ＩＤを使用して、構成管理テーブル４１２の４１２ｃから取得する。サービス環境を提供するサーバのＩＰアドレスとしては、グループに含まれる問合せに関するインシデントに対応するインシデント管理テーブル４１１のサービス環境提供サーバＩＰアドレス４１１ｉを取得する。

【0142】

また、機器監視情報テーブル１１１から、日時１１１ａの範囲および機器ＩＰアドレス１１１ｂを指定して該当する機器のパケット損失率１１１ｅを取得する。同様に、ネットワーク監視情報ＤＢ１１０のログ管理テーブル１１２から、日時１１２ａの範囲および送信元ＩＰアドレス１１２ｂ（利用端末２０のＩＰアドレス）、送信先ＩＰアドレス１１２ｄ（サービス環境のサーバのＩＰアドレス）を指定して送信元ポート１１２ｃ、送信先ポート１１２ｅ、プロトコル１１２ｆを取得する。同様に、セキュリティ監視情報ＤＢ２１０のログ管理テーブル２１２から、日時２１２ａの範囲および送信元ＩＰアドレス２１２ｂ（利用端末２０のＩＰアドレス）、アクセス先サービス提供サーバＩＰアドレス（サービス環境のサーバのＩＰアドレス）を指定して、クエリ２１２ｄ、セキュリティ対応２１２ｅを取得する。同様に、サービス監視情報テーブル３１１から、日時３１１ａの範囲およびサービス提供サーバアドレス３１１ｂ（サービス環境のサーバのＩＰアドレス）を指定してレスポンスタイム３１１ｃ、スループット３１１ｄを取得する。同様に、サービス監視情報ＤＢ３１０のログ管理テーブル３１２から、日時３１２ａの範囲およびサービス提供サーバＩＰアドレス３１２ｂ（サービス環境のサーバのＩＰアドレス）を取得する。これらの取得したデータにグループＩＤと、各々の項目に適切なｋｅｙを付与して、監視データグループ情報テーブル５１７に対応する値を、図１８に示したようなＪＳＯＮ形式で格納する。

【0143】

次に、関連データ収集部５０２は、問合せのすべてのグループについてＳ３０１からＳ３０４の処理を繰り返し（Ｓ３０５）、問合せのすべてのグループについて処理したときに（Ｓ３０５:ＹＥＳ）、関連データ収集部による関連データ収集処理を終了する。

【0144】

運用端末４０では、監視データグループ情報テーブル５１７に格納した監視データやログを表示する。

【0145】

以下、図２３Ａおよび図２３Ｂを用いて運用端末に表示されるユーザインターフェイスの例について説明する。

【0146】

運用端末４０に表示されるネットワーク障害分析画面６００では、図２３Ａに示されるように、運用者３０がネットワークトポロジータブ６１０を選択したときに、ネットワーク障害に係る通信経路を表示する。

【0147】

また、運用端末４０に表示されるネットワーク障害分析画面６００では、図２３Ｂに示されるように、運用者３０が監視データタブ６２０を選択したときに、各利用端末２０からサービス環境２４へのリクエスト数を時系列的に示したグラフ６２１、パケット損失率を時系列的に示したグラフ６２２、ネットワーク機器２１やサーバ２２の問合せとの関連度の高いログ６２３などを表示する。また、例えば、グラフ６２１上のデータを選択することにより、より詳細な通信ログ６２４を表示する。

【0148】

本実施形態では、上述のように、問い合わせに関するインシデントをグループ化することにより、運用者が個々の問い合わせに対処するよりも効率的に、多くの問い合わせがあったネットワークの不具合に対して、効率的に対処することができ、その問い合わせに関するインシデントに関連する監視データやログの収集と分析も効率的に行えることを可能にする。

【0149】

このように、本実施形態では、障害が疑われる問合せ情報を使用してネットワーク上の不具合の発生を推定し、その時刻情報、通信経路情報に基づいて、ネットワーク監視、セキュリティ監視、サービス監視の監視データ、ログの中から関連度の高い情報をまとめて運用者に提供することにより、ネットワーク上で明らかな障害が発生していない場合でも、ネットワーク上の不具合への対応時間を短縮し、あるいは、障害が起こったときに、対策のため時間を短縮し、迅速に対処することを可能とすることができる。

【符号の説明】

【0150】

１…ネットワーク障害分析システム、２…ネットワーク分析機器群、３…運用対象ネットワーク機器群、
１０…利用者、２０…利用端末、２１…ネットワーク機器、２２…サーバ、２３…サービス提供ネットワーク、２４…サービス環境、３０…運用者、４０…運用端末、
１００…ネットワーク監視装置、１０１…ネットワーク監視部、１０２…記憶部、１１０…ネットワーク監視情報ＤＢ、
２００…セキュリティ監視装置、２０１…セキュリティ監視部、２０２…記憶部、２１０…セキュリティ監視情報ＤＢ、
３００…サービス監視装置、３０１…サービス監視部、３０２…記憶部、３１０…サービス監視情報ＤＢ、
４００…サービス管理装置、４０１…サービス管理部、４０２…記憶部、４１０…サービス管理情報ＤＢ、
５００…ネットワーク障害分析装置、５０１…問合せ傾向分析部、５０２…関連データ収集部、５０３…記憶部、５１０…連携管理情報ＤＢ、
１１１…機器監視情報テーブル、１１２…ログ管理テーブル、
２１２…ログ管理テーブル、
３１１…サービス監視情報テーブル、３１２…ログ管理テーブル、
４１１…インシデント管理テーブル、４１２…構成管理テーブル、
５１１…モデル機器情報テーブル、５１２…モデル業務情報テーブル、５１３…ネットワーク性能情報テーブル、５１４…ネットワーク性能指標テーブル、５１５…通信経路情報テーブル、５１６…問合せグループ情報テーブル、５１７…監視データグループ情報テーブル

【図1】