(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023042430
(43)【公開日】2023-03-27
(54)【発明の名称】ネットワーク監視装置、ネットワーク監視方法、及び、ネットワーク監視プログラム
(51)【国際特許分類】
H04L 43/00 20220101AFI20230317BHJP
【FI】
H04L12/26
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021149720
(22)【出願日】2021-09-14
(71)【出願人】
【識別番号】501158538
【氏名又は名称】三菱電機インフォメーションネットワーク株式会社
(71)【出願人】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110002491
【氏名又は名称】弁理士法人クロスボーダー特許事務所
(72)【発明者】
【氏名】▲高▼野 啓
(72)【発明者】
【氏名】田中 正基
【テーマコード(参考)】
5K030
【Fターム(参考)】
5K030GA14
5K030JA10
5K030MC07
5K030MC08
5K030MC09
(57)【要約】
【課題】ネットワークの監視に係る要件を同時に満たすネットワーク監視装置を提供したい。
【解決手段】ネットワーク監視装置10は、判定機構110と、集約機構130と、優先制御機構120とを備える。判定機構110は、監視対象ネットワーク20における通信を監視した結果を示す監視結果データに基づいて監視対象ネットワーク20が正常であるか異常であるかを判定する。集約機構130は、監視対象ネットワーク20が正常と判定された場合に、監視結果データに対して統計的な処理を施して正常集約データを作成する。優先制御機構120は、正常集約データを保持する正常集約キュー123を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定する判定機構と、
前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成する集約機構と、
前記正常集約データを保持する正常集約キューを有する優先制御機構と
を備えるネットワーク監視装置。
【請求項2】
前記集約機構は、前記正常集約キューの使用状況に応じて前記正常集約データの粒度を変更する請求項1に記載のネットワーク監視装置。
【請求項3】
前記集約機構は、前記監視対象ネットワークが異常と判定された場合に、前記監視結果データに対して統計的な処理を施して異常集約データを作成し、
前記優先制御機構は、前記異常集約データを保持する異常集約キューを有する請求項1又は2に記載のネットワーク監視装置。
【請求項4】
前記正常集約キューと前記異常集約キューとの各々には優先度が設定されており、
前記優先制御機構は、設定された優先度に応じて、前記正常集約キューと前記異常集約キューとの各々が保持しているデータを送信する請求項3に記載のネットワーク監視装置。
【請求項5】
コンピュータが、監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定し、
前記コンピュータが、前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成し、
前記コンピュータが、前記正常集約データを保持する正常集約キューを有するネットワーク監視方法。
【請求項6】
監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定する判定処理と、
前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成する集約処理と、
前記正常集約データを保持する正常集約キューを有する優先制御処理と
をコンピュータであるネットワーク監視装置に実行させるネットワーク監視プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ネットワーク監視装置、ネットワーク監視方法、及び、ネットワーク監視プログラムに関する。
【背景技術】
【0002】
ネットワークの使用状況及び異常の有無等を把握するために、各種の方式によるネットワーク監視システムが運用されている。
ネットワーク監視システムが監視する内容の具体例として、(1)ネットワークを構成する機器群の使用状況(CPU負荷及びメモリ使用量等)と、(2)特定の区間における疎通有無及び応答時間と、(3)通過したトラフィック量及び廃棄したトラフィック量と、(4)発生したエラーを示す情報等が挙げられる。
ネットワーク監視システムは、このような内容を定期的あるいは異常発生の都度観測し、観測したデータに基づいて、グラフ等を提示したり、ネットワークの管理者へ通知したりする。
【0003】
近年、音声通信等のストリーミング性及びリアルタイム性を必要とする通信所要が増加している。また、各種のクラウドサービスの進展に伴い、監視したいアプリケーションの数が増加している。従って、ネットワークの状態を詳細に把握するために、監視間隔を短くし、また、監視の単位を詳細化することになる。監視の単位の詳細化は、具体例として、「5分間隔より1分間隔」、「ネットワークインタフェースを通過するトラフィックの総量より、送信元、宛先、及びアプリケーションの種別等により区分したトラフィック量」である。
また、日中及び夜間等、時間帯ごとに使われるアプリケーションが異なることもある。そのため、監視のために発生するデータの総量が時間帯に応じて増減することもある。
【0004】
一方、ネットワークを監視するための通信回線である監視用回線が必要であり、発生する監視用の通信所要に対して監視用回線の帯域が少なすぎると、監視データの廃棄等が発生するために監視結果を得られない状況が発生する。
図1の(a)はこの状況をグラフとして可視化した図である。本図は、輻輳中において監視結果が欠落する様子を示している。ここで、監視用回線の帯域を監視に必要な最大量とすれば
図1の(a)に示すような状況は起こらないが、ネットワークの監視に要するコストが増大する。ここで、ネットワーク監視において満たすべき要件は下記の3要件である。
要件1:ネットワークの監視結果をもれなく通知すること。
要件2:ネットワークが正常な状態である場合に、ネットワークの監視結果の通知が遅れても構わないこと。
要件3:ネットワークが異常な状態である場合に、早期にネットワークの異常を通知すること。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2005/050931号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来、通信量を安定化するために優先制御の技術が使われている(例えば特許文献1)。優先制御は、所定の基準に基づいて通信所要をいくつかの優先度別に分類して優先度順に通信する技術であり、また、QoS(Quality of Service)と呼ばれる技術である。
特許文献1が開示する技術を利用する場合、具体例として、異常を示すトラフィックの優先度を高く設定すれば、異常を示すトラフィックを監視した結果を優先的に通知することができる。しかし、低い優先度が設定された正常なトラフィックを監視した結果が廃棄されてしまう可能性がある。従って、本例において要件3は満たされるものの要件1及び要件2が満たされない、即ち、前述の3要件を同時に満たすことができないという課題がある。
【0007】
本開示は、前述の3要件を同時に満たすネットワーク監視装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示に係るネットワーク監視装置は、
監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定する判定機構と、
前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成する集約機構と、
前記正常集約データを保持する正常集約キューを有する優先制御機構と
を備える。
【0009】
前記集約機構は、前記正常集約キューの使用状況に応じて前記正常集約データの粒度を変更する。
【0010】
前記集約機構は、前記監視対象ネットワークが異常と判定された場合に、前記監視結果データに対して統計的な処理を施して異常集約データを作成し、
前記優先制御機構は、前記異常集約データを保持する異常集約キューを有する。
【0011】
前記正常集約キューと前記異常集約キューとの各々には優先度が設定されており、
前記優先制御機構は、設定された優先度に応じて、前記正常集約キューと前記異常集約キューとの各々が保持しているデータを送信する。
【0012】
本開示に係るネットワーク監視方法は、
コンピュータが、監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定し、
前記コンピュータが、前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成し、
前記コンピュータが、前記正常集約データを保持する正常集約キューを有する。
【0013】
本開示に係るネットワーク監視プログラムは、
監視対象ネットワークにおける通信を監視した結果を示す監視結果データに基づいて前記監視対象ネットワークが正常であるか異常であるかを判定する判定処理と、
前記監視対象ネットワークが正常と判定された場合に、前記監視結果データに対して統計的な処理を施して正常集約データを作成する集約処理と、
前記正常集約データを保持する正常集約キューを有する優先制御処理と
をコンピュータであるネットワーク監視装置に実行させる。
【発明の効果】
【0014】
本開示によれば、監視対象ネットワークが正常である場合において監視結果データに対して統計的な処理を施して正常集約データを作成し、また、正常集約データを保持する正常集約キューを有する。そのため、本開示によれば、監視対象ネットワークの異常を優先的に早期に通知した場合においても、正常な状態である監視対象ネットワークに対応する監視結果として、正常集約キューが保持しているデータを遅れて通知することができる。従って、本開示によれば、前述の3要件を同時に満たすネットワーク監視装置を提供することができる。
【図面の簡単な説明】
【0015】
【
図1】ネットワークの監視結果を説明する図であり、(a)は従来技術による画面、(b)は本開示による目的画面。
【
図2】実施の形態1に係るネットワーク監視システム90の構成例を示す図。
【
図3】実施の形態1に係るネットワーク監視装置10のハードウェア構成例を示す図。
【
図4】ネットワーク監視装置10の動作を示すフローチャート。
【
図5】ネットワーク監視装置10が作成するデータを説明する図であり、(a)は監視結果データ301を示す図、(b)はタグ付き監視結果データ302を示す図、(c)は集計結果データ303を示す図。
【
図6】実施の形態1の変形例に係るネットワーク監視装置10のハードウェア構成例を示す図。
【
図7】実施の形態2に係る優先制御機構150の構成例を示す図。
【
図8】実施の形態2に係る優先制御機構150の動作を説明する図であり、(a)は初期設定時又は非輻輳時における動作を説明する図、(b)は輻輳時における動作を説明する図。
【発明を実施するための形態】
【0016】
実施の形態の説明及び図面において、同じ要素及び対応する要素には同じ符号を付している。同じ符号が付された要素の説明は、適宜に省略又は簡略化する。図中の矢印はデータの流れ又は処理の流れを主に示している。また、「機構」を、「部」、「回路」、「工程」、「手順」、「処理」又は「サーキットリー」に適宜読み替えてもよい。
【0017】
実施の形態1.
以下、本実施の形態について、図面を参照しながら詳細に説明する。
【0018】
***構成の説明***
まず、本実施の形態における目的画面を説明する。
図1の(b)は、前述した3要件をグラフとして可視化した図であり、ネットワーク監視装置10が作成するデータに基づいて生成した画面を示す図である。
図1の(b)において、
図1の(a)と異なり、(1)輻輳中であっても、異常値が即時に表示される様子と、(2)正常値を集約した結果が遅れて表示される様子とが示されている。
【0019】
図2から
図5を参照して、実施の形態1に係るネットワーク監視システム90を説明する。
図2は、ネットワーク監視システム90のシステム構成例の概要を示している。ネットワーク監視システム90は、ネットワーク監視装置10と、監視対象ネットワーク20と、管理装置30とから成る。ネットワーク監視システム90を構成する装置等は、適宜一体的に構成されていてもよい。
ネットワーク監視装置10は、監視対象ネットワーク20と、管理装置30との各々に接続している。
監視対象ネットワーク20は、ネットワーク監視装置10の監視対象である。
管理装置30は、具体例として、上位の監視装置、又はネットワーク管理者の端末である。
【0020】
ネットワーク監視装置10の概要を説明する。ネットワーク監視装置10は、計測機構100と、判定機構110と、優先制御機構120と、集約機構130と、保存機構140とを備える。
【0021】
計測機構100は、計測結果作成部101と、計測結果送信部102とを備える。計測機構100は、監視対象ネットワーク20に接続されており、監視対象ネットワーク20における通信所要を把握し、監視対象ネットワーク20におけるネットワークトラフィックを監視する。計測機構100は、netflow又はSNMP(Simple Network Management Protocol)等、公知の技術により実現されてもよい。
計測機構100は、発生したトラフィックについて具体例としてnetflowのように送信元、宛先、及びプロトコル等の別に分類し、分類したトラフィックごとにトラフィックの総量を計測する。あるいは、計測機構100は、具体例としてSNMP trapのように、監視対象ネットワーク20内の機器から異常を通知するパケットを受信する。その後、計測機構100は、監視結果データ301を作成し、作成した監視結果データ301を判定機構110に送付する。監視結果データ301は、監視対象ネットワーク20における通信を監視した結果を示す。
【0022】
判定機構110は、正常異常判定部111と、判定結果送信部112とを備える。
判定機構110は、計測機構100から受信した監視結果データ301に基づいて、監視対象ネットワーク20が正常であるか異常であるかを判定する。判定機構110の機能は、公知のデータ処理方法にて実現することができる。
具体例として、判定機構110は、トラフィック量に基づいて判定する場合に、トラフィック量が一定の閾値を超過したことをもって異常であると判定してもよい。あるいは、判定機構110は、FATAL又はERROR等の特定の識別記号又は文字列がパケット内に存在することをもって異常であると判定する。
判定機構110は、判定した結果を監視結果データ301に付与してタグ付き監視結果データ302を作成し、作成したタグ付き監視結果データ302を優先制御機構120と集約機構130との各々に送信する。
【0023】
優先制御機構120は、異常集約キュー121と、異常生キュー122と、正常集約キュー123と、正常生キュー124と、送信制御部125と、キュー状況監視部126とを備える。優先制御機構120は、管理装置30への通信経路に接続されており、ネットワーク監視装置10による監視結果を監視結果の優先度に基づいて管理装置30に通知する。
優先制御機構120は、以下に示すいくつかの処理を実行する。
(1)優先制御機構120は、監視結果データの種別に応じた優先度に対応するキューに監視結果データを登録する。監視結果データは、監視結果データ301と、タグ付き監視結果データ302と、集計結果データ303との総称である。各キューに登録されるデータは監視結果データに対応するデータであってもよい。ここで、キューには、優先度順に、異常集約キュー121と、異常生キュー122と、正常集約キュー123と、正常生キュー124との少なくとも4種類がある。即ち、各キューには優先度が設定されている。異常集約キュー121は、異常を示す監視結果であって、集約された監視結果を示すデータを保持する。異常生キュー122は、異常を示す監視結果そのものを示すデータを保持する。正常集約キュー123は、正常を示す監視結果であって、集約された監視結果を示すデータを保持する。正常生キュー124は、正常を示す監視結果そのものを示すデータを保持する。また、キューは優先制御機構120が有する各キューとの総称でもある。
なお、優先制御機構120が判定機構110から受信するデータは監視結果そのものを示す。そのため、当該データは、異常生キュー122か、正常生キュー124に登録される。
(2)優先制御機構120は、各キューに登録された監視結果データを、各キューに設定された優先度に応じて、各キューが保持しているデータを管理装置30に送信する。ここで、各キューに設定された優先度に応じて各キューからデータを送信する方法として、従来のQoS技術では、具体例として、高優先キューが空になるまで高優先キューからデータを送信することを繰り返す方法、又は、ラウンドロビン方式のように高優先キューと低優先キューとを適宜切り替えてデータを送信する方法がある。後者の方法の具体例は、高優先キューに加えて所定の割合で低優先キューからデータを送信する方法である。ここで、高優先キューは、空ではないキューのうち、優先度が最も高いキューである。低優先キューは、空ではないキューのうち、高優先キューではないキューである。優先制御機構120はどのようなQoSの方法を採用してもよい。
(3)一方、優先制御機構120は、各キューの空き容量を確認し、確認した空き容量に応じて集約期間に関する指示を生成し、生成した指示を集約機構130に通知する。集約期間は、監視結果データ301を集約する際に集約対象とする期間であり、具体例として、データを集約する時間幅、又はデータが計測された期間である。指示の内容は、具体例として、各キューの空き容量の絶対値又は割合を示す情報、集約期間を長くすること又は短くすること、あるいは集約期間を1分又は5分等の具体的な期間にすることである。また、集約期間はキューごとに異なってもよい。
【0024】
集約機構130は、集計値算出部131と、データ保存部132と、集計値送信部133とを備える。集約機構130は、監視対象ネットワーク20が正常と判定された場合に監視結果データに対して統計的な処理を施して正常集約データを作成し、監視対象ネットワーク20が異常と判定された場合に監視結果データに対して統計的な処理を施して異常集約データを作成する。正常集約キュー123は正常集約データを保持する。異常集約キュー121は異常集約データを保持する。集約機構130は、正常集約キュー123の使用状況に応じて正常集約データの粒度を変更してもよい。つまり、集約機構130は、各キューの空き容量が少ない場合に集約期間を長くしてもよい、即ち各キューに登録するデータの粒度を粗くしてもよい。また、集約機構130は、各キューの空き容量が多い場合に集約期間を短くしてもよい、即ち各キューに登録するデータの粒度を細かくしてもよい。
集約機構130は、送信元、宛先、及びプロトコル等が同じである監視結果データ301について、優先制御機構120から通知された集約期間に関する指示に応じて一定の時間範囲における集計値を求め、求めた集計値を優先制御機構120に送信する。集計値は、具体例として、計測回数と、合計値と、平均値と、最小値と、最大値と、標準偏差との少なくともいずれかである。集約機構130が監視結果データについての集計値を求めることは、監視結果データに対して統計的な処理を施すことに当たる。なお、優先制御機構120は、集約機構130が求めた集計値を異常集約キュー121又は正常集約キュー123に登録する。また、集約期間は優先制御機構120から通知された指示に基づいて定まる。集約機構130が集約期間を定めてもよい。なお、一定の時間範囲における集計値を通知することは、一定の時間範囲におけるネットワークの監視結果をもれなく通知することに当たる。
加えて、集約機構130は、監視結果データ301又はタグ付き監視結果データ302と、集計結果データ303とを保存機構140に送信する。
集約機構130は、優先制御機構120からの指示等により集約期間を長くする場合、既に求めた短い期間に対応する集計値を用いて長い期間に対応する集計値を新たに求めてもよい。
【0025】
保存機構140は、計測機構100からの監視結果及び集約機構130での集約結果を一定期間保持する、具体的には監視結果データ301又はタグ付き監視結果データ302と、集計結果データ303とを一定期間保持するデータベースである。
【0026】
図3は、ネットワーク監視装置10のハードウェア構成例を示している。
図3を参照してネットワーク監視装置10のハードウェア構成を説明する。
【0027】
ネットワーク監視装置10はコンピュータである。ネットワーク監視装置10は、プロセッサ210を備える。ネットワーク監視装置10は、プロセッサ210の他に、主記憶装置220と、補助記憶装置230と、監視用通信IF(Interface)240と、管理用通信IF250等のハードウェアを備える。プロセッサ210は、信号線260を介して、他のハードウェアと接続され、他のハードウェアを制御する。
【0028】
ネットワーク監視装置10は、機能要素として、計測機構100と、判定機構110と、優先制御機構120と、集約機構130とを備え、これらの機能は、プログラム231により実現される。
【0029】
プロセッサ210は、プログラム231を実行する装置である。プログラム231は、計測機構100と、判定機構110と、優先制御機構120と、集約機構130との各々の機能を実現するプログラムである。プロセッサ210は、演算処理を行うIC(Integrated Circuit)である。プロセッサ210の具体例は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、又はGPU(Graphics Processing Unit)である。
【0030】
主記憶装置220は記憶装置である。主記憶装置220の具体例は、SRAM(Static Random Access Memory)、又はDRAM(Dynamic
Random Access Memory)である。主記憶装置220は、プロセッサ210の演算結果を保持する。
【0031】
補助記憶装置230は、データを不揮発的に保管する記憶装置である。補助記憶装置230の具体例は、HDD(Hard Disk Drive)である。また、補助記憶装置230は、SD(登録商標)(Secure Digital)メモリカード、NANDフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、又はDVD(Digital Versatile Disk)といった可搬記録媒体であってもよい。補助記憶装置230は、保存機構140を実現する。また、補助記憶装置230はプログラム231と付与装置情報232とを記憶している。
【0032】
監視用通信IF240は、プロセッサ210が監視対象ネットワーク20からトラフィック情報を取得するための通信ポートである。通信ポートは、具体例として、通信チップ又はNIC(Network Interface Card)から成る。
管理用通信IF250は、管理装置30と通信するための通信ポートである。なお、監視用通信IF240と管理用通信IF250とは一体的に構成されていてもよい。
【0033】
プロセッサ210は補助記憶装置230からプログラム231を主記憶装置220にロードし、主記憶装置220からプログラム231を読み込み、プログラム231が示す処理を実行する。
【0034】
プログラム231は、計測機構100と、判定機構110と、優先制御機構120と、集約機構130との各々を「処理」、「手順」あるいは「工程」に読み替えた各処理、各手順あるいは各工程をコンピュータに実行させるプログラムである。
【0035】
プログラム231は、ネットワーク監視プログラムに相当し、コンピュータが読み取り可能な記録媒体に格納されて提供されてもよく、プログラムプロダクトとして提供されてもよい。
付与装置情報232は、ネットワーク監視装置10の監視対象に付与された情報等である。
【0036】
***動作の説明***
ネットワーク監視装置10の動作手順は、ネットワーク監視方法に相当する。
【0037】
図4は、ネットワーク監視装置10の動作の一例を示すフローチャートである。なお、ネットワーク監視装置10の各機構は並列に動作する。
まず、計測機構100と判定機構110との動作を説明する。
【0038】
<ステップS11>
計測結果作成部101は、監視対象ネットワーク20内の通信を監視し、監視した結果を示す監視結果データ301を作成する。
図5の(a)は、監視結果データ301の形式の具体例を示している。
監視結果データ301は、計測時刻と、計測値と、計測対象を示す各種属性との各々を示すデータから成る。ここで、計測時刻はトラフィック等が計測された時刻を示す。計測値は、トラフィック量等の計測機構100が計測した値を示す。計測対象を示す各種属性は、具体例として、送信元と、宛先と、プロトコル等を含む。なお、時刻及び値の精度と、属性値の種別との各々について本開示では特に制約しない。また、監視結果データ301を構成するデータを取得する公知の技術としてnetflowのような技術がある。監視結果データ301の精度はコンピュータのスペック等により向上しうる。
【0039】
<ステップS12>
計測結果送信部102は、計測結果作成部101が作成した監視結果データ301を判定機構110に送信する。
【0040】
<ステップS13>
正常異常判定部111は、監視結果データ301を受け取り、受け取った監視結果データ301に基づいて監視対象ネットワーク20が正常であるか異常であるかを判定し、判定した結果に基づいてタグ付き監視結果データ302を作成する。
図5の(b)は、タグ付き監視結果データ302の形式の具体例を示している。
タグ付き監視結果データ302は、計測時刻と、正常/異常区分と、集約/生区分と、計測値と、計測対象を示す各種属性との各々を示すデータから成る。このうち、計測時刻と、計測値と、計測対象を示す各種属性との各々は、監視結果データ301が示すデータを複製したものである。
正常/異常区分は、所定の基準に基づいて正常異常判定部111が判定した結果を示す。所定の基準は、具体例として、計測値が所定の範囲内であること、又は“ERROR”等の所定の識別符号があることである。なお、正常異常判定部111の判定手法としては公知の各種手法があり、本開示では判定手法を特に規定しない。
集約/生区分は、計測値を集約するか、計測値を集約しないか、即ち計測機構100の監視結果そのものを用いるかの区分を示す。なお、ステップS13では、計測機構100から受信したデータそのものを扱うので一律に「生」指定となる。
【0041】
<ステップS14>
判定結果送信部112は、タグ付き監視結果データ302を優先制御機構120と集約機構130との両方に送信する。
【0042】
次に、優先制御機構120の動作を説明する。優先制御機構120は、ステップS21からステップS23の各々を並列に実行する。
【0043】
<ステップS21>
優先制御機構120は、判定機構110からタグ付き監視結果データ302、又は集約機構130から集計結果データ303を受信し、受信したデータが示す正常/異常区分と集約/生区分との値に応じて優先制御機構120が備えるいずれかのキューに受信したデータを登録する。
【0044】
<ステップS22>
送信制御部125は、各キュー内のデータを各キューの優先度に応じて管理装置30に適宜送信する。送信制御部125によるQoSの方法は、前述の方法でもよく、他の方法でもよい。
【0045】
<ステップS23>
キュー状況監視部126は、各キューの使用状況及び空き容量を確認し、確認した結果に基づいて、集約期間に関する指示を生成する。空き容量の確認において、具体例として、キュー状況監視部126は空き容量の絶対値又は割合を確認する。また、キュー状況監視部126はどのように集約期間を設定してもよい。
キュー状況監視部126は、生成した指示を集約機構130に通知する。
【0046】
次に、集約機構130の動作を説明する。集約機構130は、ステップS31又はステップS32と、ステップS33とを並列に実行する。
【0047】
<ステップS31>
集計値算出部131は、ステップS14にて判定機構110が送信したタグ付き監視結果データ302を受信し、受信したタグ付き監視結果データ302を保存機構140に蓄積する。また、集計値算出部131は、ステップS23にて優先制御機構120が送信したデータを受信し、受信したデータが示す集約期間に従って所定期間のタグ付き監視結果データ302を集計することにより集計結果データ303を作成する。
図5の(c)は、集計結果データ303の形式の具体例を示している。
集計結果データ303は、集約期間と、正常/異常区分と、集約/生区分と、各種統計値と、計測対象を示す各種属性との各々を示すデータからなる。このうち、正常/異常区分と、計測対象を示す各種属性との各々は、タグ付き監視結果データ302が示すデータを複製したものである。
集約期間は、集約に用いたデータの時間幅と開始時刻と終了時刻とから成る。時間幅はステップS23にて生成された指示に対応する。開始時刻は各種統計値を求める際に用いたデータが計測された期間の開始時刻である。終了時刻は当該データが計測された期間の終了時刻である。
集約/生区分は、ステップS32では一律に「集約」指定である。
また、集計値算出部131は、集計対象であるタグ付き監視結果データ302の計測値から各種統計値を算出する。各種統計値は、平均値、最小値、最大値、分散、又は計測個数等である。集計値算出部131が算出する統計値は実装又は用途等により異なるので、ここでは統計値を特に規定しない。
【0048】
<ステップS32>
データ保存部132は、ステップS31にて算出された集計結果データ303を保存機構140に登録する。
【0049】
<ステップS33>
集計値送信部133は、キューの使用状況に応じた集計期間に対応する集計結果データ303を優先制御機構120に送信する。
【0050】
***実施の形態1の効果の説明***
本実施の形態に係るネットワーク監視装置10によれば、優先制御機構120の逼迫具合に応じて異常値又は正常値の送信タイミングを制御すること、集約期間の長さを変えること等ができる。そのため、本実施の形態によれば、優先的に報告すべき異常値を早期に報告しつつ、優先度が低い報告事項は集約してから報告することにより、監視のための通信量を安定化させることができる。そしてその結果、
図1の(b)に示すような監視結果が得られる。つまり、本実施の形態によれば、監視対象ネットワーク20の管理者は、監視のための回線帯域がひっ迫していても、異常値を早期に把握することができ、また、多少の遅延を伴うものの集約した正常値を把握することができる。従って、本実施の形態によれば前述の3つの要件を同時に満たすことができる。
【0051】
***他の構成***
<変形例1>
図6は、本変形例に係るネットワーク監視装置10のハードウェア構成例を示している。
ネットワーク監視装置10は、プロセッサ210、プロセッサ210と主記憶装置220、プロセッサ210と補助記憶装置230、あるいはプロセッサ210と主記憶装置220と補助記憶装置230とに代えて、処理回路280を備える。
処理回路280は、ネットワーク監視装置10が備える各部の少なくとも一部を実現するハードウェアである。
処理回路280は、専用のハードウェアであってもよく、また、主記憶装置220に格納されるプログラムを実行するプロセッサであってもよい。
【0052】
処理回路280が専用のハードウェアである場合、処理回路280は、具体例として、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)又はこれらの組み合わせである。
ネットワーク監視装置10は、処理回路280を代替する複数の処理回路を備えてもよい。複数の処理回路は、処理回路280の役割を分担する。
【0053】
ネットワーク監視装置10において、一部の機能が専用のハードウェアによって実現されて、残りの機能がソフトウェア又はファームウェアによって実現されてもよい。
【0054】
処理回路280は、具体例として、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせにより実現される。
プロセッサ210と主記憶装置220と補助記憶装置230と処理回路280とを、総称して「プロセッシングサーキットリー」という。つまり、ネットワーク監視装置10の各機能構成要素の機能は、プロセッシングサーキットリーにより実現される。
他の実施の形態に係るネットワーク監視装置10についても、本変形例と同様の構成であってもよい。
【0055】
実施の形態2.
以下、主に前述した実施の形態と異なる点について、図面を参照しながら説明する。
【0056】
***構成の説明***
図7から
図8を参照して、実施の形態2に係るネットワーク監視装置10を説明する。ネットワーク監視装置10は、優先制御機構120の代わりに優先制御機構150を備える。優先制御機構150以外については実施の形態1で説明した通りである。
【0057】
図7は、優先制御機構150の構成例を示している。優先制御機構150は、実施の形態1に係る優先制御機構120の構成要素の一部を追加変更した機構に当たる。
優先制御機構150は実施の形態1で説明した4つのキューの代わりに、任意の個数のキューであって、優先度が設定されたキューから成るキュー群151を持つ。ここで、最高優先キューは最も高い優先度が設定されたキューであり、最低優先キューは最も低い優先度が設定されたキューである。キュー群151は優先度順キュー群とも呼ばれる。また、優先制御機構150は、追加要素として振り分け部152を備える。これらの機能は後述の動作の説明で説明する。なお、正常集約データが登録されたキューを正常集約キューと呼んでもよく、異常集約データが登録されたキューを異常集約キューと呼んでもよい。
本実施の形態に係るプログラム231は優先制御機構120の代わりに優先制御機構150の機能を実現する。
【0058】
***動作の説明***
図8は、優先制御機構150の動作を説明する図である。本図を参照して優先制御機構150の動作を説明する。なお、優先制御機構150の動作のうち、判定機構110又は集約機構130からデータを受信する動作と、管理装置30にデータを送信する動作とについては優先制御機構120の動作と同様である。
【0059】
図8の(a)は、初期設定時又は非輻輳時における優先制御機構150の動作を示している。このとき、
図8の(a)に示すように、優先制御機構150が受信した各種データは、振り分け部152によって、初期設定に基づき、キュー群151の中のいずれかのキューに登録される。なお、
図8の(a)に示す優先制御機構150の処理は、実質的に実施の形態1のステップS21に示す処理と同等である。
【0060】
キュー状況監視部126は、キュー群151の各キューの使用状況を監視し、集約機構130に監視した結果を通知するとともに、振り分け部152に監視した結果を通知する。
【0061】
振り分け部152は、キュー群151の各キューの逼迫状況に応じて、
図8の(b)に示すように監視結果データの振り分け先を切り替える。
具体例として、振り分け部152は、初期設定において、集計結果データ303のうち、正常/異常区分が「異常」であり、かつ、集約/生区分が「集約」であるデータだけを最高優先キューに登録する。このとき、最高優先キューの使用率が70%以上等と比較的高い場合に、振り分け部152は当該データを第二優先キューに登録してもよい。第二優先キューは2番目に優先度が高いキューである。
別の具体例として、振り分け部152は、前述のように既存のキューにデータを振り分けるのではなく、コンピュータのリソースに余裕がある限り一時的にキューを作成し、作成したキューにデータを振り分けてもよい。一般に、コンピュータのリソース状況の計測方法は各種あり、また、プログラミング手法により多様に計測手法を組み合わせることができる。いずれにしても本例は公知の手法により実現される。
また、最高優先キューの使用率が30%以下等と比較的低い場合に、振り分け部152は、初期設定において、最高優先キューの使用率が比較的低くない場合において第二優先キューに振り分けるデータも最高優先キューに振り分けてもよい。
【0062】
***実施の形態2の効果の説明***
以上のように、実施の形態2に係る優先制御機構150を備えるネットワーク監視装置10によれば、実施の形態1と同様の効果を得られるとともに、キューを柔軟に使用することができる。そのため、本実施の形態によれば、優先度が高いデータをより早期に通知することができ、また、優先度が高いデータをより多く通知することができる。
【0063】
***他の実施の形態***
前述した各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
また、実施の形態は、実施の形態1から2で示したものに限定されるものではなく、必要に応じて種々の変更が可能である。フローチャート等を用いて説明した手順は、適宜変更されてもよい。
【符号の説明】
【0064】
10 ネットワーク監視装置、20 監視対象ネットワーク、30 管理装置、90 ネットワーク監視システム、100 計測機構、101 計測結果作成部、102 計測結果送信部、110 判定機構、111 正常異常判定部、112 判定結果送信部、120 優先制御機構、121 異常集約キュー、122 異常生キュー、123 正常集約キュー、124 正常生キュー、125 送信制御部、126 キュー状況監視部、130 集約機構、131 集計値算出部、132 データ保存部、133 集計値送信部、140 保存機構、150 優先制御機構、151 キュー群、152 振り分け部、210 プロセッサ、220 主記憶装置、230 補助記憶装置、231 プログラム、232 付与装置情報、240 監視用通信IF、250 管理用通信IF、260 信号線、280 処理回路、301 監視結果データ、302 タグ付き監視結果データ、303 集計結果データ。