物理ポートの生存を確認するだけでなく、特定のポート番号のサービスが正常に動作していることを確認し、ネットワーク機器監視装置100に異常検出時の処理でそのサービスが動作するサーバの再稼働処理を可能にする手段を提供する。
ネットワーク装置は、CPU101、リレーコントローラ303、1又は2以上のリレー311、312、313及びコンセント321、322、323を含む。ネットワーク機器監視装置100のCPU101がトランスポート層の1のサービスに異常を検出した際には、リレーコントローラ303中のあるレジスタに書き込むことで対応するリレーのON/OFFを行う。これにより電源からの対応するコンセントへの電力供給がON/OFFされ、該コンセントにつながるネットワーク機器の再起動が可能になる。
請求項1乃至4のいずれか1に記載のネットワーク機器監視装置において、前記異常検出時の処理をユーザが変更可能な手段を持つことを特徴とするネットワーク機器監視装置。
【発明を実施するための形態】
【0019】
以下本発明の実施の形態を図に基いて説明する。
【0020】
(第1の実施の形態)
(ハードウェアの説明)
図1は、本発明の第1の実施の形態にかかわるネットワーク機器監視装置の物理的電気的構成を表す概念図である。
【0021】
本発明に関わるネットワーク機器監視装置100はCPU101、バスコントローラ102、メモリ201、周辺用バスコントローラ202、LAN I/F301、LEDコントローラ302、リレーコントローラ303、リレー311、312,313、コンセント321、322、323を含んで構成される。
【0022】
CPU101は、メモリ201中に記録されたプログラムに従い処理を行う中央制御装置である。本明細書ではCPUとしているが、MPUでも問題はない。またいわゆるCPU101内のCPUコアの数は拘泥しないが、時分割による疑似的なマルチタスクには対応していることが好ましい。
【0023】
バスコントローラ102は、CPU101がメモリ201等にアクセスする際に経由するチップセットである。
【0024】
その性質上バスコントローラ102は、内部バスa及び外部バスbに接続されており、CPU101から外部バスb及び周辺用バスcに存在するコントローラ等との通信を制御する。
【0025】
市場ではCPU101の種類に対応してバスコントローラ102は製品(専用品)が用意されているが、CPU101と外部バスb及び周辺用バスcに存在するコントローラ等との通信ができれば良い。
【0026】
メモリ201は、CPU101が実行するプログラム及び処理の対象となるデータ(ネットワーク機器監視装置の設定など)を記録するためのメモリである。通常だとDRAMのような揮発性記憶素子と電源を切っても保持されるNVRAMのような不揮発的な記憶素子、ROM(Read Only Memory)に分けて考えられるが、本明細書では全てを包含してメモリ201とする。
【0027】
周辺用バスコントローラ202は、CPU101等が外部バスbから周辺用バスc上にあるコントローラを制御する際に経由するチップセットである。
バスコントローラ102同様、周辺用バスコントローラ202も外部バスb及び周辺用バスcに接続されている。周辺用バスコントローラ202は、CPU101から外部バスb及び周辺用バスbに存在するコントローラ等との通信を制御する。
市場ではCPU101の種類に対応して周辺用バスコントローラ202も製品(専用品)が用意されるが、本実施の形態ではCPU101と周辺用バスに存在するコントローラ等との通信ができれば良い。
【0028】
LAN I/F301は、HUB500に接続する為のコネクタ(物理層)及びチップ(データリンク層、ネットワーク層)などを含むインターフェイス群である。このLAN I/F301を経由して他のネットワーク機器との通信を行う。このLAN I/F301は、HUB500と接続可能なものでなければならないことは言うまでもない。
【0029】
このLAN I/F301が複数ある場合には、LAN I/FごとにIPアドレスが割り振られる。従って、ネットワーク機器監視装置100が無線LANと有線LANの二つのポートを有する場合には、其々にIPアドレスが割り振られることに注意する。
【0030】
LEDコントローラ302は、ネットワーク機器監視装置100の状態をユーザに伝達する為のLEDを制御するためのコントローラである。本図では省略しているが、LEDコントローラ302は図示しないLEDが接続され、これを点灯、点滅させることでユーザにネットワーク機器監視装置100の状態を伝える。
【0031】
リレーコントローラ303は、リレー311,312、313を制御するためのコントローラである。ネットワーク機器監視装置100の製品仕様に応じて、制御するリレーの最低必要数が決定される。そしてそのリレーの数に応じてリレーコントローラ303はレジスタを持つ。CPU101はリレーコントローラ303中の該当するレジスタに1/0を書き込むことで、該当するリレーをOn/Offし、対応するコンセントへの電源供給を制御する構造になっている。但しこれに拘るものでなく、いかなる方法であってもリレーを制御できる手段を提供できれば、リレーコントローラ303の役割を果たすことが可能である。
【0032】
リレー311、312,313は、電源からコンセントへの電力供給を制御するための継電器である。リレー311、312,313は、リレーコントローラ303からの制御信号によってそれぞれ独立して対応するコンセントへの電力供給が制御可能なように構成されている。
【0033】
コンセント321、322、323は、ネットワーク機器監視装置100から監視対象のネットワーク機器に電力を供給するためのコンセントである。各コンセントは対応するリレーに接続されることで、CPU101による制御が可能になっている。
【0034】
なお、監視対象のネットワーク機器とコンセントの接続を適切に行わないと、該ネットワーク機器に異常が発生し電源を切断するときに異なるネットワーク機器の電源を切断することになるため、ユーザは注意を払って接続及びネットワーク機器監視装置100の設定を行うべきである。
【0035】
次に
図2を用いて、ネットワーク機器監視装置100の接続方法について説明する。
図2は、本発明の第1の実施の形態にかかわるネットワーク機器監視装置100の動作環境の一例を表す接続図である。
【0036】
本図ではHUB500に、ネットワーク機器監視装置100、ルータ501、HTTPサーバ502、決済サーバ503、モニタ用PC504が接続され、それぞれがネットワーク層のレベルで通信可能なように構成される。
【0037】
また、ルータ501、HTTPサーバ502、決済サーバ503の電源ケーブルはネットワーク機器監視装置100のコンセント321、322、323にそれぞれ接続され、ここから機器が動作するための電力が供給される。
【0038】
ルータ501は、インターネットへの情報の送信もしくはインターネットからの情報の受信を中継するネットワーク機器である。通常、ルータ501はOSIの7層モデルのネットワーク層までの接続を管理するが、本実施の形態においてはより上層のサービスを提供するものであっても良い。
【0039】
HTTPサーバ502は、インターネット上に存在する不特定の端末にホームページの情報(主にHTML形式で書かれたもの)を送信する。通常HTTPサーバ502が送信するホームページの情報から誘導されて、決済サーバ503へユーザが誘導されることとなる。
【0040】
決済サーバ503は、インターネットから商品の提供を行う際にクレジットカード情報を通信し、管理する為の支払い決済を行うためのサーバである。
【0041】
モニタ用PC504は、ネットワーク機器監視装置100の状況をモニタするためのPCである。このPC上ではブラウザが動作可能であることを想定する。また、このモニタ用PC504で動作するブラウザで表示可能なデータ(後述する
図5や
図7)をネットワーク機器監視装置100は生成し、出力しなければならない。
【0042】
通常、ユーザは、HTML形式で記載されたホームページから誘導されて決済サーバ503のサービスを提供される受けることになる。このため、HTTPサーバ502がダウンしているときには、ユーザは決済サーバ503の利用ができないことがほとんどである。よって決済サーバ503のみがアクティブで、他のルータ501、HTTPサーバ502がダウンしている状態では決済サーバ503の動作の意義は低下する。
【0043】
(ソフトウェアの説明)
(ネットワーク機器の監視)
以下、これらの
図1、
図2の構成を念頭に置いたうえで、ネットワーク機器監視装置100上で動作するソフトウェアの動作を説明する。
【0044】
図3は、ネットワーク機器監視装置100上でCPU101が処理するソフトウェアで構成された監視モジュールの動作の概略を説明するフローチャートである。この監視モジュールはCPU101上で動作する。本実施の形態におけるネットワーク機器監視装置100によるネットワーク機器の監視はいわゆるポーリングを行うことで実現される。
【0045】
ネットワーク機器監視装置100の起動もしくはリセットが行われると、ネットワーク機器監視装置上のOSは種々の事前処理を行った後に、監視モジュールを起動させる(ステップS10)。
【0046】
監視モジュールが起動すると、初期化処理(ステップS11)を行う。初期化処理は必要なメモリ量の確保や監視対象のIPアドレスやポート番号の特定、後述するステップS14の待機時間(ポーリング周期)の設定などが行われるが、必ずしもこれだけに拘るものではない。
【0047】
監視モジュールの起動処理が行われると、監視モジュールによる監視対象への監視が開始される。監視モジュールはICMPのPINGコマンド(ステップS12)及びTELNETで特定のポートを指定してコマンド(以下TELNETコマンド)を送出する(ステップS13)。この場合、PINGコマンドで異常終了したら、TELNETコマンドの送出を行わなくても良いし、PINGコマンドの終了状態にかかわらず、TELNETコマンドを送出しても良い。これらは設計事項である。
【0048】
ステップS12及びS13で異常終了した場合には、其々に応じた割り込み処理が呼び出される。割り込みであるため、割り込み処理が終了すれば、割り込み処理が生じたところまで戻って監視モジュールの処理が再開される。
【0049】
ここで、割り込み処理の一として、CPU101が監視対象の電源供給を制御するリレーコントローラ303の適切なレジスタへ1/0を書き込むことがあげられる。これにより、対応するコンセントへの電源の供給を再開(接続)/切断することができる。結果として、監視対象のネットワーク機器の電源のOn/Offを行うことが可能になる。
【0050】
また、自身が特定のリレーのOn/Offを行った旨CPU101がログを記録することも考えられる。ログはトラブル解析の為ユーザに必須の情報だからである。
【0051】
ここで、ステップS12での割り込み処理とステップS13での割り込み処理との処理内容を変えても良い。たとえば、ステップS12で異常終了した場合には、各サーバの再起動をする必要性が高い。しかし、ステップS13で異常終了した場合には、必ずしも監視対象のハードウェア機能(物理層やデータリンク層)がだめになっているわけではない。従ってこのような場合には、該サーバに該当するポートに関わるサービスのみを再起動するよう通信するような処理にしても良い。
【0052】
そして、PINGコマンド及びTELNETコマンドの送出が終了したら、初期化処理(ステップS11)で設定した待機時間だけ待機する(ステップS14)。
【0053】
なお、この待機時間は後述する
図5の「待機秒数」をそのまま使うことを想定するが、ステップS12及びステップS13の処理時間を引いてステップS12からステップS14までの処理一巡の総時間数として取り扱っても良い。
【0054】
その後、処理はステップS12まで戻り、ネットワーク機器監視装置100の電源が切断またはリセットされるまで、ステップS12乃至ステップS14の処理が繰り返し行われる。
(ネットワーク機器の設定の変更)
【0055】
次に上記初期化処理(ステップS11)で読み出される設定の変更ついて説明する。
【0056】
まず、ネットワーク機器監視装置は現在の設定がどのようになっているかをユーザに開示する必要がある。そもそも現状が分からなければ、設定の変更の要否を決定できない為である。その情報の開示処理について
図4を用いて説明する。
【0057】
図4は、ネットワーク機器監視装置100が自身の設定情報及び現在の監視対象の状況をユーザに開示する為の処理の流れを表すフローチャートである。又、
図5は、第1の実施の形態での
図4の処理を行った後に開示要求(Request)の送信元に送られてきた出力データを端末のブラウザ上で表示させた結果である。
【0058】
なお、本実施の形態ではHTML形式のデータをモニタ用PC504上のブラウザが出力することを想定している。従って、別段の記載がなければHTML形式のデータをネットワーク機器監視装置100は生成しているものと考える。
【0059】
まず、モニタ用PC504からネットワーク機器監視装置100に対して、設定情報の開示要求(Request)が送信される(ステップS20)。この開示要求はネットワーク機器監視装置100に割り当てられたIPアドレスに対して必要なパラメータ(たとえばどの監視対象の設定を変更するか等)を付加してHTTP要求を掛ける方法が考えられるが、必ずしもこれに拘るものではない。
【0060】
なお、本図の出力データは、モニタ用PC504の開示要求が
図2のHUB500から
図1のLAN I/F301を通って送信されているものとする。
【0061】
ステップS20における開示要求を受信したネットワーク機器監視装置100のCPU101は、メモリ201上の不揮発性領域から自身の設定(監視対象のIPアドレスやポート番号、待機秒数など)を読みだす(ステップS21)。
【0062】
またCPU101は、監視対象の現状を表示すべくステップS21で読みだした設定に基づき、必要があれば監視対象のネットワーク機器の現状に関する情報を収集する(ステップS22)。この際、
図3ステップS12及びステップS13で行ったようなPINGコマンド及びTELNETのコマンドだけでなく、SNMPを用いたデータ収集を行っても良い。
【0063】
このステップS21で求めた設定情報及びステップS22で求めた監視対象の現状をまとめた出力データをCPU101は生成する(ステップS23)。端末側に専用アプリケーションを用意し、そのアプリケーション上で表示するのであれば、ステップS23で生成するのは該アプリケーション専用のデータとなる。
【0064】
なお、
図5では監視対象の状態を表示する項目がないため、ステップS22の結果はデータには反映されていない。
【0065】
生成された出力データは、開示要求(Request)の送信元(=モニタ用PC504)に返送される(ステップS24)。この出力データに基づき、開示要求(Request)の送信元であるモニタ用PC504はブラウザなどで出力データを表示する。
【0066】
なお
図1及び
図2に従えば、CPU101が生成した出力データは
図1のLAN I/F301から
図2のHUB500を経由してモニタ用PC504に返送される。
【0067】
次に実際表示される出力データの書式について説明する。
既に述べた通り、
図5は第1の実施の形態での
図4の処理を行った後に開示要求(Request)の送信元に送られてきた出力データをモニタ用PC504のブラウザ上で表示させた結果である。すなわち、この図面に表示されている項目がネットワーク機器監視装置100の設定変更可能な項目となる。
【0068】
図5の表示画面は大きく分けると、監視対象指定コラム410、監視有効設定コラム420、詳細設定コラム430、設定保存ボタン440を含んで構成される。
【0069】
監視対象指定コラム410は、ネットワーク機器監視装置100がもつ監視対象のどれを設定するかを指定する欄である。ネットワーク機器監視装置100の製品仕様によって監視対象の数には上限がある。そしてこれらの監視対象は一意的にナンバリングされることで管理される。すなわち本図の画面に表示されている「監視対象1」以外にも「監視対象2」、「監視対象3」「監視対象n」(n=監視対象数の上限値)が存在する。
【0070】
監視対象指定コラム410はこの監視対象を指定するプルダウンメニューである。
【0071】
監視有効設定コラム420は、その監視を有効にするか否かを規定する欄である。CPU101の処理能力が高ければ高いほど、ネットワーク機器監視装置100の製品価格に跳ね返ってくる。また、監視対象が多ければ多いほどネットワーク上に流れるデータの数(=パケット数)も増える。しかし、無駄な処理をカットすれば高価な製品を購入しなくても良いし、ネットワーク上に監視の為に流れるパケットの数を減らすことが可能になる。
また、HTTPサーバ502や決済サーバ503の再起動時など明らかにステップS12及びステップS13の応答が異常になる場合も想定される。このような場合には、電源のON/OFFを繰り返すことで再起動を繰り返してしまい、これらのサーバが正常に動作しなくなる。
【0072】
これらのような場合に、監視有効設定コラム420のダイアログボックスをチェックすることで一時的に監視を無効にし、システムの円滑な活用を図ることが可能になる。
【0073】
詳細設定コラム430は、当該監視対象のIPアドレスやポート番号と言った実際の監視対象機器の詳細を設定する為の欄である。
【0074】
監視条件設定欄431は、監視対象や動作条件を決めるための必須事項が入力可能なテキストエリアやチェックボックスが複数設けられている。
【0075】
監視条件設定欄431内の「IPアドレス」テキストボックスは、監視対象のIPアドレスを定義する為の欄である。また「ポート番号」テキストボックスは、監視対象のポート番号を定義する為の欄である。少なくともこの二つが特定できなければ、トランスポート層の監視を行うことはできない為必須の項目である。
【0076】
監視条件設定欄431内の「待機秒数」テキストボックスは、
図3のステップS14の待機時間を決定するための欄である。この待機時間が短ければよりリアルタイムな監視を行うことができるが、監視頻度が高ければネットワーク上に関連するパケットを多く出すことになる。このバランスをユーザに定義させるにはこの欄は必要になる。逆を言えば、待機秒数をユーザに定義させない場合には、この欄は不要である。
【0077】
監視条件設定欄431内の「ポートチェックのみ」チェックボックスは、
図3のステップS12を省略するか否かを決定する欄である。他の監視対象でPINGコマンドを出力している場合、ステップS12は重複する処理となる。従って、当該監視対象においてステップS12を省略する場合にはこの欄にチェックを入れる。
【0078】
名称欄432は、当該監視対象がユーザに分かりやすいように表示するためのテキストボックスである。またメモ欄433は、当該監視対象についてユーザがコメントを残すためのテキストボックスである。これらは必須の項目ではないが、あれば日常の運用で便利になる為、本実施の形態でも採用している。
【0079】
設定保存ボタン440は、本ボタン押下時の各欄記載の事項を出力データ送信元であるネットワーク機器監視装置100に送信するためのボタンである。
【0080】
本実施の形態ではこの出力結果をブラウザで表示されるべくHTML(Hyper Text Markup Language)で記載されることを想定している。従って、データの主要な個所を<FORM></FORM>タグで囲われるようデータを生成する。そして、これらのタグの間に<INPUT><SELECT><TEXTAREA>等のタグを使って入力欄を設けていく。
【0081】
図5の監視対象指定コラム410で、プルダウンタグ(<SELECT><OPTION>タグ)が用いられるが、これらはステップS23でCPU101が生成するようプログラミングされていなければならない。
【0082】
同様に、監視条件設定欄431内の「IPアドレス」テキストボックス、「ポート番号」テキストボックス、「待機秒数」テキストボックスはユーザが入力可能なようにテキストボックス及びその初期値(たとえば
図5の「ポート番号」については<INPUT type=“text” value=“5901” name=“port”>タグ)をCPU101の生成時点(ステップS23)で用意する必要がある。これらの初期値はステップS21で読みだした自身の設定から求められる。
【0083】
また、
図5の「PORTチェックのみ」チェックボックスをアクティブにすることで
図3のステップS12(PINGコマンド)を省略することができる。このような表示もCPU101がステップS23で表示できるようにしてやる必要がある(たとえば<INPUT type=“Checkbox” name=“check”>タグ)。このデータもステップS21で読みだしたネットワーク機器監視装置100自身の設定から定義される。
【0084】
また設定保存ボタン440を押すことで、この表示画面でユーザが入力可能なデータをネットワーク機器監視装置100に送り返すことができるように<FORM>タグで表示データが構成されるべきである。
【0085】
この際、設定保存ボタン440を押下した際に、アクセスするアドレスもCPU101が定義しておく必要がある。このようにすることで、ユーザが間違ったアドレスを入力することなくただ設定保存ボタン440を押下するだけでネットワーク機器監視装置100の設定変更が可能になる。
【0086】
このように、ネットワーク機器監視装置100側で表示形式及びデータの修正したものを送信する方法を準備し、その状態で開示要求(Request)の送信元に送り返すことで、入力値に一定の制限を掛けることが可能になる。
【0087】
もちろん、この送り返された情報に基づき、ネットワーク機器監視装置100のCPU101が設定の変更を行う必要がある。
【0088】
図6はネットワーク機器監視装置100が自身の設定情報の変更を反映する為の処理の流れを表すフローチャートである。
【0089】
図4と
図6を対比しても分かるとおり、設定の変更を伴う場合であっても読み出しの場合と処理に大差はない。相違するのはネットワーク機器監視装置100に送信されるのがアドレス情報だけでなくデータも対象となること(ステップS30)及びこのデータを反映してCPU101がメモリ201上の不揮発性領域に格納された設定値を変更する処理(ステップS31)が入るだけである。
【0090】
この設定の変更が行われた後は設定変更後のメモリ201上の不揮発性領域から自身の設定(監視対象のIPアドレスやポート番号、ポーリング周期など)を読みだし(ステップS21)、監視対象のネットワーク機器の現状に関する情報を収集し(ステップS22)、CPU101が出力データを生成し(ステップS23)、レスポンスを返す(ステップS24)点は同じである。
【0091】
すなわち、設定の変更を行なえば、ブラウザを閉じる等しない限り、指定された監視対象についてのネットワーク機器監視装置100の状況を再び端末上に表示することとなる。
(一覧表示)
【0092】
最後に、自身の監視対象の一覧をモニタ用PCに送信するソフトウェアの動作について説明する。
【0093】
監視対象の一覧の表示も、基本的には
図4の処理と同じである。但し、「監視」であり設定の変更の必要性がないこと、一覧全体を定期的に更新する必要があること、HTTPのようなリクエスト−レスポンス形式の通信を行うためにモニタPC504側から周期的に要求を出す必要があること、などからCPU101が作成する表示データを変更する必要がある。
【0094】
図7は、第1の実施の形態での監視用画面を表す図である。
【0095】
図5の設定画面の出力データではその性質上設定対象しか表示しなかった。しかし通常監視を行う際には全ての監視対象が見渡せることが好ましい。従って、監視用画面は設定の変更機能を除外し、全ての監視対象を見渡せることを主眼に置く。
【0096】
図7では監視対象ごとにコラム710、720、730を割り当てている。そして各コラムには「名称」欄、「IP:Port」欄、「状態」欄の項目が存在する。このうち、「名称」と「IP:Port」は設定を表すものであり、「状態」は監視対象の状態を表すものである。
【0097】
注意すべきことはIPアドレスが同じであっても、ポート番号が異なる場合には別個独立の監視対象としてネットワーク機器監視装置100を取り扱うということである。これにより同一のIPアドレスであってもポート番号が異なるときには別の取り扱いが可能になる。そして、それがユーザにとって便宜を図ることになるが、それは第2の実施の形態で説明する。
【0098】
「名称」欄は、
図5の名称欄432で定義されたユーザが該監視対象につけた名称を表示する欄である。当然ユーザで名称を定義できない場合には本欄は省略することになる。
【0099】
「IP:Port」欄は、
図5の監視条件設定欄431で定めたIPアドレス及びポート番号を表示する欄である。
【0100】
「状態」欄は、監視対象がどのような状態であるかを表す欄である。「状態」欄は大まかに二つに分かれ、ネットワーク機器監視装置100が定期的に把握する項目でインジケータ的に上段に記載される。また下段にはネットワーク機器監視装置100が類推する状態を表示する。
【0101】
「状態」欄上段の「ON」はネットワーク機器監視装置100の対応するリレーが接続状態になっているか、すなわち、電源がサーバに接続されているかを表す。これはリレーコントローラ303の対応するレジスタを見て判断する。
【0102】
「ON」はインジケータ的に表示される。すなわちリレーが導通状態にあれば背景が緑に、非導通であれば背景がグレーに表示される。
【0103】
「状態」欄上段の「PI」は
図3ステップS12のPINGコマンドの処理が正常に行われたかを表す。これは
図3ステップS12の処理結果を反映させている。当該監視においてステップS12が省略されている場合(=
図5の監視条件設定欄431の「ポートチェックのみ」がチェックされている場合)にはコラム730のように通常とは異なる記載にする。但し、「PI」の不実施時の背景色は失敗と同様の表示にしても良い。
【0104】
「状態」欄上段の「PO」は
図3ステップS13のTELNETコマンドの処理が正常に行われたかを表す。
【0105】
「PI」「PO」はインジケータ的に表示される。すなわち正常に動作していれば背景が緑に、異常終了していれば背景がグレーに、処理自体が省略されている場合には黒く塗りつぶすなど、ユーザに見分けのつくような表示にすることが好ましい。
図7ではカラム730の「PI」が塗りつぶされることで表現される。
【0106】
「状態」欄下段は、現状ネットワーク機器監視装置100がどのような対応をしているかを表す。ここに表示する事項はどのような物であっても良いが、一定の法則性を持たせそれをユーザに開示すべきであろう。
【0107】
なお、
図7の表示画面の出力の際のCPU101側の処理は
図4のフローチャートと流れは同じである。
図5の画面を表示するデータを送信するか、
図7の画面を表示するデータを送信するかは、
図4のステップS20で送られる開示要求に付加されるパラメータで決めるようにすれば良い。
【0108】
また、送信される出力データに所定の秒数後自動的に再度自身のアドレスを読みだすようにすれば、反復して状態を更新することが可能になる。HTML形式では<META>タグを用いることでこのような機能を実現できる。
【0109】
このように、ネットワーク機器監視装置100の設定状態の表示を繰り返すことでユーザの利便性を向上させることが可能になる。
【0110】
以上のように、ネットワーク層での障害の検出と並行してトランスポート層での障害の検出を行うこと、及びその際異常を感知した後の割り込み処理を異なるものにすることで、より状況に即した異常の復旧を図ることが可能になる。
(第2の実施の形態)
【0111】
次に本発明の第2の実施の形態について図を用いて説明する。
【0112】
第1の実施の形態では、割り込み処理についてユーザの意向で定義することはなかった。しかし、IPアドレスやポート番号によっては割り込み処理をプログラマブルに変更できた方がユーザの運用上都合の良いことが多い。特に、同一のサーバで複数のサービスを提供する場合には、そのような利点は顕著である。
【0113】
すなわちIPアドレスは同一サーバ上のサービスすべてで共通して使用する。従って、ネットワーク層で障害が生じたら直ちにサーバ全体の再起動を行うことが好ましい。しかし、あるポート番号で不具合が起きたとしても、別のポート番号のサービスを提供するアプリがアクティブである場合も十分考えられる。このような場合に、いきなり電源切断を行うのは必ずしも適切とは限らない。
【0114】
そこで本実施の形態では、IPアドレスあるいはポート番号によって、割り込み処理の動作をユーザに設定させることを可能ならしめる手段を提供することを目的とする。
【0115】
図8は、第2の実施の形態に関わるネットワーク機器監視装置100の動作環境の一例を表す接続図である。なお、
図2と変更がない個所については説明を省略する。
【0116】
第1の実施の形態と異なり本実施の形態では、単一のサーバ600にHTTPアプリ及び決済アプリがインストールされる構成をとる。これに伴いHTTPサーバ502及び決済サーバ503は削除されている。近年ではサーバの処理能力が飛躍的に向上している為、このように一つのサーバに複数のトランスポート層〜アプリケーション層の処理を含むアプリケーションを常時実行させることも多々ある。
【0117】
このような構成をとることで、サーバ600のネットワーク層までは生きていたとしてもHTTPアプリまたは決済アプリの何れか1が落ちることも考えられる。この際全ての状況で電源の再起動処理を行うのは適切でない場合もある。
【0118】
本実施の形態は、ネットワーク機器監視装置100の割り込み処理(
図3参照)の処理内容をユーザに定義させるようにすることを特徴とする。
【0119】
図9は、第2の実施の形態での開示要求(Request)の送信元に送られてきた出力データをモニタ用PC504のブラウザ上で表示させた結果である。
【0120】
図9においては
図5の表示に加え、アクション810及びアクション設定820の項目が増えている。
【0121】
アクション810で表示されるプルダウンメニューの項目の選択によって、ユーザは大まかな処理を最大4つ自由に選ぶことができる。なお、仕様上4つとしているが、最大幾つユーザに動作の定義を認めるのかはネットワーク機器監視装置100の設計者の意図にかかっている
【0122】
図9では、電源ON(アクション2)と電源OFF(アクション1)、「ロギング」(アクション3)の選択肢しか記載されていないが、例えば、「別のモジュールの動作確認を行う」とか「該サーバに該当するポートの再起動を指示する」といったアクション種別を追加することもかんがえられよう。
【0123】
そして、上記アクション810で選んだ項目に応じて、ユーザはアクション設定820で細かな動作を選択することが可能になっている。
【0124】
また、アクションで何も選ばなければ、監視対象のポートに関わるアプリが異常終了していたとしても割り込み処理を一切行わなくすることも可能である。その判断をユーザにゆだねることができるのが本実施の形態の特徴である。
【0125】
図9のアクション設定820では現在アクション1で選択された電源OFFに対応したサブ設定項目が表示されている。ここでは電源をオフするまでの待機秒数及び電源をオフした後次のアクションを実行するまでの待機秒数が入力可能になっている。
【0126】
このように第1の実施の形態におけるポート番号(トランスポート層)まで特定して監視すること及び第2の実施の形態のユーザが自由に割り込み処理を定義できることを組み合わせることでサービスの優先順位に応じた割り込み処理の設定が可能になる。
【0127】
図8の例で説明する。サーバ600上では決済アプリとHTTPアプリが同時に動いている。実環境でのHTTPアプリと決済アプリとの優劣はつけがたいが、ここでは情報を要求があれば即時に送り出す必要があるHTTPアプリを優位とする。
【0128】
この場合、HTTPアプリがダウンし対応するポート(ウェルノンでは80番)に対するTELNETコマンドが異常終了したら、サーバ600に対応する電源ケーブルに繋がったコンセント321、322、323のいずれか1に対応するリレー311、312、313のいずれか1をオフ後に再度オンにし再起動する設定をする。
【0129】
一方、決済アプリのポートに対するTELNETコマンドが異常終了したとしても、HTTPアプリのポートが生きていれば、HTTPアプリでの情報の送信を優先する為、ログの蓄積のみするようにするといったことも今回の例では考えられる。
【0130】
なお、ネットワーク機器監視装置100側の処理に関しては、ステップS23(
図4参照)でCPU101がアクション関連の変数及び既定値を定義して、ステップS30(
図6参照)でCPU101がこの変数の修正値を受け取れるようにすれば(=処理モジュールを追加すれば)対応できるので、ここでは細かくは述べない。
【0131】
以上のようにIPアドレス、ポートの番号に応じて、処理の方法をユーザの意向で変える手段を提供することで、ユーザにとってより有効な再起動処理を行うことが可能になる。
【0132】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記の実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更が可能であることは言うまでもない。