(58)【調査した分野】(Int.Cl.,DB名)
前記障害監視装置は、前記機器状態用信号として、前記ネットワーク接続機器のIPアドレスを送信先に指定するping(Packet Internet Groper)を用いることを特徴とする
請求項1または請求項2に記載の障害監視装置。
【発明を実施するための形態】
【0009】
以下、本発明の一実施形態を、図面を参照して詳細に説明する。
【0010】
図1は、障害監視システムを示す構成図である。障害監視システムのネットワークは、2系統の冗長構成のLAN(Local Area Network)で構成されており、
図1では、1系ネットワークの回線を実線で表記し、2系ネットワークの回線を破線で表記する。
障害監視計算機1(障害監視装置)は、基幹LAN(1系基幹LAN31、2系基幹LAN32)を介してネットワーク接続装置2と接続される。ネットワーク接続装置2は、支線LAN(1系支線LAN33、2系支線LAN34)を介して監視対象のネットワーク接続機器4と接続される。
これらの障害監視システムの各装置は、制御部(CPU:Central Processing Unit)、記憶部(メモリ、ハードディスクなど)、および、通信部(ネットワークインタフェース)を備えるコンピュータとして構成される。
【0011】
障害監視計算機1は、ネットワーク接続機器4を監視する管理用の計算機である。障害監視計算機1は、機器状態テーブル11と、接続状態テーブル12とを有する。
機器状態テーブル11は、機器状態用信号により取得した各ネットワーク接続機器4までの通信状態を記憶するためのテーブルである。
機器状態用信号は、障害監視計算機1からネットワーク接続機器4に対して送信される要求信号と、その要求信号への応答信号である。機器状態用信号は、例えば、ping(Packet Internet Groper)が使用される。機器状態用信号の要求信号には、ネットワーク接続機器4のIP(Internet Protocol)アドレスが指定される。
【0012】
接続状態テーブル12は、接続状態用信号により取得した各ネットワーク接続装置2の保守状態を記憶するためのテーブルである。
接続状態用信号は、障害監視計算機1からネットワーク接続装置2に対して送信される要求信号と、その要求信号への応答信号である。接続状態用信号は、例えば、UDP(User Datagram Protocol)/IPが使用される。
【0013】
ネットワーク接続装置2も、LANと同様に、2系統の冗長構成である。一方のネットワーク接続装置2aをデータ中継等を行う現用系とし、もう一方のネットワーク接続装置2bを待機系とする。
障害監視計算機1は、機器状態用信号の応答信号が未着であるときに、自身からネットワーク接続機器4までの経路の通信障害を検知する。障害監視計算機1は、通信障害が発生した場合は、ネットワーク接続装置2の系切替により、通信途絶の回復を試みる。ネットワーク接続装置2の系切替とは、現在の現用系のネットワーク接続装置2aを次回の待機系に変更するとともに、現在の待機系のネットワーク接続装置2bを次回の現用系へと変更することである。
【0014】
ネットワーク接続装置2は、接続スイッチ21を有し、他のネットワーク接続装置2と通信するための制御線22が接続されている。
接続スイッチ21は、各ネットワーク(1系基幹LAN31、2系基幹LAN32、1系支線LAN33、2系支線LAN34)をネットワーク接続装置2内で接続するためのスイッチであり、この接続スイッチ21がON(接続状態)のときにはデータの中継を行う。
制御線22は、ネットワーク接続装置2aとネットワーク接続装置2bとを接続し、この制御線22を介して、系切替のための制御信号を送受信する。
【0015】
図2は、機器状態テーブル11の状態収集処理を示す説明図である。この図では、4つの機器状態用信号P1〜P4を例示する。1つの機器状態用信号(例えば、P1)による収集結果が、機器状態テーブル11内の1つのレコード(例えば、第1行)に書き込まれる。
【0016】
機器状態テーブル11は、機器状態用信号を示す「信号」と、その機器状態用信号の送信先として指定されるネットワーク接続機器4を示す「機器」と、機器状態用信号の送受信に使用されるネットワークの系統を示す「LAN」と、機器状態用信号の応答信号の到着(○)/未着(×)を示す「状態」とを対応付ける。
例えば、機器状態テーブル11の第1行は、1系LAN(1系基幹LAN31、1系支線LAN33)を経由してネットワーク接続機器4aへと送信される機器状態用信号の応答信号が障害監視計算機1に到着(状態=○)したことを示す。
【0017】
図3は、接続状態テーブルの状態収集処理を示す説明図である。
図3(a)は、ネットワーク接続装置2a内の接続スイッチ21aを示す。接続スイッチ21aは、1系用スイッチ(1系基幹LAN31と1系支線LAN33を接続)と、2系用スイッチ(2系基幹LAN32と2系支線LAN34を接続)とから構成される。
図3(a)では、2つのスイッチがともにON(状態=○)である。
【0018】
ネットワーク接続装置2aは、障害監視計算機1からの接続状態用信号(要求信号)を受けると、自身の接続スイッチ21a内の各スイッチの状態(ONかOFFか)を取得し、その取得結果を接続状態用信号(応答信号)として障害監視計算機1に通知する。
障害監視計算機1は、通知された接続スイッチ21a内の各スイッチの状態を、接続状態テーブル12へと書き出す。接続状態テーブル12は、接続状態用信号の送信先として指定されるネットワーク接続装置2を示す「装置」と、その装置内の接続スイッチ21のネットワークの系統を示す「LAN」と、スイッチの状態として、「ON=○」または「OFF=×」を示す「状態」とを対応付ける。
【0019】
図3(b)は、
図3(a)と同様に、ネットワーク接続装置2a内の接続スイッチ21aを示すが、両スイッチがOFFになっている。これにより、1系基幹LAN31と1系支線LAN33との間の通信や、2系基幹LAN32と2系支線LAN34との間の通信が切断される。
なお、ネットワーク接続装置2は、スイッチの状態を変更する(ONからOFFへ、OFFからONへ)手段を、物理的な切替用スイッチや論理的なコマンド入力などにより管理者などに提供する。スイッチをOFFにする要因は、例えば、ネットワーク接続装置2の保守点検である。
【0020】
図4は、第1の障害監視処理を示すフローチャートである。
S101において、障害監視計算機1は、
図2で示したように、機器状態用信号を用いて各ネットワーク接続機器4の状態の収集し、その結果を機器状態テーブル11に格納する。
【0021】
S102において、障害監視計算機1は、S101で格納した機器状態テーブル11から1つの機器を選択し(例えば、ネットワーク接続機器4a)、その機器の状態列を参照して以下のように分岐する。
同じ機器の状態列が全て「○」なら、両系正常であり、そのときには障害対策は不要なので、処理を終了する。
同じ機器の状態列が1つだけ「×」なら、片系異常であり、そのときには障害対策をするため、S106へ進む。
同じ機器の状態列が全て「×」なら、両系異常であり、そのときには保守作業中か、障害発生中かをさらに調査するため、S103へ進む。
【0022】
S103において、障害監視計算機1は、S102で判定した所定機器についての障害が発生したか否かを判定する。この判定では、所定機器とは別機器の状態列で「○」が存在するときは、所定機器についての障害が発生した(別機器は障害が発生していない)とし、S103,Yesから処理を終了する。
このケースでは、所定機器(ネットワーク接続機器4a)の装置障害であるため、その装置へ向かう経路を切り替えても、所定機器との間の通信は復旧しないことが明らかである。つまり、障害発生中であるものの、系切替によってその障害に対処できないので、あきらめる。
【0023】
S104において、障害監視計算機1は、
図3で示したように、接続状態用信号を用いて各ネットワーク接続装置2の状態を収集し、その結果を接続状態テーブル12に格納する。
S105において、障害監視計算機1は、S104で格納した接続状態テーブル12の状態から、S101の機器状態用信号が通過するネットワーク接続装置2の状態が保守中か否かを判定する。
つまり、ネットワーク接続装置2の状態列が全て「×(スイッチOFF)」であるときには、保守中であるので、S105のYesから、処理を終了する。これにより、保守作業における通信不通を障害と誤検出せず、現用系ネットワーク接続装置2aの切り替え処理(S106)を防止し、保守性の高いネットワークシステムを構築することができる。
【0024】
S106において、障害監視計算機1は、S105の判定により保守作業中でないことにより、障害発生中であるので、その障害への対処としてネットワーク接続装置2の系切替を実行する。つまり、ネットワーク接続装置2aの役割を現用系から待機系に変更し、ネットワーク接続装置2bの役割を待機系から現用系に変更する。
【0025】
図5は、機器状態テーブルの片系異常状態を示す説明図である。機器状態用信号P1は応答なし(点線矢印)であるものの、他の機器状態用信号P2〜P4は応答あり(実線矢印)である。
この
図5では、S102で片系異常と判断され、S106の系切替が実行される。
【0026】
図6は、機器状態テーブルの両系異常状態を示す説明図である。機器状態用信号P1,P2は応答なし(点線矢印)であるものの、他の機器状態用信号P3,P4は応答あり(実線矢印)である。
この
図6では、S102で両系異常と判断され、S103で所定機器障害(Yes)と判断されて終了するので、S106の系切替は実行されない。
【0027】
図7は、機器状態テーブルの全機器無応答状態を示す説明図である。全ての機器状態用信号P1〜P4は応答なし(点線矢印)である。
この
図7では、S102で両系異常と判断され、S103で所定機器障害でない(No)と判断される。その後、S105で保守中か否かが判断され、保守中でない(No)ときには、S106の系切替が実行される。
【0028】
図8は、S106の系切替後の経路を示す説明図である。
図2の系切替前の経路と比較すると、ネットワーク接続装置2aからネットワーク接続装置2bへと通信経路が変更されている。
【0029】
図9は、第2の障害監視処理を示すフローチャートである。このフローチャートは、
図4と比較すると、障害対処処理が装置単位の系切替(S106)から、装置を含むネットワークシステム単位の経路切替(S207)に置き換わっている。
【0030】
S201において、障害監視計算機1は、S101と同様に、ネットワーク接続機器4の状態を収集する。
S202において、障害監視計算機1は、S203で未選択の経路がないときには(No)、処理を終了する。
S203において、障害監視計算機1は、S201で収集した機器状態テーブル11の未選択のレコード(経路)を1つ選択する。
S204において、障害監視計算機1は、S203の選択経路の状態が正常(○)であるときには(Yes)、別の選択経路を選択するために、S202に戻る。
【0031】
S205において、障害監視計算機1は、S203の選択経路上の(選択経路が通過する各ネットワーク接続装置2の)接続状態をS104と同様の処理で収集して、接続状態テーブル12に格納する。
S206において、障害監視計算機1は、S205で収集した接続状態が保守中(×)であるネットワーク接続装置2が1台以上存在するか否かを判定する。保守中のネットワーク接続装置2が存在するときには、経路切替が不要なのでS202に戻る。
【0032】
S207において、障害監視計算機1は、S203の選択経路上のいずれかの地点で障害が発生しており、かつ、選択経路上のどの地点でも保守作業が行われていないので、選択経路から代替経路へ経路切替する。これにより、障害発生中の選択経路が今後の通信に使われなくなり、代替経路へと迂回することで、通信サービスを継続できる。
ここで、経路切替とは、選択経路が通過するネットワーク接続装置2だけでなく、選択経路が通過するネットワークも含めて、その選択経路上の通信路を使用しないようにする制御処理である。例えば、選択経路へのデータ流入が起きないように、各ネットワーク接続装置2の転送テーブル内の選択経路への経路コストを非常に大きな値としたり、転送テーブル内の選択経路を示すエントリを削除したりする処理である。
【0033】
以上説明した本実施形態により、ネットワーク接続機器4の障害の可能性があると判断後、ネットワーク接続装置2の動作状態を取得する通信を行い、ネットワーク接続装置2の動作状態が保守状態であった場合、ネットワーク接続装置2の系切替を行わず、障害誤検出を防止する。
これにより、保守作業が容易に実施でき、保守性の高いネットワークシステムを提供することができる。
【0034】
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
【0035】
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVDなどの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。