(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0022】
以下、図面を参照しながら、本発明を実施するための形態を説明する。本発明の実施の形態に係る障害対応訓練システムは、実際に系統運用用及び業務用として運用されているものと同じ、又は、それに近い訓練用のIP網(IPネットワーク)を構築し、その訓練用IP網とは別に訓練指令用端末及び模擬故障制御サーバを設け、それらの端末及びサーバを用いて、訓練指導者が訓練用IP網に障害を擬似的に発生させて、訓練用の管理端末にいる研修者に対して障害対応の訓練を行わせるものである。障害には、物理障害、論理障害及びトラフィック障害が含まれる。また、訓練には、障害発生に関する警報等の確認から機器交換等による復旧・確認までの対応作業が含まれる。
【0023】
警報等の確認から障害復旧までの作業は、基本的に以下のようなステップで行われる。
(1)障害発生時、IP網管理端末及び通信網運用管理端末へ出力されるログを分析し、障害部位を特定する。
(2)障害復旧の方法及びその手順を検討し、実施する。
(3)障害が復旧したことをIP網管理端末及び通信網運用管理端末で確認する。
【0024】
≪システムの構成と概要≫
図1は、障害対応訓練システム1の構成を示す図である。障害対応訓練システム1は、訓練指令用端末2及び模擬故障制御サーバ3と、レガシー系装置の通信網に係る装置群と、IP網に係る装置群とを含んで構成される。レガシー系装置とは、マイクロ波無線機や光伝送装置等、従来の(IP装置以外の)ネットワークを構成する装置であり、その通信網に係る装置群には、模擬伝送路装置及び模擬故障発生装置がある。その詳細説明は割愛する。IP網に係る装置群には、IP模擬故障発生装置である電源制御装置4及びIP模擬伝送路装置5、IP網管理装置6、IP網管理端末7、通信網運用管理装置8、通信網運用管理端末9、IP装置であるルータRT及びスイッチSWがある。
【0025】
訓練指令用端末2は、訓練指導者が障害の監視や制御を行う操作端末であり、訓練対象装置の状態をグラフィカルに表示し、各装置に対する模擬故障指令の発行を可能とする。すなわち、訓練指導者が訓練指令用端末2にトリガを与えて、模擬故障制御サーバ3を動作させる。模擬故障制御サーバ3は、訓練対象装置の監視及び制御を司る装置であり、IP模擬故障発生装置等から訓練対象装置の状態情報を収集し、訓練指令用端末2に通知するとともに、訓練指令用端末2からの模擬故障指令を、IP模擬故障発生装置等を介して訓練対象装置に伝送する。なお、訓練指令用端末2及び模擬故障制御サーバ3は、レガシー系装置の通信網に係る装置群にも関係する。また、模擬故障制御サーバ3は、IP網内にあるすべてのIP装置につながる。
【0026】
電源制御装置4は、ルータRT及びスイッチSWに出力する電圧値を低下させて、電源障害を発生させるための装置である。IP模擬伝送路装置5は、模擬故障制御サーバ3と、ルータRT及びスイッチSWとの間を仲介する装置であり、模擬故障制御サーバ3からの模擬故障指令を受けて、IP網の伝送路に擬似的な障害を発生させる。
【0027】
IP網管理装置6は、IP網の保守、管理を行う装置であり、ルータRTやスイッチSWから受けた通知をIP網管理端末7に転送する。IP網管理端末7は、IP網管理装置6から受けた通知をディスプレイ(表示部)に表示して、研修者にIP網の状態を知らせる。通信網運用管理装置8は、NMS(Network Management System)とも呼ばれ、IP網管理装置6とは別にIP網全体を管理する装置であり、
図2に示す系統運用用IP網及び業務用IP網の連携やソフトウェアの状況を総合的に監視し、障害が発生した場合に、IP網内に原因があるのか、外部からの影響を受けているのかを判断する。そして、ルータRTやスイッチSWから受けた通知やIP網管理装置6から受けたメッセージを通信網運用管理端末9に転送する。通信網運用管理端末9は、通信網運用管理装置8から受けた通知やメッセージをディスプレイ(表示部)に表示する。ルータRT及びスイッチSWは、IP網を構成するIP装置である。
【0028】
訓練指令用端末2、模擬故障制御サーバ3及びIP模擬伝送路装置5は、100Base−TXのファストイーサネット(Fast Ethernet)を介して相互通信可能に接続され、同一のセグメント内に存在する。模擬故障制御サーバ3と、ルータRT及びスイッチSWとの間は、同じファストイーサネットで接続され、異常通知やコンフィグ情報転送が行われる。模擬故障制御サーバ3と、電源制御装置4(#1)と、電源制御装置4(#2)との間は、シリアルインタフェースであるRS−232Cで接続され、電源制御装置4がIP装置に出力する電圧値の設定等が行われる。
【0029】
電源制御装置4(#1)はルータRTに直流電源を供給し、電源制御装置4(#2)はスイッチSWに直流電源を供給するが、それらの電圧値は模擬故障制御サーバ3からの設定により変動する。
【0030】
なお、障害対応訓練システム1は、レガシー系装置の通信網に係る装置群を含む従来のシステムに対して、訓練指令用端末2及び模擬故障制御サーバ3にIP網の障害に関する機能(ソフトウェア)を追加し、さらにIP模擬故障発生装置、IP網、管理装置及び管理端末を新規に追加した構成になっている。
【0031】
図2は、IP網の構成を示す図である。
図2(a)は、系統運用用IP網の構成を示す。系統運用用IP網は、通信の高速化や機能の付加を図る技術であるMPLS(Multi-Protocol Label Switching)で構成され、通信実習室B局のMPLSルータ(ルータRT)と、中央通信所のMPLSルータとの間にIP模擬伝送路装置5が設けられる。通信実習室A局では、FW(Fire Wall)を介してMPLSルータにテスト用端末Taが接続される。通信実習室B局では、FW(Fire Wall)を介してMPLSルータにテスト用端末Tbが接続される。テスト用端末Taと、テスト用端末Tbとの間には、テスト用データが送受信されるが、IP模擬伝送路装置5が擬似障害を発生させると、テスト用データの送受信に支障が出る。
【0032】
図2(b)は業務用IP網の構成を示す。業務用IP網は、セグメントプロトコルであるREP(Resilient Ethernet Protocol)で構成され、通信実習室B局内にある2つのL2SW(スイッチSW)の間にIP模擬伝送路装置5が設けられる。通信実習室A局では、L2SWにテスト用端末Taが接続される。通信実習室B局では、L2SWにテスト用端末Tbが接続される。テスト用端末Taと、テスト用端末Tbとの間には、テスト用データが送受信されるが、IP模擬伝送路装置5が擬似障害を発生させると、テスト用データの送受信に支障が出る。
【0033】
図3は、各装置のハードウェア構成を示す図である。ここでいう装置には、訓練指令用端末2、模擬故障制御サーバ3、各管理端末及び各管理装置が含まれる。装置は、通信部、表示部、入力部、処理部及び記憶部を備え、各部がバスを介してデータを送受信可能なように接続されている。通信部は、ネットワークを介して他の装置とIP(Internet Protocol)通信等を行う部分であり、例えば、NIC(Network Interface Card)等によって実現される。表示部は、処理部からの指示によりデータを表示する部分であり、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)等によって実現される。入力部は、オペレータがデータ(例えば、模擬故障指令のデータ)を入力する部分であり、例えば、キーボードやマウス等によって実現される。
【0034】
処理部は、所定のメモリを介して各部間のデータの受け渡しを行うととともに、装置全体の制御を行うものであり、CPU(Central Processing Unit)が所定のメモリに格納されたプログラムを実行することによって実現される。記憶部は、処理部からデータを記憶したり、記憶したデータを読み出したりするものであり、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の不揮発性記憶装置によって実現される。特に、訓練指令用端末2では記憶部25とし、模擬故障制御サーバ3では記憶部35とする。なお、訓練指令用端末2及び各管理端末は、PC(Personal Computer)等により実現され、模擬故障制御サーバ3及び各管理装置は、サーバ用コンピュータ等により実現される。
【0035】
電源制御装置4には、例えば、高砂製作所のZX−800Lが用いられる。IP模擬伝送路装置5には、例えば、アンリツのMD1230Bが用いられる。
【0036】
≪データの構成≫
図4は、訓練指令用端末2の記憶部25に記憶されるデータの構成を示す図である。
図4(a)は、電源故障選択情報25Aの構成を示す。電源故障選択情報25Aは、訓練指令用端末2に電源故障指令画面を表示する際に用いられるデータであり、局25A1、IP装置25A2及び故障項目25A3を含むレコードからなる。局25A1は、IP装置を管理する単位であり、例えば、各通信実習室に設置された一まとまりのIP装置群を示す。IP装置25A2は、当該局に含まれるIP装置の名称である。故障項目25A3は、当該IP装置に発生させることができる故障の種類である。
【0037】
電源故障選択情報25Aの局25A1、IP装置25A2及び故障項目25A3は、階層的に設定されるので、
図9に示す電源故障指令画面において、局が選択されると、その局に設置されている装置の名称が表示され、装置が選択されると、その装置に発生可能な故障項目が表示される。
【0038】
図4(b)は、伝送路故障選択情報25Bの構成を示す。伝送路故障選択情報25Bは、訓練指令用端末2に伝送路故障指令画面を表示する際に用いられるデータであり、局間25B1、伝送路装置25B2、模擬伝送路名25B3及び故障項目25B4を含むレコードからなる。局間25B1は、故障を発生させる伝送路の両端の局を特定するものであり、例えば、A局−B局、A局−C局等が設定される。伝送路装置25B2は、当該局間の伝送路に接続される伝送路装置の種類を示し、例えば、IP模擬伝送路や光ファイバ伝送路等が設定されるが、IP網に限れば、IP模擬伝送路が設定される。模擬伝送路名25B3は、当該模擬伝送路の名称を示す。故障項目25B4は、当該伝送路装置に発生させることができる故障の種類であり、例えば、トラヒック高負荷、パケットロス、エラーフレーム挿入、リンク断、コリジョン発生等が設定される。
【0039】
伝送路故障選択情報25Bの局間25B1、伝送路装置25B2、模擬伝送路名25B3及び故障項目25B4は、階層的に設定されるので、
図12Bの伝送路故障指令の画面において、局間が選択されると、その局間に接続されている装置の種類が表示され、その装置の種類が選択されると、その種類の装置の伝送路名が表示され、その伝送路名が選択されると、その伝送路名の装置に発生させることのできる故障項目が表示される。
【0040】
図4(c)は、転送コンフィグ選択情報25Cの構成を示す。転送コンフィグ選択情報25Cは、訓練指令用端末2にコンフィグ転送画面を表示する際に用いられるデータであり、局25C1、IP装置25C2及びコンフィグ25C3を含むレコードからなる。局25C1は、IP装置を管理する単位である。IP装置25C2は、当該局に含まれるIP装置の名称である。コンフィグ25C3は、当該IP装置に論理障害を発生させ、又は、復旧させるために用いられるコンフィグの種類であり、正常、異常(リンク断)等が設定される。
【0041】
転送コンフィグ選択情報25Cの局25C1、IP装置25C2及びコンフィグ25C3は、階層的に設定されるので、
図13Bのコンフィグ転送画面において、局が選択されると、その局に含まれるIP装置の名称が表示され、IP装置が選択されると、そのIP装置用に用意されているコンフィグの種類が表示される。
【0042】
図5は、模擬故障制御サーバ3の記憶部35に記憶されるデータの構成を示す図であり、転送コンフィグ情報35Aの構成を示す。転送コンフィグ情報35Aは、模擬故障制御サーバ3からルータRTやスイッチSW等のIP装置に転送されるコンフィグ情報であり、コンフィグ種類35A1及びコンフィグ情報35A2を含むレコードからなる。コンフィグ種類35A1は、転送されるコンフィグ情報の種類であり、正常、Speed設定不整合、Fire Wall設定ミス等が設定される。コンフィグ情報35A2は、転送されるコンフィグ情報のデータ自体である。なお、転送コンフィグ情報35Aは、IP装置の種類(ルータ、スイッチ等)ごとに記憶されてもよいし、IP装置ごとに記憶されてもよい。
【0043】
≪システムの処理≫
図6〜8は、障害対応訓練システム1の処理を示すフローチャートである。障害対応訓練システム1は、訓練指導者がIP網の擬似障害発生のトリガを与えて、研修者が障害の発生を知って対応を行うものである。なお、訓練に対する評価機能として、障害を見つけてから、原因の究明及び対策、復旧までの時間を制限し、その制限時間(例えば、1時間)以内にIP網の復旧ができなければ、研修者に対してペナルティ(罰則)を課すようにしてもよい。ペナルティには、例えば、再度同じ障害への対応を訓練し、制限時間以内に復旧できるまで繰り返すこと等が考えられる。
【0044】
[電源模擬故障]
図6は、電源模擬故障の処理を示すフローチャートである。本処理では、訓練指導者の指示操作に応じてIP装置の電源に故障を発生させ、研修者に電源故障を通知し、その対応を行わせるとともに、訓練指導者の指示操作に応じてIP装置の電源を復旧させる。
【0045】
まず、訓練指令用端末2は、訓練指導者の操作に応じて電源故障指令画面を表示部に表示する(S601)。
図9は、電源故障指令画面の構成を示す図である。電源故障指令画面に対して、訓練指導者は、故障指令対象項目として「局」→「装置」→「故障項目」の順に指定する。「局」、「装置」、「故障項目」の選択エリア内には、制御可能な局、装置、故障項目が一覧表示される。一覧表示から各項目を選択することにより、模擬故障発生項目を指定する。
【0046】
ツリー画面(例えば、
図12Aに示す画面)により故障発生項目が選択済み、かつ、その項目が制御可能な場合には、「局」、「装置」、「故障項目」の選択した項目にフォーカスが当てられた状態で、電源故障指令画面が開かれる。訓練指導者は、故障項目を選択し直すことなく、該当項目を模擬故障発生項目として選択し、故障指令を行う。ツリー画面により選択された項目が制御可能でない場合には、その上位項目(例えば、故障項目が制御できなければ、選択されている装置の項目)にフォーカスが当てられた状態で、電源故障指令画面が開かれる。
【0047】
訓練指導者は、訓練指令用端末2の表示部に表示された電源故障指令画面に対して、所望の故障項目を指定する。訓練指令用端末2は、電源故障指令画面に指定された項目に応じて、電源故障指令を模擬故障制御サーバ3に送信する(S602)。模擬故障制御サーバ3は、訓練指令用端末2から電源故障指令を受信し(S602)、当該電源故障指令に応じた、IP装置の動作に支障を来たす異常電圧値を設定するコマンドを電源制御装置4に送信する(S603)。電圧の範囲は、例えば、0〜42[V]が設定可能であり、模擬故障制御サーバ3からのリモート制御だけでなく、電源制御装置4の前面パネルからの手動操作による設定も可能である。実際には、直流電源の電圧を±10〜15%変動させることができるが、ここでは、ルータやスイッチの動作電圧を下げることにより、異常な動作を起こさせる。
【0048】
電源制御装置4は、模擬故障制御サーバ3から、異常電圧値の設定コマンドを受信し(S603)、IP装置に異常電圧を出力する(S604)。IP装置は、電源制御装置4から異常電圧の出力を受けると(S604)、今まで正常だった電源が異常になったことを検知し、電源異常の通知を模擬故障制御サーバ3及びIP網管理装置6に送信する(S605、S606)。電源異常の通知は、SNMP(Simple Network Management Protocol)によるトラップ通知を用いて送受信される。
【0049】
模擬故障制御サーバ3は、IP装置から電源異常の通知を受けて(S605)、IP網の状態に変化が発生したことの通知を訓練指令用端末2に送信する(S607)。訓練指令用端末2は、模擬故障制御サーバ3から状態変化の通知を受けて(S607)、故障項目一覧画面を表示部に表示する(S608)。これにより、訓練指導者は、自分が電源故障指令画面に指定した故障が実際に発生したことを確認することができる。
【0050】
図10は、故障項目一覧画面の構成を示す図である。故障項目一覧画面は、現在発生中の、IP網の故障項目が一覧表形式により出力されるものであり、リアルタイムに表示内容が更新される。故障項目一覧画面の表示中に新たな故障項目が発生すると、一覧の最下段に追加され、最新の故障項目が常に表示されるように自動的にスクロールされる。一覧の表示内容は、条件の指定による絞り込み表示が可能である。また、CSV形式で保存できるため、Excel(登録商標)を使用して編集や印刷をすることができる。なお、故障項目一覧画面は、伝送路模擬故障やコンフィグ障害にも適用される。
【0051】
一方、IP網管理装置6は、IP装置から電源異常の通知を受けて(S606)、IP網管理端末7に当該電源異常の通知を送信する(S609)。IP網管理端末7は、IP網管理装置6から電源異常の通知を受けて(S609)、故障項目一覧画面を表示部に表示する(S610)。これにより、研修者は、IP装置の電源異常が発生していることを知って、障害対応を開始することになる。なお、通信網運用管理端末9が、通信網運用管理装置8経由でIP装置やIP網管理装置6からの通知を受信し、故障項目一覧画面を表示部に表示することにより、研修者が通信網運用管理端末9の画面で障害発生を確認するようにしてもよい(伝送路模擬故障やコンフィグ障害も同様)。
【0052】
訓練指導者は、障害対応訓練の時間が制限されている場合には、電源故障の指示を行ってから所定時間が経過すると、訓練を終了する。また、障害対応訓練を行うべき時間帯が決まっている場合には、その時間帯の終了時刻になると、訓練を終了する。訓練を終了する際に、訓練指導者は、訓練指令用端末2の表示画面(図示せず)のメニューバーにより「訓練終了」を選択する。これは、伝送路模擬故障やコンフィグ障害の場合も同様である。なお、研修者が障害に対応できなかった場合にも、訓練指導者の「訓練終了」選択による障害復旧が必要になる。
【0053】
そのとき、訓練指令用端末2は、入力部から訓練終了指示を取得するが(S611)、障害対応訓練を終了する際にはIP網を元の正常な状態に戻す必要があるので、模擬故障制御サーバ3に電源復旧指令を送信する(S612)。模擬故障制御サーバ3は、訓練指令用端末2から電源復旧指令を受信し(S612)、当該電源復旧指令に応じた正常電圧値を設定するコマンドを電源制御装置4に送信する(S613)。電源制御装置4は、模擬故障制御サーバ3から正常電圧値の設定コマンドを受信し(S613)、IP装置に正常電圧を出力する(S614)。IP装置は、電源制御装置4から正常電圧の出力を受けると(S604)、今まで異常だった電源が正常になったことを検知し、電源正常の通知を模擬故障制御サーバ3及びIP網管理装置6に送信する(S615、S616)。
【0054】
模擬故障制御サーバ3は、IP装置から電源正常の通知を受けて(S615)、IP網の状態に変化が発生したことの通知を訓練指令用端末2に送信する(S617)。訓練指令用端末2は、模擬故障制御サーバ3から状態変化の通知を受けて(S617)、
図11に示す故障履歴一覧画面を表示部に表示する(S618)。これにより、訓練指導者は、訓練の終了に際して、IP装置の電源が復旧したことを確認することができる。
【0055】
図11は、故障履歴一覧画面の構成を示す図である。本図の故障履歴一覧画面は、訓練指令用端末2の表示部に表示される画面であり、IP網に発生したすべての故障項目に対し、設定条件による絞り込みにより、故障の発生/復旧状況を時系列に一覧表形式で出力する。一覧に表示される内容は、条件を指定した絞りこみ表示をすることができる。また、CSV形式で保存できるため、Excel(登録商標)を使用して編集や印刷をすることができる。なお、故障履歴一覧画面は、伝送路模擬故障、コンフィグ障害にも適用される。
【0056】
一方、IP網管理装置6は、IP装置から電源正常の通知を受けて(S616)、IP網管理端末7に当該電源正常の通知を送信する(S619)。IP網管理端末7は、IP網管理装置6から電源正常の通知を受けて(S619)、故障履歴一覧画面(図示せず)を表示部に表示する(S620)。これにより、研修者は、IP装置の電源が復旧していることを確認することができる。なお、故障履歴一覧画面により、自らの障害対応の結果を確認することもできる。
【0057】
[伝送路模擬故障]
図7は、伝送路模擬故障の処理を示すフローチャートである。本処理では、訓練指導者の指示操作に応じて2局間の伝送路に故障を発生させ、研修者に伝送路故障を通知し、その対応を行わせる。なお、研修者が伝送路故障の発生を知るためには、テスト用データを受信するテスト用端末Tbの表示部を自分が直接見ていてもよいし、テスト用端末Tbの表示部を見ているユーザから申告を受けるようにしてもよい。
【0058】
IP網においては、テスト用端末Ta、IP装置a、伝送路、IP装置b及びテスト用端末Tbがつながっていて、IP装置aとIP装置bとの間の伝送路の途中にIP模擬伝送路装置5が設けられる。テスト用端末Taは、定期的にテスト用データを送信しており(S701)、そのテスト用データは、IP装置a→伝送路→IP模擬伝送路装置5→伝送路→IP装置bを経由して、テスト用端末Tbに受信される(S702)。テスト用端末Tbがテスト用データを正常に受信したことを表示することにより、研修者は、テスト用端末Taと、Tbとの間のデータ送受信が正常に行われていることを認識する。
【0059】
なお、テスト用データとして、テレビカメラの映像データを送受信してもよい。これによれば、テスト用端末Tbで表示される映像が少しでも乱れると、異常が発生したことがすぐに分かる。また、テスト用端末Taが所定量のデータを送信し続けて、テスト用端末Tbは、受信するデータが少なくなると、警報を出すようにしてもよい。これによれば、異常が発生したことがすぐに分かる。
【0060】
訓練指令用端末2は、訓練指導者の操作に応じて伝送路故障指令画面を表示部に表示する(S711)。
図12Bは、伝送路故障指令画面の構成を示す図である。伝送路故障指令画面において、訓練指導者は、伝送路故障対象項目として、「局間」→「装置」→「模擬伝送路名」→「故障項目」の順に指定する。「局間」、「装置」、「模擬伝送路名」及び「故障項目」の選択エリア内には、制御可能な局間、装置、模擬伝送路名及び故障項目を一覧表示する。一覧表示から各項目を選択し、伝送路故障発生項目を指定する。
【0061】
訓練指導者は、訓練指令用端末2の表示部に表示された伝送路故障指令画面に対して、所望の故障項目を指定する。訓練指令用端末2は、電源故障指令画面に指定された項目に応じて、伝送路故障指令を模擬故障制御サーバ3に送信する(S712)。模擬故障制御サーバ3は、訓練指令用端末2から伝送路故障指令を受信し(S712)、当該伝送路故障指令に応じたトラフィック障害を制御するコマンドをIP模擬伝送路装置5に送信する(S713)。IP模擬伝送路装置5は、模擬故障制御サーバ3からトラフィック障害制御のコマンドを受けて(S713)、当該コマンドの指定内容に応じてトラフィック障害を発生させる。
【0062】
IP模擬伝送路装置5がトラフィック障害を発生させると、テスト用端末Taがテスト用データを送信しても(S721)、テスト用端末Tbは、定期的に来るはずのテスト用データを受信できない(S722)。テスト用端末Tbがテスト用データを受信できないことを表示することにより、研修者は、テスト用端末Taと、Tbとの間のデータ送受信が正常に行われていないことを認識し、障害対応を開始することになる。なお、IP模擬伝送路装置5により故障になった伝送路は、訓練指令用端末2の伝送路故障指令画面において、「故障復旧」ボタンを操作することにより、模擬故障制御サーバ3からIP模擬伝送路装置5に正常コマンドが発行され、異常状態から正常状態に復旧する。
【0063】
なお、トラフィック障害には、トラフィック高負荷、エラーフレーム、パケットロス、コリジョン(信号の衝突)等がある。それらに関しては、少なくとも伝送路上の通信は行われるので、IP装置が異常を検出することはなく、模擬故障制御サーバ3やIP網管理装置6等には何も通知されず、テスト用端末Tbだけで異常を検出することになる。
【0064】
詳細には、IP模擬伝送路装置5でトラフィック高負荷を発生させて、通常は10〜15%のトラフィックを80%に上げると、テスト用端末Tbでデータ遅延が発生する。IP模擬伝送路装置5でエラーフレームを挿入すると、テスト用端末Tbでエラーフレームの発生を検出する。IP模擬伝送路装置5でパケットを破棄すると、テスト用端末Tbでパケットロスの発生を検出する。IP模擬伝送路装置5で伝送路に対してトラフィックを発生させると、テスト用端末Ta、Tb間でコリジョンの発生を検出する。
【0065】
[コンフィグ障害]
図8は、コンフィグ障害の処理を示すフローチャートである。本処理では、訓練指導者の指示操作に応じてIP装置にコンフィグ障害を発生させ、研修者にコンフィグ障害を通知し、その対応を行わせるとともに、訓練指導者の指示操作に応じてコンフィグ障害を復旧させる。すなわち、模擬故障制御サーバ3からIP装置に対して間違ったコンフィグ情報を書き込むことにより論理障害を擬似的に発生させ、正しいコンフィグ情報に書き換えることにより論理障害を復旧させる。
【0066】
まず、訓練指令用端末2は、訓練指導者の操作に応じてコンフィグ転送画面を表示部に表示する(S801)。
図13Bのコンフィグ転送画面において、訓練指導者は、コンフィグ転送対象項目として、「局」→「装置」→「コンフィグ」の順に指定する。「局」、「装置」、「コンフィグ」の選択エリア内には、コンフィグ情報が転送可能な装置及び転送用コンフィグ情報の種類が一覧表示される。なお、同一のIP装置に対して、複数のコンフィグ情報を同時に転送することはできない。また、転送用の正常/異常のコンフィグ情報は、メンテナンス機能により事前に模擬故障制御サーバ3に登録することができる。
【0067】
図13Aのコンフィグ転送画面において、例えば、左側に示すネットワーク構成図のツリー表示項目の中から「ネットワーク構成図」を選択すると、該当するIPネットワーク図が表示され、コンフィグ転送を行いたいMPLSルータのボックスを選択すると、局及び装置が選択済の
図13Bのコンフィグ転送画面が表示される。
【0068】
訓練指導者は、訓練指令用端末2の表示部に表示されたコンフィグ転送画面に対して、所望の項目を指定する。訓練指令用端末2は、コンフィグ転送画面に指定された項目に応じて、コンフィグ障害指令を模擬故障制御サーバ3に送信する(S802)。模擬故障制御サーバ3は、訓練指令用端末2からコンフィグ障害指令を受信し(S802)、当該コンフィグ障害指令に応じた異常コンフィグ情報をIP装置に送信する(S803)。IP装置は、模擬故障制御サーバ3から異常コンフィグ情報を受信すると(S803)、記憶しているコンフィグ情報を、受信した異常コンフィグ情報
に書き換える。その後、コンフィグ情報が異常であることを検知し、コンフィグ情報の誤設定によるアラーム通知を模擬故障制御サーバ3及びIP網管理装置6に送信する(S804、S805)。
【0069】
模擬故障制御サーバ3は、IP装置からアラーム通知を受けて(S804)、IP網の状態に変化が発生したことの通知を訓練指令用端末2に送信する(S806)。訓練指令用端末2は、模擬故障制御サーバ3から状態変化の通知を受けて(S806)、故障項目一覧画面を表示部に表示する(S807)。これにより、訓練指導者は、自分がコンフィグ転送画面に指定した異常コンフィグ情報により、論理障害が実際に発生したことを確認することができる。
【0070】
一方、IP網管理装置6は、IP装置からアラーム通知を受けて(S805)、IP網管理端末7に当該アラーム通知を送信する(S808)。IP網管理端末7は、IP網管理装置6からアラーム通知を受けて(S808)、故障項目一覧画面を表示部に表示する(S809)。これにより、研修者は、論理障害が発生していることを知って、障害対応を開始することになる。そして、コンフィグ情報の誤設定が原因であることが分かれば、IP網管理端末7を操作して、IP装置に設定されたコンフィグ情報を修正する。
【0071】
訓練指令用端末2は、障害訓練が終了したとき等に、訓練指導者の操作に応じてコンフィグ転送画面を表示部に再度表示する(S811)。訓練指導者は、IP装置のコンフィグ情報を元に戻すために、コンフィグの「normalConfig」を選択する。「normalConfig」の選択に応じて、訓練指令用端末2は、模擬故障制御サーバ3にコンフィグ復旧指令を送信する(S812)。模擬故障制御サーバ3は、訓練指令用端末2からコンフィグ復旧指令を受信し(S812)、当該コンフィグ復旧指令に応じた正常コンフィグ情報をIP装置に送信する(S813)。IP装置は、模擬故障制御サーバ3から正常コンフィグ情報を受信すると(S813)、記憶しているコンフィグ情報を、受信した正常コンフィグ情報を書き換える。その後、コンフィグ情報が正常に戻ったことを検知し、復旧通知を模擬故障制御サーバ3及びIP網管理装置6に送信する(S814、S815)。
【0072】
模擬故障制御サーバ3は、IP装置から復旧通知を受けて(S814)、IP網の状態に変化が発生したことの通知を訓練指令用端末2に送信する(S816)。訓練指令用端末2は、模擬故障制御サーバ3から状態変化の通知を受けて(S816)、
図11に示す故障履歴一覧画面を表示部に表示する(S817)。これにより、訓練指導者は、正常コンフィグ情報の選択により、IP装置のコンフィグ障害が復旧したことを確認することができる。
【0073】
一方、IP網管理装置6は、IP装置から復旧通知を受けて(S815)、IP網管理端末7に当該復旧通知を送信する(S818)。IP網管理端末7は、IP網管理装置6から復旧通知を受けて(S818)、故障履歴一覧画面(図示せず)を表示部に表示する(S819)。これにより、研修者は、IP装置の電源が復旧していることを確認することができる。なお、故障履歴一覧画面により、自らの障害対応の結果を確認することもできる。
【0074】
なお、上記に説明したのは、I/Fに対しDisableが設定されたコンフィグ情報をIP装置に転送したときの処理である。それ以外の入力ミスのコンフィグ情報を用いたときには、IP装置からアラーム通知や復旧通知は上がらず、
図7の伝送路模擬故障の処理と同様に、テスト用端末Ta、Tb間のデータ送受信が正常に行われないことで障害の発生が検出される。
【0075】
≪論理障害(コンフィグ障害)の詳細≫
コンフィグ障害には、Speed設定不整合、FireWall設定ミス、IPアドレス設定ミス、サブネット設定ミス、VPN設定間違い、site設定間違い、I/Fに対しDisable及びsiteに対しinactiveがある。以下に、コンフィグ情報の誤設定の内容及びIP装置の動作について説明する。
【0076】
Speed設定不整合に関して、例えば、通信速度の10MB/Sを5MB/Sに誤設定する。コンフィグ情報に設定されたspeedが実際の通信速度と不一致の場合には、リンクアップしない。Duplexが違う場合には、リンクアップするが、常に通信ができないことがある。AutoNEGO及び100MFullに固定した設定を行った場合には、100MHalfでリンク接続する。
【0077】
FireWall設定ミスに関して、接続方法に関するデータの設定を間違えた場合には、LAN間通信ができない。スループットの設定を間違えた場合には、データ転送の遅延やデータの廃棄が発生する。すなわち、受信すべきデータが受信できないという事象が発生する。
【0078】
IPアドレス及びサブネットの設定ミスの場合には、ルータ間のデータ通信はできないが、リンクアップはする。VPN(Virtual Private Network)設定間違いに関して、暗号化に関する内容を間違えた場合には、VPN(Tunnel)間の通信ができない。
【0079】
site設定間違いの場合には、ルータ間のデータ通信ができないが、リンクアップはする。なお、siteとはNEC製のIP管理端末上で使用している用語であり、一般的にはサブインタフェース(論理インタフェース)のことを示す。I/Fに対しDisableの場合には、IP装置のI/F(インタフェース)を不使用にし、リンクダウンする。siteに対しinactiveの場合には、ルータ間のデータ通信ができないが、リンクアップはする。
【0080】
なお、上記実施の形態では、
図1に示す障害対応訓練システム1の各装置を機能させるために、処理部(CPU)で実行されるプログラムをコンピュータにより読み取り可能な記録媒体に記録し、その記録したプログラムをコンピュータに読み込ませ、実行させることにより、本発明の実施の形態に係る障害対応訓練システム1が実現されるものとする。この場合、プログラムをインターネット等のネットワーク経由でコンピュータに提供してもよいし、プログラムが書き込まれた半導体チップ等をコンピュータに組み込んでもよい。
【0081】
以上説明した本発明の実施の形態によれば、IP装置及び伝送路を含むネットワークの障害に対応する訓練が可能になる。詳細には、以下のような技術を習得することができる。
(1)ルータやスイッチ等のIP装置に物理障害(ハード障害)が発生した場合に、現場で障害部位を特定し、交換する技術を習得できる。
(2)IP網内におけるトラフィックの高負荷や、ユーザによるIP網の想定外利用に起因するデータ遅延トラブル等を擬似体験し、ネットワークの正常化に向けた復旧技術を習得できる。特に、IP模擬伝送路装置5を用いることにより、IP装置が検出することのできない、データの抜けや遅延等の、原因追求が難しい障害への対応の訓練を行うことができるので、非常に有用である。
(3)IP装置で論理障害(コンフィグ入力ミス)に起因するトラブルが発生した場合に、現場でその原因を探査し、処理する技術を習得できる。
【0082】
以上、本発明を実施するための形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得るとともに、本発明にはその等価物も含まれる。例えば、上記実施の形態では、IP網管理端末7等の各端末がIP網の状態を表示するように記載したが、例えば、音声出力したり、通信部により当該IP網とは別のネットワークを経由して他の端末(PC、携帯端末等)に送信したりするようにしてもよい。