(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6388835
(24)【登録日】2018年8月24日
(45)【発行日】2018年9月12日
(54)【発明の名称】障害分析支援装置、障害分析システムおよびプログラム
(51)【国際特許分類】
H04L 12/70 20130101AFI20180903BHJP
【FI】
H04L12/70 100A
【請求項の数】4
【全頁数】10
(21)【出願番号】特願2015-28038(P2015-28038)
(22)【出願日】2015年2月16日
(65)【公開番号】特開2016-152460(P2016-152460A)
(43)【公開日】2016年8月22日
【審査請求日】2017年9月4日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100114258
【弁理士】
【氏名又は名称】福地 武雄
(74)【代理人】
【識別番号】100125391
【弁理士】
【氏名又は名称】白川 洋一
(72)【発明者】
【氏名】樫原 俊太郎
【審査官】
菊地 陽一
(56)【参考文献】
【文献】
特開2011−188422(JP,A)
【文献】
国際公開第2013/042349(WO,A1)
【文献】
特開2013−247410(JP,A)
【文献】
米国特許出願公開第2013/0346584(US,A1)
【文献】
宮澤 雅典 他,統合リソース情報を活用した障害解析手法の提案,電子情報通信学会技術研究報告 Vol.110 No.119,2010年 7月,ICM2010-23,第85-90頁
(58)【調査した分野】(Int.Cl.,DB名)
H04L 12/70
(57)【特許請求の範囲】
【請求項1】
ネットワーク障害の影響分析を支援する障害分析支援装置であって、
障害影響分析システムからネットワーク構成情報を要求する旨の構成要求を受信する構成要求受信部と、
構成情報管理システムから前記構成要求に対応したネットワーク構成情報を含む構成情報リストを取得する構成リスト受信部と、
ネットワークを構成する設備に対してリソースの割り当てを行なうリソース割当サーバから動的なリソース情報を取得し、前記構成情報リストに前記動的なリソース情報を付与する動的リソース情報付与部と、
前記動的リソース情報が付与された構成情報リストに対し、前記構成要求と一致する項目にフラグ情報を付与するフラグ付与部と、を備え、
前記フラグ情報が付された項目のみを前記構成情報リストから抽出して、前記障害影響分析システムに出力することを特徴とする障害分析支援装置。
【請求項2】
前記障害影響分析システムから受信した構成要求をバッファリングする要求バッファ部を更に備え、
前記構成リスト受信部は、構成情報管理システムから前記要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストを取得し、
前記動的リソース情報付与部は、前記要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストに前記動的なリソース情報を付与することを特徴とする請求項1記載の障害分析支援装置。
【請求項3】
リソース割当サーバがネットワークを構成する設備に対して動的にリソースの割り当てを行なうネットワークの障害の影響を分析する障害分析システムであって、
前記ネットワークの構成情報を管理する構成情報管理システムと、
前記ネットワーク内で発生した障害の影響を分析する障害影響分析システムと、
請求項1または請求項2記載の障害分析支援装置と、から構成されることを特徴とする障害分析システム。
【請求項4】
ネットワーク障害の影響分析を支援する障害分析支援装置のプログラムであって、
障害影響分析システムからネットワーク構成情報を要求する旨の構成要求を受信する処理と、
構成情報管理システムから前記構成要求に対応したネットワーク構成情報を含む構成情報リストを取得する処理と、
ネットワークを構成する設備に対してリソースの割り当てを行なうリソース割当サーバから動的なリソース情報を取得し、前記構成情報リストに前記動的なリソース情報を付与する処理と、
前記動的リソース情報が付与された構成情報リストに対し、前記構成要求と一致する項目にフラグ情報を付与する処理と、
前記フラグ情報が付された項目のみを前記構成情報リストから抽出して、前記障害影響分析システムに出力する処理と、の一連の処理を、コンピュータに実行させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク障害の影響分析を支援する技術に関する。
【背景技術】
【0002】
従来から、ネットワーク内で発生した障害を監視する技術が知られている。例えば、特許文献1には、障害レベルに応じて、適切な担当者に適切なタイミングで障害の発生を通知するネットワーク監視システムが開示されている。このネットワーク監視システムは、ネットワークを構成する設備または回線の障害を検出し、障害判定テーブル、影響範囲決定テーブル、障害レベルテーブル、障害レベルに対応づけて障害の状態の通知先ユーザが登録されたユーザテーブルおよび障害判定テーブルを参照し、設備または回線の状態をそれぞれ決定する。また、設備または回線の状態の組み合わせに基づいて、影響範囲決定テーブルを参照し、影響範囲を決定し、影響範囲と経過時間に基づいて、障害レベルテーブルを参照し、障害レベルを決定する。また、ユーザテーブルで障害レベルに対応づけられた通知先ユーザに障害の内容を通知するための電子メールを送信する。
【0003】
また、特許文献2には、通信キャリアが提供する広域なネットワーク、データセンター内のネットワーク装置またはサーバ装置において障害が発生した場合、影響するユーザネットワークとサービスを特定する技術が開示されている。この技術では、ネットワークおよびサーバの警報情報を収集する。さらに、ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性に基づいて、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納し、警報情報の障害装置から、資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2013−030826号公報
【特許文献2】特開2012−169956号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の技術では、事前設計されたルールに基づいて障害発生時の影響範囲を算出するが、ルールを事前設計する場合に、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮した影響範囲を特定することができない。
【0006】
ネットワーク内のある設備が故障したことによるネットワークサービスへの影響を特定しようとする場合、サービスに対して時々刻々と変化するリソースや、リクエストに応じて動的に割り当てられるリソース(サーバやゲートウェイスイッチ等)の割り当て状況を把握する必要がある。
【0007】
しかしながら、動的なリソース割当情報は、時間の結果と共に変化するものであるため、時間の経過と共に変化しない静的な情報と比較すると、更新頻度が高い。このため、動的リソースと関連付けた構成情報を単純に取得しようとすると、高頻度の構成情報取得に伴う処理負荷が、増大してしまう。
【0008】
本発明は、このような事情に鑑みてなされたものであり、ネットワーク構成情報に動的なリソース割り当て情報を反映させると共に、処理負荷の増大を回避することができる障害分析支援装置、障害分析システムおよびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明の障害分析支援装置は、ネットワーク障害の影響分析を支援する障害分析支援装置であって、障害影響分析システムからネットワーク構成情報を要求する旨の構成要求を受信する構成要求受信部と、構成情報管理システムから前記構成要求に対応したネットワーク構成情報を含む構成情報リストを取得する構成リスト受信部と、ネットワークを構成する設備に対してリソースの割り当てを行なうリソース割当サーバから動的なリソース情報を取得し、前記構成情報リストに前記動的なリソース情報を付与する動的リソース情報付与部と、前記動的リソース情報が付与された構成情報リストに対し、前記構成要求と一致する項目にフラグ情報を付与するフラグ付与部と、を備え、前記フラグ情報が付された項目のみを前記構成情報リストから抽出して、前記障害影響分析システムに出力することを特徴とする。
【0010】
このように、リソース割当サーバから動的なリソース情報を取得し、構成情報リストに動的なリソース情報を付与するので、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮して、障害の影響範囲を特定することができる。さらに、動的リソース情報が付与された構成情報リストに対し、構成要求と一致する項目にフラグ情報を付与し、フラグ情報が付された項目のみを構成情報リストから抽出して、障害影響分析システムに出力するので、障害影響分析システムの処理負荷の増大を回避することが可能となる。
【0011】
(2)また、本発明の障害分析支援装置は、前記障害影響分析システムから受信した構成要求をバッファリングする要求バッファ部を更に備え、前記構成リスト受信部は、構成情報管理システムから前記要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストを取得し、前記動的リソース情報付与部は、前記要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストに前記動的なリソース情報を付与することを特徴とする。
【0012】
このように、構成情報管理システムから要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストを取得し、要求バッファ部に一定数バッファリングされた構成要求に対応したネットワーク構成情報を含む構成情報リストに動的なリソース情報を付与するので、障害影響分析システムからの複数の要求に対応した構成情報を一度の処理で取得することが可能となり、頻度が増加しがちな構成情報取得処理において、負荷の低減を図ることが可能となる。
【0013】
(3)また、本発明の障害分析システムは、リソース割当サーバがネットワークを構成する設備に対して動的にリソースの割り当てを行なうネットワークの障害の影響を分析する障害分析システムであって、前記ネットワークの構成情報を管理する構成情報管理システムと、前記ネットワーク内で発生した障害の影響を分析する障害影響分析システムと、上記(1)または(2)記載の障害分析支援装置と、から構成されることを特徴とする。
【0014】
この構成により、リソース割当サーバから動的なリソース情報を取得し、構成情報リストに動的なリソース情報を付与するので、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮して、障害の影響範囲を特定することができる。さらに、動的リソース情報が付与された構成情報リストに対し、構成要求と一致する項目にフラグ情報を付与し、フラグ情報が付された項目のみを構成情報リストから抽出して、障害影響分析システムに出力するので、障害影響分析システムの処理負荷の増大を回避することが可能となる。
【0015】
(4)また、本発明のプログラムは、ネットワーク障害の影響分析を支援する障害分析支援装置のプログラムであって、障害影響分析システムからネットワーク構成情報を要求する旨の構成要求を受信する処理と、構成情報管理システムから前記構成要求に対応したネットワーク構成情報を含む構成情報リストを取得する処理と、ネットワークを構成する設備に対してリソースの割り当てを行なうリソース割当サーバから動的なリソース情報を取得し、前記構成情報リストに前記動的なリソース情報を付与する処理と、前記動的リソース情報が付与された構成情報リストに対し、前記構成要求と一致する項目にフラグ情報を付与する処理と、前記フラグ情報が付された項目のみを前記構成情報リストから抽出して、前記障害影響分析システムに出力する処理と、の一連の処理を、コンピュータに実行させることを特徴とする。
【0016】
このように、リソース割当サーバから動的なリソース情報を取得し、構成情報リストに動的なリソース情報を付与するので、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮して、障害の影響範囲を特定することができる。さらに、動的リソース情報が付与された構成情報リストに対し、構成要求と一致する項目にフラグ情報を付与し、フラグ情報が付された項目のみを構成情報リストから抽出して、障害影響分析システムに出力するので、障害影響分析システムの処理負荷の増大を回避することが可能となる。
【発明の効果】
【0017】
本発明によれば、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮して、障害の影響範囲を特定することができる。さらに、障害影響分析システムの処理負荷の増大を回避することが可能となる。
【図面の簡単な説明】
【0018】
【
図1】本発明の適用対象となるネットワークの構成例を示す図である。
【
図2】ネットワークで障害が発生したときの影響を分析する障害分析システムの概略を示す図である。
【
図3】本実施形態に係る障害分析支援装置1の概略構成を示す図である。
【
図4】構成情報から一部を切り出す様子を示す図である。
【
図5】障害分析支援装置1の動作を示すフローチャートである。
【
図6】障害分析支援装置1が構成情報管理システム3から取得した構成リストを処理した結果の一例を示す図である。
【発明を実施するための形態】
【0019】
本発明者は、ネットワーク障害の影響範囲を分析する際に、動的なリソース割当の状況を考慮しつつ、障害影響分析システムからの要求に応じて一回一回構成情報を取得すると、処理負荷が増大してしまう点に着目し、障害影響分析システムからの要求を一定数バッファリングすると共に、動的なリソース割当情報を付加し、さらに要求に対応する項目のみにフラグ情報を付与することによって、障害影響分析システムにおける用途に応じた構成情報のみを抽出し、処理負荷の増大を回避することができることを見出し、本発明をするに至った。
【0020】
すなわち、本発明の障害分析支援装置は、ネットワーク障害の影響分析を支援する障害分析支援装置であって、障害影響分析システムからネットワーク構成情報を要求する旨の構成要求を受信する構成要求受信部と、構成情報管理システムから前記構成要求に対応したネットワーク構成情報を含む構成情報リストを取得する構成リスト受信部と、ネットワークを構成する設備に対してリソースの割り当てを行なうリソース割当サーバから動的なリソース情報を取得し、前記構成情報リストに前記動的なリソース情報を付与する動的リソース情報付与部と、前記動的リソース情報が付与された構成情報リストに対し、前記構成要求と一致する項目にフラグ情報を付与するフラグ付与部と、を備え、前記フラグ情報が付された項目のみを前記構成情報リストから抽出して、前記障害影響分析システムに出力することを特徴とする。
【0021】
これにより、本発明者は、ユーザ端末からのリクエスト毎に動的に割り当てられるリソースや、経路変換のような時々刻々と変化するネットワーク設定を考慮して、障害の影響範囲を特定することを可能とした。さらに、障害影響分析システムの処理負荷の増大を回避することが可能となる。以下、本発明の実施形態について、図面を参照しながら具体的に説明する。
【0022】
図1は、本発明の適用対象となるネットワークの構成例を示す図である。このネットワークは、リソース割当サーバ、端末1および2、ゲートウェイ1〜3、外部サービスで構成されている。リソース割当サーバは、負荷分散を図るために、複数のゲートウェイ1〜3のうち、端末1または2からのリクエストに応じて、オンデマンドで、どのゲートウェイ1〜3に接続するのかについて、割り当てを行なう。ゲートウェイの割り当てがあると、端末1または2は、外部サービスとの間で、データ通信を行なうことができる。このように、リソース割当サーバは、端末1または2からのリクエストに応じて、動的に、適切なゲートウェイを割り当てることによって、外部サービスへの接続を確立する。
【0023】
図2は、
図1に示したネットワークで障害が発生したときの影響を分析する障害分析システムの概略を示す図である。この障害分析システムは、リソース割当サーバ100が、端末1または2からのリクエストに応じて、どのゲートウェイ1〜3に接続するのかについて、割り当てを行なう。ゲートウェイの割り当てがあると、端末1または2は、外部サービス102との間で、データ通信を行なうことができる。
【0024】
本実施形態に係る障害分析支援装置1は、ネットワークサービスにおける監視網内に存在し、サービスに対するリソースを割り当てる外部装置であるリソース割当サーバ100に接続して、“端末とゲートウェイの割り当て”のような動的に変化する関係性を、論理的な接続関係として内部データベースに記録する。また、障害影響範囲を分析するための外部システムである障害影響分析システム5が、分析元データとしてネットワークの構成情報を管理する構成情報管理システム3から構成情報を取得する際に、本実施形態に係る障害分析支援装置1が、動的に割り当てられるリソースの接続情報を加えることによって、障害影響範囲分析における分析対象データを追加し、分析精度の向上に寄与する。本実施形態では、システム間のデータ転送量と処理回数を低減するために、複数の構成情報読み出し要求をバッファリングしておき、それぞれの要求に応じたフラグ情報を付与することで、当該構成情報の部分切り出しを行なう。
【0025】
障害分析支援装置1は、動的なリソース割当を担うリソース割当サーバ100の情報を随時読み出して、内部的に論理的な結線情報として変換し保存する。また、障害分析支援装置1は、静的な構成情報、すなわち、装置間の物理接続情報や、静的な論理接続情報を管理する構成情報管理システム3と、障害影響を分析する障害影響分析システム5との間で、プロキシとして機能する。すなわち、障害影響分析システム5が、構成情報管理システム3に対して、構成情報リクエストを行なうと、障害分析支援装置1は、これを中継し、構成情報管理システム3に構成情報リクエストを行なう。一方、構成情報管理システム3は、リクエストを受けた内容に応答して、構成情報を出力する返答を行なう。障害分析支援装置1は、構成情報管理システム3から構成情報を取得すると、リソース割当サーバ100から取得したリソース割当情報を付加し、障害影響分析システム5が必要とする最小限の情報を、加工済み構成情報として出力する。
【0026】
このように、障害分析支援装置1は、障害影響分析システム5が構成情報を読み出す際に、動的なリソース割当の情報を付与して転送する。これにより、障害影響分析システム5などの外部の障害管理システムは、より詳細な設備間の関連情報を利用することができるようになる。その結果、影響範囲分析の精度向上を図ることが可能となる。
【0027】
図3は、本実施形態に係る障害分析支援装置1の概略構成を示す図である。ネットワーク内で障害が発生した場合、障害影響分析システム5からの構成要求は、大量に、かつ、断続的に発生する。そこで、処理の高速化を図るため、障害分析支援装置1は、障害影響分析システム5からの大量かつ断続的に発生する構成要求を、一括処理する機能を果たすことによって、処理負荷の増大を回避する。
図3において、構成要求受信部2は、障害影響分析システム5からの構成要求を受信する。要求バッファ部7は、構成要求受信部2が受信した構成要求を、一定数バッファリングする。すなわち、障害発生源の近くに関連障害が集中する傾向が強いため、一括処理するために、一定量の構成要求をバッファリングする。これにより、複数の要求に対応した構成情報を一度の処理で取得することが可能になり、頻度が増加する構成情報取得処理において負荷を低減が期待できる。
【0028】
構成リスト受信部4は、障害影響分析システム5からの構成要求に対応した構成リストを、構成情報管理システム3から受信する。マーキング部9は、構成リスト処理時に設備単位でマーキングを行なう。フラグ付与部11は、バッファのリスト数と対応したビット列を、要求に対応したフラグとして保存する。これにより、フラグとリストの論理演算で必要部分のみを抽出することが可能となる。
【0029】
図6は、障害分析支援装置1が構成情報管理システム3から取得した構成リストを処理した結果の一例を示す図である。
図6に示すように、リスト形式で取得した当該構成情報の繋がり情報を、内部で論理的な結線情報として変換する過程で、構成要求に対応した関連性を保持するビットフラグを構成要求単位で設定する。このように、一括取得した構成情報とフラグ情報との論理演算を行なうことで、
図4に示すように、取得した全体の構成情報の中から個別の構成要求に必要な部分だけを切り出すことが可能になる。
【0030】
すなわち、
図4の紙面に対して左側に示すように、物理構成情報のみでは複数の構成要求に基づいて関連情報を取得するのみでは、情報量が多くなってしまう。これに対し、本実施形態の障害分析支援装置1が処理を行なうことによって、
図4の紙面に対して右側に示すように、リソース割当サーバ100から取得した動的なリソース割当情報を考慮することによって、物理構成情報のうち、フラグ情報を利用して、必要な部分のみを切り出して、再構築することが可能となる。これにより、障害影響分析システム5における処理負荷の増大を回避することが可能となる。
【0031】
図5は、障害分析支援装置1の動作を示すフローチャートである。障害分析支援装置1は、障害影響分析システム5から構成情報の要求があったかどうかを判断し(ステップS1)、要求が無い場合は、ステップS1における判断を繰り返す。一方、ステップS1において、障害影響分析システム5から構成情報の要求があった場合、バッファがいっぱいになった場合、またはタイムアウトした場合は、ステップS2に遷移する。次に、要求条件をマージする(ステップS2)。すなわち、要求条件に対する「OR演算」を行ない、関連する全ての設備を抽出する(ステップS2)。
【0032】
次に、構成情報管理システム3から、構成情報をリスト形式で取得する(ステップS3)。次に、ステップS3で取得したリスト形式の構成情報に対して、動的なリソース割当情報を付与する(ステップS4)。すなわち、リスト中に、リソース割当サーバ100から別途取得した動的リソースの情報を追加する。次に、動的リソースの情報によって特定された接続情報に基づいて、要求条件と一致する設備に対し、個別にフラグ情報を付与する(ステップS5)。次に、要求毎に構成情報を抽出する(ステップS6)。ここでは、フラグ情報と要求情報との「AND演算」を行なって、各要求に必要な構成情報のみを抽出する。次に、障害影響分析システム5に対して、抽出した構成情報を転送する(ステップS7)。次に、バッファ内に残っている要求があるかどうかを判断し(ステップS8)、バッファ内に残っている要求がある場合は、ステップS6に遷移して、上記処理を繰り返す。ステップS8において、バッファ内に残っている要求が無い場合は、終了する。
【0033】
以上説明したように、本実施形態によれば、ネットワークを構成する装置に障害が発生した場合、当該障害によるネットワークサービスへの影響を、データ処理の負荷を抑えつつ、個別のサービス単位で正確に特定して把握することが可能になる。
【符号の説明】
【0034】
1 障害分析支援装置
2 構成要求受信部
3 構成情報管理システム
4 構成リスト受信部
5 障害影響分析システム
7 要求バッファ部
9 マーキング部
11 フラグ付与部
13 動的リソース情報付与部
100 リソース割当サーバ
102 外部サービス