(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024008455
(43)【公開日】2024-01-19
(54)【発明の名称】障害対応支援システム及び障害対応支援方法
(51)【国際特許分類】
G06F 11/07 20060101AFI20240112BHJP
G06F 11/34 20060101ALI20240112BHJP
【FI】
G06F11/07 193
G06F11/34 176
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022110347
(22)【出願日】2022-07-08
(71)【出願人】
【識別番号】000233295
【氏名又は名称】株式会社日立情報通信エンジニアリング
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】武田 栄里子
(72)【発明者】
【氏名】神崎 元
(72)【発明者】
【氏名】三村 和
(72)【発明者】
【氏名】森 久斗
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042KK14
5B042KK17
5B042MA08
5B042MA14
5B042MC22
5B042MC25
5B042MC40
(57)【要約】
【課題】様々な記載方法のログに対応することができる障害対応支援技術を提供する。
【解決手段】障害対応支援システムは、機器に発生した障害への対応を支援する。障害対応支援システムは、1以上の機器構成における複数の過去の障害それぞれへ対応するための対応情報と、前記複数の過去の障害に関する複数の過去ログに対して、所定ルールに従って機器状態について行われた判定の結果を示す、複数の過去ログ判定結果と、を格納する。障害対応支援システムは、入力されたログに対して前記所定ルールに従って判定を行い、入力ログ判定結果を生成し、前記複数の過去ログ判定結果から、前記入力ログ判定結果と同じまたは類似の少なくとも一方の過去ログ判定結果を選択し、選択された過去ログ判定結果と対応付けられる過去の障害への対応に関する情報を出力する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
機器に発生した障害への対応を支援する障害対応支援システムであって、
記憶装置と、
演算装置と、を含み、
前記記憶装置は、
1以上の機器構成における複数の過去の障害それぞれへ対応するための対応情報と、
前記複数の過去の障害に関する複数の過去ログに対して、所定ルールに従って機器状態について行われた判定の結果を示す、複数の過去ログ判定結果と、を格納し、
前記演算装置は、
入力されたログに対して前記所定ルールに従って判定を行い、入力ログ判定結果を生成し、
前記複数の過去ログ判定結果から、前記入力ログ判定結果と同じまたは類似の少なくとも一方の過去ログ判定結果を選択し、
前記選択された過去ログ判定結果と対応付けられる過去の障害への対応に関する情報を出力する、障害対応支援システム。
【請求項2】
請求項1に記載の障害対応支援システムであって、
前記複数の過去ログ及び前記入力されたログは、1以上の判定対象箇所を含み、
前記演算装置は、前記所定ルールに従って前記1以上の判定対象箇所について判定を行う、障害対応支援システム。
【請求項3】
請求項2に記載の障害対応支援システムであって、
前記複数の過去ログ及び前記入力されたログは、複数の判定対象箇所を含み、
前記複数の過去ログ判定結果及び前記入力ログ判定結果は、前記複数の判定対象箇所の正常または異常の組み合わせのパタンを示す、障害対応支援システム。
【請求項4】
請求項1に記載の障害対応支援システムであって、
前記対応情報は、前記複数の過去の障害を管理するための管理番号を含み、
出力される前記過去の障害への対応に関する情報は、前記管理番号、障害原因を検討するための情報、障害の想定原因、対応方法、対応方法の有効性に関する情報の中のいずれか1つ以上である、障害対応支援システム。
【請求項5】
請求項1に記載の障害対応支援システムであって、
前記記憶装置は、前記複数の過去ログを格納し、
前記演算装置は、前記所定ルールに従って前記複数の過去ログに対して判定を行って前記複数の過去ログ判定結果を生成し、前記複数の過去ログ判定結果を前記記憶装置に格納する、障害対応支援システム。
【請求項6】
請求項5に記載の障害対応支援システムであって、
前記演算装置は、
第1動作モードにおいて、前記入力されたログに対する前記過去の障害への対応に関する情報を出力し、
第2動作モードにおいて、前記予め設定されたルールに従って過去ログに対して判定を行って過去ログ判定結果を生成し、前記過去ログ判定結果を前記記憶装置に格納し、
所定時間ログが入力されないことを検知したときに前記第2動作モードで動作し、
ログの入力の検知に応答して、前記第2動作モードから前記第1動作モードに変化する、障害対応支援システム。
【請求項7】
請求項1に記載の障害対応支援システムであって、
前記演算装置は、前記ログとともに障害事象が入力された場合、前記障害事象に対する対応方法を出力する、障害対応支援システム。
【請求項8】
請求項1に記載の障害対応支援システムであって、
前記演算装置は、前記入力されたログ及び前記複数の過去ログの機器の構成に関する情報に基づいて、前記入力ログ判定結果と前記複数の過去ログ判定結果の類似を判定する、障害対応支援システム。
【請求項9】
請求項2に記載の障害対応支援システムであって、
前記記憶装置は、前記複数の過去ログを格納し、
前記演算装置は、
前記複数の過去ログにおいて、前記判定対象箇所以外の判定対象外箇所に対して、機器の状態を表す内容が含まれているか解析を行い、
前記解析の結果を出力する、障害対応支援システム。
【請求項10】
請求項9に記載の障害対応支援システムであって、
前記演算装置は、前記複数の過去ログにおいて、前記解析の結果に基づき追加された前記判定対象箇所に対する判定を行い、前記複数の過去ログ判定結果を更新する、障害対応支援システム。
【請求項11】
システムによる、機器に発生した障害への対応を支援する方法であって、
前記システムは、
1以上の機器構成における複数の過去の障害それぞれへ対応するための対応情報と、
前記複数の過去の障害に関する複数の過去ログに対して、所定ルールに従って機器状態について行われた判定の結果を示す、複数の過去ログ判定結果と、を格納し、
前記方法は、前記システムが、
入力されたログに対して前記所定ルールに従って判定を行い、入力ログ判定結果を生成し、
前記複数の過去ログ判定結果から、前記入力ログ判定結果と同じまたは類似の少なくとも一方の過去ログ判定結果を選択し、
前記選択された過去ログ判定結果と対応付けられる過去の障害への対応に関する情報を出力する、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、障害対応支援技術に関する。
【背景技術】
【0002】
機器に障害が発生した場合の対応方法の1つとして、機器のログを取得しそのログを調べ、それに基づいて対応することがあげられる。過去に障害が発生した時に取得したログが保存されていれば、新たに障害が発生したときに、保存したログの中から、同じ、または類似のログを探して、そのログの機器への対応方法を参考にすることが可能となる。
【0003】
ここで、本発明の背景技術として、例えば特許文献1には、「所定形式の事象データにより表されたログを蓄積するログ蓄積手段と、前記ログ蓄積手段に蓄積されたログを事象毎に対比し、その結果をもとにログ同士の類似度を得る類似度取得手段と、ログ全体から前記類似度取得手段により得られたログ同士の類似度をもとに各ログの出現頻度を算出するログ出現頻度算出手段と、前記ログ出現頻度算出手段により算出された各ログの出現頻度に応じて出力するログを選択する出力ログ選択手段を備えたことを特徴とする情報処理装置」が開示されている。さらに、「情報処理装置において、前記類似度取得手段は、データ形式とデータ内容を考慮して類似度を判定するようにしたこと」が記載されている。
【0004】
特許文献1によれば、「S e r i a l N u m b e r」、「D a t e T i m e」「E r r o r C o d e」「E r r o r M e s s a g e」「U s e r」が1行の中に決められた順番に記載されている行に対して類似度を得る手段が記載されている。
【0005】
特許文献1には「S e r i a l N u m b e r」、「D a t e T i m e」は、類似度の解析に用いるのには不向きであること、「E r r o r C o d e」は、類似度の解析では、完全一致するか、どうかの判断をすること、「E r r o r M e s s a g e」は、文字列で表現されるので、文字列の内容によって類似度が解析され、評価は、類似の度合いで表わされること、「U s e r」を類似度の解析に使用するかどうかの判断は、解析結果の利用目的に必要かどうかで判断することが記載されている。
【0006】
「E r r o r M e s s a g e」に対する解析方法については、ログの文字列で使用される言語や文字列の長さ等をファクタとして考慮し、最適精度が得られるものが選択されることが記載されており、例として文字列中に含まれる単語を調べ、一致する単語数の全単語数に対する割合を値とすることが記載されている。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
様々なログの記述形式が存在する。しかし、特許文献1では、上記の形式以外で記述された障害機器のログを処理する方法を開示していない。本発明は上述の課題を考慮してなされたものであり、様々な記載方法のログに対応することができる障害対応支援技術の提供を目的とする。
【課題を解決するための手段】
【0009】
上述の課題を解決するため、本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、機器に発生した障害への対応を支援する障害対応支援システムは、記憶装置と、演算装置と、を含む。前記記憶装置は、1以上の機器構成における複数の過去の障害それぞれへ対応するための対応情報と、前記複数の過去の障害に関する複数の過去ログに対して、所定ルールに従って機器状態について行われた判定の結果を示す、複数の過去ログ判定結果と、を格納する。前記演算装置は、入力されたログに対して前記所定ルールに従って判定を行い、入力ログ判定結果を生成し、前記複数の過去ログ判定結果から、前記入力ログ判定結果と同じまたは類似の少なくとも一方の過去ログ判定結果を選択し、前記選択された過去ログ判定結果と対応付けられる過去の障害への対応に関する情報を出力する。
【発明の効果】
【0010】
本発明によれば、様々な記載方法のログに対応することができる障害対応支援技術を提供できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
【図面の簡単な説明】
【0011】
【
図1】第1の実施形態の障害対応支援システムの機能構成の一例を示すブロック図である。
【
図2】第1の実施形態の障害対応支援システムで扱うログの模式図である。
【
図3】第1の実施形態のログ判定部の動作を示すフローチャートである。
【
図4】第1の実施形態のパタン番号と判定結果の関係表である。
【
図5】第1の実施形態のパタン番号と管理番号の関係表である。
【
図6】第1の実施形態のパタン番号と類似度が高いパタン番号の関係表である。
【
図7】第1の実施形態のパタン番号と判定事象の関係表である。
【
図8】第1の実施形態のパタン番号と障害対応方法の関係表である。
【
図9】第1の実施形態の障害対応支援システムが出力する結果の画面の一例を示す図である。
【
図10】第1の実施形態の障害対応支援システムのハード構成の一例を示す図である。
【
図11】第2の実施形態の障害対応支援システムの機能構成の一例を示すブロック図である。
【
図12】第2の実施形態のログ解析部の動作を示すフローチャートである。
【
図13】第2の実施形態の使用者に提示される解析結果の一例を表す表である。
【
図14】第2の実施形態のパタン番号と判定結果の関係表である。
【発明を実施するための形態】
【0012】
以下、図面を用いて、本発明の実施形態を説明する。なお、以下の実施形態においては便宜上その必要があるときは、複数のセクション又は実施形態に分割して説明するが、特に明示した場合を除き、それらはお互い無関係なものではなく、一方は他方の一部又は全部の変形例、詳細、補足説明などの関係にある。各実施形態は、個別に実施してもよいが、組合せて実施してもよい。
【0013】
また、以下の実施形態において、要素の数など(個数、数値、量、範囲などを含む)に言及する場合、特に明示した場合及び原理的に明らかに特定の数に限定される場合などを除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよいものとする。
【0014】
さらに、以下の実施形態において、その構成要素(要素ステップなどを含む)は、特に明示した場合及び原理的に明らかに必須であると考えられる場合などを除き、必ずしも必須のものではないことは言うまでもない。
【0015】
同様に、以下の実施形態において、構成要素などの形状、位置関係等に言及するときは、特に明示した場合や原理的に明らかにそうでないと考えられる場合などを除き、実質的にその形状などに近似又は類似するものなどを含むものとする。このことは数値及び範囲についても同様である。
【0016】
また、以下の説明では、「xxx表」といった表現で説明することがあるが、当該情報は、どのような構造のデータでもよい。また、以下の説明において、各表の構成は一例であり、1つの表は、2以上の表に分割されてもよいし、2以上の表の全部又は一部が1つの表であってもよい。また、以下の説明では、「xxx部」の表現にて機能を説明することがあるが、当該機能は、1以上のコンピュータプログラムが実行されることで実現されてもよい。
【0017】
本明細書の一実施形態は、機器の障害対応を支援する技術に関する。例えば、通信に用いられる機器に発生した障害に対して、機器のログ情報を用いて、その障害の対応方法に関する情報を出力する。以下においては、障害機器のログに記載された機器の状態と同じまたは類似のログを抽出することができる障害対応支援システム、さらには、例えば機器の型番やオペレーティングシステムの変更により、記載方法が変更になっているログも類似のログの抽出対象にすることができる障害対応支援システムが説明される。
<第1の実施形態>
【0018】
図1から
図10を用いて、第1の実施形態を説明する。
図1は障害対応支援システム100の機能構成の一例を示すブロック図である。障害対応支援システム100は、対応情報保持部101、ログ情報保持部102、ログ判定部103、データベース作成・保持部104、インタフェース106、入力情報処理部107、出力情報作成部105を含んで構成されている。
【0019】
対応情報保持部101は、機器に発生した障害ごとに管理のための番号(以下、管理番号)を付与し、管理番号の情報とともに、この障害の原因を検討し対応するための情報を保持する機能ブロックである。障害の原因を検討し対応するための情報は、例えば、どのような情報を取得したか、それからどのような原因を想定したか、想定した原因に対してどのような対応をとったか、またその対応は有効であったか等の情報を含む。これらの対応情報は、インタフェース106を通して障害対応支援システム100の使用者によって障害対応支援システム100に格納されるように構成すればよい。
【0020】
ログ情報保持部102は、これまで障害が発生した機器の障害発生時、もしくはその後に障害を解析する目的で取得したログ(過去ログ)を管理番号に紐づけて保持する機能ブロックである。管理番号に対して複数のログがある場合は、管理番号の後ろに枝番をつけるなどの方法で対応すれば良い。
【0021】
これらのログは、インタフェース106を通して障害対応支援システム100の使用者によって障害対応支援システム100に格納されるようにしてもよいし、また、
図1には記載していないが、障害対応支援システム100が、インタフェース106を通して機器から取得して保持するように構成してもよい。
【0022】
ログ判定部103は、機器の状態を判定するための予め設定されたルールを保持し、そのルールに従ってログの判定を行い、ログを分類する処理を行う、もしくは、同じ判定結果となったログを出力する処理を行う機能ブロックである。ログ判定部103の処理の詳細は後述する。
【0023】
データベース作成・保持部104は、ログ判定部103で判定された結果から、ログと判定結果の関係表などを作成し、それを保持する機能ブロックである。データベース作成・保持部104の処理の詳細は後述する。
【0024】
インタフェース106は、障害対応支援システム100が情報の入出力を行うためのインタフェースである。
【0025】
入力情報処理部107は、インタフェース106から入力された情報を、必要に応じて、障害対応支援システム100内での処理に適したフォーマットに変更し、処理に応じた機能ブロックにその情報を送信する機能ブロックである。出力情報作成部105は、障害対応支援システム100で処理された結果を使用者に提示するための情報を作成し、インタフェース106に送信する機能ブロックである。
【0026】
次に
図2から
図4を用いてログ判定部103の動作を説明する。第1の実施形態の障害対応支援システム100には、2つの処理モードがある。1つ目の処理モードは、ログ情報保持部102に保持されているログを、ルールに従って分類する分類モードである。2つ目の処理モードは、入力されたログと同じもしくは類似した分類に属するログの管理番号を提示する提示モードである。
【0027】
処理モードの設定は、障害対応支援システム100の起動時に、使用者が2つのモードのいずれかを使用者が指定するような構成としてもよい。また、障害対応支援システム100に、一定時間、新たなログが入力されず待機状態になっていることを検知したときに、障害対応支援システム100が、自動的に分類モードとして動作し、新たなログが入力されたことに応答して分類モードを休止し、提示モードに切り変わるような構成としてもよい。これにより、分類モードによる提示モードへの影響を低減できる。
【0028】
図2は第1の実施形態の障害対応支援システム100で扱うログ200の模式図である。機器のログは、時刻の設定に関する情報、CPUの使用率に関する情報など、それぞれの専用のコマンドの入力によって、その情報だけ取得することも可能である。一方で、あらかじめ決められた複数の情報をまとめて取得するコマンドもあり、そのコマンドを入力すると、
図2に示したように、様々な情報が記載されたログを取得することができる。
【0029】
図2において、判定対象箇所、または判定対象外箇所として示した箇所は、それぞれの専用のコマンドで取得できる情報の範囲を示している。障害対応支援システム100では、
図2のような様々な情報が記載されたログ200を想定している。
【0030】
ログ判定部103は、ログの記載内容が、機器が正常である、もしくは使用者の想定通りの設定や状態になっているか、または機器が異常である、もしくは、想定通りの設定や状態になっていないかを判定するためのルールを保持している。以下、想定通りの設定や状態になっていることも「正常」、想定通りの設定や状態になっていないことも「異常」と表現して説明する。
【0031】
機器のログは、機器の構成、例えば、機器の型番が変更になった場合や、機器のオペレーティングシステム(以下OSと略す)のバージョンが変わった場合にも、情報の記載方法が変更になる場合がある。従って、機器の型番とOSのバージョンごとに、正常・異常を判定するルールを用意することが望ましい。もちろん、OSのバージョンが変更になっても、同じルールにより判定できる場合は、そのルールを用いればよい。
【0032】
また、機器の正常・異常の判定のために、例えば、ケーブルで接続されている2台の機器の両方のログに基づいた解析が必要な場合は、判定のために2つのログを入力するようにし、かつ、2つの機器のそれぞれの状態を確認し、その結果に応じて正常・異常の判定するようなルールを実装すれば良い。
【0033】
第1の実施形態では、説明を簡易にするため、ログ200のなかの、判定対象箇所A201、判定対象箇所B202、判定対象箇所C203に対して、そこに記載されている情報が、機器の正常な状態を示しているか、または異常な状態を示しているかを判定するためのルールをログ判定部に実装し、そのルールによってログを判定する例を示す。
図2の判定対象外箇所a204、判定対象箇所b205に対しては判定を行わない。
【0034】
図3は、ログ判定部103の処理例のフローチャートを示す。ログ判定部103は、
図3に示すように、処理モード、ログ、そのログが紐づけられている管理番号が入力されると、それらの情報を読み込み(S301)、判定対象箇所AからCに対して順番に正常、異常の判定を行い(S302からS304)、その結果として管理番号と判定結果のパタン番号を取得する(S305)。
【0035】
前述のように、機器の型番とOSのバージョンによって、判定のルールが変わる場合があるため、
図3には記載していないが、ログの中から、型番とOSのバージョンを読み取って、それに適したルールで、正常、異常の判定を行うように構成すればよい。また、使用者が、型番とOSのバージョンを入力するような構成としてもよい。
【0036】
ここで、
図4を用いて判定結果のパタン番号を説明する。
図4はパタン番号401と判定結果402の関係を示す表であり、データベース作成・保持部104に保持されている。前述のように機器のログは、機器の型番が変更になった場合や、機器のOSのバージョンが変わった場合にも、情報の記載方法が変更になる場合があるため、
図4は、パタン番号が対応する機器の型番403と、OSバージョン404も一緒に記載されている。
【0037】
第1の実施形態では、ログの中の3か所に対して、正常・異常の判定を行うため、
図4に示すように判定結果のパタンは、判定対象箇所Aが正常または異常、判定対象箇所Bが正常または異常、判定対象箇所Cが正常または異常の組合せとなり、全部で8パタンとなる。各パタンに対してパタン番号P1からP8(401)をつけ、判定結果をパタン番号で表す。
【0038】
ログ判定部103は、判定対象箇所Cの判定が終わると(S304)、データベース作成・保持部104にアクセスして、入力されたログに対するパタン番号を取得する(S305)。そして、現在の動作モードが分類モードかどうかによって(S306)、分類モードであれば(S306でYES)、パタン番号と管理番号をデータベース作成・保持部に出力する(S307)。
【0039】
また、分類モードでない場合(S306でNO)、すなわち提示モードであれば、データベース作成・保持部104から同じまたは類似のパタン番号に属する管理番号を取得し(S308)、入力されたログの管理番号とパタン番号、ならびにデータベース作成・保持部から取得した同じまたは類似のパタン番号に属する管理番号を使用者インタフェースに出力する(S309)。類似のパタン番号は、予め定義されていてよい。
【0040】
なお、動作の途中でデータベース作成・保持部から同じまたは類似のパタン番号に属する管理番号を取得(S308)、データベース作成・保持部から同じまたは類似のパタン番号に属する管理番号をユーザインタフェースに出力する(S309)、において、出力される情報を同じパタン番号に属する管理番号とするか、類似のパタン番号に属する管理番号とするか、それとも両方とするかは、使用者が選択できるようにしてもよい。また、基本的には同じパタン番号を優先的に出力するようにして、同じパタン番号がなければ類似のパタン番号を出力するようにしてもよい。類似のパタン番号については後述する。
【0041】
次に
図4から
図8を用いて、データベース作成・保持部104が作成し保持する情報を説明する。前述のように、データベース作成・保持部104は
図4に示す表を保持する。この表は、ログのなかの判定対象箇所が決まると何通りのパタンになるかが自動的に決まるため、それぞれのパタンに対して番号を付与することで作成することが可能である。
【0042】
図5は、第1の実施形態のパタン番号401と管理番号501の関係表である。障害対応支援システム100が分類モードで動作し、ログ情報保持部102が保持する過去ログを判定した結果を受けとることで、
図5の表を作成する。この動作によって、ログ情報保持部102のログを、ログに記載された機器の状態に応じて分類している。
【0043】
図5のパタン番号と管理番号の関係表は、ログの分類に使用する判定ルールに対応して作成する。なお、
図5も
図4と同様にパタン番号が対応する機器の型番403と、OSバージョン404も一緒に記載されている。
図5では、型番とOSのバージョンが異なる場合も1つの表にまとめているが、使用するルールごとに別の表にしてもよい。
【0044】
図6は、各パタン番号401が示す機器の状態と、状態の類似度が高いパタン番号601を示した表である。この表は、使用者が障害対応支援システム100に与えてもよいし、使用者から与えられた条件に基づいて、障害対応支援システム100が自動的に作成するように構成してもよい。例えば、同じ型番でもOSバージョンによって、判定ルールが異なり、判定結果のパタンが同じでも異なるパタン番号が付けられている場合は、OSバージョンの近いもので、同じ判定結果に分類されたログが、類似度が高いと考えられる。類似度が高いと考えられるログが、類似するログと定義され得る。
【0045】
従って、OSバージョンの枝番、例えば枝番が11.22.33の機器とOSバージョンが11.22.22の機器に対して、異なるパタン番号が付けられているときは、それらの判定結果のパタンが同じものは機器の状態の類似度が高いと考えられる。従って、
図1には図示していないが、このようなアルゴリズムを障害対応支援システム100に実装して、自動で
図6に示すパタン番号と類似度が高いパタン番号の関係表を作成するような構成としてもよい。
【0046】
型番が同じ機器でOSバージョンが異なっても、判定の結果が同じパタン番号で表される場合は、同じ機能をもつ機器や、もしくは後継機となる型番、もしくはその型番の旧機種に相当する型番の機器に対して、同じ判定結果となるパタン番号に分類されたログが、機器の状態の類似度の高いログと考えられる。この考え方をアルゴリズムとして実装し、類似度の高いログを、類似するログとして提示できるようにしてもよい。
【0047】
また、OSバージョンによってログの表記方法が変わる場合は、
図2で説明した判定対象箇所による判定ではなく、
図7に示すように、判定する機器の状態をあらわす事象を項目として、例えば、電源の状態、CPU使用率の状態、メモリ使用率の状態、ネットワーク接続の状態に対して、正常、異常を判定し、その判定事象701に対する正常、異常のパタンに対してパタン番号401を付けてもよい。
【0048】
ログ判定部103は、予め指定されたルールに従ってログを検索し、判定事象701が示す項目それぞれについて正常、異常の判定を行う。このように判定事象701を異なるOSバージョンで共通化することで、OSバージョンごとに分ける必要がなくなる。ただし、この場合は、ある特定のOSバージョンにのみ障害が起きるような場合への対応が困難になるため、
図5の管理番号501のところに、管理番号ともにOSバージョン情報を付記するとよい。これにより、障害対応のために管理番号と共にOSバージョンを示すことができる。
【0049】
図8は、
図5の管理番号501を障害対応方法801に置き換えたパタン番号401と障害対応方法801の関係表である。
図8は、管理番号501に対する対応方法にもとづき使用者が対応方法を定めて、障害対応支援システム100に登録した表である。
【0050】
障害対応支援システム100を提示モードで動作させた状態で、新たな障害対応が必要な機器のログが入力されたら、そのログと同じパタン番号に属する管理番号のかわりに障害対応方法を提示する構成としてもよい。障害対応支援システム100は、管理番号、障害原因を検討するための情報、障害の想定原因、対応方法、対応方法の有効性に関する情報の中のいずれか1つ以上を提示してよい。
【0051】
機器の障害が一過性だった場合は、ログを判定しても機器に異常が認められないという場合もある。そのため、異常となる判定がないログに対する障害対応方法は、1つの対応にまとめることが難しい場合もある。従って、そのような場合は、対応方法を1つにまとめずに、
図8に示すように機器の障害として報告された事象ごとの対応方法をまとめて、その結果を表に記載するようにしてもよい。また、入力情報として、機器のログの他に、そのログの機器に発生した障害の事象もあわせて入力する構成とすればよい。その結果、そのログに異常がないと判定された場合でも、障害の事象にあわせた対応方法を出力することができる。
【0052】
次に、
図9を用いて、障害対応支援システム100の出力結果を説明する。
図9は、提示モードで動作中の障害対応支援システム100が出力する結果の画面900の一例を示す図であり、ディスプレイ装置901に画面表示される。画面900は、入力したログに対する判定結果として出力する情報の選択ボタン905、最大出力数の入力欄906を設け、それらを選択、入力し、実行ボタン907を押すと、その結果として、入力したログファイル名、使用した判定ルール、判定により得られたパタン番号、選択した情報に対する結果、並びに判定に用いたログの記載事項が出力される構成となっている。また、結果の保存する、しないを選択できるようしてもよい。
図9は一例であり、そのほか、使用者が必要とする情報を出力するように構成してもよい。
【0053】
図10は、第1の実施形態における障害対応支援システム100のハードウェア構成の一例を示すブロック
図1000である。
【0054】
図10に示すように、障害対応支援システム100は、演算装置1001、メモリ1002、補助記憶装置1003、通信インタフェース1004、入力インタフェース1005及び出力インタフェース1006を備えたシステムであって、演算装置1001が各種プログラムを実行することによって、障害対応支援システム100の各種機能が実現される。
【0055】
演算装置1001は、メモリ1002に格納されたプログラムを実行する演算装置である。なお、演算装置1001が実行する上記プログラムは、リムーバブルメディア又はネットワーク1007を介して障害対応支援システム100に提供され、非一時的記憶媒体である不揮発性の補助記憶装置1003に格納される。このため、障害対応支援システム100は、リムーバブルメディアからデータを読み込むインタフェースを有するとしてもよい。
【0056】
メモリ1002は、不揮発性の記憶素子であるROM(Read Only Memory)及び揮発性の記憶素子であるRAM(Random Access Memory)を含む。ROMは、不変のプログラム(例えばBIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、演算装置1001が実行する処理、及び処理の実行時に使用されるデータを一時的に格納する。
【0057】
補助記憶装置1003は、例えば、磁気記憶装置(HDD(Hard Disk Drive))、フラッシュメモリ(SSD(Solid State Drive))等の大容量かつ不揮発性の記憶装置である。また、補助記憶装置1003は、演算装置1001がプログラムの実行時に使用するデータ、および演算装置1001が実行するプログラムを格納する。すなわち、プログラムは、補助記憶装置1003から読み出されて、メモリ1002にロードされて、演算装置1001によって実行されることによって、障害対応支援システム100の各機能を実現する。
【0058】
通信インタフェース1004は、所定のプロトコルに従って、他の装置との通信を制御する。例えば、
図10に示したように、障害対応支援システム100は、通信インタフェース1004を用いて、ネットワーク1007を経由して、他の機器1008と通信するようにしてもよい。また、このような構成とすることで、1つ以上の他の機器から、定期的に機器ログを取得して、機器の状態を判定するようにしてもよい。
【0059】
入力インタフェース1005は、キーボード1009やマウス1010などの入力装置が接続されるインタフェースである。使用者が入力装置を操作することにより、入力インタフェース1005は、入力装置を介して使用者からの入力を受ける。
【0060】
出力インタフェース1006は、ディスプレイ装置901やプリンタ(不図示)などの出力装置が接続されるインタフェースである。出力インタフェース1006は、例えば、
図9に示したような結果を、使用者が視認可能な形式で出力装置に出力する。
【0061】
また、障害対応支援システム100は、使用者が操作する端末とネットワークによって接続されたオンプレミスまたはクラウドのサーバ上に構築してもよい。また、
図10に示すように物理的に一つの計算機上で構成されることに限定されず、例えば、論理的または物理的に構成された複数の計算機上で構成されるシステムであってもよく、また例えば、物理的計算機資源上に構築された仮想計算機上で動作するとしてもよい。
【0062】
さらに、障害対応支援システム100は、ログの他に、障害対応の依頼が記載された文書を入力情報として、そこから障害事象を自動で読み取りログ判定部に入力する構成としてもよい。
【0063】
障害対応支援システム100を、上述の実施形態とすることで、新しい障害が発生した時に、ログから判定して同じもしくは類似の状態の障害を扱ったときの管理番号、もしくは、対応方法を得ることができ、使用者は、障害機器の対応を速やかに行うことができるようになる。また、
図7のように判定事象に対してログを分類することで、OSのバージョンが異なって、ログの記載が異なる場合でも、同じ基準でログを分類することができる。
<第2の実施形態>
【0064】
図11から
図14を用いて、第2の実施形態を説明する。以下では、主に第1の実施形態と異なる機能について説明する。
【0065】
図11は、障害対応支援システム1100の機能構成の一例を示すブロック図である。障害対応支援システム1100は、第1の実施形態での障害対応支援システム100の機能ブロックに対して、ログ解析部1101が追加されている点が異なる。ログ解析部は、
図2において判定対象外箇所a204などの、これまで判定対象外だった箇所に機器の状態を表す内容が含まれているか解析し、さらに、正常な状態を示す語と、異常な状態を示す語が、保持している過去のログでは、どの程度の比率になっているかを調べる。例えば、正常な状態を示す語としては、OK、Green、Normal、Success、また異常な状態を示す語としては、NG、Red、Abnormal、Failなどである。
【0066】
図12は第2の実施形態のログ解析部1101の動作を示すフローチャートである。ログ解析部は、ログ情報保持部102から未解析のログを1つ選択し(S1201)、機器の型番とOSバージョンを抽出する(S1202)。選択したログの中の判定対象外箇所を1つ選択し(S1203)、その中で使用されている正常な状態もしくは異常な状態を示す語の数をそれぞれカウントし(S1204)、同じ型番、OSバージョンのログに対してこれまでカウントした数に、今回カウントした数を合算する(S1205)。
【0067】
判定対象外箇所の全てを調査したか?を調べて(S1206)、していなければ(S1206でNO)残っている選択対象外箇所を1つ選択し、同じ処理を繰り返す。判定対象外箇所の全てを調査していれば(S1206でYES)、次に、あらかじめ決めた数のログを解析したか?を調べて(S1207)、調査していれば(S1207でYES)解析結果を使用者に提示する(S1208)。
【0068】
あらかじめ決めた数のログを解析していなければ(S1207でNO)、未解析のログを1つ選択し、処理を繰り返す。また、あらかじめ決めた数は1通りである必要はなく、例えば、20個のログを解析した時、50個のログを解析した時、100個のログを解析した時など、複数の値を設定して、解析したログが20個になった時、さらにログを解析して50個になったとき、さらに100個になった時のタイミングで、結果を使用者に提示するようにしてもよい。
【0069】
図13は解析したログの数が使用者によって決められた数になった場合に、使用者に提示される解析結果の一例を表す表である。型番403、OSバージョン404ごとに、判定対象外箇所1301ごとに正常な状態を示す語の数1302と異常な状態を示す語の数1303をまとめられている。
【0070】
使用者は、
図13にしめす解析結果の表から、これまでに調べたログからは、判定対象外箇所aには異常な状態を示す語はないこと、判定対象外箇所bには正常、異常の状態を示すいずれの語もないこと、判定対象外箇所cには、正常、異常の状態を表す両方の語があることがわかる。
【0071】
このような結果から、例えば、使用者は判定対象外箇所aに対しては機器の状態が正常か異常かを判定するためのルールを作成し障害対応支援システム100に実装する必要性は低いと考えることができる。また、判定対象外箇所bに対しては、ルールは不要と考えることができる。一方で、判定対象外箇所cからは、機器が正常な状態、または異常な状態のどちらも取りうることがあると考えることができる。
【0072】
従って、判定対象外箇所cの記載内容を確認して、正常・異常を判定するルールが作成できれば、ルールを作成して障害対応支援システム100に実装し、次回からは判定対象箇所cも追加した状態で、ログ判定部103で判定するようにすればよい。
【0073】
それに伴い、データベース作成・保持部104は、
図14に示すように判定対象箇所cを追加したパタン番号と判定結果の関係表を作成する。また、
図7に示すように判定対象箇所ではなく判定事象で関係表を保持する場合は、判定対象箇所cに対する判定事象を追加したパタン番号と判定事象の関係表を作成する。
【0074】
そして、ログ判定部103は過去に判定したログに対して、新たに判定対象箇所cに対する判定を行い、第1の実施形態で
図5、
図6に
図8に示した各表を更新する。
【0075】
障害対応支援システム100を第2の実施形態の構成とすることで、これまでは判定対象外としていたログのなかで、機器の状態の判定に活用できるログを抽出することができ、またその判定ルールを実装して過去のログを分類することで、従来よりも機器の状態の分類精度を向上させることができる。
【0076】
また、その結果として、新しく障害が発生した機器のログに対しても、より機器の状態に適した障害対応に関連した情報を提示することが可能になる。
【0077】
なお、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0078】
また、上記の各構成・機能・処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード等の記録媒体に置くことができる。
【0079】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0080】
100、1100 障害対応支援システム
101 対応情報保持部
102 ログ情報保持部
103 ログ判定部
104 データベース作成・保持部
105 出力情報作成部
106 インタフェース
107 入力情報処理部
200 ログ
901 ディスプレイ装置
1001 演算装置
1002 メモリ
1003 補助記憶装置
1004 通信インタフェース
1005 入力インタフェース
1006 出力インタフェース
1007 ネットワーク
1008 他の機器
1009 キーボード
1010 マウス
1101 ログ解析部