IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特許7629757障害対応サーバー、障害対応システム、プログラムおよび障害対応方法
<>
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図1
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図2
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図3
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図4
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図5
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図6
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図7
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図8
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図9
  • 特許-障害対応サーバー、障害対応システム、プログラムおよび障害対応方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-05
(45)【発行日】2025-02-14
(54)【発明の名称】障害対応サーバー、障害対応システム、プログラムおよび障害対応方法
(51)【国際特許分類】
   G06Q 10/20 20230101AFI20250206BHJP
   G06Q 50/20 20120101ALI20250206BHJP
【FI】
G06Q10/20
G06Q50/20
【請求項の数】 7
(21)【出願番号】P 2021035620
(22)【出願日】2021-03-05
(65)【公開番号】P2022135670
(43)【公開日】2022-09-15
【審査請求日】2024-01-11
(73)【特許権者】
【識別番号】000233295
【氏名又は名称】株式会社日立情報通信エンジニアリング
(74)【代理人】
【識別番号】110000198
【氏名又は名称】弁理士法人湘洋特許事務所
(72)【発明者】
【氏名】森 久斗
(72)【発明者】
【氏名】高 偉翔
(72)【発明者】
【氏名】菅原 剛宏
(72)【発明者】
【氏名】室口 武廣
【審査官】深津 始
(56)【参考文献】
【文献】特開2016-045840(JP,A)
【文献】特開2018-088224(JP,A)
【文献】特開2003-281365(JP,A)
【文献】特開2018-169734(JP,A)
【文献】特開2005-018587(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 -G06Q 99/00
(57)【特許請求の範囲】
【請求項1】
所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶するシステム情報記憶部と、
前記監視対象の障害を検知すると、該障害の情報を検知し、どの監視対象でどのような障害が起きたのか特定し、必要なログ情報等を収集する障害検知部と、
前記障害検知部が前記障害を検知すると、保守員を評価する所定の評価点に応じて保守員が複数属する層を形成し、該障害の内容および前記教育優先情報に応じて選定対象となる保守員の層を特定し、該障害の解決のための保守員を選定する保守員選定部と、
前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設し、開設された前記オンラインチャットルームへ、選定された前記保守員を招待するチャット設定部と、
を備えることを特徴とする障害対応サーバー。
【請求項2】
請求項に記載の障害対応サーバーであって、
前記保守員選定部は、特定した前記層に属する前記保守員を前記オンラインチャットルームへ招待すると、前記招待への応答までの経過時間に応じて前記評価点を変動させる、
ことを特徴とする障害対応サーバー。
【請求項3】
請求項1または2に記載の障害対応サーバーであって、
前記保守員選定部は、前記評価点を、少なくとも技術の高さ、障害対応件数、同一の障害の対応経験有無、のいずれかを含む評価軸に基づいて算出する、
ことを特徴とする障害対応サーバー。
【請求項4】
請求項に記載の障害対応サーバーであって、
前記保守員選定部は、前記教育を優先する程度が所定以上の前記監視対象については、特定された前記層に属する保守員に助言を行うために該層より上位の評価点の層に属する保守員も選定する、
ことを特徴とする障害対応サーバー。
【請求項5】
所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶するシステム情報記憶部と、
前記監視対象の障害を検知すると、該障害の情報を検知し、どの監視対象でどのような障害が起きたのか特定し、必要なログ情報等を収集する障害検知部と、
前記障害検知部が前記障害を検知すると、保守員を評価する所定の評価点に応じて保守員が複数属する層を形成し、該障害の内容および前記教育優先情報に応じて選定対象となる保守員の層を特定し、前記保守員の層に含まれる前記保守員から該障害の解決のための保守員を選定する保守員選定部と、
前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設し、開設された前記オンラインチャットルームへ、選定された前記保守員を招待するチャット設定部と、
を備えることを特徴とする障害対応システム。
【請求項6】
コンピュータを、障害対応サーバーとして機能させるプログラムであって、
前記コンピュータの記憶部に、
所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶させ、
前記コンピュータのプロセッサに、
前記監視対象の障害を検知すると、該障害の情報を検知し、どの監視対象でどのような障害が起きたのか特定し、必要なログ情報等を収集する障害検知ステップと、
前記障害検知ステップにおいて前記障害を検知すると、保守員を評価する所定の評価点に応じて保守員が複数属する層を形成し、該障害の内容および前記教育優先情報に応じて選定対象となる保守員の層を特定し、前記保守員の層に含まれる前記保守員から該障害の解決のための保守員を選定する保守員選定ステップと、
前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設し、開設された前記オンラインチャットルームへ、選定された前記保守員を招待するチャット設定ステップと、
を実施させることを特徴とするプログラム。
【請求項7】
コンピュータを障害対応サーバーとして用いる障害対応方法であって、
前記コンピュータの記憶部は、所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶し、
前記コンピュータのプロセッサ
前記監視対象の障害を検知すると、該障害の情報を検知し、どの監視対象でどのような障害が起きたのか特定し、必要なログ情報等を収集する障害検知ステップと、
前記障害検知ステップにおいて前記障害を検知すると、保守員を評価する所定の評価点に応じて保守員が複数属する層を形成し、該障害の内容および前記教育優先情報に応じて選定対象となる保守員の層を特定し、前記保守員の層に含まれる前記保守員から該障害の解決のための保守員を選定する保守員選定ステップと、
前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設し、開設された前記オンラインチャットルームへ、選定された前記保守員を招待するチャット設定ステップと、
を実施することを特徴とする障害対応方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、障害対応サーバー、障害対応システム、プログラムおよび障害対応方法に関する。
【背景技術】
【0002】
特許文献1には、複数の情報処理装置からログを取得する監視サーバにおいて、取得したログの内容に基づいて当該ログに対してチャットルームを登録するか否かを判定し、過去のログに対するチャットルームの登録状況に基づいて前記ログに対してチャットルームを新規開設するか否かを判定し、前記チャットルームを登録し、新規開設すると判定された場合、前記情報処理装置に関連付けられたユーザを参加ユーザとしてチャットルームを新規開設し、前記ログと、開設されたチャットルームとを対応付けて登録する技術の開示がある。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-088224号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記特許文献1に記載された技術は、ログの内容に基づいてチャットルームを開設し、予め固定的に関連付けられた保守員をチャットルームに参加させることはできるが、長期にわたるサービス提供の観点から保守員の技術研鑽に配慮した保守員の選出を行うには適切とはいえない。
【0005】
本発明の目的は、保守員の技術研鑽に配慮した保守員の選出を行う技術を提供することにある。
【課題を解決するための手段】
【0006】
本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。上記課題を解決すべく、本発明の一態様に係る障害対応サーバーは、所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶するシステム情報記憶部と、前記監視対象の障害を検知する障害検知部と、前記障害検知部が前記障害を検知すると、該障害の内容および前記監視対象の前記教育優先情報に応じて該障害の解決のための保守員を選定する保守員選定部と、前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設するチャット設定部と、を備える。
【0007】
また、上記の障害対応サーバーにおいて、前記チャット設定部は、選定した前記保守員を開設された前記オンラインチャットルームへ招待するものであってもよい。
【0008】
また、上記の障害対応サーバーにおいて、前記保守員選定部は、前記保守員を評価する所定の評価点に応じて前記保守員が複数属する層を形成し、前記障害の内容および前記教育優先情報に応じて選定対象となる保守員の前記層を特定するものであってもよい。
【0009】
また、上記の障害対応サーバーにおいて、前記保守員選定部は、特定した前記層に属する前記保守員を前記オンラインチャットルームへ招待すると、前記招待への応答までの経過時間に応じて前記評価点を変動させるものであってもよい。
【0010】
また、上記の障害対応サーバーにおいて、前記保守員選定部は、前記評価点を、少なくとも技術の高さ、障害対応件数、同一の障害の対応経験有無、のいずれかを含む評価軸に基づいて算出するものであってもよい。
【0011】
また、上記の障害対応サーバーにおいて、前記保守員選定部は、前記教育を優先する程度が所定以上の前記監視対象については、特定された前記層に属する保守員に助言を行うために該層より上位の評価点の層に属する保守員も選定するものであってもよい。
【0012】
また、本発明の別の態様に係る障害対応システムは、所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶するシステム情報記憶部と、前記監視対象の障害を検知する障害検知部と、前記障害検知部が前記障害を検知すると、該障害の内容および前記監視対象の前記教育優先情報に応じて該障害の解決のための保守員を選定する保守員選定部と、前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設するチャット設定部と、を備えることを特徴とする。
【0013】
また、本発明の別の態様に係るプログラムは、コンピュータを、障害対応サーバーとして機能させるプログラムであって、前記コンピュータの記憶部に、所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶させ、前記コンピュータのプロセッサに、前記監視対象の障害を検知する障害検知ステップと、前記障害検知ステップにおいて前記障害を検知すると、該障害の内容および前記監視対象の前記教育優先情報に応じて該障害の解決のための保守員を選定する保守員選定ステップと、前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設するチャット設定ステップと、を実施させることを特徴とする。
【0014】
また、本発明の別の態様に係る障害対応方法は、コンピュータを障害対応サーバーとして用いる障害対応方法であって、前記コンピュータの記憶部は、所定の監視対象を保守する保守員の教育を優先する程度を示す教育優先情報を前記監視対象ごとに記憶し、前記コンピュータのプロセッサに、前記監視対象の障害を検知する障害検知ステップと、前記障害検知ステップにおいて前記障害を検知すると、該障害の内容および前記監視対象の前記教育優先情報に応じて該障害の解決のための保守員を選定する保守員選定ステップと、前記保守員が前記障害の解決のために用いるオンラインチャットルームを開設するチャット設定ステップと、を実施させることを特徴とする。
【発明の効果】
【0015】
本発明によれば、保守員の技術研鑽に配慮した保守員の選出を行う技術を提供することができる。上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0016】
図1】本発明の実施形態に係る障害対応システムの構成例を示す図である。
図2】システム情報記憶部に格納されるデータの構造例を示す図である。
図3】過去事例記憶部に格納されるデータの構造例を示す図である。
図4】保守員情報記憶部に格納されるデータの構造例を示す図である。
図5】スケジュール記憶部に格納されるデータの構造例を示す図である。
図6】障害対応サーバーのハードウェア構成例を示す図である。
図7】初動処理のフローの例を示す図である。
図8】保守員候補抽出処理のフローの例を示す図である。
図9】保守員候補の選定例を示す図である。
図10】チャットルーム画面の例を示す図である。
【発明を実施するための形態】
【0017】
以下、本発明に係る一つの実施の形態を図面に基づいて説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。また、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。また、「Aからなる」、「Aよりなる」、「Aを有する」、「Aを含む」と言うときは、特にその要素のみである旨明示した場合等を除き、それ以外の要素を排除するものでないことは言うまでもない。同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは、特に明示した場合および原理的に明らかにそうでないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。
【0018】
以下の説明では、図示しない障害対応サーバー100、チャットサーバー200および保守員が使用する情報処理装置の入出力部と表示部は、一つ以上のインターフェースデバイスでよい。当該一つ以上のインターフェースデバイスは、下記のうちの少なくとも一つでよい。
・一つ以上のI/O(Input/Output)インターフェースデバイス。I/Oインターフェースデバイスは、I/Oデバイスと遠隔の障害対応サーバー100あるいはチャットサーバー200とのうちの少なくとも一つに対するインターフェースデバイスである。障害対応サーバー100あるいはチャットサーバー200に対するI/Oインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも一つのI/Oデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・一つ以上の通信インターフェースデバイス。一つ以上の通信インターフェースデバイスは、一つ以上の同種の通信インターフェースデバイス(例えば一つ以上のNIC(Network Interface Card))であってもよいし二つ以上の異種の通信インターフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。
【0019】
また、以下の説明では、「メモリ」は、一つ以上の記憶デバイスの一例である一つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも一つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。
【0020】
また、以下の説明では、「記憶部」または「ストレージ」は、メモリと永続記憶装置のうちメモリかまたは両方であればよい。具体的には、永続記憶装置は例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、NVME(Non-Volatile Memory Express)ドライブ、又は、SCM(Storage Class Memory)でよい。
【0021】
また、以下の説明では、「処理部」または「プロセッサ」は、一つ以上のプロセッサデバイスでよい。少なくとも一つのプロセッサデバイスは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサデバイスでよいが、GPU(Graphics Processing Unit)のような他種のプロセッサデバイスでもよい。少なくとも一つのプロセッサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも一つのプロセッサデバイスは、プロセッサコアでもよい。少なくとも一つのプロセッサデバイスは、処理の一部又は全部を行うハードウェア記述言語によりゲートアレイの集合体である回路(例えばFPGA(Field-Programmable Gate Array)、CPLD(Complex Programmable Logic Device)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサデバイスでもよい。
【0022】
また、以下の説明では、「yyy部」の表現にて機能を説明することがあるが、機能は、一つ以上のコンピュータプログラムがプロセッサによって実行されることで実現されてもよいし、一つ以上のハードウェア回路(例えばFPGA又はASIC)によって実現されてもよいし、それらの組合せによって実現されてもよい。プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/又はインターフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体(例えば非一時的な記録媒体)であってもよい。各機能の説明は一例であり、複数の機能が一つの機能にまとめられたり、一つの機能が複数の機能に分割されたりしてもよい。
【0023】
また、以下の説明では、「プログラム」や「処理部」を主語として処理を説明する場合があるが、プログラムを主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。また、二つ以上のプログラムが一つのプログラムとして実現されてもよいし、一つのプログラムが二つ以上のプログラムとして実現されてもよい。
【0024】
また、以下の説明では、「xxxテーブル」あるいは「xxx記憶部」といった表現にて、入力に対して出力が得られる情報を説明することがあるが、当該情報は、どのような構造のテーブルでもよいし、入力に対する出力を発生するニューラルネットワーク、遺伝的アルゴリズムやランダムフォレストに代表されるような学習モデルでもよい。また、以下の説明において、各テーブルの構成は一例であり、一つのテーブルは、二つ以上のテーブルに分割されてもよいし、二つ以上のテーブルの全部又は一部が一つのテーブルであってもよい。
【0025】
また、以下の説明では、「障害対応システム」は、一つ以上の物理的な計算機で構成されたシステムでもよいし、物理的な計算リソース群(例えば、クラウド基盤)上に実現されたシステム(例えば、クラウドコンピューティングシステム)でもよい。障害対応システムが表示用情報を「表示する」ことは、計算機が有する表示デバイスに表示用情報を表示することであってもよいし、計算機が表示用計算機に表示用情報を送信することであってもよい(後者の場合は表示用計算機によって表示用情報が表示される)。
【0026】
コンピュータシステムの障害解決は、障害解決を担当する保守員の研鑽が難しい領域である。オーソドックスな教育手法としては、反復訓練が挙げられる。しかし、実際のコンピュータシステムの運用においては、反復訓練したものと同じシステム障害が発生するとは限らないし、未知の障害も発生しうる。また、通常の業務であれば担当者が計画を立て、計画的に能力向上を図っていくこともできるが、システム障害はいつ発生するか不明であり、障害対応を計画的に経験させることは難しい。
【0027】
更に、システム障害は、多くのシステムにおいて最優先の対応事項となることが多いため、障害解決を担当する保守員は解決を優先して経験豊富な保守員のみがアサインされることも多い。このような中、未熟な保守員が障害解決を計画的に経験して能力を向上させるのは容易ではない。
【0028】
発明者は、このような問題に関して、システム毎に解決あるいは教育のいずれを優先するか予め決められるようにしておき、障害発生時に保守員の技術や経験を定量的に評価してシステムの教育の優先度合いに応じた技術の保守員を自動選定することにより、長期にわたるサービス提供の観点から保守員の技術研鑽に配慮した保守員の選出を行うことができると考えた。
【0029】
なお、通常、ほとんどのシステム単体では障害解決を優先するものではあるが、複数のシステムを管理する状況では、解決を優先するのか、教育を優先するのかは、障害対応予算に応じて決定しうるものとなり得る。つまり、障害対応予算が多い状態では解決に非効率であっても教育を優先し、予算が少ない状態では解決を優先する等、システムに応じて方針を決定することもできる。
【0030】
本発明に係る障害対応システムによれば、長期にわたるサービス提供の観点から保守員の技術研鑽に配慮した保守員の選出を行うことができる。それだけでなく、オンラインでの障害対応を実現することで、外出規制等の社会状況であっても多くの保守員の参加を即時で促すことができ、保守員の技術の偏りを防ぐことができる。
【0031】
図1は、本発明の実施形態に係る障害対応システムの構成例を示す図である。障害対応システム1は、障害の監視対象となるネットワーク機器、サーバー装置等の監視対象システムが一または複数含まれる監視対象システム群99と、監視対象システム群99とネットワーク10を介して監視情報を通信する障害対応サーバー100と、障害対応サーバー100とネットワーク20を介して通信可能にチャットサービスを行うチャットサーバー200と、チャットサーバー200にインターネット等のネットワーク30を介してオンラインチャットルームにアクセスしてチャット上で障害対応を行うインターフェースとなるパーソナルコンピューターやスマートフォン等の情報処理装置と、を含む。
【0032】
なお、チャットサーバー200が提供するオンラインチャットサービスは、キャラクターベースのチャットであるが、これに限られるものではなく、例えば音声によるボイスチャット、動画によるビデオチャット、あるいはこれらの混在するチャットであってもよい。あるいはリアルタイムのチャットに限られず、BBS(Bulletin Board System:電子掲示板)やブログ記事のコメントによる情報交換であってもよい。
【0033】
ネットワーク10、20および保守員が使用する情報処理装置とチャットサーバー200との間のネットワーク30は、例えば、LTE(Long Term Evolution)あるいは5G(ファイブジー)と呼ばれる所定の周波数帯(3.5GHz(ギガヘルツ)帯、4.5GHz帯、28GHz帯等)を利用する無線通信ネットワークであり、監視対象システム群99と障害対応サーバー100と、障害対応サーバー100とチャットサーバー200と、保守員が使用する情報処理装置とチャットサーバー200と、のそれぞれを通信可能に接続する。
【0034】
なお、監視対象システム群99と、障害対応サーバー100と、チャットサーバー200と、保守員が使用する情報処理装置との間は、通信品質やセキュリティ、維持コスト等を総合的に考慮して有線ネットワーク(LAN(Local Area Netowork)等)を介して通信可能に接続されるものであってもよい。
【0035】
監視対象システム群99に属する監視対象システムのそれぞれは、障害が発生すると、監視用の所定のソフトウェアを用いて障害に関するテキストファイルやメッセージ等のログ情報とともに障害対応サーバー100にアラートを報知する。
【0036】
障害対応サーバー100は、監視対象システム群99から報知されるアラートを受信すると、障害として検知し、チャットサーバー200にオンラインチャットルームを開設して保守員を招待する。また、障害対応サーバー100は、障害の切り分けを行い、招待する保守員の選定を保守員のスケジュールと保守員の評価および障害が発生したシステムの教育の優先度に応じて行う。
【0037】
チャットサーバー200は、障害対応サーバー100からのチャットルームの開設の求めに応じて、オンラインチャットルームを開設し、ネットワーク30を介して保守員の参加管理、発言の記録、通知、等のいわゆるチャット環境を提供する。
【0038】
障害対応サーバー100には、記憶部110と、処理部120と、通信部130と、が含まれる。記憶部110には、システム情報記憶部111と、過去事例記憶部112と、保守員情報記憶部113と、スケジュール記憶部114と、が含まれる。
【0039】
図2は、システム情報記憶部に格納されるデータの構造例を示す図である。システム情報記憶部111には、監視対象システム群99に属するシステムの情報が格納される。システム情報記憶部111には、監視対象システム識別子111aと、監視要素111bと、対応候補保守員111cと、教育優先度111dと、が含まれる。
【0040】
監視対象システム識別子111aは、監視対象システム群99に属する監視対象システムを識別する情報である。監視要素111bは、監視対象システム識別子111aにより識別される監視対象システムを構成する要素を特定する情報である。対応候補保守員111cは、監視対象システム識別子111aにより特定される監視対象システムの監視要素111bに関する保守員の候補を特定する情報である。教育優先度111dは、監視対象システム識別子111aにより特定される監視対象システムの監視要素111bごとに設定される優先の程度を示す値である。教育優先度111dは、本実施形態においては1~5の5段階で示され、1は最も解決優先であることを示し、5は最も教育優先であり、2~4はそれらの中間の程度を示す。
【0041】
図3は、過去事例記憶部に格納されるデータの構造例を示す図である。過去事例記憶部112には、過去の障害の事例が格納される。過去事例記憶部112には、障害ログ112aと、障害システム112bと、構成要素112cと、対応保守員112dと、が含まれる。
【0042】
障害ログ112aは、障害の内容を示すログ情報である。ログ情報は、例えば障害メッセージ等のテキスト情報、あるいはメモリダンプやエラーヒープの情報である。障害システム112bは、障害が起きた監視対象システムを識別する情報である。構成要素112cは、障害が起きた監視対象システムの構成要素を識別する情報である。対応保守員112dは、障害に対応した保守員を特定する情報である。
【0043】
図4は、保守員情報記憶部に格納されるデータの構造例を示す図である。保守員情報記憶部113には、保守員の情報が格納される。保守員情報記憶部113には、保守員113aと、技術レベル113bと、過去対応件数113cと、平均応答時間113dと、が含まれる。
【0044】
保守員113aは、保守員を識別する情報である。技術レベル113bは、保守員が発揮できる技術レベルを特定する情報であり、本実施形態においては1~5の5段階で示され、5は技術が高いことを示し、1は技術が高くないことを示し、2~4はそれらの中間の程度を示す。過去対応件数113cは、保守員113aにより識別される保守員が実際に障害に対応した件数である。平均応答時間113dは、障害発生時にチャットの招待に応じる(チャットに参加する)までの時間(応答時間)の保守員ごとの平均を特定する情報である。
【0045】
図5は、スケジュール記憶部に格納されるデータの構造例を示す図である。スケジュール記憶部114には、保守員の対応可能時間、すなわちスケジュール情報が格納される。スケジュール記憶部114には、保守員114aと、対応時間114bと、が含まれる。
【0046】
保守員114aは、保守員を識別する情報である。対応時間114bは、保守員が障害に対応できる当日の時刻帯を特定する情報である。
【0047】
図1の説明に戻る。処理部120には、障害検知部121と、保守員選定部122と、チャット設定部123と、システム情報登録部124と、保守員情報登録部125と、保守員スケジュール登録部126と、が含まれる。
【0048】
障害検知部121は、監視対象システム群99から報知される障害情報を検知し、どの監視対象でどのような障害が起きたのか特定し、必要なログ情報等を自動収集する。
【0049】
保守員選定部122は、障害に対応するための保守員を選定する。具体的には、保守員選定部122は、障害検知部121が監視対象システムの障害を検知すると、該障害の内容および監視対象システムの教育優先情報に応じて該障害の解決のための保守員を選定する。その際、保守員選定部122は、保守員を評価する所定の評価点に応じて保守員が複数属する層を形成し、障害の内容および教育優先情報に応じて選定対象となる保守員の層を特定する。また、保守員選定部122は、特定した層に属する保守員をオンラインチャットルームへ招待すると、招待への応答までの経過時間(応答時間)に応じて評価点を変動させる。なお、保守員選定部122は、少なくとも、技術の高さ、障害対応件数、同一の障害の対応経験有無、のいずれかを含む評価軸に基づいて評価点を算出する。
【0050】
チャット設定部123は、保守員が前記障害の解決のために用いるオンラインチャットルームを開設する。具体的には、チャット設定部123は、チャットサーバー200にオンラインチャットルームの開設を求める。その際、チャット設定部123は、収集したログメッセージ等を参照物としてオンラインチャットルームから参照可能に設定する。また、チャット設定部123は、保守員選定部122が選定した保守員をチャットに招待する。
【0051】
システム情報登録部124は、システム情報記憶部111に格納される情報の参照、生成、削除、変更を行う。
【0052】
保守員情報登録部125は、保守員情報記憶部113に格納される情報の参照、生成、削除、変更を行う。
【0053】
保守員スケジュール登録部126は、スケジュール記憶部114に格納される情報の参照、生成、削除、変更を行う。
【0054】
通信部130は、ネットワーク10、ネットワーク20を介してそれぞれ監視対象システム群99と、チャットサーバー200と、の間の通信を行う。
【0055】
チャットサーバー200には、チャットルーム提供部210が含まれる。チャットルーム提供部210は、オンラインチャットルームの開設を求められると、招待された保守員がネットワーク30を介して参加可能なオンラインチャットルームを生成し、生成したオンラインチャットルームの管理を行う。なお、チャットサーバー200は、セキュリティポリシーに合致したチャットルームを用いることができるものであれば、外部の機関が提供するサービスを利用するものであってもよい。
【0056】
図6は、障害対応サーバーのハードウェア構成例を示す図である。障害対応サーバー100は、いわゆるパーソナルコンピューターやサーバー装置等の情報処理装置であって、ネットワーク10およびネットワーク20を介して他の装置との間で情報の送受信を行う。なお、障害対応サーバー100は、パーソナルコンピューターに限られず、例えばスマートフォンやタブレット装置等の他の装置であってもよい。
【0057】
障害対応サーバー100は、CPU(Central Processing Unit)等のプロセッサ101と、RAM(Random Access Memory)等のメモリ102と、ハードディスクやSSD(Solid State Drive)等のストレージ103と、LTE通信用のSIMカード等、あるいはNIC(Network Interface Card)等の通信装置107と、これらをつなぐバスと、を含んで構成される。
【0058】
通信装置107は、アンテナを介して無線通信を行う無線通信装置である。通信装置107は、ネットワーク10およびネットワーク20に接続される他の装置との無線通信を行う。本実施形態においては、あるいは、上述したように、通信装置107は、ネットワークケーブルを介して他の装置との有線通信を行う有線の通信装置であってもよい。
【0059】
上記した障害検知部121と、保守員選定部122と、チャット設定部123と、システム情報登録部124と、保守員情報登録部125と、保守員スケジュール登録部126とは、プロセッサ101に処理を行わせるプログラムによって実現される。このプログラムは、メモリ102内に記憶され、実行にあたってプロセッサ101により実行される。
【0060】
また、記憶部110に格納されるシステム情報記憶部111と、過去事例記憶部112と、保守員情報記憶部113と、スケジュール記憶部114とは、メモリ102及びストレージ103により実現される。
【0061】
また、通信部130は、通信装置107により実現される。障害対応サーバー100の図示しない入出力部、表示部は、上述の通りI/Oインターフェースデバイスあるいは通信インターフェースデバイスのいずれかでよい。
【0062】
以上が、本実施形態における障害対応サーバー100のハードウェア構成例である。しかし、これに限らず、その他のハードウェアを用いて構成されるものであってもよい。なお、障害対応サーバー100は、図示しないが、OS、ミドルウェア、アプリケーションなどの公知の要素を有する。
【0063】
また、チャットサーバー200についても、基本的に障害対応サーバー100と同様のハードウェア構成を備える。なお、チャットルーム提供部210は、チャットサーバー200のプロセッサに処理を行わせるプログラムによって実現される。このプログラムは、チャットサーバー200のメモリ内に記憶され、実行にあたってプロセッサにより実行される。
【0064】
[動作の説明]次に、本実施形態における障害対応サーバー100の動作を説明する。
【0065】
図7は、初動処理のフロー例を示す図である。初動処理は、障害対応サーバー100が監視対象システム群99のいずれかの監視対象から障害の報知を受け付けると、開始される。
【0066】
まず、障害検知部121は、障害情報を収集する(ステップS001)。具体的には、障害検知部121は、受け取った障害の報知情報から障害の発生元の監視対象システムを特定し関連するログファイル等の取得を行う。
【0067】
そして、チャット設定部123は、チャットサーバー200にチャットルームの開設を求める(ステップS002)。その際、チャット設定部123は、収集したログファイルや報知情報のメッセージ等を参照物としてオンラインチャットルームから参照可能に設定する。
【0068】
保守員選定部122は、後述する保守員候補抽出処理を実施する(ステップS003)。具体的には、保守員選定部122は、スケジュール記憶部114の対応時間114bを参照して、当該時刻帯において障害に対応できる保守員を特定し、そのうち監視対象システムおよび監視要素が一致し、かつ対応候補となっている保守員の保守員評価点数を算出して教育優先度に応じて抽出する。
【0069】
そして、チャット設定部123は、抽出した保守員をチャットに招待する(ステップS004)。具体的には、チャット設定部123は、ステップS003において抽出された保守員をチャットに招待する。チャット設定部123は、招待時に、抽出された保守員のうち保守員評価点数の高い者から順に招待し、応答がなく時間切れとなった場合には保守員評価点数が次点の者を招待する。チャット設定部123は、所定の定員(例えば、2人)となるまで招待を繰り返す。
【0070】
そして、保守員選定部122は、招待応答時間を記録する(ステップS005)。具体的には、保守員選定部122は、招待した保守員について招待からチャットルームへの参加までの応答時間(招待応答時間)を計時し、記録する。より詳しくは、保守員選定部122は、計時した招待応答時間と平均応答時間113dとの差を算出し、過去対応件数113cに「1」を加えた値で除した結果を平均応答時間113dに加算して、新たな平均応答時間を求める。そして、保守員選定部122は、保守員情報記憶部113の平均応答時間113dに新たな平均応答時間を格納する。
【0071】
なお、招待への応答がなく時間切れとなった保守員については、保守員選定部122は、ペナルティとして招待応答時間の上限より長い時間(例えば、上限の招待応答時間の二倍)を招待応答時間とみなして(例えば、上限の招待応答時間が30分である場合には、その倍の60分とみなして)新たな平均応答時間を求めるようにしてもよい。
【0072】
そして、障害検知部121は、障害の情報と、チャットに招待されて参加した保守員とを過去事例として過去事例記憶部112に格納する(ステップS006)。
【0073】
以上が、初動処理の流れである。初動処理によれば、障害発生を検知すると障害情報を収集してオンラインチャットルームを開設し、対応可能な保守員をチャットに招待することができる。
【0074】
図8は、保守員候補抽出処理のフロー例を示す図である。保守員候補抽出処理は、初動処理のステップS003において開始される。
【0075】
まず、保守員選定部122は、障害の範囲と時刻に応じて対象保守員を抽出する(ステップS101)。具体的には、保守員選定部122は、スケジュール記憶部114の対応時間114bを参照して、当該時刻帯において障害に対応できる保守員を特定し、そのうち障害が発生している監視対象システムおよび監視要素がシステム情報記憶部111の監視対象システム識別子111aおよび監視要素111bと一致し、かつ対応候補保守員111cに含まれる保守員を対象保守員として抽出する。
【0076】
そして、保守員選定部122は、抽出した対象保守員ごとに、ステップS103~ステップS107の処理を実施する(ステップS102、ステップS108)。
【0077】
保守員選定部122は、保守員の技術レベル点数を算出する(ステップS103)。具体的には、保守員選定部122は、保守員の技術レベルを保守員情報記憶部113の技術レベル113bより取得して、所定の技術レベル係数(例えば、「6.6」)を掛けて技術レベル点数Aとする。すなわち、保守員選定部122は、技術レベル点数A=技術レベル×技術レベル係数として算出する。
【0078】
保守員選定部122は、保守員の対応件数点数を算出する(ステップS104)。具体的には、保守員選定部122は、保守員の対応件数を保守員情報記憶部113の過去対応件数113cより取得して、所定の対応件数係数(例えば、「3.3」)を掛けて対応件数点数Bとする。すなわち、保守員選定部122は、対応件数点数B=対応件数×対応件数係数として算出する。
【0079】
保守員選定部122は、保守員の過去事例点数を算出する(ステップS105)。具体的には、保守員選定部122は、保守員の同様の過去事例への対応有無(有:1、無:0)を過去事例記憶部112を検索して(障害ログのメッセージと対応保守員の組み合わせで検索して)、対応有の場合には所定の過去事例係数(例えば、「33.3」)を掛けて過去事例点数Cとする。すなわち、保守員選定部122は、過去事例点数C=対応有無(1,または0)×過去事例係数として算出する。
【0080】
保守員選定部122は、保守員の応答点数を算出する(ステップS106)。具体的には、保守員選定部122は、保守員の平均応答時間を保守員情報記憶部113の平均応答時間113dより取得して、上限の招待応答時間からの差に所定の応答時間係数(例えば、「0.5」)を掛けて応答点数Dとする。すなわち、保守員選定部122は、応答点数D=(上限の招待応答時間-平均応答時間)×応答時間係数として算出する。
【0081】
そして、保守員選定部122は、保守員評価点数を算出する(ステップS107)。具体的には、保守員選定部122は、ステップS103~S106において求めた技術レベル点数Aと、対応件数点数Bと、過去事例点数Cと、応答点数Dと、に所定の重み付けを行って加算し、保守員評価点数を算出する。すなわち、保守員選定部122は、保守員評価点数=αA+βB+γC+δD(α、β、γ、δは、それぞれ任意の所定の重み付け係数)として算出する。
【0082】
そして、保守員選定部122は、保守員評価点数をパーセンタイル法で評価し、障害の教育優先度に応じて対象保守員の候補の層から候補を選定する(ステップS109)。具体的には、図9に示すように保守員を保守員評価点数の大小に応じて順に並べるモデル400において、保守員選定部122は、障害が発生した監視対象システムの教育優先度に応じて保守員の層を特定し、当該層に含まれる保守員を候補として選定する。
【0083】
例えば、教育優先度が「1」すなわち解決を最優先とする監視対象システムでは、保守員選定部122は、80~100パーセンタイルの保守員、すなわち候補の保守員が100人いるとすると保守評価点数の順に並べた保守員の最上層の20パーセントの層である上位20人から保守員を選定する。
【0084】
さらに例えば、教育優先度が「3」すなわち解決と教育のバランスを優先する監視対象システムでは、保守員選定部122は、40~60パーセンタイルの保守員、すなわち候補の保守員が100人いるとすると保守評価点数の順に並べた保守員の中間層の20パーセントの層である上位41人~60人の20人から保守員を選定する。
【0085】
以上が、保守員候補抽出処理の流れである。保守員候補抽出処理によれば、教育優先度に応じて能力評価が高くない保守員であっても担当者に任命されることとなり、障害対応の機会を得ることが可能となり、実践的な問題解決能力の教育につなげることができる。また、そのことにより、一部の上位者のみに解決能力が偏ってしまうことを回避し、層の厚い障害対応チームの育成が可能となる。また、オンラインでの障害対応をすることで、多くの保守員の参加を促せる。さらには、保守員のスケジュールに応じ、確実に対応可能な人員をアサインできる。
【0086】
以上、実施形態に係る障害対応システム1について具体的に説明したが、本発明はこの実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。そもそも、教育優先の監視対象システムであっても障害の解決を行わなくてもよいわけではない。したがって、例えば保守員選定部122が、教育優先度が高い監視対象システムでは、選定した保守員に助言を行うために、当該保守員が属する層より上位の評価点の層に属する保守員を対となるように招集し、メンター(助言係)として参加させるようにしてもよい。
【0087】
図10は、チャットルーム画面の例を示す図である。チャットルーム画面500は、チャットルーム提供部210により生成され、チャットに参加する保守員の情報処理装置上で表示される画面である。チャットルーム画面500には、オンラインチャットルームでの発言を表示するスレッド領域510と、参加しているメンバーを示すメンバーリスト領域520と、が含まれる。そして、メンバーリスト領域520には、教育優先度が高い監視対象システムの場合にはメンターとして参加している保守員に「メンター」の説明書きが、メンティーとして参加している保守員に「メンティー」の説明書きが加えられて表示される。
【0088】
このように、教育優先の監視対象システムでは、チャットに参加した保守員に助言係がペアを組んで割り当てられることにより、障害の解決を図りつつ技術研鑽、技術移転を容易に行うことができる。例えば、メンティーが対応策や状況分析をチャットで述べ、メンターが即時に助言・指導を行ったり明らかに誤りのある行動を諫めたりすることができる。
【0089】
なお、上記した実施形態では本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
【0090】
また、上記の各構成、機能、処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【0091】
また、上記した各構成、機能、処理部等は、それらの一部又は全部を、例えば別の装置で実行してネットワークを介して統合処理する等により分散システムで実現してもよい。
【0092】
また、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品のような複数の部分に分けられて適用されるようにしてもよい。
【0093】
以上、本発明について、実施形態を中心に説明した。
【符号の説明】
【0094】
1:障害対応システム、10,20,30:ネットワーク、99:監視対象システム群、100:障害対応サーバー、110:記憶部、111:システム情報記憶部、112:過去事例記憶部、113:保守員情報記憶部、114:スケジュール記憶部、120:処理部、121:障害検知部、122:保守員選定部、123:チャット設定部、124:システム情報登録部、125:保守員情報登録部、126:保守員スケジュール登録部、130:通信部、200:チャットサーバー、210:チャットルーム提供部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10