(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-25
(45)【発行日】2024-07-03
(54)【発明の名称】自動化システム、サーバ、自動化方法及びコンピュータプログラム
(51)【国際特許分類】
G06F 11/07 20060101AFI20240626BHJP
G06F 11/34 20060101ALI20240626BHJP
G06F 9/48 20060101ALI20240626BHJP
【FI】
G06F11/07 193
G06F11/34 176
G06F11/07 140A
G06F9/48 370
(21)【出願番号】P 2020187111
(22)【出願日】2020-11-10
【審査請求日】2023-02-22
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100165179
【氏名又は名称】田▲崎▼ 聡
(74)【代理人】
【識別番号】100175824
【氏名又は名称】小林 淳一
(74)【代理人】
【識別番号】100114937
【氏名又は名称】松本 裕幸
(72)【発明者】
【氏名】河崎 純一
【審査官】円子 英紀
(56)【参考文献】
【文献】特開2004-242030(JP,A)
【文献】特開2008-130033(JP,A)
【文献】特開2013-045256(JP,A)
【文献】特開2018-097793(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/07
G06F 11/28-11/36
G06F 9/455-9/54
(57)【特許請求の範囲】
【請求項1】
各々の特定機能を有する複数のサーバを備え、前記複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムにおいて、
前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報の入力を受付けるプロセス定義部と、
前記プロセス定義部が受付けた前記自動化プロセス情報を前記複数のサーバへ配布し、前記複数のサーバに対して前記自動化プロセス情報に基づくプロセスをアクティブ状態にさせる管理制御部と、を備える自動化管理制御装置と、
前記一連のプロセス毎に、前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部と、を備え、
前記サーバは、
前記自動化プロセス情報を受信する受信部と、
前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行部と、
前記サービス実行部によるプロセスの実行に関する履歴情報を前記履歴蓄積部へ送信する履歴記録部と、を備え
、
前記サーバは、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行部の実行結果を含む実行結果情報を送信する送信部をさらに備え、
前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行部の実行結果が順次追加され、
前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、
自動化システム。
【請求項2】
各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムの前記サーバにおいて、
前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報を受信する受信部と、
前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行部と、
前記サービス実行部によるプロセスの実行に関する履歴情報を、前記一連のプロセス毎に前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部へ送信する履歴記録部と、
前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行部の実行結果を含む実行結果情報を送信する送信部と、を備え、
前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行部の実行結果が順次追加され、
前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、
サーバ。
【請求項3】
各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化方法であって、
自動化管理制御装置が、前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報の入力を受付けるプロセス定義ステップと、
前記自動化管理制御装置が、前記プロセス定義ステップが受付けた前記自動化プロセス情報を前記複数のサーバへ配布し、前記複数のサーバに対して前記自動化プロセス情報に基づくプロセスをアクティブ状態にさせる管理制御ステップと、
前記サーバが、前記自動化プロセス情報を受信する受信ステップと、
前記サーバが、前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行ステップと、
前記サーバが、前記サービス実行ステップによるプロセスの実行に関する履歴情報を履歴蓄積部へ送信する履歴記録ステップと、
前記履歴蓄積部が、前記一連のプロセス毎に、前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積ステップと、
前記サーバが、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行ステップの実行結果を含む実行結果情報を送信する送信ステップと、を含み、
前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行ステップの実行結果が順次追加され、
前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、
自動化方法。
【請求項4】
各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムの前記サーバのコンピュータに、
前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報を受信する受信ステップと、
前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行ステップと、
前記サービス実行ステップによるプロセスの実行に関する履歴情報を、前記一連のプロセス毎に前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部へ送信する履歴記録ステップと、
前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行ステップの実行結果を含む実行結果情報を送信する送信ステップと、を実行させ、
前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行ステップの実行結果が順次追加され、
前記他のサーバのコンピュータに、
前記他のサーバが受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断するステップをさらに実行させる、
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、自動化システム、サーバ、自動化方法及びコンピュータプログラムに関する。
【背景技術】
【0002】
近年、通信ネットワークを利用したIT(Information Technology)システムは人々の生活やビジネスに欠かせないものとなってきている。このため、通信障害が直接生活やビジネスに大きな影響を及ぼす可能性がある。このような理由から、通信ネットワークの品質を常時監視し、通信ネットワークの障害発生時には解析によりその原因及び箇所を特定し、適切な復旧作業を実施することが求められている。そして、通信ネットワークの運用業務においては、障害時間を短縮して影響を最小限に抑制するために、過去の運用履歴をナレッジとして蓄積し、そのナレッジを参照して運用業務を行うことが考えられる。
【0003】
一方、近年の通信ネットワークは仮想化やソフト化に伴って複雑さが増しており、且つ将来的な人手不足の懸念から、通信ネットワークの運用業務を自動化するための技術が検討されている。そして、自動化された通信ネットワークの運用業務においても、過去の運用履歴をナレッジとして蓄積して活用することが有効である。
【0004】
特許文献1には、デバイスの障害時にステータスコードを含むインシデントを発行し、担当者が対応終了後に対応内容を手動で登録することによって、障害対応履歴をナレッジ情報として蓄積する技術が記載されている。特許文献2には、過去の運用履歴及びカウンタを参照して障害時に適切な対処方法を選択して実行する技術が記載されている。その運用履歴には障害種別や復旧させた対処方法及び実行日時の情報が含まれ、カウンタには過去一定期間内にどの対処方法が何回失敗したかの情報が含まれる。特許文献3には、復旧制御履歴に基づき復旧制御アルゴリズムによって自動的に復旧処理を行う技術が記載されている。その復旧制御履歴には、自動制御のトリガ(アラームやユーザ申告等)と自動復旧のパターン(再起動等)との対応関係が保持されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2014-089643号公報
【文献】特開2014-157567号公報
【文献】特開2018-025968号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上述した特許文献1に記載された技術では、デバイスの障害に対する対応履歴情報を担当者が都度手動で入力する必要があるため、通信ネットワークの運用業務の自動化に適用することが難しい。また、特許文献2-3に記載された技術では、履歴情報が自動で記録されるが、履歴に含まれる内容が障害種別と対応する復旧処理であって、失敗事例やその他の処理(障害解析等)に関する履歴を含めた一連の運用履歴をナレッジとして蓄積することができない。
【0007】
本発明は、このような事情を考慮してなされたものであり、その目的は、複数のサーバが連携して自動的に一連のプロセスを実行する際の当該一連のプロセスの実行に関する履歴情報を蓄積することを図ることにある。
【課題を解決するための手段】
【0008】
(1)本発明の一態様は、各々の特定機能を有する複数のサーバを備え、前記複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムにおいて、前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報の入力を受付けるプロセス定義部と、前記プロセス定義部が受付けた前記自動化プロセス情報を前記複数のサーバへ配布し、前記複数のサーバに対して前記自動化プロセス情報に基づくプロセスをアクティブ状態にさせる管理制御部と、を備える自動化管理制御装置と、前記一連のプロセス毎に、前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部と、を備え、前記サーバは、前記自動化プロセス情報を受信する受信部と、前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行部と、前記サービス実行部によるプロセスの実行に関する履歴情報を前記履歴蓄積部へ送信する履歴記録部と、備える、自動化システムである。
(2)本発明の一態様は、前記サーバは、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行部の実行結果を含む実行結果情報を送信する送信部をさらに備え、前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行部の実行結果が順次追加され、前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、上記(1)の自動化システムである。
【0009】
(3)本発明の一態様は、各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムの前記サーバにおいて、前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報を受信する受信部と、前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行部と、前記サービス実行部によるプロセスの実行に関する履歴情報を、前記一連のプロセス毎に前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部へ送信する履歴記録部と、を備えるサーバである。
(4)本発明の一態様は、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行部の実行結果を含む実行結果情報を送信する送信部をさらに備え、前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行部の実行結果が順次追加され、前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、上記(3)のサーバである。
【0010】
(5)本発明の一態様は、各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化方法であって、自動化管理制御装置が、前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報の入力を受付けるプロセス定義ステップと、前記自動化管理制御装置が、前記プロセス定義ステップが受付けた前記自動化プロセス情報を前記複数のサーバへ配布し、前記複数のサーバに対して前記自動化プロセス情報に基づくプロセスをアクティブ状態にさせる管理制御ステップと、前記サーバが、前記自動化プロセス情報を受信する受信ステップと、前記サーバが、前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行ステップと、前記サーバが、前記サービス実行ステップによるプロセスの実行に関する履歴情報を履歴蓄積部へ送信する履歴記録ステップと、前記履歴蓄積部が、前記一連のプロセス毎に、前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積ステップと、を含む自動化方法である。
(6)本発明の一態様は、前記サーバが、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行ステップの実行結果を含む実行結果情報を送信する送信ステップをさらに含み、前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行ステップの実行結果が順次追加され、前記他のサーバは、受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断する、上記(5)の自動化方法である。
【0011】
(7)本発明の一態様は、各々の特定機能を有する複数のサーバが連携して自動的に一連のプロセスを実行する自動化システムの前記サーバのコンピュータに、前記一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された自動化プロセス情報を受信する受信ステップと、前記自動化プロセス情報の自動化シーケンスに従ってプロセスを実行するサービス実行ステップと、前記サービス実行ステップによるプロセスの実行に関する履歴情報を、前記一連のプロセス毎に前記複数のサーバの各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積部へ送信する履歴記録ステップと、を実行させるためのコンピュータプログラムである。
(8)本発明の一態様は、前記コンピュータに、前記自動化プロセス情報の自動化シーケンスに示される次のプロセスを実行する他の前記サーバへ、自己の前記サービス実行ステップの実行結果を含む実行結果情報を送信する送信ステップをさらに実行させ、前記実行結果情報は、前記自動化プロセス情報の自動化シーケンスに示されるプロセスの実行の順番に従って、各前記サーバの前記サービス実行ステップの実行結果が順次追加され、前記他のサーバのコンピュータに、前記他のサーバが受信した前記実行結果情報に基づいて、前記自動化プロセス情報の自動化シーケンスに従って自己のプロセスの実行条件を判断するステップをさらに実行させる、上記(7)のコンピュータプログラムである。
【発明の効果】
【0012】
本発明によれば、複数のサーバが連携して自動的に一連のプロセスを実行する際の当該一連のプロセスの実行に関する履歴情報を蓄積することができるという効果が得られる。
【図面の簡単な説明】
【0013】
【
図1】一実施形態に係る障害自動復旧システム(自動化システム)の構成例を示すブロック図である。
【
図2】一実施形態に係る障害自動復旧システムの詳細構成および自動化方法の手順を説明するためのブロック図である。
【
図3】一実施形態に係る自動化方法の一例を説明するための説明図である。
【
図4】一実施形態に係る自動化プロセス情報の構成例を示す図である。
【
図5】一実施形態に係る自動化プロセス情報の構成例を示す図である。
【発明を実施するための形態】
【0014】
以下、図面を参照し、本発明の実施形態について説明する。本実施形態では、自動化システムの一例として、通信ネットワークの障害発生時に自動的に復旧作業を実施する障害自動復旧システムを例に挙げて説明する。
【0015】
図1は、一実施形態に係る自動化システムとしての障害自動復旧システムの構成例を示すブロック図である。
図1において、障害自動復旧システム1は、自動化管理制御装置10と、収集サーバ20と、分析サーバ30と、対処判断サーバ40と、対処実行サーバ50と、履歴蓄積部60と、を備える。これらの各装置10,20,30,40,50,60は、通信回線を介してデータを送受する。
【0016】
複数のサーバ20,30,40,50は、各々の特定機能を有するサーバである。複数のサーバ20,30,40,50が連携して自動的に一連のプロセスを実行する。本実施形態に係る障害自動復旧システム1では、複数のサーバ20,30,40,50が連携して自動的に障害自動復旧処理の一連のプロセスを実行する。
【0017】
収集サーバ20は、障害自動復旧サービスの対象の通信ネットワークNWから定期的に監視データを取得する収集機能を有する。分析サーバ30は、収集サーバ20が収集した監視データを解析して、通信ネットワークNWで発生した障害の原因や箇所を特定する分析機能を有する。対処判断サーバ40は、分析サーバ30が分析した結果の障害原因や障害箇所に対して、障害を復旧させるための対処を決定する対処判断機能を有する。対処実行サーバ50は、対処実行サーバ50が決定した結果の対処を通信ネットワークNWに対して実行する対処実行機能を有する。これら複数のサーバ20,30,40,50が有する機能群は、障害自動復旧システム1内の自動化に係る機能群である。
【0018】
自動化管理制御装置10は、複数のサーバ20,30,40,50が有する自動化に係る機能群を管理するための自動化管理制御機能を有する。履歴蓄積部60は、複数のサーバ20,30,40,50によって実行された障害自動復旧処理の一連のプロセス毎に、複数のサーバ20,30,40,50の各々のプロセスの実行に関する履歴情報を蓄積する履歴蓄積機能を備える。
【0019】
各装置10,20,30,40,50,60の機能は、各装置10,20,30,40,50,60がCPU(Central Processing Unit:中央演算処理装置)及びメモリ等のコンピュータハードウェアを備え、CPUがメモリに格納されたコンピュータプログラムを実行することにより実現される。なお、各装置10,20,30,40,50,60として、汎用のコンピュータ装置を使用して構成してもよく、又は、専用のハードウェア装置として構成してもよい。例えば、各装置10,20,30,40,50,60は、インターネット等の通信ネットワークに接続されるサーバコンピュータを使用して構成されてもよい。また、各装置10,20,30,40,50,60の機能はクラウドコンピューティングにより実現されてもよい。また、各装置10,20,30,40,50,60は、単独のコンピュータにより実現するものであってもよく、又は各装置10,20,30,40,50,60の機能を複数のコンピュータに分散させて実現するものであってもよい。また、各装置10,20,30,40,50,60の機能はVM(Virtual Machine、仮想マシン)やコンテナ等の仮想化実行環境により実現されてもよい。
【0020】
図2は、本実施形態に係る障害自動復旧システム1の詳細構成および自動化方法の手順を説明するためのブロック図である。
図2には、複数のサーバ20,30,40,50のうち分析サーバ30及び対処判断サーバ40を代表として図示している。他のサーバ20,50も分析サーバ30及び対処判断サーバ40と同様の構成である。
【0021】
まず
図2を参照して、本実施形態に係る自動化管理制御装置10及びサーバ20,30,40,50の構成を説明する。
【0022】
自動化管理制御装置10は、プロセス定義部11と、管理制御部12とを備える。プロセス定義部11は、ユーザ(ユーザ端末)から自動化プロセス情報200の入力を受付ける。自動化プロセス情報200は、障害自動復旧処理の一連のプロセスについての開始、終了及び繰返し条件を含む自動化シーケンスが定義された情報である。
【0023】
より具体的には、プロセス定義部11は、テンプレートに基づいて、自動化プロセス情報200に含めるシーケンステーブル及びデータベース情報の入力を受付ける。当該シーケンステーブルは、各サーバ20,30,40,50の機能について、障害自動復旧処理の一連のプロセスについての開始、終了及び繰返し条件を含む各機能の実行順序を定める情報を格納するテーブルである。当該データベース情報は、複数のサーバ20,30,40,50の各々のプロセスの実行に関する履歴情報を蓄積する先となる履歴蓄積部60についての情報である。当該データベース情報は、例えば、履歴蓄積部60のホスト名、ログイン情報(ログインのための識別子(ログインID)及びパスワード)、データベース名、テーブル名等である。
【0024】
管理制御部12は、プロセス定義部11が受付けた自動化プロセス情報200を複数のサーバ20,30,40,50へ配布する。管理制御部12は、自動化プロセス情報200を複数のサーバ20,30,40,50へ配布した後に、複数のサーバ20,30,40,50に対して当該自動化プロセス情報200に基づくプロセスをアクティブ状態にさせる。
【0025】
より具体的には、管理制御部12は、障害自動復旧システム1内の自動化に係る機能群のリスト(機能群リスト)を保持する。管理制御部12は、ユーザ(ユーザ端末)から自動化プロセス情報200のプロセスのアクティベーション要求を受けると、当該自動化プロセス情報200を複数のサーバ20,30,40,50へ配布し、当該配布の後に、複数のサーバ20,30,40,50に対して当該自動化プロセス情報200に基づくプロセスをアクティブ状態にさせる。
【0026】
各サーバ20,30,40,50は、受信部101と、サービス実行部102と、履歴記録部103と、送信部104とを備える。
【0027】
受信部101は、自動化管理制御装置10の管理制御部12から送信された自動化プロセス情報200を受信する。また、受信部101は、自動化プロセス情報200のシーケンステーブルに従って、あるサービス実行要求を受信すると、当該サービス実行要求を所定のサービス実行部102に転送する。
【0028】
サービス実行部102は、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に従ってプロセスを実行する。サービス実行部102は、受信部101から受信したサービス実行要求に基づいたプロセスを実行する。サービス実行部102は、自動化プロセス情報200のシーケンステーブル内の開始、終了及び繰返し条件に従って、プロセスの実行結果の出力からプロセスの開始、終了及び繰返しについての条件判定を行う。サービス実行部102は、当該条件判定の結果に従って、プロセスの開始、終了及び繰返しを行う。
【0029】
履歴記録部103は、サービス実行部102によるプロセスの実行に関する履歴情報を、自動化プロセス情報200のデータベース情報を用いて履歴蓄積部60へ送信する。当該履歴情報は、サービスの実行時間、プロセス識別子(プロセスID)、実行したサービス(実行サービス)の名称(実行サービス名)及び実行サービスの結果を含む情報である。
【0030】
プロセスIDは、自動化プロセス情報200に含まれている。プロセスIDは、複数のサーバ20,30,40,50によって実行される障害自動復旧処理の一連のプロセスを識別する識別情報である。履歴記録部103が履歴情報に含めるプロセスIDは、自動化プロセス情報200に含まれているプロセスIDである。したがって、同じ自動化プロセス情報200によって実行された一連のプロセスに関する履歴情報は、各サーバ20,30,40,50で同一のプロセスIDを有するものになる。履歴蓄積部60は、プロセスID毎に履歴情報を保管する。これにより、履歴蓄積部60には、複数のサーバ20,30,40,50によって実行された障害自動復旧処理の一連のプロセス(プロセスID)毎に、複数のサーバ20,30,40,50の各々のプロセスの実行に関する履歴情報が蓄積される。
【0031】
送信部104は、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に示される次のプロセスを実行する他のサーバへ、自己のサービス実行部102の実行結果(実行サービスの結果)を含む実行結果情報を送信する。当該実行結果情報は、実行サービスの結果及び該当するプロセスIDを含む情報である。送信部104は、当該他のサーバに対して、当該実行結果情報を送信すると共にサービス実行要求を送信する。当該実行結果情報及び当該サービス実行要求は、送信先の他のサーバの受信部101により受信される。
【0032】
次に
図2を参照して、本実施形態に係る自動化方法の手順を説明する。
(ステップS1) ユーザがプロセス定義部11に対し、テンプレートに基づいて自動化プロセス情報200を入力する。
【0033】
(ステップS2) ユーザがステップS1で入力した自動化プロセス情報200のプロセスのアクティベーション要求を行うと、管理制御部12が機能群リストを参照し、機能群リストに記載された全機能(全サーバ20,30,40,50)に対して当該自動化プロセス情報200を配布し、当該配布の後に、全サーバ20,30,40,50に対して当該自動化プロセス情報200に基づくプロセスをアクティブ状態にさせる。この後、各サーバ20,30,40,50の機能が当該自動化プロセス情報200に従って、連携して一連のプロセスを実行する。以下、分析サーバ30を例に挙げて説明を行うが、他のサーバ20,40,50も同様の手順である。
【0034】
(ステップS3) 分析サーバ30において、自動化プロセス情報200に基づくプロセスのアクティベーションが実行されて当該プロセスがアクティブ状態に移行した後、自動化プロセス情報200に含まれるシーケンステーブルに従って、受信部101が指定されたサービス要求を受信する。
【0035】
(ステップS4) 受信部101は、サービス実行要求を受信すると、当該サービス実行要求を所定のサービス実行部102に転送する。
【0036】
(ステップS5) サービス実行部102は、受信部101から受信したサービス実行要求に基づいたプロセスを実行する。このとき、サービス実行部102は、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に従ってプロセスを実行する。具体的には、サービス実行部102は、自動化プロセス情報200のシーケンステーブル内の開始、終了及び繰返し条件に従って、プロセスの実行結果の出力からプロセスの開始、終了及び繰返しについての条件判定を行う。サービス実行部102は、当該条件判定の結果に従って、プロセスの開始、終了及び繰返しを行う。サービス実行部102は、プロセスの実行結果であるサービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果を履歴記録部103へ通知する。
【0037】
(ステップS6) 履歴記録部103は、サービス実行部102から通知されたサービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果を含む履歴情報を、自動化プロセス情報200のデータベース情報を用いて履歴蓄積部60へ送信する。
【0038】
(ステップS7) 履歴記録部103は、サービス実行部102から通知された実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果」を送信部104へ送信する。
【0039】
(ステップS8) 送信部104は、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に示される次のプロセスを実行する他のサーバ(ここでの例では、対処判断サーバ40)へ、履歴記録部103から受信した実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果」を送信すると共にサービス実行要求を送信する。
【0040】
対処判断サーバ40の受信部101は、分析サーバ30から実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果」及びサービス実行要求を受信する。以降、対処判断サーバ40において、ステップS3以降の処理が実行される。
【0041】
なお、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に示されるプロセスの終了条件が満たされると、当該自動化プロセス情報200によるプロセスが終了される。このプロセスの終了時においても、サービス実行部102の実行結果が履歴情報として履歴記録部103から履歴蓄積部60へ送信されて履歴蓄積部60に格納される。
【0042】
図3を参照して、本実施形態に係る自動化方法の一例を説明する。
図3は、本実施形態に係る自動化方法の一例を説明するための説明図である。各サーバ20,30,40,50において、自動化プロセス情報200に基づくプロセスのアクティベーションが実行されて当該プロセスがアクティブ状態に移行した後、当該自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に従って、順次、複数のサーバ20,30,40,50でプロセスが実行される。
【0043】
まず収集サーバ20においてサービス実行部102が、通信ネットワークNWの監視データを収集する。次いで、収集サーバ20の送信部104が、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(スライスAのPMデータ)」及びサービス実行要求を、次のプロセスを実行する分析サーバ30へ送信する。
【0044】
次いで、分析サーバ30において、収集サーバ20から受信した実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(スライスAのPMデータ)」及びサービス実行要求に基づいて、サービス実行部102が分析を行う。次いで、分析サーバ30の送信部104が、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードaのメモリ不足)」及びサービス実行要求を、次のプロセスを実行する対処判断サーバ40へ送信する。このとき、分析サーバ30の送信部104は、収集サーバ20から受信した実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(スライスAのPMデータ)」に追記する形式で、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードaのメモリ不足)」を記載した実行結果情報を作成し、当該実行結果情報を対処判断サーバ40へ送信する。
【0045】
次いで、対処判断サーバ40において、分析サーバ30から受信した実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードaのメモリ不足)」及びサービス実行要求に基づいて、サービス実行部102が対処判断を行う。次いで、対処判断サーバ40の送信部104が、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノード追加)」及びサービス実行要求を、次のプロセスを実行する対処実行サーバ50へ送信する。このとき、対処判断サーバ40の送信部104は、
図3に例示されるように、分析サーバ30から受信した実行結果情報300に追記する形式で、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノード追加)」を記載した実行結果情報300を作成し、当該実行結果情報300を対処実行サーバ50へ送信する。
【0046】
次いで、対処実行サーバ50において、対処判断サーバ40から受信した実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノード追加)」及びサービス実行要求に基づいて、サービス実行部102が対処実行を行う。次いで、対処実行サーバ50の送信部104が、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードa’追加)」及びサービス実行要求を、次のプロセスを実行する他のサーバ(例えば分析サーバ30)へ送信する(図示せず)。このとき、対処判断サーバ40の送信部104は、
図3に例示されるように、対処判断サーバ40から受信した実行結果情報300に追記する形式で、自己のサービス実行部102の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードa’追加)」を記載した実行結果情報300を作成し、当該実行結果情報300を、次のプロセスを実行する他のサーバ(例えば分析サーバ30)へ送信する。
【0047】
図3の自動化方法の例では、通信ネットワークNWに発生した障害に対して、障害自動復旧処理の一連のプロセスが自動化プロセス情報200に基づいて複数のサーバ20,30,40,50の連携により実行される。また、実行結果情報300は、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に示されるプロセスの実行の順番に従って、各サーバ20,30,40,50のサービス実行部102の実行結果が順次追加されて、順次転送される。そして、各サーバ20,30,40,50は、自己が受信した実行結果情報300に基づいて、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に従って自己のプロセスの実行条件を判断する。例えば、
図3の例において、対処判断サーバ40のサービス実行部102は、分析サーバ30の実行結果「サービスの実行時間、プロセスID、実行サービス名及び実行サービスの結果(ノードaのメモリ不足)」に基づいて、自動化プロセス情報200のシーケンステーブル(自動化シーケンス)に従って通信ネットワークNWに発生した当該障害に対してはノードaのメモリ追加では対処することができないと判断し、別の対処方法である「ノード追加」によって対処すると判断する。
【0048】
図4及び
図5は、本実施形態に係る自動化プロセス情報200の構成例を示す図である。自動化プロセス情報200は、シーケンステーブル及びデータベース情報を有する。
図4及び
図5には、自動化プロセス情報200のうちシーケンステーブルの例が示される。なお、自動化プロセス情報200には、データベース情報として、履歴蓄積部60のホスト名、ログイン情報(ログインのための識別子(ログインID)及びパスワード)、データベース名、テーブル名等が記載される。
【0049】
図4及び
図5においてシーケンステーブルには、シーケンス番号「NO」毎に、機能名(サーバ名)、実行サービス名、実行結果情報及びサービス実行要求を受信する元(送信元)及び送信する先(送信先)の各IPアドレス及び条件が格納される。シーケンステーブルにおいて、送信元には、サービス要求元に関する条件を指定することができる。また、送信先には、実行結果情報及びサービス実行要求を送信する宛先を指定する。条件には、自己のシーケンス番号におけるプロセスの開始、終了及び繰返し条件が定義される。通常、シーケンス番号「NO=1」から順番に各機能のサービスが実行される。
【0050】
なお、送信元及び送信先については、IPアドレスに限定されず、例えば「REST API」のURIや「pub/subメッセージング」のトピック名等でも指定することができる。
【0051】
また、一つの自動化プロセス情報200において、複数のシーケンステーブルが定義されてもよい。この場合、シーケンステーブル毎に固有のプロセス名が付与される。
【0052】
図4に例示される自動化プロセス情報200は、通信ネットワークNWの障害が検知されたときに、当該障害に対して自動的に対処して復旧させるためのプロセスのシーケンステーブル(自動化シーケンス)「auto-001」が定められたものである。具体的には、シーケンステーブル「auto-001」では、シーケンス番号「NO=1」において、スライスAパフォーマンス分析の実行結果が「normal」の場合に同じシーケンス番号「NO=1」を繰り返し実行し、一方、「normal」以外の場合にはプロセスID「process_id」がセットされてプロセス開始となる。次いでシーケンス番号「NO=2」の各対処判断、次いでシーケンス番号「NO=3」の各対処実行を行った後、シーケンス番号「NO=3」の繰返し条件の指定に従ってシーケンス番号「NO=1」に戻ってスライスAパフォーマンス分析を行い、このスライスAパフォーマンス分析の結果が「normal」であればプロセスを終了する。
【0053】
図5に例示される自動化プロセス情報200は、通信ネットワークNWが新規に構築されたときに、当該新規の通信ネットワークNWの品質を測定して自動的に最適化するためのプロセスのシーケンステーブル(自動化シーケンス)「auto-002」が定められたものである。例えば、構築当初は、仮の設定パラメータで通信ネットワークNWを構築し、構築後の実測値を基にリソース設定等を自動的にチューニングすることが挙げられる。
【0054】
具体的には、シーケンステーブル「auto-002」では、シーケンス番号「NO=1」において、スライスB構築の実行結果が「processing」の場合に同じシーケンス番号「NO=1」を繰り返し実行し、一方、「completed」の場合にはプロセスID「process_id」がセットされてプロセス開始となる。次いでシーケンス番号「NO=2」のスライスBパフォーマンス分析を行い、スライスBパフォーマンス分析の実行結果が「normal」であればプロセスを終了する。一方、スライスBパフォーマンス分析の実行結果が「normal」以外の場合には、次いでシーケンス番号「NO=3」の各対処判断、次いでシーケンス番号「NO=4」の各対処実行を行った後、シーケンス番号「NO=4」の繰返し条件の指定に従ってシーケンス番号「NO=2」に戻る。
【0055】
本実施形態によれば、複数のサーバ20,30,40,50が連携して自動的に障害自動復旧処理の一連のプロセスを実行する際の当該一連のプロセスの実行に関する履歴情報を蓄積することができる。これにより、障害自動復旧処理の一連のプロセスに関する履歴情報(例えば、収集機能、分析機能、対処判断機能及び対処実行機能の各履歴情報)をナレッジとして活用することができるという効果が得られる。
【0056】
また本実施形態によれば、以下に示す効果が得られる。
(1)自動化システムにおいて、自動化プロセス情報を定義し、この自動化プロセス情報に従ってプロセス単位で各サービスの実行履歴を記録し、当該実行履歴をナレッジとして蓄積することによって、有効な手順の再利用や解析による各プロセスの改善を図ることができる。例えば、障害を自動的に復旧させるための
図4に例示される分析、対処判断及び対処実行から構成される一連のプロセスの実行履歴の中から、プロセスの開始(
図4中の「start」)から終了(
図4中の「end」)までに一定時間以上要した実行履歴を抽出して分析することによって、その傾向(例えば、「分析結果=“メモリ不足”」のケースが多いこと)を把握し、改善策(例えば、「メモリ不足」に対する対処判断ルールの見直し等)を講じることができる。
【0057】
(2)自動化プロセス情報に従いリアルタイムのプロセスの実行履歴を記録することによって、当該自動化プロセス情報による一連のプロセスの中において各サービス実行部が直近の履歴を参照してサービスを実行することができ、これにより効率的に自動化システムの処理の目標を達成することができる。例えば、障害を自動的に復旧させるための
図4に例示される分析、対処判断及び対処実行が繰り返されている一連のプロセスの実行中において、対処実行により同じ対処として例えば「ノードaの再起動」が一定回数以上繰り返し実行され、且つ障害が復旧しない場合に、次の対処判断において当該対処判断「ノードaの再起動」を除外して対処判断を行うことによって、異なる対処判断の結果として例えば「ノードaの削除又は再構築」)を得ることができる。そして、当該対処の実行によって効率的に障害を復旧させることができるという効果が得られる。
【0058】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0059】
上述した実施形態では、自動化システムとして障害自動復旧システムを例に挙げたが、障害自動復旧システム以外の他のシステムに適用してもよい。
【0060】
また、上述した各装置の機能を実現するためのコンピュータプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するようにしてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disc)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0061】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【符号の説明】
【0062】
1…障害自動復旧システム(自動化システム)、10…自動化管理制御装置、11…プロセス定義部、12…管理制御部、20…収集サーバ、30…分析サーバ、40…対処判断サーバ、50…対処実行サーバ、60…履歴蓄積部、101…受信部、102…サービス実行部、103…履歴記録部、104…送信部