(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022165798
(43)【公開日】2022-11-01
(54)【発明の名称】対策選定装置、システム及び対策選定方法
(51)【国際特許分類】
G06Q 10/00 20120101AFI20221025BHJP
G06Q 50/10 20120101ALI20221025BHJP
【FI】
G06Q10/00
G06Q50/10
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021071306
(22)【出願日】2021-04-20
(71)【出願人】
【識別番号】502129933
【氏名又は名称】株式会社日立産機システム
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】中野 亮
(72)【発明者】
【氏名】木原 一
(72)【発明者】
【氏名】白根 一登
(72)【発明者】
【氏名】山田 大樹
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA01
5L049CC11
(57)【要約】
【課題】復旧要件に則した対策を自動的に選定し、優先度を付して出力する。
【解決手段】自装置又は他装置で発生した障害に対する復旧対策を決定する装置であって、前記発生した障害に対する復旧対策候補を選定する対策候補選定部と、復旧対策において重視される事項である1以上の評価指標に対する対策別の評価値を管理する対策評価値管理部と、前記復旧対策候補の優先度を1以上の評価指標に基づいて決定する対策優先度決定部と、前記決定された優先度を付して復旧対策候補を出力する出力部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
自装置又は他装置で発生した障害に対する復旧対策を決定する対策選定装置であって、
前記発生した障害に対する復旧対策候補を選定する対策候補選定部と、
復旧対策において重視される事項である1以上の評価指標に対する対策別の評価値を管理する対策評価値管理部と、
前記復旧対策候補の優先度を1以上の前記評価指標に基づいて決定する対策優先度決定部と、
前記決定された優先度を付して復旧対策候補を出力する出力部とを備えることを特徴とする対策選定装置。
【請求項2】
請求項1に記載の対策選定装置であって、
前記評価指標毎の優先度を示す加重値を含む復旧要件、及び前記復旧要件の適用先の装置を管理する復旧要件管理部とを備え、
前記対策優先度決定部は、前記対策候補選定部によって選定された復旧対策候補別に、復旧対象となる装置に適用される前記復旧要件における前記加重値を反映した前記評価値の合計値を算出し、前記算出された合計値が高ければ前記復旧対策候補の優先度が高くなるように優先度を決定することを特徴とする対策選定装置。
【請求項3】
請求項1に記載の対策選定装置であって、
前記評価指標は、障害復旧に要するコストを最小化する指標又は時間を最小化する指標を含むことを特徴とする対策選定装置。
【請求項4】
請求項2に記載の対策選定装置であって、
前記対策別かつ前記評価指標別の評価値と、前記復旧要件別かつ前記評価指標別の加重値と、前記復旧要件の適用先の装置との入力を受け付ける入力部を更に備えることを特徴とする対策選定装置。
【請求項5】
請求項2に記載の対策選定装置であって、
前記復旧要件管理部は、所定の条件に応じて切り替えられて前記装置に適用される復旧要件を管理することを特徴とする対策選定装置。
【請求項6】
請求項5に記載の対策選定装置であって、
前記所定の条件は、時刻の条件又は前記装置の動作状態の条件を含むことを特徴とする対策選定装置。
【請求項7】
請求項2に記載の対策選定装置であって、
前記対策評価値管理部は、
対策実行時の復旧結果及び前記評価指標の実績値を記録し、
前記対策別かつ前記評価指標別の前記実績値の平均値を算出し、
前記平均値に基づいて前記対策別の評価値を算出して登録することを特徴とする対策選定装置。
【請求項8】
請求項2に記載の対策選定装置であって、
前記復旧要件管理部は、前記復旧要件毎に前記評価指標が満たすべき下限評価値を管理し、
前記対策優先度決定部は、前記下限評価値を満たさない対策を候補から除外することを特徴とする対策選定装置。
【請求項9】
システムを構成する装置と、
前記装置で発生した障害に対する復旧対策を決定する管理装置を備えるシステムであって、
前記管理装置は、
前記発生した障害に対する復旧対策候補を選定する対策候補選定部と、
復旧対策において重視される事項である1以上の評価指標に対する対策別の評価値を管理する対策評価値管理部と、
前記復旧対策候補の優先度を1以上の評価指標に基づいて決定する対策優先度決定部と、
前記決定された優先度を付して前記復旧対策候補を出力する出力部とを有することを特徴とするシステム。
【請求項10】
自装置又は他装置で発生した障害に対する復旧対策を決定する対策選定方法であって、
前記発生した障害に対する復旧対策候補を選定する対策候補選定手順と、
復旧対策において重視される事項である1以上の評価指標に対する対策別の評価値を管理する対策評価値管理手順と、
前記復旧対策候補の優先度を1以上の評価指標に基づいて決定する対策優先度決定手順と、
前記決定された優先度を付して前記復旧対策候補を出力する出力手順とを備えることを特徴とする対策選定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対策選定装置に関する。
【背景技術】
【0002】
近年、工場等の現場装置に関するデータを通信機能を用いて収集し、設備や機器の遠隔監視・制御等を行うシステムが提供されている。一方、接続機器の増加や、システムの複雑化に伴い、障害発生時の対策工数が増大しており、復旧対策立案の自動化が求められている。しかし、発生した障害に対して複数の復旧対策案がある場合、最適な対策は各システムの要件に応じて様々である。例えば、システムの一部に障害が発生した際の対策選定基準として、早期復旧を目指す時間優先のケースや、時間を要しても他のシステム領域に影響を及ぼさないことを優先する稼働率優先のケース等がある。その他、作業者を極力現場へ派遣せずに遠隔対応すること優先する人的コスト優先のケースなどもある。これらの様々な評価指標に関する復旧要件を考慮し、当該要件に則した適切な対策を選定して講じることは、システムの稼働率の向上や、運用コストの低減等の観点で重要である。
【0003】
そこで、発生した障害に対する復旧対策の選定において、各対策の安定性・安全性を考慮した選定を支援する技術がある。特許文献1(特開2020-86474号公報)には、通信ネットワークを構成する機器群で発生した異常から復旧するための作業手順を示す復旧作業列に基づいて、前記復旧作業列に対する所定の指標値を計算する指標値計算手段と、前記指標値計算手段により計算された指標値を所定の出力先に出力する出力手段と、を有することを特徴とする復旧支援装置が記載されている(請求項1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載された背景技術では、安定性や安全性が考慮されているが、前述のコストに関する評価指標など、システム毎に異なる顧客やオペレータの志向まで考慮して対策が選定されていない。実際の運用上は、これらの任意評価指標も柔軟に考慮した対策の選定が望ましい。また、安定性や安全性に関する評価値の出力によって、作業者による対策選定を促しているが、例えば安定性と安全性のどちらを重視すべきかは、システムの運用ポリシー等に依存する。そのため、評価値の組み合わせから最適な対策を選定するには、システムに対する一定の知識や作業経験が必要となる。知識や経験が乏しい作業者でも、復旧対策を実行できるようにするためには、各対策の評価値だけでなく、所定要件の観点に基づく対策優先度や順位まで出力して、講じるべき対策を一意に示す事が望ましい。
【0006】
本発明は、前述した課題に鑑みてなされたものであり、発生障害に対して任意の復旧要件に則した対策を自動的に選定し、講じるべき対策を優先度を付して提示する事を目的とする。
【課題を解決するための手段】
【0007】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、自装置又は他装置で発生した障害に対する復旧対策を決定する装置であって、前記発生した障害に対する復旧対策候補を選定する対策候補選定部と、復旧対策において重視される事項である1以上の評価指標に対する対策別の評価値を管理する対策評価値管理部と、前記復旧対策候補の優先度を1以上の評価指標に基づいて決定する対策優先度決定部と、前記決定された優先度を付して復旧対策候補を出力する出力部とを備えることを特徴とする。
【発明の効果】
【0008】
本発明の一態様によれば、復旧要件に則した対策を自動的に選定し、優先度を付して出力できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
【図面の簡単な説明】
【0009】
【
図1】実施例1のシステム構成と各装置のハードウェア構成を説明する図である。
【
図2】実施例1の管理装置の装置情報管理部で管理される装置情報管理テーブルの構成例を示す図である。
【
図3】実施例1の管理装置の対策候補選定部で管理される対策候補管理テーブルの構成例を示す図である。
【
図4】実施例1の管理装置の対策評価値管理部で管理される評価値管理テーブルの構成例を示す図である。
【
図5】実施例1の管理装置の復旧要件管理部で管理される復旧要件加重値管理テーブルの構成例を示す図である。
【
図6】実施例1の管理装置の復旧要件管理部で管理される復旧要件適用管理テーブルの構成例を示す図である。
【
図7】実施例1における障害発生時の対策選定処理のフローチャートである。
【
図8】実施例1において対策候補及び優先度情報を出力する画面表示例を示す図である。
【
図9】実施例1において管理装置で管理される各種テーブルの情報を設定するための画面表示例を示す図である。
【
図10】実施例2の管理装置の復旧要件管理部で管理する復旧要件適用管理テーブルの構成例を示す図である。
【
図11】実施例3の管理装置の対策評価値管理部で管理される対策実績管理テーブルの構成例を示す図である。
【
図12A】実施例3の管理装置の対策評価値管理部で管理する評価値管理テーブルの構成例を示す図である。
【
図12B】実施例3の実績統計値から評価値への変換関数の例を示す図である。
【
図13】実施例3における障害発生時の対策選定処理のフローチャートである。
【
図14】実施例4の管理装置の復旧要件管理部が管理する復旧要件加重値管理テーブルの構成例を示す図である。
【
図15】実施例4における障害発生時の対策選定処理のフローチャートである。
【
図16】実施例5における装置のハードウェア構成を示す図である。
【
図17】実施例5における障害発生時の対策選定処理のフローチャートである。
【発明を実施するための形態】
【0010】
まず、本発明の実施例のシステムの概要について説明する。
【0011】
発生障害に対する復旧対策を決定する管理装置では、対策候補選定部が障害内容別の対策一覧情報を管理情報として管理し、対策評価値管理部が当該対策毎に対策所要時間及びコストなどの任意評価指標別の評価値を管理する。また、復旧要件管理部が、各復旧要件に対して評価指標別の優先度を加重した加重値を管理し、さらに、管理対象装置毎に適用される復旧要件を管理する。
【0012】
そして、実際に障害発生を示すアラートの受信等によって、障害発生を検知すると、最初に、対策候補選定部が、発生した障害に対応した対策候補を選定する。次に、復旧要件管理部が、復旧対象となる管理対象装置に適用される復旧要件を参照し、更に当該復旧要件に定義された評価指標別の加重値を取得する。続いて、管理装置の対策優先度決定部が、当該復旧要件に則った各対策候補の優先度を決定する。具体的には、対策評価値管理部が管理する評価指標別の評価値に、加重値を反映した(各評価値に対して加重値に応じた重みを乗じた)合計評価値を対策候補毎に算出し、当該合計評価値を対策優先度として、値が高い順に各対策候補の優先順位を決定する。優先すべき評価指標に対して、高い評価値を持つ対策である程、合計評価値も高く算出されるため、復旧要件に則した対策を高い優先度で選定できる。最後に、出力部が、対策優先度(又は優先順位)と共に、対策候補を出力する。
【0013】
このような対策選定処理によって、任意の優先すべき評価指標を持つ復旧要件に応じて、適切な対策候補を自動的に選定し出力できる。また、優先度が付された対策候補が自動的に出力されるため、知識や経験に乏しい作業者でも、優先して講じるべき対策を明確に判断でき、適切な障害復旧作業が可能となる。
【0014】
以下、本発明の実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0015】
以下の説明では、情報を「AAAテーブル」の表現にて説明することがあるが、情報はどのようなデータ構造で構成されてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」を「AAA情報」とすることができる。
【0016】
【0017】
<実施例1>
実施例1では、発生障害に対する対策選定処理の基本形を説明する。まず、
図1を参照して、システム構成と各装置の構成を説明する。次に、
図2~
図6を参照して、管理装置が管理するテーブル、すなわち情報を説明する。その後、
図7を参照して、対策選定処理の流れを説明し、
図8及び
図9を参照して、対策選定結果の出力及び情報の入力に関する画面表示例を説明する。
【0018】
以下の実施例の説明において、構成要素を分けて説明する必要がない場合は、添字を付さずに(例えば、装置101)と記載し、構成要素を分けて説明する場合は、添字を付して(例えば、装置101-a)と記載する。
【0019】
まず、
図1を参照して、実施例1のシステム構成と各装置のハードウェア構成を説明する。
【0020】
図1に記載されるシステムは、管理対象となる複数の装置101(101-a~101-c)と、管理装置102とを含んで構成される。装置101と管理装置102は有線通信又は無線通信によって接続されており、装置101は設置現場から取得したデータや、自装置の稼働情報やアラート等を管理装置102へ送信する。管理装置102は、装置101から受信したデータを活用したサービスを提供し、アラートの受信等によって装置101における障害発生を検知し、復旧に向けた対策を選定及び出力する。尚、
図1では、装置101-aと装置101―bから構成されるシステムAと、装置101-cから構成されるシステムBが存在し、これらの複数システムを1台の管理装置102で管理する構成を例示しているが、システム毎に1台の管理装置102を設ける構成でもよい。また、管理装置102は、装置101と同一の現場に設置する他、クラウド上など別拠点に設置する構成でもよい。
【0021】
次に、装置101のハードウェア構成を説明する。装置101は、前述の通り、現場から取得したデータや、自装置の稼働情報等をパケットに格納して送信し、管理装置102との通信機能を有する装置である。装置101は、取得するデータの種類に応じて種々の構成を有する。例えば、現場の温度を計測する温度計測装置、現場の映像を取得するカメラ装置などの他、現場に存在する他の機器からデータを集約して送信する集約装置などである。
図1において、装置101は、通信I/F111、CPU112及び記憶装置113を有する。
【0022】
通信I/F111は、例えば、無線通信を介して管理装置102とパケットを送受信する場合、デジタルデータと無線信号とを相互に変換し、デジタルデータを無線信号に変換して送信する送信部と、受信した無線信号からデジタルデータを抽出する受信部を有する。装置101が、管理装置102だけでなく、現場に存在する他の機器ともパケットを送受信する場合、複数の通信I/F111を搭載してもよい。これらの通信手段はEthernet(登録商標)、WiFi(登録商標)、電話網、光回線など任意のものでよい。
【0023】
CPU112は、記憶装置113に格納されている各種コンピュータプログラムを実行する演算装置であり、これによって装置101が有する各種機能が実現される。なお、CPU112がコンピュータプログラムを実行して行う処理の一部を、他の演算装置(例えば、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェア)で実行してもよい。
【0024】
記憶装置113は、例えば読み出し専用の半導体メモリ(ROM)などから構成される記憶装置と、書き換え可能な半導体メモリ(RAM)などから構成される記憶素子を有し、各種処理を実現するコンピュータプログラムや、取得したデータなどを格納する。記憶装置113は、不揮発性記憶媒体(磁気ディスクドライブ、不揮発性メモリ等)を有してもよい。
【0025】
アプリケーションプログラム114は、データの取得方法や送信スケジュールなどの各種設定を管理し、内部バスを介して接続されたCPU112による取得処理や、通信処理部115への送信命令を実行する。その他、自装置の障害発生を通知するアラートの生成ルール(CPU使用率が閾値を超過した際にアラートを生成など)を管理し、障害発生時に通信処理部115へアラートの送信命令を実行する機能などを有してもよい。
【0026】
通信処理部115は、通信における送受信処理を実行する。具体的には、送信すべきパケットの組立処理や、受信したパケットが自装置宛か否かの判定等のパケット解析処理を実行する。尚、装置101は独立した装置でも、組み込み機器でもよい。また、装置101は、前述の通り、取得する現場データの種類に応じた様々な構成が可能であり、例えば温度センサやカメラモジュールなども備えてもよい。
【0027】
続いて、管理装置102のハードウェア構成を説明する。管理装置102は、通信I/F121、CPU122、入力部123、出力部124及び記憶装置125を有する。通信I/F121と、CPU122及び記憶装置125は、前述した装置101の通信I/F111、CPU112及び記憶装置113とハードウェア的に同じである。また、通信処理部127は、前述した装置101の通信処理部115と同じである。
【0028】
管理装置102は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。例えば、アプリケーションプログラム126、通信処理部127、装置情報管理部128、障害検知部129、対策候補選定部130、対策評価値管理部131、復旧要件管理部132及び対策優先度決定部133は、各々別個の物理的又は論理的計算機上で動作するものでも、複数が組み合わされて一つの物理的又は論理的計算機上で動作するものでもよい。
【0029】
入力部123は、例えばキーボードやマウスなどから構成され、作業者が各種操作や設定を入力するために用いられる。出力部124は、例えば液晶ディスプレイモニタなどから構成され、必要な画面や各種処理の結果を表示する。ただし、管理装置102に接続された別の外部機器から管理装置102へリモートログインする形態など、通信I/F121を介して外部機器からの入力情報を受け付け、外部機器へ出力情報を提供する場合は、入力部123及び出力部124は管理装置102に搭載されなくてもよい。
【0030】
アプリケーションプログラム126は、収集データを活用したサービスをユーザに提供するプログラムである。例えば、装置101から受信した現場データ(例えば温度)の単位時間当たりの平均値を提供するプログラムは、収集したデータ値から平均値を算出するなどのデータ解析処理を実行する。その他、装置101からのデータ送信スケジュールを遠隔設定及び遠隔管理するプログラムなども、アプリケーションプログラム126に含まれてもよい。
【0031】
装置情報管理部128は、各装置101が属するシステムを管理する。各装置101が属するシステムを管理するために、装置情報管理部128は、
図2で後述する装置情報管理テーブル128aを管理する。ただし、システム毎に1台の管理装置102を設ける場合、装置101が属するシステムが自明であるため、装置情報管理部128を省略できる。
【0032】
障害検知部129は、装置101から受信した情報に基づいて、装置101の障害発生を検知する。障害の検知方法は特定の方法に限定されるものではなく、任意の方法でよい。例えば、装置101から障害発生を通知するアラートの受信による障害検知や、装置101から受信した稼働情報の解析による障害検知などがある。
【0033】
対策候補選定部130は、障害検知部129で検知された障害に対する対策候補を選定する。対策候補選定部130は、対策候補を選定するために、
図3で後述する対策候補管理テーブル130aを管理する。
【0034】
対策評価値管理部131は、障害に対する対策毎に、評価指標別に評価値を管理する。評価指標の数や種別は任意であり、例えば、対策実行時に発生する人的コスト及び物的コスト、通信途絶時間、対策所要時間など、所定の復旧要件に関わる任意の評価指標を設けてもよい。対策評価値管理部131は、当該評価指標別の対策の評価値を管理するために、
図4で後述する評価値管理テーブル131aを管理する。
【0035】
復旧要件管理部132は、復旧要件に関する情報を管理し、具体的には各復旧要件に対して評価指標毎の優先度を加重値として管理する。復旧要件管理部132は、当該加重値情報を管理するために、
図5で後述する復旧要件加重値管理テーブル132aを管理する。さらに、復旧要件管理部132は、
図6で後述する復旧要件適用管理テーブル132bによって、各装置101に適用される復旧要件の一覧を管理する。
【0036】
対策優先度決定部133は、対策候補選定部130によって選定された対策候補毎に、所定の復旧要件に従って実行優先度を算出する。当該優先度は、評価値や加重値を使用して算出し、詳細は
図7で後述する。対策優先度決定部133は、対策候補毎の優先度を算出した後、出力部124を介して発生した障害に対する対策候補と共に、当該優先度情報を出力する。
【0037】
図2を参照して、管理装置102の装置情報管理部128で管理される装置情報管理テーブル128aについて説明する。装置情報管理テーブル128aは、各装置101がどのシステムに属するかを示す情報を管理する。
図2は、実施例1における装置情報管理テーブル128aの構成を図示する。
【0038】
装置ID201は、装置101の識別子である。具体的には、装置ID201は、装置101のアドレスやホスト名などを記載するフィールドであり、装置101の識別子は、システムで採用している方式に準拠するとよい。IPアドレス、MACアドレス又は独自の識別子で各装置101を識別する場合、それらの識別子を記載してもよい。
図2の例では、装置101の識別子を
図1の添字部分で示す。システムID202は、装置ID201に記載された装置101が属するシステムの識別子である。システムの識別子も各システムで採用している方式に準拠するとよい。
図2の例では、システムの識別子を
図1に記載のシステム名称で示す。
【0039】
装置情報管理テーブル128aを参照することによって、管理装置102の装置情報管理部128は、各装置101が属するシステムを把握でき、
図2の例では装置101-a(装置ID:a)と装置101-b(装置ID:b)がシステムA(システムID:System-A)に属し、装置101-c(装置ID:c)がシステムB(システムID:System-B)に属していることが判別できる。尚、装置情報管理テーブル128aは、システム構築時に作業者が登録したり、装置101が送信するパケットに格納されるシステム情報を通信処理部127のパケット解析処理で取得して、当該情報を自動的に登録してもよい。また、前述の通り、システム毎に1台の管理装置102を設ける場合、装置101が属するシステムが自明であるので、装置情報管理部128を省略できる。
【0040】
図3を参照して、管理装置102の対策候補選定部130で管理される対策候補管理テーブル130aについて説明する。対策候補管理テーブル130aは、障害内容別の対策候補一覧を管理する。
図3は、実施例1における対策候補管理テーブル130aの構成を図示する。
【0041】
障害ID301は、障害内容を区別するための識別子である。障害の識別子の命名規則は任意であり、
図3の例では、「Fault001」のような表記を採用しているが、例えば
図3に併記しているように「電波干渉発生」など具体的な障害内容を識別子に採用してもよい。対策ID302は、障害ID301に記載の障害から復旧するための対策の識別子でる。対策の識別子の命名規則も任意であり、
図3の例では「Counter001」のような表記を採用しているが、例えば
図3に併記しているように「無線チャネル変更」など具体的な対策内容を識別子に採用してもよい。また、
図3に例示するように、一つの障害に対して複数の対策案がある場合は、一つの障害ID301に対して複数の対策ID302をテーブルに登録してもよい。
【0042】
対策候補管理テーブル130aを参照することによって、管理装置120の対策候補選定部130は、発生した障害に応じた対策候補を選定でき、
図3の例では無線通信を用いる装置101の設置現場において、他の機器等に起因する電波干渉による障害の発生を検知した場合、干渉を回避するための「無線チャネル変更」や「設置場所変更」、又は干渉電波を超える強い出力で送信するための「アンテナ交換」などの対策候補を選定すればよいことが判別できる。尚、対策候補管理テーブル130aは、システム構築段階で想定される障害及び対策を登録したり、新規の障害を観測した時点で、対応する対策と合わせて随時追加登録してもよい。
【0043】
図4を参照して、管理装置102の対策評価値管理部131で管理される評価値管理テーブル131aについて説明する。評価値管理テーブル131aは、対策候補管理テーブル130aに登録される対策毎に、復旧要件に関わる評価指標別の評価値を管理する。
図4は、実施例1における評価値管理テーブル131aの構成例を示す。
【0044】
対策ID401は、
図3の対策候補管理テーブル130aの対策ID302と同じ対策の識別子である。対策候補管理テーブル130aと評価値管理テーブル131aとの間で記載される対策が同一である場合、対策IDに記載される識別子は同一である。評価値402は、対策ID401に記載された対策に関する、評価指標別の評価値である。
図4では、評価指標として対策実行時に発生する「人的コスト」(作業者の派遣コスト等)、「物理コスト」(交換部品のコスト等)、「通信断時間」(装置101と管理装置102、又は装置101と他の機器を繋ぐ通信等の途絶時間)、「所要時間」を例示するが、前述の通り、管理される評価指標の数や種別・名称は限定されず、復旧要件として考慮すべき指標に応じて任意に定義するとよい。例えば、特許文献1のように「安定性」等の指標を設けてもよい。
【0045】
また、
図4の例では、評価値を「1~10」の範囲で、値が大きい程、高評価で定義しているが、評価値の範囲も任意に設定してよい。評価値の設定方法も任意であり、特許文献1に記載されるように、過去の復旧情報に基づいて機械学習を用いて評価値を算出したり、評価指標毎に独自基準を設けて評価値を定義してもよい。例えば「通信断時間」の場合、通信途絶無しを評価値10点、途絶時間が数分オーダーを7点、数時間オーダーを4点、1日以上を1点としてもよい。
【0046】
評価値管理テーブル131aを設定することで、各対策がどの指標に優れているかを管理できる。例えば、
図4の「無線チャネル変更」は、遠隔設定変更により作業者を派遣する必要が無く「人的コスト」の指標に優れており、設定変更に伴う装置101の再起動等で一時的な「通信断時間」を伴うことを示している。また、「設置場所調整」は、装置101の再起動を必要としないため、通信途絶が発生せず、「通信断時間」の指標に優れており、設置場所の調整には人手が必要となるため、作業者の派遣又は現場顧客への作業依頼などに伴い、「人的コスト」の指標で「無線チャネル変更」による対策に劣ることを示している。本例では、復旧要件として「人的コスト」と「通信断時間」のどちらを優先するかに応じて、「無線チャネル変更」と「設置場所調整」の何れの対策を選定すべきかが異なり、当該評価値情報を参照することによって、復旧要件に則した対策の優劣を比較できる。尚、評価値管理テーブル131aは、システム構築段階で登録しても、システム運用中の任意のタイミングで登録や更新してもよい。
【0047】
図5を参照して、管理装置102の復旧要件管理部132で管理される復旧要件加重値管理テーブル132aについて説明する。復旧要件加重値管理テーブル132aは、各復旧要件における評価指標毎の優先度合いを管理する。具体的には、評価指標毎の優先度を評価値に対する加重値として定義し、評価指標の優先度が高ければ、高い加重値を設定する。
図5は、実施例1における復旧要件加重値管理テーブル132aの構成例を示す。
【0048】
復旧要件ID501は、復旧要件を区別するための識別子である。当該識別子の命名規則は任意であり、
図5の例では「Policy001」のような表記を採用しているが、例えば
図5に併記しているように「コスト優先」など復旧要件の方針を示す名称で登録してもよい。加重値502は、復旧要件ID501に記載の復旧要件における評価指標毎の優先度を、前記評価値に対する加重値として表現したものである。
図5の例では加重値を「0~1」の範囲で定義しているが、加重値の範囲は任意に設定してよい。
【0049】
例えば、
図5の例において、システム稼働率を優先する復旧要件「Policy002」では、「通信断時間」の評価指標に対する加重値が他の指標より高く設定されており、通信途絶によるシステムの稼働停止を最優先で抑えるという復旧要件を反映している。
図5の例では、他の評価指標の加重値を「0.1」に設定しているが、他の評価指標を全く考慮する必要が無い場合は加重値を「0」に設定してもよい。一方、例えばシステムの稼働停止時間に応じて、顧客にペナルティコストを支払う場合、コストを優先する復旧要件「Policy001」においても、「通信断時間」の評価指標を考慮することが望ましい。その場合、
図5に例示するように、「通信断時間」の加重値を少し高く設定することで、コストに直結する「人的コスト」や「物理コスト」の指標を最優先としつつ、「通信断時間」も考慮した復旧要件を設定できる。復旧要件毎に異なる細かい優先度合いを、加重値として柔軟に定義することで、システムの運用ポリシーや顧客志向に合わせた任意の復旧要件を、復旧要件加重値管理テーブル132aにて表現及び管理できる。尚、復旧要件加重値管理テーブル132aは、システム構築段階で登録しても、システム運用中の任意のタイミングで登録や変更してもよい。
【0050】
図6を参照して、管理装置102の復旧要件管理部132で管理される復旧要件適用管理テーブル132bについて説明する。復旧要件適用管理テーブル132bは、装置101毎に適用される復旧要件を管理する。
図6は、実施例1における復旧要件適用管理テーブル132bの構成例を示す。
【0051】
装置ID601及びシステムID602は、装置101の識別子、及び所属するシステムの識別子である。
図2の装置情報管理テーブル128aの説明で述べた通り、当該識別子の形式は任意である。尚、装置ID601のフィールドに装置101の識別子が記載され、且つシステム間で装置101の識別子の重複が無い場合、装置ID601で装置101を一意に特定できるため、システムID602は空欄でもよい。また、システム毎に1台の管理装置102を1台設ける場合、各装置101が属するシステムが自明であるため、システムID602のフィールドを省略できる。
【0052】
復旧要件ID603は、装置ID601に記載の装置101、及びシステムID602に記載のシステムに適用される復旧要件の識別子である。復旧要件ID603に記載される識別子は、
図5の復旧要件加重値管理テーブル132aの復旧要件ID501に記載される識別子の中から選択される。尚、あるシステムに属する全装置101に同一の復旧要件を適用する場合、
図6に例示する通り、システムID602のフィールドでシステムの識別子を指定して、装置ID601の欄にワイルドカード「*」を指定してもよい。特に、多数の装置101が同一システムに属し、装置ID601に全装置101の識別子の記載が面倒である場合に有効である。勿論、同一システムに属する複数の装置101に対して、
図6のように異なる復旧要件を適用してもよい。
【0053】
図7を参照して、管理装置102による対策選定処理について説明する。大まかな処理の流れとして、管理装置102では、障害検知部129が装置101の障害発生を検知すると、発生した障害に対する対策候補を対策候補選定部130が選定する。その後、対策優先度決定部133が対策候補毎に復旧要件に応じた対策優先度を決定し、出力部124が当該優先度情報が付された対策候補を出力する。
図7は、実施例1における当該対策選定処理のフローチャートであり、以下詳細を説明する。
【0054】
図7のステップS701では、管理装置102の障害検知部129が、装置101における障害発生を検知する。前述の通り、障害検知方法は、アラート受信に基づく検知など任意であり、障害発生を検知した場合(YES)は、ステップS702に進む。この時、管理装置102が、複数システムを統合管理している場合、装置情報管理部128で管理される
図2の装置情報管理テーブル128aを参照し、障害発生元の装置101が属するシステム情報を取得する。障害が検知されない場合(NO)は、任意の時間の経過後に再度ステップS701の処理を実行する。
【0055】
ステップS702では、対策候補選定部130が、
図3の対策候補管理テーブル130aを参照し、ステップS701で検知された障害に対する対策候補を選定する。例えば、障害内容が「電波干渉発生」であれば、
図3の対策候補管理テーブル130aによると、「無線チャネル変更」、「設置場所調整」、「アンテナ交換」の三つの対策候補が選定される。ステップS702の処理が終了すると、ステップS703に進む。
【0056】
ステップS703では、復旧要件管理部132が、
図6の復旧要件適用管理テーブル132bを参照し、ステップS701で検知された障害発生元の装置101に適用される復旧要件を取得する。例えば、障害発生元の装置101が装置101-a(装置ID:a)である場合、
図6の例では「Policy001(コスト優先)」の復旧要件が取得される。ステップS703の処理が終了すると、ステップS704に進む。
【0057】
ステップS704では、復旧要件管理部132が、
図5の復旧要件加重値管理テーブル132aを参照し、ステップS703で取得した適用復旧要件における各評価指標に対する加重値を取得する。前述した例では、適用復旧要件は「Policy001」であるため、
図5の例では、「評価指標1(人的コスト):1、評価指標2(物理コスト):1、評価指標3(通信断時間):0.5、評価指標4(所要時間):0.1」の加重値が取得される。ステップS704の処理が終了すると、ステップS705に進む。
【0058】
ステップS705は、対策優先度決定部133が、対策評価値管理部131によって管理される
図4の評価値管理テーブル131aを参照し、ステップS702で選定された対策候補毎の評価値を取得し、ステップS704で取得した加重値を反映した合計評価値を算出する。具体的には、N種類の評価指標が存在する場合、評価指標i(1≦i≦N)に関する対策の評価値をxi、適用復旧要件における加重値をyiとした時、合計評価値は次式にて定義される。
合計評価値=(x1×y1)+…+(xi×yi)+…+(xN×yN)
【0059】
前述した例の場合、適用される復旧要件「Policy001」の加重値が「評価指標1:1、評価指標2:1、評価指標3:0.5、評価指標4:0.1」であり、
図4の例における「Counter001(無線チャネル変更)」の評価値は「評価指標1:10、評価指標2:10、評価指標3:7、評価指標4:10」であるため、「無線チャネル変更」に関する合計評価値は24.5(=10×1+10×1+7×0.5+10×0.1)と算出される。同様に、「Counter002(設置場所調整)」の合計評価値は20.5(=5×1+10×1+10×0.5+5×0.1)、「Counter003(アンテナ交換)」の合計評価値は9.6(=1×1+5×1+7×0.5+1×0.1)と算出される。ステップS705の処理が終了すると、ステップS706に進む。
【0060】
ステップS706では、対策優先度決定部133が、合計評価値を対策優先度とし、当該値が高い順に各対策候補の優先順位を決定する。優先順位を決定した後、決定された優先順位又は対策優先度(合計評価値)と共に、ステップS702で選定された対策候補を出力部124より出力する。尚、出力に関する画面表示例は
図8で後述する。
【0061】
前述した例の場合、コスト優先の復旧要件「Policy001」においては、三つの対策候補のうち、合計評価値が最も高い「無線チャネル変更」が優先順位1位(対策優先度:24.5)、合計評価値が次に高い「設置場所調整」が優先順位2位(対策優先度:20.5)、「アンテナ交換」が優先順位3位(対策優先度:9.6)と決定され、この結果が出力部124を介して出力される。これにより、本例では「無線チャネル変更」が最適な対策であることが判断可能となる。尚、
図5の「Policy002」が適用された場合は、「無線チャネル変更」の合計評価値が10、「設置場所調整」の合計評価値が12、「アンテナ交換」の合計評価値が7.7と算出されるため、稼働率優先の復旧要件「Policy002」においては「設置場所調整」が最適な対策と判断できる。このように、前記加重値と前記評価値に基づく対策優先度の決定によって、適用される復旧要件に則した対策を柔軟に選定できる。更に、優先順位付きで対策候補が出力されるので、知識や経験に乏しい作業者でも障害に対して講じるべき対策を容易に判断できる。ステップS706の処理が終了すると、
図7の対策選定処理を終了する。
【0062】
図8を参照して、
図7の対策選定処理にて選定された対策候補、及び優先度情報を出力する画面表示例を説明する。
図8は、
図7のステップS706で出力される画面表示例を示す図である。管理装置102の出力部124は、
図8に示す表示画面800を表示するためのデータを出力する。表示画面800は、障害情報を表示する表示エリア801、及び発生した障害に対する対策情報を表示する表示エリア802を含む。
【0063】
表示エリア801には、管理装置102の障害検知部129によって検知された障害情報が表示される。
図8の例では、障害発生元となる装置101の情報、所属するシステムの情報、及び障害内容を表示し、この他にも障害検知時刻など、必要に応じて任意の情報を表示してもよい。
【0064】
表示エリア802には、表示エリア801に出力された障害情報から復旧するための対策情報が表示される。
図8の例では、復旧要件管理部132で管理される情報のうち障害発生元の装置101に適用される復旧要件情報、及び対策優先度決定部133で決定された優先順位を付して、対策候補選定部130で選定された対策候補を表示する。尚、
図8の例では、各対策候補の優先順位を表示しているが、各優先順位にどれ程の優先度の差があるのかを明示するために、対策優先度(
図7のステップS705で算出される合計評価値)もあわせて表示してもよい。
【0065】
作業者は、
図8の画面の表示によって、発生した障害の内容や、障害発生元の装置101及びシステムを特定できる。更に、優先順位付きの対策情報の参照によって、知識や経験の無い作業者でも、優先的に講じるべき対策を一意に判断できる。尚、
図8の画面例に限らず、例えば、優先順位が高い所定数の対策候補(例えば、最も優先順位が高い一つの対策候補)を表示する画面でもよく、障害情報や対策情報の表示形式は特定の方法に限定されない。
【0066】
図9を参照して、管理装置102で管理される各種テーブルの情報を設定するための画面表示例を説明する。
図9は設定画面例を示す。管理装置102の出力部124は、
図9に示す表示画面900を表示するためのデータを出力する。表示画面900は、対策毎の評価値を設定するための表示エリア901、各復旧要件における加重値を設定するための表示エリア902、及び装置毎に適用される復旧要件を設定するための表示エリア903を含む。
【0067】
表示エリア901は、管理装置102の対策評価値管理部131が管理する評価値管理テーブル131a(
図4)を設定するための領域である。各対策に対して、評価指標毎の評価値を選択すると、当該入力値が評価値管理テーブル131aに設定される。尚、追加ボタン904の操作によって、障害復旧のための対策や復旧要件にて考慮すべき評価指標が随時追加可能となっている。追加ボタン904によって、システムの運用過程で発生した新規対策や新規評価指標を任意に追加できる。
【0068】
表示エリア902は、管理装置102の復旧要件管理部132が管理する復旧要件加重値管理テーブル132a(
図5)を設定するための領域である。復旧要件毎に、各評価指標の加重値を選択すると、当該入力値が復旧要件加重値管理テーブル132aに設定される。尚、表示エリア901の追加ボタン904で評価指標を追加した場合、表示エリア902の評価指標欄も自動で追加される。また、表示エリア902に復旧要件の追加ボタン904が設けられており、システムの運用過程における復旧要件の追加が可能となっている。
【0069】
表示エリア903は、管理装置102の復旧要件管理部132が管理する復旧要件適用管理テーブル132b(
図6)を設定するための領域である。装置101毎、システム毎に適用する復旧要件を選択すると、当該入力値が復旧要件適用管理テーブル132bに設定される。尚、表示エリア903に装置及びシステムの追加ボタン904が設けられており、システムの運用過程における装置101の追加が可能となっている。
【0070】
また、各種テーブルの情報を、
図9の画面上で管理するだけでなく、外部ファイルの入出力による管理が考えられる。そこで、
図9の画面表示例では、ファイル入力ボタン905と、ファイル出力ボタン906を設けている。ファイル入力ボタン905を操作すると、外部ファイルに保存された各種テーブル値を
図9の画面上に読み込む。また、ファイル出力ボタン906を操作すると、
図9の画面上で入力されたテーブル値を外部ファイルに出力する。これによって、テーブル値が格納される外部ファイルとの連携を容易に実現できる。ただし、ファイル入出力機能の搭載は任意である。
【0071】
図9のように各種テーブルの情報の設定画面によって、各種テーブル値の途中の変更等が容易になり、前述の対策、評価指標、復旧要件、装置101の追加にも柔軟に対応できる。尚、
図9の画面表示例では、
図4の評価値管理テーブル131a、
図5の復旧要件加重値管理テーブル132a、
図6の復旧要件適用テーブルを設定するための表示エリアを設けているが、同様に
図2の装置情報管理テーブル128aや、
図3の対策候補管理テーブル130aを設定するための表示エリアを設けてもよい。また、
図9の画面表示例では、テーブル値をプルダウン形式で選択し設定する形態を例示するが、設定値を直接入力としてもよく、様々な入力形式を採用できる。
【0072】
尚、本実施例では、管理装置102の入力部123と出力部124を介して、
図8や
図9の画面を表示及び操作する形態を説明したが、前述の通り、例えば管理装置102にリモートログインする等によって、通信I/F121を介して外部機器が情報の入力を受け、通信I/F121を介して外部機器に
図8や
図9の画面を表示するための表示データを出力し、外部機器のディスプレイに画面を表示してもよく、この場合には入力部123と出力部124を省略してもよい。
【0073】
以上のように、本実施例によれば、装置101の障害発生時において、発生した障害に対して、復旧要件に則した対策候補を自動的に選定し、且つ任意の復旧要件を反映した対策優先度が付された対策候補を出力できる。これにより、復旧要件に則した適切な対策が可能となり、延いてはシステムの稼働率を向上し、復旧にかかる対策コストを低減できる。さらに、対策候補毎に優先度情報が明示されるので、知識や経験に乏しい作業者でも、適切な対策を容易に判断できる。
【0074】
<実施例2>
実施例1では、各装置101に単一の復旧要件が適用される形態の対策選定処理について説明した。一方、状況に応じて、適宜異なる復旧要件を適用すべきケースも考えられる。例えば、システムの構築期間中は「コスト優先」、システムの稼働開始後は「稼働率優先」の復旧要件を適用するケースなどがある。本例の場合、システムの稼働開始時刻を境に、装置101に適用される復旧要件が「コスト優先」から「稼働率優先」へ自動的に変更されることが望ましい。そこで、実施例2では、システムの運用フェーズ等に応じた復旧要件の変化を想定し、時間変化や特定パラメータの閾値の超過をトリガに、適用復旧要件を変更する形態について説明する。
【0075】
実施例2では、
図10を参照して管理装置102の復旧要件管理部132で管理する復旧要件適用管理テーブル132bの構成を説明する。尚、実施例2に係る各種構成や処理等について、
図10に示す復旧要件適用管理テーブル132bの構成以外は第1の実施例と同じであるため、これらの説明は省略する。
【0076】
図10は、実施例2における復旧要件適用管理テーブル132bの構成例を示す。装置ID601、システムID602及び復旧要件ID603のフィールドは、
図6の実施例1における復旧要件適用管理テーブル132bの各フィールドと同じであり、これらの説明は省略する。実施例2の復旧要件適用管理テーブル132bは、判定パラメータ1003、判定条件1004及び閾値1005のフィールドを有しており、当該フィールド群に記載された条件を満たす場合に復旧要件ID1006に記載の復旧要件が適用される。
【0077】
判定パラメータ1003は、適用する復旧要件の判定対象となるパラメータの情報である。
図10の例では、現在時刻やパケットエラー率を例示しているが、当該フィールドに記載するパラメータ種別や名称は任意である。例えば、装置101の稼働情報として、CPU使用率等のパラメータでもよい。
【0078】
判定条件1004は、閾値1005に対する大小関係である。
図10に例示する大小関係以外にも、「=(一致)」や「≠(不一致)」等の条件が設定可能である。当該フィールドにおける表記形式は任意であり、不等号で記載する他、「less than」などの文字列で表記してもよい。
【0079】
閾値1005は、判定パラメータ1003の閾値である。
図10の例示では、判定パラメータ1003に時刻が定義されている場合は、当該フィールドに時刻情報を記載するなど、パラメータ種別に応じた任意形式で閾値を定義するとよい。
図10の例では、例えば現在時刻が「2020/10/01 00:00:00」以前であれば、装置101-a(装置ID:a)には「Policy001(コスト優先)」の復旧要件が適用され、閾値1005に記載の時刻を超過した後は「Policy002(稼働率優先)」の復旧要件が適用される。そのため、例えば前述のようにシステムの稼働開始前後で、適用する復旧要件を変更したい場合は、閾値1005のフィールドに稼働開始時刻を設定すればよい。一方、装置101-b(装置ID:b)は、例えば管理装置102との通信におけるパケットエラー率が50%以内である間は「Policy003(バランス優先)」の復旧要件が適用され、50%を超えると「Policy004(時間優先)」が適用される。このようにパケットエラー率が上昇し、データ収集に支障を来たすレベルの障害に至った時点で、「時間優先」の復旧要件に変更して早期復旧を目指す。このように、判定パラメータ1003に性能指標に関するパラメータを設定することで、システム品質に応じて復旧要件を切り替え可能となる。勿論、実施例1のように常時一つの復旧要件を適用したい場合は、
図10に例示する通り、判定パラメータ1003、判定条件1004及び閾値1005を無定義にすればよい。
【0080】
実施例2における復旧要件適用管理テーブル132bに定められる判定パラメータ1003は、
図10に示す時間的な判定条件や、装置の動作状態の判定条件の他、復旧に要する人員を定めてもよい。
【0081】
尚、その他の各種構成や処理は実施例1と同様であるが、実施例2における
図7の対策選定処理のステップS703では、
図10の復旧要件適用管理テーブル132bを参照して、障害発生元に適用される復旧要件を取得するにあたり、装置ID1001とシステムID1002のみで適用復旧要件を判断するのではなく、判定パラメータ1003、判定条件1004及び閾値1005を考慮して適用復旧要件を判断する。
【0082】
以上のように、本実施例によれば、システムの運用フェーズや品質に応じて、適用する復旧要件を動的に変更でき、変化する復旧要件に追従して、適切な対策を選定できる。勿論、実施例1においても作業者が時刻や特定パラメータの変化を監視し、
図9の画面等を用いて適用復旧要件を変更できるが、本実施例のように復旧要件適用管理テーブル132bに判定条件を予め登録しておくと、人手を介さずに、自動的に適用復旧要件を切り替えて、対策選定処理を実行できる。
【0083】
<実施例3>
実施例3では、実際に対策を実行する際の各評価指標に関する実績値に基づいて、対策の評価値を設定及び更新する形態について説明する。発生した障害に対して対策を講じる際に、実際に発生したコストや所要時間などの実績値が、評価値策定時の想定と異なることがある。復旧要件に則した対策を選定する上では、実態を反映した評価値が設定されていることが望ましく、実施例3では、対策実行時に発生した各評価指標の実績値を記録し、当該実績情報に基づいて評価値を決定する形態について説明する。
【0084】
実施例3では、
図1の管理装置102の対策評価値管理部131において、評価値管理テーブル131aの他に、対策実行時に生じた評価指標毎の実績値を管理する対策実績管理テーブル131bを管理する。実施例3における管理装置102の対策評価値管理部131で管理するテーブルのうち、
図11は対策実績管理テーブル131bを示し、
図12は評価値管理テーブル131aを示す。また、実績情報に基づく評価値の更新を含む、対策選定処理について
図13を参照して説明する。尚、実施例3に係る各種構成及び処理等について、
図11~
図13に示す構成及び処理以外は第1又は第2の実施例と同じであるため、これらの説明は省略する。
【0085】
図11を参照して、管理装置102の対策評価値管理部131で管理される対策実績管理テーブル131bについて説明する。発生障害に対して対策を講じる際、作業者は対策実績管理テーブル131bに、復旧結果及び評価指標毎の実績値を記録する。
図11は、実施例3における対策実績管理テーブル131bの構成例を示す。
【0086】
対策ID1101は、発生障害に対して実行した対策の識別子である。対策の識別子の形式は、
図3の対策候補管理テーブル130aの対策ID302や、
図4の評価値管理テーブル131aの対策ID401の形式と同じでよい。
【0087】
実行日時1102は、対策ID1101に記載の対策を行った日時である。日時の表記形式は任意である。
【0088】
復旧結果1103は、対策ID1101に記載の対策を行った結果、実際に障害から復旧したか否かが記録されるフィールドである。
図11の例では、復旧結果1103を「〇」又は「×」で記載しているが、その形式は任意である。尚、実行日時1102と復旧結果1103のフィールドは必須ではない。ただし、復旧結果1103のフィールドを設けて復旧結果を記録することによって、例えば各対策による復旧確率を評価指標に含む場合、当該復旧結果1103のフィールドを用いて復旧確率を算出できる。
【0089】
実績値1104は、復旧要件に関する評価指標毎に、対策を行った結果として、実際に生じた実績値が記録されるフィールドである。
図11の例では、実績値1104のフィールドに実績値を記録するにあたり、記載時の単位情報は評価指標毎に任意に設定してもよい。実績値1104は装置毎やシステム毎に集計された値でもよい。
【0090】
実環境で実際に対策を講じる度に、
図11の対策実績管理テーブル131bに復旧結果と実績値を記録し蓄積することによって、後述の
図12の評価値管理テーブル131aにおいて、より実態を反映した評価値を設定できる。尚、
図11の対策実績管理テーブル131bには、対策の対象となった装置101の識別子や、当該装置101が所属するシステムの識別子など、任意の情報を記録してもよい。
【0091】
図12A、
図12Bを参照して、管理装置102の対策評価値管理部131で管理する評価値管理テーブル131aについて説明する。実施例3の評価値管理テーブル131aでは、前述の対策実績管理テーブル131bに記録された実績情報に基づいて、各対策について評価指標毎の実績統計値(
図12Aの例では実績平均)を管理すると共に、当該実績統計値に基づいて評価値を設定する。
図12Aは実施例3における評価値管理テーブル131aの構成を示し、
図12Bは実績統計値から評価値への変換関数例を示す。
【0092】
まず、
図12Aの対策ID401は、対策の識別子であり、
図4の実施例1における評価値管理テーブル131aの対策ID401と同じである。対策の識別子の形式は、
図3の対策候補管理テーブル130aの対策ID302や、
図4の評価値管理テーブル131aの対策ID401の形式と同じでよい。
【0093】
実績統計値1202は、対策ID1201に記載の対策に関する評価指標毎の実績統計値である。具体的には、
図11の対策実績管理テーブル131bに記録された実績値に基づいて当該統計値が算出され、
図12Aの例では実績統計値として、評価指標毎の平均値を算出し記録している。ただし、実績統計値1202のフィールドに記録する情報は平均値に限らず、例えば最大値、最小値など目的に合わせた統計情報を採用しうる。
【0094】
評価値1203は、対策ID1201に記載の対策に関する評価指標毎の評価値である。ただし、実施例3の評価値1203は、実績統計値1202に記載された実績値に基づいて設定される。
図12Aの例では、最良の実績統計値を最高評価値(10点)、最悪の実績統計値を最低評価値(1点)として、評価指標毎に実績統計値を「1~10点」の範囲で正規化して、評価値へ変換している。
図12Aに記載の評価値は、
図12Bの実線のように線形的に正規化(変換)する例を示すが、例えば、ある閾値を超える実績値に対して評価値の傾斜を大きく付けたい場合は、
図12Bの破線のような変換関数を採用してもよい。また、
図12Aの例では、評価指標毎に最良及び最悪の実績統計値を算出して、評価値へ変換しているが、例えば「評価指標1(人的コスト)」と「評価指標2(物理コスト)」のように、同種類の評価軸(コスト等)を有している場合は、複数の評価指標を組み合わせて最良及び最悪の実績統計値を設定してもよい。例えば、
図12Aの例で、評価指標1のみで最良及び最悪の実績統計値を算出すると、最良967円、最悪37,000円となるが、評価指標2を組み合わせると最良0円、最悪37,000円となり、「0円~37,000円」の範囲で評価指標1と評価指標2の実績値を、各評価値へ変換してもよい。このように、実績統計値から評価値への変換関数は、任意に設定してもよい。
【0095】
図13を参照して、実施例3における障害発生時の対策選定処理について説明する。実施例3では、発生した障害の対策候補を選定し、優先度情報付して出力した後、対策実行後に実際に発生した実績値を記録し、更に実績値情報に基づいて評価値を再計算し、更新する手順を含む。
図13は、当該対策選定処理のフローチャートであり、以下詳細を説明する。ただし、
図13のステップS701~S706は、
図7の実施例1又は実施例2と同じであるため説明を省略し、対策候補の出力を終えた後のステップS1307とステップS1308の処理について説明する。
【0096】
ステップS1307では、作業者等による対策実行後、対策評価値管理部131で管理する
図11の対策実績管理テーブル131bに、講じた対策情報と共に復旧結果、及び評価指標毎の実績値を登録する。ステップS1307における登録は、作業者が手動で登録したり、例えば管理装置120が対策実行時に生じた通信途絶時間などを実際に計測し、実測値を自動的に対策実績管理テーブル131bに登録してもよい。ステップS1307の処理が終了すると、ステップS1308に進む。
【0097】
ステップS1308では、対策評価値管理部131の評価値管理テーブル131a(
図12)に記載の実績値と評価値を再計算し更新する。具体的には、ステップS1307で更新された対策実績管理テーブル131bを参照して、
図12の評価値管理テーブル131aにおける実績統計値1202のフィールドを更新し、新しい実績統計値に基づいて評価値1203の評価指標毎の評価値を再計算し更新する。ステップS1308の処理が終了すると、
図13の対策選定処理を終了する。
【0098】
図13の対策選定処理によって、対策実行時の実績値に基づいて評価値を設定でき、より実環境特性を反映した対策の選定が可能となる。特に、環境変化や作業者の対策熟練度向上などに伴い、例えば対策所要時間が徐々に短くなるなど、実績値が変化した場合、
図13のステップS1307からS1308のような実績値に基づいて、その都度、評価値を設定することによって、実績値の変動に追従した評価値を設定できる。尚、
図13の例では、対策実行後に毎回ステップS1307からS1308による実績値の登録及び評価値の更新を行うが、例えば、一週間に一回など、対策実行のタイミングと連動しないタイミングで定期的に実績値を登録し、評価値を更新してもよい。
【0099】
以上のように、本実施の形態による対策選定処理によって、実績値を反映した評価値が設定され、より実態の特性に則した対策を選定できる。前述の通り、環境変化等に応じて、対策毎の実績値が時間と共に変動する場合でも、当該変動に追従して評価値が更新されるため、常に実環境特性を反映した対策を選定できる。
【0100】
<実施例4>
実施例1から実施例3では、対策優先度決定部133が、合計評価値が高い対策候補を無条件で高優先に決定する。しかし、復旧要件の例として、例えば「人的コストと物理コストの合計が5万円を超える対策は候補から除外する」、又は「1時間以上の通信途絶を伴う対策は候補から除外する」等の制約条件が設けられる場合もある。そこで、実施例4では、復旧要件毎に、対策候補が満たすべき制約条件の設定を可能とする。
【0101】
実施例4において、
図14は管理装置102の復旧要件管理部132が管理する復旧要件加重値管理テーブル132aを示す図であり、
図15は障害発生時の対策選定処理のフローチャートである。尚、実施例4に係る各種構成及び処理等について、
図14と
図15に示す構成及び処理以外は第1~第3の実施例と同じであるため、これらの説明は省略する。
【0102】
図14は、実施例4における復旧要件加重値管理テーブル132aの構成例を示す。本実施例では、実施例1~3のように、復旧要件加重値管理テーブル132aで復旧要件毎の加重値を管理し、さらに対策候補が満たすべき制約条件も管理するために、対策可否判定指標1402と最低評価値条件1403のフィールドを新たに設けている。適用される復旧要件に対して、当該フィールド群に記載された条件を満たす対策が、対策候補の対象となり、例え合計評価値が優れていても、当該条件が未達の場合は対策候補から除外される。復旧要件ID501及び加重値502のフィールドは、
図5の実施例1における復旧要件加重値管理テーブル132aの各フィールドと同じであり、これらの説明は省略する。以下、新たに設けられた対策可否判定指標1402及び最低評価値条件1403について説明する。
【0103】
対策可否判定指標1402は、復旧要件ID501に記載の復旧要件において、対策候補としての可否を判定するための基準となる評価指標である。
図14の例では、「指標1」等の形式で記載しているが、復旧要件に関する評価指標の種別を示す記載であれば、その形式は任意である。また、前述の「人的コストと物理コストの合計値」など、複数の評価指標の組み合わせに基づいて対策候補の可否を判定する場合、
図14に例示する「指標1+指標2」のように評価指標を組み合わせて定義してもよい。
【0104】
最低評価値条件1403は、対策可否判定指標1402に記載された一つ又は複数の評価指標に対して、対策候補の対象となるために満たすべき評価値である。例えば、
図14の例において、「Policy001(コスト優先)」の復旧要件では、評価指標1(人的コスト)と評価指標2(物理コスト)の合算評価値が13以上でなければ、対策候補から除外することを示している。尚、
図14の例における最低評価値条件1403では、対策候補の可否に関する閾値を評価値で定義しているが、実施例3のように評価値から実績値を逆算できる場合などにおいては、具体的な評価指標に関する値(金額、時間など)を定義してもよい。
図14のような、復旧要件加重値管理テーブル132aを管理することによって、復旧要件毎に各対策が満たすべき任意の制約条件を設定できる。
【0105】
図15を参照して、実施例4における障害発生時の対策選定処理について説明する。実施例4では、発生障害に対する対策候補を選定後、対策優先度決定部133において対策候補毎の合計評価値を算出する際に、
図14の復旧要件加重値管理テーブル132aを参照し、適用復旧要件に設定された制約条件を満たさない対策を候補から除外する。
図15は、実施例4における対策選定処理のフローチャートであり、以下詳細を説明する。ただし、
図15のステップS701~ステップS704及びステップS706は、
図7の実施例1及び実施例2におけるステップS701~ステップS704及びステップS706と同じであるため、説明を省略し、新たに設けられたステップS1505の制約条件を満たさない対策の除外処理について説明する。
【0106】
ステップS1505にて、対策候補毎に復旧要件に応じた合計評価値を算出する点は、
図7のステップS705と同じである。しかし、この時、対策優先度決定部133は、復旧要件管理部132で管理される
図14の復旧要件加重値管理テーブル132aを参照し、適用する復旧要件に設定された制約条件を満たさない対策を候補から除外する。例えば、発生障害が
図3の「Fault001(電波干渉発生)」であり、これに対して「Counter001~Counter003」の三つが対策候補に選定されており、適用される復旧要件が
図14の「Policy001(コスト優先)」である場合、評価指標1(人的コスト)と評価指標2(物理コスト)の合算評価値が13未満の対策は候補から除外される。即ち、本例の場合、
図4の評価値管理テーブル131aにおいて「Counter003(アンテナ交換)」の対策は、評価指標1と評価指標2の合算評価値が6であるため対策候補から除外され、対策候補は「Counter001」と「Counter002」の二つが選定される。ステップS1505の処理が終了すると、ステップS1506に進み、制約条件を満たさない対策を候補から除外した残りの対策候補に対して対策優先度を算出し、出力処理が実行される。
【0107】
図15の対策選定処理によって、復旧要件毎に設定された制約条件を満たす対策候補を自動的に出力できる。尚、説明を簡単化するために、実施例1及び実施例2における
図7の対策選定処理において、制約条件を満たさない対策を除外する処理を説明したが、
図13のステップS1305を
図15のステップS1505に置き換えて、実施例3に当該処理を適用してもよい。
【0108】
以上のように、本実施の形態による制約条件の設定によって、各復旧要件に設定される任意の制約条件を満たす対策を選定し、出力できる。特に、一定時間以上の通信途絶を伴うとシステムに甚大な被害が発生する場合などにおいて、制約条件を適切に設定することによって、システムの運用上、安全な対策のみを抽出して選定できる。
【0109】
<実施例5>
実施例1~実施例4では、装置101に発生する障害に対する対策を、管理装置102が決定する形態について説明したが、装置101が対策を自己決定してもよい。管理装置102で対策選定処理を実行するメリットとして、装置101における処理負荷軽減などがあるが、一方で装置101が対策を自己決定することで、管理装置102が対策を決定するより短時間で対策を決定できるメリットが生じる。そこで、実施例5では、装置101が自装置に発生した障害への対策を決定する形態について説明する。
【0110】
実施例5において、
図16は装置101のハードウェア構成を示し、
図17は装置101による対策選定処理のフローチャートである。尚、実施例5の各種構成や処理等について、
図16と
図17に示す構成や処理以外は第1~第4の実施例と同じであるため、これらの説明は省略する。
【0111】
図16を参照して、実施例5における装置101のハードウェア構成を説明する。
図16の通信I/F1601、CPU1602、記憶装置1605、アプリケーションプログラム1606及び通信処理部1607は、それぞれ、CPU1602が実行する処理の内容を除いて、実施例1の装置101が搭載する
図1の通信I/F111、CPU112、記憶装置113、アプリケーションプログラム114、通信処理部115と同じであるため、説明を省略する。尚、管理装置102が存在せず、装置101で取得したデータや、自装置の稼働情報を送信する必要が無い場合は、通信I/F1601を搭載しなくてもよい。
【0112】
実施例5では、装置101が自装置の障害を検知し、対策候補の選定から優先度決定、出力までの処理を実行するため、実施例5の装置101は、入力部1603、出力部1604、障害検知部1609、対策候補選定部1610、対策評価値管理部1611、復旧要件管理部1612、対策優先度決定部1613を有し、それぞれは、実施例1の管理装置102が搭載する
図1の入力部123、出力部124、障害検知部129、対策候補選定部130、対策評価値管理部131、復旧要件管理部132、対策優先度決定部133と同じである。実施例1の管理装置102が搭載する
図1の装置情報管理部128は、他装置が属するシステムを管理するため、実施例5の装置101には搭載されない。また、装置101の障害検知部1609は、他装置の障害を検知するのではなく、自装置で生成したアラート情報等に基づき、自装置内に発生した障害を任意の方法で検知する点において、管理装置102が有する障害検知部129と異なる。装置101の復旧要件管理部1612で管理する復旧要件適用管理テーブル132b(
図6又は
図10)は、自装置に適用される復旧要件のみを管理する形態でよい。尚、別の外部機器から装置101へリモートログインする形態など、通信I/F1601を介して外部機器からの入力情報の受け付けや、外部機器への出力情報を提供する場合は、入力部1603及び出力部1604は装置101に搭載されなくてもよい。
【0113】
図17を参照して、障害発生時の装置101による対策選定処理について説明する。
図17は実施例5の対策選定処理のフローチャートである。実施例5の対策選定処理は、ステップS1701において他装置の障害ではなく、自装置の障害を検知する点を除けば、
図1の対策選定処理と同じである。
【0114】
ステップS1701では、装置101の障害検知部1608で自装置内の障害発生を検知する。障害発生を検知した場合(YES)は、ステップS1702に進む。障害が検知されない場合(NO)は、任意の時間経過後に再度ステップS1701の処理を実行する。
【0115】
ステップS1702では、対策候補選定部1610が、
図3の対策候補管理テーブル130aを参照し、ステップS1701で検知された障害に対する対策候補を選定する。ステップS1702の処理が終了すると、ステップS1703に進む。
【0116】
ステップS1703では、復旧要件管理部1612が、
図6又は
図10の復旧要件適用管理テーブル132bを参照し、自装置に適用される復旧要件を取得する。ステップS1703の処理が終了すると、ステップS1704に進む。
【0117】
ステップS1704は、復旧要件管理部1612が、
図5又は
図14の復旧要件加重値管理テーブル132aを参照し、ステップS1703で取得した適用復旧要件における各評価指標に対する加重値を取得する。ステップS1704の処理が終了すると、ステップS1705に進む。
【0118】
ステップS1705は、対策優先度決定部1613が、対策評価値管理部1611によって管理される
図4又は
図12Aの評価値管理テーブル131aを参照し、ステップS1702で選定された対策候補毎の評価値を取得し、ステップS1704で取得した加重値を反映した合計評価値を算出する。ステップS1705の処理が終了すると、ステップS1706に進む。
【0119】
ステップS1706は、対策優先度決定部1613が、合計評価値を対策優先度とし、当該値が高い順に各対策候補の優先順位を決定する。優先順位を決定した後、決定された優先順位又は対策優先度(合計評価値)と共に、ステップS1702で選定された対策候補を出力部1604より出力する。本処理が終了すると、
図17の対策選定処置に関するフローチャートを終了する。
【0120】
図17の対策選定処理によって、装置101が自装置で発生した障害に対して、優先度情報と共に対策候補を自動的に選定し出力できる。尚、説明を簡単化するために、実施例1及び実施例2における
図7の対策選定処理に基づいて、装置101による対策選定処理を説明したが、
図13のステップS701又は
図15のステップS701を、
図17のステップS1701に置き換えて、実施例3や実施例4の処理を装置101の対策選定処理に適用してもよい。
【0121】
以上のように、本実施例によって、管理装置102を必要とせず、装置101が自装置内で発生した障害に対する対策を決定できる。例えば、管理装置102による障害検知より、装置101の自装置内での障害検知の方が早期に行えるため、前述の通り、管理装置102が対策を決定するより、障害発生から短時間で対策を決定できる。
【0122】
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。
【0123】
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
【0124】
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、ICカード、SDカード、DVD等の記録媒体に格納することができる。
【0125】
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
【符号の説明】
【0126】
101:装置、102:管理装置、111:通信I/F、112:CPU、113:記憶装置、114:アプリケーションプログラム、115:通信処理部、121:通信I/F、122:CPU、123:入力部、124:出力部、125:記憶装置、126:アプリケーションプログラム、127:通信処理部、128:装置情報管理部、129:障害検知部、130:対策候補選定部、131:対策評価値管理部、132:復旧要件管理部、133:対策優先度決定部