(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024150194
(43)【公開日】2024-10-23
(54)【発明の名称】管理装置、管理方法、及び、管理プログラム
(51)【国際特許分類】
G06F 11/34 20060101AFI20241016BHJP
G06F 11/07 20060101ALI20241016BHJP
G06F 11/20 20060101ALI20241016BHJP
【FI】
G06F11/34 133
G06F11/07 140A
G06F11/07 193
G06F11/20 623
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023063481
(22)【出願日】2023-04-10
(71)【出願人】
【識別番号】598057291
【氏名又は名称】エフサステクノロジーズ株式会社
(74)【代理人】
【識別番号】110003649
【氏名又は名称】弁理士法人真田特許事務所
(74)【代理人】
【識別番号】100189201
【弁理士】
【氏名又は名称】横田 功
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】奥津 明彦
(72)【発明者】
【氏名】山路 敏
【テーマコード(参考)】
5B034
5B042
【Fターム(参考)】
5B034BB06
5B034CC01
5B042JJ06
5B042JJ29
5B042KK17
5B042MA08
5B042MA14
5B042MC29
(57)【要約】
【課題】冗長構成である複数のシステムにおける障害発生の確率を低減させる。
【解決手段】管理装置は、冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値41bを設定し、前記稼働状態であるシステムの負荷量の積算値が前記切替閾値41bを超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える。
【選択図】
図7
【特許請求の範囲】
【請求項1】
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
制御部を備える、管理装置。
【請求項2】
前記制御部は、
前記稼働状態であるシステムから、一定期間ごとに前記負荷量を取得し、
取得した前記負荷量の積算値を前記稼働状態であるシステムに対応付けてメモリに格納し、
前記切り替える処理により前記稼働状態から前記停止状態に切り替わったシステムに対応付けられた前記積算値を初期化する、
請求項1に記載の管理装置。
【請求項3】
前記制御部は、前記切替閾値を設定したときに、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
請求項1又は請求項2に記載の管理装置。
【請求項4】
前記負荷量は、前記稼働状態のシステムが備えるプロセッサの使用率であり、
前記積算値は、前記プロセッサの使用率の前記所定期間における積分値である、
請求項1又は請求項2に記載の管理装置。
【請求項5】
前記負荷量は、複数の指標を含み、
前記制御部は、
前記設定する処理において、前記所定期間における前記複数の指標のそれぞれの積算値に基づき、前記複数の指標のそれぞれの切替閾値を設定し、
前記切り替える処理において、前記稼働状態であるシステムの前記複数の指標のそれぞれの積算値が、前記複数の指標のそれぞれの切替閾値を超えるか否かに基づき、前記切り替えを行なうか否かを判定する、
請求項1又は請求項2に記載の管理装置。
【請求項6】
前記制御部は、前記第1システム又は前記第2システムの累積稼働量が所定の条件を満たした場合に、前記切替閾値を減少させる、
請求項1又は請求項2に記載の管理装置。
【請求項7】
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理をコンピュータが実行する、管理方法。
【請求項8】
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理をコンピュータに実行させる、管理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、管理装置、管理方法、及び、管理プログラムに関する。
【背景技術】
【0002】
所定の処理を実行するシステム(例えばサーバ)を冗長構成として管理する管理装置が、複数の当該システムの稼働状態を運用系と予備系との間で切り替えることで、複数のシステム全体の可用性を向上させる手法が知られている。
【0003】
例えば、管理装置は、第1手法として、第1システム及び第2システムの一方を運用系として稼働させ、他方を予備系として停止させておく。管理装置は、運用系の障害発生を検出した場合に、停止状態の第2システムを起動させて運用系として動作させ、第1システムが実行していた処理を第2システムに引き継がせることで、冗長構成のシステムの継続動作を実現する。
【0004】
第1手法では、第2システムは、第1システムに障害が発生するまでは待機(例えば電源OFF)状態のままであり、運用系に切り替わらない。このため、複数のシステムは、サーバが稼働し続けることのできる平均期間の前後で第1システムに障害が発生する可能性が高い。第1システムに障害が発生すると、代替機の導入費用及びサーバの交換作業費用等が発生する。
【0005】
障害発生に伴う費用や交換作業による冗長性低下を抑制するために、管理装置が、所定期間ごとに複数のシステムの稼働状態を運用系と予備系との間で切り替えることで、複数のシステムの各々を時間的に公平に稼働させる手法(2手法)が知られている。例えば、管理装置は、運用開始又は切り替えからの経過時間を計測するタイマの計測値が閾値(例えば1年)を超え、且つ、複数のシステムが切り替え可能である場合に、各システムに稼働状態の切り替えを指示する。
【0006】
第2手法では、障害の発生を待たずに複数のシステムの稼働状態を定期的に切り替えることで、システム間の稼働時間の偏りを防止する(均等に劣化させる)。これにより、第1手法と比較して、運用開始からシステムに障害が発生するまでの期間を引き延ばすことができ、運用の終了タイミング又は次世代システムへの移行タイミングによっては、サーバの障害発生に伴う費用の発生を抑制できる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2013-011929号公報
【特許文献2】特開2020-071840号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
第2手法において、第1システムが運用系である期間と、第2システムが運用系である期間との間で、運用系のシステムが実行する処理負荷に差がある場合、システム間の劣化度合いに偏りが生じ得る。このような偏りがある場合、処理負荷が大きい方のシステムの障害発生確率が増加するため、運用開始からシステムに障害が発生するまでの期間が、システムが均等に劣化する場合の期間よりも短くなることがある。
【0009】
1つの側面では、本発明は、冗長構成である複数のシステムにおける障害発生の確率を低減させることを目的の1つとする。
【課題を解決するための手段】
【0010】
1つの側面では、管理装置は、制御部を備えてよい。前記制御部は、冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定してよい。また、前記制御部は、前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替えてよい。
【発明の効果】
【0011】
1つの側面では、本発明は、冗長構成である複数のシステムにおける障害発生の確率を低減させることができる。
【図面の簡単な説明】
【0012】
【
図1】一実施形態に係る冗長構成システムの構成例を示すブロック図である。
【
図2】一実施形態に係る管理サーバの機能を実現するコンピュータのハードウェア(HW)構成例を示すブロック図である。
【
図3】一実施形態に係るシステムの動作状態の切替タイミングの一例を説明するための図である。
【
図4】一実施形態に係る冗長構成システムのソフトウェア構成例を示すブロック図である。
【
図6】一実施形態に係る管理サーバの動作例を説明するためのフローチャートである。
【
図7】管理サーバの動作例を説明するための図である。
【発明を実施するための形態】
【0013】
以下、図面を参照して本発明の実施の形態を説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形又は技術の適用を排除する意図はない。例えば、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。なお、以下の説明で用いる図面において、同一符号を付した部分は、特に断らない限り、同一若しくは同様の部分を表す。
【0014】
〔A〕一実施形態に係るシステムの構成例
図1は、一実施形態に係る冗長構成システム1の構成例を示すブロック図である。冗長構成システム1は、冗長構成とした複数のシステムのうちの運用系のシステムにより、所定の処理を実行するサービスを提供するシステムの一例である。
【0015】
図1に示すように、冗長構成システム1は、例示的に、複数のシステム2,管理サーバ4,ネットワーク(NW)スイッチ5,及び管理用NWスイッチ6を備えてよい。
【0016】
システム2は、所定の処理の実行により、外部NWに接続されたクライアントコンピュータに所定のサービスを提供するシステムである。システム2は、1以上(
図1の例では1つ)のサーバ3を備えてよい。
【0017】
一実施形態では、複数のシステム2は、一方が運用系として稼働し、他方が予備系として停止する、冗長構成(二重化構成)の2つのシステム2であってよい。以下、2つのシステム2のそれぞれを区別する場合には、これらを「システム#0」及び「システム#1」と表記する。システム#0は、第1システムの一例であり、システム#1は、第2システムの一例である。
【0018】
サーバ3は、所定の処理を実行する処理装置,情報処理装置又はコンピュータの一例である。サーバ3としては、例えば、サーバ装置,PC,又はストレージ装置のコントローラモジュール(CM)等の、プロセッサを備える種々の装置が挙げられる。以下、システム#0が備えるサーバ3を「サーバ#0」と表記し、システム#1が備えるサーバ3を「サーバ#1」と表記する。サーバ#0及び#1は、互いに冗長構成であってよい。
【0019】
ここで、「冗長構成」とは、複数のシステム2(複数のサーバ3)が、一方に障害が発生した場合に他方が一方に代わって業務(所定の処理)を引き継げるように設定された構成を意味してよい。このため、冗長構成の複数のシステム2(複数のサーバ3)は、互いに同一のハードウェア,ソフトウェアを必ずしも有している必要はなく、同程度の処理性能により、同一の処理(所定の処理)を実行可能であればよい。
【0020】
管理サーバ4は、複数のシステム2の冗長構成を管理する管理装置,情報処理装置又はコンピュータの一例である。
【0021】
NWスイッチ5は、外部NWと複数のサーバ3の各々との間を相互に通信可能に接続し、外部NWと複数のサーバ3の各々との間の通信を制御するスイッチ装置である。例えば、NWスイッチ5は、通信経路5aを介してサーバ3の各々と接続され、通信経路5bを介して外部NWと接続されてよい。
【0022】
通信経路5a及び5bは、種々のNWであってよい。例えば、通信経路5a及び5bの一方又は双方は、イーサネット(登録商標),PCIe(Peripheral Component Interconnect express),インフィニバンド,ミリネット等の、高速なバスアーキテクチャに対応したネットワーク(インターコネクト)であってもよい。
【0023】
管理用NWスイッチ6は、管理サーバ4と複数のサーバ3の各々との間を相互に通信可能に接続し、管理サーバ4と複数のサーバ3の各々との間の通信を制御するスイッチ装置である。例えば、管理用NWスイッチ6は、通信経路6aを介してサーバ3の各々と接続され、通信経路6bを介して管理サーバ4と接続されてよい。
【0024】
通信経路6a及び6bは、種々のNWであってよい。例えば、通信経路6a及び6bの一方又は双方は、通信経路5a及び5bと同様のNWであってもよいし、より低速なNWであってもよい。
【0025】
〔B〕ハードウェア構成例
一実施形態に係る管理サーバ4は、仮想サーバ(VM:Virtual Machine)であってもよいし、物理サーバであってもよい。また、管理サーバ4の機能は、1台のコンピュータにより実現されてもよいし、2台以上のコンピュータにより実現されてもよい。さらに、管理サーバ4の機能のうちの少なくとも一部は、クラウド環境により提供されるHW(Hardware)リソース及びNW(Network)リソースを用いて実現されてもよい。
【0026】
図2は、一実施形態に係る管理サーバ4の機能を実現するコンピュータ10のハードウェア(HW)構成例を示すブロック図である。管理サーバ4の機能を実現するHWリソースとして、複数のコンピュータが用いられる場合は、各コンピュータが
図2に例示するHW構成を備えてよい。
【0027】
図2に示すように、コンピュータ10は、HW構成として、例示的に、プロセッサ10a、グラフィック処理装置10b、メモリ10c、記憶部10d、IF(Interface)部10e、IO(Input / Output)部10f、及び読取部10gを備えてよい。
【0028】
プロセッサ10aは、種々の制御や演算を行なう演算処理装置の一例である。プロセッサ10aは、コンピュータ10内の各ブロックとバス10jで相互に通信可能に接続されてよい。なお、プロセッサ10aは、複数のプロセッサを含むマルチプロセッサであってもよいし、複数のプロセッサコアを有するマルチコアプロセッサであってもよく、或いは、マルチコアプロセッサを複数有する構成であってもよい。
【0029】
プロセッサ10aとしては、例えば、CPU、MPU、APU、DSP、ASIC、FPGA等の集積回路(IC:integrated circuit)が挙げられる。なお、プロセッサ10aとして、これらの集積回路の2以上の組み合わせが用いられてもよい。CPUはCentral Processing Unitの略称であり、MPUはMicro Processing Unitの略称である。APUはAccelerated Processing Unitの略称である。DSPはDigital Signal Processorの略称であり、ASICはApplication Specific ICの略称であり、FPGAはField-Programmable Gate Arrayの略称である。
【0030】
グラフィック処理装置10bは、IO部10fのうちのモニタ等の出力装置に対する画面表示制御を行なう。グラフィック処理装置10bとしては、種々の演算処理装置、例えば、GPU(Graphics Processing Unit)、APU、DSP、ASIC又はFPGA等の集積回路(IC)が挙げられる。
【0031】
メモリ10cは、種々のデータやプログラム等の情報を格納するHWの一例である。メモリ10cとしては、例えばDRAM(Dynamic Random Access Memory)等の揮発性メモリ、及び、PM(Persistent Memory)等の不揮発性メモリ、の一方又は双方が挙げられる。
【0032】
記憶部10dは、種々のデータやプログラム等の情報を格納するHWの一例である。記憶部10dとしては、HDD(Hard Disk Drive)等の磁気ディスク装置、SSD(Solid State Drive)等の半導体ドライブ装置、不揮発性メモリ等の各種記憶装置が挙げられる。不揮発性メモリとしては、例えば、フラッシュメモリ、SCM(Storage Class Memory)、ROM(Read Only Memory)等が挙げられる。
【0033】
記憶部10dは、コンピュータ10の各種機能の全部若しくは一部を実現するプログラム10h(例えば管理プログラム)を格納してよい。
【0034】
例えば、管理サーバ4のプロセッサ10aは、記憶部10dに格納されたプログラム10hをメモリ10cに展開して実行することにより、後述する管理サーバ4(例えば
図4に示す制御部47)としての機能を実現できる。
【0035】
IF部10eは、管理サーバ4とサーバ3との間の接続及び通信の制御等を行なう通信IFの一例である。例えば、IF部10eは、イーサネット(登録商標)等のLAN(Local Area Network)、或いは、FC(Fibre Channel)等の光通信等に準拠したアダプタを含んでよい。当該アダプタは、無線及び有線の一方又は双方の通信方式に対応してよい。
【0036】
例えば、管理サーバ4は、IF部10e,通信経路6a及び6b,管理用NWスイッチ6を介して、
図1に例示するサーバ3と相互に通信可能に接続されてよい。なお、プログラム10hは、当該通信IFを介して、NW(例えば外部NW)からコンピュータ10にダウンロードされ、記憶部10dに格納されてもよい。
【0037】
IO部10fは、入力装置、及び、出力装置、の一方又は双方を含んでよい。入力装置としては、例えば、キーボード、マウス、タッチパネル等が挙げられる。出力装置としては、例えば、モニタ、プロジェクタ、プリンタ等が挙げられる。また、IO部10fは、入力装置及び表示装置が一体となったタッチパネル等を含んでもよい。出力装置は、グラフィック処理装置10bに接続されてよい。
【0038】
読取部10gは、記録媒体10iに記録されたデータやプログラムの情報を読み出すリーダの一例である。読取部10gは、記録媒体10iを接続可能又は挿入可能な接続端子又は装置を含んでよい。読取部10gとしては、例えば、USB(Universal Serial Bus)等に準拠したアダプタ、記録ディスクへのアクセスを行なうドライブ装置、SDカード等のフラッシュメモリへのアクセスを行なうカードリーダ等が挙げられる。なお、記録媒体10iにはプログラム10hが格納されてもよく、読取部10gが記録媒体10iからプログラム10hを読み出して記憶部10dに格納してもよい。
【0039】
記録媒体10iとしては、例示的に、磁気/光ディスクやフラッシュメモリ等の非一時的なコンピュータ読取可能な記録媒体が挙げられる。磁気/光ディスクとしては、例示的に、フレキシブルディスク、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク、HVD(Holographic Versatile Disc)等が挙げられる。フラッシュメモリとしては、例示的に、USBメモリやSDカード等の半導体メモリが挙げられる。
【0040】
上述したコンピュータ10のHW構成は例示である。従って、コンピュータ10内でのHWの増減(例えば任意のブロックの追加や削除)、分割、任意の組み合わせでの統合、又は、バスの追加若しくは削除等は適宜行なわれてもよい。
【0041】
なお、サーバ3の機能を実現するコンピュータは、
図2に例示するコンピュータ10と同様のHW構成を備えてもよい。例えば、サーバ3のプロセッサ10aは、記憶部10dに格納されたプログラム10hをメモリ10cに展開して実行することにより、後述するサーバ3(例えば
図4に示す制御部34)としての機能を実現できる。
【0042】
サーバ3のプロセッサ10aが実行するプログラム10hは、例えば、管理サーバ4による冗長構成の管理に用いられるプログラム、並びに、システム2が提供するサービスを実現するための所定の処理を実行するプログラムを含んでもよい。
【0043】
〔C〕ソフトウェア構成例
まず、一実施形態に係る冗長構成システム1の処理の一例を説明する。冗長構成システム1において、管理サーバ4は、例えば、以下の(i)及び(ii)の処理を実行する。
【0044】
(i)管理サーバ4は、冗長構成であるシステム#0及び#1のうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、稼働状態のシステム2の所定期間における負荷量の積算値に基づき、切替閾値を設定する。
【0045】
(ii)管理サーバ4は、稼働状態のシステム2の負荷量の積算値が切替閾値を超える都度、システム#0及び#1の各々を、稼働状態から停止状態に、又は、停止状態から稼働状態に切り替える。
【0046】
例えば、管理サーバ4は、冗長構成システム1の起動時や構成変更時等の、運用開始のタイミングで上記(i)の処理を実行し、設定した切替閾値を用いて、その後の切替タイミングを制御してよい。
【0047】
「稼働状態」とは、例えば、所定の処理を実行可能な状態でシステム2(サーバ3)が起動されている状態であってよく、「アクティブ状態」(Active state)と称されてもよい。「停止状態」とは、例えば、システム2(サーバ3)が休止した状態で、システム2が所定の処理を実行しない状態(予備状態)であってよく、「スタンバイ状態」(Standby state)と称されてもよい。なお、停止状態は、サーバ3の電源OFF等によりシステム2が動作していないコールドスタンバイ状態を含んでもよいし、稼働状態のシステム2よりも負荷が小さい状態でシステム2(サーバ3)が起動されている、ホットスタンバイ状態を含んでもよい。
【0048】
以下、便宜上、システム2の現在の状態を「運用状態」(Operating state/condition)と表記する。また、システム2の運用状態が稼働状態であることを、「アクティブ状態」又は単に「稼働」と表記し、システム2の運用状態が停止状態であることを、「スタンバイ状態」又は単に「停止」と表記する。さらに、アクティブ状態のサーバ3を稼働サーバ3,スタンバイ状態のサーバ3を停止サーバ3と表記する場合がある。
【0049】
また、以下の説明において、システム#0及び#1のうちの一方を稼働又は停止させるという表記は、システム#0及び#1のうちの他方を停止又は稼働させることを含んでよく、システム2の運用状態を切り替えることを意味してよい。
【0050】
管理サーバ4によれば、アクティブ状態(稼働側)のシステム2の負荷量の積算値に基づく、システム#0及び#1の動作状態の切り替えにより、システム#0及び#1では、アクティブ状態である個々の期間において、均一又は略均一の負荷量が課されることになる。これにより、冗長構成システム1の運用期間において、システム#0及び#1間の負荷を均等にする、換言すれば、システム#0及び#1を均等に劣化させることができ、各システム2における障害発生の確率を低減させることができる。
【0051】
図3は、一実施形態に係るシステム2の動作状態の切替タイミングの一例を説明するための図である。
図3の符号A及びBには、比較例として第1手法及び第2手法の切替タイミングを示し、
図3の符号Cには、一実施形態に係るシステム2の切替タイミングの一例を示す。なお、
図3では、システム#0がアクティブ状態である区間を斜線の枠で示し、システム#1がアクティブ状態である区間を網掛けの枠で示し、システム#0及び#1がスタンバイ状態である区間を白抜きの枠で示す。
【0052】
図3では、タイミングt0で冗長構成システム1の運用を開始し、タイミングt8で冗長構成システム1の運用を終了(例えば次世代の冗長構成システム1への移行等)するものとする。t0~t8の期間は、数年間~十数年間程度であってよい。
【0053】
符号Aに示す第1手法では、タイミングt0でシステム#0が稼働し、タイミングt5でサーバ#0に障害が発生(符号A1参照)し、システム#1がスタンバイ状態からアクティブ状態に切り替わった例を示す。タイミングt5では、サーバ#0の交換作業が行なわれ、サーバ#0の交換後のシステム#0がスタンバイ状態となる。なお、タイミングt0~t5は、サーバ3の平均稼働期間であるものとする。平均稼働期間は、サーバ3が稼働し続けることのできる平均期間であり、例えば、サーバ3が継続して稼働する場合における、製品寿命の平均期間、又は、障害未発生の平均期間であってよい。
【0054】
符号Bに示す第2手法では、タイミングt0でシステム#0が稼働し、所定期間(例えば1年間)経過後のタイミングt1でシステム#1がスタンバイ状態からアクティブ状態に切り替わった例を示す。第2手法では、所定期間ごとに、システム#0及び#1の各々の運用状態が稼働,停止と交互に切り替わる。
【0055】
例えば、タイミングt1~t3においてアクティブ状態のシステム#1の処理負荷が平均よりも増加すると、システム#1の劣化の程度が平均よりも大きくなる(符号B1参照)。この場合、タイミングt7において、タイミングt6でアクティブ状態になったシステム#1に障害が発生すると(符号B2参照)、システム#0がスタンバイ状態からアクティブ状態に切り替わる。タイミングt7では、サーバ#1の交換作業が行なわれ、サーバ#1の交換後のシステム#1がスタンバイ状態となる。
【0056】
このように、第1手法ではタイミングt5で、第2手法ではタイミングt7で、運用の終了を迎えるタイミングt8よりも前に、障害の発生したサーバ3の代替機の購入費用及び作業費用が発生する。
【0057】
一方、符号Cに示す例では、管理サーバ4は、タイミングt0でシステム#0を稼働させ、所定期間経過後のタイミングt1において、システム#0(例えばサーバ#0のプロセッサ)の負荷量の積算値に基づき切替閾値を設定する(符号C1参照)。なお、所定期間は、第2手法と同じ1年間であるものとするが、異なってもよい。
【0058】
切替閾値の設定後、管理サーバ4は、タイミングt1でシステム#0及び#1の運用状態を切り替え、システム#1を稼働させる。ここで、第2手法と同様に、タイミングt1~t3においてアクティブ状態のシステム2の処理負荷が平均よりも増加した場合を想定する。
【0059】
上述したタイミングt0~t1における、切替閾値の設定処理及び初回の切替処理は、閾値設定フェーズの一例である。
【0060】
管理サーバ4は、タイミングt3よりも前であるタイミングt2で、システム#1の負荷量の積算値が切替閾値を超えたことを検出し、システム#0及び#1の運用状態を切り替え、システム#0を稼働させる。また、管理サーバ4は、タイミングt2から所定期間が経過するよりも前であるタイミングt4で、システム#0の負荷量の積算値が切替閾値を超えたことを検出し、システム#0及び#1の運用状態を切り替え、システム#1を稼働させる。
【0061】
また、例えば、タイミングt4~t5付近においてアクティブ状態のシステム2の処理負荷が平均よりも低下した場合を想定する。この場合、管理サーバ4は、タイミングt4から所定期間が経過したタイミングよりも後に、システム#1の負荷量の積算値が切替閾値を超えたことを検出し、システム#0及び#1の運用状態を切り替え、システム#0を稼働させる。
【0062】
上述したタイミングt1以降(例えばt1~t8)における、切替閾値に応じた切替処理は、運用状態切替フェーズの一例である。
【0063】
このように、管理サーバ4は、アクティブ状態であるシステム2の負荷量の積算値に応じたタイミングでシステム2の運用状態の切り替えを行なうことで、システム#0及び#1の処理負荷,劣化度合いを平均化でき、システム2の障害発生の確率を低減させることができる。
図3の例では、冗長構成システム1の運用開始(タイミングt0)から運用終了(タイミングt8)までシステム2の障害の発生を抑制でき、第1手法及び第2手法と比較して、冗長構成システム1の寿命を延ばすことができる。また、サーバ3の代替機の購入費用及び作業費用の発生を抑制できる。
【0064】
次に、冗長構成システム1の処理を実現するためのソフトウェア構成例を説明する。
【0065】
図4は、一実施形態に係る冗長構成システム1のソフトウェア構成例を示すブロック図である。
図4に示すように、サーバ3は、例示的に、サーバ処理部31,状態情報送信部32,及び切替処理部33を備えてよい。サーバ処理部31,状態情報送信部32,及び切替処理部33は、制御部34の一例である。
【0066】
サーバ処理部31は、システム2が提供するサービスを実現するための所定の処理を実行する。例えば、サーバ処理部31は、外部NWに接続されたクライアントコンピュータから、NWスイッチ5を経由して受信したリクエストに応じた処理を行ない、処理結果をクライアントコンピュータに送信する。
【0067】
状態情報送信部32は、管理サーバ4にサーバ3の情報に関する状態情報を送信する。状態情報は、負荷情報及び障害情報を含んでよい。
【0068】
例えば、状態情報送信部32は、管理サーバ4から負荷情報の取得要求を受信すると、一定期間におけるサーバ3の負荷情報を収集し、負荷情報を含む状態情報を一定期間ごとに管理サーバ4に送信する。一定期間としては、例えば1時間~1日等の期間であってよい。一実施形態では、一定期間が1日であるものとする。なお、一定期間は、数秒~数十分間程度の短い時間間隔であってもよく、状態情報送信部32は、当該短い時間間隔で、負荷情報を含む状態情報を略リアルタイムで管理サーバ4に送信してもよい。
【0069】
負荷情報としては、例えば、プロセッサ10aの使用率が挙げられる。使用率は、負荷量の一例である。状態情報送信部32は、例えば、サーバ3が実行するOS(Operating System)のシステムモニタ(パフォーマンスモニタ)から、プロセッサ10aの使用率を収集し、一定期間における使用率の情報を管理サーバ4に送信してよい。一定期間における使用率の情報としては、例えば、システムモニタから使用率が出力される時間間隔ごとの使用率の集合(複数の使用率)であってもよいし、これらの使用率の集合の積分値であってもよい。
【0070】
また、状態情報送信部32は、サーバ3において発生した障害に関する障害情報を、状態情報に含めて管理サーバ4に送信する。障害情報は、例えば、サーバ3が実行するアプリケーション,OS,デバイスドライバ,又はハードウェアから取得されてよい。
【0071】
切替処理部33は、管理サーバ4から運用状態の切替制御情報を受信すると、サーバ3の運転状態を切替制御情報が示す状態(稼働又は停止)に遷移させる。
【0072】
例えば、切替制御情報が停止を示す場合、切替処理部33は、スタンバイ状態からアクティブ状態に遷移した他のサーバ3に実行中の処理に関する情報を送信し、OSと協働して自身のサーバ3の電源をOFFに(例えばシャットダウン)してよい。
【0073】
また、例えば、切替処理部33は、起動指示の受信により自身のサーバ3が起動し、稼働を示す切替制御情報を受信した場合、他のサーバ3が実行中の処理に関する情報を当該他のサーバ3から受信して、当該実行中の処理を引き継いでよい。起動指示は、例えば、遠隔でサーバ3を起動するための起動コマンド(例えばパケット等)を含んでもよい。サーバ3のIF部10e又は電源制御用の装置は、起動コマンドを受信すると、自身のサーバ3を起動してよい。
【0074】
切替処理部33によるサーバ3の運用状態の切替処理は、上述した処理に限定されるものではなく、既知の種々の手法により実現されてよい。
【0075】
図4に示すように、管理サーバ4は、例示的に、メモリ部41,負荷算出部42,タイマ部43,切替判定部44,障害発生検出部45,及び切替実行部46を備えてよい。負荷算出部42,タイマ部43,切替判定部44,障害発生検出部45,及び切替実行部46は、制御部47の一例である。
【0076】
メモリ部41は、記憶領域の一例であり、管理サーバ4が利用する種々のデータを記憶する。メモリ部41は、例えば、
図2に示すメモリ10c及び記憶部10dのうちの一方又は双方が有する記憶領域により実現されてよい。
【0077】
図4に示すように、メモリ部41は、例示的に、サーバ情報41a及び切替負荷量41bを記憶可能であってよい。以下の説明では、サーバ情報41aをテーブル形式で表記するが、これに限定されるものではなく、サーバ情報41aは、DB(Database)形式を含む種々の形式のデータであってもよい。
【0078】
図5は、サーバ情報41aの一例を示す図である。
図5に例示するように、サーバ情報41aは、「サーバ名」,「アドレス」,「運用状態」,「負荷積算値」,「障害有無」,「切替可否」の項目を含んでよい。
【0079】
「サーバ名」は、冗長構成システム1に備えられるサーバ3の名前であり、識別情報の一例である。「アドレス」は、管理サーバ4がアクセス可能なサーバ3のアドレスであり、例えばIP(Internet Protocol)アドレスやMAC(Media Access Control)アドレス等の種々のアドレスであってよい。「運用状態」は、現在のサーバ3の運用状態、例えばアクティブ状態又はスタンバイ状態を示す。
【0080】
「負荷積算値」は、サーバ3がアクティブ状態に遷移してから現在までの負荷量の積算値である。「障害有無」は、サーバ3における障害の発生有無を示す情報である。「切替可否」は、サーバ3が切替可能か否かを示す情報である。
【0081】
図4の説明に戻り、負荷算出部42は、サーバ情報41aを参照し、稼働サーバ3のアドレスに負荷情報の取得要求を送信して、サーバ3から負荷情報(状態情報)を受信する。取得要求は、運用状態の切り替えまで一定期間ごとに負荷情報を送信することをサーバ3に指示する要求でもよいし、管理サーバ4がサーバ3を一定期間ごとに監視する場合、監視の都度、直近の一定期間の負荷情報を送信することをサーバ3に指示する要求であってもよい。例えば、負荷算出部42は、冗長構成システム1の運用開始又は切り替えのタイミングで取得要求を送信してよい。
【0082】
負荷算出部42は、取得した負荷量の積算値を稼働サーバ3に対応付けてメモリ部41に格納する。例えば、負荷算出部42は、サーバ3から受信した負荷情報から、負荷量の積算値を算出し、算出した積算値をサーバ情報41aの負荷積算値に加算(設定)する。負荷情報がプロセッサ10aの使用率の集合である場合、負荷算出部42は、使用率の集合の積分値を負荷積算値として算出してよい。プロセッサ10aの使用率の積分値は、負荷量の積算値の一例である。
【0083】
負荷算出部42による負荷情報の取得は、閾値設定フェーズ及び運用状態切替フェーズの双方において実行されてよい。
【0084】
負荷算出部42は、閾値設定フェーズにおいて、タイマ部43から所定期間の経過を通知されると、サーバ情報41aにおける稼働サーバ3の負荷積算値を、切替負荷量41bとしてメモリ部41に格納する。なお、負荷算出部42は、所定期間経過時点での稼働サーバ3の負荷積算値に代えて、当該負荷積算値にプラス又はマイナスのマージンを負荷した値を、切替負荷量41bに設定してもよい。マージンとしては、例えば、負荷積算値の数%,或いはサーバ3の1日~数日分の負荷積算値等が挙げられる。
【0085】
タイマ部43は、閾値設定フェーズの開始タイミングから所定期間(例えば1年間)の計時を行なう。例えば、タイマ部43は、閾値設定フェーズにおいて負荷算出部42がサーバ3に負荷情報の取得要求を送信してから計時を開始し、所定期間が経過したタイミングで、負荷算出部42及び切替判定部44に所定期間の経過を通知してよい。
【0086】
切替判定部44は、閾値設定フェーズ及び運用状態切替フェーズのそれぞれにおいて、複数のサーバ3の運用状態の切り替えを行なうか否かを判定する。
【0087】
例えば、切替判定部44は、タイマ部43から通知を受信していない場合(運用開始から所定期間が経過していない場合)、又は、切替負荷量41bが未設定である場合、現在が閾値設定フェーズであると判定し、タイマ部43からの通知の受信を待ち受ける。タイマ部43から通知を受信すると、切替切替判定部44は、サーバ情報41aの複数のサーバ3の切替可否が全て「可」である場合に、運用状態を切替可能であると判定し、切替実行部46に運用状態の切替指示を発行する。
【0088】
また、切替判定部44は、タイマ部43から通知を受信済みである場合、又は、切替負荷量41bが設定済みの場合、現在が運用状態切替フェーズであると判定し、サーバ情報41aの稼働サーバ3の負荷積算値と切替負荷量41bとを比較する。比較の結果、負荷積算値が切替負荷量41bを超えており、且つ、サーバ情報41aの複数のサーバ3の切替可否が全て「可」である場合に、運用状態を切替可能であると判定し、切替実行部46に運用状態の切替指示を発行する。
【0089】
なお、切替判定部44は、サーバ情報41aの切替可否を参照する前に、当該切替可否の値を更新してもよい。切替可否の更新は、切替可否を参照する前に限定されるものではなく、定期的に、又は、サーバ3の状況に変化のあった場合に実行されてもよい。
【0090】
例えば、切替判定部44は、稼働サーバ3で実行中の処理が少ない又は無い場合、定期的(計画的)な停電等でシステム2を停止させる場合等の、サーバ3を停止させてもサービスへの影響が小さい期間に、切替可否に「可」を設定してよい。また、切替判定部44は、稼働サーバ3で実行中の処理が多い期間には、切替可否に「否」を設定してよい。稼働サーバ3で実行中の処理が多いか否かは、例えば、稼働サーバ3から受信する状態情報(例えば直近の負荷情報)が所定の閾値を超えているか否か等に基づき判定されてよい。
【0091】
さらに、切替判定部44は、サーバ情報41aの切替可否を参照する際に、停止サーバ3に起動指示を送信し、停止サーバ3が正常に起動した場合に、停止サーバ3の切替可否に「可」を設定してよい。また、切替判定部44は、停止サーバ3が正常に起動しない場合、障害情報を障害発生検出部45に通知してよい。
【0092】
障害発生検出部45は、サーバ3又は切替判定部44から障害情報を受信すると、サーバ情報41aにおける障害の発生したサーバ3の障害有無に障害が有ることを示す情報(例えば「有」)を設定する。また、障害発生検出部45は、冗長構成システム1の管理者に障害の発生を通知する。管理者への障害の発生の通知手法は、既知の種々の手法が用いられてよい。
【0093】
そして、障害発生検出部45は、障害の発生したサーバ3がアクティブ状態である場合、停止サーバ3に起動指示を送信し、停止サーバ3が正常に起動した場合に、障害の発生に起因する切替指示を切替実行部46に発行する。このとき、障害発生検出部45は、サーバ情報41aにおける停止サーバ3の切替可否に「可」を設定してよい。
【0094】
一方、障害発生検出部45は、障害の発生したサーバ3がスタンバイ状態である場合、又は、稼働サーバ3及び停止サーバ3の双方に障害が発生した場合、サーバ情報41aにおける停止サーバ3の切替可否に「否」を設定し、切替実行部46への切替指示の発行を抑制する。
【0095】
切替実行部46は、切替判定部44から切替指示を受信すると、複数のサーバ3の各々に切替制御情報を送信する。例えば、切替実行部46は、サーバ情報41aにおいて運用状態がスタンバイ状態である停止サーバ3に稼働を示す切替制御情報を送信し、サーバ情報41aにおいて運用状態がアクティブ状態である稼働サーバ3に停止を示す切替制御情報を送信してよい。停止サーバ3は、切替判定部44による起動指示の送信により起動されている。このため、稼働サーバ3及び停止サーバ3のそれぞれに対する切替制御情報の送信により、稼働サーバ3及び停止サーバ3間で所定の処理の引き継ぎが可能となり、運用状態の切替前後で所定の処理を継続して(途切れずに)実行させることができる。
【0096】
切替実行部46は、切替制御情報の送信に応じて各サーバ3の運用状態が変化すると、サーバ情報41aの運用状態を更新してよい。また、切替負荷量41bは、サーバ情報41aにおいて、アクティブ状態からスタンバイ状態に切り替わったサーバ3に対応付けられた負荷積算値を初期化(例えば0にリセット)してよい。
【0097】
また、切替実行部46は、障害発生検出部45から障害の発生に起因した切替指示を受信した場合、切替判定部44から切替指示を受信した場合と同様に、複数のサーバ3の各々に切替制御情報を送信する。
【0098】
なお、切替実行部46は、切替判定部44からの切替指示と、障害発生検出部45からの切替指示とを調停し、両者を同じタイミングで受信した(両者が競合した)場合には、障害発生検出部45からの切替指示に応じた切替制御情報の送信を優先させてよい。
【0099】
〔D〕動作例
次に、一実施形態に係る冗長構成システム1(例えば管理サーバ4)の動作例を説明する。
図6は、一実施形態に係る管理サーバ4の動作例を説明するためのフローチャートであり、
図7は、管理サーバ4の動作例を説明するための図である。
【0100】
なお、
図6に例示する処理は、冗長構成システム1の運用が開始され、負荷算出部42が稼働サーバ3に負荷情報の取得要求を送信した場合の処理であり、定期的に、又は、管理サーバ4が稼働サーバ3から状態情報を受信する都度実行されてよい。
【0101】
図6に例示するように、障害発生検出部45は、稼働サーバ3から受信した状態情報に基づき、稼働サーバ3で障害が発生しているか否かを判定する(ステップS1:
図7の処理P1)。
【0102】
稼働サーバ3で障害が発生している場合(ステップS1でYES)、障害発生検出部45は、停止サーバ3に起動指示を送信し、停止サーバ3の正常起動後、切替実行部46に障害に起因する切替指示を発行する(
図7の処理P2)。切替実行部46は、障害に起因する切替指示を受信すると(
図7の処理P3)、稼働サーバ3及び停止サーバ3の各々に運用制御情報を送信することで(
図7の処理P4)、各サーバ3の運用状態を切り替える(ステップS2)。
【0103】
また、障害発生検出部45は、冗長構成システム1の管理者に障害情報を通知し(ステップS3)、処理が終了する。
【0104】
ステップS1において、稼働サーバ3で障害が発生していない場合(ステップS1でNO)、負荷算出部42は、稼働サーバ3から負荷情報を取得したか否かを判定する(ステップS4)。
【0105】
負荷情報を取得していない場合(ステップS4でNO)、処理が終了する。負荷情報を取得した場合(ステップS4でYES)、負荷算出部42は、負荷情報(稼働サーバ3の負荷率)の所定期間における積分値を算出する(ステップS5:
図7の処理P5)。例えば、負荷算出部42は、サーバ情報41aの稼働サーバ3の負荷積算値に算出した積分値を加算する。
【0106】
管理サーバ4は、切替負荷量41bがメモリ部41に保存済みか否かを判定する(ステップS6)。切替負荷量41bがメモリ部41に保存されていない場合(ステップS6でNO)、現在は閾値設定フェーズである。負荷算出部42は、運用開始から所定期間が経過したか否かを判定し(ステップS7)、所定期間が経過していない場合(ステップS7でNO)、処理が終了する。
【0107】
運用開始から所定期間が経過した場合(ステップS7でYES)、タイマ部43から負荷算出部42に所定期間の経過が通知される(
図7の処理P6)。この場合、負荷算出部42は、サーバ情報41aの稼働サーバ3の負荷積算値を切替負荷量41bとしてメモリ部41に保存する(ステップS8:
図7の処理P7)。
【0108】
切替判定部44は、所定の期間の経過により、切替判定処理を行なう。ステップS9において、切替判定部44は、サーバ情報41aを参照し、停止サーバ3を起動して切替可否を判定する(
図7の処理P8)。
【0109】
切替判定部44は、切替可能なタイミング、例えば、サーバ情報41aの全てのサーバ3の切替可否が「可」になったタイミングで、切替実行部46に切替指示を発行する(
図7の処理P9)。
【0110】
切替実行部46は、切替指示を受信すると(
図7の処理P3)、稼働サーバ3及び停止サーバ3の各々に運用制御情報を送信することで(
図7の処理P4)、各サーバ3の運用状態を切り替え(ステップS10)、処理が終了する。
【0111】
ステップS6において、切替負荷量41bがメモリ部41に保存済みである場合(ステップS6でYES)、現在は運用状態切替フェーズである。切替判定部44は、サーバ情報41aにおける稼働サーバ3の負荷積算値が切替負荷量41bよりも大きいか否かを判定する(ステップS11:
図7の処理P8)。負荷積算値が切替負荷量41b以下である場合(ステップS11でNO)、処理が終了する。
【0112】
稼働サーバ3の負荷積算値が切替負荷量41bよりも大きい場合(ステップS11でYES)、切替判定部44は、切替実行部46に切替指示を発行し(
図7の処理P9)、処理がステップS9に移行する。
【0113】
〔E〕その他
上述した一実施形態に係る技術は、以下のように変形、変更して実施することができる。
【0114】
例えば、
図4に示すサーバ3及び管理サーバ4のそれぞれの装置が備えるソフトウェア構成は、それぞれの装置において、任意の組み合わせで併合してもよく、それぞれ分割してもよい。
【0115】
また、一実施形態では、負荷量として、サーバ3のプロセッサ10aの使用率を例に挙げたが、これに限定されるものではなく、サーバ3のシステムモニタから取得可能な種々の指標が用いられてもよい。例えば、負荷量は、以下のように、サーバ3が備える個々の装置の劣化度合いを推定可能な種々の指標であってもよい。
・サーバ3のプロセッサ10aの使用率
・サーバ3の記憶部10dの使用率,使用量又は書込回数
・サーバ3のIF部10eのネットワーク使用率又は通信量
【0116】
例えば、負荷算出部42は、負荷量として、上述した指標のうちの2種類以上の指標の組み合わせを用いてもよい。この場合、負荷算出部42は、負荷量として用いる指標ごとに、指標の積算値、例えば積分値を算出し、指標ごとの負荷積算値をサーバ情報41aに格納してよい。また、閾値設定フェーズでは、負荷算出部42は、運用開始から所定期間の経過時点の指標ごとの積算値を、それぞれの切替負荷量41bとしてメモリ部41に格納してよい。
【0117】
切替判定部44は、運用状態切替フェーズにおいて、指標ごとに、負荷積算値と切替負荷量41bとを比較し、比較の結果が以下の(a)~(c)の条件のうちの少なくとも1つの条件を満たす場合に、切替可否の判定処理を行なってもよい。
【0118】
(a)少なくとも1つの指標の負荷積算値が当該指標の切替負荷量41bを超えた場合。
(b)負荷積算値が切替負荷量41bを超えた指標の数が所定数を超えた場合、又は、負荷量として用いる指標の数に対する、負荷積算値が切替負荷量41bを超えた指標の数の割合が、所定割合を超えた場合。
(c)指標ごとに負荷積算値又は切替負荷量41bに重み付けを行なった場合において、上記(a)又は(b)の条件を満たす場合。
【0119】
このように、負荷量として2種類以上の指標を用いることで、システム2のワークロードやサーバ3の構成等に応じて、切替可否の判定を適切に行なうことができる。
【0120】
また、一実施形態では、閾値設定フェーズで設定された切替負荷量41bは、運用状態切替フェーズにおいて変化しない(一定の値である)場合を例に挙げたが、これに限定されるものではない。サーバ3は、アクティブ状態として稼働することで、時間の経過によって障害発生の確率が増加する。
【0121】
そこで、負荷算出部42は、閾値設定フェーズにおいて、サーバ3の累積稼働量が所定の条件を満たした場合に、切替負荷量41bを減少させてもよい。累積稼働量が所定の条件を満たした場合とは、例えば、閾値設定フェーズからの経過時間が、所定の時間(所定期間と同一でもよいし異なってもよい)を超えたことであってもよい。或いは、累積稼働量が所定の条件を満たした場合とは、いずれかのサーバ3がアクティブ状態として稼働したときの負荷積算値の累積値が、所定の閾値を超えたことであってもよい。所定の時間及び所定の閾値のそれぞれは、複数設定されてもよく、この場合、切替負荷量41bは、複数のタイミングで減少されてもよい。
【0122】
減少量は、運用開始からの経過時間が長いほど大きくなってよい。例えば、負荷算出部42は、切替負荷量41bを減少させる際に、段階的に、又は、線形若しくは非線形の関数に従い、切替負荷量41bを減少させてもよい。
【0123】
これにより、サーバ3の劣化度合いに追従して稼働期間を短縮することができ、サーバ3の障害発生の確率をより低減させることができる。
【0124】
さらに、
図4に示す管理サーバ4は、複数の装置がネットワークを介して互いに連携することにより、各処理機能を実現してもよい。一例として、メモリ部41はDBサーバ、負荷算出部42,タイマ部43,切替判定部44,障害発生検出部45及び切替実行部46はアプリケーションサーバ又はWebサーバ等であってもよい。この場合、DBサーバ、アプリケーションサーバ及びwebサーバが、ネットワークを介して互いに連携することにより、管理サーバ4としての各処理機能を実現してもよい。
【0125】
〔F〕付記
以上の実施形態に関し、さらに以下の付記を開示する。
【0126】
(付記1)
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
制御部を備える、管理装置。
【0127】
(付記2)
前記制御部は、
前記稼働状態であるシステムから、一定期間ごとに前記負荷量を取得し、
取得した前記負荷量の積算値を前記稼働状態であるシステムに対応付けてメモリに格納し、
前記切り替える処理により前記稼働状態から前記停止状態に切り替わったシステムに対応付けられた前記積算値を初期化する、
付記1に記載の管理装置。
【0128】
(付記3)
前記制御部は、前記切替閾値を設定したときに、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
付記1又は付記2に記載の管理装置。
【0129】
(付記4)
前記負荷量は、前記稼働状態のシステムが備えるプロセッサの使用率であり、
前記積算値は、前記プロセッサの使用率の前記所定期間における積分値である、
付記1~付記3のいずれか1項に記載の管理装置。
【0130】
(付記5)
前記負荷量は、複数の指標を含み、
前記制御部は、
前記設定する処理において、前記所定期間における前記複数の指標のそれぞれの積算値に基づき、前記複数の指標のそれぞれの切替閾値を設定し、
前記切り替える処理において、前記稼働状態であるシステムの前記複数の指標のそれぞれの積算値が、前記複数の指標のそれぞれの切替閾値を超えるか否かに基づき、前記切り替えを行なうか否かを判定する、
付記1~付記4のいずれか1項に記載の管理装置。
【0131】
(付記6)
前記制御部は、前記第1システム又は前記第2システムの累積稼働量が所定の条件を満たした場合に、前記切替閾値を減少させる、
付記1~付記5のいずれか1項に記載の管理装置。
【0132】
(付記7)
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理をコンピュータが実行する、管理方法。
【0133】
(付記8)
前記稼働状態であるシステムから、一定期間ごとに前記負荷量を取得し、
取得した前記負荷量の積算値を前記稼働状態であるシステムに対応付けてメモリに格納し、
前記切り替える処理により前記稼働状態から前記停止状態に切り替わったシステムに対応付けられた前記積算値を初期化する、
処理を前記コンピュータが実行する、付記7に記載の管理方法。
【0134】
(付記9)
前記切替閾値を設定したときに、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理を前記コンピュータが実行する、付記7又は付記8に記載の管理方法。
【0135】
(付記10)
前記負荷量は、前記稼働状態のシステムが備えるプロセッサの使用率であり、
前記積算値は、前記プロセッサの使用率の前記所定期間における積分値である、
付記7~付記9のいずれか1項に記載の管理方法。
【0136】
(付記11)
前記負荷量は、複数の指標を含み、
前記設定する処理は、前記所定期間における前記複数の指標のそれぞれの積算値に基づき、前記複数の指標のそれぞれの切替閾値を設定する、処理を含み、
前記切り替える処理は、前記稼働状態であるシステムの前記複数の指標のそれぞれの積算値が、前記複数の指標のそれぞれの切替閾値を超えるか否かに基づき、前記切り替えを行なうか否かを判定する、処理を含む、
付記7~付記10のいずれか1項に記載の管理方法。
【0137】
(付記12)
前記第1システム又は前記第2システムの累積稼働量が所定の条件を満たした場合に、前記切替閾値を減少させる、
処理を前記コンピュータが実行する、付記7~付記11のいずれか1項に記載の管理方法。
【0138】
(付記13)
冗長構成である第1システム及び第2システムのうちの一方を稼働状態に遷移させ、他方を停止状態に遷移させたときの、前記一方のシステムの所定期間における負荷量の積算値に基づき、切替閾値を設定し、
前記稼働状態であるシステムの負荷量の積算値が前記切替閾値を超える都度、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理をコンピュータに実行させる、管理プログラム。
【0139】
(付記14)
前記稼働状態であるシステムから、一定期間ごとに前記負荷量を取得し、
取得した前記負荷量の積算値を前記稼働状態であるシステムに対応付けてメモリに格納し、
前記切り替える処理により前記稼働状態から前記停止状態に切り替わったシステムに対応付けられた前記積算値を初期化する、
処理を前記コンピュータに実行させる、付記13に記載の管理プログラム。
【0140】
(付記15)
前記切替閾値を設定したときに、前記第1システム及び前記第2システムの各々を、前記稼働状態から前記停止状態に、又は、前記停止状態から前記稼働状態に切り替える、
処理を前記コンピュータに実行させる、付記13又は付記14に記載の管理プログラム。
【0141】
(付記16)
前記負荷量は、前記稼働状態のシステムが備えるプロセッサの使用率であり、
前記積算値は、前記プロセッサの使用率の前記所定期間における積分値である、
付記13~付記15のいずれか1項に記載の管理プログラム。
【0142】
(付記17)
前記負荷量は、複数の指標を含み、
前記設定する処理は、前記所定期間における前記複数の指標のそれぞれの積算値に基づき、前記複数の指標のそれぞれの切替閾値を設定する、処理を含み、
前記切り替える処理は、前記稼働状態であるシステムの前記複数の指標のそれぞれの積算値が、前記複数の指標のそれぞれの切替閾値を超えるか否かに基づき、前記切り替えを行なうか否かを判定する、処理を含む、
付記13~付記16のいずれか1項に記載の管理プログラム。
【0143】
(付記18)
前記第1システム又は前記第2システムの累積稼働量が所定の条件を満たした場合に、前記切替閾値を減少させる、
処理を前記コンピュータに実行させる、付記13~付記17のいずれか1項に記載の管理プログラム。
【符号の説明】
【0144】
1 冗長構成システム
10 コンピュータ
10a プロセッサ
10b グラフィック処理装置
10c メモリ
10d 記憶部
10e IF部
10f IO部
10g 読取部
10h プログラム
10i 記録媒体
2 システム
3 サーバ
31 サーバ処理部
32 状態情報送信部
33 切替処理部
34,47 制御部
4 管理サーバ
41 メモリ部
41a サーバ情報
41b 切替負荷量
42 負荷算出部
43 タイマ部
44 切替判定部
45 障害発生検出部
46 切替実行部
5 NWスイッチ
6 管理用NWスイッチ