特開2023-170055 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-170055情報処理装置及び情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023170055

(43)【公開日】2023-12-01

(54)【発明の名称】情報処理装置及び情報処理方法

(51)【国際特許分類】

G06F 11/20 20060101AFI20231124BHJP

G06F 3/06 20060101ALI20231124BHJP

G06F 9/50 20060101ALI20231124BHJP

G06F 16/11 20190101ALI20231124BHJP

【ＦＩ】

G06F11/20 666

G06F3/06 304F

G06F3/06 304N

G06F9/50 150D

G06F16/11

【審査請求】有

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2022081510

(22)【出願日】2022-05-18

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110002365

【氏名又は名称】弁理士法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】東祐一

【テーマコード（参考）】

5B034

【Ｆターム（参考）】

5B034BB02

5B034CC01

5B034DD06

(57)【要約】

【課題】ハイブリッドクラウドのメイン環境からバックアップ環境へシステムが切替えられる際に、切替え後のバックアップ環境におけるシステムの処理遅延を軽減する情報処理装置及び情報処理方法を提供する。
【解決手段】ハイブリッドクラウドにおけるリモートコピー処理装置２１は、パブリッククラウド５上のホスト５１からストレージ装置２２に格納された各データへのアクセス頻度に関するアクセス頻度とアクセス局所性を取得及び管理するデータアクセス頻度管理部２１２ａ及びデータアクセス局所性管理部２１２ｂと、システムの優先度とアクセス頻度とアクセス局所性とに基づいてリモートコピー処理の対象データを判定するコピーデータ判定部２１２ｃと、対象データのリモートコピー処理の実行開始をストレージ装置２２に対して指示するデータコピー実行部２１３ｃとを有する。
【選択図】図１

【特許請求の範囲】

【請求項1】

システムが稼働するホストが設けられるクラウドと、前記クラウド以外に設けられ、前記ホストがデータを読書きするストレージ装置とを有するハイブリッドクラウドにおいて、メイン環境のハイブリッドクラウドから前記ハイブリッドクラウドへのデータのリモートコピー処理を実行する情報処理装置であって、
前記メイン環境のハイブリッドクラウドは、前記システムが稼働するメイン環境のホストが設けられるクラウドと、該クラウド以外に設けられ、前記メイン環境のホストがデータを読書きするメイン環境のストレージ装置と、を有し、
前記ホストから前記ストレージ装置に格納された各データへのアクセス頻度に関するアクセス頻度情報を取得するアクセス頻度情報取得部と、
前記システムの優先度と前記アクセス頻度情報とに基づいて前記リモートコピー処理の対象データを判定するコピーデータ判定部と、
前記対象データの前記リモートコピー処理の実行開始を前記ストレージ装置に対して指示するデータコピー実行部と
を有することを特徴とする情報処理装置。

【請求項2】

請求項１に記載の情報処理装置であって、
前記メイン環境のホストのホスト情報を取得するホスト情報取得部と、
前記ホスト及び前記ストレージ装置の起動を指示すると共に、前記ホストのスケールイン／スケールアウトを行うホスト数の変更及び前記ストレージ装置へのリソース割当ての変更を指示する構成変更指示部と、
前記リモートコピー処理のコピー時間の履歴情報を取得するコピー処理情報取得部と、
前記履歴情報に基づいて前記対象データの前記リモートコピー処理の実行の指示から開始までのコピー待ち時間の予測値である予測コピー待ち時間を算出し、該予測コピー待ち時間が所定閾値の上限を超過するかを判定し、該予測コピー待ち時間が該所定閾値の上限を超過する場合に、該予測コピー待ち時間が該所定閾値の上限以下となるように、前記構成変更指示部に対して前記ホスト数の変更又は前記リソース割当ての変更を指示する予測コピー待ち時間算出部と、を有し、
前記ホスト情報が前記メイン環境のクラウドでの障害発生を示す場合に、
前記構成変更指示部は、
優先度が最も高い前記システムを再開対象システムとして前記クラウドで稼働させるために前記ホスト及び前記ストレージ装置の起動を指示し、
前記データコピー実行部は、
前記予測コピー待ち時間算出部によって前記予測コピー待ち時間が前記所定閾値の上限以下であると判定された場合に、前記対象データの前記リモートコピー処理の実行開始を前記ストレージ装置に対して指示する
ことを特徴とする情報処理装置。

【請求項3】

請求項２に記載の情報処理装置であって、
前記アクセス頻度情報は、
データを識別するデータＩＤ毎の前記ホストによる前記ストレージ装置に対する第１のアクセス回数と、前記ホスト毎かつ前記データＩＤ毎の前記ホストによる前記ストレージ装置に対する第２のアクセス回数とであり、
前記コピーデータ判定部は、
前記第１のアクセス回数の総合計に対する前記データＩＤ毎の前記第１のアクセス回数の割合であるアクセス割合と、
前記データＩＤ毎の前記第２のアクセス回数の合計に対する前記再開対象システムのオートスケールグループに属する前記ホストであるオートスケールホスト毎かつ該データＩＤ毎の前記第２のアクセス回数の合計の割合であるアクセス局所性と、
前記オートスケールホスト毎の前記第２のアクセス回数の合計に対する前記再開対象システムの前記ホスト毎かつ前記データＩＤ毎の前記第２のアクセス回数の合計の割合であるアクセス共有性と、を算出し、
前記アクセス割合、前記アクセス局所性、及び前記アクセス共有性の少なくとも何れかがそれぞれの判定閾値を超過する前記データＩＤのデータを、前記対象データと判定する
ことを特徴とする情報処理装置。

【請求項4】

請求項２に記載の情報処理装置であって、
前記コピーデータ判定部は、
前記履歴情報に基づいて、一定時間の間に行われた前記リモートコピー処理のコピー指示からコピー完了までの所要時間の平均である平均データコピー時間と、一定時間の間に行われた単位時間当たりの前記リモートコピー処理の指示回数である平均到着率と、単位時間当たりの前記リモートコピー処理の実行回数である平均サービス率と、を算出し、
前記平均データコピー時間、前記平均到着率、及び前記平均サービス率に基づいて、前記予測コピー待ち時間を算出する
ことを特徴とする情報処理装置。

【請求項5】

請求項２に記載の情報処理装置であって、
前記所定閾値は、前記再開対象システムのレスポンス性能のＳＬＡ（Service Level Agreement）が充足されるように予め設定された値である
ことを特徴とする情報処理装置。

【請求項6】

請求項２に記載の情報処理装置であって、
前記ストレージ装置の前記リソース割当ての変更は、
前記ストレージ装置に対して割当てられている前記リモートコピー用の全てのポートが、利用率が閾値以下となるように該ポートの割当てを変更することと、
前記ストレージ装置に対して割当てられている前記リモートコピー用の全てのキャッシュメモリの利用率が閾値以下となるように該キャッシュメモリの割当てを変更することと、
前記リモートコピー処理の並列処理数を増加又は減少することと、の何れかを含む
ことを特徴とする情報処理装置。

【請求項7】

請求項２に記載の情報処理装置であって、
前記ホスト数の変更では、
前記一定値未満の低い優先度の前記システムの前記ホスト数を減少させる
ことを特徴とする情報処理装置。

【請求項8】

請求項７に記載の情報処理装置であって、
前記ホスト数の変更では、
前記一定値未満の低い優先度の前記システムのうち、前記ホストによる前記メイン環境のストレージ装置に対するアクセス回数が一定以上のシステムの前記ホスト数を減少させる
ことを特徴とする情報処理装置。

【請求項9】

請求項２に記載の情報処理装置であって、
全ての前記システムの再開後に、
前記予測コピー待ち時間算出部は、
前記予測コピー待ち時間が前記所定閾値の上限を超過するかを判定し、
前記予測コピー待ち時間が前記所定閾値の上限を超過する場合に、該予測コピー待ち時間が該所定閾値の上限以下となるように、前記構成変更指示部に対して前記ホスト数の変更又は前記リソース割当ての変更を指示し、
前記予測コピー待ち時間が前記所定閾値の下限未満となる場合に、該予測コピー待ち時間が該所定閾値の下限以上となるように、前記構成変更指示部に対して前記ホスト数の変更又は前記リソース割当ての変更を指示する
ことを特徴とする情報処理装置。

【請求項10】

請求項１に記載の情報処理装置であって、
前記データコピー実行部は、
前記対象データに該当せず前記リモートコピー処理を実施されていない未コピーのデータであって、前記ホストからアクセスされたデータを、前記リモートコピー処理を実行するため、前記リモートコピー処理の待ち行列に挿入する
ことを特徴とする情報処理装置。

【請求項11】

請求項１に記載の情報処理装置であって、
前記データコピー実行部は、
前記対象データに該当せず前記リモートコピー処理を実施されていない未コピーのデータであって、全ての前記システムの再開後に前記ホストから未だアクセスされていないデータに対して、所定の同期タイミングで、前記リモートコピー処理を実行する
ことを特徴とする情報処理装置。

【請求項12】

システムが稼働するホストが設けられるクラウドと、前記クラウド以外に設けられ、前記ホストがデータを読書きするストレージ装置とを有するハイブリッドクラウドにおいて、メイン環境のハイブリッドクラウドから前記ハイブリッドクラウドへのデータのリモートコピー処理を実行する情報処理装置が実行する情報処理方法であって、
前記メイン環境のハイブリッドクラウドは、前記システムが稼働するメイン環境のホストが設けられるクラウドと、該クラウド以外に設けられ、前記メイン環境のホストがデータを読書きするメイン環境のストレージ装置と、を有し、
前記ホストから前記ストレージ装置に格納された各データへのアクセス頻度に関するアクセス頻度情報を取得するアクセス頻度情報取得ステップと、
前記システムの優先度と前記アクセス頻度情報とに基づいて前記リモートコピー処理の対象データを判定するコピーデータ判定ステップと、
前記対象データの前記リモートコピー処理の実行開始を前記ストレージ装置に対して指示するデータコピー実行ステップと
を有することを特徴とする情報処理方法。

【請求項13】

請求項１２に記載の情報処理方法であって、
前記メイン環境のホストのホスト情報を取得するホスト情報取得ステップと、
前記ホスト及び前記ストレージ装置の起動を指示すると共に、前記ホストのスケールイン／スケールアウトを行うホスト数の変更及び前記ストレージ装置へのリソース割当ての変更を指示する構成変更指示ステップと、
前記リモートコピー処理のコピー時間の履歴情報を取得するコピー処理情報取得ステップと、
前記履歴情報に基づいて前記対象データの前記リモートコピー処理の実行の指示から開始までのコピー待ち時間の予測値である予測コピー待ち時間を算出し、該予測コピー待ち時間が所定閾値の上限を超過するかを判定し、該予測コピー待ち時間が該所定閾値の上限を超過する場合に、該予測コピー待ち時間が該所定閾値の上限以下となるように、前記構成変更指示ステップに対して前記ホスト数の変更又は前記リソース割当ての変更を指示する予測コピー待ち時間算出ステップと、を有し、
前記ホスト情報が前記メイン環境のクラウドでの障害発生を示す場合に、
前記構成変更指示ステップでは、
前記情報処理装置が、優先度が最も高い前記システムを再開対象システムとして前記クラウドで稼働させるために前記ホスト及び前記ストレージ装置の起動を指示し、
前記データコピー実行ステップでは、
前記情報処理装置が、前記予測コピー待ち時間算出ステップによって前記予測コピー待ち時間が前記所定閾値の上限以下であると判定された場合に、前記対象データの前記リモートコピー処理の実行開始を前記ストレージ装置に対して指示する
ことを特徴とする情報処理方法。

【請求項14】

請求項１３に記載の情報処理方法であって、
前記アクセス頻度情報は、
データを識別するデータＩＤ毎の前記ホストによる前記ストレージ装置に対する第１のアクセス回数と、前記ホスト毎かつ前記データＩＤ毎の前記ホストによる前記ストレージ装置に対する第２のアクセス回数とであり、
前記コピーデータ判定ステップでは、
前記情報処理装置が、
前記第１のアクセス回数の総合計に対する前記データＩＤ毎の前記第１のアクセス回数の割合であるアクセス割合と、
前記データＩＤ毎の前記第２のアクセス回数の合計に対する前記再開対象システムのオートスケールグループに属する前記ホストであるオートスケールホスト毎かつ該データＩＤ毎の前記第２のアクセス回数の合計の割合であるアクセス局所性と、
前記オートスケールホスト毎の前記第２のアクセス回数の合計に対する前記再開対象システムの前記ホスト毎かつ前記データＩＤ毎の前記第２のアクセス回数の合計の割合であるアクセス共有性と、を算出し、
前記アクセス割合、前記アクセス局所性、及び前記アクセス共有性の少なくとも何れかがそれぞれの判定閾値を超過する前記データＩＤのデータを、前記対象データと判定する
ことを特徴とする情報処理方法。

【請求項15】

請求項１３に記載の情報処理方法であって、
前記コピーデータ判定ステップでは、
前記情報処理装置が、
前記履歴情報に基づいて、一定時間の間に行われた前記リモートコピー処理のコピー指示からコピー完了までの所要時間の平均である平均データコピー時間と、一定時間の間に行われた単位時間当たりの前記リモートコピー処理の指示回数である平均到着率と、単位時間当たりの前記リモートコピー処理の実行回数である平均サービス率と、を算出し、
前記平均データコピー時間、前記平均到着率、及び前記平均サービス率に基づいて、前記予測コピー待ち時間を算出する
ことを特徴とする情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置及び情報処理方法に関する。

【背景技術】

【0002】

近年、パブリッククラウドのサーバ装置と、オンプレミスのストレージ装置を組合せてシステムを構築するハイブリッドクラウドが注目されている。ハイブリッドクラウドは、オンプレミスのストレージ装置を利用することでデータの安全性を維持しつつ、パブリッククラウドのサーバ装置をホストとして利用することでシステム導入時の初期費用を抑制することができる。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２２－０００７１９

【発明の概要】

【発明が解決しようとする課題】

【0004】

オンプレミスの同一環境内にホストとストレージを有するシステム構成では、物理サーバのスペックによって処理の上限が決まるため、事前の性能設計で適切な構成を決めることで、システムの性能不足による速度遅延を防ぐことができる。しかし、ハイブリッドクラウドによるシステム構成では、パブリッククラウドのホストの大規模かつ動的なスケールアウト／スケールインに対して、オンプレミスの静的なストレージ構成が追従できず、処理遅延を招くという不都合が生じる。

【0005】

また近年、異なる環境に運用系と待機系のシステムを配置し、地震といった災害が発生した際に、運用系のシステムから待機系のシステムに業務処理を引継ぎ継続するディザスタリカバリ（Disaster Recovery（ＤＲ））が重要になってきている。ＤＲでは、運用系と待機系のストレージ装置間でデータの非同期リモートコピー処理行って、業務処理が引き継がれる。

【0006】

ここで上述した不都合は、ハイブリッドクラウドの正系（運用系）環境と副系（待機系）環境とで冗長構成が構築されたＤＲシステムにおいて、システムの停止を契機としてメイン環境からバックアップ環境へ切替えられる際にも生じる。

【0007】

すなわち、切替え後のバックアップ環境では、システムが停止していた期間の業務処理に係るアクセスやジョブが発生するため、通常を上回る負荷が発生する。このため、パブリッククラウドのホストが大規模かつ動的にスケールアウトする可能性がある。しかし、上述したように、パブリッククラウドのホストの大規模かつ動的なスケールアウト／スケールインに対して、オンプレミスの静的なストレージ構成が追従できず、切替え後のバックアップ環境でシステムの処理遅延を招くという問題があった。

【0008】

本発明は以上の点を考慮してなされたもので、ハイブリッドクラウドのメイン環境からバックアップ環境へシステムが切替えられる際に、切替え後のバックアップ環境におけるシステムの処理遅延を軽減する情報処理装置及び情報処理方法の提供を目的とする。

【課題を解決するための手段】

【0009】

上述した課題を解決するため、本発明の一態様では、システムが稼働するホストが設けられるクラウドと、前記クラウド以外に設けられ、前記ホストがデータを読書きするストレージ装置とを有するハイブリッドクラウドにおいて、メイン環境のハイブリッドクラウドから前記ハイブリッドクラウドへのデータのリモートコピー処理を実行する情報処理装置であって、前記メイン環境のハイブリッドクラウドは、前記システムが稼働するメイン環境のホストが設けられるクラウドと、該クラウド以外に設けられ、前記メイン環境のホストがデータを読書きするメイン環境のストレージ装置と、を有し、前記ホストから前記ストレージ装置に格納された各データへのアクセス頻度に関するアクセス頻度情報を取得するアクセス頻度情報取得部と、前記システムの優先度と前記アクセス頻度情報とに基づいて前記リモートコピー処理の対象データを判定するコピーデータ判定部と、前記対象データの前記リモートコピー処理の実行開始を前記ストレージ装置に対して指示するデータコピー実行部とを有することを特徴とする。

【発明の効果】

【0010】

本発明によれば、ハイブリッドクラウドのメイン環境からバックアップ環境へシステムが切替えられる際に、切替え後のバックアップ環境におけるシステムの処理遅延を軽減できる。

【図面の簡単な説明】

【0011】

【図1】実施形態に係る災害対策システムの構成を示す図。

【図2】実施形態に係る災害対策システムのハードウェア構成を示す図。

【図3】オートスケール－ホスト対応管理テーブルの構成を示す図。

【図4】メイン参照回数テーブルの構成を示す図。

【図5】オートスケール管理テーブルの構成を示す図。

【図6】システム再開管理テーブルの構成を示す図。

【図7】システム優先度管理テーブルの構成を示す図。

【図8】データアクセス頻度管理テーブルの構成を示す図。

【図9】データアクセス局所性管理テーブルの構成を示す図。

【図10】ジャーナルボリューム・メタデータ管理テーブルの構成を示す図。

【図11】データ時間管理テーブルの構成を示す図。

【図12】実施形態に係るメイン処理を示すフローチャート。

【図13】コピーデータ判定処理の詳細を示すフローチャート。

【図14】データコピー処理の詳細を示すフローチャート。

【図15】コピー待ち時間判定処理の詳細を示すフローチャート。

【図16】ストレージ割当変更処理の詳細を示すフローチャート。

【図17】オートスケールホスト数変更処理を示すフローチャート。

【図18】正副同期処理を示すフローチャート。

【図19】ストレージアクセス情報収集処理を示すフローチャート。

【発明を実施するための形態】

【0012】

以下、図面を参照して本発明の実施形態を説明する。実施形態は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略及び簡略化がなされている。本発明は、他の種々の形態でも実施することが可能である。特に限定しない限り、各構成要素は単数でも複数でもよい。

【0013】

同一あるいは同様の機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。また、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。

【0014】

実施形態において、プログラムを実行して行う処理について説明する場合がある。ここで、コンピュータは、プロセッサ（例えばＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit））によりプログラムを実行し、記憶資源（例えばメモリ）やインターフェースデバイス（例えば通信ポート）等を用いながら、プログラムで定められた処理を行う。そのため、プログラムを実行して行う処理の主体を、プロセッサとしてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、演算部であればよく、特定の処理を行う専用回路を含んでいてもよい。ここで、専用回路とは、例えばＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）、ＣＰＬＤ（Complex Programmable Logic Device）等である。

【0015】

プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読取り可能な非一時的な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、実施形態において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

【0016】

以下の実施形態で、テーブル形式で各種情報を説明するが、各種情報はテーブル以外の形式であってもよい。

【0017】

［実施形態］
（実施形態に係る災害対策システムＳの構成）
図１は、実施形態に係る災害対策システムＳの構成を示す図である。災害対策システムＳは、運用系のハイブリッドクラウドであるメイン環境１ａと、待機系のハイブリッドクラウドであるバックアップ環境１ｂとを含む。バックアップ環境１ｂは、メイン環境１ａが災害などで運用継続できない状況に陥った場合にメイン環境１ａで稼働していたシステムを再開させ、業務処理を引継ぐ災対環境である。

【0018】

以下、本実施形態では、メイン環境１ａとバックアップ環境１ｂとは同様の構成として、バックアップ環境１ｂの構成を説明し、メイン環境１ａの構成の説明は適宜省略する。

【0019】

バックアップ環境１ｂは、ネットワーク６を介して接続されたオンプレミスシステム２と、パブリッククラウド５と含む。オンプレミスシステム２は、スイッチ（ネットワークスイッチ）４を介してネットワーク６に接続される。スイッチ４は、Ｉ／Ｏポート４１と、Ｉ／Ｏポート４１のミラーリングポートであるミラーポート４２とを有する。

【0020】

メイン環境１ａとバックアップ環境１ｂの各オンプレミスシステム２は、専用閉域網などを介して相互に障害監視を行う。

【0021】

パブリッククラウド５は、１以上のホスト５１と、ホスト情報通知部５２とを有する。

【0022】

オンプレミスシステム２は、リモートコピー処理装置２１と、ストレージ装置２２とを有する。ストレージ装置２２は、Ｉ／Ｏポート４１及びネットワーク６を介してパブリッククラウド５のホスト５１からのＩ／Ｏアクセスを受付ける。また、リモートコピー処理装置２１は、ミラーポート４２を介してパブリッククラウド５のホスト５１からストレージ装置２２へのＩ／Ｏアクセスをキャプチャする。

【0023】

リモートコピー処理装置２１は、データ取得部２１１と、データコピー候補算出部２１２と、データコピー管理部２１３と、各種テーブル２１４とを有する。

【0024】

各種テーブル２１４は、所定の記憶領域に格納されたオートスケール－ホスト対応管理テーブルＴ１（図３）と、メイン参照回数テーブルＴ２（図４）と、オートスケール管理テーブルＴ３（図５）と、システム再開管理テーブルＴ４（図６）と、システム優先度管理テーブルＴ５（図７）と、データアクセス頻度管理テーブルＴ６（図８）と、データアクセス局所性管理テーブルＴ７（図９）と、ジャーナルボリューム・メタデータ管理テーブルＴ８（図１０）と、データコピー時間管理テーブルＴ９（図１１）とを含む。

【0025】

（オートスケール－ホスト対応管理テーブルＴ１）
オートスケール－ホスト対応管理テーブルＴ１（図３）は、オートスケールグループとホストとの対応を管理する。オートスケール－ホスト対応管理テーブルＴ１は、「ホストＩＤ」と「オートスケールＩＤ」との列を有する。「ホストＩＤ」は、パブリッククラウド５で稼働するホスト５１を識別する情報である。「オートスケールＩＤ」は、各システムを識別する情報であり、各ホスト５１が所属するオートスケールグループを識別する情報である。

【0026】

（メイン参照回数テーブルＴ２）
メイン参照回数テーブルＴ２（図４）は、ホスト５１毎のメイン環境１ａのストレージ装置２２の参照回数を管理する。メイン参照回数テーブルＴ２は、「ホストＩＤ」と「メイン参照回数」との列を有する。「ホストＩＤ」は、パブリッククラウド５で稼働するホスト５１を識別する情報である。「メイン参照回数」は、「ホストＩＤ」で識別されるメイン環境１ａ又は再開後のバックアップ環境１ｂで稼働するホスト５１が、一定期間内にメイン環境１ａのストレージ装置２２に格納されているデータを参照した回数である。

【0027】

（オートスケール管理テーブルＴ３）
オートスケール管理テーブルＴ３（図５）は、オートスケールグループ毎のスケールアウトするホスト数を管理する。オートスケール管理テーブルＴ３は、「オートスケールＩＤ」と「デフォルトスケールアウト数」と「最小スケールアウト数」と「最大スケールアウト数」と「オートスケールホスト設定数（環境設定値）」との列を有する。「デフォルトスケールアウト数」は、「オートスケールＩＤ」で識別されるシステムの起動時又は再開時に稼働させるホスト数である。「最小スケールアウト数」は、「オートスケールＩＤ」で識別されるシステムがスケールインできる最小のホスト数である。「最大スケールアウト数」は、「オートスケールＩＤ」で識別されるシステムがスケールアウトできる最大のホスト数である。「オートスケールホスト設定数（環境設定値）」は、「オートスケールＩＤ」で識別されるシステムが稼働する現在のホスト数である。例えば「オートスケールＩＤ」が“system#1”は、起動時又は再開時に稼働させるホスト数が“２０”であり、スケールアウト／スケールインによって“５”から“６０”までのホスト数に増減可能であり、現在のホスト数が“３０”である。

【0028】

（システム再開管理テーブルＴ４）
システム再開管理テーブルＴ４（図６）は、各システムがバックアップ環境１ｂで再開済みか否かを管理する。システム再開管理テーブルＴ４は、「システムＩＤ」と「再開済みフラグ」との列を有する。「再開済みフラグ」が“１”のシステムがバックアップ環境１ｂで再開済みであり、「再開済みフラグ」が“０”のシステムがバックアップ環境１ｂで未再開である。

【0029】

（システム優先度管理テーブルＴ５）
システム優先度管理テーブルＴ５（図７）は、各システムの再開の優先度を管理する。「優先度」は、「システムＩＤ」で識別されるシステムがバックアップ環境１ｂで再開する優先度を表し、値が小さいほど優先的にバックアップ環境１ｂで再開されることを示す。「優先度」が“null”は、優先度が未設定であることを示す。

【0030】

（データアクセス頻度管理テーブルＴ６）
データアクセス頻度管理テーブルＴ６（図８）は、ストレージ装置２２に格納される「データＩＤ」で識別されるデータ毎にホスト５１からアクセスされる「アクセス回数」を管理する。

【0031】

（データアクセス局所性管理テーブルＴ７）
データアクセス局所性管理テーブルＴ７（図９）は、「ホストＩＤ」で識別されるホスト５１毎かつ「データＩＤ」で識別されるデータ毎にホスト５１からアクセスされる「アクセス回数」を管理する。

【0032】

（ジャーナルボリューム・メタデータ管理テーブルＴ８）
ジャーナルボリューム・メタデータ管理テーブルＴ８（図１０）は、バックアップ環境１ｂのストレージ装置２２のデータ書込み先を管理する。「データＩＤ」で識別されるデータのジャーナルデータを「ジャーナルデータ格納先」と「バックアップ側コピー先」で識別されるバックアップ環境１ｂのジャーナルボリューム２２３のコピー先に格納する。

【0033】

（データコピー時間管理テーブルＴ９）
データコピー時間管理テーブルＴ９（図１１）は、「データＩＤ」で識別されるデータ毎の「コピー開始時刻」と「コピー完了時刻」と「データコピー完了フラグ」とを管理する。「コピー開始時刻」は、リモートコピー処理装置２１が該当データのリモートコピーを指示した時刻である。「コピー終了時刻」は、リモートコピー処理装置２１がバックアップ環境１ｂのストレージ装置２２から該当データのリモートコピーの更新完了の通知を受信した時刻である。「コピー開始時刻」と「コピー完了時刻」が“null”であり、「データコピー完了フラグ」が“０”であるデータは、リモートコピー処理待ちのデータである。「コピー開始時刻」に時刻が登録され、「コピー完了時刻」が“null”であり、「データコピー完了フラグ」が“０”であるデータは、リモートコピー処理中のデータである。「コピー開始時刻」と「コピー完了時刻」に時刻が登録され、「データコピー完了フラグ」が“１”であるデータは、リモートコピー処理完了のデータである。

【0034】

図１の説明に戻る。データ取得部２１１は、ホスト情報取得部２１１ａと、構成変更指示部２１１ｂと、ストレージ情報取得部２１１ｃとを有する。

【0035】

ホスト情報取得部２１１ａは、ネットワーク６を介して、メイン環境１ａのホスト情報通知部５２からメイン環境１ａのホスト５１のホスト情報を取得する。ホスト情報とは、例えばホスト５１の死活情報、ホスト５１の台数、ホストＩＤ、オートスケール情報である。死活情報の取得経路は、メイン環境１ａのパブリッククラウド５～バックアップ環境１ｂのパブリッククラウド５～バックアップ環境１ｂのストレージ装置２２の経路、メイン環境１ａのパブリッククラウド５～メイン環境１ａのストレージ装置２２～バックアップ環境１ｂのストレージ装置２２の経路の何れか又は両方でもよい。

【0036】

構成変更指示部２１１ｂは、ストレージ情報取得部２１１ｃによって取得されたストレージ情報に基づいて、メイン環境１ａからバックアップ環境１ｂへデータのリモートコピー処理を行う際に、バックアップ環境１ｂのパブリッククラウド５及びストレージ装置２２の構成変更を指示する。パブリッククラウド５の構成変更は、ホスト５１のスケールアウト／スケールインである。ストレージ装置２２の構成変更は、リモートコピー処理の際に使用するポート２２１ｃ（図２）の割当ての変更、ジャーナルボリューム２２３へのキャッシュメモリ２２１ｂ（図２）の割当ての変更、メイン環境１ａとバックアップ環境１ｂの各ストレージ装置２２のボリューム２２２間のリモートコピー処理の並列処理数の増減である。

【0037】

ストレージ情報取得部２１１ｃは、バックアップ環境１ｂのストレージ装置２２のストレージ情報を取得する。ストレージ情報は、メイン環境１ａからバックアップ環境１ｂへリモートコピー処理を行う際に使用するバックアップ環境１ｂのストレージ装置２２のポート２２１ｃ（図２）の利用率、ジャーナルボリューム２２３のキャッシュメモリ２２１ｂ（図２）の利用率である。

【0038】

データコピー候補算出部２１２は、データアクセス頻度管理部２１２ａと、データアクセス局所性管理部２１２ｂと、コピーデータ判定部２１２ｃとを有する。データアクセス頻度管理部２１２ａとデータアクセス局所性管理部２１２ｂは、ホスト５１からストレージ装置２２に格納された各データへのアクセス頻度に関するアクセス頻度情報を取得するアクセス頻度情報取得部の一例である。

【0039】

データコピー候補算出部２１２は、データ取得部２１１及びミラーポート４２を介して、ホスト５１からストレージ装置２２へのＩ／Ｏアクセス毎にデータＩＤとホストＩＤを取得する。データアクセス頻度管理部２１２ａは、データアクセス頻度管理テーブルＴ６（図８）において、Ｉ／Ｏアクセス毎に取得されたデータＩＤに該当するアクセス回数を管理する。

【0040】

データアクセス局所性管理部２１２ｂは、データアクセス局所性管理テーブルＴ７（図９）において、Ｉ／Ｏアクセス毎に取得されたホストＩＤ及びデータＩＤに該当するアクセス回数を管理する。

【0041】

コピーデータ判定部２１２ｃは、後述のコピーデータ判定処理（図１２のステップＳ１６）を実行する。

【0042】

データコピー管理部２１３は、コピー処理情報取得部２１３ａと、予測コピー待ち時間算出部２１３ｂと、データコピー実行部２１３ｃとを有する。

【0043】

コピー処理情報取得部２１３ａは、データコピー時間管理テーブルＴ９（図１１）を参照して、後述の平均コピー時間、平均到着率、平均サービス率の算出（図１５のステップＳ２１）を実行する。コピー処理情報取得部２１３ａは、メイン環境１ａからのデータの均コピー時間、コピー処理の平均到着時間間隔などの監視を行う。

【0044】

予測コピー待ち時間算出部２１３ｂは、後述の予測コピー待ち時間算出（図１５のステップＳ２２）を実行する。

【0045】

データコピー実行部２１３ｃは、後述のデータコピー処理（図１２のステップＳ１７）を実行する。

【0046】

ストレージ装置２２は、ストレージコントローラ２２１と、ボリューム２２２と、ジャーナルボリューム２２３とを有する。ストレージコントローラ２２１は、ホスト５１からのＩ／Ｏアクセスに応じてボリューム２２２に対してデータのアクセスを行うと共に、該当データ及び更新履歴情報（ジャーナルデータ）をジャーナルボリューム２２３に蓄積する。なお、メイン環境１ａのストレージ装置２２を正ストレージといい、メイン環境１ａのボリューム２２２を正ボリュームという。また、バックアップ環境１ｂのストレージ装置２２を副ストレージといい、バックアップ環境１ｂのボリューム２２２を副ボリュームという。

【0047】

（実施形態に係る災害対策システムＳのハードウェア構成）
図２は、実施形態に係る災害対策システムＳのハードウェア構成を示す図である。リモートコピー処理装置２１は、ＣＰＵ２０１と、メモリ２０２と、通信装置２０３と、記憶装置２０４とを有するコンピュータである。ＣＰＵ２０１がメモリ２０２と協働してプログラムを実行することにより、データ取得部２１１、データコピー候補算出部２１２、データコピー管理部２１３が実現される。通信装置２０３は、ミラーポート４２と接続される。

【0048】

ストレージ装置２２は、ストレージコントローラ２２１と、記憶部２２４とを有する。ストレージコントローラ２２１は、プロセッサ２２１ａと、キャッシュメモリ２２１ｂと、ポート２２１ｃと、通信装置２２１ｄとを有する。ポート２２１ｃは、バックアップ環境１ｂのホスト５１からのＩ／Ｏアクセスを受付けると共に、メイン環境１ａのストレージ装置２２からバックアップ環境１ｂのストレージ装置２２へデータのリモートコピー処理の際に使用されるポートである。

【0049】

記憶部２２４は、１以上のＲＡＩＤ（Redundant Arrays of Inexpensive Disks）グループＲＧを有する。ＲＡＩＤグループＲＧは、ストレージ装置２２の記憶領域を提供する１以上の記憶装置２２４ａを管理する管理単位である。

【0050】

（実施形態に係るメイン処理）
図１２は、実施形態に係る災害対策システムＳにおけるメイン処理を示すフローチャートである。図１２は、バックアップ環境１ｂのオンプレミスシステム２によって実行される。

【0051】

先ずステップＳ１１では、ホスト情報取得部２１１ａは、メイン環境１ａのホスト情報通知部５２からメイン環境１ａのホスト情報を取得する。

【0052】

次にステップＳ１２では、ホスト情報取得部２１１ａは、ステップＳ１１で取得されたホスト情報に基づいて、メイン環境１ａのパブリッククラウド５で障害が発生したかを判定する。例えばステップＳ１１で取得されたホスト情報が、パブリッククラウド５の少なくとも何れかのホスト５１の停止を示す場合に、メイン環境１ａのパブリッククラウド５で障害が発生したと判定される。データ取得部２１１は、メイン環境１ａのパブリッククラウド５で障害が発生した場合（ステップＳ１２ＹＥＳ）にステップＳ１３へ処理を移し、障害が発生していない場合（ステップＳ１２ＮＯ）にステップＳ１１へ処理を戻す。

【0053】

ステップＳ１３では、構成変更指示部２１１ｂは、メイン環境１ａのパブリッククラウド５で稼働していたシステムのうち、高優先度のシステムの再開に必要な数のホスト５１を起動するように、バックアップ環境１ｂのパブリッククラウド５に指示する。構成変更指示部２１１ｂは、システム再開管理テーブルＴ４（図６）においてバックアップ環境１ｂで未再開（再開済みフラグが０）、かつシステム優先度管理テーブルＴ５（図７）において優先度が一定値以上のシステムを特定する。そして構成変更指示部２１１ｂは、特定したシステムを動作させるために必要なホスト５１のデフォルトスケールアウト数を、システム再開管理テーブルＴ４（図６）を参照して特定する。構成変更指示部２１１ｂは、特定したデフォルトスケールアウト数だけホスト５１を起動するように指示する。

【0054】

次にステップＳ１４では、構成変更指示部２１１ｂは、バックアップ環境１ｂのストレージ装置２２の起動を指示する。ステップＳ１４で起動されるバックアップ環境１ｂのストレージ装置２２は、メイン環境１ａのパブリッククラウド５の障害検知前に、正ストレージ（メイン環境１ａのストレージ装置２２）と最後に同期した時点のデータを格納する。

【0055】

次にステップＳ１５では、データコピー管理部２１３は、メイン環境１ａとバックアップ環境１ｂのジャーナルボリューム２２３のジャーナルデータを比較する。そしてデータコピー管理部２１３は、データコピー時間管理テーブルＴ９（図１１）を参照し、メイン環境１ａで「正常に更新」され、メイン環境１ａからバックアップ環境１ｂへ未コピーのデータのデータＩＤをデータコピー時間管理テーブルＴ９（図１１）に登録する。

【0056】

ここで「正常に更新」とは、例えば１つのデータ書込み処理で複数ブロックデータを更新した際に、全部のブロックデータの書込みに成功した場合をいう。１つのデータ書込み処理で複数ブロックデータを更新した際に、一部のブロックデータのみの書込みに成功した場合は整合性が取れないブロックデータを含むため「正常に更新」には該当せず、データコピー時間管理テーブルＴ９へのデータＩＤの登録から除外する。

【0057】

次にステップＳ１６では、データコピー候補算出部２１２は、コピーデータ判定処理（図１３）を実行する。次にステップＳ１７では、データコピー管理部２１３は、バックアップ環境１ｂのストレージ装置２２（副ストレージ）へのデータコピー処理（図１３）を行う。次にステップＳ１８では、構成変更指示部２１１ｂは、ステップＳ１３で起動指示したホスト５１で動作させる高優先度のシステムの再開を、バックアップ環境１ｂのパブリッククラウド５に指示する。

【0058】

次にステップＳ１７では、データ取得部２１１は、システム再開管理テーブルＴ４（図６）を参照し、メイン環境１ａで稼働していた全システムをバックアップ環境１ｂで再開完了したかを判定する。データ取得部２１１は、全システムを再開完了した場合（ステップＳ１７ＹＥＳ）に本メイン処理を終了し、全システムを再開完了していない場合（ステップＳ１７ＮＯ）にステップＳ１６に処理を戻す。

【0059】

（コピーデータ判定処理）
図１３は、コピーデータ判定処理（図１２のステップＳ１６）の詳細を示すフローチャートである。コピーデータ判定処理では、メイン環境１ａのストレージ装置２２からバックアップ環境１ｂのストレージ装置２２へ、最後に非同期コピーを実施して以降の更新データに基づき、システムの優先度順に、ホスト５１からのデータアクセスの頻度、データアクセスの局所性、オートスケール時のアクセスの共有性の条件を加味して、データコピーを行うデータを特定する。

【0060】

先ずステップＳ１６ａでは、コピーデータ判定部２１２ｃは、「高頻度データ」がコピー済みかを判定する。「高頻度データ」は、式（１）を充たすデータである。

閾値＜該当データのアクセス回数／全てのデータの総アクセス回数・・・（１）

【0061】

式（１）の右辺の分母“全てのデータの総アクセス回数”は、データアクセス頻度管理テーブルＴ６（図８）の「アクセス回数」の総合計である。式（１）の右辺の分子“該当データのアクセス回数”は、データアクセス頻度管理テーブルＴ６（図８）の各「データＩＤ」毎の「アクセス回数」である。

【0062】

すなわち、コピーデータ判定部２１２ｃは、データアクセス頻度管理テーブルＴ６（図８）のアクセス回数を基に「高頻度データ」に該当するデータが、データコピー時間管理テーブルＴ９（図１１）において「データコピー完了フラグ」が“１”となっているかを判定する。コピーデータ判定部２１２ｃは、「高頻度データ」がコピー済みの場合（ステップＳ１６ａＹＥＳ）にステップＳ１６ｄに処理を移し、コピー済み以外の場合（ステップＳ１６ａＮＯ）にステップＳ１６ｂに処理を移す。

【0063】

ステップＳ１６ｂでは、コピーデータ判定部２１２ｃは、データアクセス頻度管理テーブルＴ６（図８）を参照し、データＩＤ毎の「アクセス割合」（式（１）の右辺）を算出する。次にステップＳ１６ｃでは、コピーデータ判定部２１２ｃは、式（１）を基に、「アクセス割合」が閾値を超過した「高頻度データ」のデータＩＤを特定する。「高頻度データ」によって、システム全体として高頻度で参照されているデータが特定される。

【0064】

次にステップＳ１６ｄでは、コピーデータ判定部２１２ｃは、未再開システムの中で、優先度が最も高いシステムを再開対象システムとして特定する。すなわち、コピーデータ判定部２１２ｃは、システム再開管理テーブルＴ４（図６）で「再開済みフラグ」が“０”（未再開）のシステムのうち、システム優先度管理テーブルＴ５（図７）で最も優先度が高いシステムを再開対象システムと特定する。

【0065】

次にステップＳ１６ｅでは、コピーデータ判定部２１２ｃは、オートスケール－ホスト対応管理テーブルＴ１（図３）とデータアクセス局所性管理テーブルＴ７（図９）を参照し、データＩＤ毎の「アクセス局所性」を算出する。データＩＤ毎の「アクセス局所性」は、式（２）の右辺から求まる。

閾値＜再開対象システムの各ホストからの総アクセス回数／該当データへの総アクセス回数・・・（２）

【0066】

式（２）の右辺の分母“該当データへの総アクセス回数”は、データアクセス局所性管理テーブルＴ７（図９）の同一の「データＩＤ」毎の「アクセス回数」の合計である。式（２）の右辺の分子“再開対象システムの各ホストからの総アクセス回数”は、再開対象システム（オートスケールＩＤ）に所属する各「ホストＩＤ」のホストから式（２）の右辺の分母の各“該当データ”にアクセスする「アクセス回数」の合計である。すなわち、データＩＤ毎の「アクセス局所性」は、あるデータに対して再開対象システムの各ホストからどれだけの割合でアクセスしているかを示す。「アクセス局所性」によって、再開対象システムのホストから局所的に参照されているデータが特定される。

【0067】

例えば図９において、再開対象システムが“system#1”、該当データが“#2”であるとする。この場合、式（２）の分母“該当データへの総アクセス回数”は、データアクセス局所性管理テーブルＴ７（図９）における「ホストＩＤ」と「データＩＤ」が“Host#2”と“#2”及び“Host#4”と“#2”のレコードが該当するので、“22”＋“50”＝72である。また、式（２）の分子“再開対象システムの各ホストからの総アクセス回数”は、データアクセス局所性管理テーブルＴ７（図９）における「ホストＩＤ」と「データＩＤ」が“Host#2”と“#2”のレコードが該当するので、“22”である。よって、再開対象システムが“system#1”、該当データが“#2”である場合、式（２）の右辺のデータＩＤ毎の「アクセス局所性」は、22／72となる。

【0068】

次にステップＳ１６ｆでは、コピーデータ判定部２１２ｃは、式（２）のように「アクセス局所性」が閾値を超過したデータＩＤを特定する。

【0069】

次にステップＳ１６ｇでは、コピーデータ判定部２１２ｃは、オートスケール毎の「アクセス共有性」を算出する。コピーデータ判定部２１２ｃは、オートスケール－ホスト対応管理テーブルＴ１（図３）と、データアクセス局所性管理テーブルＴ７（図９）とを参照して、オートスケール毎の「アクセス共有性」を算出する。オートスケール毎の「アクセス共有性」は、式（３）の右辺から求まる。

閾値＜オートスケールするホストから該当のデータへのアクセス回数の総合計／オートスケールホストの総アクセス回数・・・（３）

【0070】

式（３）の右辺の分母“オートスケールホストの総アクセス回数”は、データアクセス局所性管理テーブルＴ７（図９）の同一のオートスケールグループに所属する「ホストＩＤ」の「アクセス回数」の合計である。式（３）の右辺の分子“オートスケールするホストから該当のデータへのアクセス回数の総合計”は、各オートスケールグループから該当のデータにアクセスする「アクセス回数」の合計である。すなわち、オートスケール毎の「アクセス共有性」によって、オートスケールホストから共通的に参照されているデータが特定される。

【0071】

例えば図９において、該当データが“#2”であるとする。この場合、式（３）の分母“オートスケールホストの総アクセス回数”は、“Host#1”及び“Host#2”が所属する“system#1”のオートスケールグループのアクセス回数の合計が“20”＋“22”＝42であり、“Host#3”、“Host#4”及び“Host#5”が所属する“system#2”のオートスケールグループのアクセス回数の合計が“20”＋“50”＋“10”＝80であるため、42＋80＝122である。また、式（３）の分子“オートスケールするホストから該当のデータへのアクセス回数の総合計”は、“Host#2”と“#2”及び“Host#4”と“#2”のレコードが該当するので、“22”＋“50”＝72である。また、よって、該当データが“#2”の場合、式（３）の右辺のオートスケール毎の「アクセス共有性」は、72／122となる。

【0072】

次にステップＳ１６ｈでは、コピーデータ判定部２１２ｃは、式（３）のように「アクセス共有性」が閾値を超過したデータＩＤを特定する。

【0073】

次にステップＳ１６ｉでは、コピーデータ判定部２１２ｃは、「アクセス割合」、「アクセス局所性」、及び「アクセス共有性」に基づいて、コピー対象データを決定する。例えば、コピー対象データは、「アクセス割合」、「アクセス局所性」、及び「アクセス共有性」の少なくとも何れか又は全部がそれぞれの閾値を超過するデータである。

【0074】

（データコピー処理の詳細）
図１４は、データコピー処理（図１２のステップＳ１７）の詳細を示すフローチャートである。データコピー処理では、メイン環境１ａのストレージ装置２２からバックアップ環境１ｂのストレージ装置２２へのデータコピーが行われる。

【0075】

先ずステップＳ１７ａでは、データコピー実行部２１３ｃは、コピー待ち時間判定処理を実行する。コピー待ち時間判定処理の詳細は、図１５を参照して後述する。

【0076】

次にステップＳ１７ｂでは、データコピー実行部２１３ｃは、バックアップ環境１ｂのジャーナルボリューム・メタデータ管理テーブルＴ８（図１０）を参照して、バックアップ環境１ｂのストレージ装置２２のデータ書込み先を特定する。

【0077】

次にステップＳ１７ｃでは、データコピー実行部２１３ｃは、ステップＳ１７ｂで特定したデータ書込み先のストレージ装置２２へのデータコピーの実行開始を、ストレージ装置２２に指示する。

【0078】

次にステップＳ１７ｄでは、データコピー実行部２１３ｃは、コピーが完了したデータをメイン環境１ａのジャーナルボリューム２２３から削除する。

【0079】

次にステップＳ１７ｅでは、データコピー実行部２１３ｃは、バックアップ環境１ｂのデータコピー時間管理テーブルＴ９（図１１）のコピー完了フラグを“１”（完了）に変更する。

【0080】

次にステップＳ１７ｆでは、データコピー実行部２１３ｃは、バックアップ環境１ｂのストレージ装置２２のストレージコントローラ２２１にデータコピー後のデータの格納場所を記録し、コントローラ情報を更新する。ステップＳ１７ｆが終了すると、バックアップ環境１ｂにおいて、パブリッククラウド５からストレージ装置２２のコピー済みのデータへのアクセスを開始させて、再開対象システムが再開される。

【0081】

なお、バックアップ環境１ｂのホスト５１は、参照するデータがバックアップ環境１ｂのストレージ装置２２にコピー済みの場合には、バックアップ環境１ｂのストレージ装置２２にアクセスする。

【0082】

一方、バックアップ環境１ｂのホスト５１は、参照するデータがバックアップ環境１ｂのストレージ装置２２に未コピーである場合には、初回参照時のみメイン環境１ａのストレージ装置２２が縮退稼働して該当データにアクセス可能である。そして、バックアップ環境１ｂのホスト５１は、バックアップ環境１ｂのデータコピー管理部２１３の待ち行列に未コピーの該当データのコピー指示を挿入し、順次リモートコピー処理を実行させる。バックアップ環境１ｂのホスト５１は、該当データを再度参照する時には、メイン環境１ａのストレージ装置２２からコピー済みのデータが格納されているバックアップ環境１ｂのストレージ装置２２にアクセスする。

【0083】

（コピー待ち時間判定処理）
図１５は、コピー待ち時間判定処理（図１２のステップＳ１８）の詳細を示すフローチャートである。コピー待ち時間判定処理は、システム再開途中のデータコピー処理（図１４）で実行されると共に、全てのシステムの再開後も定期的に実行される。コピー待ち時間判定処理は、全てのシステムの再開後に実行されることで、オートスケールホスト設定数を減らし、データコピー頻度を抑制する。システム優先度、メインへの参照回数を条件に最大ホスト数を減らすシステムを選定する。

【0084】

先ずステップＳ２１では、コピー処理情報取得部２１３ａは、データコピー時間管理テーブルＴ９（図１１）を参照して、コピー処理の平均データコピー時間、コピー処理の平均到着率、及びコピー処理の平均サービス率を算出する。

【0085】

ここでコピー処理の平均データコピー時間は、一定時間の間に行われたコピー処理の時間（バックアップ環境１ｂのデータコピー管理部２１３によるコピー指示からバックアップ環境１ｂのストレージ装置２２へのデータ更新完了まで）の平均である。

【0086】

コピー処理の平均到着率は、一定時間の間にバックアップ環境１ｂのデータコピー管理部２１３からメイン環境１ａへ出力された単位時間当たりのコピー指示回数である。コピー処理の平均到着率は、コピー指示の平均到着時間の逆数であり、例えば３分に１回コピー指示が出力される場合（コピー指示の平均到着時間が３分の場合）は、１／３［回／分］である。

【0087】

コピー処理の平均サービス率は、単位時間当たりのコピー処理の実行回数であり、コピー処理の平均データコピー時間の逆数である。コピー処理の平均サービス率は、例えばコピー処理の平均データコピー時間が４分の場合、１／４［回／分］である。

【0088】

次にステップＳ２２では、予測コピー待ち時間算出部２１３ｂは、式（４）から予測コピー待ち時間を算出する。

予測コピー待ち時間＝コピー処理の平均データコピー時間×ρ／（１－ρ）
・・・（４）
但しρ（平均利用率）＝（コピー処理の平均到着率）／（コピー処理の平均サービス率）

【0089】

次にステップＳ２３では、予測コピー待ち時間算出部２１３ｂは、ステップＳ２２で算出した予測コピー待ち時間が閾値上限超過又は閾値下限未満かを判定する。ここでの閾値は、優先度の高いシステムのレスポンス性能のＳＬＡ（Service Level Agreement）を満たすことが可能な予め設定された値の範囲である。なお、システム再開途中であれば、全てのシステム再開を迅速に行うためのスピードを優先し、予測コピー待ち時間が閾値下限未満かの判定は行われない。一方、全てのシステム再開後であれば、予測コピー待ち時間が閾値上限超過又は閾値下限未満かの両方の判定が行われることで、ストレージ割当変更処理（ステップＳ２５）とオートスケールホスト数変更処理（ステップＳ２７）によって、常に適正量のストレージリソースとホストリソースを使用することができる。

【0090】

予測コピー待ち時間算出部２１３ｂは、予測コピー待ち時間が閾値上限超過又は閾値下限未満である場合（ステップＳ２３ＹＥＳ）にステップＳ２４へ処理を移し、閾値上限以下かつ閾値下限以上である場合（ステップＳ２３ＮＯ）に本コピー待ち時間判定処理を終了する。

【0091】

次にステップＳ２４では、データコピー実行部２１３ｃは、構成変更指示部２１１ｂ（図１）に、変更可能なストレージ装置２２のリソースがあるかを判定させる。変更可能なストレージ装置２２のリソースには、ストレージ装置２２のキャッシュメモリ２２１ｂ（図２）、データコピー用のポート２２１ｃ（図２）、メイン環境１ａのボリューム２２２をバックアップ環境１ｂのボリューム２２２へコピーする際のコピー処理の並列処理数がある。

【0092】

データコピー実行部２１３ｃは、変更可能なストレージ装置２２のリソースがある場合（ステップＳ２４ＹＥＳ）にステップＳ２５へ処理を移し、変更可能なストレージ装置２２のリソースがない場合（ステップＳ２４ＮＯ）にステップＳ２６へ処理を移す。

【0093】

ステップＳ２５では、データコピー実行部２１３ｃは、構成変更指示部２１１ｂに、ストレージ割当変更処理を行わせる。ストレージ割当変更処理の詳細は、図１６を参照して後述する。

【0094】

一方ステップＳ２６では、データコピー実行部２１３ｃは、構成変更指示部２１１ｂに、変更可能なオートスケールホスト数があるかを判定させる。データコピー実行部２１３ｃは、変更可能なオートスケールホスト数がある場合（ステップＳ２６ＹＥＳ）にステップＳ２７に処理へ移し、変更可能なオートスケールホスト数がない場合（ステップＳ２６ＮＯ）に本コピー待ち時間判定処理を終了する。

【0095】

ステップＳ２７では、データコピー実行部２１３ｃは、構成変更指示部２１１ｂに、オートスケールホスト数変更処理を行わせる。オートスケールホスト数変更処理の詳細は、図１７を参照して後述する。

【0096】

ステップＳ２５及びＳ２７に続いて、ステップＳ２８では、データコピー実行部２１３ｃは、前回のステップＳ２２の予測コピー待ち時間算出から所定時間が経過したかを判定する。コピーデータ判定部２１２ｃは、前回の予測コピー待ち時間算出から所定時間が経過した場合（ステップＳ２８ＹＥＳ）にステップＳ２１へ処理を戻し、所定時間が経過していない場合（ステップＳ２８ＮＯ）にステップＳ２８を繰返す。

【0097】

ストレージ装置２２又はオートスケールホスト数変更後も、予測コピー待ち時間が閾値範囲を超過する（ステップＳ２３ＹＥＳ）場合、ステップＳ２１～Ｓ２８のループが繰返されることで、予測コピー待ち時間が閾値範囲内になるまで再開対象システムの再開が保留される。

【0098】

（ストレージ割当変更処理）
図１６は、ストレージ割当変更処理の詳細を示すフローチャートである。ストレージ割当変更処理は、図１５のステップＳ２３で予測コピー待ち時間が閾値上限超過となった場合と閾値下限未満となった場合とで、処理が異なる。以下では、コピー待ち時間予測値が閾値上限超過となった場合について説明する。

【0099】

先ずステップＳ２５ａでは、構成変更指示部２１１ｂ（図１）は、データコピー用のポート２２１ｃ（図１）の利用率が閾値超過かを判定する。構成変更指示部２１１ｂは、データコピー用のポート２２１ｃの利用率が閾値超過の場合（ステップＳ２５ａＹＥＳ）にステップＳ２５ｂへ処理を移し、利用率が閾値以下の場合（ステップＳ２５ａＮＯ）にステップＳ２５ｃへ処理を移す。

【0100】

ステップＳ２５ｂでは、構成変更指示部２１１ｂは、ポート２２１ｃの割当てを変更する。ポート２２１ｃの割当ての変更では、例えば利用率が閾値を超過しているポートのトラフィックの一部を利用率が低いポートや新規のポートに割当てる。

【0101】

すなわち、コピー待ち時間予測値が閾値上限超過（図１５のステップＳ２３ＹＥＳ）の際、利用率が閾値超過のデータコピー用のポート２２１ｃがある場合に、コピー処理のボトルネックとなっている可能性があるため、他のポート２２１ｃへ負荷分散する。

【0102】

ステップＳ２５ｃでは、構成変更指示部２１１ｂは、キャッシュメモリ２２１ｂ（図２）の利用率が閾値超過かを判定する。構成変更指示部２１１ｂは、キャッシュメモリ２２１ｂの利用率が閾値を超過している場合（ステップＳ２５ｃＹＥＳ）にステップＳ２５ｄへ処理を移し、利用率が閾値以下の場合（ステップＳ２５ｃＮＯ）にステップＳ２５ｅへ処理を移す。ステップＳ２５ｄでは、構成変更指示部２１１ｂは、コピー処理に割当てるキャッシュメモリ２２１ｂの論理パーティションの容量を増加する。

【0103】

ステップＳ２５ｅでは、構成変更指示部２１１ｂは、メイン環境１ａのボリューム２２２をバックアップ環境１ｂのボリューム２２２へコピーする際のコピー処理の並列処理数を、ストレージ装置２２の設定可能な範囲内で増加する。

【0104】

なお、図１５のステップＳ２３で予測コピー待ち時間が閾値下限未満となった場合には、ステップＳ２５ａでは、構成変更指示部２１１ｂは、データコピー用のポート２２１ｃの利用率が閾値以下かを判定する。構成変更指示部２１１ｂは、データコピー用のポート２２１ｃの利用率が閾値未満の場合（ステップＳ２５ａＹＥＳ）に、例えば利用率が低いポートをポートの利用率の上限内で集約する。すなわち、コピー待ち時間予測値が閾値下限未満（図１５のステップＳ２３ＹＥＳ）の際、利用率が閾値未満のデータコピー用のポート２２１ｃがある場合に、必要数以上のポート２２１ｃを使用しているため、他のポート２２１ｃへ負荷集約する。

【0105】

また、図１５のステップＳ２３で予測コピー待ち時間が閾値下限未満となった場合には、ステップＳ２５ｃでは、キャッシュメモリ２２１ｂ（図２）の利用率が閾値以下かを判定する。構成変更指示部２１１ｂは、キャッシュメモリ２２１ｂの利用率が閾値以下の場合に、コピー処理に割当てるキャッシュメモリ２２１ｂの論理パーティションの容量を削減する。

【0106】

また、図１５のステップＳ２３でコピー待ち時間予測値が閾値下限未満となった場合には、ステップＳ２５ｅでは、構成変更指示部２１１ｂは、メイン環境１ａのボリューム２２２をバックアップ環境１ｂのボリューム２２２へコピーする際のコピー処理の並列処理数を、ストレージ装置２２の設定可能な範囲内で削減する。

【0107】

（オートスケールホスト数変更処理）
図１７は、オートスケールホスト数変更処理を示すフローチャートである。オートスケールホスト数変更処理は、図１５のステップＳ２３で予測コピー待ち時間が閾値上限超過となった場合と閾値下限未満となった場合とで、処理が異なる。以下では、コピー待ち時間予測値が閾値上限超過となった場合について説明する。

【0108】

先ずステップＳ２７ａでは、構成変更指示部２１１ｂ（図１）は、システム優先度管理テーブルＴ５（図７）を参照して、各システムの優先度情報を取得し、優先度が一定値未満の低優先度システムを特定する。

【0109】

次にステップＳ２７ｂでは、構成変更指示部２１１ｂは、オートスケール－ホスト対応管理テーブルＴ１（図３）を参照し、ステップＳ２７ａで特定した低優先度システムのホストとオートスケールグループ情報を取得する。オートスケールグループ情報は、各システムのオートスケールグループに紐付けられているホストの情報である。図３の例では、system#1のオートスケールグループには、Host#1、Host#2、及びHost#3が紐付けられている。

【0110】

次にステップＳ２７ｃでは、構成変更指示部２１１ｂは、メイン参照回数テーブルＴ２（図４）を参照し、ステップＳ２７ｂで取得した低優先度システムの各ホストのメイン環境１ａのストレージ装置２２の参照回数情報を取得する。

【0111】

次にステップＳ２７ｄでは、構成変更指示部２１１ｂは、メイン環境１ａのストレージ装置２２への参照回数が多い低優先度システムをホスト数設定変更対象として特定する。次にステップＳ２７ｅでは、構成変更指示部２１１ｂは、ホスト数設定変更対象のオートスケールホスト設定数（環境設定値）を、オートスケール管理テーブルＴ３（図５）の最小スケールアウト数以上の条件を充たしつつ減少するようにパブリッククラウド５へ設定変更を指示する。最小スケールアウト数は、各システムの要件に応じて予め設定する値とする。例えば、他システムの処理逼迫時に処理を完全に停止するシステムは、最小スケールアウト数を０する。また、縮退稼働時でも可用性維持のために冗長化が必須なシステムは、最小スケールアウト数を２とする。

【0112】

図１５のステップＳ２３で予測コピー待ち時間が閾値上限超過となった場合のオートスケールホスト数変更処理の具体例を説明する。オートスケール－ホスト対応管理テーブルＴ１（図３）とメイン参照回数テーブルＴ２（図４）からシステム毎のメイン参照回数を算出する。次にシステム優先度とメイン参照回数を条件にオートスケールホスト設定数（環境設定値）を減らすシステムを選定する。条件例としては、システム優先度管理テーブルＴ５（図７）においてシステム優先度が２以下でメイン参照回数が最多のシステムを選定する。図３、図４及び図７のテーブルの場合、システム優先度が２以下であるsystem＃2、#3の各ホストのメイン参照回数の合計（それぞれ“16”、“30”）の比較を行い、system#3のオートスケールホスト設定数（環境設定値）を減らすと決定する。

【0113】

なお、図１５のステップＳ２３で予測コピー待ち時間が閾値下限未満となった場合には、ステップＳ２７ｅでは、構成変更指示部２１１ｂは、ホスト数設定変更対象のオートスケールホスト設定数（環境設定値）を、最大スケールアウト数以下の条件を充たしつつ増加するようにパブリッククラウド５へ設定変更を指示する。最大スケールアウト数は、各システムの要件に応じて予め設定する値とする。

【0114】

図１５のステップＳ２３で予測コピー待ち時間が閾値下限未満となった場合のオートスケールホスト数変更処理の具体例を説明する。オートスケール－ホスト対応管理テーブルＴ１（図３）とメイン参照回数テーブルＴ２（図４）からシステム毎のメイン参照回数を算出する。次にシステム優先度とメイン参照回数を条件にオートスケールホスト設定数（環境設定値）を増やすシステムを選定する。条件例としては、システム優先度管理テーブルＴ５（図７）においてシステム優先度が２以下でメイン参照回数が最多のシステムを選定する。図３、図４及び図７のテーブルの場合、システム優先度が２以下であるsystem＃2、#3の各ホストのメイン参照回数の合計（それぞれ“16”、“30”）の比較を行い、system#3のオートスケールホスト設定数（環境設定値）を増やすと決定する。

【0115】

（正副同期処理）
図１８は、正副同期処理を示すフローチャートである。正副同期処理は、対象データとしてコピーされておらず、システム再開後にホスト５１から参照されていないデータのコピーを実施するものであり、システムサービス時間外などの所定の同期タイミングで実行される。

【0116】

先ずステップＳ３１では、データコピー実行部２１３ｃ（図１）は、メイン環境１ａのストレージ装置２２から未だコピーが行われていないデータのデータＩＤを取得する。次にステップＳ３２では、データコピー実行部２１３ｃは、ステップＳ３１で特定したデータＩＤのデータを、バックアップ環境１ｂのストレージ装置２２へコピーする。

【0117】

次にステップＳ３３では、データコピー実行部２１３ｃは、バックアップ環境１ｂのストレージ装置２２のストレージコントローラ２２１にデータコピー後のデータの格納場所を記録し、コントローラ情報を更新する。

【0118】

次にステップＳ３４では、データコピー実行部２１３ｃは、ステップＳ３１で特定した全てのデータＩＤについてステップＳ３２のデータコピーが終了すると、メイン環境１ａとバックアップ環境１ｂの各ストレージ装置２２の正副を切替える。すなわち正ストレージであったメイン環境１ａのストレージ装置２２を副ストレージとし、副ストレージであったバックアップ環境１ｂのストレージ装置２２を正ストレージとし、メイン環境１ａとバックアップ環境１ｂとが入替る。

【0119】

（ストレージアクセス情報収集処理）
図１９は、ストレージアクセス情報収集処理を示すフローチャートである。ストレージアクセス情報収集処理は、メイン環境１ａ及びバックアップ環境１ｂのそれぞれにおいて、他の処理とは関係なく、定期的に実行される。

【0120】

先ずステップＳ４１では、データ取得部２１１は、ポートのミラーリングを行って、Ｉ／Ｏアクセス毎にホスト５１からストレージ装置２２へアクセスされるデータのデータＩＤとホストＩＤとsystemＩＤを取得する。次にステップＳ４２では、データアクセス頻度管理部２１２ａは、ステップＳ４１で取得した情報を基に、データＩＤ毎のアクセス回数を、データアクセス頻度管理テーブルＴ６（図８）に記録する。

【0121】

次にステップＳ４３では、データアクセス局所性管理部２１２ｂは、ステップＳ４１で取得した情報を基に、ホストＩＤ毎かつデータＩＤ毎のアクセス回数を、データアクセス局所性管理テーブルＴ７（図９）に記録する。次にステップＳ４４では、データ取得部２１１は、ステップＳ４１で取得した情報を基に、ホストＩＤとsystemＩＤの対応付けを、オートスケール－ホスト対応管理テーブルＴ１（図３）に記録する。

【0122】

（実施形態の効果）
本実施形態では、ハイブリッドクラウドのメイン環境とバックアップ環境の正副のストレージ間でデータのコピーを非同期で実行する際に、システムの優先度、ホストからのデータのアクセス頻度、データのアクセス局所性、及びオートスケール時のデータのアクセス共有性に基づいて、コピーを優先的に行うデータを判定する。よって、本実施形態によれば、優先的にコピーを行ったデータを用いて優先度が高いシステムをバックアップ環境側で早期に再開させることができる。

【0123】

また、本実施形態では、メイン環境からのデータコピー時間と、コピー処理の平均到着時間間隔の監視を行い、予測されるコピー処理の待ち時間に応じて、バックアップ環境側でのストレージリソース割当て変更や、優先度の低いシステム再開の停止、ホストのオートスケール数の変更を行う。よって、本実施形態では、優先度が高いシステムの再開遅延やシステム全体でのリソースの無駄な消費を抑制することができる。

【0124】

また、本実施形態によれば、動的なスケールアウト／スケールインが発生するハイブリッドクラウド構成を含むハイブリッドクラウドで構築された業務システムを、ＲＰＯ（Recovery Point Objective）及びＲＴＯ（Recovery Time Objective）を最小化しコストを抑制しつつ、バックアップ側のハイブリッドクラウドで再開できる。

【0125】

（他の実施形態）
本実施形態では、リモートコピー処理装置２１は、ストレージ装置２２外のサーバ上に構築する例を示したが、ストレージ装置２２上あるいはパブリッククラウド５上に構築してもよい。その場合、ミラーポート４２は、省略できる。

【0126】

また、本実施形態では、ハイブリッドクラウドを構成するクラウドをパブリッククラウド５として説明したが、プライベートクラウドでもよい。

【0127】

本発明は上述の実施形態に限定されるものではなく、様々な変形例を含む。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、矛盾しない限りにおいて、ある実施形態の構成の一部を他の実施形態の構成で置き換え、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、構成の追加、削除、置換、統合、又は分散をすることが可能である。また、実施形態で示した構成及び処理は、処理効率又は実装効率に基づいて適宜分散、統合、又は入れ替えることが可能である。

【符号の説明】

【0128】

Ｓ：災害対策システム、１ａ：メイン環境、１ｂ：バックアップ環境、２：オンプレミスシステム、５：パブリッククラウド、２１：リモートコピー処理装置、２２：ストレージ装置、５１：ホスト、５２：ホスト情報通知部、２１１：データ取得部、２１１ａ：ホスト情報取得部、２１１ｂ：構成変更指示部、２１１ｃ：ストレージ情報取得部、２１２：データコピー候補算出部、２１２ａ：データアクセス頻度管理部、２１２ｂ：データアクセス局所性管理部、２１２ｃ：コピーデータ判定部、２１３：データコピー管理部、２１３ａ：コピー処理情報取得部、２１３ｂ：予測コピー待ち時間算出部、２１３ｃ：データコピー実行部、２２１ｂ：キャッシュメモリ、２２１ｃ：ポート、２２２：ボリューム、２２３：ジャーナルボリューム

【図1】