IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立ヴァンタラ株式会社の特許一覧

特許7612630データ生成制御システム、及びデータ生成制御方法
<>
  • 特許-データ生成制御システム、及びデータ生成制御方法 図1
  • 特許-データ生成制御システム、及びデータ生成制御方法 図2
  • 特許-データ生成制御システム、及びデータ生成制御方法 図3
  • 特許-データ生成制御システム、及びデータ生成制御方法 図4
  • 特許-データ生成制御システム、及びデータ生成制御方法 図5
  • 特許-データ生成制御システム、及びデータ生成制御方法 図6
  • 特許-データ生成制御システム、及びデータ生成制御方法 図7
  • 特許-データ生成制御システム、及びデータ生成制御方法 図8
  • 特許-データ生成制御システム、及びデータ生成制御方法 図9
  • 特許-データ生成制御システム、及びデータ生成制御方法 図10
  • 特許-データ生成制御システム、及びデータ生成制御方法 図11
  • 特許-データ生成制御システム、及びデータ生成制御方法 図12
  • 特許-データ生成制御システム、及びデータ生成制御方法 図13
  • 特許-データ生成制御システム、及びデータ生成制御方法 図14
  • 特許-データ生成制御システム、及びデータ生成制御方法 図15
  • 特許-データ生成制御システム、及びデータ生成制御方法 図16
  • 特許-データ生成制御システム、及びデータ生成制御方法 図17
  • 特許-データ生成制御システム、及びデータ生成制御方法 図18
  • 特許-データ生成制御システム、及びデータ生成制御方法 図19
  • 特許-データ生成制御システム、及びデータ生成制御方法 図20
  • 特許-データ生成制御システム、及びデータ生成制御方法 図21
  • 特許-データ生成制御システム、及びデータ生成制御方法 図22
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-27
(45)【発行日】2025-01-14
(54)【発明の名称】データ生成制御システム、及びデータ生成制御方法
(51)【国際特許分類】
   G06F 11/14 20060101AFI20250106BHJP
   G06F 3/06 20060101ALI20250106BHJP
【FI】
G06F11/14 664
G06F3/06 304F
G06F3/06 301X
G06F3/06 301N
【請求項の数】 9
(21)【出願番号】P 2022041063
(22)【出願日】2022-03-16
(65)【公開番号】P2023135793
(43)【公開日】2023-09-29
【審査請求日】2024-02-16
(73)【特許権者】
【識別番号】524132520
【氏名又は名称】日立ヴァンタラ株式会社
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】小関 英通
(72)【発明者】
【氏名】出口 彰
(72)【発明者】
【氏名】新井 政弘
【審査官】坂庭 剛史
(56)【参考文献】
【文献】特開平07-084728(JP,A)
【文献】特開2005-122611(JP,A)
【文献】特開2007-115007(JP,A)
【文献】特開2011-034164(JP,A)
【文献】特開2012-043160(JP,A)
【文献】特開2020-194466(JP,A)
【文献】特開2021-022287(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/14
G06F 3/06
(57)【特許請求の範囲】
【請求項1】
複数のストレージ装置と、管理装置とを有するデータ生成制御システムであって、
前記管理装置は、
生成対象データと、前記生成対象データを生成する生成先のストレージ装置である生成先ストレージ装置との指定を受け付け、
前記生成対象データに類似する類似データを特定し、
前記生成対象データに相当する基礎データが格納されている生成元ストレージ装置から前記生成先ストレージ装置に前記基礎データを送信する第1送信処理に要すると予想される第1予想時間と、前記類似データを前記類似データを格納している類似データ格納ストレージ装置から前記生成先ストレージ装置に送信し、且つ前記基礎データと前記類似データとの差分データを前記生成元ストレージ装置から前記生成先ストレージ装置に送信する第2送信処理に要すると予想される第2予想時間とを算出し、
前記第2予想時間が第1予想時間よりも短い場合に、前記第2送信処理により前記類似データと前記差分データとを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させ、前記第2予想時間が第1予想時間よりも短くない場合に、前記第1送信処理により前記基礎データを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させる
データ生成制御システム。
【請求項2】
前記複数のストレージ装置は、
自身が管理するデータについての所定の時点のバックアップデータをバックアップ用のストレージ装置であるバックアップ用ストレージ装置に格納するバックアップ実行ストレージ装置を含み、
前記管理装置は、
前記生成対象データについてのバックアップ用ストレージ装置のバックアップデータを類似データとして特定する
請求項1に記載のデータ生成制御システム。
【請求項3】
前記バックアップ実行ストレージ装置は、前記バックアップ用ストレージ装置に格納する前記バックアップデータを自身にも格納し、
前記生成元ストレージ装置は、自身が前記バックアップ実行ストレージ装置である場合には、前記基礎データと、前記バックアップデータとに基づいて差分データを特定する
請求項2に記載のデータ生成制御システム。
【請求項4】
前記管理装置は、
前記第2送信処理において、
前記生成元ストレージ装置に前記差分データを前記バックアップ用ストレージ装置に送信させ、
前記生成先ストレージ装置に、前記差分データを前記バックアップ用ストレージ装置から取得させる
請求項3に記載のデータ生成制御システム。
【請求項5】
前記管理装置は、
前記第2送信処理において、
前記生成元ストレージ装置に前記差分データを前記生成先ストレージ装置に送信させる
請求項3に記載のデータ生成制御システム。
【請求項6】
前記生成元ストレージ装置は、
前記差分データを抽出可能か否かを判定して、判定結果を前記管理装置に送信し、
前記管理装置は、
前記生成元ストレージ装置から前記差分データを抽出可能でないとの判定結果を受信した場合に、前記第1送信処理を行わせ、
前記生成元ストレージ装置から前記差分データを抽出可能であるとの判定結果を受信した場合に、前記第1送信処理と前記第2送信処理とのいずれを実行するかを判定する
請求項1に記載のデータ生成制御システム。
【請求項7】
前記生成元ストレージ装置は、
前記差分データのデータ量を算出して前記管理装置に送信し、
前記管理装置は、
前記類似データのデータ量と、前記差分データのデータ量とに基づいて、前記第2予想時間を算出する
請求項1に記載のデータ生成制御システム。
【請求項8】
複数のストレージ装置と、管理装置とを有するデータ生成制御システムであって、
第1ストレージ装置と第2ストレージ装置との間の経路の通信速度より、第3ストレージ装置と第2ストレージ装置との間の経路の通信速度が高く、
前記管理装置は、
前記第1ストレージ装置に格納されている所定の生成対象データを前記第2ストレージ装置に生成する指示を受け、前記生成対象データに類似する類似データが前記第3ストレージ装置に存在するか否かを判定し、
前記第3ストレージ装置に前記類似データがある場合に、前記類似データを前記第2ストレージ装置に送信させ、
前記対象データと前記類似データとの差分データを前記第2ストレージ装置に送信させ、
前記類似データと前記差分データとに基づいて、前記第2ストレージ装置に前記生成対象データを生成させる
データ生成制御システム。
【請求項9】
複数のストレージ装置と、管理装置とを有するデータ生成制御システムによるデータ生成制御方法であって、
前記管理装置は、
生成対象データと、前記生成対象データを生成する生成先のストレージ装置である生成先ストレージ装置との指定を受け付け、
前記生成対象データに類似する類似データを特定し、
前記生成対象データに相当する基礎データが格納されている生成元ストレージ装置から前記生成先ストレージ装置に前記基礎データを送信する第1送信処理に要すると予想される第1予想時間と、前記類似データを前記類似データを格納している類似データ格納ストレージ装置から前記生成先ストレージ装置に送信し、且つ前記基礎データと前記類似データとの差分データを前記生成元ストレージ装置から前記生成先ストレージ装置に送信する第2送信処理に要すると予想される第2予想時間とを算出し、
前記第2予想時間が第1予想時間よりも短い場合に、前記第2送信処理により前記類似データと前記差分データとを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させ、前記第2予想時間が第1予想時間よりも短くない場合に、前記第1送信処理により前記基礎データを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させる
データ生成制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークを介して接続された他の装置にあるデータを利用してデータを生成する技術に関する。
【背景技術】
【0002】
種々のデータを格納するために使用されるストレージとして、オンプレミスのストレージ及びパブリッククラウドのストレージとを組み合わせたハイブリッドクラウドが用いられるようになってきている。
【0003】
ハイブリッドクラウドの利用が進展することに伴って、オンプレミスの装置間のデータのコピーだけでなく、オンプレミスとパブリッククラウドとの装置間のデータのコピーや、パブリッククラウドの装置間のデータのコピー等が行われる状況が増加すると予想される。
【0004】
関連する技術として、例えば、特許文献1には、第一の記憶システムでのデータの更新に関するジャーナルを、第二の記憶システムが通信線を介して取得し、ジャーナルを用いて第一の記憶システムと対応するデータを更新する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】米国特許第7152079号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
例えば、複数の記憶システム間が離れている場合には、各記憶システム間は、WAN(Wide Area Network)を介して接続されるが、一般的にはコスト等の面からWANの帯域は、記憶システム内のネットワークの帯域よりも狭くなっている。
【0007】
このため、記憶システム間で大量のデータのコピーを行う場合には、WANの帯域の制限によってコピーに長時間を要してしまうこととなる。
【0008】
本発明は、上記事情に鑑みなされたものであり、その目的は、データの生成に要する時間を短縮することのできる技術を提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するため、一観点に係るデータ生成制御システムは、複数のストレージ装置と、管理装置とを有するデータ生成制御システムであって、前記管理装置は、生成対象データと、前記生成対象データを生成する生成先のストレージ装置である生成先ストレージ装置との指定を受け付け、前記生成対象データに類似する類似データを特定し、前記生成対象データに相当する基礎データが格納されている生成元ストレージ装置から前記生成先ストレージ装置に前記基礎データを送信する第1送信処理に要すると予想される第1予想時間と、前記類似データを前記類似データを格納している類似データ格納ストレージ装置から前記生成先ストレージ装置に送信し、且つ前記基礎データと前記類似データとの差分データを前記生成元ストレージ装置から前記生成先ストレージ装置に送信する第2送信処理に要すると予想される第2予想時間とを算出し、前記第2予想時間が第1予想時間よりも短い場合に、前記第2送信処理により前記類似データと前記差分データとを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させ、前記第2予想時間が第1予想時間よりも短くない場合に、前記第1送信処理により前記基礎データを前記生成先ストレージ装置に送信させることにより、前記生成先ストレージ装置に前記生成対象データを生成させる。
【発明の効果】
【0010】
本発明によれば、データの生成に要する時間を短縮することができる。
【図面の簡単な説明】
【0011】
図1図1は、第1実施形態に係る計算機システムの全体構成図である。
図2図2は、第1実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。
図3図3は、第1実施形態に係るオンプレミスデータセンタの構成図である。
図4図4は、第1実施形態に係るパブリッククラウドの構成図である。
図5図5は、第1実施形態に係るストレージ装置のメモリに格納されるプログラム群の構成図である。
図6図6は、第1実施形態に係る管理端末のメモリの構成図である。
図7図7は、第1実施形態に係るストレージ装置によるデータのバックアップ処理を説明する図である。
図8図8は、第1実施形態に係るストレージ装置によるバックアップデータからのリストア処理を説明する図である。
図9図9は、第1実施形態に係るカタログ情報の構成図である。
図10図10は、第1実施形態に係る管理対象ストレージ登録TBLの構成図である。
図11図11は、第1実施形態に係る転送経路情報TBLの構成図である。
図12図12は、第1実施形態に係るVOL情報TBLの構成図である。
図13図13は、第1実施形態に係るBackup情報TBLの構成図である。
図14図14は、第1実施形態に係る最適copy経路判断TBLの構成図である。
図15図15は、第1実施形態に係るボリュームコピー処理のフローチャートである。
図16図16は、第1実施形態に係る通常COPY所要時間予測処理のフローチャートである。
図17図17は、第1実施形態に係る類似データ活用COPY所要時間予測処理のフローチャートである。
図18図18は、第1実施形態に係る類似データ活用COPY処理のフローチャートである。
図19図19は、第2実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。
図20図20は、第2実施形態に係る類似データ活用COPY所要時間予測処理のフローチャートである。
図21図21は、第2実施形態に係る類似データ活用COPY処理のフローチャートである。
図22図22は、第3実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。
【発明を実施するための形態】
【0012】
いくつかの実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0013】
以下の説明では、「AAAテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」を「AAA情報」と呼ぶことができる。
【0014】
また、以下の説明では、「プログラム」を動作の主体として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又は通信インターフェースデバイス(例えばNIC(Network Interface Card))を用いながら行うため、処理の主体がプロセッサとされてもよい。プログラムを動作の主体として説明された処理は、プロセッサを有する計算機が行う処理としてもよい。
【0015】
図1は、第1実施形態に係る計算機システムの全体構成図である。
【0016】
計算機システム1は、データ生成制御システムの一例であり、オンプレミスデータセンタ10と、パブリッククラウド20とを有する。オンプレミスデータセンタ10と、パブリッククラウド20とは、離れた場所に配置されている。オンプレミスデータセンタ10と、パブリッククラウド20とは、ネットワークの一例としてのインターネット30を介して接続されている。
【0017】
オンプレミスデータセンタ10は、1以上のホスト100と、1以上のストレージ装置200と、管理装置の一例としての管理端末300とを含む。ホスト100と、ストレージ装置200と、管理端末300と、インターネット30とは、スイッチ(SW)11を介して接続されている。
【0018】
ホスト100は、ユーザにより各種処理を行い、処理に関わるデータについてストレージ装置200に対して入出力(I/O)を行う。管理端末300は、計算機システム1における管理対象の装置を管理する処理を行う。本実施形態では、管理端末300は、或るデータを所定の装置に生成(コピー等)する処理を制御する。
【0019】
ストレージ装置200は、例えば、ブロックを単位としてデータを管理するブロックストレージであり、ストレージOSを含むストレージコントローラ(Storage CTL)210を有し、物理ドライブ230(図3参照)の記憶領域により各種データを格納する。本実施形態では、ストレージ装置200は、データを格納するボリュームと、そのボリュームのバックアップデータとを格納する。また、ストレージ装置200は、ボリュームのバックアップデータを後述するオブジェクトストレージサービス400に格納する。
【0020】
パブリッククラウド20は、ストレージ装置500と、オブジェクトストレージサービス400とを含む。ストレージ装置500と、オブジェクトストレージサービス400と、インターネット30とは、スイッチ21を介して接続されている。
【0021】
オブジェクトストレージサービス400は、ストレージ、ストレージ装置の一例であり、データをオブジェクトを単位として格納する。本実施形態では、オブジェクトストレージサービス400は、ストレージ装置200のボリュームのバックアップデータをオブジェクトとして格納する。
【0022】
ストレージ装置500は、例えば、SDS(Software Defined Storage)であり、ストレージOSを含むストレージコントローラ(Storage CTL)510を有し、物理ドライブ531(図4参照)の記憶領域により各種データを格納する。
【0023】
本実施形態では、オンプレミスデータセンタ10のストレージ装置200とパブリッククラウド20のオブジェクトストレージサービス400との間の経路(経路1という)と、オブジェクトストレージサービス400とストレージ装置500との間の経路(経路2という)と、オンプレミスデータセンタ10のストレージ装置200とパブリッククラウド20のストレージ装置500との間の経路(経路3という)とにおいては、経路2は、パブリッククラウド20内のネットワークのみが含まれるので、インターネットを含む経路1や経路3よりも高帯域となっている。
【0024】
図2は、第1実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。図2のデータコピー処理は、オンプレミスデータセンタ10のストレージ装置200のボリューム(Vol)#aのデータ(生成対象データ)をパブリッククラウド20のストレージ装置500にボリューム(Vol)#bにコピーする際のデータコピー処理であり、本実施形態では、オンプレミスデータセンタ10のストレージ装置200と、パブリッククラウド20のオブジェクトストレージサービス400とには、過去の或る時点におけるVol#aのバックアップデータが格納されているものとする。
【0025】
管理端末300は、管理者からストレージ装置200(コピー元ストレージ、コピー元ストレージ装置、生成元ストレージ装置、第1ストレージ装置、バックアップ実行ストレージ装置)のVol#aのデータ(コピー対象データ(生成対象データ)、基礎データ)を、ストレージ装置500(コピー先ストレージ、コピー先ストレージ装置、生成先ストレージ装置、第2ストレージ装置)のVol#bへコピーする指示を受け取る(図2(1))と、コピー対象データと類似するデータ(類似データ)を探索し、データの転送方法を判断する(図2(2))。ここでは、類似データがオブジェクトストレージサービス400(類似データ格納ストレージ装置、バックアップ用ストレージ装置、第3ストレージ装置)に存在し、オブジェクトストレージサービス400からストレージ装置500に類似データを送信する方法を使用してデータのコピー(生成)を行うと判断されたものとして以降の処理を説明する。
【0026】
管理端末300は、コピー先ストレージ(図2の例では、ストレージ装置500)に、探索した類似データのコピーを指示する(図2(3))。この指示に従って、ストレージ装置500は、オブジェクトストレージサービス400から指示された類似データ(Vol#aのバックアップデータ)を読み出して(リードして)、Vol#bに格納する(図2(4))。
【0027】
次いで、管理端末300は、コピー元ストレージ(図2の例では、ストレージ装置200)に、コピー対象データと類似データとの差分を抽出し、差分をオブジェクトストレージサービスに転送する指示を行う(図2(5))。この指示に従って、ストレージ装置200は、Vol#aとVol#aのバックアップデータとを比較して差分データを抽出し(図2(6))、差分データをオブジェクトストレージサービス400に転送する(図2(7))。
【0028】
次いで、管理端末300は、コピー先ストレージに、差分データのコピーを指示する(図2(8))。この指示に従って、ストレージ装置500は、オブジェクトストレージサービス400から差分データをリードし、Vol#bに格納されているVol#aのバックアップデータに対して差分データを反映させることにより、Vol#bにVol#aのコピーとなるデータを生成する。これにより、ストレージ装置500のVol#bへのVol#aのデータのコピーが完了する。
【0029】
次に、オンプレミスデータセンタ10の構成について詳細に説明する。
【0030】
図3は、第1実施形態に係るオンプレミスデータセンタの構成図である。
【0031】
オンプレミスデータセンタ10は、ホスト100と、ストレージ装置200と、管理端末300と、1以上のスイッチ11とを含む。
【0032】
スイッチ11は、送信されるデータのスイッチングを行う。ホスト100は、プロセッサ101と、フロントエンド(FE)インターフェース(I/F)102と、管理I/F103とを含む。プロセッサ101は、各種処理を実行し、ストレージ装置200へのデータのIOを行う。FE I/F102は、ストレージ装置200との通信を仲介する。管理I/F103は、管理端末300との管理に関わる通信を仲介する。
【0033】
ストレージ装置200は、2つのコントローラ210と、複数の物理ドライブ230とを有する。物理ドライブ230は、例えば、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などであり、ホスト100が利用するユーザデータ等の各種データを格納する。
【0034】
コントローラ210は、プロセッサ211と、メモリ212と、管理I/F213と、Copy I/F214と、IO I/F215と、Drive I/F216とを含む。
【0035】
管理I/F213は、管理端末300との管理に関わる通信を仲介する。Copy I/F214は、他のストレージ装置との間のデータのコピーに関わる通信を仲介する。IO I/F215は、ホスト100との間のデータIOに関わる通信を仲介する。Drive I/F216は、物理ドライブ230との間の通信を仲介する。
【0036】
プロセッサ211は、メモリ212に格納されているプログラムに従って各種処理を実行する。
【0037】
メモリ212は、例えば、RAM(RANDOM ACCESS MEMORY)であり、プロセッサ211で実行されるプログラム群222や、必要な情報を記憶する。
【0038】
管理端末300は、プロセッサ301と、メモリ302と、管理I/F303とを含む。管理I/F303は、ホスト100及びストレージ装置200等との管理に関わる通信を仲介する。
【0039】
プロセッサ301は、メモリ302に格納されているプログラムに従って各種処理を実行する。
【0040】
メモリ302は、例えば、RAMであり、プロセッサ301で実行されるプログラム群311や、処理に必要なテーブル群312等を記憶する。
【0041】
次に、パブリッククラウド20の構成について詳細に説明する。
【0042】
図4は、第1実施形態に係るパブリッククラウドの構成図である。
【0043】
パブリッククラウド20は、1以上のストレージ装置500と、オブジェクトストレージサービス400と、スイッチ21とを含む。
【0044】
スイッチ21は、送信されるデータのスイッチングを行う。オブジェクトストレージサービス400は、データを格納する物理ドライブを有し、データをオブジェクト単位で管理する。
【0045】
ストレージ装置500は、各種処理を行うコンピュートサービス520と、ブロック単位でデータを格納するブロックストレージサービス530とを含む。コンピュートサービス520は、プロセッサ521と、メモリ522とを含む。プロセッサ521は、メモリ522に格納されているプログラムに従って各種処理を実行する。
【0046】
メモリ522は、例えば、RAMであり、プロセッサ521で実行されるプログラム群523や、処理に必要なテーブル群524等を記憶する。
【0047】
ブロックストレージサービス530は、1以上の物理ドライブ531を有する。
【0048】
次に、ストレージ装置200,500のメモリ212,522に格納されるプログラム群222,523の構成について説明する。
【0049】
図5は、第1実施形態に係るストレージ装置のメモリに格納されるプログラム群の構成図である。
【0050】
ストレージ装置200,500のプログラム群222,523は、ストレージOSプログラム223を含む。ストレージOSプログラム223は、ボリューム作成プログラム2231と、ボリュームバックアッププログラム2232と、ボリュームリストアプログラム2233と、カタログ情報作成プログラム2234と、差分データ抽出プログラム2235と、差分抽出可否判断プログラム2236と、ボリュームコピープログラム2237とを含む。
【0051】
ボリューム作成プログラム2231は、ストレージ装置内にボリュームを作成する処理を行う。ボリュームバックアッププログラム2232は、ストレージ装置内のボリュームをバックアップする処理を行う。ボリュームリストアプログラム2233は、バックアップデータからボリュームをリストアする処理を行う。カタログ情報作成プログラム2234は、ボリュームのバックアップに関するカタログ情報411(264)(図9参照)を作成する処理を行う。差分データ抽出プログラム2235は、ボリュームのデータと、類似データとの差分を抽出する処理を行う。差分抽出可否判断プログラム2236は、差分を抽出できるか否かを判断する処理を行う。差分を抽出できるか否かは、例えば、ストレージ装置に、類似データと同じデータが格納されているか否かにより判断してもよい。ボリュームコピープログラム2237は、ボリュームをコピーする処理を行う。
【0052】
次に、管理端末300のメモリ302の構成について説明する。
【0053】
図6は、第1実施形態に係る管理端末のメモリの構成図である。
【0054】
管理端末300のメモリ302は、プログラム群311と、テーブル群312とを格納する。プログラム群311は、ボリュームコピー制御プログラム3111と、類似データ探索プログラム3112と、最適copy経路判断プログラム3113とを含む。
【0055】
ボリュームコピー制御プログラム3111は、ストレージ装置に対してボリュームのデータをコピーする処理を制御する。例えば、ボリュームコピー制御プログラム3111は、ボリュームをコピーする指示を発行する処理を行う。類似データ探索プログラム3112は、コピー対象のデータに類似する類似データを探索する処理を行う。最適copy経路判断プログラム3113は、コピー対象のデータをコピー(生成)する際の最適な経路を判断する処理を行う。
【0056】
テーブル群312は、管理対象ストレージ登録テーブル(TBL)3121と、転送経路情報TBL3122と、VOL情報TBL3123と、Backup情報TBL3124と、最適copy経路判断TBL3125とを含む。各テーブルの詳細については後述する。
【0057】
次に、ストレージ装置200によるデータのバックアップ処理について説明する。
【0058】
図7は、第1実施形態に係るストレージ装置によるデータのバックアップ処理を説明する図である。
【0059】
ストレージ装置200においては、物理ドライブ230の記憶領域に基づいてプール250が構成される。ボリューム260やスナップショット(SS)ボリューム261に対してプール250の記憶領域が割り当てられる。
【0060】
ストレージ装置200は、ボリュームバックアップ機能262と、オブジェクト変換機能270とを有する。
【0061】
ボリュームバックアップ機能262は、ボリュームバックアッププログラム2232をプロセッサ211が実行することにより実現される機能である。ボリュームバックアップ機能262は、ボリューム260のスナップショットを取得し、スナップショットに基づいて前回のスナップショットとの間の差分データと、差分データに関するメタデータとを含むバックアップデータ266を作成し、バックアップデータ266を外部のストレージ(本実施形態では、オブジェクトストレージサービス400)に格納させる機能である。
【0062】
ボリュームバックアップ機能262は、カタログ情報作成機能263と、差分データ抽出機能265とを利用する。カタログ情報作成機能263は、カタログ情報作成プログラム2234をプロセッサ211が実行することにより実現される機能である。差分データ抽出機能265は、差分データ抽出プログラム2235をプロセッサ211が実行することにより実現される機能である。
【0063】
ボリュームバックアップ機能262は、増分形式で、例えば、定期的にバックアップを行う。具体的には、ボリュームバックアップ機能262は、バックアップ対象のボリュームのスナップショットを取得し、差分データ抽出機能265により、取得したスナップショットのデータと1世代前のスナップショットのデータとを比較し、更新部位を差分データとして取り出し、差分データ(データ本体)に対してボリューム内の差分データのボリュームでの格納位置を示す位置情報と、差分データのサイズを示すサイズ情報とを付与してカプセル化したバックアップデータ266を作成する。例えば、増分形式でのバックアップであるので、最初のバックアップデータには、バックアップ対象のボリュームのすべてのデータが含まれ、2回目以降のバックアップデータには、新たに取得したスナップショットと1世代前のスナップショットとの差分データ、位置情報、及びサイズ情報が含まれる。
【0064】
また、ボリュームバックアップ機能262は、カタログ情報作成機能263により、バックアップ対象データについてのスナップショットや、バックアップ元のボリュームに関する情報に基づいて、カタログ情報264を作成する。なお、本実施形態では、カタログ情報作成機能263は、オブジェクトストレージサービス400に格納されるカタログ情報411を取得し、そのカタログ情報411に対して、変更点を追加することにより、カタログ情報264を作成する。
【0065】
また、ボリュームバックアップ機能262は、バックアップデータ266と、カタログ情報264とをオブジェクトストレージサービス400に格納する。なお、バックアップデータ266及びカタログ情報264をオブジェクトストレージサービス400に格納した後に、プール250内の最新のスナップショット以外のスナップショットのデータは削除してもよい。
【0066】
オブジェクト変換機能270は、ボリュームバックアッププログラム2232をプロセッサ211が実行することにより実現される機能であり、ブロック形式のデータを、オブジェクトストレージサービス400が取り扱うオブジェジェクト形式に変換する機能である。
【0067】
オブジェクトストレージサービス400は、実データを格納するバケット401を有する。バケット401は、その内部がカタログ情報格納エリア410と、データ格納エリア420とに分けられる。カタログ情報格納エリア410には、カタログ情報411が格納される。データ格納エリア420には、バックアップデータ266に対応するデータが格納される。
【0068】
次に、ストレージ装置500によるデータのリストア処理について説明する。
【0069】
図8は、第1実施形態に係るストレージ装置によるバックアップデータからのリストア処理を説明する図である。
【0070】
ストレージ装置500においては、ブロックストレージサービス530の物理ドライブ531の記憶領域に基づいてプール554が構成される。ボリューム553に対してプール554の記憶領域が割り当てられる。
【0071】
ストレージ装置500は、オブジェクト変換機能551と、バックアップ復元機能552とを有する。
【0072】
オブジェクト変換機能551は、ボリュームバックアッププログラム2232をプロセッサ521が実行することにより実現される機能であり、オブジェクトストレージサービス400が取り扱うオブジェジェクト形式のデータを、ブロック形式のデータに変換する機能である。
【0073】
バックアップ復元機能552は、ボリュームリストアプログラム2233をプロセッサ521が実行することにより実現される機能である。バックアップ復元機能552は、オブジェクトストレージサービス400から初回のバックアップデータであるSS#0バックアップデータ421-0を取得し、コピー先のボリュームにSS#0バックアップデータ421-0に基づくデータを復元する。次いで、復元する目的のスナップショット(例えば、コピー対象のボリュームに対応するスナップショット)のバックアップデータまで順次バックアップデータを取得し、ボリュームに対して取得した各バックアップデータにより差分を復元する。これにより、ボリュームに所望のデータを復元(生成)することができる。
【0074】
次に、カタログ情報411(264)について説明する。
【0075】
図9は、第1実施形態に係るカタログ情報の構成図である。
【0076】
カタログ情報411(264)は、バックアップ(スナップショット)に関する情報を管理する。カタログ情報411(264)は、バックアップごとのエントリを格納する。
【0077】
カタログ情報411(264)のエントリは、Backup ID(SS#)411aと、Backup元装置ID411bと、Backup元VOL#411cと、Backup元VOL Size411dと、1世代前Backup ID411eと、取得日時411fと、オブジェクトキー411gと、オブジェクトサイズ411hとのフィールドを含む。
【0078】
Backup ID(SS#)411aには、エントリに対応するバックアップ(Backup)のID(Backup ID)が格納される。本実施形態では、Backup IDとして、スナップショットの番号(SS#)が使用される。Backup元装置ID411bには、エントリに対応するバックアップの対象とするボリュームを格納している装置(Backup元装置)のIDが格納される。Backup元VOL#411cには、エントリに対応するバックアップの対象となるボリューム(Backup元VOL)のID(Vol#)が格納される。Backup元VOL Size411dには、エントリに対応するBackup元ボリュームのサイズが格納される。1世代前Backup ID411eには、エントリに対応するバックアップの1世代前のバックアップを示すBackup IDが格納される。なお、エントリに対応するバックアップが、ボリュームに対する初回のバックアップである場合には、1世代前のバックアップが存在しないので、N/Aとなる。取得日時411fには、エントリに対応するバックアップの取得日時が格納される。オブジェクトキー411gには、エントリに対応するボリュームのバックアップデータを格納したオブジェクトストレージサービス400のオブジェクトの識別情報(オブジェクトキー)が格納される。なお、エントリに対応するバックアップにおいて、複数のオブジェクトが使用されている場合には、エントリに対して複数のオブジェクトキーが対応付けられる。オブジェクトサイズ411hには、エントリのオブジェクトキー411gのオブジェクトキーに対応するオブジェクトのサイズが格納される。
【0079】
次に、管理対象ストレージ登録TBL3121について説明する。
【0080】
図10は、第1実施形態に係る管理対象ストレージ登録TBLの構成図である。
【0081】
管理対象ストレージ登録テーブル3121は、管理端末300が管理する対象とするストレージの情報を管理する。管理対象ストレージ登録テーブル3121は、管理対象のストレージごとのエントリを格納する。管理対象ストレージ登録テーブル3121のエントリは、装置名3121aと、装置種別3121bと、CTL IPアドレス/Backet名3121cとのフィールドを含む。
【0082】
装置名3121aには、エントリに対応するストレージに対してユーザが定義した装置名が格納される。装置種別3121bには、エントリに対応するストレージの装置種別が格納される。装置種別としては、例えば、ブロックストレージ、SDS、オブジェクトストア等がある。CTL IPアドレス/Backet名3121cには、エントリに対応するストレージのコントローラ(CTL)のIPアドレス又はバケット名が格納される。
【0083】
次に、転送経路情報TBL3122について説明する。
【0084】
図11は、第1実施形態に係る転送経路情報TBLの構成図である。
【0085】
転送経路情報TBL3122は、複数の装置間の経路に関する情報を管理する。転送経路情報TBL3122は、経路毎のエントリを格納する。転送経路情報TBL3122のエントリは、経路#3122aと、Source装置名3122bと、Destination装置名3122cと、平均転送速度3122dとのフィールドを含む。
【0086】
経路#3122aには、エントリに対応する経路の番号が格納される。Source装置名3122bには、エントリに対応する経路の送信元(Source)の装置名が格納される。Destination装置名3122cには、エントリに対応する経路の送信先(Destination)の装置名が格納される。平均転送速度3122dには、エントリに対応する経路の平均転送速度が格納される。
【0087】
次に、VOL情報TBL3123について説明する。
【0088】
図12は、第1実施形態に係るVOL情報TBLの構成図である。
【0089】
VOL情報TBL3123は、各ストレージに格納されているボリュームの情報を管理する。VOL情報TBL3123は、ボリューム毎のエントリを格納する。VOL情報TBL3123のエントリは、装置名3123aと、VOL#3123bと、Size3123cとのフィールドを含む。
【0090】
装置名3123aには、エントリに対応するボリュームを格納する装置の装置名が格納される。VOL#3123bには、エントリに対応するボリュームの識別情報(VOL#)が格納される。本実施形態では、VOL#は、例えば、装置内で一意の値である。Size3123cには、エントリに対応するボリュームのサイズが格納される。
【0091】
次に、Backup情報TBL3124について説明する。
【0092】
図13は、第1実施形態に係るBackup情報TBLの構成図である。
【0093】
Backup情報TBL3124は、バックアップに関する情報を管理する。Backup情報TBL3124は、オブジェクトストレージサービス400のカタログ情報411の情報に基づいて作成される。Backup情報TBL3124は、バックアップ毎のエントリを格納する。Backup情報TBL3124のエントリは、Backup ID3124aと、元装置3124bと、元VOL3124cと、取得日時3124dとのフィールドを含む。
【0094】
Backup ID3124aには、エントリに対応するバックアップのID(Backup ID)が格納される。元装置ID3124bには、エントリに対応するバックアップの対象とするボリュームを格納している装置(Backup元装置)のIDが格納される。元VOL#3124cには、エントリに対応するバックアップの対象となっているボリューム(Backup元VOL)のIDが格納される。取得日時3124dには、エントリに対応するバックアップの取得日時が格納される。
【0095】
次に、最適copy経路判断TBL3125について説明する。
【0096】
図14は、第1実施形態に係る最適copy経路判断TBLの構成図である。
【0097】
最適copy経路判断TBL3125は、最適なcopy経路判断をするための情報を管理する。最適copy経路判断TBL3125は、通常COPY3125aと、類似データ活用COPY3125eとのフィールドを含む。
【0098】
通常COPY3125aには、COPY対象のデータを使用してコピー先にデータをコピーする通常COPYに関する情報のフィールドが格納される。通常COPYは、図1の例では、ストレージ装置200からストレージ装置500に経路3を用いてVol#aのデータをコピーする処理である。
【0099】
通常COPY3125aは、通常COPY対象サイズ3125bと、通常COPY経路速度3125cと、通常COPY予想時間3125dとのフィールドを含む。
【0100】
通常COPY対象サイズ3125bには、コピー対象のデータのサイズが格納される。通常COPY経路速度3125cには、通常COPYで使用する経路(図1の例では、経路3)の通信速度が格納される。通常COPY予想時間3125dには、通常COPYに要すると予想される時間(通常COPY予想時間)が格納される。
【0101】
類似データ活用COPY3125eには、COPY対象のデータの類似データを利用してCOPY先にデータを作成する類似データ活用COPYに関する情報のフィールドが格納される。類似データ活用COPYは、図1の例では、COPY対象のデータの類似データを経路2によりストレージ装置500にコピーし、COPY対象のデータと類似データとの差分を経路1及び経路2により転送して、ストレージ装置500でCOPY対象のデータを生成する処理である。
【0102】
類似データ活用COPY3125eは、類似データサイズ3125fと、類似データ転送経路速度3125gと、差分データサイズ3125hと、差分データ転送経路1速度3125iと、差分データ転送経路2速度3125jと、類似データ活用COPY予想時間3125kとのフィールドを含む。
【0103】
類似データサイズ3125fには、類似データのサイズが格納される。類似データ転送経路速度3125gには、類似データの転送に使用される経路(図1の例では、経路2)の通信速度が格納される。差分データサイズ3125hには、コピー対象データと類似データとの差分となる差分データのサイズが格納される。差分データ転送経路1速度3125iには、差分データの転送に使用される経路の中の第1の経路(図1の例では、経路1)における転送速度が格納される。差分データ転送経路2速度3125jには、差分データの転送に使用される経路の中の第2の経路(図1の例では、経路2)における転送速度が格納される。類似データ活用COPY予想時間3125kには、類似データ活用COPYに要すると予想される時間が格納される。
【0104】
次に、計算機システム1における処理動作について説明する。
【0105】
まず、ボリュームコピー処理について説明する。
【0106】
図15は、第1実施形態に係るボリュームコピー処理のフローチャートである。
【0107】
管理端末300のボリュームコピー制御プログラム3111は、管理者からボリュームのコピー指示(ボリュームCOPY指示、生成指示の一例)を受領する(ステップS100)。ボリュームCOPY指示には、コピー対象のボリューム(コピー対象ボリューム)を特定する情報(例えば、コピー対象ボリュームのVOL#、コピー元のストレージ(コピー元ストレージ)の装置名)と、コピー先を特定する情報(コピー先のストレージ(コピー先ストレージ)の装置名)とが含まれる。次いで、類似データ探索プログラム3112は、計算機システム1において、ボリュームCOPY指示に含まれるコピー対象ボリュームのデータ(コピー対象データ)に類似するデータ(類似データ)がコピー元ストレージ以外に存在するか否かを判定する(ステップS200)。本実施形態では、類似データ探索プログラム3112は、Backup情報TBL3124を参照してコピー対象ボリュームについてのバックアップデータが存在するか否かを判定する。
【0108】
この結果、コピー元ストレージ以外の装置に類似データが存在しないと判定した場合(ステップS200:No)には、ボリュームコピー制御プログラム3111は、コピー対象ボリュームのデータをコピー元ストレージからコピー先ストレージに転送(コピー)する処理(通常COPY:第1送信処理)を実行させ(ステップS800)、処理を終了する。
【0109】
一方、コピー元ストレージ以外の装置に類似データが存在すると判定した場合(ステップS200:Yes)には、ボリュームコピー制御プログラム3111は、コピー元ストレージにおいて類似データとコピー対象データとの差分を抽出可能であるか否かを判定する(ステップS300)。具体的には、ボリュームコピー制御プログラム3111は、コピー元ストレージに対して、コピー対象データとの差分を抽出可能であるかを問合せ、コピー元ストレージからの回答を受け付ける。なお、コピー対象データと類似データとの差分を抽出可能であるかの問合せを受けたコピー元ストレージでは、差分抽出可否判断プログラム2236が、コピー対象データと類似データとの差分を抽出可能であるか否かを判断し、判断結果をボリュームコピー制御プログラム3111に回答する。ここで、コピー対象データと類似データとの差分を抽出可能であるか否かは、類似データと同じデータをコピー元ストレージが格納しているか否かにより判断してもよい。
【0110】
この結果、類似データとコピー対象データとの差分を抽出可能でないと判定した場合(ステップS300:No)には、ボリュームコピー制御プログラム3111は、処理をステップS800に進め、通常COPYを実行させる。
【0111】
一方、類似データとコピー対象データとの差分を抽出可能であると判定した場合(ステップS300:Yes)には、ボリュームコピー制御プログラム3111は、通常COPYにおける所要時間(第1予想時間)を予測する通常COPY所要時間予測処理を実行する(ステップS400)。次いで、ボリュームコピー制御プログラム3111は、類似データをコピー先装置に転送させるとともに、類似データとコピー対象データとの差分をコピー先装置に転送させることにより、コピー先ストレージにコピー対象データを作成する類似データ活用COPY(第2送信処理)における所要時間(第2予想時間)を予測する類似データ活用COPY所要時間予測処理(ステップS500)を実行する。
【0112】
次いで、ボリュームコピー制御プログラム3111は、通常COPYと、類似データ活用COPYとのいずれのCOPYが短時間で終わるかを判定する(ステップS600)。
【0113】
この結果、類似データ活用COPYの方が短時間で終わると判定した場合、例えば、予測した類似データ活用COPY所要時間が、予測した通常COPYにおける所要時間よりも短い場合(ステップS600:類似データ活用COPY)には、ボリュームコピー制御プログラム3111は、類似データ活用COPYを実行させる類似データ活用COPY処理(ステップS700)を実行し、ボリュームコピー処理を終了する。
【0114】
一方、通常COPYの方が短時間で終わると判定した場合、例えば、予測した類似データ活用COPY所要時間が予測した通常COPYにおける所要時間よりも短くない場合(ステップS600:通常COPY)には、ボリュームコピー制御プログラム3111は、処理をステップS800に進め、通常COPYを実行させる。
【0115】
次に、通常COPY所要時間予測処理(S400)について説明する。
【0116】
図16は、第1実施形態に係る通常COPY所要時間予測処理のフローチャートである。
【0117】
最適copy経路判断プログラム3113は、VOL情報テーブル3123を参照し、コピー対象ボリュームのサイズを取得する(ステップS410)。次いで、最適copy経路判断プログラム3113は、転送経路情報TBL3122を参照し、コピー元ストレージからコピー先ストレージへの使用経路(本例では、経路3)の転送速度を取得する(ステップS420)。
【0118】
次いで、最適copy経路判断プログラム3113は、コピー対象ボリュームのサイズを転送速度で除算することにより予想時間を算出し(ステップS430)、算出結果を最適copy経路判断TBL3125の通常COPY予想時間3125dに格納し(ステップS440)、処理を終了する。
【0119】
次に、類似データ活用COPY所要時間予測処理(S500)について説明する。
【0120】
図17は、第1実施形態に係る類似データ活用COPY所要時間予測処理のフローチャートである。
【0121】
最適copy経路判断プログラム3113は、オブジェクトストレージサービス400から取得したカタログ情報264を参照し、類似データのサイズ(バックアップサイズ)を取得する(ステップS510)。
【0122】
次いで、最適copy経路判断プログラム3113は、転送経路情報TBL3122を参照し、類似データを格納するストレージ(本例では、オブジェクトストレージサービス400)からコピー先ストレージ(ストレージ装置500)への経路(本例では、経路2)の転送速度を取得し(ステップS520)、バックアップサイズを転送速度で除算することによりバックアップ復元時間[A]を算出する(ステップS530)。
【0123】
次いで、最適copy経路判断プログラム3113は、コピー元ストレージに対して、コピー対象ボリュームと類似データとの差分量の算出依頼を行う(ステップS540)。ここで、算出依頼には、例えば、コピー対象のボリュームのVol#と、SS#とが含まれる。
【0124】
コピー元ストレージ(ストレージ装置200)の差分データ抽出プログラム2235は、コピー対象ボリュームと類似データとの差分量を算出し、算出した差分量を管理端末300の最適copy経路判断プログラム31113に返却する(ステップS550)。
【0125】
最適copy経路判断プログラム3113は、コピー元ストレージから返却された差分量を取得し、転送経路情報TBL3122を参照し、コピー元ストレージからオブジェクトストレージサービス400への経路(経路1)の転送速度と、オブジェクトストレージサービス400からコピー先ストレージへの経路(経路2)の転送速度を取得する(ステップS560)。
【0126】
次いで、最適copy経路判断プログラム3113は、差分のデータを転送する時間(差分転送時間[B])を計算する(ステップS570)。具体的には、最適copy経路判断プログラム3113は、差分量を経路1の転送時間で除算した値と、差分量を経路2の転送速度で除算した値とを合計することにより、差分転送時間を算出する。
【0127】
次いで、最適copy経路判断プログラム3113は、バックアップ復元時間[A]と差分転送時間[B]との合計値を類似データ活用COPY予想時間に決定し(ステップS580)、処理を終了する。
【0128】
次に、類似データ活用COPY処理(S700)について説明する。
【0129】
図18は、第1実施形態に係る類似データ活用COPY処理のフローチャートである。
【0130】
管理端末300のボリュームコピー制御プログラム3111は、画面にVOLコピー開始を表示し(ステップS701)、画面に類似データの転送中であることを表示する(ステップS702)。
【0131】
次いで、ボリュームコピー制御プログラム3111は、コピー先ストレージに対してバックアップ復元の指示を送信する(ステップS703)。ボリュームコピー制御プログラム3111は、バックアップ復元の指示に、コピー先のVOL#と、バックアップの対象とするデータ(類似データ)のバックアップID(SS#)とを含める。
【0132】
コピー先ストレージは、バックアップ復元の指示を受け取ると、ボリュームコピープログラム2237は、バックアップ復元の指示に含まれるバックアップIDのデータをコピー先のVOL#のボリュームに復元し(ステップS704)、完了応答を行う。
【0133】
管理端末300のボリュームコピー制御プログラム3111は、バックアップ復元に対応する完了応答を受け取ると、画面に差分の転送中であることを表示し(ステップS705)、コピー元ストレージに対して差分転送の指示を送信する(ステップS706)。ボリュームコピー制御プログラム3111は、差分転送の指示に、コピー元のVOL#と、差分抽出対象のデータのバックアップID(SS#)とを含める。
【0134】
コピー元ストレージは、差分転送の指示を受け取ると、差分データ抽出プログラム2235は、差分転送の指示に含まれるコピー元のVOL#のボリュームと、バックアップIDのデータとの差分を抽出し(ステップS707)、抽出した差分データをバックアップとして、オブジェクトストレージサービス400に転送し、差分を格納したデータのバックアップID(SS#)を管理端末300のボリュームコピー制御プログラム3111に返却する(ステップS708)。
【0135】
管理端末300のボリュームコピー制御プログラム3111は、コピー先ストレージに対して差分データの復元の指示を送信する(ステップS709)。ボリュームコピー制御プログラム3111は、差分の復元の指示に、コピー先のVOL#と、差分データのバックアップID(SS#)とを含める。
【0136】
コピー先ストレージは、差分の復元の指示を受け取ると、ボリュームリストアプログラム2233は、差分の復元の指示に含まれるバックアップIDの差分データをコピー先のVOL#のボリュームに復元することにより、コピー先のボリュームにコピー対象のボリュームのデータを生成し(ステップS704)、完了応答を行う。これにより、コピー先ストレージへのボリュームのコピーが完了する。
【0137】
次いで、管理端末300のボリュームコピー制御プログラム3111は、差分の復元の完了応答を受け取ると、画面にVOLコピーが完了したことを表示し(ステップS711)、類似データ活用COPY処理を終了する。
【0138】
上記した第1実施形態に係る計算機システム1によると、コピー対象のデータをそのままコピーするよりも類似データを使用してデータの生成(コピー)したほうが速いと判定した場合に、類似データを使用してデータの生成をすることができ、データの生成を迅速に行うことができる。
【0139】
次に、第2実施形態に係る計算機システム1Aについて説明する。なお、計算機システム1Aにおいて、第1実施形態に係る計算機システム1と同様な構成については、同一符号を付している。
【0140】
図19は、第2実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。
【0141】
図19のデータコピー処理は、オンプレミスデータセンタ10Aのストレージ装置200のボリューム(Vol)#aのデータをパブリッククラウド20のストレージ装置500にボリューム(Vol)#bにコピーする際のデータコピー処理であり、本実施形態では、オンプレミスデータセンタ10Aのストレージ装置200と、パブリッククラウド20のオブジェクトストレージサービス400とには、過去の或る時点におけるVol#aのバックアップデータが格納されているものとする。
【0142】
計算機システム1Aにおいては、管理端末300Aを備える。管理端末300Aは、第1実施形態に係る管理端末300とは、ボリュームコピー制御プログラム3111と、最適copy経路判断プログラム3113による処理の一部が異なる。具体的には、ボリュームコピー処理において、類似データ活用COPY所要時間予測処理(S500)に代えて、類似データ活用COPY所要時間予測処理(S800)を行い、類似データ活用COPY処理(S700)に代えて、類似データ活用COPY処理(S900)を実行する。
【0143】
管理端末300Aは、管理者からストレージ装置200(コピー元ストレージ)のVol#aのデータを、ストレージ装置500(コピー先ストレージ)のVol#bへコピーする指示を受け取る(図19(1))と、コピー対象のデータと類似するデータ(類似データ)を探索し、データの転送方法を判断する(図19(2))。ここでは、類似データがオブジェクトストレージサービス400に存在し、オブジェクトストレージサービス400からストレージ装置500に類似データを転送する方法を使用してデータのコピーを行うと判断されたものとして以降の処理を説明する。
【0144】
管理端末300Aは、コピー先ストレージ(図19の例では、ストレージ装置500)に、探索した類似データのコピーを指示する(図19(3))。この指示に従って、ストレージ装置500は、オブジェクトストレージサービス400から、指示された類似データ(Vol#aのバックアップデータ)を読み出して(リードして)、Vol#bに格納する(図19(4))。
【0145】
次いで、管理端末300Aは、コピー元ストレージ(図19の例では、ストレージ装置200)に、対象データと類似データとの差分を抽出し、差分をコピー先ストレージに転送させる指示を行う(図19(5))。この指示に従って、コピー元ストレージ(ストレージ装置200)は、Vol#aとVol#aのバックアップデータとを比較して差分データを抽出し(図19(6))、差分データをコピー先ストレージに転送する(図19(7))。
【0146】
これに対して、コピー先ストレージでは、Vol#aのバックアップデータに対して差分データを反映させることにより、Vol#aのコピーを生成する。これにより、ストレージ装置500のVol#bへのVol#aのデータのコピーが完了する。
【0147】
次に、第2実施形態に係る類似データ活用COPY所要時間予測処理(S800)について説明する。
【0148】
図20は、第2実施形態に係る類似データ活用COPY所要時間予測処理のフローチャートである。なお、図17に示す第1実施形態に係る類似データ活用COPY所要時間予測処理と同様な部分には同一の符号を付し、重複する説明を省略する場合がある。
【0149】
最適copy経路判断プログラム3113は、コピー元ストレージから返却された差分量を取得すると、転送経路情報TBL3122を参照し、コピー元ストレージからコピー先ストレージへの経路(経路3)の転送速度を取得する(ステップS810)。
【0150】
次いで、最適copy経路判断プログラム3113は、差分のデータを転送する時間(差分転送時間[B])を計算する(ステップS820)。具体的には、最適copy経路判断プログラム3113は、差分量を経路3の転送速度で除算した値を差分転送時間として算出する。
【0151】
次いで、最適copy経路判断プログラム3113は、バックアップ復元時間[A]と差分転送時間[B]との合計値を類似データ活用COPY予想時間に決定し(ステップS580)、処理を終了する。
【0152】
この類似データ活用COPY所要時間予測処理によると、類似データをオブジェクトストレージサービス400からコピー先ストレージに転送し、差分データをコピー元ストレージからコピー先ストレージに転送する類似データ活用COPY処理の予想時間を適切に予測することができる。
【0153】
次に、第2実施形態に係る類似データ活用COPY処理(S900)について説明する。
【0154】
図21は、第2実施形態に係る類似データ活用COPY処理のフローチャートである。なお、図18に示す第2実施形態に係る類似データ活用COPY処理と同様な部分には同一の符号を付し、重複する説明を省略する場合がある。
【0155】
コピー元ストレージは、差分転送の指示を受け取ると、差分データ抽出プログラム2235は、差分転送の指示に含まれるコピー元のVOL#のボリュームと、バックアップIDのデータとの差分を抽出する(ステップS707)。次いで、ボリュームコピープログラム2237は、抽出した差分データと、差分データについてのボリュームにおける書込み位置を示す情報(書込み位置情報)とをコピー先ストレージに転送する(ステップS910)。
【0156】
コピー先ストレージのボリュームリストアプログラム2233は、差分データを受け取ると、書込み位置情報に基づいて差分データをコピー先ボリュームに格納することによりコピー対象のボリュームを生成し(ステップS920)、完了応答を行う。これにより、コピー先ストレージへのボリュームのコピーが完了する。
【0157】
コピー元ストレージのボリュームコピープログラム2237は、コピー先ストレージからの格納完了応答を受け取ると、管理端末300AにVOLコピーの完了応答を行う(ステップS930)。
【0158】
次に、第3実施形態に係る計算機システム1Bについて説明する。なお、計算機システム1Bにおいて、第1実施形態に係る計算機システム1と同様な構成については、同一符号を付している。
【0159】
図22は、第3実施形態に係る計算機システムにおけるデータコピー処理の概要を説明する図である。
【0160】
図22のデータコピー処理は、オンプレミスデータセンタ10Bのストレージ装置200Aのボリューム(Vol#a)の所定の時点のボリュームを、オンプレミスデータセンタ10Bのストレージ装置200Bにコピー(復元)する際のデータコピー処理である。本実施形態では、オンプレミスデータセンタ10Bのストレージ装置200Aには、過去のある時点のVol#aの全体をバックアップしたバックアップデータ(バックアップ(ベース))が格納され、パブリッククラウド20のオブジェクトストレージサービス400には、ストレージ装置200Aと同じバックアップデータが格納されているとともに、Vol#aについての所定の時点よりも前の差分のデータ(バックアップ(差分))が格納されている。本実施形態では、ベースのバックアップデータをバックアップ#0(ベース)とし、それ以降のn番目のバックアップ時点における差分のデータをバックアップ#n(差分)とする。
【0161】
計算機システム1Bにおいては、管理端末300Bを備える。管理端末300Bは、第1実施形態に係る管理端末300とは、一部の処理が異なる。
【0162】
管理端末300Bは、管理者からストレージ装置200AのVol#aの所定のバックアップ時点(ここでは、時点n)のデータを、ストレージ装置200B(コピー先ストレージ)のVol#cへコピー(作成)する指示を受け取る(図22(1))。ここで、本実施形態では、コピー指示には、例えば、復元対象のVol#と、復元対象とするバックアップ時点を示す情報(バックアップ#)と、コピー先のVol#とが含まれる。
【0163】
管理端末300Bは、復元対象のバックアップ時点のデータと類似するデータ(類似データ)を探索し、データの転送方法を判断する(図22(2))。ここでは、ストレージ装置200Aに、復元対象のバックアップ時点nよりも前のベースとなるバックアップデータ、すなわち、Vol#aバックアップ#0が存在するので、このデータが類似データとして探索され、ストレージ装置200Aからストレージ装置200Bに類似データを転送する方法を使用してデータのコピーを行うと判断されたものとして以降の処理を説明する。
【0164】
管理端末300Bは、ストレージ装置200Aに、探索した類似データの転送を指示する(図22(3))。この指示に従って、ストレージ装置200Aは、指示された類似データ(Vol#aのバックアップ#0)を読み出して(リードして)、コピー先ストレージ(ストレージ装置200B)のVol#cに格納する(図22(4))。
【0165】
次いで、管理端末300Bは、コピー先ストレージ(ストレージ装置200B)に、復元対象のデータと類似データとの差分の転送を指示する(図22(5))。この指示に従って、コピー先ストレージ(ストレージ装置200B)は、類似データ以降の復元対象となるバックアップ時点までの差分データをオブジェクトストレージサービス400から転送する(図22(6))。例えば、バックアップ時点が#nの場合には、コピー先ストレージ(ストレージ装置200B)は、バックアップ#1からバックアップ#nのバックアップデータをオブジェクトストレージサービス400から転送する。ここで、バックアップ#0~バックアップ#nが、コピー対象データに対応する基礎データに相当する。
【0166】
次いで、コピー先ストレージは、Vol#cに格納されたVol#aのバックアップ#0のデータに対して、バックアップ#1からバックアップ#nのバックアップデータを順次反映させることにより、Vol#aの所定のバックアップ時点nのデータを生成する。これにより、ストレージ装置200Bへの所定のバックアップ時点nのデータの生成(コピー)が完了する。
【0167】
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。
【0168】
例えば、上記実施形態では、通常コピーと、類似データ活用コピーとの予想時間を比較し、予想時間が短いコピーによりデータをコピーするようにしていたが、本発明はこれに限られず、例えば、図1に示すように、コピー元ストレージとコピー先ストレージとの経路の通信速度が遅く、類似データの格納先のストレージ(図1では、オブジェクトストレージサービス400)とコピー先ストレージとの経路の通信速度が速い場合であって、類似データ活用コピーを利用した方が通常コピーよりも処理時間が短いことが見込めるような場合には、各コピーの予想時間を予測して比較することなく、類似データ活用コピーを実行するようにしてもよい。
【0169】
また、上記実施形態において、プロセッサが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア(例えば可搬型の記憶メディア)であってもよい。
【符号の説明】
【0170】
1,1A,1B…計算機システム、10,10A,10B…オンプレミスデータセンタ、20…パブリッククラウド、100…ホスト、200,200A,200B…ストレージ装置、300…管理端末、400…オブジェクトストレージサービス、500…ストレージ装置

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22