(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023125812
(43)【公開日】2023-09-07
(54)【発明の名称】コピー制御装置及び方法
(51)【国際特許分類】
G06F 16/182 20190101AFI20230831BHJP
G06F 3/06 20060101ALI20230831BHJP
G06F 13/12 20060101ALI20230831BHJP
G06F 16/20 20190101ALI20230831BHJP
【FI】
G06F16/182 100
G06F3/06 301X
G06F13/12 330E
G06F16/20
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022030125
(22)【出願日】2022-02-28
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】弘中 和衛
(72)【発明者】
【氏名】佐藤 賢太
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175AA01
5B175KA04
(57)【要約】 (修正有)
【課題】クラウドシステム間のデータコピーに要するコストを低減させ得るコピー制御装置及び方法を提供する。
【解決手段】方法は、各ストレージ装置から、そのストレージ装置に格納されたデータと、他のストレージ装置に格納されたデータとの重複の有無を判定するための所定情報を収集し、コピー元のストレージ装置から他のクラウドシステム内のストレージ装置へのコピー処理要求を受け付け、収集した所定情報に基づいて、コピー対象のデータと、コピー先のストレージ装置が属するクラウドシステム内の各データとの重複を判定し、コピー先のストレージ装置が属するクラウドシステム内のデータうち、コピー対象のデータと重複すると判定したデータを、コピー先のストレージ装置にコピーするよう当該データが格納されたストレージ装置に指示した後に、残りのデータのコピー先のストレージ装置へのコピーをコピー元のストレージ装置に指示する。
【選択図】
図19
【特許請求の範囲】
【請求項1】
それぞれ1又は複数のストレージ装置を有する複数のクラウドシステム間のデータコピーを制御するコピー制御装置であって、
各クラウドシステムの前記ストレージ装置から、当該ストレージ装置に格納されたデータと、他の前記ストレージ装置に格納されたデータとの重複の有無を判定するための所定情報をそれぞれ収集する情報収集部と、
コピー元の前記クラウドシステム内のストレージ装置から他の前記クラウドシステム内の前記ストレージ装置へデータをコピーするコピー処理要求を受け付けるコピー処理受付部と、
前記情報収集部により収集された前記所定情報に基づいて、受け付けた前記コピー処理要求において指定されたコピー対象のデータと、コピー先の他の前記クラウドシステム内のストレージ装置が属する前記クラウドシステム内の各データとの重複を判定するデータ重複比較部と、
前記データ重複比較部の判定結果に基づいて、前記データのコピー方式を決定し、決定した前記コピー方式に従って、前記ストレージ装置にコピー先の前記ストレージ装置へのコピー対象の前記データのコピーを指示するコピー指示部と
を備え、
前記コピー指示部は、
コピー対象のデータうち、コピー先の前記他のクラウドシステム内のデータと重複すると前記データ重複比較部により判定された前記データを、当該データを有する前記ストレージ装置からコピー先の前記ストレージ装置にコピーするよう前記他のクラウドシステムに指示し、前記コピー対象データのうち残りのデータのコピー先の前記ストレージ装置へのコピーを前記コピー元の前記クラウドシステムに指示する
を備えることを特徴とするコピー制御装置。
【請求項2】
前記情報収集部が収集する他の前記データとの重複の有無を判定するための前記所定情報はハッシュ値であり、
前記情報収集部は、前記ストレージ装置内の所定の記憶領域ごとのデータ列の前記ハッシュ値を収集し、
前記コピー処理要求は、コピー対象の前記データの前記所定の記憶領域ごとのデータ列の前記ハッシュ値に対応付けられており、
前記データ重複比較部は、前記コピー処理要求において指定されたコピー対象の前記データの前記ハッシュ値と、前記情報収集部により収集された各前記ストレージ装置に格納された前記データ列ごとの前記ハッシュ値とを比較するようにして、コピー対象の前記データと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の各前記データとの重複を判定する
ことを特徴とする請求項1に記載のコピー制御装置。
【請求項3】
前記情報収集部が収集する他の前記データとの重複の有無を判定するための前記所定情報はハッシュ値であり、
前記情報収集部は、前記ストレージ装置に格納されたファイル及びオブジェクトごとの前記ハッシュ値を収集し、
前記コピー処理要求は、コピー対象の前記ファイル及び又は前記オブジェクトごとの前記ハッシュ値に対応付けられており、
前記データ重複比較部は、前記コピー処理要求において指定されたコピー対象の前記ファイル及び又は前記オブジェクトの前記ハッシュ値と、前記情報収集部により収集された各前記ストレージ装置に格納された前記ファイル及び前記オブジェクトごとの前記ハッシュ値とを比較するようにして、コピー対象の前記ファイル及び又は前記オブジェクトと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の前記ファイル及び前記オブジェクトとの重複を判定する
ことを特徴とする請求項1に記載のコピー制御装置。
【請求項4】
前記情報収集部が収集する他の前記データとの重複の有無を判定するための前記所定情報は、類似性が確率的に判定可能なバケット値であり、
前記情報収集部は、前記ストレージ装置ごとの前記バケット値を収集し、
前記コピー処理要求は、コピー対象の前記データの所定の記憶領域ごとのデータ列のハッシュ値に対応付けられており、
前記データ重複比較部は、前記コピー処理要求に含まれる前記コピー対象の前記データの前記所定の記憶領域ごとの前記データ列の前記ハッシュ値に基づいて前記バケット値を算出し、算出した前記バケット値と、前記情報収集部により収集された前記ストレージ装置ごとの前記バケット値とを比較するようにして、コピー対象の前記データと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の各前記データとの重複を判定する
ことを特徴とする請求項1に記載のコピー制御装置。
【請求項5】
前記情報収集部が収集する他の前記データとの重複の有無を判定するための前記所定情報は、類似性が確率的に判定可能なバケット値であり、
前記情報収集部は、前記ストレージ装置ごとの前記バケット値を収集し、
前記コピー処理要求は、コピー対象の前記ファイル及び又は前記オブジェクトごとのハッシュ値に対応付けられており、
前記データ重複比較部は、前記コピー処理要求に含まれる前記コピー対象の前記ファイル及び又は前記オブジェクトごとの前記ハッシュ値に基づいて前記バケット値を算出し、算出した前記ハッシュ値と、前記情報収集部により収集された各前記ストレージ装置に格納された前記ファイル及び前記オブジェクトごとの前記バケット値とを比較するようにして、コピー対象の前記ファイル及び又は前記オブジェクトと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の前記ファイル及び前記オブジェクトとの重複を判定する
ことを特徴とする請求項1に記載のコピー制御装置。
【請求項6】
前記コピー指示部は、
コピー先の前記他のクラウドシステムでの同じストレージ装置内のコピー処理、コピー先の前記他のクラウドシステム内での異なるストレージ装置間のコピー処理、コピー元の前記クラウドシステムのストレージ装置と、コピー先の前記他のクラウドシステムのストレージ装置との間のコピー処理、の順で実行されるように前記コピーを指示する
ことを特徴とする請求項1に記載のコピー制御装置。
【請求項7】
それぞれ1又は複数のストレージ装置を有する複数のクラウドシステム間のデータコピーを制御するコピー制御装置により実行されるコピー制御方法であって、
各クラウドシステムの前記ストレージ装置から、当該ストレージ装置に格納されたデータと、他の前記ストレージ装置に格納されたデータとの重複の有無を判定するための所定情報をそれぞれ収集する第1のステップと、
コピー元の前記クラウドシステム内のストレージ装置から他の前記クラウドシステム内の前記ストレージ装置へデータをコピーするコピー処理要求を受け付ける第2のステップと、
収集した前記所定情報に基づいて、受け付けた前記コピー処理要求において指定されたコピー対象のデータと、コピー先の他の前記クラウドシステム内のストレージ装置が属する前記クラウドシステム内の各データとの重複を判定する第3のステップと、
判定結果に基づいて、前記データのコピー方式を決定し、決定した前記コピー方式に従って、前記ストレージ装置にコピー先の前記ストレージ装置へのコピー対象の前記データのコピーを指示する第4のステップと
を備え、
前記第4のステップにおいて、前記コピー制御装置は、
コピー対象のデータうち、コピー先の前記クラウドシステム内のデータと重複すると判定した前記データを、当該データを有する前記ストレージ装置からコピー先の前記ストレージ装置にコピーするよう他の前記クラウドシステムに指示し、前記コピー対象のデータのうち残りのデータのコピー先の前記ストレージ装置へのコピーを前記コピー元の前記クラウドシステムに指示する
を備えることを特徴とするコピー制御方法。
【請求項8】
前記第1のステップにおいて前記コピー制御装置が収集する他の前記データとの重複の有無を判定するための前記所定情報はハッシュ値であり、
前記第1のステップにおいて、前記コピー制御装置は、前記ストレージ装置内の所定の記憶領域ごとのデータ列の前記ハッシュ値を収集し、
前記コピー処理要求は、コピー対象の前記データの前記所定の記憶領域ごとのデータ列の前記ハッシュ値に対応付けられており、
前記第3のステップにおいて、前記コピー制御装置は、前記コピー処理要求において指定されたコピー対象の前記データの前記ハッシュ値と、収集した各前記ストレージ装置に格納された前記データ列ごとの前記ハッシュ値とを比較するようにして、コピー対象の前記データと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の各前記データとの重複を判定する
ことを特徴とする請求項7に記載のコピー制御方法。
【請求項9】
前記第1のステップにおいて前記コピー制御装置が収集する他の前記データとの重複の有無を判定するための前記所定情報はハッシュ値であり、
前記第1のステップにおいて、前記コピー制御装置は、前記ストレージ装置に格納されたファイル及びオブジェクトごとの前記ハッシュ値を収集し、
前記コピー処理要求は、コピー対象の前記ファイル及び又は前記オブジェクトごとの前記ハッシュ値に対応付けられており、
前記第3のステップにおいて、前記コピー制御装置は、前記コピー処理要求において指定されたコピー対象の前記ファイル及び又は前記オブジェクトの前記ハッシュ値と、収集した各前記ストレージ装置に格納された前記ファイル及び前記オブジェクトごとの前記ハッシュ値とを比較するようにして、コピー対象の前記ファイル及び又は前記オブジェクトと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の前記ファイル及び前記オブジェクトとの重複を判定する
ことを特徴とする請求項7に記載のコピー制御方法。
【請求項10】
前記第1のステップにおいて前記コピー制御装置が収集する他の前記データとの重複の有無を判定するための前記所定情報は、類似性が確率的に判定可能なバケット値であり、
前記第1のステップにおいて、前記コピー制御装置は、前記ストレージ装置ごとの前記バケット値を収集し、
前記コピー処理要求は、コピー対象の前記データの所定の記憶領域ごとのデータ列のハッシュ値に対応付けられており、
前記第3のステップにおいて、前記コピー制御装置は、前記コピー処理要求に含まれる前記コピー対象の前記データの前記所定の記憶領域ごとの前記データ列の前記ハッシュ値に基づいて前記バケット値を算出し、算出した前記バケット値と、収集した前記ストレージ装置ごとの前記バケット値とを比較するようにして、コピー対象の前記データと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の各前記データとの重複を判定する
ことを特徴とする請求項7に記載のコピー制御方法。
【請求項11】
前記第1のステップにおいて前記コピー制御装置が収集する他の前記データとの重複の有無を判定するための前記所定情報は、類似性が確率的に判定可能なバケット値であり、
前記第1のステップにおいて、前記コピー制御装置、前記ストレージ装置ごとの前記バケット値を収集し、
前記コピー処理要求は、コピー対象の前記ファイル及び又は前記オブジェクトごとのハッシュ値に対応付けられており、
前記第3のステップにおいて、前記コピー制御装置は、前記コピー処理要求に含まれる前記コピー対象の前記ファイル及び又は前記オブジェクトごとの前記ハッシュ値に基づいて前記バケット値を算出し、算出した前記ハッシュ値と、前記情報収集部により収集された各前記ストレージ装置に格納された前記ファイル及び前記オブジェクトごとの前記バケット値とを比較するようにして、コピー対象の前記ファイル及び又は前記オブジェクトと、コピー先の前記ストレージ装置が属する前記クラウドシステム内の前記ファイル及び前記オブジェクトとの重複を判定する
ことを特徴とする請求項7に記載のコピー制御方法。
【請求項12】
前記第4のステップにおいて、前記コピー制御装置は、
コピー先の他の前記クラウドシステムでの同じストレージ装置内のコピー処理、コピー先の他の前記クラウドシステム内での異なるストレージ装置間のコピー処理、コピー元の前記クラウドシステムのストレージ装置と、コピー先の他の前記クラウドシステムのストレージ装置との間のコピー処理の順で実行されるように前記コピーを指示する
ことを特徴とする請求項7に記載のコピー制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はコピー制御装置及び方法に関し、例えば、それぞれ1又は複数のストレージ装置を備える複数のクラウドシステムにおける各ストレージ装置の運用を管理する運用管理装置に適用して好適なものである。
【背景技術】
【0002】
近年、IT(Information Technology)システムのクラウド利用が一般的となっている。これに伴い、複数の異なるクラウド事業者が提供するサービスをそれぞれ利用したITシステムを構築及び運用する企業も多い。これは、クラウド事業者ごとにそれぞれ特徴のあるサービスを提供していることなどから、ITシステムごとにそのITシステムに最適なサービスを提供するクラウド事業者を選択したいという利用者の希望による。
【0003】
一例として、既存の業務システムはクラウド事業者Aが提供するクラウドシステムAを利用して構築する一方で、機械学習などを使った新しいITシステムは機械学習系のサポートが手厚いクラウド事業者BのクラウドシステムBを利用してシステムを構築するといった事例を挙げることができる。
【0004】
このような状況を想定すると、既存のクラウドシステムAに構築した既存の業務システムのデータを新規にクラウドシステムB上に構築した業務システムでも利用したいという必然的な動機が生じると考えられる。
【0005】
ここで、一般的にクラウドシステムの利用料金は、利用状況に応じた従量課金制であることが知られている。例えば、一般的なクラウドコンピューティングでは、利用している計算資源の性能や利用時間によって利用料金が加算される。これは、クラウドシステムにおけるネットワーク接続の利用に関しても同様であり、一般的にはクラウドシステムへの通信データ量に対して料金が加算される。
【0006】
この場合、多くのクラウド事業者は、ネットワーク接続の利用に対する従量課金について、クラウドシステム外からクラウドシステム内への通信(これを一般的にインバウンドという)に係る通信と、クラウドシステム内からクラウドシステム外への通信(これを一般的にアウトバウンドという)に係る通信とで、異なる料金体系を採用している。具体的には、インバウンドの通信に関しては従量課金の対象外(無料)であることが多く、一方でアウトバウンドの通信に関しては従量課金の対象となることが多い。
【0007】
このため、上述のような異なるクラウド事業者のクラウドシステム間でデータ移動を行う場合を考えると、移動元のクラウドシステムからデータを転送する通信が上述のアウトバウンドとなるため、移動するデータ量に応じたコストが生じる。
【0008】
このように、クラウドシステムの利用にあたっては、データ移動に伴うコストが直接的に運用コストとなるため、複数の異なるクラウドシステム間を大量のデータを移動する場合などで、これらのコスト削減への要求があると考えられる。
【0009】
また、クラウドシステムにおいてはデータを格納するための各種ストレージ装置が提供されており、例えば、SDS(Software Defined Storage)と呼ばれるストレージ装置の機能を実現するソフトウェアを用い、クラウド上で仮想的なストレージ装置を実現する仮想ストレージアプライアンスといったサービスがある。
【0010】
これらは、従来の物理的なストレージ装置と互換性のあるストレージ機能や監視・管理機能をユーザに提供することができる。例えば、オンプレミス環境の従来ストレージ装置とクラウド上に構築した仮想的なストレージ装置の間で、相互に互換性のあるバックアップやデータコピー、レプリケーションといったストレージ機能を利用できる。
【0011】
また、企業では自社のオンプレミス環境とクラウドシステムとを併用するといった運用も増えている。そこで、オンプレミス環境に設置した既存のストレージ装置やIT資産の運用管理と、クラウド上に構築した仮想的なストレージやIT資産の運用管理とを統合的に管理可能とするため、IT運用管理装置自体をクラウドとして提供するSaaS(Software-as-a-Service)型のIT運用管理装置が登場している。
【0012】
このようなSaaSでは、クラウド上からIT資産の設置された物理的なロケーションに関係なくユーザのIT資産を監視することで、ユーザはオンプレミスのデータセンタや複数クラウドで運用しているIT資産を俯瞰的・統合的に運用管理を行うことが可能となっている。
【0013】
また、複数のストレージ装置間において、バックアップやディザスタリカバリ(Disaster Recovery)などを目的としたレプリケーションやリモートコピーなどの機能については、従来からデータ複製に係るデータ転送量を削減するための技術として、例えば以下の特許文献1及び2に開示された技術が知られている。
【0014】
具体的に、特許文献1には、複数のストレージ装置間において、装置間のデータを同期するリモートコピーを実施する場合において、コピー元装置で発生したデータ更新の差分データのみを検知して、差分データのみをコピー先装置へ送信することで、ストレージ装置間を接続するネットワークにおけるデータ転送量を削減する技術が開示されている。
【0015】
また、特許文献2には、複数のストレージ装置間におけるレプリケーションにおいて、複製元装置からボリュームやスナップショットのデータ複製を複製先装置に作成する際、複製元のボリュームやスナップショットのデータと、複製先ストレージにすでに格納されているデータとを比較し、複製先ストレージに格納されていないユニークなデータのみをレプリケーション処理の対象とすることで、処理時間の短縮や、データ転送量の削減を行う技術が開示されている。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】米国特許出願8,250,031 B2号明細書
【特許文献2】米国特許出願10,656,864 B2号明細書
【発明の概要】
【発明が解決しようとする課題】
【0017】
上述のようにクラウドシステムで提供されている固有のサービスを利用する場合などでは、異なるクラウドシステム間など運用されているストレージ装置間でデータ移動を行う必要が生じる。
【0018】
例えば、第1のクラウドシステムの第1のストレージ装置の第1のボリュームから、第2のクラウドシステムの第2のストレージ装置の第2のボリュームへデータ移動を行う場合、このデータ移動処理は、前記第1のクラウドシステムにおいて、アウトバウンド通信となるため、一般的にデータ移動量に応じた従量課金の対象となる。
【0019】
このため、異なるクラウドシステム間のデータ移動はデータ移動に伴い無視できないコストが発生し、これがユーザにとってはITシステム運用コストの増加や、特定のクラウド事業者が提供するクラウドシステムへのロックインの要因となり得る。
【0020】
本発明は以上の点を考慮してなされたもので、クラウドシステム間において行うデータコピーの際に生じるクラウドシステム間のデータ移動量の削減し、クラウドシステム間のデータコピーに要するコストを低減させ得るコピー制御装置及び方法を提案しようとするものである。
【課題を解決するための手段】
【0021】
かかる課題を解決するため本発明においては、それぞれ1又は複数のストレージ装置を有する複数のクラウドシステム間のデータコピーを制御するコピー制御装置であって、各クラウドシステムの前記ストレージ装置から、当該ストレージ装置に格納されたデータと、他の前記ストレージ装置に格納されたデータとの重複の有無を判定するための所定情報をそれぞれ収集する情報収集部と、コピー元の前記クラウドシステム内のストレージ装置から他の前記クラウドシステム内の前記ストレージ装置へデータをコピーするコピー処理要求を受け付けるコピー処理受付部と、前記情報収集部により収集された前記所定情報に基づいて、受け付けた前記コピー処理要求において指定されたコピー対象のデータと、コピー先の他の前記クラウドシステム内のストレージ装置が属する前記クラウドシステム内の各データとの重複を判定するデータ重複比較部と、前記データ重複比較部の判定結果に基づいて、前記データのコピー方式を決定し、決定した前記コピー方式に従って、前記ストレージ装置にコピー先の前記ストレージ装置へのコピー対象の前記データのコピーを指示するコピー指示部とを設け、前記コピー指示部が、コピー対象のデータうち、コピー先の前記他のクラウドシステム内のデータと重複すると前記データ重複比較部により判定された前記データを、当該データを有する前記ストレージ装置からコピー先の前記ストレージ装置にコピーするよう前記他のクラウドシステムに指示し、前記コピー対象データのうち残りのデータのコピー先の前記ストレージ装置へのコピーを前記コピー元の前記クラウドシステムに指示するようにした。
【0022】
また本発明においては、それぞれ1又は複数のストレージ装置を有する複数のクラウドシステム間のデータコピーを制御するコピー制御装置により実行されるコピー制御方法であって、各クラウドシステムの前記ストレージ装置から、当該ストレージ装置に格納されたデータと、他の前記ストレージ装置に格納されたデータとの重複の有無を判定するための所定情報をそれぞれ収集する第1のステップと、コピー元の前記クラウドシステム内のストレージ装置から他の前記クラウドシステム内の前記ストレージ装置へデータをコピーするコピー処理要求を受け付ける第2のステップと、収集した前記所定情報に基づいて、受け付けた前記コピー処理要求において指定されたコピー対象のデータと、コピー先の他の前記クラウドシステム内のストレージ装置が属する前記クラウドシステム内の各データとの重複を判定する第3のステップと、判定結果に基づいて、前記データのコピー方式を決定し、決定した前記コピー方式に従って、前記ストレージ装置にコピー先の前記ストレージ装置へのコピー対象の前記データのコピーを指示する第4のステップとを設け、前記第4のステップにおいて、前記コピー制御装置が、コピー対象のデータうち、コピー先の前記クラウドシステム内のデータと重複すると判定した前記データを、当該データを有する前記ストレージ装置からコピー先の前記ストレージ装置にコピーするよう他の前記クラウドシステムに指示し、前記コピー対象のデータのうち残りのデータのコピー先の前記ストレージ装置へのコピーを前記コピー元の前記クラウドシステムに指示するようにした。
【0023】
本発明のデータ制御装置及び方法によれば、クラウドシステム間において行うデータコピーの際に生じるクラウドシステム間のデータ移動量の削減することができる。
【発明の効果】
【0024】
本発明によれば、クラウドシステム間のデータ移動に要するコストを低減させ得るコピー制御装置及び方法を実現できる。
【図面の簡単な説明】
【0025】
【
図1】本実施の形態による情報処理システムの全体構成を示すブロック図である。
【
図2】ストレージ装置がブロックストレージ装置である場合における本情報処理システムの論理構成を示すブロック図である。
【
図3】ストレージ装置がファイル・オブジェクトストレージ装置である場合における本情報処理システムの論理構成を示すブロック図である。
【
図4】運用管理システム管理情報データベース群の構成を示す概念図である。
【
図5】組織情報データベースの構成例を示す図表である。
【
図6】ストレージ管理情報データベースの構成例を示す図表である。
【
図7】(A)はハッシュ管理情報がハッシュ値である場合の統合ハッシュ管理情報データベースの構成例を示す図表であり、(B)はハッシュ管理情報がバケット値である場合の統合ハッシュ管理情報データベースの構成例を示す図表である。
【
図8】(A)はハッシュ管理情報がハッシュ値である場合の統合ファイルハッシュ管理情報データベースの構成例を示す図表であり、(B)はハッシュ管理情報がバケット値である場合の統合ファイルハッシュ管理情報データベースの構成例を示す図表である。
【
図9】(A)はストレージ装置がブロックストレージである場合のストレージ固有管理情報テーブル群の構成例を示す概念図であり、(B)はストレージ装置がファイル・オブジェクトストレージ装置である場合のストレージ固有管理情報テーブル群の構成例を示す概念図である。
【
図10】ボリューム管理情報テーブルの構成例を示す図表である。
【
図11】プール管理情報テーブルの構成例を示す図表である。
【
図12】論理アドレス管理情報テーブルの構成例を示す図表である。
【
図13】ハッシュ管理情報テーブルの構成例を示す図表である。
【
図14】ファイル・オブジェクト管理情報テーブルの構成例を示す図表である。
【
図15】ファイルハッシュ管理情報テーブルの構成例を示す図表である。
【
図16】コピー処理要求のデータ構造例を示す図表である。
【
図17】統合ハッシュ管理情報等収集処理の処理手順を示すフローチャートである。
【
図18】データコピー処理の処理手順を示すフローチャートである。
【
図19】ボリュームコピー処理の処理手順を示すフローチャートである。
【
図20】クラウド内データコピー処理の処理手順を示すフローチャートである。
【
図21】クラウド間データコピー処理の処理手順を示すフローチャートである。
【
図22】ファイルコピー処理の処理手順を示すフローチャートである。
【
図23】クラウド内ファイルコピー処理の処理手順を示すフローチャートである。
【
図24】クラウド間ファイルコピー処理の処理手順を示すフローチャートである。
【発明を実施するための形態】
【0026】
以下図面について、本発明の一実施の形態を詳述する。
【0027】
なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、実施の形態の中で説明されている要素の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0028】
また、以下の説明では、各種情報を「テーブル」、「データベース」又は「リスト」等の表現で説明することがあるが、各種情報はテーブル、データベース、リスト等以外のデータ構造で表現されていてもよい。そのため、データ構造に依存しないことを示すため、「xxxテーブル」、「xxxデータベース」、「xxxリスト」等を「xxx情報」と称することがある。
【0029】
また以下の説明では、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」又は「ID」という表現を用いるが、これらについてはお互いに置換が可能である。
【0030】
さらに以下の説明では、プログラムや、プロセッサがプログラムを実行することにより具現化される機能部を主語として処理を説明することがあるが、プログラムはプロセッサ(例えば、CPU:Central Processing Unit)によって実行されることによって、定められた処理を記憶資源(例えば、メモリ)、通信I/F、ポートを用いて処理を実行するため、プロセッサを主語として説明してもよい。またプログラムを主語として説明された処理は、プロセッサを有する計算機(例えば、運用管理装置又はストレージ装置)や計算機に実装された「コントローラ」等のハードウェアが行う処理としてもよい。
【0031】
さらに以下の説明において、プログラムは、プログラムソース(例えば、プログラム配布サーバや、計算機が読み取り可能な記憶メディア)から各計算機にインストールされてもよい。この場合、プログラム配布サーバはCPUと記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムを記憶している。そして、配布プログラムをCPUが実行することで、プログラム配布サーバのCPUは配布対象のプログラムを他の計算機に配布する。
【0032】
さらに以下の説明において、ボリュームは、物理的な記憶領域に限定されず、論理的な記憶領域であってもよい。また「プール(POOL)」は、論理的な記憶領域(例えば複数のプールボリュームの集合)であり、用途ごとに用意されてよい。例えば、プールとして、TPプールと、スナップショットプールとのうちの少なくとも1種類があってよい。TPプールは、複数のページ(実体的な記憶領域)で構成された記憶領域でよい。
【0033】
ストレージコントローラが、上位装置から受信したライト要求が指定するアドレスが属する仮想領域(TPボリュームの仮想領域)にページが割り当てられていない場合、その仮想領域(ライト先仮想領域)にTPプールからページを割り当てる(ライト先仮想領域にページが割り当て済であってもページが新たにライト先仮想領域に割り当てられてもよい)。
【0034】
ストレージコントローラは、割り当てられたページに、そのライト要求に付随するライト対象データを書き込んでよい。スナップショットプールは、オリジナルのボリュームから退避されたデータが格納される記憶領域でよい。1つのプールが、TPプールとしてもスナップショットプールとしても使用されてもよい。「プールボリューム」は、プールの構成要素となるボリュームでよい。
【0035】
(1)本実施の形態による情報処理システムの構成
図1において、1は全体として本実施の形態による情報処理システムの一構成例を示す。この構成例における情報処理システム1は、複数のクラウドシステム2(第1のクラウドシステム2A、第2のクラウドシステム2B、……)と、運用管理装置3とを備えて構成される。また各クラウドシステム2間、及び、各クラウドシステム2及び運用管理装置3間は、それぞれインターネット等のネットワーク4を介して通信自在に接続されている。
【0036】
各クラウドシステム2は、それぞれ複数のストレージ装置5を備えて構成されており、これらストレージ装置5が内部ネットワーク6を介して通信自在に接続されている。以下においては、第1のクラウドシステム2Aは第1及び第2のストレージ装置5A,5Bを備え、第2のクラウドシステム2Bは第3及び第4のストレージ装置5C,5Dを備えるものとする。
【0037】
各ストレージ装置5は、CPU、メモリ及びハードディスク装置などの情報処理資源を備えた物理的なストレージ装置として構築されていても、またSDSのような論理的なストレージ装置として構築されていてもよい。ストレージ装置5は、記憶領域であるボリュームVOL(VOL1,VOL2,……)をユーザに提供し、ユーザからの要求に応じてそのボリュームVOLにデータを読み書きする。
【0038】
以下においては、第1のストレージ装置5Aに第1及び第2のボリュームVOL1,VOL2が設けられ、第2のストレージ装置5Bに第3及び第4のボリュームVOL3,VOL4が設けられ、第3のストレージ装置5Cに第5及び第6のボリュームVOL5,VOL6が設けられ、第4のストレージ装置5Dに第7及び第8のボリュームVOL7,VOL8が設けられているものとする。
【0039】
ボリュームVOLは、実体的な容量をもつ記憶領域であっても、またデータの読書きに応じて動的に物理的な記憶領域が割り当てられる仮想的な容量をもつ記憶領域であってもよい。例えば、実体的な容量をもつ記憶領域として、シック・プロビジョニング(Thick Provisioning)を適用したデータ格納領域(ボリューム)を適用でき、仮想的な容量をもつデータ格納領域として、シン・プロビジョニング(Thine Provisioning)を適用したデータ格納領域(ボリューム)を適用することができる。
【0040】
各ストレージ装置5は、それぞれネットワーク4を介して運用管理装置3と接続されており、情報処理システム1のシステム管理者7は、ネットワーク4を介して運用管理装置3を操作する。
【0041】
各ストレージ装置5には、管理エージェント8が実装される。管理エージェント8は、運用管理装置3に対してその管理エージェント8が稼動しているストレージ装置(以下、これをその管理エージェントに対する自ストレージ装置と呼ぶ)5の構成情報、稼動情報、性能情報及び容量情報などの各種情報を運用管理装置3に送信したり、運用管理装置3からの指示に応じて自ストレージ装置5の設定や構成を変更する。
【0042】
管理エージェント8は、ソフトウェアとしてストレージ装置5内に実装されていてもよく、またBMC(Baseboard Micro Controller)などのハードウェア的に独立した管理用のコントローラに実装されていてもよい。
【0043】
運用管理装置3は、各クラウドシステム2の各ストレージ装置5からネットワーク4を介してそのストレージ装置5の構成情報及び稼動情報などの上述の各種情報を定期的に収集し、収集したこれらの情報に基づいてこれらストレージ装置5の状態を監視する。なお、各ストレージ装置5の構成情報及び稼動情報などの情報を運用管理装置3が能動的に収集するのではなく、各ストレージ装置5がこれらの情報を定期的に運用管理装置3に送信するようにしてもよい。
【0044】
運用管理装置3は、CPU、メモリ及びハードディスク装置などの情報処理資源を備える物理的なサーバ装置として構成されていてもよく、またクラウド上で動作するSaaSや、物理的なサーバ装置上で稼動するソフトウェアとして構成されていてもよい。
【0045】
図2は、本情報処理システム1の各ストレージ装置5がチャンク単位でデータを読み書きするブロックストレージ装置である場合において、あるクラウドシステム2のストレージ装置5内のボリュームVOLの全データを、他のクラウドシステム2のいずれかのストレージ装置5内のボリュームVOLにコピーするボリュームコピー処理に関する本情報処理システム1の論理構成を示す。
【0046】
この
図2に示すように、各ストレージ装置5に実装された管理エージェント8は、それぞれデータ監視部10を備える。データ監視部10は、自ストレージ装置5内の各ボリュームVOLにそれぞれ格納されたデータのハッシュ値を1つのチャンクに格納されたデータ列(以下、これをチャンクデータ列と呼ぶ)単位でハッシュ関数により求める処理を定期的に実行する機能を有する機能部である。
【0047】
この際、データ監視部10が利用するハッシュ関数としては、例えばSHA(Secure Hash Algorithm)-1や、SHA-2、MD(Message Digest)5などのハッシュアルゴリズムに基づくものや、チャンクデータ列の特定の一部を利用する方式などを適用することができる。データ監視部10は、算出したチャンク単位のハッシュ値を、そのチャンクデータ列が格納されているチャンクの位置を表す論理アドレスと対応付けてハッシュ管理情報テーブル11に格納して管理する。
【0048】
なお、ストレージ装置5がデータ重複排除機能やスナップショット機能を有する場合などでは、一般的にチャンクデータ列ごとの固有値データを識別するために、ハッシュ関数などを用いてチャンクデータ列固有のハッシュ値を算出し、算出したハッシュ値を、そのハッシュ値に対応するチャンクデータ列が格納されたチャンクの論理アドレスと対応付けてハッシュテーブルやアドレステーブルに格納して管理する機構をそのストレージ装置5が備えている。このような場合には、データ監視部10やハッシュ管理情報テーブル11に代えて、かかる機構を利用するようにしてもよい。
【0049】
ハッシュ管理情報テーブル11に格納されたチャンクデータ列ごとのハッシュ値は、ハッシュ管理情報として、管理エージェント8により定期的にそのストレージ装置5の構成情報や稼動情報などの情報と共に運用管理装置3に定期的に送信される(S1)。
【0050】
このとき運用管理装置3に送信されるハッシュ管理情報はチャンクデータ列ごとのハッシュ値そのものでもよいが、本実施の形態においては、ハッシュ管理情報の情報量を圧縮するため、ボリュームVOLに格納された各チャンクデータ列のハッシュ値を1つのバケット値と呼ばれるデータ形式のデータに変換したものをそのボリュームVOLに関するハッシュ管理情報として運用管理装置3に送信するものとする。「バケット値」は、例えばHyperLogLogと呼ばれる統計的な異なる推定アルゴリズムを用いてかかるハッシュ値の集合から生成される、ある任意のハッシュ値が存在する確率を表すデータ形式のデータである。このようにすることによって、運用管理装置3が管理すべきハッシュ管理情報の情報量を大幅に低減することができる。
【0051】
一方、運用管理装置3は、機能部として管理情報送受信・格納部12、コピー処理受付部13、データ重複比較部14及びコピー方式生成・指示部15を備え、データベースとしてストレージ管理情報データベース16、ストレージ稼動情報データベース17及び統合ハッシュ管理情報データベース18を備えて構成される。
【0052】
管理情報送受信・格納部12は、各ストレージ装置5との間で管理情報やコマンドの送受信を行ったり、受信した管理情報を対応するデータベースに格納する機能を有する機能部である。
【0053】
実際上、管理情報送受信・格納部12は、各ストレージ装置5から収集した各ストレージ装置5の構成情報をストレージ管理情報としてストレージ管理情報データベース16に格納すると共に、稼動情報をストレージ稼動情報データベース17に格納する。また管理情報送受信・格納部12は、これらの情報と共に各ストレージ装置5の管理エージェント8から送信されてきたハッシュ管理情報を統合ハッシュ管理情報データベース18に格納する(S2)。
【0054】
コピー処理受付部13は、ストレージ装置5から送信されてくるボリューム単位のコピー処理要求を受け付け、受け付けたコピー処理要求をデータ重複比較部に14引き渡す機能を有する機能部である。なお、コピー処理要求には、コピー元のボリューム(以下、これをコピー元ボリュームと呼ぶ)VOLのボリューム番号及び当該コピー元ボリュームVOLが設けられたストレージ装置5の製番と、コピー先のボリューム(以下、これをコピー先ボリュームと呼ぶ)VOLのボリューム番号及び当該コピー先ボリュームVOLが設けられたストレージ装置5の製番と、コピー先ボリュームVOLに関するハッシュ管理情報と含まれる。
【0055】
データ重複比較部14は、コピー処理受付部13から引き渡されたコピー処理要求に基づいて、コピー元ボリュームVOLに関するハッシュ管理情報と、統合ハッシュ管理情報データベース18に格納されているハッシュ管理情報とをそれぞれ比較する機能を有する機能部である。データ重複比較部14は、この比較により、コピー元ボリュームVOLに格納されているデータの一部(チャンクデータ列)が他のボリュームVOLに格納されているデータの一部と重複しているか否かを判定する(S3)。
【0056】
この際、データ重複比較部14が「コピー元ボリュームVOLに関するハッシュ管理情報」と比較する「他のボリュームVOLに関するハッシュ管理情報」は、コピー先ボリュームVOLが設けられたストレージ装置5を備えるクラウドシステム2内のコピー先ボリュームVOL以外の各ボリュームVOLに関するハッシュ管理情報である。
【0057】
例えば、
図2に示すように、第1のクラウドシステム2Aの第2のストレージ装置5B内の第4のボリュームVOL4の全データを第2のクラウドシステム2Bの第3のストレージ装置5Cの第5のボリュームVOL5にコピーするボリュームコピーの場合、データ重複比較部14は、コピー処理受付部13から与えられた第3のボリュームVOL3に関するハッシュ管理情報と、統合ハッシュ管理情報データベース18に格納されている第2のクラウドシステム2A内の第3又は第4のストレージ装置5C,5D内に設けられた第6~第8のボリュームVOL6~VOL8に関するハッシュ管理情報とをそれぞれ比較する。
【0058】
本実施の形態においては、上述のようにハッシュ管理情報としてバケット値を用いているため、かかる比較によって、コピー元ボリュームVOLに格納されているデータの一部(チャンクデータ列)が、コピー先ボリュームVOLが設けられたストレージ装置5を備えるクラウドシステム2内のコピー先ボリュームVOL以外のボリュームVOLに格納されているデータと一部が重複するか否かが確率的に導出される。なお、この方式では、一般的にはある程度の偽要請を含む。
【0059】
コピー方式生成・指示部15は、コピー元ボリュームVOLからコピー先ボリュームVOLへのデータコピーのプラン(以下、これをデータコピープランと呼ぶ)を生成(決定)する機能を有する機能部である。コピー方式生成・指示部15は、データ重複比較部14による上記判定の判定結果に基づいて、コピー先ボリュームVOLが設けられたストレージ装置5が属するクラウドシステム2内のコピー先ボリュームVOL以外のボリュームVOLにコピー対象のデータの一部(コピー元ボリュームVOLに格納された一部のチャンクデータ列)と同一内容のデータ(以下、これを重複データと呼ぶ)が格納されていると判定された場合には、そのボリュームVOLからコピー先ボリュームVOLにその重複データをコピーするようデータコピープランを生成する(S4)。
【0060】
このデータコピープランは、どのデータをコピー先ボリュームVOL内のどの位置にコピーすべきかという具体的なコピー指示命令と、コピー順序とを含む。コピー順序は、コピーコストを考慮して、最初に、コピー先ボリュームVOLが設けられたストレージ装置5内でのコピーを行い、次に、そのストレージ装置5が属するクラウドシステム2内でのコピーを行い、最後に、コピー元ボリュームVOLからコピー先ボリュームVOLのコピーを行うように決定される。
【0061】
そしてコピー方式生成・指示部15は、この後、生成したデータコピープランに従って、決定したコピー順序でコピー処理が実行されるよう、該当するストレージ装置5にコピー処理要求を送信する。
【0062】
例えば、
図2の例において、データ重複比較部14による上述の判定結果として、コピー先ボリュームである第5のボリュームVOL5の重複データが第6のボリュームVOL6に存在するとの判定結果が得られている場合、コピー方式生成・指示部15は、まず、第3のストレージ装置5Cに対してコピー処理要求を送信する(S5)。これにより、第6のボリュームVOL6に重複データが存在する場合に、その重複データが第6のボリュームVOL6から第5のボリュームVOL5にコピーされる。このとき、データ重複比較部14の判定結果が偽陽性であったなどの理由により重複データが第6のボリュームVOL6に存在しなかった場合には、第3のストレージ装置5Cの管理エージェント8がその旨を運用管理装置3のコピー方式生成・指示部15に通知する。
【0063】
次に、コピー方式生成・指示部15は、データ重複比較部14により第7及び又は第8のボリュームVOL7,VOL8に重複データ存在するとの判定結果が得られている場合、第4のストレージ装置5Dに対してコピー処理要求を送信する(S6)。これにより、第7のボリュームVOL7や第8のボリュームVOL8に重複データが格納されていた場合に、その重複データが第3のストレージ装置5C及び第4のストレージ装置5D間のストレージ装置間コピーにより第5のボリュームVOL5にコピーされる。このときも、第7及び第8のボリュームVOL7,VOL8に重複データが存在しなかった場合には、第4のストレージ装置5Dの管理エージェント8がその旨を運用管理装置3のコピー方式生成・指示部15に通知する。
【0064】
そしてコピー方式生成・指示部15は、この後、ステップS5及びステップS6の処理結果を受けて、第2のストレージ装置5Bにコピー処理要求を送信する(S7)。この結果、第4のボリュームVOL4に格納されているデータのうちのコピー処理が完了していないすべてのデータに対する第5のボリュームVOL5へのコピーが実行される。
【0065】
この場合のコピーは、第1のクラウドシステム2Aから第2のクラウドシステム2Bへのデータコピーとなるため、第1のクラウドシステム2Aではアウトバンド通信となり、通信データ量に応じたコストが発生する。しかしながら、ステップS5及びステップS6のコピー処理により、第4のボリュームVOL4に格納されたデータをすべて第1のクラウドシステム2Aから第2のクラウドシステム2Bに移動する場合に比べて移動データ量を削減することができる。
【0066】
このコピー処理の完了後、第4のボリュームVOL4の内容が第5のボリュームVOL5に正しくコピーできたか否かを確認するため、第3のストレージ装置5Cにおいて、第5のボリュームVOL5に格納されたデータの一貫性チェックを実行し、第4のボリュームVOL4での結果と比較する。この一貫性チェック方式としては、CRC(Cyclic Redundancy Check)を用いた方式でもよく、またハッシュ関数に基づく方式でもよい。
【0067】
一方、
図2との対応部分に同一符号を付した
図3は、本情報処理システム1の各ストレージ装置5がデータをファイルやオブジェクトを単位としてデータの読み書きを行うファイル・オブジェクトストレージ装置である場合において、あるクラウドシステム2のストレージ装置5に格納された1又は複数のファイル及び又はオブジェクトを、他のクラウドシステム2のストレージ装置5にコピーするファイルコピー処理に関する本情報処理システム1の論理構成を示す。なお以下の説明では、ファイル及びオブジェクトは、データ列の集合としての単位を表現するものであって、実質的には同等のものとして取り扱うものとする。
【0068】
この場合、各ストレージ装置5(
図3の説明においては、ファイル・オブジェクトストレージ装置)の管理エージェント20はデータ監視部21を備えている。そしてデータ監視部21は、定期的に自ストレージ装置5に格納された各ファイル及び各オブジェクトについて、ファイル単位及びオブジェクト単位でデータ内容を識別可能な固有値(ハッシュ値)をハッシュ関数によって求める機能を有する。
【0069】
この際、データ監視部21が利用するハッシュ関数としては、
図2の場合と同様に、SHA-1や、SHA-2、MD5などのハッシュアルゴリズムに基づくものを適用できる。またファイルやオブジェクトを構成するデータ列の特定の一部を利用してハッシュ値を求めるようにしてもよい。
【0070】
データ監視部21は、算出したファイル及びオブジェクトごとのハッシュ値をファイルハッシュ管理情報テーブル22に格納して管理する。ファイルハッシュ管理情報テーブル22は、ファイル及びオブジェクトごとに対応するハッシュ値と、そのファイル又はオブジェクトの名前及びサイズなどの属性値を管理するためのテーブルとして構成される。
【0071】
なお、ストレージ装置5がデータ重複排除機能やスナップショット機能を有する場合などでは、一般的にファイルやオブジェクトごとにデータを識別するため、ハッシュ関数などを用いてデータ固有のハッシュ値を算出し、算出したハッシュ値を、そのハッシュ値に対応するファイル及びオブジェクトと対応付けて管理する機構をそのストレージ装置5が備えている。このような場合は、データ監視部21及びファイルハッシュ管理情報テーブル22に代えて、かかる機構を利用するようにしてもよい。
【0072】
ファイルハッシュ管理情報テーブル22に格納されたファイル及びオブジェクトごとのハッシュ値は、ファイルハッシュ管理情報として、管理エージェント20により定期的にそのストレージ装置5の構成情報や稼動情報などの必要な情報と共に運用管理装置3に送信される(S10)。
【0073】
このとき運用管理装置3に送信されるファイルハッシュ管理情報は、ファイル及びオブジェクトごとのハッシュ値そのものでもよいが、本実施の形態においては、ファイルハッシュ管理情報の情報量を圧縮するため、自ストレージ装置5内にある任意のファイルハッシュ値が存在する確率を表すバケット値として運用管理装置3に送信するものとする。このようにすることによって、運用管理装置3が管理すべきファイルハッシュ管理情報の情報量を大幅に低減することができる。
【0074】
運用管理装置3は、機能部として管理情報送受信・格納部12、コピー処理受付部13、データ重複比較部14及びコピー方式生成・指示部15を備え、データベースとしてストレージ管理情報データベース16、ストレージ稼動情報データベース17及び統合ファイルハッシュ管理情報データベース23を備えて構成される。
【0075】
運用管理装置3の管理情報送受信・格納部12は、各ストレージ装置5から送信されてきた各ストレージ装置5の構成情報をストレージ管理情報としてストレージ管理情報データベース16に格納すると共に、稼動情報をストレージ稼動情報データベース17に格納する。また管理情報送受信・格納部12は、これらの情報と共に各ストレージ装置5から送信されてきたファイル及びオブジェクトごとのファイルハッシュ管理情報を統合ファイルハッシュ管理情報データベース23に格納する(S11)。
【0076】
そして
図3の情報処理システム1では、あるクラウドシステム2のストレージ装置5に格納されたいずれかのファイル又はオブジェクトを、他のクラウドシステム2内のストレージ装置5にコピーする場合、コピー対象のファイル又はオブジェクトを保持するコピー元のストレージ装置5(以下、これをコピー元ストレージ装置5と呼ぶ)からそのファイル又はオブジェクトに関するファイルハッシュ管理情報がコピー処理要求と共に運用管理装置3に送信される(S12)。
【0077】
例えば、
図3の例で、第2のストレージ装置5Fに格納されたファイルを第3のストレージ装置5Gにコピーする場合、第2のストレージ装置5Fが、そのファイルに関するファイルハッシュ管理情報をコピー処理要求と共に運用管理装置3のコピー処理受付部13に送信する。
【0078】
コピー処理受付部13は、受信したコピー対象のファイル又はオブジェクトのファイルハッシュ管理情報をデータ重複比較部14に引き渡す。またデータ重複比較部14は、コピー処理受付部13から引き渡されたファイルハッシュ管理情報と、統合ファイルハッシュ管理情報データベース23に格納されている他のストレージ装置5に格納された各ファイル及び各オブジェクトのファイルハッシュ管理情報とをそれぞれ比較し、コピー対象のファイル又はオブジェクトが、コピー先のストレージ装置5(以下、これをコピー先ストレージ装置5と呼ぶ)が属するクラウドシステム2内のいずれかのストレージ装置5に格納されたファイル又はオブジェクトと重複している(同一である)か否かを判定する(S13)。
【0079】
例えば、
図3の例の場合、データ重複比較部14は、第2のストレージ装置5Fに格納されたコピー対象のファイル又はオブジェクトが、第3のストレージ装置5Gに格納されたいずれかのファイル又はオブジェクトや、第4のストレージ装置5Hに格納されたいずれかのファイル又はオブジェクトと重複しているか否かを判定する。
【0080】
なお本実施の形態においては、上述のようにファイルハッシュ管理情報としてバケット値を用いているため、例えばコピー対象のファイル又はオブジェクトに関する任意のファイルハッシュ値をもつファイル又はオブジェクトが、コピー先ストレージ装置5や、当該コピー先ストレージ装置5と同じクラウドシステム2で稼動する他のストレージ装置5に格納されているファイル又はオブジェクトと重複するか否かは確率的に導出され、一般的にはある程度の偽要請を含む。
【0081】
続いて、コピー方式生成・指示部15が、コピー元ストレージ装置5からコピー先ストレージ装置5へのファイルやオブジェクトのコピープラン(以下、これをファイルコピープランと呼ぶ)を生成する。この際、コピー方式生成・指示部15は、データ重複比較部14による上記判定の判定結果に基づいて、コピー先ストレージ装置5が属するクラウドシステム2内のコピー先ストレージ装置5以外のストレージ装置5にコピー対象のファイル又はオブジェクトが格納されていることが判明した場合には、そのストレージ装置5からコピー先ストレージ装置5にそのファイル又はオブジェクトをコピーするようファイルコピープランを生成する。
【0082】
ファイルコピープランは、どのファイルやオブジェクトをコピー先ストレージ装置5内のどのデータ領域にコピーすべきかという具体的なコピー指示命令と、コピー順序とを含む。コピー順序は、コピーコストを考慮して、コピー先ストレージ装置5に存在するコピー対象のファイルやオブジェクトをコピー対象から除外した上で、まず、コピー先ストレージ装置5が属するクラウドシステム2内でのコピーを行い、次に、コピー元ストレージ装置5からコピー先ストレージ装置5にコピー対象のファイルやオブジェクトをコピーするよう決定される。
【0083】
そしてコピー方式生成・指示部15は、この後、生成したファイルコピープランに従って、決定したコピー順序でコピー処理が実行されるよう、該当するストレージ装置5にコピー処理要求を送信する。
【0084】
例えば、
図3の例において、データ重複比較部14による上述の判定結果として、第3のストレージ装置5Gにコピー対象のファイル及び又はオブジェクトと同一のファイル及び又はオブジェクトが存在するとの判定結果が得られている場合、コピー方式生成・指示部15は、第3のストレージ装置5Gに対してコピー対象のファイル及び又はオブジェクトと、当該第3のストレージ装置5Gに格納されている各ファイル及び又はオブジェクトとの同一性をチェックさせ、同一性を有するファイルやオブジェクトをコピー対象から除外する(S15)。
【0085】
次に、コピー方式生成・指示部15は、データ重複比較部14による上述の判定結果として、第4のストレージ装置5Hにコピー対象のファイル及び又はオブジェクトが存在するとの判定結果が得られている場合には、第4のストレージ装置5Hに対してコピー処理要求を送信する(S16)。これにより、第4のストレージ装置5Hにコピー対象のファイル又はオブジェクトと同一のファイル又はオブジェクトが存在する場合に、そのファイル及び又はオブジェクトが第4のストレージ装置5Hから第3のストレージ装置5Gにコピーされる。このとき、データ重複比較部14の判定結果が偽陽性であったなどの理由によりかかるファイル及び又はオブジェクトが第4のストレージ装置5Hに存在しなかった場合には、第4のストレージ装置5Hの管理エージェント20がその旨を運用管理装置3のコピー方式生成・指示部15に通知する。
【0086】
そしてコピー方式生成・指示部15は、この後、ステップS15及びステップS16の処理結果を受けて、第2のストレージ装置5Fにコピー処理要求を送信する(S17)。この結果、コピー対象のファイル及び又はオブジェクトのうちのコピー処理が完了していないすべてのファイル及び又はオブジェクトの第2のストレージ装置5Fから第3のストレージ装置5Gへのコピーが実行される。
【0087】
この場合のコピーは、第1のクラウドシステム2Aから第2のクラウドシステム2Bへのファイルコピーとなるため、第1のクラウドシステム2Aではアウトバンド通信となり、通信データ量に応じたコストが発生する。しかしながら、ステップS15及びステップS16のコピー処理により、コピー対象のファイル及び又はオブジェクトのデータを第2のストレージ装置5Fから第3のストレージ装置5Gに転送する場合に比べて転送データ量を削減することができる。
【0088】
(2)運用管理装置が管理する各種データベースの構成
次に、運用管理装置3が以上のようなコピー制御処理を実行するために管理しているデータベース群(以下、これをまとめて運用管理装置管理情報データベース群と呼ぶ)の構成について説明する。なお、以下においては、情報処理システム1内にブロックストレージ装置のみからなるクラウドシステム2と、ファイル・オブジェクトストレージ装置のみからなるクラウドシステム2とが混在しており、運用管理装置3が
図2について上述したコピー制御処理と、
図3について上述したコピー制御処理の双方を実行可能である場合について説明する。
【0089】
図4は、このような運用管理装置3が管理する運用管理装置管理情報データベース群30の構成を示す。この
図4に示すように、運用管理装置管理情報データベース群30は、組織情報データベース31と、
図2や
図3について上述したストレージ管理情報データベース16、ストレージ稼動情報データベース17、統合ハッシュ管理情報データベース18及び統合ファイルハッシュ管理情報データベース23とを備えて構成される。
【0090】
組織情報データベース31は、運用管理装置3が提供する上述のコピー制御処理などのサービスを利用するユーザを組織として管理するために利用されるデータベースである。
【0091】
この組織情報データベース31は、
図5に示すように、組織ID欄31A、組織コード欄31B、組織タイプ欄31C、組織名欄31D及び契約状況欄31Eを備えたテーブル構造を有する。組織情報データベース31では、1つのエントリが1つの組織に対応する。
【0092】
そして組織ID欄31Aには、そのとき登録された対応する組織の識別子(組織ID)が格納され、組織コード欄31Bには、その組織に割り当てられたその組織に固有の組織コードが格納される。また組織タイプ欄31Cには、その組織の種別(組織タイプ)が格納される。組織タイプとしては、顧客が利用する「Customer」と、関連会社が利用する「Partner」となどがある。
【0093】
さらに組織名欄31Dには、対応する組織の名前が格納され、契約状況欄31Eには、対応する組織が運用管理装置が提供するサービスを利用するための契約の有効性を表す契約状況が格納される。かかる契約状況としては、契約が有効である「Active」と、有効期限切れなどにより契約が無効となった「Inactive」となどがある。
【0094】
従って、
図5の例の場合、「001」という組織IDが付与された「OrgA」という組織コードの組織種別(組織タイプ)は「Customer」、組織名は「N.Bank」であり、契約状況は「Active」であることが示されている。
【0095】
またストレージ管理情報データベース16は、各組織がそれぞれ保有又は利用するストレージ装置5に関する情報を管理するために利用されるデータベースであり、
図6に示すように、組織ID欄16A、製番欄16B、ストレージタイプ欄16C、モデル名欄16D、ファームウェアバージョン欄16E、ストレージ名称欄16F、ロケーション情報欄16G及びストレージ状態欄16Hを備えたテーブル構造を有する。ストレージ管理情報データベース16では、1つのエントリが1つの組織が保有又は利用する1つのストレージ装置5に対応する。
【0096】
そして組織ID欄16Aには、対応する組織の組織IDが格納される。この組織IDは、
図5について上述した組織情報データベース31の組織IDに対応する。また製番欄16Bには、その組織が保持又は利用するストレージ装置5の製番が格納され、ストレージタイプ欄16Cには、そのストレージ装置5のストレージタイプが格納される。ストレージタイプとしては、そのストレージ装置5がハードウェアを持たないソフトウェア的なブロックストレージ装置である「SDS Block」と、そのストレージ装置5がハードウェアを持たないソフトウェア的なファイルストレージ装置である「SDS File」と、そのストレージ装置5がハードウェアを持つブロックストレージ装置である「Block」と、そのストレージ装置5がハードウェアを持つファイルストレージ装置である「File」となどがある。
【0097】
モデル名欄16D、ファームウェアバージョン欄16E及びストレージ名称欄16Fには、そのストレージ装置5のモデル名、ファームウェアのバージョン及び名称がそれぞれ格納され、ロケーション情報欄16Gには、そのストレージ装置5が設置又は配置されているクラウドシステム2の名称等の識別情報が格納される。さらにストレージ状態欄16Hには、そのストレージ装置5の現在の状態が格納される。ストレージ装置5の現在の状態としては、オンライン状態である「Online」と、オフライン状態である「offline」となどがある。
【0098】
従って、
図6の例の場合、例えば「001」という組織IDの組織に属する「20080」という製番のストレージ装置5は、ストレージタイプが「SDS Block」で、モデル名が「aaaa」、ファームウェアのバージョンが「v1.2」、名称が「Storage A」というストレージ装置であり、「Cloud A」というクラウドシステム2に設置され、現在の状態が「Online」であることが示されている。
【0099】
なお、ストレージ管理情報データベース16に格納された情報は、運用管理装置3の管理情報送受信・格納部12と、各ストレージ装置5の管理エージェント8,20との定期的な通信やイベントドリブンでの通信により取得したストレージ装置5の構成情報や稼動情報に基づいて管理情報送受信・格納部12により適宜更新される。
【0100】
統合ハッシュ管理情報データベース18は、情報処理システム1内のストレージタイプがブロックストレージ装置である各ストレージ装置5からそれぞれ定期的に送信されてくるハッシュ管理情報を保持し統合管理するために用いられるデータベースである。
【0101】
図7(A)は、かかるハッシュ管理情報がチャンクごとのハッシュ値である場合における統合ハッシュ管理情報データベース18の構成を示す。この場合、統合ハッシュ管理情報データベース18は、製番欄18AX及びハッシュ値欄18BXを備えたテーブル構造を有する。この統合ハッシュ管理情報データベース18では、1つの製番欄18AXが、本情報処理システム1内に存在するストレージタイプがブロックストレージ装置である1つのストレージ装置5に対応する。
【0102】
そして製番欄18AXには、対応するストレージ装置5の製番が格納される。またハッシュ値欄18BXは、対応するストレージ装置5内に存在する各チャンクにそれぞれ対応付けて設けられており、これらのハッシュ値欄18BXに、対応するチャンクに格納されたチャンクデータ列について算出されたハッシュ値がそれぞれ格納される。なおハッシュ値欄18BXは、対応するチャンクに付与された論理アドレスの順番に並べられている。従って、
図7(A)の例の場合、例えば「20080」という製番のストレージ装置5の1番目の論理アドレスのチャンクに格納されたチャンクデータ列のハッシュ値が「7726f55012e1e26cc762c9982e7c6c54ca7bb303」であることが示されている。
【0103】
また
図7(B)は、ハッシュ管理情報がバケット値である場合における統合ハッシュ管理情報データベース18の構成を示す。この場合、この
図7(B)に示すように、統合ハッシュ管理情報データベース18は、製番欄18AY及びバケット値欄18BYを備えたテーブル構造を有する。統合ハッシュ管理情報データベース18では、1つのエントリが本情報処理システム1内に存在するストレージタイプがブロックストレージ装置である1つのストレージ装置5に対応する。
【0104】
そして製番欄18AYには、対応するストレージ装置5の製番が格納される。またバケット値欄18BYは、1つのストレージ装置5に対して1つ設けられており、これらバケット値欄18BYに、対応するストレージ装置5について算出されたバケット値がそれぞれ格納される。従って、
図7(B)の例の場合、例えば「20080」という製番のストレージ装置のバケット値が「{12,62086,92019,…,672819,27118,272828}」であることが示されている。
【0105】
本実施の形態においては、上述のようにハッシュ管理情報としてバケット値が用いられるため、運用管理装置3は、
図7(B)の統合ハッシュ管理情報データベース18を保持することになる。
【0106】
なお、統合ハッシュ管理情報データベース18に格納された情報は、運用管理装置3の管理情報送受信・格納部12と、対応するストレージ装置5の管理エージェント8との定期的な通信や、イベントドリブンでの通信により取得したハッシュ管理情報に基づいて管理情報送受信・格納部12により適宜更新される。
【0107】
また統合ファイルハッシュ管理情報データベース23は、情報処理システム1内のストレージタイプがファイルストレージ装置である各ストレージ装置5からそれぞれ定期的に送信されてくるファイルハッシュ管理情報を統合管理するためのデータベースである。
【0108】
図8(A)は、かかるファイルハッシュ管理情報がファイル及びオブジェクトごとのハッシュ値である場合における統合ファイルハッシュ管理情報データベース23の構成を示す。この場合、統合ファイルハッシュ管理情報データベース23は、製番欄23AX、ファイル名欄23BX、ファイルサイズ欄23CX及びハッシュ値欄23DXを備えたテーブル構造を有する。この場合の統合ファイルハッシュ管理情報データベース23では、1つの製番欄23AXが、本情報処理システム1内に存在するストレージタイプがファイルストレージ装置である1つのストレージ装置5に対応する。
【0109】
そして製番欄23AXには、対応するストレージ装置5の製番が格納される。またファイル名欄23BX、ファイルサイズ欄23CX及びハッシュ値欄23DXは、対応するストレージ装置5に格納された各ファイルにそれぞれ対応付けて設けられている。そして、ファイル名欄23BXには、対応するファイルのファイル名が格納され、ファイルサイズ欄23CXには、そのファイルのファイルサイズが格納され、ハッシュ値欄23DXには、そのファイルについて算出されたハッシュ値が格納される。
【0110】
従って、
図8(A)の例の場合、例えば「20080」という製番のファイルストレージ装置に格納された「aaa」というファイル名のファイルのファイルサイズは「1024KB」で、そのファイルのハッシュ値が「7726f5501…」であることが示されている。
【0111】
また
図8(B)は、各ストレージ装置5から送信されてくるファイルハッシュ管理情報がバケット値である場合における統合ファイルハッシュ管理情報データベース23の構成を示す。この場合、この
図8(B)に示すように、統合ファイルハッシュ管理情報データベース23は、製番欄23AY及びバケット値欄23BYを備えたテーブル構造を有する。この場合の統合ファイルハッシュ管理情報データベース23では、1つのエントリが本情報処理システム1内に存在するストレージタイプがファイルストレージ装置である1つのストレージ装置5に対応する。
【0112】
そして製番欄23AYには、対応するストレージ装置5の製番が格納される。またバケット値欄23BYは、1つのストレージ装置5に対して1つ設けられており、これらバケット値欄23BYに、対応するストレージ装置5について算出されたバケット値がそれぞれ格納される。従って、
図8(B)の例の場合、例えば「20080」という製番のストレージ装置5のバケット値が「{12,62086,92019,…,672819,27118,272828}」であることが示されている。
【0113】
なお本実施の形態においては、上述のようにファイルハッシュ管理情報としてバケット値が用いられるため、運用管理装置は、
図8(B)の統合ファイルハッシュ管理情報データベース23を保持することになる。
【0114】
統合ファイルハッシュ管理情報データベース23に格納された情報も、運用管理装置3の管理情報送受信・格納部12と、対応するストレージ装置5の管理エージェント20(
図3)との定期的な通信や、イベントドリブンでの通信により取得したファイルハッシュ管理情報に基づいて管理情報送受信・格納部12により適宜更新される。
【0115】
一方、
図9(A)及び(B)は、各ストレージ装置5が管理するそのストレージ装置5に固有の各種管理情報が格納されたストレージ固有管理情報テーブル群32A,32Bの構成を示す。
図9(A)は、ストレージタイプがブロックストレージであるストレージ装置5の管理エージェント8(
図2)が管理しているストレージ固有管理情報テーブル群32Aの構成を示し、
図9(B)は、ストレージタイプがファイルストレージであるストレージ装置5の管理エージェント20(
図3)が管理しているストレージ固有管理情報テーブル群32Bの構成を示す。
【0116】
図9(A)に示すように、ストレージタイプがブロックストレージであるストレージ装置5の管理エージェント8が管理しているストレージ固有管理情報テーブル群32Aは、ボリューム管理情報テーブル33、プール管理情報テーブル34、論理アドレス管理情報テーブル35及び
図2について上述したハッシュ管理情報テーブル11から構成される。
【0117】
ボリューム管理情報テーブル33は、対応するストレージ装置5内に定義されたボリュームVOLを管理するために利用されるテーブルであり、
図10に示すように、ボリューム番号欄33A、ボリューム容量欄33B、データ削減有効欄33C及びプール番号欄33Dを備えて構成される。ボリューム管理情報テーブル33では、1つのエントリが対応するストレージ装置5内に定義された1つのボリュームVOLに対応する。
【0118】
そしてボリューム番号欄33Aには、対応するボリュームVOLに付与されたそのボリュームVOLに固有の番号(ボリューム番号)が格納され、ボリューム容量欄33Bには、そのボリュームVOLの容量が格納される。ボリュームVOLの容量は、対応するボリュームVOLが物理的な記憶領域をもつ場合にはその記憶領域の合計容量であり、対応するボリュームVOLが物理的な記憶領域を持たない仮想的なボリュームである場合には、そのボリュームVOLについて定義された仮想的な容量が格納される。
【0119】
またデータ削減有効欄33Cには、対応するボリュームVOLに対するデータ削減機能(例えば、データ圧縮機能やデータ重複排除機能などの格納データのデータ量を削減する機能)の適用が有効となっているか否かを表す情報が格納される。
図10の例では、かかるデータ削減機能の適用が有効になっている場合には「有効」が格納され、かかるデータ削減機能の適用が有効になっている場合には「無効」が格納される。
【0120】
さらにプール番号欄33Dには、対応するボリュームVOLが物理的な記憶領域を持たない仮想的なボリュームである場合に当該ボリュームVOLに関連付けられたプール(当該ボリュームVOLに動的に物理的な記憶領域を割り当てるプール)の識別番号(プール番号)が格納される。また対応するボリュームVOLが物理的な記憶領域を持つボリュームである場合には、当該ボリュームVOLにプールが関連付けられることはないため、関連付けられたプールが存在しないことを表す「N/A」が格納される。
【0121】
従って
図10の例の場合、例えば「1」というボリューム番号が付与されたボリュームVOLは、ボリューム容量が「1TB」の仮想的なボリュームであり、「1」というプール番号のプールと関連付けられ、データ削減機能の適用が「無効」に設定されていることが示されている。
【0122】
プール管理情報テーブル34は、対応するストレージ装置5内に定義されたプールを管理するために利用されるテーブルであり、
図11に示すように、プール番号欄34A、プール容量欄34B、プール割当て容量欄34C、プール使用容量欄34D及びプールボリューム情報欄34Eを備えて構成される。プール管理情報テーブル34では、1つのエントリが対応するストレージ装置5内に定義された1つのプールに対応する。
【0123】
そしてプール番号欄34Aには、対応するプールに付与されたそのプールに固有の番号(ぷウール番号)が格納され、プール容量欄34Bには、そのプールの容量が格納される。またプール割当て容量欄34Cには、そのプールからそのプールに関連付けられたボリュームVOLに割り当てられた記憶領域の合計容量が格納される。
【0124】
プール使用容量欄34Dには、そのプールから関連付けられたボリュームVOLに割り当てられた各記憶領域にそれぞれ格納されたデータの総量が格納される。データ削減機能によりデータ量が削減されている場合、削減後のデータの総量をプール使用容量欄34Dに格納するようにしてもよい。さらにプールボリューム情報欄34Eには、対応するプールを構成し、実質的な記憶領域を提供するすべてのボリュームVOLのボリュームIDが格納される。
【0125】
従って、
図11の例の場合、例えば、「1」というプール番号のプールは、「1」というボリューム番号のボリュームVOLから記憶領域が提供される「10TB」分のプール容量を有するプールであり、「10TB」のうち「4TB」分の記憶領域が既にいずれか1又は複数のボリュームVOLに割り当てられ、これら「4TB」分の記憶領域に「1TB」分のデータが格納されていることが示されている。
【0126】
論理アドレス管理情報テーブル35は、対応するストレージ装置5内の論理アドレスがそれぞれ付与された各チャンクに関する各種情報を管理するために利用されるテーブルであり、
図12に示すように、ボリューム番号欄35A、論理アドレス欄35B、参照先ボリューム番号欄35C、参照先論理アドレス欄35D、サイズ欄35E、ハッシュ値欄35F及び参照数欄35Gを備えて構成される。
【0127】
ボリューム番号欄35Aは、自ストレージ装置5内に定義された各ボリュームVOLにそれぞれ対応させて設けられる。そしてボリューム番号欄35Aには、対応するボリュームVOLに付与されたボリューム番号が格納される。
【0128】
また各ボリューム番号欄35Aにそれぞれ対応する論理アドレス欄35B、参照先ボリューム番号欄35C、参照先論理アドレス欄35D、サイズ欄35E、ハッシュ値欄35F及び参照数欄35Gは、対応するボリュームVOL内の各チャンクにそれぞれ対応付けて区分されている。
【0129】
そして論理アドレス欄35Bには、対応するチャンクの論理アドレスが格納される。また参照先ボリューム番号欄35Cには、対応するチャンクに書き込まれたデータが実際に格納されるボリュームVOLのボリューム番号が格納され、参照先論理アドレス欄35Dには、そのチャンクに割り当てられたそのボリュームVOL内の物理チャンクの論理アドレスが格納される。
【0130】
ボリューム番号欄35Aに格納されたボリューム番号と、参照先ボリューム番号欄35Cに格納されたボリューム番号とが一致する場合、対応するボリュームVOLは物理的な記憶領域を持つ物理ボリュームであり、当該ボリュームVOLに書き込まれたデータは、そのボリュームVOL内の参照先論理アドレス欄35Dに格納された論理アドレスが付与されたチャンクに格納される。
【0131】
またボリューム番号欄35Aに格納されたボリューム番号と、参照先ボリューム番号欄35Cに格納されたボリューム番号とが一致しない場合、対応するボリュームVOLは実体を有さない仮想的なボリュームVOLであり、当該ボリュームVOLに書き込まれたデータは、参照先ボリューム番号欄35Cにボリューム番号が格納されたボリュームVOL内の参照先論理アドレス欄35Dに格納された論理アドレスが付与されたチャンクに格納される。
【0132】
さらにサイズ欄35Eには、対応する論理アドレスが付与されたチャンクのサイズ(容量)が格納され、ハッシュ値欄35Fには、そのチャンクに格納されたデータのハッシュ値が格納される。さらに参照数欄35Gには、対応するチャンクに格納されたデータがデータ重複排除機能やスナップ機能などにより自己又は他のボリュームVOL内の他の論理アドレスから参照されている数(以下、これを参照数と呼ぶ)が格納される。参照数が「0」であれば、そのチャンクに格納されたデータが自己又は他のボリュームVOL内の他の論理アドレスから参照されていない(他の論理アドレスとデータを共有していない)ことを意味し、参照数が「1」以上であれば、そのチャンクに格納されたデータが参照数分の己又は他のボリュームVOL内の他の論理アドレスから参照されている(参照数分の論理アドレスとデータを共有している)ことを意味する。
【0133】
従って、
図12の例の場合、例えば「1」というボリューム番号が付与されたボリュームVOL内の「0x00000000」という論理アドレスが付与されたチャンクは実体を有する記憶領域であり(ボリューム番号及び参照先ボリューム番号と、論理アドレス及び参照先論理アドレスとがいずれも同じ)、そのチャンクのサイズは「8192」、当該チャンクに書き込まれたデータのハッシュ値は「7726f55012e1e26…」で、自己又は他のボリュームVOL内のいずれか1つの論理アドレスから参照されている(参照数が「1」)ことが示されている。
【0134】
ハッシュ管理情報テーブル11は、対応するストレージ装置5内の各チャンクにそれぞれ格納されたデータのハッシュ値を管理し、ハッシュ値をキーとしてそのチャンクを有するボリュームVOLのボリューム番号や、対応するデータが格納されたチャンクの論理アドレスを逆引きできるように構成されたテーブルであり、
図13に示すように、ハッシュ値欄11A、ボリューム番号欄11B、論理アドレス欄11C及びサイズ欄11Dを備えて構成される。ハッシュ管理情報テーブル11では、1つのエントリが対応するストレージ装置5内の1つのチャンクに格納されたデータのハッシュ値に対応する。
【0135】
そしてハッシュ値欄11Aには、対応するデータのハッシュ値が格納される。またボリューム番号欄11Bには、そのハッシュ値を有するデータが格納されたチャンクを有するボリュームVOLのボリューム番号が格納され、論理アドレス欄11Cには、そのチャンクの論理アドレスが格納される。さらにサイズ欄11Dには、そのデータのデータサイズが格納される。
【0136】
従って、
図13の例の場合、例えば「7726f55012e1e26…」というハッシュ値のデータは、「1」というボリューム番号が付与されたボリュームVOL内の「0x00000000」という論理アドレスが付与されたチャンク内に格納されており、そのデータのデータサイズが「8192」であることが示されている。
【0137】
他方、
図9(B)は、ストレージタイプがファイル・オブジェクトストレージであるストレージ装置5の管理エージェント20(
図3)が管理しているストレージ固有管理情報テーブル群32Bの構成を示す。
図9(B)に示すように、かかるストレージ固有管理情報テーブル群32Bは、ファイル・オブジェクト管理情報テーブル36と、
図3について上述したファイルハッシュ管理情報テーブル22とから構成される。
【0138】
ファイル・オブジェクト管理情報テーブル36は、対応するファイル・オブジェクトストレージ装置に格納された各ファイル及び各オブジェクトを管理するために利用されるテーブルであり、
図14に示すように、ファイル・オブジェクトID欄36A、ファイル・オブジェクトタイプ欄36B、ファイル・オブジェクト名欄36C、ファイルサイズ欄36D及びハッシュ値欄36Eを備えて構成される。ファイル・オブジェクト管理情報テーブル36では、1つのエントリが、対応するストレージ装置5に格納された1つのファイル又はオブジェクトに対応する。
【0139】
そしてファイル・オブジェクトID欄36Aには、対応するファイル又はオブジェクトに付与されたそのファイル又はオブジェクトに固有の識別子(ファイル・オブジェクトID)が格納される。またファイル・オブジェクトタイプ欄36Bには、そのファイル又はオブジェクトのタイプが格納される。
図14の例では、対応するエントリがファイルである場合には「File」、そのエントリがオブジェクトである場合には「Object」がファイル・オブジェクトタイプ欄に格納される。
【0140】
さらにファイル・オブジェクト名欄36Cには、対応するファイル又はオブジェクトの名前が格納され、ファイルサイズ欄36Dには、対応するファイル又はオブジェクトのサイズが格納される。さらにハッシュ値欄36Eには、そのファイル又はオブジェクトについて算出されたハッシュ値が格納される。
【0141】
従って、
図14の例の場合、例えば「1」というファイル・オブジェクトIDが付与されたエントリのタイプは「ファイル(File)」であり、その名前は「aaa」、ファイルサイズは「1024KB」で、ハッシュ値は「7726f55012e1e26…」であることが示されている。
【0142】
ファイルハッシュ管理情報テーブル22は、対応するストレージ装置5に格納された各ファイル及び各オブジェクトのハッシュ値を管理し、ハッシュ値をキーとして対応するファイルやオブジェクトのファイル・オブジェクトIDを逆引きできるように構成されたテーブルである。このファイルハッシュ管理情報テーブル22は、
図15に示すように、ハッシュ値欄22A及びファイル・オブジェクトID欄22Bを備えて構成される。ファイルハッシュ管理情報テーブル22では、1つのエントリが、対応するストレージ装置5に格納された1つのファイル又はオブジェクトのハッシュ値に対応する。
【0143】
そしてハッシュ値欄22Aには、対応するファイル又はオブジェクトのハッシュ値が格納される。またファイル・オブジェクトID欄22Bには、そのハッシュ値を有するファイル又はオブジェクトのファイル・オブジェクトIDが格納される。
【0144】
従って、
図15の例の場合、例えば「7726f55012e1e26…」というハッシュ値のファイル又はオブジェクトは、「1」というファイル・オブジェクトIDが付与されたファイル又はオブジェクトであることが示されている。
【0145】
(3)コピー処理要求のデータ構造
図16は、ストレージ装置5がボリューム単位又はファイル・オブジェクト単位のコピーを運用管理装置3に要求する際にそのストレージ装置5から運用管理装置3に送信される上述のコピー処理要求のデータ構造を示す。コピー処理要求40は、この
図16に示すように、基本情報領域41、コピー元ボリュームハッシュ値リスト領域42及びコピー対象ファイルリスト領域43を備えて構成される。
【0146】
基本情報領域41は、要求するコピー処理の基本情報が格納される領域であり、コピー対象がボリュームVOLである場合と、ファイル又はオブジェクトである場合とで共通して利用される。この基本情報領域41は、処理管理番号欄41A、コピーモード欄41B、コピー元ストレージ製番欄41C、コピー元ボリューム番号欄41D、コピー先ストレージ製番欄41E及びコピー先ボリューム番号欄41Fを備えて構成される。
【0147】
そして処理管理番号欄41Aには、そのとき要求するコピーの処理管理者用の番号(処理管理番号)が格納される。またコピーモード欄41Bには、そのコピー要求のタイプ(コピーモード)が格納される。コピーモードとしては、
図2について上述したボリューム単位でのコピー要求と、
図3について上述したファイル又はオブジェクト単位でのコピー要求とがあり、例えば、ボリューム単位でのコピー要求の場合には、「ボリュームコピー」という情報がコピーモード欄41Bに格納され、ファイル又はオブジェクト単位でのコピー要求の場合には、「ファイルコピー」という情報がコピーモード欄41Bに格納される。
【0148】
コピー元ボリューム番号欄41D及びコピー元ストレージ製番欄41Cは、コピーモードがボリュームコピーのときにのみ有効となる。そしてコピー元ボリューム番号欄41Dには、要求するボリュームコピーにおけるコピー元ボリュームVOLのボリューム番号が格納され、コピー元ストレージ製番欄41Cには、そのコピー元ボリュームVOLを備えるストレージ装置5の製番が格納される。
【0149】
またコピー先ボリューム番号欄41F及びコピー先ストレージ製番欄41Eも、コピーモードがボリュームコピーのときにのみ有効となる。そしてコピー先ボリューム番号欄41Fには、要求するボリュームコピーにおけるコピー先ボリュームVOLのボリューム番号が格納され、コピー先ストレージ製番欄41Eには、そのコピー先ボリュームVOLを備えるストレージ装置5の製番が格納される。
【0150】
コピー元ボリュームハッシュ値リスト領域42は、コピー元ボリュームVOLの各チャンクにそれぞれ格納されたチャンクデータ列のハッシュ値のリスト(以下、これをコピー元ボリュームハッシュ値リストと呼ぶ)42Xが格納された領域であり、コピーモードがボリュームコピーのときにのみ有効となる。このコピー元ボリュームハッシュ値リスト42Xは、コピー元のボリュームVOL内の各チャンクにそれぞれ対応させて設けられた論理アドレス欄42XA、サイズ欄42XB、ハッシュ値欄42XC及びコピー済みフラグ欄42XDを備えて構成される。
【0151】
そして論理アドレス欄42XAには、対応するチャンクの論理アドレスが格納され、サイズ欄42XBには、対応するチャンクに格納されているチャンクデータ列のサイズが格納される。またハッシュ値欄42XCには対応するチャンクに格納されたチャンクデータ列について算出されたハッシュ値が格納され、コピー済みフラグ欄42XDには、対応するチャンクに格納されたチャンクデータ列のコピーが完了したか否かを表すフラグ(以下、これをコピー済みフラグと呼ぶ)が格納される。コピー済みフラグは、対応するチャンクデータ列のコピーが完了していない場合には「未」、コピーが完了している場合には「済」に設定され、初期時にはすべて「未」に設定される。
【0152】
一方、コピー対象ファイルリスト領域43は、コピー対象のファイル及び又はオブジェクトのリスト(以下、これをコピー対象ファイルリストと呼ぶ)43Xが格納された領域であり、コピーモードがファイルコピーのときにのみ有効となる。このコピー対象ファイルリスト43Xは、コピー対象のファイル及び又はオブジェクトにそれぞれ対応させて設けられたファイル名欄43XA、サイズ欄43XB、ハッシュ値欄43XC及びコピー済みフラグ欄43XDを備えて構成される。
【0153】
そしてファイル名欄43XAには、対応するファイル又はオブジェクトの名前が格納され、サイズ欄43XBには、そのファイル又はオブジェクトのサイズが格納される。またハッシュ値欄43XCには対応するファイル又はオブジェクトについて算出されたハッシュ値が格納され、コピー済みフラグ欄43XDには、そのファイル又はオブジェクトのコピーが完了したか否かを表すコピー済みフラグが格納される。このコピー済みフラグも、対応するファイル又はオブジェクトのコピーが完了していない場合には「未」、コピーが完了している場合には「済」に設定され、初期時にはすべて「未」に設定される。
【0154】
(4)本実施の形態によるコピー制御機能に関する各種処理
次に、運用管理装置3により実行される上述のコピー制御処理に関して実行される各種処理の具体的な処理内容について説明する。
【0155】
(4-1)統合ハッシュ管理情報等収集処理
図17は、運用管理装置3が情報処理システム1内の管理対象の各ストレージ装置5からハッシュ管理情報やファイルハッシュ管理情報をそれぞれ収集する一連の処理(以下、これを統合ハッシュ管理情報等収集処理と呼ぶ)の流れを示す。運用管理装置3は、管理対象の各ストレージ装置5の管理エージェント8,20(
図2及び
図3)と連携して、この
図17に示す手順でこれらストレージ装置5の統合ハッシュ情報や統合ファイルハッシュを収集する。
【0156】
この統合ハッシュ管理情報等収集処理は定期的に実行される。そして、まず、運用管理装置3の管理情報送受信・格納部12が、ストレージ管理情報データベース16に登録された監視対象のストレージ装置5の中から1つのストレージ装置5を選択する(S20)。
【0157】
続いて、管理情報送受信・格納部12は、ストレージ管理情報データベース16を参照して、ステップS20で選択したストレージ装置(以下、これを選択ストレージ装置と呼ぶ)のストレージタイプを特定する(S21)。
【0158】
また管理情報送受信・格納部12は、ステップS21で特定したストレージタイプがブロックストレージ(「SDS Block」又は「Block」)であるか否かを判断し(S22)、肯定結果を得ると、選択ストレージ装置5の管理エージェント8に対してハッシュ管理情報の送信を要求する(S23)。
【0159】
この要求を受信した選択ストレージ装置5の管理エージェント8は、ハッシュ管理情報テーブル11(
図2及び
図13)から、選択ストレージ装置5におけるコピー対象のボリュームVOL内各チャンクにそれぞれ格納されたチャンクデータ列のハッシュ値を収集し、収集したこれらのハッシュ値からコピー対象のボリュームVOL全体のバケット値を算出する(S24)。また管理エージェント8は、算出したボリュームVOLのバケット値をハッシュ管理情報として運用管理装置3の管理情報送受信・格納部12に送信する(S25)。
【0160】
そして、このハッシュ管理情報を受信した選択ストレージ装置5の管理情報送受信・格納部12は、受信したハッシュ管理情報に含まれるバケット値によって、統合ハッシュ管理情報データベース18(
図7(B))にそれまで格納されていたコピー対象のボリュームVOLのバケット値を更新(ハッシュ管理情報に含まれるバケット値を、統合ハッシュ管理情報データベース18にそれまで格納されていたコピー対象のボリュームVOLのバケット値に上書き)し(S26)、この後ステップS31に進む。
【0161】
一方、運用管理装置3の管理情報送受信・格納部12は、ステップS22の判断で否定結果を得ると、選択ストレージ装置5の管理エージェント20に対してファイルハッシュ管理情報の送信を要求する(S27)。
【0162】
この要求を受信した選択ストレージ装置5の管理エージェント20は、ファイルハッシュ管理情報テーブル22(
図3及び
図15)から、選択ストレージ装置5に格納されているコピー対象の各ファイル及び又はオブジェクトのハッシュ値を収集し、収集したこれらのハッシュ値から選択ストレージ装置5全体のバケット値を算出する(S28)。また管理エージェント20は、算出した選択ストレージ装置5のバケット値をファイルハッシュ管理情報として運用管理装置3の管理情報送受信・格納部12に送信する(S29)。
【0163】
このハッシュ管理情報を受信した運用管理装置3の管理情報送受信・格納部12は、受信したハッシュ管理情報に含まれるバケット値によって、統合ファイルハッシュ管理情報データベース23にそれまで格納されていた選択ストレージ装置5のバケット値を更新(ハッシュ管理情報に含まれるバケット値を、統合ファイルハッシュ管理情報データベース23にそれまで格納されていた選択ストレージ装置5のバケット値に上書き)する(S30)。
【0164】
この後、管理情報送受信・格納部12は、監視対象のストレージ装置5の中でステップS21以降の処理を実行していないストレージ装置5が存在するか否かを判断する(S31)。そして管理情報送受信・格納部12は、この判断で肯定結果を得るとステップS20に戻り、この後、ステップS20で選択するストレージ装置5をステップS21以降が未処理の他のストレージ装置5に順次切り替えながらステップS21以降の処理を監視対象の各ストレージ装置5の管理エージェント8,20と連携しながら繰り返し実行する。
【0165】
この繰返し処理により、運用管理装置3の統合ハッシュ管理情報データベース18に登録されている各ブロックストレージ装置のバケット値や、統合ファイルハッシュ管理情報データベース23に登録されている各ファイル・オブジェクトストレージ装置のバケット値が最新の値に順次更新される。
【0166】
そして運用管理装置3の管理情報送受信・格納部12は、やがて管理対象のすべてのストレージ装置5についてステップS21~ステップS30の処理を実行し終えることによりステップS31で否定結果を得ると、この統合ハッシュ管理情報等収集処理を終了する。
【0167】
(4-2)データコピー処理
(4-2-1)データコピー処理の流れ
一方、
図18は、ボリュームVOLやファイルのコピー元のストレージ装置5から
図16について上述したコピー処理要求40が送信されてきた場合に運用管理装置3内で実行される一連の処理(以下、これをデータコピー処理と呼ぶ)の処理内容を示す。ここでは、かかるコピー処理要求40(
図16)が、他のクラウドシステム2内のストレージ装置5へのボリュームデータや、ファイルデータ及び又はオブジェクトデータのコピーを要求する内容であったものとする。
【0168】
かかるコピー処理要求40を運用管理装置3が受信すると、運用管理装置3においてこの
図18に示すデータコピー処理が開始され、まず、コピー処理受付部13(
図2及び
図3)がそのコピー処理要求を受け付ける(S40)。
【0169】
またコピー処理受付部13は、受け付けたコピー処理要求40の基本情報領域41(
図16)のコピー元ストレージ製番欄41Cからコピー元のストレージ装置5の製番を取得し、取得した製番に基づき、ストレージ管理情報データベース16(
図6)を参照して、コピー元ストレージ装置5のストレージタイプを特定する(S41)。
【0170】
続いて、コピー処理受付部13は、ステップS41で特定したコピー元のストレージ装置5のストレージタイプがファイルであったか否か、つまりステップS41で特定したコピー元のストレージ装置5のストレージタイプが「File」又は「SDS File」であったか否かを判断する(S42)。
【0171】
この判断で否定結果が得られた場合、コピー処理受付部13は、その旨の情報を含めてステップS40で受け付けたコピー処理要求40をデータ重複比較部14に転送する。この結果、このコピー処理要求40に従ってコピー元ボリュームVOLからコピー先ボリュームVOLにデータをコピーさせるための一連の処理(以下、これをボリュームコピー処理と呼ぶ)がデータ重複比較部14及びコピー方式生成・指示部15によって実行される(S43)。
【0172】
次いで、コピー先ボリュームVOLに格納されたデータと、コピー元ボリュームVOLに格納されたデータとの整合性をチェックする整合性チェックがコピー方式生成・指示部15により実行される(S44)。そしてコピー方式生成・指示部15は、整合性チェックの管理用後、ステップS47に進む。
【0173】
これに対して、ステップS42の判断で肯定結果が得られた場合、コピー処理受付部13は、その旨の情報を含めてステップS40で受け付けたコピー処理要求40をデータ重複比較部14に転送する。この結果、このコピー処理要求40に従ってコピー元ストレージ装置5に格納されているコピー対象のファイル及び又はオブジェクトをコピー先ストレージ装置5にコピーさせるための一連の処理(以下、これをファイルコピー処理と呼ぶ)がデータ重複比較部14及びコピー方式生成・指示部15によって実行される(S45)。
【0174】
次いで、コピー先ストレージ装置5にコピーされた各ファイル及び又は各オブジェクトのデータと、コピー元ストレージ装置5に格納されているコピー対象の各ファイル及び又は各オブジェクトのデータと整合性をチェックする整合性チェックがコピー方式生成・指示部15により実行される(S46)。
【0175】
この後、コピー方式生成・指示部15は、ステップS44又はステップS46の整合性チェックにおいて問題を検出したか否かを判断し(S47)、肯定結果を得ると処理を終了する。これにより、この
図18に示す一連のデータコピー処理が終了する。
【0176】
これに対して、コピー方式生成・指示部15は、ステップS47の判断で否定結果を得ると、整合性チェックにおいて問題を検出した旨をシステム管理者7(
図1)に通知し(S48)、この後、処理を終了する。これにより、この
図18に示す一連のデータコピー処理が終了する。
【0177】
(4-2-2)ボリュームコピー処理
(4-2-2-1)ボリュームコピー処理の具体的な処理内容
図19は、
図18について上述したデータコピー処理のステップS43でデータ重複比較部14及びコピー方式生成・指示部15により実行されるボリュームコピー処理の具体的な処理内容を示す。
【0178】
このボリュームコピー処理は、データコピー処理のステップS42で否定結果が得られた場合に開始され、まず、データ重複比較部14が、コピー処理受付部13から転送されてきたコピー処理要求40(
図16)を受領する(S50)。
【0179】
そしてデータ重複比較部14は、受領したコピー処理要求40からコピー元ボリュームハッシュ値リスト42X(
図16)を抽出し(S51)、抽出したコピー元ボリュームハッシュ値リスト42Xからコピー済みフラグが「未」となっている各エントリの情報に基づいて、HyperLogLogなどの所定のアルゴリズムにより、コピー元ボリュームVOLに格納された未コピー状態のデータのバケット値を算出する(S52)。
【0180】
続いて、データ重複比較部14は、統合ハッシュ管理情報データベース18(
図7(B))からコピー先ボリュームVOLのバケット値を読み出し、読み出したバケット値と、ステップS52で算出したバケット値との間のデータの重複度合をHyperLogLogなどの所定のアルゴリズムにより算出する(S53)。
【0181】
次いで、データ重複比較部14は、ステップS53で算出したデータの重複度合に基づいて、コピー元ボリュームVOLに格納されたデータと、コピー先ストレージ装置5に格納されているデータとの間でデータが重複している可能性があるか否かを判断する(S54)。
【0182】
具体的に、データ重複比較部14は、かかる重複度合が予め設定された閾値(以下、これをデータ重複度合閾値と呼ぶ)以上であるか否かを判断する。これは、ステップS53で算出したデータの重複度合がかかるデータ重複度合閾値未満の場合、コピー元ボリュームVOLに格納されたデータと、コピー先ストレージ装置5に格納されているデータとの間でデータの重複がない、又は、あっても少ないと判断できるからである。かくして、データ重複比較部14は、ステップS54の判断で否定結果を得るとステップS59に進む。
【0183】
これに対して、ステップS53で算出したデータの重複度合がデータ重複度合閾値以上であれば、コピー元ボリュームVOLに格納されたデータと、コピー先ストレージ装置5に格納されているデータとの間でデータの重複(以下、重複するデータを重複データと呼ぶ)があると判定できる。かくしてデータ重複比較部14は、ステップS54で肯定結果を得ると、かかる判定結果をコピー方式生成・指示部15に通知すると共に、ステップS50で受領したコピー処理要求40をコピー方式生成・指示部15に引き渡す。またコピー方式生成・指示部15は、引き渡されたコピー処理要求40をコピー先ストレージ装置5に転送する(S55)。
【0184】
この結果、コピー方式生成・指示部15から上述のコピー処理要求40が与えられたコピー先ストレージ装置5において、後述のようにかかる重複データをコピー先ボリュームVOL以外のボリュームVOLからコピー先ボリュームVOL内の対応する論理アドレス(コピー元ボリュームVOLにおけるその重複データが格納されている論理アドレス)にコピーするコピー処理が実行される。なお、このコピー処理は、同一クラウドシステム2内でのコピーとなるため、以下においては、このコピー処理をクラウド内データコピー処理と呼ぶものとする。そして、この後、かかるコピー処理要求40におけるコピー元ボリュームハッシュ値リスト42Xのエントリのうち、コピーが完了したかかる重複データに対応するエントリのコピー済みフラグが「済」に変更されたコピー処理要求40がコピー先のストレージ装置5からコピー方式生成・指示部15に返却される。
【0185】
このときコピー方式生成・指示部15は、コピー先のストレージ装置5からのかかるコピー処理要求40の返却を待ち受けており(S56)、かかるコピー処理要求40が返却されると、コピー元ボリュームVOL内のすべてのデータをコピー先ボリュームVOLにコピーし終えたか否かを判断する(S57)。この判断は、返却されたコピー処理要求40におけるコピー元ボリュームハッシュ値リスト42Xの各エントリのコピー済みフラグ欄42XD(
図16)にそれぞれ格納されたコピー済みフラグがすべて「済」であるか否かを判断することにより行われる。
【0186】
この判断で肯定結果を得ることは、コピー元ボリュームVOLに格納されていたすべてのデータがコピー先のストレージ装置5内に元々存在しており、これらすべてのデータ(重複データ)がコピー先ボリュームVOL内の対応する論理アドレスにそれぞれコピーされたことを意味する。かくして、このときコピー方式生成・指示部15は処理を終了する。この場合、これに伴ってこのボリュームコピー処理も終了する。
【0187】
これに対して、ステップS57の判断で否定結果を得ることは、コピー元ボリュームVOLに格納されていたすべてのデータがコピー先のストレージ装置5内に存在しておらず、コピー元ボリュームVOLからコピー先ボリュームVOLへのコピーが未完了のデータが存在することを意味する。かくして、このときコピー方式生成・指示部15は、コピー先のストレージ装置5から返却されたコピー処理要求40のコピー元ボリュームハッシュ値リスト42Xにおいて、コピー済みフラグが「未」となっている各エントリのハッシュ値欄42XC(
図16)にそれぞれ格納されているハッシュ値をすべて利用して、HyperLogLogなどの所定のアルゴリズムによりバケット値を算出する(S58)。
【0188】
続いて、コピー方式生成・指示部15は、ストレージ管理情報データベース16(
図2及び
図6)を参照して、コピー先のストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元のストレージ装置5と同一の組織が保持又は利用するコピー先のストレージ装置5以外のストレージ装置5(ブロックストレージ装置)をすべて特定し、特定した各ストレージ装置5のバケット値を統合ハッシュ管理情報データベース18(
図2及び
図7(B))からそれぞれ抽出する(S59)。
【0189】
次いで、コピー方式生成・指示部15は、ステップS58で算出したバケット値と、ステップS59で抽出した各バケット値とに基づいて、コピー先のストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元のストレージ装置5と同一の組織が保持又は利用するコピー先のストレージ装置5以外のブロックストレージ装置(ストレージ装置5)ごとに、そのストレージ装置5内のデータと、未だコピー先ボリュームVOLにコピーされていないデータとの間のデータの重複度合をHyperLogLogなどの所定のアルゴリズムによりそれぞれ算出する(S60)。
【0190】
次いで、データ重複比較部14は、ステップS60で算出したデータの重複度合に基づいて、コピー先のストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元のストレージ装置5と同一の組織が保持又は利用するコピー先のストレージ装置5以外のいずれかのストレージ装置5(ブロックストレージ装置)内のデータと、未だコピー先ボリュームVOLにコピーされていないデータとの間でデータが重複している可能性があるか否かを判断する(S61)。
【0191】
具体的に、データ重複比較部14は、かかるデータの重複度合が上述のデータ重複度合閾値以上であるか否かを判断する。これは、ステップS60で算出したデータの重複度合がデータ重複度合閾値未満の場合、コピー先のストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元のストレージ装置5と同一の組織が保持又は利用するコピー先のストレージ装置5以外の各ストレージ装置5(ブロックストレージ装置)内のデータと、未だコピー先ボリュームVOLにコピーされていないデータとの間でデータの重複がない、又は、あっても少ないと判断できるからである。かくして、データ重複比較部14は、ステップS61の判断で否定結果を得るとステップS65に進む。
【0192】
これに対して、ステップS60で算出したデータの重複度合がデータ重複度合閾値以上のストレージ装置5があれば、そのストレージ装置5内のデータと、未だコピー先ボリュームVOLにコピーされていないデータとの間で重複がある(重複データがある)と判断できる。
【0193】
かくしてデータ重複比較部14は、ステップS61の判断で肯定結果を得ると、かかる判断結果をコピー方式生成・指示部15に通知すると共に、ステップS56でコピー先のストレージ装置5から返却されてきたコピー処理要求40をコピー方式生成・指示部15に引き渡す。またコピー方式生成・指示部15は、引き渡されたコピー処理要求40を、ステップS61でデータの重複の可能性があると判断されたすべてのストレージ装置5にそれぞれ転送する(S62)。
【0194】
この結果、コピー方式生成・指示部15から上述のコピー処理要求40が与えられた各ストレージ装置5において、後述のようにかかる重複データをコピー先ボリュームVOL内の対応する論理アドレス(コピー元ボリュームVOLにおけるその重複データが格納されている論理アドレス)にコピーするコピー処理が実行される。なお、このコピー処理の内容は、上述の同一クラウド間データコピー処理と同じである。そして、この後、かかるコピー処理要求40におけるコピー元ボリュームハッシュ値リスト42Xのエントリのうち、コピーが完了したかかる重複データに対応するエントリのコピー済みフラグが「済」に変更されたコピー処理要求40がコピー方式生成・指示部15に返却される。
【0195】
このときコピー方式生成・指示部15は、該当する各ストレージ装置5からのかかるコピー処理要求40の返却を待ち受けており(S63)、すべてのストレージ装置5からかかるコピー処理要求40が返却されると、コピー元ボリュームVOL内のすべてのデータをコピー先ボリュームVOLにコピーし終えたか否かを判断する(S64)。この判断は、返却された各コピー処理要求40のコピー元ボリュームハッシュ値リスト42Xをマージし、マージしたコピー元ボリュームハッシュ値リスト42Xの各エントリのコピー済みフラグ欄42XDにそれぞれ格納されたコピー済みフラグがすべて「済」であるか否かを判断することにより行われる。
【0196】
この判断で肯定結果を得ることは、コピー元ボリュームVOLに格納されていたすべてのデータがコピー先ボリュームVOLにそれぞれコピーされ終えたことを意味する。かくして、このときコピー方式生成・指示部15は、処理を終了する。また、これに伴ってこのボリュームコピー処理も終了する。
【0197】
これに対して、ステップS64の判断で否定結果を得ることは、コピー元ボリュームVOLに格納されていたすべてのデータが未だコピー先ボリュームVOLにコピーされ終えていないことを意味する。かくして、このときコピー方式生成・指示部15は、上述のようにして生成したマージ後のコピー元ボリュームハッシュ値リスト42Xを有するコピー処理要求40をコピー元のストレージ装置5に転送する(S65)。
【0198】
この結果、コピー方式生成・指示部15から上述のコピー処理要求40が与えられたコピー元のストレージ装置5により、コピー元ボリュームVOLに格納されているデータのうちの未だコピー先ボリュームVOLにコピーされていないデータをコピー先ボリュームVOLにコピーするコピー処理が実行される。なお、このコピー処理は、コピー元のストレージ装置5を有するクラウドシステム2と、コピー先のストレージ装置5を有するクラウドシステム2との間でのデータコピーである。このため以下においては、このコピー処理をクラウド間データコピー処理と呼ぶものとする。そして、この後、かかるコピー処理要求40におけるコピー元ボリュームハッシュ値リスト42Xのエントリのうち、コピーが完了したデータに対応するエントリのコピー済みフラグが「済」に変更されたコピー処理要求40がコピー元のストレージ装置5からコピー方式生成・指示部15に返却される。
【0199】
このときコピー方式生成・指示部15は、コピー元のストレージ装置5からのかかるコピー処理要求40の返却を待ち受けており(S66)、当該ストレージ装置5からかかるコピー処理要求40が返却されると処理を終了する。以上により、このボリュームコピー処理も終了する。
【0200】
(4-2-2-2)クラウド内データコピー処理
図20は、ボリュームコピー処理のステップS55やステップS62で運用管理装置3のコピー方式生成・指示部15から転送されたコピー処理要求40を受信したストレージ装置5の管理エージェント8により実行されるクラウド内データコピー処理の具体的な処理内容を示す。
【0201】
管理エージェント8は、自ストレージ装置5がかかるコピー処理要求40を受信するとこの
図20に示すクラウド内データコピー処理を開始し、まず、受信したコピー処理要求からコピー元ボリュームハッシュ値リスト42X(
図16)を抽出し、抽出したコピー元ボリュームハッシュ値リスト42Xからコピー済みフラグが「未」となっているすべてのエントリのハッシュ値を掲載した図示しないハッシュ値リストを生成する(S70)。
【0202】
続いて、管理エージェント8は、ステップS70で生成したハッシュ値リストに掲載されたハッシュ値からステップS72以降が未処理の1つのハッシュ値を選択する(S71)。また管理エージェント8は、自己が管理するハッシュ管理情報テーブル11(
図2及び
図13)の各エントリの中から、ハッシュ値欄11A(
図13)に格納されたハッシュ値が、ステップS71で選択したハッシュ値(以下、これを
図20の説明において選択ハッシュ値と呼ぶ)と一致するエントリを特定する(S72)。
【0203】
次いで、管理エージェント8は、ステップS72において該当するエントリを特定でき、これにより選択ハッシュ値に対応するチャンクデータ列を特定できたか否かを判断する(S73)。そして管理エージェント8は、ステップS73の判断で否定結果を得るとステップS75に進む。
【0204】
これに対して、管理エージェント8は、ステップS73の判断で肯定結果を得ると、選択ハッシュ値に対応するチャンクデータ列をコピー先のストレージ装置5に送信することにより、当該チャンクデータ列をコピー先ボリュームVOLにコピーさせる。また管理エージェント8は、そのとき受信していたコピー処理要求40のコピー元ボリュームハッシュ値リスト42Xにおける選択ハッシュ値に対応するエントリのコピー済みフラグ欄42XD(
図16)に格納されたコピー済みフラグを「未」から「済」に更新する(S74)。
【0205】
さらに管理エージェント8は、ステップS70で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS72~ステップS74の処理を実行し終えたか否かを判断する(S75)。そして管理エージェント8は、この判断で否定結果を得るとステップS71に戻り、この後、ステップS71で選択するハッシュ値をステップS72以降が未処理の他のハッシュ値に順次切り替えながらステップS71~ステップS75の処理を繰り返す。
【0206】
そして管理エージェント8は、やがてステップS70で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS72~ステップS74の処理を実行し終えることによりステップS75で肯定結果を得ると、かかるコピー処理要求40を運用管理装置3のコピー方式生成・指示部15に返却し(S76)、この後、このクラウド内データコピー処理を終了する。
【0207】
(4-2-2-3)クラウド間データコピー処理
図21は、
図19について上述したボリュームコピー処理のステップS65で運用管理装置3から送信されたコピー処理要求40を受信したコピー元のストレージ装置5の管理エージェント8により実行されるクラウド間データコピー処理の具体的な処理内容を示す。
【0208】
管理エージェント8は、自ストレージ装置(コピー元のストレージ装置)5がかかるコピー処理要求40を受信するとこの
図21に示すクラウド間データコピー処理を開始し、まず、受信したコピー処理要求40からコピー元ボリュームハッシュ値リスト42X(
図16)を抽出し、抽出したコピー元ボリュームハッシュ値リスト42Xからコピー済みフラグが「未」となっているすべてのエントリのハッシュ値を掲載した図示しないハッシュ値リストを生成する(S80)。
【0209】
続いて、管理エージェント8は、ステップS80で生成したハッシュ値リスト42Xに掲載されたハッシュ値からステップS82以降が未処理の1つのハッシュ値を選択する(S81)。また管理エージェント8は、自己が管理するハッシュ管理情報テーブル11(
図2及び
図13)の各エントリの中から、ハッシュ値欄11A(
図13)に格納されたハッシュ値が、ステップS81で選択したハッシュ値(以下、これを
図21の説明において選択ハッシュ値と呼ぶ)と一致するエントリを特定する(S82)。
【0210】
次いで、管理エージェント8は、ステップS82で特定したエントリに対応するチャンクデータ列を対応するボリュームVOLから読み出してコピー先ボリュームVOLを有するストレージ装置5に送信することにより、当該チャンクデータ列をコピー先ボリュームVOL内の対応する論理アドレスにコピーさせる。また管理エージェント8は、そのとき受信していたコピー処理要求40のコピー元ボリュームハッシュ値リスト42Xにおける選択ハッシュ値に対応するエントリのコピー済みフラグ欄42DXに格納されたフラグを「未」から「済」に更新する(S83)。
【0211】
さらに管理エージェント8は、ステップS80で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS82~ステップS83の処理を実行し終えたか否かを判断する(S84)。そして管理エージェント8は、この判断で否定結果を得るとステップS81に戻り、この後、ステップS81で選択するハッシュ値をステップS82以降が未処理の他のハッシュ値に順次切り替えながらステップS81~ステップS84の処理を繰り返す。
【0212】
そして管理エージェント8は、やがてステップS80で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS82~ステップS83の処理を実行し終えることによりステップS84で肯定結果を得ると、かかるコピー処理要求40を運用管理装置3のコピー方式生成・指示部15に返却し(S85)、この後、このクラウド間データコピー処理を終了する。
【0213】
(4-2-3)ファイルコピー処理
(4-2-3-1)ファイルコピー処理の具体的な処理内容
一方、
図22は、
図18について上述したデータコピー処理のステップS45でデータ重複比較部14及びコピー方式生成・指示部15により実行されるファイルコピー処理の具体的な処理内容を示す。
【0214】
このボリュームコピー処理は、データコピー処理のステップS42で肯定結果が得られた場合に開始され、まず、データ重複比較部14が、コピー処理受付部13から転送されてきたコピー処理要求40(
図16)を受領する(S90)。
【0215】
そしてデータ重複比較部14は、受領したコピー処理要求40からコピー対象ファイルリスト43X(
図16)を抽出し(S91)、抽出したコピー対象ファイルリスト43Xからコピー済みフラグが「未」となっている各エントリの情報に基づいて、HyperLogLogなどの所定のアルゴリズムにより、コピー対象のファイル及び又はオブジェクト(以下、適宜、ファイル及びオブジェクトを纏めてファイル等と呼ぶ)全体のバケット値を算出する(S92)。
【0216】
続いて、データ重複比較部14は、統合ファイルハッシュ管理情報データベース23(
図3及び
図18(B))からコピー先ストレージ装置5のバケット値を読み出し、読み出したバケット値と、ステップS92で算出したバケット値に基づいてコピー対象のファイル等との間のファイル等の重複度合をHyperLogLogなどの所定のアルゴリズムにより算出する(S93)。
【0217】
次いで、データ重複比較部14は、ステップS93で算出したファイル等の重複度合に基づいて、コピー対象のファイル等と、コピー先ストレージ装置5に格納されている各ファイル等の一部とが重複している可能性(コピー先ストレージ装置5内に既にコピー対象のファイル等が格納されている可能性)があるか否かを判断する(S94)。
【0218】
具体的に、データ重複比較部14は、かかるファイル等の重複度合が予め設定された閾値(以下、これをファイル等重複度合閾値と呼ぶ)未満であるか否かを判断する。これは、ステップS93で算出した重複度合がかかるファイル等重複度合閾値未満の場合、コピー元ストレージ装置5に格納されたコピー対象のファイル等と、コピー先ストレージ装置5に格納されているファイル等との間でファイル等の重複がない、又は、あっても少ないと判断できるからである。かくして、データ重複比較部14は、ステップS94の判断で否定結果を得るとステップS99に進む。
【0219】
これに対して、ステップS93で算出したファイル等の重複度合がファイル等重複度合閾値以上であれば、コピー対象のファイル等と、コピー先ストレージ装置5に格納されているファイル等との間でファイル等の重複があると判断できる。かくして、コピー方式生成・指示部がコピー先は、ステップS94の判断で肯定結果を得ると、コピー対象の各ファイル等のハッシュ値を管理情報送受信・格納部12を介してコピー元ストレージ装置5から取得し、取得したハッシュ値を、同一性チェック指示と共にコピー先ストレージ装置5に送信する(S95)。
【0220】
かくして、この同一性チェック指示を受信したコピー先ストレージ装置5の管理エージェント20(
図3)は、かかる同一性チェック指示と共に与えられたコピー対象の各ファイル等のハッシュ値と、自己が管理するファイルハッシュ管理情報テーブル22(
図3及び
図15)に格納されている自ストレージ装置5内に存在する各ファイル等のハッシュ値とを比較する。そして、かかる管理エージェント20は、ハッシュ値が一致するファイル等が存在しない場合には、その旨の回答を運用管理装置3のコピー方式生成・指示部15に送信し、ハッシュ値が一致するファイル等が存在する場合には、そのファイル等を特定するためのファイル名等の識別情報を含む回答を運用管理装置3のコピー方式生成・指示部15に送信する。
【0221】
このときコピー方式生成・指示部15は、コピー先ストレージ装置5からの回答を待ち受けており、かかる回答を受信すると、その回答の内容に基づいて、同一性を有する少なくとも1つのファイル等がコピー先ストレージ装置5に既に格納されているか否かを判断する(S96)。
【0222】
そしてコピー方式生成・指示部15は、この判断で否定結果を得るとステップS99に進み、これに対して肯定結果を得ると、ステップS90で受領したコピー処理要求40のコピー対象ファイルリスト43Xにおける、かかる回答にその識別情報が含まれるコピー対象のファイル等(つまり既にコピー先ストレージ装置5に格納されているコピー対象のファイル等)に対応するエントリのコピー済みフラグ欄43XD(
図16)に格納されているコピー済みフラグを「済」に更新する(S97)。
【0223】
続いて、コピー方式生成・指示部15は、コピー対象のファイル等をすべてコピー先ストレージ装置5にコピーし終えたか否かを判断する(S98)。この判断は、ステップS98で更新した後のコピー処理要求40におけるコピー対象ファイルリスト43Xの各エントリのコピー済みフラグ欄43XD(
図16)にそれぞれ格納されたコピー済みフラグがすべて「済」であるか否かを判断することにより行われる。
【0224】
この判断で肯定結果を得ることは、コピー対象のファイル等が元々コピー先ストレージ装置5にすべて存在していたことを意味する。かくして、このときコピー方式生成・指示部15は、処理を終了する。そして、この場合、これに伴ってこのボリュームコピー処理も終了する。
【0225】
これに対して、ステップS98の判断で否定結果を得ることは、コピー対象のすべてのファイル等がコピー先ストレージ装置5内に存在しておらず、コピー元ストレージ装置5からコピー先ストレージ装置5へのコピーが未完了のファイル等が存在することを意味する。
【0226】
かくして、このときコピー方式生成・指示部15は、ストレージ管理情報データベース16(
図3及び
図6)を参照して、コピー先ストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元ストレージ装置5と同一の組織が保持又は利用するコピー先トレージ装置5以外のストレージ装置5(ファイル・オブジェクトストレージ装置)をすべて特定し(S99)、特定した各ストレージ装置5のバケット値を統合ハッシュ管理情報データベース18(
図2及び
図8(B))からそれぞれ抽出する(S100)。
【0227】
次いで、コピー方式生成・指示部15は、ステップS92で算出したバケット値と、ステップS100で抽出した各ストレージ装置5のバケット値とに基づいて、コピー先ストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元ストレージ装置5と同一の組織が保持又は利用するコピー先ストレージ装置5以外のストレージ装置5(ファイル・オブジェクトストレージ装置)ごとに、そのストレージ装置5に格納されているファイル等と、コピー対象のファイル等との間のファイル等の重複度合をHyperLogLogなどの所定のアルゴリズムによりそれぞれ算出する(S101)。
【0228】
次いで、データ重複比較部14は、ステップS101で算出したファイル等の重複度合に基づいて、コピー先ストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元ストレージ装置5と同一の組織が保持又は利用するコピー先ストレージ装置5以外のいずれかのストレージ装置5(ファイル・オブジェクトストレージ装置)に格納されているファイル等と、コピー対象のファイル等とが重複している可能性があるか否かを判断する(S102)。
【0229】
具体的に、データ重複比較部14は、かかるファイル等の重複度合が上述のファイル重複度合閾値以上であるか否かを判断する。これは、ステップS101で算出したファイル等の重複度合がファイル重複度合閾値未満の場合、コピー先ストレージ装置5と同一のクラウドシステム2上で稼動し、かつコピー元のストレージ装置5と同一の組織が保持又は利用するコピー先のストレージ装置5以外の各ストレージ装置5(ファイル・オブジェクトストレージ装置)に格納されているファイル等と、コピー対象のファイル等との間で重複がない、又は、あっても少ないと判断できるからである。かくして、データ重複比較部14は、ステップS102の判断で否定結果を得るとステップS106に進む。
【0230】
これに対して、ステップS101で算出したファイル等の重複度合がファイル重複度合閾値以上のストレージ装置5があれば、そのストレージ装置5に格納されたファイル等とコピー対象のファイル等との間で重複がある(重複するファイル等がある)と判断できる。
【0231】
かくしてデータ重複比較部14は、ステップS102の判断で肯定結果を得ると、かかる判断結果をコピー方式生成・指示部15に通知すると共に、ステップS90で受領し又はステップS97でコピー対象ファイルリスト43Xを更新したコピー処理要求40をコピー方式生成・指示部15に引き渡す。またコピー方式生成・指示部15は、引き渡されたコピー処理要求40を、ステップS102でファイル等の重複の可能性があると判断されたすべてのストレージ装置5にそれぞれ転送する(S103)。
【0232】
この結果、コピー方式生成・指示部15から上述のコピー処理要求40が与えられた各ストレージ装置5において、後述のようにかかる重複するファイル等をコピー先ストレージ装置5にコピーするコピー処理が実行される。そして、この後、かかるコピー処理要求40におけるコピー対象ファイルリスト43Xのエントリのうち、コピーが完了したかかる重複するファイル等に対応するエントリのコピー済みフラグが「済」に変更されたコピー処理要求40がコピー方式生成・指示部15に返却される。
【0233】
このときコピー方式生成・指示部15は、該当する各ストレージ装置5からのかかるコピー処理要求40の返却を待ち受けており(S104)、すべてのストレージ装置5からかかるコピー処理要求40が返却されると、コピー対象のすべてのファイル等をコピー先ストレージ装置5にコピーし終えたか否かを判断する(S105)。この判断は、返却された各コピー処理要求40のコピー対象ファイルリスト43Xをマージし、マージしたコピー対象ファイルリスト43Xの各エントリのコピー済みフラグ欄43XDにそれぞれ格納されたコピー済みフラグがすべて「済」であるか否かを判断することにより行われる。
【0234】
この判断で肯定結果を得ることは、コピー対象のすべてのファイル等がコピー先ストレージ装置5にそれぞれコピーされ終えたことを意味する。かくして、このときコピー方式生成・指示部15は処理を終了する。そして、これに伴ってこのファイルコピー処理も終了する。
【0235】
これに対して、ステップS105の判断で否定結果を得ることは、すべてのコピー対象のファイル等が未だコピー先ストレージ装置5にコピーされ終えていないことを意味する。かくして、このときコピー方式生成・指示部15は、上述のようにして生成したマージ後のコピー対象ファイルリスト43Xを有するコピー処理要求40をコピー元ストレージ装置5に転送する(S106)。
【0236】
この結果、コピー方式生成・指示部15から上述のコピー処理要求40が与えられたコピー元ストレージ装置5により、コピー対象のファイル等のうちの未だコピー先ストレージ装置5にコピーされていないファイル等をコピー先ストレージ装置5にコピーするコピー処理が実行される。なお、このコピー処理は、コピー元ストレージ装置5を有するクラウドシステム2と、コピー先ストレージ装置5を有するクラウドシステム2との間でのファイルコピーである。このため以下においては、このコピー処理をクラウド間ファイルコピー処理と呼ぶものとする。そして、この後、かかるコピー処理要求40におけるコピー対象ファイルリスト43Xのエントリのうち、コピーが完了したファイル等に対応するエントリのコピー済みフラグが「済」に変更されたコピー処理要求40がコピー元ストレージ装置5からコピー方式生成・指示部15に返却される。
【0237】
このときコピー方式生成・指示部15は、コピー元ストレージ装置5からかかるコピー処理要求40が返却される待ち受けており(S107)、コピー元ストレージ装置5からかかるコピー処理要求40が返却されると処理を終了する。以上により、このファイルコピー処理も終了する。
【0238】
(4-2-3-2)クラウド間ファイルコピー処理
図23は、ファイルコピー処理のステップS103で運用管理装置3のコピー方式生成・指示部15から転送されたコピー処理要求40を受信したストレージ装置5の管理エージェント20(
図3)により実行されるクラウド間ファイルコピー処理の具体的な処理内容を示す。
【0239】
管理エージェント20は、自ストレージ装置5がかかるコピー処理要求40を受信するとこの
図23に示すクラウド間ファイルコピー処理を開始し、まず、受信したコピー処理要求40からコピー対象ファイルリスト43Xを抽出し、抽出したコピー対象ファイルリスト43Xからコピー済みフラグが「未」となっているすべてのエントリのハッシュ値を掲載した図示しないハッシュ値リストを生成する(S110)。
【0240】
続いて、管理エージェント20は、ステップS110で生成したハッシュ値リストに掲載されたハッシュ値からステップS112以降が未処理の1つのハッシュ値を選択する(S111)。また管理エージェント20は、自己が管理するファイルハッシュ管理情報テーブル22(
図3及び
図15)の各エントリの中から、ハッシュ値欄22A(
図15)に格納されたハッシュ値が、ステップS111で選択したハッシュ値(以下、これを
図23の説明において選択ハッシュ値と呼ぶ)と一致するエントリを特定する(S112)。
【0241】
次いで、管理エージェント20は、ステップS112においてエントリを特定できたか否かを判断する(S113)。このステップS113で否定結果を得ることは、選択ハッシュ値に対応するファイル等がその管理エージェント20が搭載されたストレージ装置5には格納されていないことを意味する。かくして、このとき管理エージェント20は、ステップS115に進む。
【0242】
これに対して、ステップS113で肯定結果を得ることは、選択ハッシュ値に対応するファイル等がその管理エージェント20が搭載されたストレージ装置5に格納されていることを意味する。かくして、このとき管理エージェント20は、選択ハッシュ値に対応するファイル等をコピー先ストレージ装置5に送信することにより、そのファイル等をコピー先ストレージ装置5内にコピーさせる。また管理エージェント20は、そのとき受信していたコピー処理要求40のコピー対象ファイルリスト43Xにおける選択ハッシュ値に対応するエントリのコピー済みフラグ欄43DX(
図16)に格納されたコピー済みフラグを「未」から「済」に更新する(S114)。
【0243】
さらに管理エージェント20は、ステップS110で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS112~ステップS114の処理を実行し終えたか否かを判断する(S115)。そして管理エージェント20は、この判断で否定結果を得るとステップS111に戻り、この後、ステップS111で選択するハッシュ値をステップS112以降が未処理の他のハッシュ値に順次切り替えながらステップS111~ステップS115の処理を繰り返す。
【0244】
そして管理エージェント20は、やがてステップS110で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS112~ステップS114の処理を実行し終えることによりステップS115で肯定結果を得ると、かかるコピー処理要求40を運用管理装置3のコピー方式生成・指示部15に返却し(S116)、この後、このクラウド間データコピー処理を終了する。
【0245】
(4-2-3-3)クラウド内ファイルコピー処理
図24は、
図22について上述したファイルコピー処理のステップ106Sで運用管理装置3のコピー方式生成・指示部15が送信したコピー処理要求40を受信したコピー先ストレージ装置5の管理エージェント20により実行されるクラウド内ファイルコピー処理の具体的な処理内容を示す。
【0246】
かかる管理エージェント20は、自ストレージ装置(コピー先ストレージ装置)5がかかるコピー処理要求40を受信するとこの
図24に示すクラウド内ファイルコピー処理を開始し、まず、受信したコピー処理要求40からコピー対象ファイルリスト43Xを抽出し、抽出したコピー対象ファイルリスト43Xからコピー済みフラグが「未」となっているすべてのエントリのハッシュ値を掲載した図示しないハッシュ値リストを生成する(S120)。
【0247】
続いて、管理エージェント20は、ステップS120で生成したハッシュ値リストに掲載されたハッシュ値からステップS122以降が未処理の1つのハッシュ値を選択する(S121)。また管理エージェント20は、自己が管理するファイルハッシュ管理情報テーブル22(
図3及び
図15)の各エントリの中から、ハッシュ値欄22A(
図15)に格納されたハッシュ値が、ステップS121で選択したハッシュ値(以下、これを
図24の説明において選択ハッシュ値と呼ぶ)と一致するエントリを特定する(S122)。
【0248】
次いで、管理エージェント20は、ステップS122で特定したエントリに対応するファイル等をコピー先ストレージ装置5に送信することにより、そのファイル等をコピー先ストレージ装置5内にコピーさせる。また管理エージェント20は、そのとき受信していたコピー処理要求40のコピー対象ファイルリスト43Xにおける選択ハッシュ値に対応するエントリのコピー済みフラグ欄43DX(
図16)に格納されたコピー済みフラグを「未」から「済」に更新する(S123)。
【0249】
さらに管理エージェント20は、ステップS120で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS122~ステップS123の処理を実行し終えたか否かを判断する(S124)。そして管理エージェント20は、この判断で否定結果を得るとステップS121に戻り、この後、ステップS121で選択するハッシュ値をステップS122以降が未処理の他のハッシュ値に順次切り替えながらステップS121~ステップS124の処理を繰り返す。
【0250】
そして管理エージェント20は、やがてステップS120で生成したハッシュ値リストに掲載されたすべてのハッシュ値についてステップS122~ステップS123の処理を実行し終えることによりステップS124で肯定結果を得ると、かかるコピー処理要求40を運用管理装置3のコピー方式生成・指示部15に返却し(S125)、この後、このクラウド間ファイルコピー処理を終了する。
【0251】
(5)本実施の形態の効果
以上のように本実施の形態の情報処理システム1では、運用管理装置3のコピー方式生成・指示部15が、コピー先ストレージ装置5が属するクラウドシステム2内のデータのうち、コピー対象のデータ(ボリュームデータ、ファイル及び又はオブジェクトのデータ)と重複するとデータ重複比較部14が判定したデータをコピー先ストレージ装置5にコピーするよう当該データが格納されたストレージ装置5に指示した後に、残りのデータのコピー先ストレージ装置5へのコピーをコピー元ストレージ装置5に指示する。
【0252】
従って、本情報処理システム1によれば、コピー元ストレージ装置及びコピー先ストレージ装置がそれぞれ異なるクラウドシステムに属する場合に、コピー元ストレージ装置からコピー先ストレージ装置に対して行うクラウド間コピー処理時のデータ移動量(データ転送量)を削減することができ、その分、データコピーに要するコストを削減することができる。
【0253】
(6)他の実施の形態
なお上述の実施の形態においては、各ストレージ装置5から、当該ストレージ装置5に格納されたデータと、他のストレージ装置5に格納されたデータとの重複の有無を判定するための所定情報(ハッシュ値又はバケット値)をそれぞれ収集する情報収集部としての管理情報送受信・格納部12と、コピー元のストレージ装置5から他のクラウドシステム2内のストレージ装置5へのコピー処理要求を受け付けるコピー処理受付部13と、管理情報送受信・格納部12により収集された所定情報に基づいて、コピー処理要求において指定されたコピー対象のデータと、コピー先のストレージ装置5が属するクラウドシステム2内の各データとの重複を判定するデータ重複比較部14と、データ重複比較部14の判定結果に基づいて、データのコピー方式を生成し、生成したコピー方式に従って、必要なストレージ装置5にコピー先のストレージ装置5へのコピー対象のデータのコピーを指示するコピー方式生成・指示部15とを1つの運用管理装置3に搭載するようにした場合について述べたが、本発明はこれに限らず、これら管理情報送受信・格納部12等を、分散コンピューティングシステムを構成する複数のコンピュータ装置に分散して配置するようにしてもよい。
【0254】
また上述の実施の形態においては、ブロックストレージ装置間のコピー処理を制御するコピー制御機能と、ファイル・オブジェクトストレージ装置間のコピー処理を制御するコピー制御機能との双方のコピー制御機能を運用管理装置3が備える場合について述べたが、本発明はこれに限らず、管理対象のストレージ装置5のストレージタイプに応じて、これらコピー制御機能のうちのいずれか一方のコピー制御機能のみを運用管理装置3が備えるようにしてもよい。
【0255】
さらに上述の実施の形態においては、情報処理システム1内のストレージ装置5の運用を管理する運用管理装置3にかかるコピー制御機能を搭載するようにした場合について述べたが、本発明はこれに限らず、情報処理システム1内のストレージ装置5の運用を管理する運用管理装置とは別個にかかるコピー制御機能を有するコピー制御装置を設けるようにしてもよい。
【0256】
さらに上述の実施の形態においては、各ストレージ装置5の管理エージェント8,20が運用管理装置3に送信するハッシュ管理情報がバケット値である場合について述べたが、本発明はこれに限らず、チャンクデータ列ごとや、ファイル及び又はオブジェクトごとのハッシュ値であってもよい。この場合における運用管理装置3における処理内容は、例えば
図17のステップS24、
図19のステップS52及び
図22のステップS92を省略し、かつバケット値同士の比較でなくハッシュ値同士の比較となる点を除いて上述の実施形態と同様である。
【0257】
さらに上述の実施の形態においては、運用管理装置3が各ストレージ装置5に対するコピー指示(コピー処理要求40)を対応するストレージ装置5に直接送信するようにした場合について述べたが、本発明はこれに限らず、ストレージ装置5に直接送信できない場合においても本発明を適用することができる。具体的には、クラウドシステム2によっては、クラウドシステム2内のストレージ装置5への指示をクラウドシステム2全体を管理する管理装置が受領し、その後、管理装置から対応するストレージ装置5にかかる指示を転送する場合もあるため、このような場合には、運用管理装置3がかかるコピー処理要求40等をその管理装置に送信するようにすればよい。
【産業上の利用可能性】
【0258】
本発明のコピー制御装置及び方法は、1又は複数のストレージ装置を有する複数のクラウドシステムを備える種々の構成の情報処理システムに適用することができる。
【符号の説明】
【0259】
1……情報処理システム、2,2A,2B……クラウドシステム、3……運用管理装置、5,5A~5D……ストレージ装置、7……システム管理者、8,20……管理エージェント、10,21……データ監視部、11……ハッシュ管理情報テーブル、12……管理情報送受信・格納部、13……コピー処理受付部、14……データ重複比較部、15……コピー方式生成・指示部、16……ストレージ管理情報データベース、17……ストレージ稼動情報データベース、18……統合ハッシュ管理情報データベース、22……ファイルハッシュ管理情報テーブル、23……統合ファイルハッシュ管理情報データベース、30……運用管理システム管理情報データベース群、31……組織情報データベース、32A,32B……ストレージ固有管理情報テーブル群、40……コピー処理要求、41……基本情報領域、42X……コピー元ボリュームハッシュ値リスト、43X……コピー対象ファイルリスト、VOL,VOL1~VOL8……ボリューム。