特許第5685169号(P5685169)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヒタチ データ システムズ コーポレーションの特許一覧

特許5685169独立ノード冗長アレイに対するポリシーに基づく管理
<>
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000002
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000003
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000004
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000005
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000006
  • 特許5685169-独立ノード冗長アレイに対するポリシーに基づく管理 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5685169
(24)【登録日】2015年1月23日
(45)【発行日】2015年3月18日
(54)【発明の名称】独立ノード冗長アレイに対するポリシーに基づく管理
(51)【国際特許分類】
   G06F 12/00 20060101AFI20150226BHJP
   G06F 11/20 20060101ALI20150226BHJP
【FI】
   G06F12/00 545B
   G06F11/20 310C
   G06F11/20 310F
【請求項の数】26
【全頁数】23
(21)【出願番号】特願2011-203548(P2011-203548)
(22)【出願日】2011年9月16日
(62)【分割の表示】特願2006-538214(P2006-538214)の分割
【原出願日】2004年10月27日
(65)【公開番号】特開2012-27933(P2012-27933A)
(43)【公開日】2012年2月9日
【審査請求日】2011年10月14日
(31)【優先権主張番号】60/514,766
(32)【優先日】2003年10月27日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】510071448
【氏名又は名称】ヒタチ データ システムズ コーポレーション
【氏名又は名称原語表記】HITACHI DATA SYSTEMS CORPORATION
(74)【代理人】
【識別番号】110000279
【氏名又は名称】特許業務法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】ロドリゲス,アンドレス
(72)【発明者】
【氏名】オレンステイン,ジャック,エイ
(72)【発明者】
【氏名】ショウ,デイビッド,エム
(72)【発明者】
【氏名】バーナード,ベンジャミン,ケイ,ディー
【審査官】 加内 慎也
(56)【参考文献】
【文献】 特開平09−305470(JP,A)
【文献】 特開2003−296179(JP,A)
【文献】 特開2003−223286(JP,A)
【文献】 特開平04−157541(JP,A)
【文献】 特表2000−501540(JP,A)
【文献】 特開2002−244922(JP,A)
【文献】 特開2002−124927(JP,A)
【文献】 特開2003−006005(JP,A)
【文献】 特開2003−078751(JP,A)
【文献】 Product Description Guide,EMC Centera Content Addressed storage,EMC Corporation,2003年 3月,pp.1-20,URL,http://web.archive.org/web/20030801151222/http://www.emc.com/pdf/products/centera/centera_guide.pdf
【文献】 EMC Centera Compliance Edition,Solution Sheet,EMC Corporation,2003年 3月,pp.1-4,URL,http://web.archive.org/web/20030425101936/http://www.emc.com/pdf/products/centera/Centera_compliance_sol.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06F 12/00
G06F 11/20
(57)【特許請求の範囲】
【請求項1】
クラスタシステムに含まれ、前記クラスタシステム内の複数の他のストレージ装置と接続する、ストレージ装置であって、
複数のコンテンツデータを記憶する記憶手段と、
前記複数のコンテンツデータを、それぞれ、そのコンテンツデータの外部ファイル識別子とデータ保護レベルを含むメタデータに対応付けて管理するメタデータマネージャと、
前記記憶手段に記憶されている複数のコンテンツデータについて、それぞれ、そのコンテンツデータに対応付けられているメタデータを参照し、参照された前記メタデータが含む外部ファイル識別子に対応する1つ以上の内部ファイルであるコンテンツデータコピーを確認し、参照された前記メタデータが含むデータ保護レベルが表す数のコンテンツデータコピーを前記複数の他のストレージ装置が保持するよう制御するポリシーマネージャと、
を有することを特徴とするストレージ装置。
【請求項2】
請求項1に記載のストレージ装置であって、
前記データ保護レベルが、前記クラスタシステムについて設定されており、
前記メタデータマネージャは、前記記憶手段に新たにコンテンツデータが格納される場合、その新たに格納されるコンテンツデータに対応付けるメタデータには、前記クラスタシステムについて設定されているデータ保護レベルを含める、
ことを特徴とするストレージ装置。
【請求項3】
請求項2に記載のストレージ装置であって、
前記クラスタシステムについて設定されているデータ保護レベルが変更された後に前記記憶手段にコンテンツデータが新たに格納される場合、前記メタデータマネージャは、そのコンテンツデータに対応付けるメタデータには、前記クラスタシステムについて設定されている変更後のデータ保護レベルを含める、
ことを特徴とするストレージ装置。
【請求項4】
請求項1乃至3のうちのいずれか1項に記載のストレージ装置であって、
前記ポリシーマネージャが、前記クラスタシステムにおけるいずれかの他のストレージ装置に故障が発生された場合には、前記記憶手段に格納されている複数のコンテンツデータの各々について、そのコンテンツデータのメタデータが含むデータ保護レベルに従う数のコンテンツデータコピーを回復する処理を実行する
ことを特徴とするストレージ装置。
【請求項5】
請求項1乃至4のうちのいずれか1項に記載のストレージ装置であって、
前記データ保護レベルは、コンテンツデータコピーの許容可能障害点数である、
ことを特徴とするストレージ装置。
【請求項6】
請求項1乃至4のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが確認ポリシーを含み、前記確認ポリシーは前記コンテンツデータの変造を防止する処理を規定したポリシーであり、
前記ポリシーマネージャが、前記確認ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記確認ポリシーに従って、前記コンテンツデータがディジタル署名と一致するかどうかを確認する処理を実行し、
当該コンテンツデータについての前記確認する処理が、
外部ファイルとしての当該コンテンツデータについて、最初の書込み時の当該コンテンツデータのハッシュキーと、前記記憶手段における当該コンテンツデータのハッシュキーとを比較する処理と、
内部ファイルとしてのコンテンツデータコピーについて、最初の書込み時の当該コンテンツデータコピーのハッシュキーと、修復時に記憶された当該コンテンツデータコピーのハッシュキーとを比較する処理と
を含む
ことを特徴とするストレージ装置。
【請求項7】
請求項6に記載のストレージ装置であって、
前記確認ポリシーは、前記コンテンツデータの少なくとも一部分を認証するために使用される所定の暗号機能を特定する
ことを特徴とするストレージ装置。
【請求項8】
請求項6に記載のストレージ装置であって、
前記確認ポリシーは、前記コンテンツデータの少なくとも一部分を、周期値に基づき周期的に認証するために使用される所定の暗号機能と、前記周期値とを特定する
ことを特徴とするストレージ装置。
【請求項9】
請求項1乃至8のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが保持ポリシーを含み、前記保持ポリシーは前記コンテンツデータを保持する期間を規定したポリシーであり、
前記ポリシーマネージャが、前記保持ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記保持ポリシーに規定された保持期間を経過した場合に、前記コンテンツデータを消去可能な状態に設定する処理を実行する
ことを特徴とするストレージ装置。
【請求項10】
請求項1乃至9のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータがクラスタバランスポリシーを含み、前記クラスタバランスポリシーは、前記クラスタシステム中の複数の前記他のストレージ装置にコンテンツデータが均等に分散する処理を規定したポリシーであり、
前記ポリシーマネージャが、前記クラスタバランスポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記クラスタバランスポリシーに従って、前記複数の前記他のストレージ装置における容量利用度をモニターし、前記容量利用度のバランスが崩れると、前記容量利用度が均等になるように、前記コンテンツデータの再配置を行う処理を実行する
ことを特徴とするストレージ装置。
【請求項11】
請求項1乃至10のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが不要情報収集ポリシーを含み、前記不要情報収集ポリシーは、不完全な処理により残された前記コンテンツデータを削除する処理を規定したポリシーであり、
前記ポリシーマネージャが、前記不要情報収集ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記不要情報収集ポリシーに従って、消去されるべきデータとしてマーキングされた前記コンテンツデータを消去する処理を実行し、
当該コンテンツデータについて前記消去する処理が、外部ファイルとしての当該コンテンツデータについて内部ファイルとしてのコンテンツデータコピーが全て存在することを確認する処理を含む、
ことを特徴とするストレージ装置。
【請求項12】
請求項1乃至11のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータがスキャベンジングポリシーを含み、前記スキャベンジングポリシーは、前記メタデータの消失を防止する処理を規定したポリシーであり、
前記ポリシーマネージャが、前記スキャベンジングポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記スキャベンジングポリシーに従って、前記メタデータに欠落が発見された場合に、当該コンテンツデータの内部ファイルとしてのコンテンツデータコピー内の前記メタデータから外部ファイルとしてのコンテンツデータを作成することを可能にするべく前記メタデータの修復処理を実行する
ことを特徴とするストレージ装置。
【請求項13】
請求項1乃至12のうちのいずれか1項に記載のストレージ装置であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが重複削除ポリシーを含み、前記重複削除ポリシーは、重複しているコンテンツデータ削除する処理を規定したポリシーであり、
前記ポリシーマネージャが、前記重複削除ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記重複削除ポリシーに従って、重複しているコンテンツデータを確認し、重複しているコンテンツデータが発見された場合に、当該コンテンツデータを削除する処理を実行する
ことを特徴とするストレージ装置。
【請求項14】
クラスタシステムに含まれ、前記クラスタシステム内の複数の他のストレージ装置と接続する、ストレージ装置に適用される記憶制御方法であって、
記憶手段に記憶されておりそれぞれが外部ファイル識別子とデータ保護レベルを含んだメタデータが対応付けられている複数のコンテンツデータについて、それぞれ、
そのコンテンツデータに対応付けられているメタデータを参照し、
参照された前記メタデータが含む外部ファイル識別子に対応する1つ以上の内部ファイルであるコンテンツデータコピーを確認し、
参照された前記メタデータが含むデータ保護レベルが表す数のコンテンツデータコピーを前記複数の他のストレージ装置が保持するよう制御する
ことを特徴とする記憶制御方法。
【請求項15】
請求項14に記載の記憶制御方法であって、
前記データ保護レベルが、前記クラスタシステムについて設定されており、
前記記憶手段に新たにコンテンツデータが格納される場合、その新たに格納されるコンテンツデータに対応付けるメタデータには、前記クラスタシステムについて設定されているデータ保護レベルを含める、
ことを特徴とする記憶制御方法。
【請求項16】
請求項15に記載の記憶制御方法であって、
前記クラスタシステムについて設定されているデータ保護レベルが変更された後に前記記憶手段にコンテンツデータが新たに格納される場合、そのコンテンツデータに対応付けるメタデータには、前記クラスタシステムについて設定されている変更後のデータ保護レベルを含める、
ことを特徴とする記憶制御方法。
【請求項17】
請求項14乃至16のうちのいずれか1項に記載の記憶制御方法であって、
前記クラスタシステムにおけるいずれかの他のストレージ装置に故障が発生された場合には、前記記憶手段に格納されている複数のコンテンツデータの各々について、そのコンテンツデータのメタデータが含むデータ保護レベルに従う数のコンテンツデータコピーを回復する処理を実行する
ことを特徴とする記憶制御方法。
【請求項18】
請求項14乃至17のうちのいずれか1項に記載の記憶制御方法であって、
前記データ保護レベルは、コンテンツデータコピーの許容可能障害点数である、
ことを特徴とする記憶制御方法。
【請求項19】
請求項14乃至18のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが確認ポリシーを含み、前記確認ポリシーは前記コンテンツデータの変造を防止する処理を規定したポリシーであり、
前記確認ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記確認ポリシーに従って、前記コンテンツデータがディジタル署名と一致するかどうかを、所定の頻度で確認する処理を実行し、
当該コンテンツデータについての前記確認する処理が、
外部ファイルとしての当該コンテンツデータについて、最初の書込み時の当該コンテンツデータのハッシュキーと、前記記憶手段における当該コンテンツデータのハッシュキーとを比較する処理と、
内部ファイルとしてのコンテンツデータコピーについて、最初の書込み時の当該コンテンツデータコピーのハッシュキーと、修復時に記憶された当該コンテンツデータコピーのハッシュキーとを比較する処理と
を含む
ことを特徴とする記憶制御方法。
【請求項20】
請求項19に記載の記憶制御方法であって、
前記確認ポリシーは、前記データオブジェクトの前記コンテンツデータの少なくとも一部分を認証するために使用される所定の暗号機能を特定する
ことを特徴とする記憶制御方法。
【請求項21】
請求項19に記載の記憶制御方法であって、
前記確認ポリシーは、前記データオブジェクトの前記コンテンツの少なくとも一部分を、周期値に基づき周期的に認証するために使用される所定の暗号機能と、前記周期値とを特定する
ことを特徴とする記憶制御方法。
【請求項22】
請求項14乃至21のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが保持ポリシーを含み、前記保持ポリシーは前記コンテンツデータを保持する期間を規定したポリシーであり、
前記保持ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記保持ポリシーに規定された保持期間を経過した場合に、前記コンテンツデータを消去可能な状態に設定する処理を実行する
ことを特徴とする記憶制御方法。
【請求項23】
請求項14乃至22のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータがクラスタバランスポリシーを含み、前記クラスタバランスポリシーは、前記クラスタシステム中の複数の前記他のストレージ装置にコンテンツデータが均等に分散する処理を規定したポリシーであり、
前記クラスタバランスポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記クラスタバランスポリシーに従って、前記複数の前記他のストレージ装置における容量利用度をモニターし、前記容量利用度のバランスが崩れると、前記容量利用度が均等になるように、前記コンテンツデータの再配置を行う処理を実行する
ことを特徴とする記憶制御方法。
【請求項24】
請求項14乃至23のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが不要情報収集ポリシーを含み、前記不要情報収集ポリシーは、不完全な処理により残された前記コンテンツデータを削除する処理を規定したポリシーであり、
前記不要情報収集ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記不要情報収集ポリシーに従って、消去されるべきデータとしてマーキングされた前記コンテンツデータを消去する処理を実行し、
当該コンテンツデータについて前記消去する処理が、外部ファイルとしての当該コンテンツデータについて内部ファイルとしてのコンテンツデータコピーが全て存在することを確認する処理を含む、
ことを特徴とする記憶制御方法。
【請求項25】
請求項14乃至24のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータがスキャベンジングポリシーを含み、前記スキャベンジングポリシーは、前記メタデータの消失を防止する処理を規定したポリシーであり、
前記スキャベンジングポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記スキャベンジングポリシーに従って、前記メタデータに欠落が発見された場合に、当該コンテンツデータの内部ファイルとしてのコンテンツデータコピー内の前記メタデータから外部ファイルとしてのコンテンツデータを作成することを可能にするべく前記メタデータの修復処理を実行する
ことを特徴とする記憶制御方法。
【請求項26】
請求項14乃至25のうちのいずれか1項に記載の記憶制御方法であって、
前記記憶手段に記憶されている少なくとも1つのコンテンツデータのメタデータが重複削除ポリシーを含み、前記重複削除ポリシーは、重複しているコンテンツデータ削除する処理を実行する規定したポリシーであり、
前記重複削除ポリシーを含むメタデータが対応付けられたコンテンツデータについて、所定の頻度で、そのコンテンツデータのメタデータが含む前記重複削除ポリシーに従って、重複しているコンテンツデータを確認し、重複しているコンテンツデータが発見された場合に、当該コンテンツデータを削除する処理を実行する
ことを特徴とする記憶制御方法。
【発明の詳細な説明】
【背景技術】
【0001】
本願は、2003年10月27日付出願第60/514,766号に基づく優先権を主張する。
【技術分野】
【0002】
本発明は、分散型コンピュータネットワークにおける可用性、信頼性及び持続性の高いデータ保存技術に係わる。
【関連技術の説明】
【0003】
従来のテープまたは光メモリに取って代わる、またはこれを補足する、高度の可用性、信頼性及び持続性を備えた「固定コンテンツ」のアーカイバルメモリに対する需要が高まっている。「固定コンテンツ」とは参照またはその他の目的で不変の状態で保管されることが期待されるあらゆるタイプのディジタル情報を意味する。このような固定内容の例としては、特に、電子メール、文献、診断用画像、検査画像、音声記録、フィルム、ビデオなどが挙げられる。従来の独立ノード冗長アレイ(The Redundant Array of Independent
Nodes-“RAIN”)記憶方式は、このような固定コンテンツ情報資産を記憶するための大容量オンライン・アーカイブを作成するための推薦アーキテクチュアとして登場した。必要に応じてクラスタにノードを加えたり除外したりすることによって、RAIN型アーキテクチュアは記憶クラスタを1つまたは2つ以上のノードの故障から隔離することができる。複数のノードにデータを複製することによって、RAIN型のアーカイブはノードの故障または欠損を自動的に補償することができる。通常、RAIN型システムは閉システム内の同一コンポーネントから設計されたハードウェア装置として広く供給される。
【0004】
アーカイブ・インフラストラクチャの技術的陳腐化に対処することはディジタル内容を保存する上で最も重要な問題である。技術の変化が急速であるだけに、テープや光ディスクを読み取る装置として現在普及している装置が今後10年間利用できるかどうかは疑問である。陳腐化は、例えば、ファイルのオリジナル・フォーマット、ファイルを書き込んだアプリケーション、内容が記録された媒体など、種々のレベルにおいて現れる。最新の技術に対応でき、しかも妥当なコストでオンラインアクセスが可能な大規模なアーカイブを構築することは一見したところ不可能であるかに思える。アーカイブは記憶するデータの全ライフサイクルを扱わねばならないから、問題は深刻である。保存期間が極めて長いアーカイブなら、時間の経過とともに大量のデータを蓄積することができる。従って、アーカイブシステムは円滑に、例えば、数テラバイトから数ぺタバイトへ成長可能でなければならず、高度の可用性を提供し、データ損失を回避し、容易に管理できるものでなければならない。
【0005】
従来技術は上記の問題に適切に対処しきれていない。特に、大容量アーカイブシステムの構築にはエラーが付き物であることは周知である。データベース、ネットワークの形成、オペレーティングシステム、保管システム及びウェブサーバーはいずれもそれらを運用するのに豊富なスキルを有する専門家のチームを必要とする。また、記憶システム、データベース、ウェブサーバー及びオペレーティングシステムはいずれも、管理者が性能を最適化することを可能にする厖大な範囲の調整可能なパラメータを有する。さらにまた、大規模インフラストラクチャに深刻な問題が生じた場合、その診断及び解決に数週間を要することがある。アーカイブシステムは継続的に利用可能でなければならないから、管理者は進行中のサービスを中断することなく、故障機器を排除、取替えする能力を備える必要がある。最後に、種々のセキュリティーシステムが存在するにもかかわらず、多くの場合、管理者は如何にしてアーカイブを悪意の攻撃または偶発的な損傷から守るかを自身で判
断しなければならない。
【0006】
本発明は上記及びその他の問題を解決しようとするものである。
【発明の概要】
【0007】
本発明はRAINモデルに基づく低コスト且つ拡大縮小可能な、ディスク使用のアーカイブデータ保存装置を提供する。本発明を利用することにより、企業や組織は固定コンテンツ情報を恒久的に保存することができる。このシステムは厖大なディジタルアーカイブの構築及び維持に伴う煩雑さを軽減するように構成されている。管理者はその日の作業においてポリシーを設定しさえすればよいという意味で、このシステムの自律的な管理を可能にする。豊富なメタデータ管理レイヤーとフレキシブルなポリシープロセッサとによりこのようなポリシーに従った管理が可能になる。ポリシールールを規定することによって、アーカイブ管理者はシステムの動作と、システムによるファイル管理方法を決定する。即ち、ユーザーは例えば、ドメイン毎のポリシーに従いながら、貴重なデータの長期保存に必要なメタデータ抽出、データ暗号化、データ圧縮、データ複製を行うプロセスを確定することができる。
【0008】
1つの実施態様として、本発明は独立ノードの冗長アレイ、好ましくはリナックスOS搭載サーバーとして実現される。但し、それぞれのマシーンが同じハードウェアを有することは必要条件ではない。ノードはアーカイブオブジェクトを管理するネットワークベースのアプリケーションをサポートする。システムは自律的に、即ち、実質的には自己制御し、手動による介入から機能的に独立に管理される。本発明の特徴として、システムは高レベルのポリシーに規定されて自動的に(または概ね自動的に)自己構成する。このことは、新技術が出現しても進化できるシステムにとって自己構成、自己回復及び自己最適化は不可欠であることから、ディジタル資産を長期に亘って管理する上で極めて有益である。
【0009】
本発明では、独立ノードの冗長アレイにわたり分散的にアーカイブクラスタプリケーションが実行される。このアプリケーションにより、アーカイブデータベースを多数のノードにわたって分散させ、複製することができる。図示実施例の場合、それぞれのノードが完全なアーカイブクラスタプリケーションを実行することが好ましい。即ち、それぞれのノードは多量の(例えば、テラバイトの)データを記憶するデータリポジトリを提供するとともに、アーカイブファイルへのアクセスを可能にするポータルとして働く。実行時オペレーション及びデータ(及びメタデータ)の物理的記憶はクラスタのノード間で分散されるから、容量が増大する過程でも高度の信頼性と性能が保証される。1つのノードが故障しても、クラスタが処理を他のノードに振り向けることにより対応するから、アーカイブクラスタプリケーションは常にアーカイブデータを利用することができる。
【0010】
より具体的な特徴として、それぞれのノードは同じソフトウェアプロセスセット、例えば、リクエストマネジャー、ストレージマネジャー、メタデータマネジャー、ポリシーマネジャーなどを有する。従って、アーカイブクラスタプリケーション自体に関して、それぞれのノードは他のノードと対称関係にあると考えることができる。リクエストマネジャーはノードに対するデータ(即ち、ファイルデータ)リクエストを管理し、ストレージマネジャーはこのノードと連携するディスクからのデータ読取り/書込み機能を管理し、メタデータマネジャーは分散するデータベースに亘ってメタデータのトランザクション及び復元を容易にする。ポリシーマネジャーは、「アーカイブオブジェクト」のクラスタ内の動作を決定するオペレーションである1つまたは2つ以上のポリシーを実行する。本発明によると、アーカイブクラスタプリケーションはオブジェクトベースで保存を行う。このアプリケーションはメタデータ及びポリシーを生アーカイブデータと恒久的に連携させて、全体でアーカイブオブジェクトを構成させることが好ましい。オブジェクトポリシーが
アーカイブにおけるオブジェクトの動作を決定する。結果として、アーカイブはクライアントアプリケーションとは関係なく自己管理し、すべてのオブジェクトポリシーが有効となるように自動的に作用する。
【0011】
代表的な実施態様では、アプリケーションが固定コンテンツファイルシステム(FCFS)にソースファイルを書き込むと、自動的に固定コンテンツファイルデータが確定される。一旦ファイルが記憶されたら、変更不能であることが好ましい。また、保持期間が切れるまでは、ファイルが消去不能であることが好ましい。メタデータは著者や作成日のようなアーカイブオブジェクトを同定する情報である。本発明では、メタデータがポリシー設定、例えば、保持期間やファイル保護をも含み、これらはアーカイブオブジェクトのポリシーに関するパラメータとして機能する。ポリシーは所与のポリシーマネジャーによって実行されるオペレーションであり、データがアーカイブに記憶される期間であるデータのライフサイクル中のアーカイブオブジェクトの動作を決定する。ポリシーはオブジェクトのメタデータからそれらのパラメータを得る。それぞれのアーカイブオブジェクトはそれ自体のポリシーをカプセル化しているから、アーカイブについてのそれ自体の動作、例えば、その内容が真正であるかどうか、またはその保持期間が未だ有効であるかどうかはアーカイブオブジェクトにかかっている。
【0012】
本発明の主な特徴の幾つかの概略を以上に述べたが、これらの特徴はあくまでも説明の便宜上のものである。ここに開示する発明を上記とは異なる態様で実施するか、または後述するような変更を加えることによって他の多くの有益な成果を得ることができる。
【図面の簡単な説明】
【0013】
図1図1は本発明の実施例である固定コンテンツストレージアーカイブの簡略化したブロックダイヤグラムである。
図2図2はそれぞれが互いに対称関係にあり、本発明のアーカイブクラスタ(ArC)アプリケーションをサポートする独立ノード冗長アレイの簡略図である。
図3図3は所与のノードにおいて実行されるアーカイブクラスタアプリケーションの種々のコンポーネントの詳細図である。
図4図4は外部アプリケーションからアーカイブへ所与のファイルが入力される態様を示す簡略図である。
図5図5は所与のノードが故障した際にクラスタのバランスを取り戻す態様を示す簡略図である。
図6図6は所与のノードにおける管理コンソールから得られるアーカイブクラスタページの表示内容を示す図である。
【実施例】
【0014】
本発明はディスクを使用する拡大縮小可能なアーカイブデータ保存装置として実施することが好ましく、独立ノードの冗長アレイに基づくシステムアーキテクチュアとして実施することがより好ましい。ノードは異なるハードウェアから成り、従って、「異質」であると見做すことができる。これに反して、それぞれのノードにおいてサポートされるアーカイブクラスタアプリケーション(及び、場合によっては、アプリケーションを実行するOS)は同じである。即ち、それぞれのノードにおける(OSを含む)ソフトウェアスタックは対称的であるのに対して、ハードウェアは異質である。図1に示すように、本発明を利用すれば、企業は多様なタイプの固定コンテンツ情報、例えば、文献、電子メール、衛星画像、診断画像、検査画像、録音記録、ビデオなどを恒久的に保存することができる。上記した幾つかのタイプは説明のための例に過ぎないことはいうまでもない。独立サーバーまたはいわゆる記憶ノードにおいてデータを複製することによって高度の可用性が得られる。それぞれのノードは他のノードと対称関係にあることが好ましい。好ましいくは任意所与のノードがすべての機能を果すことができるため、いずれか1つのノードが故障
してもアーカイブの可用性には殆ど影響しない。
【0015】
代表的な実施態様では、本発明がアーカイブクラスタ(ArC)アプリケーションとも呼称される分散型ソフトウェアアプリケーションとして実現される。このアプリケーションはディジタル資産を捕捉、保存、管理、及び検索する。図2に示す実施例では、個々のアーカイブの物理的境界をここではクラスタと呼称する。通常、クラスタは単一の装置ではなく、装置の集合である。上述したように、これらの装置は同質であっても異質であってもよい。典型的な装置はリナックスのようなオペレーティングシステムを実行するコンピュータまたはマシーンである。市販のハードウェアをホストとするリナックスベースのシステムのクラスタは数個のストレージノードサーバーから数千テラバイトのデータを記憶する多数のノードにまで拡張可能なアーカイブを提供する。このアーキテクチュアによって、記憶容量を、組織の増大するアーカイブ需要に合せて増大させることができる。アーカイブが常に装置の故障から保護されるようにクラスタ全体に亘ってデータを複製することが好ましい。ディスクまたはノードが故障した場合、クラスタは同じデータの複製を保持しているこのクラスタ中の他のノードへ自動的に障害迂回する。
【0016】
図示のクラスタは好ましくは大別して下記のコンポーネントから成る:ノード202、1対のネットワークスイッチ204、電力分配装置(PDU)206、及び無停電電源(UPS)208。ノード202は通常、市販の1つまたは2つ以上のサーバーより成り、CPU(例えば、インテルx86)、適当なランダムアクセスメモリ(RAM)、1つまたは2つ以上のハードドライブ(例えば、標準的なIDE/SATA、SCSIなど)、及び2つまたは3つ以上のネットワークインターフェースカード(NIC)を含む。典型的なノードは2.4GHzチップ、512MBのRAM、及び6つの200GBハードドライブを含む2Uラックマウント方式ユニットである。但し、これは1例に過ぎない。ネットワークスイッチ204は通常、ノード間でピア・ツー・ピア交信を可能にする内部スイッチ205と、クラスタの外部からそれぞれのノードへのアクセスを可能にする外部スイッチ207を含む。それぞれのスイッチはクラスタ中のすべてのノードを扱うのに充分なポートを必要とする。この必要性を満たすには、イーサネットまたはGigEを使用すればよい。PDU206はすべてのノード及びスイッチへの給電に使用され、UPS208はすべてのノード及びスイッチを保護するのに使用される。多くの場合、クラスタは公衆インターネット、企業イントラネット、またはその他のワイドエリアまたはローカルエリアネットワークなどのネットワークに接続可能である。図示例の場合、クラスタは企業環境内で実現される。クラスタには、例えば、サイトの企業のドメインネームシステム(DNS)のネームサーバーをナビゲーションすることによって到達することができる。即ち、例えば、クラスタのドメインが既存のドメインの新しいサブドメインである場合が考えられる。代表例では、このサブドメインが企業DNSサーバーにおいてクラスタ自体のネームサーバーに委託される。エンドユーザーは公知のインターフェースまたはアクセスツールを利用してクラスタにアクセスする。クラスタへのアクセスは、例えば、APIを介して、または公知または新規に開発されたアクセス方法、サービス、プログラムまたはツールを介して、IPベースのプロトコル(HTTP、FTP、NFS、AFS、SMB、ウェブサービスなどを利用することでよって行うことができる。
【0017】
詳しくは後述するように、クライエントアプリケーションは1つまたは2つ以上のタイプの外部ゲートウェイ、例えば、標準型UNIXファイルプロトコル、またはHTTP
APIなどを介してクラスタにアクセスする。ゲートウェイは管理コンソールを介して独立に機能可能化または機能抑止されることが好ましい。アーカイブは、オプションとして標準的なUNIXファイルプロトコル利用設備下に作用する仮想ファイルシステムを介して露出されることが好ましい。例えば、NFS、FTP、SMB/CIFSなどがある。
標準的なTCP/IPアドレスを介してアーカイブに正しくアクセスすると、ファイルプ
ロトコルは標準的なUNIXオペレーティングシステム上におけるように動作する。尚、
「/」はクラスタのルートディレクトリである。
【0018】
好ましい実施態様では、アーカイブクラスタアプリケーションは(例えば、イーサネットを介して)1つのクラスタとしてネットワークを形成する独立ノード冗長アレイ(H−RAIN)上を走る。所与のノードのハードウェアは異質であってもよい。但し、可用性を最大にするためには、それぞれのノードが、図3に示すように、幾つかの実行時コンポーネントから成る分散アプリケーションの全インスタンス300を実行することが好ましい。即ち、ハードウェアは異質であっても、(少なくとも本発明に関する限り)ノード上のソフトウェアスタックは同じである。これらのソフトウェアコンポーネントはゲートウェイプロトコルレイヤー302、アクセスレイヤー304、ファイルトランザクション及び管理レイヤー306、及びコアコンポーネントレイヤー308から成る。「レイヤー」と呼称するのは飽くまでも説明の便宜上であって、当業者には周知のように、もっと有意義な方法でその機能を特徴付けることができる。レイヤー(またはこれに含まれるコンポーネン)の1つまたは2つ以上が一体化されていてもよい。幾つかのコンポーネントを複数のレイヤーで共用させることもできる。
【0019】
ゲートウェイプロトコルレイヤー302におけるゲートウェイプロトコルは既存のアプリケーションに透過性を与える。特に、ゲートウェイはネイティブファイルサービス、例えば、NFS310、SMB/CIFS312、及びウェブサービスを提供することによってカスタムアプリケーションを形成する。HTTPサポート314も提供される。アクセスレイヤー304はアーカイブへのアクセスを可能にする。特に、本発明では、固定コンテンツファイルシステム(FCFS)316がネイティブファイルシステムをエミュレートすることによってアーカイブオブジェクトへの完全なアクセスを可能にする。FCFSはあたかも普通のファイルであるかのようにアプリケーションを直接アーカイブ内容にアクセスさせる。好ましくは、アーカイブのコンテンツを元のフォーマットにレンダリングする一方、メタデータをXMLファイルとして表現する。FCFS316はディレクトリ、パーミッション及びルーチンのファイルレベルのコールを型通りに表示するから、管理者は慣れた態様で固定コンテンツデータを提供することができる。ファイルアクセスコールはユーザースペースデーモンによってインターセプトされ、(レイヤー308における)該当のコアコンポーネントに転送され、このコアコンポーネントが呼出しアプリケーションに対する適切な表示を動的に形成する。詳しくは後述するように、FCFSコールをアーカイブポリシーによって制約することによって自律的なアーカイブ管理を容易にすることが好ましい。従って、1例として、管理者またはアプリケーションは(所与のポリシーである)保持期間が未だ有効なアーカイブオブジェクトを消去することはできない。
【0020】
アクセスレイヤー304はウェブユーザーインターフェース(UI)318及びSNMPゲートウェイ320をも含むことが好ましい。ウェブユーザーインターフェース318はファイルのトランザクション/管理レイヤー306における管理エンジン322への対
話型アクセスを可能にする管理コンソールとして実現することが好ましい。管理コンソール318はアーカイブオブジェクト及び個別ノードを含むアーカイブを動的に表示する、パスワードで保護されたウェブベースのGUIであることが好ましい。SNMPゲートウェイ320は管理エンジン322へのストレージ管理アプリケーションのアクセスを容易にし、クラスタの動作を確実にモニターし且つ制御することを可能にする。管理エンジンはシステム及びポリシーイベントを含むクラスタの動作をモニターする。ファイルのトランザクション/管理レイヤー306はリクエストマネジャープロセス324をも含む。リクエストマネジャー324は(アクセスレイヤー304を介しての)外界からのすべてのリクエストと、コアコンポーネントレイヤー308におけるポリシーマネジャー326からの内部リクエストを統合する。ポリシーマネジャー326の動作については詳しく後述する。
【0021】
ポリシーマネジャー326のほかに,コアコンポーネントはメタデータマネジャー328、及びストレージマネジャー330の1つまたは2つ以上のインスタンスをも含む。メタデータマネジャー328はそれぞれのノードにインストールすることが好ましい。全体として、クラスタにおけるメタデータマネジャーはすべてのアーカイブオブジェクトを管理する分散データベースとして作用する。所与のノードにおいて、メタデータマネジャー328はアーカイブオブジェクトのサブセットを管理し、好ましくはそれぞれのオブジェクトが外部ファイル(「EF」、記憶させるためアーカイブに入力されるデータ)とアーカイブデータが物理的に配置されている内部ファイルセット(それぞれが「IF」)との間に位置する。同じメタデータマネジャーが他のノードから複製されたアーカイブオブジェクトのセットをも管理する。従って、それぞれの外部ファイルの現状を幾つかのノードにおける複数のメタデータマネジャーが常に利用することができる。ノードに故障が発生した場合、他のノードにおけるメタデータマネジャーがそれまで故障ノードによって管理されていたデータに直ちにアクセスする。ストレージマネジャー330は分散アプリケーションにおける他のすべてのコンポーネントが利用できるファイルシステムレイヤーを提供する。好ましくはこのファイルシステムレイヤーがノードのローカルファイルシステムにデータオブジェクトを記憶させる。所与のノードにおけるそれぞれのドライブは好ましくはそれ自体のストレージマネジャーを有する。これにより、ノードは個々のドライブを除去してスループットを最適化することができる。ストレージマネジャー330はシステム情報、データに関する完全性チェックをも提供するとともに、ローカル構造に直接アクセスすることもできる。
【0022】
図3に示すように、クラスタは通信ミドルウェアレイヤー332及びDNSマネジャー334を介して内部及び外部通信を管理する。インフラストラクチャ332はアーカイブコンポーネント間の通信を可能にする効率的で、しかも信頼度の高いメッセージに基づくミドルウェアレイヤーである。図示例では、このレイヤーがマルチキャスト/ポイント・
ツー・ポイント通信を支援する。DNSはすべてのノードを企業サーバーに接続する分散ネームサービスを実行する。DNSマネジャーはリクエスト負荷がすべてのノードにおいて均等になるように作用して、クラスタのスループット及び可用性を最大限に維持することが好ましい。
【0023】
図示例において、ArCアプリケーションは、例えば、Red Hat Linux9.0のようなベースオペレーティングシステム336で実行される。通信ミドルウェアとしては、Spreadグループ通信またはその他の分散型通信機構に基づくものを使用できる。周知のように、Spreadは高性能のメッセージサービスを可能にするツールキットであり、外部または内部ネットワークに発生する障害に対して柔軟に対応することができる。Spreadは分散アプリケーションのための一体化されたメッセージバスとして機能し、高度に調整されたアプリケーションレベルのマルチキャスト通信及びグループ通信を可能にする。その他のコンポーネントとして、固定内容ファイルシステム(FCFS)316のために使用できるFUSE(USErspaceにおけるファイルシステム)が挙げられる。NFSゲートウェイ310は標準的なnfsd Linux Kernel
NFSドライバーのユーザースペース版であるUnfsdによって実現することができる。それぞれのノードにおけるデータベースは、例えば、オブジェクト関連データベース管理システム(ORDBMS)であるPostgreSQLによって実現することができる。ノードはJava HTTPサーバー及びサーブレットコンテナであるJettyのようなウェブサーバーを含む。但し、以上に挙げた機構はあくまでも説明の便宜上列記したものであり、本発明がこれらの機構に制限されるものではない。
【0024】
所与のノードにおけるストレージマネジャー330は物理的記憶装置を管理する。それぞれのストレージマネジャーインスタンスは並列アルゴリズムに従ってすべてのファイルが配置されている単一のルートディレクトリを担当することが好ましい。同時に複数のス
トレージマネジャーインスタンスが1つのノードにおいて機能し、それぞれのインスタンスがシステム内の異なる物理的ディスクを表す。ストレージマネジャーがドライブを取除き、システムの残り部分からのインターフェース技術が利用される。ファイルへの書込みを要求されると、ストレージマネジャーは対応の表示を行うため、フルパス及びフルネームを形成する。代表的な実施態様では、ストレージマネジャーに記憶させるべきそれぞれのオブジェクトが記憶させるべき生データの形で受信され、記憶させるファイルにストレージマネジャーが自らのメタデータを加えることにより、異なるタイプの情報をトラックできるようにする。例えば、このメタデータは以下に列記する内容を含む:EF長さ(外部ファイルの長さ(バイト))、IFセグメントサイズ(内部ファイルのこの部分のサイズ)、EF保護表示(EF保護モード)、IF保護任務(この内部ファイルの表示)、EF作成時刻印(外部ファイル時刻印)、ハッシュ(ハッシュタイプを含む、書込み時(PUT)における内部ファイルのハッシュ)及びEFファイルネーム(外部ファイルのファイルネーム)。内部ファイルのデータとともにこの追加メタデータを記憶させることによって、保護効果のレベルがさらに向上する。特に、スキャベンジングは、内部ファイルに記憶されているメタデータから、データベース中に外部ファイルを作成することを可能にする。その他のポリシーは内部ファイルに対して内部ファイルハッシュを有効化することにより、内部ファイルがそのままであることを有効化することができる。基本親情報に対するデータ探索を回避することによって最適化が可能になる。
【0025】
上述したように、内部ファイルはアーカイブオブジェクト中のオリジナル「ファイル」の一部を表す「大量の」データであることが好ましく、ストライピング及び保護ブロック達成するため異なるディスクに配置することが好ましい。通常、それぞれのアーカイブオブジェクト毎に1つのファイル記述項がメタデータマネジャーに存在し、それぞれの外部ファイル記述項ごとに多数の内部ファイル記述項が存在する。多くの場合、内部ファイルのレイアウトはシステムに応じて異なる。実施態様によっては、ディスク上におけるこのデータの物理的フォーマットが一連の可変長記録の形で記憶される。
【0026】
ファイルを記憶させると、ストレージマネジャーはファイルが媒体に書き込まれたことを保証する。ストレージマネジャーはまた、システムの残りの部分からの、種々のサービスに対するリクエストに応答する。これらのサービス及びその動作は以下の動作を含む:Exists−内部ファイルが存在するかどうかをチェック;Delete−内部ファイルを消去する;Wipe−内部ファイルを消去し、書き直す(確実な消去);Metadata−内部ファイルからストレージマネジャーを得る;Hash−内部ファイルに対応する内部ファイルハッシュ(内部ファイル・メタデータを含む)を回復する;Listall−このストレージマネジャーに対応するすべての内部ファイルのリストを回復する;及びDeleteall−このストレージマネジャーにおけるすべての内部ファイルを消去する。
【0027】
リクエストマネジャー324は、システム内の他のコンポーネントと相互作用することによってアーカイブ作用を行うのに必要な一連のオペレーションを実行する。リクエストマネジャーは多様な同時作用を可能にし、途中に故障が発生したトランザクション処理を無効化することができ、実行に長時間を要する可能性があるトランザクションをサポートする。リクエストマネジャーはまた、アーカイブにおける読取り/書込みオペレーション
が適正に行われ、リクエストがすべて常に既知の状態にあることを保証する。さらにまた、所与のクライエントリクエストを満たすように、複数ノードにおいて同時に行われる複数の読取り/書込みオペレーションを整合させるべくトランザクション制御を可能にする。また、リクエストマネジャーは最近使用されたファイルに対応するメタデータマネジャー記述項をキャッシュし、セッション及びデータブロックのためのバッファリングを提供する。
【0028】
クラスタの最も重要な機能はディスクに無制限の数のファイルを確実に記憶させることにある。何らかの理由でアクセス不能であるか、または利用不能であれば、所与のクラスタを「信頼できない」と考えられる。本発明の目的はこのような信頼できないノードを回収して信頼できる、可用性の高いストレージを作成することにある。記憶させる必要がある情報は2つのタイプに大別される。即ち、ファイル自体とファイルに関するメタデータである。
【0029】
図4はファイルをシステムに入力する方法を示す。ステップ1において、独自のキーとともにファイルが幾つかのサポートされているゲートウェイの1つを介してアーカイブに入力される。ファイルを保護するためには、ステップ2に図示するように、幾つかのスキーム:ファイル二重化、回復ストライプを利用してファイル内容を複数ノードに分散させることにより消失ストライプを再生させるRAID-5のようなスキーム、及び複数の回復ストライプを利用して同時的に発生するノードの故障がシステム全体の故障に至らないようにする(例えば、Rabin情報分散アルゴリズムまたはIDAのような)RAID-5スキームのバリエーションのうちの1つを利用すればよい。ステップ3に示すように、キー値情報及びその他のシステムメタデータをメタデータマネジャーに書き込む。次いで、ステップ4に示すように、メタデータマネジャーが分散データベースを更新する。こうしてプロセスが完了する。
【0030】
信頼性の高いアーキテクチャは他の目的にも貢献する。ストレージノードをグレードアップする場合、他のノードに冗長ファイルを配置しているのと同じメタデータを利用することによって新しいノードを配置することができる。これを4つのノード502、504、506及び508を示す図5に基づいて説明する。図5から明らかなように、ノード2が故障すると、メタデータがクラスタを再び平衡させるのに必要なあらゆる情報を提供する。新しいノード510が加わると、クラスタはこの容量を平衡回復プロセスの一部として利用する。平衡回復の方法及びタイミングを判断するプロセスはルールベースポリシーによって与えられる。このシナリオにおいては、図5に示すように、システムは下記のステップを実行する。既存ノード504をオフライン処理する。これに代わるノードとして新しいノード510が同定される。次いで、該当のメタデータが複製すべきファイル510及びこれらのファイルの位置を同定する。次いでリクエストマネジャーは複製されるファイルを新しいノード510へ誘導する。次いで、リクエストマネジャーが位置情報とともに更新される。
【0031】
一般に、メタデータの量と必要な同時性に応じて異なるが、所与のノードと連携する所与数のメタデータマネジャーが存在する。それぞれのメタデータマネジャーはそれぞれのメタデータサブセットを担当する。(メタデータオブジェクトの形態の)メタデータを、ハッシュ処理を利用することで複数のメタデータマネジャーに分散させることが好ましい。それぞれのメタデータマネジャーは1つまたは2つ以上の範囲のハッシュ値を担当する。好ましくは、それぞれのメタデータオブジェクトが名前を有し、このオブジェクトを担当するメタデータマネジャーを、名前のハッシング処理でハッシュ値を求めることによって決定する。所与のアプリケーションがメタデータオブジェクトを作成、検索または更新しなければならない場合、このアプリケーションは名前をハッシュ処理することによってハッシュ値を求め、次いで、メタデータオブジェクトのハッシュ値を含む範囲412を担当するメタデータマネジャーに対してリクエストを送信する。1つのメタデータマネジャーが直ちに他の領域の担当を引受けることができるようにメタデータ更新を管理することによって高い可用性が得られる。メタデータオブジェクトを更新する場合、担当のメタデータマネジャーに更新指令が送信され、メタデータマネジャーがこの更新指令をそのローカルデータベースに入力する。更新スル前に、アットランダムに選択された1組の他のメタデータマネジャーに更新指令が送信される。何らかの理由で1つのメタデータマネジャーが利用不能である場合、別のメタデータマネジャーが問題の領域を制御することができ
、クラスタ全体に分散させたメタデータのバックアップコピーを利用することによってこの領域に対するリクエストを取扱うことができる。
【0032】
本発明のRAINアーキテクチャの利点は、(システムを構成する)それぞれのノードが同じでなくてもよいことである。性能、容量、及び期待される信頼性において、それぞれのノードが互いに著しく異なっていてもよい。H−RAINシステムの設計は商用ハードウェアを使用する多数のノードを前提とする。図1は互いに異質のハードウェア・コンポーネント100a‐100nで構成されたH−RAINクラスタを示す。所与のシステムの実施には幾つかの戦略がある。同じ構成のノードを追加することによって記憶容量を増大させることができる。このように新しいノードを追加しても、長い目で見れば大したコスト増にはならない。アーカイブ全体のギガバイト当りの平均コストは経時的に軽減される。アーカイブの容量とコストの関連は予測可能である。高品質のハードウェアを使用する新しいノードでクラスタを拡張することによって記憶容量、性能及び信頼性を高めることができる。システムがこれらの新しいノードを活用することによってアーカイブの性能を高めることができる。例えば、CPUに負担がかかるフィルタリングオペレーションには高性能CPUとともに新しいノードを使用すればよい。このようにすれば、比較的少量の新しいハードウェアで「プット」性能をかなり向上させることができる。いずれの戦略を採用しても、ユーザーは技術的インフラストラクチャをグレードアップするとともに、アーカイブ内容を新しいノードへ透過的に移動させることができる。初期のインストレーションをそのまま生かしながら、改良を重ねることができる。ハードウェアの価格が低下すれば、その時点でユーザーはコスト当たり性能が高いストレージノードでアーカイブの性能を高めることができる。互いに異質のノードで構成されたアーキテクチャの場合、これらの選択がすべて容易になる。図5はノードをアップグレードするためのシナリオの1つを示すが、このほかにも本発明が採用できるシナリオが幾つか考えられる。
【0033】
新しいノードの追加は自動的に行われることが好ましい。システムは容量の増大などのような管理上のタスクを自動化するように構成されている。例えば、ユーザーが新しいノードサーバーをクラスタに追加した後、手動干渉無しに、アプリケーションは直ちにそのノードを全体的なワークフローに投入する。代表的な実施態様では、1つのクラスタが、例えば、数百のノードを含むことができる。システムにノードを追加することによって、1つのクラスタを数千テラバイトにまで拡張することができる。
【0034】
アプリケーションはデータ損失に対する保護を可能にする。或るノードが動作不能に陥ると、リクエストマネジャーが自動的にストレージオペレーションを別のノードに肩代わりさせる。分散型アプリケーションは常に所与のノードのデータをクラスタ中のいずれかのノードにおいて複製する。アーカイブの障害迂回機能により、故障ノードから別のノードへデータが透過的に移行するから、故障ノードのデータを常時利用することができる。上述したように、システム中に記憶されているすべてのファイルが、消失ファイルを自動的に再生するデータ保護スキームによって保護されることが好ましい。
【0035】
ディジタルアーカイブは極めて大規模且つ長命であるから、特殊なデータ管理方式を可能にする。このシステムを管理運営するためのコストは長期のスパンで考えねばならない。アーカイブシステムが自己管理し、殆ど手動干渉を必要としなければ、著しいコスト軽減につながる。本発明は、アーカイブ中でのライフサイクルに亘ってアーカイブオブジェクトの動作を決定する自らのポリシーをそれぞれのオブジェクトがカプセル化するように構成することで上記目的を達成する。即ち、それぞれのアーカイブオブジェクトはアーカイブとともにオブジェクト自体の動作を自律する。所与のアーカイブオブジェクトに関して、アーカイブクラスタアプリケーションは下記ポリシーのいずれか1つまたは2つ以上を適用する:即ち、保護、データ確認、保持、クラスタバランス、不要情報収集、スキャベンジング、及び重複削除である。保護ポリシーはデータオブジェクトの完全性を保護す
る;即ち、例えば、ハードウェアに故障が発生すると、修理を開始する。データ確認ポリシーはファイルコンテンツがそのディジタル署名と一致することを確認する。このポリシーを、ディジタル署名の形成に使用される特定のハッシュアルゴリズムにセットすることが好ましい。保持ポリシーは保持期間が切れる前にファイルが消去されるのを防止する。保持期間が切れたら、アプリケーションによって自動的に、またはアーカイブ管理者によって積極的にデータオブジェクトを消去することができる。クラスタバランスポリシーはクラスタ中のすべてのノードにデータオブジェクトが均等に分散させるように作用する。不要情報収集ポリシーは不完全なトランザクションによって取り残されたままのファイルを排除することによってディスクスペースを再利用する。このポリシーはシステムメタデータの完全性をチェックする機能をも果たす。このポリシーは排除する前に、消去すべきデータをマーキングしなければならない期間を規定するピックアップタイムにセットすることが好ましい。スキャベンジングポリシーはメタデータの消失を防止するポリシーである。アーカイブのストレージマネジャーは内部ストレージファイル中のデータファイルのメタデータをも含む。内部ストレージファイルは必要に応じてアーカイブのスキャベンジングポリシーにアクセス可能な冗長レイヤーを提供する。重複削除ポリシーは重複しているデータオブジェクトを発見し、余分なコピーを排除することによって有効クラスタ容量を増大させる。
【0036】
本発明では、クラスタが1つまたは2つ以上のタイプの自動化されたポリシーの管理下にある:即ち、保護、データ確認、保持、クラスタバランス、不要情報収集、スキャベンジング、重複削除、などである。これらのポリシーのそれぞれについて、以下に詳細を説明する。ポリシーマネジャーはシステム中のそれぞれのノードに対してポリシー管理を実施する。
【0037】
システム内部において、アーカイブクラスタアプリケーションは1つまたは2つ以上のデータ保護スキームを支援する。代表的なスキームがRAID-1(シンプルミラーリン
グ)保護スキームである。このほか、代表的なスキームとして、情報分散アルゴリズムが
ある。管理者の観点からすれば、この支援はクラスタ全体のための単一の調整可能な保護パラメータとして露出されることが好ましい。但し、これは1例に過ぎない。即ち、代表的な実施態様では、特定の保護スキーム及び関連のパラメータに煩わされることなく、管理者はファイルをサポートするための許容可能障害点数(TPOF)を設定するだけでよい。アーカイブクラスタアプリケーションはそれぞれのノード内の各ディスクをモニターし、ノード及びディスクの故障を自動的に対応することができる。特定のTPOFに対応して、アプリケーションはクラスタ中のノード数に応じて(利用可能なスキームのうち)最善の保護スキームを活用する。RAID-1データ保護スキームだけが利用可能である
場合、最も単純な2方向ミラーリングの場合でも、ディスク利用率は50%に過ぎない。ミラー数が増えると、TPOFも増大するが、ディスク利用率は低下する。例えば、3方向ミラーリングでは、ディスク利用率は33%、4方向ミラーリングではディスク率が25%となる。保護ポリシーはクラスタレベルにセットすることが好ましく、ファイルレベルでは利用できない。
【0038】
より具体的な実施態様としては、保護ポリシーはクラスタレベルで設定され、ファイルレベルでは利用できない。クラスタレベルの初期値は変化可能であるが、クラスタに入力される新しいファイルにのみ適用される。1例として、クラスタレベルにおける初期値TPOFは1である。保護ポリシーの実行頻度は設定可能である。初期値設定頻度は周期的であり、例えば、24時間毎である。この場合、クラスタ中のどこかでディスクまたはノードに故障が発生すると、すべてのノードに対する保護ポリシーが自動的に起動する。
【0039】
所与のノードにおけるポリシーマネジャーは以下に述べるように保護を行う。ポリマーマネジャーは実行するノードが所有するすべての外部ファイル(EF)に亘って保護ポリ
シーを反復実行する。それぞれの外部ファイル毎に、ポリシーマネジャーはすべての内部ファイル(IF)に亘って反復実行する。こうして、IFが指示するファイルに到達でき、必要に応じて修理を開始することができる。
【0040】
データ確認はデータの変造及び/またはサボタージュを防止する。即ち、アーカイブクラスタアプリケーションは、クラスタに挿入されるファイルがディジタル署名と一致することを確認するデータ確認ポリシーを支援する。署名はファイルの実際のコンテンツから形成するか、または実際のコンテンツの一部によって形成することが好ましい。アーカイブは、例えば、記憶されているコンテンツからこの署名を再生させ、元の署名と比較することによって記憶されているファイルコンテンツの信憑性を周期的にチェックする。データの信憑性を実証するためには署名が一致しなければならず、さもない時はアーカイブが除外すべきものとしてアーカイブ管理者に返送する。図示例においては、データ確認用のディジタル書名を、MD5アルゴリズムを使用して計算するが、(例えば、SHA-1、MD4などのような)適当な暗号機能を利用してもよい。図示例では、アーカイブに挿入する際にファイルのMD5内容ハッシュを計算する。クライエントのアプリケーションに記憶されている内容がオリジナルと同一であることを実証するには、クラスタの外部でMD5ハッシュキーを計算し、これをクラスタが維持しているハッシュキーと比較すればよい。データ確認ポリシーの実行頻度を設定し、設定した実行頻度(例えば、1週間毎)を適用する。
【0041】
ポリシーマネジャーは所与のノードに対して以下のようにしてデータ確認を支援する。確認の対象ノードが所有するすべての外部ファイル(EF)に亘って反復実行する。それぞれのEF毎に、ディスク上のコンテンツのMD5ハッシュキーを計算し、最初の書込み時に記憶された外部ファイルに対応のMD5ハッシュキーと比較する。それぞれの内部ファイル(IF)毎に、ポリシーマネジャーは最初の書込み時及び必要に応じて最初の修復時に記憶された内部ファイルのMD5ハッシュを比較することによってコンテンツを認証する。上述したように、EFハッシュはオリジナルコンテンツから引出すことが好ましい。また、IFハッシュはスキャベンジング情報とともにオリジナルコンテンツから引出すことが好ましい。
【0042】
多くのデータファイルに関して、組織及び規制上の基準が課せられ、種々の期間に亘ってデータファイルを保存するよう要求している。アーカイブクラスタアプリケーションは保持期間が切れる前に、事故または悪意によるファイルの消失を防止するため、データファイルの性質に応じて保持期間を定める。例えば、ファイルが1/1/2004に記憶され、その保持期間が2ヶ月であれば、3/1/2004以前にファイルを消去しようとすると、エラーが返送される。3/1/2004またはそれ以後ならば、ファイルに消去許可のフラグが付せられる。アーカイブ管理者が積極的に消去しない限り、ファイルはクラスタ内に温存される。
【0043】
保持期間はミリセコンド単位で記憶させることが好ましい。例えば、保持期間を−1と設定することによって消去不能であることをファイルにマークすることもできる。保持ポリシーについては、個々のディレクトリレベルで初期値を設定することが好ましいが、HTTPゲートウェイを使用する場合には挿入されるそれぞれのファイルにも設定することができる。一旦或るファイルに保持期間を規定したら、(利用可能なゲートウェイを介して)変更することができるが、延長する場合のみであって、短縮は許されない。或るファ
イルに関するファイルに設定される保持期間初期値が「0」ということは、そのファイルをいつでも消去できることを示唆するものである。代表的な実施態様では、所与のノードにおけるリクエストマネジャー(RM)が保持ポリシーをモニターする。但し、これは必須条件ではない。
【0044】
経時的にクラスタ内の個々のノードがそのストレージ利用度の点で互いにバランスを失う可能性がある。アーカイブクラスタアプリケーションはこの容量利用度をモニターし、例えば、クラスタに新しいノードが追加されると、クラスタを平衡状態に戻すべくファイルを再配置する。クラスタバランスは調整可能なパラメータを持たないクラスタレベルのポリシーであることが好ましいが、このことは必須条件ではない。クラスタバランスはクラスタの容量利用度を平衡状態に戻す積極的なアルゴリズムではあるが、リクエストマネジャーが所与のノードとともに、データを配置すべきノードを適正に選択することによって書込み毎にこのバランスを維持するように試みることが好ましい。
【0045】
不要情報収集はメタデータマネジャーにおいて論理的に消去されるとしてマーキングされたすべてのファイルを物理的に消去するのに必要である。このような記入事項が現れるのは、ファイル書込み中の失敗が原因であり、誤った書込みプロセスによってコンポーネントの一部が自動的にクリーンアップされなかったのである。不要情報収集は調整可能なパラメータを持たないクラスタレベルのポリシーであることが好ましいが、このことは必須条件ではない。不要情報収集ポリシーの実行頻度は設定可能である。1例として、初期値実行頻度は24時
間に一度と設定することができる。
【0046】
所与のノードにおけるポリシーマネジャーは下記のように不要情報収集を支援する。実行の対象であるノードが所有するすべてのメタデータに亘って反復する。それぞれの外部ファイル毎に、ポリシーマネジャーは関連する内部ファイルすべてを有することを確認する。次いで、ポリシーマネジャーは誤ってこれらの内部ファイルに挿入された残留データをクリーンアップする。
【0047】
スキャベンジングは最悪のメタデータ喪失に対する安全ネットである。上述したように、(ストレージマネジャーによって)記憶させられたそれぞれの物理的ファイルは(メタデータマネジャーによって管理される)メタデータをも含む。スキャベンジングポリシーはすべてのファイルに亘って作用してそれぞれのファイルのメタデータを無傷に維持する。メタデータが欠落していることが判明すると、必要に応じて再生させる。スキャベンジングは調整可能なパラメータを持たないクラスタレベルのポリシーであることが好ましいが、このことは必須条件ではない。スキャベンジングポリシーの実行頻度は設定することができる。初期値実行頻度は24時間に一度である。
【0048】
所与のノードにおけるポリシーマネジャーは下記のようにスキャベンジングを支援する。ポリシーマネジャーの実行対象であるノードが所有するすべてのファイルに亘って反復実行する。それぞれのファイル毎に、ポリシーマネジャーはクラスタがこのファイルのための有効なメタデータを有することを認証する。必要に応じて、メタデータの修復を開始する。
【0049】
上述したように、アーカイブにおけるそれぞれのノードが、図6に示すようなディスプレイインターフェースを出力する管理コンソールを支援する。図6には、アーカイブクラスタの概括ページ600を示す。このページは、クラスタが所与の日時の状態として、完全に作動していることを示すインジケータ602を含む。このインジケータはその時々の動作状態に応じて色が変わる(例えば、緑色から黄色へ、黄色から赤色へ)。ポリシーステータス及びリセントイベント表604はポリシータブ606及びイベントタブ608を含むことが好ましい。(図示例において)支援されるポリシーのそれぞれについてカレントポリシーステータスが示されている。ノードリスト表610はそれぞれのノードをそのID、ステータス及びノードIPアドレスによって識別している。管理オペレーションを容易にするため、一連のコントロールが設けられている。具体的には、管理コンソールが下記のコントロールを含む一連のクラスタ/ノードコンポーネントコントロールを可視化
することが好ましい:ノード起動、ノード停止、ノード再起動、クラスタ起動、クラス停止、及びクラスタ再起動のコントロール。(図示例において)クラスタ中のクラスタボリューム及びトータルファイルを示すための、1つまたは2つ以上のメトリックグラフ612、614をも設ける。種々のディスプレイタブを選択することによって、管理者はその他の詳細を観察し、セットすることができる。ディスプレイタブはクラスタノードページ616、ゲートウェイページ618、システムセッティングページ620及びクラスタログページ622を含む。クラスタノードページ616はクラスタ中のそれぞれのノードに関して設定可能な性質を有する。ゲートウェイタブ618は支援されるそれぞれのゲートウェイに関する情報を表示する。それぞれのゲートウェイはゲートウェイの作用を可能にしたり不能にしたりできるとともに、1つまたは2つ以上の設定可能な性質を有する。
【0050】
いうまでもなく、図6に示すディスプレイのレイアウトは1例に過ぎない。上述したように、管理コンソールはそれぞれのノードに存在するウェブ-ベースのアプリケーション
であることが好ましい。ゲートウェイからクラスタに入力される他のすべての外部リクエストと同様に、管理コンソールリクエストもDNS負荷バランサーによって選択されたノードにおいて処理される。
【0051】
本発明はディジタル資産を捕捉、保存、管理及び検索するように構成されたアーカイブ管理対策を容易にする。この構成は種々の必要条件を満たす:即ち、無制限の記憶、高い信頼性、自己管理、規制との整合性、ハードウェアからの独立性、及び既存アプリケーションとの一体化の容易さである。
【0052】
本発明が提案する、市販のハードウェアで実行される(例えば)Linuxのクラスタは堅牢なプラットホームと殆ど無制限のアーカイブを可能にする。このシステムは、例えば、数個のストレージノードサーバーから数千テラバイトのデータを記憶する多数のノードまで拡張することができる。この独自のアーキテクチャにより、記憶容量は組織の増大するアーカイブ需要にペースを合せて増大することができる。このシステムはファイルを絶対に喪失しないように構成されている。アーカイブが常に装置故障から保護されるようにクラスタ全体に亘ってデータを複製する。ディスクまたはノードが故障すると、クラスタは自動的に、同じデータの複製を保持しているクラスタ中の他のノードに肩代わりする。本発明は自律的な処理によってアーカイブの保存コストを軽減する。例えば、ノードがアーカイブと接合したり、アーカイブから切り離されると、システムは自動的にクラスタの負荷バランスを調整し、構成ノード全体に亘ってファイルを再分散させることによって性能を最適化する。
【0053】
本発明は政府規制及び業界規制や、金融書類及び医療データのような記録の長期保存に関連して企業を助けることを目的とする。本発明はワーム(WORM)保証やユーザー定義の保存ポリシーとの整合を容易にするタイムスタンピングを実施することによって上記目的を達成する。
【0054】
本発明はオープンプラットホーム上に展開することでハードウェア依存性を解消する。商品プラットホームと工業所有権を有する記憶装置とのコストギャップが増大するに従って、情報技術(IT)の買い手は最早高コスト装置の売り手との関係に縛られたくないと考えている。所与のノードは、多くの場合、商品ハードウェアと、好ましくはオープンソース(例えば、Linux)オペレーティングシステムで作用するから、買い手は最善の対策として多様なハードウェアオプションで購入できることが好ましい。
【0055】
本発明はファイルの記憶及び検索に業界標準のインターフェース、例えば、NFS、HTTP、FTP、CIFSなどを提供する。これにより、システムは標準的なコンテンツ管理システム、検索システム、記憶管理ツール(例えば、HSM及びバックアップシステ
ム)、及びカスタマイズされたアーカイブアプリケーションと容易に相互作用することができる。
【0056】
RAINに基づくアーキテクチャを使用することにより、システムは複製ポリシーによって規定される程度に信頼性を保証することができる。故障ディスクまたは所与のノードにおけるファイルは自動的に他の場所へ再配置されるから、システムは自己回復性である。小規模で始まったアーカイブはノードを追加するだけで容易に拡張することができる。極めて対称的であるから、性能に影響を及ぼすことなく多数のノードから成るクラスタに亘って処理能力及び記憶容量を分散させることができる。
【0057】
大規模アーカイブの構築には通常2つの初期コストが伴う:即ち、アーカイブが運営される装置と、これと協働するソフトウェアに要するコストである。いずれも多くの場合財産的価値のあるものである。本発明は幾つの方法でこのコストを軽減する。このシステムは商品オペレーティングシステム及びハードウェア、特に、好ましい実施態様としては、Linuxシステムのクラスタにおいて作用するように構成されている。Linuxの新しいモデルで動作するコンピュータならシステムノードとして作用することができる。ハードウェアに左右されないプラットホームを利用することによって、ユーザーは個々の需要に適した最善のストレージクラスタコンポーネントを求めることができる。このシステムは広範囲のアプリケーションと協働し、例えば、NFS、HTTP及びFTPを含む最もポピュラーなファイルレベルのインターフェースを支援するように構成されている。このことはシステムが広範囲のアプリケーションと容易に協働できることを意味する。
【0058】
本発明は多くの利点を提供する。上述したように、大規模アーカイブシステムの構成にはエラーが付き物である。データベース、ネットワーク構成、オペレーティングシステム、ストレージ管理システム及びウェブサーバーはいずれも豊富なスキルを有する専門家チームでなければ一括して運営することはできない。本発明は、例えば、高レベルのポリシーを介してシステム構成を設定することによってインストール及び一体化を簡単にする自律的システムでこの問題と取り組む。記憶システム、データベース、ウェブサーバー及びオペレーティングシステムがいずれも、管理者が性能を最適化することを可能にする広範囲の調整可能なパラメータを有することも公知である。本発明の自律システムは自体のオペレーションをモニターしながら、負荷平衡化のような機能を自動的に行う。公知技術では、大規模インフラストラクチャに生じた問題を診断または決定するのに数週間を要する。アーカイブシステムは連続的に利用可能でなければならないから、管理者は進行中のサービスを中断することなく故障装置を取外し、交換できねばならない。本発明が提供するような自律システムは誤動作中のプロセス、ノードなどを自動的に検知し、アーカイブからこれらを安全に取外す。種々のセキュリティ機構が存在するにもかかわらず、管理者は悪意の攻撃または不慮の損傷からアーカイブを如何にして保護するかを自身の判断で決定する場合が多い。これに反して、本発明では、文献の保存、データ確認、及びファイル複製を実行する保護ポリシーを組合せて貴重なディジタル資産の損失から保護する。
【0059】
本発明を方法及びプロセスに関して説明したが、本発明はオペレーションを実行するための装置にも係わる。この装置は所期の目的のために特に構成された装置か、コンピュータに記憶されているコンピュータプログラムによって作動させるか、または再構成できる商品コンピュータか、である。このようなコンピュータプログラムはコンピュータ可読記憶媒体、例えば、光ディスク、CD−ROM、磁気-光ディスクのようなディスク、読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気または光カード、またはコンピュータプログラム命令を記憶するのに好適な媒体などであり、いずれもコンピュータシステムバスに接続される。
【0060】
システムの所与のコンポーネントを別々に説明したが、当業者なら容易に理解できるよ
うに、機能の幾つかは所与の命令、プログラムシーケンス、コード部分などにおいて組合わせるか、または共用させることができる。
図1
図2
図3
図4
図5
図6